Regexi tühiku kasutamine Javas

Regexi Tuhiku Kasutamine Javas



Regex ehk regulaaravaldis on erimärkide kogum, mis ühendavad mustri stringides märkide otsimiseks. Arvutiprogrammeerimises ja tarkvaratehnikas on regexi õppimine väga kasulik mis tahes tekstist teabe leidmisel. Igasuguseid tekstiotsingu, vormindamise ja teksti asendamise toiminguid saab läbi viia regulaaravaldiste abil.

See õpetus juhendab teid regulaarse tühiku kasutamise kohta Javas.







Mis on Regex Javas?

Regulaaravaldis või regex võib olla sama lihtne kui üks märk või keeruline muster. Seda saab luua kindlas järjekorras teksti ja sümbolite jadaga. Enamik regexi märke on tähed ja tüpograafilised sümbolid. Regex on tõstutundlik, seega pidage seda selle loomisel ja kasutamisel meeles.



Kuidas kasutada Javas Regexi tühikuid?

Kuigi Java-l pole ühtegi eelmääratletud regulaaravaldise klassi. Siiski saame kasutada regulaaravaldisi, importides ' java.util.regex ” raamatukogu. See sisaldab mõningaid klasse nagu ' Muster ”, mida kasutatakse regex-mustri määratlemiseks ja „ Tikud ” klass, mida kasutatakse mustriga otsimiseks.



Regex tühikute kasutamiseks Javas on kaks meetodit järgmiselt.





    • Meetodi Pattern.matches() kasutamine (kasutage eelmääratletud regexit)
    • Klassi Muster ja sobitaja kasutamine (loo sobitamiseks kasutaja määratud regex)

Vaatame, kuidas need meetodid töötavad Javas tühikute regexiga.

1. meetod: kasutage Javas eelmääratletud regexi tühikuid Pattern.matches() meetodiga

Stringist tühikute leidmiseks on Java-s kolm levinumat regexet:



    • \s : see tähistab üht valget tühikut.
    • \s+ : tähistab mitut tühiku.
    • \u0020 : see on tühiku Unikood, mida kasutatakse tekstist tühiku leidmiseks regexina.

Neid regexe saame kasutada staatilises meetodis ' tikud() ' selle ' Muster ” klass. Mustriklass kuulub ' java.util.regex ” pakett. Allpool on toodud meetodi Pattern.matches() süntaks:

Süntaks

Muster.tikud ( '\s' , ' ' ) ;


Määratud meetod kasutab kahte argumenti: regulaaravaldist ja stringi. Esimene argument '\s' on tühiku regulaaravaldis või regex ja teine ​​argument '' on ruum stringis. See tagastab tõese või väära tõeväärtuse.

Näide 1: kasutage '\s' WhiteSpace Regexit

Siin kasutame ' \s ” regex meetodis Pattern.matches(). Teise argumendina edastame stringi, kus meetodis pole tühikut. Meetod kontrollib regulaarlauset ja stringi ning tagastab seejärel tõeväärtuse, mis salvestatakse vaste ” muutuja:

tõeväärtus vaste = Muster.vastused ( '\s' , '' ) ;


Printige vastemuutuja väärtus, kasutades ' System.out.println() ” meetod:

System.out.println ( 'Ruum on olemas:' + vaste ) ;



Väärtus, mille tagastas ' Pattern.matches() 'meetod on' vale ', kuna läbitud stringil pole tühikut:


Nüüd näeme mõningaid teisi näiteid tühikute sobitamiseks teiste regexidega.

Näide 2: kasutage '\s+' WhiteSpace Regexit

Selles näites edastame ' \s+ ' regex jaotises ' tikud() ” meetod mitme tühiku leidmiseks:

tõeväärtus vaste = Muster.vastused ( '\s+' , ' ' ) ;


Printige vaste muutuja väärtus, mis salvestab meetodi tagastatud tulemuse:

System.out.println ( 'Ruum on olemas:' + vaste ) ;



Kuna teine ​​argument sisaldab tühikuid, kuvatakse saadud väärtus kujul ' tõsi ”:

Näide 3: kasutage „\u0020” WhiteSpace Regex

Siin näitame teile, kuidas Unicode'i kasutatakse Java regexina. Määratud eesmärgil kasutame ' \u0020 ” regex tühiku Unikoodina:

tõeväärtus vaste = Muster.vastused ( '\u0020' , ' ' ) ;


Printige tagastatud väärtus:

System.out.println ( 'Ruum on olemas:' + vaste ) ;



Pattern.matches() meetod prindib ' tõsi ” läbitud stringina, mis sisaldab tühikuid:


Liigume Java-s regexi kasutamiseks teise meetodi juurde.

2. meetod: kasutage kasutaja määratud regexi tühikuid mustri ja sobitaja klassiga

' Muster ' klassi kasutatakse mustri määratlemiseks või loomiseks, samas kui ' Tikud ” klassi kasutatakse otsimiseks etteantud mustri järgi. Regulaarse väljendi mustri saab luua ' kompileerima () ” klassi Muster meetod. Selleks on vaja ainult ühte parameetrit, mustrit, mida soovite mis tahes eesmärgil koostada.

Süntaks

Muster.koostada ( ' \t \p{Zs}' ) ;


The Tikud klass sobib mustriga, kasutades ' tikud() ” meetod. See võtab ' string ” nagu muster.

Süntaks

musterMuutuja.sobitaja ( string ) ;


Tühjade jaoks on mõned eelmääratletud regex, mida oleme eespool käsitlenud, ülejäänud on loetletud allpool:

    • \\t\\p{Zs}
    • \\p{Zs}

Vaatame nüüd mõnda näidet.

Näide 1: kasutage '\\t\\p{Zs}' WhiteSpace Regexit

Selles näites saame tühikute arvu teada nende loendamisega. Esiteks loome stringi ' s ” ja printige see konsoolist välja:

String s = 'WelcometoLinuxHint' ;
System.out.println ( s ) ;


Järgmisena määratleme mustri ' \\t\\p{Zs} ', mis toimib Javas tühikute regexina ja võrdub ' \s ”. Pärast antud mustri koostamist muutuja ' regexPattern ” sisaldab saadud väärtust:

Muster regexPattern = Pattern.comile ( '\ \t \\p{Zs}' ) ;


Helistage ' tikud() 'meetod ja pass' s 'String:

Vastaja stringSpaces = regexPattern.matcher ( s ) ;


Looge täisarvu tüüpi muutuja ' loendama ' ja lähtestage see väärtusega ' 0 ”:

int count = 0 ;


Loendage stringis olevate tühikute arv, kasutades ' samal ajal 'silmus. Silmus läbib stringi ja suurendab loenduse muutuja väärtust, kui see puutub kokku tühikuga:

samal ajal ( stringSpaces.find ( ) ) {
count++;
}


Lõpuks printige loendi väärtus, et näidata, kui palju tühikuid stringis leidub:

System.out.println ( 'String sisaldab' +count+ 'ruumid' ) ;


Väljund



Näide 2: kasutage '\p{Zs}' WhiteSpace Regexit

Nüüd leiame stringist tühikud, kasutades teist mustrit ' \p{Zs} ”. See muster töötab sarnaselt ' \s ” ja „ \s+ ” regex:

Muster regexPattern = Pattern.comile ( '\\p{Zs}' ) ;


Nüüd kutsume me ' tikud() 'meetod ja pass' s ” String argumendina:

Vastaja stringSpaces = regexPattern.matcher ( s ) ;


Nagu ülaltoodud näites, kasutame ka ' samal ajal ” silmus stringi tühikute loendamiseks ja nende printimiseks:



Antud väljund näitab, et meie string ' Tere tulemast Linuxi vihjesse ” sisaldab kolme tühiku:



Koostame kõik lihtsaimad meetodid, mis aitavad teil Java-vormingus tühikuid kasutada.

Järeldus

Tühja jaoks on palju regulaaravaldisi, näiteks ' \s ”, „ \s+ ”, „ \u0020 ”, „ \\t\\p{Zs} ”, ja „ \\p{Zs} ”. Neid regexe kasutatakse klassi Pattern meetodis matches() või mustri määratlemisel mustriklassiga ja selle sobitamisel klassi Matcher abil. Kõige sagedamini kasutatav regex tühimärk on \s ja \s+. Selles õpetuses käsitlesime kõiki Javas regexi tühikute kasutamise meetodeid.