Rozdeliť a analyzovať reťazec v Pythone

In Python, práca s reťazcami je základným aspektom programovania. Struny sú sekvencie znakov a často obsahujú štruktúrované údaje, ktoré je potrebné spracovať alebo analyzovať. Bežné operácie vykonávané s reťazcami sú rozdelenie a analýza.

Rozdelenie reťazca v Pythone

V Pythone môžete reťazec rozdeliť na menšie časti pomocou split()> metóda a The split()> metóda berie oddeľovač ako argument a prerušuje reťazec pri každom výskyte oddeľovača a vracia zoznam podreťazcov.

Syntax:

string.split(oddeľovač)

Parametre:

  • delimiter> : Znak alebo podreťazec, v ktorom bude reťazec rozdelený. Je to voliteľný parameter.

Návratová hodnota:

The split()> metóda vráti zoznam podreťazcov získaných prerušením pôvodného reťazca pri výskyte oddeľovača.

metóda str.split().

Táto metóda rozdelí reťazec na zoznam podreťazcov na základe zadaného oddeľovača. Reťazec Dobrý deň, vitajte na stránke techcodeview.com pomocou čiarky („,“) ako oddeľovača. The funkcia split(). rozdeľuje reťazec na zoznam podreťazcov pomocou oddeľovača, výsledkom čoho je zoznam A obsahujúci [Ahoj, vitajte na techcodeview.com].

Príklad:

Python




# Define a string containing> string> => 'Hello,Welcome,to,techcodeview.com'> # Use the split() method to split the string into> A> => string.split(> ','> )> # Print the resulting list> print> (A)>

Výkon :

['Hello', 'Welcome', 'to', 'techcodeview.com'] 

Str.rsplit() Metóda

Toto je podobné ako str.split() , ale oddeľuje sa z pravej strany reťazca. Daný kód používa funkciu rsplit() na rozdelenie reťazca S na dve časti na základe posledného výskytu čiarky (‘,‘). Výsledkom je zoznam častí pred a po rozdelení. A bude [‚Hello to World‘, ‚Python‘] kde je posledná časť oddelená čiarkou Python je oddelený od zvyšku reťazca Ahoj svetu .

Príklad:

Python




# Given string> S> => 'Hello,to,World,Python'> A> => S.rsplit(> ','> ,> 1> )> # Printing the result> print> (A)>

Výkon :

['Hello,to,World', 'Python'] 

str.splitlines() Metóda

Táto metóda rozdelí reťazec pri zalomení riadkov a vráti zoznam riadkov. Kód definuje reťazec M s tromi riadkami textu oddelenými znakmi nového riadku. Potom použije metóda splitlines(). na rozdelenie reťazca do zoznamu s názvom line a kde každý prvok predstavuje riadok z pôvodného reťazca. Nakoniec kód vytlačí obsah zoznamu riadkov.

Príklad:

Python




# Define a string with three lines of> # text separated by newline characters> M> => 'GFG 1 GFG 2 GFG 3'> # Use the splitlines() method to split> line> => M.splitlines()> print> (line)>

Výkon :

['GFG 1', 'GFG 2', 'GFG 3'] 

Str.partition() Metóda

Táto metóda rozdelí reťazec na tri časti na základe prvého výskytu separátora. Kód používa oddiel() metóda na rozdelenie reťazca Text pri prvom výskyte oddeľovača. Časť pred oddeľovačom priradí k premennej pred, samotný oddeľovač k premennej sep a časť za oddeľovačom k premennej za.

Príklad:

Python




# Input string> Text> => 'Mango,Orange,apple'> before, sep, after> => Text.partition(> ','> )> # Printing the part of the string before the separator> print> (before)> print> (after)>

Výkon :

Mango Orange,apple 

metóda re.split().

Modul re poskytuje výkonnejšie delenie reťazcov pomocou regulárnych výrazov. Kód používa re.split() funkcia z modulu re v Pythone na rozdelenie textového reťazca na základe prítomnosti číslic. Vytvára zoznam P, kde prvky sú podreťazce textu oddelené číslicami. Výstup by bol [‚Mango, Orange‘, ‚Banana‘], čo ukazuje, že reťazec bol rozdelený na číslo ‚1‘.

Príklad:

Python




import> re> # Input text containing a mix of> # alphabetic characters and digits> Text> => 'Mango,Orange1Banana'> P> => re.split(r> 'd'> , Text)> # Printing the resulting list of substrings> print> (P)>

Výkon :

['Mango,Orange', 'Banana'] 

Používanie porozumenia zoznamu

Môžeš použiť porozumenie zoznamu na rozdelenie reťazca a odfiltrovanie prázdnych reťazcov. Kód rozdelí reťazec Text čiarkami pomocou split(‘,’) a potom použije porozumenie zoznamu na vytvorenie zoznamu P obsahujúceho neprázdne časti po odstránení všetkých začiatočných alebo koncových medzier. Výstupom je zoznam P, ktorý obsahuje [‚Mango‘, ‚Pomaranč‘, ‚Banán‘]. Tento kód účinne odstraňuje prázdne časti z výsledku rozdelenia a orezáva všetky nadbytočné medzery.

Príklad:

Python




# Given input string> Text> => 'Mango,Orange,Banana'> # Split the input string by commas and filter out empty parts using list comprehension> P> => [part> for> part> in> Text.split(> ','> )> if> part.strip()]> # print> print> (P)>

Výkon :

['Mango', 'Orange', 'Banana'] 

In Python , Analýza reťazca sa týka extrakcie zmysluplných informácií z daného reťazca a Tento proces zahŕňa konverziu reťazca na požadovaný typ údajov alebo extrahovanie špecifických vzorov údajov z reťazca.

Konverzia na Integer alebo Float

Ak reťazec obsahuje číselné údaje. môžete ho analyzovať na typ údajov typu integer alebo float pomocou int()> a float()> funkcie, resp. Daný kód skonvertuje reťazec 52 na celé číslo a vypíše výsledok (52). Podobne skonvertuje reťazec 4.17 na číslo s pohyblivou rádovou čiarkou a vypíše výsledok (4.17). Toto demonštruje použitie funkcií int() a float() na konverziu reťazcov na zodpovedajúce číselné dátové typy v Pythone.

Python




# Convert a string to an integer> number_str> => '52'> number_int> => int> (number_str)> print> (number_int)> # Convert a string to a floating-point number> decimal_str> => '4.17'> decimal_float> => float> (decimal_str)> print> (decimal_float)>

Výkon :

52 4.17 

Záver

Použitím vyššie uvedených metód budete môcť rozdeliť a analyzovať reťazec. Tiež preskúmame, ako môžeme previesť interger na float a pomocou metódy split(). ako dokážeme pretrhnúť šnúrku na menšie časti na základe oddeľovača.