Python | Pandas Series.str.contains()

Python | Pandas Series.str.contains()

Series.str lze použít k přístupu k hodnotám řady jako řetězcům a použít na ně několik metod. pandy Series.str.contains() Funkce se používá k testování, zda je vzorek nebo regulární výraz obsažen v řetězci řady nebo indexu. Funkce vrací booleovskou řadu nebo index na základě toho, zda je daný vzor nebo regulární výraz obsažen v řetězci řady nebo indexu.

Syntax: Series.str.contains(pat, case=True, flags=0, na=nan, regex=True)
Parametr :
také: Posloupnost znaků nebo regulární výraz.
pouzdro : Pokud je pravda, rozlišují se malá a velká písmena.
vlajky: Příznaky, které mají projít do modulu re, např. re.IGNORECASE.
že : Doplňte hodnotu pro chybějící hodnoty.
regulární výraz: Pokud je True, předpokládá se, že pat je regulární výraz.
Vrátí: Řada nebo index booleovských hodnot

Příklad č. 1: Pomocí funkce Series.str.contains () zjistíte, zda je v řetězcích podkladových dat v daném objektu řady přítomen vzor.

Python3




# importing pandas as pd> import> pandas as pd> # importing re for regular expressions> import> re> # Creating the Series> sr> => pd.Series([> 'New_York'> ,> 'Lisbon'> ,> 'Tokyo'> ,> 'Paris'> ,> 'Munich'> ])> # Creating the index> idx> => [> 'City 1'> ,> 'City 2'> ,> 'City 3'> ,> 'City 4'> ,> 'City 5'> ]> # set the index> sr.index> => idx> # Print the series> print> (sr)>

Výstup :

Nyní použijeme funkci Series.str.contains () ke zjištění, zda je vzor obsažen v řetězci přítomném v podkladových datech daného objektu řady.

Python3




# find if 'is' substring is present> result> => sr.> str> .contains(pat> => 'is'> )> # print the result> print> (result)>

Výstup :

Jak můžeme vidět na výstupu, funkce Series.str.contains() vrátila objekt série s booleovskými hodnotami. Platí, pokud je předaný vzor v řetězci přítomen, jinak je vrácena hodnota False.
Příklad č. 2: Pomocí funkce Series.str.contains () zjistíte, zda je v řetězcích podkladových dat v daném objektu řady přítomen vzor. Použijte regulární výrazy k nalezení vzorů v řetězcích.

Python3




# importing pandas as pd> import> pandas as pd> # importing re for regular expressions> import> re> # Creating the Series> sr> => pd.Series([> 'Mike'> ,> 'Alessa'> ,> 'Nick'> ,> 'Kim'> ,> 'Britney'> ])> # Creating the index> idx> => [> 'Name 1'> ,> 'Name 2'> ,> 'Name 3'> ,> 'Name 4'> ,> 'Name 5'> ]> # set the index> sr.index> => idx> # Print the series> print> (sr)>

Výstup :

Nyní použijeme funkci Series.str.contains () ke zjištění, zda je vzor obsažen v řetězci přítomném v podkladových datech daného objektu řady.

Python3




# find if there is a substring such that it has> # the letter 'i' followed by any small alphabet.> result> => sr.> str> .contains(pat> => 'i[a-z]'> , regex> => True> )> # print the result> print> (result)>

Výstup :

Jak můžeme vidět na výstupu, funkce Series.str.contains() vrátila objekt série s booleovskými hodnotami. Platí, pokud je předaný vzor v řetězci přítomen, jinak je vrácena hodnota False.