Extrahování řádků pomocí Pandas .iloc[] v Pythonu
Python je skvělý jazyk pro analýzu dat, především kvůli fantastickému ekosystému balíčků Pythonu zaměřených na data. pandy je jedním z těch balíčků, které značně usnadňují import a analýzu dat. zde se učíme, jak extrahovat řádky pomocí Pandas .iloc[] in Krajta.
Syntaxe Pandas .iloc[]
Syntax: pandas.DataFrame.iloc[]
Parametry: Index pozice řádků v celém čísle nebo seznamu celého čísla.
Typ návratu: Datový rámec nebo Série v závislosti na parametrech
Co je Pandas .iloc[] v Pythonu?
V knihovně Python Pandas .iloc[]> je indexer používaný pro indexování dat na základě umístění v celém čísle v a DataFrame . Umožňuje uživatelům vybrat konkrétní řádky a sloupce poskytováním celočíselných indexů, což z něj činí cenný nástroj pro manipulaci a extrakci dat na základě číselných pozic v rámci DataFrame. Tento indexátor je zvláště užitečný, když chcete přistupovat k datům nebo s nimi manipulovat pomocí celočíselného pozičního indexování spíše než štítků.
Použitá datová sada: Chcete-li stáhnout CSV použitý v kódu, klikněte .iloc[]> pro indexování založené na celočíselných umístěních. Extrahované řádky se pro ověření vytisknou.
Python3
import> pandas as pd> # Creating a sample DataFrame> data> => pd.DataFrame({> > 'Name'> : [> 'Geek1'> ,> 'Geek2'> ,> 'Geek3'> ,> 'Geek4'> ,> 'Geek5'> ],> > 'Age'> : [> 25> ,> 30> ,> 22> ,> 35> ,> 28> ],> > 'Salary'> : [> 50000> ,> 60000> ,> 45000> ,> 70000> ,> 55000> ]> })> # Setting 'Name' column as the index for clarity> data.set_index(> 'Name'> , inplace> => True> )> # Displaying the original DataFrame> print> (> 'Original DataFrame:'> )> print> (data)> # Extracting a single row by index> row_alice> => data.iloc[> 0> , :]> print> (> '
Extracted Row (Geek1):'> )> print> (row_alice)> # Extracting multiple rows using a slice> rows_geek2_to_geek3> => data.iloc[> 1> :> 3> , :]> print> (> '
Extracted Rows (Geek2 to Geek3):'> )> print> (rows_geek2_to_geek3)> |
Výstup :
Original DataFrame: Age Salary Name Geek1 25 50000 Geek2 30 60000 Geek3 22 45000 Geek4 35 70000 Geek5 28 55000 Extracted Row (Geek1): Age 25 Salary 50000 Name: Geek1, dtype: int64 Extracted Rows (Geek2 to Geek3): Age Salary Name Geek2 30 60000 Geek3 22 45000
Závěr
Na závěr, Pandy .iloc[]> v Pythonu je výkonný nástroj pro extrahování řádků na základě celočíselného indexování umístění. Jeho hodnota svítí v datových sadách, kde na číselných pozicích záleží více než na štítcích. Tato funkce umožňuje selektivní načítání jednotlivých řádků nebo řezů, což je nezbytné pro efektivní manipulaci a analýzu dat. Všestrannost .iloc[]> zvyšuje flexibilitu při extrakci dat a umožňuje bezproblémový přístup ke konkrétním částem datových sad. Jako základní součást Pandy, .iloc[]> významně přispívá k efektivitě a přehlednosti úloh souvisejících s daty pro vývojáře a datové vědce.