Wyodrębnianie wierszy za pomocą Pandas .iloc[] w Pythonie
Python to świetny język do analizy danych, przede wszystkim ze względu na fantastyczny ekosystem pakietów Pythona zorientowanych na dane. Pandy to jeden z tych pakietów, który znacznie ułatwia importowanie i analizowanie danych. tutaj uczymy się, jak wyodrębniać wiersze za pomocą pliku Pandas .iloc[] w Pyton.
Składnia Pandy .iloc[].
Składnia: pandy.DataFrame.iloc[]
Parametry: Indeksuj pozycję wierszy w liczbie całkowitej lub liście liczb całkowitych.
Typ zwrotu: Ramka danych lub seria w zależności od parametrów
Co to jest Pandas .iloc[] w Pythonie?
W bibliotece Python Pandas .iloc[]> jest indeksatorem używanym do indeksowania danych w oparciu o liczbę całkowitą w pliku a Ramka danych . Umożliwia użytkownikom wybieranie określonych wierszy i kolumn poprzez dostarczanie indeksów całkowitych, co czyni go cennym narzędziem do manipulacji i ekstrakcji danych w oparciu o pozycje numeryczne w ramce DataFrame. Ten indeksator jest szczególnie przydatny, gdy chcesz uzyskać dostęp do danych lub manipulować nimi przy użyciu indeksowania pozycyjnego opartego na liczbach całkowitych, a nie etykiet.
Wykorzystany zbiór danych: Aby pobrać plik CSV użyty w kodzie, kliknij .iloc[]> do indeksowania opartego na lokalizacjach całkowitych. Wyodrębnione wiersze są drukowane w celu weryfikacji.
Python3
import> pandas as pd> # Creating a sample DataFrame> data> => pd.DataFrame({> > 'Name'> : [> 'Geek1'> ,> 'Geek2'> ,> 'Geek3'> ,> 'Geek4'> ,> 'Geek5'> ],> > 'Age'> : [> 25> ,> 30> ,> 22> ,> 35> ,> 28> ],> > 'Salary'> : [> 50000> ,> 60000> ,> 45000> ,> 70000> ,> 55000> ]> })> # Setting 'Name' column as the index for clarity> data.set_index(> 'Name'> , inplace> => True> )> # Displaying the original DataFrame> print> (> 'Original DataFrame:'> )> print> (data)> # Extracting a single row by index> row_alice> => data.iloc[> 0> , :]> print> (> '
Extracted Row (Geek1):'> )> print> (row_alice)> # Extracting multiple rows using a slice> rows_geek2_to_geek3> => data.iloc[> 1> :> 3> , :]> print> (> '
Extracted Rows (Geek2 to Geek3):'> )> print> (rows_geek2_to_geek3)> |
Wyjście :
Original DataFrame: Age Salary Name Geek1 25 50000 Geek2 30 60000 Geek3 22 45000 Geek4 35 70000 Geek5 28 55000 Extracted Row (Geek1): Age 25 Salary 50000 Name: Geek1, dtype: int64 Extracted Rows (Geek2 to Geek3): Age Salary Name Geek2 30 60000 Geek3 22 45000
Wniosek
Podsumowując, Pandy .iloc[]> w Pythonie to potężne narzędzie do wyodrębniania wierszy w oparciu o indeksowanie lokalizacji całkowitych. Jego wartość jest widoczna w zbiorach danych, w których pozycje liczbowe mają większe znaczenie niż etykiety. Ta funkcja umożliwia selektywne pobieranie pojedynczych wierszy lub wycinków, co czyni ją niezbędną do wydajnej manipulacji i analizy danych. Wszechstronność .iloc[]> zwiększa elastyczność ekstrakcji danych, umożliwiając bezproblemowy dostęp do określonych części zbiorów danych. Jako podstawowy składnik Pand, .iloc[]> znacząco przyczynia się do wydajności i przejrzystości zadań związanych z danymi dla programistów i analityków danych.