Ustvarite Pandas DataFrame iz seznamov
Python je odličen jezik za analizo podatkov, predvsem zaradi fantastičnega ekosistema podatkovno osredotočenih paketov Python. Pande je eden od teh paketov, ki močno olajša uvoz in analizo podatkov. Ustvarjanje a Pandas Dataframe je mogoče doseči na več načinov. Poglejmo, kako lahko ustvarimo Pandas DataFrame iz seznamov.
Ustvarjanje Pandas DataFrames iz seznamov
Pretvarjanje seznamov v DataFrames je ključnega pomena pri analizi podatkov, saj vam omogoča enostavno izvajanje sofisticiranih podatkovnih manipulacij in analiz.
Tukaj bomo razpravljali o različnih načinih za ustvarjanje Pandas Dataframe s seznamov:
- Ustvari podatkovni okvir s seznama z uporabo Constructerja
- Ustvari DataFrame s seznama z uporabo slovarja
- Ustvari DataFrame s seznama z uporabo zip()
- Ustvarite DataFrame s seznama tako, da spremenite vrsto podatkov
- Ustvari DataFrame s seznama z uporabo večdimenzionalnega seznama
- Ustvari DataFrame s seznama z imeni indeksov in stolpcev
Ustvari podatkovni okvir s seznama z uporabo Constructerja
Če želite pretvoriti seznam v Pandas DataFrame, lahko uporabite pd.DataFrame()> konstruktor. Ta funkcija sprejme seznam kot vhod in ustvari DataFrame z enakim številom vrstic in stolpcev kot vhodni seznam.
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list df = pd.DataFrame(lst) print(df)
Izhod:
0 0 Geeks 1 For 2 Geeks 3 is 4 portal 5 for 6 Geeks
Ustvari DataFrame s seznama z uporabo slovarja
Če želite uporabiti sezname v slovarju za ustvarjanje Pandas DataFrame, ustvarimo slovar seznamov in nato posredujemo slovar pd.DataFrame()> konstruktor. Po želji lahko določimo imena stolpcev za DataFrame tako, da posredujemo seznam nizov v columns> parameter za pd.DataFrame()> konstruktor.
# importing pandas as pd import pandas as pd # list of name, degree, score nme = ['aparna', 'pankaj', 'sudhir', 'Geeku'] deg = ['MBA', 'BCA', 'M.Tech', 'MBA'] scr = [90, 40, 80, 98] # dictionary of lists dict = {'name': nme, 'degree': deg, 'score': scr} df = pd.DataFrame(dict) print(df) Izhod:
name degree score 0 aparna MBA 90 1 pankaj BCA 40 2 sudhir M.Tech 80 3 Geeku MBA 98
Ustvari DataFrame iz seznama z uporabo zip()
Če želite ustvariti Pandas DataFrame iz seznamov z uporabo zip(). Uporabimo lahko tudi zip()> funkcijo za stiskanje več seznamov, da ustvarite DataFrame z več stolpci.
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # list of int lst2 = [11, 22, 33, 44, 55, 66, 77] # Calling DataFrame constructor after zipping # both lists, with columns specified df = pd.DataFrame(list(zip(lst, lst2)), columns =['Name', 'val']) print(df)
Izhod:
Name val 0 Geeks 11 1 For 22 2 Geeks 33 3 is 44 4 portal 55 5 for 66 6 Geeks 77
Ustvarite DataFrame s seznama tako, da spremenite vrsto podatkov
Če želite ustvariti Pandas DataFrame z uporabo večdimenzionalnega seznama z navedenimi imeni stolpcev in dtypes. Z določitvijo dtypes lahko zagotovimo, da je DataFrame ustvarjen s pravilnimi tipi podatkov.
Python import pandas as pd # List1 lst = [['tom', 'reacher', 25], ['krish', 'pete', 30], ['nick', 'wilson', 26], ['juli', 'williams', 22]] # Create DataFrame df = pd.DataFrame(lst, columns=['FName', 'LName', 'Age']) # Convert 'Age' column to float df['Age'] = df['Age'].astype(float) print(df)
Izhod:
FName LName Age 0 tom reacher 25.0 1 krish pete 30.0 2 nick wilson 26.0 3 juli williams 22.0
Ustvari DataFrame iz seznama z uporabo večdimenzionalnega seznama
Če želite ustvariti DataFrame z uporabo večdimenzionalnega seznama, lahko uporabite pd.DataFrame()> konstruktor. The pd.DataFrame()> konstruktor vzame seznam seznamov kot vhod in ustvari DataFrame z enakim številom vrstic in stolpcev kot vhodni seznam.
# import pandas as pd import pandas as pd # List1 lst = [['tom', 25], ['krish', 30], ['nick', 26], ['juli', 22]] df = pd.DataFrame(lst, columns =['Name', 'Age']) print(df)
Izhod:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22
Ustvari DataFrame s seznama z imeni indeksov in stolpcev
Če želite ustvariti DataFrame s seznamom z imeni indeksov in stolpcev, lahko uporabite pd.DataFrame()> konstruktor z index> in columns> parametri.
# import pandas as pd import pandas as pd # list of strings lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list # with indices and columns specified df = pd.DataFrame(lst, index =['a', 'b', 'c', 'd', 'e', 'f', 'g'], columns =['Names']) print(df)
Izhod:
Names a Geeks b For c Geeks d is e portal f for g Geeks