Ako vytvoriť DataFrame v Pythone?

Dátový rámec je dvojrozmerný súbor údajov. Ide o dátovú štruktúru, kde sú dáta uložené v tabuľkovej forme. Množiny údajov sú usporiadané do riadkov a stĺpcov; v dátovom rámci môžeme uložiť viacero množín údajov. Môžeme vykonávať rôzne aritmetické operácie, ako je pridávanie výberu stĺpcov/riadkov a stĺpcov/riadkov do dátového rámca.

V Pythone slúži DataFrame, kľúčový komponent knižnice Pandas, ako komplexný dvojrozmerný dátový kontajner. Pripomína tabuľku a prehľadne zapuzdruje údaje pomocou riadkov a stĺpcov, z ktorých každý je vybavený charakteristickým indexom. Jeho všestrannosť umožňuje umiestnenie rôznych typov údajov v stĺpcoch, čo poskytuje flexibilitu pri manipulácii so zložitými súbormi údajov.

Dátové rámce Pandas poskytujú používateľom širokú škálu funkcií. Od vytvárania štruktúrovaných údajov pomocou slovníkov alebo iných dátových štruktúr až po použitie robustného indexovania pre bezproblémový prístup k údajom, Pandas uľahčuje manipuláciu s údajmi. Knižnica poskytuje intuitívne rozhranie na vykonávanie operácií, ako je filtrovanie riadkov na základe podmienok, zoskupovanie údajov na agregáciu a jednoduché vykonávanie štatistických analýz.

Môžeme importovať DataFrames z externého úložiska; tieto úložiská možno označiť ako SQL Databáza, súbor CSV a súbor Excel. Môžeme použiť aj zoznamy, slovník a zo zoznamu slovníkov atď.

V tomto návode sa naučíme vytvárať dátový rámec viacerými spôsobmi. Poďme pochopiť tieto rôzne spôsoby.

Najprv musíme nainštalovať knižnicu pandy do Python životné prostredie.

Prázdny dátový rámec

Môžeme vytvoriť základný prázdny Dataframe. Na vytvorenie dátového rámca je potrebné zavolať konštruktor dátového rámca. Poďme pochopiť nasledujúci príklad.

Príklad -

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are Calling DataFrame constructor df = pd.DataFrame() print(df) # here, we are printing the dataframe  

Výkon:

 Empty DataFrame Columns: [] Index: []  

Metóda - 2: Vytvorte dátový rámec pomocou zoznamu

Dátový rámec môžeme vytvoriť pomocou jedného zoznamu alebo zoznamu zoznamov. Poďme pochopiť nasledujúci príklad.

Príklad -

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are declaring the string values in the list lst = ['Java', 'Python', 'C', 'C++', 'JavaScript', 'Swift', 'Go'] # Here, we are calling DataFrame constructor on list dframe = pd.DataFrame(lst) print(dframe) # here, we are printing the dataframe  

Výkon:

 0 Java 1 Python 2 C 3 C++ 4 JavaScript 5 Swift 6 Go  

Vysvetlenie:

  • Importovať pandy: importovať pandy ako pd importuje knižnicu Pandy a stručne ju nazýva ako pd.
  • Create List: lst je zhrnutie obsahujúce reťazcové hodnoty adresujúce programovacie dialekty.
  • Vývoj dátového rámca: pd.DataFrame(lst) vytvára dátový rámec zo zhrnutého lst. Samozrejme, keď je daný osamelý prehľad, Pandas vytvorí DataFrame so samostatnou sekciou.
  • Printing DataFrame: print(dframe) vytlačí nasledujúci DataFrame.

Metóda - 3: Vytvorenie dátového rámca z ndarray/zoznamov

Na vytvorenie dátového rámca je možné použiť príkaz ndarray/lists ndarray musí mať rovnakú dĺžku. Index bude štandardne rozsah (n); kde n označuje dĺžku poľa. Poďme pochopiť nasledujúci príklad.

Príklad -

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the data of lists. data = {'Name': ['Tom', 'Joseph', 'Krish', 'John'], 'Age': [20, 21, 19, 18]} # Here, we are creating the DataFrame df = pd.DataFrame(data) # here, we are printing the dataframe # Here, we are printing the output. print(df) # here, we are printing the dataframe  

Výkon:

 Name Age 0 Tom 20 1 Joseph 21 2 Krish 19 3 John 18  

Vysvetlenie:

  • Importovať pandy: importovať pandy ako pd importuje knižnicu Pandy a označuje ju ako pd.
  • Vytvoriť slovník: informácia je odkaz na slovo, kde kľúče sú názvy segmentov („Názov“ a „Vek“) a hodnoty sú záznamy obsahujúce súvisiace informácie.
  • Vývoj dátového rámca: pd.DataFrame(data) vytvára dátový rámec zo slova odkaz. Kľúče sa stanú názvami sekcií a zhrnutia sa stanú segmentmi.
  • Printing DataFrame: print(df) vytlačí nasledujúci DataFrame.

Metóda - 4: Vytvorenie dátového rámca indexov pomocou polí

Poďme pochopiť nasledujúci príklad na vytvorenie dátového rámca indexov pomocou polí.

Príklad -

 # Here, we are implementing the DataFrame using arrays. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the data of lists. data = {'Name':['Renault', 'Duster', 'Maruti', 'Honda City'], 'Ratings':[9.0, 8.0, 5.0, 3.0]} # Here, we are creating the pandas DataFrame. df = pd.DataFrame(data, index =['position1', 'position2', 'position3', 'position4']) # Here, we are printing the data print(df)  

Výkon:

 Name Ratings position1 Renault 9.0 position2 Duster 8.0 position3 Maruti 5.0 position4 Honda City 3.0  

Vysvetlenie:

  • Importovať pandy: importovať pandy ako pd importuje knižnicu Pandy a označuje ju ako pd.
  • Vytvoriť slovník: informácia je odkaz na slovo, kde kľúče sú názvy segmentov („Názov“ a „Vyhodnotenie“) a hodnoty sú záznamy obsahujúce súvisiace informácie.
  • Vývoj DataFrame: pd.DataFrame(data, index=['position1', 'position2', 'position3', 'position4']) vytvorí DataFrame z odkazu na slovo. Preddefinovaný zoznam je priradený k riadkom.
  • Printing DataFrame: print(df) vytlačí nasledujúci DataFrame.

Metóda - 5: Vytvorte Dataframe zo zoznamu diktátov

Zoznamy slovníkov môžeme odovzdať ako vstupné údaje na vytvorenie dátového rámca Pandas. Názvy stĺpcov sa štandardne berú ako kľúče. Poďme pochopiť nasledujúci príklad.

Príklad -

 # Here, we are implementing an example to create # Pandas DataFrame by using the lists of dicts. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the values to lists. data = [{'A': 10, 'B': 20, 'C':30}, {'x':100, 'y': 200, 'z': 300}] # Here, we are creating the DataFrame. df = pd.DataFrame(data) # Here, we are printing the data of the dataframe print(df)  

Výkon:

 A B C x y z 0 10.0 20.0 30.0 NaN NaN NaN 1 NaN NaN NaN 100.0 200.0 300.0  

Poďme pochopiť ďalší príklad vytvorenia dátového rámca pandy zo zoznamu slovníkov s indexom riadkov aj indexom stĺpcov.

Vysvetlenie:

  • Importovať pandy: importovať pandy ako pd importuje knižnicu Pandy a označuje ju ako pd.
  • Vytvoriť zoznam a slovník: informácie sú zhrnutie, kde každý komponent je odkazom na slovo adresujúcim stĺpec v DataFrame. Kľúče slovných odkazov sa stanú názvami segmentov.
  • Vývoj dátového rámca: pd.DataFrame(data) vytvára dátový rámec zo zhrnutia slovných odkazov. Kľúče slovných odkazov sa stanú sekciami a kvality sa stanú informáciami v DataFrame.
  • Printing DataFrame: print(df) vytlačí nasledujúci DataFrame.

Príklad – 2:

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the values to the lists. data = [{'x': 1, 'y': 2}, {'A': 15, 'B': 17, 'C': 19}] # Here, we are declaring the two column indices, values same as the dictionary keys dframe1 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y']) # Here, we are declaring the variable dframe1 with the parameters data and the indexes # Here, we are declaring the two column indices with # one index with other name dframe2 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y1']) # Here, we are declaring the variable dframe2 with the parameters data and the indexes # Here, we are printing the first data frame i.e., dframe1 print (dframe1, '
') # Here, we are printing the first data frame i.e., dframe2 print (dframe2)  

Výkon:

 x y first 1.0 2.0 second NaN NaN x y1 first 1.0 NaN second NaN NaN  

Vysvetlenie:

Knižnica pandas sa používa na vytvorenie dvoch nezameniteľných dátových rámov, mienených ako dframe1 a dframe2, počnúc súhrnom slovných odkazov s názvom informácie. Tieto slovné odkazy fungujú ako zobrazenia jednotlivých riadkov vo vnútri dátových rámcov, pričom kľúče sa týkajú názvov segmentov a súvisiace kvality adresujú relevantné informácie. Základný DataFrame, dframe1, sa spúšťa s explicitnými súbormi riadkov („prvý“ a „druhý“) a záznamami sekcií („x“ a „y“). Druhý DataFrame, dframe2, je teda vytvorený pomocou podobnej informačnej kolekcie, avšak s rozdielmi v súboroch sekcií, explicitne označenými ako 'x' a 'y1'. Kód sa uzavrie vytlačením oboch DataFrame do riadiaceho centra, čím sa objasnia konkrétne návrhy sekcií každého DataFrame. Tento kód sa vyplní ako rozsiahly prehľad vytvárania a ovládania DataFrame v knižnici pandas a ponúka skúsenosti s tým, ako možno vykonávať odrody v záznamoch sekcií.

Príklad - 3

 # The example is to create # Pandas DataFrame by passing lists of # Dictionaries and row indices. import pandas as pd # Here, we are importing the pandas library as pd # assign values to lists data = [{'x': 2, 'z':3}, {'x': 10, 'y': 20, 'z': 30}] # Creates padas DataFrame by passing # Lists of dictionaries and row index. dframe = pd.DataFrame(data, index =['first', 'second']) # Print the dataframe print(dframe)  

Výkon:

 x y z first 2 NaN 3 second 10 20.0 30  

Vysvetlenie:

V tomto kóde Pythonu je Pandas DataFrame vyvinutý s využitím knižnice pandas tým, že poskytuje usporiadanie slovných odkazov a určuje záznamy stĺpcov. Cyklus začína importom knižnice pandy, ktorá je kvôli stručnosti priradená falošným názvom 'pd'. Preto je charakterizovaný súhrn slovných odkazov s názvom informácie, kde každý slovný odkaz adresuje riadok dátového rámca. Klávesy vo vnútri týchto slovných odkazov znamenajú názvy segmentov, zatiaľ čo súvisiace hodnoty označujú dôležité informácie.

DataFrame, označený ako dframe, sa potom vytvorí pomocou konštruktora pd.DataFrame(), konsoliduje poskytnuté informácie a výslovne nastaví riadkové záznamy na „prvý“ a „druhý“. Nasledujúci DataFrame zobrazuje rovnomerný dizajn s časťami s názvom „x“, „y“ a „z“. Všetky chýbajúce vlastnosti sú označené ako „NaN“.

Metóda - 6: Vytvorenie dátového rámca pomocou funkcie zip().

Na zlúčenie dvoch zoznamov sa používa funkcia zip(). Poďme pochopiť nasledujúci príklad.

Príklad -

 # The example is to create # pandas dataframe from lists using zip. import pandas as pd # Here, we are importing the pandas library as pd # List1 Name = ['tom', 'krish', 'arun', 'juli'] # List2 Marks = [95, 63, 54, 47] # two lists. # and merge them by using zip(). list_tuples = list(zip(Name, Marks)) # Assign data to tuples. print(list_tuples) # Converting lists of tuples into # pandas Dataframe. dframe = pd.DataFrame(list_tuples, columns=['Name', 'Marks']) # Print data. print(dframe)  

Výkon:

 [('john', 95), ('krish', 63), ('arun', 54), ('juli', 47)] Name Marks 0 john 95 1 krish 63 2 arun 54 3 juli 47  

Vysvetlenie:

Tento Python kód ukazuje produkciu Pandas DataFrame z dvoch záznamov, konkrétne 'Name' a 'Stamps', s využitím knižnice pandas a schopnosti komprimácie. Po importe knižnice pandas sú charakterizované záznamy „Name“ a „Checks“, ktoré sa týkajú ideálnych častí DataFrame. Schopnosť zipsu sa využíva na spojenie porovnávacích komponentov z týchto zhrnutí do n-tic, čím sa vytvorí ďalší zoznam s názvom list_tuples.

Kód potom v tomto bode vytlačí prehľad n-tic, aby poskytol krátky pohľad na spojené informácie. V dôsledku toho sa Pandas DataFrame s názvom dframe vytvorí pomocou konštruktora pd.DataFrame(), v ktorom sa zhrnutie n-tic zmení na organizovanú párnu konfiguráciu. Segmenty 'Name' a 'Stamps' sú počas tohto procesu vytvárania DataFrame jednoznačne pridelené.

Metóda - 7: Vytvorenie dátového rámca z Dicts of series

Slovník je možné odovzdať na vytvorenie dátového rámca. Môžeme použiť Dicts of series, kde nasledujúci index je spojením všetkých sérií odovzdaných hodnôt indexu. Poďme pochopiť nasledujúci príklad.

Príklad -

 # Pandas Dataframe from Dicts of series. import pandas as pd # Here, we are importing the pandas library as pd # Initialize data to Dicts of series. d = {'Electronics' : pd.Series([97, 56, 87, 45], index =['John', 'Abhinay', 'Peter', 'Andrew']), 'Civil' : pd.Series([97, 88, 44, 96], index =['John', 'Abhinay', 'Peter', 'Andrew'])} # creates Dataframe. dframe = pd.DataFrame(d) # print the data. print(dframe)  

Výkon:

 Electronics Civil John 97 97 Abhinay 56 88 Peter 87 44 Andrew 45 96  

Vysvetlenie:

V tomto kóde Pythonu je dátový rámec Pandas vytvorený zo slovných odkazov na série s využitím knižnice pandas. Dva predmety, 'Gadgets' a 'Common,' sú riešené ako sekcie a jednotlivé skóre s explicitnými súbormi sú koordinované do DataFrame s názvom dframe. Následná jednoduchá konštrukcia je vytlačená do riadiaceho centra a ukazuje kompaktnú techniku ​​na koordináciu a skúmanie označených informácií pomocou Pandy.

V tomto návode sme diskutovali o rôznych spôsoboch vytvárania dátových rámov.