Kako stvoriti DataFrame u Pythonu?
Data Frame je dvodimenzionalna zbirka podataka. To je podatkovna struktura u kojoj su podaci pohranjeni u tabelarnom obliku. Skupovi podataka raspoređeni su u retke i stupce; možemo pohraniti više skupova podataka u okviru podataka. Možemo izvoditi različite aritmetičke operacije, kao što je dodavanje odabira stupaca/redova i stupaca/redaka u okviru podataka.
U Pythonu, DataFrame, ključna komponenta biblioteke Pandas, služi kao sveobuhvatni spremnik dvodimenzionalnih podataka. Nalik na tablicu, jasno sažima podatke, koristeći retke i stupce, od kojih svaki ima poseban indeks. Njegova svestranost omogućuje smještaj različitih tipova podataka unutar stupaca, omogućujući fleksibilnost u rukovanju složenim skupovima podataka.
Pandas DataFrames osnažuje korisnike širokim nizom funkcionalnosti. Od stvaranja strukturiranih podataka korištenjem rječnika ili drugih struktura podataka do korištenja robusnog indeksiranja za besprijekoran pristup podacima, Pandas olakšava manipulaciju podacima bez napora. Knjižnica pruža intuitivno sučelje za izvršavanje operacija kao što je filtriranje redaka na temelju uvjeta, grupiranje podataka za agregaciju i izvođenje statističkih analiza s lakoćom.
Možemo uvesti DataFrames iz vanjske pohrane; ta se skladišta mogu nazvati SQL Baza podataka, CSV datoteka i Excel datoteka. Također možemo koristiti popise, rječnik, s popisa rječnika itd.
U ovom vodiču naučit ćemo izraditi podatkovni okvir na više načina. Hajdemo razumjeti ove različite načine.
Prvo moramo instalirati biblioteku pandas u Piton okoliš.
Prazan podatkovni okvir
Možemo stvoriti osnovni prazan Dataframe. Konstruktor podatkovnog okvira mora se pozvati da bi se stvorio DataFrame. Razumimo sljedeći primjer.
Primjer -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are Calling DataFrame constructor df = pd.DataFrame() print(df) # here, we are printing the dataframe
Izlaz:
Empty DataFrame Columns: [] Index: []
Metoda - 2: Stvorite podatkovni okvir pomoću popisa
Možemo izraditi podatkovni okvir pomoću jednog popisa ili popisa popisa. Razumimo sljedeći primjer.
Primjer -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are declaring the string values in the list lst = ['Java', 'Python', 'C', 'C++', 'JavaScript', 'Swift', 'Go'] # Here, we are calling DataFrame constructor on list dframe = pd.DataFrame(lst) print(dframe) # here, we are printing the dataframe
Izlaz:
0 Java 1 Python 2 C 3 C++ 4 JavaScript 5 Swift 6 Go
Obrazloženje:
- Import Pandas: import pandas as pd uvozi biblioteku Pandas i označava je kao pd zbog kratkoće.
- Stvori popis: lst je sažetak koji sadrži vrijednosti niza koji se odnose na dijalekte programiranja.
- Razvoj DataFramea: pd.DataFrame(lst) gradi DataFrame od sažetka lst. Naravno, kada je dan pojedinačni sažetak, Pandas izrađuje DataFrame s pojedinačnim dijelom.
- Ispis DataFramea: print(dframe) ispisuje sljedeći DataFrame.
Metoda - 3: Stvorite Dataframe iz dict od ndarray/lists
Dikt ndarray/lists može se koristiti za stvaranje podatkovnog okvira, sve ndarray moraju biti iste dužine. Indeks će prema zadanim postavkama biti raspon(n); gdje n označava duljinu niza. Razumimo sljedeći primjer.
Primjer -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the data of lists. data = {'Name': ['Tom', 'Joseph', 'Krish', 'John'], 'Age': [20, 21, 19, 18]} # Here, we are creating the DataFrame df = pd.DataFrame(data) # here, we are printing the dataframe # Here, we are printing the output. print(df) # here, we are printing the dataframe Izlaz:
Name Age 0 Tom 20 1 Joseph 21 2 Krish 19 3 John 18
Obrazloženje:
- Import Pandas: uvoz pandi kao pd uvozi biblioteku Pandas i naziva je pd.
- Stvori rječnik: informacija je referenca riječi gdje su ključevi nazivi segmenata ('Ime' i 'Dob'), a vrijednosti su zapisi koji sadrže povezane informacije.
- Razvoj DataFramea: pd.DataFrame(data) gradi DataFrame od reference riječi. Ključevi postaju nazivi odjeljaka, a nizovi postaju segmenti.
- Ispis DataFramea: print(df) ispisuje sljedeći DataFrame.
Metoda - 4: Stvorite okvir podataka indeksa pomoću nizova
Razmotrimo sljedeći primjer za stvaranje okvira podataka indeksa pomoću nizova.
Primjer -
# Here, we are implementing the DataFrame using arrays. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the data of lists. data = {'Name':['Renault', 'Duster', 'Maruti', 'Honda City'], 'Ratings':[9.0, 8.0, 5.0, 3.0]} # Here, we are creating the pandas DataFrame. df = pd.DataFrame(data, index =['position1', 'position2', 'position3', 'position4']) # Here, we are printing the data print(df) Izlaz:
Name Ratings position1 Renault 9.0 position2 Duster 8.0 position3 Maruti 5.0 position4 Honda City 3.0
Obrazloženje:
- Import Pandas: uvoz pandi kao pd uvozi biblioteku Pandas i naziva je pd.
- Stvori rječnik: informacija je referenca riječi gdje su ključevi nazivi segmenata ('Naziv' i 'Ocjene'), a vrijednosti su zapisi koji sadrže povezane informacije.
- Razvoj DataFramea: pd.DataFrame(data, index=['position1', 'position2', 'position3', 'position4']) gradi DataFrame od reference riječi. Predefinirani popis je dodijeljen linijama.
- Ispis DataFramea: print(df) ispisuje sljedeći DataFrame.
Metoda - 5: Stvorite Dataframe iz popisa dictova
Možemo proslijediti popise rječnika kao ulazne podatke za stvaranje okvira podataka Pandas. Imena stupaca se prema zadanim postavkama uzimaju kao ključevi. Razumimo sljedeći primjer.
Primjer -
# Here, we are implementing an example to create # Pandas DataFrame by using the lists of dicts. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the values to lists. data = [{'A': 10, 'B': 20, 'C':30}, {'x':100, 'y': 200, 'z': 300}] # Here, we are creating the DataFrame. df = pd.DataFrame(data) # Here, we are printing the data of the dataframe print(df) Izlaz:
A B C x y z 0 10.0 20.0 30.0 NaN NaN NaN 1 NaN NaN NaN 100.0 200.0 300.0
Razmotrimo još jedan primjer za stvaranje podatkovnog okvira pandas iz popisa rječnika s indeksom reda i stupca.
Obrazloženje:
- Import Pandas: uvoz pandi kao pd uvozi biblioteku Pandas i naziva je pd.
- Stvorite popis i rječnik: informacije su sažetak gdje je svaka komponenta referenca riječi koja se odnosi na stupac u DataFrameu. Ključevi referenci riječi postaju nazivi segmenata.
- Razvoj DataFramea: pd.DataFrame(data) gradi DataFrame iz niza referenci riječi. Ključevi referenci riječi postaju odjeljci, a kvalitete informacije u DataFrameu.
- Ispis DataFramea: print(df) ispisuje sljedeći DataFrame.
Primjer - 2:
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the values to the lists. data = [{'x': 1, 'y': 2}, {'A': 15, 'B': 17, 'C': 19}] # Here, we are declaring the two column indices, values same as the dictionary keys dframe1 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y']) # Here, we are declaring the variable dframe1 with the parameters data and the indexes # Here, we are declaring the two column indices with # one index with other name dframe2 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y1']) # Here, we are declaring the variable dframe2 with the parameters data and the indexes # Here, we are printing the first data frame i.e., dframe1 print (dframe1, '
') # Here, we are printing the first data frame i.e., dframe2 print (dframe2) Izlaz:
x y first 1.0 2.0 second NaN NaN x y1 first 1.0 NaN second NaN NaN
Obrazloženje:
Knjižnica pandas koristi se za izradu dva nepogrešiva DataFramea, označena kao dframe1 i dframe2, počevši od niza referenci riječi nazvanih informacijama. Ove reference riječi djeluju kao prikazi pojedinačnih redaka unutar DataFramesa, pri čemu se ključevi odnose na nazive segmenata, a povezane kvalitete odnose se na relevantne informacije. Temeljni DataFrame, dframe1, pokreće se eksplicitnim linijskim datotekama ('prvi' i 'drugi') i zapisima odjeljaka ('x' i 'y'). Prema tome, drugi DataFrame, dframe2, kreiran je korištenjem slične zbirke informacija, ali s nesrazmjerom u datotekama odjeljaka, eksplicitno označenim kao 'x' i 'y1'. Kod se zatvara ispisom oba DataFramea u kontrolni centar, pojašnjavajući dizajn pojedinih odjeljaka svakog DataFramea. Ovaj kod predstavlja opsežan pregled stvaranja DataFramea i kontrole unutar biblioteke pandas, nudeći iskustva o tome kako se mogu izvršiti različiti zapisi sekcija.
Primjer - 3
# The example is to create # Pandas DataFrame by passing lists of # Dictionaries and row indices. import pandas as pd # Here, we are importing the pandas library as pd # assign values to lists data = [{'x': 2, 'z':3}, {'x': 10, 'y': 20, 'z': 30}] # Creates padas DataFrame by passing # Lists of dictionaries and row index. dframe = pd.DataFrame(data, index =['first', 'second']) # Print the dataframe print(dframe) Izlaz:
x y z first 2 NaN 3 second 10 20.0 30
Obrazloženje:
U ovom Python kodu, Pandas DataFrame razvijen je korištenjem pandas biblioteke davanjem rasporeda referenci riječi i određivanjem zapisa stupaca. Ciklus počinje s uvozom biblioteke pandas, dodijeljene lažnim imenom 'pd' radi kratkoće. Stoga je karakteriziran niz referenci riječi nazvanih informacija, pri čemu svaka referenca riječi adresira liniju DataFramea. Ključevi unutar ovih referenci riječi označavaju nazive segmenata, dok odgovarajuće vrijednosti označavaju važne informacije.
DataFrame, naznačen kao dframe, tada se izrađuje korištenjem pd.DataFrame() konstruktora, konsolidirajući dane informacije i izričito postavljajući zapise retka na 'prvi' i 'drugi'. Sljedeći DataFrame prikazuje ravnomjeran dizajn s odjeljcima pod nazivom 'x', 'y' i 'z'. Sve kvalitete koje nedostaju označene su kao 'NaN'.
Metoda - 6: Stvorite Dataframe pomoću funkcije zip().
Funkcija zip() koristi se za spajanje dva popisa. Razumimo sljedeći primjer.
Primjer -
# The example is to create # pandas dataframe from lists using zip. import pandas as pd # Here, we are importing the pandas library as pd # List1 Name = ['tom', 'krish', 'arun', 'juli'] # List2 Marks = [95, 63, 54, 47] # two lists. # and merge them by using zip(). list_tuples = list(zip(Name, Marks)) # Assign data to tuples. print(list_tuples) # Converting lists of tuples into # pandas Dataframe. dframe = pd.DataFrame(list_tuples, columns=['Name', 'Marks']) # Print data. print(dframe)
Izlaz:
[('john', 95), ('krish', 63), ('arun', 54), ('juli', 47)] Name Marks 0 john 95 1 krish 63 2 arun 54 3 juli 47
Obrazloženje:
Ovaj Python kod prikazuje proizvodnju Pandas DataFramea iz dva zapisa, posebno 'Name' i 'Stamps', korištenjem biblioteke pandas i mogućnosti kompresije. Nakon uvoza biblioteke pandas, karakteriziraju se zapisi 'Name' i 'Checks', koji se odnose na idealne dijelove DataFramea. Sposobnost zip-a koristi se za spajanje usporednih komponenti iz ovih nizova u torke, uokvirujući drugi niz pod nazivom list_tuples.
Kod tada, u tom trenutku, ispisuje niz torki kako bi dao kratak pregled spojenih informacija. Posljedično, Pandas DataFrame nazvan dframe napravljen je korištenjem pd.DataFrame() konstruktora, pri čemu se niz torki mijenja u organiziranu ravnomjernu konfiguraciju. Segmenti 'Ime' i 'Oznake' nedvosmisleno su dodijeljeni tijekom ovog procesa stvaranja DataFramea.
Metoda - 7: Stvorite Dataframe iz Dicts serije
Rječnik se može proslijediti za stvaranje podatkovnog okvira. Možemo koristiti Dicts nizova gdje je sljedeći indeks unija svih nizova prenesenih vrijednosti indeksa. Razumimo sljedeći primjer.
Primjer -
# Pandas Dataframe from Dicts of series. import pandas as pd # Here, we are importing the pandas library as pd # Initialize data to Dicts of series. d = {'Electronics' : pd.Series([97, 56, 87, 45], index =['John', 'Abhinay', 'Peter', 'Andrew']), 'Civil' : pd.Series([97, 88, 44, 96], index =['John', 'Abhinay', 'Peter', 'Andrew'])} # creates Dataframe. dframe = pd.DataFrame(d) # print the data. print(dframe) Izlaz:
Electronics Civil John 97 97 Abhinay 56 88 Peter 87 44 Andrew 45 96
Obrazloženje:
U ovom Python kodu, Pandas DataFrame napravljen je od referenci riječi nizova koji koriste biblioteku pandas. Dvije teme, 'Gadgeti' i 'Uobičajeno', obrađuju se kao odjeljci, a pojedinačni rezultati s eksplicitnim datotekama koordiniraju se u DataFrame nazvan dframe. Naknadna obična konstrukcija ispisuje se u kontrolni centar, pokazujući kompaktnu tehniku za koordinaciju i istraživanje označenih informacija korištenjem Panda.
U ovom vodiču raspravljali smo o različitim načinima stvaranja DataFramesa.