Come creare un DataFrame in Python?
Un Data Frame è una raccolta di dati bidimensionale. È una struttura dati in cui i dati sono archiviati in forma tabellare. I set di dati sono organizzati in righe e colonne; possiamo memorizzare più set di dati nel frame di dati. Possiamo eseguire varie operazioni aritmetiche, come aggiungere la selezione di colonne/righe e colonne/righe nel frame di dati.
In Python, un DataFrame, un componente fondamentale della libreria Pandas, funge da contenitore di dati bidimensionale completo. Simile a una tabella, incapsula i dati con chiarezza, utilizzando righe e colonne, ciascuna dotata di un indice distintivo. La sua versatilità consente la sistemazione di diversi tipi di dati all'interno delle colonne, offrendo flessibilità nella gestione di set di dati complessi.
Pandas DataFrames offre agli utenti una vasta gamma di funzionalità. Dalla creazione di dati strutturati utilizzando dizionari o altre strutture di dati all'impiego di una solida indicizzazione per un accesso continuo ai dati, Pandas facilita la manipolazione dei dati senza sforzo. La libreria fornisce un'interfaccia intuitiva per l'esecuzione di operazioni come il filtraggio delle righe in base alle condizioni, il raggruppamento dei dati per l'aggregazione e l'esecuzione semplice di analisi statistiche.
Possiamo importare i DataFrames dalla memoria esterna; questi archivi possono essere indicati come SQL Database, file CSV e un file Excel. Possiamo anche utilizzare elenchi, dizionari e da un elenco di dizionari, ecc.
In questo tutorial impareremo a creare il data frame in diversi modi. Comprendiamo questi diversi modi.
Per prima cosa dobbiamo installare la libreria Pandas nel file Pitone ambiente.
Un dataframe vuoto
Possiamo creare un Dataframe vuoto di base. Il costruttore del dataframe deve essere chiamato per creare DataFrame. Comprendiamo il seguente esempio.
Esempio -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are Calling DataFrame constructor df = pd.DataFrame() print(df) # here, we are printing the dataframe
Produzione:
Empty DataFrame Columns: [] Index: []
Metodo - 2: crea un dataframe utilizzando List
Possiamo creare dataframe utilizzando un singolo elenco o elenco di elenchi. Comprendiamo il seguente esempio.
Esempio -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are declaring the string values in the list lst = ['Java', 'Python', 'C', 'C++', 'JavaScript', 'Swift', 'Go'] # Here, we are calling DataFrame constructor on list dframe = pd.DataFrame(lst) print(dframe) # here, we are printing the dataframe
Produzione:
0 Java 1 Python 2 C 3 C++ 4 JavaScript 5 Swift 6 Go
Spiegazione:
- Importa Panda: importa panda come pd importa la libreria Pandas e la soprannomina come pd per la scortesia.
- Crea elenco: lst è un elenco contenente valori stringa che indirizzano i dialetti di programmazione.
- Sviluppo DataFrame: pd.DataFrame(lst) crea un DataFrame dal rundown lst. Naturalmente, quando viene fornito un elenco solitario, Pandas crea un DataFrame con una sezione solitaria.
- Stampa DataFrame: print(dframe) stampa il DataFrame successivo.
Metodo - 3: crea Dataframe da dict of ndarray/lists
Il comando ndarray/lists può essere utilizzato per creare un dataframe, tutto il ndaray devono essere della stessa lunghezza. Per impostazione predefinita, l'indice sarà un intervallo (n); dove n indica la lunghezza dell'array. Comprendiamo il seguente esempio.
Esempio -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the data of lists. data = {'Name': ['Tom', 'Joseph', 'Krish', 'John'], 'Age': [20, 21, 19, 18]} # Here, we are creating the DataFrame df = pd.DataFrame(data) # here, we are printing the dataframe # Here, we are printing the output. print(df) # here, we are printing the dataframe Produzione:
Name Age 0 Tom 20 1 Joseph 21 2 Krish 19 3 John 18
Spiegazione:
- Importa Panda: importa panda come pd importa la libreria Pandas e la chiama pd.
- Crea dizionario: le informazioni sono un riferimento a una parola in cui le chiavi sono nomi di segmenti ('Nome' e 'Età') e i valori sono record contenenti informazioni correlate.
- Sviluppo DataFrame: pd.DataFrame(data) crea un DataFrame dal riferimento alla parola. Le chiavi diventano i nomi delle sezioni e i rundown diventano i segmenti.
- Stampa DataFrame: print(df) stampa il DataFrame successivo.
Metodo - 4: creare un dataframe di indici utilizzando gli array
Comprendiamo l'esempio seguente per creare il dataframe degli indici utilizzando gli array.
Esempio -
# Here, we are implementing the DataFrame using arrays. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the data of lists. data = {'Name':['Renault', 'Duster', 'Maruti', 'Honda City'], 'Ratings':[9.0, 8.0, 5.0, 3.0]} # Here, we are creating the pandas DataFrame. df = pd.DataFrame(data, index =['position1', 'position2', 'position3', 'position4']) # Here, we are printing the data print(df) Produzione:
Name Ratings position1 Renault 9.0 position2 Duster 8.0 position3 Maruti 5.0 position4 Honda City 3.0
Spiegazione:
- Importa Panda: importa panda come pd importa la libreria Pandas e la chiama pd.
- Crea dizionario: le informazioni sono un riferimento a parole in cui le chiavi sono nomi di segmenti ('Nome' e 'Valutazioni') e i valori sono record contenenti informazioni correlate.
- Sviluppo DataFrame: pd.DataFrame(data, index=['position1', 'position2', 'position3', 'position4']) crea un DataFrame dal riferimento alla parola. Alle linee è assegnata la lista predefinita.
- Stampa DataFrame: print(df) stampa il DataFrame successivo.
Metodo - 5: crea Dataframe dall'elenco di dict
Possiamo passare gli elenchi di dizionari come dati di input per creare il dataframe Pandas. I nomi delle colonne vengono presi come chiavi per impostazione predefinita. Comprendiamo il seguente esempio.
Esempio -
# Here, we are implementing an example to create # Pandas DataFrame by using the lists of dicts. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the values to lists. data = [{'A': 10, 'B': 20, 'C':30}, {'x':100, 'y': 200, 'z': 300}] # Here, we are creating the DataFrame. df = pd.DataFrame(data) # Here, we are printing the data of the dataframe print(df) Produzione:
A B C x y z 0 10.0 20.0 30.0 NaN NaN NaN 1 NaN NaN NaN 100.0 200.0 300.0
Comprendiamo un altro esempio per creare il dataframe panda dall'elenco di dizionari con indice di riga e indice di colonna.
Spiegazione:
- Importa Panda: importa panda come pd importa la libreria Pandas e la chiama pd.
- Crea elenco e dizionario: le informazioni sono un elenco in cui ogni componente è un riferimento a una parola che indirizza una colonna nel DataFrame. Le chiavi dei riferimenti alle parole diventano nomi di segmenti.
- Sviluppo DataFrame: pd.DataFrame(data) crea un DataFrame dalla lista dei riferimenti alle parole. Le chiavi dei riferimenti alle parole diventano sezioni e le qualità diventano le informazioni nel DataFrame.
- Stampa DataFrame: print(df) stampa il successivo DataFrame.
Esempio - 2:
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the values to the lists. data = [{'x': 1, 'y': 2}, {'A': 15, 'B': 17, 'C': 19}] # Here, we are declaring the two column indices, values same as the dictionary keys dframe1 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y']) # Here, we are declaring the variable dframe1 with the parameters data and the indexes # Here, we are declaring the two column indices with # one index with other name dframe2 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y1']) # Here, we are declaring the variable dframe2 with the parameters data and the indexes # Here, we are printing the first data frame i.e., dframe1 print (dframe1, '
') # Here, we are printing the first data frame i.e., dframe2 print (dframe2) Produzione:
x y first 1.0 2.0 second NaN NaN x y1 first 1.0 NaN second NaN NaN
Spiegazione:
La libreria panda viene utilizzata per realizzare due inconfondibili DataFrames, intesi come dframe1 e dframe2, partendo da una carrellata di riferimenti verbali denominati informazioni. Questi riferimenti verbali fungono da rappresentazioni di singole linee all'interno dei DataFrames, in cui le chiavi si riferiscono ai nomi dei segmenti e le relative qualità indirizzano le informazioni rilevanti. Il DataFrame sottostante, dframe1, viene avviato con file di linee espliciti ('first' e 'second') e record di sezione ('x' e 'y'). Pertanto, un secondo DataFrame, dframe2, viene creato utilizzando una raccolta di informazioni simile ma con una disparità nei file di sezione, esplicitamente indicati come 'x' e 'y1'. Il codice si chiude stampando entrambi i DataFrame al centro di controllo, chiarendo i particolari progetti di sezione di ciascun DataFrame. Questo codice funge da descrizione completa della creazione e del controllo di DataFrame all'interno della libreria panda, offrendo esperienze su come eseguire le varietà dei record di sezione.
Esempio - 3
# The example is to create # Pandas DataFrame by passing lists of # Dictionaries and row indices. import pandas as pd # Here, we are importing the pandas library as pd # assign values to lists data = [{'x': 2, 'z':3}, {'x': 10, 'y': 20, 'z': 30}] # Creates padas DataFrame by passing # Lists of dictionaries and row index. dframe = pd.DataFrame(data, index =['first', 'second']) # Print the dataframe print(dframe) Produzione:
x y z first 2 NaN 3 second 10 20.0 30
Spiegazione:
In questo codice Python, un Pandas DataFrame viene sviluppato utilizzando la libreria pandas fornendo disposizioni di riferimenti alle parole e determinando i record di colonna. Il ciclo inizia con l'importazione della libreria pandas, assegnata per brevità con il falso nome 'pd'. Pertanto, viene caratterizzata una carrellata di riferimenti a parole denominate informazioni, in cui ogni riferimento a parola indirizza una riga del DataFrame. Le chiavi all'interno di questi riferimenti verbali indicano i nomi dei segmenti, mentre i relativi valori indicano le informazioni importanti.
Il DataFrame, indicato come dframe, viene quindi realizzato utilizzando il costruttore pd.DataFrame(), consolidando le informazioni fornite e impostando espressamente i record di riga su 'first' e 'second'. Il DataFrame successivo mostra un design uniforme con sezioni denominate 'x', 'y' e 'z'. Eventuali qualità mancanti sono indicate come 'NaN'.
Metodo - 6: crea Dataframe utilizzando la funzione zip()
La funzione zip() viene utilizzata per unire i due elenchi. Comprendiamo il seguente esempio.
Esempio -
# The example is to create # pandas dataframe from lists using zip. import pandas as pd # Here, we are importing the pandas library as pd # List1 Name = ['tom', 'krish', 'arun', 'juli'] # List2 Marks = [95, 63, 54, 47] # two lists. # and merge them by using zip(). list_tuples = list(zip(Name, Marks)) # Assign data to tuples. print(list_tuples) # Converting lists of tuples into # pandas Dataframe. dframe = pd.DataFrame(list_tuples, columns=['Name', 'Marks']) # Print data. print(dframe)
Produzione:
[('john', 95), ('krish', 63), ('arun', 54), ('juli', 47)] Name Marks 0 john 95 1 krish 63 2 arun 54 3 juli 47
Spiegazione:
Questo codice Python mostra la produzione di un Pandas DataFrame da due record, in particolare 'Nome' e 'Timbri', utilizzando la libreria Pandas e la funzionalità di compressione. A seguito dell'importazione della libreria panda, vengono caratterizzati i record 'Nome' e 'Verifica', indirizzando le sezioni ideali del DataFrame. La funzionalità zip viene utilizzata per unire i componenti confrontati di questi rundown in tuple, inquadrando un altro rundown denominato list_tuples.
Il codice quindi, a quel punto, stampa l'elenco delle tuple per dare una breve occhiata alle informazioni unite. Di conseguenza, un Pandas DataFrame denominato dframe viene creato utilizzando il costruttore pd.DataFrame(), in cui l'elenco delle tuple viene trasformato in una configurazione uniforme organizzata. I segmenti 'Nome' e 'Timbri' vengono assegnati inequivocabilmente durante questo processo di creazione di DataFrame.
Metodo - 7: Crea Dataframe da Dicts di serie
Il dizionario può essere passato per creare un dataframe. Possiamo usare i Dicts delle serie dove l'indice successivo è l'unione di tutte le serie di valori dell'indice passati. Comprendiamo il seguente esempio.
Esempio -
# Pandas Dataframe from Dicts of series. import pandas as pd # Here, we are importing the pandas library as pd # Initialize data to Dicts of series. d = {'Electronics' : pd.Series([97, 56, 87, 45], index =['John', 'Abhinay', 'Peter', 'Andrew']), 'Civil' : pd.Series([97, 88, 44, 96], index =['John', 'Abhinay', 'Peter', 'Andrew'])} # creates Dataframe. dframe = pd.DataFrame(d) # print the data. print(dframe) Produzione:
Electronics Civil John 97 97 Abhinay 56 88 Peter 87 44 Andrew 45 96
Spiegazione:
In questo codice Python, un Pandas DataFrame è costituito da riferimenti a parole di serie che utilizzano la libreria pandas. Due argomenti, 'Gadget' e 'Comuni', vengono affrontati come sezioni e i singoli punteggi con file espliciti vengono coordinati in un DataFrame denominato dframe. La successiva struttura semplice viene stampata al centro di controllo, mostrando una tecnica compatta per coordinare e indagare sui dati contrassegnati utilizzando i Panda.
In questo tutorial, abbiamo discusso i diversi modi per creare DataFrames.