I panda leggono CSV in Python

I file CSV sono file separati da virgole. Per accedere ai dati dal file CSV, abbiamo bisogno di una funzione read_csv() di Pandas che recuperi i dati sotto forma di frame di dati.

Sintassi di read_csv()

Ecco il I panda leggono CSV sintassi con i suoi parametri.

Sintassi: pd.read_csv (filepath_or_buffer, sep=' ,' , header='infer', index_col=None, usecols=None, engine=None, skiprows=None, nrows=None)

parametri:

  • percorso_file_o_buffer : posizione del file CSV. Accetta qualsiasi percorso di stringa o URL del file.
  • sett : sta per separatore, il valore predefinito è ','.
  • intestazione : Accetta int, un elenco di int, numeri di riga da utilizzare come nomi di colonna e l'inizio dei dati. Se non viene passato alcun nome, ovvero header=None, verrà visualizzata la prima colonna come 0, la seconda come 1 e così via.
  • usecols : recupera solo le colonne selezionate dal file CSV.
  • nrows : numero di righe da visualizzare dal set di dati.
  • indice_col : Se Nessuno, non vengono visualizzati numeri di indice insieme ai record.
  • skiprow : Salta le righe passate nel nuovo frame di dati.

Leggi il file CSV utilizzando Panda read_csv

Prima di utilizzare questa funzione, dobbiamo importare il file Panda libreria, caricheremo il file CSV utilizzando Pandas.

PITONE3




# Import pandas> import> pandas as pd> # reading csv file> df> => pd.read_csv(> 'people.csv'> )> print> (df.head())>

Produzione:

 First Name Last Name Sex Email Date of birth Job Title  0 Shelby Terrell Male [email protected] 1945-10-26 Games developer  1 Phillip Summers Female [email protected] 1910-03-24 Phytotherapist  2 Kristine Travis Male [email protected] 1992-07-02 Homeopath  3 Yesenia Martinez Male [email protected] 2017-08-03 Market researcher 4 Lori Todd Male [email protected] 1938-12-01 Veterinary surgeon 

Utilizzando sett in read_csv()

In questo esempio, prenderemo un file CSV e quindi aggiungeremo alcuni caratteri speciali per vedere come funziona il file sett il parametro funziona.

Python3




# sample = 'totalbill_tip, sex:smoker, day_time, size> # 16.99, 1.01:Female|No, Sun, Dinner, 2> # 10.34, 1.66, Male, No|Sun:Dinner, 3> # 21.01:3.5_Male, No:Sun, Dinner, 3> #23.68, 3.31, Male|No, Sun_Dinner, 2> # 24.59:3.61, Female_No, Sun, Dinner, 4> # 25.29, 4.71|Male, No:Sun, Dinner, 4'> # Importing pandas library> import> pandas as pd> # Load the data of csv> df> => pd.read_csv(> 'sample.csv'> ,> > sep> => '[:, |_]'> ,> > engine> => 'python'> )> # Print the Dataframe> print> (df)>

Produzione:

 totalbill tip Unnamed: 2 sex smoker Unnamed: 5 day time Unnamed: 8 size  16.99 NaN 1.01 Female No NaN Sun NaN Dinner NaN 2 10.34 NaN 1.66 NaN Male NaN No Sun Dinner NaN 3 21.01 3.50 Male NaN No Sun NaN Dinner NaN 3.0 None 23.68 NaN 3.31 NaN Male No NaN Sun Dinner NaN 2 24.59 3.61 NaN Female No NaN Sun NaN Dinner NaN 2 25.29 NaN 4.71 Male NaN No Sun NaN Dinner NaN 4 

Utilizzo di usecols in read_csv()

Qui stiamo specificando solo 3 colonne, ovvero [Nome, Sesso, Email] da caricare e utilizziamo l'intestazione 0 come intestazione predefinita.

Python3




df> => pd.read_csv(> 'people.csv'> ,> > header> => 0> ,> > usecols> => [> 'First Name'> ,> 'Sex'> ,> 'Email'> ])> # printing dataframe> print> (df.head())>

Produzione:

 First Name Sex Email 0 Shelby Male [email protected] 1 Phillip Female [email protected] 2 Kristine Male [email protected] 3 Yesenia Male [email protected] 4 Lori Male [email protected] 

Utilizzando index_col in read_csv()

Qui usiamo il Sesso prima l'indice e poi il Titolo di lavoro index, possiamo semplicemente reindicizzare l'intestazione con indice_col parametro.

Python3




df> => pd.read_csv(> 'people.csv'> ,> > header> => 0> ,> > index_col> => [> 'Sex'> ,> 'Job Title'> ],> > usecols> => [> 'Sex'> ,> 'Job Title'> ,> 'Email'> ])> print> (df.head())>

Produzione:

 Email Sex Job Title  Male Games developer [email protected] Female Phytotherapist [email protected] Male Homeopath [email protected]  Market researcher [email protected]  Veterinary surgeon [email protected] 

Utilizzando nrows in read_csv()

Qui, visualizziamo solo solo 5 righe utilizzando parametro nrows .

Python3




df> => pd.read_csv(> 'people.csv'> ,> > header> => 0> ,> > index_col> => [> 'Sex'> ,> 'Job Title'> ],> > usecols> => [> 'Sex'> ,> 'Job Title'> ,> 'Email'> ],> > nrows> => 3> )> print> (df)>

Produzione:

 Email Sex Job Title  Male Games developer [email protected] Female Phytotherapist [email protected] Male Homeopath [email protected] 

Utilizzo degli skiprow in read_csv()

IL skiprow aiuta a saltare alcune righe in CSV, ovvero qui osserverai che le righe menzionate in skiprows sono state saltate dal set di dati originale.

Python3




df> => pd.read_csv(> 'people.csv'> )> print> (> 'Previous Dataset: '> )> print> (df)> # using skiprows> df> => pd.read_csv(> 'people.csv'> , skiprows> => [> 1> ,> 5> ])> print> (> 'Dataset After skipping rows: '> )> print> (df)>

Produzione:

Previous Dataset:  First Name Last Name Sex Email Date of birth Job Title  0 Shelby Terrell Male [email protected] 1945-10-26 Games developer 1 Phillip Summers Female [email protected] 1910-03-24 Phytotherapist  2 Kristine Travis Male [email protected] 1992-07-02 Homeopath  3 Yesenia Martinez Male [email protected] 2017-08-03 Market researcher 4 Lori Todd Male [email protected] 1938-12-01 Veterinary surgeon  5 Erin Day Male [email protected] 2015-10-28 Management officer  6 Katherine Buck Female [email protected] 1989-01-22 Analyst 7 Ricardo Hinton Male [email protected] 1924-03-26 Hydrogeologist  Dataset After skipping rows:   First Name Last Name Sex Email Date of birth Job Title  0 Shelby Terrell Male [email protected] 1945-10-26 Games developer 1 Kristine Travis Male [email protected] 1992-07-02 Homeopath  2 Yesenia Martinez Male [email protected] 2017-08-03 Market researcher 3 Lori Todd Male [email protected] 1938-12-01 Veterinary surgeon  4 Katherine Buck Female [email protected] 1989-01-22 Analyst 5 Ricardo Hinton Male [email protected] 1924-03-26 Hydrogeologist