Pandas Читайте CSV на Python
Файли CSV є файлами, розділеними комами. Щоб отримати доступ до даних із файлу CSV, нам потрібна функція read_csv() від Pandas, яка отримує дані у формі фрейму даних.
Синтаксис read_csv()
Ось Панди читають CSV синтаксис з його параметрами.
Синтаксис: pd.read_csv (filepath_or_buffer, sep=’,’, header=’infer’, index_col=Немає, usecols=Немає, engine=Немає, skiprows=Немає, nrows=Немає)
Параметри:
- filepath_or_buffer : розташування файлу csv. Він приймає будь-який шлях до рядка або URL-адресу файлу.
- вер : означає роздільник, за замовчуванням — «,».
- заголовок : приймає int, список int, номери рядків, які використовуються як імена стовпців, і початок даних. Якщо не передано жодних імен, тобто header=None, тоді перший стовпець відображатиметься як 0, другий як 1 і так далі.
- usecols : отримує лише вибрані стовпці з файлу CSV.
- nrows : кількість рядків для відображення з набору даних.
- index_col : Якщо немає, номери індексів не відображаються разом із записами.
- skiprows : пропускає передані рядки в новому кадрі даних.
Прочитайте файл CSV за допомогою Pandas read_csv
Перш ніж використовувати цю функцію, ми повинні імпортувати панди бібліотеку, ми завантажимо файл CSV за допомогою Pandas.
PYTHON3
# Import pandas> import> pandas as pd> # reading csv file> df> => pd.read_csv(> 'people.csv'> )> print> (df.head())> |
Вихід:
First Name Last Name Sex Email Date of birth Job Title 0 Shelby Terrell Male [email protected] 1945-10-26 Games developer 1 Phillip Summers Female [email protected] 1910-03-24 Phytotherapist 2 Kristine Travis Male [email protected] 1992-07-02 Homeopath 3 Yesenia Martinez Male [email protected] 2017-08-03 Market researcher 4 Lori Todd Male [email protected] 1938-12-01 Veterinary surgeon
Використання вер у read_csv()
У цьому прикладі ми візьмемо файл CSV і додамо деякі спеціальні символи, щоб побачити, як вер параметр працює.
Python3
# sample = 'totalbill_tip, sex:smoker, day_time, size> # 16.99, 1.01:Female|No, Sun, Dinner, 2> # 10.34, 1.66, Male, No|Sun:Dinner, 3> # 21.01:3.5_Male, No:Sun, Dinner, 3> #23.68, 3.31, Male|No, Sun_Dinner, 2> # 24.59:3.61, Female_No, Sun, Dinner, 4> # 25.29, 4.71|Male, No:Sun, Dinner, 4'> # Importing pandas library> import> pandas as pd> # Load the data of csv> df> => pd.read_csv(> 'sample.csv'> ,> > sep> => '[:, |_]'> ,> > engine> => 'python'> )> # Print the Dataframe> print> (df)> |
Вихід:
totalbill tip Unnamed: 2 sex smoker Unnamed: 5 day time Unnamed: 8 size 16.99 NaN 1.01 Female No NaN Sun NaN Dinner NaN 2 10.34 NaN 1.66 NaN Male NaN No Sun Dinner NaN 3 21.01 3.50 Male NaN No Sun NaN Dinner NaN 3.0 None 23.68 NaN 3.31 NaN Male No NaN Sun Dinner NaN 2 24.59 3.61 NaN Female No NaN Sun NaN Dinner NaN 2 25.29 NaN 4.71 Male NaN No Sun NaN Dinner NaN 4
Використання usecols у read_csv()
Тут ми вказуємо лише 3 стовпці, тобто [Ім’я, Стать, Електронна адреса] для завантаження, і ми використовуємо заголовок 0 як заголовок за умовчанням.
Python3
df> => pd.read_csv(> 'people.csv'> ,> > header> => 0> ,> > usecols> => [> 'First Name'> ,> 'Sex'> ,> 'Email'> ])> # printing dataframe> print> (df.head())> |
Вихід:
First Name Sex Email 0 Shelby Male [email protected] 1 Phillip Female [email protected] 2 Kristine Male [email protected] 3 Yesenia Male [email protected] 4 Lori Male [email protected]
Використання index_col у read_csv()
Тут ми використовуємо секс спочатку індекс, а потім Назва посади index, ми можемо просто переіндексувати заголовок за допомогою index_col параметр.
Python3
df> => pd.read_csv(> 'people.csv'> ,> > header> => 0> ,> > index_col> => [> 'Sex'> ,> 'Job Title'> ],> > usecols> => [> 'Sex'> ,> 'Job Title'> ,> 'Email'> ])> print> (df.head())> |
Вихід:
Email Sex Job Title Male Games developer [email protected] Female Phytotherapist [email protected] Male Homeopath [email protected] Market researcher [email protected] Veterinary surgeon [email protected]
Використання nrows у read_csv()
Тут ми просто відображаємо лише 5 рядків за допомогою параметр nrows .
Python3
df> => pd.read_csv(> 'people.csv'> ,> > header> => 0> ,> > index_col> => [> 'Sex'> ,> 'Job Title'> ],> > usecols> => [> 'Sex'> ,> 'Job Title'> ,> 'Email'> ],> > nrows> => 3> )> print> (df)> |
Вихід:
Email Sex Job Title Male Games developer [email protected] Female Phytotherapist [email protected] Male Homeopath [email protected]
Використання skiprows у read_csv()
The skiprows допоможе пропустити деякі рядки в CSV, тобто тут ви побачите, що рядки, згадані в skiprows, були пропущені з вихідного набору даних.
Python3
df> => pd.read_csv(> 'people.csv'> )> print> (> 'Previous Dataset: '> )> print> (df)> # using skiprows> df> => pd.read_csv(> 'people.csv'> , skiprows> => [> 1> ,> 5> ])> print> (> 'Dataset After skipping rows: '> )> print> (df)> |
Вихід:
Previous Dataset: First Name Last Name Sex Email Date of birth Job Title 0 Shelby Terrell Male [email protected] 1945-10-26 Games developer 1 Phillip Summers Female [email protected] 1910-03-24 Phytotherapist 2 Kristine Travis Male [email protected] 1992-07-02 Homeopath 3 Yesenia Martinez Male [email protected] 2017-08-03 Market researcher 4 Lori Todd Male [email protected] 1938-12-01 Veterinary surgeon 5 Erin Day Male [email protected] 2015-10-28 Management officer 6 Katherine Buck Female [email protected] 1989-01-22 Analyst 7 Ricardo Hinton Male [email protected] 1924-03-26 Hydrogeologist Dataset After skipping rows: First Name Last Name Sex Email Date of birth Job Title 0 Shelby Terrell Male [email protected] 1945-10-26 Games developer 1 Kristine Travis Male [email protected] 1992-07-02 Homeopath 2 Yesenia Martinez Male [email protected] 2017-08-03 Market researcher 3 Lori Todd Male [email protected] 1938-12-01 Veterinary surgeon 4 Katherine Buck Female [email protected] 1989-01-22 Analyst 5 Ricardo Hinton Male [email protected] 1924-03-26 Hydrogeologist