Як створити DataFrame в Python?
Кадр даних — це двовимірний набір даних. Це структура даних, де дані зберігаються в табличній формі. Набори даних упорядковуються в рядки та стовпці; ми можемо зберігати кілька наборів даних у кадрі даних. Ми можемо виконувати різні арифметичні операції, такі як додавання вибору стовпців/рядків і стовпців/рядків у кадрі даних.
У Python DataFrame, ключовий компонент бібліотеки Pandas, служить повним контейнером двовимірних даних. Подібний до таблиці, він чітко інкапсулює дані, використовуючи рядки та стовпці, кожен з яких має характерний індекс. Його універсальність дозволяє розміщувати різні типи даних у стовпцях, забезпечуючи гнучкість у роботі зі складними наборами даних.
Pandas DataFrames надає користувачам широкий набір функціональних можливостей. Від створення структурованих даних за допомогою словників або інших структур даних до використання надійного індексування для безперебійного доступу до даних, Pandas полегшує маніпулювання даними без зусиль. Бібліотека надає інтуїтивно зрозумілий інтерфейс для виконання таких операцій, як фільтрація рядків на основі умов, групування даних для агрегації та виконання статистичних аналізів з легкістю.
Ми можемо імпортувати DataFrames із зовнішнього сховища; ці сховища можна назвати SQL База даних, файл CSV і файл Excel. Ми також можемо використовувати списки, словник, зі списку словника тощо.
У цьому підручнику ми навчимося створювати фрейм даних різними способами. Давайте розберемося в цих різних способах.
По-перше, нам потрібно встановити бібліотеку pandas у Python навколишнє середовище.
Порожній кадр даних
Ми можемо створити базовий порожній фрейм даних. Для створення DataFrame потрібно викликати конструктор кадру даних. Давайте розберемося в наступному прикладі.
приклад -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are Calling DataFrame constructor df = pd.DataFrame() print(df) # here, we are printing the dataframe
Вихід:
Empty DataFrame Columns: [] Index: []
Спосіб 2: Створіть фрейм даних за допомогою списку
Ми можемо створити фрейм даних за допомогою одного списку або списку списків. Давайте розберемося в наступному прикладі.
приклад -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are declaring the string values in the list lst = ['Java', 'Python', 'C', 'C++', 'JavaScript', 'Swift', 'Go'] # Here, we are calling DataFrame constructor on list dframe = pd.DataFrame(lst) print(dframe) # here, we are printing the dataframe
Вихід:
0 Java 1 Python 2 C 3 C++ 4 JavaScript 5 Swift 6 Go
Пояснення:
- Імпорт Pandas: import pandas as pd імпортує бібліотеку Pandas і називає її pd для короткості.
- Створити список: lst — це викладка, що містить рядкові значення, що стосуються діалектів програмування.
- Розробка DataFrame: pd.DataFrame(lst) створює DataFrame із викладеного списку lst. Звичайно, коли дається окремий виклад, Pandas створює DataFrame з окремим розділом.
- Друк DataFrame: print(dframe) друкує наступний DataFrame.
Спосіб - 3: Створення Dataframe з dict ndarray/lists
Команду ndarray/lists можна використовувати для створення фрейму даних ndarray повинні бути однакової довжини. За замовчуванням індексом буде діапазон (n); де n позначає довжину масиву. Давайте розберемося в наступному прикладі.
приклад -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the data of lists. data = {'Name': ['Tom', 'Joseph', 'Krish', 'John'], 'Age': [20, 21, 19, 18]} # Here, we are creating the DataFrame df = pd.DataFrame(data) # here, we are printing the dataframe # Here, we are printing the output. print(df) # here, we are printing the dataframe Вихід:
Name Age 0 Tom 20 1 Joseph 21 2 Krish 19 3 John 18
Пояснення:
- Імпорт Pandas: import pandas as pd імпортує бібліотеку Pandas і називає її pd.
- Створити словник: інформація – це посилання на слова, де ключі – це імена сегментів («Ім’я» та «Вік»), а значення – це записи, що містять відповідну інформацію.
- Розробка DataFrame: pd.DataFrame(data) будує DataFrame із посилання на слово. Ключі стають назвами розділів, а згортки стають сегментами.
- Друк DataFrame: print(df) друкує наступний DataFrame.
Спосіб - 4: Створення індексів Data Frame за допомогою масивів
Розглянемо наступний приклад створення фрейму даних індексів за допомогою масивів.
приклад -
# Here, we are implementing the DataFrame using arrays. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the data of lists. data = {'Name':['Renault', 'Duster', 'Maruti', 'Honda City'], 'Ratings':[9.0, 8.0, 5.0, 3.0]} # Here, we are creating the pandas DataFrame. df = pd.DataFrame(data, index =['position1', 'position2', 'position3', 'position4']) # Here, we are printing the data print(df) Вихід:
Name Ratings position1 Renault 9.0 position2 Duster 8.0 position3 Maruti 5.0 position4 Honda City 3.0
Пояснення:
- Імпорт Pandas: import pandas as pd імпортує бібліотеку Pandas і називає її pd.
- Створити словник: інформація – це посилання на слова, де ключі – це імена сегментів («Ім’я» та «Оцінки»), а значення – це записи, що містять відповідну інформацію.
- Розробка DataFrame: pd.DataFrame(data, index=['position1', 'position2', 'position3', 'position4']) будує DataFrame із посилання на слово. Попередньо визначений список розподіляється по рядках.
- Друк DataFrame: print(df) друкує наступний DataFrame.
Спосіб - 5: Створення Dataframe зі списку dicts
Ми можемо передати списки словників як вхідні дані для створення фрейму даних Pandas. Назви стовпців приймаються як ключі за замовчуванням. Давайте розберемося в наступному прикладі.
приклад -
# Here, we are implementing an example to create # Pandas DataFrame by using the lists of dicts. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the values to lists. data = [{'A': 10, 'B': 20, 'C':30}, {'x':100, 'y': 200, 'z': 300}] # Here, we are creating the DataFrame. df = pd.DataFrame(data) # Here, we are printing the data of the dataframe print(df) Вихід:
A B C x y z 0 10.0 20.0 30.0 NaN NaN NaN 1 NaN NaN NaN 100.0 200.0 300.0
Давайте розглянемо інший приклад створення фрейму даних pandas зі списку словників як з індексом рядка, так і індексом стовпця.
Пояснення:
- Імпорт Pandas: import pandas as pd імпортує бібліотеку Pandas і називає її pd.
- Створити список і словник: інформація – це зведення, де кожен компонент є посиланням на слово, що адресує стовпець у DataFrame. Ключі посилань на слова стають назвами сегментів.
- Розробка DataFrame: pd.DataFrame(data) будує DataFrame із переліку посилань на слова. Ключі посилань на слова стають розділами, а якості стають інформацією в DataFrame.
- Друк DataFrame: print(df) друкує наступний DataFrame.
Приклад - 2:
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the values to the lists. data = [{'x': 1, 'y': 2}, {'A': 15, 'B': 17, 'C': 19}] # Here, we are declaring the two column indices, values same as the dictionary keys dframe1 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y']) # Here, we are declaring the variable dframe1 with the parameters data and the indexes # Here, we are declaring the two column indices with # one index with other name dframe2 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y1']) # Here, we are declaring the variable dframe2 with the parameters data and the indexes # Here, we are printing the first data frame i.e., dframe1 print (dframe1, '
') # Here, we are printing the first data frame i.e., dframe2 print (dframe2) Вихід:
x y first 1.0 2.0 second NaN NaN x y1 first 1.0 NaN second NaN NaN
Пояснення:
Бібліотека pandas використовується для створення двох безпомилкових DataFrame, що означаються як dframe1 і dframe2, починаючи з короткого списку посилань на слова з іменами інформації. Ці посилання на слова діють як зображення окремих рядків усередині DataFrames, де ключі стосуються назв сегментів, а пов’язані якості стосуються відповідної інформації. Базовий DataFrame, dframe1, запускається з явними рядковими файлами («перший» і «другий») і записами розділу («x» і «y»). Таким чином, другий DataFrame, dframe2, створюється з використанням подібної колекції інформації, але з невідповідністю у файлах розділів, явно позначених як «x» і «y1». Код завершується друком обох DataFrame до центру керування, уточнюючи конкретні конструкції розділів кожного DataFrame. Цей код є розширеним описом створення та керування DataFrame у бібліотеці pandas, пропонуючи досвід виконання різних записів розділів.
Приклад - 3
# The example is to create # Pandas DataFrame by passing lists of # Dictionaries and row indices. import pandas as pd # Here, we are importing the pandas library as pd # assign values to lists data = [{'x': 2, 'z':3}, {'x': 10, 'y': 20, 'z': 30}] # Creates padas DataFrame by passing # Lists of dictionaries and row index. dframe = pd.DataFrame(data, index =['first', 'second']) # Print the dataframe print(dframe) Вихід:
x y z first 2 NaN 3 second 10 20.0 30
Пояснення:
У цьому коді Python Pandas DataFrame розроблено з використанням бібліотеки pandas, надаючи розташування посилань на слова та визначаючи записи стовпців. Цикл починається з імпорту бібліотеки pandas, якій для стислості присвоєно помилкове ім’я «pd». Таким чином, характеризується перелік посилань на слова, названий інформацією, де кожне посилання на слово адресує рядок DataFrame. Ключі в цих посиланнях на слова означають назви сегментів, а відповідні значення вказують на важливу інформацію.
Потім DataFrame, позначений як dframe, створюється за допомогою конструктора pd.DataFrame(), об’єднуючи надану інформацію та чітко встановлюючи рядкові записи на «перший» і «другий». Подальший DataFrame відображає рівний дизайн із розділами під назвами «x», «y» і «z». Будь-які відсутні якості позначаються як 'NaN'.
Спосіб - 6: Створення Dataframe за допомогою функції zip().
Функція zip() використовується для об’єднання двох списків. Давайте розберемося в наступному прикладі.
приклад -
# The example is to create # pandas dataframe from lists using zip. import pandas as pd # Here, we are importing the pandas library as pd # List1 Name = ['tom', 'krish', 'arun', 'juli'] # List2 Marks = [95, 63, 54, 47] # two lists. # and merge them by using zip(). list_tuples = list(zip(Name, Marks)) # Assign data to tuples. print(list_tuples) # Converting lists of tuples into # pandas Dataframe. dframe = pd.DataFrame(list_tuples, columns=['Name', 'Marks']) # Print data. print(dframe)
Вихід:
[('john', 95), ('krish', 63), ('arun', 54), ('juli', 47)] Name Marks 0 john 95 1 krish 63 2 arun 54 3 juli 47
Пояснення:
Цей код Python показує створення Pandas DataFrame із двох записів, зокрема «Name» і «Stamps», за допомогою бібліотеки pandas і можливості стиснення. Після імпорту бібліотеки pandas описуються записи «Назва» та «Перевірки», що стосуються ідеальних розділів DataFrame. Можливість zip використовується для об’єднання компонентів порівняння з цих зведень у кортежі, створюючи інший зріз під назвою list_tuples.
У цей момент код друкує виклад кортежів, щоб дати короткий огляд об’єднаної інформації. Отже, Pandas DataFrame під назвою dframe створюється з використанням конструктора pd.DataFrame(), де список кортежів змінюється на організовану парну конфігурацію. Сегменти «Назва» та «Пампи» однозначно розподіляються під час цього процесу створення DataFrame.
Спосіб - 7: Створіть фрейм даних із серії Dicts
Словник можна передати для створення фрейму даних. Ми можемо використовувати Dicts серій, де наступний індекс є об’єднанням усіх серій переданого значення індексу. Давайте розберемося в наступному прикладі.
приклад -
# Pandas Dataframe from Dicts of series. import pandas as pd # Here, we are importing the pandas library as pd # Initialize data to Dicts of series. d = {'Electronics' : pd.Series([97, 56, 87, 45], index =['John', 'Abhinay', 'Peter', 'Andrew']), 'Civil' : pd.Series([97, 88, 44, 96], index =['John', 'Abhinay', 'Peter', 'Andrew'])} # creates Dataframe. dframe = pd.DataFrame(d) # print the data. print(dframe) Вихід:
Electronics Civil John 97 97 Abhinay 56 88 Peter 87 44 Andrew 45 96
Пояснення:
У цьому коді Python Pandas DataFrame створюється з посилань на слова серії з використанням бібліотеки pandas. Два предмети, «Гаджети» та «Загальні», розглядаються як розділи, а окремі оцінки з явними файлами координуються у DataFrame під назвою dframe. Наступна звичайна конструкція друкується в центрі керування, демонструючи компактну техніку для координації та дослідження позначеної інформації за допомогою Pandas.
У цьому посібнику ми обговорили різні способи створення DataFrames.