Как да създадете DataFrame в Python?
Рамката с данни е двуизмерна колекция от данни. Това е структура от данни, където данните се съхраняват в таблична форма. Наборите от данни са подредени в редове и колони; можем да съхраняваме множество набори от данни в рамката с данни. Можем да извършваме различни аритметични операции, като добавяне на избор на колона/ред и колони/редове в рамката с данни.
В Python, DataFrame, основен компонент на библиотеката Pandas, служи като изчерпателен двуизмерен контейнер за данни. Наподобявайки таблица, той капсулира данните с яснота, като използва редове и колони, всеки от които е надарен с отличителен индекс. Неговата гъвкавост позволява настаняване на различни типове данни в рамките на колони, осигурявайки гъвкавост при работа със сложни набори от данни.
Pandas DataFrames дава възможност на потребителите с широк набор от функционалности. От създаването на структурирани данни с помощта на речници или други структури от данни до използването на стабилно индексиране за безпроблемен достъп до данни, Pandas улеснява лесното манипулиране на данни. Библиотеката предоставя интуитивен интерфейс за изпълнение на операции като филтриране на редове въз основа на условия, групиране на данни за агрегиране и извършване на статистически анализи с лекота.
Можем да импортираме DataFrames от външното хранилище; тези хранилища могат да бъдат посочени като SQL База данни, CSV файл и Excel файл. Можем също да използваме списъците, речника и от списък с речник и т.н.
В този урок ще се научим да създаваме рамка с данни по много начини. Нека разберем тези различни начини.
Първо, трябва да инсталираме библиотеката на pandas в Python заобикаляща среда.
Празна рамка от данни
Можем да създадем основен празен Dataframe. Конструкторът на dataframe трябва да бъде извикан, за да създаде DataFrame. Нека разберем следния пример.
пример -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are Calling DataFrame constructor df = pd.DataFrame() print(df) # here, we are printing the dataframe
Изход:
Empty DataFrame Columns: [] Index: []
Метод - 2: Създайте рамка с данни с помощта на List
Можем да създадем рамка с данни, използвайки единичен списък или списък от списъци. Нека разберем следния пример.
пример -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are declaring the string values in the list lst = ['Java', 'Python', 'C', 'C++', 'JavaScript', 'Swift', 'Go'] # Here, we are calling DataFrame constructor on list dframe = pd.DataFrame(lst) print(dframe) # here, we are printing the dataframe
Изход:
0 Java 1 Python 2 C 3 C++ 4 JavaScript 5 Swift 6 Go
Обяснение:
- Импортиране на панди: импортиране на панди като pd импортира библиотеката Pandas и я нарича като pd за краткост.
- Създаване на списък: lst е списък, съдържащ низови стойности, адресиращи програмни диалекти.
- Разработка на DataFrame: pd.DataFrame(lst) изгражда DataFrame от списъка lst. Разбира се, когато е даден самотен списък, Pandas прави DataFrame с отделен раздел.
- Отпечатване на DataFrame: print(dframe) отпечатва последващия DataFrame.
Метод - 3: Създайте Dataframe от dict на ndarray/lists
Диктът на ndarray/lists може да се използва за създаване на рамка с данни, всички ndarray трябва да са с еднаква дължина. Индексът ще бъде диапазон (n) по подразбиране; където n означава дължината на масива. Нека разберем следния пример.
пример -
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the data of lists. data = {'Name': ['Tom', 'Joseph', 'Krish', 'John'], 'Age': [20, 21, 19, 18]} # Here, we are creating the DataFrame df = pd.DataFrame(data) # here, we are printing the dataframe # Here, we are printing the output. print(df) # here, we are printing the dataframe Изход:
Name Age 0 Tom 20 1 Joseph 21 2 Krish 19 3 John 18
Обяснение:
- Импортиране на панди: импортиране на панди като pd импортира библиотеката на Pandas и я нарича като pd.
- Създаване на речник: информацията е препратка към дума, където ключовете са имена на сегменти („Име“ и „Възраст“), а стойностите са записи, съдържащи свързана информация.
- Разработка на DataFrame: pd.DataFrame(data) изгражда DataFrame от препратката към думата. Ключовете се превръщат в имена на раздели, а изчерпанията стават сегменти.
- Отпечатване на DataFrame: print(df) отпечатва последващата DataFrame.
Метод - 4: Създаване на рамка с данни за индекси с помощта на масиви
Нека разберем следния пример за създаване на рамка с данни на индекси с помощта на масиви.
пример -
# Here, we are implementing the DataFrame using arrays. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the data of lists. data = {'Name':['Renault', 'Duster', 'Maruti', 'Honda City'], 'Ratings':[9.0, 8.0, 5.0, 3.0]} # Here, we are creating the pandas DataFrame. df = pd.DataFrame(data, index =['position1', 'position2', 'position3', 'position4']) # Here, we are printing the data print(df) Изход:
Name Ratings position1 Renault 9.0 position2 Duster 8.0 position3 Maruti 5.0 position4 Honda City 3.0
Обяснение:
- Импортиране на панди: импортиране на панди като pd импортира библиотеката на Pandas и я нарича като pd.
- Създаване на речник: информацията е препратка към дума, където ключовете са имена на сегменти („Име“ и „Оценки“), а стойностите са записи, съдържащи свързана информация.
- Разработване на DataFrame: pd.DataFrame(data, index=['position1', 'position2', 'position3', 'position4']) изгражда DataFrame от препратката към думата. Предварително зададеният списък е разпределен за линиите.
- Отпечатване на DataFrame: print(df) отпечатва последващата DataFrame.
Метод - 5: Създайте Dataframe от списък с dicts
Можем да предадем списъците с речници като входни данни, за да създадем рамката с данни на Pandas. Имената на колоните се приемат като ключове по подразбиране. Нека разберем следния пример.
пример -
# Here, we are implementing an example to create # Pandas DataFrame by using the lists of dicts. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the values to lists. data = [{'A': 10, 'B': 20, 'C':30}, {'x':100, 'y': 200, 'z': 300}] # Here, we are creating the DataFrame. df = pd.DataFrame(data) # Here, we are printing the data of the dataframe print(df) Изход:
A B C x y z 0 10.0 20.0 30.0 NaN NaN NaN 1 NaN NaN NaN 100.0 200.0 300.0
Нека разберем друг пример за създаване на рамката от данни на pandas от списък с речници както с индекс на ред, така и с индекс на колона.
Обяснение:
- Импортиране на панди: импортиране на панди като pd импортира библиотеката на Pandas и я нарича като pd.
- Създаване на списък и речник: информацията е обобщение, където всеки компонент е препратка към дума, адресираща колона в DataFrame. Ключовете на препратките към думите стават имена на сегменти.
- Разработване на DataFrame: pd.DataFrame(data) изгражда DataFrame от списъка с препратки към думи. Ключовете на препратките към думите стават раздели, а качествата стават информацията в DataFrame.
- Отпечатване на DataFrame: print(df) отпечатва последващата DataFrame.
Пример - 2:
# Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the values to the lists. data = [{'x': 1, 'y': 2}, {'A': 15, 'B': 17, 'C': 19}] # Here, we are declaring the two column indices, values same as the dictionary keys dframe1 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y']) # Here, we are declaring the variable dframe1 with the parameters data and the indexes # Here, we are declaring the two column indices with # one index with other name dframe2 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y1']) # Here, we are declaring the variable dframe2 with the parameters data and the indexes # Here, we are printing the first data frame i.e., dframe1 print (dframe1, '
') # Here, we are printing the first data frame i.e., dframe2 print (dframe2) Изход:
x y first 1.0 2.0 second NaN NaN x y1 first 1.0 NaN second NaN NaN
Обяснение:
Библиотеката pandas се използва за създаване на две безпогрешни DataFrames, означавани като dframe1 и dframe2, като се започне от набор от препратки към думи, наречена информация. Тези препратки към думи действат като изобразяване на отделни редове вътре в DataFrames, където ключовете се отнасят до имената на сегменти и свързаните качества адресират съответната информация. Основният DataFrame, dframe1, се стартира с изрични редови файлове („първи“ и „втори“) и записи на секции („x“ и „y“). По този начин се създава втора DataFrame, dframe2, като се използва подобна колекция от информация, но с несъответствие във файловете на секциите, изрично обозначени като „x“ и „y1“. Кодът се затваря чрез отпечатване на двата DataFrame в контролния център, изяснявайки дизайна на конкретните секции на всеки DataFrame. Този код попълва като обширно очертание на създаването и контрола на DataFrame в библиотеката на pandas, като предлага опит за това как могат да се изпълняват разновидности в записите на секции.
Пример - 3
# The example is to create # Pandas DataFrame by passing lists of # Dictionaries and row indices. import pandas as pd # Here, we are importing the pandas library as pd # assign values to lists data = [{'x': 2, 'z':3}, {'x': 10, 'y': 20, 'z': 30}] # Creates padas DataFrame by passing # Lists of dictionaries and row index. dframe = pd.DataFrame(data, index =['first', 'second']) # Print the dataframe print(dframe) Изход:
x y z first 2 NaN 3 second 10 20.0 30
Обяснение:
В този код на Python е разработен Pandas DataFrame, като се използва библиотеката pandas, като се предоставят подредби на препратки към думи и се определят записи на колони. Цикълът започва с импортирането на библиотеката на pandas, присвоена с фалшивото име 'pd' за краткост. Следователно се характеризира набор от препратки към думи, наречени информация, където всяка препратка към дума адресира ред от DataFrame. Ключовете вътре в тези препратки към думи означават имената на сегментите, докато съответните стойности показват важната част от информацията.
DataFrame, посочен като dframe, след това се прави с помощта на конструктора pd.DataFrame(), консолидирайки дадената информация и изрично задавайки записите на редовете на „първи“ и „втори“. Следващият DataFrame показва равномерен дизайн със секции, наречени „x“, „y“ и „z“. Всички липсващи качества се обозначават като „NaN“.
Метод - 6: Създайте Dataframe с помощта на функцията zip().
Функцията zip() се използва за обединяване на двата списъка. Нека разберем следния пример.
пример -
# The example is to create # pandas dataframe from lists using zip. import pandas as pd # Here, we are importing the pandas library as pd # List1 Name = ['tom', 'krish', 'arun', 'juli'] # List2 Marks = [95, 63, 54, 47] # two lists. # and merge them by using zip(). list_tuples = list(zip(Name, Marks)) # Assign data to tuples. print(list_tuples) # Converting lists of tuples into # pandas Dataframe. dframe = pd.DataFrame(list_tuples, columns=['Name', 'Marks']) # Print data. print(dframe)
Изход:
[('john', 95), ('krish', 63), ('arun', 54), ('juli', 47)] Name Marks 0 john 95 1 krish 63 2 arun 54 3 juli 47
Обяснение:
Този код на Python показва създаването на Pandas DataFrame от два записа, по-специално „Име“ и „Печати“, чрез използване на библиотеката на pandas и възможността за компресиране. След импортирането на библиотеката на pandas, записите „Име“ и „Проверки“ се характеризират, адресирайки идеалните секции на DataFrame. Възможността за zip се използва за обединяване на сравняващи компоненти от тези набори в кортежи, оформяйки друг набор, наречен list_tuples.
След това в този момент кодът отпечатва набора от кортежи, за да даде кратък поглед върху обединената информация. Следователно Pandas DataFrame, наречена dframe, се прави с помощта на конструктора pd.DataFrame(), където наборът от кортежи се променя в организирана равномерна конфигурация. Сегментите „Име“ и „Печати“ са недвусмислено разпределени по време на този процес на създаване на DataFrame.
Метод - 7: Създайте Dataframe от Dicts от серия
Речникът може да бъде предаден за създаване на рамка с данни. Можем да използваме Dicts of series, където последващият индекс е обединението на всички серии от предадена стойност на индекса. Нека разберем следния пример.
пример -
# Pandas Dataframe from Dicts of series. import pandas as pd # Here, we are importing the pandas library as pd # Initialize data to Dicts of series. d = {'Electronics' : pd.Series([97, 56, 87, 45], index =['John', 'Abhinay', 'Peter', 'Andrew']), 'Civil' : pd.Series([97, 88, 44, 96], index =['John', 'Abhinay', 'Peter', 'Andrew'])} # creates Dataframe. dframe = pd.DataFrame(d) # print the data. print(dframe) Изход:
Electronics Civil John 97 97 Abhinay 56 88 Peter 87 44 Andrew 45 96
Обяснение:
В този код на Python Pandas DataFrame се прави от препратки към думи на серии, използващи библиотеката pandas. Две теми, „Gadgets“ и „Common“, се разглеждат като секции, а индивидуалните резултати с изрични файлове се координират в DataFrame, наречен dframe. Последващата обикновена конструкция се отпечатва в контролния център, показвайки компактна техника за координиране и изследване на маркирана информация, използваща Pandas.
В този урок обсъдихме различните начини за създаване на DataFrames.