Како направити ДатаФраме у Питхон-у?

Оквир података је дводимензионална збирка података. То је структура података у којој се подаци чувају у облику табеле. Скупови података су распоређени у редове и колоне; можемо да ускладиштимо више скупова података у оквиру података. Можемо да изводимо различите аритметичке операције, као што је додавање избора колона/редова и колона/редова у оквиру података.

У Питхон-у, ДатаФраме, кључна компонента Пандас библиотеке, служи као свеобухватан дводимензионални контејнер података. Подсећајући на табелу, он јасно обједињује податке, користећи редове и колоне, од којих је сваки опремљен карактеристичним индексом. Његова свестраност омогућава смештај различитих типова података унутар колона, пружајући флексибилност у руковању сложеним скуповима података.

Пандас ДатаФрамес омогућава корисницима широку лепезу функционалности. Од креирања структурираних података помоћу речника или других структура података до употребе робусног индексирања за беспрекоран приступ подацима, Пандас олакшава манипулацију подацима без напора. Библиотека пружа интуитиван интерфејс за извршавање операција као што је филтрирање редова на основу услова, груписање података за агрегацију и извођење статистичких анализа са лакоћом.

Можемо да увеземо ДатаФраме из спољне меморије; ова складишта се могу назвати СКЛ База података, ЦСВ датотека и Екцел датотека. Такође можемо да користимо листе, речник, и из листе речника итд.

У овом водичу ћемо научити да креирамо оквир података на више начина. Хајде да разумемо ове различите начине.

Прво, морамо да инсталирамо библиотеку панда у Питхон Животна средина.

Празан оквир података

Можемо креирати основни празан оквир података. Потребно је позвати конструктор оквира података да би се направио ДатаФраме. Хајде да разумемо следећи пример.

Пример -

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are Calling DataFrame constructor df = pd.DataFrame() print(df) # here, we are printing the dataframe  

Излаз:

 Empty DataFrame Columns: [] Index: []  

Метод - 2: Креирајте оквир података помоћу листе

Можемо креирати оквир података користећи једну листу или листу листа. Хајде да разумемо следећи пример.

Пример -

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are declaring the string values in the list lst = ['Java', 'Python', 'C', 'C++', 'JavaScript', 'Swift', 'Go'] # Here, we are calling DataFrame constructor on list dframe = pd.DataFrame(lst) print(dframe) # here, we are printing the dataframe  

Излаз:

 0 Java 1 Python 2 C 3 C++ 4 JavaScript 5 Swift 6 Go  

Објашњење:

  • Импорт Пандас: импорт пандас ас пд увози Пандас библиотеку и даје јој надимак као пд ради краткоће.
  • Креирај листу: лст је сажетак који садржи низ вредности које се односе на дијалекте програмирања.
  • Развој ДатаФраме-а: пд.ДатаФраме(лст) гради ДатаФраме из сажетог лст. Наравно, када се даје усамљени преглед, Пандас прави ДатаФраме са усамљеним одељком.
  • Штампање оквира података: принт(дфраме) штампа следећи оквир података.

Метод - 3: Креирајте Датафраме из дицт оф ндарраи/листс

Диктат ндарраи/листс се може користити за креирање оквира података, све ндарраи морају бити исте дужине. Индекс ће подразумевано бити опсег(н); где н означава дужину низа. Хајде да разумемо следећи пример.

Пример -

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the data of lists. data = {'Name': ['Tom', 'Joseph', 'Krish', 'John'], 'Age': [20, 21, 19, 18]} # Here, we are creating the DataFrame df = pd.DataFrame(data) # here, we are printing the dataframe # Here, we are printing the output. print(df) # here, we are printing the dataframe  

Излаз:

 Name Age 0 Tom 20 1 Joseph 21 2 Krish 19 3 John 18  

Објашњење:

  • Импорт Пандас: импорт пандас ас пд увози Пандас библиотеку и даје јој надимак као пд.
  • Креирајте речник: информације су референца на реч где су кључеви називи сегмената („Име“ и „Старост“), а вредности су записи који садрже повезане информације.
  • ДатаФраме развој: пд.ДатаФраме(дата) гради ДатаФраме из референце речи. Кључеви постају називи секција, а резимеи постају сегменти.
  • Штампање оквира података: принт(дф) штампа следећи оквир података.

Метод - 4: Креирајте оквир података индекса користећи низове

Хајде да разумемо следећи пример за креирање оквира података индекса користећи низове.

Пример -

 # Here, we are implementing the DataFrame using arrays. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the data of lists. data = {'Name':['Renault', 'Duster', 'Maruti', 'Honda City'], 'Ratings':[9.0, 8.0, 5.0, 3.0]} # Here, we are creating the pandas DataFrame. df = pd.DataFrame(data, index =['position1', 'position2', 'position3', 'position4']) # Here, we are printing the data print(df)  

Излаз:

 Name Ratings position1 Renault 9.0 position2 Duster 8.0 position3 Maruti 5.0 position4 Honda City 3.0  

Објашњење:

  • Импорт Пандас: импорт пандас ас пд увози Пандас библиотеку и даје јој надимак као пд.
  • Креирајте речник: информације су референца на реч где су кључеви називи сегмената ('Име' и 'Евалуације'), а вредности су записи који садрже повезане информације.
  • ДатаФраме развој: пд.ДатаФраме(дата, индек=['поситион1', 'поситион2', 'поситион3', 'поситион4']) гради ДатаФраме из референце речи. Унапред дефинисана листа је додељена линијама.
  • Штампање оквира података: принт(дф) штампа следећи оквир података.

Метод - 5: Креирајте Датафраме са листе диктата

Можемо да проследимо листе речника као улазне податке за креирање Пандас оквира података. Називи колона се подразумевано узимају као кључеви. Хајде да разумемо следећи пример.

Пример -

 # Here, we are implementing an example to create # Pandas DataFrame by using the lists of dicts. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the values to lists. data = [{'A': 10, 'B': 20, 'C':30}, {'x':100, 'y': 200, 'z': 300}] # Here, we are creating the DataFrame. df = pd.DataFrame(data) # Here, we are printing the data of the dataframe print(df)  

Излаз:

 A B C x y z 0 10.0 20.0 30.0 NaN NaN NaN 1 NaN NaN NaN 100.0 200.0 300.0  

Хајде да разумемо још један пример за креирање оквира података пандас из листе речника са индексом реда и колоне.

Објашњење:

  • Импорт Пандас: импорт пандас ас пд увози Пандас библиотеку и даје јој надимак као пд.
  • Креирајте листу и речник: информације су сажетак где је свака компонента референца на реч која адресира колону у ДатаФраме-у. Кључеви референци речи постају имена сегмената.
  • Развој ДатаФраме-а: пд.ДатаФраме(дата) гради ДатаФраме из низа референци речи. Кључеви референци речи постају секције, а квалитети информације у ДатаФраме-у.
  • Штампање оквира података: принт(дф) штампа следећи оквир података.

Пример - 2:

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the values to the lists. data = [{'x': 1, 'y': 2}, {'A': 15, 'B': 17, 'C': 19}] # Here, we are declaring the two column indices, values same as the dictionary keys dframe1 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y']) # Here, we are declaring the variable dframe1 with the parameters data and the indexes # Here, we are declaring the two column indices with # one index with other name dframe2 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y1']) # Here, we are declaring the variable dframe2 with the parameters data and the indexes # Here, we are printing the first data frame i.e., dframe1 print (dframe1, '
') # Here, we are printing the first data frame i.e., dframe2 print (dframe2)  

Излаз:

 x y first 1.0 2.0 second NaN NaN x y1 first 1.0 NaN second NaN NaN  

Објашњење:

Пандас библиотека се користи за прављење два непогрешива оквира података, која се означавају као дфраме1 и дфраме2, почевши од низа референци речи под називом информације. Ове референце речи делују као прикази појединачних линија унутар оквира података, при чему се кључеви односе на називе сегмената, а сродни квалитети се односе на релевантне информације. Основни ДатаФраме, дфраме1, покреће се са експлицитним датотекама линија ('први' и 'други') и записима секција ('к' и 'и'). Према томе, други ДатаФраме, дфраме2, креиран је коришћењем сличне колекције информација, али са диспаритетом у датотекама секција, експлицитно означеним као 'к' и 'и1'. Код се затвара штампањем оба оквира података у контролном центру, појашњавајући посебне дизајне секција сваког оквира података. Овај код се попуњава као опсежан преглед креирања и контроле ДатаФраме-а унутар библиотеке панда, нудећи искуства о томе како се варијетети у записима секција могу извршити.

Пример - 3

 # The example is to create # Pandas DataFrame by passing lists of # Dictionaries and row indices. import pandas as pd # Here, we are importing the pandas library as pd # assign values to lists data = [{'x': 2, 'z':3}, {'x': 10, 'y': 20, 'z': 30}] # Creates padas DataFrame by passing # Lists of dictionaries and row index. dframe = pd.DataFrame(data, index =['first', 'second']) # Print the dataframe print(dframe)  

Излаз:

 x y z first 2 NaN 3 second 10 20.0 30  

Објашњење:

У овом Питхон коду, Пандас ДатаФраме је развијен користећи библиотеку пандас давањем аранжмана референци на речи и одређивањем записа колона. Циклус почиње увозом пандас библиотеке, додељене лажним именом 'пд' ради краткоће. Дакле, карактерише се низ референци речи са именом информација, где свака референца речи адресира линију ДатаФраме-а. Кључеви унутар ових референци на речи значе називе сегмената, док повезане вредности указују на важне делове информација.

ДатаФраме, означен као дфраме, се затим прави коришћењем конструктора пд.ДатаФраме(), консолидујући дате информације и изричито постављајући записе линије на 'први' и 'други'. Следећи ДатаФраме приказује равномеран дизајн са одељцима под називом 'к', 'и' и 'з'. Сви недостајући квалитети су означени као 'НаН'.

Метод - 6: Креирајте оквир података користећи зип() функцију

Функција зип() се користи за спајање две листе. Хајде да разумемо следећи пример.

Пример -

 # The example is to create # pandas dataframe from lists using zip. import pandas as pd # Here, we are importing the pandas library as pd # List1 Name = ['tom', 'krish', 'arun', 'juli'] # List2 Marks = [95, 63, 54, 47] # two lists. # and merge them by using zip(). list_tuples = list(zip(Name, Marks)) # Assign data to tuples. print(list_tuples) # Converting lists of tuples into # pandas Dataframe. dframe = pd.DataFrame(list_tuples, columns=['Name', 'Marks']) # Print data. print(dframe)  

Излаз:

 [('john', 95), ('krish', 63), ('arun', 54), ('juli', 47)] Name Marks 0 john 95 1 krish 63 2 arun 54 3 juli 47  

Објашњење:

Овај Питхон код приказује производњу Пандас ДатаФраме-а из два записа, посебно 'Наме' и 'Стампс', користећи пандас библиотеку и могућност компресије. Након увоза библиотеке панда, карактеришу се записи 'Наме' и 'Цхецкс' који се односе на идеалне делове ДатаФраме-а. Могућност зип-а се користи за спајање компонената поређења из ових низова у низове, уоквирујући други низ под називом лист_туплес.

Код тада, у том тренутку, штампа сажетак торки да би дао кратак поглед на спојене информације. Сходно томе, Пандас ДатаФраме назван дфраме се прави коришћењем конструктора пд.ДатаФраме(), при чему се низ торки мења у организовану равномерну конфигурацију. Сегменти 'Назив' и 'Печати' су недвосмислено додељени током овог процеса креирања ДатаФраме-а.

Метод - 7: Креирајте оквир података из Диктата серије

Речник се може проследити да би се креирао оквир података. Можемо да користимо Диктове серија где је следећи индекс унија свих низова прослеђених вредности индекса. Хајде да разумемо следећи пример.

Пример -

 # Pandas Dataframe from Dicts of series. import pandas as pd # Here, we are importing the pandas library as pd # Initialize data to Dicts of series. d = {'Electronics' : pd.Series([97, 56, 87, 45], index =['John', 'Abhinay', 'Peter', 'Andrew']), 'Civil' : pd.Series([97, 88, 44, 96], index =['John', 'Abhinay', 'Peter', 'Andrew'])} # creates Dataframe. dframe = pd.DataFrame(d) # print the data. print(dframe)  

Излаз:

 Electronics Civil John 97 97 Abhinay 56 88 Peter 87 44 Andrew 45 96  

Објашњење:

У овом Питхон коду, Пандас ДатаФраме је направљен од референци речи серија које користе пандас библиотеку. Два предмета, 'Гадгетс' и 'Цоммон', адресирају се као секције, а појединачни резултати са експлицитним датотекама се координирају у ДатаФраме под називом дфраме. Наредна обична конструкција се штампа у контролном центру, показујући компактну технику за координацију и истраживање означених информација помоћу Панда.

У овом водичу смо разговарали о различитим начинима за креирање оквира података.