Python'da DataFrame nasıl oluşturulur?

Veri Çerçevesi, iki boyutlu bir veri koleksiyonudur. Verilerin tablo halinde saklandığı bir veri yapısıdır. Veri kümeleri satırlar ve sütunlar halinde düzenlenir; veri çerçevesinde birden fazla veri kümesi saklayabiliriz. Veri çerçevesine sütun/satır seçimi ve sütun/satır ekleme gibi çeşitli aritmetik işlemleri gerçekleştirebiliriz.

Pandas kütüphanesinin önemli bir bileşeni olan DataFrame, Python'da kapsamlı bir iki boyutlu veri taşıyıcısı görevi görür. Bir tabloyu andıran bu tablo, her biri kendine özgü bir indeksle donatılmış satır ve sütunları kullanarak verileri net bir şekilde kapsüller. Çok yönlülüğü, çeşitli veri türlerinin sütunlar içinde barındırılmasına olanak tanıyarak karmaşık veri kümelerinin işlenmesinde esneklik sağlar.

Pandas DataFrames, kullanıcılara geniş bir işlevsellik yelpazesi sunar. Pandalar, sözlükler veya diğer veri yapıları kullanılarak yapılandırılmış verilerin oluşturulmasından kesintisiz veri erişimi için sağlam indekslemenin kullanılmasına kadar, zahmetsiz veri manipülasyonunu kolaylaştırır. Kitaplık, koşullara göre satırları filtrelemek, verileri toplama için gruplamak ve istatistiksel analizleri kolaylıkla gerçekleştirmek gibi işlemleri yürütmek için sezgisel bir arayüz sağlar.

DataFrame'leri harici depolamadan içe aktarabiliriz; bu depolara şu adlar verilebilir: SQL Veritabanı, CSV dosyası ve bir Excel dosyası. Ayrıca listeleri, sözlüğü ve bir sözlük listesinden vb. de kullanabiliriz.

Bu derste veri çerçevesini birden çok yolla oluşturmayı öğreneceğiz. Bu farklı yolları anlayalım.

Öncelikle pandas kütüphanesini kurmamız gerekiyor. Python çevre.

Boş bir veri çerçevesi

Basit bir boş Dataframe oluşturabiliriz. DataFrame'i oluşturmak için veri çerçevesi yapıcısının çağrılması gerekir. Aşağıdaki örneği anlayalım.

Örnek -

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are Calling DataFrame constructor df = pd.DataFrame() print(df) # here, we are printing the dataframe  

Çıktı:

 Empty DataFrame Columns: [] Index: []  

Yöntem - 2: Listeyi kullanarak bir veri çerçevesi oluşturun

Tek bir liste veya listeler listesini kullanarak veri çerçevesi oluşturabiliriz. Aşağıdaki örneği anlayalım.

Örnek -

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are declaring the string values in the list lst = ['Java', 'Python', 'C', 'C++', 'JavaScript', 'Swift', 'Go'] # Here, we are calling DataFrame constructor on list dframe = pd.DataFrame(lst) print(dframe) # here, we are printing the dataframe  

Çıktı:

 0 Java 1 Python 2 C 3 C++ 4 JavaScript 5 Swift 6 Go  

Açıklama:

  • Pandaları İçe Aktar: pandaları pd olarak içe aktar, Pandalar kitaplığını içe aktarır ve kısalık için onu pd olarak adlandırır.
  • Liste Oluştur: lst, programlama lehçelerine yönelik dize değerlerini içeren bir özettir.
  • DataFrame Geliştirme: pd.DataFrame(lst), listeden bir DataFrame oluşturur. Elbette tek bir özet verildiğinde Pandas tek bölümlü bir DataFrame oluşturur.
  • DataFrame'i Yazdırma: print(dframe) sonraki DataFrame'i yazdırır.

Yöntem - 3: ndarray/listelerin diktesinden Veri Çerçevesi oluşturun

ndarray/lists diktesi bir veri çerçevesi oluşturmak için kullanılabilir. ndarray aynı uzunlukta olmalıdır. Dizin varsayılan olarak bir aralık(n) olacaktır; burada n dizi uzunluğunu belirtir. Aşağıdaki örneği anlayalım.

Örnek -

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the data of lists. data = {'Name': ['Tom', 'Joseph', 'Krish', 'John'], 'Age': [20, 21, 19, 18]} # Here, we are creating the DataFrame df = pd.DataFrame(data) # here, we are printing the dataframe # Here, we are printing the output. print(df) # here, we are printing the dataframe  

Çıktı:

 Name Age 0 Tom 20 1 Joseph 21 2 Krish 19 3 John 18  

Açıklama:

  • Pandaları İçe Aktar: Pandaları pd olarak içe aktar, Pandalar kitaplığını içe aktarır ve onu pd olarak adlandırır.
  • Sözlük Oluştur: bilgi, anahtarların segment adları ('Ad' ve 'Yaş') ve değerlerin ilgili bilgileri içeren kayıtlar olduğu bir kelime referansıdır.
  • DataFrame Geliştirme: pd.DataFrame(data), word referansından bir DataFrame oluşturur. Anahtarlar bölüm adlarına, özetler ise segmentlere dönüşür.
  • DataFrame'i Yazdırma: print(df) sonraki DataFrame'i yazdırır.

Yöntem - 4: Dizileri kullanarak dizin Veri Çerçevesi oluşturma

Dizileri kullanarak indeks veri çerçevesini oluşturmak için aşağıdaki örneği anlayalım.

Örnek -

 # Here, we are implementing the DataFrame using arrays. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the data of lists. data = {'Name':['Renault', 'Duster', 'Maruti', 'Honda City'], 'Ratings':[9.0, 8.0, 5.0, 3.0]} # Here, we are creating the pandas DataFrame. df = pd.DataFrame(data, index =['position1', 'position2', 'position3', 'position4']) # Here, we are printing the data print(df)  

Çıktı:

 Name Ratings position1 Renault 9.0 position2 Duster 8.0 position3 Maruti 5.0 position4 Honda City 3.0  

Açıklama:

  • Pandaları İçe Aktar: Pandaları pd olarak içe aktar, Pandalar kitaplığını içe aktarır ve onu pd olarak adlandırır.
  • Sözlük Oluştur: bilgi, anahtarların segment adları ('Ad' ve 'Değerlendirmeler') olduğu ve değerlerin ilgili bilgileri içeren kayıtlar olduğu bir kelime referansıdır.
  • DataFrame Geliştirme: pd.DataFrame(data, index=['position1', 'position2', 'position3', 'position4']), word referansından bir DataFrame oluşturur. Önceden tanımlanmış liste satırlara tahsis edilmiştir.
  • DataFrame'i Yazdırma: print(df) sonraki DataFrame'i yazdırır.

Yöntem - 5: Sözlük listesinden Dataframe oluşturun

Pandas veri çerçevesini oluşturmak için sözlük listelerini giriş verileri olarak aktarabiliriz. Sütun adları varsayılan olarak anahtar olarak alınır. Aşağıdaki örneği anlayalım.

Örnek -

 # Here, we are implementing an example to create # Pandas DataFrame by using the lists of dicts. import pandas as pd # Here, we are importing the pandas library as pd # Here, we are assigning the values to lists. data = [{'A': 10, 'B': 20, 'C':30}, {'x':100, 'y': 200, 'z': 300}] # Here, we are creating the DataFrame. df = pd.DataFrame(data) # Here, we are printing the data of the dataframe print(df)  

Çıktı:

 A B C x y z 0 10.0 20.0 30.0 NaN NaN NaN 1 NaN NaN NaN 100.0 200.0 300.0  

Hem satır indeksi hem de sütun indeksi içeren sözlükler listesinden pandalar veri çerçevesini oluşturmak için başka bir örneği anlayalım.

Açıklama:

  • Pandaları İçe Aktar: Pandaları pd olarak içe aktar, Pandalar kitaplığını içe aktarır ve onu pd olarak adlandırır.
  • Liste ve Sözlük Oluşturun: bilgi, her bileşenin DataFrame'deki bir sütuna hitap eden bir kelime referansı olduğu bir özettir. Kelime referanslarının anahtarları segment adlarına dönüşür.
  • DataFrame Geliştirme: pd.DataFrame(data), kelime referanslarının özetinden bir DataFrame oluşturur. Kelime referanslarının anahtarları bölümler haline gelir ve nitelikler DataFrame'deki bilgiler haline gelir.
  • DataFrame'i Yazdırma: print(df) sonraki DataFrame'i yazdırır.

Örnek - 2:

 # Here, we are importing the pandas library as pd import pandas as pd # Here, we are assigning the values to the lists. data = [{'x': 1, 'y': 2}, {'A': 15, 'B': 17, 'C': 19}] # Here, we are declaring the two column indices, values same as the dictionary keys dframe1 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y']) # Here, we are declaring the variable dframe1 with the parameters data and the indexes # Here, we are declaring the two column indices with # one index with other name dframe2 = pd.DataFrame(data, index =['first', 'second'], columns =['x', 'y1']) # Here, we are declaring the variable dframe2 with the parameters data and the indexes # Here, we are printing the first data frame i.e., dframe1 print (dframe1, '
') # Here, we are printing the first data frame i.e., dframe2 print (dframe2)  

Çıktı:

 x y first 1.0 2.0 second NaN NaN x y1 first 1.0 NaN second NaN NaN  

Açıklama:

Pandas kütüphanesi, bilgi adı verilen kelime referanslarının bir özetinden başlayarak, dframe1 ve dframe2 anlamına gelen iki belirgin DataFrame oluşturmak için kullanılır. Bu kelime referansları, DataFrame'lerin içindeki ayrı satırların tasvirleri olarak hareket eder; burada anahtarlar, segment adlarıyla ilgilidir ve ilgili nitelikler, ilgili bilgilere yöneliktir. Temel DataFrame olan dframe1, açık satır dosyalarıyla ('birinci' ve 'ikinci') ve bölüm kayıtlarıyla ('x' ve 'y') başlatılır. Bu nedenle, benzer bilgi toplama kullanılarak, ancak bölüm dosyalarında açıkça 'x' ve 'y1' olarak gösterilen bir eşitsizlikle ikinci bir DataFrame, dframe2 oluşturulur. Kod, her iki DataFrame'in kontrol merkezine yazdırılması ve her bir DataFrame'in belirli bölüm tasarımlarının açıklanmasıyla kapatılır. Bu kod, pandas kütüphanesinde DataFrame oluşturma ve kontrolünün kapsamlı bir taslağını doldurarak bölüm kayıtlarındaki çeşitlerin nasıl yürütülebileceğine dair deneyimler sunar.

Örnek - 3

 # The example is to create # Pandas DataFrame by passing lists of # Dictionaries and row indices. import pandas as pd # Here, we are importing the pandas library as pd # assign values to lists data = [{'x': 2, 'z':3}, {'x': 10, 'y': 20, 'z': 30}] # Creates padas DataFrame by passing # Lists of dictionaries and row index. dframe = pd.DataFrame(data, index =['first', 'second']) # Print the dataframe print(dframe)  

Çıktı:

 x y z first 2 NaN 3 second 10 20.0 30  

Açıklama:

Bu Python kodunda pandas kütüphanesinden yararlanılarak kelime referanslarının düzenlenmesi ve sütun kayıtlarının belirlenmesi yoluyla bir Pandas DataFrame geliştirilmiştir. Döngü, kısa olması açısından 'pd' sahte adıyla atanan pandas kütüphanesinin içe aktarılmasıyla başlar. Bu nedenle, her kelime referansının DataFrame'in bir satırına hitap ettiği, bilgi adı verilen kelime referanslarının bir listesi karakterize edilir. Bu kelime referanslarının içindeki anahtarlar segment adlarını, ilgili değerler ise önemli bilgi parçalarını belirtir.

Dframe olarak belirtilen DataFrame, daha sonra pd.DataFrame() yapıcısı kullanılarak, verilen bilgileri birleştirerek ve satır kayıtlarını açıkça 'birinci' ve 'ikinci' olarak ayarlayarak yapılır. Sonraki DataFrame, 'x', 'y' ve 'z' adlı bölümlerle eşit bir tasarım görüntüler. Eksik nitelikler 'NaN' olarak belirtilir.

Yöntem - 6: zip() işlevini kullanarak Veri Çerçevesi oluşturun

Zip() fonksiyonu iki listeyi birleştirmek için kullanılır. Aşağıdaki örneği anlayalım.

Örnek -

 # The example is to create # pandas dataframe from lists using zip. import pandas as pd # Here, we are importing the pandas library as pd # List1 Name = ['tom', 'krish', 'arun', 'juli'] # List2 Marks = [95, 63, 54, 47] # two lists. # and merge them by using zip(). list_tuples = list(zip(Name, Marks)) # Assign data to tuples. print(list_tuples) # Converting lists of tuples into # pandas Dataframe. dframe = pd.DataFrame(list_tuples, columns=['Name', 'Marks']) # Print data. print(dframe)  

Çıktı:

 [('john', 95), ('krish', 63), ('arun', 54), ('juli', 47)] Name Marks 0 john 95 1 krish 63 2 arun 54 3 juli 47  

Açıklama:

Bu Python kodu, pandas kütüphanesini ve sıkıştırma özelliğini kullanarak, özellikle 'Ad' ve 'Damgalar' olmak üzere iki kayıttan bir Pandas DataFrame'in üretimini gösterir. Pandas kütüphanesinin içe aktarılmasının ardından, DataFrame'in ideal bölümlerine hitap eden 'Ad' ve 'Kontroller' kayıtları karakterize edilir. Zip özelliği, bu özetlerdeki karşılaştırma bileşenlerini demetler halinde birleştirmek ve list_tuples adlı başka bir özetin çerçevesini oluşturmak için kullanılır.

Daha sonra kod, bu noktada, birleştirilen bilgilere kısa bir bakış sağlamak için demetlerin özetini yazdırır. Sonuç olarak, pd.DataFrame() yapıcısı kullanılarak dframe adlı bir Pandas DataFrame oluşturulur, burada demetlerin listesi düzenli bir eşit konfigürasyona dönüştürülür. 'Ad' ve 'Damgalar' segmentleri bu DataFrame oluşturma işlemi sırasında kesin olarak tahsis edilir.

Yöntem - 7: Serinin Diktlerinden Veri Çerçevesi Oluşturma

Bir veri çerçevesi oluşturmak için sözlük aktarılabilir. Sonraki endeksin, aktarılan tüm endeks değeri serilerinin birleşimi olduğu serilerin Sözlerini kullanabiliriz. Aşağıdaki örneği anlayalım.

Örnek -

 # Pandas Dataframe from Dicts of series. import pandas as pd # Here, we are importing the pandas library as pd # Initialize data to Dicts of series. d = {'Electronics' : pd.Series([97, 56, 87, 45], index =['John', 'Abhinay', 'Peter', 'Andrew']), 'Civil' : pd.Series([97, 88, 44, 96], index =['John', 'Abhinay', 'Peter', 'Andrew'])} # creates Dataframe. dframe = pd.DataFrame(d) # print the data. print(dframe)  

Çıktı:

 Electronics Civil John 97 97 Abhinay 56 88 Peter 87 44 Andrew 45 96  

Açıklama:

Bu Python kodunda, pandas kütüphanesini kullanan serilerin kelime referanslarından bir Pandas DataFrame yapılmıştır. 'Gadget'lar' ve 'Ortak' olmak üzere iki konu bölümler halinde ele alınır ve açık dosyalara sahip bireysel puanlar, dframe adlı bir DataFrame'de koordine edilir. Sonraki düz yapı kontrol merkezine yazdırılır ve Pandalar kullanılarak işaretlenmiş bilgilerin koordine edilmesi ve araştırılması için kompakt bir teknik gösterilir.

Bu eğitimde DataFrames oluşturmanın farklı yollarını tartıştık.