R – Tietokehykset
R Ohjelmointikieli on avoimen lähdekoodin ohjelmointikieli, jota käytetään laajasti tilastollisena ohjelmistona ja tietojen analysointityökaluna. Datakehykset R-kielellä ovat R:n yleisiä tietoobjekteja, joita käytetään taulukkotietojen tallentamiseen.
Datakehykset voidaan tulkita myös matriiseiksi, joissa jokainen sarake a matriisi voi olla eri tietotyyppejä. R DataFrame koostuu kolmesta pääkomponentista, tiedoista, riveistä ja sarakkeista.
R Datakehysten rakenne
Kuten alla olevasta kuvasta näkyy, datakehys rakennetaan näin.
Tiedot esitetään taulukkomuodossa, mikä helpottaa käyttöä ja ymmärtämistä.
R – Tietokehykset
Luo tietokehys R-ohjelmointikielellä
Luo R-datakehys käyttämällä datakehys() funktio ja välitä sitten kukin luomistasi vektoreista argumenteina funktiolle.
R
# R program to create dataframe> # creating a data frame> friend.data <-> data.frame> (> > friend_id => c> (1:5),> > friend_name => c> (> 'Sachin'> ,> 'Sourav'> ,> > 'Dravid'> ,> 'Sehwag'> ,> > 'Dhoni'> ),> > stringsAsFactors => FALSE> )> # print the data frame> print> (friend.data)> |
Lähtö:
friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni
Hanki R-tietokehyksen rakenne
R-datakehyksen rakenne voidaan saada käyttämällä str() toiminto R:ssä.
Se voi näyttää jopa sisäkkäisten suurten luetteloiden sisäisen rakenteen. Se tarjoaa yhden rivin ulostulon R-perusobjekteille, jolloin käyttäjä tietää objektista ja sen ainesosista.
R
# R program to get the> # structure of the data frame> # creating a data frame> friend.data <-> data.frame> (> > friend_id => c> (1:5),> > friend_name => c> (> 'Sachin'> ,> 'Sourav'> ,> > 'Dravid'> ,> 'Sehwag'> ,> > 'Dhoni'> ),> > stringsAsFactors => FALSE> )> # using str()> print> (> str> (friend.data))> |
Lähtö:
'data.frame': 5 obs. of 2 variables: $ friend_id : int 1 2 3 4 5 $ friend_name: chr 'Sachin' 'Sourav' 'Dravid' 'Sehwag' ... NULL
Yhteenveto R-datakehyksen tiedoista
R-tietokehyksessä tietojen tilastollinen yhteenveto ja luonne saadaan hakemalla yhteenveto() toiminto.
Se on yleinen funktio, jota käytetään tulostiivistelmien tuottamiseen eri mallisovitusfunktioiden tuloksista. Funktio kutsuu tiettyjä menetelmiä, jotka riippuvat ensimmäisen argumentin luokasta.
R
# R program to get the> # summary of the data frame> # creating a data frame> friend.data <-> data.frame> (> > friend_id => c> (1:5),> > friend_name => c> (> 'Sachin'> ,> 'Sourav'> ,> > 'Dravid'> ,> 'Sehwag'> ,> > 'Dhoni'> ),> > stringsAsFactors => FALSE> )> # using summary()> print> (> summary> (friend.data))> |
Lähtö:
friend_id friend_name Min. :1 Length:5 1st Qu.:2 Class :character Median :3 Mode :character Mean :3 3rd Qu.:4 Max. :5
Poimi tiedot tietokehyksestä R:ssä
Tietojen purkaminen R-tietokehyksestä tarkoittaa, että pääset sen riveihin tai sarakkeisiin. R-tietokehyksestä voidaan poimia tietty sarake käyttämällä sen sarakkeen nimeä.
R
# R program to extract> # data from the data frame> # creating a data frame> friend.data <-> data.frame> (> > friend_id => c> (1:5),> > friend_name => c> (> 'Sachin'> ,> 'Sourav'> ,> > 'Dravid'> ,> 'Sehwag'> ,> > 'Dhoni'> ),> > stringsAsFactors => FALSE> )> # Extracting friend_name column> result <-> data.frame> (friend.data$friend_name)> print> (result)> |
Lähtö:
friend.data.friend_name 1 Sachin 2 Sourav 3 Dravid 4 Sehwag 5 Dhoni
Laajenna tietokehys R-kielellä
R:n tietokehystä voidaan laajentaa lisäämällä uusia sarakkeita ja rivejä jo olemassa olevaan R-tietokehykseen.
R
# R program to expand> # the data frame> # creating a data frame> friend.data <-> data.frame> (> > friend_id => c> (1:5),> > friend_name => c> (> 'Sachin'> ,> 'Sourav'> ,> > 'Dravid'> ,> 'Sehwag'> ,> > 'Dhoni'> ),> > stringsAsFactors => FALSE> )> # Expanding data frame> friend.data$location <-> c> (> 'Kolkata'> ,> 'Delhi'> ,> > 'Bangalore'> ,> 'Hyderabad'> ,> > 'Chennai'> )> resultant <- friend.data> # print the modified data frame> print> (resultant)> |
Lähtö:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai
R:ssä voidaan suorittaa erilaisia operaatioita datakehykselle, kuten käyttää rivejä ja sarakkeita, valita tietokehyksen osajoukkoa, muokata datakehyksiä, poistaa rivejä ja sarakkeita tietokehyksestä , jne.
Katso DataFrame-toiminnot R:ssä tietää kaikentyyppisistä toiminnoista, jotka voidaan suorittaa tietokehyksellä.
Käytä R-tietokehyksen kohteita
Voimme valita ja käyttää mitä tahansa elementtiä tietokehyksestä käyttämällä yksittäistä $> ,sulut [ ] or> kaksinkertaiset kiinnikkeet [[]]> päästäksesi sarakkeisiin tietokehyksestä.
R
# creating a data frame> friend.data <-> data.frame> (> > friend_id => c> (1:5),> > friend_name => c> (> 'Sachin'> ,> 'Sourav'> ,> > 'Dravid'> ,> 'Sehwag'> ,> > 'Dhoni'> ),> > stringsAsFactors => FALSE> )> # Access Items using []> friend.data[1]> # Access Items using [[]]> friend.data[[> 'friend_name'> ]]> # Access Items using $> friend.data$friend_id> |
Lähtö:
friend_id 1 1 2 2 3 3 4 4 5 5 Access Items using [[]] [1] 'Sachin' 'Sourav' 'Dravid' 'Sehwag' 'Dhoni' Access Items using $ [1] 1 2 3 4 5
Rivien ja sarakkeiden määrä
Voimme selvittää, kuinka monta riviä ja saraketta on parsantti tietokehyksessämme käyttämällä dim-funktiota.
R
# creating a data frame> friend.data <-> data.frame> (> > friend_id => c> (1:5),> > friend_name => c> (> 'Sachin'> ,> 'Sourav'> ,> > 'Dravid'> ,> 'Sehwag'> ,> > 'Dhoni'> ),> > stringsAsFactors => FALSE> )> # find out the number of rows and clumns> dim> (friend.data)> |
Lähtö:
[1] 5 2
Lisää rivejä ja sarakkeita R-tietokehykseen
Voit helposti lisätä rivejä ja sarakkeita R DataFrame -kehykseen. Lisäys auttaa laajentamaan jo olemassa olevaa DataFrame-kehystä tarvitsematta uutta.
Katsotaanpa kuinka lisätä rivejä ja sarakkeita DataFrame-kehykseen? esimerkin kanssa:
Lisää rivejä R-tietokehykseen
Voit lisätä rivejä tietokehykseen käyttämällä sisäänrakennettua toimintoa rbind().
Seuraava esimerkki havainnollistaa rbind():n toimintaa R Data Framessa.
R
# Creating a dataframe representing products in a store> Products <-> data.frame> (> > Product_ID => c> (101, 102, 103),> > Product_Name => c> (> 'T-Shirt'> ,> 'Jeans'> ,> 'Shoes'> ),> > Price => c> (15.99, 29.99, 49.99),> > Stock => c> (50, 30, 25)> )> # Print the existing dataframe> cat> (> 'Existing dataframe (Products):
'> )> print> (Products)> # Adding a new row for a new product> New_Product <-> c> (104,> 'Sunglasses'> , 39.99, 40)> Products <-> rbind> (Products, New_Product)> # Print the updated dataframe after adding the new product> cat> (> '
Updated dataframe after adding a new product:
'> )> print> (Products)> |
Lähtö:
Existing dataframe (Products): Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 Updated dataframe after adding a new product: Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 4 104 Sunglasses 39.99 40
Lisää sarakkeita R-tietokehykseen
Voit lisätä sarakkeita tietokehykseen käyttämällä sisäänrakennettua toimintoa cbind().
Seuraava esimerkki havainnollistaa cbind():n toimintaa R Data Framessa .
R
# Existing dataframe representing products in a store> Products <-> data.frame> (> > Product_ID => c> (101, 102, 103),> > Product_Name => c> (> 'T-Shirt'> ,> 'Jeans'> ,> 'Shoes'> ),> > Price => c> (15.99, 29.99, 49.99),> > Stock => c> (50, 30, 25)> )> # Print the existing dataframe> cat> (> 'Existing dataframe (Products):
'> )> print> (Products)> # Adding a new column for 'Discount' to the dataframe> Discount <-> c> (5, 10, 8)> # New column values for discount> Products <-> cbind> (Products, Discount)> # Rename the added column> colnames> (Products)[> ncol> (Products)] <-> 'Discount'> # Renaming the last column> # Print the updated dataframe after adding the new column> cat> (> '
Updated dataframe after adding a new column 'Discount':
'> )> print> (Products)> |
Lähtö:
Existing dataframe (Products): Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 Updated dataframe after adding a new column 'Discount': Product_ID Product_Name Price Stock Discount 1 101 T-Shirt 15.99 50 5 2 102 Jeans 29.99 30 10 3 103 Shoes 49.99 25 8
Poista rivit ja sarakkeet
Tietokehys R:ssä poistaa sarakkeet ja rivit jo olemassa olevasta R-datakehyksestä.
Poista rivi R DataFramesta
R
library> (dplyr)> # Create a data frame> data <-> data.frame> (> > friend_id => c> (1, 2, 3, 4, 5),> > friend_name => c> (> 'Sachin'> ,> 'Sourav'> ,> 'Dravid'> ,> 'Sehwag'> ,> 'Dhoni'> ),> > location => c> (> 'Kolkata'> ,> 'Delhi'> ,> 'Bangalore'> ,> 'Hyderabad'> ,> 'Chennai'> )> )> data> # Remove a row with friend_id = 3> data <-> subset> (data, friend_id != 3)> data> |
Lähtö:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai # Remove a row with friend_id = 3 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai
Yllä olevassa koodissa loimme ensin tietokehyksen nimeltä tiedot kolmella sarakkeella: ystävän_tunnus , ystävän_nimi , ja sijainti . Poistaaksesi rivin kanssa ystävän_tunnus yhtä kuin 3, käytimme osajoukko() toiminto ja määrittänyt ehdon ystävän_tunnus!= 3 . Tämä poisti rivin kanssa ystävän_tunnus yhtä kuin 3.
Poista sarake R DataFramesta
R
library> (dplyr)> # Create a data frame> data <-> data.frame> (> > friend_id => c> (1, 2, 3, 4, 5),> > friend_name => c> (> 'Sachin'> ,> 'Sourav'> ,> 'Dravid'> ,> 'Sehwag'> ,> 'Dhoni'> ),> > location => c> (> 'Kolkata'> ,> 'Delhi'> ,> 'Bangalore'> ,> 'Hyderabad'> ,> 'Chennai'> )> )> data> # Remove the 'location' column> data <-> select> (data, -location)> data> |
Lähtö:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>Poista 'sijainti' -sarake ystävän_tunnus ystävän_nimi 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni
Poistaaksesi sijainti sarakkeessa käytimme valitse() toiminto ja määritetty -sijainti . The – merkki osoittaa, että haluamme poistaa sijainti sarakkeessa. Tuloksena oleva datakehys tiedot siinä on vain kaksi saraketta: ystävän_tunnus ja ystävän_nimi .
Datakehysten yhdistäminen R:ssä
On olemassa kaksi tapaa yhdistää datakehykset R:ssä. Voit yhdistää ne joko pysty- tai vaakasuunnassa.
Katsotaanpa kumpaakin tapausta esimerkin avulla:
Yhdistä R-tietokehys pystysuunnassa
Jos haluat yhdistää 2 datakehystä pystysuunnassa, voit käyttää rbind()-funktio. Tämä toiminto toimii kahden tai useamman datakehyksen yhdistämisessä.
R
# Creating two sample dataframes> df1 <-> data.frame> (> > Name => c> (> 'Alice'> ,> 'Bob'> ),> > Age => c> (25, 30),> > Score => c> (80, 75)> )> df2 <-> data.frame> (> > Name => c> (> 'Charlie'> ,> 'David'> ),> > Age => c> (28, 35),> > Score => c> (90, 85)> )> # Print the existing dataframes> cat> (> 'Dataframe 1:
'> )> print> (df1)> cat> (> '
Dataframe 2:
'> )> print> (df2)> # Combining the dataframes using rbind()> combined_df <-> rbind> (df1, df2)> # Print the combined dataframe> cat> (> '
Combined Dataframe:
'> )> print> (combined_df)> |
Lähtö:
Dataframe 1: Name Age Score 1 Alice 25 80 2 Bob 30 75 Dataframe 2: Name Age Score 1 Charlie 28 90 2 David 35 85 Combined Dataframe: Name Age Score 1 Alice 25 80 2 Bob 30 75 3 Charlie 28 90 4 David 35 85
Yhdistä R-tietokehys vaakasuunnassa:
Jos haluat yhdistää 2 datakehystä vaakasuunnassa, voit käyttää cbind()-funktio. Tämä toiminto toimii kahden tai useamman datakehyksen yhdistämisessä.
R
# Creating two sample dataframes> df1 <-> data.frame> (> > Name => c> (> 'Alice'> ,> 'Bob'> ),> > Age => c> (25, 30),> > Score => c> (80, 75)> )> df2 <-> data.frame> (> > Height => c> (160, 175),> > Weight => c> (55, 70)> )> # Print the existing dataframes> cat> (> 'Dataframe 1:
'> )> print> (df1)> cat> (> '
Dataframe 2:
'> )> print> (df2)> # Combining the dataframes using cbind()> combined_df <-> cbind> (df1, df2)> # Print the combined dataframe> cat> (> '
Combined Dataframe:
'> )> print> (combined_df)> |
Lähtö:
Dataframe 1: Name Age Score 1 Alice 25 80 2 Bob 30 75 Dataframe 2: Height Weight 1 160 55 2 175 70 Combined Dataframe: Name Age Score Height Weight 1 Alice 25 80 160 55 2 Bob 30 75 175 70
Lue myös:
- R – Objektit
- Tietorakenteet R-ohjelmoinnissa
Tässä artikkelissa olemme käsitelleet R-tietokehykset, ja kaikki perustoiminnot, kuten luominen, käyttö, yhteenveto, lisääminen ja poistaminen. Tämän artikkelin tarkoituksena on tutustua R:n tietokehyksiin, jotta voit käyttää niitä projekteissasi.
Toivottavasti tämä auttaa sinua ymmärtämään tietokehysten käsitteen R:ssä ja voit helposti ottaa R-tietokehyksen käyttöön projekteissasi.