Test del chi quadrato in R

Test del chi quadrato in R

IL test del chi quadrato di indipendenza valuta se esiste un'associazione tra le categorie delle due variabili. Esistono fondamentalmente due tipi di variabili casuali e producono due tipi di dati: numerici e categoriali. In Linguaggio di programmazione R La statistica chi-quadrato viene utilizzata per indagare se le distribuzioni delle variabili categoriali differiscono l'una dall'altra. Il test chi quadrato è utile anche per confrontare i conteggi o i conteggi delle risposte categoriche tra due (o più) gruppi indipendenti.

Nel linguaggio di programmazione R, la funzione utilizzata per eseguire un test chi-quadrato è chisq.test()> .

Sintassi:

chisq.test(dati)

parametri:

dati : i dati sono una tabella contenente i valori di conteggio delle variabili nella tabella.

Prenderemo i dati del sondaggio in MASS> biblioteca che rappresenta i dati di un sondaggio condotto sugli studenti.

R




# load the MASS package> library> (MASS)> print> (> str> (survey))>

Produzione:

'data.frame': 237 obs. of 12 variables:  $ Sex : Factor w/ 2 levels 'Female','Male': 1 2 2 2 2 1 2 1 2 2 ...  $ Wr.Hnd: num 18.5 19.5 18 18.8 20 18 17.7 17 20 18.5 ...  $ NW.Hnd: num 18 20.5 13.3 18.9 20 17.7 17.7 17.3 19.5 18.5 ...  $ W.Hnd : Factor w/ 2 levels 'Left','Right': 2 1 2 2 2 2 2 2 2 2 ...  $ Fold : Factor w/ 3 levels 'L on R','Neither',..: 3 3 1 3 2 1 1 3 3 3 ...  $ Pulse : int 92 104 87 NA 35 64 83 74 72 90 ...  $ Clap : Factor w/ 3 levels 'Left','Neither',..: 1 1 2 2 3 3 3 3 3 3 ...  $ Exer : Factor w/ 3 levels 'Freq','None',..: 3 2 2 2 3 3 1 1 3 3 ...  $ Smoke : Factor w/ 4 levels 'Heavy','Never',..: 2 4 3 2 2 2 2 2 2 2 ...  $ Height: num 173 178 NA 160 165 ...  $ M.I : Factor w/ 2 levels 'Imperial','Metric': 2 1 NA 2 2 1 1 2 2 2 ...  $ Age : num 18.2 17.6 16.9 20.3 23.7 ... NULL 

Il risultato sopra mostra che il set di dati ha molte variabili fattore che possono essere considerate variabili categoriali. Per il nostro modello, considereremo le variabili Eser E Fumo .La colonna Fumo registra le abitudini di fumo degli studenti mentre la colonna Esercizio registra il loro livello di esercizio. Il nostro obiettivo è verificare l'ipotesi se l'abitudine al fumo degli studenti sia indipendente dal loro livello di esercizio fisico con un livello di significatività pari a 0,05.

R




# Create a data frame from the main data set.> stu_data => data.frame> (survey$Smoke,survey$Exer)> # Create a contingency table with the needed variables.> stu_data => table> (survey$Smoke,survey$Exer)> > print> (stu_data)>

Produzione:

 Freq None Some  Heavy 7 1 3  Never 87 18 84  Occas 12 3 4  Regul 9 1 7 

E infine applichiamo il chisq.test()> funzione alla tabella di contingenza stu_data.

R




# applying chisq.test() function> print> (> chisq.test> (stu_data))>

Produzione:

 Pearson's Chi-squared test  data: stu_data X-squared = 5.4885, df = 6, p-value = 0.4828 

Poiché il valore p 0,4828 è maggiore di 0,05, concludiamo che l'abitudine al fumo è indipendente dal livello di esercizio dello studente e quindi esiste una correlazione debole o assente tra le due variabili. Il codice R completo è riportato di seguito.

Quindi, in sintesi, si può dire che è molto semplice eseguire un test Chi-quadrato utilizzando R. È possibile eseguire questo compito utilizzando chisq.test()> funzione in R.

Visualizzare i dati del test Chi-Quadro

R




# Load required library> library> (MASS)> # Print structure of the survey dataset> print> (> str> (survey))> # Create a data frame for smoking and exercise columns> stu_data <-> data.frame> (survey$Smoke, survey$Exer)> stu_data <-> table> (survey$Smoke, survey$Exer)> # Print the table> print> (stu_data)> # Perform the Chi-Square Test> chi_result <-> chisq.test> (stu_data)> print> (chi_result)> # Visualize the data with a bar plot> barplot> (stu_data, beside => TRUE> , col => c> (> 'lightblue'> ,> 'lightgreen'> ),> > main => 'Smoking Habits vs Exercise Levels'> ,> > xlab => 'Exercise Level'> , ylab => 'Number of Students'> )> # Add legend separately> legend> (> 'center'> , legend => rownames> (stu_data), fill => c> (> 'lightblue'> ,> 'lightgreen'> ))>

Produzione:

gh

Test del chi quadrato in R

In questo codice usiamo il MASS> biblioteca per condurre un test Chi-Square sul set di dati del “sondaggio”, concentrandosi sulla relazione tra abitudini al fumo e livelli di esercizio fisico.

Crea una tabella di contingenza, esegue il test statistico e visualizza i dati utilizzando un grafico a barre. La legenda viene aggiunta separatamente nell'angolo in alto a sinistra, distinguendo tra diverse abitudini di fumo con colori distinti.

Il codice mira a esplorare e comunicare le associazioni tra il comportamento del fumo e le pratiche di esercizio fisico all'interno del set di dati.