Come eseguire un test T in Excel

Sommario:

Come eseguire un test T in Excel
Come eseguire un test T in Excel
Anonim

Un test T è un modo per decidere se ci sono differenze statisticamente significative tra i set di dati, utilizzando la distribuzione t di Student. Il T-Test in Excel è un T-test a due campioni che confronta le medie di due campioni. Questo articolo spiega cosa significa significatività statistica e mostra come eseguire un T-Test in Excel.

Le istruzioni in questo articolo si applicano a Excel 2019, 2016, 2013, 2010, 2007; Excel per Microsoft 365 ed Excel Online.

Image
Image

Che cos'è il significato statistico?

Immagina di voler sapere quale dei due dadi darà un punteggio migliore. Tiri il primo dado e ottieni un 2; tiri il secondo dado e ottieni un 6. Questo ti dice che il secondo dado di solito dà punteggi più alti? Se hai risposto "Certo che no", allora hai già una certa comprensione della significatività statistica. Capisci che la differenza era dovuta al cambiamento casuale del punteggio, ogni volta che viene lanciato un dado. Poiché il campione era molto piccolo (solo un rotolo) non ha mostrato nulla di significativo.

Ora immagina di tirare ogni dado 6 volte:

  • Il primo dado tira 3, 6, 6, 4, 3, 3; Media=4,17
  • Il secondo dado tira 5, 6, 2, 5, 2, 4; Media=4,00

Questo ora dimostra che il primo dado dà punteggi più alti del secondo? Probabilmente no. Un piccolo campione con una differenza relativamente piccola tra le medie rende probabile che la differenza sia ancora dovuta a variazioni casuali. Man mano che aumentiamo il numero di lanci di dadi, diventa difficile dare una risposta di buon senso alla domanda: la differenza tra i punteggi è il risultato di una variazione casuale o è effettivamente più probabile che uno dia punteggi più alti dell' altro?

La significatività è la probabilità che una differenza osservata tra i campioni sia dovuta a variazioni casuali. Il significato è spesso chiamato livello alfa o semplicemente "α". Il livello di confidenza, o semplicemente 'c,' è la probabilità che la differenza tra i campioni non sia dovuta a variazioni casuali; in altre parole, che c'è una differenza tra le popolazioni sottostanti. Pertanto: c=1 – α

Possiamo impostare 'α' a qualsiasi livello desideriamo, per essere sicuri di aver dimostrato di essere importanti. Molto spesso viene utilizzato α=5% (95% di confidenza), ma se vogliamo essere veramente sicuri che eventuali differenze non siano causate da variazioni casuali, potremmo applicare un livello di confidenza più elevato, utilizzando α=1% o anche α=0,1 %.

Vari test statistici vengono utilizzati per calcolare la significatività in diverse situazioni. I test T vengono utilizzati per determinare se le medie di due popolazioni sono diverse e i test F vengono utilizzati per determinare se le varianze sono diverse.

Perché testare la significatività statistica?

Quando confrontiamo cose diverse, dobbiamo usare il test di significatività per determinare se una è migliore dell' altra. Questo vale per molti campi, ad esempio:

  • Negli affari, le persone hanno bisogno di confrontare diversi prodotti e metodi di marketing.
  • Negli sport, le persone hanno bisogno di confrontare diverse attrezzature, tecniche e concorrenti.
  • Nell'ingegneria, le persone devono confrontare diversi design e impostazioni dei parametri.

Se vuoi verificare se qualcosa funziona meglio di qualcos' altro, in qualsiasi campo, devi verificare la significatività statistica.

Cos'è la distribuzione T di uno studente?

La distribuzione t di Student è simile a una distribuzione normale (o gaussiana). Queste sono entrambe distribuzioni a forma di campana con la maggior parte dei risultati vicini alla media, ma alcuni eventi rari sono abbastanza lontani dalla media in entrambe le direzioni, indicati come le code della distribuzione.

La forma esatta della distribuzione t di Student dipende dalla dimensione del campione. Per campioni superiori a 30 è molto simile alla distribuzione normale. Quando la dimensione del campione si riduce, le code diventano più grandi, rappresentando la maggiore incertezza che deriva dal fare inferenze basate su un piccolo campione.

Come eseguire un T-Test in Excel

Prima di poter applicare un T-Test per determinare se c'è una differenza statisticamente significativa tra le medie di due campioni, devi prima eseguire un F-Test. Questo perché per il T-Test vengono eseguiti calcoli diversi a seconda che vi sia una differenza significativa tra le varianze.

Per eseguire questa analisi, avrai bisogno del componente aggiuntivo Analysis Toolpak abilitato.

Controllo e caricamento del componente aggiuntivo Analysis Toolpak

Per controllare e attivare Analysis Toolpak segui questi passaggi:

  1. Seleziona la scheda FILE >seleziona Opzioni.

  2. Nella finestra di dialogo Opzioni, seleziona Add-Ins dalle schede sul lato sinistro.
  3. Nella parte inferiore della finestra, seleziona il menu a discesa Gestisci, quindi seleziona Componenti aggiuntivi di Excel. Seleziona Vai.

    Image
    Image
  4. Assicurati che la casella di controllo accanto a Analysis Toolpak sia selezionata, quindi seleziona OK.
  5. L'Analysis Toolpak è ora attivo e sei pronto per applicare F-Test e T-Test.

Esecuzione di un test F e un test T in Excel

  1. Inserisci due set di dati in un foglio di calcolo. In questo caso, stiamo considerando la vendita di due prodotti durante una settimana. Viene calcolato anche il valore medio delle vendite giornaliere per ciascun prodotto, insieme alla sua deviazione standard.

    Image
    Image
  2. Seleziona la scheda Dati > Analisi dei dati

    Image
    Image
  3. Seleziona F-Test a due campioni per le varianze dall'elenco, quindi seleziona OK.

    Image
    Image

    Il test F è altamente sensibile alla non normalità. Potrebbe quindi essere più sicuro utilizzare un test Welch, ma è più difficile in Excel.

  4. Seleziona l'intervallo della variabile 1 e l'intervallo della variabile 2; impostare l'Alfa (0,05 dà il 95% di confidenza); seleziona una cella per l'angolo in alto a sinistra dell'output, considerando che questo riempirà 3 colonne e 10 righe. Seleziona OK.

    Image
    Image

    Per l'intervallo per la variabile 1, è necessario selezionare il campione con la deviazione standard (o varianza) maggiore.

  5. Visualizza i risultati del test F per determinare se c'è una differenza significativa tra le varianze. I risultati danno tre valori importanti:

    • F: Il rapporto tra le varianze.
    • P(F<=f) una coda: La probabilità che la variabile 1 non abbia effettivamente una varianza maggiore della variabile 2. Se questa è maggiore di alfa, quale è generalmente 0,05, quindi non c'è alcuna differenza significativa tra le varianze.
    • F Critical one-tail: Il valore di F che sarebbe necessario per dare P(F<=f)=α. Se questo valore è maggiore di F, significa anche che non c'è alcuna differenza significativa tra le varianze.

    P(F<=f) può anche essere calcolato utilizzando la funzione DISTRIB. FD con F e i gradi di libertà per ciascun campione come input. I gradi di libertà sono semplicemente il numero di osservazioni in un campione meno uno.

  6. Ora che sai se c'è una differenza tra le varianze, puoi selezionare il T-Test appropriato. Selezionare la scheda Dati > Analisi dei dati, quindi selezionare uno o l' altro t-Test: due campioni assumendo varianze ugualio t-Test: due campioni assumendo varianze disuguali

    Image
    Image
  7. Indipendentemente dall'opzione che hai scelto nel passaggio precedente, ti verrà presentata la stessa finestra di dialogo per inserire i dettagli dell'analisi. Per iniziare, seleziona gli intervalli contenenti i campioni per Variable 1 Range e Variable 2 Range.

    Image
    Image
  8. Supponendo che tu voglia verificare l'assenza di differenze tra le medie, imposta la Differenza media ipotizzata su zero.
  9. Imposta il livello di significatività Alpha (0,05 fornisce una sicurezza del 95%) e seleziona una cella nell'angolo in alto a sinistra dell'output, considerando che questo riempirà 3 colonne e 14 righe. Seleziona OK.
  10. Rivedi i risultati per decidere se c'è una differenza significativa tra i mezzi.

    Proprio come con il test F, se il valore p, in questo caso P(T<=t), è maggiore di alfa, non ci sono differenze significative. Tuttavia, in questo caso vengono forniti due valori p, uno per un test a una coda e l' altro per un test a due code. In questo caso, utilizzare il valore a due code poiché una delle variabili con una media maggiore rappresenterebbe una differenza significativa.

Consigliato: