Test-t dla prób ależnych - przegląd wprowadzający (z pliku pomocy pr. Statistica)

Cele, założenia

Rozmieszczenie danych

Alternatywne rozmieszczenie danych

Wykresy dla testów-t

Bardziej złożone porównania

 

Test-t dla prób niezależnych, przegląd wprowadzający - Cele, założenia

Test-t jest najbardziej powszechnie stosowaną metodą oceny różnic między średnimi w dwóch grupach. Można go na przykład użyć do sprawdzenia różnicy w teście przeprowadzanym na grupie pacjentów poddanych działaniu jakiegoś leku w stosunku do grupy otrzymujących placebo. Teoretycznie test-t może być stosowany także w małych próbkach (np. próbkach o liczności 10, zaś niektórzy badacze twierdzą, że nawet w mniej licznych); jedynym warunkiem jest normalność rozkładu zmiennych oraz brak istotnych różnic między wariancjami (patrz także Pojęcia podstawowe). Jak zostało to wspomniane wcześniej założenie o normalności można sprawdzić przez analizę rozkładu danych (przy pomocy histogramów) lub przy pomocy testu normalności (opcja Statystyki opisowe). Założenie o równości wariancji sprawdzamy przy pomocy testu-F (włączonego do wydruku w opcji test-t) lub też przy pomocy mocniejszej opcji określonej jako test Levenea (jak również modyfikacji Browna-Forsythe tego testu). Jeżeli warunki, o których mowa nie są spełnione, wówczas alternatywą pozostaje użycie jednego z testów występujących w module Testy nieparametryczne i rozkłady.

Podawany w wynikach testu-t poziom-p reprezentuje prawdopodobieństwo błędu związanego z przyjęciem hipotezy o istnieniu różnic między średnimi. Mówiąc technicznie jest to prawdopodobieństwo popełnienia błędu polegającego na odrzuceniu hipotezy o braku różnicy między średnimi w dwóch badanych kategoriach populacji generalnej (reprezentowanych przez badane grupy) w sytuacji gdy stan faktyczny w populacji jest taki, iż hipoteza ta jest prawdziwa. Niektórzy badacze uważają, że jeśli znak różnicy średnich jest zgodny z przewidywaniami to można do testowania używać jedynie połowy (jednego ogona) rozkładu prawdopodobieństwa i dzielić podawany poziom-p (prawdopodobieństwo z dwoma ogonami) przez dwa. Niektórzy uważają to za błędne i polecają używać dwustronnego zbioru krytycznego. Dalsze szczegóły znaleźć można w piśmiennictwie cytowanym w tym podręczniku.

tt_00Test-t dla prób niezależnych, przegląd wprowadzający - Rozmieszczenie danych

Aby przeprowadzić test-t dla prób niezależnych wymagana jest jedna zmienna niezależna (grupująca - np. Płeć. mężczyzna/kobieta) oraz przynajmniej jedna zmienna zależna (badana - np. wynik testu). Wartości średnie zmiennej zależnej będą porównywane w grupach selekcjonowanych przez wartości zmiennej niezależnej (kody grupujące np. mężczyzna i kobieta). Następujące dane można analizować przy pomocy testu-t porównującego średnie wartość LBC (Liczba Białych Ciałek) u mężczyzn i kobiet.

PŁEĆ LBC

------ ---

przypadek 1 mężczyzna 111

przypadek 2 mężczyzna 110

przypadek 3 mężczyzna 109

przypadek 4 kobieta 102

przypadek 5 kobieta 104

średnia LBC u mężczyzn = 110

średnia LBC u kobiet = 103

Jeżeli wybrano nie jedną lecz wiele zmiennych zależnych wtedy przeprowadzona zostanie seria testów-t (jeden dla każdej zmiennej zależnej).

 

 

Test-t dla prób niezależnych, przegląd wprowadzający - Alternatywne rozmieszczenie danych

Niekiedy dane zostały już rozmieszczone (np. w arkuszu kalkulacyjnym) w taki sposób, że każda kolumna lub zmienna w pliku reprezentuje jedną grupę:

Mężczyzna Kobieta

---- ------

przypadek 1 111 102

przypadek 2 110 104

przypadek 3 109

Zwróćmy uwagę, że opcja Test-t dla prób niezależnych z modułu Podstawowe statystyki i tabele pozwala na obliczenia testu-t dla tak rozmieszczonych danych. Warto jednakże od razu podkreślić, iż tego typu rozmieszczenie jest nietypowe i nie jest zalecane w szczególności dla dużych zbiorów danych. Większość oprogramowania do analizy danych, włączając program STATISTICA, zazwyczaj zakłada, że dane rozmieszczone są w sposób pokazany wcześniej. To poprzednio pokazane rozmieszczenie pozwala na zidentyfikowanie każdego respondenta lub obiektu w pliku danych. W ten sposób, jeżeli interesuje nas wiele zmiennych zależnych, można zastosować różne metody wielozmienne oparte na (wewnątrzgrupowych) macierzach korelacji.

 

 

Test-t dla prób niezależnych, przegląd wprowadzający - Wykresy dla testów-t

W przypadku testu-t można porównania wartości średnich i miar zmienności w dwóch grupach przedstawiać graficznie przy pomocy wykresów ramkowych, które mogą być wywoływane wprost z arkusza wyników przez zwyczajne wskazanie wybranego testu-t (myszą lub klawiszami ruchu kursora). Różnego rodzaju wykresy rozkładu wartości w grupach mogą być wywoływane również bezpośrednio z dialogu test-t dla prób niezależnych. Wykresy te ułatwiają szybką ocenę i intuicyjną wizualizację siły relacji pomiędzy zmienną grupującą i zmienną zależną.

 

 

Test-t dla prób niezależnych, przegląd wprowadzający - Porównania bardziej złożone

Często zdarza się w praktyce badawczej, że należy dokonać porównań dla więcej niż dwóch grup (np. lek 1, lek 2 oraz placebo) albo porównywać grupy utworzone na podstawie więcej niż jednej zmiennej niezależnej przy kontroli wpływu każdej z nich (np. Płeć, typ leku i wielkość dawki). W takich wypadkach należy analizę prowadzić przy pomocy Analizy wariancji, którą można uważać za uogólnienie testu-t. Faktycznie dla porównania dwóch grup ANOVA daje wyniki identyczne do testu-t (t**2 [df] = F[1,df]). Kiedy wszakże układ pomiarowy jest bardziej złożony ANOVA oferuje wiele udogodnień w stosunku do testu-t (nawet jeśli test-t przeprowadzamy wiele razy porównując różne komórki układu pomiarowego)