Alternatywne rozmieszczenie danych
Test-t dla prób niezależnych, przegląd wprowadzający - Cele, założenia
Test-t jest najbardziej powszechnie stosowaną metodą oceny różnic między średnimi w dwóch grupach. Można go na przykład użyć do sprawdzenia różnicy w teście przeprowadzanym na grupie pacjentów poddanych działaniu jakiegoś leku w stosunku do grupy otrzymujących placebo. Teoretycznie test-t może być stosowany także w małych próbkach (np. prób
kach o liczności 10, zaś niektórzy badacze twierdzą, że nawet w mniej licznych); jedynym warunkiem jest normalność rozkładu zmiennych oraz brak istotnych różnic między wariancjami (patrz także Pojęcia podstawowe). Jak zostało to wspomniane wcześniej założenie o normalności można sprawdzić przez analizę rozkładu danych (przy pomocy histogramów) lub przy pomocy testu normalności (opcja Statystyki opisowe). Założenie o równości wariancji sprawdzamy przy pomocy testu-F (włączonego do wydruku w opcji test-t) lub też przy pomocy mocniejszej opcji określonej jako test Levenea (jak również modyfikacji Browna-Forsythe tego testu). Jeżeli warunki, o których mowa nie są spełnione, wówczas alternatywą pozostaje użycie jednego z testów występujących w module Testy nieparametryczne i rozkłady.Podawany w wynikach testu-t poziom-p reprezentuje prawdopodobieństwo błędu związanego z przyjęciem hipotezy o istnieniu różnic między średnimi. Mówiąc technicznie jest to prawdopodobieństwo popełnienia błędu polegającego na odrzuceniu hipotezy o braku różnicy między średnimi w dwóch badanych kategoriach populacji generalnej (reprezentowanych przez badane grupy) w sytuacji gdy stan faktyczny w populacji jest taki, iż hipoteza ta jest prawdziwa. Niektórzy badacze uważają, że jeśli znak
różnicy średnich jest zgodny z przewidywaniami to można do testowania używać jedynie połowy (jednego ogona) rozkładu prawdopodobieństwa i dzielić podawany poziom-p (prawdopodobieństwo z dwoma ogonami) przez dwa. Niektórzy uważają to za błędne i polecają używać dwustronnego zbioru krytycznego. Dalsze szczegóły znaleźć można w piśmiennictwie cytowanym w tym podręczniku.tt_00Test-t dla prób niezależnych, przegląd wprowadzający - Rozmieszczenie danych
Aby przeprowadzić test-t dla prób niezależnych wymagana jest jedna zmienna niezależna (grupująca - np. Płeć. mężczyzna/kobieta) oraz przynajmniej jedna zmienna zależna (badana - np. wynik testu). Wartości średnie zmiennej zależnej będą porównywane w grupach selekcjonowanych pr
zez wartości zmiennej niezależnej (kody grupujące np. mężczyzna i kobieta). Następujące dane można analizować przy pomocy testu-t porównującego średnie wartość LBC (Liczba Białych Ciałek) u mężczyzn i kobiet.PŁEĆ LBC
------ ---
przypadek 1 mężczyzna 111
p
rzypadek 2 mężczyzna 110przypadek 3 mężczyzna 109
przypadek 4 kobieta 102
przypadek 5 kobieta 104
średnia LBC u mężczyzn = 110
średnia LBC u kobiet = 103
Jeżeli wybrano nie jedną lecz wiele zmiennych zależnych wtedy przeprowadzona zostanie seria testów-t (jeden dla każdej zmiennej zależnej).
Test-t dla prób niezależnych, przegląd wprowadzający - Alternatywne rozmieszczenie danych
Niekiedy dane zostały już rozmieszczone (np. w arkuszu kalkulacyjnym) w taki sposób, że każda kolumna lub zmienna w pliku reprezentuje jedną grupę:
Mężczyzna Kobieta
---- ------
przypadek 1 111 102
przypadek 2 110 104
przypadek 3 109
Zwróćmy uwagę, że opcja Test-t dla prób niezależnych z modułu Podstawowe statystyki i tabele pozwala na obliczenia testu-t dla tak rozmieszczonych danych. Warto jednakże od razu podkreślić, iż tego typu rozmieszczenie jest nietypowe i nie jest zalecane w szczególności dla dużych zbiorów danych. Większ
ość oprogramowania do analizy danych, włączając program STATISTICA, zazwyczaj zakłada, że dane rozmieszczone są w sposób pokazany wcześniej. To poprzednio pokazane rozmieszczenie pozwala na zidentyfikowanie każdego respondenta lub obiektu w pliku danych. W ten sposób, jeżeli interesuje nas wiele zmiennych zależnych, można zastosować różne metody wielozmienne oparte na (wewnątrzgrupowych) macierzach korelacji.
Test-t dla prób niezależnych, przegląd wprowadzający - Wykresy dla testów-t
W przypadku testu-t można porównania wartości średnich i miar zmienności w dwóch grupach przedstawiać graficznie przy pomocy wykresów ramkowych, które mogą być wywoływane wprost z arkusza wyników przez zwyczajne wskazanie wybranego testu-t (myszą lub klawiszami ruchu kursora). Różnego rodzaju wykresy rozkładu wartości w grupach mogą być wywoływane również bezpośrednio z dialogu test-t dla prób niezależnych. Wykresy te ułatwiają szybką ocenę i intuicyjną wizualizację siły relacji pom
iędzy zmienną grupującą i zmienną zależną.
Test-t dla prób niezależnych, przegląd wprowadzający - Porównania bardziej złożone
Często zdarza się w praktyce badawczej, że należy dokonać porównań dla więcej niż dwóch grup (np. lek 1, lek 2 oraz placebo) albo porównywać grupy utworzone na podstawie więcej niż jednej zmiennej niezależnej przy kontroli wpływu każdej z nich (np. Płeć, typ leku i wielkość dawki). W takich wypadkach należy analizę prowadzić przy pomo
cy Analizy wariancji, którą można uważać za uogólnienie testu-t. Faktycznie dla porównania dwóch grup ANOVA daje wyniki identyczne do testu-t (t**2 [df] = F[1,df]). Kiedy wszakże układ pomiarowy jest bardziej złożony ANOVA oferuje wiele udogodnień w stosunku do testu-t (nawet jeśli test-t przeprowadzamy wiele razy porównując różne komórki układu pomiarowego)