Ako hodnotiť štatistickú významnosť

Autor: Randy Alexander
Dátum Stvorenia: 2 Apríl 2021
Dátum Aktualizácie: 26 V Júni 2024
Anonim
Significant Figures - A Fast Review!
Video: Significant Figures - A Fast Review!

Obsah

Testovanie hypotéz sa riadi štatistickou analýzou. Štatisticky významná spoľahlivosť sa počíta pomocou p-hodnoty - čo naznačuje pravdepodobnosť pozorovaného výsledku, keď je splnená určitá propozícia (nulová hypotéza). Ak je hodnota p nižšia ako hladina významnosti (zvyčajne 0,05), experimentátor môže dospieť k záveru, že existuje dostatok dôkazov na odmietnutie nulovej hypotézy a pripustenie inverznej hypotézy. Pomocou jednoduchého t-testu môžete vypočítať hodnotu p a určiť významnosť medzi dvoma rôznymi skupinami údajov.

Kroky

1. časť z 3: Pripravte svoje experimenty

  1. Určte svoju hypotézu. Prvým krokom pri hodnotení štatistickej významnosti je identifikácia otázok na zodpovedanie a vyhlásenie vašej hypotézy. Hypotéza je vyjadrením empirických údajov a možných rozdielov v populácii. Každý experiment má nulovú hypotézu a inverznú hypotézu. Všeobecne budete porovnávať dve skupiny, aby ste zistili, či sú rovnaké alebo rozdielne.
    • Všeobecne platí, že hypotéza nie je (H0) potvrdzujú, že medzi týmito dvoma skupinami údajov nie je žiadny rozdiel. Príklad: Študenti, ktorí si prečítajú materiál pred vyučovaním, nedostanú lepšie výsledné známky.
    • Inverzná hypotéza (Ha) je v rozpore s nulovou hypotézou a je tvrdením, ktoré sa snažíte podporiť svojimi empirickými údajmi. Napríklad: Študenti, ktorí si materiál prečítajú pred vyučovaním, dostanú skutočne lepšie známky.

  2. Vyberte úroveň významnosti a určte stupeň rozdielu, ktorý sa dá v dátach považovať za zmysluplný. Úroveň dôležitosti (známa tiež ako alfa) je prahová hodnota, ktorú zvolíte na určenie významu. Ak je hodnota p menšia alebo rovná danej hladine významnosti, údaje sa považujú za štatisticky významné.
    • Spravidla sa hladina významnosti (alebo alfa) zvyčajne volí na úrovni 0,05 - čo znamená, že pravdepodobnosť pozorovania rozdielu viditeľného na dátach je náhodná, iba 5%.
    • Čím vyššia je úroveň spoľahlivosti (a teda tým nižšia je hodnota p), tým sú výsledky zmysluplnejšie.
    • Ak je potrebná väčšia spoľahlivosť, znížte hodnotu p na 0,01. Pri výrobe sa na detekciu chýb produktu často používa nízka hodnota p. Vysoký stupeň spoľahlivosti je rozhodujúci pre akceptovanie toho, že každá časť bude fungovať tak, ako má.
    • Pre väčšinu experimentov založených na hypotézach je prijateľná úroveň významnosti 0,05.

  3. Rozhodnite sa, či použijete jednostranný alebo obojstranný test. Jedným z predpokladov t-testu je, že vaše údaje sú v normálnom rozdelení. Normálne rozdelenie vytvorí zvonovú krivku s väčšinou pozorovaní v strede. T-test je matematický test, ktorý kontroluje, či vaše údaje spadajú na vonkajšiu stranu normálneho rozdelenia, zhora alebo zdola, do „hornej“ časti krivky.
    • Ak si nie ste istí, či sú údaje nad alebo pod kontrolnou skupinou, použite dvojstranný test. Umožňuje vám skontrolovať významnosť v oboch smeroch.
    • Ak viete, aký je očakávaný smer vašich údajov, použite jednostranný test. Vo vyššie uvedenom príklade očakávate, že sa skóre študenta zlepší. Preto použijete jednostranný test.

  4. Stanovte veľkosť vzorky pomocou silovej analýzy. Sila testu je schopnosť pozorovať očakávaný výsledok pri danej veľkosti vzorky. Spoločný prah pre silu (alebo β) je 80%. Silová analýza môže byť dosť zložitá bez určitých predbežných údajov, pretože potrebujete informácie o očakávanom priemere medzi skupinami a ich štandardných odchýlkach. Na určenie optimálnej veľkosti vzorky pre vaše údaje použite online analýzu sily.
    • Vedci často uskutočňujú malú premisnú štúdiu, aby informovali o silovej analýze a rozhodli o veľkosti vzorky potrebnej pre rozsiahlu a komplexnú štúdiu.
    • Ak neexistujú prostriedky na uskutočnenie komplexného predbežného výskumu, odhadnite možný priemer na základe čítania článkov a prieskumu, ktorý mohli urobiť iní jednotlivci. Môže vám poskytnúť dobrý štart pri určovaní veľkostí vzorky.
    reklama

Časť 2 z 3: Vypočítajte štandardnú odchýlku

  1. Určte vzorec pre štandardnú odchýlku. Štandardná odchýlka meria rozptyl údajov. Poskytuje informácie o identite každého údajového bodu vo vzorke. Pri prvom začiatku môžu rovnice vyzerať dosť komplikovane. Nasledujúce kroky vám však pomôžu ľahko pochopiť proces výpočtu. Vzorec je s = √∑ ((xi - u) / (N - l)).
    • s je štandardná odchýlka.
    • ∑ označuje, že budete musieť spočítať všetky zhromaždené pozorovania.
    • Xi každý predstavuje hodnotu vašich údajov.
    • µ je priemer dát pre každú skupinu.
    • N je celkový počet pozorovaní.
  2. Priemerný počet pozorovaní v každej skupine. Ak chcete vypočítať štandardnú odchýlku, musíte najskôr vypočítať priemer pozorovaní pre každú jednotlivú skupinu. Táto hodnota je symbolizovaná gréckym písmenom mu alebo µ. Ak to chcete urobiť, jednoducho pridajte pozorovania a vydelte ich celkovým počtom pozorovaní.
    • Ak napríklad chceme zistiť priemerné skóre skupiny, ktorá číta dokument pred triedou, pozrime sa na niektoré údaje. Pre jednoduchosť použijeme množinu údajov 5 bodov: 90, 91, 85, 83 a 94 (na 100-bodovej škále).
    • Sčítajte všetky pozorovania: 90 + 91 + 85 + 83 + 94 = 443.
    • Vyššie uvedený súčet vydelte počtom pozorovaní N (N = 5): 443/5 = 88,6.
    • Priemerné skóre pre túto skupinu je 88,6.
  3. Odčítajte priemer od každej pozorovanej hodnoty. Ďalší krok zahŕňa časť (xi - µ) rovnice. Od každej pozorovanej hodnoty odčítajte priemernú hodnotu. Vo vyššie uvedenom príklade máme päť odčítaní.
    • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) a (94 - 88,6).
    • Vypočítaná hodnota je 1,4; 2,4; -3,6; -5,6 a 5,4.
  4. Vyššie uvedené rozdiely zarovnajte a sčítajte. Každá nová hodnota, ktorá sa práve vypočíta, sa teraz rozdelí na druhú. Tu sa tiež odstráni záporné znamienko. Ak sa po tomto kroku alebo na konci výpočtu objaví záporné znamienko, možno ste zabudli urobiť vyššie uvedený krok.
    • V našom príklade budeme teraz pracovať s 1,96; 5,76; 12,96; 31,36 a 29,16.
    • Sčítajte tieto štvorce dohromady: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Vydeľte celkovým počtom pozorovaní mínus 1. Delenie číslom N - 1 pomáha kompenzovať výpočet, ktorý sa nevykonáva s populáciou ako celkom, ale je založený na vzorke všetkých študentov.
    • Odčítanie: N - 1 = 5 - 1 = 4
    • Rozdelenie: 81,2 / 4 = 20,3
  6. Získajte druhú odmocninu. Po vydelení počtom pozorovaní mínus 1 vezmite druhú odmocninu získanej hodnoty. Toto je posledný krok pri výpočte štandardnej odchýlky. Niektoré štatistické programy vám pomôžu vykonať tento výpočet po importe pôvodných údajov.
    • Pri vyššie uvedenom príklade je štandardná odchýlka triedy na konci semestra študentov, ktorí si prečítajú dokument pred triedou: s = √20,3 = 4,51.
    reklama

Časť 3 z 3: Stanovenie štatistickej významnosti

  1. Vypočítajte rozptyl medzi vašimi dvoma skupinami pozorovaní. Až do tohto bodu sa príklad zaoberal iba jednou skupinou pozorovaní. Na porovnanie dvoch skupín samozrejme potrebujete údaje z oboch. Vypočítajte štandardnú odchýlku druhej skupiny pozorovaní a pomocou nej vypočítajte rozptyl medzi týmito dvoma experimentálnymi skupinami. Vzorec na výpočet odchýlky je: sd = √ ((s1/ N1) + (s.)2/ N2)).
    • Sd je rozptyl medzi skupinami.
    • S1 je štandardná odchýlka skupín 1 a N1 je veľkosť skupiny 1.
    • S2 je štandardná odchýlka skupín 2 a N2 je veľkosť skupiny 2.
    • V našom príklade si povedzme, že údaje zo skupiny 2 (študenti, ktorí si pred triedou nečítali text) majú veľkosť 5 a štandardnú odchýlku 5,81. Rozptyl je:
      • Sd = √ ((s1) / N1) + ((s2) / N2))
      • Sd = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Vypočítajte t-skóre dát. T-štatistika vám umožňuje prevádzať údaje do formy porovnateľnej s ostatnými údajmi. Hodnota t tiež umožňuje vykonať t-test, test, ktorý umožňuje vypočítať pravdepodobnosť štatisticky významného rozdielu medzi týmito dvoma skupinami. Vzorec pre výpočet t-štatistiky je: t = (µ1 – µ2) / Sd.
    • µ1 je priemer prvej skupiny.
    • µ2 je priemer druhej skupiny.
    • Sd je rozptyl medzi pozorovaniami.
    • Použite väčší priemer ako µ1 aby sme nezískali negatívnu t-štatistiku.
    • Pre náš príklad predpokladajme, že pozorovaný priemer pre skupinu 2 (ktorá si neprečítala predchádzajúci článok) je 80. T-skóre je: t = (µ1 – µ2) / Sd = (88,6 – 80)/3,29 = 2,61.
  3. Určte stupeň voľnosti vzorky. Pri použití t-štatistiky sa stupne voľnosti určujú na základe veľkosti vzorky. Sčítajte počet pozorovaní pre každú skupinu a potom odčítajte dve. Vo vyššie uvedenom príklade je stupeň voľnosti (d.f.) 8, pretože v prvej skupine je 5 vzoriek a v druhej skupine 5 vzoriek ((5 + 5) - 2 = 8).
  4. Na vyhodnotenie významnosti použite tabuľku t. Tabuľky hodnôt t a stupňov voľnosti nájdete v štandardnej štatistickej knihe alebo online. Nájdite riadok, ktorý obsahuje stupne voľnosti údajov a hodnotu p zodpovedajúcu t-štatistike, ktorú máte.
    • Pri stupňoch voľnosti 8 at = 2,61 sa p-hodnota pre jednostranný test pohybuje medzi 0,01 a 0,025. Pretože zvolená hladina významnosti je menšia alebo rovná 0,05, sú naše údaje štatisticky významné. S týmito údajmi odmietame nulovú hypotézu a prijímame inverznú hypotézu: študenti, ktorí si materiál prečítajú pred vyučovaním, majú vyššie konečné skóre.
  5. Zvážte vykonanie ďalšieho výskumu. Mnoho vedcov uskutočňuje premise štúdie s niekoľkými metrikami, aby pochopili, ako navrhnúť väčšiu štúdiu. Ak budete robiť ďalší výskum s väčším počtom metrík, zvýši sa vaša dôvera vo vaše závery. reklama

Rada

  • Štatistika je veľká a zložitá oblasť. Absolvujte test štatistickej hypotézy na strednej alebo vysokej škole (alebo vyšší), aby ste pochopili štatistickú významnosť.

Výstraha

  • Táto analýza sa zameriava na t-test na kontrolu rozdielu medzi dvoma štandardnými distribučnými populáciami. V závislosti od zložitosti údajov možno budete potrebovať ďalší štatistický test.