Jak analyzovat statistický význam: 15 kroků

Obsah:

Jak analyzovat statistický význam: 15 kroků
Jak analyzovat statistický význam: 15 kroků

Video: Jak analyzovat statistický význam: 15 kroků

Video: Jak analyzovat statistický význam: 15 kroků
Video: 5 Steps to Statistical Analysis 2024, Listopad
Anonim

Testování hypotéz se provádí statistickou analýzou. Statistická významnost byla vypočtena pomocí hodnoty p, která udává velikost pravděpodobnosti výsledků výzkumu za předpokladu, že jsou určitá tvrzení (nulová hypotéza) pravdivá. Pokud je hodnota p menší než předem stanovená hladina významnosti (obecně 0,05), může výzkumník dojít k závěru, že nulová hypotéza není pravdivá, a přijmout alternativní hypotézu. Pomocí jednoduchého t-testu můžete vypočítat hodnotu p a určit významnost mezi dvěma různými soubory dat.

Krok

Část 1 ze 3: Nastavení experimentů

Vyhodnoťte statistický význam Krok 1
Vyhodnoťte statistický význam Krok 1

Krok 1. Stanovte hypotézu

Prvním krokem při analýze statistické významnosti je určit výzkumnou otázku, na kterou chcete odpovědět, a formulovat svou hypotézu. Hypotéza je tvrzení o vašich experimentálních datech a vysvětluje možné rozdíly ve studované populaci. Pro každý experiment musí být stanovena nulová hypotéza a alternativní hypotéza. Obecně budete porovnávat dvě skupiny, abyste zjistili, zda jsou stejné nebo odlišné.

  • Nulová hypotéza (H.0) obecně uvádí, že mezi těmito dvěma datovými soubory není žádný rozdíl. Příklad: skupina studentů, kteří četli látku před začátkem hodiny, nedostala lepší známky než skupina, která látku nečetla.
  • Alternativní hypotéza (H.A) je tvrzení, které je v rozporu s nulovou hypotézou a kterou se pokoušíte podpořit experimentálními daty. Příklad: skupina studentů, kteří četli látku před třídou, získala lepší známky než skupina, která látku nečetla.
Posoudit statistický význam Krok 2
Posoudit statistický význam Krok 2

Krok 2. Omezte úroveň významnosti a určete, jak jedinečná musí být vaše data, aby mohla být považována za významná

Úroveň významnosti (alfa) je práh používaný k určení významnosti. Pokud je hodnota p menší nebo rovna hladině významnosti, považují se data za statisticky významná.

  • Obecně platí, že hladina významnosti (alfa) je stanovena na 0,05, což znamená, že pravděpodobnost rovnosti obou skupin dat je pouze 5%.
  • Použití vyšší úrovně spolehlivosti (nižší hodnota p) znamená, že experimentální výsledky budou považovány za významnější.
  • Pokud chcete zvýšit úroveň spolehlivosti vašich dat, snižte hodnotu p více na 0,01. Nižší hodnoty p se běžně používají při výrobě při zjišťování vad produktu. Vysoká míra spolehlivosti je nezbytná k zajištění toho, aby každý vyrobený díl plnil svou funkci.
  • Pro experimenty testování hypotéz je přijatelná hladina významnosti 0,05.
Vyhodnoťte statistický význam Krok 3
Vyhodnoťte statistický význam Krok 3

Krok 3. Rozhodněte se použít jednostranný test nebo dvoustranný test

Jedním z předpokladů použitých při provádění t-testu je, že vaše data jsou normálně distribuována. Data, která jsou normálně distribuována, vytvoří zvonovou křivku, přičemž většina dat je uprostřed křivky. T-test je matematický test, který slouží ke zjištění, zda jsou vaše data mimo normální rozdělení, pod nebo nad „ocasem“křivky.

  • Pokud si nejste jisti, zda jsou vaše data pod nebo nad kontrolní skupinou, použijte oboustranný test. Tento test zkontroluje význam obou směrů.
  • Pokud znáte směr trendu vašich dat, použijte jednostranný test. Pomocí předchozího příkladu jste očekávali, že se hodnocení studenta zvýší. Proto byste měli použít jednostranný test.
Posoudit statistický význam Krok 4
Posoudit statistický význam Krok 4

Krok 4. Určete velikost vzorku testovací statistickou analýzou výkonu

Síla testovací statistiky je pravděpodobnost, že určitý statistický test může poskytnout správný výsledek s určitou velikostí vzorku. Prahová hodnota zkušebního výkonu (nebo) je 80%. Analýza síly statistického testu může být bez předběžných údajů komplikovaná, protože budete potřebovat informace o odhadovaném průměru každé sady dat a její standardní odchylce. Pomocí online kalkulačky analýzy statistických testů určete optimální velikost vzorku pro svá data.

  • Výzkumníci obecně provádějí pilotní studie jako materiál pro analýzu síly statistických testů a jako základ pro stanovení velikosti vzorku potřebné pro větší a komplexnější studie.
  • Pokud nemáte zdroje k provedení pilotní studie, odhadněte průměr na základě literatury a dalšího výzkumu, který byl proveden. Tato metoda poskytne informace k určení velikosti vzorku.

Část 2 ze 3: Výpočet směrodatné odchylky

Posoudit statistický význam Krok 5
Posoudit statistický význam Krok 5

Krok 1. Použijte vzorec standardní odchylky

Standardní odchylka (také známá jako standardní odchylka) je měřítkem distribuce vašich dat. Standardní odchylka poskytuje informace o podobnosti každého datového bodu ve vašem vzorku. Zpočátku se může rovnice standardní odchylky zdát komplikovaná, ale níže uvedené kroky vám pomohou s procesem výpočtu. Vzorec standardní odchylky je s = ((x -)2/(N - 1)).

  • s je standardní odchylka.
  • znamená, že musíte sečíst všechny ukázkové hodnoty, které jste nasbírali.
  • X představuje všechny jednotlivé hodnoty vašich datových bodů.
  • je průměr dat pro každou skupinu.
  • N je počet vašich vzorků.
Posoudit statistický význam Krok 6
Posoudit statistický význam Krok 6

Krok 2. Vypočítejte průměr vzorku v každé skupině

Chcete -li vypočítat standardní odchylku, musíte nejprve vypočítat průměr vzorku v každé sadě dat. Průměr je označen řeckým písmenem mu nebo. Chcete -li to provést, sečtěte všechny hodnoty bodových dat vzorků a vydělte počtem vašich vzorků.

  • Chcete -li například získat průměrné skóre pro skupinu studentů, kteří si před třídou přečetli látku, podívejme se na ukázková data. Pro jednoduchost použijeme 5 datových bodů: 90, 91, 85, 83 a 94.
  • Sečtěte všechny hodnoty vzorku: 90 + 91 + 85 + 83 + 94 = 443.
  • Rozdělte počtem vzorků, N = 5: 443/5 = 88, 6.
  • Průměrné skóre pro tuto skupinu bylo 88. 6.
Posoudit statistický význam Krok 7
Posoudit statistický význam Krok 7

Krok 3. Odečtěte každou bodovou hodnotu vzorku od průměrné hodnoty

Druhým krokem je dokončení součásti (x -) rovnice. Odečtěte každou bodovou hodnotu dat vzorku od předem vypočítaného průměru. Pokračujeme -li v předchozím příkladu, musíme provést pět odčítání.

  • (90- 88, 6), (91- 88, 6), (85- 88, 6), (83- 88, 6) a (94- 88, 6).
  • Získané hodnoty jsou 1, 4, 2, 4, -3, 6, -5, 6 a 5, 4.
Vyhodnoťte statistický význam Krok 8
Vyhodnoťte statistický význam Krok 8

Krok 4. Vyčíslujte každou získanou hodnotu a sečtěte všechny

Vyčíslujte každou hodnotu, kterou jste právě vypočítali. Tento krok odstraní všechna záporná čísla. Pokud je po provedení tohoto kroku nebo času po provedení všech výpočtů záporná hodnota, možná jste na tento krok zapomněli.

  • Pomocí předchozího příkladu získáme hodnoty 1, 96, 5, 76, 12, 96, 31, 36 a 29,16.
  • Sečtěte všechny hodnoty: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.
Vyhodnoťte statistický význam Krok 9
Vyhodnoťte statistický význam Krok 9

Krok 5. Vydělte počtem vzorků minus 1

Vzorec vyjadřuje N - 1 jako úpravu, protože nepočítáte celou populaci; Pro odhad odeberete pouze vzorek populace.

  • Odečíst: N - 1 = 5 - 1 = 4
  • Rozdělit: 81, 2/4 = 20, 3
Vyhodnoťte statistický význam Krok 10
Vyhodnoťte statistický význam Krok 10

Krok 6. Vypočítejte druhou odmocninu

Poté, co vydělíte počet vzorků minus jeden, vypočítejte druhou odmocninu konečné hodnoty. Toto je poslední krok k výpočtu standardní odchylky. Existuje několik statistických programů, které dokážou vypočítat standardní odchylku poté, co jste zadali nezpracovaná data.

Například standardní odchylka skóre pro skupinu studentů, kteří si přečetli látku před začátkem hodiny, je: s = √20, 3 = 4, 51

Část 3 ze 3: Určení významu

Vyhodnoťte statistický význam Krok 11
Vyhodnoťte statistický význam Krok 11

Krok 1. Vypočítejte rozptyl mezi dvěma skupinami vzorků

V předchozím příkladu jsme vypočítali pouze směrodatnou odchylku jedné skupiny. Pokud chcete porovnat dvě skupiny, měli byste mít data ze dvou skupin. Vypočítejte standardní odchylku druhé skupiny a použijte výsledky k výpočtu rozptylu mezi oběma skupinami v experimentu. Vzorec pro rozptyl je sd = ((s1/N1) + (s2/N2)).

  • sd je meziskupinový rozptyl.
  • s1 je standardní odchylka skupiny 1 a N.1 je počet vzorků ve skupině 1.
  • s2 je standardní odchylka skupiny 2 a N.2 je počet vzorků ve skupině 2.
  • Například data ze skupiny 2 (studenti, kteří nečtou látku před začátkem hodiny) mají velikost vzorku 5 se standardní odchylkou 5,81. Pak varianta:

    • sd = ((s1)2/N1) + ((s2)2/N2))
    • sd = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.
Vyhodnoťte statistický význam Krok 12
Vyhodnoťte statistický význam Krok 12

Krok 2. Vypočítejte hodnotu t-testu vašich dat

Hodnota t-testu vám umožní porovnat jednu skupinu dat s jinou skupinou dat. Hodnota t vám umožňuje provést t-test, abyste zjistili, do jaké míry je pravděpodobnost, že se obě skupiny porovnávaných dat výrazně liší. Vzorec pro hodnotu t je: t = (µ1 -2)/sd.

  • 1 je průměrem první skupiny.
  • 2 je průměrná hodnota druhé skupiny.
  • sd je rozptyl mezi těmito dvěma vzorky.
  • Použijte větší průměr jako1 takže nedostanete záporné hodnoty.
  • Průměrné skóre skupiny 2 (studenti, kteří nečtou) je například 80. Hodnota t je: t = (µ1 -2)/sd = (88, 6 – 80)/3, 29 = 2, 61.
Vyhodnoťte statistický význam Krok 13
Vyhodnoťte statistický význam Krok 13

Krok 3. Určete stupně volnosti vzorku

Při použití hodnoty t jsou stupně volnosti určeny velikostí vzorku. Přidejte počet vzorků z každé skupiny a poté odečtěte dva. Například stupně volnosti (d.f.) jsou 8, protože v první skupině je pět vzorků a ve druhé skupině pět vzorků ((5 + 5) - 2 = 8).

Posoudit statistický význam Krok 14
Posoudit statistický význam Krok 14

Krok 4. K určení významnosti použijte tabulku t

Tabulky hodnot t a stupňů volnosti lze nalézt ve standardních statistických knihách nebo online. Podívejte se na řádek zobrazující stupně volnosti, které jste vybrali pro svá data, a najděte příslušnou hodnotu p pro hodnotu t odvozenou z vašich výpočtů.

Se stupni volnosti 8 d.f. a hodnota t 2,61, hodnota p pro jednostranný test je mezi 0,01 a 0,025. Protože jsme použili hladinu významnosti menší nebo rovnou 0,05, data, která používáme, dokazují, že tyto dvě skupiny dat jsou významně odlišný. významný. S těmito daty můžeme nulovou hypotézu odmítnout a přijmout alternativní hypotézu: skupina studentů, kteří si před začátkem hodiny přečetli látku, dosáhla lepšího skóre než skupina studentů, kteří látku nečetli

Posoudit statistický význam Krok 15
Posoudit statistický význam Krok 15

Krok 5. Zvažte provedení navazující studie

Mnoho výzkumníků provádí malé pilotní studie, které jim mají pomoci pochopit, jak navrhnout větší studie. Provedení dalšího výzkumu s více měřeními zvýší vaši důvěru ve vaše závěry.

Tipy

Statistika je široká a složitá oblast. Vezměte si střední školu nebo univerzitu v odvozené statistice, která vám pomůže porozumět statistické významnosti

Doporučuje: