Spôsoby výpočtu odchýlky

Autor: Robert Simon
Dátum Stvorenia: 21 V Júni 2021
Dátum Aktualizácie: 1 V Júli 2024
Anonim
Spôsoby výpočtu odchýlky - Tipy
Spôsoby výpočtu odchýlky - Tipy

Obsah

Rozptyl meria rozptyl súboru údajov. Je to veľmi užitočné pri zostavovaní štatistických modelov: nízka variancia môže znamenať, že namiesto podkladového vzťahu v dátach popisujete náhodnú chybu alebo šum. V tomto článku vás wikiHow naučí, ako vypočítať odchýlku.

Kroky

Metóda 1 z 2: Vypočítajte rozptyl vzorky

  1. Napíšte svoju vzorovú množinu údajov. Štatistici majú vo väčšine prípadov iba informácie o vzorke alebo podmnožine populácie, ktorú študujú. Napríklad namiesto analýzy „ceny každého automobilu v Nemecku“ by štatistik mohol zistiť cenu náhodnej vzorky niekoľkých tisíc automobilov. Štatistik môže pomocou tejto vzorky získať dobrý odhad nákladov na automobily v Nemecku. Je však pravdepodobnejšie, že sa nebude presne zhodovať so skutočnými číslami.
    • Napríklad: Pri analýze počtu predaných muffinov za deň v kaviarni ste odobrali náhodnú šesťdňovú vzorku a dosiahli ste nasledujúce výsledky: 38, 37, 36, 28, 18, 14, 12, 11, 10,7, 9,9. Toto je vzorka, nie populácia, pretože nemáte údaje o každom dni otvorenia obchodu.
    • Ak každý Dátové body v hlavnom počítači, prejdite na spôsob uvedený nižšie.

  2. Zapíšte si vzorec odchýlky vzorky. Rozptyl súboru údajov označuje stupeň rozptylu údajových bodov. Čím je rozptyl bližšie k nule, tým sú dátové body zoskupené. Pri práci so vzorovými množinami údajov používajte na výpočet rozptylu nasledujúci vzorec:
    • = /(n - 1)
    • je rozptyl. Odchýlka sa vždy počíta v štvorcoch.
    • predstavuje hodnotu vo vašom súbore údajov.
    • ∑, čo znamená „súčet“, vám hovorí, aby ste pre každú hodnotu vypočítali nasledujúce parametre a potom ich sčítali.
    • x̅ je priemer vzorky.
    • n je počet údajových bodov.

  3. Vypočítajte priemer vzorky. Symbol x̅ alebo „x-horizontálne“ sa používa na označenie priemeru vzorky. Vypočítajte ako každý priemer: spočítajte všetky údajové body a vydelte ich počtom bodov.
    • Napríklad: Najskôr spočítajte svoje dátové body: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Ďalej vydelte výsledok počtom dátových bodov, v tomto prípade šiestimi: 84 ÷ 6 = 14.
      Priemer vzorky = x̅ = 14.
    • Priemer si môžete predstaviť ako „stredový bod“ údajov. Ak sú údaje sústredené okolo priemeru, rozptyl je nízky. Ak sú rozptýlené ďaleko od priemeru, rozptyl je vysoký.

  4. Odčítajte priemer od každého údajového bodu. Teraz je čas na výpočet - x̅, kde je každý bod vo vašom súbore údajov. Každý výsledok bude označovať odchýlku od priemeru každého zodpovedajúceho bodu alebo, zjednodušene povedané, vzdialenosť od priemeru.
    • Napríklad:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • Je veľmi ľahké skontrolovať svoje výpočty, pretože výsledky sa musia sčítať s nulou. Je to preto, že priemerom sú negatívne výsledky (vzdialenosť od priemeru k malému počtu). pozitívne výsledky (vzdialenosť od priemeru k väčšiemu počtu) sú úplne eliminované.
  5. Štvorec všetky výsledky. Ako bolo uvedené vyššie, zoznam aktuálnych odchýlok (- x̅) má súčet nula. To znamená, že „priemerná odchýlka“ bude tiež vždy nulová a o rozptyle údajov nemožno nič povedať. Na vyriešenie tohto problému nájdeme štvorec každej odchýlky. Výsledkom je, že všetko sú kladné čísla, záporné hodnoty a kladné hodnoty sa už navzájom nezrušia a nedajú súčtu nulu.
    • Napríklad:
      (- X)
      - X)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Teraz máte (- x̅) pre každý údajový bod vo vzorke.
  6. Nájdite súčet štvorcových hodnôt. Teraz je čas vypočítať celý čitateľ vzorca: ∑. Veľké cyklo, ∑, vyžaduje, aby ste ku každej hodnote pridali nasledujúcu hodnotu prvku. Pre každú hodnotu vo vzorke ste vypočítali (- x̅), takže stačí iba spočítať výsledky.
    • Napríklad: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Vydeľte číslom n - 1, kde n je počet údajových bodov. Dávno pri výpočte rozptylu vzorky sa štatistici delili iba n. Toto rozdelenie vám poskytne priemer štvorcovej odchýlky, ktorá sa presne zhoduje s rozptylom tejto vzorky. Pamätajte však, že vzorka predstavuje iba odhad väčšej populácie. Ak vezmete ďalšiu náhodnú vzorku a urobíte rovnaký výpočet, získate iný výsledok. Ako sa ukazuje, delenie číslicami n-1 namiesto n vám dáva lepší odhad rozptylu väčšej populácie - na čom vám skutočne záleží. Táto korekcia je taká bežná, že je teraz akceptovanou definíciou rozptylu vzorky.
    • Napríklad: Vo vzorke je šesť dátových bodov, takže n = 6.
      Rozptyl vzorky 33,2
  8. Pochopte rozptyl a štandardnú odchýlku. Všimnite si, že keďže vo vzorci sú mocniny, odchýlka sa meria v štvorci jednotiek pôvodných údajov. To je vizuálne mätúce. Namiesto toho je často štandardná odchýlka celkom užitočná. Nemá však zmysel zbytočne zbytočne míňať úsilie, pretože štandardná odchýlka je určená druhou odmocninou rozptylu. Preto je rozptyl vzorky napísaný v termínoch a štandardná odchýlka vzorky je.
    • Napríklad štandardná odchýlka vyššie uvedenej vzorky = s = √33,2 = 5,76.
    reklama

Metóda 2 z 2: Vypočítajte rozptyl populácie

  1. Počnúc súborom kmeňových údajov. Termín „populácia“ sa používa na označenie všetkých dôležitých pozorovaní. Ak napríklad skúmate vek obyvateľov Hanoja, vaša celková populácia bude zahŕňať vek všetkých jednotlivcov žijúcich v Hanoji. Zvyčajne by ste vytvorili tabuľku pre veľkú množinu údajov, ako je táto, ale tu je menší príklad množiny údajov:
    • Napríklad: V miestnosti akvária je presne šesť akvárií. Týchto šesť nádrží obsahuje nasledujúce počty rýb:





  2. Zapíšte si vzorec pre celkovú odchýlku. Pretože populácia obsahuje všetky údaje, ktoré potrebujeme, tento vzorec nám dáva presnú odchýlku populácie. Na odlíšenie od variancie vzorky (čo je iba odhad) používajú štatistici ďalšie premenné:
    • σ = /n
    • σ = rozptyl vzorky. Toto je normálne hranatá klobása. Odchýlka sa meria v štvorcoch.
    • predstavuje prvok vo vašom súbore údajov.
    • Prvok v calculated sa počíta pre každú hodnotu a potom sa sčíta.
    • μ je celkový priemer.
    • n je počet údajových bodov v populácii.
  3. Nájdite priemer populácie. Pri analýze populácie predstavuje symbol μ ("mu") aritmetický priemer. Ak chcete zistiť priemer, spočítajte všetky údajové body a potom ich vydelte počtom bodov.
    • Môžete si myslieť, že priemerný výraz je „priemerný“, ale buďte opatrní, pretože slovo má veľa matematických definícií.
    • Napríklad: stredná hodnota = μ = = 10,5
  4. Odčítajte priemer od každého údajového bodu. Dátové body bližšie k priemeru majú rozdiel bližšie k nule. Zopakujte problém s odčítaním pre všetky údajové body a pravdepodobne začnete pociťovať rozptyl údajov.
    • Napríklad:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Každý znak označte štvorčekom. V tomto okamihu budú niektoré výsledky získané v predchádzajúcom kroku negatívne a niektoré pozitívne.Ak vizualizujete údaje na izomorfnej čiare, tieto dve položky predstavujú čísla vľavo a vpravo od strednej hodnoty. To by nemalo zmysel pri výpočte odchýlky, pretože tieto dve skupiny by sa navzájom rušili. Namiesto toho ich všetky zarovnajte, aby boli všetky pozitívne.
    • Napríklad:
      (- μ) pre každú hodnotu i jazdí od 1 do 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Nájdite priemer svojich výsledkov. Teraz máte hodnotu pre každý údajový bod, súvisiaci (nie priamo) s tým, ako ďaleko je tento údajový bod od priemeru. Priemer ich spočítaním a vydelením počtom hodnôt, ktoré máte.
    • Napríklad:
      Celková odchýlka 24,25
  7. Kontaktujte recept. Ak si nie ste istí, ako to zodpovedá vzorcu načrtnutému na začiatku metódy, zapíšte si celý problém ručne a neskracujte:
    • Po zistení rozdielu od priemeru a štvorca získate (- μ), (- μ) atď., Kým (- μ), kde je posledný údajový bod. v súbore údajov.
    • Ak chcete zistiť priemer týchto hodnôt, spočítajte ich a vydeľte n: ((- μ) + (- μ) + ... + (- μ)) / n
    • Po prepísaní čitateľa sigmoidnou notáciou máte /n, variancia vzorca.
    reklama

Rada

  • Pretože je ťažké interpretovať odchýlku, táto hodnota sa často počíta ako východiskový bod pre nájdenie štandardnej odchýlky.
  • Použitie „n-1“ namiesto „n“ v menovateli je technika nazývaná Besselova korekcia. Vzorka predstavuje iba odhad úplnej populácie a priemer vzorky má určitú odchýlku, ktorá zodpovedá uvedenému odhadu. Táto oprava eliminuje vyššie uvedené skreslenie. Týka sa to skutočnosti, že po vymenovaní n - 1 dátových bodov je posledný bod n bola konštanta, pretože na výpočet priemeru vzorky (x̅) vo variančnom vzorci sa použili iba určité hodnoty.