Určte korelačný koeficient

Autor: Morris Wright
Dátum Stvorenia: 28 Apríl 2021
Dátum Aktualizácie: 19 V Júni 2024
Anonim
Určte korelačný koeficient - Avíza
Určte korelačný koeficient - Avíza

Obsah

Korelačný koeficient označený r alebo ρ je mierou lineárnej korelácie (vzťah v sile aj smere) medzi dvoma premennými. Pohybuje sa od -1 do +1, pričom kladné a záporné korelácie predstavuje znamienko plus a mínus. Ak je korelačný koeficient presne -1, potom je vzťah medzi týmito dvoma premennými úplne negatívny; ak je korelačný koeficient presne +1, potom je vzťah úplne pozitívny. Dve premenné môžu mať pozitívnu koreláciu, negatívnu koreláciu alebo vôbec žiadnu koreláciu. Koreláciu môžete vypočítať ručne pomocou niektorých bezplatných výpočtov korelácie dostupných online alebo pomocou štatistických funkcií dobrej grafickej kalkulačky.

Na krok

Metóda 1 zo 4: Ručný výpočet korelačného koeficientu

  1. Najskôr zhromaždite svoje údaje. Ak chcete začať počítať s účinnou koreláciou, najskôr preskúmajte dátové páry. Je užitočné umiestniť ich do tabuľky, vertikálne aj horizontálne. Označte každý riadok alebo stĺpec x a y.
    • Predpokladajme napríklad, že máte štyri dátové páry pre X a r. Tabuľka potom môže vyzerať takto:
      • x || r
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Vypočítajte priemer z X. Na výpočet priemeru potrebujete všetky hodnoty X pridať a potom vydeliť počtom hodnôt.
    • Pomocou vyššie uvedeného príkladu si všimnite, že máte štyri hodnoty pre X. Na výpočet priemeru sa spočítajú všetky hodnoty X a vydelíme ho 4. Výpočet vyzerá takto:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Nájdite priemernú hodnotu r. Do priemeru r Ak ju chcete nájsť, postupujte podľa rovnakých krokov, pridajte všetky hodnoty y a vydeľte ich počtom.
      • Vo vyššie uvedenom príklade máte tiež štyri hodnoty pre r. Pridajte všetky tieto hodnoty dohromady a potom ich vydelte číslom 4. Výpočty budú vyzerať takto:
      • μr=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Určte smerodajnú odchýlku X. Keď máte prostriedky, môžete vypočítať štandardnú odchýlku. Ak to chcete urobiť, použite vzorec:
        • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Vypočítajte štandardnú odchýlku r. Rovnakými základnými krokmi vyhľadajte štandardnú odchýlku r. Použijete rovnaký vzorec, ktorý použije dátové body pre y.
          • So vzorovými údajmi budú vaše výpočty vyzerať takto:
          • σr=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Prezrite si základný vzorec na určenie korelačného koeficientu. Vzorec na výpočet korelačného koeficientu využíva priemery, štandardné odchýlky a počet párov v súbore údajov (predstavované n). Samotný korelačný koeficient predstavuje malé písmeno r alebo grécke písmeno ρ (rho). V tomto článku použijeme vzorec známy ako Pearsonov korelačný koeficient, ako je uvedené nižšie:
            • ρ=(1n1)Σ(XμXσX)(rμrσr){ displaystyle rho = doľava ({ frac {1} {n-1}} doprava) Sigma doľava ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Určte korelačný koeficient. Teraz máte prostriedky a štandardné odchýlky pre vaše premenné, takže môžete prejsť na vzorec korelačného koeficientu. Zapamätaj si to n predstavuje počet hodnôt, ktoré máte. Ostatné relevantné informácie ste už vypracovali vo vyššie uvedených krokoch.
              • Pomocou vzorových údajov môžete údaje zadať do vzorca korelačného koeficientu a vypočítať ich takto:
              • ρ=(1n1)Σ(XμXσX)(rμrσr){ displaystyle rho = doľava ({ frac {1} {n-1}} doprava) Sigma doľava ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Výsledok interpretujte. Pre tento súbor údajov je korelačný koeficient 0,988. Toto číslo hovorí o údajoch dve veci. Pozerajte sa na znamienko čísla a veľkosť čísla.
                • Pretože je korelačný koeficient kladný, môžete povedať, že medzi údajmi x a údajmi y existuje pozitívna korelácia. To znamená, že ak sa hodnoty x zvýšia, môžete očakávať, že sa tiež zvýšia hodnoty y.
                • Pretože je korelačný koeficient veľmi blízko +1, údaje x a y sú veľmi úzko spojené. Ak by ste mali tieto body zobraziť v grafe, videli by ste, že sú veľmi dobrou aproximáciou priamky.

Metóda 2 zo 4: Používanie online korelačných kalkulačiek

  1. Vyhľadajte online korelačné kalkulačky. Meranie korelácie je pre štatistikov pomerne štandardný výpočet. Výpočet môže byť pre veľké súbory dát veľmi namáhavý, ak sa vykoná ručne. Mnoho zdrojov preto sprístupnilo bežné výpočty korelácie online. Použite ľubovoľný vyhľadávací nástroj a zadajte hľadaný výraz „korelačná kalkulačka“.
  2. Zadajte údaje. Pozorne si prečítajte pokyny na webovej stránke, aby ste mohli údaje zadať správne. Je dôležité, aby sa dátové páry udržiavali v poriadku, inak získate nesprávny výsledok korelácie. Rôzne webové stránky používajú na zadávanie údajov rôzne formáty.
    • Napríklad na webovej stránke http://ncalculators.com/statistics/correlation-coefficient-calculator.htm nájdete vodorovné pole pre zadávanie hodnôt x a druhé vodorovné pole pre zadávanie hodnôt y. Zadávate výrazy oddelené iba čiarkami. Sada údajov x vypočítaná predtým v tomto článku by mala byť zadaná ako 1,2,4,5. Súbor údajov y sa zadáva ako 1,3,5,7.
    • Na inej stránke, http://www.alcula.com/calculators/statistics/correlation-coefficient/, môžete zadávať údaje vodorovne alebo zvisle, pokiaľ udržiavate údajové body v poriadku.
  3. Vypočítajte výsledky. Tieto výpočtové weby sú populárne, pretože po zadaní údajov zvyčajne stačí kliknúť na tlačidlo „Vypočítať“ - výsledok sa zobrazí automaticky.

Metóda 3 zo 4: Použitie grafickej kalkulačky

  1. Zadajte svoje údaje. Vo svojej grafickej kalkulačke povoľte funkciu štatistík a potom vyberte príkaz „Upraviť“.
    • Každá kalkulačka má mierne odlišné klávesové príkazy. Tento článok poskytuje konkrétne pokyny pre prístroj Texas Instruments TI-86.
    • Pre prístup k funkcii Stat stlačte [2nd] -Stat (nad klávesom „+“) a potom stlačte F2-Edit.
  2. Odstráňte všetky staré uložené údaje. Väčšina kalkulačiek uchová štatistické údaje, kým nebudú vymazané. Aby ste si nepomýlili staré údaje s novými, mali by ste najskôr vymazať všetky predtým uložené informácie.
    • Pomocou klávesov so šípkami posuňte kurzor na zvýraznenie kategórie „xStat“. Potom stlačte „Vymazať“ a „Enter. Toto by malo vymazať všetky hodnoty v stĺpci xStat.
    • Pomocou klávesov so šípkami zvýraznite kategóriu „yStat“. Stlačením klávesov „Vymazať“ a „Enter“ tiež vymažete údaje pre tento stĺpec.
  3. Zadajte hodnoty údajov. Pomocou klávesov so šípkami posuňte kurzor na prvé miesto pod hlavičkou xStat. Zadajte svoju prvú údajovú hodnotu a potom stlačte kláves Enter. Mali by ste vidieť medzeru v dolnej časti obrazovky „xStat (1) = __“, kde vaša hodnota vypĺňa prázdne miesto. Keď stlačíte kláves Enter, údaje vyplnia tabuľku, kurzor sa presunie na ďalší riadok a riadok v dolnej časti obrazovky by mal teraz znieť „xStat (2) = __“.
    • Pokračujte v zadávaní všetkých hodnôt x.
    • Keď ste zadali hodnoty x, pomocou klávesov so šípkami prejdite na stĺpec yStat a zadajte hodnoty y.
    • Po zadaní všetkých údajov stlačte Exit, aby ste vymazali obrazovku a opustili ponuku Stat.
  4. Vypočítajte štatistiku lineárnej regresie. Korelačný koeficient je mierou toho, ako blízko sa údaje približujú k priamke. Grafická kalkulačka so štatistickými funkciami dokáže veľmi rýchlo vypočítať najvhodnejšiu čiaru a korelačný koeficient.
    • Zadajte funkciu Stat a potom stlačte tlačidlo Calc. Na TI-86 je to [2.] [Stat] [F1].
    • Vyberte výpočty lineárnej regresie. Na TI-86 je to [F3] s označením „LinR.“ Na grafickom displeji sa potom zobrazí riadok „LinR _“ s blikajúcim kurzorom.
    • Teraz musíte zadať názvy dvoch premenných, ktoré chcete vypočítať. Ide o xStat a yStat.
      • Na TI-86 vyberte zoznam mien („Mená“) stlačením [2.] [Zoznam] [F3].
      • V dolnom riadku obrazovky by sa teraz mali zobraziť dostupné premenné. Vyberte [xStat] (toto je pravdepodobne tlačidlo F1 alebo F2), potom zadajte čiarku a potom [yStat].
      • Stlačením klávesu Enter vypočítajte údaje
  5. Interpretujte výsledky. Keď stlačíte kláves Enter, kalkulačka okamžite vypočíta nasledujúce údaje pre zadané údaje:
    • r=a+bX{ displaystyle y = a + bx}Pochopte pojem korelácia. Korelácia sa týka štatistického vzťahu medzi dvoma veličinami. Korelačný koeficient je jediné číslo, ktoré môžete vypočítať pre dve sady údajových bodov. Číslo je vždy niečo medzi -1 a +1 a naznačuje, ako blízko sú tieto dve množiny údajov.
      • Ak by ste napríklad merali výšku a vek detí do približne 12 rokov, čakali by ste, že nájdete silnú pozitívnu koreláciu. Ako deti starnú, majú tendenciu stúpať.
      • Príkladom negatívnej korelácie je porovnanie času, ktorý niekto strávi trénovaním golfu, s golfovým skóre tejto osoby. Postupom tréningu by malo skóre klesať.
      • V konečnom dôsledku by ste očakávali malú koreláciu, pozitívnu alebo negatívnu, napríklad medzi veľkosťou topánky človeka a známkami skúšky.
    • Vypočítajte priemer. Aritmetický priemer alebo „priemer“ množiny údajov sa vypočíta tak, že sa spočítajú všetky hodnoty údajov, a potom sa vydelí počtom hodnôt v množine. Ak chcete určiť korelačný koeficient pre svoje údaje, musíte vypočítať priemer každej sady údajov.
      • Priemer premennej je označený premennou, nad ktorou je vodorovná čiara. Toto sa pre súbory údajov xay často označuje ako „čiara x“ alebo „čiara y“. Alternatívne môže byť priemer označený malým gréckym písmenom μ (mu). Napríklad na označenie priemeru údajových bodov x môžete použiť μX alebo μ (x).
      • Napríklad ak máte množinu x (1,2,5,6,9,10), priemer týchto údajov sa vypočíta takto:
        • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Poznať význam štandardnej odchýlky. V štatistike štandardná odchýlka meria odchýlku a ukazuje rozptyl čísel od priemeru. Skupina čísel s nízkou štandardnou odchýlkou ​​je dosť blízko pri sebe. Skupina čísel s vysokou štandardnou odchýlkou ​​je rozptýlenejšia.
          • Ako symbol je štandardná odchýlka vyjadrená pomocou malého písmena s alebo gréckeho písmena σ (sigma). Štandardná odchýlka údajov x sa teda píše ako sX alebo σX.
        • Rozpoznajte súčtový zápis. Súčetový operátor je jedným z najbežnejších operátorov v matematike a označuje súčet hodnôt. Je reprezentovaná gréckym veľkým písmenom, sigma alebo ∑.
          • Napríklad, ak máte zbierku dátových bodov x (1,2,5,6,9,10), potom ∑x znamená:
            • 1+2+5+6+9+10 = 33

Tipy

  • Korelačný koeficient sa niekedy označuje ako „Pearsonov korelačný koeficient produktu a momentu“ na počesť jeho vývojára Karla Pearsona.
  • Všeobecne platí, že korelačný koeficient vyšší ako 0,8 (pozitívny alebo negatívny) predstavuje silnú koreláciu; korelačný koeficient nižší ako 0,5 (opäť kladný alebo záporný) predstavuje slabý korelačný koeficient.

Varovania

  • Korelácia ukazuje, že dva súbory údajov sú nejakým spôsobom spojené. Buďte však opatrní, aby ste to nevykladali ako príčinnú súvislosť. Napríklad, ak porovnáte veľkosť topánok ľudí a ich výšku, pravdepodobne nájdete silnú pozitívnu koreláciu. Väčší ľudia majú spravidla väčšie nohy. To však neznamená, že s pribúdajúcimi nohami vám nohy dorastú, alebo že veľké nohy vám dorastú. Proste sa stávajú spolu.