Ako vypočítať koeficient lineárnej korelácie

Autor: Eric Farmer
Dátum Stvorenia: 7 Pochod 2021
Dátum Aktualizácie: 1 V Júli 2024
Anonim
Ako vypočítať koeficient lineárnej korelácie - Spoločnosť
Ako vypočítať koeficient lineárnej korelácie - Spoločnosť

Obsah

Korelačný koeficient (alebo lineárny korelačný koeficient) sa označuje ako „r“ (v zriedkavých prípadoch ako „ρ“) a charakterizuje lineárnu koreláciu (to znamená vzťah, ktorý je daný nejakou hodnotou a smerom) dvoch alebo viacerých premenných. Hodnota koeficientu leží medzi -1 a +1, to znamená, že korelácia môže byť pozitívna aj negatívna. Ak je korelačný koeficient -1, existuje dokonalá negatívna korelácia; ak je korelačný koeficient +1, existuje dokonalá pozitívna korelácia. V opačnom prípade existuje pozitívna korelácia medzi týmito dvoma premennými, negatívna korelácia alebo žiadna korelácia. Korelačný koeficient je možné vypočítať ručne, pomocou bezplatných online kalkulačiek alebo pomocou dobrej grafickej kalkulačky.

Kroky

Metóda 1 zo 4: Ručný výpočet korelačného koeficientu

  1. 1 Zbierať dáta. Pred výpočtom korelačného koeficientu si preštudujte tieto dvojice čísel. Je lepšie ich zapísať do tabuľky, ktorá môže byť usporiadaná vertikálne alebo horizontálne. Každý riadok alebo stĺpec označte „x“ a „y“.
    • Napríklad uvedené štyri páry hodnôt (čísel) premenných „x“ a „y“. Môžete vytvoriť nasledujúcu tabuľku:
      • x || r
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Vypočítajte aritmetický priemer „x“. Za týmto účelom spočítajte všetky hodnoty x a výsledok vydelte počtom hodnôt.
    • V našom prípade existujú štyri hodnoty pre premennú "x". Ak chcete vypočítať aritmetický priemer „x“, sčítajte tieto hodnoty a potom rozdeľte súčet číslom 4. Výpočty sú zapísané nasledovne:
    • μX=(1+2+4+5)/4{ Displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μX=12/4{ Displaystyle mu _ {x} = 12/4}
    • μX=3{ displaystyle mu _ {x} = 3}
  3. 3 Nájdite aritmetický priemer „y“. Postupujte podľa rovnakých krokov, to znamená, že sčítajte všetky hodnoty y a potom súčet vydelte počtom hodnôt.
    • V našom prípade sú uvedené štyri hodnoty premennej "y". Pridajte tieto hodnoty a potom delte súčet číslom 4. Výpočty budú zapísané nasledovne:
    • μr=(1+3+5+7)/4{ Displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μr=16/4{ Displaystyle mu _ {y} = 16/4}
    • μr=4{ displaystyle mu _ {y} = 4}
  4. 4 Vypočítajte štandardnú odchýlku „x“. Po výpočte priemerov „x“ a „y“ nájdite štandardné odchýlky týchto premenných. Štandardná odchýlka sa vypočíta podľa nasledujúceho vzorca:
    • σX=1n1Σ(XμX)2{ Displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • V našom prípade budú výpočty napísané takto:
    • σX=141((13)2+(23)2+(43)2+(53)2){ Displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σX=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}}
    • σX=13(10){ Displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σX=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σX=1,83{ Displaystyle sigma _ {x} = 1,83}
  5. 5 Vypočítajte štandardnú odchýlku „y“. Postupujte podľa krokov uvedených v predchádzajúcom kroku. Použite rovnaký vzorec, ale zadajte hodnoty y.
    • V našom prípade budú výpočty napísané takto:
    • σr=141((14)2+(34)2+(54)2+(74)2){ Displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σr=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}}
    • σr=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σr=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σr=2,58{ displaystyle sigma _ {y} = 2,58}
  6. 6 Napíšte základný vzorec na výpočet korelačného koeficientu. Tento vzorec obsahuje priemer, štandardné odchýlky a počet (n) párov čísel oboch premenných. Korelačný koeficient je označený ako „r“ (v zriedkavých prípadoch ako „ρ“). Tento článok používa vzorec na výpočet Pearsonovho korelačného koeficientu.
    • ρ=(1n1)Σ(XμXσX)(rμrσr){ Displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • Tu a v iných zdrojoch môžu byť množstvá označené rôznymi spôsobmi. Niektoré vzorce obsahujú napríklad „ρ“ a „σ“, zatiaľ čo iné obsahujú „r“ a „s“. Niektoré učebnice uvádzajú rôzne vzorce, ale sú matematickým ekvivalentom vyššie uvedeného vzorca.
  7. 7 Vypočítajte korelačný koeficient. Vypočítali ste priemer a štandardné odchýlky oboch premenných, takže na výpočet korelačného koeficientu môžete použiť vzorec. Pripomeňme, že „n“ je počet párov hodnôt pre obe premenné. Ostatné hodnoty boli vypočítané skôr.
    • V našom prípade budú výpočty napísané takto:
    • ρ=(1n1)Σ(XμXσX)(rμrσr){ Displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • ρ=(13){ Displaystyle rho = vľavo ({ frac {1} {3}} vpravo) *}[(131,83)(142,58)+(231,83)(342,58){ Displaystyle left ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1,83}} vpravo) * vľavo ({ frac {3-4} {2,58}} vpravo)}
         +(431,83)(542,58)+(531,83)(742,58){ Displaystyle + left ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ({ frac { 5-3} {1,83}} right) * left ({ frac {7-4} {2.58}} right)}]
    • ρ=(13)(6+1+1+64,721){ Displaystyle rho = left ({ frac {1} {3}} right) * left ({ frac {6 + 1 + 1 + 6} {4.721}} right)}
    • ρ=(13)2,965{ Displaystyle rho = vľavo ({ frac {1} {3}} vpravo) * 2,965}
    • ρ=(2,9653){ Displaystyle rho = vľavo ({ frac {2,965} {3}} vpravo)}
    • ρ=0,988{ Displaystyle rho = 0,988}
  8. 8 Analyzujte výsledok. V našom prípade je korelačný koeficient 0,988. Táto hodnota nejakým spôsobom charakterizuje danú množinu dvojíc čísel. Dávajte pozor na znamienko a veľkosť hodnoty.
    • Pretože je hodnota korelačného koeficientu kladná, existuje pozitívna korelácia medzi premennými „x“ a „y“. To znamená, že so zvýšením hodnoty „x“ sa zvyšuje aj hodnota „y“.
    • Pretože hodnota korelačného koeficientu je veľmi blízka +1, hodnoty premenných „x“ a „y“ sú vo veľkej korelácii. Ak umiestnite body na súradnicovú rovinu, budú sa nachádzať blízko určitej priamky.

Metóda 2 zo 4: Použitie online kalkulačiek na výpočet korelačného koeficientu

  1. 1 Nájdite na internete kalkulačku na výpočet korelačného koeficientu. Tento koeficient sa často vypočítava v štatistikách. Ak existuje veľa párov čísel, je takmer nemožné vypočítať korelačný koeficient ručne. Preto existujú online kalkulačky na výpočet korelačného koeficientu. Do vyhľadávača zadajte „kalkulačka korelačných koeficientov“ (bez úvodzoviek).
  2. 2 Zadajte údaje. Podľa pokynov na webovej stránke zadajte správne údaje (dvojice čísel). Je nevyhnutné zadať príslušné dvojice čísel; v opačnom prípade dosiahnete nesprávny výsledok. Nezabudnite, že rôzne webové stránky majú rôzne vstupné formáty.
    • Napríklad na stránke http://ncalculators.com/statistics/correlation-coefficient-calculator.htm sú hodnoty premenných xay zadané do dvoch vodorovných čiar. Hodnoty sú oddelené čiarkami. To znamená, že v našom prípade sú hodnoty „x“ zadané takto: 1,2,4,5 a hodnoty „y“ takto: 1,3,5,7.
    • Na inom webe http://www.alcula.com/calculators/statistics/correlation-coefficient/ sa údaje zadávajú zvisle; v tomto prípade nezamieňajte zodpovedajúce dvojice čísel.
  3. 3 Vypočítajte korelačný koeficient. Po zadaní údajov jednoducho kliknite na tlačidlo „Vypočítať“, „Vypočítať“ alebo podobné, aby ste získali výsledok.

Metóda 3 zo 4: Použitie grafickej kalkulačky

  1. 1 Zadajte údaje. Vezmite grafickú kalkulačku, prejdite do režimu štatistických výpočtov a zvoľte príkaz „Upraviť“.
    • Rôzne kalkulačky vyžadujú stlačenie rôznych klávesov. Tento článok pojednáva o kalkulačke Texas Instruments TI-86.
    • Stlačením [2.] - Štatistiky (nad klávesom +) vstúpte do režimu štatistického výpočtu. Potom stlačte F2 - Upraviť.
  2. 2 Odstráňte predchádzajúce uložené údaje. Väčšina kalkulačiek uchováva zadané štatistiky, kým ich nevymažete. Aby ste sa vyhli zámene starých údajov za nové, najskôr odstráňte všetky uložené informácie.
    • Pomocou klávesov so šípkami presuňte kurzor a zvýraznite nadpis „xStat“. Potom stlačením Vymazať a Enter vymažete všetky hodnoty zadané v stĺpci xStat.
    • Pomocou klávesov so šípkami zvýraznite nadpis „yStat“. Potom stlačením Vymazať a Enter vymažete všetky hodnoty zadané v stĺpci yStat.
  3. 3 Zadajte počiatočné údaje. Pomocou klávesov so šípkami presuňte kurzor na prvú bunku pod nadpisom „xStat“. Zadajte prvú hodnotu a stlačte Enter. V spodnej časti obrazovky sa zobrazí „xStat (1) = __“, pričom zadaná hodnota nahradí medzeru. Po stlačení klávesu Enter sa zadaná hodnota zobrazí v tabuľke a kurzor sa presunie na nasledujúci riadok; v spodnej časti obrazovky sa zobrazí „xStat (2) = __“.
    • Zadajte všetky hodnoty pre premennú „x“.
    • Po zadaní všetkých hodnôt pre x sa pomocou klávesov so šípkami presuňte do stĺpca yStat a zadajte hodnoty pre y.
    • Po zadaní všetkých párov čísel stlačením klávesu Exit vyčistíte obrazovku a opustíte režim agregácie.
  4. 4 Vypočítajte korelačný koeficient. Charakterizuje, ako blízko sú údaje k určitej priamke. Kalkulačka grafov dokáže rýchlo určiť vhodnú priamku a vypočítať korelačný koeficient.
    • Kliknite na položku Štat. Na TI -86 stlačte [2.] - [Stat] - [F1].
    • Vyberte funkciu Lineárna regresia. Na TI-86 stlačte [F3], ktorý je označený „LinR“. Na obrazovke sa zobrazí riadok „LinR _“ s blikajúcim kurzorom.
    • Teraz zadajte názvy dvoch premenných: xStat a yStat.
      • Na TI-86 otvorte zoznam mien; Vykonáte to stlačením [2.] - [Zoznam] - [F3].
      • Dostupné premenné sú zobrazené v dolnom riadku obrazovky. Vyberte položku [xStat] (na to pravdepodobne budete musieť stlačiť kláves F1 alebo F2), zadajte čiarku a potom vyberte položku [yStat].
      • Zadané údaje spracujete stlačením klávesu Enter.
  5. 5 Analyzujte svoje výsledky. Po stlačení klávesu Enter sa na obrazovke zobrazia nasledujúce informácie:
    • r=a+bX{ displaystyle y = a + bx}: toto je funkcia, ktorá popisuje riadok. Upozorňujeme, že funkcia nie je napísaná v štandardnej forme (y = kx + b).
    • a={ displaystyle a =}... Toto je súradnica y priesečníku priamky s osou y.
    • b={ displaystyle b =}... Toto je sklon čiary.
    • corr={ displaystyle { text {corr}} =}... Toto je korelačný koeficient.
    • n={ displaystyle n =}... Toto je počet dvojíc čísel, ktoré boli použité pri výpočtoch.

Metóda 4 zo 4: Vysvetlenie základných pojmov

  1. 1 Pochopte koncept korelácie. Korelácia je štatistický vzťah medzi dvoma veličinami. Korelačný koeficient je číselná hodnota, ktorú je možné vypočítať pre akékoľvek dve množiny údajov. Hodnota korelačného koeficientu vždy leží v rozmedzí od -1 do +1 a charakterizuje stupeň vzťahu medzi dvoma premennými.
    • Napríklad vzhľadom na výšku a vek detí (asi 12 rokov). S najväčšou pravdepodobnosťou bude existovať silná pozitívna korelácia, pretože deti vekom rastú.
    • Príklad negatívnej korelácie: trestné minúty a čas strávený biatlonovým tréningom, to znamená, že čím viac športovec trénuje, tým menej trestných sekúnd dostane.
    • Napokon, niekedy existuje len veľmi malá korelácia (pozitívna alebo negatívna), napríklad medzi veľkosťou obuvi a matematickým skóre.
  2. 2 Nezabudnite, ako vypočítať aritmetický priemer. Ak chcete vypočítať aritmetický priemer (alebo priemer), musíte nájsť súčet všetkých týchto hodnôt a potom ho vydeliť počtom hodnôt. Nezabudnite, že na výpočet korelačného koeficientu je potrebný aritmetický priemer.
    • Priemerná hodnota premennej je označená písmenom s vodorovným pruhom nad ním. Napríklad v prípade premenných „x“ a „y“ sú ich priemerné hodnoty označené nasledovne: x̅ a y̅. Priemer je niekedy označovaný gréckym písmenom „μ“ (mu). Na zápis aritmetického priemeru hodnôt premennej „x“ použite zápis μX alebo μ (x).
    • Napríklad vzhľadom na nasledujúce hodnoty pre premennú „x“: 1,2,5,6,9,10. Aritmetický priemer týchto hodnôt sa vypočíta takto:
      • μX=(1+2+5+6+9+10)/6{ Displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μX=33/6{ Displaystyle mu _ {x} = 33/6}
      • μX=5,5{ displaystyle mu _ {x} = 5,5}
  3. 3 Všimnite si dôležitosti štandardnej odchýlky. V štatistikách štandardná odchýlka charakterizuje stupeň, v akom sú čísla rozptýlené vo vzťahu k ich priemeru. Ak je štandardná odchýlka malá, čísla sa blížia k priemeru; ak je štandardná odchýlka veľká, čísla sú ďaleko od priemeru.
    • Štandardná odchýlka je označená písmenom „s“ alebo gréckym písmenom „σ“ (sigma). Štandardná odchýlka hodnôt premennej „x“ sa teda označuje takto: sX alebo σX.
  4. 4 Pamätajte si symbol operácie súčtu. Symbol súčtu je jedným z najbežnejších symbolov v matematike a označuje súčet hodnôt. Tento symbol je grécke písmeno „Σ“ (veľké sigma).
    • Ak sú napríklad pre premennú „x“ uvedené nasledujúce hodnoty: 1,2,5,6,9,10, potom Σx znamená:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Tipy

  • Korelačný koeficient sa podľa vývojára Carla Pearsona niekedy nazýva „Pearsonov korelačný koeficient“.
  • Vo väčšine prípadov, keď je korelačný koeficient väčší ako 0,8 (pozitívny alebo negatívny), existuje silná korelácia; ak je korelačný koeficient menší ako 0,5 (kladný alebo záporný), pozoruje sa slabá korelácia.

Varovania

  • Korelácia charakterizuje vzťah medzi hodnotami dvoch premenných. Pamätajte však, že korelácia nemá nič spoločné s príčinnou súvislosťou. Ak napríklad porovnáte výšku a veľkosť obuvi ľudí, pravdepodobne nájdete silnú pozitívnu koreláciu. Spravidla platí, že čím je človek vyšší, tým je obuv väčšia. To však neznamená, že zvýšenie výšky povedie k automatickému zvýšeniu veľkosti obuvi alebo že väčšie chodidlá povedú k rýchlejšiemu rastu. Tieto veličiny spolu jednoducho súvisia.