Ako vypočítať emisie

Autor: Janice Evans
Dátum Stvorenia: 23 V Júli 2021
Dátum Aktualizácie: 1 V Júli 2024
Anonim
Ako vypočítať emisie skleníkových plynov
Video: Ako vypočítať emisie skleníkových plynov

Obsah

V štatistikách sú odľahlé hodnoty hodnoty, ktoré sa výrazne líšia od ostatných hodnôt v zhromaždenom súbore údajov. Odľahlá hodnota môže naznačovať anomálie v distribúcii údajov alebo chyby merania, takže extrémne hodnoty sú často zo súboru údajov vylúčené. Vylúčením odľahlých hodnôt z množiny údajov môžete dospieť k neočakávaným alebo presnejším záverom. Preto je potrebné, aby bolo možné vypočítať a odhadnúť odľahlé hodnoty, aby sa zaistilo správne pochopenie štatistiky.

Kroky

  1. 1 Naučte sa rozpoznávať potenciálne odľahlé hodnoty. Pred vylúčením odľahlých hodnôt z množiny údajov by sa mali identifikovať potenciálne odľahlé hodnoty. Odľahlé hodnoty sú hodnoty, ktoré sa veľmi líšia od väčšiny hodnôt v množine údajov; inými slovami, odľahlé hodnoty sú mimo trendu väčšiny hodnôt. To je ľahké nájsť v tabuľkách hodnôt alebo (najmä) v grafoch. Ak sú hodnoty v množine údajov vykreslené, odľahlé hodnoty budú ležať ďaleko od väčšiny ostatných hodnôt. Ak napríklad väčšina hodnôt padne na priamku, potom krajné hodnoty ležia na oboch stranách takejto priamky.
    • Zoberme si napríklad množinu údajov predstavujúcu teploty 12 rôznych predmetov v miestnosti. Ak má 11 predmetov približne 70 stupňov, ale dvanásty predmet (možno pec) má 300 stupňov, potom rýchly pohľad na hodnoty môže naznačiť, že v peci je pravdepodobne prasknutie.
  2. 2 Zoraďte údaje vzostupne. Prvým krokom pri určovaní odľahlých hodnôt je výpočet mediánu množiny údajov. Táto úloha je výrazne zjednodušená, ak sú hodnoty v množine údajov usporiadané vzostupne (od najmenšieho po najväčší).
    • Pokračovaním vyššie uvedeného príkladu zvážte nasledujúci súbor údajov predstavujúci teploty viacerých objektov: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Túto sadu je potrebné objednať takto: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Vypočítajte medián súboru údajov. Medián množiny údajov je hodnota v strede množiny údajov. Ak množina údajov obsahuje nepárny počet hodnôt, medián je hodnota, pred ktorou a za ktorou je v množine údajov rovnaký počet hodnôt. Ak však súbor údajov obsahuje párny počet hodnôt, musíte nájsť aritmetický priemer týchto dvoch priemerov. Všimnite si toho, že pri výpočte odľahlých hodnôt je medián obvykle označovaný ako Q2, pretože leží medzi Q1 a Q3, dolným a horným kvartilom, ktoré definujeme neskôr.
    • Nebojte sa pracovať s množinami údajov, ktoré majú párny počet hodnôt- aritmetický priemer týchto dvoch prostriedkov bude číslo, ktoré nie je v množine údajov; toto je normálne. Ak sú však tieto dve priemerné hodnoty rovnaké, potom sa aritmetický priemer rovná tomuto číslu; to je tiez v poriadku veci.
    • Vo vyššie uvedenom príklade sú stredné 2 hodnoty 70 a 71, takže medián je ((70 + 71) / 2) = 70,5.
  4. 4 Vypočítajte spodný kvartil. Táto hodnota, označovaná ako Q1, je pod ktorou sa nachádza 25% hodnôt súboru údajov. Inými slovami, je to polovica hodnôt až do mediánu. Ak je pred mediánom párny počet hodnôt z množiny údajov, na výpočet Q1 musíte nájsť aritmetický priemer týchto dvoch priemerov (je to podobné ako pri výpočte mediánu).
    • V našom prípade je 6 hodnôt umiestnených za mediánom a 6 hodnôt- pred ním. To znamená, že na výpočet dolného kvartilu potrebujeme nájsť aritmetický priemer dvoch priemerov zo šiestich hodnôt, ktoré ležia pred mediánom. Tu sú priemerné hodnoty 70 a 70. Teda Q1 = ((70 + 70) / 2) = 70.
  5. 5 Vypočítajte horný kvartil. Táto hodnota, označovaná ako Q3, je vyššia ako 25% hodnôt súboru údajov. Proces na výpočet Q3 je podobný procesu na výpočet Q1, ale tu sa berú do úvahy hodnoty po mediáne.
    • Vo vyššie uvedenom príklade sú dva priemery šiestich po mediáne 71 a 72. Takže Q3 = ((71 + 72) / 2) = 71,5.
  6. 6 Vypočítajte medzikvartilný rozsah. Po vypočítaní Q1 a Q3 je potrebné nájsť vzdialenosť medzi týmito hodnotami. Za týmto účelom odčítajte Q1 od Q3. Hodnota medzikvartilového rozsahu je mimoriadne dôležitá pre stanovenie hraníc hodnôt, ktoré nie sú odľahlé.
    • V našom prípade Q1 = 70 a Q3 = 71,5. Interkvartilný rozsah je 71,5 - 70 = 1,5.
    • Všimnite si toho, že to platí aj pre záporné hodnoty Q1 a Q3. Ak napríklad Q1 = -70, potom je medzikvartilný rozsah 71,5 -(-70) = 141,5.
  7. 7 Nájdite „vnútorné hranice“ hodnôt v množine údajov. Odľahlé hodnoty sa určujú analýzou hodnôt- bez ohľadu na to, či spadajú do takzvaných „vnútorných hraníc“ a „vonkajších hraníc“. Hodnota mimo „vnútorných hraníc“ je klasifikovaná ako „vedľajšia hodnota“, zatiaľ čo hodnota mimo „vonkajších hraníc“ je klasifikovaná ako „významná odľahlá hodnota“. Ak chcete nájsť vnútorné hranice, musíte vynásobiť medzikvartilný rozsah 1,5; výsledok je potrebné pripočítať k Q3 a odpočítať od Q1. Dve nájdené čísla sú vnútornými hranicami súboru údajov.
    • V našom prípade je medzikvartilný rozsah (71,5 - 70) = 1,5. Ďalej: 1,5 * 1,5 = 2,25. Toto číslo je potrebné pripočítať k Q3 a odčítať od Q1, aby ste našli vnútorné hranice:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Vnútorné hranice sú teda 67,75 a 73,75.
    • V našom prípade iba teplota pece - 300 stupňov - leží mimo týchto limitov a možno ju považovať za nevýznamnú emisiu. Nerobte však unáhlené závery - musíme určiť, či je táto teplota významnou odľahlou hodnotou.
  8. 8 Nájdite „vonkajšie hranice“ množiny údajov. To sa deje rovnakým spôsobom ako pre vnútorné hranice, okrem toho, že medzikvartilný rozsah sa vynásobí 3 namiesto 1,5. Výsledok je potrebné pripočítať k Q3 a odpočítať od Q1. Dve nájdené čísla sú vonkajšími hranicami súboru údajov.
    • V našom prípade vynásobte medzikvartilný rozsah 3: 1,5 * 3 = 4,5. Vypočítajte vonkajšie hranice:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Vonkajšie hranice sú teda 65,5 a 76.
    • Všetky hodnoty, ktoré spadajú mimo vonkajšie hranice, sa považujú za významné emisie. V našom prípade je teplota pece 300 stupňov považovaná za významný výbuch.
  9. 9 Pomocou kvalitatívneho odhadu určte, či by mali byť z množiny údajov vylúčené mimoriadne hodnoty. Metóda popísaná vyššie vám umožňuje určiť, či sú niektoré hodnoty odľahlé (malé alebo významné). Nemýľte sa však - hodnota, ktorá je klasifikovaná ako odľahlá hodnota, je iba „kandidátom“ na výnimku, čo znamená, že ju nemusíte vylučovať. Príčina odľahlej hodnoty je hlavným faktorom, ktorý ovplyvňuje rozhodnutie vylúčiť odľahlú hodnotu. Mimoriadne hodnoty, ktoré sa vyskytujú v dôsledku chýb (pri meraní, záznamoch atď.), Sú spravidla vylúčené. Na druhej strane odľahlé hodnoty nesúvisiace s chybami, ale s novými informáciami alebo trendmi sú zvyčajne ponechané v súbore údajov.
    • Rovnako dôležité je posúdiť vplyv odľahlých hodnôt na medián súboru údajov (či už ho deformujú alebo nie). To je obzvlášť dôležité, keď vyvodzujete závery z mediánu množiny údajov.
    • V našom prípade je extrémne nepravdepodobné, že sa rúra zahreje na teplotu 300 stupňov (pokiaľ neberieme do úvahy prirodzené anomálie). Preto možno dospieť k záveru (s vysokým stupňom istoty), že takáto teplota je chybou merania, ktorú je potrebné vylúčiť z množiny údajov. Navyše, ak nevylúčite odľahlú hodnotu, bude medián súboru údajov (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 stupňa, ale ak vylúčite odľahlú hodnotu, medián bude (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 stupňa.
      • Odľahlé hodnoty sú zvyčajne výsledkom ľudskej chyby, takže je potrebné vylúčiť extrémne hodnoty z množiny údajov.
  10. 10 Pochopte dôležitosť (niekedy) extrémnych hodnôt, ktoré zostali v množine údajov. Niektoré extrémne hodnoty by mali byť vylúčené z množiny údajov, pretože sú spôsobené chybami a technickými problémami; ostatné odľahlé hodnoty by mali byť ponechané v súbore údajov. Ak napríklad odľahlá hodnota nie je výsledkom chyby a / alebo poskytuje nové chápanie testovaného javu, mala by byť ponechaná v súbore údajov. Vedecké experimenty sú obzvlášť citlivé na odľahlé hodnoty - omylom odstránením odľahlej hodnoty pravdepodobne prichádzate o nový trend alebo objav.
    • Vyvíjame napríklad nový liek na zvýšenie veľkosti rýb v rybolove. Použijeme starý súbor údajov ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), ale tentoraz každá hodnota bude predstavovať hmotnosť ryby (v gramoch) po požití experimentálneho lieku. Inými slovami, prvý liek vedie k zvýšeniu hmotnosti rýb až o 71 g, druhý liek - až o 70 g atď. V tejto situácii je 300 významnou hodnotou, ale nesmieme to vylúčiť; ak predpokladáme, že nedošlo k žiadnym chybám merania, potom je taká odľahlá hodnota v experimente významným úspechom. Droga, ktorá zvýšila hmotnosť rýb na 300 gramov, funguje oveľa lepšie ako ostatné lieky; 300 je teda najdôležitejšia hodnota v súbore údajov.

Tipy

  • Keď sa nájdu mimoriadne hodnoty, pokúste sa vysvetliť ich prítomnosť a potom ich vylúčte z množiny údajov. Môžu indikovať chyby merania alebo anomálie distribúcie.

Čo potrebuješ

  • Kalkulačka