Kuidas (ja miks) Exceli funktsioonide kasutamine
Väljaspool on väärtus, mis on oluliselt suurem või väiksem kui enamik teie andmete väärtustest. Andmete analüüsimiseks Exceli abil võivad tulemused kõrvale kalduda. Näiteks võib andmekogu keskmine keskmine teie väärtusi tõesti kajastada. Excel pakub mõningaid kasulikke funktsioone, mis aitavad teie kõrvalekaldeid hallata, nii et vaatame.
Kiire näide
Allpool olevas pildis on kõrvalekalded mõistlikult kergesti märgatavad - Ericile määratud kahe väärtuse ja Ryanile määratud 173 väärtuse. Sellises andmestikus on see lihtne väljumiste käsitlemiseks ja käsitlemiseks piisavalt lihtne.
Suuremas andmekogumis ei ole see nii. Oluline on välja selgitada kõrvalekalded ja eemaldada need statistilistest arvutustest - ja seda me vaatame, kuidas selles artiklis teha.
Kuidas leida oma andmetes kõrvalekaldeid
Andmekogumi kõrvalekallete leidmiseks kasutame järgmisi samme:
- Arvutage 1. ja 3. kvartiil (räägime sellest, mis need on natuke).
- Hinnake interkvartiilide vahemikku (selgitame neid ka veidi allapoole).
- Tagastage meie andmevahemiku ülemine ja alumine piir.
- Kasutage neid piire, et tuvastada kõrvalised andmepunktid.
Nende väärtuste salvestamiseks kasutatakse allpool olevas pildis näidatud andmekogumist paremale jäävat lahtri vahemikku.
Alustame.
Esimene samm: arvutage kvartiilid
Kui jagate oma andmed kvartalitesse, nimetatakse neid komplekti kvartiiliks. Kõige madalamad 25% numbritest moodustavad 1. kvartiili, järgmise 25% teise kvartiili ja nii edasi. Me võtame selle sammu kõigepealt läbi, sest kõige laiemalt kasutatav väljundi määratlus on andmepunkt, mis on üle 1,5 interkvartiilse vahemiku (IQR) allpool 1. kvartiili, ja 1,5 interkvartiilne vahemik 3. kvartiili kohal. Nende väärtuste kindlakstegemiseks peame kõigepealt välja selgitama, millised on kvartiilid.
Excel pakub QUARTILE funktsiooni kvartiilide arvutamiseks. See nõuab kahte informatsiooni: massiivi ja kvartsi.
= QUARTILE (massiiv, kvarts)
The massiivi on väärtuste vahemik, mida hindate. Ja quart on number, mis esindab kvartiili, mida soovid naasta (ntst kvartiil, 2 neljandale kvartiilile jne).
Märge: Excel 2010-s vabastas Microsoft QUARTILE.INC ja QUARTILE.EXC funktsioone QUARTILE funktsiooni parandustena. QUARTILE on enamate Exceli versioonide töötamisel ühilduvam.
Lähme tagasi meie näite tabelisse.
1 arvutamiseksst Kvartiil, mida saab kasutada lahtris F2 järgmise valemi abil.
= QUARTILE (B2: B14,1)
Kui sisestate valemit, pakub Excel kvartsargumentide valikuid.
3 arvutamiseksrd kvartiil, saame lahtrisse F3 sisestada valemi nagu eelmine, kuid ühe asemel kolm.
= QUARTILE (B2: B14,3)
Nüüd on rakkudes kuvatud kvartiilsed andmepunktid.
Teine etapp: Hinnake interkvartiilide vahemikku
Interkvartiilide vahemik (või IQR) on teie andmete keskmised 50%. See arvutatakse kui 1. kvartiili väärtuse ja 3. kvartiili väärtuse vahe.
Me kasutame lahtrisse F4 lihtsat valemit, mis lahutab 1st kvartiil 3-strd kvartiil:
= F3-F2
Nüüd näeme meie interkvartiilide vahemikku.
Kolmas etapp: tagastage alumine ja ülemine piir
Alumine ja ülemine piir on andmevahemiku väikseim ja suurim väärtus, mida me soovime kasutada. Kõik need väärtused, mis on väiksemad või suuremad kui need seotud väärtused, on kõrvalekalded.
Arvutame alampiiri limiidi lahtris F5, korrutades IQR väärtuse 1,5-ga ja lahutades selle Q1-andmepunktist:
= F2- (1,5 * F4)
Märge: Selle valemi sulgud ei ole vajalikud, sest korrutamise osa arvutatakse enne lahutamise osa, kuid nad teevad valemi loetavamaks.
Ülemise piiri arvutamiseks lahtris F6 korrutame IQRi 1,5-ga, kuid seekord lisama Q3 andmepunkti:
= F3 + (1,5 * F4)
Neljas samm: identifitseerige kõrvalekalded
Nüüd, kui meil on kõik meie aluseks olevad andmed, on aeg kindlaks teha meie kõrvalised andmepunktid - need, mis on madalamad kui alumine piirväärtus või kõrgemad kui ülemine piirväärtus.
Selle loogilise testi tegemiseks kasutame OR funktsiooni ja näitame neile kriteeriumidele vastavaid väärtusi, sisestades lahtrisse C2 järgmise valemi:
= VÕI (B2 $ F $ 6)
Seejärel kopeerime selle väärtuse oma C3-C14 rakkudesse. TRUE väärtus näitab väljumist ja nagu näete, on meil kaks andmeid.
Väljundite ignoreerimine keskmise keskmise arvutamisel
QUARTILE funktsiooni kasutamine võimaldab meil arvutada IQR ja töötada kõige laiemalt kasutatava väljendi määratlusega. Väärtuste vahemiku keskmise arvutamisel ja kõrvalekallete ignoreerimisel on siiski kasutatav kiirem ja lihtsam funktsioon. See meetod ei tuvasta väljumist nagu varem, kuid see võimaldab meil olla paindlik, mida võiksime kaaluda meie väljalõigete osas.
Vajalikku funktsiooni nimetatakse TRIMMEANiks ja selle süntaksit näete allpool:
= TRIMMEAN (massiiv, protsent)
The massiivi on keskmiste väärtuste vahemik. The protsenti on andmepunktide protsent, mis välistatakse andmestiku ülemisest ja alumisest osast (saate selle sisestada protsendina või kümnendarvuna).
Me sisestasime allpool toodud näite meie näites lahtrisse D3, et arvutada keskmine ja välistada 20% kõrvalekalletest.
= TRIMMEAN (B2: B14, 20%)
Seal on teil kaks erinevat funktsiooni kõrvalekallete käitlemiseks. Kas soovite tuvastada need mõne aruandlusvajadusega või jätta need arvutustest, nt keskmised, välja arvata, on Exceli funktsioon teie vajadustele vastav.