T-TEST ja ANOVA

Anonim

T-TEST vs. ANOVA

Tilastotietojen kerääminen ja laskeminen keskiarvon hankkimiseksi on usein pitkä ja työläs prosessi. T-testi ja varianssian yksisuuntainen analyysi (ANOVA) ovat kaksi yleisintä tätä tarkoitusta varten käytettyä koetta.

T-testi on tilastollisen hypoteesin testi, jossa testitilasto seuraa opiskelijan t-jakaumaa, jos nollahypoteesia tuetaan. Tätä testiä sovelletaan, kun testitilasto seuraa normaalia jakautumista ja skaalausjakson arvo testitilastossa on tunnettua. Jos skaalaustapa tuntematon, se korvataan arvioidulla käytettävissä olevien tietojen perusteella. Testitilasto noudattaa opiskelijan t-jakelua.

William Sealy Gosset esitteli t-tilaston vuonna 1908. Gosset oli kemisti Guinnessin panimoon Dublinissa Irlannissa. Guinnessin panimo oli pyrkinyt rekrytoimaan parhaimmat tutkinnon suorittaneet Oxfordista ja Cambridgeista valitsemalla niille, jotka voisivat tarjota biokemian ja tilastotieteen sovelluksia yrityksen vakiintuneisiin teollisiin prosesseihin. William Sealy Gosset oli yksi tällainen jatko. Menetelmässä William Sealy Gosset loi t-testin, joka alunperin oli suunniteltu keinona valvoa voimakasta (tumma olut panimo tuottaa) kustannustehokkaalla tavalla. Gosset julkaisi testin kynän nimellä "Student" Biometrissä noin 1908. Kynän nimen nimi oli Guinnessin vaatimus, koska yritys halusi säilyttää politiikkansa tilastojen hyödyntämisestä osana "liikesalaisuuksia".

T-testitilastot seuraavat yleensä lomaketta T = Z / s, missä Z ja s ovat datan funktioita. Z-muuttuja on suunniteltu herkiksi vaihtoehtoiselle hypoteesille; tehokkaasti Z-muuttujan suuruus on suurempi, kun vaihtoehtoinen hypoteesi on tosi. Sillä välin 's' on skaalausparametri, joka mahdollistaa T: n jakauman määrittämisen. T-testin taustalla olevat olettamukset ovat, että a) Z noudattaa tavanomaista normaalijakaumaa nollahypoteesin alla; b) ps2 seuraa Ï ‡ 2 -jakaumaa p: n vapausasteella nollahypoteesin (jossa p on positiivinen vakio); ja c) Z-arvo ja s-arvo ovat riippumattomia. Tietyissä t-testityypeissä nämä olosuhteet ovat tutkimuksen kohteena olevan väestön seurauksia sekä tapa, jolla tietoja otetaan näytteistä.

Toisaalta varianssianalyysi (ANOVA) on tilastomallien kokoelma. Vaikka tutkijat ja tilastotieteilijät ovat pitkään käyttäneet ANOVA: n periaatteita, vasta vuonna 1918 Sir Ronald Fisher esitti ehdotuksen virallisen varianssianalyysin tekemiseksi artikkelissa "Sukupuolten välinen vastaavuus Mendelian perintönä". Sen jälkeen ANOVAa on laajennettu soveltamisalaan ja sovellukseen. ANOVA on tosiasiassa harhaanjohtava, koska se ei johdu varianssien eroista vaan ryhmien välisistä eroista. Se sisältää niihin liittyvät menetelmät, joissa havaittu varianssi tietyssä muuttujassa jaetaan osiksi eri lähteistä johtuviin komponentteihin.

Pohjimmiltaan ANOVA tarjoaa tilastollisen testin sen määrittämiseksi, onko useiden ryhmien keinot yhtäläinen ja tuloksena yleistää t-testiä useammalle kuin kahdelle ryhmälle. ANOVA voi olla hyödyllisempi kuin kahden näytteen t-testi, sillä sillä on pienempi mahdollisuus tehdä tyyppi I -virhe. Esimerkiksi useilla kaksinäytteillä varustetuilla t-testeillä olisi suurempi mahdollisuus virheen tekemiseen kuin samat muuttujat ANOVA, jotka saivat keskiarvon. Malli on sama ja testitilasto on F-suhde. Yksinkertaisemmissa termeissä t-testit ovat vain eräs erityinen ANOVA-tapaus: tekemällä ANOVA: lla on sama tulos useista t-testeistä. ANOVA-malleja on kolme luokkaa: a) Kiinteät vaikutukset, jotka olettavat, että tiedot ovat peräisin tavallisista populaatioista, eroavat vain niiden keinoin; b) Satunnaiset vaikuttamallit, jotka olettavat tietoja, kuvaavat eri väestöryhmien hierarkiaa, jonka eroja rajoittaa hierarkia; ja c) sekamuotoiset malleja, jotka ovat tilanteita, joissa sekä kiinteät että satunnaiset vaikutukset ovat läsnä.

Yhteenveto:

  1. T-testiä käytetään määritettäessä, ovatko kaksi keskiarvoa tai välineet samanlaisia ​​vai erilaisia.ANOVA on edullinen vertaamalla kolmea tai useampia keskiarvoja tai keinoja.
  2. T-testillä on todennäköisempää virheen tekemistä enemmän keinoja, joten ANOVAa käytetään verrattaessa kahta tai useampaa keinoa.