Tölfræði

Úr Wikipediu, frjálsa alfræðiritinu
Stökkva á: flakk, leita
Normalkúrfan er mikilvægt tæki ályktunartölfræðinnar.

Tölfræði er undirgrein stærðfræðinnar um söfnun, greiningu, túlkun, framsetningu og úrvinnslu á gögnum. Tölfræði er þverfaglegt hjálpartæki í rannsóknum í vísindagreinum sem byggja á megindlegum aðferðum hvort sem um er að ræða raunvísindi, hugvísindi eða félagsvísindi.

Hægt er að skipta tölfræði mjög gróflega í tvennt: lýsandi tölfræði og ályktunartölfræði. Lýsandi tölfræði er notuð til að lýsa eiginleikum tölulegra gagna, svo sem miðsækni og dreifingu þeirra. Ályktunartölfræði er hins vegar notuð til að draga ályktanir um tiltekin gögn, svo sem varðar ákveðna eiginleika sem þýði hefur, út frá upplýsingum sem fengust í úrtakinu. Þær breytur sem mældar eru skiptast í nafnkvarða, raðkvarða, jafnbilakvarða eða hlutfallskvarða.

Saga tölfræði[breyta]

Eitt af fyrstu dæmum þess að tölfræði hafi verið beitt er að finna í verkinu Observations on the Bills of Mortality eftir einn að brautryðjendum lýðfræðinnar, Bretanum John Graunt, sem kom út árið 1662. Ein helst ástæða þróunar í tölfræði var nauðsyn ríkisins á áreiðanlegum gögnum til þess að geta gert áætlanir fram í tímann.[1] Hvað mestur framgangur varð í notkun tölfræði á 19. öld og jókst hún jafnt og þétt í framhaldinu.

Hefð er fyrir því að tölfræði sé talinn aðskilin grein hagnýtrar stærðfræði frekar en undirgrein stærðfræði. Grundvöllur tölfræðinnar var lagður þegar Blaise Pascal og Pierre de Fermat settu fram kenningar sínar um líkindafræði á 17. öld. Carl Friedrich Gauss bætti svo við þekkingu undir lok 18. aldar. Tilkoma nútímalegra tölva með meiri reiknigetu en áður hefur orðið til þess að flókinn tölfræðilegur útreikningur er mun auðveldari en áður.

Tíðnidreifing[breyta]

Einkunnir nemenda í bekk
Einkunn 1 2 3 4 5 6 7 8 9 10 Alls
Tíðni 0 0 0 3 5 4 8 2 3 0 25
Hlutfall 0 0 0 12% 20% 16% 32% 8% 12% 0 100%
Samanlagt hlutfall 0 0 0 12% 32% 48% 80% 88% 100% 0 100%
Bilskipt tafla 0 3 9 10 3 25

Framsetning á gögnum getur verið margskonar. Sé um einföld töluleg gögn að ræða er hægt að búa til tíðnitöflu sem sýnir tíðni (e. frequency) breytanna. Í þessu dæmi einkunna sem nemendur hafa hlotið eru einkunnirnar raðaðar eftir stíganda, þ.e.a.s. þær fara hækkandi. Í fljótu bragði má sjá að fjórir nemendur hafa hlotið einkunnina 6. Hægt er að sjá fjölda nemenda með því að leggja tölurnar saman 0 + 0 + 0 + 3 + 5 + 4 + 8 + 2 + 3 + 0 = 25.

Samanlögð tíðni er mæld í prósentum og venjulega sett í sér dálk við hliðinni á hlutfallstíðninni. Hún virkar þannig að hlutfallstíðnin í prósentum er lögð saman við samanlögðu tíðinni í færslunni fyrir ofan. Hún hækkar því neðar á töflunna er litið og er ávallt 100% undir lokin.

Bilskipt tafla er framsett með þeim hætti að flokkar eru sameinaðir, sem getur verið þægilegt ef fjöldi mismunandi atriða er mikill eða óskað er eftir gögnum yfir eitthvað sem spannar stórt bil. Dæmi um þetta eru t.d. einkunnir tugi nemenda sem tóku ákveðið próf og síðan raðað eftir einkunnum. Þegar bil eru ákvörðuð er skýrast að hafa þau jafn löng en lengdin sem það spannar er kölluð billengd. Í billengd er tekið til greina alla lengdina sem tölubilið spannar, einnig þegar námundun er notuð. Sem dæmi má nefna bilin 0-4, 5-9 og 10-14 en billengdin í þessu tilviki er 5. Fyrstgreinda bilið spannar tölurnar -0,5 til 4,5, það næsta er 4,5 til 9,5 og það síðastgreinda 9,5 til 14,5. Í dæminu hér til hliðar eru fimm 2 billengdar bil.

Miðsækni[breyta]

Miðsækni (e. central tendency); meðaltal, miðgildi og tíðasta gildi, í lýsandi tölfræði veitir upplýsingar um dreifingu gagna.

Einkunnir nemenda í bekk
Gildi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Alls
Miðgildi 4 4 4 5 5 5 5 5 6 6 6 6 7 7 7 7 7 7 7 7 8 8 9 9 9 160

Miðgildi er gildi þess staks sem er í miðjunni. Til að reikna út miðgildi skal raða tölunum í beina línu í vaxandi röð, talan sem er í miðjunni er síðan miðgildið eða ef það eru tvær tölur í miðjunni, þá skal taka meðaltal af þeim. Hér til hliðar, í sama dæmi og að ofan, eru 25 tölur og því er tekið meðaltalið af tólftu og þrettándu tölunni. (6+7)/2 = 6,5

Til þess að fá meðaltal eru öll stökin lögð saman og síðan deilt með fjölda þeirra. Vandinn við þetta er að ekki er gert ráð fyrir s.k. útlaga, gildi sem eru óregluleg eða óvenjuleg. Þau gildi geta skekkt upplýsingar tökum dæmi af teningi sem er kastað þrisvar sinnum, upp koma tölurnar:

  1. 3, 3 og 3. Sem er ólíklegt en gefur meðaltalið 3. (3+3+3)/3
  2. 1, 3, og 5. Sem gefur einnig meðaltalið 3. (1+3+5)/3

Í dæminu sem við notumst við má gjörla komast að því að meðaltalið er: 160/25 = 6,4

Tíðasta gildi er, eins og nafnið gefur til kynna, sú breyta sem birtist oftast. Vert er að athuga að tíðasta gildið getur verið fleiri en eitt. Í dæminu hér að ofan er það 7 sem kemur 8 sinnum fyrir.

Dreifing[breyta]

Til þess að rýna betur í það mengi sem verið er vinna með er hægt að skoða dreifinguna (e. dispersion). Spönnin er fundin út með því að draga lægstu töluna frá þeirri efstu. Í dæminu hér að ofan er spönnin 9 - 5 = 4.

Einkunnir nemenda í bekk
Gildi 1-3 4-8 9-12 13-20 21-22 23-25 Meðalfrávik
Frávik 2,4 1,4 0,4 0,6 1,6 2,6 1,24

Meðalfrávik er mælikvarði á meðalfjarlægðinni frá meðaltalinu. Til að fá út meðalfrávik er fyrst fundið út meðaltalið, það dregið frá sérhverri tölu til að fá frávik hverrar tölu frá meðaltalinu, frávikin eru öll lögð saman án tillits til formerkja (mínus breytist í plús) til að fá heildarfrávik og á endanum er heildarfrávikið deilt með fjölda talna. (2,4 + 2,4 + 2,4 + ... 1,6 + 2,6 + 2,6 + 2,6) / 25 = 31 / 25 = 1,24

Formúla staðalfráviks
\sqrt{\frac{N \sum x^2 - (\sum x)^2}{N(N - 1)}} Þar sem: N = samanlagður fjöldi talna.

\sum x^2 = Tölur settar í annað veldi, síðan lagðar saman.

(\sum x)^2 = Allar tölurnar lagðar saman og útkoman sett í annað veldi.

Staðalfrávik er önnur aðferð til að finna út dreifingu talna í líkindalegri dreifingu (e. probability distribution), handahófskenndri breytu, þýði eða gagnasafni. Lástafur gríska bókstafsins sigma σ er oftast notaður til þess að tákna staðalfrávik (eða s í latneska stafrófinu). Staðalfrávik er skilgreint sem kvaðratrótin af frávikinu, eða dreifnin í öðru veldi. Staðalfrávik er því í raun meðaltal frávika, þ.e. hversu langt frá meðaltali stök eru að meðaltali.

Frávikshlutfall[breyta]

Frávikshlutfall er formúla sem er notuð til að bera staðalfrávik mismunandi talnahópa saman. Formúlan reiknar út hlutfall staðalfráviksins af meðaltalinu.

Formúlan er eftirfarandi:

Frávikshlutfall = \frac{s}{x} * 100

s = Staðalfrávik

x = Meðaltal allra talnanna

Tengt efni[breyta]

Tilvísanir[breyta]

  1. Samanber forskeytið „stat“ á orðinu yfir tölfræði í ensku, þýsku, dönsku og fleiri tungumálum.


Tenglar[breyta]

Einkennismerki Wikibóka
Wikibækur eru með efni sem tengist