Tilgátuprófanir, machine learning (lærdómur véla)

Jæja, eigum við að byrja? Heyrðu, okay í dag þá ætlum sem sagt að tala um hérna fyrsta lagi tilgátuprófanir og í öðru lagi hérna ætlum við fara í svona smá upphaf af hérna machine learning, og ég ætla bara svona að tala þar um bara svona almennar aðferðir og svona smá, svona yfirlit yfir hérna hvað machine learning snýst um í þessu sambandi sem við erum að fara að vinna með það þar sem maður er bara með svona flatt gagnasafn. En fyrst þá ætlum við aðeins að hérna klára þessa umræðu um hérna tölfræðina sem við byrjuðum á í seinustu viku og spjalla aðeins um sem sagt tilgátuprófanir og svo líka öryggisbil af því að oft þegar maður er sem sagt með einhver svona gögn og maður vill sem sagt draga einhverjar ályktanir út frá þessum gögnum, þá er maður að gera það með tilgátuprófunum og það eru til rosalega mikið af mismunandi tilgátuprófum og það er gott að vera svona hérna með í huga að þú veist hvað á við best hverju sinni og svona. Og það sem sáum í seiustu viku eða fyrirgefðu á mánudaginn var svona svoldið hérna það sem kallast ályktunartölfræði þar sem við erum bara að að taka saman svona upplýsingar í gagnasafninu okkar. En svo getur maður líka á hinn bóginn verið með sem sagt hérna það sem heitir inferencial statistics þar sem maður er að, er að sem sagt, já draga ályktanir út frá gögnunum og reyna svona að spá fyrir um eitthvað og líka að sem sagt álykta eitthvað um heildina út frá, sem sagt úrtakinu sem maður hefur. Af því maður hefur mjög sjaldan kost á því að að gera einhverjar mælingar á öllu þýðinu á öllu [population-inu] og þess vegna tekur maður úrtak og maður prófar eitthvað af úrtakinu sínu, og svo vill nota þær niðurstöður til að álykta eitthvað um allt þýðið þannig það er svona pælingin á bak við þessa ályktunartölfræði og þá er það sem sagt gert með svona hérna tilgátuprófunum, meðal annars eða með því að reikna öryggisbil eða að spá fyrir um óþekkt gildi til dæmis með svona línulegri aðfallsgreiningu og svoleiðis. En ef við bara förum í hérna tilgátuprófanir og um hvað það snýst þá er tölfræðileg tilgáta. Það er einhvers konar tilgáta sem er hægt að prófa út frá gögnunum sem við höfum. Og það er sem sagt módelað sem sagt, miðað við einhvers konar líkindadreifingu sem við gefum okkur að gögnin okkar fylgi og þannig það sem þarf er einhvers konar úrtak og má þarf einhverjar sem sagt ályktanir um þetta úrtak varðandi hvaða dreifingu það fylgir og og hérna og þetta er sem sagt er bara ákveðin hérna vinnubrögð og og svona fræði sem er búið að þróa þannig að þegar fólk talar um að eitthvað sé tölfræðilega marktækt þá þýðir það að það byggir á þessum grundvallar hérna já, reglum sem að er búið að þróa í á þessu sviði. Þannig að oft þegar maður heyrir hérna auglýsingar og svona þar sem þar sem fyrirtækin segja við erum ódýrari, við erum betri og svo framvegis, þeir segja aldrei neitt hversu mikið betri eða ákvað byggir á stóru úrtaki eða hvað þannig að þeim vantar kannski svona þennan hérna þennan tölfræðilega vísindilega grunn til þess til þess að hérna bakka upp sínar staðhæfingar. En ef maður gerir þetta rétt og notar þessar tölfræðilegar aðferðir þá getur maður sem sagt verið með réttan grundvöll fyrir svona staðhæfingum og allir sem að hérna eru að vinna í þessu þeir vita hvað þá það þýðir það sem maður er að segja þegar maður segir að hérna það eru níutíu og fimm prósent öruggt að okkar vara er betri heldur en ykkar eða ódýrari. Og þetta sem sagt byggir á þessum tilgátuprófunum sem að eru hérna og tilgátuprófanir byggjast á tveimur tilgátum. Annars vegar núll tilgátunni og hins vegar móttilgátunni og og þá er núlltilgátan, einhvers konar staðhæfing sem við erum að reyna að afsanna. Svo á móti kemur mót tilgátan sem er sem sagt mótstæð við núll tilgátuna og það er það sem við erum að reyna að sanna. Og þetta er bara sett upp svona út af hérna raunverulega stærðfræðin á bak við þetta. Það er yfirleitt þannig að við erum að reyna sem sagt að að afsanna núll tilgátuna til þess að hitt gildi og sem dæmi um þetta er til dæmis að, já, hérna erum við með núlltilgátu sem segir að meðalstærð heila hjá fólki sem reykir er sú sama og þeim sem reykir ekki og, og þá er mót tilgátan sem sagt andstæðan við þetta, um það að heilastærð reykingarfólks sé ekki sú sama og heilastærð fólk sem reykir ekki, þannig að yfirleitt er núlltilgátan, svona, svona einföld, hérna, staðhæfing sem er með sem sagt jafnt og merki hann er að bera saman eitthvað tvennt, og þá er mót tilgátan sem sagt allt hitt sem sagt fyllimengið af þessari núlltilgátu og eins og ég segi þetta er bara sett upp svona af því að út af sem sagt öllu á bak við þetta þá er einfaldara að, að sanna eða afsanna þessar staðhæfingar með því að setja þær upp sem sagt á þennan hátt. Og eins og ég segi líka þá erum við alltaf að reyna að sem sagt afsanna þessa núlltilgátu en svo hérna hafið þið líka heyrt þegar maður er með svona tilgátur að það er alltaf sagt með níutíu og fimm prósent vissu eða níutíu og níu prósent vissu. Og það er sem sagt sem gefur, svona, tilfinninguna fyrir því hversu örugg við erum með þessa [HIK: staðhæfing] staðhæfingu. Þá notum við þetta sem sagt significance level sem yfirleitt kallað alfa sem að sem sagt segir okkur hversu öruggt prófið er [HIK: tilgát] tilgátuprófið er og, og hérna, og þegar maður er, sem sagt í svona, hérna, tölfræðivinnslu þá yfirleitt ákveður maður fyrir fram hvaða, hérna, significance level, maður vill vera með hvort maður sé að vinna með níutíu og fimm prósent, eða níutíu og níu prósent og, og hérna, svo, sem sagt reiknar maður út p-gildið í prófinu sínu og ber það saman við þetta alfa gildi sem að maður var búinn að ákveða fyrir fram og svo segir maður út frá því hvort að þetta sé tölfræðilega marktækt, sko hvort þetta standist eða ekki, hvort við ætlum að hafna núlltilgátunni eða ekki. Og, og hérna, já, þannig að þetta byggir á þessu tvennu, að við, hérna, erum með sem sagt tilgátan, tilgátan okkar við reiknum út einhvers konar p-gildi. Svo berum við p-gildið saman við þetta significance level og út frá því ákveðum við hvort við ætlum að hafna eða ekki hafna. Og hér er sem sagt eitt dæmi um svona tilgátu próf þar sem að einhver, hérna, vísindamaður ætlar að, að, hérna, prófa eftirfarandi tilgátu: Hann sem sagt er að planta tómötum, þessi maður, og hann vill vita hvort að tómatarnir, hérna, vaxi hraðar eftir því hvort hann gefi þeim áburð eða ekki. Og þá setur hann fram þessar, þetta tilgátupróf þar sem núlltilgátan er að, hérna, tómatarnir þeir vaxa ekki hraðar ef hann setur áburð í moldina og þá er móttilgátan að, sem sagt, andstæða, að þeir vaxi hraðar þegar hann setur, sem sagt áburð í moldina og auðvitað náttúrlega þegar hann er að setja upp þessa tilraun sína þá þarf hann að vera svolítið passasamur með það hvenær hann plantar hann þarf náttúrulega að planta þessum plöntum á sama tíma þannig að þarf líka að passa það að þær fái jafn mikla sól og það sé jafnmikill, mikið vatn og svona þannig að hann þarf aðeins að pæla líka í hvernig hann setur upp tilraunina sína til þess að vera viss um að niðurstöðurnar séu marktækar en ef hann gerir það og svo lætur hann helminginn af tómötunum fá áburð og hinn helminginn ekki fá áburð og mælir svo hreinlega hversu hratt þessir tómatar vaxa. Þá er hann kominn með sem sagt einhvern grundvöll til þess að prófa þetta og, og hérna, hann sem sagt fær út þetta að líkurnar á því að að, hérna, niðurstöðurnar passi ekki við núlltilgátuna séu níutíu og sex prósent, en af því að hann ákvað að vera með sem sagt fimm prósent significance þá, hérna, ákveður hann að að hafna núlltilgátunni af því þið sjáið muninn á níutíu og sex og fimm prósent. Já og kannski ágætt að hafa í huga sem ég talaði um áðan, að significance level mundi vera níutíu og fimm prósent. En þá er það raunverulega öryggið sem við erum með en significance-ið mundi vera þá fimm prósenta, þegar hundrað mínus fimm, það er sem sagt allt sem er fyrir utan, þannig við erum, ég er að tala um, já, þetta er svona svolítið talað um þetta sem sagt á sama tíma, annaðhvort fimm prósent eða níutíu og fimm prósent, eitt prósent eða níutíu og níu prósent. Fer eftir því hvernig maður er að orða þetta. En en sem sagt í þessu tilfelli þá hafnar þessi maður sinni núlltilgátu af því að hann fær út þetta níutíu og sex prósent, hérna, test statistic. Ókei, en hvernig reiknum við út þessar líkur til að bera saman við significance level-ið okkar? Það eru bara ákveðnar reglur sem maður fylgir til þess að reikna það út og, sem sagt bara nokkur skref. Og í fyrsta lagi þá náttúrulega erum við með úrtakið okkar þar sem við erum að mæla þetta. Við erum með þessa tómataplöntu sem við mældum tímana á hversu hratt þær uxu. Og, já, þannig að við reiknum sem sagt við pælum í hvaða tölfræðilegu, hérna, ályktanir við erum með og út frá þessu þá vitum við sem sagt út frá gögnunum sem við erum með þá vitum að þá drögum ályktanir um það hvaða, hérna, hvaða dreifingu þau fylgja og voðalega oft þá er maður að vinna með normaldreifingu, m maður getur líka verið að vinna með t dreifingu ef að ef að hérna úrtakið er frekar lítið en út frá, sem sagt úrtakinu okkar, þá reiknar maður það sem heitir sem sagt test statistic og maður sem sagt gefur sér eitthvað um það hvaða dreifingu þessi, þetta test statistic fylgir ef að núlltilgátan ,sem sagt stendur og af því að við erum komin með þetta eina gildi sem heitir test statistic út frá úrtakinu okkar og við erum búnir að gefa okkur eitthvað um það hvaða dreifingu þetta gildi mundi fylgja ef að núlltilgátan heldur þá getum við reiknað út sem sagt þessar líkur sem við þurfum til þess að bera saman við alfað okkar. En ég mun taka dæmi um þetta á eftir. En alla vegana þá, hérna, sem sagt þegar við erum komin með test gildið okkar þá getum við reiknað út p-gildið fyrir þetta test gildi sem að þið sjáið svona myndrænt hér aðeins að þetta mundi til dæmis vera normaldreifing og í þessu tilfelli þá erum við að nota alfa sem svarar til þessa svæðis, sem sagt rauða svæðis undir kúrfunni þar sem að, sem sagt þetta þetta rauða svæði undir kúrfunni það er raunverulega fimm prósent af öllu svæðinu undir þessari kúrfu. Þannig að allt hérna sem er ekki rautt það eru þessi níutíu og fimm prósent. En undir þessu rauða er þessi fimm prósent sem svarar til raunverulega significance level-sins okkar og svo reiknuðum við út eitthvað, hérna, z-gildi út frá úrtakinu okkar og þetta z-gildi er það sem kallar test statistict, sem sagt byggir á úrtakinu. Og við getum fundið út frá, já, og við gefum okkur að það fylgir sem sagt normaldreifingu í þessu tilfelli, og við getum fundið p-gildi fyrir þetta ákveðna z-gildi. Bara með því að sjá hversu mikið af kúrfunni er er sem sagt ef maður heildar alla kúrfuna eða þú veist þarna flatarmálið undir kúrfunni upp að þessu z þá mundi það vera p-gildið okkar og þá getum við borið p-gildið saman við alfað og í þessu tilfelli þá mundi p-gildið vera raunverulega stærra heldur en, heldur en significance level-ið af því að þið sjáið það að flatarmálið þetta strikaða það er stærra heldur en, heldur en, sem sagt þetta rauða. vona getur maður sem sagt séð þetta fyrir sér myndrænt. En nú er ég búinn að vera minna svolítið á að z-gildi eða z-scores og það er einhver svona, já, svona, hérna, parameter sem maður getur reiknað út frá gögnunum sínum og maður er sem sagt að bera úrtakið eða gögnin saman við normaldreifingu og þá er þetta svona gildi sem að maður getur séð hvernig talan manns, sem maður er með eða úrtakið manns er miðað við alla dreifinguna. Og ef þið horfið á normaldreifinguna þá hefur hún þann eiginleika ef við erum hérna með, sem sagt meðaltalið. Þetta er meðaltalið hérna, sem sagt miðjan á dreifingunni þá, og við reiknum út staðalfrávikið þá er, sem sagt erum við með, sem sagt hérna megin hérna erum við með eitt meðaltal mínus eitt staðalfrávik og hérna megin erum við með eitt meðaltal plús eitt staðalfrávik og þið sjáið að hún er alveg symmetrísk alveg um miðjuna og normaldreifingin hefur þá eiginleika að innan eins staðalfráviks frá meðaltalinu, sem sagt sitt í hvora áttina eru sextíu og átta prósent af öllum gögnunum. Öllu dreifingunni. Flatarmálið undir þessu hérna, hérna á milli eru sextíu og átta prósent. Og svo þegar við förum tvö staðalfrávik frá meðaltalinu þá erum við komin með níutíu og fimm prósent af allri dreifingunni. Þannig að flatarmálið hérna milli µ mínus tveir sigma og upp í µ plús tveir sigma er níutíu og átta prósent. Og svo ef við förum aðeins lengra út þá kemur alltaf meira og meira. Þannig að þegar við erum komin upp í þrjú staðalfrávik þá erum við komin með níutíu og níu komma sjö prósent líkur á því að vera sem sagt þarna inni á þessu inná þessu svæði. En hvað er yfirleitt hægt að gera með z-gildi? Jú z-gildi eru svona leið til að staðla gögnin okkar til þess að færa þau, sem sagt yfir á þetta normaldreifingarform. Þannig að ef við erum með eitthvað úrtak úr, úr þýði, þar sem þýðið hefur meðaltalið µ og staðalfrávikið sigma þá getum við tekið, hérna, úrtakið okkar og reiknað meðaltalið á því, og svo ef við drögum frá sem sagt meðaltal þýðisins og deilum með staðalfrávikinu þá fáum við út þetta z-score og við getum borið það saman við meðaldreifingunna. Þannig að ef þið ímyndið ykkur að í einhverjum kúrs er meðaleinkunnin sex og staðalfrávikið er einn. Og svo kemur einhver nemandi og hann fær út sjö í prófinu og hann vill vita hvernig hann, sem sagt er miðað við alla hina. Þá getur hann notað þessa aðferð til þess að reikna út hvernig hann er miðað við alla hina, þannig að hann mundi þá taka sem sagt sjö mínus sex og deilt með einum þannig að það mundi þá vera sex og það þýðir þá að hann mundi vera, sem sagt sex staðalfrávikum, raunverulega, frá, fyrirgefið einu staðalfráviki frá öllu þýðinu, frá, miðað við alla hina. þannig að, svona, sjö mínus sex er einn en ekki sex. En allavegana, hérna sjáið þið þetta miðað við normaldreifinguna. ið vorum hérna áðan í, sem sagt efstu línunni þar sem við erum með normaldreifinguna hér. Þegar við reiknum z-score-in þá erum við í raun búin að færa þau yfir á þetta hérna form, og þá vitum við að ef z-score-ið okkar er einn þá erum við hér og ef z-score-ið er tveir þá erum við hér og svo framvegis. Þannig að við vitum hvernig okkar úrtak er miðað við alla normaldreifingunna. Já, þannig að eins og við segjum hérna þá er sem sagt z-gildið segir þér hversu mörg staðalfráviki þú ert frá, frá meðaltali, meðaltalinu og, og það kallast að, sem sagt, eins og ég sagði að staðla og þetta er oft sem gerir við gögn áður en maður byrjar að vinna með þau er maður staðlar þau til þess að koma þeim inn á inn á þetta inn á þetta, sem sagt sama bil þannig að séu öll á sama level-inu þannig að þið ímyndið ykkur að, að til dæmis ef við mælum hæð í sentimetrum og, og segjum skóstærð bara í skónúmerum raunverulega, þá er miklu meira, sem sagt tölurnar í hæðinni eru miklu dreifðari heldur en skóstærðirnar því skóstærðirnar eru kannski á bilinu hvað þrjátíu og sex upp í fjörutíu og sex meðan hæðin getur, hérna, hefur miklu meira, miklu meira range og ef við stöðlum báðar þessar stærðir þá komast þær, svona, inn á raunverulega sama level þannig að það er betra, kannski auðveldara að bera þær saman. Þannig að ímyndið ykkur að ef við erum ef við erum að spá í skóstærð þá er munurinn á, á, þú veist, fjörutíu og fjörutíu og tvö það eru bara tvær tölur, sem sagt, já, raunverulega tvær stærðir á milli. En það lýsir miklu stærri mun heldur en munurinn á hundrað og sextíu og hundrað og sextíu og tveimur, þótt það sé líka bara tvær einingar þannig ef við, svona, stöðlum þetta þá kemst það svona allt saman á sama level-ið svolítið þannig að það auðveldara að bera saman mismunandi breytur. En já, en við sjáum líka smá útúrdúr en þegar við erum búin að nota þessi z-score, þá getum við, sem sagt flett upp þessum líkum hversu mikið svæði er undir kúrfunni eða það er hægt að muna þessar þumalputtareglur hér að, sem sagt sextíu og átta prósent af dreifingunni er innan eins staðalfráviks, sem sagt er hér. hérna erum við með sextíu og átta prósent massans ef við heildum flatarmálið undir körfunni. Innan tveggja staðalfrávika eru níutíu fimm prósent og innan þriggja staðalfrávika eru níutíu og sjö og hálft prósent. og þetta er svona kannski bara, já, tölur sem er ágætt svona að hafa bara í huga. Maður getur alltaf alltaf flett þeim upp en þetta er bara svona, já, reglur um normaldreifinguna. Og við tökum nú dæmi hvernig við mundum gera þetta í praktís. Ef við erum með einhverja bíla sem eru að keyra eftir Miklubrautinni og, hérna, og það, sem sagt er búið mæla það bara yfir einhvern tíma að meðalhraði bíla er áttatíu kílómetrar á klukkustund. Og staðalfrávikið á þessum hraða eru átta kílómetrar á klukkustund. Ókei, og svo ef við tökum einn bíl af handahófi og mælum hvað hann er hratt, fer hratt. Hverjar eru líkurnar á því að hann sé að keyra á níutíu kílómetra hraða eða minna þannig að raunverulega sem við viljum vita eru hverjar eru líkurnar á því að hraðinn á þessum, sem sagt þessum bíl sem við veljum af handahófi sé minna eða jafnt og níutíu. Og núna erum við, sem sagt að gefa okkur að þetta sé, sem sagt normaldreift. Og það sem við byrjum á að gera er að reikna þetta z-score með því að bara setja inn í inn í formúluna en núna erum við bara með sem sagt einn bíl þannig að meðaltalið er bara níutíu, við erum ekkert að pæla í neinu úrtaki meira en það er bara eitt, einn bíll í úrtakinu og þá getum við umskrifað þetta. Svo segjum við að líkurnar á því að z sé minna en eða jafnt og níutíu mínus áttatíu deilt með átta og þá erum við búin að staðla þennan hraða á þessum bíl með því að z-score og þá getum við notað, sem sagt þessa stöðluðu normaldreifingunni til þess að reikna þessar líkur og þá ef við pælum í því hvernig þetta lítur út munið þið við vorum með normaldreifingunna sem var svona eftir því sé staðlað þannig að það mundi vera núll og okkar gildi hérna z-score-ið okkar einn komma tuttugu og fimm. Þannig að við erum svona sirkabát einhvers staðar hér einn komma tuttugu og fimm og núna viljum við reikna þetta hérna flatarmál. Þetta er raunverulega það sem við viljum finna, til þess að finna þessar líkur. Og, og þetta er eitthvað sem við getum bara flett upp í töflum eða við getum reiknað það. Það eru hérna vefsíður þar sem maður getur reiknað svona líkur þannig að þegar þið ýtið á þessa linka í glærunum þá komist þið inn á svona síðu sem þið getið reiknað þetta eða þið getið bara farið í Python, einfaldlega, einfaldlega farið í Python og notað, sem sagt, hérna, þetta normfall úr SciPy stats pakkanum og kallað svo á, sem sagt bara norm sem er normaldreifingin og cdf-ið sem við vorum að tala um í seinustu viku af einum komma tuttugu og fimm og þá reiknar, sem sagt þetta flatamálið undir ferlinum upp að einum komma tuttugu og fimm. Og þá fáum við út líkurnar áttatíu og níu komma fjögur prósent þannig að spurningin var: hverjar eru líkurnar á því að bíll valinn af handahófi sé að keyra á níutíu kílómetra hraða eða minna? Mundi þá vera áttatíu og níu komma fjórir og í þessu tilfelli þá vorum að gefa okkur, sem sagt að, hérna, þessir bílar sem eru að keyra miklubrautinni, hraði þeirra hann fylgir normaldreifingu með meðaltal áttatíu og staðalfrávik átta. En svo, hérna, er ekki alltaf allt normaldreifð. Stundum þarf maður að vinna með aðrar dreifingar eins og til dæmis t dreifinguna. Þetta eru ekki glærur frá mér, sko, þetta kemur frá Magnúsi en, en, hérna, sem sagt t-dreifingin hún var fundin upp af þessum manni sem hét, hérna, já, W S Gosset og hann kallaði sig stúdent og hann, sem sagt var í einhverju svona verknámi í Guinness-verksmiðjunni þar sem þeir sem sagt voru að sponsor-a einhverja, svona, já, afburðanemendur af því að þeir vildu sem sagt optimize-a workflow-ið sitt og, og svoleiðis. Þannig þeir buðu, buðu afburðanemendum í stærðfræði og tölfræði að koma til sín og hjálpa sér og þar var þessi Gosset karl að vinna, sem sagt með einhver gögn og þróaði þessa, þessa, hérna dreifingu sem heitir students t dreifing og hann sem sagt hann skrifaði einhverjar fræðigreinar og eitthvað um þetta. En hann vildi ekki koma fram undir nafni þannig að student var hérna sem sagt svona já, ghostname-ið hans eða þannig. En alla veganna þá þróaði hann þessa t dreifingu sem að, hérna, er mjög tengd normaldreifingunni nema hún, maður notar hana þegar maður veit ekki staðalfrávik þýðisins af því oft þannig líka að þegar maður er í þessum tölfræðipælingum að maður veit ekki hvað staðalfrávikið er og þegar maður notar normaldreifinguna þá verður maður að gefa sér að maður viti hvað staðaldreifingin er, staðalfrávikið er en ef maður veit það ekki þá nota maður, þá notar maður t dreifinguna og , og það á líka, sem sagt við um það þegar maður er með, sem sagt lítil úrtök, kannski bara tíu eða, eða færri, og í staðin fyrir að reikna z gildi þá reiknar maður t gildi með þessari jöfnu hér þar sem að þið sjáið að munurinn er að við erum aftur með, sem sagt meðaltal úrtaks mínus meðaltal þýðis þarna uppi á strikinu en undir strikinu erum við núna með, sem sagt staðalfrávik úrtaksins deilt með kvaðratrótin af n þar sem n er stærð úrtaksins og þegar maður gefur sér að test statistic-ið, sem sagt uppfylli núlltilgátuna þá, þá sem sagt fylgir hún t dreifingunni. Þessi, þessi stærð hér. Og hérna sjáum við t dreifinguna. Hún líkist mjög normaldreifingunni. Reyndar er þessi bláa kúrfa það er normaldreifingin og þessi rauða og þessar grænu eru t dreifing með mismunandi, hérna, freedoms, nei, frígráðum, sem sagt degrees of freedom og þetta degrees of freedom það, sem sagt er háð úrtaksstærðinni. Þannig að ef við erum með úrtak með sex, sex breytum, eða það er að segja sex úrtakastærð sex, þá er þetta degrees of freedom það er sem sagt sex mínus einn eða fimm. Þannig að, já, degrees of freedom er alltaf sem sagt stærð úrtaksins mínus einn. Þannig að ef við værum með úrtakastærð, til dæmis ellefu hvað mundi degrees of freedom vera? Ef það er n mínus einn? Tíu. Nákvæmlega. En þið sjáið það að, sem sagt þessi t dreifing hún líkist normaldreifingunni. Hún er líka svona symmetrísk um miðjuna en hún nær ekki jafnhátt upp og halarnir þeir eru aðeins feitari. Og það þýðir raunverulega að, að, hérna p-gildin okkar þau verða aðeins, þau verða aðeins, sem sagt stærri. Þannig að það eru meiri, sem sagt líkur á því raunverulega að maður hafni ekki núlltilgátunni. En þegar úrtakstærðin stækkar verður stærri og stærri og stærri þá nálgast t dreifingin normaldreifinguna þannig að sem sagt þessar kúrfur sem eru neðst hérna mundu raunverulega vera, hérna, t dreifing með fáum degrees of freedom og svo aukast þær eftir því sem toppurinn eykst og svo þegar n stefnir óendanlegt þá verður þetta normaldreifingin. Og hér er dæmi um þetta þar sem við mundum nota t dreifinguna. Hann, hérna, Ari rektor, hann segir að allir sem að útskrifaðist úr HR séu með, hérna, að meðaltali tvö hundruð dollara í tímakaup og, hérna, hann segir ekkert um staðalfrávikið. Hann bara segir þetta. Þetta er meðaltalið. Og svo fer ég og ég spyr níu nemendur sem eru búnir að útskrifast hvað þau séu eiginlega með í tímakaup og reikna út þeirra meðaltal úr þessu úrtaki að þeirra meðaltali sé hundrað og áttatíu dollarar og sem sagt staðalfrávik úrtaksins eru þrjátíu dollarar og svo spyrjum við okkur: Hverjar eru líkurnar á því að, sem sagt meðallaun útskrifaðra nemenda séu stærri en hundrað og áttatíu og eins og þið sjáið hér þá erum við ekki, vitum við ekki hvað staðalfrávik úrtaksins er, nei, fyrirgefðu, staðalfrávik þýðisins er, bara úrtaksins og við erum með úrtakastærð níu. Þannig að við ætlum að nota t dreifinguna og við byrjum á að reikna t-score-ið okkar sem að er, sem sagt hérna t þar sem við tökum x mínus [mu] deilt með staðalfráviki úrtaksins deilt með kvaðratrótinni af stærð úrtaksins og fáum þarna út tvo. En við þurfum að vita eins og áður hvað, sem sagt p-gildið er með því að reikna þetta flatarmál undir kúrfunni og það gerum við eins og áður með því að fletta upp þessu gildi það er hægt að gera það í töflu, það er hægt að gera það á, hérna, alls konar síðum á netinu en líka bara í Python. Þannig að núna ef við erum með, sem sagt importum við þessu t úr SciPy stats og á sama hátt þá reiknum við cdf-ið af gildinu mínus tveir, af því að það var t gildið okkar. En takið eftir því að við erum með átta. Af hverju erum við með átta þarna líka? Já, af því að t dreifingin hún, sem sagt tekur tvo parametra, annars vegar t gildið okkar og hins vegar hversu margar degrees of freedom. Degrees of freedom er alltaf einn. Einu minna heldur en stærð úrtaksins og við vorum með úrtakastærð níu þannig að við erum með átta gráður hér í þessu tilfelli. Og þá fáum við út, sem sagt einhverjar líkur, já, fjögur prósent líkur og það er þá í raunverulega, hérna, flatarmálið upp að significance level-inu okkar og ef við ætlum að vera með fimm prósent significance level ætlum við að hafna eða ekki hafna? Er þetta rétt eða er þetta ekki rétt miðað við okkar úrtak? Þetta er ekki rétt. Við, sem sagt getum hafnað núlltilgátunni í þessu tilfelli. Ókei. Og eitt tilgátupróf í viðbót sem heitir key squared. Þetta er bara önnur dreifing sem ég ætla að sýna ykkur með smá dæmi. Þetta er til dæmis notað til þess að bera saman hvort að, sem sagt svona faktor level séu, séu, hérna, óháð eða ekki. Þannig að ef við erum til dæmis með með, eins og hérna stendur, með kyn og hversu, hérna, empathetic fólk er, þá getum við séð hvort það sé einhver fylgni á milli þessara tveggja breyta. Það er kannski oft að sagt að konur hafi svona meira empathy heldur en menn og þetta var sem sagt þetta próf sem maður getur notað til þess að prófa þessa staðhæfingu. Key squared dreifingin eða key kvaðrat hún lítur svona út. Hún er líka byggð á mismunandi, sem sagt degrees of freedom. Hérna sjáið þið nokkrar, sem sagt variation-ir fyrir mismunandi degrees of freedoms en hún, sem sagt er ekki svona symmetrísk eins og bæði t og normaldreifingin. Hún er, hérna, svona, já, feit hérna á einum stað svo er hún með hala í aðra áttina en ekki í báðar áttir, sem sagt bara, tekur bara jákvæð gildi. Og key kvaðrat, sem sagt test statistic-ið er reiknað svona. Ég skal fara aðeins á næstu glæru til að útskýra þetta. Í þessu tilfelli þá erum við, sem sagt með fimm hundruð einstaklinga í Bandaríkjunum valdir af handahófi og þeir eru spurðir út í sitt álit á einhvers konar, hérna, já, svona tax reform bill og svo sjáið þið niðurstöðurnar að demókratar þeir eru, hérna, mikið hlynntir þessum breytingum. Það eru sem sagt einhverjir sem er alveg sama og ekkert voðalega margir sem eru á móti á meðan repúblikanar þeir eru akkúrat öfugir. Það eru færri sem eru samþykkir þessu heldur en eru, sem sagt mótfallnir þessu. Þannig ef við horfum bara á þessa töflu þá getum sem sagt við gert okkur í hugarlund að það sé munur á skoðunum fólks í þessum tveimur flokkum og, hérna, og hérna sjáum við hvernig þetta mundi vera bara myndrænt. Við erum með, sem sagt þessi, þessar þrjár skoðanir hérna: Að vera hlynntur, alveg sama og á móti þar sem að, hérna, þessir grænu eru republicans og þessir rauðu eru demókratarnir og þið sjáið bara ef þið horfið á þessa mynd að það eru svona eiginlega alveg merki um það að, að það sé, sem sagt fylgni á milli þessara tveggja breyta, skoðunarinnar og stjórnmálaflokksins. Nema það að við getum prófað þetta með þessu key squared testi þessu key kvaðrat testi. Þar sem við reiknum út, aftur, þetta test statistics og með þessum hætti, þar sem þetta o og e byggir á þessari töflu sem þið sjáið hér. Þannig að o er það sem er [observed] þar sem við mælum á meðan [expected] er það sem við mundum búast við. Og svo á sama hátt, aftur, þá finnum við p-gildið með því að finna sem sagt gildi úr úr töflunni þar sem að degrees of [freedom] er r mínus einn sinnum c mínus einn þar sem r stendur fyrir [rows] og sé stundum fyrir [columns] þannig að hversu margar raðir í töflunni erum við með og hversu marga dálka í töflunni erum við með Þannig að í þessu tilfelli við getum, sem sagt [UNK] sleppi ég að spá í þessu totals því við erum bara búin að reikna út heildarfjöldann ef við spáum bara í, sem sagt þessa mismunandi flokka. Þá sjáum við það að við erum með tvær raðir og þrjá dálka. Þannig að hvað mundum við vera með margar degrees of freedom í þessu tilfelli, ef það er n mínus einn sinnum c mínus einn? R mínus einn er einn og c mínus einn er tveir. Af því við erum með þrjá dálka. Þannig við myndum vera með tvisvar sinnum eitt degree of freedom, sem eru tveir. Og í þessu dæmi þá mundi þetta vera sem sagt núlltilgátan okkar. Þessar tvær breytur, party og view, sem sagt hvaða stjórnmálaflokki þú [HIK: fylg] fylgir og hvaða skoðun þú hefur. Núlltilgátan er sú að þessar tvær breytur séu óháðar, sem sagt ef önnur, hún fylgir ekki hinni og ef að h núll er raunverulega rétt, ef að hún stenst, þá mundu við búast við því að niðurstöðurnar væru þessar hér, ekki satt? Að þessar þrjár tegundir af skoðunum, þær eru saman innan þessara tveggja flokka. Dreifingin er sú sama. En það sem við mældum þegar við fórum og spurðum fólk var þetta hérna. Þannig að þið sjáið alveg að það er greinilegur munur á því sem maður myndi búast við og því sem við mældum. Og þetta er í raun veru það tvennt sem við erum að bera saman í þessu tilfelli. Það sem við búumst við og það sem við mældum. Og hérna sjáið þið hvernig við reiknum það sem við búumst við, þetta expected. Er að við tökum raunverulega bara heildargildin, sem sagt hversu margir í heildina voru, hérna, sammála og hversu margir í heildina voru demókratar og deilum með heildinni eins og þið sjáið þarna uppi: Tvö hundruðu áttatíu og fimm, sem eru þessi tvö hundruð áttatíu og fimm sinnum tvöhundruð og tveir deilt með fimm hundruð. Þannig að þetta er það sem við myndum búast við að fá ef það væri engin fylgni á milli og við gerum það sem sagt fyrir alla reitina. Og svo bara fyllum við inn í formúluna fyrir key kvaðrat test gildið okkar. Þannig að við tökum raunverulega, en sjáið þarna fyrsta, það mundi vera hundrað þrjátíu og átta, sem að er þessi hundrað þrjátíu og átta hérna, democrat favor, og við drögum frá hundrað og fimmtán komma fjórtán, sem að er expected value fyrir democrat in favor og svo framvegis og leggjum það allt saman saman. Þá fáum við út test gildið okkar og svo flettum við upp gildinu í töflu eða notum Python, og hérna sjáiði hvernig við gerum þetta í Python þá erum við með þessa key tveir cdf af þessu gildi og tveimur free gráðum og fáum út, sem sagt mjög stóra tölu eða það er þessa tölu sem er mjög nálægt einum en við þurfum svo að draga einn, sem sagt draga hana frá einum til þess að fá líkurnar útaf því við erum sem sagt að finna flatarmálið hér en ekki hér, sem sagt út úr þessu kemur núll komma núll núll einn og, og hérna og við getum hafnað núlltilgátunni og við getum sagt eins og við vorum búin að sjá út frá gögnunum að það er fylgni á milli skoðunar og stjórnmálaflokks. hérna í í í Jupyter eða, þú veist, í [HIK: work] notebook-inu sem er á, á Canvas þá er farið í gegnum það hvernig maður getur reiknað þetta líka bara í því að nota staðlaðar aðferðir í Python. En alla vegana, sama hvað þið eruð að prófa, þá eru þetta yfirleitt sama, sama aðferðin að maður reiknar út test statistic út frá úrtakinu sínu. Maður notar það test statistic til að finna út p-gildi, p-gildið er háð dreifingunni sem við erum að nota, og svo ber maður p-gildið saman við significance-ið sem maður er að, sem sagt, er búinn að ákveða fyrir fram að eigi að vera. Þannig að þetta eru þessi þrjú skref og þegar maður ber saman test, nei, p-gildið og significance level-ið út frá því ákveður maður hvort maður hafni núlltilgátunni eða ekki. Ókei, svo aðeins um öryggisbil þau eru, sem sagt aðferð til þess að mæla, hérna, svona, já, óöryggi sem að tengist mati á stika. Þannig að ímyndum okkur sem svo að við viljum vita hver meðalhraði bíla af Miklubrautinni er og við tökum úrtak, við mælum hraðann hjá hundrað bílum og við ætlum að nota þetta sem, sem sagt mælikvarða á meðaltala, meðaltal þýðisins. Og þá getum við reiknað út öryggisbil fyrir þetta meðaltal sem við reiknum í úrtakinu okkar. Og þá getum við sagt, þú veist, að níutíu og fimm prósent viss um það að hið sanna meðaltal liggi inni í þessu bili þannig að þetta lítur einhvern veginn svona út, að við erum með, sem sagt þýði með óþekkt meðaltal. En við vitum hvað staðalfrávikið er þá reiknum við út öryggisbil fyrir meðaltalið með þessari jöfnu hér við erum með meðaltal úrtaksins og svo leggjum við og drögum frá sitt hvoru megin, annars vegar, hérna, z-gildið sinnum staðalfrávikið deilt með stærð úrtaksins, kvaðratrótina af því, og drögum frá þannig að þið getið ímyndað ykkur það ef ef, hérna, meðaltalið er hér einhvers staðar þá erum við að leggja við erum að taka þessa tölu sitthvoru megin við þetta meðaltal ég ætla að fá út einhvers konar bil. tilfelli þá erum við með einhvern nemanda sem er að, já, hann er að gera einhverjar efnafræðitilraunir. Hann er að mæla sem sagt suðumark á einhverjum vökva og hann mælir þessi hérna gildi. Og h Og hann vill reikna öryggisbil fyrir suðumark þessa vökva út frá gögnunum sínum og þá notar hann sem sagt þessa aðferð. Og þá fær hann út sjáið þið bil hérna meðaltalið er hundrað og einn komma tveir svo plús mínus einn komma sex fjórir fimm sinnum núll komma fjörutíu og níu. Þannig að meðaltalið liggur þá hérna á þessu bili og athugið það að svona öryggisbil þau eru líka alltaf háð, sem sagt þessu significance level-i hversu örugg við erum um það að, að, hérna, talan liggur þarna og athugið það líka að, að, sem sagt eftir því sem við erum minna örugg því minna verður bilið af því til þess að vera hundrað prósent örugg um að talan sé í bilinu þá náttúrulega þurfum við að hafa allan, allar rauntölurnar með. Þannig að ef við erum því öryggari sem við erum því stærra er bilið og því minna örugg sem við erum því minna getur bilið verið. Þetta er svolítið, hérna, flott síða sem ég bendi ykkur á að kíkja á þar sem maður sér svona á myndrænan hátt ýmiss konar, ýmiss konar tölfræðileg atriði sem við erum búnir að tala um. Þannig ef við förum til dæmis hérna í chapters og ég ætla að fara í þennan hér. ið förum í, hérna, í sem sagt öryggisbila estimation þá getum við hérna til þess að meta öryggisbilin þá getum byrjað á því að velja okkur hvaða dreifingu við viljum þannig að við erum með normaldreifinguna. Ég er að sýna ykkur eitthvað, já. Sorry. Ég ætlaði að sýna ykkur. Já hérna, fyrirgefðu. Ég ætla að fara bara aftur á, á, hérna, Já, sem sagt við erum með hérna, hvar er þetta? Já, sem sagt normaldreifinguna og hvað viljum við stór, stórt úrtak hvað er significance level-ið okkar? Og svo getum við startað eða byrjað að sampla hérna og þá, sem sagt sjáið þið að við erum með dreifinguna og það kemur alltaf úrtak af stærð níu úr þessari dreifingu. Og við sjáum hversu vel þetta úrtak er að meta meðaltal dreifingarinnar. Meðaldreifing er náttúrulega, er þessi, hérna, punktalína þetta µ og þið sjáið það að stundum þá fellur öryggisbilið fyrir utan en yfirleitt þá fellur þar fyrir innan og við erum með þarna [alpha] sem er núll komma níu. Þannig að þið getið ímyndað ykkur að, að, hérna, sem sagt í eitt [HIK: pró] nei, fyrirgefðu, í tíu prósent tilfella þá mundi öryggisbilið falla fyrir utan af því að þeir eru, sem sagt níutíu prósent líkur á því að meðaltalið sé í úrtakinu og þá tíu prósent líkur á því að það sé ekki í úrtakinu. Ókei, þannig að ég ætla bara að stoppa þetta og, og ef við kíkjum svo aðeins áfram. Á, sem sagt týpur af error þegar við erum að hafna og ekki hafna núlltilgátum þá eru, sem sagt mismunandi möguleikar. Það getur verið að við séum að hafna núll, núlltilgátunni þegar að, hérna, hún er sönn. Þegar við ættum ekki að hafna henni og þá erum við með, sem sagt type eitt error. Og svo hins vegar getur verið að við höfnum henni ekki þegar hún er röng. Og þá gerum við error af týpu tvö og hérna, sem sagt erum við með, false positive hérna erum við með false negative en svo í hinum tilfellunum þegar við erum með núlltilgátu sem við höfnum ekki og hún er rétt, þá erum við með eitthvað sem er rétt gert og eins ef við höfnum rangri tilgátu þá er það líka rétt. Þannig að mér finnst mjög ágætt að horfa á þessa mynd þegar ég er að velta þessu fyrir mér að, sem sagt hérna eru einhverjir sem eru í, sem sagt ólettuprófi og annars vegar erum við með hérna false positive, þessi karl hérna hann fékk niðurstöðurnar úr sínu prófi að hann væri ófrískur á meðan konan hérna hinum megin sem er komin, þú veist, sjö mánuði á leið hún fór í óléttupróf og fékk niðurstöðurnar að hún væri ekki ólétt. Þannig að það mundi vera false negative. Og svona finnst mér finnst mér ágætt að, ágætt að muna þetta. Ókei, einhverjar spurningar? Þá skulum taka okkur taka pásu og, hérna, svo tölum aðeins um machine learning þegar við komum til baka. Fimm mínútur.

Tölvunarfræði. María Óskarsdóttir - fyrirlestrar, Tilgátuprófanir, machine learning (lærdómur véla)

Tilgátuprófanir, machine learning (lærdómur véla)