Følgende ble syndikert fra Medium til Det faderlige forumet, et fellesskap av foreldre og påvirkere med innsikt om jobb, familie og liv. Hvis du ønsker å bli med i forumet, send oss en forespørsel på [email protected].
For en måned siden prøvde jeg A/B-testing for å se hvordan forskjellige "behandlinger" eller inngangsparametere kan resultere i lengre søvn for tvillingene våre - og selvfølgelig ved proxy, oss. Gjennom dette fant jeg ut at søvnmønsteret var ganske uberegnelig og fant ikke mye som korrelerte sterkt med økt søvn. Ettersom tiden gikk begynte de mer og mer på egenhånd naturlig. Men nå som de har nådd 4 måneder, har de begynt den tilsynelatende vanlige, men sjelden diskuterte søvnregresjonsfasen. Jeg fant meg nok en gang desperat etter mer søvn. Var jeg, som en kommenterte i forrige innlegg påpekte, "søkte etter å finne noe uansett hvor desperat etter mer søvn?" Ja. Ja jeg var. Derfor vendte jeg meg til en annen informatikkteknikk, maskinlæring.
flickr / Matthew H.
Maskinlæring er et felt innen informatikk som gir metoder for å "undervise" datamaskiner eller programmer uten å gi dem diskrete instruksjoner. I normal programmering ville jeg gitt datamaskinen en sekvens med kommandoer å utføre, og kastet inn logikk til ta avgjørelser om hva du skal gjøre basert på input, men programmet kunne aldri gå ut av disse veldefinerte skinner. Selv om denne beskrivelsen høres nærmere ut
Takket være min kones regnskapsbakgrunn og vår type A-personlighet, har vi detaljerte registreringer av mating og søvnadferd for guttene. Husker du dette regnearket?
Ved å bruke disse dataene satte jeg meg for å finne den optimale kombinasjonen av inngangsparametere, i dette tilfellet så jeg på total mat som ble konsumert i dagen, tidspunktet for siste fôring og mengden siste fôring, for å bestemme hva som ville resultere i den lengste nattesøvnen for gutter. Og best av alt kunne jeg la datamaskinen gjøre det harde arbeidet. I tillegg hadde vi dobbelt så mye data om disse mønstrene fordi vi selvfølgelig ikke har én men 2 gutter.
flickr / Matthew Ephraim
Det er flere flotte biblioteker for maskinlæring tilgjengelig på tvers av programmeringsspråk. Selv om jeg primært bruker Java og Javascript til jobb, valgte jeg Python-biblioteket sklearn, da jeg har kjennskap til Python, og dette virket som det perfekte programmet for fleksibel skripting Språk. Det er mange gode opplæringsprogrammer der ute for dette biblioteket og god dokumentasjon også.
Du finner koden min på github hvis interessert.
Ved å eksportere dataene vi samlet inn fra regnearket, hentet jeg bare den siste måneden med datapunkter. På grunn av den raske veksten og utviklingsendringene spedbarn går gjennom, følte jeg at en måneds data – ganger 2 spedbarn – var en god balanse mellom nylig og nok data til å gi en prediksjon.
Å sette det sammen og kode det opp
Jeg fikk også noen statistikker som var interessante inkludert at vi i gjennomsnitt matet guttene 27,5 oz pr dag, la dem oftest i seng kl. 07:25, matet dem 5,22 oz ved leggetid, og de sov 9 timer på gjennomsnitt. Det viste seg også at guttene sov over 10 timer 75 prosent av tiden. Ikke værst. Men jeg visste at med litt mer arbeid kunne vi forbedre dette.
Ved å bruke disse dataene var jeg i stand til å plotte hver parameter mot søvntiden.
Du kan se at det allerede ikke er en sterk korrelasjon, i det minste lineær mellom de fleste av disse. Det nærmeste er det noe lineære - med mange uteliggere - forholdet mellom total mat og timers søvn. Merkelig nok ser mer mat ut til å resultere i mindre søvn.
flickr / hegbar
Det finnes mange forskjellige typer maskinlæringsalgoritmer. Disse er i stor grad klassifisert i lineære og ikke-lineære typer. Jeg tok dataene og kjørte dem gjennom 6 ganske mye brukte algoritmer for å se hvor nøyaktig hver enkelt kunne bli. Her er resultatene.
Eller i en mer piktografisk form
Her kan du se at Support Vector Machine klarte klarte best mot dataene, selv om utvalget er veldig bredt og gjennomsnittet ikke er mye bedre enn de andre. Ingen er engang på 50 prosent, noe som er ganske dårlig for å forutsi. Dette er helt på grunn av dataenes pseudo-tilfeldige natur. Selv med slike resultater bestemte jeg meg for å gå videre, i håp om å få noen innsikt i det hele tatt.
Ved å bruke SVM trente jeg algoritmen på inndataene. Ved å bruke dette kunne jeg nå forutsi hvor mye søvn vi ville få basert på mengden mat som ble tatt i løpet av en dag, når vi legger dem og hvor mye vi matet dem ved siste fôring. For eksempel, å gi dem 28 gram, legge dem til sengs klokken 7 og gi 6 gram ved den siste matingen ville resultere i ganske dårlige 8 timers søvn.
Konklusjoner
Med algoritmen nå trent, kunne jeg med en viss sikkerhet forutsi hvor mye søvn vi ville få. Enda viktigere, jeg kunne se på trendlinjene for disse og se hvilken type atferd som førte til mer søvn i et forsøk på å optimalisere. Kontraintuitivt økte søvnen ved å legge seg tidligere, med mindre mat da og utover dagen. Dette skyldes sannsynligvis mange faktorer, men min teori er at mindre mat betyr mindre gass, mindre magekrymping når du er sulten, og derfor mer avslappende søvn. Hvor mange ganger har du pigget ut og så bisarrt våknet midt på natten og sultet?
flickr / Dion Hinchcliffe
Dessverre, akkurat som med A/B-testingen, ser ingen individuelle input ut til å ha en sterk direkte input på søvn. Jeg antar at hvis det gjorde det, ville noen allerede ha oppdaget det og ville tjene millioner. Til sammen kan maskinlæring finne noen av disse trendene og assosiasjonene mellom variabler, noe som fører til bedre, mer nøyaktige resultater enn A/B-testing eller prøving og feiling, men resultatene er fortsatt langt fra gode. Fra disse dataene kunne jeg på det meste få en nøyaktighetsgrad på 41 prosent av spådommer. Det betyr at de oftere tar feil. På grunn av de hyppige endringene i utviklingen og til og med forskjellene mellom guttene, er det vanskelig å bruke data på tvers av dem. Igjen, en større prøvestørrelse kan hjelpe, men vi sikter ikke på trillinger med det første.
Likevel er disse resultatene bedre enn ingenting og bidrar til å demonstrere løftet innen maskinlæring og datavitenskap. Jeg foretrekker å ta avgjørelser fra data fremfor magefølelser, og disse dataene bekrefter til og med bare noen av gjetningene mine, får meg til å føle meg bedre om foreldretilnærmingen vår.
Tyler Lund er redaktør for Pappa på flukt.