Следното беше синдикирано от Среден за Бащинският форум, общност от родители и влиятелни лица с прозрения за работата, семейството и живота. Ако искате да се присъедините към форума, пишете ни на [email protected].
Преди месец опитах A/B тестване за да видим как различните „лечения“ или входни параметри могат да доведат до по-дълъг сън за нашите близнаци – и разбира се чрез прокси, нас. По този начин открих, че моделите на съня са доста непостоянни и не открих много, което да корелира силно с увеличения сън. С течение на времето те започнаха в по-голяма степен сами, естествено. Въпреки това, сега, когато са достигнали 4 месеца, те са започнали очевидно често срещаната, но рядко обсъждана фаза на регресия на съня. Отново открих, че отчаяно искам повече сън. Бих ли, както беше посочено един от коментарите в предишната публикация, „търсех да намеря нещо, без значение колко отчаяно искам повече сън?“ да. Да аз бях. Затова се обърнах към друга техника на компютърните науки, машинното обучение.
flickr / Матю Х.
Машинното обучение е област в рамките на компютърните науки, която предоставя методи за „преподаване“ на компютри или програми, без да им дава отделни инструкции. При нормално програмиране бих дал на компютъра поредица от команди за изпълнение, като вмъквам логиката вземайте решения какво да правите въз основа на въведените данни, но програмата никога не би могла да излезе от тези добре дефинирани релси. Въпреки че това описание звучи по-близо до Терминатор отколкото това, което всъщност изглежда на практика, машинното обучение позволява на човек да вземе набор от „учебни“ данни и да ги използва за основа за правене на прогнози. Въпреки че става все по-популярен в технологичната индустрия, той се използва предимно за разглеждане на покупки поведение и препоръки, AI и може би най-интересното, за категоризиране и идентифициране на снимки и изкуство – до голяма степен от Google. Не можах да намеря много случаи, когато това се прилага към родителството.
Благодарение на счетоводния опит на съпругата ми и нашите личности от тип А, ние имаме подробни записи за храненето и поведението на сън за момчетата. Помните ли тази електронна таблица?
Използвайки тези данни, се заех да намеря оптималната комбинация от входни параметри, в този случай разгледах общата консумирана храна в деня, часа на последното хранене и количеството на последното хранене, за да се определи какво би довело до най-дългия нощен сън за момчета. И най-хубавото е, че можех да оставя компютъра да свърши тежката работа. Освен това имахме два пъти повече данни за тези модели, защото, разбира се, имаме не едно, а 2 момчета.
flickr / Матю Ефраим
Има няколко страхотни библиотеки за машинно обучение, налични в различните езици за програмиране. Въпреки че използвам предимно Java и Javascript за работа, избрах библиотеката на Python sklearn, тъй като познават Python и това изглежда идеалното приложение за гъвкави скриптове език. Има много страхотни уроци за тази библиотека и добра документация.
Можете да намерите моя код на github при интерес.
Експортирайки данните, които събрахме от електронната таблица, извадих точки от данни само за последния месец. Поради бързия растеж и промени в развитието, през които преминават бебетата, почувствах, че данните за един месец - умножени на 2 бебета - са добър баланс на актуалност и достатъчно данни, за да направя прогноза.
Събираме го и го кодираме
Също така получих някои статистически данни, които бяха интересни, включително, че дадохме средно на момчетата 27,5 oz ден, слагайте ги да спят най-често в 7:25, хранете ги с 5,22 унции преди лягане и те спят 9 часа средно аритметично. Оказа се също, че момчетата са спали над 10 часа в 75 процента от времето. Не е много лошо. Но знаех, че с още малко работа можем да подобрим това.
Използвайки тези данни, успях да начертая всеки параметър спрямо времето за заспиване.
Можете да видите, че вече няма силна корелация, поне линейна между повечето от тях. Най-близката е донякъде линейната - с много отклонения - връзката между общата храна и часовете сън. Странно изглежда, че повече храна води до по-малко сън.
flickr / hegbar
Има много различни видове алгоритми за машинно обучение. Те са до голяма степен класифицирани на линейни и нелинейни типове. Взех данните и ги прокарах през 6 доста широко използвани алгоритма, за да видя колко точен може да стане всеки. Ето резултатите.
Или в по-пиктографска форма
Тук можете да видите, че алгото на Support Vector Machine явно се представя най-добре спрямо данните, въпреки че диапазонът е много широк и средната стойност не е много по-добра от останалите. Никой не е дори на 50 процента, което е доста лошо за прогнозиране. Това се дължи изцяло на псевдослучайния характер на данните. Дори с такива резултати реших да продължа напред, надявайки се да проблясвам изобщо.
Използвайки SVM, обучих алгоритъма върху входните данни. Използвайки това, вече можех да предскажа колко сън ще получим въз основа на количеството храна, приета на ден, кога сме ги сложили да спят и колко сме ги нахранили при последното хранене. Например, давайки им 28 унции, поставянето им в леглото в 7 и даването на 6 унции при последното хранене ще доведе до доста лоши 8 часа сън.
Заключения
С вече обучения алгоритъм можех да предскажа с известна сигурност колко сън ще получим. По-важното е, че можех да погледна линиите на тенденцията за тях и да видя какъв тип поведение доведе до повече сън в опит за оптимизиране. Противно интуитивно, лягането по-рано, с по-малко храна тогава и през целия ден всъщност увеличават съня. Това вероятно се дължи на много фактори, но моята теория е, че по-малко храна означава по-малко газове, по-малко свиване на стомаха, когато сте гладни, и следователно по-спокоен сън. Колко пъти сте се измъкнали и след това странно се събуждали посред нощ гладуващи?
flickr / Дион Хинчклиф
За съжаление, точно както при A/B тестването, изглежда, че нито един индивидуален вход няма силен директен вход за съня. Предполагам, че ако беше така, някой вече щеше да го е открил и щеше да направи милиони. Взети заедно, машинното обучение може да намери някои от тези тенденции и асоциации между променливи, което води до по-добри, по-точни резултати от A/B тестване или опит и грешка, но резултатите все още са далеч от страхотни. От тези данни мога да получа най-много 41 процента точност на прогнозите. Това означава, че по-често грешат. Поради честите промени в развитието и дори разликите между момчетата, е трудно да се прилагат данни към тях. Отново, по-голям размер на извадката може да помогне, но ние не се стремим към тризнаци скоро.
Все пак тези резултати са по-добри от нищо и помагат да се демонстрира обещанието на областта на машинното обучение и науката за данни. Аз от една страна предпочитам да вземам решения въз основа на данните, а не на чувствата и тези данни, дори само потвърждаващи някои от моите предположения, ме карат да се чувствам по-добре относно нашия родителски подход.
Тайлър Лунд е редактор на Татко в бягство.