다음에서 신디케이트되었습니다. 중간 ~을위한 아버지 포럼, 직장, 가족, 삶에 대한 통찰력을 가진 부모와 영향력 있는 사람들의 커뮤니티. 포럼에 가입하려면 다음으로 전화하십시오. [email protected].
한 달 전에 시도한 A/B 테스트 다른 "치료" 또는 입력 매개변수가 어떻게 우리 쌍둥이의 수면 시간을 늘릴 수 있는지 알아보기 위해 — 물론 대리인에 의해. 이를 통해 수면 패턴이 상당히 불규칙하고 수면 증가와 강한 상관 관계를 많이 찾지 못했다는 것을 알았습니다. 시간이 지남에 따라 그들은 자연스럽게 스스로 시작했습니다. 그러나 이제 4개월이 되자 겉보기에는 흔하지만 거의 논의되지 않은 수면 퇴행 단계를 시작했습니다. 나는 다시 한 번 더 잠을 자야 한다는 절망감을 느꼈다. 이전 게시물에 댓글이 달렸듯이 제가 "아무리 잠을 더 자고 싶어도 뭔가를 찾고 있었던 걸까요?" 예. 그래요. 그래서 저는 또 다른 컴퓨터 과학 기술인 기계 학습으로 눈을 돌렸습니다.
플리커 / 매튜 H.
머신 러닝은 컴퓨터나 프로그램에 개별 지침을 제공하지 않고 "가르치는" 방법을 제공하는 컴퓨터 과학의 한 분야입니다. 일반적인 프로그래밍에서는 컴퓨터에 실행할 명령 시퀀스를 제공하고 논리를 던집니다. 입력에 따라 무엇을 할지 결정하지만 프로그램은 이러한 잘 정의된 범위에서 벗어날 수 없습니다. 울타리. 이 설명은 터미네이터 실제로 실제로 보이는 것보다 기계 학습을 사용하면 "학습" 데이터 세트를 가져와 예측 기반으로 사용할 수 있습니다. 기술 산업 전반에 걸쳐 점점 더 대중화되고 있지만 주로 구매를 확인하는 데 사용되었습니다. 행동 및 권장 사항, AI, 그리고 아마도 가장 흥미롭게도 그림과 예술을 분류하고 식별하는 것입니다. Google. 육아에 적용한 사례는 많이 찾아볼 수 없었습니다.
아내의 회계 배경과 A형 성격 덕분에 남자 아이들의 수유 및 수면 행동에 대한 자세한 기록이 있습니다. 이 스프레드시트를 기억하십니까?
이 데이터를 사용하여 입력 매개변수의 최적 조합을 찾기 시작했습니다. 이 경우에는 요일, 마지막 수유 시간 및 마지막 수유량을 통해 가장 긴 야간 수면 결과를 결정합니다. 소년들. 그리고 무엇보다도 컴퓨터가 힘든 일을 하도록 할 수 있었습니다. 게다가, 우리는 물론 소년이 한 명이 아니라 두 명이기 때문에 이러한 패턴에 대한 데이터가 두 배나 많았습니다.
플리커 / 매튜 에프라임
여러 프로그래밍 언어에서 사용할 수 있는 기계 학습을 위한 몇 가지 훌륭한 라이브러리가 있습니다. 저는 주로 Java와 Javascript를 업무에 사용하지만 Python 라이브러리 sklearn을 선택했습니다. Python에 익숙하고 유연한 스크립팅을 위한 완벽한 응용 프로그램처럼 보였습니다. 언어. 이 라이브러리와 좋은 문서에 대한 많은 훌륭한 자습서가 있습니다.
내 코드를 찾을 수 있습니다 깃허브 관심이 있다면.
스프레드시트에서 수집한 데이터를 내보내면서 지난 달의 데이터 포인트만 추출했습니다. 영유아가 겪는 급격한 성장과 발달상의 변화 때문에 나는 한 달의 데이터(영아 2명 곱하기)가 최근성과 예측을 하기에 충분한 데이터의 균형이 잘 맞는다고 느꼈습니다.
합치고 코딩하기
나는 또한 평균적으로 우리가 소년들에게 1인당 27.5oz를 먹였다는 것을 포함하여 흥미로운 통계를 얻었습니다. 낮에는 7시 25분에 가장 자주 잠자리에 들게 하고 취침 시간에 5.22oz를 먹이고 9시간을 잤습니다. 평균. 또한 소년들은 75%의 시간에 10시간 이상 자는 것으로 밝혀졌습니다. 나쁘지 않아. 하지만 더 많은 작업을 통해 이를 개선할 수 있다는 것을 알았습니다.
이 데이터를 사용하여 수면 시간에 대한 각 매개변수를 표시할 수 있었습니다.
이들 대부분 사이에는 적어도 선형적인 강한 상관관계가 이미 존재하지 않는다는 것을 알 수 있습니다. 가장 가까운 것은 총 음식과 수면 시간 간의 다소 선형(이상치가 많은) 관계입니다. 이상하게 더 많은 음식은 잠을 덜 자는 결과를 낳는 것 같습니다.
플리커/헤그바
기계 학습 알고리즘에는 다양한 유형이 있습니다. 크게 선형과 비선형으로 분류됩니다. 데이터를 가져와서 상당히 널리 사용되는 6가지 알고리즘을 통해 실행하여 각각이 얼마나 정확한지 확인했습니다. 결과는 다음과 같습니다.
또는 좀 더 픽토그램적인 형태로
여기에서 범위가 매우 넓고 평균이 다른 것보다 훨씬 좋지는 않지만 Support Vector Machine 알고리즘이 데이터에 대해 분명히 가장 잘 수행된 것을 볼 수 있습니다. 아무도 예측하기에는 매우 좋지 않은 50%에 불과합니다. 이것은 전적으로 데이터의 의사 무작위 특성 때문입니다. 그러한 결과에도 불구하고 나는 통찰력이 조금이라도 빛나기를 희망하면서 앞으로 나아가기로 결정했습니다.
SVM을 사용하여 입력 데이터에 대한 알고리즘을 훈련했습니다. 이를 사용하여 하루에 섭취한 음식의 양, 잠자리에 든 시간, 마지막 수유 시 먹인 양을 기준으로 얼마나 많은 수면을 취하는지 예측할 수 있습니다. 예를 들어, 28온스를 주고 7시에 잠자리에 들게 하고 마지막 수유 시에 6온스를 주면 8시간의 수면 시간이 상당히 부족할 것입니다.
결론
이제 알고리즘이 훈련되어 얼마나 많은 수면을 취할지 어느 정도 확실하게 예측할 수 있었습니다. 더 중요한 것은 이러한 추세선을 살펴보고 최적화를 위해 어떤 유형의 행동이 더 많은 수면을 유도했는지 확인할 수 있다는 것입니다. 반 직관적으로, 더 적은 음식으로 더 일찍 잠자리에 들면 하루 종일 실제로 수면이 증가했습니다. 이것은 많은 요인 때문일 수 있지만 내 이론은 음식이 적을수록 가스가 적고 배고플 때 위 수축이 적어서 더 편안한 수면을 의미한다는 것입니다. 몇 번이나 배고파서 한밤중에 기이하게 깨어 났습니까?
플리커 / 디온 힌치클리프
불행히도 A/B 테스트와 마찬가지로 개별 입력은 수면에 대한 강력한 직접적인 입력이 없는 것 같습니다. 누군가가 이미 그것을 발견하고 수백만 달러를 벌었을 것입니다. 종합하면 머신 러닝은 이러한 추세와 변수 간의 연관성 중 일부를 찾을 수 있습니다. A/B 테스팅이나 시행착오보다 더 정확하고 좋은 결과를 얻기 위해 노력하고 있지만 결과는 아직 멀었습니다. 이 데이터에서 기껏해야 41%의 예측 정확도를 얻을 수 있었습니다. 즉, 잘못된 경우가 더 많습니다. 발달의 잦은 변화와 소년들 사이의 차이 때문에 그들 사이에 데이터를 적용하기가 어렵습니다. 다시 말하지만, 더 큰 표본 크기가 도움이 될 수 있지만 곧 삼중항을 목표로 하지는 않습니다.
그럼에도 불구하고 이러한 결과는 없는 것보다 낫고 기계 학습 및 데이터 과학 분야의 가능성을 입증하는 데 도움이 됩니다. 나는 직감보다 데이터에서 결정을 내리는 것을 선호하며 이 데이터는 내 추측의 일부를 확인하는 것만으로도 우리의 양육 방식에 대해 기분이 좋아집니다.
Tyler Lund는 편집자입니다. 달리는 아빠.