Následující bylo syndikováno z Střední pro Otcovské fórum, komunita rodičů a influencerů s náhledy na práci, rodinu a život. Pokud se chcete připojit k fóru, napište nám [email protected].
"Zajímalo by mě, jak je můžeme přimět spát víc." Tato jednoduchá myšlenka, kterou vyslovila moje žena, dokonce ani otázka, se pro mě stala výzvou. Moje inženýrská mysl to vzala jako problém, který je třeba vyřešit, a když vývojář softwaru vidí problém, vymyslí testy. Naštěstí jsem znal dokonalý systém pro testování některých nápadů v kontrolovaném a měřitelném prostředí. A s dvojčaty by bylo testování ještě jednodušší. Vítejte v rodičovství, stylu A/B testování.
A/B testování se používá na celém webu. Pravděpodobně se s tím setkáte desítky, ne-li stovkykrát denně, aniž byste si toho všimli. Dělají to všechny velké technologické společnosti a používají to jako nástroj k testování výkonnosti nápadů a jejich měření. Google je známý testováním 41 odstínů modré pro výsledky vyhledávání. Designéři se údajně nemohli rozhodnout, který ze 2 odstínů použít, a tak testovali celkem 41, aby zjistili, co vedlo k tomu, že na výsledky klikalo více uživatelů. Facebook neustále testuje různé zkušenosti ve feedu. Amazon dokonce poměrně často mění rozložení tlačítek nákupu a košíku. Můžete si toho všimnout, pokud se někdy přihlásíte z nového počítače nebo uvidíte, že přítel používá web, který vypadá jemně odlišně od toho vašeho.
A/B testování se používá k testování jedné nebo více „léčeb“ nebo experimentů nad „kontrolou“ nebo existující zkušeností. Metrika se měří, obvykle na základě akce uživatele, jako je proklik nebo „konverze“, se základní linií oproti kontrole. V příkladu Google mohou otestovat pravděpodobnost, že se uživatelé prokliknou alespoň k jednomu výsledku s jiným odstínem. Po statisticky významném časovém období, často týden nebo 2, bude jako vítěz vybrán kterýkoli zážitek, který má lepší míru, a stane se novou kontrolou.
To se opravdu komplikuje, když je spuštěno několik experimentů současně nebo když procento uživatelů není rovnoměrně rozděleno. Zde je nutná komplikovaná znalost statistiky. Nebo použití některého z mnoha dostupných výkonných testovacích nástrojů. Ve společnostech Audible a Amazon neustále testujeme podobné zkušenosti. Je to nejlepší způsob, jak zjistit, jak se uživatelé skutečně chovají, stejně často, co uživatelé říkají, že budou dělat, a to, co dělají, se může mírně lišit.
Rozhodl jsem se použít tuto metodu při testování s chlapci, abych zjistil, zda bychom mohli zvýšit nejdůležitější metriku v domě kohokoli, kdo má 10 týdenní děti, zejména dvojčata; doby spánku. Používat jednoho z chlapců jako kontrolu a druhého jako léčbu – nevadí, že nikdo nepopíše žádnou část našeho žije právě teď se slovy kontrola nebo léčba – testoval jsem několik teorií o délce spánku založených na řízení.
V každém experimentu je kritické přesné měření a sledování dat. Často je metrika úspěchu zvolena kvůli dostupnosti dat nebo schopnosti měření. Nechcete se pokoušet měřit něco, co měření trvá déle, než změna testu nebo vstupu testu. Naštěstí je měření spánku tak snadné, jak jen to jde. Když se v noci probudí, jen to zapíšeme. To je přesně to, co děláme ode dne, kdy se narodili, od té doby, co nám to vštěpovaly sestry v nemocnici. Prošli jsme již několik poznámkových bloků, ale je tak snadné je sledovat. Za tímto účelem jsme dokonce začali importovat data do tabulky, abychom viděli dopad vizuálněji.
Dobrou lekcí pro A/B testy je, že někdy existuje několik dní období přizpůsobení, kdy lidé vymyslí novou novou léčbu a přizpůsobí se.
Nejprve jsme testovali zvýšení množství podávaného při krmení těsně před spaním. Místo normálních 4 uncí jsme zkusili 5, pak 6. Abychom zabránili zaujatosti u jednoho dítěte, střídali jsme, kdo byl testem a kdo byl kontrolou, protože se zdá, že jsou v cyklech dobra a zla. Zatímco jedno dítě mělo větší večerní krmení, druhé zůstalo na 4 uncích. Výsledek: neprůkazný. Zdálo se, že obě děti v tomto období stejně začaly prodlužovat délku spánku. Oba spali skoro stejně dlouho. Byla jedna noc, kdy zvýšené krmení korelovalo s rekordním 5,5hodinovým úsekem spánku, ale jeden datový bod je v tomto souboru dat nevýznamný. Bylo také těžké pokračovat v testování, protože cokoliv nad 5 uncí mělo vysokou pravděpodobnost, že to vyplivne několik minut po jídle.
Další bylo tajemství, o kterém se šeptalo v temných zákoutích rodičovských blogů po celém webu a předávalo se z rodičů na spolurodiče, alespoň v mé kanceláři. Dobře, možná to není takové tajemství, ale chvíli nám trvalo, než jsme to zkusili. Předpokládá se, že tato směs bylin a koření, na rozdíl od směsi KFC, by uklidnila žaludky z refluxu a plynu, zejména přes noc, což mělo za následek delší spánek. Po týdnu testování jsme zjistili, že to skutečně pomáhá s refluxem, zejména vyplivnutím, a přestože jsme nesledovali jednotlivá říhnutí nebo prdění, zdálo se, že je také snižuje. Délka spánku však nebyla příliš ovlivněna. V průměru jsme zaznamenali malý nárůst, mezi 20 a 30 minutami, ale opět se mohlo jednat o přirozené nárůsty způsobené věkem.
Po gripe vodě, která se stala novou kontrolou, jsme otestovali extra krmení před spaním. Kluci to stejně začali dělat přirozeně sami a my jsme se tomu snažili zabránit. Zdálo se to však jako příležitost zralá na testování, a tak jsme to zkusili. Mnoho dětí se „shlukuje“ krmení před spaním s krmením jen krátce po tom předchozím, těsně před spaním. Toto krmení jsme provedli asi 1,5 až 2 hodiny po předchozím, ve srovnání se 3 hodinami normálně. V tomto krmení jsme zkusili 4 unce ve srovnání se 4–5, které normálně berou během denního krmení.
Někdy odmítli vzít více než 3. Ze všech experimentů se zdálo, že to fungovalo nejlépe. V důsledku toho jsme zaznamenali nárůst až o hodinu spánku navíc, i když často až po několika dnech experimentu, zjevně to nějakou dobu trvá, než se projeví spánkové vzorce. Dobrou lekcí pro A/B testy je, že někdy existuje několik dní období přizpůsobení, kdy lidé vymyslí novou novou léčbu a přizpůsobí se. Je však důležité zachytit jak výsledky období úprav, tak výsledky po úpravě. Apple skvěle zanedbával období úprav u několika uvedení produktů, zejména map.
Nakonec jsme testovali, jak je udržet déle vzhůru během dne. Naší hypotézou bylo, že budou proto v noci unavenější a budou v důsledku toho déle spát. To může být trochu pravda, zaznamenali jsme menší prodloužení délky spánku, ale nezohlednili jsme stres a vyčerpání, které by to způsobilo tím, že bychom je drželi vzhůru a činili je nešťastnými. Také jim trvalo podstatně déle, než se usadili a v noci spali, protože byli unavení a vybíraví. Poučení pro testování: neobětujte jiné metriky pro malý zisk v jednom.
Tyler Lund je editorem Táta na útěku.
Chcete tipy, triky a rady, které skutečně využijete? Klikněte zde a přihlaste se k odběru našeho e-mailu.