Att namnge människor är svårt. Det är en personlig process som har långsiktiga konsekvenser för det ofödda och som måste förstås i ett bredare socialt sammanhang. Det finns känslor som måste beaktas och även data. Men datasidan av namngivningsprocessen kommer sällan till sin rätt. Att namnge ett barn, trots allt, är helt klart inget jobb för en maskin. Som sagt kan blivande föräldrar fatta bättre beslut genom att titta på tillgänglig information om deras namnval.
Oavsett om det är explicit eller implicit, många faktorer påverkar namnet på en bebis. Hur många stavelser har den? Går det bra med ditt efternamn? Kände du någon med det namnet när du växte upp och, ännu viktigare, gillade du den personen? Svaren på många av de frågorna varierar mycket för varje familj (och för varje egensinnig familjemedlem). Som sagt, det finns en uppsättning frågor som data kan besvara entydigt: Hur populärt (dvs ofta stött på) har ett namn varit under åren? Hur populärt är det nu? Hur är det troligt att det blir i framtiden?
Låt oss till exempel titta på mitt (amerikanska) förnamn, George, i topp 100 amerikanska manliga namn med 1-2 och 3 stavelser dataset:
Den översta grafen representerar antalet George-födslar (y-axeln) varje år (x-axeln). Den mellersta grafen är normaliseringen över hela uppsättningen. Och den nedersta grafen är extrapoleringen för de kommande åren. De orange, gröna och röda kurvorna är polynomregressionerna av 1:a, 2:a, 3:e och 4:e graden. Den här sista grafen representerar en välgrundad gissning om intervallet av potentiella utfall för George-gemenskapen som talar om sannolikheten för att namnet avtar från eller vinner framträdande plats. För George finns det ett ganska brett men inte enormt utbud av möjligheter. Med all sannolikhet kommer namnet att förbli populärt, men inte otroligt vanligt eller så populärt som det en gång var - med undantag för ett popkulturellt ögonblick.
Låt oss nu titta på mer intressanta tomter, som att namnet Shirley nådde sin topp 1935, kanske på grund av barnskådespelerskan Shirley Temple började sin karriär det året:

Vi börjar se den enorma makt popkulturen utövar på namngivning och även i vilken grad namn snabbt kan försvinna från nåd - eller inte. Ett intressant och lite annorlunda exempel visar att namnet Dylan spikar i början av 1990-talet - troligen på grund av debuten av den fiktiva karaktären Dylan McKay på Beverly Hills, 90210 – och vad som har hänt sedan dess.

Med den typen av information kan analytiska föräldrar nu göra det medvetna valet att välja en gammal-men-godis, ett på väg att bli återupptäckt eller ett bandwagon-y namn för sin avkomma. Föräldrar kan reagera på uppgifterna på olika sätt. Vissa kan vara bra att välja ett namn som sannolikt för alltid kommer att avslöja deras barns exakta ålder medan andra kanske vill välja något mer originellt eller mer tidlöst. Det viktigaste är att förstå beslutets natur innan det fattas. Och det är inte bara möjligt, det är också ganska enkelt. Nyckeln är att hitta datamängden. Det bästa valet? Nationella namnuppgifter insamlade av Social Security Administration.
Föräldrar kan använda den tillgängliga informationen för att fatta ett bättre beslut - eller åtminstone ångra det lite mer - som så länge de inte vill lära sig hur man gör en polynomregression, vilket inte är särskilt svårt om du är nere på Google den. Jag skulle säga ta dig tid. Du har inget barn än, du har det.
Denna berättelse har anpassats från en berättelse som ursprungligen publicerades den Georges Duvergers personliga webbplats.
