いつの間にやらプチバズっていたので
過去にLunar-KがVBAで大過去に作って、ウンコード供養として上げたGistのコードがあったのですが、なんか1年弱程前にプチバズった時期があるようで…とてもお恥ずかしい限りでございます。
何がプチバズったのか
VBAマクロ向け関数。GenderEstimate。漢字の名前とふりがなから、性別を推定する関数 · GitHub
このコードです。GenderEstimate関数といって、Excel VBA環境上で2012年頃に作ったもので、名前から性別を推定する関数です。
同じ頃、連続した住所のStringから市区町村名を切り出す関数をFileMakerProから移植できていい気になっていた20代のLunar-Kが調子こいて「できねえなりになんか作ってみよう」としたものになります。
なんで作ったのか
当時、前職の会社で記名アンケート統計の仕事が定期的にあったのですが、性別を5%ぐらいの方が記載せずに回答するもので、まあできねえなりに推定を試みようとして、残り5%の性別を埋めるために開発したものになります。従って、全員が全員性別書いてないような(名前だけ書いてあるような)名簿への性別の推定を目的としてはおらず、まぁ手慰み程度にとおもって半ばギャグで作ったものになります。ヒューリスティックの塊でどこまで人間の行う「推定」に近づけられるのかという課題にチャレンジしたようなものになります。
実際作って動かしてみての乾燥ですが、若い子の性別判定とかアニメキャラではもうボロボロなものの、案外キラキラネームじゃない世代の性別推定には善戦していた印象があります。すぐに使わなくなりましたが。
当時考えていたアイディア
男女どっちにも当てはまる名前への対応
- そもそもその個人の性別を「判定」する目的で作っているわけではないので、例えば可能性が半々なら、1/2の確率で男という結果を返したり女という結果を返したりするようにしよう
- ただ、一度付けた値が固定してくれないと、Excel関数としては使いにくいよね…
- もう少し発展的には、男女比に偏りのある苗字なら、男女の比率に重みを付けて結果を返せばなんとなくシステムっぽい?
- まあ、でもその名前の男女比なんてわからんよねぇ…。
バズっている内容へのコメント
まぁ、性別推定なんてやるもんじゃないよ。やればやるほど血を見るのでお勧めしません。