2005年02月06日
フリーメールアドレスにまつわる仮説と検証
yahoo, livedoor, goo, hotmailとさまざまなフリーメールアドレスはあるわけだが。
d-uを見ているとフリーメールアドレスの人は、ちょっと調べればわかる程度 のしょうもない質問をしてたり、なんかだらだらと続いてたり、あるいは次々 と質問してきたりする、という「イメージ」があった。
で実際にそのイメージはどうなのかということで、42400〜42826の426通につい て調べてみた。判断はかなりテキトー。ぱっと見て感覚で「まぁよいかな」「こりゃ ダメだな」というのを適当に振り分けてハッシュDBファイルにアドレスを 書いていく。
結果なのだが、実はそれほど仮説を強く支持するようなものにはならなかった。
- 335 vs 91。フリーメール系では24 vs 48。判断基準がアレなのでもっとちゃんとした尺度が必要。
- フリーメールだからすなわちダメということはない。まともな投稿もある。
- ただし、フリーメールアドレスの絶対数で言うと、ダメなほうが多い。
- でもフリーメール投稿者が爆発的に全体の中で多いわけでもない。とはいえ、48/91=53%弱がフリーメールというのは高いと見るべきか?
- ごく数名のフリーメール投稿者がダメメール率を上げている。
- とりあえず、自分はメール出しすぎ(笑)。59通。かねこさんが32通なので、DSAの分も多いとは言えるが…。ちなみにその次はやまねさんの11通。
次はspamassassinを応用できないか考えてみよう(超暇ができるか気分転換が 必要なとき)。基本的なところでは全文引用をうまく引っ掛ける方法とか全角 英数字とかか。
原稿に煮詰まってアホなことに逃避していた深夜。まぁPerlのDB_Fileの使い方がわかったのでよしとするか。
![[hatena]](http://d.hatena.ne.jp/images/b_entry_de.gif)
![[RSS]](/d/rss10.png)
Debian GNU/Linux徹底入門 Sarge対応
Debian辞典