オルタナティブ・ブログ > 森崎修司の「どうやってはかるの?」 >

計測できそうでできない多くのこと。エンピリカル(実証的)アプローチで。

150万通の公開電子メールアーカイブ

»

粉飾決算の疑いが広まり2001年に経営破綻したエンロン(Enron Corporation)の社員(の一部)がやりとりした150万通のメールが公開されている。電子メールは訴訟を起こそうとする人だけの興味だけでなく、ソーシャルネットワークを分析する研究者、情報漏えい防止を目的としたメール監視システムの開発者の興味も引いている。

2000年にエンロンが行ったとされる市場操作の調査の一環として公開され、今ではエンロンコーパスと呼ばれている。自然言語処理、法律、ソーシャルネットワークの実対象データとして、様々な立場の人間にとって非常に貴重な存在となっている。

公開の経緯や目的は全くといっていいほど異なるが、ソフトウェア開発の途中で収集した規模、品質、工期に関わるデータを公開しているものがある。ちょうどここで紹介したものと同様のものである。こちらもソフトウェア開発中のデータを分析の収集や評価をしようとする様々な立場の人間にとって非常に貴重な存在である。

Comment(0)