最近,研究論文の捏造や盗作が報告されることが多くなりましたね(たとえば最近ではは2ちゃんねるのこの記事).生命科学のようにリアルタイムの国際競争が激しい分野では,つい良心が麻痺してしまうのでしょうか.上記記事で言及されているテキスト大学のdejavuというシステムは,世界最大の医学文献抄録のデータベースMedlineのデータを用いて,論文同士の類似性を計算し,盗作の可能性がある論文とその引用元のリストを公開しています.7万件にもおよぶリストは,もちろん,すべては盗作なのではなく,あくまでもテキスト間の類似性が高いと判断されたものです.例えば,引用元と引用先で同一の著者を含んでいるものもあるし,ある論文の発展形として次の論文が執筆されることもあり得ます.リストでは,論文タイトルや著者名,類似度,同一著者を含むかのフラグなどのほかに,Medlineで使われているIDが付与されていますので,Medlineを使って両者の論文を比べてみることができます.いくつか見てみましたが,かなり微妙にみえるものもありますね.このdejavuシステム,同じくテキサス大学のeTBLASTというシステムをベースに作られています.eTBLASTは,単語ではなく論文中のフレーズ(単語列)を使って検索を行うシステムですが,dejavuは,これを論文の盗作の検知に利用しています.

別に盗用をしなくとも :-) eTBLASTに自分の論文の一部を入れると,似たような論文を教えてくれるわけで,これはこれで役に立ちそうですね (医学系の論文が対象ですが).また,英語の論文を書くとき,言いたいことを英語でどのように表現するか,という用途にも使えそうです.

Medlineでは,1800万件を超える論文抄録が無料で公開されています.dejavuの結果も同様です.このような姿勢は非常に素晴らしいと思います.

うらら

Special

- PR -
コメント
盗作 2010/08/23 23:06

盗作 - http://plagiarisma.net


コメントを投稿する
メールアドレス(必須):
URL:
コメント:
トラックバック

http://app.blogs.itmedia.co.jp/t/trackback/77444/16681968

トラックバック・ポリシー


» このブログのTOP

» オルタナティブ・ブログTOP



プロフィール

浦本直彦

浦本直彦

日本IBM東京基礎研究所にて次世代Webプラットフォーム技術の研究開発を担当。現在の興味はWeb 2.0セキュリティ。

詳しいプロフィール

カレンダー
2011年7月
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            
カテゴリー
エンタープライズ・ピックアップ

news094.gif ストレス社会との付き合い方
政府がメンタルヘルス検査の義務化を検討しています。しかしうつになった後だけではなく、なる前の予防も大切なのではないでしょうか。(5/24)

news094.gif 「思いやり経営」のススメ
産学・NPO連携の民間団体が先頃、「思いやり経営」という観点で評価した指標や企業ランキングを発表した。企業のマネジメント力を知る手立てとして注目されそうだ。(5/24)

news094.gif テレワークが労働者のマインドを変える
テレワークが普及すると、労働者の評価は従来の「時間×生産性」から「成果」へと変化する。時間や場所を自分の裁量でコントロールできる変わりに、成果を最大化するために労働をマネジメントする能力とマインドが労働者には必要になる。(5/23)

news094.gif 求む、クックパッド男子
高身長も高学歴も高収入もいらない。私が男性に求めるのは「料理の腕」だけです。(5/18)

news094.gif 37歳の常識――我々は一生学び続ける
学び続けなければ衰退するのみだ。(5/18)

オルタナティブ・ブログは、専門スタッフにより、企画・構成されています。入力頂いた内容は、アイティメディアの他、オルタナティブ・ブログ、及び本記事執筆会社に提供されます。

Special

- PR -

サイトマップ | 利用規約 | プライバシーポリシー | 広告案内 | お問い合わせ