Google日本語入力は、間接的に他社のかな漢字変換の辞書の内容の一部を「ぶっこ抜いて」いるのか?
12月3日に話題騒然となったGoogleによるIME、「Google 日本語入力」。忽然と現れたベータにも関わらず、その性能が従来に無く専門用語や固有名詞に強いということで評判です。
そして、日本語IMEと言えば、みなさん思う浮かべるジャストシステム社への影響を心配する声が出ています。MS-DOS時代に数多くあった当時FEPと呼ばれたIME(日本語入力)ソフトがWindows OSに付属したIMEで淘汰されて市場が消えた様子を目の当たりにされた、樋口理氏のブログでの指摘です。
ぶっこ抜き? [Google日本語入力の功罪] - higuchi.com blog via kwout
樋口氏は特に、その元になるデータが市販のIMEデータに由来するものではないか?という問題意識を「ぶっこ抜き」という、マナーに反したデータ入手の手法を表現するストレートな言葉で語られています。
ユーザーが「かな」をどういう文脈の時にどういう漢字に変換するかという膨大な統計データを使うということはすばらしいと思うのだけど、そこでユーザーが 入力したかな文字列と変換後の漢字文字列のセットは、実はユーザーが使っているかな漢字変換機能の辞書が吐き出したものなんですね。つまり、ユーザーを介 して、間接的に他社のかな漢字変換の辞書の内容の一部を「ぶっこ抜いて」いるわけですわ。
私は、評価記事と試用してみての感想で、他社のIMEの変換ノウハウが「ぶっこ抜き」されたわけではなく、あくまで、読みと変換用例から純粋に作られた、別の手法でできたソフトだと考えました。
確かにネット上の日本語テキストのほとんど、そして、検索エンジンに入る検索語のほとんどは既存のIMEが出した結果ではあります。しかし、誤変換とか使い手の誤用も含んだ形で載っている、使用した後の結果なので、各製品固有のノウハウを抜き取ったと非難されるようなことをしているわけではないと考えます。少なくとも、既存のIMEを真似て作ったわけではなく、ネットの用例をベースに新しいものを生み出そう、そんな高い志を持ったソフトウェアでだと思います。
確かに、有償の製品として売る会社があってそこに無償で品質が高いものを規模が大きな会社が出すことの、社会的にどうよ、 という意見がでるのは分かります。
しかし、真似て作って、お化粧で勝とうとしている小賢しいソフトではないし、開発したエンジニアの功績は立派に評価されるべきものだと思います。
その傍証の一つとして、世間でよく使われる誤用がでてくる例をいくつか上げておきます。
この12月によくプロスポーツ界で聞く言葉、 年俸(ねんぽう)ですが、Google日本語入力では、 年棒(ねんぼう) というよくある誤用が一発変換されました。
"年棒" の検索結果 約 238,000 件
とこれだけ広く使われている誤表記なので、スムーズに出てしまうようです。
MS-IMEでもいくつか正しくない日本語が変換されてしまうことが問題になっていましたが、Google日本語入力ではこの手の誤用がスムーズに変換されることが推定されます。
雰囲気を「ふいんき」と読む誤用は、既存のIMEでも変換されないので、出てきてしまうことはないですが、熟語として間違っている組み合わせは構造的に出やすくなっています。
「ないぞうは」で 内蔵ハードディスク と 内臓ハードディスク の両方が出るのは期待通りでした。
きょうみしんしん だと、興味津々 の次に、興味深々 が候補に出ます。危機一髪は、さすがにか、入力されないためか映画のタイトルの 危機一発 は出ませんね。 濡れ手に粟 だと、 濡れ手に泡 もでます。
こういう振る舞いをするソフトウェアが、「正しい日本語」がうりのあの製品を脅かすとはあまり考えられません。
また、Windows上では付属のものをつかうという流れが強くなっているなか、わざわざインストールして使うIMEを注目させたということで、専業メーカーにはかえってチャンスかもしれません。一方逆に学習用には、漢字の表記を頼れない、考えてチェックを要求するIMEとして面白いかもしれません。
いずれにしろ、まだベータですし、今後市場や業界からの評価が出てくると思います。いずれにしろ、世界企業のGoogleから日本語IMEというローカルなソフトウェアが出てきたということは注目すべきことだと思います。
グローバルというあり方以外に、ローカルに最適化する、ローカライズの重要性を改めて思い出しました。I18N(Internationalization)でいいじゃない、という流れに抗して、それでも地域にとっていいものを供給すべし、そうGoogleは私を励ましてくれたのかなと、同じ時刻に世に出たGlobalなマテリアルを振り返りつつ考えさせられました。
>>>>>> ITとマーケティング関係のマスコミや関係者のフォローが増えてTwitterが楽しくなってきました。是非フォローして、交流を広げる一助にお使いください。 お断り:
http://twitter.com/sakamotoh
本ブログでの坂本英樹による投稿やコメントは、あくまで個人の主観に基づくものです。現在および過去の勤務先の意見や見解を表すものではありません。