Google Chrome 4.1の翻訳バーで遊んでみた
»
例によってMac版とLinux版より先に、Google ChromeのWindows版が一足先に4.1にバージョンアップしました。日本語ユーザーにとってはあまり実用的ではありませんが、翻訳バーは結構遊べます。
世界各地に支社を持つサムソンのサイトの言語選択ページからいろんな言語を選んで表示してみました。
アラビア語などは人間でも見てすぐ分かりますが、例えばロシア語とウクライナ語なんて、ぱっと見にはキリル文字で同じようなのに、どうやって判別しているんだろうと不思議。中国語の簡体字と繁体字もちゃんと区別します(気のせいかほかの言語よりちょっと判別に時間がかかるような気がしますが)。
Google翻訳チームの説明によると、言語判別にはオープンソースの「compact language detection library(CLD)」というライブラリを使っているそうです。CLDがページ上のテキストを4文字ずつのかたまりに分けて、ハッシュテーブルと照合するんだそうです。このテーブルはChromeのバイナリに入っているので、判別作業はGoogleのサーバではなく、ブラウザ上でやってるわけです。だから数秒で答えが出るんですねー。翻訳作業自体はさすがにGoogleのサーバで行っているそうです。よくわかんないけどすごーい。
判別は正確でも、日本語の特殊性もあって翻訳のレベルはまだ実用的とはいえません。まだ当分私のようなへっぽこでも翻訳稼業でなんとか食べていけるようです。Google先生が本気を出したら、近いうちに駆逐されちゃうかもしれませんが。
SpecialPR