文科系のための人工知能入門 "第2回" ~今現在、人工知能が出来ることをざっくり知る~
世に溢れる人工知能の情報は、"今できること" と "SFの世界" と "将来の展望" がごっちゃに語られてるケースが多く、文系の人の多くが人工知能を誤解してしまいます。私もそうでした。
まず "今人工知能が出来ること" を理解しましょう。これで少し視界がすっきりすると思います。
今人工知能が出来ること
今人工知能ブームですが、鉄腕アトムのようなロボットが出来てる訳じゃありません。今人工知能と呼ばれているものは基本的にあなたが使っているパソコンと同じ仕組みのコンピューターで作れます。あなたが慣れ親しんでいるのとちょっと違う コンピューターの使い方、"機械学習"という使いかたで出来ることが人工知能と呼ばれています。
機械学習って何ですか?
今回は概要理解のため超ざっくりと機械学習を説明します(*1)。
機械学習を一言で言うと "分類機械" です。もうちょっと難しくいうと『判断基準をプログラムにロジックとして入れ込むのが難しいケースでもデータを元に傾向をつかみおそらくだいたい正しい選択肢を提示する』仕組みです。
何ができるのか?
そう言ってもなかなかイメージつかめないと思うので実際の例で説明すると
- 画像分類...多くの画像から人が写っているものを分類
- 文書分類...Webの記事を政治、経済、スポーツ、芸能、その他に分類
写真に人が写ってる判断基準やWebの記事の内容の判断基準を説明しろって言われても難しいですよね、説明できないものはプログラムできません。コンピューターはこういうデータ(非構造化データと言います)を扱うのが苦手でした、機械学習を使うとこれを扱えるようになります。
- 迷惑メール...送られてくるメールから迷惑メールを検知して分類
- カード不正...カードの使用情報から不正使用を発見
迷惑メールやカード不正とも日々新しい手口が開発されているので判断基準作ること自体が難しいです。また、いろいろある情報をもとにすると何らかの相関を発見できそうだけど人間がそれをあぶり出すのは困難です。こういうケースでも機械学習が活躍します。
どうやってやるのか?
機械学習のやり方をイメージでいうと "調整つまみ" がたくさん付いている分類器です。この分類器は使う前に用途に応じて "調整つまみ" を調整する必要があります。
例えば人が写っている写真を分類したい場合、大量の写真データを準備します、写真にはあらかじめ "人が写っている" , "写っていない" というラベルをつけておきます。これを分類器にインプットして分類を行います。分類器はラベルを見ないで分類を行い、その結果とラベルを比較して答え合わせをします。正しく仕分できた場合はそのまま、間違えた場合は少しづつ"調整つまみ(パラメーター)"を調整して徐々に正解率を上げていきます。実用に耐えうる精度が得られるまでこれを続けます。
これが人間が "学習"する過程と似ているので『機械学習』と呼ばれていますが、実際にやっているのは調整つまみの調整、もっとストレートに言うとパラメーター調整です。
実装方法
機械学習には色んな実装方法があります。ニューラルネットワーク、サポートベクトルマシン、ベイジアンネットワーク、などなど。どれもデータを元に学習(パラメーター調整)を行って実際に使うという部分は一緒です。
最近よく耳にする『ディープラーニング(深層学習)』はニューラルネットワークに分類される手法で、最近これを使うことで分類の精度が飛躍的に向上した分野もあり今の人工知能ブームの火付け役になっています。『ディープラーニング(深層学習)』という名前から「人知を超えたすっごい深遠なことを考えている」と誤解する人がいるのですが単なる機械学習の一手法に過ぎません。
どうして今ブームに?
機械学習という考え方自体は昔からありました。先ほど言った今回のブームの立役者の一つ『ディープラーニング(深層学習)』も、使っている手法は昔からあるもので特に新しいものはありません。
ではなぜ今ブームなのか、それには2つの理由があります
(1)大量データ
機械学習が学習して実用に耐える精度を実現するためには大量の学習用データが必要です。昔はそれだけのデータを入手するのが困難でした。Bigdata時代とも言われる現在、データの入手が可能になりました。
(2)コンピューターの性能向上
学習は多くの調整つまみ(=パラメーター)を調整する必要があります。昔のコンピューターの性能ではこの調整に時間がかかりすぎるので大規模な調整器を作っても実用に耐える時間で学習させることが困難でした。昨今のコンピューターの性能向上で実用に耐えうる時間での学習が可能になりました。
何がすごいのか?
コンピューターを使って『過去のデータからおそらくだいたい正しい答え』を出せるような仕組みを実現できたこと、その精度が上がってきたことは大きな可能性を持っていると筆者は思います。人間の思考方法でいうと『帰納的』な推論をコンピューターに実行させることで新しい形で人間の意思決定支援を支援できるようになると思っています。
しかし、、、
世で議論されている人工知能の出来ること、その影響については誤解に基づいた意見も多いと感じています。ということで来週は
なぜ誤解が生まれるのか?その原因と対策
(*1) 今回は機械学習の概要をザクッと理解いただくため、かなりざっくりした説明になっています。機械学習で出来ることは今回説明した分類以外に回帰とかクラスターなどがあります。学習方法には今回説明した教師あり学習という手法以外に教師なし学習、強化学習などがあります。また実際はデータを訓練データとテストデータに分けて過剰適合していないかを確認するなどのステップもありますがこの説明で割愛しています。その他いろいろはしょってる部分の詳細はこの連載の中で説明していく予定です。