オルタナティブ・ブログ > ITソリューション塾 >

最新ITトレンドとビジネス戦略をわかりやすくお伝えします!

【図解】コレ一枚でわかる機械学習とデータサイエンス

»

スクリーンショット 2018-12-10 7.49.43.png

世の中の森羅万象を理解したいという科学者たちの飽くなき探究心が科学を発展させてきました。彼らは、様々な現象を観察し、そこに秘められた規則性や法則性について仮説を立て、実験を行って検証をしました。その事実をさらに考察し、その現象が生じるルールを見つけ出してきたのです。ニュートンの「運動方程式」、アインシュタインの「質量とエネルギーの等価性」を意味する「E = mc2」方程式などがこれに相当します。

この方程式の変数に入力として数字を当てはめれば、この方程式に組み込まれたルールに従って、結果が出力されます。私たちは、このような「ルール」すなわち「ものごとを理解するモデル」を使って、ものごとを理解したり課題を解決したりしてきたのです。

スクリーンショット 2018-12-10 7.49.57.png

機械学習は、このルール、すなわちモデルをデータの中から見つけ出そうというものです。例えば、肺癌患者のレントゲン写真を「肺癌がある」という情報とともに機械学習プログラムに読み込ませます。このとき入力されるレントゲン写真が「学習データ」です。そうすると「肺癌がある」とはどういう特徴の組合せパターンなのかをプログラムが見つけ出そうとします。ただ、一枚の写真だけでは際だった特徴を見つけ出すことはできません。そこで、同様の処理を大量のレントゲン写真で行うことで、「肺癌がある」場合に共通する際だった特徴の組合せパターンを機械学習プログラが見つけ出してゆきます。

こうして生成されたレントゲン写真に写し出された肺癌であることの「特徴の組合せパターン」を「モデル」として用意しておきます。これに未知の肺のレントゲン写真を入力すると「肺癌がある」ことを示す「特徴の組合せパターン」と照らし合わせて、肺癌があるかないかを判別することが可能になります。

このように、人間の思考によらずデータを分析することで「ルール」すなわち「モデル」を生成するのが機械学習です。

機械学習で生成されたモデルは「E = mc2」のようなすっきりした方程式にはなりませんが、結果として「有効」であるとされれば、それが使われるようになります。また、我々には気付かなかった規則性や法則性を見つけ出してくれる可能性もあります。一方で、なぜそうなるのかを明確に説明できないことが課題でもあり、「説明できる機械学習」を実現しようという研究も行われています。

ただ、結果として「有効」であることの判断やこれをどのようなことに役立てるかは、人間の役割であり、機械学習プログラムが自分で決めてくれることはありません。また、「有効」となるような学習データを揃えることや適切な機械学習のアルゴリズムを選択することも人間の役割です。

機械学習を使えば便利なことはいっぱいありますが、それを使いこなすための人間の役割は広範に及びます。それを明らかにし整備してゆく学問領域がデータサイエンスです。

動画セミナー(会員のみ)を開始!最新トレンドの講義を聞ける。
ITビジネス・プレゼンテーション・ライブラリー/LiBRA

LiBRA 12月度版アップデート====================
・「動画セミナー」をご覧頂けるようになりました。12月時点では、ITソリューション塾・第29期・第6回までの10講義をご覧頂けます。今月は6つの講義を新たに掲載しました。
・ITソリューション塾・講義資料を最新の第29期に置き換えました。
・基礎的なことに重点を置いて資料をアップデートしています。
========================================

動画セミナー *会員限定*
【新規】量子コンピュータ
【新規】RPA
【新規】ブロックチェーン
【新規】データベース
【新規】ストレージ
【新規】これからの開発と運用

【改訂】総集編 2018年12月版

ビジネス戦略編
【新規】SI事業者とお客様のカタチ p.54

人材開発編
*変更はありません

サービス&アプリケーション・先進技術編/IoT
【新規】MaaS p.50
【新規】MaaS レベルの定義 p.51

サービス&アプリケーション・先進技術編/AI
【新規】統計学と機械学習の違い p.12

サービス&アプリケーション・基本編
*変更はありません

サービス&アプリケーション・開発と運用編
【新規】これからの開発と運用のあるべき姿 p.4
【更新】これからの開発に求められるもの p.6
【新規】ビジネス・スピードを加速する方法 p.65
【新規】開発の自動化とは p.84

ITインフラとプラットフォーム編
【新規】リレーショナル・データベースの系譜 p.150
【新規】リレーショナル・データベースの革新性 p.151
【新規】リレーショナル・データベースの限界 p.152
【新規】仮想化の普及によるストレージの限界 p.222
【新規】NVMeとNVME-oF p.227

クラウド・コンピューティング編
*変更はありません。

テクノロジー・トピックス編
*変更はありません。

ITの歴史と最新のトレンド編
【新規】インターネットに接続されるデバイスの数の推移 p.14

ブロックチェーン
【新規】ブロックチェーンの適用範囲
【新規】ブロックチェーン活用事例

量子コンピュータ
【新規】量子コンピュータの課題/デコヒーレンス状態 p.13
【新規】量子コンピュータの課題/絶対0度で原子・分子の動きを停止 p.14

Comment(0)