人工知能・機械学習・ディープラーニングとは? Udemy【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 初級編 –

【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 初級編 - Udemy

私は以前から、人工知能や機械学習を学んでみたいと強く思っていた。しかし実際に数冊本を購入して勉強を試みたところ、残念ながら途中で挫折してしまった。

Webプログラミングに関しては、プログラミングスクール「ウェブカツ!!」の動画教材が私の性分に合っていたのか、すんなりと身に付けることができた。

人工知能や機械学習も、動画教材であれば同様にうまく学習できるのではないかという淡い期待を抱きつつ、Udemyで講座を探したところ、以下の講座がとても評判が良いようだ。

>> 【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 初級編 –

実際に購入し視聴してみたが、評判通りの非常に分かりやすい講義だった。機械学習を学ぶ上で必要となる数学も丁寧に説明されている。動画学習の利点は、効率が良く知識のイメージが得られる点にあると思う。知識の整理や詳細の学習に書籍は欠かせないが、何かを学ぶ上でまずは動画で全体のイメージを得るというのは、とても効率が良い学習方法であると思う。

この記事は、上記「【キカガク流】~ – 初級編 – 」で学んだことを自分の中で整理するためにまとめているだけなので、詳細を知りたい方はUdemyの動画を視聴してほしい。

人工知能・機械学習・ディープラーニングの違い

人工知能(AI)、機械学習、ディープラーニングの技術的な位置付けは、図で表すと次のようになる。

人工知能・機械学習・ディープラーニングの違い

つまり、ディープラーニングと呼ばれる技術は、機械学習という技術の一部であり、また、機械学習は人工知能(AI)に関する技術の一部であるということ。

人間と同等の仕事をコンピュータに行わせる技術が人工知能(AI)だ。ただし、人間が持つ機能をコンピュータに落とし込むためには、次のようないくつかの処理について考える必要がある。

  • 人間であれば目から光の情報を、耳で音の情報を取得しているが、コンピュータでこれを行うためには、センサーで情報を取得する必要がある。
  • 目からの情報であれば画像データに、耳からの情報であれば音声データにそれぞれ変換して、コンピュータ内部で扱える形にする必要がある。
  • 目からの情報(画像データ)や耳からの情報(音声データ)など、複数の異なる形式の情報を統一した形式に変換し、コンピュータが計算できる数値として表現する必要がある。
  • コンピュータが扱える数値に変換された情報(入力X)から、何らかの判断(出力Y)を下すためのロジックが必要になる。
  • コンピュータ自ら、入力X(例えば画像)から出力Y(猫の画像であるかどうか)を判定するためのロジックを見つけ出させるためには、大量のデータからコンピュータに学習させる必要がある。

これらのことを図に表すと次のようになる。

人工知能・機械学習・ディープラーニングの関係

このように機械学習は、コンピュータ内部で数値化された入力Xから出力Yを得るための規則(ロジック)を見つけ出すための技術だ。

一方、ディープラーニングは、そのような規則を見つけ出すためのアルゴリズム(手順)の1つに過ぎない。他にもSVM(サポート・ベクター・マシーン)や単回帰分析など多数のアルゴリズムが存在する。

また、ディープラーニングは学習データの数が多くないとうまく機能しない、単回帰分析はデータの数がそれほど多くなくても機能するが小回りが利かない、などの特徴がある。

このように各アルゴリズムにはそれぞれメリット・デメリットが存在するため、常にディープラーニングを用いるのが最適というわけではない。

この講座 「【キカガク流】~ – 初級編 – 」 では、単回帰分析に焦点を当てて、機械学習の初歩を分かりやすく説明してくれている。理解するための数学の知識や、プログラムを組むための Python の講義もふくまれているので、人工知能・機械学習の勉強を始めたいと思っている人にオススメな講座だ。

>> 【キカガク流】人工知能・機械学習 脱ブラックボックス講座 – 初級編 –

機械学習に必要な数学

機械学習で必要になる数学は、主に次の3つ。

  • 微分・積分
  • 線形代数
  • 確率・統計

これらの知識がないと、機械学習を理解することはできない。ただ、それぞれの分野について網羅的な知識が必要かというと、そうではなく、機械学習を学ぶという観点からは必要のない事柄も多い。

この講座 「【キカガク流】~ – 初級編 – 」 では、機械学習を学ぶという観点から必要となる数学の知識を最小限に絞り、機械学習を学びながら必要な数学も学んでいくというスタイルをとっている。

機械学習の3大トピック

上で、「機械学習は、入力Xと出力Yの関係性を見つけるための技術」と説明したが、実はそれは機械学習のもつ1トピック(教師あり学習)に過ぎず、機械学習には大きく分けると次の3つのトピックが存在する。

  • 教師あり学習
  • 教師なし学習
  • 強化学習

教師あり学習

「教師あり学習」とは機械学習の手法の一つであり、これが先ほどの「入力Xと出力Yの関係性を見つけるための技術」に該当する。

そしてこの教師あり学習は、さらに次の2つのトピックに分けられる。

  • 回帰 ーー 数値(連続値)を予測するための手法
          例:部屋の広さXから家賃Yを予測する。
  • 分類 ーー カテゴリを予測するための手法
          例:ワインのアルコール度数Xから種類Y(赤ワイン or 白ワイン)を予測する。

教師あり学習は、「何か(出力Y)を予測したい」という課題に対して用いられる手法といえる。

教師なし学習

教師あり学習が「何か(出力Y)を予測したい」という課題に対して使用される方法なのに対し、教師なし学習は、「データ(入力X)の特性を知りたい」という課題に対して使用される方法。学習の際に、正解となる出力Yが与えられない、という特徴がある。

教師なし学習は、大きく分けると次の2つのトピックがある。

  • クラスタリング ーー ある集団(入力X)から似ている特徴を見出し、分類するための手法
  • 次元削減

強化学習

強化学習は、学習させるためのデータX、Yを与えずに、試行錯誤を通じて一番いい行動を学習させる手法。

教師あり学習

内挿と外挿

  • X = 1, Y = 2
  • X = 2, Y = 4
  • X = 4, Y = 8

という学習データ(過去のデータ)があったとする。このデータから「X = 3」のときのYの値を予測することはOKだが、「X = 5」のときのYの値を予測することはダメ。

「X = 3」のような学習データの範囲内(X = 1 ~ 4)の領域で予測することを内挿という。一方で、「X = 5」のような学習データの範囲外の領域で予測することを外挿という。

教師あり機械学習では、内挿の領域内でしか予測できることを保証しない。外挿の領域での予測は保証外なので注意が必要。

株価の予測は可能か?

過去のデータから未来の株価を予測することを考えた場合、時間という視点で考えると、未来の価格を予測することは外挿なのだから、未来の株価の予測に教師あり学習を使用できないのか?

時系列のデータの場合は、学習データの株価の範囲内なら内挿になるらしい。一方で、学習データの範囲外の株価は外挿となり予測することはできない。

微分

機械学習を学ぶ上で必須の数学の一つである微分。

タイトルとURLをコピーしました