ディープラーニング徹底入門 〜AIトレーニング第1回〜

  1. ディープラーニング徹底入門 〜AIトレーニング第1回〜
  2. AIトレーニングキックオフ 〜ハムケツを認識したい〜
  3. AIトレーニングはじめました

今回は、ディープラーニングのイメージを掴んでもらうためにAさんにお話した内容をお届けします。

画像認識とは?

さて、突然ですが、皆さんに問題です。
以下のようにグループが分かれているものとします。

このとき、下の画像はどちらのグループになるでしょうか?

正解は「B」です。正解者の皆さんおめでとうございます!
ではなぜ「B」なのか。おそらくこう考えたはずです。

「色がポイントだ。青ければグループA、赤ければグループB。だから、この画像はグループBだろう。」

図式化すると、下記のような形かと思います。

これが画像を見分けるメカニズムで、これを機械に代替させようというのが機械学習における画像認識の分野です。
そして、機械学習の文脈では、前半を「特徴抽出」、後半を「分類」と呼びます。

画像認識の難しさ

さて、冒頭に出した問題ですが、以下のようなグループ分けだったらどうでしょう。

先ほどは「色」に注目しましたが、今度は「形」に注目して判定する必要がありそうです。
図を再掲すると以下のようになります。

このように、注目するポイントは問題設定によって異なります。
そして、この注目する部分を決める「特徴抽出」の設計は、人間が行う必要があり、大変でした。

ディープラーニングとは?

これらの作業を機械が自動的に行ってくれるのがディープラーニングです。
具体的には、この画像はグループA、この画像はグループBといったように大量の画像を機械に覚えさせるだけで良い、というイメージです。

つまり、これまでよりも簡単に画像認識ができるようになったということです。しかも、より高い精度が出るようになったということで、ディープラーニングは爆発的に広まりました。

畳み込みニューラルネットワーク (CNN)

画像認識におけるディープラーニングでは、畳み込みニューラルネットワークが用いられるのが一般的です。
教科書などでは、よく下記のような図が用いられていると思います。

縦に並んだ丸の列が「層」を表しており、上記の図は4層のニューラルネットワークを表現しています。
大雑把にいうと、最後の層の前までで「特徴抽出」を行い、最後の層で「分類」を行っていると考えてください。
本当はそれぞれの層に意味がありますが、現段階では上記の理解で十分かと思います。

次回予告

ディープラーニング(畳み込みニューラルネットワーク)のイメージを掴んでいただいた上で、Aさんに課題を設定しました。

「学習済みモデルを用いて、画像の特徴抽出を行い、次元削減を行った上で可視化せよ」

見慣れない用語が幾つか出てきましたが、調べれば理解出来る内容だと考え、上記課題としました。
次回はその内容についてお届けします。

  1. ディープラーニング徹底入門 〜AIトレーニング第1回〜
  2. AIトレーニングキックオフ 〜ハムケツを認識したい〜
  3. AIトレーニングはじめました
著者紹介
阪神タイガースと天下一品が好きなエンジニア。