深層学習(Deep Learning)システムの重要性・仕組み・できることを紹介

深層学習(Deep Learning)システムの重要性・仕組み・できることを紹介

深層学習(Deep Learning)の重要性

昨今の日本では、科学技術の進化によるAIブームが巻き起こっていますが、そのブームの火付け役となったのが深層学習です。深層学習は今やいろいろな分野に活用できるといわれており、人間よりも素早くかつ高い精度で処理することが出来るので、今後の技術発展のためにも必要であると考えられています。

また、技術発展の面のみでなく、私たちの日常生活をより豊かにさせるといった場面でも用いられることから、研究者でない私たちもこの深層学習の発展からは目が離せません。

そんな深層学習ですが、「名前だけを聞いたことがある」、「はじめてその言葉を耳にした」という方も多いのではないでしょうか。今回は、以下で深層学習についてどういったものなのかを紹介いたします。

深層学習とは?

ここでは深層学習や機械学習、AIとの違いなどをご紹介!

機械学習との違い

では、まず初めに「機械学習」との違いについて見ていきましょう。

深層学習とよく比較される機械学習ですが、その意味は全く異なります。実は、深層学習は機械学習の一種です。より詳しく言うと、機械学習の中でも最近になってとても注目されているのがこの深層学習です。では、なぜ深層学習がこれほどまでに注目されているのでしょうか。

その大きな理由は特徴量の発見にあります。

従来、深層学習が登場するまでの機械学習では、教師あり学習といったものが主流でした。ここで、教師あり学習とは、人間がAIにいくつかの画像とその正解ラベルを与えて、コンピュータに学習させるといったものです。少し具体例を見ていきましょう。

例えば、犬と猫の画像を見せられてどちらが犬かを判断できるようなAIを作ることを考えます。コンピュータは初め、犬と猫の外見を知らないわけですから、私たち人間が学習させる必要があります。

どのように学習させるかというと、犬と猫の画像を数万枚ほど見せて、その画像の一つ一つに犬の画像ならば「犬」、猫の画像ならば「猫」といった正解のラベルを付けておきます。

それにより、AIは「こういった見た目のものが犬なのだな」といったように人間が犬と猫の違いをプログラムしなくても、勝手に学習してくれます。これが従来の機械学習で行われていた教師あり学習です。よく考えてみると、犬と猫の違いを言葉で伝えるのって難しいですよね。こういったものを解決できるのがこの学習手法の特徴です。

しかし、この学習方法には限界があります。第一に、先ほど猫と犬との違いを判別するようなAIを考えましたが、このようなAIはあまり実用的ではありません。それは例が悪いじゃないかと思うかもしれませんが、教師あり学習を使ったAIには、人間が当たり前のようにできることしかできません。

例えば、人間が答えを出すことの難しい問題があったとします。教師あり学習では、人間がAIに正解を与えなくてはならないため、このような人間には不可解な問題はAIも解くことが出来ませんでした。

また、多くのデータに正解のラベルを与えなくてはならないため、とても手間がかかります。これを行ってほしい処理の数だけやらなくてはならないため、効率が悪いのも教師あり学習のデメリットです。それをうまく解決したのが深層学習です。

深層学習では、AIが自ら特徴量を発見し、データの違いを理解します。要するに、先ほど与えていた正解のラベルが不要なのです。これにより、先ほどの問題を解決するとともに、より素早く正確な結果を出すことに成功しました。

AIとの違い

では次に、AIとの違いについて考えていきます。

こちらもよく、同じ分野で使われる言葉ですが、意味が異なります。簡単に言うと、深層学習などの機械学習を行うコンピュータのことをAIというのです。あくまでも、機械学習や深層学習は学習手法であり、AIはそれを実現するためのコンピュータなのです。その違いをよく押さえておきましょう。

では、ここから深層学習の仕組みについて見ていきましょう。

深層学習の仕組み

データを与えるだけで特徴量を自身で判断し、学習するといった素晴らしい機能を持った深層学習ですが、いったいどのようにして作られているのでしょうか。

実は、深層学習の仕組みとしては、人間の脳神経細胞のつくりをもとにしています。人間のように考える機械を生み出したいのだから人間の脳つくりを参考にしようといった試みですね。では、人間の脳神経細胞のつくりについて少し見ていきましょう。

人間の脳神経細胞は、3つの層から構成されており、外からの刺激を受け取る入力層、その刺激を処理する中間層、そして処理した結果を伝える出力層があります。これらの層をつなぎ合わせることで、人間は外からの刺激に対する処理を行っているのです。ちなみに、この構造のことをニューラルネットワークと呼んだりしています。

深層学習の仕組みは、このモデルを参考にして作られます。しかし、人間と同じようなものを作ろうとすると、間違いなく人間の劣化版が出来ます。なので、中間層を多層化するのです。こうすることで、より複雑な処理を行えるようになります。この構造のことは、先ほどのニューラルネットワークに対して、DNN(Deep Neural Network)と呼ばれています。

しかし、最近ではこのDNNをさらに改良して進化させたような例もいくつかあるので、それについても簡単に紹介します。

畳み込みネットワーク(CNN)

まず一つ目がCNNです。CNNは画像認識を行うAIに用いられている構成法で、先ほどのDNNの中間層にあたる部分を改良します。

具体的にどのように改良するのかというと、中間層にある役割を与えます。DNNでは、どの中間層も同じような役割を持っていたのに対して、CNNでは、中間層をグループ分けして異なる役割を設けるのです。

リカレントニューラルネットワーク(RNN)

続いて、RNNです。RNNとは、DNNにおける中間層の部分にループの処理を加えた構成法のことです。これにより、音声や自然言語などの時系列的に処理するようなものが実装可能になりました。

Generative Adversarial Network(GAN)

GANとは、生成器と識別器といった二つのニューラルネットワークを用いた構成のことで、こちらは主に画像の生成に使われています。ここで、生成器や識別器の簡単な紹介をします。

生成器とは、画像を生成するための機構のことです。これだけ聞くと生成器のみでGANを実現することが出来そうなのですが、それは不可能です。なぜなら、コンピュータにとって画像を生成するといったことは非常に複雑な処理であり、いくら生成器といえども、精度が高い画像をはじめから作ることはできないからです。

そのため、識別器とセットで使います。識別器とは、生成器が作成した画像と、今生成したい目的の画像を見比べて、どちらが目的の画像かを識別するための機構で、生成器は識別器をだますようにうまく画像を作ります。

初めのうちは、先ほど述べた通り生成画像の精度がさほど高くないため、すぐに見破られてしまいますが、トライ&エラーを繰り返すうちに精度が増します。これが、GANの仕組みです。

Transformer

Transformerは、比較的最近登場した構成法で、Attentionと呼ばれるモデルを用いています。

Attentionとは、自然言語の文脈を考慮して単語の意味を導出するといった機構であり、これにより、自然な翻訳機能が実現可能となりました。

深層学習(Deep Learning)でできること

以下では、深層学習でできることとして主要な4つの例を紹介します。

画像認識

深層学習でできることとして、まず初めに画像認識があります。

日常的に使われる例としては、iPhoneの顔認証パスワードや、カメラについている感情分析、また最近よく使われている加工アプリなどがあげられます。

音声認識

音声認識の例としては、これもみなさんご存じの通りiPhoneの初期機能であるSiriや、グーグルやヤフーなどの会社が使っている音声入力などがあります。

自然言語処理

こちらは、コールセンターでの問い合わせや機械翻訳なんかに使われています。数年前はあまり精度が高くなかった自然言語処理の分野ですが、最近では、すごいスピードで進化しており、より自然な処理が可能となりました。

異常検知

異常検知とは、センサー等の時系列データから異常の兆しを感知する技術のことで、工場などで使われています。

 

まとめ

ここまで深層学習の仕組みやできることについて紹介してきましたが、深層学習についての知識を蓄える良いきっかけになったでしょうか。

深層学習は間違いなくこの先多くの場所で導入されていくので、深層学習に対する理解を持ってうまく扱えるような人間になれると良いですね。

 

この記事の執筆・監修者
Aidiot編集部
「BtoB領域の脳と心臓になる」をビジョンに、データを活用したアルゴリズムやソフトウェアの提供を行う株式会社アイディオットの編集部。AI・データを扱うエンジニアや日本を代表する大手企業担当者をカウンターパートにするビジネスサイドのスタッフが記事を執筆・監修。近年、活用が進んでいるAIやDX、カーボンニュートラルなどのトピックを分かりやすく解説します。

AI・人工知能カテゴリの最新記事