第3次AIブームの火付け役、ディープラーニングとは

最終更新日:2021年02月06日

ディープラーニングとは何か

ディープラーニングとは、第3次AIブームの火付け役となったコンピューターの学習方法の一つです。コンピューターが学習することを機械学習といい、ディープラーニングもその機械学習の一種です。

ここで説明するAIは、「汎用人工知能」といわれる万能のAIではなく、「特化型人工知能」といわれる「人間と同じように見える設定ができるAI技術」のことを指します。このことを頭の隅に置いておきましょう。

この第3次AIブームにとって大変重要な、ディープラーニングについて、もう少し掘り下げて、説明していきます。

ディープラーニングの歴史

「汎用人工知能」は、人間と同じように感じ、感情を持ち、自ら考え、行動する知性ある能力を持つ機械、あるいはその機械を基に作り上げられたロボットのことを指します。“ドラえもん”や“鉄腕アトム”のようなAIロボットは、未だ誕生するまでに至っていませんが、その知性ある機械を人間の手でいつか作り出せるのではないかという思いが、何度もAIブームを巻き起こしたのでした。

第1次AIブーム、第2次AIブームは、AI機器が高性能ではなかったためにブームは消え、冬の時代が到来しました。冬の時代はAI研究が下火になり、出資者も減り、研究が進みませんでした。

しかし、時代が移ってPCの性能が格段に上がり、インターネットに常時接続され、スマートフォンで大量のデータが収集できるようになった頃から変化が訪れます。

そして、2012年夏、「深層学習の父」と呼ばれるジェフリー・ヒントン教授らがイメージネット(ImageNet)・チャレンジ」というコンテストで優勝した時に使われたのが、深層学習(deep learning)でした。

ここで、もしかして「汎用人工知能」が作られるのではないかという期待が起こり、AI業界は色めき立ったのです。

そして、このディープラーニングがきっかけで、第3次AIブームが沸き起こって、今に至ります。

ニューラルネットワークとは

ディープラーニングを語るには、ニューラルネットワークについても説明する必要があるでしょう。ニューラルネットワーク(Neural Network)は、脳神経のシナプスが同じ刺激を受けると強化されることのように、AIも同じように考え方で作ろうとコンピューターに適用したもののことです。

実際の人間の脳は本当に複雑なので、あくまでその考え方をシンプルにしたものを使った「アルゴリズム」ということです。人間の脳の仕組み(ニューロン)を真似て、単純にしたものをコンピューターに当てはめて考えたやり方ということです。

ニューラルネットワークには3つの層があります。それが「入力層」「出力層」「隠れ層」です。「入力層」は、外からのデータを受け取る層です。「猫」を「これは猫か、猫ではないか」という問いに対して「猫」の画像を見せる(スキャンする)部分です。

その「猫」の画像を見せると、「隠れ層」で受け取ったデータを分析していきます。そして、「出力層」で答えを返します。入力層で見た画像が猫ならば「これば猫である」という結果を表示させます。ディープラーニングで重要なのは、「隠れ層」です。

アルゴリズムとは

ニューラルネットワークの説明で、アルゴリズムという言葉が出てきました。アルゴリズムは、通常の会話でも時折登場します。アルゴリズムとは何でしょうか。アルゴリズムとは、簡単に言うと、「やり方」のことです。何かを行う時にどんなやり方をするかが「アルゴリズム」です。例えば、道案内。A地点からB地点に行くのに、効率が良い行き方もあれば、時間が掛かる行き方もある。その「行き方」がアルゴリズムです。

“Google検索のアルゴリズムが変わる”という話題をネットのニュースで目にした人も多いと思います。ニュースになるくらいだから、何かが変わったのだろうけれど、アルゴリズムって何なのかな、何が変わったのだろうと疑問に思いませんでしたか。

この場合のアルゴリズムは、Googleが、どのページが読む人にとって良いページかを決める「やり方」のことです。Googleは時に大きく「アルゴリズム」を変更するため、変更前は検索すると検索結果の一番先頭にサイトが表示されて(利用者に)すぐに見つけてもらえていたのに、変更後は検索結果の順位が下がり、見つけられにくくなるということがあります。それはGoogleが何を良いページと判断して、一番上に表示させるのか、「やり方」を変えてしまうからなのです。

ディープラーニングと機械学習

ディープラーニングは機械学習の一種とも言えます。機械学習(Machine Learning)とは、コンピューターにものを学ばせるための技術です。ディープラーニングは、人間の子供のように、経験から学び、理解していきます。

「猫」を例に取ると、AI(コンピューター)に膨大な猫の画像を見せて学習を繰り返すうちに、AI自身が猫の写真を見せて、「これは猫か、猫ではないか?」とAIに聞くと、猫の画像を見せると「これは猫」と答え、犬の写真を見せると「これは猫ではない」と答えられるようになったのです。

教師あり学習では「耳は三角」「猫目」「尻尾がある」など猫だと判別が付く特徴を教えてあげなくてはいけなかったのが、自分で見ながら特徴を見出し、猫と分かるようになるのがディープラーニングです。ディープラーニングでは学習方法もAIが自分で学習します。

ディープラーニングが出現してからAIの進化が格段に早くなったのです。

ディープニューラルネットワーク

ディープラーニングでは、ディープニューラルネットワークと言われる種類のものが多く使われています。これは、ニューラルネットワークの「隠れ層」が多く、100層以上のものが積み重なっているものです。

隠れ層が厚いため、出力層が深い所にあり、出力層の深さは、答えの精度が高いことにつながっています。元々のニューラルネットワークの隠れ層は、2層か3層程度だったので、層の厚みがどれだけ増したのかが理解できると思います。

ディープラーニングで画期的に進歩があった分野

ディープラーニングの技術が発達し、目覚ましい進歩があったいくつかの代表的な分野について説明します。

画像データ、画像認識

ディープラーニングが一般的になるまで難しい課題だった分野ですが、画像データが入手しやすくなった背景もあり、発展している分野です。

顔認証、工場の不良品の検出など「A」と「A以外のもの」を画像から見分けることが、迅速、かつ、正確にできます。

音声データ、音声認識

音声という波形を分析し、聞き分けることができます。AlexaやSiriのように、声を認識し、答えを返すこともできます。また、音声をテキストに変換することも可能です。近年は音声から感情を読み取るAIなどもあります。音声認識によるリアルタイム翻訳なども登場しています。

テキストデータ

チャットボット(AIを利用した自動会話プログラム)や、自動翻訳サービスなどに使われています。チャットボットは、チャットで使用者が文字入力を行うと、AIがそれに答えて対応してくれるサービスです。

自然言語処理

自然言語とは、私たちが普段話したり書いたりしている自然に使っている言語のことです。それと相対する言葉が、プログラミング言語です。

自動翻訳サービスは、以前からインターネット内にたくさんありました。今もまだ完全とは言えませんが、以前に比べて随分改良されました。どの国の言語も一つの単語にもかかわらず複数の意味を持つものが多くあります。その曖昧で複雑な自然言語を理解して、分かりやすい言葉に翻訳できるようになったのもディープラーニングの賜物です。

自然言語処理には、そのほかに画像データ上にある文字をテキストデータにすることも含まれます。例えば、写真の中の看板に書いてある文字を見つけて文字データにしたり、写真に撮った名刺の情報を文字情報として保存したりすることができます。

レコメンデーション

レコメンデーションというのは、顧客の購入履歴や訪問履歴などから、顧客におすすめの情報を提供する仕組みのことです。自分が検索していた商品や類似品が広告と表示されているのを見た人も多いでしょう。

まとめ

第3次AIブームの火付け役ともなったディープラーニングは、私たちが意識することなく使われ、浸透しています。複雑な理論や機械的と思っていたことも実は人間をもとにして考えられているということは、興味深いことです。

今はまだ狭い範囲での「特化型人工知能」といわれるAI技術を活用にとどまっていますが、発展スピードの速いAI業界においては、思ったより近い将来、より人間的な「汎用型人工知能」も登場するかもしれません。