KUMICO

COLUMN

ディープラーニングとは~サッカーに例えて説明してみる~

このコラムでは、家庭でテレビなどを見ていても目にする「AI」、「人工知能」のブームの火付け役としてあげられる「ディープラーニング」をサッカーのフォーメーションに例えて説明します。

「ディープラーニング」は特徴を見つけるアルゴリズム

今のAI・人工知能ブームの火付け役となったディープラーニング。なぜここまで有名になったのかというと、ディープラーニングが登場したことで、時にはコンピュータが人間を超える精度で判断や予測を出来るようになったことがその理由かと思います。ディープラーニングを用いると、コンピュータはなぜ人間を越える精度で判断や予測をできるようになったのでしょうか。まずはここから簡単に説明していきましょう。

ディープラーニング登場以前は、コンピュータが何かしらの判断・認識をするための学習には人間がコンピュータに特徴を教える必要がありました。しかし、ディープラーニングを用いるとコンピュータが特徴を自ら発見できるようになったのです。しかも人間が気がつかない・人間には見分けがつかないような特徴までも発見できるようになったために、時に人間を超える精度で判断・予測ができるようになったのです。わかりやすく例で考えて見ましょう。たとえば双子を見分けるプログラムを作るとします。ディープラーニングがない時代には、プログラムでその顔画像がお兄ちゃんか弟かを判断するなら、プログラマーが目と耳を見るとわかるよといった特徴をプログラムとして記述していました。当然プログラムは教わった通りに目と耳でお兄ちゃんか弟かを判断するのです。しかしながらディープラーニングを使うと、お兄ちゃんと弟の画像をディープラーニングで学習させると、お兄ちゃんと弟の判断をするなら目と耳を見るといいという特徴をプログラムが自ら自動で発見することができるようになりました。さらにはプログラマが気がつかなかった目や耳よりも唇の方がもっと特徴的で判断しやすい といったことまで発見できるようになったのです。

ディープラーニングというアルゴリズムの登場により、人間には気がつかない特徴の抽出が可能となり、その特徴を用いた判断を行うことで時には人間を超えるような精度の結果を出すことができるようになりました。その結果、今のAI・人工知能がここまで盛り上がったと私は考えています。

ディープラーニングは特徴をどうやって見つけるのか

ディープラーニングはニューラルネットワークという人間の神経細胞の構造を模したアルゴリズムがベースとなります。ニューラルネットワークは入力層、出力層を含む複数の層で構成されます。各層には複数の細胞(ニューロン)が含まれ、各層のニューロンは次の層のニューロンに情報を伝達することができます。つまり入力層のニューロンに入った情報は中間層を通り出力層のニューロンに出力されるのです。

サッカーの4-2-4のフォーメーションを思い浮かべるとわかり易いかと思います。ディフェンダーが入力層で4つのニューロンで構成される、ミッドフィルダーが中間層で2つのニューロンで構成される、フォワードが出力層で4つのニューロンで構成される。ディフェンダーの4人はミッドフィルダーの2人に情報を伝えることができます。同様にミッドフィルダーの2人はフォワード4人に情報を伝えることができます。ここで出力層であるフォワードに伝わる情報が、入力層であるディフェンダーが伝えた情報となるべく同じになるように伝える情報を変更しながら調整していきます。

まずは理解をしやすくするために、4-4-4のフォーメーションで考えてみましょう(※実際のサッカーでは有り得ないフォーメーションですがここでは説明のために使います)。ディフェンダー4人にお兄ちゃんの目、鼻、耳、口の情報を伝えます。ディフェンダー4人はミッドフィルダー4人に目、鼻、耳、口の情報を伝え、ミッドフィルダー4人はフォワードに目、鼻、耳、口を伝えます。この場合、ディフェンダー4人が伝えた情報がそのままフォワードに伝わることになり特に調整せずに終わります。

それでは4-2-4のフォーメーションの場合ではどうでしょうか。ディフェンダー4人は、ミッドフィルダーに情報を伝えようとしますが、ミッドフィルダーは2人しかいません。そこで初めにミッドフィルダーに目、鼻の情報を伝え、フォワードに伝わった結果が、お兄ちゃんらしいかを判断します。次にミッドフィルダーは目と耳の情報を伝えて、最終的な結果がお兄ちゃんらしいかを判断します。このように伝える情報を調整しながら、最終的にお兄ちゃんらしくなるよう調整を行います。結果的には目、耳、鼻、口の中で特徴的である目、耳の情報を伝えたときがお兄ちゃんらしい情報となったとします。この段階で鼻と口の情報は無視されてしまっているのですが、結果として目と耳が特徴として抽出されたわけです。

ディープラーニングはこのように、中間層のニューロンを減らした状態で入力層と出力層の結果がなるべく同じになるように調整することで特徴を抽出するのです。勘の良い方ならば理解頂けると思いますが、中間層で入力情報を劣化させないように抽象化を行うことで特徴の抽出を行っているのです。

ディープラーニングのこれから

ディープラーニングにより人間が見つけられないような特徴を抽出することが可能となり、人間超えと言われるような成果も出ています。つい最近みたテレビでは、アメリカの警察が天気、周辺のイベント、気温など様々なパラメータから犯罪が起きそうな地域を予想し、警察官を配備することで検挙率のアップにつながっているという事例が紹介されていました。しかし、実際に予期した犯罪と検挙した犯罪が同一だったのかどうかなどの検証はまだ出来ていないようですディープラーニングにより人間を超えるような結果を出すことが出来るようになりましたが、現段階において危うい要素も多数あります。本コラムの例でいえば、このおでこだからお兄ちゃんと判断しましたとコンピュータが言っても人間には理解できないのです。なぜこのおでこだとお兄ちゃんなのかという検証を人間にも理解できるようにすることが、今後のディープラーニングの応用では必要な要素になってくると私は考えます。

個別相談も承っております。下記よりお申し込みください。

個別相談会申し込み

関連記事

OTHER COLUMN

MORE  

まこちゃんブログ

NEWS

MORE  

PARTNER

  • Intel
  • Xilinx

お探しの組み込み製品はキーワードで検索!