【徹底解説!】ディープラーニングとは何か、1から解説してみた①

ビジネス

近年、新たな技術として注目を集めてきたディープラーニング(深層学習)は、多くの人々が日常生活の中で、耳にする言葉まで成長を遂げてきました。しかし、殆どの人々が表面上の言葉だけを理解し、実態を掴めていない人が多いように感じています。

この技術は、いずれ迎えるであろうシンギュラリティ(技術的特異点=機械が人間を超える時代)に向けて、様々な問題を解決し、不可能だと思われていたことを可能にしていくことが期待されています。

そこで今回は、ディープラーニングとは何かを明らかにするために、人工知能や機械学習など順を追って1から解説していきます。興味がある人は是非目を通してみてください。

人工知能(AI)とは

深層学習について学ぶ前に、まず、人工知能(artificial intelligence=AI)について知る必要があります。なぜなら、深層学習は、人工知能の技術的要素の一つであるからです。

深層学習は、2012年に画像認識で注目されてから様々な発展や問題解決の一翼を担ってきました。しかし、それよりも遥か昔に人工知能という言葉は生まれています。具体的には、1956年アメリカのダートマス会議で、人工知能研究者であるジョン・マッカーシーが初めて使った言葉になります。それから50年以上の時間を超えて、日本で深層学習という言葉は一般的に普及をしてきました。

人工知能には、様々な研究者が定義づけを行っています。その中からいくつか紹介をするので、読んでみて自分が分かりやすい言葉で理解をしておきましょう。

【人工知能の定義】

定義についてはバラバラですが、人間の力と同等またはそれ以上の力をコンピュータが発揮するという点では近しいようにも感じます。他にも多くの研究者が人工知能の定義については行っているので気になった人は検索エンジンで調べてみることをおすすめします。

※以下のリンクから見れるディープラーニング協会でも明確な人工知能の定義はないと言われています。

協会について
当協会設立の背景及びその設立目的と、協会概要について

人工知能の多様な側面

大学の教授の定義が揃っていないことからも、私たちの中ではさらに人工知能へのイメージは曖昧になっています。人工知能は一面的に見るのではなく、その中の技術レベルによって多様な側面で形成されています。その中の技術の一つに深層学習は存在しています。

今回は、人工知能を「教師あり学習」「教師なし学習」「強化学習」という3層の技術レベルに分けて解説していきます。一般的にわかりやすいのは、お掃除ロボットがあると思います。これは「教師あり学習」に当てはまる機体が多く、”自分の部屋の間取り”という正解のデータを軸として、掃除経路パターンを学習していきます。また、教師あり学習は、分類と予測、実行と呼ばれる3つの領域に渡り、深層学習は特に分類と実行で力を発揮します。

「予測」のテクノロジー

この分野での日常生活における応用領域は、数値予測やニーズ・個人的な興味の予測などに役立ちます。そしてここで用いられる数学的手法としては、線形回帰や重回帰などが挙げられます。

回帰とは、例えばテレビのCM放映数が増加すれば、その商品の売り下げも増加するという傾向があるとします。この傾向から実績値との誤差が最小になる直線を以下の図に示します。この直線式の傾向があれば、テレビCM放映数を「x」としたときに売上予想額「y」を求めることができます。このように一定の傾向の式に当てはめ「x」の数値から別の要素である「y」を求めることを”単回帰分析”と言います。”重回帰分析”はこの右側のyの変数が複数の要素で構成されている時のことを指します。

【単回帰分析について】

回帰分析(単回帰分析)をわかりやすく徹底解説!|Udemy メディア
データを分析する上でかかせない回帰分析について、メリットやデメリットなどを交えて解説します。実際の活用法にも触れていますので、ぜひデータ分析の参考にしてみてください!また、回帰分析を用いて売上予測をする手法が身につけられる動画も紹介します。

つまり、既にあるデータから自動的に傾きと切片が決まり、そこにxやyの変数を当てはめることで予測値を導いていくとが、ここでの「予測」のテクノロジーの実態となります。言い換えると、人工知能では、元となるデータが重要であり、予測される結果に密接に関わってくると言えます。

こうしてビジネス的な予測が人工知能によって実現できることも、多くの人がこぞってAI領域に投資をしている一つの要因となります。AIの技術自体をビシネスにする人もいますが、多くの企業では自分たちのビジネスモデルに上手く人工知能を組み合わせて利益拡大を図っていることが多いです。こうしてどの事業領域にも人工知能つまりIT分野は密接に関わっているため、実質、各業界の境界線は崩壊していると言われてきています。

こうして人工知能の技術の一片だけでも、業界を再編させていると理解すると良いかもしれません。では、続いて分類の領域について詳しくみていきましょう。

「分類」のテクノロジー

この分野における応用分野としては、代表的に画像識別があります。ここでは「類似度」と呼ばれるデータ間の距離を元に、データの分類をしていきます。下記の図におけるデータAとデータBの距離をユークリッド距離と言います。この距離は、中学校で習う三平方の定理で求めることができますが、ユークリッド距離が短いほど類似度は高いと言えます。これ以外にも「コサイン類似度」など類似度を測る尺度はありますが、ここでは類似度を用いうることで分類ができると理解しておくと良いでしょう。

教師あり学習では、元となる教師データと類似度が近いデータとそうではないデータに分類することができます。例えば、猫の画像の教師データがあれば、それをもとに類似度を比較して犬の画像との分類をすることができるようになります。

最後に

今回は、深層学習の元となる人工知能の「教師あり学習」について説明をしてきました。深層学習にたどり着くための基盤となる前提知識ですので、しっかりとものにしておきましょう。次回は、「教師あり学習」の”実行”部分について詳しく解説していきます。ニューラルネットワークなど新たな知識も出てくるので、根底からゆっくりと紐解いていきます。

コメント

タイトルとURLをコピーしました