前回に引き続き、近年注目されているディープラーニングについて、具体的に「Keras」というフレームワークを「R」で利用しながら、解説していく。ディープラーニングは、理論的には難しい点もある。しかし、ゼロから実装するのでははく、フレームワークを利用すれば、誰でも比較的容易に実行することができるようになってきた。そのため、ディープラーニングの大衆化といわれているほどに普及しつつある。
第5回でも紹介したように、ディープラーニングを行う際にも、多くのフレームワークが提案されている。
- Tensorflow・・・Googleの開発しているフレームワーク。
- Keras・・・非常に簡単に実装できる。そのため導入としてよい。
- Chainer・・・日本のpreferred networksで開発されている。
それ以外にもMxnetなどがある。
それぞれ設計の思想があり、利用できるプログラミング言語も異なっている。
ここで扱うKerasというのは、プロジェクトONEIROSの研究で開発され、GoogleのエンジニアのFrançois Cholletがつくったものだ。
Kerasのメリットは、最小限の記述で実行でき、初心者でも容易に実装できるわかりやすさにある。人工知能の普及や、大衆化といったことも言われている現在、その一役を担っている。一方、デメリットとしては、ブラックボックス的に処理してしまうため、中身を細かく理解せずとも使えてしまうという点や、自分で拡張をする場合に問題が出る可能性がある点だ。
Pythonでも提供されているが、ここでは前回同様にRで行う方法を解説する。
まず、分析の大きな流れについて紹介しよう。実行には、大きく五つのステップがある。細かい用語については第5回も参考にしてほしい。
0.フレームワークの入手
1を始めるまえに、実際にRを用意し、Kerasをダウンロードして、インストールするなどの準備が必要である。
1.データの用意
トレーニングデータのラベル、ラベルに関連するデータ、評価データのラベル、ラベルに関連するデータを準備する。
2.モデルの設定とコンパイル
どのようなネットワークにするかを、ここで指定する。またコンパイルの部分で「損失関数」(予測結果と実際の結果の違いを評価したもの)の指定や、損失からどのようにネットワークの重みを更新するか(「最適化器」)なども指定する。
ネットワークの設定では、隠れ層における「ノードの数」の指定、そしてreluなどの「活性化関数」の指定、層をいくつにするかの指定、dropoutを行うかということなどを指定する。
また、コンパイルの部分では「損失関数」や「最適化器」の指定を行う。これらは、学習で用いられる細かい設定である。学習というのは、図表2にもあるように予測した結果と実際の結果とのずれを損失関数で計算し、最適化器で適切にネットワークの重み(パラメータ)を更新していくことだ。例えば、「カテゴリカルデータのときは,cross-entropyなどを用いる」といったことを指定する。最適化器では、SDG(確率的勾配降下法)、RMSprop、adamなどが用意されており、これらを利用する。
3.学習
学習では、ミニバッチ確率的勾配降下法(SGD)を用いる場合の細かい設定を行ったうえで、実際にデータを用いてネットワークの重みの推定を行う部分だ。具体的にはミニバッチ(学習する際のデータの一部を抜き出したデータ)や、エポックと呼ばれる繰り返しの回数などを指定する。詳細は次節でのべる。
4.評価
評価では、(1)で用意したテストデータのラベルに関連するデータと、学習したモデルを用いて、実際にラベルを予測し、その結果がもとの結果をどの程度正確に予測できているかを評価する。
5.予測
最後に、学習したデータを用いて、新しいデータが入力された場合に、どのようなラベルになるかなどの予測を行う。
以上の五つが大きな流れである。これらに基づいて2節では具体的にRにおいてKerasを用いた実装について説明する。
参照コンテンツ
【シリーズ】マーケティングのための人工知能入門およびその周辺技術
- (1)人工知能とその社会的インパクト
- (2)人工知能とは
- (3)機械学習の入門およびマーケティング
- (4)ディープラーニングなどの新たな機械学習と因果などの限界
- (5)実践:今日からはじめる機械学習とディープ・ラーニング
- (6)Rを用いたディープラーニング入門
おすすめ新着記事
「食と生活」のマンスリー・ニュースレター 管理職は筋トレ率2倍! 20〜30代の美容・健康意識が市場をけん引
健康意識の高まりや筋トレブームなどを背景に、プロテイン関連市場が成長しており、高たんぱくをうたうお菓子や、レトルト食品なども目にするようになった。今回は、プロテイン食品をどのような人が利用しているのかについて調査した。
成長市場を探せ コロナも値上げも乗り越えて成長するドラッグストア(2025年)
ドラッグストアが伸びている。コロナ禍でも医薬品や消毒薬、マスク、日用品などが好調で成長を続けた。2014年から23年の10年間で、チェーンストアの販売額がほぼ横ばい、コンビニエンスストアでも約1.2倍なのに対して、同期間でのドラッグストアの売上高はほぼ1.7倍に達する。
消費者調査データ キャッシュレス決済 利用経験ついに5割超え 「PayPay」独走態勢なるか
成長著しいキャッシュレス決済サービスのブランドを調査。コード決済の雄、「PayPay」の強さが際立つ結果となった。全項目で首位を獲得したうえに、認知率はほぼ8割、経験率は5割をこえて6割に迫り、全体の半数に利用意向がみられる。