日本最大級のマーケティングサイト J-marketing.net


(2019.03)
マーケティングのための人工知能入門およびその周辺技術
(6)Rを用いたディープラーニング入門
客員研究員 沖縄国際大学 金城敬太






 前回に引き続き、近年注目されているディープラーニングについて、具体的に「Keras」というフレームワークを「R」で利用しながら、解説していく。ディープラーニングは、理論的には難しい点もある。しかし、ゼロから実装するのでははく、フレームワークを利用すれば、誰でも比較的容易に実行することができるようになってきた。そのため、ディープラーニングの大衆化といわれているほどに普及しつつある。


1.はじめに

 第5回でも紹介したように、ディープラーニングを行う際にも、多くのフレームワークが提案されている。

  • Tensorflow・・・Googleの開発しているフレームワーク。
  • Keras・・・非常に簡単に実装できる。そのため導入としてよい。
  • Chainer・・・日本のpreferred networksで開発されている。

 それ以外にもMxnetなどがある。

 それぞれ設計の思想があり、利用できるプログラミング言語も異なっている。

 ここで扱うKerasというのは、プロジェクトONEIROSの研究で開発され、GoogleのエンジニアのFrançois Cholletがつくったものだ。

 Kerasのメリットは、最小限の記述で実行でき、初心者でも容易に実装できるわかりやすさにある。人工知能の普及や、大衆化といったことも言われている現在、その一役を担っている。一方、デメリットとしては、ブラックボックス的に処理してしまうため、中身を細かく理解せずとも使えてしまうという点や、自分で拡張をする場合に問題が出る可能性がある点だ。

 Pythonでも提供されているが、ここでは前回同様にRで行う方法を解説する。

 まず、分析の大きな流れについて紹介しよう。実行には、大きく五つのステップがある。細かい用語については第5回も参考にしてほしい。


図表1.主な実装のステップ



図表2.ディープラーニングの概念図



0.フレームワークの入手

 1を始めるまえに、実際にRを用意し、Kerasをダウンロードして、インストールするなどの準備が必要である。

1.データの用意

 トレーニングデータのラベル、ラベルに関連するデータ、評価データのラベル、ラベルに関連するデータを準備する。

2.モデルの設定とコンパイル

 どのようなネットワークにするかを、ここで指定する。またコンパイルの部分で「損失関数」(予測結果と実際の結果の違いを評価したもの)の指定や、損失からどのようにネットワークの重みを更新するか(「最適化器」)なども指定する。

 ネットワークの設定では、隠れ層における「ノードの数」の指定、そしてreluなどの「活性化関数」の指定、層をいくつにするかの指定、dropoutを行うかということなどを指定する。

 また、コンパイルの部分では「損失関数」や「最適化器」の指定を行う。これらは、学習で用いられる細かい設定である。学習というのは、図表2にもあるように予測した結果と実際の結果とのずれを損失関数で計算し、最適化器で適切にネットワークの重み(パラメータ)を更新していくことだ。例えば、「カテゴリカルデータのときは,cross-entropyなどを用いる」といったことを指定する。最適化器では、SDG(確率的勾配降下法)、RMSprop、adamなどが用意されており、これらを利用する。

3.学習

 学習では、ミニバッチ確率的勾配降下法(SGD)を用いる場合の細かい設定を行ったうえで、実際にデータを用いてネットワークの重みの推定を行う部分だ。具体的にはミニバッチ(学習する際のデータの一部を抜き出したデータ)や、エポックと呼ばれる繰り返しの回数などを指定する。詳細は次節でのべる。

4.評価

 評価では、(1)で用意したテストデータのラベルに関連するデータと、学習したモデルを用いて、実際にラベルを予測し、その結果がもとの結果をどの程度正確に予測できているかを評価する。

5.予測

 最後に、学習したデータを用いて、新しいデータが入力された場合に、どのようなラベルになるかなどの予測を行う。


 以上の五つが大きな流れである。これらに基づいて2節では具体的にRにおいてKerasを用いた実装について説明する。


次は「Kerasによるディープラーニングの実装」
【続きを読む】(有料会員向け先行公開)

※会員のご登録はこちらをご覧ください。

参照コンテンツ


【シリーズ】マーケティングのための人工知能入門およびその周辺技術


おすすめ新着記事

消費者調査データ ビール系飲料<br>じわり差をつめられるスーパードライ
消費者調査データ ビール系飲料
じわり差をつめられるスーパードライ

18年に出荷量過去最低を記録したビール系飲料。今回の調査でも、前回同様「アサヒ スーパードライ」が全項目で首位を獲得した。だが2位との差は縮小、「キリン 一番搾り」「ザ・プレミアム・モルツ」がこれを追う展開となっている。厳しい市場環境下にあるビール系飲料。20年10月には税率改正も控えるが、果たしてこれが市場にどのような影響を与えるかが注目される。

MNEXT 眼のつけどころ<br>次の時代のマーケティング戦略を考える<br>「嫌韓」層の正体-プロマーケターが読み解く
MNEXT 眼のつけどころ
次の時代のマーケティング戦略を考える
「嫌韓」層の正体-プロマーケターが読み解く

日韓関係が悪化する中、19年5月8日付で毎日新聞に掲載された「なぜ嫌韓は高齢者に多いのだろうか」という記事がネット上で話題になった。さらに産経新聞も6月3日付で世代を切り口にした記事を掲載。しかしこれらの主張からは、年代と世代を意図的あるいは無意識的に混同して主張の確からしさを示そうとしているようにも感じられた。この「嫌韓=高齢者」というテーマについて、プロマーケターの視点から統計的真実性を追求してみたい。

成長市場を探せ 冷菓(2019年版)
成長市場を探せ 冷菓(2019年版)

17年の冷菓市場は過去最高を記録するなど、好調を維持し続けている。牽引しているのは中価格帯のアイスだ。「エッセル スーパーカップ」などのスイーツ系や、「sunao」など糖質オフを付加価値にした商品が伸びているとみられる。値上げや増税など逆風要素もある中、各社の今後の動向から目が離せない。

マーケティングモニターのご案内
データでわかる辛口性格診断
会員登録のご案内
消費社会白書2019
「戦略200+」比較分析ツールのご案内
page top

JMR生活総合研究所マーケティングサイトに掲載の記事・写真・図表などの無断転載を禁止します。著作権はJMR生活総合研究所に属します。

Copyright (c) 1997-2019 Japan Consumer Marketing Research Institute. All rights reserved.