半歩先を読む日本最大級のマーケティングサイト J-marketing.net

マーケティング用語集
データマイニング
1.データマイニングとは
 データマイニングとは、データベースにある大量のデータから意味のある特徴を高速に抽出するデータ分析手法のことです。機械学習や統計、人口知能といった分野の技術を応用し、情報探索・アルゴリズム等を用いるという特徴があります。これまでの統計と異なる点は、これまでの統計が仮説検証的であったのに対し、説明変数の選択を自動的に行うなど帰納的・発見的であることがあげられます。
 歴史的には、1994年にIBMのR.Agrawalらにより、大規模データから多頻度アイテム集合を効率よく抽出するアプリオリアルゴリズムが提案されたことに始まります。応用として有名なのは、ある店において「顧客がビールと紙おむつを同時に買う」というルールが抽出されたことがあります。解釈としては「子供のいる家庭で、父親は母親に紙おむつを買うように頼まれ、それと同時に自身のビールを買う傾向がある」ということです。仮説としては極めて想起しにくい組み合わせですので、統計ではなくデータマイニングを行うことで初めて発見された象徴的な事例として語り継がれています。

2.データマイニングの手法と活用
 データマイニングの手法は数多くありますが、ここでは代表的なものを紹介します。
  1. 頻出パターンを抽出する
     データ集合の中から、高頻度で発生する特徴的なパターンを見つける方法で、代表的な手法としては、頻繁に同時に生起する事象同士を相関の強い事象の関係として抽出する技術である「相関ルール」があります。具体事例としては、商品の併売傾向(どの商品とどの商品の組み合わせが最も売れるか)を測る「マーケットバスケット分析」が有名です。
  2. データの集合をクラスタと呼ぶグループに分ける(クラスタリング)
     クラスタとは、同じクラスタのデータならば互いに似ていて、違うクラスタならば似ていないようなデータの集まりを意味します。与えられたデータを外的基準なしに自動的に分類する方法で、代表的な手法として「K平均法(K-means法)」があげられます。具体例としては、Webの視聴パターンのデータで、類似したものをまとめることで、視聴傾向が同じ利用者のグループを発見することなどが可能です。
  3. 与えられたデータに対応するカテゴリを予測する(クラス分類)
     代表的なものに「決定木分析(ディシジョンツリー)」があります。ある事項に対する観察結果から、その事項の目標値に関する結論を導く予測モデルで、葉が分類を表し、枝がその分類に至るまでの特徴の集まりを表すような木構造を示します。ビジネスの分野では、顧客特性や傾向を分析するのに使われています。

3.データマイニングの今後
 近年では、ネットワークなど構造を持ったデータからの構造データマイニング、時系列データを扱う時系列データマイニングなど幅広い分野へ拡張されています。応用として、自然言語処理技術と組み合わせることで自由記述文から情報を抽出する、テキストマイニングの技術も急速に発展しています。
 また、マーケティングの分野では、データベースマーケティングなどに利用されており、アマゾンの推薦システムに代表されるような協調フィルタリングといった技術があります。その他、社会調査を目的として大量のブログへのテキストマイニングも行われています。
 今後の展開としては、ユビキタス社会の到来により、センサーから得られるデータが増えるなど、大規模なデータを逐次的に扱う技術の必要性が益々増えると考えられます。






お知らせ

2024.12.19

JMR生活総合研究所 年末年始の営業のお知らせ

新着記事

2024.12.20

消費者調査データ No.418 サブスクリプションサービス 広く利用される「プライムビデオ」、音楽サブスクには固定ファンも

2024.12.19

24年10月の「商業動態統計調査」は7ヶ月連続のプラス

2024.12.19

24年10月の「広告売上高」は、6ヶ月連続のプラス

2024.12.19

24年10月の「旅行業者取扱高」は19年比で83%に

2024.12.18

提言論文 「価値スタイル」で選ばれるブランド・チャネル・メディア

2024.12.18

24年11月の「景気の先行き判断」は3ヶ月連続の50ポイント割れに

2024.12.18

24年11月の「景気の現状判断」は9ヶ月連続で50ポイント割れに

2024.12.17

24年10月の「現金給与総額」は34ヶ月連続プラス、「所定外労働時間」はマイナス続く

2024.12.16

企業活動分析 SGHDの24年3月期はロジスティクス事業不振で2期連続の減収減益

2024.12.16

企業活動分析 ヤマトHDの24年3月期はコスト削減追いつかず3期連続減益

2024.12.13

成長市場を探せ コロナ禍の壊滅的状況からV字回復、売上過去最高のテーマパーク(2024年)

2024.12.12

24年10月の「家計収入」は再びプラスに

2024.12.12

24年10月の「消費支出」は6ヶ月連続のマイナスに

2024.12.11

提言論文 価値スタイルによる生活の再編と収斂

2024.12.10

24年10月は「有効求人倍率」は改善、「完全失業率」は悪化

2024.12.09

企業活動分析 江崎グリコ株式会社 23年12月期は国内外での売上増などで増収増益達成

2024.12.09

企業活動分析 日清食品ホールディングス株式会社 24年3月期は価格改定浸透で増収、過去最高益達成

 

2024.12.06

消費者調査 2024年 印象に残ったもの 「大谷選手」「50-50」、選挙も五輪も超えてホームラン!

2024.12.05

24年11月の「乗用車販売台数」は3ヶ月ぶりのマイナス

週間アクセスランキング

1位 2024.05.10

消費者調査データ エナジードリンク(2024年5月版)首位は「モンエナ」、2位争いは三つ巴、再購入意向上位にPBがランクイン

2位 2024.04.05

消費者調査データ ノンアルコール飲料(2024年4月版) 首位は「ドライゼロ」、追う「オールフリー」「のんある気分」

3位 2024.12.04

提言論文 本格消費回復への転換-価値集団の影響力拡大

4位 2024.03.13

戦略ケース なぜマクドナルドは値上げしても過去最高売上を更新できたのか

5位 2024.03.08

消費者調査データ カップめん(2024年3月版)独走「カップヌードル」、「どん兵衛」「赤いきつね/緑のたぬき」が2位争い

パブリシティ

2023.10.23

週刊トラベルジャーナル2023年10月23日号に、当社代表取締役社長 松田の執筆記事「ラーケーションへの視点 旅の価値問い直す大事な切り口」が掲載されました。

2023.08.07

日経MJ「CM裏表」に、当社代表取締役社長 松田の執筆記事が掲載されました。サントリー ザ・プレミアム・モルツ「すず登場」篇をとりあげています。

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area