半歩先を読む日本最大級のマーケティングサイト J-marketing.net

マーケティング用語集
データマイニング
1.データマイニングとは
 データマイニングとは、データベースにある大量のデータから意味のある特徴を高速に抽出するデータ分析手法のことです。機械学習や統計、人口知能といった分野の技術を応用し、情報探索・アルゴリズム等を用いるという特徴があります。これまでの統計と異なる点は、これまでの統計が仮説検証的であったのに対し、説明変数の選択を自動的に行うなど帰納的・発見的であることがあげられます。
 歴史的には、1994年にIBMのR.Agrawalらにより、大規模データから多頻度アイテム集合を効率よく抽出するアプリオリアルゴリズムが提案されたことに始まります。応用として有名なのは、ある店において「顧客がビールと紙おむつを同時に買う」というルールが抽出されたことがあります。解釈としては「子供のいる家庭で、父親は母親に紙おむつを買うように頼まれ、それと同時に自身のビールを買う傾向がある」ということです。仮説としては極めて想起しにくい組み合わせですので、統計ではなくデータマイニングを行うことで初めて発見された象徴的な事例として語り継がれています。

2.データマイニングの手法と活用
 データマイニングの手法は数多くありますが、ここでは代表的なものを紹介します。
  1. 頻出パターンを抽出する
     データ集合の中から、高頻度で発生する特徴的なパターンを見つける方法で、代表的な手法としては、頻繁に同時に生起する事象同士を相関の強い事象の関係として抽出する技術である「相関ルール」があります。具体事例としては、商品の併売傾向(どの商品とどの商品の組み合わせが最も売れるか)を測る「マーケットバスケット分析」が有名です。
  2. データの集合をクラスタと呼ぶグループに分ける(クラスタリング)
     クラスタとは、同じクラスタのデータならば互いに似ていて、違うクラスタならば似ていないようなデータの集まりを意味します。与えられたデータを外的基準なしに自動的に分類する方法で、代表的な手法として「K平均法(K-means法)」があげられます。具体例としては、Webの視聴パターンのデータで、類似したものをまとめることで、視聴傾向が同じ利用者のグループを発見することなどが可能です。
  3. 与えられたデータに対応するカテゴリを予測する(クラス分類)
     代表的なものに「決定木分析(ディシジョンツリー)」があります。ある事項に対する観察結果から、その事項の目標値に関する結論を導く予測モデルで、葉が分類を表し、枝がその分類に至るまでの特徴の集まりを表すような木構造を示します。ビジネスの分野では、顧客特性や傾向を分析するのに使われています。

3.データマイニングの今後
 近年では、ネットワークなど構造を持ったデータからの構造データマイニング、時系列データを扱う時系列データマイニングなど幅広い分野へ拡張されています。応用として、自然言語処理技術と組み合わせることで自由記述文から情報を抽出する、テキストマイニングの技術も急速に発展しています。
 また、マーケティングの分野では、データベースマーケティングなどに利用されており、アマゾンの推薦システムに代表されるような協調フィルタリングといった技術があります。その他、社会調査を目的として大量のブログへのテキストマイニングも行われています。
 今後の展開としては、ユビキタス社会の到来により、センサーから得られるデータが増えるなど、大規模なデータを逐次的に扱う技術の必要性が益々増えると考えられます。






新着記事

2024.11.20

24年9月の「旅行業者取扱高」は19年比で75%に

2024.11.19

24年10月の「景気の先行き判断」は2ヶ月連続の50ポイント割れに

2024.11.19

24年10月の「景気の現状判断」は8ヶ月連続で50ポイント割れに

2024.11.18

企業活動分析 アルファベット(グーグル)の23年12月期は、グーグルサービスがけん引し売上過去最高を更新

2024.11.18

企業活動分析 アマゾンの23年12月期はAWSがけん引し営業利益前年比3倍へ

2024.11.15

24年9月の「現金給与総額」は33ヶ月連続プラス、「所定外労働時間」はマイナス続く

2024.11.14

24年9月の「消費支出」は5ヶ月連続のマイナスに

2024.11.14

24年9月の「家計収入」は5ヶ月ぶりのマイナス

2024.11.13

24年9月は「完全失業率」、「有効求人倍率」とも改善

2024.11.12

企業活動分析 ローソンの23年2月期は、「地域密着×個客・個店主義」徹底し増収増益

2024.11.12

企業活動分析 セブン&アイHDの24年2月期は海外事業の影響で減収も過去最高益を更新

2024.11.11

24年10月の「乗用車販売台数」は2ヶ月連続のプラス

2024.11.08

消費者調査データ No.416 レトルトカレー(2024年11月版) 首位「咖喱屋カレー」、3ヶ月内購入はダブルスコア

2024.11.07

企業活動分析 楽天グループの23年12月期は27期連続増収も、モバイルへの投資で4期連続の赤字

2024.11.07

24年9月の「新設住宅着工戸数」は5ヶ月連続のマイナス

2024.11.06

「食と生活」のマンスリー・ニュースレター 伸長するパン市場  背景にある簡便化志向や節約志向

2024.11.05

企業活動分析 ファンケルの24年3月期算は国内売上がけん引し、3期ぶりの増収増益へ

2024.11.05

企業活動分析 コーセーの23年12月期は、国内好調も中国事業低迷で増収減益に

2024.11.01

成長市場を探せ コロナ禍の落ち込みから再成長する惣菜食市場(2024年)

2024.10.31

月例消費レポート 2024年10月号 消費は緩やかな改善が続いている-政治が消費回復のリスクに

2024.10.31

消費からみた景気指標 24年8月は6項目が改善

週間アクセスランキング

1位 2024.03.13

戦略ケース なぜマクドナルドは値上げしても過去最高売上を更新できたのか

2位 2017.09.19

MNEXT 眼のつけどころ なぜ日本の若者はインスタに走り、世界の若者はタトゥーを入れるのか?

3位 2024.03.08

消費者調査データ カップめん(2024年3月版)独走「カップヌードル」、「どん兵衛」「赤いきつね/緑のたぬき」が2位争い

4位 2024.02.02

成長市場を探せ コロナ禍乗り越え再び拡大するチョコレート市場(2024年)

5位 2021.05.25

MNEXT 眼のつけどころ プロ・マーケティングの組み立て方 都心高級ホテル競争 「アマン」VS.「リッツ」(1)

パブリシティ

2023.10.23

週刊トラベルジャーナル2023年10月23日号に、当社代表取締役社長 松田の執筆記事「ラーケーションへの視点 旅の価値問い直す大事な切り口」が掲載されました。

2023.08.07

日経MJ「CM裏表」に、当社代表取締役社長 松田の執筆記事が掲載されました。サントリー ザ・プレミアム・モルツ「すず登場」篇をとりあげています。

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area