半歩先を読む日本最大級のマーケティングサイト J-marketing.net

マーケティング用語集
データマイニング
1.データマイニングとは
 データマイニングとは、データベースにある大量のデータから意味のある特徴を高速に抽出するデータ分析手法のことです。機械学習や統計、人口知能といった分野の技術を応用し、情報探索・アルゴリズム等を用いるという特徴があります。これまでの統計と異なる点は、これまでの統計が仮説検証的であったのに対し、説明変数の選択を自動的に行うなど帰納的・発見的であることがあげられます。
 歴史的には、1994年にIBMのR.Agrawalらにより、大規模データから多頻度アイテム集合を効率よく抽出するアプリオリアルゴリズムが提案されたことに始まります。応用として有名なのは、ある店において「顧客がビールと紙おむつを同時に買う」というルールが抽出されたことがあります。解釈としては「子供のいる家庭で、父親は母親に紙おむつを買うように頼まれ、それと同時に自身のビールを買う傾向がある」ということです。仮説としては極めて想起しにくい組み合わせですので、統計ではなくデータマイニングを行うことで初めて発見された象徴的な事例として語り継がれています。

2.データマイニングの手法と活用
 データマイニングの手法は数多くありますが、ここでは代表的なものを紹介します。
  1. 頻出パターンを抽出する
     データ集合の中から、高頻度で発生する特徴的なパターンを見つける方法で、代表的な手法としては、頻繁に同時に生起する事象同士を相関の強い事象の関係として抽出する技術である「相関ルール」があります。具体事例としては、商品の併売傾向(どの商品とどの商品の組み合わせが最も売れるか)を測る「マーケットバスケット分析」が有名です。
  2. データの集合をクラスタと呼ぶグループに分ける(クラスタリング)
     クラスタとは、同じクラスタのデータならば互いに似ていて、違うクラスタならば似ていないようなデータの集まりを意味します。与えられたデータを外的基準なしに自動的に分類する方法で、代表的な手法として「K平均法(K-means法)」があげられます。具体例としては、Webの視聴パターンのデータで、類似したものをまとめることで、視聴傾向が同じ利用者のグループを発見することなどが可能です。
  3. 与えられたデータに対応するカテゴリを予測する(クラス分類)
     代表的なものに「決定木分析(ディシジョンツリー)」があります。ある事項に対する観察結果から、その事項の目標値に関する結論を導く予測モデルで、葉が分類を表し、枝がその分類に至るまでの特徴の集まりを表すような木構造を示します。ビジネスの分野では、顧客特性や傾向を分析するのに使われています。

3.データマイニングの今後
 近年では、ネットワークなど構造を持ったデータからの構造データマイニング、時系列データを扱う時系列データマイニングなど幅広い分野へ拡張されています。応用として、自然言語処理技術と組み合わせることで自由記述文から情報を抽出する、テキストマイニングの技術も急速に発展しています。
 また、マーケティングの分野では、データベースマーケティングなどに利用されており、アマゾンの推薦システムに代表されるような協調フィルタリングといった技術があります。その他、社会調査を目的として大量のブログへのテキストマイニングも行われています。
 今後の展開としては、ユビキタス社会の到来により、センサーから得られるデータが増えるなど、大規模なデータを逐次的に扱う技術の必要性が益々増えると考えられます。






お知らせ

2025.03.06

クレジットカード決済に関する重要なお知らせ

新着記事

2025.04.04

25年3月の「乗用車販売台数」は3ヶ月連続のプラス

2025.04.03

25年2月の「新設住宅着工戸数」は10ヶ月ぶりのプラスに

2025.04.02

ネット時代に放送局は生き残れるのかーテレビ業界の構造分析

2025.04.01

25年1月の「広告売上高」は、9ヶ月連続のプラス

2025.03.31

企業活動分析 SUBARUの24年3月期は売上台数増加と為替変動による増収効果で大幅増収増益

2025.03.31

企業活動分析 スズキの24年3月期は価格見直し、為替影響などで売上、利益とも過去最高更新

2025.03.28

成長市場を探せ キャッシュレス市場の雄、クレジットカードは3年連続過去最高更新(2025年)

2025.03.27

25年2月の「ファーストフード売上高」は48ヶ月連続のプラスに

2025.03.27

25年2月の「ファミリーレストラン売上高」は36ヶ月連続プラス

2025.03.27

消費からみた景気指標 25年1月は7項目が改善

2025.03.26

25年2月の「コンビニエンスストア売上高」は2ヶ月ぶりのマイナスに

2025.03.26

25年2月の「チェーンストア売上高」は既存店で4ヶ月ぶりのマイナスに

2025.03.26

25年2月の「全国百貨店売上高」は4ヶ月ぶりのマイナスに

 

2025.03.25

25年1月の「商業動態統計調査」は10ヶ月連続のプラス

2025.03.24

中国メーカーの多様化戦略への対応―垂直差別化では勝てない

 

2025.03.24

提言論文 高収入層がけん引するアメリカ消費 - 日本はどうなのか

2025.03.24

企業活動分析 トヨタの24年3月期は営業利益5兆3,529億円、大幅な増収増益を達成

週間アクセスランキング

1位 2024.06.19

「食と生活」のマンスリー・ニュースレター 縮小する野菜ジュース市場 値上げ下でブランド継続は4割

2位 2025.03.24

中国メーカーの多様化戦略への対応―垂直差別化では勝てない

3位 2024.10.24

MNEXT 日本を揺るがす「雪崩現象」―「岩盤保守」の正体

4位 2025.03.14

日本のブランド危機と再生戦略 - トライアドマーケティング

5位 2024.05.10

消費者調査データ エナジードリンク(2024年5月版)首位は「モンエナ」、2位争いは三つ巴、再購入意向上位にPBがランクイン

ENGLISH ARTICLES

2023.04.17

More than 40% of convenience store customers purchase desserts. Stores trying to entice shoppers to buy desserts while they're shopping.

2023.02.22

40% of men in their 20s are interested in skincare! Men's beauty expanding with awareness approaching that of women

2022.11.14

Frozen Foods' Benefits Are Expanding, and Child-raising Women Are Driving Demand

2022.09.12

The Penetration of Premium Beer, and a Polarization of the Growing Beer Market

2022.06.20

6.9 Trillion Yen Market Created By Women― Will Afternoon Tea save the luxury hotels in the Tokyo Metropolitan Area