マーケティング用語集 | |
データマイニング | |
1.データマイニングとは |
データマイニングとは、データベースにある大量のデータから意味のある特徴を高速に抽出するデータ分析手法のことです。機械学習や統計、人口知能といった分野の技術を応用し、情報探索・アルゴリズム等を用いるという特徴があります。これまでの統計と異なる点は、これまでの統計が仮説検証的であったのに対し、説明変数の選択を自動的に行うなど帰納的・発見的であることがあげられます。 歴史的には、1994年にIBMのR.Agrawalらにより、大規模データから多頻度アイテム集合を効率よく抽出するアプリオリアルゴリズムが提案されたことに始まります。応用として有名なのは、ある店において「顧客がビールと紙おむつを同時に買う」というルールが抽出されたことがあります。解釈としては「子供のいる家庭で、父親は母親に紙おむつを買うように頼まれ、それと同時に自身のビールを買う傾向がある」ということです。仮説としては極めて想起しにくい組み合わせですので、統計ではなくデータマイニングを行うことで初めて発見された象徴的な事例として語り継がれています。 |
2.データマイニングの手法と活用 |
データマイニングの手法は数多くありますが、ここでは代表的なものを紹介します。
|
3.データマイニングの今後 |
近年では、ネットワークなど構造を持ったデータからの構造データマイニング、時系列データを扱う時系列データマイニングなど幅広い分野へ拡張されています。応用として、自然言語処理技術と組み合わせることで自由記述文から情報を抽出する、テキストマイニングの技術も急速に発展しています。 また、マーケティングの分野では、データベースマーケティングなどに利用されており、アマゾンの推薦システムに代表されるような協調フィルタリングといった技術があります。その他、社会調査を目的として大量のブログへのテキストマイニングも行われています。 今後の展開としては、ユビキタス社会の到来により、センサーから得られるデータが増えるなど、大規模なデータを逐次的に扱う技術の必要性が益々増えると考えられます。 |
Tweet |
|