2018/07/10

データマイニングとは?基本情報処理の午前対策

 

この記事を書いている人 - WRITER -

基本情報処理技術者試験から不定期に1題出題、解説いたします。

試験を受けない人にとっても役に立つ解説を心掛けていきます。

 

本日の問題は平成29年春の午前問題からです。

問題

午前問29
ビッグデータの活用例として,大量のデータから統計学的手法などを用いて新たな知識(傾向やパターン)を見つけ出すプロセスはどれか。
  1. データウェアハウス
  2. データディクショナリ
  3. データマイニング
  4. メタデータ

基本情報技術者 平成29年春期試験から抜粋

 

 

 

正解は

3.データマイニングが正解

データマイニング(Data Mining)とは?

データウェアハウスに蓄積されている大量の生データを統計学的手法で分析し、今まで知られていなかったデータの規則や因果関係を見つけ出す手法です。

 

 

データマイニングとは、情報を発掘すること

英語を和訳してみます。

data 〔分析や意思決定に用いる〕データ、事実情報、基礎資料
mining        1) 採鉱、鉱業、採掘、鉱山業、  2) 地雷の敷設     3)〔データの〕検索

データマイニングは「データや事実情報の検索・採掘」という意味になります。
大量にある情報や事実の中から、意味がある情報を探し出す事がデータマイニングです。

 

ちなみにデータマイニングとは仮説を立てる事

データマイニングとは、大量のデータから傾向を探り見つけ出す行為ですが

あくまで、仮説を立てるだけです。

仮説が正しいかどうかを検証する作業としてデータ分析(データアナリティクス)をという作業が存在します。

 

今回の問題文では、特に触れていませんが、「仮説」→『検証」の仮説の過程がマイニングという事になります。

 

その他の選択肢について

データウェアハウス

データウェアハウスは、企業内に散らばっているデータの有効活用を目的に、過去から現在までの基幹系データベースや外部データベースを統合し、効果的な戦略的意思決定を支援するためのデータベースのことです。

 

データディクショナリ

データディクショナリは、データベースやシステム開発においてデータの属性・性質などデータに関する情報の定義を保存するための辞書です。

 

メタデータ

メタデータは、データについてのデータという意味で、データベースであればデータベース名やテーブル名、フィールド属性など本来のデータ付随する情報のことをいいます。

今回の問題のキーポイント

大量のデータというキーワードから、無関係の選択肢を削っていく事で正答に近づきます。

まとめ

今日の問題はいかがでしょうか。

今回は、データマイニングについて解説させていただきました。

実際の試験では、じっくりと考えている時間はありません。

ポイントとなるキーワードを見つけ、ピンポイントで正答を判断しましょう。

この記事を書いている人 - WRITER -
 

Copyright© 株式会社ヴァックスラボ , 2018 All Rights Reserved.