データマイニングとは?基本情報処理の午前対策
基本情報処理技術者試験から不定期に1題出題、解説いたします。
試験を受けない人にとっても役に立つ解説を心掛けていきます。
本日の問題は平成29年春の午前問題からです。
問題
- データウェアハウス
- データディクショナリ
- データマイニング
- メタデータ
基本情報技術者 平成29年春期試験から抜粋
正解は
3.データマイニングが正解
データマイニング(Data Mining)とは?
データウェアハウスに蓄積されている大量の生データを統計学的手法で分析し、今まで知られていなかったデータの規則や因果関係を見つけ出す手法です。
データマイニングとは、情報を発掘すること
英語を和訳してみます。
data 〔分析や意思決定に用いる〕データ、事実情報、基礎資料
mining 1) 採鉱、鉱業、採掘、鉱山業、 2) 地雷の敷設 3)〔データの〕検索
データマイニングは「データや事実情報の検索・採掘」という意味になります。
大量にある情報や事実の中から、意味がある情報を探し出す事がデータマイニングです。
ちなみにデータマイニングとは仮説を立てる事
データマイニングとは、大量のデータから傾向を探り見つけ出す行為ですが
あくまで、仮説を立てるだけです。
仮説が正しいかどうかを検証する作業としてデータ分析(データアナリティクス)をという作業が存在します。
今回の問題文では、特に触れていませんが、「仮説」→『検証」の仮説の過程がマイニングという事になります。
その他の選択肢について
データウェアハウス
データウェアハウスは、企業内に散らばっているデータの有効活用を目的に、過去から現在までの基幹系データベースや外部データベースを統合し、効果的な戦略的意思決定を支援するためのデータベースのことです。
データディクショナリ
データディクショナリは、データベースやシステム開発においてデータの属性・性質などデータに関する情報の定義を保存するための辞書です。
メタデータ
メタデータは、データについてのデータという意味で、データベースであればデータベース名やテーブル名、フィールド属性など本来のデータ付随する情報のことをいいます。
今回の問題のキーポイント
大量のデータというキーワードから、無関係の選択肢を削っていく事で正答に近づきます。
まとめ
今日の問題はいかがでしょうか。
今回は、データマイニングについて解説させていただきました。
実際の試験では、じっくりと考えている時間はありません。
ポイントとなるキーワードを見つけ、ピンポイントで正答を判断しましょう。
ヴァックスラボではSE・プログラマを募集中です
私たちと一緒に価値を提供していく新しい仲間を募集します。
[spheader position="center"]
[/spheader]