データマイニングとは、計算機科学の一分野に属する情報技術である。
マイニングminingという言葉が指示す通りデータの集合体から有益な事物を発掘(=抽出)する事が主たる目的である。
データマイニングには様々な手法が用いられるが、データに対して施す基本的な操作は次の5つに纏められる※。
※http://www.albert2005.co.jp/technology/mining/basic_process.htmlより
抽出(extraction)を行う方法として先ず挙げられるのはデータのフィルタリングである。
フィルタリングは特定要素に属するデータを抽出対象外とする事で残ったデータのみを抽出する効果がある。ゴミとなる不要データを弾く事は特にデータクレンジングと呼ばれ、NGワード指定やマイナス検索などもその一種である。
ソーティングはデータをある一定の規則に従って並べ替える事で、一覧表示などの際に更新日時、サイズなどを昇順または降順で指定して読込むのがこれに当たる。
グループ化は対象となるデータをカテゴリなどで区分けする事で、ゲームソフトであればジャンル別、機種別などで幾つかのグループに分類していくのがこれに当たる。タギングなどもグループ化の一種と言える。
特性分析はデータの性質を調べるもので、数値化可能な要素を取り出してそこから読取れる物を明らかにしていく。
相関分析はデータとデータの間にどのような関係があるかを解析するものである。
急上昇ワード改
最終更新:2025/12/13(土) 14:00
最終更新:2025/12/13(土) 14:00
ウォッチリストに追加しました!
すでにウォッチリストに
入っています。
追加に失敗しました。
ほめた!
ほめるを取消しました。
ほめるに失敗しました。
ほめるの取消しに失敗しました。