ハッシュ単語

101件
ハッシュ
2.1千文字の記事
  • 4
  • 0pt
掲示板へ

ハッシュとは、あるデータが別のあるデータと一致しているかどうかを調べる際に使われる短いデータである。

曖昧さ回避

概要

ハッシュとは、データの確認や探索に用いる小さなデータの事である。ハッシュ値は元データを何らかのルールで要約したものと捉えることができる。

ハッシュはある特定アルゴリズムによって生成され、次のような場合に用いられる。

ハッシュはその利用のされ方から、同じデータに対しては同じハッシュが生成されなければならない。また、その他にも以下の用件を満たすのが望ましい。

  • あるハッシュ値を出するデータを意図的に生成することが十分に難しい
  • 異なるデータに対してはできるだけ異なるハッシュが生成される
  • ハッシュの長さはできるだけ短い

圧縮と異なるのは、ハッシュは元となるデータが一致しているかどうかが分かれば良いので、データを復元できなくても良い点である。そのため、通常あるデータのハッシュはそのデータ圧縮したものよりもかにデータ量が少ない。また、元データを復元できないことから、暗号化とも異なる。暗号化では暗号化で生成されたデータからパスワード秘密を用いて復元できなければならない。

世の中には様々なハッシュアルゴリズムが存在するが、大まかに言うとデータ構造を作るためのハッシュと、暗号セキュリティで用いるハッシュ(暗号的ハッシュという)があり、それぞれ特性が異なっている。

データ構造用のハッシュでは、良いハッシュを生成できるに越したことはないが、そのためにハッシュ自体の生成が遅くては本末転倒なため、性速度バランスを取ったアルゴリズムが使用される。また生成される値の範囲も狭く、大体は4バイト整数にまとめられる。例 Murmur Hash,Fowler-Noll-Vo hash,Jenkins hashなど。

一方暗号的ハッシュでは、簡単にデータの衝突などが発生しては問題があるため、生成が遅くとも天文学確率でしか同じハッシュ値を生成しないような工夫が重視される。生成される値もデータ構造用にべると長く、20バイトから64バイト程度のものが使われる。また暗号的ハッシュではハッシュの値から元のデータを予測できてはならないという要件が必要である(例えば似たデータから似たようなハッシュが出ると、近場を総当りで探すことによって元の値を見つけられてしまうため)。例 SHA-256,SHA-512,SHA3-512など。またかつては使われていたが、今は脆弱性が見つかり使用されていないものとしてはMD5,SHA-1などがある。

簡単なハッシュの例

ハッシュがどういうものか理解するために、ごく簡単なハッシュの例を用いて説明しよう。

例えばハッシュアルゴリズムとして「文字列を一文字おきに取り出す」というものを考えよう。例えば、「ニコニコ動画」が元の文字列として与えられた場合、そのハッシュは「ニニ動」となる。このハッシュアルゴリズムを使って、「ニコニコ動画」という文字列が書かれたファイルが破損していないかどうかを確認できるようにするには、ハッシュである「ニニ動」という文字列が書かれたファイルをハッシュファイルとして提供すればよい。ユーザダウンロードしたファイル文字列を一字おきに取り出してハッシュファイルの内容と同じになるかどうかを調べることでダウンロードが成功したことを確認できる。

実際にはこのハッシュアルゴリズムは、「ニニ動」というハッシュが与えられたときに元データを推測しやすい(すぐに「ニコニコ動画」が元データであることが分かる)うえ、ハッシュが「ニニ動」となる他の有効な文字列をすぐに生成できる(例えば「ニフニフ動画」)、ハッシュの長さが元データの長さに対して長すぎる(ハッシュが元データの半分にしかならない)など、ハッシュとしては十分に使い勝手が良いとは言えない。実世界で広く使われているハッシュアルゴリズムは、数学的にこれらの問題を解決している。

英単語「Hash」

英単として「hash」と言えば、「細切れ」「切り刻む」「小さくちぎる」「焼き直し」などの意味で使われている。これは、上記の「ハッシュ」のでもある。

また、「ハッシュドビーフ」と言えば「牛肉の細切れをデミグラスソースで調理した料理」の名前として使われている。

「ハッシュドポテト」と言えば「細かくしたジャガイモ小麦粉を付けてであげた物」をす。

関連項目

【スポンサーリンク】

  • 4
  • 0pt
記事編集 編集履歴を閲覧

ニコニ広告で宣伝された記事

小春六花 (単) 記事と一緒に動画もおすすめ!
提供: NoirAuslese
もっと見る

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

ハッシュ

7 ななしのよっしん
2011/04/12(火) 13:12:46 ID: JS7xSXwV04
半年前の書き込みに対してアレだが
>>4
1はその通り。決定性が崩れたらハッシュではない。
3は誤り。強度が同じなら短い方が優秀。強度が必要だからこそ長くなる。
👍
高評価
0
👎
低評価
0
8 ななしのよっしん
2011/05/03(火) 02:50:36 ID: maB0cAKUNu
>>6
もしかしてハッシュポテト

>>4,>>7
突っ込みサンクス。確かに1は必須で、それが分かりやすいように修正してみた。また間違いがあったら教えてほしい。
👍
高評価
0
👎
低評価
0
9 ななしのよっしん
2013/03/19(火) 22:52:16 ID: 1Gy9Nodd5i
ハッシュテーブルに利用するハッシュアルゴリズムは、
MD5だSHA-1なんてデータの同一性チェックに使われるものと違い、
ハッシュ値の計算速度(コスト)とバラけ具合(質)のコスパが重要になる。
👍
高評価
0
👎
低評価
0
10 ななしのよっしん
2014/05/09(金) 00:16:40 ID: R1HdVSKm2M
CRCは通常ハッシュに分類されません(衝突性が考慮されてないので)
あと、載ってるアルゴリズム暗号ハッシュに偏ってるのでハッシュテーブルアルゴリズムもあった方がいいかと
👍
高評価
0
👎
低評価
0
11 ななしのよっしん
2016/04/21(木) 21:16:06 ID: jK5eU+HTV1
厳密に「異なるデータに対しては異なるハッシュが生成される」のだと圧縮になってしまうのでは…?
同じハッシュが生成される確率ができる限り小さい(偏りが小さい)ということなのだろうが
👍
高評価
0
👎
低評価
0
12 ななしのよっしん
2016/09/03(土) 02:09:27 ID: R1HdVSKm2M
>>11
ハッシュは一方向関数だからハッシュだとしても圧縮とは異なる。まあ全な対応表をつくれば圧縮とみなせなくもないが。
👍
高評価
0
👎
低評価
0
13 ななしのよっしん
2016/10/11(火) 13:51:02 ID: iadf1FVljo
👍
高評価
0
👎
低評価
0
14 ななしのよっしん
2017/12/22(金) 21:52:38 ID: A03a7i/j/P
ハッシュの衝突が起こりうるってことは要するにハッシュ関数は単射な写像じゃないってことだから
ハッシュ関数が不可逆なのは一方向だからではなく単射じゃないせいで逆関数が存在しないからなのでは
ハッシュ定義域をうまく制限することで単射にしているだけでアルゴリズムとしては元の情報を削っているはずだから、ハッシュ関数であっても原理的には元の文章を復元できないと思う
👍
高評価
0
👎
低評価
0
15 ななしのよっしん
2018/06/07(木) 08:08:36 ID: F0cZIk1qqf
>>13
ああ、なろう系俺tueee主人公にようやくまともなライバル登場と思ったらあっさり舎に成り下がって主人公運搬係やって駄に死んだ存在意義のなさと声優無駄使いが酷かった人か
天才クリム演じられてほんと良かったな逢坂さん
👍
高評価
0
👎
低評価
0
16 ななしのよっしん
2021/01/18(月) 10:16:30 ID: 4NRE9SSZ3h
hash は細かく切り刻む
hash out で底的に議論する

ならばハッシュはしらみつぶしと似たような意味ではないかと思った
つぶしシラミ値と呼ぼう
👍
高評価
0
👎
低評価
0