ハミング距離とは?

ハミング距離は、ある文字列を別の文字列に変換するために必要な最小置換数、または1つの文字列を別の文字列に変換したエラーの数を測定するメトリクスです。リチャード・ハミングにちなんで名付けられており、情報理論、符号理論、エラー検出に特に有用です。重要な要件は、両方の文字列が同じ長さである必要があることです。

ツールの説明

このカリキュレータは、同じ長さの2つの文字列間のハミング距離を計算します。異なる文字を持つ位置の数をカウントし、類似度のパーセンテージを提供します。このツールは、バイナリデータの比較、送信されたデータのエラー検出、および文字列の類似性分析に役立ちます。

例1: シンプルなテキスト比較

  • 文字列1: hello
  • 文字列2: hallo
  • ハミング距離: 1('e'と'a'のみが異なります)

例2: バイナリ文字列

  • 文字列1: 10101010
  • 文字列2: 11001011
  • ハミング距離: 3(位置2、5、8が異なります)

例3: DNA配列

  • 文字列1: AGCTTAGC
  • 文字列2: AGCTTGGC
  • ハミング距離: 1(位置6が異なります: AとG)

機能

  • リアルタイムハミング距離計算
  • 自動類似度パーセンテージ計算
  • 異なる長さの文字列に対するエラー検出
  • あらゆる文字セットのサポート(テキスト、バイナリ、DNA配列)
  • 比較結果の明確な可視化

ユースケース

  • データ送信時のエラー検出: 送信されたデータが元のデータと一致するかどうかを確認し、ビットエラーの数を計算します
  • DNA配列比較: 遺伝子配列を比較して、サンプル間の突然変異または変動を特定します
  • コード類似性分析: 固定長コード、識別子、またはハッシュ値間の類似性を測定します
  • 製造業の品質管理: 製品のシリアル番号またはバーコードを比較して、不一致を検出します
  • 生体認証検証: 指紋またはその他の生体認証データのバイナリ表現を比較します