オーディオフィンガープリントとは?

オーディオフィンガープリントは、オーディオ信号のコンパクトなデジタル要約です。録音の音響特性をキャプチャする短い数字列で、エンコーディング変更、ピッチシフト、背景ノイズなどの一般的な歪みに対してロバストに設計されています。暗号ハッシュとは異なり、オーディオフィンガープリントは異なるソース、ビットレート、またはわずかな編集から来た同じ曲の録音にマッチするように設計されています。

最も広く使用されているアルゴリズムはChromaprintで、オープンなAcoustIDデータベースを支えています。Chromaprintはオーディオを一連のクロマ特性(各音楽ピッチクラスでのエネルギー表現)に変換し、それを短いBase64文字列に圧縮します。このフィンガープリントはAcoustIDサービスに送信して、基礎となるトラックを識別し、MusicBrainzからメタデータを取得できます。

ツール説明

このツールは、アップロードされたオーディオファイルのChromaprintオーディオフィンガープリントをブラウザで直接計算します。その後、オプションでAcoustID公開データベースをクエリしてトラックを識別し、タイトル、アーティスト、MusicBrainz IDなどのメタデータを返します。すべてファイルをサーバーにアップロードすることなく実行されます。

機能

  • ローカル処理: オーディオデコーディングとフィンガープリント処理はChromaprintのWebAssemblyビルドを使用してブラウザ内で完全に実行されます。オーディオファイルはデバイスから出ることはありません
  • 幅広いフォーマット対応: MP3、WAV、FLAC、OGG、M4A、およびブラウザのWeb Audio APIがデコードできる任意のフォーマットで動作します
  • AcoustID検索: オプションでフィンガープリントをAcoustID公開APIに送信して、曲を識別し、アーティスト/タイトル/MusicBrainzメタデータを取得します
  • 技術詳細: フィンガープリント文字列と共に、サンプルレート、チャネル数、分析期間を表示します
  • コピー可能なフィンガープリント: fpcalcなどの外部ツールで使用するために、生のChromaprintフィンガープリント文字列をコピーできます

動作方法

  1. アップロードされたファイルはブラウザのWeb Audio APIによって生のPCMサンプルにデコードされます。
  2. 最大120秒のオーディオがChromaprint WASMモジュールに入力され、クロマ特性を計算してフィンガープリント文字列に圧縮します。
  3. AcoustIDで検索をクリックすると、フィンガープリントと期間がAcoustID公開APIに送信され、MusicBrainzデータベースからマッチングした録音が信頼度スコアでランク付けされて返されます。

サポートされているフォーマット

ブラウザのWeb Audio APIがサポートする任意のオーディオフォーマット。通常は以下を含みます:

  • MP3 (.mp3)
  • WAV (.wav)
  • FLAC (.flac)
  • OGG Vorbis (.ogg)
  • AAC / M4A (.m4a, .aac)
  • Opus (.opus)

制限事項

  • オーディオの最初の120秒のみが分析されます(信頼できる識別に十分です)。
  • AcoustID識別にはトラックがMusicBrainzデータベースに存在する必要があります。レアな、未リリース、または大幅にリミックスされたトラックは結果が返されない場合があります。
  • 非常に短いクリップ(約10秒未満)は信頼度の低いフィンガープリントを生成する可能性があります。