Co to jest odcisk palca audio?

Odcisk palca audio to zwarta cyfrowa streszczenie sygnału audio — krótka sekwencja liczb, która przechwytuje charakterystykę akustyczną nagrania w sposób odporny na typowe zniekształcenia, takie jak zmiany kodowania, przesunięcia tonacji i szum tła. W przeciwieństwie do skrótu kryptograficznego, odcisk palca audio jest zaprojektowany tak, aby dopasowywać nagrania tej samej piosenki nawet wtedy, gdy pochodzą z różnych źródeł, szybkości transmisji bitów lub niewielkich edycji.

Najszerzej używanym algorytmem jest Chromaprint, który napędza otwartą bazę danych AcoustID. Chromaprint konwertuje audio na sekwencję cech chroma — reprezentacje energii na każdej klasie tonacji muzycznej — a następnie kompresuje to do krótkiego ciągu base64. Ten odcisk palca można przesłać do usługi AcoustID w celu identyfikacji utworu i pobrania metadanych z bazy MusicBrainz.

Opis narzędzia

To narzędzie oblicza odcisk palca audio Chromaprint przesłanego pliku audio bezpośrednio w przeglądarce. Następnie opcjonalnie wysyła zapytanie do publicznej bazy danych AcoustID w celu identyfikacji utworu i zwrócenia metadanych, takich jak tytuł, artysta i identyfikator MusicBrainz — wszystko bez przesyłania pliku na żaden serwer.

Funkcje

  • Przetwarzanie lokalne: Dekodowanie audio i generowanie odcisku palca działają całkowicie w przeglądarce przy użyciu kompilacji WebAssembly Chromaprint — plik audio nigdy nie opuszcza urządzenia
  • Szerokie wsparcie formatów: Działa z MP3, WAV, FLAC, OGG, M4A i dowolnym formatem, który może zdekodować Web Audio API przeglądarki
  • Wyszukiwanie AcoustID: Opcjonalnie przesyła odcisk palca do publicznego API AcoustID w celu identyfikacji piosenki i pobrania metadanych artysty/tytułu/MusicBrainz
  • Szczegóły techniczne: Wyświetla częstotliwość próbkowania, liczbę kanałów i analizowany czas trwania obok ciągu odcisku palca
  • Kopiowalne odciski palca: Skopiuj surowy ciąg odcisku palca Chromaprint do użytku w zewnętrznych narzędziach, takich jak fpcalc

Jak to działa

  1. Przesłany plik jest dekodowany przez Web Audio API przeglądarki na surowe próbki PCM.
  2. Do 120 sekund audio jest przesyłane do modułu Chromaprint WASM, który oblicza cechy chroma i kompresuje je w ciąg odcisku palca.
  3. Jeśli klikniesz Wyszukaj w AcoustID, odcisk palca i czas trwania są wysyłane do publicznego API AcoustID, które zwraca pasujące nagrania z bazy danych MusicBrainz uporządkowane według wyniku pewności.

Obsługiwane formaty

Dowolny format audio obsługiwany przez Web Audio API przeglądarki, który zazwyczaj obejmuje:

  • MP3 (.mp3)
  • WAV (.wav)
  • FLAC (.flac)
  • OGG Vorbis (.ogg)
  • AAC / M4A (.m4a, .aac)
  • Opus (.opus)

Ograniczenia

  • Analizowane są tylko pierwsze 120 sekund audio (wystarczające do niezawodnej identyfikacji).
  • Identyfikacja AcoustID wymaga, aby utwór istniał w bazie danych MusicBrainz; rzadkie, niewydane lub mocno zremixowane utwory mogą nie zwrócić wyników.
  • Bardzo krótkie klipy (poniżej ~10 sekund) mogą generować odciski palca o niskiej pewności.