Vad är ett ljudfingeravtryck?

Ett ljudfingeravtryck är en kompakt digital sammanfattning av en ljudsignal — en kort sekvens av tal som fångar de akustiska egenskaperna hos en inspelning på ett sätt som är robust mot vanliga förvrängningar som kodningsändringar, tonhöjdsförskjutningar och bakgrundsbrus. Till skillnad från en kryptografisk hash är ett ljudfingeravtryck utformat för att matcha inspelningar av samma låt även när de kommer från olika källor, bithastigheter eller små redigeringar.

Den mest använda algoritmen är Chromaprint, som driver den öppna AcoustID-databasen. Chromaprint konverterar ljud till en sekvens av chromafunktioner — representationer av energin vid varje musikalisk tonklass — och komprimerar sedan det till en kort base64-sträng. Detta fingeravtryck kan skickas till AcoustID-tjänsten för att identifiera det underliggande spåret och hämta metadata från MusicBrainz.

Verktygsbeskrivning

Det här verktyget beräknar Chromaprint-ljudfingeravtrycket för en uppladdad ljudfil direkt i din webbläsare. Det frågar sedan eventuellt den offentliga AcoustID-databasen för att identifiera spåret och returnera metadata såsom titel, artist och MusicBrainz-ID — allt utan att ladda upp din fil till någon server.

Funktioner

  • Lokal bearbetning: Ljudavkodning och fingeravtrycksberäkning körs helt i webbläsaren med en WebAssembly-version av Chromaprint — din ljudfil lämnar aldrig din enhet
  • Bred formatstöd: Fungerar med MP3, WAV, FLAC, OGG, M4A och alla format som din webbläsares Web Audio API kan avkoda
  • AcoustID-sökning: Skickar eventuellt fingeravtrycket till det offentliga AcoustID API:et för att identifiera låten och hämta artist-/titel-/MusicBrainz-metadata
  • Tekniska detaljer: Visar samplingsfrekvens, kanalantal och analyserad varaktighet tillsammans med fingeravtryckssträngen
  • Kopierbart fingeravtryck: Kopiera den råa Chromaprint-fingeravtryckssträngen för användning i externa verktyg som fpcalc

Hur det fungerar

  1. Den uppladdade filen avkodas av webbläsarens Web Audio API till råa PCM-sampel.
  2. Upp till 120 sekunder ljud matas in i Chromaprint WASM-modulen, som beräknar chromafunktioner och komprimerar dem till en fingeravtryckssträng.
  3. Om du klickar på Slå upp på AcoustID skickas fingeravtrycket och varaktigheten till det offentliga AcoustID API:et, som returnerar matchande inspelningar från MusicBrainz-databasen rankade efter konfidenspoäng.

Format som stöds

Alla ljudformat som stöds av din webbläsares Web Audio API, vilket vanligtvis inkluderar:

  • MP3 (.mp3)
  • WAV (.wav)
  • FLAC (.flac)
  • OGG Vorbis (.ogg)
  • AAC / M4A (.m4a, .aac)
  • Opus (.opus)

Begränsningar

  • Endast de första 120 sekunderna av ljud analyseras (tillräckligt för tillförlitlig identifiering).
  • AcoustID-identifiering kräver att spåret finns i MusicBrainz-databasen; sällsynta, ej utgivna eller kraftigt remixade spår kan inte returnera resultat.
  • Mycket korta klipp (under ~10 sekunder) kan producera fingeravtryck med lågt konfidenspoäng.