Τι είναι ένα ακουστικό αποτύπωμα;

Ένα ακουστικό αποτύπωμα είναι ένα συμπαγές ψηφιακό περίληψη ενός ακουστικού σήματος — μια σύντομη ακολουθία αριθμών που καταγράφει τα ακουστικά χαρακτηριστικά μιας ηχογράφησης με τρόπο που είναι ανθεκτικός σε κοινές παραμορφώσεις όπως αλλαγές κωδικοποίησης, μετατοπίσεις τόνου και θόρυβος φόντου. Σε αντίθεση με ένα κρυπτογραφικό hash, ένα ακουστικό αποτύπωμα έχει σχεδιαστεί για να ταιριάζει με ηχογραφήσεις του ίδιου τραγουδιού ακόμα και όταν προέρχονται από διαφορετικές πηγές, bitrates ή ελαφρές επεξεργασίες.

Ο πιο ευρέως χρησιμοποιούμενος αλγόριθμος είναι το Chromaprint, το οποίο τροφοδοτεί την ανοιχτή βάση δεδομένων AcoustID. Το Chromaprint μετατρέπει το ήχο σε μια ακολουθία χρωματικών χαρακτηριστικών — αναπαραστάσεις της ενέργειας σε κάθε μουσική κλάση τόνου — και στη συνέχεια το συμπιέζει σε ένα σύντομο string base64. Αυτό το αποτύπωμα μπορεί να υποβληθεί στην υπηρεσία AcoustID για να αναγνωρίσει το υποκείμενο κομμάτι και να ανακτήσει μεταδεδομένα από το MusicBrainz.

Περιγραφή εργαλείου

Αυτό το εργαλείο υπολογίζει το ακουστικό αποτύπωμα Chromaprint ενός μεταφορτωμένου αρχείου ήχου απευθείας στο πρόγραμμα περιήγησής σας. Στη συνέχεια, προαιρετικά ερωτά τη δημόσια βάση δεδομένων AcoustID για να αναγνωρίσει το κομμάτι και να επιστρέψει μεταδεδομένα όπως τίτλος, καλλιτέχνης και MusicBrainz ID — όλα χωρίς να μεταφορτώσετε το αρχείό σας σε κάποιο διακομιστή.

Χαρακτηριστικά

  • Τοπική επεξεργασία: Η αποκωδικοποίηση ήχου και το αποτύπωμα εκτελούνται εξ ολοκλήρου στο πρόγραμμα περιήγησης χρησιμοποιώντας μια κατασκευή WebAssembly του Chromaprint — το αρχείο ήχου σας δεν φεύγει ποτέ από τη συσκευή σας
  • Ευρεία υποστήριξη μορφών: Λειτουργεί με MP3, WAV, FLAC, OGG, M4A και οποιαδήποτε μορφή μπορεί να αποκωδικοποιήσει το Web Audio API του προγράμματος περιήγησής σας
  • Αναζήτηση AcoustID: Προαιρετικά υποβάλλει το αποτύπωμα στο δημόσιο API του AcoustID για να αναγνωρίσει το τραγούδι και να ανακτήσει μεταδεδομένα καλλιτέχνη/τίτλου/MusicBrainz
  • Τεχνικές λεπτομέρειες: Εμφανίζει το ποσοστό δείγματος, τον αριθμό καναλιών και τη διάρκεια ανάλυσης μαζί με το string αποτυπώματος
  • Αποτύπωμα που μπορεί να αντιγραφεί: Αντιγράψτε το raw string αποτυπώματος Chromaprint για χρήση σε εξωτερικά εργαλεία όπως fpcalc

Πώς λειτουργεί

  1. Το μεταφορτωμένο αρχείο αποκωδικοποιείται από το Web Audio API του προγράμματος περιήγησης σε raw δείγματα PCM.
  2. Έως 120 δευτερόλεπτα ήχου τροφοδοτούνται στη μονάδα Chromaprint WASM, η οποία υπολογίζει χρωματικά χαρακτηριστικά και τα συμπιέζει σε ένα string αποτυπώματος.
  3. Εάν κάνετε κλικ στο Αναζήτηση στο AcoustID, το αποτύπωμα και η διάρκεια αποστέλλονται στο δημόσιο API του AcoustID, το οποίο επιστρέφει αντιστοιχίσεις ηχογραφήσεων από τη βάση δεδομένων MusicBrainz ταξινομημένες κατά βαθμό εμπιστοσύνης.

Υποστηριζόμενες μορφές

Οποιαδήποτε μορφή ήχου υποστηρίζεται από το Web Audio API του προγράμματος περιήγησής σας, η οποία συνήθως περιλαμβάνει:

  • MP3 (.mp3)
  • WAV (.wav)
  • FLAC (.flac)
  • OGG Vorbis (.ogg)
  • AAC / M4A (.m4a, .aac)
  • Opus (.opus)

Περιορισμοί

  • Αναλύονται μόνο τα πρώτα 120 δευτερόλεπτα ήχου (επαρκή για αξιόπιστη αναγνώριση).
  • Η αναγνώριση AcoustID απαιτεί το κομμάτι να υπάρχει στη βάση δεδομένων MusicBrainz. τα σπάνια, μη κυκλοφορημένα ή έντονα remixed κομμάτια ενδέχεται να μην επιστρέψουν αποτελέσματα.
  • Πολύ σύντομα κλιπ (λιγότερα από ~10 δευτερόλεπτα) ενδέχεται να παράγουν αποτυπώματα με χαμηλή εμπιστοσύνη.