Сравнивает ли какое-либо экономически осуществимое общедоступное программное обеспечение аудиофайлы, чтобы определить, являются ли они обманщиками?

В духе этого вопроса https://unix.stackexchange.com/questions/3037/is-there-an-easy-way-to-replace-duplicate-files-with-hardlinks есть ли какое-либо программное обеспечение, которое будет автоматически анализировать библиотека моих песен и найти те, которые действительно являются дубликатами, которые можно удалить? Вот пример:

Мой брат был большим поклонником ремиксов на CD. Он брал все свои любимые треки и ставил их на один. Тогда он использовал бы мой компьютер, чтобы прочитать их. Так что теперь у меня есть 6 копий Californication на моем жестком диске, и все они имеют разницу в несколько байтов в целом. У меня есть сотни песен в моей библиотеке, как это. Я хочу урезать их до уникальности. Они не все имеют правильные теги ID3, поэтому выясните, что Untitled(74).mp3 такой же как californication.mp3 такой же как whowrotethis.mp3 это сложно.

Я НЕ хочу рассматривать концертный альбом и разрыв студийного альбома как одно и то же (если бы я просто подбирал артиста и название, я бы в итоге получил этот сценарий, который мне не подходит).

Я использую Windows (выбираю вашу платформу) и получу коробку OSX позже в этом году. Я буду запускать Linux, если это то, что нужно, чтобы организовать его. У меня есть незащищенные файлы AAC и mp3. Бонусные баллы за работу с WAV или MIDI и бонусные баллы за конвертацию из них в MP3 (я всегда могу использовать Audacity и LAME, чтобы конвертировать позже, если я знаю, что они совпадают, или конвертировать заранее, если это облегчит задачу).

Есть ли какие-либо предложения, или мне нужно перейти к Программистам или SO и составить список требований для сравнения этих вещей и написать программное обеспечение самостоятельно?

1 ответ

На самом деле это довольно сложная алгоритмическая проблема, но, к счастью, она уже была написана. MusicBrainz Picard идентифицирует песни по звуку, а затем присваивает им названия, основываясь на большой базе данных отпечатков пальцев аудио.

Если он идентифицирует дубликат, он присвоит песне то же имя, что и оригинал, с номером, добавленным в конец, так что вы можете легко удалить дубликаты, удалив любую песню, к которой добавлен номер. Прошло несколько лет с тех пор, как я использовал Picard, поэтому возможно, что удаление дубликатов было добавлено.

MusicBrainz Picard http://musicbrainz.org/doc/PicardTagger

Другие вопросы по тегам