Кто такая ЭмилиМариДаунт или как читать/реверс-инжиниринг DCF-файла Master Clips

Кто такая ЭмилиМариДаунт или как читать/реверс-инжиниринг DCF-файла Master Clips

Много лет назад я купилМастерклипс 1,250,000. Это набор из примерно 14 ГБ изображений, разделенных на 28 или около того CD. Включенное в комплект программное обеспечение для просмотра MasterClips все еще работает, более или менее, на современной системе Windows 7. Однако интерфейс довольно старый и неуклюжий. Например, среднее колесо мыши не поддерживается, миниатюры изображений маленькие и размытые, а поиск очень медленный. Кроме того, управление окнами MDI ужасное.

Сами файлы изображений находятся в свободном доступе. Picasa или даже проводник Windows хорошо подходят для просмотра изображений. Однако метаданные о каждом изображении (текстовые описания) заблокированы в двоичных файлах *.DCF. Поэтому вопрос:

Есть ли способ извлечь текстовые описания (вместе с соответствующими именами файлов) из этих файлов MasterClips DCF? Или есть более новая версия браузера MasterClips, которая более приятна в использовании?

На самом деле, мне просто интересно, что не так с именем: «EmilyMarieDaunt» (см. ниже)

Некоторая информация, которая может быть полезна:

  • Браузер MasterClips имеет версию 1.0.0.7 (из страницы свойств исполняемого файла: FrontLine.exe)
  • Авторские права 1998 г.
  • В поле «О программе» содержится ссылка на лицензию RasterMaster Imaging Technology от Snowbound Software.
  • Диалоговое окно «Открыть» относится к *.DCF;*.PAQфайлам как к файлам библиотеки GCG3.
  • Для создания новых файлов имеется пункт меню «Файл» *.DCF;*.PAQ.
  • Последняя версия этого программного обеспечения выглядит так:ClipArt&More 3,5 миллиона. Я не уверен, использует ли эта версия тот же формат каталога.

Я извлек строки из 500 меньших файлов DCF. Интересные строки, которые встречались часто:

  • Все файлы DCF начинаются с «EKIF» в самом начале.
  • Имя «EmilyMarieDaunt» встречается более 2300 раз.
  • «Sine Labore Nihil» также встречается более 600 раз.
  • Дата «04/11/90» встречается ровно столько же раз, сколько и «Sine Labore Nihil».
  • «1992 ACCUSOFT INC, ВСЕ ПРАВА ЗАЩИЩЕНЫ» встречается 48 раз.

Я поделился четырьмя файлами DCF для тех, кто захочет с ними ознакомиться:


обновлять:

Анархив образов ISOдоступны на archive.org, сейчас. Это немного другой набор, но должен иметь те же файлы формата DCF.

решение1

ДКФкажется стандартными существуют спецификации, поэтому нет необходимости в обратном проектировании.

Поскольку DCF основан на EXIF,exifdump(скрипт Python) вероятно можно адаптировать для их чтения. Это потребует немного программирования, но это, безусловно, будет намного проще, чем писать парсер с нуля.

Связанный контент