
Я видел, что в сети доступно много электронных книг. Как они создаются из книги или вы действительно пишете их вручную? Если они захватывают изображение из книги, как шрифты делаются копируемыми?
решение1
В большинстве случаев мастер-версии являются цифровыми, и их можно просто сохранить в формате PDF (на самом деле некоторые издатели даже выпускают книги в формате PDF).электронные книгидо выпуска физической копии)
В противном случае это вопрос сканирования книг с использованиемОРСчтобы преобразовать большую часть в текст, перечитать его и добавить обратно любые изображения. Шрифты довольно стандартные, или используется достаточно близкий шрифт.
решение2
Раньше электронные книги в основном были в формате PDF, но электронные книги, которые читаются на Kindle, имеют формат .mobi, а книги, которые читаются на любом другом устройстве для чтения, имеют формат ePub. Оба формата основаны на HTML, типе разметки, который используется для веб-страниц. PDF-файлы бывают двух видов: если вы что-то сканируете, то сканы можно преобразовать в PDF, но это всего лишь изображение документа. Важен процесс OCR, который превращает текст в документе в машиночитаемый текст — тип текста, который мы с вами используем здесь. OCR не идеален, но есть некоторые методы, которые лучше других. Как только текст находится в машиночитаемой форме, его можно разметить в HTML и поместить в формат .mobi или ePub.