11.06.2015, 23:07 | #1 |
Главный Кинооператор
Новичок
|
Создание книги из jpeg файлов
Есть отсканированная книга, при попытке собрать, ничего не выходит. Находил много мануалов, но...руки не с того места. Есть книга и в OCR формате с ошибками, но её запрещают заливать, ибо её делал сам, распознавание текста, нет вычитке. Хотел бы объединить сканы. Кто может помочь?
Вот ссылка на архив отсканированной книги |
11.06.2015, 23:21 | #2 |
Техподдержка
Великий Гуру
|
|
11.06.2015, 23:42 | #3 |
ВИП
Гуру Форума
|
|
12.06.2015, 01:47 | #4 |
Техподдержка
Великий Гуру
|
Если на скорую руку, не выравнивая страницы, можно использовать для получения PDF файла программу PDF24 Creator (русский язык в комплекте, бесплатна).
Минут за 15, получаем такой файл. |
12.06.2015, 12:01 | #5 |
ВИП
Гуру Форума
|
А если потратить в два раза больше времени, используя ScanTailor и Adobe Acrobat можно получить вот такой результат https://yadi.sk/d/vHf8CY47hDcDY ) п.с. яндексдиск работает с перебоями |
12.06.2015, 12:06 | #6 |
ВИП
Великий Гуру
|
Некоторые страницы, где был темный край, нечитаемы: Можно в ScanTailor выбрать смешанный режим и увеличить жирность текста до 12 пунктов. Проблемные области на первых страницах перевести в режим картинки. |
12.06.2015, 12:08 | #7 |
ВИП
Гуру Форума
|
|
12.06.2015, 18:46 | #9 |
Главный Кинооператор
Новичок
|
Книгу я прижимал к стеклу сканира видать слабо давил.
nb92, kolia1984 Спасибо. Возьму вариант nb92. Если нет возражений, то его и залью. Есть и моя личная работа, как писал распознанный текст, но без вычитки, жаль запрещено и вес куда меньше и смотрится лучше, вот |
12.06.2015, 19:20 | #10 |
ВИП
Великий Гуру
|
Конечно, такой распознанный, переведенный в текст и великолепно отформатированный материал гораздо лучше любых сканов.
Я не контроллер в разделе Библиотека. Поэтому вопрос дилетанта: а что такое вычитка? Нужно сравнивать текст с исходником? |
12.06.2015, 19:28 | #11 |
Главный Кинооператор
Новичок
|
Проверка на грамматические ошибки. В распознанном тексте они могут появится.
На книжных трекерах такие раздачи разрешены, просто качество указывается OCR с ошибками. Но один из редакторов мне запретил заливать мою версию увы |
12.06.2015, 19:44 | #12 |
ВИП
Великий Гуру
|
Так а что мешает текстовый исходник прогнать в том же Ворде, включив Орфографию?
|
12.06.2015, 20:00 | #13 |
Главный Кинооператор
Новичок
|
Текстовика не осталось, можно просто скопировать, но все переделывать выйдет. Например в программе, что бы получить длинное тире нужно написать "--- и это одна из команд. Те же сноски задаются командой footnote{текст}, а так я копировал текст при создании документа и вставлял его сперва в translit.ru и на сайте проверял орфографию, но были слова, которые сайт не знал, а некоторые подчеркивал как ошибки, хотя в книги это слово было написано именно так.
|
12.06.2015, 20:19 | #14 |
ВИП
Великий Гуру
|
Само собой, если много японских имен и фамилий или терминов, то он не будет их знать. Поэтому просто сверяете с оригиналом и жмете Пропустить все.
|
12.06.2015, 20:27 | #15 |
Главный Кинооператор
Новичок
|
|
12.06.2015, 21:19 | #16 |
ВИП
Великий Гуру
|
Мой вариант, к сожалению, не пойдет. Воспользовался онлайн-конвертером, а он мне последовательность страниц перепутал.
А исходники уже удалил. Сейчас попробую поковыряться с Вашим текстовым вариантом. |
12.06.2015, 22:33 | #17 |
ВИП
Великий Гуру
|
Воспользуйтесь утилитой ScanTailor.
Она великолепно работает со сканами, автоматически разбивая на страницы, выравнивая, выставляя поля. Там есть хороший видеоурок на русском. Режим для всех страниц выставьте смешанный, жирность увеличьте до 12. И пройдитесь по всем страницам. Часть, что нечитаема можно пометить как картинку. В отдельной папке после пакетной обработки будут готовые постраничные сканы в tif Их можно конвертировать в pdf |
13.06.2015, 11:52 | #19 |
ВИП
Великий Гуру
|
На этапе Вывода, когда просматриваете сканы, на нужной картинке выбираете Зоны картинок и выделяете область, которая нечетко читается (правой клавишей мыши ставятся вершины многоугольника, который и обозначит границы зоны скана, который будет распознан как картинка).
Потом возвращаетесь на вкладку Вывод и видите результат - та часть картинки, которую вы выделите, не будет переводиться в режим черно-белого контрастного изображения, а будет оставлена как цветное изображение. |
15.09.2018, 00:29 | #20 |
Зритель
Великий Гуру
|
Доброго времени суток всем! Подскажите, пожалуйста, куда можно обратиться на счёт фонов для электронных книг? Может существуют какие-то программы с этими фонами, которые подойдут для запуска на андроиде? Или здесь кто-то в курсе этого?
|