Вы здесьКак создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Опубликовано вс, 14/12/2008 - 04:53 пользователем Psychedelic
Цитата:
Если нужно, я могу детально составить пошаговый шаблон, как конвертировать pdf и djvu с распознаванием в fb2. Как конверитировать картинки оттуда, сжатыми по максимуму в png без визуальной потери качества, причем конвертировать в пакетной обработке. точнее как это сделать относительно быстро и качественно. Описал. Довольно много получилось. Жду комментариев.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
SparkySpirit RE:Прошу переформатировать, распознать, etc... 1 день
Саша из Киева RE:Подайте бедному копеечку на книжку с литреса... 1 день SparkySpirit RE:Жорж Санд - переводы 19 века 1 день sem14 RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 2 дня Саша из Киева RE:Наш дом - СССР 3 дня babajga RE:Чернушка. Повести 3 дня Саша из Киева RE:Сказки далёких островов 5 дней babajga RE:Лопоухий бес 6 дней kopak RE:Таинственная личность админа Флибусты 1 неделя babajga RE:Ежик покидает дом 1 неделя babajga RE:Сказки бабушки Черепахи 1 неделя babajga RE:Свист диких крыльев 1 неделя Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 неделя Саша из Киева RE:Турецкие мусорщики в Анкаре открыли библиотеку, полную... 2 недели Isais RE:Не тот автор 3 недели xieergai60 RE:Продление подписки 3 недели TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 3 недели Isais RE:Древняя Греция. Читаем... 3 недели Впечатления о книгах
Chernovol про Дуган: Предательство истины (Публицистика, Документальная литература, Спецслужбы)
28 12 Бред сивой кобылы. Автор, специалист по сибирской язве, забыл описать боевых комаров. Оценка: нечитаемо
Дей про Петровичева: Девушка без имени [litres] (Любовная фантастика, Попаданцы)
28 12 Не смогла читать после того, как ГГ, никого и ничего не знающая о мире, в который попала, ушла от спасшего её человека, от которого видела лишь добро, только потому, что он инквизитор. Истории о бабах-дурах и истеричках меня не привлекают. Оценка: плохо
Chernovol про Жан Саван
28 12 Не очень удачный перевод. В стихе слово "Люба" написано с большой буквы, хотя это не имя а люба, т.е. любимая.
Chernovol про Широкорад: Битва за Крым. От противостояния до возвращения в Россию (Публицистика)
28 12 Пропагандистский лубок, в большинстве фактов документально ничем не подтвержденный. Оценка: нечитаемо
Синявский про Вадим Абрамов
27 12 26 декабря 2024 года в Санкт-Петербурге похоронили историка Вадима Розенберга. Он был настоящим знатоком спецслужб. Его книги издавались под псевдонимом Вадим Абрамов.
Саша из Киева про Ефим Семёнович Ефимовский
27 12 Надо чтобы кто-нибудь добавил сюда ещё книги "Приключения юнната Синичкина Игната" и "Приключения юнната Синичкина Игната в зоопарке". Их можно взять с Флибусты.
decim про Людмила Захаровна Уварова
27 12 Этот вечно бухой пошляк был сам собой пародия. Раскрепощённый - как в объявлении тех же лет: "требуются раскрепощённые девушки". Сейчас начинающий так стендапер тут же и закончит карьеру, а тогда ничё, пипл хавал. Автора рекомендую. Нормальный человек, что редкость.
decim про Кольцов: За гранью возможного (Героическая фантастика)
27 12 Без задушевных разговоров только лучше было бы: изложение идеи и способов её реализации. Получился бы нормальный научпоп. "Оживление и утепление" темы делают креатив подражанием Немцову, был такой "фантаст" в начале 50-х. ……… Оценка: нечитаемо
decim про Кольцов: Три сказки про царя Никиту… или «Хрущёвская оттепель» (Публицистика, Документальная литература)
27 12 Хрущёв у нас уже мифологизирован по самое некуда. Автор твердит как заведенный "госдеп, госдеп", словно это некие всемогущие волшебники. Очень удобно всё на них свалить, не видя собственного головотяпства. А кто приучил ……… Оценка: плохо
Foset про Людмила Захаровна Уварова
27 12 А. Иванов пародию на её произведения сделал https://www.youtube.com/watch?v=ifTzAEqeTVQ ?
miri.ness_ про Еще не поздно
25 12 Двоякое впечатление. У автора, возможно, в родственниках или их друзей есть взрослые люди, крепко обиженные Ангстремом. Но много знающие про электронику и микроэлектронику тех лет - отсюда и довольно глубокие познания, правда ………
decim про Овалов: Демон революции. Жизнь и приключения Розалии Землячки (Биографии и Мемуары)
25 12 Рерайтинг имеющейся здесь же книги Овалова "Январские ночи", снабжённый манким заголовком. Оценка: хорошо |
Комментарии
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Большая работа. Респект!
Для работы с картинками из уже готового fb2-файла не обязательно переносить его в BD.
В FBE есть опция "Экспорт в HTML". Результат тот же: собственно файл и папка с картинками.
Очень полезной оказалась для меня информация по массовой обработке картинок в IrfanView.
Немного смутила "галочка" в пункте "Convert to greyscale". Если картинки цветные, то получается, что они становятся черно-белыми, или я что-то не так поняла?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да, я ж там написал что если картинки чернобелые. Для цветных нужно убрать эту галку, и поставить не 8 цветов, а 256 и более. Там это тоже написано.
С greyScale картинки получаются более качественные, и меньше размером чем если сохранить чб в цветном.
Хех. А ведь потом все равно придется в BD вставлять (а там он наверняка опять переформатирует). А так сразу, меняем и сохраняем в fb2, с сохранением исходного форматирования.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
спасибо
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Прочитал рекомендации.
Всё, в общем-то, правильно, но мне не нравится упор на использование Book Designer'a. Эта программа хороша своей всеядностью и годится для преобразования почти из всех форматов в почти все, но вот FB2 она делает довольно своеобразные, которые требуют слишком большой доводки. К тоже BD не поддерживает стиль 'cite', который бывает очень нужен.
Мой опыт показывает, что более удобно делать всю послеOCRную работу в Word'е, также сделать стилевую разметку, а затем конвертировать в FB2 посредством преобразования 'wml2fb.xsl', который входит в комплект doc2fb (В Word делаем 'Сохранить как XML…', 'Применить преобразование…', выбираем wml2fb.xsl и всё. Остается только переименовать .XML в .FB2).
Картинки сохраняются в том виде как были, сноски (Word'овские!) делаются сносками FB2, заголовки до 4-го уровня расставляются корректно. Стили типа 'cite' остаются на местах. (Стиль 'epigraph' почему-то заменяется на 'stanza'). А вот раздел 'Description' пуст. Нужно полностью заполнить ручками. Ну и другая обработка тоже не помешает.
Если же нужно оптимизировать картинки, BookDesigner тоже не очень нужен, так как в FictionBook Editor v2.0 (как и в FB Writer) есть скрипты для работы с иллюстрациями, например просто сохранить все картинки из FB2 в текущую папочку. Потом можно делать с ними, всё что нужно, и вернуть на родину.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вы акцентировали внимание на слишком да еще и большой доводки
Какие например? У меня особых проблем с ним не было. Иногда файл получается невалидный, но это редко, да и fb2 подправить не сложно.
А как же с этим скриптом сделать главы, подглавы и вложенные секции? Как скрипт разберет что куда вложено и что есть title, а что есть subtitle?
В fbe их делать не реально.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В FBE это делается элементарно и без всяких скриптов :)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Я уже писал, что заголовки до 4-го уровня wml2fb.xsl расставляет корректно. Он все будут title с правильным уровнем вложенности. А subtitle можно и в FBE расставить. Кроме того в FBE (версии 2.0) есть чудный инструмент, расположенный под структурой документа. C помощью этих стрелочек легко корректируется вложенность секций.
Но я не и настаиваю. Различных инструментов много, так что каждый может использовать то, что ему нравится больше. Лишь бы был хороший результат!
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
+101
Пару раз встречал идеальные документы сделанные в Any2fb2!
Действительно - есть... а я его и не заметил (черт знает, кем помрешь)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Поддерживает. Выделить нужное, + правый клик--->cite.
А в верхнем меню cite нет, факт...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да, но дело в том, что в исходном файле этот стиль УЖЕ есть, а при переносе в BD исчезает, а еще раз проделывать разметку не хочется.
Когда таких фрагментов мало - не страшно, а если их пол книги?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вопрос по BD & FBD
Задавал в параллельной ветке, но тут уместней.
Перейдя на Висту, обнаружил, что ни та ни другая программа не хочет работать в этой ОС. Ошибка какого-то файла .ocx
Если эта задача решаема, то что нужно сделать.
Попытки установки ее в корень и в другой раздел диска ни к чему не привели. Файл нашел в сети, скачал, пихал в разные папки (и в виндовз и в папку с программой) - безрезультатно.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Файл поместить в system32, затем его зарегистрировать - Пуск - Выполнить - regsvr32 имя_файла.ocx. Во всяком случае так в ХР. В Висте, кажется, тоже самое.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Попробовал. Бесполезно. система при попытке регистрации не может найти файл ни в виндовз ни в систем32 папке.
Ошибка же выглядит так: этот компонент DHTMLED.OCX (и еще один .осх файл) больше не входит в состав виндовз.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да выкиньте нафиг эту висту. Это тормоз всей системы. В начале следущего года (да 2009) выйдет Windows 7, говорят она будет в разы быстрее этого тормоза.
Поставьте лучше XP x64 Pro - в данное время это наилучший вариант.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Я не спрашивал, что мне делать с вистой. Мне интересно - есть ли у существующего конкретного софта возможность работать в этой среде.
Если есть - то как этого добиться.
Если нет - не нужно сваливать с больной головы ФБД и БД на относительно здоровую голову висты.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Относительно здоровую - это сильно натянуто. Сами Microsoft признала что данная версия неудачная по производительности и оптимизации компонент. А также масса пользователей. Мало кто хотел брать Висту, пока ее не стали навязывать принудительно с ноутбуками например и не сделали агрессивную рекламу. Я просто советую. Игры на ней идут также с микрорывками, по сравнению с XP на одной и той же конфигурации.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Спасибо за советы, я поначалу тоже хотел ее снести, ибо раздражала, как, видимо, все новое и непривычное раздражает. а потом то ли я к ней привык, то ли она под меня приспособилась, и как бы желание уйти на ХР у меня пропало.
В игры я не играю, бук мой от нее не тормозит несмотря на аэро фейс и все анимации (поотключал кучу ненужных сервисов). Удобно в ней все сделано. Одни только Избранные папки слева в окне чего стоят.
Проги по фб2 запустились шаманскими способами. Видео показывает. Все прекрасно.
Но это офф. в этой теме. Я его сегодня уже в других местах начитался.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Если развивать офтоп, то на Longhorn тоже возлагалось много надежд - гораздо больше, чем оправдала Vista (если вообще что-то оправдала)... Хотя по поводу XP согласен.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Есть еще DHTML Editing Control for Applications Redistributable Package.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нифига! :(
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вспомнил я, наконец, где видел тему: http://the-ebook.org/forum/viewtopic.php?t=6177
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Ура! программа наконец-то открылась! Не спрашивайте - как, ибо я сам не знаю, делал все по последней ссылке от agrey (спасибо ему)
Пока не проверял как будет работать и сохранять. но и это уже что-то.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
-- у меня Window SP
-- я в system32 поместила свой файл 1.pdf
-- пуск
-- выполнить
-- regsvr32 набираю
-- нахожу свой файл 1.pdf и даю ему уже другое расширение (правильно ???) 1.ocx
-- ok
-- и этот файл не находится
Подскажите, пожалуйста, что я делаю не правильно ...
я плохо разбираюсь в этих тонкостях, но хочется научиться правильно заливать книги
спасибо
с уважением ...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А что вы, собственно, делаете?
пдф можно грузить без ухищрений. Если такой книги нет на сайте, конечно.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А как? Т.е. можно выделить слово, и сделать его title? Как? Я бы очень хотел чтобы такая возможность была. Подскажите пожалуйста где она. Я искал не нашел.
Вы не поняли. Как он определит что это title а здесь subtitle? Разве в ворде это можно указать?
Т.е. есть книга, в которой идет Глава 1. Далее в ней идут подзаголовки, через абзац, два. Вот их нужно вручную выделять как Subtitle. Как скрипт поймет это?
Или он просто сделает их как title? Но делать их именно заголовками нельзя, т.к. замучаешся читать на устройстве ebook, там заголовок начинается с новой страницы - т.е. в данной ситуации ,каждый абзац будет с новой страницы..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А как? Т.е. можно выделить слово, и сделать его title? Как? Я бы очень хотел чтобы такая возможность была. Подскажите пожалуйста где она. Я искал не нашел.
Очень просто!
Выделяете абзац, нажимаете Shift+Enter и всё!!! titlе готов.
Выделяете абзац, нажимаете Alt+S и всё!!! subtitle готов.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Спасибо. Я не знал этого про title. Почему то об этом нигде не написано в программе.
Тогда BD остается только для конвертирования из html.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Это главная фича FBE - отсутствие справки. "Попробуй угодай" - бесплатная игра от Грибова юзерам.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Из HTML я конвертирую обычно через Word. Попался как-то документ с множеством перекрестных ссылок. BD такой FB2 наворотил, что просто офигеть, а через Word получилось нормально.
А из Word'a еще можно с помощью ExportXML.dot конвертировать.
Что же касается title, то это я методом тыка нашел. А потом уже увидел в книге Михаила Кондратовича "Создание электронных книг в формате FictionBook 2.1: практическое руководство" http://lib.rus.ec/b/123638. Там много чего полезного есть. Жаль, она мне поздно попалась.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
О нет, только не Word. Может быть наворотил с ссылками, но это еденичный случай. Word перегоняет все картинки в jpg, тем самым ухудшая (размазывание) качество их увеличивая их размер.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Не заметил. На днях делал книгу, как раз из PDF. Картинки, как были смесью PNG и JPG, так и остались. Использовал только Acrobat, Word и FBE.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Очень просто. Нужно выровнять нужный абзац в Ворде по центру :) После преобразования doc2fb эти выровненные по центру абзацы станут субтитлами.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Все таки мой вариант лучше. 20 сек на перегонку в fb2 в BD, а после уже редактировать в fbe, - сразу видишь что делаешь. тем более после скрипта все равно нужно будет забрасывать его в fbe для шифовки.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Дык никто ж не спорит, вопрос был, "разве возможно это в ворде?" - я ответил как это сделать.
??? какой шифровки?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
там л пропущена.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Возвращаясь к началу.
Многие PDF содержат текст в виде собственно текста, так что их можно и не распознавать. Достаточно самим Adobe Acrobat'ом сделать 'Save as HTML | RTF | DOC'. Если же так просто не получится, можно использовать ABBYY PDF Transformer. Он конвертирует PDF в разные форматы более корректно.
Читал где-то, что есть и DJVU с текстовым слоем, но мне такие не встречались.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Есть. Дневники Чехова из ППС на publ.lib.ru, например. Но этот слой в формате txt, где каждая строчка – абзац, т.е. с этим файлом еще работать и работать. Естественно, ни болд, ни италик в нем не отображаются.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нашел в сетке у себя. Кому надо могу залить на рапиду. 220 мб.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нестоит. Кому надо, тот найдет, например тут.
Или к примеру в теме fb2-софт, ссылка на которую есть в заглавном посте soshial.
ИМХО конечно, но FineReader все таки лучше...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В отделе Сноски утверждение:
излишне жесткое.
Я, например, использую квадратные скобки. Все получается без осечек.
Еще вопрос. Я чего-то не смог в FR9 избавиться от знаков абзаца в конце строки. Никак. "Помню" в каких-то ранних версиях с этим проблем не было - отметил галочку и все насильственные переносы строки исчезли. Здесь же все галочки "Сохранять деление на строки" убраны, а оно все равно их сохраняет. Это все обычный OCR, конечно, не из pdf, ну да все равно. Не подскажете, что за хрень?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В квадратных скобках могут содержаться ссылки на статьи, главы итп. к примеру [1] или [2]. Я уже так попал, потом пришлось нудно искать где же они лежат.
При сохраниении в html я ничего подобного не заметил, в FR9 (OCR был с djvu).
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Если судить по набору скриптов FBE, то можно использовать для обозначения сносок различные виды скобок: фигурные {...}, квадратные [...], [!...!], [~...~] и свои собственные, лишь бы не смешивались с теми, которые сносками не являются.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Так рассказываю минуса.
Да текст переводиться качественно НО, одно большое но:
Включаються колонтитулы и номера страниц. Это очень сильно усложняет обработку конечного файла.
Так что даже в этом случае я выбираю Fine Reader - ведь весь текст разпознается без ошибок (если pdf текстовый), но можно выбрать области сразу и применить на все страницы.
Но если текст без колонтитолов и номеров страниц (что редко бывает), тогда конечно Transformer.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Не такое оно и большое... Можно тем же Acrobat'ом сделать Crop страниц, с целью обрезки колон(титулов)цифр.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Дык в том то и дело, что то же самое можно сделать и в Fine Reader, без мудрежа. Я к примеру не знаю как это делается, + надо устанавливать Adobe Acrobat а не Reader. В итоге юзать две программы, и тратить больше времени. - вот поэтому оно и большое "НО", по сравнению с FR - где все конверирование занимает минуты. Повторюсь - текст который не отсканирован, FR разпознает с без ошибок. А юзать подобный способ только для того, чтобы использовать програму pdf transformer имхо неправильно, ведь нужно смотреть на тот как быстро можно получить качественный результат.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Это если картинки не с OCR. С OCR такого не сделаешь. Плюс прозрачность увеличивает размер. + она в большистве и не нужна. Ведь все равно на белом фоне что на ebook что на компе.
Здрастье приехали. Наоборот. Попробуйте сначала уменьшить без ресепла - удивитесь. это раз.
во вторых в скобках написано возле ресепла написано - (better quality)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
За советы также всем спасибо. На выходных обновлю мануал (сейчас в поездке), с обозначением автора, который предложил вариант.
Думаю многим пригодиться.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Иногда png имеет даже ме́ньший размер, чем jpg
http://i4.imageban.ru/out/2010/12/05/581abfa36a0cbb56b297358a200a4c81.jpg
http://i1.imageban.ru/out/2010/12/05/3c15deacb34dfc99e136e91a1501afd0.png
Можете скачать и убедиться
Фотки сделаны из дежавюшки из программы WinDjVu экспортом страницы.
Если кто не знает, как сохранить рисунок, вот подсказка:
ПКМ на рисунке и