Вы здесьКак создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Опубликовано вс, 14/12/2008 - 04:53 пользователем Psychedelic
Цитата:
Если нужно, я могу детально составить пошаговый шаблон, как конвертировать pdf и djvu с распознаванием в fb2. Как конверитировать картинки оттуда, сжатыми по максимуму в png без визуальной потери качества, причем конвертировать в пакетной обработке. точнее как это сделать относительно быстро и качественно. Описал. Довольно много получилось. Жду комментариев.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Приключения Мишки-Ушастика (Перевод Марата Брухнова) 2 дня
Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 2 дня ostap79 RE:Подайте бедному копеечку на книжку с литреса... 5 дней babajga RE:Белая княжна 1 неделя Nicout RE:Таинственная личность админа Флибусты 1 неделя Isais RE:Файл достаточно хорош. Нет смысла в его улучшении. Ага,... 1 неделя mazay RE:Sleepy Xoma - Bagⲣѱnoⲣojdennaѱ 1 неделя zlyaka RE:С Новым годом! 1 неделя Isais RE:Детство, опаленное войной (Вторая мировая 1939-1945 и ВОВ) 2 недели SparkySpirit RE:Прошу переформатировать, распознать, etc... 2 недели SparkySpirit RE:Жорж Санд - переводы 19 века 2 недели Саша из Киева RE:Наш дом - СССР 2 недели babajga RE:Чернушка. Повести 3 недели Саша из Киева RE:Сказки далёких островов 3 недели babajga RE:Лопоухий бес 3 недели babajga RE:Ежик покидает дом 3 недели babajga RE:Сказки бабушки Черепахи 3 недели babajga RE:Свист диких крыльев 3 недели Впечатления о книгах
DGOBLEK про Кивиряхк: Последний, кто знал змеиную молвь [Mees, kes teadis ussisõnu ru] (Фэнтези, Современная проза)
14 01 Огромнейшее спасибо! Цитаты с книги - Они, видишь ли, ноги мне отрубили да в море сбросили! Пусть катятся в задницу, такими детскими приёмчиками от меня не избавишься! Юной девушке трудно устоять перед косолапым — ……… Оценка: отлично!
Barbud про Фонд: Агитбригада 1 [СИ] (Городское фэнтези, Попаданцы, Самиздат, сетевая литература)
14 01 Написано вроде и неплохо, но анахронизмы глаз режут - тут тебе в 1927 году и дуст, и "Либертанго", и "учебник по истории КПСС". И это я только половину книги одолел. Похоже, автор (или коллектив авторов) в реалиях тех лет ……… Оценка: неплохо
Саша из Киева про Даррелл: Говорящий сверток [The Talking Parcel ru] (Природа и животные, Детская проза)
14 01 artak60, У меня эта книга тоже была именно с такими иллюстрациями. Правда, эта книга была не моя собственная - я брал её в нашей местной детской библиотеке. А сейчас у нас в Киеве со старыми книгами катастрофическая ситуация.
dolle про Пелевин: Круть [litres] (Современная проза)
14 01 Наверное не нужно рассматривать " Трансгуманизм " как цикл.Все книги концептуально разные , вызывающие разные вопросы и эмоции у читателя.После первой книги планка была поднята слишком высоко и у многих появились завышенные ……… Оценка: отлично!
Belomor.canal про Свечин: Месть – блюдо горячее (Исторический детектив, Исторические приключения)
13 01 Похоже автору Лыков надоел по полной! если выкинуть 100 тонн воды - многостраничные цитаты из газет того времени, описание международной обстановки и ещё куча всего, то останется мало интересная история поимки, похожая на ……… Оценка: неплохо
alexk про Древневосточная литература: Книга тысячи и одной ночи. Арабские сказки [litres] (Древневосточная литература, Мифы. Легенды. Эпос)
13 01 Неловкая попытка переиздания /b/436061 из БВЛ
mysevra про Чайлд: Из глубины [Deep Storm ru] (Научная фантастика, Триллер)
13 01 Мне понравилось. Увлекательный сюжет, быстрое развитие действий. Наверное, фильм по этой книге вышел бы зрелищным. Оценка: хорошо
svetik489 про Дмитриев: Записки нечаянного богача – 3 (Социальная фантастика, Городское фэнтези, Самиздат, сетевая литература)
12 01 перенесите книгу к (Donteven) http://lib.rusec.net/a/200576 Оценка: неплохо
Barbud про Берг: Война (Детективная фантастика, Самиздат, сетевая литература)
12 01 По сравнению с первой частью весьма затянуто и скучно. Размышлизмы и исторические справки совершенно заполонили текст и вынуждают читать по диагонали. Степан от книги к книге становится все глупей и глупей. И кстати - "...я, ……… Оценка: хорошо
alexk про Кича: Большая книга по истории Ближнего Востока. Комплект из 5 книг [litres] (Исторические приключения, История)
11 01 Очень странное издание. И с каких это пор Афганистан стал Ближним Востоком?
behemmoth про Круз: В центре урагана (Социальная фантастика, Самиздат, сетевая литература)
09 01 Долго думал, писать ли отзыв или aut bene aut nihil. Но тем не менее. "Ветер над островами" был, пожалуй, самой "взрослой" серией Андрея, в которой наконец-то хоть чем то была разбавлена набившая оскомину парадигма "война ……… Оценка: плохо
Barbud про Ларин: Прощай СССР (Приключения: прочее, Самиздат, сетевая литература)
09 01 Дочитал... Да, местами смешно, читать можно. Жаль, концовка какая-то невнятная - ГГ вкупе с заклятыми братьями по сверхразуму исчез ХЗ куда, вожатую и ненормального пионера - "кровь-кишки-распидорасило", итог лагерной "Зарницы" остался непроясненным)) |
Комментарии
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Большая работа. Респект!
Для работы с картинками из уже готового fb2-файла не обязательно переносить его в BD.
В FBE есть опция "Экспорт в HTML". Результат тот же: собственно файл и папка с картинками.
Очень полезной оказалась для меня информация по массовой обработке картинок в IrfanView.
Немного смутила "галочка" в пункте "Convert to greyscale". Если картинки цветные, то получается, что они становятся черно-белыми, или я что-то не так поняла?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да, я ж там написал что если картинки чернобелые. Для цветных нужно убрать эту галку, и поставить не 8 цветов, а 256 и более. Там это тоже написано.
С greyScale картинки получаются более качественные, и меньше размером чем если сохранить чб в цветном.
Хех. А ведь потом все равно придется в BD вставлять (а там он наверняка опять переформатирует). А так сразу, меняем и сохраняем в fb2, с сохранением исходного форматирования.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
спасибо
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Прочитал рекомендации.
Всё, в общем-то, правильно, но мне не нравится упор на использование Book Designer'a. Эта программа хороша своей всеядностью и годится для преобразования почти из всех форматов в почти все, но вот FB2 она делает довольно своеобразные, которые требуют слишком большой доводки. К тоже BD не поддерживает стиль 'cite', который бывает очень нужен.
Мой опыт показывает, что более удобно делать всю послеOCRную работу в Word'е, также сделать стилевую разметку, а затем конвертировать в FB2 посредством преобразования 'wml2fb.xsl', который входит в комплект doc2fb (В Word делаем 'Сохранить как XML…', 'Применить преобразование…', выбираем wml2fb.xsl и всё. Остается только переименовать .XML в .FB2).
Картинки сохраняются в том виде как были, сноски (Word'овские!) делаются сносками FB2, заголовки до 4-го уровня расставляются корректно. Стили типа 'cite' остаются на местах. (Стиль 'epigraph' почему-то заменяется на 'stanza'). А вот раздел 'Description' пуст. Нужно полностью заполнить ручками. Ну и другая обработка тоже не помешает.
Если же нужно оптимизировать картинки, BookDesigner тоже не очень нужен, так как в FictionBook Editor v2.0 (как и в FB Writer) есть скрипты для работы с иллюстрациями, например просто сохранить все картинки из FB2 в текущую папочку. Потом можно делать с ними, всё что нужно, и вернуть на родину.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вы акцентировали внимание на слишком да еще и большой доводки
Какие например? У меня особых проблем с ним не было. Иногда файл получается невалидный, но это редко, да и fb2 подправить не сложно.
А как же с этим скриптом сделать главы, подглавы и вложенные секции? Как скрипт разберет что куда вложено и что есть title, а что есть subtitle?
В fbe их делать не реально.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В FBE это делается элементарно и без всяких скриптов :)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Я уже писал, что заголовки до 4-го уровня wml2fb.xsl расставляет корректно. Он все будут title с правильным уровнем вложенности. А subtitle можно и в FBE расставить. Кроме того в FBE (версии 2.0) есть чудный инструмент, расположенный под структурой документа. C помощью этих стрелочек легко корректируется вложенность секций.
Но я не и настаиваю. Различных инструментов много, так что каждый может использовать то, что ему нравится больше. Лишь бы был хороший результат!
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
+101
Пару раз встречал идеальные документы сделанные в Any2fb2!
Действительно - есть... а я его и не заметил (черт знает, кем помрешь)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Поддерживает. Выделить нужное, + правый клик--->cite.
А в верхнем меню cite нет, факт...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да, но дело в том, что в исходном файле этот стиль УЖЕ есть, а при переносе в BD исчезает, а еще раз проделывать разметку не хочется.
Когда таких фрагментов мало - не страшно, а если их пол книги?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вопрос по BD & FBD
Задавал в параллельной ветке, но тут уместней.
Перейдя на Висту, обнаружил, что ни та ни другая программа не хочет работать в этой ОС. Ошибка какого-то файла .ocx
Если эта задача решаема, то что нужно сделать.
Попытки установки ее в корень и в другой раздел диска ни к чему не привели. Файл нашел в сети, скачал, пихал в разные папки (и в виндовз и в папку с программой) - безрезультатно.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Файл поместить в system32, затем его зарегистрировать - Пуск - Выполнить - regsvr32 имя_файла.ocx. Во всяком случае так в ХР. В Висте, кажется, тоже самое.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Попробовал. Бесполезно. система при попытке регистрации не может найти файл ни в виндовз ни в систем32 папке.
Ошибка же выглядит так: этот компонент DHTMLED.OCX (и еще один .осх файл) больше не входит в состав виндовз.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да выкиньте нафиг эту висту. Это тормоз всей системы. В начале следущего года (да 2009) выйдет Windows 7, говорят она будет в разы быстрее этого тормоза.
Поставьте лучше XP x64 Pro - в данное время это наилучший вариант.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Я не спрашивал, что мне делать с вистой. Мне интересно - есть ли у существующего конкретного софта возможность работать в этой среде.
Если есть - то как этого добиться.
Если нет - не нужно сваливать с больной головы ФБД и БД на относительно здоровую голову висты.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Относительно здоровую - это сильно натянуто. Сами Microsoft признала что данная версия неудачная по производительности и оптимизации компонент. А также масса пользователей. Мало кто хотел брать Висту, пока ее не стали навязывать принудительно с ноутбуками например и не сделали агрессивную рекламу. Я просто советую. Игры на ней идут также с микрорывками, по сравнению с XP на одной и той же конфигурации.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Спасибо за советы, я поначалу тоже хотел ее снести, ибо раздражала, как, видимо, все новое и непривычное раздражает. а потом то ли я к ней привык, то ли она под меня приспособилась, и как бы желание уйти на ХР у меня пропало.
В игры я не играю, бук мой от нее не тормозит несмотря на аэро фейс и все анимации (поотключал кучу ненужных сервисов). Удобно в ней все сделано. Одни только Избранные папки слева в окне чего стоят.
Проги по фб2 запустились шаманскими способами. Видео показывает. Все прекрасно.
Но это офф. в этой теме. Я его сегодня уже в других местах начитался.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Если развивать офтоп, то на Longhorn тоже возлагалось много надежд - гораздо больше, чем оправдала Vista (если вообще что-то оправдала)... Хотя по поводу XP согласен.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Есть еще DHTML Editing Control for Applications Redistributable Package.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нифига! :(
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вспомнил я, наконец, где видел тему: http://the-ebook.org/forum/viewtopic.php?t=6177
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Ура! программа наконец-то открылась! Не спрашивайте - как, ибо я сам не знаю, делал все по последней ссылке от agrey (спасибо ему)
Пока не проверял как будет работать и сохранять. но и это уже что-то.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
-- у меня Window SP
-- я в system32 поместила свой файл 1.pdf
-- пуск
-- выполнить
-- regsvr32 набираю
-- нахожу свой файл 1.pdf и даю ему уже другое расширение (правильно ???) 1.ocx
-- ok
-- и этот файл не находится
Подскажите, пожалуйста, что я делаю не правильно ...
я плохо разбираюсь в этих тонкостях, но хочется научиться правильно заливать книги
спасибо
с уважением ...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А что вы, собственно, делаете?
пдф можно грузить без ухищрений. Если такой книги нет на сайте, конечно.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А как? Т.е. можно выделить слово, и сделать его title? Как? Я бы очень хотел чтобы такая возможность была. Подскажите пожалуйста где она. Я искал не нашел.
Вы не поняли. Как он определит что это title а здесь subtitle? Разве в ворде это можно указать?
Т.е. есть книга, в которой идет Глава 1. Далее в ней идут подзаголовки, через абзац, два. Вот их нужно вручную выделять как Subtitle. Как скрипт поймет это?
Или он просто сделает их как title? Но делать их именно заголовками нельзя, т.к. замучаешся читать на устройстве ebook, там заголовок начинается с новой страницы - т.е. в данной ситуации ,каждый абзац будет с новой страницы..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А как? Т.е. можно выделить слово, и сделать его title? Как? Я бы очень хотел чтобы такая возможность была. Подскажите пожалуйста где она. Я искал не нашел.
Очень просто!
Выделяете абзац, нажимаете Shift+Enter и всё!!! titlе готов.
Выделяете абзац, нажимаете Alt+S и всё!!! subtitle готов.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Спасибо. Я не знал этого про title. Почему то об этом нигде не написано в программе.
Тогда BD остается только для конвертирования из html.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Это главная фича FBE - отсутствие справки. "Попробуй угодай" - бесплатная игра от Грибова юзерам.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Из HTML я конвертирую обычно через Word. Попался как-то документ с множеством перекрестных ссылок. BD такой FB2 наворотил, что просто офигеть, а через Word получилось нормально.
А из Word'a еще можно с помощью ExportXML.dot конвертировать.
Что же касается title, то это я методом тыка нашел. А потом уже увидел в книге Михаила Кондратовича "Создание электронных книг в формате FictionBook 2.1: практическое руководство" http://lib.rus.ec/b/123638. Там много чего полезного есть. Жаль, она мне поздно попалась.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
О нет, только не Word. Может быть наворотил с ссылками, но это еденичный случай. Word перегоняет все картинки в jpg, тем самым ухудшая (размазывание) качество их увеличивая их размер.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Не заметил. На днях делал книгу, как раз из PDF. Картинки, как были смесью PNG и JPG, так и остались. Использовал только Acrobat, Word и FBE.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Очень просто. Нужно выровнять нужный абзац в Ворде по центру :) После преобразования doc2fb эти выровненные по центру абзацы станут субтитлами.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Все таки мой вариант лучше. 20 сек на перегонку в fb2 в BD, а после уже редактировать в fbe, - сразу видишь что делаешь. тем более после скрипта все равно нужно будет забрасывать его в fbe для шифовки.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Дык никто ж не спорит, вопрос был, "разве возможно это в ворде?" - я ответил как это сделать.
??? какой шифровки?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
там л пропущена.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Возвращаясь к началу.
Многие PDF содержат текст в виде собственно текста, так что их можно и не распознавать. Достаточно самим Adobe Acrobat'ом сделать 'Save as HTML | RTF | DOC'. Если же так просто не получится, можно использовать ABBYY PDF Transformer. Он конвертирует PDF в разные форматы более корректно.
Читал где-то, что есть и DJVU с текстовым слоем, но мне такие не встречались.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Есть. Дневники Чехова из ППС на publ.lib.ru, например. Но этот слой в формате txt, где каждая строчка – абзац, т.е. с этим файлом еще работать и работать. Естественно, ни болд, ни италик в нем не отображаются.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нашел в сетке у себя. Кому надо могу залить на рапиду. 220 мб.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нестоит. Кому надо, тот найдет, например тут.
Или к примеру в теме fb2-софт, ссылка на которую есть в заглавном посте soshial.
ИМХО конечно, но FineReader все таки лучше...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В отделе Сноски утверждение:
излишне жесткое.
Я, например, использую квадратные скобки. Все получается без осечек.
Еще вопрос. Я чего-то не смог в FR9 избавиться от знаков абзаца в конце строки. Никак. "Помню" в каких-то ранних версиях с этим проблем не было - отметил галочку и все насильственные переносы строки исчезли. Здесь же все галочки "Сохранять деление на строки" убраны, а оно все равно их сохраняет. Это все обычный OCR, конечно, не из pdf, ну да все равно. Не подскажете, что за хрень?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В квадратных скобках могут содержаться ссылки на статьи, главы итп. к примеру [1] или [2]. Я уже так попал, потом пришлось нудно искать где же они лежат.
При сохраниении в html я ничего подобного не заметил, в FR9 (OCR был с djvu).
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Если судить по набору скриптов FBE, то можно использовать для обозначения сносок различные виды скобок: фигурные {...}, квадратные [...], [!...!], [~...~] и свои собственные, лишь бы не смешивались с теми, которые сносками не являются.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Так рассказываю минуса.
Да текст переводиться качественно НО, одно большое но:
Включаються колонтитулы и номера страниц. Это очень сильно усложняет обработку конечного файла.
Так что даже в этом случае я выбираю Fine Reader - ведь весь текст разпознается без ошибок (если pdf текстовый), но можно выбрать области сразу и применить на все страницы.
Но если текст без колонтитолов и номеров страниц (что редко бывает), тогда конечно Transformer.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Не такое оно и большое... Можно тем же Acrobat'ом сделать Crop страниц, с целью обрезки колон(титулов)цифр.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Дык в том то и дело, что то же самое можно сделать и в Fine Reader, без мудрежа. Я к примеру не знаю как это делается, + надо устанавливать Adobe Acrobat а не Reader. В итоге юзать две программы, и тратить больше времени. - вот поэтому оно и большое "НО", по сравнению с FR - где все конверирование занимает минуты. Повторюсь - текст который не отсканирован, FR разпознает с без ошибок. А юзать подобный способ только для того, чтобы использовать програму pdf transformer имхо неправильно, ведь нужно смотреть на тот как быстро можно получить качественный результат.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Это если картинки не с OCR. С OCR такого не сделаешь. Плюс прозрачность увеличивает размер. + она в большистве и не нужна. Ведь все равно на белом фоне что на ebook что на компе.
Здрастье приехали. Наоборот. Попробуйте сначала уменьшить без ресепла - удивитесь. это раз.
во вторых в скобках написано возле ресепла написано - (better quality)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
За советы также всем спасибо. На выходных обновлю мануал (сейчас в поездке), с обозначением автора, который предложил вариант.
Думаю многим пригодиться.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Иногда png имеет даже ме́ньший размер, чем jpg
http://i4.imageban.ru/out/2010/12/05/581abfa36a0cbb56b297358a200a4c81.jpg
http://i1.imageban.ru/out/2010/12/05/3c15deacb34dfc99e136e91a1501afd0.png
Можете скачать и убедиться
Фотки сделаны из дежавюшки из программы WinDjVu экспортом страницы.
Если кто не знает, как сохранить рисунок, вот подсказка:
ПКМ на рисунке и