Вы здесьКак создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Опубликовано вс, 14/12/2008 - 04:53 пользователем Psychedelic
Цитата:
Если нужно, я могу детально составить пошаговый шаблон, как конвертировать pdf и djvu с распознаванием в fb2. Как конверитировать картинки оттуда, сжатыми по максимуму в png без визуальной потери качества, причем конвертировать в пакетной обработке. точнее как это сделать относительно быстро и качественно. Описал. Довольно много получилось. Жду комментариев.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 день
Саша из Киева RE:Избранное 1 день PipboyD RE:Подайте бедному копеечку на книжку с литреса... 1 день Alligatoreader RE:Багрепорт - 2 2 дня fedor.de RE:Отображение страницы Librusek 4 дня Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 6 дней kopak RE:Таинственная личность админа Флибусты 1 неделя blahblahblah2024 RE:Беженцы с Флибусты 1 неделя sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 1 неделя sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 2 недели TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 3 недели Oleg V.Cat RE:B343695 Александр. Книга 1 3 недели Isais RE:Калибрятина/Самиздатина 3 недели md2k15 RE:Относительно Вархаммер 40 000 3 недели tvnic RE:"Коллектив авторов" 4 недели SergL197 RE:Регистрация 4 недели ejik.v RE:Viva Stiver! 1 месяц RedRoses3 RE:Флибуста конец? 1 месяц Впечатления о книгах
Олег Макаров. про Шоу должно продолжаться!
23 11 Если вы любите попаданцев... Если вам интересна музыка... Если вы не считаете, что каждый уважающий себя и читателя попаданец обязан спасти СССР и по дороге жёстко разобраться с Горбачёвым, Ельциным, евреями и велосипедистами.... то стоит попробовать эту серию
Олег Макаров. про Черный дембель
23 11 Неплохо. Простенько, но интересненько. Местами чуть затянуто, но не мешает. Короче, если вам нечего читать, то стоит попробовать.
Олег Макаров. про Сухов: Первый квест [СИ] (Фэнтези, ЛитРПГ, Самиздат, сетевая литература)
23 11 Написано хорошо, но мне не нравятся такие книги. Любители литрпг дерзайте. Оценка: хорошо
Oleg68 про Кобен: Укороченный удар [Drop Shot ru] (Крутой детектив)
22 11 Хорошее продолжение серии о спортивном агенте-детективе. Оценка: отлично!
decim про Галинакс: Как украсть миллион. Жизнь и удивительные приключения Бенвенуто Челлини, гения Возрождения (Историческая проза, Исторические приключения, Биографии и Мемуары)
22 11 Аноним-самопальщик выспался на "Жизни Бенвенуто Челлини, написанной им самим", переведя с русского языка 19-го века(вы же не думаете, что со средневекового итальянского?) на жаргон журок и эскортниц.О вторых он сведущ, словно сам шлюхой работал. Нечитаемо.
Лысенко Владимир Андреевич про Коровин: После «Украины» (Политика, Публицистика)
22 11 Надо же такое придумать, нечитаемо. Оценка: нечитаемо
Oleg V.Cat про Коровин: После «Украины» (Политика, Публицистика)
21 11 Любому насекомоядному понятно, что эта война устраивает практически всех. Поэтому заканчивать её таки придется тем, кого она не устраивает.
udrees про Мэтьюз: Как остановить травлю? Помогите ребенку справиться с обидчиками в интернете и школе (Психология, Педагогика)
21 11 Легко написанная книга про проблему буллинга детей в школах, снабжена кучей смешных иллюстраций. Описывает опыт, в основном, я так понял, из Австралии. Есть куча советов как работать с жертвами, как работать с мучителями, ……… Оценка: неплохо
trampak про Коровин: После «Украины» (Политика, Публицистика)
21 11 Мир - это война, гармония-убийства и разрушения, развитие- дырка в земле вместо туалета... Оценка: нечитаемо |
Комментарии
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Большая работа. Респект!
Для работы с картинками из уже готового fb2-файла не обязательно переносить его в BD.
В FBE есть опция "Экспорт в HTML". Результат тот же: собственно файл и папка с картинками.
Очень полезной оказалась для меня информация по массовой обработке картинок в IrfanView.
Немного смутила "галочка" в пункте "Convert to greyscale". Если картинки цветные, то получается, что они становятся черно-белыми, или я что-то не так поняла?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да, я ж там написал что если картинки чернобелые. Для цветных нужно убрать эту галку, и поставить не 8 цветов, а 256 и более. Там это тоже написано.
С greyScale картинки получаются более качественные, и меньше размером чем если сохранить чб в цветном.
Хех. А ведь потом все равно придется в BD вставлять (а там он наверняка опять переформатирует). А так сразу, меняем и сохраняем в fb2, с сохранением исходного форматирования.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
спасибо
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Прочитал рекомендации.
Всё, в общем-то, правильно, но мне не нравится упор на использование Book Designer'a. Эта программа хороша своей всеядностью и годится для преобразования почти из всех форматов в почти все, но вот FB2 она делает довольно своеобразные, которые требуют слишком большой доводки. К тоже BD не поддерживает стиль 'cite', который бывает очень нужен.
Мой опыт показывает, что более удобно делать всю послеOCRную работу в Word'е, также сделать стилевую разметку, а затем конвертировать в FB2 посредством преобразования 'wml2fb.xsl', который входит в комплект doc2fb (В Word делаем 'Сохранить как XML…', 'Применить преобразование…', выбираем wml2fb.xsl и всё. Остается только переименовать .XML в .FB2).
Картинки сохраняются в том виде как были, сноски (Word'овские!) делаются сносками FB2, заголовки до 4-го уровня расставляются корректно. Стили типа 'cite' остаются на местах. (Стиль 'epigraph' почему-то заменяется на 'stanza'). А вот раздел 'Description' пуст. Нужно полностью заполнить ручками. Ну и другая обработка тоже не помешает.
Если же нужно оптимизировать картинки, BookDesigner тоже не очень нужен, так как в FictionBook Editor v2.0 (как и в FB Writer) есть скрипты для работы с иллюстрациями, например просто сохранить все картинки из FB2 в текущую папочку. Потом можно делать с ними, всё что нужно, и вернуть на родину.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вы акцентировали внимание на слишком да еще и большой доводки
Какие например? У меня особых проблем с ним не было. Иногда файл получается невалидный, но это редко, да и fb2 подправить не сложно.
А как же с этим скриптом сделать главы, подглавы и вложенные секции? Как скрипт разберет что куда вложено и что есть title, а что есть subtitle?
В fbe их делать не реально.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В FBE это делается элементарно и без всяких скриптов :)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Я уже писал, что заголовки до 4-го уровня wml2fb.xsl расставляет корректно. Он все будут title с правильным уровнем вложенности. А subtitle можно и в FBE расставить. Кроме того в FBE (версии 2.0) есть чудный инструмент, расположенный под структурой документа. C помощью этих стрелочек легко корректируется вложенность секций.
Но я не и настаиваю. Различных инструментов много, так что каждый может использовать то, что ему нравится больше. Лишь бы был хороший результат!
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
+101
Пару раз встречал идеальные документы сделанные в Any2fb2!
Действительно - есть... а я его и не заметил (черт знает, кем помрешь)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Поддерживает. Выделить нужное, + правый клик--->cite.
А в верхнем меню cite нет, факт...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да, но дело в том, что в исходном файле этот стиль УЖЕ есть, а при переносе в BD исчезает, а еще раз проделывать разметку не хочется.
Когда таких фрагментов мало - не страшно, а если их пол книги?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вопрос по BD & FBD
Задавал в параллельной ветке, но тут уместней.
Перейдя на Висту, обнаружил, что ни та ни другая программа не хочет работать в этой ОС. Ошибка какого-то файла .ocx
Если эта задача решаема, то что нужно сделать.
Попытки установки ее в корень и в другой раздел диска ни к чему не привели. Файл нашел в сети, скачал, пихал в разные папки (и в виндовз и в папку с программой) - безрезультатно.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Файл поместить в system32, затем его зарегистрировать - Пуск - Выполнить - regsvr32 имя_файла.ocx. Во всяком случае так в ХР. В Висте, кажется, тоже самое.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Попробовал. Бесполезно. система при попытке регистрации не может найти файл ни в виндовз ни в систем32 папке.
Ошибка же выглядит так: этот компонент DHTMLED.OCX (и еще один .осх файл) больше не входит в состав виндовз.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Да выкиньте нафиг эту висту. Это тормоз всей системы. В начале следущего года (да 2009) выйдет Windows 7, говорят она будет в разы быстрее этого тормоза.
Поставьте лучше XP x64 Pro - в данное время это наилучший вариант.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Я не спрашивал, что мне делать с вистой. Мне интересно - есть ли у существующего конкретного софта возможность работать в этой среде.
Если есть - то как этого добиться.
Если нет - не нужно сваливать с больной головы ФБД и БД на относительно здоровую голову висты.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Относительно здоровую - это сильно натянуто. Сами Microsoft признала что данная версия неудачная по производительности и оптимизации компонент. А также масса пользователей. Мало кто хотел брать Висту, пока ее не стали навязывать принудительно с ноутбуками например и не сделали агрессивную рекламу. Я просто советую. Игры на ней идут также с микрорывками, по сравнению с XP на одной и той же конфигурации.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Спасибо за советы, я поначалу тоже хотел ее снести, ибо раздражала, как, видимо, все новое и непривычное раздражает. а потом то ли я к ней привык, то ли она под меня приспособилась, и как бы желание уйти на ХР у меня пропало.
В игры я не играю, бук мой от нее не тормозит несмотря на аэро фейс и все анимации (поотключал кучу ненужных сервисов). Удобно в ней все сделано. Одни только Избранные папки слева в окне чего стоят.
Проги по фб2 запустились шаманскими способами. Видео показывает. Все прекрасно.
Но это офф. в этой теме. Я его сегодня уже в других местах начитался.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Если развивать офтоп, то на Longhorn тоже возлагалось много надежд - гораздо больше, чем оправдала Vista (если вообще что-то оправдала)... Хотя по поводу XP согласен.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Есть еще DHTML Editing Control for Applications Redistributable Package.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нифига! :(
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Вспомнил я, наконец, где видел тему: http://the-ebook.org/forum/viewtopic.php?t=6177
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Ура! программа наконец-то открылась! Не спрашивайте - как, ибо я сам не знаю, делал все по последней ссылке от agrey (спасибо ему)
Пока не проверял как будет работать и сохранять. но и это уже что-то.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
-- у меня Window SP
-- я в system32 поместила свой файл 1.pdf
-- пуск
-- выполнить
-- regsvr32 набираю
-- нахожу свой файл 1.pdf и даю ему уже другое расширение (правильно ???) 1.ocx
-- ok
-- и этот файл не находится
Подскажите, пожалуйста, что я делаю не правильно ...
я плохо разбираюсь в этих тонкостях, но хочется научиться правильно заливать книги
спасибо
с уважением ...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А что вы, собственно, делаете?
пдф можно грузить без ухищрений. Если такой книги нет на сайте, конечно.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А как? Т.е. можно выделить слово, и сделать его title? Как? Я бы очень хотел чтобы такая возможность была. Подскажите пожалуйста где она. Я искал не нашел.
Вы не поняли. Как он определит что это title а здесь subtitle? Разве в ворде это можно указать?
Т.е. есть книга, в которой идет Глава 1. Далее в ней идут подзаголовки, через абзац, два. Вот их нужно вручную выделять как Subtitle. Как скрипт поймет это?
Или он просто сделает их как title? Но делать их именно заголовками нельзя, т.к. замучаешся читать на устройстве ebook, там заголовок начинается с новой страницы - т.е. в данной ситуации ,каждый абзац будет с новой страницы..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
А как? Т.е. можно выделить слово, и сделать его title? Как? Я бы очень хотел чтобы такая возможность была. Подскажите пожалуйста где она. Я искал не нашел.
Очень просто!
Выделяете абзац, нажимаете Shift+Enter и всё!!! titlе готов.
Выделяете абзац, нажимаете Alt+S и всё!!! subtitle готов.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Спасибо. Я не знал этого про title. Почему то об этом нигде не написано в программе.
Тогда BD остается только для конвертирования из html.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Это главная фича FBE - отсутствие справки. "Попробуй угодай" - бесплатная игра от Грибова юзерам.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Из HTML я конвертирую обычно через Word. Попался как-то документ с множеством перекрестных ссылок. BD такой FB2 наворотил, что просто офигеть, а через Word получилось нормально.
А из Word'a еще можно с помощью ExportXML.dot конвертировать.
Что же касается title, то это я методом тыка нашел. А потом уже увидел в книге Михаила Кондратовича "Создание электронных книг в формате FictionBook 2.1: практическое руководство" http://lib.rus.ec/b/123638. Там много чего полезного есть. Жаль, она мне поздно попалась.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
О нет, только не Word. Может быть наворотил с ссылками, но это еденичный случай. Word перегоняет все картинки в jpg, тем самым ухудшая (размазывание) качество их увеличивая их размер.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Не заметил. На днях делал книгу, как раз из PDF. Картинки, как были смесью PNG и JPG, так и остались. Использовал только Acrobat, Word и FBE.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Очень просто. Нужно выровнять нужный абзац в Ворде по центру :) После преобразования doc2fb эти выровненные по центру абзацы станут субтитлами.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Все таки мой вариант лучше. 20 сек на перегонку в fb2 в BD, а после уже редактировать в fbe, - сразу видишь что делаешь. тем более после скрипта все равно нужно будет забрасывать его в fbe для шифовки.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Дык никто ж не спорит, вопрос был, "разве возможно это в ворде?" - я ответил как это сделать.
??? какой шифровки?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
там л пропущена.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Возвращаясь к началу.
Многие PDF содержат текст в виде собственно текста, так что их можно и не распознавать. Достаточно самим Adobe Acrobat'ом сделать 'Save as HTML | RTF | DOC'. Если же так просто не получится, можно использовать ABBYY PDF Transformer. Он конвертирует PDF в разные форматы более корректно.
Читал где-то, что есть и DJVU с текстовым слоем, но мне такие не встречались.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Есть. Дневники Чехова из ППС на publ.lib.ru, например. Но этот слой в формате txt, где каждая строчка – абзац, т.е. с этим файлом еще работать и работать. Естественно, ни болд, ни италик в нем не отображаются.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нашел в сетке у себя. Кому надо могу залить на рапиду. 220 мб.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Нестоит. Кому надо, тот найдет, например тут.
Или к примеру в теме fb2-софт, ссылка на которую есть в заглавном посте soshial.
ИМХО конечно, но FineReader все таки лучше...
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В отделе Сноски утверждение:
излишне жесткое.
Я, например, использую квадратные скобки. Все получается без осечек.
Еще вопрос. Я чего-то не смог в FR9 избавиться от знаков абзаца в конце строки. Никак. "Помню" в каких-то ранних версиях с этим проблем не было - отметил галочку и все насильственные переносы строки исчезли. Здесь же все галочки "Сохранять деление на строки" убраны, а оно все равно их сохраняет. Это все обычный OCR, конечно, не из pdf, ну да все равно. Не подскажете, что за хрень?
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
В квадратных скобках могут содержаться ссылки на статьи, главы итп. к примеру [1] или [2]. Я уже так попал, потом пришлось нудно искать где же они лежат.
При сохраниении в html я ничего подобного не заметил, в FR9 (OCR был с djvu).
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Если судить по набору скриптов FBE, то можно использовать для обозначения сносок различные виды скобок: фигурные {...}, квадратные [...], [!...!], [~...~] и свои собственные, лишь бы не смешивались с теми, которые сносками не являются.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Так рассказываю минуса.
Да текст переводиться качественно НО, одно большое но:
Включаються колонтитулы и номера страниц. Это очень сильно усложняет обработку конечного файла.
Так что даже в этом случае я выбираю Fine Reader - ведь весь текст разпознается без ошибок (если pdf текстовый), но можно выбрать области сразу и применить на все страницы.
Но если текст без колонтитолов и номеров страниц (что редко бывает), тогда конечно Transformer.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Не такое оно и большое... Можно тем же Acrobat'ом сделать Crop страниц, с целью обрезки колон(титулов)цифр.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Дык в том то и дело, что то же самое можно сделать и в Fine Reader, без мудрежа. Я к примеру не знаю как это делается, + надо устанавливать Adobe Acrobat а не Reader. В итоге юзать две программы, и тратить больше времени. - вот поэтому оно и большое "НО", по сравнению с FR - где все конверирование занимает минуты. Повторюсь - текст который не отсканирован, FR разпознает с без ошибок. А юзать подобный способ только для того, чтобы использовать програму pdf transformer имхо неправильно, ведь нужно смотреть на тот как быстро можно получить качественный результат.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Это если картинки не с OCR. С OCR такого не сделаешь. Плюс прозрачность увеличивает размер. + она в большистве и не нужна. Ведь все равно на белом фоне что на ebook что на компе.
Здрастье приехали. Наоборот. Попробуйте сначала уменьшить без ресепла - удивитесь. это раз.
во вторых в скобках написано возле ресепла написано - (better quality)
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
За советы также всем спасибо. На выходных обновлю мануал (сейчас в поездке), с обозначением автора, который предложил вариант.
Думаю многим пригодиться.
Отв: Как создавать книги в fb2, из pdf, djvu, rtf, doc, txt ..
Иногда png имеет даже ме́ньший размер, чем jpg
http://i4.imageban.ru/out/2010/12/05/581abfa36a0cbb56b297358a200a4c81.jpg
http://i1.imageban.ru/out/2010/12/05/3c15deacb34dfc99e136e91a1501afd0.png
Можете скачать и убедиться
Фотки сделаны из дежавюшки из программы WinDjVu экспортом страницы.
Если кто не знает, как сохранить рисунок, вот подсказка:
ПКМ на рисунке и