Вы здесьФормат NFB
Опубликовано ср, 26/11/2008 - 07:23 пользователем СерыйМыш
начиная с 01.12.2008 ТЕМА НЕ МОДЕРИРУЕТСЯ изменено: 30.06.2009. 24.04.2009: работы временно приостановлены по субъективным причинам. возобновление планируется на середину мая этого года. формат разрабатывается как макcимально упрощенный альтернативный вариант хранения книг. работы над спецификацией формата практически закончены. конвертор пока существует только из fb2 в nfb, планируется полная поддержка импорта и экспорта для формата fb2. у кого есть конструктивные идеи/замечания/предложения - прошу высказаться.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Aliki RE:Подайте бедному копеечку на книжку с литреса... 8 часов
laurentina1 RE:Ирина Александровна Велембовская - Немцы 1 день Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 4 дня Саша из Киева RE:Избранное 1 неделя Alligatoreader RE:Багрепорт - 2 1 неделя fedor.de RE:Отображение страницы Librusek 1 неделя Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 1 неделя kopak RE:Таинственная личность админа Флибусты 2 недели blahblahblah2024 RE:Беженцы с Флибусты 2 недели sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 2 недели sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 3 недели TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 4 недели Oleg V.Cat RE:B343695 Александр. Книга 1 4 недели Isais RE:Калибрятина/Самиздатина 1 месяц md2k15 RE:Относительно Вархаммер 40 000 1 месяц tvnic RE:"Коллектив авторов" 1 месяц SergL197 RE:Регистрация 1 месяц ejik.v RE:Viva Stiver! 1 месяц Впечатления о книгах
андрей169 про Шалашов: Господин следователь 1 [СИ] (Альтернативная история, Исторический детектив, Попаданцы, Самиздат, сетевая литература)
29 11 Забавная книга. Мне лично зашло хорошо. С продолжением обязательно ознакомлюсь. Оценка: хорошо
udrees про Баковец: Не тот господин 3 (Порно, ЛитРПГ, Самиздат, сетевая литература)
29 11 Книга строго для отдыха мозгов, тем кому нравится читать про влажные подростковые фантазии про гарем, воплощенные в реальность, и сексуальные подвиги, перемешанные с фэнтези. Герой настолько крут, что особо не заморачивается ……… Оценка: неплохо
udrees про Михайлов: Без пощады. Книга 3 [СИ] (Боевая фантастика, Космическая фантастика, Самиздат, сетевая литература)
29 11 Последняя книга из серии, но не последняя книга про месть киборга Вертинского. Написано в том же стиле, что и предыдущие книги. Описание во многом уделено экшену, поэтому всегда держит в тонусе, сражения, драки, убийства и ……… Оценка: отлично!
lukmak про Сочинения Иосифа Бродского в 7 томах
29 11 Бродский - гений. А кто его не понимает - что ж... Он непрост. Но, ребята, если вы его не понимаете - может, это ваша проблема?.. И пиндосы тут ни при чём.
nik_ol про Донцова: Амур с гранатой (Иронический детектив, Детективы: прочее)
27 11 Конечно, я рада, что книги Донцовой выходят и выходят, но неужели, если она сама их пишет, то не помнит, что «старичок» был не Коробков, а Гри, её первый муж, до Ивана в этой серии?! Или всё-таки литературные негры клепают?! Оценка: неплохо
neletay про Котов: Ценитель [СИ] (Городское фэнтези, Самиздат, сетевая литература, Приключения)
27 11 Прочитала только несколько первых глав - и уже очень, очень нравится. Нравится все - сюжет, стиль, язык, ГГ, а также автор, который за всем этим видится. С удовольствием читаю дальше, надеюсь не разочароваться.
Lan2292 про Ермаков: Май, весна и апокалипсис. Книга 1 (Боевая фантастика, ЛитРПГ, Самиздат, сетевая литература)
27 11 Так себе чтиво, но не скучно. Оценка: неплохо
Chernovol про Коровин: После «Украины» (Политика, Публицистика)
25 11 Интересно, такие книги кто-то покупает или их бесплатно раздают. Оценка: нечитаемо
sem14 про Лазарис: Белая ворона (Историческая проза)
25 11 Леонид Гомберг 24 июля 2007 Роман известного в Израиле прозаика, поэта и переводчика Владимира Лазариса «Белая ворона» (Тель-Авив: Ладо, 2003) в этом году был включен в «лонг-лист» популярной премии «Букер». И это ……… Оценка: отлично!
decim про Осне Сейерстад
25 11 Попробовала бы Сурайя-реис не подать в суд! Муж бы убил. "Для контекста добавлю, что после публикации книги семья героя подала на Сейерстад в суд за клевету, но после апелляции писательница была признана невиновной, а через ………
tvv про Кич: Большой дом [СИ] (Ужасы, Мистика, Фанфик, Юмористическое фэнтези)
24 11 Совершенно замечательное "Оккультное Простоквашино".
decim про Галинакс: Женщина-рыцарь. Самые необычные истории Средневековья (Исторические приключения, История)
24 11 А вот это уже лучше. Подлинник на сей раз не знаю, а компиляция - явно автор чем-то вдохновлялся, но не ссылается на - получилась годная, и хорошо подобраны иллюстрации. Неплохо. Оценка: неплохо |
||||||
Комментарии
Отв: Формат NFB
Э-э, прости за мои постоянные потуги расширить «NFB_Info», но тут вот какое дело: на Либрусеке, насколько я понимаю, довольно активно используется механизм слежения за автором *.fb2 документа, поскольку некоторые авторы склонны к некоторым недоделкам и т. п. А у тебя автор *.fb2 лишается своего особого блока и помещается в общей секции для доп. сведений «INFO». Вопрос: сможет ли твой каталогизатор вытаскивать эту нужную информацию?
Отв: Формат NFB
при возникновении претензий к определенному "автору" на основании его определённой "работы", вполне возможно глазками разобрать поле INFO и сделать выводы. автоматизированно компоновать файлы по имени "автора" - явно лишнее, особенно учитывая, что подпись в поле "document-info.author" заполняется вообще абстрактно и как придётся, потому как человек в здравом уме не станет указывать подробно свои паспортные данные на "вещественном доказательстве".
в связи с этим настораживает гипотетическая вероятность предъявления претензий всякими копирастами к особо активным оцифровщикам. как-то подсознательно мне не хочется помогать всяким идейным борцам и желающим заработать не работая.
надо голосовать. если выяснится реальная полезность отдельного структурированного блока вида "document-info" - добавлю без вопросов.
Отв: Формат NFB
Что-то типа совета. :)
Наверное, надо завести коллекцию образцов для разного рода документов (сборников, колл. монографий, изданий с многими сопроводительными материалами etc. — чтобы можно было наглядно иметь дело с разными «NFB_Info».
Отв: Формат NFB
выложил триннадцатую редакцию. попытался навести порядок и учесть последние пожелания.
перечитал спецификацию, пытаясь представить себе, что читает её посторонний человек в первый раз. понял, что выглядит оно внутри как-то безсистемно и косолапо.
кто может помочь хотя бы рекомендациями по методике оформления спецификации и переводу её на человеческий язык - буду безмерно благодарен.
Отв: Формат NFB
Бегло и сумбурно, но…
У сборников часто бывают разные языки оригиналов отдельных произведений. И было бы неплохо иметь возможность указать язык для каждого произведения.
Стихи могут попадать в оглавление по первой строфе. Дублировать?
Неоднозначность сигнатуры ||. Просто придирка, но парсеру надо будет запоминать, что сейчас он, к примеру, сноску обрабатывает.
Дальше смешной вопрос -- сигнатуры типа === автоматически обозначают применение ~~ для последующего текста при наличии каких-то шрифтовых выделений в предшествующем тексте?
Отв: Формат NFB
вот аццкий сотона. заметил-таки... а я так надеялся... ладно, впишем уже :)
я надеюсь, нет сборников, в которых тексты на разных языках? или всё-таки есть???
не, не дублировать. просто задать в начальной сигнатуре пустой заголовок нужного уровня:
[&]===
Лыжи у печки стоят
Не на что лыжам присесть.
[.]
отмечу в спецификации.
на самом деле не придется. придется по разному обрабатывать маркер при выводе разных видов блоков, но этот вывод сейчас и так сделан с помощью перекрытых методов объектов, так что проблема не столь серьёзна.
опять же - количество символов ограничено, поэтому вразумительные сигнатуры на каждый отдельный случай сложновато придумать.
да. переход к следующему абзацу/блоку всегда сбрасывает шрифтовое выделение. заголовок выводится своим стилем, текст далее - своим, без выделения.
Отв: Формат NFB
Отв: Формат NFB
хм. вроде было указано ещё с первых версий:
Сигнатуры форматирования могут встречаться в любом месте текста. Все сигнатуры являются переключателями. Первое вхождение включает указанный формат символов, следующее - выключает. При отсуствии выключающего вхождения формат действует до конца текущего абзаца.
добавлю уточнение на всякий случай. действительно написано неочевидно.
Отв: Формат NFB
JAW wrote:
Меня в Fb2 в реализации PocketBook не удовлетворила глубина вложенности Section.
Там, какжется, Title, Part, Section и вроде всё...
Всяких SubSection, SubSubSection, Par (с Inline заголовком) не предусмотрено?
Ладно... Нужно смотреть спецификацию внимательней.
А что делать, если мы в одном документе объединяем разные статьи со своими титламами, возможно разными авторами и т.п.
Типичный научный сборник... Там ещё к каждой статье свой индекс УДК болтается...
А потом всё это разбить среди множества таких томов по рубликации?
GribUser wrote:
Типичный научный сборник
Без шансов, fb2 это не переварит.
А nfb такое переварит?
Отв: Формат NFB
уровней вложения заголовков изначально предусмотрено четыре, но в спецификации этот факт жетско не прописан. количество этажей рассчитывалось из соображений удобства пользования оглавлением и усредненной статистики - в основном содержание в книгах имеет два-три уровня деления - Книга первая/Часть первая/Глава первая. четвертый уровень взят для покрытия клинических случаев. вполне допустимо сделать хоть десять уровней вложения, только надо ли?
насчет Par и инлайновых заголовков можно обдумать. но вероятно результатом будет загромождение блока "содержание" и потеря удобства пользования.
сборники с разными авторами уже обсуждались: деление в файле идет на уровне текстовых секций - по отдельным публикациям/авторам, внутри секций - по заголовкам разного уровня.
подход к каталогизации такой - обрабатывается служебная секция "bookinfo", и из нее берутся сведенияоб авторах, названиях и т.п. если очень нужен поиск и систематизация по отдельным статьям - оформлять в виде отдельных секций и прописывать в bookinfo.
не вижу пока ни одной причины не переварить.
п.с. мне неимоверно стыдно, но никак не могу заставить себя доделать движок читалки. завал на работе плюс ремонт дома, в итоге сил и желания практически не остаётся. надеюсь, когда-нибудь ситуация поменяется.
Отв: Формат NFB
Да одному все это поднять нелегко.
Вы и так сделали много.
По-хорошему, этот проект должен поддержать Ларин: деньгами или хотя бы заявлением о постепенном переводе либрусека на nfb.
Отв: Формат NFB
не-не-не-не, девид блейн! (с)
сразу две ошибки в одном предложении. во-первых - Ларин никому из нас ничего не должен, а особенно денег. во-вторых, говорить об использовании какого-либо альтернативного формата для либрусека можно будет только после того, как этот формат будет иметь полную инфраструктуру поддержки - редакторы, читалки, конвертеры. да и то не факт.
чтобы перейти на другой формат, нужны очень веские основания. как минимум тенденция к увеличению количества книг в новом формате, и явные недвусмысленные намеки общественности на то, что имеющийся формат их не устраивает. пока fb2 устраивает большинство, и незачем мутить воду.
по поводу денег - они не помогут. вряд ли у грибова на его работе мало платят, однако fb3 до сих пор не вышел из состояния драфта.
и вообще, я изначально объявил и буду в дальнейшем настаивать: моя разработка была и будет бесплатной и открытой. любого, кто попробует использовать её для зарабатывания денег, я предам анафеме и затаскаю по судам.
кстати, похоже самое время на всякий случай сделать фиксацию факта авторства и подумать, под какой лицензией жить дальше. скорее всего GNU GPL/FDL или СС-NC, надо перечитать и выбрать.
П.С. очень хочется присобачить СС BY-NC-SA, но в нашей стране нет адекватного закона на этот счет. буду думать.
Отв: Формат NFB
< сразу две ошибки в одном предложении
<во-первых - Ларин никому из нас ничего не должен
Ну почему же, затеяв такой проект он несет перед нами определенную моральную ответственность. Например, кореец, drserj и др. разработали разработали замечательные программы, предполагая, что либусек не прекратит свою работу.
>по поводу денег - они не помогут. вряд ли у грибова на его работе мало платят, однако fb3 до сих пор не вышел из состояния драфта.
Ну деньги, иногда, штука очень полезная. Например, если бы ваш проект в какой-то степени финансировался, то вы бы побыстрее закончили ремонт и написали движок. Кроме тоо деньги пригодились бы для регистрации авторских прав и торговой марки на "nfb".
Отв: Формат NFB
в любом случае, слово _должен_ тут неуместно. не привязывайте вражью капиталистическую идеологию к данным обстоятельствам. никаких гарантий, явных или подразумеваемых, всё исключительно на энтузиазме и любви к людям.
НЕЕЕЕЕТ. если бы это была моя основная работа, и от того, сделаю я ее или нет, зависило моё финансовое благополучие - тогда может быть деньги помогли бы. сейчас всё упирается в отсутствие свободного времени, и в голову, забитую всякой хренью типа 1С. после фантазий на тему бухучета креативное мышление отключается напрочь. и ремонт тут не особо причём.
за деньги это есть смысл делать, если собираешься потом делать на этом деньги. я не собираюсь делать ни того ни другого, вполне достаточно выполнения некоторых идиотских условий, обеспечивающих подтверждение авторства. остальное излишне.
п.с. предлагаю на этом перестать мусолить тему денег.
п.п.с. в ближайший день-два выложу 14 редакцию спецификации, статус "релиз". хватит уже в кандидатах сидеть.
Отв: Формат NFB
И таки хотелось бы увидеть «прозрачный» маркер «номер страницы в оригинальном издании». И, как вариант, сослаться на него из другой книги.
Т. е. довести до идеала: «Возможен переход по ссылке или вывод расшифровки в виде подсказки.
Допускается указание номера страницы после номера книги:
Подробнее данная тем описана в ["1,234]».
P. S. А поглядеть на исходники того, что было в самом начале в исполняемом виде с примером, можно? :)
Отв: Формат NFB
"номер страницы в оригинальном издании" уже давно включен в спецификацию, курите внимательнее.
с переходом несколько проблем, не относящихся к собственно формату. первая и основная - однозначная идентификация книги, на которую оформлена ссылка. код ISBN/ISSN, указанный в библиографическом списке, возможно решит эту задачу, но при этом возникает вторая проблема - в наличии этой самой книги в библиотеке у того, кто переходит по ссылке. скачивание из инета по запросу не предлагать, ибо вообще нонсенс и фантастика.
все-таки считаю, что маневры с переходом из одной книги в другую излишне усложнят всю конструкцию, и не будут надежно работать. хотя, при тесной интеграции каталогизатора и читалки в принципе можно попробовать. на всякий случай в спецификации добавлю пояснение на этот счет.
легко. только надо учесть, что написано под дельфи7 без vcl, с использованием GDI+. если всё ещё интересно - скинь личным письмом асю/жабу, сконтачим.
Отв: Формат NFB
Каюсь, действительно не вкурил про номера страниц :) Их надо сделать опционально отображаемыми.
А вот остальное и, в том числе, проблемы с лёгкой читалкой и серьёзным библиотекарем — надеюсь опишу. К сожалению у меня те же проблемы с работой, квартирой итд. Идей куча, а времени просто физически не хватает.
Но есть предложение :) Так как формат ушёл довольно далеко от «плоской» литературы — выбрать несколько эталонных книг, которые хотелось бы иметь в адекватном отображении (для начала без математики). И с ростом формата — увеличивать список :)
Отв: Формат NFB
демку я форматировал руками, но для серьезных по объему текстов это неприемлемо.
математика пока не поддерживается, планируется всё это отдать на откуп плагинам.
Отв: Формат NFB
До кучи :) Заголовок со сноской. Козьма Прутков сильно этим страдал :)
Отв: Формат NFB
>в любом случае, слово _должен_ тут неуместно. не привязывайте вражью капиталистическую >идеологию к данным обстоятельствам. никаких гарантий, явных или подразумеваемых, всё >исключительно на энтузиазме и любви к людям.
Очень рад от вас это слышать, хоть здесь коммунистические идеи побеждают.
>п.п.с. в ближайший день-два выложу 14 редакцию спецификации, статус "релиз". хватит уже в >кандидатах сидеть.
Здорово.
Отв: Формат NFB
в процессе написания парсера секции bookinfo в ум пришла и не уходит одна назойливая мысль: зачем я сделал разные ключи для названия одиночной книги и названия сборника?
по идее, само по себе наличие конструкции PART:000х ... ENDP: обоначает, что имеющийся файл содержит сборник. или же несколько самостоятельных частей - например собственно книгу, вступительную статью/предисловие, послесловие и т.п.
в итоге имеем: если это реально сборник, то его название и прочие регалии относятся именно к сборнику и каждая часть должны иметь свои реквизиты. если же это книга с допматериалами, то название относится к содержательной части книги, и нет смысла дублировать его в описателе секции (и в принципе само описание этой секции делать не за чем).
в результате имеем правило (уже указанное в спецификации): последний - верный. если для секции не указано наименование, автор, и прочие детали, то подразумевается, что эти реквизиты совпадают с указанными в начале.
таким образом исключается необходимость указывать повторно частные реквизиты, если они совпадают с общими.
решение - реквизит COLL переименовываем в TITL и всё становится ровно.
теперь вопрос такой: нужно ли отдельно указывать, что данный файл (книга) по сути является сборником?
теоретически этот факт можно обозначить в головном реквизите FORM: - форма произведения = сборник. вот как-то так.
я прав? или есть что-то, что я не заметил?
Отв: Формат NFB
Может я и ошибаюсь, но спорно.
COLL однозначно говорил что это многосоставная книга. И уже не так важно, сборник это или издание с кучей допов.
Я предлагаю другой вариант: разделить нынешний BookInfo на два раздела. BookInfo и PartInfo. И тогда в первую часть попадают выходные данные об издании и тип издания. А потом мы имеем энное количество частей. И тогда там, если в букинфо стоит «самостоятельное произведение» -- мы уже на EDIC, к примеру, внимания не обращаем. Бо для одного издания редакторско-корректорский коллектив, как правило не изменяется. За редким исключением «Печатается по изданию такому-то». Заодно это упрощает парсинг. Для чтения данных «одночастёвой» книги не надо будет пробегать весь файл.
Ах да, ну и разные издания — тоже проще парсить :) Тело книги читать не придётся.
Отв: Формат NFB
в догонку:
автор допматериалов в отдельном реквизите в данном случае тоже становится не нужным. то, чот это допматериалы также можно выяснить из частного реквизита FORM, указанного для соответствующей секции.
вот такой блин финал релиз...
готовлю 15-ю редакцию.
Отв: Формат NFB
Становится не совсем понятен смысл поля FORM. Для карты в допе это будет что? А для одной и той же статьи в журнале и в приложении? А когда это современная книжка и есть диск? Который вроде бы тоже часть книги? С ним как? :)
Отв: Формат NFB
«Каждый реквизит в секции должен завершаться парой символов CR+LF»
Тоже ни разу не хорошо. Win и местами symbian. Большинству остальных хватает LF :) Они не от печатных машинок произошли :)))
P. S. СерыйМыш, а нет желания или на адобовскую или на гугловскую площадку вынести обсуждение? С возможностью хотя бы коллективных комментариев к документу?
И коллективно в стиле rfc оформить.
Отв: Формат NFB
«Например:
LANG:RU
SRCL:EN
AUTH:Брэдбери, Рэй, Дуглас
AUTH:Bradbury, Ray, Douglas
TITL:Марсианские хроники
TITL:The Martian Chronicles»
Хм, а не так:
«LANG:RU
AUTH:Брэдбери, Рэй, Дуглас
TITL:Марсианские хроники
ISBN: x-xxxxx-xxx-x
SRCL:EN
AUTH:Bradbury, Ray, Douglas
TITL:The Martian Chronicles
ISBN: x-xxx-xxxxx-x»
Пока у нас LANG=RU -- наше всё. Остальное -- надо, скорее, для библиотекарского софта и поиска. Заодно блоком парсить проще, чем чётные и не очень строки. Я уж не говорю, про издания в которых имя автора даётся на языке оригинала, в англицкой транскрипции и в русском звучании.
А потом мы дойдём до того, что будем говорить о конкретной книге BOKL:RU, SRCL:EN. И добавлять кучу PNTL:XX для поиска по изданиям на других языках.
Отв: Формат NFB
Немного пропускаем и переходим к картинкам.
Я уже почти верю в коллективный разум, но когда-то найдётся гений, оформивший горизонтальную картинку межабзачного узора высотой в 15 строк. И при этом с шириной 30% и обтеканием справа. Кажется нужны более жёсткие правила.
Потом найдётся картинка, в которой подпись больше, чем графика. Собственно уже :) Я на досуге пытаюсь первую Тесловскую книжку во вменяемый вид из djvu перевести. Там такие есть :)
Бэг пардон, что наскоками и сумбурно :) Я в кои-то веки дома до компа добрался не заснув по дороге :)
Отв: Формат NFB
Случайно ткнулся в Серия в Либрусеке. Нужно что-то делать. и оху… мрачно.
Там, ближе к нынешней дате, даже таки звучат слова не мальчиков, но мужей :)
Надо срочно учиться на их ошибках :)
Отв: Формат NFB
отвечаю оптом:
насчет CR+LF согласен. вроде уже обсуждалось, однако почему-то в спецификации остался первоначальный вариант.
с реквизитом FORM надо поработать, но суть его не меняется. форма произведения вполне поддается классификации. а то что не поддается - сгибается по месту и классифицируется по общим правилам.
присобачивать диск внутрь файла с книгой - имхо перебор. пусть уже лежит отдельно.
касаемо серий - возможно, есть смысл ввести иерархические понятия - серия, цикл, и т.п., но кроме путаницы это вряд ли что-то даст. поэтому предлагаю всё, что относится к авторскому делению на серии вгонять в SEQU, всё что относится к издательским сериям - в PSEQ. при любом порядке следования этих реквизитов вполне можно определить, относится книга к той или иной, заранее известной серии, или нет.
с языками текста и оригинала, и определением, на каком языке задан реквизит, возникло некоторое затруднение. возможна ситуация, когда указаны, например, две издательские серии, каждая на двух языках - итого 4 одинаковых реквизита. как их тасовать и компоновать - не совсем очевидно.
делить список реквизитов на иерархические конструкции упорно не хочется, но похоже придётся. надо поиграть с разными вариантами компоновки и найти самое простое и красивое решение. xml в этом плане конечно рулит, но цель была как раз уйти от тяжеловесных программных реализаций.
наверное есть смысл пойти кривым, но общепринятым путем - сначала написать код, а потом по ходу дела, когда обнаружатся ошибки проектирования, поправить спецификацию, и уже после этого всё устаканивать.
Отв: Формат NFB
После 14-ой версии спецификации и ее годичного обсуждения так сделать уже не получится :).
Отв: Формат NFB
Эмм? А почему? Пользуемся мы-же браузерами или офисными пакетами. И там энная версия или год обсуждения — это просто очередной верстовой столбик на дороге.
Отв: Формат NFB
ещё как получится :)
на данный момент не существует ни одной программы, поддерживающей формат nfb, поэтому изменения никому не создадут проблем.
к тому же, конструктивных/идеологических изменений не будет, будет косметическая доработка по месту напильником.
по сути, задача сейчас разделилась на две - визуальная часть, относящаяся к отображению собственно книги, и информативная часть, относящаяся к реквизитам.
в первую очередь хочется заняться визуальной частью, потому что сразу будут видны все отличия от конкурирующих форматов.
информативную часть однозначно стоит проработать еще раз, обобщив все вновь поступившие и имеющиеся сведения. думаю, надо более детально покурить инфу о EPUB, чтобы по возможности сделать возможной конвертацию туда-обратно с минимальными потерями.
Страницы