FB2+NON-FB2(PDF, DJVU, ETC)=FBD? Или предложение по поддержке формата описаний для не-фб2 книг

Предложение простое. Автром программы "Библиотекарь", насколько я понимаю, был придуман формат файла описаний для не-фб2 книг. По сути - обычный пустой фб2 с заполненным дескрипшеном, который лежит рядом с книжкой. При наличии такого файла Библиотекарь берет из него всю инфу. Довольно удобно, кстати. При обработке файлов можно ввести все вручную и программа создаст архив в виде filename.pdf.zip с обоими файлами.

Выгода от использования такого формата очевидна - любая скачанная книга будет содержать всю необходимую информацию для автоматической обработки прогрммами-библиотекарями и онлайновыми библиотеками.

Пример такого файла: ftp://lib.rus.ec/Alexx_S/Попенко, Виктор - Метательное холодное оружие.djvu.zip

Собственно и предложение - добавить возможность обрабатывать такие архивы при добавлении книг, ну а задача максимум - перевести в такой вид уже имеющиеся книги

Alexx_S написал:

Блин, точно! Так и надо сделать - заключить в [p]

fixed.

та же книга: http://lib.rus.ec/b/161940/fbd

Ненужные элементы em и u

{em}Том без номера. Издан в Москве, Крафт+Леан в 2002 году, 560 страниц{/em}


{u}Содержание:{/u}

И.. вроде все. Валидатор ругается только на чудной ID и отсутствие body, эти ошибки, я думаю, можно проигнорировать. Во всяком случае, Библиотекарь обрабатывает корректно.

Завтра с утра еще десяток - другой файлов посмотрю, на свежую голову

Зы. А. забыл посмотреть - ссылки и картинка в этих файлах http://lib.rus.ec/b/164851/fbd и http://lib.rus.ec/b/164380/fbd

ссылки надо чуть подправить и для всех аннотаций не забыть заменить & на & amp; и <> на & lt; и & gt; ( при этом ссылки не должны пострадать)

Alexx_S написал:
Зы. А. забыл посмотреть - ссылки и картинка в этих файлах http://lib.rus.ec/b/164851/fbd и http://lib.rus.ec/b/164380/fbd

http://www.fictionbook.org/index.php/%D0%AD%D0%BB%D0%B5%D0%BC%D0%B5%D0%BD%D1%82_annotation
не может быть в аннотации ссылок. И картинок тоже не может быть. Во всяком случае в fb2, fb3 не смотрел.
Alexx_S написал:
ссылки надо чуть подправить и для всех аннотаций не забыть заменить & на & amp; и <> на & lt; и & gt; ( при этом ссылки не должны пострадать)

куда править, разве что удалить.

larin написал:

не может быть в аннотации ссылок.

Однако же, файл со ссылками проходит валидацию, да и FBE с читалками ничего против не имеет ;)

larin написал:

куда править, разве что удалить.

Не знаю, как к этому отнесутся остальные пользователи, но я считаю что ссылкам не место не только в аннотации, но и вообще в книге. В своих я их удаляю. Я за то, чтобы ссылки из аннотации просто удалять.

larin написал:
И картинок тоже не может быть.

Так я и имел в виду то, что при отсутствии обложки и присутствии картинки в аннотации, сделать последнюю обложкой, из ее аннотации удалять надо в любом случае.

Да, чуть не забыл, не хватает пустых строк (например: http://lib.rus.ec/b/163172/fbd) там, где они должны быть, надо двойной символ конца строки преобразовывать в [empty-line/]

Прогнал порядка 600 файлов через Библиотекаря.

1. Довольно много обложек сидит в аннотации в таком виде:
{img}http://lib.rus.ec/sites/default/files/1_10.jpg{/img} (http://lib.rus.ec/b/140882/fbd ( хотя в этом файле вместо обложки - левый скрин), http://lib.rus.ec/b/160065/fbd...)
2.Обложка перенесена, но линк на нее в аннотации остался http://lib.rus.ec/b/150416/fbd
4. Некоторые обложки в GIF. Вроде как не все читалки с ними работают
http://lib.rus.ec/b/151520/fbd

5. В аннотации встречаются необработанные коды:

{b}{/b} http://lib.rus.ec/b/144808/fbd
{i}{/i} http://lib.rus.ec/b/140439/fbd
{right}Ярослав Грицак{/right} http://lib.rus.ec/b/142933/fbd
{i}{font=Bookman Old Style}{color=#494E58}{size=14} и т.п. http://lib.rus.ec/b/157637/fbd http://lib.rus.ec/b/157626/fbd

6. Ошибки разбор. Спотыкается на &, <, > в аннотации. Ну и ссылки, конечно, которые, чаще всего и содержат эти символы.

7. Среди прочих ошибок:
p}{strong}Вых. данные книги:{/p}
{p}{/strong} Издательство: "Экспресс-Полиграф" (г.Киев){/p}
http://lib.rus.ec/b/145206/fbd
Там же {em} {!--break--}

{p}{ul}{li}HTML, XML, XHTML (50 страниц){/p}
{p}{li}CSS (35 страниц){/p}
{p}{li}Client Side Scripting (70 стр){/p}
{p}{li}Server Side Scripting (55 стр){/p}
{p}{li}Web Databases (50 стр){/p}
{p}{li}CMS (50 стр){/ul}{/p}

http://lib.rus.ec/b/144880/fbd

Alexx_S написал:

1. Довольно много обложек сидит в аннотации в таком виде:
{img}http://lib.rus.ec/sites/default/files/1_10.jpg{/img} (http://lib.rus.ec/b/140882/fbd ( хотя в этом файле вместо обложки - левый скрин), http://lib.rus.ec/b/160065/fbd...)

Вытаскивать обложки с других сайтов, с непредсказуемым таймаутом, кажется мне не слишком очевидной идеей.
Лучше оставить как есть - bbcode xml-у не помеха.

Alexx_S написал:

2.Обложка перенесена, но линк на нее в аннотации остался http://lib.rus.ec/b/150416/fbd

И как тут разобраться, обложка ли это, или просто какая иллюстрация?

Alexx_S написал:

4. Некоторые обложки в GIF. Вроде как не все читалки с ними работают
http://lib.rus.ec/b/151520/fbd

Это проблема читалок. В стандарте ограничений не видно.

Alexx_S написал:

5. В аннотации встречаются необработанные коды:
{b}{/b} http://lib.rus.ec/b/144808/fbd
{i}{/i} http://lib.rus.ec/b/140439/fbd
{right}Ярослав Грицак{/right} http://lib.rus.ec/b/142933/fbd
{i}{font=Bookman Old Style}{color=#494E58}{size=14} и т.п. http://lib.rus.ec/b/157637/fbd http://lib.rus.ec/b/157626/fbd

А надо ли обрабатывать bbcode? Они вполне законны внутри xml, и другого способа эту разметку сохранить я не вижу. Ну не позволяет fb2 верстать аннотации, любые xml теги зарубит валидатор.
Я наоборот склоняюсь к тому, чтобы html разметку переводить в bbcode. Костыль, конечно, а что делать? Либрусек показывает правильно, авторы прочего софта подтянутся.

Alexx_S написал:

6. Ошибки разбор. Спотыкается на &, <, > в аннотации. Ну и ссылки, конечно, которые, чаще всего и содержат эти символы.

примеры, плиз.

Alexx_S написал:

7. Среди прочих ошибок:
p}{strong}Вых. данные книги:{/p}
{p}{/strong} Издательство: "Экспресс-Полиграф" (г.Киев){/p}
http://lib.rus.ec/b/145206/fbd
Там же {em} {!--break--}

{p}{ul}{li}HTML, XML, XHTML (50 страниц){/p}
{p}{li}CSS (35 страниц){/p}
{p}{li}Client Side Scripting (70 стр){/p}
{p}{li}Server Side Scripting (55 стр){/p}
{p}{li}Web Databases (50 стр){/p}
{p}{li}CMS (50 стр){/ul}{/p}

http://lib.rus.ec/b/144880/fbd

Элемент annotation:
Может содержать произвольный набор (в произвольном количестве) из следующих элементов:
* p;
* poem;
* cite;
* subtitle;
* empty-line;
* table (с версии 2.1).

larin написал:

Вытаскивать обложки с других сайтов, с непредсказуемым таймаутом, кажется мне не слишком очевидной идеей.
Лучше оставить как есть - bbcode xml-у не помеха.

Многие на либрусеке лежат. С чужих сайтов - тут тебе виднее, хотя обидно, конечно
larin написал:

И как тут разобраться, обложка ли это, или просто какая иллюстрация?
В общем случае - первую же картинку из аннотации надо ставить обложкой, если обложки еще нет, конечно.

В этом и других случаях - файл обработан как обложка, переименован в cover.jpg, а в аннотации осталась на него ссылка.

Цитата:

А надо ли обрабатывать bbcode? Они вполне законны внутри xml, и другого способа эту разметку сохранить я не вижу. Ну не позволяет fb2 верстать аннотации, любые xml теги зарубит валидатор.
Я наоборот склоняюсь к тому, чтобы html разметку переводить в bbcode. Костыль, конечно, а что делать? Либрусек показывает правильно, авторы прочего софта подтянутся.

Ну не знаю... Вопрос я бы поставил по-другому - а зачем все это в аннотации? Я не помню ни одной бумажной книги, где аннотация была бы сделана с использованием оформления болдом, италиком, цветом и т.п. В подавляющем большинстве это чистый текст.
Я бы просто очищал.
Насчет валидатора не понял. Почему зарубит?

Цитата:

примеры, плиз.

http://lib.rus.ec/b/153696/fbd
http://lib.rus.ec/b/153669/fbd
http://lib.rus.ec/b/153591/fbd

И со ссылками
http://lib.rus.ec/b/145206/fbd

Цитата:

7. Среди прочих ошибок:
p}{strong}Вых. данные книги:{/p}
{p}{/strong} Издательство: "Экспресс-Полиграф" (г.Киев){/p}
http://lib.rus.ec/b/145206/fbd
Там же {em} {!--break--}

{p}{ul}{li}HTML, XML, XHTML (50 страниц){/p}
{p}{li}CSS (35 страниц){/p}
{p}{li}Client Side Scripting (70 стр){/p}
{p}{li}Server Side Scripting (55 стр){/p}
{p}{li}Web Databases (50 стр){/p}
{p}{li}CMS (50 стр){/ul}{/p}

http://lib.rus.ec/b/144880/fbd

Элемент annotation:
Может содержать произвольный набор (в произвольном количестве) из следующих элементов:
* p;
* poem;
* cite;
* subtitle;
* empty-line;
* table (с версии 2.1).

Ты не понял, получаются ошбочные конструкции вида:
{p}{li}{/p}
{p}{li}{/ul}{/p}
{p}{strong}{/p}

Есть ли какая-то связь между зипом с FBD внутри и книгой под FB3-draft? Если да, то какая?
В смысле, если теперь уже любую книгу можно описать с FBD и засунуть в зип, а схема XML внутри FBD динамична по определению, на кой тогда вообще нужен FB3?

Что-то я не понимаю... А что общего у ПФД с ДежаВю с ФБ3?

Alexx_S написал:
Что-то я не понимаю... А что общего у ПФД с ДежаВю с ФБ3?

Ну, насколько я понимаю, fb3 это тоже зип (как и тут), плюс внутри файл описания с мутировавшей схемой (похож на FBD) ну и дальше любые файлы сопровождения (картинки там и т.д.).
Просто я рассматриваю PDF/DJVU как частный случай запакованных файлов сопровождения.
Посему мне и стало непонятно, зачем вообще нужен fb3, если можно малой кровью (zip + fbd) и подключением частных namespaces в fb2, добиться тех же результатов.
И при этом не нужно сооружать новое поколение читалок под fb3.
Я чего-то недопонимаю?

eg написал:

Посему мне и стало непонятно, зачем вообще нужен fb3 ...

Грибов давно точит зубы на коммерциализацию формата. fb3 с зипом при закрытых (в отличие от epub) спецификациях обеспечит возможность изготавливать, например, книги, в которых только ознакомительный фрагмент открыт, а хотите остальное - извольте купить пароль. Вот и вся загадка.

Нормальное желание, имхо. Каждый преследует свои цели.

Alexx_S написал:
Нормальное желание, имхо.

Для Грибова - да.
Аватар пользователя Антонина82

Уважаемые компьютерные ГУРУ. Я Вашими знаниями программ завидую. Помогите немолодой тетеньке решить простую (для Вас)задачу. У меня электронная книга берет формат DJVU,но изменить размер текста я не могу.И поэтому читать в таком формате книги мне не удобно. Для меня идеальный вариант книги в формате FB2.Однако даже на этом сайте книги(например Ф.Ванденберг) в формате FB2 нет. Можно ли перевести книгу из формата DJVU вFB2.
Только объясните,пожалуйста, на языке, доступной "чайнику".

"Перевести" нельзя. DjVu - это набор отсканированных картинок. Можно распознать, как любой другой набор картинок, в Файнридере. Но это труд, легко и быстро не получится.

Антонина82 написал:
Для меня идеальный вариант книги в формате FB2.Однако даже на этом сайте книги(например Ф.Ванденберг) в формате FB2 нет. Можно ли перевести книгу из формата DJVU вFB2.

Как Вам уже ответили, процесс это не быстрый и не совсем уж лёгкий. Но возможный. ;)
Взяла в свой список обе книги Вандерберга. Следите за новыми поступлениями (а лучше, подпишитесь на новинки Ванденберга).
Аватар пользователя Антонина82

Уважаемые компьютерные ГУРУ. Получилось корявое сообщение. Я хотела написать "я Вашими знаниями программ восхищаюсь", а получилось завидую (Опечатка по Фрейду), извините.

Аватар пользователя Антонина82

Уважаемая golma 1.Огромное спасибо за Ваше внимание к моей проблеме. И если не трудно, подскажите, как подписаться на новинки Ванденберга?.
Я - новичок на этом сайте, он мне очень нравится. Огромное количестово книг, которые хочется немедленно прочитать. Сегодня дождалась "Голубку" Рубиной. Этот сайт коллективное Творение, поэтому даже не знаю, кого благодарить.

Антонина82 написал:
И если не трудно, подскажите, как подписаться на новинки Ванденберга?.

Если Вам понятие RSS о чём-то говорит, то на странице автора http://lib.rus.ec/a/52869 наверху, над словами "Описание автора" есть значок . Нажмите на него - это и будет подписка.
Если же Вы с этим понятием не знакомы, просто заглядывайте на страничку автора или в "Новые поступления". Думаю, в ближайшие несколько дней сумею Вас порадовать. :)
Аватар пользователя Антонина82

golma 1. Спасибо

Читайте/качайте "Дочь Афродиты".
:)

Засунул fbd в архивы всего, что не fb2. заодно запаковал то, что не зип.

larin написал:
Засунул fbd в архивы всего, что не fb2. заодно запаковал то, что не зип.

Попробовал покачать файлы со страницы последних поступлений PDF - файлы в архивах, но FBD внутри нет.

Alexx_S написал:
larin написал:
Засунул fbd в архивы всего, что не fb2. заодно запаковал то, что не зип.

Попробовал покачать файлы со страницы последних поступлений PDF - файлы в архивах, но FBD внутри нет.

Должен быть. Он маленький совсем, может не заметил?

larin написал:
Alexx_S написал:
larin написал:
Засунул fbd в архивы всего, что не fb2. заодно запаковал то, что не зип.

Попробовал покачать файлы со страницы последних поступлений PDF - файлы в архивах, но FBD внутри нет.

Должен быть. Он маленький совсем, может не заметил?

Не, не было. Сейчас есть. :)
Кстати, одна неприятная штука есть - архивы. Для либрусека это не критично, но если книги обрабатывать потом программой-каталогизатором, то нехорошая штука получается - вместо PDF/DjVu будет открываться архив.

Ну и надо оформить как-то новость с разъяснением что такое ФБД и как и пользоваться, могу взяться.

Возьмись, дело хорошее.

Аватар пользователя Антонина82

golma 1. Спасибо.Я скачала. Не могли бы Вы ответить еще на один вопрос.Почему я могу зайти на сайт только утром? После (примерно после 12 часов) я не могу подключиться.

Антонина82 написал:
golma 1. Спасибо.Я скачала. Не могли бы Вы ответить еще на один вопрос.Почему я могу зайти на сайт только утром? После (примерно после 12 часов) я не могу подключиться.

Этот вопрос в тему Временные проблемы с добавлением книг надо было задавать, впрочем Ларин уже дал ответ: потому, что DDoS- атака на сайт, а вот, когда она кончится? Это уже другой вопрос и на него может знать ответ только организатор DDoS- атак :'(
P.S.
У меня аналогично, только с утра до 12 и наверно, ночью тоже можно, но ночью я сплю.
Аватар пользователя Антонина82

Zadd, Вы не могли бы пояснить, что такое DDoS- атака на сайт. Это зависит от моего провайдера? Я подключена к Стриму. Просто на другие сайты в это время я могу спокойно заходить

в вопросе DDoS- атак на сайт я "чайник", объясняю, как я это понимаю: это атака на сайт, а не на провайдера. (От провайдера не зависит) В данном случае на сайт lib.rus.ec
Скачивать и читать книги Либрусека можно ещё и на зеркале, а вот заливать- только сюда, на lib.rus.ec

Аватар пользователя Антонина82

Zadd, спасибо за информация. Я так поняла, что это конкурентная борьба. Неужели, есть сайты где есть больше разнообразных книг. Я довольно продолжительное время смотрела другие сайты, но такого обилия книг я не видела. Это, наверное, зависть других. У них там только реклама порнографии.

Кстати, вот сейчас подумалось: а веднь неплохо было бы иметь возможность подгружать FBD для уже имеющихся в библиотеке книг. Т.е при правке инфоррмации о книге добавить команду "Загрузить файл с описанием"

Аватар пользователя Антонина82

golma 1. Помогите мне еще раз. В новых поступлениях появилась книга Г.Вишневской в формате, который для моей элетронной книге неприемлем.Можно эту книгу перевести в FB2.Я раньше скачивала эту книгу с litru.ru но там был незаконченный вариант. А здесь, я увидела через компьютер, опубликовано полностью. Заранее спасибо

Антонина82 написал:
golma 1. Помогите мне еще раз. В новых поступлениях появилась книга Г.Вишневской в формате, который для моей элетронной книге неприемлем.Можно эту книгу перевести в FB2.Я раньше скачивала эту книгу с litru.ru но там был незаконченный вариант. А здесь, я увидела через компьютер, опубликовано полностью. Заранее спасибо

Нет, тут я Вам помочь не сумею.

В любом случае, давайте уйдём из этой темы, тут обсуждается другое. Если хотите, создайте новую с просьбой о конвертации интересующих Вас книг.

Страницы

X