Вычитка #5 (2010-I)
Опубликовано пн, 04/01/2010 - 14:06 пользователем soshial
Forums: Теперь главная тема по вычитке здесь. Архив тем: таблица: http://spreadsheets.google.com/pub?key=psStiaWgJ7Suju2UxmDWpKA Если в таблице не нашлось ничего интересного для Вас, обратите своё внимание на список книг, сделанных LibRusEc kit'ом: Книги из этого списка нуждаются в доработке: форматировании и вычитке. Если Вы берёте книгу из таблицы, отпишитесь в этой теме, чтобы можно было сделать необходимые пометки. Если книга не из таблицы, внесите на странице редактирования в поле "Доп. инф." информацию о том, что книга в работе. Если Вы владеете форматом fb2, можно выбрать книги текстовых или других форматов по этой ссылке и конвертировать их в предпочтительный в нашей библиотеке формат. Учитывайте при этом целесообразность такого конвертирования. Присоединяйтесь к нам! :) golma1 написал:
Уважаемые желающие поучаствовать в проекте "Вычитка"! Обращаю внимание всех, делающих первые шаги в верстании электронных книг, на мануалы, предоставленные уважаемым wotti.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
konst1 RE:Подайте бедному копеечку на книжку с литреса... 1 час
fedor.de RE:Отображение страницы Librusek 1 день konst1 RE:Багрепорт - 2 2 дня Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 3 дня Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 3 дня kopak RE:Таинственная личность админа Флибусты 4 дня blahblahblah2024 RE:Беженцы с Флибусты 4 дня sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 6 дней sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 2 недели TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 2 недели Oleg V.Cat RE:B343695 Александр. Книга 1 2 недели Isais RE:Калибрятина/Самиздатина 3 недели md2k15 RE:Относительно Вархаммер 40 000 3 недели tvnic RE:"Коллектив авторов" 3 недели SergL197 RE:Регистрация 3 недели ejik.v RE:Viva Stiver! 3 недели RedRoses3 RE:Флибуста конец? 4 недели Ldrozd RE:Сандра Ньюмен - Джулия [1984] 1 месяц Впечатления о книгах
Skyns71 про Григулевич: История инквизиции, или Надежные способы распознания еретиков (История, Религиоведение)
20 11 Скажем так: уже по аннотации можно догадаться об уровне достоверности. Симптоматично, что начали переиздаваться откровенные "агитки" советских времен.
Лысенко Владимир Андреевич про Емельянов: Японская война. 1904 [СИ] (Альтернативная история, Социальная фантастика, Самиздат, сетевая литература)
19 11 Очень хорошо. Прочитал на одном дыхании. Жду продолжения. Оценка: отлично!
decim про Григулевич: История инквизиции, или Надежные способы распознания еретиков (История, Религиоведение)
19 11 Первое издание книги, "Инквизиция", вышло в 1985 году. Эта версия - копия 1-го издания. И комментарии те же. Текст в стиле последних лет "холодной войны". Бруно у автора всё ещё казнили за вольнодумство, а не за альбигойство, ………
trampak про Дуган: Предательство истины (Публицистика, Документальная литература, Спецслужбы)
17 11 Эпиграф к этой книге должен быть: чем невероятнее ложь - тем больше люди в неё верят. Не верится , что книгу написал американец, проживший большую часть жизни в свободной стране. Ну а похвала дугина, это как несмываемое пятно фекалий. Оценка: нечитаемо
Вита Бревис про Калинин: Сирийские мистики о любви, страхе, гневе и радости [litres] (Публицистика)
16 11 Книга-разочарование. Острые и актуальные вопросы, а вот ответы притянуты к ним за уши.
GrandTourism про Желязны: Этот бессмертный [This Immortal [=...And Call Me Conrad] ru] (Научная фантастика, Постапокалипсис)
16 11 Да благословен будет Роджер Желязны. Да благословен будет Рошаль и Фёдоров. Их перевод настолько прекрасен, как будто они его делали вместе с бессмертным Желязны. О Боги, спасибо Вам. Оценка: отлично!
GrandTourism про Роджер Желязны
16 11 Ребята, он наше всё. И наше всё ранние переводы, со спасённым юмором и азартом автора. Новые переводы - за гранью добра и зла.
Анни-Мари про Борзых: Восхождение Примарха (Самиздат, сетевая литература)
15 11 В целом, достаточно интересно читается. Одно плохо: все герои разговаривают одинаково, как слегка пообтесавшиеся гопники. Вообще все. Мальчики, девочки, взрослые, молодежь, император, принцесса, министры, потусторонние сущности ……… Оценка: неплохо
mig2009 про Корнев: Адепт не хуже прочих (Фэнтези, Приключения: прочее, Самиздат, сетевая литература)
14 11 Читабельно. Но Корнев воду начал лить, слишком много описания «раскачки» ГГ. Накрутка буковок. Оценка: неплохо
Дей про Садов: Адская практика [= Дело о неприкаянной душе] (Фэнтези)
13 11 Сюжет понравился, исполнения - не очень. Затянуто, поверхностно, ангел - истеричка. Показать характер можно было бы и по-другому. Оценка: неплохо
Mindar про Гончаров: Голые короли. Книга 8 (Публицистика)
13 11 Предложение скачать PDF не соответствует действительности. Вы скачаете заархивированный файл ZIP. Оригинальный файл размером 6,17 МВ сжат до 5,90 МВ, поэтому чтобы читать книгу, необходимо ее разархивировать. |
Отв: Вычитка #5 (2010-I)
Не совсем понял как сообщить о готовности заняться вычиткой одной из предложенных к вычитке книг?
Б. Р. Скотт Падение святого города http://lib.rus.ec/b/170827 вычитать ошибки OCR
Опыта в этом деле у меня нет, но есть желание. Думаю, я смогу разобраться с "инструментарием" и оказать библиотеке посильную помощь.
Отв: Вычитка #5 (2010-I)
Считайте, что сообщили. :)
Будут вопросы, не стесняйтесь их задавать. :)
Отв: Вычитка #5 (2010-I)
начинаю задавать вопросы 8)
Вопрос 1.
Попытался заглянуть, но скачать её не получается по известной причине 8).
Есть какие-нибудь альтернативные ссылки, по которым можно свободно скачать эту книгу?
Вопрос 2. Где взять исходный FB2-файл выбранной на вычитку книги? Скачать оный по указанной вами ссылке http://lib.rus.ec/b/170827 снова-таки не представляется возможным:
Вопрос 3.
Что конкретно подразумевается под этим понятием? Достаточно ли просто исправлять замеченные ошибки и несуразицы по мере прочтения книги, или же требуется обязательное её сравнение с текстом бумажного оригинала? Как быть если бумажный оригинал для этих целей достать проблематично?
Отв: Вычитка #5 (2010-I)
На сайте автора: http://www.yuzzich.narod.ru/mybook1.htm
Отв: Вычитка #5 (2010-I)
1. Странно, что не скачивается Кондратович. Одно время был какой-то глюк, что вообще ничего нельзя было скачать, но вроде бы его исправили. Может быть, опять? :(
2. См. п. 1. Если не получится, сообщите мне свой мэйл в личку, я вышлю Вам файл.
3. 90% всех ошибок OCR можно исправить без оригинала - достаточно просто внимательно читать, а после ещё и пройтись скриптами. Но бывают, конечно, и спорные или вовсе не читаемые места. Если у Вас нет оригинала и достать его сложно/невозможно, оставляйте как есть. Возможно, имеет смысл в хистори упомянуть о том, что в книге остались ещё ошибки OCR.
RE:Отв: Вычитка #5 (2010-I)
Ещё есть вариант: сравнивать текст не с бумажным оригиналом, а с тем файлом, с которого делался OCR, то есть с фотокопией. Часто на сайт выкладывают файлы в формате PDF или DJVU - их можно жрать за исходную точку для сравнения. То, что программы распознавания распознают плохо, человеческий мозг может сделать гораздо лучше. Часто при сканировании некоторые символы или целые слова искажаются, расплываются и т.д. Вот, программы часто сбиваются в таких местах, но люди могут восстановить правильное слово по смыслу, если есть хоть небольшой намёк на правильное слово со стороны расплывающегося текста. Если PDF или DJVU файла нет на сайте, думаю, можно попросить его переслать того пользователя, который занимался OCR.
в какой кодировке сохранять книгу?
скажите пожалуйста какую кодировку делать в книге
оставлять, какая была или есть какие-то предпочтительные кодировки, типа utf-8? но при этом размер чуть увеличится...
редактировал книгу, она была в win-1251, сейчас у меня utf-8, размер сжатой возрос на 50кб, стоит обратно ее в win-1251 переводить?
Отв: в какой кодировке сохранять книгу?
Отв: в какой кодировке сохранять книгу?
Только utf-8. Размер не имеет значения.:)
Отв: в какой кодировке сохранять книгу?
ну и отлично, мне тоже ближе утф
единственное сомневался из-за размера файла и что возможно некоторые читалки для кпк/телефонов не смогут открыть файл в этой кодировке
Отв: Вычитка #5 (2010-I)
В процессе производства журнала Искатель №4 за 1988 выяснилось, что один из рассказов имеется здесь: http://lib.rus.ec/b/150420, но качество плохое - не вычитан. Поставил пометку "вычитывается".
Отв: Вычитка #5 (2010-I)
как можно принять участие в вычитке? Спасибо )))))))))))
Отв: Вычитка #5 (2010-I)
Вы можете присмотреть себе что-нибудь в таблице (ссылка в первом постинге) или выбрать что-нибудь по вкусу из файлов, сделанных LibRusEc kit'ом http://lib.rus.ec/stat/document-author/rusec, или просто читать нравящиеся Вам книги и заодно исправлять ошибки.
На странице редактирования книги следует делать пометку в поле "доп. инф." что-то типа "вычитывается" или "в работе". Чтобы не получилось дублирования.
Отв: Вычитка #5 (2010-I)
Рассказ Андре Рюэллана "Мемо" заменил на вычитанную версию - http://lib.rus.ec/b/180047. Кроме того добавил в библиотеку журнал Искатель, №4, 1988 - http://lib.rus.ec/b/180046, в котором этот рассказ имеется. Не знаю, прав ли...
Отв: Вычитка #5 (2010-I)
Здравствуйте!
Готов что-то повычитывать.
У меня интересы -- история, религоведение. Это означает что тут я лучше вычитаю.
Впрочем, могу вычитывать и то что есть.
Из гугльдока заинтересовало "Ла Сор Обзор Ветхого завета",однако оригинала у меня нет. Есть только doc файл с погаными сканами фотографий.
Из проблем есть то что я использую Linux и не уверен что есть готовые тлзы для создания/редактирования fb2. Но думаю что разберусь...
Так что заявку я оставил :)
Отв: Вычитка #5 (2010-I)
В "Обзоре Ветхого завета" пропущены куски текста. Если в Вашем доке они есть, то и он годится. :)
А откуда взялся Ваш док? Если по тем же ссылкам, что приведены в дескрипторе, то значит, и в нём текст не полностью.
Если Вы умеете распознавать и конвертировать другие форматы в fb2 (и найдёте способ делать это под Линуксом), можно просмотреть книги по жанрам:
http://lib.rus.ec/g/sci_religion
http://lib.rus.ec/g/religion_budda
http://lib.rus.ec/g/religion
http://lib.rus.ec/g/religion_rel
http://lib.rus.ec/g/religion_self
http://lib.rus.ec/g/religion_esoterics
Все файлы, сделанные LibRusEc kit'ом, нуждаются в обработке.
Если возьмёте что-нибудь в работу не из таблицы, оставьте на странице редактирования книги пометку в поле "доп. инф.".
Успехов! :)
Отв: Вычитка #5 (2010-I)
Приветствую всех!
Временами, читая книги в Вашей прекрасной библиотеке, поражаюсь вопиющей малограмотностью некоторых текстов. Хотел бы помочь с вычиткой (благо имею определенный опыт), но... как это реализовать на практике?
Можно ли править "на грамотность" читаемые тексты с их последующей перезаливкой?
И не будет ли это воспринято, как "нарушение авторских прав" и т.п.?
В ожидании ответа, WildKitten.
Отв: Вычитка #5 (2010-I)
Можно и нужно.
Почитайте вступительный пост (особенно ту часть, где говорится о форматах). Если Вам там всё понятно и Вы со всем согласны, можете смело править читаемые Вами книги.
Уточню: речь идёт о грамматических ошибках и форматировании. Всё остальное остаётся на совести автора.
Отв: Вычитка #5 (2010-I)
Поправил и перезалил книгу Тома Шарпа "Флоузы": http://lib.rus.ec/b/180361 Сделал, что мог, но правил в основном ошибки орфографические и огрехи OCR. Оформил стихи тэгом. Внес дополнительную инфу в Description.
Много вопросов у меня было по разбиению книги на абзацы, но поправил лишь явные случаи. При сомнениях оставлял так, как оно есть - такие вещи, ИМХО, лучше сверять со сканом или бумажным изданием. Поскольку не было ни того, ни другого, решил, что лучше не навредить.
Отв: Вычитка #5 (2010-I)
Большое спасибо. Абсолютно верное решение.
Отв: Вычитка #5 (2010-I)
Здравствуйте.Отметьте пож.в таблице - Питер Уоттс "Ложная слепота" вычитан, обновленную версию я залил в базу библиотеки.Встречались сложные понятия в тексте, не разобрать - то ли опечатки,то ли это переводчик так перевел научные термины.Решил оставить как есть.
Беру новую книгу на вычитку из таблицы - Орлов "Смело мы в бой пойдем...".Отметьте пож. в таблице.На страничке книги я отметился.Спасибо.
Отв: Вычитка #5 (2010-I)
Готов заниматься вычиткой. К кому обращаться?
Отв: Вычитка #5 (2010-I)
Добро пожаловать!
Сначала просмотрите таблицу, может быть, там найдётся что-то, над чем Вам интересно будет "поработать". Если нет, то в списке файлов, сделанных LibRusEc kit'ом, можно выбирать любой файл и дорабатывать его. Там всегда отсутствует форматирование и зачастую нужна вычитка.
Если найдёте что-то для себя интересное, сделайте пометку на странице редактирования книги в поле "доп. инф.". Мол, вычитывается. ;)
Отв: Вычитка #5 (2010-I)
Почему-то библиотека не принимает доработанные файлы обратно - пишет что файл слишком короткий и просит паковать стихи по сто килобайт.
Отв: Вычитка #5 (2010-I)
Вечер добрый! Я бы с удовольствием занялась вычиткой, но только текстовых файлов. Таблица не информативна, т.к., посмотрев интересующие меня книги, обнаружила, что в таблице они никак не отмечены цветом, а на странице самой книги отмечено, что она вычитывается.
Киньте в меня, пожалуйста, книжкой, которую нужно вычитать.
Отв: Вычитка #5 (2010-I)
К сожалению, вряд ли кто-то сумеет Вам точно указать такую книгу.
Попробуйте подобрать себе что-нибудь интересное здесь: http://lib.rus.ec/stat/tot, полистав файлы в форматах doc, rtf, txt.
Читайте и правьте заодно. :)
Но заранее сказать, что книга нуждается в вычитке, никто не сможет.
Ой, вспомнила! Вдруг Вам будет интересно:
http://lib.rus.ec/a/36186
Нужно вычитать оба doc-файла.
При этом нужно удалить номера страниц, проставить сноски (если они есть). Сноски можно проставить либо при помощи инструментов Word'a (постраничные сноски), либо поставив их в фигурные скобки за словом, к которому они относятся.
Нужно также провести небольшое форматирование - выделить заголовки и стихи.
Заинтересовала Вас такая работа? :)
Отв: Вычитка #5 (2010-I)
Взяла бы на вычитку вот эту книгу http://lib.rus.ec/b/170065 "Сереброкрыл". Только не понимаю как ее взять. Скачать не могу (хочет абонемент или пользу), а кнопки чтения нет.
Отв: Вычитка #5 (2010-I)
http://lib.ololo.cc/b/170065
Отв: Вычитка #5 (2010-I)
Сегодня еще читала Сергея Лукьяненко не помню точно как называется (что-то вроде "Беседы с дьяволом"). Он в фб2 (я с ним не работаю, пока), но в нем есть опечатки, неверные окончания и пропущенные запятые. Если мне не нужно вставлять никаких тегов (так, по-моему, это нзывается), я могу поправить текст и залить его заново?
Отв: Вычитка #5 (2010-I)
http://lib.ololo.cc/b/170065
по ссылке открывается пустая страница
Отв: Вычитка #5 (2010-I)
Пришлите мне в личку свой мэйл, я Вам вышлю.
Отв: Вычитка #5 (2010-I)
после того, как выслала мейл, смогла открыть страницу и скачать оттуда. Начинаю читать. Отметьте.
Отв: Вычитка #5 (2010-I)
В таблице этой книге нет. А на странице редактирования Вы можете самостоятельно отметить: в графе "доп. инф." проставьте "вычитывается". Или Вы и конвертировать будете? Тогда можно поставить "конвертируется".
Отв: Вычитка #5 (2010-I)
Здравствуйте!
Готова заняться Иосиф Бродский Стихи (2) http://lib.rus.ec/b/9097 разобраться в перемешанных стихах, отформатировать
а также Иван Бунин Дневники 1939-1945 годов http://lib.rus.ec/b/177214 вычитать, сделать структуру, расставить сноски
Отв: Вычитка #5 (2010-I)
Отлично! Занесла в таблицу.
Если Вы на странице редактирования книги сделаете пометку, тоже не помешает. ;)
Отв: Вычитка #5 (2010-I)
Взял на конвертацию в фб2 и вычитку книгу Руперта Шелдрейка "Новая наука о жизни" - http://lib.rus.ec/b/180809
Отв: Вычитка #5 (2010-I)
Взял на конвертацию и вычитку "Поколение свиней" Хантера Томпсона - http://lib.rus.ec/a/20018
Отв: Вычитка #5 (2010-I)
Добрый вечер! Отметьте пожалуйста в таблице, что Иосиф Бродский Стихи (2) вычитан.
:)
Отв: Вычитка #5 (2010-I)
Отметила. Спасибо!
Отв: Вычитка #5 (2010-I)
Отметьте, плиз. Взялся поправить массу ошибок в книге Стивена Кинга "Кэрри": http://lib.rus.ec/b/140451. Сравню с бумажным изданием
Хотел посоветоваться, как сделать лучше: Фактически книга состоит из трех частей, соответственно три секции. Примерно 30-40% книги составляют выдержки из книг, газет и т.д., выделенные тегом cite + внутри курсив или bold. В бумажном издании курсив и bold присутствуют также.
Вопрос у меня заключается в следующем: бегло вычитываю книгу с КПК в AlReader-е и то, что выделяется тэгом cite, да еще с дополнительным курсивом и bold-ом внутри выглядит, мягко говоря аляписто... Есть задумка назначить пустые строки подзаголовками, оставить выделение жирным и курсивом, а вот тэг cite снять - ИМХО, подобное форматирование книги будет выглядеть намного читабельнее и нагляднее, нежели просто выделение тэгом цитаты...
Отв: Вычитка #5 (2010-I)
Подождите, подождите. Я тоже читаю на КПК AlReader'ом и цитаты (cite) выглядят прекрасно. Все стили настраиваются под вкус читателя. Размер, цвет, начертание, отступы и т.д. Например, cite выделяется только цветом и отступами (можно и другим шрифтом), а курсив и bold на этом фоне ничего не портят.
Удалять стилевую разметку совершенно нет никакой необходимости! К тому же подзаголовки (subtitle), поставленные для пустых строк, улетят в FBE при первой же обработке скриптами.
В общем, я бы не советовал.
Отв: Вычитка #5 (2010-I)
Спасибо за замечания. Поэтому прежде и спросил, прежде чем действовать.
Тогда оставляю расстановку тэгов as it и правлю орфографию, расстановку абзацев, добавляю курсив, там, где он отсутствует. Все по бумажному изданию. В воскресенье выложу результат.
Кстати, видел в таблице Волки Кальи того же Стивена Кинга: http://lib.rus.ec/b/67272 Книга вроде бы как в работе с 23.02.09. Если актуально, могу взять на себя - опять же есть бумажный вариант книги, есть по чему править...
Отв: Вычитка #5 (2010-I)
<cite> не удалять ни в коем случае, если это цитаты!
курсив внутри цитаты не нужен, т.к. обычно в печатной книжке для того и выделяют курсивом, чтобы читатель понял, что это цитата! Если там все цитаты выделены и курсивом и болдом, то тогда IMHO, имеет смысл убрать курсив и болд, а вот <cite> лучше оставить.
Отв: Вычитка #5 (2010-I)
papamuller. Раз уж переделываете, найдите обложку покрасивее и русскую и иностранную, в сети их, как грязи. И хорошо-бы выходные данные русской книги в Дескрипшн и автора, название и год написания на английском. А так-же переводчика:) Не много прошу?:)
Отв: Вычитка #5 (2010-I)
Igorek67 Description уже заполнил - я обычно с него начинаю работу. Все данные внес. А обложку... Тогда попутный вопрос - если указывается ISBN книги, издательство ее выпустившее, допустимо ли замена обложки? У меня бумажный вариант в этом же исполнении, разве что цветопередача отличается? Можно ли здесь позволять какие-то вольности, или данные должны стыковаться: ISBN - аутентичная обложка бумажного издания?
Отв: Вычитка #5 (2010-I)
Да должны стыковаться. Если есть бумажный вариант, то лучше конечно обложку самому отсканить и сделать скажем 400 пикселей по горизонтали. Гораздо лучше, чем обложка с Оzona к примеру, где по горизонтали 200.
Сам я ставлю обложку и ISBN по одному изданию, а если есть поинтереснее обложка тоже кладу обычно в файл, как и иностранные, если есть. Уж у Кинга то есть:)
Отв: Вычитка #5 (2010-I)
papamuller, если будете добавлять иностранную обложку - не подцепляйте ее в дескрипшен как обложку (сайт именно ее и выберет для демонстрации на странице книги), разместите иллюстрацией в конце книги.
Отв: Вычитка #5 (2010-I)
Zadd, Нет, тэг цитаты оставляю точно. Часть книги сделана просто в виде отсыла к другим источникам - они как раз и цитируются. С курсивом там я разобрался - вместо него должны стоять обычные кавычки, так что спокойно их заменяю. В бумажном варианте было проще - там эта часть книги просто дается уменьшенным шрифтом. Смотрится очень даже, конечно. Ну а у fb2 инструментарий победнее, это понятно.
Igorek67, сделал бы это с удовольствием, был бы сканер в наличии. Но в этом году прикуплю обязательно.
Ronja_Rovardotter, спасибо за совет!
Да, собственно, спасибо всем помогающим здесь в теме таким вот "чечако" как я
Отв: Вычитка #5 (2010-I)
Уменьшенный шрифт можно делать при помощи тегов sub или sup.
Отв: Вычитка #5 (2010-I)
sub и sup не всеми читалками поддерживаются, а cite и есть cite, зачем его еще как-то особо выделять? Каждый читатель может настроить его вид у себя так, как ему нужно. Разве нет?
Страницы