V170848 Два капитана
Опубликовано ср, 20/10/2010 - 11:37 пользователем Рыжий Тигра
Forums: Два капитана Изобилует ошибками сканирования/OCR - по 3-5 ошибок на страницу. На самом деле это не отдельный "с нуля" скан книги (равно как и его первоисточник - восьмой том "Библиотеки приключений" в формате .doc в библиотеке Ершова), а скопипизженный из более ранних источников текст, разбавленный иллюстрациями. По крайней мере, тексты этот и http://lib.rus.ec/b/68345 идентичны - отличаются только наличием-отсутствием точек в названиях глав. :-( Чтобы убедиться - достаточно поискать фразы из первого абзаца первой главы первого тома: "Двор сеял у самой реки, и по веснам", "а потом вода принесла и осторожно положила на берег я самого почтальона". Правильный, без "осканок", текст есть у Гугль-бука (http://books.google.com/books?id=GPsoPTBc7fsC&pg=PA7&dq=%22%D0%B0+%D0%BF%D0%BE%D1%82%D0%BE%D0%BC+%D0%B2%D0%BE%D0%B4%D0%B0+%D0%BF%D1%80%D0%B8%D0%BD%D0%B5%D1%81%D0%BB%D0%B0+%D0%B8+%D0%BE%D1%81%D1%82%D0%BE%D1%80%D0%BE%D0%B6%D0%BD%D0%BE+%D0%BF%D0%BE%D0%BB%D0%BE%D0%B6%D0%B8%D0%BB%D0%B0+%D0%BD%D0%B0+%D0%B1%D0%B5%D1%80%D0%B5%D0%B3+%D0%B8+%D1%81%D0%B0%D0%BC%D0%BE%D0%B3%D0%BE+%D0%BF%D0%BE%D1%87%D1%82%D0%B0%D0%BB%D1%8C%D0%BE%D0%BD%D0%B0%22&hl=ru&ei=AhO_TLeAOYKQjAf_oYWbAg&sa=X&oi=book_result&ct=result&resnum=1&ved=0CCgQ6AEwAA#v=onepage&q=%22%D0%B0%20%D0%BF%D0%BE%D1%82%D0%BE%D0%BC%20%D0%B2%D0%BE%D0%B4%D0%B0%20%D0%BF%D1%80%D0%B8%D0%BD%D0%B5%D1%81%D0%BB%D0%B0%20%D0%B8%20%D0%BE%D1%81%D1%82%D0%BE%D1%80%D0%BE%D0%B6%D0%BD%D0%BE%20%D0%BF%D0%BE%D0%BB%D0%BE%D0%B6%D0%B8%D0%BB%D0%B0%20%D0%BD%D0%B0%20%D0%B1%D0%B5%D1%80%D0%B5%D0%B3%20%D0%B8%20%D1%81%D0%B0%D0%BC%D0%BE%D0%B3%D0%BE%20%D0%BF%D0%BE%D1%87%D1%82%D0%B0%D0%BB%D1%8C%D0%BE%D0%BD%D0%B0%22&f=false) (как извлечь текст - не знаю; изображения страниц получить можно, но это 150 dpi от силы) и http://my-shop.ru/shop/books/441482.html (на странице ссылка "Заглянуть внутрь") (фрагмент - первые 20 страниц и оглавление). Если кто знает, где можно получить полный текст, - отзовитесь!
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
Tafobau RE:Не присылает пароль на почту 13 часов
monochka RE:Подайте бедному копеечку на книжку с литреса... 13 часов kopak RE:О группе Дятлова. О той самой, того самого... 2 дня babajga RE:Плюмаж 1 неделя Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 неделя babajga RE:Блошкинс и Фрю. Опасное путешествие 1 неделя alexk RE:Багрепорт - 2 2 недели babajga RE:Удивленная сова 3 недели Larisa_F RE:Серия «Квадрат» издательства «Текст» 4 недели Aleks_Sim RE:Беженцы с Флибусты 4 недели edvud RE:Прошу переформатировать, распознать, etc... 4 недели monochka RE:С 8 Марта! 1 месяц babajga RE:Книга чуДОМищ 1 месяц ProstoTac RE:Подборка о Первой Мировой 1 месяц babajga RE:Нержавеющая сабля 1 месяц sem14 RE:«Уроки русского» 1 месяц Isais RE:Древний Рим. Подборка книг 1 месяц babajga RE:Отчаянная осень 1 месяц Впечатления о книгах
Oleg68 про Бушков: Времена звездочетов. Наш грустный массаракш (Фэнтези, Самиздат, сетевая литература)
07 04 Не шедевр, но мне понравилось. Опять на самом интересном пауза. Оценка: отлично!
Олег Макаров. про Усманов: Конец или начало? [СИ] (Героическая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
07 04 Белиберда картонная с самого начала. Трёх страниц достаточно, чтобы понять Оценка: нечитаемо
Stager про Старуха
07 04 УГ. Литературы тут нет совсем. Это чисто заклёпочническое построение, а вот с заклёпочничеством у автора большие проблемы. Он не знает того, что знает любой любознательный школьник и что даже сносно описано в Википедии. Поэтому ………
mysevra про Терехов: Каменный мост (Современная проза)
07 04 Я бы читала, мне было интересно, но автор постоянно сбивается на тошнотворное описание каких-то эпизодов взаимоотношений главного героя с его женщинами - зачем мне это знать? Оценка: плохо
mysevra про Свечин: Адский прииск (Исторический детектив)
07 04 Добротно и обстоятельно. Очень интересно описан край. Прочитала с большим удовольствием, теперь хочу прочитать всю серию. Оценка: отлично!
mysevra про Горд: LOVE-леди. Искусство отличаться от других женщин (Психология)
07 04 Наверное, кое-что можно взять на вооружение, хотя риторика американских подростковых сериалов сильно удешевляет идею. Интересно было бы воочию сравнить байгужинку, последовательницу Валяевой и барышню, проработавшую эту книгу. Оценка: неплохо
Gilean про За чужой мечтой
06 04 Читать интересно, но вот мало логики. Ну и как всегда сериал не закончен. Что не понравилось - переходы между книг, читаешь следующую и как будто не врубаешься что происходит? Через главу или две понимаешь о чем речь ………
Олег Макаров. про Панов: Кто-то просит прощения [litres] (Триллер, Детективы: прочее, Мистика)
06 04 Какая-то муть. Не дочитал. После предыдущей даже обидно Оценка: нечитаемо
lukyanelena про Вудворт: Парный танец (Любовная фантастика)
06 04 Какая-то ода абьюзу. И безобразно написаны эротические сцены. Убожество. Полно пафоса и штампов. Такое впечатление, что отдали на аутсорс какой-то малолетке. Оценка: плохо
Г.Гуслия про Скотина
05 04 Очень хорошо, можно даже сказать отлично. Вроде бы как обычный попаданец, но много свежих нюансов. Язык хороший, читается легко. Жалко, что пока только две книги. Надеюсь, продолжение будет не хуже и достаточно скоро.
magmel про Грайдер: Стажер Ли Су Джин (Попаданцы, Самиздат, сетевая литература)
05 04 Понравилось, перекликается с произведениями Кощиенко
dolle про Шаргородский: Слишком смышленый дурачок (Боевая фантастика, Фэнтези, Попаданцы, Самиздат, сетевая литература)
05 04 Как бы попаданец в почти боярку.Оригинально, свежо и необычно. Понравилось.Отлично. Оценка: отлично! |
Отв: V170848 Два капитана
Мне принесли книгу 8й том библиотеки приключений. Возьмусь вычитать и сверить, тем более, что это совпадает с моим желанием перечитать произведение. Сканировать вряд ли буду, но будем посмотреть... ;-)
Отв: V170848 Два капитана
Так что прошу прощения, что пытаюсь кого-то припахать, :-) но лучше отсканируй и поделись сырым сканом. 300 dpi, 8-бит серый, можно завернуть в JPEG 80-90%. Иллюстрации тоже имеет смысл переделать - их лучше сканить в 600 dpi и упаковывать беспотерьным сжатием (PNG); если поверх ч/б иллюстрации почёркано какими-ньдь карандашами или фломастерами - можно восстановить, но тогда её скан должен быть в цвете.
Я сейчас добиваю "Восставшую Луну" Хайнлайна, до конца недели сделаю и смогу заняться "Двумя капитанами": для начала отOCR'ю и сравню (кстати, давно пользуюсь вот таким способом - http://www.flibusta.net/node/83676#comment-192053), а если особого эффекта не даст - тогда уже буду делать по старинке, с вычиткой и правкой...
Отв: V170848 Два капитана
SergeyR, сорри, но личка, похоже, не ходит - отзовусь тут:
> причем предпочтительно именно в том виде и с тем текстом, как я его помню! ;-)
Дык аналогично! :-) Правда, я его читал в другом издании - серо-голубая картонная обложка с рисунком - Саня и Николай Антонович, - но рисунки были те же.
> думал, что глазами вычитать будет проще, а, теперь даже и не знаю...
Я на такое тоже нарвался - как раз когда купил сканер и сделал первые книги: http://lib.rus.ec/b/184697 и http://lib.rus.ec/b/184698 - они на процентов 80 совпадают, глазами я выловил по паре сотен опечаток, а на сличении двух файлов - где-то с полтысячи. С тех пор и держу на вооружении методику http://www.flibusta.net/node/83676#comment-192053 - помогает даже при вычитках с одного и того же текста, а тем более если это с разных сканов.
> думаю, что вряд ли нужно сканировать иллюстрации в 600 dpi, потом все равно ведь придется загрублять до 72.



Загрублять - да (хотя до 72 - это уже слишком). Но при прочих равных с 600-dpi'йной однобитной картинки можно с аккуратным сглаживанием уменьшить до 120-150-dpi'йной, с 300 dpi предел - 75, а с исходного 150 dpi даже 50-dpi'йная будет выглядеть довольно похабно. Это раз. Два - при 600 dpi при чистке исходного серого скана хорошо видна природа дефектов картинки - то ли это мелкая деталь изображения, то ли сопля от размазанной краски, то ли щепочка в бумаге; при 300 dpi этого не видно - приходится напрягать фантазию; да и дорисовывать погибшие мелкие детали при большом разрешении удобнее.
Вот в качестве примера - последний рисунок к книге "Сироты квартала Бельвилль" (все рисунки можешь глянуть здесь):
сырьё - 600 dpi, 256-серый:
готовый - 600 dpi, однобитный ч/б (день ушёл на чистку, но зато ж смотрится! :-) ):
готовый для книги - 133 dpi, 7 уровней серого:
(все три кликабельны и увеличиваются)
> но все равно частенько на месте раздела страниц бывают "тени" [...] Правда это существенно только для рисунков.

Для готовых рисунков - однобитных - это как раз пофиг, а при реставрации плавным градиентом плотности фона можно пренебречь, а перед формированием однобитного я такие вещи обычно затушёвываю/забеливаю вручную. Куда хуже - перекос линий возле корешка.
Кроме того, если сканируешь файн-ридером, то для текста надо включать режимы "делить страницы" и "исправлять перекос" - тогда ФР ищет что0то похожее на почти горизонтальные строки текста и "выпрямляет" их; представляешь, во что он может превратить рисунок? :-) А рисунки ФРом сканировать таки удобно - но в отдельный проход и с выключенными коррекциями и делением на страницы.
Кстати, картинки можно делать и без теней, и даже почти без геометрических искажений, если ложить книгу на сканер корешком вдоль хода каретки так, чтобы корешок был как можно ближе к середине каретки:
(серый - корпус сканера, тёмно-серый - стекло, синий - книга, красный - границы рисунка)
> Мне [...] оказалась приписанной как "автору" книга "Русская кухня: Традиции и обычаи" http://lib.rus.ec/b/191031
Кто-то уже успел исправить раньше, чем я до неё добрался.
Отв: V170848 Два капитана
Единственное, что меня хоть немного убеждает в необходимости 600-dpi'шного сканирования, так это возможная правка, конечно, природа дефектов будет видна лучше. А вот "72 - это уже слишком", почему "слишком"? никто же ведь не собирается печатать с fb2 (хотя такие вопросы-пожелания я слышал, но это уже, по-моему извращение...). А разрешение читалки, на которые fb2 и рассчитан, иногда или от 72 далек, или точки такого размера, что разрешение рисунка все равно не спасет. Вот сейчас "размер" страницы в скане получается что-то порядка 1800х1200 точек. Некоторые из рисунков книги такого же размера. Хорошо есть и мЕньшие. Да и в fb2 ведь рекомендуется делать иллюстрации, что-то порядка, не более 300х400, поправьте, если ошибся. Вот и получается, куда же еще бОльшее разрешение, только в расчете на гипотетическую правку.
Иль я в чем-то ошибаюсь?.. 8-)
Отв: V170848 Два капитана
Лично я привык делать 482×728 - такая картинка как раз умещается в страничку CoolReader 3.0.28 в полноэкранном двухстраничном режиме на "рабочем столе" 1024×768, а на экране "буки" остаётся с полсантиметра полей. Но уже перехожу на 580×740, благо последние раскопки :-) в алгоритме сжатия PNG позволяют упихать штриховую картинку такого размера в 50-100 килобайт. (Однобитная 600-dpi'йная полностраничная (2600×3800) штриховая иллюстрация, кстати, после чистки ужимается до примерно такого же размера.)
Отв: V170848 Два капитана
Ну в общем, как говорится: "Не прошло и года..." ;о) Книга наконец сделана, вычитана и выложена -
http://lib.rus.ec/b/241172
Спасибо Рыжему Тигре, что он сподвиг меня на сканирование, иначе вычитывание отняло бы куда больше времени и сил!
В принципе должен заметить, что каких-то глобальных потерь текста ранее имевшийся в библиотеке вариант не имел, разве что досадные ошибки типа: "дом сеял", да и то не слишком многочисленные.
Но все равно не жалею, что сделал работу заново. Зато теперь я в своей книге уверен, как это не глупо и не самоуверенно звучит... ;о)
Но все равно, если будут замечания просьба написать, сюда или в личку.
Более того, как уже написал в комментарии получил большое удовольствие от чтения, чего и вам всем желаю!
Отв: V170848 Два капитана
Отв: V170848 Два капитана
Спасибо огромное! И сподвигнувшему, а особо сделавшему!
Ещё может быть старую версию удалить стОит?