У меня есть книга, которой нет в интернете!!

Появилась идея создать группу людей, которые будт обмениваться неэлектронными книгами, которых нет на Либрусеке и, возможно, сканировать их.

Тем у кого есть книги, которых нет на Либрусеке и тем, кто хочет взять себе книгу отсканировать – отписывайтесь здесь.

Также, всем настоятельно рекомендую ознакомиться с понятием слова буккроссинг здесь.

Или в этой цитате:

wikipedia написал:
Буккро́ссинг (англ. bookcrossing, иногда «книговорот») — хобби и общественное движение, действующее по принципу социальных сетей и близкое к флешмобу.

Буккроссинг — это процесс освобождения книг. Человек, прочитав книгу, оставляет («освобождает») её в общественном месте (парк, кафе, поезд, станция метро), для того, чтобы другой, случайный, человек мог эту книгу найти и прочитать; тот в свою очередь должен повторить процесс. Слежение за «путешествием» книги осуществляется через специальные сайты в интернете. Аналогия — орнитологическая практика окольцовывания птиц, чтобы отследить их перемещение.

Комментарии

у меня есть пара книг, которых нигде нет:
1. Ларс Кристенсен. Полубрат (норвежская проза) (сделано)
2. Чинуа Ачебе. Стрела бога (африканская проза)
3. Мария Елиферова. Смерть автора (филологический триллер)

Есть Ларри Мэддок "Агентство ТЕРРА". Нет сканера :-(

SergeR написал:
Есть Ларри Мэддок "Агентство ТЕРРА". Нет сканера :-(

Есть "Агенство Терра" и "Терра против империи". Могу отсканировать, распознать с fb2 не знаю, я тут ровно без году неделя. Кто дает отмашку на начало работы, чтобы не повторяться?

babajga написал:

Есть "Агенство Терра" и "Терра против империи". Могу отсканировать, распознать с fb2 не знаю, я тут ровно без году неделя. Кто дает отмашку на начало работы, чтобы не повторяться?

Никто. :)
Просмотрите и отпишитесь в этой теме - это максимум "гарантий". ;)
Если не хотите/можете конвертировать в fb2, выложите куда-нибудь скан. Кто-нибудь сделает. :)

Хавьер Мариас "Белое сердце". Нет сканера. Могу потом распознать и вычитать. Киев

Это интересное предложение вызывает только один вопрос. У нескольких писавших аргумент - нет сканера. В настоящее время мюстековский сканер Scan Express (более чем пригодный для OCR ;) стоит в районе $40. А сколько стоит пересылка по почте книги? А нескольких книг? Т.е. в таком случае, не проще купить сканер, если нет других препятствий? Или даже взять его на день-другой там, где он есть? Или прямо там и отсканировать? Поймите меня правильно, я просто удивлен, что в наше время это может быть проблемой. Вот отсутствие времени, скажем - это серьезнее.

сканер то есть, но сказать, что в этом опытен (для оцифровки книг), не могу, к тому же для меня время - основная причина создания темы))

Угу... Насчет времени - таки да... Та же проблема. А вот насчет опыта - а какой тут опыт нужен? Нужен сканер и файнридер (свободных, в том числе портэйбл-версий - море в Сети ;). После чего техника сканирования осваивается даже не за 5 минут, а просто по ходу работы ;).

computers написал:
Нужен сканер и файнридер (свободных, в том числе портэйбл-версий - море в Сети ;).
Ага. А можно пару ссылочек в раздел "Программы"?

Нет, туда нельзя! За ссылками активно охотятся и удаляют, это вам не хухры-мухры, а факн-ридер! ;) Вот одна из возможных ссылок, проверил, файл еще лежит, но полностью, конечно, не скачивал. Хотя пользуюсь версией из того же поста, но скачанной с другой ссылки, уже умершей :(. Версия работает без установки. Обратите внимание на пароль к архиву! Просьба не писать открыто имя программы, иначе ссылка сдохнет сразу же... Лучше в личку, если кому надо, давайте ссылку. Или перекладывайте куда-то.
Portable A-B-BBB-Y-Y F-i-kn-e-R-e-a-d-e-r 8.0.0.731 rus & enu
password:nnm.ru
Download http://rs182.rapidshare.com/files/67548469/FuckRussianShit_.rar
Кстати, живой пример, что такое факнридер. Только сегодня появилась ссылка на 9-ю версию (кстати, классная вещь, позволяет даже загружать pdf для распознавания), и вот результат (рапида):

Цитата:
An error has occured:
This file is blocked, because it is under suspicion for illegal content. 7 days after a file is blocked, it will automatically be deleted, if the block has not been removed by RapidShare beforehand. Therefore, a download of this file is currently not possible.
Через 2 часа примерно! А там 300 метров, кто не успел, тот опоздал! Русский щит работает, ИМХО.

computers написал:

Download

Спасибо, скачал, авось пригодится.

computers написал:

Через 2 часа примерно! А там 300 метров, кто не успел, тот опоздал! Русский щит работает, ИМХО.

На сайтах, выкладывающих линки на кино, такое бывает сплошь и рядом. Считается, что это работа платных сотрудников компаний, борющихся против распространения, чуть ли не самих киностудий. А что такое "Русский щит"?

Русский щит - это специальная компания, борющаяся с варезом в Сети по заданию (платному, конечно) компаний-производителей софта. Абби, в частности - ее весьма известный клиент. Правда, все это работает весьма избирательно. Например, одна и та же ссылка может быть срочно удалена с Рапиды, и неделями лежать на Депозите. Ну, это их дело. Можно лишь констатировать, что компании-производители софта зря тратят деньги на Щит, лучше бы софт удешевляли ;). А вы обратили внимание на имя файла для закачки? FuckRussianShit_.rar ;D

хаха))
lol)

computers написал:
Русский щит - это специальная компания, борющаяся с варезом в Сети по заданию (платному, конечно) компаний-производителей софта. Абби, в частности - ее весьма известный клиент.

Ага, понятно, спасибо. Я и не знал что уже есть такие российские компании. (и мимолетно позавидовал - вот работенка не бей лежачего!)

computers написал:
Правда, все это работает весьма избирательно. Например, одна и та же ссылка может быть срочно удалена с Рапиды, и неделями лежать на Депозите.

Насколько я понимаю, Рапида просто быстрее (практически мгновенно, в автоматическом режиме) реагирует на абьюз-жалобы. Ну и с Рапиды качают, конечно, больше, чем со всех остальных вместе взятых, так что она цель номер один.

computers написал:
А вы обратили внимание на имя файла для закачки?

Еще как обратил! Хорошо хоть мой корпоративный фильтр не обратил... ;-)

ребят, давайте все-таки обмен книгами обсуждать, м?

Цитата:
Через 2 часа примерно!

Да ну, не все так печально. На http://rapidlinks.ru/ поиском за пару секунд найдется с десяток программ АББИ - вполне рабочих. Та 9 версия, что я скачивал, с марта еще лежит, и ничего, не удаляют.

Цитата:
Нужен сканер и файнридер (свободных, в том числе портэйбл-версий - море в Сети ;).

Для начала можно поюзать бесплатный CuneiForm. Основной его недостаток - не работает пакетно, приходится распознавать постранично и дописывать в файл. Но в целом неплох.

Цитата:
После чего техника сканирования осваивается даже не за 5 минут, а просто по ходу работы ;).

(чешет репу) ...где-то у меня была подборка мануалов по технике сканерёжки. Найти, да и вывесить... Авось пригодится кому.

Кунеформ - ацтой тот еще :(. Не тратьте на него время, плз! Файнридер лучше не на порядок, а даже сравнивать не с чем. Кунеформ по сравнению с ним - просто пустое место ;).
Материалы по технике сканирования - дело, может, и нужное, но, ИМХО, никакой техники-то и нет. Чесслово, не знаю, чему там учиться - режим LineArt, разрешение 300, и вперед! Можно, если нужны картинки, и режим серый или цветной использовать, файнридер последних версий позволяет, но идет куда медленнее. Вопрос же создания из сканов файлов книг - совсем другое дело, тут масса вариантов и форматов - дежаву, пдф, фб2 и прочее... В этом я, например, не копенгаген ;). Т.е. делал, конечно, но профессионалы настолько же выше меня, как файнридер - кунеформа ;D. А само сканирование требует, ИМХО, только одной науки - терпения :). Что да, то да! Терпение и свободное время, Ватсон - вот и все, что нам потребуется! - (С) - Конан Дойл. Сканирование 1 страницы даже на самом лучшем сканере отнимает не менее 30 сек, и через 100 страниц превращаешься в автомат по сканированию. Кошмар! Кто не пробовал, не представляет :(.

computers написал:
Сканирование 1 страницы даже на самом лучшем сканере отнимает не менее 30 сек, и через 100 страниц превращаешься в автомат по сканированию. Кошмар! Кто не пробовал, не представляет :(.

Да ладно народ-то пугать! )
400-500 страниц книга за 3 часа сканится легко. Только успевай листать, это точно - на автомате.
Сканер простецкий трехлетний епсон.

Ну, если это легко - флаг в руки! Но я не выдерживаю за сканером больше часа :(.

Э-э...5 минут вы это загнули. Хардкорным "клавишникам" это конечно не проблема, но все-таки заметная часть посетителей-потенциальных сканировщиков ими не является.

Могу добавить, что часто проблема еще состоит в особенностях книги. Например, у меня есть 3 тома "Материальной цивилизации" Броделя, которой в цифре я нигде не видел, хотя она и заслуживает этого. Но раскачаться на сканирование я не надеюсь. Там тонны графиков/картинок и прочих нехороших вещей. И если сделать из нее пдф/дежавю еще возможно, то цивилизованные хтмл/фб2 - "заибёсся". Про полную вычитку я даже не вспоминаю. Ну и общий объем тоже роль играет - под 2к страниц получается.

soshial написал:
сканер-то есть...

Вот ссылка про сканирование/распознавание.
_ttp://militera.lib.ru/ocr/01.html
Читать первые две страницы. Остальные (про ворд, макросы и т.д.) читать по желанию.

У меня на столе 2 компьютера умещаются. И сверху принтер. Сканер поставить некуда. :-)

вот пжалста сслыка: http://ifolder.ru/6856930
сканировал в оттенки серого/dpi 300/16 bit.

soshial написал:
вот пжалста сслыка: http://ifolder.ru/6856930
сканировал в оттенки серого/dpi 300/16 bit.

16 бит нигде нафиг не надо. Ни в сером, ни в цветном. 8 ставь.

ты сам файл смотрел??
а как бороться с тем, что посередине? или ocr скушает??

soshial написал:
ты сам файл смотрел??
а как бороться с тем, что посередине? или ocr скушает??

Глянул. Херовато все.

1) Прижимать сильнее надо, книжку слегка развернуть на столе можно, чтобы легче раскрывалась. Окр не справится. Всего плохо все будет в середине.

2) Если просвечивают буквы с обратной стороны - подкладывать черную бумагу (на принтере можно распечатать).
(Я купил в канцтоварах несколько тоненьких пластиковых папок рублей по 10, у которых задняя часть из черного тонкого пластика. Нарезал этот пластик под размер типичных форматов страниц - вечная штука получилась.)

3) Если нет картинок в книге, то режим rgb (цветной) нафиг не нужен, достаточно чистого чб или грэй, 300 точек.

soshial написал:
ты сам файл смотрел??
а как бороться с тем, что посередине? или ocr скушает??

Проблема на сгибе. Если корешок книги прочный, то можно прижать именно его к стеклу сканера. Края лучше не сканировать -- сразу обрезать во время сканирования.
Сохраняться лучше в тифе. 17 мбайт на страницу --многовато.
TaKir написал:
300

Количество точек лучше выбирать в зависимости от размера шрифта. Если страница примечаний со газетным шрифтом, то ч/б 300 точек мало, имхо.

P.S. Во время сканирования книжка не должна перемещаться по стеклу. Руки придётся потренировать.

короче, резюмирую:
1. прижимать сильнее чтоб не смазывалась
2. избавиться от просвечивания
3. grey 300 dpi 8 bit tiff
4. обрезать края
5. не двигать рукой

okey, спасибо, а есть такие кто мог бы распознать отсканенную книгу?
ps. как ее засунуть в один файл кстати?))

soshial написал:
ps. как ее засунуть в один файл кстати?))

После сканера получаются .tiff-ы россыпью
Их надо перегнать в единый .djvu

Я предпочитаю пользоваться для сего старенькой DjVu Solo 3.1, но "возможны варианты". Читать про формат и скачивать нужный софт здесь: http://djvu-inf.narod.ru/

Дежавюшный файл, если он делался из тиффов разрешения 300dpi, неплохо разделяется на страницы и распознаётся.

UPD: Кстати, насчет проблем на сгибе...
http://djvu-soft.narod.ru/scan/curved_text.htm

Для данной картинки:

soshial написал:
2. избавиться от просвечивания

В данном случае это не является проблемой, от которой надо избавляться.
soshial написал:
1. прижимать сильнее чтоб не смазывалась

Не всю книжку, а корешок. На картинке не только яркость меняется, но и резкость теряется. Судя по картинке, книжка очень толстая. 485 страница находится где-то в середине книги. Можно попробовать прижать корешок каким-либо стержнем, засунутым внутрь корешка. Там не нужны большие усилия. (Конечно же, учитываем состояние самой книги!)

soshial написал:
grey 300 dpi 8 bit tiff

Если корешок удастся прижать, то чб 400 dpi и, возможно, подобрать яркость сканера. В редакторе удаётся сделать контрастное изображение, значит, и сканеру можно объяснить. Если проблема корешка останется, то grey.

soshial написал:

ps. как ее засунуть в один файл кстати?))

Нет такой необходимости. Если файлы, например, перенумерованы, то FR легко воспринимает пачку файлов на входе.
Зы. Для распознавания текст лучше в tiff, а не djvu

Вот вариант отсканенного разворота, когда практически идеально распознается текст.
(бумага плохая, сильно желтая, книжка старая)

(файл 1,5 мега, жпег)

TaKir написал:
вариант отсканенного разворота, когда практически идеально распознается текст.
О! Спасибо! Есть на что ориентироваться. :) А то я тут задумал одну штуку... Обычно когда еду загорать - ищу комнату, где хозяева позволяют копаться в книжном шкафу, и когда дождь или просто лень гулять - лежу, читаю; но год на год не приходится. А сейчас подсел на э-книги, ан самых-то моих любимых и нету! :( Вот задумал: брать с собой сканер, и хорошие книги, будЕ подвернутся, не только читать, но и сканить. А потом, долгими зимними вечерами, OCR'ить и выкладывать. Хорошая идея?

Рыжий Тигра написал:
Вот задумал: брать с собой сканер, и хорошие книги, будЕ подвернутся, не только читать, но и сканить. А потом, долгими зимними вечерами, OCR'ить и выкладывать. Хорошая идея?

Идея хорошая, типа бук-тур )) (по аналогии с шоп-турами).
3-4 часа на 400-600 страниц - пару-тройку книг за дождливый день осилить можно )
Главное проверяй, не пропустил ли где страницы... А то при таки объемах сканежки можно пропустить - обидно потом будет...
И скань все - от корки до корки, пригодится )

TaKir написал:
Главное проверяй, не пропустил ли где страницы... [...] И скань все - от корки до корки, пригодится )
Угу, когда дойдут руки до распознавалки - пересканить будет, скорее всего, уже никак. :(

Вообще в библиотеке Ершова можно почитать про скан и распознавание.
Написано просто и по делу:
http://publ.lib.ru/publib.html
http://publ.lib.ru/OCR/_Ocr.html

А возьмется ли кто отсканировать вот эту книжку?
http://www.ozon.ru/context/detail/id/1595741/

Это сборник пьес Ю.М. Полякова. А я тогда, может, возьмусь ее OCR-ить и вычитывать...

У меня есть некоторое количество отсканированной фантастики, ждущей вычитки и (около половины) распознавания.

В электронном виде не нашёл. Сканировал только те части сборников, которых нет в электронном виде.

Станислав Лем:
- "Моя жизнь" (автобиография)

Борис Хазанов:
- "Нагльфар в океане времён"
- "Чудотворец"

Виталий Бабенко (какая-то из книг издательства Текст, 1992 или около того):
- "Приблудяне"
- "Земля"
- "Авангардист"
- "Трудоустройство"
- "New-Москва"
- "Нечеловек-невидимка"
- "Феномен всадников"
- "Игоряша-робинзон"
- "Игры на Красной площади"
- "Холодильник"
- "Поражение"

Василий Головачёв:
- "Реквием машине времени" (оригинальная версия, ещё не переработанная в отстойный цикл)

Из сборника "Ночь, которая умирает":
- Доминик Дуэ "Кочезе из Северамы 10"
- Кодзи Танака "Погоня"
- Джозев Дилейни "Скачок мысли"
- Пьер Буль "Сколько весит сонет?"
- Герд Прокоп "Смерь "бессмертных""
- Доналд Уэстлейк "Смерть на астероиде"
- Радомир Клабал "Если вы такой умник, то скажите, где трупы?"
- Дж. Венс "Удар милосердия"

Из сборника "Компьютер по имени Джо":
- Рикардо Гарсиа Леон "Дарик"
- Джон Макинтош "Дело рук компьютера"
- Иржи Колафа-мл. "Обман"
- Любен Дилов "Очередной номер"
- Даина Чавини "Опять этот робот!"
- Гюнтер Теске "Талантливый футболист"
- Ульф Мальмгрен "Три желания"
- Герберт Франке "Управляемые на расстоянии"

Из сборника "Обратная связь":
- Филип К. Дик "Дублёр президента" (в сети лежит другой текст, так озаглавленный - это ошибка!)
- Карл-Хайнц Тушель "Экспертная система"
- Дж. Уодемс "Имитроника"
- Стен Драйер "Конец шпината"
- Грегори Бенфорд "Под Леннона"
- Джон Койн "Позвоните мне!"
- Джон Браннер и О. Генри "Затруднения с кредитом"

Вячеслав Крапивин:
- "Возвращение клипера "Кречет""
- "Мушкетёр и фея"
- "Ковёр-самолёт"
- "Сказки Севки Глущенко"

Из сборника "Лалангамена":
- Теодор Томас "Целитель"

Из сборника "Перпендикулярный мир":
- Анатолий Гланц "Блудный сын промышленности"
- Грегорий Николаев "Кроссворд"
- Михаил Кривич, Ольгерт Ольгин "Лунная ночь в двадцать первом веке"
- Авдей Каргин "Мы вам докажем, что нас нет"
- Николай Блохин "Настоящим направляю заявку..."
- Георгий Николаев "Восприимчивый"

Из сборника "Продаётся Япония":
- Саке Комацу "Да здравствуют предки"
- Синити Хоси "Корабль сокровищ"
- Таку Маюмура "Приказ о прекращении работ"
- Синити Хоси "Рационалист"

Филип Фармер:
- "Конец времён"

Из сборника "Фата-моргана":
- Гербен Хелинга-мл. "Чудо-цветок"
- Ллойд Дж. Бигл-мл. "Крылья песни"

cпасибо большое.
мы обязательно этим займемся!!
то, что надо просто вычитывать/конвертировать в fb2 - обращайтесь через личку к golma1
а то, что сканить можете пока обратиться к Polarnik, ща еще других соберу ocr'ить.

пока им напишите. вотъ. скоро отвечу о том, как дела: есть ли ресурсы.

Пообщался в личке и с golma1 и с Polarnik.

У меня внезапно не оказалось места, куда можно положить файлы.

Есть какой-нибудь ftp для заливки сырых файлов, предназначенных для дальнейшей обработки?

Чтобы держать статус в одном месте.

Прогнано через OCR, имеется в виде .txt и .rtf (картинки утрачены), требует вычитывания:

- Бабенко "Приблудяне"

Прогнано через OCR, имеется в виде .rtf и в виде картинок, требует вычитывания и конверсии. Качество OCR местами плохое из-за плохого переплёта книг.

- весь Бабенко, кроме "Приблудяне" и "Земля"
- Фармер
- Рассказы из сборника "Фата-Моргана"
- Лем
- Головачёв

Отсканировано, имеется в виде картинок:

- Бабенко "Земля"
- Рассказы из сборника "Компьютер по имени Джо", "Лалангамена", "Ночь, которая умирает", "Обратная связь", "Перпендикулярный мир", "Продаётся Япония",
- Крапивин
- Хазанов

Я ответила Вам в личке, предложила Рапиду.

Но вообще-то есть ftp Либрусека:
login: ocr
password: newbook

Правда, были какие-то сложности с местом. Не знаю подробностей.

ok, с этой частью разобрались, нашёл место.

с не-OCR-енными книжками - чуть позже.

Мдэ. Пока личка не работает - пишу сюда :)

Оставшиеся странички сфотографировал, выложил: http://artifact-master.com/pages/ - там их по четыре экземпляра каждой, на случай неудачной съёмки.

ОК. Спасибо. :)

Я всё скачала на свой комп. Можно удалять.

Ищу "Вчера будет война" (Сергей Буркатовский) http://www.ozon.ru/context/detail/id/3856135/

Заранее благодарен!

наиболее быстро "сканирует" цифровой фотоаппарат. Единственный секрет выставленная вручную диафрагма и выдержка + освещение парой настольных ламп. ~ 5 секунд на страницу, причем большее время уходит на переворачивание :)

а что за фотик ?
я баловался 6-мегапиксельной мыльницей fuji - результат так себе.
:)

кенон, результат хороший только при отключении автомата и выставлении ручных настроек диафрагмы и выдержки.

Тем у кого нет сканера.
А цифровым фотоаппаратом никто не пробовал?
Все пытаюсь создать электронный вариант: Большая книга драконов (Лора С. Айриш)
Но тут нюанс - там большие картинки, а fb2 под это дело не шибко заточен

Страницы

X