Вы здесьПомогите с Fine Reader! или весь труд насмарку..
Опубликовано ср, 02/09/2009 - 08:06 пользователем Psychedelic
Целый месяц разпознавал книгу и исправлял ошибки в в распознанном тексте (430 страниц). После этого еще 5 дней делал проверку (сервис >> Проверка) - т.к. много ошибок. Что делать люди, не копировать же в буфер обмена по одной странице... Помогите пожалуйста.. Надо сохранить в txt.
|
Вход на сайтПоиск по блогам и форумамUser menuПоследние комментарии
fedor.de RE:Отображение страницы Librusek 9 часов
konst1 RE:Багрепорт - 2 1 день Саша из Киева RE:Кто сможет раздобыть и оцифровать нужные мне книги? 1 день Isais RE:Чиполь Сергеевич Наглецов - Огненный дракон [СИ] 1 день kopak RE:Таинственная личность админа Флибусты 2 дня blahblahblah2024 RE:Беженцы с Флибусты 3 дня sem14 RE:Что читать о блокаде Ленинграда. Подборка книг 4 дня Леди Стервa RE:Подайте бедному копеечку на книжку с литреса... 6 дней sem14 RE:Михаил Юрьевич Берг - Андеграунд. Итоги. Ревизия_5 2 недели TaKir RE:Валерия Сергеевна Черепенчук А. Н. Николаева - Мифы... 2 недели Oleg V.Cat RE:B343695 Александр. Книга 1 2 недели Isais RE:Калибрятина/Самиздатина 2 недели md2k15 RE:Относительно Вархаммер 40 000 3 недели tvnic RE:"Коллектив авторов" 3 недели SergL197 RE:Регистрация 3 недели ejik.v RE:Viva Stiver! 3 недели RedRoses3 RE:Флибуста конец? 3 недели Ldrozd RE:Сандра Ньюмен - Джулия [1984] 1 месяц Впечатления о книгах
Лысенко Владимир Андреевич про Емельянов: Японская война. 1904 (СИ) (Альтернативная история, Социальная фантастика, Самиздат, сетевая литература)
19 11 Очень хорошо. Прочитал на одном дыхании. Жду продолжения. Оценка: отлично!
decim про Григулевич: История инквизиции или Надежные способы распознания еретиков (Исторические приключения, Религиоведение)
19 11 Первое издание книги, "Инквизиция", вышло в 1985 году. Эта версия - копия 1-го издания. И комментарии те же. Текст в стиле последних лет "холодной войны". Бруно у автора всё ещё казнили за вольнодумство, а не за альбигойство, ………
trampak про Дуган: Предательство истины (Публицистика, Документальная литература, Спецслужбы)
17 11 Эпиграф к этой книге должен быть: чем невероятнее ложь - тем больше люди в неё верят. Не верится , что книгу написал американец, проживший большую часть жизни в свободной стране. Ну а похвала дугина, это как несмываемое пятно фекалий. Оценка: нечитаемо
Вита Бревис про Калинин: Сирийские мистики о любви, страхе, гневе и радости [litres] (Публицистика)
16 11 Книга-разочарование. Острые и актуальные вопросы, а вот ответы притянуты к ним за уши.
GrandTourism про Желязны: Этот бессмертный [This Immortal [=...And Call Me Conrad] ru] (Научная фантастика, Постапокалипсис)
16 11 Да благословен будет Роджер Желязны. Да благословен будет Рошаль и Фёдоров. Их перевод настолько прекрасен, как будто они его делали вместе с бессмертным Желязны. О Боги, спасибо Вам. Оценка: отлично!
GrandTourism про Роджер Желязны
16 11 Ребята, он наше всё. И наше всё ранние переводы, со спасённым юмором и азартом автора. Новые переводы - за гранью добра и зла.
Анни-Мари про Борзых: Восхождение Примарха (Самиздат, сетевая литература)
15 11 В целом, достаточно интересно читается. Одно плохо: все герои разговаривают одинаково, как слегка пообтесавшиеся гопники. Вообще все. Мальчики, девочки, взрослые, молодежь, император, принцесса, министры, потусторонние сущности ……… Оценка: неплохо
mig2009 про Корнев: Адепт не хуже прочих (Фэнтези, Приключения: прочее, Самиздат, сетевая литература)
14 11 Читабельно. Но Корнев воду начал лить, слишком много описания «раскачки» ГГ. Накрутка буковок. Оценка: неплохо
Дей про Садов: Адская практика [= Дело о неприкаянной душе] (Фэнтези)
13 11 Сюжет понравился, исполнения - не очень. Затянуто, поверхностно, ангел - истеричка. Показать характер можно было бы и по-другому. Оценка: неплохо
Mindar про Гончаров: Голые короли. Книга 8 (Публицистика)
13 11 Предложение скачать PDF не соответствует действительности. Вы скачаете заархивированный файл ZIP. Оригинальный файл размером 6,17 МВ сжат до 5,90 МВ, поэтому чтобы читать книгу, необходимо ее разархивировать.
Sello про Мориак: Клубок змей [Le Nœud De Vipères ru] (Классическая проза)
12 11 Великая вранцузская литература. Ни прибавить, ни убавить. В аннотации понравился пассаж "68-летний старик..." Эка, как сдвигаются возрастные рамки с течением времени. Ныне, пишут, это - "золотой возраст". Оценка: отлично!
blahblahblah2024 про Пелевин: Круть [litres] (Современная проза)
11 11 Не знаю, что там триггернуло Санька, но книга отличная. То есть была бы, выйди она до 24 лютого 2022 року. А теперь на ней лежит печать некой ненужности, что ли. |
Комментарии
Отв: Помогите с Fine Reader! или весь труд насмарку..
Его и можно сохранить, как простой текст, если вы укажете такие параметры сохранения в настройках для "сохранить как" или "передать в". К сожалению, операция по удалению стилей необратима, и файнридер об этом предупреждает при их удалении. (Как Вы думаете, почему я об этом знаю совершенно точно?.. :)))) И Вам придется теперь сверять с исходником утерянный курсив и болд. :( Сочувствую. :(
Отв: Помогите с Fine Reader! или весь труд насмарку..
А скажите, Таня, Вам Уленшпигель ничего не передавал?
Отв: Помогите с Fine Reader! или весь труд насмарку..
Это Вы о чем - зубы отслеживаете? Нелинцензированные и без акцизной марки?
Отв: Помогите с Fine Reader! или весь труд насмарку..
Значит, нет...
Не тем он себя представил, получается. Не Иуда, а скорее Петр. Посмотрим, отрежет ли кому ухо.
Отв: Помогите с Fine Reader! или весь труд насмарку..
А нельзя ли мне все это как-то подоступнее растолковать? На пальцах? В личке, например? Или скажите, какой травы мне тоже надо покурить - для совпадения полета мысли.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Да в этом ничего секретного нету. Была здесь недавно шутка, про различные интерпретации произошедшего с библиотекой и библиотекарями. Я предложил классический сюжет, про 12 апостолов. Вообще-то в уме я держал тот факт, что произошедшее 2 тыс. лет назад тоже покрыто дымкой неопределенности, и разные источники по разному все описывают. Я так и намекнул, мол, какое будет интересное Евангелие от pkn.
Уленшпигель уловил в этом другой намек, на тайную вечерю, и начал спрашивать, кого тут надо поцеловать. Я предложил Вас. И вот выясняется, что до дела у него не дошло...
Я не знал, что Вы эти посты не читали, поэтому продолжил шутку без лишних разъяснений, сравнив его с другим апостолом.
Я надеюсь, Вы не сердитесь? Я без злобных намерений.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Спасибо за разъяснение. Нашла теперь где все это было.
Да, читать ту тему перестала быстро - берегла цветы своей селезенки.
Нет, не сержусь, если Вы не станете предлагать мою кандидатуру для отрезания уха, уха мне жалко.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Ну вот и славно.
Ухо было отсечено мечом, так что, если придерживаться сюжета, пострадать должен тов. Кирон.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Чмок! :)))
Отв: Помогите с Fine Reader! или весь труд насмарку..
По правилам русского языка надо писать: "Чмоки!"
Отв: Помогите с Fine Reader! или весь труд насмарку..
Чмоки - это много чмоков. А ему видимо нужен был один. :)
Отв: Помогите с Fine Reader! или весь труд насмарку..
Отв: Помогите с Fine Reader! или весь труд насмарку..
Чмок не шпок.
Отв: Помогите с Fine Reader! или весь труд насмарку..
В том то и дело что там нет ни курсива ни болда, там просто один текст, одни шрифтом. А FR нашел штук 30 шрифтов, и кучу начертаний, вот поэтому я решил их удалить.
В том то и дело что он не сохраняется. Пишет нет стилей, разпознайте еще раз.
А если не нужны стили, если нужно все сделать одним шрифтом? Почему без стилей нельзя сохранить в файл txt, хотя распознанный текст вот он, бери и копируй в буфер.. нафига сделалий кнопку "удалить все стили"? Почему не предупреждают что придется еще раз разпознавать страницы.
Как то непродуманно.
Возможно ли создать один стиль и привязать его ко всему тексту?
Отв: Помогите с Fine Reader! или весь труд насмарку..
Да, стили же редактируются, можно задать для текста или его части один стиль. И отредактиривать этот стиль, как Вам нужно.
И не надо заново распознавать пока - попробуйте посохранять с разными параметрами сохранения - вообще-то оно должно сохраниться. Или выделите все и задайте стиль, а затем сохраните.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Есть ещё вопрос о разрядке. Редактор стилей её не показывает. У меня в работе здоровенная пьеса, по самые уши набитая именами персонажей вразрядку. Есть ли простой способ сменить разрядку на курсив или жирность, или на любой другой атрибут, который можно передать в FB2? Очень не хочется пару сотен страниц размечать вручную. :-(
Отв: Помогите с Fine Reader! или весь труд насмарку..
Как вариант - в том же ворде:
Если абзац начинается с имени персонажа, то
поиск (знак абзаца+Персонаж 1) меняем на знак абзаца + Персонаж 1 (жирный) ну и так всех персонажей встречающихся... ну или если оно просто разрядкой, реально пробелами сделано - то П е р с о н а ж 1 меняем на Персонаж 1 жирный или курсив, что больше нравится
Можно и в ФБЕ
/p/Персонаж 1
меняем на
/p/strong/Персонаж 1//strong/
тэги нормально не передаются, так что заменил на /
Отв: Помогите с Fine Reader! или весь труд насмарку..
Отв: Помогите с Fine Reader! или весь труд насмарку..
Ну нету в ФР замены с форматированием... И вообще у него поиск-замена сильно уступает тому же ворду.
А поиск склеенных абзацев в ФР описан выше:
жмем ctrl+F, (просто поиск), ищем по очереди (!?:;.) + разрыв строки (типа так: !^l, потом ?^l и т.п.). Там где нужен именно разрыв абзаца, ставим энтер. 1 штуку. (везде по тексту, контроль глазками).
- Каждый новый поиск начинать с первой страницы пакета.
А разорванные абзацы, стихи и прочие подписи, (если все не поймались в ворде), напоследок в ФБЕ ищет такой регэксп (не говоря уже про специальный скрипт)
([^»….,:;!\?]|[-—–,])$
Отв: Помогите с Fine Reader! или весь труд насмарку..
Отв: Помогите с Fine Reader! или весь труд насмарку..
Как бы держать открытым ФР при работе с вордом никто не мешает совершенно )
Просто делаешь в ФР то, на что он способен, а остальное - другими средствами, более развитыми.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Отв: Помогите с Fine Reader! или весь труд насмарку..
Тогда уж лучше перегони в MXML(мокрософтовский XML) и там ковыряйся по самое не балуйся!
Отв: Помогите с Fine Reader! или весь труд насмарку..
Имеем: скан большой пьесы - под 4000 реплик, распознан файн-ридером-9, имена персонажей вразрядку с шагом 2.00.
Что сделал:
- В первой же реплике нашёл кусочек из трёх слов, который нигде больше не встречается, набранный тем же стилем, что и имена в репликах; выделил его жирным.
- Из ФР передал распознанное в опен-офис - хрен там, разрядки не сохранились, больше с этим вариантом не игрался.
- Из ФР сохранил в .doc.
- Открыл .doc опен-офисом - разрядки сохранились, ура! :-) Сохранил в .odt.
- Из .odt разархивировал contents.xml, открыл explorer'ом, нашёл строку с жирностью, запомнил её text:style-name ("T22"), запомнил text:style-name имени персонажа с разрядкой("T19").
- Открыл contents.xml текстовым редактором, заменил все вхождения цепочки ""T19">" на ""T22">".
- Запаковал правленный contents.xml обратно в .odt, открыл опен-офисом, убедился - таки да, разрядка превратилась в жирность! Ура! :-)
- Сохранил .odt в .doc, открыл wordviewer'ом, пролистал - оказалось, в полутора десятках мест разрядка таки осталась разрядкой. :-(
- Сделал .fb2; места, где разрядка не превратилась в жирность, поправил вручную.
Дарю технологию. Если кто сократит явно лишние телодвижения (а их не может не быть, т.к. в OpenOffice я весьма плаваю) - делитесь сюда! :-)Отв: Помогите с Fine Reader! или весь труд насмарку..
Шаг 8 явно лишний. Вместо него сразу переход к конвертации.
odt→OOoFBTools→fb2
Деклается это все прямо не выходя из Опенофиса
Надо просто установить OOoFBTools и не мучаться х…ней занимаясь
онанизмомкопипастингом из пустого в порожнее, когда правильно размеченный текст конвертор сам переведет в валидный fb2. А потом можно допиливатьлобзикомв FBE.Отв: Помогите с Fine Reader! или весь труд насмарку..
Собственно, на ooofbtools соблазнился именно из его задекларированной способности брать примечания на автопилоте.
Отв: Помогите с Fine Reader! или весь труд насмарку..
А что, разве в Опенохвисе не видно?
Ну, это просто вопрос
вкусак чему у тебя "глаз пристрелямши"Кстати, в Опенофисе есть фича "Убрать разбиение на страницы" — вот и не будет тебе разбиения на страницы.
А вот склейка разорванных абзацев и прочая
предпродажнаяпредконвертационная подготовкаКроме того, в чем ты .odt делал? Не во вьюере же?! Вот и не надо было выходить из Опенофиса, а сразу конвертить.
Что касается того, что тебе неудобно конвертить, то могу сказать одно: «Ты просто не умеешь их готовить!»
Покури маныпочитай Help_чего-то-там.pdf, который идет в пакете OOoFBTools, почитай тут темы про OpenOffice, поспрошай s_Sergius.Я тоже сперва мучался с фбтулсом, потом кое-что s_Sergius подсказал на форуме, кое-что у других вычитал, кое-до-чего сам допер. Сейчас считаю, что это самый лучший конвертер.
P.S.
Хотел цитату загнать в спойлер, но Либрусек не Флибуста: спойлеров не понимает!
Отв: Помогите с Fine Reader! или весь труд насмарку..
Отв: Помогите с Fine Reader! или весь труд насмарку..
Честное слово - это не я писала файнридер, меня-то за что? А как у Вас настроено сохранение? Если в форматированный текст - Ф.ридер будет искать стили, а если в простой - смилуется. Еще, попробуйте в других форматах сохранить - там же не только вордовские. Мне в такой ситуации удалось сохранить в rtf - неформат.текст.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Сохраните файнридеровский пакет на файлообменнике, дайте ссылку. Не я, так кто-нибудь еще текст вытащит.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Не хочет ни в одном формате сохранять, везде проставил простой текст, пишет ту же ошибку что выше.
Пробовал сделать так:
Удалил файл _FRBatch.pac - в папке со сканами, и FR начал восстанавливать, но потом покрэшился на 103 странице.
Но теперь зато 100 страниц можно сохранить, что делать с остальными 300 незнаю.. Чере ж сделана программа.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Дело в том что если открыть Свойста для распознанного текста, там все неактивно. Т.е. нельзя не шрифт поменять ни его размер нифига, как будто нет текста..
Отв: Помогите с Fine Reader! или весь труд насмарку..
Я вот как раз на пробу проделала удаление стилей на распознанной странице и спокойно сохранила ее - может, у Вас какой-то частный одноразовый глюк? Как это всегда и бывает в самый неподходящий момент. Тогда Вам нужен совет кого-то более хитроумного, чем я. Мне очень жаль.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Проделал только что на новом документе:
Открыл картинку ,распознал, затем Сервис > редактор стилей - кнопка "удалить все".
Вышел попытался сохранить в txt, опять пишет "стилей нет - распознайте страницу".
версия 9.0.0.1019
Видимо придется копировать с буфера обмена потихоньку. по одной сранице.
Отв: Помогите с Fine Reader! или весь труд насмарку..
А если в 8 ФР попробовать открыть этот пакет?
Или несовместимы версии?
Вообще, выложите, действительно архив с пакетом куда-нить, поглядим... Наверняка можно малой кровью справиться )
Отв: Помогите с Fine Reader! или весь труд насмарку..
Не открывает даже 9 версией, с билдом чуть ниже. Архив выложить не могу, т.к. он 3 гига (т.к. фотки по 5 мегапикселей)
Отв: Помогите с Fine Reader! или весь труд насмарку..
Вот вам еще Файн9 мне он нравица.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Нах-нах такие ссылки!
Надо давать ссылку, чтоб можно было закачать с оф. сайта, а не с файло
помойкиобменника.напр. так: http://forum.ru-board.com/topic.cgi?forum=35&topic=46259&start=540
А ещё лучше НЕ делать ссылок, адрес Гугла и так все знают!
Понимать же надо: запостил ссылку — ссылку прибили, ещё запостил — ещё прибили!
Сображать же надо!
Отв: Помогите с Fine Reader! или весь труд насмарку..
Вумный ты как я погляжу...ну попробуй скачать крякнутый с офсайта.Гы.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Если ты, , сходил бы по ссылке, тог увидел бы, что ссылка НЕ на оф.сайт, а на Ru-Board, тама варезник так устроен, что незарегистрированный не зайдет, так что
шаг 1: регистрируешься и заходишь в другой вкладке по упомянутой ссылке.
шаг 2: смотришь шапку и видишь, что программа скачивается с оф.сайта! А вот кряки - конечно нет!
И это правильно!
Главное преимущество такого способа в том, что файл Файна очень большой и когда он скачивается с оф. сайта, то это происходит очень быстро, на максимальной скорости(у меня, напр. скачался со скоростью 450кБайт/c), а если бы (как в твоем варианте) с файлопомойки, то скорость была бы значительно ниже: 39-80кБайт/с, а потом(а можно и одновременно с этим) скачиваем кряк(один только махонький кряк) с файлопомойки, т.к. кряк махонький, то это не займет много времени, или совсем нисколько, если качать одновременно с закачкой основного файла, так что всё пучком! Так что вполне можно, как ты выражаешься, скачать крякнутый с офсайта.Гы.
Отв: Помогите с Fine Reader! или весь труд насмарку..
Мине
пляски с бубнамивозня с кряками никчему ,а на том что выложил - клик и стоиткак у волка на морозе.Отв: Помогите с Fine Reader! или весь труд насмарку..
Это мне ни к чему, поэтому нах тебя с твоим заработком, зарабатывай в другом месте!
Что, хотел выложить Файн и заработать на скачиваниях, а я тебе малину-то обосрал, теперь меньше скачиваний будет, чем ты рассчитывал?
Что легче: скачать за 5 мин или скачать за час?
А уж ссылку лишнюю я как-нибудь нажму, не беспокойся, лишь бы скачать быстро и при этом бесплатно.
P.S.
Тока щаз заметил
Хочешь сказать, что ты на файлопомойку НЕкрякнутое залил?
Гы-гы-гы!
Отв: Помогите с Fine Reader! или весь труд насмарку..
Гыыы ты скоро анархиста по бестолковости переплюнешь..тебез сказано без плясок с бубнАми - КЛИКАЕШЬ И СТАВИШЬ, НЕ НАДА КРЯКОВ!!! ВОТ ТУПОЙ....ВСЁ УЖЕ ТАМ СДЕЛАНО.
Отв: Помогите с Fine Reader! или весь труд насмарку..
НЕ КРИЧИ!!! Не глухой!
Я вижу 2 причины, почему ты так рьяно защищаешь "свой" способ скачивания:
украденныйкрякнутый до тебя, закачается, вместо того, чтобы скачать за 5 минутВ первом случае ты будешь рьяно, с пеной у рта отстаивать "свою" позицию, прикидываясь дураком, лишь бы деньги капали.
Во втором случае эта позиция действительно твоя, тогда все зависит от степени твоего дебилизма: если немножко, тогда ещё не всё потеряно, можно переубедить, а вот если НА САМОМ ДЕЛЕ, тогда ты будешь себя вести точно так же, как и в варианте №1, с той лишь разницей, что не будешь за это получать денег, ни реальных, ни обещанных.
Итак, растолковываю второй раз для варианта № 2(при варианте №1 ты это и так знаешь, но не хочешь признаться. потому что недополученную прибыль терять жалко):
пятьнесколько минут, а не за один-полтора-два часа, как в случае с файлохранилищемUPD
Ещё один аргумент:
Враньё, что
тебе нужно меньше кликовты укладываешься в один клик! А распаковать архив? Да и при том, там в архиве уже якобы крякнутом до тебя, скорее всего находится инструкция, как применить кряк. Потом, никто из крякоделов не будет мудохаться, заменяя весь инсталлятор полностью, скорее всего там просто тот же самый инсталлятор от оф.сайта и отдельно приложен файл кряка. Так что миф об одном клике развеян!Отв: Помогите с Fine Reader! или весь труд насмарку..
Параноик - теоретик. Да скачай и попробуй, или очко играет?)))))))))))))))))))))))))))))))))
Отв: Помогите с Fine Reader! или весь труд насмарку..
Всё понятно, вариант №1.
При чём тут очко?
Скачивать твое гавно не буду, т.к. оно мине не нада!
С меня ты бабосов не получишь, спамер паршивый!
Отв: Помогите с Fine Reader! или весь труд насмарку..
Остается постранично, через буфер...
Отв: Помогите с Fine Reader! или весь труд насмарку..
Можно тоже вопрос?
Я поставил файнридер-9, загнал распознавать готовый скан - обнаружил странную штуку: почти на каждой странице склеиваются по 2-3-4 коротких (1-2 строки) абзаца, а следующий за ними длинный абзац обязательно рвётся. Если коротких абзацев больше 4 - ничего такого не происходит, если короткий только один либо страница заканчивается короткими абзацами без длинного - тоже ничего. Что может быть за глюк? Или что-то у меня в настройках? Как бороться? Руками всё сравнивать дюже уж муторно... :(
Отв: Помогите с Fine Reader! или весь труд насмарку..
Я работаю с 9-й версией, ничего подобного не наблюдаю. Бывает, конечно, что склеиваются абзацы (разрываются гораздо реже и это легче вылавливается - скриптами в FBE), но никакой закономерности я не выявила.
Просмотрела только что свои настройки - ничего там "такого" не нашла. Это у тебя какой-то локальный глюк. :(
Отв: Помогите с Fine Reader! или весь труд насмарку..
Страницы