Метаграммы | Либрусек

Вы здесь Главная » Блоги » Блог пользователя golma1 Метаграммы Опубликовано пн, 10/09/2012 - 03:04 пользователем golma1 Название темы - условное, для лучшего поиска. На самом деле метаграмма - вид шарады. Но к нашей теме косвенное отношение имеет. А собственно тема - об улучшении качества fb2-файла (а о чём же ещё? ). По аналогии с уже существующей темой "Типичные ошибки распознавания" предлагаю собирать здесь пары действительно существующих слов, отличающихся всего одной буквой. Особое внимание уделить тем словам, где эти две различные буквы сходны по начертанию. Примеры: "грех - трех", "свечка - овечка", "липа - лица". Я думаю, все OCR-щики и верстальщики понимают, зачем это нужно. Это совсем недавно опять прозвучало в теме "Мои алгоритмы работы с ФР11": такие слова не распознаёт спеллчекер (поскольку они входят в словарь), и обнаружить ошибку можно только во время чтения. Когда-нибудь, возможно, появится скрипт, выискивающий такие слова, пока их (при желании) можно включить в "Поиск по регэкспам" (частично они уже там присутствуют). К сожалению, словаря на эту тему не существует (или я плохо искала?), поэтому предлагаю собирать их здесь. Для того, чтобы в момент появления скрипта (надеюсь, он всё-таки когда-нибудь появится) было бы чтó ему "скормить". Блог пользователя golma1 Войдите или зарегистрируйтесь, чтобы отправлять комментарии Комментарии Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 11/01/2013 - 00:34 пользователем Антонина82 Evernet написал: Давайте я сделаю. Только вопрос: в парах, в которых слова начинаются с разных букв, ведь не имеет значения, какое будет первым? Я обработала почти 70%, но если Вы продвинулись дальше, то уступлю. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано чт, 10/01/2013 - 14:39 пользователем kozlenok А еще нужно учесть формы слова (падежи и т.п.), если очевидно, что ошибка будет "срабатывать" на всех или нескольких, то нужно добавлять и их. Например, ворона - борона (нужно добавлять все падежи). Врага - врата (только так, лишнего не надо). Врата - брага (аналогично). Врага - брага (здесь нужно перебрать падежи, на которых "сработает": враги - браги; враге - браге (-брате); врагу - брагу (-брату). Все перебрали, на других формах сработать не должно). Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 11/01/2013 - 01:46 пользователем Evernet Извините меня, ради Бога, я не знала, что вы делаете, иначе бы не стала браться. Очень сожалею, что так получилось. Я по алфавиту расставила, проверила в FBE орфографией и набором регэкспов, сейчас начала перебирать все падежные формы. После этого занятия с огромной, нет, с огромнейшей радостью отдам все в хорошие руки. Как вы решите. Если продвинулись дальше, или хотите сами сделать, я не буду настаивать. Могу выложить результаты, чтобы можно было сравнить. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 11/01/2013 - 01:54 пользователем Evernet Я действительно очень сожалею, это неприятно, когда делаешь работу и кто-то переходит дорогу. Еще раз прошу прощения. Просто хотела побыстрее этот скрипт попробовать. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 11/01/2013 - 01:57 пользователем Антонина82 Evernet написал: Я действительно очень сожалею, это неприятно, когда делаешь работу и кто-то переходит дорогу. Еще раз прошу прощения. Просто хотела побыстрее этот скрипт попробовать. Ничего страшного не произошло. Скорей я виновата, не известила о том, что начала делать. Но я придерживаюсь такого правила - не сообщать о недоделках. Успехов Вам в работе. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 11/01/2013 - 03:06 пользователем golma1 Тааак... Не получится ли теперь, что никто теперь не будет делать? :( Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 11/01/2013 - 03:32 пользователем Evernet Я продолжаю. Но очень много вариантов. А нельзя по неизменяемой основе искать. Например, волевой - болевой, искать по — волев - болев. Без: волевой - болевой волевая - болевая волевые - болевые волевое - болевое волевым - болевым волевого - болевого волевому - болевому волевом - болевом Если что, я не специалист и имею право на глупость :). При перечислении всех вариантов количество слов увеличится в разы. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 11/01/2013 - 03:46 пользователем Alex2L Полагаю, что можно aka в словарях, типа: волев~ - болев~ Авось, товарисчь, который возмётся варганить скрипт, с пониманием отнесётся к данной промблеме. :) Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 11/01/2013 - 09:00 пользователем Evernet Вот асе - же бар с - барс без - вез бодра - бедра бодро - бедро бокам - бонам бок - бон более - боже больнее - боль нее больней - боль ней ваза - база ваз - баз в бантах - в байтах бант - байт в дела - вдела в дел - вдел в деть - вдеть векую - некую вес - все вешать - вещать вешаю - вещаю вешаешь - вещаешь вешает - вещает вешают - вещают вешал - вещал взяла - паяла взял - паял взять - паять внизу - в низ у в одной - водной в одном - водном возразил - воз разил возразить - воз разить возразят - воз разят возразим - воз разим вол - бал вол - вал волевой - болевой волев - болев воли - волн вон - вот вот - бот врал - брал врать - брать врата - врага - брага - брата врат - враг вратами - врагами врат - брат врагу - брагу враги - браги враге - браге брату - брагу брате - браге вред - бред врежьте - врежь те вроде - броде в своей - и носи все едино душно - все единодушно в след - вслед вся - вея выбраться - вы браться выбрать - вы брать выбрал - вы брал выберем - вы берем вы пишите - выпишите глаза - глава головой - годовой гранаты - фанаты грант-фант грозный - грязный грозн - грязн грунт - фунт дает - даст два - дна две - дне детали - летали дизельной - дизель ной его - ого его - ею еле - ем если - сели жди - меди задушевные - задушенные задушевн - задушенн запал - запад запалами - запахами зашита - защита звали - знали звал - знал звать - знать званий - знаний звание - знание зван - знан злых - алых злые - алые злым - алым знает - зияет зятем - затем из данного - изданного из данн - изданн иной - ивой ист - нет как - так как он - какой камни - камин капкан - канкан карста - карета карсте - карете карсту - карету кем - нем клику - к лику компот - комнат копни - копии копры - ковры копя - коня крест - к реет кроме - кроне кто - «то лама - дама - мама лам - дам - мам лишних - липших лог - лот любовь - любое материн - материи мина - ми на мною - много мой - мои навешает - навещает навеш - навещ на деле - наделе на дел - надел надеть - видеть наземном - на земном наземной - на земной наперстка - каперства народ - парад народном - на родном народной - на родной народная - на родная на следующий - наследующий на следующ - наследующ наст - паст начинялось - начиналось начинять - начинать начинял - начинал начиняем - начинаем начиняют - начинают наши - паши нашу - пашу нашем - пашем неясного - нежного неясн - нежн ненцы - немцы ненец - немец ненц - немц нерпы - нервы несколько - насколько мим - ним ниши - пиши нишу - пишу но все - новее ногу - йогу ногу - могу номер-помер нора - пора нор - пор нору - пору норой - порой норма - поэма норм - поэм нравы - правы нрав - прав нравилось - правилось нравился - правился обвинять - обвивать обвинял - обвивал оберегать - сберегать оберег - сберег обить - сбить обил - сбил оборка - сборка оборк - сборк один - одни оказал - сказал оказать - сказать окажет - скажет окажут - скажут окажем - скажем окон - окоп окон - оком олово - слово ом - он ответа - отпета ответ - отпет ответом - отпетом от дел - отдел отрезала - от резала отрезал - от резал отрезать - от резать оттенки - опенки оттенок - опенок оттенка - опенка палашу - папашу палаш - папаш палок - падок память - намять папу - пану пари - цари - дари царю - дарю царя - даря пары - нары пар - нар паук - наук пая - нам пена - цена пену - цену пеной - ценой пене - цене пенила - ценила пенил - ценил пенит - ценит первый - верный перегнившего - пережившего перегнивш - переживш перед ними - передними перед ним - передним пить - нить пищи - пиши пищу - пишу пли - или повторить - по вторить повторю - по вторю повторим - по вторим повторит - по вторит повторят - по вторят повторю - по вторю по данным - поданным поддержать - под держать поддержат - под держат поддержал - под держал поддержим - под держим по длинным - подлинным подними - под ними пои - при показал - доказал показать - доказать пока та - поката по личным - поличным полка- попка полк - попк пол нее - полнее поло - подо получить - полечить полушка - подушка полушк - подушк полыми - полыни поля - ноля помешается - помещается помешает - помещает помешать - помещать помешал - помещал помешаю - помещаю понял - повял понятней - понятием попятный - понятный попятн - понятн порей - порой по степи - постели пот - нот - вот - кот потом - патом потому - потону похожа - похода права - нрава прав - нрав правились - нравились правился - нравился правилось - нравилось прекратились - превратились прекратил - превратил пример - при мер принадлежала - при над лежала принадлежал - при над лежал при ставке - приставке приткнуть - притянуть приткнут - притянут приткнул - притянул прицел - прицеп протянул - про тянул прочее - прочес прошение - прощение пруд - труд прямой - пряной прямая - пряная прямое - пряное прямые - пряные пс - не пугать - путать пугал - путал пугает - путает пугают - путают пугаем - путаем пыли - ныли пыл - ныл рад - ряд раз - паз регион - легион ров - роз рук - рун салопные - салонные салоп - салон самого - само то свод - овод сей час - сейчас синел - сипел синеть - сипеть сказать - скакать сказал - скакал скалы - скаты склад - оклад слива - олива слитком - слишком слова - слава - слева - слива славу - сливу славой - сливой слова - слона слову - слону словом - слоном слове - слоне служанка - слушка смогу - смету снами - с нами сними - с ними снял - сиял снопа - снова содержим - со держим содержать - со держать содержат - со держат содержал - со держал сонет - совет споро - скоро спросили - сбросили спрос - сброс спрошу - сброшу спросили - опросили спрос - опрос спрошу - опрошу спят - снят спят - опят спять - снять стен - степ стой - с той стой - стон стучит - отучит стучу - отучу стучат - отучат стучал - отучал стучим - отучим сцепка - сценка так - таи там - том тапки - танки таран - тиран таран - варан - баран тонкая - топкая тонкий - топкий тонкое - топкое тонким - топким тонком - топком тоща - когда трал - трап тренога - тревога трона - тропа трубкой - трубной труда - груда ужо - уже у шел - ушел фею - рею фея - рея фею - грею чаща - чаша черная - черпая черная - черкая честью - честно шагающих - шатающих шаль - жаль шины - шипы шип - шин шипам - шинам шли - или штормовок - штормовой щит - шит это - его это - ого этому - атому эту - рту юрод - город яге - же 0 - о - О 11 - И 6 - б - С 611 - бы !! - й Болдом выделены слова как они были предложены в теме. Курсивом выделена основа для поиска. Если все-таки нужно будет сделать все варианты, без проблем, только завтра. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 11/01/2013 - 12:34 пользователем kozlenok Водной - в одной Водном - в одном (где там скрипт "слипшиеся слова" или как его там, может быть в подобных случаях он поможет?). Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано сб, 12/01/2013 - 00:15 пользователем Evernet kozlenok написал: Водной - в одной Водном - в одном (где там скрипт "слипшиеся слова" или как его там, может быть в подобных случаях он поможет?). Не, скрипт Слипшиеся слова ругнулся только на один случай отсутствия пробела перед дефисом, все остальное его устроило. И вообще я думала, что в скрипт будут входить только выловленные оригинальные "метаграммы", иначе бы тихо сидела себе в уголке. У меня вчера голова вспухла, я давно забыла, что такое спряжения, падежи и подобное. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано сб, 12/01/2013 - 08:24 пользователем kozlenok Evernet написал: И вообще я думала, что в скрипт будут входить только выловленные оригинальные "метаграммы", иначе бы тихо сидела себе в уголке. У меня вчера голова вспухла, я давно забыла, что такое спряжения, падежи и подобное. Ну вот это как раз реально выловленные: Водной - в одной Водном - в одном и бороны - вороны тоже... Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано сб, 12/01/2013 - 03:18 пользователем golma1 Класс! Спасибо большое. Уведомлю нашего уважаемого скриптописальщика. ;) Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано сб, 12/01/2013 - 05:35 пользователем Evernet Я подумала, может быть, зная, на каких буквах спотыкается FR, пособирать теоретически возможные случаи. Разумеется, не впадая в крайность. Например: калан - калач капитель - канитель казак - казан кадета - надета кабак - кабан платью - платно лестью - лестно голой - юлой рыбкой - рыбной Любимая FR замена буквы с на е в конце слова вполне может сработать в слове каперс — капере. Или это лишнее? Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано сб, 12/01/2013 - 05:43 пользователем golma1 Evernet написал: Или это лишнее? На мой взгляд, отличная идея. :) Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано сб, 12/01/2013 - 05:57 пользователем Evernet Тогда я сначала выложу варианты сюда, если возражений не будет, внесу в список. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано сб, 12/01/2013 - 10:09 пользователем Evernet Водной - в одной Водном - в одном есть в списке, а Борона - ворона я добавлю, не заметила, что этого слова нет в списке, приняла только как пример, в предыдущих постах его не было. Извините, что не поняла вас. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано вс, 13/01/2013 - 16:25 пользователем der Fremde Вот, встретилось: полетать - под стать. Редкость, наверное. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пн, 14/01/2013 - 04:49 пользователем Vadi Ну, метограммы все можно перебором из словаря выбрать программно... Не понимаю смысла составления этого Метограмматона... Вариантов подмены букв очень много и зависят они от качества скана, ШРИФТА!, программы распознающей и тп. Я уж не говорю про многоязычные книги или книги, где язык сознательно исковеркан (например, для передачи картавости, заикания...) А по опыту, действительно - Файнридер порой такие перлы выдает, - кажется он неисчерпаем, как атом - без бутылки не разберешь, куда там регэкспами вылавливать))) Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано вт, 15/01/2013 - 11:25 пользователем Evernet Цитата: Не понимаю смысла составления этого Метограмматона... Вариантов подмены букв очень много и зависят они от качества скана, ШРИФТА!, программы распознающей и тп. Я уж не говорю про многоязычные книги или книги, где язык сознательно исковеркан (например, для передачи картавости, заикания...) Если по какой-то причине книга не вычитывается, этот скрипт позволит выловить хотя бы часть "метаграмм". И совесть успокоит. А сложные книги лучше вычитывать, здесь скрипт не понадобится. ИМХО. Вот еще 106 пар аптеки - ацтеки баран - варан баран - барак бездомный - бездонный берег - берет бесит - весит бесишь - весишь бесы - весы бинтом - винтом блеска - блесна бой - вой больница - вольница больной - вольной борона - ворона бранный - брачный бредить - вредить бремени - времени бремя - время брешь - врешь бугры - буфы будочник - булочник вагон - батон варево - зарево верно - зерно вертел - вертеп вещать - вешать взбесил - взвесил взбешенный - взвешенный взбить - взвить визита - визига вмещать - вмешать во время - вовремя в пасть - впасть выливать - вылизать вымести - вынести вымотал - вымогал вялить - валить главной - глазной годовой - головой голой - юлой готы - юты его - ею забыл - завыл - заныл знал - звал казак - казан канитель - капитель каперс - капере корма - норма коса - носа кочевать - ночевать крениться - крепиться кресла - креола кров - крон лава - лаза лента - лепта лепкой - лепной леской - лесной лестью - лестно луна - лупа набрал - наврал налет - налег намять - память нёбо - небо отток - опок пена - цена пень - печь перебитый - перевитый платью - платно плотью - плотно повеяло - повезло покои - покой полетать - под стать понравилось - поправилось пятью - пятно равный - разный рубаи - рубай рыбкой - рыбной рыбок - рывок сбагрить - обагрить сбрить - обрить сброс - оброс сдержать - одержать сдурел - одурел сжил - ожил скинул - окинул склока - склона слать - спать слева - слеза сонный - сочный спасаться - опасаться спешить - опешить спустил - опустил ссыпал - осыпал с ученым - сученым тазовый - газовый теолог - геолог томик - гомик тонок - гонок торная - горная треть - греть трех - грех трубить - грубить трудной - грудной убил - увил угол - уют цепь - цель чин - чип То есть вариантов, естественно, было больше. Решите, что нужно оставить, или может быть добавить? Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано вт, 15/01/2013 - 12:46 пользователем sem14 Только что нарвался в новой книге Фоллетта войны- воины Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано вт, 15/01/2013 - 16:40 пользователем kozlenok sem14 написал: Только что нарвался в новой книге Фоллетта войны- воины Кстати, это встречается часто. И с падежами. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано сб, 19/01/2013 - 14:41 пользователем Isais Может быть, и даже скорее всего, уже было: стальные / стильные - и все морфологические варианты; мечты / менты - заглавие "Роковые менты" меня сильно порадовало :)) Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано вт, 12/03/2013 - 02:56 пользователем Антонина82 Хотелось бы узнать: кто-нибудь что-нибудь делает по решению данного вопроса? Или... Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано вт, 12/03/2013 - 03:00 пользователем golma1 Антонина82 написал: Хотелось бы узнать: кто-нибудь что-нибудь делает по решению данного вопроса? Или... Да, собственно скрипт готов. Осталось его всесторонне потестировать и можно "выдавать". Если автор даст добро, можно выложить для массового тестирования. Уточню. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано вт, 12/03/2013 - 03:08 пользователем Антонина82 Я "вручную" пополняю Ваш, Голма, справочник. Мне кажется, нужно только в предложенном списке (может это уже реализовано) вначале ставить неправильный или "любимый ФР" вариант слов, а затем правильный. К примеру, в книгах издательства МГ, ФР№ 11 категорически не замечает букву "щ". Поэтому при варианте чаше-чаще я бы поставила, как ошибку "чаше". Сейчас попалось: мешанина - мещанина. То есть у данного скрипта будет возможность "под себя" подстроить? Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано вт, 12/03/2013 - 03:23 пользователем golma1 Этим скриптом занимается Evernet, поэтому у меня нет ответов на Ваши вопросы. Знаю только, что словарь для скрипта может пополняться пользователем. Давайте подождём ответа автора. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано вт, 12/03/2013 - 03:24 пользователем Alex2L Скрипт скоро будет представлен публике. Наполнением списка давно занимается Evernet. По этому вопросу лучше обратиться к ней. Замечу, что как располагать "правильный - неправильный" значения не имеет. Для этого используется символ $. Т.е. в вашем случае конкретно так: чаше-чаще$ и мешанина - мещанина$ Как видите - полная подстройка под нужды пользователя. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано вт, 12/03/2013 - 03:54 пользователем Антонина82 Хорошо, буду ждать. А то очень сложно бывает выловить ошибки, которые подчас и смысл текста меняют Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано вт, 12/03/2013 - 05:04 пользователем Vadi FR11, в основном на гарнитуре таймс и неплохих по качеству сканах открыть опустевшим - опупевшим сжалось - окалось ветрил - петрил (гл. прош. врем. сленг) слово - олово всего - нетто там - гам свинцом - с винцом явно - мимо все - псе ("..потом он, конечно, отыгрался. На псе." На каком таком псе, думаю?! А он - на все)))) палец - малец выкини - выкипи любит - побит нов - но в возвращался - поз вращался его - сто тот - ют такого - много осталось - остаюсь гикая - дикая нас - пас (это 100 раз капец) пить - нить включен - и ключей заснул - загнул ловца - юнца ("на юнца и зверь бежит" - подумал, постмодерн какой-то, но оказалось банальное "ловца") свой - гной сняла - сияла перевел - перепел городе - породе круглые - крутые бороду - борону столе - стопе глаз - таз пяти - гати горошком - горюшком потом - лотом словом - еловом при - мри лук - пук элитарной - янтарной главным - пивным (пивным образом))) строгом - с грогом тот - гот - тог слова - слона (подмена слона) знаменитого - знамен итого о брате - обрате кумская - кумекая (пророчица кумекая))) Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано чт, 14/03/2013 - 05:03 пользователем Alex2L Архив со скриптом и необходимыми файлами выложен здесь: http://ge.tt/5fl904b/v/0 и здесь: http://rusfolder.com/35464421 Инструкция пользователя внутри архива. Часть метаграмм УМЫШЛЕННО не обозначена символом $ — как априори верные. В иных случаях возможно обсуждение необходимости простановки, перемещения либо удаления знака $. Подготовкой xml-файла метаграмм и составлением инструкции пользователя занималась Evernet при участии Alex2L. Она же занималась тестированием, за что ей отдельное спасибо! Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано чт, 14/03/2013 - 05:28 пользователем Антонина82 Alex2L написал: Архив со скриптом и необходимыми файлами выложен здесь: http://ge.tt/5fl904b/v/0 и здесь: http://rusfolder.com/35464421 Инструкция пользователя внутри архива. Часть метаграмм УМЫШЛЕННО не обозначена символом $ — как априори верные. В иных случаях возможно обсуждение необходимости простановки, перемещения либо удаления знака $. Подготовкой xml-файла метаграмм и составлением инструкции пользователя занималась Evernet при участии Alex2L. Она же занималась тестированием, за что ей отдельное спасибо! Можно уточнить по интрукции Цитата: прописываем путь к словарю метаграмм "metagramma.xml", находящемся на диске «H:» в папке "4OTHER"; У меня на диск "H", когда я нажимаю, пишет "вставьте диск"? Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано чт, 14/03/2013 - 05:34 пользователем Alex2L Да куда захотите! Любой диск с правами на чтение-запись. Например, D: Кстати в инструкции маленькая неточность: Цитата: // Путь к словарю метаграмм var MetagrammaPath = 'H://Metagramma//4OTHER//'; вместо 'H://Metagramma//4OTHER//' следует понимать как 'H://4OTHER//' В вашем случае, скажем, 'D://4OTHER//' (4OTHER - можите ПЕРЕОБОЗВАТЬ) Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано чт, 14/03/2013 - 05:45 пользователем Антонина82 Поняла.Следующий вопрос Цитата: Во второй папке, в файле "Метаграмма-контекст.js", открыв его любым редактором Как точно файл называется? У меня нет названия "Метаграмма-контекст.js" С окончанием "js" есть 5 файлов в папке "js" Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано чт, 14/03/2013 - 05:51 пользователем Alex2L В файле инструкции "Метаграмма-контекст.rtf" написано: Цитата: В архиве находятся две папки." т.е. в папка 4FBE - Метаграмма-контекст.js. В нём "D://XML//Metagramma//" - меняем на тот, куда распаковали! Сам фвйл переносим в FB-скриптам. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано чт, 14/03/2013 - 06:29 пользователем Антонина82 Вопрос: прописала 'D://4OTHER//' 2. Файл "Метаграмма-контекст.js" поместила в подпапку "Scripts" 3.Открыла FBE. В разделе скрипты появился раздел: метаграмма-контест. Нажимаю: пишет- Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано чт, 14/03/2013 - 06:35 пользователем Alex2L Что прописано в 21-й сверху строке "Метаграмма-контекст.js" ? Так: var MetagrammaPath = 'D://4OTHER//'; ?! А файл "metagramma.xml" гиде лежит? Тут: 'D:\4OTHER' ?! Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано чт, 14/03/2013 - 06:47 пользователем Антонина82 Спасибо, заработало. Я одну палочку в адресе не поставила. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано чт, 14/03/2013 - 22:31 пользователем Evernet Антонина82, вы говорили, что пополняете словарик. Можете выложить ваши метаграммы, чтобы можно было добавить в свой? Может быть у кого-нибудь еще появились новые, неплохо было бы писать сюда. А желающие уже будут добавлять в свой словарь. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 15/03/2013 - 00:45 пользователем Антонина82 Слова, которые я добавляю в скрипт регэспов (кто придумал такое дурацкое словцо), практически перечислены выше. Опробовала новый скрипт. Для меня он не очень подходит. Объясню почему. Дело в том, что все книги я прочитываю, сравнивая с бумажным экземпляром. Расценивайте это, как чудачество, при наличии сканов, но это так. Поэтому проверять повторно с помощью метаграмм, мне не очень хочется. Вчера потеряла несколько часов, проверяя с помощью этой программы, ранее сделанную книгу. Ни одной ошибки! Это не значит, что я вычитываю безошибочно. Наверняка, спустя год, прочитав ранее сделанную книгу, их обнаружу. Но, уверена, их количество не будет критичным. Для себя вывела способ, как сократить количество ошибок. Надо брать одну-две-три серии книг одного издательства и сними работать. Примерно на 5-6-7 книге, вы будете знать "родовые" проблемы ФР при распознавании текста данного издания. К примеру, книги серии ЖЗЛ,как я писала выше, приобретают после работы ФР,"белорусский" акцент, т.е. букву "щ" превращают в в "ш". И получается "мешанина" вместо "мещанина" (: В книгах, серии "Живая история", обязательно надо проверить, если в конце предложения стоит буква "к" наличие точки. И 6 (шестерка) постоянно заменяется буквой "б". Я думаю, что Голма может привести значительно больше подобных примеров из практики. Ну, конечно, зацикливаться на книгах одной серии я не собираюсь, а то у меня в мозгах "сумбур биографий классиков". Поэтому программа "метаграмм" будет хорошо работать и помогать тем книгоделам, кто не читает текстов. ФР покажет ошибки распознавания, а "метаграммы" покажут ошибки ФР. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 15/03/2013 - 02:35 пользователем izekbis Это я ставил вопрос про спелчекер и вычитку. Поставил. Сделал даже под него иконку. Кого заинтересует здесь http://yadi.sk/d/vN5f9PtO3ITwL . Попробовал работать. По моему получается довольно параноидально. При проверке обнаружилось больше 500!!! слов. Только слово «более» имеет 105 вхождений. Проверка всех слов займет времени больше, чем вычитка. А по мере увеличения словаря будет еще хуже. Это первое впечатление. Посмотрим, что будет дальше. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 15/03/2013 - 03:26 пользователем Alex2L Что параноидально, эт точно! Сам когда увидел первые рез-ты - офигел, сколько слов оказывается в метаграммных связях замечены. Насчет "более" - кто-то написал, что так у него "боже" распозналось. Наверное, так и было. С "далее" - та же, похоже, история. Тут два выхода - или переделать словарь "под себя", выкинув лишнее. Либо при прверке протокола не обращать на часть слов внимания в принципе, особенно тех, где кол-во повторений много. Кстати Это кол-во не вхождений данного слова в текст в целом, а кол-во параграфов, где встретилось это слово. Т.е. на самом деле их может быть больше. Уменьшение размеров словаря - путь к ускорению обработки. Оставить только типа "негр - неф" и т.п. Скрипт по большому счету для отпетых педантов. А что делать?! На джаваскриптах искусственные интелект не соорудить. ИМХО. Отв: Метаграммы Постоянная ссылка (Permalink) Опубликовано пт, 15/03/2013 - 07:08 пользователем izekbis Alex2L написал: Что параноидально, эт точно! Сам когда увидел первые рез-ты - офигел, сколько слов оказывается в метаграммных связях замечены. Насчет "более" - кто-то написал, что так у него "боже" распозналось. Наверное, так и было. С "далее" - та же, похоже, история. Тут два выхода - или переделать словарь "под себя", выкинув лишнее. Либо при прверке протокола не обращать на часть слов внимания в принципе, особенно тех, где кол-во повторений много. Кстати Это кол-во не вхождений данного слова в текст в целом, а кол-во параграфов, где встретилось это слово. Т.е. на самом деле их может быть больше. Уменьшение размеров словаря - путь к ускорению обработки. Оставить только типа "негр - неф" и т.п. Скрипт по большому счету для отпетых педантов. А что делать?! На джаваскриптах искусственные интелект не соорудить. ИМХО. Всего скрипт насчитал больше 4800 вхождений. Если, на просмотр каждого потратить 5 сек, то получится 24000 сек= 400 мин= 6,6 часов. Я эту книгу 400 стр. прочту за 8. Страницы « первая ‹ предыдущая 1 2 3	Вход на сайт Имя пользователя * Пароль * Запомнить меня Регистрация Забыли пароль? Навигация Книги Издательские серии Премии Рекомендации Библиотечное ЧаВо Вычитка Про вычитку Технические темы Последние материалы Поиск по блогам и форумам Поиск книг Фильтр-список Популярные книги User menu Чёрно-белый список Книжная полка Последние комментарии nehug@cheaphub.net RE:не открывается книга 2 дня Aliki RE:Подайте бедному копеечку на книжку с литреса... 3 дня nehug@cheaphub.net RE:Доступ 6 дней sibkron RE:«Македонский роман XXI века 1 неделя sem14 RE:Рассказы Южных морей 1 неделя weis RE:Прошу переформатировать, распознать, etc... 1 неделя arkadybi RE:Абонемент 1 неделя babajga RE:Комната в башне 1 неделя Саша из Киева RE:Герои Израиля 1 неделя babajga RE:сиреневая звезда 2 недели babajga RE:Сказки Папоротникового Леса 2 недели sem14 RE:вопрос 2 недели sem14 RE:Премия «Небьюла» (Nebula Award) 3 недели Isais RE:Maxima-library - переезд 3 недели Iron Man RE:Курьезы сканировщика 1 месяц tvv RE:Абрахам Вергезе - The Covenant of Water 1 месяц Larisa_F RE:Эрнесто и его кролики 1 месяц Саша из Киева RE:Горящие паруса 1 месяц Впечатления о книгах Старший про Поселягин: Док [litres] (Фэнтези, Попаданцы) 06 07 Сказка с очень большими роялями.Оценка неплохо. udrees про Михайлов: Инфер-9 [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Самиздат, сетевая литература) 06 07 Написано хорошо, значительно отличаясь от предыдущих книг серии. По идее, 8-я книга могла стать последней в серии, но добавилась 9-я, где все опять вернулось к истокам. Гоблин Оди снова один, без своих компаньонов, и снова ……… Оценка: отлично! udrees про Михайлов: Инфер-8 [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Самиздат, сетевая литература) 06 07 По идее это была бы достойной завершения серии книга. Вроде бы все сюжетные задания выполнены, плюс самому герою тоже изрядно подрезали крылья, сообщив пакостную весть об его здоровье. Описаний кровавых сцен хватает, как ……… Оценка: отлично! obivatel про Прозоров: Слово воина (Фэнтези, Попаданцы) 06 07 Не понимаю, как он мог набрать такое кол-во положительных отзывов. До финиша добраться не смог, насиловать себя не стану. Оценка: плохо Oleg68 про Туомайнен: Фактор кролика [litres] (Иронический детектив, Детективы: прочее) 04 07 Книга понравилась. Действительно не обычно. Присутствует и юмор, и криминал, и любовь. Оценка: отлично! obivatel про Калбазов: Царство Небесное [litres] (Боевая фантастика, Попаданцы) 04 07 Рука-лицо. Дочитать не смог(стопнулся примерно на 20%), сплошное натягивание совы на глобус, при чём многократное. Очень-очень плохо, просто отвратительно. Оценка: нечитаемо obivatel про Калбазов: Родоначальник [СИ] (Боевая фантастика, Технофэнтези, Попаданцы, Самиздат, сетевая литература) 03 07 Каждой книге хорошо, а всей серии - отлично! Оценка: хорошо Alhimik0 про Уэльбек: Возможность острова [La possibilité d'une île ru] (Современная проза) 02 07 Счастье это лишь возможность острова на миг открытого нам вдали холодного равнодушного моря нашей жизни. Жизнь - реальна. Все остальное - нет... Оценка: отлично! udrees про Михайлов: Инфер-3 [СИ] (Боевая фантастика, Киберпанк) 02 07 Хорошее продолжение серии. Написано в жестком стиле, обилие кровищи, сцены жестокости, пыток, убийств. Главный герой никого не боится, шагает по трупам. В разговорах с другими хамоват и быдловат. Никто ему не ровня. ……… Оценка: хорошо udrees про Михайлов: Инфер-7 [СИ] (Боевая фантастика, Киберпанк, ЛитРПГ, Самиздат, сетевая литература) 02 07 Продолжение жестоких приключений героя в жестоком умирающем мире. Для любителей серии зайдет, благо что антураж поменялся, поменялись монстры и сюжетная линия поменялась. Описания предельно жестокие, с изобилием кровавых ……… Оценка: хорошо udrees про Михайлов: Инфер-6 [СИ] (Боевая фантастика, Киберпанк, ЛитРПГ) 02 07 В целом хорошо, небольшая смена обстановки, чуть лучше стало описание. Главный герой в целом справедлив, хотя и жесток. Все равно старается помочь угнетенным и отчаявшимся. Находится в «контрах» с власть имущими и эксплуатирующими. Для ……… Оценка: хорошо udrees про Михайлов: Инфер-5 [СИ] (Боевая фантастика, Киберпанк, Постапокалипсис, Самиздат, сетевая литература) 02 07 Очередное продолжение цикла Низшего. Но сейчас наконец-то смена обстановки. Повествование начинается почти как с первой книги, когда герой переносится без всего в мир Формоз. Но на сей раз путь наверх проходится практически ……… Оценка: хорошо больше впечатлений