Создавать маловесящие rtf

Forums: 

Сканирую книгу, перевожу в txt. Вставляю в Ворд, редактирую, форматирую. Сохраняю в rtf.
Книга весит, допустим, 3 Мб. Ужимаю RTFPress`ом. Получается ~2 Мб
Выкладываю сюда или на Флибусту, там редактируют и получается rtf весом 400 Кб.
Вопрос: как? Как мне самому добиться такого размера?

Первая ошибка - "перевожу в txt".
Вторая ошибка - "сохраняю в rtf".
Софт для OCR способен создавать форматирование более сложное, чем то, которое поддерживает plain text, поэтому надо использовать сразу соответствующий формат, а не txt. Затем, LRE поддерживает doc и docx (не считая других форматов). Они в плане размера заметно лучше rtf'ов, так что не вижу смысла использовать rtf вообще.

P.S. Жаль, что не поддерживается odt.

Я, когда еще пользовался rtf, использовал Atlantis — получившийся размер был сопоставим с txt.
UPD. Вернее, Atlantis Nova.

Цитата:
Сканирую книгу, перевожу в txt. Вставляю в Ворд, редактирую, форматирую. Сохраняю в rtf.

А почему не в ворд?
Цитата:
Книга весит, допустим, 3 Мб. Ужимаю RTFPress`ом. Получается ~2 Мб

А архиватором пользоваться пробовали?
Цитата:
Выкладываю сюда или на Флибусту, там редактируют и получается rtf весом 400 Кб.

Вот сервер и архивирует.
Цитата:
Вопрос: как? Как мне самому добиться такого размера?

В Эксплорере - правый клик и архивирование, в тотал коммандере - Alt+F5.

Цитата:
В Эксплорере - правый клик и архивирование, в тотал коммандере - Alt+F5.

Получится файл с расширением архиватора. А нужен РТФ. Возможно, у меня где-то пробелы в познаниях об этом формате :)

Цитата:
Получится файл с расширением архиватора. А нужен РТФ.

Правильно. А в архиве лежит ртф.

Если бы понять зачем вам ртф нужен. *пожимает плечами*

sem14 написал:
Цитата:
Получится файл с расширением архиватора. А нужен РТФ.

Правильно. А в архиве лежит ртф.

Если бы понять зачем вам ртф нужен. *пожимает плечами*


RTF и doc хороши для сохранения ссылок в научных книгах...для тех, кто почитывает ридерами попсу есессно бесполезны.

Ser9ey написал:
RTF и doc хороши для сохранения ссылок в научных книгах...для тех, кто почитывает ридерами попсу есессно бесполезны.

Тогда можно и в html, получается?

Atlantis Nova - чемпион по созданию компактных RTF плюс - кроссплатформенный формат, минус - таблицы не умеет делать. А с DOC/DOCX можно макровирусы подцепить.

Сканируете-распознаете-сохраняете в rtf-копируете содержимое в чистый файл, объем уменьшаецца иногда в разы.

Ser9ey написал:
Сканируете-распознаете-сохраняете в rtf-копируете содержимое в чистый файл, объем уменьшаецца иногда в разы.

Это происходит если было разрешено быстрое сохранение:
Сервис > Параметры > Сохранение > Разрешить быстрое сохранение

При быстром сохранении в момент выполнения команды Сохранить записываются только внесенные изменения, а не обновленный документ. Причем эти изменения приписываются к концу файла и при окончательном сохранении не стираются, а так и болтаются в командной части файла (невидимой пользователю), увеличивая его объем.

Отсюда совет.
ОБЯЗАТЕЛЬНО запретите быстрое сохранение (оно установлено по умолчанию). Лучше пользоваться автоматическим сохранением или периодически жать F12 :)

Возможно при сохранении в файл rtf включаются фонты.
Посмотрите в опциях сохранения - там это можно отключить...

X