Третья инкарнация Космотеки

Сразу к делу: восстанавливается, вновь на двигателе MediaWiki, т.н. Космотека, посвящённая реалиям, выведенным в моих произведениях. Требуются энтузиасты и подвижники, могущие найти время для создания статей по реалиям Ралиона, Шамтерана, Галлии и других миров.

Пояснение 1: я не ограничиваю Космотеку исключительно своими работами. Любые литературные статьи, и статьи об искусстве в широком смысле приветствуются, в т.ч. статьи по реалиям миров, созданных другими авторами.

Пояснение 2: поскольку у меня, увы, нет времени активно модерировать Вики, а первая версия не в последнюю очередь пострадала от вандализма, право создания новых страниц и их правки назначается явным образом.

Спасибо.

Комментарии

В принципе, я заинтересован в словаре понятий, используемых в художественной литературе - в свете (более-менее) существующего проекта автоматической каталогизации текстов. Поэтому готов принять участие. Но, к сожалению, сейчас я неожиданно оказался чрезвычайно занят (заочные извинения О.Д.) - поэтому много времени уделять не смогу.

Stager написал:
В принципе, я заинтересован в словаре понятий, используемых в художественной литературе - в свете (более-менее) существующего проекта автоматической каталогизации текстов.

Гм... а нельзя ли об этом проекте чуть поподробнее? Почему спрашиваю: у меня пару раз возникала мысль сделать дубово-статистический (типа, если много лазеров-бластеров - то scifi, если много лошадей-мечей-и-магов - то фентези) автоопределитель жанра текста. Исключительно дабы не ковырять вручную несколько сотен-тысяч текстовых файлов. Может, можно как-то Вам на хвост упасть? Или, наоборот, пригодиться? Программировать умею, с думанием похуже.

P.S. Константин, извините, плз, за оффтоп.

pkn написал:
P.S. Константин, извините, плз, за оффтоп.

Гы. А я для того и написал. Типа - кстати...

Проект я вяло делаю в рамках своих служебных обязанностей. Но при этом никто не мешает мне эксплуатировать массы :-)
Если Вы в курсе дел с автоматическим разнесением текстов по категориям, то знаете, что, если категории извлекать из самого массива текстов - то некоторые успехи в этом деле есть. А в особо благоприятных случаях - получившееся разбиение имеет почти настоящий смысл и пользу. Но редко.
В деле же разнесения текстов по заранее определённым категориям - прогресс начисто отсутствует. Если подойти трезво - то на сегодня способа автоматически присвоить абстрактному тексту категорию из наперёд заданных - не существует.
И вот я, в проблеске гениальности, некий подход к этой проблеме нашёл. А не так давно, после беседы с корифеями темы - и приложение подхода к анализу более-менее больших текстов. Ну, так, чтобы для этого не требовался суперкомпьютер. Просто у меня был некий информационный ресурс :-)

На самом деле, насколько это всё реально - пока непонятно. Но понятно, что без того ресурса - а именно, глоссария (тезауруса, словаря) терминов предметной области - ничего не получится точно. И если с научными и псевдо-научными терминами всё можно организовать за казённый счёт, то с терминами из фэнтези и фантастики - только очень в последнюю очередь. Вот здесь и могут помочь энтузиасты, ибо им нужнее.
Соответственно - объявленная Космотека - это где-то то...

Похоже, у Вас что-то высоконаучное и универсальное затевается... я думал об затее сильно проще, что-то наподобие такого: насчитать частотные словари по паре-тройке (десятков) тысяч книг (хоть из того же Либрусека) для которых *известен* жанр, никаких neural-network-ов не затевая, посмотреть на закономерности глазками, подобрать эмпирические веса-пороги ручками (используя контрольную выборку с, опять же, известными жанрами), и... и усё.

pkn написал:
Похоже, у Вас что-то высоконаучное и универсальное затевается... я думал об затее сильно проще, что-то наподобие такого: насчитать частотные словари... и... и усё.

Ага-ага. Щазкакже.
Я же начал свое повествование с фразы: "Если Вы в курсе...."
А если нет - то вот краткое резюме: всё уже было.
Предложенный Вами алгоритм имеет умное название. И даже - не одно.
Но если Вы не верите - можете попробовать, я же не возражаю?

Stager написал:

Ага-ага. Щазкакже.
Я же начал свое повествование с фразы: "Если Вы в курсе...."

Мне казалось, что я ясно показал, что не в курсе. Подкиньте названий литературки по вопросу почитать, плз (англ. или рус.). Или хотя бы ключевые слова по которым гуглить.

У меня в книге Спрэга де Кампа, помимо трёх романов, была статья (не его), в которой был разбор - что считать фэнтези, а что научной фантастикой. Если коротко, то по мнению автора, на деление фантастика-фэнтези количество бластеров и магических мечей влияния не оказывает, а главным критерием различия является логичность и последовательность. То есть, грубо говоря, если у автора магия - это универсальный рояль, то это однозначное фэнтези, а если магия чётко дифференцирована и полностью описано, что и как можно сделать, а что нельзя - то уже НФ. Как там автор точно сформулировал - не помню; если найду книгу, то отсканирую статью.

Rogue написал:
... что считать фэнтези, а что научной фантастикой. ...

Вы, фактически, говорите об очевидном - фэнтези, постсказочный жанр со сказочными законами и так его можно отделить от фантастики, скажем. Логическим путем.
А камрады говорят об исследовательской работе на тему - можно ли на основе словаря разделить жанры. Далеко не факт, что можно. Это диссертация, блин.

Интересненько, а когда (и если) жанры более-менее выделятся, то, что останется не идентифицированным (или неуверенно идентифицированным), это какие будут книжки? Наиболее выдающиеся или наоборот, полный отстой?...

Rogue написал:
грубо говоря, если у автора магия - это универсальный рояль, то это однозначное фэнтези, а если магия чётко дифференцирована и полностью описано, что и как можно сделать, а что нельзя - то уже НФ.

Угу, а Бережной, будучи, видимо, более снисходителен, говорил что сайфаи - имманентно физична, а фентези - имманентно этична.

Так или иначе:
1. "магия чётко дифференцирована и полностью описано" - не бывает.
2. Даже если бы бывало - всё равно ни тот, ни другой признак невозможно формализовать.

Так что остаётся подсчитывать лазеров с бластерами и лошадей с мечами.

pkn написал:
1. "магия чётко дифференцирована и полностью описано" - не бывает.

Бывает, ещё как бывает. Например, Щеглов.

pkn написал:
Так что остаётся подсчитывать лазеров с бластерами и лошадей с мечами.

И записать чистую, прям-таки эталонную НФ Шумила в фентези? Лошадей, мечей и даже драконов у него хватает.

larin написал:
pkn написал:
1. "магия чётко дифференцирована и полностью описано" - не бывает.

Бывает, ещё как бывает. Например, Щеглов.

Не читал (и не буду), но верю. Пусть это будет именно то исключение, которое подтверждает правило.

larin написал:
pkn написал:
Так что остаётся подсчитывать лазеров с бластерами и лошадей с мечами.

И записать чистую, прям-таки эталонную НФ Шумила в фентези? Лошадей, мечей и даже драконов у него хватает.

У Шумила нет магии. Значит, у него есть шанс. ;D

Если же серьёзно, то никто и не утверждает, что робот-определитель ни разу не споёт песню птицы обломинго.

X