Обработка дублей.

Может все-таки стоит запретить удаление книг для всех? Сделать удаление и обработку дублей модерируемыми? Просто некоторые товарищи уже задолбали заменять отличные файлы неправлеными eBookDownloader'овскими. Сборники Лукьяненко, например, заменили. Сейчас залил назад нормальные.

Комментарии

Зачем заливать? Можно восстановить удаленное. Насчет модерации не согласен - неудобно + много работы модераторам, которых сейчас нет и т.д. Что действительно нужно, если уж делать модераторов, то дать им(и только им!) возможность удаления книг навсегда. Зачем это надо? Есть авторы у которых написано 10 книг, а в удаленных 60+ Причем версии книги идут так: 1 версия --- добавлена анотация --- исправлена опечатка(одна) --- исправлена опечатка(еще одна) и т.д. Нафиг хранить все эти промежуточные вещи? Плюс появляются "доброжелатели", которые восстанавливают все подряд. Итог: каша на полке у автора.

Bullfear написал:
Что действительно нужно, если уж делать модераторов, то дать им(и только им!) возможность удаления книг навсегда. Зачем это надо? Есть авторы у которых написано 10 книг, а в удаленных 60+ Причем версии книги идут так: 1 версия --- добавлена анотация --- исправлена опечатка(одна) --- исправлена опечатка(еще одна) и т.д. Нафиг хранить все эти промежуточные вещи? Плюс появляются "доброжелатели", которые восстанавливают все подряд. Итог: каша на полке у автора.

Да-да-да! Я сама недавно только с 3-го раза "правильно" залила книгу. *краснеет*
Промежуточных два варианта никому не нужны.

Не знал. Спасибо. Работы, кстати, не так уж и много. Человек 5-10 вполне справятся. Думаю, что из числа постоянно заливающих книги, желающих быть модераторами наберется достаточно.
И восстанавливать уделенное не очень удобно. То что раньше в библиотеке была книга лучшего качества практически никто не знает и восстанавливать некому.

а что, резонно.

А может быть как-то присваивать "облизанным" вариантам статус незаменимых? Правда как это осуществить программно в Друпале не представляю.
Вот именно статусы "окончательного варианта" и можно было бы оставить модераторам. Или обратный вариант - под замену открыты только невалидные книги. Еще подумать надо. Вообще, задачка логистическая или управленческая, решения должны быть различными. В зависимости от степени ограничений, которые выставляются определенным группам пользователей.

Не знаю, реально ли тут что-то изменить. Сам вики-принцип формирования библиотеки не дает что-то сделать в этом плане. Иначе потеряем больше - затруднится заливка. Наверное, надо заливающим иметь больше ответственности. Дублей, действительно, море. Другое название, другой жанр... И вот вам новая книга, а по сути - та же самая, но хуже. И главное, люди ведь это делают не со зла, а считают, что помогают библиотеке :(. Предложение Ларину: при заливке книг сделать крупное, яркое сообщение - предупреждение, типа: А вы уверены, что заливаемая вами книга отсутствует в библиотеке? А вы уверены, что ваша версия лучше, чем имеющаяся в библиотеке? А модераторы - это несерьезно, увы.

Цитата:
под замену открыты только невалидные книги.

Это не вариант. Я сейчас правлю поэзию - она полностью не отформатированная, зато формально валидная. :-(
Да и "простые" книги, прошедшие валидацию, не всегда могут получить статус "окончательного варианта". Так что валидность не может быть критерием.

"Приходите и модераторствуйте над нами!" - за такие неприличные предложения нужно банить :)
Можно посылать уведомления "залитая вами книга n1 заменена на n2", вывесить на видном месте список удаленных и замененных книг, помечать заведомо валидные книги, и т.д. То есть, следует соблюдать принципы wiki, раз уж взялись.

Bullfear написал:
Что действительно нужно, если уж делать модераторов, то дать им(и только им!) возможность удаления книг навсегда.

С этой задачей и простенький скрипт прекрасно справится. Когда понадобиться свободное место на диске.

Отвечу своей собственной цитатой:

Цитата:
появляются "доброжелатели", которые восстанавливают все подряд. Итог: каша на полке у автора.

Свободное место - последнее что меня волнует. Я же не говорю: давайте уберем возможность "удаления" книг пользователями. Я говорю: давайте выберем групу модераторов и дадим им возможность окончательного удаления промежуточных версий книг.
Цитата:
Можно посылать уведомления "залитая вами книга n1 заменена на n2", вывесить на видном месте список удаленных и замененных книг, помечать заведомо валидные книги, и т.д.

Не обижайся, но это маразм. Заливается и правится огромное количество книг ежедневно(около двух сотен, а иногда и больше).

Bullfear написал:
появляются "доброжелатели", которые восстанавливают все подряд. Итог: каша на полке у автора.

И это тоже проще решить техсредствами.

Bullfear написал:
Заливается и правится огромное количество книг ежедневно

Ну, и?.. Пара модераторов с этим справятся лучше пары сотен добровольцев?.. Не обижайся, но это не меньший маразм :)

Не знаю, как насчёт модераторов - не думала над этим вопросом, да и не чувствую (пока?) необходимости, но вот против рассылки я была бы категорически против.
Тут не получается отписаться от уведомлений об ответах из форума (кстати, кто-то знает, как это сделать?), а если к ним ещё добавятся уведомления о перезаливке книг, то вообще придётся заводить отдельный почтовый ящик только для этих целей. :-(
Представьте себе, что будет делаться у людей, заливающих регулярно книги. УжОс!

Цитата:
Представьте себе, что будет делаться у людей, заливающих регулярно книги. УжОс!

На ifolder.ru файлы заливать не доводилось? :)

Почтой слать уведомления совсем не обязательно. Можно в "личку". Можно (и нужно!) сделать страничку персональной статистики по залитым книгам... Само собой разумеется, юзер должен иметь возможность все это отключить.

agrey написал:
На ifolder.ru файлы заливать не доводилось? :)

Нет. А шо, страшно? ;-)

agrey написал:
Цитата:

Почтой слать уведомления совсем не обязательно. Можно в "личку". Можно (и нужно!) сделать страничку персональной статистики по залитым книгам... Само собой разумеется, юзер должен иметь возможность все это отключить.

Не знаю, так ли уж сильно я бы хотела, чтобы кто-то видел, сколько и какие книги я залила. В-) Точно так же, как я не хотела бы, чтобы мой IP был всем доступен.

Кстати, я таки подумала насчёт модераторов. Мне кажется, что это просто неудачное слово. На самом деле, предполагаю, что Bullfear имел в виду контингент "проверенных добровольцев", которые бы вычистили библиотеку от ненужного хлама, который неизбежно в ней накапливается.
Не думаю, что этим "модераторам" нужны были бы какие-нибудь другие права, кроме доступа к... ой, я не знаю, как это правильно называется. *стесняется*

Так вот, эта идея - постепенное приведение библиотеки в относительный (насколько возможно в вики-библиотеке) порядок мне нравится. И даже очень. Конечно, это огромный труд, к тому же очень кропотливый, но овчинка выделки стоит. ИМХО.

Цитата:
Нет. А шо, страшно? ;-)

Нудно. Очень неудобный, для тех заливает, обменник.

Цитата:
Не знаю, так ли уж сильно я бы хотела, чтобы кто-то видел, сколько и какие книги я залила. В-) Точно так же, как я не хотела бы, чтобы мой IP был всем доступен.

А никто и не должен эту страничку видеть, кроме самого юзера.

Цитата:
Кстати, я таки подумала насчёт модераторов. Мне кажется, что это просто неудачное слово. На самом деле, предполагаю, что Bullfear имел в виду контингент "проверенных добровольцев", которые бы вычистили библиотеку от ненужного хлама, который неизбежно в ней накапливается.

Э... А как их проверять-то? Создадим СБ Либрусека? :)
Меня лично вполне бы устроил и чекбокс "показывать 'сомнительные' книги".

agrey написал:

Цитата:
Не знаю, так ли уж сильно я бы хотела, чтобы кто-то видел, сколько и какие книги я залила. В-) Точно так же, как я не хотела бы, чтобы мой IP был всем доступен.

А никто и не должен эту страничку видеть, кроме самого юзера.

Держать на сервере любую информацию о том кто сколько какого копирайта залил - мягко говоря, нежелательно.

Ну, мне вот, мягко говоря, пофиг. А для кого опасно - тот конечно должен иметь возможность все это отключить.

Да мне как бы тоже пофиг... пока повестка не пришла ;-) (плюет по три раза через все плечи и стучит по всему деревянному - голова, естественно, отзывается глухой болью)

Но мне так кажется что это и для Ларина нежелательно.

И вот кстати попутная мысль - а нельзя ли сделать такой скрипт (локальный на клиенте, как Ваши пользовательские) который бы держал список залитых мною книг - но не на сервере, а на моем компе?

Хотя я пока и не вижу зачем (ну кроме тщеславие почесать) мне такой список был бы нужен... но все равно хочется. Не так чтобы сильно, правда. Я все равно держу в отдельном директории копии залитого.

Цитата:
Да мне как бы тоже пофиг... пока повестка не пришла ;-)

* задумчиво смотрит на значки мюторрента и емула в трее *
Книжки, говорите?..

Цитата:
Но мне так кажется что это и для Ларина нежелательно.

Ларину, пожалуй, тоже пофиг. Руки у ебук-копирастов (как звучит!) коротки.

Цитата:
И вот кстати попутная мысль - а нельзя ли сделать такой скрипт (локальный на клиенте, как Ваши пользовательские) который бы держал список залитых мною книг - но не на сервере, а на моем компе?

Тогда уж лучше делать нормальный upload manager, на языке уровнем пониже скриптов.

agrey написал:

* задумчиво смотрит на значки мюторрента и емула в трее *
Книжки, говорите?..

*весело смотрит на зелененький индикатор Флешгета, качающего в двадцать четыре горла очередные хай-дефинишн кинухи с рапиды*
А мы пирингом не занимаемся. Соответственно, и не распространяем. Так что прихватить нас за выступающие части тела совсем не так легко.

agrey написал:

Ларину, пожалуй, тоже пофиг. Руки у ебук-копирастов (как звучит!) коротки.

Не знаю. Может быть. Я бы на его месте, все-таки, не держал на сервере информацию о том кто что залил.

Цитата:

Тогда уж лучше делать нормальный upload manager, на языке уровнем пониже скриптов.

Ну это явно оверкилл, задача того не стоит.

Цитата:
А мы пирингом не занимаемся.

Ай-яй-яй! Задумайтесь - откуда на рапиде киношки берутся?.. Может, как раз я ее туда и залил? ;)

Цитата:
Ну это явно оверкилл, задача того не стоит.

Как сказать... У JavaScript есть такой недостаток: максимальный размер cookie ~4Kb. Какие уж тут списки файлов...
Впрочем, попробую поиграть с относительно новой фичей "Local Storage" (~60Kb). Посмотрим, что из этого выйдет.

agrey написал:

Задумайтесь - откуда на рапиде киношки берутся?..

Как - откуда?! Самозарождаются, конечно. Как булки на деревьях.

Логично. И чего к нам защЫтники копирайтов цепляются?..

Я так думаю что исключительно из врожденной вредности.

О-о-о! Так ты тоже из Ксанфа? :D

это что такое?
королевство тёмных эльфов или павильон для уничтожения ядерных отходов?))))))))))
просто звучит немного пугающе название))))))

Энтони Пирс, серия "Ксанф", на русском читал 20 книг. Хотя написано для детей (в основном), но вполне доступно и взрослым :)

согласен, страничка статистики по всем книгам которые я заливал или правил - супер!!
типо watchlist'a на википедии =)

Цитируя pkn: ....мягко говоря, нежелательно.

Аватар пользователя Captain Scarlett

Все это решается просто: книги отправляются в список не автоматом по факту заливки, а вручную. Если я хочу следить за данной книгой - жму на кнопку "наблюдать" (сейчас я пользуюсь для этой цели книжной полкой, но это не очень удобно). Конечно, наблюдать можно не только за теми книгами, которые залил сам.

отличная идея!!!! мне бы такое в голову никогда не пришло)))
кстати, у меня вопрос, эту случайно не ты в вычитке переводила отсканенные книги djvu в fb2? можно попросить тебя то же самое сделать с одним учебником??

Аватар пользователя Captain Scarlett

Цитата:
в вычитке переводила отсканенные книги djvu в fb2? можно попросить тебя то же самое сделать с одним учебником??

Если ты о "1189 годе", то у меня был текстовый файл из другого источника. А что за учебник? Если в нем много иллюстраций и формул, лучше оставить в djvu, мне кажется.

я не о нем.
у мну есть учебник польского, но там нет ocr слоя.
я хочу оставить книгу в djvu, но!
1. я не знаю как добавить ocr слой
2. не знаю как сделать оглавление

обяснишь?)

Аватар пользователя Captain Scarlett

Цитата:
обяснишь?)

Неа, сама не знаю.

Да... Да. Да!! Не нужно хранить на сервере ничего лишнего. Как сказал О. Бендер, - "уберите фотографа, он мешает моей шахматной мысли" ;) А мы тут не междупланетный турнир устраиваем, а всего лишь... Ну, да ладно, все и так знают. Что я заливаю, например, на рапиду, я оставляю у себя в виде ссылки. Там и адрес, и код удаления. И довольно.

Цитата:
отписаться от уведомлений об ответах из форума
Насколько я помню, в самом уведомлении есть такая строчка-ссылка. Но я не пробовал, мне пофиг, а иногда даже смотрю, кто где ответил. Оно у меня автоматом все равно идет в спам, и если я туда не загляну, то тю-тю!

Цитата:
Тут не получается отписаться от уведомлений об ответах из форума (кстати, кто-то знает, как это сделать?), а если к ним ещё добавятся уведомления о перезаливке книг, то вообще придётся заводить отдельный почтовый ящик только для этих целей. :-(

Сам не разобрался. :( Пришлось изменить почтовый ящик в настройках на - теперь "спам" с либрусека не доходит.

блин, вот что значит глючный интернет :( Тройной пост

Bullfear написал:
блин, вот что значит глючный интернет :( Тройной пост

Мне придёт ТРИ уведомления. В-)

Bullfear написал:
блин, вот что значит глючный интернет :( Тройной пост

Я борюсь с этим путем максимального повышения терпения и максимального понижения нетерпения. Килкнул на "отправить" - оно му-му... му-му... му-му... тогда я не кликаю второй-третий раз, а перехожу к другим делам. Минут через десять возвращаюсь, рефрешу страничку в другом окне - как правило, пост появляется.

Что-то много воды... Вопрос к занимающимся оцифровкой и прочими премудростями, в просторечии именуемыми созданием электронных книг:
Насколько точно можно определить правильность книги и вообще, возможно ли это?
Какие критерии нужно использовать при таком отборе?
Если ответ отрицательный, то никаких рычагов управления, кроме жесткого администрирования (абсолютно не соответствует модели ресурса) не вижу.
Если "правильность" книги поддается определению, (кстати, можно увязать с проектом вычитки - уж там-то должны по определению получатся наиболее правильные варианты), напрашивается введение для таких книг введение статуса "Finish", который не позволяет удалить или заменить данный вариант без снятия статуса. Модераторы не нужны, просто установкой статусов и дальнейшей правкой статусных произведений будет заниматься группа вычитки и коррекции.
Окончательное удаление остается в руках Ларина - слишком серьезные права. Если группа вычитки будет работать и будет достаточно обширной - через некоторое время появится вполне приличная по объему вполне "правильная" подборка.
Еще один плюсик - в подборке будут в основном новинки и наиболее популярные произведения.
А дубли пусть существуют. Пока не стоит вопрос нехватки места, они не очень мешают. А вот статус позволит читателю отобрать из нескольких дублей тот, который наиболее близок к совершенству.
Могу ошибаться, или не видеть каких-то очевидных проблем. Может кто-то подскажет другое решение по данному вопросу...

xxxyurixxx написал:
некоторые товарищи уже задолбали заменять отличные файлы неправлеными eBookDownloader'овскими.
Ну, во-первых, результат работы ebookdownloader'а легко отличить - по общей невалидности, несоответствию схемам и приметной строчке в тэге "program-used". Либо по строке "fb2fix" там же и в списке авторов документа. Наверняка и ещё способы имеются. Даже по номеру версии документа.

Во-вторых, заливалка новых книг всегда бодро рапортует "дубль найден и удалён", а должна смотреть и на ebookdownloader'ность с fb2fix'ностью, и на номер версии (отказываться заменять более древнюю на более свежую, версией 1.0 вообще никакую не замещать, версии >= 2 не заменять никакими), и только если заливаемая свежЕе - тогда, так уж и быть, пусть выводит дубля и предлагает между ними выбрать.

В-третьих, при просмотре книги (и даже при наведении мыша на линк на книгу - по крайней мере, при поиске и просмотре обновлений) неплохо бы сообщать ID и номер версии документа, ник его автора и дату заливки. (Часть этой информации можно получить на странице исправления книги, но не всю и это не сильно удобно.)

Можно попробовать такой вариант до кучи:
1) Составить список признаков, явно отличающих более сложное форматирование книги от более простого
(заголовки, эпиграфы, стихи, цитаты, сноски и проч)
2) Наличие/отсутствие признаков ebookdownloader'ности с fb2fix'ностью
3) Размер
4) Картинки-обложки
5) Аннотации
6) Валидность

При попытке менять книгу со сложным форматированием на вариант плэйн-текста - отказывать.

по моему это довольно сложно воплотиьт, чтобы при заливке каждой книги такое делалось...

Помоему, все ушли не в ту степь.
Самый простой вариант, прикрутить оценки качества к книгам.
Книги с неким количеством проголосовавших, но получившие сумму оценок ниже определенного уровня, автоматом пусть убираются в спойлер "Книги сомнительного качества".
Пройдет время и библиотеке будет красота (но тут уже от читателей зависит).

А удаление всеми желающими - зло.

люди и самой книге ставят оценки не очень активно, а вот качеству книги совсем мизерное число будет((((

пусть лучше ларин обратно приделает поиск дублей по id книги.
теперь оно не работает((((((((((

В контроле за удалением есть здравый смысл. Например, приходит какой-то поц с литреса и удаляет книги. В связи с этим предлагаю следующее. Удалённые книги должны лежать в особой папке "удалённые". Такая папка есть на целом ряде почтовых серверов. Файлы в предложенном варианте из папки "удалённые" пользователи удалить не могут, но могут при необходимости восстановить. Если файлы не восстановили в течении какого-то срока, скажем, недели с момента удаления, тогда они удаляются автоматически. Возможно, что есть смысл и в аналогичном контроле сверки дублей. Дубли при этом удаляются окончательно, а отправляются в папку "дубли", если их не затребовали назад на повторную сверку в течении недели - удаляются автоматически.

Возможно, следует делать так: Заменять/удалить книги не сразу, сделав предварительный опрос пользователей. Если какой-либо юзверь решил заменить/удалить книгу, то это происходит не сразу, а оба варианта помещаются в некий лист опроса: "Пользователь такой-то предлагает заменить книгу такую-то". Причина (заполняется инициатором) "более качественное форматирование" (допустим). И рядом голосовалка в простейшем виде. Любой, всяк сюда входящий, сможет просмотреть бегло оба варианта и голосовать "Да"/ "Нет". По итогам n дней книга автоматически заменяется/удаляется. Это защитит библиотеку от чистильщиков с литреса и просто неадекватных пофигистичных ламеров.
От дублей можно оборонятся аналогично "Пользователь такой-то предлагает добавить автору такому-то произведение такое-то". И рядом голосовалка Хотим/Не хотим/Это дубль/. В случае победы по п 3 книга попадает автоматически в опросник замены.
Библиотека выгодно отличается от Википедии в том, что там для того чтобы сделать вывод о качестве / правильности статьи надо обладать специальными знаниями. Здесь же большинство может все-таки отличить разницу между текстами.
Для экономии результат голосования выкладывать рядом с голосовалкой, чтобы, например, при подавляющем "за" люди не тратили время на сравнивание.
Ну если такой механизм не защитит, то уж, звиняйте, ничего не поможет, тогда и жаловаться нех.

У Крайтона Майкла есть дубли романа Крылья

Научная Фантастика Детектив
- Крылья 1118K

Триллер
- Крылья 676K

Первый нужно удалить; плохо отформатирован, без обложки.
Как или кто это сделает? ;-)

это под каждому из пользователей =)
надо просто нажать: исправить и объединить с другой книгой

soshial написал:
это под каждому из пользователей =)
надо просто нажать: исправить и объединить с другой книгой

Т.е. беру неправильную книгу, исправляю и объединяю с правильной? неправильная удалится?
И в чём отличие от просто "удалить"?

Страницы

X