Уникализатор контента
Вот здесь я недавно пытался рассуждать про способы уникализации текста, но потрепаться это одно, гораздо интереснее попробовать все на практике. Поэтому я сделал демку уникализатора контента, чтобы можно было посмотреть на эти методы воочию.
Сейчас доступны такие опции:
- Перемешивать абзацы
- Перемешивать предложения в пределах абзаца
- Сделать выжимку (маленькую статью из большой)
- Заменять русские буквы на эквиваленты
- Синонимизация
Что хочу отметить – способы с перемешиванием предложений неплохо работают на текстах по типу обзоров товаров или коротких новостей, смысл которых при перестановках практически не изменяется, также подойдет для уникализации стандартных баз данных шопов. Еще можно оставлять первое и последнее предложения на своих места – тогда смысловая читабельность будет еще лучше. На сколько “уникальным” становится при этом текст, это еще вопрос конечно
Синонимизая “в лоб”, т.е. простая автоматическая замена слов на синонимы по словарю, работает гораздо хуже, чем для англоязычных текстов, даже с небольшим вручную отобранным словарем. Для получения адекватных результатов придется применять более интеллектуальные методы работы со словоформами.
Думаю, что лучше всего аккуратно применять все способы понемногу и без фанатизма. Теперь попробую испытать эти и другие финты на реальных сайтах, посмотрим, чем нам ответят поисковики…
Еще по теме:
- Не найдено
отпишись по результатам тестов! очень интересно насчет перемешивания.
Я вот нашел синонимайзер для вордпрес, в принципе должен работать аналогично уникализатору(для поисковиков) интерестно, сработает или нет…
Спасибо, автор. продолжай копать!
имхо в твоём уникализаторе ценность имеет только возможность уменьшать размер статьи и синонимайзер, остальное легко разпознаётся поисковиками
вопрос про локальное исполнение php скриптов
что можешь сказать о xampplite ? или что то другое посоветуешь ?
xampplite это типа инсталяционного пакета апач+пхп+майскл?.. Ничего не могу сказать. Я когда начал изучать php, поставил и настроил на локалхост все вручную по какому-то простому мануалу, так уже много лет оно и стоит…
для повышения качества синонимизации можно использовать полуавтоматический режим – когда юзеру предлагается список найденных вариантов, а он уже сам выбирает лучший. как вот здесь. конечно это вариант больше пойдет для статей.
ну да!красавец!даешь народу пошевелить мозгами
Спасибо за предложения,обязательно напиши что у тебя получится.
Да, для русского языка проблему читабельной синонимизации текста решить довольно проблематично. Если это делать для доров, то чего заморачиваться – марковка 5 порядка сделает не хуже!
А для беляша – синонимизация – гон. Текст не читабельный.
Возможно, еще и прокатит узко специализированны тематический словарь. Но для этого нужно, как минимум обработать индексатором пару сотен кил тематического текста. Вычислив, таким образом наиболее встречающиеся слова и словоформы составить словарь синонимов. Здесь, же следует учесть и направление синонимизации, то есть:
анкор1->анкор2->анкор3 должно соответствовать в любом направлении. Задача геморройная, а вот выхлоп от нее еще достаточно спорный.
а полная версия будет бесплатная или платная?
Естественно нужно все текста после проги дорабатывать руками! Ну согласитесь это не тоже самой, что писать статью заного ??
Ага, за ногу её!
RE: Естественно нужно все текста после проги дорабатывать руками! Ну согласитесь это не тоже самой, что писать статью заного ??
Да, эти мысли заставят нас шевелить мозгами! А что из этого получится!
При перемешивании абзацев получается нечитабельный текст, а вот если делать синонимизацию и замену букв на англ. то нормально получается.
Спасибо за линк. надо будет посмотреть, насколько чисто эта штука работает. )
Лучше конешно самому писать… Уникальность в цене
Лучше написать статью полезную, чем бездумно прогнать, пользы больше
для говносайтов самое то, а для людей не важно
Да ладно. чего накинулись то? Как смог автор, так и написал. Конечно до идеала далеко, но его ждать и не стоит. Ежу понятно, что фича затачивается под ГСы
Вы проверьте результат этой штуки на предмет уникализации контента. Она дает полностью уникальный текст при установке на 9 или максимальную синонимизацию. При всех других настройках – текст не получается полностью уникальным.
С другой стороны, попадался мне макрос для ворда, работающий со словарем тезауруса. Хотя, если бы кто, мог бы прикрутить его к ОРФО 8, так как у него вроде эти функции реализованы лучше чем в ворде, авторы утверждают, чо при подборе учитывается склонение и падеж.
А можно поинтересоваться, сколько времни у Вас отнимает создание такого “уникализатора”. Я имею ввиду чистого времени, не учитывая перерывы.
Я считаю что премешивание абзацев не особо поможет. Тут нужно слова перемешивать в предложениях и вообще лучше склонения менять ,предложение полностью переписывать своими словами.
За сколько можно купить этот блог?
Простенький рерайт делать несложно, сразу получаешь уникальный контент…
Думаю, многие копирайтеры обидяться на такое изобретение…=)
Есть уже готовые синонимайзеры, но большинство из них уже морально устарело, так что было бы очень интересно посмотреть на твой.
[...] контента. Что и как можно почитать например у Арсера. Можно ещё попробовать сменить дизайн. Но это всё [...]
Интересная вещь. А есть другие предложения на рынке? Сравнить бы с конкурентами.
Да в идеале такая вещь могла бы заменить 100 копирайтеров, но чтобы тогда стало с интернетом, авторскими статьями? Даже боюсь представить, так что лучше эту прогу спрячте куда подальше и ни кому не показывайте))
почти закончили работу надо такой софтиной, что будет делать
1. синонимайзить по словоформам и словам (базы конечно надо собирать большие)
2. обработка предложений с прямой речью, вместо нее делает – как сказал, по словам (очень удобно для рерайта интервью, из диалога получается пресс релиз)
3. еще некоторые ноу хау, по обработке предложений переменой мест подчиненных предложений
если кому интересно то можно пообщаться по асе
427 – семьсот шестнадцать – 112
А не проще ли пользоваться аллсабмиттером?
Спасибо за линк, обязательно проверим эксперементально. У меня был опыт работы с прогой такого плана и она выдавала очень неплохие результаты, но как только я испытал вариант для русского текста все покосилось просто немеренно. Что туту поделаешь?! Велик и могуч русский язык.
Очень интересный уникализатор с неплохими возможностями. Буду тестить.
Попробовал с разными настройками. copyscape распознает в раз.
А при перемешивании предложений и абзацев пропадают картинки. Надо бы доработать.
Куплю, если только сама смогу потом словарь синонимов дополнять.
Дайте в начале демо на попробу.