Уникализатор контента

Дата: 07.06.2008
Рубрики: SEO (Black&White) |

Вот здесь я недавно пытался рассуждать про способы уникализации текста, но потрепаться это одно, гораздо интереснее попробовать все на практике. Поэтому я сделал демку уникализатора контента, чтобы можно было посмотреть на эти методы воочию.

Сейчас доступны такие опции:
- Перемешивать абзацы
- Перемешивать предложения в пределах абзаца
- Сделать выжимку (маленькую статью из большой)
- Заменять русские буквы на эквиваленты
- Синонимизация

Что хочу отметить – способы с перемешиванием предложений неплохо работают на текстах по типу обзоров товаров или коротких новостей, смысл которых при перестановках практически не изменяется, также подойдет для уникализации стандартных баз данных шопов. Еще можно оставлять первое и последнее предложения на своих места – тогда смысловая читабельность будет еще лучше. На сколько “уникальным” становится при этом текст, это еще вопрос конечно :)

Синонимизая “в лоб”, т.е. простая автоматическая замена слов на синонимы по словарю, работает гораздо хуже, чем для англоязычных текстов, даже с небольшим вручную отобранным словарем. Для получения адекватных результатов придется применять более интеллектуальные методы работы со словоформами.

Думаю, что лучше всего аккуратно применять все способы понемногу и без фанатизма. Теперь попробую испытать эти и другие финты на реальных сайтах, посмотрим, чем нам ответят поисковики…

Еще по теме

Комментарии

Комментарии (34) на запись “Уникализатор контента”

  1. Max 07.06.2008 15:48

    отпишись по результатам тестов! очень интересно насчет перемешивания.

  2. Nemetc 07.06.2008 19:45

    Я вот нашел синонимайзер для вордпрес, в принципе должен работать аналогично уникализатору(для поисковиков) интерестно, сработает или нет…

  3. Роман 07.06.2008 20:54

    Спасибо, автор. продолжай копать!

  4. user 08.06.2008 09:54

    имхо в твоём уникализаторе ценность имеет только возможность уменьшать размер статьи и синонимайзер, остальное легко разпознаётся поисковиками

    вопрос про локальное исполнение php скриптов

    что можешь сказать о xampplite ? или что то другое посоветуешь ?

  5. Arser 08.06.2008 10:04

    xampplite это типа инсталяционного пакета апач+пхп+майскл?.. Ничего не могу сказать. Я когда начал изучать php, поставил и настроил на локалхост все вручную по какому-то простому мануалу, так уже много лет оно и стоит…

  6. syncsync 08.06.2008 12:18

    для повышения качества синонимизации можно использовать полуавтоматический режим - когда юзеру предлагается список найденных вариантов, а он уже сам выбирает лучший. как вот здесь. конечно это вариант больше пойдет для статей.

  7. Андрей 08.06.2008 19:00

    ну да!красавец!даешь народу пошевелить мозгами

  8. АндрейK 09.06.2008 08:23

    Спасибо за предложения,обязательно напиши что у тебя получится.

  9. Цветовод-декоратор 09.06.2008 09:41

    Да, для русского языка проблему читабельной синонимизации текста решить довольно проблематично. Если это делать для доров, то чего заморачиваться - марковка 5 порядка сделает не хуже!
    А для беляша - синонимизация - гон. Текст не читабельный.
    Возможно, еще и прокатит узко специализированны тематический словарь. Но для этого нужно, как минимум обработать индексатором пару сотен кил тематического текста. Вычислив, таким образом наиболее встречающиеся слова и словоформы составить словарь синонимов. Здесь, же следует учесть и направление синонимизации, то есть:
    анкор1->анкор2->анкор3 должно соответствовать в любом направлении. Задача геморройная, а вот выхлоп от нее еще достаточно спорный.

  10. manual 09.06.2008 21:07

    а полная версия будет бесплатная или платная?

  11. Разработка веб-дизайна Новосибирск 10.06.2008 11:59

    Естественно нужно все текста после проги дорабатывать руками! Ну согласитесь это не тоже самой, что писать статью заного ??

  12. Arser 10.06.2008 12:07

    Ага, за ногу её! :)

  13. Цветовод-декоратор 10.06.2008 21:01

    RE: Естественно нужно все текста после проги дорабатывать руками! Ну согласитесь это не тоже самой, что писать статью заного ??

    :)) О какой ручной доработке вы говорите? Вы что, на белый проект собираетесь контент переделывать синонимайзером?

  14. Олимпиада 11.06.2008 08:45

    Да, эти мысли заставят нас шевелить мозгами! А что из этого получится!

  15. Софтер 11.06.2008 20:27

    При перемешивании абзацев получается нечитабельный текст, а вот если делать синонимизацию и замену букв на англ. то нормально получается.

  16. Серега 12.06.2008 16:33

    Спасибо за линк. надо будет посмотреть, насколько чисто эта штука работает. )

  17. Петр 13.06.2008 19:15

    Лучше конешно самому писать… Уникальность в цене

  18. Андрей 13.06.2008 23:53

    Лучше написать статью полезную, чем бездумно прогнать, пользы больше

  19. blu-ray 14.06.2008 12:32

    для говносайтов самое то, а для людей не важно

  20. SEOшNic 17.06.2008 06:29

    Да ладно. чего накинулись то? Как смог автор, так и написал. Конечно до идеала далеко, но его ждать и не стоит. Ежу понятно, что фича затачивается под ГСы

  21. Цветовод-декоратор 17.06.2008 15:09

    Вы проверьте результат этой штуки на предмет уникализации контента. Она дает полностью уникальный текст при установке на 9 или максимальную синонимизацию. При всех других настройках - текст не получается полностью уникальным.
    С другой стороны, попадался мне макрос для ворда, работающий со словарем тезауруса. Хотя, если бы кто, мог бы прикрутить его к ОРФО 8, так как у него вроде эти функции реализованы лучше чем в ворде, авторы утверждают, чо при подборе учитывается склонение и падеж.

  22. tarusexpert 18.06.2008 13:58

    А можно поинтересоваться, сколько времни у Вас отнимает создание такого “уникализатора”. Я имею ввиду чистого времени, не учитывая перерывы.

  23. Znaxar 19.06.2008 11:35

    Я считаю что премешивание абзацев не особо поможет. Тут нужно слова перемешивать в предложениях и вообще лучше склонения менять ,предложение полностью переписывать своими словами.

  24. магазин блогов 19.06.2008 17:27

    За сколько можно купить этот блог?

  25. e-commerce 20.06.2008 04:45

    Простенький рерайт делать несложно, сразу получаешь уникальный контент…

  26. Андрей 21.06.2008 15:38

    Думаю, многие копирайтеры обидяться на такое изобретение…=)

  27. bong-bong 23.06.2008 10:59

    Есть уже готовые синонимайзеры, но большинство из них уже морально устарело, так что было бы очень интересно посмотреть на твой.

  28. Как модно говорить — палю темы. | neudor 24.06.2008 20:26

    […] контента. Что и как можно почитать например у Арсера. Можно ещё попробовать сменить дизайн. Но это всё […]

  29. Олег 25.06.2008 06:37

    Интересная вещь. А есть другие предложения на рынке? Сравнить бы с конкурентами.

  30. Карибы 30.06.2008 12:57

    Да в идеале такая вещь могла бы заменить 100 копирайтеров, но чтобы тогда стало с интернетом, авторскими статьями? Даже боюсь представить, так что лучше эту прогу спрячте куда подальше и ни кому не показывайте))

  31. skype 06.07.2008 10:45

    почти закончили работу надо такой софтиной, что будет делать
    1. синонимайзить по словоформам и словам (базы конечно надо собирать большие)
    2. обработка предложений с прямой речью, вместо нее делает - как сказал, по словам (очень удобно для рерайта интервью, из диалога получается пресс релиз)
    3. еще некоторые ноу хау, по обработке предложений переменой мест подчиненных предложений

    если кому интересно то можно пообщаться по асе

    427 - семьсот шестнадцать - 112

  32. Блогер 12.07.2008 12:09

    А не проще ли пользоваться аллсабмиттером?

  33. Gleo 30.07.2008 13:11

    Спасибо за линк, обязательно проверим эксперементально. У меня был опыт работы с прогой такого плана и она выдавала очень неплохие результаты, но как только я испытал вариант для русского текста все покосилось просто немеренно. Что туту поделаешь?! Велик и могуч русский язык.

  34. Антон Софтун 16.08.2008 13:16

    Очень интересный уникализатор с неплохими возможностями. Буду тестить.

Оставить комментарий