Уникализация контента

Дата: 16.04.2008
Рубрики: SEO (Black&White) |

Задумался над вопросом, как из неуникального текста, сделать уникальный хотя бы в глазах поисковиков. Сразу оговорюсь, что сейчас я рассматриваю только автоматические варианты работы с контентом, при этом на выходе получить хочется по-возможности качественный и читабельный текст.

Все методы баянистые, просто хочу собрать в кучу и проанализировать.

Синонимайзер.

Помню, впервые мысль про синонимайзер закралась в мою голову года 4 назад, ну все, думаю, гугл попал… Но полазив по просторам Интернета, так и не нашел подходящий словарь, были платные продукты, но как-то не решился.

Сейчас различные словари синонимов уже гуляют в свободном доступе, и только ленивый не попробовал этот метод.

Мое ИМХО – получить “нормальный” текст с помощью синонимайзера вполне возможно, но нужны маленькие узконаправленные словари, аккуратно составленные вручную. Кстати, хорошая идея для нового проекта, на сколько я знаю, подобные словари еще не продаются. Как работает синонимайзер на многотысячном универсальном словаре можно посмотреть здесь.

Для русскоязычных текстов метод замены слов на синонимы работает гораздо хуже, чем для английских текстов. Тут уж приходится вникать во все глубины морфологии и принципы словообразований языка. Такую работу мы проводим уже некоторое время, но пока хвастаться особо нечем.

Имитирование опечаток.

Например, в каждом десятом слове текста, имитировать опечатку или просто заменять символы на html entities (надо подумать, можно ли так сделать). Текст остается читабельным, но разбавляется “новыми” словами.

Еще можно попробовать просто скрыть некоторые куски текста от роботов, для Яндекса – тег <noindex>, для Google часть предложений или слов можно выводить на JavaScript.

Переводчик.

Машинный перевод с одного языка на другой, или, например, английский-русский-анлийский.

Недавно игрался с Google Translate – действительно, отлично переводит, да и еще онлайн сервис :) Но как-то это неинтересно, добиться приемлемого качества без ручной правки пока невозможно.

Mashup.

Я как-то уже упоминал про этот метод, проверенно – работает. Это когда мы перемешиваем куски текста.

Понятно, что если мы перемешаем абзацы или предложения какой-то статьи – то смысл уходит. Но если это база товаров (например, amazon), и поменять местами в списке характеристики товара, то с точки зрения восприятия человеком смысл текста не изменится вообще, но с точки зрения бота, возможно, он станет более уникальный (точные алгоритмы нам конечно не известны).

Но есть способ перемешать и текст наподобие статьи. Каждое предложение можно поместить в div, перемешать их, а потом с помощью CSS расставить по нужным местам. Кто-то видел такую реализацию?

Сюда бы я отнес еще более глобальный метод, когда контент – это винегрет, нарубленный из многих источников, понемногу с каждого. По такому принципу, например, работает BRush. Ведь поисковые роботы скорее всего оценивают всю страницу целиком. Добавьте сюда еще локальную уникализацию каждого блока – и мы уже имеем кое-что…

Можно придумать и другие способы смешивания контента из различных источников в один текст, тут все зависит от исходного материала и того, что мы хотим получить на выходе. Например, мы имеем 10 статей одной тематики, из них вполне можно сделать краткую выжимку основных мыслей и или тезисов по теме, более того, этот текст может быть очень полезен человеку, ему не придется перечитывать все 10 статей.

зы. Руки рулят :)

Еще по теме

Комментарии

Комментарии (41) на запись “Уникализация контента”

  1. neudor 16.04.2008 13:22

    Понравилась идея с перемешиванием дивов. Но как верстальщик, скажу что на чистом сss реализовать это будет довольно сложно. Может, лучше яваскриптом собирать их обратно? Как к этому отнесутся Яндекс и Гугл? Они исполняют скрипты, или нет? Просвети пожалуйста, а то я не знаю.

  2. Arser 16.04.2008 13:49

    Гугл типа исполняет… но можно считать, что нет…

  3. proraritet 16.04.2008 14:12

    Для русскоязычных текстов есть хороший синонимайзер, в комплекте с которым идет база синонимов! Тексты получаются вполне читаемыми.

    seodimas.ru/sinonimajzer-pod-ru.html

  4. Arser 16.04.2008 14:27

    proraritet, давайте примеры текстов, посмотрим какие там хорошие тексты. а так это просто реклама…

  5. bondar 16.04.2008 16:18

    Проблема уникального контента стоит остро. Меня интересует пока только английский. Вот в нем без своей базы узкотематической получить нормальный контент сложно. Нормальный - для человека, а не для поисковика.
    В принципе, разные стандартные описания товаров для шопов можно превращать в тексты при помощи шаблонов+синонимов.

  6. Стёпыч 16.04.2008 16:34

    От себя добавлю: желательно при перепечатке статей/новостей никогда не оставлять первоначальный заголовок

  7. Delpher 16.04.2008 16:54

    По опыту могу сказать, что в рунете не плохо работает Mashup.

  8. Lucas 16.04.2008 18:12

    proraritet.
    Я этим синонимайзером пользуюсь. Сказать хочу следующее - все виды синонимайзеров хорошои, если есть БАЗА СИНОНИМОВ суперская. А такую базу можно сделать только руками и годами.

    Arser
    Ты мне по аське видал как то текст - я тебе его синонимимзировал. Речь идет о том синонимайзере…

    Стёпыч
    Да не желательно, а я бы сказал ОБЯЗАТЕЛЬНО!!! Аргументировать? Тег тайтл вспомните :) И как гугля с ним дружит? :)

  9. syncsync 16.04.2008 21:09

    Вот интересный сервис http://datapresser.com/ на эту тему. По сути - автоматический генератор контента из узкотематических баз.

  10. News.WebMoon.Ru - Новостной Блог: Уникализация контента 16.04.2008 21:59

    […] Читать […]

  11. Xzorro 16.04.2008 22:05

    Перемешивание рулит!
    еще можно в русском тексте после запятых вклинивать свои реплики, в репликах замешивается нужный ключевик в итоге получаем достаточно уникальный текст+ имеющий некий смысл

  12. 100 грамм водки 16.04.2008 22:23

    Как вариант из простых предложений делать сложные и подпровлять пунктуацию.

  13. khalid 17.04.2008 07:39

    Посмотри на этот словарь:
    http://kerkzone.net/2008/01/09/angliyskiy-slovar-sinonimov/
    Он доступен в SQL формате :)

  14. Fleurette 17.04.2008 11:47

    Замечаю неоднократно, что не так важно читать новости, как коменты! Спасибо за хорошую информацию!

  15. DrO 17.04.2008 12:30

    to Xzorro: это как в бородатом известном стебе- если после заятых ставить БЛЯ, то текст не теряет смысл, а приобретает эмоциональную насыщенность

  16. alexf2000 17.04.2008 14:35

    Мой синонимайзер получше будет. :) Вообще, можно попробовать замутить конкурс программ-синонимайзеров, у кого лучше получается переделывать текст с сохранением читаемости.

  17. Arser 17.04.2008 14:43

    alexf2000, где твой можно глянуть? он у тебя в генерилке твоей спрятан?

    конкурс можно, главное знать какой приз :)

  18. alexf2000 17.04.2008 15:49

    Мой разве что на сайтах наткнёшься, так нигде не выложен. С призом как раз всё ясно, у кого лучше синонимайзер, у того потенциально больше страниц в серпах и трафа. :)

  19. khalid 17.04.2008 16:46

    Для русского языка юзайте словарь Трушина - ASIS

  20. Kindzo 18.04.2008 09:15

    Рерайт рулит и ничего с этим неподелать.

  21. Nautilus 18.04.2008 09:20

    если добавить перед прилагательным наречие, то смысл текста не нарушится, а вот структура шинглов, будет нарушена и тем самым контент будет уникализирован. Как известно «Яшка» вычисляет дублирование контента в Интернете используя в том числе алгоритм шинглов. В Интернете можно найти описание этого алгоритма. Замечу только, что если в текст предложения вставить новые слова, то такой текст для Яндекса становиться уникальным (ИМХО).

    такая фишка есть в последней версии feedmaster

  22. DeV 18.04.2008 10:38

    Непомню где , но читал как составлять фарма-объявления для Adwords . Типа заменять похожие символы их аналогами или цифрами .
    Можно например изменить “слово” на “cлoвo” . Читаемо , но совсем другое . Возможно такой тип уникализации используется иногда.

  23. khalid 18.04.2008 11:03

    Можно например изменить “слово” на “cлoвo”
    Т.е. буква “о” в одном варианте русская а в другом английская? Интересно, боты умеют такое отсеивать?
    Если нет то проблема уникализации решена, наверное :)

  24. Arser 18.04.2008 11:13

    khalid, не решена она ничего, на “бессмысленный” текст не будет поискового траффика.

  25. DeV 18.04.2008 15:50

    Arser , а если “бессмысленный текст” разбавить нормальными кеями ? На твой взгляд будет толк ? Просто провел маленький экспериментик , проверил с пяток слов с измененным написанием . Такое впечатление , что эту тему уже вовсю юзают , или поисковики спалили такой тип контента

  26. Владислав 18.04.2008 16:50

    проблема неуникального контента близка сердцу каждого сеошника! И каждый бореться с ней как может, особенно в свете последних попыток Яндекса ограничить доступ сателлитов в индекс. пробывал большинство методов, но добить от синонимайзкра качественно текста так и не смог :) перлы повесил на стенку)))

  27. andre 18.04.2008 18:35

    За неуникальность контента ничего не будет. Разве что трафика меньше. Бывали случаи, что сайт поднимался дажке выше источника на одной странице Я.

  28. деловой человек Kozzi 18.04.2008 19:33

    да, синонимы - это вещь!
    Хотя копирайтера думаю этим не удивишь:)

  29. Максим 20.04.2008 08:24

    За неуникальность будет склейка рано или поздно

  30. Green-Lo 20.04.2008 13:18

    За неуникальность склуйка будет в скором времени. Реврайтинг- наиболее подходящая штука для белых проектов.
    Сининимы, разбавление+ вставки на Маркове (3 порядка)- под доры и т.п.

  31. Людмила 20.04.2008 16:23

    Из всех перечисленных способов только синонимизацию контента считаю нормальным способом получения уникального контента. сама использую синонимейзер на макросах в ворде, называется syn, где скачала, уже не помню… Текст получается вполне читабильным, после небольшой ручной доработки.

  32. PictaBoo 20.04.2008 19:01

    Свой словарь для замен + с вариациями (не тупая замена каждый раз).

  33. jt 21.04.2008 10:07

    Не плохие идея, надо будет воспользоваться

  34. Дмитрий 21.04.2008 18:49

    Лучший способ уникализировать контент - использование синонимов, правда нужен немалый их словарь

  35. Александр 22.04.2008 05:36

    Я бы синонимы использовал…и переписал бы 80% исходного текста.

  36. Fred Perry 22.04.2008 11:24

    Идеи правда не плохие. Но пусть сначала их опробует кто нибудь другой

  37. Гарик Бульдог 22.04.2008 17:00

    Тут рулит синонимайзер…
    А никто не пробовал например в тексте пару букв(в каждом или почти каждом слове) на английские заменить

  38. Акша туралы 24.04.2008 16:48

    А лучше сканировать газеты. Адоб Ридер все равно правильно все не разберет, будет эффект опечаток и уникальность будет.

  39. Виктор 25.04.2008 19:58

    По поводу замены букв в слове - яндекс недавно объявил об автоматической замене запросов написанных с ошибками, и замена букв может отрицательно сказаться на колличество посетителей.

  40. Уникальный контент howto « Записки вебмастера 30.04.2008 10:40

    […] “Тщательно охраняемые” и “только продаваемые” секреты, наконец, расшарены на русском: Уникализация контента […]

  41. Man 30.04.2008 19:55

    Руки рулят однозначно :)
    Надо все способы пробовать.
    У меня скрипт рифму подбирает- новости получаются оборжаться

Оставить комментарий






Генератор Cайтов BRush