26.09.2019

Академическая тошнота документа. Классическая и академическая тошнота текста. Проверка текста


Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Подписаться

Плотностью ключевых слов () называют показатель частоты повторения ключевиков в тексте. Рассчитывается, как процентное отношение количества ключевых слов к общему числу слов в тексте. Тошнота страницы - один из основных параметров, с помощью которого поисковые системы вычисляют уровень соответствия запрашиваемой информации в поиске.

Для того чтобы быстрее в этом разобраться, можно привести простой пример. За исходный текст возьмем фразу «танцы народов мира», ключом в этом запросе является слово «танцы». Поскольку весь текст состоит всего из трех слов, значит слово «танцы» представляет собой 1/3 от всей фразы, и его составит 33.3% от всего текста. Следует отметить, что в расчет не принимаются шумовые слова – общие, часто встречающиеся части речи, такие как причастия, частицы, предлоги, междометия, цифры и т.д.

Классическая и академическая тошнота

Классической тошнотой принято называть самое часто повторяющееся слово в тексте. Ее рассчитывают, как квадратный корень от всего числа повторений.

Академическая тошнота – наиболее употребляемые слова и словосочетания в тексте, которое характерны для любых документов. Чем больше слов повторяется в документе, тем большей будет показатель академической тошноты, также на ее показатель влияют частота повторений и размер всего текста.

От плотности ключей непосредственно зависит продвижение сайта. Если плотность слишком мала, то нет и вероятности, что страница поднимется высоко в поисковой выдаче. Но если переборщить с плотностью вхождения ключевых слов, то документ будет принят за спам и его позиции в выдаче будут снижены.

Сегодня существует множество бесплатных онлайн-сервисов для тошноты страницы. Далее будут приведены некоторые из них:

SeoTXT.com
Определяет количество повторов и плотность часто встречаемых слов в тексте.

Istio.com
Вставить документ можно методом копипаст или ввести url страницы. Определяет ТОП-10 употребляемых слов в тексте, тошноту документа, количество символов и слов.

SEObuilding.ru
Вводите url адрес страницы, отмечаете интересующие пункты и получаете результаты плотности каждого слова в тексте.

Advego.ru
Это инструмент популярной биржи, с помощью которого вы сможете оценить текст на академическую и классическую тошноту.

Оптимальная плотность ключевых слов

Сколько должно быть ключевых слов на странице? Средний показатель оптимальной тошноты составляет примерно 3-8% от всего текста. Но на самом деле все индивидуально. Количество ключевиков на странице напрямую зависит от размера текста, места страницы, занимаемое на сайте, а также тематики статьи. Порой встречаются узкоспециализированные темы документов, где ключевые слова заменить практически нечем.

Для разных поисковым систем показатель оптимальности тошноты также будет индивидуален. Если говорить о Яндексе, изначально приемлемой была плотность ключевых запросов в 10%, после 3-5%, на данный момент где-то 3-7%. Отсюда делаем вывод, что никакого секретного процента оптимального употребления ключевиков не существует. И вместо того, чтобы гнаться за идеальной формулой плотности вхождения ключевых слов, лучше обратить внимание на следующий совет:

Текст должен быть естественным. Очень важно не переоптимизировать страницу, потому что поисковые роботы сразу раскусят, какой контент интересен людям, а какой состоит из множества повторений одного и того же ключевика. Вся сила в качественном контенте, написанном для человека. Используйте производные словоформы и синонимы ключевых запросов. Это сделает ваш текст более разнообразным, полезным и уникальным.

А как думаете вы, насколько важен показатель тошноты страницы в продвижении сайта?

Кстати, у нас полно статей-инструкций, в которых много практических советов с историей многолетней практики. Конечно, мы думали над тем, чтобы наладить тематическую рассылку, но пока не успеваем. Так что удобней всего

Наконец, еще один в меру бесполезный параметр, характеризующий количество «воды» в тексте. Вычисляется очень просто: берем количество незначимых слов и делим на общее число слов в документе. Незначимые — это предлоги, частицы, местоимения, сокращения и прочие словеса, сами по себе не несущие смысловой нагрузки.

Здравое зерно в этом параметре, безусловно, есть. Слишком много «воды» — и вот уже смысл текста теряется в многочисленных «как известно» , «нетрудно вообразить» , «в современном мире» и «молодая динамично развивающаяся компания» . Наоборот, сквозь «сухой» текст вам придется буквально продираться, и об этом знают все без исключения студенты.

Вот только к поисковой оптимизации водность имеет очень опосредованное отношение. Кроме того, характеристика не учитывает тематику текста, его структуру, использованную терминологию. Не говоря уже про метафоры и игру слов. Анализ «Евгения Онегина» на водность дает свыше 70% (при «оптимальных» и всячески рекомендуемых «экспертами» 60%), а стихи Бродского содержат и вовсе под 80% «воды». Это у Бродского-то, с его «многомерными» смыслами!

Скажете, стихи одно, а коммерческие тексты — другое? Верно. Но читают и то, и другое люди. В которых, кстати, тоже воды около 70%.

Доказательства бесполезности

Или, если точнее, иррелевантности вышеописанных параметров. После чего перейдем к лингвистическим характеристикам.

Чтобы понять, какое влияние оказывают плотность (частотность) ключевых слов, классическая и академическая тошнота и водность текста на ранжирование сайта в поиске, я проанализировал первую десятку сайтов в выдаче Яндекса по 5 произвольным запросам: «каршеринг» , «продвижение сайтов» , «дешевые авиабилеты» , «бухгалтерское обслуживание москва» и «копирайтинг на английском» . Для каждого сайта выполнялся расчет корреляции четырех параметров с рангом сайта и выполнялся регрессионный анализ полученных данных на предмет выявления возможной зависимости.

Детали исследования — ниже под спойлером. Кому математика неинтересна — идем сразу к выводам.

[+] Расчет корреляции параметров текста и позиции в поиске

По каждой поисковой фразе я сделал поиск в регионе Москва в Яндексе. Для первых 10 результатов в поиске выполнялись следующие действия:

  1. Открыть сайт.
  2. Нажать Ctrl+A, Ctrl+C.
  3. Вставить содержимое буфера в поле для текста в сервисе семантического анализа текста Адвего.
  4. Записать полученные параметры.

В результате получилось 5 групп по 10 значений каждого из четырех анализируемых параметров. Значения корреляции параметров с позицией в поиске рассчитывались сначала для отдельных ключевых слов, т.е. по группам. Затем были подсчитаны общие коэффициенты корреляции по всей выборке.

Все данные сведены в таблицу. Кликните, чтобы открыть в полном размере.

Корреляция по Пирсону хорошо «ловит» только линейную зависимость или близкую к ней. Поэтому на всякий случай проведем регрессионный анализ данных.

В общем-то, все видно невооруженным глазом. Да, есть некоторые границы значений каждого из параметров, но какой-то явной системы в распределении не наблюдается. Наличие границ как таковых, впрочем, ничего не означает. Если бы мы анализировали не осмысленные тексты, а набор слов — никаких границ не получилось бы, т.к. верхние и нижние значения частотности слов или, скажем, водности, определяются синтаксисом и морфологией языка и структурой текста, а не какими-то алгоритмами ранжирования.

Уравнения регрессии, построенные с максимальной достоверностью аппроксимации, выглядят здесь как чужеродные элементы: хаос он и есть хаос. Достоверность, кстати, намного меньше единицы.

Конечно, анализ не претендует на полноту. Есть к чему придраться: малая выборка, недостаточная глубина значений функции (позиции сайта), смешанные тематики запросов. Вполне возможно, что где-нибудь на 20-ой странице поиска картина сложится кардинально отличная от полученной мной.

Если кто-то проверит и поделится своими результатами, буду благодарен.

Результаты таковы: ни один из рассмотренных параметров не показал достоверной корреляции с позицией сайта в поиске. Проще говоря, ни обе тошноты, ни водность, ни даже частотность никакого заметного влияния на позицию не оказывают. По крайней мере, для сайтов в первой десятке результатов Яндекса по вышеуказанным запросам.

И еще несколько наблюдений.

Как известно, основной составляющей контента веб-сайта считается не что иное, как текст. Именно, качественный, уникальный текст – настоящий «двигатель» сайта. Замечали ли вы когда-нибудь, что одно и то же слово либо его морфологическое производное чересчур часто мелькает на глазах.

Правильно! Это и есть верный признак «тошноты» текста или «тошнотой» целой страницы. Другими словами, это понятие происходит от частого употребления одних и тех же слов.

Изначально этот термин был внедрен одним пользователем с форума forum.searchengines.ru и обозначал tf*idf в формуле ранжирования текстов Яндекса образца 2006 года. По численности «тошнота» страницы тогда приравнивалась к значению квадратного корня от числа употреблений наиболее частотного слова контента целой страницы. Гораздо позже, под «тошнотой» стали подразумевать плотность употребления на странице конкретно обозначенного ключевого слова или же целой ключевой фразы. Нужно учитывать, что важно не только наличие ключевого слова и оптимальное его распределение по тексту, но и «тошнота» – достаточное число повторений.

Добиться многократного увеличения эффекта его действия можно с помощью оптимизации, которая выражается обыкновенно в применении ключевых слов. «Ключи», как их сокращенно называют, представляют собой некие «крючки», позволяющие вытягивать сайты на выдачу поисковыми системами.

1. Тошнота страницы

1.1 Что это?

Безусловно, «тошнота» страницы – немаловажный и мощный показатель SEO-оптимизации. Термин этот не может нести в себе медицинского значения, поэтому не имеет ничего общего с физиологическими реакциями человеческого организма. По сути, «тошнота» является одним из качественных характеристик текстового документа и выражается в цифрах. Соответственно, «тошноты» со значением 0 просто не может существовать!

К «тошноте» относятся такие характеристики: плотность ключей, показатель спамности страницы, а также частота употребления идентичных слов. Для определения реальной «тошноты» у документа, необходимо подвергнуть текст некоторому анализу с помощью специально созданных с этой целью он-лайн сервисов. Они-то и выводят любой документ на «чистую воду», устанавливая «тошноту» документа по назначенному слову и по всему тексту, в целом.

1.2 Как проверить

Соответственно, необходимо контролировать этот показатель, поскольку «тошнота» напрямую оказывает влияние на . Кроме того, отмечу, что превышение значения «тошноты» определенного порога (для разных слов эта величина также разная!), поисковые системы-роботы могут посчитать страницу попросту переспамленной.

Для облегчения и без того нелегкой задачи в помощь оптимизатору были разработаны специальные сервисы, которые умеют безошибочно анализировать текст страницы по ряду параметров: количество вхождений «ключевиков» на страницу, релевантность «ключей» к общему тексту страницы, плотность ключевых слов на заданной странице и т.д.

Собственно говоря, проверка сводится к указанию адреса интересующей страницы либо вставке текста в специально предусмотренное для этой цели окно. Далее, остается выждать некоторое время для завершения анализа.

2 Список сервисов

Существует целый ряд веб-сервисов, которые, на мой взгляд, будут интересны для начинающих веб-мастеров. Обыкновенно, подобные SEO-сервисы применяют в своей работе фрилансеры либо небольшие компании: и те, и другие не имеют возможности нанимать профессиональных программистов для создания собственных инструментов.

Для удобства и полноты проводимого анализа предлагаю следующую классификацию SEO-сервисов:

  • по уровню доступности общему кругу пользователей – платные и бесплатные;
  • по степени универсальности – многофункциональные универсальные (для анализа ссылочной, технической и текстовой составляющей сайта), многофункциональные специализированные (для выполнения оценки сайта по многим параметрам в рамках единой направленности анализа), а также монофункциональные (для анализа только одного из параметров).

http://advego.ru/text/seo/ – представляет собой мощный сервис, на котором можно реально провести полный семантический анализ по разным направлениям параметров. Сравнительно недолгий по времени анализ, но иногда он может не работать. Обновляя страницу или задавая меньше параметров для анализа, можно «выжать» из этого сайта многое.

А вот что получилось:

Сервис http://istio.com/ – незаменимый «помощник», важный инструмент оптимизатора любого уровня квалификации, позволяющий получить статистику по любому из предложенных интернет-ресурсов в сети, а также методах их продвижения. Несмотря на то, что анализ продолжается недолго, а результат просто ошеломляет кучей полезной информации!

3. Какой должна быть тошнота?

Стоит ли говорить о том, что уровень тошноты должен быть оптимальным… %-ный показатель тошноты получается при делении количества «ключевиков» на общее число всех употребленных в тексте слов. Низкий уровень тошноты, равно, как и высокий показатель по ключевым словам, не сыграют положительной роли в продвижении сайта, в целом.

Дело в том, что низкий коэффициент «ключей» не дает возможности добиться внимания поисковых систем, не позволяя подойти к ним и на пушечный выстрел. Высокий же, обнаружив за собой заспамленность от слишком частого употребления определенных слов, – попросту оттолкнет поисковики от данного веб-ресурса. Автоматически, это указывает на низкое качество текстов страницы, а, значит, его нечитабельность и т.д. Для поисковых систем такой ресурс будет воспринят не иначе, как нарушитель, что может привести к применению штрафных санкций по отношению к сайту или существенному понижению его «веса».

Таким образом, показатель «тошноты» более 8 – весьма тревожный признак, способный отпугнуть реальных посетителей сайта. Вряд ли кто-либо захочет тратить драгоценное время на прочтение некачественных текстов с недобросовестной информацией. На доверие рассчитывать не приходится!

Мы снова будем говорить о том, как сделать Ваш ресурс лучше. Я расскажу о таком важнейшем факторе внутренней оптимизации как тошнота текста.

Что такое тошнота текста

Тошнота статьи – это показатель, который отражает количество использования какого-либо слова в тексте.

Тошнота бывает двух видов: классическая и академическая.

Классическая тошнота

Обычно рассчитывается для слова, которое используется чаще всего. Для того, чтобы посчитать классическую тошноту мы смотрим сколько раз самое популярное слово употребляется на странице и извлекаем из этого числа корень.

Например, если слово используется 9 раз – тошнота равняется 3. Существенный недостаток этой формулы – в ней не учитывается длина текста. Это значит, что длинный текст, чаще всего, будет иметь большую тошнотность по сравнению с коротким.

Академическая тошнота

Академическая тошнота это отношение количества употребления слова к общему количеству слов в тексте, выраженное в процентах. По сути, академическая тошнотность – это частота употребления слова на странице.

Обычно этот показатель считается для всех слов в тексте, но обращать внимание следует, прежде всего, на ключевые слова, под которые оптимизируется статья.

Как показывает практика, при оптимизации страницы под ключевой запрос очень часто делается две фундаментальные ошибки.

Ошибка №1. Недостаточная тошнота. В том случае, если ключевые слова присутствуют на странице в недостаточном количестве, поисковая система может «подумать», что они употребляются эпизодически и не несут существенной смысловой нагрузки. По логике поисковой системы из этого следует что текст не является ответом на запрос пользователя, и его вообще не включат в выдачу, или отодвинут на последние позиции.

Ошибка №2. Слишком большая тошнота. Однако не следует впадать в противоположную крайности и стремиться к тому, чтобы перенасытить страницу ключевиками. Это приведет к тому, что статья станет практически нечитаемой. Поисковые системы очень ревностно следят за качеством материалов, которые попадают к ним в индекс, и если тошнота будет превышена, то страница будет серьезно понижена в выдаче.

Какой же должна быть тошнота текста?

Это зависит от темы статьи. Обычно, для того, чтобы попасть в выдачу поисковой системы, и, в то же время, не навлечь на себя ее санкции академическая тошнота должна быть в пределах 2-7%.

Значение классической тошнотности на которые можно ориентироваться – от 3 до 5.

Это примерные цифры, которые были получены империческим путем (другие названия «метод проб и ошибок», «метод научного тыка», «пальцем в небо»).

Еще один хороший способ определить необходимую тошнотность – посмотреть на статьи конкурентов, которые занимают верхние позиции в поиске по нужному Вам запросу.

Для того чтобы быстро проанализировать текст существует несколько удобных инструментов.

Как быстро определить тошноту любого теста

Для того, быстро проверить статью и убедиться что тошнота находится в норме есть два метода.

Метод первый (субъективный).
Просто читаем текст (или даем прочитать другу). Если текст хорошо воспринимается, ключевые слова не режут глаз, значить тошнота, скорее всего, в норме.

Метод второй (объективный). Можно скачать и установить бесплатную программу TextusPro . Теперь нужно скопировать текст в окошко и программа автоматически подсчитает классическую тошнотность:

И частотности всех слов в статье:

А вот несколько полезных онлайн-сервисов для проверки статей:

Заходим на сайт istio.com , копируем текст в окошко, нажимаем «Анализ текста», и получаем точную сводку частоты употребления всех слов в тексте. Здесь же будет указана его классическая тошнота.

Кроме того, можно воспользоваться таким инструментом как анализ релевантности страницы на сайте Megaindex . ru. Для этого добавляем свой сайт в систему. Добавляем запрос, по которому будем продвигать страницу и адрес страницы. Система автоматически проанализирует насколько текст статьи подходит выбранному запросу и выдаст результат в виде процентного соотношения. На картинке (кликабельно) это соотношение выделено красным.

Если кликнуть на нем мышкой, то появиться окошко, в котором приведен текст на указанной странице с подсвеченными ключевыми словами, и результаты анализа страницы на релевантность запросу ввиде:

Как видите, здесь указаны рекомендуемые значения всех основных параметров. Все что остается, это только исправить текст статьи таким образом, чтобы она на 100% подходила своему запросу. Это очень важная часть внутренней поисковой оптимизации. Если этого не сделать, то дальнейшее будет неэффективно. С другой стороны, если релевантность страницы максимальна, то статья может оказаться в топе по низкочастотному запросу практически без дополнительных усилий.

Как уменьшить или увеличить тошноту страницы

Если видите, что в тексте явный «перебор» с ключевыми словами, это обязательно нужно исправить. Для этого необходимо пройтись по статье и убрать лишние ключевые слова там где без них можно обойтись.

Ещё один хороший способ уменьшить частотность – заменить ключевые слова на их синонимы. Это не только поможет сделать текст более читабельным, но и может привести дополнительных читателей по низкочастотным запросам.

Для того, чтобы повысить тошноту необходимо то же самое но, наоборот: добавить дополнительные ключи и заменить синонимы на точные формулировки.

Оптимизации. Термин этот не медицинский и не обладает негативным смыслом. Тошнота – это один из качественных показателей текстового документа и относится к частоте употребления в тексте одних и тех же слов. Это понятие всегда выражается в цифрах, нулевой тошноты не бывает. Плотность ключей, спамность страницы, частота употребления одних и тех же слов – относятся к понятию «тошнота». Чтобы определить тошноту документа, нужно подвергнуть его анализу. Для этого существует немало он-лайн сервисов. Они покажут тошноту документа по определенному слову и в целом по тексту.

Итак, важнейшая составляющая контента сайта – текст. Хороший уникальный интересный текст сам по себе является важным продвигающим моментом. Но эффект будет гораздо круче, если ко всем остальным качествам текста добавится оптимизация . Прежде всего она выражается в использовании ключевых слов. Ключевое слово – тот самый крючок, который вытянет сайт на выдачу поисковой системы . Поэтому важно не только наличие в тексте ключевого слова, но и правильное распределение его по тексту и достаточное число повторений – тошнота.

Уровень тошноты должен быть оптимальным

Изначально термин "тошнота" был введен пользователем форума forum.searchengines.ru под ником Миныч и означал нормировку tf*idf в формуле текстового ранжирования Яндекса образца конца 2006-го года. Численно тошнота страницы равнялась квадратному корню от числа употреблений самого частотного слова контента страницы. Со временем под "тошнотой" стали, как правило, понимать плотность употребления на странице конкретного ключевого слова или фразы.

Если число ключевых слов разделить на общее число всех слов текста получится процентный показатель тошноты. Низкий уровень тошноты по ключевым словам не сыграет роли в продвижении сайта . Высокий уровень обнаружит заспамленность, слишком частое употребление определенных слов. Это, соответственно, означает низкое качество текста, часто – его нечитабельность или даже потерю смысла. Естественно, что поисковая система среагирует на такое качество и вкупе с другими нарушениями слишком большая тошнота может стать причиной бана или снижения траста сайта. Показатель тошноты больше 8 – тревожный. Кроме того, это отпугнет реальных посетителей сайта, которые вряд ли станут тратить время на чтение некачественных текстов и не станут доверять недобросовестной информации.

Грамотно оптимизированный текст покажет не только оптимальную, достаточную тошноту по ключевым словам, очень важно, чтобы другие слова, не являющиеся ключевыми в этом документе, не употреблялись с большим преобладанием. Иначе они как бы “заглушат” эффект от ключевых слов. Например, ключевым словом было задумано словосочетание “продажа бетона”, но в тексте оптимальная тошнота получилась у сочетания “ранние заморозки”. Есть даже вероятность, что текст выйдет в топы именно по второму запросу, но вряд ли это будет целевая аудитория, интересующаяся продажей бетона. Если в тексте несколько ключей, то важно, чтобы тошнота по ним была распределена равномерно.