31166
•
17 минут чтения
•
Скрытое семантическое индексирование — это метод поиска информации, изобретенный задолго до появления Интернета. В какой-то момент, когда Google начал совершенствовать свои алгоритмы ранжирования, возникли разногласия по поводу ключевых слов LSI и того, полезны ли они для SEO веб-сайтов.
В этой статье я остановлюсь на истоках скрытого семантического индексирования и концепции ключевых слов LSI. И я покажу пару инструментов генератора ключевых слов LSI, которые можно использовать в копирайтинге. Наслаждаться!
Скрытое семантическое индексирование, сокращенно LSI, — это математический метод, который находит связи между словами в наборе документов. Используя LSI, мы можем сравнить десяток текстов и сделать вывод, что некоторые из них схожи по тематике. Алгоритм выявляет сходство, даже если ключевое слово основной темы не используется в некоторых текстах напрямую.
Другими словами,
Потребность в скрытом семантическом анализе возникла в то время, когда возможности компьютеров росли, и программисты стремились улучшить доступ пользователей к информации. Обработка текстовой информации потребовала более эффективного семантического анализа. Методика LSI была направлена на решение нескольких проблем анализа текста, а именно синонимии и многозначности.
Что такое синонимы?
Синонимия – это лингвистический термин, описывающий существование разных слов для одного и того же предмета или понятия. Например, для вашего пути у вас есть несколько слов, чтобы описать его как маршрут, дорогу, проезд, проход.
Что такое полисемия?
Полисемия – лингвистический термин, обозначающий одно слово, имеющее более одного значения. Многозначные слова имеют разные, но родственные значения. Возьмем слово «драйв» : вы можете водить машину, или вы можете отвезти друга домой из паба, или вы можете просто долго водить машину. Другое дело, что вы можете кого-то свести с ума. Слово может означать решимость, путешествие, широкий проезд для транспортных средств, компьютерную часть и т. д.
Что такое омонимия?
Несколько иным явлением является омонимия, когда слова одинаково пишутся (омографы) или одинаково звучат (омофоны), но обозначают разные понятия, не связанные по происхождению. Например, надо быть или не быть как глагол, а есть пчела как насекомое.
Эти языковые явления являются движущей силой всех каламбуров и юмора в искусстве и литературе.
Тем не менее, синонимия и полисемия являются основной причиной, по которой точное соответствие ключевых слов не подходит поисковым системам.
LSI раскрывает основные семантические структуры, которые могут быть скрыты или неясны из-за разнообразия формулировок. Этот метод позволяет находить сходства между несколькими документами в коллекции текстов и извлекать наиболее релевантные запросу поисковика.
LSI — это запатентованная технология, опубликованная в 1988 году (срок действия патента истек в 2008 году).
LSI использует матрицу терминов-документов и разложение сингулярных значений (SVD), распространенный метод линейной алгебры, для изучения концептуальных корреляций в тексте. Если вы не знакомы с операциями над матрицами и собственными векторами, потребуется время, чтобы понять, как это работает, но вот небольшая попытка.
Расчеты выявляют совпадения в тексте, помогая выявить концепции, общие для нескольких документов в коллекции текстов. Преимущество LSI заключается в том, что он помогает устранить шум и преобразовать очень разреженную матрицу TDM в аппроксимированную матрицу низкого ранга, которая выявляет общие структуры. Недостатками БИС является сложность вычислений.
Это анимация примера LSA из введения в учебные пособия по тематическому моделированию.
LSI можно использовать для сравнения терминов с терминами, документов с документами и терминов с документами. В более частном случае он служит для поиска соседних терминов (это термины, наиболее близкие по весу), нахождения группы слов, тесно связанных с одним понятием. Это могут быть не только синонимы, но и противоположности или просто слова, которые часто совпадают с основной темой. Благодаря кластеризации слов, которую делает LSI, он эффективен для поиска и категоризации документов.
Ключевые слова LSI — это слова, которые семантически связаны с ключевым словом основной темы страницы и могут быть найдены во множестве похожих текстов.
Чтобы просто понять, что такое ключевые слова LSI, давайте рассмотрим случайный запрос, например «изменение климата». Во-первых, подумайте, какие ассоциации у вас возникают со словом «фраза».
Если набрать его в строке поиска, то вы получите кучу самых разных страниц. Google извлекает определение этого термина из Википедии в избранном фрагменте, выделяя жирным шрифтом наиболее важные термины, связанные с изменением климата: «таяние льда», «потепление океана», «повышение уровня моря» и «подкисление океана».
На странице результатов поиска мы найдем еще пару релевантных терминов, таких как «глобальное потепление», «выбросы парниковых газов» и т. д. Это слова и фразы, которые появляются рядом с нашим основным ключевым словом в большинстве текстов.
Сложный вопрос о LSI заключается в том, что...
Для всех, кто спрашивает, использует ли Google ключевые слова LSI, есть один короткий ответ от представителя Google John Mueller раз и навсегда:
Итак, почему Google ассоциируется со скрытым семантическим анализом? Мы точно знаем, что поисковая система Google различает многозначные слова и синонимы. По популярным запросам как минимум несколько результатов в поисковой выдаче должны охватывать примерно один и тот же аспект темы, поскольку Google успешно идентифицирует ключевое слово и различает многозначные слова (конечно, когда вы его указываете, но также на основе вашей истории поиска) и даже интерпретирует цель запроса — отобразить наиболее релевантные тексты.
Более того, каждый день Google получает 15% поисковых запросов, с которыми он никогда раньше не сталкивался. Как он с ними справляется?
По правде говоря, вряд ли можно упомянуть какую-либо исследовательскую работу Google по ключевым словам LSI, показывающую, на каком этапе LSI могла быть реализована в его алгоритмах. Конечно, сегодня Google использует более совершенные алгоритмы обработки естественного языка для сканирования постоянно расширяющейся сети. Bill Slawski объясняет здесь, почему Google почти не использует LSI для поиска, и цитирует патенты 2017 года, заявляя в качестве примера, что новый алгоритм Google RankBrain основан на подходе вектора слов.
Судя по последним обновлениям алгоритмов, Google использует BERT для повышения релевантности результатов поиска запросам пользователей. Нейронная сеть для обработки естественного языка используется для ранжирования отрывков или для понимания глубокой семантики видео, что кажется гораздо более сложным, чем LSI.
Связанное чтение Google MUM: обновления поиска и последствия для SEO
LSI была изобретена на заре Интернета. Для такой большой сети, как сегодня, LSI непрактичен, не говоря уже о том, что достаточен.
Следует иметь в виду, что LSI — это лишь один из многих методов семантического анализа, наряду с вероятностным латентно-семантическим анализом, анализом главных компонентов, скрытым распределением Дирихле, Word2Vec и т. д.
Хотя метод LSI считается слишком старым и простым для современных потребностей поиска, термин «ключевые слова LSI» используется маркетологами по контент-маркетингу для описания объема работы по оптимизации, выполняемой на странице. Итак, какова ценность ключевых слов LSI для SEO?
Основное преимущество ключевых слов LSI заключается в том, что вы можете использовать их для улучшения SEO на странице. Инструменты LSI не предназначены для настройки алгоритмов Google. Они сосредотачиваются на анализе текста, чтобы найти слова и фразы, которые естественным образом встречаются рядом, на основе текстов, уже доступных в поисковой выдаче.
LSI позволяет обогащать контекст семантически связанными ключевыми словами. Использование ключевых слов LSI должно помочь вам создать естественный контекст для запроса и более глубоко раскрыть тему. Вы можете рассматривать его как своего рода помощника в написании контента.
Термин «копирайтинг LSI» используется в контент-маркетинге для обозначения процесса добавления связанных терминов в ваш контент. Грубо говоря, SEO-копирайтинг стремится уйти от устаревших и неестественных методов наполнения ключевыми словами. Он скорее ориентирован на создание удобного для пользователя контента: копирайтеры должны делать тексты написанными естественно и приносить дополнительную ценность пользователям (то же самое, к чему стремятся поисковые инженеры).
Итак, когда мы говорим о ключевых словах LSI, мы имеем в виду поиск соответствующих связанных ключевых слов, которые можно добавить для улучшения контента. В этом случае мы говорим об этом как о маркетинговой концепции, используемой создателями контента.
Сначала подумайте. Если вы эксперт, у вас будет множество идей, которые можно развить в своей статье. Что делать, если у вас закончились идеи? Используйте инструменты подсказки ключевых слов.
Первый метод, который приходит на ум, когда вы собираетесь найти ключевые слова LSI, — это использовать предложения ключевых слов Google. Однако, говоря об обычных инструментах подсказки ключевых слов Google, мы не можем использовать их для обозначения генераторов ключевых слов LSI, поскольку алгоритмы Google не предназначены для скрытого семантического индексирования.
Хотя автозаполнение Google, несомненно, является лучшим источником поиска ключевых слов, это не всегда то, что мы подразумеваем под ключевыми словами LSI. Кроме того, обратите внимание на разницу между ключевыми словами с длинным хвостом и семантическими ключевыми словами LSI. Ключевые слова с длинным хвостом уже включают ваше основное ключевое слово, скорее всего, они впишутся в ваш контент, и вы, вероятно, захотите отслеживать их как целевые ключевые слова. В то время как ключевые слова LSI могут вообще не включать ваше целевое ключевое слово.
В поисковой выдаче вы всегда увидите универсальный результат поиска, известный как поле «Люди также спрашивают». Это место, скорее всего, предложит вам пару отличных семантически связанных тем.
Развернув коробку, вы увидите больше вопросов и ответов. Чем больше вопросов вы видите, тем больше вопросов предлагает Google. Однако предлагаемые темы будут все дальше и дальше отдаляться от вашей основной темы.
Подсказки, найденные в поле PPA, представляют собой отличный выбор ключевых слов LSI для оптимизации для мобильного голосового поиска и полей часто задаваемых вопросов.
Вот еще один бесплатный инструмент для генерации ключевых слов от Google. Внизу страницы результатов поиска перейдите к просмотру результатов «Похожие поисковые запросы» — тем, которые оказываются наиболее частыми рядом с вашим основным поисковым запросом. При подобных поисках вы найдете пару хороших подтем, которые можно добавить к основному контенту и сделать статью более подробной. Синонимы и связанные термины — хороший способ обогатить ваш контент.
Google Images — еще один простой метод поиска ключевых слов с помощью ярлыков. Инструмент предлагает самые популярные ключевые слова с коротким хвостом, тесно связанные по семантике с целевым ключевым словом и представленные в изобилии в результатах поиска изображений.
Связанное чтение: 20+ бесплатных инструментов для исследования ключевых слов
Простой инструмент генератора ключевых слов LSI для академических исследований — это XLSTAT, надстройка для Excel. XLSTAT предлагает двухнедельную бесплатную пробную версию, а также демонстрационную таблицу, показывающую, как применять LSI к матрице терминов документа.
Во-первых, вам нужно будет создать DTM с двоичными значениями для вхождений слов в ваши тексты. Затем, активировав XSTAT в Excel, перейдите в раздел «Дополнительные функции» (нажав кнопку «+») и выберите «Интеллектуальный анализ текста» > «Скрытый семантический анализ». Перейдите к установке нужных параметров для ваших данных и нажмите «ОК», чтобы применить их.
Инструмент предоставит вам список тем, которые инструмент LSI извлекает из ваших данных. Чтобы быстро интерпретировать качество результатов, инструмент генерирует осыпную диаграмму, измеряя важность тем с помощью собственных значений и совокупного процента изменчивости. Также имеются визуализации отношений между терминами и между документами.
LSI Graph — хороший инструмент для семантического подбора ключевых слов, который говорит сам за себя. Это позволяет бесплатно выполнять 10 поисков в день. Просто зайдите на веб-сайт, вставьте начальное ключевое слово, и вы получите список ключевых слов LSI, сопровождаемый статистикой SEO, которая поможет вам выбрать наиболее перспективные ключевые фразы. Результаты принесут множество идей по обогащению вашего контента дополнительными темами или функциями.
В LSI Graph вы можете увидеть объем поиска по ключевому слову, стоимость клика и тенденции за определенный период времени. LSIGraph выполняет поиск по ключевым словам LSI, используя собственное измерение, известное как скрытое семантическое значение (LSV). В правой рабочей области вы увидите самый эффективный контент с активными ссылками, чтобы быстро их просмотреть.
LSI Graph также предлагает дополнительные функции, включая массовое управление ключевыми словами и инструмент Semantic Writer. Этот инструмент позволяет оптимизировать контент в приложении, генерировать ключевые слова LSI и видеть их рядом с вашим контентом, измеряя количество слов, плотность ключевых слов и т. д. Фактически, Semantic Writer предлагает руку помощи SEO-копирайтерам, уделяя особое внимание исследованиям. Ключевые слова LSI.
Keysearch — еще один бесплатный инструмент для поиска ключевых слов LSI для вашего контента. Алгоритм поиска ключевых слов, лежащий в основе этого инструмента, проходит первую страницу результатов поиска Google по вашему основному ключевому слову и анализирует все страницы рейтинга, чтобы найти слова и фразы, наиболее часто используемые в них.
Опять же, вы получите всю статистику исследования ключевых слов, такую как тенденции поиска, стоимость CPC и даже силу рейтинга доменов в поисковой выдаче по ключевому слову, а также их ссылки, органический трафик и популярность в социальных сетях.
Keysearch предлагает инструмент Content Assistant, который использует алгоритм функции глубокого анализа. Это добавляет еще один уровень к поиску ключевых слов LSI. Инструмент включает в себя связанные поисковые запросы из Google, а также ключевые слова с самым высоким рейтингом для первого результата в Google. Таким образом, вы найдете наиболее выгодные ключевые слова на лучшей странице, которые привлекают на сайт наибольший органический трафик.
Таким образом, Keysearch сочетает в себе функции инструмента поиска ключевых слов для исследования с инструментом написания контента, который помогает создавать контент на основе анализа результатов поиска. Это простой и легкий способ генерировать ключевые слова LSI для добавления в ваш контент, которые извлекаются в результате автоматического анализа из результатов самого высокого рейтинга, связанных поисковых запросов Google и полей вопросов.
Редактор контента является частью WebSite Auditor, инструмента из программного обеспечения SEO PowerSuite, который сочетает в себе функции сканера сайта и приложения для оптимизации контента. Для создания контента в WebSite Auditor есть отдельный модуль для аудита отдельных страниц и интеллектуальный помощник по написанию статей для оптимизации страниц в приложении.
Чтобы найти ключевые слова LSI, запустите WebSite Auditor и перейдите в раздел «Аудит страниц» > «Редактор контента». Нажмите кнопку +, чтобы добавить URL-адрес страницы, которую вы будете оптимизировать (существующей страницы или новой), затем приступайте к добавлению целевого ключевого слова для страницы.
Инструмент «Редактор контента» проанализирует поисковую выдачу для страниц с самым высоким рейтингом и предоставит советы по оптимизации страницы.
В главном окне у вас будет пространство для редактирования, где вы сможете создавать свой контент и видеть улучшение показателя оптимизации справа и справа в приложении.
Альтернативно, для создателей контента есть возможность экспортировать рекомендации в файл PDF и передать их для использования в каком-либо другом инструменте письма.
Поле количества ключевых слов доступно для редактирования. Вы можете увидеть существующую частоту ключевых слов на странице и узнать, как ее улучшить, используя больше или меньше ключевых слов. Вы можете редактировать это поле вручную (а также вручную добавлять дополнительные ключевые слова LSI).
В WebSite Auditor есть специальный инструмент TF-IDF, который расшифровывается как «Частота терминов — обратная частота документов». TF-IDF измеряет важность ключевой фразы, сравнивая ее с частотой этого термина в большом наборе документов. По сути, этот метод контент-анализа выполняет те же шаги, что и LSI, перед применением SVD. В то время как LSI выясняет, какие темы являются общими для каких документов в коллекции текстов, TF-IDF просто взвешивает термины в них.
Прелесть инструмента TF-IDF в редакторе контента заключается в том, что он показывает использование слов в виде четких визуализированных графиков. Он показывает среднее количество ключевых слов на страницах конкурентов и рассчитывает количество ключевых слов, которые вы должны использовать на своей странице. Инструмент быстрого предложения рекомендует добавить новое ключевое слово или использовать меньше некоторых ключевых слов, чтобы избежать переполнения ключевыми словами.
Редактор контента предоставляет рекомендуемое количество ключевых слов для использования в вашем контенте, взятых из контента ваших лучших конкурентов и отфильтрованных по параметру TF-IDF. Вы можете развернуть список конкурентов и просмотреть URL-адреса, а также трафик, полученный страницей в результате органического поиска по целевому ключевому слову. Вы можете просмотреть текстовую версию страницы прямо в инструменте или перейти на сайт по быстрой ссылке из инструмента.
Проведя анализ контента, инструмент предлагает темы и вопросы, на которых вам следует остановиться в вашем фрагменте контента, взятые прямо из поисковой выдачи Google (раздел «Люди также спрашивают» ). Это поможет вам придумать больше идей по темам и более подробно раскрыть вашу основную тему.
По мере добавления нового контента вес каждого ключевого слова в общем количестве слов меняется. Специальный виджет «Облако Word» показывает вес ваших ключевых слов в контенте.
Может ли упоминание связанных слов и фраз повысить рейтинг? Не совсем, эффект не гарантирован. Вы добавляете в свой контент релевантные ключевые слова и расширяете тему, освещаете ее более подробно. Тем временем вы получаете больше ключевых слов на своей странице, а ваши целевые ключевые слова поддерживаются расширенным контекстом. Алгоритмы поиска могут выявить некоторые дополнительные запросы, на которые нацелены ваши страницы. Это привлекает на ваш сайт более релевантный органический трафик и способствует общей видимости в Интернете. Но какие дополнительные ключевые слова лучше всего подходят для оптимизации страницы?
Независимо от того, используют ли поисковые системы LSI сегодня, концепция ключевых слов LSI используется оптимизаторами для помощи в создании контента. Понимая роль ключевых слов LSI, вы можете эффективно сделать их частью своей стратегии ключевых слов. Просто имейте в виду, что алгоритмы Google используют сотни факторов ранжирования, где контент имеет решающее значение.
Какой бы инструмент или метод поиска ключевых слов вы ни применяли, просто сосредоточьтесь на создании высококачественного контента. Не сомневайтесь в ценности лонгридов, потому что отличный контент получает голоса пользователей и его видят поисковые системы.