•
Leitura de 17 minutos
•
A Indexação Semântica Latente é uma técnica de recuperação de informações inventada muito antes de a Internet entrar em uso. Em algum momento, quando o Google começou a melhorar seus algoritmos de classificação, surgiu uma controvérsia sobre as palavras-chave LSI e se elas eram benéficas para o SEO do site.
Neste artigo, abordarei as origens da indexação semântica latente e o conceito de palavras-chave LSI. E mostrarei algumas ferramentas geradoras de palavras-chave LSI para usar em direitos autorais. Aproveitar!
A Indexação Semântica Latente, abreviadamente LSI, é uma técnica matemática que encontra relações entre palavras em uma coleção de documentos. Usando o LSI, podemos comparar uma dúzia de textos e concluir que alguns deles são semelhantes por tema. O algoritmo provoca semelhança mesmo que a palavra-chave do tópico principal não seja usada diretamente em alguns textos.
Em outras palavras,
A necessidade de análise semântica latente surgiu no momento em que as capacidades dos computadores cresciam e os programadores procuravam melhorar o acesso dos utilizadores à informação. O processamento de informações relacionadas ao texto exigia uma análise semântica mais eficiente. A técnica LSI teve como objetivo abordar diversas questões de análise de texto, nomeadamente, sinonímia e polissemia.
O que são sinônimos?
Sinonímia é um termo linguístico que descreve a existência de palavras diferentes para a mesma coisa ou conceito. Por exemplo, para o caminho que você percorre, você tem uma série de palavras para descrevê-lo como uma rota, uma estrada, um passeio, uma passagem.
O que é polissemia?
Polissemia é um termo linguístico para uma palavra com mais de um significado. Polissemas têm significados diferentes, porém relacionados. Considere a palavra dirigir : você pode dirigir um veículo, ou pode levar seu amigo de um pub para casa, ou simplesmente dirigir por um longo tempo. Outra coisa é que você pode deixar alguém louco. A palavra pode significar uma determinação, uma jornada, uma passagem larga para veículos, uma peça de computador, etc.
O que é homonímia?
Um fenômeno ligeiramente diferente é a homonímia, quando as palavras têm a mesma grafia (homógrafos) ou têm o mesmo som (homófonos), mas significam conceitos diferentes, não relacionados por origem. Por exemplo, você tem que ser ou não ser como verbo, e existe uma abelha como inseto.
Esses fenômenos linguísticos são a força motriz de todos os trocadilhos e do humor na arte e na literatura.
No entanto, a sinonímia e a polissemia são a principal razão pela qual a correspondência exata de palavras-chave não funciona para os mecanismos de pesquisa.
O LSI revela estruturas semânticas subjacentes que podem ser ocultadas ou obscurecidas devido à variabilidade do texto. Esta técnica permite encontrar semelhanças entre vários documentos de uma coleção de textos e recuperar os mais relevantes para a investigação do pesquisador.
LSI é uma tecnologia patenteada, publicada em 1988 (e a patente expirou em 2008).
O LSI usa uma matriz termo-documento e a decomposição de valores singulares (SVD), uma técnica comum de álgebra linear, para aprender correlações conceituais em um corpo de textos. A menos que você esteja familiarizado com operações em matrizes e autovetores, levará algum tempo para entender como isso funciona, mas aqui está uma pequena tentativa.
Os cálculos identificam coocorrências no corpo dos textos, ajudando a revelar conceitos comuns a diversos documentos do acervo de textos. O benefício do LSI é que ele ajuda a eliminar o ruído e a transformar uma matriz TDM muito esparsa em uma matriz aproximada de baixa classificação que revela estruturas comuns. A deficiência do LSI é a complexidade do cálculo.
Esta é uma animação do exemplo LSA da introdução aos tutoriais de modelagem de tópicos.
O LSI pode ser usado para comparar termos com termos, documentos com documentos e termos com documentos. Num caso mais específico, serve para encontrar os termos vizinhos (são os termos mais próximos pelo seu peso), encontrando um agrupamento de palavras intimamente relacionadas com um conceito. Podem ser não apenas sinônimos, mas também opostos, ou simplesmente palavras que muitas vezes acompanham o tópico principal. Graças ao agrupamento de palavras que o LSI faz, ele é eficaz para pesquisa e categorização de documentos.
Palavras-chave LSI são palavras semanticamente relacionadas à palavra-chave do tópico principal da página e podem ser encontradas em uma variedade de textos semelhantes.
Para uma compreensão simples do que são palavras-chave LSI, vamos dar uma olhada em uma consulta aleatória, por exemplo 'mudanças climáticas'. Primeiro, pense nas associações que você tem com a palavra frase.
Se você digitá-lo na barra de pesquisa, obterá várias páginas de vários tipos. O Google extrai a definição do termo da Wikipedia em um trecho em destaque, destacando em negrito os termos mais importantes associados às mudanças climáticas: 'derretimento do gelo', 'aquecimento dos oceanos', 'aumento do nível do mar' e 'acidificação dos oceanos'.
Na página de resultados da pesquisa, encontraremos mais alguns termos relevantes, como 'aquecimento global', 'emissões de gases de efeito estufa', etc. Estas são palavras e frases que aparecem ao lado do nosso termo de palavra-chave principal na maioria dos textos.
A pergunta complicada sobre LSI é...
Para todos aqueles que perguntam se o Google usa palavras-chave LSI, há uma resposta curta do representante do Google, John Mueller, de uma vez por todas:
Então, por que o Google está associado à análise semântica latente? Sabemos com certeza que o mecanismo de busca do Google distingue polissemias e sinônimos. Para consultas populares, pelo menos vários resultados no SERP devem cobrir aproximadamente o mesmo aspecto do tópico, uma vez que o Google identifica com sucesso a palavra-chave e distingue polissemas (é claro, quando você a especifica, mas também com base no seu histórico de pesquisa), e até interpreta o intenção da consulta de extrair os textos mais relevantes.
Além disso, todos os dias o Google recebe 15% de pesquisas que nunca encontrou antes. Como isso lida com eles?
A verdade é que dificilmente se pode mencionar qualquer artigo de pesquisa do Google sobre palavras-chave LSI que mostre em que estágio o LSI pode ter sido implementado em seus algoritmos. Com certeza, hoje em dia o Google usa algoritmos de processamento de linguagem natural mais avançados para examinar a web em constante expansão. Bill Slawski deixa claro aqui por que o Google dificilmente usa LSI para pesquisa e cita patentes a partir de 2017, afirmando como exemplo que um algoritmo mais recente do Google, RankBrain, é baseado em uma abordagem de vetor de palavras.
A partir das últimas atualizações algorítmicas, o Google usa o BERT para melhorar a relevância dos resultados da pesquisa para as consultas dos usuários. A rede neural para processamento de linguagem natural é usada para classificação de passagens ou para entender a semântica profunda em vídeos, o que parece ser muito mais complicado que o LSI.
Leitura relacionada MUM do Google: atualizações de pesquisa e implicações de SEO
O LSI foi inventado no início da Internet. Para a web tão grande como é hoje, o LSI não é prático, muito menos suficiente.
Uma coisa a ter em mente é que LSI é apenas uma das muitas técnicas de análise semântica, ao lado da Análise Semântica Latente Probabilística, Análise de Componentes Principais, Alocação de Dirichlet Latente, Word2Vec, etc.
Embora a técnica LSI seja considerada muito antiga e simples para as necessidades de pesquisa modernas, o termo 'palavras-chave LSI' é usado por profissionais de marketing de conteúdo para descrever o escopo do trabalho de otimização realizado em uma página. Então, qual é o valor das palavras-chave LSI para SEO?
O principal benefício das palavras-chave LSI é que você pode usá-las para melhorar o SEO na página. As ferramentas LSI não têm como objetivo ajustar os algoritmos do Google. Eles se concentram na análise de textos para encontrar palavras e frases que ocorrem naturalmente lado a lado com base em textos já disponíveis na SERP.
LSI permite enriquecer o contexto com palavras-chave semanticamente relacionadas. O uso de palavras-chave LSI deve ajudá-lo a criar o contexto natural para a consulta e cobrir o tópico com mais detalhes. Você pode tratá-lo como uma espécie de auxiliar na redação do conteúdo.
O termo 'copywriting LSI' é usado no marketing de conteúdo para denotar o processo de adição de termos relacionados ao seu conteúdo. Grosso modo, o copywriting de SEO tende a se afastar de técnicas desatualizadas e não naturais de preenchimento de palavras-chave. Em vez disso, concentra-se na criação de conteúdo amigável: os redatores devem fazer textos escritos de forma natural e trazer valor agregado aos usuários (a mesma coisa que os engenheiros de pesquisa buscam).
Portanto, quando falamos sobre palavras-chave LSI, queremos dizer encontrar palavras-chave relacionadas relevantes que podem ser adicionadas para melhorar o conteúdo. Nesse caso, falamos dele como um conceito de marketing utilizado pelos criadores de conteúdo.
Primeiro, pense. Se você for um especialista, terá muitas ideias para desenvolver em seu artigo. E se você estiver sem ideias? Use ferramentas de palavras-chave.
O primeiro método que vem à mente quando você está pronto para encontrar palavras-chave LSI é usar as sugestões de palavras-chave do Google. No entanto, ao falar sobre as ferramentas regulares de palavras-chave do Google, não podemos usá-las para nos referirmos a geradores de palavras-chave LSI, uma vez que os algoritmos do Google não tratam de indexação semântica latente.
Embora o preenchimento automático do Google seja, sem dúvida, a melhor fonte para descoberta de palavras-chave, nem sempre é isso que queremos dizer com palavras-chave LSI. Além disso, observe a diferença entre palavras-chave de cauda longa e palavras-chave semânticas LSI. Palavras-chave de cauda longa já incorporam sua palavra-chave principal, provavelmente elas se encaixarão em seu conteúdo e você provavelmente desejará rastreá-las como suas frases-chave alvo. Considerando que as palavras-chave LSI podem nem incluir a palavra-chave alvo.
Abaixo do SERP, você sempre verá o resultado da pesquisa universal conhecido como caixa People Also Ask. É mais provável que este lugar forneça alguns ótimos tópicos semanticamente relacionados.
Você verá mais perguntas e respostas enquanto desembrulha a caixa. Quanto mais perguntas você vê, mais perguntas o Google sugere. Porém, os tópicos sugeridos se distanciarão cada vez mais do seu tema central.
As pistas encontradas na caixa PPA são uma ótima escolha de palavras-chave LSI para otimizar a pesquisa por voz móvel e caixas de perguntas frequentes.
Aqui está outra ferramenta gratuita de geração de palavras-chave do Google. Na página de resultados da pesquisa, vá para inspecionar os resultados de pesquisas relacionadas, os tópicos que são os mais frequentes próximos ao seu termo de pesquisa principal. Em pesquisas semelhantes, você encontrará alguns bons subtópicos para adicionar ao seu conteúdo principal e tornar seu artigo mais aprofundado. Sinônimos e termos relacionados são uma ótima maneira de enriquecer seu conteúdo.
Imagens do Google é outro método fácil de encontrar palavras-chave com a ajuda de rótulos. A ferramenta sugere as palavras-chave de cauda curta mais populares, intimamente conectadas pela semântica à palavra-chave alvo e representadas em abundância nos resultados de imagens.
Leitura relacionada: Mais de 20 ferramentas gratuitas de pesquisa de palavras-chave
Uma ferramenta simples de geração de palavras-chave LSI para pesquisa acadêmica é o XLSTAT, um complemento para Excel. XLSTAT oferece um teste gratuito de duas semanas para experimentar e uma planilha de demonstração, mostrando como aplicar LSI em sua matriz de prazo de documento.
Primeiro, você precisará criar seu DTM com valores binários para ocorrências de palavras em seus textos. Em seguida, com o XSTAT ativado no Excel, vá para Recursos avançados (pressionando o botão +) e selecione Mineração de texto > Análise Semântica Latente. Continue definindo as configurações desejadas para seus dados e clique em OK para aplicar.
A ferramenta fornecerá a lista de tópicos que a ferramenta LSI extrai de seus dados. Para interpretar rapidamente a qualidade dos resultados, a ferramenta gera um scree plot, medindo a importância dos tópicos por meio de autovalores e percentual de variabilidade cumulativa. Existem também visualizações de relações entre termos e entre documentos.
LSI Graph é uma ótima ferramenta de palavras-chave semânticas que fala por si. Permite realizar 10 pesquisas por dia gratuitamente. Basta acessar o site, colar sua palavra-chave inicial e você obterá uma lista de palavras-chave LSI, acompanhada de estatísticas de SEO que o ajudam a escolher as frases-chave mais promissoras. Os resultados trarão um monte de ideias para enriquecer seu conteúdo com mais tópicos ou recursos.
No LSI Graph, você pode ver o volume de pesquisa da palavra-chave, os custos de custo por clique e as tendências ao longo de um período de tempo. LSIGraph realiza uma pesquisa de palavras-chave LSI usando sua própria medição proprietária conhecida como Valor Semântico Latente (LSV). Na área de trabalho direita, você verá conteúdo de alto desempenho com links ativos para verificá-los rapidamente.
LSI Graph também oferece recursos premium, incluindo gerenciamento de palavras-chave em massa e a ferramenta Semantic Writer. A ferramenta permite otimizar o conteúdo no aplicativo, gerar palavras-chave LSI e vê-las ao lado do seu conteúdo, medindo contagem de palavras, densidade de palavras-chave, etc. Na verdade, o Semantic Writer oferece uma ajuda aos redatores de SEO, com foco especial na pesquisa Palavras-chave LSI.
Keysearch é outra ferramenta gratuita para descobrir palavras-chave LSI para o seu conteúdo. O algoritmo de localização de palavras-chave por trás da ferramenta percorre a primeira página dos resultados de pesquisa do Google para sua palavra-chave principal e analisa todas as páginas de classificação para encontrar palavras e frases usadas com mais frequência nelas.
Novamente, você obterá todas as estatísticas de pesquisa de palavras-chave, como tendências de pesquisa, custos de CPC e até mesmo a força da classificação dos domínios no SERP para a palavra-chave, juntamente com seus links, tráfego orgânico e popularidade na mídia social.
Keysearch oferece uma ferramenta Content Assistant que usa o algoritmo de recurso de análise profunda. Ele adiciona outro nível à localização de palavras-chave LSI. A ferramenta inclui pesquisas relacionadas do Google, além das palavras-chave mais bem classificadas para o primeiro resultado no Google. Dessa forma, você encontra os termos-chave mais lucrativos da melhor página que atrai mais tráfego orgânico para o site.
Assim, Keysearch combina recursos de uma ferramenta de palavras-chave para pesquisa com uma ferramenta de escrita de conteúdo que ajuda a criar conteúdo com base na análise SERP. Esta é uma maneira simples e fácil de gerar palavras-chave LSI para adicionar ao seu conteúdo, extraídas por análise automática dos resultados mais bem classificados, pesquisas relacionadas do Google e caixas de perguntas.
O Content Editor faz parte do WebSite Auditor, uma ferramenta do software SEO PowerSuite que combina as funções de um rastreador de sites e um aplicativo de otimização de conteúdo em um só. Para criação de conteúdo, o WebSite Auditor possui um módulo separado para auditar páginas individuais e a ferramenta de assistente de escrita inteligente para otimizar páginas no aplicativo.
Para encontrar palavras-chave LSI, inicie o WebSite Auditor e vá para Page Audit > módulo Content Editor. Clique no botão + para adicionar o URL da página que você irá otimizar (a página existente ou a nova) e, em seguida, adicione a palavra-chave alvo para a página.
A ferramenta Editor de Conteúdo analisará o SERP para páginas de melhor classificação e fornecerá dicas de otimização na página.
Na janela principal, você terá o espaço de edição onde poderá criar seu conteúdo e ver a pontuação de otimização melhorando à direita no aplicativo.
Alternativamente, para criadores de conteúdo, existe a opção de exportar recomendações em um arquivo PDF e entregá-las para uso em alguma outra ferramenta de escrita.
O campo de contagem de palavras-chave é editável. Você pode ver a frequência das palavras-chave existentes na página e como melhorá-la usando mais ou menos palavras-chave. Você pode editar este campo manualmente (e também pode adicionar mais palavras-chave LSI manualmente).
Existe uma ferramenta TF-IDF especial no WebSite Auditor que significa 'Term Frequency - Inverse Document Frequency'. O TF-IDF mede a importância de uma frase-chave comparando-a com a frequência do termo em um grande conjunto de documentos. Basicamente, esta técnica de análise de conteúdo segue as mesmas etapas do LSI antes da aplicação do SVD. Enquanto o LSI descobre quais tópicos são comuns para quais documentos em uma coleção de textos, o TF-IDF simplesmente avalia os termos neles.
A beleza da ferramenta TF-IDF no Editor de Conteúdo é que ela mostra o uso das palavras em gráficos visualizados claramente. Ele mostra a contagem média de palavras-chave nas páginas dos concorrentes e calcula a contagem de palavras-chave que você deve usar em sua página. A ferramenta de sugestão rápida recomenda adicionar uma nova palavra-chave ou usar menos algumas palavras-chave para evitar o excesso de palavras-chave.
O Editor de Conteúdo fornece o número recomendado de palavras-chave para serem utilizadas em seu conteúdo, retiradas do conteúdo de seus melhores concorrentes e filtradas pelo parâmetro TF-IDF. Você pode desembrulhar a lista de concorrentes e ver os URLs, juntamente com o tráfego que a página obteve com a pesquisa orgânica pela palavra-chave alvo. Você pode visualizar a versão em texto simples da página diretamente na ferramenta ou acessar o site por meio de um link rápido da ferramenta.
Feita com análise de conteúdo, a ferramenta sugere tópicos e questões que você deve abordar em seu conteúdo, retirados diretamente do Google SERP (seção 'As pessoas também perguntam'). Isso ajuda você a ter mais ideias de tópicos e a cobrir seu tema principal com mais profundidade.
À medida que você adiciona novo conteúdo, o peso de cada palavra-chave em relação à contagem geral de palavras muda. Um widget especial de nuvem do Word ilustra o peso de suas palavras-chave no conteúdo.
Mencionar palavras e frases relacionadas pode aumentar as classificações? Não exatamente, o efeito não é garantido. Você adiciona palavras-chave relevantes ao seu conteúdo e expande o tópico, abordando-o com mais profundidade. Enquanto isso, você obtém mais palavras-chave em sua página e suas palavras-chave alvo são suportadas por um contexto aprimorado. Os algoritmos de pesquisa podem revelar algumas consultas adicionais às quais suas páginas se destinam. Isso direciona tráfego orgânico mais relevante para seu site e contribui para sua visibilidade online geral. Mas quais palavras-chave adicionais são melhores para otimização na página?
Independentemente de os mecanismos de pesquisa usarem LSI hoje ou não, o conceito de palavras-chave LSI é usado pelos SEOs para auxiliar na criação de conteúdo. Compreendendo a função das palavras-chave LSI, você pode efetivamente torná-las parte de sua estratégia de palavras-chave. Lembre-se de que os algoritmos do Google usam centenas de fatores de classificação onde o conteúdo é o rei.
Qualquer que seja a ferramenta ou técnica de localização de palavras-chave que você aplicar, concentre-se apenas na criação de conteúdo de alta qualidade. Não duvide do valor das leituras longas, porque um ótimo conteúdo recebe o voto do usuário e os mecanismos de pesquisa o veem.