31976
•
17분 읽기
•
잠재 의미 색인은 인터넷이 사용되기 오래 전에 발명된 정보 검색 기술입니다. 어느 시점에서 Google이 순위 알고리즘을 개선하기 시작했을 때 LSI 키워드와 그것이 웹 사이트 SEO에 유익한지 여부에 대한 논란이 일어났습니다.
이 기사에서는 잠재 의미 색인의 기원과 LSI 키워드의 개념에 대해 설명하겠습니다. 그리고 카피라이팅에 사용할 수 있는 몇 가지 LSI 키워드 생성 도구를 보여 드리겠습니다. 즐기다!
LSI(Lantent Semantic Indexing)는 줄여서 LSI 로, 문서 모음에서 단어 간의 관계를 찾는 수학적 기술입니다. LSI를 사용하면 수십 개의 텍스트를 비교하고 그 중 일부가 주제별로 유사하다는 결론을 내릴 수 있습니다. 알고리즘은 주요 주제 키워드가 일부 텍스트에서 직접 사용되지 않는 경우에도 유사성을 이끌어냅니다.
다시 말해서,
잠재 의미 분석의 필요성은 컴퓨터 용량이 성장하고 프로그래머가 사용자의 정보 액세스를 향상시키려는 시기에 나타났습니다. 텍스트 관련 정보 처리에는 보다 효율적인 의미 분석이 필요했습니다. LSI 기술은 텍스트 분석의 여러 문제, 즉 동의어와 다의어를 해결하는 것을 목표로 했습니다.
동의어란 무엇입니까?
동의어는 동일한 사물이나 개념에 대해 서로 다른 단어가 존재함을 설명하는 언어적 용어입니다. 예를 들어, 가는 길 에는 경로, 도로, 드라이브, 통로 등 을 설명하는 여러 단어가 있습니다.
다의성이란 무엇입니까?
다의어(Polysemy)는 하나의 단어가 하나 이상의 의미를 갖는 것을 가리키는 언어적 용어입니다. 그럼에도 불구하고 다의어는 관련된 의미가 다릅니다. 운전이라는 단어를 생각해 보세요. 차량을 운전할 수도 있고, 친구를 술집에서 집으로 데려다 줄 수도 있고, 단순히 오랫동안 운전할 수도 있습니다. 또 다른 점은 누군가를 화나게 만들 수 있다는 것입니다. 이 단어는 결단, 여행, 차량의 넓은 통행, 컴퓨터 부품 등을 의미할 수 있습니다.
동음이의란 무엇입니까?
약간 다른 현상은 단어의 철자가 동일하거나(동음이의어) 소리가 동일하지만(동음이의어) 의미가 어원에 따라 다르지만 다른 개념을 의미하는 경우 동음이의어입니다. 예를 들어 동사로는 be or not to be가 있고, 곤충으로는 bee가 있습니다.
이러한 언어적 현상은 예술과 문학의 모든 말장난과 유머의 원동력입니다.
그러나 동의어와 다의어는 정확한 키워드 일치가 검색 엔진에서 작동하지 않는 주된 이유입니다.
LSI는 표현의 다양성으로 인해 숨겨지거나 모호해질 수 있는 기본 의미 구조를 드러냅니다. 이 기술을 사용하면 텍스트 모음에서 여러 문서 간의 유사점을 찾고 검색자의 문의와 가장 관련성이 높은 문서를 검색할 수 있습니다.
LSI는 1988년에 공개된 특허 기술입니다(특허는 2008년에 만료되었습니다).
LSI는 용어-문서 행렬과 일반적인 선형 대수 기술인 SVD(특이값 분해)를 사용하여 텍스트 본문의 개념적 상관 관계를 학습합니다. 행렬과 고유벡터에 대한 연산에 익숙하지 않은 경우 이것이 어떻게 작동하는지 이해하는 데 시간이 걸리지만 여기서는 간단한 시도를 해보겠습니다.
계산은 텍스트 본문에서 동시 발생을 식별하여 텍스트 모음의 여러 문서에 공통된 개념을 밝히는 데 도움이 됩니다. LSI의 이점은 노이즈를 제거하고 매우 희박한 TDM 매트릭스를 공통 구조를 나타내는 낮은 순위 근사 매트릭스로 변환하는 데 도움이 된다는 것입니다. LSI의 단점은 계산이 복잡하다는 것입니다.
토픽 모델링 튜토리얼 소개의 LSA 예제 애니메이션입니다.
LSI는 용어 대 용어, 문서 대 문서, 용어 대 문서를 비교하는 데 사용할 수 있습니다. 보다 구체적인 경우에는 하나의 개념과 밀접하게 관련된 단어 클러스터를 찾아 인접 용어(가중치로 가장 가까운 용어)를 찾는 역할을 합니다. 이는 동의어일 뿐만 아니라 반대말일 수도 있고, 단순히 주요 주제와 자주 어울리는 단어일 수도 있습니다. LSI는 클러스터링이라는 단어 덕분에 문서 검색 및 분류에 효과적입니다.
LSI 키워드는 페이지의 주요 주제 키워드와 의미상 관련이 있는 단어로, 다양한 유사한 텍스트에서 찾을 수 있습니다.
LSI 키워드가 무엇인지 간단하게 이해하기 위해 '기후 변화' 와 같은 임의의 쿼리를 살펴보겠습니다. 먼저, 문구라는 단어와 어떤 연관성이 있는지 생각해 보세요.
검색창에 검색하시면 다양한 종류의 페이지가 나옵니다. Google은 특집 스니펫에서 Wikipedia의 용어 정의를 가져와 기후 변화와 관련된 가장 중요한 용어인 '얼음 용해', '해양 온난화', '해수면 상승' 및 '해양 산성화'를 굵은 글씨로 강조했습니다.
검색 결과 페이지 아래에서 '지구 온난화', '온실 가스 배출' 등과 같은 몇 가지 더 관련성 높은 용어를 찾을 수 있습니다. 이러한 용어는 대부분의 텍스트에서 주요 키워드 용어 옆에 나타나는 단어 및 구문입니다.
LSI에 대한 까다로운 질문은...
Google이 LSI 키워드를 사용하는지 묻는 모든 분들을 위해 Google 담당자 John Mueller가 단번에 한 가지 짧은 답변을 드립니다.
그렇다면 Google이 잠재 의미 분석과 관련된 이유는 무엇입니까? 우리는 Google 검색 엔진이 다의어와 동의어를 구별한다는 것을 확실히 알고 있습니다. 인기 있는 검색어의 경우, Google이 키워드를 성공적으로 식별하고 다의어를 구별하고(물론 사용자가 지정하는 경우뿐만 아니라 검색 기록을 기반으로) SERP의 적어도 여러 결과가 주제의 거의 동일한 측면을 다루어야 합니다. 가장 관련성이 높은 텍스트를 그리려는 쿼리의 의도입니다.
게다가 매일 Google은 이전에 한 번도 경험해 본 적이 없는 검색량의 15%를 받고 있습니다. 어떻게 처리합니까?
사실 LSI가 알고리즘에 구현된 단계를 보여주는 LSI 키워드에 대한 Google 연구 논문은 거의 언급할 수 없습니다. 확실히 요즘 Google은 더욱 발전된 자연어 처리 알고리즘을 사용하여 끊임없이 확장되는 웹을 검색합니다. Bill Slawski는 여기에서 Google이 검색에 LSI를 거의 사용하지 않는 이유를 분명히 밝히고 2017년 현재 특허를 인용하여 최신 Google 알고리즘 RankBrain이 단어 벡터 접근 방식을 기반으로 한다고 언급했습니다.
최신 알고리즘 업데이트에서 Google은 BERT를 사용하여 사용자 쿼리에 대한 검색 결과의 관련성을 향상시킵니다. 자연어 처리를 위한 신경망은 구절 순위를 매기거나 비디오의 깊은 의미를 이해하는 데 사용되는데, 이는 LSI보다 훨씬 복잡해 보입니다.
관련 읽기 Google의 MUM: 검색 업데이트 및 SEO 영향
LSI는 인터넷의 등장과 함께 발명되었습니다. 오늘날처럼 큰 웹의 경우 LSI는 충분은커녕 실용적이지 않습니다.
한 가지 명심해야 할 점은 LSI는 확률적 잠재 의미 분석, 주성분 분석, 잠재 Dirichlet 할당, Word2Vec 등과 함께 의미 분석의 많은 기술 중 하나일 뿐이라는 것입니다.
LSI 기술은 현대의 검색 요구 사항에 비해 너무 오래되고 단순하다고 일축되지만 콘텐츠 마케팅 담당자는 'LSI 키워드'라는 용어를 사용하여 페이지에서 수행되는 최적화 작업의 범위를 설명합니다. 그렇다면 SEO를 위한 LSI 키워드의 가치는 무엇입니까?
LSI 키워드의 주요 이점은 이를 사용하여 페이지 SEO를 향상시킬 수 있다는 것입니다. LSI 도구는 Google의 알고리즘을 조정하는 것을 목표로 하지 않습니다. 그들은 SERP에서 이미 사용 가능한 텍스트를 기반으로 자연스럽게 나란히 나타나는 단어와 문구를 찾기 위해 텍스트 분석에 중점을 둡니다.
LSI를 사용하면 의미상 관련된 키워드로 컨텍스트를 풍부하게 할 수 있습니다. LSI 키워드를 사용하면 쿼리에 대한 자연스러운 컨텍스트를 생성하고 주제를 더욱 심층적으로 다루는 데 도움이 됩니다. 컨텐츠 작성에 있어서 일종의 도우미로 취급하시면 됩니다.
'LSI 카피라이팅' 이라는 용어는 콘텐츠 마케팅에서 콘텐츠에 관련 용어를 추가하는 과정을 나타내는 데 사용됩니다. 대략적으로 말하면, SEO 카피라이팅은 구식이고 부자연스러운 키워드 채우기 기술에서 벗어나는 경향이 있습니다. 오히려 사용자 친화적인 콘텐츠를 만드는 데 중점을 둡니다. 카피라이터는 텍스트를 자연스럽게 작성하고 사용자에게 부가가치를 제공해야 합니다(검색 엔지니어가 추구하는 것과 동일).
따라서 LSI 키워드에 관해 이야기할 때 콘텐츠 개선을 위해 추가할 수 있는 관련 키워드를 찾는 것을 의미합니다. 그런 경우에는 콘텐츠 제작자가 사용하는 마케팅 개념이라고 합니다.
먼저 생각해보세요. 당신이 전문가라면 기사에서 전개할 아이디어가 많이 있을 것입니다. 아이디어가 부족하면 어떻게 되나요? 키워드 도구를 사용하세요.
LSI 키워드를 찾을 때 가장 먼저 떠오르는 방법은 Google 키워드 제안을 사용하는 것입니다. 그러나 Google의 일반 키워드 도구에 대해 이야기할 때 Google의 알고리즘은 잠재 의미 색인 생성에 관한 것이 아니기 때문에 이를 LSI 키워드 생성기로 지칭하는 데 사용할 수 없습니다.
Google 자동 완성은 의심할 여지 없이 키워드 검색을 위한 최고의 소스이지만 LSI 키워드가 항상 그런 것은 아닙니다. 게다가 롱테일 키워드와 시맨틱 LSI 키워드의 차이점에 주목하세요. 롱테일 키워드에는 이미 기본 키워드가 포함되어 있어 귀하의 콘텐츠에 적합할 가능성이 높으며 이를 타겟 키워드 문구로 추적하고 싶을 것입니다. LSI 키워드에는 대상 키워드가 전혀 포함되지 않을 수도 있습니다.
SERP 아래에는 People Also Ask 상자로 알려진 범용 검색 결과가 항상 표시됩니다. 이 장소는 의미상으로 관련된 몇 가지 훌륭한 주제를 제공할 가능성이 더 높습니다.
상자 포장을 풀면서 더 많은 질문과 답변을 보실 수 있습니다. 더 많은 질문이 표시될수록 Google에서 더 많은 질문을 제안합니다. 그러나 제안된 주제는 핵심 주제와 점점 더 멀어질 것입니다.
PPA 상자에서 발견된 단서는 모바일 음성 검색 및 FAQ 상자에 최적화하기 위한 LSI 키워드의 훌륭한 선택입니다.
Google의 또 다른 무료 키워드 생성 도구는 다음과 같습니다. 검색 결과 페이지 아래로 이동하여 주요 검색어 옆에 가장 자주 나타나는 주제인 관련 검색 결과를 살펴보세요. 유사한 검색에서 주요 콘텐츠에 추가하고 기사를 더욱 심층적으로 만들 수 있는 몇 가지 좋은 하위 주제를 찾을 수 있습니다. 동의어와 관련 용어는 콘텐츠를 풍부하게 만드는 좋은 방법입니다.
Google 이미지는 라벨을 사용하여 키워드를 찾는 또 다른 쉬운 방법입니다. 이 도구는 가장 인기 있는 짧은 꼬리 키워드를 제안하며, 의미론적으로 타겟 키워드와 밀접하게 연결되어 있고 이미지 결과에 풍부하게 표시됩니다.
관련 자료: 20개 이상의 무료 키워드 조사 도구
학술 연구를 위한 간단한 LSI 키워드 생성 도구는 Excel용 추가 기능인 XLSTAT입니다. XLSTAT는 문서 용어 매트릭스에 LSI를 적용하는 방법을 보여주는 2주 무료 평가판과 데모 스프레드시트를 제공합니다.
먼저 텍스트에서 단어 발생에 대한 이진 값을 사용하여 DTM을 생성해야 합니다. 그런 다음 Excel에서 XSTAT를 활성화한 상태에서 고급 기능 (+ 버튼 누르기)으로 이동하여 텍스트 마이닝 > 잠재 의미 분석을 선택합니다. 계속해서 데이터에 대해 원하는 설정을 지정하고 확인을 클릭하여 적용합니다.
이 도구는 LSI 도구가 데이터에서 도출하는 주제 목록을 제공합니다. 결과의 품질을 신속하게 해석하기 위해 도구는 고유값과 누적 변동성 백분율을 통해 주제의 중요성을 측정하는 스크리 플롯을 생성합니다. 용어 간, 문서 간의 관계를 시각화하는 기능도 있습니다.
LSI Graph 는 그 자체로 표현되는 훌륭한 의미론적 키워드 도구입니다. 하루에 10번의 검색을 무료로 수행할 수 있습니다. 웹사이트에 가서 시드 키워드를 붙여넣으면 가장 유망한 키워드 문구를 선택하는 데 도움이 되는 SEO 통계와 함께 LSI 키워드 목록을 얻을 수 있습니다. 결과를 통해 더 많은 주제나 기능으로 콘텐츠를 풍부하게 만들 수 있는 다양한 아이디어가 나올 것입니다.
LSI Graph에서는 키워드에 대한 검색량, 클릭당 비용, 시간 경과에 따른 추세를 확인할 수 있습니다. LSIGraph는 LSV(Latent Semantic Value)라는 자체 독점 측정을 사용하여 LSI 키워드 검색을 수행합니다. 오른쪽 작업 공간에는 빠르게 확인할 수 있는 활성 링크가 포함된 최고 성능의 콘텐츠가 표시됩니다.
LSI Graph는 대량 키워드 관리 및 Semantic Writer 도구를 포함한 프리미엄 기능도 제공합니다. 이 도구를 사용하면 앱 내 콘텐츠를 최적화하고, LSI 키워드를 생성하고, 콘텐츠 옆에서 이를 확인하고, 단어 수, 키워드 밀도 등을 측정할 수 있습니다. 실제로 Semantic Writer는 연구에 특별히 중점을 두고 SEO 카피라이터에게 도움의 손길을 제공합니다. LSI 키워드.
Keysearch 는 콘텐츠에 대한 LSI 키워드를 검색할 수 있는 또 다른 무료 도구입니다. 도구 뒤에 있는 키워드 찾기 알고리즘은 주요 키워드에 대한 Google 검색 결과의 첫 번째 페이지를 거치며 순위 페이지의 모든 항목을 분석하여 가장 자주 사용되는 단어와 문구를 찾습니다.
다시 말하지만, 검색 동향, CPC 비용, 심지어 해당 키워드에 대한 SERP의 도메인 순위 강도와 같은 모든 키워드 연구 통계를 해당 링크, 유기적 트래픽 및 소셜 미디어 인기도와 함께 얻을 수 있습니다.
Keysearch는 심층 분석 기능 알고리즘을 사용하는 Content Assistant 도구를 제공합니다. LSI 키워드 찾기에 또 다른 수준을 추가합니다. 이 도구에는 Google의 관련 검색어와 Google의 첫 번째 결과에 대한 상위 키워드가 포함되어 있습니다. 이렇게 하면 웹사이트에 가장 유기적인 트래픽을 유도하는 최고의 페이지에서 가장 수익성이 높은 핵심 용어를 찾을 수 있습니다.
따라서 Keysearch는 검색을 위한 키워드 도구의 기능과 SERP 분석을 기반으로 콘텐츠를 생성하는 데 도움이 되는 콘텐츠 작성 도구를 결합합니다. 이는 LSI 키워드를 생성하여 상위 결과, Google 관련 검색어, 질문 상자에서 자동 분석하여 가져온 콘텐츠에 추가할 수 있는 간단하고 쉬운 방법입니다.
Content Editor는 사이트 크롤러와 콘텐츠 최적화 앱의 기능을 하나로 결합한 SEO PowerSuite 소프트웨어의 도구인 WebSite Auditor의 일부입니다. 콘텐츠 생성을 위해 WebSite Auditor에는 개별 페이지를 감사하는 별도의 모듈과 앱 내 페이지를 최적화하는 스마트 쓰기 보조 도구가 있습니다.
LSI 키워드를 찾으려면 WebSite Auditor를 실행하고 페이지 감사 > 콘텐츠 편집기 모듈로 이동하세요. + 버튼을 눌러 최적화할 페이지(기존 페이지 또는 새 페이지)의 URL을 추가한 다음 해당 페이지에 대한 타겟 키워드를 추가하세요.
콘텐츠 편집기 도구는 최상위 페이지의 SERP를 분석하고 페이지 최적화 팁을 제공합니다.
기본 창에는 콘텐츠를 생성하고 최적화 점수가 향상되는 앱 내 오른쪽을 확인할 수 있는 편집 공간이 있습니다.
또는 콘텐츠 작성자의 경우 권장 사항을 PDF 파일로 내보내어 다른 작성 도구에서 사용할 수 있도록 넘겨주는 옵션이 있습니다.
키워드 수 필드는 편집 가능합니다. 페이지의 기존 키워드 빈도를 확인하고 더 많거나 적은 키워드를 사용하여 이를 개선하는 방법을 확인할 수 있습니다. 이 필드를 수동으로 편집할 수 있습니다. 또한 수동으로 LSI 키워드를 더 추가할 수도 있습니다.
WebSite Auditor에는 '용어 빈도 - 역 문서 빈도' 를 나타내는 특별한 TF-IDF 도구가 있습니다. TF-IDF는 키워드 문구를 대규모 문서 세트의 용어 빈도와 비교하여 키워드 문구의 중요성을 측정합니다. 기본적으로 이 컨텐츠 분석 기술은 SVD가 적용되기 전의 LSI와 동일한 단계를 따릅니다. LSI는 텍스트 모음에서 어떤 문서에 어떤 주제가 공통적인지 알아내는 반면, TF-IDF는 단순히 해당 용어에 가중치를 둡니다.
Content Editor의 TF-IDF 도구의 장점은 명확하게 시각화된 그래프로 단어 사용을 표시한다는 것입니다. 경쟁업체 페이지의 평균 키워드 수를 표시하고 귀하의 페이지에서 사용해야 하는 키워드 수를 계산합니다. 빠른 제안 도구는 새 키워드를 추가하거나 일부 키워드를 적게 사용하여 키워드 반복을 방지할 것을 권장합니다.
콘텐츠 편집기는 최고의 경쟁업체 콘텐츠에서 가져와 TF-IDF 매개변수로 필터링하여 콘텐츠에 사용할 권장 키워드 수를 제공합니다. 경쟁사 목록을 풀고 대상 키워드에 대한 자연 검색을 통해 페이지가 얻은 트래픽과 함께 URL을 볼 수 있습니다. 도구에서 바로 페이지의 일반 텍스트 버전을 미리 보거나 도구의 빠른 링크를 통해 사이트로 이동할 수 있습니다.
콘텐츠 분석이 완료되면 이 도구는 Google SERP( '사람들이 묻는 질문' 섹션)에서 바로 가져온 콘텐츠에서 숙지해야 할 주제와 질문을 제안합니다. 이는 더 많은 주제 아이디어를 떠올리고 주요 주제를 더 깊이있게 다루는 데 도움이 됩니다.
새로운 콘텐츠를 계속 추가하면 전체 단어 수에 대한 각 키워드의 가중치가 변경됩니다. 특별한 단어 클라우드 위젯은 콘텐츠에서 키워드의 중요성을 보여줍니다.
관련 단어나 문구를 언급하면 순위가 올라갈 수 있나요? 정확하게는 효과가 보장되지 않습니다. 콘텐츠에 관련 키워드를 추가하고 주제를 확장하면 더 깊이 있게 다룰 수 있습니다. 그 동안 페이지에 더 많은 키워드가 표시되고 타겟 키워드는 향상된 컨텍스트를 통해 지원됩니다. 검색 알고리즘은 귀하의 페이지가 목표로 하는 몇 가지 추가 검색어를 드러낼 수 있습니다. 이는 귀하의 사이트에 더 관련성이 높은 유기적 트래픽을 유도하고 전반적인 온라인 가시성에 기여합니다. 하지만 페이지 최적화에 가장 적합한 추가 키워드는 무엇입니까?
오늘날 검색 엔진이 LSI를 사용하는지 여부에 관계없이 LSI 키워드의 개념은 SEO에서 콘텐츠 생성을 지원하는 데 사용됩니다. LSI 키워드의 역할을 이해하면 LSI 키워드를 키워드 전략의 일부로 효과적으로 만들 수 있습니다. Google 알고리즘은 콘텐츠가 가장 중요한 수백 가지 순위 요소를 사용한다는 점을 명심하세요.
어떤 키워드 찾기 도구나 기술을 적용하든 고품질 콘텐츠를 만드는 데 집중하세요. 훌륭한 콘텐츠가 사용자 투표를 받고 검색 엔진에서 이를 볼 수 있으므로 오랫동안 읽는 것의 가치를 의심하지 마십시오.