티스토리 툴바


네이버 연관 검색어 원리? 웹페이지 분석, 단어 추출, 데이터 마이닝 기술이 필요함.

* 연관검색어의 의미? 연관검색어는 사용자가 특정 단어를 검색한 후 연이어 많이 검색한 검색어를 추출하여 제공하는 서비스로, 해당 검색분야에 확장 검색어를 제공하여, 찾으려는 정보에 더욱 쉽게 다가갈 수 있도록 도와주는 서비스입니다.

1. 확장 검색어 제공 : "꽃배달"을 검색 할 경우 "꽃배달 서비스"를 보여 주는 기술

2. 최신 이슈에 맞춰 꾸준히 변화하는 검색어 연관검색어 데이터는 고정적으로 추출되는 것이 아니라 꾸준히 변하게 됩니다. 시간의 흐름에 따라 데이터로 변화게 되어 최신 이슈를 바로바로 잡아줍니다.

* 사용자 그룹이란 무엇이고, 어떻게 정해지나요?

네이버의 검색어를 분석해 보면 사용자마다 특별히 많이 입력하는 주제가 있는데,
여기에 기계적인 로직을 적용해 사용자 검색어를 기반으로 몇 가지 그룹으로 묶고 
각 그룹 검색어 특성에 맞게  "싱글녀", "싱글남", "대학생" 등의 이름을 붙임으로써, 검색 사용자 그룹이 형성됩니다.


현재 서비스 가능한 사용자 그룹은 최대 7개 입니다. 
(싱글남, 싱글녀, 직장인, 재테크족, 주부, 대학생, 청소년) 
현재 보고 계신 사용자 그룹 이외의 다른 그룹의 검색어는 '다른그룹보기' 기능을 이용해서 확인하실 수 있습니다.


매일 발생하는 검색 기록을 기반으로 자동으로 업데이트가 이뤄지기 때문에, 
서비스되는 사용자 그룹들이 조금씩 변동될 수도 있습니다.


* 사용자 그룹별 인기검색어 선정 기준은 무엇입니까?

최근 기준 시간 내에 특정한 사용자 그룹에서 집중적으로 많이 검색한 상위 검색어를 선정합니다.


한 대의 PC나 하나의 IP에서 동일검색어를 연속적으로 입력하는 경우 
순위에 영향을 미치지 않도록 하는 로직을 기술적으로 구현하고 있습니다. 
또한 검색어 차트에 이미 노출되고 있는 검색어를 클릭한 경우도 검색 횟수로 집계되지 않습니다.


* 네이버 자동 완성이란?

검색어 자동완성 서비스는 사용자의 검색 편의를 위해 네이버 검색창에 입력되는 검색어의 유형을 분석하여 많은 수의 사용자가 자주 찾는 검색어로 자동 완성해주는 서비스입니다. 
한글의 입력 특성을 살려 사용자가 입력하는 단어를 포함하는 검색어를 좌측부터 자소 단위로 제공해 드립니다.


하이라이팅 기능을 사용하여 이용자가 입력한 단어와 정확히 같은 부분을 강조해 줍니다.

이와 같이 색깔이 입혀지므로 현재 어떤 단어를 입력한 상태인지, 무엇을 선택하면 되는지를 직관적으로 알 수 있습니다.


1) 추론
- 사용자들의 검색 패턴으로 분석하여 연관어를 추출한다. (데이터 마이닝)

2) 사용자들의 동작 패턴 분석 (데이터 마이닝)
사용자들의 검색 조건에 해당하는 웹페이지 상의 관련된 링크를 따라 갈 것이다.
이때 어떤 단어로 검색해서, 그 결과 페이지 중 어떤 페이지를 많이 방문하고, 그 페이지에서 다시 어떤 다른 페이지로 따라가느냐는 것을 나타낸다. 이 데이터를 모두 모아서 분석한 후, 사용자들이 클릭한 링크의 단어들을 이용해서 연관어를 제시합니다.

3) 웹 페이지 분석
- 웹 검색을 위해서는 모든 웹페이지에 대해서 어떤 단어들이 나오는지 분석합니다.
출현 횟수가 높은 단어들을 분석하여 이것들을 연관어로 제시할 수 있다.
또는, 특정 단어 조합이 웹페이지들에서 많이 나오는 걸 미리 분석해서 저장해놓고, 연관어로 제시할 수도 있다.

4) 전자 키워드와 후자 키워드와의 상관성만 발견 되면 된다.
- 데이터 마이닝에 기초한 것인데. 많은 데이터 가운데 숨겨져 있는 유용한 상관 관계를 발견하여 미래에 실행 가능한 정보를 추출해 내고 의사 결정에 이용하는 과정을 말한다. 데이터 베이스로 부터 과거에는 알지 못했지만 데이터 속에서 유도된.....

5) 검색창에 검색어를 입력한 후 연이어 많이 찾은 검색어를 로직에 의해 자동으로 제공하고 있다.
따라서, 임의로 삭제 할 수 없으며, 노출되는 검색어는 이용자들의 검색어 입력량과 패턴에 따라 수시로 변할 수 있다.

6) 네이버의 경우 매일 연관 검색어가 갱신된다. 매일 갱신 되려면 기본적으로 많은 쿼리가 일어나야 가능하기도 하겠지만... 신선하고 그때그때 가장 적절한 연관어를 보여준다는 장점을 가진다. 그리고 일반 유저가 특정 단어를 검색한 후 검색 쿼리를 추가로 발생 시킬수 있는 근거가 된다.
A를 검색한 수, B를 검색한 양이다. 본 쿼리의 쌍이 임계치수-수치를 넘어설때 연관성이 있다고 판단 반영 된다. 그리고 정확도의 반영이다. 웹사에 수많은 문서 문자열 등을 DB로 저장해 연관성 있는 단어를 인식하는 단계이다. 구글의 웹링크와 유사

형태소 분석, 데이터 베이스 분야의 데이터 마이닝, 대용량 데이터 처리 기술 등등...
웹 검색, 전산 분야의 기술들이 많이 접목 된 것이라고 생각 된다.

키워드 검색 광고
검색 광고의 출발은 키워드 입니다.

바이럴 마케팅 : 바이러스와 오랄의 합성어
키워드 광고에 비해서 바이럴 마케팅의 경우 비용면에서 장점이 있다.

바이러스 마케팅(virus marketing)은 네티즌들이 이메일이나 다른 전파 가능한 매체를 통해 자발적으로 어떤 기업이나 기업의 제품을 홍보할 수 있도록 제작하여 널리 퍼지는 마케팅 기법을 말한다. 컴퓨터 바이러스처럼 확산된다고 해서 이런 이름이 붙었다. 2000년 말부터 확산되면서 새로운 인터넷 광고 기법으로 주목받기 시작했는데, 기업이 직접 홍보를 하지 않고, 소비자의 이메일을 통해 입에서 입으로 전해지는 광고라는 점에서 기존의 광고와 다르다.
입소문 마케팅과 일맥 상통하지만 전파하는 방식이 다르다. 입소문 마케팅은 정보 제공자를 중심으로 메시지가 퍼져나가지만 바이러스 마케팅은 정보 수용자를 중심으로 퍼져나간다.
기업은 유행이나 풍조 등 현실의 흐름을 따라가면서 네티즌들의 입맛에 맞는 엽기적인 내용이나 재미있고 신선한 내용의 웹 애니메이션을 제작, 인터넷 사이트에 무료로 게재하면서 그 사이에 기업의 이름이나 제품을 슬쩍 끼워넣는 방식으로 간접광고를 하게 된다.
네티즌은 애니메이션 내용이 재미있으면, 이메일을 통해 다른 네티즌에게 전달하게 되고, 이러한 과정이 반복되다 보면 어느새 네티즌 사이에 화제가 됨으로써 자연적으로 마케팅이 이루어지는 것이다.
이 바이러스 마케팅은 웹 애니메이션 기술을 바탕으로 이루어지며, 파일 크기가 작아 거의 실시간으로 재생이 가능함은 물론, 관련 프로그램만 이용하면 누구나 쉽게 제작할 수 있고, 기존의 텔레비전이나 영화 등 필름을 이용한 광고보다 훨씬 저렴한 비용이 들기 때문에 빠른 속도로 확산되고 있다.
저작자 표시 비영리 변경 금지
Posted by 자바코어