태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

 

  쇼너짱의
         Warm IT up !!  

 

*쇼너짱은 누규?
검색 
분류 전체보기 (229)
Shoner Life (31)
Data Mining (1)
Media와 IT (68)
모바일퓨처리스트 (7)
Mobile (12)
UX공부&경험 (3)
MS Windows (7)
실버라이트와닷넷 (8)
Python&Django (2)
정보검색&시각화 (15)
에너지와 환경 (3)
멋진 장면,글,노래 (9)
쇼너짱 me2DAY (56)
Project P (0)
Vehicle (7)
MS  me2sms  실버라이트  me2mms  show  MSP  me2photo  ucc  KTF  휴대폰 
 매출은 쑥쑥..
└>Salesforce.com
 F1 지원 1천억..
└>dream reader
 갈비김치찌개..
└>맛多? 맞다!
 쇼너짱의 생각
└>shoner's me2DAY
 JIXmall :: ajax
└>JIXmall.com
«   2010/08   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        
+ 6 Fingers
+ ai-times
+ Blogom
+ DJ SUNGWOO
+ Eluard's Play..
+ happysphere
+ Mook
+ OutSider
+ The Dynamo Of..
+ ♡♡♡♡♡
+ 꿈꾸는아이,..
+ 루카쨩
+ 멜로디언님의..
+ 밥알양(no-name)
+ 소명
+ 이야기#2
+ 작은아이!
+ 절대미녀 누님
+ 지에고의 게임..
+ 크림치즈베이글
+ Total : 249,062
+ Today : 17
+ Yesterday : 113
  

MSP Banner
Channel 8
Silverlight
DreamSpark
xna Team
미투데이
믹시

 

 

 

+   [정보검색&시각화]   |  2009/10/22 20:24  


블로그 상에서 무언가를 검색했을 때, 검색 결과 상단에 무엇이 나와야 할 것인가?
그건 당연히  신뢰성 있는, 권위있는, 인기있는 블로그 일 것이다.
그럼 이러한 블로그 랭킹은 어떻게 매길 수 있을까? 누가, 무엇을 근거로 순위를 만들 수 있을까?




일단 일반적인 웹 검색 엔진 이야기 부터 해보자.
원래 구글 검색 엔진에서 처음 사용된 PageRank의 기본 모토가
인터넷에 널리 수 많은, 정말 너무나도 많은 웹페이지 중에서 중요한 웹페이지는 무엇일까,
어느 것이 더 신뢰성이 있을까 하는 고민을 하게 된 와중에 생겨난 것인데,
구글 이전의 검색 엔진들은 웹페이지 자체의 정보(이를테면 페이지에 검색어가 얼마마 많이 나오냐, 또는 해당 사이트에 관련 페이지가 많냐, 아니면, 페이지가 내용이 방대하냐 등등)만을 이용했었다.
그러다보니 정작 사용자 대부분이 기대하는 페이지는 검색 결과의 수백 페이지 중에서 직접 찾아봐야 했다.

하지만 구글이 들고 나온 검색 기술은 달랐다. 획기적이었다.
사용자가 원하는 페이지를 검색 결과의 첫 페이지(상위 10개의 웹페이지)에서 바로 찾을 수 있게 한 것이다.
지금은 당연하게 여기는 이 것(구글링)이, 10년전에야 인터넷에서 시작이 된 것이다.

Chicago Mayor Daley Announces Initiative With Google


그런데 이러한 구글 검색의 비밀은 PageRank 알고리즘에 있다.

인터넷 상에서 어떠한 웹페이지 또는 웹사이트의 중요도나 신뢰성(또는 인기?)을 판단하기 위해서는
해당 페이지만 가지고는 판단할 수가 없으며, 해당 페이지의 인기도는 해당 페이지를 참조하는 다른 여타 수많은 페이지의 양이 얼마나 많은지에 달려있다는 것이 이 이론의 핵심.

또한 이왕이면, 인기도가 높은(다르게 말하면 PageRank가 높은) 페이지가 참조하는 페이지일 수록 더욱도 인기도가 올라가게 되는 것.

즉, 웹페이지 간의 링크(참조)를 웹페이간의 추천,투표,평가 요소로 사용한 것이다.

이후에 대부분의 웹 검색 엔진은 구글의 PageRank를 따라가게 되었다고 한다.



그럼, 블로그 검색도 구글의 PageRank를 이용하면 된다?
하지만 문제는 그렇게 간단하지가 않다.
우선 블로그는 일반 웹사이트와 그 특성에 차이가 있다.
일반 웹사이트에서 다루는 내용과 블로그에서 다루는 내용의 형식에도 차이가 있으며,
(일반 웹사이트에 비해 블로그는 좀 더 개인적이다. 1인 미디어의 성격이 강하다. 개인의 취향이나 생각이 더 강하다.
일반웹사이트에서 "소녀시대"을 검색하면, 소녀시대 공식 홈피, 팬사이트가 상위에 나오는게 당연할 것이다.



하지만 블로그에서 똑같은 키워드로 검색했을 때, 무엇이 상위에 나와야할까?
소녀시대가 직접 운영하는 블로그가 있다면 그것? 아니면 소녀시대 사진이나 글이 많은 어떤 열혈 팬의 블로그?)
블로그에는 댓글이나 트랙백의 활발한 행동에 의해 생기는 블로그와 네티즌간의 활발한 작용이 존재하지만, 블로그 글 안에 직접 인용,참조되는 링크들은 그 수가 상대적으로 매우 적을 것이다.
그리고 블로그 글들 중에는 그때 그때 트렌드에 맞춰서 생산된 글들도 많을 것이고, 또 어떤 사람의 블로그는 이와 상관없이 자기 관심 분야의 전문적인 내용을 장황히 서술해낸 글들도 올라올 것이다.

생각해볼 수록 더욱더 어렵다. 블로그간의 랭킹을 매긴다는 것이....
(최근 국내에서도 몇몇 사이트에서 자체적으로 블로그 랭킹을 매기고 있는데,
문제는 이것이 각 사이트의 심사(랭킹) 기준에 따라 많이 달라지기도 한다는 것이다.)


하지만 요즘 블로그의 파워가 무시하지 못할 정도로 강력한 미디어로 떠오르면서,
또한 아주 좋은 입소문 마케팅의 장소로 활용이 되면서,
블로그안에서 무엇인가를 찾고(검색하고), 블로그의 랭킹을 매기고 하는 것은 꼭 필요한 것들 중의 하나가 되었다.
그런데 정작 아직은 우리가 웹에서 접할 수 있는 "블로그 검색"들의 성능은 그리 썩 마음에 들지 못한다.
구글도 블로그검색은 아직 베타판, 즉 자랑스럽게 성능을 얘기하지 못하는 상황이다.
국내 주요 포탈사이트의 검색이나 메타블로그 사이트의 검색도 말할 것도 없다.
(물론 조금씩 조금씩이지만, 끊임없이 그 성능은 나아지고 있다.)


그리고 기존의 블로그 검색이 블로그 자체의 신뢰성이나 인기, 즉 블로그 자체의 랭킹에 치중하여,
검색 결과를 보여주는 것 까진 좋은데, 문제는 또 있다.

어떤 인기있는 블로그 A가 있다고 치자.
이 블로그 A는 평소 글 한번 올리면, 며칠 사이에 그 글 하나에 수백명이 댓글을 단다.
그리고 트랙백도 수십게 달린다.
그럼 A에 있는 글은 뭐든지 다, 검색 결과 상위에 나와야 할까?
A를 운영하는 블로거는 모든 분야, 모든 토픽에 대하여 대표성이 있을까? 전문성이 있을까?

검색어에 대한 연관성을 블로그의 인기+ 검색어의 빈도수 정도로만 판단하기엔 뭔가 부족하다.

또한 블로그에서 무언가를 찾기 위해 검색을 한다면, 해당 검색어에 대해서 사람들이 많은 의견을 단 글을 찾을 수도 있다. 하지만 블로그에는 의견이 오가는 것만이 중요한 것이 아니다. 블로그에도 정보 전달이라는 것이 있으며,
이 것은 설사 해당 글에 댓글이 많이 달리지 않는다 하여도, 그 내용 자체가 충분히 양질의 글이 될 수도 있다.



Australian Twitter Craze Gains Momentum

ps.
아, 그리고 새로운 문제 하나 더. 기존에 블로그를 중요시 여긴 마케팅 담당자들은, 블로그를 통해 네티즌들의 취향이나 트렌드, 또는 어떠한 이슈의 흐름과 파장 등등을 탐색해 오고 활용했을 것이다.
하지만 블로그의 이러한 기능은 지금 "트위터"나 "미투데이"처럼, 좀더 빈번하게 의견들이 오고가는 "마이크로 블로그(또는 스몰토크)에 그 자리를 내줘야할 처지까지 오게 되었다. 때문에 MS의 bing 검색인 트위터 실시간 검색에 공을 들이고 있고(http://www.bing.com/community/blogs/search/archive/2009/10/21/bing-is-bringing-twitter-search-to-you.aspx?WT.mc_id=Twiiter_BingTwittersearch), 구글도 트위터 실시간 오픈을 앞두고 있다.(http://googlekoreablog.blogspot.com/2009/10/blog-post_22.html)


그럼에도 불구하고, 블로그 검색은 여전히 흥미로운 분야이다. 왜냐하면 블로고스피어(Blogosphere)로 불리는 블로그 세상이 뿜어내는 효과는 여전히 막강하다. 아직 국내에서도 더욱 더 발전해 나갈 수 있으며(물론 앞으로 해결해야 할 문제들도 많다는 뜻), 해외에서, 아직 인터넷이 보급되지 않은 나라까지 다함께 블로깅할 수 있는 그런 날이 오게 되면 더욱더 블로그는 전세계인의 중요한 미디어 중의 하나가 될것임은 분명하다.

그럼 블로그 검색 시스템에는 어떤 것이 있으며, 어떤식으로 블로그 랭킹을 매기는 지 궁금한데,
실제 검색 사이트의 엔진은 자세히 알길이 없으니, 일단 발표된 논문들을 통해서 알아보고자 한다. +_+



다음 글 : 준비중 ^^
저작자 표시 비영리 동일 조건 변경 허락

 
     , , , , , , , ,
     0   0
이 글의 관련글(트랙백) 주소 ::    http://shoner.pe.kr/trackback/267 관련글 쓰기
<<이전 | 1 ... | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 ... | 229 | 다음>>