목록검색사이트 (2)
Saltern of Knowledge
최근 포털사이트와 관련된 가장 큰 이슈는 네이트의 검색점유율이 쭉쭉 올라가고 있다는 것이죠. 이제는 네이트의 통합검색 점유율이 10%를 돌파했다고 하는군요. 통합검색점유율의 변화수치를 보면 5.7% (10/12) → 6.08% (10/26) → 7.04% (11/9) → 9.81% (11/23) → 10.23% (12/7) 로 명백하게 상승하고 있는 것을 확인할 수 있습니다. 다만 이 수치에서 감안할 것은 프로모션이라는 노이즈입니다. 네이트에서 2009년 11월 30일부터 12월 13일까지 진행하는 시맨틱 검색 이벤트로 인한 인위적인 요소가 저 상승 수치에 들어가 있을 수 있죠. 검색사이트들이 주기적으로 검색 관련 이벤트를 진행하고, 그 이벤트는 대부분 검색 쿼리를 일으키는 방식으로 기획되어 있고, 참여..

검색엔진이 크롤링하는 데이터에 대해서 성인용 컨텐츠인지 아닌지의 판단은 누구의 몫일까요? 인터넷에 올라오는 각종 데이터들. 태생은 누군가 사람이 생산하는 것이겠지만, 데이터화가 되고 나면 그저 0과 1로 이루어진 것 이상은 아닐 겁니다. 그리고 그 0과 1에 대해서 성인용 컨텐츠, 속칭 음란물인지 아닌지는 구분할 수 없는 게 사실이죠. 텍스트의 경우는 특정 단어로 필터링을 하는 자동화 정도가 있지만, 결국 그 특정 단어도 누군가인 사람이 등록을 해야 하는 것이니 말이 자동화일 뿐 사람의 판단으로 음란물이다 아니다를 결정하는 것이겠죠. 또 다른 예로 영상의 경우는 속칭 살색 (이 단어가 인종차별적 단어라는 건 알지만요...)이 어느정도의 비율로 들어가 있다 아니다를 가지고 음란물을 판단한다고 하지만, 개인..