목록자동화 (1)
Saltern of Knowledge

검색엔진이 크롤링하는 데이터에 대해서 성인용 컨텐츠인지 아닌지의 판단은 누구의 몫일까요? 인터넷에 올라오는 각종 데이터들. 태생은 누군가 사람이 생산하는 것이겠지만, 데이터화가 되고 나면 그저 0과 1로 이루어진 것 이상은 아닐 겁니다. 그리고 그 0과 1에 대해서 성인용 컨텐츠, 속칭 음란물인지 아닌지는 구분할 수 없는 게 사실이죠. 텍스트의 경우는 특정 단어로 필터링을 하는 자동화 정도가 있지만, 결국 그 특정 단어도 누군가인 사람이 등록을 해야 하는 것이니 말이 자동화일 뿐 사람의 판단으로 음란물이다 아니다를 결정하는 것이겠죠. 또 다른 예로 영상의 경우는 속칭 살색 (이 단어가 인종차별적 단어라는 건 알지만요...)이 어느정도의 비율로 들어가 있다 아니다를 가지고 음란물을 판단한다고 하지만, 개인..
서비스 다시보기
2008. 1. 22. 15:51