[알아봅시다] 인터넷과 SNS 상 유해한 콘텐츠 걸러주는 `콘텐츠 필터`

성인·폭력물·광고 등 유해정보 알고리즘 만들어 구분
정확한 분석 통해 '자동분류'

  • 프린트
  • 페이스북
  • 트위터
  • 카카오스토리


[알아봅시다] 인터넷과 SNS 상 유해한 콘텐츠 걸러주는 `콘텐츠 필터`


인터넷은 그동안 알기 어려웠던 정보를 쉽게 찾고 활용할 수 있지만, 반대로 보기 싫은 정보나 유해한 정보도 봐야 하는 문제를 만들고 있습니다. 특히, 성인물이나 폭력물, 광고 등의 노출은 정부에서 꾸준히 단속을 하고 있지만, 콘텐츠 제작과 유통이 실시간으로 이뤄지는 인터넷 환경에서 이를 제한하는 것이 쉽지 않습니다. 최근에는 스마트폰 메신저 등을 통해 유통되는 콘텐츠는 관리 자체가 불가능에 가깝고, 소셜네트워크서비스(SNS)는 콘텐츠를 구독자들에게 자동으로 보여주는 형태이기 때문에 이런 유해한 광고에 무방비로 노출될 수 밖에 없습니다.

이에 유해한 콘텐츠나 유해하다고 짐작되는 콘텐츠를 자동으로 분류하는 '콘텐츠 필터(Contents Filter)' 부문의 역할이 중요해지고 있습니다.

콘텐츠 필터는 많은 양의 데이터를 처리하고 특정 기준에 해당하는 콘텐츠에 대해 조치를 취하기 위해 설치된 자동 시스템을 말합니다. 게시자는 텍스트 및 미디어 필터링 솔루션을 사용해 사이트에서 사용자 제작 콘텐츠를 처리합니다. 이러한 시스템은 주로 성인용 콘텐츠와 불법 파일 공유 사이트, 그리고 총기, 약물, 주류, 담배 판매를 걸러내는 데 사용됩니다.

콘텐츠 필터는 콘텐츠에 포함된 단어나 이미지, 동영상의 특성을 분석해 유해할 가능성이 있는 콘텐츠는 제한할 수 있습니다. 유해콘텐츠로 분류되면 제작자의 요청 또는 콘텐츠 유통사의 분류에 따라 유해한 콘텐츠인지 아닌지를 최종 구분하게 됩니다.

이전까지는 콘텐츠를 검수하는 사람이 있어서 직접 확인해야 했지만, 이제는 유해한 콘텐츠일 수 있는 특성을 알고리즘으로 만들어 구분하고, 해당 정보를 대상으로 정확한 분석을 하게 됩니다.

콘텐츠 필터는 각 콘텐츠 사업자가 자체적으로 만들거나, 전문업체들이 제공하고 있습니다. 성인용 콘텐츠나 저작권이 있는 콘텐츠와 같은 특정 유형을 필터링하는 전문 서비스도 있습니다.

문자 기반 콘텐츠의 경우 문제가 될 수 있는 단어나 문장을 걸러낼 수 있어 구현이 그렇게 어렵지 않습니다. 하지만 이같은 콘텐츠 필터를 피하기 위해 제작된 콘텐츠나 이미지, 동영상 콘텐츠 경우에는 복잡한 알고리즘이 필요합니다. 동영상 게시물 같은 경우 동영상에 포함된 배경 음악, 등장인물 등도 저작권의 문제가 될 수 있기 때문에 콘텐츠 필터가 필요합니다.

유튜브는 사용자가 제작한 콘텐츠를 등록할 때, 해당 영상에 포함된 음악을 자체 데이터베이스와 비교해 저작권을 침해했다고 판단되면 소리는 제외하고 등록할 수 있도록 하고 있습니다.

최근에는 SNS 관련해서 고도화된 콘텐츠 필터가 확대되고 있습니다. 일본 NTT는 기계 학습 기술 '딥러닝(Deep Learning)'을 활용해 대상 이미지를 수치화해 부적절한 콘텐츠를 거를 수 있는 기술을 공개했습니다. 딥러닝은 보통 개나 고양이 등과 같은 이미지를 구분하는데 100만장 정도 이미지가 필요한데, NTT는 1만장 정도 사진을 학습시켜 콘텐츠 필터에 활용할 수 있다고 설명했습니다.

NTT는 여성이 수영복을 입은 같은 사진이라도 여행안내 책자에 포함된 사진과 성인물에 사용된 사진을 구분할 수 있을 정도로 설정이 가능하다고 밝히고 있습니다. 또, 영상물 등급에 따라 어린이, 청소년, 성인 등 단계에 따라 분류하는 것도 가능하다고 설명하고 있습니다.

도쿄대가 개발한 콘텐츠 필터는 문자와 이미지의 속성을 구분할 수 있는 기술로 어도비 디지털마케팅 솔루션에 사용되고 있습니다. 이 콘텐츠 필터 기술은 광고주가 광고를 내보낼 때 해당 서비스의 광고정책에 반해 중단될 위험을 줄여주는 역할을 합니다. 콘텐츠 필터를 통해 수익성이 감소되는 위험을 방지하는데 사용하는 것입니다.

구글과 마이크로소프트, 네이버 등은 자체적으로 콘텐츠 필터 기준을 마련해 적용하고 있습니다. 마이크로소프트는 검색 엔진 '빙(Bing)'에 어린이 대상 콘텐츠 필터 '안전 환경(Safe Prerference)'을 새로 적용했습니다. 이 기능을 사용하면, 특정 웹사이트와 서비스는 해당 브라우저에서 어린이에게 안전하다고 분류된 콘텐츠만 표시합니다. 이 기능을 사용하려면 윈도에서 가족보호 기능을 설정해야 합니다.

대부분 웹브라우저는 자체적에서 콘텐츠 필터를 제공하고 있습니다. MS 익스플로러, 구글 크롬, 애플 사파리 브라우저의 설정 기능을 사용하면 콘텐츠 필터를 단계적으로 사용할 수 있습니다.

최근 콘텐츠 필터 기술은 지역별로 콘텐츠를 제한하는데도 사용됩니다. 최근 웹서비스는 전세계적으로 제공되고 있기 때문에 해당 국가의 법규에 맞춰 콘텐츠를 제한해 제공하는 것입니다. 이 경우 해당 계정의 접속위치가 기준이 되고 있습니다. 빅데이터와 사물인터넷 시대에는 콘텐츠 필터 기술이 더 고도화되고 다양한 분야에 활용될 것으로 예상됩니다.

이형근 기자 bass007@dt.co.kr
▶이형근기자의 블로그 바로가기




[저작권자 ⓒ디지털타임스 무단 전재-재배포 금지]


가장 많이 본 기사