디지털타임스

 


LG CNS, 서울시민 생활패턴 `합성데이터` 구축·공개…"차별적 고객경험 제공"

프린트 페이스북 트위터 카카오스토리
LG CNS가 서울시민 생활 특성을 담은 가상의 '합성데이터(재현데이터)'를 성공적으로 생성해 본격적으로 서비스를 제공한다.

LG CNS는 '서울시민 라이프스타일 재현데이터'를 구축해 서울시 오픈플랫폼인 빅데이터캠퍼스를 통해 선보였다고 23일 밝혔다. 이로써 전날(22일) 서울시는 382만 서울시민 가구(약 740만명)의 주거·소비·금융 패턴 등에 대한 빅데이터 분석이 가능한 합성데이터를 지자체 중 최초로 개발·공개했다. 서울시 빅데이터캠퍼스 홈페이지에 이용 신청하면 시민 누구나 본원과 8개 분원을 방문해 활용 가능하다.

'서울시민 라이프스타일 재현데이터'는 가명처리된 74만명의 샘플데이터를 기반으로 약 740만명 분량으로 확대 재현한 합성데이터다. LG CNS는 주민등록자료, 건축물대장, 민간 3사(신용정보사·카드사·통신사) 정보로 제작된 가명정보를 결합해 이를 생성했다. 데이터 분야 전문성을 바탕으로 원본데이터의 통계적 특성을 유지하면서도 개인 식별 위험이 없도록 안전성을 확보함으로써 활용가치가 유지된 합성데이터를 공개했다는 게 회사의 설명이다.

'서울시민 라이프스타일 재현데이터'는 범주형 데이터와 수치형 데이터가 공존하는 정형데이터로, 유관기관들의 정책연구 사전설계나 시민들의 데이터 분석 실습 등에 자유롭게 활용 가능하다. △성별 △생년월일 △직업 △추정연소득 △자산금액 △대출잔액 등 약 65개 변수로 이뤄진 '서울시민 금융현황'과 '서울시민 소비 및 이동 패턴' 등 두 가지 주제의 데이터세트로 제공된다.

서울시가 이를 활용해 분석한 결과 서울시민 가구당 평균 총자산은 9억5361만원, 대출은 평균 9210만원, 연평균소득은 7369만원으로 나타났다. 대출이 있는 1인가구 약 62만 중 23.2%, 다인가구 약 140만 중 13.3%가 부채상환위험(DTI 300% 이상)이 큰 것으로 분석됐다. 연령대별로는 1인·다인가구 모두 청년(40세 미만)이 각각 27%, 21.4%로 위험률이 가장 높았다. 이밖에도 소비의 절반가량을 청년 1인 가구는 '전자상거래'와 '요식(식당)'에, 노년 1인 가구는 '소형유통점'과 '의료'에 할애하는 것으로 파악됐다.

LG CNS, 서울시민 생활패턴 `합성데이터` 구축·공개…"차별적 고객경험 제공"
서울시의 '서울시민 라이프스타일 재현데이터' 분석 결과. 서울시 제공

LG CNS는 그동안 축적해온 빅데이터·AI(인공지능) 기술력을 바탕으로 이런 유스케이스(활용사례) 설계부터 정교한 데이터 샘플링, 합성데이터 생성 모델 개발, 전·후처리 과정 등을 통해 대규모 고품질 합성데이터를 생성했다. 회사는 2022년 7월 개인정보보호위원회로부터 '결합전문기관'으로 지정돼 가명정보 결합 관련 컨설팅과 분석 및 데이터 중개를 아우르는 '가명 데이터결합분석 통합 서비스' 사업을 본격화했다.

카드·은행·신용평가·통신·유통·모빌리티·빅테크 등 다양한 분야 파트너들과 유스케이스를 확보하며 합성데이터 관련 전문성을 높였다. 지난해 7월 금융위원회로부터 '데이터전문기관'으로도 지정돼 금융·비금융을 망라하게 됐다. 앞서 2021년 9월 획득한 '마이데이터 사업자' 자격까지 정부에서 인증하는 데이터 전문기업 3종을 IT업계에서 유일하게 모두 갖췄다고 LG CNS는 강조했다.

황윤희 LG CNS 데이터허브&플랫폼사업담당 상무는 "앞으로 모든 분야에서 개인정보 보호와 데이터 활용에 대한 중요성이 더욱 커질 것"이라며 "고객들이 LG CNS의 가명정보 결합 및 합성데이터 역량을 통해 새로운 비즈니스 인사이트와 기회를 얻을 수 있도록 서비스를 확대할 계획으로, 이를 통해 차별적 고객경험을 제공하겠다"고 말했다.

한편 서울시는 '서울시민 라이프스타일 재현데이터'를 통해 그동안 특정 목적 외에는 활용이 불가하고 접근이 제한됐던 가명결합데이터의 한계를 넘어 가상의 합성데이터로 개인정보 유출위험 없이 더 넓은 범위의 정책연구와 활용이 가능하게 됐다고 설명했다. 특히 통계청의 가계금융복지조사 등 민감한 조사항목을 다루는 통계를 보완해 정밀한 금융 상태 분석에 도움을 줄 것으로 기대하고 있다.

윤충식 서울시 빅데이터담당관은 "1년여의 준비 끝에 개발한 서울시민 라이프스타일 재현데이터는 개인정보 보호와 데이터 활용 사이 균형을 찾는 새로운 시도"라며 "데이터를 정기적으로 업데이트해 시민들에게 최신정보를 제공하고 데이터가 다양한 분야에서 활용돼 서울시민의 삶의 질을 개선하는 데 도움을 주겠다"고 전했다.팽동현기자 dhp@dt.co.kr


[ 저작권자 ⓒ디지털타임스, 무단 전재 및 재배포 금지 ]