KT가 인공지능(AI)을 이용해 보이스피싱 사기범의 실제 목소리와 AI로 변조된 음성까지 실시간으로 잡아내는 서비스를 국내 최초로 상용화한다고 29일 밝혔다.

KT는 오는 7월 30일부터 기존 문자나 통화 맥락 기반의 탐지를 넘어 ‘화자인식’과 ‘딥보이스 탐지’ 기능을 통합한 ‘AI 보이스피싱 탐지서비스 2.0’을 선보인다.

날로 지능화하는 보이스피싱 범죄에 대응하기 위해 통신사가 기술적 방어 수위를 최고 수준으로 끌어올린 것으로 풀이된다.

이번 기술 고도화의 핵심은 두 가지다. 첫째는 국립과학수사연구원의 실제 범죄자 음성 데이터 일명 ‘그놈목소리’를 AI에 학습시켜 통화 중인 상대방이 사기범인지 목소리 자체로 식별하는 화자인식 기술이다. 이는 “검찰입니다” 같은 특정 단어를 감지하는 수준을 넘어 사기범의 성문 즉 목소리 지문을 직접 대조하는 방식으로 탐지 정확도를 획기적으로 높였다.

둘째는 자녀나 지인의 목소리를 AI로 위조해 돈을 요구하는 신종 사기에 대응하기 위한 딥보이스 탐지 기술이다. AI 음성합성 기술로 만들어진 변조 음성의 미세한 특징을 분석해 사람이 만든 목소리인지 AI가 만든 가짜 목소리인지 판별해낸다.

이러한 기술의 상용화는 KT 단독으로 이뤄낸 성과가 아니라는 점에서 더욱 의미가 깊다. 범죄자의 목소리라는 민감한 정보를 활용하기 위해 개인정보보호위원회의 엄격한 심사와 승인을 거쳤고 과학기술정보통신부의 규제샌드박스 실증특례 사업으로 지정돼 기술 개발의 물꼬를 텄다. 특히 국립과학수사연구원은 신뢰도 높은 데이터를 제공하기 위해 10개월간 ‘그놈목소리’ 데이터를 전수조사하고 정제하는 노력을 기울였다.

사진=KT
사진=KT

보이스피싱이라는 사회적 재난에 대응하기 위해 민관이 어떻게 협력해야 하는지에 대한 모범 사례를 제시한 셈이다.

KT는 여기서 그치지 않고 탐지 정보를 은행연합회 등 금융권의 이상거래탐지시스템(FDS)과 연계해 실질적인 피해 차단으로 이어지게 했다. 보이스피싱이 의심되는 통화가 감지되면 즉시 금융사에 정보가 공유돼 계좌 모니터링 강화나 지급정지 같은 후속 조치가 이뤄지는 선순환 구조를 구축한 것이다.

KT는 이미 기존 서비스를 통해 2025년 상반기에만 약 710억원의 피해를 예방했으며 이번 2.0 서비스로 연간 2000억원 이상의 피해 예방과 95% 이상의 탐지 정확도를 달성하겠다는 목표다.

KT Customer부문장 이현석 부사장은 “보이스피싱으로부터 국민을 더욱 강력히 보호하기 위한 화자인식 기반 AI 탐지서비스 상용화를 위해 아낌없는 협력을 해주신 개인정보보호위원회 과학기술정보통신부 그리고 국립과학수사연구원에 깊이 감사드린다”며 “이번 기술 상용화를 계기로 금융권과의 협업도 한층 강화해 고객 피해를 획기적으로 줄여 나가겠다”고 밝혔다.