여백
> IT
"AI와 알고리즘도 차별과 혐오에서 자유로울 수 없다"데이터의 함정 주의해야

[이코노믹리뷰=최진홍 기자] 기술의 발전으로 인공지능 등 다양한 기술을 통해 유연한 알고리즘을 적용, 복잡한 업무를 수행하는 사례가 많아지고 있다. 다만 이 과정에서 핵심 소재인 데이터가 오염되어 기술의 결과물이 왜곡되는 등 부작용도 발생해 눈길을 끈다.

   
▲ 인공지능 시대가 열리고 있다. 출처=갈무리

인공지능 만능시대

‘인사가 만사’라는 말이 있을 정도로 기업에 있어 인사평가는 핵심적인 영역이다. 그 연장선에서 최근 발전하기 시작한 인공지능이 기업의 인사관리 프로그램에 도입되는 장면에 집중할 필요가 있다. 이는 최첨단 인공지능 기술이 기업이 요구하는 최적의 인재를 발굴하는 작업을 성공적으로 수행할 수 있다는 믿음에 기인한다.

실제로 배관 및 공조 회사인 SPS는 직원들의 상대평가에 있어 인공지능이 핵심적인 역할을 수행하고 있으며 개발사인 얼티메이트 소프트웨어그룹(Ultimate Software Group)은 인공지능 샌더를 통해 임직원 평가 프로그램을 제공하는 중이다. 이 외에도 실리콘밸리의 많은 기업들은 인공지능 등 ICT 기술을 인가평가 시스템에서 효율적으로 가동하는 중이다.

인재 선발도 마찬가지다. 인재를 채용하는 일은 기업의 미래를 좌우할 정도로 중요하기 때문에 많은 기업들은 인공지능 등 다양한 기술을 속속 도입하는 분위기다.

국내 기업도 마찬가지다. 당장 KT의 음원 스트리밍 플랫폼인 지니뮤직은 지난 9월 대졸 신입사원 공개 채용을 단행하며 인공지능을 도입한 바 있다. ‘인공지능 인사 담당자’는 온라인 인적성 검사 방식에 투입되며 이 검사는 지원자가 지니뮤직이 제시한 특정 사이트에 접속해 질문에 답변하거나 전략 게임을 수행하는 방식으로 진행된다는 설명이다.

지니뮤직은 이 과정에서 입력된 지원자의 영상 정보와 음성 정보를 실시간으로 분석해 대면적 신뢰도를 측정한다. 면접 시 면접관의 성향이나 선입관으로 인해 발생할 수 있는 오류를 줄이고, 공정하고 객관적인 평가로 우수한 역량을 지닌 인재를 선발한다는 계획이다.

지니뮤직 박정수 경영기획실장은 “미래 성장의 원동력이 될 수 있는 우수한 인재를 확보하고 지니뮤직에 새로운 활력을 불어넣기 위해 창립 이래 처음으로 신입사원 공개 채용을 실시하게 됐다”며, “업계 최초로 도입하는 인공지능 인적성 검사를 통해 지원자의 인성과 직무적합성, 역량 등을 종합적으로 평가해 우수한 인재를 선발하겠다”고 밝혔다.

뻔한 자기소개서(자소서)를 걸러내는 인공지능도 있다. SK C&C는 지난해 매년 50여개 이상의 국내 주요 기업·기관의 채용대행 사업을 수행하는 스카우트와 협력해 인공지능 에이브릴을 활용한 'HR 자기소개서 분석 서비스 업무 제휴’를 체결했다고 밝혔다. 에이브릴과 인사담당자의 평가점수 오차범위는 15% 이내에 불과한 반면 평가 시간은 1인당 3초 이내다. 성과는 확실한 반면 효율성은 극대화시켰다는 설명이다.

   
▲ 지니뮤직 대졸 신입사원 공개채용에 인공지능이 개입한다. 출처=지니뮤직

믿을 수 있을까?

인공지능 인사 담당자가 업계의 관심을 끌고 있으나, 일각에서는 강한 회의감도 감지된다. 인공지능이 효율성과 정확성을 바탕으로 인사 담당자의 역할을 충실하게 수행하는 것은 사실이지만, 맹점도 크다는 반론이 나오고 있다.

아마존이 대표적이다. 아마존은 지난해 초 2014년부터 운영하던 인공지능 채용 프로그램을 전격 폐지했다. 컴퓨터 500개가 지원자의 이력서를 바탕으로 5만개의 키워드를 추출해 분석하는 방식을 자랑했으나, 편향된 데이터를 도출하며 문제가 발생했기 때문이다. 특히 로이터에 따르면 인공지능은 여성 지원자의 점수를 대폭 깎으며 논란을 일으켰다. 프로그램 및 개발자 직군에 남성 선호도가 높다는 ‘기존 데이터’가 여성 지원자들을 배제하는 알고리즘을 끌어냈기 때문이다.

이러한 데이터 오염에 따른 비합리적인 알고리즘은 기업의 인사채용 영역에서만 국한된 것이 아니다.

조이 부올람위니 미국 매사추세츠공대(MIT) 미디어랩 연구원은 지난해 초 기계학습연구학회에서 인공지능의 편향성을 정면으로 지적한 바 있다. 주요 테크기업의 인공지능 얼굴인식율을 조사한 결과 백인 남성의 경우 효율적인 인식에 성공했으나 흑인, 특히 흑인 여성의 경우 사실상 의미있는 분별력을 보여주지 못했다. 인공지능이 가동되는 데이터 자체가 주류인 백인남성을 중심으로 설정되었기 때문에 벌어진 일이다.

애플카드에도 비슷한 논란이 벌어지고 있다. 올해 초 애플은 골드만삭스와 함께 신용카드인 애플카드를 출시했으나, 남녀의 사용한도가 별다른 이유없이 크게 다르다는 점이 폭로되며 논란이 벌어지고 있다. 실제로 블룸버그 등 외신에 따르면 덴마크 프로그래머이자 기업가인 데이비드 하이네마이어 한손은 최근 트위터를 통해 자기와 아내의 애플카드 신용한도가 20배 차이난다고 밝혔다. 아내의 신용도가 더 높지만, 애플카드는 자기에게 20배나 많은 신용한도를 제공한다는 설명이다.

스티브 잡스와 함께 애플을 설립한 스티브 워즈니악도 비슷한 주장을 하며 논란은 더욱 커지고 있다. 남성의 신용한도가 여성의 신용한도를 기계적으로 압도한다는 점은 보기에 따라 명백한 성차별이기 때문이다. 애플은 이러한 우려에 ‘사실이 아니다’는 입장이지만, 최근 골드만삭스는 한손의 문제제기가 논란이 되자 아무런 설명없이 그의 아내 신용한도를 올려 또 다른 논란에 직면한 상태다.

애플카드의 신용한도 결정은 골드만삭스가 결정하지만, 관련 알고리즘은 애플이 제공하는 것으로 알려졌다.

   
▲ 애플카드가 보인다. 출처=뉴시스

기술도 혐오와 차별에서 자유로울 수 없다

올해 초 한 시민단체는 KT의 기가지니, SK텔레콤의 누구 등 인공지능 스피커를 두고 성차별적 인터페이스를 보여준다고 비판한 바 있다. 그들은 인공지능 비서가 모두 여성으로 구성된 상황에서 그릇된 남녀 성역할을 조장한다고 주장했다. 실제로 기가지니는 자동차와 관련된 질문에서 “제가 여자라서...”라는 답변을 해 물의를 일으켰다. 현재 이런 문제는 해결된 상태다.

이러한 기술의 혐오, 편파적 현상은 결국 데이터의 오염이 원인이다. 더 좋은 사회를 만들기 위한 노력과는 별개로, 데이터는 과거와 현재의 냉정한 수평선만 달리고 있으며 이 과정에서 인공지능의 예측은 편협한 결과를 낳을 수 밖에 없기 때문이다.

마이크로소프트의 테이 논란이 단적인 사례다. 테이는 인간의 언어를 이해하기 위해 만들어진 인공지능이며, 메시징 서비스 킥과 그룹미를 비롯해 트위터를 바탕으로 사람과 대화하는 방식이다. 말 그대로 대화를 하는 방식으로 자신의 능력을 키운다.

하지만 일부 백인 우월주의자와 여성 및 무슬림 혐오자들이 의도적으로 테이에 접근해 그릇된 정보를 주입했고, 테이가 최악의 인종차별주의자로 변신한 일이 발생했다. 결국 마이크로소프트는 테이의 베타 서비스를 중단했다. 테이 논란은 인공지능에 대한 경계심을 일깨움과 동시에, 약 인공지능의 인간 활동에 있어서도 큰 시사점을 남겼다는 평가다. 이 모든 논란은 기술이 중립적이고 객관적이라는 환상에 젖어 인공지능이 도출한 알고리즘의 결과물만 맹신할 경우 벌어진다.

다행히 이러한 기술의 편향성을 극복하기 위한 노력도 벌어지고 있다.

유럽연합 집행위원회(EC)는 지난 4월 8일(현지시간) 인공지능 시스템의 개발에 영향을 줘야하는 다양한 지침을 발표했다. 사안에 대한 접근부터 고무적이다. 윤리 지침 초안 작성에 관여한 IBM 유럽의 법규 담당 부사장 리암 벤햄은 “사람들에게 지금 그들이 접촉하고 있는 것은 다른 사람이 아니라 알고리즘이라는 사실을 알도록 하는 것이 중요하다”면서 인공지능 알고리즘의 한계를 스스로 인정했기 때문이다. 그 연장선에서 다양성, 무차별, 공정성(Diversity, non-discrimination and fairness)에 대한 원칙을 세웠다. 데이터에 접근하는 인공지능의 기본적인 방향성을 다변화시켜 혐오와 기술적 편향성을 극복하려는 의지다.

구글은 외부 전문가로 구성된 첨단기술외부자문위(Advanced Technology External Advisory Council)를 설립한 후 단 며칠만에 이를 철회하는 행동도 보여줬다. 해당 자문위에 보수 성향 싱크탱크인 헤리티지 재단 대표인 케이 콜스 제임스가 포함된 상태에서, 그가 창출하는 데이터가 인공지능을 오염시킬 수 있다는 일부 직원들의 문제제기가 있었다. 이는 데이터의 생성과 가이드 라인 구축 과정에서 오염된 데이터를 창출하지 않으려는 노력과 관련이 있다.

최진홍 기자  |  rgdsz@econovill.com  |  승인 2019.11.11  16:54:54
최진홍 기자의 다른기사 보기

[태그]

#이코노믹리뷰, #최진홍

[관련기사]

이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
SPONSORED
여백
여백
전문가 칼럼
동영상
PREV NEXT
여백
포토뉴스
여백