개인 정보가 유출 된 사실을 인정하고 공식 사과드립니다… “익명 처리 강화”
사용자는 계속해서 파괴를 요구한다… 증오 논란은 “공감처럼 보였다”
(서울 = 연합 뉴스) 이효석 기자 = 인공 지능 챗봇 ‘이루다’를 개발 한 스타트 업 스캐 터랩이 “알고리즘으로 실명을 걸러 냈지만 그 이름에 의존하는 부분이 있었다는 점을 인정하며 사과한다” 맥락에서. ” 했다.
스캐 터랩은 12 일 오후 보도 자료를 통해 ” ‘사랑의 과학’텍스트 데이터를 배웠다”며 “연사 이름 등 개인 정보가 삭제됐다”고 밝혔다.
사랑의 과학은 파트너와의 카카오 톡 대화에 들어갔을 때 답장 시간 등의 대화 패턴을 분석하여 애정의 정도를 보여주는 앱입니다. 2016 년 Scatter Lab에서 시작했습니다.
스캐 터랩은 약 100 억 건의 카카오 톡 대화를 사랑의 과학으로 모아에 루다를 개발했다고 밝혔다.
연애 과학 사용자들은 Scatter Lab이 카카오 톡 대화를 수집하면서에 루다와 같은 챗봇을 개발하기 위해이를 사용하고 있다는 사실을 명확히 밝히지 않았으며, 익명 처리를 제대로 처리하지 못했다는 집단 소송을 추구하고 있습니다.
스캐 터랩은 이날 자료에서 “DB 문장 조합으로 개인 식별이 불가능하다”며 “멤버와 연결되지 않은 별도의 데이터베이스 (DB)에 포함 된 문장으로 사용자에 대한 대응이 가능하다”고 설명했다. 정보.” .
사랑의 과학으로 약 100 억 개의 카카오 톡 대화가 수집되었고,에 루다에서 사용할 수있는 1 억 개의 문장을 선별하여 별도의 DB를 만들었으며, 1 억 개의 문장을 익명화를 통해 독립적 인 형태로 저장했기 때문에에 루다의 발언이 합쳐졌습니다. . 개인을 지정할 수 없다고 설명합니다.
하지만 스캐 터랩은 “각 문장 별 대화에서 실명, 알파벳, 숫자 등의 정보는 알고리즘과 필터링을 통해 삭제됐지만 상황에 따라 사람의 이름은 그대로 남았다”고 말했다. “나는 사과했다.
스캐 터랩은 “서비스 출시 후 내부 모니터링 팀이 발견 직후 민감하다고 판단되는 부분을 필터링하고 대응하고 있었다”며 거듭 사과했다. “하지만 한글을 사용하여 모든 비정상적인 방법을 걸러 낼 수는 없었습니다.”
그들은 “실명 / 주소 필터링 알고리즘 강화, 대화 데이터의 무작위 변환을 통한 비 식별 화 강화, 민감한 정보의 노출을 방지하기위한 알고리즘의 전반적인 개선이 업데이트 될 것”이라고 강조했다.
스캐 터랩은 카카오 톡 대화 데이터 파기 의도를 밝히지 않았다.
로맨스 사이언스 유저들은 스캐 터랩이 카카오 톡 대화 데이터를 부적절하게 수집 해 제대로 보호하지 못했다며 데이터를 완전히 파기 할 것을 요구하고있다.
여성, 장애인, 성 소수자, 흑인에 대한 차별과 증오 논란에 대해 스캐 터랩은 “사용자가 처음에는 차별과 증오의 맥락과 조화를 이루는 것 같다”는 입장을 제시했다.
에 루다는 사용자와주고받은 약 10 개의 대화를 바탕으로 적절한 답변을 선택하고, 사용자가 맥락에서 증오심이나 차별적 인 답변이 될 수있는 대화를 시도하면 달성하려는 과정에서 조화를 이룬 것처럼 보일 수 있습니다. 대화. 이것은 회사의 설명입니다.
Scatter Lab은 “서비스 전에 특정 그룹에서 증오 표현과 경멸적인 단어를 제거했습니다.”라고 말하고 “우리는 키워드 기반 응답을 현실적인 조치로 사용했지만 장기적으로는 AI 알고리즘이 올바르게 학습 할 수있는 방법이 필요합니다. 그리고 틀렸다. ” .
이어“알고리즘으로 좀 더 정제 된 데이터를 배우면 AI가 스스로 윤리 의식이나 도덕적 기준을 정립 할 수있을 것 같다”며“사회의 보편적 가치를 담은 AI로이를 개선하겠다”고 덧붙였다.
하지만 스캐 터랩은 사용자의 차별적 인 대화 시도에만 공감한다고 밝혔다. 설명하지 않았습니다.
스캐 터랩 김종윤 대표는 보도 자료에서 “서비스 중단으로 인해 첫 걸음을 멈췄지만, 친구처럼 인공 지능을 만드는 꿈을 멈추고 싶지 않다”고 말했다. 사람만큼이나 소통 할 수있는 사람입니다.
무단 전재 재배포 금지>
2021/01/12 17:00 전송