야후의 남용 알고리즘은 90%의 시간 동안 작동합니다.

컴퓨터 알고리즘 도움말

Yahoo의 뉴스 기사에는 인터넷의 다른 부분과 마찬가지로 불쾌한 댓글이 많이 있으므로 Yahoo 팀은 최악의 범죄자를 성공적으로 식별할 수 있는 알고리즘을 개발하기 위해 댓글 섹션을 사용하기로 결정했습니다. 그들의 새로운 남용 감지 알고리즘 90%의 시간 동안 작동하며, 다른 조직이 유사한 위업을 시도하는 것보다 더 효과적이며 이 분야에서 중요한 진전이라고 설명합니다. 90% 하다 꽤 좋은 소리, 인정합니다.

열광한 야후는 또한 학대 퇴치를 위한 프로젝트의 일환으로 공개적으로 사용 가능한 최초의 온라인 증오심 표현 데이터베이스를 공개하고 있다고 보고했습니다. 이는 다른 사이트가 자체 알고리즘을 설계하기 위해 야후의 댓글 데이터베이스를 사용할 수 있음을 의미합니다. Yahoo의 알고리즘은 기계 학습과 댓글 섹션에 대한 사용자 보고 데이터를 기반으로 개발되었습니다.

댓글 중재 알고리즘에서 가장 까다로운 부분은 오탐지를 처리하는 것입니다. 많은 남용 감지 알고리즘은 욕설이나 일반적인 모욕과 같은 특정 단어나 구문을 찾아 자동으로 댓글에 검토 플래그를 지정합니다. 그러나 이로 인해 예를 들어 적절하지 않다고 말하는 맥락에서 비방을 언급하거나 해당 댓글이 트롤의 비꼬는 모방인 경우에도 댓글에 플래그가 지정됩니다. 야후의 알고리즘은 분명히 특정 음성 패턴을 감지할 수 있으며, 농담과 실제 학대를 구별할 수 있도록 설계되었습니다. (물론, 귀하의 재미있는 댓글이 실제 남용과 구별할 수 없다면 알고리즘이 여전히 이를 표시할 것이라고 확신하지만 AI의 해당 부분이 어떻게 작동하는지 확신할 수는 없습니다.)

야후는 알고리즘을 완성하는 데 도움이 되도록 훈련된 댓글 중재자를 고용했고 훈련되지 않은 중재자에게도 비용을 지불했으며 훈련된 중재자가 어떤 댓글이 적절한지 파악하는 데 훨씬 더 뛰어남을 발견했습니다. AI를 만드는 과정에서 야후는 이러한 훈련된 중재자의 작업이 알고리즘의 효율성을 유지하고 탐지 기술을 완성하는 데 필수적이라는 것을 발견했습니다.

물론이야, 알고리즘에는 여전히 편향이 있습니다. , 의견을 분류하는 데 사용되는 방법론을 계속 반복하려면 인간 중재자로 구성된 (다양한) 팀이 필요합니다. 힘든 일처럼 들리지만 적어도 야후는 이제 잘 훈련된 인간 중재자와 새로운 AI 동료 모두의 역할을 교육하고 평가하는 것의 중요성을 이해하고 있습니다.