그녀의 말에 대한 획기적인 연구

이제 전설이 된 놀라운 효과와 수명 그것이 그녀가 말한 것입니다 농담, 최근에 다시 대중화 사무실 , 수백만 명의 사람들에게 일상적인 대화에 대한 엉뚱한 대답을 제공한 것 이상의 일을 했습니다. 이제 진지한 언어 연구를 고무함으로써 사회적 중요성의 새로운 수준에 도달했습니다. 라는 연구 논문의 형태로 제공됩니다. 그게 그녀가 말한 것입니다: 이중 응모자 식별 , 두 명의 컴퓨터 과학 학생이 저술한 클로이 키돈유리 브룬 .

그들의 논문에서, 쌍은 그들의 창조에 대해 설명합니다. 명사 전달 또는 DEviant를 통한 Double Endender 그녀가 말한 것을 자동으로 식별하는 접근 방식(TWSS) 농담. 그들은 그들의 접근 방식을 은유적 분석이라고 부릅니다. 이 분석은 이중적인 의미를 지니고 있으며 특정 단어를 다른 단어보다 더 섹시하게 평가하는 데 기반을 두고 있습니다. 팀은 몇 가지 섹시한 명사와 동사에 가중치를 부여한 다음 알고리즘을 실행했습니다.

그들의 연구에서 쌍은 또한 TWSS 농담에 대한 몇 가지 흥미로운 규칙을 발견했습니다. 예를 들어, TWSS 농담을 잘못 호출할 위험이 있습니다. 그들의 연구에서:

예를 들어, 사회적 환경에서 그녀가 부적절하게 말한 것을 말하는 비용은 높지만 적절했을 때 말하지 않는 비용은 무시할 수 있습니다.

이 문제를 해결하고 더 나은 결과를 생성하기 위해 팀은 학습 알고리즘을 사용했습니다. 무엇보다도 이것은 거짓 음성보다 100배 더 높은 거짓 양성 생성을 설정합니다.

일련의 사전 식별된 TWSS 농담 자료 및 무작위 인용을 통해 DEviant를 실행한 후. 그들의 테스트에서 그들은 1.5개의 에로틱한 문장과 57,000개의 비-에로틱한 문장을 사용했습니다. 팀은 71.4% 이상의 성공률을 달성했다고 말합니다. 별 것 아닌 것처럼 보일 수도 있지만 팀은 더 큰 데이터 세트를 사용하면 99.5%에 가까운 결과를 기대할 수 있다고 말합니다. 또한 DEvianT는 몇 가지 흥미로운 결과를 반환했습니다. 다시 한 번 연구에서:

DEvianT는 이러한 문장 28개(모두 TWSS일 가능성이 가장 높음)를 반환했으며 그 중 20개는 참 긍정입니다. 그러나 8개의 가양성 중 2개는 실제로 TWSS입니다(음성 테스트 데이터에서 비롯되었음에도 불구하고): 예, 모든 크림을 주면 그는 사라졌습니다. 그리고 네, 하지만 그의 구멍은 때때로 정말 냄새가 납니다.

어떤 사람들은 이 연구를 단순히 종달새이자 가치가 없다고 하여 이 연구의 가치를 떨어뜨릴 수 있습니다. 연구원들조차 그들의 작업을 어려운 자연어 이해 문제로 설명하기 때문에 이것은 낮은 타격이 될 것입니다. (그녀가 한 말이다.)

( 새로운 과학자 통하다 도피자 )