跳到内容 跳到导航

Research & Ideas

站内搜索

自动语音识别系统往往误解黑色音箱

因为这种技术是基于在很大程度上依赖于英语的数据库由美国白人所讲的机器学习系统的差异可能发生。

A black megaphone pressed up against a pink surface

那是什么?语音识别系统做两次解释非裔美国人,因为他们解释白人的错误。 | stocksy /胡安莫亚诺

解释由非裔美国人口头解释由白人说同样的话时,如话的时候,根据研究员在葡京体育app的一项新研究的技术力量全国领先的自动语音识别系统让两倍的错误。

而研究专注于黑白美国人之间的差距,类似的问题可能会影响到谁与区域和母语非英语的口音说话的人,研究人员得出结论。

如果不加以解决,这种不平衡的翻译可能对人们的职业生涯甚至生命造成严重后果。现在很多企业与自动化在线访谈雇用语音识别屏幕求职者。法庭使用该技术来帮助录制听证会。对于谁不能用自己的双手的人,而且,语音识别是一种用于访问计算机的关键。

调查结果在杂志上发表3月23日 科学的美国国家科学院院刊, 是基于由亚马逊开发的系统测试,IBM,谷歌,微软和苹果。第一四家公司提供收费的在线语音识别服务,以及研究人员使用这些服务运行他们的测试。第五,研究人员建立了使用苹果的免费语音识别技术RAN测试定制的iPhone应用程序。研究人员进行他们的测试去年春天,而语音技术可能已经自那以后更新。

研究人员无法确定该公司的语音识别技术是否也用自己的虚拟助理,如苹果和ALEXA在亚马逊的情况下的情况下,Siri的,因为该公司并没有透露他们是否使用不同版本的自己技术在不同的产品系列。

“但应该想到的是美国为基础的企业将建立服务于所有美国人的产品,说:”研究的主要作者 佳佳koenecke,一个博士生在计算和数学工程与谁的工作语言学家和计算机科学家联手。 “现在,似乎他们不这样做,人口的整体部分。”

不等错误率

研究者从记录的采访美国黑人和白人测试从每家公司的语音识别系统2000余个语音样本。黑色的语音样本来自来到 区域非裔美国人的语言语料库,白样品从进行的访谈来了 加州的声音,其特点不同加州社区居民的访谈录。

所有五个语音识别技术有这样的几乎两倍,黑人的白人错误率 - 甚至当发言者按性别和年龄匹配的,当他们说同样的话。平均来说,系统误解的黑人所说的话35%,但仅19那些白人所说的百分比。

错误率最高的是非洲裔男性,差距是谁做更多的使用非洲裔美国黑人英语的发言者更高。

研究人员还跑到其他测试,以确定五个语音识别技术是如何常常被误解的话这么厉害的改编是毫无实际用处的。他们测试数千语音样本,平均长度为15秒,以计算技术如何经常通过各样品中一半的话至少搞坏的阈值。本不可接受的高差错率发生在黑人讲,相对于由所说的白人样品的少于2%样品的20%以上。

隐藏的偏见

koenecke推测,差距通用于所有五项技术从一个共同的缺陷茎 - 机器学习来训练语音识别系统的系统可能在很大程度上依赖于英语的数据库由美国白人的发言。一个更公平的办法是包括反映口音和其他讲英语的方言的更大的多样性数据库。

不同于其他厂商,这往往需要通过法律或习俗来解释什么进入他们的产品和他们是如何工作的,提供语音识别系统的公司正在没有这样的义务。

沙拉德·戈埃尔斯坦福计算工程学教授谁监督的工作,说,这项研究突出了需要审核的新技术,如语音识别隐藏的偏见,可能排除谁已经边缘化的人。这种审计需要由独立的外部专家来完成,并需要大量的时间和精力,但他们以确保这种技术是包容性的重要。

“这不是他们设置什么事要做。我可以想像,一些实力自愿承诺独立审计,如果有足够的公众压力。但它也可能是必要的政府机构施加更多的监督。人们必须知道如何影响他们的生活真正起作用的技术的权利“。

听到误转录语音样本,并了解更多关于在越来越多地使用自动语音识别技术 fairspeech.stanford.edu,一个网站创建由 葡京体育计算实验室政策.