Pluto启动项目,收集阿拉伯语语音数据以改进人工智能多语言识别技术

人工智能数据和解决方案公司Pluto于 10 日宣布,已启动一项新项目,旨在收集高质量的阿拉伯语语音数据,以提高人工智能模型的多语言识别率。

本项目旨在提升阿拉伯语在语音转文本(STT)模型中的识别率,该语言的识别率一直相对较低。除了标准语MSA之外,阿拉伯语还有30多种方言。由于日常对话中标准语和方言频繁切换,阿拉伯语的语码转换使得构建人工智能训练数据变得十分困难。

Pluto 正在开展一项阿拉伯语语音数据采集活动,该活动利用了其移动应用程序内置的“Arcade”语音数据采集功能。参与者朗读呈现的句子并录制自己的声音,人工智能系统会分析语音数据以确定方言类型。如果方言类型不明确,系统会提供额外的句子以鼓励参与者再次参与,从而提高数据的准确性。

该公司解释说,之所以推进这个项目,是为了积极响应潜在需求以及实际项目请求,因为对多语言语音数据的需求持续增长,尤其是在全球大型科技公司中。

Pluto公司认为,此次数据收集将有助于创建反映语言多样性的训练数据,包括说话者的语调、发音模式和词汇选择。基于此,Pluto计划减轻语言资源差异造成的AI学习偏差,并开发一个能够在真实环境中实现高识别率的数据集。

Pluto公司首席执行官李正洙表示:“阿拉伯语是全球超过4亿人使用的主要语言,但它是一种资源匮乏的语言,用于人工智能训练的数据相对不足。” 他补充道:“通过这个项目,我们将构建能够真实反映阿拉伯语实际使用语境的数据,从而为提升全球人工智能模型中阿拉伯语识别的质量做出贡献。”


  • 查看更多相关文章