博鱼官方网页版-博鱼(中国)




  1. 咨(zī)询热线(xiàn):021-80392549

    博鱼官方网页版-博鱼(中国) QQ在线 博鱼官方网页版-博鱼(中国) 企业微信
    博鱼官方网页版-博鱼(中国)
    博鱼官方网页版-博鱼(中国) 资讯 > 人工智能(néng) > 正文

    谷歌开源AI能区分声音(yīn) 准确率达92%

    2018/11/29机器(qì)人网489

    据VentureBeat报道,在语(yǔ)音(yīn)嘈杂(zá)的环(huán)境中,要想分辨(biàn)出(chū)有几(jǐ)个人讲话(huà)、在(zài)什么时间(jiān)讲话,对于机器来说(shuō)非常(cháng)困难(nán)。但谷(gǔ)歌人工智能(AI)研究部(bù)门在语音识(shí)别方面取得了新进展,能以92%的准确率识别(bié)出每个(gè)人声音的(de)专(zhuān)属模式。

    谷歌AI


    谷歌AI研究(jiū)部门(mén)在(zài)最新名为(wéi)《FullySupervisedSpeakerDiarization》的(de)论文和相关博客文(wén)章中,研(yán)究(jiū)人(rén)员描述了一种新的AI系统,它“能以一种更有效(xiào)的(de)方式识别声(shēng)音”。


    这套系统(tǒng)涉及到Speakerdiarization任务,即需要标注出“谁”从(cóng)“什么时候”到“什么时(shí)候”在说(shuō)话,将语音样本分(fèn)割成独特的、同构片段(duàn)的(de)过程。强(qiáng)大的AI系统必须能够将新的(de)演讲(jiǎng)者发音与(yǔ)它以前从未遇到(dào)过的语音片段关联(lián)起来。


    这(zhè)篇论文的作者声称,核心算(suàn)法已经可在(zài)Github上的开源(yuán)软件(jiàn)中可用,它(tā)实现了一个在线二值化错(cuò)误率(lǜ)(DER),在NISTSRE2000CALLHOME基准上是7.6%,这对(duì)于实时应用来说(shuō)已经足够低(dī)了,而谷歌之前使(shǐ)用的(de)方(fāng)法DER为8.8%。


    谷歌研(yán)究人员的(de)新方法(fǎ)是通过递归神经网络(RNN)模拟演讲者(zhě)的(de)嵌入(如(rú)词汇和短语的(de)数学表示),递归神经网络是一种机器学习模型,它可以利用内部(bù)状态来(lái)处理(lǐ)输入序列。每(měi)个演讲者都从自(zì)己的(de)RNN实(shí)例开始(shǐ),该实例不(bú)断更(gèng)新给定新嵌入的RNN状态,使(shǐ)系(xì)统能够学(xué)习发言者共(gòng)享的高级知识。


    研(yán)究人员在论文中写道(dào):“由于该系统的所有组件都可以在(zài)监督环境下学习(xí),所以在有高质量时间(jiān)标记(jì)演讲者标签(qiān)训练数据的情(qíng)况下,它比无(wú)监(jiān)督系统更受青睐。我们的系统受到全面监督,能够从带有时间戳的演讲者标签(qiān)例子(zǐ)中学习。”


    在未来的工作(zuò)中,研究团(tuán)队(duì)计划改进模型,使其能够集成上下(xià)文信息(xī)来执行脱机解(jiě)码,他们希(xī)望(wàng)这将进一步减少DER。研究人员还希(xī)望能够直接对声学特征进行建模,这样整个Speakerdiarization系统就(jiù)可以进行端(duān)到端训练。

    关键词: 人工(gōng)智能(néng)




    AI人工(gōng)智能(néng)网声明(míng):

    凡资讯来源注明为其他媒体来(lái)源的信息,均为转载自(zì)其他(tā)媒体(tǐ),并不代表本网站赞同(tóng)其观点,也(yě)不代表本网站对其真(zhēn)实性负(fù)责。您若对该文章内容有(yǒu)任何(hé)疑问或质疑,请立即与网站(www.baise.shiyan.bynr.xinxiang.zz.pingliang.ww38.viennacitytours.com)联系,本网站将(jiāng)迅速给您回应并(bìng)做处理。


    联系电话:021-31666777   新闻、技术文章投(tóu)稿QQ:3267146135   投稿邮箱:syy@gongboshi.com

    精选资讯更多

    相关资讯更(gèng)多(duō)

    热门搜索

    工博士人工智能网
    博鱼官方网页版-博鱼(中国)
    扫描二维码关注微(wēi)信
    扫码反(fǎn)馈(kuì)

    扫一(yī)扫,反馈当(dāng)前页面

    咨询反馈
    扫码关注

    微信公众号

    返回顶部(bù)

    博鱼官方网页版-博鱼(中国)

    博鱼官方网页版-博鱼(中国)