对于(yú)"有什么好(hǎo)笑的?"这个问题(tí)的答案,似乎没有人(rén)能够达成一致(zhì)。因(yīn)此,想象一(yī)下试图训练一个机器人笑的场(chǎng)景。但通过创建一个(gè)从(cóng)共享笑声系统中获取信号的(de)人工智(zhì)能,日(rì)本京都(dōu)大学的(de)一个研(yán)究(jiū)小组正试图(tú)做到这一点(diǎn)。研究人(rén)员在《机器人学和(hé)人工智能前沿》杂志上描述了(le)他(tā)们为日本机器人(rén)"Erica"创造笑这一表(biǎo)情的新技术。
这并不是说机器人不(bú)能理解,甚至不能(néng)对一个糟糕(gāo)的笑话发出笑声。相反,困(kùn)难在于(yú)为人工智能系统开发人类幽默的微妙之处,以增强机器人和(hé)人类(lèi)之间的(de)普通对话。

研究人员(yuán)与Erica之间的对话实(shí)例。资料来源:Inoue等人
"我(wǒ)们认为对(duì)话式人工(gōng)智能的重(chóng)要功(gōng)能(néng)之一(yī)是转移(yí)情感,"主要(yào)作者(zhě)井(jǐng)上浩二(èr)博士解释说,他是京都大学信息学研(yán)究生(shēng)院智能(néng)科学和技术系的助理教授(shòu)。"当然,对话是多模态的,不仅仅是正确的回应。因此,我们(men)决定,机器人能够与用(yòng)户(hù)产生共鸣的一种方式是分享他们的笑声,而这(zhè)是基于(yú)文本(běn)的聊天(tiān)机器(qì)人无法(fǎ)做到(dào)的。"
在分享笑声的模式(shì)中,人类最初会(huì)笑,而(ér)人工智(zhì)能系统则以笑声作为移情反(fǎn)应。这种方法(fǎ)需要设计三个子系统--一个(gè)用于(yú)检测笑声(shēng),第二个用于决定(dìng)是否笑,第三个用于选择适当的笑(xiào)声类型。
科学家们通过注(zhù)释80多(duō)段来自速配(pèi)的对话(huà)来收集训练数据(jù),速配是一(yī)种社会场景,大(dà)群人在短暂的时间内一对一(yī)地互动。在(zài)这种情(qíng)况下,涉及京都大学学生的"相(xiàng)亲马拉松"活动(dòng)让Erica加入其中,由几个(gè)业余女(nǚ)演员远程操作(zuò)。
"我们在这(zhè)项工作中最大的挑(tiāo)战是确定共(gòng)享笑声的实际案例,这并不容易,因为(wéi)如你(nǐ)所知,大多(duō)数笑声(shēng)实际上根本没有(yǒu)共享,"Inoue说。"我们必须仔细分类(lèi),到底哪些笑声可以用于我们的分析(xī),而不是仅仅假设任何笑声(shēng)都可以被回(huí)应。"
笑声的类型也很重要,因为在(zài)某些情况下,礼貌(mào)的(de)笑声可能(néng)比响亮的嗤笑(xiào)声更合适。实验仅限于(yú)社交性的笑声(shēng)与欢快的(de)笑声。
研究(jiū)小组最终通(tōng)过在一个人和Erica之间(jiān)用她的(de)新(xīn)分(fèn)享式笑声系统创造四段两到三分钟的简短对话来(lái)测试Erica新学会(huì)的幽默感。在第一个场景中,她只发出了(le)社交性的笑(xiào)声,随(suí)后在(zài)第二和第(dì)三(sān)个交流中只发(fā)出了(le)欢(huān)笑声,在最(zuì)后一个对话中两(liǎng)种(zhǒng)笑声结合起来。该小(xiǎo)组还创建了另外两组类似的对(duì)话作为基线模型(xíng)。在第一组中,Erica从未(wèi)笑过。在(zài)第二(èr)个中,Erica每次检(jiǎn)测到人类(lèi)的笑声时都会发(fā)出社交性的笑声(shēng),而不使用其他两个子系(xì)统来过滤背(bèi)景(jǐng)和反应。
研究人员共召(zhào)集了130多人听(tīng)取(qǔ)了三种不同条件下的(de)每个场景--共享笑声系统(tǒng)、无笑声、所(suǒ)有笑声--并(bìng)根据移情、自然、人类相似性和理解来(lái)评估互(hù)动。共享(xiǎng)笑(xiào)声系统的表现(xiàn)优于任(rèn)何一种基线。
"这篇论文最重要的结(jié)果是,我们已(yǐ)经(jīng)展示了我们如何将所(suǒ)有这三项任务结合到一个机器人中。我们相信,这种类型的(de)组(zǔ)合(hé)系统对(duì)于正确的笑的行为(wéi)是必(bì)要的,而不仅仅(jǐn)是检测到笑并对其做出反应,"Inoue说(shuō)。
在Erica准备好(hǎo)参加脱口秀表演(yǎn)之前,还有很(hěn)多其他的笑声方式需要建模和训练。"还(hái)有(yǒu)许多其他的笑的功能和(hé)类(lèi)型需要考虑,这不(bú)是一(yī)项容易的(de)任(rèn)务。我(wǒ)们甚(shèn)至还没有尝试对(duì)不共(gòng)享的笑声进行建模,尽管它们(men)是最常见(jiàn)的,"Inoue指出(chū)。
当然,笑声只是与机器人进(jìn)行类似人(rén)类(lèi)自然对话(huà)的一个方面(miàn)。
"机器人实(shí)际上应该有一(yī)个独特的性格,我们认为(wéi)他们可(kě)以(yǐ)通过他们的对话(huà)行(háng)为来(lái)显(xiǎn)示这一点,例如笑、眼睛(jīng)注视(shì)、手势(shì)和说话风格(gé),"Inoue补充说。"我们认(rèn)为这根本不是一个简单的问题,很可能需要10到20年以(yǐ)上的时间,我(wǒ)们才能最终与机器人像与(yǔ)朋友(yǒu)一样(yàng)进(jìn)行休闲聊天。"