《科(kē)创板日报》12月28日讯(编辑 宋子乔) 众多专业学科中(zhōng),医(yī)学(xué)以难度强、压力(lì)大著称,但(dàn)仍有(yǒu)无(wú)数人接受挑战,选择(zé)迎难而上,如今,AI也跑来和(hé)医学生“抢饭碗”。
当地时间12月27日,谷歌公(gōng)布了(le)一个(gè)新的医(yī)疗AI模型“Med-PaLM”。在经历一系列考(kǎo)核(hé)后,该模型被证实“几乎(hū)达到”了人类医生的水平。
![]()
具体(tǐ)来看,研究团队准备了(le)一个医学问题问(wèn)答数据(jù)集“MultiMedQA”,涵盖医学考(kǎo)试、医学研究(jiū)和消费者医学问题,该“题(tí)库”收集(jí)了MedQA(USMLE,美国医师执照考试题),还引入了他(tā)们(men)自己的新数据(jù)集HealthSearchQA,它由(yóu)搜索过(guò)的健康问题组成。
该团队又请来一组临床医生(shēng)作答。这些(xiē)临床医生分布于美(měi)国和英国,在初级保健、外科、内科(kē)和儿科(kē)方面(miàn)具有专业经验(yàn)。
最(zuì)后,研究(jiū)人员将(jiāng)模型和人类医生的答案匿名后交给9名分别来自美国、英国和(hé)印度的临床医生进行评(píng)估。
结(jié)果显(xiǎn)示,Med-PaLM在科(kē)学常(cháng)识方面的正确率在92%以上,在理解、检索和推理能力方面,也几乎达到了(le)人类医生的水平,并在(zài)克服隐(yǐn)性偏见方面(miàn)略(luè)胜一筹。
不(bú)过,该研究负责人也表示,Med-PaLM给出的答案在整(zhěng)体上(shàng)仍然(rán)不如(rú)临(lín)床医(yī)生,该模(mó)型在实际应用(yòng)前有待进一步完(wán)善。
追根溯源,Med-PaLM是怎么诞(dàn)生的呢(ne)?
这(zhè)里不得不提谷(gǔ)歌在今(jīn)年发布的转换器语(yǔ)言模型——PaLM,该模(mó)型基于Pathways架构、拥有5400亿参数,是Google迄今为止(zhǐ)研发的最大(dà)规模的模型,全名(míng)为Pathways Language Model。
PaLM模(mó)型在语(yǔ)言理解等各种方面的评估(gū)测试中的表现(xiàn)十分(fèn)出色(sè),甚至还在语言和推理类的测(cè)评中(zhōng)超过了人类。
Med-PaLM正是(shì)PaLM的衍生品。谷歌研(yán)究团(tuán)队(duì)首先在上文提及的医学问题问答数据集“MultiMedQA”上评(píng)估(gū)了PaLM及微调变体Flan-PaLM,然后,基于此提(tí)出了指(zhǐ)令提示x调(diào)整(zhěng),让Flan-PaLM进一步与医学接轨,进一步产(chǎn)生了Med-PaLM。
值得注意的是,AI模型的每一次突(tū)破,都预示着更(gèng)聪明的机器人即将(jiāng)到来。指挥(huī)机器人干活不是什么新奇(qí)的事,但(dàn)要让机器人能(néng)够理解(jiě)你的命令(lìng)背后的意(yì)图,那就要考验它的“大脑”好不好用了。将AI模型应用到机器人身上相当于(yú)给机器(qì)人“开智”。
据(jù)了(le)解,今年8月份,谷歌就(jiù)将大型语(yǔ)言模型首次集成(chéng)到机器人中(zhōng),有了AI模型(xíng)的加持,机器人能像人类一样(yàng)响应完整(zhěng)的命令。
谷歌(gē)研究人(rén)员就此做了(le)演示。当(dāng)对机(jī)器人说(shuō):“我(wǒ)饿了,你能给我点零(líng)食吗?”机器人在自助餐(cān)厅中搜索一番(fān)后,打开了一个(gè)抽(chōu)屉,找(zhǎo)到一袋薯片并将它拿给研究人员。
可以预见(jiàn)的是(shì),通过进(jìn)一步的训练、优化,Med-PaLM模(mó)型的回(huí)答准(zhǔn)确率将进一步(bù)提高,基于此模型(xíng)的机器(qì)人医(yī)生也有望更快出(chū)现。