博鱼官方网页版-博鱼(中国)




  1. 咨(zī)询热(rè)线(xiàn):021-80392549

    博鱼官方网页版-博鱼(中国) QQ在线 博鱼官方网页版-博鱼(中国) 企业微信(xìn)
    博鱼官方网页版-博鱼(中国)
    博鱼官方网页版-博鱼(中国) 资讯 > 人工智能(néng) > 正文

    16×16 图像(xiàng)放大 8 倍还不(bú)糊!这个机器学(xué)习模型是怎么办(bàn)到的(de)?

    2019/09/02雷锋网472

    最近看(kàn)到了一个比(bǐ)较好玩的项目,号称可以(yǐ)将非常小的图片表情恢(huī)复(fù)原状。通过一个机器学习模型对面部的标志进行渐进式(shì)的超分辨,训练(liàn)后的网络可以输入小至16×16像素(sù)的图像(xiàng)进(jìn)行(háng)面部图像(xiàng)的重建,并重新缩放到128×128像素大(dà)小作为输(shū)出图(tú)像,以下是(shì)他们给出的例子:

    16×16 图像放大(dà) 8 倍还不糊(hú)!这个机器学习模型是怎么(me)办到的?

    相关论文介(jiè)绍

    该机器学(xué)习模型(xíng)来自论文:Progressive Face Super-Resolution via Attention to Facial Landmark(https://arxiv.org/abs/1908.08239),论文提(tí)出(chū)了(le)一种新的人脸识别方法,用(yòng)这个方法可(kě)生成逼真的8倍超分辨率的人脸图像的同时,完全保留其面部细节。该(gāi)神经(jīng)网络的训(xùn)练方法是渐进式的,通过将网络分割成连(lián)续的步骤,使训练稳定下(xià)来,每(měi)一步输出(chū)的(de)分辨率都在不断提(tí)高(gāo)。论文还(hái)提(tí)出了(le)一种新的面部注意(yì)力丢失方法,并将(jiāng)其应(yīng)用(yòng)于每一步的训练中,通过增加像素差和热图值来(lái)更详细(xì)地恢(huī)复面部属性。最(zuì)后,论文(wén)还提出一(yī)个压缩版本的人脸对齐网络(FAN)的标志热(rè)图提取(qǔ)。利用所提出的FAN,可以提取出适合于人脸(liǎn)SR的(de)热图,并减少了整体训练(liàn)时(shí)间(jiān)。实验结果证明,该方法(fǎ)在定性和定量测量方面都优于目前最先进的(de)方法,尤其是在面部感知质量方面。

    然而(ér),论文(wén)中有一个没被提(tí)及的细(xì)节,就是最后输出的图片带有疤痕的比例非(fēi)常高?,活(huó)脱脱都变成(chéng)了哈(hā)利波(bō)特呢。

    16×16 图像(xiàng)放大 8 倍(bèi)还不糊!这个(gè)机器学习模型是(shì)怎么办到(dào)的?

    左:真人,中:原(yuán)输入(rù)表情(qíng),右:输出结果

    仔细一(yī)看右图还真(zhēn)的怪(guài)吓人(rén)的,幸好农历(lì)七月已经过(guò)去了

    另外,该(gāi)模型的最佳训练场景是输入的图像大小应该为16×16像(xiàng)素,并且需(xū)要使用与训(xùn)练和测试模型(xíng)完全(quán)相同的代码。

    如果原图像不是(shì)16×16像素的呢?

    16×16 图(tú)像放(fàng)大 8 倍还不糊(hú)!这个机(jī)器学习模型是怎么(me)办(bàn)到(dào)的?

    如上图所示,在Twitter上有一(yī)组大小正好为16×16像素的表情符(fú)号(大家也可以自(zì)行到Twitter表情的(de)Github项目查看:https://github.com/twitter/twemoji),作者利用(yòng)这些表情(qíng)进行了测试,结果可(kě)以看下图:

    16×16 图像放大 8 倍还(hái)不糊!这个机器学习模(mó)型是怎么办(bàn)到的?

    以上8组表情的的(de)左侧都是原(yuán)图,右侧则是输出结果,这训练出来的结果也太老(lǎo)龄(líng)化(huà)了吧(ba),面部全部(bù)都满脸皱纹,连披(pī)萨都烤的毫无食(shí)欲(还是叫个必胜客(kè)的披萨吃吧,推特牌就算了)。

    现在有了新的(de)进展!因为这个模型是(shì)专门(mén)用(yòng)于寻找(zhǎo)面部标志的(de),所以(yǐ)任(rèn)何(hé)一个标志都可以在一个像(xiàng)素上画出(chū)眼睛和鼻孔(kǒng)。作者表示非(fēi)常肯定意大利辣(là)香(xiāng)肠披萨就是模仿人(rén)类的嘴唇?制成的…

    下面的样(yàng)本(běn)是经过精(jīng)心挑选的,然而许多输出(chū)的(de)结果都不是很理想。作者(zhě)也花了很大力气鼓(gǔ)励模型对面部特征做(zuò)出积极的猜测。例如,虽然推特的图像已(yǐ)经是16×16像(xiàng)素,但如果首先通过(guò)传(chuán)统(tǒng)的(de)大(dà)小调整将其(qí)从16×16像素的输入调整到(dào)128×128像素,然后再降低到16×16像素,通常(cháng)会得到(dào)更好的结(jié)果。这(zhè)显然增加了很多模糊,但似乎为模型提供(gòng)了更多创造性的空间来解释某(mǒu)个(gè)事(shì)物。作者还将预测的图像作(zuò)为输入发送(sòng)回模型进行迭(dié)代(迭代(dài)次(cì)数多达10次(cì)),其中有(yǒu)许多(duō)输入图(tú)像都是来自后(hòu)来迭代生成的结果。然而(ér),在10次迭代中只有3次可以看到人的(de)眼睛(jīng)。


    16×16 图像(xiàng)放大 8 倍还不糊(hú)!这个机器学习模型是怎么办到的?

    16×16 图像放大 8 倍还不糊!这个(gè)机器学习(xí)模(mó)型是(shì)怎么办到的?

    作者还非常喜欢这个绿(lǜ)色的很(hěn)像龙(或者像蛇)的(de)表情。除(chú)了一只眼睛以(yǐ)外,它从来没有真正拥有过(guò)人类的特征,但生成(chéng)图片的(de)人造(zào)风(fēng)格令作者非常喜欢。

    16×16 图像放大 8 倍还不(bú)糊!这个(gè)机器(qì)学习(xí)模型是(shì)怎(zěn)么办(bàn)到的?

    当你放大(dà)或缩小一个StyleGAN面部(bù)模型时(shí),作者联想到这篇(piān)Gan可(kě)操(cāo)控性(xìng)论文(https://arxiv.org/pdf/1907.07171.pdf)。

    以下是用Face Super-Resolution模型缩放(fàng)的图像结果:

    16×16 图像放大 8 倍还不糊!这个机器学习模型是怎么办到的?

    该动图无法(fǎ)上(shàng)传,敬请移步到原文查看:https://iforcedabot.com/photo-realistic-emojis-and-emotes-with-progressive-face-super-resolution/

    Twitch表情的输出效果如何?

    16×16 图像(xiàng)放大 8 倍还不(bú)糊!这个(gè)机(jī)器学习模型是怎(zěn)么办到(dào)的?

    令人(rén)惊讶的是,只需要一(yī)点点调整,爬(pá)行动物图片的输出结果(guǒ),面部看起来更像人类了!说好的建(jiàn)国以后动物不能(néng)成精呢?!!

    Twitch表情(qíng)并不完全适用于16×16,其中一些具(jù)有高分(fèn)辨率版本,而另一些则没有。作者尝试了所有种类,因此对(duì)于以下(xià)的(de)某些图片,输入的时候已经是高分辨率,但在进入模型之前被调整为16×16像素大小。图片输出结果(guǒ)也在下方,因为与真正的高分辨率表情经(jīng)常有一(yī)种有趣的对比。

    16×16 图像(xiàng)放(fàng)大 8 倍还(hái)不(bú)糊!这个机器学习模(mó)型(xíng)是(shì)怎么办到的?

    最后来看看游戏精灵们(men)的生成结(jié)果

    16×16 图像放大(dà) 8 倍(bèi)还不糊!这个机器(qì)学习模型是怎么办到的?

    由于篇幅有限,作者没有拿(ná)更多(duō)的精灵进行测试,不过可以期待作者之后(hòu)的更(gèng)新~

    进一步探(tàn)索

    我(wǒ)认为可以做更多的事情来鼓(gǔ)励模型在应用人类特征(zhēng)方面具有创造性 —— 目(mù)前我只是(shì)尝试对管道进(jìn)行一些调整并迭代,几乎没有做其他的事情。使用其他模型的可能性(xìng)是无穷无尽的。作者立(lì)即联想到StyleGAN编码:https://twitter.com/jonathanfly/status/1138236372572135424

    16×16 图像(xiàng)放大 8 倍(bèi)还不糊!这个机(jī)器学习(xí)模(mó)型是怎(zěn)么办到的(de)?

    在 https://selfie2anime.com/上(shàng)也有一个快速测试,可以告诉(sù)你在动(dòng)漫里长(zhǎng)什么样子,输出的结果(guǒ)会(huì)发(fā)送到邮(yóu)箱中。


    16×16 图像放(fàng)大 8 倍还不糊!这个机器学习模型是怎么(me)办到的?

    16×16 图像放大(dà) 8 倍还不糊!这(zhè)个机(jī)器(qì)学习模(mó)型是怎么办到的?

    更新1:更多(duō)Minecraft

    我被(bèi)要求(qiú)尝试用更多的Minecraft纹理去进行测试(shì),当然是(shì)以16×16像素的图片作为样(yàng)本。结果很显然,绝大(dà)多数的样本并没有真(zhēn)正(zhèng)发挥(huī)作用(yòng)......?

    16×16 图(tú)像放大 8 倍还不糊!这个(gè)机器学习模型是怎么办到的?

    完(wán)整数据集(jí)地址:https://drive.google.com/open?id=1kzmgMAshMeO8dOs6gnr0IzHWHsn_MBux

    面部特(tè)征通常非(fēi)常微妙,实际上会(huì)比明显的面部特征(zhēng)更令(lìng)人毛骨悚然。想(xiǎng)象(xiàng)一下在玩游戏的时候,隐隐约约感觉(jiào)看到了一张脸,但是又不能对这张图像做出什么操作......

    16×16 图(tú)像(xiàng)放大 8 倍还(hái)不(bú)糊!这个机器学习模型是怎么办到的?

    更新2:不能停止尝试的事(shì)情

    为了(le)寻找(zhǎo)更多可以用来进行(háng)测试(shì)的(de)像素图(tú)像,作者在这颗恒星的图(tú)像上尝试了 Face Super-Resolution 训(xùn)练。只花了大约40次迭代,(输出的(de)图像)就揭(jiē)示(shì)它实际上是一个可(kě)爱(ài)的小(xiǎo)外星人的(de)形象。很确定天文学(xué)是如何运作的?https://t.co/dUQjERGllq

    16×16 图像放(fàng)大 8 倍还不糊!这(zhè)个机器学习模型是怎么办到的?

    更新3:视频的 Face Super-Resolution

    继续用Face Super-Resolution神经网络(luò)对一个16x16像素的视频进(jìn)行超分(fèn)辨,结(jié)果(guǒ)大家也都看到了,Face Super-Resolution 基本(běn)上把它(tā)变成了DeepFake里(lǐ)的魔鬼。?

    16×16 图像放大 8 倍还不糊!这(zhè)个机器学习模型是怎么办(bàn)到(dào)的?

    YouTube视频:https://youtu.be/H8qH_mdceNM

    最后,对 Face Super-Resolution 感(gǎn)兴趣的同学,可(kě)以(yǐ)到(dào)Colab进行尝试(shì)。如果大家(jiā)知道为什么会出(chū)现(xiàn)如此恐怖的现象,也可以在留言区进行留言~

    https://gist.github.com/JonathanFly/80b669a72bf624d17b56a1cfec742588#file-progressivefacesuperresolutiondemo-ipynb

    快速在线体验地址:

    https://colab.research.google.com/gist/JonathanFly/80b669a72bf624d17b56a1cfec742588/progressivefacesuperresolutiondemo.ipynb

    彩蛋时间到

    以(yǐ)下是(shì)小编自己(jǐ)在Colab上测试的结果,图片(piàn)都是在网络(luò)找的(de),只需要在代码中(zhōng)修改网络图片的(de)地址即可运(yùn)行。具体效果如何,请大家自行(háng)感受(shòu)吧

    16×16 图(tú)像放(fàng)大 8 倍还不糊(hú)!这个机器(qì)学习模型(xíng)是怎(zěn)么办到的?

    (不能让我一(yī)个人辣眼睛)


    16×16 图像放(fàng)大 8 倍(bèi)还(hái)不糊!这(zhè)个机器学习(xí)模型是怎(zěn)么办(bàn)到的?

    via https://iforcedabot.com/photo-realistic-emojis-and-emotes-with-progressive-face-super-resolution/

    关键(jiàn)词:




    AI人工(gōng)智能网声明:

    凡资讯来源注明为其他(tā)媒体来源的信(xìn)息,均(jun1)为转载自其(qí)他媒体,并不(bú)代表本网站赞同其观(guān)点,也不代(dài)表本网(wǎng)站对其真实性负责(zé)。您若对该文章内容(róng)有任何疑问或质疑,请立(lì)即与网站(www.baise.shiyan.bynr.xinxiang.zz.pingliang.ww38.viennacitytours.com)联系,本网站将迅速给您回应并做处理。


    联系电话:021-31666777   新(xīn)闻、技术文章(zhāng)投稿QQ:3267146135   投(tóu)稿邮箱(xiāng):syy@gongboshi.com

    工博士人工智能网
    博鱼官方网页版-博鱼(中国)
    扫描二维码关注微信
    扫码反馈

    扫一扫,反馈当前(qián)页面

    咨询(xún)反馈
    扫码关(guān)注

    微信公众号

    返回顶部(bù)

    博鱼官方网页版-博鱼(中国)

    博鱼官方网页版-博鱼(中国)