作者 | Jack Cui
出品 | AI科技大本营
一位 B 站 up 主「Jack Cui」使用 AI 技术,还原了康熙、雍正、乾隆的历史样貌。
看看富态的雍正!!
算法实现
人工智能技术,可以实现很多有趣而又有意义的事情。
利用 StyleGAN 算法,可以生成逼真的但不存在于这个世界的人物肖像。
甚至可以根据的要求,生成各式各样的人脸,比如网红脸、明星脸、超模脸、萌娃脸、黄种人脸、混血人脸、港式美人脸、日式美人脸。
想要在线体验,可以登录下方的这个网站,你每刷新一次页面,网站都会为你随机生成一个不带重样的人物肖像。
https://thispersondoesnotexist.com/
利用风格迁移算法,可以将照片的风格进行转换,照片秒变油画:
秒变漫画:
利用一阶运动模型算法,甚至可以让照片里的人物“复活”,为你演唱一首歌曲。
推荐阅读:让图片动起来,特朗普和蒙娜丽莎深情合唱《Unravel》
该算法使用的是 First Order Motion,也就是一阶运动模型,来自 NeurIPS 2019 论文。
「First Order Motion Model for Image Animation」
论文最初的目的是让「静态图片」动起来。如下图所示:“你动,它也动”。
这个模型可以轻易地让「权利的游戏」中的人物模仿特朗普进行讲话,还可以让静态的马跑起来等。
一阶运动模型的思想是用一组自学习的关键点和局部仿射变换来建立复杂运动模型。
模型由运动估计模块和图像生成模块两个主要部分组成。
首先进行关键点检测,然后根据关键点,进行运动估计,最后使用图像生成模块,生成最终效果。
在运动估计模块中,该模型通过自监督学习将目标物体的外观和运动信息进行分离,并进行特征表示。
而在图像生成模块中,模型会对目标运动期间出现的遮挡进行建模,然后从给定的图片中提取外观信息,结合先前获得的特征表示,生成图片。
作者使用该算法在四个数据集上进行了训练和测试。
VoxCeleb 数据集、UvA-Nemo 数据集、The BAIR robot pushing dataset、作者自己收集的数据集。
其中,VoxCeleb 是一个大型人声识别数据集。
它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音,同时数据基本上是性别平衡的(男性占 55%),这些名人有不同的口音、职业和年龄。
First Order Motion 利用了这个数据集的视频图像,进行了模型训练。
AI修复视频
UP 主就是通过使用这些 AI 技术,复原了康熙、雍正、乾隆的历史样貌。
点击下方小程序前去围观!
更多精彩推荐