趣书网

阅读记录  |   用户书架
上一页
目录 | 设置
下一章

186. 新建文件夹:扩散模型(2 / 2)

加入书签 | 推荐本书 | 问题反馈 | 内容报错

这是后来许多优质生成技术的基石,非常适合现在做准备。

扩散(diffusion)模型,这个比较不明觉厉的名词,虽然后来知晓原理的人很少,但很多人却都听过这个名词多次。

从AI绘图软件生成的作品打败一众人类艺术家,斩获数字艺术类冠军,到后来Midjourney,、Imagen、novelai等国内外平台遍地开花。

越来越多的人都曾点开过相关网站,尝试让AI描绘脑海中的画面,又或者是进行局部的修改调整。

有以文生图,各种神秘咒语召唤古神的,也有以图生图,闹出各种神奇笑话的。

2022年,AI绘画,AI生成图像,在短短几个月内数次进步。

每一次的进展突破都带了了肉眼可见的提升,远超人类的想象。

就在22年年关左右的时候,大家都还在嘲笑AI绘图是什么东西,实在太过丑陋了。

结果三个月后就发现事情似乎没有那么简单,AI开始大量产出各种波涛胸涌的绘图,这吸引了相当一部分人们的注意力。

那时不少人还在开玩笑说,虽然AI画得不行,但你真别说,它对题材的把握还是非常不错的嘛!水平不够,题材来凑。

等再过三四个月,到22年底的时候,AI绘画的水平和能力已经无人再去争议了。

这回大家主要争论的点又变了,变成了AI绘图究竟是不是抄袭,AI水平和画师究竟谁更强。

抛开到底谁更强这件说不清的事不谈,单从大家争论的这些内容就能看出,AI绘画的能力确实进步得非常之快。

“平心而论,在AI生成这件事情上,GAN生成式方法是让大家走了弯路的。”

虽然孟繁岐的GAN生成式办法在学界广受好评,建立起了很高的学术声誉和知名度,FaceGAN的假脸生成效果也颇为惊艳,但最终真正让AI制图火起来的还是扩散模型。

“GAN办法生成对抗的模式固然让人感到惊为天人,但两个网络彼此对抗学习,毕竟还是非常麻烦的事情。”孟繁岐思忖了一下,现在的大难题,数据是一方面,计算设备则是另一方面。

本来自己提前发布技术,显卡就已经很不够用了。目前用GAN去针对某一个特定的事物,比如FaceGAN只做人脸还是比较可以的,但想要从文本直接生成,那难度可就大了。

扩散模型的原理其实并不难,主要是通过对照片添加噪声,然后在这个过程中学习到当前图片的各种特征。之后再随机生成一个服从高斯分布的噪声图片,然后一步一步的减少噪声直到生成预期图片。

代码写起来不是那么困难,不过若是写成论文,琢磨其中的原理,那里面的数理逻辑和推导,够孟繁岐喝一壶的。

“数学这方面....这两天找韩辞和付院长他们帮帮忙吧,好久没怎么跟他们联络了。或者也可以请辛顿和李飞飞指点一下,这两位都算是我的导师。”涉及数学问题,找数学专业人才自然放心。

李飞飞和辛顿虽然不是数学出身,但李飞飞有物理背景,辛顿更是领域内教父,两者在这方面实力想必也很强。

新建了文件夹,孟繁岐刚准备开始工作,却隐约感觉哪里不对,自己好像遗忘了什么事情。

半晌才想起来,自己的倒霉室友唐璜今天要到斯坦福附近来。

“这大半年过的,差点忘记我自己还是个学生了。”

高强度研发了三四个月的孟繁岐,感觉时间好像已经过去了一年多。

正好唐璜来了,就给自己放几天假吧,来了也有几周了,却一直没有好好逛过斯坦福的校园。

上一页
目录
下一章
A- 18 A+
默认 贵族金 护眼绿 羊皮纸 可爱粉 夜间