重生之AI教父(CloseAI)_186. 新建文件夹：扩散模型_章节免费阅读无弹窗

这是后来许多优质生成技术的基石，非常适合现在做准备。

扩散(diffusion)模型，这个比较不明觉厉的名词，虽然后来知晓原理的人很少，但很多人却都听过这个名词多次。

从AI绘图软件生成的作品打败一众人类艺术家，斩获数字艺术类冠军，到后来Midjourney，、Imagen、novelai等国内外平台遍地开花。

越来越多的人都曾点开过相关网站，尝试让AI描绘脑海中的画面，又或者是进行局部的修改调整。

有以文生图，各种神秘咒语召唤古神的，也有以图生图，闹出各种神奇笑话的。

2022年，AI绘画，AI生成图像，在短短几个月内数次进步。

每一次的进展突破都带了了肉眼可见的提升，远超人类的想象。

就在22年年关左右的时候，大家都还在嘲笑AI绘图是什么东西，实在太过丑陋了。

结果三个月后就发现事情似乎没有那么简单，AI开始大量产出各种波涛胸涌的绘图，这吸引了相当一部分人们的注意力。

那时不少人还在开玩笑说，虽然AI画得不行，但你真别说，它对题材的把握还是非常不错的嘛！水平不够，题材来凑。

等再过三四个月，到22年底的时候，AI绘画的水平和能力已经无人再去争议了。

这回大家主要争论的点又变了，变成了AI绘图究竟是不是抄袭，AI水平和画师究竟谁更强。

抛开到底谁更强这件说不清的事不谈，单从大家争论的这些内容就能看出，AI绘画的能力确实进步得非常之快。

“平心而论，在AI生成这件事情上，GAN生成式方法是让大家走了弯路的。”

虽然孟繁岐的GAN生成式办法在学界广受好评，建立起了很高的学术声誉和知名度，FaceGAN的假脸生成效果也颇为惊艳，但最终真正让AI制图火起来的还是扩散模型。

“GAN办法生成对抗的模式固然让人感到惊为天人，但两个网络彼此对抗学习，毕竟还是非常麻烦的事情。”孟繁岐思忖了一下，现在的大难题，数据是一方面，计算设备则是另一方面。

本来自己提前发布技术，显卡就已经很不够用了。目前用GAN去针对某一个特定的事物，比如FaceGAN只做人脸还是比较可以的，但想要从文本直接生成，那难度可就大了。

扩散模型的原理其实并不难，主要是通过对照片添加噪声，然后在这个过程中学习到当前图片的各种特征。之后再随机生成一个服从高斯分布的噪声图片，然后一步一步的减少噪声直到生成预期图片。

代码写起来不是那么困难，不过若是写成论文，琢磨其中的原理，那里面的数理逻辑和推导，够孟繁岐喝一壶的。

“数学这方面....这两天找韩辞和付院长他们帮帮忙吧，好久没怎么跟他们联络了。或者也可以请辛顿和李飞飞指点一下，这两位都算是我的导师。”涉及数学问题，找数学专业人才自然放心。

李飞飞和辛顿虽然不是数学出身，但李飞飞有物理背景，辛顿更是领域内教父，两者在这方面实力想必也很强。

新建了文件夹，孟繁岐刚准备开始工作，却隐约感觉哪里不对，自己好像遗忘了什么事情。

半晌才想起来，自己的倒霉室友唐璜今天要到斯坦福附近来。

“这大半年过的，差点忘记我自己还是个学生了。”

高强度研发了三四个月的孟繁岐，感觉时间好像已经过去了一年多。

正好唐璜来了，就给自己放几天假吧，来了也有几周了，却一直没有好好逛过斯坦福的校园。

趣书网