我们刚分享过北大肖睿团队的两份 DeepSeek “内部秘籍”,除了 DeepSeek 的使用技巧,还对整个 AIGC 领域进行了简单的介绍。
这不,清华的也拿出了他们的《AIGC 发展研究报告 3.0》,家友们正好可以借此机会对 AIGC 领域有一个全新的认识。
此外,北大这边也拿出了一篇比较硬核的《DeepSeek-R1 及类强推理模型开发解读》,让我们看看 DeepSeek 真正的领先之处。
对了,这次给大家分享的 PDF 下载,是原汁原味的原版哦,网上有太多卖课者魔改的内置其广告版本。
这份《AIGC 发展研究报告 3.0》解读时间截至 2024 年 12 月,内容聚焦于 DeepSeek “以外的世界”。
至于近期的 DeepSeek-R1 及 Grok3 等最新进展,则要等一下他们 4.0 版本的报告了。
和自动驾驶类似,AI 自动化的道路上也有着 L1 到 L5 的说法,AI 将逐渐从单一领域的简单任务执行,发展为完全的自动化。
OpenAI 创始人奥尔特曼对于 AGI 通用人工智能五个阶段的说法,基本也是类似的道理。
2022 年 ChatGPT 的出现,正是 AI 大模型由“特种模型”走向“通用基座”的重要节点。
而 OpenAI o1、DeepSeek R1、QwQ-Max 等 CoT 思维链模型,正好也说明 AI 正从“模仿者”走向“慢思考者”。
现在的 AI 大模型,正在由上面所提的 L3 向 L4 领域演进,它们已经向我们展现了在某些任务上的高效与自主性,但仍然无法达到完全的通用智能和独立学习的水平。
创造力跃迁在 AI 时代体现为从“零知识启动”到“高知识生产”,再到“新知识创造”,最终到“元知识形成”的完整过程。
在文字、音乐、图像甚至视频创作的领域,我们都已经能看到 AI 的创造力。
以文字创作为例,使用合适的提示词来引导 AI 大模型,便能得到不错的结果。
绘画的本质便是将艺术家脑中的构思投射至现实世界。
AI 正好使得未经过专业训练的我们,也能通过绘画来表达自己心中的想法。
随着 AI 的发展,人机协同融合创作将逐渐主导未来。
目前,在诸多领域,AI 大模型已经在展示出他们在效率上的提升潜力。
比如传统的制衣流程中,AI 可以在前期的灵感构思、调研企划及设计绘图环节节约大量的时间。
在医疗领域,一些专有的大模型也已经可以实现数据自动分析、临床知识点查询、病例分析及多模态影像数据的解析。
在教育领域,AI 更是在不同学科的各个领域,都有广泛的施展空间。
这份文档中还给出了 AIGC 在音乐创作、视频制作、工业设计、代码开发等多种领域的应用及潜力,等待家友们去发现。
来自北大的这份新宝典,则向我们展示了 DeepSeek-R1 这类强推理模型的开发解读。
我们便可以了解到,为什么 AI 业内都盛赞 DeepSeek 所带来的方法创新,也能搞明白为什么官方会提供 DeepSeek-R1 和 DeepSeek R1 Zero 两个版本的模型。
DeepSeek-R1 Zero 完全放弃了 SFT 监督微调,纯靠 RL 强化学习的方法进行训练。
跳过了 SFT 的阶段采用纯强化学习的方法,也就让大模型摆脱了对于大规模人工标注数据的依赖,训练成本大大降低。
想要对 DeepSeek-R1、强化学习、蒸馏等概念有进一步了解,但是又觉得自己啃论文太困难的家友,就可以来看一下这篇较为硬核的解读。
IT之家微信公众号回复:AI
即可获取清华大学 + 北京大学原版秘籍,点此 或扫描 / 长按下方二维码皆可进入公众号,关注后发消息即可。