港大开源博士级AI智能体，独立完成三篇算法研究，一站式科研6小时搞定 - AI

热门话题

白天

搜索

资讯

港大开源博士级AI智能体，独立完成三篇算法研究，一站式科研6小时搞定

2 天前 / 阅读约10分钟

来源：36kr

L3级自主研究智能体

这三篇论文，出自同一AI之手。

随着人工智能技术的迅猛发展，OpenAI提出的五级模型（涵盖从对话系统到协作管理者）已成为行业发展的重要参考框架。其中，“自主研究智能体”（Autonomous Research Agent）作为第三至第四阶段的核心技术，正受到全球范围内越来越多的关注。

近日，香港大学数据智能实验室推出了一款开源的AI-Researcher系统，以Claude-3.5-sonnet作为核心，兼容DeepSeek、HuggingFace等主流大模型生态。通过参数优化和任务适配，系统展现了从复杂需求解析、多源知识整合到成果输出的全面能力，

与OpenAI商业化方案每月高达2万美元的费用相比，香港大学团队这款方案开源，10天就在Github上获得了超过1k星标。

以下内容展示了系统基于初步研究构想所生成的部分科研成果。

成果展示：AI-Researcher自主产出的学术成果

AI-Researcher自主提出的技术方案

在计算机视觉图像生成领域，AI-Researcher凭借对「Vector Quantization」技术的理解，仅依据用户提供的研究方向和相关文献，AI-Researcher独立完成了从算法设计到代码实现的完整研究流程。

AI-Researcher所设计的技术方案融合三大核心技术：特殊的旋转重缩放机制、梯度流优化算法及动态码本更新系统。这一组合设计巧妙打通了编码解码环节中的梯度障碍。

实验表明，该方案不仅加速了模型训练进程，还显著提升了生成图像质量。

AI-Researcher自主完成的实验验证与分析

主要性能对比实验：比较了不同规模VQ-VAE模型性能，改进后模型的损失显著降低，码本困惑度从17.95提升至最高431.25。

重建质量演化分析：通过第0至99轮训练过程的图像可视化，展示了重建质量从模糊低保真到高清晰高保真的演进过程。

消融研究：通过调整承诺损失系数β(0.1至2.0)发现较低β值提高码本多样性但总损失较高，较高β值则相反。

码本演化可视化： t-SNE可视化显示码本向量从初始分散状态逐渐形成有意义的聚类结构，证明了编码空间的优化。

值得关注的是，AI-Researcher在未看过原始论文的情况下所提出的技术方案，与已发表的学术成果《Restructuring Vector Quantization with the Rotation Trick》具有一定的可比性。

AI-Researcher自主提出的技术方案

传统向量量化技术面临瓶颈——庞大码本与复杂编解码机制导致计算负荷沉重，特别在大型数据集应用场景下捉襟见肘。这种资源密集型特性成为VAE实际部署的绊脚石，需要突破性的轻量化量化方案。

为解决该技术挑战，AI-Researcher设计了有限标量量化框架。该方法融合了三项技术：解决不可微问题的直通估计器、提升训练稳定性的温度退火与EMA动态更新，以及最小化冗余的层次化结构设计。

AI-Researcher自主完成的实验验证与分析

该文章通过提出增强型连续归一化流（Enhanced Continuous Normalizing Flows），解决了传统连续归一化流（CNFs）在高维空间中数据生成不稳定以及映射精度不足的关键问题，显著提升了模型的性能和生成质量。

AI-Researcher自主提出的技术创新点

该工作通过改进速度网络架构、引入速度一致性损失和优化采样策略，显著提升了连续归一化流（CNFs）的稳定性和精确性，有效解决了高维空间中数据生成的挑战。此外，该方法还采用了指数移动平均（EMA）技术来稳定训练过程中的参数更新，进一步提高了模型的性能和生成质量。

AI-Researcher自主完成的实验验证与分析

主要性能对比实验：使用 CIFAR-10 数据集，对比了标准 CNF 模型和 ResNet 增强型 CNF 模型，经过 100 个周期训练后，ResNet 增强型 CNF 模型在 FID 分数上表现更好，样本保真度有所提高。
消融研究实验：对不同架构配置进行实验，发现增加网络深度和使用 Tanh 激活函数可提升样本保真度和多样性。
敏感性分析实验：调整学习率、权重衰减等超参数，发现平衡的超参数设置能稳定模型，不当设置会导致性能下降，凸显了超参数调整的重要性。