OpenAI 12集“发布会”背后:对中国产业AI落地的五大启示
2 天前 / 阅读约12分钟
来源:36kr
技术向上,产业向智能

展望2025年,可以预见AI技术将在产业中扮演更加核心的角色。

AI大模型将进一步融入企业的日常工作流程,推动企业乃至产业的升级进化。

近日,OpenAI 主演的“12集连续剧式发布会”迎来了大结局。

随着人工智能技术的飞速发展,产业界对AI的需求日益增长,特别是在提高效率、降低成本、增强竞争力等方面。从某种层面来看,OpenAI长达12天的直播发布会,不仅是一场技术的展示,更是对未来产业变革的一次深刻启示。

强化微调技术、Sora Turbo视频编辑功能、Canvas画布的Python运行环境、以及AI桌面助手等,都直接回应了这些需求,为产业落地提供了强有力的支持。

如强化微调技术能够在数据量有限的情况下实现显著性能提升,这对于数据资源有限的企业来说,意味着更低的推理成本和更快的知识库构建。这不仅降低了企业使用AI技术的门槛,也为快速响应市场变化提供了可能;

再如Sora Turbo的视频编辑功能则为媒体和娱乐产业提供了新的创作和编辑工具,提升了内容生产的灵活性和效率;

以及Canvas画布的Python运行环境降低了编程门槛,使得非技术人员也能快速上手,加速了技术的应用和创新;和备受好评的AI桌面助手,其通过与本地应用的直接协作,提升了工作的流畅性和智能化水平。

这些技术的发展和应用,在揭示AI技术向AGI加速推进的同时,也更在昭示着产业AI或许将成为未来几年的AI重点。

一 垂类模型依旧是“主航道”

在人工智能领域,通用型AGI(人工通用智能)与垂直领域模型的选择一直是一个备受争议的话题。OpenAI在过去的12场发布会上似乎给出了一些启示。

在最近的直播中,OpenAI展示了其强化微调技术,与传统微调不同,强化微调技术使得即使是数据量较少的垂直领域也能快速获得高质量的AI模型。奥特曼称这项技术为2024年最大的惊喜之一。

中国作为制造业的大国,企业拥有大量的行业数据,这为AI的发展提供了丰富的“养料”。

要知道,中国在AI领域虽然已经建立了一定的研究基础,特别是在计算机视觉和语音识别方面,也在应用层面取得了显著进展,但在基础理论和原创算法上与国际先进水平仍有差距。尤其是原创性算法和模型架构方面,与国际先进水平存在差距。

例如这次OpenAI最近发布了更快、更智能的满血版o1模型,并推出了史上最贵的o1pro,每月费用高达200美元。通过模型优化,还推出了满血版o1、强化微调、o3家族等。

尤其o3系列,其宣称已经接近通用人工智能,OpenAI方面表示,o3在ARC-AG测试87.5%分,超GPT-3和GPT-40。在编程竞赛Condeforces 得分2727,数学基准测试AIME 2024准确率达96.7%。

OpenAI的模型优化,展示了其AI技术在处理速度和智能水平上的潜力。这对于中国AI技术的发展而言,意味着需要在算法创新和模型训练上持续投入。

然而,这种短板在短时间内无法快速补足。

主要是因为中国在AI基础研究方面的投入不足,导致原创性成果较少,依赖于国外的研究进展。此外,数据资源分散在不同的企业和机构中,缺乏有效的共享机制,这也限制了模型训练的效果。

不过,随着数字化转型的深入,各行各业对智能化解决方案的需求日益增长。垂直领域模型能够快速响应市场需求,结合具体行业特点,赋能千行百业,推动产业升级。这不仅将推动国内AI技术的应用发展,还有望实现在某些领域的弯道超车。

二 AI奔向听、写、看一体

2024年3月,OpenAI推出了其视频模型Sora,标志着视频生成技术迈入了新的阶段。这一举措不仅在国内引起了厂商们的积极响应和追赶,也预示着多模态技术发展的新篇章。

在OpenAI 12天的直播期间,再次对其进行升级,发布正式版Sora,支持生成高达1080P分辨率、最长20秒的视频,支持多种视频比例。

更重要的是还推出Sora Turbo,Sora Turbo的最大亮点在于其创新的故事板功能,允许用户从任意时间点对视频进行编辑,打破了传统视频模型只能生成单一视频的限制,创作复杂视频序列。

目前,OpenAI方面表示,Sora仅面向ChatGPT Plus和Pro用户开放,前者用户每月有50条视频生成配额,后者用户则高达5000条。

这一功能极大地增强了视频创作的精确性和个性化,使创作者能够更加自由地表达创意。

与此同时,OpenAI还在其高级语音模式中集成了视频聊天和屏幕共享功能,实现了视觉与听觉的实时互动,进一步丰富了用户的交流体验。

‍这两项升级共同推动了AI在多模态创作方面的能力,使得从文本到视频的转换变得更加高效和直观。通过将语音、视觉和文本融合在一起,ChatGPT等智能助手不仅能更好地理解和回应人类的需求,还能在处理实时任务时提供更全面的支持。

这种多模态技术的进步,不仅改善了人机交互的质量,也为跨领域的应用开发提供了无限可能。

多模态技术的发展不仅仅是技术上的突破,它反映了对人类认知和交互方式的深刻理解。

一个新的启示是,未来的AI发展应更加注重人性化设计,以满足人们日益复杂和多样化的实际需求。随着技术的不断演进,我们可以预见,未来的交互界面将实现听觉、视觉和文本的一体化,形成一个更为自然、直观且高效的沟通环境。

随着像Sora Turbo这样的创新技术不断涌现,AI正快速向“听、写、看”一体的方向迈进,为各行各业带来前所未有的变革机遇。

三 大模型企业有责任为AI应用“搭桥铺路”

在OpenAI长达12天的直播发布会中,可以发现,无论是Canvas画布功能免费开放、推出project功能,还是AI桌面助手的亮相,一系列新功能和工具的推出展示了该公司致力于拓展AI技术边界的努力。

这不仅标志着AI技术本身的进步,也体现了其对各行各业产生深远影响的潜力。

具体来看,Canvas画布功能的免费开放,创建了一个支持Python编程的新平台,并通过集成GPT智能辅助,转化为一个多功能的AI导师。这不仅降低了编程与创作的技术门槛,使更多人能够参与到科技创造中来,同时也为教育和技术开发领域带来了革新性的变化。

Project功能的上线基于用户反馈进一步强化了GPT在项目管理方面的能力。

支持用户将资料、文件、聊天记录等信息集中到一个Project中,支持项目管理与写作、文件与数据管理、个性化定制等场景。简而言之,就是通过智能分析和任务管理,帮助用户更加高效地规划、组织和完成项目,提升了工作效率和项目成功率。

OpenAI表示,计划明年初向企业和教育用户提供。

AI桌面助手的亮相,不仅能直接与本地应用进行交互,还能大幅提升工作流畅性,使得日常工作更加智能化和便捷。

据了解,基于AI桌面助手,用户可以通过简单的复制粘贴操作,与Warp、XCode等应用协同工作,无需详细交流即可执行任务。此外,ChatGPT还支持在语音模式下与Notion、Apple Notes等应用协同工作。目前已在Mac最新版和ChatGPT应用中推出。

综上所述,上述功能的整合提供了一个既高效又开放的创新环境,激发了更广泛的应用可能性,并促进了AI技术在不同领域的深度应用。对于国内乃至全球的AI行业而言,这也提供了宝贵的借鉴意义,即如何将先进技术转化为实际生产力。

展望未来,随着类似创新平台的不断涌现,以及项目管理工具向智能化和自动化方向的发展,预计将引发一场工作方式的革命,极大提升工作效率和专业度。

这种演变不仅限于技术层面,还将深刻改变人们的工作模式和协作方式,推动整个社会向更高层次的信息时代迈进。

四 AI技术民主化的前提:更低门槛

实现技术普惠是推动技术落地的关键,而要达到技术普惠,首先需要的是降低使用这些技术的门槛。

在这一背景下,AI领域内的进展尤为显著。

OpenAI发布会期间,o1模型API的登场成为了开发者社区的新焦点。新增的WebRTC支持,让实时语音交互仅需短短12行代码即可实现,成本降低60%,极大地简化了AI应用的开发流程。

同时,还增加了偏好微调工具,允许开发者根据用户的特定需求定制AI模型,提供更为个性化的用户体验。

这两大特性大幅简化了AI应用开发流程,使得创建复杂功能变得更加直接和便捷。

随着API的开放,技术门槛被进一步拉低,激发了开发者的无限创造力。他们现在可以更加轻松地构建出既高效又创新的AI解决方案,为AI技术的快速普及和发展注入了强大动力。

开放API不仅是AI技术民主化的重要标志,它也为更多开发者与创新者敞开了大门,使他们能够触及到最先进的AI模型和工具,从而加速整个行业的创新步伐。

这种开放策略的意义远不止于此。它促进了技术共享,鼓励了更广泛的创意涌现,并催生了多样化的解决方案。这不仅加快了行业的发展速度,同时也意味着更多的中小企业和个人开发者得以加入到AI技术的开发与创新中来。最终,这样的趋势将为社会带来丰富多样的AI应用和服务,真正实现了AI技术的大众化和普及化。

五 2025,探索AI无缝集成的无限可能

如果说OpenAI 12天发布会中,产品集中度最高的是哪个方向,那就是各种让消费者用上AI的“手段”。例如免费搜索服务、与苹果生态系统的深度融合,还有通过多种渠道与GPT交流的新方式。

其中OpenAI发布的全球免费精准搜索,该功能基于GPT-40模型的微调版本。功能通过

与第三方搜索提供商及ChatGPT的合作伙伴直接提供的内容相结合,用户能快速并准确获取所需信息。内置地图并支持高级语音模式,为用户提供了一个全新的搜索体验。

这一功能的推出,不仅告别了广告的干扰,还通过高级语音模式,还凭借其智能的语音识别能力,让用户能够更加轻松快捷地获取信息。

同时,ChatGPT全面嵌入苹果系统,支持Siri、相机控制和快捷键操作,这不仅助力了苹果生态优势的大幅领先,也为用户带来了更加丰富的交互体验。

目前,iPhone、iPad和Mac用户都可以通过Siri使用ChatGPT的功能。苹果全家桶的用户现在可以更加便捷地与AI进行交流,享受AI带来的便利。

此外,为了使更多人受益于AI的进步,任何具备拨号功能的电话或手机都可以直接与GPT进行通话,WhatsApp用户也能通过消息与GPT互动。据了解,号码是1-800-CHAT-GPT,或者是1-800-242-8427。目前支持智能手机、老人机、座机等设备。

这种多样化的交流途径大大降低了使用门槛,使得AI技术变得更加普及和平易近人,真正走进了千家万户。

无论是免费搜索服务的推出、苹果全家桶的深度整合,还是多样的GPT交流方式,都显著提升了用户体验,彰显了AI技术正在逐渐成为我们生活中不可或缺的一部分。这些无缝集成的服务,不仅促进了人机交互的自然化和直观性,同时也提高了生活品质和工作效率,预示着一个更加智能化的未来。

写在最后:

随着OpenAI的12集连续剧式发布会落下帷幕,我们见证了AI技术如何以前所未有的速度和深度融入我们的生活和工作。从垂类模型的精细化发展,到多模态交互的创新突破,再到AI技术的民主化和无缝集成,每一步都标志着人工智能领域的巨大飞跃。

展望2025年,可以预见AI技术将在产业中扮演更加核心的角色。

AI技术将进一步融入企业的日常工作流程,成为提高生产力和效率的标配。随着技术的成熟和成本的降低,企业将更加依赖AI来优化决策、提升服务质量、增强客户体验。AI技术的无缝集成将使得企业能够更加灵活地应对市场变化,快速响应客户需求。

同时,AI也将推动产业向更加智能化、自动化的方向发展,为企业带来前所未有的发展机遇。