• 首页
  • 一分赛车必中方法表对刷介绍
  • 产品展示
  • 新闻动态
  • 新闻动态

    字节、OpenAI加速AI智能体热潮,英伟达合作方认为2028年超84%将是AI应用

    发布日期:2025-02-02 19:30    点击次数:172

    通俗来讲,AI 智能体就像一个有智商、有情商、能理解、会帮忙的"小助手"。

    (图片来源:钛媒体 AGI 编辑林志佳拍摄)

    继 OpenAI 推出首个 AI Agent(代理、智能体)应用产品后,国内大厂也公布类似 Operator 的 AI 技术应用。

    1 月 26 日消息,钛媒体 AGI 获悉,字节跳动近日在 GitHub 上放出一款全新面向图形化用户界面(GUI)的新一代自动化操作模型 UI-TARS,它拥有 70 亿参数规模,将视觉理解、文本处理、操作规划、记忆管理等关键组件深度融合在同一个大模型中,就能完成跨平台复杂任务,并像人类一样感知界面信息、推理操作步骤并执行交互动作。

    下图是官方公布的一段用 UI-TARS 模型完成"自动"发布推文的过程。

    当然,目前 UI-TARS 依然处于 Preview 和不断迭代阶段,需要人工辅助一些点击步骤和文案撰写等,UI-TARS 现已上线 MacOS、Windows 系统版本。

    事实上,两天前的 1 月 24 日,美国 OpenAI 公司正式推出首款 AI 智能体功能应用" Operator "(意为操作员),能模拟人类操作浏览器完成购物、订餐、论文整理等操作,通过融合视觉识别与高级推理的 CUA 模型实现复杂步骤规划,已率先面向每月 200 美元订阅的美国 ChatGPT Pro 用户开放测试。

    最近几个月," AI 智能体"应用概念持续火热。比如,智谱推出了 AutoGLM、GLM-PC 等多个 AI 智能体应用产品;字节跳动推出 的 AI 应用开发平台扣子已发布了超过 200 万个智能体,在国内处于领先;今年 CES 上,英伟达 CEO 黄仁勋也表示,AI Agent 应用可能是下一个机器人产业,蕴藏着价值数万亿美元的机会;Verses 团队研发的 Genius 智能体,仅训练 2 小时、用了十分之一的数据,就在 Pong 游戏中超越人类顶级玩家。

    OpenAI CEO 奥尔特曼(Sam Altman)直言,到 2025 年,我们可能会看到首批 AI 智能体应用"正式就业"。这意味着,2025 年将成为 AI 智能体应用的发展元年。

    针对 AI 应用发展趋势,英伟达合作伙伴、全球多云应用安全和应用交付服务商 F5 亚太区首席技术官 Mohan Veloo 近日对钛媒体 AGI 等表示,未来 AI 应用将更加依赖于 API,同时,随着 AI 使用量增加,相关 API 接口也会呈现爆炸式增长。预计 2025 年,全球 77% 的企业将部署生成式 AI 以提升生产力,到 2028 年,超过 84% 的应用将成为 AI 应用或具备 AI 推理能力。

    很显然,AI 智能体应用将变得至关重要,企业需要将重心转向 AI 应用落地。

    字节、OpenAI 等中美大模型加速入场,AI 智能体将成下一个万亿赛道

    简单来说,AI 智能体就是一个具有智能的实体,能够自主感知环境、做出决策并执行行动,它可以是一个程序、一个系统,也可以是一个机器人。

    通俗来讲,AI 智能体就像一个有智商、有情商、能理解、会帮忙的"小助手"。

    一个 AI 智能体应具备类似人类的思考和规划能力,并具备一定的技能以便与环境和人类进行交互,完成特定的任务。它能像人类一样"观察"和"操作"计算机,协助用户高效完成各类电脑任务。

    2022 年底 ChatGPT 风靡全球之后,大家开始讨论生成式 AI 应用的发展。

    2023 年,斯坦福大学和谷歌的联合研究团队发表了一篇题为《生成式智能体:人类行为的交互式模拟》的研究论文称,居住在虚拟小镇 Smallville 的 25 个虚拟人在接入 ChatGPT 之后,表现出各种类似人类的行为,由此带火了 AI 智能体(Agent)概念。

    2024 年 3 月,Coursera 创始人、斯坦福大学教授吴恩达(Andrew Ng)在红杉资本演讲中指出,智能体拥有四种模式:反思、使用工具、规划以及多智能体协同,事实上,Agent 的价值被大大低估了,基于 GPT-3.5 构建的 Agent 工作流在实际应用中的表现比 GPT-4 更好。

    不久前,OpenAI 列出实现通用人工智能的五级路线图:L1 是聊天机器人;L2 是推理者,即像人类一样能够解决问题的 AI;L3 是智能体,即不仅能思考,还可采取行动的 AI 系统;L4 是创新者;L5 是组织者。

    在这其中,AI 智能体恰好位于承前启后的关键位置,是 AGI 发展过程中非常重要的一个阶段步骤。AI 智能体的出现,标志着 AI 从简单的规则匹配和计算模拟向更高级别自主智能迈进。

    "通往 AGI 的道路感觉更像是一段旅程,而不是一个目的地。但我认为这种类型的智能体工作流可以帮助我们在这个非常漫长的旅程中向前迈进一小步。"吴恩达表示。

    数据显示,2023 年,中国 AI Agent 智能体市场规模为 554 亿元,预计至 2028 年将达 8520 亿元,年均复合增长率为 72.7%。另据黄仁勋预测,AI 智能体未来规模将超过万亿美金规模。

    澜舟科技 CEO 周明表示,AI 智能体的广泛应用可降低人力成本。对普通人来说,相当于多了很多帮手;对企业而言,也是一个智能化转型的机会。

    以 Operator 为例。

    OpenAI 将" Operator "描述为一个可以上网为用户执行任务的智能体,是"一种能够独立为你工作的人工智能——你给它一个任务,它就会执行"。

    在演示中,用户只需要输入需求,Operator 就可以完成餐厅订位、购买日常用品、预订比赛门票等任务。用户可以实时查看进度,并随时介入,遇到付款信息、家庭住址等隐私信息,Operator 还会主动暂停让用户接管。

    具体的工作流程上,Operator 会根据需求捕获屏幕画面,再将其添加到模型上下文,并通过 GPT-4o 的视觉能力准确理解界面内容,再依靠强化学习的推理能力制定下一步计划,最后使用虚拟鼠标和键盘,精确执行点击、滚动或输入的界面操作,直到任务完成或需要用户输入。

    OpenAI 的联合创始人 Andrej Karpathy 曾表示,普通人、创业者和极客在构建 Agents 方面比 OpenAI 更有优势,大家处于平等竞争的状态。

    截至目前,AI 智能体已在客服、编程、内容创作、知识获取、财务、手机助手、工业制造等多个场景中得到应用。其中,在内容创作行业,AI 智能体已能实现一句话生成视频,或采用流水线,通过多个大模型协作生成内容更复杂的短片;在文学创作中,通过 AI 智能体产生剧本、创意等已被更多从业者接受。

    如今,字节跳动、智谱、OpenAI、谷歌等中美 AI 大模型公司全面入局智能体赛道,有望迎来新一轮竞争态势。

    《2024 数字科技前沿应用趋势》报告显示,AI 智能体有望成为下一代技术平台。

    新一轮 AI 热潮进入下半场,企业亟待用 AI 降本增效

    近日,火山引擎副总裁张鑫回忆道,2023 年,那时候大家更多聊的是买卡训练模型,所以出现过"百模大战";到 2024 年,大家开始聊 AI 智能体,企业思考如何基于大模型做出好用的应用产品。未来第三个阶段,随着企业认识到 AI 大模型的应用和场景越来越多,如何能够通过 0 代码方式快速、广泛实现创新应用,构建自己的一个 AI 能力中心,将变得更加关键。

    张鑫表示,AI 大模型本身是一把"双刃剑",它在给企业增加了新的生产力工具的同时,可能反而也在削弱一些头部企业的竞争优势,因为"大模型"本质上带来的是一种知识的平权,它能让以往只有一些少数专家才能具备的技能和知识,现在可以变得像"信息"一样让更多的人唾手可得。

    加州大学伯克利分校人工智能政策研究员 Ritwik Gupta 表示,DeepSeek 最近发布的模型表明" AI 能力没有护城河"。

    因此,如何用 AI 大模型能力实现应用方向的创新部署,这对企业发展来说将更加关键。

    F5 亚太区副总裁、北亚区总裁黄彦文对钛媒体 AGI 等表示,目前可以看到 AI 行业五个重要趋势:一是不断扩展 AI 基础建设;二是网络安全更加复杂和挑战;三是企业亟待用 AI 降本增效;四是通过人机协作,利用 AI 把重复性很高的数据最好的整合,让 AI 助力生产、制造和创新;五是 AI 与物联网(IoT)、边缘计算和云原生架构等技术深度融合,正加速推动企业 AI 事项的落地与实践。

    " AI 技术的深度融合,不仅能帮助我们的客户在复杂多变数字环境中实现更高效、更智能运营,还将进一步巩固 F5 在全球范围内技术领先地位。"

    F5(NASDAQ:FFIV)成立于 1996 年,是一家总部位于美国华盛顿州西雅图的老牌软件技术公司,也是全球领先的多云应用交付网络(ADN)和应用安全解决方案提供商,而且是英伟达、英特尔等科技巨头的合作伙伴。

    最新财报显示,截至去年 9 月 30 日的 2024 财年,F5 公司总收入 28.2 亿美元,与 2023 财年(28.1 亿美元)几乎持平;GAAP 下,营业利润 6.59 亿美元,营业利润率 23.4%;其中,F5 全球服务收入 15.4 亿美元,较上年同期增长 4%;软件业务收入较上年同期增长 11%。

    Mohan Veloo 认为,F5 拥有大量 AI 和机器学习技术经验,正全面赋能企业客户,现有解决方案包括 BIG-IP 代码生成等功能都加入了 AIGC 技术能力。在他看来,F5 使命是防护、交付并优化应用及 API,通过创新解决方案,助力企业应对 AI 技术带来的挑战与机遇。面对 AI 应用产生数据负载,推理与训练节点必须依赖连接,而 AI 集群运行则离不开调度工具,以确保 GPU 资源利用并应对故障。F5 聚焦这些环节,为企业提供支持,助力企业解决 AI 问题,推动 AI 技术落地。

    " F5 依然是被 NVIDIA(英伟达)推荐为入口的最佳选择。" F5 中国区产品及解决方案总经理陈亮对钛媒体 AGI 等表示,此前很多企业客户在大量采购 GPU 卡、算力,做网络,企业有约 70% 的资金投入在 AI 基础架构上,而如今,企业需要把后续的重心投入到 AI 的应用上、大模型的使用上,因为这对于 AI 企业降本增效更为有利。

    随着这一轮生成式 AI 热潮进入下半场,"东方神秘力量" DeepSeek 大模型引爆了全球 AI 大模型行业关注,中国企业都需要对 AI 应用产业发展更有信心。

    DeepSeek 声称,其开源基座大模型 DeepSeek V3 仅使用 2048 块英伟达 H800 和 560 万美元来训练一个包含 6710 亿个参数的模型,训练成本仅为 OpenAI 同类模型的十分之一。

    这表明,未来企业采用基于大模型的 AI 应用时,成本将会进一步降低。同时,这也预示着,新一轮 AI 大模型的发展热潮将持续下去。

    Meta 创始人兼 CEO 扎克伯格(Mark Zuckerberg),"今年将是 AI 的决定性一年。我预计到 2025 年,预计 Meta AI 将成为服务超过 10 亿人的领先助手,Llama 4 将成为领先的先进模型,我们将培养一名 AI 工程师,开始为我们的研发工作贡献越来越多的代码。"

    扎克伯格强调,2025 年,Meta 计划资本投入 600 亿 -650 亿美元,比 2024 年的 380 亿 -400 亿美元增长 62%,并到年底将拥有超过 130 万个 GPU 计算卡。"我们有资本在未来几年继续投资。"