智能体是AI应用的最主流形态,即将迎来爆发点
11月13日消息,11月12日,百度世界2024如期召开,百度创始人李彦宏发表了主题为《应用来了》的演讲。如字面意思,注重人工智能的落地应用,而非大模型,是李彦宏对人工智能的认知和判断。
在去年大模型最火的时候,李彦宏就发表了“不要卷模型,要卷应用”的观点。今年的演讲,则是这一观点的进一步延伸,这也符合李彦宏坚定「应用」的一贯态度。
当然,观点并不是空口无凭而来,而是有正在发生的数据支撑。
据介绍,截至11月初,百度文心大模型的日均调用量已经超过15亿,相较一年前首次披露的5000万次,增长约30倍。李彦宏表示“这个增速超出预期”,说明AI是真需求。他感慨道,这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。
在过去这2年人工智能狂飙期间,国内各厂商在路径选择上,大模型确实最为拥挤。然而,理想很丰满现实很骨感,深陷烧钱泥潭而迟迟不能商业化落地就是现实,以至于不少玩家倒在了黎明前的黑暗里,黯然离场。如今,几乎没有玩家会弱化「应用」的重要性。现在回望,李彦宏对于人工智能的判断,可谓是具备非常高的前瞻性。
百度押注「AI应用」,前瞻性源于先人一步
李彦宏对行业的精准判断源自于自身十多年来的深耕和学习。作为中国AI的头号玩家,李彦宏在2012年就写了一封邮件,鼓励全百度产品经理了解AI技术最新趋势。
2012年,如果你在中国一线城市的大街上跟人讲述人工智能,别人可能都会认为你不是疯子就是骗子。而在当时,百度却已经愿意斥下天文数字般的巨资着手布局。
同年,李彦宏计划收购当时号称“深度学习之父”,全球最顶尖的的Geoff Hinton团队。尽管在竞标中,百度叫出4400万的全场最高价,但因种种原由最终未能与百度成功合作。一位相关专业人士对此事做出评论称,在当时的中国互联网公司中,只有百度愿意为真正的技术人才支付如此高昂的代价。
2013年,百度成立深度学习实验室,李彦宏任院长。至此,百度正式拉开了探索AI的序幕。
有“AI教父”之称的杨立昆在出版的《科学之路》一书中评价到,百度是最早部署商业化深度学习系统的大型公司之一,领先于谷歌和微软。有意思的是,在2012年的那场收购竞标中,微软和谷歌就是百度的主要竞标对手。
2014年,诺贝尔奖得主吴恩达加入百度并在研究院担任首席科学家。在吴恩达加入不久后,六位顶级的人工智能专家通过邮件表达了加入百度的意向。
作为中国人工智能领域的开拓者和践行者,百度如今已然成长为国内的「扛大旗者」,具备与国际巨头同台竞争的实力。
近日,沙利文发布报告《2024年全球AI生态全景概览》,在全球AI生态全景中,百度与谷歌、OpenAI位于AI-Native Giant 同一象限。
事实证明,在任何行业,站在顶峰的企业必然具备「敢为人先」的精神。从报告结果来看,百度目前已经取得了阶段性成果。
据了解,百度在布局AI领域长达十余年累计投入超过1700亿,打造了完备的AI生态(云、自动驾驶、大模型),这在全球的公司里都罕见。
文心iRAG发布:文生图无幻觉,更真实
“过去24个月,AI行业发生最大的变化是大模型基本消除了幻觉。”这是李彦宏对行业变幻的第一感知。
在现场,李彦宏演示了将一个开源模型生成一张北京天坛的图片,图中天坛生成了四层,但实际上只有三层。
这是文生图比较典型的幻觉现象,这种幻觉现象,至今仍然很普遍。“所以今天的多模态大模型没有什么成规模的应用出来,就是幻觉没有解决,至少没有像文生文RAG解决得那么好。”李彦宏称。
基于此,百度发布了检索增强的文生图技术iRAG,全称image based RAG。
据介绍,iRAG是将百度搜索的亿级图片资源跟强大的基础模型能力相结合,生成的图片更为真实,整体效果远远超过文生图原生系统,去掉了浓郁的“机器味”。
现场还演示了一张「大众揽巡汽车飞跃长城」iRAG生成图。从图能看到,车型、车标、姿态以及背景,都比较符合预期。
据百度首席技术官王海峰对iRAG的技术链路介绍:
首先,基于大模型对用户的需求进行分析理解,自动规划精确或泛化方案,比如对哪些实体进行增强;接着在增强阶段,对需要增强的实体,检索并选择相应的参考图。
最后在生成阶段,自研了多模可控生图大模型。一方面,通过局部注意力计算,在保持实体特征不变的情况下,实现了图像的高泛化生成,比如根据牛顿的肖像,生成绘本风格的牛顿;另一方面,通过整体注意力计算,进行高精确的图像生成,比如生成图中的汽车跟原图片保持完全一致。
在实际应用中,这个方法也支持用户上传参考图,应用户期望进行生成。
iRAG技术极大地提高了AI生成图片的可用性。李彦宏在演讲中举例,在实际应用场景中,如汽车品牌宣传场景时,拍摄一组海报动辄需要一二十万,甚至大几十万。使用iRAG后,创作的成本接近于0。“简单来说,iRAG的商业价值体现在:无幻觉、超真实、没成本,立等可取。”
无代码工具“秒哒”发布,将迎来一个“只靠想法就能赚钱的时代”
大会上,百度官宣发布无代码应用平台“秒哒”,旨在让每个人都具备程序员的能力,会说话就能做出应用,根本不需要看懂代码。
官方称之为“迄今为止人类历史上最复杂的多智能体协作工具”。
据介绍,秒哒的三大特点是具备无代码编程、多智能体协作和多工具调用。一个人通过自然语言交互,就可以完成一整套系统的搭建。且还可以做任意场景下的各种应用。
李彦宏称,我们将迎来一个前所未有的只靠想法就能赚钱的时代。以前有个想法,你还要去执行,把想法做出来。现在只要你有想法,秒哒就可以帮你做了。
据悉,该平台预计在2025年一季度上线,目前可以申请排队。
智能体是AI应用的最主流形态,即将迎来爆发点
“智能体”这三个字是本次大会最为频繁出现的词汇之一,可见其在百度AI里的战略地位之高。
李彦宏在最近的一次内部讲话中谈及了大模型三大认知误区,其中就指出:智能体是最重要的发展方向,但还不是业界共识。
李彦宏称,当AI玩家不知道怎么从模型变成应用时,智能体能提供一个非常直接、非常高效、非常简单的方式。
当基础模型能力就绪,智能体成为AI应用的方向之一。李彦宏认为,智能体是AI应用的最主流形态,即将迎来它的爆发点。智能体可能会变成AI原生时代,内容、信息和服务的新载体。
打个比方,智能体很像PC时代做网站,或者是移动时代做自媒体账号。不同之处是智能体更像人,更智能,更像是你的助理和客服,能够像人一样做各种各样的脑力和体力劳动,各方面的工作都可以独立完成。
同时,李彦宏强调,在模型之上构建智能体是相当方便的。这也是什么目前每周都有上万个新的智能体在文心平台上被创造出来。
据介绍,目前,文心智能体平台上,已经吸引了15万家企业和80万名开发者参与,覆盖的应用场景非常广泛。文心智能体平台的TOP100智能体是基于智能体的分发量、平均对话轮次、用户喜爱度等指标综合遴选出来的。