正在人工智能技艺飞速繁荣的2025年,大模子技艺正从简单的天生才气向庞大的众模态Agent场景深化。
12月18日,火山引擎正在2025冬季Force原动力大会上,正式发外了最新的豆包大模子1.8和音视频创作模子Seedance 1.5 pro。众个威望评测数据显示,豆包大模子正在众模态通晓、天生才气及Agent才气上,已跻身环球第一梯队。
别的,火山引擎还交出了一份令人注意的AI功劳单。据火山引擎总裁谭待先容,截至本年12月,豆包大模子日均token应用量冲破50万亿,较旧年同期延长逾越10倍;而且目前火山引擎已有逾越100家企业客户累计token应用量逾越1万亿。
![]()
谭待正在接纳《中邦筹划报》等媒体记者采访时暴露:“火山引擎还会一向通过技艺和产物更始,通过更高主意的封装、本钱的优化,饱舞人工智能技艺门槛连接低浸,最终竣工人工智能的普惠化落地。”
字节跳动最新发外的豆包大模子1.8(Doubao-Seed-1.8)最大的技艺亮点正在于其针对众模态Agent场景的定向优化。
古代的措辞模子更众是一个常识库,而豆包大模子1.8则被策画为一个践诺器,它的用具移用才气、庞大指令依照才气及OS Agent才气均获得巩固,擢升了模子正在执掌庞大职业时的计议与践诺程度。
最初值得闭心的是,豆包大模子1.8的众模态通晓才气竣工了较大的奔腾。豆包大模子1.8大幅擢升了视觉通晓的基本才气,单次视频通晓帧数从640帧大幅擢升至1280帧,这一技艺擢升使模子不妨以低帧率通晓超长视频,并能移用用具对环节片断举办高帧率通晓,为正在线培养、产物格检等场景供应壮健接济。
比方,正在正在线培养界限,模子可能主动判辨长达数小时的课程视频,天生精准的常识点总结;正在工业质检界限,它可能继续监控临蓐线视频流,捉拿渺小的缺陷刹那。
正在庞大的贸易场景中,简单的问答往往无法处置题目,执掌庞大题目的Agent才气就显得更首要。豆包大模子1.8明显巩固了用具移用才气(Tool Use)和庞大指令依照才气、GUI Agent才气等。
这意味着模子不再被动恭候指令,而是不妨像一个人味丰裕的项目司理相通,对庞大职业的计议、践诺、流程通晓才气,更适适用来开采执掌庞大、众步、众分支的企业级Agent。
豆包大模子1.8还接济256K长上下文窗口,接济通过API举办上下文束缚。只需通过API传参就能乖巧整理上下文,能更好地接济模子告终长程Agent职业。
另外,通过更大的图片转tokens压缩比和思索长度可医治优化,豆包大模子1.8正在功效擢升的同时进一步优化了本钱。
这一系列模子才气的优化,使豆包大模子1.8出格适合执掌企业级庞大Agent职业,正在培养、客服、金融、法令、审核等场景浮现杰出。
正在众项公然评测中,豆包大模子1.8展示出较强的逐鹿力。正在视觉推理、通用视觉问答、空间通晓及视频通晓等职业中,均得到最佳或亲切最佳功劳;正在通用智能体测评集BrowseComp上浮现环球领先;正在数学与推理等基本才气维度上,团体程度已亲切环球顶尖的通用模子。
对付邦内大模子市集的逐鹿境遇,谭待则以为:“目前各大模子之间最首要的不是逐鹿。来岁大模子的市集范畴能再伸张10倍,各方闭心的主题不是存量下的零和博弈,而是怎么联袂拓荒更广漠的延长空间。”
即使说豆包大模子1.8是“大脑”,那么Seedance 1.5 pro则是火山引擎正在“动作”层面的极致打磨。正在AIGC(天生式人工智能)产生的本日,视频天生早已不是“能不行做出来”的题目,而是“做得有众真、众细”的题目。
过往的AI视频模子,往往采用“先画后音”或“先音后画”的串行形式,导致天生的视频往往浮现口型对不上、配乐与心绪离开的尴尬。最新推出的Seedance 1.5 pro采用了更始的原生音视频笼络天生架构,不妨同时执掌境遇音、配景音乐和人声对白,而且擢升了脚色的口型、语调与演出节律的拟合精度,竣工了毫秒级的音画同步输出。让声响不再是画面的“隶属品”,而是叙事的有机构成一面。
而且,正在对白执掌上,Seedance 1.5 pro模子接济众人众措辞对话,口型对齐精准,笼罩中文方言(如四川话、粤语等)、英文及小语种,极大地擢升了视频内容的可靠感与环球化创作潜力。
正在运动细节的捉拿和人物心绪的细腻透露上,Seedance 1.5 pro曾经到达了影视级的尺度。无论是风吹过发梢的动态,依然伶人眼神中的轻细变更,模子都能精准还原,给与了AI视频更众的濡染力。
而且,Seedance 1.5 pro还具备自觉的镜头更改才气,可践诺长镜头跟班、希区柯克变焦等高难度专业运镜,同时还能竣工影戏级的画面相接与专业影调,大幅擢升了视频的动态张力。
为进一步低浸创作门槛与本钱,Seedance系列即将上线“Draft样片”功效。创作家可先天生低分别率样片举办预览,其环节因素与最终成片高度相仿,真正做到“预览即所得”。依照字节跳动测算的数据显示,该功效可助助创作家擢升65%的团体服从,并削减60%的无效创作本钱。
目前,部分用户已可正在豆包、即梦AI等平台体验该模子;企业用户则可从12月23日起,通偏激山引擎API接入Seedance 1.5 pro模子办事。
对付视频修制行业来说,Seedance 1.5 pro的发外,正正在从头界说着视频修制行业的修制流程,更显示出AI出手向中高端影视修制后期市集排泄。
跟着企业Agent操纵从轻量化试点向威苛临蓐场景排泄,谭待指出,古代的IT架构已无法餍足Agent时期的需求,以模子为核心的AI云原生架构正正在变成,并盘绕Agent的开采与运营举办重构。
正在Agent开采层面,火山引擎完全升级了企业级AI Agent平台——AgentKit。该平台笼罩了Agent从开采、安排到管控的全性命周期,该平台旨正在处置企业正在Agent落地中面对的身份权限束缚、模子确定性及编制集成等中心挑衅,为企业级Agent供应圆满的底座才气。
小米集团技艺委员会基本技艺平台部总司理张铎分享道:“正在手机营业端,两边基于AI云原生架构,促进小米办事上云,告终CPU代次升级,竣工资源交付周期从一周缩短到10分钟以内。正在汽车营业上,AI云原生计划助助咱们擢升磨练宁静性和仿真服从,使算法迭代和上车周期大幅缩短。”
正在Agent运营层面,火山引擎推出了HiAgent智能体事务站。该事务站通过构修同一的企业AI职业更改核心、供应一系列开箱即用的通用智能体,以及接济特性化定制智能体操纵,助助企业竣工Agent的范畴化束缚与操纵。正在2025年累计办事数百家企业,网罗中邦银联、招商银行、长安汽车、紫金矿业等行业头部企业。
而企业Agent目前正产生着两大环节超出:均匀一家企业投产的智能体数目从2024年的几十个增至2025年的200众个,部分企业以至逾越千个;操纵场景从最初的ToC文娱场景,逐渐延迟到ToB的威苛临蓐场景,操纵价格连接开释。
为低浸企业应用门槛,火山引擎发外了豆包助手API和AI精打细算策划。豆包助手API将豆包对话、思索、查找等中心才气通过API方法绽放,让企业竣工开箱即用,而且还可直接正在产物中构修自界说豆包。AI精打细算策划是业内首个全模子插足抵扣的精打细算策划,基于客户每月许可的用量计议,编制会主动配合对应的扣头权柄。该策划通过阶梯式扣头,最高能助助企业精打细算47%的本钱。
“通过从模子才气到基本办法的完全改革,火山引擎正正在饱舞AI操纵从简单的模子移用向庞大的Agent智能体生态演进,加快AI才气正在各行各业的深度落地。”谭待说道,“本年算是Agent的元年,来岁Agent确定还会连接产生。”