2025年2月,DeepSeek刷屏的那個春節(jié),梁汝波在全員會上說了六個字:跟進速度不夠。
一年后的2026年2月,豆包2.0發(fā)布前夕,火山引擎拿下了春晚獨家AI云合作伙伴的身份。從「缺席者」到「造浪者」,中間剛好隔了一整年,365天。
這一年里,阿里瘋狂發(fā)力,一口氣發(fā)了上百個模型;騰訊也動了大動作,重組了AI Infra部;百度更直接,把文心給開源了。
唯獨字節(jié),出牌頻率反而變得特別低,看著有點反常,但它并沒缺席這場競賽,只是把籌碼都押在了大家看不見的地方。
這篇年終復(fù)盤,只想回答一個問題:字節(jié)看不見的押注,是如何在2026年春節(jié)前,變成一發(fā)不可收拾的?
如果說 2023 到 2024 年,字節(jié)大模型走的是「突擊隊」路子,打快仗、搶熱點,快速完成從 0 到 1 的布局,那 2025 年,字節(jié)大模型正式進入了「吳永輝時間」。
這位被寄予厚望的新帥上任后,做的第一件事,就驚到了整個字節(jié):他直接給Seed團隊取消了季度OKR,甚至連半年考核都給撤了。
要知道,字節(jié)可是出了名的講「字節(jié)范兒」、喊「Always Day One」,在這樣一家公司里,取消考核這事兒,簡直就是「政治不正確」。
但吳永輝有他自己的道理:
要是方向從一開始就錯了,讓大家三個月交一次答卷,只會更快把路走死;字節(jié)的DNA是「小步快跑、快速迭代」,可這套邏輯,到了大模型領(lǐng)域,根本不好使。
那時候的字節(jié)大模型團隊,已經(jīng)染上了嚴(yán)重的「大公司病」。
2025年初,AI Lab、Seed團隊、視覺生成團隊、豆包產(chǎn)品技術(shù)部,這四支隊伍就跟四條平行線似的,各有各的匯報線,各搞各的研發(fā)節(jié)奏,互不相干。
AI Lab由李航帶隊,主打?qū)W術(shù)研究;Seed團隊歸吳永輝管,重點放在實際應(yīng)用上;視覺團隊剛從阿里挖來周暢,還在磨合,而豆包的技術(shù)負(fù)責(zé)人朱文佳,更是直接向梁汝波匯報。
大家互相搶資源、隱性競爭,甚至出現(xiàn)過同一個需求,四家團隊各自埋頭做的荒唐事兒。
吳永輝入職后,Seed團隊前后搞了三次組織收斂,一步步把分散的力量擰成一股繩。
2025 年 3月份,AI Lab整體并入Seed,李航開始向吳永輝匯報,原來集團級研究部門的光環(huán)沒了,所有研發(fā)力量,都?xì)w到了同一個指揮體系下。
到了年中,隨著楊建朝暫休,字節(jié)從阿里挖來周暢接手視覺多模態(tài)團隊,文生圖 Seedream、文生視頻 Seedance 等多模態(tài)團隊的管理權(quán)限,同步納入 Seed 整體體系,周暢直接向吳永輝匯報,多模態(tài)研發(fā)與大模型主干能力實現(xiàn)了同頻調(diào)度。
最關(guān)鍵的一步,在10月份落地,豆包技術(shù)負(fù)責(zé)人朱文佳,直接匯報對象從梁汝波改成了吳永輝。
這是字節(jié)為數(shù)不多以「收斂」而非「擴張」為核心目的的組織整合。
過去十年,字節(jié)擅長分,抖音分出頭條、飛書、TikTok。但大模型競賽的后半程,比的不是誰開的分支多,是誰的主干粗。
為了讓這根「技術(shù)主干」更扎實,吳永輝入職后,一直鼓勵研究員深耕基礎(chǔ)研究、積極輸出頂會論文,2025 年上半年,Seed 團隊在國際頂級學(xué)術(shù)會議上發(fā)布的論文數(shù)量,比2024 年同期實現(xiàn)了翻倍增長。
但理想與業(yè)務(wù)現(xiàn)實之間,終究有需要平衡的鴻溝。
到了三季度,豆包2.0的發(fā)布節(jié)點越來越近,管理層對發(fā)論文也有了新要求:內(nèi)容必須和正在迭代的核心技術(shù)沒關(guān)系,不能影響產(chǎn)品上線。
2026年1月,梁汝波在全員會上,把核心關(guān)鍵詞改了,從之前的「探索智能上限」,變成了「勇攀高峰」和「AI模型能力要做到行業(yè)前列」。
從「探索」到「做到」,這七個字的變化,是2025年字節(jié)組織調(diào)整的全部答案:它不再滿足于做一個「參與者」,它要做「第一梯隊」,甚至要做「唯一」。
組織收斂的效果好不好,最終還得靠產(chǎn)品來檢驗,2025年上半年,豆包在用戶心里的形象,特別分裂。
它聊起天來是真厲害,情緒價值給得足足的,你跟它嘮一宿情感八卦、吐吐槽,它都能接住。
可要是你讓它查機票、比價格,或者完成一個需要多步驟的任務(wù),它大概率只會給你一段通用攻略,然后,熱情地問你還有什么能幫你的嗎,根本解決不了實際問題。
「聊天機器」和「辦事助理」之間,隔著一道實打?qū)嵉镍櫆稀6止?jié),選了一條最笨、也最扎實的路來填這個坑:死磕「聽懂人話」和「把事辦成」這兩件事。
2025年11月,豆包的語音對話功能,上線了一個看似不起眼、但實際特別難的功能:同一個音色里,能流暢切換粵語、四川話、東北話、陜西話四種方言,還能識別20種方言。
為了做好這個體驗,字節(jié)讓同一批聲優(yōu),用不同的方言錄制一模一樣的語料。這就意味著,錄音成本直接翻了一倍,后期的標(biāo)注工作,復(fù)雜度更是呈指數(shù)級上升。
有人可能會問,為啥要費這么大勁做方言功能?
答案很簡單:打基礎(chǔ),做基建。中國有超過10億人說方言,這其中,有大量的中老年用戶,不會打字、也不熟悉App的操作邏輯,但他們會對著手機說話。
讓AI學(xué)會方言,是為了讓四川的老人、廣東的阿姨能毫無門檻地用起來。這是字節(jié)在爭奪「下一個10億用戶」的入場券。
方言降低了開口的門檻,而「Agent(智能體)」則解決動手的問題。
字節(jié)在這條坎上的爬升路徑,清晰地寫進了2025年的版本日歷里,2025年6月11日,豆包1.6版本發(fā)布,譚待在發(fā)布會上,演示了一個讓所有人都眼前一亮的場景:
拍一張購物小票,模型能自動整理成Excel表格;你隨口說一句話,模型能自動操作瀏覽器,幫你完成酒店預(yù)訂。他把這次升級的核心,總結(jié)成了三個字:「行動力」。
到了12月,豆包1.8版本發(fā)布,Agent能力又上了一個臺階,能調(diào)用十幾個工具,在多個電商平臺之間來回切換,幫你完成耳機的全網(wǎng)比價,還能選出最優(yōu)選項。
從「能做一件事」到「能做一系列事」,字節(jié)一點點補齊了豆包「辦事能力」的短板。但這也帶來了一個致命的新問題:成本太高。
Agent執(zhí)行一次任務(wù),消耗的Token數(shù)量,是普通聊天的幾十倍。要是單次調(diào)用的成本降不下來,哪怕Agent再厲害,也只能停留在實驗室里,根本沒法大規(guī)模推廣、給更多人用。
在 2025 年火山引擎春季原動力大會上,譚待曾直言,通過底層技術(shù)的持續(xù)優(yōu)化,大模型推理成本未來還有 99% 的下降空間。
這一判斷,也為字節(jié)后續(xù)的成本戰(zhàn)、技術(shù)債清零,定下了核心基調(diào)。
2025 年 11 月,火山引擎發(fā)布官方公告:Doubao-pro-32k、Doubao-vision-pro-32k 等十余款 2024 年發(fā)布的舊版本模型,將逐步停止服務(wù),引導(dǎo)用戶遷移到最新的 Seed 系列模型。
這是字節(jié) 2025 年最激進、卻也最容易被外界忽略的關(guān)鍵動作。
公告發(fā)布后,客服收到了大量企業(yè)開發(fā)者的反饋,畢竟對開發(fā)者而言,模型版本切換意味著接口重接、代碼重改、全流程回歸測試,成本極高。
但字節(jié)硬推了。因為譚待算過一筆賬:
智能體時代已經(jīng)到來,大模型的調(diào)用量只會迎來指數(shù)級增長。到那個時候,如果還背著 2023 年的老版本、2024 年的 Pro 版、各類客戶特供版等多套技術(shù)架構(gòu),成本窟窿只會越來越大,根本填不上。
只有把所有模型的內(nèi)核統(tǒng)一起來,才能釋放規(guī)模飛輪的紅利。這不僅是清零之前的技術(shù)債,更是對商業(yè)模式的一次徹底重構(gòu)。
字節(jié)的成本優(yōu)勢,靠「算力精算」,把每一分錢都花在刀刃上。
大模型服務(wù)的成本困境,根源很簡單,就是一種浪費:「快車要等慢車」。用戶的輸入請求,有的短到只有10個詞,有的長到10萬詞,把這些請求混在一起處理,系統(tǒng)就得按照最慢的那個來調(diào)度,大量的算力就這么被閑置了,特別可惜。
字節(jié)的解法是「區(qū)間定價」和「PD分離」。
2025年6月,豆包1.6版本,首次推出了「區(qū)間定價」:0到32K的輸入?yún)^(qū)間,價格直接打到0.8元/百萬tokens,綜合成本比1.5版本和DeepSeek R1降低了63%;32K以上的輸入,價格再逐級上浮。
這就跟快遞打包一個道理,要把所有尺寸的包裹混在一起裝,肯定特別浪費空間;要是按尺寸分類打包,至少能省下三分之一的紙箱。
更深層的邏輯是「PD分離」,把處理長文本的「預(yù)填充」階段,和生成文本的「解碼」階段拆開,用不同的硬件、不同的策略來處理,效率一下子就提升了好幾倍。
這套邏輯的前提是:所有的優(yōu)化,只能做一遍。
要是同時維護好幾套架構(gòu),每做一次優(yōu)化,就得在每套架構(gòu)上都來一遍,邊際成本永遠(yuǎn)降不下來;所以說,「舊模型大下架」,是「降價99%」的必要前提,也是字節(jié)向全行業(yè)發(fā)起「成本戰(zhàn)爭」的宣戰(zhàn)書。
數(shù)據(jù)證明了這一策略的成功。
2025 年 5 月底,豆包日均 Token 調(diào)用量已達(dá) 16.7 萬億;9月突破30萬億;12月突破50萬億,較2024年同期增長超10倍。IDC報告顯示,2025年上半年中國公有云大模型服務(wù)市場,火山引擎份額達(dá)到49.2%。
當(dāng)同行在2025年下半年被迫跟進降價時,字節(jié)已經(jīng)通過清掉技術(shù)債,獲得了結(jié)構(gòu)性的成本優(yōu)勢;這種優(yōu)勢一旦建立,很難被單純的價格戰(zhàn)顛覆。
組織收斂了,技術(shù)債清了,成本降下來了,最后一塊拼圖是「節(jié)奏」。
字節(jié)為什么能從2025年春節(jié)的「缺席者」變成2026年春節(jié)的「主角」?在我看來,它終于找到了屬于自己的研發(fā)節(jié)奏,它把春節(jié),變成了自己的iPhone發(fā)布會,每年都要搞個大動作。
這套「春節(jié)錨定法」,是一種「研發(fā)倒逼機制」:
別的公司都是按財季規(guī)劃模型發(fā)布,字節(jié)卻是按春節(jié)倒排工期,1月份必須封版,2月份必須上線,前一年夏天,就得把技術(shù)路線定死。
2025 年春節(jié)的被動,讓字節(jié)意識到,靠「突擊隊」模式打游擊、追熱點,永遠(yuǎn)只能跟著行業(yè)節(jié)奏走,永遠(yuǎn)無法建立自己的領(lǐng)先優(yōu)勢。
而 2026 年春節(jié)的全面爆發(fā),正是這套節(jié)奏管理的第一次大考:春晚獨家 AI 云合作、豆包 2.0、多模態(tài)能力的全面升級,這一系列動作,都是吳永輝入職一年來,組織收斂、技術(shù)清債、成本優(yōu)化的集中成果爆發(fā)。
據(jù)行業(yè)媒體披露,2026 年 2 月 14 日,豆包 2.0 將正式發(fā)布。這是字節(jié)大模型遲到的全面進攻信號,但這場關(guān)于通用人工智能的戰(zhàn)役,其實才剛剛開始。
站在 2026 年春節(jié)的節(jié)點回望與前瞻,字節(jié)面前,還有三個更難、更長遠(yuǎn)的課題需要解決。
第一個,是「閉源模式的持續(xù)性」。
2025年,阿里開源了Qwen3全系列,衍生模型超17萬個,形成了龐大的開源生態(tài);百度開源了文心,甚至連騰訊混元也開始在部分版本上開源。字節(jié)是唯一堅持閉源路線的中國大廠。
這套模式能走得通,前提是:
火山引擎的 To B 服務(wù)收入,與豆包的 To C 用戶黏性,能持續(xù)反哺 Seed 團隊的巨額研發(fā)投入,形成「研發(fā) - 落地 - 營收 - 再研發(fā)」的正向循環(huán)。
如果下一階段開源模型能力追平閉源,開發(fā)者還會不會為「獨家調(diào)用權(quán)」付費?字節(jié)賭「體驗優(yōu)先」,但這是一場孤獨的豪賭。
其次,是固定節(jié)點錨定的反作用力。
把研發(fā)節(jié)奏錨定在春節(jié)這一個節(jié)點上,好處是目標(biāo)清晰、全鏈路同頻,代價是每年核心的重磅發(fā)布,基本只有一次扣扳機的機會。
2025年春節(jié)的缺席是代價,2026年春節(jié)打響也是代價;如果2027年春節(jié)前被對手刻意狙擊,或者產(chǎn)品不及預(yù)期,代價將是巨大的。
最后是「巨頭的底牌」。
騰訊在2025年底重組了AI Infra部,由大模型負(fù)責(zé)人姚順雨直接管,手里還握著微信這個有12億用戶的超級入口,一旦騰訊決定把大模型全量導(dǎo)入微信,那流量優(yōu)勢,是字節(jié)根本比不了的。
阿里云也沒閑著,2025年9月發(fā)布了萬相2.5,12月又把千問接入了萬相2.6。它在開源生態(tài)上的厚度,還有在云服務(wù)領(lǐng)域的深耕,不是字節(jié)用一年時間就能追上的。
還有DeepSeek。沒人知道那家創(chuàng)業(yè)公司2026年還能拿出什么黑科技。
一年前梁汝波那句「跟進速度不夠」,在 2025 年被字節(jié)整個大模型團隊反復(fù)咀嚼,成為了全力奔跑的動力。
2026年春節(jié),字節(jié)用一場精密的「造浪」證明了它已經(jīng)補上了短板,把一支3000人的突擊隊改裝成了有節(jié)拍器的正規(guī)軍。
但大模型的競賽沒有終點。
本可以做得更好的遺憾,字節(jié)用 365 天成功改寫;但「還可以更好」的追求,是這條賽道上永遠(yuǎn)劃不掉的命題。字節(jié)用365天證明了自己會追趕、會切換,它需要下一個365天,證明自己配得上「長期主義者」這個稱號。
春節(jié)總會再來,字節(jié)作為進攻者的戰(zhàn)役,才剛剛拉開序幕;不一定對,個人觀察。

小程序
掃碼打開微信小程序
APP下載
掃碼下載市場部網(wǎng) App





