每日經(jīng)濟(jì)新聞 2025-04-29 20:38:21
近日,國(guó)家專(zhuān)精特新“小巨人”企業(yè)傳神語(yǔ)聯(lián)創(chuàng)始人何恩培接受了《每日經(jīng)濟(jì)新聞》記者的專(zhuān)訪。他認(rèn)為,當(dāng)前大模型競(jìng)爭(zhēng)雖激烈,但遠(yuǎn)未成熟,類(lèi)似1920年電氣時(shí)代,應(yīng)用尚未被充分發(fā)掘。智能語(yǔ)言服務(wù)行業(yè)正從“單純的語(yǔ)言轉(zhuǎn)換”轉(zhuǎn)向“知識(shí)理解與應(yīng)用”。傳神語(yǔ)聯(lián)選擇“后撤一步”,提供底層技術(shù)和工具。何恩培強(qiáng)調(diào),數(shù)據(jù)質(zhì)量重于數(shù)量,AI未來(lái)競(jìng)爭(zhēng)在于底層技術(shù)框架,“根原創(chuàng)”是根技術(shù)中最有生命力的部分。
每經(jīng)記者 可楊 每經(jīng)編輯 張海妮
開(kāi)欄語(yǔ)
大模型正從技術(shù)競(jìng)逐的“實(shí)驗(yàn)室”加速奔向產(chǎn)業(yè)落地的“深水區(qū)”。在這波浪潮中,一些先行者以敏銳的洞察力與破局勇氣,率先探索技術(shù)與場(chǎng)景的融合邊界——他們是打破算力桎梏的開(kāi)源先鋒,是深耕垂直領(lǐng)域的場(chǎng)景拓荒者,是構(gòu)建生態(tài)協(xié)同的產(chǎn)業(yè)布道者。
聚焦大模型應(yīng)用落地的“最后一公里”,我們對(duì)話以技術(shù)為矛、以場(chǎng)景為盾的探索者,試圖勾勒出一幅大模型賦能千行百業(yè)的“清明上河圖”,為行業(yè)提供可復(fù)用的方法論,也為中國(guó)AI產(chǎn)業(yè)的全球化突圍注入信心與動(dòng)能。
(策劃:郭榮村、李少婷)
義烏小商品城外貿(mào)出海成風(fēng),不懂英語(yǔ)的店員對(duì)著海外直播平臺(tái)熱情闡述,大模型幫他們將訂單統(tǒng)統(tǒng)攬下,這離不開(kāi)AI(人工智能)翻譯的功勞。
在大模型重塑千行萬(wàn)業(yè)的浪潮中,傳統(tǒng)翻譯已發(fā)展成為集語(yǔ)言理解、知識(shí)處理、文化適配于一體的綜合性智能服務(wù)體系。換句話說(shuō),翻譯不再是被動(dòng)接受技術(shù)賦能的領(lǐng)域,而是主動(dòng)引領(lǐng)大模型產(chǎn)業(yè)變革的前沿試驗(yàn)場(chǎng)。
但熱潮的另一面,是智能語(yǔ)言服務(wù)行業(yè)靜默的變革——機(jī)器翻譯增多,人類(lèi)譯員的工作并沒(méi)有隨之減少,然而單價(jià)出現(xiàn)下降;訂單量的增長(zhǎng)與盈利能力的滯漲構(gòu)成悖論。在這場(chǎng)人機(jī)博弈中,終極勝負(fù)手或許就藏在未被算法吞噬的認(rèn)知褶皺與知識(shí)基因之間。
近日,《每日經(jīng)濟(jì)新聞》記者專(zhuān)訪了國(guó)家專(zhuān)精特新“小巨人”企業(yè)——傳神語(yǔ)聯(lián)網(wǎng)網(wǎng)絡(luò)科技股份有限公司(以下簡(jiǎn)稱(chēng)傳神語(yǔ)聯(lián))創(chuàng)始人何恩培。
當(dāng)前,大模型的競(jìng)爭(zhēng)已邁入第三年,新的玩家突出重圍,座次又生變化。何恩培認(rèn)為,此時(shí)談定局為時(shí)尚早,大模型還遠(yuǎn)未成熟,當(dāng)前更像是1920年的電氣時(shí)代,基礎(chǔ)技術(shù)已經(jīng)誕生,但五花八門(mén)的應(yīng)用尚未被發(fā)掘。
在他看來(lái),智能語(yǔ)言服務(wù)行業(yè)正在從“單純的語(yǔ)言轉(zhuǎn)換”轉(zhuǎn)向“知識(shí)理解與應(yīng)用”。趨勢(shì)之下,傳神語(yǔ)聯(lián)選擇“后撤一步”,提供服務(wù)于行業(yè)的底層技術(shù)和工具。而在面向應(yīng)用提供服務(wù)的過(guò)程中,他們意識(shí)到,“大數(shù)據(jù)”并不適用,質(zhì)量更重于數(shù)量。
技術(shù)發(fā)展的腳步越快,各行各業(yè)面臨的拷問(wèn)就越相似——人工智能會(huì)取代我們嗎?
在這場(chǎng)關(guān)乎生存的討論中,智能語(yǔ)言服務(wù)行業(yè)是最早被卷入的領(lǐng)域之一。早在大模型熱潮來(lái)臨之前,機(jī)器翻譯就在不斷進(jìn)化,逐步蠶食著人工翻譯的生存空間。
這種焦慮也沖擊著客戶(hù)的預(yù)期:如果機(jī)器翻譯能做到“基本能看懂”,為什么還要支付高昂的翻譯費(fèi)用?
生成式AI席卷而來(lái),人工翻譯會(huì)成為最先被取代的職業(yè)嗎?
“我可以給大家一個(gè)結(jié)論:翻譯可能是人類(lèi)和機(jī)器博弈中最后消亡的行業(yè)。”何恩培篤信,語(yǔ)言不僅僅是溝通工具,也是人類(lèi)思考的“操作系統(tǒng)”,是一個(gè)復(fù)雜而動(dòng)態(tài)的體系,機(jī)器需要通過(guò)自然語(yǔ)言來(lái)理解世界。
但在這場(chǎng)人類(lèi)與機(jī)器的“博弈”中,智能語(yǔ)言服務(wù)行業(yè)呈現(xiàn)出一個(gè)值得探究的信號(hào):訂單增長(zhǎng)幅度顯著高于收入增長(zhǎng)。何恩培拋出這樣一組數(shù)據(jù):2024年,傳神語(yǔ)聯(lián)的智能語(yǔ)言服務(wù)收入增長(zhǎng)了10%,但訂單量增長(zhǎng)了30%。
表面上看,這是一個(gè)樂(lè)觀的信號(hào),訂單量增長(zhǎng)說(shuō)明市場(chǎng)需求仍然旺盛,但訂單的碎片化趨勢(shì)正在重塑行業(yè)——過(guò)去,一個(gè)翻譯訂單可能價(jià)值不菲,現(xiàn)在訂單金額卻越來(lái)越小,“因?yàn)榭蛻?hù)自己能‘看懂’了”。
機(jī)器翻譯的普及使得語(yǔ)言不再是障礙,提供智能語(yǔ)言服務(wù)也不再是一項(xiàng)“從頭到尾”的工作,而成為一種“修訂和優(yōu)化”的服務(wù)??蛻?hù)的需求變得更加精準(zhǔn)。同時(shí),客戶(hù)對(duì)人工翻譯的付費(fèi)意愿也在下降。既然機(jī)器能做到95%的準(zhǔn)確率,為什么還要收這么多錢(qián)?
然而,何恩培認(rèn)為,知識(shí)型產(chǎn)品具有一個(gè)顯著特征,即使機(jī)器翻譯的準(zhǔn)確率高達(dá)95%,但只要還需要人工從頭至尾審閱,以識(shí)別那5%的誤差,處理速度就會(huì)回落至人工水平。
人與機(jī)器的博弈最終帶來(lái)了企業(yè)間的博弈。客戶(hù)普遍認(rèn)為,機(jī)器進(jìn)行初步翻譯,僅需稍作修改即可,進(jìn)而付費(fèi)意愿降低;而為了獲客,智能語(yǔ)言服務(wù)企業(yè)選擇壓低價(jià)格,而成本端唯一的對(duì)沖方式,是不得不在部分場(chǎng)景中使用機(jī)器翻譯;機(jī)器不可避免地?fù)屪吡艘徊糠质袌?chǎng),而人類(lèi)譯員的工作量減少,但單價(jià)也隨之下滑。
博弈中,傳神語(yǔ)聯(lián)選擇“后撤一步”。何恩培解釋?zhuān)^(guò)去,智能語(yǔ)言服務(wù)公司直接服務(wù)于終端客戶(hù),但未來(lái),傳神要做的是“賦能”,讓合作伙伴,比如翻譯公司、中介機(jī)構(gòu),去覆蓋直接的語(yǔ)言需求,而傳神為他們提供底層技術(shù)和工具。
這一策略背后的核心邏輯是智能語(yǔ)言服務(wù)行業(yè),正在從“單純的語(yǔ)言轉(zhuǎn)換”轉(zhuǎn)向“知識(shí)理解與應(yīng)用”。“傳統(tǒng)翻譯的總量并沒(méi)有減少,而是產(chǎn)品形態(tài)發(fā)生了變化。”何恩培說(shuō),“客戶(hù)需要的,不再是簡(jiǎn)單的文本轉(zhuǎn)換,而是一整套基于大模型的知識(shí)處理能力。”
出海,早已成為各家科技企業(yè)繞不開(kāi)的話題。何恩培認(rèn)為,對(duì)于中國(guó)企業(yè)而言,AI出海的真正挑戰(zhàn)不僅是語(yǔ)言問(wèn)題,而是幫助企業(yè)在新的市場(chǎng)環(huán)境中實(shí)現(xiàn)知識(shí)遷移和業(yè)務(wù)落地。
“他們關(guān)心的是能不能聽(tīng)‘懂’。”何恩培認(rèn)為,理想的場(chǎng)景是,大模型成為一個(gè)知識(shí)轉(zhuǎn)換與傳遞的工具,但現(xiàn)實(shí)總比理想復(fù)雜。今天的大模型在語(yǔ)言覆蓋上仍存在很大局限,尤其是對(duì)于非英語(yǔ)市場(chǎng),數(shù)據(jù)的訓(xùn)練深度和準(zhǔn)確性仍不足以支撐高質(zhì)量的業(yè)務(wù)應(yīng)用。“每家企業(yè)的現(xiàn)有數(shù)據(jù)都很重要,因?yàn)槠髽I(yè)是依據(jù)自身特色出海。”
企業(yè)高質(zhì)量數(shù)據(jù)的稀缺,導(dǎo)致大模型在解決客戶(hù)的深度問(wèn)題上還沒(méi)有呈現(xiàn)出絕對(duì)優(yōu)勢(shì)。“我認(rèn)為(當(dāng)下)距離大模型真正解決客戶(hù)問(wèn)題還有一段路要走。”何恩培表示。
“過(guò)去企業(yè)把記錄和數(shù)據(jù)混在一起,他們認(rèn)為工單、硬盤(pán)(上的內(nèi)容)也是數(shù)據(jù),但這只能叫記錄和資料。”他指出,數(shù)據(jù)的價(jià)值并不在于存量,而在于其系統(tǒng)化以及可被機(jī)器學(xué)習(xí)和推理的程度。
在人工智能發(fā)展初期,行業(yè)普遍追求“大數(shù)據(jù)”——投入數(shù)量龐大的數(shù)據(jù)進(jìn)行訓(xùn)練,以換取更強(qiáng)大的模型能力。然而,當(dāng)大模型逐漸成為基礎(chǔ)設(shè)施時(shí),數(shù)據(jù)的“質(zhì)量”將比“數(shù)量”更重要。
在何恩培看來(lái),數(shù)據(jù)、參數(shù)和算法并非孤立存在,而是一種動(dòng)態(tài)平衡關(guān)系;數(shù)據(jù)和參數(shù)規(guī)模在一定范圍內(nèi)能帶來(lái)性能增長(zhǎng),但算法創(chuàng)新才是突破“天花板”的關(guān)鍵。
早期開(kāi)發(fā)翻譯軟件時(shí),何恩培已經(jīng)體會(huì)到數(shù)據(jù)和規(guī)則規(guī)模的邊際效應(yīng)。“當(dāng)我們?cè)O(shè)定了1.5萬(wàn)條翻譯規(guī)則時(shí),效果非常好。但當(dāng)規(guī)則規(guī)模擴(kuò)展到2萬(wàn)條(時(shí)),(效果)反而變差了。”原因很簡(jiǎn)單,數(shù)據(jù)之間、規(guī)則之間存在沖突,統(tǒng)計(jì)概率的關(guān)系也可能產(chǎn)生矛盾——換句話說(shuō),數(shù)據(jù)或參數(shù)在某個(gè)階段的增加確實(shí)能帶來(lái)提升,但當(dāng)增長(zhǎng)到一定程度,如果算法不突破,模型的質(zhì)量反而會(huì)下降。
數(shù)據(jù)問(wèn)題是傳神語(yǔ)聯(lián)提出“數(shù)推分離”架構(gòu)的核心原因。何恩培回憶,最早在2021年,傳神語(yǔ)聯(lián)為法律行業(yè)開(kāi)發(fā)了一套AI系統(tǒng),能夠?qū)W習(xí)過(guò)去十年的法律案例。然而客戶(hù)很快提出了一個(gè)關(guān)鍵問(wèn)題:新產(chǎn)生的數(shù)據(jù)怎么辦,還要重新訓(xùn)練一次嗎?
這促使他們開(kāi)始思考:如果數(shù)據(jù)和推理能夠分離,AI系統(tǒng)就可以在不依賴(lài)大規(guī)模訓(xùn)練的情況下,實(shí)現(xiàn)自我學(xué)習(xí)和進(jìn)化。“我們不需要把所有數(shù)據(jù)壓縮到神經(jīng)網(wǎng)絡(luò)里,而是讓推理大腦保持輕量化,同時(shí)支持實(shí)時(shí)學(xué)習(xí)。”何恩培解釋道,這種架構(gòu)不僅降低了模型的計(jì)算成本,還提高了適應(yīng)性,使其能夠在動(dòng)態(tài)環(huán)境中不斷優(yōu)化自身。
DeepSeek熱潮后,知名投資人朱嘯虎曾提出,以后給數(shù)據(jù)打標(biāo)簽的(工作)都需要博士生來(lái)做。何恩培認(rèn)同這個(gè)觀點(diǎn):“我們現(xiàn)在在處理數(shù)據(jù)時(shí),很多時(shí)候已經(jīng)是博士生在做了。”在當(dāng)下的人工智能熱潮中,數(shù)據(jù)的價(jià)值并不取決于它的數(shù)量,而取決于質(zhì)量,以及隱藏在其中的知識(shí)密度。
他舉例,如果一名律師在過(guò)去十年處理過(guò)500個(gè)案件,他的大腦中就沉淀了豐富的專(zhuān)業(yè)經(jīng)驗(yàn)。當(dāng)有人請(qǐng)教他相關(guān)的問(wèn)題時(shí),他不需要拿出所有的案卷逐條翻閱,而是可以直接給出綜合判斷和方法論,這位律師的大腦就是一個(gè)“行業(yè)大模型”,其價(jià)值在于知識(shí)的提煉,而不是原始數(shù)據(jù)的堆積。
何恩培認(rèn)為,AI的未來(lái),也將走向這樣的方向。企業(yè)往往不愿意分享自己的高價(jià)值數(shù)據(jù),因?yàn)閿?shù)據(jù)往往涉及核心業(yè)務(wù)和商業(yè)秘密,但這并不意味著數(shù)據(jù)無(wú)法轉(zhuǎn)化為價(jià)值:“數(shù)據(jù)可以不外流,但由數(shù)據(jù)訓(xùn)練出的智能是可以共享的。”
“回看我們的成長(zhǎng)路徑,從最早的2.1B模型,到現(xiàn)在的9B,我們從未在參數(shù)規(guī)模上盲目堆砌,也從未在算力上無(wú)止境投入。”何恩培表示,這并不是因?yàn)橘Y源不足,而是因?yàn)楣臼冀K認(rèn)為,這是一條更有效的技術(shù)路線。
在他的觀點(diǎn)中,衡量大模型價(jià)值的核心指標(biāo)并非參數(shù)規(guī)模,而是能否真正解決客戶(hù)的問(wèn)題。這種路徑在行業(yè)內(nèi)也帶來(lái)了一定的認(rèn)知挑戰(zhàn),銷(xiāo)售和前端團(tuán)隊(duì)有時(shí)會(huì)遇到客戶(hù)的疑問(wèn):模型參數(shù)還不到100億,算得上是大模型嗎?“但當(dāng)客戶(hù)真正使用后,他們就會(huì)明白,關(guān)鍵不在參數(shù),而在效果。”
在當(dāng)下的科技語(yǔ)境中,“國(guó)產(chǎn)”“根技術(shù)”“0到1”已然成為熱詞,但在何恩培眼中,這些概念的邊界遠(yuǎn)比市場(chǎng)討論的更加復(fù)雜。
何恩培認(rèn)為,根技術(shù)是產(chǎn)品和應(yīng)用最基礎(chǔ)的底層能力,它可以是自己研發(fā)的,也可以是基于開(kāi)源的,甚至是通過(guò)授權(quán)獲得的。但無(wú)論如何,“我們掌握了這項(xiàng)技術(shù),這項(xiàng)技術(shù)也屬于根技術(shù),掌握了根技術(shù),至少代表我們自己有了一定的主動(dòng)性”。而“(從)0到1的技術(shù)”則等于是某項(xiàng)應(yīng)用發(fā)明,它既可以在應(yīng)用層,也可以在根層。
在他看來(lái),AI的未來(lái)競(jìng)爭(zhēng),不僅僅是參數(shù)規(guī)模的競(jìng)賽,而是底層技術(shù)框架的競(jìng)爭(zhēng),未來(lái)人工智能會(huì)衍生出無(wú)數(shù)的行業(yè)專(zhuān)用模型,而這些模型的底層架構(gòu)將決定它們的智能邊界。
“根原創(chuàng)”是何恩培提出的概念,他認(rèn)為這是根技術(shù)當(dāng)中最有生命力的一部分,“你只有在‘根’上創(chuàng)新,才能真正擁有自己的技術(shù)思想。”何恩培強(qiáng)調(diào),技術(shù)體系是帶有思想性的,如果所有的技術(shù)來(lái)源都依賴(lài)于外部的開(kāi)源框架,就很難擺脫既有框架的思想束縛。而當(dāng)企業(yè)在根技術(shù)層面擁有自主權(quán)時(shí),它不僅能擺脫對(duì)外部技術(shù)的依賴(lài),還能決定自身技術(shù)演進(jìn)的方向,這才是最有創(chuàng)新價(jià)值的部分。
在商業(yè)層面,大模型競(jìng)賽邁入第三年,關(guān)于大模型的商業(yè)模式、技術(shù)最終是不是應(yīng)該是免費(fèi)的,在行業(yè)內(nèi)越來(lái)越被關(guān)注。過(guò)去,許多科技公司的商業(yè)模式都是先“燒錢(qián)做免費(fèi)”,再通過(guò)其他方式盈利。例如,搜索引擎免費(fèi),但靠廣告賺錢(qián);手游免費(fèi),但靠道具收費(fèi)。
然而,大模型的情況似乎更為復(fù)雜。何恩培的核心觀點(diǎn)是:To B(企業(yè)級(jí))市場(chǎng)的AI服務(wù),不可能是免費(fèi)的。“企業(yè)使用AI的核心目的是解決業(yè)務(wù)問(wèn)題,而解決問(wèn)題就一定會(huì)有成本。”他說(shuō),“只是說(shuō)在競(jìng)爭(zhēng)中把成本降到最低,一定不會(huì)免費(fèi)。因?yàn)椋ㄒ坏┟赓M(fèi),它就缺乏了這項(xiàng)技術(shù)持續(xù)運(yùn)轉(zhuǎn)的能力,這由技術(shù)的稀缺性和商業(yè)模式共同決定。”
何恩培認(rèn)為,今天的大模型遠(yuǎn)遠(yuǎn)沒(méi)有成熟,市場(chǎng)格局還未定型,現(xiàn)在討論最終格局為時(shí)尚早。
當(dāng)前更像是1920年的電氣時(shí)代,電力技術(shù)已經(jīng)成熟,但沒(méi)人能想到后面還有那么多家電、設(shè)備會(huì)被發(fā)明出來(lái)。一方面,今天的大模型很多問(wèn)題尚未解決,不可能像一個(gè)成熟產(chǎn)品一樣占領(lǐng)所有領(lǐng)域;另一方面,當(dāng)前市場(chǎng)競(jìng)爭(zhēng)依舊集中在通用大模型方面,但垂直場(chǎng)景中的模型尚未爆發(fā)。“也許未來(lái)可能有一萬(wàn)個(gè)AlphaFold在不同行業(yè),這才(會(huì))形成大模型的完整生態(tài)。”何恩培說(shuō)。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP