全球快播：昆侖萬維CEO方漢：AI大模型的競賽關(guān)鍵在于工程積累

來源：上海證券報(bào)·中國證券網(wǎng) 時(shí)間：2023-04-19 09:42:17

上證報(bào)中國證券網(wǎng)訊（記者羅茂林郭成林）4月17日，昆侖萬維宣布正式發(fā)布千億級(jí)大語言模型“天工”，同時(shí)宣布即日起啟動(dòng)邀請(qǐng)測試。上海證券報(bào)記者第一時(shí)間受邀參與了此次內(nèi)測，從初步體驗(yàn)來看，這款大模型在日常性回答方面表現(xiàn)出色，值得注意的是，在部分需要揣摩情感的題目上，這款大模型也表現(xiàn)出了不錯(cuò)的推理能力。

據(jù)了解，“天工”由昆侖萬維與國內(nèi)領(lǐng)先的AI團(tuán)隊(duì)奇點(diǎn)智源聯(lián)合研發(fā)，是國內(nèi)對(duì)標(biāo)ChatGPT的雙千億級(jí)大語言模型，也是昆侖萬維繼AI繪畫產(chǎn)品“天工巧繪”后的又一款生成式AI產(chǎn)品。

(資料圖片)

在大廠密集發(fā)布AI大模型產(chǎn)品的當(dāng)下，昆侖萬維此次推出的“天工”令市場頗為關(guān)注。方漢第一時(shí)間接受上海證券報(bào)記者獨(dú)家專訪，分享了公司在AI領(lǐng)域的最新布局。

眼下，國內(nèi)外在AI技術(shù)領(lǐng)域上的差距可謂是市場關(guān)注的熱點(diǎn)。對(duì)此，方漢告訴記者，中外的實(shí)際情況（差距）恐怕并非大眾想象的那么大。“中國在過去二十年，培養(yǎng)了大量的程序員工程師，近十年來在人工智能領(lǐng)域，中國的工程師數(shù)量可能僅次于美國。”對(duì)于此次OpenAI的崛起，在他看來，更像是“一家公司領(lǐng)先其他公司”，而非“一個(gè)國家領(lǐng)先其他國家”。

據(jù)了解，成立于2008年的昆侖萬維，從網(wǎng)絡(luò)游戲業(yè)務(wù)起步，2009年成為中國最早出海的互聯(lián)網(wǎng)企業(yè)之一。基于業(yè)務(wù)場景洞察，以及對(duì)人工智能技術(shù)的前瞻性判斷，昆侖萬維從2020年開始布局AI音樂領(lǐng)域。2022年，昆侖萬維從音樂AI往多模態(tài)AI拓展，并和奇點(diǎn)智源就百億級(jí)大語言模型、圖像AIGC、編程AIGC等技術(shù)領(lǐng)域達(dá)成全面技術(shù)戰(zhàn)略合作，在2022年底宣布模型開源。

值得一提的是，作為國內(nèi)程序領(lǐng)域最早發(fā)起開源運(yùn)動(dòng)的倡議者，此次方漢帶領(lǐng)的“天工”團(tuán)隊(duì)，在項(xiàng)目開發(fā)過程中也得到了開源社區(qū)上百位AI科學(xué)家助力。此外，“天工”團(tuán)隊(duì)投入大量資源攻克了中文語料庫的質(zhì)量瓶頸，從數(shù)十萬億的數(shù)據(jù)中清洗、篩選出了3萬億單詞數(shù)據(jù)用于訓(xùn)練大模型。

有意思的是，對(duì)于“中文素材有限就一定做不出中文AI”這一論調(diào)，方漢告訴記者，這實(shí)際上是一個(gè)普遍存在的誤區(qū)?！爸拔覀円舱J(rèn)為訓(xùn)練語料的語種會(huì)對(duì)模型產(chǎn)生此類影響?！比欢S著業(yè)內(nèi)訓(xùn)練模型參數(shù)規(guī)模不斷擴(kuò)大，一種神奇的“遷移”現(xiàn)象出現(xiàn)了?！拔覀兒髞戆l(fā)現(xiàn)，當(dāng)模型參數(shù)規(guī)模突破1000億的時(shí)候，模型本身就會(huì)發(fā)生質(zhì)變，其中一大特點(diǎn)就是展現(xiàn)出不同語種直接的‘遷移’能力?！?/p>

據(jù)方漢介紹，在“遷移”現(xiàn)象出現(xiàn)后，即使純英文訓(xùn)練的模型，在用中文回答問題時(shí)也能夠表現(xiàn)出不俗的應(yīng)對(duì)能力。方漢笑稱，這或許就是AI的觸類旁通。

值得注意的是，采訪中當(dāng)談及當(dāng)下AI大模型訓(xùn)練的關(guān)鍵點(diǎn)時(shí)，不同于大眾認(rèn)知的“缺算力”和“缺數(shù)據(jù)”，方漢坦言最大的差距將會(huì)是不同項(xiàng)目組之間的工程經(jīng)驗(yàn)積累。

數(shù)據(jù)上的問題有了AI的“遷移”能力自然不在話下。而從算力上看，“這些年我們的工程師可以通過優(yōu)化算法，不斷抬高算力天花板。”方漢說道，相比之下，對(duì)于大模型此類大項(xiàng)目的工程調(diào)度，精細(xì)化調(diào)試將成為最大短板。

方漢解釋道：“以訓(xùn)練數(shù)據(jù)為例，其實(shí)業(yè)界最難的不是找數(shù)據(jù)，而是如何給AI投喂數(shù)據(jù)。什么樣的數(shù)據(jù)不能使用，篩選數(shù)據(jù)的標(biāo)準(zhǔn)是什么，如何做數(shù)據(jù)的剪枝、清洗等。通過篩選數(shù)據(jù)調(diào)整參數(shù)、改進(jìn)模型設(shè)計(jì)才是最核心的機(jī)密，這也是OpenAI沒有在論文中公開的核心技術(shù)。”

對(duì)此，方漢坦言國內(nèi)的團(tuán)隊(duì)仍然需要不斷地探索，他預(yù)言未來的大模型生態(tài)主要有兩類參與者，一類做底層模型，一類做上層的應(yīng)用產(chǎn)品?！拔艺J(rèn)為這個(gè)生態(tài)會(huì)相對(duì)均衡，不會(huì)一家獨(dú)大。”采訪最后，方漢頗為樂觀地說道。

（文章來源：上海證券報(bào)·中國證券網(wǎng)）

關(guān)鍵詞：