上證報(bào)中國證券網(wǎng)訊(記者羅茂林郭成林)4月17日,昆侖萬維宣布正式發(fā)布千億級(jí)大語言模型“天工”,同時(shí)宣布即日起啟動(dòng)邀請(qǐng)測試。上海證券報(bào)記者第一時(shí)間受邀參與了此次內(nèi)測,從初步體驗(yàn)來看,這款大模型在日常性回答方面表現(xiàn)出色,值得注意的是,在部分需要揣摩情感的題目上,這款大模型也表現(xiàn)出了不錯(cuò)的推理能力。
據(jù)了解,“天工”由昆侖萬維與國內(nèi)領(lǐng)先的AI團(tuán)隊(duì)奇點(diǎn)智源聯(lián)合研發(fā),是國內(nèi)對(duì)標(biāo)ChatGPT的雙千億級(jí)大語言模型,也是昆侖萬維繼AI繪畫產(chǎn)品“天工巧繪”后的又一款生成式AI產(chǎn)品。
(資料圖片)
在大廠密集發(fā)布AI大模型產(chǎn)品的當(dāng)下,昆侖萬維此次推出的“天工”令市場頗為關(guān)注。方漢第一時(shí)間接受上海證券報(bào)記者獨(dú)家專訪,分享了公司在AI領(lǐng)域的最新布局。
眼下,國內(nèi)外在AI技術(shù)領(lǐng)域上的差距可謂是市場關(guān)注的熱點(diǎn)。對(duì)此,方漢告訴記者,中外的實(shí)際情況(差距)恐怕并非大眾想象的那么大。“中國在過去二十年,培養(yǎng)了大量的程序員工程師,近十年來在人工智能領(lǐng)域,中國的工程師數(shù)量可能僅次于美國。”對(duì)于此次OpenAI的崛起,在他看來,更像是“一家公司領(lǐng)先其他公司”,而非“一個(gè)國家領(lǐng)先其他國家”。
據(jù)了解,成立于2008年的昆侖萬維,從網(wǎng)絡(luò)游戲業(yè)務(wù)起步,2009年成為中國最早出海的互聯(lián)網(wǎng)企業(yè)之一。基于業(yè)務(wù)場景洞察,以及對(duì)人工智能技術(shù)的前瞻性判斷,昆侖萬維從2020年開始布局AI音樂領(lǐng)域。2022年,昆侖萬維從音樂AI往多模態(tài)AI拓展,并和奇點(diǎn)智源就百億級(jí)大語言模型、圖像AIGC、編程AIGC等技術(shù)領(lǐng)域達(dá)成全面技術(shù)戰(zhàn)略合作,在2022年底宣布模型開源。
值得一提的是,作為國內(nèi)程序領(lǐng)域最早發(fā)起開源運(yùn)動(dòng)的倡議者,此次方漢帶領(lǐng)的“天工”團(tuán)隊(duì),在項(xiàng)目開發(fā)過程中也得到了開源社區(qū)上百位AI科學(xué)家助力。此外,“天工”團(tuán)隊(duì)投入大量資源攻克了中文語料庫的質(zhì)量瓶頸,從數(shù)十萬億的數(shù)據(jù)中清洗、篩選出了3萬億單詞數(shù)據(jù)用于訓(xùn)練大模型。
有意思的是,對(duì)于“中文素材有限就一定做不出中文AI”這一論調(diào),方漢告訴記者,這實(shí)際上是一個(gè)普遍存在的誤區(qū)?!爸拔覀円舱J(rèn)為訓(xùn)練語料的語種會(huì)對(duì)模型產(chǎn)生此類影響?!比欢S著業(yè)內(nèi)訓(xùn)練模型參數(shù)規(guī)模不斷擴(kuò)大,一種神奇的“遷移”現(xiàn)象出現(xiàn)了?!拔覀兒髞戆l(fā)現(xiàn),當(dāng)模型參數(shù)規(guī)模突破1000億的時(shí)候,模型本身就會(huì)發(fā)生質(zhì)變,其中一大特點(diǎn)就是展現(xiàn)出不同語種直接的‘遷移’能力?!?/p>
據(jù)方漢介紹,在“遷移”現(xiàn)象出現(xiàn)后,即使純英文訓(xùn)練的模型,在用中文回答問題時(shí)也能夠表現(xiàn)出不俗的應(yīng)對(duì)能力。方漢笑稱,這或許就是AI的觸類旁通。
值得注意的是,采訪中當(dāng)談及當(dāng)下AI大模型訓(xùn)練的關(guān)鍵點(diǎn)時(shí),不同于大眾認(rèn)知的“缺算力”和“缺數(shù)據(jù)”,方漢坦言最大的差距將會(huì)是不同項(xiàng)目組之間的工程經(jīng)驗(yàn)積累。
數(shù)據(jù)上的問題有了AI的“遷移”能力自然不在話下。而從算力上看,“這些年我們的工程師可以通過優(yōu)化算法,不斷抬高算力天花板。”方漢說道,相比之下,對(duì)于大模型此類大項(xiàng)目的工程調(diào)度,精細(xì)化調(diào)試將成為最大短板。
方漢解釋道:“以訓(xùn)練數(shù)據(jù)為例,其實(shí)業(yè)界最難的不是找數(shù)據(jù),而是如何給AI投喂數(shù)據(jù)。什么樣的數(shù)據(jù)不能使用,篩選數(shù)據(jù)的標(biāo)準(zhǔn)是什么,如何做數(shù)據(jù)的剪枝、清洗等。通過篩選數(shù)據(jù)調(diào)整參數(shù)、改進(jìn)模型設(shè)計(jì)才是最核心的機(jī)密,這也是OpenAI沒有在論文中公開的核心技術(shù)。”
對(duì)此,方漢坦言國內(nèi)的團(tuán)隊(duì)仍然需要不斷地探索,他預(yù)言未來的大模型生態(tài)主要有兩類參與者,一類做底層模型,一類做上層的應(yīng)用產(chǎn)品?!拔艺J(rèn)為這個(gè)生態(tài)會(huì)相對(duì)均衡,不會(huì)一家獨(dú)大。”采訪最后,方漢頗為樂觀地說道。
(文章來源:上海證券報(bào)·中國證券網(wǎng))
關(guān)鍵詞: