多模態(tài)的引入,讓OpenAI最新發(fā)布的GPT-4明顯“更上一層樓”。對(duì)比來(lái)看,GPT-4可以接受圖像和文本輸入,ChatGPT只接受文本;GPT-4在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)達(dá)到“人類水平”,在事實(shí)性、可引導(dǎo)性和可控制方面取得了“史上最佳結(jié)果”;當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),GPT-4比ChatGPT更可靠,更有創(chuàng)造力,能夠處理更細(xì)微的指令
全球各界還在消化ChatGPT帶來(lái)的顛覆性意義,OpenAI已經(jīng)用更強(qiáng)大的GPT-4革了自己的命。
美國(guó)東部時(shí)間3月14日,OpenAI宣布推出大型的多模態(tài)模型GPT-4.“GPT-4比以往任何版本更具創(chuàng)造性和協(xié)作性”,并且“有更廣泛的常識(shí)和解決問(wèn)題的能力,可以更準(zhǔn)確地解決難題”。OpenAI的CEO山姆·阿爾特曼說(shuō):“這是我們迄今為止功能最強(qiáng)大的模型?!?/p>
(相關(guān)資料圖)
以名列前茅的成績(jī)通過(guò)高難度考試、分析圖片中的符號(hào)意義、在10秒時(shí)間內(nèi)生成耗費(fèi)程序員數(shù)十小時(shí)的代碼……GPT-4展示出的能力讓人欣喜,甚至恐慌?!翱萍伎袢恕瘪R斯克感嘆道:“人類還能做什么?”
從聊天機(jī)器人到生產(chǎn)力工具
“我們創(chuàng)建了GPT-4,這是OpenAI努力擴(kuò)展深度學(xué)習(xí)的最新里程碑。GPT-4是一個(gè)大型多模態(tài)模型(接受圖像和文本輸入,提供文本輸出),雖然在許多現(xiàn)實(shí)世界場(chǎng)景中的能力不如人類,但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平?!監(jiān)penAI介紹道。
與上一個(gè)版本相比,GPT-4強(qiáng)在哪?OpenAI稱,雖然這兩個(gè)版本在隨意的談話中看起來(lái)很相似,但“當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),差異就會(huì)出現(xiàn)”,GPT-4更可靠、更有創(chuàng)意,并且能夠處理更細(xì)微的指令。
對(duì)比來(lái)看,GPT-4可以接受圖像和文本輸入,ChatGPT只接受文本;GPT-4在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)達(dá)到“人類水平”,在事實(shí)性、可引導(dǎo)性和可控制方面取得了“史上最佳結(jié)果”;當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),GPT-4比ChatGPT更可靠,更有創(chuàng)造力,能夠處理更細(xì)微的指令。
OpenAI展示的一個(gè)示例便可以窺探出GPT-4的智能:用戶給出一張圖片,詢問(wèn)GPT-4為什么好笑,GPT-4精準(zhǔn)描述了圖片內(nèi)容,回答道:“這幅圖的幽默之處在于,把一個(gè)大而過(guò)時(shí)的顯示接口插入一個(gè)小而現(xiàn)代的智能手機(jī)充電端口是荒謬的?!弊R(shí)別圖片是各大搜索引擎早有的功能,但對(duì)圖片中的元素進(jìn)行拆解并分析符號(hào)意義,卻是首例。
OpenAI稱,他們花了6個(gè)月時(shí)間使GPT-4更安全、更具一致性。在內(nèi)部評(píng)估中,與GPT-3.5相比,GPT-4對(duì)不允許內(nèi)容做出回應(yīng)的可能性降低82%,給出事實(shí)性回應(yīng)的可能性高40%。GPT-4引入了更多人類反饋數(shù)據(jù)進(jìn)行訓(xùn)練,不斷汲取現(xiàn)實(shí)世界使用的經(jīng)驗(yàn)教訓(xùn)進(jìn)行改進(jìn)。
總體上,多模態(tài)的引入,讓此次發(fā)布的GPT-4明顯“更上一層樓”。上一代ChatGPT展示出的能力還屬于聊天機(jī)器人范疇,GPT-4綜合體感均有所完善,被視為強(qiáng)大的生產(chǎn)力工具。
商用化場(chǎng)景更為明朗
如果說(shuō)ChatGPT的橫空出世,主要給文字從業(yè)者帶來(lái)了職業(yè)焦慮,那么GPT-4的推出,則是大幅加劇了程序員的恐慌感。
在此次發(fā)布會(huì)上,OpenAI總裁格雷格·布羅克曼在現(xiàn)場(chǎng)演示了GPT-4在這方面的能力。他直接在紙上畫了一個(gè)潦草的示意圖,拍照發(fā)給GPT,并要求其按照這個(gè)布局寫網(wǎng)頁(yè)代碼。幾乎只需要數(shù)秒鐘的時(shí)間,相應(yīng)的代碼就完成了生成。發(fā)布會(huì)還展示了一個(gè)GPT-4的使用場(chǎng)景,把程序運(yùn)行出錯(cuò)的信息甚至錯(cuò)誤信息截圖提交給GPT-4,僅憑這部分圖片信息,GPT-4都能自動(dòng)查出錯(cuò)誤。
“這對(duì)于整個(gè)編程行業(yè)來(lái)說(shuō)是具有顛覆性意義的?!币晃换ヂ?lián)網(wǎng)從業(yè)人士表示,未來(lái)大量基礎(chǔ)性的編程都將由人工智能接手。據(jù)他透露,目前國(guó)內(nèi)許多的互聯(lián)網(wǎng)公司已經(jīng)引入GPT,輔助編寫程序,“以后這種替代的比例會(huì)進(jìn)一步提高”。
正因如此,此次發(fā)布會(huì)上,OpenAI明確表示,將在ChatGPT Plus上提供GPT-4,并將其作為API提供給開(kāi)發(fā)人員構(gòu)建應(yīng)用程序和服務(wù),這意味著,任何公司和個(gè)人都可以在自己的程序中自由調(diào)取GPT-4的相關(guān)功能。定價(jià)方面,每1000次調(diào)用花費(fèi)在0.03美元至0.06美元。
“ChatGPT開(kāi)放商用API接入,意味著其成本已經(jīng)足夠低廉到一般企業(yè)可以支付。”一位市場(chǎng)人士直言,在商業(yè)化的邏輯下,許多小公司在性能上無(wú)可比擬ChatGPT的同時(shí),成本上或許也將被其碾壓。
除了微軟的新版必應(yīng)搜索引擎,目前還有多家公司將GPT-4搭載到他們的產(chǎn)品中,包括語(yǔ)言學(xué)習(xí)工具軟件多鄰國(guó)(Duolingo)、幫助視障用戶的軟件BeMyEyes、移動(dòng)支付公司Stripe、國(guó)際性金融服務(wù)公司摩根士丹利等。
以摩根士丹利為例,在OpenAI的GPT-4的幫助下,摩根士丹利正在改變其財(cái)富管理人員定位相關(guān)信息的方式。摩根士丹利維護(hù)著一個(gè)內(nèi)容庫(kù),其中包含數(shù)十萬(wàn)頁(yè)涵蓋投資策略、市場(chǎng)研究和評(píng)論以及分析師見(jiàn)解的知識(shí)和洞見(jiàn)。這些大量的信息分布在許多內(nèi)部網(wǎng)站上,主要以PDF形式呈現(xiàn),需要顧問(wèn)們?yōu)g覽大量信息才能找到特定問(wèn)題的答案。
從去年開(kāi)始,摩根士丹利開(kāi)始探索如何利用GPT的嵌入和檢索功能來(lái)利用其智庫(kù)。摩根士丹利主導(dǎo)該項(xiàng)目的分析、數(shù)據(jù)與創(chuàng)新主管表示,目前已經(jīng)使用GPT-4技術(shù)將所有智庫(kù)內(nèi)容轉(zhuǎn)化為更易于使用和操作格式;該行此前一直在用300名顧問(wèn)測(cè)試這款工具,并計(jì)劃在未來(lái)幾個(gè)月廣泛推廣。
不過(guò),OpenAI也坦承,GPT-4還不完美,在許多情況下,它的能力不如人類。OpenAI表示:“GPT-4仍有許多已知的局限性,我們正在努力解決,比如社會(huì)偏見(jiàn)、幻覺(jué)和對(duì)抗性提示?!痹贕PT-4發(fā)布之后,山姆·阿爾特曼表示:“它仍然是有缺陷的、有限的,在你花了更多的時(shí)間第一次使用它時(shí),它似乎比實(shí)際情況更令人印象深刻?!?/p>
(文章來(lái)源:上海證券報(bào))
關(guān)鍵詞: