多模態(tài)超出預(yù)期 GPT-4掀起更大產(chǎn)業(yè)變革今日熱搜

來(lái)源：上海證券報(bào) 時(shí)間：2023-03-16 05:46:55

多模態(tài)的引入，讓OpenAI最新發(fā)布的GPT-4明顯“更上一層樓”。對(duì)比來(lái)看，GPT-4可以接受圖像和文本輸入，ChatGPT只接受文本；GPT-4在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)達(dá)到“人類水平”，在事實(shí)性、可引導(dǎo)性和可控制方面取得了“史上最佳結(jié)果”；當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí)，GPT-4比ChatGPT更可靠，更有創(chuàng)造力，能夠處理更細(xì)微的指令

全球各界還在消化ChatGPT帶來(lái)的顛覆性意義，OpenAI已經(jīng)用更強(qiáng)大的GPT-4革了自己的命。

美國(guó)東部時(shí)間3月14日，OpenAI宣布推出大型的多模態(tài)模型GPT-4.“GPT-4比以往任何版本更具創(chuàng)造性和協(xié)作性”，并且“有更廣泛的常識(shí)和解決問(wèn)題的能力，可以更準(zhǔn)確地解決難題”。OpenAI的CEO山姆·阿爾特曼說(shuō)：“這是我們迄今為止功能最強(qiáng)大的模型?！?/p>

(相關(guān)資料圖)

以名列前茅的成績(jī)通過(guò)高難度考試、分析圖片中的符號(hào)意義、在10秒時(shí)間內(nèi)生成耗費(fèi)程序員數(shù)十小時(shí)的代碼……GPT-4展示出的能力讓人欣喜，甚至恐慌?！翱萍伎袢恕瘪R斯克感嘆道：“人類還能做什么？”

從聊天機(jī)器人到生產(chǎn)力工具

“我們創(chuàng)建了GPT-4，這是OpenAI努力擴(kuò)展深度學(xué)習(xí)的最新里程碑。GPT-4是一個(gè)大型多模態(tài)模型(接受圖像和文本輸入，提供文本輸出)，雖然在許多現(xiàn)實(shí)世界場(chǎng)景中的能力不如人類，但在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出人類水平?！監(jiān)penAI介紹道。

與上一個(gè)版本相比，GPT-4強(qiáng)在哪？OpenAI稱，雖然這兩個(gè)版本在隨意的談話中看起來(lái)很相似，但“當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí)，差異就會(huì)出現(xiàn)”，GPT-4更可靠、更有創(chuàng)意，并且能夠處理更細(xì)微的指令。

對(duì)比來(lái)看，GPT-4可以接受圖像和文本輸入，ChatGPT只接受文本；GPT-4在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上的表現(xiàn)達(dá)到“人類水平”，在事實(shí)性、可引導(dǎo)性和可控制方面取得了“史上最佳結(jié)果”；當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí)，GPT-4比ChatGPT更可靠，更有創(chuàng)造力，能夠處理更細(xì)微的指令。

OpenAI展示的一個(gè)示例便可以窺探出GPT-4的智能：用戶給出一張圖片，詢問(wèn)GPT-4為什么好笑，GPT-4精準(zhǔn)描述了圖片內(nèi)容，回答道：“這幅圖的幽默之處在于，把一個(gè)大而過(guò)時(shí)的顯示接口插入一個(gè)小而現(xiàn)代的智能手機(jī)充電端口是荒謬的?！弊R(shí)別圖片是各大搜索引擎早有的功能，但對(duì)圖片中的元素進(jìn)行拆解并分析符號(hào)意義，卻是首例。

OpenAI稱，他們花了6個(gè)月時(shí)間使GPT-4更安全、更具一致性。在內(nèi)部評(píng)估中，與GPT-3.5相比，GPT-4對(duì)不允許內(nèi)容做出回應(yīng)的可能性降低82%，給出事實(shí)性回應(yīng)的可能性高40%。GPT-4引入了更多人類反饋數(shù)據(jù)進(jìn)行訓(xùn)練，不斷汲取現(xiàn)實(shí)世界使用的經(jīng)驗(yàn)教訓(xùn)進(jìn)行改進(jìn)。

總體上，多模態(tài)的引入，讓此次發(fā)布的GPT-4明顯“更上一層樓”。上一代ChatGPT展示出的能力還屬于聊天機(jī)器人范疇，GPT-4綜合體感均有所完善，被視為強(qiáng)大的生產(chǎn)力工具。

商用化場(chǎng)景更為明朗

如果說(shuō)ChatGPT的橫空出世，主要給文字從業(yè)者帶來(lái)了職業(yè)焦慮，那么GPT-4的推出，則是大幅加劇了程序員的恐慌感。

在此次發(fā)布會(huì)上，OpenAI總裁格雷格·布羅克曼在現(xiàn)場(chǎng)演示了GPT-4在這方面的能力。他直接在紙上畫了一個(gè)潦草的示意圖，拍照發(fā)給GPT，并要求其按照這個(gè)布局寫網(wǎng)頁(yè)代碼。幾乎只需要數(shù)秒鐘的時(shí)間，相應(yīng)的代碼就完成了生成。發(fā)布會(huì)還展示了一個(gè)GPT-4的使用場(chǎng)景，把程序運(yùn)行出錯(cuò)的信息甚至錯(cuò)誤信息截圖提交給GPT-4，僅憑這部分圖片信息，GPT-4都能自動(dòng)查出錯(cuò)誤。

“這對(duì)于整個(gè)編程行業(yè)來(lái)說(shuō)是具有顛覆性意義的?！币晃换ヂ?lián)網(wǎng)從業(yè)人士表示，未來(lái)大量基礎(chǔ)性的編程都將由人工智能接手。據(jù)他透露，目前國(guó)內(nèi)許多的互聯(lián)網(wǎng)公司已經(jīng)引入GPT，輔助編寫程序，“以后這種替代的比例會(huì)進(jìn)一步提高”。

正因如此，此次發(fā)布會(huì)上，OpenAI明確表示，將在ChatGPT Plus上提供GPT-4，并將其作為API提供給開(kāi)發(fā)人員構(gòu)建應(yīng)用程序和服務(wù)，這意味著，任何公司和個(gè)人都可以在自己的程序中自由調(diào)取GPT-4的相關(guān)功能。定價(jià)方面，每1000次調(diào)用花費(fèi)在0.03美元至0.06美元。

“ChatGPT開(kāi)放商用API接入，意味著其成本已經(jīng)足夠低廉到一般企業(yè)可以支付。”一位市場(chǎng)人士直言，在商業(yè)化的邏輯下，許多小公司在性能上無(wú)可比擬ChatGPT的同時(shí)，成本上或許也將被其碾壓。

除了微軟的新版必應(yīng)搜索引擎，目前還有多家公司將GPT-4搭載到他們的產(chǎn)品中，包括語(yǔ)言學(xué)習(xí)工具軟件多鄰國(guó)(Duolingo)、幫助視障用戶的軟件BeMyEyes、移動(dòng)支付公司Stripe、國(guó)際性金融服務(wù)公司摩根士丹利等。

以摩根士丹利為例，在OpenAI的GPT-4的幫助下，摩根士丹利正在改變其財(cái)富管理人員定位相關(guān)信息的方式。摩根士丹利維護(hù)著一個(gè)內(nèi)容庫(kù)，其中包含數(shù)十萬(wàn)頁(yè)涵蓋投資策略、市場(chǎng)研究和評(píng)論以及分析師見(jiàn)解的知識(shí)和洞見(jiàn)。這些大量的信息分布在許多內(nèi)部網(wǎng)站上，主要以PDF形式呈現(xiàn)，需要顧問(wèn)們?yōu)g覽大量信息才能找到特定問(wèn)題的答案。

從去年開(kāi)始，摩根士丹利開(kāi)始探索如何利用GPT的嵌入和檢索功能來(lái)利用其智庫(kù)。摩根士丹利主導(dǎo)該項(xiàng)目的分析、數(shù)據(jù)與創(chuàng)新主管表示，目前已經(jīng)使用GPT-4技術(shù)將所有智庫(kù)內(nèi)容轉(zhuǎn)化為更易于使用和操作格式；該行此前一直在用300名顧問(wèn)測(cè)試這款工具，并計(jì)劃在未來(lái)幾個(gè)月廣泛推廣。

不過(guò)，OpenAI也坦承，GPT-4還不完美，在許多情況下，它的能力不如人類。OpenAI表示：“GPT-4仍有許多已知的局限性，我們正在努力解決，比如社會(huì)偏見(jiàn)、幻覺(jué)和對(duì)抗性提示?！痹贕PT-4發(fā)布之后，山姆·阿爾特曼表示：“它仍然是有缺陷的、有限的，在你花了更多的時(shí)間第一次使用它時(shí)，它似乎比實(shí)際情況更令人印象深刻?！?/p>

（文章來(lái)源：上海證券報(bào)）

關(guān)鍵詞：