天天速訊:多項測試超越90%的人類,GPT-4會引發(fā)新一輪風暴嗎

2023-03-16 05:27:08    來源:北京商報網(wǎng)

3月15日,美東時間3月14日,OpenAI宣布推出大型語言模型的最新版本——GPT-4,該版本比以前的版本“更大”,稱它可以接收圖像和文本輸入,輸出文本,“比以往任何更具創(chuàng)造性和協(xié)作性”,并且“由于它有更廣泛的常識和解決問題的能力,可以更準確地解決難題”。在內(nèi)部評估中,它產(chǎn)生正確回應的可能性比GPT-3.5高40%。它將用于付費版ChatGPT Plus。

ChatGPT是最近科技界最火爆的話題,GPT-3是世界上最大的大語言模型之一,其驚人的表現(xiàn)也讓外界猜測下一代的GPT-4到底有多強大。


【資料圖】

OpenAI官方發(fā)布的宣傳片中GPT的最新一代版本ChatGPT-4,相比上一代,其AI能力再度提升,同時支持輸入的內(nèi)容不再僅限于文字,還支持圖像內(nèi)容的輸入,成為一個能夠理解照片的人工智能。雖然ChatGPT-4未能實現(xiàn)音頻解析,但新功能讓人興奮不已。

同時根據(jù)OpenAI介紹,GPT-4是一個多模態(tài)大型語言模型,即支持圖像和文本輸入,以文本形式輸出;擴寫能力增強,能處理超過25000個單詞的文本。

OpenAI表示,新模型將產(chǎn)生更少的錯誤答案,更少地偏離談話軌道,更少地談論禁忌話題,甚至在許多標準化測試中比人類表現(xiàn)得更好。例如,GPT-4模擬律師考試的成績在考生中排名前10%左右,在SAT閱讀考試中排名前7%左右,在SAT數(shù)學考試中排名前11%左右。

雖然GPT-4更具創(chuàng)造力,并且能夠處理更細微的指令,但官方也警告說,這些系統(tǒng)保留了許多與早期語言模型相同的問題,包括編造信息的傾向以及生成暴力和有害文本的能力,盡管如此,用戶們還是為之振奮。

北京商報記者向GPT-4和GPT-3.5中輸入“幫我出一個北京一日游的攻略”的問題。

由輸入結(jié)果可知,在北京一日游的攻略中GPT-4明顯時間安排與提醒更加細致貼心,內(nèi)容上更豐富清晰,而同時GPT-3.5出現(xiàn)了序號錯誤。

再向二者輸入第二個問題“解釋一下冪函數(shù)”。

從答案可以看出,在冪函數(shù)的介紹上,GPT-4與GPT-3.5相比清晰地將定義、舉例、應用表達出來,更具有邏輯性。

接著再同時輸入“哈利波特是怎樣的魔法師”。

在對哈利波特的介紹中,將“父母在他很小時被黑巫師伏地魔殺害”的內(nèi)容表述成“年幼失去雙親”,顯然GPT-4在語言上更加精煉。

GPT-4在不斷學習之下,ChatGPT也變得更為聰明、準確。GPT-4相較于GPT-3.5更加具備規(guī)范和精確的語言能力,同時也具備更精確的知識。

據(jù)報道,GPT-4多項測試超越90%的人類,這不免成為人們關注的焦點。

北京光大銀行(601818)一位計算機程序員向北京商報記者表示,目前對于銀行這種要求嚴謹精確的系統(tǒng)來講,短期內(nèi)程序員是不會被機器替代的,機器還是存在更多的不確定性。在銀行一直使用的是較為“老”而穩(wěn)定的程序。

GPT-4的更新讓大眾受益,同樣ChatGPT的開發(fā)者OpenAI在GPT-4的研發(fā)上已經(jīng)取得了不少進展,各種猜測紛紜,有說其訓練參數(shù)高達100萬億的,有說微軟已經(jīng)把GPT-4納入最新版本的必應中。

本周,AI行業(yè)或?qū)⒂瓉怼隘偪裥瞧谒摹薄0俣却饲靶迹瑢⒂?月16日(周四)發(fā)布旗下首款類ChatGPT產(chǎn)品“文心一言”。微軟也透露,本周內(nèi)將推出擁有更高性能的GPT-4。雖然目前尚未透露具體發(fā)布時間,不過考慮到3月16日也是微軟的AI活動日,活動主題為“用人工智能重塑生產(chǎn)力”,而公司CEO將上臺演講,外界普遍認為當天這款產(chǎn)品將正式亮相。

北京商報記者 陶鳳 實習記者 李想

(責任編輯:王治強 HF013)

關鍵詞:

上一篇:
下一篇:

熱點話題

熱點推薦

頭條

?