在全世界人民都仍處于GPT-4的震驚中時,百度終于發(fā)布了自己的同類產(chǎn)品——文心一言。藍鯨財經(jīng)記者在第一時間拿到了內(nèi)測名額,為大家實測這款新一代大語言模型、生成式AI產(chǎn)品文心一言。
由于是精通中文語境,所以我們首先拿前不久一道給chat GPT做過的題給它做
(資料圖片)
顯然,文心一言準確地識別了問題中的人物,并且精準回答了其中暗藏的“玄機”。
但這種喜悅似乎并沒有持續(xù)多久,當我希望文心一言為我推薦一些禮物備選時,它的回答真的是靠譜中夾雜著各種不靠譜。
請問哪里可以用500塊買到iPhone 13 Pro Max手機,我出雙倍買!
文心一言像一個聽話的工具,讓干啥干啥,但似乎缺乏一些判斷力,比如我讓它幫我撰寫一段諾貝爾數(shù)學獎的領(lǐng)獎詞,這也是寫得頭頭是道,完全沒考慮到這獎項根本不存在……
可見文心一言雖然有基礎(chǔ)的文案撰寫能力,但是對于問題并沒有基礎(chǔ)的糾錯能力,同時文案本身也缺乏創(chuàng)意,基本是一些片兒湯話。
在見識過水平能上哈佛的GPT-4后,大家對文心一言不太滿意在所難免。因此也有博主將其比作AI界的馬保國。
但是如果你把這個結(jié)論告訴文心一言,它可能會很開心,因為它對馬保國的評價很高!
或許文心一言和你對于馬保國武術(shù)水平的評價并不一致,但是并不能因此否定它作為一款大語言模型、生成式AI產(chǎn)品的能力。
比如我們體驗了它的AI繪畫功能,雖然某些細節(jié)有出入,但是基本要素是具備的:
在chat GPT橫空出世之后,不少人都產(chǎn)生了“AI焦慮”擔心自己的工作被AI取代,那文心一言會取代我們的工作嗎?
身先士卒,我請文心一言幫助處理了一些工作中的常見數(shù)據(jù)收集與整理問題:
但仔細校對會發(fā)現(xiàn)根據(jù)國家電影局數(shù)據(jù),2021年春節(jié)檔電影票房達78.22億元,這個數(shù)據(jù)并不準確,除此之外,“近五年”的指令似乎也沒有很好的執(zhí)行,中間有不少遺漏。看來如果把這類工作都交給文心一言,還是很有風險的。
聽說編劇也是有可能被AI取代的高危職業(yè),于是我邀請文心一言續(xù)寫了今年大熱的電影《流浪地球2》,希望能為李彥宏的陽泉老鄉(xiāng)劉慈欣省點心:
結(jié)果發(fā)現(xiàn),大劉還是得接著寫……文心一言這水平連投資都騙不到。
文心一言對于信息的覆蓋面和掌握程度無需多言,并且在分析的時候很有邏輯:
比如最近爆紅的《烏梅子醬》它也能點評一二,并且像模像樣:
但從整個回答也能看得出,文心一言呈現(xiàn)的內(nèi)容比較片面,缺乏更全面的觀點,與此同時缺乏更加深刻的點評,換句話說,如果把回答中的李榮浩換成周杰倫應(yīng)該也是完全可以的,雖然周杰倫的粉絲可能不同意……
雖然截至目前,文心一言的表現(xiàn)都顯得比較AI,沒有人情味,但是我發(fā)現(xiàn)它有些時候還是會展示一些“人性特質(zhì)”的,比如面對感情問題,它也會表現(xiàn)得像個“情感導師”
面對深刻的愛與死亡話題也能給出這樣的回答:
比如下面這種情況:
截至目前,我們對于文心一言的體驗暫告一段落。
雖然這場萬眾矚目的發(fā)布會被各界唱衰,甚至百度的股價都應(yīng)聲下跌,但真正體驗過之后發(fā)現(xiàn),作為近期國內(nèi)首款大模型,文心一言從回答速度到對話效果整體不錯,雖然這其中有很多令人啼笑皆非的bug。但敢于發(fā)布文心一言,敢于發(fā)布大模型放在公眾輿論之下,本身就需要勇氣,就像李彥宏自己在會上說的:“這類大語言模型還遠未到發(fā)展完善的階段,進步空間很大,未來這段時間它一定會飛速發(fā)展,日新月異”,openAI也是在不斷自我迭代過程中成長為“大魔王”的,文心一言剛剛邁出自己的第一步。
(責任編輯:董萍萍 )關(guān)鍵詞: