OpenAI發(fā)布GPT-4參加考試擊敗九成人類,人工智能會替代人類嗎?
ChatGPT的熱度還沒有散去,它的開發(fā)商——人工智能研究公司OpenAI日前又發(fā)布了大型多模態(tài)模型GPT-4。與ChatGPT所用的模型相比,GPT-4不僅能夠處理圖像內(nèi)容,并且回復的準確性有所提高。
GPT-4只根據(jù)一個粗糙的草圖,用10秒就做出了一個網(wǎng)站。在模擬律師考試中,GPT-4的得分約為前10%,也就是說它擊敗了90%的人類。它為什么這么強大?人工智能替代人類工作,真的指日可待了嗎?記者采訪到南京大學人工智能學院教授俞揚,來聽聽他怎么說。
根據(jù)OpenAI官方的介紹,GPT-4是一個大型多模態(tài)模型,它接收你的提示,給你想要的答案。一方面,GPT-4是強大的工具,幫助你完成和語言相關的任務;另一方面,GPT-4是一個智能系統(tǒng),將你的夢想、思考、觀點用文字的形式呈現(xiàn)在眼前。南京大學人工智能學院教授俞揚進一步介紹說,所謂模態(tài)指的是信息來源的形態(tài),它可以是語言文字,也可以是視覺看到的圖像,還可以是聽覺聽到的聲音。
俞揚:就像人一樣,除了有語言以外,我們還有眼睛。這是很重要的一個信息來源,我們可以去看這個世界,這叫做用視覺去感知世界。所以它大模型往多模態(tài)發(fā)展,就會更接近于人類的視覺、聽覺,能夠去閱讀文字,能夠看得懂圖像。
OpenAI介紹,GPT-4一次能接收和生成2.5萬字的文本,是ChatGPT的8倍。它還能理解圖像,能夠有邏輯地給出推理和解釋,這一點被認為是質(zhì)的飛躍。
俞揚:這確實是一個非常大的飛躍。對于人來說,我們感知這個世界的信息,70%是靠我們的眼睛去看的,所以能“看”這件事情對于我們來說是非常關鍵的。但是之前的這種語言模型,雖然它做語言做得非常好,但是它還不能“看”,它不能和人處在同一個維度下面?,F(xiàn)在它也能“看”了,而且還能“說”,就會使得新的模型和人類是處在同樣的時空下面的。我們?nèi)丝梢钥词裁?,它也可以去看什么,人可以用語言和它再進行溝通,所以它對模型的應用范圍就會變得更加寬廣。
OpenAI聯(lián)合創(chuàng)始人兼總裁格雷格·布羅克曼(Greg Brockman)在發(fā)布會直播上也對GPT-4接受圖像輸入并理解圖像內(nèi)容進行了詳細演示:簡單在紙上畫一個網(wǎng)站的草稿圖,拍一張照片上傳給GPT-4,它可以快速識別,并根據(jù)要求生成網(wǎng)頁代碼。
格雷格·布羅克曼:我這里有一張很棒的網(wǎng)站草圖,我拿出我的手機,給這張草圖拍張照,發(fā)到我們的討論區(qū)。來吧!現(xiàn)在技術正在解決它。我想最令人驚嘆的是,我們正在這里與一個神經(jīng)網(wǎng)絡交流,而這個神經(jīng)網(wǎng)絡被訓練用于預測接下來發(fā)生的事情。它玩了一個游戲,給它展示一部分文件,再根據(jù)無法想象的大量文件預測下一步。從那里,它學到了這些技能,你可以靈活應用這些技能。好!現(xiàn)在我們能看到輸出了,我們從那張圖輸出了HTML文件。來做個對比吧,從一張手繪草稿,到一個能工作的網(wǎng)站。
除普通圖片外,GPT-4還能處理更復雜的圖像信息,比如直接把論文截圖發(fā)給GPT-4,它可以按像素處理其中的文字和圖片,并給出對整篇論文的總結(jié)摘要。幾乎所有的辦公室案頭工作,GPT-4都可以完成。在性能表現(xiàn)上,OpenAI更是直接表示:GPT-4“在各種專業(yè)和學術基準上和人類相當!”比如模擬律師考試,GPT-4取得了前10%的好成績,做美國高考SAT試題,GPT-4也在閱讀寫作中拿下710分的高分。
另外,值得關注的是,GPT-4對于英語以外的語種支持也得到了極大的優(yōu)化,在多種語言方面均表現(xiàn)出優(yōu)越性。其中,GPT-4的中文達到了80.1%的準確性,英文準確性提高到了85.5%。不過,俞揚觀察發(fā)現(xiàn),GPT-4在一些方面的能力似乎并沒有達到預期。
俞揚:因為它就是一個語言模型,所以我們默認它在語言任務上面應該會表現(xiàn)得比較好,應該會表現(xiàn)得基本上要超過人類。但是我發(fā)現(xiàn)它有幾個考試,好像沒有比人做得好,考試得分沒有我們想象得高,這里面可能涉及比較深層次的邏輯思考。另外,雖然它在數(shù)學題上面增加了很多訓練的數(shù)據(jù),但是要做深層次的數(shù)學思考,依然是比較困難的。用它現(xiàn)有的這種模型的能力,從根源上來說,它是不太適合做數(shù)學思考或者邏輯思考這一類任務的。
OpenAI介紹說,GPT-4的核心價值在于為每個人的人生創(chuàng)造無窮的價值,并最終帶來更高質(zhì)量的生活。而更強大的功能,意味著GPT-4接受了更多數(shù)據(jù)的訓練,因此運行起來也更加昂貴。據(jù)了解,目前GPT-4沒有免費版本,僅向ChatGPT Plus的付費訂閱用戶及企業(yè)和開發(fā)者開放。在GPT-4發(fā)布后,有不少人感嘆它太強了,也有人調(diào)侃,我們的失業(yè)危機是不是又加強了?人工智能替代人類工作,還有多遠?
俞揚:像這樣的模型,不管它能力有多強,這個模型本身是不會取代人的。那么,有可能會增加什么?增加人和人之間競爭力的差別。比如原來一個項目可能需要100個程序員,現(xiàn)在把模型的能力提上去了以后,使得每一個程序員的開發(fā)效率得到了大幅提升,現(xiàn)在可能只需要20個程序員就夠了。在這種情況下,可能會導致80個程序員需要去做別的事情。但這樣導致的結(jié)果其實并不是模型在替代人,而是模型在加強個人的能力,剩下的80個人可能會去尋找新的工作,在新的崗位上面也可能達到更多的生產(chǎn)力。對于我們每一個人來說,只要能夠很好地掌握和利用新的技術,我們預期的收入水平應該是會提升的,因為我們的生產(chǎn)力在提升。