国产日韩欧美在线_日韩精品中文在线_成人图片综合在线网站_911亚洲清品青草衣衣麻豆_综合国产日本影视_中文字幕日韓视频_亚洲av无码成人h动漫无遮_k频道欧美成人午夜视频综合_欧美日韩一中文字幕精品_无码?V不卡在线看DVD

快捷導(dǎo)航

ChatGPT這么會聊天,還要朋友干什么

2024-5-16 13:16| 發(fā)布者: admin| 查看: 184| 評論: 0
摘要: 最近一周,科技行業(yè)熱鬧非凡,大型“臉對臉”開打的“科技春晚”,更將輪番上演。5月14日凌晨,OpenAI 2024年春季發(fā)布會上線。如今這家巨頭的每次動向,都存在再度“顛覆”一個行業(yè)的可能,既讓AI創(chuàng)業(yè)者們翹首以盼, ...

ChatGPT這么會聊天,還要朋友干什么

最近一周,科技行業(yè)熱鬧非凡,大型“臉對臉”開打的“科技春晚”,更將輪番上演。

5月14日凌晨,OpenAI 2024年春季發(fā)布會上線。如今這家巨頭的每次動向,都存在再度“顛覆”一個行業(yè)的可能,既讓AI創(chuàng)業(yè)者們翹首以盼,更讓大家緊張萬分。

雖然這場OpenAI的發(fā)布會僅持續(xù)了28分鐘,業(yè)內(nèi)也早有劇透——不會有傳說中的ChatGPT 5,也不會直接對標(biāo)谷歌做AI搜索;但發(fā)布會的效果,仍然震驚四座。

此次OpenAI推出的是一款桌面版ChatGPT,該模型被稱為GPT-4o。其中“o”代表著“omni”(全能)。在演示中,這一“全模態(tài)”模型不僅能接受文本、音頻、圖像的任意組合輸出,并可跨領(lǐng)域進(jìn)行推理與展示——最重要的是,其反應(yīng)速度最短達(dá)到了232毫秒,完全可做到與人類在正常對話中同頻。

演示中,GPT-4o像個真實的人類一樣,可以被打斷,也可做到語態(tài)聯(lián)想。當(dāng)它被裝入手機(jī)時,能通過喘氣聽懂用戶的嘆息、疲憊,使用體驗易用自然、功能強大。

OpenAI同步宣布了“獲客”大殺器:GPT-4o可以被安裝至桌面和手機(jī)端,并向所有人免費開放,API定價只有GPT-4 Turbo的一半,速度達(dá)到GPT-4 Turbo的2倍,付費的ChatGPT Plus用戶將獲得5倍調(diào)用額度。

壓力被急劇轉(zhuǎn)移到谷歌、蘋果等巨頭身上。北京時間5月15日凌晨,谷歌也將上線“I/O大會”,據(jù)傳谷歌將在會上公布大模型最新進(jìn)展,并將發(fā)布類似GPT-4o,在Gemini加持下的、名為“Pixie”的個人數(shù)字助理。

本月21日,微軟也將召開“Build開發(fā)者大會”,市場猜測其大概率會將OpenAI最新能力集成到自家產(chǎn)品線中。

另據(jù)外媒報道,蘋果在此次發(fā)布會前,已與OpenAI達(dá)成合作。在6月的蘋果“WWDC大會”上,ChatGPT會不會被塞入iPhone之中,以取代“招人恨”的Siri,也非常值得期待。

01、28分鐘,干翻所有語音助手

一場大范圍預(yù)熱,將OpenAI發(fā)布會的懸念提前拉滿。

發(fā)布會前,OpenAI創(chuàng)始人、CEO山姆·奧特曼先早早否定了對標(biāo)谷歌,上線AI搜索的傳聞。他稱,“(新功能)對我來說就像魔法一樣”。OpenAI語音AGI研究領(lǐng)導(dǎo)Alexis Conneau更直接將自己的社交媒體主頁背景,改成了一張電影《Her》中的劇照——這是一部講述人與AI助手“薩曼莎”相戀的科幻電影。

外界甚至為奧特曼編排出了一個與AI助手相愛的浪漫故事。發(fā)布會結(jié)束后,山姆也順?biāo)浦鄣兀谧约旱腦賬號上,只發(fā)表了一個單詞——“Her”。


ChatGPT這么會聊天,還要朋友干什么

▲(圖源/網(wǎng)絡(luò))

不過當(dāng)看過OpenAI的最新產(chǎn)品后,觀眾們驚呼,《Her》中的劇情真的進(jìn)入了現(xiàn)實。

發(fā)布會上展示的GPT-4o,仿佛是一個真實的“朋友”坐在身邊。它反應(yīng)迅速,語調(diào)流暢自然,情緒飽滿,會跟隨著你的情緒興奮起來,也能根據(jù)上下文給出豐富的對話細(xì)節(jié),揣摩對話者的情緒。

例如,當(dāng)OpenAI的研發(fā)負(fù)責(zé)人Mark Chen上臺時,他對著GPT-4o說:“我站在臺上有點緊張,該怎么辦?”GPT-4o回答:“你太棒了,深呼吸一下吧,記得你可是個專家?!盡ark Chen隨之大聲喘氣,問GPT-4o接下來還能給些什么建議,對方回答:“放松點Mark,呼吸得慢一點,你又不是吸塵器?!?/span>


ChatGPT這么會聊天,還要朋友干什么

▲(圖源/OpenAI)

接下來,GPT-4o被要求給大家講個睡前故事。沒講幾秒,它就被Chen打斷,要求能不能多點情緒和戲劇性。隨即,GPT-4o語調(diào)更加起伏和夸張。Chen又對其要求:能不能再來點情感,最戲劇化的表達(dá)可以嗎?GPT-4o顯然讀懂了“戲劇化”的含義,隨即拿出了戲劇演員一樣夸張的語調(diào)——有趣的是,當(dāng)GPT-4o又被要求唱歌時,它甚至自己先嘆了口氣。

在此過程中,GPT-4o的反應(yīng)速度也令人深刻。據(jù)計算,它對音頻輸入的響應(yīng)時間最短為232毫秒,平均為320毫秒,這與人類在對話中的響應(yīng)時間相似。

語音聊天外,GPT-4o還表現(xiàn)出了多模態(tài)理解和輸出能力。它能夠跨聲音、文本和視覺進(jìn)行智能推理,可以就用戶給出的截圖、照片,或含有文本和圖像的文件展開對話。

此外,GPT-4o也能生成任何文本、音頻和圖像的組合。并能在輸出中,識別人類的感情,根據(jù)感情做出“有情緒的反應(yīng)”。

為了快速“獲客”,這樣強大的助手,OpenAI準(zhǔn)備交給用戶免費使用,并可在電腦桌面運行。據(jù)官方介紹,OpenAI優(yōu)化了用戶界面,用戶只需要關(guān)注如何與ChatGPT協(xié)作??上攵@樣一位免費的AI助手,可以隨時陪你聊天、看圖表、寫日程,它將爆發(fā)怎樣的巨量使用場景。

02、打到谷歌、蘋果家門口

盡管OpenAI此次沒有亮出GPT-5這樣的大招,從業(yè)界反饋看,其展現(xiàn)出的技術(shù)能力升級足以令人再度感到震驚。

據(jù)騰訊科技報道,根據(jù)OpenAI官網(wǎng)最新博客文章顯示,在GPT-4o上線之前,使用語音模式與ChatGPT對話,平均延遲為2.8秒(GPT-3.5)和5.4秒(GPT-4)。為實現(xiàn)這一點,ChatGPT語音模式是由三個獨立的模型組成的流水線:一個簡單的模型將音頻轉(zhuǎn)錄為文本,GPT-3.5或GPT-4接收文本并輸出文本,第三個簡單的模型將該文本再轉(zhuǎn)換回音頻。

在這個過程中,GPT-4會丟失很多信息,它不能直接觀察語調(diào)、多個說話者或背景噪音,也不能輸出笑聲、歌唱或表達(dá)情感。

而GPT-4o之所以能表現(xiàn)出更自然、更貼近人類的情感,源于其是單獨訓(xùn)練的新模型。因此,可以端到端地處理文本、視覺和音頻,這意味著所有輸入和輸出都由同一個神經(jīng)網(wǎng)絡(luò)處理。


ChatGPT這么會聊天,還要朋友干什么

▲(圖源/OpenAI)

這款被OpenAI能力強大優(yōu)化了的桌面App與手機(jī)端助手,其所打開的想象力,也威脅到了一眾巨頭的蛋糕。例如,許多人最直接的反應(yīng)是:它已經(jīng)達(dá)到了全面“吊打”Siri的水平。

有趣的是:據(jù)外媒報道,發(fā)布會前一天,蘋果與OpenAI的合作已秘密達(dá)成。雖然合作方式尚不可知,但不少人猜測:OpenAI的技術(shù)將會在蘋果新品中集成亮相。

另外多模態(tài)人工智能助手的賽道里,最大的玩家本來還站著谷歌。

2023年12月,谷歌發(fā)布了Gemini模型1.0版本,開始便定義其為“原生多模態(tài)大模型”,希望打通語言、聽力、視覺信息的輸入輸出能力。2024年2月,Gemini上新了1.5版本。

5月15日,OpenAI發(fā)布會一天后,谷歌“I/O大會”即將舉辦,Gemini的更新發(fā)布本是關(guān)注重點。但OpenAI爆冷發(fā)布語音助手,無疑會將關(guān)注度從Gemini身上奪走不少。

不過這種在發(fā)布會前被搶風(fēng)頭的“糟心事”,谷歌已經(jīng)不是第一次經(jīng)歷。2023年12月,谷歌原定上線Gemini時,OpenAI便在11月?lián)屜扰e辦了首屆開發(fā)者大會。為此,Gemini的上線時間一度被傳,要被延后到2024年初。

這一次,面對OpenAI“騎臉”開打,谷歌也不甘示弱地做出了反擊,很快在官方賬號里放出了語音助手的demo實時演示。


ChatGPT這么會聊天,還要朋友干什么

▲(谷歌I/O大會語音助手Demo。圖源/網(wǎng)絡(luò))

谷歌旗下人工智能研究機(jī)構(gòu)DeepMind的CEO和聯(lián)合創(chuàng)始人Demis Hassabis、谷歌AI工作室產(chǎn)品負(fù)責(zé)人及Gemini API研究人員Logan Kilpatrick紛紛下場表示,自己將在本屆I/O大會上“首秀”。

兩大巨頭在實時語音助手戰(zhàn)場正面交鋒,讓看客直呼精彩。但也有人給谷歌先潑了涼水,評價道:“Sorry Google but we got it one day earlier(對不起谷歌,但我們一天前已經(jīng)得到這個了)?!?/span>

03、競爭對手們怎么辦?

十年前,“科技春晚”還是蘋果發(fā)布會的代名詞。十年之后,主角已然輪換。

不得不承認(rèn),“百模大戰(zhàn)”國內(nèi)外已膠著對戰(zhàn)了一年多,但每每在市場中扛起“議程設(shè)置”標(biāo)桿角色的,仍非OpenAI莫屬。接下來,圍繞GPT-4o多模態(tài)功能更新的交互體驗,也勢必將掀起市場中的新一輪攻防大戰(zhàn)。

此前,市場在曝光了OpenAI可能發(fā)布AI搜索產(chǎn)品、硬剛谷歌之時,已有各路大V下場,激辯“AI搜索”的未來。GPT-4o的最新體驗,也為還在苦苦追趕的國內(nèi)AI創(chuàng)業(yè)市場,平添了許多緊張氣氛。

不過,從業(yè)界的綜合觀察來看,國內(nèi)創(chuàng)企亦不必覺得節(jié)奏被OpenAI追逐得難以喘息。比如,OpenAI沒有選擇上線GPT-5,本身亦是大模型訓(xùn)練“卷”至高階,也逐漸進(jìn)入到瓶頸期的反映。

作為目前在研的OpenAI最新一代大模型,GPT-5被視為有望對現(xiàn)有模型形成碾壓級超越的產(chǎn)品。其性能、售價等因素,也將直接影響市場的發(fā)力方向。

而從2022年11月到2023年3月,OpenAI很快完成了從ChatGPT(基于GPT-3.5)到GPT-4的跨越,但GPT-5的發(fā)布目前還沒有具體時間表。

有關(guān)GPT-5的亮相時間,市場已經(jīng)存在多個版本。此前,OpenAI官網(wǎng)曾預(yù)計GPT-5將在2023年第四季度推出,隨后發(fā)布時間推遲。如今市場傳聞稱,GPT-5有望于年中、今夏發(fā)布;亦有媒體援引內(nèi)部人士消息稱,GPT-5或?qū)⒂?024年11月份亮相。

而就在剛剛過去的4月,還有許多人在網(wǎng)上曬出了OpenAI發(fā)出的“紅隊測試邀請”郵件截圖。在AI行業(yè),“紅藍(lán)對抗測試”是保證大模型安全性的重要方式,測試人員通過不斷地挑戰(zhàn)模型,以便提前對漏洞“查漏補缺”。因此,市場猜測雖然OpenAI未標(biāo)明模型版本,但GPT-5或許已經(jīng)接近發(fā)布。

也有業(yè)內(nèi)人士猜測,GPT-5的“姍姍來遲”,或因OpenAI研發(fā)遇到某種天花板。與此同時,OpenAI在今年2月16日發(fā)布的重磅文生視頻模型Sora,雖然看起來技驚四座,但OpenAI至今仍未開放使用Sora,更遑論商業(yè)落地。


ChatGPT這么會聊天,還要朋友干什么

▲(Sora生成的MV畫面。圖源/網(wǎng)絡(luò))

在專業(yè)人士看來,Sora越快開放使用,就能提早完善問題、重塑商業(yè)流程。

音視頻協(xié)作軟件“分秒幀”創(chuàng)始人程剛對「市界」講道:“我們目前看到Sora存在幻覺問題、精準(zhǔn)度問題、對物理世界的理解,以及模擬不準(zhǔn)確所帶來的邏輯問題、版權(quán)溯源和版權(quán)保護(hù)問題,以及有人濫用工具去生成虛假內(nèi)容的問題等等。這些問題當(dāng)然會影響Sora在商業(yè)場景中的使用。”

但他判斷:“Sora迭代的速度,基本可以參照ChatGPT的迭代速度。Sora對現(xiàn)實模擬不準(zhǔn)確的問題,比如手有六指,(如果放開使用)應(yīng)該半年左右就能得到比較大的優(yōu)化?!?/span>

作者 |董溫淑

編輯 | 李 原

運營 | 劉 珊




鮮花

握手

雷人

路過

雞蛋

關(guān)注我們:東遠(yuǎn)物聯(lián)

抖音

微信咨詢

咨詢電話:

199-2833-9866

D-Think | 廣州東遠(yuǎn)智能科技有限公司

地址:廣州市白云區(qū)北太路1633號廣州民營科技園科創(chuàng)中心2棟16樓

電話:+86 020-87227952 Email:iot@D-Think.cn

Copyright  ©2020  東遠(yuǎn)科技  粵ICP備2024254589號

免責(zé)申明:部分圖文表述來自于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系作者刪除!