Stack Overflow,一個(gè)類似知乎、Reddit的老牌網(wǎng)站,因?qū)W⒂诩夹g(shù)問答和社區(qū)運(yùn)營,因此在全球程序員圈內(nèi)備受歡迎。 然而自從ChatGPT問世以來,該網(wǎng)站的訪問量和搜索量都在短時(shí)間里驟降,眾多程序員開始放棄使用。 為了挽留住用戶,Stack Overflow先是封殺ChatGPT,緊接著推出自研AIGC產(chǎn)品,但接二連三的“自救”依然止不住流量的大幅下降。 令人驚訝的是,Stack Overflow突然在本周一宣布與OpenAI簽訂協(xié)議,為其提供數(shù)據(jù)。 有意思的是,Stack Overflow不僅與OpenAI合作,其豐富的數(shù)據(jù)也被谷歌的Gemini模型買走。 程序員最大的問答網(wǎng)站,擋不住AI在程序員圈里,Stack Overflow地位有多高? 簡單點(diǎn)說,作為一家老牌問答網(wǎng)站,Stack Overflow已經(jīng)成立了16年、最高時(shí)每月都有2億臺(tái)主機(jī)訪問。 無論一線大廠技術(shù)大佬,還是剛?cè)腴T的計(jì)算機(jī)小白,只要提出了編程問題,總會(huì)有網(wǎng)友挺身而出,提供思路,甚至直接給出最優(yōu)解的答案。 正是因?yàn)橛兄嫶蟮臄?shù)據(jù),Stack Overflow雖然名氣比不上Reddit,但也算是圈內(nèi)人的必備網(wǎng)站。 但事情在ChatGPT橫空出世后,開始朝著衰落的方向發(fā)展。 在 ChatGPT上線后,迅速有網(wǎng)友發(fā)現(xiàn)其出色的代碼生成能力,因此“ChatGPT可以取代Google、Stack Overflow”的言論吸引了大批程序員的目光。 然而令人沒想到的是,僅僅上線5天后,Stack Overflow反手就把 ChatGPT 給封殺了。 原因是ChatGPT生成的代碼錯(cuò)得過于離譜,因此Stack Overflow宣布這些生成垃圾答案的賬號(hào)都會(huì)被封號(hào)。有意思的是,Stack Overflow團(tuán)隊(duì)發(fā)現(xiàn),很多用來訓(xùn)練AI模型的數(shù)據(jù),其實(shí)就是來自Stack Overflow。 如果放任AI機(jī)器人生成垃圾回答,那不就等于搬起石頭砸自己的腳嗎? 雖然Stack Overflow的表態(tài)很明確,廣大程序員們也能理解,但奈何ChatGPT的體驗(yàn)實(shí)在是真香! 最終,面對(duì)AI的強(qiáng)勢來襲,Stack Overflow的流量也是越來越差,到了2023年6月,瀏覽量幾乎已經(jīng)是腰斬。 為了止住頹勢,Stack Overflow 開始是一系列措施。 先是在7月,技術(shù)團(tuán)隊(duì)利用自家5800萬個(gè)問題和答案的數(shù)據(jù)庫,做了一款名為「OverflowAI」的AI 工具,其功能主要圍繞著編程,但沒有掀起太大的水花。 到了10月,公司CEO宣布解雇了約28%的員工,通過縮減營銷預(yù)算的方式,為 AI工具持續(xù)輸血。 不過由于OverflowAI還處于初級(jí)測試階段,面對(duì)實(shí)力強(qiáng)勁且不斷進(jìn)化的ChatGPT,OverflowAI能做的僅僅是拖延Stack Overflow衰落的速度。 賣數(shù)據(jù),真香在面對(duì)ChatGPT的威脅時(shí),Stack Overflow一開始選擇使用“防御”的姿態(tài)。 但殊不知,這些公開的互聯(lián)網(wǎng)數(shù)據(jù)早已被OpenAI等科技公司用“爬蟲”等手段進(jìn)行搜刮,自己不僅要面臨用戶的流失,更要面臨數(shù)據(jù)的流失。不過畢竟日訪問量擺在那里,Stack Overflow手握著大量優(yōu)質(zhì)的數(shù)據(jù),倒也成為一筆可以交易的資源。 自《紐約時(shí)報(bào)》帶頭起訴OpenAI后,越來越多的新聞媒體和門戶網(wǎng)站加入到討伐OpenAI的隊(duì)伍中。 在面對(duì)版權(quán)問題時(shí),科技公司們只能乖乖掏錢為訓(xùn)練數(shù)據(jù)付費(fèi),并承諾不會(huì)使用私人數(shù)據(jù)。Reddit、Youtube、ShutterStock、Photobucket等網(wǎng)站都是數(shù)據(jù)交易的受益者,手握大把優(yōu)質(zhì)的訓(xùn)練材料,科技巨頭們花起錢來也是毫不吝嗇。 相比之下,Stack Overflow的數(shù)據(jù)同樣出色,甚至比Reddit這樣的綜合性網(wǎng)站更加專業(yè)。 因此,Stack Overflow CEO也開始學(xué)會(huì)了向各大科技公司推銷自家數(shù)據(jù),其中就包括了Google的 Gemini 模型。 或許正是看到了科技公司對(duì)于優(yōu)質(zhì)數(shù)據(jù)的渴望,讓高層選擇來了一次360度的態(tài)度大轉(zhuǎn)變,既然用戶是回不來了,那至少把錢賺到口袋里。值得一提的是,Stack Overflow當(dāng)時(shí)強(qiáng)調(diào),該協(xié)議并不具有排他性,這就意味著任何科技公司都可以購買同樣的數(shù)據(jù),剩下就看哪家訓(xùn)練得更好。 據(jù)報(bào)道稱,Stack Overflow 的技術(shù)內(nèi)容將與 OpenAI 的 GPT-4 等模型相結(jié)合,通過OverflowAPI訪問,未來開發(fā)者可以直接通過 OpenAI獲得可靠且經(jīng)過驗(yàn)證的數(shù)據(jù),并幫助他們快速找到解決復(fù)雜問題的方法。 而Stack Overflow 也能從開發(fā)社區(qū)收集反饋,確保 AI 開發(fā)工具持續(xù)改進(jìn)。 簡單點(diǎn)就是說,Stack Overflow與 OpenAI來了一次技術(shù)和數(shù)據(jù)的互換,前者提高了AI能力,后者得到了可靠的數(shù)據(jù),兩者雙贏。 據(jù)悉,此次合作將帶來的第一組集成功能和能力,預(yù)計(jì)將于 2024 年上半年發(fā)布,這也說明雙方的合作其實(shí)已經(jīng)進(jìn)行了很久。 隱私還是大問題?目前,越來越多的社區(qū)網(wǎng)站開始加入到AI訓(xùn)練中,包括百度貼吧的“弱智吧”,在一次研究里顯現(xiàn)出不俗的數(shù)據(jù)訓(xùn)練效果,一度沖上熱搜。 對(duì)于訪問量不斷下降的傳統(tǒng)內(nèi)容網(wǎng)站們,優(yōu)質(zhì)的數(shù)據(jù)確實(shí)是一個(gè)可以長期進(jìn)行的“副業(yè)”。 另外,AI固然很香,但不是沒有缺點(diǎn)。 自Stack Overflow開始轉(zhuǎn)向開發(fā)AI能力后,開發(fā)者社區(qū)的一些成員對(duì)這一變化表示反對(duì),他們對(duì)人工智能生成的信息的有效性、以及數(shù)據(jù)隱私表示擔(dān)憂。 也有專家指出,AI會(huì)導(dǎo)致更多錯(cuò)誤代碼被推送到代碼庫中,甚至放大軟件項(xiàng)目中現(xiàn)有的漏洞和安全問題。 但對(duì)于“饑渴”的AI公司們,不斷膨脹的數(shù)據(jù)消耗問題已經(jīng)足夠頭疼。 而網(wǎng)站的幫助,剛好可以為自己分擔(dān)一些風(fēng)險(xiǎn)。 本文作者:jh,觀點(diǎn)僅代表個(gè)人,題圖源:網(wǎng)絡(luò) |
19款電子扎帶
電路板識(shí)別電子標(biāo)簽