本地視角記錄硅谷,全球視野關(guān)注創(chuàng)新
別忘了把 “硅星人”加上星標(biāo)
(資料圖)
2023
新技術(shù)追蹤
BUSINESS
新的變革已經(jīng)到來
文| 油醋 VickyXiao 編輯| VickyXiao
??面對(duì)ChatGPT的來勢(shì)洶洶,谷歌徹底慌了。
OpenAI發(fā)布ChatGPT也不過是4個(gè)月之前。但是在這4個(gè)月里,已經(jīng)有不少預(yù)言,稱ChatGPT帶來的變革,將會(huì)顛覆谷歌的現(xiàn)有搜索產(chǎn)品和商業(yè)模式。
于是,谷歌CEO桑達(dá)爾·皮柴(Sundar Pichai) 開啟“戰(zhàn)備”狀態(tài):先是在ChatGPT問世兩周內(nèi)就拉起了“紅色警報(bào)”,然后創(chuàng)始人拉里·佩奇和謝爾蓋·布林時(shí)隔3年再度被緊急喚回。
今天皮柴更是在官網(wǎng)上稱,谷歌一直在研發(fā)一款名為Bard的實(shí)驗(yàn)性對(duì)話AI服務(wù),今天起,谷歌將把它對(duì)信任的開發(fā)者開放,然后將在接下來的幾周內(nèi),把它向更廣泛的受眾開放。
谷歌終于加入了這場(chǎng)智能聊天機(jī)器人對(duì)搜索引擎發(fā)動(dòng)的大戰(zhàn)。
01 谷歌宣戰(zhàn)
谷歌的第23號(hào)員工,Gmail的締造者保羅·布赫海特在2月1號(hào)發(fā)推悲觀表示,谷歌將會(huì)在一兩年內(nèi)被徹底顛覆——當(dāng)人們的搜索需求能夠被封裝好的、語義清晰的答案滿足,搜索廣告將會(huì)沒有生存余地。而占據(jù)全球接近84%搜索市場(chǎng)的谷歌,到現(xiàn)在仍然是一家50%營收直接來自搜索廣告的公司。
圖源:推特
眼看ChatGPT引起的戰(zhàn)火燒到了自家主場(chǎng),谷歌終于反應(yīng)過來,在今天宣布推出類ChatGPT產(chǎn)品——一款實(shí)驗(yàn)性的對(duì)話AI服務(wù)Bard。
皮柴在今天發(fā)出的博文里稱,谷歌一直希望通過大語言模型,把這些深度研究和突破變成產(chǎn)品來幫助人們。兩年前,谷歌推出了大語言模型LaMDA,此后,谷歌就在LaMDA的基礎(chǔ)上,開發(fā)出了Bard。
今天,谷歌將先對(duì)信任的開發(fā)者開放這項(xiàng)服務(wù),然后將在接下來的幾周內(nèi),把它向更廣泛的受眾開放。
谷歌強(qiáng)調(diào),巴德會(huì)把世界上的信息知識(shí)和谷歌的大語言模型所帶來的能力和智能相結(jié)合,它會(huì)獲取網(wǎng)絡(luò)上的信息,來提供新鮮的、高質(zhì)量的回復(fù)。這意味著和ChatGPT受限于2021年以前的數(shù)據(jù)不同,巴德會(huì)是基于實(shí)時(shí)網(wǎng)絡(luò)數(shù)據(jù)的,谷歌將把它與LaMDA的輕量級(jí)模型版本一起發(fā)布。
從博文里的圖片來看,Bard也是和ChatGPT類似的聊天框形態(tài),能做的事除了簡(jiǎn)化復(fù)雜的主題,比如”向9歲的孩子解釋NASA的韋伯望遠(yuǎn)鏡帶來的新發(fā)現(xiàn)“,還能幫助人們做一些復(fù)雜的任務(wù),包括”計(jì)劃朋友的新生兒派對(duì)“、”比較兩部奧斯卡提名的電影“和”根據(jù)冰箱里的食物給出一些午餐點(diǎn)子”等。
圖源:谷歌
在谷歌看來,這個(gè)小得多的模型需要更少的算力,從而可以擴(kuò)展到更多的用戶,獲得更多的反饋。他們會(huì)將外部反饋與自己的內(nèi)部測(cè)試相結(jié)合,以確保 Bard 的回答在質(zhì)量、安全性和真實(shí)信息的基礎(chǔ)性方面達(dá)到高標(biāo)準(zhǔn)。谷歌希望通過這一階段的測(cè)試,來提高 Bard 的質(zhì)量和速度。
皮柴還在博文里稱,很快,谷歌還將很快在搜索中整合基于AI的功能。除了像ChatGPT一樣會(huì)將復(fù)雜的信息和多個(gè)視角提煉成易于理解的回答,谷歌還將進(jìn)一步提供更多網(wǎng)頁信息的選擇。
不過,根據(jù)硅星人獲得的消息,Bard大部分由華人團(tuán)隊(duì)開發(fā),而且這次Bard的發(fā)布有點(diǎn)趕,在內(nèi)部算不上完全準(zhǔn)備好,所以才在現(xiàn)在以面向有限開發(fā)者的形式推出,而非像ChatGPT一樣,一開始便開放給大眾使用。
同時(shí),谷歌內(nèi)部對(duì)ChatGPT感到恐懼的另外一層原因,是人才的流失。和很多公司一樣,谷歌內(nèi)部也采用賽馬制,有好幾個(gè)做類似模型的團(tuán)隊(duì),但內(nèi)部其它大語言模型團(tuán)隊(duì)向OpenAI流失人才的情況比較嚴(yán)重。
當(dāng)然,不管內(nèi)里如何焦慮,皮柴至少在博文里信心滿滿地宣布,下個(gè)月,谷歌將開始讓個(gè)人開發(fā)者、創(chuàng)作者和企業(yè)嘗試自家的生成語言 API (Generative Language API),該 API 最初會(huì)由 LaMDA 提供支持,并有一系列模型可供選擇?!半S著時(shí)間的推移,我們打算創(chuàng)建一套工具和 API,讓其他人可以輕松地使用 AI 構(gòu)建更具創(chuàng)新性的應(yīng)用程序。”
與此同時(shí),ChatGPT開發(fā)者OpenAI背后的金主微軟,也在緊鑼密鼓地想要把ChatGPT整合進(jìn)自己產(chǎn)品中。
微軟正在與OpenAI洽談一筆100億美元的投資,并在年初傳出計(jì)劃將ChatGPT添加到自己的搜索引擎Bing中,搜索結(jié)果將首次顯示為帶有信息來源的完整句子,這個(gè)新的版本會(huì)在3月左右發(fā)布。
而就在皮柴的博文發(fā)出不久,微軟就宣布,將在明天召開一場(chǎng)發(fā)布會(huì),主要就是關(guān)于微軟和OpenAI的合作,以及ChatGPT和微軟Bing搜索的整合。
與此前的危機(jī)都不同的是,這是谷歌的搜索根基在20多年后第一次受到挑戰(zhàn)。幾年以后“Google it.”會(huì)不會(huì)讓位給“ChatGPT it.”?這是讓人興奮的地方。Bing和百度們想追上谷歌,谷歌不想變成雅虎。
谷歌的搜索霸權(quán)會(huì)在今年被動(dòng)搖嗎?
02 停滯的搜索
讓我們的目光先回到谷歌誕生之初。
拉里·佩奇和謝爾蓋·布林在千禧年前夕嗅到了互聯(lián)網(wǎng)繁榮在即與信息檢索陳舊邏輯之間的間隙,貫穿谷歌生命的算法Page Rank由此誕生。
20世紀(jì)90年代,互聯(lián)網(wǎng)僅僅是一個(gè)為全球2%的人受用的先鋒概念。網(wǎng)絡(luò)資源匱乏,雅虎甚至以手工錄入的方式就足夠建立起最初的互聯(lián)網(wǎng)搜索概念。1995年Alta Vista出現(xiàn),互聯(lián)網(wǎng)歷史上有了第一個(gè)全網(wǎng)頁內(nèi)容的索引工具,后者第一次設(shè)計(jì)出爬蟲技術(shù)(web crawl),并在1995年8月完整完成了第一次網(wǎng)絡(luò)爬取。
圖源:源于網(wǎng)絡(luò)
但以Alta Vista為首的搜索工具對(duì)搜索關(guān)鍵詞與索引結(jié)果之間的關(guān)聯(lián)分析仍然十分薄弱,這很大程度源于搜索工具最初的受用人群。在互聯(lián)網(wǎng)普及之前,信息搜索只是服務(wù)于文獻(xiàn)查找的工具,其框架長(zhǎng)久建立在學(xué)術(shù)圈以關(guān)鍵詞加權(quán)平均為信息搜索基礎(chǔ)的邏輯上。
極度理性且表達(dá)精確的學(xué)術(shù)內(nèi)容搜索邏輯并不適用于互聯(lián)網(wǎng)的信息抓取。反映在Alta Vista上,就是它能搜索到大量信息,但準(zhǔn)確性卻非常低。
只有拉里·佩奇注意到了互聯(lián)網(wǎng)信息之間關(guān)聯(lián)性的利用潛力。
他將互聯(lián)網(wǎng)想象成一個(gè)多節(jié)點(diǎn)的矩陣,每一個(gè)網(wǎng)頁都是“點(diǎn)”,網(wǎng)頁之間的超鏈接關(guān)系則是“邊”。指向一個(gè)網(wǎng)頁的超鏈接越多,則這個(gè)網(wǎng)頁被判斷為越重要,這個(gè)過程中每個(gè)網(wǎng)頁都可以找到統(tǒng)一標(biāo)尺下的重要性參數(shù)。
圖源:推特
這個(gè)這是日后知識(shí)圖譜技術(shù)甚至圖計(jì)算的最初想象,也是算法作為一種思維第一次進(jìn)入搜索領(lǐng)域。
受制于互聯(lián)網(wǎng)的發(fā)展階段,雅虎和Alta Vista是不可能產(chǎn)生算法思維的,而Page Rank對(duì)Alta Vista的取代則成為“搜索”歷史上最閃耀的時(shí)刻。
但至今關(guān)于“搜索”的所有變革,也在24年前Page Rank誕生那一刻就宣告結(jié)束了。
無論是2001年出現(xiàn)的百度,2009年出現(xiàn)的Bing(當(dāng)然也包括使用Bing核心搜索技術(shù)的雅虎),都再也沒有逃出以Page Rank所建立起的邏輯框架,即把用戶的開放性問題轉(zhuǎn)換成互聯(lián)網(wǎng)信息圖譜上具有關(guān)聯(lián)性優(yōu)先級(jí)的、一個(gè)更具體的選項(xiàng)擴(kuò)列,再還給用戶去甄別。
2021年新興的搜索引擎You.com,最大的賣點(diǎn)僅僅是集成式的把推特等其他平臺(tái)的搜索結(jié)果分門類得納入到了信息搜索結(jié)果中,并且賦予用戶對(duì)于信息來源平臺(tái)一定的權(quán)重設(shè)計(jì)能力。
在搜索的發(fā)展停滯中,這樣一個(gè)“谷歌的挑戰(zhàn)者”就足夠獲得2000萬美元的種子輪融資。
中文互聯(lián)網(wǎng)世界里沒有另一個(gè)綜合搜索引擎獲得長(zhǎng)期繁榮,反倒是在移動(dòng)互聯(lián)網(wǎng)信息孤島的壓迫下,微信和字節(jié)跳動(dòng)提供的更垂直的搜索服務(wù)開始占領(lǐng)百度的內(nèi)容盲區(qū)。
類似You.com的搜索引擎短期內(nèi)仍然不會(huì)在國內(nèi)出現(xiàn),這是百度遺憾的地方。而無論抖音搜索或是微信搜一搜,也都沒有從搜索技術(shù)效率上取代百度的野心。一個(gè)自有生態(tài)內(nèi)的內(nèi)容連接器角色已是這類垂直搜索服務(wù)的上限,這本質(zhì)上是新的互聯(lián)網(wǎng)巨頭們適應(yīng)各自商業(yè)邏輯所做的模式創(chuàng)新,而非技術(shù)創(chuàng)新。
所以抖音搜索們對(duì)抖音重要,對(duì)“搜索”卻不重要。
2002年加入谷歌并主導(dǎo)設(shè)計(jì)了后者日中韓文搜索算法的吳軍在2012年出版的《浪潮之巔》中這樣描述Page Rank:
“雖然今天Google和其他搜索引擎相比當(dāng)初的Google已有了長(zhǎng)足的進(jìn)步,但是這種進(jìn)步基本上屬于量變。搜索引擎領(lǐng)域迄今為止的質(zhì)變只有Page Rank取代Alta Vista那一次?!?/p>
這個(gè)判斷到現(xiàn)在仍不過時(shí),直到ChatGPT帶著生成式搜索的面目出現(xiàn)。
03 未必顛覆一切
ChatGPT可以寫代碼、需求文檔甚至初步實(shí)現(xiàn)所有辦公軟件的AI化,但大部分人用不著這些——就像大部分搜索引擎的用戶只是簡(jiǎn)單的提問,然后要一個(gè)答案。
于是撇開這些,ChatGPT與谷歌(或者百度)相比最大的優(yōu)勢(shì),是它可以——幾乎是畢其功于一役的——生成一個(gè)極高質(zhì)量的首條信息結(jié)果。
康乃爾大學(xué)的研究人員曾經(jīng)通過眼部追蹤實(shí)驗(yàn)獲得了精確的谷歌搜索結(jié)果的用戶行為分析。分析結(jié)果顯示,首條結(jié)果獲得了 56.38% 的搜索流量,第二條和第三條結(jié)果的排名依次降低,但遠(yuǎn)低于排名第一的結(jié)果。
圖源:Search Engine Journal
這十分考驗(yàn)ChatGPT生成內(nèi)容的準(zhǔn)確性,而這個(gè)大型語言模型背后是一個(gè)信息來源與即時(shí)性的黑盒。
由于ChatGPT的回答中并不展示信息來源,用戶目前無法從回答中分辨信息真?zhèn)巍?/p>
在即時(shí)性上,ChatGPT無論是以頻繁增加標(biāo)注數(shù)據(jù)并一次次重新對(duì)模型進(jìn)行預(yù)訓(xùn)練的方式,還是用Fine-Ture的思路來修改現(xiàn)成的訓(xùn)練結(jié)果,都會(huì)遇到新的問題。前者是極大的算力成本,后者是新知識(shí)對(duì)原有知識(shí)的過度覆蓋隱患。
ChatGPT是搜索領(lǐng)域苦等的一次效率革命,被認(rèn)為是一種“導(dǎo)彈”對(duì)“弓箭”的降維打擊。但如果說Page Rank是算法邏輯第一次進(jìn)入搜索領(lǐng)域,ChatGPT也并沒有背離這個(gè)技術(shù)原點(diǎn)。
ChatGPT的成功基于一場(chǎng)以1萬個(gè)英偉達(dá)V100 GPU支撐、用深度學(xué)習(xí)和人工智能對(duì)人類信息歷史反復(fù)咀嚼的苦功。從這個(gè)角度上看,它仍然是漸進(jìn)式的,并非一個(gè)完全的顛覆者。
而哪怕谷歌本身,也并不意外ChatGPT在技術(shù)層面所實(shí)現(xiàn)的東西,
去年開發(fā)者大會(huì) I/O 上,谷歌展示了大語言模型LaMDA如何以冥王星作為對(duì)話主體來與人進(jìn)行交流,這種回答是即時(shí)生成的,并不是學(xué)習(xí)了大量預(yù)定義的結(jié)果。大語言模型LaMDA和多模態(tài)多任務(wù)模型MUM所表現(xiàn)出來的素質(zhì),意味著谷歌已經(jīng)具備與ChatGPT相近的AI能力。
而讓皮柴感到緊張的是,ChatGPT在上線五天就成功吸引了超過100萬的用戶,這個(gè)數(shù)字在兩個(gè)月后漲到1億。
OpenAI做了第一個(gè)吃螃蟹的人,而大眾接受了它。
而一家市值超過1.4萬億美元的大公司注定比小型創(chuàng)業(yè)公司更保守。
谷歌人工智能負(fù)責(zé)人杰夫·迪恩在幾個(gè)月前對(duì)員工表示,倘若通過(ChatGPT)這樣的服務(wù)提供錯(cuò)誤信息,會(huì)給谷歌帶來更大的“聲譽(yù)風(fēng)險(xiǎn)”。
谷歌的一位高級(jí)工程師曾在去年公開表示大語言模型LaMDA“有意識(shí),有靈魂”,隨即被勒令停職。他在被停職的前一天把一些包含谷歌及其技術(shù)涉嫌宗教歧視的證據(jù)交到了一名美國參議員的辦公室。
種種困擾,讓谷歌即使有了大語言模型LaMDA,也無法輕易拋出一個(gè)可能會(huì)亂說話,又容易動(dòng)搖自己商業(yè)化根基的聊天機(jī)器人。
但Open AI可以冒這樣的風(fēng)險(xiǎn)。
這看起來就像曾經(jīng)拉里·佩奇和謝爾蓋·布林在對(duì)雅虎所做的事?,F(xiàn)在時(shí)隔多年再次因?yàn)樗阉鳂I(yè)務(wù)現(xiàn)身谷歌硅谷辦公室所需要面對(duì)的,是一個(gè)神奇,卻仍然算力成本困擾籠罩,生成內(nèi)容充滿漏洞的ChatGPT,兩人或許在Open AI的莽撞中看到了曾經(jīng)的自己。
1997年,拉里·佩奇和謝爾蓋·布林在買下google.com域名后,提著窮的叮當(dāng)響的西裝口袋為谷歌找了一年的投資,最后終于在1998年遇到了斯坦福校友、太陽公司創(chuàng)始人安迪·貝托謝姆的一張10萬美元的支票。
今時(shí)已不同往日,根據(jù)CB Insights提供的市場(chǎng)情報(bào),與生成式AI概念相關(guān)的初創(chuàng)公司已經(jīng)達(dá)到250家以上,其中有接近7成已經(jīng)拿到至少天使輪的融資,其中11%的公司已經(jīng)走到B輪以上。在這眾多初創(chuàng)公司中,價(jià)值最高的就是OpenAI。
那張陳年的10萬美元支票打開了一扇互聯(lián)網(wǎng)搜索引擎的門,而人們現(xiàn)在對(duì)于ChatGPT的信心和期望,也幾乎是從那個(gè)成功的谷歌延續(xù)而來。
谷歌也在近日拿出了3億美元提前布局與OpenAI的攻守戰(zhàn)。這筆投資給到了Anthropic——一家以前OpenAI核心員工為骨干,同樣做生成式AI,并且此前估值已高達(dá)50億美元的人工智能公司——換取了后者10%的股份,以及一個(gè)獨(dú)家云提供商的身份。
此外,谷歌選擇對(duì)內(nèi)部的類ChatGPT項(xiàng)目Bard壓下重注。
與ChatGPT不同的是,Bard在描述中可以涉及當(dāng)下的時(shí)事,這意味著其可以解決ChatGPT所欠缺的信息即時(shí)性問題。
百度的“ChatGPT計(jì)劃”也將以生成式搜索的形式出現(xiàn)。目前在內(nèi)部“高度機(jī)密”,甚至不可以被公開討論,最終這項(xiàng)會(huì)融入目前的百度搜索引擎中。
李彥宏在去年年底的一次內(nèi)部講話中表示,AIGC和ChatGPT這些新的技術(shù)進(jìn)展會(huì)變成什么樣的AI產(chǎn)品,
仍然有很多不確定性,但這件事“百度必須做”。對(duì)于這個(gè)即將在下個(gè)月面世的項(xiàng)目,李彥宏給出的定位是“引領(lǐng)搜索體驗(yàn)的代際變革”。
現(xiàn)在無論主動(dòng)還是被動(dòng)的,蝴蝶效應(yīng)已起。
“搜索”這片已經(jīng)平靜20多年的湖面,一顆石子久違地拋下了。
*參考資料:
《浪潮之巔》,吳軍
《百度將推出類似ChatGPT服務(wù)》,財(cái)經(jīng)網(wǎng)
注:封面圖來自于Pexels,版權(quán)屬于原作者。如果不同意使用,請(qǐng)盡快聯(lián)系我們,我們會(huì)立即刪除。
2)分享到你的朋友圈和微信群
3)趕快關(guān)注硅星人吧!
關(guān)注硅星人,帶你用本地視角看硅谷,全球視野看創(chuàng)新
關(guān)鍵詞: 搜索引擎
最新資訊