電子發(fā)燒友網(wǎng)報道(文/黃山明)近日,美國加利福利亞山景城,谷歌在今年I/O開發(fā)者大會上,沒有過多展示Android及手機硬件技術(shù),反而將人工智能技術(shù)放在了重點。不僅推出了全新的大語言模型,還如微軟一樣,谷歌將這項AI技術(shù)融入到了旗下各種產(chǎn)品當中,如搜索、電子郵件、翻譯。
最引人注意的是,做為全球最大的搜索引擎公司,也是AI行業(yè)的領(lǐng)軍企業(yè),但從去年底開始隨著OpenAI發(fā)布ChatGPT這項可能改變?nèi)藗兿M和創(chuàng)建信息方式的AI技術(shù)以后,谷歌的業(yè)務(wù)從根本上受到了威脅。此次的I/O開發(fā)者大會,也被視作為谷歌的反擊。
從語言模型開始
2022年4月,谷歌推出了該公司的高級語言學習模型PaLM,并將其應(yīng)用于許多不同的生成式AI應(yīng)用程序,包括聊天機器人Bard。但在Bard發(fā)布之初,其糟糕的表現(xiàn)以及錯誤百出的回復(fù),讓人們對谷歌的AI技術(shù)表示懷疑,而此次的I/O開發(fā)者大會,也是谷歌證明自己的時刻。
圖源:谷歌
此次谷歌宣布推出PaLM 2,并將其作為OpenAI的GPT-4的直接競爭對手。谷歌CEO桑達爾·皮查伊表示,得益于廣泛的邏輯和推理培訓(xùn),PaLM 2模型在邏輯和推理方面更強大,它還接受了跨越100多種語言的多語言文本訓(xùn)練。
據(jù)谷歌高級研究主管Petrov透露,PaLM 2在一系列基于文本的任務(wù)上表現(xiàn)更好,包括推理、編碼和翻譯,與PaLM 1相比,有了顯著的改進。
Petrov還現(xiàn)場展示了PaLM 2如何能夠理解不同語言的成語,當輸入德語短語“Ich verstehe nur Bahnhof”,不僅回復(fù)其字面意思是“我只理解火車站”,還能表示出實際意思是“我不明白你在說什么”。甚至谷歌工程師認為,目前PaLM 2系統(tǒng)的語言熟練程度,已經(jīng)足以教導(dǎo)人們學習該語言。
與其他的大語言模型一樣,PaLM 2與其說是一個產(chǎn)品,不如說是一個系列,該系統(tǒng)有四種版本可選,從小到大分別命名為Gecko、Otter、Bison和Unicorn,分別針對消費者和企業(yè)環(huán)境。
如在演示中,一個接受健康數(shù)據(jù)訓(xùn)練的PaLM 2版本,谷歌方面表示它可以回答類似于美國醫(yī)學執(zhí)照考試中的問題,不準確的推理減少了9倍,已經(jīng)媲美專家水平;而另一個受網(wǎng)絡(luò)安全數(shù)據(jù)訓(xùn)練的PaLM 2版本則可以發(fā)現(xiàn)潛在惡意腳本的行為,并幫助檢測代碼中的威脅。
而最輕的版本Gecko可以在智能手機中本地運行使用,每秒能夠處理20個Token,大約相當于17個單詞。這種語言模型的小型化意義重大,因為在云端運行成本極高,如果可以實現(xiàn)本地化,不僅可以極大地降低成本,并且還能保護個人數(shù)據(jù)安全。
目前PaLM 2已經(jīng)被用于支持25種功能和產(chǎn)品,包括聊天機器人Bard。讓Bard的編碼能力得到顯著提升,可以幫助進行代碼調(diào)試、協(xié)作和探索,還支持20種以上編碼語言,能夠自動進行代碼引用。
與其他生成式AI相比,谷歌表示,使用PaLM 2的Bard即將推出新的視覺功能,在回答時能夠包含圖像、表格或地圖。并且Google Lens也將登陸B(tài)ard,允許用戶將照片上傳至Bard并詢問有關(guān)照片的提示。這也意味著,Bard擁有了識圖能力。
同時,谷歌還宣布正在開發(fā)一項名為Universal Translator的實驗技術(shù),該技術(shù)可以將視頻從一種語言翻譯成另一種語言,同時保留整體基調(diào)和氛圍。工作流程是首先檢測單詞并進行翻譯,隨后它會檢查說話者的語氣以及他們強調(diào)的內(nèi)容,結(jié)合這兩個方面,來生成目標語言的語音。最后,會根據(jù)生成語音的發(fā)音同步視頻中說話者的口型。
不過谷歌考慮到這項工具可能會被濫用來創(chuàng)建虛假視頻,因此限制了普通人對這項技術(shù)的訪問,并且只有谷歌授權(quán)合作伙伴才能將其用于建設(shè)性項目。
用AI,谷歌將“搜索”轉(zhuǎn)向“對話”
值得注意的是,在此次大會上,皮查伊表示,谷歌正在重新構(gòu)想所有的核心產(chǎn)品,包括搜索。對于一家以搜索引擎起家的企業(yè)而言,近期被微軟的New Bing壓制,也讓谷歌迫切的想要證明自己。
大會上,谷歌推出了的搜索機器人——SGE。新的搜索將由AI技術(shù)驅(qū)動,可以為用戶提供簡潔的信息查詢以及豐富的對話式答案。不過為了避免生成式AI過剩的創(chuàng)造力,谷歌對其進行了嚴格的選擇,從而防止AI談?wù)撟约旱母惺堋?br />
圖源:谷歌
新的谷歌搜索與New Bing的Chat對話類似,當進行搜索查詢時,會得到一大段由AI生成的文本,這些文本便是所要尋找的信息,從網(wǎng)絡(luò)上不同的來源收集而來,并以類似人類的語氣編寫。與New Bing一樣,回答的文本會提供信息來源,同時也會在一旁顯示出與搜索內(nèi)容相關(guān)的鏈接。
這也是谷歌20多年以來對搜索引擎進行的最大改變,將過去的“搜索”轉(zhuǎn)向了“對話”。但目前這些生成式AI在進行回復(fù)時,可能會生成錯誤或者編造的答案,這類現(xiàn)象被稱為“幻覺”(hallucination),這類錯誤也是大型語言模型所遇到的常見問題。
為了解決這一問題,谷歌搜索副總裁Liz Reid表示,目前已經(jīng)對SGE進行了培訓(xùn),因為SGE是谷歌旗艦產(chǎn)品的核心部分,應(yīng)該具有更低的誤差幅度。
一個值得注意的點是,谷歌表示,如果對其來源的可信度或涉及某些主題的可信度存疑時,如醫(yī)療劑量建議、正在發(fā)生的當下新聞事件等,SGE便會選擇不回答查詢。目前這一技術(shù)正在小范圍測試當中。
盡管谷歌方面強調(diào),目前SGE還只處于實驗性質(zhì),但他們也認為,這對用戶的搜索方式將造成一個顛覆性的改變。
從微軟到谷歌,目前看到這些企業(yè)都開始不約而同的選擇將搜索向AI對話模式發(fā)展,可以認為這一趨勢也代表了搜索引擎未來的發(fā)展方向。但問題在于,盡管目前的問答回復(fù)都給出了原文的鏈接,不過由于AI直接給出了答案,久而久之,會打擊人們在網(wǎng)絡(luò)上進行分享的動力,比如旅游推薦、游戲攻略、食譜等。
并且對于搜索引擎公司而言,搜索欄中的廣告占其收入的重要組成部分,如果搜索內(nèi)容都被對話式回復(fù)取代,那么廣告形式也將發(fā)生巨大的改變。這種改變對企業(yè)營收而言,是好是壞猶未可知。
寫在最后
當然,在這次大會上,谷歌還發(fā)布了Android 14以及首款折疊屏手機Pixel Fold,其中搭載自研Tensor G2芯片,還發(fā)布了Pixel 7a和Pixel Tablet平板電腦,同樣搭載手機同款自研芯片。但在AI的映襯下,這些產(chǎn)品顯得有些黯淡。
本次的I/O開發(fā)者大會可以看到谷歌正在全面擁抱AI,作為當前全球最具影響力的搜索引擎企業(yè),谷歌引入AI對于搜索方式的改變將是深刻的。從目前New Bing的應(yīng)用來看,對話式的搜索方式也極大可能成為未來搜索的發(fā)展趨勢。
但這種搜索方式顯然會對眾多原創(chuàng)內(nèi)容平臺或者創(chuàng)作者造成不利影響,也將打擊原創(chuàng)者的創(chuàng)作積極性,甚至可能有一定侵權(quán)的風險。盡管谷歌的高管們表示,他們的方法是在推廣由人們創(chuàng)建的網(wǎng)站的同時,以深思熟慮的方式來使用新技術(shù)。同時谷歌方面的研究表明,用戶仍然希望訪問外部網(wǎng)站并聽取其他人的意見。
-
谷歌
+關(guān)注
關(guān)注
27文章
6168瀏覽量
105372 -
AI
+關(guān)注
關(guān)注
87文章
30887瀏覽量
269065
發(fā)布評論請先 登錄
相關(guān)推薦
評論