電子發燒友網報道(文/李彎彎)據報道,在近日召開的Google Cloud Next 2022上,谷歌CEO桑達爾·皮查伊介紹了在全息視頻聊天項目(Project Starline)上取得的一些進展。
Project Starline是谷歌內部高度保密的實驗項目之一,根據谷歌的研究院透露,項目小組在6年前就已經開始相關的技術研究。直到去年5月,桑達爾·皮查伊首次在Google I/O大會上向公眾發布,在此之后又沉寂了幾乎一整年。
最新進展和體驗效果
在近日的Google Cloud Next 2022上,桑達爾·皮查伊表示,Starline 項目已經在谷歌內部進行了數千小時的測試,并在其美國辦公室每天使用,而100多個橫跨媒體、醫療和零售的企業合作伙伴已經收到了演示。
谷歌還宣布Project Starline正在進入下一個測試階段,計劃是在選定的合作伙伴辦公室部署設備進行定期測試,谷歌提到的合作伙伴包括Salesforce、WeWork、T-Mobile和Hackensack Meridian Health,這些設備預計將在今年年底前完成安裝,開啟初試。
谷歌為什么花費大量時間開展Project Starline呢?根據項目組給出的答案,就是讓人在通話的時候,感覺你是和一個真正的人在一起。在如今的社會中,人們通常會相隔千里,尤其是近兩年疫情頻繁發生,人們不得不通過Zoom等遠程會議軟件,進行聯系、溝通工作。
然而當下視頻會議給人的感覺并不好,根據微軟一份關于視頻會議對工作效率的影響的報告,人們在視頻會議中會比顯示溝通更容易分析,這是人們在面對高壓力的視頻會議下的自然應對反應。而谷歌認為,能提供真人對話體驗的Project Starline,似乎能夠消除這種壓力感。
谷歌的研究員做了對比實驗,他們發現相比傳統視頻溝通,使用Project Starline溝通的參會者會有更多眼神接觸和肢體語言,在溝通結束后能夠回憶的內容也要多出28%。
Project Starline給人的真實體驗效果到底如何呢?在測試階段,Project Starline邀請了包括The Verge在內的媒體和合作伙伴進行了親身體驗。The Verge編輯Jay Peters在體驗后感嘆到,這是他迄今為止體驗過的最真實的一次虛擬現實交互,感覺像是科幻小說照進現實。
Jay Peters表示,Project Starline就像一塊具有魔法的窗戶,將兩間房間連接在一起,坐在他對面的谷歌研究員看起來和真人的高度、長相幾乎一致,當他遞過來一個蘋果時,他甚至能夠通過畫面上的陰影感受到近似真實世界的空間距離感。
這就像是一場發生在同一張桌子上的兩個人,在面對面進行交流。Project Starline在標準辦公環境下就可以運行,而且使用者無需佩戴任何設備。
硬件構成和工作原理
Project Starline看上去像是一個精致的梳妝臺,人坐下來之后,前面是一塊65寸的大屏幕。據介紹,這是一塊8K/60Hz的3D光場顯示器。谷歌的研究員稱,這塊顯示器單眼可觀測的像素密度是Oculus Quest等VR設備的兩倍,可以有更精細的立體顯示效果。
圖源:谷歌
Project Starline的工作原理是,通過傳感器和攝像頭,從不同角度捕捉人像,再利用深度學習進行實時壓縮,將這些數據傳輸到對面,在顯示屏上重建實時3D模型。再配合高級的聲音系統,構建了一個 3D全息電話亭。
從分布來看,光場顯示器想要顯示出好的立體效果,需要采集物體的深度信息,谷歌的研究員,在屏幕的上方和底部都安裝了多個雙目立體相機和紅外相機,這樣能夠結合多角度的深度信息,還原出人物的空間距離感。
在屏幕的兩側和上方還安裝了多個單色跟蹤攝像頭,用于對人物兩部五官的實時3D定位,這樣當人物移動的時候,也能夠精準地還原人物模型。
圖源:Starline的硬件構成圖例
這是在視覺方面,為了營造面對面溝通交流的逼真感,谷歌在聽覺方面也下了很多功夫。
在輸入端,麥克風可以配合臉部追蹤的數據形成具有指向性的動態波束,以實現降噪和抗干擾。在輸出端,追蹤系統能定位觀眾的耳朵,模擬出對話的空間方位感,讓聲音聽起來就像是屏幕中人像的嘴巴說出來的一樣。
是否會成為下一代通信手段
隨著信息技術的發展,人類的通訊手段也在不斷升級。1844年5月24日,美國薩繆爾·莫爾斯在華盛頓國會大廈,向40英里以外的巴爾的摩,發出了人類歷史上第一份長途電報。電文內容是《圣經·舊約申命記》中的一句話:"What hath God wrought!"。
這份電報為人類開啟了信息時代的大門。此后,電報技術迅速在歐美大陸普及,并逐漸傳遞到世界各個角落。然而電報作為早期的通訊手段,使用起來并不方便。
1875年,美國發明家亞歷山大·貝爾和他的助手發明了第一臺電話誕生。不同于電報,它是一種通過直接傳送人類聲音的通訊方式。1876年2月14日,貝爾在美國專利局申請電話專利。1878年,貝爾成立了電話公司,并實現了波士頓和紐約之間相距300公里的長途電話試驗。從此,電話很快在北美各大城市盛行起來,并且迅速風靡全球。
1973年,馬丁·庫帕發明的第一部手機誕生。不過一直到1985年,才誕生出一臺現代意義上的、真正可以移動的電話。1987年,手機進入中國。
從早期的電報文,電話,到手機,人類通訊傳遞的信息內容,從文字,到聲音,到視頻影像,信息傳遞的及時性和內容都在不斷提高。那么未來人類通信手段如何才能更先進呢?除了信息傳遞的及時性外,內容可不可以更豐富。
比如Project Starline所實現的3D影像,如同真人面對面溝通。Project Starline可能就是人類下一代通信應該有的樣子。
不過從目前的情況來看,Project Starline距離實際應用,還有諸多問題。
Wired的編輯Lauren Goode在參與測試體驗過后表示,當人物移動幅度過大時,原本立體的圖像就會短暫變回平面,體驗并不完美。谷歌的研究員也提到,在處理形狀復雜,比如蓬松的毛發、光學眼鏡等,或者運動物體的時候,時常有錯誤的偽影出現。
另外,谷歌開展Project Starline的研究,目標用戶是B端企業,可以用于人數眾多的集體會議。然而因為3D全息視頻通話的時候,計算機時刻需要進行大量計算,谷歌的這臺設備目前僅支持一對一聊天,這在未來的應用場景上就會受限。
更為重要的是,裝配一套Project Starline,成本相當高,光場顯示器和各種光學攝像頭都非常昂貴,這使得Project Starline短期內只能停留在實驗室,而進入消費者市場的可能性很小。Project Starline的產品管理總監Andrew Nartker稱,目前它還很難稱得上是一件產品。
整體而言,Project Starline是一個全新技術的探索,谷歌也會繼續對其進行優化改進。未來,它能否成為一個真正的產品還未可知。不過無論怎樣,任何一項新技術的探索都值得被關注。
Project Starline是谷歌內部高度保密的實驗項目之一,根據谷歌的研究院透露,項目小組在6年前就已經開始相關的技術研究。直到去年5月,桑達爾·皮查伊首次在Google I/O大會上向公眾發布,在此之后又沉寂了幾乎一整年。
最新進展和體驗效果
在近日的Google Cloud Next 2022上,桑達爾·皮查伊表示,Starline 項目已經在谷歌內部進行了數千小時的測試,并在其美國辦公室每天使用,而100多個橫跨媒體、醫療和零售的企業合作伙伴已經收到了演示。
谷歌還宣布Project Starline正在進入下一個測試階段,計劃是在選定的合作伙伴辦公室部署設備進行定期測試,谷歌提到的合作伙伴包括Salesforce、WeWork、T-Mobile和Hackensack Meridian Health,這些設備預計將在今年年底前完成安裝,開啟初試。
谷歌為什么花費大量時間開展Project Starline呢?根據項目組給出的答案,就是讓人在通話的時候,感覺你是和一個真正的人在一起。在如今的社會中,人們通常會相隔千里,尤其是近兩年疫情頻繁發生,人們不得不通過Zoom等遠程會議軟件,進行聯系、溝通工作。
然而當下視頻會議給人的感覺并不好,根據微軟一份關于視頻會議對工作效率的影響的報告,人們在視頻會議中會比顯示溝通更容易分析,這是人們在面對高壓力的視頻會議下的自然應對反應。而谷歌認為,能提供真人對話體驗的Project Starline,似乎能夠消除這種壓力感。
谷歌的研究員做了對比實驗,他們發現相比傳統視頻溝通,使用Project Starline溝通的參會者會有更多眼神接觸和肢體語言,在溝通結束后能夠回憶的內容也要多出28%。
Project Starline給人的真實體驗效果到底如何呢?在測試階段,Project Starline邀請了包括The Verge在內的媒體和合作伙伴進行了親身體驗。The Verge編輯Jay Peters在體驗后感嘆到,這是他迄今為止體驗過的最真實的一次虛擬現實交互,感覺像是科幻小說照進現實。
Jay Peters表示,Project Starline就像一塊具有魔法的窗戶,將兩間房間連接在一起,坐在他對面的谷歌研究員看起來和真人的高度、長相幾乎一致,當他遞過來一個蘋果時,他甚至能夠通過畫面上的陰影感受到近似真實世界的空間距離感。
這就像是一場發生在同一張桌子上的兩個人,在面對面進行交流。Project Starline在標準辦公環境下就可以運行,而且使用者無需佩戴任何設備。
硬件構成和工作原理
Project Starline看上去像是一個精致的梳妝臺,人坐下來之后,前面是一塊65寸的大屏幕。據介紹,這是一塊8K/60Hz的3D光場顯示器。谷歌的研究員稱,這塊顯示器單眼可觀測的像素密度是Oculus Quest等VR設備的兩倍,可以有更精細的立體顯示效果。
圖源:谷歌
Project Starline的工作原理是,通過傳感器和攝像頭,從不同角度捕捉人像,再利用深度學習進行實時壓縮,將這些數據傳輸到對面,在顯示屏上重建實時3D模型。再配合高級的聲音系統,構建了一個 3D全息電話亭。
從分布來看,光場顯示器想要顯示出好的立體效果,需要采集物體的深度信息,谷歌的研究員,在屏幕的上方和底部都安裝了多個雙目立體相機和紅外相機,這樣能夠結合多角度的深度信息,還原出人物的空間距離感。
在屏幕的兩側和上方還安裝了多個單色跟蹤攝像頭,用于對人物兩部五官的實時3D定位,這樣當人物移動的時候,也能夠精準地還原人物模型。
圖源:Starline的硬件構成圖例
這是在視覺方面,為了營造面對面溝通交流的逼真感,谷歌在聽覺方面也下了很多功夫。
在輸入端,麥克風可以配合臉部追蹤的數據形成具有指向性的動態波束,以實現降噪和抗干擾。在輸出端,追蹤系統能定位觀眾的耳朵,模擬出對話的空間方位感,讓聲音聽起來就像是屏幕中人像的嘴巴說出來的一樣。
是否會成為下一代通信手段
隨著信息技術的發展,人類的通訊手段也在不斷升級。1844年5月24日,美國薩繆爾·莫爾斯在華盛頓國會大廈,向40英里以外的巴爾的摩,發出了人類歷史上第一份長途電報。電文內容是《圣經·舊約申命記》中的一句話:"What hath God wrought!"。
這份電報為人類開啟了信息時代的大門。此后,電報技術迅速在歐美大陸普及,并逐漸傳遞到世界各個角落。然而電報作為早期的通訊手段,使用起來并不方便。
1875年,美國發明家亞歷山大·貝爾和他的助手發明了第一臺電話誕生。不同于電報,它是一種通過直接傳送人類聲音的通訊方式。1876年2月14日,貝爾在美國專利局申請電話專利。1878年,貝爾成立了電話公司,并實現了波士頓和紐約之間相距300公里的長途電話試驗。從此,電話很快在北美各大城市盛行起來,并且迅速風靡全球。
1973年,馬丁·庫帕發明的第一部手機誕生。不過一直到1985年,才誕生出一臺現代意義上的、真正可以移動的電話。1987年,手機進入中國。
從早期的電報文,電話,到手機,人類通訊傳遞的信息內容,從文字,到聲音,到視頻影像,信息傳遞的及時性和內容都在不斷提高。那么未來人類通信手段如何才能更先進呢?除了信息傳遞的及時性外,內容可不可以更豐富。
比如Project Starline所實現的3D影像,如同真人面對面溝通。Project Starline可能就是人類下一代通信應該有的樣子。
不過從目前的情況來看,Project Starline距離實際應用,還有諸多問題。
Wired的編輯Lauren Goode在參與測試體驗過后表示,當人物移動幅度過大時,原本立體的圖像就會短暫變回平面,體驗并不完美。谷歌的研究員也提到,在處理形狀復雜,比如蓬松的毛發、光學眼鏡等,或者運動物體的時候,時常有錯誤的偽影出現。
另外,谷歌開展Project Starline的研究,目標用戶是B端企業,可以用于人數眾多的集體會議。然而因為3D全息視頻通話的時候,計算機時刻需要進行大量計算,谷歌的這臺設備目前僅支持一對一聊天,這在未來的應用場景上就會受限。
更為重要的是,裝配一套Project Starline,成本相當高,光場顯示器和各種光學攝像頭都非常昂貴,這使得Project Starline短期內只能停留在實驗室,而進入消費者市場的可能性很小。Project Starline的產品管理總監Andrew Nartker稱,目前它還很難稱得上是一件產品。
整體而言,Project Starline是一個全新技術的探索,谷歌也會繼續對其進行優化改進。未來,它能否成為一個真正的產品還未可知。不過無論怎樣,任何一項新技術的探索都值得被關注。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
谷歌
+關注
關注
27文章
6168瀏覽量
105409 -
3D全息技術
+關注
關注
0文章
7瀏覽量
7215
發布評論請先 登錄
相關推薦
TIKOOL太酷信息無線內部通話系統允許多個人一起講話,頻道內會不會很吵?
傳統的對講機聲音采樣率普遍是4K,音質差,往往音量大但稍有干擾就聽不清內容;TIKOOL太酷無線內部通話系統音頻采樣率可達16K,音質數倍的提升,具備極高的聲音還原度,如同面對面聊天,多人講話也不會
發表于 12-18 09:07
3D掃描技術醫療領域創新實踐,積木易搭3D掃描儀Mole助力定制個性化手臂康復輔具
1、“3D掃描+3D打印”技術為矯形修復、醫療輔助器具定制等領域帶來突破性創新 近年來,隨著AI、大數據、3D掃描、3D打印、云計算、物聯網等數字化技術的發展,“數字化+醫療”正在
裸眼3D筆記本電腦——先進的光場裸眼3D技術
隨著科技的不斷進步,裸眼3D技術已經不再是科幻電影中的幻想。如今,英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活中。無論你是專業的3D模型設計師,還是希望在視頻播放和模型
蘇州吳中區多色PCB板元器件3D視覺檢測技術
3D視覺檢測相較于2D視覺檢測,有其獨特的優勢,不受產品表面對比度影響,精確檢出產品形狀,可以測出高度(厚度)、體積、平整度等。在實際應用中可以與2D結合做檢測。利用
英倫科技10.1寸裸眼3D平板電腦的五大特點
選擇英倫科技的裸眼3D平板電腦,就是選擇了一種全新的視覺體驗。它的裸眼3D視頻觀看功能、光場裸眼3D技術、卓越的硬件配置、豐富的軟件支持以及人性化的設計理念,都是您不容錯過的選擇。現在
無監督深度學習實現單次非相干全息3D成像
論文信息 背景引入 數字全息術因其能夠從單一視點對3D場景進行成像而備受關注。與直接成像相比,數字全息是一種間接的多步驟成像過程,包括光學記錄全息圖和數值計算重建,為包括深度學習在內的
3D打印汽車配件小批量試制中的應用案例
隨著工業4.0的到來,制造業正經歷著前所未有的變革。其中,3D打印技術作為一種顛覆性的制造技術,正在改變傳統的生產方式。特別是在工業小批量試制領域,3D打印展現出了巨大的潛力和優勢。以下是一個具體的應用案例。
Mode Maison利用基于OpenUSD的高保真數字孿生推動零售業創新
“ Omniverse 先鋒面對面”系列文章主要介紹使用 OpenUSD 為 3D 工作流和物理精確的虛擬世界構建工具、應用和服務的個人創作者和開發者。
Stability AI推出全新Stable Video 3D模型
近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關注。此模型具備從單張圖像中生成多視圖3D視頻的能力,為視頻制作領域帶
Stability AI推出Stable Video 3D模型,可制作多視角3D視頻
SV3D_u是Stable Video 3D的一個版本,僅需單幅圖片即可生成運動軌跡視頻,無須進行相機調整。擴充版本的SV3D_p加入了軌道視圖的特性,使其可以根據預設的相機路徑創建
中國科研團隊突破全息3D顯示技術
全息顯示技術為真正的3D顯示提供了終極解決方案,在增強現實和虛擬現實方面具有巨大的潛力。然而,全息3D顯示的顏色和視角主要取決于激光的波長和當前空間光調制器的像素尺寸。
發表于 01-26 12:45
?732次閱讀
面向3D增強現實(AR)眼鏡的波導全息顯示
同時,全息顯示技術被認為是終極的3D顯示方案,其利用空間光調制器(SLM)來調制光的波前,還提供了其它獨特優勢,例如無像差、高分辨率圖像、每像素深度控制、眼視差深度提示、視力校正功能以及大色域。近年,計算機生成全息圖(CGH)渲
評論