在某些哺乳動物如牛、馬、羊等,它們的兩眼長在頭的兩側,因此兩眼的視野完全不重疊,左眼和右眼各自感受不同側面的光刺激,這些動物僅有單眼視覺(monocular vision)。人和靈長類動物的雙眼都在頭部的前方,兩眼的鼻側視野相互重疊,因此凡落在此范圍內的任何物體都能同時被兩眼所見,兩眼同時看某一物體時產生的視覺稱為雙眼視覺(binocular vision)。雙眼視物時,兩眼視網膜上各形成一個完整的物像,由于眼外肌的精細協(xié)調運動,可使來自物體同一部分的光線成像于兩眼視網膜的對稱點上,并在主觀上產生單一物體的視覺,稱為單視。眼外肌癱瘓或眼球內腫瘤壓迫等都可使物像落在兩眼視網膜的非對稱點上,因而在主觀上產生有一定程度互相重疊的兩個物體的感覺,稱為復視(diplopia)。雙眼視覺的優(yōu)點是可以彌補單眼視野中的盲區(qū)缺損,擴大視野,并產生立體視覺。
雙眼視物時,主觀上可產生被視物體的厚度以及空間的深度或距離等感覺,稱為立體視覺(stereopsis)。其主要原因是同一被視物體在兩眼視網膜上的像并不完全相同,左眼從左方看到物體的左側面較多,而右眼則從右方看到物體的右側面較多。來自兩眼的圖像信息經過視覺高級中樞處理后,產生一個有立體感的物體的形象。然而,在單眼視物時,有時也能產生一定程度的立體感覺,這主要是通過調節(jié)和單眼運動而獲得的。另外,這種立體感覺的產生與生活經驗、物體表面的陰影等也有關。但是,良好的立體視覺只有在雙眼觀察時才有可能。
立體視覺是人眼對看到的景象具有的深度感知能力,而這些感知能力又源自人眼可以提取出景象中的深度要素。
除了雙目視覺可產生立體感外,單眼看空間景物時,也能辨別物體的前后深度,具有一定的立體感。對于三維顯示技術,更為全面地了解眼睛的立體視覺因素具有重要的意義?,F(xiàn)代心理學公認有十種要素來察覺像的深度,其中涉及生理機能的有四種,涉及心理暗示的有六種。
(1) 雙目視差(binocularparallax)。由于人的兩只眼睛存在間距(平均值為65mm),因此對于同一景物,左右眼的相對位置(relativeposition) 是不同的,這就產生了雙目視差,即左右眼看到的是有差異的圖像。
(2) 眼睛的適應性調節(jié)(accommodation)。人眼的適應性調節(jié)主要是指眼睛的主動調焦行為。眼睛的焦距是可以通過其內部構造中的晶狀體進行精細調節(jié)的,焦距的變化使我們可以看清楚遠近不同的景物和同一景物的不同部位。一般來說,人眼的最小焦距為1.7cm,沒有上限。而晶狀體的調節(jié)又是通過其附屬肌肉的收縮和舒張來實現(xiàn)的,肌肉的運動信息反饋給大腦有助于立體感的建立。即使我們用單眼觀看物體,這種立體感也是有的,所以可以說是單眼深度暗示??墒沁@種暗示只在與其他雙眼暗示組合在一起,而視距又在2m 之內時才是有效的。
(3) 單眼移動視差(motion parallax)。運動視差是由觀察者和景物發(fā)生相對運動所產生的,這種運動使景物的尺寸和位置在視網膜的投射發(fā)生變化,從而產生深度感。當用一只眼睛看一個固定物體時,則調節(jié)就成為對深度感的唯一有效暗示??墒牵绻^看位置是允許移動的,我們就可利用雙目視差這種效應從各個方向觀看物體。這個效應就稱為單眼移動視差。特別重要的是,當觀看者移動得相當快速時,如坐在飛機上或極快的列車上,更是如此。
(4) 會聚(convergence)。當雙眼觀看物體上的一點時,兩只眼睛的視軸將會聚,兩視軸的夾角稱為會聚角。對于空間不同物點,視軸將發(fā)生變化,為實現(xiàn)這種會聚,人眼肌肉需要牽引眼球轉動,肌肉的活動反饋到人腦時就會給出一種深度感覺。實驗表明,在適應性調節(jié)和會聚之間是存在著相互作用的,一方面對應于一定距離的會聚信息自動地引起一定程度的調節(jié),另一方面調節(jié)的信息也影響會聚。這一效應可由簡單實驗來證明,即我們先遮住一眼,移動另一眼所注視的物體,當物體的距離突然由無限遠改變?yōu)?0cm時,則會聚需要有0.2?0.3s 時間才能對調節(jié)所給出的距離信息作出響應。
深度感的心理學暗示
(1) 視網膜像的相對大小。同樣大小的物體,當觀看距離不同時,在視網膜上成像的大小也不相同,距離越遠,視網膜像越小,見圖1。或者說,視線方向上平行線上對應兩點隨著視距的增大,在視網膜上所成像點的距離線性減小。由此,可通過比較視網膜像的大小來判斷物體的前后關系。
(2) 根據視覺這一現(xiàn)象形成了一種繪畫方法||線性透視法,透視法是在平面上表現(xiàn)立體感的最有效的方法,在繪畫藝術中被廣泛采用。但對于傳統(tǒng)的中國畫,不太遵循透視繪畫原理。
(3)視野。人眼的視野很寬,水平方向約220±,垂直方向約130±,呈橢圓形。但在通常的顯示方式中,圖框均在視野之內,因此缺乏立體視覺的身臨其境感。為此,增大畫框或者使畫框不清楚,可以增強立體感。例如,寬銀幕電影的立體感就比窄銀幕的強,而全景電影由于沒有畫框,立體感更強。
(4)光和陰影。物體上光亮部分和陰影部分的適當分配可以改變或增強立體感,陰影及影子對深度感也是心理學上重要的暗示。
(5)空氣透視。對于同一場景,近處的景物比遠處的景物或多或少有些模糊,這樣也可以產生深度暗示。景物越遠,其發(fā)出的光線被空氣中的微粒(如塵埃、煙、水汽) 散射越多,因而顯得越模糊, 如圖3所示。
(6)重疊。當景物有相互遮擋時,也會產生深度暗示,如圖所示,包含球體、柱體和立方體三個幾何體,三個幾何體在不同遮擋情況下將產生不同的立體視覺。
圖重疊產生的深度視覺
深度感的生理機能是三維顯示最重要的依據,而心理學暗示所產生的立體感一般用于平面顯示技術之中。
大家都去過電影院看過3D電影嗎?在看3D電影的時候你需要領取一副3D眼鏡,你就可以發(fā)現(xiàn)電影里的畫面如同真實般的浮現(xiàn)在你的眼前。
但你知道3D眼鏡為什么能夠達到這種效果呢?對了,是因為我們營造了立體視覺,3D眼鏡欺騙了我們的大腦,把屏幕上的東西認為是立體的。
什么是立體視覺呢?簡單來說,立體視覺是指通過雙眼視覺獲得可見對象的深度和距離的過程。
我們有兩個眼睛,眼睛從不同的位置接收物體產生的光線,就形成了視差。雙眼視覺形成的視差可以輔助產生精細的深度知覺,進而產生立體視覺。
我們可以用一個非常簡單的實驗來驗證這種現(xiàn)象。首先,盯著你附近的一個物體,然后用手遮掉一只眼睛,交替遮掉另一只眼睛,你看到的物體的角度是一樣嗎?
這樣你就可以感受到視差的存在了。
除了3D眼鏡,我們還可以用什么方式營造立體視覺呢?接下來,創(chuàng)客達芬奇用三個方法和若干例子,帶你看看營造立體視覺的各種方式。
方法一:視覺陷阱
制造視覺陷阱的方法有很多,比如下面這個“跟著你動的眼睛”的制作,就是這么一個案例。
這是科技學堂網站的課程《小實驗大科學:未成年人科普50例》的案例。首先我們要準備一個面具,在面具后方一定的距離準備一張紙條,在紙條上畫上兩個眼睛,你就可以做一個跟隨你的眼睛了。
另一個制造視覺陷阱的就是浮動方塊了。它利用半個立方體欺騙你的大腦,讓你誤以為是一個浮動的立方體。與之相似的還有盯著你看的小恐龍,同樣也是利用半個立方體來欺騙大腦
視覺陷阱經常被用于藝術創(chuàng)作中,比如街頭藝術的立體畫,就是用到了視覺陷阱的原理。
不要以為立體畫只有現(xiàn)在才有哦,早在巴洛克時期就有立體畫了。比如下面這幅是文藝復興畫家漢斯·荷爾拜因的代表作《大使們》,從畫的側面看,你能發(fā)現(xiàn)一個用視覺陷阱畫成的骷髏。
此外還有讓畫面人物逃出畫框的畫法,也是用到了視覺陷阱。用立體視覺讓人物撲面而出,比如十九世紀卡索的這幅《潛逃》
用同樣的原理,我們還可以在普通的電影畫面中加上兩條白線,產生一個類似畫框的效果,讓畫面突出畫框,形成立體視覺。
方法二:全息投影
第二種方法是利用全息投影的方法,利用多光源的干涉和衍射制作出來的立體效果。目前全息投影的技術還沒完全成熟,不過我們可以通過制作“偽全息投影”來欺騙眼睛,獲得立體視覺。
這是一個利用四塊亞克力板和一個手機投影做成的“偽全息投影”,這種方法常用語商品展示中,你自己也可以做一個,換一個角度看是這樣子的。
第三種方法:產生視差
第三種方法,就是讓我們的兩個眼睛看到不同的畫面,讓眼睛誤以為產生視差,從而達到立體視覺的效果。我們熟悉的3D眼鏡、VR眼鏡就是利用這種原理。
3D眼鏡分為兩種:色差式眼鏡和偏振式眼鏡。它們都是讓左右眼屏蔽一部分光,從而欺騙眼睛看到兩種不同的圖像,進而產生視差。
它們的屏蔽方式不一樣,色差式是利用不同的鏡片顏色來屏蔽光線;偏振式是利用兩個互相垂直的偏振片來屏蔽某個方向的光。
下次去看3D電影的時候,看看你拿到的是色差式還是偏振式的眼鏡。
而VR眼鏡用的也是類似的原理,只不過它直接分別在兩只眼睛前面顯示不同的畫面,從而產生視差,欺騙了你的眼睛。
你甚至可以在網上下載圖紙,自己動手制作一個VR眼鏡。
伊娃老師在《我愛綠色生活:2017青少年科學調查體驗活動慕課》課程中也只做了一個VR眼鏡,看看她是怎么做的吧。
總結一下,我們現(xiàn)在認識了三種制造立體視覺的方法,分別是視覺陷阱、全息投影和產生視差。
雙目立體視覺這一有著廣闊應用前景的學科,隨著光學,電子學以及計算機技術的發(fā)展,將不斷進步,逐漸實用化,不僅將成為工業(yè)檢測,生物醫(yī)學,虛擬現(xiàn)實等領域。目前在國外,雙目立體視覺技術已廣泛應用于生產,生活中,而我國正處于初始階段,尚需要廣大科技工作者共同努力,為其發(fā)展做出貢獻。
1、立體視覺的發(fā)展方向
就雙目立體視覺技術的發(fā)展現(xiàn)狀而言,要構造出類似于人眼的通用雙目立體視覺系統(tǒng),還有很長的路要走,進一步的研究方向可歸納如下:
(1)如何建立更有效的雙目立體視覺模型,能更充分地反映立體視覺不去確定性的本質屬性,為匹配提供更多的約束信息,降低立體匹配的難度。
(2)探索新的適用于全面立體視覺的計算理論和匹配擇有效的匹配準則和算法結構,以解決存在灰度失真,幾何畸變(透視,旋轉,縮放等),噪聲干擾,特殊結構(平坦區(qū)域,重復相似結構等),及遮掩景物的匹配問題;
(3)算法向并行化發(fā)展,提高速度,減少運算量,增強系統(tǒng)的實用性;
(4)強調場景與任務的約束,針對不同的應用目的,建立有目的的面向任務的雙目立體視覺系統(tǒng)。
在機器視覺賴以普及發(fā)展的諸多因素中,有技術層面的,也有商業(yè)層面的,但制造業(yè)的需求是決定性的。制造業(yè)的發(fā)展,帶來了對機器視覺需求的提升;也決定了機器視覺將由過去單純的采集、分析、傳遞數(shù)據,判斷動作,逐漸朝著開放性的方向發(fā)展,這一趨勢也預示著機器視覺將與自動化更進一步的融合。需求決定產品,只有滿足需求的產品才有生存的空間,這是不變的規(guī)律,機器視覺也是如此。
2、國外研究動態(tài)
雙目體視目前主要應用于四個領域:機器人導航、微操作系統(tǒng)的參數(shù)檢測、三維測量和虛擬現(xiàn)實。
日本大阪大學自適應機械系統(tǒng)研究院研制了一種自適應雙目視覺伺服系統(tǒng),利用雙目體視的原理,如每幅圖像中相對靜止的三個標志為參考,實時計算目標圖像的雅可比短陣,從而預測出目標下一步運動方向,實現(xiàn)了對動方式未知的目標的自適應跟蹤。該系統(tǒng)僅要求兩幅圖像中都有靜止的參考標志,無需攝像機參數(shù)。而傳統(tǒng)的視覺跟蹤伺服系統(tǒng)需事先知道攝像機的運動、光學等參數(shù)和目標的運動方式。
日本奈良科技大學信息科學學院提出了一種基于雙目立體視覺的增強現(xiàn)實系統(tǒng)(ar)注冊方法,通過動態(tài)修正特征點的位置提高注冊精度。該系統(tǒng)將單攝像機注冊(mr)與立體視覺注冊(sr)相結合,利用mr和三個標志點算出特征點在每個圖像上的二維坐標和誤差,利用sr和圖像對計算出特征點的三維位置總誤差,反復修正特征點在圖像對上的二維坐標,直至三維總誤差小于某個閾值。該方法比僅使用mr或sr方法大大提高了ar系統(tǒng)注冊深度和精度。實驗結果如圖2,白板上三角開的三頂點被作為單攝像機標定的特征點,三個三角形上的模型為虛擬場景,烏龜是真實場景,可見基本上難以區(qū)分出虛擬場景(恐龍)和現(xiàn)實場景(烏龜)。
日本東京大學將實時雙目立體視覺和機器人整體姿態(tài)信息集成,開發(fā)了仿真機器人動態(tài)行長導航系統(tǒng)。該系統(tǒng)實現(xiàn)分兩個步驟:首先,利用平面分割算法分離所拍攝圖像對中的地面與障礙物,再結合機器人身體姿態(tài)的信息,將圖像從攝像機的二維平面坐標系轉換到描述軀體姿態(tài)的世界坐標系,建立機器人周圍區(qū)域的地圖;基次根據實時建立的地圖進行障礙物檢測,從而確定機器人的行走方向。
日本岡山大學使用立體顯微鏡、兩個ccd攝像頭、微操作器等研制了使用立體顯微鏡控制微操作器的視覺反饋系統(tǒng),用于對細胞進行操作,對鐘子進行基因注射和微裝配等。
麻省理工學院計算機系統(tǒng)提出了一種新的用于智能交通工具的傳感器融合方式,由雷達系統(tǒng)提供目標深度的大致范圍,利用雙目立體視覺提供粗略的目標深度信息,結合改進的圖像分割算法,能夠在高速環(huán)境下對視頻圖像中的目標位置進行分割,而傳統(tǒng)的目標分割算法難以在高速實時環(huán)境中得到令人滿意的結果,系統(tǒng)框圖如圖3。
華盛頓大學與微軟公司合作為火星衛(wèi)星“探測者”號研制了寬基線立體視覺系統(tǒng),使“探測者”號能夠在火星上對其即將跨越的幾千米內的地形進行精確的定位玫導航。系統(tǒng)使用同一個攝像機在“探測者”的不同位置上拍攝圖像對,拍攝間距越大,基線越寬,能觀測到越遠的地貌。系統(tǒng)采用非線性優(yōu)化得到兩次拍攝圖像時攝像機的相對準確的位置,利用魯棒性強的最大似然概率法結合高效的立體搜索進行圖像匹配,得到亞像素精度的視差,并根據此視差計算圖像對中各點的三維坐標。相比傳統(tǒng)的體視系統(tǒng),能夠更精確地繪制“探測者”號周圍的地貌和以更高的精度觀測到更遠的地形。
3、國內研究動態(tài)
浙江大學機械系統(tǒng)完全利用透視成像原理,采用雙目體視方法實現(xiàn)了對多自由度機械裝置的動態(tài)、精確位姿檢測,僅需從兩幅對應圖像中抽取必要的特征點的三維坐標,信息量少,處理速度快,尤其適于動態(tài)情況。與手眼系統(tǒng)相比,被測物的運動對攝像機沒有影響,且不需知道被測物的運動先驗知識和限制條件,有利于提高檢測精度。
維視圖像公司采用雙目ccd相機,從工業(yè)相機內參標定、鏡頭畸變標定、立體匹配、特征點分割處理等方面給出了詳細的數(shù)學模型和算法接口。其雙目標定軟件ccas采用了張正友平面標定法,可以實現(xiàn)機器人導航、微操作系統(tǒng)的參數(shù)檢測、三維測量和虛擬現(xiàn)實等應用。
東南大學電子工程系基于雙目立體視覺,提出了一種灰度相關多峰值視差絕對值極小化立體匹配新方法,可對三維不規(guī)則物體(偏轉線圈)的三維空間坐標進行非接觸精密測量。
哈工大采用異構雙目活動視覺系統(tǒng)實現(xiàn)了全自主足球機器人導航。將一個固定攝像機和一個可以水平旋轉的攝像機,分別安裝在機器人的頂部和中下部,可以同時監(jiān)視不同方位視點,體現(xiàn)出比人類視覺優(yōu)越的一面。通過合理的資源分配及協(xié)調機制,使機器人在視野范圍、測跟精度及處理速度方面達到最佳匹配。雙目協(xié)調技術可使機器人同時捕捉多個有效目標,觀測相遇目標時通過數(shù)據融合,也可提高測量精度。在實際比賽中其他傳感器失效的情況下,僅僅依靠雙目協(xié)調仍然可以實現(xiàn)全自主足球機器人導航。
火星863計劃課題“人體三維尺寸的非接觸測量”,采用“雙視點投影光柵三維測量”原理,由雙攝像機獲取圖像對,通過計算機進行圖像數(shù)據處理,不僅可以獲取服裝設計所需的特征尺寸,還可根據需要獲取人體圖像上任意一點的三維坐標。該系統(tǒng)已通過中國人民解放軍總后勤部軍需部鑒定。可達到的技術指標為:數(shù)據采集時間小于5s/人;提供身高、胸圍、腰圍、臀圍等圍度的測量精度不低于1.0cm。
審核編輯:黃飛
-
計算機系統(tǒng)
+關注
關注
0文章
282瀏覽量
24115 -
3D眼鏡
+關注
關注
0文章
25瀏覽量
11000 -
雙目立體視覺
+關注
關注
0文章
17瀏覽量
8582 -
VR眼鏡
+關注
關注
4文章
221瀏覽量
40736
原文標題:雙目立體視覺技術
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論