加州大學伯克利分校的一組科學家進行的新研究使全球數據貧乏的地區有能力分析數據豐富的衛星圖像。發表在自然傳播上的研究介紹了一種機器學習模型,資源受限的組織和研究人員可以利用該模型提取區域社會經濟和環境信息。能夠遠程評估當地資源有助于指導有效的干預措施并使全球社區受益。
“我們發現,包括我們在內的許多研究人員都放棄了這一有價值的數據源,因為建立計算機視覺管道將原始像素值轉化為有用信息的復雜性和前期成本。我們認為 MIG 有一種方法可以使這些信息更容易獲取,同時保持最先進方法提供的預測技能。因此,我們開始構建一種實現這一目標的方法,”該研究的合著者伊恩·博利格( Ian Bolliger )說,他在加州大學伯克利分校攻讀能源與資源博士學位時參與了這項研究。
在任何時候,數百顆圖像采集衛星環繞地球運行,每天向數據庫發送大量信息。這些數據對全球挑戰(包括健康、經濟和環境條件)有著寶貴的洞察力 ,甚至還提供了對數據貧乏和偏遠地區的觀察。
將衛星圖像與機器學習( SIML )相結合已成為將這些原始數據流轉化為可用信息的有效工具。研究人員已將 SIML 應用于廣泛的研究,從計算貧困率到水的供應,再到教育普及。然而,大多數 SIML 項目捕捉的是一個狹隘主題的信息,創建的數據適合于特定的研究和位置。
研究人員試圖創建一個可訪問的系統,能夠分析和組織來自多個來源的衛星圖像,同時降低計算需求。他們創建的工具,稱為使用衛星圖像和廚房水槽的多任務觀測( MOSAIKS ),通過使用相對簡單和更有效的無監督機器學習算法來實現這一點。
“我們設計 MOSAIKS 時考慮到單個衛星圖像同時包含許多不同預測變量(如森林覆蓋率或人口密度)的信息。我們選擇使用圖像的無監督嵌入來創建每個圖像的統計摘要。特征化步驟的無監督性質使得管道的學習和預測步驟非常快,而如何從圖像計算這些特征的細節非常適合衛星圖像數據,”合著者、博士 Esther Rolf 說。伯克利大學計算機科學系學生。
為了開發模型,研究人員在 AWS 上使用 CUDA – 加速 NVIDIA V100 Tensor Core GPU。公共可用的CodeOcean膠囊使用 NVIDIA GPU ,它提供代碼、計算和存儲,供任何人交互運行。
圖 1 。訓練數據(左)和使用日間圖像單一特征化的預測(右)。插圖(最右側)在全局地圖中用黑色正方形標記。訓練樣本是對 1000000 個陸地網格單元的統一隨機抽樣, 498063 個網格單元的圖像可用,并且可以與任務標簽匹配。
“我們希望資源有限且沒有專業計算技能的決策者能夠毫不費力地收集衛星圖像,建立他們關心的變量模型(比如,是否存在適當的衛生系統),并測試該模型是否實際運行良好。如果他們能夠做到這一點,這將大大提高這些信息在實現政策目標方面的有用性,”博利格說。
目前,該團隊正在開發和測試一個面向公眾的網頁界面工具,使人們能夠方便地在用戶指定的位置查詢 MOSAIKS 功能。研究人員鼓勵感興趣的研究人員使用注冊作為測試版。
關于作者
Michelle Horton 是 NVIDIA 的高級開發人員通信經理,擁有通信經理和科學作家的背景。她在 NVIDIA 為開發者博客撰文,重點介紹了開發者使用 NVIDIA 技術的多種方式。
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
5026瀏覽量
103272 -
機器學習
+關注
關注
66文章
8428瀏覽量
132779
發布評論請先 登錄
相關推薦
評論