海嘯、洪水、火山、地震,各種惡劣災害在地球上經常上演。過去十年,地震和隨之而來的海嘯對受災地造成了巨大的經濟損失。地震通常是接連出現的,最先出現的是“主震”,隨后是一系列“余震”。雖然這些余震大部分都比主震要小,但在某些情況下,它們可能會讓重建工作變的更困難。雖然目前的技術已經能預測余震的時間和大小了,但想知道發(fā)生在什么位置卻是有挑戰(zhàn)性的工作。
為此,哈佛大學和谷歌的機器學習專家一起組建團隊,研究能否用深度學習技術預測余震可能發(fā)生的位置。今天,這篇論文發(fā)表在《Nature》上。為了得到這一結果,研究團隊首先搜集了世界上100多次地震的信息,并建立了數據庫。
1992年南加利福尼亞州蘭德斯地震可視化,中間的彩色區(qū)域表示第一次地震,紅色方塊表示余震位置
根據數據集,研究人員用一個神經網絡來分析主震和余震位置之間對應的靜態(tài)應力變化關系。算法可以辨別有用的形狀。最終我們得到了一個可以預測余震位置的模型。
對蘭德斯地震余震位置的預測。深紅色區(qū)域表示預測有余震的范圍,黑色的點表示實際發(fā)生的余震,黃線表示主震時發(fā)生斷層的位置
這項研究最后也帶來了意外的收獲:它可以幫我們確定地震的物理數值,這對研究地震的生成很重要。當我們在數據集上應用神經網絡時,我們可以看到內部因素的結合,它們是如何找到重要且有用的因素來幫助預測的。
下面就跟論智看看這篇論文大致講了什么吧:
具體方法
為了訓練和測試該模型,我們用的是SRCMOD在線數據集,其中含有有限斷層模型。我們計算了SRCMOD中199個滑動分部的應力變化張量(其中包含118次主震)。以每次主震為中心,周圍5km×5km×5km的范圍內為一個立方體單位。我們從國際地震中心獲得了主震過后一年內的余震記錄,將它們表示在每個立方體單位內。
通過這種表示方法,余震預報可以看作是大型二元分類問題,我們的目標就是精準分辨每個立方體單位內是否會有余震發(fā)生。
神經網絡就是應對這種問題的最好算法。這里使用的神經網絡是全連接的,共有六個隱藏層,每個隱藏層中包含50個神經元,并具有雙曲正切函數(總共有13451個權重和偏值)。我們用Keras搭建神經網絡,用Theano訓練它。在訓練時,有10%的訓練數據樣本用于驗證。
第一層網絡處理的是神經網絡的輸入,在該案例下,輸入的是在中心計算的應力變化張量的六個獨立分量的大小及其負值。在解決二元分類問題的神經網絡中,最后一層通常是單一sigmoid函數。而在我們的案例中,最后一個神經元的輸出可以理解成一個單元內生成一次或多次余震的概率。
模型評估
我們用ROC分析對余震預測模型進行了評估,ROC曲線廣泛用于評測醫(yī)療診斷檢測的有效性。結果如圖1所示:
圖1,上排為實際地震情況,下排為神經網絡預測結果
ROC分析結果表示,神經網絡的預測比目前使用的方法效果要好,神經網絡模型的AUC分數為0.849,而傳統(tǒng)的方法AUC分數僅為0.583。
除此之外,我們運用排列測驗法檢驗神經網絡在測試數據集上的數據重要性。對每個測試集中的主震分布,我們會隨機生成5000個位置,然后再計算出各自的AUC值。將這些值與實際的AUC比較,生成一個P值。
另外,我們發(fā)現,經過學習的余震發(fā)生模式是可以用物理解釋的:剪應力的最大變化、Von Mises屈服準則以及應力變化張量的獨立元素絕對值之和都能解釋神經網絡預測中98%的方差。這種機器學習做出的決策不僅能提高對余震發(fā)生位置預測的精確度而且還能確定它蘊涵的能量。
結語
雖然這一系統(tǒng)還并不精準,但為未來的研究打下了基礎。也許有一天,機器學習預報器能夠用在災難應急中,對危險區(qū)域的疏散轉移計劃提供幫助。
-
神經網絡
+關注
關注
42文章
4773瀏覽量
100882 -
數據庫
+關注
關注
7文章
3821瀏覽量
64506 -
深度學習
+關注
關注
73文章
5507瀏覽量
121265
原文標題:谷歌與哈佛大學合作,用深度學習預測余震位置
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論