機器學習使計算機能夠處理迄今為止僅由人執行的任務。從駕駛汽車到翻譯語言,機器學習正在推動人工智能爆炸式的增長,幫助軟件理解混亂而不可預知的真實世界。
但究竟什么是機器學習,又是什么讓機器學習現在如此繁榮呢?
什么是機器學習?
在很高的水平上,機器學習是教授計算機系統如何在饋入數據時做出準確預測的過程。
這些預測可以回答一張照片中的水果是香蕉還是蘋果,發現在自動駕駛汽車前橫過馬路的人,電子郵件是否是垃圾郵件,或足夠準確的識別語音以生成YouTube視頻的標題。
與傳統計算機軟件的主要區別在于,人類開發人員沒有編寫代碼來指導系統如何區分香蕉和蘋果之間的區別。相反,機器學習模式通過對大量數據進行訓練來準確地區分果實,在這種情況下會有大量標記為香蕉或蘋果的圖像。
AI和機器學習有什么不同?
機器學習可能已取得了巨大成功 ,但那只是實現人工智能的方式之一。在20世紀50年代人工智能領域誕生之時,人工智能被定義為任何能夠執行具有人類智慧任務的機器。
人工智能系統通常至少會展示以下特征中的一部分:規劃,學習,推理,解決問題,知識表達,感知,動作和操縱,以及社交智能和創造力。
除了機器學習外,還有其他各種用于構建AI系統的方法,包括進化計算,其中算法經歷隨機變異和代之間的組合以試圖“演變”為最優解決方案。以及專家系統,其中計算機按規則進行編程允許它們模仿特定領域的專家,例如駕駛飛機的自動駕駛系統。
機器學習有哪些主要類型?
機器學習分為兩大類:有監督學習和無監督學習。
什么是監督學習?這種方法基本上都是通過例子來學習。
在監督學習訓練期間,系統暴露于大量被標記的數據,例如標明了對應數字的手寫數字圖像。給出足夠的例子,監督學習系統將學會識別與每個數字相關的像素和形狀,并且最終能夠識別手寫數字,能夠可靠地區分數字9和4或6和8。
但是,對這些系統進行訓練通常需要大量標記數據,有些系統甚至需要暴露于數百萬個示例才能掌握任務。
因此,用于培訓這些系統的數據集可能非常龐大,Google的開放圖像數據集包含大約900萬個圖像,其帶有標簽的視頻存儲庫YouTube-8M可鏈接到700萬個帶標簽的視頻,ImageNet是這類早期數據庫之一,擁有超過1400萬個分類圖像。培訓數據集的規模繼續增長,Facebook最近宣布已經編輯了35億張在Instagram上公開發布的圖片,并使用每張圖片的標簽作為標簽。在ImageNet的基準測試中,使用10億張這些照片來訓練圖像識別系統的記錄準確率達到了85.4%。
標記訓練中使用的數據集的繁瑣過程通常使用群集服務進行,例如亞馬遜機械土耳其人,它提供了遍布全球的大量低成本勞動力的訪問。例如,ImageNet由兩年近5萬人組成,主要通過Amazon Mechanical Turk招募。然而,Facebook使用公開可用的數據來訓練系統的方法可以提供另一種使用數十億個數據集的訓練系統的方法,而無需手動標記的開銷。
什么是無監督學習?
相比之下,無監督學習任務算法在數據中識別模式,試圖將相似性的數據進行分類。例如愛彼迎將鄰居可租用的房屋聚集在一起,或Google新聞每天將類似主題的故事分組在一起。
該算法不是為了挑選特定類型的數據而設計,它只是查找可以按照其相似性進行分組的數據,或尋找突出異常的數據。
機器學習的一個子集是深度學習,其中神經網絡被擴展到具有大量數據訓練龐大網絡中。正是這些深度神經網絡推動了計算機執行語音識別和計算機視覺方面能力的飛躍發展。
各種類型的神經網絡,有不同的優勢和劣勢。遞歸神經網絡是特別適用于語言處理和語音識別的一類神經網絡,而卷積神經網絡更常用于圖像識別。神經網絡的設計也在不斷發展,研究人員最近為有效類型的深度神經網絡設計了一種更高效的設計,稱為長期短期記憶或LSTM,使其能夠快速運行,例如Google翻譯。
進化算法的AI技術甚至被用于優化神經網絡。該方法最近由優步人工智能實驗室展示,該實驗室發布了關于使用遺傳算法訓練深度神經網絡以強化學習問題的論文。
機器學習用來干什么?
機器學習系統一直在我們身邊使用,是現代互聯網的基石。用于為您推薦在亞馬遜上想要購買的產品或想要在Netflix上觀看的視頻。
每個Google搜索都使用多個機器學習系統,通過個性化搜索結果來了解查詢中的語言,因此搜索“低音”的釣魚愛好者不會被吉他的結果所淹沒。同樣,Gmail的垃圾郵件和網絡釣魚識別系統也使用經過機器學習的訓練模型,讓您的收件箱避開流氓信息。
虛擬助手如蘋果的Siri,亞馬遜的Alexa,谷歌助理和微軟Cortana是機器學習最典型的例子。
除此之外,在許多其它行業中也有許多用處,包括:無人駕駛汽車,無人駕駛飛機的計算機視覺;聊天機器人和服務機器人的語音識別;人臉識別;幫助放射科醫生在X射線中挑選腫瘤,幫助研究人員發現與疾病相關的基因序列,并找出可能導致醫療保健中更有效藥物的分子;通過分析物聯網傳感器數據,允許對基礎設施進行預測性維護等等。
本文由自興動腦人工智能學員:柯斌斌提供
借助此文,接下來我們會一步步講到深度學習,本文做為一個跳板。
-
AI
+關注
關注
87文章
31141瀏覽量
269478 -
人工智能
+關注
關注
1792文章
47436瀏覽量
238982 -
機器學習
+關注
關注
66文章
8425瀏覽量
132772 -
深度學習
+關注
關注
73文章
5508瀏覽量
121295
發布評論請先 登錄
相關推薦
評論