【導讀】本文介紹了包括圖像分類、交易預測、情感分類、推薦系統、股票預測等在內的若干個機器學習應用及數據集。
1.鳶尾花分類
Iris Flowers數據集被視為ML的“Hello World”,因為它是分類的典型例子。這個數據集的好處是它只有四個屬性:花瓣長度,花瓣寬度,萼片長度和萼片寬度,可加載到內存中。
該項目涉及使用四種已知特的不同種類的鳶尾花。
分類類型?這里使用多類分類。這意味著我們應該能夠準確地預測數據點屬于哪個類。
目標:根據花的特性對三種花進行分類:花瓣和萼片的尺寸。
2. 交易預測
GNY的小組發布了一個演示程序,展示了該平臺如何通過其強大的神經網絡預測零售交易組,并且該平臺的完全可下載和可定制版本將在今年夏天推出。GNY將有一個可選擇的機器學習代碼集庫,可以根據每個人的要求進行選擇,并可以應用于他們的側鏈(因為GNY將使用Lisk的側鏈技術)。
為什么這個這么重要?幾乎所有企業都在尋找一種經濟實惠的方式來挖掘其數據中的隱藏價值,但是如果它將它們暴露給安全風險則不會。區塊鏈的固有結構有助于控制數據一致性,并保持對數據的控制
性能提高,因為在前一個塊仍處于活動狀態時,已經可以為后續塊啟動驗證。驗證包括檢查用戶是否有足夠的余額。只有錯誤預測的交易,才需要重做這項工作。
這個演示是一個有趣的入門項目,適合想要預測簡單數字的人,今年夏天推出的完整平臺應該為開發人員提供更多功能和定制。可以在MLWave找到一個好的數據集,用于使用購買歷史來預測重復購買者。
目標:根據支出歷史預測未來交易。
3. Twitter的情感分析
機器學習的一個有趣應用是情感分析。隨著加密貨幣的興起,情緒分析取得了重大突破。許多人試圖建立包含情緒分析的交易機器人,以做出更好的交易決策。
還有許多其他平臺可用于情緒分析,如Reddit,Facebook或LinkedIn,因為它們都提供易于使用的API來檢索數據。但是,由于Twitter平臺上數據的格式一致,這是機器學習的首選數據。由于推文主要由文本,URL和主題標簽組成,因此預處理也更容易。
Twitter API知道許多可用于集成到項目中的API庫。可以使用!pip install python-twitter通過pip安裝Python的包裝器。
分析幾個有趣的例子:
圍繞新發布的電影的評論,并將其與IMDB和其他評級網站上的評論進行比較。
圍繞特定選舉或任何其他趨勢政治話題的情緒。
根據推文的情緒預測前50種加密貨幣價格的未來方向。
目標:情緒分析器學習一段內容背后的各種情緒。此任務可幫助您考慮設計各種模型以將推文標記為正面或負面。在后期階段,我們可以用更加細致的方式標記推文,如“中性”,“憤怒”,“樂觀”,......
4.使用Movielens的推薦系統
推薦系統是機器學習技術在商業中最成功和最廣泛的應用之一。您可以在日常生活中隨處找到推薦系統。例如,在觀看Youtube視頻時,Youtube算法會根據您的觀看習慣向您推薦視頻,同時也會根據觀察運行ML算法的模式對全世界人們的觀看行為提出關鍵見解。
我們可以為推薦系統找到兩種算法:
基于內容:它尋找內容的相其與其他人進行比較以找到類似的行為/喜好。下圖說明了這一點。
目前,Movielens提供了最受歡迎的電影評級數據集之一,這是初學者試驗的理想數據集。
目標:根據評分,預測用戶喜歡哪些電影。
5. Quandl股票價格預測
股票價格預測器是一個了解公司業績并預測未來股票價格的系統。股票價格預測的問題是可以使用許多類型和數據來源:
波動率指數
歷史價格
全球宏觀經濟指標
基本面分析
使用指標的技術分析
分析股票市場的好處是它具有更短的反饋周期,這使得更容易驗證您的預測。如果您不了解市場周期,我建議您閱讀有關此主題的內容,以了解典型周期的情況。
為了簡單起見,您可以選擇一個簡單的機器學習示例,如根據組織的季度報告預測6個月的價格變動。
目標:使用基本和技術指標預測未來價格。
-
圖像分類
+關注
關注
0文章
90瀏覽量
11918 -
股票預測
+關注
關注
0文章
2瀏覽量
6797 -
機器學習
+關注
關注
66文章
8418瀏覽量
132646 -
推薦系統
+關注
關注
1文章
43瀏覽量
10078
原文標題:機器學習如何入門?這五大機器學習項目帶你飛
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論