在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

有意義的機器學習來自于不同的數據

5RJg_mcuworld ? 來源:YXQ ? 2019-04-22 15:35 ? 次閱讀

人工智能的三大發展要素已經是老生常談了。算法、算力和數據對機器學習的重要性和聲望不亞于“謙哥”的喝酒、燙頭和抽煙。

那些熱衷競爭實施機器學習的公司現在驚訝地發現,其實,實施一些算法使機器變得對某一數據或問題更加智能并不困難。畢竟,這年頭“即插即用”又很穩健的算法編程解決方案簡直“爛大街了”。例如,從開源機器學習框架谷歌TensorFlow,到微軟Azure Machine Learning以及亞馬遜SageMaker,應有盡有。

所以,數據已逐漸成為了機器學習競爭中最關鍵的區分點。一個原因是高質量數據并不常見;另一原因是數據尚未商品化,公司企業之間存在著信息不對稱。

希望借助AI一臂之力的企業需要尋求外部數據源,甚至這樣的數據甚至可能需要他們自己創建。

有用的數據:有價值、又很稀少

數據逐漸變成競爭中的區分點是因為許多公司根本沒有他們需要的數據。盡管幾十年來,公司都在使用通用的會計準則這樣的系統化方法來評估自己,但是這種評估方法一直關注于實體資產與金融資產,也就是實物和錢。2013年甚至給資產定價理論頒了一個諾貝爾獎,強化了已有的對實體或金融資產重要性的認知。

但是,今天最有價值的那些公司貿易對象是軟件或網絡,而不僅僅是實體或金融資產。在過去的40年內,資產類型的重心有了很大的變化:1975年,83%的有形資產占整個市場絕大部分份額;而2015年時市場中84%的資產是無形資產。今天的公司巨頭們不再生產咖啡壺也不再售賣洗衣機,他們轉而提供應用程序,軟件等等。這樣的轉變造成了會計記賬的對象和實際產生價值的對象極其不匹配。

結果就是有用數據的缺少已經成為了一個問題。市面價值與賬面價值的差別越來越大。公司們正在試圖利用機器學習輔助重要的商業決策來改善這一差別。有時,機器學習甚至會取代一些昂貴的咨詢顧問們,而最后他們經常會意識到算法所需的數據壓根不存在。所以實際上,那些閃瞎人眼的先進AI系統最后依舊只是在同樣老舊的數據上試圖實施新技術。

和人類一樣,除非有人教,機器學習系統并不會精通任何領域。不過比起人類,機器會需要更多的信息來進行學習,并且它們確實比人類讀取數據的速度更快。因此,表面上公司間會互相競爭誰擁有更好的機器學習程序員以及誰先啟動AI項目,在幕后其實是對于數據新穎度和廣泛度的競爭。

比如說在金融領域,可供選擇的數據來源遠遠超過了傳統證券交易報告以及投資者展示等。數據還可以來源于社交網絡情感分析或者獲批專利數量等。

這些數據源的重要性主要基于兩點原因。首先,傳統數據局限于傳統資產,在當今無形資產當道的時代,覆蓋面上遠遠不夠。第二,并沒有任何必要在市場上所有人都在分析的數據上使用機器學習方法。所有對此感興趣的人都早已經嘗試過分析產業趨勢、利潤率、增長率、息稅前利潤、資產周轉率以及資產回報率和其它上千個常見的變量與股東回報率之間的相關性。

在所有人都在分析的數據上試圖發現相關性并不會幫助公司取勝。相反,希望使用AI取勝的公司需要尋找新數據集之間的聯系,因此他們可能必須自己創建那些新數據集來評估無形資產。

謹慎思考:你想知道什么?

創建數據比僅僅把銷售點與顧客信息兩個表聚合到一起然后丟進數據庫復雜得多。大多數企業錯誤地相信通過這樣一種權宜的方法能夠預測或區分出他們關心的信息:把所有能找到的數據都大費周章地聚合到一起然后指望能夠找到一絲希望之光。

盡管機器學習有時會突然發現某些從未有人意識到的事物從而使所有人都大吃一驚,但它并不能夠持續穩定提供這樣的洞察。這并不意味著這項工具很垃圾,這意味著我們需要更明智地使用它。但說起來容易做起來難:比如,在我們研究外部數據市場時,我們發現大多數新數據提供者依舊在關注實體與金融資產。

許多企業遺漏的一步是提出一項真正重要的假設。機器學習真正體現優越性之處在于,它們能夠通過采用人類已經擁有的見解,這可以來自于經驗法則、廣泛認知或者幾乎完全不被理解的相關性,來建設一種速度更快、更易于理解、更易于擴展且更低錯誤率的方法。

為了這樣使用機器學習方法,不應向系統塞進任何你能找到的數據。你僅僅輸入被謹慎思考過的一組信息,希望它能夠學習并拓展,得到比人類掌握的更多的信息。

有意義的機器學習來自于不同的數據

以下是為希望搭建有影響力、有價值的機器學習應用的公司提出的三點建議:

1.成功的AI在于與眾不同的數據。在你的競爭對手都已經掌握的數據上你是得不出什么新穎信息的。審視企業內部,找出只有你們知道并理解的信息并以此創建一個獨特的數據集。機器學習算法確實需要大量的數據支持,但這并不意味著模型需要考慮大量變量。你應當把關注點放在企業已經具有獨特之處的數據上。

2.有意義的數據比全面的數據好。你可能就某問題上擁有大量詳盡數據,但它們可能壓根沒什么用。如果你的公司根本不會在決策過程中隨時使用這些信息,那這樣的數據八成對機器學習也沒有什么價值。專業的機器學習工程師會詢問許多困難的問題來找出什么才是真正重要的領域,以及那些領域將如何對該應用程序輸出結果產生影響。如果這些問題對你太難了,那么你并沒有為得到實際價值而仔細思考。

3.應當從你已知的信息出發。最善于利用機器學習的公司會從一個獨特的視角出發,來找到與他們重要決策最為相關的因素。這將會指導他們去收集何種數據以及使用何種技術。就基于你們團隊已經擁有的一部分知識之上進行拓展這個問題來著手是比較簡單的,這也將為你企業創造更多價值。

很明顯這個時代已經是“軟件吃掉了整個世界”了(這個形容來源于軟件工程師Marc Andreessen)。但它們依然很饑餓!軟件們需要一份包含嶄新數據與科技的食譜來持續創造價值。

沒有人希望落后于這樣的洞察、機器與外部數據的轉變。那么,請從內部審視企業開始,去發掘你獨特的見解以及你可以而且應該得到的有價值的外部數據來源。通過這些步驟,你才能夠發現保持企業競爭力的相關洞見。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7104

    瀏覽量

    89293
  • 機器學習
    +關注

    關注

    66

    文章

    8428

    瀏覽量

    132842

原文標題:機器學習競爭其實是一場數據上的競爭

文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    安防監控NTP校時服務器:讓視頻數據有意義

    安防監控NTP校時服務器:讓視頻數據有意義
    的頭像 發表于 12-16 10:59 ?204次閱讀
    安防監控NTP校時服務器:讓視頻<b class='flag-5'>數據</b>更<b class='flag-5'>有意義</b>

    ads8568的gain drift不是一般來自于ref的溫漂嗎?為啥還會有額外的溫漂呢?如何降低這個溫漂值呢?

    ? ADC的gain drift不是一般來自于ref的溫漂嗎?為啥還會有額外的溫漂呢? 另外,如何降低這個溫漂值呢?我打算采用一個低溫漂的ADR4525D作為外部參考,它的溫漂是0.8ppm,這樣可以減少ADS8568的溫漂嗎?
    發表于 11-29 08:06

    示波器ADC分辨率再高,沒有優質探頭也是沒有意義

    在示波器測量領域,存在一種常見的錯誤認知:人們往往以為示波器測量的準確性僅僅取決儀器本身的規格,例如屏幕上顯示的波形數量。然而,實際情況遠非如此簡單,測量準確性是一個復雜的概念,它與測量設置緊密
    的頭像 發表于 11-22 11:23 ?174次閱讀
    示波器ADC分辨率再高,沒有優質探頭也是沒<b class='flag-5'>有意義</b>的

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實上,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得它逐漸成為智
    的頭像 發表于 11-16 01:07 ?460次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    收到《時間序列與機器學習》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發燒友提供了一個讓我學習時間序列及應用的機會! 前言第一段描述了編寫背景: 由此可知,這是一本關于時間序列進行大
    發表于 08-11 17:55

    雙電源無擾動快切裝置的小型化設計是否有意義

    快切裝置的小型化設計對于安裝空間有限的改造場景是非常有意義的,DCM635系列是目前業內體積最小的快切裝置,前面板長266mm,寬146mm,裝置深210.5mm,安裝與進線柜或母聯柜上層二次控制室面板上,小型化設計節省安裝空間,尤其適用于改造項目中,開關柜前面板開孔尺寸有限的場景。
    的頭像 發表于 07-19 11:30 ?406次閱讀
    雙電源無擾動快切裝置的小型化設計是否<b class='flag-5'>有意義</b>?

    機器學習中的數據分割方法

    機器學習中,數據分割是一項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習
    的頭像 發表于 07-10 16:10 ?2024次閱讀

    機器學習中的數據預處理與特征工程

    機器學習的整個流程中,數據預處理與特征工程是兩個至關重要的步驟。它們直接決定了模型的輸入質量,進而影響模型的訓練效果和泛化能力。本文將從數據預處理和特征工程的基本概念出發,詳細探討這
    的頭像 發表于 07-09 15:57 ?518次閱讀

    機器學習數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從
    的頭像 發表于 07-02 11:22 ?704次閱讀

    通過強化學習策略進行特征選擇

    更快更好地學習。我們的想法是找到最優數量的特征和最有意義的特征。在本文中,我們將介紹并實現一種新的通過強化學習策略的特征選擇。我們先討論強化學習,尤其是馬爾可夫決策
    的頭像 發表于 06-05 08:27 ?387次閱讀
    通過強化<b class='flag-5'>學習</b>策略進行特征選擇

    TLF35584處待機狀態時,能否通過SPI命令獲取其狀態?

    35584 處于待機狀態時,能否通過 SPI 命令獲取其狀態? 或者 DEVSTAT.STATE = 0x04(待機)是否有意義
    發表于 05-30 08:10

    機器學習入門:基本概念介紹

    機器學習(GraphMachineLearning,簡稱GraphML)是機器學習的一個分支,專注利用圖形結構的
    的頭像 發表于 05-16 08:27 ?527次閱讀
    圖<b class='flag-5'>機器</b><b class='flag-5'>學習</b>入門:基本概念介紹

    Perplexity將Yelp數據引入其聊天機器

    Perplexity首席執行官Aravind Srinivas告訴The Verge,許多人正在使用像常規搜索引擎一樣的聊天機器人 —— 直接從源頭提供他們想要的東西的信息是有意義的,比如選擇餐館。
    的頭像 發表于 03-19 17:36 ?721次閱讀
    Perplexity將Yelp<b class='flag-5'>數據</b>引入其聊天<b class='flag-5'>機器</b>人

    數據挖掘的應用領域,并舉例說明

    數據挖掘(Data Mining)是一種從大量數據中提取出有意義的信息和模式的技術。它結合了數據庫、統計學、機器
    的頭像 發表于 02-03 14:19 ?3207次閱讀

    干貨!收藏!一文講清楚數據治理到底是什么?

    是指對客觀事件進行記錄并可以鑒別的符號,是對客觀事物的性質、狀態以及相互關系等進行記載的物理符號或這些物理符號的組合。 數據可以分為兩個部分,一是數字,二是文字。數字是沒有意義的抽象符號,數據
    的頭像 發表于 02-01 10:40 ?500次閱讀
    干貨!收藏!一文講清楚<b class='flag-5'>數據</b>治理到底是什么?
    主站蜘蛛池模板: 日本毛片在线观看| a黄网站| 深爱婷婷| 亚洲成人免费看| 天堂亚洲网| 色五夜婷婷| 免费一日本一级裸片在线观看| 欧美日韩一区不卡| 久久国产香蕉一区精品| 国模无水印一区二区三区| 高颜值大长腿美女啪啪| 午夜视频久久| 精品乱人伦一区二区三区| 欧美乱妇高清无乱码| 久操视频网| 2021久久精品国产99国产| 丁香六月啪啪| 中文字幕第8页| 色六月丁香| 精品国产乱码久久久久久浪潮| 操美女大逼逼| 人人天天爱天天做天天摸| 亚洲操综合| 国产精品性| 色网站综合| 韩国在线a免费观看网站| 五月天婷婷综合| 亚洲啪啪免费视频| 国产精品高清久久久久久久| 四虎在线最新永久免费| 久久综合九色综合欧美狠狠| 在线观看永久免费| 国产午夜小视频| 美女扒开尿口给男人桶视频免费 | 久操免费在线视频| 中文字幕一区二区三区有限公司| 伊人毛片| 免费观看黄色网页| 午夜在线视频免费| 日处女穴| 天天欲色|