在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

什么是機器學習?通過機器學習方法能解決哪些問題?

穎脈Imgtec ? 2024-11-16 01:07 ? 次閱讀

來源:Master編程


機器學習”最初的研究動機是讓計算機系統具有人的學習能力以便實現人工智能。因為沒有學習能力的系統很難被認為是具有智能的。目前被廣泛采用的機器學習的定義是“利用經驗來改善計算機系統自身的性能”。事實上,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得它逐漸成為智能數據分析技術的創新源之一,并且受到越來越多的關注。

機器學習的核心在于建模和算法,學習得到的參數只是一個結果。

成功訓練一個模型需要四個要素:數據、轉換數據的模型、衡量模型好壞的損失函數和一個調整模型權重以便最小化損失函數的算法。

機器學習里最重要的四類問題(按學習結果分類):

預測(Prediction)一般用回歸(Regression,Arima)等模型。

聚類(Clustering)如K-means方法。

分類(Classification)如支持向量機法(Support Vector Machine,SVM),邏輯回歸(Logistic Regression)。

降維(Dimensional reduction)如主成分分析法(Principal Component Analysis,PCA,即純矩陣運算)。

如果按照學習方法,機器學習又可以分為如下幾類

  • 監督學習(SupervisedLearning,如深度學習);
  • 無監督學習(Un-supervised Learning,如聚類);
  • 半監督學習(Semi-supervised Learning);
  • 增強學習(Reinforced Learning)。

幾種常用的機器學習方法:

  • 文本分類
  • 特征提取
  • 標注
  • 搜索與排序
  • 推薦系統
  • 序列學習

1、文本分類

文本分類技術在NLP領域有著舉足輕重的地位。文本分類是指在給定分類體系,根據文本內容自動確定文本類別的過程。20世紀90年代以來,文本分類已經出現了很多應用,比如信息檢索、Web 文檔自動分類、數字圖書館、自動文摘、分類新聞、文本過濾單詞語義辨析、情感分析等。
分類過程主要分為兩個階段,訓練階段和預測階段。訓練階段根據訓練數據訓練得到分類模型。預測階段根據分類器推斷出文本所屬類別。訓練階段一般需要先分詞,然后提取文本為特征,提取特征的過程稱之為特征提取。

一般來說文本分類大致分為如下幾個步驟:

1)定義階段定義數據以及分類體系,具體分為哪些類別,需要哪些數據

2)數據預處理對文檔做分詞、去停用詞等準備工作。

3)數據提取特征對文檔矩陣進行降維,提取訓練集中最有用的特征。

4)模型訓練階段選擇具體的分類模型以及算法,訓練出文本分類器。

5)評測階段在測試集上測試并評價分類器的性能。

6)應用階段應用性能最高的分類模型對待分類文檔進行分類。


2、特征提取

在使用分類器之前,需要對文本提取特征,而一般來說,提取特征有幾種經典的方法:

Bag-of-words最原始的特征集,一個單詞/分詞就是一個特征。往往一個數據集就會有上萬個特征;有一些簡單的指標可以幫助篩選掉一些對分類沒幫助的詞語,例如去停詞、計算互信息熵等。但不管怎么訓練,特征維度都很大,每個特征的信息量太小。

統計特征包括Termfrequency(TF)、Inverse document frequency(IDF),以及合并起來的TF-IDF。這種語言模型主要是用詞匯的統計特征來作為特征集,每個特征都能夠說得出物理意義,看起來會比bag-of-words效果好,但實際效果也差不多。

  • N-Gram一種考慮了詞匯順序的模型,就是N階Markov鏈,每個樣本轉移成轉移概率矩陣,也能取得不錯的效果。

3、標注事實上,有一些看似分類的問題在實際中卻難以歸于分類。例如,把圖所示的小女孩與狗這張圖無論分類成人還是狗看上去都有些問題。

圖里既有人又有狗。其實還不止這些,里面還有草啊、書包啊、樹啊等。與其將上圖僅僅分類為其中一類,倒不如把這張圖里面我們所關心的類別都標注出來。比如,給定一張圖片,我們希望知道里面是否有人、是否有狗、是否有草等。給定一個輸人,輸出不定量的類別,這個就叫作標注任務。


4、搜索與排序

在這個數據爆炸的時代,在大量數據的場景下,如何用算法幫助人們從這些無序的信息中找到人們需要的信息就成為一個剛需。搜索與排序關注的問題更多的是如何對一堆對象排序。例如在信息檢索領域,我們常常關注如何把海量的文檔按照與檢索條目的相關性進行排序。在互聯網時代,由于谷歌和百度等搜索引擎的流行,我們更加關注如何對網頁進行排序。互聯網時代早期,谷歌研發出一個著名的網頁排序算法-PageRank。該算法的排序結果并不取決于特定的用戶檢索條目,這些排序結果可以更好地為所包含的檢索條目的網頁進行排序。


5、推薦系統

推薦系統和搜索排序關系緊密,并且被廣泛應用于電子商務、搜索引擎、新聞門戶等。推薦系統的主要目標是把用戶可能感興趣的東西推薦給用戶。推薦算法用到的信息種類非常多,例如用戶的自我描述、過往的購物習慣,以及對過往推薦的反饋等。


6、序列學習序列學習是一類近來備受關注的機器學習問題。在這類問題中,需要考慮順序問題輸入和輸出的長度不固定(例如翻譯,輸入的英文和翻譯出來的中文長度都是不固定的)。這類模型通常可以處理任意長度的輸人序列,或者輸出任意長度的序列。當輸入和輸出都是不定長的序列時,我們把這類模型稱為seq2seq,例如QA問答系統、語言翻譯模型和語音轉錄文本模型。

以下列舉了一些常見的序列學習案例。


1. 語音識別

在語音識別的問題里,輸人序列通常都是麥克風的聲音,而輸出是對通過麥克風所說的話的文本轉錄。這類問題通常有一個難點,例如聲音通常都在特定的采樣率下進行采樣,因為聲音和文本之間不存在一一對應的關系。換言之,語音識別是一類序列轉換問題。這里的輸出往往比輸人短很多。


2. 文本轉語音

這是語音識別問題的逆問題。這里的輸入是一個文本序列,而輸出才是聲音序列。因此,這類問題的輸出比輸入長。


3. 機器翻譯機器翻譯的目標是把一段話從一種語言翻譯成另一種語言,例如把中文翻譯成英語。目前,機器翻譯技術已經很成熟,例如國內的科大訊飛以及百度語音在中文翻譯領域都有不錯的成績,不過有的時候也會出現一些尷尬的翻譯結果。

機器翻譯的復雜程度是非常高的,同一個詞在兩種不同語言下有時候是多對多的關系。另外,符合語法或者語言習慣的語序調整也令問題更加復雜。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7522

    瀏覽量

    88290
  • 機器學習
    +關注

    關注

    66

    文章

    8428

    瀏覽量

    132827
  • nlp
    nlp
    +關注

    關注

    1

    文章

    489

    瀏覽量

    22063
收藏 人收藏

    評論

    相關推薦

    【卡酷機器人】——基礎學習方法

    `` 這里和大伙兒講解一下卡酷機器人基礎學習方法,如果有錯誤,歡迎大家指點喲。``
    發表于 01-09 18:01

    【下載】《機器學習》+《機器學習實戰》

    讀者, 本書附錄給出了一些相關數學基礎知識簡介.目錄:全書共16 章,大致分為3 個部分:第1 部分(第1~3 章)介紹機器學習的基礎知識;第2 部分(第4~10 章)討論一些經典而常用的機器
    發表于 06-01 15:49

    深度解析機器學習三類學習方法

    機器學習(Machine learning)領域。主要有三類不同的學習方法:監督學習(Supervised learning)、非監督學習
    發表于 05-07 09:09 ?1.4w次閱讀

    什么是機器學習機器學習能解決什么問題?(案例分析)

    隨著大數據時代的到來,機器學習成為解決問題的一種重要且關鍵的工具。不管是工業界還是學術界,機器學習都是一個炙手可熱的方向,但是學術界和工 業界對機器
    發表于 05-18 13:13 ?1.6w次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>能解</b>決什么問題?(案例分析)

    機器學習與數據挖掘:方法和應用》

    和應用》的介紹及下載地址 贊助本站 《機器學習與數據挖掘:方法和應用》分為5個部分,共18章,較為全面地介紹了機器學習的基本概念,并討論了數
    發表于 06-27 18:38 ?786次閱讀

    如何學好機器學習機器學習學習方法4個關鍵點整理概述

    。 對于想要了解或從事AI行業工作的小伙伴們來說,能夠快速、深入的掌握機器學習相關知識顯得尤為重要,小編給大家整理機器學習學習方法
    的頭像 發表于 09-24 19:29 ?6334次閱讀
    如何學好<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的<b class='flag-5'>學習方法</b>4個關鍵點整理概述

    機器學習入門寶典《統計學習方法》的介紹

    《統計學習方法》可以說是機器學習的入門寶典,許多機器學習培訓班、互聯網企業的面試、筆試題目,很多都參考這本書。本文根據網上資料用python
    的頭像 發表于 11-25 09:24 ?4680次閱讀

    面向人工智能的機器學習方法體系總結

    此處梳理出面向人工智能的機器學習方法體系,主要體現機器學習方法和邏輯關系,理清機器學習脈絡,后續
    的頭像 發表于 12-17 15:10 ?3408次閱讀
    面向人工智能的<b class='flag-5'>機器</b><b class='flag-5'>學習方法</b>體系總結

    區塊鏈數據集有怎樣的機器學習方法

    區塊鏈數據集提供了一個與加密貨幣資產行為相關的獨特的數據宇宙,因此,為機器學習方法的應用提供了獨特的機會。
    發表于 11-26 09:49 ?905次閱讀

    隨著人工智能的落地 自動化機器學習方法AutoML應運而生

    隨著概念的普及,科技公司對人工智能的要求越來越高,成本、準確度、效率都影響著人工智能能否落地融入日常的使用中。對人工智能應用的快速增長也進而催生了對影響人工智能水平的關鍵要素——機器學習方法的需求。自動化機器
    發表于 12-02 15:03 ?811次閱讀

    機器學習方法遷移學習的發展和研究資料說明

    近年來,遷移學習已經引起了廣泛的關注和研究。遷移學習是運用已存有的知識對不同但相關領域問題進行求解的一種新的機器學習方法。它放寬了傳統機器
    發表于 07-17 08:00 ?0次下載
    <b class='flag-5'>機器</b><b class='flag-5'>學習方法</b>遷移<b class='flag-5'>學習</b>的發展和研究資料說明

    深度討論集成學習方法,解決AI實踐難題

    集成學習方法是一類先進的機器學習方法,這類方法訓練多個學習器并將它們結合起來解決一個問題,在實踐中獲得了巨大成功,并成為
    發表于 08-16 11:40 ?782次閱讀
    深度討論集成<b class='flag-5'>學習方法</b>,解決AI實踐難題

    水聲被動定位中的機器學習方法研究進展綜述

    向量機、隨機森林及以卷積網絡層和全連接層為主要組成單元的深度神經網絡。本文通過重點引述近幾年發表在國際期刊和會議上的相關前沿研究工作,詳細論述了將機器學習方法應用于水聲被動定位的關鍵理論基礎、單水聽器和陣列前端信號
    發表于 12-24 11:18 ?698次閱讀
    水聲被動定位中的<b class='flag-5'>機器</b><b class='flag-5'>學習方法</b>研究進展綜述

    聯合學習在傳統機器學習方法中的應用

    聯合學習在傳統機器學習方法中的應用
    的頭像 發表于 07-05 16:30 ?790次閱讀
    聯合<b class='flag-5'>學習</b>在傳統<b class='flag-5'>機器</b><b class='flag-5'>學習方法</b>中的應用

    傳統機器學習方法和應用指導

    用于開發生物學數據的機器學習方法。盡管深度學習(一般指神經網絡算法)是一個強大的工具,目前也非常流行,但它的應用領域仍然有限。與深度學習相比,傳統
    的頭像 發表于 12-30 09:16 ?293次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習方法</b>和應用指導
    主站蜘蛛池模板: 久久久久免费精品国产| 久久99精品久久久久久臀蜜桃| 床上激情四射| 9久久99久久久精品齐齐综合色圆| 免费网站黄| 永久在线观看www免费视频| 中文字幕不卡免费高清视频| 一久久| 天堂bt种子资源+在线| 色妞影视| 久久色婷婷| 波多野结衣在线观看一区| 伊人狼人在线| 男人午夜禁片在线观看| 182tv免费视视频线路一二三 | 九色97| 成人久久久| 天天射视频| 97久草| 精品国产免费观看久久久| 婷婷97狠狠的狠狠的爱| 热久久综合这里只有精品电影| 九色窝| 天天摸夜夜摸成人免费视频| 国产伦精品一区二区三区四区| 亚洲综合涩| 校园 春色 欧美 另类 小说| 日本黄色片在线播放| 高清国产亚洲va精品| 奇米影视99| 中文字幕精品一区二区三区视频 | 黄色h网站| 真实女人寂寞偷人视频| 日本免费的一级绿象| 国精视频一区二区视频| 五月天婷婷综合| 我不卡老子影院午夜伦我不卡四虎 | 成人精品视频一区二区三区| 啪啪伊人网| 视频一区二区在线观看| 四虎国产永久在线精品免费观看|