自然語(yǔ)言處理(NLP)的定義
自然語(yǔ)言處理(NLP)是人工智能技術(shù)的一個(gè)分支,它使計(jì)算機(jī)能夠像人們一樣理解、處理和生成語(yǔ)言,并且在商業(yè)中的應(yīng)用正在迅速增長(zhǎng)。
雖然自然語(yǔ)言處理(NLP)這一術(shù)語(yǔ)最初指的是人工智能系統(tǒng)的閱讀能力,但它后來(lái)成為所有計(jì)算語(yǔ)言學(xué)的一種通俗說(shuō)法。其子類別包括自然語(yǔ)言生成(NLG)(計(jì)算機(jī)自行創(chuàng)建通信的能力)和自然語(yǔ)言理解(NLU)(理解俚語(yǔ)、錯(cuò)誤發(fā)音、拼寫(xiě)錯(cuò)誤以及其他語(yǔ)言變體的能力)。
自然語(yǔ)言處理(NLP)的工作原理
自然語(yǔ)言處理通過(guò)機(jī)器學(xué)習(xí)(ML)進(jìn)行。機(jī)器學(xué)習(xí)系統(tǒng)像其他任何形式的數(shù)據(jù)一樣存儲(chǔ)單詞及其組合方式。將短語(yǔ)、句子,有時(shí)甚至整本書(shū)的內(nèi)容都輸入機(jī)器學(xué)習(xí)引擎,并根據(jù)語(yǔ)法規(guī)則和人們的現(xiàn)實(shí)語(yǔ)言習(xí)慣(或兩者兼而有之)進(jìn)行處理。然后,計(jì)算機(jī)使用這些數(shù)據(jù)來(lái)查找模式并推斷出下一步的工作。以翻譯軟件為例:在法語(yǔ)中,“我要去公園”是“Je vais au parc”,因此機(jī)器學(xué)習(xí)預(yù)測(cè)“我要去商店”也將以“Je vais au”開(kāi)頭。
自然語(yǔ)言處理應(yīng)用
機(jī)器翻譯是更好的自然語(yǔ)言處理(NLP)應(yīng)用程序之一,但它并不是最常用的一種。人們每次在Google或Bing搜索引擎中查找內(nèi)容時(shí),都將數(shù)據(jù)輸入到系統(tǒng)中。當(dāng)單擊搜索結(jié)果時(shí),搜索引索會(huì)將其視為對(duì)找到的結(jié)果正確的確認(rèn),并在以后使用這個(gè)信息更好地進(jìn)行搜索。
聊天機(jī)器人的工作方式與其相同:它們與Slack、Microsoft Messenger和其他聊天程序集成在一起,可以在其中讀取人們所說(shuō)的語(yǔ)言,然后在說(shuō)出觸發(fā)詞語(yǔ)時(shí)將其打開(kāi)。當(dāng)Siri和Alexa等語(yǔ)音助手聽(tīng)到“Hey,Alexa”之類的短語(yǔ)時(shí),它們就會(huì)進(jìn)行響應(yīng)。這就是批評(píng)者指責(zé)這些程序一直在監(jiān)聽(tīng)的原因:如果不是,它們永遠(yuǎn)不會(huì)知道人們何時(shí)需要它們。除非人們自己打開(kāi)應(yīng)用程序,否則自然語(yǔ)言處理程序?qū)⒃诤笈_(tái)運(yùn)行,等待短語(yǔ)的出現(xiàn)。
自然語(yǔ)言處理(NLP)對(duì)人們的利大于弊。人們可以想象一下沒(méi)有谷歌搜索或者拼寫(xiě)檢查程序的生活。它使用自然語(yǔ)言處理(NLP)將輸入的單詞與字典中的單詞進(jìn)行比較。通過(guò)比較這兩個(gè)數(shù)據(jù)集,拼寫(xiě)檢查程序可以找出問(wèn)題并提供建議。
自然語(yǔ)言處理(NLP)示例
搜索引擎和拼寫(xiě)檢查的應(yīng)用如今非常普遍,人們經(jīng)常將它們視為一種理所當(dāng)然的技術(shù),尤其是在自然語(yǔ)言處理(NLP)可以顯著提高生產(chǎn)力的工作中。例如如果想知道還剩下多少假期?不必詢問(wèn)人力資源部門。可以采用聊天機(jī)器人Talla節(jié)省時(shí)間,它會(huì)搜索企業(yè)政策以尋找答案。打電話聯(lián)系客戶需要翻看手機(jī)所存的電話號(hào)碼?可以采用語(yǔ)音提示,通過(guò)聲音搜索啟動(dòng)SecondMind,將會(huì)給出所需的號(hào)碼。這種集成的搜索工具可以加快員工與客戶的溝通。
自然語(yǔ)言處理還可以幫助招聘者對(duì)簡(jiǎn)歷進(jìn)行分類,吸引各種應(yīng)聘者并雇用更多合格的員工。對(duì)垃圾郵件進(jìn)行檢測(cè)可以使用自然語(yǔ)言處理(NLP),以阻止垃圾電子郵件進(jìn)入人們的收件箱;此外,可以采用Outlook和Gmail等程序?qū)⒛承┤说泥]件分類到創(chuàng)建的文件夾中。
諸如情緒分析之類的工具可幫助企業(yè)快速識(shí)別推文內(nèi)容的好壞,從而可以了解客戶的顧慮。情感分析不僅可以處理社交媒體上的文字,還可以分解詞語(yǔ)出現(xiàn)的語(yǔ)境。對(duì)于分析機(jī)構(gòu)Periscopic公司的數(shù)據(jù)可視化工具SkyeMorét來(lái)說(shuō),只有30%的英語(yǔ)單詞是正面的,其余的是中性或負(fù)面的。因此,自然語(yǔ)言處理(NLP)可以幫助企業(yè)更全面地理解一個(gè)帖子:在這些中性詞匯背后,消費(fèi)者表達(dá)的情感是什么?
傳統(tǒng)上,企業(yè)使用自然語(yǔ)言處理將反饋分為積極和消極兩類。但是Fleishman Hillard公司社會(huì)和創(chuàng)新業(yè)務(wù)的高級(jí)副總裁Ryan Smith表示,當(dāng)今的自然語(yǔ)言處理工具可以識(shí)別更精確的情緒,例如悲傷、憤怒和恐懼。
自然語(yǔ)言處理(NLP)軟件
無(wú)論人們是要構(gòu)建聊天機(jī)器人、語(yǔ)音助手、預(yù)測(cè)文本應(yīng)用程序,還是以自然語(yǔ)言處理為核心的其他應(yīng)用程序,企業(yè)都將需要采用工具。根據(jù)調(diào)查,最受歡迎的自然語(yǔ)言處理軟件包括:
?自然語(yǔ)言工具包(NLTK)。自然語(yǔ)言工具包(NLTK)是一個(gè)開(kāi)放源代碼框架,用于構(gòu)建Python程序以使用人類語(yǔ)言數(shù)據(jù)。它是在賓夕法尼亞大學(xué)計(jì)算機(jī)和信息科學(xué)系開(kāi)發(fā)的,為50多個(gè)語(yǔ)料庫(kù)和詞匯資源庫(kù)、一個(gè)文本處理庫(kù)、自然語(yǔ)言處理庫(kù)和論壇提供接口。自然語(yǔ)言工具包(NLTK)是在Apache2.0許可下提供的。
?SpaCy。SpaCy是一個(gè)開(kāi)放源代碼庫(kù),用于高級(jí)自然語(yǔ)言處理,專門為生產(chǎn)目的而非研究目的而設(shè)計(jì)。SpaCy的設(shè)計(jì)充分考慮了高級(jí)數(shù)據(jù)科學(xué),并允許深度數(shù)據(jù)挖掘。它是由麻省理工學(xué)院授權(quán)的。
?Gensim。Gensim是一個(gè)用于自然語(yǔ)言處理的開(kāi)源Python庫(kù)。獨(dú)立于平臺(tái)的庫(kù)支持可擴(kuò)展的統(tǒng)計(jì)語(yǔ)義、針對(duì)語(yǔ)義結(jié)構(gòu)的純文本文檔分析以及檢索語(yǔ)義相似文檔的能力。可以在無(wú)需人工監(jiān)督的情況下處理大量文本。
?Amazon Comprehend。這項(xiàng)Amazon服務(wù)不需要機(jī)器學(xué)習(xí)的經(jīng)驗(yàn)。它旨在幫助組織從電子郵件、客戶評(píng)論、社交媒體、支持通知單和其他文本中獲得見(jiàn)解。它使用情感分析、詞性提取和標(biāo)記化來(lái)分析單詞背后的意圖。
?IBM Watson音頻分析器。這個(gè)基于云計(jì)算的解決方案旨在用于社交監(jiān)聽(tīng)、聊天機(jī)器人集成和客戶服務(wù)監(jiān)控。它可以分析客戶帖子中的情緒和語(yǔ)氣,并監(jiān)視客戶服務(wù)電話和聊天對(duì)話。
?谷歌云翻譯。這個(gè)API使用自然語(yǔ)言處理來(lái)檢查源文本以確定語(yǔ)言,然后使用神經(jīng)機(jī)器翻譯將文本動(dòng)態(tài)翻譯為另一種語(yǔ)言。這個(gè)API允許用戶將功能集成到他們自己的程序中。
自然語(yǔ)言處理(NLP)課程
有很多資源可用于學(xué)習(xí)創(chuàng)建和維護(hù)自然語(yǔ)言處理應(yīng)用程序,其中許多是免費(fèi)的資源。其中包括:
?DataCamp中的Python自然語(yǔ)言處理。這門免費(fèi)課程提供15個(gè)視頻和51個(gè)練習(xí)文件,涵蓋了使用Python處理自然語(yǔ)言的基礎(chǔ)知識(shí)。它涵蓋了如何識(shí)別和分隔單詞,如何在文本中提取主題,以及如何構(gòu)建自己的虛假新聞分類器。
?Udemy的自然語(yǔ)言處理(NLP)。這個(gè)入門課程提供使用Python和自然語(yǔ)言工具包處理和分析文本的實(shí)踐經(jīng)驗(yàn)。它包括三個(gè)小時(shí)的點(diǎn)播視頻,三篇文章和16個(gè)可下載資源。該課程費(fèi)用為19.99美元,并提供結(jié)業(yè)證書(shū)。
?使用Udemy的Python進(jìn)行自然語(yǔ)言處理(NLP)。這個(gè)課程面向具有語(yǔ)言基礎(chǔ)編程經(jīng)驗(yàn),理解面向?qū)ο缶幊痰母拍睿哂谢A(chǔ)到中級(jí)數(shù)學(xué)知識(shí)以及矩陣運(yùn)算知識(shí)的個(gè)人。它完全基于項(xiàng)目,并且涉及構(gòu)建文本分類器以實(shí)時(shí)預(yù)測(cè)推文的情緒,以及構(gòu)建文章摘要器,該文章摘要器可以獲取文章并提取摘要。該課程包括10.5小時(shí)的點(diǎn)播視頻和8篇文章。該課程費(fèi)用為19.99美元,并提供結(jié)業(yè)證書(shū)。
?edX的自然語(yǔ)言處理(NLP)。由微軟公司通過(guò)edX提供的為期六周的課程概述了自然語(yǔ)言處理和經(jīng)典機(jī)器學(xué)習(xí)方法的使用。它涵蓋了統(tǒng)計(jì)機(jī)器翻譯和深度語(yǔ)義相似性模型(DSSM)及其應(yīng)用。它還涵蓋了在自然語(yǔ)言處理和視覺(jué)語(yǔ)言多模式智能中應(yīng)用的深度強(qiáng)化學(xué)習(xí)技術(shù)。這是一門高級(jí)課程,完成該課程學(xué)習(xí)的人員只需支付99美元即可獲得認(rèn)證證書(shū)。
?Coursera公司提供的自然語(yǔ)言處理。本課程是Coursera公司高級(jí)機(jī)器學(xué)習(xí)專業(yè)化的一部分,涵蓋自然語(yǔ)言處理任務(wù),包括情感分析、摘要、對(duì)話狀態(tài)跟蹤等。Coursera公司表示,這是一門高級(jí)課程,需要學(xué)習(xí)五個(gè)星期,每個(gè)星期需要學(xué)習(xí)四到五個(gè)小時(shí)。
自然語(yǔ)言處理為社會(huì)公益提供支持
除了幫助企業(yè)處理數(shù)據(jù)外,情緒分析還可以幫助人們了解社會(huì)動(dòng)態(tài)。例如,Periscopic已將自然語(yǔ)言處理(NLP)與視覺(jué)識(shí)別結(jié)合使用,創(chuàng)建了特朗普表情計(jì)算器(Trump Emoticoaster),這是一種處理語(yǔ)言和面部表情的數(shù)據(jù)引擎,目的是了解美國(guó)特朗普總統(tǒng)的情緒狀態(tài)。
類似的技術(shù)也可以防止校園槍擊事件:在哥倫比亞大學(xué),研究人員已經(jīng)處理了9000名暴力傾向的年輕人發(fā)布的200萬(wàn)條推文,并在尋找問(wèn)題的答案:隨著青少年越來(lái)越傾向采用暴力,那么其語(yǔ)言是如何改變的?
Coursera公司項(xiàng)目總監(jiān)Desmond Patton博士說(shuō),“有問(wèn)題的內(nèi)容會(huì)隨著時(shí)間的推移而發(fā)展。”隨著一些年輕人越來(lái)越接近危險(xiǎn)的邊緣,他們會(huì)通過(guò)語(yǔ)言表達(dá)。然后,自然語(yǔ)言處理會(huì)標(biāo)記出有問(wèn)題的情緒,以便社會(huì)工作者可以進(jìn)行干預(yù)。
與Periscopic一樣,Columbia公司將情感分析與圖像識(shí)別結(jié)合使用,以提高準(zhǔn)確性。Patton說(shuō),計(jì)算機(jī)視覺(jué)將推文上的圖片進(jìn)行分解,然后機(jī)器學(xué)習(xí)將它們與語(yǔ)言一起處理,以告訴“圖片的真實(shí)情感”。這個(gè)圖像是關(guān)于悲傷的嗎?這是有關(guān)威脅的圖片嗎?這些圖像中還發(fā)生了什么,可以幫助人們更好地理解?”除校園槍擊事件之外,哥倫比亞計(jì)劃還希望采用這種技術(shù)防止團(tuán)伙暴力。
自然語(yǔ)言處理(NLP)以提高個(gè)人水平
自然語(yǔ)言處理(NLP)還可以幫助人們監(jiān)控自己的情緒狀態(tài)。Woebot是一種電子治療師,可通過(guò)Facebook Messenger聊天機(jī)器人或獨(dú)立應(yīng)用程序與用戶聯(lián)系。不過(guò),目前還沒(méi)有高級(jí)的情感分析技術(shù),Woebot實(shí)際上只能跟蹤那些抑郁和焦慮,可能表明用戶面臨緊急情況的詞匯。
責(zé)任編輯自然語(yǔ)言處理(NLP)的定義
自然語(yǔ)言處理(NLP)是人工智能技術(shù)的一個(gè)分支,它使計(jì)算機(jī)能夠像人們一樣理解、處理和生成語(yǔ)言,并且在商業(yè)中的應(yīng)用正在迅速增長(zhǎng)。
雖然自然語(yǔ)言處理(NLP)這一術(shù)語(yǔ)最初指的是人工智能系統(tǒng)的閱讀能力,但它后來(lái)成為所有計(jì)算語(yǔ)言學(xué)的一種通俗說(shuō)法。其子類別包括自然語(yǔ)言生成(NLG)(計(jì)算機(jī)自行創(chuàng)建通信的能力)和自然語(yǔ)言理解(NLU)(理解俚語(yǔ)、錯(cuò)誤發(fā)音、拼寫(xiě)錯(cuò)誤以及其他語(yǔ)言變體的能力)。
自然語(yǔ)言處理(NLP)的工作原理
自然語(yǔ)言處理通過(guò)機(jī)器學(xué)習(xí)(ML)進(jìn)行。機(jī)器學(xué)習(xí)系統(tǒng)像其他任何形式的數(shù)據(jù)一樣存儲(chǔ)單詞及其組合方式。將短語(yǔ)、句子,有時(shí)甚至整本書(shū)的內(nèi)容都輸入機(jī)器學(xué)習(xí)引擎,并根據(jù)語(yǔ)法規(guī)則和人們的現(xiàn)實(shí)語(yǔ)言習(xí)慣(或兩者兼而有之)進(jìn)行處理。然后,計(jì)算機(jī)使用這些數(shù)據(jù)來(lái)查找模式并推斷出下一步的工作。以翻譯軟件為例:在法語(yǔ)中,“我要去公園”是“Je vais au parc”,因此機(jī)器學(xué)習(xí)預(yù)測(cè)“我要去商店”也將以“Je vais au”開(kāi)頭。
自然語(yǔ)言處理應(yīng)用
機(jī)器翻譯是更好的自然語(yǔ)言處理(NLP)應(yīng)用程序之一,但它并不是最常用的一種。人們每次在Google或Bing搜索引擎中查找內(nèi)容時(shí),都將數(shù)據(jù)輸入到系統(tǒng)中。當(dāng)單擊搜索結(jié)果時(shí),搜索引索會(huì)將其視為對(duì)找到的結(jié)果正確的確認(rèn),并在以后使用這個(gè)信息更好地進(jìn)行搜索。
聊天機(jī)器人的工作方式與其相同:它們與Slack、Microsoft Messenger和其他聊天程序集成在一起,可以在其中讀取人們所說(shuō)的語(yǔ)言,然后在說(shuō)出觸發(fā)詞語(yǔ)時(shí)將其打開(kāi)。當(dāng)Siri和Alexa等語(yǔ)音助手聽(tīng)到“Hey,Alexa”之類的短語(yǔ)時(shí),它們就會(huì)進(jìn)行響應(yīng)。這就是批評(píng)者指責(zé)這些程序一直在監(jiān)聽(tīng)的原因:如果不是,它們永遠(yuǎn)不會(huì)知道人們何時(shí)需要它們。除非人們自己打開(kāi)應(yīng)用程序,否則自然語(yǔ)言處理程序?qū)⒃诤笈_(tái)運(yùn)行,等待短語(yǔ)的出現(xiàn)。
自然語(yǔ)言處理(NLP)對(duì)人們的利大于弊。人們可以想象一下沒(méi)有谷歌搜索或者拼寫(xiě)檢查程序的生活。它使用自然語(yǔ)言處理(NLP)將輸入的單詞與字典中的單詞進(jìn)行比較。通過(guò)比較這兩個(gè)數(shù)據(jù)集,拼寫(xiě)檢查程序可以找出問(wèn)題并提供建議。
自然語(yǔ)言處理(NLP)示例
搜索引擎和拼寫(xiě)檢查的應(yīng)用如今非常普遍,人們經(jīng)常將它們視為一種理所當(dāng)然的技術(shù),尤其是在自然語(yǔ)言處理(NLP)可以顯著提高生產(chǎn)力的工作中。例如如果想知道還剩下多少假期?不必詢問(wèn)人力資源部門。可以采用聊天機(jī)器人Talla節(jié)省時(shí)間,它會(huì)搜索企業(yè)政策以尋找答案。打電話聯(lián)系客戶需要翻看手機(jī)所存的電話號(hào)碼?可以采用語(yǔ)音提示,通過(guò)聲音搜索啟動(dòng)SecondMind,將會(huì)給出所需的號(hào)碼。這種集成的搜索工具可以加快員工與客戶的溝通。
自然語(yǔ)言處理還可以幫助招聘者對(duì)簡(jiǎn)歷進(jìn)行分類,吸引各種應(yīng)聘者并雇用更多合格的員工。對(duì)垃圾郵件進(jìn)行檢測(cè)可以使用自然語(yǔ)言處理(NLP),以阻止垃圾電子郵件進(jìn)入人們的收件箱;此外,可以采用Outlook和Gmail等程序?qū)⒛承┤说泥]件分類到創(chuàng)建的文件夾中。
諸如情緒分析之類的工具可幫助企業(yè)快速識(shí)別推文內(nèi)容的好壞,從而可以了解客戶的顧慮。情感分析不僅可以處理社交媒體上的文字,還可以分解詞語(yǔ)出現(xiàn)的語(yǔ)境。對(duì)于分析機(jī)構(gòu)Periscopic公司的數(shù)據(jù)可視化工具SkyeMorét來(lái)說(shuō),只有30%的英語(yǔ)單詞是正面的,其余的是中性或負(fù)面的。因此,自然語(yǔ)言處理(NLP)可以幫助企業(yè)更全面地理解一個(gè)帖子:在這些中性詞匯背后,消費(fèi)者表達(dá)的情感是什么?
傳統(tǒng)上,企業(yè)使用自然語(yǔ)言處理將反饋分為積極和消極兩類。但是Fleishman Hillard公司社會(huì)和創(chuàng)新業(yè)務(wù)的高級(jí)副總裁Ryan Smith表示,當(dāng)今的自然語(yǔ)言處理工具可以識(shí)別更精確的情緒,例如悲傷、憤怒和恐懼。
自然語(yǔ)言處理(NLP)軟件
無(wú)論人們是要構(gòu)建聊天機(jī)器人、語(yǔ)音助手、預(yù)測(cè)文本應(yīng)用程序,還是以自然語(yǔ)言處理為核心的其他應(yīng)用程序,企業(yè)都將需要采用工具。根據(jù)調(diào)查,最受歡迎的自然語(yǔ)言處理軟件包括:
?自然語(yǔ)言工具包(NLTK)。自然語(yǔ)言工具包(NLTK)是一個(gè)開(kāi)放源代碼框架,用于構(gòu)建Python程序以使用人類語(yǔ)言數(shù)據(jù)。它是在賓夕法尼亞大學(xué)計(jì)算機(jī)和信息科學(xué)系開(kāi)發(fā)的,為50多個(gè)語(yǔ)料庫(kù)和詞匯資源庫(kù)、一個(gè)文本處理庫(kù)、自然語(yǔ)言處理庫(kù)和論壇提供接口。自然語(yǔ)言工具包(NLTK)是在Apache2.0許可下提供的。
?SpaCy。SpaCy是一個(gè)開(kāi)放源代碼庫(kù),用于高級(jí)自然語(yǔ)言處理,專門為生產(chǎn)目的而非研究目的而設(shè)計(jì)。SpaCy的設(shè)計(jì)充分考慮了高級(jí)數(shù)據(jù)科學(xué),并允許深度數(shù)據(jù)挖掘。它是由麻省理工學(xué)院授權(quán)的。
?Gensim。Gensim是一個(gè)用于自然語(yǔ)言處理的開(kāi)源Python庫(kù)。獨(dú)立于平臺(tái)的庫(kù)支持可擴(kuò)展的統(tǒng)計(jì)語(yǔ)義、針對(duì)語(yǔ)義結(jié)構(gòu)的純文本文檔分析以及檢索語(yǔ)義相似文檔的能力。可以在無(wú)需人工監(jiān)督的情況下處理大量文本。
?Amazon Comprehend。這項(xiàng)Amazon服務(wù)不需要機(jī)器學(xué)習(xí)的經(jīng)驗(yàn)。它旨在幫助組織從電子郵件、客戶評(píng)論、社交媒體、支持通知單和其他文本中獲得見(jiàn)解。它使用情感分析、詞性提取和標(biāo)記化來(lái)分析單詞背后的意圖。
?IBM Watson音頻分析器。這個(gè)基于云計(jì)算的解決方案旨在用于社交監(jiān)聽(tīng)、聊天機(jī)器人集成和客戶服務(wù)監(jiān)控。它可以分析客戶帖子中的情緒和語(yǔ)氣,并監(jiān)視客戶服務(wù)電話和聊天對(duì)話。
?谷歌云翻譯。這個(gè)API使用自然語(yǔ)言處理來(lái)檢查源文本以確定語(yǔ)言,然后使用神經(jīng)機(jī)器翻譯將文本動(dòng)態(tài)翻譯為另一種語(yǔ)言。這個(gè)API允許用戶將功能集成到他們自己的程序中。
自然語(yǔ)言處理(NLP)課程
有很多資源可用于學(xué)習(xí)創(chuàng)建和維護(hù)自然語(yǔ)言處理應(yīng)用程序,其中許多是免費(fèi)的資源。其中包括:
?DataCamp中的Python自然語(yǔ)言處理。這門免費(fèi)課程提供15個(gè)視頻和51個(gè)練習(xí)文件,涵蓋了使用Python處理自然語(yǔ)言的基礎(chǔ)知識(shí)。它涵蓋了如何識(shí)別和分隔單詞,如何在文本中提取主題,以及如何構(gòu)建自己的虛假新聞分類器。
?Udemy的自然語(yǔ)言處理(NLP)。這個(gè)入門課程提供使用Python和自然語(yǔ)言工具包處理和分析文本的實(shí)踐經(jīng)驗(yàn)。它包括三個(gè)小時(shí)的點(diǎn)播視頻,三篇文章和16個(gè)可下載資源。該課程費(fèi)用為19.99美元,并提供結(jié)業(yè)證書(shū)。
?使用Udemy的Python進(jìn)行自然語(yǔ)言處理(NLP)。這個(gè)課程面向具有語(yǔ)言基礎(chǔ)編程經(jīng)驗(yàn),理解面向?qū)ο缶幊痰母拍睿哂谢A(chǔ)到中級(jí)數(shù)學(xué)知識(shí)以及矩陣運(yùn)算知識(shí)的個(gè)人。它完全基于項(xiàng)目,并且涉及構(gòu)建文本分類器以實(shí)時(shí)預(yù)測(cè)推文的情緒,以及構(gòu)建文章摘要器,該文章摘要器可以獲取文章并提取摘要。該課程包括10.5小時(shí)的點(diǎn)播視頻和8篇文章。該課程費(fèi)用為19.99美元,并提供結(jié)業(yè)證書(shū)。
?edX的自然語(yǔ)言處理(NLP)。由微軟公司通過(guò)edX提供的為期六周的課程概述了自然語(yǔ)言處理和經(jīng)典機(jī)器學(xué)習(xí)方法的使用。它涵蓋了統(tǒng)計(jì)機(jī)器翻譯和深度語(yǔ)義相似性模型(DSSM)及其應(yīng)用。它還涵蓋了在自然語(yǔ)言處理和視覺(jué)語(yǔ)言多模式智能中應(yīng)用的深度強(qiáng)化學(xué)習(xí)技術(shù)。這是一門高級(jí)課程,完成該課程學(xué)習(xí)的人員只需支付99美元即可獲得認(rèn)證證書(shū)。
?Coursera公司提供的自然語(yǔ)言處理。本課程是Coursera公司高級(jí)機(jī)器學(xué)習(xí)專業(yè)化的一部分,涵蓋自然語(yǔ)言處理任務(wù),包括情感分析、摘要、對(duì)話狀態(tài)跟蹤等。Coursera公司表示,這是一門高級(jí)課程,需要學(xué)習(xí)五個(gè)星期,每個(gè)星期需要學(xué)習(xí)四到五個(gè)小時(shí)。
自然語(yǔ)言處理為社會(huì)公益提供支持
除了幫助企業(yè)處理數(shù)據(jù)外,情緒分析還可以幫助人們了解社會(huì)動(dòng)態(tài)。例如,Periscopic已將自然語(yǔ)言處理(NLP)與視覺(jué)識(shí)別結(jié)合使用,創(chuàng)建了特朗普表情計(jì)算器(Trump Emoticoaster),這是一種處理語(yǔ)言和面部表情的數(shù)據(jù)引擎,目的是了解美國(guó)特朗普總統(tǒng)的情緒狀態(tài)。
類似的技術(shù)也可以防止校園槍擊事件:在哥倫比亞大學(xué),研究人員已經(jīng)處理了9000名暴力傾向的年輕人發(fā)布的200萬(wàn)條推文,并在尋找問(wèn)題的答案:隨著青少年越來(lái)越傾向采用暴力,那么其語(yǔ)言是如何改變的?
Coursera公司項(xiàng)目總監(jiān)Desmond Patton博士說(shuō),“有問(wèn)題的內(nèi)容會(huì)隨著時(shí)間的推移而發(fā)展。”隨著一些年輕人越來(lái)越接近危險(xiǎn)的邊緣,他們會(huì)通過(guò)語(yǔ)言表達(dá)。然后,自然語(yǔ)言處理會(huì)標(biāo)記出有問(wèn)題的情緒,以便社會(huì)工作者可以進(jìn)行干預(yù)。
與Periscopic一樣,Columbia公司將情感分析與圖像識(shí)別結(jié)合使用,以提高準(zhǔn)確性。Patton說(shuō),計(jì)算機(jī)視覺(jué)將推文上的圖片進(jìn)行分解,然后機(jī)器學(xué)習(xí)將它們與語(yǔ)言一起處理,以告訴“圖片的真實(shí)情感”。這個(gè)圖像是關(guān)于悲傷的嗎?這是有關(guān)威脅的圖片嗎?這些圖像中還發(fā)生了什么,可以幫助人們更好地理解?”除校園槍擊事件之外,哥倫比亞計(jì)劃還希望采用這種技術(shù)防止團(tuán)伙暴力。
自然語(yǔ)言處理(NLP)以提高個(gè)人水平
自然語(yǔ)言處理(NLP)還可以幫助人們監(jiān)控自己的情緒狀態(tài)。Woebot是一種電子治療師,可通過(guò)Facebook Messenger聊天機(jī)器人或獨(dú)立應(yīng)用程序與用戶聯(lián)系。不過(guò),目前還沒(méi)有高級(jí)的情感分析技術(shù),Woebot實(shí)際上只能跟蹤那些抑郁和焦慮,可能表明用戶面臨緊急情況的詞匯。
責(zé)任編輯:ct
評(píng)論
查看更多