在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

怎樣使用Python創(chuàng)建詞云

ss ? 來源:磐創(chuàng)AI ? 作者:磐創(chuàng)AI ? 2020-11-06 17:26 ? 次閱讀

介紹從開始從事數(shù)據(jù)可視化工作的那一天起,我就愛上它了,我總是喜歡從數(shù)據(jù)中獲得有用的見解。在此之前,我只了解基本圖表,例如條形圖,散點(diǎn)圖,直方圖等,這些基本圖表內(nèi)置在tableau中,而Power BI則用于數(shù)據(jù)可視化。通過每天完成此任務(wù),我遇到了許多新圖表,例如徑向儀表盤,華夫圖等。

因此,出于好奇,最近我正在搜索數(shù)據(jù)可視化中使用的所有圖表類型,這些詞云引起了我的注意,我發(fā)現(xiàn)它非常有趣。之后,我嘗試使用Tableau和Power BI中的少量數(shù)據(jù)來制作詞云,在成功嘗試之后,我想通過使用條形圖,餅圖和其他圖表的代碼來嘗試使用它。詞云是什么?定義:詞云是一個(gè)簡單但功能強(qiáng)大的可視化表示對象,用于文本處理,它以更大,更粗的字母和不同的顏色顯示最常用的詞,單詞的大小越小,重要性就越小。

詞云的用途

1.社交媒體上的熱門標(biāo)簽(Instagram,Twitter):全世界的社交媒體都在尋找最新的趨勢,因此,我們可以獲取人們在其帖子中使用最多的標(biāo)簽來探索最新的趨勢。

2.媒體中的熱門話題:分析新聞報(bào)道,我們可以在頭條新聞中找到關(guān)鍵字,并提取出前n個(gè)需求較高的主題,來獲得所需的結(jié)果,即前n個(gè)熱門媒體主題。

3.電子商務(wù)中的搜索詞:在電子商務(wù)購物網(wǎng)站中,網(wǎng)站所有者可以制作被搜索次數(shù)最多的購物商品的詞云,這樣,他就可以了解在特定時(shí)期內(nèi)哪些商品需求量最大。讓我們開始使用Python來實(shí)現(xiàn)詞云首先,我們需要在jupyter notebook中安裝所有庫。在python中,我們將安裝一個(gè)內(nèi)置庫wordcloud。在Anaconda命令提示符下,輸入以下代碼:pip install wordcloud

如果你的anaconda環(huán)境支持conda,請輸入:conda install wordcloud

這可以直接在notebook中實(shí)現(xiàn),只需在代碼的開頭添加“!”即可。像這樣:!pip install wordcloud

但現(xiàn)在我想生成擁有任何主題的維基百科文本的詞云,因此,我將需要一個(gè)Wikipedia庫來訪問Wikipedia API,可以通過在anaconda命令提示符下安裝Wikipedia來完成,如下所示:pip install wikipedia

現(xiàn)在我們還需要其他一些庫,它們是numpy,matplotlib和pandas。截至目前,我們需要的庫就安裝好了import wikipedia

result= wikipedia.page("MachineLearning")

final_result = result.content

print(final_result)

機(jī)器學(xué)習(xí)維基百科頁面的輸出:

上圖是我們通過檢索Wikipedia的機(jī)器學(xué)習(xí)頁面獲得的輸出圖像,我們還可以看到它可以向下滾動(dòng),這表示將檢索整個(gè)頁面。在這里,我們還可以通過摘要方法得到頁面的摘要,如:result= wikipedia.summary("MachineLearning", sentences=5)

print(result)

這里我們有句子的參數(shù),因此我們可以用它來檢索特定的行數(shù)。

輸出5個(gè)句子讓我們一起創(chuàng)建wordcloudfrom wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.a(chǎn)xis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='pink', random_state=10).generate(final_result)

plot_cloud(wordcloud)

停用詞是沒有任何含義的單詞,例如‘is’, ‘a(chǎn)re’, ‘a(chǎn)n’, ‘I’ 等。Wordcloud帶有內(nèi)置停用詞庫,該庫將自動(dòng)從文本中刪除停用詞。同時(shí)我們也可以通過stopwords.add()函數(shù)在python中添加停用詞的選擇。Wordcloud方法可以設(shè)置詞云的寬度和高度,我將它們都設(shè)置為500,背景色設(shè)置為粉紅色。如果不添加隨機(jī)狀態(tài),則每次運(yùn)行代碼時(shí),詞云都會(huì)看起來不同,我們可以將其設(shè)置為任何int值。從上面的代碼中,我們將獲得這樣的詞云:

通過查看上圖,我們可以看到機(jī)器學(xué)習(xí)是最常用的詞,還有一些其他經(jīng)常使用的詞是模型,任務(wù),訓(xùn)練和數(shù)據(jù),因此,我們可以得出結(jié)論,機(jī)器學(xué)習(xí)是訓(xùn)練數(shù)據(jù)模型的任務(wù)。我們還可以在這里通過背景顏色方法更改背景顏色,并通過colormap方法更改字體顏色,還可以在背景顏色中添加顏色的哈希碼,但是mapcolor帶有內(nèi)置的特定顏色。讓我們通過使用哈希碼將背景色更改為藍(lán)綠色,將字體顏色更改為藍(lán)色:from wordcloud import WordCloud, StopWords

import matplotlib.pyplot as plt

def plot_cloud(wordcloud):

plt.figure(figsize=(10, 10))

plt.imshow(wordcloud)

plt.a(chǎn)xis("off");

wordcloud = WordCloud(width = 500, height = 500, background_color='#40E0D0', colormap="ocean", random_state=10).generate(final_result)

plot_cloud(wordcloud)

在這里,我指定了ocean,如果我添加了一些錯(cuò)誤的顏色圖,jupyter將拋出一個(gè)值錯(cuò)誤,并向我顯示顏色圖的可用選項(xiàng),如下所示:

我們還可以使用PIL庫在任何圖像中實(shí)現(xiàn)詞云。尾注在本文中,我們討論了詞云,詞云的定義,應(yīng)用領(lǐng)域以及使用python實(shí)現(xiàn)詞云。參考鏈接:https://www.a(chǎn)nalyticsvidhya.com/blog/2020/10/word-cloud-or-tag-cloud-in-python/

責(zé)任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7104

    瀏覽量

    89294
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4801

    瀏覽量

    84867
  • 數(shù)據(jù)可視化

    關(guān)注

    0

    文章

    468

    瀏覽量

    10332
收藏 人收藏

    評論

    相關(guān)推薦

    Flexus 服務(wù)器 X:Python 安裝的極致便捷之旅

    配置和環(huán)境設(shè)置方面,可能會(huì)遇到各種挑戰(zhàn)。為了幫助開發(fā)者更高效地使用 Flexus 服務(wù)器 X,本文將詳細(xì)介紹如何在 Flexus 服務(wù)器 X 上安裝 Python,并突出其便捷性。 一
    的頭像 發(fā)表于 01-07 17:00 ?90次閱讀
    Flexus <b class='flag-5'>云</b>服務(wù)器 X:<b class='flag-5'>Python</b> 安裝的極致便捷之旅

    華為 Flexus X 實(shí)例下的場景體驗(yàn)——小企業(yè)使用 Python 語言——超迅速搭建簡單公網(wǎng) API 接口服務(wù)

    ? 前言 小企業(yè)為了快速搞定一些接口功能如果不使用 Python 的話相對來說復(fù)雜度還是很高的,這里我來通過【華為 Flexus X 實(shí)例】來迅速的搭建一個(gè) Python 的 WebApi 示例
    的頭像 發(fā)表于 12-27 13:46 ?133次閱讀
    華為<b class='flag-5'>云</b> Flexus X 實(shí)例下的場景體驗(yàn)——小企業(yè)使用 <b class='flag-5'>Python</b> 語言——超迅速搭建簡單公網(wǎng) API 接口服務(wù)

    如何在Python中使用socket

    和UDP。 2. 創(chuàng)建Socket 在Python中,我們使用 socket 模塊來創(chuàng)建socket。以下是創(chuàng)建一個(gè)TCP socket的示例代碼: import socket #
    的頭像 發(fā)表于 11-01 16:10 ?259次閱讀

    利用Python腳本登錄到交換機(jī)并創(chuàng)建VLAN

    本文將詳細(xì)介紹如何利用Python腳本登錄到交換機(jī)并創(chuàng)建VLAN。
    的頭像 發(fā)表于 08-12 17:59 ?603次閱讀

    中國信通院發(fā)布“2024計(jì)算十大關(guān)鍵

    7月23日,由中國通信標(biāo)準(zhǔn)化協(xié)會(huì)主辦,中國信息通信研究院(簡稱“中國信通院”)承辦的“2024可信大會(huì)”在京召開。大會(huì)上,中國信通院正式發(fā)布“2024計(jì)算十大關(guān)鍵”,中國信通院
    的頭像 發(fā)表于 08-02 08:28 ?666次閱讀
    中國信通院發(fā)布“2024<b class='flag-5'>云</b>計(jì)算十大關(guān)鍵<b class='flag-5'>詞</b>”

    pytorch和python的關(guān)系是什么

    在當(dāng)今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語言之一。Python的易學(xué)易用、豐富的庫和框架以及強(qiáng)大的社區(qū)支持,使其成為了數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域的首選語言。而在深度學(xué)習(xí)領(lǐng)域
    的頭像 發(fā)表于 08-01 15:27 ?2134次閱讀

    opencv-python和opencv一樣嗎

    不一樣。OpenCV(Open Source Computer Vision Library)是一個(gè)開源的計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)軟件庫,它提供了大量的圖像和視頻處理功能。OpenCV-Python
    的頭像 發(fā)表于 07-16 10:38 ?1308次閱讀

    用pycharm進(jìn)行python爬蟲的步驟

    提供了許多有用的功能,如代碼自動(dòng)完成、調(diào)試和版本控制等。您可以從JetBrains的官方網(wǎng)站下載PyCharm,并根據(jù)您的需求選擇免費(fèi)社區(qū)版或付費(fèi)專業(yè)版。 創(chuàng)建一個(gè)新的Python項(xiàng)目 打開
    的頭像 發(fā)表于 07-11 10:11 ?907次閱讀

    用離線安裝器安裝的idf,其創(chuàng)建Python虛擬環(huán)境無激活腳本是怎么回事?

    如題,用離線安裝器安裝的idf,其創(chuàng)建Python虛擬環(huán)境無激活腳本,具體如下圖所示: 反而用vscode插件安裝的idf有,如下圖:vscode插件安裝的idf的Python虛擬環(huán)境 提問:沒有
    發(fā)表于 06-11 06:49

    華為開發(fā)者桌面全新發(fā)布 CodeArts IDE for Python,極致優(yōu)雅云原生開發(fā)體驗(yàn)

    近日,華為正式發(fā)布 CodeArts IDE for Python,這是一款內(nèi)置華為自研 Python 語言服務(wù),提供智能編程、靈活調(diào)試能力的可擴(kuò)展桌面開發(fā)工具,為華為開發(fā)者提供卓
    的頭像 發(fā)表于 05-10 00:27 ?1263次閱讀
    華為<b class='flag-5'>云</b>開發(fā)者桌面全新發(fā)布 CodeArts IDE for <b class='flag-5'>Python</b>,極致優(yōu)雅云原生開發(fā)體驗(yàn)

    華為正式發(fā)布CodeArts IDE for Python

    近日,華為正式發(fā)布CodeArts IDE for Python,這是一款內(nèi)置華為自主創(chuàng)新的Python語言服務(wù),提供智能編程、靈活調(diào)試能力的可擴(kuò)展桌面開發(fā)工具,為華為開發(fā)者提供卓
    的頭像 發(fā)表于 05-08 14:58 ?525次閱讀

    基于Python的地圖繪制教程

    本文將介紹通過Python繪制地形圖的方法,所需第三方Python相關(guān)模塊包括 rasterio、geopandas、cartopy 等,可通過 pip 等方式安裝。
    的頭像 發(fā)表于 02-26 09:53 ?1272次閱讀
    基于<b class='flag-5'>Python</b>的地圖繪制教程

    鴻蒙應(yīng)用/元服務(wù)開發(fā)實(shí)戰(zhàn)-Serverless存儲沒法創(chuàng)建處理方式

    新賬戶,Serverless存儲沒法創(chuàng)建 ,沒法進(jìn)行下一步。 解決方式 請按照這個(gè)方式修改一下就能正常創(chuàng)建了,瀏覽器中打開控制臺輸入 window.top.cfpConfig.cloudStorageSwitch=‘off’
    發(fā)表于 02-19 11:21

    如何使用linux下gdb來調(diào)試python程序

    如何使用linux下gdb來調(diào)試python程序? 在Linux下,可以使用GDB(GNU調(diào)試器)來調(diào)試Python程序。GDB是一個(gè)強(qiáng)大的調(diào)試工具,可以幫助開發(fā)者診斷和修復(fù)程序中的錯(cuò)誤。在本文
    的頭像 發(fā)表于 01-31 10:41 ?2687次閱讀

    python中open函數(shù)的用法詳解

    python中open函數(shù)的用法詳解 Python中的open()函數(shù)用于打開文件。它接受文件名和模式作為參數(shù),并返回一個(gè)文件對象。文件對象可用于讀取、寫入和管理文件。 open()函數(shù)的基本語法
    的頭像 發(fā)表于 01-30 15:31 ?2194次閱讀
    主站蜘蛛池模板: 中国胖女人一级毛片aaaaa| 毛片免费观看| 久久 在线播放| 国产香蕉久久精品综合网| 欧美黑人性色黄在线视频| 国产午夜视频在线观看第四页| 国产一级αv片免费观看| 在线看黄网| 69xxxⅹxxxxxx日本| 国产一级簧片| 性欧美大战久久久久久久野外| h黄视频| 欧美 亚洲 国产 丝袜 在线| 在线亚洲日产一区二区| 在线观看中文字幕一区| 欧美日本视频一区| 亚洲第一色视频| 日本三级视频在线观看| 久久亚洲视频| a毛片免费观看完整| 午夜精品久久久久久99热| 国产综合成色在线视频| 67xxxxxx日本| 亚洲精品美女在线观看| 日本www色| 成人涩涩网站| 米奇777四色精品人人爽| 高清精品女厕在线观看| 一色屋免费视频| 欧美日韩亚洲国内综合网俺| 国产产一区二区三区久久毛片国语| 天天操精品视频| yiren22亚洲综合高清一区| 制服丝袜中文字幕第一页| 日韩毛片网| 国产高清在线视频| 不卡无毒免费毛片视频观看| 天堂成人在线| 91大神成人偷拍在线观看| 亚洲精品国产成人| 久青草免费在线视频|