在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

相比Matplotlib 可視化神器Altair登場

電子工程師 ? 來源:fqj ? 2019-05-23 14:49 ? 次閱讀

如何將我們的數據以更好的形勢呈現出來?擅長不同編程語言的程序員會選擇各自技術范疇內成熟、好用的工具包,比如 R 語言的開發者最常使用的是 ggplot2,但它不支持 Python;以前 Python 語言的開發者使用最多的是 matplotlib,一個很強大的可視化庫,不過它的局限也非常嚴重,制作交互式圖表也是一件難事。今天要給大家推薦一個新的工具——Altair,一個 Vega-Lite 的包裝器,也許這些概念你都還不沒了解過,接下來我們就在下面的文章為大家作介紹。

ggplot2 是 R 的作圖工具包,可以使用非常簡單的語句實現非常復雜漂亮的效果。然而不幸的是,ggplot2 并不支持 Python。

在 Python 中,我們常使用 matplotlib 用于可視化圖形,matplotlib是一個很強大的可視化庫,但是它有著很嚴重的局限性。matplotlib 的使用非常靈活,這可以說的上是它的一個優點,但是當我們想為圖形加一個小小的功能的時候,它的繁瑣操作會讓我們舉步維艱。除此之外,matplotlib 的兩種界面(面向對象界面、基于狀態的界面)令人相當困惑,對于新手很不友好。即使對于多年使用 matplotlib 的人而言,他們也無法完全掌握這些操作。最后不得不說的是,用 matplotlib 制作交互式圖表是一件相當困難的事情。

Altair 和圖形語法

Altair 是 Vega-Lite 的包裝器。Vega-Lite 是 JavaScript 的高級可視化庫,它最最重要的特點是,它的API是基于圖形語法的。

什么是圖形語法呢?圖形語法聽起來有點像一個抽象的功能,值得注意的是,它是 Altair 和其他 Python 可視化庫之間最主要的區別。Altair 符合我們人類可視化數據的方式和習慣,Altair 只需要三個主要的參數

Mark.數據在圖形中的表達形式。點、線、柱狀還是圓圈?

Channels.決定什么數據應該作為x軸,什么作為y軸;圖形中數據標記的大小和顏色。

Encoding.指定數據變量類型。日期變量、量化變量還是類別變量?

基于以上三個參數,Altair 將會選擇合理的默認值來顯示我們的數據。

Altair 最讓人著迷的地方是,它能夠合理的選擇顏色。如果我們在 Encoding 中指定變量類型為量化變量,那么 Altair 將會使用連續的色標來著色(默認為 淺藍色-藍色-深藍色)。如果變量類型指定為類別變量,那么 Altair 會為每個類別賦予不同的顏色。(例如 紅色,黃色,藍色)

補充:Vega-Lite 有兩種類型的類別變量:名義變量和序數變量。名義變量的集合中,各元素的排序階數沒有任何實際意義,例如大陸集合是歐洲,亞洲,非洲,美洲,大洋洲,他們的次序沒有任何數值上的意義;序數變量的集合中,各元素的排序階數是有實際意義的,例如亞馬遜的評論可以是一星,二星,三星,四星或五星,星級的高低次序是由意義的。

讓我們來看一個具體的例子,如下所示,我們組織了6個國家和它們所對應的人口數據,除此之外,還有相應的收入數據:

import pandas as pdimport altair as altdata = pd.DataFrame({'country_id': [1, 2, 3, 4, 5, 6], 'population': [1, 100, 200, 300, 400, 500],
'income':
[1000,50,200,300,200,150]})

相比Matplotlib 可視化神器Altair登場

首先我們繪制每個國家的人口數據:

首先我們繪制每個國家的人口數據:"""As we mentioned before, we need to define 3 parameters:
1. Mark: We do this by using "mark_circle".
2. Channel: We only define an x-axis and we map it to the population.
3. Encodings: We define both variables as quantitative by using :Q after the column name"""categorical_chart = alt.Chart(data).mark_circle(size=200).encode( x='population:Q', color='country_id:Q')

相比Matplotlib 可視化神器Altair登場

從上圖可以看出,Altair 選擇了連續色標,在本例中這是沒有意義的。問題的根源在于,我們將 country_id 定義為量化變量,而實際上,它應該是一個類別變量,修改代碼如下:

# We changed color='country_id:Q' to color='country_id:N' to indicate it is a nominal variablecategorical_chart = alt.Chart(data).mark_circle(size=200).encode( x='population:Q', color='country_id:N')

相比Matplotlib 可視化神器Altair登場

從圖中可以看到,每個國家都用了不同的顏色表示。我們僅僅改變了變量 country_id 的編碼,即用 N (Nominal 名義變量)替換了 Q (Quantitative 量化變量)。這點小小的改變就足以使得 Altair 明白,它不該使用連續色標,而是使用獨立色標。

圖表的擴展

Altair 的另一個美妙之處就是,我們可以從現有的圖表中創建新的圖表。例如,我們現在要加入新的數據 income,我們唯一需要做的就是告訴 Altair:用 income 作為y軸,代碼如下所示:

categorical_chart = alt.Chart(data).mark_circle(size=200).encode( x='population:Q', y='income:Q', color='country_id:N')

相比Matplotlib 可視化神器Altair登場

如果想添加數據提示的功能(tooltip,鼠標懸停在數據上時,會顯示該數據的詳細信息),只需要增加一行代碼:

categorical_chart = alt.Chart(data).mark_circle(size=200).encode( x='population:Q', y='income:Q', color='country_id:N', tooltip=['country_id', 'population', 'income']))

Altair 的迷人之處

在接觸 Altair 之前,我們常常持有一種的懷疑態度:這些可視化工具的包裝器真的好用嗎?通常來講,包裝是一個壞主意,就拿 ggplot2 來說,它的很多包裝器都沒有被 Python 社區廣泛采用。這些包裝器很難創建功能完整的版本,而且它們的更新也常常不及時。然而 Altair 卻不一樣:

Altair 的 API 非常全面。這就要感謝 Jake Vanderplas(JVP)偉大的設計,凡是 Vega-Lite 能夠做的,Python 就可以做。這是因為 Altair 只是一個 Python API,它能夠生成有效的 Vega-Lite jsons,而 API 是以編程的方式生成的,因此在 Vega-Lite 的新版本發布后,Altair 能夠全面而且快速的更新,這一切都顯得如此美妙。

直觀且具有符合 Python 習慣的接口。就像使用其他的 Python 庫一樣,我們需要一些時間來習慣。但 Altair 的精彩之處在于,它所有的設置都符合人類的推理方式,這樣我們就能很快的了解它內部的運作原理,并且因此而變得高效。

互動性強。Vega-Lite 交互性非常強大,我們不僅能夠使用一行代碼來添加 tooltips,還能將圖的選擇區與另一個可視化圖關聯。

高度靈活性。Altair的marks可以理解為圖表構建中的模塊。如下圖所示,我們用圓圈標記、線標記和文本標記的組合來構建一個圖。最終的代碼可讀性強,而且易于修改,這對于 matplotlib 來說是很難的。

相比Matplotlib 可視化神器Altair登場

相比Matplotlib 可視化神器Altair登場

有點很多,同時也存在一些不足

Altair 的主要缺點

沒有 3d 繪圖。如果3d可視化對您的工作很重要,那么 Altair 不太適合您。

Altair 不是 D3.js。就像許多的高級可視化框架一樣,Altair 也不是 100% 可定制的,在某些時候,我們會遇到一些無法用Altair制作的圖表。(注:D3.js 是一個 JavaScript 庫,用于在 Web 瀏覽器中生成動態的交互式數據可視化。 它利用了廣泛實施的 SVG,HTML5 和 CSS 標準,具有高度的可定制性)

統計支持較差。如果需要對數據進行線性回歸的話,還是推薦用 Seaborn 來進行快速可視化。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編程語言
    +關注

    關注

    10

    文章

    1945

    瀏覽量

    34740
  • Altair
    +關注

    關注

    0

    文章

    18

    瀏覽量

    10007

原文標題:還在用Matplotlib? 又一可視化神器Altair登場

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    可視化MES系統軟件

    是關鍵部分,可視化管理可幫助企業更直觀的挖掘隱藏的數據并有效管理企業。“制造物聯”是MES系統軟件更高階段的必然表現形式。“制造物聯”與MES系統軟件的側重:(1)MES側重生產業務管理,制造物聯更關注
    發表于 11-30 19:55

    matplotlib動態演示深度學習之tensorflow將神經網絡系統自動學習散點(二次函數+noise)并優化修正并且將輸出結果可視化

    TF之NN:matplotlib動態演示深度學習之tensorflow將神經網絡系統自動學習散點(二次函數+noise)并優化修正并且將輸出結果可視化
    發表于 12-21 10:48

    數據可視化之Python-matplotlib概述

    數據可視化(二):Python-matplotlib
    發表于 07-22 14:58

    如何把AD中非可視化區域物件移到可視化區域?

    AD中非可視化區域物件怎么移到可視化區域???
    發表于 09-10 05:36

    基于STM的可視化門禁系統

    基于STM的可視化門禁系統
    發表于 03-07 09:49

    基于stm的可視化門禁系統

    基于stm的可視化門禁系統
    發表于 03-11 09:23

    Python數據可視化

    Python數據可視化:網易云音樂歌單
    發表于 07-19 08:30

    三維可視化的應用和優勢

    ,為此三維可視化運維系統登場了。  三維可視化的應用  宏觀場景可視化:在特定的環境中對隨著時間推移而不斷變化的目標實體進行檢測,可以直觀、靈活、逼真的展示所處區域的情景和環境,可以快
    發表于 12-02 11:52

    常見的幾種可視化介紹

    與方法,幫助人們理解和分析數據。與科學可視化相比,信息可視化則側重于抽象數據集,幫助用戶理解、分析繁雜的數據信息
    發表于 07-12 07:49

    經驗分享|BI數據可視化報表布局——容器

    容器功能是一種用于數據可視化圖表排版的功能,主要作用對圖表進行有效的布局調整,或者用于巧妙在同一地方安排多個不同類型的數據可視化圖表,供使用者點擊切換瀏覽。目前,在奧威BI軟件上一同有兩類容器功能
    發表于 03-15 17:10

    keras可視化介紹

    keras可視化可以幫助我們直觀的查看所搭建的模型拓撲結構,以及模型的訓練的過程,方便我們優化模型。 模型可視化又分為模型拓撲結構可視化以及訓練過程可視化。 以上一講的mnist為例,
    發表于 08-18 07:53

    可視化技術有哪些

    完整的地理空間信息可視化概念主要包括科學計算可視化、數據可視化和信息可視化可視化技術作為解釋大量數據最有效的手段而率先被科學與工程計算領域
    發表于 02-05 09:09 ?3760次閱讀

    還在用Matplotlib? 又一可視化神器Altair登場

    在接觸 Altair 之前,我們常常持有一種的懷疑態度:這些可視化工具的包裝器真的好用嗎?通常來講,包裝是一個壞主意,就拿 ggplot2 來說,它的很多包裝器都沒有被 Python 社區廣泛采用。這些包裝器很難創建功能完整的版本,而且它們的更新也常常不及時。
    的頭像 發表于 05-11 09:43 ?2788次閱讀
    還在用<b class='flag-5'>Matplotlib</b>? 又一<b class='flag-5'>可視化</b><b class='flag-5'>神器</b><b class='flag-5'>Altair</b><b class='flag-5'>登場</b>

    使用Python來收集、處理和可視化人口數據

    數據分析和可視化: pandas:一個提供高性能、易用的數據結構和數據分析工具的庫。 requests:一個簡潔、優雅的HTTP庫,用于發送網絡請求和獲取數據。 matplotlib:一個強大的繪圖庫,支持多種圖形和樣式。 seaborn:一個基于
    的頭像 發表于 06-21 17:08 ?1401次閱讀
    使用Python來收集、處理和<b class='flag-5'>可視化</b>人口數據

    Altair:一個漂亮易用的數據可視化

    Altair 是一個基于Jupyter Notebook的強大可視化庫。它提供了強大而簡潔的可視化語法,使我們能夠快速構建各種統計可視化圖表。 通過下面10行代碼,你就能創建一個可交互
    的頭像 發表于 10-21 10:43 ?925次閱讀
    <b class='flag-5'>Altair</b>:一個漂亮易用的數據<b class='flag-5'>可視化</b>庫
    主站蜘蛛池模板: china国语对白刺激videos| 亚洲色四在线视频观看| 亚洲宅男天堂a在线| 四虎影院免费网址| 国产美女动态免费视频| 久久黄色影片| 最近2018中文字幕免费视频| 欧美成人福利| 日本特黄视频| 字幕网中文aⅴ资源站| 欧美sese| 欧美肉到失禁高h视频在线| 免费视频黄| 女人张开腿让男人桶免费网站| 天天操 夜夜操| 在线黄视频| 求av网址| 四虎影院在线免费观看| 成人欧美一区二区三区黑人免费| 2018天天干天天射| 四虎最新免费网址| 又长又大又粗又硬3p免费视| 一区视频在线| 另类图片综合网| 黄色网址中文字幕| 五月开心六月伊人色婷婷| hs网站在线观看| 性生交酡| 久久精品香蕉视频| 2019天天操夜夜操| 色5月婷婷| 欧美黄色片视频| 亚洲高清国产拍精品影院| 8050午夜一级二级全黄| 涩狠狠狠狠色| 人人草在线| 免费高清特黄a 大片| 婷婷丁香九月| 天天操夜夜欢| 亚在线| 午夜免费在线观看|