很多同學(xué)都對可視化都非常感興趣,但等自己去畫圖或者制作數(shù)據(jù)分析報告時,配色可能亮瞎狗眼。今天就給大家分享一篇最全數(shù)據(jù)可視化配色指南,聚焦可視化中顏色如何傳遞數(shù)據(jù)信息。可別小瞧了這一技能,可視化是一圖看懂,還是一團漿糊,可能就是顏色有沒有用對。
什么是色階?
在數(shù)據(jù)可視化的過程中,我們離不開和顏色打交道。例如為不同類別的信息賦予不同的顏色,或是在地圖中制作有梯度的色彩漸變。如果你用顏色進(jìn)行數(shù)據(jù)可視化,那么你用到的色相調(diào)色板和顏色漸變就會形成標(biāo)注數(shù)據(jù)的色階。這是因為二者都與數(shù)據(jù)有著對應(yīng)關(guān)系:例如每一個色相對應(yīng)著一個特定的類別,而每一種顏色對應(yīng)著一個特定的數(shù)值區(qū)間。
而色階又可以分為類別色階、連續(xù)色階和發(fā)散色階,它們分別對應(yīng)不同數(shù)據(jù)類型:
1)類別色階所謂色相,就是我們五歲時就知道的“不同的顏色”:紅,黃,藍(lán)。。。。。。這些顏色可以很好地用來為那些沒有天然優(yōu)劣之分的東西進(jìn)行分門別類,比如國家、種族、性別、行業(yè)——這也是為什么用于分類它們的類別色階也被稱為“無序色階”。
小貼士:記得要給你的色相賦予不同的明度,這對于色盲讀者來說尤為重要。
2)單一方向的連續(xù)色階 連續(xù)色階就是由亮到暗或由暗到亮的漸變。它們能很好地把從低到高的數(shù)字?jǐn)?shù)字化,比如收入、溫度或年齡。
小貼士:你可以在你的連續(xù)漸變中使用一種色調(diào)(例如從淺藍(lán)到深藍(lán)色),但在這里展示的幾乎所有的例子都使用了多種色調(diào)(例如從淺黃到深藍(lán)色)。使用兩種甚至更多的色調(diào)可以增加漸變部分之間的顏色對比,使讀者更容易區(qū)分它們。
3)雙方向的發(fā)散色階 發(fā)散色階(也稱為雙極色階或雙端色階)的顏色刻度和連續(xù)的顏色刻度是一樣的-但不是單一從低到高變化,而是有一個明亮的中間值,然后向刻度不同色調(diào)的兩端逐漸變暗。發(fā)散色階經(jīng)常被用來刻畫消極/積極的價值取向、選舉結(jié)果或李克特量表(強烈同意、同意、中立、不同意、強烈不同意)。
連續(xù)色階和發(fā)散色階都是定量色階。
4)突出/弱化 對于任何色階,無論是類別色階、連續(xù)色階,還是發(fā)散色階,你都可以重點強調(diào)那些你認(rèn)為對你的讀者或故事特別重要的數(shù)據(jù)類別:
除了強調(diào),你也可以弱化一些類別,比如雜項、其他或者無數(shù)據(jù)。它們通常是灰色的:
我們接下來關(guān)注的問題是:什么時候應(yīng)該使用哪種色階?
何時定性?何時定量?
我們先來看看適用于90%情況的答案:
1)當(dāng)你的數(shù)據(jù)沒有內(nèi)在排序時,使用類別色階
如果你無法對顏色編碼后的變量進(jìn)行大小排序,使用類別色階,反之如果可以排序,使用連續(xù)色階或發(fā)散色階。 例如變量是行業(yè)或國別,如伊朗、摩洛哥、巴基斯坦,應(yīng)該使用不同的色相,因為摩洛哥本身并不比巴基斯坦好,反之亦然。
如果你想對失業(yè)率,如3.4%,1.4%,2%,這樣的數(shù)據(jù)進(jìn)行顏色編碼,就要使用一個定量的色階,連續(xù)色階或者發(fā)散色階。
這并不僅僅是用不同方法區(qū)分文本與數(shù)字的問題,如在李克特量表和衣服尺碼表中都有內(nèi)在的排序,這些也是定量尺度。所以當(dāng)你把它們可視化的時候也一定要考慮使用定量的色階。
讓我們再深入一點。
2)使用明暗強調(diào)內(nèi)在的排序在你的分類之下總會有一些數(shù)字,如各州的失業(yè)率或是子類的計數(shù),你可以使用定性的色階來展示這些潛在的值。下面的樹狀圖就是一個很好的示例:
你可以像左圖那樣,在樹狀圖中通過不同的色相給你的類別上色(如定義國家或行業(yè))。但如果像右圖一樣通過色塊的尺寸大小對應(yīng)明暗變化來上色,你的樹狀圖的可讀性會更好,不會看起來花里胡哨。
左邊的樹狀圖試圖同時做太多的事情,即使有一個很好的顏色圖標(biāo),閱讀這樣的圖表也是一個挑戰(zhàn)。在大多數(shù)圖表類型中,避免使用未被編碼的值(例如位置或順序)著色。如果你想給圖表中潛在的值上色,請確保這些值在無顏色的情況下也是清晰可見的,這樣這個圖表才會易于理解。
我不想給你們留下用一個尚未編碼的潛在變量著色總是一個糟糕的決定的印象。
讓我們看看左上角的散點圖:這張散點圖是用它的數(shù)值來著色,而不需要用位置、長度等來可視化。散點圖是為數(shù)不多的用根據(jù)數(shù)值上色效果就能很好的圖表。我認(rèn)為這是因為散點圖類似于符號圖,讀者習(xí)慣于看到根據(jù)數(shù)據(jù)上色的點。盡管如此,我們還是花了幾秒鐘才能理解《經(jīng)濟學(xué)人》的這張圖表。但右上角的散點圖就容易理解多了,因為它是雙重編碼的:政治意識形態(tài)通過位置(左右)和明暗雙重顯示。如果沒有右上角和下方柱狀圖,要迅速理解左上角的散點圖是很困難的。到目前為止,我們已經(jīng)學(xué)習(xí)了樹形圖、柱狀圖和散點圖。
在這兩個折線圖中,明暗變化都用于在第一個日期對折線順序進(jìn)行雙重編碼。但是右邊的圖表中,更容易看到這一點,因為在整個圖表中線條的順序是相同的,左側(cè)的圖表會使我們感到困惑。
3)使用明暗變化區(qū)分子類別
還有更多的理由建議我們使用定量色階而不是定性色階來給定性數(shù)值上色。比如,區(qū)分子類別。
這張圖里,一級分類有猶太人(藍(lán)色)和阿拉伯人(黃色),子分類是地區(qū),以不同明度的藍(lán)色和黃色表示。
4)使用色調(diào)來區(qū)分強調(diào)和弱化的區(qū)域顏色分類不必具有相同的重要性,如果你想突出顯示一個類別,可以用一種色調(diào)(通常是灰色)的陰影為所有其他類別著色:
這張圖表基本上把類別(已婚、單身、離婚、喪偶)分成了子類別,又通過不同色調(diào)明暗把它們分成更大的類別。正如我們剛才看到的,子類別內(nèi)的陰影不會迷惑讀者——所以這個圖表也不會。
5)用陰影使分類顏色減少,便于色盲人群閱讀
在數(shù)據(jù)可視化行業(yè)中有一條準(zhǔn)則——從業(yè)者要讓他們的可視化數(shù)據(jù)對于視力受損的讀者也可以理解。這條準(zhǔn)則的意思是顏色應(yīng)該具有不同的亮度級別,以便在將它們轉(zhuǎn)換為灰度時可以輕松區(qū)分。
此外,僅使用一種色調(diào),你的老板(或讀者)就不會抱怨它看起來“太五顏六色”了。如果你正在做一個嚴(yán)肅的話題的可視化,那么這種單色調(diào)方式可能會排在你優(yōu)先級列表的首位。更容易理解和專業(yè)的表達(dá),會說服你在分類時相比于選擇不同色相更有可能選擇同一色相,只是通過明暗色調(diào)來區(qū)別。英國的《金融時報》就是這樣做:
但當(dāng)嘗試這么做的時候還有一些要點要牢記。首先,要做好一些讀者會為你的著色進(jìn)行“合理化”解釋的準(zhǔn)備。即使這并不是你的本意,他們還是可能搜尋一些使用漸變的緣由。如“美國用一種更暗的色調(diào)展示是因為它有更高的值”或是“因為這對故事來說更重要。”因此,不要隨意地著色。其次,根據(jù)經(jīng)驗,編碼條目時使用的漸變越多,閱讀就越困難。辨認(rèn)2-3個相同顏色的明暗漸變還是較為可行的。但如果是4、5、6個不同的漸變讀者就會放棄,尤其是如果它們是無序的、沒有被直接標(biāo)記、或只使用一個色相(淺藍(lán)到深藍(lán))而不是多個色相(淺黃到深藍(lán))的情況下,(讀者會更容易放棄)。
第三,如果你確實想使用漸變,如果在引入第二種顏色沒有意義的情況下,請保持一種顏色的漸變。有一個示例。為了避免使用一個顏色的太多漸變,《金融時報》有時會展示多個顏色的漸變。
這樣的效果并不好。“非洲/中東”和“其他”是不是屬于藍(lán)色區(qū)域(歐洲、亞太、美國)之外的另一個類別?這份圖表的作者或許并沒有想讓讀者這樣理解這份圖表,但讀者的確會有這樣的猜測。
何時一個色系?何時兩個色系?
如果你決定應(yīng)使用定量色階而不是分類色階的話,還有兩個問題要討論。第一個問題,你應(yīng)該使用順序色階還是發(fā)散色階?1)如果有一個有意義的中間節(jié)點,就使用兩端發(fā)散的明暗色階
如果中間值有意義,請使用多種顏色。那可能是:
零,例如正負(fù)經(jīng)濟增長
50%,例如兩個選擇之間的投票
平均年齡或中位數(shù),例如,年齡中位數(shù)以下
商定的閾值,例如低于或高于貧困線的收入水平
目標(biāo),例如收入高于和低于季度目標(biāo)
這聽起來很容易,但是,很多時候中間值是什么并不清楚,或者根本沒有中間值。舉個例子:
這個項目的開發(fā)者決定不用配色對這些活動進(jìn)行編碼,而是用耗盡的程度來分類,并采用定量色階:
然后,他們決定其他們的色階是發(fā)散的,這意味著色階有一個中間點:“正常/平均”程度的疲憊類型(辦公室、早餐、晚餐)。他們也可以不設(shè)中間值——睡眠是零疲勞,跑步是非常疲勞,這樣的話他們的變化應(yīng)該是從亮到暗。
注意,使用發(fā)散色階主要有兩個優(yōu)點:第一,強調(diào)極端情況;第二,使讀者看到更多的數(shù)據(jù)差異。2)使用發(fā)散色階可以強調(diào)極端值如果你的故事強調(diào)一個最大值,就選擇連續(xù)色階;如果你的故事同時關(guān)注最低和最高值,就選擇發(fā)散色階。設(shè)想你寫了一篇關(guān)于互聯(lián)網(wǎng)的主要構(gòu)成是歐洲、美國、日本、澳大利亞和其他西方國家,并且這些國家和地區(qū)從中受益頗多的故事。為了說明你的觀點,下面這幅用連續(xù)色階制作的地圖很適合作為插圖。它強調(diào)了數(shù)值最高的國家:
但如果你的故事是關(guān)于在非洲和亞洲只有少數(shù)人使用互聯(lián)網(wǎng),你或許就想用一個發(fā)散色階來展示你的數(shù)據(jù):
3)使用發(fā)散的明暗,讓讀者看到數(shù)據(jù)中的更多差異
和連續(xù)色階相比,使用發(fā)散的明暗變化會讓你看到數(shù)據(jù)中更多的差異。這是因為你表現(xiàn)出一個梯度的數(shù)量范圍是連續(xù)漸變的數(shù)量范圍的一半。你可以在上面的地圖上看到, 淺藍(lán)色漸變在順序色階地圖中占0至100%,但在發(fā)散色階地圖圖中僅占50%至100%。10%或20%點的差異在發(fā)散色階地圖中變得更加明顯。將俄羅斯和土耳其比較一下,按照連續(xù)色階,盡管它們之間相差16%,但土耳其在地圖上看起來只比俄羅斯略淺一點點。
在發(fā)散色階的地圖中,差異會更加明顯——俄羅斯仍然是類似的藍(lán)色,但土耳其看上去顏色更淺,更接近米色,這表明它更接近中間點。
何時分類?何時不分類?
要使用定量色階,除了要注意是用順序色階還是發(fā)散色階,你需要考慮是否要把數(shù)據(jù)分級(即歸類,也稱分類、階梯化、量化、分等級、統(tǒng)計或使其離散),還是不分級(即讓其保持未歸類的,也稱連續(xù)的)。
1)如果數(shù)據(jù)已分類,請使用分類的色階
首先,如果你的數(shù)據(jù)是非連續(xù)的,請不要使用連續(xù)的色階。這意味著,當(dāng)可視化有天然排序的數(shù)據(jù)時,例如李克特量表、服裝尺寸、官銜等,請使用分類的色階。未分類的色階會讓人誤認(rèn)為兩個相鄰選項之間還有別的選項,但其實并沒有。
2)如果想要表達(dá)統(tǒng)計范圍,就使用分級色階使用分類的色階會比未分類的色階更容易表明觀點。你可以將具有相同顏色的數(shù)值和區(qū)域進(jìn)行分組,以便讀者可以快速了解你想表達(dá)的觀點。 制圖師邁克爾·多布森(Michael Dobson)在1980年代大力倡導(dǎo)分類地圖。他稱它是“更簡單、更高效的通信設(shè)備”。分類地圖肯定會更簡單,因為簡化是分類地圖的核心。但這是否也會更有效?這取決于你要傳達(dá)的內(nèi)容。
如果您想傳達(dá)非常有限的信息,分類地圖是一個不錯的選擇。制圖師麥凱瑟琳(Mr. 庫爾森(Coulson)在1991年指出,只要地圖具有統(tǒng)計目標(biāo),例如顯示:
“中等家庭收入排最后百分之十的縣域”
“癌癥死亡率高于平均水平兩個標(biāo)準(zhǔn)差以上的區(qū)域”
如果某個縣的失業(yè)率高于全國平均水平
分類是實現(xiàn)這一目標(biāo)的方法?!胺诸愊到y(tǒng)定義了自己,相比地圖的整體模式,重點是哪些數(shù)據(jù)單元屬于特定的預(yù)定義類別?!?如果你希望讀者查看某些區(qū)域是否在統(tǒng)計范圍內(nèi),請使用分類色階。但是一旦你想展示一種普遍現(xiàn)象 ,如“溫度在南部比北部高”或“我們的收入是今年高于去年”,未分類地圖可能是更好的選擇。這是同一張失業(yè)地圖,其色階有所不同:
相比上一張,這張地圖讓人們更難看清各個縣屬于哪個統(tǒng)計范圍——即它們的失業(yè)率低于或高于全國失業(yè)率。
3)用未分類色階呈現(xiàn)細(xì)微差別的視圖
正如上面的兩張地圖所清楚顯示的,與未分類的地圖相比,分類的地圖顯示的細(xì)微差別要小。未分類的地圖會提供更真實、更細(xì)致的失業(yè)率視圖。朱迪思·泰納(Judith A. Tyner)在她的《地圖設(shè)計原理》中寫道:“未分類的等值線圖可以最精確地表示數(shù)據(jù)模型。”展示數(shù)據(jù)的復(fù)雜性本身就是一個崇高的目標(biāo)。如果展示復(fù)雜性在你的優(yōu)先級中名列前茅,請使用未分類的地圖。但是分類地圖也可以或多或少地產(chǎn)生細(xì)微差別。你顯示的類別越多,地圖就變得越細(xì)致入微。僅顯示兩個類別的失業(yè)率地圖是個極端的例子。這里我們提供了一份有六個檔次的地圖,3個高于全國平均水平的檔次和3個低于全國平均水平的檔次。
與只有兩個分類的地圖相比,此地圖顯示的差別更加細(xì)微–但與未分類地圖相比還是略遜一籌。
4)如果你懶得向讀者解釋,請使用未分類色階未分類的圖中能體現(xiàn)出的那些你觀察到的細(xì)微差別可以讓讀者看到一些對僅僅對他們很重要的信息。比如,未分類圖能讓讀者更容易看到:
…邊界區(qū)域。在分類地圖中,通常將它們與數(shù)值稍高或稍低的區(qū)域放在一起。
…不同類別之間的過渡是平穩(wěn)的還是突兀的。
…作為讀者我感興趣的地區(qū)的數(shù)值與相鄰地區(qū)相比到底是更高還是更低。
舉個例子,讓我們放大南達(dá)科他州-下圖正中央的地區(qū)。南達(dá)科他州的失業(yè)率比周圍大多數(shù)州都更接近全國平均水平(所以它的藍(lán)色更淺)。在未分檔的地圖上,我們可以看到,那些與其他州接壤的南達(dá)科他州縣的失業(yè)率都要高于接壤的外州的區(qū)縣。
在分檔地圖中,這些細(xì)微的差異是不可見的。讀者無法知道南達(dá)科他州的標(biāo)為深藍(lán)色的縣的失業(yè)率是否比周圍其他州標(biāo)為深藍(lán)色的縣更高還是更低。
5)如果如果想讓讀者讀取數(shù)值,請使用分類色階分檔地圖使讀者雖然只能讓讀者讀取一個范圍(例如6%和7%之間),但是卻可以幫助他們更好的領(lǐng)會這份數(shù)據(jù)。我們在幾小節(jié)前已經(jīng)提到過的麥格和庫爾森(Mak and Coulson)在1991年的一項研究中得出結(jié)論:“分級地圖在估計數(shù)值的測試中比未分級地圖在統(tǒng)計結(jié)果上有著非常顯著的優(yōu)勢?!弊屛覀冊俅慰纯茨线_(dá)科他州:
在上面的分檔地圖中,你可以確保正確閱讀某一區(qū)域的值處在哪個范圍-而在未分檔的地圖上,你只能對值域有“合理的猜測”。你的猜測可能在很小的區(qū)間里(“接近6%”,而不是“介于5%和6.9%之間”),但他們?nèi)灾皇遣聹y。當(dāng)然,數(shù)值的可讀性也取決于到底有多少類:你定義的類別越多,讀者讀出正確數(shù)值的可能性就越小。因此,如果你希望讀者讀出特定的數(shù)值范圍,請選擇僅包含幾個類的分類地圖。這在你展示靜態(tài)地圖(例如在打印或 PDF報表中)這種人們沒有辦法通過工具或者鼠標(biāo)懸停獲得補充信息的時候尤為重要。
編譯略有刪改,
原文鏈接:https://blog.datawrapper.de/which-color-scale-to-use-in-data-vis/
https://blog.datawrapper.de/quantitative-vs-qualitative-color-scales/
https://blog.datawrapper.de/diverging-vs-sequential-color-scales/
https://blog.datawrapper.de/classed-vs-unclassed-color-scales/
編輯:jq
-
編碼
+關(guān)注
關(guān)注
6文章
946瀏覽量
54870 -
數(shù)據(jù)可視化
+關(guān)注
關(guān)注
0文章
467瀏覽量
10318
原文標(biāo)題:別找了,最全數(shù)據(jù)可視化配色指南在這
文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論