您的位置 首页 kreess

《數據可視化基礎》第二章:坐標軸

以下部分是基於《Fundamentals of Data Visualization》學習筆記,要是有興趣的話,可以直接看原版書籍哦!https://serialmento

以下部分是基於《Fundamentals of Data Visualization》學習筆記,要是有興趣的話,可以直接看原版書籍哦!https://serialmentor.com/dataviz/

進行數據可視化的第一步是來定義數據的位置,也就是位置標度(position scales)。位置標度決定瞭我們的數據在圖片中的位置,對於一個常規的2D圖形而言,我們需要兩個變量來定義一個點,這個也就是我們經常說到的X軸和Y軸。有瞭兩個位置標度之後,我們還需要制定這兩個標度的相對位置。常規來說X軸和Y軸是垂直的,但是也有其他的,比如說Y軸相對於X軸是銳角的。這種兩個位置標度再加上一個相對位置就構成瞭一個坐標軸。

直角坐標軸(笛卡爾坐標系)

在數據可視化方面用的最廣的就是直角坐標系,這個坐標軸系統由於是數學傢笛卡爾發明的,所以也就叫笛卡爾坐標系瞭。常規的坐標軸就是 這個圖的樣子。

對於數據而言,它們都是有單位的。例如,如果我們要測量溫度,則這些值可能以攝氏度或華氏度為單位。同樣,如果我們正在測量距離,則值可能以公裡或英裡為單位。在笛卡爾坐標系中,沿軸線的網格線之間的間距對應於這些數據單元中的離散步長。例如,在溫度范圍內,每10華氏度可能有一條網格線;在距離范圍內,我們可能每5公裡有一條網格線。

直角坐標系可以有兩個不同單位的軸。每當我們將兩種不同類型的變量映射到x和y時,就會經常發生 的圖中的情況,下圖中,我們繪制瞭溫度與一年中的天數的關系時。y軸以華氏度為單位,每20度有一條網格線,而x軸以月為單位,每3個月的第一個有一條網格線。無論何時以不同單位測量兩個軸,我們都可以相對於另一個拉伸或壓縮一個軸,並保持數據的有效可視化。哪個版本更合適取決於我們想要傳達的故事。高而窄的圖強調沿y軸的變化,而短而寬的圖則相反。理想情況下,我們希望選擇一種長寬比,以確保位置上的任何重要差異都明顯。

另一方面,如果x和y軸以相同單位測量,則兩個軸的網格間距應相等,以使沿x或y軸的相同距離對應於相同數量的數據單位 。例如,我們可以繪制一年中每一天德克薩斯州休斯頓的溫度與加利福尼亞州聖地亞哥的溫度的關系圖,由於在兩個軸上都繪制瞭相同的數量,因此我們需要確保網格線形成完美的正方形。

非線形坐標軸

在笛卡爾坐標系中,沿軸的網格線在數據單位和結果可視化中均等分佈。我們將這些坐標系中的位置比例稱為線性。雖然線性標度通常可以提供準確的數據表示,但在某些情況下,非線性標度可能能更好的呈現數據的分佈。

最常用的非線形坐標軸就是對數坐標軸瞭。所謂的對數坐標軸就是把我們的數據進行對數處理。最常見的坐標軸就是 log10對數坐標軸。如下圖所示,如果按照線形坐標軸來排列的話,數據跨度特別大,這個時候使用對數坐標軸就比較好一些。對數坐標軸的使用方式有兩種:

  1. 把數據進行轉換後,使用轉換後的數據進行繪圖。同時在坐標軸標題上面說明數據進行瞭什麼轉換(下圖的第二個)。
  2. 直接使用原始數據,但是在數據跨度上使用的是對數的原始數據(下圖的第三個),坐標軸標題標註的時候則使用原始的數據。

以上的兩種轉換都是可以的,建議的還是使用第一種,因為這種轉換在讀者看到標題標註之後,對於讀者解讀圖片的壓力會小很多。

有一個錯誤的表示就是,標註瞭對數轉換,但是坐標軸數據卻是原始數據。

對於數據跨度大都可以嘗試對數坐標軸試一下,特別是比率的數據。例如德克薩斯州每個縣的居民人數為基礎,並將其除以德克薩斯州所有縣的居民人數中位數的數據。由於數據是比率的結果呈現的,如果我們線形坐標軸來繪圖的話,是這樣的。

大多數地區的人口和中位數人口很接近,而有的地區的人口則是中位數人口的200多倍。這麼大的數據跨度,就導致瞭,在下面的差別不大的地區沒辦法很好顯示其分佈。這個時候,我們時候對數坐標軸的話則就很好的顯示結果瞭。

極坐標系

以上介紹的兩個坐標系其相對位置還是直角的,但是還有其他坐標系,其中軸本身是彎曲的。特別是在極坐標系中,我們通過角度和距原點的徑向距離來指定位置,因此角度軸是圓形的。

極坐標可用於周期性的數據,這樣可以將刻度一端的數據值邏輯上與另一端的數據值連接。例如,考慮一年中的天數,12月31日是一年中的最後一天,但它也是一年中第一天的前一天,果要顯示一年中的數量變化情況,可以將極坐標與指定每天的角度坐標一起使用。

另外一種使用非直角坐標系的設置是地理空間的數據,由於地球是一個球體,如果使用直角來繪制經緯度的話容易產生誤解所以不建議使用。取而代之的則是使用各種非線形的則會好一些。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部