在數(shù)據(jù)分析過程中我們大多數(shù)是通過柱狀圖、折線圖、餅圖等來展示分析數(shù)據(jù)的差異。
但是當我們擁有一批數(shù)據(jù)的時候,比如有500個數(shù)據(jù)指標,甚至有多組500個指標的時候,上述幾個圖表就無能為力了。
面對大量的指標,而我們又需要了解這些數(shù)據(jù)的特性的時候,這個時候我們就需要對這些數(shù)據(jù)做描述性統(tǒng)計分析。
描述性統(tǒng)計是揭示數(shù)據(jù)分布特征的方式,表達定量數(shù)據(jù)的方法。包括數(shù)據(jù)的平均分析、集中趨勢、離散程度、頻率分布。
常見的描述性統(tǒng)計指標有:
體現(xiàn)集中趨勢的指標:眾數(shù)、平均數(shù)、分位數(shù)
離散趨勢指標:極值與極差、平均差、方差、標準差、分位差
分布趨勢指標:峰態(tài)、偏態(tài)
*上述加粗指標為箱形圖能夠展示的指標
今天的主角箱形圖,就是一個包含了上述3個趨勢指標的一個強大圖形。
箱形圖,又稱為盒式圖或箱線圖,因為形狀像箱子而得名,用于分析一組或多組數(shù)據(jù)的范圍、中心位置和分布。
箱形圖不像柱狀圖、折線圖、餅圖一樣簡單易懂。
但只要我們稍微理解一下一些指標的定義,就能很好地應用起來。
今天我們可以借助一個例子來學習下這個圖形怎么應用:
使用箱型圖來分析行業(yè)商品價格的分布特征。
*特別聲明:我們的數(shù)據(jù)來源是天貓生意參謀市場數(shù)據(jù)某個類目的商品TOP榜單。獲取榜單上商品的價格。
首先認識一下箱形圖:
【名詞解釋】:
【Q1】:下四分位數(shù),就是指標數(shù)值按降序序排行,處于3/4位置的數(shù)值稱為下四分位數(shù)。
【Q2】:中位數(shù),數(shù)值指標按降序排行,排1/2位置的數(shù)值稱為中位數(shù)。
【Q3】:上四分位數(shù),數(shù)值指標按降序排行,處于1/4位置的數(shù)值稱為上四分位數(shù)。
【IQR】:四分位距離,Q3和Q1的差,稱為四分位距離,公式:IQR=Q3-Q1。
【上邊緣】:上四分位數(shù)加上1.5倍的四分位距離跟數(shù)據(jù)指標的最大值相比,取小的那個。上邊緣是上異常值的邊界。計算公式:上邊緣=(Q3 + 1.5 * IQR,MAX)取最小。
【下邊緣】:下四分位數(shù)減去1.5倍的四分位距離跟數(shù)據(jù)指標的最小值相比,取大的那個。下邊緣是下異常值的邊界。計算公式:下邊緣 =(Q1 – 1.5 * IQR,MIN)取最大。
【異常值】:處于上下邊緣之外的數(shù)值都是異常值
【平均值】:所有指標的算術平均值。
根據(jù)各個指標的定義,我們通過這個圖形就可以直觀看出指標的最大、最小、異常值。
平均值、中位數(shù)有分布形態(tài)。這個圖形比較復雜,但就是由于比較復雜,才能直觀帶給我們很多的信息。
我們用Excel 來制作箱形圖:
Excel制作箱形圖特別方便快捷
①先選擇左圖的數(shù)據(jù)區(qū)域:
②點擊插入圖表這里右下角小箭頭:
③在所有圖表中選擇箱形圖:
④這樣一個基本的箱形圖就做好了(可以添加多列數(shù)據(jù)做對比):
⑤我們看看實際例子中,我們能從箱形圖中洞察出什么內(nèi)容:
我們可以直觀獲取到以下信息:
1、價格最低是6.5最高是160,有兩個高異常值。
2、有兩個商品的價格比較突出,超出正常范圍很多,達到249、171。
3、有一半的商品價格集中在43-92之間,3/4的商品價格都在92以下。
4、價格中位數(shù)是67,平均值跟中位數(shù)比較接近,平均值為72。
以上數(shù)據(jù),就能更清晰地知道自己商品的價格所處的位置。
數(shù)據(jù)分析中箱形圖的用途:
1、開新品定價:開新品的時候,對商品的價格能夠有一個較好的定位。
如果結(jié)合價格段數(shù)據(jù)的增長趨勢,就能決策進入哪個商品價格帶比較合適。
2、類目對比:如果多個類目數(shù)據(jù)對比,就能分析出不同類目的客單價分布的差異性。
箱形圖是功能超級強大的一個分析圖形,趕緊使用起來吧,歡迎交流更多數(shù)據(jù)分析內(nèi)容
關于數(shù)據(jù)銀行的其它功能和應用場景,我們會陸續(xù)在后續(xù)的文章分享,關注我們及時閱讀干貨內(nèi)容
~~~~~~~~~~~~~~~ 作者分割線 ~~~~~~~~~~~~~~
~~~~~~~~~~~~~公司介紹分割線 ~~~~~~~~~~~
「蔚云科技」專注成為一家數(shù)字商業(yè)運營服務商,我們通過數(shù)字商業(yè)洞察、數(shù)字商業(yè)技術、數(shù)字商業(yè)運營三大核心引擎,為客戶提供具有遠見卓識的商業(yè)增長解決方案。
聚焦用“大數(shù)據(jù)”為企業(yè)提供「選品賦能」服務,賦能企業(yè)。
版權聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權/違法違規(guī)的內(nèi)容, 請發(fā)送郵件至 sumchina520@foxmail.com 舉報,一經(jīng)查實,本站將立刻刪除。