|
品管七大工具-直方圖(Histogram)介紹
直方圖(Histogram)的最主要用途在推測製程能力、計算不良率、調查是否有混入兩種以上不同群體,也可以用來測知有無假數據、設計的管制界線是否適用於實際製程管制,並藉以訂定規格與規格界限或表準值比較。
直方圖基本上是一種次數分配表,沿著橫軸以各組組界為分界,組距為底邊,以各組的次數為高度,依序在固定的間距上畫出矩形高度所繪製而成之圖形。
早期沒有電腦的時候,製作直方圖是有點麻煩,因為拿到手的原始資料通常非常地凌亂,甚至沒有順序,必須要自己先統計然後再手動計算其間距與各組數據的數量,不小心的話還很容易出錯。現在有了電腦的輔助,可以使用Excel之類的軟體來分組並自動統計各分組的數量,也容易微調各組的計數位置。
長條圖與直方圖的差異
雖然有人將長條圖(Bar Chart,各長條中間不相連接)與直方圖(Histogram,各相鄰長條中間彼此相連接)兩者分得非常清楚,但個人覺得其實相鄰長條之間有無間隔應該無傷大雅。
持此論者認為這兩者最大的差異應該是長條圖的長條類別可以任意調換位置,比如說居住地區的人口數、性別資料等屬於不連續的資料。而直方圖的長條則必須依照原來的順序排列,通常代表連續的資料,比如班級內的身高統計屬於連續的資料。
不過真的有幾人可以如此分得清楚呢?那銷售業績、營業績效應該屬於條圖或直方圖呢?連續的資料應該是直方圖囉!可是又不是很像?算了吧!更正工作熊如果你有比較好的看法。
直方圖的繪製技巧
老實說,直方圖算是最常出現在你我生活中的統計圖表之一了,舉凡班級成績分佈、考試成績分佈、年齡分佈等幾乎都是以直方圖來表示的。不過統計中的直方圖因為統計的是某個規定尺寸或某個規定重量,只要統計的數量夠多,就會出現所謂的常態分佈。
現在我們就來看看如何由數據製作直方圖吧。
《例子》假設有一鐵板的厚度測得200組數據如下,單位為mm。
8.8 | 8.8 | 8.4 | 8.2 | 8.3 | 9.3 | 8.6 | 8.4 | 9.0 | 9.7 |
8.4 | 8.5 | 9.0 | 8.7 | 9.4 | 8.9 | 8.7 | 8.7 | 8.6 | 8.7 |
8.4 | 8.4 | 8.5 | 8.8 | 8.9 | 9.6 | 8.4 | 7.9 | 8.1 | 8.4 |
8.8 | 8.3 | 8.4 | 8.5 | 9.3 | 8.1 | 8.7 | 8.3 | 8.9 | 8.7 |
8.1 | 9.1 | 9.0 | 8.6 | 8.3 | 9.0 | 8.7 | 9.0 | 8.6 | 8.6 |
7.8 | 9.2 | 9.8 | 7.4 | 8.8 | 8.1 | 9.0 | 7.8 | 8.6 | 8.7 |
8.8 | 9.4 | 9.0 | 8.8 | 8.5 | 8.7 | 9.0 | 7.8 | 9.2 | 8.7 |
8.8 | 7.9 | 8.0 | 8.0 | 7.9 | 8.2 | 8.6 | 8.4 | 8.6 | 8.3 |
9.0 | 9.0 | 8.3 | 8.4 | 9.5 | 8.4 | 9.7 | 8.9 | 9.2 | 9.0 |
8.4 | 8.1 | 8.4 | 9.9 | 9.9 | 8.6 | 8.5 | 7.9 | 8.7 | 7.8 |
9.3 | 8.4 | 8.8 | 8.5 | 9.1 | 8.9 | 8.4 | 8.8 | 8.9 | 9.7 |
8.3 | 9.0 | 9.3 | 8.7 | 9.0 | 9.2 | 9.1 | 7.0 | 7.9 | 7.3 |
9.7 | 8.9 | 7.8 | 8.3 | 8.7 | 9.0 | 8.4 | 7.6 | 8.1 | 8.2 |
8.5 | 8.5 | 8.1 | 8.3 | 7.6 | 7.7 | 9.0 | 7.9 | 8.3 | 9.0 |
8.9 | 8.6 | 8.4 | 8.9 | 8.3 | 8.0 | 8.0 | 8.0 | 8.9 | 8.3 |
9.0 | 7.7 | 7.9 | 8.3 | 8.5 | 8.5 | 8.9 | 8.4 | 8.3 | 9.5 |
8.8 | 8.7 | 8.1 | 9.1 | 8.9 | 8.4 | 7.9 | 8.6 | 7.8 | 8.9 |
8.1 | 7.7 | 7.3 | 8.5 | 8.0 | 7.7 | 7.8 | 8.3 | 7.5 | 8.3 |
9.4 | 7.0 | 7.5 | 7.7 | 8.3 | 7.9 | 8.6 | 8.9 | 8.4 | 9.9 |
8.3 | 9.4 | 8.4 | 9.3 | 8.5 | 7.9 | 8.4 | 8.8 | 8.3 | 8.0 |
使用Excel計算及繪圖直方圖
- 使用Min()函數計算最小值=7.0
- 使用Max()函數計算最大值=9.9。
- 一般建議分成10組左右。所以間距就是將(最大值-最小值 )/ 10,最後得出間距為(9.9-7.0)/9=0.29,四捨五入的結果,所以間距取0.3。
- 各組中心值為7.15, 7.45, 7.75, 8.05, 8.35, 8.65, 8.95, 9.25, 9.55, 9.85。
- 使用COUNTIFS()函數計算並統計各組的次數分配可得下表
間距 7.15 7.45 7.75 8.05 8.35 8.65 8.95 9.25 9.55 9.85 數量 2 5 14 26 44 38 43 13 7 8 - 將以上數值繪製成Excel圖表如下:
上面圖表看起來似乎怪怪的,並不是我們一般熟知的常態分佈曲線的正常形狀,這是因為取間距及刻度的關係所造成的,我們稍微移動一下間距的中心點位置,組數從10組變為11組,重新計算其統計的數據如下:
間距 | 7.05 | 7.35 | 7.65 | 7.95 | 8.25 | 8.55 | 8.85 | 9.15 | 9.45 | 9.75 | 10.05 |
數量 | 2 | 3 | 9 | 24 | 31 | 46 | 40 | 25 | 11 | 6 | 3 |
再用Excel繪製一次直方圖表後就變成下面的分佈曲線的樣子,是不是比較像常態分佈的圖形了呢。
所以,取間距及中心值的時候就顯得非常重要,有時候可能得稍微挪移一下,以得到較正確的圖形。
延伸閱讀:
特性要因分析圖(Cause & effect Analysis)介紹
柏拉圖分析 (Pareto Chart)介紹
如何使用Excel2007製作柏拉圖(Pareto chart)
標準差與常態分佈的關係(six sigma)
如何使用Excel2007建立常態分布曲線圖表
|
訪客留言內容(Comments)
// Begin Comments & Trackbacks ?> // End Comments ?>訪客留言注意事項:
1.首次留言須通過審核後內容才會出現在版面上,請不要重覆留言。
2.留言時請在相關主題文章下留言,與主題不相關的留言將會被視為垃圾留言,請善加利用【搜尋框】尋找相關文章,找不到主題時請在「水平選單」的「留言板」留言。
3. 留言前請先用【搜尋框】尋找相關文章,自己做一點功課後再留言。沒有前因後果的內容,工作熊不一定會瞭解你在說什麼,就更無法回答你的問題。
4. 工作熊並非某一方面的專家,所以回答的內容或許會有不正確的地方,服用前還請三思。如果您想詢問關於電路板方面的工程問題,請前先參考這篇文章【詢問工程問題,請提供足夠的資訊以利有效回答】 把自己的問題想清楚了再來詢問,並且請提供足夠的資訊,這樣才能有效回答問題。
5. 工作熊每則留言都會看,但不會每則留言都回答,尤其是只有問候之類的內容。
6. 留言詢問時請注意您的態度,工作熊不是你的「細漢」,更沒有拿你的薪水,所以不接受吆喝工作熊的態度來回答你的問題。
7. 原則上工作熊不接受私下電子郵件、電話、私訊、微信或任何即時通聯絡。
8. 自2021年7月起Google將停止最新文章電子郵件通知,如果你想隨時接收部落格的最新文章可以參考這裡。
個人想協助工作熊補充說明一下組界範圍
組界範圍包含 :下限值 + 區間範圍值 + 上限範圍值
組界範圍會根據資料筆數而定
>50 ~ 100筆 (經驗可取 5 ~ 10組 )
>100 ~ 1000筆 (經驗可取 10 ~ 15 組 )
>1000筆 (經驗可取10 ~20 組 )
實際工作最常用經驗 約 10 ~ 15 組 最多可能會到20組
這裡200筆大約會取10 ~ 15組
——————————————————————-
事實上我們還可用log或開根號去求組界範圍
以log計算 大概分為9 ~ 10組
不過依照200筆數據計算 計算約9組 (四捨五入)
若以10組計算 其實沒包含上限值9.9這一組
繪製直方圖看起來較不正確 因此分為11組較為恰當)
但如果以開根號來分組數 200筆數據大概會分到15~17組
以經驗來看 < 100筆數據可直接開根號求組界
經驗大約分為8 ~ 10 組