close

在統計實務中,當我們要估算某事件發生的機率,尤其是來自重複伯努利試驗(例如抽樣瑕疵品、顧客反應、品質檢測),常見的兩種方法是:

二項分配(Binomial Distribution)

樣本比例的常態近似分配(Normal Approximation to Sample Proportion)

這兩種方法在樣本數不大時可能產生顯著差異。本文以某公司品管抽驗瑕疵品的案例為例,說明兩者的計算方式、結果差異與適用情境

📦 案例背景:瑕疵品抽驗決策

某公司每日抽驗 100 件產品,若抽樣中瑕疵品比例超過 8%,則當日所有產品需報廢。已知母體瑕疵率為 5%。我們欲估算:每日抽樣中瑕疵比例超過 6% 的機率是多少?

🧮 法一:二項分配法

  • 設隨機變數 X 機率採用二項分配,參數為 n = 100、p = 0.05。我們旨在估算事件 P(X > 6) 的機率值。 使用常態近似並加上連續校正:
  • 平均值 μ = np = 5
  • 標準差 [統計] 二項分配與樣本比例常態近似分配機率估算的差異
  • 連續校正後:P(X > 6.5)
  • Z 分數:Z = (6.5 – 5) / 2.179 0.688
  • 機率:P(Z > 0.688) 0.2458

📊 法二:樣本比例常態近似分配

定義樣本比例 [統計] 二項分配與樣本比例常態近似分配機率估算的差異,近似服從常態分布:

  • 平均值 [統計] 二項分配與樣本比例常態近似分配機率估算的差異
  • 標準誤 [統計] 二項分配與樣本比例常態近似分配機率估算的差異
  • 要估算 [統計] 二項分配與樣本比例常態近似分配機率估算的差異
  • Z 分數:[統計] 二項分配與樣本比例常態近似分配機率估算的差異
  • 機率:[統計] 二項分配與樣本比例常態近似分配機率估算的差異

🔍 結果比較與差異分析

[統計] 二項分配與樣本比例常態近似分配機率估算的差異

差異原因如下:

  1. 離散 vs 連續:二項分配是離散的,樣本比例是連續近似,在小樣本時二者計算出來的機率值誤差較為明顯。
  2. 連續校正影響:二項分配使用連續校正(如 X > 6.5),而樣本比例直接估算 [統計] 二項分配與樣本比例常態近似分配機率估算的差異,忽略了離散性。
  3. 樣本數不足:當 n 不夠大時,樣本比例的常態近似分配偏離真實分配。

📈 樣本數增加後的改善

若將抽樣數提高至 n = 200,則樣本比例估算結果為:

  • 標準誤下降至 0.0154
  • Z 分數提升至 0.649
  • 機率下降至 25.7%

此時常態近似分配與二項分配結果更接近,顯示樣本數增加能改善二種方法之間的估算差異

結論與建議

  • 在樣本數不大(如 n < 100)時,建議使用二項分配或加上連續校正的常態近似。
  • 樣本比例常態近似適合快速估算,但需注意其誤差來源,尤其在品質管制、風險預警等高敏感度場景。
  • 若需建立決策模型或儀表板,建議同時列出兩種估算結果,並標示誤差範圍。

202592日星期二

創作者介紹
創作者 jackterrylau 的頭像
jackterrylau

儒道哲學的浪漫人生

jackterrylau 發表在 痞客邦 留言(0) 人氣()