← 管理筆記 | 首頁 關於我 海事筆記
Statistics for Business商業統計學Reay's Note

統計學重點筆記
相關 · 迴歸 · 假說檢定

從變數之間的關聯,到建立預測模型,再到驗證結果是否可信—— 一份串連統計核心概念與商業決策應用的視覺化學習筆記。

Executive Summary

統計分析的核心:從資料洞察到商業行動

統計分析不只是計算數字,而是一條從「觀察關聯」到「量化影響」再到「驗證可信度」的決策路徑。 相關分析告訴我們變數之間有沒有關係;迴歸分析把關係量化成可預測的模型;假說檢定則確認結果並非隨機偶然。 三者結合,才能將資料轉化為值得行動的商業洞察。

3核心統計主題
r相關係數 −1 到 +1
迴歸模型解釋力
0.05常用顯著水準 α
💡

學習與應用提示

  • 相關 ≠ 因果:相關分析只說明變數一起變動,不代表其中一個造成另一個,需額外研究確認因果。
  • 先看圖、再看數字:解讀 R² 前務必檢查殘差圖;只看 p 值或 R² 數字容易誤判模型。
  • 統計顯著 ≠ 商業重要:即使 p 值顯著,仍需評估差異是否夠大、是否值得投入資源。
The Analytical Workflow

統計分析的四步流程

從提出問題到形成決策,每個步驟回答一個關鍵問題。

步驟一

用相關分析觀察兩個變數是否一起變動,判斷是否值得進一步建模。

相關分析 · 有關聯嗎?
步驟二

建立簡單線性迴歸模型,把關聯量化成可預測的方程式。

迴歸分析 · 影響多大?
步驟三

透過假說檢定與 p 值,確認觀察到的效果具有統計顯著性。

假說檢定 · 結果可信嗎?
步驟四

結合實質假說,評估統計結果是否真正值得轉化為商業行動。

實質評估 · 值得行動嗎?
01
Correlation Analysis

相關分析

相關分析用統計方法衡量兩個定量變數之間的線性關聯程度與方向,是所有分析的起點。

核心概念
定義

相關係數 r

  • 衡量兩個定量變數之間的線性關聯程度
  • 範圍:−1 到 +1
  • r = +1 完全正相關、r = −1 完全負相關、r = 0 無線性關係
三種類型

方向與強度

  • 正相關:兩變數同方向變化(r 接近 +1)
  • 負相關:兩變數反方向變化(r 接近 −1)
  • 零相關:沒有明顯線性關係(r 接近 0)
變數角色

自變數 vs. 依變數

  • 自變數 X:可能的原因,通常放在 x 軸
  • 依變數 Y:被預測的結果,通常放在 y 軸
  • 因果關係需額外研究確認,相關只是起點
⚠️
核心警示:相關不等於因果關係。兩個變數共同變化,不代表其中一個造成另一個改變——可能存在第三方因素,或純屬巧合。
商業應用
行銷

廣告投放與銷售

  • 分析廣告支出與銷售收入之間的線性相關
  • r 接近 +1 → 廣告效益顯著,值得持續投入
情境:電商公司發現 Google Ads 支出與當週訂單量 r = 0.87,決定提高預算配置。
金融

股票與市場指數

  • 分析個股與大盤指數的相關程度(Beta 概念)
  • 負相關資產組合可降低整體投資組合風險
情境:基金經理人發現兩支股票 r = −0.73,將其配對以降低波動風險。
零售

店面因素與銷售額

  • 分析人流量、競爭者數量與銷售額的相關
  • 找出最值得投資的門市改善項目
情境:連鎖超市發現人流量與營業額 r = 0.91,優先在人流密集區展店。
02
Simple Linear Regression

簡單線性迴歸

迴歸分析把變數之間的關係量化成一條方程式,讓我們能用已知資料預測未知數值。

核心概念
迴歸方程式

機率性模型

Yᵢ = α + βXᵢ + εᵢ
  • α:y 截距(真實但未觀察到)
  • β:斜率(每單位 X 對 Y 的影響)
  • εᵢ:誤差項(無法解釋的隨機因素)
模型評估

R-squared(R²)

R² = r² 範圍:0 → 1
  • 衡量自變數能解釋多少依變數的變異
  • R² < 0.5 通常被視為解釋力不足
  • R² 接近 1 表示模型配適良好
解讀法則

黃金組合

  • 先檢查殘差圖,再解讀 R²
  • 低 p 值 + 高 R² → 模型最具解釋力
  • 複雜行為領域,低 R² 仍可能有研究價值
📈
殘差圖判讀:理想殘差圖應隨機散布、無規律;若出現曲線、漏斗形或系統性偏向,代表模型可能有偏誤,此時 R² 數值不可直接信任。
商業應用
業務預測

銷售量預測

  • 以廣告費用 X 預測下季銷售量 Y
  • β 係數顯示每增加 1 元廣告費帶來多少銷售額
情境:品牌商建立 SLR 模型,每投入 1 萬元廣告費可預測增加約 4.2 萬元銷售額。
房產

資產估值

  • 以房屋坪數、地點評分預測市場售價
  • R² 高表示這些變數能解釋大部分價格差異
情境:不動產公司用坪數作為 X 建立迴歸線,估算合理售價,R² = 0.82。
物流

運輸成本預測

  • 以貨物重量 X 預測運輸費用 Y
  • 搭配 R² 評估重量是否為費用的主要決定因素
情境:物流業者建立迴歸方程式,自動報價系統依重量即時計算估價。
03
Hypothesis Testing

假說檢定

假說檢定用樣本資料判斷是否有足夠證據拒絕虛無假說,確認觀察到的效果並非隨機偶然。

假說類型與 p 值
三種類型

假說分類

  • 研究假說:研究者對結果的初步預測
  • 統計假說:以數學形式(H₀ / Hₐ)表達
  • 實質假說:結果是否對商業決策有實際價值
H₀ vs. Hₐ

虛無與對立假說

  • H₀(虛無假說):現狀不變,沒有新變化
  • Hₐ(對立假說):有新變化或研究者的新主張
  • 檢定只說「不拒絕 H₀」,不說「接受 H₀」
p 值判斷

決策規則

  • p 值 ≤ α → 拒絕 H₀(通常 α = 0.05)
  • p 值 > α → 不拒絕 H₀
  • 記憶口訣:P low, null go
兩種錯誤
Type I Error

第一型錯誤(偽陽性)

  • 錯誤地拒絕了真實的 H₀
  • 發生機率 = α(顯著水準)
  • 比喻:把無辜的人誤判為有罪
Type II Error

第二型錯誤(偽陰性)

  • 未能拒絕一個錯誤的 H₀
  • 發生機率 = β;檢定力 Power = 1 − β
  • 比喻:讓真正有罪的人逃過判決
HTAB 假說檢定流程
H
建立假說
設定 H₀ 與 Hₐ,明確定義要檢定的主張
T
進行檢定
選擇方法、設定 α、蒐集樣本並分析
A
統計行動
依 p 值決定拒絕或不拒絕 H₀
B
商業意涵
將統計結論轉換為商業決策行動
商業應用
行銷實驗

A/B 測試

  • H₀:新版首頁與舊版點擊率無差異
  • p 值 < 0.05 → 拒絕 H₀,新版效果顯著
情境:電商平台測試新版結帳流程,p = 0.03,決定全面上線新設計。
品質管理

製程品質檢驗

  • H₀:產品平均重量符合規格(μ = 500g)
  • 雙尾檢定,任一方向偏差皆需處理
情境:食品廠抽樣檢測 500g 包裝,p = 0.01 → 拒絕 H₀,機器需重新校正。
市場策略

市場占有率檢驗

  • H₀:市場占有率 ≤ 18%(行銷活動無效)
  • 右尾單尾檢定,只關心是否「增加」
情境:醫療設備公司投入行銷後,p = 0.02 → 拒絕 H₀,市場份額顯著提升。
🎯
統計顯著 ≠ 商業重要。即使 p 值顯著,仍需評估差異是否夠大、是否值得投入資源——這才是實質假說(Substantive Hypothesis)的核心問題。
04
Integrated Case Study

綜合案例:串連三大步驟

以一個電商廣告預算決策案例,完整走過相關分析、迴歸分析與假說檢定的決策路徑。

🛒

商業情境:電商平台廣告預算決策

某電商平台行銷團隊想知道:增加 Google Ads 廣告預算,是否真的能有效提升銷售額?並想建立模型來預測最佳投放金額。

1
相關分析 Correlation
廣告支出與銷售額,有關聯嗎?
相關係數 r
0.89
相關強度
強正相關
樣本數
24 個月
  • r = 0.89 → 廣告支出與銷售額呈強正相關,兩者同方向變動
  • 散佈圖確認無明顯非線性趨勢,線性模型適用
結論:廣告支出與銷售額存在強線性關聯(r = 0.89),值得進一步建立迴歸模型量化關係。
2
迴歸分析 Regression
廣告每多 1 萬元,銷售額增加多少?
Ŷ = 12.5 + 4.2 × X (單位:萬元)
截距 α
12.5 萬
斜率 β
4.2
0.79
  • 截距 12.5 萬:即使不投廣告,仍有品牌基礎自然銷售額
  • 斜率 4.2:每增加 1 萬元廣告費,預測銷售額增加約 4.2 萬元
  • R² = 0.79:廣告支出能解釋 79% 的銷售額變異,配適良好
  • 殘差圖呈隨機散布,無系統性偏誤,模型可信
預測應用:若下個月廣告預算為 20 萬 → 預測銷售額 = 12.5 + 4.2 × 20 = 96.5 萬元
結論:每投入 1 萬元廣告費可帶來約 4.2 萬元銷售額增長,ROI 約 4.2 倍。
3
假說檢定 HTAB
這個效果,統計上真的存在嗎?
H
建立假說
H₀:β = 0(廣告無效)
Hₐ:β ≠ 0(廣告有效)
T
進行檢定
α = 0.05
雙尾 t 檢定
A
統計行動
p = 0.0003
p < 0.05 → 拒絕 H₀
B
商業意涵
廣告確實顯著影響銷售,建議持續投入
p 值
0.0003
顯著水準 α
0.05
檢定結果
拒絕 H₀
  • p = 0.0003 遠小於 α = 0.05 → 強烈拒絕 H₀
  • 廣告支出對銷售額的正向影響具有統計顯著性,非隨機偶然
結論:β 顯著不為零(p = 0.0003),廣告對銷售的影響在統計上確立。
實質假說評估 Substantive Hypothesis
這個統計結果,值得採取商業行動嗎?
步驟一 · 相關分析
有關聯嗎?
r = 0.89,強正相關
步驟二 · 迴歸分析
影響多大?
每 1 萬帶來 4.2 萬銷售
步驟三 · 假說檢定
結果可信嗎?
p = 0.0003,統計顯著
🚀
商業決策:三項統計結果一致支持增加廣告預算。ROI 約 4.2 倍、顯著性強,建議行銷團隊提高 Google Ads 投放,並持續追蹤更新模型。
⚠️
注意事項:統計顯著不等於商業上一定要行動。仍需評估廣告成本是否合理、市場是否飽和、其他行銷管道的機會成本,再做最終預算配置。

分析三大鐵則

把下列原則放進每一次資料分析與商業決策的檢查清單中。

01|相關 ≠ 因果 相關分析只說明變數一起變動,建立因果結論前需要實驗設計或更嚴謹的研究。
02|先看圖、再看數字 解讀 R² 與 p 值前先檢查殘差圖與資料分布,避免被單一數字誤導模型品質。
03|顯著 ≠ 重要 統計顯著只是門檻,仍需用實質假說評估效果規模、成本效益與策略價值。