去年投稿文章時與匿名審稿人為了文章中有關迴歸的問題有了對話,正巧有談論使用迴歸於競爭法案件的文章一篇[1],謹就內容重點與心得撰文如下。
R. Posner法官在Re ATA v. Fedex (7th Cir., 2011)乙案中曾說:「這不是在吹毛求疵,專家們的迴歸和Brutus[2]率領羅馬元老院議員捅了凱薩23刀所流的血一樣多。」(This is not nitpicking.
the expert’s regression had as many bloody wounds as Julius Caesar when he was
stabbed 23 times by the Roman Senators led by Brutus.)
Posner法官這句話傳達了一個很重要的訊息,即,正確使用迴歸和其他的計量方法對經濟專家的公信力和案件的成功與否致關重大。
事實上,對競爭法的從業人員而言,可以不須要經濟學或統計學的高深學位,就可以很厲害的進行迴歸計量經濟分析。這可從《捍衛任務》(John Wick)男主角基努李維的故事談起。
迴歸:是什麼、為什麼要用、如何使用
2017年,基努李維在為《捍衛任務2》進行宣傳活動時,有記者問他:「你從事演藝多年,你認為表演有助你更了解人際關係和能成為一位更好的人嗎﹖」,基努李維只是簡單地回答:「比較或對比對我來講是一件困難的事,因為我沒什麼可以比較的,從15、16歲開始當演員,我不知道不當演員是什麼感覺。」
基努李維的問題和我們在競爭法訴訟或結合管制時所面臨的問題沒甚麼不同,例如在審理卡特爾案件時,我們會常問的關鍵問題是,在沒有卡特爾情況下,價格是不是更低﹖結合管制也是一樣,我們也會問結合後價格會更高嗎﹖一個是關心過去發生的事情,另一個是展望未來可能的情況。無論是過去或未來,這些問題都是要我們去定義“假如沒有(卡特爾或結合)”(but for)的情況下世界會是如何﹖這類問題很重要也很具挑戰性,是一個因果推論的基本問題(the
fundamental problem of causal inference)。
實務上要如何處理這些問題﹖標竿法(bechmarking)是競爭法常使用的方法之一─比較違法行為發生前後(發生前就是“but for”)的價格、以相似市場(就是“but for”)的觀察結果為比較基礎等,資料可以是時間序列(time series)的也可以是橫斷面(cross-section)的。另外,迴歸也是經濟學家常用的方法。
最早使用“迴歸”一詞的應該是英國的Francis Galton爵士[3],在他的文章中研究了父親身高與大兒子身高間的關係,用現代術語來說,迴歸模型是用於理解事物之間相互關係的數學模型,例如使用迴歸來瞭解卡特爾對價格的影響,在結合審查中以迴歸來理解競爭對價格的影響。最簡單的迴歸模型就是兩個變數的線性迴歸:
Y=C+bX+e
Y:因變數 C:截距項 X:自變數 e:殘差項
而最小平方法(Ordinary Least Squares,OLS)的使用可以簡便的求得未知的數據,並使得求得的數據與實際數據之間誤差的平方和為最小。
當然也可以將自變數擴大至二個或二個以上,例如:
Y=C+b1X1+b2X2+e
一般我們會鼓勵使用二個或二個以上自變數的複迴歸(multiple
regression),理由如下例。假設今藥廠研發出兩種新冠肺炎的疫苗A、B,進行人體實驗後獲得表一(最簡單的迴歸)的結果,疫苗B的效果看起來是比疫苗A要高5%,所以應該選擇疫苗B投產。
表一 |
|
疫苗A |
疫苗B |
78% (273/350) |
83% (289/350) |
答案可能不是那麼簡單,因為進一步發現疫苗A、B對男、女的影響後所得到的結論卻大大不同(表二,複迴歸):
表二 |
||
|
疫苗A |
疫苗B |
女性 |
93% (81/87) |
87% (234/270) |
男性 |
73% (192/263) |
69% (55/80) |
不論男或女,疫苗A的防護力都高於疫苗B,所以應該選擇疫苗A投產才是,這種前後結論完全不同的情形就是所謂的辛普森悖論(Simpson's
Paradox)[4]。
辛普森悖論也會發生在競爭法的個案上,若把前面的例子改為量販店結合,表三是預測結合後的事業會提高83%(289/350)種產品的價格,比競爭對手高出5%,所以事業結合後會有單方效果的發生。若我們是在觀察結合後有機食品與非有機食品的銷售狀況,結論會完全不一樣(如表四),以有機食品為例,結合後事業B的銷量比競爭A對手為多,且價格還低6%;非有機食品則是價格比競爭對手少4%,在此情況下恐無法驟下有單方效果的結論。所以說若不去確認其他因素(性別、有機)的重要性,就可能導致錯誤的判斷。
表三 |
|
競爭對手A |
合併後事業B |
78% (273/350) |
83% (289/350) |
表四 |
||
|
競爭對手A |
合併後事業B |
有機食品 |
93% (81/87) |
87% (234/270) |
非有機食品 |
73% (192/263) |
69% (55/80) |
在卡特爾的案子也是一樣。如前所述,我們會關心在沒有卡特爾情況下價格是不是更低﹖如果我們發現卡特爾期間的平均價格比非卡特爾期間高$10,是否即可下結論因卡特爾而多收了$10﹖在回答這個問題前,或可將平均值的比較轉換為以下形式的簡單迴歸:
Pt = a + b*Cartel + et
Cartel是虛擬變數(卡特爾期間=1、非卡特爾期間=0),b是衡量平均價格的差異(在本例b=10)。若只看上開方程式,導致價格變動的原因就是卡特爾,可是影響價格的因素還有其他─天然災害造成供給中斷、需求減少等。所以若沒有考慮其他因素,將可能因此誇大卡特爾的效應。
若我們的目的是要“預測”(predict),而不是將係數(b)解釋為(卡特爾)的因果關係時,有可能會出現以下的盲點。
圖一是歷史的價格趨勢資料,右邊的陰影區是原先想預測的區域。而目前有模型 一、二、三3個迴歸來預測最後的價格走勢(即陰影區)。其中模型三最契合歷史價格趨勢,模型二對歷史的契合度不如模型三,但比模型一要來得好,所以理應是愈契合歷史價格趨勢者愈有最佳的價格預測能力,可是在揭開陰影區後(圖二)反而是模型一預測能力最佳。所以若有人說我的迴歸模型最契合歷史數據,這就得對他保持懷疑的態度。
另一個盲點就是前面提到的因果的基本問題,任何兩個或兩個以上的變數都可進行迴歸分析,可是沒有因果關係變數所做出的迴歸分析並沒有任何意義。例如若發現近十年尼可拉斯凱吉(Nicolas Cage)電影上映數量與溺斃事件數呈正向關係,一般人是不可能斷言溺斃事件都是尼可拉斯凱吉電影所造成,常理判斷兩者是沒有因果關係的;可是若小明前天發燒,今天吃了退燒藥就退燒了,倘因此說燒退是退燒藥的效果,很多人都會接受,然事實上很可能是發燒二天後,即使不吃藥也會自行好轉,不見得是藥物的效果,也就是說在退燒與藥物間並沒有因果的關係。
另近來亦常有利用巨量的數據建立模型並從中找出隱藏的特殊關連性,這種所謂的“數據挖掘”(data mining)若是無法先理解要應用的領域、熟悉相關的知識,再多數據所形成的模型也無助於最後的解釋與評估。
後記
上月底華爾街日報的一篇短文―“經濟學如何在數據中迷失了自己”(How Economics Lost Itself in Data)提到,數據無法自己解釋(data doesn’t interpret itself),若是要解釋市場競爭,對參進障礙、市場力等概念的瞭解可能影響你對數據的解讀,在沒有紮實的理論基礎下去訪視數據只會產生困惑(Going to the data without a strong theoretical grounding is an invitation to confusion.)!
[1] Ai Deng (2020), “Julius Caesar, Keanu Reeves, Nicolas Cage, and
Econometrics? Four Analytical Insights for Antitrust Counsel”, theantitristsource.
[2] 為反對凱薩專政,Brutus在西元前44年率領元老院議員刺殺了凱薩,並留下:「我愛凱薩,我更愛羅馬。」
[3] Francis Galton, “Regression towards Mediocrity in Hereditary
Stature”, THE JOURNAL OF THE ANTHROPOLOGICAL INSTITUTE OF GREAT BRITAIN AND
IRELAND (1886), 15: 246–263.
[4] Edward H. Simpson, “The Interpretation of Interaction in
Contingency Tables”, JOURNAL OF THE ROYAL STATISTICAL SOCIETY SERIES B
(METHODOLOGICAL) (1951), 13(2): 238–241.