close

你知道開什麼顏色的車,車子最不容易壞嗎?誰能想到,這個看似無俚頭的問題,居然是有憑有據的好問題。

每個車廠都會使用累積的大量銷售數據,去分析消費者模式,好訂立下一波的製造與販售計畫。面對眼前的資訊,一般人會做的第一件事,當然是思索資料與資料間的關係。而下一步,就是去思索整件事的來龍去脈,問 Why 與 How,好自己安心。探究因果,是人類的本能反應。畢竟,看似無法解釋的事物,通常一定有理可循。但是當數據呈現的結果實在太離奇時,又該如何自處?

orangetoy


在五年前,我們還可能沒有這種顧慮,因為沒有技術去容納與分析巨量的資料。想分析巨量數據,或從裡頭挖掘確實的成果,在當時還是天方夜譚。如今,依靠數學分析模型與電腦演算速度的進步,巨量數據解析技術,讓我們看見事件與事件間的關連性。但是,它不會告訴我們原因,只會告訴我們結果。當變數多到超乎你我想像時,千頭萬緒劃過腦海,就是無法特定隱藏在電子海洋裡的因果關係。有時,A與B的關聯性看起來實在太跳痛,空留解讀者一陣錯愕。最初提到的橘色汽車,正是一例。


近日高居暢銷排行榜上位的『大數據』一書,舉了一個知名案例,跟汽車有很深的淵源。知名統計學競賽網站 Kaggle,於2011年底到2012年初底舉行了一場競賽,題目圍繞著汽車數據打轉。『你購入的二手車是爛貨嗎 (Predict if a car purchased at auction is a lemon)?』這個競賽,要參賽者使出渾身解數建立數學模型,解開二手車競售市場裡千奇百怪的現象。主辦單位提供的資料,有32項獨立變數。來自波蘭與新加坡的冠軍團隊提出的模型,特別引人注目。那是因為,他們發現兩個我們直覺不應相關的變數之間,有著顯著的相關性:烤漆顏色和故障率。研究結果顯示,橘色烤漆的車特別不容易壞,故障率是其他顏色汽車的一半。

17

看到這個結果,肯定有不少人會感到疑惑。通常引擎、懸吊系統等直接與汽車性能有關的元件,才是我們認定會引發故障的因素。沒想到,看似最無關係的烤漆顏色,也跟故障率有著緊密的連結。面對這個謎團,人們會直覺地提出一連串假設。例如,買橘車的人可能都是汽車狂熱份子,會好好保養他們的車,車體自然完好。橘車刮花、撞壞會很明顯,維修得花一大筆錢,得小心翼翼地駕駛,保持愛車美麗外型。或是,橘色多半為客製顏色,因此出廠的造工就比較精細。又或,因為閃閃橘色在路上發光,顯眼不易出車禍,轉賣狀況自然較好。無論是哪一種假說,在過分龐大的變數交錯累積下,都難以被完全證明。

雖然沒人能解釋箇中理由,至少我們學到了一些關於汽車不為人知的豆知識。這種意外的驚喜,蘊含汽車所以能媚惑人類數百年的秘密。期待往後會有更多後續研究,為我們解謎。話說,看了這份報導,別以為只要把車子漆成橘色,就能受神明保庇愛車不受損囉。據理則學原則,如此推斷因果純為謬誤,還請小心保養愛車。

轉自:http://www.iscar.tw/index.php/carlife/intel

arrow
arrow
    創作者介紹

    合泰精品汽車 發表在 痞客邦 留言(0) 人氣()