2017年4月21日 星期五

年輕人太會花錢

一句「年輕人太會花錢」引發了許多爭議。
重點不在於這句話是對是錯,而是它讓我們鮮明地看到台灣社會的另一種族群對立--年長世代和年輕世代的對立。拿現在的年輕人和三、四十年前的年輕人比,就像在問「項羽和呂布誰的武力比較高?」一樣,只會有爭議,不會有答案。不同的時空、不同的因素、難有共同的參照基礎。
不同的時代,很多事情都改變了。 228事件,起因於一個查緝私煙的衝突;而今,走進7-11掏出幾十塊就可以買一包煙。數十年前足以引發血腥衝突的對立事件,在現在看來微不足道。

時間改變了很多事情,但,族群的對立和衝突,始終沒有改變。一百年前、一千年前,族群的對立造成無數血腥殺戮;此時此刻,一句「年輕人太會花錢」就足以引發族群對立及相互的語言撻伐;一百年後、一千年後呢?從人類的歷史來推斷,情況大概不會有太大的改變。該怎麼說呢,或許這就是人的本質。問題不在於年輕人太會花錢,而在於,人類太容易對立。

自白

這是一個發生在明末的故事。
「啟秉大人,聚眾滋事的嫌犯都已經抓到了。」
「哦?人數有多少?」
「共計百餘人。據報,亂黨實際人數約莫七十餘人,因此這一百多個嫌犯中,十之有七是有罪的,其它三成則是無辜的良善百姓。」
「那好,把所有證供都呈上來,待本官好好審理審理,揪出那些有罪之人。」
「是,屬下已錄好這一百多人的自白口供,請大人過目。相信以大人之英明,憑這些證供,定能撥雲見日、忠奸立辨……」
「荒唐!本官豈能只憑當事人的口供論斷。這樣如何判人於罪?怎能教人心服口服?」
「這......大人,容小的直言,憑當事人的自白斷案,已有往例,非本朝所獨有;這方法在日後應該也會一直沿用下去。屬下大膽預測,即便是三百餘年後斷案,使用的也還會是這法子。」
「哼!三百年後還在用當事人的自白來斷是非?怎麼可能。荒唐、荒唐!」縣官一邊斥責,一邊忍不住翻了那些口供。雖然遣詞用字略有不同,但每份口供大致上都是這樣寫的:
『從小我就是同學們的心情垃圾桶,當大家有心事時,總會找我傾吐……』
『我身邊剛好有人得了憂鬱症,看著他受苦,更堅定了我報考心理系的決心……』
『如果有幸錄取貴系,在入學前,我絕不鬆解;我會加強自己的英文,並且閱讀相關書籍、充實自己….入學後的近程目標是……中程目標是……遠程目標是……』

我盯著電腦螢幕上的大學推甄書審資料。明朝末年那個縣官的聲音在我腦海中迴盪不已: 「三百年後還在用當事人的自白來斷是非?怎麼可能。荒唐、荒唐…….

雪樹

「最近我常想,和她分手的時間似乎到了。」
『怎麼會,我看你們總是如膠似漆,很多人都覺得你們是天造地設的一對啊。』
「那只是一般人看到的表象,說來我們之間有很多不足為外人道的苦。」
『到底發生了什麼事?』
「我覺得她不再是以前的她了。」
『你是說,她變了?』
「可以這樣說,但其實也不是這樣。」
『咦?這是怎麼回事』
「在我眼中,現在的她和那個我曾經喜歡過的她,確實不一樣了。但,這只是『在我眼中』,事實上她自始自終都沒變。說來也怪我自己,我年輕看到的那個她,並不是真正的她,而是我想像中的她。如今年近半百,或許是相處久了,也或許是人生歷練多了,這幾年我才慢慢看清她真正的樣貌。坦白說,我自己也嚇了一跳,這幾十年來我竟然一直活在自己的想像中。」
『會不會是你想太多了?很多事情都會隨時間改變啊,就因為這樣分手也不好吧。我記得你可是吃了許多苦,才能和她在一起的啊。』
「是啊。我十幾歲看了第一眼就喜歡上她,甚至為了和她在一起,想盡辦法要出人頭地,唸到了博士。你也知道,我年紀輕輕就去唸了軍校。在那個環境,要唸到博士可不容易。當時,為了和她在一起,真是什麼苦都吞得下去。可如今...... 『嗯.......嘿,你該不會是在找藉口吧?你是不是喜歡上別的對象了?』
「不不不,正好相反。我之所以還勉強維持這段關係,就是因為沒有遇上另一個喜歡的對象,因此在心情上也還離不開她,我是害怕寂寞的人。如果已經有了喜歡的對象可以替代,我會毫不猶豫地和她分手,也就不會像現在這樣煩惱了。」
『既然這樣,那你還是別輕言分手啊。就當是騎驢找馬的過渡期吧。』
「唉,這正是矛盾的地方啊。我這個人,只要和她在一起的一天,就不會花心思去找對象,畢竟,就像你說的,反正有驢可騎,何必那麼麻煩去找馬?這大概就是人家說的舒適圈的意思吧。除非和她分手,否則我就永遠會待在這個不快樂的舒適圈,當然也不會有遇見新對象的機會。」
『唉呀,真是麻煩啊。』
「是啊。只是,最近總是覺得,要開啟新的人生,除了和她分手,似乎也想不到別的辦法了。」
『嗯......對了,這問題可能不重要,但我好像一直不知道她的名字,她叫作......?』
「雪樹。」
『雪樹?好特別的名字。』
「不不不,不是雪樹,是學術。」

這球場上有球嗎?

有甲乙兩位同學,他們的學科能力是完全相同的,考完學測後,甲得了59級分,乙卻只得了41級分。明明兩人實力完全相同啊,為什麼學測成績差這麼多?乙打了電話去問試務委員,這是怎麼回事?試務委員的回答是:「喔,學測結果本來就有誤差呀,你的能力和甲相同,卻和他差了18級分,這是非常合理的喔,它在可容忍的誤差範圍內啊。」
台大研究團隊作假的新聞吵了有一陣子了。心理學界這幾年也不斷地有類似事情上演;事實上,我們已經麻痺了。從最初發現有人造假震撼學界,到現在誰誰誰的理論被發現可能作假,已經不再令人驚訝,只是成為大家覺得「哦,又一件啊」的八卦話題。很多人開始發明偵測作假的方法,或是提出避免學術造假的解決方案。一開始我也對這議題感到興趣,但是後來我慢慢地覺得不太對勁,有一種奇怪的違和感。那種感覺好像是,本來球場上裁判的工作,是要去判斷這球是safeout?是界內或界外?得分算不算數?如今裁判們三不五時聚在一起討論的是:這個球場上真的有球嗎?「這球場上有球嗎?」這是個什麼樣的問題?「這篇研究有造假嗎?」這算是什麼科學問題?我不是為了瞭解「這球場上有球嗎?」才站上球場的;也不是為了想方設法去偵測作假而走上科學之路的。但,這並不是最糟的,這背後有更糟的問題。
很多學者致力於避免造假,是因為他們相信:「只要心理學家不造假,就能產生有效的知識。」這個假設是合理的嗎?我發現不是;即使心理學家不造假,也無法產生有效的知識。
有非常多理由讓我認為「即使心理學家不造假,也無法產生有效的知識」,在此我只講其中一個顯而易見的理由--我們的測量非常糟。很多心理學家認為測量的信度(誤差指標)0.7就可以接受,0.9就很好之類的。就以心理學家普遍滿意的信度0.9來說;信度0.9是什麼意思?就是本文一開始舉的例子:兩個學科能力相同的人,可能一個人考完後是59級分,另一個人卻只得了41級分;這是我用103年大學學測成績算出來的。當學測的信度是0.9,也就是同一個人測出來的結果可能是41分,也可能是59分時,我們敢把學測用在大學推甄嗎?如果像學科能力這麼具體的東西,0.9都這麼慘烈了,心理學中那些虛無縹渺的抽象建構:人格、信念、自尊、價值、動機等等,0.9的信度到底在測什麼?建立在這種測量上的科學又是什麼樣的科學? 測量,只是我認為現有心理學無法建立有效知識的眾多原因之一。

問題已經不在於心理學家是否作假了,而在於:「即使心理學家不造假,也無法產生有效的知識。」

學術與菜蟲

今天一個外國期刊找我審稿,我想都不想就直接拒絕。這個舉動和最近台灣的數間大學聯合起來,拒訂某個國外出版社的期刊是一樣的。一般人可能不知道怎麼回事,讓我用種菜作個比喻。
有好心人提供了土地、肥料等等(納稅人出錢),給農夫種菜(學者出力)。菜種完之後,菜蟲不花一毛錢就把菜給拿走了(出版社免費得到了研究成果),然後菜蟲還要求農夫要幫忙撿菜、洗菜(學者們免費擔任主編、審查稿件)。從頭到尾菜蟲只作了一件事:他在市場裡弄了一個攤子(提供網路或紙本平台)。 然後,有趣的事情來了,菜蟲把這些菜以非常高的價錢賣出去,賣給誰呢?賣給兩種人,當初負責出錢買土地、肥料的好心人(納稅人),和負責出力種菜、還免費幫菜蟲撿菜、洗菜的農夫(學者)。所有的利潤都進了菜蟲的荷包。出錢的納稅人和出力的農夫,不但拿不到一分利潤,還要從口袋掏出大把鈔票把菜買回來。
如果以上比喻讓你覺得:這些國際出版商和菜蟲簡直一樣可惡(註1)!那你就錯了。他們比菜蟲還可惡。菜蟲有付錢給農夫,才把菜拿走;出版商一毛都沒付就把學者的研究成果佔為己有。菜蟲沒有叫農夫幫他撿菜洗菜,出版商要求學者免費為他們擔任主編、審查稿件(註2)。菜蟲沒有把菜用高價賣回給農夫,出版商用高價把研究成果賣回給當初出錢出力生產它們的人。最後,菜蟲有繳稅回饋給納稅人;而出版商,以台灣的立場,他們的稅繳給了自家政府,當初資助學者研究的台灣納稅人,沒有得到任何一絲回饋(註3)。
今天菜蟲寄了一封信問我願意不意幫他們撿菜洗菜?我理所當然地拒絕了,我為什麼要幫你撿菜洗菜?
1:本文談的是「國際」出版商,台灣出版商並非如此。因為市場小,台灣期刊常常慘淡經營,甚至可以說,他們可能是帶著賠本的社會責任心情在辦期刊的。
2:為什麼學者們願意免費幫期刊擔任主編、審查人呢?有一部份原因是我們在學術訓練中被教育這種事需要大家無私地付出;但是我長大後明白這觀念是錯的,那些國際期刊藉由我們的付出獲得了鉅大的利益(以億美金計)。另一個原因則多少和虛榮有關:「我好厲害喔,我是國際期刊的審查人耶......。」就是這種虛榮讓學者被出版商玩弄於股掌之間。

3:只要稍微思考一下就可以發現,台灣納稅的人的錢藉由學者之手,大量地流向國外,卻對台灣沒有任何實質幫助。台灣的學術機制是以「是否獲得西方人認可」為標準來運作的;我們覺得登上國際期刊比較厲害、從國外請來(或回來)的學者比較厲害等等。如果西方的學術運作方式可以讓找到真理,那麼用「是否獲得西方人認可」為標準來運作也無妨;科學爭的誰能接近真理,而不是誰的種族優越。但是,至少就實徵社會科學而言,西方的學術商業化運作模式只會讓我們離真理愈來愈遠,無法帶領我們找到真理。

我們射了十五年的漁船

最近有學者發現:某些研究軟體可能存在bug,而由於這些軟體長期被用在研究上,於是這bug可能導致近十五年來的許多大腦相關研究是無效的(註1)。就一門科學來說,我們的知識可能是錯誤的,這很可怕,但是更可怕的是,我們竟然需要十五年的時間去發現它!每年可能有數不清的學者、數十億甚至更多經費投入相關研究,而我們竟然需要十五年去發現這件事。
科學有很多「自我保護」機制;例如,重覆驗證、否證論的邏輯等等。這就像發射飛彈一樣,要真的射出飛彈之前會有很多保護機制,要經過重重關卡、不斷確認,誤射不會輕易發生。於是,當一枚飛彈被莫明奇妙射出去,打中的不是敵人而是漁船時,我們可以認為這是偶發事件;然而,如果這種事常發生,一直不斷有飛彈被誤射,一天到底打中漁船,你會覺得射飛彈的人一定瘋了,再不然就是他們是刻意地、有目的性地在誤射飛彈。我們一直射飛彈、然後花了十五年才明白,這十五年來被擊沈的都是漁船。這門學科失去了「自我保護」的能力,它無法有效偵測並汰除那些錯誤的知識。
這件事發生不久,就有人跳出來大聲疾呼:「沒那麼嚴重!」並且提供了一些統計推論來支持他們的論點。這讓我想起前2015Science刊登一篇研究,內容是有超過一半甚或2/3的心理學研究無法被重覆驗證,當時也是沒多久就有人跳出來說:「沒那麼嚴重!」。我覺得這真的很不可思議,就像八國聯軍已經打到城門口了,朝中還有很多大臣,通常是那些嚐盡既得利益的重臣,在嚷嚷著:「不用擔心,我們的城牆很堅固!」 我們的知識可能是錯誤的,這很可怕;而我們花了十五年的時間才發現它,更可怕;然而,當發現這些事情後,我們還在宣稱「沒那麼嚴重」時,對科學來說,這不叫作可怕,這是恐怖。
我一直不明白,當有人宣稱:「沒那麼嚴重」時,為什麼總是需要藉由統計的推導來說明?(註2)就實徵科學來說,要知道哪一方是正確的,其實很簡單。例如,你認為「十五年來的許多研究是無效的」太過危言聳聽,就隨機挑一些研究重作一次,看結果是否相同就可以知道答案了;你覺得「超過一半甚或2/3的心理學研究無法被重製」言過其實,就隨機挑一些研究作看看,看結果能否重製就可以知道答案了。為什麼需要用統計推導的間接方式來爭辯這個問題?
或許有些人認為,重作別人的研究太麻煩。沒關係,我提供一個比統計更強力而且非常簡單的方式;那些宣稱「沒那麼嚴重」的學者們不必費心寫那麼長的論文、玩那麼多的統計,他們只要寫以下簡單幾句話就可以說服我:「我歡迎任何人重作我的任何一個實徵研究,而且有信心一定會得到相同的結果。我樂於藉由我自己的研究去證明現有心理學研究並沒有出什麼大問題。」如果那些講得口沬橫飛、義正言辭地捍衛現有知識的學者們,有人敢公開寫下我上面說的這些話,我不只會相信「沒那麼嚴重」,而且還會把他當作神一樣崇拜。
1Eklund, A., Nichols, T. E., & Knutsson, H. (2016). Cluster failure: why fMRI inferences for spatial extent have inflated false-positive rates. Proceedings of the National Academy of Sciences, 113(28), 7900–7905.
註1:用統計來爭辯這些問題是沒有意義的。以本文所說的研究為例,學者們發現軟體錯誤可能讓我們的研究結論犯錯機率高達70%。然而即使單一研究犯錯機高達70%其實也不嚴重,因為如果有兩個獨立的研究得到同樣結果,則犯錯機率會降到0.7*0.7=49%,以此類推,當有愈多研究得到同樣的正向結果時,結論出錯的機率會一直往下掉;如果有100個研究都支持某個理論,則犯錯機率會是0.7100次方,犯錯機率幾乎是零。因此就算軟體錯誤造成某個研究犯錯機率為70%也沒有想像中嚴重,因為在心理學文獻中,你很輕易地就可以找到一堆一面倒支持理論的研究。這種機率運算是完全正確的,唯一的問題是:你手上的資料必須正確,所有的研究都是誠實無欺的。統計、數學很可靠,但它們的前題是所有的研究都沒有作任何手腳。如果你用來分析的資料,在刊登前就已經被調整和潤飾過了,那麼以這些資料為基礎的所有數學和機率分析都是沒有意義的。數學管得了真理,管不了人們對名利的渴望。


沒有算計的論文指導

最近,我有四組大學部論文完成口試了。 剛到銘傳任教時,我對「每個大學生都要寫論文」這種規範非常反彈,就像要讓不懂馬步的人打出太極拳一樣,教大學生寫論文很不容易。我對論文生性嚴謹,即使只是大學部的論文,我也都來來回回改過八、九遍以上。在教學、行政雜事繁多的情況下,每年指導大學部專題,是我生活中不小的負擔。
一年一年過去了;我慢慢可以體會,為什麼系上堅持要有這樣的制度。口試時,每每看到學生們一幅衣冠......楚楚的樣子,緊張卻故作鎮定地在台上報告、清澀卻勇氣十足地回應口委,以及口試結束後,難掩喜悅地在投影幕前拍照;我也會覺得欣慰而感動。 指導學生是一個吃力不討好的工作,花得時間多,但幾乎拿不到什麼實質好處。
指導學生時,有些學者會想一魚多吃,希望學生的研究成果將來能共同投稿發表,為自己增加一些業績。然而,能帶來好處的事,總會付出一些代價,就像古老的心理學理論所說的,當外在動機不斷被強化,內在動機就會逐漸削弱。如果養育孩子的過程中總想著他長大後能為家裡賺進多少錢,父母大概很難從陪伴孩子的成長中感受到喜悅,也很難在孩子披上嫁衣那天獲得感動。

無論如何,有算計的論文指導能帶來績效;沒有算計的論文指導,能帶來感動。十一年來我指導了34篇論文,我有好多「感動」。對,我都快哭了。 「身為老師,沒有什麼比感受到學生的成長,更開心的了。」(暗殺教室,2015

包牌式的學術研究

最近我要開始作實驗了。把問卷設計完之後,我心裡頭很自然地浮現了一個想法:「要不要再多測一些東西,比較保險?」 為什麼多測一些東西會比較保險?是在保什麼險?
當心理學家想知道AB之間是否有關聯時,照理說問卷上只需要測AB;但大部份人不會這樣作。因為只放A, B太危險了,萬一發現A, B之間沒關聯怎麼辦?沒有發現關聯的論文是不能發表的(也因此拿不到錢、換取不到名聲)。於是一個普遍的想法就是:「多測一些東西,比較保險!」
此時有很多作法。例如採用各種不同的方式測量A, B,於是我們施測了A1, A2, A3B1, B2, B3;這樣就有九種AXB的組合,只要發現任何一種AB組合有關聯,寫論文時就宣稱A, B有關聯。 那剩下8種組合發現AB沒關聯怎麼解釋?不用解釋,藏起來就好了。例如,如果發現A1B1有關聯,論文中就言之鑿鑿地宣稱自己只測量了A1B1,沒有多作什麼手腳。
這有點像買樂透時的包牌,沒事包個幾萬塊的牌,中獎機率可以提昇非常多;不過包牌而中獎的人們會誠實地說他包了牌,而學者們在中獎後常常一臉無辜地說:我沒有包牌,我只買一張彩券就中了。 這種作法讓我們的知識變得非常不可靠。以上面的例子來說,如果我們作了九種AB組合中,發現只有一組有關聯,有8組沒有關聯;此時我們大概不會認為A, B之間很強的關係;但是如果論文宣稱只測了一組就發現了A, B的關聯,我們會誤以為A, B具有很高的關聯。
我一直自認為自己具有很好的科學素養,更在意研究結果是否呈現事實,而非能否發表。但是當我今天心中浮現:「要不要再多測一些東西,比較保險一點?」的想法時,我啞然失笑,這學術社會化的黑暗影響力實在比我想像中的厲害許多。

ps. 現狀其實比我描述的更糟。例如,我們可以像上面說的施測9AB組合,然後「重覆作5次」,於是就有9*5=45AB組合。最後挑出其中有效果的5組,隱藏剩下的40組;然後宣稱我只作了5組,而且每次都發現AB具有關聯。於是在論文中會如此下結論:「......連續5個實驗結果都發現AB具有顯著的關係,此一效果非常穩定......。