2021年5月13日 星期四

統計資料的整理

 #本文為《傻瓜也會寫論文》《傻瓜也會跑統計》《給少年社會科學家》之補充資料#  

     關於SPSS資料檔,有一些小細節非常重要,但是老師們可能很少教學生。這邊就讓我來告訴你。

     一個好的資料檔最重要的原則之一,就是:

「幾年後你再打開資料檔,還能清楚地知道每個欄位是什麼變項。」 

雖然你現在可能認為,寫完論文後我絕不會再碰這些資料,但是人生是很難預料的,我也沒想過我會娶現在身邊的那個女人當老婆啊…….我的意思是說,我沒想到我能那麼幸運啦(汗)。總之,相信我,SPSS資料檔最好作到:「幾年後你再打開資料檔,還能清楚地知道每個欄位是什麼變項。」 

要作到這件事其實很簡單。只要:

1.  給予適切的變項名稱。名稱不一定要非常完整,但要看得懂。例如下圖。



2.  善用Excel。有時學生沒有好好設定變項名稱,是因為題目很多、要打很多字。其實這件事非常簡單。在Excel中輸入「XXX1」、「XXX2」,然後往下拉,會自動產生多個按編號順序的變項名稱,再將它們從Excel剪貼到SPSS就可以了(如下圖)。



3.   注意,以上說的都是設定變項名稱(如「參與動機1」、「參與動機1」),並不是把題目內容打上。除非要作探索性因素分析,否則把題目內容當作變項名稱是不必要的,而且會干擾分析(關於探索性因素分析時SPSS檔之處理,請參考《傻瓜也會跑統計》單元1415Step 1)。

4.    還有,如果你的研究資料有多個檔案,「檔名」也是相同原則,必須「幾年後你看到檔名,還能清楚地知道這個檔案是作什麼的。」例如下圖。

 

5.     上面用Excel產生變項名稱這一招,在寫R程式時很好用(如果你有使用到《傻統II》的程式碼的話)。因為R這軟體很原始,並沒像「X1 to X5」這種簡易寫法,只能一個一個打(如X1+X2+X3+X4+X5)。有時會打到瘋掉。此時仍可用上面說的方法:(1)先從Excel產生變項名稱 (2)剪貼到R。然後再用backespacedel鍵整理一下就可以,這比一個一個變項打輕鬆很多。如下圖。



6.   最後,無論如何,拿到資料後要作的第一個動作是整理資料,這一部份請參考《傻統》附錄一。