一、心理測驗的意義
狹義:測量工具本身。
廣義:
- Anastasi(1982)認為心理測驗是對行為樣本所做的一種客觀的和標準化的測量。
- Cronbach(1970)認為心理測驗是採用數字量尺或分類系統,來描述個人特質的一中有系統程序。
- 郭生玉:採用一套標準的刺激,對個人的特質做客觀測量有系統程序。(1)標準的刺激(2)個人的特質(3)有系統的程序,指測驗標準化過程,包括在測驗實施方面,測驗情境的控制和安排,都必須達到指導手冊規定中的標準化要求;在計分方面不論誰來計分,所得分數應相同,如此分數才算客觀。
綜合以上,黃政昌將心理測驗定義為:「利用科學的方法將個人的特質測量出來,以區分個別差異,作最適當之心理與教育安置的一門學問。」
1.科學的方法:指具有系統性、客觀性、實徵性及驗證性的研究問題。
2.個人特質:指人的內隱特質,包括認知特質、情感特質等。
3.個別差異:包括個別間差異與個人內差異。
4.心理與教育安置:指心理測驗在不同情境中的利用。
二、相關名詞比較
教育測驗與心理測驗
教育單位經常使用「教育測驗」一詞,而臨床寶務中則較常使用「心理測驗 」一詞 ,其實兩者的測驗原理幾乎相同 而且重疊的部分也非常多、只是因為應用領域不同,因此強調的重點也不同而已。
心理計量學與心理測驗
心理計量學:心理計量學是一門理論測驗學,主要在探討心理測驗的理論原理,驗證測驗假定、發展測量與統計方法,因此具有數學或資訊背景的研究者更為適合。
心理測驗:心理測驗比較屬於應用測驗學,主要目的在於如何將測驗正確有效地運用在教育或臨床等相關單位。
心理評估與心理測驗
心理評估:心理評估強調透過各種資料,包括心理測驗、評估會談、行為觀察及各種檔案傳記資料等,綜合評估個體的心理狀態,以回答轉介者的問題 。
心理測驗:心理測驗只是心理評估過程中所採用的一種重要資料蒐集方法,因為這樣的方法符合科學研究的原理。
教育評量與心理測驗
教育評量:教育評量是透過各種考試、心理測驗、完成作品、學習表現及各種紀錄資料、以評量學生的學習能力高低或學習成果的優異程度。
心理測驗:心理測驗只是教育評量過程中所採用的一種重要資料蒐集方法,而且較偏向於成就測驗的性質。
測量、評量與診斷
測量:只依據客觀標準或量尺,以數量表示個人特質的歷程,屬於「有多少的問題?」例如:用智力測驗的結果顯示 IQ=130,這是「測量」。
評量:根據一項價值標準,對所測量到的數量做價值判斷,屬於「有多好的問題?」對於 IQ=130我們認為這樣的智商程度很高,這是「評量」。
診斷:根據一項分類標準,確認個體的特質狀態是否符合特定類別,屬於「是否的問題?」最後,我們根據身心障礙及資賦優異學生鑑定辦法,鑑定 IQ=130是屬於「一般智能優異」 類別的學生,這是「診斷」。
三、心理測驗的基本原理
心理測驗的原理就是:「為了解受測者的某項心理特質(如智カ),於是對受測者實施該項心理測驗(智力測驗,再根據受測者在心理測驗上(智力測驗)的得分高低與反應情形,來推論受擲音該項心理特質(智力) 的強度或性質。」
其中智力特質就是評估者真正要測量研究的母群。因為智力的概念型定義 ( conceptual definition ) 是指所有反應速度、學習能力及問題解決能力等,也就是一種構念與內隱的特質,因此無法直接觀察而得。
於是心理學家針對智力構念下了操作定義 (operational definition ) :根據可觀察、可測量或可操作的方法來界定智力,如定義智力為「智力測驗所測得的分數 」。此時智力測驗就是為了研究母群(智力):所抽樣 (sampling ) 而來的一種代表性樣本,它由具體可觀察測量的行為樣本 ( behavior sample) ,如題目 (item ) 或工作 ( task)所組成。
因此,受測者在智力測驗(樣本)的得分高低與反應情形 ,就可以用來推論 (inferencing ) 受測者的所有智力特質 (母群) 之強度或性質。
在推論統計學中,最重要的概念就是抽樣與推論,亦即研究者希望選取具有代表性的樣本,如此日後的研究結果才有信心推論回母群,而不至於出現過多的誤差。
同理,在心理測驗的原理中,智力測驗何以能夠成為一種具有代表性的樣本?智力測驗的結果如何有信心可以準確推論回智力母群?這就是心理測驗的基本原理所在。
如圖 3.1 中間上方所標示 智力測驗的題目是否具有鑑別力與適當難度(試題分析)、整份智力測驗是否具有穩定性、一致性 (信度)及有效預測效標 (效度) ‘ 這些就是智力測驗是否具有代表性的重要指標。
如圖中間下方所標示、受測者的智力測驗施測結果 ‘ 和所屬常模團體對照起來的能力高低為何(常模比較),或是自己的各項能力高低特色為何(分數解釋)這些就是智力測驗是否能有效推論受測者整體智力母群的重要資訊。
四、心理測驗的種類
(一)依測驗目的的區分
- 認知測驗:測量心理的能力,包括潛在能力與實際能力,前者如智力測驗與性向測驗,後者有如成就測驗。
- 智力測驗:用來測量個體基本的心智能力,包括語文抽象思考、推理、學習、環境適應、問題解決等多種能力。
- 神經心理測驗:用來測量診斷是否具有知覺動作協調障礙或腦傷行為的發生。
- 性向測驗:用來測量個人在心智活動中,表現於各種不同領域的潛在能力:並預測未來發展的可能性,如美術性向、音樂性向、科學性向、機械性向等。
- 成就測驗:用來測量經由學習或訓練所獲得的能力即評量過去學獨項目的精熟程度,如英文科成就測驗、數學科成就測驗及一般學枝的考試。
- 情意測驗:旨在測量個人的情感特質 是一種非能力測驗。 包括人格、興趣、態度、價值觀等測驗。
- 人格測驗:用來測量鑑別個體的獨特性格、氣質、情緒、動機、行為及適應功能等。常用方式包括自陳量表、投射技術、評定量表、社交計量法等。
- 興趣測驗:用來衡量個人對裝些事物或活動有所喜好。而主動接觸參與的積極心理傾向。如職業興趣量表與生涯興趣量表可以測量個人對於職業,學科般活動等內容的偏好程度。
(二)依測驗材料區分
語文測驗:以語言和文字為測驗的主要材料,評估者將語文刺激經由聽覺和視覺管道傳遞給受測者,再由受測者以語言或文字方式作pencil test。其中 ,全以文字為刺激和作答的測驗稱為「紙筆測驗」(paper and pencil test)
作業測驗:測驗內容以圖形、物體、方塊、迷津、拼圖與儀器等材料為主,再配合以動作或表達方式進行 。智力測驗與神經心理測驗屬於常見的作業測驗,適用對象為文盲、智能不足、年幼兒童及外國人等,因此較具有「文化公平性測驗 」(culture free test) 的條件,可作「跨文化比較」
(三)依測驗人數區分
個別測驗: 在同一時間內,只能有一個人實施的測驗優點為評估者可建立親善的施測關係,且可以做詳細的觀察與記錄; 缺點是需要專業人員施測,且較費時,因此多應用在臨床與個案研究上。
團體測驗: 在同一時間內,可以多人一同實施的測驗 。優點為可在短時間內獲得大量資料、經濟效益高;缺點為較無法建立親善的施測關係。且難以進行如個別測驗般的豐富臨床觀察 ,因此多應用在教育或人事單位中。
(四)依標準化程度區分
標準化測驗:由測驗專家根據測驗的標準程序新變且測驗的實施 ,計分與解釋都有一定的程序,必須依照指導手冊實施,同時測驗也都建立常模 信度和效度等資料。
非標準化測驗:通常由教師、諮商人員及臨床工作者根據需要而自編的測驗,因此沒有一定的實施程序,也沒有指導手冊、常模、信度和效度等資料,此種測驗是較主觀、個別化目的的運用。
(五)依測驗時限區分
速度測驗:主要在測量反應速度的快慢此種測驗題日難度低,但時間限制嚴格。在教育測量中,多數教學目標均重觀精熟學習,再重視速度。
難度測驗:旨在測驗問題解決的能力,大多數的成就測驗屬難度測驗,其目的在評量個人獲得知議與技能的程度,而非反應的快慢。
(六)依測驗的反應行區分
最大表現測驗(maximum performance test):其目的在測量個人能力的最佳反應或最大成就。在最大表現測驗的分數中,至少有先天能力、實際能力和動機等三項決定因素:智力測驗、性向測驗、成就測驗即為此種測驗。
典型表現測驗(typical performance test): 即在測量一般情境下,個人所表現的典型行為或態度,在測驗中,須假定受測者都很誠實回答問題,然而實際上卻常有偽飾做答的現象 , 故典型表現的測量較為困難。人格測驗、興趣測驗 、態度測驗與適應測驗等,即為測量受測者的典型行為。
(七)依分數的解釋區分
常模參照測驗:: 根據測驗的分數在團體中之相對位置來加以解釋的一種測驗 。此測驗的目的在區分受測者之間的成就水準例如校內各種考試、升學考試等均是常模參照測驗的應用。
標準參照測驗:根據測驗前所訂定的標準來解釋測驗之結果的一種測驗。 此測驗的目的是要了解受測者通不通過、及不及格。 而不是拿來和別人比較,例如各種檢定考試、證照考試等都是標準參照測驗的應用。
(八)依測驗的客觀程度區分
客觀測驗:客觀測驗具有明確的評分標準。例如:是非題、選擇題。
主觀測驗:主觀測驗通常沒有明確的評分標準,受試者作答的內容由不同人平分可能會有所差異。例如:問答題、申論題。
(九)依測驗的目的區分
形成性測驗:在教學過程中 ,教師為了瞭解學生學習情形,椅作為教學成效回饋或進行補救教學而採用內容簡短的、較不具考核原則性質的測驗。
總結性測驗:當教完一個進度,例如數個單元,為了瞭解學生學習成果,所實施內容較廣、題目較多、難度分布較大、具可考核性質的測驗。例如期中考、期末考。