第十章 智力與智力測驗
一、什么是測量
心理測量(psychological assessment)是用來檢測人們的能力、行為和個性特質(zhì)的特殊的測驗程序。心理測量通常是指對個體差異的測量。
1、測量的歷史
西方智力測驗發(fā)展中的關(guān)鍵人物是英國上層社會的弗朗西斯·高爾頓爵士(Sir Francis Galton)。
《遺傳的天才》測量的四個重要思想:第一,智力的差異可以根據(jù)智力的程度來度量。第二,智力的個性差異成鐘型曲線,或者稱做正態(tài)分布。第三,智力,或叫做心理能力,可以由客觀測驗測得,第四,兩套測試成績之間的相關(guān)程度可以由相關(guān)的統(tǒng)計分析來確定。
有爭議的思想:
* 天才或是出眾的人會出現(xiàn)在同一個家族內(nèi),教育對于智力只有很小的影響。
* 智力上與人的道德價值相關(guān)
2、正是測量的基本特點
正式測量(formal assessment)程序應(yīng)該滿足三方面的要求,即信度、效度和標準化。正式測量的程序適用于所有的心理測量。
(1)信度
信度(reliability)是指某一測量工具能夠得出一致分數(shù)的程度。
重測信度(tet-retest reliability):即對于同一個人、同一個測驗,在兩種情況下所測結(jié)果的相關(guān)程度。
變化了的平行信度(parallel forms):可以減少測驗的練習 效應(yīng)、對測驗問題的記憶,以及被試力求兩次測驗表現(xiàn)一致的愿望。
內(nèi)部一致性(internal consistency)檢驗,在可信度較好的測驗中,這兩部分的成績相當,這時可稱為內(nèi)部一致性較好,具有分半信度(split-half reliability)。
不僅測量工具本身要可信,運用工具的方法也要可信,主試必須學會以一種可信的方式,采用同一個區(qū)分系統(tǒng)來施測。
(2)效度
測驗的效度(validity)是指測驗?zāi)軌驕y得的它要測定的東西的程度。
有效性反映了測驗對行為或結(jié)果(與測驗?zāi)康幕蛟O(shè)計相關(guān))進行準確預測的能力。有三種重要的效度:表面效度、效標效度和結(jié)構(gòu)效度。
如果測驗項目看起來與感興趣的特性直接相關(guān),那么測驗具有表面效度(face validity)。表面效應(yīng)并不能保證測量的準確性。
效標效度(criterion validity,也稱為預測效度),將某一個人的測驗成績與他或她在其他標準(與測驗相關(guān))上的成績相比較。
一種測驗是否有效的條件是特定的,因此對一種測驗要考慮基于何種目的它是有效的。
信度是某一測驗與其自身的相關(guān)程度,而效度是測驗與外部的相關(guān)程度。不可信的測驗也沒有效度,很可能具有較高信度的測驗沒有效度。
(3)常模和標準化
說明你所得分數(shù)的意義,你會將你的成績統(tǒng)計常模(norm)做比較。通過查看測驗的常模,你會知道分數(shù)的大致范圍,以及在你的年齡和性別范圍內(nèi)的平均數(shù)是多少。這會有助于評價你在正態(tài)人群中的相對位置。常模使一個人的分數(shù)可以同與其年齡、性別和文化相當?shù)娜说钠骄窒啾取?/p>
標準化(standardiztion)是指在同一條件下對所有人、以同樣的方式實施測驗。
對任何測驗,你應(yīng)該根據(jù)測驗的信度和效度,操作的常模以及測驗環(huán)境的標準化程度等來評價測驗分數(shù)。
二、智力測量
1、智力測驗的起源
智力是一種一般的心理能力,與其他事物一樣,包含推理、計劃、問題解決、抽象思維、理解復雜思想、快速學習 和從經(jīng)驗中學習 等能力。
1905年,第一次出版了關(guān)于可實施的智力測驗的出版物。阿爾弗雷德·比奈(Llfred Binet)-西奧菲勒·西蒙(Theophile Simon)量表。
不同年齡的正常兒童的平均分數(shù)被計算出來,測驗的結(jié)果以達到某一特定分數(shù)的正常兒童的平均年齡來表示,這就稱之為心理年齡(mental age)。
比奈的方法有4個重要特點。首先,它將測驗的分數(shù)解釋為對當前操作的評估,而不是對天生智力的測量。第二,他想使測驗分數(shù)應(yīng)用于確認需要特殊幫助的孩子,而不是污蔑他們。第三,他強調(diào)訓練和機會可以影響智力,而且他也在尋找可以幫助弱勢兒童的方法。最后,他用經(jīng)驗編制他的測驗——他收集了數(shù)據(jù)看它是否有效——而不是試圖根據(jù)一種特定的智力理論來編制。
2、IQ測驗
有兩種個體施測的測驗至今還在廣泛應(yīng)用:斯坦福-比奈(Stanford-Binet)和韋克斯勒(Wechsler)測驗。
特曼1916年發(fā)表了比奈測驗的斯坦福版本被稱為斯坦福-比奈測驗,在特曼的新測驗中,他提供了智商的概念。
IQ=心理年齡&pide;生理年齡×100
當18歲以下的個體的有效IQ得分為70~75,或者更低,則他們被歸為心理遲滯(mental retardation)。被認為是心理遲滯的個體還必須在適應(yīng)性技能等方面表現(xiàn)出缺陷。
1939年發(fā)表了韋克斯勒-貝爾維尤智力測驗。
WAIS-R中有6個語詞分測驗:知識、語詞、領(lǐng)悟、計算、相似和數(shù)字廣度。這些測驗包括書面和口頭表達兩種。5個操作分測驗是對測驗材料的操作。
WAIS-R適于18歲及以上的人群。韋氏兒童智力測驗第三版(Wechsler Intelligence Scale for Children-Third Edition)適于6至17歲的兒童;韋入學前和初級智力量表修訂版(Wechsler Preschool and timay Scale of Inteligence-revises, WPPSI-R, Wecher,1989)適于4至6歲半的兒童。
在對同一被試的不同年齡進行施測時,韋克斯勒量表具有特別的價值。
三、智力理論
1、智力的心理測量學理論
心理測量學(psychometrics)是心理學的一個領(lǐng)域,主要是對心理能力進行全方位的測量,包括人格評定、智力評估和能力測量。
查理斯·斯皮爾曼(Charles Spearman)在智力領(lǐng)域中較早地應(yīng)用了因素分析,認為存在一般智力因素,或稱為g因素,這是所有智力操作的基礎(chǔ)(Spearman, 1927)。每個維度還與其特殊智力相關(guān)聯(lián),即斯皮爾曼定義的s。
雷蒙德·卡特爾將一般智力分為兩個相對獨立的成分,他稱之為晶態(tài)智力和液態(tài)智力。晶態(tài)智力(crystallized)包括一個人所獲得的知識以及獲得知識的能力,它由語詞、算術(shù)和一般知識測驗來測定。液態(tài)智力(fluid intelligence)是發(fā)現(xiàn)復雜關(guān)系和解決問題的能力,它由木塊圖、空間視覺等測驗來測定,在這些測驗中,所需要的背景信息是很明確的。
晶態(tài)智力使得人們很好地面對自己的生活和具體問題,而液態(tài)智力幫助你處理新的復雜的問題。
吉爾福德定義了智力任務(wù)的三個特性:內(nèi)容或信息類型、產(chǎn)品或信息表征的形式、操作或心理活動表現(xiàn)的類型。
這一模型中有5個內(nèi)容:視覺、聽覺、符號、語義和行為;6種產(chǎn)品:單元、分類、關(guān)系、系統(tǒng)、轉(zhuǎn)換和提示;5種操作:評價、聚合、發(fā)散、記憶和認知。每一智力任務(wù)都包含這三個維度,每一個內(nèi)容—產(chǎn)品—操作的結(jié)合,代表一個獨立的心理能力。吉爾福德的智力概念具有預測價值。
2、兩個超出IQ概念的理論。
(1)羅伯特·斯騰伯格(Robert Sternberg)提出了智力的三因素理論,認為智力包括三個部分——成分、經(jīng)驗和情境,它們都代表有效操作的不同方面。
成分性智力(componential intelligence)是指思維和問題解決等所依賴的心理過程。斯騰伯格認為,有三種成分對信息加工是至關(guān)重要的:(1)知識獲得成分,可以用于學習 新的事實;(2)操作成分,作為問題解決的策略和技巧;(3)元認知成分,用于選擇策略、監(jiān)控認知過程以達到成功。
經(jīng)驗智力(experiential intelligence)是指人們在兩種極端情況下處理問題的能力:新異的或常規(guī)的問題。
情境智力(contextual intelligence)反映在對日常事物的處理上。它包括對新的和不同環(huán)境的適應(yīng),選擇合適的環(huán)境以及有效地改變環(huán)境以適應(yīng)你的需要。情境智力有地被人們稱為小聰明(street smarts)或商業(yè)頭腦(business sense)。沒有較高IQ值的人,也可以具有較高的情境智力。
斯騰伯格的三因素智力理論認為,IQ測驗并不能涵蓋智力行為的全部內(nèi)容。
(2)加德納的8種智力
加德納確定了涵蓋人類經(jīng)驗范圍的許多智力。每一種能力依據(jù)某一社會對它的需要、獎賞以及它對社會的作用,在不同的人類社會中的價值也不同。歸納了8種智力。
加德納的8種智力
* 邏輯——數(shù)學
* 語言
* 功能主義
* 音樂
* 空間
* 身體運動
* 人際間(社交 )
* 內(nèi)心的(自知)
加德納的智力理論認為,應(yīng)該對個體在許多生活情境下的行為進行觀察和評價,并將傳統(tǒng)的智力測驗視為生活的一個很小的縮影。
情緒智力(emotional intelligence)可定義為4個主要成分。
* 準確和適當?shù)刂X、評價和表達情感的能力。
* 運用情感、促進思考的能力。
* 理解和分析情感、有效地運用情感知識的能力。
* 調(diào)節(jié)情緒,以促進情感和智力發(fā)展的能力。
EQ分——情商,對情感的理解是EQ的一種表現(xiàn)。
測定EQ:要求被試對一系列情感問題,提出解決辦法。
四、智力的政治
1、 組間比較的歷史
高達德幫助開創(chuàng)了宣稱一些有色人種先天低等的不幸傳統(tǒng)。
2、遺傳與IQ
某一特質(zhì)的遺傳性評價,是指基于這一特質(zhì)的得分可歸因于遺傳因素的變異比例。
遺傳性隨年齡而增長;在4~6歲時遺傳性為40%,到了成年為60%,到了老年為80%!
很可能基因的規(guī)劃使得環(huán)境促進了我們的基因特質(zhì),因而使遺傳性變大。
遺傳性是對于一個組內(nèi)的估計,它不能用于對組間比較的解釋,不論在客觀測驗中的組間差異有多大。遺傳估計只與給定的個體人群的平均值相關(guān)。即使有高的遺傳性估計,我們也不能確定與個體IQ或是組的IQ值相關(guān)的特定基因的貢獻。
一般來說,不同種族基因的組間差別,比同一組內(nèi)不同個體的基因差別要小。社會判斷并不依據(jù)生物的真實性,只是將皮膚顏色或血液作為種族融合的指標
母親對孩子智力的社會化貢獻大于父親。
3、環(huán)境與IQ
家庭的社會經(jīng)濟狀況和母親的教育水平。
富裕和貧窮能夠影響智力能力,其中對健康和教育資源的影響是最明顯的。孕期健康狀況不好和出生時低體重,對于孩子的心理能力低下是較強的預測因子。
單親家庭,會使他們沒有時間和精力陪孩子們玩,這會對標準IQ測驗中的操作造成負面影響。
生活在貧窮條件下的人們是受歧視的,這種社會恥辱會對個體的自我完善起負面影響。
造成IQ差異的并不是種族,而是在我們的社會和大多數(shù)國家中,與種族有關(guān)的經(jīng)濟、健康和教育資源。
IQ受環(huán)境影響;但豐富的環(huán)境要保持(美國領(lǐng)先計劃研究)。
4、文化與IQ測驗的有效性
對IQ測驗的一個普遍的考慮是,它們對不同文化的人們具有某些偏見。
這種IQ測量對于少數(shù)民族而言是無效而不公平的。但是,即使測驗?zāi)軌蜃龅礁鼮椤拔幕健保源嬖诜N族間的差別。
測驗中的成績受刻板印象威脅(stereotype threat,又稱為定勢攻擊,stereotype vulnerability)的影響,即某一組人冒著受負性定勢影響的威脅。在情境中受到刻板印象威脅影響的人表現(xiàn)會較差。
當黑人學生相信實驗成績可以用來檢驗他們的智力時,他們做得較差。
測驗的情境要比測驗的內(nèi)容存在更多的問題。重要的是測驗實施者如何定義情境。人們相信測驗可以測量智力時,定勢的知識才會影響表現(xiàn)成績。
五、創(chuàng)造力
創(chuàng)造力(creativity)是指就特定環(huán)境而言,個體產(chǎn)生新異的和合適的思想和產(chǎn)品的能力。
1、評價創(chuàng)造力及其與智力的關(guān)系
發(fā)散思維(pergent thinking),即對于一個問題可以產(chǎn)生許多不尋常的想法的能力。
發(fā)散思維測驗與IQ測驗的關(guān)系:相關(guān)性很小或中等;如高于120,則其相關(guān)程度下降。原因可能是一定水平的智力會使人有機會進行創(chuàng)造,但人們通常不利用他或她自己的這種機會。
當評判創(chuàng)造力的等級時,其一致性相當高,人們可以被可靠地確定為訓創(chuàng)造力者或低創(chuàng)造力者。
2、特殊創(chuàng)造力與瘋狂
霍華德·加德納創(chuàng)造力的人的生活肖像,他把她叫做E.C.:
E.C.發(fā)現(xiàn)她對某未知一領(lǐng)域的問題有特殊的興趣,這是一個極度興奮的時刻。在這一點上E.C.與她的同輩們無法交 流,她必須獨自工作。她感到自己正在突破的邊緣,雖然她對此還不甚了解。奇怪的是,在這個關(guān)鍵時刻,E.C.渴望認知和情感上的支持,從而使她可以保持她的方向。沒有這些支持,她可能會深刻地體會到某種形式的崩潰。
加德納暗指了一種非常普遍的對創(chuàng)造者的定勢:他們生活在瘋狂的邊緣,或包括對瘋狂的體驗。
個體會乘著癲狂的波浪進行大量的工作。如果這個人有一定的天賦,他的一些工作,并不是全部,就會很出色,但其比率并不比藝術(shù)家在其他時候創(chuàng)作的出色作品的比率更高。創(chuàng)造力和瘋狂之間的關(guān)系很小。
有關(guān)特殊創(chuàng)造力的敘述中學到冒險的模式,高創(chuàng)造力的個體愿意走入“未知的領(lǐng)域”準備模式;高創(chuàng)造力的人通常會在他們希望有所成就的領(lǐng)域中花費很多年來獲得專業(yè)知識內(nèi)在動機的模式;高創(chuàng)造力的個體從事他們的工作,是因為他們能從創(chuàng)造的事物中得到快樂和滿足。
六、測量與社會
爭論的焦點是三個與倫理有關(guān)的方面:
* 基于測驗的決定的公平性:對某些測驗者而言,其代價或負性后果要高于其他人。
* 測量用于教育評價的可行性:測驗不只是幫助評價學生,它在教育塑造上也起一定的作用。
以測驗分數(shù)進行個體分類的寓意:測驗結(jié)果作為不可改變的標簽的狀況。