四技二專跨類群考試公平性分析-以商業語文群
商業概論試題為例
商經科 劉孟珊
摘要
國內四技二專招生分發的主要依據為考生參加四技二專統一入學測驗所取得的成績,九十二學年度起首次推行跨類群考試的制度,使得考生有更寛廣而多元的選擇機會,而為了能夠使參加不同類組考試的考生能力能夠相互比較,以方便進行招生分發工作,用來相互比較的考試科目之試題設計便顯得十分重要,不能有差異試題功能存在。本文主要目的即以九十二學年度四技二專統一入學測驗中商業語文群之商業概論試題為例,進行DIF的檢測,以瞭解試題命題的良窳。結果顯示商業概論試題25題之中,僅有3個試題存在嚴重的DIF,難度差異值超過0.5以上,有2個試題的難度差異值約在0.4左右,其他則沒有顯著的DIF存在;此外,前述5個題目DIF的有利方向不一,造成試題存在DIF的原因,值得深入探討。。
關鍵字:四技二專統一入學測驗、跨類群考試、差異試題功能、Differential Item Functioning(DIF)
壹、 序言
國內四技二專招生考試的制度近年來有幾次重大的改革和轉變,過去傳統的聯合招生考試制度(即俗稱的聯考制度),已於八十九學年度實施最後一次考試之後,正式走入歷史,取而代之的是九十學年度正式實施的考招分離制度,將考試和招生分由不同的專責單位辦理,考生必須先報名參加統一入學測驗之後,以統一入學測驗所得之成績,作為各招生入學管道招生分發的依據(巫銘昌等,民91),其中統一入學測驗即由技專校院入學測驗中心統一辦理。
九十學年度開始的統一入學測驗制度中,考生並不能跨類群考試,每個考生只能夠挑選單一類組進行考試,並依據考試所得成績,做為選擇該類組內所包含科系志願、進行各招生分發管道的入學依據,這樣的規定窄化了考生的選擇,使得考生只能在眾多考試類組之間做抉擇,為了改善這樣的問題,於九十二學年度的統一入學測驗制度中,開放了考生可以跨類群考試的規定,使得考生可以有較寛廣的選擇機會。
舉例來說,就讀語文相關科系的考生,可以選擇單純報考語文類測驗,也可以選擇報考商業語文群的測驗,兩者很大的不同點在於如果只單純報考語文類測驗的話,其所得的測驗成績,只能參加語文類組內各科系的招生分發,但是如果報考商業語文群的測驗的話,則可視其成績較優異的部份,在商業類組或語文類組的招生分發中,選擇較利於自己的類群參加分發,如此一來就可以使考生的選擇機會更加多元。
就讀商業相關科系的考生也同樣可以參加上述的商業語文群考試,除了商業語文類的跨類群考試以外,九十二學年度也同步實施了其他跨類群考試的設計,包括電機電子群及家政美容群等,其中商業語文群更因為不同的組合而分為四類,合計參加跨類群考試的考生共有14,616人,佔總考生人數的6.8%左右(技專校院入學測驗中心,民92)。
在跨類群考試的設計當中,為了使參加跨類群考試的考生成績,能夠和僅參加單一類組考試考生的成績進行相互比較,以作為招生分發的依據,因此在考試科目的設計中,跨類群考試的科目較單一類組考試的科目要多,同時包含所跨類群的考試科目,為了能夠公平進行比較,考試科目的試題設計應該不能特別有利於其中一類考生,亦即不存在差異試題功能(Differential Item Functioning, DIF),這些試題設計的良窳與否影響了考試的公平性,有鑑於此,本文主要目的即以九十二學年度統一入學測驗商業語文類之商業概論試題為例,採用單參數IRT 模式,透過試題特徵曲線(Item-Characteristic curve, ICC)鑑別法進行DIF的檢驗,並進一步利用測驗相關軟體Acer Conquest(Wu, Adams, & Wilson, 1998)進行DIF的檢定,以瞭解商業概論試題的命題品質。
貳、 文獻探討
測驗理論領域的兩大主流論點包括古典測驗理論(Conventional test theory, 簡稱CTT)與試題反應理論(Item response theory, 簡稱IRT),兩理論最大差別在於CTT是以真分數模式做為理論架構,依據弱勢假設而來,而IRT則是依據強勢假設,將受試者的能力和實際得分情形,運用一個函數關係聯結在一起(楊明宗,民90)。IRT有幾項基本的假設,當這些基本假設都成立時,IRT模式才能夠被用來分析受試者的作答資料,這些主要的假設包括單向性(unidimensionality)和局部獨立性(local independence)。
所謂單向性是指測驗內容只測到一種特質或能力,以商業概論試題而言,其所有試題都應該只測量到有關商業概論的內容,也就是說考生答對與否,只和他對於商業概論內容熟悉與否有關,而無關於其他如數學或語文的能力;其次,局部獨立性乃是指受試者答對試題與否只和受試者的能力有關,而無關於其他試題的答對與否,亦即對受試者而言,他能夠答對商業概論試題中某一題的機率高低,只受到他的能力所影響,而不會受到他是否答對其他試題而影響。
基於前述單向性及局部獨立性等兩項假定之下,對於兩個來自不同群體的考生而言,如果兩人的能力相當,則他們對於同一個試題的答對機率應該相同,倘若兩人的答題機率不同的時候,則出現了差異試題功能(differential item functioning, DIF),簡言之,也就是說對各團體中能力相同的人,其試題通過率(答對率)並不相同(王文中、陳雪珠,民88),如此即產生了不公平的現象,如何找出能力因素以外,對於試題通過率的影響因素(例如種族、性別等),使試題對所有團體的受試者而言都是公平的,是測驗編製過程中極為重要的一個環節,也影響著試題編製的良窳。
IRT特點之一在於它係以概率來表示受試能力與項目之間的關係(王寶墉,民84),因此,可以利用受試者能力和題目難度建立一個機率函數,稱為項目反應函數,將該函數繪製在平面座標圖上時,即可得到試題特徵曲線(Item Characteristic Curve)。對兩個受試者能力相當的團體而言,其回答同一個試題的通過機率應該相當,則所繪製出來的ICC曲線也應該會重合,即沒有存在DIF(如圖一),但當兩曲線沒有重合時,則顯示該題目存在DIF(如圖二),兩曲線差距愈大時,表示DIF愈嚴重,亦即對這兩個能力相當的群體而言,因為受到能力以外的其他因素所影響,導致試題存在差異功能,使他們答對題目的機率產生差異。
| |
圖一 沒有DIF存在的ICC曲線圖 | 圖二 有DIF存在的ICC曲線圖 |
綜合上述發現,利用兩群體的答題ICC曲線相比較,即可知道試題是否存在DIF,此外,試題分析軟體Acer Conquest(Wu, Adams, & Wilson, 1998)也可以針對DIF進行分析,本文即旨在利用前述兩個方法,以九十二學年度四技二專統一入學測驗之商業概論試題為例,採取單參數IRT模式進行DIF分析,以瞭解該試題編製的良窳,並檢討跨類群考試制度的公平性。
參、 研究方法
資料介紹與抽樣
本研究旨在以九十二學年度四技二專統一入學測驗之商業概論試題為例,進行DIF的檢定,以瞭解該科目試題之編製狀況。研究資料為九十二學年度四技統一入學測驗商業類及語文類(英文組及日文組)考生之答題反應,該資料乃獲得技專校院入學測驗中心同意所取得,詳細報考人數及抽樣結果整理如表一所示。
在資料整理及抽樣過程中,首先就各類考生之全部答題資料進行檢視,並將缺考之考生資料剔除後,得到可利用資料筆數合計共66,698筆,分別針對各類群進行隨機抽樣,商業類抽出500名考生資料,語文類合計抽出500名考生資料(其中英文組及日文組各抽出250名),合計共得到1,000名考生資料,做為本研究分析之用。
表一 研究資料抽樣一覽表
報考類別 | 報考人數 | 扣除缺考後人數 | 抽樣人數 | 合計人數 | 組別 |
13 商業類 | 66,074 | 62,244 | 500 | 500 | 商業類(group 1) |
19 語文類(英文) | 4,074 | 3,558 | 250 | 500 | 語文類(group 2) |
20 語文類(日文) | 1,007 | 896 | 250 | ||
合計 | 71,155 | 66,698 | 1,000 | 1,000 |
|
資料分析方法
如前所述,檢視試題是否存在DIF的方式很多,本文除了採用試題特徵曲線檢驗法以外,並進一步利用Acer Conquest(Wu, Adams, & Wilson, 1998)軟體直接針對商業概論之25題試題進行DIF檢定,以瞭解商業概論試題是否存在DIF功能。
肆、 結果與討論
為了跨類群考試比較的公平性而言,試題的編製應該要能夠不存在DIF為佳,亦即對不同群體中能力相當的人而言,對於試題的通過率應該一致,則試題的編製優良。以下即就本研究所採用之兩種DIF檢定方法之結果詳細說明如下。
運用ICC曲線判別試題差異功能(DIF)之結果
就兩個能力相當的群體而言,其回答同一份試題的通過率應該相當,且繪製出來的ICC曲線應該能夠重合,亦即當沒有DIF存在時,ICC曲線應該能夠非常接近,甚至能夠完全重合,但事實上要能夠達到每個試題的ICC曲線均能夠完全重合並不容易,本研究將商業類及語文類兩團體考生在商業概論25題試題的答題反應繪製成ICC曲線,其中藍色實線代表商業類考生之ICC曲線,紅色虛線則代表語文類考生的ICC曲線。
其次,當DIF存在時,ICC曲線位於上方者,表示就同一試題、同一能力者而言,其通過(答對)該試題的機率較高,亦即表示該題對其較為有利,在本研究中,因為藍色實線代表商業類考生的ICC曲線,紅色虛線則代表語文類考生曲線,因此,若藍色實線位於紅色虛線上方,則表示該題對商業類考生較為有利,反之,若紅色虛線位於藍色實線上方,則表示該題對語文類考生較為有利。
以下將商業概論試題25題的ICC曲線圖,概略分為沒有DIF存在與有DIF存在等兩大類進行說明。
(一) 沒有DIF存在
當ICC曲線完全重合或幾乎重合時,即表示沒有DIF存在,就商業概論試題25題的ICC曲線來看,可以發現共有五個題目幾乎沒有存在DIF,包括第3、13、20、21及25題等,詳細如圖三至圖七所示。
| |
圖六 第21題的ICC曲線 | 圖七 第25題的ICC曲線 |
有DIF存在
當ICC曲線不重合時,表示試題存在DIF,在本研究中,存在DIF的試題有20題,其DIF嚴重程式不一,其中DIF輕微者包括11題,而有9題試題存在嚴重DIF。
當存在嚴重的DIF時,即表示兩團體的ICC曲線差距甚大,本研究中總共有9題試題存在嚴重DIF,包括第2、6、7、14、16、17、18、19及22題等,詳見圖八至圖十六,其中第7、14、17及18等四題,對商業類考生較為有利,其他則對語文類考生較為有利。
|
| ||
圖九 第6題的ICC曲線 | 圖十 第7題的ICC曲線 |
| |
|
|
| |
圖十一 第14題的ICC曲線 | 圖十二 第16題的ICC曲線 |
| |
|
|
| |
圖十三 第17題的ICC曲線 | 圖十四 第18題的ICC曲線 |
| |
| |||
圖十五 第19題的ICC曲線 | 圖十六 第22題的ICC曲線 | ||
從前述利用ICC曲線進行判別的結果來看,商業概論25題試題當中,除了5題不存在DIF的試題外,其餘20題或多或少存在輕微或嚴重的DIF現象,其中約有10題對商業類考生較為有利,另外約有10題對語文類考生較為有利,從題數上來看有利方向的不同,似乎平衡所有試題所造成的DIF,整份試題對兩團體考生而言,不致於有太大的DIF存在。
運用Acer ConQuest進行試題差異功能(DIF)分析之結果
前述運用ICC曲線所進行的DIF分析方式,主要乃利用受試者能力和試題難度彼此之間的關係建立機率函數,並繪製成ICC曲線圖,依據兩團體的ICC曲線重合或分離程度進行判別,DIF的嚴重與否程度端賴研究者自己目測歸類之,並無法有絕對的依據說明DIF的嚴重情形,Acer ConQuest(Wu, Adams, & Wilson, 1998) 軟體提供了一項有力的功能,可用以直接檢測試題是否存在DIF,有鑑於此,本研究更進一步利用測驗軟體Acer ConQuest(Wu, Adams, & Wilson, 1998)進行試題DIF的檢測。
研究結果整理如表二。依據美國教育測驗服務社(Educational Testing Service, ETS)對於DIF效果的解釋,將DIF效果區分為A、B、C三個等級,將其換算為logit尺度而言,則相當於若難度差異值低於0.4 logits以下的試題,歸屬於A類,即表示幾乎沒有DIF存在,若難度差異值超過0.6 logits的試題,則屬於C類,有DIF效果存在,其餘則歸類為B類(王文中、陳雪珠,民88)。
依據前述指標,結果顯示商業概論試題中,所有的題項幾乎都不存在DIF效果,僅有5個題項存在DIF效果,其中有4個題項難度差異值界於0.4-0.6個logits之間,存在輕微的DIF效果,只有1個題項存在嚴重的DIF現象,難度差異值為0.778個logits。此外,就整份試卷的DIF狀況進行卡方檢定結果達到顯著差異(Chi-square =111.333 ,Sig. Level = .000),顯示整份試卷存在DIF。
就存在輕微DIF的4個題項來看,其中有3個題項對語文類考生有利,而只有1個題項對商業類考生有利;但就存在嚴重DIF的1個題項來看,其難度差異值高達0.778個logits,對商業類考生顯著有利,整體而言存在DIF的題項應對商業類考生較為有利。
表二 九十二學年度四技統一入學測驗商業概論試題DIF檢定結果
試題 | 總難度 | DIF參數 | 卡方值 | p值 | 有利 方向 | 嚴重 程度 | ||||
商業類考生 | 語文類考生 | |||||||||
1 | -2.047 | (0.109) | -0.061 | (0.107) | 0.061** |
|
|
| --- |
|
2 | -1.687 | (0.096) | 0.256 | (0.095) | -0.256** |
|
|
| 語文類 | 輕微 |
3 | 3.098 | (0.124) | -0.031 | (0.119) | 0.031** |
|
|
| --- |
|
4 | -1.465 | (0.088) | .065 | (0.088) | -.065** |
|
|
| --- |
|
5 | -0.187 | (0.068) | 0.086 | (0.068) | -0.086** |
|
|
| --- |
|
6 | 0.896 | (0.068) | 0.275 | (0.068) | -0.275** |
|
|
| 語文類 | 輕微 |
7 | -1.528 | (0.093) | -0.389 | (0.093) | 0.389** |
|
|
| 商業類 | 嚴重 |
8 | -2.135 | (0.113) | -0.146 | (0.112) | 0.146** |
|
|
| --- |
|
9 | 1.647 | (0.076) | 0.094 | (0.076) | -0.094** |
|
|
| --- |
|
10 | 0.456 | (0.066) | -0.068 | (0.066) | 0.068** |
|
|
| --- |
|
11 | -0.680 | (0.073) | 0.072 | (0.073) | -0.072** |
|
|
| --- |
|
12 | -0.254 | (0.069) | -0.075 | (0.068) | 0.075** |
|
|
| --- |
|
13 | 0.077 | (0.067) | -0.028 | (0.066) | 0.028** |
|
|
| --- |
|
14 | 0.574 | (0.067) | -0.175 | (0.066) | 0.175** |
|
|
| --- |
|
15 | 1.261 | (0.071) | -0.115 | (0.071) | 0.115** |
|
|
| --- |
|
16 | -0.710 | (0.073) | 0.211 | (0.073) | -0.211** |
|
|
| 語文類 | 輕微 |
17 | 0.079 | (0.067) | -0.214 | (0.067) | 0.214** |
|
|
| 商業類 | 輕微 |
18 | 0.816 | (0.068) | -0.195 | (0.067) | 0.195** |
|
|
| --- |
|
19 | 0.990 | (0.068) | 0.195 | (0.068) | -0.195** |
|
|
| --- |
|
20 | 1.690 | (0.076) | 0.030 | (0.076) | -0.030** |
|
|
| --- |
|
21 | 0.036 | (0.067) | 0.023 | (0.066) | -0.023** |
|
|
| --- |
|
22 | 0.446 | (0.066) | 0.184 | (0.066) | -0.184** |
|
|
| --- |
|
23 | -1.732 | (0.097) | 0.166 | (0.096) | -0.166** |
|
|
| --- |
|
24 | -0.157 | (0.068) | -0.152 | (0.068) | 0.152** |
|
|
| --- |
|
25 | 0.516** |
| -0.006** |
| 0.006** |
|
|
| --- |
|
Chi-square =111.333 df = 24 Sig. Level = .000 *括號內為標準誤。 **此行數字因為被限制住,而非估計算得,因此沒有標準誤。 |
深入針對存在DIF現象的五個題項(第2、6、7、16、17題)進行分析,可以發現第2、6、7題等三個題項的內容較偏向於商業經營、商業現代化的單元,而第16、17題兩個題項則較偏向於人力資源管理的單元,推論造成商業概論試題對商業群考生及語文群考生存在DIF的主要因素,有可能因為除了正式的商業概論課程教學的時間以外,商業類群考生平日所接觸有關商業領域知識範疇的機會,遠較語文類群考生為多。
此外,因為新課程標準中,開放有38-50學分可供學校彈性訂定的校訂科目學分(教育部,民87),讓學校可針對各科特性酌開相關課程供學生選修,在此情況之下,商業類群考生除了商業概論課程以外,在其他相關專業課程中(例如商業經營實務、人力資源管理、行銷管理、商業現代化等),也較語文類學生有更多機會可以接觸到與商業概論相關之內容。
伍、 結語
一份好的試卷,應該對能力相同的不同群體具有相同的通過機率,亦即不應該存在DIF現象。技專入學統一測驗的結果影響了數十萬考生的前途,倘若試題編製過程中存在DIF,則對考生造成了不公平的影響,因此在編題時不可不慎。
本研究僅以商業語文類群專業一中的商業概論試題為例,進行DIF的檢測,至於計算機概論的試題,以及其他如電機電子群及家政美容群的考試科目是否也存在DIF現象,值得其他研究者進一步深入探討。
參考文獻
王文中、陳雪珠(民88)。教學觀點量表之發展與試題反應分析。應用心理研究,2,頁181-207。
王寶墉(民84)。現代測驗理論。台北:心理出版社。
巫銘昌等(民92)。統一入學考試之實施對高職教學互動的影響研究。技專校院入學測驗中心委託研究案。
技專校院入學測驗中心(民92)。九十二學年度四技二專統一入學測驗各類別(或群組)報考人數。民國92年12月30日,取自技專校院入學測驗中心網頁:http://www.tcte.edu.tw/four/majtype92.html。
教育部(民87)。商業職業學校不動產事務科課程標準暨設備標準。台北:教育部。
教育部(民87)。商業職業學校文書事務科課程標準暨設備標準。台北:教育部。
教育部(民87)。商業職業學校商業經營科課程標準暨設備標準。台北:教育部。
教育部(民87)。商業職業學校國際貿易科課程標準暨設備標準。台北:教育部。
教育部(民87)。商業職業學校會計事務科課程標準暨設備標準。台北:教育部。
教育部(民87)。商業職業學校資料處理科課程標準暨設備標準。台北:教育部。
教育部(民87)。商業職業學校餐飲管理科課程標準暨設備標準。台北:教育部。
教育部(民87)。商業職業學校應用外語科(日文組)課程標準暨設備標準。台北:教育部。
教育部(民87)。商業職業學校應用外語科(英文組)課程標準暨設備標準。台北:教育部。
教育部(民87)。商業職業學校觀光事業科課程標準暨設備標準。台北:教育部。
楊明宗(民90)。IRT模式之假設及其檢定。測驗統計簡訊,42,頁15-23。
Wu, M., Adams, R. J., & Wilson, M. R. (1998). ACER ConQuest.
附錄:運用Acer ConQuest進行相關分析之程式語法
|