公务员面试考官评分策略研究_新闻中心_乐鱼官网登录页面-乐鱼官网app登录入口

公务员面试考官评分策略研究

发布时间：2024-10-18 02:15:38 作者: 乐鱼官网

公务员面试考官评分策略研究

[摘要]公务员面试考官评分是影响公录用的主要的因素，考官评分策略的形成与组合决定了考官评分决策。考官评分策略是多种评分心理行为基础上形成的多种评分方式的组合，实证研究表明公务员面试中考官使用了11种评分方式，形成“锚定策略”、“匹配策略”和“调整策略”3种评分策略。面试中不同考官对同一考生评分时采用的评分策略组合存在一定的差异、同一考官对不同考生评分时采用了不同的评分策略组合，这些评分策略组合具有多样性、差异性和政治性。本文揭示了公务员面试考官评分策略的内在属性，归纳和提炼了公务员面试考官评分的规律和特殊性，为提高公务员面试考官评分信度和效度的理论研究和实践探讨提供了良好基础。

国内外对考官评分的研究主要集中于考官评分心理行为与评分方式两个角度， [1][2]研究表明面试考官存在特定的评分心理行为和评分方式。那么，公务员面试中考官存在怎样的评分心理行为?这些评分心理行为表现出什么样的评分方式?这些评分方式是如何组合的?这种组合呈现出什么样的特点?对面试评分决策有什么影响?对这些问题的探讨可以帮助我们认识分数背后的考官评分心理行为 [3]、解释考官评分差异形成的原因，为公务员考官的选拔和培训提供相关依据，提高公务员面试的效度，确保公务员面试录用的公平性和科学性。

经过梳理，本文将考官评分心理行为归纳为6种类型，形成6种不同的评分方式。

第一类表现为考官将面试中被测者的个人特质和自己内心的理想原型作比较的过程。研究表明考官内心存在理想原型, [4]理想原型表现为考官心中目标岗位理想人选所具备的系列特质, [5]有些考官对不同职组使用了不同的理想原型， [6]有些考官对不同职组使用了相同的理想原型。[7]考官评分时，被测者的表现越接近于理想原型，面试评分越高，反之越低。

第二类是考官将被测者反映出来的个体特质与岗位所需个体特质作比较的过程。岗位所需个体特质分为大众标准和特殊标准两种类型，大众标准指的是不同组织都普遍接受的个人特质，特殊标准指的是某个组织或职位所需的个人特质。[8]面试中，考官评分方式表现为考官以大众标准和特殊标准为参照给被测者打分，被测者个人特征与岗位所需个人特征的匹配程度越高，考官评分越高，反之越低。[9]

第三类是考官在预设的“评分区间”内，根据被测者的表现判断其所属区间值的过程。考官评分行为表现为考官内心预设“什么样的表现给多少分”的“评分区间”， [10]并根据面试刚开始形成的第一印象确定一个分数，[11]形成“基准值”。随着面试的推进，考官根据考生回答的内容对“基准值”做调整，[12]一直调整到考官认为给出了合适的分数。

第四类是考官在评分过程中对被测者外貌、语言或非语言行为进行观测的过程。在评分过程中，考官根据岗位性质确定观测内容。如果目标岗位是对外接触频率比较低的岗位，考官评分时更关注被测者的语言内容而不是外貌和非语言行为。[13]对于考官认为外貌与绩效相关度高的岗位，考官评分时更多考虑外貌和非语言行为。[14]因此，考官的评分方式是根据岗位性质关注被测者的外貌、语言或非语言行为的某个方面来确定分数。

第五类是考官将被测者特质与自身特质相比较，判断二者间相似程度的过程。这种相似可以是考官与被测者在性别、种族等人口统计学特征方面的相似，也可以是人格、态度、价值观和动机方面的相似。[15]虽然考官与被测者的相似性可能不是工作所需的知识和能力，[16]但考官倾向于给与自己某些个人特征相似程度高的考生更高的评价。[17]

第六类是考官将被测者与其他被测者作比较的过程。在面试中，考官倾向于给第一个被测者“中庸”的分数，[18]将被测试者和前面的被测试者作比较，分析他们之间的能力差异，给出该被测试者的评分。因此，考官评分方式表现为考官在评分时往往以第一位被测者的表现为参照点，再将后续被测者的表现与它对比后进行评分决策。[19]

从目前已有文献来看，研究者对考官评分中有几率存在的心理行为进行了较为全面的探讨，对每类评分心理行为形成的具体评分方式来进行了分析，并在此基础上构建了考官评分方式的部分测量量表，为进一步研究考官评分决策奠定了良好的基础。

考官评分决策是由多种评分心理行为产生的评分方式相互作用而形成的最终结果。[20]考官是如何将单个评分方式组合起来形成最终决策的呢?现有研究多关注单个维度的评分心理和评分方式，对这些评分方式在面试中具体如何组合以形成最终评分决策的研究尚不足。为了回答这样的一个问题，我们将多种考官评分心理行为和评分方式纳入同一个分析框架，将考官评分策略界定为多种评分心理行为基础上形成的多种评分方式的组合。

国外开发的考官评分方式测量工具适合被测者人数比较少的情况，[21] [22]也没有体现公务员面试考官评分策略的特殊性。因此，直接将若干考官评分方式测量工具组合起来用于测量公务员考官评分策略是不合适的，考官评分策略的测量方法还需要改进。

综上所述，考官的评分策略是一个多维的概念，考官评分策略研究应该将考官多种评分心理行为和评分方式纳入同一个分析框架，以便更加全面体现考官评分策略的内容。同时，公务员面试考官的评分策略不同于其他面试考官评分策略，这就需要开发公务员面试考官评分策略问卷，以便更加准确体现公务员面试考官评分策略的特殊性。

本次访谈以湖北省公务员面试考官为对象，采用半结构化方式来进行，访谈的目的是通过访谈归纳和提炼考官在面试中可能采用的评分方式。遵循关键行为事件访谈的程序，访谈从开放式问题“谈谈你在面试过程中印象最深的考生”开始，要求被访谈者讲述这个考生的面试过程、被访谈者在面试过程中的心理过程、被访谈者评分情况并给出评分的理由、其他考官评分的情况、可能会影响考生面试分数的因素等。对于被访谈者没有明确回答的内容，访谈者做补充提问，一直到问题全部回答完毕。

湖北省公务员面试考官主要由政府部门处级以上干部和高校高级职称教师构成，因此访谈选取了5名曾经多次担任公务员面试考官的高校教师和5名曾经多次担任公务员面试考官的湖北省公务员局处级以上干部，全部访谈过程录音并转化为文字资料，共获得文字约8万字。

由两名人力资源管理专业的博士和三名硕士对记录的文字资料做编码分析，保证每个编码只有一个涵义、语意清晰、归类明确。首先对文字资料内容做归类，获得8个类别。再将每个类别中的文字资料编码，删除明显不属于考官评分策略的编码，对于不同语言表达同一个意思的语句进行合并后，共获得85个编码。删除语意模糊、归类不明确的编码，共获得78个编码。最后，将所有编码按类别汇总，用陈述语句表达出来，最后共获得17个陈述语句。

编码和归类完毕后，请被访谈者对陈述语句的适合程度进行判断。首先请他们对语句表达的意思是否清晰进行判断，然后由编码者告诉被访谈者每个陈述语句编写的目的是什么，询问被访谈者这些陈述语句是否与现实情况相符。经过多次讨论和修订，最后筛选出17个陈述语句。

将最后筛选出的陈述语句设计成问卷，命名为公务员考官评分策略问卷。问卷共分为两个部分：第一个部分是个人基础信息，包括性别、年龄、工作单位性质、担任考官次数等。第二部分是考官评分策略，共17个题项。所有题项采用李克特5点计分法。“1”表示“完全不赞同”，“2”表示“不太赞同”，“3”表示“一般”，“4”表示“比较赞同”，“5”表示“完全赞同”。

本次调研以湖北省公务员面试考官为样本，利用2014年6月和2015年7月湖北省公中考官休息时间发放问卷，并现场收回。2014年6月发放问卷494份，回收354份，回收率为71.7%。剔除评分策略部分填写无效的问卷后共计278份，占回收问卷的78.5%。2015年7月共发放问卷210份，回收210份，回收率为100%，剔除评分策略部分填写无效的问卷后共计204份，占回收问卷的97.1%。两次调研共获得482份问卷，样本分布情况见表1。

将2015年的208份问卷命名为样本1，将2014年的问卷命名为样本2。探索性因子分析要求问卷题项与样本数量之比达到1：5以上，样本数量至少为100。验证性因子分析要求观察变量与样本数量之比达到1：15，样本数量最好达到200以上。本次调研的问卷共有17个题项，验证性因子分析的样本数量大于255比较理想。因此，本文将样本1用于探索性因子分析、样本2用于验证性因子分析，这样能同时满足探索性因子分析和验证性因子分析的要求。

主成分因子分析法常用来对问卷的结构效度进行检测验证。先用全部题项进行主成分因子分析，得到KMO=0.813(p0.01)，说明题项之间的关系适合进行因子分析。我们利用最大方差法提取主成分，保留因素负荷大于0.45的题项并且删除多个因子上的因素负荷大于0.45的题项，按照特征值大于1提取公因子，经过反复正交旋转，结果显示6个题项应该被删除，它们是“外貌评分有影响”、“考生的政治激情对评分有影响”、“考生的语言表达对评分有影响”、“在面试中，我结合评分区间和考生表现打分”、“我参考前一个考生给后一个考生打分”和“相对岗位能力，考生的政治素质更重要”。删除这6个题项后，量表的KMO=0.784(p0.01)，说明问卷的共同因素会降低但仍然适合进行因子分析。按照特征值大于1提取公因子，结果显示应该提取3个公因子，3个公因子的累计方差贡献率为55.4%，说明3个共同因素可以解释问卷全部题项55.4%的变异量，问卷拥有非常良好的构建效度。

根据研究目标和各因子所包括题项的涵义进行抽象和概括，将考官评分策略提炼和细分为“锚定策略”、“调整策略”和“匹配策略”三个维度，详细的细节内容见表2。

S3 当考生出现与自己相似的想法和价值取向时，我会对其产生认同感，分数有所提高。 0.787

S4 当考生的想法或价值取向与自己不相符时，我不自觉降低其分数。 0.64

S5 我熟悉应聘岗位，考生表现与岗位要求的符合程度影响我的评分。 0.634

S6 面试中，其他考官与我之间打分差异比较大时，我会改变我心里的评分区间。 0.795

因子1包含S1、S2、S3、S4和S5共5个题项，表示考官通过你自己的经验和偏好形成评分区间，考官根据考生的政治素质、考生与考官的相似度、考生表现与应聘岗位的差距确定该区间内的实际得分，我们将其命名为“锚定策略”。因子2包括S6、S7和S8，说明其他考官评分情况、考生的面试表现和考生的外貌会改变考官原有的评分区间，我们将其命名为“调整策略”。因子3包括S9、S10、S11共3个题项，表示考官对不太熟悉的岗位采用了大众标准并结合参进行评分，考生的分数取决于考生与大众标准和参的相符程度，我们将其命名为“匹配策略”。

我们利用Amos7.0软件进行一阶验证性因子分析和二阶验证性因子分析，运行结果见表3。一阶验证性因子分析的p(x2/df)0.5，GFI0.9，PFI0.5，RFI0.9，TLI0.9，PGFI0.5，RMSEA=0，ECVI=0.234。二阶验证性因子分析的拟合指数与一阶验证性因子分析的拟合指数相同，说明三个公因子在二阶上可以聚合为一个高阶因子，拟合度和稳定能力较高，我们将其命名为考官评分策略。其中，“锚定策略”的标准化系数为0.791，“调整策略”的标准化系数为0.984，“匹配策略”的标准化系数为0.791，标准化路径系数在0.05水平下显著，说明“锚定策略”、“调整策略”和“匹配策略”能够反映考官评分策略的内容。

探索性因子分析和验证性因子分析根据结果得出考官在评分中组合使用了“锚定策略”、“调整策略”和“匹配策略”三种评分策略。全部研究样本显示(见表4)，“锚定策略”均值最高，其次是“匹配策略”，最后是“调整策略”，说明考官评分中更倾向于使用“锚定策略”。独立样本t检验发现，2014年和2015年考官的“锚定策略”和“调整策略”评分策略没有显著差异，而“匹配策略”有显著差异，说明考官的“锚定策略”和“调整策略”是较为稳定的，而“匹配策略”是不稳定的。

虽然公务员面试中考官同时使用了三种评分策略，但是三种策略的具体组合存在一定的差异。以“锚定策略”和“匹配策略”为例，考官对这两种评分策略的使用情况可大致分为高“锚定策略”组、低“锚定策略”组、高“匹配策略”组和低“匹配策略”组四种类型。研究表明(表5)，34.9%的考官采取了高“锚定策略”、高“匹配策略”的组合方式，22.6%的考官采取了低“锚定策略”、高“匹配策略”的组合方式，12.5%的考官采取了高“锚定策略”、低“匹配策略”的组合方式，30%的考官采取了低“锚定策略”、低“匹配策略”的组合方式，说明考官虽然整体上更倾向于使用“锚定策略”和“匹配策略”，但考官之间的评分策略组合方式存在一定的差异。

说明：高“锚定策略”组中，考官选择“锚定策略”的分值高于该策略均值，反之则是低“锚定策略”组。高“锚定策略”组中，考官选择“锚定策略”的分值高于该策略均值，反之则是低“锚定策略”组。

在每种评分策略内部，考官之间的评分方式组合存在差异，我们用考官对每种评分方式的使用情况来表示(见表6)。例如，“锚定策略”包括5种评分方式，90.4%的考官比较赞同和完全赞同“我心中有一个大致的评分区间”，还有9.6%的考官持不太赞同态度。28.4%的考官比较赞同和完全赞同“当考生的想法或价值取向与自己不相符时，我不自觉降低其分数”，还有72.6%的考官持不太赞同或完全不赞同态度。整体而言，考官最倾向于使用的评分方式是“我心中有一个大致的评分区间”，最不倾向于使用的评分方式是“当考生的想法或价值取向与自己不相符时，我不自觉降低其分数”。因此，对于“锚定策略”而言，所有考官都使用了5种评分方式，但考官对5种评分方式的使用情况是不同的，考官之间的评分方式组合存在差异。

S3 当考生出现与自己相似的想法和价值取向时，我会对其产生认同感，分数有所提高。 48.3%

S4 当考生的想法或价值取向与自己不相符时，我不自觉降低其分数。 28.4%

S5 我熟悉应聘岗位，考生表现与岗位要求的符合程度影响我的评分。 28.4%

“调整策略”研究显示，面试中考官受到考生外貌、考生在面试中的实际表现以及其他考官的影响会调整自己的评分区间。21.1%的考官比较赞同或完全赞同“其他考官与我之间评分差异太大时，我会改变我心里的评分区间”，在公务员面试中考官会把自己的评分与其他考官的评分作比较，根据评分的整体情况调整自己的评分区间，表现为评分普遍比较低的考官会提高分数，评分普遍比较高的考官会降低分数。22.8%的考官比较赞同和完全赞同“当考生回答的内容与标准答案差异比较大时，我会给同情分”，说明这部分考官对能力比较差的考生的评分高于实际应得分数，考官根据考生的表现对自己的评分区间进行了调整。70.5%的考官认为面试过程中外貌影响评分，但随面试过程的推进，外貌的影响减弱，考官根据考生的外貌使用不相同的评分区间。因此，由于受到考生外貌、考生在面试中的实际表现以及其他考官的影响，“调整策略”中评分区间产生一些变化，同一考官对不同考生进行评价时，考官利用不一样评分区间的“调整策略”结合“锚定策略”和“匹配策略”组合形成差异化的评分策略。

公务员面试考官评分策略问卷的题项内容表明公务员面试考官的评分策略具有政治性。84.6%的考官比较认同或完全认同“政治素质影响评分”，59.2%的考官比较赞同或完全赞同“考生的面试表现与应聘岗位相符程度影响评分”，65.2%的考官比较赞同或完全赞同“使用大众对公务员的一般素质要求对考生进行评分”。公务员岗位明白准确地提出了对任职人员的政治素质要求，大众对公务员的一般素质要求也有政治素质方面的要求，说明考官评分关注考生的政治性特质。因此，公务员面试考官评分策略具有政治性，这是公务员面试考官区别于其他面试考官的突出特点。

本研究以湖北省2014年和2015年公务员面试考官为样本，运用探索性因子分析和验证性因子进行实证研究，发现考官在面试中使用了11种评分方式，形成3种评分策略，分别为“锚定策略”、“匹配策略”和“调整策略”。由于受考生实际表现和其他考官评分情况的影响，部分考官会调整内心的评分区间，对同组考生使用不相同的评分策略。公务员面试考官评分策略中政治性特色突出，表现为考官在评分过程中普遍关注考生的政治素质。

本文的研究做出了两个方面的贡献。理论方面，本文将考官评分方式扩展为多维的考官评分策略，概括和提炼出公务员面试中考官采用的“锚定策略”、“调整策略”和“匹配策略”三维评分策略，并对其相互间的关系进行较为深入的探讨，寻求公务员面试考官评分策略的规律性及特殊性，从而丰富和拓展了面试相关理论。实践方面，本文编制了公务员面试考官评分策略问卷，指出考官评分策略的特点，回答了考官如何评分的问题，为识别考官评分策略、解释考官个体评分差异提出了分析视野，也为公务员面试考官的培训和选拔提供指导。

由于数据限制，本文没有对以下问题进行研究：(1)公务员面试考官评分策略影不影响面试的信度和效度。本研究提出公务员面试中考官评分存在11种评分方式，构成三种评分策略，但这三种评分策略影不影响面试的有效性与稳定性，本文还未涉及，这是下一步研究要解决的问题。(2)考官三种评分策略对面试的信度和效度分别有何具体影响。“锚定策略”表明考官有着特定的评分区间，“调整策略”表明考官改变了内心的评分区间，面试中考官会改变自身的评分策略，“锚定策略”和“调整策略”对面试信度和效度的影响可能会不同，到底有何不同还有待于进一步证实。(3)考官评分策略的选择受到哪一些原因的影响。已有研究表明考官评分方式与考官个人特征有关，这些研究集中于考官个人特征与考官是否使用“与我相似”这种评分方式，例如考官的性别、教育程度、工作经验等 [23][24]，暂未发现其他个人特征影不影响其它评分方式的研究，本文也未涉及到这样的一个问题，未来研究可以将考官个人特征与多种评分方式结合起来，更加全面探讨考官个人特征与评分策略之间的关系，以便识别哪一些原因影响考官评分策略的选择和使用。

（作者：陈芳，中南财经政法大学公共管理学院教授、博士生导师;盛艳燕，中南财经政法大学公共管理学院博士研究生，长江大学管理学院讲师；来源：中国行政管理）

[2]陈学军. 面试考官的权重策略对评分和录用的影响[J]. 应用心理学，2009，15(4).

[3] 王文中. Rasch测量理论与其在教育和心理之应用[J]. 教育与心理研究，2004(4).

[18]谷向东，李铮.领导干部竞争性选拔中考官评分者信度研究[J].中国人力资源开发，2012(7).

[19]徐建平，周瀚，李文雅等. 结构化面试中面试官的评分及影响因素[J]. 心理科学进展，2014, 22(2).

上一条：快速读懂什么是“数据标注”

下一条：什么是标志与目标它们之间有什么差异

乐鱼官网

乐鱼官网

Previous

Next

Previous

Next

新闻中心

新闻中心

联系我们

公务员面试考官评分策略研究