标准化考试已经成为美国教育政策的核心。“不让任何一个孩子掉队法案”(No Child Left Behind Act)的颁布,及奥巴马政府对“力争上游”(Race to the Top)计划的34亿美元拨款,使得标准化测试步入神坛。在对这些政策的持续辩论中,我们有必要听取一些在“隐蔽”部门工作的教育工作者的经历------即我们这些给考试打分谋生的人的经历。我们的观点很有启发意义,因为它揭示了考试评分系统中许多矛盾和荒谬的现象。这些评分系统都是由盈利性机构经营的,而这些盈利性机构都受制于学校管理者和政府官员,由于有一定的利害关系会产生虚高的评分数字。我们的经历也将会告诉人们,对考试的狂热如何阻碍了数百万年轻人的心智发展。

最近,我花了四个月为考试评分公司工作,给数万份试卷打分,每周的工作时间长达70小时。这是我连续第三年做这项工作。Todd Farley,作为一个现实生活中的试卷评分人和行业内幕的知情者,将他十四年的从业经验经历尖刻地记录在了《制造分数:我在标准化考试行业的不幸遭遇》一书中。而我想要告诉你们我的故事,以此来证实Farley的指控是这个行业普遍的现象。

“等等,有人给标准化考试打分?我以为这些都是机器做的。”这是我告诉其他人我做考试评分临时工来勉强维生时得到的第一反应。负责评分标准化考试的公司还没有找到一种方法,可以通过电子方式来处理数以万计的从三年级到十二年级学生的各类书写和创意。并且据我所知,它们也没有把这项工作外包给印度。因此,全国每年无数的标准化考试中书面答题的部分都是由人工打分。成千上万的我们组成了一个名副其实的临时工大军。

我经常想知道学生们想象谁在为他们的试卷评分。当我还是一名学生的时候,我设想我的试卷是由全国其他地方的合格教师来评分的,这些教师的工作与考试的年级水平和科目相关。但事实证明,这与想象这些测试都是由机器评分一样,都是一种幻想。

考试评分是一个很大的产业,由少数跨国公司所主导,它们筹办这些工作以此来获取最大的利润。当我发现我工作的第一家公司-------培生教育集团(Pearson,编者注:1980年代大陆就卖这家公司出的留学考试辅导教材),也拥有英国《金融时报》、《经济学人》、企鹅出版社和主要教育出版商普林帝斯霍尔(Prentice Hall)时,我感到十分震惊。培生集团的首席执行官Marjorie Scardino2007年福布斯全球最具影响力的100位女性中排名第17位。

美国标准化考试评分员的爆料-激流网培生集团总裁 Marjorie Scardino

考试评分公司通过每年春天雇佣临时劳动力来赚钱。这些评分人拿着低工资(一般来说每小时1113美元),没有福利,也没有长期就业的希望,这对受过培训有执照的教育工作者来说不是什么吸引人的条件。因此,从事评分的人基本都是本科学位,缺乏稳定的工作,并且愿意放弃独立的想法,去遵循那些由考试评分公司制定的荒谬的和不断变化的指导方针。我们中的一些人是退休教师,但大多数以前是的办公室工作人员、保安、或是从事过各类工作的失业者。三年前,当我开始从事打分行业时,我的第一个“团队领导”之所以有资格去监督我们,不是因为他在教育领域的资历,而是因为他是一个地方超市(Target)的低级经理。

在我曾工作过的位于圣保罗市中心和明尼阿波利斯市郊的考试评分中心里,工作人员绝大多数都是白人,白人占90%以上。与此同时,最看重分数的学区里------在这里官员们将通过分数决定学校是否关闭、学生是否停课、教师是否被开除,绝大多数学生都是有色人种。截至2005年,全国20个最大的学区中,80%的学生是有色人种。认为文化差异无关紧要,认为我们应该按照同样的标准对所有学生进行评分,这样的观点是十分牵强的。或许把评分工作外包给印度更好,因为在某些方面来说,印度员工与这些学生的文化差异可能更小。

很多评分人多年来一直从事这个工作,有些甚至超过十年。然而,这些都是暂时的、季节性的工作。连面试和聘用你的人都是临时工,大部分的主管也是如此。在一个评分中心,甚至连办公室和电脑都是暂时租用的。每当我抱怨这些事情的时候,一些同事必然地会说:“嘿,这可比在赛百味或麦当劳工作强多了。”

这话说的没错。但是当人们知道,那些国家政策中心的评分员的另一个选择是快餐业工作,这是否能激发人们的信心呢?当人们知道,由于低工资和缺乏福利,许多评分人不得不做两份工作-----早上送报纸,晚上忙着去做收银员或女服务员,或者像我一样,回到家马上为另一个评分公司工作的时候,这是否能激发人们的信心呢?

公司与评分人之间的交流经常让人觉得置身于卡夫卡的小说中一样。在家工作的评分员几乎从不和真正的人类说话。公司通过电子邮件与家中的评分员交流,现在又增加了自动电话通知你检查你的收件箱。在项目开始后,即使是这些电子邮件也停止发送了,评分人被迫靠自己的主动性在项目主页上查看任何重要的变动。值得注意的是,作为一个被委托评估学生教育表现的公司,公司信息中包含了许多让人不安的拼写错误、不正确的日期和信息缺失。例如,陪生集团的线上入门指导视频警告评分人可能因为性骚扰而面临“民事疏松”(正确应为“民事诉讼”)。没有任何错误的信息十分罕见的。当我在2011年春季收到了一封主题是“培生2010年秋季”的邮件时,我开始考虑这个公司是否有资格来实行公正的试卷评估。

评分中心的沟通情况也不太好。比如说,评分的工作从来没有一个肯定的结束日期。如果你问主管一个项目何时完成,你会得到一个令人困惑的答复:“我们不知道系统中有多少份文件,所以我们不知道什么时候能完成。”尽管很容易通过我们的评分速度和学生总数来计算出完成所需要的时间时,你得到的还是这样的答复。如果我们幸运的话,我们会在项目结束前的24小时以内被告知,并通知我们去寻找其他的工作。提前两小时的通知是十分常见的。

工作本身是什么样子的?在评分中心里,几十个评分人坐成一排,盯着电脑屏幕,学生们的试卷出现在那里(在试卷经历了一些神秘的扫描过程之后)。我想,大多数学生认为他们的试卷被评分的时候,就好像他们是世界上最重要的东西一样。然而,每一天,每一个评分人都要看上百分试卷。因此,学生们在课上准备好几个月花了几十个小时的时间写出的文章,可能会在大约一分钟内被审阅完成。

当我们拿的是计件工资时,评分就显得尤为匆忙。取决于不同类型的考试,每份试卷给3070美分。因此,评分人的主要目的,尤其对在家工作的评分人来说,就是尽快打分来挣钱:如果每份30美分,你得一小时之内批40份试卷才能赚12美元,而批阅试卷的过程中需要很多精神上的休息。想必对评分公司来说,“在家办公”的模式要比设立办公室更有利可图,尤其是因为它避免了加班费。加班费对于有严格截止日期项目的公司来说是个祸害,但它是上天赐给我们这些贫穷的打分员的礼物。我曾因一个项目在办公室连续工作了23天,其中很多天每天工作9小时睡45小时——这就是我对加班的兴奋程度。

然而在家工作也带来了一种全新的疏离感。你可能在长达一个月的项目中都没有和其他人说过一句话,更不用说去看那些写试卷的孩子们了。如果你和另一个人说话,你得自行承担后果,因为给评分中心的主管打电话是要花费时间的,可能会占你宝贵的评分工作时间(特别是你得等15分钟才会有人答复,这种情况在一些项目中十分常见)。

计件工资的方式也会导致一些不详的数学运算:我经常想知道在每次去洗手间的时候我会损失多少钱,并且盘算着要不要把笔记本带进洗手间。既然批完试卷之后你就会失业,你就要和你的幻影同事竞争,尽可能快地尽可能多地评分。这会明显地危害评分的质量,但是只要统计数据吻合,项目按时完成,公司就会很高兴。我确实收到过培生公司的一些自动警告告诉我说我评得太快,但同时又在培生网站收到消息说:“我们落后了!尽可能长时间登陆,尽可能多地评阅!”

无论用什么速度工作,都不能保证用最大的专注去评每一份试卷。这项工作让头脑麻木,所以评分员们必须想办法来自娱自乐。最常见的办法或许是茫然地盯着墙壁,或每次盯着一个地方几分钟。但在今年的工作中,我发现没人会注意到我在评分时看新闻,所以我在家里打分时,每天晚上都会在网上复制粘贴大量的文章------关于印度毛派的报道,关于动物是否是同性恋的科学猜测,关于标准化考试的批评------到一个80页的单行距的Word文档中。然后把它打印出来,第二天在评分中心工作的时候读上面的新闻。这是避免发疯唯一的办法。在家评分的时候,我时不时地在聊天工具上进行三到四次激烈的谈话。这就是评分工作的现实情况。

一种常见的幻想认为评分人可以控制他们所打的分数。每当有人对我说:“一定要确保你放松,然后给孩子们好成绩!”时,我就无奈地笑。我们完全依赖并受限于国家设定的、评分公司强制的标准。为了确保评分人给予“正确的”分数,我们每个考试都要接受几个小时的培训,并且被不同的质量控制措施监控。这一切看起来似乎是合乎逻辑的,也是确保公平的必要手段。毕竟,这些是“标准化”考试。但不幸的是,过去三年评过至少五个州的试卷之后,我发现其中唯一的真正的标准化元素是令人困惑的培训过程、比评分人更困惑的主管、和这些考试对提高创造力和写作能力的普遍无效。

在培训中,评分人往往比刚开始更加困惑。由于我们试图遵循培训中制定的规则而不可避免地给的分数偏低时,他们告诉我们要把分给高一点儿。用主管的话来说就是:“要看到更多4分的试卷”。由于一些我们这些评分人不知道的神秘原因,我们给的分数被要求与前几年的分数相近。因此,如果前年3分的试卷占40%,那么今年就要维持相近的比例。以防你认为这种情况是个例,Farley在他的书中引用了他长达14年的评分经历,举例说他的项目经理曾经说分数必须要改变,因为“我们的数字与心理测量师[统计人员]的预测不匹配”。Farley在书中描述了一位雇员的怀疑:“统计人员没有看试卷答案就知道分数该是什么样子?”

我也质疑这些分数是如何能够衡量学生和学校是否在进步的。我们到底是在试着与去年的分数相匹配,还是一场精心制作的“统计作假”阴谋的一部分?经纪人会不会为了取悦上级而改变数据?对这些公司来说,最终的目标是尽可能快地在截止日期之前向州立教育部门提供可以接受的数字(我们听说如果公司没有按时完成,将会面临100万美元的罚款)。他们要证明他们的可靠性以此来获得更多的合同。

就像Farley写的那样,“在我的职业生涯中,我们的评分结果往往不能被视为教育进步的例子,而应该被看作是在匆忙中完成、通过利润的棱镜来看待的统计数字。”在我看来,如果这些公司诚实的话,他们会告诉我们:“嗨,伙计们,你们的评分从来都不重要。我们只是想给和去年一样的分数,这样就不会在各州引起任何争议,我们就会得到更多的合同,赚更多的利润。所以不管你们在培训中学到了什么,都要试着忘掉它们。”与此同时,各州和地方的政府也在玩它们自己的游戏,因为当政客们可以声称考试分数在上升时,这对它们来说是一件好事。纽约州的情况是一个很好的例子:学生通过数学考试的比例从2006年的57%上升到2009年的82%,在复审标准后,2010年的通过率暴跌到了54%

作为考试评分员,我们从来都不知道我们打的分数的实际意义,也不知道我们在这场精心设计的游戏中所处的位置。我们只负责给一小部分的试卷一个分数,我们甚至都不知道这些分数意味着通过还是不及格,在培训中这类信息从没泄露给我们。我们从来不会知道这些学生的遭遇。玛丽莎能否和她的朋友们一起上七年级?在我们其中的一个人喝完咖啡之后,将她试卷的分数决定为3分而不是4分后,我们仍然不知道她将会面临什么。玛丽莎的学校是否会被关闭?她的老师是否会被解雇,明年春天成为一个评分员?这些问题对我们来说仍然是个谜。但是,这些分数的重要性至关生死。就像洛杉矶中学教师Rigoberto Ruelas Jr.的经历一样:他从洛杉矶时报上仅根据考试分数而得出的排名,得知他的表现是“效率不太高的”,然后他‘自裁’了。

即使评分变得更为精确,这也不能弥补标准化考试的狂热追崇对创造力所造成的恶劣影响。这种影响早就被报道了出来。一项研究显示,自1990年以来,美国儿童的创造力一直在下降。目前在幼儿园和六年级学生之间,创造力的下降尤为严重。

虽然评分人和学生的年龄、地理位置、种族和文化不同,但是我们之间有一个共同的纽带:标准化考试杀死了我们。面对着这些考试培养出来的成百上千的死记硬背式的回答,评分员不得不为自己独立战斗以保持清醒。目前为止的任何一个考试评分中心,有一个人负责最重要的工作----为数百名员工煮咖啡。我们中的很多人每天要喝到六杯咖啡才能活下来。在我的脑海里,我看到了一个极其丑陋的对称性:一面是拼命避免打瞌睡的评分人,一面是学生们在准备及参加这些考试时疲倦的、僵尸般的面孔。

当然,这些学生只存在于我的想象中,就像考试评分员不被允许知道我们的分数对学生的影响一样,我们也从来没有机会见到他们,看到他们是如何发展成为作家、思想家或慢慢长成人类的,我们也从没有机会得知他们生活的社区和家庭是什么样子的。我们看到的只是屏幕上的一张纸。在每天阅读几百篇单调乏味的文章之后,我们开始厌倦本该美丽的美国青年所表现出的贫乏创造力。

我记得在连续23天里我都在评阅成千上万的高中生对“你的人生目标是什么?”这个问题的回答。大多数人都用了几段话来说明他们的人生目标是在课堂上少说话,多听老师讲课,不要再浪费时间。在标准化的考试里希望出现伟大的文学作品有些苛求了。但是,考虑到这是许多学生学习写作和思考的媒介,我们应该要期望更多。这些死记硬背的答案,本身就是我们教育失败的证明。它未能与孩子们的生活真正联系起来,帮助他们培养人性和批判性思维的能力,而不仅仅是训练他们,让他们成为听话的工人或士兵。

虽然我们这些评分人可能会因为他们想法的千篇一律而责怪这些孩子时,我们知道他们的想象力和灵感从他们身上被吸走并不是他们的错。在这些考试中,创造力没有得到任何分数,尽管一些评分人告诉我,最近许多州确实把创造力作为一个因素纳入评分体系中。讽刺的是,评分人往往乐于看到那些表现出个性、发出自己声音的试卷,而且往往会用更高的分数来奖励他们,然而,从我读过的试卷中看,似乎学生们经常被明确告知不要有创造性。即使考虑到了创造力,它也不太可能改变因为强调标准化考试而导致的写作和教育的整体特征。正如爱因斯坦的名言:“好奇心能在正规教育中幸存下来,这是一个奇迹”。

在重复、单调和纪律中发展的教育政策,在虚假的学业负责制[译者注:学业负责制是指根据学生学业成绩而定学校拨款和教员工资的教学效果考核制] 的伪装之下,阻碍了创造力和好奇心。更有甚者,这一政策由于学生的种族和阶级的不同,有着不同的影响。就像Jonathan Kozol解释说:

“在市中心的学校里,对于考试的焦虑感不仅消耗掉了一年中大约三分之一的时间,而且这种焦虑感还要求在校的每一分钟都被用来提高考试相关的技能。这些教室里很少有艺术、社会科学,其实完全没有人文精神。

看到这个过程的结果让我们感到沮丧,你都可以在评分中心感受的到这份沮丧。即使在这里你可以自由地走动,有需要的时候可以使用卫生间,并且相互交谈,但在今年春天我呆的这个房间内,几乎完全都是安静的。在每一个项目的进行中,随着时间的流逝,许多评分员的健康状况都恶化了。这让我十分好奇,是不是试卷上那些无情的、让灵魂破碎的单调会对这些被迫阅读的人产生实际的物理影响。

公平地说,这些试卷并不全是乏味的废话,即使在标准化考试中,也常常会在其中感受到智慧。在写作中常常会感受到富人和穷人之间的鸿沟:一些学生有着难以想象的特权,而更多的学生则在寄养家庭中忍受着令人心碎的经历。这些试卷答案也证实了种族主义的存在,描述了十几岁的青少年因为肤色而被赶出商店或被拒绝服务和工作。如果你们把评分人看成是被击垮的、精疲力竭的一群人,那就错了。我们中的许多人做这份工作是为了避免自己不得不去找一些其他的、让我们远离创造性劳动的、阻止我们去旅行、或是追求其他丰富的生活方式的工作。在过去的三年中,我遇到的许多评分员都是作家、艺术家、摄影师或独立学者,而且经常会在休息室的公告板上看到评分人发布的关于新书发布和其他事件的帖子。

在布满错误的培训视频中,Marjorie Scardino:“大多数在培生公司工作的人都有激情和激情,因为他们认为知道他们在做一些重要的事情。”但是我从来没有从我的同事们那里得到过这样的感觉,他们觉得自己做的事情是在帮助孩子或教育过程。如果奥巴马政府问评分人,这个国家教育体系的解决方案是否会是标准化考试,我想大多数人都会一笑置之。不幸的是,随着奥巴马政府更加大力地推行标准化考试,这个笑话就落在了我们身上。今年4月,我们评分中心所有的工作人员都被要求填写一份表格,让我们的公司因为雇佣我们获得一份税务减免,我当时都不知道是该笑还是该哭。这项税收减免是通过奥巴马政府的雇佣法案来实现的,该法案旨在给“提供就业机会”的企业以补贴,或是补贴那些没有医疗保障的临时工作和不能过渡到长期就业的岗位。而在一个更好的世界里,像这样的工作是不该存在的

当这些公司厚颜无耻地收集着那些只能被描述为企业福利的支票时,随着政府削减教育经费,成千上万的教师被解雇。或许明年,这些被解雇的教师中的一些人将会得到一小时12美元的报酬(如果他们涌入就业市场的话,就会是10美元),给在更大的课堂上课的学生们评试卷,并帮助政府“公平地”决定哪些学校将被关闭、他们中的哪些同事将被解雇。同样糟糕的是,声称通过标准化考试实行的学业问责制会增加高质量的教师,但实际上却没有产生任何一类这样的结果。Kozol引用“不让任何一个孩子掉队法案”说:“仅仅通过学生们标准化考试的分数来衡量教师的成功,这种做法奖励了最具机器人性质的教师,驱逐了能够批判性思考的、令人振奋的教师。”

当我的一个朋友在今年评分季结束后向办公室的同事说再见时,他70岁的主管、一个经验丰富的评分战士,说出了很多评分人希望听到的话:“我希望我再也不会在这里见到你了”。然而,虽然很多人希望逃离这个行业,这些评分公司却正在成功地扩张,现在他们希望能够获得奥巴马政府和州政府颁发的数十亿美元的学校资金。培生集团已经“成立了K-12解决方案小组”[注:K-12是指从幼儿园到12年级的基础教育],并且正在寻求至少八个州的校改合同,(声称)可以利用它的测试、科技和其他产品来执行一项学校改进工作。

如果我在评分中心的经历有任何一点启示的话,那就是每个人都应该担心把更多的教育系统放入这些盈利公司手中,但这些公司会因为学生们的商品化的思想而扎根更深。为什么那些头脑正常的人会把教育评估交给那些缺乏训练、工作过度、工资低的、为牟利而编造数据的公司的临时工呢?尽管可能性看起来很小,但是作为学生、老师、家长,甚至是评分员,我们的共同目标应该是把教育从这个可笑的数字游戏中解放出来。

为了避免失联请加+激流网小编微信号jiliu1921

美国标准化考试评分员的爆料-激流网(翻译:xd。原文链接:https://monthlyreview.org/2010/12/01/the-loneliness-of-the-long-distance-test-scorer/