一个让所有人震惊的实验
2018年,斯坦福大学做了一个著名的教育实验。
研究者找了两组小学生,让他们学习「浮力」的概念。
A组(传统评估):
- 学习2周后,做一份试卷
- 问题:"什么是浮力?""浮力的公式是什么?""为什么船能浮在水上?"
- 结果:90%的学生得了高分
B组(UbD评估):
- 学习2周后,给每个学生一块橡皮泥和一个装水的容器
- 任务:"这块橡皮泥通常会沉到水底。现在请你想办法让它浮起来,并解释你的设计原理。"
- 结果:只有35%的学生能成功完成任务
震惊的发现:
- A组得高分的学生中,70%在B组的实际任务中失败了
- 他们能"说出"浮力的定义,但不会"运用"浮力的原理
为什么评估要在第二步,而不是最后一步?
传统逻辑的陷阱
大多数教师的设计顺序:
1. 确定要教的内容
2. 设计教学活动
3. 教完之后,想个测试题检验一下
问题:
- 评估成了"事后补充",往往流于形式
- 测试题通常只测"记住了什么",不测"理解了什么"
- 教和考脱节:教的是A,考的是B
UbD逻辑的智慧
1. 确定持久理解(学生应该理解什么)
2. 确定评估证据(如何知道他们真的理解了)← 这是第二步!
3. 设计学习体验(什么活动能产生这种理解)
为什么先设计评估?
类比:导航目的地
- 你不会说"我先开车,开完了再想去哪儿"
- 你会先确定目的地(持久理解),然后设定导航(评估标准),最后选择路线(教学活动)
实际效果:
- 评估标准明确了,教学活动自然对齐
- 知道"终点"长什么样,就不会在路上迷失
- 学生从第一天就知道"我们要去哪里",学习更有方向感
理解的六个层面(The Six Facets of Understanding)
Wiggins和McTighe发现:"理解"不是单一的状态,而是六个维度的综合。
层面1:解释(Explanation)
定义:能用自己的话解释概念,并阐明其背后的"为什么"
表现:
- ❌ 复述教科书的定义
- ✅ 用类比、例子、因果关系来说明概念
评估方式:
- "请向一个从未听说过[概念]的人解释它,让他能明白。"
- "为什么会发生[现象]?背后的原因是什么?"
案例(小学科学-种子发芽):
- 低层次:"种子需要水、阳光和土壤才能发芽。"(背诵)
- 高层次:"种子就像一个睡着的婴儿,它身体里储存了'醒来'的能量。当水进入种子,就像闹钟响了,种子开始醒来。它先从壳里长出小根,因为它需要找到更多的水和营养,就像婴儿醒来后要找妈妈要奶喝。阳光告诉种子'外面安全了,可以长出来了'。"(解释)
层面2:阐释(Interpretation)
定义:能发现和解读意义、模式和重要性
表现:
- ❌ 看到表面信息
- ✅ 看到深层含义和联系
评估方式:
- "这个故事/数据/现象告诉我们什么?"
- "为什么这个很重要?"
- "这和我们之前学的[X]有什么联系?"
案例(小学语文-读《小王子》):
- 低层次:"小王子遇到了一朵玫瑰花。"(字面理解)
- 高层次:"小王子和玫瑰的关系让我明白:真正的爱不是占有,而是愿意为对方花时间。就像狐狸说的'驯养'——当你对一个人投入了时间和关心,这个人就变得独一无二了。这也解释了为什么小王子在看到5000朵玫瑰时会哭,因为他意识到他的那朵玫瑰因为他的陪伴而变得特别。"(深度阐释)
层面3:应用(Application)
定义:能在新的、真实的情境中有效运用知识
表现:
- ❌ 只能做教过的题目
- ✅ 能把学到的运用到从未见过的新问题
评估方式:
- "现在你遇到[全新情境],你会如何运用[概念]来解决?"
- "设计/创造一个[产品]来解决[真实问题]"
案例(小学数学-面积概念):
- 低层次:"长方形面积=长×宽,所以4×3=12平方米。"(套公式)
- 高层次任务:"妈妈要给你的房间买新地毯。房间是不规则形状(提供平面图)。请你:1) 算出需要多大的地毯 2) 去建材市场网站查价格 3) 设计3个不同预算的方案 4) 向妈妈推荐你认为最好的方案并说明理由。"(真实应用)
层面4:洞察(Perspective)
定义:能从多个角度看问题,理解他人的观点
表现:
- ❌ 认为只有一个"正确答案"
- ✅ 能看到不同视角,理解复杂性
评估方式:
- "不同的人可能如何看待这个问题?"
- "如果你是[另一个角色],你会怎么想?"
- "这个决定的利弊各是什么?"
案例(小学社会-城市建设主题):
-
低层次:"城市应该多建公园,因为环境好。"(单一视角)
-
高层次任务:"市长要决定把一块空地建成公园还是停车场。请你分别从以下角色的角度写一封信给市长:
- 住在附近的老人(想要散步的地方)
- 开车上班的年轻父母(停车难)
- 环保组织成员(关心绿化)
- 房地产开发商(想建商场)
然后,如果你是市长,你会如何平衡这些不同的需求?"(多角度洞察)
层面5:共情(Empathy)
定义:能从内心理解他人的感受和世界观
表现:
- ❌ 知识性地"知道"别人的观点
- ✅ 情感上"感同身受"
评估方式:
- "想象你是[角色],你会有什么感受?"
- "为什么[人物]会做出这个选择?"
- "如果发生在你身上,你会...?"
案例(小学历史-战争主题):
- 低层次:"战争中很多人死了,很悲惨。"(表面认知)
- 高层次任务:"读这三封真实的二战家书:士兵写给妻子的、母亲写给前线儿子的、孩子写给失踪父亲的。
- 选一封最触动你的,写下你读时的感受
- 如果你是信的作者,在写这封信时你在想什么?怕什么?希望什么?
- 完成一个艺术作品(绘画/诗歌/音乐)来表达这些情感
- 反思:为什么学习历史不只是记住日期和事件,更要理解人的故事?"(深度共情)
层面6:自知(Self-knowledge)
定义:认识到自己的理解和误解,知道自己如何学习和思考
表现:
- ❌ 不知道自己哪里懂、哪里不懂
- ✅ 能反思学习过程,识别自己的思维模式和盲点
评估方式:
- "这个主题中,什么让你最困惑?为什么?"
- "你的想法如何改变的?"
- "你在这个学习过程中发现了自己的什么特点?"
案例(小学数学-分数学习):
- 低层次:"我学会分数了。"(笼统自评)
- 高层次任务:"完成这份学习日志:
- 学习前我认为:分数就是两个数字,一个在上一个在下
- 让我困惑的时刻:当老师说1/2和2/4是一样的,我完全懵了,因为它们看起来明明不一样啊!
- 我的突破:当我把披萨切成4块拿走2块,和切成2块拿走1块,发现拿到的一样多时,我突然明白了!原始份数不一样,但实际量是一样的。
- 我现在理解的:分数不是'两个数字',而是'一个量',它表达的是'部分占整体的比例'。
- 我还想知道:为什么除法和分数这么像?它们之间有什么关系?
- 我发现我学习数学的方式是:我需要用实物操作才能理解,光听讲我会忘。"(深度元认知)
UbD评估的两大类型
类型1:表现性任务(Performance Tasks)
定义:要求学生在真实或模拟的复杂情境中展示理解的综合性任务
特点:
- 真实性:类似真实世界中的挑战
- 复杂性:需要综合运用多种知识和技能
- 开放性:可以有多种合理的解决方案
- 持续性:通常需要数天到数周完成
设计框架:GRASPS模型
这是UbD最著名的任务设计工具,六个要素缩写:
- G - Goal(目标):你的任务/挑战是什么?
- R - Role(角色):你的身份是什么?
- A - Audience(受众):你为谁做这个?
- S - Situation(情境):背景和限制条件是什么?
- P - Product(产品):你要创造什么?
- S - Standards(标准):如何评判成功?
案例1:"健康饮食"主题(小学3年级)
G - Goal(目标):设计一份营养均衡的学校午餐菜单
R - Role(角色):你是学校食堂的营养师
A - Audience(受众):你要说服校长采用你的菜单方案
S - Situation(情境):学校收到很多家长投诉,说孩子们不喜欢现在的午餐,经常不吃完。同时,学校体检发现一些学生营养不良或肥胖。你的预算是每人每餐15元。
P - Product(产品):
- 一份一周的午餐菜单(包含营养成分标注)
- 一份给校长的说明书(解释你的设计理念)
- 一张海报向学生介绍新菜单(让他们想吃)
S - Standards(标准):
- 营养均衡:每餐包含谷物、蛋白质、蔬菜、水果
- 符合预算:每餐成本≤15元
- 吸引学生:至少3道孩子喜欢的菜
- 多样性:一周不重复
- 解释清晰:能说明为什么这样搭配健康
为什么这是好的表现性任务?
- 真实:营养师真的会做这样的工作
- 综合:需要营养知识+数学计算+说服技巧+创意设计
- 多层面理解:解释(营养原理)+应用(设计菜单)+洞察(平衡健康和美味)+共情(考虑孩子的喜好)
案例2:"水循环"主题(小学5年级)
G - Goal(目标):设计一个解决方案来应对城市缺水危机
R - Role(角色):你是环境工程师团队成员
A - Audience(受众):市政府官员和社区居民
S - Situation(情境):你所在的城市连续三年干旱,水库水位降到历史最低。政府在考虑多个方案:海水淡化、云层播种、限制用水、水循环利用系统。每个方案都有利弊。
P - Product(产品):
- 一个可行性报告(分析至少2个方案的科学原理、成本、环境影响)
- 一个社区节水计划(教育居民如何在日常生活中节水)
- 一个实物模型或视频(展示你推荐的方案如何运作)
S - Standards(标准):
- 科学准确性:正确运用水循环原理
- 系统思维:考虑长期影响,不只是短期效果
- 多角度分析:评估经济、环境、社会三个维度
- 说服力:有数据支持,逻辑清晰
- 创新性:提出原创的改进建议
类型2:其他证据(Other Evidence)
定义:除了表现性任务,还需要多种方式持续收集学习证据
类型清单:
1. 观察记录
- 教师在活动中观察学生的表现
- 记录关键时刻:"今天小明在实验中说'哦!我明白为什么了',然后他解释..."
- 特别关注:卡住的时刻(哪里困惑)、突破的时刻(何时顿悟)
2. 对话与提问
- 苏格拉底式对话:"你为什么这么认为?""如果...会怎样?""你能举个例子吗?"
- 同伴讨论:听学生如何向彼此解释
- 一对一会议:深入了解个体理解
3. 学习日志
- 每日反思:今天学到了什么?什么让我困惑?
- 概念图:画出概念之间的联系
- "我曾经以为...现在我知道..."句式
4. 小测验(但不是传统那种)
- ✅ 开放性问题:"用3种不同的方法解释[概念]"
- ✅ 应用题:"设计一个实验来测试[假设]"
- ❌ 选择题:"浮力的定义是 A/B/C/D"
5. 自评与互评
- 学生用评分标准(rubric)评价自己的作品
- 同伴反馈:"你的作品最好的部分是...我建议你可以..."
- 反思:"我这次比上次进步的地方是..."
6. 项目过程记录
- 草稿和修改版本的对比
- 决策记录:"我选择做[X]因为..."
- 失败和调整的记录
评分标准(Rubric):让评估透明化
什么是Rubric?
定义:一个明确的评分指南,描述不同表现水平的具体特征
为什么需要它?
- 让"好"和"不好"从主观判断变成客观标准
- 学生从第一天就知道"优秀"长什么样
- 教师评分更公平一致
- 学生可以自评和互评
Rubric的基本结构
| 评价维度 | 4分(优秀) | 3分(良好) | 2分(合格) | 1分(需改进) |
|---|---|---|---|---|
| 维度1 | 具体描述 | 具体描述 | 具体描述 | 具体描述 |
| 维度2 | 具体描述 | 具体描述 | 具体描述 | 具体描述 |
关键原则:
- 每个格子都是具体的行为描述,不是笼统的词汇
- ❌ "很好""不错""需要努力" → 太模糊
- ✅ "能用3个不同例子解释概念""能用1个例子解释概念" → 具体明确
案例:"解释水循环"任务的Rubric
| 评价维度 | 4分(深度理解) | 3分(基本理解) | 2分(部分理解) | 1分(需支持) |
|---|---|---|---|---|
| 科学准确性 | 准确解释水循环的每个阶段,并说明能量的作用(太阳能驱动蒸发)。没有科学错误。 | 准确解释主要阶段(蒸发、凝结、降水),但对能量角色解释不清。有1-2个小错误。 | 能说出一些阶段,但顺序混乱或有明显概念错误(如"水向上跑到云里") | 只能说出个别词汇("下雨"),无法解释过程 |
| 深度理解(系统思维) | 能解释水循环是一个闭合系统,水的总量不变,只是形态和位置改变。能联系到其他循环系统(碳循环、季节循环) | 理解水在循环中不会消失,但无法清晰阐述"系统"概念或做跨领域联系 | 将水循环描述为线性过程(海洋→云→雨),缺乏"循环"和"系统"的理解 | 认为水会"用完"或"消失",没有循环概念 |
| 沟通表达 | 使用类比、图示、例子让非专业人士也能理解。语言流畅,逻辑清晰。 | 解释清楚,但主要依赖科学术语,对外行人可能有理解障碍 | 解释不连贯,跳跃,听者需要努力才能跟上思路 | 无法完整表达,只有片段信息 |
| 应用能力 | 能用水循环原理解释真实现象(如"为什么沿海地区雨水多"),并预测改变某个环节的后果(如"如果森林被砍光会影响降雨") | 能解释1-2个真实现象,但对"改变会怎样"的预测不够深入 | 只能复述学过的例子,不能应用到新情境 | 无法将概念与真实世界联系 |
使用方法:
- 任务布置时,给学生看这个Rubric:"这就是我们追求的目标"
- 学生完成任务后,先自评:"我觉得我在各个维度的表现是..."
- 教师评分,并指出具体证据:"你在[维度]达到4分,因为你..."
- 反馈时聚焦改进路径:"要达到下一个水平,你可以尝试..."
实战练习:为你的主题设计评估
工作表:评估设计
主题:_
持久理解:____(来自Day 23-2)
第一步:确定要评估的理解层面
我最想看到学生展示的是:(至少选3个)
☐ 解释:能清楚阐明概念背后的"为什么"
☐ 阐释:能看到深层意义和联系
☐ 应用:能在新情境中运用
☐ 洞察:能从多角度看问题
☐ 共情:能理解他人的感受和处境
☐ 自知:能反思自己的学习过程
第二步:设计表现性任务(用GRASPS)
G - Goal(目标):学生的挑战是__
R - Role(角色):学生扮演__
A - Audience(受众):为__完成
S - Situation(情境):背景是__
P - Product(产品):创造__
S - Standards(标准):成功的关键是__
第三步:设计其他证据收集方式
我将通过以下方式持续了解学生的理解:
☐ 观察记录(什么时候观察?记录什么?)
☐ 对话提问(关键问题是?)
☐ 学习日志(什么频率?什么问题?)
☐ 小测验(什么形式?测什么?)
☐ 自评互评(用什么工具?)
☐ 其他:__
第四步:制定简化版Rubric
选择3个最重要的评价维度,写出4分和2分的具体表现描述:
| 维度 | 4分表现 | 2分表现 |
|---|---|---|
| 1. | ||
| 2. | ||
| 3. |
最后的检验:三个关键问题
设计完评估后,问自己:
问题1:对齐性检验
"我的评估真的在测持久理解吗?"
- 把评估任务给不知情的同事看
- 让他们猜"这个任务在测什么理解"
- 如果他们猜不到你的持久理解→评估设计偏离了
问题2:真实性检验
"这个任务像真实世界的挑战吗?"
- 真实世界中,谁会做类似的工作?
- 如果答案是"只有学生在课堂上会做这个" → 任务不够真实
- 优化:让任务更像专业人士/真实场景中的挑战
问题3:公平性检验
"所有学生都有机会展示理解吗?"
- 是否只有一种展示方式?(如只能写作文)
- 有没有为不同学习风格的学生提供选项?
- 语言障碍/文化差异是否会阻碍学生展示真实理解?
似水流年