Day 24-1：阶段二深度解析——如何设计评估任务，让「理解」可见可测-似水流年

一个让所有人震惊的实验

2018年，斯坦福大学做了一个著名的教育实验。

研究者找了两组小学生，让他们学习「浮力」的概念。

A组（传统评估）：

学习2周后，做一份试卷
问题："什么是浮力？""浮力的公式是什么？""为什么船能浮在水上？"
结果：90%的学生得了高分

B组（UbD评估）：

学习2周后，给每个学生一块橡皮泥和一个装水的容器
任务："这块橡皮泥通常会沉到水底。现在请你想办法让它浮起来，并解释你的设计原理。"
结果：只有35%的学生能成功完成任务

震惊的发现：

A组得高分的学生中，70%在B组的实际任务中失败了
他们能"说出"浮力的定义，但不会"运用"浮力的原理

为什么评估要在第二步，而不是最后一步？

传统逻辑的陷阱

大多数教师的设计顺序：

1. 确定要教的内容
2. 设计教学活动
3. 教完之后，想个测试题检验一下

问题：

评估成了"事后补充"，往往流于形式
测试题通常只测"记住了什么"，不测"理解了什么"
教和考脱节：教的是A，考的是B

UbD逻辑的智慧

1. 确定持久理解（学生应该理解什么）
2. 确定评估证据（如何知道他们真的理解了）← 这是第二步！
3. 设计学习体验（什么活动能产生这种理解）

为什么先设计评估？

类比：导航目的地

你不会说"我先开车，开完了再想去哪儿"
你会先确定目的地（持久理解），然后设定导航（评估标准），最后选择路线（教学活动）

实际效果：

评估标准明确了，教学活动自然对齐
知道"终点"长什么样，就不会在路上迷失
学生从第一天就知道"我们要去哪里"，学习更有方向感

理解的六个层面（The Six Facets of Understanding）

Wiggins和McTighe发现："理解"不是单一的状态，而是六个维度的综合。

层面1：解释（Explanation）

定义：能用自己的话解释概念，并阐明其背后的"为什么"

表现：

❌ 复述教科书的定义
✅ 用类比、例子、因果关系来说明概念

评估方式：

"请向一个从未听说过[概念]的人解释它，让他能明白。"
"为什么会发生[现象]？背后的原因是什么？"

案例（小学科学-种子发芽）：

低层次："种子需要水、阳光和土壤才能发芽。"（背诵）
高层次："种子就像一个睡着的婴儿，它身体里储存了'醒来'的能量。当水进入种子，就像闹钟响了，种子开始醒来。它先从壳里长出小根，因为它需要找到更多的水和营养，就像婴儿醒来后要找妈妈要奶喝。阳光告诉种子'外面安全了，可以长出来了'。"（解释）

层面2：阐释（Interpretation）

定义：能发现和解读意义、模式和重要性

表现：

❌ 看到表面信息
✅ 看到深层含义和联系

评估方式：

"这个故事/数据/现象告诉我们什么？"
"为什么这个很重要？"
"这和我们之前学的[X]有什么联系？"

案例（小学语文-读《小王子》）：

低层次："小王子遇到了一朵玫瑰花。"（字面理解）
高层次："小王子和玫瑰的关系让我明白：真正的爱不是占有，而是愿意为对方花时间。就像狐狸说的'驯养'——当你对一个人投入了时间和关心，这个人就变得独一无二了。这也解释了为什么小王子在看到5000朵玫瑰时会哭，因为他意识到他的那朵玫瑰因为他的陪伴而变得特别。"（深度阐释）

层面3：应用（Application）

定义：能在新的、真实的情境中有效运用知识

表现：

❌ 只能做教过的题目
✅ 能把学到的运用到从未见过的新问题

评估方式：

"现在你遇到[全新情境]，你会如何运用[概念]来解决？"
"设计/创造一个[产品]来解决[真实问题]"

案例（小学数学-面积概念）：

低层次："长方形面积=长×宽，所以4×3=12平方米。"（套公式）
高层次任务："妈妈要给你的房间买新地毯。房间是不规则形状（提供平面图）。请你：1) 算出需要多大的地毯 2) 去建材市场网站查价格 3) 设计3个不同预算的方案 4) 向妈妈推荐你认为最好的方案并说明理由。"（真实应用）

层面4：洞察（Perspective）

定义：能从多个角度看问题，理解他人的观点

表现：

❌ 认为只有一个"正确答案"
✅ 能看到不同视角，理解复杂性

评估方式：

"不同的人可能如何看待这个问题？"
"如果你是[另一个角色]，你会怎么想？"
"这个决定的利弊各是什么？"

案例（小学社会-城市建设主题）：

低层次："城市应该多建公园，因为环境好。"（单一视角）
高层次任务："市长要决定把一块空地建成公园还是停车场。请你分别从以下角色的角度写一封信给市长：
- 住在附近的老人（想要散步的地方）
- 开车上班的年轻父母（停车难）
- 环保组织成员（关心绿化）
- 房地产开发商（想建商场）
然后，如果你是市长，你会如何平衡这些不同的需求？"（多角度洞察）

层面5：共情（Empathy）

定义：能从内心理解他人的感受和世界观

表现：

❌ 知识性地"知道"别人的观点
✅ 情感上"感同身受"

评估方式：

"想象你是[角色]，你会有什么感受？"
"为什么[人物]会做出这个选择？"
"如果发生在你身上，你会...？"

案例（小学历史-战争主题）：

低层次："战争中很多人死了，很悲惨。"（表面认知）
高层次任务："读这三封真实的二战家书：士兵写给妻子的、母亲写给前线儿子的、孩子写给失踪父亲的。
- 选一封最触动你的，写下你读时的感受
- 如果你是信的作者，在写这封信时你在想什么？怕什么？希望什么？
- 完成一个艺术作品（绘画/诗歌/音乐）来表达这些情感
- 反思：为什么学习历史不只是记住日期和事件，更要理解人的故事？"（深度共情）

层面6：自知（Self-knowledge）

定义：认识到自己的理解和误解，知道自己如何学习和思考

表现：

❌ 不知道自己哪里懂、哪里不懂
✅ 能反思学习过程，识别自己的思维模式和盲点

评估方式：

"这个主题中，什么让你最困惑？为什么？"
"你的想法如何改变的？"
"你在这个学习过程中发现了自己的什么特点？"

案例（小学数学-分数学习）：

低层次："我学会分数了。"（笼统自评）
高层次任务："完成这份学习日志：
- 学习前我认为：分数就是两个数字，一个在上一个在下
- 让我困惑的时刻：当老师说1/2和2/4是一样的，我完全懵了，因为它们看起来明明不一样啊！
- 我的突破：当我把披萨切成4块拿走2块，和切成2块拿走1块，发现拿到的一样多时，我突然明白了！原始份数不一样，但实际量是一样的。
- 我现在理解的：分数不是'两个数字'，而是'一个量'，它表达的是'部分占整体的比例'。
- 我还想知道：为什么除法和分数这么像？它们之间有什么关系？
- 我发现我学习数学的方式是：我需要用实物操作才能理解，光听讲我会忘。"（深度元认知）

UbD评估的两大类型

类型1：表现性任务（Performance Tasks）

定义：要求学生在真实或模拟的复杂情境中展示理解的综合性任务

特点：

真实性：类似真实世界中的挑战
复杂性：需要综合运用多种知识和技能
开放性：可以有多种合理的解决方案
持续性：通常需要数天到数周完成

设计框架：GRASPS模型

这是UbD最著名的任务设计工具，六个要素缩写：

G - Goal（目标）：你的任务/挑战是什么？
R - Role（角色）：你的身份是什么？
A - Audience（受众）：你为谁做这个？
S - Situation（情境）：背景和限制条件是什么？
P - Product（产品）：你要创造什么？
S - Standards（标准）：如何评判成功？

案例1："健康饮食"主题（小学3年级）

G - Goal（目标）：设计一份营养均衡的学校午餐菜单

R - Role（角色）：你是学校食堂的营养师

A - Audience（受众）：你要说服校长采用你的菜单方案

S - Situation（情境）：学校收到很多家长投诉，说孩子们不喜欢现在的午餐，经常不吃完。同时，学校体检发现一些学生营养不良或肥胖。你的预算是每人每餐15元。

P - Product（产品）：

一份一周的午餐菜单（包含营养成分标注）
一份给校长的说明书（解释你的设计理念）
一张海报向学生介绍新菜单（让他们想吃）

S - Standards（标准）：

营养均衡：每餐包含谷物、蛋白质、蔬菜、水果
符合预算：每餐成本≤15元
吸引学生：至少3道孩子喜欢的菜
多样性：一周不重复
解释清晰：能说明为什么这样搭配健康

为什么这是好的表现性任务？

真实：营养师真的会做这样的工作
综合：需要营养知识+数学计算+说服技巧+创意设计
多层面理解：解释（营养原理）+应用（设计菜单）+洞察（平衡健康和美味）+共情（考虑孩子的喜好）

案例2："水循环"主题（小学5年级）

G - Goal（目标）：设计一个解决方案来应对城市缺水危机

R - Role（角色）：你是环境工程师团队成员

A - Audience（受众）：市政府官员和社区居民

S - Situation（情境）：你所在的城市连续三年干旱，水库水位降到历史最低。政府在考虑多个方案：海水淡化、云层播种、限制用水、水循环利用系统。每个方案都有利弊。

P - Product（产品）：

一个可行性报告（分析至少2个方案的科学原理、成本、环境影响）
一个社区节水计划（教育居民如何在日常生活中节水）
一个实物模型或视频（展示你推荐的方案如何运作）

S - Standards（标准）：

科学准确性：正确运用水循环原理
系统思维：考虑长期影响，不只是短期效果
多角度分析：评估经济、环境、社会三个维度
说服力：有数据支持，逻辑清晰
创新性：提出原创的改进建议

类型2：其他证据（Other Evidence）

定义：除了表现性任务，还需要多种方式持续收集学习证据

类型清单：

1. 观察记录

教师在活动中观察学生的表现
记录关键时刻："今天小明在实验中说'哦！我明白为什么了'，然后他解释..."
特别关注：卡住的时刻（哪里困惑）、突破的时刻（何时顿悟）

2. 对话与提问

苏格拉底式对话："你为什么这么认为？""如果...会怎样？""你能举个例子吗？"
同伴讨论：听学生如何向彼此解释
一对一会议：深入了解个体理解

3. 学习日志

每日反思：今天学到了什么？什么让我困惑？
概念图：画出概念之间的联系
"我曾经以为...现在我知道..."句式

4. 小测验（但不是传统那种）

✅ 开放性问题："用3种不同的方法解释[概念]"
✅ 应用题："设计一个实验来测试[假设]"
❌ 选择题："浮力的定义是 A/B/C/D"

5. 自评与互评

学生用评分标准（rubric）评价自己的作品
同伴反馈："你的作品最好的部分是...我建议你可以..."
反思："我这次比上次进步的地方是..."

6. 项目过程记录

草稿和修改版本的对比
决策记录："我选择做[X]因为..."
失败和调整的记录

评分标准（Rubric）：让评估透明化

什么是Rubric？

定义：一个明确的评分指南，描述不同表现水平的具体特征

为什么需要它？

让"好"和"不好"从主观判断变成客观标准
学生从第一天就知道"优秀"长什么样
教师评分更公平一致
学生可以自评和互评

Rubric的基本结构

评价维度	4分（优秀）	3分（良好）	2分（合格）	1分（需改进）
维度1	具体描述	具体描述	具体描述	具体描述
维度2	具体描述	具体描述	具体描述	具体描述

关键原则：

每个格子都是具体的行为描述，不是笼统的词汇
❌ "很好""不错""需要努力" → 太模糊
✅ "能用3个不同例子解释概念""能用1个例子解释概念" → 具体明确

案例："解释水循环"任务的Rubric

评价维度	4分（深度理解）	3分（基本理解）	2分（部分理解）	1分（需支持）
科学准确性	准确解释水循环的每个阶段，并说明能量的作用（太阳能驱动蒸发）。没有科学错误。	准确解释主要阶段（蒸发、凝结、降水），但对能量角色解释不清。有1-2个小错误。	能说出一些阶段，但顺序混乱或有明显概念错误（如"水向上跑到云里"）	只能说出个别词汇（"下雨"),无法解释过程
深度理解（系统思维）	能解释水循环是一个闭合系统，水的总量不变，只是形态和位置改变。能联系到其他循环系统（碳循环、季节循环）	理解水在循环中不会消失，但无法清晰阐述"系统"概念或做跨领域联系	将水循环描述为线性过程（海洋→云→雨），缺乏"循环"和"系统"的理解	认为水会"用完"或"消失"，没有循环概念
沟通表达	使用类比、图示、例子让非专业人士也能理解。语言流畅，逻辑清晰。	解释清楚，但主要依赖科学术语，对外行人可能有理解障碍	解释不连贯，跳跃，听者需要努力才能跟上思路	无法完整表达，只有片段信息
应用能力	能用水循环原理解释真实现象（如"为什么沿海地区雨水多"),并预测改变某个环节的后果（如"如果森林被砍光会影响降雨"）	能解释1-2个真实现象，但对"改变会怎样"的预测不够深入	只能复述学过的例子，不能应用到新情境	无法将概念与真实世界联系

使用方法：

任务布置时，给学生看这个Rubric："这就是我们追求的目标"
学生完成任务后，先自评："我觉得我在各个维度的表现是..."
教师评分，并指出具体证据："你在[维度]达到4分，因为你..."
反馈时聚焦改进路径："要达到下一个水平，你可以尝试..."

实战练习：为你的主题设计评估

工作表：评估设计

主题：_

持久理解：____（来自Day 23-2）

第一步：确定要评估的理解层面

我最想看到学生展示的是：（至少选3个）

☐ 解释：能清楚阐明概念背后的"为什么"

☐ 阐释：能看到深层意义和联系

☐ 应用：能在新情境中运用

☐ 洞察：能从多角度看问题

☐ 共情：能理解他人的感受和处境

☐ 自知：能反思自己的学习过程

第二步：设计表现性任务（用GRASPS）

G - Goal（目标）：学生的挑战是__

R - Role（角色）：学生扮演__

A - Audience（受众）：为__完成

S - Situation（情境）：背景是__

P - Product（产品）：创造__

S - Standards（标准）：成功的关键是__

第三步：设计其他证据收集方式

我将通过以下方式持续了解学生的理解：

☐ 观察记录（什么时候观察？记录什么？）

☐ 对话提问（关键问题是？）

☐ 学习日志（什么频率？什么问题？）

☐ 小测验（什么形式？测什么？）

☐ 自评互评（用什么工具？）

☐ 其他：__

第四步：制定简化版Rubric

选择3个最重要的评价维度，写出4分和2分的具体表现描述：

维度	4分表现	2分表现
1.
2.
3.

最后的检验：三个关键问题

设计完评估后，问自己：

问题1：对齐性检验

"我的评估真的在测持久理解吗？"

把评估任务给不知情的同事看
让他们猜"这个任务在测什么理解"
如果他们猜不到你的持久理解→评估设计偏离了

问题2：真实性检验

"这个任务像真实世界的挑战吗？"

真实世界中，谁会做类似的工作？
如果答案是"只有学生在课堂上会做这个" → 任务不够真实
优化：让任务更像专业人士/真实场景中的挑战

问题3：公平性检验

"所有学生都有机会展示理解吗？"

是否只有一种展示方式？（如只能写作文）
有没有为不同学习风格的学生提供选项？
语言障碍/文化差异是否会阻碍学生展示真实理解？

Day 24-1：阶段二深度解析——如何设计评估任务，让「理解」可见可测

一个让所有人震惊的实验

为什么评估要在第二步，而不是最后一步？

传统逻辑的陷阱

UbD逻辑的智慧

理解的六个层面（The Six Facets of Understanding）

层面1：解释（Explanation）

层面2：阐释（Interpretation）

层面3：应用（Application）

层面4：洞察（Perspective）

层面5：共情（Empathy）

层面6：自知（Self-knowledge）

UbD评估的两大类型

类型1：表现性任务（Performance Tasks）

类型2：其他证据（Other Evidence）

1. 观察记录

2. 对话与提问

3. 学习日志

4. 小测验（但不是传统那种）

5. 自评与互评

6. 项目过程记录

评分标准（Rubric）：让评估透明化

什么是Rubric？

Rubric的基本结构

案例："解释水循环"任务的Rubric

实战练习：为你的主题设计评估

工作表：评估设计

最后的检验：三个关键问题

问题1：对齐性检验

问题2：真实性检验

问题3：公平性检验

相关推荐

置顶推荐

最新文章

文章目录