hao.ren8.com
知识库

Day 24-1:阶段二深度解析——如何设计评估任务,让「理解」可见可测

一个让所有人震惊的实验

2018年,斯坦福大学做了一个著名的教育实验。

研究者找了两组小学生,让他们学习「浮力」的概念。

A组(传统评估)

  • 学习2周后,做一份试卷
  • 问题:"什么是浮力?""浮力的公式是什么?""为什么船能浮在水上?"
  • 结果:90%的学生得了高分

B组(UbD评估)

  • 学习2周后,给每个学生一块橡皮泥和一个装水的容器
  • 任务:"这块橡皮泥通常会沉到水底。现在请你想办法让它浮起来,并解释你的设计原理。"
  • 结果:只有35%的学生能成功完成任务

震惊的发现

  • A组得高分的学生中,70%在B组的实际任务中失败了
  • 他们能"说出"浮力的定义,但不会"运用"浮力的原理

为什么评估要在第二步,而不是最后一步?

传统逻辑的陷阱

大多数教师的设计顺序:

1. 确定要教的内容
2. 设计教学活动
3. 教完之后,想个测试题检验一下

问题

  • 评估成了"事后补充",往往流于形式
  • 测试题通常只测"记住了什么",不测"理解了什么"
  • 教和考脱节:教的是A,考的是B

UbD逻辑的智慧

1. 确定持久理解(学生应该理解什么)
2. 确定评估证据(如何知道他们真的理解了)← 这是第二步!
3. 设计学习体验(什么活动能产生这种理解)

为什么先设计评估?

类比:导航目的地

  • 你不会说"我先开车,开完了再想去哪儿"
  • 你会先确定目的地(持久理解),然后设定导航(评估标准),最后选择路线(教学活动)

实际效果

  • 评估标准明确了,教学活动自然对齐
  • 知道"终点"长什么样,就不会在路上迷失
  • 学生从第一天就知道"我们要去哪里",学习更有方向感

理解的六个层面(The Six Facets of Understanding)

Wiggins和McTighe发现:"理解"不是单一的状态,而是六个维度的综合

层面1:解释(Explanation)

定义:能用自己的话解释概念,并阐明其背后的"为什么"

表现

  • ❌ 复述教科书的定义
  • ✅ 用类比、例子、因果关系来说明概念

评估方式

  • "请向一个从未听说过[概念]的人解释它,让他能明白。"
  • "为什么会发生[现象]?背后的原因是什么?"

案例(小学科学-种子发芽)

  • 低层次:"种子需要水、阳光和土壤才能发芽。"(背诵)
  • 高层次:"种子就像一个睡着的婴儿,它身体里储存了'醒来'的能量。当水进入种子,就像闹钟响了,种子开始醒来。它先从壳里长出小根,因为它需要找到更多的水和营养,就像婴儿醒来后要找妈妈要奶喝。阳光告诉种子'外面安全了,可以长出来了'。"(解释)

层面2:阐释(Interpretation)

定义:能发现和解读意义、模式和重要性

表现

  • ❌ 看到表面信息
  • ✅ 看到深层含义和联系

评估方式

  • "这个故事/数据/现象告诉我们什么?"
  • "为什么这个很重要?"
  • "这和我们之前学的[X]有什么联系?"

案例(小学语文-读《小王子》)

  • 低层次:"小王子遇到了一朵玫瑰花。"(字面理解)
  • 高层次:"小王子和玫瑰的关系让我明白:真正的爱不是占有,而是愿意为对方花时间。就像狐狸说的'驯养'——当你对一个人投入了时间和关心,这个人就变得独一无二了。这也解释了为什么小王子在看到5000朵玫瑰时会哭,因为他意识到他的那朵玫瑰因为他的陪伴而变得特别。"(深度阐释)

层面3:应用(Application)

定义:能在新的、真实的情境中有效运用知识

表现

  • ❌ 只能做教过的题目
  • ✅ 能把学到的运用到从未见过的新问题

评估方式

  • "现在你遇到[全新情境],你会如何运用[概念]来解决?"
  • "设计/创造一个[产品]来解决[真实问题]"

案例(小学数学-面积概念)

  • 低层次:"长方形面积=长×宽,所以4×3=12平方米。"(套公式)
  • 高层次任务:"妈妈要给你的房间买新地毯。房间是不规则形状(提供平面图)。请你:1) 算出需要多大的地毯 2) 去建材市场网站查价格 3) 设计3个不同预算的方案 4) 向妈妈推荐你认为最好的方案并说明理由。"(真实应用)

层面4:洞察(Perspective)

定义:能从多个角度看问题,理解他人的观点

表现

  • ❌ 认为只有一个"正确答案"
  • ✅ 能看到不同视角,理解复杂性

评估方式

  • "不同的人可能如何看待这个问题?"
  • "如果你是[另一个角色],你会怎么想?"
  • "这个决定的利弊各是什么?"

案例(小学社会-城市建设主题)

  • 低层次:"城市应该多建公园,因为环境好。"(单一视角)

  • 高层次任务:"市长要决定把一块空地建成公园还是停车场。请你分别从以下角色的角度写一封信给市长:

    • 住在附近的老人(想要散步的地方)
    • 开车上班的年轻父母(停车难)
    • 环保组织成员(关心绿化)
    • 房地产开发商(想建商场)

    然后,如果你是市长,你会如何平衡这些不同的需求?"(多角度洞察)

层面5:共情(Empathy)

定义:能从内心理解他人的感受和世界观

表现

  • ❌ 知识性地"知道"别人的观点
  • ✅ 情感上"感同身受"

评估方式

  • "想象你是[角色],你会有什么感受?"
  • "为什么[人物]会做出这个选择?"
  • "如果发生在你身上,你会...?"

案例(小学历史-战争主题)

  • 低层次:"战争中很多人死了,很悲惨。"(表面认知)
  • 高层次任务:"读这三封真实的二战家书:士兵写给妻子的、母亲写给前线儿子的、孩子写给失踪父亲的。
    • 选一封最触动你的,写下你读时的感受
    • 如果你是信的作者,在写这封信时你在想什么?怕什么?希望什么?
    • 完成一个艺术作品(绘画/诗歌/音乐)来表达这些情感
    • 反思:为什么学习历史不只是记住日期和事件,更要理解人的故事?"(深度共情)

层面6:自知(Self-knowledge)

定义:认识到自己的理解和误解,知道自己如何学习和思考

表现

  • ❌ 不知道自己哪里懂、哪里不懂
  • ✅ 能反思学习过程,识别自己的思维模式和盲点

评估方式

  • "这个主题中,什么让你最困惑?为什么?"
  • "你的想法如何改变的?"
  • "你在这个学习过程中发现了自己的什么特点?"

案例(小学数学-分数学习)

  • 低层次:"我学会分数了。"(笼统自评)
  • 高层次任务:"完成这份学习日志:
    • 学习前我认为:分数就是两个数字,一个在上一个在下
    • 让我困惑的时刻:当老师说1/2和2/4是一样的,我完全懵了,因为它们看起来明明不一样啊!
    • 我的突破:当我把披萨切成4块拿走2块,和切成2块拿走1块,发现拿到的一样多时,我突然明白了!原始份数不一样,但实际量是一样的。
    • 我现在理解的:分数不是'两个数字',而是'一个量',它表达的是'部分占整体的比例'。
    • 我还想知道:为什么除法和分数这么像?它们之间有什么关系?
    • 我发现我学习数学的方式是:我需要用实物操作才能理解,光听讲我会忘。"(深度元认知)

UbD评估的两大类型

类型1:表现性任务(Performance Tasks)

定义:要求学生在真实或模拟的复杂情境中展示理解的综合性任务

特点

  • 真实性:类似真实世界中的挑战
  • 复杂性:需要综合运用多种知识和技能
  • 开放性:可以有多种合理的解决方案
  • 持续性:通常需要数天到数周完成

设计框架:GRASPS模型

这是UbD最著名的任务设计工具,六个要素缩写:

  • G - Goal(目标):你的任务/挑战是什么?
  • R - Role(角色):你的身份是什么?
  • A - Audience(受众):你为谁做这个?
  • S - Situation(情境):背景和限制条件是什么?
  • P - Product(产品):你要创造什么?
  • S - Standards(标准):如何评判成功?

案例1:"健康饮食"主题(小学3年级)

G - Goal(目标):设计一份营养均衡的学校午餐菜单

R - Role(角色):你是学校食堂的营养师

A - Audience(受众):你要说服校长采用你的菜单方案

S - Situation(情境):学校收到很多家长投诉,说孩子们不喜欢现在的午餐,经常不吃完。同时,学校体检发现一些学生营养不良或肥胖。你的预算是每人每餐15元。

P - Product(产品)

  1. 一份一周的午餐菜单(包含营养成分标注)
  2. 一份给校长的说明书(解释你的设计理念)
  3. 一张海报向学生介绍新菜单(让他们想吃)

S - Standards(标准)

  • 营养均衡:每餐包含谷物、蛋白质、蔬菜、水果
  • 符合预算:每餐成本≤15元
  • 吸引学生:至少3道孩子喜欢的菜
  • 多样性:一周不重复
  • 解释清晰:能说明为什么这样搭配健康

为什么这是好的表现性任务?

  • 真实:营养师真的会做这样的工作
  • 综合:需要营养知识+数学计算+说服技巧+创意设计
  • 多层面理解:解释(营养原理)+应用(设计菜单)+洞察(平衡健康和美味)+共情(考虑孩子的喜好)

案例2:"水循环"主题(小学5年级)

G - Goal(目标):设计一个解决方案来应对城市缺水危机

R - Role(角色):你是环境工程师团队成员

A - Audience(受众):市政府官员和社区居民

S - Situation(情境):你所在的城市连续三年干旱,水库水位降到历史最低。政府在考虑多个方案:海水淡化、云层播种、限制用水、水循环利用系统。每个方案都有利弊。

P - Product(产品)

  1. 一个可行性报告(分析至少2个方案的科学原理、成本、环境影响)
  2. 一个社区节水计划(教育居民如何在日常生活中节水)
  3. 一个实物模型或视频(展示你推荐的方案如何运作)

S - Standards(标准)

  • 科学准确性:正确运用水循环原理
  • 系统思维:考虑长期影响,不只是短期效果
  • 多角度分析:评估经济、环境、社会三个维度
  • 说服力:有数据支持,逻辑清晰
  • 创新性:提出原创的改进建议

类型2:其他证据(Other Evidence)

定义:除了表现性任务,还需要多种方式持续收集学习证据

类型清单

1. 观察记录

  • 教师在活动中观察学生的表现
  • 记录关键时刻:"今天小明在实验中说'哦!我明白为什么了',然后他解释..."
  • 特别关注:卡住的时刻(哪里困惑)、突破的时刻(何时顿悟)

2. 对话与提问

  • 苏格拉底式对话:"你为什么这么认为?""如果...会怎样?""你能举个例子吗?"
  • 同伴讨论:听学生如何向彼此解释
  • 一对一会议:深入了解个体理解

3. 学习日志

  • 每日反思:今天学到了什么?什么让我困惑?
  • 概念图:画出概念之间的联系
  • "我曾经以为...现在我知道..."句式

4. 小测验(但不是传统那种)

  • ✅ 开放性问题:"用3种不同的方法解释[概念]"
  • ✅ 应用题:"设计一个实验来测试[假设]"
  • ❌ 选择题:"浮力的定义是 A/B/C/D"

5. 自评与互评

  • 学生用评分标准(rubric)评价自己的作品
  • 同伴反馈:"你的作品最好的部分是...我建议你可以..."
  • 反思:"我这次比上次进步的地方是..."

6. 项目过程记录

  • 草稿和修改版本的对比
  • 决策记录:"我选择做[X]因为..."
  • 失败和调整的记录

评分标准(Rubric):让评估透明化

什么是Rubric?

定义:一个明确的评分指南,描述不同表现水平的具体特征

为什么需要它?

  • 让"好"和"不好"从主观判断变成客观标准
  • 学生从第一天就知道"优秀"长什么样
  • 教师评分更公平一致
  • 学生可以自评和互评

Rubric的基本结构

评价维度 4分(优秀) 3分(良好) 2分(合格) 1分(需改进)
维度1 具体描述 具体描述 具体描述 具体描述
维度2 具体描述 具体描述 具体描述 具体描述

关键原则

  • 每个格子都是具体的行为描述,不是笼统的词汇
  • ❌ "很好""不错""需要努力" → 太模糊
  • ✅ "能用3个不同例子解释概念""能用1个例子解释概念" → 具体明确

案例:"解释水循环"任务的Rubric

评价维度 4分(深度理解) 3分(基本理解) 2分(部分理解) 1分(需支持)
科学准确性 准确解释水循环的每个阶段,并说明能量的作用(太阳能驱动蒸发)。没有科学错误。 准确解释主要阶段(蒸发、凝结、降水),但对能量角色解释不清。有1-2个小错误。 能说出一些阶段,但顺序混乱或有明显概念错误(如"水向上跑到云里") 只能说出个别词汇("下雨"),无法解释过程
深度理解(系统思维) 能解释水循环是一个闭合系统,水的总量不变,只是形态和位置改变。能联系到其他循环系统(碳循环、季节循环) 理解水在循环中不会消失,但无法清晰阐述"系统"概念或做跨领域联系 将水循环描述为线性过程(海洋→云→雨),缺乏"循环"和"系统"的理解 认为水会"用完"或"消失",没有循环概念
沟通表达 使用类比、图示、例子让非专业人士也能理解。语言流畅,逻辑清晰。 解释清楚,但主要依赖科学术语,对外行人可能有理解障碍 解释不连贯,跳跃,听者需要努力才能跟上思路 无法完整表达,只有片段信息
应用能力 能用水循环原理解释真实现象(如"为什么沿海地区雨水多"),并预测改变某个环节的后果(如"如果森林被砍光会影响降雨") 能解释1-2个真实现象,但对"改变会怎样"的预测不够深入 只能复述学过的例子,不能应用到新情境 无法将概念与真实世界联系

使用方法

  1. 任务布置时,给学生看这个Rubric:"这就是我们追求的目标"
  2. 学生完成任务后,先自评:"我觉得我在各个维度的表现是..."
  3. 教师评分,并指出具体证据:"你在[维度]达到4分,因为你..."
  4. 反馈时聚焦改进路径:"要达到下一个水平,你可以尝试..."

实战练习:为你的主题设计评估

工作表:评估设计

主题:_

持久理解:____(来自Day 23-2)

第一步:确定要评估的理解层面

我最想看到学生展示的是:(至少选3个)

☐ 解释:能清楚阐明概念背后的"为什么"

☐ 阐释:能看到深层意义和联系

☐ 应用:能在新情境中运用

☐ 洞察:能从多角度看问题

☐ 共情:能理解他人的感受和处境

☐ 自知:能反思自己的学习过程

第二步:设计表现性任务(用GRASPS)

G - Goal(目标):学生的挑战是__

R - Role(角色):学生扮演__

A - Audience(受众):为__完成

S - Situation(情境):背景是__

P - Product(产品):创造__

S - Standards(标准):成功的关键是__

第三步:设计其他证据收集方式

我将通过以下方式持续了解学生的理解:

☐ 观察记录(什么时候观察?记录什么?)

☐ 对话提问(关键问题是?)

☐ 学习日志(什么频率?什么问题?)

☐ 小测验(什么形式?测什么?)

☐ 自评互评(用什么工具?)

☐ 其他:__

第四步:制定简化版Rubric

选择3个最重要的评价维度,写出4分和2分的具体表现描述:

维度 4分表现 2分表现
1.
2.
3.

最后的检验:三个关键问题

设计完评估后,问自己:

问题1:对齐性检验

"我的评估真的在测持久理解吗?"

  • 把评估任务给不知情的同事看
  • 让他们猜"这个任务在测什么理解"
  • 如果他们猜不到你的持久理解→评估设计偏离了

问题2:真实性检验

"这个任务像真实世界的挑战吗?"

  • 真实世界中,谁会做类似的工作?
  • 如果答案是"只有学生在课堂上会做这个" → 任务不够真实
  • 优化:让任务更像专业人士/真实场景中的挑战

问题3:公平性检验

"所有学生都有机会展示理解吗?"

  • 是否只有一种展示方式?(如只能写作文)
  • 有没有为不同学习风格的学生提供选项?
  • 语言障碍/文化差异是否会阻碍学生展示真实理解?
未经允许不得转载:似水流年 » Day 24-1:阶段二深度解析——如何设计评估任务,让「理解」可见可测