教学大纲
- 授课方式: 线下授课 + 腾讯会议(详见课程微信群、Canvas 公告)
- 授课地点: 上海交通大学徐汇校区
- 课程时间: 星期六(3 月 21 日 - 6 月 27 日)
- 下午 14 时 - 16 时 45 分
一、课程简介
本课程《走近大模型》是上海交通大学“学森挑战计划”的硬核前沿导论课程。 在大模型重塑智能范式的时代背景下,本课程旨在引领学有余力的优秀高中生探索人工智能的最前沿。
课程依托《大模型十讲》一书的知识框架,内容涵盖大语言模型(LLM)的全生命周期:从底层的机器学习与自监督学习理论出发,深度剖析Transformer网络架构、预训练与微调技术、涌现能力及对齐机制;随后跨越文本模态,探讨多模态感知、决策大模型及自主智能体(Agent)的构建。课程不仅关注技术实现,更强调科技伦理与家国情怀,旨在培养具备国际视野、扎实基础和创新内驱力的未来人工智能领军人才。
二、培养目标
基于“学森挑战计划”核心理念,本课程设定以下四大维度目标:
- 学科导向:建立对大模型技术脉络的系统性认知。能够阅读并理解主流学术论文,熟练掌握大模型相关的核心术语。
- 家国理想:理解人工智能对国家战略的重要性,针对“卡脖子”挑战树立科技报国志向,并建立严谨的 AI 伦理观。
- 创新天赋:培养批判性思维,能够分析不同模型架构的优劣,并初步具备在大模型领域发现并定义问题的能力。
- 目标驱动:通过“重实践”的课程大作业,从零构建大模型自主智能体,实现从理论认知到创新应用的跨越。
三、进度安排
课程分为三个阶段,循序渐进构建大模型时代的智能体系:
第一阶段:理论基石与技术底座
| 周次 | 日期 | 课题 | 核心知识点 |
|---|---|---|---|
| 1 | 03-21 | 绪论:欢迎来到大模型时代 | 语言模型演进(从N-gram到GPT)、发展里程碑、应用全景 |
| 2 | 03-28 | 机器学习与自监督学习 | 机器学习三要素、自监督学习的魔力(掩码语言模型)、海量数据价值 |
| 3 | 04-11 | 判别式 vs 生成式人工智能 | 概率分布建模、自回归生成原理、内容创作的新范式 |
| 4 | 04-18 | 机器学习进阶:强化学习 | Agent与环境交互、奖励函数、RLHF(人类反馈对齐)的初步概念 |
第二阶段:核心模型与智能涌现
| 周次 | 日期 | 课题 | 核心知识点 |
|---|---|---|---|
| 5 | 04-25 | 预训练基石:从RNN到Transformer | 注意力机制、并行计算优势、位置编码 |
| 6 | 05-16 | LLM特性:扩展定律与安全伦理 | Scaling Laws、模型调优、“幻觉”成因分析、AI 安全红线 |
| 7 | 05-23 | 跨模态:图文对齐与多模态生成 | CLIP 模型、对比学习、文生图模型、跨模态理解 |
第三阶段:前沿范式与自主智能
| 周次 | 日期 | 课题 | 核心知识点 |
|---|---|---|---|
| 8 | 05-30 | 决策大模型:从对话到行动 | 决策表示学习、策略强化学习、大模型在动态环境中的规划能力 |
| 9 | 06-06 | 适配技术与自主智能体(Agent) | 参数微调、提示学习、工具学习、ReAct 框架 |
| 10 | 06-13 | 世界模拟器与具身智能 | 具身智能展望、3D 生成、通用多模态智能体 |
四、考核方式
- 60%: 共有三次课后思考作业,需独立完成并在规定时间内提交
- 每次课后思考作业占总成绩的20%
- 40%: 课程大作业汇报展示,需三人合作完成并在最后一节课进行展示
- 时间: 6/27/2026 (线下)