• 授课方式: 线下授课 + 腾讯会议(详见课程微信群、Canvas 公告)
  • 授课地点: 上海交通大学徐汇校区
  • 课程时间: 星期六(3 月 21 日 - 6 月 27 日)
    • 下午 14 时 - 16 时 45 分

一、课程简介

本课程《走近大模型》是上海交通大学“学森挑战计划”的硬核前沿导论课程。 在大模型重塑智能范式的时代背景下,本课程旨在引领学有余力的优秀高中生探索人工智能的最前沿。

课程依托《大模型十讲》一书的知识框架,内容涵盖大语言模型(LLM)的全生命周期:从底层的机器学习与自监督学习理论出发,深度剖析Transformer网络架构、预训练与微调技术、涌现能力及对齐机制;随后跨越文本模态,探讨多模态感知、决策大模型及自主智能体(Agent)的构建。课程不仅关注技术实现,更强调科技伦理与家国情怀,旨在培养具备国际视野、扎实基础和创新内驱力的未来人工智能领军人才。

二、培养目标

基于“学森挑战计划”核心理念,本课程设定以下四大维度目标:

  • 学科导向:建立对大模型技术脉络的系统性认知。能够阅读并理解主流学术论文,熟练掌握大模型相关的核心术语。
  • 家国理想:理解人工智能对国家战略的重要性,针对“卡脖子”挑战树立科技报国志向,并建立严谨的 AI 伦理观。
  • 创新天赋:培养批判性思维,能够分析不同模型架构的优劣,并初步具备在大模型领域发现并定义问题的能力。
  • 目标驱动:通过“重实践”的课程大作业,从零构建大模型自主智能体,实现从理论认知到创新应用的跨越。

三、进度安排

课程分为三个阶段,循序渐进构建大模型时代的智能体系:

第一阶段:理论基石与技术底座

周次 日期 课题 核心知识点
1 03-21 绪论:欢迎来到大模型时代 语言模型演进(从N-gram到GPT)、发展里程碑、应用全景
2 03-28 机器学习与自监督学习 机器学习三要素、自监督学习的魔力(掩码语言模型)、海量数据价值
3 04-11 判别式 vs 生成式人工智能 概率分布建模、自回归生成原理、内容创作的新范式
4 04-18 机器学习进阶:强化学习 Agent与环境交互、奖励函数、RLHF(人类反馈对齐)的初步概念


第二阶段:核心模型与智能涌现

周次 日期 课题 核心知识点
5 04-25 预训练基石:从RNN到Transformer 注意力机制、并行计算优势、位置编码
6 05-16 LLM特性:扩展定律与安全伦理 Scaling Laws、模型调优、“幻觉”成因分析、AI 安全红线
7 05-23 跨模态:图文对齐与多模态生成 CLIP 模型、对比学习、文生图模型、跨模态理解


第三阶段:前沿范式与自主智能

周次 日期 课题 核心知识点
8 05-30 决策大模型:从对话到行动 决策表示学习、策略强化学习、大模型在动态环境中的规划能力
9 06-06 适配技术与自主智能体(Agent) 参数微调、提示学习、工具学习、ReAct 框架
10 06-13 世界模拟器与具身智能 具身智能展望、3D 生成、通用多模态智能体


四、考核方式

  • 60%: 共有三次课后思考作业,需独立完成并在规定时间内提交
    • 每次课后思考作业占总成绩的20%
  • 40%: 课程大作业汇报展示,需三人合作完成并在最后一节课进行展示
    • 时间: 6/27/2026 (线下)