题目

请结合 Agent 与环境交互相关内容展开思考,正文不少于100字。

在 Agent 与环境交互时,始终面临“探索新动作”和“利用已知高收益动作”的矛盾。请结合你在生活中学习一项新技能,如打球或玩新游戏的经验,谈谈你是如何平衡这两者的。

提交要求

请同学们按照以下三个步骤完成作业:

  1. 闭卷阶段:在不借助任何工具书和大模型的情况下,写出自己对题目的理解。
  2. 开卷阶段:在可以查看 PPT 的情况下,再次写出自己的理解。
  3. 参考模型:将任务输给大模型,获得大模型视角下的理解。

将以上三部分内容整理到一个文档中,加上比较和分析,最终在 Canvas 平台提交一份 Word 文档。可接受后缀名:.doc.docx