题目

请结合机器学习基础与自监督学习的相关内容展开思考,正文不少于100字。

在人类的学习过程中,我们往往需要老师指出对错(监督学习)。但大模型通过“掩码语言模型”等自监督学习方式,利用海量无标注数据就获得了惊人的能力。请谈谈你对自监督学习机制的理解,它为什么能发掘出海量数据的价值?

提交要求

请同学们按照以下三个步骤完成作业:

  1. 闭卷阶段:在不借助任何工具书和大模型的情况下,写出自己对题目的理解。
  2. 开卷阶段:在可以查看 PPT 的情况下,再次写出自己的理解。
  3. 参考模型:将任务输给大模型,获得大模型视角下的理解。

将以上三部分内容整理到一个文档中,加上比较和分析,最终在 Canvas 平台提交一份 Word 文档。可接受后缀名:.doc.docx