课后思考 #2 - 自监督学习的“魔力”
题目
请结合机器学习基础与自监督学习的相关内容展开思考,正文不少于100字。
在人类的学习过程中,我们往往需要老师指出对错(监督学习)。但大模型通过“掩码语言模型”等自监督学习方式,利用海量无标注数据就获得了惊人的能力。请谈谈你对自监督学习机制的理解,它为什么能发掘出海量数据的价值?
提交要求
请同学们按照以下三个步骤完成作业:
- 闭卷阶段:在不借助任何工具书和大模型的情况下,写出自己对题目的理解。
- 开卷阶段:在可以查看 PPT 的情况下,再次写出自己的理解。
- 参考模型:将任务输给大模型,获得大模型视角下的理解。
将以上三部分内容整理到一个文档中,加上比较和分析,最终在 Canvas 平台提交一份 Word 文档。可接受后缀名:.doc、.docx。