题目

请就以下题目展开自己的思考和理解,每道题回答不少于100字(共4题)

1. 大语言模型的 Scaling Laws

大语言模型的性能与理解能力并不是随着模型参数规模与数据量的增加而线性提升,而是在到达某一规模后出现”顿悟”式的突破,请结合课堂内容以及个人学习知识的过程谈谈为什么会出现这种现象。

2. 大语言模型在预训练中学到了什么

大语言模型的预训练到底是从训练数据集中死记硬背,还是像人类一样学到了物理世界中的实际规律?请各位同学谈谈自己对大语言模型训练过程的理解。

3. 大语言模型在生活中的应用

人工智能模型早已深入到生活中的点点滴滴,早期的人脸识别,到自动驾驶,再到现在火爆全网的大语言模型。请谈一谈除了撰写文本以及知识问答,大语言模型还能在哪些方面帮助大家,以及大家希望未来的大语言模型能够进一步帮助大家完成哪些现在还未实现的东西。

4. 大模型的概念理解

结合”规模效应”、”并行化”、”高效训练”、”高效推理”等在课堂上学习到的概念,谈谈这些概念是什么,你怎么理解的,以及不同概念之间的关系。

此外,请结合个人实际生活,在撰写理解的过程中使用三个修辞手法并加粗,例如比喻、夸张、借代、通感、排比等,可以重复使用同一种修辞手法。修辞示例:

  • 示例1:模型并行化就好比我在吃午餐的时候同时背单词、做数学题、背生物知识点,还能同时打王者、打和平精英、打第五人格、打光遇、打英雄联盟、打原神、打星穹,效率一下子就提上去了。
  • 示例2:高效训练和高效推理看起来很像,但是实际上的技术实现走的是不同的路径,就好比我们班的两个双胞胎,长得很像,但是一个喜欢热闹,比如打篮球,另一个喜欢安静,比如读书
  • 示例3:大模型的规模效应本质上也是从混沌初开到灵窍妙悟的过程,亦如我在语文阅读理解上,从最初难以理解,到读书够多、做题够多,最终在某一刻醍醐灌顶,悟得其中真味

要求

请同学们按照以下三个步骤完成作业:

  1. 闭卷阶段:在不借助任何工具书和大模型的情况下,写出自己对题目的理解
  2. 开卷阶段:在可以查看PPT的情况下,再次写出自己的理解
  3. 参考模型:将任务输给大模型,获得大模型视角下的理解

将以上三部分内容整理到一个文档中,加上比较和分析,最终在 Canvas 平台上提交一份 PDF 文档