课程日历
大型语言模型的行为
- 2023年1月3日
- 引言
- 讲座
- Percy Liang
- 为什么存在这门课程?
- 语言模型
- 课程概述
- 2023年1月5日
- 能力
- 讲座 讨论
- Percy Liang
- 适应框架
- 困惑度
- 提示
- GPT-3任务的概述
- 讨论论文:
- 2023年1月10日
- 危害I
- 讲座 讨论
- Rishi Bommasani
- 性能差异
- 社会偏见和刻板印象
- 讨论论文:
- 2023年1月12日
- 危害II
- 讲座 讨论
- Percy Liang
- 毒性
- 虚假信息
- 讨论论文:
大型语言模型背后的数据
- 2023年1月19日
- 数据
- 讲座 讨论
- Percy Liang
- 对现有数据集的审查
- 数据文档
- 数据生态系统
- 讨论论文:
- 2023年1月24日
- 安全与隐私
- 讲座 讨论
- Tatsunori Hashimoto
- 数据污染
- 差分隐私
- 讨论论文:
- 2023年1月26日
- 法律考虑
- 讲座 讨论
- Percy Liang
- 版权法
- 公平使用
- 讨论论文:
构建大型语言模型
- 2023年1月31日
- 建模
- 讲座 讨论
- Percy Liang
- 分词
- RNNs, Transformers
- 讨论论文:
- 2023年2月2日
- 训练
- 讲座 讨论
- Percy Liang
- 目标函数
- 稳定性
- 调试
- 讨论论文:
- 2023年2月7日
- 并行主义
- 讲座 讨论
- Christopher Ré
- 数据并行主义
- 模型并行主义
- 管道并行主义
- 讨论论文:
- 2023年2月9日
- 扩展定律
- 讲座 讨论
- Tatsunori Hashimoto
- 扩展定律
- 讨论论文:
- 2023年2月14日
- 模块化架构
- 讲座 讨论
- Percy Liang
- 专家混合
- 记忆增强(检索)模型
- 讨论论文:
- 2023年2月16日
- 适应
- 讲座 讨论
- Sang Michael Xie
- 探测
- 微调
- 轻量级微调
- 讨论论文:
- 2023年2月23日
- 环境影响
- 讲座 讨论
- Percy Liang
- 训练和推理成本
- 碳排放
- 讨论论文:
超越大型语言模型