Link Search Menu Expand Document

课程日历

大型语言模型的行为

2023年1月3日
引言
讲座
Percy Liang
  1. 为什么存在这门课程?
  2. 语言模型
  3. 课程概述
2023年1月5日
能力
讲座 讨论
Percy Liang
  1. 适应框架
  2. 困惑度
  3. 提示
  4. GPT-3任务的概述
讨论论文:
2023年1月10日
危害I
讲座 讨论
Rishi Bommasani
  1. 性能差异
  2. 社会偏见和刻板印象
讨论论文:
2023年1月12日
危害II
讲座 讨论
Percy Liang
  1. 毒性
  2. 虚假信息
讨论论文:

大型语言模型背后的数据

2023年1月19日
数据
讲座 讨论
Percy Liang
  1. 对现有数据集的审查
  2. 数据文档
  3. 数据生态系统
讨论论文:
2023年1月24日
安全与隐私
讲座 讨论
Tatsunori Hashimoto
  1. 数据污染
  2. 差分隐私
讨论论文:
2023年1月26日
法律考虑
讲座 讨论
Percy Liang
  1. 版权法
  2. 公平使用
讨论论文:

构建大型语言模型

2023年1月31日
建模
讲座 讨论
Percy Liang
  1. 分词
  2. RNNs, Transformers
讨论论文:
2023年2月2日
训练
讲座 讨论
Percy Liang
  1. 目标函数
  2. 稳定性
  3. 调试
讨论论文:
2023年2月7日
并行主义
讲座 讨论
Christopher Ré
  1. 数据并行主义
  2. 模型并行主义
  3. 管道并行主义
讨论论文:
2023年2月9日
扩展定律
讲座 讨论
Tatsunori Hashimoto
  1. 扩展定律
讨论论文:
2023年2月14日
模块化架构
讲座 讨论
Percy Liang
  1. 专家混合
  2. 记忆增强(检索)模型
讨论论文:
2023年2月16日
适应
讲座 讨论
Sang Michael Xie
  1. 探测
  2. 微调
  3. 轻量级微调
讨论论文:
2023年2月23日
环境影响
讲座 讨论
Percy Liang
  1. 训练和推理成本
  2. 碳排放
讨论论文:

超越大型语言模型

2023年2月28日
嘉宾讲座
讲座 讨论
Maxwell Nye
2023年3月2日
嘉宾讲座
讲座 讨论
Margaret MitchellStella Biderman
2023年3月7日
项目展示
学生展示
2023年3月9日
项目展示
学生展示