Skip to main content Link Search Menu Expand Document (external link)

课程日历

第一周

Jan 9
讲座Introduction (介绍)
Percy Liang
Jan 11
主题FlashAttention
Tri Dao (来自斯坦福大学)
阅读材料

阅读材料

说明

  • 第一周课程提供了一个关于Transformer模型和GPU加速深度学习的基本介绍和资源列表。
  • 特别提到了一篇重要的论文《Attention Is All You Need》,这篇论文详细介绍了Transformer模型的架构和原理,对于理解现代深度学习模型中的注意力机制至关重要。
  • 还提供了一些辅助材料,帮助读者更好地理解深度学习在GPU上的性能优化。

第二周

Jan 18
主题Model Training (模型训练)
Ce Zhang

第三周

Jan 23
讲座Scaling Laws and Emergent Behavior
Tatsu Hashimoto
Jan 25
主题Pathways Language Model (PaLM) and Model Scaling
Aakanksha Chowdhery (Google Brain)

Jan 23

  • 主题: Scaling Laws and Emergent Behavior (规模法则与突现行为)
  • 演讲者: Tatsu Hashimoto

Jan 25

说明

  • 1月23日,Tatsu Hashimoto将举行一场关于规模法则与突现行为的讲座。
  • 1月25日,Aakanksha Chowdhery将就Google Brain的Pathways Language Model(PaLM)及其模型扩展进行演讲。可以通过提供的链接访问更多关于PaLM的信息。

第四周

Jan 30
讲座Mechanistic Interpretability – Reverse Engineering Learned Algorithms from Transformers
Stella Biderman (EleutherAI, Booz Allen Hamilton)
Feb 1
主题A data-centric view on reliable generalization
Ludwig Schmidt

Jan 30

  • 事件: 讲座 (Lecture)
  • 主题: Mechanistic Interpretability – Reverse Engineering Learned Algorithms from Transformers (机制解释性 - 从 Transformer 中逆向工程学习算法)
  • 演讲者: Stella Biderman
  • 演讲者隶属机构: EleutherAI, Booz Allen Hamilton
  • 演讲者信息: Stella Biderman’s Personal Website

Feb 1

  • 事件: 主题 (Topic)
  • 主题: A data-centric view on reliable generalization (数据驱动的可靠泛化视角)
  • 演讲者: Ludwig Schmidt
  • 备注: 未提供演讲者隶属机构或其他详细信息

说明

  • 1月30日,Stella Biderman将就Transformer中学习算法的逆向工程进行讲座,探讨机制解释性。
  • 2月1日,Ludwig Schmidt将讨论关于如何通过数据驱动的方法来实现可靠的泛化。

第五周

Feb 6
讲座Security + Privacy
Tatsu Hashimoto
Feb 8
主题Building ML Models like Open-Source Software
Colin Raffel (UNC, Hugging Face)

Feb 6

  • 事件: Lecture (讲座)
  • 主题: Security + Privacy (安全性与隐私)
  • 演讲者: Tatsu Hashimoto
  • 备注: 无具体备注信息

Feb 8

  • 事件: Speaker (演讲者)
  • 主题: Building ML Models like Open-Source Software (像构建开源软件一样构建机器学习模型)
  • 演讲者: Colin Raffel
  • 演讲者隶属机构: UNC (北卡罗来纳大学), Hugging Face
  • 演讲者信息: Colin Raffel’s Personal Website

说明

  • 2月6日,Tatsu Hashimoto将举行一场关于安全性与隐私的讲座。
  • 2月8日,Colin Raffel将就如何像构建开源软件一样构建机器学习模型进行演讲。可以通过提供的链接访问Colin Raffel的相关博客文章,以获取更多背景信息和细节。

第六周

Feb 13
主题Unlocking the RNA Universe
Raphael Townshend (Atomic AI)
Feb 15
主题Foundation Model Ethics
Rob Reich (Stanford)

Feb 13

  • 事件: Speaker (演讲者)
  • 主题: Unlocking the RNA Universe (解锁 RNA 宇宙)
  • 演讲者: Raphael Townshend
  • 演讲者隶属机构: Atomic AI
  • 演讲者信息: Raphael Townshend’s Personal Website

Feb 15

  • 事件: Speaker (演讲者)
  • 主题: Foundation Model Ethics (基础模型伦理)
  • 演讲者: Rob Reich
  • 演讲者隶属机构: Stanford University (斯坦福大学)
  • 演讲者信息: Rob Reich’s Stanford Profile

说明

  • 2月13日,Raphael Townshend将就解锁 RNA 宇宙这一主题进行讲座,他是来自 Atomic AI 的专家。
  • 2月15日,Rob Reich将就基础模型伦理进行演讲,他是斯坦福大学政治科学系的成员。

第七周

Feb 22
主题Poisoning web-scale datasets is practical
Nicholas Carlini (Google Brain)

Feb 22

  • 事件: Speaker (演讲)
  • 主题: Poisoning web-scale datasets is practical (对网络规模数据集投毒是可行的)
  • 演讲者: Nicholas Carlini
  • 演讲者隶属机构: Google Brain
  • 演讲者信息: Nicholas Carlini’s Personal Website

说明

  • 2月22日,Nicholas Carlini将就”对网络规模数据集投毒是可行的”这一主题进行演讲,他是来自 Google Brain 的专家。

第八周

Feb 27
主题Compression for AGI
Jack Rae (OpenAI)
Mar 1
SpeakerTalk TBD
Susan Zhang (Meta)

第九周

Mar 6
SpeakerTalk TBD
Yejin Choi (University of Washington, Allen Institute for AI)
Mar 8
SpeakerTalk TBD
Jared Kaplan (Anthropic)

第十周

Mar 13
Speaker or Final Presentations (TBD)
TBD
Mar 15
Final Presentations