课程日历
第一周
- Jan 9
- 讲座Introduction (介绍)
- Percy Liang
- Jan 11
- 主题FlashAttention
- Tri Dao (来自斯坦福大学)
- 阅读材料
阅读材料
- 有关Transformer和GPU的两篇短博客文章:
- The Illustrated Transformer - 介绍Transformer的图解。
- Attention is All You Need - 论文,可选,但推荐阅读。
- 有关深度学习和GPU的阅读材料:
- Making Deep Learning Go Brrrr From First Principles - 从第一原理出发让深度学习加速的文章。
- NVIDIA deep learning performance guide - NVIDIA深度学习性能指南。
说明
- 第一周课程提供了一个关于Transformer模型和GPU加速深度学习的基本介绍和资源列表。
- 特别提到了一篇重要的论文《Attention Is All You Need》,这篇论文详细介绍了Transformer模型的架构和原理,对于理解现代深度学习模型中的注意力机制至关重要。
- 还提供了一些辅助材料,帮助读者更好地理解深度学习在GPU上的性能优化。
第二周
- Jan 18
- 主题Model Training (模型训练)
- Ce Zhang
第三周
- Jan 23
- 讲座Scaling Laws and Emergent Behavior
- Tatsu Hashimoto
- Jan 25
- 主题Pathways Language Model (PaLM) and Model Scaling
- Aakanksha Chowdhery (Google Brain)
Jan 23
- 主题: Scaling Laws and Emergent Behavior (规模法则与突现行为)
- 演讲者: Tatsu Hashimoto
Jan 25
- 主题: Pathways Language Model (PaLM) and Model Scaling (路径语言模型与模型扩展)
- 演讲者: Aakanksha Chowdhery (Google Brain)
- 演讲者信息: Aakanksha Chowdhery’s Personal Website
- 相关链接: Google AI Blog Post on PaLM
说明
- 1月23日,Tatsu Hashimoto将举行一场关于规模法则与突现行为的讲座。
- 1月25日,Aakanksha Chowdhery将就Google Brain的Pathways Language Model(PaLM)及其模型扩展进行演讲。可以通过提供的链接访问更多关于PaLM的信息。
第四周
- Jan 30
- 讲座Mechanistic Interpretability – Reverse Engineering Learned Algorithms from Transformers
- Stella Biderman (EleutherAI, Booz Allen Hamilton)
- Feb 1
- 主题A data-centric view on reliable generalization
- Ludwig Schmidt
Jan 30
- 事件: 讲座 (Lecture)
- 主题: Mechanistic Interpretability – Reverse Engineering Learned Algorithms from Transformers (机制解释性 - 从 Transformer 中逆向工程学习算法)
- 演讲者: Stella Biderman
- 演讲者隶属机构: EleutherAI, Booz Allen Hamilton
- 演讲者信息: Stella Biderman’s Personal Website
Feb 1
- 事件: 主题 (Topic)
- 主题: A data-centric view on reliable generalization (数据驱动的可靠泛化视角)
- 演讲者: Ludwig Schmidt
- 备注: 未提供演讲者隶属机构或其他详细信息
说明
- 1月30日,Stella Biderman将就Transformer中学习算法的逆向工程进行讲座,探讨机制解释性。
- 2月1日,Ludwig Schmidt将讨论关于如何通过数据驱动的方法来实现可靠的泛化。
第五周
- Feb 6
- 讲座Security + Privacy
- Tatsu Hashimoto
- Feb 8
- 主题Building ML Models like Open-Source Software
- Colin Raffel (UNC, Hugging Face)
Feb 6
- 事件: Lecture (讲座)
- 主题: Security + Privacy (安全性与隐私)
- 演讲者: Tatsu Hashimoto
- 备注: 无具体备注信息
Feb 8
- 事件: Speaker (演讲者)
- 主题: Building ML Models like Open-Source Software (像构建开源软件一样构建机器学习模型)
- 相关链接: 博客文章
- 演讲者: Colin Raffel
- 演讲者隶属机构: UNC (北卡罗来纳大学), Hugging Face
- 演讲者信息: Colin Raffel’s Personal Website
说明
- 2月6日,Tatsu Hashimoto将举行一场关于安全性与隐私的讲座。
- 2月8日,Colin Raffel将就如何像构建开源软件一样构建机器学习模型进行演讲。可以通过提供的链接访问Colin Raffel的相关博客文章,以获取更多背景信息和细节。
第六周
- Feb 13
- 主题Unlocking the RNA Universe
- Raphael Townshend (Atomic AI)
- Feb 15
- 主题Foundation Model Ethics
- Rob Reich (Stanford)
Feb 13
- 事件: Speaker (演讲者)
- 主题: Unlocking the RNA Universe (解锁 RNA 宇宙)
- 演讲者: Raphael Townshend
- 演讲者隶属机构: Atomic AI
- 演讲者信息: Raphael Townshend’s Personal Website
Feb 15
- 事件: Speaker (演讲者)
- 主题: Foundation Model Ethics (基础模型伦理)
- 演讲者: Rob Reich
- 演讲者隶属机构: Stanford University (斯坦福大学)
- 演讲者信息: Rob Reich’s Stanford Profile
说明
- 2月13日,Raphael Townshend将就解锁 RNA 宇宙这一主题进行讲座,他是来自 Atomic AI 的专家。
- 2月15日,Rob Reich将就基础模型伦理进行演讲,他是斯坦福大学政治科学系的成员。
第七周
- Feb 22
- 主题Poisoning web-scale datasets is practical
- Nicholas Carlini (Google Brain)
Feb 22
- 事件: Speaker (演讲)
- 主题: Poisoning web-scale datasets is practical (对网络规模数据集投毒是可行的)
- 演讲者: Nicholas Carlini
- 演讲者隶属机构: Google Brain
- 演讲者信息: Nicholas Carlini’s Personal Website
说明
- 2月22日,Nicholas Carlini将就”对网络规模数据集投毒是可行的”这一主题进行演讲,他是来自 Google Brain 的专家。
第八周
- Feb 27
- 主题Compression for AGI
- Jack Rae (OpenAI)
- Mar 1
- SpeakerTalk TBD
- Susan Zhang (Meta)
第九周
- Mar 6
- SpeakerTalk TBD
- Yejin Choi (University of Washington, Allen Institute for AI)
- Mar 8
- SpeakerTalk TBD
- Jared Kaplan (Anthropic)
第十周
- Mar 13
- Speaker or Final Presentations (TBD)
- TBD
- Mar 15
- Final Presentations