投影片連結:https://docs.google.com/presentation/d/1XeiZP-00kckqCxkgvi5QO47zyY1SAHqa/edit?usp=sharing&ouid=115046073158939078465&rtpof=true&sd=true
不熟悉大型語言模型訓練過程的同學可以先看以下影片:
Pretrain: https://youtu.be/cCpErV7To2o?si=V1AmHnYmCAog5YiT
SFT: https://youtu.be/Q9cNkUPXUB8?si=QuHhtTtipAs7VeHs
RLHF: https://youtu.be/v12IKvF6Cj8?si=brgghIWIq5VL3UuU
56:05 上課時沒有講清楚,這裡是在固定算力的前提下,以不同數量的資料來 pretrain 模型,所以資料多時每筆資料就被看得比較少次,資料少時每筆資料就被看得比較多次。
1:15:10 這部分起用到較多分析模型的概念,不熟悉的同學可以先看以下影片
https://youtu.be/Xnil63UDW2o?si=1ILQ-NTSiJZPm4Un