亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

使用方式

原生pytorch checkpoint

在訓練代碼內需要保存checkpoint的py文件內，進行加載和checkpointer初始化：

from eagle.framework_train.pytorch.async_checkpoint.ddp_checkpointer import DdpCheckpointer
checkpointer = DdpCheckpointer("/tmp/flash_checkpoint_example_ckpt")

將pytorch代碼里用來存儲/讀取checkpoint的代碼，例如、，修改為

checkpointer.save_checkpoint(step, state_dict)
checkpointer.load_checkpoint()

可以參考工程內的示例：examples/ddp_example.py

CTFlashCkpt擴展使用:

英偉達Megatron-LM

按照上述安裝方法安裝CTFlashCkpt后，修改的英偉達Megatron-LM的默認存儲已經被CTFlashCkpt替換，只要按照標準Megatron的pretrain_gpt.py訓練，得到的checkpoint即是異步存儲的。

華為ModelLink

按照上述安裝方法安裝CTFlashCkpt后，修改的ModelLink的默認存儲已經被CTFlashCkpt替換，只要按照標準ModelLink的pretrain_gpt.py訓練，得到的checkpoint即是異步存儲的。

鏡像使用

平臺的公共鏡像中我們已經分別為安裝了英偉達Megatron-LM和昇騰ModelLink的鏡像集成好了CTFlashCkpt的功能，可以直接運行megatrong/modellink：

英偉達鏡像：ctflashtckpt:v0.1.0-pytorch2.0.0-cuda12.2-ubuntu22.04-x64-llama
昇騰鏡像：ctflashtckpt:v0.1.0-pytorch2.1.0-cann7.0.0-ubuntu22.04-aarch64-llama

我們提供了運行訓練llama的示例，可以自行閱讀并修改相關配置進行訓練：

可參考examples/llama文件夾的run_llama.sh文件，這是訓練啟動程序；
var_example.sh，這是啟動run_llama.sh的參數示例（不要運行此文件）。

使用效果觀察

昇騰 ModelLink的CTFlashCkpt寫加速

數據集大小	ckpt文件大小	訓練環境配置	原生ckpt單次保存到存儲?訓練中斷時間	優化后flash ckpt單次保存耗時訓練中斷時間
7B	76G	機器配置：昇騰910B 顯存512G，1 node，8卡 4TP 2PP 1DP	10.45min	3.458s
13B	146G	機器配置：昇騰910B 顯存512G，1 node，8卡 4TP 4PP 1DP	20.43min	3.33s

英偉達 megatron的CTFlashCkpt寫加速

數據集大小	ckpt文件大小	訓練環境配置	原生ckpt單次保存到存儲?訓練中斷時間	優化后flash ckpt單次保存耗時訓練中斷時間
7B	76G	機器配置：Nvidia L40s 顯存384G，1 node，8卡 8TP 1PP 1DP	3.9min	3.971s
13B	146G	機器配置：Nvidia L40s 顯存384G，2node，16卡 8TP 2PP 1DP	4.71min	3.5s

注：昇騰及英偉達的測試數據來自于各自獨立的測試環境，兩組數據相互之間不具備可比性。

亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

智算服務

應用商城

定價

合作伙伴

開發者

支持與服務

了解天翼云

一體化計算加速平臺·異構計算

一體化計算加速平臺·異構計算

使用方式

原生pytorch checkpoint

CTFlashCkpt擴展使用:

英偉達Megatron-LM

華為ModelLink

鏡像使用

使用效果觀察

亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

活動

智算服務

應用商城

定價

合作伙伴

開發者

支持與服務

了解天翼云

一體化計算加速平臺·異構計算

一體化計算加速平臺·異構計算

使用方式

原生pytorch checkpoint

CTFlashCkpt擴展使用:

英偉達Megatron-LM

華為ModelLink

鏡像使用

使用效果觀察