全部文章Ta的評論
- t****n2025-09-2320
- t****n2025-09-2310
- 當前主流的大模型主要采用Transformer結構,在分布式訓練中張量并行是一個最核心的并行技術。當前有很多的文章對張量并行做出生動的解釋,本文基于”圖解大模型訓練之:張量模型并行(TP),Megatron-LM“博客,將其中的解釋使用最簡單的python語言翻譯一次,通過具體并且最簡單的例子,讓讀者對張量并行更深且具體的理解。t****n2025-05-06210
- ROCE(RDMA over Converged Ethernet)是一種網絡技術,它結合了RDMA(Remote Direct Memory Access)和以太網(Ethernet)的優勢,提供了高性能和低延遲的數據傳輸解決方案。盡管ROCE網絡作為一種高性能數據傳輸解決方案,在數據中心和企業網絡中得到了廣泛應用,但它仍然存在一些問題和挑戰。例如PFC風暴,擁塞控制失效,缺乏可拓展性等等。本文將介紹如何基于NS3,進行RoCE網絡仿真環境搭建,并驗證最近知名的擁塞控制算法。t****n2023-08-0117511
共 4 條
- 1
頁
沒有更多了
個人簡介
暫未填寫公司和職務
暫未填寫個人簡介
暫未填寫技能專長
暫未填寫畢業院校和專業
個人成就
共發表過 4 篇文章
文章獲得 1 次贊同
文章被瀏覽 1775 次
獲得 1 人關注
個人榮譽查看規則