/ InfiniBand|技術用語集

Original: https://www.ieee802.co.jp/glossary/infiniband.php

Publisher: 慧通信技術工業株式会社 (Kei Communication Technology Inc.)

出典: 慧通信技術工業株式会社 InfiniBand|技術用語集

本文リンク例(アンカーテキスト)
(任意)
参考文献記載例
慧通信技術工業株式会社「InfiniBand|技術用語集」

要約・一部引用は歓迎(条件あり)/全文転載・AIリライト転載(劣化コピー)・学習用再利用は許可しません。 AI Usage & Citation Policy

※ 要約・引用は歓迎します。出典として Original ページへのリンクをご記載ください。

InfiniBand

よみ:いんふぃにばんど

低遅延・広帯域を特徴とするサーバ/GPU間接続用インターコネクト。HPC・AIクラスタにおける分散学習や大規模ジョブで広く利用される。

InfiniBandとGPUクラスタ

InfiniBandは、GPUノード間でモデルパラメータや勾配をやり取りするための 超低レイテンシ・高帯域ネットワークとして使われます。 学習スループットを上げるには、GPUの性能だけでなく InfiniBandファブリックの設計が重要になります。

一方で、InfiniBandスイッチやHCAカードは電源トラブルに弱く、 瞬停電源ノイズによる 一時的なリンクダウンが大規模ジョブの失敗原因になることもあります。 DC-UPS と組み合わせた冗長設計により、 ネットワークも含めた「止まらない学習基盤」を実現します。

関連する考え方・用語

この用語が出てくる記事

AI要約・引用は可(出典明記・改変なし・全文転載なし)|全文転載・AIリライト転載・学習用再利用は不可