Search

ChatGPTのようなモデルを高速生成するツール、Microsoftが開発 ... - ITmedia NEWS

 米Microsoftは4月12日、ChatGPTのようなモデルを生成できるツール「DeepSpeed-Chat」を公開した。GPU1台で100億以上のパラメータを持つモデルの学習ができる上、学習速度も既存技術の15倍以上としている。

photo

 DeepSpeed-ChatはChatGPTでも採用されている学習手法「RLHF」を効率的に実行するためのツール。これまでは高価なGPUを大量に使う必要があったが、DeepSpeed-Chatは少ないGPUで効率的に学習ができる。

 例えば、クラウド上でGPU「A100-80GB x8」を使って大規模言語モデル「OPT-B13」を訓練する場合、9時間程度で完了し、コストも290ドル程度という。複数台のGPUを使えば1000億パラメータ規模のモデルの学習にも対応する。

photo

 Microsoftは「1〜2時間のコーヒータイムや昼休みに、DeepSpeed-Chatで小規模なトイモデルをトレーニングしてみるのも良いでしょう」と手軽さをアピールしている。

Adblock test (Why?)



from "高価な" - Google ニュース https://ift.tt/jeWB2UI
via IFTTT

Bagikan Berita Ini

0 Response to "ChatGPTのようなモデルを高速生成するツール、Microsoftが開発 ... - ITmedia NEWS"

Post a Comment

Powered by Blogger.