想尝试不同的模型大小和配置？DeepSpeed-Chat轻松实现！

工具软件3年前 (2023)发布 gpts

197 0 0

我们了解到用户通常喜欢尝试不同的模型大小和配置，以满足他们不同的训练时间、资源和质量的需求。借助 DeepSpeed-Chat，你可以轻松实现这些目标。例如，如果你想在 GPU 集群上训练一个更大、更高质量的模型，用于你的研究或业务，你可以使用相同的脚本，只需输入你期望的模型大小（例如 660 亿参数）和 GPU 数量（例如 64 个 GPU）：

python train.py --actor-model facebook/opt-66b --reward-model facebook/opt-350m --num-gpus 64

在接下来的9 小时内，你将拥有一个 660 亿参数的 ChatGPT 模型，并可以在你喜欢的前端 GUI 中使用：

Model Sizes	Step 1	Step 2	Step 3	Total
Actor: OPT-66B, Reward: OPT-350M	82 mins	5 mins	7.5hr	9hr

表 5. 在8个DGX节点上（64x A100-80G），针对不同的RLHF步骤，使用DeepSpeed-Chat训练OPT-66b所需的时间。

如果你只有大约 1-2 小时的咖啡或午餐休息时间，你也可以尝试使用 DeepSpeed-Chat 训练一个小型模型。例如，我们为单个数据集准备了一个 13 亿参数模型的训练示例，以便在你的消费级 GPU 上测试我们的框架。当你从午餐休息回来时，你的模型已经准备好供你使用！

python train.py --actor-model facebook/opt-1.3b --reward-model facebook/opt-350m --num-gpus 1

Model Sizes	Step 1	Step 2	Step 3	Total
Actor: OPT-1.3B, Reward: OPT-350M	2900 secs	670 secs	1.2hr	2.2hr

表 6. 在单个消费级A6000-48G上，针对不同的RLHF步骤，使用DeepSpeed-Chat训练OPT-1.3b所需的时间。

# 工具软件

文章版权归作者所有，未经允许请勿转载。

AI 生成可扫码图像 — 新 ControlNet 模型展示

gpts

237 0

如何通过 3 种方式在 Clubhouse App 上更改名称

gpts

209 0

订阅 Midjourney 会员怎么用

gpts

251 0

Google 被指用ChatGPT 数据训练Bard

gpts

262 0

挖掘 Google Bard 的潜力：探索高级功能和应用

gpts

240 0

OpenAI 错误代码 404 – 您必须是组织的成员才能使用 API

gpts

276 0

想尝试不同的模型大小和配置？DeepSpeed-Chat轻松实现！

DeepSpeed Chat: 一键式RLHF训练，让你的类ChatGPT千亿大模型提速省钱15倍

利用 DeepSpeed-Chat 的 RLHF API 自定义你自己的 RLHF 训练流程

相关文章

随机内容