首页训练模型 Stable Vicuna

Stable Vicuna

更新时间：2024-08-08 18:40:28

手机查看

站点链接：https://chat.lmsys.org

站点标题：Stable Vicuna

收录时间：2024-08-08 18:40:28

访问次数：F(hits) + Value(1)

站点关键词：ai训练模型|stability-ai

StableVicuna，这是第一个通过人类反馈强化学习（RHLF）训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本，它是一个指令微调的LLaMA 13b模型。

同样，这里有一些基准，显示了与其他类似规模的开源聊天机器人相比，StableVicuna的整体性能。

为了实现StableVicuna的强大性能，我们利用Vicuna作为基础模型，并遵循Steinnon等人和Ouyang等人概述的典型的三阶段RLHF管道。使用三个数据集，通过监督微调（SFT）进一步训练基础Vicuna模型：

Stability AI发布的Vicuna，第一个开源RLHF聊天机器人

󰄼 赞 0 赏 󰄯 分享

温馨提示：当前网站仅在本站做收录展示，同时在2024年08月08日入库时，该网站内容都属于安全正规，但不能保证一直都是安全正规，请注意自行判断站点的安全性，如有内容出现违规，可通过本站站点反馈功能进行反馈，或联系站长进行删除，以免财产损失！

在线查询：站长查询爱站网 5118查询网址爆红申诉