当前位置：首页 >人工智能 >面壁智能对齐技术UltraFeedback如何让7B模型打败70B LLaMA2？

面壁智能对齐技术UltraFeedback如何让7B模型打败70B LLaMA2？

发布时间：2023-11-28 14:54:54 浏览量：101次

性能超越参数十倍之大的 LLaMA2-70B-Chat。

面壁智能对齐技术UltraFeedback如何让7B模型打败70B LLaMA2？

HuggingFace 团队最新训练的小尺寸模型 Zephyr-7B，性能 超越参数十倍之大的 LLaMA2-70B-Chat。

在权威基准测试 MT-Bench 上，Zephyr-7B 以 7.09 分的成绩整体超越 LLaMA2-70B-Chat。此外，Zephyr-7B 还在 OpenLLM Leaderboard 的 4 个数据集上取得了 66.1 的平均分。

从 Twitter 中的雷达图可以看出，这个 7B 模型的信息抽取（Extraction）和代码（Coding）能力尤其突出，大幅超越 Mistra-7B-Instruct 和 LLaMA2-70B-Chat。

以一当十，Zephyr-7B 是怎么做到的？

Zephyr-7B 基于 面壁智能（ModelBest）联合清华 NLP 实验室最新开源的大规模反馈数据集 UltraFeedback 训练而成。

UltraFeedback是团队探索 大模型对齐（Alignment）技术 的又一座里程碑，发布不足十天，已经得到开源社区的积极认可。

GitHub地址：https://github.com/OpenBMB/UltraFeedback

HuggingFace链接： https://huggingface.co/datasets/openbmb/UltraFeedback

UltraFeedback 数据集强在哪里？

基于人类反馈的强化学习（RLHF），已被 OpenAI、Anthropic 和 Google DeepMind 等业界领先公司广泛研究并应用。

然而，由于 缺乏高质量、公开可用的偏好数据集，开源社区在 RLHF 的研究和实践上仍然处于落后状态。

为了解决这一问题，助力建设繁荣的大模型开源生态。面壁智能团队构建了UltraFeedback，一个 大规模、多样化、细粒度 的偏好数据集，包括 25万 条对话数据以及相应的偏好标注数据。

在非社区标注的偏好数据集中，这一数据规模排在首位。并且，其中每条偏好标注均包含四个方面的细粒度得分与详细的文字说明。

此外，UltraFeedback 从多个社区开源的指令数据集中收集了约 6 万条指令。基于这些指令，UltraFeedback 从 17 种不同架构、参数量、训练数据的模型中随机选取 4 种不同模型，为每条指令生成4种有区分度的回复，极大地提升了指令和模型的多样性。

目前，团队已经发布 UltraFeedback 的相应论文，想要详细了解 UltraFeedback 技术原理的朋友可前去查看。

如何应用 UltraFeedback？奖励模型和批评模型

基于 UltraFeedback，团队训练了两个模型来进一步辅助模型评测和模型反馈学习。

一个是 奖励模型（Reward Model）——UltraRM，旨在区分同一个问题的不同回答好坏（HuggingFace 地址：https://huggingface.co/openbmb/UltraRM-13b ）。

就像老师为不同学生的答案给出评分，分数高低其实就是收到的奖励大小。高分答案可以指引大家后续的回答方向。同理，UltraRM 是大模型后续进行RLHF的基础，也是衡量反馈数据集质量的重要维度。

UltraRM 由 LLaMA2-13B 初始化，在 UltraFeedback 和三个开源数据集（Anthropic HH-RLHF, Stanford SHP和OpenAI Summarization）组成的混合数据集上进行微调。在四个公共偏好测试集上，UltraRM 显著超过其他开源奖励模型，达到了 SOTA 的性能。

另一个机制是 批评模型（Critique Model）——UltraCM，用于自动生成文本形式的反馈（HuggingFace 地址： https://huggingface.co/openbmb/UltraCM-13b）。

批评重在“评”，就像老师除了给分外，还会进一步作出点评，指出答案好在哪里，不好在哪里。根据更明确的一对一点评，才能针对性地提升回答。

能够给出文本形式评价的 UltraCM 对于可解释的模型评测以及模型反馈学习十分重要。

与 UltraRM 类似，UltraCM 由 LLaMA2-13B 初始化。在 9 个基准数据集上，UltraCM 优于所有开源 baseline，性能接近 ChatGPT。

对齐技术给大模型戴上“紧箍咒”

“对齐（Alignment）” 是指要求人工智能系统的目标、价值观、利益等与人类的相一致，使其符合设计者的预期，避免产生超出控制的有害后果。

如果人工智能是神通广大的孙悟空，那么对齐技术就是紧箍咒。唐僧只有掌握了紧箍咒，才能确保孙悟空不会胡作非为。

面壁智能（ModelBest）与清华大学 NLP 实验室持续探索深耕大模型对齐（Alignment）技术，除了 UltraFeedback 外，团队此前还开源发布了 UltraChat 和 UltraLM。

UltraChat，高质量的对话数据集，包含了 150 余万 条多轮指令数据。调用多个 ChatGPT API 相互对话，从而生成多轮对话数据。

UltraLM，基于 UltraChat 数据训练的大语言模型，具有丰富的世界知识和超强的指令理解和跟随能力，能对各类问题/指令给出具有丰富信息量的回复。

继 UltraLM-13B-v1.0 登顶斯坦福 AlpacaEval* 开源模型榜单 后，团队最新发布了与 UltraRM 联合的 UltraLM-13B-v2.0（best-of-16 采样），在 AlpacaEval 榜单取得了 92.30% 的高分，成为 70B 以下模型 最高分。

由此可见，运用面壁智能相关对齐技术能够“降本增效”地提升模型能力。

不管AI未来会有多么强大，只有被人类驯化才能服务人类。对齐技术是人工智能的好老师，让大模型的训练和生成得以控制。

上一篇北师大未来设计学院在第六届中国教博会发布五项PBL大挑战项目

下一篇谷歌让大模型更具“心智”，GPT-4任务准确率大增

热门课程推荐

热门资讯

1. 照片变漫画效果，这4个方法操作简单有效，快来试试吧！

想将照片变成漫画效果？这篇文章分享了4个方法，包括Photoshop、聪明灵犀、VanceAI Toongineer、醒图，简单操作就能实现，快来尝试一下吧！
2. 华为手机神奇“AI修图”功能，一键消除衣服！原图变身大V领深V！

最近华为手机Pura70推出的“AI修图”功能引发热议，通过简单操作可以让照片中的人物换装。想了解更多这款神奇功能的使用方法吗？点击查看！
3. 四款值得推荐的AI以图生图软件，有需要的赶紧来试试!

近年来,人工智能逐渐走入公众视野,其中的AI图像生成技术尤为引人注目。只需在特定软件中输入关键词描述语以及上传参考图就能智能高效生成符合要求的...
4. AI视频制作神器Viggle：让静态人物动起来，创意无限！

Viggle AI是一款免费制作视频的AI工具，能让静态人物图片动起来，快来了解Viggle AI的功能和优势吧！
5. Logo Diffusion——基于sd绘画模型的AI LOGO 生成器

这下LOGO设计彻底不用求人了。接下来详细演示一遍操作流程首先进入Logo D... 想学习更多AI技能,比如说关于怎么样利用AI来提高生产效率、还能做什么AI...
6. AI显卡绘画排行榜:4090无悬念，最具性价比出人意料

在AI绘图领域，Stable Diffusion的显卡绘图性能备受关注。本文整理了Stable Diffusion显卡的硬件要求和性能表现，以及2023年3月显卡AI绘图效率排行榜和性价比排行榜。欢迎查看最新的AI显卡算力排行榜。
7. 零基础10分钟生成漫画，教大家如何用AI生成自己的漫画

接下来,我将亲自引导你,使用AI工具,创作一本既有趣又能带来盈利的漫画。我们将一起探索如何利用这个工具,发挥你的创意,制作出令人惊叹的漫画作品。让...
8. 赶紧收藏好!这4个完全免费的AI视频制作网站和工具

以下是一些免费的AI视频制作网站或工具,帮助您制作各种类型的视频。 1. Lumen5:Lumen5是一个基于AI的视频制作工具,可将文本转换为视频。用户可以使...
9. 四款软件让你一键生成AI美女!

就能快速生成一幅极具艺术效果的作品,让现实中不懂绘画的人也能参与其中创作!真的超赞哒~趣趣分享几款超厉害的AI绘画软件,提供详细操作!有需要的快来...
10. 10个建筑AI工具，从设计到施工全覆盖!肯定有你从来没听过的

讲述了建筑业比较著名的AI公司小库科技做出的探索,在这儿就不多说了。今天,我们试着在规划设计、建筑方案设计、住宅设计、管道设计、出渲染图、3D扫...

面壁智能对齐技术UltraFeedback如何让7B模型打败70B LLaMA2？

UltraFeedback 数据集强在哪里？

如何应用 UltraFeedback？奖励模型和批评模型

对齐技术给大模型戴上“紧箍咒”

请绑定手机号