一次经由率73％，开源代码大模子WizardCoder逾越最新GPT

发布时间：2025-02-23 18:39:46 作者：玩站小弟

在开源这件事上，Meta 不愧是业界知己。这多少天，代码大模子规模又凋敝了起来！先是 Meta 开源代码专用大模子 Code Llama，且收费商用。下场也颇为宜，Code Llama 在 Human 。

在开源这件事上，次经Meta 不愧是由率源代逾业界知己。

这多少天，％开代码大模子规模又凋敝了起来！码大模

先是最新 Meta 开源代码专用大模子 Code Llama，且收费商用。次经下场也颇为宜，由率源代逾Code Llama 在 HumanEval 以及 MBPP 代码数据集上的％开一次天生经由率（pass@1）轻松逾越 GPT-3.5，其中「Unnatural」版本的码大模 pass@1 迫近了原始 GPT-4（OpenAI 在往年 3 月 GPT-4 技术陈说中的数据）。

Code Llama 宣告仅一天，最新来自 Phind 机关的次经钻研职员用微调的 Code Llama-34B 在 HumanEval 评估中击败了 GPT-4 。他们的由率源代逾两个模子 Phind-CodeLlama-34B-v1 以及 Phind-CodeLlama-34B-Python-v1 在 HumanEval 分说实现 67.6% 以及 69.5% 的 pass@1，显明都逾越了原始 GPT-4 的％开 67%。

不外，码大模仅仅又过了一天，最新Phind 微调版 Code Llama 又迎来了一个单薄的对于手。这次是 WizardLM 团队的编程专用大模子 WizardCoder。

该团队推出了基于 Code Llama 的最新版本模子 WizardCoder 34B ，它运用 Evol-Instruct 妨碍微调而成。

服从展现，它在 HumanEval 上的 pass@1 抵达了惊人的 73.2%，逾越了原始 GPT-四、ChatGPT-3.5 以及 Claude 二、Bard。此外，WizardCoder 13B 以及 7B 版本也将很快到来。

GitHub 地址：https://github.com/nlpxucan/WizardLM/tree/main/WizardCoder
Huggingface ：https://huggingface.co/WizardLM/WizardCoder-Python-34B-V1.0

这次详细版本是 WizardCoder-Python-34B-V1.0 ，下图是与主流闭源以及开源模子的 HumanEval pass@1 比力。除了最新 API 的 GPT-4（该团队测试后患上到的服从是 82.0%），该模子逾越了所有闭源以及开源模子，搜罗最新 API 的 ChatGPT（72.5%）以及原始 GPT-4（67%）。

因此，WizardCoder-Python-34B-V1.0 成为了最新的 SOTA 开源代码大模子。

WizardLM 团队还展现，WizardCoder-Python-34B-V1.0 的功能百分之百是可能复现的。

想要体验 WizardCoder-Python-34B-V1.0 的小过错可能试验如下 demo。

demo 地址：http://47.103.63.15:50085/

有人展现，在试了 demo 后发现，提供精确代码以前彷佛有 COT（脑子链）在起熏染，这颇为棒。

尚有人展现，WizardCoder-Python-34B-V1.0 要比 GPT-4 犯的错更少。

不外运行 WizardCoder-Python-34B-V1.0 需要 32GB 以上的 mac。

WizardLM 团队会带来更多惊喜

WizardCoder 在成为代码家族一员已经不是别致事，可是 WizardLM 团队每一次都市给巨匠带来纷比方样的惊喜。

斯坦福宣告的狂语言模子排行榜 AlpacaEval 是一种基于 LLM 的全自动评估基准，且愈减速速以及坚贞。良多驰名的模子如 GPT-四、ChatGPT 等都在其上刷榜单。在这其中，WizardLM 13B V1.2 仍是在第六位。

WizardLM 是由 Can Xu 等人在 2023 年 4 月提出的一个可能凭证重大指令天生文本的大型语言模子。它运用了一个名为 Evol-Instruct 的算法来天生以及改写指令数据，从而后退了指令的庞漂亮以及多样性。 WizardLM 共有三个版本：7B 、13B 以及 30B 。

WizardLM 推出的指令微调代码大模子 ——WizardCoder，更是突破了闭源模子的操作位置，在 HumanEval 以及 HumanEval + 上优于 Anthropic 的 Claude 以及 Google 的 Bard 。

更值患上一提的是，WizardCoder 还大幅度地提升了开源模子的 SOTA 水平，缔造了惊人的后退，后退了 22.3% 的功能，成为了开源规模的新晋「领头羊」。

如下为 WizardLM 团队在 GitHub 上宣告的诸多模子，这些模子是该团队不断立异、改善的足迹。

WizardLM 团队在 WizardLM 与 WizardCoder 之后，还在往年八月中旬宣告了 WizardMath。该团队还发推文展现，自己不断在自动于处置各个学科重大的下场。

那末未来 WizardLM 团队还会带给咱们奈何样的惊喜，让咱们刮目相待。

Tag：

英超最新积分榜，热刺4:1排第五，曼联惨败依然第六，切尔西第12
英超联赛第16轮全部战罢，纽卡斯尔联客场1:4惨败给热刺，遭遇两连败，无力反超曼联，只能排名第七，热刺打破5轮不胜的尴尬，排名第五，距离前四只差3分。曼城客场2:1逆转卢顿，守住了第四的位置，卫冕冠军
2025-02-23
0∶2不敌拜仁慕尼黑！大巴黎欧冠出局，梅西下赛季会在哪？1973年，第一届香港小姐看看能认出几个，当时都是纯天然的大美女
【环球时报综合报道】据法新社报道，在当地时间8日进行的欧冠1/8决赛中，巴黎圣日耳曼0∶2客场不敌拜仁慕尼黑，以总比分0∶3再次告别欧冠赛场，“这已是大巴黎七年来第五次止步欧冠淘汰赛首轮”。2月中旬双
2025-02-23
广州27元单式票摘3794万元大奖
新快报讯记者陆妍思报道 6月3日，体玄色B超级大乐透第23062期开奖，当期广州一张27元的3倍单式追加票中出3注1264万多元追加一等奖，单票总奖金抵达3794万元。大乐透第23062期的中奖号码
2025-02-23
中外爵士音乐家同台北京音乐厅上演520浪漫之夜张子枫未修生图流出，被网友公开批评：她的胸碍了谁的“意淫梦”？
用爵士表达浪漫和爱意可谓拉满氛围感，5月20日，北京音乐厅上演了一场“爵色欧洲·520浪漫之夜爵士音乐会”，来自欧洲的爵士音乐家与中国音乐家联袂为北京观众呈现了一场爵士浪漫之夜。作为北京音乐厅202
2025-02-23
NBA独行侠Vs灰熊内线劣势再被放大？
季中锦标赛刚刚落下帷幕，球员需要休息调整，所以联盟昨天没有赛事安排，明天有13场比赛，相信会精彩纷呈。我们首先回顾一下上轮公推勇士Vs雷霆，双方近两次交手都打进加时赛才分出胜负，无独有偶，两次都是由霍
2025-02-23
梅西来了！迈阿密国内近两个月赛程一览
原问题：梅西来了！迈阿密国内近两个月赛程一览梅西来了！迈阿密国内近两个月赛程一览直播吧6月8日讯据罗马诺新闻，梅西抉择加盟美职联球队迈阿密国内。迈阿密国内接下来两个月赛程如图，梅西要先以及阿根廷国
2025-02-23