因发布前忘了测试，MicroSoft删除最新开源大模型 [复制链接]

军衔等级：

发表于 2024-4-22 14:21:49 |显示全部楼层

上周五，Meta 宣布推出了开源大模型 Llama 3，以其卓越性能引发热议。而在 Llama 3 发布之前，MicroSoft也悄悄发布了最新的开源模型 WizardLM-2。

颇具戏剧性的是，这款模型在发布仅几个小时后，就被MicroSoft下架了，理由是在发布之前忘了进行“毒性测试”。

据悉，这款大模型发布于上周一，提供三个版本：8x22B、70B 和 7B，每个版本都旨在满足不同的规模和要求。8x22B 模型是旗舰模型，拥有 1410 亿个参数，使其成为开源社区中最有效的模型之一。

MicroSoft这次发完模型又删除的行为让很多网友表示困惑，因此MicroSoft开发人员在 X 上发布了一份声明说明了下架模型的原因。

开发人员遗憾地承认了他们在模型发布过程中由于工作疏忽忘记了进行毒性测试。为了向社区保证迅速采取行动，他们承诺在重新发布模型之前马上进行必要的测试。

还有外界消息称，WizardLM-2 背后的研发团队总部位于北京。他们澄清表示：“删除该模型是由于忘记测试，而不是故意试图绕过审查”。

大家深感抱歉。

距离大家发布模型已经过去一段时间😅，所以现在的大家对于新的发布流程有点生疏，不小心遗漏了模型发布过程中的重要一环——有毒内容测试。

目前，大家正在快速补全测试工作……

大语言模型的毒性，是指其创作有害或不当内容的能力。如果在大模型中发现“有毒”内容，不单会影响技术方案的性能表现，更可能在全球各地纷纷对 AI 技术抱谨慎、甚至负面态度的背景下引发轩然大波。相关错误输出可能在互联网上疯狂自传播，甚至招来政府当局的调查。没有哪家企业愿意看到这样灾难性的经营事故。

因此，该模型的所有文件均被从 GitHub 和 Hugging Face 上移除，访问相关页面现在会显示 404 错误。

本帖有 2 个回帖，您需要登录后才能浏览登录 | 注册

手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图

GMT+8, 2024-11-24 06:47 , Processed in 0.132245 second(s), 20 queries , Gzip On.

Discuz Licensed

回顶部

		自动登录	找回密码
密码			注册