上周五,Meta 宣布推出了开源大模型 Llama 3,以其卓越性能引发热议。而在 Llama 3 发布之前,MicroSoft也悄悄发布了最新的开源模型 WizardLM-2。
颇具戏剧性的是,这款模型在发布仅几个小时后,就被MicroSoft下架了,理由是在发布之前忘了进行“毒性测试”。
据悉,这款大模型发布于上周一,提供三个版本:8x22B、70B 和 7B,每个版本都旨在满足不同的规模和要求。8x22B 模型是旗舰模型,拥有 1410 亿个参数,使其成为开源社区中最有效的模型之一。
MicroSoft这次发完模型又删除的行为让很多网友表示困惑,因此MicroSoft开发人员在 X 上发布了一份声明说明了下架模型的原因。
开发人员遗憾地承认了他们在模型发布过程中由于工作疏忽忘记了进行毒性测试。为了向社区保证迅速采取行动,他们承诺在重新发布模型之前马上进行必要的测试。
还有外界消息称,WizardLM-2 背后的研发团队总部位于北京。他们澄清表示:“删除该模型是由于忘记测试,而不是故意试图绕过审查”。
大家深感抱歉。
距离大家发布模型已经过去一段时间😅,所以现在的大家对于新的发布流程有点生疏,不小心遗漏了模型发布过程中的重要一环——有毒内容测试。
目前,大家正在快速补全测试工作……
大语言模型的毒性,是指其创作有害或不当内容的能力。如果在大模型中发现“有毒”内容,不单会影响技术方案的性能表现,更可能在全球各地纷纷对 AI 技术抱谨慎、甚至负面态度的背景下引发轩然大波。相关错误输出可能在互联网上疯狂自传播,甚至招来政府当局的调查。没有哪家企业愿意看到这样灾难性的经营事故。 因此,该模型的所有文件均被从 GitHub 和 Hugging Face 上移除,访问相关页面现在会显示 404 错误。
|