“零一万物” 回应 Yi 开源大模型“套壳” Llama

李开复旗下 AI 公司“零一万物”(01.AI)上周宣布推出Yi-34B 和Yi-6B 两个开源大模型。其公布的基准测试结果显示虽然模型参数少于其它大模型,但性能更出色。零一万物的估值高达 10 亿美元,已跻身独角兽行列。

Yi 正式开源数日后,在其Hugging Face 主页的讨论区中,有人指出Yi-34B 完全使用了 Meta 开源大模型 Llama 的架构,最明显的变化只是修改了张量 (Tensor) 名称。

来源:https://huggingface.co/01-ai/Yi-34B/discussions/11

根据公开的信息,Yi 系列开源大模型没有在开源 License 中提及 Llama。上面的帖子内容经过广泛传播后,零一万物的 Yi 系列大模型被质疑是 Llama 的套壳。

昨天,“零一万物” 正式公开回应了此事。根据该公司开源团队总监Richard Lin 的跟帖回复,他们承认了修改 Llama 张量名称的做法不妥,并会按照建议进行修改。

Richard Lin 称此问题是团队的疏忽。因为在大量的训练实验中,他们对代码进行了多次重命名,以满足实验要求。但最后没有在发布之前将它们改回来。他为这个失误造成的混乱表示抱歉。

与此同时,Richard Lin 邀请这名指出问题的开发者提交包含上述改动的 PR——对 Yi 的张量名称进行重命名以符合 Llama 架构。

最后,Richard Lin表示团队会增强对流程的执行,避免此类错误再次发生,他们也将再次检查所有代码,确保其他一切正常。