斯坦福AI团队被曝抄袭
事件背景与模型发布
在科技前沿的AI领域,一个由顶尖学府斯坦福大学本科生Siddharth Sharma、Aksh Garg与资深软件工程师Mustafa Aljadery组成的创新团队,于2024年5月29日发布了名为“Llama3-V”的开源多模态大模型。这款模型的发布立即引起了全球关注,其仅需500美元的训练成本即可达到与GPT-4V、Gemini Ultra等顶尖模型相匹敌的性能。这一声明在科技界引发了一场旋风,尤其是当该模型在HuggingFace趋势榜上崭露头角,且团队成员的学术和职业背景为其增添了信誉。
抄袭指控与证据浮现
当中国的大模型公司面壁智能深入后,发现Llama3-V与他们之前开源的“MiniCPM-Llama3-V 2.5”模型存在高度相似性。这种相似性不仅体现在架构和配置上,更深入到代码层面。核心证据包括:两者的模型结构和训练代码几乎如出一辙,甚至连错误样例,如识别战国古文字“清华简”的部分都完全相同。值得注意的是,“清华简”相关的数据并未公开,这一发现进一步加剧了争议的严重性。通过对比发现,如果将Llama3-V的变量名替换为MiniCPM的命名,后者的代码几乎可以无缝运行。进一步的高斯噪声分析显示,Llama3-V的权重与MiniCPM的模型参数存在高度匹配。而面对这些铁证,Llama3-V团队在GitHub和HuggingFace上的行为也引发了广泛的质疑,包括删除质疑帖文并隐藏项目页面。
团队的回应与道歉
面对日益严重的指责,Siddharth Sharma和Aksh Garg在社交平台X上公开发表道歉声明。他们承认,虽然代码是由Mustafa Aljadery编写,但在未经充分验证原创性的情况下就发布了模型。他们撤下了Llama3-V模型及相关宣传内容。面壁智能的CEO李大海与联合创始人刘知远则表示,虽然抄袭行为破坏了开源社区的信任基础,但他们仍希望涉事学生能够认识到错误并改正。他们也强调了维护开放合作社区的重要性。
后续结果与行业影响
目前,Llama3-V的所有相关页面已经从GitHub和HuggingFace上删除,相关的推广内容也被撤下。这个事件不仅仅引发了关于学术诚信和开源协议规范的广泛讨论,更打破了“国内大模型套壳国外技术”的刻板印象,凸显了中国团队在技术开发上的实力与影响力。
争议焦点
关于此事件的争议焦点,主要集中在以下几个方面:首先是责任归属问题。团队将责任主要归咎于Mustafa Aljadery,但关于其职业背景的真实性也引发了讨论。是关于开源社区规范的问题。此次事件暴露出部分研究者在知识产权保护方面的漠视态度,以及不遵守开源协议引用前人成果的行为。这一事件不仅成为国际AI领域学术不端的典型案例,也促使行业对模型原创性审核机制进行深入反思。