2024年6月5日发生的重大事件:
摘要:2024年6月5日(农历2024年4月29日),斯坦福回应抄袭清华系大模型:悉数撤下相关模型。
斯坦福团队回应抄袭清华系大模型:对所发生的事情承担全部责任,已撤下Llama3-V模型。
北京时间2024年6月5日,上月底5月29日,美国著名学府——斯坦福大学一AI团队…
|
2024年6月5日(农历2024年4月29日),斯坦福回应抄袭清华系大模型:悉数撤下相关模型。
斯坦福团队回应抄袭清华系大模型:对所发生的事情承担全部责任,已撤下llama3-v模型。
北京时间2024年6月5日,上月底5月29日,美国著名学府——斯坦福大学一ai团队发布了一个名为llama3-v的多模态大模型,这一模型比gpt-4、gemini ultra、claude opus等模型能力更强,宣称只需500美元就可训练出一个性能可与gpt4-v媲美的模型。但随后,该团队发布的模型被指抄袭,其与国内清华系大模型相似度极高。
这个模型被指抄袭清华大学自然语言处理实验室与创业公司面壁智能联合开发的开源模型“小钢炮”minicpm-llama3-v 2.5。
当地时间6月4日,斯坦福llama3-v团队的两位作者森德哈斯·沙玛(siddharth sharma)和阿克沙·加格(aksh garg)在社交平台上就这一学术不端行为向面壁minicpm团队正式道歉,并表示会将llama3-v模型悉数撤下。
阿克沙在社交媒体上发文致歉:
“首先,我们要向minicpm原作者道歉。我、森德哈斯·沙玛,以及穆斯塔法(mustafa)一起发布了llama3-v,穆斯塔法为这个项目编写了代码,但从昨天起就无法联系他。我与森德哈斯·沙玛主要负责帮助穆斯塔法进行模型推广。我们俩查看了最新的论文,以验证这项工作的新颖性,但并未被告知或意识到openbmb(清华团队支持发起的大规模预训练语言模型库与相关工具)之前的任何工作。我们向作者道歉,并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任,并已撤下llama3-v,再次致歉。”
|