中国模型大火,美国巨头急忙出招
据美国世界新闻网 1 月 27 日报道,随着中国 AI 新创公司深度求索(DeepSeek)以较低成本推出高性能 AI 模型震撼硅谷,脸书母公司元宇宙平台公司(Meta)的 AI 研究人员陷入恐慌模式,据传 Meta 生成式 AI 团队的主管和工程师已经成立四个"战情室"研究 DeepSeek 模型的运作方式。
报道援引美国信息网的报道指出,OpenAI、Meta 和其他顶尖开发商的研究人员正仔细分析 DeepSeek 模型,以寻找可借鉴之处,包括它如何以比一些美国 AI 模型能以更低成本、更具效率的方式运作。
据报道,其中,Meta 已为此筹组四个"战情室"。一名员工透露,两个小组聚焦于研究如何降低训练和运作 DeepSeek 模型的成本。
据员工透露,第三个研究小组正在试图厘清 DeepSeek 使用了哪些数据来训练其模型;第四个战情室则是考虑基于 DeepSeek 模型归纳出的特质,重新建构 Meta 的模型。
DeepSeek 去年底推出大型语言模型 DeepSeek-V3,根据多份美国公司发表的评估和用户评价,这款模型在完成多种任务方面表现,符合或甚至超越三大 AI 公司 Meta、OpenAI 和 Anthropic 的模型。该公司接着在 1 月 20 日推出另一个模型 DeepSeek-R1,可能媲美 OpenAI 的 o1 推理模型,这引发外界质疑美国一些 AI 公司是否运作效率低,或耗费太多资金却取得较差的成果。
据报道,Meta 的 AI 团队一些主管近日对 DeepSeek 推出的新型的对话式 AI 公开表达担忧,担心 Meta 在 AI 竞赛中落后了。
微信审核 | 陈向阳
内容编审 | 王缅 吴一凡
微信编辑 | 凡帅帅