当前位置:首页 > 绿巨人最新热点 > 正文内容

DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型

admin4个月前 (09-18)绿巨人最新热点55

9月18日,由DeepSeek(深度求索)团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。

DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异。

在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了模型训练的技术细节说明,包括模型训练数据类型和安全性考虑等,并回应了此前关于知识蒸馏的质疑。

DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的质疑。在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。

DeepSeek还透露,为了防止基准测试数据污染,对DeepSeek-R1的预训练和后训练数据都实施了全面的去污染措施。

开源之后,R1在Hugging Face下载量破1090万次,成为全球最受欢迎的开源推理模型。

DeepSeek首次公开了仅靠强化学习,就能激发大模型推理能力的重要研究成果,从而启发全球AI研究者。DeepSeek R1的核心创新在于采用了“纯强化学习”这一自动化试错方法,R1通过奖励模型达到正确答案的行为来学习推理策略,而非传统模仿人类预设的推理模式。

在补充材料中,DeepSeek团队还首次公开了R1训练成本仅为29.4万美元。这个金额即使加上约600万美元的基础模型成本,也远低于OpenAI、谷歌训练AI的成本。

今年1月,当DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本曾引发全球科技股大幅下跌。

作为全球首个通过同行评审的主流大语言模型,《自然》期刊不但将该篇论文作为封面论文,还在评论报道文章中用了“里程碑式论文揭示 DeepSeek AI 模型的秘密”、“创造历史”表达赞赏和肯定,此次论文发表标志着中国在大模型基础研究领域取得重要突破。

在AI行业快速发展中,未经证实的说法和炒作不在少数。《自然》杂志认为,随着AI技术日渐普及,大模型厂商们无法验证的宣传可能对社会带来真实风险。依靠独立研究人员进行的同行评审,是抑制AI行业过度炒作的一种有效方式。而DeepSeek所做的一切,是非常值得欢迎的先例。

8月21日,DeepSeek正式发布了最新大语言模型DeepSeek-V3.1。

据DeepSeek介绍,新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。

DeepSeek是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。

 

相关文章

快手极速安装版,畅享短视频新体验,轻松下载即刻开启快乐时光

快手极速安装版,畅享短视频新体验,轻松下载即刻开启快乐时光

你有没有发现,最近手机上多了一个特别好玩的小玩意儿?没错,就是快手极速安装版!这款软件可是火得一塌糊涂,不仅年轻人爱不释手,连长辈们也开始纷纷下载。今天,就让我带你来全方位了解一下这个神奇的快手极速安...

快手极速版下载官方免费,官方免费下载,畅享短视频新体验

快手极速版下载官方免费,官方免费下载,畅享短视频新体验

你有没有听说最近超级火的快手极速版下载?没错,就是那个让你刷视频还能赚钱的APP!今天,我就要带你全方位揭秘这个神奇的APP,让你知道为什么它能在这么短的时间内就吸引了那么多人。准备好了吗?让我们一起...

中国煤炭地质总局原党委委员、副局长王海宁接受审查调查

据中央纪委国家监委驻国务院国资委纪检监察组、陕西省纪委监委消息:中国煤炭地质总局原党委委员、副局长王海宁涉嫌严重违纪违法,目前正接受中央纪委国家监委驻国务院国资委纪检监察组纪律审查和陕西省西安市监委监...

 

赶上阴雨天,似乎很不巧。毕竟这次要看的是太阳能设施。上海电力学院太阳能研究所赵春江教授自2006年起在自家建了户用光伏电站,以全直流微电网配合储能系统,这套系统前后运转近20年。来到上海松江的别墅区,澎湃研究所研究员望见一块“上海电力大学太阳能研究所实验基地”的牌子,下方是电动汽车充电箱,光伏板则建在屋顶。

赵春江教授家门口。 王昀 图

“今天下雨,就要注意节电。晴天要多用电,但有时小孩不在家,用不掉那么多,就要弃电。”在这套自建的光伏直流微电网系统之下,赵春江教授夫妇依据天气和季节转换,调节自己的生活方式,近20年下来已成习惯——偶尔照顾孙辈,也要考虑能源如何使用。而要适应和减缓气候变化挑战,这种“与自然共生”的切身意识,恰是最为稀缺和可贵的。

在实验室场景之外,户用光储直柔系统能否进入更多城市居民生活?赵教授提到,有一回该片区因施工不慎挖断电缆而停电,邻居发现他家电器照常运转,电动车也能充电,十分羡慕,希望能装一套户用系统。成本算下来并非遥不可及,还可应对不时之需。当下电动乘用车普及,其动力电池作为移动储能单元,户用光储直柔的适用性更是大大拓展。

这正符合能源分布式发展的趋势,也受到

城市需为户用直流小微电网开拓更多场景

 赶上阴雨天,似乎很不巧。毕竟这次要看的是太阳能设施。上海电力学院太阳能研究所赵春江教授自2006年起在自家建了户用光伏电站,以全直流微电网配合储能系统,这套系统前后运转近20年。来到上海松...

他信入狱后:早餐吃煮鸡蛋,可能当语言老师

他信入狱后:早餐吃煮鸡蛋,可能当语言老师

当地时间9月11日,泰国狱政厅发言人透露了前总理他信入狱后的情况。目前他信正处于5天隔离期,家属和律师不可探访,之后他可能在监狱里担任老师。 狱政厅发言人尚恩表示,狱政厅将根据犯人的擅长技能和意...

如果你死了你会疯狂一次吗,灵魂的终极觉醒

如果你死了你会疯狂一次吗,灵魂的终极觉醒

你有没有想过这样一个问题:如果你突然离我们而去,你会不会在另一个世界疯狂一次呢?这个问题听起来可能有些诡异,但不妨让我们一起探索一下这个奇妙的想象空间。想象当你闭上眼睛,生命在这一刻画上了句号。你的身...