美国亚马逊旗下的亚马逊网络服务(AWS)开始了研发和使用R1的云服务。此前有报道称美国微软因怀疑DeepSeek存在数据违规利用而与OpenAI一起展开调查,但目前也开始在自己的云服务“Azure”上提供R1服务。
关注原创的研发方法
R1的性能与2024年12月正式发布的OpenAI“o1”相差无几,但很多专家关注其原创的研发方法。R1采用了一种名为“GRPO”的提高强化学习效率的新研发的算法。另外研发出仅利用强化学习来获得高度推理能力的模型“R1-Zero”,这一点也受到好评。
![]() |
| 发布AI模型“o1”正式版的美国OpenAI的现场活动(2024年12月5日) |
作为有助于实现AI自主完成工作的“AI Agent(智能体)”、能像人类一样完成广泛任务的未来的通用AI(AGI)以及更远未来的超级人工智能(ASI)的新型大语言模型(LLM),像R1这样的推理加强型AI模型正受到关注。
世界上最早的推理加强型AI模型是OpenAI在2024年9月发表的“o1-preview”。仅仅2个月后, DeepSeek和中国阿里巴巴集团等于11月相继发表了推理加强型模型。中国AI企业的技术实力和研究人才的充实程度从那时起就备受关注。
封闭的研发体制或将变得无力
在美国,从2024年下半年开始,对中国AI研发感到警戒的看法急速增强,到11月,美国国会的跨党派的美中经济与安全审查委员会(USCC)提议,AI研发应该以过去的有关原子弹研发的曼哈顿计划为范本推进。从安全保障的观点来看,特朗普执政的4年内总投资5000亿美元的星际之门计划很有可能采取类似曼哈顿计划的秘密研发体制。
然而,这种封闭的研发体制有可能因此次DeepSeek所展示的中国企业的技术实力和基于开源的创新而变得无力。随着AI模型在长期变为“大路货”,附加价值提高的并不是模型本身,而是AI应用领域,在AI模型研发方面落后于中美的日本或许也会迎来机会。日本需要在考虑AI的军民两方面冲击的同时制定研发战略。

