DeepSeek超越ChatGPT,登顶苹果美国区免费APP下载排行榜
1月27日,DeepSeek应用程序在中国和美国的Apple应用商店中的免费应用程序下载排名高位,在美国下载列表中超过了Chatgpt。
苹果美国应用商店
Apple App商店中国免费清单
DeepSeek来自国内大型模型公司DeepSeek,该公司是一家大型模型公司,该公司的定量巨头Huanfang定量。 1月20日,该公司正式发布了大型推理模型DeepSeek-R1。启动后,DeepSeek-R1具有其“高质量和低价”功能,引起了海外开发人员社区的轰动。
作为开源模型,R1在数学,编码和自然语言推理等任务中的性能与OpenAI O1模型的官方版本相当。它采用了MIT许可协议,并支持免费的商业用途,任意修改和衍生性开发。目前,在外国大型模型排名列表聊天机器人体育馆中,DeepSeek-R1的基准测试排名已上升到所有类别的大型模型中的第三名,与OpenAI的Chatgpt-4O的最新版本挂钩,并在样式控制中排名模型(STYLICTRL)类别。与Openai的O1型号并列第一。
甚至令人惊讶的是,根据DeepSeek的说法,R1的培训前成本仅为557.6万美元,并且在55天内完成了2,048个NVIDIA H800 GPU(GPU的低调版本的GPU)的群集完成。对于中国市场)。它仅是OpenAI GPT-4O不到模型培训成本的十分之一。 DeepSeek说,R1在训练后阶段使用强化的增强学习技术,这极大地提高了模型的推理能力,仅使用很少的标记数据来提高模型的推理能力。此外,DeepSeek不仅使所有R1培训技术公开,而且还可以提取6个小型型号,并将其开源到社区,从而允许用户培训其他型号。
NVIDIA的高级研究科学家Jim Fan表示,DeepSeek-R1可能是“第一个OSS(开源软件)项目,证明RL(增强学习)飞轮可以正常工作并导致持续增长。”其中,“飞轮”用于描述AI系统中自我强化和积极循环的过程。 DeepSeek的论文表明,与经常依赖于监督微调的AI模型不同(SFT,指的是通过标记数据训练的AI模型),R1完全受强化学习的驱动,证明直接加强学习是可行的。
吉姆·范(Jim Fan)写道:“我们正处于一个奇怪的时间表,一家非美国公司正在实现Openai的最初使命,即真正开放,使每个人都受益。这种情况简直是无法理解的。大多数有趣的结果是最有可能的结果结果。”
单击输入主题:
DeepSeek在海外流行