DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
01-22 11:34 来源:csdn 阅读(96)

DeepSeek 宣布推出其最新模型 DeepSeek-R1,该模型在后训练阶段通过强化学习技术,仅使用少量标注数据,显著提升了推理能力,并在数学、代码和自然语言推理等任务上达到了与 OpenAI o1 正式版相当的性能。DeepSeek 公开 R1 的训练技术,旨在促进技术社区的交流与创新。同时,DeepSeek 开源了 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型,并基于 R1的输出蒸馏出 6 个小模型,其中 32B 和 70B 模型在多项能力上超越了 OpenAI o1-mini。为推动开源社区发展,DeepSeek 采用 MIT 开源许可,完全开源且不限制商用,无需申请。此外,DeepSeek 更新用户协议,明确允许用户通过模型蒸馏等方式训练其他模型。用户可通过 DeepSeek 官网或官方 App 登录并使用“深度思考”模式调用 DeepSeek-R1完成推理任务。DeepSeek-R1 的 API 服务定价为每百万输入 tokens 1 元(缓存命中)/4 元(缓存未命中),每百万输出 tokens 16 元。

https://www.zuocode.com

详细的 API 调用指南请参考官方文档:


https://api-docs.deepseek.com/zh-cn/guides/reasoning_model