首页 > 其他分享 >怎么能使用DeepSeek-R1 模型?

怎么能使用DeepSeek-R1 模型?

时间:2025-01-23 18:30:24浏览次数:3  
标签:deepseek R1 ai spring DeepSeek API 模型

要使用 DeepSeek-R1 模型,可以按照以下步骤进行:

1. 创建账户

首先,您需要通过 DeepSeek 的官方网站 chat.deepseek.com 使用您的电子邮件、Google 账户或 +86 手机号码注册一个 DeepSeek 账户。

2. 选择合适的模型

注册完成后,您可以选择适合您需求的模型:

  • DeepSeek Chat:用于一般对话。
  • DeepSeek Coder:用于编程任务。DeepSeek Coder 有多个版本,从 1B 到 236B 参数不等。

3. 通过网页界面访问

您可以直接通过网页界面访问 DeepSeek 模型:

4. API 集成(可选)

如果您是开发者,并希望将 DeepSeek 集成到您的应用程序中,可以使用以下方法:

  • Hugging Face Transformers 库:DeepSeek 提供了与 Hugging Face Transformers 库的兼容性,您可以通过该库进行模型推理。
  • API 端点:DeepSeek 提供了 API 端点,您需要进行适当的认证才能使用。具体步骤可以参考 DeepSeek 的 API 文档。

5. 本地安装(可选)

对于需要本地部署 DeepSeek Coder V2 的用户,确保您有足够的硬件资源(236B 模型需要 80GB*8 GPU),并使用 Hugging Face 的 Transformers 库进行模型推理。

6. 使用示例

以下是一个简单的使用示例,展示如何在 Spring AI 中集成 DeepSeek Reasoner 模型:

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-openai-spring-boot-starter</artifactId>
    <version>0.8.0-SNAPSHOT</version>
</dependency>

application.properties 中配置 DeepSeek API 相关信息:

spring.ai.openai.chat.options.model=deepseek-reasoner
spring.ai.openai.base-url=https://api.deepseek.com
spring.ai.openai.api-key=sk-xxx

由于 DeepSeek Reasoner 不支持 temperature 参数,您需要添加一个请求拦截器来移除该参数:

@Configuration

标签:deepseek,R1,ai,spring,DeepSeek,API,模型
From: https://blog.csdn.net/weixin_41429382/article/details/145289418

相关文章

  • 【玩转全栈】----YOLO8训练自己的模型并应用
    继上篇:【玩转全栈】---基于YOLO8的图片、视频目标检测-CSDN博客        相信大家已经可以训练一些图片和视频了,接下来我将为大家介绍如何训练自己的特定模型,并用其进行检测目录准备数据图片数据标识数据配置文件运行测试训练结果存在的问题准备数据......
  • 从零开始构建一个大语言模型-第三章第四节
    第三章目录3.1长序列建模的问题3.2用注意力机制捕捉数据依赖关系3.3用自注意力关注输入的不同部分3.4用可训练的权重实现自注意力3.5用因果注意力隐藏未来的词3.6将单头注意力扩展到多头注意力‘3.4实现带有可训练权重的自注意力机制我们的下一步是实现最初......
  • 从零开始构建一个大语言模型-第三章第三节(勘误重发)
    第三章目录3.1长序列建模的问题3.2用注意力机制捕捉数据依赖关系3.3用自注意力关注输入的不同部分3.4用可训练的权重实现自注意力3.5用因果注意力隐藏未来的词3.6将单头注意力扩展到多头注意力3.3用自注意力关注输入的不同部分我们现在将介绍自注意力机制的......
  • 字节 GUI 代理模型 UI-TARS:具备像人一样的感知、推理、行动能力;SLAM-Omni:支持可控音色
       开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编......
  • 一文详解!大模型性能测试全指标、计算方法及优化指南
    最近一周,我参与了一些第三方大模型的性能测试,在过程中发现,对于那些对实时性和稳定性要求较高的应用场景,模型的性能指标已经成为衡量其优劣的关键。这些指标不仅直接影响用户体验,还决定了模型能否真正胜任复杂的业务需求。在近年来大模型技术的快速发展中,我们看到智谱、文......
  • 模型类别计较和选择说明
    我来为您解释这几种模型的区别和应用场景:基模型(BaseModel)定义:通过大规模预训练得到的原始模型,如GPT-3、BERT、LLaMA等特点:具有广泛的通用能力参数量较大训练成本高未经过特定任务优化使用场景:作为其他模型的起点需要通用语言理解能力的场景资源充足且需要自定......
  • 大模型论文精选||多智能体微调:通过多样推理链实现自我提升
    多智能体微调是一种实现自我提升的补充方法,它将微调应用于语言模型的多智能体群体。一组均基于相同基础模型的语言模型,通过模型间的多智能体交互生成的数据,分别对各个模型进行更新,实现独立的专业化。通过在不同的数据集上训练每个模型,这种方法能够让各个模型实现专业化,并使整个模......
  • 大模型论文精选|| 多 LLM 文本摘要:创新方法与卓越成果
    多LLM文本摘要:创新方法与卓越成果论文https://arxiv.org/abs/2412.15487Multi-LLMTextSummarization2412.15487多LLM摘要框架在每一轮对话中有两个至关重要的步骤:生成和评估。根据使用的是多LLM去中心化摘要还是中心化摘要,这些步骤会有所不同。在这两种策略中,k个不同的大......
  • 详解类与对象——c++对象模型和this指针
    (^_^)一.成员变量和成员函数分开存储只有非静态成员变量才属于类的对象上classPerson{public:Person(){mA=0;}//非静态成员变量占对象空间intmA;//静态成员变量不占对象空间staticintmB;//函数也不占对......
  • PyTorch 模型 浅读
    PyTorch是一个广泛使用的深度学习框架,它被广泛应用于机器学习、自然语言处理、计算机视觉等多个领域。本文将详细介绍PyTorch模型的原理、一个简单的Demo以及它的常见应用场景,帮助你更好地理解PyTorch的核心概念和实际使用。1.PyTorch模型原理1.1.什么是PyTorc......