• 2024-09-22DeepSeek 2.5本地部署的实战教程
      大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行
  • 2024-09-19DeepSeek-Free-API 学习资料汇总 - 免费接入DeepSeek大语言模型的API服务
    DeepSeek-Free-API学习资料汇总DeepSeek-Free-API是一个让开发者可以免费接入DeepSeek大语言模型的开源项目。本文将为大家介绍这个项目的相关学习资料,帮助开发者快速上手使用。项目简介DeepSeek-Free-API是由LLM-Red-Team开发的一个开源项目,它提供了一个API服务,
  • 2024-09-18开源大模型 | Open LLM集中爆发,卷疯了!
    开源大模型领域热闹非凡,各种开源,PaperAgent进行了概括:端侧、Code、RAG、Agent、Reflection(反思纠正)、MoE,你关注的都在这里了。一、ReflectionLlama-3.1-70B开源ReflectionLlama-3.170B是世界上顶尖的OpenLLM,通过反思微调技术(Reflection-Tuning)训练,能够检测并纠正推理错误,具有
  • 2024-08-18程序 · 杂谈 | DeepSeek发布最强开源数学定理证明模型
    DeepSeek-Prover-V1展示了大模型在数学定理证明领域的潜力,通过将数学问题转换为Lean编程语言,帮助数学家严格验证证明正确性。今天,DeepSeek开源Prover-V1.5版本,引入了类似AlphaGo的强化学习系统,模型通过自我迭代和Lean证明器监督,构建了一个“围棋”式的学习环境。最终,
  • 2024-08-04OpenAI Function Call大模型调用单个多个agent案例
    参考:https://platform.deepseek.com/api-docs/zh-cn/function_callinghttps://blog.csdn.net/qq_31095905/article/details/139143778https://blog.csdn.net/jacbo/article/details/136278619##官方案例https://cookbook.openai.com/examples/how_to_call_functions_wi
  • 2024-07-31PerfXCloud 再度升级,免费开放体验全球顶尖 MOE 大模型 DeepSeek-V2 236B!
     PerfXCloud注册地址:www.perfxcloud.cn今日,在PerfXCloud重磅更新支持llama 3.1 405B之后,其平台再度实现重大升级!目前,已顺利接入被誉为全球最强的MOE大模型DeepSeek-V2,已在PerfXCloud(澎峰云)官网的体验中心对平台用户免费开放体验。DeepSeek-V2 DeepSeek-V2是强大的
  • 2024-06-20【论文翻译】DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence
    本翻译来自大模型翻译,如有不对的地方,敬请谅解引言开源社区通过开发诸如StarCoder(Li等人,2023b;Lozhkov等人,2024)、CodeLlama(Roziere等人,2023)、DeepSeek-Coder(Guo等人,2024)和Codestral(MistralAI,2024)等开源代码模型,在推进代码智能方面取得了显著进展。这些模型的性能已稳步接近
  • 2024-06-19DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence
    DeepSeek-Coder-V2:BreakingtheBarrierofClosed-SourceModelsinCodeIntelligence相关链接:arxivgithub关键字:开源、代码智能、混合专家模型(MoE)、编程语言支持、上下文长度扩展摘要我们介绍了DeepSeek-Coder-V2,这是一个开源的混合专家(MoE)代码语言模型,其性
  • 2024-05-27# 使用RAG-GPT集成智谱AI、DeepSeek快速搭建OpenAI Cookbook智能客服
    引言前面介绍了使用RAG-GPT和OpenAI快速搭建LangChain官网智能客服,目前国内也有一些比较不错的云端大模型API服务。本文将介绍通过RAG-GPT集成智谱AI和DeepSeek,快速搭建OpenAICookbook智能客服。RAG技术原理介绍在介绍RAG-GPT项目之前,我们首先要理解RAG的基本原理,RAG在问答系
  • 2024-05-20使用RAG-GPT集成智谱AI、DeepSeek快速搭建OpenAI Cookbook智能客服
    使用RAG-GPT集成智谱AI、DeepSeek快速搭建OpenAICookbook智能客服引言前面介绍了使用RAG-GPT和OpenAI快速搭建LangChain官网智能客服,目前国内也有一些比较不错的云端大模型API服务。本文将介绍通过RAG-GPT集成智谱AI和DeepSeek,快速搭建OpenAICookbook智能客服。RAG技术原理介
  • 2024-03-15deepseek-coder模型量化
    简介DeepSeek-Coder在多种编程语言和各种基准测试中取得了开源代码模型中最先进的性能。为尝试在开发板进行部署,首先利用llama.cpp对其进行量化。llama.cpp安装gitclone之后进入文件夹make即可,再将依赖补全pipinstall-rrequirements.txt量化可以将模型文件放到lla
  • 2023-12-21国产DeepSeek Coder 33B开源:创新代码AI,性能优于CodeLlama
    引言近日,国产AI领域迎来了一项重大突破:DeepSeek团队正式发布了DeepSeekCoder33B模型,这一基于最新人工智能技术的代码生成模型不仅完全开源,而且在多项评测中显示出优于同类产品CodeLlama的卓越性能。Huggingface模型下载:https://huggingface.co/deepseek-aiAI快站模型免费加速下
  • 2023-12-20国产670亿参数的DeepSeek:超越Llama2,全面开源
    模型概述DeepSeek,一款国产大型语言模型(LLM),凭借其670亿参数的规模,正引领着人工智能领域的新浪潮。这款模型不仅在多项中英文公开评测榜单上超越了700亿参数的Llama2,而且在推理、数学和编程能力方面表现突出。最引人注目的是,DeepSeek在匈牙利最新高中数学考试中获得了65分的高分,显示