首页 > 其他分享 >创新实训 (二)

创新实训 (二)

时间:2024-05-30 19:23:38浏览次数:12  
标签:创新 requirements 代码 实训 install pip GPU txt

在对模型进行部署时,可以使用魔搭默认的环境,CPU免费,GPU有使用的时间限制,需要关联阿里云的账号,因为 CodeGeeX 要用 GPU,所以先选择限制使用时长的 GPU。

在相应的模型库中选择:CodeFuse-CodeGeeX2-6B

使用教程中对应的 git clone https://www.modelscope.cn/codefuse-ai/CodeFuse-CodeGeeX2-6B.git 命令,从对应的 Git 仓库克隆 CodeGeeX 的代码。

但是如果按照原来教程中的步骤,使用 pip install -r requirements.txt 安装项目所需的所有依赖包时会出现问题,查看 requirements.txt 后发现是版本不兼容导致的。

解决方案是删去 requirements.txt 中的 deepspeed 一行,DeepSpeed 是一个由微软开发的深度学习优化库,它旨在提高大型模型训练的效率,通过优化内存使用和分布式训练来实现。

尝试了一下方法后,发现可以使用 pip install deepspeed -U 来安装依赖。

将所有依赖都安装的时间较长,需要进行一段时间的等待。且在安装的最后,仍然会出现一段报错信息,但是模型已经可以正常运行了。

可以通过修改下面代码中的 text,来实现代码的生成。如命令模型生成求最大子段和的代码:

模型给出的结果包括代码和一些测试用例:


代码:

再一次打开模型,进行运行时,出现了一个错误:

经过查阅资料,可以通过调整transformers版本解决:pip install transformers==4.33.2

标签:创新,requirements,代码,实训,install,pip,GPU,txt
From: https://www.cnblogs.com/asuldb/p/18223078

相关文章

  • 创新实训 (一)
    为了提高在线评测系统的功能性,需要选择和集成一个强大的代码纠错大模型,用于自动分析和纠正用户提交的代码中的错误。这里的大模型我们选择使用清华大学开源的ChatGLM-CodeGeeX2。在该模型的基础上,选用程序设计试题的专门数据,进行Fine-turning的训练(即微调)。为了令CodeGeeX在......
  • 创新实训 (四)
    在线评测系统的前后端都是使用PHP进行开发的。PHP是一种广泛用于Web开发的服务器端脚本语言,有以下特点:开源和跨平台:PHP是一种开源语言,可以在各种操作系统上运行,如Windows、Linux和macOS。这使得PHP非常灵活和可访问。易学易用:与其他编程语言相比,PHP的语法相对简单,学习......
  • 创新实训 (三)
    1.为什么需要微调大模型?大型预训练模型的训练成本极高,涉及庞大的计算资源和海量数据,如果对于不同特征的数据和任务都要重新进行大模型的训练,那么成本是非常高昂的。这也导致了研究成果难以被复现和验证。为了解决这个问题,Parameter-EfficientFine-Tuning(参数有效微调)技术应运而......
  • 创新实训 (七)
    1.登录爬取力扣上的数据首先需要进行登录,使用Chrome的开发者模式来确定登录时提交的信息。经过登录验证,发现是通过https://leetcode.com/accounts/login这一接口提交了登录表单,使用爬虫进行登录的时候需要填写表单中对应的数据。其中csrfmiddlewaretoken是cookie值,需......
  • 创新实训 (六)
    在指导老师鹿旭东的指导下,我们将现有的工作进行总结,形成了一篇简短的论文,目前该文章已投稿至CEISEE2024。AnOnlineJudgementSystemBasedonCode-GeneratingLargeModeAbstract:Forcomputersciencemajorsinhighereducationinstitutions,programmingcoursesare......
  • 创新实训 (五)
    论文:Prefix-Tuning:OptimizingContinuousPromptsforGenerationPrefix-tuning将一系列连续的特定于任务的向量添加到输入中,这些前缀向量并不能够映射到真正的实体token,可以理解为“虚拟token”,这些虚拟的token作为Prefix。然后,在训练的时候只更新Prefix部分的参数,而PL......
  • 登上国际舞台!天翼云P4 EIP网关流量管理创新方案亮相CCGrid 2024!
    5月8日,第24届IEEE/ACM集群、云和互联网计算国际研讨会(CCGrid2024)在美国费城隆重举行。来自中国、美国、印度、法国等国家的学术及产业界代表齐聚一堂,围绕云计算相关议题进行深入探讨和交流,并带来最前沿的技术展示。天翼云云网产品事业部弹性网络产品线总监侯叶飞出席大会硬件系......
  • [持续更新中] 创新实训项目
    DeerOJ的前端框架介绍Web文件夹下的结构DeerOJ的前端框架参考了部分Lavarel框架,做到兼顾代码的可维护性和可阅读性。具体的维护目录文件结构如下:注意到web文件夹下的index.php这是整个前端程序的main程序,当服务段收到请求后,根据.htaccess文件指定使用index.php文......
  • 深入探索汇编语言的顶尖级应用领域,包括多核并行处理、物联网和嵌入式系统、高性能计算
    汇编语言初级应用的大纲:1.汇编语言概述介绍汇编语言的基本概念和作用。解释汇编语言与高级语言的区别。简要说明汇编语言的历史和发展。2.汇编语言基础讲解汇编语言的基本语法和结构。介绍汇编语言中的指令、寄存器、内存等概念。解释汇编语言程序的组成部分,如数据段......
  • 【持续更新】创新实训
    项目简介随着互联网+的生态模式和人工智能的产业化发展,程序设计已成为计算机专业乃至工科学生的必备技能之一。学生学习程序设计,不仅能提高代码水平能力,学会如何写代码,如何写好代码,而且能锻炼学生在今后面对项目开发等实际应用场景时解决问题的能力。因此,很多同学在刚刚接触到编......