首页 > 编程语言 >[算法前沿]--022-使用 StarCoder 创建一个编程助手

[算法前沿]--022-使用 StarCoder 创建一个编程助手

时间:2024-04-07 22:58:31浏览次数:23  
标签:git co -- starcoder token StarCoder https 022

文章目录

StarCoder

BigCode 开发的 StarCoder,这是一个在一万亿的 token、80 多种编程语言上训练过的 16B 参数量的模型。训练数据多来自 GitHub 上的 issues、使用 Git 提交的代码、Jupyter Notebook 等等 。得益于对企业友好的许可证、长度为 8192 的 token、借助 multi-query attention 的快速大批量推理,StarCoder 可以说是当前对代码相关的应用最合适的开源选择。

  1. 代码: https://github.com/bigcode-project/starcoder
  2. 数据集: https://huggingface.co/datasets/HuggingFaceH4/oasst1_en
  3. 模型: https://huggingface.co/HuggingFaceH4/starchat-alpha

调优

$ git clone https://github.com/bigcode-project/starcoder.git
$ cd starcoder/chat

创建环境





标签:git,co,--,starcoder,token,StarCoder,https,022
From: https://blog.csdn.net/weixin_32393347/article/details/137481710

相关文章

  • python排序算法
    冒泡排序n=int(input())#5a=list(map(int,input().split(",")))#7,6,5,4,3foriinrange(0,n-1):#循环n-1次forjinrange(0,n-i-1):#循环n-i次,依次找第二大,第三大的等等ifa[j]>a[j+1]:a[j],a[j+1]=a[j+1],a[j]......
  • Java多线程
    Process进程系统资源分配的单位Thread线程CPU调度和执行的单位1.继承Thread类packagedemo01;//创建线程方式一:继承Thread类,重写run()方法,调用start开启线程//线程开启不一定立即执行,由cpu调度publicclassTestThread1extendsThread{@Overridep......
  • SQL窗口函数的移动求和/平均,及相应的Leecode题目
    原文链接:https://blog.csdn.net/weixin_45638528/article/details/130229603移动求和的窗口函数——连续n个数据求和sum(字段1)over(partitionby字段2orderby字段3rowsnpreceding)LEECODE1321餐馆营业额变化增长表:Customer+---------------+---------+|Colum......
  • 从零开始学Spring Boot系列-SpringApplication
    SpringApplication类提供了一种从main()方法启动Spring应用的便捷方式。在很多情况下,你只需委托给SpringApplication.run这个静态方法:@SpringBootApplicationpublicclassSpringbootLearningApplication{publicstaticvoidmain(String[]args){......
  • SpringBoot中的Tomcat(内嵌式)使用及分析
    前言Tomcat是我们在项目中使用最多的Web应用服务器,今天通过代码来简单分析下SpringBoot中是如何启动内嵌式Tomcat的。使用importjava.io.File;importjava.io.IOException;importjava.nio.charset.StandardCharsets;importjava.util.HashSet;importjava.util.Se......
  • P1314 [NOIP2011 提高组] 聪明的质监员
    P1314[NOIP2011提高组]聪明的质监员题目小T是一名质量监督员,最近负责检验一批矿产的质量。这批矿产共有$n$个矿石,从$1$到$n$逐一编号,每个矿石都有自己的重量$w_i$以及价值$v_i$。检验矿产的流程是:给定$m$个区间$\lbrackl_i,r_i\rbrack$;选出一个参数$W$;......
  • 使用MySQL驱动方式实现读写分离
    前言MySQL在5.1.X版本之后增加了对multi-host的支持,我们可以使用它来实现读写分离。正常的jdbc连接格式为jdbc:mysql://ip:3306/testdb?characterEncoding=UTF-8multi-host的jdbc连接格式为jdbc:mysql:replication://ip:3306,ip:3307,ip:3308/testdb?useUnicode=t......
  • Linux下安装Kubernetes
    准备工作预留2G左右的内存,尽可能多,需要提前安装了dockerkubeadm:用来初始化集群的指令。kubelet:在集群中的每个节点上用来启动Pod和容器等。kubectl:用来与集群通信的命令行工具。集群安装,但只有一个节点curl-LOhttps://storage.googleapis.com/minikube/releases/lates......
  • mongo prisma
    prisma要求mongo服务必须是集群,需要有副本集执行事务。本地开发环境安装了一个debian12虚拟机:在debian12系统中, 安装docker,docker-compose下载mongo镜像:dockerpullmongo创建配置文件docker-compose.yml:version:'3'services:mongo:container_name:mong......
  • P1177 【模板】排序
    P1177【模板】排序题目将读入的$N$个数从小到大排序后输出。输入第一行为一个正整数$N$。第二行包含$N$个空格隔开的正整数$a_i$,为你需要进行排序的数。输出将给定的$N$个数从小到大输出,数之间空格隔开,行末换行且无空格。样例输入542451输出12445......