文章目录
StarCoder
BigCode 开发的 StarCoder,这是一个在一万亿的 token、80 多种编程语言上训练过的 16B 参数量的模型。训练数据多来自 GitHub 上的 issues、使用 Git 提交的代码、Jupyter Notebook 等等 。得益于对企业友好的许可证、长度为 8192 的 token、借助 multi-query attention 的快速大批量推理,StarCoder 可以说是当前对代码相关的应用最合适的开源选择。
- 代码: https://github.com/bigcode-project/starcoder
- 数据集: https://huggingface.co/datasets/HuggingFaceH4/oasst1_en
- 模型: https://huggingface.co/HuggingFaceH4/starchat-alpha
调优
$ git clone https://github.com/bigcode-project/starcoder.git
$ cd starcoder/chat
创建环境
标签:git,co,--,starcoder,token,StarCoder,https,022 From: https://blog.csdn.net/weixin_32393347/article/details/137481710