bitsandbytes

2024-09-19Qwen2模型量化时关于bitsandbytes安装的问题
Qwen2模型量化时关于bitsandbytes安装的问题问题描述：fromtransformersimportAutoTokenizer,AutoModelForCausalLM,GenerationConfig,BitsAndBytesConfigCUDA_DEVICE="cuda:0"model_name_or_path='/qwen2-1.5b-instruct'Tokenizer=AutoTokenizer.from_pr
2024-08-22LLaMA-Factory
LLaMA-Factory是一个整合了主流的各种高效训练微调技术、适配主流开源模型、功能丰富、适配性好的训练框架。安装LLaMAFactorycondacreate-nllamafactorypython=3.8.0condaactivatellamafactorygitclone--depth1https://github.com/hiyouga/LLaMA-Factory.gitc
2024-04-04记录一次Windows11本地部署Qwen1.5-0.5B AWQ模型的经历
直接上代码，来自魔搭的模型通义千问1.5-0.5B-Chat-AWQ·模型库(modelscope.cn)frommodelscopeimportAutoModelForCausalLM,AutoTokenizerdevice="cuda"#thedevicetoloadthemodelontomodel=AutoModelForCausalLM.from_pretrained("qwen/Qwen1.5-0.5B-C
2023-11-07用 bitsandbytes、4 比特量化和 QLoRA 打造亲民的 LLM
众所周知，LLM规模庞大，如果在也能消费类硬件中运行或训练它们将是其亲民化的巨大进步。我们之前撰写的LLM.int8博文展示了我们是如何将LLM.int8论文中的技术通过bitsandbytes库集成到transformers中的。在此基础上，我们不断努力以不断降低大模型的准入门槛。在此过程中，我
2023-11-06jupyter 下 bitandbytes报错记录
背景：在jupyter中加载baichuan大模型时报错报错一：frompeftimportPeftModel 报错报错提示：python-mbitsandbytes执行python-mbitsandbytes时又报错，报错内容为：Traceback(mostrecentcalllast):File"/home/miniconda3/envs/vllm/lib/python3.10/runpy.py",lin