网站首页
编程语言
数据库
系统相关
其他分享
编程问答
tensorrtllm
2024-09-03
使用docker部署tensorrtllm推理大模型baichuan2-7b
简介大模型的推理框架,我之前用过vllm和mindie。近期有项目要用tensorrtllm,这里将摸索的过程记录下,特别是遇到的问题。我的环境是Linux+rt3090准备docker环境本次使用docker镜像部署,需要从网上拉取:dockerpullnvcr.io/nvidia/tritonserver:24.08-trtllm-python-py3Th