Transformers Pipeline + Mistral-7B-Instruct-v0.x修改Chat Template

时间：2024-07-17 11:19:26浏览次数：16

标签：Pipeline Transformers 7B messages system chat template role message

在使用https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.3提供的Generate with transformers代码进行测试时，产生以下报错：

from transformers import pipeline

messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
chatbot = pipeline("text-generation", model="mistralai/Mistral-7B-Instruct-v0.3")
chatbot(messages)

TemplateError: Conversation roles must alternate user/assistant/user/assistant/...

这个错误是由于Mistral本身不支持system prompt导致的。
查看tokenizer.apply_chat_template的源码，可以看到默认的chat template是这样的：

def default_chat_template(self):
        """
        This template formats inputs in the standard ChatML format. See
        https://github.com/openai/openai-python/blob/main/chatml.md
        """
        return (
            "{% for message in messages %}"
            "{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}"
            "{% endfor %}"
            "{% if add_generation_prompt %}"
            "{{ '<|im_start|>assistant\n' }}"
            "{% endif %}"
        )

为了在使用Transformers Pipeline + Mistral模型时能够支持system prompt，我们需要修改默认的chat template：

{% if messages[0]['role'] == 'system' %}
    {% set system_message = messages[0]['content'] | trim + '\n\n' %}
    {% set messages = messages[1:] %}
{% else %}
    {% set system_message = '' %}
{% endif %}

{{ bos_token + system_message}}
{% for message in messages %}
    {% if (message['role'] == 'user') != (loop.index0 % 2 == 0) %}
        {{ raise_exception('Conversation roles must alternate user/assistant/user/assistant/...') }}
    {% endif %}

    {% if message['role'] == 'user' %}
        {{ '[INST] ' + message['content'] | trim + ' [/INST]' }}
    {% elif message['role'] == 'assistant' %}
        {{ ' ' + message['content'] | trim + eos_token }}
    {% endif %}
{% endfor %}

在代码中将默认的chat_template覆盖：

tokenizer.apply_chat_template(
        messages, 
        chat_template=mistral_chat_template,
        tokenize=False, 
        add_generation_prompt=True
)

这样就可以顺利进行推理了。

标签：Pipeline,Transformers,7B,messages,system,chat,template,role,message
From： https://www.cnblogs.com/yourenbo/p/18306902

一起学Hugging Face Transformers（18） - 使用Transformers 库实现命名实体识别（NER）
文章目录前言1.环境配置2.加载模型和分词器3.创建命名实体识别管道4.输入文本进行识别5.完整代码示例6.结果解释总结前言命名实体识别（NER）是自然语言处理（NLP）中的一种任务，旨在识别文本中具有特定意义的实体，例如人名、地名、组织名等。NER在信息抽取、文本分析......
数据结构与算法 —— Transformers之Pipeline
Transformers之Pipeline是HuggingFaceTransformers库中提供的一种使用预训练模型进行推理的极简方式。这些Pipeline对象从库中抽象出大部分复杂代码，为多项任务（如命名实体识别、情感分析、特征提取和问答等）提供了简单的API。以下是对Transformers之Pipeline的详细介绍：一、......
【人工智能】Transformers之Pipeline（一）：音频分类（audio-classification）
目录一、引言二、音频分类（audio-classification）2.1概述2.2技术原理2.2.1 Wav2vec2.0模型 2.2.1HuBERT模型2.3pipeline参数2.3.1pipeline对象实例化参数2.3.2pipeline对象使用参数 2.4 pipeline实战2.4.1指令识别（默认模型） 2.4.2 情......
使用 lmdeploy 部署 internlm/internlm2_5-7b-chat
使用lmdeploy部署internlm/internlm2_5-7b-chat0.引言1.lmdeploy性能2.lmdeploy支持的模型3.快速开始0.引言LMDeploy由MMDeploy和MMRazor团队联合开发，是涵盖了LLM任务的全套轻量化、部署和服务解决方案。这个强大的工具箱提供以下核心功能：高效的......
使用 lmdeploy 部署 Qwen/Qwen2-7B-Instruct
使用lmdeploy部署internlm/internlm2_5-7b-chat0.引言1.lmdeploy性能2.lmdeploy支持的模型3.快速开始0.引言LMDeploy由MMDeploy和MMRazor团队联合开发，是涵盖了LLM任务的全套轻量化、部署和服务解决方案。这个强大的工具箱提供以下核心功能：高效的......
一起学Hugging Face Transformers（15）- 使用Transformers 进行情感分析
文章目录前言一、环境准备二、加载预训练模型三、示例：情感分析四、处理数据集五、自定义模型总结思考前言情感分析（SentimentAnalysis）是自然语言处理（NLP）中的一个重要任务，旨在确定文本的情感倾向，如积极、消极或中性。HuggingFace的Transformers库提供了强大的工......
【人工智能】Transformers之Pipeline（概述）：30w+大模型极简应用
目录一、引言二、pipeline库2.1概述2.2使用task实例化pipeline对象2.2.1基于task实例化“自动语音识别”2.2.2task列表2.2.3 task默认模型2.3 使用model实例化pipeline对象2.3.1基于model实例化“自动语音识别” 2.3.2查看model与task的......
go并发模式 pipeline
packagemainimport("fmt""math/rand")funcmain(){pFn:=func(done<-chaninterface{},fnfunc()int)<-chanint{valueStream:=make(chanint)gofunc(){deferclose(valueStream)......
pipeline 显示获取git分支
pipeline{agentanyparameters{gitParameter(branchFilter:'origin/(.*)',//高级中设置为这个defaultValue:'master',name:'BRANCH',type:'PT_BRANCH',useRepository:'https://gitlab.lingtingshidai.com/lt/java/lt-......
使用Blue Ocean生成Pipeline
该教程展示如何使用Jenkins的 BlueOcean 特性生成一个流水线，该流水线将协调构建一个简单的应用程序。在学习本教程前,建议您先从Tutorialsoverview 页面至少浏览一组入门教程来熟悉CI/CD概念(与你最熟悉的技术栈有)以及这些概念是如何在Jenkins中实现的。Jenkins.......

Transformers Pipeline + Mistral-7B-Instruct-v0.x修改Chat Template

相关文章

赞助商

阅读排行