《Rasa实战》读书笔记（一）

时间：2023-01-23 12:44:53浏览次数：48

标签：实战 py nlu rasa 3.10 Rasa 读书笔记 intent 版本

安装Rasa需要的Python版本

在3.7 <= python <= 3.10
如果python版本太低或太高，pip安装都将会失败，我用的是3.10版本。
window下python默认会有多版本管理工具，python Launcher，可以很方便在window下对多版本python进行管理

1.查看所有可用版本

py -0

2.运行指定版本安装rasa（3.10），等待一会儿安装成功

py -3.10 -m pip install rasa

3.安装成功后，使用rasa init命令初始化，会询问你是否安装到当前目录下，也可以指定目录。第二次会询问你是否马上训练模型，如果选是的话，会在models目录下生成一个tar.gz模型。如果不马上训练也可以自己通过rasa train命令训练模型。

py -3.10 -m rasa init

初始化目录结构如下

对书上案例进行操作

书上用的应该是rasa2.x版本，和我3.4版本不一样
贴上代码：
data/nlu.yml
intent：意图
[]()：这种是实体，rasa是对文本中的意图和实体提取之后再判断怎么回答，[]中可以定义多个不同的字符串，这些都会被rasa标记成()里的内容，如感冒、发烧、喉咙痛，都会被标记成disease。

version: "3.1"
nlu:
  - intent: greet
    examples: |
      - 你好
      - 1
      - 在吗
      - 您好
  - intent: goodbye
    examples: |
      - 88
      - 再见
  - intent: medicine
    examples: |
      - 我[感冒](disease)了
      - 我[发烧](disease)了
      - 我[喉咙痛](disease)

domain.yml，在这里配置了nlu.yml中的意图

version: "3.1"
intents:
  - greet
  - goodbye
  - medicine

config.yml，rasa默认没有支持中文分词，需要配置中文分词器

recipe: default.v1
language: zh
pipeline:
  - name: JiebaTokenizer
  - name: LanguageModelFeaturizer
    model_name: bert
    model_weights: bert-base-chinese
  - name: "DIETClassifier"
    epochs: 100

开始训练nlu模型

用到了JiebaTokenizer，rasa没有自带，需要用pip下载这个组件

py -3.10 -m pip install jieba
py -3.10 -m pip install transformers

训练：

py -3.10 -m rasa train nlu

训练完之后会在models目录下得到一个nlu模型

nlu对话分析

命令行运行

py -3.10 -m rasa shell nlu

进入之后，会等待我输入一句话，我输入“我感冒了”

nlu模块对这句话进行分析
text：是我输入的这句话
entities：text中提取的实体（这里提取到了感冒关键字）
intent：意图，medicine是在nlu.yml中配置的一个意图，confiedence是评分，这里高达0.99，分数很高
intent_ranking：是对意图的一个排名，可以看到medicine排名第一

总结

rasa主要有两个模块，一个是nlu，一个是core
nlu模块作用主要是理解用户的语言，提取用户输入的关键词，涉及到对语句的分词，并根据匹配度进行排名，有点类似es的分词和倒排索引
core模块是管理对话上下文，对用户输入选择合适的返回，对话的每行记录都会被管理，rasa会根据对话历史记录和当前用户输入判断该怎么回复用户。
还有一个叫nlg，和nlu是反过来的，是把机器语言组装成用户语言返回给用户，方便用户理解。

标签：实战,py,nlu,rasa,3.10,Rasa,读书笔记,intent,版本
From： https://www.cnblogs.com/dagger9527/p/17065095.html

ARM-DSP读书笔记开坑
ARM-DSP读书笔记开坑原书是ARMEducationMedia的《DigitalSignalProcessingusingArmCortex-MbasedMicrocontrollers-TheoryandPractice》。由于电赛备赛......
DVWA靶场实战(九)——Weak Session IDS
DVWA靶场实战（九）九、WeakSessionIDS：1.漏洞原理：WeakSessionIDS也叫做弱会话，当用户登录后，在服务器就会创造一个会话（session），叫做会话控制，接着访问页面的时候就不用......
《RPC实战与核心原理》学习笔记Day5
06|RPC实战：剖析gRPC源码，动手实现一个完整的RPC我们通过动态代理技术，屏蔽RPC调用的细节，从而让使用者能够面向接口编程。什么是gRPC？gRPC是由Google开发并且开源的一款......
Elasticsearch 核心技术与实战学习笔记
分片的设定对于生产环境中分片的设定，需要提前做好容量规划分片数设置过小导致后续无法增加节点实现水品扩展单个分片的数据量太大，导致数据重新分配耗时分片数设......
Longhorn+K8S+KubeSphere云端数据管理，实战 Sentry PostgreSQL 数据卷增量快照/备份与
云端实验环境配置VKEK8SClusterVultr托管集群https://vultr.com/3个worker节点，kubectlgetnodes。k8s-paas-71a68ebbc45bReady<none>12d......
Web安全入门与靶场实战（13）- Get方法和Post方法
在上一节介绍了URL的基本概念，但其实URL中还有一个非常重要的概念没有介绍-URL中的参数。比如一个完整的URL应当是如下格式：http://www.test.com/index.php?id=1“?id=1”就是......
《RPC实战与核心原理》学习笔记Day4
05|动态代理：面向接口编程，屏蔽RPC处理流程RPC和动态代理有什么关系？当我们使用RPC时，我们一般会先找到服务提供方要接口，然后将接口依赖配置到项目中，我们在编写业务逻辑时......
Web安全入门与靶场实战（12）- 统一资源定位符URL
互联网中存在着无数的Web站点，在每个站点中都存放着大量的Web资源，那系统该如何区分用户准备访问的是哪个站点中的哪个资源呢？比如在Linux系统中我们要对某个文件进行操作，首先......
实战：微信小程序电商项目
介绍学习视频来源SpringBoot微信小程序电商实战项目课程Vue3.2ElementPlus后台管理(火爆连载更新中...)_哔哩哔哩_bilibili技术栈介绍本套课程采用主流技术栈......
【Redis技术专区】「实战案例」谈谈使用Redis缓存时高效的批量删除的几种方案
前因后果之前我们的服务，在上线的时候发现有一些大Key的使用不是很规范，特别是没有设置过期时间，因此导致redis中内存的数据越来越多，目前Redis节点的内存已经快撑不住了。所以......

《Rasa实战》读书笔记（一）

安装Rasa需要的Python版本

对书上案例进行操作

开始训练nlu模型

nlu对话分析

总结

相关文章

赞助商

阅读排行