首页 > 其他分享 >BERT的使用

BERT的使用

时间:2022-09-30 09:25:35浏览次数:67  
标签:BERT transformers tokenizer bert tokens Embedding 使用 import

一、背景

目录

bert是一种基于transformer的结构,也就是比较经典的attention机制,bert的思维导图模型如下所示(其他人总结的):
image

二、bert使用

使用bert首先需要安装transformers以及bert的模型(可以在安装完bert后使用)

pip install transformers

transformers中的embedding是TFBertEmbedding,这里有一个Bert训练的Embedding,fastNLP,安装指令如下:

pip install fastNLP

除此之外,还有一种新型的封装pytorch和TensorFlow的NLP语言包allennlp

pip install allennlp

下面就会对分词、Embedding进行说明。

2.1 tokenizer

接下来就是直接使用bert

from transformers import BertTokenizer
tokenizer = BertTokenizer.from_pretrained("bert-base-uncased")
tokens = tokenizer.tokenize(text)  # 分词 
# tokens = list(filter(lambda x: x not in stop_word, tokens))
tokens = tokenizer.convert_tokens_to_ids(tokens) # 转化成id
2.2 Embedding的使用
from fastNLP.embeddings import BertEmbedding
from fastNLP import Vocabulary
from transformers import BertTokenizer
vocab = Vocabulary()
vocab.add_word_lst(tokenizer.vocab)

embed = BertEmbedding(vocab, model_dir_or_name='en-base-cased')

标签:BERT,transformers,tokenizer,bert,tokens,Embedding,使用,import
From: https://www.cnblogs.com/future-dream/p/16743764.html

相关文章

  • 如何使用智能IC卡登录web系统
    在web浏览器中如何使用智能IC卡来登录系统呢?在BS架构软件中,使用刷智能IC卡来登录系统,而不是输入用户名和密码,这样不仅快而且方便,让使用者有更好的体验。要实现这种功能,其实......
  • JDBC介绍及使用
    JDBC简介JDBC(JavaDataBaseConnectivity,java数据库连接)是一种用于执行SQL语句的JavaAPI,可以为多种关系数据库提供统一访问,它由一组用Java语言编写的类和接口组成。JDB......
  • 使用Java打包下载zip文件
    本文提供打包下载目标url文件为zip解决方案工具类packagecom.solvay.utils.file;importorg.slf4j.Logger;importorg.slf4j.LoggerFactory;importjavax.servlet.h......
  • 【转载】模式——使用MVVM设计模式的WPF程序开发
    原文:模式-具有模型-视图-视图模型设计模式|的WPF应用微软学习(microsoft.com)翻译:https://blog.csdn.net/weixin_37537723/article/details/106916294说明本文是笔......
  • WinUI3 使用Win32Api 实现窗口停靠常驻桌面功能。
    我们可以通过使用Win32Api来制作一些强大的功能,本文将通过示例代码来介绍使用Win32Api来之做桌面窗口停靠功能;效果图:   一.通过Nuget引入Vanara.PInv......
  • 使用python——matplotlib绘制的图表
    #绘制饼状图importmatplotlib.pyplotaspltimportnumpyasnpman=2245505woman=3254584man_prec=man/(man+woman)woman_prec=woman/(man+woman)labels=['男','女']col......
  • Python中Selenium模块的使用
    目录​​Selenium的介绍、配置和调用​​​​Selenium的配置​​​​Selenium的调用​​​​Selenium的使用​​​​定位​​​​定位元素的使用​​​​定位下拉标签元素 ......
  • Python中math和cmath模块的使用
    目录​​Math模块​​​​Cmath模块​​Math模块pi                数字常量,圆周率e                 表示一个常量sqrt(x)      ......
  • Spring Cloud Gateway 服务网关的部署与使用详细介绍
    一、为什么需要服务网关:1、什么是服务网关:        传统的单体架构中只需要开放一个服务给客户端调用,但是微服务架构中是将一个系统拆分成多个微服务,如果没有网......
  • C++ CMake 使用 Python3
    C++CMake使用Python3CMakeListst设置#如果使用的是非系统目录下的Python可以通过指定Python3_ROOT_DIR改变查找路径#set(Python3_ROOT_DIR"${CMAKE_SOURCE_D......