如何可视化bert的注意力权重

时间：2022-12-17 17:56:27浏览次数：55

标签：bert attention tokens html 可视化 model 注意力 view

参考链接：

bertviz github
使用指南：BERT可视化工具bertviz体验
一些bert中存在的模式解析：解构 BERT：可视化注意力的内部运作，最强NLP模型BERT可视化学习

代码（保存成html）

from transformers import AutoTokenizer, AutoModel, utils
from bertviz import model_view, head_view
utils.logging.set_verbosity_error()  # Suppress standard warnings
model_name='/downloads/bert-base-chinese'
input_text = item['title']+item['key_word']
tokenizer = AutoTokenizer.from_pretrained('/downloads/bert-base-chinese')
tokenizer.add_special_tokens({ "additional_special_tokens": [ "[unused1]", "[unused2]", "[unused3]"] })
model = AutoModel.from_pretrained(model_name, output_attentions=True)  # Configure model to return attention values
inputs = tokenizer.encode(input_text, return_tensors='pt')  # Tokenize input text
print('inputs:', inputs)
outputs = model(inputs)  # Run model
attention = outputs[-1]  # Retrieve attention from model outputs
tokens = tokenizer.convert_ids_to_tokens(inputs[0])  # Convert input ids to token strings
print('tokens:', tokens)
# print('attention:',attention)
# model_view(attention, tokens)  # Display model view
html_head_view = head_view(attention, tokens, html_action='return')

with open("views/bert.html", 'w') as file:
    file.write(html_head_view.data)

基本用法：

红色是bert中的12层，绿色是每层的12个头，可以单击进行选择，双击进行过滤。

鼠标放到左边的某个词上，线条显示的意思是，在更新这个词emb的过程中，右边不同词的注意力权重，即重要程度。线越深越重要。

鼠标放到右边的某个词上，线条的表示的意思是，这个词都被左边哪些词关注到了，线越深代表被关注的越强。

标签：bert,attention,tokens,html,可视化,model,注意力,view
From： https://www.cnblogs.com/carolsun/p/16989265.html

RNA-seq 详细教程：可视化（12）
学习内容了解如何为可视化准备数据了解如果利用可视化来探索分析结果火山图可视化热图可视化可视化结果当我们处理大量数据时，以图形方式显示该信息以获得更多信息，......
利用IBERT IP核实现GTX收发器硬件误码率测试实例
利用IBERTIP核实现GTX收发器硬件误码率测试实例1. 引言Vivado中提供了1种IBERT工具用于对XilinxFPGA芯片的高速串行收发器进行板级硬件测试。通过IBERT我们可以获取误码......
全自动化数据洞察！数据分布对比可视化！⛵
......
Python可视化图表生成-Matplotlib
✅作者简介：热爱科研的算法开发者，Python、Matlab项目可交流、沟通、学习。......
Python绘制柱状图之可视化神器Pyecharts
✅作者简介：热爱科研的算法开发者，Python、Matlab项目可交流、沟通、学习。......
【机器学习】李宏毅——自注意力机制(Self-attention)
前面我们所讲的模型，输入都是一个向量，但有没有可能在某些场景中输入是多个向量，即一个向量集合，并且这些向量的数目并不是固定的呢？这一类的场景包括文字识别、语音识别、图......
大屏数据可视化项目需要注意什么问题？
样式什么的都没什么太大变化，<script>$(function(){functionapiFn(){this.hostname=""}apiFn.prototype={......
低代码系列 —— 可视化编辑器3
可视化编辑器3这是可视化编辑器的最后一篇，本篇主要实现属性区和组件的放大和缩小，最后附上所有代码。属性区：即对编辑区的组件进行编辑，例如编辑......
数据看板可视化
前言这段时间一直在做可视化，在我的项目中有一部分是电力巡检的数据可视化。其中的数据看板比较简单，我将其单独抽离出来形成一个demo，为保密demo中数据非真实数据。先看效果......
瓴羊Quick BI 填报组件让数据分析和可视化呈现轻而易举
当前，发布了有关应用行业软件的年度报告，里面表示，市场规模在不断扩大，增速也有所提升。瓴羊、帆软等国产的BI商家都在积极成长以满足相关需求。但是BI工具的规划应用只是实现对......

如何可视化bert的注意力权重

代码（保存成html）

基本用法：

相关文章

赞助商

阅读排行