首页 > 其他分享 >数据标注工具 doccano

数据标注工具 doccano

时间:2024-06-20 11:21:32浏览次数:13  
标签:创建 -- 标签 doccano 按钮 工具 标注

目录

数据标注工具 Label-Studio

安装

打开命令行(cmd、terminal)执行安装命令

# Python 3.8+
pip install doccano -i https://pypi.tuna.tsinghua.edu.cn/simplelabel

image

运行 doccano

#在电脑第一次运行的时候初始化doccano
#只需设置一次,之后不用再运行该命令
doccano init

#创建用户名及密码;例如现在有一个主管admin,1个标注员vipsoft
doccano createuser --username admin --password 123456
doccano createuser --username vipsoft --password 123456

#开启doccano服务
doccano webserver

完成上述操作后,另打开一个新的命令行,执行下列命令

# In another terminal, run the command:
doccano task

image
image

打开 doccanno

在浏览器里输入:http://localhost:8000/ 支持中文,挺好
image
输入用户名密码:
image

创建项目

  • 抽取式任务项目创建

    适配命名实体识别、关系抽取、事件抽取、评价观点抽取等任务

  • 分类式任务项目创建

    适配文本分类、句子级情感倾向分类等任务。

为创建项目,如图点击Create按钮。根据需要选择合适的项目类别,这里选择 文本分类 Text Classification
image
image
image

上传数据

实验数据下载:https://hidadeng.github.io/blog/doccano_text_anotation/data.csv
image

上传数据
image
下面的 review 对应 csv 里的列
image
image

定义标签

击左侧菜单中的“Labels”按钮来定义我们的标签。我们看到标签编辑器页面。在标签编辑器页面中,您可以通过指定标签文本、快捷键、背景颜色和文本颜色来创建标签。
image
同理,可以定义负面neg标签。现在有了pos和neg两个标签。
image

添加成员

点击左侧目录中的 Members 按钮,然后,选择“Add”按钮以显示表单。使用您要添加到项目中的用户名和角色填写此表单。然后,选择“Save”按钮。如果没有可供选择的成员,记得创建成员。doccano createuser --username tom --password 123456
image

开始标注

点击导航栏中的Start annotation按钮,开始对文档进行批注了
image

导出数据

到“Dataset”页面,然后单击“操作”菜单中的“Export dataset”按钮。选择导出格式后,单击“Export”。
image

查看数据

import pandas as pd

df = pd.read_csv('all.csv')
df

image

统计

image

标签:创建,--,标签,doccano,按钮,工具,标注
From: https://www.cnblogs.com/vipsoft/p/18258050

相关文章

  • rebindMultiA:一款功能强大的多重A记录重绑定攻击测试工具
    关于rebindMultiArebindMultiA是一款功能强大的多重A记录重绑定攻击测试工具,该工具可以帮助广大研究人员通过针对目标域名执行多重A记录重绑定攻击,来测试目标域名或地址的安全情况。工具提供了一个rebindmultia.com域名,用来帮助广大研究人员使用该工具来进行测试实践。它会......
  • 【一文开启StableDiffusion】最火AIGC绘画工具SD阿里云部署指南(含踩坑经验)
     Midjonery使用简单,效果出色,不过需要付费。本文将介绍完全开源的另一款产品StableDiffusion,它的社区目前非常活跃,各种插件和微调模型都非常多,而且它无需付费注册,没有速度、网络限制,非常推荐一试。目前主流AI绘画产品:产品优点缺点StableDiffusionStablityAI公司开源、免费,可......
  • (转)Linux环境下使用logrotate工具实现nginx日志切割
    原文:https://www.cnblogs.com/even160941/p/13903291.html一.前提背景及需求Nginx运行日志默认保存在Nginx安装目录下的 /usr/local/nginx/logs目录(或/var/log/nginx目录下),包含access.log和error.log两个文件。(1) access.log 记录了哪些用户、哪些页面以及用户浏览器、i......
  • cbrutekrag:一款针对SSH服务器的渗透测试工具
    关于cbrutekragcbrutekrag是一款针对SSH服务器的渗透测试工具,该工具基于C语言开发,可以帮助广大研究人员使用字典攻击来对目标SSH服务器执行渗透测试。该工具仅出于教育目的设计和开发,请在获得测试授权后再使用该工具。 工具要求libssh 工具下载广大研究人员可以使......
  • Columbus:一个基于API实现的子域名发现服务工具
    关于ColumbusColumbus是一款功能强大的子域名发现与枚举工具,该工具基于API实现其功能,并且还提供了很多其他的高级功能。在该工具的帮助下,广大研究人员可以快速且高效地实现子域名枚举任务。前端架构HTML+tailwindcss+DaisyUI想要了解网络安全,或者想学习网络安全知识的......
  • 13.1.资源清单的管理工具-helm
    目录一、helm的介绍1.helm的价值概述2.helm的关键名词二、安装部署helm1.解压安装包并设置全局命令2.添加命令补全三、使用helm部署服务管理1.使用helm创建chart1.1创建工作目录 1.2.helm创建chart2.响应式创建名称空间3.安装chart到名称空间4.使用helm命令查看......
  • matlab最优化工具箱
    一、实验目的(一)通过一个农业生产计划优化安排的实例求解,培养学生解决实际线性规划问题的初步能力;熟悉线性规划的建模过程;掌握Matlab优化工具箱中线性规划函数的调用。二、实验内容(一)某村计划在100公顷的土地上种植a、b、c三种农作物。可以提供的劳力、粪肥和化肥等资源的数量,种......
  • 推荐一款目前可用的百度网盘下载工具:ODE多功能助手
    ODE多功能助手是一款百度网盘下载工具,目前还在开发阶段,但已实现百度网盘解析下载功能。用户可以提前使用该功能进行百度网盘文件的下载。软件特点:1.多功能预期:虽然目前功能有限,但开发者计划将其打造为一款多功能下载工具。2.自动解析:能够自动识别百度网盘链接中的提取码,......
  • postman接口测试工具详解
    关注我,持续分享逻辑思维&管理思维&面试题;可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导;推荐专栏《10天学会使用asp.net编程AI大模型》,目前已完成所有内容。一顿烧烤不到的费用,让人能紧跟时代的浪潮。从普通网站,到公众号、小程序,再到AI大模型网站。干货满满。学成后可......
  • Windows 10 磁盘管理使用教程 Windows 10 磁盘管理工具的基本步骤和常见操作;高级的 Wi
    Windows10磁盘管理初级使用教程大纲:1. 打开磁盘管理工具方法:右键点击“此电脑”或者“计算机”图标,选择“管理”,然后在左侧面板中找到并点击“磁盘管理”。2. 磁盘基本信息查看查看已安装的物理硬盘和分区的基本信息:硬盘列表分区列表可用空间和已用空间3. 创......