Datawhale工具
组件:数据可视化组件
炼丹师在炼丹过程中最头疼的事情是什么?
1、好不容易找到可用数据,但无法直观了解标注质量?
2、想把标注情况可视化展现,却要花费数天分辨千奇百怪的数据格式、写繁杂代码翻过万重山?
3、辛苦劳动后,若是数据可用那还皆大欢喜,若是到最后发现数据质量不佳,那所有工作从头来过?
面对这些痛点,其实可以通过数据可视化组件来解决这些问题,减免“炼丹”前复杂的“生火”动作,完美跳过下载步骤,无需另写代码。
通过工具提升效率,带大家了解数据工程师生存必备工具之:
格物钛数据可视化组件
格物钛可视化组件,是基于格物钛标准格式开发的针对图片、点云、多传感器融合、语音以及文本类数据的快速在线可视化组件,支持原数据及其标注信息的同时可视化,支持多种分布方式查看数据特征,帮助算法工程师快速确认数据质量,将更多的精力投入AI开发的后续工作中!
可视化组件提供什么?
➡ 直观预览原数据
在线预览主流格式的图片、点云、文本、音视频原数据,包括多种激光雷达点云图像的可视化。
01
图片类型
02
点云类型
03
语音类型
04
文本类型
滑动查看更多
➡ 灵活查看标注信息
数据标注信息在线可视化,快速查看标注数据的标签、属性等信息。
快速选择文件,查看标注信息
通过分享功能,快速分享插件地址或将插件嵌入您自己的网页中。
分享插件地址、将插件嵌入自己的网页
➡ 分布可视化洞察数据特征
以列表、柱状图、饼图等多种样式查看数据的多级标注与属性分布,在线查看、实时统计数据,快速评估数据集质量以及对您使用场景的匹配程度!
01
饼图
02
柱状图
03
列表
滑动查看更多
如何快速使用可视化组件?
➡ 可视化查看公开数据集
在格物钛公开数据集平台Graviti Open Datasets,我们提供了海量的公开数据集。
在查找数据集的过程中,您可点击进入数据集详情概要页面快速预览数据。
快速可视化查看数据集,掌握细节,所见即所得;试错成本大幅降低,轻松确定数据集为自己想要的Mr. Right。
➡ 可视化自有数据集
您可将数据集上传至您在格物钛的个人空间,无需开发即可进行可视化。您可通过开发者工具上传融合数据集、连续数据以及标注数据,3D和多传感器等复杂场景都可以轻松搞定。
您无需针对每一种标注类型重新编写可视化代码,大大减少了可视化开发工作量。
➡ 本地数据集可视化
如果您不想上传数据集,我们也提供本地可视化能力。
通过Python SDK读取本地数据,您可立即通过可视化组件浏览数据集,无需登陆和上传即可使用数据可视化插件所有功能,快速把握数据质量。
详情请查看:https://tensorbay-python-sdk.graviti.com/en/stable/features/visualization.html#pharos-usage
关于「格物钛」
格物钛定位为面向机器学习的数据平台,帮助AI开发者解决日益增长的非结构化数据难题。借助非结构化数据管理平台TensorBay和开源数据集社区Open Datasets,机器学习团队和个人可进行数据管理、查询、协同、可视化和版本控制等高效操作,降低高质量数据获取、存储和处理成本,加速AI开发和产品创新。
Open Datasets
标签:查看,生存,必备,工程师,可视化,组件,格物,数据,标注 From: https://blog.51cto.com/u_15699042/7188376