首页 > 其他分享 >创建自己的数据集进行分析——Faker 库教程

创建自己的数据集进行分析——Faker 库教程

时间:2022-09-19 12:01:51浏览次数:99  
标签:分析 教程 创建 Javascript Faker 数据

创建自己的数据集进行分析——Faker 库教程

如果您曾经在您最喜欢的平台(例如 TikTok、Udemy 等)上看到大量有关数据分析的视频、博客文章或课程,建议保持不变,请学习技术技能、SQL、Excel、Tableau 等开,这是非常重要的,但是总是被搁置的一件事是你可以用来将你刚刚学到的东西付诸实践的数据。

果然有很多免费的在线数据集,例如 卡格尔 , 通常虽然可用的信息可能不完全适合您的测试用例或可能不包括您希望的所有功能, 一个例子是 数据集 在您可以找到信用卡欺诈信息的地方,由于支付卡保证 (PCA) 合规性以保护持卡人的私人信息,元数据已被遗漏,因此您的分析受到限制。

那么你可能想知道的答案是什么?别再犹豫了,Faker 库在这里为我们提供帮助!

A Javascript library to generate fake data ( 资源)

对于我的测试用例,我将对此表示赞赏 美国消费金融投诉 数据集包含由 Faker 生成的数据,该库具有 Python、Javascript 等可用的绑定。我将在这个实验中使用 Javascript。

查看数据集中的列标签,我发现我们有一些日期、投诉的唯一 ID、位置数据等。

Available information within the dataset

为了丰富数据并使分析更有趣,我还想添加以下列:

  • 申报人的年龄。
  • 全名。
  • 对公司的满意度评分。
  • 电子邮件地址。
  • 电话号码。

下一步是浏览 Faker 的文档,看看哪些类和方法可以帮助我们实现目标。

简单看一下项目的 Github 存储库,就会发现我们可以生成的可用数据,甜!

Hello there! ( 资源)

浏览文档和我们设置的要求,我用 TypeScript 编写了以下代码并使用 NodeJS 运行它,这样它就可以为我们提供我想要的信息:

一旦脚本完成运行,只需将列数据复制并粘贴到 美国消费金融投诉 数据集,并将最终文件导入您最喜欢的可视化工具(Tableau、Power Bi 等)进行分析。

Hello there!

下一步

现在我们已经了解了如何使用 Faker 库来丰富您在网上找到的数据集的基础知识,您已经准备好开始利用这个库来创建练习可视化技能所需的信息。

我希望你喜欢这篇关于如何使用 Faker 的介绍!

如果您喜欢这篇文章,请继续关注,因为我目前正计划分享更多关于数据分析和电子的相关内容!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/37978/50501911

标签:分析,教程,创建,Javascript,Faker,数据
From: https://www.cnblogs.com/amboke/p/16707264.html

相关文章

  • ENVI5.6安装教程及安装包
    软件介绍目前ENVI5.6版本推出了许多有用的新功能,比如深度学习、cropscience等。如果是遥感专业人士,还是建议安装功能更强大的5.6版本(5.6和5.3版本可以共存)。安装主程......
  • 使用git创建项目至github
    前言github在2020/10/01宣布上的所有新库都将用中性词「main」命名,取代原来的「master」,如果我们通过 gitpush-ugriginmaster 方法上传仓库,在github仓库中就会出现......
  • Final Cut Pro X10.6.4如何局部处理加马赛克,模糊遮挡效果教程
    想要用FinalCutPro给视频中的人和物加马赛克该怎么操作呢?fcpx如何局部处理加马赛克,模糊遮挡效果教程分享给大家。其实很简单,这里用到的是FinalCutProX软件的效果里的......
  • SAP HANA2.0 HDB studio 创建租户数据库及备份租户数据库的初步理解
    为避免误人子弟,本次是由笔者于自己搭建的测试环境上进行测试的结果而记录下来的,没有确认是否正确,望知悉。0x00环境:1.HANA2.0 2.HDBstudio已安装0x01几个概念(自......
  • 环境创建和查看,等命令
    condainfo--envs:输出中带有【*】号的的就是当前所处的环境创建condacreate--nameyourEnvpython=2.7 condalist:看这个环境下安装的包和版本condainstallnum......
  • C#教程 - 枚举器 & 迭代器(IEnumrator & Iterator)
    更新记录转载请注明出处:https://www.cnblogs.com/cqpanda/p/16691006.html2022年9月19日发布。2022年9月10日从笔记迁移到博客。枚举器(Enumerator)枚举器和可枚举......
  • 大家好,这是我创建的第一个博客
    publicclassMain{publicstaticvoidmain(String[]args){System.out.println("你好world!");}}2022年9月19日,这是我创建的第一个博客!很高......
  • docker实战教程(七):镜像的分层概念
    联合文件系统(UnionFS)联合文件系统是一种分层、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系......
  • linux创建本地svn仓库
    记录代码迭代,创建本地svn仓库:#mkdir/home/svn#cd/home/svn#svnadmincreatemwork   //创建仓库mwork#cdmwork#vimconf/passwd         //......
  • Redis详细教程笔记
    1.目录2.待更新:集群环境搭建、订阅发布、哨兵机制、主从复制、缓存雪崩与穿透3.笔记链接:https://t.wss.ink/f/9bktugzrk5n复制链接到浏览器打开(过期联系:QQ:8108062......