首页 > 其他分享 >9.16

9.16

时间:2024-12-26 18:11:52浏览次数:5  
标签:9.16 petal sepal width length 取值 属性

今天完成《机器学习》的第一次作业,找到了网上的大量的数据集,并且下载,试图理解。

数据集名称

Iris

来源

UCI Machine Learning Repository [下载地址: https://archive.ics.uci.edu/ml/datasets/Iris]

数据集描述

 Iris 数据集是一个常用的多类别分类问题数据集,包含了鸢尾花的萼片和花瓣的测量数据。

样本数(大小)

150

属性个数

4

属性值取值范围

萼片长度、宽度以及花瓣长度、宽度均为厘米单位,具体数值区间在不同属性上有所不同。

标签数量

3 (setosa, versicolor, virginica)

标签值\取值范围

三个不同的鸢尾花品种。

样本举例

sepal length=5.1, sepal width=3.5, petal length=1.4, petal width=0.2, label=setosa

sepal length=7.0, sepal width=3.2, petal length=4.7, petal width=1.4, label=versicolor

sepal length=6.3, sepal width=3.3, petal length=6.0, petal width=2.5, label=virginica

 

面向任务

分类

 

2.

数据集名称

Dry Bean

来源

Dry Bean - UCI Machine Learning Repository

数据集描述

本研究使用了一个计算机视觉系统来区分市场上具有相似特征的七种不同注册类型的干豆。通过高分辨率相机拍摄了13,611颗干豆的图像,并从中提取了16个特征,包括12个尺寸特征和4个形状特征

样本数(大小)

13,611

属性个数

16 (12个尺寸特征 + 4个形状特征)

属性值取值范围

属性类型包括整数和实数,具体的取值范围取决于每个特征的定义,例如面积是以像素为单位计算的区域大小。

标签数量

 7 (Seker, Barbunya, Bombay, Cali, Dermosan, Horoz, Sira)

标签值\取值范围

七个不同的干豆品种。

样本举例

Area=100, Perimeter=20, MajorAxisLength=15, MinorAxisLength=10, AspectRatio=1.5, Eccentricity=0.8, ConvexArea=120, EquivDiameter=11.18, Extent=0.8, Solidity=0.9, Roundness=0.8, Compactness=0.73, ShapeFactor1=?, ShapeFactor2=?, ShapeFactor3=?, ShapeFactor4=?, class="Seker"

Area=120, Perimeter=25, MajorAxisLength=18, MinorAxisLength=12, AspectRatio=1.5, Eccentricity=0.7, ConvexArea=140, EquivDiameter=12.25, Extent=0.85, Solidity=0.95, Roundness=0.75, Compactness=0.67, ShapeFactor1=?, ShapeFactor2=?, ShapeFactor3=?, ShapeFactor4=?, class="Barbunya"

 

面向任务

分类

 

3.

数据集名称

Heart Disease

 

来源

UCI Machine Learning Repository [下载地址: https://archive.ics.uci.edu/ml/datasets/Heart+Disease]

数据集描述

此数据库包含来自四个不同来源的心脏病患者数据:Cleveland、Hungary、Switzerland 和 VA Long Beach。实验通常集中于区分心脏病的存在(值1、2、3、4)与不存在(值0)。

样本数(大小)

303

属性个数

13 (实际上共有76个属性,但常用的是其中14个)

属性值取值范围

属性类型包括分类、整数和实数,具体的取值范围取决于每个特征的定义。

标签数量

5 (0代表无心脏病,1-4代表不同程度的心脏病)

标签值\取值范围

0 (无心脏病),1-4 (不同程度的心脏病)

样本举例

age=63, sex=1, cp=3, trestbps=145, chol=233, fbs=1, restecg=0, thalach=150, exang=0, oldpeak=2.3, slope=2, ca=0, thal=2, num=1

age=37, sex=1, cp=2, trestbps=130, chol=250, fbs=0, restecg=0, thalach=187, exang=0, oldpeak=3.5, slope=2, ca=0, thal=2, num=0

 

面向任务

分类

标签:9.16,petal,sepal,width,length,取值,属性
From: https://www.cnblogs.com/lml66/p/18633873

相关文章

  • 单片机初学日记9.16-9.22
    准备1.软件安装       编写软件keilv5       烧录软件stcisp 2.新建工程:养成编程习惯            从上到下由主到次         芯片AT89C52         品字第一列工程名第二列user主程序driver底层  ......
  • 9.16~9.22 总结
    做题ARC156D注意到\(f(x^{2^k})=f(x)^{2^k}\pmod2\)。然后问题是计算生成函数的乘积的答案。我的想法是考虑\(f(x^{2^{10}})\)的最低项大于\(f(x)f(x^2)\dotsf(x^{2^9})\)的最高项,因此可以分位做。但是若直接考虑拆位计算\(i\)位,这时考虑计算(和为\(S\))\(\lfloor\fr......
  • 2024.9.16下午校测
    T1题目描述有\(n\)个人站成一行,每个人有一个魅力值,相同魅力值的人会形成一个团伙,你出于对于社会和谐发展的考虑,定义一个团伙正常当且仅当团伙人数为\(2\),现在你的任务就是回答\(M\)个询问,每次询问一个区间\([L,R]\),你需要回答这个区间中所有人各自结成团伙后,处于不正常团......
  • 9.16
    今天完成《机器学习》的第一次作业,找到了网上的大量的数据集,并且下载,试图理解。数据集名称Iris来源UCIMachineLearningRepository[下载地址: https://archive.ics.uci.edu/ml/datasets/Iris]数据集描述 Iris数据集是一个常用的多类别分类问题数据......
  • 云原生周刊:Prometheus 3.0 Beta 发布|2024.09.16
    开源项目推荐KumaKuma是一个现代化的基于Envoy的服务网格,能够在每个云平台上运行,支持单区域或多区域部署,兼容Kubernetes和虚拟机。凭借其广泛的通用工作负载支持,以及对Envoy数据平面代理技术的原生支持(但无需Envoy专业知识),Kuma提供了现代化的L4-L7服务连接、发现、......
  • 2024.9.16 Python,最短的桥
    1.最短的桥:这个题我最新的代码如下:fromcollectionsimportdequeclassSolution:defshortestBridge(self,grid:List[List[int]])->int:nr=len(grid)ifnr==0:return0nc=len(grid[0])island=deque([])......
  • 2024.9.16 下午 总结(考 DS)
    T1做法1:莫队。(考虑一个数的出现次数变化时的影响。)应该可以直接做,似乎也可以正难则反(见做法2)。做法2:[扫描线](?)。按询问右端点排序。记一下每个位置前面最近的和它权值相同的位置。一种是直接做,分讨。一种是正难则反:算前缀和;算出现次数为\(2\)的数的贡献之和,减去这部分贡献。......
  • 2024.9.16 上午 总结(考 DS)
    T1我的做法:合并->并查集。类似建Kruskal重构树。询问跑LCA。注意并查集合并要把两个根都变成一个新点的儿子,而不是把一个作为另一个的儿子。(可能类似建[边](?)Kruskal重构树)要特判询问时\(x=y\)的情况(好像是输出\(0\))。lzh的做法:连出一棵树,边的边权是......
  • inscode的会员计划的python环境问题【版本3.9.16】无法升级python
    购买了inscode的会员计划后,部署python项目遇到python环境无法升级的问题inscode的会员计划的环境是3.9.16,但是项目用的例子需要3.10以上的版本,最终本人也无法完全解决,虽然手动安装了python3.10,一切都可以实现,但是最后环境自动恢复到3.9版本,导致自己手动配置的全废了,本帖子......
  • 9.16
    今天早上学了算法与数据结构的队列,学习了队列的初始化,以及循环队列的顺序表示与实现,其中最重要的是判断循环队列是否为空又或者是否满不能单纯的依靠两个指针判断。同时对于排出队列元素后所出现的假溢出问题也需要对于指针所在位置加一后的对总个数求余来进行判断。同时还学习了......