完成机器学习查询数据集的作业
数据集名称 | 样本数 | 属性 | 属性个数 | 标签 | 任务 |
---|---|---|---|---|---|
Iris 数据集 | 150 | 花萼长度, 花萼宽度, 花瓣长度, 花瓣宽度 | 4 | 鸟类(Setosa, Versicolor, Virginica) | 分类 |
MNIST 数据集 | 70,000 | 像素值(28x28像素) | 784 | 手写数字(0-9) | 分类 |
Titanic 数据集 | 891 | 乘客ID, 船舱等级, 姓名, 性别, 年龄, 登船港口, 票价, 亲属数量等 | 12 | 生还(0/1) | 分类 |
详细说明:
-
Iris 数据集
- 样本数: 150
- 属性: 包括花萼长度、花萼宽度、花瓣长度和花瓣宽度,共4个数值型属性。
- 属性个数: 4
- 标签: 数据集中的标签是鸢尾花的品种,有三种可能(Setosa, Versicolor, Virginica)。
- 任务: 分类任务,通过花萼和花瓣的特征来预测花的品种。
-
MNIST 数据集
- 样本数: 70,000张训练图像和10,000张测试图像
- 属性: 每张图像为28x28像素的灰度图像,共784个像素值。
- 属性个数: 784
- 标签: 每个图像的标签是手写数字(0到9)。
- 任务: 分类任务,通过图像的像素值来预测数字。
-
Titanic 数据集
- 样本数: 891个乘客的记录
- 属性: 包括乘客ID、船舱等级、姓名、性别、年龄、登船港口、票价、亲属数量等。
- 属性个数: 12
- 标签: 标签是乘客是否生还(0表示未生还,1表示生还)。
- 任务: 分类任务,通过乘客的特征来预测其是否生还。