人工智能2023-2024年人工智能理学学士请仔细阅读以下所有信息**评估I简报文件——单独评估(无团队合作)课程:JC3509–机器学习注意:这部分评估说明
课程总分的30%。学习成果成功完成此部分后,学生将具备以下区域:
•能够识别、准备和管理适当的数据集进行分析。
•能够适当地呈现数据分析的结果。
•能够分析数据分析的结果,并评估分析的性能上下文中的技术。
•分析技术的知识和理解,以及适当应用的能力他们在上下文中,对如何做到这一点做出正确的判断。剽窃和行为信息:您提交的报告可能会被提交剽窃检查(例如Turnitin)。有关更多信息,请参阅MyAberdeen上的幻灯片在你开始进行评估之前,提供有关避免抄袭的信息。还请阅读大学提供的以下信息此外,请您熟悉以下文件“学生行为准则”学科(学术)”:https://tinyurl.com/y92xgkq6
报告指南和要求
您的报告必须符合以下结构,并包括每个报告中概述的所需内容部分每个子任务都分配了自己的标记。您必须提供一份书面报告,以及相应的代码,包含所有不同的部分/子任务,提供完整的关键和反思对所进行过程的说明。
概述
此任务要求您完成完整的机器学习流程,代 写 JC3509人工智能机器学习包括数据处理以及对所开发方法的处理、模型构建和训练以及评估。你是其任务是创建一个神经网络,将数据分类为3类。第2页,共3页*请仔细阅读以下所有信息**满足本评估要求所需的数据集可在MyAberdeen中找到。
数据
该数据包含3家不同制造商生产的食品的化学特性。本实验的目的是探索所列化学措施之间的关系以下是食品的制造商。该数据有177条记录,其中第一列
“生产商”表示生产分析样品的制造商。数据集的特征如下所示:
•生产商——产品制造商(TARGET)。
•氨基酸–氨基酸的总含量百分比。
•苹果酸–苹果酸的百分比含量。
•灰分——产品中存在的灰分。
•Alc–存在的灰烬的碱度。
•Mg——镁的计量单位。
•酚类——酚类的总量。
•黄酮类化合物——产品中黄酮类酚的含量。
•非类黄酮酚类——产品中非类黄酮类酚类的含量。
•原花青素-原花青素测量。
•Colo_int–颜色强度。
•色调–颜色的色调。
•OD–产品的蛋白质含量。
•脯氨酸–脯氨酸氨基酸的测量。
目标:
使用这些数据的主要目的如下:
1.分类:通过分析确定产品的原产地(制造商)测量。
2.分析:推断哪些分析因素可能会影响的分类产品。为了实现这些目标,我们希望使用机器学习。
屈服
请提供以下信息:
1.一份书面报告,解释每项任务所采取的步骤以及每项任务背后的决定选择你应该使用机器学习原理来解释你的结果图形和/或表格。
2.一个代码提交,包括一个带注释的python文件,其中包含所需的所有代码
复制书面报告中的调查结果。第3页,共3页*请仔细阅读以下所有信息**任务1——数据准备(10分)
子任务:
1.导入数据集:请提供所提供数据的简短描述并导入数据进入您的编程环境;提供用于这些目的的代码片段。
2.预处理数据:如果您对数据进行了任何预处理,例如归一化,请解释它以及您进行预处理的原因;如果你没有做任何预处理,也请解释一下。
任务2——模型构建(50分)
您的任务是从头开始构建简单的完全连接的人工神经网络,以对记录分为3类(1、2或3)。您不允许使用任何机器学习或统计库,您应该
从头开始构建神经网络,即仅使用核心Python和NumPy。
子任务:
1.损失功能:选择并执行适当的损失功能,解释您为什么有选择了与数据和问题相关的损失函数。
2.网络设计:构建一个至少有一个隐藏层的全连接神经网络。解释您的体系结构选择,并通过代码片段、测试和书面演示解释您的代码按预期运行。要实现这一点,您需要施二者都
a.向前传球。
b.后向传球。
3.梯度下降:通过小批量随机梯度下降更新权重。通过代码片段、测试和书面解释证明重量更新。如果您愿意,您可以使用高级优化技巧,即动量。
注意:如果您无法完成上述任务,您可以使用其他库(即PyTorch),但这将导致扣20分。
任务3——模特培训(15分)
从上一个任务中获取模型,并根据在任务1中预先处理的数据对其进行训练。确保您在一个子数据集上训练您的模型,并拿出一个子集进行验证。
子任务:
1.模型训练:对训练集进行训练和参数选择。
2.模块正则化:实现正则化方法,简单解释(最多200字)
如何在代码上下文中工作,请使用代码片段来提供帮助。
3.模型推理:通过对保存的验证数据进行推理来验证模型。第4页,共3页**请仔细阅读以下所有信息**
任务4——评估(25分)评估经过训练的分类器的性能,并采用机器学习原理用图表和/或表格解释你的结果。此外,对经过培训的人员进行一些分析
模型,以更好地了解哪些分析因素可能会影响的分类产品。
子任务:
1.呈现结果:通过问题的适当度量来呈现分类器的结果陈述
2.绘图:绘制用于培训和验证的损失曲线,回答以下问题:
a.你的损失曲线告诉你什么?
b.您是否观察到任何过盈或过盈?
c.增加正规化有帮助吗?
3.解释结果:根据问题解释前几个子任务的结果语句/设置。标记标准
•知识的深度和广度。
•形式化、实现和伪代码的技术细节。
•沟通技巧(清晰、技术性内容和合理的推理)
•文件结构。提交说明您应该向Codio提交报告的PDF版本和随附代码
环境关于此评估的截止日期,请在MyAberdeen上查看。的名称
PDF文件应具有“JC3509_评估1 _<您的姓氏>_<您第一个
name>_<您的学生证>”。例如,“JC3509_Assession1_Smith_John_4568985.pdf”,
其中4568985是您的学生ID。
与本评估的任何方面有关的任何问题,请在课程中解决