数据挖掘与机器学习COMP 3027J课业1重量:40%提交:Brightspace上的报告(PDF)和zip文件(包括代码和数据集)。本课业的目的是练习如何使用数据挖掘和机器学习解决现实世界中的问题。您需要自己确定目标问题。你可以选择任何项目,但它必须是一个分类任务,并且在汇报(注意:不要与课业2中的数据集相关或使用该数据集;不要与您的FYP项目。)只要它是合法的。此课业是一个小组项目,每个小组都应该有四个成员。每个小组只需要提交一个解决方案。你的pdf报告应该清楚地详细说明你是如何进行实验的,以解决你的有针对性的问题,并显示您得到的结果。
1.您的报告应使用背页书写,并使用提供的模板:
2.它应该是人类可读的文档(例如,不包括代码)
3.最终报告预计为4-6页,包括参考文献。
4.你应该提供你的UCD学生编号,而不是提供的院校样板
5.每节使用清晰的标题。
6.如果需要,适当地包括表格和数字,例如提供标题、描述您的数字或分析文本中表格中提供的结果等。
7.最终报告文件名应为“Comp3027J_GroupXX”(例如。omp3027J_组01)在您的报告中,建议讨论以下重要主题,但不限于
这些主题:
1.现实世界中的问题是什么,为什么它很重要。
2.数据集选择(收集)和数据预处理。您在哪里找到数据(或者如何收集数据并创建数据集)?你如何分析你的数据?如何预处理您的数据以适应您的解决方案?您的数据集有什么挑战吗?等
3.方法
可以使用任何机器学习算法(不限于我们现有的算法有学问的鼓励创造力。要小心,一个复杂的方法只需要很少的描述和解释获得的信用很少。
4.评估
详细说明您的实验,例如拆分数据集、K-fold;将您的解决方案与文献中的基准进行比较;任务的评估指标;分析你的结果等。
您应该提交一个pdf文件和一个zip文件。在您的zip文件中,您应该包括您的代码和数据集。请确保清理您的代码以使结果可重复。如果它的大小
超过Brightspace限制,则需要通过USB密钥提交。注意你的pdf报告必须作为单独的文件提交,不应将其压缩到zip文件中。期末会有一次面试,你会被问及方法采用2.
•分级问题文献法评价代码+再现性5% 5% 15% 10% 5%