本次创新项目实训自三月开始,在今天中期检查之后对项目工作进行了回顾,下文对这段工作作简要总结。
项目选题其实我是比较犹豫,因为LLM此前的了解只有ChatGPT这种基本成熟的模型,而且也只是简单调用,对源码,接口的使用基本是未知,以我对其他成员的了解,基本也大差不差。因此项目前景堪忧。
当我开始研究LLM以及应用微调的时候,我才发现,源代码的规模过于庞大,以至于我像是个误入迷宫的孩子,迷失在了github的目录下。为
我从未面对这样复杂的工程,在它面前,以往的课程设计只能称为玩具。
我们的工作建立在ChatGLM基础之上,而团队成员之间的分工不太明确。因此每个人都必须对模型微调和前后端的交互部分等有一定的了解,并在此基础上进行改进以完成需求。
目前的进度:
-
完成开源法律数据集搜集与通用法律知识训练
-
法律文书数据集构建与法律文书生成训练
-
基于Gradio的前端搭建
后续内容:
- 法律知识库接入
- 模型能力评估
- 前端基于多种格式的输出报告(.md、.pdf等)