首页 > 其他分享 >基于 LLM 的小众脚本语言(某仿真软件 DSL)生成方案

基于 LLM 的小众脚本语言(某仿真软件 DSL)生成方案

时间:2024-11-01 10:48:34浏览次数:3  
标签:仿真 脚本语言 训练 代码 DSL 文档 LLM 软件

某仿真软件现状

新建仿真项目后,工程中的模型只能依靠编辑其自带的脚本语言来进行增删改,业务人员的学习成本极高。网上的资料也很少,Github 上都只能找到一个该软件的项目代码。文档也基本只有该软件自带的文档,社区基本没有,好在文档写的比较详实。

目前打算去尝试的解决方案

基于 Code Llama/Qwen2.5-Coder/DeepSeek Coder 做 continual training 或 fine-tune。

训练数据集

  1. 仿真软件自带的 60+ demo 项目代码
  2. 公司已有项目代码 10~20

后续训练方案

  • 预估计算量:8卡 A100,2~3天
  • 确保用于训练的代码质量,做好数据清洗
  • 防止训练过程中出现遗忘,添加一些 C++ 代码做混合训练,比例可以为 2:1 或者 4:1
  • 根据 loss 的变化,lr 在训练中可以做一些调整;epoch 小于 5

评估

  • 训练后测效果,RAG + In context learning 配合使用
  • 参考 HumanEval 和 SWE-bench

标签:仿真,脚本语言,训练,代码,DSL,文档,LLM,软件
From: https://www.cnblogs.com/cdyang/p/18519723

相关文章

  • LLM | 论文精读 | 地学视觉语言大模型:Towards Vision-Language Geo-Foundation Model:
    论文标题:TowardsVision-LanguageGeo-FoundationModel:ASurvey作者:YueZhou,LitongFeng,YipingKe,XueJiang,JunchiYan,XueYang,WayneZhang期刊:未提供DOI:https://arxiv.org/abs/2406.09385email:[email protected]创作不易,恳请大家点赞收藏支持:)论......
  • bellman_ford算法原理
    是什么松弛在《算法四》中,对松弛的解释是:relaxtheedge,看起来比较抽象,不过如果我们从生活中的实例去理解,就简单多了:试想一根绳索,当你握着绳索的两头使劲用力拉伸时,绳子紧绷,长度会变长;而当你减小用力时,绳子松弛,长度会变短。当你没有用任何力时,此时绳子的长度最短。这里当用力减......
  • BitNet.cpp:革新性的1比特LLM推理框架,让CPU也能驾驭百亿参数大模型!
    ......
  • Prompt工程八大技巧:打造高效LLM应用
    文章目录前言一、明确认知过程边界二、明确指定输入/输出三、实施防护栏四、与人类认知过程对齐(一)模仿人类思维的步骤分解(二)多步骤/代理的应用五、利用结构化数据六、精心设计上下文数据七、保持简单八、不断迭代零基础入门AI大模型1.学习路线图2.视频教程3.......
  • LLM大模型: Maskformer/Mask2Former语义分割原理详解
    1、自动驾驶、机器人、电商、监控等行业都涉及到image的sematicsegmentation,传统的方式:per-pixelclassification,每个像素点都要分类;如果进一步做 instance-levelsegmentation,可能还要改networkarchiture后重新训练,很麻烦。FAIR在2021年10月份的时候发表了论文:Per-PixelC......
  • LLM论文研读: GraphRAG的替代者LightRAG
    1. 背景最近有一个很火的开源项目LightRAG,Github6.4K+星※,北邮和港大联合出品,是一款微软GraphRAG的优秀替代者,因此本qiang~得了空闲,读读论文、跑跑源码,遂有了这篇文章。2. LightRAG框架2.1 已有RAG系统的局限性1)许多系统仅依赖于平面数据表示(如纯文本),限制了根据文本中......
  • 终于有了!!!基于Langgraph使用本地LLM搭建agent!!!
    需求Langchain是使用闭源LLM实现agent搭建的,Langgraph官网给的例子是基于Claude,其他一些agent例子也是基于OPENAI的,但是对于很多私有化场景,使用本地LLM搭建agent是非常重要的。但是网上并没有相关的教程,捣鼓了两天,捣鼓出来Ollama+Langgraph实现的基于本地LLM的agent搭建模......
  • 2025秋招LLM大模型多模态面试题(十三)- rag(检索增强生成)技术
    1.基本概念检索增强LLM(RetrievalAugmentedLLM),简单来说,就是给LLM提供外部数据库,对于用户问题(Query),通过一些信息检索(InformationRetrieval,IR)的技术,先从外部数据库中检索出和用户问题相关的信息,然后让LLM结合这些相关信息来生成结果。下图是一个检......
  • AI大模型(LLMs)五大热点研究方向分享!
    近年来,人工智能大模型(LLMs)的研究不断深入,衍生出了多个热门方向,聚焦提升模型的性能、适应性与应用场景,推动了技术的突破与革新。今天为大家梳理一下AI顶会上的五大热门研究方向,希望为那些专注大模型方向的研究者带来一些灵感和参考。Part.01检索增强生成(RAG)大模型虽然在生......
  • 清华:细粒度强化学习优化LLM工具使用
    ......