pediatrics_llm_qa：儿科问诊小模型

时间：2024-09-12 21:35:05浏览次数：8

标签：pediatrics 训练模型 py qa llm

项目简介

本项目开源了基于儿科医疗指令微调的问诊模型：pediatrics_llm_qa(GitHub - jiangnanboy/pediatrics_llm_qa)，目前模型的主要功能如下：

智能问诊：问诊后给出诊断结果和建议。

更新

[2024/09/11] 开源了基于Qwen2-1.5B-instruct lora指令微调的儿科问诊模型

开源模型

模型	基座	HuggingFace
pediatrics_llm_qa_1.5B	Qwen2-1.5B-instruct	pediatrics_llm_qa_1.5B

⚡快速开始

配置环境（测试环境如下，具体版本可以根据实际需求配置）

openvino
openvino-tokenizers
optimum-intel>=1.17.0
transformers>=4.40.0,<4.42.0
huggingface-hub>=0.21.3
torch>=2.1
gradio>=4.20.0
peft
pandas

2.训练及合并

1.训练代码见train_sft/train.py，儿科问答训练语料见data_process/all_data.rar

2.此模型是经微调后的lora模型，需要将其与Qwen2-1.5B-Instruct模型进行merge，merge代码见：
train_sft/merge_lora_weights.py

3.下载模型参数并运行（要求单卡GPU >= 15G或者CPU）

GPU环境请运行gpu_infer下面的流式推理：
     1.gpu_stream_infer.py
     2.web形式的运行gpu_web_demo.py

CPU环境请运行cpu_infer下面的流式推理：(对merge后的模型转换为支持CPU运行格式，转换见cpu_infer/convert.py，转换命令为【python convert.py --model_id /output_qwen_merged --precision fp16 --output /output_qwen_merged-ov】)
     1.cpu_stream_infer.py
     2.web形式的运行cpu_web_demo.py

web样例

免责声明

预训练模型是基于大量语料库和算法模型进行训练的，并且在训练过程中可能存在偏差、错误和不完整的信息。因此，本项目提供的预训练模型仅供参考和研究使用，并不能保证其准确性和可靠性。使用预训练模型产生的结果可能存在误差和偏差，不能用于实际应用或决策。本项目不对使用预训练模型所产生的结果承担任何责任，也不对因使用预训练模型所产生的任何损失承担责任。使用者在使用预训练模型时应自行承担风险并进行自我验证。

标签：pediatrics,训练,模型,py,qa,llm
From： https://www.cnblogs.com/little-horse/p/18411149

AGI时代，程序员想学习大语言模型（LLM），应该从哪里开始？
一、怎样学好，并应用大模型AGI（ArtificialGeneralIntelligence，通用人工智能）时代，懂AI、懂编程、懂业务的超级个体，会是AGI时代最重要的人。为了成为这样的超级个体，我们需要在哪几个方向发力呢？那就是：原理、实践和认知。不懂原理就不会举一反三，走不了太远。不懂实践就只能纸上......
tanuki.py学习资料汇总 - 轻松构建更快更便宜的LLM应用
tanuki.py简介tanuki.py是一个用于轻松构建LLM驱动应用的Python库,它能让LLM应用随着使用变得更快更便宜。其主要特点包括:易于集成-只需几秒钟即可将LLM增强功能添加到任何工作流程中类型感知-确保LLM输出符合函数的类型约束,避免意外问题对齐输出-通过简单的断言语......
Base/chat/instruct in LLM
Base/chat/instructhttps://blog.csdn.net/qq_43127132/article/details/140447880大模型库中的base、chat、instruct和4bit通常指的是不同类型或配置的预训练语言模型。它们的区别主要在于训练目标、用途和模型参数的精度。以下是对这些术语的解释：1.Base模型(base) ......
RAG与LLM原理及实践(17)---Docker Redis & Python Usage
目录背景Redis环境download修改镜像RunRedisCodingpythonredisdownload基本使用描述完整代码运行结果高阶用法序列化的方式 Snapshot与AOF快照（RDB）AOF（Append-OnlyFile）代码总结发布与订阅描述代码运行结果注意事项解释Transanction......
LLM 工程师入门：生成式 AI 的简易指南
大模型发展了近两年，BaihaiIDP也分享了近百篇LLM各环节的技术洞察，有前沿探讨、有落地实践、有应用经验。但回头来看，我们似乎从来没有认真、从0开始探讨过LLM的基本原理。最近，一些企业客户和伙伴来询问，是否有LLM的从0到1的科普贴。他们说："虽然在很多场景中，L......
北大&阿里最新LLM偏好学习调研报告
《TowardsaUnifiedViewofPreferenceLearningforLargeLanguageModels:ASurvey》链接：https://arxiv.org/pdf/2409.02795github：https://github.com/kbsdjames/awesome-LLM-preference-learning摘要大型语言模型（LLMs）展现出强大的能力，但要实现与人类偏好的对齐，往往......
RLPF：用于LLM用户摘要的预测反馈
《RLPF:ReinforcementLearningfromPredictionFeedbackforUserSummarizationwithLLMs》链接：https://arxiv.org/pdf/2409.04421文章介绍了一种新的强化学习方法RLPF（ReinforcementLearningfromPredictionFeedback），用于优化大型语言模型（LLMs）生成的用户摘要，以提高下......
GEE错误：Image.select: Band pattern ‘BQA‘ did not match any bands. Available ban
目录错误原始代码Landsat8TOA数据介绍错误解析正确的代码结果错误Errorinmap(ID=LC08_044034_20130603):Image.select:Bandpattern'BQA'didnotmatchanybands.Availablebands:[B1,B2,B3,B4,B5,B6,B7,B8,B9,B10,B11,QA_PIXEL,QA_RADSAT......
【LLM训练系列】从零开始训练大模型之Phi2-mini-Chinese项目解读
一、前言本文主要是在复现和实践Phi2-mini-Chinese后，简要分析下Phi2-mini-Chinese这个项目，做一个学习实战总结。原文发布于知乎：https://zhuanlan.zhihu.com/p/718307193，转载请注明出数。Phi2-mini-Chinese简介Phi2-Chinese-0.2B从0开始训练自己的Phi2中文小模型，支持接入langc......
BinLLM论文阅读笔记
Text-likeEncodingofCollaborativeInformationinLargeLanguageModelsforRecommendation论文阅读笔记Abstract现存的问题：在调整用于推荐的大型语言模型（LLMRec）时，整合协作信息至关重要。现有的方法通过从头开始学习LLM潜在空间中的协作嵌入或通过外部模型的映射来......

pediatrics_llm_qa：儿科问诊小模型

相关文章

赞助商

阅读排行