首页 > 其他分享 >心理健康数据集:mental_health_chatbot_dataset

心理健康数据集:mental_health_chatbot_dataset

时间:2023-09-18 22:58:30浏览次数:42  
标签:mental attacks panic chatbot dataset health 数据

一.数据集描述
1.数据集摘要
  该数据集包含与心理健康相关的问题和答案的对话对,以单一文本形式呈现。数据集是从流行的医疗博客(如WebMD、Mayo Clinic和HealthLine)、在线常见问题等来源精选而来的。所有问题和答案都经过匿名化处理,以删除任何个人身份信息(PII),并经过预处理以删除任何不必要的字符。
2.语言
  数据集中的文本是英文。

二.数据集结构
1.数据实例
  一个数据实例包括一个文本列,其中包含了患者和医疗提供者之间的问题和答案的对话。问题是由患者提出的,答案是由医疗提供者提供的。如下所示:

"<HUMAN>: What is a panic attack? <ASSISTANT>: Panic attacks come on suddenly and involve intense and often overwhelming fear. They’re accompanied by very challenging physical symptoms, like a racing heartbeat, shortness of breath, or nausea. Unexpected panic attacks occur without an obvious cause. Expected panic attacks are cued by external stressors, like phobias. Panic attacks can happen to anyone, but having more than one may be a sign of panic disorder, a mental health condition characterized by sudden and repeated panic attacks."

翻译中文,如下所示:

"<HUMAN>: 什么是惊恐发作? <ASSISTANT>: 惊恐发作突然发作,伴随着强烈且常常不可抑制的恐惧。它们伴随着非常具有挑战性的身体症状,如心跳加快、呼吸急促或恶心。突发的惊恐发作没有明显的原因。而预期的惊恐发作是由外部应激因素引起的,比如恐惧症。惊恐发作可能会发生在任何人身上,但多次经历可能是惊恐症的迹象,这是一种以突然和反复的惊恐发作为特征的心理健康状况。"

2.数据字段
  'text':患者和医疗提供者之间的问题和答案的对话。

三.数据集创建
1.策展理由
  聊天机器人为寻求支持的个人提供了一个随时可用且易于访问的平台。它们可以随时随地访问,为需要帮助的人提供即时支持。聊天机器人可以提供共情和非判断性的回应,为用户提供情感支持。虽然它们无法完全替代人际互动,但它们可以是一个有用的补充,尤其是在困难时刻。因此,这个数据集被策划出来,以帮助使用这个自定义数据集微调会话式AI聊天机器人,然后可以部署并提供给最终患者作为聊天机器人。
2.数据源
  该数据集是从流行的医疗博客(如WebMD、Mayo Clinic和HealthLine)、在线常见问题等来源策划而来的。
3.个人和敏感信息
  该数据集可能包含与心理健康相关的敏感信息。所有问题和答案都经过匿名化处理,以删除任何个人身份信息。

参考文献:
[1]mental_health_chatbot_dataset:https://huggingface.co/datasets/heliosbrahma/mental_health_chatbot_dataset
[2]https://github.com/iamarunbrahma/finetuned-qlora-falcon7b-medical
[3]Fine-tuning of Falcon-7B Large Language Model using QLoRA on Mental Health Conversational Dataset:https://medium.com/@iamarunbrahma/fine-tuning-of-falcon-7b-large-language-model-using-qlora-on-mental-health-dataset-aa290eb6ec85
[4]train/loss for Falcon-7B PEFT model:https://wandb.ai/heliosbrahma/huggingface/reports/train-loss-for-Falcon-7B-PEFT-model--Vmlldzo1MDQxMDAy?accessToken=fi8s1lrhuwjlloumbxbmd3mm9h138nmu0b03szmir9fyqqs8wlev72878yd97ctn

标签:mental,attacks,panic,chatbot,dataset,health,数据
From: https://www.cnblogs.com/shengshengwang/p/17713360.html

相关文章

  • Chatbot到底提供了哪些便利?来看看“中文版Chatbase”
    Chatbot的出现可以说是在极大的程度上改变了企业与客户互动的方式。Chatbot凭借其先进的功能和全天候可用性提供了一系列便捷的功能,为企业和客户提供便利和高效。随着自然语言处理和机器学习算法的进步,Chatbot已经发展到可以提供准确和个性化的响应,从而增强整体客户体验。像HelpLoo......
  • 相比SiteGPT,用HelpLook创建Chatbot有哪些优势?
    在当今快节奏的数字时代,很多企业都在不断寻找新的方法来改善客户支持和简化运营。一种广受欢迎的解决方案是使用AI问答机器人(Chatbot)。聊天机器人凭借其理解自然语言查询和实时响应的能力,已成为各行业企业不可或缺的工具。SiteGPT和HelpLook是两个比较强大的人工智能工具,在技术和人......
  • NLP(六十二)HuggingFace中的Datasets使用
    Datasets库是HuggingFace生态系统中一个重要的数据集库,可用于轻松地访问和共享数据集,这些数据集是关于音频、计算机视觉、以及自然语言处理等领域。Datasets库可以通过一行来加载一个数据集,并且可以使用HuggingFace强大的数据处理方法来快速准备好你的数据集。在ApacheArrow......
  • Three ways to conditionally remove variables in a dataset
    Method1:proccontentsdata=carsshortout=outds00;run;dataoutds(keep=name);setoutds00;vnam=substr(name,1,1);ifvnamne"M"thenoutput;run;proctransposedata=outdsout=outds01(drop=_name__label_);idname;run;dataoutds02(drop=......
  • 使用 HelpLook Chatbot,让AI聊天机器人变成销售经理
    想要增强AI聊天机器人销售技巧的话,我们需要一个强大的搭建工具来帮助我们增加客户互动,通过很多的客户互动数据来支撑和锻炼我们的AI聊天机器人。在本篇文章中,looklook将会系统地来说说该如何定制聊天机器人的行为。使用AI聊天机器人的好处聊天机器人最明显的好处是,它们可以提供即时......
  • A Challenge Dataset and Effective Models for Aspect-Based Sentiment Analysis
    摘要基于方面的情感分析(ABSA)由于其广泛的应用,近年来受到了越来越多的关注。在现有的ABSA数据集中,大多数句子只包含一个或多个具有相同情感极性的方面,这使得ABSA任务退化为句子级情感分析。在本文中,我们提出了一个新的大规模多方面多情感(MAMS)数据集,其中每个句子至少包含两个具有不......
  • IIncrementalGenerator 增量 Source Generator 生成代码入门 从语法到语义 获取类型完
    本文告诉大家如何在使用IIncrementalGenerator进行增量的SourceGenerator生成代码时,如何从语法分析过程,将获取的语法Token转换到语义分析上,比如获取类型完全限定名。一个使用的例子是在拿到一个Token表示某个类型时,本文将演示通过语义分析获取到拿到的Token的Type类......
  • train_set_x_orig = np.array(train_dataset["train_set_x"][:])
    这行代码的作用是将 train_dataset 字典中的 "train_set_x" 键对应的值转换为一个NumPy数组,并将其赋值给变量 train_set_x_orig。首先,train_dataset["train_set_x"] 表示从 train_dataset 字典中获取键为 "train_set_x" 的值。接下来,[:] 表示获取该值的所有元素。最......
  • 搭建自己的ChatGPT智能问答,HelpLook ChatBot 正式上线!
    基于已有内容的站点或现成文档零代码快速导入即可生成自己专属的ChatGPT智能问答机器人HelpLookChatBot,正式发布上线!只需连接您的数据源,HelpLook就能为您的数据创建一个类似ChatGPT的聊天机器人。您可以将它作为小工具以JS的方式添加到您的任意网站,或API集成的方式,与您专属......
  • 基于 Vercel & TiDB Serverless 的 chatbot
    作者:shiyuhang0#前言TiDBServerless去年就有和Vercel的集成了,同时还有一个bookstoretemplate方便大家体验。但个人感觉bookstore不够炫酷,借2023TiDBhackthon的机会,我搞了个maskchatbot,你可以在maskchatbot上选定角色,基于此生成prompt来更好的使用ChatGPT......