心理健康数据集:mental_health_chatbot_dataset

2023-09-18 22:41:46

一.数据集描述
1.数据集摘要
  该数据集包含与心理健康相关的问题和答案的对话对,以单一文本形式呈现。数据集是从流行的医疗博客(如WebMD、Mayo Clinic和HealthLine)、在线常见问题等来源精选而来的。所有问题和答案都经过匿名化处理,以删除任何个人身份信息(PII),并经过预处理以删除任何不必要的字符。
2.语言
  数据集中的文本是英文。

二.数据集结构
1.数据实例
  一个数据实例包括一个文本列,其中包含了患者和医疗提供者之间的问题和答案的对话。问题是由患者提出的,答案是由医疗提供者提供的。如下所示:

"<HUMAN>: What is a panic attack? <ASSISTANT>: Panic attacks come on suddenly and involve intense and often overwhelming fear. They’re accompanied by very challenging physical symptoms, like a racing heartbeat, shortness of breath, or nausea. Unexpected panic attacks occur without an obvious cause. Expected panic attacks are cued by external stressors, like phobias. Panic attacks can happen to anyone, but having more than one may be a sign of panic disorder, a mental health condition characterized by sudden and repeated panic attacks."

翻译中文,如下所示:

"<HUMAN>: 什么是惊恐发作? <ASSISTANT>: 惊恐发作突然发作,伴随着强烈且常常不可抑制的恐惧。它们伴随着非常具有挑战性的身体症状,如心跳加快、呼吸急促或恶心。突发的惊恐发作没有明显的原因。而预期的惊恐发作是由外部应激因素引起的,比如恐惧症。惊恐发作可能会发生在任何人身上,但多次经历可能是惊恐症的迹象,这是一种以突然和反复的惊恐发作为特征的心理健康状况。"

2.数据字段
  ‘text’:患者和医疗提供者之间的问题和答案的对话。

三.数据集创建
1.策展理由
  聊天机器人为寻求支持的个人提供了一个随时可用且易于访问的平台。它们可以随时随地访问,为需要帮助的人提供即时支持。聊天机器人可以提供共情和非判断性的回应,为用户提供情感支持。虽然它们无法完全替代人际互动,但它们可以是一个有用的补充,尤其是在困难时刻。因此,这个数据集被策划出来,以帮助使用这个自定义数据集微调会话式AI聊天机器人,然后可以部署并提供给最终患者作为聊天机器人。
2.数据源
  该数据集是从流行的医疗博客(如WebMD、Mayo Clinic和HealthLine)、在线常见问题等来源策划而来的。
3.个人和敏感信息
  该数据集可能包含与心理健康相关的敏感信息。所有问题和答案都经过匿名化处理,以删除任何个人身份信息。

参考文献:
[1]mental_health_chatbot_dataset:https://huggingface.co/datasets/heliosbrahma/mental_health_chatbot_dataset
[2]https://github.com/iamarunbrahma/finetuned-qlora-falcon7b-medical
[3]Fine-tuning of Falcon-7B Large Language Model using QLoRA on Mental Health Conversational Dataset:https://medium.com/@iamarunbrahma/fine-tuning-of-falcon-7b-large-language-model-using-qlora-on-mental-health-dataset-aa290eb6ec85
[4]train/loss for Falcon-7B PEFT model:https://wandb.ai/heliosbrahma/huggingface/reports/train-loss-for-Falcon-7B-PEFT-model–Vmlldzo1MDQxMDAy?accessToken=fi8s1lrhuwjlloumbxbmd3mm9h138nmu0b03szmir9fyqqs8wlev72878yd97ctn

更多推荐

【第57篇】DEiT:通过注意力训练数据高效的图像transformer &蒸馏

摘要最近,纯基于注意力的神经网络被证明可以解决图像理解任务,如图像分类。这些高性能的是使用大型基础设施预先训练数以亿计的图像,从而限制了它们的采用。本文仅通过在Imagenet上训练,产生有竞争力的无卷积transformer。我们用一台电脑在不到3天的时间里训练它们。所提出的参考视觉transformer(86M参数

时序预测 | MATLAB实现NGO-LSTM北方苍鹰算法优化长短期记忆网络时间序列预测

时序预测|MATLAB实现NGO-LSTM北方苍鹰算法优化长短期记忆网络时间序列预测目录时序预测|MATLAB实现NGO-LSTM北方苍鹰算法优化长短期记忆网络时间序列预测预测效果基本介绍程序设计参考资料预测效果基本介绍MATLAB实现NGO-LSTM北方苍鹰算法优化长短期记忆网络时间序列预测(完整源码和数据)1.da

项目:TCP在线云词典

一.要求1.搭建的框架环境中实现并发,实现多个用户同时查询的功能。2.服务器分别保存每个用户的使用记录,客户端可以查询日志的功能。3.基本的查询单词的功能。4.密码验证的功能,实现登录验证账号和密码是否正确。二.流程和框架框架客户端服务器三.思路1.首先你要准备好单词文件,用于英语单词的查询。dict.txt2.该项目

【C++】泛型算法(四)使用顺序性容器

一、顺序性容器顺序性容器用来维护一组有序、类型相同的元素。主要是:vector和list。1.vectorvector是用一块连续的内存存放数据;vector进行随机访问,效率比较高(适合数列);vector对于插入和删除操作效率较低:这是由于vector内的每个元素都被存储在距离起始点固定的偏移位置,当进行插入操作时

C++ - 异常介绍和使用

前言我们在日常编写代码的时候,难免会出现编写错误带来程序的奔溃,或者是用户在使用我们编写的程序时候,使用错误所带来程序的奔溃。在C++当中可以对你觉得可能发生错误的地方在运行之前进行判断,发生错误可以给出提示。C语言传统的处理错误的方式在了解C++当中处理错误的异常之前,我们先来了解一下C语言当中处理错误的方式。终止程

前端面试的话术集锦第 20 篇博文——高频考点(输入 URL 到页面渲染的整个流程)

这是记录前端面试的话术集锦第二十篇博文——高频考点(输入URL到页面渲染的整个流程),我会不断更新该博文。❗❗❗借用这道经典面试题,将之前学习到的浏览器以及网络几章节的知识联系起来。首先是DNS查询,如果这一步做了智能DNS解析的话,会提供访问速度最快的IP地址回来。1.DNSDNS的作用就是通过域名查询到具体的IP。

【Vue】安装并使用vue-cli搭建SPA项目

目录一、Vue-cli安装1.1什么是Vue-cli1.2安装Vue-cli1.3使用Vue-cli构建项目二、SPA项目2.1导入、运行SPA项目2.2vue项目结构说明2.3.什么是*.vue文件2.4基于SPA项目完成路由2.5基于SPA项目完成嵌套路由一、Vue-cli安装1.1什么是Vue-cliVueCLI

换台电脑python使用uiautomator2操作逍遥模拟器

前几天写了一篇文章python使用uiautomator2操作雷电模拟器_小小爬虾的博客-CSDN博客今天用另外一个环境和模拟器再次测试。环境如下:win7sp164位;Python3.8.10;逍遥模拟器9.0.6;android版本9;逍遥模拟器自带adb版本1.0.41一、首先将手机(模拟器)进入开发者模式。多次

2023/9/18 -- C++/QT

作业完善登录框点击登录按钮后,判断账号(admin)和密码(123456)是否一致,如果匹配失败,则弹出错误对话框,文本内容“账号密码不匹配,是否重新登录”,给定两个按钮ok和cancel,点击ok后,会清除密码框中的内容,继续进行登录;如果点击cancel按钮,则关闭界面。如果账号和密码匹配,则弹出信息对话框,给出提

《消费金融真经》笔记

《消费金融真经》笔记一:概述与产品规划消费金融五大原则;竞品调研;收入来源;产品特征;增值功能;创造品牌;目标客群匹配;发展预测;产品实验。《消费金融真经》笔记二:信用评分信用评分优势;信用评分劣势;评分系统建设(评分系统规划,开发,实施,评测和监控);通用评分模型。《消费金融真经》笔记三:获客寻找潜在用户;筛选账户;

wallet connect简单使用

walletconnect简单使用准备工作安装配置打包测试准备工作新建一个文件夹xxx右键在终端中打开npminit-y在文件夹中新建src目录在src目录中新建index.html和index.js文件目录大概就这样我这是打包过的安装按照官方文档先安装官方页面长这样我们需要用到的是web3Modal点进去我们可以看到

热文推荐