心理健康数据集:mental_health_chatbot_dataset

2023-10-01 17:05

1。数据集描述
1.数据集汇总
该数据集包含与心理健康相关的问题和答案的对话对,以单个文本的形式呈现。该数据集的来源包括流行的医学博客(例如 WebMD、Mayo Clinic 和 HealthLine)、在线常见问题解答等。所有问题和答案均经过匿名处理以删除任何个人身份信息 (PII),并经过预处理以删除任何不必要的字符。
2。语言
数据集中的文本为英文。

2。数据集结构
1.数据示例
数据实例由一个文本列组成,其中包含患者和医疗提供者之间的问答对话。患者提出问题,医疗服务提供者提供答案。如下图:

:什么是惊恐发作?:惊恐发作突然,涉及强烈且往往压倒性的恐惧。它们伴随着非常具有挑战性的身体症状,如心跳加速、呼吸急促、或恶心。意外的惊恐发作没有明显的原因。预期的惊恐发作是由外部压力源引发的,例如恐惧症。惊恐发作可能发生在任何人身上,但超过一次可能是惊恐障碍的征兆,这是一种心理健康状况,其特征是突然且反复的恐慌发作。”

翻译成中文如下:

:什么是惊恐发作?:惊恐发作突然发生,伴随着强烈且常常无法控制的恐惧。它们还伴有非常具有挑战性的身体症状,例如心跳加快、呼吸急促或恶心. 突然的惊恐发作没有明显的原因。预期的惊恐发作是由外部压力源引起的,例如恐惧症。惊恐发作可能发生在任何人身上,但多次经历惊恐发作可能是惊恐障碍的征兆,惊恐障碍是一种心理健康状况,其特征是突然和突然的惊恐发作。反复发作的恐慌症。”

2。数据字段
“文本”:患者和医疗提供者之间的问答对话。

3。数据集创建
1。参展理由
聊天机器人为寻求支持的个人提供了一个随时可用且易于访问的平台。您可以随时随地访问它们,为有需要的人提供即时支持。聊天机器人可以提供同理心和非评判性的响应,为用户提供情感支持。虽然它们不能完全取代人际互动,但它们可以成为有用的补充,尤其是在困难时期。因此,该数据集的目的是帮助使用该自定义数据集微调对话式 AI 聊天机器人,然后可以将其作为聊天机器人部署并提供给最终患者。
2。数据来源
该数据集的来源包括流行的医学博客(例如 WebMD、Mayo Clinic 和 HealthLine)、在线常见问题解答等。
3。个人和敏感信息
该数据集可能包含与心理健康相关的敏感信息。所有问题和答案都是匿名的,以删除任何个人身份信息。

参考:
[1]mental_health_chatbot_dataset:https://m.gsm-guard.net/datasets/heliosbrahma/mental_health_chatbot_dataset
[2]https://m.gsm-guard.net/iamarunbrahma/finetuned-qlora-falcon7b-medical
[3]在心理健康对话数据集上使用 QLoRA 微调 Falcon-7B 大语言模型:https://m.gsm-guard.net/@iamarunbrahma/fine-tuning-of-falcon-7b-large-language-model-using- qlora-on-mental-health-dataset-aa290eb6ec85
[4]Falcon-7B PEFT模型的train/loss:https://m.gsm-guard.net/heliosbrahma/huggingface/reports/train-loss-for-Falcon-7B-PEFT-model--Vmlldzo1MDQxMDAy?accessToken=fi8s1lrhuwjlloumbxbmd3mm9h138nmu0b03szmir9fyqqs8wlev72878yd97ct n