論文の概要: KokoroChat: A Japanese Psychological Counseling Dialogue Dataset Collected via Role-Playing by Trained Counselors
- arxiv url: http://arxiv.org/abs/2506.01357v1
- Date: Mon, 02 Jun 2025 06:20:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:34.054267
- Title: KokoroChat: A Japanese Psychological Counseling Dialogue Dataset Collected via Role-Playing by Trained Counselors
- Title(参考訳): ココロチャット(KokoroChat) : 教師によるロールプレイングを通して収集した日本語心理学的対話データセット
- Authors: Zhiyang Qi, Takumasa Kaneko, Keiko Takamizo, Mariko Ukiyo, Michimasa Inaba,
- Abstract要約: 本研究は、カウンセラーがカウンセラー-クライアント間相互作用をシミュレートするロールプレイングアプローチを採用する。
我々は6,589の長文対話からなる心理カウンセリング対話データセットであるKokoroChatを構築した。
実験結果から,ココロチャットを用いたオープンソースLLMは,カウンセリング応答の質とカウンセリング対話の自動評価の両方を改善した。
- 参考スコア(独自算出の注目度): 1.3456699275044242
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Generating psychological counseling responses with language models relies heavily on high-quality datasets. Crowdsourced data collection methods require strict worker training, and data from real-world counseling environments may raise privacy and ethical concerns. While recent studies have explored using large language models (LLMs) to augment psychological counseling dialogue datasets, the resulting data often suffers from limited diversity and authenticity. To address these limitations, this study adopts a role-playing approach where trained counselors simulate counselor-client interactions, ensuring high-quality dialogues while mitigating privacy risks. Using this method, we construct KokoroChat, a Japanese psychological counseling dialogue dataset comprising 6,589 long-form dialogues, each accompanied by comprehensive client feedback. Experimental results demonstrate that fine-tuning open-source LLMs with KokoroChat improves both the quality of generated counseling responses and the automatic evaluation of counseling dialogues. The KokoroChat dataset is available at https://github.com/UEC-InabaLab/KokoroChat.
- Abstract(参考訳): 言語モデルによる心理的カウンセリング応答の生成は、高品質なデータセットに大きく依存する。
クラウドソーシングされたデータ収集方法は厳格な労働者訓練を必要とし、現実世界のカウンセリング環境からのデータはプライバシーと倫理的懸念を引き起こす可能性がある。
近年の研究では、心理学的カウンセリング対話データセットを強化するために、大きな言語モデル(LLM)を用いて検討されているが、結果として得られるデータは、限られた多様性と信頼性に悩まされることが多い。
これらの制限に対処するために、訓練されたカウンセラーがカウンセラー-クライアント間相互作用をシミュレートし、プライバシーリスクを軽減しながら高品質な対話を保証するロールプレイングアプローチを採用する。
この手法を用いて、6,589の長文対話からなる日本語の心理カウンセリング対話データセットであるKokoroChatを構築する。
実験結果から,ココロチャットを用いたオープンソースLLMは,カウンセリング応答の質とカウンセリング対話の自動評価の両方を改善した。
KokoroChatデータセットはhttps://github.com/UEC-InabaLab/KokoroChatで公開されている。
関連論文リスト
- Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。
この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。
実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-07T21:37:51Z) - Cactus: Towards Psychological Counseling Conversations using Cognitive Behavioral Theory [24.937025825501998]
我々は,認知行動療法(Cognitive Behavioral Therapy, CBT)の目標指向的, 構造化的アプローチを用いて, 実生活インタラクションをエミュレートする多ターン対話データセットを作成する。
我々は、実際のカウンセリングセッションの評価、専門家の評価との整合性の確保に使用される確立された心理学的基準をベンチマークする。
Cactusで訓練されたモデルであるCamelはカウンセリングスキルにおいて他のモデルよりも優れており、カウンセリングエージェントとしての有効性と可能性を強調している。
論文 参考訳(メタデータ) (2024-07-03T13:41:31Z) - Data Augmentation of Multi-turn Psychological Dialogue via Knowledge-driven Progressive Thought Prompting [46.919537239016734]
大規模言語モデル(LLM)はマルチターン対話の実装を単純化した。
心理的対話のような低リソース領域で満足なパフォーマンスを実現することは依然として困難です。
心理学的対話を生成するための LLM 指導のための知識駆動型進歩的思考促進手法を提案する。
論文 参考訳(メタデータ) (2024-06-24T12:02:56Z) - CPsyCoun: A Report-based Multi-turn Dialogue Reconstruction and Evaluation Framework for Chinese Psychological Counseling [27.193022503592342]
中国における心理カウンセリングのための多面的対話再構築・評価フレームワークCPsyCounを提案する。
心理カウンセリングレポートを完全に活用するために、高品質な対話を構築するための2段階のアプローチが考案された。
マルチターン心理相談の効果的な自動評価のための総合評価ベンチマークを開発した。
論文 参考訳(メタデータ) (2024-05-26T05:18:00Z) - Does Collaborative Human-LM Dialogue Generation Help Information
Extraction from Human Dialogues? [55.28340832822234]
実際のアプリケーションにおける人間の対話の問題解決は、既存のWizard-of-Ozコレクションよりもはるかに複雑である。
本稿では,リアルな対話を合成できる人間間対話生成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-13T20:02:50Z) - Improving Conversational Recommendation Systems via Counterfactual Data
Simulation [73.4526400381668]
会話推薦システム(CRS)は、自然言語による会話を通じてレコメンデーションサービスを提供することを目的としている。
既存のCRSアプローチは、トレーニングデータの不足により、トレーニングの不十分な問題に悩まされることが多い。
我々は,CRSにおけるデータ不足の問題を緩和するため,CFCRSと呼ばれるCRSに対するCounterFactualデータシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2023-06-05T12:48:56Z) - Rethinking the Evaluation for Conversational Recommendation in the Era
of Large Language Models [115.7508325840751]
近年の大規模言語モデル(LLM)の成功は、より強力な対話レコメンデーションシステム(CRS)を開発する大きな可能性を示している。
本稿では,ChatGPTの会話レコメンデーションへの活用について検討し,既存の評価プロトコルが不十分であることを明らかにする。
LLMをベースとしたユーザシミュレータを用いた対話型評価手法iEvaLMを提案する。
論文 参考訳(メタデータ) (2023-05-22T15:12:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。