論文の概要: OnCoCo 1.0: A Public Dataset for Fine-Grained Message Classification in Online Counseling Conversations
- arxiv url: http://arxiv.org/abs/2512.09804v1
- Date: Wed, 10 Dec 2025 16:18:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-11 15:14:53.594583
- Title: OnCoCo 1.0: A Public Dataset for Fine-Grained Message Classification in Online Counseling Conversations
- Title(参考訳): OnCoCo 1.0: オンライン会話における細粒度メッセージ分類のための公開データセット
- Authors: Jens Albrecht, Robert Lehmann, Aleksandra Poltermann, Eric Rudolph, Philipp Steigerwald, Mara Stieler,
- Abstract要約: OnCoCo 1.0は、オンラインカウンセリングにおけるきめ細かいメッセージ分類のための新しいパブリックデータセットである。
これは、精神社会的オンラインカウンセリング会話の自動分析を改善するために設計された、新たな統合されたカテゴリシステムに基づいている。
- 参考スコア(独自算出の注目度): 35.44667871201894
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper presents OnCoCo 1.0, a new public dataset for fine-grained message classification in online counseling. It is based on a new, integrative system of categories, designed to improve the automated analysis of psychosocial online counseling conversations. Existing category systems, predominantly based on Motivational Interviewing (MI), are limited by their narrow focus and dependence on datasets derived mainly from face-to-face counseling. This limits the detailed examination of textual counseling conversations. In response, we developed a comprehensive new coding scheme that differentiates between 38 types of counselor and 28 types of client utterances, and created a labeled dataset consisting of about 2.800 messages from counseling conversations. We fine-tuned several models on our dataset to demonstrate its applicability. The data and models are publicly available to researchers and practitioners. Thus, our work contributes a new type of fine-grained conversational resource to the language resources community, extending existing datasets for social and mental-health dialogue analysis.
- Abstract(参考訳): 本稿では,オンラインカウンセリングにおける詳細なメッセージ分類のための新しい公開データセットであるOnCoCo 1.0を提案する。
これは、精神社会的オンラインカウンセリング会話の自動分析を改善するために設計された、新たな統合されたカテゴリシステムに基づいている。
既存のカテゴリーシステムは、主にモチベーション・インタビュー(MI)に基づいており、その焦点が狭く、主に対面カウンセリングから派生したデータセットに依存している。
これにより、テキストカウンセリング会話の詳細な検査が制限される。
そこで我々は,38種類のカウンセラーと28種類のクライアント発話を区別する包括的新しいコーディング手法を開発し,約2.800のメッセージからなるラベル付きデータセットをカウンセリング会話から作成した。
私たちは、その適用性を示すために、データセット上にいくつかのモデルを微調整しました。
データとモデルは研究者や実践者に公開されている。
そこで本研究は,言語資源コミュニティに新たな対話資源を提供し,社会的・精神的対話分析のための既存のデータセットを拡張した。
関連論文リスト
- KokoroChat: A Japanese Psychological Counseling Dialogue Dataset Collected via Role-Playing by Trained Counselors [1.3456699275044242]
本研究は、カウンセラーがカウンセラー-クライアント間相互作用をシミュレートするロールプレイングアプローチを採用する。
我々は6,589の長文対話からなる心理カウンセリング対話データセットであるKokoroChatを構築した。
実験結果から,ココロチャットを用いたオープンソースLLMは,カウンセリング応答の質とカウンセリング対話の自動評価の両方を改善した。
論文 参考訳(メタデータ) (2025-06-02T06:20:53Z) - A Personalized Conversational Benchmark: Towards Simulating Personalized Conversations [112.81207927088117]
PersonaConvBenchは、大規模言語モデル(LLM)とのマルチターン会話におけるパーソナライズされた推論と生成を評価するためのベンチマークである。
我々は,複数の商用およびオープンソース LLM を統一的なプロンプト設定でベンチマークし,パーソナライズされた履歴を組み込むことで大幅な性能向上が得られることを観察した。
論文 参考訳(メタデータ) (2025-05-20T09:13:22Z) - Recent Trends in Personalized Dialogue Generation: A Review of Datasets, Methodologies, and Evaluations [25.115319934091282]
本稿では,近年の対話生成のパーソナライズ化の状況について調査する。
22のデータセットをカバーし、ベンチマークデータセットと、追加機能に富んだ新しいデータセットを強調します。
2021年から2023年の間、トップカンファレンスから17のセミナー作品を分析し、5つの異なるタイプの問題を識別する。
論文 参考訳(メタデータ) (2024-05-28T09:04:13Z) - A Survey on Recent Advances in Conversational Data Generation [14.237954885530396]
マルチターン対話型データ生成の体系的・包括的レビューを行う。
オープンドメイン,タスク指向,情報検索の3種類の対話システムに注目した。
合成会話データを評価するための評価指標と手法について検討する。
論文 参考訳(メタデータ) (2024-05-12T10:11:12Z) - Learning From Free-Text Human Feedback -- Collect New Datasets Or Extend
Existing Ones? [57.16050211534735]
一般的な対話データセットにおける自由文フィードバックのタイプと頻度について検討する。
この結果から, エラータイプ, ユーザ応答タイプ, それらの関係性など, 調査したデータセットの構成に関する新たな知見が得られた。
論文 参考訳(メタデータ) (2023-10-24T12:01:11Z) - DeliData: A dataset for deliberation in multi-party problem solving [17.152995902615235]
リソース不足のため、グループ協議が実施されている。
グループ会話の64%では、グループメンバーは個人が特定したよりも優れたソリューションを見つけることができる。
最終解答として正解を得たグループの43.8%では、参加者の1人ひとりが正しい解答をしていない。
論文 参考訳(メタデータ) (2021-08-11T15:13:07Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Detecting and Classifying Malevolent Dialogue Responses: Taxonomy, Data
and Methodology [68.8836704199096]
コーパスベースの会話インタフェースは、テンプレートベースのエージェントや検索ベースのエージェントよりも多様な自然なレスポンスを生成することができる。
コーパスベースの会話エージェントの生成能力が増大すると、マレヴォレントな反応を分類し、フィルタリングする必要性が生じる。
不適切な内容の認識と分類に関するこれまでの研究は、主にある種のマレヴォレンスに焦点を絞っている。
論文 参考訳(メタデータ) (2020-08-21T22:43:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。