論文の概要: Estimating Quality in Therapeutic Conversations: A Multi-Dimensional Natural Language Processing Framework
- arxiv url: http://arxiv.org/abs/2505.06151v1
- Date: Fri, 09 May 2025 16:03:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-12 20:40:10.327133
- Title: Estimating Quality in Therapeutic Conversations: A Multi-Dimensional Natural Language Processing Framework
- Title(参考訳): 治療的会話における品質の推定:多次元自然言語処理フレームワーク
- Authors: Alice Rueda, Argyrios Perivolaris, Niloy Roy, Dylan Weston, Sarmed Shaya, Zachary Cote, Martin Ivanov, Bazen G. Teferra, Yuqi Wu, Sirisha Rambhatla, Divya Sharma, Andrew Greenshaw, Rakesh Jetly, Yanbo Zhang, Bo Cao, Reza Samavi, Sridhar Krishnan, Venkat Bhat,
- Abstract要約: 患者とセラピストの関わりは治療の成功の重要な決定要因である。
テキストの書き起こしに基づくカウンセリングセッションにおけるエンゲージメント品質を客観的に分類する多次元自然言語処理(NLP)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.928100324187122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Engagement between client and therapist is a critical determinant of therapeutic success. We propose a multi-dimensional natural language processing (NLP) framework that objectively classifies engagement quality in counseling sessions based on textual transcripts. Using 253 motivational interviewing transcripts (150 high-quality, 103 low-quality), we extracted 42 features across four domains: conversational dynamics, semantic similarity as topic alignment, sentiment classification, and question detection. Classifiers, including Random Forest (RF), Cat-Boost, and Support Vector Machines (SVM), were hyperparameter tuned and trained using a stratified 5-fold cross-validation and evaluated on a holdout test set. On balanced (non-augmented) data, RF achieved the highest classification accuracy (76.7%), and SVM achieved the highest AUC (85.4%). After SMOTE-Tomek augmentation, performance improved significantly: RF achieved up to 88.9% accuracy, 90.0% F1-score, and 94.6% AUC, while SVM reached 81.1% accuracy, 83.1% F1-score, and 93.6% AUC. The augmented data results reflect the potential of the framework in future larger-scale applications. Feature contribution revealed conversational dynamics and semantic similarity between clients and therapists were among the top contributors, led by words uttered by the client (mean and standard deviation). The framework was robust across the original and augmented datasets and demonstrated consistent improvements in F1 scores and recall. While currently text-based, the framework supports future multimodal extensions (e.g., vocal tone, facial affect) for more holistic assessments. This work introduces a scalable, data-driven method for evaluating engagement quality of the therapy session, offering clinicians real-time feedback to enhance the quality of both virtual and in-person therapeutic interactions.
- Abstract(参考訳): 患者とセラピストの関わりは治療の成功の重要な決定要因である。
テキストの書き起こしに基づくカウンセリングセッションにおけるエンゲージメント品質を客観的に分類する多次元自然言語処理(NLP)フレームワークを提案する。
253のモチベーション的面接文(150の高品質、103の低品質)を用いて、会話力学、トピックアライメントとしての意味的類似性、感情分類、質問検出という4つの領域にまたがる42の特徴を抽出した。
ランダムフォレスト(RF)、キャットブース、サポートベクトルマシン(SVM)などの分類器は、階層化された5倍のクロスバリデーションを用いて調整・訓練され、ホールドアウトテストセットで評価された。
バランスのとれた(拡張されていない)データでは、RFは最高分類精度76.7%、SVMは最高AUC(85.4%)を達成した。
RFは88.9%の精度、90.0%のF1スコア、94.6%のAUC、SVMは81.1%の精度、83.1%のF1スコア、93.6%のAUCを達成した。
拡張データの結果は、将来の大規模アプリケーションにおけるフレームワークの可能性を反映している。
特徴的貢献は、クライアントとセラピスト間の会話のダイナミクスとセマンティックな類似性が、クライアントから発せられる言葉(平均偏差と標準偏差)によって導かれるトップコントリビュータの1人であることを明らかにした。
このフレームワークは、オリジナルのデータセットと拡張データセット間で堅牢で、F1スコアとリコールの一貫性のある改善を実証した。
現在テキストベースのフレームワークでは、より包括的な評価のために、将来のマルチモーダル拡張(例えば、声調、顔の影響など)をサポートする。
この研究は、治療セッションのエンゲージメント品質を評価するスケーラブルでデータ駆動の手法を導入し、クリニックにリアルタイムフィードバックを提供することで、仮想的および対人的な治療相互作用の質を高める。
関連論文リスト
- $C^2$AV-TSE: Context and Confidence-aware Audio Visual Target Speaker Extraction [80.57232374640911]
我々はMask-And-Recover (MAR)と呼ばれるモデルに依存しない戦略を提案する。
MARは、モダリティ間およびモダリティ間コンテキスト相関を統合し、抽出モジュール内の大域的推論を可能にする。
各サンプルの難易度を向上するために, 精細信頼スコア(FCS)モデルを導入する。
論文 参考訳(メタデータ) (2025-04-01T13:01:30Z) - Leveraging Cross-Attention Transformer and Multi-Feature Fusion for Cross-Linguistic Speech Emotion Recognition [60.58049741496505]
音声感情認識(SER)は、人間とコンピュータの相互作用を強化する上で重要な役割を担っている。
本稿では,HuBERT,MFCC,および韻律特性を組み合わせたHuMP-CATを提案する。
HMP-CATは、ターゲットデータセットから少量の音声でソースモデルを微調整することにより、平均78.75%の精度が得られることを示す。
論文 参考訳(メタデータ) (2025-01-06T14:31:25Z) - How Well Can Modern LLMs Act as Agent Cores in Radiology Environments? [54.36730060680139]
RadA-BenchPlatは、放射線学環境での大規模言語モデル(LLM)のパフォーマンスをベンチマークする評価プラットフォームである。
また、エージェント駆動型タスク解決ツールの10のカテゴリを定義し、7つの主要なLCMを評価している。
論文 参考訳(メタデータ) (2024-12-12T18:20:16Z) - Detecting Sexual Content at the Sentence Level in First Millennium Latin Texts [0.0]
我々は,紀元前300年から900年までの約2500の文からなる,性意味論を含む新しいコーパスを紹介した。
我々は,様々な文分類手法と異なる入力埋め込み層を評価し,単純なトークンベースの検索を一貫して上回ることを示す。
論文 参考訳(メタデータ) (2023-09-25T09:21:25Z) - Automatic Severity Classification of Dysarthric speech by using
Self-supervised Model with Multi-task Learning [4.947423926765435]
マルチタスク学習と連動した自己教師付きモデルを用いて,変形性音声の自動重大度評価手法を提案する。
Wav2vec 2.0 XLS-Rは重度分類と補助的自動音声認識(ASR)の2つのタスクで訓練される
本モデルでは,F1スコアの相対値が1.25%増加し,従来のベースライン法よりも優れていた。
論文 参考訳(メタデータ) (2022-10-27T12:48:10Z) - NaturalSpeech: End-to-End Text to Speech Synthesis with Human-Level
Quality [123.97136358092585]
我々は、ベンチマークデータセット上で人間レベルの品質を実現するNaturalSpeechと呼ばれるTSシステムを開発した。
具体的には、波形生成のための変分オートエンコーダ(VAE)を利用する。
LJSpeechデータセットを用いた実験により,提案したNaturalSpeechは文レベルでの人間の記録に対して-0.01CMOSを達成した。
論文 参考訳(メタデータ) (2022-05-09T16:57:35Z) - On-the-Fly Feature Based Rapid Speaker Adaptation for Dysarthric and
Elderly Speech Recognition [53.17176024917725]
話者レベルのデータの共有化は、データ集約型モデルに基づく話者適応手法の実用的利用を制限する。
本稿では,2種類のデータ効率,特徴量に基づくオンザフライ話者適応手法を提案する。
論文 参考訳(メタデータ) (2022-03-28T09:12:24Z) - An Automated Quality Evaluation Framework of Psychotherapy Conversations
with Local Quality Estimates [38.841853815519734]
CBTインタラクションの品質を自動評価する階層型フレームワークを提案する。
まず、セグメントレベルの(局所的な)品質スコアを予測するために、BERTを微調整する。
次に、双方向LSTMベースのニューラルネットワークへの低レベル入力としてセグメント埋め込みを使用し、セッションレベル(グローバル)の品質推定を予測します。
論文 参考訳(メタデータ) (2021-06-15T07:18:30Z) - TextFlint: Unified Multilingual Robustness Evaluation Toolkit for
Natural Language Processing [73.16475763422446]
NLPタスク(TextFlint)のための多言語ロバスト性評価プラットフォームを提案する。
普遍的なテキスト変換、タスク固有の変換、敵攻撃、サブポピュレーション、およびそれらの組み合わせを取り入れ、包括的な堅牢性分析を提供する。
TextFlintは、モデルの堅牢性の欠点に対処するために、完全な分析レポートとターゲットとした拡張データを生成します。
論文 参考訳(メタデータ) (2021-03-21T17:20:38Z) - Automated Quality Assessment of Cognitive Behavioral Therapy Sessions
Through Highly Contextualized Language Representations [34.670548892766625]
認知行動療法(Cognitive Behavioral Therapy, CBT)という,特定の心理療法の行動自動スコアリングモデルを提案する。
このモデルは高い解釈可能性を達成するためにマルチタスクで訓練される。
BERTベースの表現は、利用可能な治療メタデータでさらに拡張され、関連する非言語的コンテキストを提供し、一貫したパフォーマンス改善につながります。
論文 参考訳(メタデータ) (2021-02-23T09:22:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。