論文の概要: Eeyore: Realistic Depression Simulation via Supervised and Preference Optimization
- arxiv url: http://arxiv.org/abs/2503.00018v1
- Date: Fri, 21 Feb 2025 20:29:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-09 03:50:40.801198
- Title: Eeyore: Realistic Depression Simulation via Supervised and Preference Optimization
- Title(参考訳): Eeyore: 監視と優先最適化による現実的な抑うつシミュレーション
- Authors: Siyang Liu, Bianca Brie, Wenda Li, Laura Biester, Andrew Lee, James Pennebaker, Rada Mihalcea,
- Abstract要約: 構造化アライメントフレームワークを用いて,現実的な抑うつシミュレーションに最適化した8Bモデルを提案する。
まず、実世界のうつ病に関連する会話をキュレートし、うつ病の特徴を抽出し、データフィルタリングと心理的プロファイル構築をガイドする。
私たちはドメインの専門家と積極的に協力し、特性抽出を検証するインタラクティブインターフェースを開発しています。
モデルサイズは小さいが、アイユール抑うつシミュレーションはSOTAの推進戦略によりGPT-4oより優れていた。
- 参考スコア(独自算出の注目度): 23.692762385998847
- License:
- Abstract: Large Language Models (LLMs) have been previously explored for mental healthcare training and therapy client simulation, but they still fall short in authentically capturing diverse client traits and psychological conditions. We introduce \textbf{Eeyore}, an 8B model optimized for realistic depression simulation through a structured alignment framework, incorporating expert input at every stage. First, we systematically curate real-world depression-related conversations, extracting depressive traits to guide data filtering and psychological profile construction, and use this dataset to instruction-tune Eeyore for profile adherence. Next, to further enhance realism, Eeyore undergoes iterative preference optimization -- first leveraging model-generated preferences and then calibrating with a small set of expert-annotated preferences. Throughout the entire pipeline, we actively collaborate with domain experts, developing interactive interfaces to validate trait extraction and iteratively refine structured psychological profiles for clinically meaningful role-play customization. Despite its smaller model size, the Eeyore depression simulation outperforms GPT-4o with SOTA prompting strategies, both in linguistic authenticity and profile adherence.
- Abstract(参考訳): 大規模言語モデル (LLMs) は、これまで精神医療訓練や治療のクライアントシミュレーションのために研究されてきたが、それでも多様なクライアント特性や心理的条件を正確に把握するには不十分である。
構造化アライメントフレームワークを通じて現実的なうつ病シミュレーションに最適化された8Bモデルである「textbf{Eeyore}」を導入し、各段階で専門家の入力を取り入れた。
まず、実世界のうつ病に関連する会話を体系的にキュレートし、データフィルタリングと心理的プロファイル構築を導くために抑うつ特性を抽出し、このデータセットを使用してプロファイルの定着を指導する。
次に、リアリズムをさらに強化するために、Eeyore氏は反復的な選好最適化を行う。
パイプライン全体を通して、私たちはドメインの専門家と積極的に協力し、特徴抽出を検証するインタラクティブインターフェースを開発し、臨床的に意味のあるロールプレイのカスタマイズのために構造化された心理的プロファイルを反復的に洗練する。
モデルサイズは小さいが、Eeyore 抑うつシミュレーションは GPT-4o より優れており、SOTA は言語的信頼性とプロファイルの適合性の両方において戦略を推進している。
関連論文リスト
- Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment [104.18002641195442]
既存のペアデータを必要としない、効果的でスケーラブルなトレーニングパラダイムである自己拡張型優先度最適化(SAPO)を導入する。
負の反応を自律的に生成するセルフプレイの概念に基づいて、我々はさらに、データ探索とエクスプロイトを強化するために、非政治的な学習パイプラインを組み込む。
論文 参考訳(メタデータ) (2024-05-31T14:21:04Z) - Implicitly Guided Design with PropEn: Match your Data to Follow the Gradient [52.2669490431145]
PropEnは'matching'にインスパイアされている。
一致したデータセットによるトレーニングは、データ分布内に留まりながら、興味のある性質の勾配を近似することを示す。
論文 参考訳(メタデータ) (2024-05-28T11:30:19Z) - Enhanced Bayesian Optimization via Preferential Modeling of Abstract
Properties [49.351577714596544]
本研究では,非測定抽象特性に関する専門家の嗜好を代理モデルに組み込むための,人間とAIの協調型ベイズフレームワークを提案する。
優先判断において、誤った/誤解を招く専門家バイアスを処理できる効率的な戦略を提供する。
論文 参考訳(メタデータ) (2024-02-27T09:23:13Z) - Linear Alignment: A Closed-form Solution for Aligning Human Preferences without Tuning and Feedback [70.32795295142648]
リニアアライメントは、言語モデルと人間の好みを1つの推論ステップで整列する新しいアルゴリズムである。
一般的な選好データセットとパーソナライズされた選好データセットの実験により、線形アライメントはLLMアライメントの性能と効率を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2024-01-21T10:46:23Z) - Human-in-the-Loop Optimization for Deep Stimulus Encoding in Visual
Prostheses [2.7309692684728617]
神経補綴は、失われた感覚機能を回復し、人間の能力を増強する可能性を示しているが、現在の装置が生み出す感覚は、しばしば不自然または歪んでいるように見える。
この2つの基本的制約を克服する,斬新で現実的なアプローチを提案する。
提案手法は、パーソナライズされた刺激エンコーダを迅速に学習し、回復した視覚の質を劇的に改善し、患者からのフィードバックに頑健であることを示す。
論文 参考訳(メタデータ) (2023-06-16T18:49:51Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Pushing on Personality Detection from Verbal Behavior: A Transformer
Meets Text Contours of Psycholinguistic Features [27.799032561722893]
テキストデータから人格特性を予測する上で,2つの大きな改善点を報告する。
精神言語学的特徴のテキスト内分布を学習した,事前学習型トランスフォーマー言語モデルBERTと双方向長短期記憶ネットワークを統合した。
2つのベンチマークデータセット上に構築したモデルの性能を評価する。
論文 参考訳(メタデータ) (2022-04-10T08:08:46Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Neural Architecture Searching for Facial Attributes-based Depression
Recognition [32.158631421525236]
本稿では,複数の顔属性に基づく抑うつ認識のための最適モデル設計のためのニューラルネットワーク検索(NAS)手法の拡張を提案する。
提案手法はまず,各顔属性の特徴抽出器に対して,探索空間を大幅に削減することを目的として,より温かいステップを実行する。
そして,全ての特徴抽出器と融合ネットワークをエンドツーエンドで探索し,相補的抑うつキューと冗長性の低下を最適に組み合わせる。
論文 参考訳(メタデータ) (2022-01-24T16:57:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。