論文の概要: Assessing the Human-Likeness of LLM-Driven Digital Twins in Simulating Health Care System Trust
- arxiv url: http://arxiv.org/abs/2512.08939v1
- Date: Mon, 27 Oct 2025 02:56:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-25 16:54:51.412971
- Title: Assessing the Human-Likeness of LLM-Driven Digital Twins in Simulating Health Care System Trust
- Title(参考訳): 医療システムトラストのシミュレーションにおけるLCM駆動型デジタル双生児の人間的類似性の評価
- Authors: Yuzhou Wu, Mingyang Wu, Di Liu, Rong Yin, Kang Li,
- Abstract要約: LLM(Large Language Model)駆動のHuman Digital Twinsは、医療システム研究において大きな可能性を秘めている。
しかし、医療システムにおける不信のような複雑な人間の心理的特徴に対する実際のシミュレーション能力は、まだ不明である。
本研究は,現在のLLM駆動型Digital Twinsは,複雑な人間の態度のモデル化に限界があることを示唆する。
- 参考スコア(独自算出の注目度): 11.272529608962996
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Serving as an emerging and powerful tool, Large Language Model (LLM)-driven Human Digital Twins are showing great potential in healthcare system research. However, its actual simulation ability for complex human psychological traits, such as distrust in the healthcare system, remains unclear. This research gap particularly impacts health professionals' trust and usage of LLM-based Artificial Intelligence (AI) systems in assisting their routine work. In this study, based on the Twin-2K-500 dataset, we systematically evaluated the simulation results of the LLM-driven human digital twin using the Health Care System Distrust Scale (HCSDS) with an established human-subject sample, analyzing item-level distributions, summary statistics, and demographic subgroup patterns. Results showed that the simulated responses by the digital twin were significantly more centralized with lower variance and had fewer selections of extreme options (all p<0.001). While the digital twin broadly reproduces human results in major demographic patterns, such as age and gender, it exhibits relatively low sensitivity in capturing minor differences in education levels. The LLM-based digital twin simulation has the potential to simulate population trends, but it also presents challenges in making detailed, specific distinctions in subgroups of human beings. This study suggests that the current LLM-driven Digital Twins have limitations in modeling complex human attitudes, which require careful calibration and validation before applying them in inferential analyses or policy simulations in health systems engineering. Future studies are necessary to examine the emotional reasoning mechanism of LLMs before their use, particularly for studies that involve simulations sensitive to social topics, such as human-automation trust.
- Abstract(参考訳): 新たな強力なツールとして、LLM(Large Language Model)駆動のHuman Digital Twinsは、医療システム研究において大きな可能性を秘めている。
しかし、医療システムにおける不信のような複雑な人間の心理的特徴に対する実際のシミュレーション能力は、まだ不明である。
この研究のギャップは、健康専門家が日常的な作業を支援するためにLLMベースの人工知能(AI)システムの信頼と利用に特に影響を及ぼす。
本研究では,Twin-2K-500データセットをベースとして,Health Care System Distrust Scale (HCSDS) を用いたLCM駆動型デジタル双生児のシミュレーション結果を定式化して評価した。
その結果, ディジタル双生児によるシミュレーション応答は, 分散度が低く, 極端な選択肢の選抜が少ないほど有意に中央集権的であった(すべてp<0.001)。
デジタル双生児は、年齢や性別などの大きな人口動態パターンにおいて、人間の結果を広く再現するが、教育レベルの微妙な違いを捉えるための感度は比較的低い。
LLMをベースとしたデジタルツインシミュレーションは人口の傾向をシミュレートする可能性があるが、人間のサブグループで詳細な特定の区別を行う上での課題も示している。
本研究は,現在のLCM駆動型Digital Twinsは,医療システム工学における推論分析や政策シミュレーションに応用する前に,注意深い校正と検証を必要とする複雑な人間の態度のモデル化に限界があることを示唆する。
今後の研究は、LLMの使用前の感情的推論機構、特に人間自動信頼のような社会的トピックに敏感なシミュレーションを含む研究に必要である。
関連論文リスト
- Psychometric Comparability of LLM-Based Digital Twins [2.7740826124350355]
私たちは、モデル、タスク、個人固有の入力がどのようにパフォーマンスを形作るかをテストするために、人間のゴールド標準に対してデジタルツインをベンチマークします。
研究全体では、デジタル双生児は高い人口レベルの精度と、参加者内プロファイルの強い相関を達成した。
ディジタル双生児はバイアスを過小評価し、規範的予測、圧縮分散、時間的情報に対する感度の制限を示す。
論文 参考訳(メタデータ) (2025-12-22T18:04:27Z) - Scaling Law in LLM Simulated Personality: More Detailed and Realistic Persona Profile Is All You Need [17.298070053011802]
本研究では,大規模言語モデル(LLM)を用いて社会実験をシミュレートし,仮想ペルソナロールプレイングにおける人間の個性をエミュレートする能力を探求する。
本研究は、安定性と識別可能性の個人レベルの分析を含むエンドツーエンド評価フレームワークを開発する。
論文 参考訳(メタデータ) (2025-10-10T05:52:07Z) - Population-Aligned Persona Generation for LLM-based Social Simulation [58.84363795421489]
本稿では,社会シミュレーションのための高品質な集団対応ペルソナ集合を合成するための体系的枠組みを提案する。
我々のアプローチは、長期のソーシャルメディアデータから物語的ペルソナを生成するために、大きな言語モデルを活用することから始まる。
特定のシミュレーションコンテキストのニーズに対処するために,対象のサブポピュレーションに対してグローバルに整合したペルソナを適応させるタスク固有モジュールを提案する。
論文 参考訳(メタデータ) (2025-09-12T10:43:47Z) - Organ-Agents: Virtual Human Physiology Simulator via LLMs [66.40796430669158]
オルガン-エージェント(Organ-Agents)は、LDM駆動のエージェントを介して人間の生理学をシミュレートする多エージェントフレームワークである。
症例は7,134例,コントロール7,895例で,9系統および125変数にわたる高分解能トラジェクトリを作成した。
臓器抗原は4,509人の保留患者に対して高いシミュレーション精度を達成し, システムごとのMSE0.16とSOFA系重症度層間の堅牢性を示した。
論文 参考訳(メタデータ) (2025-08-20T01:58:45Z) - Med-Real2Sim: Non-Invasive Medical Digital Twins using Physics-Informed Self-Supervised Learning [15.106435744696013]
デジタルツイン(Digital twin)は、数学的モデリングを用いてその定義する特徴を特徴づけ、シミュレートする現実世界の物理現象の仮想レプリカである。
非侵襲的な患者健康データのみを用いてデジタル双対モデルパラメータを同定する手法を提案する。
論文 参考訳(メタデータ) (2024-02-29T23:04:42Z) - Redefining Digital Health Interfaces with Large Language Models [69.02059202720073]
大規模言語モデル(LLM)は、複雑な情報を処理できる汎用モデルとして登場した。
LLMが臨床医とデジタル技術との新たなインターフェースを提供する方法を示す。
自動機械学習を用いた新しい予後ツールを開発した。
論文 参考訳(メタデータ) (2023-10-05T14:18:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。