論文の概要: A Mega-Study of Digital Twins Reveals Strengths, Weaknesses and Opportunities for Further Improvement
- arxiv url: http://arxiv.org/abs/2509.19088v1
- Date: Tue, 23 Sep 2025 14:42:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.900174
- Title: A Mega-Study of Digital Twins Reveals Strengths, Weaknesses and Opportunities for Further Improvement
- Title(参考訳): デジタル双生児のメガスタディは、さらなる改善のための強度、弱さ、機会を探求する
- Authors: Tiany Peng, George Gui, Daniel J. Merlau, Grace Jiarui Fan, Malek Ben Sliman, Melanie Brucks, Eric J. Johnson, Vicki Morwitz, Abdullah Althenayyan, Silvia Bellezza, Dante Donati, Hortense Fong, Elizabeth Friedman, Ariana Guevara, Mohamed Hussein, Kinshuk Jerath, Bruce Kogut, Kristen Lane, Hannah Li, Patryk Perkowski, Oded Netzer, Olivier Toubia,
- Abstract要約: 我々は、全米のパネルとLLM駆動のデジタルツインについて19の研究を行い、164の結果のツインとヒューマンの回答を比較した。
双子の答えと人間の答えの相関は穏やかであり(平均で約0.2)、双子の反応は人間の反応よりも変化が少ない。
双子のパフォーマンスはドメインによって異なり、より教育的、高い収入、イデオロギー的に穏健な参加者の間で高い。
- 参考スコア(独自算出の注目度): 0.7036983664082609
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Do "digital twins" capture individual responses in surveys and experiments? We run 19 pre-registered studies on a national U.S. panel and their LLM-powered digital twins (constructed based on previously-collected extensive individual-level data) and compare twin and human answers across 164 outcomes. The correlation between twin and human answers is modest (approximately 0.2 on average) and twin responses are less variable than human responses. While constructing digital twins based on rich individual-level data improves our ability to capture heterogeneity across participants and predict relative differences between them, it does not substantially improve our ability to predict the exact answers given by specific participants or enhance predictions of population means. Twin performance varies by domain and is higher among more educated, higher-income, and ideologically moderate participants. These results suggest current digital twins can capture some degree of relative differences but are unreliable for individual-level predictions and sample mean and variance estimation, underscoring the need for careful validation before use. Our data and code are publicly available for researchers and practitioners interested in optimizing digital twin pipelines.
- Abstract(参考訳): デジタル双生児」は調査や実験で個々の反応を捉えるか?
我々は、全米のパネルとLLM駆動のデジタルツイン(これまで収集された広範囲な個人レベルのデータに基づいて構築された)について、19の事前登録研究を行い、164の結果に対して双子と人間の回答を比較した。
双子の答えと人間の答えの相関は穏やかであり(平均で約0.2)、双子の反応は人間の反応よりも変化が少ない。
リッチな個人レベルのデータに基づいてデジタルツインを構築することで、参加者間の不均一性を捕捉し、相対的な差異を予測する能力が向上する一方、特定の参加者が与える正確な回答を予測したり、集団平均の予測を高める能力は大幅に向上しない。
双子のパフォーマンスはドメインによって異なり、より教育的、高い収入、イデオロギー的に穏健な参加者の間で高い。
これらの結果から,現在のディジタル双生児はある程度の相対差を捉えることができるが,個々のレベルの予測やサンプル平均および分散推定には信頼できないことが示唆された。
我々のデータとコードは、デジタルツインパイプラインの最適化に関心のある研究者や実践者に公開されています。
関連論文リスト
- Twin-2K-500: A dataset for building digital twins of over 2,000 people based on their answers to over 500 questions [11.751234495886674]
LLMベースのデジタルツインシミュレーションは、AI、社会科学、デジタル実験の研究に大いに貢献する。
我々は、米国におけるN = 2,058$参加者(平均2.42時間)の代表サンプルを、合計500の質問を含む4つの波で調査した。
最初の分析では、データは高品質であることが示唆され、個人と集合レベルでの人間の振る舞いを良く予測するデジタルツインの構築が約束されている。
論文 参考訳(メタデータ) (2025-05-23T05:05:11Z) - Merging synthetic and real embryo data for advanced AI predictions [69.07284335967019]
我々は、作成した2つのデータセットを用いて、2つの生成モデルをトレーニングし、既存の1つのデータセットを使用して、様々な細胞レベルで合成胚画像を生成する。
これらは実画像と組み合わせて、胚細胞ステージ予測のための分類モデルを訓練した。
その結果,実データと合成画像を組み合わせることで分類性能が向上し,実データのみをトレーニングした場合の94.5%に比べて97%の精度が得られた。
論文 参考訳(メタデータ) (2024-12-02T08:24:49Z) - Digital Twin Generators for Disease Modeling [2.341540989979203]
患者のデジタルツイン(英: Digital twin)とは、患者の健康状態の経時変化を記述する計算モデルである。
デジタル双生児は、人間の健康の個々のレベルのコンピュータシミュレーションを可能にすることによって、医療に革命をもたらす可能性がある。
論文 参考訳(メタデータ) (2024-05-02T17:23:04Z) - Machine Learning Techniques with Fairness for Prediction of Completion of Drug and Alcohol Rehabilitation [0.0]
本研究の目的は, 薬物・アルコールのリハビリテーションプログラムが完了するか, 出席回数を予測することである。
本研究は、オクラホマ州の薬物・アルコールリハビリテーションセンターの入院および退院データから得られた人口統計に基づく。
論文 参考訳(メタデータ) (2024-04-23T18:09:53Z) - TWIN-GPT: Digital Twins for Clinical Trials via Large Language Model [24.35626029582016]
本稿では,TWIN-GPTと呼ばれる大規模言語モデルに基づくディジタル双対生成手法を提案する。
TWIN-GPTによるデジタル双生児の使用は臨床治験結果の予測を促進できることを示す。
論文 参考訳(メタデータ) (2024-04-01T17:48:55Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Predicting MOOCs Dropout Using Only Two Easily Obtainable Features from
the First Week's Activities [56.1344233010643]
いくつかの特徴は、学習者の誘惑や興味の欠如に寄与すると考えられており、そのことが解脱や総減退につながる可能性がある。
この研究は、いくつかの機械学習アプローチを比較して、最初の1週間から早期のドロップアウトを予測することを目的としている。
論文 参考訳(メタデータ) (2020-08-12T10:44:49Z) - Two-Sample Testing on Ranked Preference Data and the Role of Modeling
Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。
私たちのテストでは、基本的に分布に関する仮定は必要ありません。
実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文 参考訳(メタデータ) (2020-06-21T20:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。