論文の概要: A Mega-Study of Digital Twins Reveals Strengths, Weaknesses and Opportunities for Further Improvement
- arxiv url: http://arxiv.org/abs/2509.19088v1
- Date: Tue, 23 Sep 2025 14:42:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.900174
- Title: A Mega-Study of Digital Twins Reveals Strengths, Weaknesses and Opportunities for Further Improvement
- Title(参考訳): デジタル双生児のメガスタディは、さらなる改善のための強度、弱さ、機会を探求する
- Authors: Tiany Peng, George Gui, Daniel J. Merlau, Grace Jiarui Fan, Malek Ben Sliman, Melanie Brucks, Eric J. Johnson, Vicki Morwitz, Abdullah Althenayyan, Silvia Bellezza, Dante Donati, Hortense Fong, Elizabeth Friedman, Ariana Guevara, Mohamed Hussein, Kinshuk Jerath, Bruce Kogut, Kristen Lane, Hannah Li, Patryk Perkowski, Oded Netzer, Olivier Toubia,
- Abstract要約: 我々は、全米のパネルとLLM駆動のデジタルツインについて19の研究を行い、164の結果のツインとヒューマンの回答を比較した。
双子の答えと人間の答えの相関は穏やかであり(平均で約0.2)、双子の反応は人間の反応よりも変化が少ない。
双子のパフォーマンスはドメインによって異なり、より教育的、高い収入、イデオロギー的に穏健な参加者の間で高い。
- 参考スコア(独自算出の注目度): 0.7036983664082609
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Do "digital twins" capture individual responses in surveys and experiments? We run 19 pre-registered studies on a national U.S. panel and their LLM-powered digital twins (constructed based on previously-collected extensive individual-level data) and compare twin and human answers across 164 outcomes. The correlation between twin and human answers is modest (approximately 0.2 on average) and twin responses are less variable than human responses. While constructing digital twins based on rich individual-level data improves our ability to capture heterogeneity across participants and predict relative differences between them, it does not substantially improve our ability to predict the exact answers given by specific participants or enhance predictions of population means. Twin performance varies by domain and is higher among more educated, higher-income, and ideologically moderate participants. These results suggest current digital twins can capture some degree of relative differences but are unreliable for individual-level predictions and sample mean and variance estimation, underscoring the need for careful validation before use. Our data and code are publicly available for researchers and practitioners interested in optimizing digital twin pipelines.
- Abstract(参考訳): デジタル双生児」は調査や実験で個々の反応を捉えるか?
我々は、全米のパネルとLLM駆動のデジタルツイン(これまで収集された広範囲な個人レベルのデータに基づいて構築された)について、19の事前登録研究を行い、164の結果に対して双子と人間の回答を比較した。
双子の答えと人間の答えの相関は穏やかであり(平均で約0.2)、双子の反応は人間の反応よりも変化が少ない。
リッチな個人レベルのデータに基づいてデジタルツインを構築することで、参加者間の不均一性を捕捉し、相対的な差異を予測する能力が向上する一方、特定の参加者が与える正確な回答を予測したり、集団平均の予測を高める能力は大幅に向上しない。
双子のパフォーマンスはドメインによって異なり、より教育的、高い収入、イデオロギー的に穏健な参加者の間で高い。
これらの結果から,現在のディジタル双生児はある程度の相対差を捉えることができるが,個々のレベルの予測やサンプル平均および分散推定には信頼できないことが示唆された。
我々のデータとコードは、デジタルツインパイプラインの最適化に関心のある研究者や実践者に公開されています。
関連論文リスト
- Psychometric Comparability of LLM-Based Digital Twins [2.7740826124350355]
私たちは、モデル、タスク、個人固有の入力がどのようにパフォーマンスを形作るかをテストするために、人間のゴールド標準に対してデジタルツインをベンチマークします。
研究全体では、デジタル双生児は高い人口レベルの精度と、参加者内プロファイルの強い相関を達成した。
ディジタル双生児はバイアスを過小評価し、規範的予測、圧縮分散、時間的情報に対する感度の制限を示す。
論文 参考訳(メタデータ) (2025-12-22T18:04:27Z) - No More Sibling Rivalry: Debiasing Human-Object Interaction Detection [47.554732714656296]
この研究は、相互作用デコーダの学習を妨げる重要な問題である「毒性兄弟」のバイアスを特定する。
このバイアスは、兄弟三重項/カテゴリ間の高い混乱から生じ、類似性の増加はパラドックス的に精度を低下させる。
我々は,2つの新しいデバイアス学習目標-「コントラスト-then-calibration」と「マージ-then-split」を提案する。
論文 参考訳(メタデータ) (2025-08-31T09:23:15Z) - TalkVid: A Large-Scale Diversified Dataset for Audio-Driven Talking Head Synthesis [74.31705485094096]
7729のユニークなスピーカーから1244時間のビデオを含む、大規模で高品質で多様なデータセットであるTalkVidを紹介した。
TalkVidは、動作の安定性、美的品質、顔のディテールを厳格にフィルタする、原則付き多段階自動パイプラインを通じてキュレートされる。
TalkVid-Benchは、500クリップの階層化された評価セットで、重要な人口統計学と言語学の軸間で慎重にバランスを取ります。
論文 参考訳(メタデータ) (2025-08-19T08:31:15Z) - Twin-2K-500: A dataset for building digital twins of over 2,000 people based on their answers to over 500 questions [11.751234495886674]
LLMベースのデジタルツインシミュレーションは、AI、社会科学、デジタル実験の研究に大いに貢献する。
我々は、米国におけるN = 2,058$参加者(平均2.42時間)の代表サンプルを、合計500の質問を含む4つの波で調査した。
最初の分析では、データは高品質であることが示唆され、個人と集合レベルでの人間の振る舞いを良く予測するデジタルツインの構築が約束されている。
論文 参考訳(メタデータ) (2025-05-23T05:05:11Z) - Merging synthetic and real embryo data for advanced AI predictions [69.07284335967019]
我々は、作成した2つのデータセットを用いて、2つの生成モデルをトレーニングし、既存の1つのデータセットを使用して、様々な細胞レベルで合成胚画像を生成する。
これらは実画像と組み合わせて、胚細胞ステージ予測のための分類モデルを訓練した。
その結果,実データと合成画像を組み合わせることで分類性能が向上し,実データのみをトレーニングした場合の94.5%に比べて97%の精度が得られた。
論文 参考訳(メタデータ) (2024-12-02T08:24:49Z) - Digital Twin Generators for Disease Modeling [2.341540989979203]
患者のデジタルツイン(英: Digital twin)とは、患者の健康状態の経時変化を記述する計算モデルである。
デジタル双生児は、人間の健康の個々のレベルのコンピュータシミュレーションを可能にすることによって、医療に革命をもたらす可能性がある。
論文 参考訳(メタデータ) (2024-05-02T17:23:04Z) - Machine Learning Techniques with Fairness for Prediction of Completion of Drug and Alcohol Rehabilitation [0.0]
本研究の目的は, 薬物・アルコールのリハビリテーションプログラムが完了するか, 出席回数を予測することである。
本研究は、オクラホマ州の薬物・アルコールリハビリテーションセンターの入院および退院データから得られた人口統計に基づく。
論文 参考訳(メタデータ) (2024-04-23T18:09:53Z) - TWIN-GPT: Digital Twins for Clinical Trials via Large Language Model [24.35626029582016]
本稿では,TWIN-GPTと呼ばれる大規模言語モデルに基づくディジタル双対生成手法を提案する。
TWIN-GPTによるデジタル双生児の使用は臨床治験結果の予測を促進できることを示す。
論文 参考訳(メタデータ) (2024-04-01T17:48:55Z) - Digital Twins: How Far from Ideas to Twins? [0.0]
デジタル双生児には理論的・実用的な考え方が提案されている。
理論的には、デジタルツインとは、モダリティ間のデータマッピングの融合である。
実用の観点からは、デジタルツインはモノのインターネットとモデルに基づくシナリオ実装である。
論文 参考訳(メタデータ) (2024-03-16T01:25:59Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。
我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。
我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文 参考訳(メタデータ) (2023-03-20T19:32:49Z) - Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia
for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。
実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文 参考訳(メタデータ) (2021-06-20T10:48:49Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Diverse Knowledge Distillation for End-to-End Person Search [81.4926655119318]
人物検索は、画像ギャラリーから特定の人物をローカライズし識別することを目的としている。
最近の手法は2つのグループ、すなわち2段階とエンドツーエンドのアプローチに分類できる。
ボトルネックを解消するために、多様な知識蒸留を備えたシンプルで強力なエンドツーエンドネットワークを提案します。
論文 参考訳(メタデータ) (2020-12-21T09:04:27Z) - Digital Twins: State of the Art Theory and Practice, Challenges, and
Open Research Questions [62.67593386796497]
この研究は、様々なDT機能と現在のアプローチ、デジタルツインの実装と導入の遅れの背景にある欠点と理由を探求する。
この遅延の主な理由は、普遍的な参照フレームワークの欠如、ドメイン依存、共有データのセキュリティ上の懸念、デジタルツインの他の技術への依存、定量的メトリクスの欠如である。
論文 参考訳(メタデータ) (2020-11-02T19:08:49Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Predicting MOOCs Dropout Using Only Two Easily Obtainable Features from
the First Week's Activities [56.1344233010643]
いくつかの特徴は、学習者の誘惑や興味の欠如に寄与すると考えられており、そのことが解脱や総減退につながる可能性がある。
この研究は、いくつかの機械学習アプローチを比較して、最初の1週間から早期のドロップアウトを予測することを目的としている。
論文 参考訳(メタデータ) (2020-08-12T10:44:49Z) - Two-Sample Testing on Ranked Preference Data and the Role of Modeling
Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。
私たちのテストでは、基本的に分布に関する仮定は必要ありません。
実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文 参考訳(メタデータ) (2020-06-21T20:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。