論文の概要: Measurement for Opaque Systems: Multi-source Triangulation with Interpretable Machine Learning
- arxiv url: http://arxiv.org/abs/2602.00022v1
- Date: Fri, 16 Jan 2026 20:09:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 02:03:42.215988
- Title: Measurement for Opaque Systems: Multi-source Triangulation with Interpretable Machine Learning
- Title(参考訳): 不透明系の計測:解釈可能な機械学習を用いたマルチソース三角法
- Authors: Margaret Foster,
- Abstract要約: 間接的データトレース,解釈可能な機械学習モデル,および理論誘導三角測量を用いて,到達不能な測定空間を埋める計測フレームワークを提案する。
我々のフレームワークは、従来の統計的・因果推論に十分なデータがない場合に、定量的な特徴付けに適した分析ワークフローを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a measurement framework for difficult-to-access contexts that uses indirect data traces, interpretable machine-learning models, and theory-guided triangulation to fill inaccessible measurement spaces. Many high-stakes systems of scientific and policy interest are difficult, if not impossible, to reach directly: dynamics of interest are unobservable, data are indirect and fragmented across sources, and ground truth is absent or concealed. In these settings, available data often do not support conventional strategies for analysis, such as statistical inference on a single authoritative data stream or model validation against labeled outcomes. To address this problem, we introduce a general framework for measurement in data regimes characterized by structurally missing or adversarial data. We propose combining multi-source triangulation with interpretable machine learning models. Rather than relying on accuracy against unobservable, unattainable ideal data, our framework seeks consistency across separate, partially informative models. This allows users to draw defensible conclusions about the state of the world based on cross-signal consistency or divergence from an expected state. Our framework provides an analytical workflow tailored to quantitative characterization in the absence of data sufficient for conventional statistical or causal inference. We demonstrate our approach and explicitly surface inferential limits through an empirical analysis of organizational growth and internal pressure dynamics in a clandestine militant organization, drawing on multiple observational signals that individually provide incomplete and biased views of the underlying process. The results show how triangulated, interpretable ML can recover substantively meaningful variation.
- Abstract(参考訳): 本稿では,間接的データトレース,解釈可能な機械学習モデル,および理論誘導三角測量を用いて,到達不能な測定空間を埋める難易度測定フレームワークを提案する。
多くの科学的・政策的な関心の高いシステムは、直接に到達することは困難である:興味のダイナミクスは観測不可能であり、データは間接的に、情報源間で断片化され、根本的真実は欠落または隠蔽される。
これらの設定では、利用可能なデータは、単一の権威データストリームに対する統計的推測やラベル付き結果に対するモデル検証といった、従来の分析戦略をサポートしないことが多い。
この問題に対処するために、構造的に欠落したデータや敵対的なデータを特徴とするデータ構造の測定のための一般的な枠組みを導入する。
マルチソース三角測量と解釈可能な機械学習モデルの組み合わせを提案する。
我々のフレームワークは、観測不能で到達不能な理想的なデータに対して正確さに頼るのではなく、分離された部分的に情報のあるモデル間で一貫性を求めます。
これにより、ユーザは、クロスシグナルの一貫性や期待状態からの逸脱に基づいて、世界の状態に関する防御可能な結論を描くことができる。
我々のフレームワークは、従来の統計的・因果推論に十分なデータがない場合に、定量的な特徴付けに適した分析ワークフローを提供する。
我々は,組織の成長と内部圧力のダイナミクスを実証的に分析し,不完全かつ偏りのあるプロセスの視点を個別に示す複数の観測信号に基づいて,我々のアプローチを実証し,明確に推論限界を提示する。
その結果,三角法で解釈可能なMLが,実質的な有意な変動をいかに回復するかが示唆された。
関連論文リスト
- Robust Molecular Property Prediction via Densifying Scarce Labeled Data [53.24886143129006]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では, ラベル付きデータを利用して, 分布内データ(ID)と分布外データ(OOD)を補間する2段階最適化手法を提案する。
論文 参考訳(メタデータ) (2025-06-13T15:27:40Z) - Federated Causal Inference from Multi-Site Observational Data via Propensity Score Aggregation [0.0]
因果推論は通常、個々のレベルのデータへの集中的なアクセスを仮定する。
本稿では,フェデレートラーニング(FL)手法を用いて,分散化された観測データから平均処理効果(ATE)を推定することにより,この問題に対処する。
論文 参考訳(メタデータ) (2025-05-23T14:32:57Z) - Testing Generalizability in Causal Inference [3.547529079746247]
機械学習アルゴリズムの一般化性を統計的に評価するための公式な手続きは存在しない。
本研究では,高次元因果推論モデルの一般化可能性を統計的に評価するための体系的枠組みを提案する。
論文 参考訳(メタデータ) (2024-11-05T11:44:00Z) - Bias-inducing geometries: an exactly solvable data model with fairness implications [12.532003449620607]
我々は、正確に解決可能なデータ不均衡の高次元モデルを導入する。
この合成フレームワークで訓練された学習モデルの典型的特性を解析的に解き放つ。
フェアネス評価によく用いられる観測対象の正確な予測値を得る。
論文 参考訳(メタデータ) (2022-05-31T16:27:57Z) - Non-Linear Spectral Dimensionality Reduction Under Uncertainty [107.01839211235583]
我々は、不確実性情報を活用し、いくつかの従来のアプローチを直接拡張する、NGEUと呼ばれる新しい次元削減フレームワークを提案する。
提案したNGEUの定式化は,大域的な閉形式解を示し,Radecherの複雑性に基づいて,基礎となる不確実性がフレームワークの一般化能力に理論的にどのように影響するかを分析する。
論文 参考訳(メタデータ) (2022-02-09T19:01:33Z) - OR-Net: Pointwise Relational Inference for Data Completion under Partial
Observation [51.083573770706636]
この作業はリレーショナル推論を使って不完全なデータを埋めます。
本稿では,2つの点での相対性理論をモデル化するために,全関係ネットワーク (or-net) を提案する。
論文 参考訳(メタデータ) (2021-05-02T06:05:54Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z) - On Disentangled Representations Learned From Correlated Data [59.41587388303554]
相関データに対する最も顕著な絡み合うアプローチの挙動を解析することにより、現実のシナリオにギャップを埋める。
本研究では,データセットの体系的相関が学習され,潜在表現に反映されていることを示す。
また、トレーニング中の弱い監督や、少数のラベルで事前訓練されたモデルを修正することで、これらの潜伏相関を解消する方法を実証する。
論文 参考訳(メタデータ) (2020-06-14T12:47:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。