論文の概要: Towards Handling Uncertainty-at-Source in AI -- A Review and Next Steps
for Interval Regression
- arxiv url: http://arxiv.org/abs/2104.07245v1
- Date: Thu, 15 Apr 2021 05:31:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 15:13:07.615619
- Title: Towards Handling Uncertainty-at-Source in AI -- A Review and Next Steps
for Interval Regression
- Title(参考訳): AIにおける不確実性への対処 - インターバル回帰のレビューと次のステップ
- Authors: Shaily Kabir, Christian Wagner and Zack Ellerby
- Abstract要約: 本稿では,近年の成長領域である区間値データの線形回帰に着目した。
我々は,最先端手法の詳細な分析を行い,特性の異なるデータセットに適用した場合の動作,利点,落とし穴を明らかにする。
- 参考スコア(独自算出の注目度): 6.166295570030645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most of statistics and AI draw insights through modelling discord or variance
between sources of information (i.e., inter-source uncertainty). Increasingly,
however, research is focusing upon uncertainty arising at the level of
individual measurements (i.e., within- or intra-source), such as for a given
sensor output or human response. Here, adopting intervals rather than numbers
as the fundamental data-type provides an efficient, powerful, yet challenging
way forward -- offering systematic capture of uncertainty-at-source, increasing
informational capacity, and ultimately potential for insight. Following recent
progress in the capture of interval-valued data, including from human
participants, conducting machine learning directly upon intervals is a crucial
next step. This paper focuses on linear regression for interval-valued data as
a recent growth area, providing an essential foundation for broader use of
intervals in AI. We conduct an in-depth analysis of state-of-the-art methods,
elucidating their behaviour, advantages, and pitfalls when applied to datasets
with different properties. Specific emphasis is given to the challenge of
preserving mathematical coherence -- i.e., ensuring that models maintain
fundamental mathematical properties of intervals throughout -- and the paper
puts forward extensions to an existing approach to guarantee this. Carefully
designed experiments, using both synthetic and real-world data, are conducted
-- with findings presented alongside novel visualizations for interval-valued
regression outputs, designed to maximise model interpretability. Finally, the
paper makes recommendations concerning method suitability for data sets with
specific properties and highlights remaining challenges and important next
steps for developing AI with the capacity to handle uncertainty-at-source.
- Abstract(参考訳): 統計とAIのほとんどは、情報源間の不一致やばらつき(すなわち、ソース間の不確実性)をモデル化することで洞察を引き出す。
しかし、センサ出力や人間の反応など、個々の測定値(内部またはソース内)のレベルで生じる不確実性に注目している研究が増えている。
ここで、基本データ型として数値ではなく間隔を採用することは、効率良く、強力で、挑戦的な方法を提供する -- 不確実性をソースとして体系的に捉え、情報容量を増加させ、最終的には洞察の機会を提供する。
近年、人間の参加者を含むインターバル値データの取得が進み、インターバルで直接機械学習を行うことが重要なステップである。
本稿では,近年の成長領域である区間値データの線形回帰に着目し,AIにおける間隔の広範化に欠かせない基礎を提供する。
我々は,最先端手法の詳細な分析を行い,特性の異なるデータセットに適用した場合の動作,利点,落とし穴を明らかにする。
数学的コヒーレンス(英語版)の保存、すなわちモデルが区間の基本的な数学的特性を維持することを保証するという課題に特に重点を置いており、この論文はそれを保証するために既存のアプローチの拡張を推し進めている。
モデル解釈可能性の最大化を目的として設計された、区間値回帰出力の新しい可視化と共に、合成データと実世界のデータの両方を使用して、注意深く設計された実験が行われる。
最後に、特定の特性を持つデータセットに対するメソッド適合性について提案し、残すべき課題と、不確実性のあるソースを扱う能力を持つAIを開発するための重要な次のステップを強調する。
関連論文リスト
- Deep End-to-End Survival Analysis with Temporal Consistency [49.77103348208835]
本稿では,大規模長手データの処理を効率的に行うために,Survival Analysisアルゴリズムを提案する。
我々の手法における中心的な考え方は、時間とともにデータにおける過去と将来の成果が円滑に進化するという仮説である時間的一貫性である。
我々のフレームワークは、安定したトレーニング信号を提供することで、時間的一貫性を大きなデータセットに独自に組み込む。
論文 参考訳(メタデータ) (2024-10-09T11:37:09Z) - Causal Contrastive Learning for Counterfactual Regression Over Time [3.3523758554338734]
本稿では, 長期予測を重視した, 反実的回帰に対するユニークなアプローチを提案する。
Causal Transformerのような既存のモデルから切り離し、我々のアプローチは長期的な予測にRNNを使うことの有効性を強調します。
提案手法は, 合成データと実世界のデータの両方を用いて, 最先端の対物推定結果を実現する。
論文 参考訳(メタデータ) (2024-06-01T19:07:25Z) - Multi-Source Conformal Inference Under Distribution Shift [41.701790856201036]
複数のバイアスのあるデータソースを活用することにより,対象個体数の分布自由な予測区間を得るという課題を考察する。
対象集団および源集団における未観測結果の定量値に対する効率的な影響関数を導出する。
本稿では、効率向上のための重み付き情報ソースとバイアス低減のための重み付き非情報ソースに対するデータ適応戦略を提案する。
論文 参考訳(メタデータ) (2024-05-15T13:33:09Z) - Uncertainty for Active Learning on Graphs [70.44714133412592]
不確実性サンプリングは、機械学習モデルのデータ効率を改善することを目的とした、アクティブな学習戦略である。
予測の不確実性を超えた不確実性サンプリングをベンチマークし、他のアクティブラーニング戦略に対する大きなパフォーマンスギャップを強調します。
提案手法は,データ生成プロセスの観点から基幹的ベイズ不確実性推定法を開発し,不確実性サンプリングを最適クエリへ導く上での有効性を実証する。
論文 参考訳(メタデータ) (2024-05-02T16:50:47Z) - Pessimistic Causal Reinforcement Learning with Mediators for Confounded Offline Data [17.991833729722288]
我々は新しいポリシー学習アルゴリズム PESsimistic CAusal Learning (PESCAL) を提案する。
我々のキーとなる観察は、システム力学における作用の効果を媒介する補助変数を組み込むことで、Q-関数の代わりに媒介物分布関数の下位境界を学習することは十分であるということである。
提案するアルゴリズムの理論的保証とシミュレーションによる有効性の実証、および主要な配車プラットフォームからのオフラインデータセットを利用した実世界の実験を提供する。
論文 参考訳(メタデータ) (2024-03-18T14:51:19Z) - Differentially Private Linear Regression with Linked Data [3.9325957466009203]
コンピュータ科学の数学的概念である差分プライバシーは、堅牢なプライバシー保証を提供する上昇するツールである。
最近の研究は、個々の統計および機械学習タスクの微分プライベートバージョンの開発に焦点を当てている。
相関データを用いた線形回帰のための2つの微分プライベートアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-01T21:00:19Z) - Toward Reliable Human Pose Forecasting with Uncertainty [51.628234388046195]
我々は、複数のモデルを含む人間のポーズ予測のためのオープンソースのライブラリを開発し、複数のデータセットをサポートする。
我々は、パフォーマンスを高め、より良い信頼をもたらすために、問題の2つの不確実性を考案する。
論文 参考訳(メタデータ) (2023-04-13T17:56:08Z) - CEDAR: Communication Efficient Distributed Analysis for Regressions [9.50726756006467]
患者レベルのデータを共有することなく、複数のEHRデータベース上での分散学習への関心が高まっている。
本稿では,局所的な最適推定値を集約する通信効率のよい新しい手法を提案する。
本稿では,統計的推測法と差分プライバシーに関する理論的検討を行い,シミュレーションおよび実データ解析におけるその性能評価を行う。
論文 参考訳(メタデータ) (2022-07-01T09:53:44Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。