論文の概要: Towards Handling Uncertainty-at-Source in AI -- A Review and Next Steps
for Interval Regression
- arxiv url: http://arxiv.org/abs/2104.07245v1
- Date: Thu, 15 Apr 2021 05:31:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 15:13:07.615619
- Title: Towards Handling Uncertainty-at-Source in AI -- A Review and Next Steps
for Interval Regression
- Title(参考訳): AIにおける不確実性への対処 - インターバル回帰のレビューと次のステップ
- Authors: Shaily Kabir, Christian Wagner and Zack Ellerby
- Abstract要約: 本稿では,近年の成長領域である区間値データの線形回帰に着目した。
我々は,最先端手法の詳細な分析を行い,特性の異なるデータセットに適用した場合の動作,利点,落とし穴を明らかにする。
- 参考スコア(独自算出の注目度): 6.166295570030645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most of statistics and AI draw insights through modelling discord or variance
between sources of information (i.e., inter-source uncertainty). Increasingly,
however, research is focusing upon uncertainty arising at the level of
individual measurements (i.e., within- or intra-source), such as for a given
sensor output or human response. Here, adopting intervals rather than numbers
as the fundamental data-type provides an efficient, powerful, yet challenging
way forward -- offering systematic capture of uncertainty-at-source, increasing
informational capacity, and ultimately potential for insight. Following recent
progress in the capture of interval-valued data, including from human
participants, conducting machine learning directly upon intervals is a crucial
next step. This paper focuses on linear regression for interval-valued data as
a recent growth area, providing an essential foundation for broader use of
intervals in AI. We conduct an in-depth analysis of state-of-the-art methods,
elucidating their behaviour, advantages, and pitfalls when applied to datasets
with different properties. Specific emphasis is given to the challenge of
preserving mathematical coherence -- i.e., ensuring that models maintain
fundamental mathematical properties of intervals throughout -- and the paper
puts forward extensions to an existing approach to guarantee this. Carefully
designed experiments, using both synthetic and real-world data, are conducted
-- with findings presented alongside novel visualizations for interval-valued
regression outputs, designed to maximise model interpretability. Finally, the
paper makes recommendations concerning method suitability for data sets with
specific properties and highlights remaining challenges and important next
steps for developing AI with the capacity to handle uncertainty-at-source.
- Abstract(参考訳): 統計とAIのほとんどは、情報源間の不一致やばらつき(すなわち、ソース間の不確実性)をモデル化することで洞察を引き出す。
しかし、センサ出力や人間の反応など、個々の測定値(内部またはソース内)のレベルで生じる不確実性に注目している研究が増えている。
ここで、基本データ型として数値ではなく間隔を採用することは、効率良く、強力で、挑戦的な方法を提供する -- 不確実性をソースとして体系的に捉え、情報容量を増加させ、最終的には洞察の機会を提供する。
近年、人間の参加者を含むインターバル値データの取得が進み、インターバルで直接機械学習を行うことが重要なステップである。
本稿では,近年の成長領域である区間値データの線形回帰に着目し,AIにおける間隔の広範化に欠かせない基礎を提供する。
我々は,最先端手法の詳細な分析を行い,特性の異なるデータセットに適用した場合の動作,利点,落とし穴を明らかにする。
数学的コヒーレンス(英語版)の保存、すなわちモデルが区間の基本的な数学的特性を維持することを保証するという課題に特に重点を置いており、この論文はそれを保証するために既存のアプローチの拡張を推し進めている。
モデル解釈可能性の最大化を目的として設計された、区間値回帰出力の新しい可視化と共に、合成データと実世界のデータの両方を使用して、注意深く設計された実験が行われる。
最後に、特定の特性を持つデータセットに対するメソッド適合性について提案し、残すべき課題と、不確実性のあるソースを扱う能力を持つAIを開発するための重要な次のステップを強調する。
関連論文リスト
- Collect, Measure, Repeat: Reliability Factors for Responsible AI Data
Collection [8.12993269922936]
AIのデータ収集は責任ある方法で行うべきだと我々は主張する。
本稿では,データ収集をメトリクスの集合でガイドするResponsible AI(RAI)手法を提案する。
論文 参考訳(メタデータ) (2023-08-22T18:01:27Z) - Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty
Quantification [3.175239447683357]
本稿では、摂動支援サンプル合成(PASS)法により生成された合成データを利用した新しい摂動支援推論(PAI)フレームワークを提案する。
このフレームワークは、複雑なデータシナリオ、特に非構造化データの不確実性定量化に焦点を当てている。
我々は、画像合成、感情語分析、マルチモーダル推論、予測区間の構築など、様々な分野に適用することで、複雑なデータ駆動タスクにおける不確実性定量化を推し進める上で、PAIの有効性を実証する。
論文 参考訳(メタデータ) (2023-05-30T01:01:36Z) - STEERING: Stein Information Directed Exploration for Model-Based
Reinforcement Learning [111.75423966239092]
遷移モデルの現在の推定値と未知の最適値との間の積分確率距離(IPM)の観点から探索インセンティブを提案する。
KSDに基づく新しいアルゴリズムを開発した。 textbfSTEin information dirtextbfEcted Explor for model-based textbfReinforcement Learntextbfing。
論文 参考訳(メタデータ) (2023-01-28T00:49:28Z) - CEDAR: Communication Efficient Distributed Analysis for Regressions [9.50726756006467]
患者レベルのデータを共有することなく、複数のEHRデータベース上での分散学習への関心が高まっている。
本稿では,局所的な最適推定値を集約する通信効率のよい新しい手法を提案する。
本稿では,統計的推測法と差分プライバシーに関する理論的検討を行い,シミュレーションおよび実データ解析におけるその性能評価を行う。
論文 参考訳(メタデータ) (2022-07-01T09:53:44Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Exploring the Efficacy of Automatically Generated Counterfactuals for
Sentiment Analysis [17.811597734603144]
本稿では,データ拡張と説明のためのデファクトデータの自動生成手法を提案する。
いくつかの異なるデータセットに対する包括的な評価と、さまざまな最先端ベンチマークの使用により、我々のアプローチがモデルパフォーマンスを大幅に改善できることを示す。
論文 参考訳(メタデータ) (2021-06-29T10:27:01Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z) - S^3-Rec: Self-Supervised Learning for Sequential Recommendation with
Mutual Information Maximization [104.87483578308526]
本稿では,シーケンスレコメンデーションのための自己改善学習のためのモデルS3-Recを提案する。
そこで本稿では,属性,項目,サブシーケンス,シーケンス間の相関関係を学習するために,4つの補助的自己教師対象を考案する。
6つの実世界のデータセットで実施された大規模な実験は、既存の最先端手法よりも提案手法が優れていることを示す。
論文 参考訳(メタデータ) (2020-08-18T11:44:10Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。