論文の概要: FINDER: Feature Inference on Noisy Datasets using Eigenspace Residuals
- arxiv url: http://arxiv.org/abs/2510.19917v1
- Date: Wed, 22 Oct 2025 18:00:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:16.535928
- Title: FINDER: Feature Inference on Noisy Datasets using Eigenspace Residuals
- Title(参考訳): FINDER:固有空間残差を用いたノイズデータセットの特徴推論
- Authors: Trajan Murphy, Akshunna S. Dogra, Hanfeng Gu, Caleb Meredith, Mark Kon, Julio Enrique Castrillion-Candas,
- Abstract要約: 一般的な分類問題を分析するための厳密なフレームワークであるFINDERを紹介する。
FINDERは、基本的な分析のアイデアを特徴学習と推論の段階に取り入れている。
i) アルツハイマー病のステージ分類, (ii) 森林破壊のリモートセンシング。
- 参考スコア(独自算出の注目度): 0.7349919073512893
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: ''Noisy'' datasets (regimes with low signal to noise ratios, small sample sizes, faulty data collection, etc) remain a key research frontier for classification methods with both theoretical and practical implications. We introduce FINDER, a rigorous framework for analyzing generic classification problems, with tailored algorithms for noisy datasets. FINDER incorporates fundamental stochastic analysis ideas into the feature learning and inference stages to optimally account for the randomness inherent to all empirical datasets. We construct ''stochastic features'' by first viewing empirical datasets as realizations from an underlying random field (without assumptions on its exact distribution) and then mapping them to appropriate Hilbert spaces. The Kosambi-Karhunen-Lo\'eve expansion (KLE) breaks these stochastic features into computable irreducible components, which allow classification over noisy datasets via an eigen-decomposition: data from different classes resides in distinct regions, identified by analyzing the spectrum of the associated operators. We validate FINDER on several challenging, data-deficient scientific domains, producing state of the art breakthroughs in: (i) Alzheimer's Disease stage classification, (ii) Remote sensing detection of deforestation. We end with a discussion on when FINDER is expected to outperform existing methods, its failure modes, and other limitations.
- Abstract(参考訳): 「ノイズ」データセット(低信号対雑音比、小サンプルサイズ、故障データ収集等)は、理論的・実践的な意味を持つ分類手法の鍵となる研究フロンティアである。
本稿では,一般的な分類問題を分析するための厳密なフレームワークであるFINDERを紹介し,ノイズの多いデータセットを最適化したアルゴリズムを提案する。
FINDERは、基本的な確率解析のアイデアを特徴学習と推論段階に組み込んで、すべての経験的データセットに固有のランダム性を最適に説明する。
経験的データセットを(正確な分布の仮定なしで)基礎となるランダム場から実現し、それから適切なヒルベルト空間にマッピングすることで、'stochastic features'を構築する。
Kosambi-Karhunen-Lo\'eve展開(KLE)は、これらの確率的特徴を計算不可能なコンポーネントに分解し、固有分解を通してノイズの多いデータセットの分類を可能にする。
我々は、FINDERをいくつかの挑戦的でデータ不足の科学領域で検証し、最先端のブレークスルーを生み出す。
(i)アルツハイマー病ステージ分類
二 森林破壊のリモート検知
FINDERが既存のメソッド、フェールモード、その他の制限を上回ることをいつ期待するかという議論に終止符を打つ。
関連論文リスト
- A Dataset for Semantic Segmentation in the Presence of Unknowns [49.795683850385956]
既存のデータセットは、既知のものや未知のもののみの評価を可能にするが、両方ではない。
乱雑な実環境からの多様な異常な入力を特徴とする,新しい異常セグメンテーションデータセットISSUを提案する。
データセットは、既存の異常セグメンテーションデータセットの2倍大きい。
論文 参考訳(メタデータ) (2025-03-28T10:31:01Z) - Active Learning with Context Sampling and One-vs-Rest Entropy for Semantic Segmentation [11.077512630548153]
マルチクラスのセマンティックセグメンテーションは、コンピュータビジョンにおける画期的な課題である。
アクティブラーニング(AL)は、戦略的にアノテーションのデータポイントを選択することで、この課題を軽減する。
マルチクラスセマンティックセグメンテーション用に設計されたパッチベースのAL手法であるOREALを提案する。
論文 参考訳(メタデータ) (2024-12-09T13:15:52Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - Efficient Multidimensional Functional Data Analysis Using Marginal
Product Basis Systems [2.4554686192257424]
多次元関数データのサンプルから連続表現を学習するためのフレームワークを提案する。
本研究では, テンソル分解により, 得られた推定問題を効率的に解けることを示す。
我々は、ニューロイメージングにおける真のデータ応用で締めくくっている。
論文 参考訳(メタデータ) (2021-07-30T16:02:15Z) - Online nonnegative CP-dictionary learning for Markovian data [8.490619842547739]
CANDECOMP/PARAFACベースを一般的な制約下でテンソル値データの所定のストリームから学習する新しいアルゴリズムを提案する。
提案アルゴリズムは,データテンソルの列が基礎となるマルコフ連鎖によって生成されるという仮説の下で,目的関数の定常点の集合にほぼ確実に収束することを示す。
論文 参考訳(メタデータ) (2020-09-16T11:41:01Z) - Spatial Classification With Limited Observations Based On Physics-Aware
Structural Constraint [18.070762916388272]
限られた特徴観察による空間分類は、機械学習において難しい問題である。
本稿では,各クラスにおけるサンプルの特徴値にマルチモーダル分布を従わせることによって,最近のアプローチを拡張した。
マルチモーダル分布を持つ拡張モデルの学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-25T20:07:28Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。