論文の概要: Tighnari v2: Mitigating Label Noise and Distribution Shift in Multimodal Plant Distribution Prediction via Mixture of Experts and Weakly Supervised Learning
- arxiv url: http://arxiv.org/abs/2602.08282v1
- Date: Mon, 09 Feb 2026 05:23:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.076383
- Title: Tighnari v2: Mitigating Label Noise and Distribution Shift in Multimodal Plant Distribution Prediction via Mixture of Experts and Weakly Supervised Learning
- Title(参考訳): Tighnari v2:エキスパートと弱監視学習の混合によるマルチモーダル植物分布予測におけるラベルノイズと分布変化の緩和
- Authors: Haixu Liu, Yufei Wang, Tianxiang Xu, Chuancheng Shi, Hongsheng Xing,
- Abstract要約: Presence-Only (PO) データは広い空間範囲と豊富な分布を提供するが、負のサンプルではひどいラベルノイズに悩まされる。
本稿では,PAおよびPOデータの強度をフル活用したマルチモーダル融合フレームワークを提案する。
GeoLifeCLEF 2025の実験では,PAカバレッジが限定され,分散シフトが顕著なシナリオにおいて,本手法が優れた予測性能を実現することを示す。
- 参考スコア(独自算出の注目度): 4.888851550406879
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large-scale, cross-species plant distribution prediction plays a crucial role in biodiversity conservation, yet modeling efforts in this area still face significant challenges due to the sparsity and bias of observational data. Presence-Absence (PA) data provide accurate and noise-free labels, but are costly to obtain and limited in quantity; Presence-Only (PO) data, by contrast, offer broad spatial coverage and rich spatiotemporal distribution, but suffer from severe label noise in negative samples. To address these real-world constraints, this paper proposes a multimodal fusion framework that fully leverages the strengths of both PA and PO data. We introduce an innovative pseudo-label aggregation strategy for PO data based on the geographic coverage of satellite imagery, enabling geographic alignment between the label space and remote sensing feature space. In terms of model architecture, we adopt Swin Transformer Base as the backbone for satellite imagery, utilize the TabM network for tabular feature extraction, retain the Temporal Swin Transformer for time-series modeling, and employ a stackable serial tri-modal cross-attention mechanism to optimize the fusion of heterogeneous modalities. Furthermore, empirical analysis reveals significant geographic distribution shifts between PA training and test samples, and models trained by directly mixing PO and PA data tend to experience performance degradation due to label noise in PO data. To address this, we draw on the mixture-of-experts paradigm: test samples are partitioned according to their spatial proximity to PA samples, and different models trained on distinct datasets are used for inference and post-processing within each partition. Experiments on the GeoLifeCLEF 2025 dataset demonstrate that our approach achieves superior predictive performance in scenarios with limited PA coverage and pronounced distribution shifts.
- Abstract(参考訳): 大規模でクロス種の植物分布予測は生物多様性の保全において重要な役割を担っているが、この領域におけるモデリングの取り組みは、観測データの空間性や偏見のために大きな課題に直面している。
一方、Presence-Only(PO)データは広い空間範囲と豊富な時空間分布を提供するが、負のサンプルでは厳しいラベルノイズに悩まされる。
本稿では,これらの実世界の制約に対処するため,PAデータとPOデータの両方の長所をフル活用するマルチモーダル融合フレームワークを提案する。
衛星画像の地理的カバレッジに基づいたPOデータに対する革新的な擬似ラベル集約戦略を導入し,ラベル空間とリモートセンシング特徴空間との地理的アライメントを実現する。
モデルアーキテクチャの面では,衛星画像のバックボーンとしてSwin Transformer Baseを採用し,表特徴抽出にTabM Networkを使用し,時系列モデリングにTaboral Swin Transformerを留置し,重み付け可能なシリアル3モードのクロスアテンション機構を用いて不均一なモダリティの融合を最適化する。
さらに,実験解析により,POデータとPAデータを直接混合したモデルでは,POデータのラベルノイズによる性能劣化が生じる傾向が見られた。
テストサンプルは、PAサンプルとの空間的近接に応じて分割され、異なるデータセットでトレーニングされた異なるモデルは、各パーティション内での推論と後処理に使用される。
GeoLifeCLEF 2025データセットを用いた実験では,PAカバレッジが限定され,分布シフトが顕著なシナリオにおいて,提案手法が優れた予測性能を実現することを示す。
関連論文リスト
- Calibrated Probabilistic Interpolation for GEDI Biomass [0.0]
本稿では,局所観測セット上での予測条件を明示する確率的メタラーニングフレームワークであるAttentive Neural Processs (ANPs)を紹介する。
本研究では,熱帯アマゾン林からボレアル,アルプスの5つの生態系にまたがるアプローチを検証した。
この研究は、大陸規模の地球観測のためのアンサンブル分散の、スケーラブルで理論的に厳密な代替手段を提供する。
論文 参考訳(メタデータ) (2026-01-23T15:35:33Z) - Leveraging Optimal Transport for Distributed Two-Sample Testing: An Integrated Transportation Distance-based Framework [2.65043787671605]
本稿では,ITD(Integrated Transportation Distance)を用いた分散二サンプルテストのための新しいフレームワークを提案する。
データプライバシを保ちながら効率的な計算を可能にするために、分散環境での実装のための置換テスト手順が提案されている。
結果は、ITDが分散クライアント間で情報を効果的に集約し、個々のクライアントを調べる際に見逃される可能性のある微妙な分散シフトを検出することを示唆している。
論文 参考訳(メタデータ) (2025-06-19T05:59:48Z) - Spatial-Temporal-Spectral Unified Modeling for Remote Sensing Dense Prediction [20.1863553357121]
リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
様々な密集した予測タスクと多様な意味クラス予測を統一する。
論文 参考訳(メタデータ) (2025-05-18T07:39:17Z) - Un-mixing Test-time Adaptation under Heterogeneous Data Streams [21.40129321379529]
TTA(Test-Time Adaptation)は、ディープモデル適応のための有望なソリューションとして登場した。
本稿では、新しい周波数ベースの分散適応フレームワークFreDAを提案する。
論文 参考訳(メタデータ) (2024-11-16T12:29:59Z) - Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Multi-Source and Test-Time Domain Adaptation on Multivariate Signals using Spatio-Temporal Monge Alignment [59.75420353684495]
コンピュータビジョンやバイオメディカルデータなどの信号に対する機械学習の応用は、ハードウェアデバイスやセッション記録にまたがる変動のため、しばしば課題に直面している。
本研究では,これらの変動を緩和するために,時空間モンジュアライメント(STMA)を提案する。
我々はSTMAが、非常に異なる設定で取得したデータセット間で、顕著で一貫したパフォーマンス向上をもたらすことを示す。
論文 参考訳(メタデータ) (2024-07-19T13:33:38Z) - Deep Generative Sampling in the Dual Divergence Space: A Data-efficient & Interpretative Approach for Generative AI [29.13807697733638]
自然画像の生成的サンプリングにおける顕著な成果の上に構築する。
我々は、画像に似たサンプルを生成するという、画期的な挑戦を、潜在的に過度に野心的に提案する。
統計上の課題は、小さなサンプルサイズであり、時には数百人の被験者で構成されている。
論文 参考訳(メタデータ) (2024-04-10T22:35:06Z) - Breaking the Spurious Causality of Conditional Generation via Fairness
Intervention with Corrective Sampling [77.15766509677348]
条件生成モデルは、トレーニングデータセットから急激な相関を継承することが多い。
これは別の潜在属性に対して不均衡なラベル条件分布をもたらす。
この問題を緩和するための一般的な2段階戦略を提案する。
論文 参考訳(メタデータ) (2022-12-05T08:09:33Z) - PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and
Localization [64.39761523935613]
本稿では,画像中の異常を同時検出・ローカライズするPatch Distribution Modeling, PaDiMを提案する。
PaDiMは、パッチの埋め込みに事前訓練された畳み込みニューラルネットワーク(CNN)を使用している。
また、CNNの異なるセマンティックレベル間の相関を利用して、異常のローカライズも改善している。
論文 参考訳(メタデータ) (2020-11-17T17:29:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。