論文の概要: StruMPL: Multi-task Dense Regression under Disjoint Partial Supervision and MNAR Labels
- arxiv url: http://arxiv.org/abs/2605.19931v1
- Date: Tue, 19 May 2026 14:51:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.447414
- Title: StruMPL: Multi-task Dense Regression under Disjoint Partial Supervision and MNAR Labels
- Title(参考訳): StruMPL: 分割部分スーパービジョンとMNARラベルによるマルチタスクダンス回帰
- Authors: Reza M. Asiyabi, Juan Alberto Molina-Valero, The SEOSAW Partnership, Steven Hancock, Casey M. Ryan,
- Abstract要約: 地球観測による森林表層バイオマス(AGB)の推定は、2つの構造的非互換なラベル源を組み合わせたものである。
我々はこれをMNARラベルとマルチタスク間物理的制約との不均一な解離部分監督の下でのマルチタスク密度回帰として定式化する。
我々は,損失を拘束しながらIPW重み付き定常点を回復するためには,共同最適化が必要であることを解析的かつ実証的に示す。
- 参考スコア(独自算出の注目度): 0.25241093712112367
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating forest aboveground biomass (AGB) from Earth observation combines two structurally incompatible label sources: spaceborne lidar provides canopy structure at millions of locations but no biomass estimate, and ground-based plots provide biomass at thousands of biased locations but no metrics of structure. No single training sample carries labels for all target variables, plot labels are missing not at random (MNAR), and biomass is linked to the structural variables by known but biome-specific allometric laws. We formalise this as multi-task dense regression under heterogeneous disjoint partial supervision with MNAR labels and inter-task physical constraints, and propose StruMPL to address it jointly. A shared encoder feeds per-variable regression, imputation, and propensity heads for spatial MNAR correction, and a learnable physics module that evaluates the inter-task constraint on the model's own predictions at every pixel. The supervised loss uses an Augmented IPW (AIPW) pseudo-outcome with stop-gradients on the propensity and on the imputation baseline; we show analytically and empirically that both are necessary for joint optimisation to recover IPW-weighted stationary points while keeping the loss bounded. On two ecologically distinct biomes, StruMPL outperforms ablation variants and the closest published method on AGB RMSE and bias, with a stratified analysis showing AIPW reduces high-AGB bias by ~54%.
- Abstract(参考訳): 地球観測による森林表層バイオマス(AGB)の推定には、2つの構造的非互換なラベル源が組み合わさっている。
単一のトレーニングサンプルには、すべてのターゲット変数のラベルは持たず、プロットラベルはランダムではない(MNAR)。
我々はこれをMNARラベルとタスク間物理的制約との不均一な解離部分監督の下でのマルチタスク高密度回帰として定式化し、共同で対処するためにStruMPLを提案する。
共有エンコーダは、空間的MNAR補正のための可変レグレッション、インプット、および確率ヘッドと、各画素におけるモデル自身の予測に対するタスク間制約を評価する学習可能な物理モジュールとをフィードする。
教師付き損失は,IPW(AIPW)擬似アウトカムを用いて,相対性および命令ベースライン上の停止勾配を算出し,損失を有界に保ちながらIPW重み付き定常点を回復するためには,共同最適化が必要であることを解析的かつ実証的に示す。
2つの生態学的に異なる生物群において、StruMPLはアブレーション変異と最も近いAGB RMSEとバイアスの手法を上回り、AIPWが高AGBバイアスを約54%減少させることを示す成層解析を行った。
関連論文リスト
- scHelix: Asymmetric Dual-Stream Integration via Explicit Gene-Level Disentanglement [84.88065404629079]
scHelixは、機能がどのように処理されるかを根本的に変更するデータセット適応フレームワークである。
scHelixは、停止段階のグラフキャッシュを備えたデュアルストリームスパース拡散エンコーダを使用する。
scHelixは最先端のメソッドより優れています。
論文 参考訳(メタデータ) (2026-05-18T15:55:13Z) - SEED: Targeted Data Selection by Weighted Independent Set [76.92528228676969]
我々はSEEDと呼ばれる堅牢でスケーラブルなデータ選択パイプラインを開発した。
SEEDは、命令チューニング、視覚的命令チューニング、セマンティックセグメンテーションにおける最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2026-05-15T07:26:54Z) - Rethinking Molecular OOD Generalization via Target-Aware Source Selection [10.102858221967791]
SCOPE-BENCHは、明示的な物理化学的記述空間におけるクラスタレベルのパーティショニングに基づいて構築されたベンチマークである。
POMAは、知識伝達を検索-合成-適応パイプラインとして定式化するフレームワークである。
SCOPE-BENCHにおける最先端の3D分子モデルの予測誤差は平均5.9倍である。
論文 参考訳(メタデータ) (2026-05-13T16:09:46Z) - Ecologically-Constrained Task Arithmetic for Multi-Taxa Bioacoustic Classifiers Without Shared Data [6.033831199709592]
バイオ音響学のトレーニングデータは、分類学、地域学、機関に散在している。
独立に微調整されたBEATエンコーダは、統一された671種分類器に構成可能であることを示す。
論文 参考訳(メタデータ) (2026-05-05T16:10:02Z) - Calibrated Probabilistic Interpolation for GEDI Biomass [0.0]
本稿では,局所観測セット上での予測条件を明示する確率的メタラーニングフレームワークであるAttentive Neural Processs (ANPs)を紹介する。
本研究では,熱帯アマゾン林からボレアル,アルプスの5つの生態系にまたがるアプローチを検証した。
この研究は、大陸規模の地球観測のためのアンサンブル分散の、スケーラブルで理論的に厳密な代替手段を提供する。
論文 参考訳(メタデータ) (2026-01-23T15:35:33Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - How Does Pseudo-Labeling Affect the Generalization Error of the
Semi-Supervised Gibbs Algorithm? [73.80001705134147]
擬似ラベル付き半教師付き学習(SSL)におけるGibsアルゴリズムによる予測一般化誤差(ゲンエラー)を正確に評価する。
ゲンエラーは、出力仮説、擬ラベルデータセット、ラベル付きデータセットの間の対称性付きKL情報によって表現される。
論文 参考訳(メタデータ) (2022-10-15T04:11:56Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。