論文の概要: AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision
- arxiv url: http://arxiv.org/abs/2603.07356v2
- Date: Sat, 14 Mar 2026 23:10:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 13:51:29.000621
- Title: AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision
- Title(参考訳): AgrI Challenge: 農業ビジョンにおけるチーム間検証のためのデータ中心AIコンペティション
- Authors: Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem,
- Abstract要約: 複数のチームが独立してフィールドデータセットを収集する、データ中心の競争フレームワークであるAgrI Challengeを紹介します。
個別に収集したデータセット間のクロスドメイン一般化を体系的に評価するために,クロスチーム検証(CTV)を提案する。
CTVには、単一ソースの一般化を測定するTrain-on-One-Team-Only(TOTO)と、協調的なマルチソーストレーニングを評価するLeave-One-Team-Out(LOTO)の2つの補完プロトコルが含まれている。
- 参考スコア(独自算出の注目度): 0.42599924975120773
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine learning models in agricultural vision often achieve high accuracy on curated datasets but fail to generalize under real field conditions due to distribution shifts between training and deployment environments. Moreover, most machine learning competitions focus primarily on model design while treating datasets as fixed resources, leaving the role of data collection practices in model generalization largely unexplored. We introduce the AgrI Challenge, a data-centric competition framework in which multiple teams independently collect field datasets, producing a heterogeneous multi-source benchmark that reflects realistic variability in acquisition conditions. To systematically evaluate cross-domain generalization across independently collected datasets, we propose Cross-Team Validation (CTV), an evaluation paradigm that treats each team's dataset as a distinct domain. CTV includes two complementary protocols: Train-on-One-Team-Only (TOTO), which measures single-source generalization, and Leave-One-Team-Out (LOTO), which evaluates collaborative multi-source training. Experiments reveal substantial generalization gaps under single-source training: models achieve near-perfect validation accuracy yet exhibit validation-test gaps of up to 16.20% (DenseNet121) and 11.37% (Swin Transformer) when evaluated on datasets collected by other teams. In contrast, collaborative multi-source training dramatically improves robustness, reducing the gap to 2.82% and 1.78%, respectively. The challenge also produced a publicly available dataset of 50,673 field images of six tree species collected by twelve independent teams, providing a diverse benchmark for studying domain shift and data-centric learning in agricultural vision.
- Abstract(参考訳): 農業ビジョンにおける機械学習モデルは、しばしば、キュレートされたデータセットに対して高い精度を達成するが、トレーニングとデプロイメント環境の間の分散シフトのため、実際のフィールド条件下での一般化には失敗する。
さらに、ほとんどの機械学習コンペティションは、主にモデル設計に焦点を当て、データセットを固定リソースとして扱う。
AgrI Challengeは、複数のチームが独立してフィールドデータセットを収集し、取得条件の現実的な変動を反映した異種マルチソースベンチマークを生成する、データ中心の競争フレームワークである。
独立したデータセット間でのクロスドメインの一般化を体系的に評価するために,各チームのデータセットを独立したドメインとして扱う評価パラダイムであるクロスチーム検証(CTV)を提案する。
CTVには、単一ソースの一般化を測定するTrain-on-One-Team-Only(TOTO)と、協調的なマルチソーストレーニングを評価するLeave-One-Team-Out(LOTO)の2つの補完プロトコルが含まれている。
モデルはほぼ完全な検証精度を達成するが、他のチームが収集したデータセットで評価した場合、最大16.20%(DenseNet121)と11.37%(Swin Transformer)の検証テストギャップを示す。
対照的に、協調的なマルチソーストレーニングは、それぞれ2.82%と1.78%のギャップを減らし、ロバスト性を大幅に改善する。
この課題はまた、12の独立したチームによって収集された6つの木種の50,673のフィールドイメージの公開データセットを作成し、農業ビジョンにおけるドメインシフトとデータ中心学習を研究するための多様なベンチマークを提供した。
関連論文リスト
- OpenDataArena: A Fair and Open Arena for Benchmarking Post-Training Dataset Value [74.80873109856563]
OpenDataArena(ODA)は、トレーニング後のデータの本質的な価値をベンチマークするために設計された、総合的でオープンなプラットフォームである。
ODAは4つの主要な柱からなる包括的なエコシステムを確立している。 (i) 多様なモデル間で公平でオープンな比較を保証する統一的なトレーニング評価パイプライン、 (ii) 異なる軸数に沿ってデータ品質をプロファイリングする多次元スコアリングフレームワーク、 (iii) データセットの系図を視覚化してコンポーネントソースを識別するインタラクティブなデータ系統探索である。
論文 参考訳(メタデータ) (2025-12-16T03:33:24Z) - C2AL: Cohort-Contrastive Auxiliary Learning for Large-scale Recommendation Systems [7.548682352355034]
共有埋め込み選択のための因子化機械において,注意機構が重要な役割を担っていることを示す。
本稿では、データセットのサブ構造を分析し、補助学習を通して強力な分布コントラストを持つ構造を明らかにすることで、この問題に対処することを提案する。
このアプローチは、注目層の学習プロセスをカスタマイズし、少数派コホートとの相互情報を保護し、グローバルなパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2025-10-02T17:00:17Z) - A Tale of Two Experts: Cooperative Learning for Source-Free Unsupervised Domain Adaptation [59.88864205383671]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、ソースデータにアクセスすることなく、ターゲットドメインにソース学習モデルを適用するという現実的な課題に対処する。
既存のSFUDA手法は、ソースモデルの予測のみを利用するか、大きなマルチモーダルモデルを微調整する。
本稿では、補完的な洞察と対象データの潜在構造を利用するためのエキスパート協調学習(EXCL)を提案する。
論文 参考訳(メタデータ) (2025-09-26T11:39:50Z) - Cross-Dataset Gaze Estimation by Evidential Inter-intra Fusion [38.93368421481945]
クロスデータセットモデルをトレーニングするための新しいEvidential Inter-Intra Fusion EIFフレームワークを提案する。
さまざまなデータセットに対して独立した単一データセットのブランチを構築します。
さらに、単一データセットのブランチから一般化可能な機能を統合するために、クロスデータセットのブランチを作成します。
論文 参考訳(メタデータ) (2024-09-07T08:53:17Z) - Universal Semi-supervised Model Adaptation via Collaborative Consistency
Training [92.52892510093037]
我々は、Universal Semi-supervised Model Adaptation (USMA)と呼ばれる現実的で挑戦的なドメイン適応問題を導入する。
本稿では,2つのモデル間の予測整合性を規則化する協調的整合性トレーニングフレームワークを提案する。
実験により,いくつかのベンチマークデータセットにおける本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-07-07T08:19:40Z) - Federated Graph Representation Learning using Self-Supervision [18.015793175772835]
フェデレートグラフ表現学習(FedGRL)は、データキュレーションに関連するプライバシーとコンプライアンスの問題に対処しながら、構造化データに分散トレーニングの利点をもたらす。
クロスサイロクライアントは、ラベル付きまたはラベルなしのデータで膨大な量のラベル付きデータにアクセスでき、また、下流クラスラベルドメインも多様である、現実的で斬新な問題設定を考察する。
我々は,自己監督的目標を用いて協調的に最適化された共有グローバルモデルを学習し,ローカルクライアントモデルを通じて下流タスクの監視を行うモデルに基づく新しいFedGRLの定式化を提案する。
論文 参考訳(メタデータ) (2022-10-27T02:13:42Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。