論文の概要: Adapting SAM with Dynamic Similarity Graphs for Few-Shot Parameter-Efficient Small Dense Object Detection: A Case Study of Chickpea Pods in Field Conditions
- arxiv url: http://arxiv.org/abs/2509.25805v1
- Date: Tue, 30 Sep 2025 05:26:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 14:45:00.027159
- Title: Adapting SAM with Dynamic Similarity Graphs for Few-Shot Parameter-Efficient Small Dense Object Detection: A Case Study of Chickpea Pods in Field Conditions
- Title(参考訳): Few-Shotパラメータ効率の良い小型物体検出のための動的類似グラフ付きSAMの適応:野外環境におけるチクピアポッドの事例
- Authors: Xintong Jiang, Yixue Liu, Mohamed Debbagh, Yu Tian, Valerio Hoyos-Villegas, Viacheslav Adamchuk, Shangpeng Sun,
- Abstract要約: 本研究では,Segment Anything Model (SAM) に適応する動的類似性に基づくグラフ適応(DSGA)モジュールを提案する。
DSGAは4.00Mのトレーニング可能なパラメータしか持たない堅牢な空間的および動的類似性表現を確立しており、これはオリジナルのSAMの4.26%である。
提案手法は農業用自動監視装置の実用性を示し, 精度の高いポッド計数が可能であり, 調整したR-squaredは0.8987である。
- 参考スコア(独自算出の注目度): 7.500556611536649
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Parameter-Efficient Fine-Tuning (PEFT) of foundation models for agricultural computer vision tasks remains challenging due to limited training data and complex field conditions. This study introduces a Dynamic Similarity-based Graph Adaptation (DSGA) module to adapt the Segment Anything Model (SAM) under extreme data constraints for precise foreground and instance segmentation of small dense objects in complex agricultural environments. Through dynamic similarity graph construction with a learnable polynomial decay-initialized weight ranking mechanism and adaptive local feature aggregation, DSGA establishes robust spatial and dynamic similarity representation with only 4.00M trainable parameters, which is 4.26% of the original SAM. Integrating this graph-based feature adaptation with Low-Rank Adaptation (LoRA) creates a complementary optimization framework that effectively captures both local and global dependencies in image embeddings while preserving model stability and parameter efficiency. Experimental results on a challenging chickpea pod dataset demonstrated that DSGA with LoRA achieved superior performance across multiple metrics evaluated under 2, 4, 8 and 10 shots, with progressive performance gains as shot count increased. Quantitative metrics showed a 17.31% improvement in Structure-measure and a 62.36% gain in adaptive F-measure compared to the baseline SAM fine-tuning. Comprehensive ablation studies and visualization analyses through Grad-CAM and t-SNE validated the framework's effectiveness in feature discrimination. The proposed adaptation demonstrated practical utility for automated agricultural monitoring applications, achieving accurate pod-counting with an adjusted R-squared of 0.8987 for images with 10 to 120 pods under challenging field conditions.
- Abstract(参考訳): 農業用コンピュータビジョンタスクの基礎モデルのパラメータ効率の良い微調整(PEFT)は、限られた訓練データと複雑なフィールド条件のため、依然として困難である。
本研究では,複雑な農業環境下での細密なオブジェクトの厳密な前景とインスタンスセグメンテーションのために,厳密なデータ制約の下でSegment Anything Model(SAM)を適用するための動的類似性に基づくグラフ適応(DSGA)モジュールを提案する。
学習可能な多項式崩壊初期化重み付け機構と適応的な局所的特徴集約による動的類似性グラフの構築により、DSGAは、オリジナルのSAMの4.26%である4.00Mのトレーニング可能なパラメータしか持たない、堅牢な空間的および動的類似性表現を確立する。
このグラフベースの機能適応とLo-Rank Adaptation (LoRA)を統合することで、モデル安定性とパラメータ効率を保ちながら、画像埋め込みにおける局所的およびグローバル的依存関係を効果的にキャプチャする補完的な最適化フレームワークが作成されます。
難易度の高いチクピーポッドデータセットの実験結果から,2,4,8,10ショットで評価された複数の指標において,LoRAを用いたDSGAが優れた性能を達成し,ショット数の増加とともに進行的なパフォーマンス向上が得られた。
定量測定の結果、構造測定では17.31%、適応的なF測定では62.36%改善した。
Grad-CAMとt-SNEによる包括的アブレーション研究と可視化分析により、特徴判別におけるフレームワークの有効性が検証された。
提案手法は,10から120ポッドの画像に対して,調整されたR-2乗0.8987で正確なポッドカウントを達成し,自動農業モニタリングの実用性を実証した。
関連論文リスト
- Dual Atrous Separable Convolution for Improving Agricultural Semantic Segmentation [2.3636539018632616]
本研究では, 精密農業における効率的な画像分割手法を提案する。
Dual Atrous Separable Convolution (DAS Conv)モジュールはDeepLabV3ベースのセグメンテーションフレームワークに統合されている。
モデルの複雑さとパフォーマンスのトレードオフを考慮すると、66%以上の効率改善が達成されます。
論文 参考訳(メタデータ) (2025-06-27T18:37:43Z) - High-Fidelity Scientific Simulation Surrogates via Adaptive Implicit Neural Representations [51.90920900332569]
入射神経表現(INR)は空間的に構造化されたデータをモデリングするためのコンパクトで連続的なフレームワークを提供する。
近年のアプローチでは、剛性幾何学的構造に沿った付加的な特徴を導入することでこの問題に対処している。
機能適応型INR(FA-INR)を提案する。
論文 参考訳(メタデータ) (2025-06-07T16:45:17Z) - FedAWA: Adaptive Optimization of Aggregation Weights in Federated Learning Using Client Vectors [50.131271229165165]
Federated Learning (FL)は、分散機械学習のための有望なフレームワークとして登場した。
ユーザの行動、好み、デバイス特性の相違から生じるデータの異質性は、連合学習にとって重要な課題である。
本稿では,学習過程におけるクライアントベクトルに基づくアダプティブ重み付けを適応的に調整する手法であるAdaptive Weight Aggregation (FedAWA)を提案する。
論文 参考訳(メタデータ) (2025-03-20T04:49:40Z) - HeteroTune: Efficient Federated Learning for Large Heterogeneous Models [35.53420882449293]
HeteroTuneは,限られた通信と予算の下で動作する大規模異種モデルのための,新しいファインチューニングパラダイムである。
我々の手法のコアは、異種モデルの柔軟かつ効率的な集約を可能にする新しいアーキテクチャであるDeMAにある。
We provide the theory analysis and empirical evidence shows that HeteroTune achieves state-of-the-art performance and efficiency across various task and model architectures。
論文 参考訳(メタデータ) (2024-11-25T09:58:51Z) - Structuring a Training Strategy to Robustify Perception Models with Realistic Image Augmentations [1.5723316845301678]
本報告では, モデルロバスト性, 性能を向上させるため, 強化したトレーニング手法を提案する。
機械学習モデルの弱点を特定し、適切な拡張を選択し、効果的なトレーニング戦略を考案する包括的フレームワークを提案する。
実験結果は,オープンソースオブジェクトの検出とセマンティックセグメンテーションモデルとデータセットに対する平均平均精度(mAP)や平均距離(mIoU)といった一般的な測定値によって測定されるモデル性能の改善を示す。
論文 参考訳(メタデータ) (2024-08-30T14:15:48Z) - Multi-scale Contrastive Adaptor Learning for Segmenting Anything in Underperformed Scenes [12.36950265154199]
本稿では, MCA-SAM という新しいマルチスケールコントラスト適応学習手法を提案する。
MCA-SAMはトークンレベルとサンプルレベルの両方で、巧妙に設計された対照的な学習フレームワークを通じて、アダプタのパフォーマンスを向上させる。
MCA-SAMは新しいベンチマークを設定し、既存の手法を3つの挑戦的な領域で上回る結果が得られた。
論文 参考訳(メタデータ) (2024-08-12T06:23:10Z) - GroupMamba: Efficient Group-Based Visual State Space Model [66.35608254724566]
状態空間モデル(SSM)は、最近、四次計算の複雑さで長距離依存を捉えることを約束している。
しかし、純粋にSSMベースのモデルは、コンピュータビジョンタスクにおける安定性と最先端の性能を達成するために重要な課題に直面している。
本稿では,コンピュータビジョンのためのSSMベースのモデルをスケールする上での課題,特に大規模モデルの不安定性と非効率性について論じる。
論文 参考訳(メタデータ) (2024-07-18T17:59:58Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Self-Guided Adaptation: Progressive Representation Alignment for Domain
Adaptive Object Detection [86.69077525494106]
非教師なしドメイン適応(UDA)は、オブジェクト検出モデルのドメイン間ロバスト性を改善するために前例のない成功を収めた。
既存のUDA手法は、モデル学習中の瞬間的なデータ分布を無視しており、大きなドメインシフトによって特徴表現が劣化する可能性がある。
本稿では、特徴表現の整合とドメイン間のオブジェクト検出モデルの転送を目標とする自己ガイド適応モデルを提案する。
論文 参考訳(メタデータ) (2020-03-19T13:30:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。