Fugu-MT 論文翻訳(概要): Parameter-Efficient Fine-Tuning of Vision Foundation Model for Forest Floor Segmentation from UAV Imagery

論文の概要: Parameter-Efficient Fine-Tuning of Vision Foundation Model for Forest Floor Segmentation from UAV Imagery

arxiv url: http://arxiv.org/abs/2505.08932v1
Date: Tue, 13 May 2025 19:59:29 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-15 21:44:09.28782
Title: Parameter-Efficient Fine-Tuning of Vision Foundation Model for Forest Floor Segmentation from UAV Imagery
Title（参考訳）: UAV画像からの森林床セグメンテーションのための視覚基礎モデルのパラメータ効率の良い微調整
Authors: Mohammad Wasil, Ahmad Drak, Brennan Penfold, Ludovico Scarton, Maximilian Johenneken, Alexander Asteroth, Sebastian Houben,
Abstract要約: 我々は視覚基盤モデルを用いて,樹木の切り株,植生,樹木の破片などの林床オブジェクトを分割する。我々はパラメータ効率の細かい微調整(PEFT)を用いて、追加のモデルパラメータの小さなサブセットを微調整する。その結果,アダプタを用いたPEFT法は,結合よりも高い平均交叉を実現していることがわかった。
参考スコア（独自算出の注目度）: 36.962599292942755
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Unmanned Aerial Vehicles (UAVs) are increasingly used for reforestation and forest monitoring, including seed dispersal in hard-to-reach terrains. However, a detailed understanding of the forest floor remains a challenge due to high natural variability, quickly changing environmental parameters, and ambiguous annotations due to unclear definitions. To address this issue, we adapt the Segment Anything Model (SAM), a vision foundation model with strong generalization capabilities, to segment forest floor objects such as tree stumps, vegetation, and woody debris. To this end, we employ parameter-efficient fine-tuning (PEFT) to fine-tune a small subset of additional model parameters while keeping the original weights fixed. We adjust SAM's mask decoder to generate masks corresponding to our dataset categories, allowing for automatic segmentation without manual prompting. Our results show that the adapter-based PEFT method achieves the highest mean intersection over union (mIoU), while Low-rank Adaptation (LoRA), with fewer parameters, offers a lightweight alternative for resource-constrained UAV platforms.
Abstract（参考訳）: 無人航空機 (UAV) は森林再植林や森林モニタリングにますます使われており、種子の散布は困難な地形で行われている。しかし、森林床の詳細な理解は、高い自然変動性、環境パラメータの急激な変化、不明瞭な定義による曖昧なアノテーションにより、依然として困難である。この問題に対処するため,木切り株や植生,樹木の破片などの林床オブジェクトを分割するために,強力な一般化能力を持つ視覚基盤モデルであるセグメンション・アニーシング・モデル(SAM)を適用した。この目的のために、パラメータ効率の微調整(PEFT)を用いて、元の重みを固定しながら、追加のモデルパラメータの小さなサブセットを微調整する。我々はSAMのマスクデコーダを調整し、データセットカテゴリに対応するマスクを生成する。提案手法は,より少ないパラメータを持つ低ランク適応 (LoRA) が資源制約付きUAVプラットフォームに対する軽量な代替手段であることを示す。

関連論文リスト

Controllable-LPMoE: Adapting to Challenging Object Segmentation via Dynamic Local Priors from Mixture-of-Experts [16.21786310193235]
制御可能LPMoEと呼ばれる、トレーニング可能なパラメータが少ない新しい動的事前学習パラダイムを提案する。入力画像から多種多様な局所前駆体を異種畳み込みによりキャプチャする軽量な動的混合局所前駆体抽出器を構築した。また、コサインアラインな変形性アテンションとチャネル指向適応スケールエンハンスメントを利用した双方向インタラクションアダプタを設計する。
論文参考訳（メタデータ） (2025-10-24T03:03:59Z)
Forestpest-YOLO: A High-Performance Detection Framework for Small Forestry Pests [3.9627432442852544]
本稿では,森林リモートセンシングのニュアンスに巧みに最適化された検出フレームワークであるフォレストペスト・ヨロを紹介する。まず、ダウンサンプリングモジュールであるSPD-Convを統合し、ネットワーク全体を通して小さなターゲットに関する重要な高解像度の詳細が保存されるようにします。これは、背景雑音を抑えながらマルチスケールの特徴表現を動的に強化する新しいクロスステージ機能融合ブロック、CSPOKによって補完される。
論文参考訳（メタデータ） (2025-10-01T06:06:40Z)
Weakly-Supervised Learning for Tree Instances Segmentation in Airborne Lidar Point Clouds [1.5624421399300306]
大気中のレーザースキャン(ALS)データのツリーインスタンスセグメンテーションは、森林モニタリングにおいて最も重要である。人間の操作者による品質評価として,初期セグメンテーション結果のラベルが提供される弱い教師付きアプローチを提案する。品質評価中に生成されたラベルは、評価モデルをトレーニングするために使用され、そのタスクは、セグメンテーション出力を人間のオペレータが指定したクラスに分類することである。
論文参考訳（メタデータ） (2025-08-21T15:25:23Z)
Exploring Sparse Adapters for Scalable Merging of Parameter Efficient Experts [72.22148263683037]
ニューラルネットワークの重みのサブセットのみをトレーニングするスパースアダプタの特性をモジュラーアーキテクチャの潜在的な構成要素として検討する。まず,本論文の既存の手法よりも概念的にシンプルである,効果的なスパースアダプタの訓練方法を提案する。次に,これらのスパースアダプタのマージ特性について,最大20の自然言語処理タスクに対して,アダプタをマージすることで検討する。
論文参考訳（メタデータ） (2025-07-09T03:25:45Z)
Dome-DETR: DETR with Density-Oriented Feature-Query Manipulation for Efficient Tiny Object Detection [7.16574066661446]
Dome-DETRは、高効率Tinyオブジェクト検出のための密度指向の特徴クエリ操作を備えた新しいフレームワークである。最先端のパフォーマンス(AI-TOD-V2では+3.3 AP、VisDroneでは+2.5 AP)を実現し、計算の複雑さとコンパクトなモデルサイズを維持している。
論文参考訳（メタデータ） (2025-05-09T02:44:06Z)
Vision-Centric Representation-Efficient Fine-Tuning for Robust Universal Foreground Segmentation [5.326302374594885]
前景のセグメンテーションはシーン理解に不可欠であるが、視覚基盤モデル(VFM)のパラメータ効率の良い微調整(PEFT)は複雑なシナリオでしばしば失敗する。 LSR-ST(Ladder Shape-bias Representation Side-tuning)を提案する。
論文参考訳（メタデータ） (2025-04-20T04:12:38Z)
Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文参考訳（メタデータ） (2024-10-09T15:02:28Z)
LoRTA: Low Rank Tensor Adaptation of Large Language Models [70.32218116940393]
Low Rank Adaptation (LoRA) は、PEFT (Efficient Fine Tuning) 法として人気がある。よりコンパクトで柔軟な表現を可能にする高階Candecomp/Parafac(CP)分解を提案する。本手法は,比較性能を維持しつつパラメータ数を削減できる。
論文参考訳（メタデータ） (2024-10-05T06:59:50Z)
On the Implicit Relation Between Low-Rank Adaptation and Differential Privacy [5.359060261460183]
言語モデルの低ランクタスク適応(LoRAやFLoRAなど)が提案されている。理論的には、LoRAとFLoRAで使用される低ランク適応は、アダプタパラメータにランダムノイズを注入する。低ランク適応の力学は、アダプタの微分プライベート微調整の力学に近いことを示す。
論文参考訳（メタデータ） (2024-09-26T04:56:49Z)
Semantic segmentation of sparse irregular point clouds for leaf/wood discrimination [1.4499463058550683]
本稿では,点幾何学のみを利用するPointnet ++アーキテクチャに基づくニューラルネットワークモデルを提案する。我々のモデルは、UAVポイントクラウドにおける最先端の代替品よりも優れていることを示す。
論文参考訳（メタデータ） (2023-05-26T14:19:17Z)
Unsupervised Seismic Footprint Removal With Physical Prior Augmented Deep Autoencoder [11.303407992331213]
本稿では、獲得したフットプリントの教師なし抑制のためのフットプリント除去ネットワーク(FR-Netと呼ばれる)を提案する。 FR-Netの鍵となるのは、ノイズの本質的な指向性に応じてフットプリント獲得のための一方向全変動(UTV)モデルを設計することである。
論文参考訳（メタデータ） (2023-02-08T07:46:28Z)
Optimizing Relevance Maps of Vision Transformers Improves Robustness [91.61353418331244]
視覚的分類モデルは、しばしば画像背景に依存し、前景を無視し、分布の変化に対する頑丈さを損なうことが観察されている。本稿では,モデルが前景オブジェクトに注目するように,モデルの関連性信号を監視して操作することを提案する。これは、画像とそれに関連する前景マスクからなる比較的少数のサンプルを含む、微調整のステップとして行われる。
論文参考訳（メタデータ） (2022-06-02T17:24:48Z)
Pre-Trained Models for Heterogeneous Information Networks [57.78194356302626]
異種情報ネットワークの特徴を捉えるための自己教師付き事前学習・微調整フレームワークPF-HINを提案する。 PF-HINは4つのデータセットにおいて、各タスクにおける最先端の代替よりも一貫して、大幅に優れています。
論文参考訳（メタデータ） (2020-07-07T03:36:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。