論文の概要: EasyControlEdge: A Foundation-Model Fine-Tuning for Edge Detection
- arxiv url: http://arxiv.org/abs/2602.16238v1
- Date: Wed, 18 Feb 2026 07:28:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.540899
- Title: EasyControlEdge: A Foundation-Model Fine-Tuning for Edge Detection
- Title(参考訳): EasyControlEdge:エッジ検出のための基礎モデルファインチューニング
- Authors: Hiroki Nakamura, Hiroto Iino, Masashi Okada, Tadahiro Taniguchi,
- Abstract要約: エッジ検出に画像生成基盤モデルを適用したEasyControlEdgeを提案する。
本研究は,非処理性評価と限られたトレーニングデータによる一貫した利得を示す。
- 参考スコア(独自算出の注目度): 9.817969756082995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose EasyControlEdge, adapting an image-generation foundation model to edge detection. In real-world edge detection (e.g., floor-plan walls, satellite roads/buildings, and medical organ boundaries), crispness and data efficiency are crucial, yet producing crisp raw edge maps with limited training samples remains challenging. Although image-generation foundation models perform well on many downstream tasks, their pretrained priors for data-efficient transfer and iterative refinement for high-frequency detail preservation remain underexploited for edge detection. To enable crisp and data-efficient edge detection using these capabilities, we introduce an edge-specialized adaptation of image-generation foundation models. To better specialize the foundation model for edge detection, we incorporate an edge-oriented objective with an efficient pixel-space loss. At inference, we introduce guidance based on unconditional dynamics, enabling a single model to control the edge density through a guidance scale. Experiments on BSDS500, NYUDv2, BIPED, and CubiCasa compare against state-of-the-art methods and show consistent gains, particularly under no-post-processing crispness evaluation and with limited training data.
- Abstract(参考訳): エッジ検出に画像生成基盤モデルを適用したEasyControlEdgeを提案する。
現実世界のエッジ検出(例えば、フロアプランの壁、サテライトロード/ビルディング、医療機関の境界)では、鮮明さとデータ効率が不可欠だが、限られたトレーニングサンプルを持つ鮮やかな生のエッジマップの作成は依然として困難である。
画像生成基礎モデルは、多くの下流タスクでよく機能するが、その事前訓練されたデータ効率の転送と高頻度ディテール保存のための反復的改善は、エッジ検出には不十分なままである。
そこで我々は,これらの機能を用いて,画像生成基礎モデルのエッジ特化適応を,クリップかつデータ効率のよいエッジ検出を可能にする。
エッジ検出のための基礎モデルをより高度に専門化するために、エッジ指向の目的と効率的なピクセル空間損失を組み込む。
推論では,非条件力学に基づくガイダンスを導入し,単一のモデルが誘導尺度を用いてエッジ密度を制御できるようにする。
BSDS500、NYUDv2、BIPED、CubeCasaの実験は最先端の手法と比較し、特に非処理のクリスペンス評価と限られたトレーニングデータの下で、一貫した利得を示す。
関連論文リスト
- Efficient Detection Framework Adaptation for Edge Computing: A Plug-and-play Neural Network Toolbox Enabling Edge Deployment [59.61554561979589]
エッジコンピューティングは、時間に敏感なシナリオでディープラーニングベースのオブジェクト検出をデプロイするための重要なパラダイムとして登場した。
既存のエッジ検出手法では、軽量モデルによる検出精度のバランスの難しさ、適応性の制限、現実の検証の不十分といった課題に直面している。
本稿では,汎用的なプラグイン・アンド・プレイコンポーネントを用いてエッジ環境にオブジェクト検出モデルを適用するエッジ検出ツールボックス(ED-TOOLBOX)を提案する。
論文 参考訳(メタデータ) (2024-12-24T07:28:10Z) - Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - Cycle Pixel Difference Network for Crisp Edge Detection [14.625034156501778]
エッジ検出はコンピュータビジョンの基本課題である。
近年の深層学習手法は,1)大規模事前学習重量への依存,2)太いエッジの生成という2つの重大な課題に直面している。
CPD-Netと呼ばれるU字型エンコーダデコーダモデルを構築し、これら2つの問題に同時に対処する。
論文 参考訳(メタデータ) (2024-09-06T13:28:05Z) - Learning to utilize image second-order derivative information for crisp edge detection [16.152236524867078]
エッジ検出はコンピュータビジョンの基本課題である。
最近のトップパフォーマンスエッジ検出手法は、厚くノイズの多いエッジラインを生成する傾向にある。
本稿では,モデルが真のエッジピクセルを正確に検出するのに役立つ2階微分型マルチスケールコンテキスト拡張モジュール(SDMCM)を提案する。
また、不均衡分布問題を軽減するために、ハイブリッド焦点損失関数(HFL)を構築した。
最後に、エッジ検出のためのSDMCMとBRMに基づくLUS-NetというU字型ネットワークを提案する。
論文 参考訳(メタデータ) (2024-06-09T13:25:02Z) - SuperEdge: Towards a Generalization Model for Self-Supervised Edge
Detection [2.912976132828368]
最先端のピクセルワイドアノテーションは労働集約的であり、手作業で取得すると矛盾する。
本稿では, マルチレベルのマルチホログラフィー技術を用いて, 合成データセットから実世界のデータセットへアノテーションを転送する, エッジ検出のための新しい自己教師型アプローチを提案する。
提案手法は,手動の注釈付きエッジラベルへの依存性を排除し,多様なデータセット間の一般化性を向上させる。
論文 参考訳(メタデータ) (2024-01-04T15:21:53Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - Refined Plane Segmentation for Cuboid-Shaped Objects by Leveraging Edge
Detection [63.942632088208505]
本稿では,セグメント化された平面マスクを画像に検出されたエッジと整列するための後処理アルゴリズムを提案する。
これにより、立方体形状の物体に制限を加えながら、最先端のアプローチの精度を高めることができます。
論文 参考訳(メタデータ) (2020-03-28T18:51:43Z) - DeepStrip: High Resolution Boundary Refinement [60.00241966809684]
関心領域をストリップ画像に変換し、ストリップ領域の境界予測を計算することを提案する。
対象境界を検出するために,2つの予測層を持つフレームワークを提案する。
我々は、誤報を減らすために、整合性とC0連続性正規化をネットワークに強制する。
論文 参考訳(メタデータ) (2020-03-25T22:44:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。