論文の概要: BoundaryNet: An Attentive Deep Network with Fast Marching Distance Maps
for Semi-automatic Layout Annotation
- arxiv url: http://arxiv.org/abs/2108.09433v1
- Date: Sat, 21 Aug 2021 04:24:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 16:00:48.596293
- Title: BoundaryNet: An Attentive Deep Network with Fast Marching Distance Maps
for Semi-automatic Layout Annotation
- Title(参考訳): BoundaryNet: 半自動レイアウトアノテーションのための高速マーキング距離マップを備えた注意深いネットワーク
- Authors: Abhishek Trivedi and Ravi Kiran Sarvadevabhatla
- Abstract要約: BoundaryNetは、高精度なセミオートマチックレイアウトアノテーションのための新しいリサイズフリーアプローチである。
挑戦的なイメージ原稿データセットの結果は、BoundaryNetが強力なベースラインを上回っていることを示している。
- 参考スコア(独自算出の注目度): 10.990447273771592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precise boundary annotations of image regions can be crucial for downstream
applications which rely on region-class semantics. Some document collections
contain densely laid out, highly irregular and overlapping multi-class region
instances with large range in aspect ratio. Fully automatic boundary estimation
approaches tend to be data intensive, cannot handle variable-sized images and
produce sub-optimal results for aforementioned images. To address these issues,
we propose BoundaryNet, a novel resizing-free approach for high-precision
semi-automatic layout annotation. The variable-sized user selected region of
interest is first processed by an attention-guided skip network. The network
optimization is guided via Fast Marching distance maps to obtain a good quality
initial boundary estimate and an associated feature representation. These
outputs are processed by a Residual Graph Convolution Network optimized using
Hausdorff loss to obtain the final region boundary. Results on a challenging
image manuscript dataset demonstrate that BoundaryNet outperforms strong
baselines and produces high-quality semantic region boundaries. Qualitatively,
our approach generalizes across multiple document image datasets containing
different script systems and layouts, all without additional fine-tuning. We
integrate BoundaryNet into a document annotation system and show that it
provides high annotation throughput compared to manual and fully automatic
alternatives.
- Abstract(参考訳): 画像領域の正確な境界アノテーションは、領域クラスセマンティクスに依存する下流アプリケーションにとって重要である。
いくつかの文書コレクションは、アスペクト比の広い多クラス領域インスタンスと非常に不規則で重なり合う密集したレイアウトを含んでいる。
完全自動境界推定手法は、データ集約的であり、可変サイズの画像を扱うことができず、上記の画像に対する準最適結果を生成する傾向がある。
本稿では,高精度半自動レイアウトアノテーションのための新しいリサイズフリーアプローチであるバウンダリネットを提案する。
可変サイズのユーザ選択領域は、最初に注目誘導スキップネットワークにより処理される。
ネットワーク最適化は高速マーチング距離マップを介して導かれ、高品質な初期境界推定と関連する特徴表現を得る。
これらの出力は、ハウスドルフ損失を用いて最適化された残差グラフ畳み込みネットワークによって処理され、最終的な領域境界を得る。
挑戦的な画像原稿データセットの結果、BoundaryNetは強いベースラインを上回り、高品質なセマンティック領域境界を生成する。
定性的には,スクリプトシステムとレイアウトの異なる複数の文書画像データセットを,追加の微調整なしで一般化する。
BoundaryNetを文書アノテーションシステムに統合し、手動や完全自動の代替品と比較して高いアノテーションスループットを提供することを示す。
関連論文リスト
- Adaptive Region Selection for Active Learning in Whole Slide Image
Semantic Segmentation [3.1392713791311766]
リージョンベースアクティブラーニング(AL)では、限られた数の注釈付き画像領域でモデルをトレーニングする。
本稿では,このALハイパーパラメータに依存しないアノテーション領域を適応的に選択する手法を提案する。
CAMELYON16データセットを用いた乳癌セグメンテーションの課題を用いて本手法の評価を行った。
論文 参考訳(メタデータ) (2023-07-14T05:34:13Z) - ReFit: A Framework for Refinement of Weakly Supervised Semantic
Segmentation using Object Border Fitting for Medical Images [4.945138408504987]
Weakly Supervised Semantic (WSSS)は、画像レベルの監視のみに依存しているため、ネットワークの必要性に対処する上で有望なアプローチである。
本稿では,最新クラスのアクティベーションマップとポストプロセッシング手法を組み合わせたReFitフレームワークを提案する。
本手法をWSSS予測に適用することにより,医用画像の最先端WSSS法に対して最大10%の改善を実現した。
論文 参考訳(メタデータ) (2023-03-14T12:46:52Z) - Push-the-Boundary: Boundary-aware Feature Propagation for Semantic
Segmentation of 3D Point Clouds [0.5249805590164901]
本研究では,オブジェクト境界近傍のセマンティックセグメンテーションを改善するための境界対応特徴伝搬機構を提案する。
1つの共有エンコーダで、ネットワークは、(i)境界ローカライゼーション、(ii)オブジェクトの内部を指す方向の予測、(iii)セマンティックセグメンテーションを3つの並列ストリームで出力する。
提案手法は境界誤差を低減することによって一貫した改善をもたらす。
論文 参考訳(メタデータ) (2022-12-23T15:42:01Z) - SpaText: Spatio-Textual Representation for Controllable Image Generation [61.89548017729586]
SpaTextはオープン語彙シーン制御を用いたテキスト・ツー・イメージ生成の新しい手法である。
シーン全体を記述したグローバルテキストプロンプトに加えて、ユーザはセグメンテーションマップを提供する。
現状拡散モデルである画素ベースと潜在条件ベースでの有効性を示す。
論文 参考訳(メタデータ) (2022-11-25T18:59:10Z) - Grasp-Oriented Fine-grained Cloth Segmentation without Real Supervision [66.56535902642085]
本稿では, 深度画像のみを用いて, 変形した衣服のきめ細かい領域検出の問題に取り組む。
最大で6つの意味領域を定義し, 首の縁, スリーブカフ, ヘム, 上と下をつかむ点を含む。
これらの部品のセグメント化とラベル付けを行うために,U-net ベースのネットワークを導入する。
合成データのみを用いてネットワークをトレーニングし、提案したDAが実データでトレーニングしたモデルと競合する結果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-06T16:31:20Z) - Improving Semantic Segmentation via Decoupled Body and Edge Supervision [89.57847958016981]
既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。
本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。
我々の洞察は、セマンティックセグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクトのテキストボディとテキストエッジを具体的にモデル化する必要があるということである。
さまざまなベースラインやバックボーンネットワークを備えた提案したフレームワークが,オブジェクト内部の一貫性とオブジェクト境界を向上させることを示す。
論文 参考訳(メタデータ) (2020-07-20T12:11:22Z) - Split-Merge Pooling [36.2980225204665]
スプリット・マージ・プールはサブサンプリングなしで空間情報を保存するために導入された。
本研究では,CityscapesとGTA-5データセットから得られた大規模画像の高密度なセマンティックセマンティックセマンティックセグメンテーションについて検討した。
論文 参考訳(メタデータ) (2020-06-13T23:20:30Z) - DeepStrip: High Resolution Boundary Refinement [60.00241966809684]
関心領域をストリップ画像に変換し、ストリップ領域の境界予測を計算することを提案する。
対象境界を検出するために,2つの予測層を持つフレームワークを提案する。
我々は、誤報を減らすために、整合性とC0連続性正規化をネットワークに強制する。
論文 参考訳(メタデータ) (2020-03-25T22:44:48Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。