論文の概要: Fusing Forces: Deep-Human-Guided Refinement of Segmentation Masks
- arxiv url: http://arxiv.org/abs/2408.03304v1
- Date: Tue, 6 Aug 2024 17:11:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-07 13:28:25.012889
- Title: Fusing Forces: Deep-Human-Guided Refinement of Segmentation Masks
- Title(参考訳): ファンクションフォース: ディープ・ヒューマン・ガイドによるセグメンテーション・マスクの微細化
- Authors: Rafael Sterzinger, Christian Stippel, Robert Sablatnig,
- Abstract要約: エトルリアの鏡はエトルリアの芸術において重要なカテゴリーであり、裏面に描かれた精巧な図形が特徴である。
人間の指示に基づいて既存のアノテーションをインタラクティブに洗練するよう訓練されたディープニューラルネットワークを提案する。
提案手法は有効性を大幅に改善し,エトルリアミラー以外の広い範囲のアプリケーションに転送可能である。
- 参考スコア(独自算出の注目度): 1.024113475677323
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Etruscan mirrors constitute a significant category in Etruscan art, characterized by elaborate figurative illustrations featured on their backside. A laborious and costly aspect of their analysis and documentation is the task of manually tracing these illustrations. In previous work, a methodology has been proposed to automate this process, involving photometric-stereo scanning in combination with deep neural networks. While achieving quantitative performance akin to an expert annotator, some results still lack qualitative precision and, thus, require annotators for inspection and potential correction, maintaining resource intensity. In response, we propose a deep neural network trained to interactively refine existing annotations based on human guidance. Our human-in-the-loop approach streamlines annotation, achieving equal quality with up to 75% less manual input required. Moreover, during the refinement process, the relative improvement of our methodology over pure manual labeling reaches peak values of up to 26%, attaining drastically better quality quicker. By being tailored to the complex task of segmenting intricate lines, specifically distinguishing it from previous methods, our approach offers drastic improvements in efficacy, transferable to a broad spectrum of applications beyond Etruscan mirrors.
- Abstract(参考訳): エトルリアの鏡はエトルリアの芸術において重要なカテゴリーであり、裏面に描かれた精巧な図形が特徴である。
分析とドキュメントの面倒でコストのかかる側面は、これらのイラストを手作業でトレースする作業である。
これまでの研究では、深層ニューラルネットワークと組み合わせた測光ステレオスキャンを含む、このプロセスを自動化する方法論が提案されている。
専門家のアノテータに似た定量的な性能を達成する一方で、いくつかの結果は定性的精度に欠けており、検査や潜在的な修正のためのアノテータを必要とし、資源強度を維持している。
そこで本研究では,人間の指示に基づいて既存のアノテーションをインタラクティブに洗練するよう訓練されたディープニューラルネットワークを提案する。
私たちのHuman-in-the-loopアプローチはアノテーションを合理化し、最大75%のマニュアル入力で同等の品質を実現しています。
さらに, 改良過程において, 純粋手動ラベリングによる手法の相対的な改善がピーク値の26%に達し, 品質が大幅に向上した。
複雑な線を分割する複雑な作業、特に従来の方法と区別することで、エトルリア鏡以外の広い範囲のアプリケーションに転送可能な、有効性を大幅に改善する。
関連論文リスト
- Semantics-Oriented Multitask Learning for DeepFake Detection: A Joint Embedding Approach [77.65459419417533]
本稿ではセマンティクス指向のDeepFake検出タスクをサポートするための自動データセット拡張手法を提案する。
また,顔画像とそれに対応するラベルを併用して予測を行う。
提案手法は,DeepFake検出の一般化性を向上し,人間の理解可能な説明を提供することで,ある程度のモデル解釈を行う。
論文 参考訳(メタデータ) (2024-08-29T07:11:50Z) - Drawing the Line: Deep Segmentation for Extracting Art from Ancient Etruscan Mirrors [1.024113475677323]
エトルリアの鏡はエトルリアの芸術において重要なカテゴリーであり、それゆえ、古代についての洞察を得るために体系的な調査が行われている。
彼らの分析の重要な側面は、裏面から手動で彫刻をトレースする労働集約的な作業である。
深層セグメンテーションネットワークと協調して、測光ステレオスキャンによってプロセスを自動化することで、これらの課題に対処する。
論文 参考訳(メタデータ) (2024-04-24T14:57:37Z) - A Lightweight Parallel Framework for Blind Image Quality Assessment [7.9562077122537875]
ブラインド画像品質評価(BIQA)のための軽量並列フレームワーク(LPF)を提案する。
まず,事前学習した特徴抽出ネットワークを用いて視覚特徴を抽出し,視覚特徴を変換するための簡易で効果的な特徴埋め込みネットワーク(FEN)を構築した。
本稿では,サンプルレベルのカテゴリ予測タスクとバッチレベルの品質比較タスクを含む,新たな2つのサブタスクを提案する。
論文 参考訳(メタデータ) (2024-02-19T10:56:58Z) - ENInst: Enhancing Weakly-supervised Low-shot Instance Segmentation [23.621454800084724]
我々は,新しいクラスを効果的に扱うためのアノテーション効率のよい訓練手法である,弱教師付きローショットインスタンスセグメンテーションに対処する。
私たちのENInstは、既存の完全に教師されたいくつかのショットモデルに匹敵するパフォーマンスを達成する上で、7.5倍の効率を実現しています。
論文 参考訳(メタデータ) (2023-02-20T05:15:23Z) - Fingerprint Image-Quality Estimation and its Application to
Multialgorithm Verification [56.128200319868526]
信号品質の認識は、認識率を増大させ、マルチセンサー環境における決定を著しく支援することが見出されている。
本稿では, 指紋画像の向きテンソルを用いて, ノイズ, 構造不足, ぼやけなどの信号障害を, 対称性記述子の助けを借りて定量化する。
定量的な結果は、あらゆる面において品質意識を優先し、認識率を高め、異なるスキルを持つ専門家を効果的かつ効果的に融合させる。
論文 参考訳(メタデータ) (2022-11-24T12:17:49Z) - FineDiving: A Fine-grained Dataset for Procedure-aware Action Quality
Assessment [93.09267863425492]
競争力のあるスポーツビデオにおける行動の高レベル意味論と内部時間構造の両方を理解することが、予測を正確かつ解釈可能なものにする鍵である、と我々は主張する。
本研究では,多様なダイビングイベントに対して,アクションプロシージャに関する詳細なアノテーションを付加した,ファインディビングと呼ばれる詳細なデータセットを構築した。
論文 参考訳(メタデータ) (2022-04-07T17:59:32Z) - Improving Deep Learning Interpretability by Saliency Guided Training [36.782919916001624]
精度法はモデル予測において重要な入力特徴を強調するために広く用いられている。
既存の方法の多くは、修正された勾配関数のバックプロパゲーションを使用して、サリエンシマップを生成する。
本稿では,予測に使用する雑音勾配を低減するために,ニューラルネットワークに対するサリエンシ指導訓練手法を提案する。
論文 参考訳(メタデータ) (2021-11-29T06:05:23Z) - X-Distill: Improving Self-Supervised Monocular Depth via Cross-Task
Distillation [69.9604394044652]
そこで本研究では,クロスタスク知識蒸留による単眼深度の自己指導的訓練を改善する手法を提案する。
トレーニングでは,事前訓練されたセマンティックセグメンテーション教師ネットワークを使用し,そのセマンティック知識を深度ネットワークに転送する。
提案手法の有効性をKITTIベンチマークで評価し,最新技術と比較した。
論文 参考訳(メタデータ) (2021-10-24T19:47:14Z) - Deep Semi-supervised Knowledge Distillation for Overlapping Cervical
Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。
摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。
実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-21T13:27:09Z) - Improved Noise and Attack Robustness for Semantic Segmentation by Using
Multi-Task Training with Self-Supervised Depth Estimation [39.99513327031499]
本研究では,ラベルなしビデオ上での自己教師付き単眼深度推定により,教師付きセマンティックセマンティックセグメンテーションを拡張するマルチタスクトレーニングによるロバストネスの向上を提案する。
提案手法の有効性をCityscapesデータセットで示し,マルチタスクトレーニングアプローチが単一タスクセマンティックセグメンテーションベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2020-04-23T11:03:56Z) - Disentangling Adaptive Gradient Methods from Learning Rates [65.0397050979662]
適応的勾配法が学習率のスケジュールとどのように相互作用するかを、より深く検討する。
我々は、更新の規模をその方向から切り離す"グラフティング"実験を導入する。
適応勾配法の一般化に関する経験的および理論的考察を示す。
論文 参考訳(メタデータ) (2020-02-26T21:42:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。