論文の概要: Rethinking Object Saliency Ranking: A Novel Whole-flow Processing
Paradigm
- arxiv url: http://arxiv.org/abs/2312.03226v1
- Date: Wed, 6 Dec 2023 01:51:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-07 16:16:13.428895
- Title: Rethinking Object Saliency Ranking: A Novel Whole-flow Processing
Paradigm
- Title(参考訳): object saliency rankingの再検討: 新たなフロー処理パラダイム
- Authors: Mengke Song, Linfeng Li, Dunquan Wu, Wenfeng Song, Chenglizhao Chen
- Abstract要約: 本稿では、その「重要順」によって、有能な物体のランク付けに完全にフォーカスすることを目的とした、有能なランキングのための新しいパラダイムを提案する。
提案手法は、広く使われているSALICONの既存の最先端手法よりも優れている。
- 参考スコア(独自算出の注目度): 22.038715439842044
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing salient object detection methods are capable of predicting binary
maps that highlight visually salient regions. However, these methods are
limited in their ability to differentiate the relative importance of multiple
objects and the relationships among them, which can lead to errors and reduced
accuracy in downstream tasks that depend on the relative importance of multiple
objects. To conquer, this paper proposes a new paradigm for saliency ranking,
which aims to completely focus on ranking salient objects by their "importance
order". While previous works have shown promising performance, they still face
ill-posed problems. First, the saliency ranking ground truth (GT) orders
generation methods are unreasonable since determining the correct ranking order
is not well-defined, resulting in false alarms. Second, training a ranking
model remains challenging because most saliency ranking methods follow the
multi-task paradigm, leading to conflicts and trade-offs among different tasks.
Third, existing regression-based saliency ranking methods are complex for
saliency ranking models due to their reliance on instance mask-based saliency
ranking orders. These methods require a significant amount of data to perform
accurately and can be challenging to implement effectively. To solve these
problems, this paper conducts an in-depth analysis of the causes and proposes a
whole-flow processing paradigm of saliency ranking task from the perspective of
"GT data generation", "network structure design" and "training protocol". The
proposed approach outperforms existing state-of-the-art methods on the
widely-used SALICON set, as demonstrated by extensive experiments with fair and
reasonable comparisons. The saliency ranking task is still in its infancy, and
our proposed unified framework can serve as a fundamental strategy to guide
future work.
- Abstract(参考訳): 既存のサルエント物体検出法は、視覚的にサルエント領域を強調するバイナリマップを予測することができる。
しかし、これらの手法は、複数のオブジェクトの相対的重要性とそれらの関係を区別する能力に限られており、複数のオブジェクトの相対的重要性に依存する下流タスクにおいて、エラーや精度の低下につながる可能性がある。
そこで本研究では,その「重要順」によって,有能な物体のランク付けに完全に焦点を合わせることを目的とした,有能度ランキングの新しいパラダイムを提案する。
以前の作品は有望な性能を示したが、未だに不適切な問題に直面している。
まず、正しいランク付け順序が正しく定義されていないため、正当性ランキング基底真理(GT)順序生成法は理にかなわないため、誤報となる。
第二に、ほとんどの給与ランク付け手法がマルチタスクパラダイムに従っており、異なるタスク間の競合やトレードオフにつながるため、ランク付けモデルのトレーニングは依然として困難である。
第三に、既存の回帰型サリエンシーランキング手法は、例のマスクベースのサリエンシーランキング順序に依存するため、サリエンシーランキングモデルにとって複雑である。
これらの方法は、正確に実行するには大量のデータを必要とし、効果的に実装することは困難である。
これらの問題を解決するため,本研究では,GTデータ生成,ネットワーク構造設計,トレーニングプロトコルの観点から,原因の詳細な分析を行い,サリエンシランキングタスクの全体フロー処理パラダイムを提案する。
提案手法は, 公正かつ合理的な比較実験により実証された, 広く使用されているSALICONの既存の最先端手法よりも優れている。
サラレンシーランキングタスクはまだ初期段階であり、我々の提案した統合フレームワークは、将来の作業の指針となる基本的な戦略として機能する。
関連論文リスト
- List-aware Reranking-Truncation Joint Model for Search and
Retrieval-augmented Generation [80.12531449946655]
本稿では,2つのタスクを同時に実行可能なRe rank-Truncation joint model(GenRT)を提案する。
GenRTは、エンコーダ-デコーダアーキテクチャに基づく生成パラダイムによるリランクとトランケーションを統合している。
提案手法は,Web検索および検索拡張LLMにおけるリランクタスクとトラルケーションタスクの両方においてSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-02-05T06:52:53Z) - TA&AT: Enhancing Task-Oriented Dialog with Turn-Level Auxiliary Tasks
and Action-Tree Based Scheduled Sampling [16.77137239284608]
タスク指向対話システムは,対話型事前学習技術によって大きく進歩している。
エンコーダのターンレベルマルチタスク目的を提案する。
デコーダに対しては,アクションツリーに基づくスケジュールサンプリング手法を導入する。
論文 参考訳(メタデータ) (2024-01-28T11:02:23Z) - PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文 参考訳(メタデータ) (2023-09-20T08:16:39Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - A Pre-processing Method for Fairness in Ranking [0.0]
本稿では,データの順序を相互に評価する公平なランキングフレームワークを提案する。
提案手法は,実世界のデータセットに対する精度と公平性のトレードオフにおいて,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-10-29T02:55:32Z) - Instance-Level Relative Saliency Ranking with Graph Reasoning [126.09138829920627]
そこで本研究では,有意な事例を分割し,相対的有意な有意なランク順序を推定するための統一モデルを提案する。
また、サラレンシーランキングブランチを効果的にトレーニングするために、新しい損失関数も提案されている。
実験の結果,提案手法は従来の手法よりも有効であることがわかった。
論文 参考訳(メタデータ) (2021-07-08T13:10:42Z) - Monocular Depth Estimation via Listwise Ranking using the Plackett-Luce
Model [15.472533971305367]
多くの実世界のアプリケーションでは、画像内の物体の相対的な深さがシーン理解に不可欠である。
近年のアプローチでは, この問題を回帰課題として扱うことにより, 単眼画像の深度予測の問題に対処している。
しかし、ランク付け手法は回帰の自然な代替として自らを示唆しており、実際、ペア比較を利用したランク付け手法はこの問題に対して有望な性能を示している。
論文 参考訳(メタデータ) (2020-10-25T13:40:10Z) - Sequential Transfer in Reinforcement Learning with a Generative Model [48.40219742217783]
本稿では,従来の課題から知識を移譲することで,新たな課題を学習する際のサンプルの複雑さを軽減する方法について述べる。
この種の事前知識を使用することのメリットを明確に示すために,PAC境界のサンプル複雑性を導出する。
簡単なシミュレートされた領域における理論的な発見を実証的に検証する。
論文 参考訳(メタデータ) (2020-07-01T19:53:35Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - The World is Not Binary: Learning to Rank with Grayscale Data for
Dialogue Response Selection [55.390442067381755]
人間の努力なしに、グレースケールのデータを自動的に構築できることが示される。
本手法では,自動グレースケールデータ生成装置として,市販の応答検索モデルと応答生成モデルを用いる。
3つのベンチマークデータセットと4つの最先端マッチングモデルの実験は、提案手法が大幅に、一貫したパフォーマンス改善をもたらすことを示している。
論文 参考訳(メタデータ) (2020-04-06T06:34:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。