論文の概要: A General Framework for Saliency Detection Methods
- arxiv url: http://arxiv.org/abs/1912.12027v2
- Date: Fri, 2 Dec 2022 00:01:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 23:55:25.665323
- Title: A General Framework for Saliency Detection Methods
- Title(参考訳): 塩分濃度検出のための一般的なフレームワーク
- Authors: Fateme Mostafaie, Zahra Nabizadeh, Nader Karimi, Shadrokh Samavi
- Abstract要約: 解像度検出は、画像解析とコンピュータビジョンにおいて最も難しい問題の1つである。
多くのアプローチは、人間の視覚的注意体系の心理的・生物学的性質に基づいて異なるアーキテクチャを提案する。
このフレームワークは,前処理,特徴抽出,サリエンシマップ生成,サリエンシマップの組み合わせ,後処理という5つの主要なステップから構成される。
- 参考スコア(独自算出の注目度): 9.561123408923489
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Saliency detection is one of the most challenging problems in image analysis
and computer vision. Many approaches propose different architectures based on
the psychological and biological properties of the human visual attention
system. However, there is still no abstract framework that summarizes the
existing methods. In this paper, we offered a general framework for saliency
models, which consists of five main steps: pre-processing, feature extraction,
saliency map generation, saliency map combination, and post-processing. Also,
we study different saliency models containing each level and compare their
performance. This framework helps researchers to have a comprehensive view of
studying new methods.
- Abstract(参考訳): 塩分検出は画像解析とコンピュータビジョンにおいて最も難しい問題の1つである。
多くのアプローチは、人間の視覚注意システムの心理的および生物学的特性に基づいて異なるアーキテクチャを提案する。
しかし、既存のメソッドを要約する抽象的なフレームワークはまだ存在しない。
本稿では,前処理,特徴抽出,サリエンシマップ生成,サリエンシマップの組合せ,後処理の5つの主要なステップからなる,サリエンシモデルのための一般的なフレームワークを提案する。
また,各レベルを含む相性モデルについて検討し,その性能を比較した。
このフレームワークは、研究者が新しい手法を総合的に研究するのに役立つ。
関連論文リスト
- Machine Apophenia: The Kaleidoscopic Generation of Architectural Images [11.525355831490828]
本研究では,建築設計における生成人工知能の適用について検討する。
本稿では,複数のニューラルネットワークを組み合わせて,教師なしかつ修正されていないユニークなアーキテクチャイメージのストリームを生成する手法を提案する。
論文 参考訳(メタデータ) (2024-07-12T11:11:19Z) - Masked Modeling for Self-supervised Representation Learning on Vision
and Beyond [69.64364187449773]
仮面モデリングは、トレーニング中に比例的にマスキングされる元のデータの一部を予測する、独特なアプローチとして現れてきた。
マスクモデリングにおけるテクニックの詳細については,多様なマスキング戦略,ターゲット回復,ネットワークアーキテクチャなどについて詳述する。
我々は、現在の手法の限界について議論し、マスクモデリング研究を進めるためのいくつかの道のりを指摘した。
論文 参考訳(メタデータ) (2023-12-31T12:03:21Z) - Deep Learning for Human Parsing: A Survey [54.812353922568995]
本研究では,人間の意味解析の先駆的な研究の幅広い範囲を網羅する,最先端の人間の構文解析手法の解析を行う。
1) 構造駆動型アーキテクチャは,人体の異なる部分と固有の階層構造を生かし,(2) グラフベースのネットワークは,効率的で完全な人体分析を実現するためにグローバルな情報を捉え,(3) コンテキスト認識ネットワークは,対応するクラスのピクセルを特徴付けるために,すべてのピクセルにわたって有用なコンテキストを探索し,(4) LSTMベースの手法は,短距離と長距離空間の依存関係を結合して,豊富な局所的・グローバルなコンテキストをうまく活用することができる。
論文 参考訳(メタデータ) (2023-01-29T10:54:56Z) - A Unified Framework for Attention-Based Few-Shot Object Detection [3.4874998970351427]
Few-Shot Object Detection (FSOD) はコンピュータビジョンにおいて急速に成長している分野である。
与えられたクラスの集合のすべての発生を、各クラスに対していくつかの注釈付きの例で見つけることで構成される。
論文 参考訳(メタデータ) (2022-01-06T13:35:28Z) - Distribution Alignment: A Unified Framework for Long-tail Visual
Recognition [52.36728157779307]
長尾視覚認識のための分散アライメント戦略を提案する。
次に,二段階学習における一般化された再重み付け法を導入して,事前のクラスバランスをとる。
提案手法は, 4つの認識タスクすべてにおいて, 単純で統一されたフレームワークを用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-03-30T14:09:53Z) - Recent Progress in Appearance-based Action Recognition [73.6405863243707]
アクション認識は、ビデオ内の様々な人間の行動を特定するタスクである。
最近の外見に基づく手法は、正確な行動認識に向けて有望な進歩を遂げている。
論文 参考訳(メタデータ) (2020-11-25T10:18:12Z) - Neural Entity Linking: A Survey of Models Based on Deep Learning [82.43751915717225]
本調査では,2015年以降に開発されたニューラルエンティティリンク(EL)システムの包括的記述について報告する。
その目標は、ニューラルエンティティリンクシステムの設計機能を体系化し、それらのパフォーマンスを一般的なベンチマーク上の注目すべき古典的手法と比較することである。
この調査はエンティティリンクの応用に焦点をあて、最近出現した、深い事前訓練されたマスキング言語モデルを強化するユースケースに焦点を当てている。
論文 参考訳(メタデータ) (2020-05-31T18:02:26Z) - Image Segmentation Using Deep Learning: A Survey [58.37211170954998]
イメージセグメンテーションは、画像処理とコンピュータビジョンにおいて重要なトピックである。
深層学習モデルを用いた画像セグメンテーション手法の開発を目的とした研究が,これまでに数多く行われている。
論文 参考訳(メタデータ) (2020-01-15T21:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。