論文の概要: Recent Advances of Local Mechanisms in Computer Vision: A Survey and
Outlook of Recent Work
- arxiv url: http://arxiv.org/abs/2306.01929v1
- Date: Fri, 2 Jun 2023 22:05:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-06 21:23:02.362498
- Title: Recent Advances of Local Mechanisms in Computer Vision: A Survey and
Outlook of Recent Work
- Title(参考訳): コンピュータビジョンにおける局所的メカニズムの最近の進歩:最近の研究動向と展望
- Authors: Qiangchang Wang, Yilong Yin
- Abstract要約: ローカルメカニズムはコンピュータビジョンの開発を促進するように設計されている。
識別的局所表現を学習するために対象部品に焦点を合わせるだけでなく、効率を向上させるために選択的に情報を処理することができる。
本稿では,様々なコンピュータビジョンタスクやアプローチの局所的なメカニズムを体系的に検討する。
- 参考スコア(独自算出の注目度): 48.69845068325126
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Inspired by the fact that human brains can emphasize discriminative parts of
the input and suppress irrelevant ones, substantial local mechanisms have been
designed to boost the development of computer vision. They can not only focus
on target parts to learn discriminative local representations, but also process
information selectively to improve the efficiency. In terms of application
scenarios and paradigms, local mechanisms have different characteristics. In
this survey, we provide a systematic review of local mechanisms for various
computer vision tasks and approaches, including fine-grained visual
recognition, person re-identification, few-/zero-shot learning, multi-modal
learning, self-supervised learning, Vision Transformers, and so on.
Categorization of local mechanisms in each field is summarized. Then,
advantages and disadvantages for every category are analyzed deeply, leaving
room for exploration. Finally, future research directions about local
mechanisms have also been discussed that may benefit future works. To the best
our knowledge, this is the first survey about local mechanisms on computer
vision. We hope that this survey can shed light on future research in the
computer vision field.
- Abstract(参考訳): 人間の脳は入力の識別的部分を強調し、無関係な部分を抑制することができるという事実に触発され、コンピュータビジョンの開発を促進するために重要な局所的なメカニズムが設計されている。
識別的局所表現を学習するために対象部品に焦点を合わせるだけでなく、効率を向上させるために選択的に情報を処理することができる。
アプリケーションシナリオとパラダイムの観点では、ローカルメカニズムには異なる特性があります。
本研究では,視覚の微粒化,人物の再識別,少数/ゼロショット学習,マルチモーダル学習,自己教師型学習,ビジョントランスフォーマーなど,様々なコンピュータビジョンタスクやアプローチの局所的なメカニズムを体系的に検討する。
各分野における局所メカニズムの分類を要約する。
そして、各カテゴリーの利点と欠点を深く分析し、探索の余地を残します。
最後に、今後の研究に役立つであろう局所的なメカニズムに関する今後の研究方向についても議論されている。
私たちの知る限りでは、コンピュータビジョンのローカルメカニズムに関する最初の調査である。
この調査が将来のコンピュータビジョン分野の研究に光を当てることを願っている。
関連論文リスト
- Exploring Emerging Trends and Research Opportunities in Visual Place Recognition [28.76562316749074]
視覚に基づく認識は、コンピュータビジョンとロボティクスのコミュニティにおける長年の課題である。
ほとんどのローカライズ実装では、視覚的位置認識が不可欠である。
研究者は最近、視覚言語モデルに注意を向けている。
論文 参考訳(メタデータ) (2024-11-18T11:36:17Z) - Fairness and Bias Mitigation in Computer Vision: A Survey [61.01658257223365]
コンピュータビジョンシステムは、高精細な現実世界のアプリケーションにますますデプロイされている。
歴史的または人為的なデータにおいて差別的な傾向を伝播または増幅しないことを確実にする必要がある。
本稿では,コンピュータビジョンの文脈における現在進行中の傾向と成功をまとめた,公平性に関する総合的な調査を行う。
論文 参考訳(メタデータ) (2024-08-05T13:44:22Z) - Learning Where to Look: Self-supervised Viewpoint Selection for Active Localization using Geometrical Information [68.10033984296247]
本稿では, 位置決めの精度を高めるために, 視点選択の重要性を強調し, アクティブな位置決め領域について検討する。
私たちのコントリビューションは、リアルタイム操作用に設計されたシンプルなアーキテクチャ、自己教師付きデータトレーニング方法、および実世界のロボティクスアプリケーションに適した計画フレームワークにマップを一貫して統合する能力による、データ駆動型アプローチの使用に関するものです。
論文 参考訳(メタデータ) (2024-07-22T12:32:09Z) - Enhancing Efficiency in Vision Transformer Networks: Design Techniques and Insights [5.798431829723857]
本稿では、視覚変換器(ViT)ネットワークにおける注意機構の設計手法と洞察を包括的に探求する。
再設計したアプローチを応用した,ViT内の様々な注意機構の系統分類法を提案する。
この分析には、新規性、強み、弱み、そして提案された様々な戦略の詳細な評価が含まれる。
論文 参考訳(メタデータ) (2024-03-28T23:31:59Z) - Machine Unlearning: A Survey [56.79152190680552]
プライバシ、ユーザビリティ、および/または忘れられる権利のために、特定のサンプルに関する情報をマシンアンラーニングと呼ばれるモデルから削除する必要がある特別なニーズが生まれている。
この新興技術は、その革新と実用性により、学者と産業の両方から大きな関心を集めている。
この複雑なトピックを分析したり、さまざまなシナリオで既存の未学習ソリューションの実現可能性を比較したりした研究はない。
この調査は、未学習のテクニックに関する卓越した問題と、新しい研究機会のための実現可能な方向性を強調して締めくくった。
論文 参考訳(メタデータ) (2023-06-06T10:18:36Z) - Attention Mechanisms in Computer Vision: A Survey [75.6074182122423]
本稿では,コンピュータビジョンにおける様々な注意機構について概観する。
チャネルアテンション,空間アテンション,時間アテンション,分岐アテンションなど,アプローチによって分類する。
我々は注意機構研究の今後の方向性を提案する。
論文 参考訳(メタデータ) (2021-11-15T09:18:40Z) - Attention mechanisms and deep learning for machine vision: A survey of
the state of the art [0.0]
ビジョントランスフォーマー(ViT)は、確立されたディープラーニングベースのマシンビジョン技術にかなり挑戦している。
いくつかの最近の研究は、これらの2つの異なるフィールドの組み合わせが、両方のフィールドの利点を持つシステムを構築することを証明することを示唆している。
論文 参考訳(メタデータ) (2021-06-03T10:23:32Z) - Counterfactual Explanations for Machine Learning: A Review [5.908471365011942]
機械学習における対実的説明に関する研究をレビューし、分類する。
機械学習における対実的説明可能性に対する現代のアプローチは、多くの国で確立された法的教義と結びついている。
論文 参考訳(メタデータ) (2020-10-20T20:08:42Z) - A Survey on Deep Learning for Localization and Mapping: Towards the Age
of Spatial Machine Intelligence [48.67755344239951]
包括的調査を行い、深層学習を用いた局所化とマッピングのための新しい分類法を提案する。
オードメトリ推定、マッピング、グローバルローカライゼーション、同時ローカライゼーション、マッピングなど、幅広いトピックがカバーされている。
この研究がロボティクス、コンピュータビジョン、機械学習コミュニティの新たな成果を結び付けることを願っている。
論文 参考訳(メタデータ) (2020-06-22T19:01:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。