論文の概要: Hyperbolic Deep Learning in Computer Vision: A Survey
- arxiv url: http://arxiv.org/abs/2305.06611v1
- Date: Thu, 11 May 2023 07:14:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-12 15:37:41.535087
- Title: Hyperbolic Deep Learning in Computer Vision: A Survey
- Title(参考訳): コンピュータビジョンにおける双曲的深層学習 : サーベイ
- Authors: Pascal Mettes, Mina Ghadimi Atigh, Martin Keller-Ressel, Jeffrey Gu,
Serena Yeung
- Abstract要約: 双曲空間は コンピュータビジョンの学習で 急速に勢いを増しています
コンピュータビジョンのための双曲学習に関する現在の文献の分類と詳細な概要を提供する。
我々は,すべてのテーマにおいて双曲学習がどのように実行されるのかを概説し,コンピュータビジョンにおける双曲学習の現在の進歩の恩恵を受ける主要な研究課題について論じる。
- 参考スコア(独自算出の注目度): 20.811974050049365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep representation learning is a ubiquitous part of modern computer vision.
While Euclidean space has been the de facto standard manifold for learning
visual representations, hyperbolic space has recently gained rapid traction for
learning in computer vision. Specifically, hyperbolic learning has shown a
strong potential to embed hierarchical structures, learn from limited samples,
quantify uncertainty, add robustness, limit error severity, and more. In this
paper, we provide a categorization and in-depth overview of current literature
on hyperbolic learning for computer vision. We research both supervised and
unsupervised literature and identify three main research themes in each
direction. We outline how hyperbolic learning is performed in all themes and
discuss the main research problems that benefit from current advances in
hyperbolic learning for computer vision. Moreover, we provide a high-level
intuition behind hyperbolic geometry and outline open research questions to
further advance research in this direction.
- Abstract(参考訳): 深層表現学習は現代のコンピュータビジョンのユビキタスな部分である。
ユークリッド空間は視覚表現を学ぶためのデファクト標準多様体である一方、双曲空間はコンピュータビジョンの学習において急速に牽引されている。
具体的には、双曲学習は階層構造を埋め込んだり、限られたサンプルから学習したり、不確実性を定量化したり、堅牢性を追加したり、エラーの深刻度を制限したりする強力な可能性を示している。
本稿では,コンピュータビジョンのための双曲学習に関する現在の文献の分類と概要について述べる。
我々は,教師付き文献と教師なし文献の両方を調査し,各方面の3つの研究テーマを特定した。
我々は,すべてのテーマにおいて双曲学習がどのように行われているかを概説し,コンピュータビジョンにおける双曲学習の進歩から得られる主な研究課題について論じる。
さらに,双曲幾何学の背景にある高次直観を提供し,この方向の研究を進めるためにオープンリサーチの課題を概説する。
関連論文リスト
- Integration and Performance Analysis of Artificial Intelligence and
Computer Vision Based on Deep Learning Algorithms [5.734290974917728]
本稿では,ディープラーニングとコンピュータビジョン技術の統合による応用効果の分析に焦点をあてる。
ディープラーニングは階層型ニューラルネットワークを構築することで歴史的なブレークスルーを実現し、エンドツーエンドの機能学習と画像の意味的理解を可能にする。
コンピュータビジョンの分野で成功した経験は、ディープラーニングアルゴリズムのトレーニングに強力なサポートを提供する。
論文 参考訳(メタデータ) (2023-12-20T09:37:06Z) - Deep Learning to See: Towards New Foundations of Computer Vision [88.69805848302266]
この本はコンピュータビジョンの分野における科学的進歩を批判している。
情報に基づく自然法則の枠組みにおける視覚の研究を提案する。
論文 参考訳(メタデータ) (2022-06-30T15:20:36Z) - Neural Fields in Visual Computing and Beyond [54.950885364735804]
機械学習の最近の進歩は、座標ベースニューラルネットワークを用いた視覚コンピューティング問題の解決への関心が高まっている。
ニューラルネットワークは、3D形状と画像の合成、人体のアニメーション、3D再構成、ポーズ推定に成功している。
本報告は、文脈、数学的基礎、および、ニューラルネットワークに関する文献の広範なレビューを提供する。
論文 参考訳(メタデータ) (2021-11-22T18:57:51Z) - Deep Reinforcement Learning in Computer Vision: A Comprehensive Survey [29.309914600633032]
ディープ強化学習は強化学習フレームワークを強化し、ディープニューラルネットワークの強力な表現を活用する。
近年の研究では、ファイナンス、医療、医療、ビデオゲーム、ロボティクス、コンピュータビジョンなど様々な分野で、深い強化学習が顕著に成功している。
論文 参考訳(メタデータ) (2021-08-25T23:01:48Z) - Threat of Adversarial Attacks on Deep Learning in Computer Vision:
Survey II [86.51135909513047]
ディープラーニングは、予測を操作できる敵攻撃に対して脆弱である。
本稿では,ディープラーニングに対する敵対的攻撃におけるコンピュータビジョンコミュニティの貢献を概観する。
この領域では、非専門家に技術的な用語の定義を提供する。
論文 参考訳(メタデータ) (2021-08-01T08:54:47Z) - Tensor Methods in Computer Vision and Deep Learning [120.3881619902096]
テンソル(tensor)は、複数の次元の視覚データを自然に表現できるデータ構造である。
コンピュータビジョンにおけるディープラーニングパラダイムシフトの出現により、テンソルはさらに基本的なものになっている。
本稿では,表現学習と深層学習の文脈において,テンソルとテンソル法を深く,実践的に検討する。
論文 参考訳(メタデータ) (2021-07-07T18:42:45Z) - Deep Learning for Embodied Vision Navigation: A Survey [108.13766213265069]
身体的視覚ナビゲーション」問題では、エージェントが3D環境をナビゲートする必要がある。
本稿では、総合的な文献調査を提供することで、視覚ナビゲーションの具体的分野における現在の研究の概要を確立することを試みる。
論文 参考訳(メタデータ) (2021-07-07T12:09:04Z) - Hyperbolic Deep Neural Networks: A Survey [31.04110049167551]
本論文では,このモデルを双曲型ディープニューラルネットワークと呼んでいる。
本論文では,ハイパーボリック深層ニューラルネットワークの構築における神経成分に関する文献の一貫性と総合的検討について述べる。
論文 参考訳(メタデータ) (2021-01-12T15:55:16Z) - Learning Depth With Very Sparse Supervision [57.911425589947314]
本稿では, 環境との相互作用を通じて, 知覚が世界の3次元特性と結合するという考えを考察する。
我々は、環境と対話するロボットが利用できるような、特殊なグローバルローカルネットワークアーキテクチャを訓練する。
いくつかのデータセットの実験では、画像ピクセルの1つでも基底真理が利用できる場合、提案されたネットワークは、最先端のアプローチよりも22.5%の精度でモノクロの深度推定を学習できることを示している。
論文 参考訳(メタデータ) (2020-03-02T10:44:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。