論文の概要: Semi-supervised Viewpoint Estimation with Geometry-aware Conditional
Generation
- arxiv url: http://arxiv.org/abs/2104.01103v1
- Date: Fri, 2 Apr 2021 15:55:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 13:46:45.422280
- Title: Semi-supervised Viewpoint Estimation with Geometry-aware Conditional
Generation
- Title(参考訳): 幾何認識条件生成を用いた半教師付き視点推定
- Authors: Octave Mariotti, Hakan Bilen
- Abstract要約: 本稿では,ラベルなし画像ペアから視点情報を推測できる半教師あり視点推定法を提案する。
本手法は、第1画像からの出現と第2画像からの視点を組み合わせて第2画像の合成を学習する。
- 参考スコア(独自算出の注目度): 30.83924581439373
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: There is a growing interest in developing computer vision methods that can
learn from limited supervision. In this paper, we consider the problem of
learning to predict camera viewpoints, where obtaining ground-truth annotations
are expensive and require special equipment, from a limited number of labeled
images. We propose a semi-supervised viewpoint estimation method that can learn
to infer viewpoint information from unlabeled image pairs, where two images
differ by a viewpoint change. In particular our method learns to synthesize the
second image by combining the appearance from the first one and viewpoint from
the second one. We demonstrate that our method significantly improves the
supervised techniques, especially in the low-label regime and outperforms the
state-of-the-art semi-supervised methods.
- Abstract(参考訳): 限られた監督から学ぶことができるコンピュータビジョンの手法の開発への関心が高まっている。
本稿では,限定されたラベル付き画像から地平線アノテーションの取得が高価であり,特別な装置を必要とするカメラ視点の学習の課題について考察する。
本稿では,2つの画像が視点変化によって異なる未ラベル画像対から視点情報を推測する半教師付き視点推定法を提案する。
特に,第1画像からの出現と第2画像からの視点を組み合わせることにより,第2画像の合成を学習する。
提案手法は,特に低ラベル法において教師あり手法を著しく改善し,最先端の半教師あり手法よりも優れていることを示す。
関連論文リスト
- Dual-Image Enhanced CLIP for Zero-Shot Anomaly Detection [58.228940066769596]
本稿では,統合視覚言語スコアリングシステムを活用したデュアルイメージ強化CLIP手法を提案する。
提案手法は,画像のペアを処理し,それぞれを視覚的参照として利用することにより,視覚的コンテキストによる推論プロセスを強化する。
提案手法は視覚言語による関節異常検出の可能性を大幅に活用し,従来のSOTA法と同等の性能を示す。
論文 参考訳(メタデータ) (2024-05-08T03:13:20Z) - Two Tricks to Improve Unsupervised Segmentation Learning [37.63303434543399]
教師なしセグメンテーション学習のための2つの実践的改善手法を提案する。
まず、誘導フィルタリングなどの画像後処理技術を利用して出力マスクを洗練する。
第2に,教師-学生養成方式に基づくマルチスケールの一貫性基準を導入する。
論文 参考訳(メタデータ) (2024-04-04T11:49:56Z) - Towards Few-Annotation Learning in Computer Vision: Application to Image
Classification and Object Detection tasks [3.5353632767823506]
本論文では,限定ラベルを用いた機械学習の理論的,アルゴリズム的,実験的貢献について述べる。
最初のコントリビューションでは、Few-Shot分類で使われる人気のあるメタラーニングアルゴリズムの理論と実践のギャップを埋めることに興味がある。
トランスフォーマーアーキテクチャに基づくオブジェクト検出器のトレーニングにおいて,ラベルのないデータを活用するために,教師なし事前学習と半教師付き学習の両方を提案する。
論文 参考訳(メタデータ) (2023-11-08T18:50:04Z) - Free-ATM: Exploring Unsupervised Learning on Diffusion-Generated Images
with Free Attention Masks [64.67735676127208]
テキストと画像の拡散モデルは、画像認識の恩恵を受ける大きな可能性を示している。
有望ではあるが、拡散生成画像の教師なし学習に特化した調査は不十分である。
上記フリーアテンションマスクをフル活用することで、カスタマイズされたソリューションを導入する。
論文 参考訳(メタデータ) (2023-08-13T10:07:46Z) - Learning to search for and detect objects in foveal images using deep
learning [3.655021726150368]
本研究では,画像中のクラスを探索する人間の客観的な注意をエミュレートする固定予測モデルを用いる。
そして、各固定点のフェーブされた画像を分類して、シーンにターゲットが存在するか否かを判定する。
本稿では,2つのタスク間の知識伝達を可能とし,修正予測と検出を同時に行うことができる新しいデュアルタスクモデルを提案する。
論文 参考訳(メタデータ) (2023-04-12T09:50:25Z) - Active Gaze Control for Foveal Scene Exploration [124.11737060344052]
本研究では,葉型カメラを用いた人間とロボットが現場を探索する方法をエミュレートする手法を提案する。
提案手法は,同数の視線シフトに対してF1スコアを2~3ポイント増加させる。
論文 参考訳(メタデータ) (2022-08-24T14:59:28Z) - Stain based contrastive co-training for histopathological image analysis [61.87751502143719]
本稿では,ヒストリボリューション画像の分類のための,新しい半教師付き学習手法を提案する。
我々は、半教師付き学習フレームワークを作成するために、パッチレベルのアノテーションと、新しいコトレーニング損失を併用した強力な監視を採用する。
透明細胞腎細胞および前立腺癌に対するアプローチを評価し,最先端の半教師あり学習法の改善を実証した。
論文 参考訳(メタデータ) (2022-06-24T22:25:31Z) - Self-supervised Contrastive Learning of Multi-view Facial Expressions [9.949781365631557]
顔表情認識(FER)は,人間とコンピュータのインタラクションシステムにおいて重要な構成要素である。
本稿では,多視点表情のコントラスト学習(CL-MEx)を提案する。
論文 参考訳(メタデータ) (2021-08-15T11:23:34Z) - Unsupervised Deep Metric Learning with Transformed Attention Consistency
and Contrastive Clustering Loss [28.17607283348278]
教師なしのメートル法学習のための既存のアプローチは、入力画像自体の自己超越情報を探索することに焦点を当てている。
我々は、画像を分析する際、人間の目は個々の画像を調べるのではなく、互いに画像を比較することが多いことを観察した。
本研究では,画像間の自己超越情報に基づいてネットワークを学習する,教師なし深度学習のための新しいアプローチを開発する。
論文 参考訳(メタデータ) (2020-08-10T19:33:47Z) - Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the
Wild [101.70320427145388]
本稿では、3Dアノテーションを必要としない弱教師付きアプローチを提案し、ラベルのないマルチビューデータから3Dポーズを推定する。
提案手法を2つの大規模データセット上で評価する。
論文 参考訳(メタデータ) (2020-03-17T08:47:16Z) - Semi-Supervised StyleGAN for Disentanglement Learning [79.01988132442064]
現在の解離法は、いくつかの固有の制限に直面している。
半教師付き高分解能ディスタングル学習のためのStyleGANに基づく新しいアーキテクチャと損失関数を設計する。
論文 参考訳(メタデータ) (2020-03-06T22:54:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。