論文の概要: Enabling Viewpoint Learning through Dynamic Label Generation
- arxiv url: http://arxiv.org/abs/2003.04651v2
- Date: Tue, 9 Feb 2021 14:35:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 21:39:18.905372
- Title: Enabling Viewpoint Learning through Dynamic Label Generation
- Title(参考訳): 動的ラベル生成による視点学習の実現
- Authors: Michael Schelling, Pedro Hermosilla, Pere-Pau Vazquez, Timo Ropinski
- Abstract要約: 提案手法は,異なる対象カテゴリのモデルに対する視点予測を学習するのにどう役立つかを示す。
本研究では,SOTA(State-of-the-art)の視点品質評価と比較して,予測時間が数分から1秒に短縮されることを示す。
- 参考スコア(独自算出の注目度): 10.228754362756153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Optimal viewpoint prediction is an essential task in many computer graphics
applications. Unfortunately, common viewpoint qualities suffer from two major
drawbacks: dependency on clean surface meshes, which are not always available,
and the lack of closed-form expressions, which requires a costly search
involving rendering. To overcome these limitations we propose to separate
viewpoint selection from rendering through an end-to-end learning approach,
whereby we reduce the influence of the mesh quality by predicting viewpoints
from unstructured point clouds instead of polygonal meshes. While this makes
our approach insensitive to the mesh discretization during evaluation, it only
becomes possible when resolving label ambiguities that arise in this context.
Therefore, we additionally propose to incorporate the label generation into the
training procedure, making the label decision adaptive to the current network
predictions. We show how our proposed approach allows for learning viewpoint
predictions for models from different object categories and for different
viewpoint qualities. Additionally, we show that prediction times are reduced
from several minutes to a fraction of a second, as compared to state-of-the-art
(SOTA) viewpoint quality evaluation. We will further release the code and
training data, which will to our knowledge be the biggest viewpoint quality
dataset available.
- Abstract(参考訳): 最適視点予測は、多くのコンピュータグラフィックスアプリケーションにおいて重要な課題である。
残念なことに、一般的な視点特性には、必ずしも利用できないクリーンな表面メッシュへの依存と、レンダリングを伴う高価な検索を必要とするクローズドフォーム表現の欠如という2つの大きな欠点がある。
これらの制限を克服するため,多角形メッシュの代わりに非構造化点雲から視点を予測することにより,メッシュ品質への影響を低減するために,エンドツーエンドの学習アプローチによるレンダリングから視点選択を分離することを提案する。
これにより、評価中にメッシュの離散化に敏感になるが、この文脈で発生するラベルの曖昧さを解決することでのみ可能となる。
そこで本稿では,ラベル生成をトレーニング手順に組み込むことにより,ラベル決定を現在のネットワーク予測に適応させることを提案する。
提案手法は,異なる対象カテゴリと異なる視点特性のモデルに対して,視点予測を学習することができることを示す。
さらに,SOTA(State-of-the-art)の視点品質評価と比較して,予測時間が数分から1秒に短縮されることを示す。
コードとトレーニングデータをさらにリリースし、私たちの知識が利用可能な最大の視点品質データセットになります。
関連論文リスト
- Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - Vision-language Assisted Attribute Learning [53.60196963381315]
大規模な属性ラベリングは通常不完全で部分的である。
既存の属性学習手法は、欠落したラベルを否定的な扱いをすることが多い。
利用可能な視覚言語知識を活用して、モデル学習の強化に欠落しているラベルを明確に明らかにする。
論文 参考訳(メタデータ) (2023-12-12T06:45:19Z) - Weakly Supervised Video Individual CountingWeakly Supervised Video
Individual Counting [126.75545291243142]
Video Individual Countingは、単一のビデオ内のユニークな個人数を予測することを目的としている。
トラジェクトリラベルが提供されない弱い教師付きVICタスクを導入する。
そこで我々は,ネットワークを駆動し,インフロー,アウトフロー,残りを識別するために,エンドツーエンドのトレーニング可能なソフトコントラスト損失を考案した。
論文 参考訳(メタデータ) (2023-12-10T16:12:13Z) - Credible Remote Sensing Scene Classification Using Evidential Fusion on
Aerial-Ground Dual-view Images [6.817740582240199]
マルチビュー(マルチソース、マルチモーダル、マルチパースペクティブなど)データはリモートセンシングタスクで頻繁に使用される。
データ品質の問題はさらに明確になり、マルチビューデータの潜在的なメリットが制限される。
深層学習は空中二視点リモートセンシングシーン分類の課題に導入される。
論文 参考訳(メタデータ) (2023-01-02T12:27:55Z) - Data Augmentation-free Unsupervised Learning for 3D Point Cloud
Understanding [61.30276576646909]
ソフトクラスタリング(SoftClu)と呼ばれる,移動可能な点レベルの特徴を学習するための,ポイントクラウドに対する拡張不要な教師なしアプローチを提案する。
我々は,クラスタに対するポイントのアフィリエイトをプロキシとして利用し,擬似ラベル予測タスクを通じて自己学習を可能にする。
論文 参考訳(メタデータ) (2022-10-06T10:18:16Z) - Pointly-supervised 3D Scene Parsing with Viewpoint Bottleneck [3.2790748006553643]
本稿では,ポイントワイズ・セマンティック・アノテーションが高価であることを考えると,極端にスパースなラベルを持つモデルを学ぶことの難しさに対処する。
本稿では,視点ボトルネックという自己監督型3次元表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-17T13:54:20Z) - Unsupervised Representation Learning from Pathology Images with
Multi-directional Contrastive Predictive Coding [0.33148826359547523]
本稿では,デジタル病理パッチを用いたcpcフレームワークの修正について述べる。
これは潜在コンテキストを構築するための代替マスクを導入することで実現される。
提案法は, 組織学的パッチの深部分類を改良できることを示す。
論文 参考訳(メタデータ) (2021-05-11T21:17:13Z) - Weak Multi-View Supervision for Surface Mapping Estimation [0.9367260794056769]
密接なアノテーションを使わずにカテゴリ別表面マッピングを学習する,弱監督型マルチビュー学習手法を提案する。
人間の顔、車、飛行機といった一般的なカテゴリの基盤となる表面形状を、それらのカテゴリの例から学習する。
論文 参考訳(メタデータ) (2021-05-04T09:46:26Z) - Distribution Alignment: A Unified Framework for Long-tail Visual
Recognition [52.36728157779307]
長尾視覚認識のための分散アライメント戦略を提案する。
次に,二段階学習における一般化された再重み付け法を導入して,事前のクラスバランスをとる。
提案手法は, 4つの認識タスクすべてにおいて, 単純で統一されたフレームワークを用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-03-30T14:09:53Z) - Data Augmentation for Object Detection via Differentiable Neural
Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。
この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。
オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文 参考訳(メタデータ) (2021-03-04T06:31:06Z) - A Weakly-Supervised Semantic Segmentation Approach based on the Centroid
Loss: Application to Quality Control and Inspection [6.101839518775968]
本稿では,新しい損失関数を用いた弱教師付きセマンティックセマンティックセマンティクス手法の提案と評価を行う。
アプローチのパフォーマンスは,2つの業界関連ケーススタディのデータセットに対して評価される。
論文 参考訳(メタデータ) (2020-10-26T09:08:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。