論文の概要: Semi-supervised Classification using Attention-based Regularization on
Coarse-resolution Data
- arxiv url: http://arxiv.org/abs/2001.00994v1
- Date: Fri, 3 Jan 2020 21:29:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 17:17:13.817347
- Title: Semi-supervised Classification using Attention-based Regularization on
Coarse-resolution Data
- Title(参考訳): 粗分解能データに対する注意に基づく正規化を用いた半教師付き分類
- Authors: Guruprasad Nayak, Rahul Ghosh, Xiaowei Jia, Varun Mithal, Vipin Kumar
- Abstract要約: 粗い分解能の監督を利用して、より微細な分解能のモデルを訓練するための分類アルゴリズムを提案する。
異なる解像度は、マルチビューフレームワークでデータの異なるビューとしてモデル化されます。
テキストデータを用いた衛星観測と感情分類を用いた都市域マッピングの現実的適用実験により,提案手法の有効性が示された。
- 参考スコア(独自算出の注目度): 6.4466362693513055
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real-world phenomena are observed at multiple resolutions. Predictive
models designed to predict these phenomena typically consider different
resolutions separately. This approach might be limiting in applications where
predictions are desired at fine resolutions but available training data is
scarce. In this paper, we propose classification algorithms that leverage
supervision from coarser resolutions to help train models on finer resolutions.
The different resolutions are modeled as different views of the data in a
multi-view framework that exploits the complementarity of features across
different views to improve models on both views. Unlike traditional multi-view
learning problems, the key challenge in our case is that there is no one-to-one
correspondence between instances across different views in our case, which
requires explicit modeling of the correspondence of instances across
resolutions. We propose to use the features of instances at different
resolutions to learn the correspondence between instances across resolutions
using an attention mechanism.Experiments on the real-world application of
mapping urban areas using satellite observations and sentiment classification
on text data show the effectiveness of the proposed methods.
- Abstract(参考訳): 多くの実世界の現象は多重解像度で観測される。
これらの現象を予測するために設計された予測モデルは、通常異なる分解能を別々に考慮する。
このアプローチは、ファインレゾリューションで予測を希望するが、利用可能なトレーニングデータが少ないアプリケーションで制限される可能性がある。
本稿では,より細かい解像度のモデル学習を支援するために,粗い解像度からの監督を活用する分類アルゴリズムを提案する。
異なる解像度は、異なるビュー間の機能の相補性を利用して両方のビューのモデルを改善するマルチビューフレームワークにおけるデータの異なるビューとしてモデル化される。
従来の多視点学習問題とは異なり、我々の場合において重要な課題は、異なるビューにまたがるインスタンス間の一対一対応が存在しないことである。
注意機構を用いて,異なる解像度でインスタンスの特徴を学習し,各解像度のインスタンス間の対応を学習することを提案する。衛星観測とテキストデータに対する感情分類を用いた都市地図作成の実世界応用実験は,提案手法の有効性を示す。
関連論文リスト
- Cross-Domain Knowledge Distillation for Low-Resolution Human Pose Estimation [31.970739018426645]
人間のポーズ推定の実践的応用では、低解像度の入力が頻繁に発生し、既存の最先端モデルでは低解像度の画像では不十分である。
本研究は,高分解能モデルから知識を抽出することにより,低分解能モデルの性能向上に重点を置いている。
論文 参考訳(メタデータ) (2024-05-19T04:57:17Z) - Learning Resolution-Adaptive Representations for Cross-Resolution Person
Re-Identification [49.57112924976762]
低解像度(LR)クエリIDイメージと高解像度(HR)ギャラリーイメージとの整合性を実現する。
実際のカメラとの違いにより、クエリ画像が分解能の低下に悩まされることがしばしばあるため、これは困難かつ実用的な問題である。
本稿では,問合せ画像の解像度に適応する動的計量を用いて,HRとLRの画像を直接比較するためのSRフリーなパラダイムについて検討する。
論文 参考訳(メタデータ) (2022-07-09T03:49:51Z) - Switchable Representation Learning Framework with Self-compatibility [50.48336074436792]
自己整合性(SFSC)を考慮した交換可能な表現学習フレームワークを提案する。
SFSCは1つのトレーニングプロセスを通じて、異なる能力を持つ一連の互換性のあるサブモデルを生成する。
SFSCは評価データセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-06-16T16:46:32Z) - Discriminative Multimodal Learning via Conditional Priors in Generative
Models [21.166519800652047]
本研究は,モデルトレーニングにおいて,すべてのモダリティとクラスラベルが利用できる現実的なシナリオについて研究する。
このシナリオでは、変動的な下界境界は、結合表現と欠測モダリティの間の相互情報を制限する。
論文 参考訳(メタデータ) (2021-10-09T17:22:24Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - Scale-Localized Abstract Reasoning [79.00011351374869]
本稿では,インテリジェンステストとしてよく用いられる抽象的関係推論タスクについて考察する。
いくつかのパターンは空間的有理性を持っているが、他のパターンは意味論に過ぎないため、各クエリを複数の解像度で処理するマルチスケールアーキテクチャを提案する。
異なる解法によって実際に異なるルールが解かれることを示し、組み合わせたマルチスケールアプローチは、全てのベンチマークにおいて、このタスクにおける既存の技術の状態を5~54%上回っていることを示す。
論文 参考訳(メタデータ) (2020-09-20T10:37:29Z) - Unified Representation Learning for Cross Model Compatibility [19.808287296481208]
視覚検索アプリケーションのコンテキストにおけるクロスモデル適合性問題に対処する統一表現学習フレームワークを提案する。
異なる埋め込みモデル間の相互互換性により、視覚検索システムは、ユーザイメージを再エンコードすることなく、アイデンティティを正しく認識し、検索することができる。
論文 参考訳(メタデータ) (2020-08-11T16:14:53Z) - Variational Inference for Deep Probabilistic Canonical Correlation
Analysis [49.36636239154184]
線形多視点層と深層生成ネットワークを観測モデルとして構成した深部確率的多視点モデルを提案する。
潜在確率多視点層の後方分布を近似した効率的な変分推論法を開発した。
任意の数のビューを持つモデルへの一般化も提案されている。
論文 参考訳(メタデータ) (2020-03-09T17:51:15Z) - Cross-Resolution Adversarial Dual Network for Person Re-Identification
and Beyond [59.149653740463435]
人物再識別(re-ID)は、同一人物の画像をカメラビューでマッチングすることを目的としている。
カメラと関心のある人の距離が異なるため、解像度ミスマッチが期待できる。
本稿では,クロスレゾリューションな人物のリIDに対処する新たな生成的対向ネットワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T07:21:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。