論文の概要: Compressive Self-localization Using Relative Attribute Embedding
- arxiv url: http://arxiv.org/abs/2208.08863v1
- Date: Wed, 3 Aug 2022 01:42:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-08-28 22:29:46.723598
- Title: Compressive Self-localization Using Relative Attribute Embedding
- Title(参考訳): 相対属性埋め込みを用いた圧縮自己局在化
- Authors: Ryogo Yamamoto, Kanji Tanaka
- Abstract要約: 本稿では、視覚的位置認識における相対属性(例えば、美しく、安全で、便利)に基づく画像埋め込みについて述べる。
- 参考スコア(独自算出の注目度): 3.42658286826597
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The use of relative attribute (e.g., beautiful, safe, convenient) -based
image embeddings in visual place recognition, as a domain-adaptive compact
image descriptor that is orthogonal to the typical approach of absolute
attribute (e.g., color, shape, texture) -based image embeddings, is explored in
this paper.
- Abstract(参考訳): 本稿では,絶対属性(色,形状,テクスチャなど)に基づく画像埋め込みの典型的なアプローチと直交するドメイン適応コンパクト画像記述子として,視覚位置認識における相対属性(例えば,美,安全,便利)に基づく画像埋め込みの利用について検討する。
関連論文リスト
- DQE-CIR: Distinctive Query Embeddings through Learnable Attribute Weights and Target Relative Negative Sampling in Composed Image Retrieval [53.482391830683014]
合成画像検索(CIR)は、参照画像と、意図した変更を特定する修正テキストとを共同で解釈することにより、対象画像を検索するタスクに対処する。
既存のほとんどの手法は、基底の真理像を唯一の正の例として扱い、残りの全ての画像を負の例として扱う対照的な学習フレームワークの上に構築されている。
学習可能な属性重みとターゲットの相対的負サンプリングによるクエリ埋め込みを提案する。
論文 参考訳(メタデータ) (2026-03-04T13:17:44Z) - Omni-Attribute: Open-vocabulary Attribute Encoder for Visual Concept Personalization [82.31106470150844]
我々はOmni-Attributeを紹介した。Omni-Attributeは、属性固有の表現を学習するための最初のオープン語彙画像属性エンコーダである。
我々は、生成的忠実度と対照的な非絡み合いのバランスをとる、二重目的学習パラダイムを使用する。
結果として得られる埋め込みは、オープン語彙属性の検索、パーソナライゼーション、合成生成に有効である。
論文 参考訳(メタデータ) (2025-12-11T18:59:56Z) - Content-Adaptive Image Retouching Guided by Attribute-Based Text Representation [53.196155487850746]
本稿では,Attribute-based Text Representation (CA-ATP) によるコンテンツ適応型画像修正手法を提案する。
具体的には,複数のカラーマッピング関係を確立するために,一連の基底曲線を利用するコンテンツ適応型曲線マッピングモジュールを提案する。
さらに,複数の画像属性からテキスト表現を生成する属性テキスト予測モジュールを提案する。
論文 参考訳(メタデータ) (2025-12-10T12:15:50Z) - Region Feature Descriptor Adapted to High Affine Transformations [11.300618381337777]
本稿では,アフィン変換をシミュレートした領域特徴記述子を提案する。
既存の古典的記述子に比べて精度と堅牢性が高い。
論文 参考訳(メタデータ) (2024-02-15T05:33:58Z) - UMAAF: Unveiling Aesthetics via Multifarious Attributes of Images [16.647573404422175]
画像の絶対属性と相対属性の両方をモデル化する統一多属性美意識評価フレームワーク(UMAAF)を提案する。
UMAAFは、TAD66KとAVAデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-11-19T11:57:01Z) - Improving Generalization of Image Captioning with Unsupervised Prompt
Learning [63.26197177542422]
画像キャプションの一般化(GeneIC)は、アノテーション付きデータを必要とせずに、ターゲットドメインのドメイン固有のプロンプトベクトルを学習する。
GeneICは、学習済みのContrastive Language-Image Pre-Training (CLIP)モデルと視覚的および言語的モダリティを一致させる。
論文 参考訳(メタデータ) (2023-08-05T12:27:01Z) - Attribute Prototype Network for Any-Shot Learning [113.50220968583353]
属性ローカライズ機能を統合した画像表現は、任意のショット、すなわちゼロショットと少数ショットのイメージ分類タスクに有用である、と我々は主張する。
クラスレベルの属性のみを用いてグローバルな特徴とローカルな特徴を共同で学習する新しい表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-04T02:25:40Z) - Composition and Style Attributes Guided Image Aesthetic Assessment [66.60253358722538]
本稿では,画像の美学を自動予測する手法を提案する。
提案ネットワークには,意味的特徴抽出のための事前学習ネットワーク(Backbone)と,画像属性の予測にBackbone機能に依存するマルチレイヤパーセプトロン(MLP)ネットワーク(AttributeNet)が含まれる。
画像が与えられた場合、提案するマルチネットワークは、スタイルと構成属性、および美的スコア分布を予測できる。
論文 参考訳(メタデータ) (2021-11-08T17:16:38Z) - Unsupervised Domain Attention Adaptation Network for Caricature
Attribute Recognition [23.95731281719786]
キャラクチュア属性は、心理学と神経科学の研究に役立つ特徴的な顔の特徴を提供する。
注釈付き画像の量を持つ顔写真属性データセットとは異なり、似顔絵属性のアノテーションは稀である。
本稿では,画像の属性学習のための特徴属性データセットであるWebCariAを提案する。
論文 参考訳(メタデータ) (2020-07-18T06:38:45Z) - Controllable Image Synthesis via SegVAE [89.04391680233493]
セマンティックマップは条件付き画像生成の中間表現として一般的に使用される。
本研究では,所望のカテゴリからなるラベルセットを与えられたセマンティックマップの生成を特に対象とする。
提案するフレームワークSegVAEは,条件付き変分オートエンコーダを用いて,セマンティックマップを反復的に合成する。
論文 参考訳(メタデータ) (2020-07-16T15:18:53Z) - Attribute Mix: Semantic Data Augmentation for Fine Grained Recognition [102.45926816660665]
本研究では属性レベルのデータ拡張戦略であるAttribute Mixを提案する。
その原則は、属性の特徴が細粒度のサブカテゴリ間で共有され、画像間でシームレスに転送可能であることである。
論文 参考訳(メタデータ) (2020-04-06T14:06:47Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - MulGAN: Facial Attribute Editing by Exemplar [2.272764591035106]
遅延特徴空間の予め定義された領域に画像の属性関連情報をエンコードする手法では、逆の属性を持つ一対の画像を列車モデルへの入力として利用する。
それらには、3つの制限がある:(1)モデルが入力として反対の属性を持つ一対のイメージを使用して訓練されなければならない;(2)複数の属性を例によって編集する能力の弱い;(3)画像生成の質が悪い。
論文 参考訳(メタデータ) (2019-12-28T04:02:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。