論文の概要: Cross-domain Variational Capsules for Information Extraction
- arxiv url: http://arxiv.org/abs/2210.09053v1
- Date: Thu, 13 Oct 2022 20:04:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 16:19:52.777897
- Title: Cross-domain Variational Capsules for Information Extraction
- Title(参考訳): 情報抽出のためのクロスドメイン変動カプセル
- Authors: Akash Nagaraj, Akhil K, Akshay Venkatesh, Srikanth HR
- Abstract要約: その意図は、データの顕著な特徴を特定し、この識別メカニズムを使用して、他の目に見えない領域のデータからインサイトを自動的に生成することであった。
可変オートエンコーダ(VAE)とカプセルネットワークを組み合わせた情報抽出アルゴリズムを提案する。
さまざまなドメインに属する画像の可視性を含むデータセットの数が減少していることに気付き、マルチドメイン画像特徴データセットが作成され、公開されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a characteristic extraction algorithm and the
Multi-domain Image Characteristics Dataset of characteristic-tagged images to
simulate the way a human brain classifies cross-domain information and
generates insight. The intent was to identify prominent characteristics in data
and use this identification mechanism to auto-generate insight from data in
other unseen domains. An information extraction algorithm is proposed which is
a combination of Variational Autoencoders (VAEs) and Capsule Networks. Capsule
Networks are used to decompose images into their individual features and VAEs
are used to explore variations on these decomposed features. Thus, making the
model robust in recognizing characteristics from variations of the data. A
noteworthy point is that the algorithm uses efficient hierarchical decoding of
data which helps in richer output interpretation. Noticing a dearth in the
number of datasets that contain visible characteristics in images belonging to
various domains, the Multi-domain Image Characteristics Dataset was created and
made publicly available. It consists of thousands of images across three
domains. This dataset was created with the intent of introducing a new
benchmark for fine-grained characteristic recognition tasks in the future.
- Abstract(参考訳): 本稿では,特徴抽出アルゴリズムと特徴タグ付き画像のマルチドメイン画像特徴データセットを用いて,人間の脳がクロスドメイン情報を分類し,洞察を生成する方法をシミュレートする。
その意図は、データの顕著な特徴を特定し、この識別メカニズムを使用して、他の見えない領域のデータから洞察を自動的に生成することであった。
可変オートエンコーダ(VAE)とカプセルネットワークを組み合わせた情報抽出アルゴリズムを提案する。
カプセルネットワークはイメージを個々の特徴に分解するために使用され、VAEはこれらの特徴を分解するために使用される。
したがって、モデルがデータのバリエーションから特徴を認識するのに堅牢になる。
注目すべき点は、このアルゴリズムがよりリッチな出力解釈に役立つ効率的なデータの階層的デコードを使っていることである。
さまざまなドメインに属する画像の可視的特徴を含むデータセット数の減少に気付き、マルチドメイン画像特徴データセットが作成され、公開されている。
3つのドメインにまたがる何千ものイメージで構成されている。
このデータセットは、将来、きめ細かい特徴認識タスクのための新しいベンチマークを導入することを意図して作成された。
関連論文リスト
- Pre-processing and Compression: Understanding Hidden Representation Refinement Across Imaging Domains via Intrinsic Dimension [1.7495213911983414]
医用画像モデルは,ネットワークの早期に表現IDがピークとなることを示す。
また、このピーク表現IDと入力空間内のデータのIDとの強い相関関係も見出す。
論文 参考訳(メタデータ) (2024-08-15T18:54:31Z) - Language Guided Domain Generalized Medical Image Segmentation [68.93124785575739]
単一ソースドメインの一般化は、より信頼性が高く一貫性のあるイメージセグメンテーションを現実の臨床環境にわたって約束する。
本稿では,テキストエンコーダ機能によって案内されるコントラスト学習機構を組み込むことで,テキスト情報を明確に活用する手法を提案する。
文献における既存手法に対して,本手法は良好な性能を発揮する。
論文 参考訳(メタデータ) (2024-04-01T17:48:15Z) - Attribute-Aware Deep Hashing with Self-Consistency for Large-Scale
Fine-Grained Image Retrieval [65.43522019468976]
本稿では属性認識ハッシュコードを生成するための自己整合性を持つ属性認識ハッシュネットワークを提案する。
本研究では,高レベル属性固有ベクトルを教師なしで蒸留する再構成タスクのエンコーダ・デコーダ構造ネットワークを開発する。
我々のモデルは,これらの属性ベクトルに特徴デコリレーション制約を設けて,それらの代表的能力を強化する。
論文 参考訳(メタデータ) (2023-11-21T08:20:38Z) - Attributes Grouping and Mining Hashing for Fine-Grained Image Retrieval [24.8065557159198]
微粒な画像検索のための属性グループとマイニングハッシュ(AGMH)を提案する。
AGMHはカテゴリ固有の視覚属性を複数の記述子にグループ化し、包括的特徴表現を生成する。
AGMHは、きめ細かいベンチマークデータセットの最先端メソッドに対して、一貫して最高のパフォーマンスを得る。
論文 参考訳(メタデータ) (2023-11-10T14:01:56Z) - Learning Structured Output Representations from Attributes using Deep
Conditional Generative Models [0.0]
本稿では,条件付き変分オートエンコーダアーキテクチャを再現し,属性を条件付き画像でトレーニングする。
毛髪の色や眼鏡などの特徴の異なる新しい顔と、異なる鳥類種のサンプルを創り出そうとする。
論文 参考訳(メタデータ) (2023-04-30T17:25:31Z) - Multiscale Analysis for Improving Texture Classification [62.226224120400026]
本稿では,テクスチャの異なる空間周波数帯域を別々に扱うために,ガウス・ラプラシアピラミッドを用いる。
バイオインスパイアされたテクスチャ記述子,情報理論測度,灰色レベルの共起行列特徴,ハリリック統計特徴から抽出した特徴を特徴ベクトルに集約した。
論文 参考訳(メタデータ) (2022-04-21T01:32:22Z) - Disentangled Unsupervised Image Translation via Restricted Information
Flow [61.44666983942965]
多くの最先端のメソッドは、所望の共有vs固有の分割をアーキテクチャにハードコードする。
帰納的アーキテクチャバイアスに依存しない新しい手法を提案する。
提案手法は,2つの合成データセットと1つの自然なデータセットに対して一貫した高い操作精度を実現する。
論文 参考訳(メタデータ) (2021-11-26T00:27:54Z) - Domain Adaptation for Learning Generator from Paired Few-Shot Data [72.04430033118426]
十分なソースデータと少数のターゲットデータを持つジェネレータを学習するためのペアドフェーショットGAN(PFS-GAN)モデルを提案する。
提案手法は,複数のベースラインと比較して,より多様性の高い生成対象ドメインデータに対して,定量的,定性的な結果が得られる。
論文 参考訳(メタデータ) (2021-02-25T10:11:44Z) - DoFE: Domain-oriented Feature Embedding for Generalizable Fundus Image
Segmentation on Unseen Datasets [96.92018649136217]
対象ドメインに対するCNNの一般化能力を向上させるために,新しいドメイン指向特徴埋め込み(DoFE)フレームワークを提案する。
私たちのDoFEフレームワークは、マルチソースドメインから学んだ追加のドメイン事前知識で、画像機能を動的に強化します。
本フレームワークは、未確認データセットのセグメンテーション結果を満足して生成し、他の領域の一般化やネットワークの正規化手法を超越する。
論文 参考訳(メタデータ) (2020-10-13T07:28:39Z) - Sparse data to structured imageset transformation [0.0]
スパースデータセットを含む機械学習の問題は、サンプルと特徴の数が非常に大きい場合、畳み込みニューラルネットワークの使用の恩恵を受ける可能性がある。
このようなデータセットをイメージセットに変換し、畳み込みニューラルネットワークで使用可能な各イメージ構造を与えようとする。
論文 参考訳(メタデータ) (2020-05-07T20:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。