Fugu-MT 論文翻訳(概要): Iterative collaborative routing among equivariant capsules for transformation-robust capsule networks

論文の概要: Iterative collaborative routing among equivariant capsules for transformation-robust capsule networks

arxiv url: http://arxiv.org/abs/2210.11095v1
Date: Thu, 20 Oct 2022 08:47:18 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-21 14:58:25.269605
Title: Iterative collaborative routing among equivariant capsules for transformation-robust capsule networks
Title（参考訳）: トランスフォーメーションロバストカプセルネットワークのための同変カプセル間の反復的協調ルーティング
Authors: Sai Raam Venkataraman, S. Balasubramanian, R. Raghunatha Sarma
Abstract要約: 本稿では,同変で構成性に配慮したカプセルネットワークモデルを提案する。構成性に対する認識は、提案した新しい反復的グラフベースのルーティングアルゴリズムを用いて得られる。 FashionMNIST, CIFAR-10, CIFAR-100の変換画像分類実験により, ICRを用いた我々のモデルは, 畳み込みベースラインとカプセルベースラインを上回り, 最先端性能を実現していることが示された。
参考スコア（独自算出の注目度）: 6.445605125467574
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Transformation-robustness is an important feature for machine learning models that perform image classification. Many methods aim to bestow this property to models by the use of data augmentation strategies, while more formal guarantees are obtained via the use of equivariant models. We recognise that compositional, or part-whole structure is also an important aspect of images that has to be considered for building transformation-robust models. Thus, we propose a capsule network model that is, at once, equivariant and compositionality-aware. Equivariance of our capsule network model comes from the use of equivariant convolutions in a carefully-chosen novel architecture. The awareness of compositionality comes from the use of our proposed novel, iterative, graph-based routing algorithm, termed Iterative collaborative routing (ICR). ICR, the core of our contribution, weights the predictions made for capsules based on an iteratively averaged score of the degree-centralities of its nearest neighbours. Experiments on transformed image classification on FashionMNIST, CIFAR-10, and CIFAR-100 show that our model that uses ICR outperforms convolutional and capsule baselines to achieve state-of-the-art performance.
Abstract（参考訳）: 変換ロバスト性は、画像分類を行う機械学習モデルにとって重要な特徴である。多くの手法は、データ拡張戦略を用いてモデルにこの特性を与えるが、より正式な保証は同変モデルを用いて得られる。構成的あるいは部分的構造は,変換ロバストモデルを構築する上で考慮すべき画像の重要な側面でもある。そこで本研究では,同値かつ構成性を考慮したカプセルネットワークモデルを提案する。我々のカプセルネットワークモデルの等分散性は、注意深いチョンセン・ノベル・アーキテクチャにおける等変畳み込みの使用から生じる。構成性に対する意識は、提案した新しい反復的グラフベースのルーティングアルゴリズム、ICR(Iterative collaborative routing)によってもたらされる。当社の貢献の中核であるicrは、近距離にあるカプセルの次数分布を反復的に平均したスコアに基づいて、カプセルの予測を重み付けている。 FashionMNIST, CIFAR-10, CIFAR-100の変換画像分類実験により, ICRを用いた我々のモデルは, 畳み込みベースラインとカプセルベースラインを上回り, 最先端の性能を達成することを示した。

関連論文リスト

Knowledge-Informed Neural Network for Complex-Valued SAR Image Recognition [51.03674130115878]
本稿では,新しい「圧縮集約圧縮」アーキテクチャ上に構築された軽量なフレームワークであるKnowledge-Informed Neural Network(KINN)を紹介する。 KINNはパラメータ効率の認識における最先端を確立し、データスカースとアウト・オブ・ディストリビューションのシナリオにおいて例外的な一般化を提供する。
論文参考訳（メタデータ） (2025-10-23T07:12:26Z)
Vision Foundation Models as Effective Visual Tokenizers for Autoregressive Image Generation [66.73899356886652]
我々は、事前訓練された視覚基盤モデルの上に画像トークン化器を直接構築する。提案する画像トークンーであるVFMTokは、画像再構成と生成品質を大幅に改善する。 ImageNetベンチマークで2.07のgFIDを達成することで、自動回帰(AR)生成をさらに強化する。
論文参考訳（メタデータ） (2025-07-11T09:32:45Z)
Quantitative Comparison of Fine-Tuning Techniques for Pretrained Latent Diffusion Models in the Generation of Unseen SAR Image Concepts [0.0]
本研究は,大規模な事前学習型潜伏拡散モデルの急激な画像領域への適応について検討する:合成開口レーダ(SAR) 我々は、Low-Rank Adaptation (LoRA)のようなフルモデル微調整とパラメータ効率のアプローチを含む、複数の微調整戦略を探索、比較する。提案手法は,テキストエンコーダのLoRAによる部分的チューニングとSAR>トークンの埋め込み学習を併用して,迅速なアライメントの維持に有効であることを示す。
論文参考訳（メタデータ） (2025-06-16T09:48:01Z)
Structural Similarity-Inspired Unfolding for Lightweight Image Super-Resolution [88.20464308588889]
効率的な画像SRのための構造類似インスパイアド・アンフォールディング(SSIU)法を提案する。この方法は、構造的類似性に制約されたSR最適化関数の展開によって設計される。我々のモデルは現在の最先端モデルより優れており、パラメータ数が低く、メモリ消費が減少している。
論文参考訳（メタデータ） (2025-06-13T14:29:40Z)
Calibrated Cache Model for Few-Shot Vision-Language Model Adaptation [36.45488536471859]
類似性は、ラベルのない画像を使用することで画像と画像の類似性を洗練する。重みは、トレーニングサンプル間の関係を適切にモデル化するために、精度行列を重み関数に導入する。 GPの複雑さを低減するため,グループベースの学習戦略を提案する。
論文参考訳（メタデータ） (2024-10-11T15:12:30Z)
Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。 CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。 DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文参考訳（メタデータ） (2023-10-11T12:46:11Z)
Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文参考訳（メタデータ） (2023-06-12T17:56:01Z)
Binarized Spectral Compressive Imaging [59.18636040850608]
ハイパースペクトル画像(HSI)再構成のための既存のディープラーニングモデルは、優れた性能を実現するが、膨大なメモリと計算資源を持つ強力なハードウェアを必要とする。本稿では,BiSRNet(Biarized Spectral-Redistribution Network)を提案する。 BiSRNetは,提案手法を用いてベースモデルのバイナライズを行う。
論文参考訳（メタデータ） (2023-05-17T15:36:08Z)
Robustcaps: a transformation-robust capsule network for image classification [6.445605125467574]
本稿では, 変換ロバスト性の望ましい特性を示すディープニューラルネットワークモデルを提案する。我々のモデルはRobostCapsと呼ばれ、改良されたカプセルネットワークモデルでグループ同変畳み込みを使用する。 CIFAR-10、FashionMNIST、CIFAR-100データセットの最先端の精度を実現している。
論文参考訳（メタデータ） (2022-10-20T08:42:33Z)
Contextformer: A Transformer with Spatio-Channel Attention for Context Modeling in Learned Image Compression [5.152019611975467]
本稿では,変換器を用いたコンテキストモデルであるContextformerを提案する。我々は、現代の圧縮フレームワークのコンテキストモデルをContextformerに置き換え、広く使われているKodakイメージデータセット上でテストする。実験の結果,VVCテストモデル (VVC) と比較すると,提案モデルでは最大10%の削減率が得られることがわかった。
論文参考訳（メタデータ） (2022-03-04T17:29:32Z)
CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文参考訳（メタデータ） (2021-12-31T04:37:11Z)
Semantic Correspondence with Transformers [68.37049687360705]
本稿では,変換器を用いたコストアグリゲーション(CAT)を提案し,意味論的に類似した画像間の密接な対応を見出す。初期相関マップと多レベルアグリゲーションを曖昧にするための外観親和性モデリングを含む。提案手法の有効性を示す実験を行い,広範囲にわたるアブレーション研究を行った。
論文参考訳（メタデータ） (2021-06-04T14:39:03Z)
FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning [64.32306537419498]
本稿では,複雑な変換を多様に生成する特徴量に基づく改良・拡張手法を提案する。これらの変換は、クラスタリングを通じて抽出したクラス内およびクラス間の両方の情報も利用します。提案手法は,大規模データセットにスケールアップしながら,より小さなデータセットに対して,現在の最先端技術に匹敵するものであることを実証する。
論文参考訳（メタデータ） (2020-07-16T17:55:31Z)
Group Equivariant Generative Adversarial Networks [7.734726150561089]
本研究では,グループ同変畳み込みネットワークを通じて,帰納的対称性をネットワークアーキテクチャに明示的に組み込む。群変換はより表現力が高く、サンプルが少ないため、ジェネレータと判別器の間の勾配フィードバックが向上する。
論文参考訳（メタデータ） (2020-05-04T17:38:49Z)
Toward a Controllable Disentanglement Network [22.968760397814993]
本稿では, 画像編集における歪みの程度を制御し, 歪み強度と復元品質のバランスをとることにより, 歪み画像表現を学習する2つの重要な問題に対処する。ソフトターゲット表現の実際の値空間を探索することにより、指定された特性を持つ新規な画像を合成することができる。
論文参考訳（メタデータ） (2020-01-22T16:54:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。