論文の概要: Enhancing deep neural networks through complex-valued representations and Kuramoto synchronization dynamics
- arxiv url: http://arxiv.org/abs/2502.21077v1
- Date: Fri, 28 Feb 2025 14:10:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 13:43:03.132453
- Title: Enhancing deep neural networks through complex-valued representations and Kuramoto synchronization dynamics
- Title(参考訳): 複素数値表現と倉本同期ダイナミクスによるディープニューラルネットワークの強化
- Authors: Sabine Muzellec, Andrea Alamia, Thomas Serre, Rufin VanRullen,
- Abstract要約: 視覚的分類のために訓練された人工モデルにおいて、同期型メカニズムがオブジェクト符号化を向上できるかどうかを検討する。
複素数値表現と倉本ダイナミクスを組み合わせ、位相アライメントを促進し、同一対象に属する特徴のグルーピングを容易にする。
本研究は,ディープラーニングモデルの向上,性能の向上,堅牢性,一般化のための同期駆動機構の可能性を明らかにする。
- 参考スコア(独自算出の注目度): 13.611995923070426
- License:
- Abstract: Neural synchrony is hypothesized to play a crucial role in how the brain organizes visual scenes into structured representations, enabling the robust encoding of multiple objects within a scene. However, current deep learning models often struggle with object binding, limiting their ability to represent multiple objects effectively. Inspired by neuroscience, we investigate whether synchrony-based mechanisms can enhance object encoding in artificial models trained for visual categorization. Specifically, we combine complex-valued representations with Kuramoto dynamics to promote phase alignment, facilitating the grouping of features belonging to the same object. We evaluate two architectures employing synchrony: a feedforward model and a recurrent model with feedback connections to refine phase synchronization using top-down information. Both models outperform their real-valued counterparts and complex-valued models without Kuramoto synchronization on tasks involving multi-object images, such as overlapping handwritten digits, noisy inputs, and out-of-distribution transformations. Our findings highlight the potential of synchrony-driven mechanisms to enhance deep learning models, improving their performance, robustness, and generalization in complex visual categorization tasks.
- Abstract(参考訳): ニューラルシンクロニーは、脳が視覚シーンを構造化された表現に整理する方法において重要な役割を担い、シーン内の複数のオブジェクトの堅牢なエンコーディングを可能にすると仮定されている。
しかし、現在のディープラーニングモデルはオブジェクトバインディングに苦しむことが多く、複数のオブジェクトを効果的に表現する能力を制限する。
神経科学に触発されて、視覚的分類のための訓練された人工モデルにおいて、同期型メカニズムがオブジェクトエンコーディングを向上できるかどうかを検討する。
具体的には、複素数値表現と倉本ダイナミクスを組み合わせることで位相アライメントを促進し、同一対象に属する特徴のグルーピングを容易にする。
フィードバック接続を伴うフィードフォワードモデルとリカレントモデルという,同期を用いた2つのアーキテクチャを評価し,トップダウン情報を用いて位相同期を洗練させる。
両モデルとも、重複する手書き桁、雑音入力、アウト・オブ・ディストリビューション変換などの多目的画像を含むタスクにおいて、倉本同期のない実値モデルと複素値モデルよりも優れている。
本研究は, 複雑な視覚分類タスクにおける, 深層学習モデルの向上, 性能の向上, 堅牢性, 一般化のための同期駆動機構の可能性を明らかにするものである。
関連論文リスト
- Hierarchical Banzhaf Interaction for General Video-Language Representation Learning [60.44337740854767]
マルチモーダル表現学習は人工知能領域において重要な役割を担っている。
本稿では,多変量協調ゲーム理論を用いて,ビデオテキストをゲームプレイヤーとしてモデル化する手法を提案する。
元の構造をフレキシブルなエンコーダ・デコーダ・フレームワークに拡張し、モデルが様々な下流タスクに適応できるようにする。
論文 参考訳(メタデータ) (2024-12-30T14:09:15Z) - MOVIS: Enhancing Multi-Object Novel View Synthesis for Indoor Scenes [35.16430027877207]
MOVISは、多目的NVSのためのビュー条件拡散モデルの構造的認識を高めることを目的としている。
本稿では,新しいビューオブジェクトマスクを同時に予測するためにモデルを必要とする補助タスクを提案する。
合成画像の可視性を評価するために,クロスビューの一貫性と新しいビューオブジェクト配置を評価する。
論文 参考訳(メタデータ) (2024-12-16T05:23:45Z) - Towards Evaluating the Robustness of Visual State Space Models [63.14954591606638]
視覚状態空間モデル(VSSM)は視覚知覚タスクにおいて顕著な性能を示した。
しかし、自然と敵対的な摂動の下での頑丈さは依然として重要な懸念事項である。
様々な摂動シナリオ下でのVSSMの頑健さを総合的に評価する。
論文 参考訳(メタデータ) (2024-06-13T17:59:44Z) - Recurrent Complex-Weighted Autoencoders for Unsupervised Object Discovery [62.43562856605473]
複雑な重み付き再帰的アーキテクチャの計算上の優位性について論じる。
本稿では,反復的制約満足度を実現する完全畳み込みオートエンコーダSynCxを提案する。
論文 参考訳(メタデータ) (2024-05-27T15:47:03Z) - Discovering group dynamics in coordinated time series via hierarchical recurrent switching-state models [5.250223406627639]
システムレベルと個別レベルのダイナミクスを学習するために、教師なしの方法でトレーニングできる新しいスイッチング状態モデルを提案する。
我々は、遅延系レベルの離散状態マルコフ連鎖を用いて、遅延系レベルの連鎖にトップダウンの影響を与え、各観測時系列の放出を制御している。
論文 参考訳(メタデータ) (2024-01-26T16:06:01Z) - Data driven modeling for self-similar dynamics [1.0790314700764785]
本稿では,自己相似性を先行知識として組み込んだマルチスケールニューラルネットワークフレームワークを提案する。
決定論的ダイナミクスの場合、我々のフレームワークは力学が自己相似かどうかを識別できる。
本手法は,自己相似システムにおける電力法指数を同定する。
論文 参考訳(メタデータ) (2023-10-12T12:39:08Z) - Robust and Controllable Object-Centric Learning through Energy-based
Models [95.68748828339059]
我々の研究は概念的にシンプルで一般的なアプローチであり、エネルギーベースモデルを通してオブジェクト中心の表現を学習する。
既存のアーキテクチャに容易に統合でき、高品質なオブジェクト中心表現を効果的に抽出できることを示す。
論文 参考訳(メタデータ) (2022-10-11T15:11:15Z) - Complex-Valued Autoencoders for Object Discovery [62.26260974933819]
本稿では,オブジェクト中心表現に対する分散アプローチとして,複合オートエンコーダを提案する。
このシンプルで効率的なアプローチは、単純なマルチオブジェクトデータセット上の等価な実数値オートエンコーダよりも、より良い再構成性能を実現することを示す。
また、2つのデータセット上のSlotAttentionモデルと競合しないオブジェクト発見性能を実現し、SlotAttentionが失敗する第3のデータセットでオブジェクトをアンタングルする。
論文 参考訳(メタデータ) (2022-04-05T09:25:28Z) - Structure-Regularized Attention for Deformable Object Representation [17.120035855774344]
文脈依存のキャプチャは、ディープニューラルネットワークの表現力を改善するのに有用であることが証明されている。
自己注意や非局所操作といったグローバルコンテキストのモデリングに焦点をあてた近年のアプローチは、要素間の制約のないペアワイズ相互作用を可能にすることで、この目標を達成する。
本稿では,データに固有の構造的依存関係をモデル化することにより,コンテキスト利用の恩恵を受けることができる変形可能なオブジェクトの学習表現について考察する。
論文 参考訳(メタデータ) (2021-06-12T03:10:17Z) - S2RMs: Spatially Structured Recurrent Modules [105.0377129434636]
モジュール構造とテンポラル構造の両方を同時に活用できる動的構造を利用するための一歩を踏み出します。
我々のモデルは利用可能なビューの数に対して堅牢であり、追加のトレーニングなしで新しいタスクに一般化できる。
論文 参考訳(メタデータ) (2020-07-13T17:44:30Z) - Relational State-Space Model for Stochastic Multi-Object Systems [24.234120525358456]
本稿では、逐次階層型潜在変数モデルであるリレーショナル状態空間モデル(R-SSM)を紹介する。
R-SSMはグラフニューラルネットワーク(GNN)を用いて、複数の相関オブジェクトの結合状態遷移をシミュレートする。
R-SSMの実用性は、合成および実時間時系列データセットで実証的に評価される。
論文 参考訳(メタデータ) (2020-01-13T03:45:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。