論文の概要: Towards Robust Multimodal Learning in the Open World
- arxiv url: http://arxiv.org/abs/2511.09989v1
- Date: Fri, 14 Nov 2025 01:24:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.620802
- Title: Towards Robust Multimodal Learning in the Open World
- Title(参考訳): オープンワールドにおけるロバストなマルチモーダル学習を目指して
- Authors: Fushuo Huo,
- Abstract要約: 現在のニューラルネットワークベースのモデルは、固有の予測不能を特徴とするオープンワールド環境では不足することが多い。
人間は自然にこのようなダイナミックであいまいなシナリオに適応するが、人工知能システムは頑丈さの限界を示す。
本研究では,オープンワールド環境におけるマルチモーダル学習の堅牢性に関する基礎的課題について検討し,制御された実験性能と実践的展開要件のギャップを埋めることを目的とした。
- 参考スコア(独自算出の注目度): 6.397254957727733
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid evolution of machine learning has propelled neural networks to unprecedented success across diverse domains. In particular, multimodal learning has emerged as a transformative paradigm, leveraging complementary information from heterogeneous data streams (e.g., text, vision, audio) to advance contextual reasoning and intelligent decision-making. Despite these advancements, current neural network-based models often fall short in open-world environments characterized by inherent unpredictability, where unpredictable environmental composition dynamics, incomplete modality inputs, and spurious distributions relations critically undermine system reliability. While humans naturally adapt to such dynamic, ambiguous scenarios, artificial intelligence systems exhibit stark limitations in robustness, particularly when processing multimodal signals under real-world complexity. This study investigates the fundamental challenge of multimodal learning robustness in open-world settings, aiming to bridge the gap between controlled experimental performance and practical deployment requirements.
- Abstract(参考訳): 機械学習の急速な進化により、ニューラルネットワークは様々な領域で前例のない成功を収めた。
特に、マルチモーダル学習は、異種データストリーム(テキスト、ビジョン、オーディオなど)からの相補的な情報を活用して、文脈的推論とインテリジェントな意思決定を前進させる、変革的パラダイムとして登場した。
これらの進歩にもかかわらず、現在のニューラルネットワークベースのモデルは、予測不可能な環境構成のダイナミクス、不完全なモダリティ入力、および急激な分布関係がシステムの信頼性を著しく損なうような、固有の予測不可能さを特徴とするオープンワールド環境では、しばしば不足する。
人間は自然にこのようなダイナミックであいまいなシナリオに適応するが、人工知能システムは、特に実世界の複雑さの下でマルチモーダル信号を処理する場合、頑丈さに厳しい制限を示す。
本研究では,オープンワールド環境におけるマルチモーダル学習の堅牢性に関する基礎的課題について検討し,制御された実験性能と実践的展開要件のギャップを埋めることを目的とした。
関連論文リスト
- Multi-Modal Manipulation via Multi-Modal Policy Consensus [62.49978559936122]
本稿では,ロボット操作のための多様な感覚モダリティを統合するための新しいアプローチを提案する。
提案手法は,それぞれが単一の表現に特化している拡散モデルの集合にポリシーを分解する。
我々は、RLBenchにおけるシミュレーション操作タスクと、隠蔽対象のピック、手作業のスプーン再配向、パズル挿入といった実世界のタスクについて評価した。
論文 参考訳(メタデータ) (2025-09-27T19:43:04Z) - Disentangling the Causes of Plasticity Loss in Neural Networks [55.23250269007988]
可塑性の喪失は複数の独立したメカニズムに分解できることを示す。
種々の非定常学習タスクにおいて, 層正規化と重み劣化の組み合わせは, 可塑性維持に極めて有効であることを示す。
論文 参考訳(メタデータ) (2024-02-29T00:02:33Z) - Learning Continuous Network Emerging Dynamics from Scarce Observations
via Data-Adaptive Stochastic Processes [11.494631894700253]
我々は、データ適応型ネットワークダイナミクスによって制御される新しいプロセスのクラスであるODE Processs for Network Dynamics (NDP4ND)を紹介する。
提案手法はデータと計算効率に優れており,未確認のネットワークに適応できることを示す。
論文 参考訳(メタデータ) (2023-10-25T08:44:05Z) - Pre-training Contextualized World Models with In-the-wild Videos for
Reinforcement Learning [54.67880602409801]
本稿では,視覚制御タスクの学習を効率的に行うために,Wild 動画を多用した事前学習型世界モデルの課題について検討する。
本稿では、コンテキストと動的モデリングを明確に分離したContextualized World Models(ContextWM)を紹介する。
実験により,ContextWMを内蔵したWildビデオ事前学習は,モデルベース強化学習のサンプル効率を大幅に向上できることが示された。
論文 参考訳(メタデータ) (2023-05-29T14:29:12Z) - Learning Individual Interactions from Population Dynamics with Discrete-Event Simulation Model [9.827590402695341]
複雑なシステム力学の離散時間シミュレーション表現を学習する可能性について検討する。
この結果から,本アルゴリズムは,意味のあるイベントを持つ複数のフィールドにおいて,複雑なネットワークダイナミクスをデータ効率よくキャプチャできることがわかった。
論文 参考訳(メタデータ) (2022-05-04T21:33:56Z) - Collective Intelligence for Deep Learning: A Survey of Recent
Developments [11.247894240593691]
我々は、複雑なシステムへのニューラルネットワーク研究の関与に関する歴史的文脈を提供する。
我々は,集合知の原理を取り入れた,現代のディープラーニング研究の活発な領域をいくつか取り上げる。
論文 参考訳(メタデータ) (2021-11-29T08:39:32Z) - Causal Navigation by Continuous-time Neural Networks [108.84958284162857]
本研究では,連続時間ニューラルネットワークを用いた因果表現学習のための理論的,実験的枠組みを提案する。
本手法は,ドローンの視覚制御学習の文脈において,一連の複雑なタスクにおいて評価する。
論文 参考訳(メタデータ) (2021-06-15T17:45:32Z) - Network Diffusions via Neural Mean-Field Dynamics [52.091487866968286]
本稿では,ネットワーク上の拡散の推論と推定のための新しい学習フレームワークを提案する。
本研究の枠組みは, ノード感染確率の正確な進化を得るために, モリ・ズワンジッヒ形式から導かれる。
我々のアプローチは、基礎となる拡散ネットワークモデルのバリエーションに対して多用途で堅牢である。
論文 参考訳(メタデータ) (2020-06-16T18:45:20Z) - Zero-Shot Reinforcement Learning with Deep Attention Convolutional
Neural Networks [12.282277258055542]
本研究では、特定の視覚センサ構成を持つ深層注意畳み込みニューラルネットワーク(DACNN)が、より低い計算複雑性で高いドメインとパラメータの変動を持つデータセット上でトレーニングを行うことを示す。
我々の新しいアーキテクチャは、制御対象に対する認識に適応し、知覚ネットワークを事前訓練することなくゼロショット学習を実現する。
論文 参考訳(メタデータ) (2020-01-02T19:41:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。