論文の概要: CGCMA: Conditionally-Gated Cross-Modal Attention for Event-Conditioned Asynchronous Fusion
- arxiv url: http://arxiv.org/abs/2604.16411v1
- Date: Wed, 01 Apr 2026 14:06:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.973875
- Title: CGCMA: Conditionally-Gated Cross-Modal Attention for Event-Conditioned Asynchronous Fusion
- Title(参考訳): CGCMA:イベントコンディション型非同期核融合のための条件付きクロスモーダルアテンション
- Authors: Yunxiang Guo,
- Abstract要約: 本研究では,高密度一次ストリームを散発的外部コンテキストで融合させる,一級マルチモーダル学習環境について検討する。
CGCMA (Conditionally-Gated Cross-Modal Attention) を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study asynchronous alignment, a first-class multimodal learning setting in which a dense primary stream must be fused with sporadic external context whose value depends on when it arrives. Unlike standard multimodal benchmarks that assume structural synchrony, this setting requires models to reason explicitly about freshness and trust. We focus on the event-conditioned case in which continuous market states are paired with delayed web intelligence, and we use high-frequency cryptocurrency markets only as a timestamped, high-noise stress test for this broader problem. We propose CGCMA (Conditionally-Gated Cross-Modal Attention), whose central design principle is to separate text-conditioned grounding from lag-aware trust control. Text first attends over price sequences to identify event-relevant market states, after which a conditional gate uses modality agreement, web features, and lag $τ_{\mathrm{lag}}$ to regulate residual injection and fall back toward unimodal prediction when external context is stale or contradictory. We introduce CMI (Crypto Market Intelligence), an asynchronous evaluation corpus with 27,914 real-news samples pairing high-frequency price sequences with lagged web intelligence. On the current short real-news corpus, CGCMA attains the highest mean downstream Sharpe ratio ($+0.449 \pm 0.257$) among the evaluated baselines under a shared zero-cost threshold-trading evaluation on news-available bars. Additional controls show that the gain is not explained by web scalars alone and is not recovered by simple freshness heuristics. The resulting evidence supports problem validity and a promising asynchronous multimodal gain on this stress-test setting.
- Abstract(参考訳): 非同期アライメント(非同期アライメント)は,高密度な一次ストリームを,到着時の値に依存する散発的外部コンテキストと融合させなければならない,一級マルチモーダル学習環境である。
構造的同期を仮定する標準的なマルチモーダルベンチマークとは異なり、この設定では、新鮮さと信頼について明確に推論する必要がある。
我々は、連続的な市場状態と遅延したWebインテリジェンスが組み合わされるイベント条件のケースに焦点を当て、この広範な問題に対して、タイムスタンプ付き、高ノイズのストレステストとしてのみ、高周波暗号市場を使用する。
CGCMA (Conditionally-Gated Cross-Modal Attention) を提案する。
条件ゲートは、モダリティ合意、Web特徴、lag $τ_{\mathrm{lag}}$を使用して、残留注入を規制し、外部コンテキストが不安定または矛盾している場合に、一様予測にフォールバックする。
CMI(Crypto Market Intelligence, CMI)は,27,914個の実ニュースサンプルと,タグ付きWebインテリジェンスと高周波価格シーケンスを組み合わせた非同期評価コーパスである。
現在の短い実ニュースコーパスでは、CGCMAはニュース提供バーにおけるゼロコスト閾値トレーディングの共有に基づく評価ベースラインの中で、最高平均下流シャープ比(+0.449 \pm 0.257$)を達成している。
追加の制御により、この利得はWebスカラーだけでは説明されず、単純なフレッシュネスヒューリスティックによって回復されないことが示された。
結果として得られた証拠は、このストレステスト設定における問題妥当性と有望な非同期マルチモーダルゲインを支持する。
関連論文リスト
- MADE: A Living Benchmark for Multi-Label Text Classification with Uncertainty Quantification of Medical Device Adverse Events [0.7685926099671206]
医療などの高度な領域における機械学習は、強力な予測性能と信頼性のある不確実性定量化を必要とする。
医療機器の異常事象報告から得られたMLTCベンチマークであるMADEを紹介する。
エントロピー/一貫性に基づく自己言語UQ手法を体系的に評価する。
論文 参考訳(メタデータ) (2026-04-16T16:28:16Z) - CORE: Context-Robust Remasking for Diffusion Language Models [51.59514489363897]
我々は、推論時リビジョンのためのトレーニング不要フレームワークであるContext-Robust Remasking (CORE)を提案する。
静的トークンの確率を信頼するのではなく、COREは、ターゲットとなるマスク付きコンテキストの摂動に対する感受性を示すことによって、コンテキスト不安定なトークンを識別する。
LLaDA-8B-Baseでは、COREは推論とコードベンチマークの間で一貫した改善を行い、計算に適合したベースラインを上回り、MBPPを最大9.2%改善した。
論文 参考訳(メタデータ) (2026-02-04T00:12:30Z) - MARS: Unleashing the Power of Speculative Decoding via Margin-Aware Verification [7.935725883885573]
Speculative Decoding (SD)は、自動回帰型大言語モデル(LLM)推論をデカップリングして高速化する。
対象モデルの局所的決定性に適応する訓練不要でドメインに依存しない検証戦略であるMargin-Aware Speculative Verificationを提案する。
本手法は,目標ロジットから直接測定した決定安定性の検証を行い,厳密な検証が最小限の利益をもたらす場合にのみ拒否を緩和する。
論文 参考訳(メタデータ) (2026-01-21T22:03:06Z) - All That Glisters Is Not Gold: A Benchmark for Reference-Free Counterfactual Financial Misinformation Detection [67.89888669159899]
RFC Benchは、現実的なニュースの下で財務的な誤情報に関する大規模な言語モデルを評価するためのベンチマークである。
このベンチマークでは、2つの補完的なタスクが定義されている。
論文 参考訳(メタデータ) (2026-01-07T18:18:28Z) - Encoder Decoder Generative Adversarial Network Model for Stock Market Prediction [0.0]
本稿では,GRU をベースとした表現型デコーダ GAN (EDGAN) モデルを提案する。
多様なストックデータセットの実験では、EDGANは揮発性市場においても予測精度とトレーニング安定性が優れていることが示されている。
論文 参考訳(メタデータ) (2025-10-12T13:57:36Z) - DASA: Delay-Adaptive Multi-Agent Stochastic Approximation [64.32538247395627]
我々は,N$エージェントが並列に動作し,中央サーバと通信することで,一般的な近似問題を高速化することを目的とした設定を考える。
遅延とストラグラーの効果を軽減するために,マルチエージェント近似のための遅延適応アルゴリズムである textttDASA を提案する。
論文 参考訳(メタデータ) (2024-03-25T22:49:56Z) - Asynchronous Federated Learning with Bidirectional Quantized
Communications and Buffered Aggregation [39.057968279167966]
Asynchronous Federated Learning with Buffered Aggregation (FedBuff)は、その効率性と高いスケーラビリティで知られている最先端のアルゴリズムである。
直接量子化によるエラー伝搬を回避するために,サーバとクライアント間で共有された"隠れ"状態を確立する量子化スキームを備えた新しいアルゴリズム(QAFeL)を提案する。
論文 参考訳(メタデータ) (2023-08-01T03:50:58Z) - CTC-based Non-autoregressive Speech Translation [51.37920141751813]
非自己回帰音声翻訳における接続性時間分類の可能性について検討する。
我々は、CTCによって誘導される2つのエンコーダからなるモデルを構築し、ソースおよびターゲットテキストを予測する。
MuST-Cベンチマークの実験では、我々のNASTモデルは平均BLEUスコアが29.5であり、スピードアップは5.67$times$である。
論文 参考訳(メタデータ) (2023-05-27T03:54:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。