Fugu-MT 論文翻訳(概要): Test-Time Adaptation for Tactile-Vision-Language Models

論文の概要: Test-Time Adaptation for Tactile-Vision-Language Models

arxiv url: http://arxiv.org/abs/2602.15873v1
Date: Sat, 31 Jan 2026 02:26:01 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-23 12:01:13.679611
Title: Test-Time Adaptation for Tactile-Vision-Language Models
Title（参考訳）: 触覚言語モデルに対するテスト時間適応
Authors: Chuyang Ye, Haoxian Jing, Qinting Jiang, Yixi Lin, Qiang Li, Xing Tang, Jingyan Jiang,
Abstract要約: 触覚ビジョン言語(TVL)モデルは、現実のロボットやマルチモーダルな知覚タスクにますます多くデプロイされている。既存のテスト時間適応法は、一様条件下でのフィルタリングを提供するが、モーダルシフトの下でのモダリティの信頼性の明示的な扱いは欠如している。本稿では,予測の不確実性と摂動に基づく応答からモダリティ毎の信頼性を推定する信頼性認識フレームワークを提案する。
参考スコア（独自算出の注目度）: 6.918033886034668
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Tactile-vision-language (TVL) models are increasingly deployed in real-world robotic and multimodal perception tasks, where test-time distribution shifts are unavoidable. Existing test-time adaptation (TTA) methods provide filtering in unimodal settings but lack explicit treatment of modality-wise reliability under asynchronous cross-modal shifts, leaving them brittle when some modalities become unreliable. We study TTA for TVL models under such shifts and propose a reliability-aware framework that estimates per-modality reliability from prediction uncertainty and perturbation-based responses. This shared reliability signal is used to (i) filter unreliable test samples, (ii) adaptively fuse tactile, visual, and language features, and (iii) regularize test-time optimization with a reliability-guided objective. On the TAG-C benchmark and additional TVL scenarios, our approach consistently outperforms strong TTA baselines, achieving accuracy gains of up to 49.9\% under severe modality corruptions, underscoring the importance of explicit modality-wise reliability modeling for robust test-time adaptation.
Abstract（参考訳）: 触覚ビジョン言語(TVL)モデルは、テスト時間分布シフトが避けられない実世界のロボットやマルチモーダルの知覚タスクに、ますます多くデプロイされている。既存のテスト時間適応法(TTA)は、一様条件下でのフィルタリングを提供するが、非同期のクロスモーダルシフトの下では、モダリティの信頼性が明示されていないため、いくつかのモダリティが信頼できなくなると不安定になる。そこで我々は,TVLモデルのTTAについて,予測の不確実性や摂動応答からモダリティ毎の信頼性を推定する信頼性を考慮したフレームワークを提案する。この共有信頼性信号は (i)信頼できないテストサンプルをフィルタリングする。 (二)触覚、視覚、言語の特徴を適応的に融合させ、三信頼性誘導目標によるテスト時間最適化を正則化すること。 TAG-Cベンチマークと追加のTVLシナリオでは、我々のアプローチは強いTTAベースラインを一貫して上回り、厳格なモダリティの破損下では49.9%の精度向上を実現し、堅牢なテスト時間適応のための明示的なモダリティワイド信頼性モデリングの重要性を強調している。

関連論文リスト

ProtoDCS: Towards Robust and Efficient Open-Set Test-Time Adaptation for Vision-Language Models [32.840734752367275]
Prototype-based Double-Check separation (ProtoDCS)はOSTTAの堅牢なフレームワークである。 csIDとcsOODを分離し、ビジョン言語モデルのcsIDデータへの安全かつ効率的な適応を可能にする。 ProtoDCSは、既知のクラス精度とOOD検出メトリクスの両方を大幅に向上させる。
論文参考訳（メタデータ） (2026-02-27T03:39:02Z)
Fair Context Learning for Evidence-Balanced Test-Time Adaptation in Vision-Language Models [10.45965859391796]
テスト時間適応(TTA)は、ラベルのないテストサンプルのみを使用して堅牢性を改善することを目的としている。ほとんどのプロンプトベースのTTA法はエントロピーの最小化に依存している。本研究では,共有エビデンスバイアスに明示的に対処することにより,エントロピーの最小化を回避するフェアコンテキスト学習(FCL)を提案する。
論文参考訳（メタデータ） (2026-02-02T16:02:50Z)
BrowseConf: Confidence-Guided Test-Time Scaling for Web Agents [58.05949210993854]
本研究では,長期にわたる行動の後,言語化された信頼度スコアを用いて,検索エージェントが自身の信頼を伝達できるかどうかを検討する。本研究では,信頼度スコアを用いて回答の質を判断し,信頼度レベルに達するまで再度試すテスト時間スケーリング(TTS)手法を提案する。
論文参考訳（メタデータ） (2025-10-27T15:58:51Z)
Uncertainty-driven Embedding Convolution [16.523816971857787]
不確実性駆動型埋め込み畳み込み(UEC)を提案する。 UECは決定論的埋め込みをポストホックな方法で確率論的に変換する。その後、埋め込みの不確実性に基づいて適応アンサンブル重みを計算する。
論文参考訳（メタデータ） (2025-07-28T11:15:25Z)
Advancing Reliable Test-Time Adaptation of Vision-Language Models under Visual Variations [67.35596444651037]
視覚言語モデル(VLM)は、素晴らしいゼロショット機能を示すが、ラベル付きデータが利用できない場合、下流タスクの分散シフトに苦慮する。本稿では,信頼性を両面から高めるReliable Test-Time Adaptation (ReTA)法を提案する。
論文参考訳（メタデータ） (2025-07-13T05:37:33Z)
TrustLoRA: Low-Rank Adaptation for Failure Detection under Out-of-distribution Data [62.22804234013273]
本稿では,共変量および意味的シフトの両条件下での拒絶による分類を統一し,促進する,単純な故障検出フレームワークを提案する。キーとなる洞察は、障害固有の信頼性知識を低ランクアダプタで分離し、統合することにより、障害検出能力を効果的かつ柔軟に向上できるということです。
論文参考訳（メタデータ） (2025-04-20T09:20:55Z)
UncertaintyRAG: Span-Level Uncertainty Enhanced Long-Context Modeling for Retrieval-Augmented Generation [93.38604803625294]
IncertaintyRAG, a novel approach for long-context Retrieval-Augmented Generation (RAG)について紹介する。我々は、SNR(Signal-to-Noise Ratio)ベースのスパン不確実性を用いて、テキストチャンク間の類似性を推定する。不確かさRAGはLLaMA-2-7Bでベースラインを2.03%上回り、最先端の結果を得る。
論文参考訳（メタデータ） (2024-10-03T17:39:38Z)
MedBN: Robust Test-Time Adaptation against Malicious Test Samples [11.397666167665484]
テスト時間適応(TTA)は、トレーニングデータとテストデータの間の予期せぬ分散シフトによるパフォーマンス劣化に対処する、有望なソリューションとして登場した。以前の研究では、テストバッチのごく一部が不正に操作された場合でも、TTA内のセキュリティ脆弱性が明らかになった。テスト時間推論におけるバッチ正規化層内の統計量推定に中央値のロバスト性を利用する中央値バッチ正規化(MedBN)を提案する。
論文参考訳（メタデータ） (2024-03-28T11:33:02Z)
Uncertainty-Calibrated Test-Time Model Adaptation without Forgetting [65.21599711087538]
テスト時間適応(TTA)は、与えられたモデルw.r.t.を任意のテストサンプルに適用することにより、トレーニングデータとテストデータの間の潜在的な分散シフトに取り組むことを目指している。事前の手法は各テストサンプルに対してバックプロパゲーションを実行するため、多くのアプリケーションに対して許容できない最適化コストがかかる。本稿では, 有効サンプル選択基準を策定し, 信頼性および非冗長なサンプルを同定する, 効率的なアンチフォッティングテスト時間適応法を提案する。
論文参考訳（メタデータ） (2024-03-18T05:49:45Z)
AR-TTA: A Simple Method for Real-World Continual Test-Time Adaptation [1.4530711901349282]
本稿では,自律運転のためのデータセット,すなわちCLAD-CとShiFTを用いたテスト時間適応手法の検証を提案する。現在のテスト時間適応手法は、ドメインシフトの様々な程度を効果的に扱うのに苦労している。モデル安定性を高めるために、小さなメモリバッファを組み込むことで、確立された自己学習フレームワークを強化する。
論文参考訳（メタデータ） (2023-09-18T19:34:23Z)
Reliable Federated Disentangling Network for Non-IID Domain Feature [62.73267904147804]
本稿では、RFedDisと呼ばれる新しい信頼性のあるフェデレーション・ディエンタングリング・ネットワークを提案する。我々の知る限り、提案するRFedDisは、明らかな不確実性と特徴の混在に基づくFLアプローチを開発する最初の試みである。提案するRFedDisは,他の最先端FL手法と比較して信頼性の高い優れた性能を提供する。
論文参考訳（メタデータ） (2023-01-30T11:46:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。