Fugu-MT 論文翻訳(概要): Provably Efficient Third-Person Imitation from Offline Observation

関連論文リスト

Beyond Confidence: Adaptive and Coherent Decoding for Diffusion Language Models [64.92045568376705]
コヒーレントコンテキストデコーディング(Coherent Contextual Decoding, CCD)は、2つのコアイノベーションに基づいて構築された新しい推論フレームワークである。 CCDは、歴史的文脈を活用してシーケンスコヒーレンスを高める軌道修正機構を採用している。拡散ステップに基づく厳密なアロケーションの代わりに,各ステップのアンマスク予算を動的に調整する適応型サンプリング戦略を導入する。
論文参考訳（メタデータ） (2025-11-26T09:49:48Z)
Balance Equation-based Distributionally Robust Offline Imitation Learning [8.607736795429638]
イミテーション・ラーニング(IL)は、報酬関数や明示的なコントローラを手動で設計するロボットや制御タスクに非常に効果的であることが証明されている。標準のILメソッドは、トレーニングとデプロイメントの間に環境のダイナミクスが固定されていると暗黙的に仮定します。バランス方程式に基づく分散ロバストオフライン学習を通じてこの問題に対処する。不確実な遷移モデルの集合に対する分布論的にロバストな最適化としてこの問題を定式化し、最悪の遷移分布の下での模倣損失を最小限に抑える政策を求める。
論文参考訳（メタデータ） (2025-11-11T07:48:09Z)
FAIRWELL: Fair Multimodal Self-Supervised Learning for Wellbeing Prediction [16.913286294651236]
本稿では、以下の3つのメカニズムを用いて、より公平な表現を学習するための新しい主観レベル損失関数を提案する。我々は,現実の異種医療データセットを3つ評価した。
論文参考訳（メタデータ） (2025-08-22T19:03:06Z)
FARCLUSS: Fuzzy Adaptive Rebalancing and Contrastive Uncertainty Learning for Semi-Supervised Semantic Segmentation [26.585985828583304]
半教師付きセマンティックセグメンテーション(SSSS)は、ラベルのないデータを効果的に活用する上で、永続的な課題に直面している。現在のアプローチは、しばしば支配階級を優先する厳格なしきい値によって不確実な地域を捨てる。我々は,不確実性を4つの主要コンポーネントを通じて学習資産に変換する総合的な枠組みを導入する。
論文参考訳（メタデータ） (2025-06-11T03:47:08Z)
Enhancing Learnable Descriptive Convolutional Vision Transformer for Face Anti-Spoofing [1.8816077341295627]
Face Anti-Spoofing (FAS) は、プレゼンテーション攻撃に対抗するために、ライブ/スプーフ識別機能に大きく依存している。近年,Learningable Descriptive Convolution を ViT に組み込むための LDCformer を提案している。本稿では,LCDフォーマのトレーニングを効果的に強化し,特徴量を向上させるための3つの新しいトレーニング戦略を提案する。
論文参考訳（メタデータ） (2025-03-29T01:55:48Z)
Robust Distribution Alignment for Industrial Anomaly Detection under Distribution Shift [51.24522135151649]
異常検出は産業アプリケーションの品質管理において重要な役割を担っている。既存の方法は、一般化可能なモデルをトレーニングすることで、ドメインシフトに対処しようとする。提案手法は,最先端の異常検出法や領域適応法と比較して,優れた結果を示す。
論文参考訳（メタデータ） (2025-03-19T05:25:52Z)
Feature Space Perturbation: A Panacea to Enhanced Transferability Estimation [13.930288332118561]
本稿では,特徴空間を体系的に変更することにより,伝達可能性推定のプロセスを向上させる特徴摂動手法を提案する。本手法では,クラス間の距離を最小化し,クラス境界を曖昧にするため,クラス内変動を増加させるスプレッド演算と,クラス間の距離を最小化するアトラクション演算を含む。
論文参考訳（メタデータ） (2025-02-23T07:07:49Z)
Unconditional Truthfulness: Learning Unconditional Uncertainty of Large Language Models [104.55763564037831]
我々は、注意マップ、現在の生成ステップにおける確率、および以前に生成されたトークンから繰り返し計算された不確実性スコアを利用する回帰モデルを訓練する。評価の結果,提案手法は選択的生成に極めて有効であり,教師なしアプローチと教師なしアプローチに比較して大幅な改善が得られた。
論文参考訳（メタデータ） (2024-08-20T09:42:26Z)
Self-Supervised Modality-Agnostic Pre-Training of Swin Transformers [0.7496510641958004]
我々はSwin Transformerを拡張して、異なる医用画像モダリティから学習し、下流のパフォーマンスを向上させる。 SwinFUSEと呼ばれるこのモデルは,事前学習中にCT(Computed Tomography)とMRI(Magical Resonance Images)の両方から学習し,補完的な特徴表現をもたらす。
論文参考訳（メタデータ） (2024-05-21T13:28:32Z)
Robust Representation Learning with Self-Distillation for Domain Generalization [2.0817769887373245]
本稿では,ロバスト表現学習(Robust Representation Learning with Self-Distillation)と呼ばれる新しい領域一般化手法を提案する。 3つのデータセットの最先端データに対して、平均精度を1.2%から2.3%に改善する。
論文参考訳（メタデータ） (2023-02-14T07:39:37Z)
Boosting Cross-Domain Speech Recognition with Self-Supervision [35.01508881708751]
自動音声認識(ASR)のクロスドメイン性能は,トレーニングとテストのミスマッチにより著しく損なわれる可能性がある。従来, 自己監督学習 (SSL) や擬似ラベル学習 (PL) は, 未ラベルデータの自己監督を利用してUDAに有効であることが示された。この研究は、事前学習および微調整のパラダイムにおいて、ラベルなしデータを完全に活用する体系的なUDAフレームワークを提案する。
論文参考訳（メタデータ） (2022-06-20T14:02:53Z)
Balancing Discriminability and Transferability for Source-Free Domain Adaptation [55.143687986324935]
従来のドメイン適応(DA)技術は、ドメイン不変表現を学習することでドメイン転送性を改善することを目的としている。ラベル付けされたソースとラベル付けされていないターゲットへの同時アクセス要件は、ソースフリーなDA設定に適さない。そこで本研究では,原文と翻訳サンプルの混在が識別可能性と伝達可能性のトレードオフを促進することを示す新しい知見を導出する。
論文参考訳（メタデータ） (2022-06-16T09:06:22Z)
A Mutually Reinforced Framework for Pretrained Sentence Embeddings [49.297766436632685]
InfoCSEは高品質な文埋め込みを学習するための新しいフレームワークである。文表現モデル自体を利用して、以下の反復的な自己スーパービジョンプロセスを実現する。言い換えれば、表現学習とデータアノテーションは相互に強化され、強い自己超越効果が導出される。
論文参考訳（メタデータ） (2022-02-28T14:00:16Z)
Self-attention fusion for audiovisual emotion recognition with incomplete data [103.70855797025689]
視覚的感情認識を応用したマルチモーダルデータ解析の問題点を考察する。本稿では、生データから学習可能なアーキテクチャを提案し、その3つの変種を異なるモダリティ融合機構で記述する。
論文参考訳（メタデータ） (2022-01-26T18:04:29Z)
Selective Pseudo-Labeling with Reinforcement Learning for Semi-Supervised Domain Adaptation [116.48885692054724]
半教師付きドメイン適応のための強化学習に基づく選択擬似ラベル法を提案する。高精度かつ代表的な擬似ラベルインスタンスを選択するための深層Q-ラーニングモデルを開発する。提案手法は, SSDAのベンチマークデータセットを用いて評価し, 全ての比較手法よりも優れた性能を示す。
論文参考訳（メタデータ） (2020-12-07T03:37:38Z)
Discriminative Active Learning for Domain Adaptation [16.004653151961303]
我々は、データアノテーションの労力を減らすために、ドメイン適応のための差別的なアクティブな学習手法を導入する。具体的には,ニューラルネットワークの3段階能動対向トレーニングを提案する。 4つのベンチマークデータセットを用いた既存領域適応手法との比較実験により,提案手法の有効性が示された。
論文参考訳（メタデータ） (2020-05-24T04:20:49Z)
GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文参考訳（メタデータ） (2020-02-21T00:27:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

論文の概要: Provably Efficient Third-Person Imitation from Offline Observation

関連論文リスト