Cosmos 3: Omnimodal World Models for Physical AI [322.0] 我々は、言語、画像、ビデオ、オーディオ、アクションシーケンスを共同で処理し、生成するために設計された、一様世界モデルのファミリーであるCosmos 3を紹介する。
評価の結果,コスモス3は多種多様な理解・生成タスクにまたがって新たな最先端技術を確立していることがわかった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:12:30 GMT)
Trans2Occ: Voxel Occupancy Estimation and Grasp for Transparent Objects from Simulation to Reality [125.8] 単一ビューRGB入力に基づく透明な物体認識と操作のためのフレームワークを提案する。
提案手法は,1つの画像から直接ボクセル空間の占有率を予測し,下流ロボットの把握を支援する幾何学的表現を提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:59:13 GMT)
MetaWorld: Scaling Multi-Agent Video World Model from Single-view Video Data [125.4] MetaWorldは、マルチエージェントビデオワールドモデルをシングルビュービデオから直接オープンドメイン環境にスケールする新しいフレームワークである。
クロスビューの一貫性とアイデンティティの整合性を向上し、マルチエージェントビデオワールドモデリングのための高度にスケーラブルで物理駆動のパラダイムを確立する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:20:20 GMT)
Baton: Explicit Semantic Blueprints for Joint Video-Audio Generation [113.2] Batonは、共同ビデオオーディオ生成に明示的なセマンティックプランニングを導入するフレームワークである。
我々の重要な洞察は、粗いテキストガイダンスを意味的にリッチでモダリティを意識したトークンで補完することで、細かなセマンティックディテールを同時に復元できるということです。
ベンチマークの実験は、バトンの有効性を質的にも定量的にも示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:54:28 GMT)
Better with Experience: Self-Evolving LLM Agents for Evidence-Grounded Health Community Notes [108.4] LLM(Large Language Model)拡張コミュニティノートは、ソーシャルプラットフォーム上での健康上の誤った情報の、タイムリーで根拠に基づく修正のためのスケーラブルなパスを提供する。
エボノート(EvoNote)は、医療コミュニティノート生成において、過去の誤報訂正エピソードの記憶の進化を通じて自己進化を可能にするエージェントフレームワークである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:16:22 GMT)
Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments [96.2] 身体的な知性は、操作やナビゲーションといった個々のタスクのための特別なモデルを通してしばしば研究される。
本稿では,Qwenの視覚言語モデリングスタックを連続的な動作と軌道生成に拡張した統一的な基礎モデルであるQwen-VLAを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:48:35 GMT)
Residual Decoder Adapter: ID-Preserving Tokenizer Adaption for Autoregressive Text Rendering [92.4] Visual Autoregressive (AR)モデルは、視覚的トークン化器によってデコードされた離散トークンを予測して画像を生成する。
全体的な画像生成能力は高いが、ぼやけたストロークと文字の形を乱したテキストレンダリングでは依然として性能が劣っている。
トークン空間を変更することなく既存のトークン化器を更新するResidual Decoder Adapter(RDA)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:47:17 GMT)
MT-EditFlow: Reinforcement Learning for Multi-Turn Image Editing with Flow Matching [91.8] MT-EditFlowは、逐次画像編集のための報酬信号の最適化を目的とした、フローマッチング強化学習フレームワークである。
MT-EditFlowは多種多様なベースモデル間で性能を著しく向上させることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:46:10 GMT)
Robust Dreamer: Deviation-Aware Latent Gaussian Memory for Action-Controlled AR Video Generation [89.7] アクション制御された画像対ビデオ生成は、インタラクティブな世界シミュレーションにおいて有望なパラダイムであり、各制御信号が即時視覚応答を誘発する。
長時間の自己回帰的なロールアウトに対する視覚的忠実さと3D一貫性を維持することは依然として難しい。
既存の3D認識手法は、textitLatent--RGB Cyclingからの情報損失と、textiterror-free仮説によって引き起こされるトレーニング-推論ギャップという2つの障害により、破滅的なドリフトに悩まされることが多い。
textbfRobust Dreamerという,メモリ拡張フレームワークについて紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:19:36 GMT)
SkillHarm: Lifecycle-Aware Skill-Based Attacks via Automated Construction [89.0] エージェントスキルはエージェントワークフローにおける特権的な位置を占め、サードパーティスキルを脆弱な攻撃面にする。
我々はスキルベースアタックのベンチマークであるSkillHarmを紹介した。
攻撃成功率はFPPが86.3%、SMPが69.3%である。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:45:39 GMT)
SeClaw: Spec-Driven Security Task Synthesis for Evaluating Autonomous Agents [87.3] SeClawは、仕様駆動のセキュリティタスク合成と、自律エージェントの実行ベースのセキュリティ評価を組み合わせたフレームワークである。
ベンチマークは、リソース、ユーザタスク、環境、本質的なエージェントの振る舞いから生じるリスクをカバーしている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:23:42 GMT)
Understanding-Enhanced Model Collaboration for Long-Tailed Egocentric Mistake Detection [85.5] 理解力向上型モデル協調手法(UE-MCM)を提案する。
より効率的な粗いビデオ理解と正確なきめ細かなアクション推論を組み合わせる。
結果として得られるシステムは速度と精度のバランスを保ち、エゴセントリックな指導ビデオの微妙で稀で曖昧な誤りを検出するのに効果的である。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:50:16 GMT)
HumanNOVA: Photorealistic, Universal and Rapid 3D Human Avatar Modeling from a Single Image [84.8] 我々は,1枚のRGB画像から3次元アバターを生成するための,フォトリアリスティックで普遍的で高速なモデルであるHumanNOVAを提案する。
アーキテクチャの面では、HumanNOVAは1秒未満で高速な推論を可能にする、フィードフォワード、トークン条件付きアバターモデリングフレームワークを採用している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:58:11 GMT)
Training-Free Composed Video Retrieval via Visual Representation-Guided Video-LLM Reasoning [84.5] CVPR2026 Reason-Aware Video Retrieval Challengeでは、基準映像と修正指示に従って対象映像を検索する必要がある。
我々は、学習自由な合成ビデオ検索のための視覚表現誘導ビデオ-LLM推論を開発した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:35:23 GMT)
Readable Yet Unpredictable: Rotated-Outcome Prediction in Vision-Language Models [82.1] 視覚言語モデルでは、オリジナルの画像だけで180回転を予測できるのか?
我々はこの能力について,回転アウトカム予測を用いて検討する。
現在の視覚言語モデルは、表示された時に変換された視覚状態を認識できるが、しばしば元のビューからその状態を予測できない。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:16:09 GMT)
Unveiling the Entropy Dynamics of Chain-of-Thought Reasoning [81.6] 1)信頼性の高い -- 信頼性の高い -- 信頼性の高い領域での回答は高度に正確で安定したものになり、2)高冗長性 -- モデルは正しい回答に達した後ずっと経ってから不必要なトークンを生成する。
これらの特性はより効率的で信頼性の高い推論戦略を解き放つ。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:11:14 GMT)
Polaris: Scaling Up Instruction-Guided Image Generation Towards Millions of Personalized Style Needs [81.1] ユーザーは、画像生成モデルが非常に多様でパーソナライズされた要求に迅速に適応することを期待している。
従来のアプローチは微調整に依存しており、コストがかかり、スケールが難しい。
ユーザの指示に基づいてモデルライブラリから適切なモデルを自動的に選択・統合するインテリジェント検索フレームワークであるPolarisを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:10:25 GMT)
How Hard Can It Be? Hardness-Aware Multi-Objective Unlearning [76.0] 機械学習は、プライバシー、著作権、バイアスの懸念による特定の忘れられたトレーニングデータの影響を取り除くことを目的としている。
我々は,品質の特定の改善を保証することを目的として,未学習のアルゴリズムを導出する。
私たちの硬度測定は、ユーティリティの劣化が避けられない場合にユーザーに通知します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:49:47 GMT)
PhyScene3D: Physically Consistent Interactive 3D Tabletop Scene Generation [75.9] 3Dテーブルトップシーンの生成は、インタラクティブでジェネラリスト的なロボット学習の基本的な問題である。
本稿では,PhyScene3Dについて紹介する。
実験により、PhyScene3Dは意味的精度と物理的妥当性の両方において最先端のアプローチより優れていることが示された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:56:32 GMT)
Paving the Way for Point Cloud Video Representation Learning Using A PDE Model [74.3] 空間的時間的相関、特に時間とともに空間的点がどう変化するかを調べることは、ポイント・クラウド・ビデオを理解する上で重要である。
従来の手法、特にフローベースの手法は、シーケンシャル・ポイント・クラウドデータの非秩序な空間配置のためにこれらの相関に苦慮している。
本稿では,空間的時間的相関学習の正規化を課題を解法部分微分方程式として定式化する手法を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:57:01 GMT)
Everywhere Learning: Artificial Intelligence with Pointwise Constraints [74.1] あらゆる場所での学習は、AI(Artificial Intelligence)システムがデータ分布上の確率1による損失制約を満たすために訓練される新しいパラダイムである。
我々は、経験的および統計的学習問題の解間の近接性を確立する一般化解析の基盤となる近似双対理論を開発する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:02:22 GMT)
Mitigating Bias in Locally Constrained Decoding via Tractable Proposals [73.8] 既存の局所的制約付き復号法は、ミオプティックに次のトークンを隠蔽することで制約を強制する。
最近の研究では、シーケンシャルなモンテカルロ法を用いてバイアスを緩和しているが、効果的な提案分布や潜在的な関数を設計することは重要な課題である。
我々は、$p_mathrmlm( cdot mid mathrmconstraint)$からSMCサンプリングのための提案とポテンシャルを構築するための一般的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:58:18 GMT)
Multi-Agent Computer Use [72.8] 我々はマルチエージェント・コンピュータ・ユース(MACU)システムの評価・構築に向けて進むべきであると論じる。
本稿では、マネージャモデルがコンピュータ使用タスクを有向非巡回グラフ(DAG)として分解する汎用マルチエージェント構成を提案する。
各イテレーションで、マネージャは並列CUAサブエージェントをディスパッチし、DAGの準備ができているフロンティアでノードを実行する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:29:36 GMT)
FLARE: Diffusion for Hybrid Language Model [72.6] FLAREは、ハイブリッドアテンションな大規模言語モデルのための体系的な変換フレームワークである。
トークン平等なAR/拡散目標、ハードウェア対応カーネル、統一推論を組み合わせることで、ひとつのチェックポイントがARスタイルの検証された復号化と拡散スタイルの並列復号化の両方をサポートすることができる。
この結果から,実際のdLLMは復号化アルゴリズムだけでなく,データ品質や現在のブロック拡散目標のトレーニング非効率によって制限されていることが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:58:15 GMT)
CoreUnlearn: Rethinking Concept Unlearning through Disentangled Component-Level Erasure in Text-guided Diffusion Models [72.2] CoreUnlearnは、望ましくないコンセプトの消去クリティカルなコンポーネントを混乱させ、取り除くことを目的としている。
モデル全体のパフォーマンスへの影響を最小限に抑えて、効果的な概念消去を実現する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:09:45 GMT)
WorldMemArena: Evaluating Multimodal Agent Memory Through Action-World Interaction [72.2] マルチモーダルな言語モデルは、長距離エージェントとしてますます多くデプロイされている。
既存のベンチマークは、静的対話上のリコールを測定し、メモリを1つのタスクの精度に分解し、キャプションに対する視覚的な観察を減らす。
マルチモーダルエージェントメモリを,観測可能な4段階ライフサイクルを持つアクションワールドインタラクションループとして定式化する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:01:55 GMT)
AdaCodec: A Predictive Visual Code for Video MLLMs [66.3] 我々は,このインターフェースを音声予測ビジュアルコードと呼び,ビデオMLLMを textbfAdaCodec としてインスタンス化する。
AdaCodecは、条件付き予測コストが高い場合にのみ、参照フレームに完全なビジュアルトークンを使用する。
これは、動きや予測残差を含むフレーム間の変化をコンパクトなPトークンとしてエンコードする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:56:35 GMT)
Why Are DMD Students Lazy? Understanding the Copying Behavior in Few-Step Distillation [66.2] 分散整合蒸留 (DMD) は、全てのスケールでノイズ分布を整列することにより、事前学習した拡散モデルを効率的な数ステップ生成器に圧縮する。
意外なことに、高次元環境では、蒸留された学生が、教師のオリジナルのノイズデータペアリングを自然に再現することが、私たちがコピーと呼ぶ現象であることがわかった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:30:19 GMT)
FocusDiT: Masking Queries in Diffusion Transformers for Fine-grained Image Generation [64.7] 拡散変圧器(DiT)は、生成拡散場において広く採用されている。
より複雑な詳細に対応する重要なクエリトークンに注目することは、きめ細かいビジュアル生成に不可欠である。
本研究では,FFNにのみ入力される重要なクエリトークンにマスキング方式を適用するFocusDiTを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:18:11 GMT)
AVI-Bench: Toward Human-like Audio-Visual Intelligence of Omni-MLLMs [64.2] 我々は,Omni-MLLMを3段階,認識,理解,推論の3段階にわたって評価するベンチマークを導入する。
AVI-Benchは、モデル機能と障害モードのきめ細かい診断を可能にする。
PriSeは、未知の低セマンティック刺激を用いて、モデルの原始的な視覚感覚を探索する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:12:09 GMT)
TVIR: Building Deep Research Agents Towards Text--Visual Interleaved Report Generation [63.9] TVIR (Text-Visual Interleaved Report Generation) は、100名の専門家によるマルチモーダルディープリサーチタスクのベンチマークである。
TVIR-Agentは階層的なマルチエージェントフレームワークで、アウトラインの構築と画像検索のための強力なベースラインとして機能する。
テキストアセスメントとビジュアルアセスメントを組み合わせたデュアルパスアセスメントフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:35:14 GMT)
SOCO: Benchmarking Semantic Object Correspondence in Vision Foundation Models [63.3] セマンティックオブジェクト対応のための新しいベンチマークであるSOCOを紹介する。
視覚基盤のバックボーンは強い意味構造をエンコードするが、関連するカテゴリ間での伝達対応は不十分であることを示す。
また,LVLMは画像マッチングよりもテキストプロンプト部分のローカライゼーションが優れていることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:53:39 GMT)
Are Full Rollouts Necessary for On-Policy Distillation? [63.2] オンライン蒸留(OPD)は、学生が生み出すロールアウトに沿って密集した教師のフィードバックを提供する。
我々は、ロールアウトの地平線を、トレーニング効率に大きく影響を及ぼすOPDの重要なボトルネックとみなす。
本稿では,トレーニング中に徐々にロールアウト地平線を拡大するプログレッシブPDと,信頼性の高い切り抜きロールアウトで恒久的に蒸留を行うTrncated OPDの2つの簡単な水平制御戦略を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:41:45 GMT)
Not All Points Are Equal: Uncertainty-Aware 4D LiDAR Scene Synthesis [63.1] 我々は,空間不確実性を明確に活用し,LiDARシーン生成をガイドする新しいフレームワークであるU4Dを提案する。
nuScenesとSemantic KITTIの実験は、最先端のシーンの忠実さ、時間的一貫性、下流のパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:24:14 GMT)
OpenWebRL: Demystifying Online Multi-turn Reinforcement Learning for Visual Web Agents [61.4] 実際のWebサイト上で,オンラインマルチターンRLによるビジュアルWebエージェントのトレーニングを行うオープンフレームワークであるOpenWebRLを紹介した。
OpenWebRLは、スケーラブルなライブブラウザインフラストラクチャを含む、完全なトレーニングパイプラインをカバーしている。
私たちはOpenWebRL-4Bをトレーニングします。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:20:10 GMT)
SimSD: Simple Speculative Decoding in Diffusion Language Models [61.3] 拡散大言語モデル (dLLMs) は、並列またはブロックワイド復号による高速な推論を提供する。
彼らのマスク付き言語モデリングの定式化は、標準的なトークンレベルの投機的復号法とは相容れないままである。
我々は,dLLMに時間的に有効なトークンレベルのコンテキストを付与する,SimSDと呼ばれるdLLMの投機的復号アルゴリズムを提案する。
提案手法は,平均生成品質を維持しつつ,最大7.46倍高い復号スループットを実現する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:46:46 GMT)
PEAM: Parametric Embodied Agent Memory through Contrastive Internalization of Experience in Minecraft [59.8] 本稿では,MinecraftのParametric Embodied Agent MemoryフレームワークであるPEAMを紹介する。
PEAMは、エージェントメモリを推論時間検索から経験を通して内部化されたパラメータレジデントスキルに変換する。
PEAMは,長時間のタスクパフォーマンスを改善し,従来と統合されていたスキルの忘れを軽減し,パラメトリック・ヴァーサス・検索効率を向上させる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:20:53 GMT)
Turing Patterns for Multimedia: Reaction-Diffusion Multi-Modal Fusion for Language-Guided Video Moment Retrieval [59.6] ビデオ言語モデルは、時間的ビデオシーケンスとテキスト意味論の間の動的で非線形な相互作用を捉えるのに苦労することが多い。
反応拡散過程としてビデオ言語アライメントを再現する新しいフレームワークである textbfReaction-Diffusion Multimodal Fusion (RDMF) を提案する。
予備実験は、有能なビデオモーメントを識別する既存の手法より優れている可能性を実証している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:02:35 GMT)
CultureForest: Understanding and Evaluating Cultural Norm Grounded Reasoning in LLMs [59.1] TextitCultural Norm Grounded ReasoningのベンチマークであるCultureForestを紹介する。
CultureForestは8つのドメインで5,378のサンプルと53の国/リージョンで構成されている。
大規模な実験では、トップ層モデルでさえ、オープンな設定で大幅に劣化していることが明らかになった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:25:12 GMT)
Suppressing Forgery-Specific Shortcuts for Generalizable Deepfake Detection [59.1] ディープフェイク検出は偽造法全体の一般化が不十分である。
近年のアプローチでは一般化の改善が試みられているが、そのようなショートカットを特定して抑制するための明確なメカニズムは欠如している。
本稿では,メソッド固有のショートカットを明示的に特徴付け,抑制するショートカットサブスペース抑圧(S3)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:54:58 GMT)
Semantic Motion Anchors: Bridging Motion and Meaning in Co-Speech Gestures [58.6] そこで本稿では, 意味的動作アンカー, ジェスチャー動作の自然言語的抽象化, 物理的形状, コミュニケーション意図を提案する。
本手法は,3次元ジェスチャーを身体動作プリミティブに識別し,言語的に構造化された記述に分類し,転写文にグルーピングする。
BEAT2では,テキスト・モーション・ベースライン上でテキスト・ツー・ジェスチャR@1を8.2%改善する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:43:09 GMT)
Dynamic Spectral Denoising with Global-Context Attention for Multi-Behavior Recommendation [58.3] 重要なボトルネックは、2つの結合した不均一性によって引き起こされる表現レベルの失敗である、と我々は主張する。
マルチビヘイビアレコメンデーション(SpectraMB)のためのグローバルコンテキストを考慮した動的スペクトルデノベーションを提案する。
SpectraMBは、ほとんどの評価設定で最高の結果を達成し、ノイズのある相互作用下での堅牢性の向上を示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:58:13 GMT)
Large Byte Model: Teaching Language Models About Compiled Code [57.3] 大規模言語モデル(LLM)は、生のバイト表現を処理し、それらに関する質問に答えることはできない。
本稿では,bespoke byteトークンを用いた語彙拡張手法をベースとした,最初のバイトネイティブLSMを提案する。
このアプリケーションには、トレーニング中にドメイン知識を提供することが不可欠であることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:56:02 GMT)
Edge-directed geometric partitioning for versatile video coding [57.0] 本稿では,GEOのオーバヘッドを低減し,符号化効率を向上させるため,MPM(Most Probable Mode)リストを構築することでGEOモード予測戦略を提案する。
提案手法は, RA LDB の構成に対して VTM-6.0 と比較して平均0.58%, 1.00% の目標 BD レートゲインを提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:47:14 GMT)
From Extrinsic to Intrinsic: Geodesic-Guided Representation Learning for 3D Geometric Data [56.4] 我々は,textbfPreトレーニングのための新しい3D表現学習パラダイムであるtextbfPRISMを紹介した。
PRISMは textbfIntrinsic textbfSurface geodesic textbfMetric を検索して埋め込みを学習する。
提案手法は測地線距離予測において, 良好な精度, 堅牢性, 高効率性を示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:54:26 GMT)
Spatio-Temporal Correlation Guided Geometric Partitioning for Versatile Video Coding [55.4] 映像符号化の運動場における物体情報信号を記述するためのガイド付き幾何分割法(STGEO)を提案する。
提案手法は,分割モードや移動情報を含む側情報に対して消費されるビットをエコノマイズすることができる。
主なアイデアは、選択可能性の高いSTGEOモードと運動候補を予測することである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:11:50 GMT)
Deformable Wiener Filter for Future Video Coding [55.4] We propose a deformable Wiener Filter (DWF) for in-loop filters in Versatile Video Coding (VVC)。
局所特性と非局所特性を組み合わせて、ウィナーフィルタ理論に基づいてフィルタ係数を指導的に訓練する。
平均で1.16%、1.92%、および2.67%のビットレートの節約を実現している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:24:07 GMT)
MCP-Persona: Benchmarking LLM Agents on Real-World Personal Applications via Environment Simulation [55.1] MCP-Personaは,実世界向けパーソナライズされたMPPツール上でのエージェント性能を評価するために設計された,最初のベンチマークである。
MCP-Personaには、RedditやXiaohongshu(Rednote)のようなソーシャルメディアプラットフォームから、Lark(Feishu)やSlackといったエンタープライズコラボレーションスイートまで、さまざまな用途のアプリケーションが含まれている。
さまざまな最先端(SOTA)エージェントに関する実験は、パーソナライズされたツールの使用に対する大きな苦労を実証し、これらの制限を特定し、対処する上で、ベンチマークが重要な役割を担っていることを強調した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:44:10 GMT)
Multilinguality of Large Language Models From a Structural Perspective [55.1] 大規模言語モデル(LLM)は、多言語データに対する事前および後訓練によって複数の言語を処理するのに優れている。
その結果,低リソース言語は高水準言語や中級言語と構造的に異なることが明らかとなった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:18:09 GMT)
SCAPO: Self-Supervised Category-Level Articulated Pose Estimation from a Single 3D Observation [55.0] 本稿では,1つのRGB-D観測から標準幾何,剛部分セグメンテーション,関節ピボット,軸,調音状態を推定する自己教師型フレームワークを提案する。
合成および実調音オブジェクトデータセットの実験により、SCAPOは、一貫した部分構造と正確な調音パラメータを復元し、全ての自監督ベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:04:49 GMT)
EntangleCodec: A Unified Discrete Audio Tokenizer via Semantic-Acoustic Entanglement [55.0] EntangleCodecは、量子化の前にキャプションに沿った意味音響表現を学習する独立したオーディオトークンである。
コンパクトなトークンストリーム内に言語内容、話者識別、感情、韻律、音響シーンをキャプチャする。
特殊なコーデックと競合する再構成品質を実現し、統合されたフレームワークでTSとTTAの生成をサポートする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:05:18 GMT)
PaSBench-Video: A Streaming Video Benchmark for Proactive Safety Warning [54.7] ビデオ対応の大型言語モデル(MLLM)は、このウィンドウ内で警告を発する常時オンの安全モニタとして機能する。
今回紹介するPaSBench-Videoは、481のリスクと4つのドメインにわたる259のリスクビデオを備えた740のビデオベンチマークだ。
最も厳密な基準ではモデルが20.0%を超えることはなく、リコールは偽陽性率と強く結びついている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:14:01 GMT)
Not What, But How: A Communicative Audit of LLM Response Framing [54.3] 大規模言語モデル(LLM)は、主観的、情報探索的な疑問に答えるためにますます使われている。
既存の主観的文化的クエリの評価は、応答のフレーム化を無視して、事実の正しさに重点を置いている。
FRANZ(FRAmework for respoNse characteriZation)を導入し、4次元のLLM応答のコミュニケーション監査を行う。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:01:31 GMT)
MOSS-Video-Preview: Toward Real-Time Video Understanding via Cross-Attention [53.8] クロスアテンションバックボーンは、一般的なデコーダのみの設計よりもリアルタイムの視覚言語融合に適していることを示す。
我々のモデルはQwen2.5-VL-7Bベースライン全体に続く。
256フレームの1つのH200では、最初のトークンの5倍のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:07:15 GMT)
Effective Multi-sensor Conditioning for Street-view Novel-view Synthesis [53.7] ビデオ拡散フレームワークであるStreetNVSを紹介する。
我々は,高架,車線シフト,引き戻し,回転などの極端な軌道外経路に沿ってコヒーレントな映像を合成する能力を示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:37:56 GMT)
Adversarial Dual On-Policy Distillation from Expressive Teacher [53.6] フローマッチングの教師は、デモから学び、軽量の学生と共同で訓練される。
教師は学生のロールアウトに2つの補完的な信号を提供します。
アクションチャネルは、学生が訪問する州で密集したローカルターゲットを提供し、搾取を安定化させる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:46:42 GMT)
BehaviorBench: Modeling Real-World User Decisions from Behavioral Traces [53.6] textscBehaviorBenchは、実世界の行動トレースからパーソナライズされた意思決定モデリングを評価するためのベンチマークである。
textscBehaviorBenchは、公開市場とオンチェーンの記録からウォレットレベルの意思決定履歴を再構築する。
2,000以上の評価ウォレットで、ベンチマークには141,445のBeliefインスタンスと1,485,972のTradeインスタンスが含まれている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:04:36 GMT)
MaskForge: Structure-Aware Adaptive Attacks for Jailbreaking Diffusion Large Language Models [53.1] MaskForgeは完全にブラックボックス対応の攻撃で、構造パターンのライブラリを最適化した検索としてdLLMのレッドチームを実行する。
攻撃成功率は79.3%であり、最強のdLLMベースラインよりも17.6%向上している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:10:21 GMT)
ResMerge: Residual-based Spectral Merging of Large Language Models [52.7] 本稿では,RL専門家のための残留スペクトルマージフレームワークResMergeを提案する。
本稿では,RL専門家のための残留スペクトルマージフレームワークResMergeを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:42:45 GMT)
What to Test Next: Interpretable Coverage Gap Discovery in Driving VLMs [52.5] 視覚言語モデル(VLM)を駆動するには,操作設計領域(ODD)が定義する様々な条件のシーンを正確に理解する必要がある
SliceScorerは、欠落したスライス推薦のための決定論的スコアリングルールである。
SliceNavは, 従来のスライス発見法よりも, 高リスクカバレッジギャップを効果的に表面化することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:18:01 GMT)
Fast Unlearning at Scale via Margin Self-Correction [52.5] 言語モデルアンラーニングは、トレーニングモデルを更新して、選択したトレーニング例を見ていないかのように振る舞う。
MASCは、既存のベースラインの計算コストのごく一部で、競争力のある忘れがちなトレードオフを達成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:49:54 GMT)
MotionDreamer: Universal Skeletal Motion Generation for 3D Rigged Shapes [52.5] MotionDreamerは、2Dビデオガイダンスからカテゴリに依存しない骨格アニメーションを生成するための拡散ベースのフレームワークである。
本研究では,2次元視覚運動キューとヘテロジニアスな3次元骨格構造とのギャップを埋める構造的意味注入機構を提案する。
提案手法は既存の手法を著しく上回り、堅牢で効率的な4Dアセット生成のための最先端のベンチマークを新たに設定する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 00:42:31 GMT)
Aligning Data-Driven Predictors with Allocation: A Decision-Focused Approach to Survival Analysis [52.1] 機械学習予測器は、アロケーションに使用する場合、任意に貧弱な結果が得られることを示す。
正規化割引累積ゲイン(NDCG)の最適化に基づく意思決定型学習手法を提案する。
既存の生存モデルのNDCGを最適化するためのブートストラップ手法を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:03:22 GMT)
Moment-Video: Diagnosing Temporal Fidelity of Video MLLMs on Momentary Visual Events [52.0] ビデオマルチモーダル大言語モデル(MLLM)は、一般的なビデオ理解と長大なビデオ理解を急速に進歩させてきたが、短い回答クリティカルな視覚的証拠を保存できる能力はいまだに未発見のままである。
本稿では,映像MLLMの時間的忠実度を時間的視覚的事象理解によって診断するためのベンチマークであるMoment-Videoを紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:32:20 GMT)
LL-Bench: Rethinking Low-Level Vision Evaluation in the Era of Large-Scale Generative Models [51.9] LL-Benchは、低レベル視覚タスクにおける大規模生成モデルの能力を評価するためのベンチマークである。
本稿では,大規模生成モデルの性能境界とフェールの一様モードを明らかにする体系的な診断法を提案する。
MLLMに基づく評価器であるtextbfLL-Score を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:40:09 GMT)
Off-the-Shelf LLMs as Process Scorers: Training-Free Alternative to PRMs for Mathematical Reasoning [51.9] Chunk-Level Guided Generationは、既製の大規模言語モデルをプロセススコアラとして使用する、トレーニング不要の代替手段である。
本研究では,系統的な長さバイアスのため,大モデル確率の可変長推論ステップが信頼できないことを示す。
Chunk-Level Guided Generation は PRM guided search よりもかなり短い推論トレースを生成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:43:36 GMT)
MobEvolve: An Agentic Self-Evolving Heuristic System for Interpretable Human Mobility Generation [51.8] MobEvolveは、人間のモビリティ生成のための自己進化フレームワークである。
エージェントを使用して、内部ロジックを反復的に進化させる。
最先端の深層生成法とLLMベースの手法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:46:25 GMT)
Dexterity-BEV: Aligning 3D World and Actions for Generalizable Robot Policies Learning [51.8] エンドツーエンドの操作ポリシーは、汎用的で巧妙なロボット操作を約束することを示している。
2Dファンデーションモデルから2つの重要な制限を継承する。
これらの問題に対処するために、一連のコントリビューションを提示します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:01:11 GMT)
Initialization is Half the Battle: Generating Diverse Images from a Guidance Potential Posterior [51.6] 誘導電位後部から初期雑音の選択を定式化し,多様性に富む領域への事前の重み付けを効果的に行う。
この分布を効率的にサンプリングするために、ダイバーシティ誘導初期化(DivIn)を紹介する。
本手法は,拡散モデルと流れマッチングモデルの両方に適合する推論時多様性向上として機能する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:25:10 GMT)
Which Defense Closes Which Threat? Attributing OWASP-LLM-Top-10 Coverage and Its Brittleness Under Paraphrasing [51.6] プロダクションLLMアプリケーションは、いくつかの防衛ファミリを積み重ねる -- 拒絶フレーズフィルタ、トークンバッジコントロール、モデル許容度リスト、レート制限、ツール登録認証 -- が、BASベンチマークでは、単一の集計カバレッジ番号を報告している。
21エージェントベースラインスキャナに4つのLLM-Top-10対応エージェントを追加し、4つの合成LDMエンドポイントの格子をターゲットとした。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:39:25 GMT)
Representational Capacity: Geometric Limits on Feature Representation in Transformer Language Models [51.6] モデルがサポートできるほぼ直交方向数を推定するためのフレームワークを開発する。
このメトリックを数十のオープンソースモデルに適用すると、高い$varepsilon$を持つモデルと、それを維持する$varepsilon$の低いモデルという2つのクラスが明らかになる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:28:56 GMT)
Single-Line Drawing Generation via Semantics-Driven Optimization [51.3] 本稿では,ベクトル形式で1行の描画を自動的に生成するセマンティクス駆動方式を提案する。
本手法は,一様有理B-スプライン曲線(URBS)のパラメータを最適化するために,スコア蒸留サンプリングを利用する。
本手法はベクトル化曲線を生成するため, 直結する下流加工プロセス, レーザーエッチング, ワイヤ曲げなどの加工を支援できる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:46:22 GMT)
Where Do Deep-Research Agents Go Wrong? Span-Level Error Localization in Agent Trajectories [51.2] 最終回答に基づく評価は、エージェントが成功するかどうかを示すが、どの部分の軌道が答えを信頼できないかを示すものではない。
2つのエージェントフレームワーク、3つのバックボーンモデル、3つのベンチマークから2,790の実際のトラジェクトリを収集し、生ログをセマンティックスパンに変換し、エキスパートレビューを通じて有害なエラースパンを注釈付けします。
我々は,エージェントの主張を追跡するクレーム中心の監査フレームワークであるDRIFTを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:50:26 GMT)
Disentanglement-Based Equivariant Learning for Compositional VQA [51.1] 本稿では,合成VQAのための新しいディスタングルメント・エクイブアリアント学習フレームワークを提案する。
我々は、再エンコードフレームワーク内で視覚的およびテキスト的入力から導かれる概念をアンタングル化するために因果性にインスパイアされた介入を用いる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:28:37 GMT)
An Algebraic View of the Expressivity of Recurrent Language Models [50.9] 本稿では、繰り返しニューラルネットワークの表現性に関する統一的代数的記述法を開発する。
同じアーキテクチャでは、浮動小数点反復が強制されると偶モジュラーカウンタを実装することはできないが、符号付き整数量子化の下ではすべての偶モジュラーカウンタを実現する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:47:58 GMT)
Explainable Forensics of Manipulated Segments in Untrimmed Long Videos [50.2] 時間的AI生成セグメンテーションの局所化と説明のタスクを定式化する。
多様な操作パターンと豊富なアノテーション信号を備えた12,472の未トリミングビデオからなる大規模ベンチマークであるTASLEを紹介する。
そこで本稿では,MLLMに基づく精密な境界ローカライゼーションと解釈可能な推論のためのリファインメントモジュールと,効率的な長ビデオスキャンのためのバウンダリ感性提案生成モジュールを組み合わせた,粗大な法医学ベースラインであるMSLocを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:48:38 GMT)
Variational Learning for Insertion-based Generation [50.2] 可変長挿入モデルの挿入順序を学習するための確率的フレームワークを提案する。
本稿では,挿入する場所,挿入する場所,終了するタイミングを共同で学習する生成モデルであるInsertion Process (IP)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:59:46 GMT)
A Local Perturbation Theory for Cross-Domain Interference and Recovery in Multi-Domain RL [49.6] 単一領域のRLは、上位変化ニューロン間の重なりが弱い、スパースで小振幅のパラメータの編集を生成する。
マルチドメインRLの局所モデルの下では、後続のドメイントレーニングは、主に2階の損傷項によって、以前のドメインに害を与えることが証明される。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:44:56 GMT)
Visual Graph Scaffolds for Structural Reasoning in Large Language Models [49.5] グラフは、大きな言語モデル(LLM)を強化するために使われてきた。
本稿では, LLM のグラフの値は情報提供だけでなく, 組織的推論にも当てはまる。
人間はグラフ構造化マインドマップを使って、枝分かれや収束する思考を整理し、グラフが推論支援の内的形態として機能するかどうかを問う。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:17:52 GMT)
Question-Aware Evidence Ledgers for Video Relational Reasoning [49.2] 我々は,強力なGPT-5.5ビデオQA解決器と疑似エビデンス台帳のセットを中心に構築されたテスト時間推論パイプラインを提案する。
パイプラインは92.95%の総合精度と93.79%のマクロ精度を達成した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:18:03 GMT)
Auteur: Language-Driven Cinematographic Framing for Human-Centric Video Generation [48.5] 生成ビデオにおける言語駆動型人中心カメラフレーミングの手法であるAuteurを提案する。
Auteurは、人中心のシーンの撮影フレーミングを可能にする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:41:01 GMT)
CalArena: A Large-Scale Post-Hoc Calibration Benchmark [48.1] ポストホックキャリブレーションのための大規模で標準化されたベンチマークを導入する。
私たちのベンチマークでは、さまざまな古典モデル、現代的なディープラーニングアーキテクチャ、基礎モデルからの予測を集約しています。
適切なスコアリングルールにおけるポストホック改善(PHI)は、従来のキャリブレーション誤差推定器に代わる原則的な代替手段であると主張する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:20:48 GMT)
Plan2Map: A Multimodal Benchmark for Document-Grounded Geospatial Boundary Reconstruction from Planning Records [47.1] Plan2Mapは、イギリスの計画記録から文書化された地理空間境界再構築のための208ケースのベンチマークである。
提案するGeoPlanAgentは,そのタスクをエビデンス抽出,ローカライゼーション,マップ登録,境界セグメンテーション,プロジェクション,検証に分解する。
Plan2Mapでは、GeoPlanAgentが0.736の平均IoUと0.904中央IoUを達成した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:12:16 GMT)
Beyond Isolated Behaviors: Hierarchical User Modeling for LLM Personalization [46.6] 大規模言語モデル(LLM)は、様々な領域にまたがる顕著な能力を示してきたが、個々のユーザにアウトプットをパーソナライズすることは、依然としてオープンな課題である。
既存のアプローチは主にフラットな振舞いパラダイムを採用し、より深い振舞い構造にどのように組織化されているかを明確に説明せずにユーザーの振舞いを集約する。
実践としての個人行動, 習慣としての時間的蓄積, 類似のユーザ間での規則性の共有という3つの階層的なレベルを通じて, LLMのパーソナライゼーションを再認識する社会学的基盤の枠組みであるPHFを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:23:17 GMT)
Exploiting Semantic and Pixel Representations for Ultra-Low Bitrate Image Compression [46.5] SPRDiffは、意味表現とピクセル表現の両方を完全に活用する拡散ベースの圧縮手法である。
我々は,事前学習された歪み指向および意味指向エンコーダから高忠実度特徴を利用する三重エンコーダアーキテクチャを開発した。
ベンチマークデータセットを用いた実験により,本手法は速度-歪-知覚トレードオフにおいて最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:59:31 GMT)
Joint Agent Memory and Exploration Learning via Novelty Signals [46.4] オープンエンド環境では、自律的なエージェントのための探索が基本である。
textbfJoint textbfAgent textbfMemory と textbfExploration textbfLearning (textbfJAMEL) を導入する。
textbfJAMELは、新しいインタラクションを通じてエージェントメモリと探索ポリシーを一緒に訓練するフレームワークである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:20:26 GMT)
Accelerating Min-Max Optimization via Power-Law Stepsizes [46.2] 本稿では,非拘束的ビファインmin-max最適化に対するEG法(Extragradient)の収束保証を再検討する。
決定論的動的段階化スケジュールは、任意の$varepsilon > 0$に対して、EGの収束速度を$mathcalO(T-2/3+varepsilon)$に加速させることを示す。
次に、外挿と更新の異なるステップ化を許すことで、ほぼ最適の$mathcalO(T-1+varepsilon)$への収束率がさらに向上することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:45:16 GMT)
AVTrack: Audio-Visual Tracking in Human-centric Complex Scenes [45.3] 音声-視覚的話者追跡は、聴覚と視覚の手がかりを活用して、アクティブな話者をローカライズし、追跡することを目的としている。
既存のデータセットは、粗いアノテーションを持つ単純または均質なオーディオ視覚シーンに限られている。
AVTrackは、動的実世界のシナリオ用に設計された、人間中心の音声視覚インスタンスセグメンテーションデータセットである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:00:08 GMT)
SeeTraceAct: Visibility-Aware Latent Planning from Cross-Embodiment Demonstration Videos [44.6] 本研究では,視覚言語行動モデル(VLA)について検討する。
SeeTraceActは、将来のエンドエフェクタトレースの可視性を考慮した予測を通じて、正確な空間的接地を促進する。
RoboCasa-DCの実験と、Franka Pandaの腕が人間のデモで条件付けられている実世界のベンチマークは、SeeeTraceActがベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:09:31 GMT)
Speculative Sampling For Faster Molecular Dynamics [44.6] 分子動力学(MD)を加速するための投機的サンプリング装置であるLangevin Speculative Dynamics (LSD)を紹介する。
言語と拡散モデルにおける投機的手法にインスパイアされたLSDは、高速なシミュレーションステップの提案にドラフトモデルを使用し、より遅いターゲットモデルと並列に検証する。
また,LSDが対象モデル分布からトラジェクトリを抽出したことを理論的,実証的に確認した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:25:31 GMT)
Policy and World Modeling Co-Training for Language Agents [44.6] 強化学習(RL)は、大きな言語モデル(LLM)エージェントを、高い報酬をもたらすアクションを教えることによって改善するが、これらのアクションが環境に何をするかをほとんど監督しない。
世界モデリング(WM)はこのギャップを埋めることができますが、既存のアプローチでは、個別のシミュレータ、追加のトレーニングステージ、追加の推論時間計算が必要です。
我々は、推論パラダイムを変更することなく、RL中に同一ポリシーに補助的なWM監督を追加する政策・世界モデリング協調学習フレームワークPaWを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:35:40 GMT)
Order within Chaos: Capturing Intrinsic Energy Anomalies for AI-Manipulated Image Forgery Localization [44.5] 生成AIの最近の進歩は、現実的な偽造を生成できる画像編集モデルに繋がった。
本稿では,LADマップを用いて固有異常を捕捉する統合フレームワークFLAMEを提案する。
法医学的なベンチマークと進化する生成モデルの間の遅延を埋めるために、EditStreamを紹介します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:36:04 GMT)
FairGen: Preference-Aligned Diffusion for Demographically Equitable Medical Image Synthesis [44.2] 人口統計学的にバランスの取れた医療画像を合成するフェアネス対応拡散フレームワークであるFairGenを紹介する。
医師の好みを生成プロセスに組み込むことで、FairGenは合成時のカバレッジと下流の分類を改善する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:45:20 GMT)
Fast Generalization after Interpolation via Critically Damped Momentum Optimization [44.0] GROKtimizerは低ノルム補間解を選択するための自然な解であることを示す。
GROKtimizer は古典的な勾配勾配よりも2次的なスピードアップを提供し、一階一般化の中で証明可能な最適性を提供する。
我々は,高品位一般化モデルの構築における補間後のダイナミクスの重要性を強調して,フラット・ミニマ仮説を用いて解析を行った。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 00:54:45 GMT)
Pave-GRPO: Beyond Instantaneous Guidance through Principled Average Velocity Decomposition [43.9] グループ相対政策最適化は、フローベースの生成モデルと人間の嗜好を整合させる強力なパラダイムとして登場した。
原理的平均速度分解によりGRPOの目的を再構築するPave-GRPOを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:41:04 GMT)
Parameter-efficient Dual-encoder Architecture with Differentiable Choquet Integral Fusion for Underwater Acoustic Classification [43.9] 本稿では、音響波形とスペクトログラムを同時に処理するデュアルエンコーダニューラルアーキテクチャを提案する。
潜在的な非対称なチャネル歪みによって最小に劣化した表現に動的に注意を移すことにより、提案したゲーティング機構は水中環境の非定常的課題を緩和する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:49:38 GMT)
Data-Driven Forecasting of three-Component Seismograms Using Transformer Architectures [43.9] 我々は,3成分地震波形を時間領域内で直接予測するために,変圧器を用いた自己回帰モデルであるtextscSeismoGPTを紹介した。
震源深5-100,km,震源中央距離10-90$$$,震源深3leqM_w leq7$の合成地震計を用いて評価を行った。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:38:03 GMT)
Goal2Pixel: Grounding Goals to Pixels for Vision-Language Navigation [43.8] 視覚言語モデル(VLM)は、連続環境(VLN-CE)における視覚・言語ナビゲーションの共通基盤となっている。
本稿では,VLN-CEをナビゲート可能な画素グラウンドングとして再構成する,純粋なピクセルベースのパラダイムであるGoal2Pixelを提案する。
Goal2Pixelは、従来のメソッドよりもVLM推論呼び出しを少なくしながら、最先端の競合性能を実現している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:12:58 GMT)
K-BrowseComp: A Web Browsing Agent Benchmark Grounded in Korean Contexts [43.3] 我々は,K-BrowseCompを紹介した。K-BrowseComp,K-BrowseComp,K-BrowseComp,K-BrowseComp,K-BrowseComp,K-BrowseComp,K-BrowseComp,K-BrowseC omp,K-BrowseComp。
300プロブレムのK-BrowseComp-Verifiedサブセットは、韓国のネイティブスピーカーによって手作業で構築され、検証される。
このサブセットでは、GPT-5.5、DeepSeek-V4-Pro、GLM-5.1を含むフロンティアのLLMが30.00--45.67%にしか達せず、BrowseCompから大幅に落ち込んだ。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:50:03 GMT)
Hand Trajectory Fusion for Egocentric Natural Language Query Grounding [43.1] Egocentric Natural Language Query (NLQ) グラウンドでは、フリーフォームのテキストクエリに応答する時間間隔の長い1対1のビデオで、モデルをローカライズするよう求めている。
ハンドスケルトン列を高意味的手動特性に変換するハンドトラジェクトリエンコーダを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:46:18 GMT)
GeoDrive-Bench: Benchmarking Region-Specific Multimodal Reasoning in Autonomous Driving [43.0] 自動運転のための視覚言語モデル(VLM)は有望な性能を示しているが、地域固有の交通ルールを扱う能力はいまだ探索されていない。
本稿では,VLMの地理文化的根拠に基づく運転推論の体系的調査を可能にする新しいベンチマークであるGeoDrive-Benchを紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:36:46 GMT)
Hybrid Neural Ordinary Differential Equations for Data-Efficient Polymerization Modeling with Incomplete Kinetics [42.6] 自由ラジカル重合のデータ効率モデリングのためのハイブリッドニューラル正規微分方程式フレームワークを提案する。
ハイブリッドNODEは、離散時間フィードフォワードニューラルネットワークと、スパースデータ条件下で純粋にデータ駆動のNODEに対して評価される。
ノイズの多いデータと目に見えない操作条件の一般化シナリオでは、ハイブリッドNODEはデータ駆動NODEの0.31と離散時間モデルでの0.68に対して、RMSEの0.013を達成している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:10:48 GMT)
Closing the Alignment-Maturity Gap in Federated Prototype Learning [42.2] FedSAPは2つの相補的なメカニズムを通じてフェデレーション学習を安定化するフレームワークである。
実験では、評価されたプロトタイプベースラインよりも最大4ポイント向上した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:30:53 GMT)
Why Larger Models Learn More: Effects of Capacity, Interference, and Rare-Task Retention [42.1] より大規模なモデルでは、無限のトレーニングデータであっても、小さなモデルでは学習できないタスクが学習されることが示される。
特に、より小さなモデルでは、ニューロンを高頻度または低複雑性のタスクに割り当て、希少で複雑なタスクでは不十分なソリューションを学ぶ。
次に、より大きなモデルがこのデータ中心のボトルネックを回避し、干渉機構の低下に辿り着くかを評価する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:29:35 GMT)
Adaptive Auto-Harness: Sustained Self-Improvement for Agentic System Deployment on Open-Ended Task Streams [41.7] このようなストリームのためのフレームワークとシステムであるAdaptive Auto-Harnessを紹介します。
オラクルハーネスとのギャップを進化損失と適応損失に分解する。
予測市場、セキュリティ競争、イベント予測ストリームで、既存の5つのオートハーネスベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:51:14 GMT)
Towards 3D-Aware Video Diffusion Models: Render-Free Human Motion Control with Mesh Tokenization [41.6] 圧縮された3次元メッシュトークン上で直接ビデオ生成を行うレンダリングフリーフレームワークを提案する。
この表現は、統一されたトークンベースの生成パイプラインを可能にしながら、完全な3D幾何情報を保存する。
実験の結果,人間の動作制御ベンチマークにおいて,ビュー依存の2D誘導や軌道上のミスマッチによって誘導されるアーティファクトを低減しつつ,強い性能を示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:56:48 GMT)
Quantum secure blind decryption with two users [41.4] 量子セキュアブラインド復号化のための2種類のプロトコルを提案する。
ユーザは、サーバからのテキストの機密性を保証する。
サーバは、ユーザのキーの機密性を維持する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:10:00 GMT)
The Road Ahead in Autonomous Driving: The KITScenes Multimodal Dataset [41.0] KITScenes Multimodalは、高忠実度センサーとマップを中心に構築されたヨーロッパのデータセットである。
当社のHDマップは,オープンソースソフトウェア上での自動運転試験を通じて検証されたセンサデータセットの中で,最も完全なものです。
パブリックデータセットで初めて、交通信号などの運転関連トラフィック要素はすべて、3Dで再投射精度の高いレベルにマッピングされる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:23:14 GMT)
Extreme Low-Bit Inference in Reasoning Models: Failure Modes and Targeted Recovery [40.9] 生成プロセスの不安定性はトークン数を膨らませるため、2ビットのアグレッシブ推論がエンドツーエンドのスピードアップを達成できないことを示す。
Qwen3推論モデルの完全な推論トレースを数学的および常識的なベンチマークで分析する。
以上の結果から, 異常を制御可能な世代病理として扱うと, 極端に低ビット推論が現実的になることがわかった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:04:09 GMT)
SentGuard: Sentence-Level Streaming Guardrails for Large Language Models [40.0] 本稿では,文レベルのストリーミングガードレールであるSentGuardを提案する。
構造化された文毎アノテーションによるベンチマークは、推論と応答セグメントの両方にわたる安全性リスクの進化をキャプチャする。
実験の結果、SentGuardは既存のベースラインを上回り、2文以内に90.5%の安全でないケースを検出し、低ストリーミングの偽陽性率7.41%を維持した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:30:08 GMT)
Attention-guided Fine-tuning of Multimodal Large Language Models Improves Chain-of-Thought Reasoning [39.5] MLLM (Multimodal Large Language Models) におけるChain-of-Thought (CoT) の促進はいまだに不確実である。
我々は,CoTトラジェクトリに応答のコミットメントを遅らせるよう促す注意誘導微調整目標であるAttentive-CoT(Att-CoT)を提案する。
Att-CoTはアーキテクチャの変更なしに任意のCoT-SFTトレーニングにプラグインできる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:02:23 GMT)
Astra: a generalizable report generation foundation model for 3D computed tomography [39.4] 90, 胸腹部CT-Report pairs (CTRgDB) を訓練し, 8臓器系に353,671の異常を認めた。
Astraは44.1%の詳細な診断基準で、最先端の完全性を達成している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:07:28 GMT)
Ranking vs. Assignment: The Metric Mismatch in Multi-View Object Association [39.3] マルチビューオブジェクトアソシエーションは重要なコンピュータビジョン問題である。
最近の研究は、モデル評価においてAPやFPR-95のようなペアのランキングに大きく依存している。
我々は、アサインが既に正しい場合でもAPとFPR-95は不完全であり、シンクホーンに基づく正規化はそれらを完璧にすることができることを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:11:51 GMT)
SIRI: Self-Internalizing Reinforcement Learning with Intrinsic Skills for LLM Agent Training [39.3] ロングホライゾンLSMエージェントは、再利用可能なスキルの恩恵を受けることができるが、既存のスキルベースの手法は、トレーニング中や推論時の永続的なスキル検索に外部スキルジェネレータに依存することが多い。
エージェントが外部スキルジェネレータや推論時スキルバンクを使わずに、スキルの発見、検証、内部化を可能にする3段階フレームワークである、内在的スキルを用いた自己内在的強化学習(SIRI)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:02:59 GMT)
The Ghost Annotator: a Framework to Explore Human Label Variation in Content Moderation through Conformal Prediction [39.1] 共形予測と協調フィルタリングスタイルのアノテータ表現を組み合わせたフレームワークを提案する。
非整合スコアを用いて、モデル予測が利用可能なすべてのアノテーションから発散するケースを定量化するために、ゴースト予測メトリックとゴーストアノテーション表現を導入する。
我々の発見は、アノテータの不一致によって全てのモデルの不確実性が増大する一方で、より大きなモデルは、人間のアノテーションと一致しないテキストの分類により自信を持つ傾向にあることを示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:32:37 GMT)
Thinking Past the Answer: Evaluating Harmful Overthinking in Large Reasoning Models [38.8] 第1の正しい接頭辞の停止は、標準的推論よりも21%の精度向上を示す。
早期停止のような一般的な効率戦略は、冗長な過度な考えを著しく減らすが、有害な過度な過度な考えを軽減できない。
我々の研究結果は言語のみの推論ベンチマークに一般化され、より広範な信頼性リスクとして有害な過ちを浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:59:27 GMT)
No Free Lunch for Synthetic Images under Data Scarcity Conditions [38.5] 本研究では,データ不足とプライバシ感受性の条件下での合成データ生成における忠実度,プライバシ,ユーティリティのトレードオフについて検討する。
本稿では,これら3つの次元を共同で評価し,VAE,GAN,DDPMの3つの広く利用されている生成モデルに適用する評価フレームワークを提案する。
この評価は、MNIST、OCTMNIST、OrganAMNISTの3つの画像データセットにまたがっており、汎用画像領域と医用画像領域の両方を含んでいる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:45:02 GMT)
From Capability Models to Automated Planning: An AAS-Native Approach for Automatic PDDL Generation [37.7] Asset Administration Shells (AAS) は産業4.0における産業資産の標準化されたデジタルツインとして登場した。
AAS機能モデルは,4つの確立された産業用4.0標準を用いて構成され,PDDL問題を自動生成するための十分な情報を含んでいることを示す。
提案手法は,資源関数のドメインレベルの記述,いわゆる機能から,PDDL構文や計画概念に縛られることなく,エンジニアが機能をモデル化できるという,すべての計画要素を導出する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:27:41 GMT)
Mechanistic Diagnostics of Spatial Lexical Bias in Multimodal Large Language Model Spatial Reasoning [37.6] 応答オプションに空間関係語を追加することで、モデルの判断を引き付けることができ、新たに追加されたオプションを選択する可能性が高まる。
モデルが二項空間問題に正しく答えられるが、解集合に追加されると不正確な第3の空間オプションが一貫して選択されることを示す。
単一オブジェクト対合成データに対する軽量なLDMのみのDPO更新がバイアスを軽減することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:49:47 GMT)
OctoT2I: A Self-Evolving Agentic Text-to-Image Router [37.1] 生成品質と推論効率の協調最適化として,テキスト・画像タスクを再構成する新しいエージェントフレームワークであるOctoT2Iを紹介する。
OctoT2Iは、その知識とメモリに基づいて最適なツールを適応的に選択するステートフルなマルチラウンドルーティング戦略を実装している。
実験により、OctoT2IはGenEval上での競争性能(0.96)を達成することが示された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:21:01 GMT)
Chutes and Ladders: Dynamical Automorphisms via the ZX-Calculus [37.1] 動的安定化符号の処理にはZX-calculus言語を用いる。
安定化器符号の空間に閉ループを実装するためにゲージ固定ステップを組み合わせる。
これにより、動的自己同型を構築するための機械解釈可能な方法が得られる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:46:09 GMT)
ProbRes: Volatility Learning for Probabilistic Time-Series Forecasting [37.0] 本稿では,確率予測にボラティリティのダイナミクスを明示的に学習し,組み込んだポストホック確率キャリブレーション手法ProbResを提案する。
ProbResは正確に予測分布をキャプチャし、よく校正された予測間隔を生成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:49:03 GMT)
MMG2Skill: Can Agents Distill In-the-Wild Guides into Self-Evolving Skills? [36.9] MMG2Skillは、ワイルドガイドをエージェント実行可能なスキルに変換するためのフレームワークである。
MMG2Skillは、モデルドメイン設定毎にバニラベースラインエージェントを一貫して上回る。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:50:40 GMT)
Policy-based Foveated Imaging and Perception [36.7] 本稿では,画像取得時に直接動作するリアルタイム,予測的,タスク対応のファベードイメージングシステムを提案する。
本研究では,センサアテンションポリシー学習問題として,過去の観測行動が将来の測定値を決定することを導いた。
我々は,200メガピクセルのデュアルストリームセンサを用いて,現実的な帯域幅とレイテンシの制約下で実世界の映像をキャプチャするシステムの有効性を検証した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:55:05 GMT)
WRIT: Write-Read Intensive Trajectory Synthesis for Multi-Turn User-Facing Agents [36.2] We propose WRIT (ulineWrite-ulineRead uline Intensive ulineTrajectory Synthesis, a pipeline for synthesizing multi-turn agent training trajectories。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:25:06 GMT)
Mitigating Perceptual Judgment Bias in Multimodal LLM-as-a-Judge via Perceptual Perturbation and Reward Modeling [35.9] MLLMの裁判官は、視覚的証拠がテキストの手がかりと矛盾する場合、知覚的に正しい答えに対して、もっともらしい物語に報いる傾向がある。
本稿では,最小限に編集された反事実応答を構成するPerceptually Perturbed Judgmentデータセットを提案する。
我々は、構造化GRPOベースの報酬とバッチレベルの目標を組み合わせた統一的なトレーニングフレームワークを開発し、明示的なペアワイドラベルを使わずにコヒーレントなグローバルオーダを実現する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:59:46 GMT)
SafeMCP: Proactive Power Regulation for LLM Agent Defense via Environment-Grounded Look-Ahead Reasoning [35.9] 大規模言語モデル(LLM)エージェントは、複雑な環境での操作にモデルコンテキストプロトコル(MCP)をますます活用している。
我々は,将来の安全リスクに関する予測的推論を通じてツールの取得を制約するサーバサイドディフェンスプラグインであるSafeMCPを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:48:41 GMT)
MORPHOS: Autoregressive 4D Generation with Temporal Structured Latents [35.8] MORPHOSはビデオから動的3Dアセットを多種多様な表現で生成する新しい自己回帰フレームワークである。
我々は、時間次元に沿って幾何学と外観を共同で符号化する統合された4次元表現であるT-SLAT(Temporal Structured Latents)を導入する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:01:21 GMT)
ToolFG: Towards Well-Grounded Fine-Grained Image Classification [35.6] 画像のきめ細かい分類に適したMLLMベースの最初のツール統合フレームワークである textbfToolFG を提案する。
ToolFGはMLLMが推論プロセス中に外部ツールを自律的かつ柔軟に使用できるようにする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:27:48 GMT)
Scaling Laws for Neural-Network Quantum States [35.5] スケーリング法則は、学習問題の複雑さを特徴づける方法を提供する。
スケーリング法則は変動解のベンチマークに利用できることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:59:01 GMT)
Investigating and Alleviating Harm Amplification in LLM Interactions [35.4] 私たちは、12のリスクカテゴリにまたがるマルチターン調和増幅シナリオのための新しいベンチマークであるHarmAmpを紹介します。
有害なトラジェクトリを予測し,ユーザの真の意図を探索することで介入するプロアクティブモニタであるTrajSafeを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:01:37 GMT)
Real-Time Generation of Streamable Talking Portrait Video with Reference-Guided Deep Compression VAEs [34.9] 本研究は,音声および参照画像に条件付き,ストリーム可能な音声画像生成のためのフレームワークを提案する。
深い潜伏圧縮のための因果ビデオVAEと自己回帰潜伏復調モデルを備えている。
提案手法により,高品質な音声ポートレート映像をリアルタイムに生成し,ベースラインモデルよりもはるかに高速に撮影することができる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:12:23 GMT)
eMoT: evolving Memory-of-Thought via Symbolic Anchoring and Memory Corrosion [34.7] マルチステップ推論を安定化する統合フレームワーク eMoT (evolving Memory-of-Thought) を提案する。
eMoTは、(i)高実用性推論構造を補強するメモリ腐食機構、(ii)Pythonを計算機のように決定論的計算に利用するシンボリックアンカーエンジン、(iii)神経推論と記号的結果とを整合させる一貫性駆動の洗練されたプロセスの3つの相互接続モジュールから構成される。
24の伝統的なタスクでは、eMoTは100%の精度を達成し、ベースラインを最大17.6%上回る。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:41:12 GMT)
VLMs are Good Teachers for Video Reasoning via Adaptive Test-Time Optimization [34.4] 視覚言語モデル(VLM)の役割を「教師」に移行させるパラダイムシフトを導入する。
VLMの教師は、タスク固有のルールを識別可能な報酬に抽出し、LoRAモジュールのテストタイムオンライン最適化を通じてVReasonerを定式化する。
この戦略は、適応的なテスト時間最適化を可能にし、Vの本質的な境界を越えて推論能力を拡張する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:54:26 GMT)
Spectral-Progressive Thought Flow for Lightweight Multimodal Reasoning [34.0] 本稿では,新しいマルチモーダル空間推論フレームワークSpectral-Progressive Thought Flowを提案する。
強力なエネルギー圧縮を利用することで、SpecFlowはグローバルなレイアウトとリレーショナル構造を保存する。
SpecFlowは、計算とKVキャッシュコストを最大2.1倍に削減しながら、競争力や優れた推論性能を達成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:06:50 GMT)
Non-destructive cavity readout of molecules for precision measurements [33.9] 本研究では, 高精細光空洞に分子を結合させることにより, 選択した回転超微細状態の分子集団を測定する非破壊的手法を提案する。
従来の手法とは対照的に,本手法は加熱と損失を低減し,標準量子限界以下で高速(1ms未満)の繰り返し測定を可能にする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:07:10 GMT)
RoboTrustBench: Benchmarking the Trustworthiness of Video World Models for Robotic Manipulation [33.8] 我々は,ビデオワールドモデルの信頼性を評価するベンチマークであるRoboTrustBenchを紹介した。
現在のモデルは、しばしば視覚的に一貫性のあるビデオを生成するが、制約推論、反ファクトグラウンド、物理的相互作用、安全でない命令抑制に苦慮している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:56:09 GMT)
Whole-Pool Setwise Reranking with Long-Context Language Models [33.7] 各コールが現在非ランクの候補パスをすべて考慮し、DualEndを導入する。
両端からランク付けすることで、DualEndは100人の候補者に50回のLCMコールを付けている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:03:51 GMT)
Do Gender Cues Affect LLM Value Trade-offs? Evidence from a Controlled Decision Benchmark [33.3] シナリオを保持しながらロールジェンダーの設定だけを変えるベンチマークを構築します。
明示的なジェンダーの手がかりは、有界だが体系的な意思決定のフリップを引き起こす。
ジェンダー効果は、決定的な値境界の近くに集中しており、ジェンダーの手がかりが局所的な境界シフト要因として働くことを示唆している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:14:10 GMT)
Minimax-Optimal Policy Regret in Partially Observable Markov Games [33.1] 本研究では,部分的に観察可能な環境下での逐次的意思決定を,戦略的かつ適応的な相手に対して検討する。
固定問題パラメータに対して,エポックベースの楽観的最大値類似アルゴリズムが$tildeO(sqrtT)$ポリシー後悔を達成することを証明した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:11:51 GMT)
ProbMoE: Differentiable Probabilistic Routing for Mixture-of-Experts [32.9] Mixture-of-Experts (MoE)モデルはトークンごとに少数の専門家を活性化することでスケールする。
本稿では,確率的ルーティングフレームワークProbMoEを紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 00:16:36 GMT)
TabPrep: Closing the Feature Engineering Gap in Tabular Benchmarks [32.5] TabPrepは、3つの特定の構造データパターンをターゲットにした機能ジェネレータで構成される軽量な前処理パイプラインである。
広く使われているモデルクラスの多くは、これらのパターンに予測可能な盲点を示し、体系的な特徴工学だけで新しいピーク性能を確立することができることを示す。
TabArenaベンチマーク全体を通じて、TabPrepをモデルトレーニングとチューニングに統合することで、ツリーベース、ニューラル、リニア、ファンデーションモデルのパフォーマンスが一貫して向上する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:33:43 GMT)
HMPO: Hybrid Median-length Policy Optimization for Chain-of-Thought Compression [32.1] HMPOはコスト効率のよい単段強化学習フレームワークである。
数学、コード、科学、および命令追従タスクをシームレスに一般化する。
19%~46%のトークン圧縮を実現し、精度は無視できる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:01:55 GMT)
WorldCoder-Bench: Benchmarking Physically Grounded 3D World Synthesis [31.9] 本稿では,3次元世界合成のベンチマークであるWorldCoder-Benchを紹介する。
WorldCoder-Benchには、シミュレーション、レンダリング、アプリケーションシナリオにわたる専門家による2,026のタスクが含まれている。
サンドボックスブラウザで生成されたプログラムを探索する実行ベースのプロトコルであるStateProbeを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:17:49 GMT)
RoboDream: Compositional World Models for Scalable Robot Data Synthesis [31.9] ロボット学習のスケールには大規模で多様なデモが必要だが、遠隔操作による実世界のデータ収集は極めて高価で時間を要する。
本稿では、新しいオブジェクトでデモを合成することで、スケーラブルなデータ生成を実現する、一般化可能なエンボディメント中心の世界モデルを提案する。
実世界の実験で、生成したデータは、ダウンストリームポリシーのパフォーマンスを一貫して改善し、多様な操作タスクにおける実世界のデータ要求を大幅に低減することを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:59:38 GMT)
Equilibrated Diffusion: Frequency-aware Textual Embedding for Equilibrated Image Customization [31.7] 画像カスタマイズは、基準概念画像から対象対象を学習し、テキストプロンプト毎に条件付き画像を生成する。
一般的な方法は、様々な概念属性を統一された潜伏埋め込みにまとめるために微調整を採用する。
本稿では、バランスの取れたカスタマイズと一貫したテキスト-視覚的マッチングのために、絡み合った概念機能を切り離す周波数駆動型手法である平衡拡散を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:57:10 GMT)
Learning Label-Efficient Interpretable Medical Image Diagnosis via Semi-supervised Hypergraph Concept Bottleneck Model [31.4] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、臨床的に意味のある中間概念を診断パイプラインに埋め込むことによって、有望な道を提供する。
本研究は,医用イメージング用に設計された新しい半教師付きCBMフレームワークを提案する。
提案手法は,概念レベルのハイパーグラフを拡張推論に組み込むことにより,より優れた解釈性と性能を実現する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:05:10 GMT)
From Non-Convex to Strongly Convex: Curvature-Adaptive FTPL for Online Optimization [31.4] 曲率適応性はオンライン最適化における古典的なテーマである。
提案アルゴリズムは,過去の情報のみを用いて選択した様々なスケールで,固定スケールを置換することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:01:36 GMT)
AutoMedBench: Towards Medical AutoResearch with Agentic AI Models [31.3] AutoMedBenchは、自律医療AI研究のためのワークフロー対応ベンチマークである。
各ランの平均エージェントターンが33回ある長い水平タスクで構成されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:22:55 GMT)
Retrieve What's Missing: Coverage-Maximizing Retrieval for Consistent Long Video Generation [31.3] 自己回帰ビデオ生成のためのCOVRAG(Coverage-Maximizing Retrieval-Augmented Generation)を提案する。
COVRAGは、トレーニング済みの3Dプリエンプションを使用して、軽量な3Dメモリエビデンスとしてターゲットビューカバレッジマップを構築する。
RealEstate10K と DL3DV10K の実験では、COVRAG はベースラインに比べて低レイテンシを維持しながら、長い水平の幾何的整合性を改善する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:49:58 GMT)
RescueBench: Can Embodied Agents Save Lives in the Wild ? [31.1] RescueBenchは、検索とレスキュー機能のための写真リアリスティックな診断ベンチマークである。
RescueBenchは、探索とメモリ障害が具体化されたメモリ障害を通じてどのように伝播するかを分析することができる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:59:54 GMT)
SPADE-Bench: Evaluating Spontaneous Strategic Deception in Agents via Plan-Action Divergence [31.0] 本研究では,自発的なプラン・アクションのばらつきを評価するためのベンチマークSPADE-Benchを紹介する。
以前の偽装ベンチマークとは異なり、SPADE-Benchは実際のツールの実行と制御されたプレッシャーシナリオを同時に統合する。
実験により、エージェントの偽装は、ツール使用のコンテキストにおいて真に迫った問題であることを確認した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:28:34 GMT)
AGENTCL: Toward Rigorous Evaluation of Continual Learning in Language Agents [30.8] 言語エージェントは個々のタスクの解決に相当な推論時間を費やすが、あるエピソードで得られた経験は将来のエピソードでは利用されないことが多い。
継続的な学習は、エージェントが一連のタスクに再利用可能な経験を蓄積し、時間とともに改善し、無関係な経験からの干渉を避けることを期待する。
本稿では,エージェントにおける連続学習のための評価フレームワークであるAgentCLについて述べる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:32:59 GMT)
RA-LWLM: Retrieval-Augmented In-Context Localization with Wireless Foundation Models [30.6] RA-LWLMは、検索拡張インコンテキストローカライゼーションフレームワークである。
シーン固有の情報を、シーンごとの指紋データベースに外部化する。
RA-LWLMは、シーンごとの再トレーニングを行わずに、見かけや見えないシーンでほぼ同じ精度を達成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:39:23 GMT)
Attention Calibration for Position-Fair Dense Information Retrieval [29.9] デンス検索モデルは、後続の通路に関連情報が現れると位置バイアスを示す。
我々は、このバイアスが再トレーニングや全体的な検索効率を犠牲にすることなく、推論時に低減できるかどうかを問う。
推定時間アテンションのキャリブレーションを下流の検索に適用し、元のアテンション分布と完全にキャリブレーションされたアテンション分布を補間する強度係数で拡張する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:04:26 GMT)
Consistent Yet Wrong: Evidence Insensitivity in Spatial Vision-Language Models [29.7] 現代の視覚言語モデル(VLM)は、計量距離クエリでは信頼できないままである。
我々は,Hypersim,ScanNet,KITTI360から構築したマルチビュー評価プロトコルであるtextbfViewDiagを紹介する。
安定な予測は、証拠に敏感な推論よりも先駆的な崩壊を反映している可能性が示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:06:08 GMT)
Physics-Guided Attention in a Lightweight TCN for Efficient WiFi CSI-Based Human Activity Recognition [29.6] 本稿では,動作認識による帰納的バイアスを特徴学習に明示的に組み込む,TCNベースのフレームワークを提案する。
提案手法は,パラメータ数と計算コストを大幅に削減しつつ,より深いベースラインよりも優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:47:23 GMT)
Geometry-Aware Implicit Memory for Video World Models [29.5] GIM-Worldは、ビデオワールドモデルのための幾何学的な暗黙記憶フレームワークである。
カメラクエリ可能な幾何ヘッドは、凍結基礎モデルからトレーニング中にメモリに3Dシーン構造を蒸留する。
MINDの実験では、GIM-Worldは明示的メモリベースラインと暗黙的メモリベースラインの両方よりも、長期の幾何学的および視覚的一貫性を保っている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:08:43 GMT)
Thinking in Blender: Staged Executable Inverse Graphics with Vision-Language Models [29.1] 1枚の画像から3Dシーンを再構成するエージェントフレームワークであるSEIG(Staged Executable Inverse Graphics)を導入する。
我々は,画素レベル,知覚的,意味的忠実度にまたがるさまざまな再現指標を用いて,様々な場面におけるフレームワークの評価を行った。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:59:53 GMT)
$Ψ$-Bench: Evaluating Persona-Sensitive Influencing in Persuasive Dialogues [29.1] パーソナライゼーションは現代の言語エージェントにとって重要な能力である。
現実的相互作用におけるこのような積極的パーソナライゼーションを体系的に評価するために,$$-Benchを提案する。
我々は,$$-Benchの説得を含む3つの実世界の相互作用シナリオを設計する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:20:27 GMT)
CAD-to-CT Registration of Cylindrical Objects via Ellipse-Based Axis Estimation [29.0] 円筒状物体(電離チャンバー)の2段階形状登録法を提案する。
まず,3次元回転軸をCTスライスを横切る楕円断面を検出し,エッジ検出輪郭に楕円を嵌合させ,RANSAC除去後の楕円中心にPCAを施すことにより推定する。
第2に,CADモデルのボキセル化を行い,検出した軸に沿ってオリエントし,CTスキャンとのボリュームオーバーラップを最大化する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:33:40 GMT)
Self-Improving Small Object Grounding in LVLMs [28.7] LVLMは微調整なしで信頼性の高い小オブジェクトボックスを識別できることを示す。
COCOとObjects365の実験では、小さなオブジェクトのローカライゼーションにおいて最大19%の自己改善が示されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:01:38 GMT)
Symmetry-Aware 9D Pose Estimation with Sim(3)-Consistent Feature and Spherical Inception Convolution [28.6] カテゴリーレベルのオブジェクトポーズ推定を2つの重要なイノベーションで効果的に行う方法を提案する。
翻訳/大きさ推定器は、対称性の点を推測するために意味誘導対称性認識モジュールを使用し、正確な翻訳と大きさは、形状の前兆を伴わない。
機能融合モジュールは、LVMのセマンティックな特徴を体系的に計算された幾何学的特徴と融合させ、クラス内のバリエーションから不可欠なポーズの特徴を抽出する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:20:04 GMT)
DFlare: Scaling Up Draft Capacity for Block Diffusion Speculative Decoding [28.4] ブロック拡散復号法 LLM は、ブロック内の全てのトークンを同時に予測することで、推論を加速する。
モデルネームは、DFlashの狭い条件付けのボトルネックを、軽量なレイヤワイド・フュージョン機構によって引き起こします。
モデルネームはQwen3-4Bでは平均ウォールクロックの速度が5.52倍、Qwen3-8Bでは5.46倍、GPT-OSS-20Bでは3.91倍に達する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:18:30 GMT)
LongLive-RAG: A General Retrieval-Augmented Framework for Long Video Generation [28.2] 自己回帰(AR)ビデオ拡散は可変長合成を可能にするが、長い水平生成は蓄積されたエラーやアイデンティティドリフトに悩まされることが多い。
本稿では、長いビデオ生成を検索強化世代(RAG)問題として定式化し、この制限に対処する。
本稿では,ARビデオ生成のための汎用検索フレームワークであるLongLive-RAGを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:50:49 GMT)
Honey, I Shrunk the Arc de Triomphe! [28.2] 大規模データアグリゲーションにより,メートルスケール単分子形状推定が大幅に進展した。
現在の基礎モデルは「スケール崩壊」現象に悩まされており、遠くのランドマークや広大な風景は計量的に過小評価されている。
我々は、MetricScenesと呼ばれる、新しい計測基準付きインザワイルドデータセットをキュレートする。
我々のデータセット上の微調整MoGe-2はスケール崩壊を著しく軽減し、制約のないオープンドメインシーンにおいて優れた計量精度を実現する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:28:13 GMT)
X-Stream: Exploring MLLMs as Multiplexers for Multi-Stream Understanding [28.1] マルチストリームストリーミング理解に特化した最初のベンチマークであるX-Streamを紹介する。
厳格にキュレートされた4,220のQAペアを932ビデオにコンパイルし、X-Streamはマルチウィンドウ、マルチビュー、マルチデバイスシナリオで11のサブタスクを評価している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:52:11 GMT)
HLL: Can Agents Cross Humanity's Last Line of Verification? [27.9] textbfHumanityのLast Line of Verification (HLL)を導入し、エージェントがこの境界を越えることができるかどうかを評価する。
HLLは多様なCAPTCHA相互作用をカバーし、制御されたリアリズムストレス因子に作用する。
結果は、現在のエージェントがこの人間-置換境界で不安定なままであることを示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:20:45 GMT)
Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses [27.8] 本研究では,20B検索エージェント(検索サブエージェント)であるHarness-1を紹介する。
ハーネスは、候補プール、重要タグ付きキュレートセット、コンパクトエビデンスリンク、検証記録、圧縮および重複した観察を含む環境側のワーキングメモリを維持している。
8つのベンチマークで、Harness-1は平均0.730回のリコールを達成し、次の最強のオープンサーチサブエージェントを+11.4ポイント上回った。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:21:41 GMT)
HoliTok:A Coutinuous Holistic Tokenization with Robust Dual Capabilities of Speech Generation and Understanding [27.5] 本稿では,一元的生成に基づくモデリングのための連続的ホロスティック音声トークン化モデルを提案する。
HoliTokは48kHzの音声を128次元のラテントの25Hzのコンパクトなシーケンスに符号化する。
実験により,HoliTokは競争力のある再現性を実現し,高品質で制御可能な合成のための生成的学習性を向上させることが示された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:03:07 GMT)
HERO'S JOURNEY: Testing Complex Rule Induction with Text Games [27.5] HERO's JOURNEYは、エピソードタスクにおけるルール誘導のベンチマークである。
属性および手続き誘導ファミリーにまたがる8つのタスクをカバーしている。
モデルではルール誘導の証拠が示されていますが、その能力はタスクによって制限され、不均一です。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:51:40 GMT)
Collaborative Space Object Detection with Multi-Satellite Viewpoints in LEO Constellations [27.4] 深層学習(DL)フレームワークにおける多視点観測融合の可能性を検討した。
実験の結果,mAP50とmAP50-95では,多視点入力がほとんどのケースで実現可能であることがわかった。
これらの知見は、LEO星座展開における空間的状況認識に幅広い影響を及ぼすSODの有効かつ効果的な戦略として、多視点融合を確立した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:37:43 GMT)
WebSpline: Structure-Informed Splines for Real-Time 3D Gaussians from Monocular Videos [27.3] WebSplineは新しい動的3Dガウスフレームワークで、高速なレンダリングでモノクロビデオから構造的に一貫性のある高忠実な再構成を可能にする。
挑戦的なモノラルな動的シーンベンチマークであるiPhoneとNVIDIAの実験では、WebSplineが最先端のレンダリング品質を実現し、WorldTreeの10倍高速なレンダリングを実現しています。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:28:17 GMT)
Who Annotates in NLP? A Large-scale Assessment of Human Annotation Reporting between 2018 and 2025 [27.0] 主要なNLP会場にまたがるヒューマンアノテーションレポートの大規模・タスクレベルの監査を行う。
アノテーションレポートの実践を統一した分類法を導入し,LLM支援抽出パイプラインの有効性を検証した。
以上の結果から,NLPのアノテーション報告は時間とともに改善したが,まだ不均一であることが明らかとなった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:43:10 GMT)
Physically-Constrained Mamba-SDE for Remaining Useful Life Prediction under Irregular Observations [26.8] 不規則な観測下でのロバストなRUL予測のための統合連続時間フレームワークであるPC-MambaSDEを提案する。
具体的には、パラメトリック整合ハイブリッドドリフトを用いた物理誘導潜水SDEを設計する。
また,現実的な産業不完全性をシミュレートするハイブリッド不規則性生成手法を開発した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:37:38 GMT)
Learning When Not to Act: Mitigating Tool Abuse in Agentic Reinforcement Learning [26.3] エージェント強化学習は、内部推論によって解決可能なクエリであっても、モデルが外部ツールを過剰に使用するツールの乱用を引き起こす可能性がある。
本稿では,効率的なエージェントポリシー最適化フレームワークEAPOを提案する。
GRPOと比較して、EAPOは平均パフォーマンスを10.45%、7.27%、9.69%改善し、平均ツールコールを18.33%、18.33%、および24.59%削減した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:58:55 GMT)
Argument Collapse: LLMs Flatten Long-Form Public Debate [26.2] 我々は、議論の崩壊、異なる LLM によって生成されたエッセイの傾向を、より小さな主要な議論、サブ引数、および段落レベルの構造に収束させる傾向について研究する。
ニューヨーク・タイムズ(NYT)の討論会では1,039件、ボストン・レビュー(BR)のフォーラムでは448件、LLMのエッセイでは23,384件を比較した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:58:50 GMT)
TimeBlocks: Foundational and Continual Time-Series Blockbase -- Extended Version [26.1] TimeBlocksは、可変条件下で複数のタスクに適した軽量モデルの効率的な構築を可能にする。
我々は、TimeBlocksにStreamCoreと呼ばれるメソッドを装備し、データストリームの代表的な小さなサブセットを構築し、時間とともにストリームの保証された近似を保存する。
複数のデータセットと複数のタスクをカバーする実験的な研究は、TimeBlocksが既存のベースラインより優れたモデルを構築することができることを示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:09:13 GMT)
Demystifying Multimodal Biomolecular Co-design With Intrinsic Geodesic Coupling [26.0] 生体分子は、配列と3次元構造の間の密接な相互作用から生じる生物学的システムにおいて中心的な役割を果たす。
生体分子共設計の最近の生成モデルは、結合されたモダリティを共同でモデル化することで、この相互作用を捉えることを目的としている。
既存のアプローチは主に、固定同期結合を暗黙的に強制する、限界生成プロセスの並列実行を採用する。
批判的だが見過ごされた自由の度合いは、これらの限界過程がトレーニングと生成の間に時間的に結合されていることにある、と我々は主張する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:25:17 GMT)
Dynamics Are Learned, Not Told: Semi-Supervised Discovery of Latent Dynamics Geometries For Zero-Shot Policy Adaptation [25.9] 実世界のダイナミクスシフトは、ロボット工学における強化学習にとって重要な課題である。
既存のほとんどのメソッドは、明確に特定された物理的パラメータを潜在コンテキストにエンコードすることに依存している。
結果中心の観点から、動的適応を再考する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:05:23 GMT)
Benchmarking LLM-as-a-Judge for Long-Form Output Evaluation [25.7] 大規模言語モデル(LLM)は、長文生成にますます使われている。
LLMs-as-a-judgeは、人間の評価に代わるスケーラブルな代替手段を提供する。
既存のメタ評価ベンチマークは、主にショートフォーム出力に焦点を当てている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:25:34 GMT)
What to Format and How: A Benchmark and Workflow Approach for Document Formatting [25.5] 現実世界のフォーマットは、しばしば文書の内容に基づいてターゲットを特定する必要がある。
DocFormBenchは、Text-to-Formatの評価をさまざまなフォーマットに拡張するベンチマークです。
そこで我々は,修正の実行からフォーマットや方法まで,対象のローカライゼーションを分離するDocFormFlowを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:02:33 GMT)
Improving Visual Token Reduction via Rectifying Distortions for Efficient Multimodal LLM Inference [25.0] 本稿では,効率を保ちながら位置や注意の歪みを補正する新しい視覚トークン低減(VTR)フレームワークを提案する。
具体的には、相対距離に基づいて注意重みを増大させることにより、視覚的注意を回復する簡易かつ効果的な校正法を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:25:46 GMT)
EvoBrain: Continual Learning of EEG Foundation Models Across Heterogeneous BCI Tasks [24.8] EvoBrainは、統合されたEEGデコーディングのためのタスク対応連続学習フレームワークである。
これは2つの相補的なコンポーネントによる可塑性-安定性のトレードオフに対処する。
様々な基礎のバックボーンにまたがる最先端の手法を一貫して超越している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:49:50 GMT)
Ultra Diffusion Poser: Diffusion-Based Human Motion Tracking From Sparse Inertial Sensors and Ranging-Based Between-Sensor Distances [24.7] 慣性測定ユニット(IMU)を用いる方法は、カメラベースのモーションキャプチャーに代わるウェアラブルを提供する。
慣性ポーズ推定器では、超広帯域(UWB)範囲で測定されるセンサ間距離を積分する。
我々はこれらの幾何学的制約を明示的にモデル化した拡散モデルであるUltra Diffusion Poserを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:20:31 GMT)
ReSkill: Reconciling Skill Creation with Policy Optimization in Agentic RL [24.7] 本稿では,RL-in-the-loopスキル作成フレームワークであるReSkillを紹介する。
ReSkillはGRPOの群構造を利用して、3つのメカニズムを埋め込む。
いくつかのドメインで、ReSkillは既存のメモリとスキルベースのRLメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:12:05 GMT)
IstGPT: LLM-based Anomaly Detection for Spatial-Temporal Graph in Industrial Systems [24.6] LLMとグラフ学習に基づく最初の異常検出ツールであるIstGPTを提案する。
IstGPTは、産業用サイバー物理システムにおける空間的時間的依存関係のきめ細やかなモデリングを実現する。
IstGPTを9つのデータセット上で12の最先端ベースラインに対して評価した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:55:51 GMT)
Coherent Off-Policy Improvement of Large Behavior Models with Learned Rewards [24.6] 強化学習は、さらなる経験を用いてポリシーを微調整するために使用することができる。
逆強化学習では、専門家によるデモンストレーションから高密度報酬関数が学習される。
提案手法は,6つのスパース操作タスクすべてに対してpi-0.5を維持・改善し,複雑な操作タスクのうち5つに対して50q 90%の成功率を達成できることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:49:14 GMT)
Multilingual Idioms in Sentences and Conversations Across High-, Medium-, and Low-Resource Languages [24.6] MIDIは、3つの高レベル、3つの中級、12の低リソース言語にまたがるデータセットである。
文レベルと会話コンテキストの両方に埋め込まれたイディオムを提供し、リテラルとフィギュラティブの両方をキャプチャする。
最先端モデルのベンチマークでは、低リソース言語では理解力が低下し、すべてのリソース層では、リテラル解釈が比喩的言語よりもかなり難しいことが示されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:16:14 GMT)
InfoMerge: Information-aware Token Compression for Efficient Video Large Language Models [24.4] ビデオ大言語モデル(ビデオ-LLM)は、ビデオ理解において高い性能を達成するが、その過度な視覚トークンは、計算上のオーバーヘッドを著しく引き起こす。
本稿では,ロバストな冗長性推定とコンテンツ対応予算配分によるトークン利用を改善する,トレーニング不要なビジュアルトークン圧縮手法であるInfoMergeを提案する。
LLaVA-OneVision-7Bでは、InfoMergeはオリジナルの平均性能の98.8%を維持し、ビジュアルトークンの85%を削減し、プリフィル段階で4.24倍のスピードアップを達成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:24:24 GMT)
Embedding Semantic Risk into Distance Fields and CBFs for Online Monocular Safe Control [24.0] 制御バリア関数(CBF)に基づく安全なナビゲーションと遠隔操作で使用される距離フィールドにセマンティックリスクを埋め込むオンライン単眼知覚制御フレームワークを提案する。
我々のフレームワークは、ユークリッド符号距離場(ESDF)に直接意味情報を埋め込むことによって、障害物幾何学とクラス依存リスクをオンライン化する。
この設計は制御最適化の前にセマンティックリスクを符号化するので、高リスクオブジェクトは、実行時に効率的なESDFクエリを保持しながら、安全分野に大きな空間的影響をもたらす。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:57:31 GMT)
FACT: A Simple and Efficient Framework for Active Finetuning [24.0] 効率性と簡易性を両立した3相階層型ファインタニングフレームワークFACTを提案する。
低サンプリング率下では,CIFAR10,CIFAR100,ImageNet-1kベンチマークのViTモデルでは20%以上の顕著な性能向上を実現している。
この体系的なアプローチは、パラメータ効率を維持しながら、新しい最先端のパフォーマンスを確立し、ラベル付きデータが不足している場合に特に有効であることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:08:31 GMT)
Understanding Identity Continuity in Thermal Video through Scene-Level Consistency [23.7] 重度再識別モデルや複雑なオンラインアソシエーションに頼ることなく、軽量なポストプロセッシングがアイデンティティの連続性を回復できるかどうかを検討する。
オンラインのショートギャップリマッピングとオフラインのトラックレットリリンクで構成されるモジュラーID-リペアバックエンドを追加します。
その結果,シーンレベルの空間的・時間的整合性は,局所的なフレーム・フレーム・アソシエーションに比べてアイデンティティの連続性において支配的な役割を担っていることがわかった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:59:28 GMT)
Pixel Cube: Diffusion-based Portrait Video Relighting Through Realistic Lighting Reproduction [23.6] 本稿では,動的ポートレート映像を光写実性と時間的整合性でリライトする拡散法を提案する。
我々のモデルは、現実的に見え、提供された新しい環境下で、時間的に一貫した忠実なポートレートビデオを生成することができる。
その結果,本手法は光リアリズム,照明調和,時間的一貫性の両立を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:47:17 GMT)
Beyond $\ell_2$-norm and $\ell_\infty$-norm: A Curvature-Inspired $\ell_p$-Norm Scheme for Deep Neural Networks [23.3] 動的値が$p$の$ell_p$-normスキームを提案し、それを勾配降下(SGD)と運動量(SGDM)に組み込む。
我々は,深部ニューラルネットワークに対する(O-1/2)収束率を達成するLPSGDとLPSGDMの理論的保証を確立する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:07:35 GMT)
Unveiling the Limits of Large Language Models in Inferring Pragmatic Meaning from Non-Verbal Responses [23.3] 本稿では,非言語応答のみからなる対話における語用的意味を推測する大規模言語モデルの能力について,最初の体系的評価を行う。
我々は,LLMが非言語的応答から根底にある意味を推測するのに苦慮しており,その精度は動詞の応答に比べて最大60%低下することを示した。
さらなる分析により、LLMの非言語的行動解釈における行動パターンが明らかになり、文脈内学習が実用的な推論を促進することが示される。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:56:06 GMT)
Vision-language Models for Driver Monitoring Systems: A Driver Activity Description Dataset [23.2] 微妙なドライバー動作を理解することは、信頼性の高いドライバー監視システムを構築する上で不可欠である。
既存のビジョンモデル(VLM)は、一般的なデータセットに基づいてトレーニングされており、ドライバーの振る舞いの微妙な区別に苦慮している。
本稿では、Drive&Actデータセットの詳細な自然言語バージョンを作成することで、この制限に対処する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:59:46 GMT)
Multi-modal Video Representation Alignment for Robust Self-supervised Driver Distraction Detection [23.2] 本研究では,マルチモーダルなグローバルアライメントのための新しいフレームワークを提案する。
サイクル整合性スコアから導かれるソフトターゲットを導入し、ハードネガティブな仮定を緩和する。
提案手法をDrive&Actデータセット上で評価し、ペアワイドと既存のグローバルアライメントベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:01:17 GMT)
JenBridge: Adaptive Long-Form Video Soundtracking across Scene Transitions [23.1] JenBridgeは、高忠実度オーディオ生成とトランジッション自然性の両方を保証する、適応的なロングフォームビデオサウンドトラックのためのフレームワークである。
様々なシーンの変化にまたがって長い形式のコヒーレンスを達成するために、JenBridgeは、新しい適応的な遷移メカニズムを取り入れている。
このタスクを厳格に評価するために、キュレートされたデータセットと新しい評価指標を含む新しいベンチマークであるLVSベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:12:20 GMT)
RoboSemanticBench: Diagnosing Semantic Grounding in Action Prediction for VLA Models [23.0] 視覚言語アクションモデル(VLA)は、事前訓練された言語や視覚言語バックボーンからの意味的理解がロボットの行動予測を導くべきであるという前提に基づいて構築されている。
動作予測におけるセマンティックグラウンドの診断のための具体的ベンチマークであるRoboSemanticBench(RSB)を紹介する。
多くのポリシーが候補ブロックの把握を学習するが、成功を把握するために制御した後、近ランダムまたは下位ランダムレートで意味論的に正しいブロックを選択する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:02:37 GMT)
EvoPool: Evolutionary Programmatic Annotation for Label-Efficient Specialized Supervision [22.7] EvoPoolはダーウィンの進化に触発された進化的マルチエージェントフレームワークである。
プール投票はテキスト認識アグリゲータであるEvoAggによってソフトトレーニングラベルにマップされる。
Poolは平均+0.141マクロF1で最強のLCMアノテーションベースラインを破り、ChemProtでは+0.301、PubMedでは+0.265に達した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:10:37 GMT)
RoleCDE:Benchmarking and Mitigating Role-Alignment Trade-offs in Role-Playing Agents [22.6] RoleCDEは,ロール固有値とアライメント指向制約との間の構造的矛盾の下でRPAを評価するために設計された最初のベンチマークである。
ベンチマークは大規模に構築され、およそ8万の多様なロールプロファイルとシナリオと、3つの難易度と8つのロールカテゴリにわたる24万のジレンマインスタンスをカバーする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:56:27 GMT)
EvoCut: Multi-Layer Evolution-Aware Visual Token Compression for Efficient Large Vision-Language Models [22.4] 多層展開偏差からトークンの重要度を推定する視覚的トークン圧縮法を提案する。
EvoCutは平均的なパフォーマンスの94.4%を維持しながら、LLaVA-1.5-7B上の視覚トークンの11.1%しか保持できない。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:21:28 GMT)
Casual as an Anchor: Resolving Supervision Misalignment in Formality Transfer Dataset [22.1] 形式的転送は、通常、形式的レジスタと形式的レジスタの間の対称的な双方向タスクとしてフレーム化される。
このフレーミングは、GYAFCのような既存のベンチマークにおいて、監督設計上の欠陥を隠蔽していると論じる。
人間の整合性の定義の下で、ベンチマーク形式ラベルを再評価することで、このミスアライメントを定量化する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:06:41 GMT)
Quantum light source with lithium tantalate for scalable photonic quantum circuits [22.0] 薄膜タンタル酸リチウム(T)は有望な集積フォトニックプラットフォームとして出現している。
自然発生4波混合によるTによる最初の量子光源の実証を行った。
製造されたマイクロリングは350GHzの自由スペクトル範囲を持ち、光学品質係数は106ドルである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:09:42 GMT)
SMH-Bench: Benchmarking LLM Agents for Environment-Grounded Reasoning and Action in Smart Homes [21.9] スマートホーム環境におけるLarge Language Models (LLM) の評価のための総合ベンチマークであるSMH-Benchを紹介する。
HomeEnvは、実行可能で検証可能なスマートホームシミュレータで、SMH-Benchは7つのカテゴリと22のきめ細かいサブカテゴリにまたがる1,100の高品質なタスクを含んでいる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:48:15 GMT)
VISReg: Variance-Invariance-Sketching Regularization for JEPA training [21.9] 自己教師付き学習手法は、埋め込み空間のモデリングや明示的な正規化による埋め込み崩壊を防止する。
可変不変ケッチ正規化(VISReg)を提案する。
VISRegは共分散をSliced-Wassersteinベースのスケッチ目的に置き換え、完全な分布形状を強制する。
我々は、VISRegが線形にスケールし、低品質データセット上で既存の正規化よりも優れており、長い尾と低ランクのレギュレーションに対して弾力性があることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:58:01 GMT)
ODTQA-FoRe: An Open-Domain Tabular Question Answering Dataset for Future Data Forecasting and Reasoning [21.8] 本稿では,将来データ予測と推論のための新しいタスク,オープンドメインタブラリ質問応答を導入する。
本稿では,不動産データを用いた時系列予測と予測に基づく推論シナリオを対象とした最初のデータセットを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:06:20 GMT)
Estimating Mutual Information between Time Series and Temporal Event Sequences Across Diverse Analysis Tasks [21.7] 時系列とイベントシーケンス間の依存度を測定する非パラメトリックな相互情報推定器を提案する。
本手法は,実世界の時系列の連続離散双対性をモデル化し,量子化と繰り返し値のアーティファクトを処理する。
合成および実世界のデータセットの実験は、精度、堅牢性、解釈可能性において既存の手法よりも一貫した改善を示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:56:50 GMT)
STaR-KV: Spatio-Temporal Adaptive Re-weighting for KV Cache Compression in GUI Vision-Language Models [21.5] ビジョンモデルベースのグラフィカルユーザインタフェース(GUI)エージェントは、幅広い自動化機能を示している。
デプロイメントは、インタラクションステップと線形に成長するキーバリュー(KV)キャッシュによってボトルネックされる。
トレーニング不要なKVキャッシュ圧縮フレームワークSTaR-KVを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:10:00 GMT)
Restoring Initial Noise Sensitivity in Text-to-Image Distillation via Geometric Alignment [21.5] 生成蒸留はテキスト・トゥ・イメージ(T2I)生成を著しく加速する。
既存の手法は主に効率と出力の忠実さを最適化し、しばしば元の軌道の臨界特性を無視する。
本稿では,教師モデルと学生モデルの局所的機能挙動を整合させる感度保存フレームワークであるGeometry-Aware Distillation (GAD)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:58:47 GMT)
HarnessForge: Joint Harness and Policy Evolution for Adaptive Agent Systems [21.4] LLMエージェントは、多種多様なタスクレジームで運用されることがますます期待されている。
本稿では,エージェントシステムを進化させるメタ適応フレームワークであるHarnessForgeを提案する。
HarnessForgeはエージェントシステムをハーネスのペアとして定式化し、安定した適応空間を定義する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:00:35 GMT)
Does Compression Preserve Uncertainty? A Unified Benchmark for Quantized and Sparse LLMs via Conformal Prediction [21.4] 5つのNLPタスクにまたがる様々な圧縮構成の下で、12の大規模言語モデル(LLM)をベンチマークする。
実験の結果, (I) 圧縮は精度を不確実性から分離することが多く, (II) より大きなモデルでは圧縮誘起不確実性をより効果的に吸収し, (III) 不確実性インフレーションは段階的にではなくしきい値に近いことが多いことがわかった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:00:17 GMT)
Trapping 11,000 Atoms in a Tweezer Array Generated by a Single Metasurface [21.4] ツイーザーアレイに11,000個の個々の原子をトラップし、利用可能な量子ビット資源を数十個単位のスケールに到達させる。
この研究は、1万量子ビットスケールの量子コンピュータに向けて重要な第一歩を踏み出す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:00:04 GMT)
Learning to Refine: Spectral-Decoupled Iterative Refinement Framework for Precipitation Nowcasting [21.3] 本稿では,現在放送を進行周波数分離改良として再編成する決定論的枠組みを提案する。
SDIRはまず安定な低周波合成骨格を抽出し、次いで物理的制約下で高周波テクスチャを反復的に洗練する。
3つのベンチマークで実験したところ、SDIRは空間精度でSOTA法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:34:30 GMT)
Why Do Time Series Models Need Long Context Windows? [21.2] 時系列の予測群は、(i)生成過程同定(GPI)と(ii)条件付き予測(CF)の2つの目的を含むことを示す。
この観点から、最適予測は、入力ウィンドウが与えられた場合、その可能性によって重み付けされる、可算なデータ生成プロセスの平均として解釈することができる。
メモリ長が$P$のプロセスであっても、最小到達可能なエラーを達成するためには、入力ウィンドウサイズが$P$より厳密に大きいことを証明する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:55:06 GMT)
IMWM: Intuition Models Complement World Models for Latent Planning [21.0] 有限予算のサンプルベースプランナーがまだいくつかのタスクで失敗していることを示す。
このギャップに触発されたIMWMを提案する。これは世界モデルと、実証から訓練された直観モデルとを組み合わせて、期待できる行動を認識する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:23:25 GMT)
Scalable Counterfactual Risk Estimation for Rare Events in Longitudinal Data [21.0] 本稿では,既存の因果効果推定装置に適用可能な長手生存データに対する,原則的サブサンプリングと再重み付け戦略を提案する。
提案手法は, 整合性を保ちながら計算負荷を大幅に低減し, 希少な出力設定における推定安定性を向上する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:41:16 GMT)
Divide and Conquer: Reliable Multi-View Evidential Learning for Deepfake Detection [20.8] ディープフェイクはセマンティック・リアリズムをほぼ完璧に達成し、法医学的な痕跡は微妙な構造上の異常にのみ残されている。
既存の単一ビューのパラダイムは、支配的なセマンティックな特徴が微妙なアーティファクトの手がかりを圧倒するため、しばしば一般化に失敗する。
本稿では,ディープフェイク検出のためのDivide-and-Conquer Multi-View Evidential Learning (DiCoME)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:29:40 GMT)
FUSE: Quantifying Uncertainty in Vision-Language Models by Bayesian Fusing Epistemic and Aleatoric Uncertainty [20.6] ロボット工学などの多くの応用において、視覚言語モデルの出力の不確かさを定量化することが不可欠である。
視覚言語モデリングにおける2つの相補的不確実性源を捉えるための確率的フレームワークであるFUSEを開発した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:11:00 GMT)
Learning When to Translate for Multilingual Reasoning [20.5] 推論言語モデル (RLM) は複雑な推論タスクにおいて高い性能を発揮するが、それでもかなりの多言語推論のギャップがある。
英語翻訳は、RLMがより確実に解釈できる形で非英語入力を表現することによって、これらの失敗を軽減することができる。
本稿では,言語理解境界を意識した強化学習フレームワークLuarを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:37:18 GMT)
Repurposing Adversarial Perturbations for Continual Learning: From Defense to Active Alignment [20.4] AdvCLは3つのプラグインモジュールを組み合わせている:-Smoothは小さな対向的摂動によって局所的な滑らかさを促進する; Proto-Clipは、現在のタスクプロトタイプへの過剰なアライメントを防ぐために類似性クリッピングを使用する; Inter-Alignは、表現的ギャップを減らすために、以前のタスクプロトタイプに対して方向アライメントを適用する。
実験では、標準性能とロバスト性の両方で一貫した利得を示し、忘れられやすく、より強い転送が可能である。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:35:59 GMT)
Improving LLM-Based Go Code Review through Issue-List Generation and Context Augmentation [20.2] 本稿では,LSMが最重要事項のみを報告するのではなく,潜在的な問題をすべて列挙する課題リストレビューパラダイムを提案する。
次に、隣人、LSPベースのセマンティクス、IRベースの同様のコチェンジコンテキストの3つのタイプのコードコンテキスト拡張を比較します。
提案手法は,非コンテキストおよび文脈拡張世代から候補を統合してレビューカバレッジを向上させるとともに,改良誘導プルーニングを導入し,候補リストを実用的規模に維持する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:11:34 GMT)
Do Multimodal Agents Really Benefit from Tool Use? A Systematic Study of Capability Gains [20.1] 画像のエージェントであるThymeとDeepEyesV2を用いて、現実世界の理解、OCR、チャート理解、数学的推論の2つの代表的思考について検討する。
ツールアクセスは、一貫した集約的改善がほとんど得られず、生成したコストを確実に削減することができず、小さなツールのみの解決セットのみを残している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:04:25 GMT)
The Lie We Tell: Correcting the Euclidean Fallacy in Vision Language Action Policies via Score Matching on Tangent Space [20.0] 本報告では,SE(3)を内在的に運用する拡散フレームワークを提案する。
本手法は,左不変SDEを用いてノイズを注入し,空間接点のスコアを予測し,指数写像を用いてサンプルを抽出する。
CALVIN ABC$rightarrow$Dでは、平均タスク長が$3.27$から$3.51$+7.3%$に改善されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:59:29 GMT)
ShaplEIG: Bayesian Experimental Design for Shapley Value Estimation [19.9] 共有値は、解釈可能な機械学習で広く使われている原則的帰属尺度である。
本稿では,高価な値関数を近似したベイズ実験設計手法ShaplEIGを提案する。
予測情報ゲインがクローズドな形で利用できることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:40:38 GMT)
On the Salience of Low-Probability Tokens for AI-Generated Text Detection: A Multiscale Uncertainty Perspective [19.8] 不確実性は情報的低確率トークンに焦点を当てたマルチスケール不確実性推定器である。
低確率トークンのログ確率を平均化することで、ボイラープレートの優位性を緩和する。
これはレニイエントロピーを通じて、この低確率領域の分布形状を捉え、脆さを減少させる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:21:41 GMT)
On the Persistent Effects of Lexicality in Large Language Mod [19.8] 大規模言語モデル(LLM)における意味的内容に対する語彙重なりの効果を定量化する。
語彙的影響はモデルの深さにまたがって広がり、一貫してアーキテクチャ、トレーニング体制、客観的機能にまたがっている。
語彙信号と意味信号の両方が同時に劣化する中深度領域を観察し、表象が表象と意味の両方に乏しい遷移状態を示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:15:45 GMT)
THRD: A Training-Free Multi-Turn Defense Framework for Jailbreak Attacks on Large Language Models [19.7] マルチターンジェイルブレイク攻撃はLLMに対する脅威を増大させる。
THRDは、時間的リスク蓄積を明示的にモデル化する最初のトレーニング不要のフレームワークである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:02:15 GMT)
CARTE: A Benchmark for Mapping Language Model Knowledge Across France [19.7] CARTE 1(CARTE 1)は、大規模言語モデルが、地理的に根ざした、地域的に区別されたフランスにおける知識に対して、きめ細かい推論を行う能力を評価するためのベンチマークである。
CARTE-LVはフランス語領域にまたがる言語変化を対象とするサブセットであり、言語関連の違いを集中的に評価できる。
本実験は, 地域とモデル規模における性能格差を明らかにし, 事前訓練対象範囲の体系的ギャップと, 国内内変動に対する頑健さの制限を示唆した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:50:50 GMT)
Unified Context Evolution for LLM Agents [19.6] Unified Context Evolution (UCE) は、エージェントエクスペリエンスを進化するライブラリタイプEvolvable Context Units (ECUs) に外部化するフレームワークである。
UCEは経験を4つの補完型(メモリ、戦略、スキル)に分解する
スケジューリングモジュールは、ライブラリが最も弱いタイプに対して、各サイクルの生成予算を割り当てる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:25:29 GMT)
Edge Prediction for Roof Wireframe Reconstruction with Transformers [19.5] 本稿では,S23DRチャレンジ2026に対する競合ソリューションを提案する。
SfM点雲と地上レベルのセマンティックセグメンテーションと深度マップから3Dハウスのワイヤーフレームモデルを再構築することを目的としている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:51:30 GMT)
Outsmarting the Chameleon: Counterfactual Decoupling for Tactical OOD Shifts in Live Streaming Risk Assessment [19.5] ライブストリーミングは、ソーシャルインタラクションとデジタルコマースの主要な媒体として登場したが、ますます高度なリスクに悩まされている。
本稿では,ロバストなライブストリーミングリスク評価のためのプラグインフレームワークであるアンダーライン・アンダーライン予測アンダーラインデカップリング(LPCD)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:55:18 GMT)
Time-Aware Diffusion based on Preference Disentanglement for Generative Recommendation [19.4] ジェネレーティブレコメンダ(GR)は、従来のアイテムIDを意味指標(SID)に置き換えることで、変革的レコメンデーションパラダイムとして登場した。
本研究では,SIDトークン上での時間認識拡散を設計し,TDPMという新しいGRフレームワークを提案する。
詳しくは、TDPMは、時間進化するユーザの好みの影響を拡散プロセスに統合する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:27:49 GMT)
Unsupervised Collaborative Domain Adaptation for Driving Scene Parsing [19.4] 本稿では、ソースフリー環境でシーン解析を行うための教師なし協調的なドメイン適応フレームワークについて述べる。
複数の事前訓練されたソースモデルからの補完的な知識を、元のソースサンプルにアクセスすることなく、統一されたターゲットモデルに転送する。
補完的なマルチソース知識を効果的に統合し、様々な運転環境における信頼性と一般化を目標領域で解析するシーンを改善する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:33:19 GMT)
Multi-Segment Attention: Enabling Efficient KV-Cache Management for Faster Large Language Model Serving [18.8] AsymCacheは、LLM(Large Language Model)推論のための計算対応のKVキャッシュ管理システムである。
AsymCacheはTTFTを最大1.90-2.03x、TPOT(time-per-latency-token)を1.62-1.71xまで下げることを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:51:37 GMT)
On the Generalization in Topology Optimization via Sensitivity-Conditioned Bernoulli Flow Matching [18.7] トポロジー最適化(TO)のサロゲートモデルは、負荷や境界条件の変化の下で、高度に可変なアウト・オブ・ディストリビューション(OOD)一般化を示す。
我々は,従来のTOを駆動する随伴感度について,コンディショニング信号がどれだけ情報を保存するかによってOOD性能が制御されるという仮説を立てる。
感性に対する条件付けにより,OODの性能が向上する一方で,物理場が生パラメータ条件に低下する傾向がみられた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:36:41 GMT)
TriAlign: Towards Universal Truth Consistency in Personalized LLM Alignment [18.6] 我々は、パーソナライゼーションを保ちながら、社会集団間で普遍的な真理が一貫していることを保証するために、真理不変アライメント(TIA)について研究する。
TIAのための初のオフラインマルチエージェント強化学習フレームワークであるTriAlignを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:19:52 GMT)
Beyond Low-Rank: Low-Rank Sparse Prompting via Spiking Neural Network and Prompt Factorization [18.4] 動的低ランクスパース視覚プロンプトを自然に学習する新しいフレームワークである textbfLow-textbfRank visual textbfSpike textbfPrompting (LoRSP) を提案する。
LoRSPは、スパイキングニューロンの脳に誘発されるスパース発火機構を利用して、各インスタンスに対してピクセルレベルのスパースプロンプトを生成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:08:34 GMT)
Encoded but Not Routed: Explaining the Table-Chart Gap in Scientific Claim Verification [18.0] モデルがチャートから情報を取り出すのに失敗するのか、それともそれを抽出するのに、予測を作るのに失敗するのかを考察する。
本研究では,表と表のエビデンス上の3つのオープンウェイトVLMの層次線形探索とアテンション解析を行い,その基礎となるデータについて考察する。
チャート情報はモデルの中間表現にエンコードされているが、予測位置には達していない。
これらの発見は、テーブルチャートのギャップを、予測時ではなく予測時に、どのように符号化された視覚情報がルーティングされるかの失敗として再構成した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:39:13 GMT)
Report on the Designing Accountable Software Systems Workshop [18.0] ワークショップは、いくつかの研究の方向性に終止符を打った知識の協調的な体系化として実施された。
この発見には、説明責任組織における定義と責任を明確にすることの重要性が含まれる。
さらに、説明責任構造をソフトウェア設計プロセスに翻訳する方法を研究するために必要となる研究が特定された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:22:02 GMT)
Cost-Aware Diffusion Draft Trees for Speculative Decoding [17.9] textbfCaDDTree (Cost-aware Diffusion Draft Tree) は,木構造とノード予算を協調的に選択することで,トークンスループット(単位時間当たりの予測トークン)を直接最適化する手法である。
Qwen3-4BとQwen3-8Bの実験では、推論、コーディング、命令追従タスクにまたがる8つのベンチマークで、caDDTreeがDDTreeとほぼ全てのタスクでオラクルの予算選択と一致または上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:29:56 GMT)
ContinuousBench: Can Differentially Private Synthetic Text Improve Capabilities? [17.4] ContinuousBenchは、差分プライベート(DP)テキスト合成から得られる能力を測定する。
Geminonは、架空の生物に関する手続き的に生成されたデータセットで、Newsは、新しくクロールされたニュース記事のストリームだ。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:00:01 GMT)
Any2Poster: Any-Source Poster Generation Across Modalities and Domains [17.3] 我々は、任意のソースのポスター生成のためのベンチマークであるAny2Poster Benchを紹介します。
Any2Poster Benchは、各ソースとクイズに基づく、直感的な事実保持と解釈的理解のプローブをペアリングする。
我々はまた、異種ソースを解析し、健全なコンテンツを整理し、レイアウト、レンダリングを計画し、視覚的フィードバックを使ってそれらを反復的に洗練する、エンドツーエンドの参照エージェントであるAny2Poster Agentを提示する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:41:21 GMT)
Active Exploring like a Pigeon: Reinforcing Spatial Reasoning via Agentic Vision-Language Models [17.2] 既存のアプローチでは、空間言語モデル(VLM)を受動的オブザーバとして扱うが、現実のアプリケーションでは難しい。
そこで本研究では,ハトによるナビゲーションのための認知マップの構築と活用に着想を得て,空間推論のための新しいエージェントパイプラインを提案する。
VisionCubeベンチマークの実験では、emph80.5%の精度で最先端のパフォーマンスを示し、emph29.5の精度ポイントで最高の電流法を上回った。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:30:56 GMT)
Treatment Effect Estimation with Differentiated Networked Effect on Graph Data [17.2] 観察グラフデータから個別治療効果(ITE)を推定することは、商業や医療などの分野における意思決定に不可欠である。
既存の手法は、正確なITE推定のためにそのような干渉をモデル化しようとする。
本稿では,2つの部分的注意機構とメッセージアンプを組み込んだ干渉モデリング機構を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:33:34 GMT)
CodegenBench: Can LLMs Write Efficient Code Across Architectures? [17.1] 汎用プログラミングとGPUアクセラレーション環境のためのコード生成タスクにおいて,大規模言語モデル (LLM) が広く評価されている。
CodegenBenchは、3つの異なるハードウェアプラットフォームにわたる効率的な並列コードの生成を評価するために設計されたベンチマークスイートである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:55:10 GMT)
UniNote: A Unified Embedding Model for Multimodal Representation and Ranking [17.0] 産業用I2I検索のための統合埋め込みモデルである textbfUniNote を提案する。
大規模アプリケーションにおいて,UniNoteは検索品質とコスト効率の大幅な向上を実現していることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:21:43 GMT)
CRAFTQA: A Code-Driven Adaptive Framework for Complex Structured Data Reasoning [17.0] 現実世界のシナリオは、巨大な異質な構造化データ(例えば、表、知識グラフ)を伴い、このような多様なデータに対する効果的な推論がますます重要になる。
CRAFTQAは,CodeSTEPとCRAFTの2つのコアモジュールからなる適応型コード駆動フレームワークである。
CodeSTEPモジュールは、質問に基づいてステップバイステップのコードベースの推論操作を含む、完全な実行可能なPythonコードシーケンスを生成する。
CRAFTモジュールは事前に定義された関数セットを超えて操作用のカスタムコード関数を動的に生成し、CodeSTEPとシームレスに統合することで複雑な推論処理の柔軟性を著しく向上する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:29:20 GMT)
PlanarBench: Evaluating LLM Spatial Reasoning via Planar Graph Drawing [17.0] PlanarBenchは、LLMがエッジリストのみを与えられたASCIIアートとして平面グラフを描画できるかどうかをテストする。
我々は、最も単純な199個の非同型連結平面グラフ上で91個のモデルを評価する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:04:07 GMT)
On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters [17.0] 強共有基盤モデル上で, 学習可能な小型アダプタを永続的局所状態として研究する。
スケールアップ(Scale Up)、スケールダウン(Scale Down)、スケールアウト(Scale Out)という3つのスケーリング軸に関する問題を整理します。
その結果,PEFTは永続的個人モデルのためのコンパクトな基板であることが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:09:19 GMT)
Hallucination Detection-Guided Preference Optimization for Clinical Summarization [16.8] 大規模言語モデル(LLM)は要約タスクを約束するが、幻覚を生成することが多い。
幻覚検出器を用いて反復的なリビジョンを導出する推論時間法であるitermodelfull(itermodel)を導入する。
そこで本研究では,検出器誘導精製軌道をモデルファインタニングのための選好ペアに変換する優先学習(Preference Learning, モデル)のイテラーモデルを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:38:20 GMT)
G2LoRA: Gradient Orthogonal Low-Rank Adaptation Framework for Graph Continual Learning on Text-Attributed Graphs [16.7] テキスト分散グラフ(TAG)の連続学習フレームワークであるG2LoRAを提案する。
G2LoRAは単一のグラフテキストアライメント目的の下でノード、リンク、グラフレベルのタスクを統一する。
ベンチマークデータセットの実験では、G2LoRAはさまざまなバックボーンアーキテクチャにおいて、一貫して強力なベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:19:47 GMT)
SafeSteer: Localized On-Policy Distillation for Efficient Safety Alignment [16.6] 我々は、安全機能は本質的に出力分布内では不足しているため、アライメントにはグローバルなトレードオフではなく、局所的な修正が必要であると論じる。
安全トークンに限定したオンライン蒸留を行うSafeSteerを提案する。
多様なモデルにまたがる実験結果から、SafeSteerは既存の方法と比較して安全性と一般的な機能とのトレードオフが優れていることが判明した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:38:12 GMT)
CanonCGT: Reference-Based Color Grading via Canonical Pivot Representation [16.6] CanonCGTは、安定した色マッピングのためのスタイルニュートラル中間表現である。
二相学習スキームDP-CGTは、教師付きプレセット学習と教師なし写真の自己教師付き精錬を組み合わせたものである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:42:20 GMT)
Linear Probes Detect Task Format, Not Reasoning Mode in Language Model Hidden States [16.5] 大規模言語モデル(LLM)隠れ状態の線形探索は、モデルが異なる推論型に対して異なる表現を学習すると主張するために広く用いられている。
古典的三分法にまたがる3つのベンチマーク、LogiQA 2.0 (導出性)、ARC-Challenge (導出性)、$$NLI (導出性)で、QwensicBによりこれを検証した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:22:15 GMT)
Adaptive Sharpness-Aware Minimization with a Polyak-type Step size: A Theory-Grounded Scheduler [16.4] Sharpness-Aware Minimization (SAM)は、強力で広く採用されている機械学習モデルとして自らを確立している。
SAMとその変種は、ほとんどのトレーニングアルゴリズムと同様に、学習率の選択に敏感である。
本研究では、SAMスタイルの更新に合わせたPolyakスケジューラを導出する。
提案したPolyakスケジューラはSAMベースラインを慎重に調整するよりもパフォーマンスが優れていることを示す実験である。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:42:01 GMT)
Characterization of Multi-Model Agentic AI Systems on General Tasks via Trace-Driven Simulation [16.4] 本稿では、2つの最先端エージェントシステムのトークンレベルトレースデータセットであるGAIATraceについて述べる。
GAIATraceは、すべての主要なLLMの完全な推論トークン、タスクレベル構造、アクティビティをキャプチャする。
また、GAIATraceを再生して再現可能で低コストなシステム評価を行うトレース駆動シミュレータVidur-Agentを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:43:16 GMT)
MPMWorlds: Material-Point-Method Simulations for Inferring and Extrapolating Physical Dynamics [16.4] 変形可能な物体,流体,運動物体,エミッタなどのリッチな物理現象をカバーする2次元材料ポイント法 (MPM) の物理シミュレーションデータセットを組み立てる。
このデータセット上でのコード生成とビデオ拡散のアプローチについて検討し、物理的に関係する側情報の量を変化させることで、その強みと弱みを識別する。
コード生成モデルは、MPMシミュレーションの自動合成の動作デモ以上のもので、このようなアプローチは視覚的入力から物理パラメータを推測するのに苦労するが、ビデオ拡散とは対照的に、時間とともに物理的および時間的に安定した外挿を生成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:36:44 GMT)
ST-ColoNet: Spatio-Temporal Colon Segment Recognition via Hybrid Attention and Edge-Guided Feature Learning [16.3] 既存の自動認識手法は、時間的情報を完全に活用することなく、大腸内視鏡画像のみを使用するため、性能は低下した。
時空間ネットワーク(ST-ColoNet)を用いた2段階の深層学習フレームワークColo-Segment Recognitionを提案する。
我々は,コロセグメンテーション認識のタスクにおいて最先端の性能を達成でき,精度が81.0%,F1スコアが70.7%であることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:12:44 GMT)
ProtoAda: Prototype-Guided Adaptive Adapter Expansion and Geometric Consolidation for Multimodal Continual Instruction Tuning [16.2] MLLM(Multimodal Large Language Models)は、命令チューニングによって高いパフォーマンスを達成するが、現実のデプロイメントでは、新たな視覚言語機能を取得する必要がある。
近年の手法では、画像-テキスト類似性ルーティングのMixture of LoRA Expertsのようなスパースアーキテクチャが採用されている。
プロトタイプ誘導適応チューニングフレームワークProtoAdaを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:59:13 GMT)
CRAM: Centroid-Routing and Adaptive MoE for Multimodal Continual Instruction Tuning [16.2] MLLM(Multimodal Large Language Models)は、多種多様な視覚言語タスクを、命令チューニングを通じて共有生成フレームワークで統合する。
既存のメソッドは、共有パラメータセットですべてのタスクを更新するか、新しいタスクごとに専用のモジュールを割り当てる。
CRAMはタスク固有のパターンを独立したモジュールに分離することで、タスク間の破滅的な忘れを軽減します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:11:30 GMT)
Hierarchical Semantic-Augmented Navigation: Optimal Transport and Graph-Driven Reasoning for Vision-Language Navigation [15.9] VLN-CE(Vision-Language Navigation in Continuous Environments)は、自律的なエージェントに深刻な課題をもたらす。
既存のアプローチは、シーン理解の制限、非効率な計画、堅牢な意思決定フレームワークの欠如など、長期的なタスクでしばしば失敗する。
我々は、VLN-CEを3つの相乗的革新によって再定義する画期的なアプローチである textbfHierarchical Semantic-Augmented Navigation (HSAN) フレームワークを紹介した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:11:01 GMT)
Generalization Limits in Vehicle Re-Identification [15.8] 車両の再識別は、クエリー画像が与えられたギャラリーから同じ車両の画像を取得することに焦点を当てる。
例えば、トレーニングセットとテストセットの両方において、同じメイク、モデル、色が現れるなど、視覚的な差異が少ない車両を観察する。
そこで本研究では,未確認車種に対する一般化能力をより効果的に測定する新しい評価手法を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:43:06 GMT)
Poking Around in the Dark: Why a Shared Understanding of Components Matters [15.8] 一般的な4つのSBOM生成ツールを分析し、それらが関連するコンポーネントをどのように定義し、識別するかを理解する。
我々はこれらをPython、Java、Go、PHP、Rust、Cといったプログラミング言語の根底にある真実を使って評価します。
現在の曖昧な定義とツールの下では、SBOMはコンポーネントの包摂において曖昧さと盲点を示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:12:26 GMT)
The Image Reconstruction Game: Drawing Common Ground Through Iterative Multimodal Dialogue [15.8] 我々は、視覚言語モデルが複数のターンにまたがる画像生成装置に補正命令を発行する完全自動ベンチマークである画像再構成ゲームを紹介した。
また, 再現品質の要因として, 再現性向上の助けとなるか, 痛みを伴うか, ジェネレータが決定する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:42:06 GMT)
Community-Aware Assessment of Social Textual Engagement and Resonance: A Human-Centric Perspective on User-Generated Content Evaluation [15.6] 本稿では,信号中心の指標から人間中心の共鳴評価へのパラダイムシフトを提案する。
本稿では,新しいソーシャル・チェーン・オブ・トラヒック(Social-CoT)機構を導入するMEDEAについて紹介する。
CASTER-Benchは、さまざまなカテゴリをカバーする包括的な人間アノテーション付きベンチマークである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:38:39 GMT)
Topics as Proxies for Sociodemographics: How Conversational Context Affects LLM Answers [15.5] 本研究では,大きな言語モデル(LLM)が,単一の会話履歴からユーザ社会デマトグラフィーを推測するのに苦労していることを示す。
会話の話題は、会話の文脈内でLLM生成のアドバイスを最も予測することを発見した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:38:41 GMT)
Principled Reflection Separation via Nonlinear Superposition and Feature Interaction [15.4] 単一像の反射分離は、透過層と反射層の絡み合いによって根本的に困難である。
既存のアプローチは主に単純化された仮定や独立したモデリングに依存し、現実世界のシナリオを扱う能力を制限する。
本稿では, 層間相互作用をより忠実に特徴づけ, 分解精度を向上させる非線形重ね合わせモデルを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:50:52 GMT)
Tree-Guided Identify-Then-Exploit: A Unified Framework of Best Arm Identification and Regret Minimization for Dueling Bandits [15.4] 我々はコンドルチェット・ウィンナーの仮定で$N$の武器を持つデュエルバンドについて研究する。
広く採用されている3つの目的は、ベストアーム識別(BAI)、弱い後悔、強い後悔である。
我々は,これらすべての目的に対処する最初の統合フレームワークであるTG-ITE(Tree-Guided Identify-Then-Exploit)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:17:49 GMT)
Consistency evaluation of benchmarks used for causal discovery [15.1] この研究は、ベンチマーク因果グラフの品質を体系的に研究した最初のものである。
具体的には、科学データベースから関連する研究論文を自動的に取得するパイプラインを設計する。
我々は11の人気のある実世界のベンチマークを評価し、このベンチマークで合計38,081のドメイン論文が得られた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:09:06 GMT)
COMAP: Co-Evolving World Models and Agent Policies for LLM Agents [14.9] COMAPは、クローズドループインタラクションを通じてテキストワールドモデルとエージェントポリシーを共進化させる新しいフレームワークである。
各決定ステップにおいて、世界モデルは、候補行動に対する将来の状態フィードバックを予測し、エージェントは、このフィードバックの信頼性を推定して、将来の状態リフレクションを行う。
結果として生じるオンライン軌道は、自己蒸留によって世界モデルを更新するために使用され、エージェントの進化する相互作用分布によく一致する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:21:17 GMT)
MidSurfNet: Learnable Face Pairing and Interference Implicit Fields for Generalized Mid-surface Abstraction [14.9] MidSurfNetは、幾何学的およびトポロジ的特徴から対の信頼性を予測することを学ぶ学習拡張フレームワークである。
1500以上の注釈付きCADモデルを含む大規模中層データセットを構築した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:36:02 GMT)
When Knowledge Is Not Free: Cost-Aware Evidence Selection in Retrieval-Augmented Generation [14.8] 検索された証拠がアクセスコストの層に割り当てられ、システムは明示的なエビデンスアクセス予算の下で答えなければならない。
本稿では, LLMがいつ取得するか, アクセスするレベル, 停止するタイミングを決定するエージェントコスト対応RAGについて検討する。
これらのことから,次世代のRAGシステムにおいて,コスト認識型エビデンス獲得が中心的な課題であることが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:39:39 GMT)
WALL-WM: Carving World Action Modeling at the Event Joints [14.8] WALL-WMは、ビデオアクション学習をチャンク中心の最適化からイベントグラウンドのVLA事前トレーニングに移行するWorld Action Modelである。
WALL-WMはこのミスマッチに対処するため、セマンティックイベントに関する監視とデータの両方を整理する。
実験により、WALL-WMは言語、シーン、タスクを幅広く一般化し、大規模実世界の一般化評価において最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:14:51 GMT)
World-Task Factorization for Robot Learning [14.6] ロボット工学における最も基本的な要因は、世界とタスクを分離することである。
世界的要因は、エンボディシステムと環境の性質である。
タスクファクタは、世界が認めるタスクのロジックによって定義される。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:16:07 GMT)
ClinEnv: An Interactive Multi-Stage Long Horizon EHR Environment for Agents [14.4] ClinEnvは、決定論的グラウンドマッチングと、その情報収集方法を通じて、モデルが決定するものをスコア付けする。
ClinEnvは、結果のみの評価に見えない、直接測定可能な情報取得ギャップを作る。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:56:26 GMT)
PlatonicNav: Unveiling Semantic Correspondence in Navigation with Platonic Topological Maps [14.4] 身体的な視覚ナビゲーションは、家庭用サービスロボティクス、補助ロボティクス、大規模自律探査など、幅広い応用を支えている。
我々は,Platonic Topological Mapが自己教師付き視覚エンコーダから幾何学的および意味的ノード距離を融合する学習自由フレームワークであるPlatonicNavを紹介し,視覚言語データをペア化せずにブラインドマッチングによって言語目標をグラウンド化する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:08:50 GMT)
Training Prompt Matters: State-Adaptive Optimization for Robust Fine-Tuning [14.3] パラフレーズのプロンプトは, 忘れることや一般化に大きく異なる影響をもたらすことを示す。
これらの影響はタスク間で正に相関しており、優れたプロンプトの存在が常により良いパフォーマンスをもたらすことを示している。
静的入力から動的状態適応変数へタスク定式化をシフトする軽量かつ効果的なトレーニング戦略である状態適応型プロンプト最適化(SAPO)を導入する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:31:28 GMT)
GloResNet: A lightweight 3D CNN with global topological features for preterm brain injury prediction [14.2] 本稿では,ResNet-10をベースとした軽量3次元CNNであるGloResNetを提案する。
大域多様体写像戦略はまず、各3次元体積を128x128x128に再サンプリングし、次に主観的にzスコア強度正規化を適用する。
5倍のクロスバリデーションでは、GloResNetは平均精度75.18%(約81.82%)、特異度0.81、感度0.76。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:04:43 GMT)
ChatHealthAI: Aligning Electronic Health Record Representations with Large Language Models for Grounded Clinical Reasoning [14.0] 大規模言語モデル (LLMs) は、臨床診断支援のための強力な自然言語推論能力を示す。
本稿では,構造化EHR表現と凍結LDMの意味空間を整合させるマルチモーダル推論フレームワークChatHealthAIを提案する。
その結果,ChatHealthAIは,競争予測性能を維持しつつ,推論品質と解釈可能性を向上させることがわかった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:21:18 GMT)
TROPHIES: Temporal Reconstruction of Places, Humans, and Cameras from Multi-view Videos [13.6] TROPHIESは、動的な人間、静的シーン、カメラのポーズを1つのグローバル座標フレームで共同で推定することを目的としている。
グローバルアライメントと最適化モジュールは、スケール整合性、コンタクト先、およびクロスビューの時間的コヒーレンスを強制することによって、両方のブランチを結合する。
EgoHuman と EgoExo4D の実験では、TROPHIES はグローバルな忠実さとヒューマンシーンの一貫性の両方において、既存のパラダイムを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:00:18 GMT)
Unified Driving Tokens: Representation- and Geometry-Guided Discrete Tokenizer for Driving World Models and Planning [13.4] 共同管理下で離散トークンを学習する表現誘導型および幾何学強化型トークン化器を提案する。
NAVSIMの実験では、再構成の忠実度と表現整合性、固定デコーダによる競合計画性能、一致した設定での生成品質が向上した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:02:32 GMT)
Many a Little Makes a Mickle: A Code-Centric Empirical Study of Data Minimization Principle in Android App Development [13.3] 我々は,データ最小化を開発者操作可能な原則として重視し,Androidアプリケーションにおけるその実現について検討する。
我々は,5つのデータ処理ステージにわたる10の繰り返しデータ最小化シナリオを特定するために,オープンソースの1,114のAndroidアプリに関するフォーマティブスタディを実施している。
プライバシに準拠した開発を支援するために31の実行可能なコーディングガイドラインを抽出する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:36:47 GMT)
Multi-Modal Machine Learning for Breast Cancer Recurrence Prediction [13.3] 乳がんの再発は、生存者の長期死亡の主な原因である。
従来の予測モデルは、しばしば構造化データまたは非構造化データのみに限定され、完全な臨床コンテキストを捉えるのに苦労する。
本研究は, 治療記録, 病理報告, 臨床ノートなどの多段階臨床データの統合が再発予測に及ぼす影響について検討した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:06:07 GMT)
Reason-Then-Retrieve for CoVR-R with Structured Edit Prompts and Dense-Sparse Fusion [13.2] 我々はQwen3.5-27Bの周囲にゼロショットの合理的検索パイプラインを構築している。
各ギャラリービデオに対して、モデルが検索指向の構造記述と密埋め込みを生成する。
検証では、R@1で80.81、R@5で94.86、R@10で97.11、R@50で98.59に達する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:21:01 GMT)
Faster Synchronous On-Policy RL via Straggler-Aware Group Sizing [13.1] Straggler-Aware Group Control (SAGC) は、観察されたロールアウト行動に基づいてトレーニンググループをオンラインで適応する動的グループサイズコントローラである。
我々は,SAGCがトラグラーの発生率を一定に低減し,ウォールクロック効率を向上し,競争力やトレーニング報酬を向上することを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:20:00 GMT)
Rethinking the Role of Positional Encoding: Sliding-Window Transformers without PE Remain Turing Complete [13.0] 位置符号化(PE)は、整列処理に必要な変換器として広く見なされている。
この直観は、任意の普遍性を実現することができることを証明するために位置情報に依存する全ての先行結果の根底にある。
我々は、この信念を、有限なスライディングコンテキストウインドウを通して生成が進行する、長期的推論に最も関係のある体制に再考する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:28:42 GMT)
PyFEX: Uncovering Evasive Python-based Threats via Resilient and Exhaustive Path Exploration [12.9] プログラム解析のためのレジリエントな強制実行エンジンであるPyFEXを提案する。
PyFEXはプログラムの振る舞い空間を体系的に探索し、すべての条件分岐に対して実行を強制して回避チェックをバイパスする。
このエンジンの有効性を実証するため,我々はPyFEX上に構築された概念実証マルウェア検出器であるPyFEXScanを開発した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:51:21 GMT)
AFUN: Towards an Affordance Foundation Model for Functionality Understanding [12.9] 我々は,機能理解のための手頃な基礎モデルに向けたステップとして,我々のモデルを提示する。
我々は、異種ロボット、人間、シミュレーション、現実世界のスキャンデータを共有価格スキーマに変換する大規模な標準化データパイプラインを構築します。
私たちのモデルは、4つのベンチマークから8つのテストセットにまたがる大きなマージンで、すべてのベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:50:16 GMT)
ROGLE: Robust Global-Local Alignment with Automated Region Supervision for Text-Based Person Search [12.9] テキストベースパーソンサーチモデルは、大域的な表現バイアスと短いキャプションでのトレーニングから受け継がれた意味空間性のために、きめ細かな理解に苦慮している。
ROGLEは、自動化された領域間マッチング戦略により、コストのかかる手作業によるアノテーションへの依存を克服する統合フレームワークである。
また、P-VLGベンチマーク(P-VLG Benchmark)についても紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:41:44 GMT)
MomentKV: Closing the Directional Gap in KV Cache Eviction for Long-Context Inference [12.3] Transformerベースの言語モデルにおける自動回帰デコーディングは、KVキャッシュに依存している。
KVキャッシュ消去は、キーと値のペアの固定サイズのサブセットを保持し、残りを破棄することでこの問題に対処する。
本稿では, 除去トークン集合上のコンパクトで小型なモーメント統計量を維持するMomentKVを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:08:40 GMT)
Pathway-Structured Privileged Distillation for Deployable Computational Pathology [12.3] パスウェイエキスパートの混合(Mixture of Pathway Experts、MOPE)は、病理学のみの推論のための特権蒸留としてマルチモーダル学習を再構成する知識蒸留フレームワークである。
MoPEはRNA由来の経路をコードし、分子制御を経路インデクシングされた病理の専門家に伝達する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:46:42 GMT)
Near-Optimal Pure Machine Unlearning for Smooth Strongly Convex Losses [12.2] マシンアンラーニングは、訓練されたモデルから個人データの影響を取り除くための法的およびユーザ対応の要件によって動機付けられている。
我々は,約$varepsilon$-unlearningの過剰集団リスクについて,上層と下層の境界を証明した。
我々のアルゴリズムは、スクラッチからモデルを再訓練するよりも指数関数的に精度が向上する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:19:04 GMT)
Spatial Representation Learning Beyond Pixels: Unifying Raster Data and Vector Semantics for Human-Centric Geospatial Foundation Models [12.2] 自己教師型学習の最近の進歩は地球観測基礎モデル(EOFMs)を提起した
本稿では,ベクトルベース推論と認識を統合した統合埋め込み空間における共同空間表現学習(SRL)へのパラダイムシフトを提案する。
このような統合は、地球をより正確で、解釈可能で、根底から理解できる次世代の地理空間AIシステムの開発に不可欠である、と我々は主張する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:21:58 GMT)
Motion Planning in Dynamic Environments: A Survey from Classical to Modern Methods [12.2] 本稿では,古典的アプローチと学習的アプローチの両方にまたがる138作品の包括的調査を行う。
動作計画手法は, サンプリング, グラフ探索, モデル予測制御, 学習, その他の古典的局所計画手法の5つのカテゴリに分類される。
この調査は各手法の原則、強み、限界を分析し、特に動的環境に特有の課題に注目している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:47:51 GMT)
Hist2Style: Histogram-Guided Stylization with Bilateral Grids [12.1] フォトリアリスティックなスタイル転送は、入力画像の色とトーンを、オリジナルシーンの内容と詳細を保存しながら、スタイルターゲットの色とトーンに合わせることを目的としている。
本モデルでは,大規模な教師付きコーパスのトレーニングにより,大規模な画像編集モデルを軽量ネットワークに抽出する。
Hist2Styleは、インタラクティブなユーザ制御可能な色とトーン調整を備えたリアルタイムで高解像度のフォトリアリスティックスタイリングをサポートする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:34:10 GMT)
BlockGen: Flexible Blockwise Sequence Modeling with Hybrid Samplers [12.1] マスクと均一拡散の両方でインスタンス化するブロックワイズシーケンスモデルであるBlockGenを導入する。
BlockGenは、ARと拡散予測を組み合わせたARインフォームド予測-コレクタサンプリング(ARPC)を可能にし、不可能なトークンを再生成する。
GSM8Kのブロックサイズは16ドルであり、MDMはUSDMよりもわずかに精度が高く、OpenWebTextのGenerative Perplexityでも同様の傾向が観察されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:36:54 GMT)
If LLMs Have Human-Like Attributes, Then So Does Age of Empires II [12.0] われわれは、ビデオゲーム『帝国時代の時代』に基づいて、シンプルなニューラルネットワークを構築し、訓練する。
LEGO や Greater Boston Area のような十分なパワーを持つ基板の任意のエンティティも,そのような属性を提示できる点に注意が必要だ。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:31:22 GMT)
CityTrajBench: A Unified Benchmark for City-Scale Vehicle Trajectory Generation [11.8] CityTrajBenchは、都市規模の車両軌道生成のための統一されたベンチマークフレームワークとプロトコルである。
データ取り込み、軌道正規化、特徴構成、モデル適応、マップ対応後処理、モデル選択、評価を標準化する。
このベンチマークは、グローバル空間リアリズム、トリップレベル分布の忠実度、軌跡レベルの幾何学的類似性、条件付きモビリティの整合性、効率を計測する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:08:56 GMT)
Quantifying the Energy Floor: Direct Measurement and Replay Buffer Bias in SAC-Based HVAC Control on sbsim [11.8] 我々は、作用空間の制約が与えられた最小の達成可能なコストであるエネルギーフロアを定量化する。
アルゴリズム設計ではなく,機器の最小電力が結合制約を課していることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:18:42 GMT)
CRAB-Bench: Evaluating LLM Agents under Complex Task Dependencies and Human-aligned User Simulation [11.8] CRAB-BenchとRUSEを導入し、サービスシナリオにおける現実的なエージェントを評価する。
RUSEは、協調的なテンプレートのようなシミュレータを、人間の行動研究に基づく現実的なユーザに置き換える。
実験によると、最高のモデルはCRAB-Benchで61%のpass@1しか達成せず、RUSEに切り替えると最大57%の低下が生じる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:31:04 GMT)
Edge-aware Decoding for Neural Asymmetric Routing [11.7] ニューラル非対称ルーティングのためのデコーダ設計原理を提案する。
最終スコアは、問題のコスト・ツー・ゴー構造によって示唆される遷移レベルの量を明確に示すべきである。
我々は、この原理を、現在の有向エッジに対して候補固有の用語を追加するエッジ対応デコーダでインスタンス化する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:03:59 GMT)
Food Noise & False Safety: A Systematic Evaluation of How LLMs Fail to Adapt to Eating Disorder Queries with Clinician Feedback [11.5] 本稿では,摂食障害(ED)とLarge Language Model(LLM)ベースのチャットシステムとのインタラクションパターンについて検討する。
我々は、特定の言語的手がかりが、安全でない応答の可能性を高めることを発見した。
LLMが問題や潜在的に危険なユーザ入力に非批判的に適応する範囲について報告する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:14:18 GMT)
Regularized Large Neighborhood Search [11.5] 大規模地域探索(LNS)を用いたNP難問の運用研究実践者
正規化LSS(RLNS)によりこのギャップを埋める。
アンダートロピック正規化では、RLNSが正確なブロックギブスサンプリングを行う。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:16:18 GMT)
When Meaning Travels: A Granular Lens on Hybrid-MoE's Role in Idiomatic Understanding for Language Models [11.4] 本稿では, ヒンディー語, ベンガル語, タイ語などの低資源の東南アジア諸言語において, 図形的・文化的意味を保ち続ける航法を示す。
このような複雑さに対処するため、3,533個の多言語イディオムからなる再構成された多モーダルコーパスであるVarnikaを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:28:44 GMT)
Segment-driven Structural Induction and Semantic Alignment for Heterogeneous Tabular Representation [11.3] NAVIはセグメント中心の事前トレーニングフレームワークであり、各ヘッダ値ペアをスキーマレベルの構造的エビデンスと列レベルの分布的エビデンスを集約する単位として扱う。
Masked Segment ModelingとEntropy-driven Segment Alignmentは、構造化ヘッダ値の結合と、安定した属性とインスタンス固有の属性間のセマンティックアライメントを共同で実施する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:34:25 GMT)
Depth from Dual Differential Defocus and Stereo Consensus [11.2] 本稿ではD3S Consensusについて紹介する。D3S ConsensusはDfDとステレオを統一した物理ベースの閉形式アルゴリズムである。
被写界深度(DoF)を超える広い作業範囲にわたって高精度な深度推定を実現する。
最大900 x 1800ピクセルの深度マップを生成し、1-cmの平均絶対誤差はスナップショット取得から0.3-1.64mを超える。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:21:09 GMT)
From Zero to Hero: Training-Free Custom Concept Spawning in World Models [11.2] SPAWN(Swapping Anchor with Windowed iNjection)は,概念生成のためのトレーニング不要な手法である。
我々はSPAWNが一貫した照明、スケール、視点と概念を統合しつつ、アイデンティティと時間的コヒーレンスを保っていることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:59:05 GMT)
Two to Tango: Coupled Task-Reference Selection for Safe LLM Fine-tuning [11.2] 下流データ上での微調整型安全性整列大言語モデル(LLM)は適応性を向上するが、学習された安全性の挙動を損なう可能性がある。
タスク条件付き安全基準を更新するタスクと参照の選択のための結合フレームワークであるDualSelectを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:43:36 GMT)
DOT-MoE: Differentiable Optimal Transport for MoEfication [11.2] DOT-MoEは、高密度層の分解を微分可能な最適輸送問題として定式化する新しいフレームワークである。
我々は,DOT-MoEが構造化プルーニング,クラスタリング,ランダムスプリットベースラインを著しく上回ることを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:19:16 GMT)
Spectral Audit of In-Context Operator Networks [11.1] 本稿では,文脈内演算子学習のためのヤコビアンベースのスペクトル監査手法を提案する。
この結果から,予測精度と局所演算子の忠実度は学習したニューラル演算子の異なる特性であることが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:04:21 GMT)
Ensemble Score Filtering for Real-Data Energy Consumption Forecast Correction [11.0] 実エネルギー消費データに対する高次元データ同化問題について検討する。
本研究ではEnsemble Score Filter(EnSF)を用いて,部分的および雑音的な観測を同化し,時間とともに予測軌道を補正する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:36:10 GMT)
Towards Multidisciplinary Summarization of Hospital Stays: Efficient Sentence-Level Clinical Provenance Categorization [11.0] 本研究では,大規模言語モデル (LLM) の教師付き微調整 (SFT) を用いた臨床経験分類パイプラインを提案する。
2つのLlama-3モデルを2,002MIMIC-III(Adult ICU)コーパスであるMedSecIdに適応した。
モデル容量 (8B vs. 70B) と227文レベルのゴールド標準データセットを用いた定量化を行った。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:57:51 GMT)
Density-Aware Translation of Spurious Correlations in Zero-Shot VLMs [10.9] 本稿では,グループ参照集合から派生した局所的幾何学的密度項を用いて画像テキスト類似度スコアを洗練する密度認識翻訳を提案する。
提案手法は,CLIP埋め込みがモダリティギャップを呈し,特徴空間の異方性貝殻に横たわる現象を特徴とする。
我々は,密接な意味的整合性を維持しつつ,拡散領域における過信度スコアを抑えながら,埋め込み密度に基づいて類似性を再スケールするために,相対測度を用いる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:23:48 GMT)
TIDES: Time-Derivative Event Simulation via Deformable Reconstruction [10.9] 動的スプラッティングをベースとした連続時間イベントシミュレータTIDESを提案する。
TIDESは、学習された幾何学と動きを持つ明示的な3D表現で動作する。
レンダリングフレームの違いによってではなく、シーンから直接ピクセルごとの強度ダイナミクスを導き出すことができる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:49:13 GMT)
FATE-VLA:Failue-aware test generation for vision-language-action models [10.7] ビジョンランゲージ・アクションモデルは、ジェネラリストロボットポリシーとしてますます使われている。
高次元のエンボディド空間では、障害はスパースでクラスタ化されているため、静的なベンチマークはリスクを過小評価する可能性がある。
本稿では,多様性に基づく探索と観察結果から得られたサロゲートモデルを組み合わせたフェールアウェアなテスト生成手法を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:27:13 GMT)
MixerSENet: A Lightweight Framework for Efficient Hyperspectral Image Classification [10.7] ハイパースペクトル画像(HSI)分類のための新しいフレームワークであるMixerSENetが導入された。
提案モデルは、ネットワーク全体にわたって一貫したサイズと解像度を維持しながら、ハイパースペクトル画像パッチを処理する。
MixerSENetは軽量で計算効率が良く、従来のモデルに比べてパラメータが少ない。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:07:32 GMT)
QSplitFL: Capability Aware Deep Q-Learning for Optimal Split Point Selection in Split Federated Learning [10.6] 本稿では、分散学習に基づくフェデレート学習(SFL)環境において、最適な分割点選択のための機能対応のディープQネットワーク(DQN)フレームワークであるQSplitFLを紹介する。
提案フレームワークは,早期収束を優先する損失損失補償機能と,ハッキングに対して多数票を投じた委員会ベースのDQNアーキテクチャを備える。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:46:04 GMT)
Hybrid Adaptive Kalman Filtering for Data-Efficient Joint Tracking and Classification [10.5] 本稿では,システムダイナミクスに対する構造的補正と,測定のみから処理ノイズの共分散を学習する自己教師型ハイブリッド適応カルマンフィルタを提案する。
実世界およびシミュレーションデータセットの実験結果から,評価精度と統計的整合性が向上し,ロバストな分類性能が得られた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:30:59 GMT)
Before Fusion, Ask What to Keep: Contextual Calibration of Multimodal Signals [10.5] マルチモーダルシステムは、言語、サウンド、ビジュアルストリーム間の情報の組み合わせの恩恵を受けることが多いが、この利点は保証されていない。
本研究では、下流予測器にマージされる前にマルチモーダル表現を調整する方法について検討する。
我々は,各モダリティを要約レベルで比較し,クロスソースサポートと競合のキューを抽出し,これらのキューをインスタンスワイドおよび次元ワイド変調信号に変換する,コンパクトなキャリブレーションモジュールを開発した。
キャリブレーションは、既に融合した表現ではなく、元のモダリティの特徴に適用され、モデルが誤解を招く成分を抑え、弱いが有用な証拠を保持し、より支持された応答を強調することができる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:20:12 GMT)
Towards Precise Intent-Aligned VLA Aerial Navigation via Expert-Guided GRPO [10.4] VLAに基づく航空ナビゲーションのための効率的な強化学習フレームワークを提案する。
その中核として,数ショットのエキスパートデータでオンラインロールアウトを拡大するEG-GRPOを提案する。
複雑な人間の意図によって指定された複数のタスクに対して、EG-GRPOは成功率をSFTベースラインの2.13倍に改善し、インテントアライメント性能を60.9%向上させた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:31:35 GMT)
Gate the Filter, Not the Message: Node-Channel Mixtures for Pre-Propagation GNNs [10.3] FilterMoEは、学習可能なChebyshevフィルタ専門家の小さなバンクを3Dゲーティングテンソルでノードとチャネルに共同でルーティングする、エキスパートの混合PPGNNである。
11のホモフィリックデータセットとヘテロフィリックデータセットの合計で、FilterMoEは9つのデータセットで強力なPGGNNベースラインを上回り、3つの大規模ベンチマークで第1位にランクインしている。
これらの結果は、データセット固有のホップアグリゲータ選択の頑健な代替として、ジョイントノードチャネルフィルタを確立する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:14:13 GMT)
VLBM: Variational Latent Basis Modeling for OOD Robust Multivariate Time Series Forecasting [10.3] OOD誘起偏差から安定なダイナミクスを分離する理論ガイド付き潜時予測フレームワークを提案する。
12のベンチマークタスクで、VLBMは堅牢性とIDの精度を達成し、平均的なMAEとMSEは15.08%、最強のベースラインは7.74%向上した。
これらの結果は,IDとOODの混合条件下での頑健な予測への原則的経路として,潜在構造予測を支援する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:05:57 GMT)
Simulating Condensed Matter Physics on Quantum Hardware [10.3] このレビューでは、ゲートベースのデジタル量子コンピュータシミュレーションが強調され、アナログ実験は相補的なベンチマークとして議論されている。
まず、超伝導量子ビット、トラップイオン、超低温原子、リドバーグアレイ、フォトニックシステム、モアレ量子材料など、主要なハードウェアプラットフォームについてレビューする。
この基礎の上に、凝縮物質物理学、基底状態問題、強相関物質、トポロジカル位相、非平衡力学、開系物理学、高エネルギー物理に着想を得たシミュレーションの代表的な応用について論じる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:00:07 GMT)
Identifiable Markov Switching Models with Instantaneous Effects and Exponential Families [10.3] 時相系は、季節的な気候変動や1型糖尿病患者の血糖変動などの非定常的な行動を示すことが多い。
非定常性(英語版)をモデル化する方法の1つは、離散潜在状態、すなわち定常時間セグメントを通してである。
潜伏状態の特定は、頻繁な状態スイッチと非線形および非ガウス力学の存在において困難である。
我々の識別可能性理論は因果モデルの非時間混合を仮定する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:25:58 GMT)
Benign Inputs, Harmful Outputs: Cross-Modal Jailbreaking via Distributed Semantic Recomposition [10.2] MLLM(Multimodal Large Language Models)は近年,コンテンツ合成と自律推論において顕著な能力を示した。
従来の安全ガードレールは、主に単文入力インターセプション用に設計されている。
本稿では,分散セマンティック・リコンポジション(DSR)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:49:12 GMT)
Asymptotic Recovery in Fourier Spectral Methods for the Schrödinger Equation with Point Singularities [10.2] 本稿では、Hs$における特異ポテンシャル$Vを持つシュルディンガー方程式に対するフーリエスペクトル法(FSM)について検討する。
孤立点特異点を持つポテンシャルの存在下で、我々はFSM解を後処理する手法を開発する。
AR-FSMと呼ばれるこの手法は超収束性を完全に活用し、固有値に対して2s+2+2b$、標準値として$H1$$の固有関数に対して$s+1+b$を得る。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:33:58 GMT)
Automated Report-Derived Oncology VQA Benchmark for Evaluating Vision-Language Models on 3D Medical Imaging [10.1] 医用画像上での視覚言語モデル (VLM) の評価には、臨床的に基礎を置き、拡張性があり、評価のために制御されるベンチマークが必要である。
本稿では,2つのプライベートラジオグラフィーレポートと3Dオンコロジーイメージングから直接,複数選択VQAデータセットを生成する自動エージェント駆動パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:27:42 GMT)
A Primer in Post-Training Reasoning Data: What We Know About How It Works [10.1] 本稿では,150以上の主要な公開研究と学習後推論データに関するシステムレポートを合成した最初のプライマーである。
データオブジェクトが存在するか、何が有用か、どのように構築されているか、どのようにスケールするか、という4つの質問に関するフィールドを整理します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:45:50 GMT)
AutoForest: Automatically Generating Forest Plots from Biomedical Studies with End-to-End Evidence Extraction and Synthesis [10.1] AutoForestは、バイオメディカルペーパーから直接出版可能な森林区画を生成するエンドツーエンドシステムである。
1つ以上の研究論文が与えられたとき、AutoForestはICO(Intervention, Comparator, Outcome)要素を自動で提案し、結果データを抽出し、統計的合成を行い、最終的な森林プロットを描画する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:49:33 GMT)
Uncertainty-Calibrated Diffusion for Reliable 3D Molecular Graph Generation [10.1] 拡散推論によって不確実性が伝播し,サンプリング品質が低下することを示す。
本稿では, 逆拡散過程を校正して不確実性を考慮し, 簡便かつ効果的な方法として, UCD (Uncertainty-Calibrated Diffusion) を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:48:22 GMT)
Convex Distance Operator Transport: A Convex and Geometry-Preserving Formulation [9.9] 異種領域間の分散を整列する最初の凸最適輸送フレームワークであるConvex Distance Transport Operator (CDOT)を紹介する。
CDOTは、距離と条件付き期待演算子を導入することで集約された距離構造を整列する演算子ベースの正規化を用いる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:38:09 GMT)
EVA-Net: Subject-Independent EEG Motor Decoding with Video-Derived Motor Priors [9.9] EVA-Netは、主観非依存の脳波モータデコーディングのセマンティックプリエントとしてアクションビデオを使用する2段階のフレームワークである。
EEGMMIでは8.66%のLOSO精度向上を含む、強い被写体非依存の復号性能を実現している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:29:37 GMT)
Measurement Geometry and Design for Trustworthy Generative Inverse Problems [9.9] 本研究では,測度・測度の観点から生成的逆問題について検討する。
中心的な問題は、固定測定オペレータが、生成前の条件下で可視である近傍の画像を識別できるかどうかである。
本稿では,操作者が先行関係の接点方向をいかによく観察するかを定量化する局所的な測定・次元整合性尺度を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:28:24 GMT)
Do Value Vectors in Deep Layers Need Context from the Residual Stream? [9.9] Bank of Values(BOV)は、トークン固有の値ベクトルのルックアップテーブルを、最後の3分の1のレイヤ毎に学習することで、注目されている価値ベクトルを計算するための新しい方法である。
BoVは標準的な注意力よりもバリデーション損失を改善し、780Mでは21ベンチマークの平均スコアが以前のベストメソッドと一致している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:43:34 GMT)
Randomized Least Squares Value Iteration itself is Joint Differentially Private [9.9] 本研究は,RLSVI(Least Squares Value Iteration)のようなランダムな探索に基づくアルゴリズムに焦点を当てる。
探索用に設定されたRSVIのノイズが、同時にプライバシー保護を提供するのを特徴付ける新しいプライバシ分析を示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:13:02 GMT)
Revisiting Ripple Effects in Knowledge Editing through Pressure-Aware Joint Neighborhood Optimization [9.7] 本研究では,目標計画段階における両方の圧力を形式化し,協調的に対処する新しい知識編集フレームワークを提案する。
RippleEditsの実験では、JNOは、バックボーン間の編集安定性を維持しながら、伝播と保存のメトリクスを少なくとも7.0%改善している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:00:13 GMT)
ForestHG-Trace: Traceable Long-Horizon Ecological Reasoning over Large-Scale Forest Scenes [9.7] ForestHG-Traceは、森林環境に対する追跡可能な長期の生態学的推論のためのフレームワークである。
エージェントは、読み取り、フィルタリング、拡張、集約、比較、監査のための決定論的ツールを呼び出す。
ForestTraceQAは、様々なタスクタイプと推論深さにわたる生態的QAを評価するための実行可能なベンチマークである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:02:56 GMT)
EGOSTREAM: A Diagnostic Benchmark for Streaming Episodic Memory in Egocentric Vision [9.7] 連続エピソードメモリは自律エージェントのコア機能である。
Egostreamは、egocentric Visionにおけるエピソードメモリ評価の診断ベンチマークである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:50:06 GMT)
VET: A Framework for Analyzing AI Discourse [9.7] AIに関する大衆の言論は分極化され、伝統的なソーシャルメディアにおけるAIに対する誇張された立場は、AIリテラシーの発展を脅かしている。
VETフレームワーク(VET Framework)は、AIの会話を、妥当性、有効性、軌道の次元に沿って分類する手法である。
このフレームワークが、AI Hype、AI Doom、AI Denial、AI Normalcyといった一般的な物語を特定し、比較し、批判するのにどのように使えるかを示します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:59:03 GMT)
AlphaToken: Decoupling Adaptation and Stability for Path-Aware Response Token Valuation in LLM Post-Training [9.7] これは、評価を$textbfadaptation$と$textbfstability$に分離するレスポンストークン評価フレームワークです。
実験により、AlphaTokenはトレーニング後のパフォーマンスを改善し、破滅的な忘れを緩和することが示された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:40:35 GMT)
Local Preferential Bayesian Optimization [9.6] 我々は,鍵アイデアを高次元BOから優先的な設定に伝達する局所的なPBO手法のファミリーを開発する。
特に、信頼領域とデリバティブインフォームドローカル検索を相互に選好フィードバックに適応させるローカルPBO手法を提案する。
GPサンプルパス,標準最適化ベンチマーク関数,ポリシ検索タスクのベンチマークでは,局所的なPBO手法が特に高次元・複雑な景観に有効であることが示されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:00:27 GMT)
Agile Online Model Selection: Resolving Adaptation Lag via Safeguarded Large Learning Rates [9.5] 本稿では,保護された大規模学習率を最大$(T) まで活用する,新しい楽観的なオンラインミラー降下法を提案する。
私たちの重要な技術的貢献は、不安定な更新を動的に監視し、過度の後悔を招く学習率を排除する、ポストホックペナルティメカニズムです。
3つの合成および11の多様な実世界のデータセットに対する実証的な評価は、我々のアプローチが数百ラウンドから数ラウンドまでの適応ラグを減少させることを示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:05:51 GMT)
ForestMamba: Sparse Mamba with Geometry-guided Queries for 3D Forest Point Cloud Segmentation [9.4] ForestMambaは、フォレスト固有の事前情報を特徴符号化、クエリ生成、クエリ改善に組み込む構造認識手法である。
7つの森林地域での実験では、フォレストマンバは、両方のセグメンテーションタスクにおいて、既存のベースラインを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:49:09 GMT)
GRZO: Group-Relative Zeroth-Order Optimization for Large Language Model Fine-Tuning [9.4] GRZOは、微調整された大規模言語モデルのバックプロパゲーションに代わるメモリ効率のよい代替品である。
相対零次推論はミニバッチの例ごとに一独立な摂動を引き出す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:19:36 GMT)
CL-DMDF:Dynamic Multimodal Data Fusion Model Based on Contrastive Learning [9.1] コントラスト学習(CL-DMDF)に基づく動的マルチモーダルデータ融合モデルを提案する。
CL-DMDFは、信頼性の高い注意スコアを計算するために、特徴次元とモダリティ次元の両方で機能する新しい注意機構を導入している。
3つのデータセットで行った実験は、多様なマルチモーダル核融合タスクにおけるCL-DMDFの有効性を示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:12:17 GMT)
Direct Informed Sampling on Riemannian Manifolds via Loewner Order Lower Bounds [9.1] 動作計画の高速化を目的とした新しいタイプのインフォメーションサンプリング手法が提案されている。
我々は、対称正定値上のルーナー次数を利用して、計量テンソル上の最も厳密な定数下界を計算する。
本手法はユークリッドおよびスカラー固有値境界よりも一貫して情報集合を生成し,複数の最先端最適プランナー間の収束を加速することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:51:01 GMT)
FOAM: Frequency and Operator Error-Based Adaptive Damping Method for Reducing Staleness-Oriented Error for Shampoo [9.0] コンバージェンスと安定性の相補レンズによる安定度の理論的研究を行う。
本研究では,減衰係数と固有分解周波数の両方を動的に制御することにより,学習を安定させる適応アルゴリズムを提案する。
実験により, 安定収束を維持しながら, 標準的なシャンプーに比べて壁面時間短縮効果が認められた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:13:28 GMT)
GC-MoE: Genomics-Guided Cell-Type-Specific Mixture of Experts for Histology-Based Single-Cell Spatial Transcriptomics [9.0] 組織学に基づく単一細胞空間転写学(ST)推定は、個々の細胞に対する遺伝子発現を予測することを目的としている。
我々は,遺伝子型特異的な遺伝子発現予測の専門家をソフトに組み合わせ,ルーティングネットワークを用いて細胞型確率を推定するゲノミクス誘導細胞型特異的混合試験(GC-MoE)を提案する。
公開シングルセルSTデータセットの実験と改善は、既存のシングルセルと適応されたスポットレベルのベースラインに対して一貫した改善を示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:01:44 GMT)
Do VLMs See What Sensors Feel? A Scalable Expert-Guided Design for Wheelchair Accessibility Assessment from Street View [8.9] 本稿では,Googleストリートビューの画像から視覚言語モデル(VLM)がアクセシビリティ障壁を識別できるかどうかを検討する。
本稿では, アクセシビリティ次元を評価するために, GSV画像, ADAインフォームドガイダンス, およびエキスパート由来のルーリックを組み合わせた, エキスパート誘導型検索拡張フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:46:43 GMT)
Filter, Then Reweight: Rethinking Optimization Granularity in On-Policy Distillation [8.9] 大規模言語モデルにおけるオンライン蒸留(OPD)は、完全なKLの監督からより選択的な訓練パラダイムへと移行しつつある。
近年のOPD法では,どの軌跡から学ぶか,どのトークンが最も情報的か,どの信号が最も信頼できるかの選択に注目が集まっている。
本稿では,ファリコンFiRe-OPD(Filter, then Reweight)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:58:22 GMT)
Modeling Depth Ambiguity: A Mixture-Density Representation for Flying-Point-Free Depth Estimation [8.8] 物体の境界付近では、深度推定器は前景と背景の間の空き空間の3D点をしばしば予測する。
MDAは混合密度の表現で、モデルが各ピクセルに対して多重深度仮説とそれらの関連する確率を予測することができる。
異なるバックボーン全体にわたって、MDAは境界再構築を大幅に改善し、深刻な入力のぼかしの下でも飛行点のアーティファクトを大幅に除去する。
同じ混合密度のフレームワークは自然に透明な物体に拡張され、透明なピクセルで複数の深度層を予測する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:50:28 GMT)
Decentralized Instruction Tuning: Conflict-Aware Splitting and Weight Merging [8.7] 我々は多種多様なユーザ意図を持つ言語モデルを訓練し、不均一な混合へのスケーリングは、勾配干渉と帯域幅重大同期によって妨げられることを発見した。
重み付けは曲率重み付き分散還元を生じさせ,PCA対応のコンフリクト分割は高い曲率方向に沿ってこの利得を最大化する。
これらの結果は、分散化されたマージ対応の命令チューニングパイプラインであるMERITを直接動機付けている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:33:56 GMT)
Mitigating Spurious Correlations with Memorization-Guided Dataset De-Biasing [8.6] コアおよびスパイラル特徴の学習力学をアンハングリングする2段階のサンプルスコアリング関数を開発した。
提案手法は,提案手法を用いて,突発的相関を伴わずに,情報的サンプルの発見と優先順位付けを行うアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:48:20 GMT)
Cast a Wider Net: Coordinated Pass@K Policy Optimization for Code Reasoning [8.6] Coordinated Pass@$K$ Policyは、pass@$K$ジェネレーションを戦略に関する共同調査に変える。
APPS、CodeContests、LiveCodeBench-v6全体で、CPPOは、直接サンプリング、プランニングベースライン、プランナーのみのSFT、パス@$K$-orientedで、同じ$K=4$ソルバ回避予算で、pass@4$を改善している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:39:36 GMT)
Landseer: Exploring the Machine Learning Defense Landscape [8.6] 機械学習(ML)ディフェンスをMLライフサイクルに統合するためのフレームワークであるLandseerを紹介します。
予備研究では,35個の最先端の機械学習ディフェンスを同定した。
本研究は, 防衛家族間の複製能力のギャップを明らかにし, 複数防衛を統合する上での課題と機会について考察した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:00:09 GMT)
Fixing FOLIO and MALLS: Verified Annotations and an LLM-assisted Framework to Focus Human Relabeling [8.5] 本研究では,textsfFOLIO と textMALLS テストインスタンスのサブセットの検証分割を系統的に検証する。
第2のコントリビューションは、そのようなデータセットの修正された基底真理の開発とリリースです。
これらの結果から,NL-to-FOLデータセットを手作業でレビューする上で,人間を支援するLLMベースのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:00:35 GMT)
A Mid-Infrared Platform Based on Strontium Tweezer Arrays [8.5] サブ波長原子トウィーザーアレイは、集合放出現象を研究するための汎用的なプラットフォームとして提案されている。
ここでは、光ツイーザアレイに88ドルSr原子を使用し、2,923nmで中赤外遷移にアクセスする。
我々のプラットフォームは、双極子多体物理学の新しい機会を開き、ライドバーグ力学とストロンチウム微細構造量子ビットの制御を強化した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:53:03 GMT)
TrafficRAG: A Multimodal RAG Framework for Traffic Accident Liability Determination [8.4] 既存の手法は、しばしば低効率、主観的判断、一貫性のない分析結果に悩まされる。
本稿では,自動交通事故解析とレポート生成のためのマルチモーダル検索拡張フレームワークであるTrafficRAGを紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:01:04 GMT)
Eyettention II: A Dual-Sequence Architecture for Modeling Fixation Location, Within-Word Landing Position, and Fixation Duration in Reading [8.4] Eyettention IIは、現実的なスキャンパスを生成することができるエンドツーエンドのディープラーニングモデルである。
我々は、スキャンパス予測において、Eyettention IIが最先端モデルを上回ることを実証した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:28:25 GMT)
A Structured Benchmark for Text-Guided Anomaly Detection: When Language Stops Conditioning the Decision [8.3] テキストガイド型異常検出(TGAD)は,3つのシナリオにまたがる言語機能の役割を段階的に向上させる構造化ベンチマークである。
提案手法は, 大規模視覚言語, 学習自由識別, 組込み適応識別の1つの代表的なモデルである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:50:30 GMT)
Evaluating Real-World Generalizability of Algorithm Selection Models [8.0] アルゴリズム選択(AS)は、与えられた問題インスタンスに最も適したアルゴリズムを自動的に識別することを目的としている。
広く使われている2つの学術ベンチマークスイート(BBOBとCEC)と2つの実世界の問題セットについて考察する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:07:02 GMT)
Towards Drone-based Mapping of Volcanic Gases using Gas Tomography [8.0] 火山は大量の二酸化炭素を放出し、直接人命に影響を与える。火山ガスの放出をマッピングすることは、火山が気候や環境に与える影響を予測し理解するのに役立ちます。
ドローンによるガス検知は、火山モニタリングのリスクを著しく低減するが、ローターが検知する前にガス配管を分散させるため、ガス測定の技術的制限に直面している。
風による対流を補うためにラグランジアンモデルを組み込んだ新しいモデルベースガストモグラフィー再構成手法を提案する。その結果のガス分布図は,手動で収集したその場測定値と一致し,モデルベースガストモグラフィーが降水制限を効果的に克服し,正確なマッピングを可能にすることを確認する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:09:49 GMT)
Drifting Preference Optimization for One-Step Generative Models [8.0] ワンステップのテキスト・ツー・イメージジェネレータは、単一のフォワードパスを持つイメージを生成するため、デプロイには魅力的である。
決定論的ワンステップジェネレータのオンライン選好精選手法であるドリフト選好最適化(DrPO)を提案する。
DrPOは、現在のジェネレータから候補をランク付けし、ターゲットの報酬でランク付けし、高および低スコアのサンプルを使用して特徴空間更新方向を合成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:31:49 GMT)
Optical Stability and Photophysics of NV Centers in Diamond up to 120 GPa [8.0] 窒素空孔(NV)中心は高圧研究において強力な量子センサーとして登場した。
静水圧下でのNV中心の光学特性について実験的および理論的に検討した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:45:43 GMT)
Dynamic Trust-Aware Sparse Communication Topology for LLM-Based Multi-Agent Consensus [8.0] 本稿では,動的信頼を意識したスパースコンセンサス機構であるDySCoを提案する。
エージェントの信頼性、応答のばらつき、タスクの関連性に基づいて通信エッジの値を推定し、メッセージ交換のための少数の高値エッジを選択する。
その後、動的信頼度を通じて異なるエージェントの回答を集約し、合意が安定すれば早期に議論を終了する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:42:33 GMT)
Task-Induced Representational Invariances Depend on Learning Objective in Deep RL [8.0] 強化学習(Reinforcement Learning, RL)は、長年、神経科学における目標指向の動物行動のモデルとして機能してきた。
MDP還元理論のレンズによる深部RL表現の解析を行った。
我々の研究は、学習した表現をRLアルゴリズムで比較するための原則的なアプローチを提供し、実践的な意味と脳内のニューラルコーディングに関する洞察を実証した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:16:48 GMT)
An Explicit Scott-Type Bound for Absolutely Maximally Entangled States with Arbitrary Defect [8.0] 絶対的に極大に絡み合う(AME)状態であり、より一般的には、$(Cq)otimes n$の$k$-一様状態は多部交絡理論の中心的な対象である。
極端の場合 $k=lfloor n/2rfloor において、Scott (2004) は AME 状態が 2q2$ のしきい値を超えると存在できないことを示すシャープな非存在境界を証明した。
本稿では、任意の欠陥が$lge 0$であるAME状態に対して、完全に明示的なスコット型上限を確立する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:06:51 GMT)
EIVE: End-to-End Instance-Specific Visual Explanations for Detection Transformers [7.9] EIVE(End-to-end Instance-specific Visual Explanation framework)を提案する。
EIVEは、検出トランスフォーマー(DETR)のようなモデルの前方通過に従って、インスタンスレベルのサリエンシマップを直接生成する。
MS 2017の実験では、ExDarkとCityscapesは、EIVEが高品質のインスタンスレベルの唾液マップを生成することを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:56:31 GMT)
See Less, Specify More: Visual Evidence Budgets for Generalizable VLAs [7.9] 一般化は、ヴィジュアル-アクション(VLA)モデルにおける中心的なボトルネックである。
本稿では,よりクリーンなインタフェース下でエグゼキュータをトレーニングすることで,VLAの一般化を改善するためのフレームワークであるS2を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:02:07 GMT)
Why Not Hyperparameter-Friendly Optimisation? A Monotonic Adaptive Norm Rescaling Approach For Long-Tailed Recognition [7.9] 長い尾の認識はディープラーニングにとって重要な課題である。
本稿では,標準再スケーリング手法をサポートするクラス条件分布の視点を提供する。
自己適応単調正規化(SAMN)と呼ばれる単純だが効果的な手法を提案する。
SAMN は Pool Adjacent Violators Algorithm を用いてクラスごとのウェイトノルムに単調性を直接適用する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:34:38 GMT)
RadioMaster: Multi-Agent System for Autonomous Radio Signal Generation [7.8] ユーザ入力を現実のワイヤレスエミッションにシームレスに変換する,完全自律型マルチエージェントフレームワークであるRadioMasterを紹介する。
RadioMasterは、ドメイン固有の知識検索のためのRadioWiki、ハードウェア構成を伴う共同I/Qサンプル生成のためのRadioAgent、クローズドループ物理層検証のためのRadioEmulatorの3つの相乗的柱を運用している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:13:07 GMT)
Hierarchical Object Representation for Spatial Robot Perception: Points, Meshes, and Superquadrics [7.7] 階層型3Dシーングラフ(3DSG)は、長期的な自律性のためのアクション可能でスケーラブルな表現として登場した。
高忠実度オブジェクトレベルの再構成に利用できる階層的オブジェクト表現を導入する。
提案手法は,現在最先端のオブジェクトベースのマップアライメント手法 ROMAN よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:45:47 GMT)
A Theoretical Framework for Self-Play Theorem Proving Algorithms [7.7] 定理証明のための自己表現アルゴリズムの自己改善能力を理解するための理論的枠組みを提供する。
定理の基底グラフが十分に連結であれば、導出アルゴリズムが可逆ランダムウォークに基づいて証明された定理の集合を指数関数的に成長させるのに十分であることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:12:47 GMT)
MOC: Multi-Order Communication in LLM-based Multi-Agent Systems [7.5] 本稿では,マルチホップ依存を捕捉するためにエージェント間通信を再構築するマルチオーダ通信方式を提案する。
具体的には、構造化された多階エビデンスストリームを構築するための通信機構を形式化し、トークン制約のセマンティック・トポロジカルマージアルゴリズムを設計し、トークン制約内の意味的忠実度を最適化する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:06:38 GMT)
Personalized 3D Myocardial Infarct Geometry Reconstruction from Cine MRI for Cardiac Digital Twins [7.4] 本研究では,3次元MIをシネMRIから直接再構成する新しい形状運動組込みモデルを提案する。
225 cine MRI 実験の結果,提案した 3D MI 再構成はDice スコア0.678 $pm$ 0.011 で高い性能を示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:25:56 GMT)
RCEM: Embedder Equipped with Query Rewriting Skill for Robust Conversational Search in Distributional Shift [7.4] 本稿では,LLMの問合せ変換能力を埋込みモデルに蒸留する,対話型高密度検索モデルRCEMを提案する。
直接の会話と文書のマッチングを学習する従来の会話の密集した検索手法とは異なり、RCEMは会話クエリの埋め込みと書き直しクエリの埋め込みを整列する。
QReCC、TopiOCQA、TREC CAsTの実験は、RCEMが強い会話検索ベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:04:17 GMT)
Don't Let a Few Network Failures Slow the Entire AllReduce [7.4] 非対称ネットワーク帯域におけるAllReduce完了時間に対する情報理論の下限について述べる。
次に、この低いバウンダリにアプローチする4段パイプラインAllReduceアルゴリズムであるOpsCCを設計します。
SimAIの実験では、OptCCが既存のフォールトトレラント方式で残っているギャップを埋めていることが確認されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:40:41 GMT)
Agentic-J: An AI Agent for Biological Microscopy Image Analysis [7.4] Agentic-Jはコンテナ化されたマルチエージェントAIアシスタントである。
生物学者は自然言語で分析タスクを指定できる。
ドキュメント化されたプロジェクト構造に編成された実行可能なスクリプトを生成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:10:28 GMT)
LLM Anonymization Against Agentic Re-Identification [7.3] AURA (textbf Anonymization with textbfUtility-textbfRetention textbfAdaptation) は LLM ベースのtextitmask-reconstruct フレームワークである。
我々は,Web検索エージェントが行った再識別攻撃と,インタビュアーの注目する事実,コードブックの事実,および共同コンテキストのユーティリティグリッドに基づく実用性評価を用いて,実際のユーザインタビューテキスト上でのAURAを評価する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:13:40 GMT)
WAXAL-NET: Finetuned Edge ASR Across 19 African Languages [7.3] 細調整されたエッジモデルは、マクロ平均WERが38.0%$であるのに対し、最高のゼロショットベースラインは64.9%$である。
その結果, 自発性アフリカ発声における領域特化の尺度が支配的であることが確認された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:22:35 GMT)
Rethinking Evaluation Paradigms in IBP-based Certified Training [7.3] ディープニューラルネットワークは多くの教師付き学習タスクで高いパフォーマンスを達成するが、敵の摂動に弱いままである。
これを軽減するために、認定トレーニングテクニックは、トレーニング中に検証可能な堅牢性を最適化する。
先行進行は想定よりも顕著で,未報告のパフォーマンス相補性も明らかである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:00:15 GMT)
IMAC-AgriVLN: Can Agricultural Vision-and-Language Navigation Agents be Aware of Instruction Mistakes? [7.3] そこで本研究では,各命令に3つの誤り分類を挿入する半自動データアノテータを提案する。
いくつかの最先端の農業用VLN剤を試験し,SRでは57%,NEでは-9%の低下を示した。
本稿では,命令の誤りの有無を判定し,必要に応じて修正しようとするIMACモジュールを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:27:57 GMT)
Two-Fidelity Best-Action Identification for Stochastic Minimax Tree [7.2] ミニマックス樹における固定信頼ベストアクション識別(BAI)について検討した。
本研究では,複数要素の平坦なバンドイットのアイデアを木にもたらす2要素木探索アルゴリズムである2FFSを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:21:40 GMT)
"Înţelegi Româneşte?'' A Recipe for Romanian Vision-Language Models [7.1] ルーマニア語のための言語固有の視覚言語モデル(VLM)を構築するための体系的研究について述べる。
我々は、確立した英語VLMトレーニングと評価コーパスをルーマニア語に翻訳し、テキストアノテーションや画像内テキストに機械翻訳を適用した。
このデータを用いて、様々なスケールと事前学習の視覚バックボーンの寄与を分離するために、一連のVLMを訓練し、アブレーションする。
また、ルーマニアの日常シーンに根ざした文化的にネイティブな評価セットであるHolaVQAをキュレートする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:58:07 GMT)
Iteris: Agentic Research Loops for Computational Mathematics [7.1] 本稿では,計算数学におけるオープンな問題に対するエージェント研究システムであるイテリスを紹介する。
我々は最近のSimons Workshopコレクションからイテリスを2つのオープンな問題に適用した。
イテリスは数値的な証拠、建設、証明の草案を作成し、専門家のレビューと修正を経て、検証結果に繋がった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:54:31 GMT)
A Note on Stability for Orthogonalized Matrix Momentum with Client Sampling [7.0] 我々は, 隣接再帰安定性と重み付き濃度ステップから, 有限ラウンド上尾保証を導出した。
一次元の反例は、なぜギャップ、平滑化、あるいは正則性条件が必要なのかを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:36:26 GMT)
The Role of Ambiguity in Error Prediction via Uncertainty Quantification [7.0] 本稿では,UQ信号からの入力あいまいさを解消し,Large Language Models(LLMs)の誤り予測を改善する手法を提案する。
質問回答(QA)を6つのUQ指標を用いて実施し、UQ指標が複数の答えを持つ質問よりも曖昧なインスタンス上のエラーを予測可能であることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:20:57 GMT)
Provable Data Scaling Law for Meta Learning via Complexity Minimization [7.0] 本稿では,各領域に最も適したダウンストリームモデルの複雑性を評価することにより,表現を学習する複雑性最小化を提案する。
我々のエンドツーエンドの理論分析は、下流回帰による事前学習にまたがって、このフレームワークが、このスケーリングの振る舞いを確実に捉えていることを示している。
既存のメタ学習手法に複雑性正規化を組み込むことで、下流のサンプル効率が一貫して改善されることを実証する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:02:29 GMT)
Defenses & Enablers For Skill Injection Attacks on Terminal Based Agents [6.9] 大規模言語モデル(LLM)エージェントは、タスク固有の手順を記述する再利用可能なスキルに依存している。
これにより、エージェントを管理するための新たなアタックサーフェスが導入される。
我々は,これらのファイルのビルド時に,熟練ファイルアクセスや事前書き直しの仲介役として機能する仲介的LLMエージェントとして,保護者ベースの防御を評価した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:13:49 GMT)
Learning Implicit Bias in Generative Spaces for Accelerating Protein Dynamics Emulation [6.9] タンパク質動力学の生成エミュレータは、分子動力学のコストのごく一部で可塑性軌道を生成する。
古典的拡張サンプリングに着想を得て,前訓練エミュレータの生成空間に暗黙的,歴史に依存したバイアスを導入する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:46:28 GMT)
Data-Automated Policy Learning for Nonlinear Welfare [6.9] 本稿では,2次処理環境における非線形福祉基準に着目し,観測データからの政策学習について考察する。
我々はこの基準を,潜在的な結果と中間パラメータを含むユーティリティ関数を用いてモデル化し,後者は結果分布の高次モーメントをキャプチャする。
観測データの文脈で定式化する場合,中間パラメータと福祉基準の両方は,機械学習技術を用いて推定した正当性スコアに依存する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:13:49 GMT)
BEAST3D: Animal behavioral analysis and neural encoding from multi-view video via Gaussian splatting [6.9] BEAST3Dは、ラベルなし、校正されたマルチビュービデオから3D視覚表現を学ぶ、自己教師付き事前学習フレームワークである。
BEAST3Dは、既知のカメラパラメータを直接条件付けすることで、4つのビューで3D構造を再構築する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:34:14 GMT)
Decoupled Residual Quantization for Robust Semantic IDs in Recommendation [6.9] 低い品質のトークンライザは、コードブックの未使用、不安定な決定境界、または埋め込み空間の幾何学的歪みから得られる。
本稿では,期待されるコードワード重複と効果的なコードブック能力を通じて,これらの故障を定量的に診断する枠組みを開発する。
概念実証として,連続的幾何再構成と離散分布マッチングを分離する疎結合残留量子化(DRQ)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:55:21 GMT)
Intercepting the Future: Latent-Space Predictive World Model for Dynamic VLA Manipulation [6.8] AHEAD (Anticipatory Horizon Extrapolation with Adaptive Dynamics) は、動きを意識した潜在世界モデルで凍結したVLAを増強する予測効果のあるラッパーである。
AHEADは凍結した7B OpenVLAに4.9Mパラメータを追加し、20の動的シミュレーションシナリオで79から97%の成功を達成した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:55:38 GMT)
"I've Seen How This Goes": Characterizing Diversity via Progressive Conditional Surprise [6.7] そこで本研究では,文脈内学習を用いた多様性測定手法を提案する。
バイト単位のスコアは、ベースモデルのトークン単位のログ確率を読み取る。
OLMo-2-7Bのポストトレーニングパイプラインでは、$D_Ca_n$がベース$to$SFT $to$DPO $to$RLVRステージに散りばめられ、クリエイティブなアプリケーションにとって関心のある多様性損失の種類を検出する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:27:43 GMT)
From Layers to Submodules: Rethinking Granularity in Replacement-Based LLM Compression [6.7] LLM(Large Language Models)のトレーニング後の圧縮は、アーキテクチャコンポーネント全体を削除します。
サブモジュールレベルでLLMを圧縮するSubFitを導入する。
評価されたスパーシリティレベル全体で最高の集合パープレキシティ-精度トレードオフを達成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:52:53 GMT)
Neural Acquisition & Representation of Subsurface Scattering [6.6] 被写体表面の各点における画素フットプリント応答を学習することにより,光輸送の地下散乱特性を高精度に把握し,推定する手法を提案する。
位相シフトプロファイロメトリーパターンを用いたステレオプロジェクタ・カメラは、様々な散乱物体のデータを効率的にキャプチャする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:14:38 GMT)
RPCASSM: Robust PCA State Space Model For Infrared Small Target Detection [6.6] 本稿では、ロバストな主成分分析(RPCA)のモデルパラダイムに基づくRPCASSMネットワークを提案する。
BSSMは、背景情報をモデル化するための空間プローブ走査機構(SPCM)を設計するために、空間異質信号の正当性を利用することを目的としている。
TSSMは、状態空間モデリングのためのターゲットの変形可能な空間に焦点を合わせるために、ターゲットの空間と局所ハイライトを用いて、変形可能なプロンプトスキャン機構(DPCM)を設計する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:55:37 GMT)
Anchor-Conditioned Compositional Control for Landscape Image Generation [6.6] 本稿では,ランドスケープ画像生成のためのアンカー条件付ファインタニングフレームワークの初期結果について述べる。
構成的に均質なシーンサブセットのトレーニングは、混合トレーニングと比較して、水平偏差を最大40%減少させる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:30:48 GMT)
Query-Limited Community Recovery in Stochastic Block Models [6.5] 我々は,ネットワークデータへのアクセスが制限されうる条件下で,$n$の頂点上での2つのコミュニティブロックモデルにおけるコミュニティの正確な回復について検討した。
我々は、オラクルのみのアクセスと、学習者が基礎となるグラフの1つのサブサンプルコピーを観察する統合モデルを考える。
2段階の適応戦略が$n+o(n)$クエリで成功することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:44:00 GMT)
SAVMap: Structure-Aided Visual Mapping of Large-Scale 2.5D Manhattan Wireframes from Panoramic Video [6.5] SAVMapは,倉庫棚と光構造物のセマンティックワイヤフレームマップを生成する手法である。
倉庫の通路に沿って撮影したパノラマ映像から,棚と天井面の景色を写した整形画像のシーケンスを抽出した。
我々は,5000個以上のシェルフ要素のワイヤフレームマップを作成し,地上構造に対して平均絶対誤差4.8,cmを達成した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:04:29 GMT)
DisFlow: Scene Flow from Distance Field for Object Pose, Velocity Tracking, and Dynamic Object Reconstruction [6.5] DisFlowは遠隔地からのオンラインシーンフロー推定のための新しいフレームワークである。
これは、emph6DoF動的オブジェクトのポーズ推定、emphmotion Track、emphground再構成を可能にする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:41:40 GMT)
Private and Stable Test-Time Adaptation with Differential Privacy [6.5] テスト時間適応(TTA)は、推論中にこれらの入力のモデルを更新することで、新しいデータと異なるデータのエラーを減らすことができる。
これらの更新は、モデルパラメータが過去のすべての入力に依存しているため、テストデータに対するプライバシーの問題を引き起こす。
このプライバシーリスクを制御するために、複数の一般的なTTAメソッドを差分プライバシー形式に投入した。
ImageNet-Cでは,DP-TTA法は精度の低い適切なプライバシを提供し,低プライバシー体制ではDPのクリッピング機構が適応の精度と安定性を向上する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:45:59 GMT)
Construction of Historical Knowledge Graphs Based on BERT and Graph Neural Networks [6.5] 本稿では,変換器(BERT)とグラフニューラルネットワーク(GNN)のエンコーダ双方向表現を組み合わせた高レベルアーキテクチャを提案する。
伝統的な歴史のテキストは言語的曖昧さ、文脈によって制限された参照、体系的な方法で確立された文法規範の欠如を解決している。
この実験は、自治体の記録、議会文書、歴史文書の総合的な収集を全面的に活用している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:10:19 GMT)
ProbeScale: Probing Analysis to Optimize Neural Scaling Laws for Efficient Small Language Model Inference [6.5] 小型言語モデル(SLM)は、能力と計算能力のバランスを提供する。
本稿では,スケーリング法則から洞察を統一し,事前学習されたSLM内のパラメータ効率の高いエンコードワークを識別するフレームワークであるProbScaleを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:24:37 GMT)
Adversarial Attacks on Robot Localization Systems via Deep Feature Perturbation [6.4] 本稿では,ディープラーニングによる攻撃に対するローカライゼーションパイプラインの脆弱性について検討する。
本稿では,視覚的ローカライゼーションシステムにおいて,製品量子化(PQ)を特に対象とする逆クエリを生成するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:36:13 GMT)
Consistency Training while Mitigating Obfuscation via Rate Matching [6.4] 大規模な言語モデルはしばしば、ユーザの好みの回答を明らかにするなど、外部の入力機能の影響を受けます。
既存のメソッドは、応答全体や内部のアクティベーションに対する一貫性をトレーニングします。
このことが難読化につながることを示しているが、そこではモデルがキューに言及しないように学習し、その影響で監視性が損なわれる可能性がある。
本稿では,この動作の表現方法に制約を加えることなく,選択した動作特性に対する一貫性をトレーニングするRMCT(Rate Matching Consistency Training)を紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:10:49 GMT)
Hallucination-Aware Diffusion Sampling for Inverse Problems via Robust Prior Updates [6.3] 拡散に基づく逆問題解法は現実的な再構成を生成できるが、現実主義だけでは、得られた詳細が測定によって支持されることは保証されない。
本研究では,この障害を計測条件付幻覚として考察する。
本稿では,拡散前更新の局所的安定性を探索する解法レベルモジュールであるRobust Prior Update (RPU)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:41:46 GMT)
Semi-Supervised Hyperbolic Hierarchical Clustering with Set-Level Structural Priors [6.3] 半教師付き階層クラスタリングは、データパターンとユーザが提供する監視と整合したツリー構造を学ぶことを目的としている。
本稿では, 半教師付きハイパーボリック階層クラスタリング手法を提案する。
実験により,提案手法は階層的クラスタリングベースラインよりも連続的にラベルの整合性を向上させることが示された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:14:00 GMT)
BenGER: Benchmarking LLM Systems on Subsumption-Based Legal Reasoning in German Law [6.2] BenGERデータセットは、複数のレベルの法学教育にまたがる596の試験スタイルのフリーテキストの訴訟タスクと、531の短い教義的推論タスクの3つのコンポーネントで構成されている。
12の現代LLMシステム – クローズドフラッグシップ,効率指向,オープンウェイト – を,自動および判断に基づくメトリクスで評価する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:01:48 GMT)
TN-SHAP-G: Graph-Structured Tensor Network Surrogates for Shapley Values and Interactions [6.1] グラフ構造入力の構造を利用してShapley値と高次相互作用指標を効率的に計算するフレームワークを提案する。
学習された因子分解は、小さなグラフ上の正確なShapley値と密に一致し、サンプリングベースの手法が実現不可能な大きなグラフに効率よくスケールすることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:41:29 GMT)
The Fair Lending Model: How the Longest-Running Algorithmic Fairness Programs Work in Practice [6.1] 米国の金融機関は何十年にもわたって、公正貸付法に基づくアルゴリズムフェアネスプログラムを実行してきた。
我々は、金融機関がアルゴリズムによる差別を地上でどのようにテストし緩和するかについて、最初の実証的な説明を提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:24:08 GMT)
Alignment Collapse Under KV Cache Quantization: Diagnosis and Mitigation [6.1] キー値(KV)キャッシュの量子化は、Large Language Model(LLM)推論メモリの削減に広く利用されている。
本研究では,KVキャッシュ量子化下でのアライメント保存について検討する。
低ビット量子化は安全アライメントを静かに破壊することができる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:02:20 GMT)
A Closer Look at In-Distribution vs. Out-of-Distribution Accuracy for Open-Set Test-time Adaptation [6.1] 我々は,CIFAR-10-C と ImageNet-C の破損評価ベンチマークにおいて,オープンセットテスト時間適応法をベンチマークした。
CIFAR-10-C と ImageNet-C を用いた InD と OOD の認識における TTA 手法の精度と信頼性の評価を行った。
ソフトマックス/マルチクラス出力をシグモイド/マルチラベル出力に置き換える新しいベースラインを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:35:29 GMT)
Structure-Guided Adaptive Propagation for Protein-Protein Interaction Site Prediction [6.1] PPIS予測のための構造誘導適応伝搬モデルであるSGAP-PPISを提案する。
その結果,SGAP-PPIS は Test_60 上での最先端手法と競合する性能を示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:03:00 GMT)
Hierarchically Decoupled Mixture-of-Experts for Robust Traffic Sign Recognition in Complex Driving Scenarios [6.1] CBDES MoE TSRは、交通信号認識のための階層的に分離されたヘテロジニアス混合物(MoE)フレームワークである。
ゲーティングモジュールは、入力画像の意味特性に基づいて、エキスパートプールから最も適したエキスパートモデルを選択的に活性化する。
実験結果から,本手法は検出精度と効率の相違が顕著であることがわかった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:39:44 GMT)
Repair Before Veto: Repair-Augmented Constraint Learning for Contextual Decisions [6.0] 我々は、既知の修理作業者をセマンティクスに引き上げる文脈決定フレームワークである修復制約学習(RACL)を導入する。
候補者は、手頃な修理が十分に実現可能で好まれる場合に受け入れられる。そうでなければ、システムは構造化された拒絶債権を返却し、適用すれば、修理計画を立てる。
制御されたDB1B由来のベンチマークで、RACLは意図した信用と修復構造を回復する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:38:04 GMT)
Observation, Not Prediction: Conversation-Level Disaggregated Scheduling for Agentic Serving [5.9] LLMベースのエージェントは、多くの依存的推論とツールコールを通じてユーザータスクを解決します。
既存のマルチターンシステムはスケジューリングユニットとしてターンを保持し、プリフィルをデコードから切り離すかどうかをターンごとに決定する。
我々は、この予測への依存が、作業負荷ではなくスケジューリングユニットによって課されることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:51:09 GMT)
VEDAL: Variational Error-Driven Asynchronous Learning for 3D Gaussian Splatting Pruning [5.9] 3D Splatting (3DGS) は, リアルタイム合成による目覚ましいビューレンダリング品質を実現しているが, 過剰なメモリ消費に悩まされている。
変分自由エネルギー最小化としてガウシアンプルーニングを定式化する原理的枠組みであるVEDALを提案する。
Mip-NeRF 360、Tants&Temples、Deep Blendingの実験では、VEDAL 5.2x圧縮はわずか0.31dBのPSNRで、PUP 3D-GSを0.05dB、LightGaussianを0.35dBで上回った。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:56:50 GMT)
GJDNet: Robust Graph Neural Networks via Joint Disentangled Learning Against Adversarial Attacks [5.9] グラフニューラルネットワーク(GNN)は、非競合エッジを導入することで本質的に接続パターンを反転させる敵攻撃に対して脆弱である。
本稿では,グラフ・コンジョイント・ディスタングルメント・ネットワーク(GJDNet)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:05:40 GMT)
Linguistic Productivity in Large Language Models: Models Coerce, but do not Preempt [5.9] 大規模言語モデルでは, コーカシオンの場合, 建設的生産性(エンクエンチメント)を保ちながら再現可能であることを示す。
また、最も大きなモデルでさえ、新規言語に対する否定的な証拠を拡張できないことも示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:11:39 GMT)
CRAM-ER: Error-Resilient Spintronic Computational Random Access Memory for Scalable In-Memory Computation [5.9] スケーラブルなインメモリ行列ベクトル乗算(MVM)のためのエラー耐性CRAM(CRAM-ER)アーキテクチャを提案する。
DNNベンチマークにおけるCMOS+スピントロニックハイブリッドアーキテクチャの評価は、CRAMレイテンシを最大2桁まで低減し、ほぼロスレスな精度を示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:45:05 GMT)
Higher-order exceptional points and enhanced quantum squeezing in a pseudo-Hermitian semiconductor optomechanical system [5.8] 擬エルミート条件下では,光子,励起子,フォノンの三部結合から三階例外点(EP3)が出現することを示す。
励起子ポラリトンによる2モードの量子スクイーズが明らかにされ、EP3近傍でこのスクイーズが著しく強化されていることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:32:34 GMT)
RT-Lynx: Putting the GEMM Sparsity In a Right Way for Diffusion Models [5.8] 重みよりもN:M半構造スペーサー化に対して,DiTの活性化は本質的に疎く,より頑健であることを示す。
アクティベーションにN:Mスペーシフィケーションを適用したRT-Lynxを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:03:29 GMT)
NanoSpec: Accelerating Speculative Decoding using Minimalist In-Context Vocabularies [5.7] NanoSpecは、ドラフトタイムを平均51.6%削減し、1.17$-1.29times$エンドツーエンドのスピードアップを提供する。
本稿では,スパースメモリアクセスの非効率性を克服するシステム設計について紹介する。
補完的なプラグアンドプレイモジュールとして、NanoSpecはドラフト時間を平均51.6%削減し、1.17$-1.29times$エンドツーエンドのスピードアップを提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:39:40 GMT)
On Improving Robustness of Deepfake Image Detectors [5.7] 3つの相補的な設計原則を統合する統一的なフレームワークを提案する。
敵攻撃は主に低次統計と視覚的意味論に基づいて行われる。
提案手法は, アーキテクチャ的に多様である6つの検出器間のロバスト性を一貫して改善する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:03:32 GMT)
KForge: LLM-Driven Cross-Platform Kernel Generation for AI Accelerators [5.7] 生産推定は、不均一な加速器の混合をますます狙う。
それぞれのパイプラインは、増大するハードウェアバックエンドとプログラミングモデルにまたがって、ハイパフォーマンスカーネルを必要としている。
我々は、2つのLLMベースのエージェントによって駆動される反復リファインメントループを中心に構築されたクロスプラットフォームフレームワークであるKForgeを紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:48:55 GMT)
Thouless Pumping of Large Chern Numbers in Optical Floquet Quasicrystals [5.5] 低温原子を持つ光フロッケ準結晶において,大きなチャーン数を実現する手法を提案する。
フロケ準結晶の準エネルギースペクトルを研究し、ギャップラベル定理を用いて創発チャーン数を特徴づける。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:00:20 GMT)
Runtime Analysis of a Compact Genetic Algorithm on a Truly Multi-valued OneMax Function [5.5] Adak and Witt (GECCO 2025) は、多値のOneMax関数上でのcGA (multi-valued compact genetic algorithm) の最初のランタイム解析を発表した。
アップデートの強度の最適な選択は、$textrmObigl(n r3 log2, n)log (r)bigr)$から$textrmObigl(n rlog3(n)log3(r)bigr)$に改善します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:55:11 GMT)
Gravity-Aware Hierarchical Routing for Lightweight SensorLLM on Human Activity Recognition [5.4] 本報告では,コア手法を強調表示し,より広範な評価を行うための基盤となることを目的として,単一のデータセットにのみ結果を報告する。
センサ言語アライメントに関する最近の研究は、2段階のフレームワークがウェアラブル・センサ・ヒューマン・アクティビティ認識(HAR)のセマンティック・モデリング能力を向上させることを示している。
すでに整列したモデル上に構築された軽量なポストアライメント適応として,重力を考慮した階層型ルーティングヘッドを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:43:50 GMT)
Neutrino Fingerprints: Image-Based Encodings of IceCube Events for CNN Direction Reconstruction [5.4] IceCube--NeutrinosはDeep Ice Kaggleのコンペティションで、再現技術をベンチマークするために1億4000万のシミュレーションイベントを提供した。
ニュートリノの指紋は72倍の72倍の画像を圧縮し、それぞれのピクセルは1つの検出器を表す。
この表現は、スパースで不規則なパルスデータを畳み込み処理に適した濃密な画像に変換する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:54:43 GMT)
A Measurement-Driven Digital Twin Architecture for Plant-Level Biomass Estimation and Growth Forecasting in Hydroponic Systems [5.2] 水耕環境下での個々のレタスの生育を追跡する新しいシステムを開発した。
デジタルツイン成長予測は、将来1日から4日間の将来の収量に近似することができる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:00:24 GMT)
An Exploration of Collision-based Enemy Morphology Generation [5.0] 本稿では,プレイヤーの衝突情報に基づいて敵形態を生成する3つの異なるアプローチについて検討する。
それぞれのアプローチは異なる長所と短所を提供するが、いずれも以前のロボット形態学の作業から適応した進化的ベースラインと同等あるいは優れた性能を持っていた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:52:33 GMT)
Cross-Lingual Steering for Figurative Language Generation [5.0] 1つの言語における文のアクティベーションの違いから、図形カテゴリーの方向性を推定する。
5つの図式カテゴリ、6つの言語、4つの多言語 LLM で、これらの方向はそれぞれの言語内で確実に制御される。
学習した方向は、他者に適用する際の目標行動を増加させ、ドイツが最も受容的な標的となる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:15:01 GMT)
Traj-Evolve: A Self-Evolving Multi-Agent System for Patient Trajectory Modeling in Lung Cancer Early Detection [4.9] 既存のマルチエージェントシステムは、患者を隔離して処理することができない。
本稿では2つの相補的な進化機構を持つ自己進化型マルチエージェントシステムであるTraj-Evolveについて述べる。
最大5年間のマルチモーダル EHR を用いた肺がん予測タスクでは、Traj-Evolve は9つの強いベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:30:07 GMT)
Overcoming Challenges in Agile and DevOps Integration: A Qualitative Study [4.9] この研究は、文化的・組織的障壁、構造的制約、プロセス・アンド・メソッドの複雑さ、技術的制限の4つの中核的なカテゴリを識別する。
チーム構造と自律性、文化とコラボレーション、プロセスと変化の管理、自動化とインフラの4つの主要なソリューションドメインを提供する。
この結果は、アジャイルとDevOpsのインターフェースをより深く理解し、この複雑な移行を効果的にナビゲートしようとするソフトウェア組織に実践的な洞察を与えてくれます。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:34:26 GMT)
PINNOCHIO: Physics-Informed Neural Network for Coupled Hyperelastic Interface-Volume Simulation in Orthognathic Surgery [4.6] PINNOCHIO(ピノチオ)は、顔認識シミュレーションのための物理インフォームドフレームワークである。
表面精度と物理的妥当性の両方において、既存のベースラインを上回っている。
FEMの大幅な高速化を実現し、インタラクティブな手術計画のための信頼性が高く実用的なツールを提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:20:54 GMT)
LALE: Lightweight-Transformer Architecture for Land-Cover Estimation [4.6] 本稿では,エンド・ツー・エンドのリモートセンシング画像セグメンテーションアーキテクチャであるLALEについて述べる。
大規模なARAS400kリモートセンシングセグメンテーションベンチマークでは、LALEはCNN、トランスフォーマー、ハイブリッドベースラインに対して強力な効率とパフォーマンスのトレードオフを確立する。
我々の最小の変種(たった1.6Mパラメータ)は、最高のベースライン(UPerNet)の2.6F1ポイント以内まで到達し、4.5倍のパラメータ、7倍のストレージ、17倍のGMAC、1.8倍のスループットを提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:18:49 GMT)
Probing Minimalist Phase Structure in LLMs: What Universal Dependencies Cannot Represent [4.5] 構造プローブはUD(Universal Dependencies)を訓練するが、これは位相境界や位相内部結合のような形式-対称性の抽象化を符号化しない。
本研究では, 分布事前学習により, UD 以外の形式的シンタクティック抽象化と整合した表現を導出できることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:53:13 GMT)
CORE-MTL: Rethinking Gradient Balancing via Causal Orthogonal Representations [4.4] マルチタスク学習(MTL)は、ドメイン間で共通の表現を共有することで、複数のタスクのジョイントモデルを構築することを目的としている。
本稿では,タスク関連構造を素早い文脈から切り離すために,マルチタスク学習のための因果直交表現(CORE-MTL)を提案する。
CORE-MTLは、ディストリビューションおよびアウト・オブ・ディストリビューション設定の両方において、ビジュアルマルチタスクベンチマークの既存の手法よりも一貫して優れている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:20:58 GMT)
Translating Classical Poetry into Modern Prose [4.3] パディアム2ガダイアム(Padyam2Gadyam)は、13世紀から17世紀のテルグ語古典詩から現代のテルグ語と英語の散文への詩と詩の翻訳作業のためのデータセットである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:24:50 GMT)
Shortcut to Nowhere: Demystifying Deep Spurious Regression [4.3] 我々はDSR(Deep Spurious Regression)を属性ラベルの共起による回帰データからの学習として定義する。
分類と回帰ショートカットの本質的な違いを動機として,ラベル空間と特徴空間の両方における突発的属性の類似性を活用することを提案する。
我々の研究は、連続予測における突発的相関を研究するためのベンチマークとテクニックのギャップを埋める。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:40:11 GMT)
Coordination Graphs for Constrained Multi-Agent Reinforcement Learning [4.3] 制約付きマルチエージェント強化学習(CG-CMARL)のためのコーディネーショングラフ
システムは、共同問題をペアワイズ領域に分解し、それぞれに共有Q-関数の集合を提供する。
実行時には、Max-Sumメッセージパッシングがファクタグラフ全体のアクションをコーディネートし、ラグランジアン乗算器が客観的-制約トレードオフを制御する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:46:16 GMT)
Bridging the Sim-to-Real Gap in Semiconductor Visual Program Synthesis via Input Binarization [4.3] 本稿では,視覚言語モデル(VLM)を用いて,検査画像を編集可能なドメイン特化言語(Domain-Specific Language)コードに変換するビジュアルプログラム合成フレームワークを提案する。
VLMは、合成DSLレンダリングデータのみに基づいて訓練されるため、実際の走査型電子顕微鏡(SEM)画像を処理する際にドメインギャップが発生する。
このギャップをSEM特有のテクスチャとノイズを排除し、モデルが幾何学的構造にフォーカスする入力バイナライズ戦略で橋渡しする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:06:20 GMT)
Improved Postural Stability Using a Lightweight Semi-Active Soft Back Support Device Under Standing Perturbations [4.2] 高齢者は、特に起立中の摂動によって転倒するおそれがある。
トランク伸展支援装置は、過剰なトランク屈曲を防止して転倒リスクを軽減することができる。
本研究は立位摂動後の姿勢安定性に及ぼす軽量半能動型ソフトバック支持装置の影響について検討した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:09:38 GMT)
S3TS: Stochastic Scenario-Structured Tree Search for Advanced Planning Under Uncertainty [4.2] 効果的な計画戦略は、高度で潜在的に非線形なシステムモデルに対応する必要がある。
既存のアプローチは非線形性(モンテカルロ木探索など)や不確実性に対処することができる。
本研究ではシナリオツリーによる不確実性を明確に表現するS3TSアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:17:41 GMT)
Sensitivity as a Double-Edged Sword: A Trade-off Between Discriminability and Adversarial Robustness [4.2] 現代のニューラルネットワークは、敵の摂動に非常に敏感である。
本研究では、この脆弱性の一部は、広く使われている完全連結型(FC)分類器の摂動に対する感度に起因すると同定する。
我々は,複数のサロゲートと強力なAutoAttackを併用して,公正かつ堅牢な評価を実現する,厳密な評価プロトコルであるMixed Surrogate Attack (MSA)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:09:19 GMT)
Faster than the Team, Faster than the Customer: Tool Integration, Collaboration, and Organisational Lag in AI-assisted RE [4.2] 要求工学(RE)に生成AIツールを適用することの影響は、まだよく理解されていない。
本稿では,AI支援型REツールが,ハイテクソフトウェア工学の中規模企業であるXITASOの産業実践にどのように利用されているかを検討する。
プロダクトバックログ管理,テンダ管理,要件とドメイン理解,ドキュメントとアーティファクトの生成という,4つのカテゴリにまたがる15のユースケースを特定します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:53:56 GMT)
Optimized Point Addition Circuits for Elliptic Curve Discrete Logarithms [4.2] 量子論理回路アーキテクチャについて詳述し、Babushなどと同様の結果を与える。
また、任意の素体に対して有効な回路の一般変種に対してゲート数を与える。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:29:30 GMT)
Evaluating Transformer and LSTM Frameworks for Prediction in Ungauged Basins [4.1] 未掘削の盆地では、直接観測の欠如は不確実性を高め、極端な事象を予想する能力を制限する。
本研究は, エンコーダのみのトランスフォーマーが, 水文情報に制限された上流ストリームフロー推論において, LSTMよりも有利であるか否かを評価する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:57:20 GMT)
Algorithmic Fragility and Persona Bias in LLM-Generated Autistic Communication [4.0] 安全アライメントは明らかに有害な出力を減少させるが、衛生的で神経ノルミティブなコミュニケーションの表現を不注意に符号化する。
本研究では、この符号化を二重対人書き直しパラダイムを用いて検討し、10大言語モデルに対して、自閉症または神経型ペルソナから自然に発生する自閉症の言説を書き換えるよう促す。
以上より,現在のアライメントトレーニングは,定性的分析によってのみ,ペルソナ特異的な生成的分解を引き起こすことが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:07:11 GMT)
Are Algorithm Registers Transparent? Perspectives from Germany [4.0] アルゴリズムレジスタ(英: Algorithm register)は、公共行政で使用されるアルゴリズムの基本情報を表示する公開データベースである。
連邦レベルの登録は存在しないが、少なくとも5つの州や連邦レベルのイニシアチブがAIシステムに関する情報を公表している。
Alina Lorenz氏(2025年)による概念的提案は、ドイツにおける国家的AI透明性レジスタの技術的およびガバナンス要件を概説している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:57:27 GMT)
Resonant Context Anchoring: Decoupling Attention Routing and Signal Gain at Inference Time [4.0] 大規模言語モデル(LLM)は、内部パラメトリックメモリと矛盾する入力証拠に直面したとき、しばしば「文脈的無視」を示す。
本稿では,残差ストリーム信号のダイナミクスを考慮した軽量な推論時間干渉法であるResonant Context Anchoring (RCA)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:57:51 GMT)
Physics-Aware Linearized ADMM and Its Unrolling [4.0] PDEに基づく測定プロセスの逆問題に対する物理認識線形化ADMM (PA-LADMM) と呼ばれる新しい乗算器の交互方向法を提案する。
鍵となる考え方は、サブプロブレムをPDEで線形化することである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:01:02 GMT)
Mos-Gen: A Generative Molecular Framework for Mosquito Insecticide Design [4.0] 蚊が媒介する感染症は、毎年70万人以上の死者を出している。
従来の化学殺虫剤の長期使用は、深刻な耐性問題を引き起こしている。
分子表現モデルUni-Molと変分オートエンコーダを結合したモチーフ認識型生成協調フレームワークであるMos-Genを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:58:15 GMT)
Sequential quantum nonlocality sharing under local noisy quantum channels [3.9] 量子非局所性(SSQN)の逐次共有は、量子情報処理におけるデバイスに依存しないタスクに不可欠である。
本稿では,二分詞ベルと三分詞メルミン非局所性における逐次共有の雑音頑健性に関する理論的解析を行った。
我々の研究は、雑音の多い量子チャネル下でSSQNを実現するための実践的な枠組みを確立し、ノイズのロバスト性と測定戦略の関連を明らかにする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:30:20 GMT)
Physics-Informed Modeling and Control of Emergent Behaviors in Robot Swarms [3.6] PhySは物理インフォームされたマイクロマクロウォームフレームワークで、マルチステージスワムの出現を表す。
いくつかの概念実証Swarmミッションにおいて、PhySは異なる多段階の創発的な振る舞いを生成できることを実証した。
これらの結果は、ロボット群における創発的行動の学習、解釈、制御のための物理インフォームド・ルートを確立する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:50:45 GMT)
Impact of a Soft Wearable Back-Support Device on Postural Stability during Trip-Like Perturbations [3.6] 姿勢安定度を高めるための柔らかいウェアラブル支援装置の有効性を,旅行型摂動下で検討した。
最大不安定点における最小安定度 (MOS) を用いて全体安定性を定量化した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:02:54 GMT)
PRIMA: Boosting Animal Mesh Recovery with Biological Priors and Test-Time Adaptation [3.6] PRIMAは、厳しい種の下で頑丈な3次元四重項メッシュ回復のためのフレームワークであり、不均衡を引き起こす。
本研究は,BioCLIP埋め込みを生物前駆体として組み込んで,再建プロセスに意味的および形態学的知識を注入する。
多様な種をカバーし,バリエーションを呈する大規模擬似3DデータセットであるQuadruped3Dを構築した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:13:47 GMT)
Locality Does Not Imply Reachability: Boundary Repair in Block-Sparse Causal Attention [3.6] 本稿では,シーケンスローカリティとアテンショングラフ到達率のミスマッチについて検討する。
この境界アーティファクトを構造的依存集合で定式化する。
位相条件付きカバレッジ関数を導出し、到達性はそのブロック内のソースターゲット距離とターゲットオフセットの両方に依存することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:56:31 GMT)
Pauli-structured preconditioning for quantum linear system solvers [3.5] パウリ積の再集合は、プレコンディショニングされた作用素のパウリ係数の重みを減少させることができることを示す。
結果は、パウリ構造プレコンディショニングがQLSアルゴリズムの効率的な複雑性パラメータを減少させるかどうかを識別する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:53:30 GMT)
Closed-Form Pose Estimation of Endoluminal Medical Devices via Gradiometer-Based Electromagnetic Localization System [3.5] 本文では, 局所磁場と勾配テンソルを推定するために, 小型磁力計アレイを埋込み型準勾配計として用いる閉形状追跡フレームワークを提案する。
このアルゴリズムは、既知のソース位置と配列幾何学を必要とするが、事前校正されたワークスペースフィールドマップ、初期ポーズ推定、励起ソースモーメントは不要である。
センサーアレイ構成と励起モードによるベンチトップ実験では、SI14.49hertzの更新速度であるSI10.80mm--SI15.57mmのシーケンス平均位置誤差が示されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:09:04 GMT)
Explainable Data-driven Deep Reinforcement Learning Methods for Optimal Energy Management in Buildings [3.5] 本稿では,住宅のエネルギー管理に応用した説明可能な深層強化学習(XRL)の枠組みを提案する。
我々は、リアルタイム測定を組み込んだ拡張状態空間において、オンラインとオフポリティクスのDRLエージェントをトレーニングし、比較する。
以上の結果から,特にA2C(Advantage Actor Critic)とPPO(Proximal Policy Optimization)は,累積報酬や政策安定性の観点からも,非政治手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:39:34 GMT)
A combination of noise and bilateral filters achieve supralinear and scalable adversarial robustness in CNNs [3.5] ガウス雑音と二元フィルタリングを組み合わせた単純なプリプロセッサは、最小計算コストで対向ロバスト性を改善することを実験的に示す。
提案手法は, 計算オーバーヘッドの無視と, 理論上は基礎的な設計により, 対向的ロバスト性を高めるための, 原理的かつ容易に統合可能なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:53:39 GMT)
Asking Is Not Enough: Protocol Sensitivity in LLM Confidence Calibration [3.5] LLMの信頼性校正は、トークン確率スコアと言語的信頼の2つの信号を比較することで評価されることが多い。
我々は、動詞化-vs-token比較を定義する測度軸を変化させる。
両信頼性信号はプロトコルに依存した行動測定として扱うべきである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:50:34 GMT)
Ghost Tool Calls: Issue-Time Privacy for Speculative Agent Tools [3.4] ツール拡張された言語エージェントは、おそらく将来のツールコールを遅延を隠すために投機的に発行する。
これらの呼び出しは、エージェントがブランチにコミットする前に、外部サービスにユーザー意図を推論する。
我々は、コミット前の観察を第一級効果として扱うランタイム抽象化である、投機的ツールプライバシ契約を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:53:19 GMT)
Distortion-Aware Fusion of Statistical and Vision-Language Features for Blind Image Quality Assessment [3.4] 138次元のNASディスクリプタと2つの相補的なVLM埋め込みを統合した歪み認識型融合フレームワークを提案する。
KADID-10kの歪み毎の解析により、SNSの特徴がノイズや色シフトの歪みに最も寄与していることが明らかになった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:57:52 GMT)
FLAME: Physics-Guided Neural Operators for Onboard Satellite Methane Detection in Hyperspectral Imagery [3.4] メタンは短期的な気候変動の主要な要因であり、その排出源を迅速に特定することは重要な気候介入である。
本稿では,メタン吸収の物理をアーキテクチャに直接組み込む物理誘導型ニューラル演算子FLAMEを提案する。
メタン検出ベンチマークにおいて、FLAMEは評価されたすべての方法の中で最も高い検出精度を達成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:24:35 GMT)
SaluNet: Enabling Total Plasticity in Normalization-Free Deep Networks [3.3] 本稿では,バッチ統計や外部アフィンパラメータに依存することなく,本質的な信号安定化を実現する,有界で学習可能なアクティベーションであるSALUを紹介する。
ResNet-18で、SaluNet-C-18はCIFAR-10で97.35%、CIFAR-100で83.25%を達成し、正規化アーキテクチャが失敗するバッチサイズ1で93.44%、76.23%を維持した。
トランスでは、SaluNet-TはLayerNorm-GELUを90.92%から91.01%に改善し、CIFAR-10では66.54%から68に改善した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:09:06 GMT)
Practical Limits on Integrated Squeezers [3.3] 我々は、これらのノイズ源がスクイーズ計測に課す基本的な限界を定量化する。
我々は,これらの制約を,次世代統合圧縮光システムの設計とベンチマークのための実用的なガイダンスを提供する,シンプルなモデルに組み合わせる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:33:18 GMT)
Graph Instance Landscapes: When Structural Similarity Does (Not) Reflect Shortest-Path Performance [3.2] ショートパスアルゴリズムのベンチマークは、一般に異種グラフ集合上の集約性能に基づいている。
グラフを低コストな構造的特徴空間に埋め込み、類似した構造の領域にクラスタリングすることで、グラフベンチマークのインスタンスランドスケープビューを採用する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:21:40 GMT)
Safety-Critical Adaptive Impedance Control via Nonsmooth Control Barrier Functions under State and Input Constraints [3.2] 本研究では,不確実な動的条件下での適合的な相互作用を達成しつつ,連立状態の安全性を強制するオンライン適応インピーダンス制御フレームワークを提案する。
この手法は、二次プログラムに基づく安全フィルタと、新しい構成された位置速度非滑らかな制御バリア関数を組み合わせたものである。
外乱オブザーバの強化された安全メカニズムは、モデリングエラーや外部の相互作用力に対する堅牢性を改善する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:11:24 GMT)
Not All Errors Are Equal: A Systematic Study of Error Propagation in Large Language Model Inference [3.2] 本稿では,大規模な言語モデル (LLM) 推論における誤りの伝播に関する包括的研究を行い,本提案の故障注入フレームワークで実現した。
3つのオープンウェイトなLLMと13の代表的なタスクに障害を注入し、推論、多言語、数学的、コーディングドメインをカバーします。
本研究は,LLM推論における誤り伝播の理解を深める17のテイクアウトを得た。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:04:51 GMT)
Parallelizing Large-Scale Tensor Network Contraction on Multiple GPUs [3.1] 本稿では,中間テンソルを明示的な通信でデバイスに分散するマルチGPUフレームワークを提案する。
1つのDGX H100ノード内において、ディストリビューションは、恥ずかしく並列スライシングを超えた追加のスピードアップを7ドルから173タイムで提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:02:29 GMT)
KDH-CAD: Knowledge-data hybrid CAD learning under data scarcity [3.1] KDH-CADは、基礎モデル、構造化ドメイン知識、ラベル付きCADデータに事前訓練された知識を統合する知識データハイブリッドフレームワークである。
実験の結果、KDH-CADは低データのレシエーションにおいて高い性能を示し、250のトレーニングサンプルで92.6%の精度、1000のサンプルで95.8%、追加のデータで改善を続けていることがわかった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:11:54 GMT)
Cross-Domain Dead Tree Detection via Knowledge Distillation in Aerial Imagery [3.0] 本研究は、フィンランドの航空画像(ソースドメイン)に基づいて訓練されたTreeMort-1T-UNetモデルを、知識蒸留(KD)を適用して、様々な対象領域に適応させることにより前進させる。
Mean Tree IoU, Instance F1-score, Instance Precision, Mean Centroid Errorの4つのKD変種を評価する。
特徴レベルKDは他より優れており、平均木IoUは0.106、インスタンスF1スコアは0.63、平均セントロイド誤差は3.039である。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:24:20 GMT)
Beyond the Simplex: Balanced Prototype Geometry for Scorer-Agnostic Open-Set Recognition [3.0] 我々は、d C-1を含むすべての埋め込み次元で成り立つ単純度OSRの理論的な説明を与える。
プロトタイプは、d >= C-1 であれば、正則単純体のように振る舞う一距離対称性を持つことを示す。
さらに、自然等方性仮定の下で、d において指数関数的に偽比速度が崩壊することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:28:24 GMT)
Auditing Asset-Specific Preferences in Financial Large Language Models: Evidence from Bitcoin Representations and Portfolio Allocation [2.9] ビットコインの通貨的指標のランキングはフレーム依存であることが示されています。
Gemma 3の何千ものスパースオートエンコーダ機能を対象とした検索では、主要なBitcoin選択機能が確認されている。
我々はこれをバウンドな行動レバレッジ(財務レバレッジではなく、アウトプットに対する因果的な影響を平均的に意味する)として特徴づける。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:36:06 GMT)
Forget Attention: Importance-Aware Attention Is All You Need [2.9] 本稿では,SSMに基づく重要用語をアテンションスコア内に直接付加するSISA(SSM-Informed Softmax Attention)を提案する。
SISAはステップ1KからNIAHを100%達成し、Transformerの検索収束の7倍高速である。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:42:06 GMT)
RASER: Recoverability-Aware Selective Escalation Router for Multi-Hop Question Answering [2.9] マルチホップ質問応答システムは、質問ごとに高価な検索を使用することが多い。
マルチホップ質問の多くは、一発のRAGですでに正しく答えられている。
ワンショットRAG上に構築された安価なルータ群であるRASERとその6つの機能を紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:59:36 GMT)
What Benchmarks Don't Measure: The Case for Evaluating Abstention Competence in Autonomous Agents [2.8] 自律エージェントのベンチマークは、エージェントがタスクを完了したかどうかを計測するが、このフレーミングはエージェントが進むべきだったかどうかを体系的に見えない。
ヒューマンフィードバックの目的の下で訓練されたエージェントは、入力、証拠、あるいは安全に行動する許可がなくても、進行する構造的な傾向を発達させる。
本稿では,要求される情報が欠落している仕様ギャップ,世界国家が確認できない検証ギャップ,明示的な承認が与えられていない権限ギャップについて紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:52:56 GMT)
Attention mechanisms and transfer learning for robust peach leaf damage classification under domain shift [2.8] 気候変動は、しばしば視覚的に類似した葉の症状を引き起こす害虫や病気を含む、無生物的なストレスと生物的な圧力を増大させる。
モモ葉の損傷検出のための画像に基づく分類手法を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:36:01 GMT)
Bayesian meta-learning for modeling Alzheimer's disease progression [2.7] パーソナライズされた治療には、アルツハイマー病の患者が軽度または重度疾患の進行を経験するかどうかを予測することが不可欠である。
ベイジアン・メタ・ラーナーは,複数の個人を対象に訓練されているが,各個人の歴史データに対する予測的疾患スコアの分布を調整している。
本モデルは,長期的疾患進行予測における性能を著しく向上させつつ,シングルタスクモデルと決定論的メタラーナーの両方と性能の競争性を実現する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:24:56 GMT)
Chatterbox-Flash: Prior-Calibrated Block Diffusion for Streaming Zero-Shot TTS [2.7] 本稿では,事前学習した自己回帰型TSデコーダをブロック拡散デコーダに微調整したゼロショット音声合成モデルChatterbox-Flashを提案する。
主観的ブロック拡散復号を離散音声トークンにネーティブに転送することは品質を劣化させる。
本稿では,ブロックレベルの限界トークン分布を減算する事前校正スコアと,校正された信頼度に基づいて反復を適応的に終了する早期復号スケジュールの2つの推論時間手法を紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:53:31 GMT)
Defect Holonomy Near Rank-Deficient Mixed States [2.7] 階数変化点近傍の混合量子状態の幾何学について検討する。
ランク不足状態がバンドル構造が縮退する特異境界層を形成することを示す。
有効なSU(2)欠陥セクターの中で、ホロノミーの共役類は、ランク不足欠陥を取り巻くモノドロミーの連続的で非量子化された分類を提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:51:19 GMT)
Entropy Minimization without Model Collapse: Mitigating Prediction Bias in Medical Imaging [2.7] エントロピーの最小化はテスト時間適応の主要な目的であるが、その失敗モードであるモデル崩壊は理解されていない。
本稿では,この障害モードを特に対象とするバイアス補正対象である分散シフトバイアス低減(DSBR)を提案する。
DSBRはテスト時間適応を一定に安定化し,モデル崩壊を防止し,最先端の手法に適合し,性能を向上する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:48:16 GMT)
Do Neural Retrievers Prefer Certain Documents? Evidence of Learned Relevance Priors [2.6] 教師付きバイエンコーダレトリバーが文書レベルの関連性を暗黙的に学習するかどうかを検討する。
教師付きニューラルレトリバーは、参照できないドキュメントに一般化し、モデル間で一貫性のある関連性を符号化する。
判断された関連文書は、主流トピックの包括的で自己完結した要約である傾向があり、ニッチ、断片的、あるいは非常に技術的な内容は、しばしば未判断のままである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:31:28 GMT)
Theory of Quantum Phase Space: Foundations and Applications [2.5] この記事では、量子位相空間論の簡潔なレビューを提供する。
基本原理と標準量子準確率分布の性質から始まる。
負の値の出現や位相空間のぼかしなど,これらの分布の本質的な制限について論じる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:43:13 GMT)
A Biconvex Formulation for Stable Transport of Mixture Models with a Unique Solution [2.5] 最適化トランスポート(OT)は、分散間のマッピングのための計算フレームワークを提供する。
本稿では,画像データや摂動,実世界のデータなどの有効性と実用性を実証する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:26:04 GMT)
Improving Combined Detection and Classification of TEM Defects via Mask-Conditioned Latent Diffusion Augmentation [2.5] マスク条件付き潜時拡散モデル(LDM)を用いた生成データ拡張手法を導入し,現実的なTEM画像を制御可能で自動ラベル付き欠陥マスクで合成する。
以上の結果から,F1スコアの高調波平均値が最大0.02向上し,モデル全体の性能が向上することが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:38:47 GMT)
Flexible Online Representation Learning Based on Similarity Matching [2.5] スパース高次元表現は、教師なしデータの探索において非自明な構造を明らかにするのに役立つ。
そこで本研究では,スパースシフト不変表現を学習可能なオンライン生物可利用学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:46:27 GMT)
LLM-Evolved Pattern Generators for Optimal Classical Planning [2.4] 本稿では,A*探索の最適性を保証するために,設計によって許容されるドメイン依存ミスを学習するための最初の手法を提案する。
進化的プログラム合成フレームワークを用いて、各ドメインに対して、そのドメイン内の任意のタスクに対してパターンコレクションを生成するプログラムを取得し、その結果のパターンを飽和コストによって許容的に組み合わせる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:10:20 GMT)
Towards Efficient Synthesis of Quantum Graph States by Fusing Graph Motifs [2.4] フォトニックグラフ状態は、測定ベースの量子コンピューティング、分散量子センシング、および量子相互接続を可能にする。
本研究では,分解前のグラフ状態のより合成フレンドリな表現を識別するために,局所クリフォード(LC)等価性を利用して,コストを考慮した分解問題としてフォトニックグラフ状態の合成について検討する。
具体的には,目的とするグラフ状態をリング,スター,リニアモチーフに分解する3段階のフレームワークであるCFD(Cost-Aware Fusion-based Decomposition)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:51:29 GMT)
Pool-Select-Refine: Allocation-Aware Generative Dataset Distillation with Soft-Label-Guided Latent Refinement [2.4] 本稿では,アロケーションアウェアな生成データセット蒸留のための2段階フレームワークを提案する。
まず、オーバーコンプリート候補プールを構築し、目標予算の下でコンパクトなサブセットを選択する。
第2に,教師モデルから抽出したソフトラベル指導を用いて,潜時空間で選択したサンプルを精査する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:56:47 GMT)
The Ghost Couple: Correlated LLM Name Priors and Their Haunting of the Web and Academic Publishing [2.4] 大規模な言語モデルは、フィクションの専門家を生み出す際に、単に高い確率の個人名に対してデフォルトではないことを示す。
我々は、偽造された刊行日を記した現存しない雑誌を主張する1,655件のゴースト・ライツ・レコードを特定した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:38:56 GMT)
Ablating Archetypes: The Stability of Archetypal SAEs is an Artifact of Initialization and Metric Design [2.4] スパースオートエンコーダ (SAEs) を用いた辞書学習における安定性の主張には, 軌跡診断と改善が必要であることを示す。
我々の研究は、より大きな辞書学習の伝統の中でSAEを研究することの価値を支持する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:50:32 GMT)
Evaluation of Baseline Methods for IDD-based SSD External Memory Search [2.4] 多くの難解な探索問題は、A*のようなアルゴリズムでRAMだけを使って解けない。
本稿では、IDDベースのA*に対する単純なベースラインアプローチの性能評価と解析により、文献のギャップを解消する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:51:35 GMT)
Echelon: Auditable Aggregate-Only Language-Model Adaptation Across Privacy Boundaries [2.4] デバイスレベルのモデル-ステート非輸出を強制する境界ファーストのトレーニングアーキテクチャであるEchelonを紹介します。
Echelonはバッファリングされた半非同期セキュアアグリゲーション、スタレネス対応重み付け、参加ウィンドウ、近距離局所目標、ドリフト対応外部同期コントローラを組み合わせた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:28:29 GMT)
FedMTFI: Feature Importance Based Optimized Multi Teacher Knowledge Distillation in Heterogeneous Federated Learning Environment [2.3] フェデレートラーニング(FL)は、生データを公開せずに協調的なモデルトレーニングを可能にする分散型アプローチである。
我々は,多教師の知識蒸留(MTKD)と特徴的重要性を組み合わせた新しいアーキテクチャであるFedMTFIを提案し,不均一環境におけるFLプロセスを改善する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:58:16 GMT)
PHASOR: Phase-Anchored Universal Action Representations for Humanoid Embodiments [2.2] 既存の方法は、アクションラテントを第一級表現ではなくタスク固有の中間体として扱う。
我々は、アクション埋め込み空間自体を第一級の設計ターゲットとして位置づけ、表現品質から下流のポリシー品質を生じさせる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:02:24 GMT)
Decision-calibrated prediction sets for robust power system operations [2.2] 気象に依存した不確実性に支配される電力系統の運用コストと信頼性のバランスをとるために、決定校正された不確実性セットを導入する。
これらは条件付きカバレッジではなく、下流の意思決定の信頼性の観点から定義される。
決定校正された集合が所定の制約満足度目標を約3ポイントの範囲で達成できることを示し、一方、標準カバレッジに基づく校正は、これらの目標を11ポイント以上体系的に超えることを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:12:09 GMT)
ATLAS: A Large-Scale Evaluation Benchmark for Adversarial LiDAR Perception [2.2] ATLASは、ブラックボックスセンサー攻撃下でのLiDAR知覚モデルの大規模な物理的基盤評価ベンチマークである。
標準ベンチマークでのより強力なパフォーマンスを持つモデルは、除去攻撃に耐える傾向にあるが、実際には弱いモデルよりもインジェクション攻撃に対して脆弱である。
この脆弱性を、標準的なオブジェクトデータベースサンプリング拡張にトレースし、現在のトレーニングプラクティスがアーキテクチャに依存しない障害を誘発する方法を明らかにします。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:56:57 GMT)
Updating the standard neuron model in artificial neural networks [2.2] 1950年代の開始以来、人工知能ニューラルネットワーク(ANN)はいわゆるポイントニューロンモデルを使い始めた。
長年にわたり、神経科学の文献は、ニューロンモデルは単純すぎて多くの基本的な神経過程を適切に表現できないことを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:40:31 GMT)
Fairness Definitions and Metrics in Deep Reinforcement Learning for Drug Discovery in Healthcare: A Rapid Evidence Review [2.2] DRLに基づく薬物発見において、公正性がどのように定義され、測定され、テストされるかの正確な合成は存在しない。
i)データセットの構成と戦略、特に足場とランダムの分割、評価と分配のシフト、(ii)報酬設計(QED、ドッキング、毒性、合成アクセシビリティ)が、がんターゲットに重点を置いたバイアスをいかに生み出すか、あるいは緩和するか、(iii)測定可能な指標がフェアネスを最もよく捉えているか、という3つの質問に焦点をあてる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:18:27 GMT)
Massive Spikes in LLMs are Bias Vectors: Mechanistic Uncovering and Spike-Free Quantization [2.2] 大規模言語モデル(LLM)における大規模アクティベーションスパイクは、動的範囲を延ばして量子化を著しく低下させる。
これらのスパイクは、注意シンクと値状態ドレイン機構を駆動する正規化後に一定ベクトルに収束することを示す。
InSERTQUANTは、事前計算されたテンプレートベクトルを介してスパイクをクランプし、それらの関数を復元するポストトレーニング量子化フレームワークである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:09:35 GMT)
I-(OT)^2: A Client-optimal Oblivious Transfer Protocol for IoT Devices [2.2] Oblivious Transfer (OT) はプライバシー保護計算を可能にする基本的な暗号プリミティブである。
I$-$(OT)2$は2次リシデュエンス問題に基づく新しいベース1-out-of--2 OTプロトコルである。
3072ビットRSAを使用した128ビットのセキュリティでは、レシーバはデスクトッププラットフォームでは2.80秒、IoTデバイスでは39.90秒まで、OT当たりの平均オンラインコストを発生させる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:54:08 GMT)
Jailbreaking Multimodal Large Language Models using Multi-Clip Video [2.1] 我々は,ビデオ入力の多様性がMLLMの脆弱性に与える影響を評価するために,2,920本の動画のデータセットであるMulti-Clip Video (MCV) SafetyBenchを紹介する。
8つの代表的ビデオMLLMの実験では、クリップ数によって攻撃の成功が一貫して増加することが示されている。
その結果,映像のモダリティは(1)画像のモダリティよりも脆弱であり,(2)静的ビデオよりもダイナミックビデオに脆弱であり,(3)動画がより多様なコンテキストを含む場合,より脆弱であることが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:43:53 GMT)
Post-Deterministic Distributed Systems: A New Foundation for Trustworthy Autonomous Infrastructure [2.1] ポスト決定論的分散システム(Post-Deterministic Distributed Systems)は、異種環境をコーディネートするための研究とエンジニアリングモデルである。
古典的分散コンピューティングモデルがこの参加者モデルの非曖昧性特別ケースを形成することを示す。
プロトコル駆動開発、検証可能なエージェントインフラストラクチャ、自律状態制御プレーン、セマンティッククオラム保証、エピステミック状態レプリケーションの5つのアーキテクチャ柱を概説する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:37:59 GMT)
Diagnosis of Human Object Interaction Detectors for Real World Educational Applications [2.1] 本稿では,実世界の教育ビデオデータに対して,3段階のHOI誤り分類と誤り要因帰属分析を統合した診断駆動フレームワークを提案する。
HOI故障モードの解析とその原因に基づいて,事前学習したHOIモデルを対象領域に適応するための診断インフォームド・リファインメント・ストラテジーを開発する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:55:39 GMT)
RobustModelMaker: Coupling Bootstrap Stability Selection with Leakage-Safe Nested Cross-Validation for Scientific Machine Learning [2.0] RobustModelMakerは、厳密なネストされたクロスバリデーションで安定性の選択をブートストラップするPythonフレームワークである。
安定性テストされた機能サブセットとリークセーフなパフォーマンス見積を生成する。
バイナリ分類、マルチクラス分類、レグレッションの9つのアルゴリズムをサポートする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:11:23 GMT)
Comparing ML-Specific and General Python Code Smells Across Project Characteristics [2.0] GitHub上の279のオープンソースプロジェクトにおいて、6つのプロジェクト機能(サイズ、年齢、コントリビュータ、コミット頻度、CI/CD採用、ドメイン)がML固有のコード品質と一般的なPythonコード品質の両方にどのように関係しているかを示します。
1) MLコードの臭いは一般的なPythonの匂いの41~94倍が少なく、(2) コミット頻度とドメインはML固有の品質に大きく関連しているのに対して、プロジェクトサイズ、チームサイズ、年齢、CI/CDの採用は技術的負債に関する従来の見解に挑戦するものではない。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:27:53 GMT)
Privacy-preserving Information Sharing in Oligopoly Competitions [2.0] 競合するサプライヤー間の情報共有は不確実性の下で意思決定を改善することができる。
ライバルの搾取に関する 戦略的懸念は しばしば 自発的な開示を妨げます
本研究では,Cournot oligopolyにおける情報共有機構の需要不確実性について検討する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:58:38 GMT)
Beyond Additive Decompositions: Interpretability Through Separability [1.9] 解釈可能な機械学習は、正確で構造的にデータに忠実なモデルを必要とする。
本稿では, 段階的にグレディな手続きを施して, 単機能関数のランク1積の総和を学習する回帰モデルである分離学習(TSL)を提案する。
我々は、有界な$p$-次部分微分を持つ関数に対する近似レート保証を確立し、TSLが回帰ベンチマークのブラックボックスモデルと競合することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:12:14 GMT)
Site4Drug: Predicting Drug-Binding Target Sites with an AI Agent [1.9] Site4Drugは、明示的な制約、エビデンスサマリ、リスクフラグ、トレース可能な決定ログを備えた、ターゲット可能なリージョンのランクリストを生成する。
Site4Drugは、ユーザーが事前に薬物のモダリティを指定するのではなく、サイト発見に使用するのと同じエビデンスから結合モダリティを推奨できる。
この証拠は、化学的に可塑性だが生物学的に排除された場所を選択することを避けるために、小分子のポケット発見を含むモダリティにわたって一貫して適用されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:32:02 GMT)
Doing well with less! On Sampling Techniques for Empirical Pairwise Loss Estimation/Minimization [1.9] そこで本研究では,全対を用いて得られた手法に匹敵する推定・最適化性能を,対で利用可能な情報のごく一部しか保持しないフラジカルな手法で実現できることを,調査サンプリング手法を用いて示す。
特に、視覚やグラフ学習における埋め込みのような高次元ベクトル間のペアワイズ損失に対して、適切な補助情報を用いて情報的ペアに高い包摂確率を割り当てると、完全なペアワイズ評価に近い性能が得られる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:54:29 GMT)
Hybrid Clifford Codes via Operator Algebra Quantum Error Correction and Projective Representation Theory [1.9] 我々は、ハイブリッド古典情報と量子情報の両方と射影表現理論の設定に対してクリフォード符号の2倍の一般化を定式化する。
これはハイブリッド部分空間とサブシステムのクリフォード符号の新しいクラスにつながる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:38:21 GMT)
CRePE: Convolution-aware Relative Importance in Post-training Pruning with Efficient Search [1.9] PTP(Post-training pruning)は、メモリと計算コストの削減に有効な手法である。
局所的な2次元コンテキストと適応係数を相対的重要度スコアに組み込んだtextbfCRePEを提案する。
CRePEは、様々なモデルとスパーシティ設定で既存のPTPメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:44:31 GMT)
IntraShuffler: A Privacy Preserving Framework for Heterogeneous DP Federated Learning [1.9] フェデレートラーニング(FL)における異種差分プライバシー(HDP)は、クライアントが個々のプライバシ予算(varepsilon_i$)を選択することを可能にする。
多くのHDP-FLシステムは、宣言されたプライバシー予算に従ってクライアント更新を再重み付けすることでモデルユーティリティを改善するために、$varepsilon$-awareサーバアグリゲーションを使用している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:54:10 GMT)
Trust-Calibrated Code Review: A Participatory Design Study of Review Workflows for LLM-Generated Multi-File Changes [1.9] LLMをベースとしたエージェントが生成する複数ファイルの変更をレビューすることは、拡散問題というよりも、信頼校正問題である。
調査の結果,7つの設計構造をサポートする3段階のレビューワークフローが得られた。
これらの結果は, 将来のツール開発において, 設計の方向性が肯定的であることを示唆している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:32:25 GMT)
Detecting Pen-In-Air States from Video: A Proof-of-Concept Toward Complementary Handwriting Analysis [1.9] テーブルベースセンシングはペンアップ動作の解析を筆記面上の短い近接範囲に制限する。
YOLOをベースとした検出器と動画像の特徴抽出と機械学習の分類を併用したハイブリッドパイプラインを提案する。
結果は、デジタル化タブレットの低コストで非侵襲的な補完として、ビデオベースのPen-Up検出の実現性をサポートし、将来の大規模研究の基盤を提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:50:27 GMT)
Error Bounds for a Diffusion Model-Based Drift Estimator [1.9] Tapia Costa et al. (2026) の最近の研究は、拡散パラメータが知られているときにドリフトを推定する新しい手法を導入した。
これらの手法はドリフト推定をデノナイズ問題として扱い、(条件付き)スコアマッチング拡散モデルからツールを活用する。
これらの実験は、様々なドリフトクラスで有望な結果を示したが、理論的保証の問題は未解決のままであった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:47:34 GMT)
Cross-modal linkage risk in clinical vision-language models [1.8] 視覚言語モデル(VLM)は、ペアの胸部X線写真と放射線学レポートに基づいて訓練され、インスタンスレベルの画像レポート対応を保存できる共有埋め込み空間を学習する。
これは、ラジオグラフとレポートが買収後に意図的に分離された設定でプライバシー上のリスクを生じさせる。
我々はこれをイメージ・ツー・レポート検索として定式化し、プライバシーシナリオとしてではなく、パブリック・ペアのコホートを使用してリスクを監査した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:01:46 GMT)
Beyond One-shot: AI Agents for Learning in Field Experiments [1.8] ツール強化エージェントAIが実験データから自動的に学習し、新たな介入を生成できるかどうかを検討する。
我々の研究は、ツール強化AIが実験データから学習し、改善されたドメイン関連介入を生成することを示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:30:42 GMT)
Automated Essay Scoring and Language Certification: Assessing Generalizability, Agreement and Validity for French [1.8] 議論に基づく検証フレームワーク(ABV)の拡張的で実用的なバージョンを紹介します。
我々は、27k試験エッセイのコーパス(それぞれ2つのラガー)と991エッセイの一般化コーパス(それぞれ少なくとも9つのラガー)の8つのモデルアーキテクチャを比較した。
分析では,AESモデルの能力と落とし穴をよりよく理解するためにABVフレームワークを適用した利点を概説する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:03:11 GMT)
Model Multiplicity and Predictive Arbitrariness in Recidivism Risk Assessment [1.7] 本稿では,15年以上にわたって使用されているリシビズムリスク評価のための機械学習に基づくシステムについて検討する。
我々は、予測性能を改善し、グループ間のエラーレートの相違を低減し、リハビリテーションの進行がリスクスコアを低くする解釈可能なモデルを学習する。
本実験は, 誤差速度の相違に匹敵する多くの類似した精度のモデルが存在することが, 必ずしも重大な予測多重度に変換されないことを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:53:54 GMT)
HAIM: Human-AI Music Datasets for AI Music Production Tracking Benchmark [1.7] 本稿では,音楽制作の段階において,多様なラベルを持つデータセットであるHAIMを紹介する。
最先端検出器の評価により, システム欠陥が明らかとなった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:51:12 GMT)
An Agentic Approach Towards Replication Package Quality Evaluation [1.7] 本稿では,複製パッケージの品質評価のためのエージェント的アプローチについて検討する。
我々は34のソースから380の要件を51の基準に集約し、そのうち31は自動アーティファクトベースの評価のために運用されている。
5つの複製パッケージの予備評価は、91.4%と75.4%の高い実行間一貫性を示している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:00:41 GMT)
Scalable Derivative Gaussian Processes via Exact Gradient Reduction [1.7] 本稿では,ターゲット比の厳密な勾配減少に基づく高度にスケーラブルな微分GP法であるTERAを紹介する。
TERAは、標準的な派生GPよりも桁違いに高速に動作しながら、最先端の予測精度を達成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:29:28 GMT)
EEG-FuseFormer: A Transformer-Driven Feature Fusion Framework for Seizure Onset Prediction [1.6] 発作発生の正確な予測はてんかん患者のリスクを軽減するのに役立つ。
本稿では,アセプション・オンセット予測のためのトランスフォーマーベースの機能融合フレームワークであるEEG-FuseFormerを提案する。
提案モデルでは,98.85%の平均リコールを実現し,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:27:01 GMT)
Can scrambling protect quantum state distinguishability under noise? [1.5] 量子状態の区別可能性(Quantum state distinguishability)は、量子情報科学における基本的な概念であり、様々な重要な実用的課題を基礎にしている。
雑音の量子情報処理に対する理論的および実践的な関心から、最小限の「スクランブル」アンサンブルが雑音下での識別性を保護するかどうかを問う。
本研究は, チャネル条件エントロピーによって制御される雑音性2-設計アンサンブルの識別性が, 鋭いしきい値と位相遷移挙動を示すことを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:51:56 GMT)
Easier to Mislead Than to Correct: Harmful and Beneficial Revision in LLM Conformity [1.5] ピア合意は、当初間違ったモデルを修正するよりも、最初に正しいモデルを誤解させるのがずっと簡単であることを示す。
これらの結果から,マルチエージェントLLMシステムは単に集約するのではなく,ピア回答を検証すべきであることが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:42:00 GMT)
AI as a Tool for Simulation-Based Experiments in Literary Studies [1.5] 生成人工知能(AI)システムは、文学研究における新たな実験の可能性を開く。
現在のシステムでは、高品質で本の長さの物語テキストがまだ作成されていない。
本稿では,文学テキスト生成実験の結果について紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:16:13 GMT)
Exact Solutions for Spin Conserving Models and the Wigner-Araki-Yanase Theorem [1.4] ウィグナー・アラキ・ヤナセの定理(Wigner-Araki-Yanase theorem)は、加法保存法則の存在下での量子測定の限界に関するよく知られた定理である。
我々は、測定のモデルを保持する一般的な角運動量を開発する。
このモデルは、WAY定理の主要な意味を簡潔に説明し、装置モデルに基づく測定の効果の正確な結果を与える。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:22:04 GMT)
Are we really tilting? The mechanics of reward guidance in flow and diffusion models [1.4] 逆誘導アルゴリズムは、学習した生成過程を推論時に報奨型尺度に導出する。
経験的に強力だが、これらの手法はハッキングに報いる傾向にある。
報酬誘導拡散の最も実践的な実装における近似から報奨ハッキングが発生することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:56:24 GMT)
Microwave Crosstalk in Planar Superconducting Quantum Devices [1.4] マイクロ波クロストークは超伝導量子デバイスをスケーリングする上で大きな課題となる。
実験により得られたクロストークを定量的に説明する物理モデルを開発した。
その結果,低クロストークデバイスレイアウトの実践的ガイダンスが得られた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:12:03 GMT)
RESCAST-100K: A Comprehensive Dataset for Cross-Domain Residential Load and Indoor Temperature Forecasting [1.4] 本稿では,クロスドメインの一般化を研究するための大規模住宅予測ベンチマークであるRESCAST-100Kを紹介する。
ソースドメインとターゲットドメインを解釈可能なxに沿ってインスタンス化する設定駆動インターフェースを提供する。
このベンチマークは、ResStockから得られたEnergyPlusを模した米国の住宅約10万戸をカバーする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:17:16 GMT)
Anomalies in Multivariate Time Series Benchmarks Are Mostly Univariate [1.3] 異常を通知するセグメントごとの診断フレームワークを導入する。
断続的断裂は発生しない。
我々は、より構造的に多様な評価セットの開発を要求する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:42:35 GMT)
Creating and Probing Spin-Squeezed States of Molecules [1.3] 極性分子は、基礎物理学の量子強化されたセンシングと精度テストのための有望なプラットフォームである。
光学的ツイーザアレイに閉じ込められた極性CaF分子における、メロジカルに有用な絡み合った状態(スピンスクイーズ状態)のクラスの最初の観察を報告した。
本研究は分子の絡み合った状態の生成,制御,特性化,保存のためのスケーラブルなプラットフォームとして分子光学的ツイーザアレイを構築した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:10:37 GMT)
CANARY: Zero-Label Detection of Fine-Tuning Contamination in Language Models [1.3] CANARYは、隠れた状態のみからのサプライチェーン汚染を検出し、検証し、優先順位付けし、修正するためのゼロラベルフレームワークである。
AUROC = 1.000 at 1% contamination, with zero false positives on beign fine-tuning and full robustness to style-matching and gradient-noise adapt attack。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:01:01 GMT)
The Use of Computational Thinking Skills, Difficulties, and Strategies of Introductory Programming Students Solving Bebras Tasks [1.3] 計算思考(CT)は、誰もが学ぶべき基本的なスキルセットだと考えられている。
従来の研究では、学生や専門家が序列計算問題を解く際にCTスキルをどのように応用するかが研究されている。
本研究は, 計算問題の解決におけるCTスキルの適用方法, 遭遇の難しさ, 採用戦略について検討した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:33:56 GMT)
AdaWeather: Adaptively Mixing Probabilistic Weather Forecasts with Logarithmic Regret [1.3] AdaWeatherは、機械学習と専門家の混在を利用して多くの確率予測を組み合わせ、統一された改善された確率予測に到達する適応フレームワークである。
我々は,既存の方法よりも温度予測と改善の観察に重点を置いている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:46:26 GMT)
A Doeblin-Anchored Contrastive Chart for Learning Markov Transition Kernels [1.3] 本稿では,トランジションカーネルを対照的な目的から学習するための統計的・動的座標フレームワークを提案する。
固定された相対的リスクは、固定された遷移密度を識別し、過剰なリスクを密度誤差に校正することを証明する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:26:44 GMT)
An NLP-Driven Framework for Curriculum-Labor Market Alignment: Schema-Constrained LLM Extraction, ESCO-Anchored Semantic Matching, and Multi-Dimensional Gap Quantification [1.3] 既存のパイプラインは、暗黙の能力を取り戻すことができない語彙曲面法に依存している。
本稿では,フロンティア強化7スロット形式を組み込んだ4段階NLPフレームワークを提案する。
このフレームワークは、高等教育品質保証における重要な応用のためにインスタンス化されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:44:37 GMT)
FlipItRight: Stable Pose-Targeted Throw-Flip Across Diverse Objects [1.2] 提案するFlipItRightは,高DoFマニピュレータを用いた安定な平面ポーズターゲットスローフリップのためのフレームワークである。
リリース状態を明示的な中間表現として扱うことで、原則付き候補フィルタリング、リリースの適応選択、プレスウィング設定が可能になる。
120回の試験で90%の成功率を達成するために, 形状, サイズ, 質量の異なるオブジェクトの実際のプラットフォーム上で検証を行った。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:31:07 GMT)
Simultaneous Model-Based Evolution of Constants and Expression Structure in GP-GOMEA for Symbolic Regression [1.2] GP-GOMEAは正確かつコンパクトな表現を見つけるための主要なアルゴリズムの1つである。
本稿では,式構造として定数を同時に最適化する手法を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:29:30 GMT)
PeAR: A Static Binary Rewriting Framework for Binary-Only Fuzzing [1.2] PeARはバイナリのみのファジィフレームワークである。
SBIはバイナリのみのファジィ化において実用的で効果的な手法であることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:56:05 GMT)
Towards Heisenberg Scaling: Measurement-Efficient Non-Orthogonal Quantum Eigensolver [1.1] 非直交量子固有解法(NOQE)は電子構造計算の枠組みを提供する。
ハミルトンおよび重なり行列要素の推定はサンプリングに依存する。
この行列要素推定ステップを振幅推定タスクの集合として再構成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:37:10 GMT)
KliniskVestBERT: BERT Model Specialised to Norwegian Clinical Texts [1.1] この研究は、3つのBERTベースのエンコーダモデルのスイートであるKliniskVestBERTを紹介している。
このデータセットはHelse Vest患者の代表集団に基づいている。
含まれるドキュメントタイプは、bokmlとnynorskの幅広い臨床スペクトルを包含するように慎重にキュレートされる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:42:55 GMT)
Evolutionary Discovery of Bivariate Bicycle Codes with LLM-Guided Search [1.1] 量子LDPC符号探索では、大きな代数的設計空間を探索し、発見される任意の候補のパラメータと等価クラスを確実に証明する必要がある。
言語モデルがPythonプログラムを変異させるLLM誘導進化ワークフローを提案する。
5回のキャンペーンで約1,650回の進化的なイテレーションを実行し、約2倍の105ドルの候補コードを実行し、計算時間に$sim140$とLLM推論コストに$sim$US$400を必要とした。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:58:52 GMT)
PliableBVS: A flexible Bayesian variable selection method for modeling interactions with mandatory modifying variables [1.1] PliableBVS(英語版)は、Pliable lassoの階層構造を保存する変数選択手法である。
提案モデルはベイジアン・ラッソの連続収縮効果と階層的なスパイク・アンド・スラブの事前定式化を組み合わせたものである。
シミュレーション研究において、本手法は、活性主および相互作用効果の同定において、元の柔軟なラッソよりも優れている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:07:53 GMT)
Network Distributed Multi-Agent Reinforcement Learning for Consensus Control of Quadcopters [1.0] 本稿では,クワッドコプターコンセンサス制御のためのネットワーク分散マルチエージェント強化学習(ND-MARL)フレームワークを提案する。
その結果、集中型MARLコントローラと比較して、スムーズなコンセンサストラジェクトリとプランナー-トラッカー統合が示された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:39:40 GMT)
Unicity: Predicates and Atomic Swaps [1.0] 我々はユニシティトークンの所有権を述語と呼ばれるプログラム可能な消費条件に一般化する。
我々は、Unicity実行層のセキュリティ特性が、家族の強制不可能を予測するために、減らされて保存されていることを証明した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:46:37 GMT)
The Unicity Execution Layer [1.0] トークンの所有権は公開鍵で表現され,転送にはデジタル署名が必要となる,正式なセキュリティモデルを提案する。
1)2つのトークン状態が少なくとも1回は使用できないこと、(2)ブロッキングができないこと、(2)正当な所有者だけがトークンの使用を防止できないこと、(3)サービス側のプライバシ--Unicity Serviceはトランザクションを同じトークンでリンクできないこと、の3つの基本的なセキュリティ特性を証明します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:37:31 GMT)
PaCX-MAE: Physiology-Augmented Chest X-Ray Masked Autoencoder [1.0] 胸部X線エンコーダに生理的前駆体を注入するクロスモーダル蒸留フレームワークPa CX-MAEを提案する。
Pa CX-MAEは、CXR表現をペアのECGと実験室の埋め込みと整合させて、二重のコントラスト予測目的でドメイン内のマスク付きオートエンコーディングを増強する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:34:56 GMT)
Transferable Self-Harm Surveillance from Emergency Department Triage Notes Using an Evidence-Augmented Machine Learning Approach [0.9] セルフハームは主要な公衆衛生上の問題であるが、現在の病院のプレゼンテーションに依存する監視は不十分である。
我々は,大規模言語モデルに基づくスクリーニングとエビデンス抽出によって従来の機械学習を強化し,自己損傷を検出する3段階のアプローチを開発した。
このアプローチの重要な利点は、プライマリ・セルフハーム法を95%の精度で識別し、二項分類を超えてよりきめ細かい監視を可能にすることである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:48:21 GMT)
Attention-Like Hebbian Learning from Quantum Probability Flow and Quantum-Annealer Tests [0.9] 本稿では,連想記憶における局所学習規則を導出するための量子確率フロー原理を提案する。
横フィールドは、データ状態からの漏洩チャネルを定義し、測定された生存損失を最小限に抑えることで、安定性を駆動する更新を行う。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:29:30 GMT)
A Minimal Duality Estimate for the Surface-Code Threshold under Nearest-Neighbor Correlated Errors [0.9] 正方形八角形ランダムボンドイジングモデルに単方程式双対性規準を適用する。
誤差エッジ低減後の最小セルに対して演算を行う。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:40:15 GMT)
Why Do Self-Harm Prediction Models Struggle to Generalise? Lexical and Semantic Variations in Emergency Department Triage Notes [0.9] 救急部門へのセルフハームプレゼンテーションは、自殺リスクの増大と強く関連している。
2つの病院のEDトリアージノートを,語彙的特徴,関連性の高い予測的特徴,有能なトピックを分析して比較した。
自爆や自傷などの一貫したテーマに拘わらず, 病院内における語彙表現の変動と, 自傷に関する特徴的重要性を明らかにした。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:37:58 GMT)
BADGER: Bridging Agentic and Deterministic Evaluation for Generative Enterprise Reasoning [0.9] BADGERはテキスト・ツー・アセスメントとエージェント動作評価を統合した統合フレームワークである。
BADGERは、クライアントが管理するデータ環境内で完全に動作します。
クライアント固有の判断とメトリクスの迅速なプロトタイピングをサポートする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:42:37 GMT)
3rd Place at CVPR 2026 CASTLE Challenge: Agentic Multi-View Long-Context Video Understanding via Hierarchical Knowledge Graph Retrieval [0.9] 本稿では,CVPR 2026ワークショップにおけるCASTLE 2026 Challengeの優勝方法論について述べる。
我がチームは世界3位を獲得した。
ベースとなるデータセットは、エゴとエクソカメラのソースによって撮影された600時間以上の同期映像で構成されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:01:32 GMT)
SECUREVENT: Hybrid AI/ML Security Monitoring for Distributed Event-Based Systems [0.9] 本稿では,分散イベントベースシステムのためのハイブリッドAI/MLセキュリティ監視アーキテクチャであるSECUREVENTを提案する。
このアーキテクチャは、認証されたトランスポート、トピックレベルの認証、署名されたイベントなどの従来の保護と、オンラインの異常検出、グラフ対応の行動特徴、複雑なポリシールール、フェデレーション付き学習、対向MLガバナンスといった従来の保護を組み合わせる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:04:16 GMT)
Acceptance-Test-Driven Evaluation Protocols for Business-Centric LLM Systems [0.9] 本稿では,受入テスト駆動型開発を基礎とした運用型大規模言語モデル(LLM)システムに対する評価プロトコール拡張に寄与する。
利害関係者の目標を、実行可能行動契約、リリースゲート、監視信号、エビデンスアーティファクトに翻訳し、プロンプト、モデル、検索、エージェントの変更が受け入れられる。
このコントリビューションは、ガバナンス指向のメトリックスタック、リファレンスアーキテクチャ、そして、アクセプションテスト駆動のLCM開発を、アクセプションファーストとベンチマークアフターに比較するための経験的なプロトコルである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:21:10 GMT)
SN-WER: Script-Normalized WER for Multi-Script Indic ASR Evaluation [0.8] Script-Normalized WER (SN-WER) は、トレーニングフリーで評価のみのスコアリング手法である。
SN-WERを5つのIndic言語、2つのデータセット、3つのASRモデルで評価した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:49:10 GMT)
How Optimality Structures Sparse Dictionaries: A Theory for Understanding SAE Representations [0.8] スパースオートエンコーダ(SAE)は、神経表現を解釈可能な概念に解析することに成功した。
ここでは、任意の辞書学習最適条件が満たさなければならない性質を単に問う。
これらの制約は、観察されたSAEの挙動を説明するために用いられる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:34:34 GMT)
FlatVPR: Plug-and-play Geo-linear Residual Adapter for Geometric Rectification of Foundation Model Feature Manifolds [0.8] FlatVPR'は、視覚的位置認識における地図軽量性と位置決め精度のトレードオフを橋渡しする。
本手法は, 数学的に接地したプルバック平坦性損失を用いて, 多様体曲率を明示的に抑制する。
NCLTデータセットの実験では、アダプタの適用によってパフォーマンスが大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:56:59 GMT)
Monitoring Agentic Systems Before They're Reliable [0.7] 運用に入るエージェントシステムは、通常、部分的に統合されたアセンブリとして機能し、構造上の欠陥はタスクレベルのエラーではなく、障害のランドスケープを支配します。
本稿では,エージェントシステム評価を3次元(品質,適合性,効率)に分割するモニタリング・トリアージ手法を提案する。
発見は、FMEAに適合した重度分類によってルートされ、調査を保証しているサブセットに人間の注意を集中させる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:01:53 GMT)
Stochastic convergence of parallel asynchronous adaptive first-order methods [0.7] 非同期適応1次最適化手法の新たなクラスが導入された。
実験により、そのようなアルゴリズムは異種機械学習システムに非常に関係があることが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:08:32 GMT)
Penalty-free quantum optimization applied to lattice protein folding [0.7] アナログ反復型局所探索方式を導入し,26量子ビット以上の局所部分グラフを用いて,最大で$N=14$の格子タンパク質の折り畳みに成功した。
この手法は、長さ$N=4$および$N=6$の格子タンパク質に対する量子回路の古典的なシミュレーションを通じて検証する。
そこで我々はさらに,26量子ビットの局所部分グラフを用いて,最大$N=14$の格子タンパク質の折り畳みを成功させる,反復的な局所探索手法を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:34:07 GMT)
Bridging the Last Mile of Time Series Forecasting with LLM Agents [0.6] 実世界の予測設定では、統計的に妥当なベースラインが実際に使われる最後の予測となることは滅多にない。
この実践的な段階は、予測文学において未解明のままである。
予測バックボーン上に位置するLDMエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:03:40 GMT)
Neither Layer Alone: Epistemic Integrity Requires Hierarchical Joint Design for Long-Running AI Agents [0.6] 長期にわたるAIエージェントは、独立して進化するモデルとハーネスレイヤが、その境界を越えた信念、能力、目標のコミットメントのセマンティクスを変えると失敗する。
本稿では,エージェント・エピステミック・インテリティ(AEI)を第一級アーキテクチャ制約として扱う必要があることを論じる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 00:56:23 GMT)
Implementation and Optimization of HQC Decoding on NPU-Integrated Devices [0.6] 本稿では,NPU集積デバイスにおけるQualcommヘキサゴンプロセッサのHQCデコードについて検討する。
我々はテンソル推論エンジンではなく、ヘキサゴンベクトルeXtensions (HVX)バックエンドに焦点を当てている。
その結果、ヘキサゴン/HVXによるデコードにより、レイテンシとエネルギー消費が大幅に減少し、ホストCPUの処理を著しくオフロードしながら、最大18.13タイムのエネルギー効率が向上した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:31:49 GMT)
LLM-Assisted Reranking to Operationalize Nuanced Objectives in Recommender Systems [0.6] 大規模言語モデル(LLM)により、より強力なパーソナライゼーションが可能となる。
本研究では, LLM 支援による再評価が, イデオロギー的・過激な政治的内容への露出を不注意に増幅するか否かを考察する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:54:14 GMT)
FigSIM: A Dataset for Fine-grained Suicide Severity and Figurative Language in Suicide Memes [0.6] 自殺のミーム(英: Suicide memes)は、自殺に関する考えや自殺に関する問題についてのコメントを表現するために使われるミームである。
FigSIMは自殺のミームのきめ細かい分析のために設計された最初のデータセットである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:32:29 GMT)
Graph Edit Distance Formulation for the Vehicle Routing Problem: Theory and Analysis [0.6] 車両経路問題はグラフ編集距離(GED)問題として再構成可能であることを示す。
最適なルーティングは利用可能なエッジの5.5%しか使用せず、最適エッジの約3.0%はクラーク=ライトズによって一貫して見つからない。
エッジ付加目的は、エッジ予測に対する将来のグラフネットワークアプローチに対して、エッジごとの自然な監視信号を提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:46:45 GMT)
Predicting the risk of colorectal anastomotic leak based on preoperative mapping of the blood supply of the bowel [0.6] 大腸癌術後最も重篤な合併症の1つである。
術前に無症候性漏出のリスクを予測するためのCT法は存在しない。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:20:43 GMT)
Topological texture analysis of microscopy images of dynamic casein gelation and its relation to rheological properties [0.5] 本稿では、トポロジカルデータ解析(TDA)、微分ボックスカウント(DBC)、マルチフラクタル分割顕微鏡、局所バイナリパターン(LBP)を統合した新しい計算ツールボックスを提案する。
30Cおよび40Cのグルコノデルタラクトン(GDL)および2GDL濃度(1.8%w/v)で誘導されるカゼイン酸ナトリウムゲル化の時間分解能STED画像に適用した。
TDAは、タンパク質ネットワークの相互結合性を反映する閉環状構造であるトポロジカルループをMax-Betti-1曲線を用いて追跡し、分散集合のラグ位相を明らかにした。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:39:05 GMT)
Tiny Collaborative Inference for Occlusion-Robust Object Detection [0.5] IoT監視ノードやサーチ・アンド・レスキュープラットフォームといった小さなエッジデバイスは、コンピュータビジョンをローカルで実行することがますます期待されている。
ウルトラローエンドハードウェアでは、オブジェクト検出は利用可能なメモリと計算によって制限される。
機能レベルの融合と決定レベルの融合の2つの協調的推論戦略を評価する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:10:08 GMT)
Towards Automated Discovery: A Review of Generative Models, Multimodal Learning and Closed-Loop Workflows in Inverse Materials Design [0.5] 本稿では, 結晶構造モデリング, マルチモーダル学習, クローズドループ設計パイプラインの進歩を概観する。
本稿では, 結晶構造, 熱力学, 電子情報, 顕微鏡, 分光, 処理コンテキスト, 科学テキストなど, 多様な材料を融合させる多モード学習について論じる。
我々は,サロゲート利用,多様性の崩壊,分散シフト,安定性と合成可能性のギャップなど,繰り返し発生する障害モードを強調した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:20:55 GMT)
Breaking the Information Silo: Semantic Personas for Cross-Domain Recommendation [0.5] クロスドメインレコメンダシステムは、ソースドメインからターゲットドメインへの知識の転送によって制限を克服しようとする。
本研究では,厳密な不整合領域間での推薦知識伝達を可能にする設計成果物であるSPHEREを提案する。
SPHEREは、大きな言語モデルを使用して、共通の行動語彙を誘導し、ユーザのための構造化されたセマンティックペルソナを生成し、行動に類似したソースドメインコミュニティを検索する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:04:10 GMT)
Waterproof Editor: an educational environment for proof assistants and programming languages [0.5] Waterproof Editorは、証明アシスタントやプログラミング言語で教えることに特化した教育環境を提供する。
これは、数学的な証明を与えるスキルを学生が習得するのを助けるための教育ソフトウェアであるウォータープロテクトから生まれた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:20:21 GMT)
Train, Test, Re-evaluate: Schedule-Sensitive Evaluation of Generative Data for Hand Detection [0.5] 我々は6つのトレーニング・スケジュール体制の下でYOLOv8nハンド検出器を訓練する。
実験は、塗装されたアクセサリーデータから、実質的なリアルタイムデプロイの利点を抽出する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:38:25 GMT)
Conditional Collapse in Sign Language Production: A Diagnostic and a Scaling Argument [0.5] サイン言語生成(SLP)は、自然言語テキストからアバター手話の動きを生成するタスクである。
生成した動きの質は、How2Signのようなベンチマーク上で、動き空間フレシェ距離(FID)と後方翻訳(BT)BLEUスコアによって評価される。
本研究では,(1)初期条件付け,(2)出力多様性,(3)目標忠実度という3つの独立したレベルにおいて生成された動きを評価することを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:50:36 GMT)
Quantum criticality of the ferromagnetic Dicke-Ising model [0.5] ランダウ理論を用いた強磁性ディック・イシングモデルにおける量子相転移について述べる。
我々は、この行動に責任を持つ重要なメカニズムとして、仮想近接二重スピンフリップ過程を同定する。
本研究は、全対全相互作用量子系における適応有限サイズスケーリング形式の必要性を強調した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:37:20 GMT)
Spin Hamiltonian as Matrix-Free Linear Map [0.5] アルゴリズムは、ハエの状態ベクトル上のジェネリックスピンハミルトンの作用を計算する。
結果は任意のスピン格子にまたがる単項と二項項を評価するための明示的なフレームワークである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:29:07 GMT)
AgentPLM: Agentic Protein Language Models with Reasoning-Augmented Decoding for Protein Sequence Design [0.5] タンパク質言語モデル(PLM)は、外部の生物物理学的フィードバックやリダイレクト生成のメカニズムを持たない単一の前方通過で配列を生成する。
本稿では,ツールコールによる自己回帰生成をインターリーブするReasoning-Augmented Decoding (RAD)を用いて,事前学習したPLMを組み込むことにより,この問題に対処するAgentPLMを紹介する。
我々は、デノボ酵素設計、抗体最適化、耐熱性、PPIインターフェース設計、および標準オラクルAPIによるゼロショット適合性予測を含むベンチマークタスクにおいて、AgentPLMを評価した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:35:02 GMT)
LLM-as-a-Discriminator: When Synthetic Tables Still Look Real [0.4] LLMに各テーブルサンプルをREALまたはSyntheTICに分類するよう依頼する。
CTGAN, TVAE, および Gaussian Copula という3つのモデルを、UCI Adult と ACS Census という2つの公開データセット上で実行しています。
この結果から, LLMの識別は, モデル選択, 提供者毎の報告, データの符号化処理を行う場合の, 実用的なプライバシ監査信号であることが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:10:02 GMT)
Cross-Vendor Sola ISPM Benchmark: Evaluating Agentic AI for Federated Identity Security Reasoning [0.4] 既存の評価は、孤立した単一プラットフォーム環境に焦点を当てている。
我々は、50個のデータ基底タスクのプロダクショングレードベンチマークであるCross-Vendor Sola ISPMベンチマークを紹介する。
また、最終回答の正当性だけでなく、明らかな根拠も測定する評価フレームワークにも貢献する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:41:00 GMT)
Benchmarking AI for low-resource contexts: Thinking beyond leaderboards [0.4] 既存のAI評価プラクティスは、低リソース環境でシステムが実際にどのように機能するかをキャプチャするのに失敗することが多い。
システムとアプリケーションタイプ間の互換性を維持するための共有レポートフレームワークを提案する。
我々は、政策立案者、ドナー、実装者のための簡潔で行動可能な報告アーティファクトの必要性を強調します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:52:51 GMT)
From Local Training to Large-Scale Mapping: A Comparative Assessment of Machine Learning and Deep Learning for Transferable Satellite-Derived Bathymetry [0.3] 我々は、Sentinel-2画像を用いて、0-20mの深度範囲で転送可能なSDBの機械学習とディープラーニングを評価する。
ランダムフォレスト基地線と4つのCNNがプラタス島と選択されたグレートバリアリーフ地域で訓練されている。
新しいサイトへのスケーラブルな転送を可能にするために、最適化されたアーキテクチャと事前訓練されたウェイトをリリースします。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:28:18 GMT)
Large AI Models in Dental Healthcare: From General-Purpose Systems to Domain-Specific Foundation Models [0.3] 口腔疾患は世界中で約35億人に影響を及ぼすが、歯科医療における大規模AIモデルの臨床的ポテンシャルはいまだによく分かっていない。
言語生成モデル、識別的視覚基盤モデル、歯科固有のモデルである。
汎用モデルと歯科固有のモデルが相補的な役割を果たす。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:39:27 GMT)
Identifying High-Confidence Social Biases in LLMs for Trustworthy Conversational Tutoring Agents [0.3] 対話型学習シナリオにおける大規模言語モデル(LLM)を評価し,高い信頼度を持つ社会的バイアスを同定する。
本稿では,自然主義的な指導条件下でのバイアス評価を可能にする新しいデータセット生成手法を提案する。
バイアス検出は、ベンチマークベースの評価よりも会話型チューリングの文脈の方がかなり難しいことが判明した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:28:27 GMT)
Quantifying Side-Channel Leakage in Public Metrology Releases [0.3] 科学と気象学の公開は、それらを生み出した隠れた設定を漏洩させる可能性がある。
我々は、このリスクを統計的なサイドチャネル監査として定式化し、定量化する。
ステップバイステップのプロトコルは、測定されたリリースをこれらの数に変換し、固定されたパッケージはテーブルとフィギュアの全てを再生する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:32:02 GMT)
Novel Aspects of IEEE SA P3109 Arithmetic Formats for Machine Learning [0.3] IEEE P3109ドラフト標準は、バイナリ浮動小数点フォーマットと関連する操作のパラメータ化されたファミリーを定義する。
これらのフォーマットは、少数のビットにおける値の効率的で一貫した表現を可能にする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:27:39 GMT)
Greener Than Humans? Environmental Attitudes in Large Language Models [0.2] 大規模言語モデル(LLM)は、サステナビリティ関連の意思決定サポート、レポート、公開通信にますます利用されている。
本稿では,LLMにおける環境認知,影響,行動,レコメンデーションを評価するためのベンチマークを開発する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:05:53 GMT)
Realistic noise synthesis reduces bias and improves tissue microstructure estimation with supervised machine learning [0.2] シミュレーション信号と取得信号のノイズ特性の差がマイクロ構造パラメータ推定に与える影響について検討する。
本稿では,現実的な雑音合成(RNS)フレームワークを提案する。
RNSは、Rician予測と効果的な後処理ノイズ分散の両方を模擬訓練信号に組み込む。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:35:33 GMT)
Towards Resolving Optimization Conflicts Between Image- and Text-Based Person Re-Identification [0.2] 画像ベース(I2I)とテキストベース(T2I)の人物再識別(ReID)は、モダリティの相違や訓練目標の相反によって妨げられる。
本稿では,2つのReIDタスクとその最適化プロセスの基本的な違いについて検討する。
画像とテキストのモダリティ間で共有表現を学習するための分離された2段階学習パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:37:55 GMT)
Lightweight SAR Ship Detection via Contrastive Distillation [0.2] 本研究は,SARドメインにおけるトランスフォーマーをベースとしたSAR船の知識蒸留フレームワークを提案する。
このフレームワークは、2段階の1段および変圧器ベースの検出器のための共通領域レベルの蒸留インターフェースを提供するという意味で、アーキテクチャに依存しない。
SSDD と HRSID のベンチマーク実験により,提案手法により2段検出器の大幅な改良が得られた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:28:35 GMT)
Fast and Lightweight Novel View Synthesis with Differentiable Multiplane Image [0.2] MPIの微分可能最適化とレンダリング結果の後処理の両方に一段階拡散を導入する。
代表的なGSベースの手法と比較して、我々のアプローチは30.7%高速で、モデルサイズの14.8%しか使用していない。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:57:53 GMT)
Half the Interference, Most of the Answer: Approximate Quantum Simulation via Path-Sum Pruning [0.2] この2つ目のボトルネックを明示するフレームワークである統計的干渉サンプリングを導入する。
Deutsch-Jozsa, Grover search, Simon's problem, and small Shor period-finding instance のベンチマーク回路では、終端干渉反応の50%近くを省略できる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:57:44 GMT)
ArrythML: An Autoencoder-Based TinyML Approach for On-Device Arrhythmia Detection on Resource-Constrained Embedded Systems [0.1] 本稿では,Tiny Machine Learning(TinyML)モデルを用いたECGセグメンテーションと不整脈検出の手法を提案する。
これらのモデルは、MIT-BIH Arrhythmia Databaseから派生したカスタムデータセットを用いて評価され、PCベースのシミュレーションとオンデバイス環境の両方で検証される。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:43:30 GMT)
Normality-Preserving Continual Industrial Anomaly Detection via Orthogonal LoRA Banks [0.1] 2つのモジュールをベースとした正規性保存連続異常検出フレームワークを提案する。
HF-OLBはトレーニング済みのU-Netバックボーンと学習済みのLoRAバンクの両方を凍結する。
HNABGは層依存性の残余容量を割り当て、残余の正規性が既存の銀行の表現能力を超える場合にのみ銀行を拡大する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:30:42 GMT)
When Rating Scales Fall Short: LLM-Assisted Discovery of ADHD Signals in Turkish Teacher Narratives [0.1] 注意欠陥多動性障害(ADHD)は、小児期で最も一般的な神経発達障害の1つである。
Conners' Teacher Rating Scale-Revised Short Form (CTRS-R:S) のような構造化された楽器はADHD関連の振る舞いを定量化する一方で、教師はオープンな物語も提供する。
教師の物語が、評価尺度で見過ごされるシグナルをエンコードしているかは、まだ不明である。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:22:38 GMT)
AgentRedBench: Dynamic Redteaming and Integration-Aware Defense for LLM Agents over SaaS Integrations [0.1] ツール・ユース・エージェントへの間接的なプロンプト・インジェクションは、具体的な生産上の脅威である。
AgentREDBENCHは、215の微妙な未特定認可シナリオのベンチマークである。
AgentREDGUARDは、逆ツール-レスポンスコンテンツの統合多言語コーパスで訓練されたガードである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:34:24 GMT)
Deep Learning for Remote Sensing to Improve Flood Inundation Mapping [0.1] 本稿では,拡散確率モデルに基づく洪水画像のクラウド除去フレームワークを提案する。
現実的な雲のパターンでマルチスペクトルのSentinel-2B洪水シーンで訓練されたこのモデルは、クラウドフリーの画像実現を生成する。
以上の結果から,光フラッシャモニタリングにおいて,拡散に基づく生成モデリングがクラウド除去の頑健かつ物理的に一貫した代替手段となることが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:28:48 GMT)
POIROT: Interrogating Agents for Failure Detection in Multi-Agent Systems [0.1] システム独自のエージェントを診断層として再利用するプロトコルであるPOIROTを提案する。
評価された設定全体で、POIROTは単一LLMベースライン評価器より優れている。
我々は,安全クリティカルなマルチエージェントシステムにおけるフォールト属性のベンチマークであるBLAMEとともに,オープンソースのライブラリとしてPOIROTをリリースした。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:05:35 GMT)
Sensitivity Enhancement of S-Band Rydberg Atom Microwave Receiver Using Resonant Cavity [0.1] ライドバーグ原子をベースとしたマイクロ波電場センシングは、その固有の利点から関心が高まりつつある。
感度を制限する重要なボトルネックは、レイドバーグ原子と入射マイクロ波場の間の非効率な結合である。
本研究では, ホルンアンテナと共振マイクロ波空洞を統合し, この結合性を大幅に向上させる手法を提案し, 実験的に検証した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:25:57 GMT)
Iterative $C_Z$-gate-based protocol for squeezed Schrödinger cat state engineering [0.1] 猫の状態の生成と操作のための計測支援ゲートを提案する。
提案したゲートは、制御可能なサイズで高忠実度圧縮されたシュルディンガー猫状態の生成を可能にする。
このアプローチは、測定ベースの量子コンピューティングとハイブリッド量子ネットワークの応用に適している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:58:00 GMT)
Agent Operating Systems (AOS): Integrating Agentic Control Planes into, and Beyond, Traditional Operating Systems [0.0] 本稿ではエージェント制御プレーンを既存のオペレーティングシステムに統合するシステムアーキテクチャであるエージェントオペレーティングシステム(AOS)の概念を紹介する。
我々は、AOSの正確な定義、明示的な仮定と非ゴール、およびAOSの責務をスケジューラ、コンテキストとメモリ管理、ツールと能力登録、ポリシーと信頼の執行、可観測性と監査に構造化した分解を提供する。
本稿では,エージェント固有の脅威モデルを含むセキュリティと安全性について論じるとともに,決定論的強制,監査可能性,操作者の理解性を重視した評価基準を定義する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 00:08:03 GMT)
PortBERT: Navigating the Depths of Portuguese Language Models [0.0] PortBERTはRoBERTaをベースとしたポルトガル語の言語モデルである。
450GB以上のデコプリケートされたmC4とOSCAR23を、fairseqを使ってCulturaXからゼロからトレーニングした。
どちらのモデルも、既存の単言語モデルと多言語モデルに一致するか、あるいは超えるように競合的に実行する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:32:02 GMT)
When Tabular Foundation Models Transfer Across Modalities: A Systematic Evaluation Across 95 Datasets, 7 Modalities, and Two Regimes [0.0] パイプラインは、同じ凍結した機能で強力な軽量チューニングベースラインと幅広い競争力がある。
非常に優れた専門的なモデルや、すべてのタスクで高度に調整されたパイプラインとは一致しないが、近いままであり、非常に高速で、通常はフルバックボーンの微調整よりも4倍から200倍速く、しばしば同等の品質で動作している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:36:20 GMT)
When Helping Hurts and How to Fix It: Multi-Agent Debate for Data Cleaning [0.0] 論議の効果は逆で、批判によって引き起こされる混乱によって生成が低下する。
議論は、間違ったアウトプットを回収する確率が正しいアウトプットを破壊する確率を超える場合に有効である。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:29:47 GMT)
When Do Attention Circuits Form? Developmental Trajectories of Capability and Attention-Sink Emergence Across Three 1B-ClassArchitectures [0.0] 我々は,3つの1Bクラス言語モデルにおけるアテンションヘッド回路形成の発達軌跡を追跡する。
参加比(PR)スペクトル信号と全頭部能力特異的選択性画面を適用して,頭部の出現をトラッキングする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:26:23 GMT)
What You Approve Is What Executes: Consent Integrity for Black-Box LLM Agents [0.0] コーディングエージェントは、ヒューマン・イン・ザ・ループの承認ダイアログの背後で連続的なアクションをゲートするが、ダイアログはエージェント自身によってナレーションされる。
本稿では、エージェント承認チャネルにWhat You See Is What You Signをインポートすることで、欠落したプロパティであるIntegityを命名する。
人間に示されるアクションは、エージェントのナレーションではなく、境界における実際のアクションから信頼できる仲介者によってレンダリングされなければならない。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:08:17 GMT)
Vector Magnetometry with Broadband Microwave Fields in Nitrogen-Vacancy Centers in Diamond [0.0] 窒素空孔(NV)中心を用いた全ベクトル磁気学の新しい手法を提案する。
従来の光検出磁気共鳴法とは対照的に、2つの異なるブロードバンドマイクロ波パルスを用いる。
本手法は, 磁場ベクトル成分の異なる5thrmpT/sqrtmathrmHz$と100thrmpT/sqrtmathrmHz$の感度を推定する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:13:22 GMT)
Unpredictable Safety: Domain-Dependent Compliance and the Transparency Gap in Open-Weight LLMs [0.0] オープンウェイトLLMにおけるドメイン依存型安全挙動について検討する。
コンプライアンス率は14.7%(人身売買)から85.7%(監視設計)に変化している。
その結果、現在の安全メカニズムには、信頼できるAIデプロイメントに必要な透明性と一貫性が欠如していることが示されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:41:32 GMT)
Uncertainty-Aware Graph Neural Reconstruction of Urban Temperature Fields from Sparse Sensors under Deployment Constraints [0.0] 本研究では,スパースセンサから日次最大温度場を再構築するための不確実性対応グラフニューラルネットワーク(GNN)フレームワークを提案する。
このフレームワークはデイメット v4.1 の日温データ (1 km 分解能) を用いてモントリオールのポリゴン上で厳密な時間保持プロトコルで評価される。
センサ予算(10~40センサー)全体にわたって、提案したGNNは、逆距離重み付けと通常のリグよりも一貫して優れている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:28:23 GMT)
Tridirectional Discriminating-Power Formal Verification of Smart Contract Reentrancy Defense Against Production-Deployed Solidity Source [0.0] OpenZeppelinのReentrancy-guardパターンの最初の正当性証明は、プロダクションデプロイされたSolidityソースのLean 4ステートマシンモデルに対するものだ。
スマートコントラクトの継続は2016年以降、記録された損失として5億ドル以上を突破した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:13:39 GMT)
Tracking the Behavioral Trajectories of Adapting Agents [0.0] 本稿では,テキスト埋め込みモデルの埋め込み空間における特徴を方向として定義することにより,エージェント$traits$を測定する手法を提案する。
我々は、特徴ベクトルを学習するためにラベル付き"before"と"after"のスキルファイル差分に対して線形モデルを訓練し、そのベクトルに埋め込み差分を投影することで任意のスキル編集を行う。
我々は,この特性評価をエージェント・ツー・エージェント・プロトコルに組み込んで,信頼できる仲介者を通じて,あるエージェントが他のエージェントのスキルファイルの更新を評価できるようにする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:40:31 GMT)
Toward a Modular Architecture for Embedded AI Agent Systems at the Edge [0.0] 本稿では,組み込みエージェントシステムのためのモジュール型参照アーキテクチャを提案する。
On-Device AgentsとCloud-Augmented Agentsを分離するタイレッドデザインを導入する。
重要な貢献は、横断的なガバナンス層の統合である。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:24:18 GMT)
Theoretical Aspects of Lie Groupoid and Lie Algebroid Equivariant Convolutional Neural Networks [0.0] リー群体同変ニューラルネットワークは、リー群体持ち上げ畳み込み層とリー群体畳み込み層から構成される。
上記の各層は、最近導入された許容圏同変層の特別な場合であることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:23:34 GMT)
The Main Barrier to AI Adoption in the Public Sector is Lack of Training: How a Structured Method Increased Productivity in Two Brazilian Government Cases Without Incidents [0.0] 公共部門における生成的人工知能の導入は、主に技術的問題として扱われてきた。
本稿では,ブラジル公務員が実施する採用に対する決定的障壁は技術ではなく,訓練に関するものであることを論じる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 00:41:58 GMT)
The Epi-LLM Framework: probing LLM behavioral priors through epidemiological agent-based models [0.0] 本稿では,エージェントベースのモデリング,実生活のエピガメ,大規模言語モデルの新たな統合であるEpi-LLMフレームワークを紹介する。
4 つの異なるアーキテクチャにまたがる LLM 薬剤はピークの能動感染を減少させることがわかった。
二項一般化線形モデルは、健康の重大さが検疫行動の最も強い予測因子であることを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:31:06 GMT)
The Biomimetic Architecture of Software 4.0 [0.0] 本稿では,ヒューマンインテリジェンス,ニューラルAI,反射的シンボリック基質の自己表現的ヘテロ構造であるSoftware 4.0を紹介する。
このアーキテクチャを実現するためのプログラミング言語とプラットフォームであるRecognitiveを紹介します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:23:45 GMT)
Testing the ${\rm ER=EPR}$ conjecture with entangled photons [0.0] Aichelburg-Sexl 衝撃波計を無質量粒子の正則化する。
重力自己エネルギーは光子の長手範囲に依存することを示す。
光子の場合、対応する崩壊時間は1030ドルを超える。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:50:24 GMT)
Terminal Time and Angle-Constrained Nonlinear Intercept Guidance [0.0] 単一の制御入力により、非線形エンゲージメントキネマティクスは本質的に不活性化される。
2つの端末制約を同時に規制するために,階層的スライディングモードに基づくガイダンス法を開発した。
可変ゲイン適応誘導法は、静止目標に対する時間と角度に制約されたインターセプションを保証するように設計されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:37:08 GMT)
TechGraphRAG: An Agentic Graph-Augmented RAG Framework for Technical Literature Reasoning [0.0] 本稿では,ドメイン固有の技術的推論支援のためのエージェント検索強化世代(RAG)フレームワークを提案する。
提案アーキテクチャでは、クエリを意図的に分類する13ステップの自律パイプラインを使用し、多次元のルーリックに対して十分な証拠をスコアし、外部の学術データベースを検索する。
このフレームワークは、エージェント的でエビデンスを基盤としたRAGが、大規模でドメイン固有のコーパスに対する文学ナビゲーションと技術的推論をどのようにサポートするかを示す、実践的で実践的なケーススタディとして提示されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:01:51 GMT)
TLG: Temporal-Logic Grounding for Video Question Answering via Source-Annotation Reconstruction and Category-Targeted Reasoning [0.0] TimeLogic Challengeはビデオ上での時間的論理的推論を評価する。
エンド・ツー・エンドのビデオ言語モデル(VLM)は、動画をフレームの袋として扱い、アクションの発生時にローカライズできないため、このタスクでほぼチャンスを逃す。
TLG(Temporal-Logic Grounding)は、ベンチマークが生成した公開ソースデータセットアノテーションから、各ビデオのアクションタイムラインを再構築する3層システムである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:40:25 GMT)
TERRA: Task-Embedded Reasoning and Representation Architecture for Cross-Domain Applications [0.0] 単一の動作条件付き潜伏予測アーキテクチャは、運転シーン、ロボットワークスペース、金融注文帳の構造状態に基づいて訓練することができる。
ある構造化状態領域で学習された表現や予測器が、構造的に類似しているが、そうでなければ無関係な領域、そしてどれだけの量で受け継がれるのか。
次数付き潜在格子上で各ドメインを制御マルコフ過程としてモデル化し、任意のインスタンス化を薄いドメインアダプタと共有ドメイン不変コアに分解し、近似マルコフ決定プロセス準同型とクロスドメイン対応を同定する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 00:50:59 GMT)
Structure-Aware Prediction of PROTAC-Mediated Protein Degradability via Graph Neural Networks [0.0] 本稿では,タンパク質構造とE3リガーゼの同一性のみからproTACを介する分解性を予測するグラフニューラルネットワークであるDegradoMapを提案する。
このモデルは、タンパク質ごとの正規化を伴うリジン重み付きグラフプールを通じて、生物物理学上の先行情報を符号化する。
CRBN->VHL E3-unseenTransferでは0.646+-0.124AUROC、0.811AUROCを達成している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:39:22 GMT)
State-Coupled Volatility in Latent Dynamical Systems: Recovery Under Partial Observation [0.0] 我々は,潜在過程の変動が潜在平衡からの変位に依存する状態結合ボラティリティの枠組みを導入する。
その結果, 部分観察により, 状態結合ボラティリティを同定し, 推定できることが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 10:00:26 GMT)
SpliceBind: Isoform-Aware Prediction of Binding Pocket Druggability [0.0] ブリッジングを意識した薬物性予測のためのグラフニューラルネットワークフレームワークを提案する。
5つのメカニズムのクラスにまたがる6つの臨床的に検証された変異の系統解析により、二層耐性分類が明らかとなった。
25のファミリーにまたがる229個のキナーゼポケットで、SpliceBindはAUROC 0.703を安定して保留する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:21:24 GMT)
Spin Correlations in Two-Particle Systems: A Pedagogically Motivated Comparison of Computational Approaches [0.0] 本稿では、2つのスピン-1/2$の粒子からなる量子系におけるスピン相関計算の教育的動機付け分析について述べる。
我々の目的は、 $langle | S(1)_hatboldsymbolu S(2)_hatboldsymbolv | rangle$ という形の期待値を評価するための様々な戦略を明確にし、注目することである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:11:47 GMT)
Spatial and particle-particle entanglement in 1D quantum walks of two distinguishable or indistinguishable bosonic particles [0.0] 本研究では,ハバード・ハミルトニアンによって支配される一次元の2次元連続時間量子ウォークにおいて,空間的に分離された領域間の絡み合い,および2つの区別不可能な粒子間の絡み合い対策について述べる。
分離, 絡み合い, 二重占有した初期状態を用いて, 異なる絡み合い対策における初期絡み合いと次の成長について検討した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:16:10 GMT)
Smooth velocity shuttling for suppressing valley excitations in disordered Si/SiGe quantum dots [0.0] ケイ素量子ビットでは、非断熱的なバレー状態への遷移はスピンデファス化を引き起こす。
本稿では,これらの谷の励起を抑えるためのスムーズな速度遮断プロトコルを提案する。
我々の結果は、この単純かつ制御レベルな速度整形が、高忠実度スピン輸送への堅牢な経路を提供することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:42:52 GMT)
Self-Regulation through Communication in Evolved Neural Agents [0.0] コミュニケーションは,他者への情報伝達だけでなく,発信者の行動制御に役立てることができることを示す。
進化したCTRNNエージェントのペアが通信を頑健な生存に利用する,最小限の捕食者回避タスクを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:04:50 GMT)
Self-Regulating Annealing in Heavy-Tailed Diffusion Models [0.0] 状態依存拡散係数を明示的に組み込んだヘビーテール拡散モデル(HTDM)のためのSDEベースのサンプリング器を提案する。
重み付き分布から試料を再生する必要性を実験的に検証した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:52:08 GMT)
Self-Conditioned Positional HNSW for Overlap-Aware Retrieval in Chunked-Document RAG Systems: Method and Industrial Evidence-Quality Audit [0.0] チャンク文書検索は、検索拡張生成システム(RAG)の一般的なコンポーネントである。
本稿では,低次元の位置符号をチャンク埋め込みに付加する軽量な修正法であるSelf-Conditioned Positional HNSWを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:42:55 GMT)
ScoreStop: Gradient-based early stopping using functional score tests [0.0] 本稿では,現在予測器が人口リスク最小化器であるというヌル仮説のテストとして,各イテレーションで停止決定を行う勾配に基づく早期停止則を提案する。
我々のテストでは損失値よりも勾配を用いるため、LambdaRankのような暗黙的な検証損失や、影響関数によるCox回帰のようなデータ依存的な損失にも、同じ構成が適用されます。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:05:22 GMT)
Scalable Uncertainty Quantification for Extreme Weather Forecasting via Empirical Neural Tangent Kernels [0.0] ディープラーニングの天気モデルでは、数値的な天気予報の精度が向上し、桁違いの精度が向上した。
しかし、不確実性予測のない決定論的予測は、極度の気象イベントにおける高い意思決定に重要なギャップである。
本稿では,最後の層的経験的特徴を用いたニューラル・タンジェント・カーネルに基づく不確実性定量化(NTK-UQ)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:57:06 GMT)
Scalable Inference-Time Annealing with Surrogate Likelihood Estimators [0.0] 計算化学と生物物理学における長年の課題は、ボルツマンの分子分布を効率的にサンプリングすることである。
従来のサンプリング手法の限界に対処するために、生成モデリングの進歩が提案されている。
本稿では,フローベースモデルを再学習し,徐々に低い温度でサンプルを生成する拡張型推論時間アニール法(SITA)を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:34:26 GMT)
SCOPE: Real-Time Natural Language Camera Agent at the Edge [0.0] SCOPE(知覚と評価のためのシミュレーションとカメラ操作)
本稿では,PTZカメラ制御と視覚的シーン理解のためのモジュールエージェントSCOPEについて述べる。
我々は、Blenderベースのシミュレーション環境で、QA、単一言語カウント、カウント、空間推論、説明、光学文字認識にまたがる536タスクのベンチマークをリリースする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:07:44 GMT)
Role of System-Bath Interaction in Non-Markovian Quantum Brownian Otto Cycles [0.0] 有限時間量子オットーサイクルにおいて、動作媒質が量子ブラウン運動を受ける高調波発振器である。
等方的過程における相互作用エネルギーの変化は、仕事と熱の両方に寄与する。
特に、オットーサイクルがエンジンとして動作するとき、相互作用エネルギーの効果は仕事の出力を減らすことである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:12:26 GMT)
Robust Frequency-Calibrated Virtual EEG Channel Generation from Four Frontal Electrodes for Wearable EEG Augmentation [0.0] FAVC-Netは、Fp1, Fp2, F7, F8から13個の未測定EEGチャネルを生成する。
このモデルは、共有マルチスケールソース符号化、ソース状態埋め込み、ターゲット条件付き署名されたソースブロック混合、GATv2ベースのアテンション改善、アテンション一貫性のあるスキップ融合、弱いウェルチ電力スペクトルのキャリブレーションを組み合わせたものである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:27:05 GMT)
Riemannian Gradient Descent for Low-Rank Architectures [0.0] アルゴリズム設計空間における10点について検討する。
提案手法を小言語モデルにおけるマルチヘッドアテンションパラメータに適用する。
我々の手法はAdamWベースラインを決定的に上回らない。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:40:00 GMT)
Revisiting the Quantum-Guided Cluster Algorithm: Improvements and Numerical Experiments [0.0] 我々は,Max-Cut問題を解くための相関誘導クラスタアルゴリズムについて検討した。
我々は,Next-nearest-neighbor (NNN)情報を組み込むことで,クラスタ構築を拡張した。
相関型マルコフ連鎖モンテカルロアルゴリズムへの拡張についても概説する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:41:46 GMT)
Resonant delay in a stationary quantum clock: Lifting the threshold mask [0.0] 我々は、位相感受性散乱観測可能なSalecker--Wigner--Peres定常量子時計を再検討する。
魅力的な正方形井戸では、この閾値は消滅する外運動量と関連する散乱マッチングから継承される。
我々は、正方形井戸の正確な定常時計時間を導出し、新しいしきい値引き時計を観測可能とした。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:00:05 GMT)
Regime-Arrival Uncertainty in Generalization Bounds under Distribution Shift [0.0] 本稿では,システム構成ミスマッチによる余剰リスクを定量化することで,レシック・アウェア・モデルを一般化するフレームワークを提案する。
我々は正確な分解を行い、状態のミスマッチと状態の感度を分離する。
提案したペナルティは,事前の一般化ギャップであり,トレーニング専用推定器では有意な相関は示されていない。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:04:42 GMT)
Recovering Direct Price Effects of Environmental Amenities in Housing Markets: Regression and Causal Machine Learning Model Assessment with Empirical Monte Carlo Simulation [0.0] ヘドニック価格モデルは、環境アメニティが資産価値にどのように影響するかを評価するために広く利用されている。
本研究では,モンテカルロシミュレーションを用いて,従来の機械学習手法と因果機械学習手法の性能評価を行う。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:59:44 GMT)
Rank-Constrained Deep Matrix Completion for Group Recommendation [0.0] Group Rank-Constrained Deep Matrix Completion (Group RC-DMC)は、Set-Transformerアグリゲータを介してグループレベルの表現学習を統合することでRC-DMCを拡張する新しいフレームワークである。
既存のグループレコメンデータシステムとは異なり、グループRC-DMCは明示的な低ランク正規化、線形エンコーダデコーダアーキテクチャ、注意に基づく非線形グループモデリングを統一する。
MovieLens と Goodbooks のデータセットによる実験結果から,グループ RC-DMC は低いグループ RMSE で測定され,より優れた再構成精度が得られることが示された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:09:46 GMT)
Quantum resonance encryption for secure data storage and communication with quantum kicked top [0.0] プロトコルは、量子共鳴状態で動作するスピン系の力学である量子キックトップに基づいている。
認証されたユーザに対して完全なリカバリを保証し、インターセプトされた状態を盗聴者に混入させ、タンパ検出を内蔵している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:13:16 GMT)
Quantum optimal control of the Dicke manifold in Rydberg atom arrays [0.0] 我々は,多体系の量子状態を設計し,制御する能力について検討する。
N$ qubits のレジスタに対して、ヒルベルト空間次元は指数関数的に 2N$ になる。
局所アドレスをほとんどあるいは全く持たない制御方式に勾配上昇パルス工学(GrAPE)を実装した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:06:14 GMT)
Quantum Simulation of Nucleon-Antinucleon Interaction in Large-$N$ QCD$_2$ on an IBM Quantum Nighthawk Processor [0.0] 我々は,IBM Quantum Nighthawkプロセッサ上での大規模N$2次元量子色力学における核子-反核子相互作用の量子シミュレーションを報告する。
大きな$N$の極限において、QCD$は、バリオンが有効メソニック場理論のトポロジカルソリトン(キンク)として現れるボゾン化された記述を認めている。
これらの非ユニタリ弦作用素の条件エネルギーから構築されたシンク-アンティキンク相互作用ポテンシャルを量子ハードウェアから頑健に抽出できることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:58:37 GMT)
Quantum Dynamics of a Particle in a Linear Potential: Invariant Operator Approach and Discrete Spectrum Solutions [0.0] 線形ポテンシャルを受ける粒子の量子力学をルイス-リースフェルト不変作用素法を用いて検討する。
不変係数、変位パラメータ、変換波動関数の明示的解析式を得る。
結果として得られる形式主義は、定数力の下で粒子の正確な量子的記述を与える。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:44:09 GMT)
Quantitative Movement Testing: Measuring Patient Movements from a Single Smartphone Video [0.0] 慢性的な痛みは機能能力の低下によって生活の質を低下させる。
光モーションキャプチャは、変化した動きの質を評価するための高精度を提供する。
我々は,標準的なモノクラースマートフォンビデオから3Dキネマティックバイオマーカーを抽出するコンピュータビジョンパイプラインを開発した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:23:17 GMT)
QUIVER: Quantum-Informed Views for Enhanced Representations in Large ML Models [0.0] 我々は、量子フィッシャービューで古典的なデータ駆動機能を強化するパラダイムであるQUIVERを紹介する。
QUIVERは2つのベンチマークデータセットの標準的なパフォーマンス指標を、非常に異なる分野から改善することを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:50:28 GMT)
Pseudospectral Bounds for Transient Amplification in Coupled Gradient Descent [0.0] ブロック三角形ヤコビアンに対する擬スペクトル理論を開発する。
Kreiss 定数は、対角ブロックがスペクトル半径で最大 1$ の対称であるとき、$K(J) leq 2/ (1-) + |C|/(4 (1-))$ を満たすことを示す。
線形四元数問題、IQCに基づく比較、ニューラル・ネットワーク・トレーニングの実験は、この理論を裏付けるものである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:42:04 GMT)
Probing information theoretic measures of nonlinear ultracold quantum gases using phase-space distributions [0.0] 我々はグロス・ピタエフスキー方程式によって記述されたボース-アインシュタイン凝縮体を調和的に捕捉する。
平均場基底状態の波動関数から、分布とその位置と運動量空間の境界の両方を構築する。
強い反発相互作用は位相空間の非局在化を促進する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:21:19 GMT)
Probabilistic Data-Driven Modelling of Astrophysical Transients: The Neural Process Family for Ultrafast and Class-Agnostic Light Curve Reconstruction with NightLANP [0.0] 光曲線再構成のためのニューラルプロセスファミリーを導入する。
最適化されていなくても、Attentive Neural Processがすべてのベンチマークを一貫して上回っていることを示す。
我々のモデルは、全てのバンドをマイクロ秒で同時に補間し、次の最強のニューラルベンチマークよりも4桁以上高速である。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:48:58 GMT)
Prior Availability in Industrial Visual Sim-to-Real: A Review of CAD-Guided and CAD-Unavailable Regimes [0.0] 産業的なビジュアル・シム・トゥ・リアル(英語版)は、しばしば利用可能な証拠と必要な決定のより大きなミスマッチを伴う。
このレビューでは、産業用ビジュアル・シム・トゥ・リアルを、事前可用性によって構成されたドメインギャップ問題として再検討する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:22:35 GMT)
Position: Deployed Reinforcement Learning should be Continual [0.0] 最適性に欠けるエージェントをデプロイすることは、本質的に連続的なRL問題である、と我々は主張する。
デプロイ後、絶え間ない学習を必要とする4つの非定常性ソースを特定し、最高のデプロイエージェントが適応をやめない理由を強調します。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:40:10 GMT)
Places in the Wild: A Large, High-Resolution RAW Photograph Dataset for Ecologically Valid Vision Research [0.0] Places in the Wild』は、67,574枚の高解像度写真を、260の基本的なシーンカテゴリにまたがる810の物理的な場所から収集したデータセットである。
45メガピクセルのキヤノンEOS R5はパノラマ三脚に搭載され、72枚の画像を5度の水平間隔で撮影し、12枚の画像を様々な高度で撮影した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:51:20 GMT)
PillarDETR: YOLO-Backbone and RT-DETR Head for Real-Time 3D Object Detection [0.0] リアルタイム3Dオブジェクト検出は、自律運転システムとロボティクスの安全な操作にとって重要な要素である。
従来の手法は複雑な3D畳み込みやアンカーベースのパラダイムに依存しており、検出精度と推論速度のバランスをとるのに苦労している。
我々は、柱型LiDAR符号化の効率と現代の2次元視覚モデルの表現力を組み合わせた、新しいエンドツーエンドの3Dオブジェクト検出アーキテクチャであるPillarDETRを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:22:47 GMT)
Physics-Informed Residuals for Adaptive Mesh Refinement in Finite-Difference PDE Solvers [0.0] 本稿では,物理インフォームドニューラルネットワーク(PINN)を最終解法ではなく,適応メッシュ改良のためのオフグリッド残差プローブとして用いるハイブリッド戦略について検討する。
PINN残基はドメイン上でサンプリングされ、セルワイズインジケータに変換され、最終近似が有限差分ソルバによって計算される前に精製を誘導するために使用される。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:47:21 GMT)
Photonic Analog Quantum Simulation of (1+1)-Dimensional $U(1)$ Lattice Gauge Theory with Dynamical Matter [0.0] 本稿では, 動的物質を用いた$U(1)$ Lattice Gauge Theory (LGT) のアナログ量子シミュレーションのためのフォトニックスキームを提案する。
本稿では,JCHモデルのリアルタイム進化が,量子リンクモデルの進化を正確に再現していることを示す。
これは、高次元の物質を持つ格子ゲージ理論のリアルタイム力学を理解するための新しい経路を提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:22:29 GMT)
Parameter-Efficient Fine-Tuning of Large Pretrained Models for Instance Segmentation Tasks [0.0] 本研究では,PEFT法,特にアダプタとローランド適応(LoRA)の有効性について検討する。
トランスブロック毎に2-3アダプタを使用すると、性能と効率のバランスが最適になる。
LoRAは、変形可能な注意に適用されると強力なパラメータ効率を示し、場合によってはアダプタ構成を超えている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:09:32 GMT)
One Transit Is All You Need: Detecting Exoplanets Through Learned Stellar Behaviour with EXOVEIL [0.0] EXOVEILは、星の明るさがどう見えるべきかを学習し、現実が一致しないときにフラグを掲げるトランジット検知システムです。
16,499のケプラー光曲線でトレーニングされたトランスフォーマー世界モデルでは、トランジットマインドした自己教師付き学習が期待される恒星のフラックスを予測する。
分散重み付けを備えたマッチングフィルタ検出器は、予測残差からトランジット信号を抽出する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:41:10 GMT)
Nielsen complexity with multiple cost factors [0.0] 一つのペナルティが群多様体のハード方向と容易に区別できるような標準的な枠組みを拡張する。
修正されたオイラー・アルノルド方程式とヤコビ方程式を導出し、複数のコスト因子が共役点の構造とスケーリングをどのように再構成するかを研究する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:33:40 GMT)
Neural Posterior Estimation for Stochastic Epidemic Models Using Final Outcome Data [0.0] フィードフォワードニューラルネットワークによってパラメータ化されたlogNormal 後部近似は,様々な人口規模や送信体制で参照後部を正確に復元することを示す。
合成データセットと実際のアウトブレイクデータセットの両方のパフォーマンスは、一貫して強い。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:40:27 GMT)
Network Learning with Semi-relaxed Gromov-Wasserstein [0.0] 大規模ネットワークの生成メカニズムを推定することは、機械学習における根本的な課題である。
確率的結合を許容し、代入問題を緩和することで、この問題に対処する。
我々のフレームワークは半相対的グロモフ=ワッサーシュタインの目的として定式化することができ、生成構造の低次元表現を提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:21:17 GMT)
Negative Interaction Quench Dynamics of Density-Ordered Dipolar Bosons in a One-Dimensional Optical Lattice [0.0] 負の相互作用クエンチに続く有限1次元光学格子における密度秩序付き双極性ボース気体の非平衡ダイナミクスについて検討する。
顕著な発見は、強い動的応答にもかかわらず、基礎となる結晶状態とクエンチとの相関の堅牢性である。
本研究では, 相互作用クエンチと格子深さの傾斜とを組み合わせることで, 動的工学の制御が可能となることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:30:57 GMT)
Multimodal Approaches for Visually-Rich Document Type Classification: A Comparative Analysis [0.0] マルチモーダルトランスフォーマーは、視覚的にリッチでレイアウト集約的なドキュメントに対するLCMベースのアプローチより優れている。
画像情報は信頼性の高い分類に最も強く寄与する一方、OCRから派生したテキストは有用なが二次的なサポートを提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:24:26 GMT)
Multidimensional Reconciliation in Continuous-Variable QKD: Review, Coding Schemes, and Open Source Simulation [0.0] 多次元和解は低信号対雑音比と長距離での運用の課題に対処する。
本稿では,仮想チャネルの構築,逆整合のための実用的な符号化手法の議論,線形誤り訂正符号の統合について述べる。
本稿では,任意の次元に対して多次元整合性を実装したオープンソースのシミュレーションフレームワークであるHDiracについて述べる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:36:12 GMT)
Maximizing Information Flow in Three-Coin Quantum Walk: from Initial Entanglement to Integrated Photonic Implementation [0.0] 3枚の絡み合ったコインで動きを制御する1次元格子上に歩行器を導入する。
コインと位置の間の相互情報$I(C;P;t)$を計算する。
本研究は,情報フローと空間拡散を最大化するための動的資源として,三部交絡を確立した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:49:47 GMT)
Market-Based Replanning for Safety-Critical UAV Swarms in Search and Rescue Missions [0.0] SAR(Search and Rescue)ミッションにおける信頼性の高い自律型UAV群は、エージェントの劣化にもかかわらず、動作を持続できるフォールトトレラント調整を必要とする。
本稿では,資源制約環境向けに設計された分散協調アーキテクチャであるIntelligent Replanning Drone Swarm (IRDS)を紹介する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:33:15 GMT)
Magneto-optical characterization of GeSn and GeSn/SiGeSn heterostructures [0.0] ゲルマニウム(Ge)系ヘテロ構造におけるホールスピン量子ビットは、スケーラブルな量子情報処理の可能性を示している。
ゲルマニウム・チン(GeSn)の材料プラットフォームは直接バンドギャップを備えており、量子ネットワークのためのスピン光子インターフェースを確立することを約束している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 01:13:50 GMT)
Magnetic control of electron scattering in silicene quantum dots [0.0] 垂直磁場を受けるシリセン量子ドットの電子拡散機構を解析した。
空間局在性を高めるために,シリセン特有のスピン軌道結合(SOC)を利用して自然エネルギーギャップを発生させる。
シミュレーションにより, この内在ギャップの存在はSQDの中心における電子トラップを著しく向上させることが示された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:02:52 GMT)
Machine Learning-based Quantum Error Mitigation for Variational Algorithms [0.0] 機械学習に基づく量子エラー軽減(ML-QEM)は、ノイズの多い量子アルゴリズムの性能向上のための有望なアプローチとして登場した。
本稿では、(近傍)クリフォード回路をシミュレートしてトレーニングデータを生成する変動量子アルゴリズムに適した実用的なML-QEMプロトコルを提案する。
我々は、様々なノイズモデルの下で最大$n=12$ qubitsのシェリントン・カークパトリック・ハミルトンの変分量子固有解法(VQE)タスクに関する提案手法をベンチマークし、訓練性への影響を分析し、標準のゼロノイズ外挿法(ZNE)と比較した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:00:00 GMT)
Machine Learning-Driven Chemical Reactor Network Modeling of the Sandia-D Flame [0.0] 乱流燃焼シミュレーションは多くの科学・工学系にとって不可欠である。
等価反応器ネットワーク(ERN)アプローチは、多次元乱流シミュレーションをより安価な0-Dと1-Dの反応器に置き換えることで、計算効率を向上させる。
本研究では,サンディアD乱流メタン/空気火炎のERNを構築するための機械学習支援フレームワークを開発する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:52:12 GMT)
Machine Learning for Coding Retail Product Names to Consumer-Price Categories: A Rule-plus-Bag-of-Words Pipeline with Reliability-Weighted Human-in-the-Loop Labeling [0.0] 本稿では,一般的な再現可能な手法としてのマッピングについて検討する。
我々は、アノテータが二項有効/再帰の判断を下す、Human-in-the-loopプロトコルを使用する。
モンテカルロのラベリングプロトコルに関する調査では、信頼性に富んだ投票がほぼ多数派を圧倒している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:59:29 GMT)
MASER: Modality-Adaptive Specialist Routing for Embodied 3D Spatial Intelligence [0.0] 3D環境では、身体的エージェントは、モダリティの混合から推論することで、空間的に関係のある質問に答える。
我々は、共有VLMバックボーンの5つの異なるモダリティアダプタを訓練し、ニューラルルーティングポリシーを学習するフレームワークであるMASERを提案する。
提案手法をOpen3D-VQAベンチマークで評価した結果, 単一のモダリティが普遍的に最適でないことが示された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:36:21 GMT)
Learning Coherent Representations: A Topological Approach to Interpretability [0.0] ディープニューラルネットワークは、個々の特徴が解釈可能な意味を欠く表現を学ぶ。
コヒーレンス(Coherence)は、脳内の神経コーディングにインスパイアされた幾何学的特性であり、格子細胞のようなニューロンは、状態空間の連続した領域に反応する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:05:58 GMT)
Learning Chaotic Dynamics through Second-Order Geometric Supervision [0.0] 軌道とヤコビアン(一階)マッチングはベクトル場の値と接構造を監督する。
2階の整合性を強制することはこれらの失敗を緩和するが、フルヘッセンを形成することは高次元では禁じられている。
乱摂動入力における真ベクトル場と学習ベクトル場のヤコビアンを比較するモデル制約付きランダム化ヤコビアンマッチングを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:50:42 GMT)
LayerRoute: Input-Conditioned Adaptive Layer Skipping via LoRA Fine-Tuning for Agentic Language Models [0.0] LayerRouteは、インプット毎にトランスフォーマーブロックを選択的にスキップする方法を学習する軽量アダプタである。
1)ストレートスルー推定器を介してハードバイナリゲートを出力する層間ルータと、(2)Q/K/V/Oアテンションプロジェクション上のLoRAアダプタ(ランク8,1.08Mパラメータ)である。
ゲート正規化項を持つエージェントデータ(Hermes, Glaive, GSM8K, Turing)の単一エンドツーエンドトレーニングパス
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:50:05 GMT)
Latent-Conditioned Parameterized Quantum Circuits as Universal Approximators for Distributions over Quantum States [0.0] 潜在条件パラメタライズド量子回路(LPQC)を導入する。
我々は、LPQCが1ドルワッサーシュタイン距離における密度演算子に対する確率測度に対する普遍近似であることを証明した。
混合量子状態の合成マルチクラスターアンサンブルと3次元分子構造のQM9由来アンサンブルに関する数値実験を行った。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:36:20 GMT)
It does what it says on the tin: safe synthetic data from coarsened margins [0.0] 本稿では、ユーザにとって重要な2つの利点を持つ合成データ(SD)を作成する方法を提案する。
SDを受信した人は、元のデータ内の変数間の関係のどれがSDで概ね維持されるかを知る。
このようなSDを作成するための実践的なステップは、1901年のスコットランド国勢調査のデータを用いて説明されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:32:10 GMT)
Is the most random pattern random? Maximizing localization in a two-dimensional lattice with engineered disorder [0.0] 強結合ハミルトニアンによって記述された2次元正方格子の1つの粒子と2次元正方形四角格子の2つのモデルにおける局所化について検討する。
本稿では,特にオンサイトエネルギーのパラメータを,局所化量子化パラメータを最大化するように慎重に選択する状況を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:13:36 GMT)
Inverse Critical Experiment Design via Gradient Optimization and a Multigroup Attention-Based Neural Network Architecture [0.0] 先進的な原子炉の設計と燃料の概念の検証には、ターゲット技術と高い中性子類似性を持つ実験が必要である。
深部ニューラルネットワークサロゲートモデリングと非パラメトリック勾配最適化を用いて、$c_k$を最大化する実験測地を生成する。
このアプローチは、先進的な原子力技術の発展を加速するために、ディープラーニングと勾配最適化の可能性を実証する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 21:19:18 GMT)
Information scrambling in all-to-all interacting models [0.0] 情報スクランブル(英: information scrambling)は、孤立した量子多体系における量子カオスと熱化の指標である。
von-Neumann と Rényi のエントロピーは急速に成長し,Haar-random 値付近で飽和し,効率的なスクランブルを示す。
初期成長期における最小相互作用次数に対するレニイ・1/2相互情報と絡み合う負性の関係を数値的に求める。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:07:50 GMT)
Information Hierarchy in Many-Body Berry Phase [0.0] 多体トポロジーは、現代固体理論における中心的な概念である。
この研究は、相互作用する多体基底状態の幾何学的情報が、有限個の局所相関から推測できる範囲について研究する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:20:41 GMT)
Improvise, Adapt, Overcome: An On-The-Fly Multifidelity Algorithm for Efficient Machine Learning [0.0] MFML(Multifidelity Machine Learning)は、豊富な低忠実度データとスパース高忠実度データを組み合わせる。
標準的なMFMLスキームは、フィデリティ間のスパースデータ比を決定するために、事前に定義されたスケーリング因子に依存している。
本稿では,学習データセットの構成を自律的に決定する機械学習のための適応型オンザフライ多忠実フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:26:24 GMT)
Human Factors in Cybersecurity in Icelandic Small and Medium-sized Enterprises [0.0] 本研究は,アイスランドの重要インフラプロバイダを含む公共および民間セクター組織におけるサイバーセキュリティの課題に関する調査の結果を報告する。
マネジメントの観点からは、ヒューマンファクターは組織のセキュリティに対する課題と障壁として強く注目された。
これらの課題には、適切なトレーニングや認識の欠如、雇用問題、サイバーセキュリティ文化の貧弱、時間や財務資源の制約などが含まれる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:02:29 GMT)
Hierarchical RBF-KAN and RBF-SKAN Architectures for Multidimensional Function Approximation and Random Field Learning [0.0] 本稿では,放射基底関数を活性化関数として用いた階層型コルモゴロフ・アルノルドニューラルネットワークアーキテクチャの提案と解析を行う。
具体的には、多次元決定関数近似のための階層的ラジアル基底関数Kolmogorov-Arnoldネットワーク(階層的RBF-KAN)とランダム場学習のための階層的ラジアル基底関数Kolmogorov-Arnoldネットワーク(階層的RBF-SKAN)を開発する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:33:53 GMT)
Hidden $\mathfrak{u}(2,1)$ symmetry and Jordan chains in a resonant ghostly three-dimensional model [0.0] 完全共振6次パイス・ウレンベック発振器の3次元ゴーストリー・ハミルトン実現について検討する。
二次結合が隠れスペクトル生成の$mathfraku(2,1)$-algebraを生成するような相互交叉作用素を構築する。
さらに古典フローのリー点対称性からトリ・ハミルトニアンの定式化を導き、対応するハミルトニアンが自然に同じ隠れ代数で符号化されていることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:12:29 GMT)
Handoff Debt: The Rediscovery Cost When Coding Agents Take Over Interrupted Tasks [0.0] 他のエージェントやエンジニアが残した部分的な状態からタスクを中断し、再割り当てし、レビューし、再開するからです。
前任者の作業が不透明あるいは不完全である場合に課される再検討コスト。
我々の乗っ取りプロトコルは、決定論的ハンドオフポイントで符号化エージェントを中断し、リポジトリを凍結し、4つのハンドオフビューで後継エージェントを評価する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:40:38 GMT)
Geometric Decoherence Time in Lindbladian Dynamics [0.0] 対数ネガティビティとRényi-$tfrac1212エントロピーの間のモノトン関係の最初期の瞬間として定義される$geometric$$decoherence$$$time$を導入する。
量子相互情報は相補的な長期診断を提供することを示す。
その結果,デコヒーレンスの発生を動的に追跡できる尺度が得られた。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:06:40 GMT)
Gate AI: LLM Security Benchmark Evaluation Methodology and Results [0.0] 本稿では,データセットごとのしきい値調整と未開示動作点に対処する評価ハーネスについて述べる。
評価中の検出器は5倍のクロスバリデーションを用いて16の公開ベンチマークで評価される。
外部比較において、検出器の閾値は、競合が公表した偽陽性率に再調整される。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 23:29:58 GMT)
From Confident Closing to Silent Failure: Characterizing False Success in LLM Agents [0.0] 単一制御のtau2-benchドメインでは45~48%、二重制御の通信では3%、AppWorldの自己評価のコーディングエージェントトラジェクトリでは75.8%、明確なステータスクレームでは75.8%である。
TF-IDF検出器は、tau2-benchでタスク非結合のAUROC 0.83、AppWorldで0.95を達成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 00:13:23 GMT)
Forgetting is Not Erasure: Recovering Latent Knowledge via Transport Keys [0.0] 破滅的な忘れ方は、しばしば表象的な問題として扱われる。
その結果, 内部ステージ間の界面のドリフトにより, 明らかな忘れ込みのかなりの部分が生じることが判明した。
その結果、継続学習にはインデックス化と遅延計算の再アクセスのためのより良いメカニズムが必要であることが示唆された。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:22:03 GMT)
Fixed-Time Dynamic Landing of Quadrotors using Adaptive Unscented Kalman Filtering and Nonlinear Model Predictive Control [0.0] 本稿では,移動プラットフォーム上でのマルチロータ無人航空機の動的着陸を推定・制御するためのフレームワークを提案する。
提案手法は,非線形モデル予測制御を実時間最小軌道プランナと統合する。
EKF/UKF法と比較して、繰り返し着地し、プラットフォーム速度予測精度を向上させることが示されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:05:34 GMT)
Fast Tensor Network Imaginary Time Evolution by Implicit Stepping on Logarithmic Grids [0.0] 対数時間グリッドは、長い想像時間ダイナミクスを解くのに十分であることを示す。
次に、通常の微分方程式に対するA-stableの暗黙の時間ステッピング法は、任意の時間ステップサイズに対して安定な伝播を可能にすることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:25:24 GMT)
Expressivity of congruence-based architectures for DNNs on positive-definite matrices [0.0] 入力行列が左右に(おそらく長方形の)重み行列によって乗算される合同のような層とその変換に着目する。
このような層は祝福されたSPDNetの中核にあり、また正定値データの次元的削減にも独立して利用されている。
W$に課される(半)直交性制約は、これらの層の表現性を制限していることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:01:08 GMT)
Entangling power and fidelity diagnostic for bipartite quantum channels [0.0] 固定シュミット係数の局所単位軌道上における等局所次元の平均忠実度は、平均入力出力忠実度と積入力に対する制限によって完全に決定されることを示す。
また,2ビットチャネルに対する収束および負性に基づくエンタングルパワーを導入し,局所的な後処理下での凸性と単調性を証明し,従来提案されていた線形エントロピー量とは異なり,すべての分離可能なチャネルに対して消滅することを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 11:45:39 GMT)
Enhancing Computer Vision Model Generalization in Warehouse Facilities: A Case Study on Anomaly Detection in Vertical Material Handling Systems [0.0] ウェアハウスの施設にコンピュータビジョンモデルを配備するには、伝統的にカメラの装着、画像収集、アノテーション、訓練、配備のための広範囲なリソースが必要である。
本稿では,実験室でのみ標準手順を実行することによって,このプロセスを合理化するための革新的なアプローチについて検討する。
最適なカメラ配置, 戦略的トリガー, 慎重なモデル選択, モデルアンサンブルを組み合わせることで, 実験室環境から多様な倉庫環境へ効果的に一般化できることがわかった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:16:01 GMT)
Enhanced qubit performance by integrating altermagnets into superconducting qubit designs [0.0] 磁性ジョセフソン接合を含む場合,超伝導量子ビットの性質がどう変化するかを検討する。
分割、非調和性、デコヒーレンス、単/結合量子ゲート動作時間を含む鍵量子ビット性能パラメータは、反磁性材料の特性に応じてリッチな挙動を示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:25:29 GMT)
Echo: A Joint-Embedding Predictive Architecture for Speaker Diarization and Speech Recognition in a Shared Latent Space [0.0] 私たちは、単一のViTエンコーダを中心に構築された概念実証オーディオシステムであるEchoを紹介します。
エンコーダはJEPAの目的で事前訓練され、スピーカーアイデンティティ、音声コンテンツ、動的ソースルーティングのステージによって特殊化される。
設計段階を段階別に文書化し、最終段階を報告し、まだPoCに束縛されているVQボトルネックを通して、エンドツーエンドのASRの構造壁を識別する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:46:11 GMT)
Dynamics of the Density Cube [0.0] 密度立方体理論は、標準量子密度行列 $_ij$ を拡張し、余分な指数を $_ijk$ に加算する。
2つの異なる指標を持つ密度立方体の要素は、密度行列の対角元である$_ij$の実部と虚部に対応する。
3つの異なる指標を持つものは、非カノニカルなトリプルパス干渉を記述している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 16:00:38 GMT)
Don't Gamble, GAMBLe: An Analytical Framework for AI-Driven Research Systems [0.0] GAMBLeは,ADRSの動作を4つのパラメータに分解するフレームワークである。
単一のLLMから動的に適応するアンサンブルまで,760以上のレプリケーションされた実行環境上で,フレームワークを動作させる。
その結果、限られた予算(60回の実行)下であっても、適切なコンポーネントの選択は13~67%、検索効率は6~39倍向上することがわかった。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:26:28 GMT)
Do Transformers Need Three Projections? Systematic Study of QKV Variants [0.0] Q-K=Vは、キーと値が同様の表現空間を占有し、注目が低ランクな状態で動作するため、品質を保っていることを示す。
提案手法は,投射共有を注目の重み付けの未探索例として体系的に特徴付ける。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:59:05 GMT)
Deep Learning for Generating Computational PIN-4 Immunohistochemistry Staining from Prostate Biopsy H&E Images [0.0] PIN-4染色は通常、ヘマトキシリンとエオシン(H&E)染色組織の隣接組織で行われる。
正常な臨床前立腺生検画像からH&E/PIN-4データセットを合成した。
ネイティブH&E画像パッチから直接PIN-4染色パターンを合成するために,条件付き生成対向ネットワーク(cGAN)を訓練した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:19:25 GMT)
DECK: A Consistency x Confidence Taxonomy of LLM Hallucinations [0.0] 既存の幻覚は、アウトプットの誤りによってエラーを分類します。
これらは診断に役立ちますが、別の質問に答えることはできません。
本稿では,検出可能性シグネチャによってエラーを分類する補完的な分類法を提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:11:11 GMT)
Cross-Environment Neural Reranking for Sample-Efficient Action Selection in Text-Based Agents [0.0] 大規模言語モデルエージェントは、テキストベースのベンチマークでは高いパフォーマンスを達成するが、不当な推論コストを発生させる。
単一軽量モデルが多様な環境において動作選択を行うことができるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 13:00:58 GMT)
Correlated Quantum Sensing at the Seemingly Classical Limit [0.0] 高品質な共振量子調和検出器を用いた相関計数, ホモダイン, ヘテロダイン検出手法を提案する。
2および3種類のほとんど機能しない共鳴質量検出器に対する対称相関器を用いた簡易統計試験が提案されている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 04:30:13 GMT)
Continual Learning as a Multiphase Moving-Boundary Problem [0.0] ステファン-CLはこの安定性と塑性のジレンマを融解の物理によってエレガントに解決する。
ネットワークが学習するにつれて、この境界は拡大し、「潜熱」チューニングダイアルによって支配される。
学習した内部を数学的に凍結することにより、Stefan-CLは生データを保存することなく、記憶量の多いベースラインをほぼゼロに削減する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:13:33 GMT)
Compliance-Scored Best-of-N Guardrail Orchestration for Multimodal Document Generation in Payments Dispute Defense [0.0] 企業文書の大量生成には、財務紛争の物語、コンプライアンス通知、監査要約が含まれる。
統一されたガードレール層の前に、プロダクションシステムはしばしば別々のPIIリアクション、コンテンツモデレーション、フォーマット検証ステップを縫い合わせていた。
本稿では,テキストと画像入力のためのガードレールオーケストレーションレイヤを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 00:24:30 GMT)
Coherent Swap Regret and Channel-Proof Learning [0.0] 外部の後悔は、自分の行動が固定された代替手段によって置き換えられることに対してのみ、安定性を証明します。
このような局所的なCPTP偏差に対する後悔ベンチマークとして,コヒーレントスワップ後悔を導入する。
我々はこれらの平衡を、媒介する量子レコメンデーションプロトコルのチャネル保護性と同定する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 05:06:12 GMT)
Coherent Exchange and Decoherence in Dirac-Spin-Liquid Quantum Interconnects [0.0] そこで我々は,2つの局所量子ビットに対して,ディラック・スピン・液体のような浴槽に結合したサセプティビリティに基づく開系理論を開発した。
この単一応答カーネルがコヒーレントおよび散逸的量子ビットダイナミクスの両方を制御していることを示す。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 07:24:58 GMT)
Co-training with Ego-centric Video and Demonstration for Robot Navigation Task [0.0] 本研究では,エゴセントリックな歩行映像を移動ロボット模倣学習のためのデータセットに変換するフレームワークを提案する。
提案手法は,人間の映像からカメラの動きを推定し,地上移動ロボットと互換性のある動作表現に変換する。
フルーツ検索ナビゲーションタスクの実験は、人間の自我中心のビデオがモバイルロボット学習に効果的でスケーラブルなデータソースを提供することを示した。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:12:22 GMT)
Closed-loop Structure of Quantum Probabilities from Unitarity [0.0] バーグマン不変量は閉ループに付随する位相不変量として自然に現れることを示す。
ボルンの規則は、前方振幅と逆振幅の積から生じる基本二次構造を反映していると考えられている。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 17:12:40 GMT)
CAREF: Calibration-Aware Regularization for Explanation Faithfulness Without Rationale Supervision [0.0] 我々はパラメータ効率の良い微調整フレームワークであるCAREFを紹介する。
CAREFはトークンレベルの空間制御とエントロピーベースのキャリブレーションを結合する。
4つのNLEベンチマーク(COS-E, ECQA, ComVE, e-SNLI)の評価
論文参考訳(メタデータ) (Mon, 01 Jun 2026 02:04:16 GMT)
Bounds on Nonlocality and Random Access Codes from Extended Information Causality Principle [0.0] 我々は情報因果性を拡張し、アリスの入力間の相関を許容する。
我々は、以前に知られていた量子相関の制約を強化する量子ベル不等式の族を導出する。
一般には強いが、拡張原理は元の情報因果原理から得られる限界を改善できないことを証明している。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:58:11 GMT)
Binary Road Surface Classification Using Machine Learning on Production Vehicle Signals During Cruising [0.0] 走行中の車両信号と路面状態の相関関係を機械学習を用いて明らかにする必要がある。
特徴に基づくフレームワークとエンドツーエンドのデータ駆動フレームワークを用いて、車両の動力学的挙動の統計と路面の状態とを相関させる。
車輪速度、車輪トルク、長手加速度、操舵角度、ヨーレートの短い緩衝窓をバッチするスライディングウインドウアプローチを採用する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:25:53 GMT)
Benchmarking the ORCA PT-2 Boson Sampler using Minimum Dominating Set Problems [0.0] 我々は、シングルループ構成でボソンサンプリングをシミュレートし、個々のアルゴリズムコンポーネントのランタイムを分解する。
本研究は、干渉計の複雑さが向上するにつれて、ボソンサンプリングの監視ブリーフを推奨する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 06:55:04 GMT)
Bayesian Spectral Emotion Transition Discovery from Multi-Annotator Disagreement [0.0] マルチラターソフトラベルから感情伝達構造を発見するための2段階のフレームワークを提案する。
5ソースのクロスコーパス検証では、英語の0.91-0.98、中国語のM3EDに対する0.79-0.85、人間のハードラベルとLLM仮想ソフトラベルの間の0.979のペアワイズピアソン相関が得られる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:44:08 GMT)
BYORn: Bootstrap Your Own Responses to Defend Large Vision-Language Models Against Backdoor Attacks [0.0] 教師付き微調整は、下流タスクに自動回帰視覚言語モデルを適用する主要なアプローチである。
近年の研究では、このパラダイムはバックドア攻撃に対して非常に脆弱であることが示されている。
本研究では, 有害な標的応答が意味論的に理解できない場合が多いという観察に動機づけられた, バックドア・ローバスト微調整フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 22:58:04 GMT)
Apparent Fermionic Spectra for Bosonic Radiation: Accelerated Charge Kinematics [0.0] 加速された点電荷は、放射線がボゾンであり、その占有数は0または1に制限されないにもかかわらず、明らかにフェルミ・ディラックスペクトルを持つ光子を放出することができる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 19:41:52 GMT)
An Abstract Worlds Semantic Framework for Belief Change Operators [0.0] 本稿では、抽象世界意味論(Abstract Worlds Semantics)と呼ばれる、信念変化のための集合論的な枠組みを提案する。
グローヴ(1988)の結果にインスパイアされた我々の手法は、世界収縮と世界修正作用素が定義された原始的要素として世界を扱う。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 12:24:43 GMT)
Algorithmic algorithm development with LLMs: A Case Study on LLM-Usage for Contraction Order Optimization in Tensor Networks [0.0] 我々は,OpenEvolve を用いたテンソルネットワークの収縮次数最適化のケーススタディによる LLM ベースのアルゴリズム開発について検討する。
LLMの選択だけでなく、評価基準やテストインスタンスといった設計上の選択にも特に注意を払っています。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 09:36:59 GMT)
Absorbing Complexity: An Interaction-Native Knowledge Harness for Financial LLM Agents [0.0] 金融AIエージェントのためのインタラクションネイティブ知識ハーネス(InKH)を提案する。
InKHはユーザ、市場、ポートフォリオ、ツールイベントを構造化された運用知識に変換する。
レイテンシを82.95パーセント、トークンコストを82.29パーセント、スタイル知識の使用を96.58パーセント削減する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 08:31:35 GMT)
AURA: Action-Gated Memory for Robot Policies at Constant VRAM [0.0] AURA-Memは、一定サイズのリカレントメモリと学習ゲートを備えた凍結された視覚言語アクションバックボーンをラップする。
AURA-Mem は 5.19-6.13 倍の書き込みと 9.19 倍の書き込みを使用して、O(1) のベースラインを精度良く一致させる。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:38:21 GMT)
A mean-field description of strong-to-weak symmetry breaking in the monitored three-dimensional Bose-Hubbard model [0.0] 観測されたボソニック格子系における強弱対称性の破れについて検討する。
この局所的な順序パラメータは、電荷吸収遷移と同じ測定強度付近で臨界となる。
我々の研究は、強弱対称性の破れの局所的な特徴を確立し、観測されたボース・ハッバードにおける将来の実験のための具体的な予測を提供する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 18:00:03 GMT)
A Systematic Evaluation of Current Architectures in Wind Power Forecasting [0.0] 風速予測は、風力発電の電力システムへの効率的な統合に不可欠である。
本研究では,ディープラーニング,モーダル分解,統計的手法の組み合わせについて検討する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:15:20 GMT)
A Simulation Platform for Flapping-Wing Vehicles [0.0] 羽ばたき翼航空機(FWAV)は目覚ましい機敏性を示すが、かなりの自律性に直面する。
現在のシミュレーションプラットフォームは、通常、単純化された層流仮定と理想化されたセンサーモデルに依存している。
FWAV-Simは,(1)準定常羽根要素理論とブラフベース・ドラッグエフェクトを組み合わせた複合空力モデル,(2)ノイズの多いIMU計測,LiDAR点雲,RGBカメラフィードを含む現実的なセンサシミュレーションを統合した,高忠実度ユニティ合成シミュレーションフレームワークである。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:17:09 GMT)
A Padding Method for Enhanced Encoding of Inorganic Structures with Varying Chemical Compositions [0.0] ドメイン固有対称性認識表現を利用して無機材料のコード化と生成を再定義する新しい手法を提案する。
エンコーダアーキテクチャにWyckoff位置認識パディングを組み込むことにより、無機材料のより堅牢な情報表現を実現する。
この対称性駆動の強化はディープラーニングモデルを改善し、より優れた精度と計算効率で安定した、未探索の無機構造を生成する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:04:33 GMT)
A Nonmonotone Gradient-Based Algorithm for Symmetric Nonnegative Matrix Factorization and Graph Clustering [0.0] シンメトリーNMFへの非単トン射影バルジライ・ボルワイン法の最初の適応について述べる。
またグラフラプラシア正規化(Graph-SNMPBB)を用いたグラフクラスタリングや低ランク近似(LAI-SNMPBB)による大問題への拡張も行う。
すべての変種に対して、一階定常点への大域収束を証明し、バルジライ=ボルワイン曲率情報はランダム化近似で保存される。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 20:59:33 GMT)
A Mathematical Conflict Framework for Contextual Data Modulation [0.0] 提案した構造は、紛争を局所的、指向的、文脈に敏感な量として扱う。
このフレームワークは、様々な種類の問題に適応可能な一般的な構造として定義される。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 15:30:43 GMT)
A Kinetic Theory of Encounter-Based Information Propagation in Multi-Robot Systems [0.0] 本稿では,出会いに基づく情報伝達の速度論的理論を考案する。
この理論は,チームサイズ,運用範囲,通信範囲,目標速度など,大規模シミュレーションを用いて評価する。
結果は、提案したアクセス安定性-幾何分解をサポートする。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 14:20:31 GMT)
A Framework for Graph-Conditioned Hierarchical Shapley Attribution in Patent Valuation [0.0] 本稿では,特許評価をAIの説明可能な問題として扱う枠組みを提案する。
特許のShapley値は、効率、対称性、ダミー、および添加度を満たす方法で製品利益の公平なシェアを測定する。
特許の80%が1つのコンポーネントを共有している場合、毛布はその密度の高いクラスタをカバーするように正しく膨張する。
論文参考訳(メタデータ) (Mon, 01 Jun 2026 03:33:18 GMT)