From Pixels to Words -- Towards Native One-Vision Models at Scale [122.9] 現在の視覚モデル(VLM)は、通常、複数の段階のアライメントを通して別々の画像エンコーダと言語デコーダを縫合する。
我々は,クロスフレームとピクセルワード対応をエンドツーエンドに学習するネイティブ基盤モデルNEO-ovを紹介する。
NEO-ovは、細粒度の視覚知覚に優れながら、モジュラーとのギャップをかなり狭めている。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:59:55 GMT)
Janus-LoRA: A Balanced Low-Rank Adaptation for Continual Learning [122.1] Low-Rank Adaptation (LoRA)は、継続的学習のための有望なパラダイムとして登場した。
このバランスを2つの新しいコンポーネントを通して復元するフレームワークである textbfJanus-LoRA を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:53:14 GMT)
Self-Prophetic Decoding to Unlock Visual Search in LVLMs [108.8] LVLM(Large Vision-Language Models)は、真のマルチモーダル推論に向けて急速に進化している。
LVLMビジュアルサーチは、訓練後の本質的能力の非互換性と、長い多段階推論コンテキストにおける干渉の2つの主要な課題に直面している。
固有単一ステップ機能を活用してコヒーレントな多ステップ推論を可能にする自己プロヒーレントデコーディングフレームワークであるSeProDを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:01:39 GMT)
Measuring Real-World Prompt Injection Attacks in LLM-based Resume Screening [101.1] 広範に利用されているアプリケーションにおいて,最初のシステマティック・インジェクション・アタックについて述べる。
我々の分析は、数年以上にわたって雇用EZによって収集された約200万の現実世界の履歴書に基づいている。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:56:19 GMT)
Self-Improving Language Models with Bidirectional Evolutionary Search [93.2] Bidirectional Evolutionary Search (BES)は、前方の候補の進化と後方の目標の分解を結合する検索フレームワークである。
展開のみ探索によって生成される候補は狭いエントロピーシェルに制限され、進化的演算子はそれを回避できることを示す理論的動機を与える。
実験によると、メインストリームのポストトレーニングアルゴリズムが改善に失敗するポストトレーニングタスクにおいて、BESは一貫性のあるゲインを実現している。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:59:15 GMT)
You Live More Than Once: Towards Hierarchical Skill Meta-Evolving [92.7] テストタイムスキルの進化はエージェントシステムを強化するための新しいパラダイムと見なされている。
エージェントシステムの継続的改善には,スキル進化フレームワークの試験時間改善が不可欠であることを示す。
軽量な階層型スキルメタ進化ソリューションであるHiSMEを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:26:49 GMT)
Gamma-World: Generative Multi-Agent World Modeling Beyond Two Players [87.9] 対話型シミュレーションのための生成的マルチエージェント世界モデルを提案する。
本モデルでは,映像の忠実度,アクション制御性,およびスロットベースおよび高密度アテンションベースライン上でのエージェント間整合性を改善する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:59:31 GMT)
Look on Demand: A Cognitive Scheduling Framework for Visual Evidence Acquisition in Multimodal Reasoning [82.9] 我々は、視覚的証拠が推論プロセスにどのように、いつ導入されるかが中心的な課題であると主張している。
この知見により,言語モデルが推論プロセスを制御するマルチモーダル推論フレームワークCSMRを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:43:13 GMT)
Deformable Gaussian Occupancy: Decoupling Rigid and Nonrigid Motion with Factorized Distillation [81.4] DeGOは変形可能なガウスの占有機構であり、分解したガウスの変形と分解された4次元基礎モデル蒸留を統一する。
Occ3D-NuScenesベンチマーク実験により,本手法が弱い監督下での最先端性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:09:55 GMT)
GONDOR to the Rescue: Satisficing Planning with Low Memory [80.9] GONDORはGreedy Best-First Search(GBFS)の拡張である
GONDORは、アンカー状態のスパースセットを保持しながら周期的に探索木を圧縮し、ゴールに達するとスパース状態間の再探索によって経路を再構築する。
実験により、GONDORは標準のGBFSと比較して、低メモリ予算下でのカバレッジを一貫して改善することが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:20:58 GMT)
LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding [80.5] 並列ボックスデコーディング(PBD)に基づく統合生成基盤・検出フレームワークを提案する。
PBDはデコードスループットとローカライズ精度の両方を改善する。
さらに、スケーラブルなデータエンジンを開発し、1億1800万以上のトレーニングサンプルを持つ大規模データセットであるLocateAnything-Dataをキュレートします。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:30:49 GMT)
Proprio: Latent Self-Scoring and Inference-Time Refinement for Physically Plausible Video Generation [78.4] Proprioは、凍結したジェネレータが自身の出力の物理的妥当性を評価し改善することを可能にする、トレーニング不要のフレームワークである。
自己運動の生物学的感覚であるプロプリセプションにインスパイアされたプロプリオは、モデルの流れを自己刺激信号として扱う。
Proprioは、テキスト・ツー・ビデオ・ベンチマークと画像・ツー・ビデオ・ベンチマークの物理的妥当性を一貫して改善する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:44:18 GMT)
OmniEgo-R$^2$: A Routed Reasoning Framework for the 1st Cross-Domain EgoCross Challenge at CVPR 2026 [73.3] 我々は、EgoCrossを堅牢なクロスドメインエンボディビデオ推論問題として定式化する。
時間的境界あいまいさ、ドメイン間セマンティックミスマッチ、およびクローズドオプションによる決定不安定性の3つの主要な課題を特定します。
我々の提出物はソース制限トラックで66.35%、オープンソーストラックで66.77%、両リーダーボードで2位である。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:08:16 GMT)
Unveiling Multi-regime Patterns in SciML: Distinct Failure Modes and Regime-specific Optimization [72.6] 本研究では,科学機械学習(SciML)モデルにおけるこのようなマルチレジリエムの挙動を,レシシカル・アウェア・診断・フレームワークを用いて検討する。
i) 多くの標準SciMLモデル、異なる制約執行、および様々な設計で一貫した3つの登録構造が出現し、 (ii)最適化効率はシステマ固有であり、すべてのレギュマでうまく機能する単一の手法が存在しない、 (iii)SciMLモデルは、標準ロスランドスケープメトリクスの従来の解釈に挑戦できるきめ細かい障害モードを示すことができる。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:33:03 GMT)
Vision-OPD: Learning to See Fine Details for Multimodal LLMs via On-Policy Self-Distillation [71.9] MLLM(Multimodal Large Language Models)は、細かな視覚的理解に苦慮している。
地域間自己蒸留フレームワークであるビジョンOPD(Vision On-Policy Distillation)を提案する。
Vision-OPDは同じMLLMから2つの条件ポリシーをインスタンス化する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:29:28 GMT)
LAST: Bridging Vision-Language and Action Manifolds via Gromov-Wasserstein Alignment [71.4] LASTはアクション空間を再構築し、ビジョン・ランゲージ・アクション・モダリティとの局所的な距離互換性を確立する。
LASTは収束性と一般化性に優れたVLAモデルを可能にする。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:48:10 GMT)
Where Detectors Fail: Probing Generative Space for Generalizable AI-Generated Image Detection [69.6] AI生成画像(AIGI)の検出は、検出器が見えないジェネレータに一般化できないことが多いため、依然として難しい。
本稿では, 生成過程の挑戦領域を積極的に探究することで, 検出器の一般化を改善するフレームワーク PROBE を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:39:25 GMT)
Apertus LLM Family Expansion via Distillation and Quantization [68.3] Apertus-v1.1 - 1.7Tの許容ライセンストークンでトレーニングされた最大4Bパラメータを持つ、蒸留されたモデルのファミリーを生成する。
我々は,幅広いハードウェアおよびシステム要件をカバーするために,提案手法のコスト効率と高い精度性能を示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:40:10 GMT)
Plan Before Search: Search Agents Need Plan [66.4] サブスキル間の依存構造と蒸留が能力獲得への唯一の道ではない可能性について検討する。
本研究では,任意のターゲットモデルにおいてPlanを活性化するフィルタトラジェクトリを小型のシードモデルで生成する自己ブートストラッピングパラダイムを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:54:15 GMT)
Mining Multi-Modality Spatio-Temporal Cues for Video Important Person Identification [66.2] ビデオ重要人物(VIP)識別は、ビデオの中で最も影響力のある人物を自動的に識別することを目的としている。
本稿では,9,249のカテゴリからなる大規模有理付加データセットであるTemporal-VIPについて述べる。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:20:06 GMT)
Theoretical Foundations and Effective Algorithms for Policy-Aware Simulator Learning [65.6] 本稿では,モデルプレイヤと逆ポリシープレイヤのゼロサムミニマックスゲームを提案する。
提案手法は,戦略的に重要な領域における予測誤差を1.5$-$2.2times$に減らし,シミュレーションで純粋に訓練されたポリシーを最適に近い実世界の性能に適合させることができることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:31:37 GMT)
FLORO: A Multimodal Geospatial Foundation Model for Ecological Remote Sensing Across Sensors and Scales [65.5] FLOROは、小さなが高度に多様なリモートセンシングコーパスから転送可能な表現を学習するために設計されたマルチモーダル基礎モデルである。
FLOROは、Sentinel-1、Sentinel-2、SkySAT画像、標高、UAV由来のデータとの不均一な組み合わせによるマスク付きオートエンコーディングを用いて事前訓練される。
我々は、シーン分類、セグメンテーション、回帰タスクにまたがる凍結エンコーダプロトコルを用いて、PANGAEAベンチマーク上でFLOROを評価した。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:55:54 GMT)
Transformers Provably Learn to Internalize Chain-of-Thought [65.4] Implicit Chain-of-Thought (ICoT) は、隠れた状態の中で中間段階を内部化するモデルを訓練する。
Log-ICoTはシンキングトークンを一度に削除し、$k$のリニアから対数へのステージ数を削減します。
多層変圧器の実験により理論が確認され、より深い層に段階的に推論がどのように吸収されるかが可視化される。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:17:06 GMT)
Personal Visual Memory from Explicit and Implicit Evidence [65.0] パーソナライズされたAIエージェントにとって、長期記憶はますます重要である。
既存のベンチマークとメソッドは、主にテキスト中心のままである。
VisualMemは、テキストメモリバックエンドを構造化されたパーソナル・ビジュアル・メモリモジュールで拡張するハイブリッド・ビジュアル・テキスト・アーキテクチャである。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:56:11 GMT)
Plant, Persist, Trigger: Sleeper Attack on Large Language Model Agents [64.8] 敵のコンテンツは、同一のエージェントによって提供される相互作用にまたがって持続できることを示し、そのような脅威を検知し緩和することを困難にしている。
具体的には、敵対的コンテンツはエージェント状態に留まり、相互作用をまたいだ休眠状態に留まり、その後、良心的なユーザクエリによって活性化される。
我々は、このタイプの安全脅威をスリーパー攻撃として形式化し、評価するために、現実世界の有害な結果6つ、攻撃戦略3つ、エージェント状態の目標3つをカバーする1,896件のベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:25:37 GMT)
EgoRelight: Egocentric Human Capture and Illumination Recovery for Relightable and Photoreal Avatar Rendering [63.8] EgoRelightは、エゴセントリックなテレプレゼンスのための総合的なフレームワークである。
同時に全身の人間のパフォーマンスを捉え、幾何学と楽しい外観を合成する。
遠隔のユーザが物理的環境に応じて一貫した信頼を得られるソーシャルテレプレゼンスアプリケーションを通じて,我々のシステムを実証する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:38:10 GMT)
Rethinking Memory as Continuously Evolving Connectivity [63.6] 既存のメモリ拡張LDMエージェントは、メモリを事前定義された表現と固定された検索パイプラインを備えた静的リポジトリとして扱う。
メモリをヘテロジニアスなグラフとしてモデル化し,そのトポロジを3段階にわたって段階的に洗練する,コネクティビティ進化型メモリフレームワークであるFluxMemを提案する。
LoCoMo、Mind2Web、GAIAなど、根本的に異なる3つのベンチマークにおいて、FluxMemは一貫した最先端のパフォーマンスを実現し、複雑なエージェント環境において強力な適応と一般化を示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:35:34 GMT)
Joint Training of Multi-Token Prediction in Reinforcement Learning via Optimal Coefficient Calibration [61.5] MTP(Multi-Token Prediction)は、事前トレーニングにおいて広く採用されているモジュールである。
RL目標に対するMPPの段差効果は,第1次相関と第2次ペナルティの2つの項に分解できることを示す。
本稿では,ログ確率プロキシを用いて最適係数を無視可能なコストでオンラインで追跡する適応型手法を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:07:06 GMT)
Aligning Few-Step Generative Models by Amortizing Sample-based Variational Inference [60.8] FAV, Few-step Generative Models Alignment via Sample-based Variational Inference。
基準分布に固定された報奨型分布からのサンプリングとしてのFAVキャストアライメント
ロボット操作と画像生成のアライメントの2つの領域でFAVを評価する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:59:16 GMT)
Physics from Video: Identifiability of Time-Invariant Second-Order ODEs under Minimal Trajectory Conditions [60.3] ビジュアルリアリズムと物理的な理解のギャップを埋めることは、ビデオベースの世界モデルにとって重要な課題である。
原画素からの連続時間物理法則の構造識別可能性について検討した。
レベルセットの傾斜被覆条件は、学習された潜伏空間が真の物理的状態に局所的に親和的であることを証明する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:22:29 GMT)
Reasoning Matters: Mitigate Hallucination in Multimodal Large Reasoning Models via Reasoning-Conditioned Preference Optimization [59.2] マルチモーダル大規模推論モデルは推論パラダイムを導入し、複雑な視覚言語タスクに強力な能力を示す。
既存のトレーニングベースの手法では、応答レベルの直接選好最適化(DPO)を通じて幻覚を緩和し、CoT(Chain-of-Thought)と最終回答をモノリシックな出力として扱い、協調的に最適化する。
我々は、応答生成条件としてCoTをモデル化し、異なるCoT条件下で同じ好みの回答を優先し、応答支持型推論連鎖アライメントを促進するReasoning-Conditioned Direct Preference Optimization (RC-DPO) を導出する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:27:23 GMT)
CyberJurors: A Multi-Agent Simulation Task for E-Commerce Disputes Verdict [59.1] 電子商取引プラットフォームは、大量の取引紛争を判断するためにクラウドソースの陪審員を募集し始めた。
本稿では,先駆的タスクであるEDV(E-Commerce Dispute Verdicts)と,6,000件の現実世界のケースからなるマルチモーダルベンチマークであるVerdictBenchを紹介する。
本稿では,論争ロジックを明確にし,判定プロセスを制御するマルチエージェントフレームワークであるCyberJurorsを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:07:44 GMT)
Do Language Models Need Sleep? Offline Recurrence for Improved Online Inference [58.5] 本研究では,モデルが周期的に最新のコンテキストを持続的な高速重みに変換する睡眠様統合機構について検討する。
睡眠中、モデルは蓄積したコンテキストにN$のオフラインリカレントパスを実行し、状態空間モデルの高速な重みを更新する。
睡眠時間の増加は,より深い推論を必要とする例では最大で,我々のモデルではN$の上昇がパフォーマンスを向上させることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:13:15 GMT)
Dr-CiK: A Testbed for Foresight-Driven Agents [58.3] 本稿では,文書コーパスから予測関連コンテキストを検索できるかどうかを評価するベンチマークであるDr-CiKを紹介する。
我々は,Dr-CiKの予測性能が,高品質な文脈で大幅に向上することを示す。
我々の研究は、未来を予測するための適切なコンテキストを探索するフォレスト駆動エージェントの研究を動機付けている。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:26:42 GMT)
Tiny Brains, Giant Impact: Uncovering the Keystone Neurons of LLM with Just a Few Prompts [58.0] 広い範囲のオープンウェイトトランスフォーマーにおいて、ニューロンのサブセットは、複数の能力次元のタスクをまたいだ推論において、常に高度に活性化されることが示される。
クロスタスク活性化強度に沿って探索することにより、非常にスパースなサブセットが分離され、その除去はモデル挙動の崩壊を引き起こす。
解析の結果,キーストーンニューロンは,前訓練中にほぼ確立されたモデルの安定で内在的なニューロンサブセットであることが明らかとなった。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:45:10 GMT)
Rethinking Video-Language Model from the Language Input Perspective [57.8] VLM(Video-Language Models)は、ビデオとテキストのギャップを埋める上で、重要かつ難しい技術となっている。
本稿では,ビデオやテキストを完全にブリッジする様々なVLM方式のプラグイン・アンド・プレイ・フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:47:05 GMT)
VCap: Hypergeometric Rewards for Weak-to-Strong Visual Captioning [57.6] 本稿では,参照キャプション(証人)と視覚信号(代弁者)とをペアにする,証人-代弁者報酬であるVCapを提案する。
VCapは、キャプションの品質検証のための超幾何分布レベルの精度を持つ報酬信号を提供する。
実験では,VCapでトレーニングした8Bモデルは,複数の画像およびビデオキャプションベンチマーク上で,オープンソースおよびクローズドソースSOTAモデルより優れていた。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:27:04 GMT)
Fitting Unknown Number of Hyperplanes with Manifold Optimization [57.5] 未知数の線形平面をデータに適合させることは、機械学習の根本的な課題である。
既存のアプローチはしばしば最適な最適化に苦しむか、幾何的整合性に欠ける。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:02:20 GMT)
MolLingo: Molecule-Native Representations for LLM-Powered Scientific Agents [57.3] 分子設計を自動化するために化学者の推論過程をエミュレートするマルチエージェントシステムであるMolLingoを提案する。
MolLingoは、共有メモリモジュールを通じて、文学エージェント、化学エージェント、オーケストレーションをコーディネートすることで、この問題に対処する。
初期治療設計におけるケーススタディとして、MolLingoは、結合部位の幾何学と残基レベルのタンパク質コンテキストにおけるChemist Agentの推論を根拠にしている。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:11:23 GMT)
Diffusion Large Language Models for Visual Speech Recognition [56.8] 本稿では,最初の拡散大言語モデル(DLLM)に基づく視覚音声認識(VSR)フレームワークを提案する。
DLLM-VSRは早期に高信頼位置をコミットし、コミットトークンを双方向コンテキストとして、曖昧なトークンを洗練させる。
我々は、ビデオ長を用いて、可塑性転写長仮説を構築する長さ誘導型候補復号法を開発した。
提案手法はラベル付きトレーニングデータのみを用いて, LRS3 上で19.5%の最先端 WER を実現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:22:08 GMT)
Influence-Guided Symbolic Regression: Scientific Discovery via LLM-Driven Equation Search with Granular Feedback [56.7] 逐次的2段階プロセスとして方程式発見をフレーム化する方法である textitInfluence-Guided Regression (IGSR) を導入する。
LLM-SRBench, 薬理学的PKPDモデル, 疫学シミュレーション, 実世界のゲノムデータなど, IGSRの有効性を示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:48:01 GMT)
MTAVG-Bench 2.0: Diagnosing Failure Modes of Cinematic Expressiveness in Multi-Talker Audio-Video Generation [56.4] MTAVG-Bench 2.0は,マルチトーカーオーディオビデオ生成における映像表現の異常モードの診断のためのベンチマークである。
MTAVG-Bench 2.0はショートドラマとシーンレベルの生成をターゲットとし、演技、物語、雰囲気、音声視覚言語にまたがる高いレベルの障害分類を確立している。
実験により、ジェミニのような商業オムニモデルが他の評価モデルよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:38:54 GMT)
MemGuard: Preventing Memory Contamination in Long-Term Memory-Augmented Large Language Models [56.3] 本稿では,メモリ構築と検索において,機能的メモリ境界を保存するタイプアウェアメモリフレームワークであるMemGuardを紹介する。
幻覚と長期会話のベンチマーク全体で、MemGuardはメモリの信頼性を最大28.27%向上し、メモリトークンは以前の方法より5.8倍少ない。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:04:19 GMT)
Converted, Not Equivalent: Benchmarking Codebase Conversion via Observational Equivalence [56.3] コーディングエージェントは、しばしば自身のローカル検証ルーチンを過度に信頼し、表面チェックを満たすアーティファクトの成功を宣言する。
この問題は、事前評価が結果駆動である変換において特に深刻である。
ブラインド・コンバージョンは26.7-28.9%に達し、スペック・パスレートは91.1%まで上昇した。
このことは、失敗は限られた予算やバックボーンの強さよりも、契約ミスによる自己検証に起因していることを示唆している。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:57:15 GMT)
SCDBench: A Benchmark for LLM-Based Smart Contract Decompilers [55.4] 本稿では,スマートコントラクトデコンパイルのためのデータセットとベンチマーク手法であるSCDBenchを紹介する。
データセットには600の現実のSolidityコントラクトと、ペア化されたバイトコード入力、地味なソースコード、再生可能なセマンティックチェックポイントが含まれている。
我々は,GLM-5の変種を含むゼロショット逆コンパイル設定において,Claude Opus 4.7,GPT-5.3-Codex,GLM-5を評価した。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:08:47 GMT)
MACReD: A Multi-Agent Collaborative Reasoning Framework for Reaction Diagram Parsing [54.1] 本稿では,分子認識,矢印理解,テキスト抽出,および反応再構成のための特殊エージェントを統合VLM誘導アーキテクチャ内で協調する階層型マルチエージェントフレームワークを提案する。
RxnScribeベンチマークの実験では、MACReDはハードマッチとソフトマッチの基準で75.2%と84.6%のスコアで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:32:13 GMT)
Towards Unified Vision-Language Models with Incomplete Multi-Modal Inputs [53.9] 我々は,不完全なマルチモーダル入力を処理するために,統一された不完全ビデオ言語モデルを提案する。
本手法は,様々なマルチモーダルタスクにおける性能向上のために,従来の作業のためのプラグイン・アンド・プレイ・モジュールとして機能する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:18:10 GMT)
S3C2 Summit 2025-07: Government Secure Supply Chain Summit [53.8] ソフトウェアサプライチェーンは、膨大な経済とソフトウェア開発価値を提供します。
ここ数年、重要なソフトウェアサプライチェーンの脆弱なリンクをターゲットにしたサイバー攻撃が指数関数的に増加している。
2025年7月9日、NSFが支援するSecure Software supply Chain Center (S3C2)の3人の研究者がSecure Software supply Chain Summitを開催した。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:09:55 GMT)
Garment Particles: A 2D--3D Symmetric Garment Representation for Generation and Editing [53.2] Garment Particlesは、2Dミシンパターンと3D幾何学を共同でエンコードする5Dポイントクラウド表現である。
高レベルの入力(テキスト、画像、スケッチ)から直感的な生成をサポートし、2Dミシンパターンと3Dジオメトリの様々な編集操作をサポートする。
また, 衣服, 縫製パターンの編集, ポイントクラウド, シルエットコンディショナブルな衣服生成など, 衣服編集のシナリオを多数用意した。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:11:18 GMT)
Occlusion-Aware Physics-Semantic Keyframe Selection for Robust Video Editing [53.1] 下流編集のための最適なアンカーフレームを自動的に識別するオクルージョン対応選択フレームワークを提案する。
我々のフレームワークは、手動のアノテーションを必要とせずに、正確かつ時間的に一貫した編集を可能にする。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:47:23 GMT)
Qwen-Image-Bench: From Generation to Creation in Text-to-Image Evaluation [52.9] Qwen-Image-Benchは、クリエイター中心のベンチマークで、プロのアーティストと共同で設計され、現実世界の創造シナリオに基礎を置いています。
我々はこれらの5つの柱をトップダウンの階層的な分類に分類し、23の第二級サブ能力と56の第三級ルーリックに分解する。
Qwen3.6-27Bに基づく統一審査モデルQ-Judgerを訓練し、ブラインドラベルとトリプルリビュープロトコルの下で、グローバルアートアカデミーの80名の専門家アノテータが監督する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:46:43 GMT)
PEFT-Arena: Understanding Parameter-Efficient Finetuning from a Stability-Plasticity Perspective [52.7] PEFTは安定性・塑性ジレンマにより評価されるべきである。
本稿では,下流性能と一般能力の維持を計測するベンチマークPEFT-Arenaを紹介する。
そこで本研究では,パスワイド巻き戻しによるポストホック改善の事例研究を行った。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:59:51 GMT)
Human Label Variation as Stable Signal: Learning Annotator-Specific Explanation Behavior via Cross-Annotator Preference Optimization [51.9] 自由文の説明は、ラベルの不一致を超えて人間のラベルのバリエーションを拡大する。
このようなアノテータ固有のラベル説明動作を,大規模言語モデルで学習し,再現できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:55:00 GMT)
Xiaomi Auto World Model: A Joint World Model Integrating Reconstruction and Generation for Autonomous Driving [51.9] 本報告では,世界モデルの自律運転における2つのコア機能に対処する統合技術システムを提案する。
世界表現のために,スパースシーンクエリによって駆動されるフィードフォワード再構築アーキテクチャであるWorldRecを提案する。
次世代に向けて,両方向性事前学習のための2段階のトレーニングフレームワークWorldGenを提案し,それに続いて因果微調整を行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:09:09 GMT)
Beyond Binary: Sim-to-Real Dexterous Manipulation with Physics-Grounded Contact Representation [51.5] コンタクトリッチな操作における主要なボトルネックは、現実世界のデータ収集の難しさである。
物理原理に基づく効果的な触覚表現であるCenter-of-Pressureを紹介する。
我々は2つのブラインドで困難なコンタクトリッチな操作タスクについてCoPを評価する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:59:02 GMT)
Learn from Weaknesses: Automated Domain Specialization for Small Computer-Use Agents [50.9] LearnWeakは、小さなコンピュータ利用エージェントのためのアノテーションなしの特殊化フレームワークである。
より強力な参照エージェントを使用して、ターゲットドメインにおける生徒の弱点を特定する。
OSWorldでは、LearningWeakはEvoCUA-8BとOpenCUA-7Bで平均11.6と1.1ポイントのアップを達成した。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:37:00 GMT)
PrimitiveVLA: Learning Reusable Motion Primitives for Efficient and Generalizable Robotic Manipulation [50.8] Vision-Language-Action(VLA)モデルは、汎用的なロボットポリシーに有望なパラダイムを提供する。
これらのボトルネックは、一般的なダイレクトインストラクション・トゥ・コントロルマッピング(Direct Instruction-to-Control Mapping)に由来すると我々は主張する。
本稿では,このパラダイムをPrimitive-Centric Disassemble & AssembleパラダイムにシフトさせるフレームワークであるPrimitiveVLAを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:41:18 GMT)
Skill-as-Pseudocode: Refactoring Skill Libraries to Pseudocode for LLM Agents [50.8] Skill-as-Pseudocode (SaP) はマークダウンスキルライブラリの型付き擬似コードへの自動変換である。
1つ以上のスキルから引き出された類似の手続きパスのクラスタごとに、SaPは型付きコントラクトを抽出し、それを4チェック決定性検証器を通じてフィルタリングする。
プロモートされた契約は、復元された具体的なアクションテンプレートと共に書き直されたスキルスケルトンにインライン化され、エージェントは2つの補完的な信号を与える。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:48:40 GMT)
Embodied3DBench: Benchmarking Low-Level Embodied Spatial Intelligence of Vision Language Models [50.6] Embodied3DBenchは3D環境における低レベル空間インテリジェンスをターゲットにしたロボット中心のベンチマークである。
ベンチマークは12のサブカテゴリにまたがり、21万以上の高品質な質問応答ペアを含んでいる。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:28:56 GMT)
T-GINEE: A Tensor-Based Multilayer Graph Representation Learning [50.3] T-GINEEは、テンソルに基づく一般化された推定方程式とタスク固有の損失を組み合わせた統計正規化フレームワークである。
我々の理論的分析は、穏やかな条件下での一貫性と正規性を確立する。
合成および実世界のデータセットに関する大規模な実験は、T-GINEEが多層ネットワーク解析に有効であることを検証する。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:51:29 GMT)
Can LLMs Use Linguistic Uncertainty Markers to Reliably Reflect Intrinsic Confidence? [50.2] モデルが、安定かつ一般化可能な方法でマーカーと特定の信頼レベルを関連付けるために、独自の言語的信頼フレームワークを適用できるかどうかは不明である。
我々は,与えられたタスク領域において,モデルが特定のてんかんマーカーと関連付ける内在的信頼度として,_marker internal confidence_(MIC)を定式化する。
分析フレームワークを多種多様なモデルやタスクに適用すると、LLMはマーカーの意味のモデル中心の解釈の下でも、忠実に誤解される。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:38:00 GMT)
The Trust Paradox: How CS Researchers Engage LLM Leaderboards [49.6] リーダーボードは、標準化されたベンチマークを使用してAIモデルをランク付けするが、研究者の実際の実践をどのように形作るかは、実証的にも証明されていない。
我々は、実用的懐疑主義のほぼ普遍的なパラドックスを見出した:参加者はリーダーボードのランキングに深い不信を表明したが、彼らはそれらを粗悪な意思決定支援として使用し続けた。
これらの知見を,評価インフラと研究者の実際の使用方法とを一致させる具体的な設計勧告に翻訳する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:09:26 GMT)
KT4EQG: Personalized Exercise Question Generation via Knowledge Tracing [49.5] 教育質問生成(EQG)は、生徒の学習を促進するために、カスタマイズされた運動質問を合成することを目的としている。
効果的なEQGシステムは、学生の知識状態をモデル化し、最大の学習効果をもたらす質問を生成することにより、学生ごとの質問を理想的にパーソナライズする。
KT4EQGは,KTモデルの指導のもと,個別の学生に対して効果的な質問を生成する,個別のEQGフレームワークである。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:48:40 GMT)
VLA-Hijack: A Transferable Patch Attack against Vision-Language-Action Models via Visual Proprioception Hijacking [49.5] VLA-HijackはVision-Language-Actionモデルのための統合された対向フレームワークである。
共有された視覚的自己ローカライゼーションプロセスを活用することで、根本的な脆弱性を悪用する。
ホワイトボックス設定において優れた最適化効率を実現し、クロスアーキテクチャとクロスドメインブラックボックス転送性のための新しいSOTAを設定する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:38:16 GMT)
Beyond pass@k: Redundancy-Aware RLVR for Multi-Sample Code Generation [48.7] JPlagを用いたコード生成における実装レベルの冗長性について検討する。
再現性のみのRLVRは繰り返し実装を中心に世代を集中することが多い。
JPlagの類似性に基づく直接的反冗長報酬によりRLVRを増強する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:26:52 GMT)
Integrated and Cross-Architecture Interpretation of LLM Reasoning [48.6] 統合されたクロスアーキテクチャ推論(IAR)フレームワークは、LLM推論の解釈可能性に対する統一的なアプローチを提供するように設計されている。
まず、チューキーIQRピーク検出と組み合わされた帯域幅校正MIPを用いて、出力層における推論・クラシカルトークンを分離することを提案する。
次に、MIP-pickedトークンと計算深度トークンの重なり解析を行い、それらのトークンの層間軌跡をトレースする。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:56:35 GMT)
General Covariant Action Modeling: Constructing Generalized Manifolds via Spatio-Temporal Decoupling [48.6] GAM(Generalized Action Manifold)フレームワークは、構造的ゆがみを通じて一般的な共分散を強制する。
GAMは、ジオメトリーに依存しないベースラインよりも優れた転送能力とロバスト性を実現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:38:15 GMT)
BPPO: Binary Prefix Policy Optimization for Efficient GRPO-Style Reasoning RL with Concise Responses [48.6] GRPO型推論RLにおいて,全ての完了が等しく有用な更新信号を提供するか否かを検討する。
我々の勾配類似性分析は、同じプロンプト群において、同じクラス補完がしばしば非常に類似した更新方向を誘導することを示している。
本稿では,最短の修正完了と最短の修正完了をコンパクトな更新単位として利用するBPPO(Binary Prefix Policy Optimization)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:34:17 GMT)
A Multi-dimensional Framework for Evaluating Generalization in EEG Foundation Models [48.4] 最近のEEGファンデーションモデルは、タスクとデータセット間で有望な転送機能を示している。
低リソース環境下での脳波モデル評価のための多次元評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:51:54 GMT)
OmniVerifier-M1: Multimodal Meta-Verifier with Explicit Structured Recalibration [48.1] 決定のみの信号よりも検証器生成の合理性を利用するマルチモーダルなメタ検証について検討する。
我々は,記号的メタ検証とデカップリングされた強化学習を利用した一般の視覚的検証であるOmniVerifier-M1を訓練する。
このアプローチは、より信頼性が高く、解釈可能で、きめ細かいマルチモーダル検証の道を開き、より安全で、より制御可能な基盤モデルのデプロイメントをサポートする。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:56:04 GMT)
Compositional Text-to-Image Generation Via Region-aware Bimodal Direct Preference Optimization [47.3] BiDPOは、T2Iモデルの合成テキスト・画像生成能力を高めるためのフレームワークである。
本手法は,複雑なテキスト・ツー・イメージタスクの好みに基づく微調整の可能性を強調している。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:27:13 GMT)
Toward User Preference Alignment in LLM Recommendation via Explicit Context Feedback [46.9] 我々は,次世代のLarge Language Models(LLM)ベースのRecSysにおいて,明示的な文脈フィードバックの優先順位付けを提唱する。
よりパーソナライズされ、透明で、説明可能なRecSysオンラインプラットフォームを促進することを目指している。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:10:33 GMT)
GraphLit: Learning Text-Enriched Dynamic Character Network Representations for Literary Study [46.7] 本稿では,長編小説を時間的局所的なヘテロジニアスグラフに整理する動的ヘテロジニアス文字ネットワーク(DHCN)を紹介する。
マスク付きグラフオートエンコーダの目的により、リッチな文芸表現を学習する自己教師型学習フレームワークであるGraphLitを提案する。
文芸分析におけるDHCNとGraphLitの適用性について,物語的非直線性と動的社会的特徴との関係について検討した。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:48:13 GMT)
StoryLens: Preference-Aligned Story Rewriting via Context-Aware Narrative Enrichment [46.5] 効果的なストーリーの書き直しは、表面的なスタイル的適応以上の文脈を考慮した物語の豊かさを要求する。
私たちのパイロット人間による研究では、スタイル適応だけでは読者満足度に限界的な利益しか得られないことが示されています。
STORYLENNNCH(STORYLENNNCH)は、好みに沿ったストーリー書き換えのための大規模ベンチマークである。
本稿では,書き直し記事に対する読者満足度を推定する報酬モデルであるSTORYLENSEVALと,教師付き微調整とGRPOに基づく強化学習を組み合わせた2段階書き換えモデルであるSTORYLENSWRITERを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:29:37 GMT)
Orthogonal Concept Erasure for Diffusion Models [46.5] 概念消去は、拡散モデルにおける望ましくない、あるいは安全でないコンテンツを緩和するための有望なアプローチとして現れている。
我々は,編集に基づく消去を乗算パラメータ更新として再構成する直交概念消去(OCE)を提案する。
OCEは、パラメータに閉形式解から導出される層準変換を適用し、正確な概念消去を可能にする。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:58:20 GMT)
VidPrism: Heterogeneous Mixture of Experts for Image-to-Video Transfer [45.5] 本稿では,新しい異種時間混合フレームワークであるVidPrismを提案する。
VidPrismは専門の専門家を配置することで、空間的理解から時間的モデリングまで幅広い役割を担っている。
様々なビデオ認識ベンチマークの実験は、VidPrismが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:43:06 GMT)
Variance-Adaptive Optimal Algorithm for Reinforcement Learning with Multinomial Logit Function Approximation [44.8] 我々は,MNLに基づくマルコフ決定過程の新たな理論的解析法を開発した。
我々のアルゴリズムは計算的に効率的であり、上界と下界のギャップを狭め、後悔のインスタンスワイド最適率を達成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:59:26 GMT)
EventShiftFlow: Towards Hardware-efficient FPGA-based Flow Estimation [43.8] イベントベースの視覚センサは、非同期で高時間分解能の測定を提供する。
多くの事象に基づく動き推定法は計算集約的であり、FPGAハードウェアにマップすることは困難である。
本稿では,非同期イベントを固定時間ビンに離散化し,1ビット空間占有格子を構築し,複数の速度仮説を並列に評価するストリーミング速度推定器を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:13:58 GMT)
Theoretical Analysis of Sparse Optimization with Reparameterization, Weight Decay, and Adaptive Learning Rate [43.4] 本稿では,ReWAと呼ばれるスパース最適化手法を提案する。
CIFAR-10とImageNet with ResNetsの実験では、ReWAが大幅なスパシティ改善をもたらすことが示されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:53:07 GMT)
Mobile-Aptus: Confidence-Driven Proactive and Robust Interaction in MLLM-based Mobile-Using Agents [43.2] MLLMをベースとしたエージェントにおいて,能動的かつ堅牢な相互作用を可能にする普遍的信頼統合フレームワークを提案する。
Mobile-Aptusは、オフラインベンチマークですべてのベースラインを一貫して上回る。
実世界の実験では、Mobile-Aptusは26%のタスク成功率でベースラインを超えた。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:37:02 GMT)
Defending LLM-based Multi-Agent Systems Against Cooperative Attacks with Sentence-Level Rectification [42.9] 大規模言語モデルに基づくマルチエージェントシステム(MAS)の悪意のあるエージェントは、誤情報を注入して他のエージェントを誤解させ、システム性能を損なう可能性がある。
本稿では,攻撃戦略を自律的に調整し,動的に調整する適応型協調攻撃フレームワークを提案する。
本稿では,エージェント通信における文レベルでのミスリード情報を識別・修正する防衛フレームワークであるSentence-Level Trustworthiness Analysis and Rectification(STAR)を紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:56:33 GMT)
ATLAS: All-round Testing of Long-context Abilities across Scales [42.8] ATLASは、長文評価を長さ依存の能力プロファイルとして再定義するベンチマークフレームワークである。
ATLASは、(i)アプリケーションワークロードから基礎的な操作を分離する階層化された分類法、(ii)固定された8K-1Mグリッド上のスコア長曲線を統合するAUCスコア、(iii)不均衡なプロファイルをペナルライズする分類カテゴリー上の調和平均集計であるATLAScoreの3つの方法論に貢献する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:33:47 GMT)
Principled Algorithms for Optimizing Generalized Metrics in Multi-Label Learning [42.7] 我々は,経験的ユーティリティ最大化フレームワーク内で,幅広い種類の一般化メトリクスを最適化するための原理的学習アルゴリズムを開発した。
我々の重要な貢献は、$H$一貫性境界を証明可能なマルチラベル学習のための新しいサロゲート損失関数の設計である。
本結果は,一般マルチラベル計量最適化における理論的厳密性と実用性の両方を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:23:58 GMT)
When Think-with-Image Meets Safety: What Determines Multimodal Jailbreak Robustness? [42.5] 思考とイメージの推論は、大きな視覚言語モデルのための新しい推論パラダイムとして現れつつある。
複数の視覚言語モデル全体で、明示的なイメージとツールの相互作用は攻撃の成功率を低くする。
本稿では,イメージツール実行を隠れ表現の残留シフトとしてモデル化した画像ツール安全ベクトルフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:04:42 GMT)
VITAL: Visual-Semantic Dual Supervision for Enhanced and Interpretable Latent Reasoning in Medical MLLMs [42.0] VITALは、ビジュアル・セマンティック二重監視を備えた医療MLLMのための潜在空間推論フレームワークである。
我々は、9つの画像モダリティにまたがる61Kデータセットを構築し、それ以前の医用視覚遅延推論データセットを桁違いに超えた。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:53:13 GMT)
Moment Matching Q-Learning [42.0] 我々はMoMa QL(Moment Matching Q-Learning)という新しいフレームワークを提案する。
MoMa QLは、最大平均誤差(MMD)として知られる統計仮説テストの手法を利用して、元の分布とターゲット分布の間の統計の順序をすべて一致させる。
提案手法では,D4RLタスクの競合性能に比較して,MoMa QLの方が計算効率がよいことを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:33:51 GMT)
Comparing Classical Simulation and Sample-Based Learning of Quantum Systems: Learning the Hardness of Quantum Systems from Samples [42.0] 量子システムに対する2つの異なる古典的アプローチの関係について検討する。
我々は、制御された量子状態の族からの測定サンプルに基づいて訓練された固定された深部エネルギーベース生成モデルを用いる。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:44:36 GMT)
Zipping the Thought: When and How Compressed Reasoning Data Works in LLM Post-Training [42.0] 大規模言語モデル(LLM)は、長いチェーン・オブ・ソート(CoT)推論によって複雑な問題を解くことができる。
パフォーマンスとトークンコストのトレードオフは依然として中心的な課題です。
本稿では, Explicit CoT, Composed CoT, Implicit CoTからなるCoTの分類法を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:02:41 GMT)
Automatic Layer Selection for Hallucination Detection [41.6] 幻覚関連信号は、大言語モデルの最終層(LLM)よりも中間層に強く符号化されている
提案する選択基準は, 最適層, 準最適層を連続的に同定するFEPoID (First Effective Peak of Intrinsic Dimension) である。
FEPoIDはトレーニング不要で、計算オーバーヘッドは無視できる。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:07:58 GMT)
Measuring Progress Toward AGI: A Cognitive Framework [41.5] AGIに向けた進捗を測定するための明確な枠組みは存在しない。
本稿では,人間の認知能力に関するシステム能力を理解するための枠組みを提案する。
本稿では,対象とする認知タスクの集合に対して,システムの性能を計測する厳密な評価プロトコルを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:39:54 GMT)
Extracting Small Translation Specialists from LLMs by Aggressively Pruning Experts [41.3] 現代の大規模言語モデル(LLM)は最先端の機械翻訳性能を達成する。
彼らは、翻訳とは無関係な多くのタスクと能力のために訓練された幅広い一般主義者である。
本稿では, 翻訳品質の劣化を招きつつ, 現代のLLMから専門家を積極的に刈り取る手法を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:46:42 GMT)
Execution and assessment of agentic influence operations in simulated social networks [41.1] 本稿では、ナラティブリリース、増幅、カウンターメッセージの制御シミュレーションにより、合成ソーシャルネットワークにおけるAIによる影響操作を評価する。
我々はエージェントのオーディエンスにおける露出と信念の変化を測定し、増幅がリーチを最大化し、反メッセージのシフトが最も多く、物語のリリースにはより大きな攻撃者の足跡が必要であることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:43:47 GMT)
Evaluating the Realism of LLM-powered Social Agents: A Case Study of Reactions to Spanish Online News [41.1] LLMが生み出すスペインのオンラインニュースに対する反応が、実聴者の会話の可測性を再現するかどうかを評価する。
オフザシェルフモデルは、実際の聴衆の反応には不十分なプロキシです。
可塑性合成反応は、必ずしも公開談話の分布特性を再現するとは限らない。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:16:05 GMT)
RW-TTT: Batched Serving for Request-Owned Test-Time Training State [40.8] テストタイムトレーニングは、要求された状態を読み取ることによって、世代間LLMに適応する。
我々は、この問題を読み書きTTTサービスとして定式化し、RW-TTTを提示する。
8つの高速ウェイトなIn-PlaceTTTストリームでは、RW-TTTは274.61トン/sに達する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:57:54 GMT)
ROSD: Reflective On-Policy Self-Distillation for Language Model Reasoning across Domains [40.6] 大規模言語モデル(LLM)の推論性能を向上するオンライン自己蒸留(OPSD)
既存のOPSD法はドメイン内推論において限定的な利得をもたらし、ドメイン外問題に悪影響を及ぼす。
本稿では,参照ソリューションの模倣を対象の推論補正に変換するフレームワークであるReflective On-policy Self-Distillation (ROSD)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:09:29 GMT)
SNARE: Adaptive Scenario Synthesis for Eliciting Overeager Behavior in Coding Agents [40.3] 符号化エージェントは、シェル、ファイル、ネットワークアクションのシーケンスとして良質なタスクを実行する。
プロンプトは敵ではなく、実行は成功しますが、スコープ外ステップでは認証情報をリークしたり、ファイルを削除することができます。
既存のベンチマークでは、タスク補完スイートは、完了した実行を承認し、jailbreakスイートは、逆のプロンプトをプローブし、以前のオーバーイーガーベンチマークは、各エージェントモデルペアに単一の固定プロンプトを適用する。
再利用可能なスコープから良性シナリオを構成するパイプラインであるSNAREを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:14:07 GMT)
Can It Reach the Generator? Investigating the Survival of Prompt-Injection Attacks in Realistic RAG Settings [40.0] 7つのGEO攻撃を現実的な3段階パイプラインで再評価する。
従来のプロトコルでは,攻撃の有効性が著しく過大評価されていた。
小さなアタックデータセットに微調整された軽量のプロンプトインジェクションガードは、すでにすべてのアタックを検出している。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:16:11 GMT)
No Safe Dose: How Training Data Drives Unsafe Image Generation [39.8] 安全でない画像のごく一部が異なるデータセットに対して、テキスト・ツー・イメージモデルをトレーニングする。
出力不安全は、0%の汚染で16.6%から5%の汚染で25.5%へと単調に上昇する。
FID、CLIPscore、ImageRewardは安全フィルタリングを伴わない。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:21:38 GMT)
MobileGym: A Verifiable and Highly Parallel Simulation Platform for Mobile GUI Agent Research [39.7] MobileGymは、日常的なモバイル利用のための軽量で完全に制御可能な環境である。
階層化された状態モデルと宣言的なタスク定義フレームワークは、状態のプログラマビリティとタスク作成を大規模に実践的に保ちます。
単一のプログラム的判断メカニズムは、決定論的評価評価と高密度報酬の両方を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:27:30 GMT)
Agentic Active Omni-Modal Perception for Multi-Hop Audio-Visual Reasoning [39.5] AOP-AgentはオープンソースのOmni-LLM上に構築された効率的なエージェントフレームワークである。
MOV-BenchとOmniVideoBenchの実験では、AOP-Agentは推論性能を一貫して改善している。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:11:59 GMT)
Efficient and Quantum-safe Internet Key Exchange Protocols for Satellite Communications [39.4] 本稿では,衛星通信における暗号鍵交換について検討する。
地上ネットワークで広く利用されているインターネット鍵交換プロトコルについて考察し,衛星環境における適用性について検討する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:58:04 GMT)
Reward Transfer from Inverse Reinforcement Learning: A Coupled Minimax Approach [38.7] 本研究では, ある環境における専門家によるデモンストレーションから, 異なる環境下での強化学習への逆強化学習を用いた報酬の伝達について検討した。
我々は,ベルマン方程式の連成系として,原点および対象環境にまたがる問題を定式化する。
逐次的アプローチとは対照的に、結合されたアプローチは、ソースベルマン残差の1次的影響を除去する。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:46:20 GMT)
Optimal Rates for Differentially Private Hypothesis Testing with E-values [38.7] Xsim mathbbPn$ to $XsimmathbbQn$ with e-values with $varepsilon$-differential privacy?
この問題に対して最適な速度を特徴付け、正確に一致するアルゴリズムを提供する。
逐次設定では、観測が1対1に到達し、アナリストがいつ停止するかを選択すると、停止時間に一致する上下境界を与える。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:00:13 GMT)
VLM-Based Advanced Rider Assistance System for Motorcycle Safety [38.5] 自動車は、保護が限られ、表面の危険に対する感度が高められたため、自動車と比較して非常に高い事故リスクに直面している。
本稿では,セマンティックな認識とリスク対応計画を通じて,オートバイの安全性を高める新しいARASを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:42:33 GMT)
Bandwidth-Efficient and Privacy-Preserving Edge-Cloud Many-to-Many Speech Translation [38.4] Edge-cloud Speech Recognition and Translation (ESRT)は、プライバシー保護と帯域幅効率の協調型エッジクラウドMLLMフレームワークである。
我々は、軽量な音声エンコーダとアダプタをデバイス上に保持し、高度に圧縮された中間機能のみをクラウドに送信するエッジクラウド分割推論アーキテクチャを設計する。
英語中心のボトルネックを克服するために,データバランシングによる多タスク重み付きカリキュラム学習戦略を導入し,堅牢な言語間一貫性を実現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:47:33 GMT)
Models That Know How Evaluations Are Designed Score Safer [38.2] 評価を特徴付ける構造特性に関するパラメトリック知識として定義されるメタ知識の評価について検討する。
評価手法を記述したテキストでトレーニングされたモデルでは、評価のようなコンテキストを認識して反応することが暗黙的に学習される可能性があるという仮説を立てる。
この結果から,評価メタ知識は,明示的な記憶や言語的評価意識に依存しない新しい共同創設者を導入することにより,安全性ベンチマークのパフォーマンスを向上させる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:11:35 GMT)
CaMBRAIN: Real-time, Continuous EEG Inference with Causal State Space Models [37.9] 本稿では,脳波信号のリアルタイム推測が可能な最初のコーサル,マンバをベースとした状態空間モデルであるCaMBRAINを提案する。
CaMBRAINは、既存のモデルよりも10倍高いスループットを持つ3つの異なるEEGデータセットにわたる、最先端(SOTA)結果を達成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:50:36 GMT)
Mags-RL: Wearing Multimodal LLMs a Magnifying Glass via Agentic Reinforcement Learning For Complex Scene Reasoning [37.4] Mags-RL (Mags-RL) は、MLLMに高精細度検査のための超高分解能「磁性ガラス」エージェントを装備するエージェント強化学習フレームワークである。
第1ラウンドでは、最初の合理性を生成し、追加のアノテーションに頼ることなく、自律的に関心のある領域を識別する。
第2ラウンドでは、これらの領域を収穫し、スケールアップするために超解像剤を起動し、その後再検討し、最終的な答えを得るための初期の推論を検証する。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:54:07 GMT)
Position: The Turing-Completeness of Autoregressive Transformers Relies Heavily on Context Management [37.1] 本研究では,異なる文脈管理手法により,計算能力が著しく異なることを示す。
我々は、文脈管理が現実の自己回帰変換器の計算力を批判的に決定する中心的な要素であると主張する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:00:24 GMT)
Learning the Error Patterns of Language Models [37.1] プレフィックスフィルタは, LLMの誤りパターンを定量的に解析するのに役立つ。
Palは、TypeScript生成におけるQwen2.5-1.5Bのコンパイル率を60%以上向上させ、Qwen2.5-1.5BがLlama3.1-8Bと同じパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:28:38 GMT)
Reasoning that Travels: Dissecting How Chain-of-Thought Transfers Across Models [37.1] 大きな推論モデルは、最終的な答えを生み出す前に、しばしばチェーン・オブ・ソート・トレースを生成する。
明示的なテキストアーティファクトとして、これらのトレースは他のモデルに渡して同じタスクを解決し、モデル間の推論転送を可能にする。
本稿では,この問題を,より長いトレースプレフィックスから,プロバイダが推論トレースを生成し,レシーバが同じ問題を解く,制御されたプロバイダ-受信者フレームワークを用いて検討する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:47:31 GMT)
What Frozen VLAs Already Know About Success: A Probing Study of Value-Like Structure in Foundation Robot Policies [36.9] ビジョン・ランゲージ・アクション(VLA)ポリシーは、アクションを模倣するように訓練されている。
凍結特性の軽量線形プローブを用いてモンテカルロの結果目標を復元する。
ゲインは普遍的ではなく、追加の推論計算を必要とするが、基礎となる発見はクリーンである。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:23:29 GMT)
ChWDTA: Channel-wise Wavelet-Domain Transformer Attention and Entropy Modeling for Learned Image Compression [36.8] チャネルワイドウェーブレット変換をトランスおよびエントロピー符号化の両方に導入する。
この構成により、提案手法は、Kodak、CLIC Professional Validation、およびTecnickテストセット上での-17.82%、-19.15%、-22.56%のBDレートの削減が得られる。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:36:08 GMT)
A Unified Framework for the Evaluation of LLM Agentic Capabilities [36.4] LLMエージェント能力の公平な評価のための統一的なフレームワークを提案する。
統合された構成システムによって駆動されるこのフレームワークは、様々なベンチマークを標準化された命令-ツール-環境フォーマットに統合する。
我々は15モデルで400Kロールアウトと5Bトークンに対して大規模な実証分析を行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:20:45 GMT)
When Confidence Misleads: Suffix Anchoring and Anchor-Proximity Confidence Modulation for Diffusion Language Models [36.2] 信頼度が完全に非自己回帰的(主に非AR)デコーディングを誤解させる場合について検討する。
本稿では,デコード進行に応じてアンカー近傍の信頼度を変調する訓練不要なSuffix-Anchored Confidence Modulationを提案する。
提案手法は信頼性に基づく完全非AR復号化を一貫して改善し,EOT抑制性能に優れ,完全非AR生成の並列復号化の利点を保っている。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:02:58 GMT)
Chreode: A Cell World Model for One-Step Temporal Dynamics and Perturbation Prediction [35.7] Chreodeは、動作条件のセル状態遷移を予測するワンステップのセルワールドモデルである。
このモデルは、2.4M細胞マウス胚性アトラス上で共有の scVI と DiT ベースの動的バックボーンで事前訓練される。
GEARSの転写可能な遺伝子状態埋め込みとして、事前訓練された動的表現は共有語彙DE20平均二乗誤差を減少させる。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:05:35 GMT)
Turning Video Models into Generalist Robot Policies [35.5] 本稿では、アクションフリーなビデオワールドモデルと、エンボディメント固有の逆ダイナミクスモデルを組み合わせたビデオ対アクションポリシーを提案する。
以上の結果から,分離されたビデオ計画と忠実なビデオ・ツー・アクション翻訳は,ゼロショット,クロス・エボディメント,一般化可能なロボット制御への代替手段となる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:21:58 GMT)
Resolving Endpoint Underfitting in Diffusion Bridges via Noise Alignment [35.0] 拡散ブリッジモデルは、2つのデータ分散を接続するための強力なフレームワークを提供する。
多くの既存手法が標準拡散モデルのスコアマッチング定式化を模倣してこの橋を学習している。
そこで本研究では,この手法がターゲットの終端付近で異常な不適合現象を引き起こすことを発見した。
本稿では,この問題を解決するため,ノイズアラインド拡散橋(NADB)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:07:21 GMT)
From Knowing to Doing: A Memory-Controlled Benchmark for LLM Trading Agents on Stock Markets [34.7] KTD-Finは、エンドツーエンドの株式市場トレーディングベンチマークである。
歴史的市場記憶と投資決定を分離する。
Barraスタイルのパフォーマンス属性フレームワークが組み込まれている。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:57:10 GMT)
VFEAgent: A Multimodal Agent Framework for End-to-End Automated Finite Element Analysis [34.7] VFEAgentは、入力画像と問題記述から直接FEAモデリングとシミュレーションを自動化するために設計されたエンドツーエンドのマルチエージェントシステムである。
VFEAgentは、完全かつ物理的に有効なシミュレーションを生成する上で、高い成功率を達成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:34:04 GMT)
Adaptive Bandit Algorithms for Contextual Matching Markets [34.6] プレイヤーとアームが2つの市場側を占めており、プレイヤーのユーティリティはアームの文脈で線形である。
各ラウンドでは、新しいアームが観測可能なコンテキストと共に到着し、アルゴリズムがプレイヤーにマッチし、安定したマッチングベンチマークに対して各プレイヤーの後悔を最小限に抑える。
これは、潜在分布から引き出されたコンテキストと、任意であるかもしれない敵コンテキストの2つの設定で対処する。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:40:24 GMT)
Learning to Label: A Reinforced Self-Evolving Framework for Semi-supervised Referring Expression Segmentation [34.4] Labelへの学習は、擬似ラベル構成を学習可能な意思決定プロセスとして採用する。
安定した学習を確保するために、探索的決定プロセスとして強化された擬似ラベル選択を定式化する。
RefCOCO、RefCO+、RefCOCOgの実験は、既存の方法よりも改善されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:54:26 GMT)
Dual-branch Distilled Transformer for Efficient Asymmetric UAV Tracking [34.1] EATrackは教師が指導するUAV追跡のための二重分岐蒸留戦略である。
生徒に強い対象表現を学習させることで、表現の弱さを補う。
5つのUAVベンチマークの実験では、EATrackは精度と速度のバランスが良好であることが示されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:20:13 GMT)
SPARD: Defending Harmful Fine-Tuning Attack via Safety Projection with Relevance-Diversity Data Selection [33.9] SPARDは、安全計画代替最適化とRelevance-Diversity対応データ選択を統合した防衛フレームワークである。
GSM8KとOpenBookQAの4つの有害な微調整攻撃による実験は、SPARDが常に最も低い平均攻撃成功率を達成することを示した。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:36:22 GMT)
Device-Agnostic Microwave Noise Metrology for Nonlinear Cryogenic Quantum Devices [33.6] 近接量子制限信号処理が可能なマイクロ波デバイスは、固体量子技術のツールボックスに不可欠なコンポーネントである。
増幅器、ミキサー、アイソレータ等による単一光子マイクロ波信号の操作と読み出しは、信頼性の高い動作を保証するために、信号整合性の観点から厳しい要件を満たす必要がある。
このことは、ポートの参照平面ですべての関連するメリットの値が表現されなければならないため、その特徴付けに課題を生じさせる。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:57:07 GMT)
OSP-Next: Efficient High-Quality Video Generation with Sparse Sequence Parallelism, HiF8 Quantization, and Reinforcement Learning [33.4] OSP-Nextは、疎注意、並列性、量子化、強化学習を統合した効率的なテキスト・ビデオ生成モデルである。
SSPはサブシーケンスをランクに分割し、単一のオールツーオール通信を通じてスパースパターンを切り替える。
実験の結果、OSP-NextはVBenchの総得点が83.73%に達し、Wan2.1ベースラインを上回った。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:19:45 GMT)
REVEAL: Reference-Grounded Reasoning for Multimodal Manipulation Detection [33.3] マルチモーダル操作検出は、偽画像のペアを同時に識別し、改ざんした領域をローカライズすることを目的としている。
人間の比較推論に触発されて、我々はこのタスクを基準基底検証問題として再検討する。
本稿では,この比較パラダイム用に明示的に設計されたフレームワークであるREVEALを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:24:41 GMT)
ConceptM$^3$oE: Concept-Guided Multimodal Mixture of Experts for Interpretable Computational Pathology [33.3] ConceptM$3$oEは、Interaction-Aware Mixed-of-expertsパスに直接概念形成を組み込む。
このアーキテクチャは、エビデンスをモダリティ固有の、冗長で、シナジスティックな専門家に分解し、その後、構造化された概念ボトルネックに投影する。
データ制限付きレシエーションでは、ConceptM$3$oEはデータ制限性能を改善し、小さなトレーニングサイズでマクロF1を56.41%から66.70%に向上させた。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:47:19 GMT)
AsyncTool: Evaluating the Asynchronous Function Calling Capability under Multi-Task Scenarios [33.2] 大言語モデル(LLM)ベースのエージェントは、複雑なタスクを解決するために外部ツールを使用することで、強力な能力を示している。
現実世界のアプリケーションでは、複数のタスクを同時に実行する必要があり、全体的な効率性は、ツールのレスポンスを待っている間にエージェントがアイドルタイムを使えるかどうかに依存する。
我々は,対話型マルチタスクツール使用環境におけるLLMベースのエージェントを遅延ツールフィードバックで評価するためのベンチマークであるAsyncToolを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:36:35 GMT)
HarmoVid: Relightful Video Portrait Harmonization [33.0] 本研究では,前景映像の照度を目標の背景シーンに合わせるために調和させる手法を提案する。
画像とは異なり、ビデオのラベル付きデータを取得することは事実上不可能であり、スケールできない。
そこで本研究では,グローバルおよびローカル照明のフレッカリングアーティファクトを安定化させる新しい照明消灯モデルを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:59:02 GMT)
LRanker: LLM Ranker for Massive Candidates [32.7] 大規模候補ランキングに適したフレームワークであるLRankerを提案する。
LRankerはK平均クラスタリングを利用してグローバルな候補情報を明示的にモデル化するアグリゲーションエンコーダを組み込んでいる。
我々はRBenchの3つのシナリオにまたがる7つのタスクにおけるLRankerの評価を行った。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:04:36 GMT)
Why We Need Speech to Evaluate Speech Translation [32.5] テキストベースと音声ベースの両方の品質評価指標を評価した。
音声信号への直接アクセスが与えられた場合でも、どちらも短くなる。
本研究では,(1)現在エンコーダで音声特徴が確実に保存されていないこと,(2)モデルが音源信号を無視しやすいこと,(3)品質推定訓練データに関連例が多すぎること,の3つの原因を同定する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:41:22 GMT)
Robo-Blocks: Generative Scaffolding in End-User Design and Programming of Social Robots [32.5] 大規模言語モデル(LLM)は、プログラミングとデザイナの意図に取って代わる重要な要素を曖昧にすることができる。
ブロックベースのプログラミング環境であるRobo-Blocksは、構造化された物語を通して、初心者ロボットプログラマが生成する足場をいかに提供するかを示す。
本稿では、生成的足場を効果的に活用するための設計思想と、ソーシャルロボットプログラミングの実践への統合について述べる。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:39:01 GMT)
LiveBrowseComp: Are Search Agents Searching, or Just Verifying What They Already Know? [32.4] LLMベースの検索エージェントは、外部の証拠よりも本質的な知識に依存している。
LiveBrowseCompは、固有のカバレッジ以上のエージェントを評価するために設計されたベンチマークである。
評価されたすべてのエージェントは、クローズドブックの精度を2%以下に抑え、検索強化されたスコアは、BrowseCompと比較して25~40ポイント減少し、以前のモデルランキングは、もはやパフォーマンスを確実に予測することができない。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:39:57 GMT)
MIRAGE: Context-Aware Prompt Injection against Mobile GUI Agents via User-Generated Content [32.2] MIRAGEは、良質なモバイルスクリーンショットをプロンプトインジェクションサンプルに変換するパイプラインである。
重要な課題は、インジェクトされたスクリーンショットは、エージェントを変貌させながら、本物のユーザーコンテンツと視覚的に区別できなければならないことである。
10のアプリケーションと11の攻撃意図にまたがる1,111サンプルのベンチマークでは、5つの評価されたVLMエージェントすべてが脆弱である。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:09:53 GMT)
SEMAGIC: Learning Semantically Consistent Deformable 3D Representations from In-the-Wild Images [32.2] ワンビューインザミルド画像から変形可能な3Dオブジェクトモデルを学習することで、監督なしで印象的な3D形状復元が可能になった。
本稿では,一眼レフ画像から意味的に一貫した変形可能な3次元表現を学習するためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:18:06 GMT)
Mechanistically Interpreting the Role of Sample Difficulty in RLVR for LLMs [31.9] サンプルの難易度はRLVRに非単調な影響を及ぼすことがわかった。
ハードサンプル利用のための難易度適応戦略を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:25:57 GMT)
Which Pretraining Paradigm Better Serves Spatial Intelligence? An Empirical Comparison of Vision-Language and Video Generation Models [31.9] VLM(Vision-Language Models)とVGM(Video Generation Models)の最初の系統的凍結状態探索研究について述べる。
この軽量プローブを用いて,2つのモデルファミリの凍結表現にすでにコード化されている情報について,制御された比較を可能にする。
VLMはセマンティックタグ付けやインスタンスグルーピングが強く、VGMは密な幾何学やカメラの動きに対してよりアクセスしやすい信号を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:20:04 GMT)
Measure-to-measure Regression with Transformers [31.5] 本稿では,M2M回帰問題について検討する。
古典回帰とは対照的に、M2M回帰は全分布をデータポイントとして扱う。
非線形M2M回帰の形式化を提案し、そのような演算子を学習するために、使いやすく、表現的でスケーラブルな2つのアプローチを導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:31:04 GMT)
The Missing Piece in Pre-trained Model Evaluation: Reward-Guided Decoding Unlocks Task-Oriented Behavior Without Parameter Updates [31.5] エネルギーベースデコーディング(Energy-Based Decoding)は、凍結した事前学習モデルからタスク指向の振る舞いを活性化するためのトレーニング不要で報酬誘導型フレームワークである。
EBDは,基本モデル出力をより指示追従行動にシフトさせ,学習後の動作に類似度を増すことを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:25:00 GMT)
Online Irregular Multivariate Time Series Forecasting via Uncertainty-Driven Dual-Expert Calibration [31.4] オンラインIMTS予測の問題について検討し、不確実性駆動型デュアルエキスパートキャリブレーションフレームワークであるUnder-Caliを提案する。
我々は、推論と適応プロセスを共同で管理するコア制御信号として機能する不確実性推定器を設計する。
Under-Caliはソース予測モデルを凍結させ、軽量でモデルに依存しないキャリブレーションモジュールを通してのみ適応を行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:19:41 GMT)
EchoAvatar: Real-time Generative Avatar Animation from Audio Streams [31.3] 本稿では,低レイテンシでストリーミング音声と音楽から連続的でコヒーレントなフルボディモーションを生成するための新しいフレームワークを提案する。
この制御性とストリーム音声駆動合成を組み合わせることで,音声エージェントを対話型ヒューマノイドアバターに変換するためのプラグアンドプレイソリューションとして機能する。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:18:16 GMT)
Learning to target with network interference [31.2] 本研究では,ネットワーク干渉下での適応的ターゲティングについて検討した。
まず、ネットワーク構造を無視し、問題を通常の線形帯域に還元することで、必然的に非効率な学習につながることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:28:52 GMT)
AIBuildAI-2: A Knowledge-Enhanced Agent for Automatically Building AI Models [31.1] AIモデルは、画像やテキスト処理から生物学、物理学、化学における科学的発見まで、データ中心の応用を基盤としている。
しかし、それらの開発は依然として非常に手作業で行われており、実践者はアーキテクチャを設計し、トレーニングパイプラインを構築し、反復的にソリューションを洗練する必要がある。
本稿では,AIモデルを自動的に構築する外部進化型知識システムを備えた知識強化エージェントであるAIBuildAI-2を紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:44:13 GMT)
Single-Rollout Hidden-State Dynamics for Training-Free RLVR Data Selection [31.0] 我々は、RLVRデータ選択を、任意のRLトレーニングの前に選択を行なわなければならない設定で研究する。
推論時隠れ状態ダイナミクスのみに基づく一発学習自由セレクタShiFTを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:38:09 GMT)
World Models for Robotic Manipulation: A Survey [30.9] ロボット操作のための世界モデルについて3つの質問を通して調査する。
我々は,世界モデルを行動条件付き予測システムとして運用的に定義する。
合成経験生成、候補フィルタリング、検索に基づく評価、学習環境、結果検証などのインフラの役割を特徴付ける。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:32:17 GMT)
SPRINT: Efficient Spectral Priors for Humanoid Athletic Sprints [30.3] SPRINTは、効率の良い周波数適応スペクトルプリミティブによって駆動されるフレームワークである。
これらの先行は、広い速度スペクトルにわたって運動学的に実現可能な関節軌道を生成する。
SPRINTはUnitree G1プラットフォーム上でのフィールド実験においてゼロショットのsim-to-real転送を実現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:40:29 GMT)
The Fragility of Chain-of-Thought Monitoring Across Typologically Diverse Languages [30.3] CoT(Chain-of- Thought)モニタリングは,大規模言語モデルにおける不整合性を検出するための,有望な安全性メカニズムとして提案されている。
13の多様な言語と7つのフロンティアモデルファミリーを対象に,CoTモニタリングの大規模評価を行った。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:26:03 GMT)
PRISM: A Multi-Dimensional Benchmark for Evaluating LLM Peer Reviewers [30.1] PRISMは,4次元にわたるレビュー品質を評価するベンチマークフレームワークである。
我々は、ICLR、ICML、NeurIPSの階層化されたレビューコーパスにおいて、主要な自動レビュアシステムと人間レビュアをベンチマークする。
単一のシステムは、すべての次元にわたる人間のベースラインのバランスの取れた性能を一度に一致させるものはない。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:08:55 GMT)
Balancing Plasticity and Stability with Fast and Slow Successor Features [29.7] 持続的環境変化下での安定性と適応がパフォーマンスに与える影響について検討する。
その結果, 可塑性に着目したシナプス強化などの安定性向上手法が優れていることがわかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:46:11 GMT)
Context Distillation as Latent Memory Management [29.7] 我々は,文脈蒸留を潜在記憶管理問題として定式化する。
各コンテキストを独立したLoRAアダプタに蒸留し,モジュール型メモリバンクを形成する。
クエリが与えられた場合、我々のフレームワークは候補メモリを検索し、クエリを最も適切なアダプタにルーティングし、Self-Gatingメカニズムを使用して潜在メモリをアクティベートするかどうかを決定する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:29:40 GMT)
DisasterBench: Benchmarking LLM Planning under Typed Tool Interface Constraints [29.6] 災害は深刻な社会的影響を引き起こし、異種AIツールの迅速な調整を要求する。
効果的な調整には意味論的に妥当なツールを選択する以上のことが必要です。
本稿では,構造化マルチエージェント計画の評価ベンチマークであるDreamaBenchを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:50:23 GMT)
Towards Faithful Agentic XAI: A Verification Method and an Open-World Benchmark for Better Model Faithfulness [29.4] 本稿では,明示的な検証を通じて説明の忠実性を改善するフレームワークであるFithful Agentic XAIを提案する。
FAXは、ドラフト説明をクレームに分解し、本質的に忠実なツールに対してそれらを横断的にチェックする。
CRAFTER-XAI-Benchでは、FAXはシミュレーション忠実度を最強のベースラインで0.20から0.46に改善し、高い情報性、関連性、流布性を維持している。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:56:30 GMT)
OphIn-500K: Curating Web-Scale Visual Instructions for Scaling Ophthalmic Multimodal Large Language Models [29.1] $textbfOphIn-Engine$は眼科固有の命令データキュレーションパイプラインである。
オープンアクセス眼科ウェブスケールビデオから高品質な指導データを構築する。
$textbfOphIn-VL$は、高度な視覚的理解と会話能力を備えた眼科固有のMLLMである。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:43:23 GMT)
ICICLE: Expanding Retrieval with In-Context Documents [29.0] 生成検索(GR)は、パラメトリック知識を用いてクエリを直接ドキュメント識別子(ドクト)にマッピングする。
我々は、パラメトリックメモリとコンテキストが提供する文書とドキュメントのペアの両方に対して、ソース・アウェア・ドシド生成を行う、コンテキスト内インデクシングフレームワークICICLEを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:21:28 GMT)
PetroBench: A Benchmark for Large Language Models in Petroleum Engineering [28.9] このベンチマークは、生産、貯水池、掘削エンジニアリングをカバーしており、複数の選択、真または偽、項定義、短解形式に1200の質問がある。
Gemini-3-Pro, Kimi-K2.5, Claude-Opus-4.6-Thinkingは72%-74%の得点を記録した。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:36:43 GMT)
PointQ-Bench: Benchmarking Diagnostic and Interpretable Point Cloud Quality Assessment [28.9] ポイントクラウドの品質は、3D取得、再構築、レンダリング、知覚において重要な役割を果たす。
本稿では,PCQAをスカラースコアから包括的品質理解へ拡張するベンチマークであるPointQ-Benchを紹介する。
PointQ-Benchは,3,083のポイントクラウドで構成されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:56:36 GMT)
AutoScientists: Self-Organizing Agent Teams for Long-Running Scientific Experimentation [28.8] AutoScientistsは、長期的な計算科学実験のためのAIエージェントの分散チームである。
エージェントは共有された実験状態を解釈し、実験計算を使用する前に、有望な仮説、批判的な提案に関するチームに自己組織化する。
一致した実験予算の下で、AutoScientistsは、バイオメディカル機械学習、言語モデルトレーニング最適化、タンパク質の適合性予測など、AIエージェントを改良する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:56:12 GMT)
ClothTransformer: Unified Latent-Space Transformers for Scalable Cloth Simulation [28.6] 自動回帰シーケンスモデリングとして布シミュレーションを再構成するフレームワークであるClosTransformerを提案する。
このアプローチは3つのコントリビューションを通じてこれらの制限に対処します。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:10:58 GMT)
CLANE: Continual Learning of Actions on Neuromorphic Hardware from Event Cameras [28.6] 我々は、Intel Loihi 2.0上にエンドツーエンドに展開したCLANE(Continuous Learning of Actions on Neuromorphic Hardware from Event Cameras)を紹介する。
CNN+GRU+CLPエッジGPUベースライン上で,100倍以上のエネルギー削減と16倍のレイテンシを実現するとともに,連続的な学習タスクにおいて70.4%の精度を実現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:24:04 GMT)
DiscoForcing: A Unified Framework for Real-Time Audio-Driven Character Control with Diffusion Forcing [27.6] ストリーミングオーディオ駆動拡散フレームワークであるDiscoForcingを紹介する。
不均一ノイズレベル下で訓練された拡散強制シーケンスモデルを用いて、リズミカル構造と位相ダイナミクスをキャプチャする。
因果関係や遅延制約にマッチしたベースラインよりも、より安定したロングホライゾンロールアウトとオーディオモーションアライメントを提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:47:40 GMT)
Case-Aware Medical Image Classification with Multimodal Knowledge Graphs and Reliability-Guided Refinement [27.4] 医療画像分類のためのマルチモーダル知識グラフを用いたケースアウェア推論フレームワークを提案する。
入力画像が与えられた場合、このメモリから類似したケースを適応的に検索し、対応するケース中心のサブグラフを抽出する。
複数の医用画像データセットの実験は、我々のアプローチが強いベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:22:50 GMT)
ChildEval: When large language models meet children's personalities [27.1] 本研究では,LLMの長文会話における子ども中心の嗜好を推論し,フォローする能力を評価するためのベンチマークであるChildEvalを紹介する。
ChildEvalには3-6歳児の29Kのペルソナプロファイルが含まれており、比較的静的な背景情報を提供している。
我々は,オープンソースのLCMを体系的に評価する,きめ細かな子中心評価プロトコルを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:53:42 GMT)
Search for Coverage: Learning Coverage-Aware Retrieval with Augmented Sub-Question Answerability [27.0] 本研究では,包括的検索シナリオに最適化された高密度検索手法であるCoveRを提案する。
CoveRは、カバーベースのコントラストと蒸留の目的を訓練したバイエンコーダである。
実験の結果,CoveRは高密度検索ベースラインよりもナゲットカバレッジを10%向上させることがわかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:20:52 GMT)
From Learning Resources to Competencies: LLM-Based Tagging with Evidence and Graph Constraints [26.7] 本稿では,大規模言語モデル(LLM)を制約付きエビデンス生成タグとして使用するエンドツーエンドアライメントパイプラインを提案する。
我々は,コンピュータサイエンス部門の技術系学部における能力基準から構築したデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:41:10 GMT)
GUI-CIDER: Mid-training GUI Agents via Causal Internalization and Density-aware Exemplar Reselection [26.6] 既存のソリューションは、高価なマルチエージェントの足場や従来のポストトレーニングパラダイムに依存している。
本稿では,GUIの世界知識を因果的内在化と密度認識による模範的再選択によって明示的に内部化する中級学習手法であるGUI-CIDERを提案する。
2つのGUI知識ベンチマークと3つのタスク補完ベンチマークの実験により、GUI-CIDERはエージェントのGUI操作に対する理解とタスク成功率の両方を一貫して改善することを示した。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:29:41 GMT)
Extrapolative Weight Averaging Reveals Correctness-Efficiency Frontiers in Code RL [26.4] 予備的なRLトレーニングを伴わずに,外挿量平均化が新たなチェックポイントにフロンティアを拡張できるかどうかを検討した。
コードRLのネストされた単体テストカバレッジは、外挿重量平均化がナビゲートし、拡張し、活用できる正当性-効率フロンティアを誘導することを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:09:30 GMT)
VDSB-GWSyn: Diffusion Schrödinger Bridge for Controllable and Anatomically Feasible Guidewire Synthesis in Coronary Angiography [26.3] ガイドワイヤによるアノテートCAG画像の不足と既存のガイドワイヤ合成モデルの適応性の制限は、ガイドワイヤエンドポイントローカライゼーションの重要なボトルネックのままである。
複雑な解剖学的背景下での制御可能な高忠実なガイドワイヤサンプルの合成を可能にするモデルベースフレームワークであるVDSB-GWSynを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:35:35 GMT)
Skillful high-resolution weather forecasting independent of physical models [26.3] NWPから派生したデータを使わずに分析と予測の両方を生成するシステムであるObsCastを紹介する。
ObsCastは18時間を通して、表面に近い変数に対する運用上のNWPを上回っ、熟練した降水予測を生成する。
よりシンプルで適応性の高いルートを提供し、地域観測から直接地域予測サービスを構築し、洗練する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:37:36 GMT)
SMILE-Next: Teaching Large Language Models to Detect, Classify, and Reason about Laughter [26.2] SMILE-Nextは,マルチモーダルテキスト表現と質問応答アノテーションを用いた実世界の笑い理解のためのデータセットである。
SMILE-Nextをベースとして,現実の文脈における笑いの微妙な理解が可能な笑い特化大言語モデルの構築を目指す。
我々は、笑い特有の自己指導と、Mixture-of-Laugh-Expertsフレームワークという2つの重要なコンポーネントを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:39:37 GMT)
Law of Neural Interaction: Depth-Width Shape, Interaction Efficiency, and Generalization [26.2] 固定予算の下では、良い一般化は通常、効率的な神経相互作用を伴う。
その結果,R_D/W$は資源利用効率に影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:23:45 GMT)
Skill0.5: Joint Skill Internalization and Utilization for Out-of-Distribution Generalization in Agentic Reinforcement Learning [26.0] Skill0.5は、一般的なスキル内部化とタスク固有のスキル利用を組み合わせることで、スキル処理を明確に区別する新しいエージェントRLフレームワークである。
特典蒸留によって一般的なスキルを内包し、ハードタスクの認知基盤を構築すると同時に、ショートカットをペナルティ化し、特定のスキル利用を強制するための簡単なタスクを診断する。
ALFWorldとWebShopの実験では、Skill0.5はメモリベースのRLベースラインとスキルベースのRLベースラインの両方を上回っている。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:54:33 GMT)
Spectral Guidance for Flexible and Efficient Control of Diffusion Models [25.9] 生成過程の内在的幾何を利用して拡散モデルを制御するためのフレームワークであるスペクトル誘導を導入する。
本研究では,条件付き期待演算子の特異関数として特徴付け,自己指導的目的によって学習可能であることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:11:09 GMT)
Thinned Mean Field Langevin Dynamics [25.8] MFLD(Mean-field Langevin dynamics)はこの一般的な文脈での計算を容易にする。
我々は,各粒子が$mathcalO(Nfrac12)$の薄い粒子コアセットのみと相互作用するtextttKT-MFLDを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:10:34 GMT)
ESC-Skills: Discovering and Self-Evolving Skills for Emotional Support Conversations [25.7] 本研究では,実行可能な感情支援スキルを発見し,自己発展させるスキル中心のフレームワークであるESC-Skillsを提案する。
まず,介入単位 (Intervention Units, IUs) として局所的支援相互作用をモデル化し, 探索状態間の状態-行動-アウトカムのダイナミクス, 支援介入, 反応後の感情変化を捉える。
介入指導,適用条件,期待結果,潜在的なリスクを含む情緒的支援スキルのリポジトリであるESC-Skills Bankを構築した。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:32:12 GMT)
Where LLM Annotators Fail: Label-Free Learning on Graphs with LLMs [25.6] クラスタアウェアノイズ推定(CANE)は,クラスタ条件LLMの信頼性を基礎的な真理ラベルなしで評価する,ラベルフリーな学習フレームワークである。
CANEは、最強のラベルなしベースラインよりも改善されており、クラスタ条件のノイズがより強いデータセットに対する最大のゲインがある。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:41:04 GMT)
Category-Level 3D Correspondence in Camera Space via Morphable Object Priors [25.5] 画像から3Dオブジェクトを理解することは、ロボティクスやAR/VRアプリケーションの基本である。
本研究では,カメラ空間におけるカテゴリレベルの3D対応について検討する。
共有可能な定型オブジェクトを事前に学習することで、明示的な通信監督を伴わずに実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:08:32 GMT)
CubePart: An Open-Vocabulary Part-Controllable 3D Generator [25.4] オープン語彙と部分制御可能な3Dメッシュ生成のための生成フレームワークであるCubePartを提案する。
提案手法は,特定の意味構造を尊重しながら,コヒーレントなオブジェクトに集合するメッシュの集合を生成する。
結果の資産をゲームエンジンに直接組み込むことができ、手動の事後処理なしでアニメーションや動作スクリプトによって駆動できることを実証する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:22:38 GMT)
PRO-CUA: Process-Reward Optimization for Computer Use Agents [25.3] PRO-CUAは、コンピュータ使用エージェントを訓練するためのプロセス・リワード最適化フレームワークである。
政策最適化から政治環境の相互作用を分離する。
エージェント自身の実行状態のトレーニングによる分散シフトを低減する。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:28:26 GMT)
TRACER: Turn-level Regret Matching with Inner Reinforcement Credit for Cooperative Multi-LLM Reasoning [25.1] 大規模言語モデルは、推論を改善するために強化学習またはマルチエージェントにますます依存している。
協調型マルチLLM推論のためのターンレベル強化フレームワークであるTRACERを紹介する。
我々は,GSM8Kトレーニングの分割と,GSM8K,MATH500,GPQA-Diamondにおける局所的なRLスタイルの手法を訓練し,ドメイン内精度,クロスベンチマークの一般化,推論コスト,修正保存行動を測定する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:25:21 GMT)
On the Learnability of Test-Time Adaptation: A Recovery Complexity Perspective [25.1] テスト時適応(TTA)は、ラベル付きデータを必要とせずに、非定常テストストリーム上で信頼性の高いパフォーマンスを維持するためにモデルを適応することを目的としている。
実証的な成功にもかかわらず、非定常ストリーム下でのTTAの学習性は未解明のままである。
本稿では、TTAの学習可能性を研究するための最初の理論的枠組みを提案し、$(,)$-Recovery Complexityと$(,)$-TTA Learnabilityを導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:04:23 GMT)
Bridging the Detection-to-Abstention Gap in Reasoning Models under Insufficient Information [25.0] 本研究は, 検出不良が最終棄権に変換されない場合に, 検出と回避のギャップを形式化する。
このギャップは、医療AIのようなリスクの高い領域において特に関係しており、不完全な証拠は拒絶よりも有害である可能性がある。
本稿では、モデルに明確な応答可能性のコミットメントを与えるための軌道レベルの推論制御フレームワークであるジャッジ・Then-Then(JTS)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:28:25 GMT)
AIRGuard: Guarding Agent Actions with Runtime Authority Control [24.8] ツールを使用する言語エージェントは、モデル決定を外部の副作用に変換する。
本稿では、最小限の権限をアクションタイムの認可として運用するランタイムガードであるAIRGuardを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:48:14 GMT)
CollectionLoRA: Collecting 50 Effects in 1 LoRA via Multi-Teacher On-Policy Distillation [24.7] CollectionLoRAは、エフェクトと数ステップ生成を単一のLoRAに蒸留するフレームワークである。
独立して訓練された教師モデルに匹敵する、あるいは優れた概念の忠実性を達成しながら、デプロイメントのオーバーヘッドを低減する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:52:59 GMT)
Is Backpropagation Optimal? When Synthetic Gradients Improve Sample Efficiency [24.6] 計算グラフ上での損失ベースおよび報酬ベース学習のための統合ベクトル化フィードバックフレームワークを提案する。
合成勾配がバックプロパゲーションよりも低い勾配推定平均二乗誤差が得られる条件を特徴付ける。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:37:04 GMT)
HRBench: Benchmarking and Understanding Thinking-Mode Switch Strategies in Hybrid-Reasoning LLMs [24.6] 本稿では,ハイブリッド推論 LLM における思考モードスイッチングの研究のための統合評価フレームワークHRBenchを紹介する。
HRBenchは,3つのスイッチング戦略ファミリ,プロンプトベースの選択,外部ルーティング,投機的実行という,2つの軸に沿って設計空間を編成する。
Qwen3.5-2B から Kimi-K2.5-1.1T までの6つの LLM と、数学、科学、およびコードをカバーする5つの推論ベンチマークを評価した。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:35:39 GMT)
VeriTrip: A Verifiable Benchmark for Travel Planning Agents over Unstructured Web Corpora [24.5] 既存のベンチマークでは、情報ノイズを考慮せず、複数ソースの事実矛盾を無視し、論理的計画に視覚的認識を根ざす必要性を見落としている。
エージェントの堅牢性と信頼性の増大に対応するために設計された検証可能なベンチマークであるVeriTripを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:14:47 GMT)
Unification and Optimization of Robust Supervised Learning [24.3] 本研究では,頑健な学習を逐次的な段階に分解する学習手順を提案する。
これにより、統合された設計空間が作成され、手元にあるタスクに適した戦略を構成することができる。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:47:50 GMT)
Building Community-Centred NLP Resources for Puno Quechua [24.3] 我々はPuno Quechua(ISO 639-3: qxp)のためのASRリソースを初めて提示する。
ケチュア語で最大の音声コーパスは、台詞と自発音声のための66時間の録音である。
Puno Quechuaの最初の体系的なASRベンチマークでは、最先端のモデルと微調整のWhisper-base、wav2vec2-base、XLS-R-300Mが評価された。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:04:37 GMT)
MemTrace: Tracing and Attributing Errors in Large Language Model Memory Systems [24.2] LLMメモリシステムにおける誤り追跡と帰属の新たな問題について検討する。
本稿では,メモリパイプラインを実行可能なメモリ進化グラフに変換する新しいフレームワークを提案する。
次に、Long-Context、RAG、Mem0、EverMemOSといったメモリシステムから収集されたベンチマークであるMemTraceBenchを構築します。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:53:53 GMT)
Soft-SVeRL: Self-Verified Reinforcement Learning with Soft Rewards [24.0] Reinforcement Learning from Verifiable Rewards (RLVR)は、数学やコードなどの分野における言語モデルを改善している。
本稿では,分解された学習信号から強化学習を行うフレームワークであるSoft-RLVRを紹介する。
自己検証は、過度に許容される自己判断からインフレーションを報いる傾向があり、この崩壊を防ぐために明確な安定化が必要であることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:50:53 GMT)
Refining Multidimensional Video Reward Models via Disentangled Influence Functions [24.0] 本稿では,次元別監視リスクを効率的に見積もるアンタングルの影響フレームワークを提案する。
極端に高リスクなサンプルを除去する次元差分法と、高リスクの監督をソフトに下方修正する次元差分法という2つの次元差分法を導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:26:46 GMT)
Robust and Efficient Guardrails with Latent Reasoning [23.8] 推論ベースのガードレールは、相当なクエリレイテンシとトークンオーバーヘッドを引き起こす。
我々は,多段階の安全推論を連続的な潜伏空間に転送するガードレールモデルであるCOLAGUARDを提案する。
以上の結果から, 潜伏推論は, 展開可能なガードレールに対して, 明示的合理的生成に代わる実用的な代替手段となることが示唆された。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:15:22 GMT)
MRMMIA: Membership Inference Attacks on Memory in Chat Agents [23.8] メンバーシップ推論攻撃(MIA)は、ターゲットデータレコードがシステムのプライベートデータに属するかどうかをテストする。
本研究では,チャットエージェントメモリMIAに着目し,相手が相手のメモリユニットがチャットエージェントのメモリストアに属しているかどうかを推定する。
マルチリコールメモリMIA(Multi-Recall Memory MIA)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:31:40 GMT)
From Talking to Singing: A New Challenge for Audio-Visual Deepfake Detection [23.8] オーディオ・ビジュアル・ディープフェイク検出のための既存の手法は、クロスモーダルな不整合に依存している。
歌唱において、リズム的発声はこの結合を弱め、非自明なドメインシフトを導入する。
歌唱ベンチマークのギャップを埋めるためにリズム認識型生成モデルを用いて歌唱ヘッドディープフェイクデータセットを構築した。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:33:39 GMT)
Stage-wise Distortion-Perception Traversal in Zero-shot Inverse Problems with Diffusion Models [23.4] 歪み知覚(D-P)トレードオフはベイズ逆問題の基本現象である。
ゼロショット逆問題における単一拡散モデルを用いてD-Pトラバースを実現するための段階的フレームワークを提案する。
提案手法はMAP-RPSと呼ばれ,MMSE解を近似したMAP推定段階から始まる。
我々はMAP-RPSを潜伏空間に拡張し、LMAP-RPSを得る。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:35:23 GMT)
A Fresh Look at Lamarckian Evolution and the Baldwin Effect [22.9] ボールドウィンとラマルクの進化は長い間、学術文献や実践的な応用に支配されることなく進化アルゴリズム(EA)において存在してきた。
現代の経験的および理論的手法を用いて、ラマルクとボールドウィンの進化を再考し、それらをダーウィンの進化と厳密に比較する。
我々の結果は、ボールドウィンとラマルクの進化がダーウィンの進化を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:30:39 GMT)
Echoes within the Reasoning: Stealthy and Effective Watermarking via Chain of Thought [22.9] BiCoTは、オーナシップシグナルを推論トレースの内部幾何学に埋め込む透かしフレームワークである。
モデル盗難と表現ドリフトの検証を可能にするために,ロバスト部分空間登録を導入する。
実験によると、BiCoTは様々な複雑な推論タスクにおける推論の忠実さを保っている。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:44:38 GMT)
Let the Results Speak: A Replication-First Paradigm for LLM Behavioral Benchmarking [22.8] 本稿では,1つのヒト・ラタのコンセンサスに有効性を確保するために,複製第一パラダイムを提案する。
楽器を4つの特性で認証する - Kランの信頼性、アーキテクチャ的に異なる審査員間のクロスインストラクトレプリケーション、以前のトレーニングコホートからの審査員による歴史的フットプリントキャリブレーション、事前登録された予測。
本研究は, 自己発達型データ駆動による情緒的伴奏で, 次元は事前に決められず, 手順は9次元に安定化する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:41:11 GMT)
ProRL: Effective Reinforcement Learning for Proactive Recommendation via Rectified Policy Gradient Estimation [22.6] Proactive Recommender Systems (PRSs) は,中間勧告の経路を生成することによって,ユーザの嗜好の目標項目へのシフトを誘導することを目的としている。
プロアクティブなレコメンデーションのための2つの新しいメカニズムを持つ有効RLフレームワークProRLを提案する。
実世界の3つのデータセットに対する実験により、ProRLは最先端のPSSよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:43:37 GMT)
AI, Take the Wheel: What Drives Delegation and Trust in Human-Computer Cooperative Question Answering? [22.5] 人間は自分の判断よりもAIを信頼するかを決める際に間違いを犯すことがある。
我々は、デリゲート選択と採用選択の2つの異なる依存度決定について研究する。
人間は、正しいAI提案を過度に検討し、AIがそれらを誤解した場合に過度に回答するという、最適なコラボレーション決定をする。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:05:16 GMT)
ResearchMath-14K: Scaling Research-Level Mathematics via Agents [22.5] 我々は,マルチエージェントパイプラインを通じて学術資料から計算した一連の問題であるResearchMath-14kを紹介する。
我々は,非試行や製造基準など,繰り返し発生する回避行動を観察した。
我々はResearchMath-14kを今後の研究レベルの数学的推論のために公開する。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:54:41 GMT)
MangaFlow: An End-to-End Agentic Framework for Controllable Story to Manga Generation [22.4] MangaFlowは、コントロール可能なロングフォームマンガ生成のためのフレームワークである。
マンガ作成を計画、接地、レイアウト構成、参照条件付きレンダリング、構成、テキスト配置に分解する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:54:12 GMT)
Routing-Aligned Fine-Tuning for Multilingual Downstream Tasks in Mixture-of-Experts Models [22.4] 既存の微調整アプローチは、事前学習中に発生する異種ルーティング構造を無視して、MoEモデルをモノリシックな学習者として扱う。
並列タスクの例を,英語と対象言語の正確性に基づく4方向分類に分類する3段階のフレームワークであるRA-MoE(Routing-Aligned MoE Fine-Tuning)を提案する。
3つのMoEモデル、3つのタスク、6つのターゲット言語による実験は、RA-MoEが標準のSFTと強いベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:01:25 GMT)
Towards Demystifying and Repairing LLM-in-the-Loop Vulnerabilities [22.3] LLM(Large Language Models)は、現代のソフトウェアシステムに重要なコンポーネントとして積極的に統合されている。
LLMs-in-the-loopの脆弱性では、LLMとその依存する下流コンポーネント(フレームワークなど)が新たなリスクを導入している。
これらの脆弱性は、特にPass@1レートが28.57%であるプロンプトインジェクションを含む場合、正確に修正することがより困難である。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:11:37 GMT)
GUI Agents for Continual Game Generation [22.3] ゲーム生成の評価と改善にはプレイヤーが必要であると我々は主張する。
ブラウザベースのゲーム生成タスク200と,期待されるインプレイ動作のルーリックをペアリングする,新たな評価環境であるPlaytestArenaを紹介する。
本稿では,ゲームエージェントとGUIエージェントが共有メモリを持つ持続ループで動作し,ゲーム生成をコーディングとプレイの対話に変換するPlay2Codeを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:08:48 GMT)
Unified Panoramic Geometry Estimation via Multi-View Foundation Models [22.2] PaGeR (Panoramic Geometry Reconstruction) は、パノラマ領域に強力な3D基盤モデルを持ち上げるためのフレームワークである。
我々の戦略は、3次元再構成のための事前訓練された変換器から始まり、それを統一された高性能モデルに変換することである。
室内環境と屋外環境の両方で我々の手法を広範囲にテストし、最先端のパフォーマンスを実現することを発見した。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:32:56 GMT)
EAPO: Entropy-Driven Adaptive Positive-Negative Sample Weighting for Policy Optimization in Open-Ended QA [22.1] 質問応答に対する強化学習における正および負のサンプルの役割について検討する。
本稿では,正のサンプルと負のサンプルを区別するための報酬平均に基づく戦略を提案する。
EAPOは、応答の多様性と安定性の両方において、一定重量のベースラインを一貫して、実質的に上回っていることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:04:00 GMT)
C-MIG: Multi-view Information Gain-based Retrieval-Augmented Generation for Clinical Diagnosis Reasoning [22.1] 臨床診断のための多視点情報ゲインに基づく検索強化生成フレームワークC-MIGを提案する。
C-MIGは2つの相補的なビュー、検索文書と文書再定義から、凍結参照モデルの下での情報ゲインを推定する。
4つの医学ベンチマークの総合的な実験により、C-MIGはドメイン内およびドメイン外の両方で全てのRAG-RL法の中で最高の性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:20:21 GMT)
SARAD: LLM-Based Safety-Aware Hybrid Reinforcement Learning with Collision Prediction for Autonomous Driving [22.1] 従来のDeep Reinforcement Learning (DRL)は、安全でないランダムな探索と緩やかな収束に悩まされている。
大規模言語モデル(LLM)は、リアルタイム推論操作に固有の遅延を示す。
本稿では,自律走行のためのLLMとDRLを相乗化する安全対応ハイブリッドフレームワークSARADを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:06:34 GMT)
SNLP: Layer-Parallel Inference via Structured Newton Corrections [22.1] 本研究では, 非線形残留方程式の解として, 層間の隠れ状態トレースを扱い, 層間依存性を緩和できるかどうかを考察した。
構造ニュートン層並列性(SNLP)は、ジャコビアン層をより安価なアーキテクチャによるサロゲートダイナミクスに置き換えるトレーニングと推論のフレームワークである。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:46:55 GMT)
Skill-Conditioned Gated Self-Distillation for LLM Reasoning [22.0] SD(On-policy Self-distillation)は、教師側特権情報(PI)を用いて、スパース検証結果を高密度トークンレベルの監視に変換することにより、LCM推論を改善する。
本研究では,非条件模擬ではなく,教師の仮説検証としてスキルベースSDを定式化するスキルコンディション付きゲート型自己蒸留(SGSD)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:49:52 GMT)
Tabero: Learning Gentle Manipulation with Closed-Loop Force Feedback from Vision, Touch, and Language [22.0] 優雅で言語条件のロボット操作のためのベンチマークとモデルスイートであるTaberoを紹介した。
本稿では,分離された力配置命令インタフェースを持つアーキテクチャであるTabero-VTLAを提案する。
本モデルでは,緩やかな指示の下で平均グリップ力を70%以上削減しながら高いタスク成功率を維持している。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:08:21 GMT)
Decoupled Training with Local Reinforcement Fine-Tuning in Federated Learning [21.9] 事前訓練されたビジョンランゲージモデル(VLM)によるフェデレートラーニングは、様々な下流タスクにおいて有望なパラダイムとして現れている。
我々は、クライアントとサーバ間で画像エンコーダとテキストエンコーダを分離する新しいフェデレーションVLMフレームワークであるFedDTLを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:21:49 GMT)
TacSE3: Equivariant SE(3) Motion Estimation from Low-Texture Visuotactile Images for In-Gripper Tracking and Compensation [21.7] TacSE3は触覚運動推定パイプラインであり、低テクスチュア・ビジョタクティルを3次元の非結合力場に変換する。
本手法は, 接触中心運動から平面変換を導出し, 主にせん断関連触覚応答から回転を推定する。
DM-Tacフィンガーチップを用いた実験では、デュアルセンサーセンシングは翻訳・回転のあいまいさを低減し、軸と物体のジオメトリ間の回転追跡をサポートし、軽量な補償信号を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:03:45 GMT)
Unified Synthesis of Compositional Speech and Sound from Free-Form Text Prompts [21.0] フリーフォームテキスト・プロンプト・トゥ・ユニファイド・オーディオ・ジェネレーションという新しいタスクを導入する。
PlanAudioは統合された自己回帰型LLMベースのフレームワークである。
音声・音響・合成のシナリオで評価を行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:15:35 GMT)
OISD: On-Policy Internal Self-Distillation of Language Models [20.8] 近年の強化学習手法は, 粗末な結果レベルの報酬を用いて, 最終出力政策を最適化している。
我々は,最終層から中間表現へ政治上の予測信号を転送することで推論を改善するOISDフレームワークを提案する。
OISDの有効性は,強い推理RLベースラインよりも大きく,一貫した改善がみられた。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:43:10 GMT)
Revisiting ML Training under Fully Homomorphic Encryption: Convergence Guarantees, Differential Privacy, and Efficient Algorithms [20.7] 完全同相暗号(FHE)に基づく機械学習学習における最初の理論的収束解析について述べる。
FHEの整合性に要求される活性化関数と損失関数の近似を用いて、近似勾配勾配の収束を示す。
また、データ非依存の選択を理論的に基礎とした拡張性近似戦略も提供し、これは独立した関心を持つことができる。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:09:01 GMT)
Stochastic Gradient Descent with Momentum is Algorithmically Stable [20.6] 運動量による勾配降下(SGDM)は機械学習において最も広く使われている最適化アルゴリズムの1つである。
我々は,SGDMの総合的な一般化解析をアルゴリズム安定性のレンズを用いて開発する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:17:38 GMT)
Learning Theory of the SVRG: Generalization and Convergence Analysis [20.6] ばらつき低減法 (VR) は, 分散度を低下させる勾配を用いており, その効率性から機械学習における大規模最適化問題の解法として広く応用されている。
本研究は,SVRG(行動可変化グラディエント)をアルゴリズム的安定性のレンズを用いて,代表的VR手法の非空的解析法を開発した。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:17:00 GMT)
SSR3D-LLM: Structured Spatial Reasoning via Latent Steps for Fine-Grained Grounding in Unified 3D-LLMs [20.6] 3Dオブジェクトグラウンドは、自然言語から参照オブジェクトを3Dシーンにローカライズする。
統一インスタンス中心の3D-LLMは、ダイアログ、QA、キャプションと共にグラウンド化を解決することを目的としている。
統一3D-LLMのための構造的接地インタフェースである構造的空間共振3D-LLMを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:45:34 GMT)
AgentGuard: An Attribute-Based Access Control Framework for Tool-Use LLM-Based Agent [20.4] LLMをベースとしたエージェントは、複雑なタスクを達成するために、自律的に関連するツールを起動する能力のために、最近大きな注目を集めている。
最近の研究によると、これらのエージェントは深刻なセキュリティリスクに直面しており、プライバシーの漏洩、金融損失、さらにはシステム全体の妥協につながる可能性がある。
本稿では,ツール利用 LLM エージェントのための属性ベースのアクセス制御フレームワークである AgentGuard を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:28:39 GMT)
ISAC Privacy: Challenges and Solutions for 6G [20.4] 統合センシング通信(ISAC)は,将来の通信ネットワークにおいて有望な機能である。
プライバシーに敏感なISACデータを,位置情報と環境データ,行動データ,生理データという3つのレベルに分類する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:25:39 GMT)
The Cases LJP Never Sees: Prosecution Decision Prediction for More Complete Criminal Liability Assessment [20.2] LJP(Lawal Judgment Prediction)は、刑事訴訟領域におけるAI評価のコアベンチマークとなっている。
我々は,検事レビューを中心に構築された最初の法的AIタスクであるtextbf Prosecution Decision Prediction (PDP)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:32:18 GMT)
Understanding Generalization and Forgetting in In-Context Continual Learning [20.2] コンテキスト内学習により、大規模言語モデルは、プロンプトベースの推論だけで新しいタスクに適応できる。
既存の理論では、ICLをシングルタスク設定で研究しているが、現実世界のプロンプトは、しばしば不均一なタスクのシーケンスを含む。
本稿では,事前学習されたトランスフォーマーが1つのプロンプト内で複数のシーケンシャルタスクをどのように処理するかをモデル化する,コンテキスト内連続学習のための最初の理論的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:31:51 GMT)
IFMTBench: A Comprehensive Benchmark for Multilingual Translation Instruction Following [20.1] 従来のメトリクスは意味的忠実さを捉えるが、制約の順守についての信号はほとんど提供しない。
7つの言語に従う多言語翻訳のベンチマークであるベンチを導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:35:27 GMT)
HardMTBench: Stress-Testing Chinese-English Translation on Knowledge-Intensive Domains [19.9] 汎用機械翻訳ベンチマークは、中国語と英語のペアで飽和状態に達した。
本稿では、中国語と英語の双方向翻訳のための難易度診断ベンチマークであるHardMTBenchを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:16:19 GMT)
Provably Guaranteed Polytopic Uncertainty Quantification for SLAM [19.9] 本稿では、3D-3Dランドマークに基づくSLAMのための保証されたUQアルゴリズムを提案する。
アルゴリズムは、マッピングのための前方UQ、ポーズトラッキングのための後方UQ、ポーズ化合物の3つの基本UQモジュールで構成されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:53:23 GMT)
The Routing Plateau: Understanding and Breaking the Accuracy Limits of LLM Routers [19.8] LLMルーティングは、各クエリのモデルを動的に選択することで、LLMサービスのコスト品質トレードオフを改善するための一般的なアプローチである。
最近の研究では、クラスタリングベースのルータ、学習された分類器、ペアワイズランキング、信頼に基づくアプローチなど、幅広いルーティング方法が検討されている。
kNNを含む多くの手法は、非常によく似た精度を達成し、オラクルルータよりはるかに低い狭い性能範囲に収束する。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:29:01 GMT)
HyperBones: Realtime Bone-driven Neural Garment Simulation with Hypernetwork Conditioning [19.8] 動的衣服シミュレーションのための高速かつ物理的に妥当なアプローチを提案する。
本手法は,独立した粗い成分と細粒度成分からなる縮小空間型ニューラルダイナミクスシミュレータを訓練する。
シミュレータはコモディティGPU上で300FPS以上で動作し、リアルタイムアプリケーションに適している。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:24:44 GMT)
Let Relations Speak: An End-to-End LLM-GNN Soft Prompt Framework for Fraud Detection [19.8] 本稿では,テキストに依存しないソフトプロンプトを用いて,グラフ構造と意味空間をブリッジするLGSPFを提案する。
我々は,マルチリレーショナルトポロジをグラフトークンに変換するための並列グラフニューラルネットワーク(GNN)エンコーダを導入する。
種々の不正検出ベンチマークによる実験により,本手法が最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:21:47 GMT)
Sense Representations Are Inducible Interfaces [19.6] ACROSは凍結保存されたLMに明示的な感覚経路を誘導する。
SmolLM2-360Mでは、ACROSは、同じ誘導変数の3つの使用をサポートしながら、基本的なLM品質を保っている。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:04:35 GMT)
Bridging the Sampling Distribution Shift in Radio Map Estimation: A Trajectory-Aware Paradigm [19.5] 学習に基づく無線地図推定(RME)は、UAV支援無線センシングにおいて重要な役割を担い、カバレッジ予測やネットワーク最適化といったタスクを可能にする。
現在のほとんどの手法では、ランダムサンプリングに基づいて独立に同一に分散されたトレーニングとテストの設定を前提としている。
このミスマッチはサンプリング分布シフトを導入し、空間場回復の本質的な困難を増大させる。
そこで本研究では,Triggered Trajectory-Based (ST-TBS) に基づくトラジェクティブ・アウェア・トレーニング・パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:47:23 GMT)
One LR Doesn't Fit All: Heavy-Tail Guided Layerwise Learning Rates for LLMs [19.5] レイヤワイズラーニングレート(レイヤワイズラーニングレート、Layerwise Learning Rate、LLR)は、個々のトランスフォーマー層に異なるラーニングレートを割り当てる適応型スキームである。
LLRは最大1.5倍のトレーニングスピードアップを実現し、一様学習率ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:11:58 GMT)
Non-Local and Non-Markovian Effects of a Microscopic Two-Level Defect in Superconducting Quantum Circuits [19.5] 微視的二レベルシステム(TLS)は、固体量子デバイスにおける量子ビットデコヒーレンスの主要な原因である。
空間的に離れた2つの超伝導量子ビットに同時に結合するコヒーレントTLSの観測を報告する。
我々の発見は、スケーラブルな量子アーキテクチャにおいて、これまで見過ごされていた相互作用メカニズムを明らかにする。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:58:43 GMT)
Parallax: Parameterized Local Linear Attention for Language Modeling [19.4] 大規模言語モデル(LLM)にスケーラブルなパラメータ化ローカル線形注意法であるParallaxを導入する。
パララックスは、帯域幅、プローブ構成、アフィン構造によって接続される注意機構のファミリーに配置する。
プロトタイプのデコードカーネルは、さまざまなバッチサイズとコンテキストの長さで、FlashAttention 2/3にマッチするか、より優れています。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:50:44 GMT)
RUBRIC-ARROW: Alternating Pointwise Rubric Reward Modeling for LLM Post-training in Non-verifiable Domains [19.3] RUBRIC-ARROWは、ルビリックジェネレータとルビリックコンディショナーを共同で訓練する交互フレームワークである。
提案手法では,確率に基づくスコアリングルールと,位相特異的な選好に基づく報酬との相関を低減し,ポイントワイド評価器を併用する交互GRPO方式を併用する。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:46:25 GMT)
DriveWAM: Video Generative Priors Enable Scalable World-Action Modeling for Autonomous Driving [19.2] 本稿では、事前学習したビデオ拡散変換器を自己回帰型ビデオアクションポリシーに適応させる駆動ワールドアクションモデルDriveWAMを提案する。
DriveWAMは、ビデオストリームとアクションストリームを統合された時間トークンシーケンスに編成し、それらをジョイントフローマッチングの目的の下でトレーニングする。
NAVSIMとPhysicalAI-Autonomous-Vehiclesベンチマークの実験は、DriveWAMが強力な計画性能を発揮することを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:36:26 GMT)
SeeGroup: Multi-Layer Depth Estimation of Transparent Surfaces via Self-Determined Grouping [19.2] SeeGroupは、事前に定義されたグループ化を避けるための多層深さ推定手法である。
我々は,画素ごとの多層深度をポイントプロセスとして定式化し,深度層を各カメラ線に沿って無秩序なイベントとして扱う。
実験により,本手法は多層深度推定の技術を著しく向上させることが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:55:46 GMT)
SSDAU: Structured Semantic Data Augmentation for Joint Entity and Relation Extraction [19.1] 本研究では,拡張中のテキストの意味的構造を保存するために,構造化意味データ拡張(SSDAU)を提案する。
SSDAUはエンティティラベルに基づいてテキストをセグメントし、エンコーダを使用してエンティティの意味的特徴をキャプチャする。
その後、エンティティセマンティック再構築を行い、拡張データを生成する。
実験により、SSDAUはあいまいさに対して優れた堅牢性を持つセマンティック一貫性のあるデータを生成することが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:26:44 GMT)
Fine-Tuned LLM as a Complementary Predictor Improving Ads System [19.1] 本稿では,広告の補完的パラダイムについて紹介する: ランク付けではなく,広告固有の補助予測器として使用する,微調整のオープンソース LLM である。
LLM駆動の広告主予測は、従来の候補生成を強化し、下流ランキングに対する情報的先行情報を提供する。
以上の結果から,検索と後期ランキングの双方において,ターゲットのアシラリー予測がエンド・ツー・エンドのゲインを解き放つ可能性が示唆された。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:19:40 GMT)
Multi-Adapter Representation Interventions via Energy Calibration [18.8] 我々は、エネルギー(MARI)を用いたマルチアダプタ表現のインターベンションを提案する。
特殊専門家が非線形補正パターンを捉え、異なるサンプルに対する適切な介入方向と強度を適応的に決定する、競争力のあるマルチアダプタ機構を導入する。
提案手法は,TruthfulQA,BBQ,安全性ベンチマークの性能を向上するとともに,MMLUやARCといったタスクの汎用性を維持・改善する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:39:58 GMT)
Return-to-Go Is More Than a Number: Q-Guided Alignment for Return-Conditioned Supervised Learning [18.8] 条件付きシーケンスモデル(CSM)は、RTG(Return-to-go)を制御信号として扱うことでポリシーを学習する。
このアライメントを強制するフレームワークであるQ-ALIGN DTを提案する。
本稿では,Q-ALIGN DTが所望のポリシーを効率的に学習し,ほぼ最適に出力できることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:24:35 GMT)
Recursive Vision Transformer with Dynamic Depth and Width Adjustment for Resource-Efficient Image Semantic Communication [18.7] 画像意味コミュニケーションは次世代無線通信システムにおいて重要な要素である。
視覚変換器(ViT)を用いた画像意味コミュニケーションシステムを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:40:19 GMT)
Global Policy-Space Response Oracles for Two-Player Zero-Sum Games [18.7] ポリシー空間応答 オラクルは、大きなゼロサムゲームに平衡計算をスケールする。
人口爆発性は、制限された戦略セットがゲーム全体をどれだけうまく表現するかを測定する。
グローバルPSROは、以前のPSRO法よりも政策イテレーションが大幅に少ないナッシュ平衡を近似する。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:18:33 GMT)
Harness-Bench: Measuring Harness Effects across Models in Realistic Agent Workflows [18.7] 本稿では,リアルエージェントシステムにおける構成レベルのハーネス効果を評価するための診断ベンチマークであるHarness-Benchを紹介する。
ベンチマークには、実用的なエージェント使用パターンから構築された106のサンドボックス化されたオフラインタスクが含まれている。
5,194個の実行軌道にまたがって、完了、プロセス品質、効率、障害挙動のかなりの変化を観察する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:47:35 GMT)
Activation Steering for Synthetic Data Generation: The Role of Diversity in Downstream Safety Detection [18.6] アクティベーションステアリング(AS)は、ターゲット概念に沿った応答を生成するためのデータ効率の手法として登場した。
本研究は,4ドルの概念にまたがって,本質的・外生的評価を伴う2次元的な研究である。
操舵強度の増大は応答の多様性を低下させる。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:59:45 GMT)
Refusal Before Decoding: Detecting and Exploiting Refusal Signals in Intermediate LLM Activations [18.4] その結果, 出力発生前の中間アクティベーションで安全関連挙動が表現されることが示唆された。
本稿では,全モデル適合度評価を部分的に前進パスに置き換え,遺伝的プロンプト探索ループ内でプローブベースのスコアリングを行う,プローブ誘導型AutoDANについて紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:44:36 GMT)
Long Live The Balance: Information Bottleneck Driven Tree-based Policy Optimization [18.4] IB-Scoreは、ステップレベルの推論多様性と正解と共有される相互情報のトレードオフを定量化し、政策の探索・探索バランスを評価する新しい指標である。
Information Bottleneck-driven Tree-based Policy Optimization (IB-TPO)を提案する。
我々の手法はGRPOベースラインを2.9%から3.6%上回り、また他の最先端のオンラインRLアプローチよりも優れています。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:01:42 GMT)
PINE: Pruning Boosted Tree Ensembles with Conformal In-Distribution Prediction Equivalence [18.2] ツリーアンサンブルは、予測性能と解釈可能性の強い機械学習モデルである。
本研究では,分散領域内での強い保証を提供するプルーニング手法であるPINEを提案する。
PINEは圧縮率を最大30%改善し、既存の忠実なプルーニング手法と同等のレベルで予測を保存する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:25:06 GMT)
Thinking as Compression: Your Reasoning Model is Secretly a Context Compressor [18.2] この研究は、思考モデル自体がタスク関連情報を整理することで、自然に長いコンテキストを圧縮できることを明らかにする。
そこで我々は、思考自体を圧縮された文脈として扱う新しい圧縮パラダイムであるThinking as Compression(TaC)を導出した。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:36:01 GMT)
FedMPT: Federated Multi-label Prompt Tuning of Vision-Language Models [18.1] VLM(Vision-Language Models)に基づくマルチラベル認識(MLR)は、トレーニング済みの知識を活用して複雑な認識シナリオに適応することを目的としている。
フェデレートされた学習を必要とする現実的な分散アプリケーションでは、プライベートデータとヘテロジニアスデータを持つ各クライアントにVLMを適用すると、モデルが急激なラベル相関に過度に適合する可能性がある。
我々は、フェデレーションMLR用に設計された最初の方法であるFedMPTを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:51:25 GMT)
Ask Now, Use Later: Benchmarking the Proactivity Gap in Long-Lived LLM Agents [18.1] LLMエージェントは、現在の要求だけでなく、セッション間でユーザーの好みに作用することで、その価値を得る。
しかし、今日のエージェントは、ユーザーがボランティアしているものを保ちますが、何があっても構わないのかを尋ねることはめったにありません。
ユーザーがより多くの問題をエージェントに委譲するにつれ、このギャップの影響は増大する。
ATRBenchは、各ユーザの好みを隠れた土台真理として固定することで測定できる。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:00:58 GMT)
Auditing Training-Free 3D Shape Retrieval with Diffused Geodesic Moments [18.0] DGM(Diffused Geodesic Moments)は,疎熱応答を演算する種条件記述子である。
DGMは、実用的な非スペクトルベースラインとして、およびプロトコル効果を分離する手段として使用される。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:00:41 GMT)
Framing Matters: Addressing Framing Sensitivity in Decision-Making through Behaviorally-Grounded Value Alignment [18.0] 事実保存型だが異なるフレーム型入力は大規模言語モデル(LLM)を著しく不安定にすることができる。
実験の結果, LLMのフレーミングに対する感受性は高く, 平均フリップ率は28.6%であった。
そこで我々は,これらのフレーミング次元を明示的に対象とする表現レベル手法であるValignを提案し,決定を事前に安定な値に固定する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:09:47 GMT)
When Helpful Context Leaks: Privacy Risks in Domain-Adapted ASR [17.9] SpeechLLMは、ドメインのカスタマイズが標準的なプラクティスであるプロフェッショナルな設定にますますデプロイされる。
ドメイン固有の用語を認識するために適応されたモデルは、その文脈から音韻的に類似した単語を転写する。
我々は、迅速なレベルの緩和戦略を評価し、カスタマイズアプローチ間の精度低下トレードオフを分析する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:30:36 GMT)
Conf-Gen: Conformal Uncertainty Quantification for Generative Models [17.9] コンフォーマル予測(CP)とその拡張であるコンフォーマルリスク制御(CRC)は、教師あり機械学習における不確実性を定量化するフレームワークとして確立されている。
我々は、CRCを生成タスクに適用する一般的なフレームワークであるコンフォメーション生成(Conf-Gen)を導入し、理論的な仮定を緩和する。
我々は、非記憶画像を生成する画像生成装置、会話型AIシステムが十分な明確な質問をしてきたこと、正しいAIエージェントの出力など、いくつかの新しい応用を通して、Conf-Genの柔軟性を実証する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:00:00 GMT)
EgoBench: An Interactive Egocentric Multimodal Benchmark for Tool-Using Agents [17.7] ツール使用エージェントのための対話型マルチモーダルベンチマークであるEgoBenchを紹介する。
我々は3段階の相乗的パイプラインを実装し、各タスクは視覚知覚とツール強化マルチホップ推論の併用を強制的に行うように設計されている。
また,エージェントのインタラクション能力を評価するために,EgoBench内のマルチエージェントシミュレーションユーザを開発した。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:28:15 GMT)
AREA: Attribute Extraction and Aggregation for CLIP-Based Class-Incremental Learning [17.7] CIL(Class-Incremental Learning)は,現実世界の学習システム構築において重要である。
CLIにおける属性抽出とアグリゲーションのためのAREAを提案する。
実験の結果、AREAはSOTA法よりも一貫して優れていた。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:58:16 GMT)
Structure-Guided Visual Perturbation Neutralization for LVLMs [17.4] 大規模視覚言語モデル(LVLM)のための軽量・プラグアンドプレイ防衛フレームワークを提案する。
私たちの研究は、コストのかかるモデルトレーニングを必要とする防衛の軽量な代替手段を提供し、効率的な敵防御のためにビジョンエンコーダを利用する可能性を強調します。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:57:46 GMT)
Ω-QVLA: Robust Quantization for Vision-Language-Action Models via Composite Rotation and Per-step Scaling [17.4] Omega-QVLAは、Vision-Language-Action(VLA)モデルのためのトレーニング不要のポストトレーニング量子化フレームワークである。
言語バックボーンと拡散アクションヘッド全体を均一なW4A4精度に圧縮し、混合精度の割り当てを必要としない。
LIBEROでは、Omega-QVLA が Pi 0.5 と GR00T N1.5 を 98.0% と 87.8% のタスク成功率で W4A4 に圧縮し、FP16 参照の 97.1% と 87.0% をマッチングまたは超過し、静的メモリのフットプリントを 71.3% 削減した。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:55:01 GMT)
Semi-Supervised Hypothesis Testing by Betting on Predictions [17.3] 本稿では、ラベルのないデータに対する予測を利用して、シーケンシャルな仮説テストのパワーを高めるテスト・バイ・ベッティング・フレームワークを提案する。
予測による推論を含むベースラインアプローチよりもパワーゲインを実証する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:28:28 GMT)
ST-ColoNet: Spatio-Temporal Colon Segment Recognition via Hybrid Attention and Edge-Guided Feature Learning [17.3] 既存の自動認識手法は、時間的情報を完全に活用することなく、大腸内視鏡画像のみを使用するため、性能は低下した。
時空間ネットワーク(ST-ColoNet)を用いた2段階の深層学習フレームワークColo-Segment Recognitionを提案する。
我々は,コロセグメンテーション認識のタスクにおいて最先端の性能を達成でき,精度が81.0%,F1スコアが70.7%であることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:12:17 GMT)
Treatment Effect Estimation with Differentiated Networked Effect on Graph Data [17.2] 観察グラフデータから個別治療効果(ITE)を推定することは、商業や医療などの分野における意思決定に不可欠である。
既存の手法は、正確なITE推定のためにそのような干渉をモデル化しようとする。
本稿では,2つの部分的注意機構とメッセージアンプを組み込んだ干渉モデリング機構を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:15:59 GMT)
Computational Modeling of Antibody-Antigen Complexes: PLM-Based and MSA-Based Approaches [17.2] 本論文は, 抗体関連課題がなぜ難しいのかを考察し, 2つの相補的な方向による改善を提案する。
まず,タンパク質言語モデル(PLM)を用いた抗体および抗体-抗原構造予測法について検討する。
第2に,MSAによる抗体抗原複合体予測のための2つの介入法を開発した。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:43:52 GMT)
Anomaly as Non-Conformity via Training-Free Graph Laplacian Energy Minimization [17.2] 教師なし異常検出は、通常、クエリパッチと通常のパッチのメモリの特徴的類似度を測定することで解決される。
本稿では,クエリパッチの非整合性のコストでAnomalyをスコアする,トレーニングフリーなラプラシアングラフエネルギー最適化式ANoCoを提案する。
標準ベンチマーク全体では、強力なイメージレベルのAUROC、安定したローカライゼーションマップ、以前の方法よりも堅牢性が改善されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:58:56 GMT)
LoSATok: Low-dimensional Semantic-Acoustic Tokenizer for Cross-Domain Audio Understanding and Generation [17.0] 既存の統一トークン化器はどちらも高次元連続ラテントで共同に符号化する。
クロスドメイン音声の理解と生成のための低次元オーディオトークンであるLoSATokを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:56:45 GMT)
PilotTTS: A Disciplined Modular Recipe for Competitive Speech Synthesis [17.0] 本稿では,軽量自動回帰音声合成システムPilotTTSを提案する。
PilotTTSは,最小限のアーキテクチャと厳格なデータエンジニアリングを通じて,競争力のあるパフォーマンスを実現する。
PilotTTSは、オープンソースツールで完全に処理されたわずか200K時間のデータでトレーニングされている。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:28:23 GMT)
From Fact Overwriting to Knowledge Evolution: Causal Editing via On-Policy Self-Distillation [16.9] 我々は、明確な因果関係の物語の更新が、この紛争率を6.6%に事実上崩壊させると論じている。
因果ブートストラップと非対称なオン・ポリケート蒸留を結合することにより、CODEは因果遷移論理を直接パラメトリックメモリに彫る。
LLaMA-3.1とQwen-2.5の実験では、CODEは堅牢なマルチホップ精度(最大83.5%)を確保しながら、自己難燃を1.8%まで劇的に抑制している。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:59:54 GMT)
AI in the Workplace: The Impact of AI on Perceived Job Decency and Meaningfulness [16.9] 本稿では,AIが仕事の満足度に与える影響を,現在と未来における仕事の落ち着き感と有意義感の認識を通して検討する。
その結果,AIが仕事の満足度に与える影響は,職業領域によって異なることが明らかとなった。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:13:41 GMT)
PrionNER: A Named Entity Recognition Dataset for Prion Disease Biomedical Literature [16.8] 生物医学文献から幅広い臨床関連物質を捉えるために設計されたデータセットは公開されていない。
PubMed抄録にプリオン病臨床情報のための手動アノテーション付きエンティティ認識データセットPrionNERを紹介する。
現在のリリースでは、317の要約、2,943の文、6,955のテキストバウンドエンティティアノテーションが15の粗い粒度と31の微細な臨床指向エンティティタイプにまたがっている。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:15:36 GMT)
Lightweight Complementary-Cue Fusion for Robust Video Face Forgery Detection [16.8] 2つの手工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工芸工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工工
Xceptionベースラインモデルに基づいて、低周波ウェーブレット分解特徴(WDF)と位相スペクトルチャネルを組み合わせた1x1畳み込みを加えたLFWSという2つの検出器を構築した。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:51:04 GMT)
From Accuracy to Auditability: A Survey of Determinism in Financial AI Systems [16.8] 規制された金融環境における機械学習は、アルゴリズムの脆弱性に重大な脆弱性を露呈する。
ディープニューラルネットワークと生成AIは、ハードウェアとアーキテクチャに根ざした機械的非決定性を導入している。
この調査は、現在金融AIを支配している3つのモダリティにわたる障害に関するシステム視点を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:26:09 GMT)
Hallucination Detection-Guided Preference Optimization for Clinical Summarization [16.8] 大規模言語モデル(LLM)は要約タスクを約束するが、幻覚を生成することが多い。
幻覚検出器を用いて反復的なリビジョンを導出する推論時間法であるitermodelfull(itermodel)を導入する。
そこで本研究では,検出器誘導精製軌道をモデルファインタニングのための選好ペアに変換する優先学習(Preference Learning, モデル)のイテラーモデルを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:24:26 GMT)
Decentralized Parameter-Free Online Learning with Compressed Gossip [16.7] エージェントがグラフ上で通信し、メッセージが圧縮される場合、分散化されたオンライン凸最適化について検討する。
コインベッティング予測と圧縮差分に基づくゴシップを組み合わせた分散パラメータフリーオンライン学習アルゴリズムDECO-EFを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:37:00 GMT)
ReasonBreak: Probing Vulnerabilities in Reasoning-Enabled Vision-Language-Action Models for Autonomous Driving [16.6] 統合推論を用いたビジョン・ランゲージ・アクション(VLA)モデルは、エンドツーエンドの自動運転のために提案されている。
これらのモデルが現実的な入力摂動に対して非常に脆弱であることを示し、推論において最大89%の攻撃成功率(ASR)を達成した。
本稿では,推論のセマンティックな側面と構造的側面を,安全中心の尺度とともに把握する推論認識評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:21:37 GMT)
MemCog: From Memory-as-Tool to Memory-as-Cognition in Conversational Agents [16.6] 本稿では,メモリアクセスを推論プロセスの不可欠な部分とするメモリ・アズ・認知システムを提案する。
MemCogはユーザ知識をNavigable Memory Storeとしてアソシエーションリンクグラフで整理する。
また,プロアクティブメモリトリガ評価のための最初のベンチマークであるProactiveMemBenchを構築した。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:48:33 GMT)
MaskClaw: Edge-Side Personalized Privacy Arbitration for GUI Agents with Behavior-Driven Skill Evolution [16.5] MaskClawはGUIエージェントのためのエッジサイドのプライバシー仲裁ツールである。
ローカルな視覚的証拠を抽出し、ユーザとタスク固有のポリシーメモリを取得し、Allow、Mask、Askを決定する。
5つの設計されたスキル進化シナリオでは、修正、キャンセル、編集を再利用可能なプライバシースキルに変える。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:51:22 GMT)
Deep Neural Network Training as Random Effects: An Optimization-Inference Duality [16.2] ディープニューラルネットワーク(DNN)は目覚ましい実験的な成功を収めた。
この研究は、DNNトレーニングを統計的推論として再設計し、ディープニューラルネットワークのトレーニング期間とトレーニング期間を決定するための原則的な基盤を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:32:24 GMT)
Adaptive Coarse-to-Fine Subgoal Refinement for Long-Horizon Offline Goal-Conditioned Reinforcement Learning [16.2] 我々は,実行前に遠隔目標を適応的に洗練する完全オフライン目標条件強化学習フレームワークを提案する。
OGBenchの実験は、提案された改善と停止機構を検証し、いくつかの長期的タスクに対してかなりの効果を示した。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:17:01 GMT)
Bridging Chemists and AI: An Expert-Augmented Framework for Interpretable Route Evaluation [16.1] 我々は、機械学習と化学者のドメイン知識を統合する、専門家によるデータ駆動スコアリングフレームワークを導入する。
DeepSetsベースのモデルは、参照とマシン生成ルートの間のツリー編集距離を使用してトレーニングされる。
その結果,カテゴリ評価予測のためのスピアマン相関係数0.78,ピアソン相関0.77が得られた。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:15:51 GMT)
A Matter of TASTE: Improving Coverage and Difficulty of Agent Benchmarks [16.0] ツール・シークエンス・エボリューションによるタスク・シンセサイザー(TASTE: Task Synthesis from Tool Sequence Evolution)を提案する。
TASTEはクラスタリングを通じてプールから代表シーケンスを選択し、それらを完全なベンチマークタスクにインスタンス化し、難易度進化を通じてそれらを洗練する。
以上の結果から,既存のベンチマークにおける高いスコアは,頑健なタスク解決能力よりも飽和度を反映していることが示唆された。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:45:59 GMT)
HELEA: Hard-Negative Benchmark and LLM-based Reranking for Robust Entity Alignment [16.0] 品質管理評価ベンチマークを同時に生成する同名のハード負拡張戦略を提案する。
また,HELEAは (i) エンティティ検索エンコーダを1ホップKGコンテキストで学習し, (ii) LLM ベースの再評価を追加トレーニングなしで行うための2段階のフレームワークである。
HELEAはDW-HN29KでF1 0.967を達成し、Hit@1 0.993を標準DW-15Kで維持する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:04:12 GMT)
Inpainting-Style Conditional Diffusion for Multivariable Time Series Forecasting [16.0] 本研究では,多時間時系列太陽予測パワーのための条件拡散に基づくフレームワークを提案する。
提案手法は,スライディングウインドウのパッチ構成を用いて,時間PVデータを構造化された2次元表現として再構成する。
GEFCom2014を含むベンチマークPVデータセットで実施された実験は、このアプローチが高い予測精度を達成することを実証している。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:25:28 GMT)
A Tutorial on Diffusion Theory: From Differential Equations to Diffusion Models [15.9] 拡散モデルは、生成モデリングの主流のフレームワークとして現れてきた。
このチュートリアルは微分方程式の観点からこれらの視点を統一的で自己完結した説明を提供する。
このチュートリアルは、拡散過程の解析的基礎とそれらの上に構築された現代的な生成アルゴリズムの間の橋渡しとして意図されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:34:42 GMT)
POINav: Benchmarking and Enhancing Final-Meters Arrival in Real-World Vision-Language Navigation [15.9] 実世界のPOIゴールナビゲーションのクローズドループ評価のための最初のベンチマークであるPOINav-Benchを提案する。
実世界の捕獲から復元された11の商業地域を3Dガウススプラッティング(3DGS)で構成し、合計で126,398$m2$をカバーし、163の異なるPOIをカバーしている。
トラバーサビリティを意識したアノテーションと参照トラジェクトリにより、POINav-Benchは現実的なPOIリッチな現実世界環境におけるナビゲーションエージェントの高忠実度評価を可能にする。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:50:16 GMT)
Looking Farther with Confidence: Uncertainty-Guided Future Learning for Sequential Recommendation [15.9] シークエンシャルレコメンデーションは、動的ユーザの興味を効果的にモデル化するが、データの分散に関する課題に直面し続けている。
適応型将来の学習フレームワークであるUFRecを提案する。
提案手法は, 将来的なデータを活用することによって, 最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:51:23 GMT)
PortBench: A Correlation-Aware, Full-Pipeline Benchmark for LLM-Driven Portfolio Management [15.7] LLMは様々な財務業務において高いパフォーマンスを示してきたが、ポートフォリオ管理(PM)はいまだにベンチマークが不十分である。
PortBenchは、10年間で6つの異種資産クラスにまたがるベンチマークです。
静的な財務QAの性能は高いが、モデルに目立った組み合わせの90%は、基本的等重量割当を上回りません。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:08:23 GMT)
Diagnosing Live Within-Policy Instruction Conflicts in LLM Agents with Witnessed Resolution Profiles [15.7] LLMエージェントは、長期にわたる自然着色促進ポリシーによって管理されるが、個々に合理的なスタンディングルールは、無視できない方法で相互作用することができる。
実生活におけるルール・コンフリクトの診断について検討し、現実的な状態を共同統治できる単一のプロンプトポリシーの中でルール・ペアを見つける。
我々は、Witnessed intra-policy Rule Evaluation PipelineであるWIREを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:09:45 GMT)
Evaluating the Feasibility of Inferring Dietary Behavior Change Receptivity from Egocentric Images of Eating Environment [15.6] 自己報告に基づく行動変化の受容性は疎結合で遅延しており、継続的監視における実用的使用を制限している。
本研究では,ウェアラブルカメラで収集した自我中心の摂食画像から,参加者の自己申告行動変化受容度を推定するパイロット調査を行った。
予備実験の結果は、行動変化受容率指標のための単純なベースラインモデルよりも有望な改善を示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:44:35 GMT)
Retrieval, Reward, and Training Protocols: What Matters in Training Search Agents? [15.6] 本稿では,探索エージェント訓練の3つの未探索次元を分離する制御的実証的研究について述べる。
まず、広く使われているWikipedia 2018コーパスにおける重要なデータカバレッジの問題を特定し、それを修正するだけで、トレーニングアルゴリズムの違いよりも大きな利益が得られることを示す。
第2に、結果に基づく報酬法とプロセスに基づく報酬法を3つのベースモデルで体系的に比較し、最も単純な結果に基づくアプローチが、ほとんどの設定において、競争力や優れたパフォーマンスを達成することを発見した。
第三に、トレーニングデータの多様性、非政治データ利用、検索予算のスケーリングを分析し、効果的な検索エージェントの訓練のための実践的ガイドラインを精査する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:04:36 GMT)
Deconstructing Spatial Complexity: Hierarchical Decomposition for LLM Spatial Reasoning [15.5] 本稿では,LLM空間推論における階層的タスク分解の新しい手法を提案する。
本手法は,ナビゲーション,計画,戦略ゲームなどの空間的タスクにおけるLLM性能を大幅に向上させる。
この研究は、現実世界のアプリケーションにおけるLLMの道を開いた。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:26:57 GMT)
Towards Reliable Multilingual LLMs-as-a-Judge: An Empirical Study [15.5] 大規模言語モデル(LLM)は、生成したテキストの自動評価にますます利用されている。
本研究は多言語LLMs-as-a-judgeを開発するためのいくつかの戦略を探求する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:33:58 GMT)
Machine Learning methods for event classification and vertex reconstruction of the 12C + 12C reaction with the MATE-TPC [15.4] この研究では、機械学習技術を用いて、MATEという名前のTPCから12C + 12C核融合反応の複雑なデータを分析する。
残留ニューラルネットワーク (ResNet-50, ResNet-34, ResNet-18) とVisual Geometry Group (VGG-19) を用いて, 12C+12C反応による弾性散乱および核融合反応を分類した。
4つのモデルの分類結果はほぼ同一であり、シミュレーションデータでは約97%、実験データでは90%である。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:46:03 GMT)
MeniOmni: A Structured Multimodal Benchmark for Holistic Meniscus Injury Assessment [15.4] 半月板損傷評価のための構造化マルチモーダルベンチマークである Meni Omni を紹介する。
Meni Omniは746のマルチセンターMRI研究と3つのプラナーボリュームインプット、臨床優先事項、専門家が注釈を付けた臨床テキストから構成されている。
臨床関連性を良く反映するために,リスク対応順序評価と意味整合度尺度(Meni-Score)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:44:46 GMT)
FedEHR-Gen: Federated Synthetic Time-Series EHR Generation via Latent Space Alignment and Distribution-Aware Aggregation [15.3] FedEHR-Genは、分散病院にまたがる時系列EHR生成のための最初の連合フレームワークである。
病院間のセマンティックな整合性を確保するため,局所エンコーダをグローバルな潜在空間に整合させる階層的整合性アグリゲーション機構を開発した。
eICUとMIMIC-IIIデータセットの実験は、FedEHR-Genが、集中的なトレーニングに匹敵する世代知性、下流ユーティリティ、プライバシリスクを達成することを示した。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:17:08 GMT)
ICAN-Deploy: Identity-Stable Canary Deployment for Safety-Critical Embodied Agents [15.3] Canaryデプロイメントは、トラフィックの一部を新しいソフトウェアバージョンにルーティングし、メトリクスを監視し、レグレッションをロールバックする。
ICAN-Deployは、状態マシンが実行時にそのIDハッシュをカナリアウィンドウに保持する構成である。
アイデンティティ生成時に一度認証されたシステムは、同じ認証の下で任意の能力進化を出荷することができる。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:52:55 GMT)
SetupX: Can LLM Agents Learn from Past Failures in Functionality-Correct Code Repository Setup? [15.3] リポジトリのセットアップの目的は、実行環境(依存関係、ビルドスクリプトなど)を設定して、リポジトリのドキュメント化された機能を実行することだ。
依存関係の不互換性、ツールチェーンの欠如、不完全なインストール、検証ストラテジーのミスマッチなど、リポジトリ固有のさまざまな障害が原因で、大きな課題が発生している。
既存のエージェントは、リポジトリ間のエクスペリエンス転送、非可逆的な状態変更によるマルチステップトライアルとリペア、セットアップによる障害とリポジトリバグを区別するためのセットアップ結果の堅牢な検証をサポートするのに苦労している。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:01:59 GMT)
Knowledge Offloading: Decomposing LLMs into Sparse Backbones and Memory Modules [15.3] 本稿では,事前学習したLDMを,疎結合のバックボーンとドメイン固有の記憶に組み込むフレームワークを提案する。
3Bから8BまでのLlamaモデルとQwenモデル全体で、モデル能力に大きな損失を伴わずに、非自明なキャパシティを共有バックボーンから移動できることが判明した。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:29:31 GMT)
MIRA: A Bilingual Benchmark for Medical Information Response Audit [15.2] MIRA(Messical Information Response Audit)は、大規模言語モデルが、ユーザ側言語、レジスタ、健康リテラシー信号に匹敵する医療情報を提供するかどうかを評価するベンチマークである。
MIRAには、医学的にレビューされた低リスクの健康問題60件から4,320件のプロンプトが含まれている。
5つの主要なLCMで、モデルはすべての医学的疑問に答えたが、健康リテラシーの低い信号に対する反応は、常に重要な情報を省略した。
知識誘導による緩和は、ほとんどのモデルにおいて情報希釈を減少させる。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:28:03 GMT)
Position: Retire the "Positive Backdoor" Label -- Secret Alignment Requires Strict and Systematic Evaluation [15.2] このポジションペーパーは、AI/MLコミュニティは「肯定的なバックドア」というラベルを誇張し、廃止するのをやめるべきであると主張している。
トリガーアクティベートされた隠された振る舞いはシークレットアライメントとして扱われるべきである、と氏は主張する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:15:47 GMT)
Self-Supervised Online Robot-Agnostic Traversability Estimation for Open-World Environments [15.0] 自己監督型オンライントラバーサビリティ推定により、ロボットはラベルのないオープンワールド体験から継続的に学習することができる。
我々は,マルチモーダルでラベルなしのロボット体験から連続的トラバーサビリティ推定を行うオンライン学習フレームワークCOTRATEを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:08:07 GMT)
Structured Prompt Optimization Meets Reinforcement Learning for Global and Local Interpretability over Complex Text [15.0] LLMには高度なテキスト分類があるが、既存のパラダイムはトレードオフに直面している。
我々は,eXTCを3段階に分けて導入し,SOPを学習し,LLMから小型LMへの蒸留を推理し,初期のSOPを超えて推論能力を拡張した。
この設計は、(i)コンパクトなLMによる高速な推論を可能にし、(ii)推論時局所的推論トレースと、(ii)学習されたドメインルールのグローバルなモジュラーな説明と、(iii)分類性能と説明品質の両方において、既存のパラダイムを著しく上回り、ステージバイステージゲインを実現している。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:29:41 GMT)
Dimensionality Reduction for Robust Federated Learning: A Theoretical Analysis and Convergence Guarantee [15.0] Federated Learning (FL)は、クライアントが生データを共有せずにモデルを協調的にトレーニングすることを可能にするが、ビザンティン攻撃に対して非常に脆弱である。
既存の堅牢なアプローチはこれらの脅威を中和するが、かなりの計算オーバーヘッドを発生させる。
ベクトルレベル距離に基づくロバストアグリゲータのための普遍加速度フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:39:47 GMT)
Affective Music Recommendation: A Rollout-Based World Model for Offline Preference Optimization [14.8] LUCIDの健康・健康プラットフォーム上に展開されたAffective Music Recommendation SystemであるAMRSについて述べる。
AMRSは、使用可能な忠実度を持つ行動信号と感情信号の両方を予測する。
オンライン実験が倫理的に不可能な場合に、情緒的推薦のための方法論を早期に導入した検証として位置づける。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:58:46 GMT)
Hierarchical Synthetic Tabular Data Generation: A Hybrid Top-Down and Bottom-Up Framework [14.7] テクスチャから意味構造を分離する階層型ハイブリッドトップダウンとボトムアップ(H-TDBU)フレームワークを提案する。
実験結果から,H-TDBUアプローチはニューラルベースライン法よりも列車合成-テスト-リアル性能を向上させることが示された。
この結果から,階層型規則誘導合成は,合成データ生成における制御性,セマンティックコヒーレンス,統計的忠実度を結合する有効なメカニズムを提供すると考えられる。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:21:47 GMT)
SmartDirector: Keyframe-Conditioned Cinematic Video Generation with Narrative Pacing Control [14.7] 本稿では,映像生成モデルの物語能力を高めるフレームワークであるSmartDirectorを提案する。
SmartDirectorは、シングルショット生成、マルチショットナラティブ合成、ビデオ拡張など、フレキシブルな生成シナリオをサポートする。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:16:09 GMT)
How Far Can Disaggregation Go? A Design-Space Exploration of Attention-FFN Disaggregation for Efficient MoE LLM Serving [14.6] 本研究では,デバイス上でのカーネル計測と高忠実度ネットワークシミュレーションを融合したフレームワークを用いて,AFD(Attention-FFN Disaggregation)のメリットと限界について検討する。
厳格なTTFT/TPOT SLOの下では、AFDはチャット、コーディング、エージェントコーディングのワークロード間でDeepSeek-V3.2で約4kトークン/秒のシステムスループットを維持できる。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:55:57 GMT)
VEOcc: Voxel-Centric Online Semantic Occupancy Prediction For Embodied Scene Understanding [14.4] 本稿では,認識・同化パラダイムとして定式化されたボクセル中心のフレームワークVEOccを提案する。
VEOccは、初期スケール推定の必要性をなくすことで、高度に合理化され、オープンな地図展開を可能にする。
Occ-ScanNetとEmbodiedOcc-ScanNetの実験では、VEOccがローカル設定とエンボディ設定の両方で新しい最先端のパフォーマンスを確立することが示されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:25:53 GMT)
Democratizing Large-Scale Re-Optimization with LLM-Guided Model Patches [14.2] 本稿では,大規模言語モデル(LLM)がORエキスパートとして機能するエージェント的再最適化フレームワークを提案する。
提案フレームワークは,デプロイされた最適化モデルの対話的かつ連続的な適応を可能にする。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:54:52 GMT)
Misalignment Between Backpropagation and the Hierarchy of Brain Responses to Images [14.1] 逆伝播勾配はfMRIおよびMEG信号を確実に予測できることを示す。
しかし、これらの脳の逆伝播勾配の空間的・時間的構造は、生物学的にもっともらしい逆伝播機構の下で期待されるパターンから分岐する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:20:31 GMT)
Better Accuracies, Worse Reasoning: A Step-Level Audit of Medical Chain-of-Thought Distillation [14.1] チェーン・オブ・シンクレット(CoT)蒸留は、教師の推論の痕跡を模倣するために、より小さなモデルを訓練する。
回答の品質向上とトレースの改善が伴うかどうかを問う。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:55:24 GMT)
BiasEdit: A Training-Free Bias-Detect-and-Edit Framework for Learning Fair Visual Classifiers [13.8] このフレームワークは、元のデータセットからバイアス属性を自動的に検出し、それらを編集してバイアス付きデータセットを構築する。
本手法は手動のアノテーションを使わずに動作し,市販の視覚誘発編集モデルを活用する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:17:58 GMT)
Bilinear Coordinate Alignment for Training-Free Task-Vector Transfer [13.8] 事前訓練されたモデルの新バージョンが利用可能になると、微調整によって得られた専門知識を直接再利用することはできない。
本稿では、Bilinear Coordinateアライメントを介してタスクベクトルを転送するためのトレーニング不要なフレームワークであるBiCoを提案する。
BiCoは、幅、深さ、トレーニング前の設定が異なるモデル間で、既存の転送メソッドを一貫して上回る。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:10:34 GMT)
Expressive Power of Floating-Point Neural Networks with Arbitrary Reduction Orders and Inexact Activation Implementations [13.8] 汎用的な浮動小数点実行セマンティクスに基づく浮動小数点ニューラルネットワークの表現力について検討する。
第1層における各異なる入力を識別する能力は、普遍的な表現性に必要であることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:30:41 GMT)
Roles with Rails: Contract-Preserving Role Evolution in Multi-Agent Structured Reasoning [13.8] ロールベースのマルチエージェントシステムは適応的なロールプールを必要とするが、そのようなシステムを適用することは単なる迅速な最適化の問題ではない。
既存のシステムは、ロールインベントリを修正して適応性を失うか、制約のない世代がロールドリフトを誘発することを可能にする。
これをコントラクト保存ロールの進化として定式化し、コミットされたすべての編集が5つの構造的コントラクトを保存する必要があります。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:00:44 GMT)
Simultaneous Contact Selection and Planning for Contact-Rich Manipulation with Cascaded Optimization [13.6] 本稿では、接触リッチな操作を堅牢にするための最適化ベースのフレームワークを提案する。
接触ダイナミクスとスパース勾配の相補性のため、アクティブな接触位置選択は困難である。
同時接触選択とプランニングは,不正確な力学と知覚ノイズの下で多様な操作行動と頑健な制御をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:07:19 GMT)
Feedforward 3D Editing Learns from Semantic-Part Transformation [13.6] フィードフォワード3D編集における中心的な課題は、高品質なペア管理の欠如にある。
スケーラブルなフィードフォワード3D編集はセマンティック部分変換から学習されるべきである。
PartFlowはフィードフォワード3D編集ネットワークで、ソース認識の潜伏制御を事前訓練された3D生成先行に注入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:05:26 GMT)
Generative Spatiotemporal Intent Sequence Recommendation via Implicit Reasoning in Amap [13.5] 実際のユーザの振る舞いは、多くの場合、分離されたアクションで構成され、代わりに、応答性依存性によって管理されるインテントフローを形成する。
本稿では,複雑な状況下で物理的に整合的に実行可能である意図列を生成することを目的とした生成時シーケンス勧告(GSISR)の課題に焦点をあてる。
本稿では,LLM推論を2つのコンポーネントを通して軽量モデルに内部化する生成フレームワークGPlanを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:27:32 GMT)
Augmenting Attention with Exponentially Decaying Memory Improves Query-Aware KV Sparsity [13.5] RAT+は,8つのハイスタックタスクにおいて,スパース予算全体にわたって,標準的注意力よりも常に精度を向上することを示す。
本稿では,このメモリモジュールがクエリ対応スパース推論に有効である理由を説明する2つの仮説を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:46:19 GMT)
BlazeEdit: Generalist Image Editing on Mobile Devices with Image-to-Image Diffusion Models [13.4] BlazeEditは、デバイス上でのデプロイメントに適した、高効率で汎用的な画像から画像への拡散モデルである。
BlazeEditは、競合する生成品質を維持しながら、ダウンロードサイズとメモリオーバーヘッドを大幅に削減する。
Pixel 10では290msで完全な推論パスを完了し、シームレスでプライバシーを保ち、ライトニングファスト体験を実現しています。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:23:59 GMT)
Disentangling Adversarial Prompts: A Semantic-Graph Defense for Robust LLM Security [13.4] Adrialversa Prompt Disentanglement (APD)フレームワークは、大規模言語モデルによって処理される前に、入力プロンプト内の悪意あるコンポーネントを特定し、中立化する。
APDは、モデル性能に対する無視的な影響を維持しながら、有害な出力生成を85%以上削減する。
我々の研究は、機械学習のセキュリティにおける新しい攻撃とMLシステムの整合性に関する重要な課題に対処する。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:30:06 GMT)
Picid: A Modular Evaluation Infrastructure for Reproducible PHM Across Tasks and Domains [13.4] 我々は、PHM評価パイプラインを明示的で実行可能で再現可能なプロトコルとして形式化するモジュール評価基盤であるpicidを紹介する。
picidは決定論的でリークセーフなデータセットの構築を強制すると同時に、さまざまなPHM設定でフレキシブルに維持する。
電池, ベアリング, ターボファンエンジン, 油圧, 濾過システム, 建物にまたがる12のデータセットの13モデルについて, 実験的検討を行った。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:50:52 GMT)
Convergence of empirical subgradients for optimal transport-based objectives [13.3] 本研究では,サンプル輸送コストによって定義されるパラメータ化対象について検討し,それらのサブディファレンシャルの集団目標のサブディファレンシャルへのグラフィカルな収束性を検証した。
リスク・アバース最適化、公平性制約付き学習、スライスされたワッサースタイン問題など、いくつかの設定で結果を説明する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:20:24 GMT)
LoRe: Adaptive Interaction-Evaluation Routing with Per-Step Interaction Budgets for Iterative Graph Solvers [13.3] トレーニング不要で、推論時のドロップインラッパーであるLoReを紹介します。
完全に包括的なエンドツーエンドのウォール・クロック・カウンセリングの下で、LoReは最大独立セット(MIS)問題におけるスケーラビリティを大幅に改善する。
LoReは、$sim 15times$ $n=1000$のスピードアップを達成し、メモリ削減と競争力のあるツアー品質は440times$である。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:00:57 GMT)
Do Clinical Models Change Treatment Decisions? [13.3] ClinPivotは、バイオメディカルリレーションとピボットされた患者コンテキストから構築された、監査可能な治療判定ベンチマークである。
強い医学的QAパフォーマンスは、意思決定性能を確実に予測できないことが判明した。
意思決定構造化監視は、整合した知識予算の下で、ピボットセンシティブな意思決定と医療QAを改善する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:19:12 GMT)
A Generalized Tikhonov Layer for Interpretable-by-design Graph Neural Networks [13.2] Tikhonov層は、設計によって解釈可能なグラフニューラルネットワーク層である。
一度トレーニングされると、学習したパラメータはどのノードの特徴とグラフトポロジのどの側面を予測に利用しているかを直接明らかにする。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:01:16 GMT)
Pruning and Distilling Mixture-of-Experts into Dense Language Models [13.0] Mixture-of-Experts (MoE) は現在、フロンティア言語モデルの主要なアーキテクチャである。
トレーニングされたMoEを標準の完全高密度アーキテクチャに変換するための,最初の体系的フレームワークを提案する。
我々は,Qwen3-30B-A3Bを用いて,7つのスコア,5つのグループ化,および2つのスケール法を評価し,350の構成を得た。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:27:36 GMT)
Learning Robust and Task-Invariant Functional Representation from fMRI through Siamese Self-Supervised Learning [13.0] 我々は、データ効率のよい自己教師型表現学習フレームワークBrainSimSiamを紹介した。
学習した表現は、複数の下流分類および回帰タスクで高い性能を達成できることを実証する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:48:31 GMT)
Semantic Validation of Packer Identification Tools: Characterization, Repair, and Downstream Impact [12.8] パッケージ識別ツールは、マルウェア分析の重要な基盤である。
本稿では,パッカー識別ツールのテストと修復のためのセマンティック検証フレームワークを提案する。
我々は、11のオープンソースパッカー識別ツールと6つのプロプライエタリな VirusTotal ツールにおいて、セマンティックバグの大規模な研究を行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:16:13 GMT)
AI-T2I: Aggregating-and-Isolating Cross-Attention to Diffusion Models for Text-to-Image Synthesis [12.8] テキスト・画像合成のための拡散モデルに対するアグリゲーション・アンド・アイソレート・クロスアテンション手法を提案する。
我々のAI-T2Iは、例えば、制御可能なレイアウト生成やパーソナライズされた生成など、他のタスクに対して優れた一般化を示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:23:41 GMT)
Restructure This: Using AI to Restructure Onboarding Documents to Reduce Cognitive Overload [12.7] オンボードドキュメンテーションは、オープンソースソフトウェア(OSS)で新参者を惹きつけ、維持するために重要である
本稿では,マルチメディア学習の認知理論(CTML)がOSS文書の再構築にどのように役立つかを検討する。
私たちはGenAIベースのパイプラインを使用して、プロトタイプのVisDocを通じてこれらの戦略を運用しています。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:23:36 GMT)
SafeRx-Agent: A Knowledge-Grounded Multi-Agent Framework for Safe and Explainable Medication Recommendation [12.7] 患者コンテキスト,外部臨床知識,安全性検証を用いて,追跡可能な薬剤セットを推奨する知識基盤型マルチエージェントフレームワークであるSafeRx-Agentを提案する。
MIMIC-IIIおよびMIMIC-IVデータセットによる実験結果から、SafeRx-Agentは薬物相互作用、禁忌、医薬品セットサイズを制御しながら、きめ細かい薬物の予測精度を向上させることが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:15:48 GMT)
Beyond One Path: Evaluating and Enhancing Divergent Thinking in Interactive LLM Agents [12.5] MUTATEはエージェントの発散思考を2つのレベルで評価するインタラクティブなベンチマークである。
成功のみの評価とは異なり、MUTATEは完了したパスとオフパスの両方をスコアする。
本稿では,非制約分岐候補生成を収束制約選択から分離するReDNAを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:33:23 GMT)
IRDS: Interpretable RLVR Data Selection via Verifier-Coupled Sparse Autoencoder Coverage [12.5] 本稿では、スパースオートエンコーダ(SAE)クラスタベースでRLVRトレーニングインスタンスを選択するIRDS(Inter-pretable RLVR Data Selection)を提案する。
3つの命令調整モデルと6つの数学推論ベンチマークを用いた実験により、IRDSは全体的な精度が最も高いことを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:58:05 GMT)
Do LLMs Build World Models From Text? A Multilingual Diagnostic of Spatial Reasoning [12.5] MentalMapは6レベル機能階層(L0-L5)を持つ多言語診断ベンチマークである。
MentalMapは、100 ProcTHORの家庭シーンから構築され、8つのタイプ型的に多様な言語と構造化されたテキストコントロールをカバーし、1,950個の評価セルに39のタスクファミリを含んでいる。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:20:53 GMT)
When Eyes Betray AI: Social Gaze Consistency as a Semantic Cue for AI-Generated Image Detection [12.4] 本稿では,視線方向の相互コヒーレンス,頭部アライメント,対人関係の瞳孔配置として定義された高レベルの意味的キューであるソーシャル・ゲイズ・コンシステンシーを紹介する。
既存の低レベルパラダイムに対して,これまで未利用であった検出軸を構成することを示す。
4ステップのアカウントでは、単一インパインター(FLUX.1-Fill)のトレーニングがマルチジェネレータスイートに移行した理由が説明されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:58:33 GMT)
Revisiting Metafeatures to Explain Model Differences on Tabular Data [12.4] TabArenaベンチマークの結果を用いて、データセットレベルのパフォーマンスギャップを分析し、それらをモデルに依存しないデータセット記述子に関連付ける。
ニューラルネットワーク対木間隙の場合、メタフィーチャーが偽発見制御を生き残ることはなく、一方のアソシエーションは堅牢であるが、一方のアソシエーションはLeft-one-data-out予測でテストしても一般化しない。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:50:22 GMT)
Stay Fair! Ensuring Group Fairness in Diffusion Models Across Guidance Scales [12.2] 拡散モデルは、迅速なアライメントと多様性をトレードオフするために調整可能なガイダンススケールでステア条件生成を行う。
全体バイアスをモデルバイアスとガイダンスバイアスの2つのコンポーネントに分解することで、この振る舞いを以前見過ごされたソースにトレースします。
本稿では、この条件を利用して、両レシスタンスで公正なガイダンスアルゴリズムを設計するStayFairを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:39:25 GMT)
Localizing Input Uncertainty Quantification for Large Language Models via Shapley Values [12.2] 本稿では,入力誘起不確実性のスパンレベル属性のフレームワークであるShapley-based input uncertainty Quantification (ShaQ)を提案する。
ShaQは、スパン間の複雑な相互作用をキャプチャし、個々の属性が入力によって引き起こされる全体不確実性と正確に一致するという、原則化された分解を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:53:16 GMT)
Rethinking Software Empirical Studies with Structural Causal Models [12.2] 因果推論(Causal Inference)は、経験的ソフトウェアエンジニアリング(ESE)を従来の統計的アソシエーションを超えて進めるための基本的なアプローチを提供する。
本稿では,Judea Pearl の因果推論パラダイムを ESE コンテキストで運用するフレームワーク CausalSE を紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:41:05 GMT)
From paper to benchmark: agentic, framework-based reproduction of under-specified methods in machine health intelligence [12.0] 産業統計・健康管理(Industrial Prognostics and Health Management)は、公開論文を実行可能なベンチマーク対応実装に変換するための代表的なケーススタディである。
提案手法では,エフェスロット結合インタフェースを用いて,エージェントが文書を共有PHMベンチマークフレームワークに変換する。
提案手法は16個のPHM紙上で評価され, フレームワークを改良した, スキルベース, プロンプトベースのエージェント再現と, 最新のフレームワークフリーのペーパー複製エージェントを比較した。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:11:05 GMT)
A Principled Self-Referenced Early Stopping Approach for Deep Image Prior [12.0] 劣化画像の2つの独立ノイズコピーが利用可能である場合に、ほぼ最適なDIP早期停止が達成できることを示す。
本稿では、擬似自己参照画像の構築に基づく過適合検出フレームワークを提案し、3つのIP固有アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:17:58 GMT)
ADWIN: Adaptive Windows for Horizon-Aware On-Policy Distillation [11.9] オンライン蒸留(OPD)は、学生が生み出す軌道に沿って教師のフィードバックを訓練することで、推論の振る舞いを伝達する。
我々は、ロールアウト長をオンライン許容判定として扱うOPD用適応ウィンドウフレームワークADWINを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:33:44 GMT)
Breaking the Script Barrier: Enabling Automatic Alignment for PoS-based ASR Error Analysis in Non-Latin Scripts [11.9] Part-of-Speech (PoS)のようなきめ細かい分析は、ASR仮説と参照転写の正確な一致を必要とする。
既存のアライメントツールは、ラテン語以外のスクリプトで書かれた言語には信頼できないことが多い。
我々は、ASRおよびラテン文字と非ラテン文字の両方で記述された言語に適用可能な、堅牢で自動化された言語に依存しないアライメント機構を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:04:10 GMT)
Cycle-Space Informed Detection of Autoencoded Blind False Data Injection Attacks on Power Systems [11.8] AI駆動型データセンターと大規模エネルギーストレージシステムは、リアルタイム計測データと自動意思決定による電力系統運用への依存度を高めている。
多くの既存の検出方法は、統計的またはデータ駆動による測定分析に依存しており、攻撃者が同じデータ構造を利用して盗聴の摂動を発生させると失敗する可能性がある。
本稿では,オートエンコーダが測定多様体を学習し,ジャコビアンヌル空間に整合した摂動を生成するブラインド・ファルス・データ・インジェクション・アタック(FDIA)を実証する。
ヌル空間を利用するデータ駆動型FDIAを緩和するため、トポロジインフォームド・サイクロン空間検出器(CSD)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:36:18 GMT)
Knowledge Dependency Estimation for Reliable Question Answering [11.8] 我々はemphknowledge依存性の推定について研究する
構造化されたランク認識型知識依存度推定器である textbfKnot を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:48:57 GMT)
DEPART: DEcomposing PARiTy across Multilingual LLMs [11.8] 大きな言語モデル リーダーボードは言語ごとの正確さを報告しますが、なぜ格差が生じるのかを説明することはめったにありません。
本稿では,多言語のパフォーマンス分散を解釈可能なコンポーネントに分解する2段階のベイズ階層フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:45:48 GMT)
TCP-MCP: Landscape-Guided Co-Evolution of Prompts and Communication Topologies for Multi-Agent Systems [11.6] TCP-MCP検索エージェントは、統合されたゲノムとしてプロンプトと通信トポロジを誘導する。
自動グラフ生成ベースラインを一貫して上回り、競争精度を達成する。
これらの結果から,共同で進化するプロンプトと通信構造が,コストを意識したマルチエージェントシステム設計への実践的経路を提供することが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:06:58 GMT)
Teacher-Student Representational Alignment for Reinforcement Learning-Driven Imitation Learning [11.5] 状態に基づく強化学習(RL)政策からの模倣学習は、ロボット工学で一般的な複雑で高次元の観測空間における次元性の呪いを克服するための一般的なアプローチである。
本稿では,教師と生徒が個別に学習した時に現れる,既約の模倣ギャップについて考察する。
そこで本研究では,エージェント固有の観察を隠蔽する共有埋め込み空間を学習し,提案手法を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:12:54 GMT)
Semantic Optimal Transport for Sparse Autoencoder Feature Matching and Circuit Compression [11.4] スケールが難しい2つの主要なSAE分析は、多層膜にまたがる意味論的に類似した特徴をマッチングし、大きな特徴回路を解釈可能なスーパーノードに圧縮することである。
この問題に対して,各特徴は文献のように単一デコーダベクトルではなく,それを表現した隠蔽状態上の活性化重み付き分布によって表現される。
我々は、我々の表現が活性化再スケーリングに不変であり、摂動下で安定であり、有限サンプルマージン条件下で真の一致を回復することを証明する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:54:58 GMT)
Natural Functional Gradients for Smooth Trajectory Optimization [11.3] 本稿では,自然関数勾配を用いて,関数空間の幾何認識更新を直接行う軌道最適化フレームワークを提案する。
ブラックボックス軌道評価のみを必要とする自然関数勾配の実用的なモンテカルロ推定器を導出する。
制約されたロボット操作タスクの実験は,提案手法が軌道実現性を改善し,よりスムーズな動作を生み出すことを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:25:57 GMT)
Subtraction Gets You More: Gap-Aware Retrieval for Multimodal Multi-Hop QA [11.3] 本稿では,埋め込みレベルで直接暗黙的なクエリ書き換えを行うパラダイムを提案する。
コンテクスト・サブトラクティブなクエリ・ステアリングにより、GRAILはコンストラクショナル・クロスモーダルな推論において優れている。
タスクタイプに基づいたクエリを動的にルーティングすることで、MultimodalQA上で40.3%のマクロ平均パフォーマンス向上を実現しています。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:46:21 GMT)
Long Live the Librarian! A Persistent Search Sub-Agent for Energy-Efficient Multi-Agent Software Engineering Systems [11.2] 本稿では,リポジトリ検索履歴を追跡し,エージェント間の冗長な探索動作を抑制する永続的な検索サブエージェントを提案する。
SWE-Bench Verifiedでは、Librarianはタスク性能を維持しながら、既存のマルチエージェントSWEシステムのエピソードあたりのGPUエネルギー消費を最大25%削減する。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:10:24 GMT)
KSAFE-MM: A Multimodal Safety Benchmark via Localized Contextualization for Korean Cultural Risks [11.2] 本稿では,韓国のマルチモーダル安全性評価ベンチマークであるKSAFE-MMを紹介する。
KSAFE-MMはKSAFE-MM-GとKSAFE-MM-Cの2つの部分からなる。
我々は、KSAFE-MM上で12の最先端MLLMを評価し、ジェネリックモデルよりも文化的な攻撃に対する脆弱性が大きいことを示した。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:08:54 GMT)
LLM Zeroth-Order Fine-Tuning is an Inference Workload [11.2] バックプロパゲーションを前方目標評価に置き換えるため、ゼロオーダー(ZO)ファインチューニングは大規模言語モデルにとって魅力的である。
既存の実装では、近隣のパラメータ状態の下で、支配的な作業が繰り返しスコアリングされているにもかかわらず、従来のトレーニングループ内でZOアルゴリズムを実行している。
LLM ZOファインチューニングは推論に支配される作業負荷であり,その繰り返しスコアリングフェーズをサービスランタイムを通じて実行することを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:19:19 GMT)
Finding Koopman Invariant Subspaces via Personalized PageRank [11.1] 我々は、スパンがクープマン不変である任意の部分辞書は、EDMD行列において正確なゼロブロックを誘導することを示した。
次に、行正規化EDMD行列にPageRankを適用することにより、そのようなブロックを検出することができることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:46:29 GMT)
Ensemble Score Filtering for Real-Data Energy Consumption Forecast Correction [11.0] 実エネルギー消費データに対する高次元データ同化問題について検討する。
本研究ではEnsemble Score Filter(EnSF)を用いて,部分的および雑音的な観測を同化し,時間とともに予測軌道を補正する。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:27:38 GMT)
Residualized Temporal Sparse Autoencoders for Interpreting Diffusion Models [10.9] テキスト・ツー・イメージ拡散モデルは反復的認知過程を通じて画像を生成するため、内部の神経層は単一の静的表現ではなく、活性化の軌跡を生成する。
本研究では,拡散活性化軌道に対する残留化時間SAEを紹介する。
SAEは時間的に構造された拡散活性化を研究するのに有用な枠組みであることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:08:29 GMT)
Optimal Gap-Dependent Regret for Private Stochastic Decision-Theoretic Online Learning [10.6] 我々は、完全な情報とイベントレベルの純粋差分プライバシーを用いて決定論的オンライン学習を研究する。
HuとMehtaのCOLTオープンな問題は、決定論的オンライン学習において最適なギャップ依存の後悔率を決定することを要求する。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:17:00 GMT)
A Wolf in Sheep's Clothing: Targeted Routing Hijacking in Federated RAG [10.5] Federated Retrieval-Augmented Generation (FedRAG)は、プライバシに敏感なアプリケーションにとって、生データはローカルのままであるため魅力的である。
本稿では、不正なクライアントがプロファイルを偽造してターゲットクエリを引き付けるルーティングステージアタックであるルーティングハイジャックについて紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:06:10 GMT)
Prompt Codebooks: Discrete Compositional Optimization for Language Model Instruction Refinement [10.4] 本稿では,新しい合成プロンプト最適化フレームワークであるPrompt Codebooksを提案する。
これは、APOを自然言語本能の有限語彙上の離散学習であると再認識する。
ゼロショット以上は+30.36ポイントまで改善され、HotpotQAでは+3.34、アグリゲートでは+1.11で最強のベースライン(GEPA)を超える。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:57:12 GMT)
When LLM Reward Design Fails: Diagnostic-Driven Refinement for Sparse Structured RL [10.4] 我々はMiniGridをコア評価として,MuJoCoを境界応力試験として用いたPPO訓練剤について検討した。
私たちの監査では、報酬の洪水とセマンティック/API誤解という、2つの主要なワンショット障害モードを見つけました。
本稿では,トレーニング診断と障害モード分類ガイドが報酬関数の修正を対象とする,診断駆動反復改善法を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:57:43 GMT)
Eulerian Gaussian Splatting using Hashed Probability Pyramids [10.4] 3Dガウススプラッティングの高速化と試験時間効率を維持するスプレート型放射界フレームワーク(3DGS)を提案する。
体積確率密度の勾配に基づく最適化で原始的な操作を置き換える。
3DGSレベルのレンダリング速度を維持しつつ,mip-NeRF 360における最先端の再現性を実現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:01:01 GMT)
Efficient Pre-Training of LLMs through Truncated SVD Layers [10.4] LLM(Large Language Models)の大規模スケーリングにより、プレトレーニングはますますコストを抑えている。
本稿では,トレーニングプロセスを通じて低位と厳密な正則性を維持するフレームワークであるTLVDを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:57:49 GMT)
Revisiting Anthropomorphic Reflection Markers in Large Language Model Reasoning [10.3] 我々は人為的な反射マーカーを再検討し、その解釈と反射における役割について検討する。
我々はこれらのマーカーをプロンプトレベルとトークンレベルの介入によって抑制し、タスク性能への影響を分析する。
以上の結果から,人為的マーカーが一様ではないことが示唆された。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:00:48 GMT)
Robust Contrastive Graph Clustering with Adaptive Local-Global Integration [10.2] マルチスケールな局所構造とグローバルなセマンティクスを協調的に統合するグラフクラスタリングフレームワークを提案する。
8つの実世界のグラフデータセットに対する実験により,本手法が競合クラスタリング性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:29:17 GMT)
An Operator-Based Approach to STL [10.1] 本稿では,到達可能性値関数に作用する演算子に基づく信号時間論理(STL)に対する新しいアプローチを提案する。
これは、複雑なマルチネスト式を扱うための新しい理論的枠組みを構成する。
STLに基づくリーチビリティ関数の設計に重点を置くのとは対照的に,我々は演算子ベースのネストルールを開発する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:47:45 GMT)
Trajectory Constraints for Imaging Inverse Problems [10.1] TRACEは, 軌道に沿った隣接状態の結合による再建経路を安定化する, 訓練不要なトラジェクトリ制約rEコンストラクションフレームワークである。
これにより、近位更新のシーケンスとして解釈できるトラジェクトリレベルのモデルが得られる。
直線的および非線形的な画像再構成タスクの実験は、TRACEが再構成品質を改善することを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:08:44 GMT)
Continual Learning in Modern Hopfield Networks with an Application to Diffusion Models [10.0] ホップフィールドエネルギーを用いた生成モデルにおける連続学習について検討する。
その結果, 高エネルギー・外層型試料では, クラスター型試料よりも大きなエネルギー増加がみられた。
また、メモリリプレイを分析し、高エネルギーサンプルに特に有効であることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:12:41 GMT)
Manifold-based Algorithms for the Hadamard Decomposition [9.8] アダマール分解は標準的な低ランク近似よりも表現力が高い。
我々はアダマール分解を計算するための3つの新しいアルゴリズムを開発した。
新しいアルゴリズムは、合成データと実データの両方で効率的で競争力がある。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:35:40 GMT)
Quantum principal component analysis without eigenvector recovery [9.8] 我々は、ハードトップ$kのプロジェクタをエントロピー規則化されたFermi-Diracフィルタに置き換える測定ベースのソフトPCAフレームワークを提案する。
このフィルタは量子測定として直接解釈され、自然に量子的アプローチを示唆する。
新しい入力に対して、同じ量子回路はソフトプリンシパル部分空間スコア、スペクトルエネルギープロファイル、ポストセレクトされたフィルター状態を得る。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:27:47 GMT)
GEO-Bench: Benchmarking Ranking Manipulation in Generative Engine Optimization [9.8] 本稿では,GEOランキング操作攻撃を1つのプロトコルで評価するベンチマークであるGEO-Benchを提案する。
ブラックボックスのプロンプトベースの攻撃(TAP、ゼロショット)、ホワイトボックスのグラデーションベースの攻撃(STS、RAF、StealthRank)、ホワイトハットのC-SEO戦略を統一する。
固定されたオープンウェイトローダに対して、5つのデータセットですべてのメソッドをスコアします。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:10:43 GMT)
Bridging the Generalization Gap in Adverse Weather Segmentation: A Training Recipe Perspective [9.8] 本稿では,5つの気象条件で劣化した屋外シーンのセマンティックセグメンテーションを目的とした第8回UG2ワークショップ(CVPR 2026)トラック2について述べる。
私たちが観察する中心的な課題は、厳密な一般化ギャップです -- 検証セットでうまく機能するモデルは、テストセットでしばしば崩壊します。
アーキテクチャの複雑さよりも、慎重に設計されたトレーニングレシピが、このギャップに対処できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:55:34 GMT)
Commit to the Bit: Reactive Reinforcement Learning Done Right [9.7] 強化学習アルゴリズムはマルコフの仮定に基づいて一般的に分析(および設計)される。
我々は、新しいアルゴリズム、Commited Q-learningを導入し、最適反応ポリシーにほぼ確実に収束することを証明する。
我々の分析の重要な部分は準マルコフ環境の導入である。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:20:40 GMT)
DiagramRAG: A Lightweight Framework to Retrieve Scientific Diagram for Figure Generation [9.7] スケッチに基づく科学図作成のための軽量な検索拡張フレームワークであるDiagramRAGを紹介する。
ユーザスケッチが与えられたら、DiagramRAGは、スケッチの内容に意味的に関連し、その構造とトポロジ的に互換性のある参照ダイアグラムを検索する。
実験の結果,DigramRAG は DiagramBank と FigureBench でそれぞれ 0.848 と 0.802 の F1 スコアを獲得し,VLM-as-a-Judge スコア 7.170 で生成品質を向上させることがわかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:03:22 GMT)
In Search of the Ingredients of Open-Endedness: Replicating Picbreeder with Large Vision-Language Models [9.7] 私たちはフロンティアビジョン言語モデル(VLM)に取って代わる
システムの出力と過去の人的基準との明確な質的な差異を観察する。
これらの違いに寄与する因果的要因を同定するために,エージェントの選択過程に探索ノイズを加えることを検討した。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:19:27 GMT)
GAP3D: Generative Alignment of VLM Latents to Patch-Level Embeddings for 3D Generation [9.6] GAP3Dはモジュラーで拡散に基づくアプローチで、VLMラテントを事前訓練された画像エンコーダの完全なパッチレベルの特徴空間に直接アライメントする。
本手法は,汎用画像とテキストのペアを主にトレーニングすることで,大規模3Dデータの必要性を回避している。
また、テキスト入力のみにトレーニングされているにもかかわらず、マルチモーダルプロンプトの緊急ゼロショット機能も備えている。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:53:09 GMT)
Calibrating Conservatism for Scalable Oversight [9.6] 本稿では,多彩な補助的スコアリング機能を,保守的ベースラインからの逸脱を測定するペナルティに集約するCalibrated Collective Oversight(CCO)を紹介する。
CCOは、Conformal Decision Theoryを使って、この保守主義をオンラインで校正し、望ましくない結果がユーザ指定の目標閾値以下であることを保証する。
SWEベンチの修正版では、より弱い監督者が敵に不整合な強いエージェントを拘束することに成功し、マチャイアヴェリでは、CCOは報酬を保ちながら倫理的違反を著しく軽減する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:56:47 GMT)
Data-Efficient On-Policy Distillation for Automatic Speech Recognition [9.5] Ark-ASR(Ark-ASR, 0.6B-パラメータ音声調和言語モデル)について検討した。
我々は,強いQwen-ASR教師が,オンライン蒸留を通じて付加的な認識能力を伝達できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:22:47 GMT)
SuperValid: Capability-Aligned OOD Validation for Generalizable Downstream Scaling [9.4] 下流のスケーリングは能力レベルで研究されるべきである、と我々は主張する。
我々は,OOD(out-of-distribution),能力整合性検証データを合成するフレームワークであるSuperValidを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:01:09 GMT)
iPOE: Interpretable Prompt Optimization via Explanations [9.4] iPOEは、説明による新しい解釈可能なプロンプト最適化戦略である。
We found that iPOE can improve over the evaluation baselines to up 39% by LLM explaineds can replaced human explanations。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:07:32 GMT)
STAB: Specification-driven Testing for Algorithmic Bottlenecks [9.4] STABは自然言語の問題仕様だけでアルゴリズムのボトルネックを明らかにするテストケースを生成する。
CodeContestsでは、STABはアルゴリズムのボトルネックを平均で50.43%から73.45%に拡大するテストケースを生成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:18:39 GMT)
DREAM-R: Multimodal Speculative Reasoning with RL-Based Refined Drafting, Precise Verification, and Fully Parallel Execution [9.3] 投機的推論は、大規模マルチモーダルモデルにおける推論集約生成を加速する手段として提案されている。
本稿では,投機的推論の性能を大幅に向上させるフレームワークであるDREAM-Rを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:11:10 GMT)
Playing with Words, Improving with Rewards: Training Language Models for Creative Association [9.2] 大きな言語モデル(LLM)は、ますます困難な問題やユースケースに適用されています。
広大なソリューション空間を効果的にナビゲートするには、LLMは創造的である必要がある。
Codenamesは、クリエイティビティの2つの中心となる軸をエクササイズするワード連想ゲームです。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:41:22 GMT)
CIRF: Tokenizing Chain-of-Thoughts into Reusable Functional Units for Efficient Latent Reasoning in Large Language Models [9.2] Implicit Chain-of-Thought (CoT) は、明示的な論理を内部化することによって、大きな言語モデルの推論コストを削減する。
機能トークンの動的シーケンスとして推論を行う暗黙のCoTフレームワークであるCIRF(textitunderlineChain-of- Thoughts underlineInto underlineReusable underlineFunctional units)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:40:46 GMT)
Outer-Momentum Restarting in High-Dimensional Two-Phase Optimization [9.2] 本研究では,この外的記憶を制御するための単純な補完機構として,外的運動量の周期的再起動について検討する。
リセットが内部ループの進行を保ちながらスタル運動量を捨てて位相キャンセルを利用することを示すモードワイズ・リスタートを導出する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:09:02 GMT)
Paris 2.0: A Decentralized Diffusion Model for Video Generation [9.1] 分散計算によって事前学習された最初のビデオ生成モデルであるParis 2.0を提示する。
Paris 2.0はFrechet Video Distance (FVD)を561.04から279.01に削減し、2.0倍改善し、CLIPのテキストビデオ類似性と美的スコアを引き上げた。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:28:25 GMT)
Exploration of Perceptual Speech Features for Clinical Decision-Support in Mental Health Care [9.1] 本稿では,音響的特徴と言語的特徴を利用したシステム的特徴量分析フレームワークを提案する。
抑うつ,不安,ADHDの症状と音声特徴との関連について検討した。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:37:15 GMT)
LIFT and PLACE: A Simple, Stable, and Effective Knowledge Distillation Framework for Lightweight Diffusion Models [9.0] Linear Fitting based distillation (LIFT)とPiecewise Local Adaptive Coefficient Estimation (PLACE)による粗粒蒸留の枠組み
実験の結果、LIFTとPLACEは拡散空間(イメージ/ラテント)、バックボーン(U-Net/DiT)、タスク(条件/条件)、データセット、さらにはMMDiT(SD3)のようなフローベースモデルにまで拡張できることが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:21:33 GMT)
Satisfiability Solving with LLMs: A Matched-Pair Evaluation of Reasoning Capability [9.0] 大規模言語モデル (LLM) は、暗黙的にBoolean satisfiability (SAT) に還元されるタスクに、ますます使われている。
本稿では,2-SATと3-SATのLCMについて,Vertex Coverと離散3Dパッキングの2つの標準化とともに系統的研究を行った。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:18:45 GMT)
FABSVer: Faster Training and Better Self-Verification for LLM Mathematical Reasoning [9.0] 自己検証モデルを備えた既存のアプローチは、解の生成と検証を2つの別々のタスクとして扱うのが一般的である。
本稿では,この2つのタスクを1世代パスに融合するFABSVerを提案する。
FABSVerは3つのモデルスケールで優れた自己検証と推論性能を実現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:26:34 GMT)
When Discourse Pressures Conflict: Information Structure in Vision-Language Model Outputs [8.9] 視覚的根拠のある質問応答において、視覚言語モデル(VLM)が談話古いトピックスと談話の新しいFocicを区別するかどうかを検証する。
私たちは、TopicとFocusが専用の統語的位置にマッピングする言語であるハンガリー語を利用して、ISの選択をテキストで観察できるようにしています。
モデルはIS関連構造を生成するが、この感度を過度に調整する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:50:56 GMT)
Bias Leaves a Gradient Trail: Label-Free Bias Identification via Gradient Probes on Concept Decompositions [8.9] 本稿では,凍結視覚モデルにおける突発的概念を識別するためのバイアスラベルのないポストホック法を提案する。
Colored MNIST と Waterbirds では、この手法は既知のスプリアスキューに沿った概念を復元する。
推論時間における上位概念の抑制は、最悪のグループ精度を最大17.9ポイント向上させる。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:39:10 GMT)
The Chain Holds, the Answer Folds: Trace-Answer Dissociation in Reasoning Models Under Adversarial Pressure [8.9] 推論モデルはシングルターンベンチマークで評価されるが、マルチターンダイアログにデプロイされる。
われわれはこの不信な降伏(UC)を2ドル(約2万2000円)のラテント・ヴァース・ビヘイビア・フレームワークで分離し、指標のフリップレートとシングルターンプローブの両方を見逃す。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:41:08 GMT)
Same Question, Different Source, Different Answer: Auditing Source-Dependence in Medical Multi-Source RAG [8.9] 検索拡張生成(RAG)システムは、どのソースから取得するかによって、同じ質問に対して異なる回答を与えることができる。
情報源依存性はNLP評価の欠落軸であり,評価単位を回答の正しさからソース間関係へシフトさせることを意味する,と我々は主張する。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:38:05 GMT)
MORI-Seg: Learning Morphological Geometry for Instance Segmentation without Instance Annotations [8.8] インスタンスレベルのアノテーションを必要とせずにインスタンスセグメンテーションを可能にするディープラーニングフレームワークである Mori-Seg を提案する。
モリセグは分割やインスタンス管理を行う代わりに、意味マスクから直接形態学的に認識された幾何学的表現を学ぶ。
Mori-Segはセマンティックのみの監視の下で、接続されたセマンティック領域をエンドツーエンドの方法で個別のインスタンスマスクに分解する。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:11:30 GMT)
PROTOCOL: Late Interaction Retrieval for Protein Homolog Search [8.8] ProtoColはタンパク質を残基埋め込みの集合として表現するモデルである。
タンパク質を独立にコードし、候補表現を事前計算可能とし、残基の埋め込みよりもMaxSimで候補を採点する。
SCOPeスーパーファミリーとPfamファミリーのベンチマークでは、ProtoColはシーケンスコンポジション、アライメントベース、プールされたPLM、訓練された単一ベクトルベースラインより優れている。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:50:48 GMT)
Confidence-Orchestrated Self-Evolution against Uncertain LLM Feedback [8.8] 自己進化型大規模言語モデル(LLM)は、独自のトレーニングタスクとソリューションを生成し、人事監督への依存を減らすことで学習する。
我々は,LLMの本質的信頼度を軽度不確実性信号として用いて学習を変調するCOSE(Confidence-Orchestrated Self-Evolution)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:07:10 GMT)
Geometric Analysis of Variational Quantum Eigensolver [8.7] 変分量子固有解法(VQE)は量子コンピューティングの基本的なアルゴリズムである。
本稿では,最適化ランドスケープ,初期化保証,ノイズロバスト性の観点から,VQEの幾何学的解析を確立する。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:31:18 GMT)
Verified Misguidance: Measuring Structural Citation Failures in Search-Augmented LLMs [8.7] CITETRACEは、ユーザクエリから取得したソースから生成された回答まで、完全な引用チェーンをトレースするデータセットである。
我々は,意図的アライメント,ソース適合性,回答ソースの忠実度に基づいて各引用をスコアする3次元評価フレームワークを設計する。
プールの向こう側では、引用の30.6%がソースを歪めており、27.1%はドメイン不適切なソースから来ている。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:54:05 GMT)
FinBoardBench: Benchmarking Dynamic Wealth Management and Strategic Financial Reasoning of LLMs via Board Game Simulations [8.7] FinBoardBenchは、Cashflow、Acquire、Monopolyの3つの古典的な金融ボードゲームに基づく評価スイートである。
9 つの先進 LLM を用いた実験により, 基本的長期計画と投資論理を示す一方で, 複雑な相互作用を効果的に活用することができず, 利益を得ることができた。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:20:25 GMT)
Behind EvoMap: Characterizing a Self-Evolving Agent-to-Agent Collaboration Network [8.6] 本稿では,A2AコラボレーションネットワークであるEvoMapについて,大規模な実証的研究を行った。
スケーラブルな成長を優先する設計選択が、再利用性、進化性、監査性にトレードオフをもたらすことを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:37:25 GMT)
SafeMed-R1: Clinician-Audited Safety and Ethics Alignment for Medical Large Language Models [8.6] 我々は、トレース可能な臨床信頼信号パイプラインで訓練されたSafeMed-R1を提案する。
SafeMed-R1のマクロ平均精度は、臨床ベンチマークで79.6%である。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:42:52 GMT)
The Decision to Verify: How Warmth and User Characteristics Shape Reliance on Conversational Agents for Information Search [8.5] 情報検索は、対話型AIとWeb検索を組み合わせたハイブリッドインタラクションパラダイムにますます従っている。
我々は、AI回答の検証を促す基本的な要因(例えば、デジタルリテラシーと会話の暖かさ)を調査する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:00:45 GMT)
History-aware adaptive reduced-order models via incremental singular value decomposition [8.5] インクリメンタル特異値分解(iSVD)に基づくプロジェクションベースの適応ROMフレームワークを開発する。
本研究では, 1次元バーガース方程式, ソッド衝撃管, 硬い1次元回転デトネーションエンジン(RDE)の3つの非線形問題について検討する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:15:11 GMT)
Beyond Surrogate Gradients: Fully Differentiable Token Pruning for Vision-Language Models [8.5] 本稿では,個別選択学習ではなく,トークン情報の連続制御としてプルーニングを再構成するDiffPruneを提案する。
10個のVLMベンチマークで、DiffPruneは96.5%の完全モデルの精度を維持し、LLMのプリフィルは2.85倍に加速し、推測オーバーヘッドはわずか0.69msである。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:52:08 GMT)
Score Based Error Correcting Code Decoder [8.5] 本稿では,スコアベースのデコーダであるSB-ECCを提案する。
ニューラルデノイザは確率フロー常微分方程式(ODE)を定義し、ノイズチャネル観察を有効なコードワードに繰り返し更新する。
42のコード/SNR設定で、SB-ECCは39/42のエントリで最高のBERを達成し、SNRの平均ゲインは0.17dB、最大ゲインは0.46dBである。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:55:27 GMT)
Syllabic-Structure Decoder for Automatic Speech Recognition in Vietnamese [8.4] 我々はベトナム語の特徴から、ASRのためのSyllabic-Structure Decoderを提案する。
提案手法では,音節の音韻的構成を明示的に把握し,コンパクトな音韻インベントリから有効な音節構造をデコーダで生成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:51:09 GMT)
I Hear, Therefore I Trust: A Socio-Technical Investigation of Humans as Synthetic Speech Detectors [8.4] 人間が実際に合成音声に遭遇する社会技術環境は、いまだに理解されていない。
本報告では,47名の被験者が,正当性,完全合成,部分合成発話で疑わしい合成セグメントをマークした局所化課題について述べる。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:16:02 GMT)
PrunePath: Towards Highly Structured Sparse Language Models [8.4] FFN層のための予算適応型構造化スペーシングフレームワークである textbfPrunePath を紹介する。
PrunePathは、独立の専門家による閾値設定をソフトマックス正規化ルーティングディストリビューションに置き換える。
NLU、NLG、命令チューニング評価の他、PrunePathは好適なスパシティ-パフォーマンストレードオフを実現している。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:29:52 GMT)
Mind the Gap: Mixtures of Gaussians in Approximate Differential Privacy [8.4] 差分プライバシーを満たす付加的なノイズ機構のクラスを設計する。
この機構は、同じ分散を持つが、その手段と混合重量が異なる複数のガウス分布を混合することによって構成される。
我々は、(varepsilon, ))-DPに必要な分散の厳密な条件を導出し、それらを計算するための効率的なアルゴリズムを提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:32:26 GMT)
When Seekers Are Hard to Help: Evaluating Emotional Support Dialogue Systems in Worst-Case Interactions [8.3] 本研究では,低エンゲージメント,抵抗性,限定的な自己開示,感情的ボラティリティ,厳格な否定的解釈などの理由から,最悪の場合のESDS評価について検討した。
本稿では,LLMに基づく最悪事例探索シミュレータと,Deep Emotional Understanding, Guided Exploration, Balanced Emotional Support,Authentic and Grounded Supportという,最悪の事例指向の4つの指標からなる最悪の事例評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:41:32 GMT)
Benchmarking Inductive Biases for Multivariate Time-Series Anomaly Detection with a Robust Multi-View Channel-Graph Detector [8.3] 家族表現型検出器10個を5つのデータセットで評価した。
すべてのメソッドは同じウィンドウ、スコアリング、ハードウェア、メトリックプロトコルを共有している。
我々はNOTEARSに制約された指向性チャネルグラフビューと任意パッチアテンションと時間連想ビューを組み合わせた適応型検出器ファミリの紹介を行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:55:44 GMT)
CogPortrait: Fine-Grained Eye-Region Control in Portrait Animation via Hierarchical Agent Planning [8.3] 高レベルのラベルからポートレートアニメーションを生成する2段階のフレームワークであるCogPortraitを提案する。
最初の段階では、3つのMultimodal Large Language Models (MLLM)エージェントがハイレベルなラベルを顔のキーポイントにコンパイルする。
第2段階では、DiTベースのビデオ生成バックボーンが、キーポイントに条件付けられた最終アニメーションを合成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:02:31 GMT)
Designing Active Tether-Net Systems for Space Debris Capture with Graph-Learning-Aided Mixed-Combinatorial Optimization [8.2] 本稿では,テザネットシステムの複雑で制約付き非線形最適化問題について検討する。
グラフニューラルネットワーク(GNN)は、グラフ内のノードとして表される(上記の)候補の組み合わせと、入力として与えられる候補の連続変数ベクトル部分とをスコアするために訓練される。
その結果、MCNLP最適化はNLPに還元され、標準解法を用いて解ける。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:19:42 GMT)
Non-Hermitian Computers Need No Complex Numbers [8.2] 実ゲートセット$H, textCCNOT, G$ を具備した非エルミート量子コンピュータは, 時間内に $textPsharptextP$ の問題を解くことができることを示す。
これは、普遍性よりも非ユニタリ性が必須資源であり、複素数は不要であることを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:34:00 GMT)
Ontology-Guided Reasoning for Affordance-Based Explanations of Robot Navigation [8.1] 人間の環境では、ロボットがそのルートがブロックされていることを検出するのに十分ではない。
また、どの状態の変更が可能か、どの変更が安全に継続できるのか、近くのオブジェクトに何ができるかも考慮しなければなりません。
本研究では, 近隣の施設, 空き地, 空き地, 質的空間関係を局所的な空き地オントロジーで表現することで, この問題に対処する。
これは意味論的に根拠づけられただけでなく、作用可能な説明をもたらす。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:08:03 GMT)
Imitation Learning for Robot Assistance in Open Surgery: A Multi-Policy Evaluation on Suture Following [8.1] 本研究は,開腹手術における外科ロボット協調支援のための汎用的模倣学習の最初の評価である。
オープンソースロボットアームに160個の遠隔操作デモ(32,374フレーム)を収集する。
我々は、32の構成で評価された28のトレーニングモデルに対して、アーキテクチャ的に多様な4つの模倣学習ポリシーをベンチマークした。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:56:11 GMT)
Con-DSO: Learning Short-Horizon Consistency Priors for RGB-D Direct Sparse Odometry [8.1] Con-DSOは、一貫性を意識したRGB-D直接スパースドメトリーフレームワークである。
時間的に隣接したRGB-Dフレーム対からの高密度な測光および深度幾何学的整合性の不確実性を予測する。
実験ではRGB-D VOベースラインよりも大幅に向上した。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:46:52 GMT)
FundaPod: A Multi-Persona Agent Pod Platform with Knowledge Graph Memory for AI-Assisted Fundamental Investment Research [8.1] 我々はAI支援基礎投資研究のための多人数エージェントプラットフォームであるFundaPodを紹介する。
我々は,基本研究は,貿易信号生成とは質的に異なる人間中心の意思決定支援タスクであると主張する。
FundaPodでは、価値投資家やマクロストラテジストといった異なるペルソナを持つAIエージェントが、共有契約の下で独立して研究を行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:26:16 GMT)
Learning a Kinodynamic Trajectory Manifold for Impact-Aware Compliant Catching of Fast-Moving Objects [7.9] 空飛ぶ物体の高速捕獲は、短い反応時間、衝突の不確実性、キノダイナミックな制約のために困難である。
我々は, シミュレーションにおける強化学習を用いて, 捕集軌道の収集と低次元キノダイナミックな軌道多様体の学習を行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:31:01 GMT)
DecomposeRL: Learning to Ask Useful, Informative, and Diverse Questions for Semi-Supervised, Traceable Claim Verification [7.9] 検査可能なトレースを生成する正確なクレーム検証器としてDecomposeRLを提案する。
DecomposeRLはGRPOで訓練されたRLポリシーとして分解を行う。
分割RL-7Bは5Kキュレートされたクレームのみを全面的に監督し、86.3のドメイン内と69.8のドメイン外バランスの正確性を達成している。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:19:52 GMT)
CIVIC: End-to-End Sequence Compactness for Efficient Vision-Language Models [7.9] VLM(Vision-Language Models)は、高解像度のビジュアルトークンによって、メモリとレイテンシのボトルネックに直面する。
本稿では,パス一貫性のあるコンパクトビジュアル推論フレームワークであるCIVICを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:09:44 GMT)
Mitigating Adaptive Attacks against Reasoning Models with Activation Consistency Training [7.9] 我々は、クリーンなプロンプトと敵の書き直しに同一の振る舞いを強制する微調整目的のファミリーである一貫性トレーニングについて研究する。
我々はこれらの手法を即時噴射防御として定式化し、ACTが他の訓練ベースの防御と競合することを発見した。
また,ACTの脱獄に対する防御は,補助ターン境界における活性化空間の概ね線形シフトとして符号化されていることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:33:26 GMT)
Engineering Molecular Rectification: Mechanisms, Modulation Strategies, and Device Integration [7.8] Reviewは、CMOS時代の分子エレクトロニクスとナノスケールデバイス工学の交差点で働く研究者にとって、概念的枠組みと技術的基準の両方として機能することを目的としている。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:21:03 GMT)
Bound-Constrained Sparse Representation for Electrical Impedance Tomography [7.8] 本研究では、電気インピーダンストモグラフィ(EIT)のためのバウンダリ制約付きスパース表現(BC-SR)フレームワークを提案する。
BC-SRは表現駆動型戦略を採用し、暗黙の複合パラメータ化によって低次元潜在変数から導電率を生成する。
2D/3Dシミュレーション、タンク実験、および肺内データに対する広範囲な検証は、BC-SRが物理的整合性と構造的忠実性を改善することを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:30:24 GMT)
Self-Consistency via Marginal Sharpening [7.7] 推論時間サンプリングは、追加のトレーニングなしで言語モデルから強力な推論能力を引き出すことができる。
本稿では,数学やコーディングベンチマークにおける標準電力サンプリングよりも高い性能を示す,単純で純粋に自己回帰的な並列サンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:24:56 GMT)
Generalized Software Product Line Extraction [7.7] 本稿では,既存のソフトウェアアーチファクトから特徴モデルを抽出するための一般的なワークベンチに依存しないプロトコルを提案する。
このプロトコルは、基盤となるソフトウェアアーティファクトにほとんど仮定しないため、様々なSPLに適用できる。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:48:07 GMT)
SANTS: A State-Adaptive Scheduler for World Action Models [7.7] 本稿では,映像間拡散ポリシーのための状態適応型ノイズトラジェクタ(SANTS)について紹介する。
SANTSは現在の映像状態の表現とノイズレベルを読み出し、累積停止ハザードと相対ノイズプログレス比を共同で予測する。
実験の結果、SANTSはRoboTwin 2.0で全体の成功(94.4%)、そして7つの実ロボットタスクでの平均成功(73.1%)に達した。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:40:48 GMT)
Visualizing Latent Phase Structures in Locomotion Policies: A Multi-Environment Study with Temporal Feature Extension [7.6] 移動制御ポリシによって生成された軌道から潜在運動位相構造を明らかにするためのフレームワークを提案する。
提案手法を3つの環境に適用し,より明確で規則的な遷移規則を持つ相構造を同定した。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:09:09 GMT)
LLMBridge: An LLM Pipeline for End-to-end Referential Bridging Resolution in English [7.6] LLMBridgeは、英語でエンドツーエンドのブリッジ解決を行うための新しいシステムである。
本研究は,英語における参照ブリッジ分解能評価に用いられている3つのデータセットに対するブリッジ分解能パイプラインの評価である。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:52:09 GMT)
VesselSim: learning 3D blood vessel segmentation without expert annotations [7.6] ユニバーサル3D血管セグメンテーションのための2段階フレームワークである VesselSim を提案する。
3D U-Netは、合成データのみに基づいて訓練され、16,500の解剖学的に妥当な3D血管造影ボリュームを生成する。
VesselSimは最先端のセグメンテーション基盤モデルと競合するパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:27:41 GMT)
Conservative neural posterior estimation via distributionally robust training [7.5] 神経後部推定(NPE)によるシミュレーションベース推論は、限られたシミュレーション予算の下では、過信と信頼できない後部を生じることが多い。
DRO-NPEは、標準的なNPEの目的をワッサーシュタインの曖昧さに対する最悪の損失に置き換える、分布的に堅牢なアプローチである。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:17:22 GMT)
A Road-Conditioned Traffic Movie Prediction Network with Spatiotemporal and Structure-Consistent Learning [7.5] 既存の交通映像予測手法ではフレームレベルの精度が向上しているが,画像再構成を中心に予測処理を行っているものも多い。
本研究では,交通映画予測をトポロジ誘導による将来状態生成として再構成する道路時空間ネットワークRCSNetを提案する。
RCSNetは、静的道路地図モデルから道路認識表現を抽出し、方向の交通特徴を局所構造と整列させ、時間的整合性を改善するために将来の交通地図を生成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:07:53 GMT)
When Interpretability Is Unequally Distributed: Fairness in Hybrid Interpretable Models [7.4] ハイブリッド解釈可能なモデルは、いくつかの例を前者に割り当て、残りを後者に延期することで、透明なコンポーネントとブラックボックスモデルを組み合わせる。
一部の集団は体系的に解釈可能な決定を受け、他の集団は不均等にブラックボックスにルーティングされる。
我々は,この問題を,ハイブリッドな解釈可能なモデルのルーティング決定に適用される,階層的・階層的尺度であるInterpretability Coverage Disparity (ICD) として定式化する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:33:00 GMT)
Frequency-Guided Action Diffusion via Sub-Frequency Manifold Traversal [7.4] 自然の人間の実演を直接模倣する訓練方針は、必然的にモデルが最適以下の行動を継承する原因となる。
本稿では、暗黙的なスペクトル操作とスムーズな動作生成を可能にする新しい周波数ベースアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:45:25 GMT)
LEIA: Learned Environment for Interactive Architected Materials [7.3] 私たちは、エンジニアが境界条件を段階的に適用できる世界モデルであるLEIA(Learned Environment for Interactive Architected Materials)を紹介します。
LEIAは、大きな3つの非構造メッシュを処理し、ユーザの3次元ローディングに対する自己回帰応答を生成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:04:15 GMT)
KVoiceBench, KOpenAudioBench, and KMMAU: Agent-Driven Korean Speech Benchmarks for Evaluating SpeechLMs [7.2] 本稿では,SpeechLM評価のための2つのヒューマンエージェント・ベンチマーク・コンストラクション・フレームワークを提案する。
ソース言語SpkenQAベンチマークをターゲット言語SpkenQAベンチマークに、ターゲット言語ASRコーパスをオーディオ理解ベンチマークに変換する。
これらのフレームワークを用いて,韓国語音声理解のためのKVoiceBenchとKOpenAudioBenchと韓国語音声理解のためのKMMAUの3つのベンチマークを構築し,公開する。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:19:38 GMT)
Seeing through boxes: Non-Line-of-Sight 3D Reconstruction from Radar Signals [7.1] RF信号からの物体形状の再構成は、RF信号のレンズレス撮像特性のため、基本的に困難である。
本稿では,統一LoSとNLoSニューラルジオメトリー再構築フレームワークGeRaF 2.0を紹介する。
視覚的なLoSプリエントをニューラルネットワークの定式化に組み込むことで、GeRaF 2.0は安定したトレーニングと、目に見える幾何学と隠れた幾何学の両方の物理的に一貫した再構築を実現している。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:58:41 GMT)
GeRaF: Neural Geometry Reconstruction from Radio Frequency Signals [7.1] GeRaFは、無線周波数(RF)信号からの近距離3次元幾何再構成にニューラルネットワークを用いた最初の方法である。
RGBやLiDARベースの方法とは異なり、RFセンシングはオクルージョンを通して見ることができるが、レンズのない撮像特性のために低解像度とノイズに悩まされる。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:58:36 GMT)
HyperGuide: Hyperbolic Guidance for Efficient Multi-Step Reasoning in Large Language Models [7.1] マルチステップ推論は、大きな言語モデルにとって重要な課題である。
我々はこのギャップを、段階的に生成する双曲信号に推論の進行を蒸留することで解決する。
我々のアプローチは構造的な観察によって動機付けられており、幾何学的推論木では、解を持つ状態はほとんどなく、デッドエンドは指数関数的に数が多い。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:12:50 GMT)
An Empirical Study on Logging Evolution On Stack Overflow: Trends, Topics, and Challenges [7.1] 本稿では,開発者のQ&AプラットフォームであるStack Overflow(SO)の216,094ポストのデータセットに基づいて,ロギングにおけるトレンド,トピック,課題の詳細な分析を行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:42:01 GMT)
DeltaMCP: Incremental Regeneration via Spec-Aware Transformation for MCP servers [7.0] 本稿では,エンタープライズ向けMPPサーバ用仕様対応インクリメンタルリジェネレーションツールであるDeltaMCPを紹介する。
その結果、メンテナンス性とバージョン整合性を改善しながら、DeltaMCPによる開発者のオーバーヘッドの削減が示されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:31:21 GMT)
A Digital Twin Framework for Virtual Visuo-Haptic Teleoperation of Complex-Shaped Optical Microrobots [7.0] 本稿では,複合型光マイクロロボットの仮想ビジュオ触覚遠隔操作のためのデジタルツインフレームワークを提案する。
このフレームワークは、デジタルツイン環境、画像ベースのポーズと深さ推定、マイクロロボットモーションシミュレーション、モデルベースの触覚レンダリングを統合している。
以上の結果から, 複合型光マイクロロボットのビジュオ触覚遠隔操作戦略を評価するためのフレームワークの有効性が示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:15:38 GMT)
Semantic Flow Regularization: Teaching LLMs to Generate Diverse Yet Coherent Responses [7.0] 大きな言語モデルがペルソナやトーン条件の応答を生成するように微調整された場合、その出力の多様性は極めて限定的です。
本研究では,セマンティックフロー正規化(Semantic Flow Regularization, SFR)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:05:37 GMT)
Latent Diffusion for Missing Data [6.9] 本研究は,MCARの崩壊下で,学習した潜在表現への拡散のシフトが頑健性を向上させるか否かを考察する。
下流の計算では、潜伏拡散はピクセル空間の拡散よりも一貫して優れた性能を達成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:57:09 GMT)
Tactile-Proprioceptive Sensor Fusion for Contact Wrench Estimation in Whole-Body Physical Human-Robot Interaction [6.8] 本稿では,自然界における人間-ロボットインタラクションのための触覚・受容型センサー融合フレームワークを提案する。
空気圧スキンパッドからの触覚は、摩擦残留物と応用外力の間のあいまいさを回避できる接触指標として機能する。
ロボット表面上の多軸接触力を再構成するために、モータ電流によるプロプレセプションを用いてこれらのキューを融合する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:47:25 GMT)
Whose Is This?: Context-Aware Object Ownership Inference with Uncertainty-Guided Questioning [6.8] サービスロボットは、"bring me my cup"のような指示を正しく解釈するために、オブジェクトの所有権を推論しなければならない。
不確実性誘導相互作用(COIN)を用いたコンテキスト認識型オーナシップ推論のためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:43:17 GMT)
GS-FUSE: Granger-Supervised Gated Fusion and Multi-Granularity Alignment for Event-Driven Financial Forecasting [6.8] マルチモーダルなイベントベースの予測フレームワークであるGS-Fuseを提案する。
過去の価格を超える漸進的な予測価値を提供する場合にのみ、イベントテキストに向かって開くことを学ぶ。
さまざまなバックボーンと市場設定でインスタンス化できる。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:19:55 GMT)
Model Merging by Output-Space Projection [6.8] モデルマージは、微調整されたチェックポイントを再トレーニングせずに単一のマルチタスクモデルに結合する。
残余更新よりも凸プログラムとしてマージを定式化できることが示される。
逐次的なレイヤワイドアルゴリズムにより,マルチレイヤマージに拡張し,言語およびビジョンベンチマーク間で一貫した利得を示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:01:29 GMT)
Out of Sight, Not Out of Mind: Unveiling Latent Attack in Latent-based Multi-Agent Systems [6.8] 本稿では、敵のテキストを再利用することなく、潜伏介入による攻撃誘発効果を再活性化する潜伏攻撃フレームワークを提案する。
実験の結果、結果の遅延のみの攻撃はクリーンな実行でタスクパフォーマンスを著しく低下させる可能性がある。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:32:22 GMT)
Mag-VLA: Vision-Language-Action Model for Bimanual Magnetically Actuated Microrobot Manipulation [6.7] 磁気マイクロロボット操作のための視覚言語アクション(VLA)モデルであるMag-VLAを提案する。
我々のフレームワークは、ローランド適応(LoRA)を用いてQwen2.5-VL-7Bのバックボーンを適用し、行動予測のための視覚的観察と言語命令を処理する。
実ロボット実験において、Mag-VLAは、タスクの難易度が増加するにつれて、全タスクで90%のアプローチ成功率、トランスポート成功率80%、70%、50%を達成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:44:00 GMT)
Transfer learning RGB models to hyperspectral images with trainable tensor decompositions [6.7] 大規模なビジョンネットワークは、入力画像が3つの入力チャネルを持つと仮定し、マルチスペクトル画像やハイパースペクトル画像と互換性がない。
本研究では、部分的にトレーニング可能なテンソル分解を用いて、モデルに存在する画像と空間情報を保存するための新しいアプローチを提案する。
様々なハイパースペクトルデータセットの実験により、我々のアプローチは他のハイパースペクトル変換学習法よりも正確で堅牢であることが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:34:27 GMT)
Local Privacy Laws in a Globalized World [6.6] 本研究は,デジタルプライバシ研究コミュニティの視点を広げることを目的としている。
それは、複数の国にまたがる技術プライバシソリューションを開発するための一連の指針として機能することを目的としている。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:41:31 GMT)
GraphSteal: Structural Knowledge Stealing from Graph RAG via Traversal Reconstruction [6.6] Graph RAGは知識グラフを検索パイプラインに統合し、構造化知識に符号化されたエンティティ、リレーション、マルチホップ依存関係へのアクセスを可能にする。
グラフRAGシステムを構造オラクルに変換できることを実証する。
本研究では,局所的およびグローバル的視点から対象グラフを復元する構造指向再構築フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:50:14 GMT)
Do Agents Think Deeper? A Mechanistic Investigation of Layer-Wise Dynamics in Sequential Planning [6.6] 大規模言語モデル(LLM)は、標準のシングルターンタスクでは、その深さを非効率に利用することができる。
エージェント推論は静的タスクとは異なる深度プロファイルを示すことを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:08:08 GMT)
EIT-Pneumatic Hybrid Robotic Skin for Practical and Accurate Force Map Reconstruction [6.6] 開発されたロボットの皮膚は、完全に3Dプリンティングとスプレーコーティングで作られており、安価で簡単に製造できる。
Tikhonov-regularized inverse reconstruction, with per-pad pneumatic calibration, allowing accurate large-area tactile sensor。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:34:23 GMT)
Chinese Word Boundary Recovery through Character Alignment Projection [6.5] 本稿では、アライメントベースの投影タスクとして中国語単語境界回復を定式化する。
まず2つの文字列を文字レベルでアライメントし、次にターゲット側の単語境界をソースに投影する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:17:09 GMT)
Can Large Language Models Handle Discourse Particles? A Case Study of Colloquial Malay [6.3] 本稿では,マレー語における談話粒子の処理能力の評価と解析を行うベンチマークであるtextscMalayPragを紹介する。
また、談話粒子の実用的機能を理解するための言語学的基盤と統一的な枠組みを提供する5つの属性も導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:42:52 GMT)
BenGER: Benchmarking LLM Systems on Subsumption-Based Legal Reasoning in German Law [6.2] BenGERデータセットは、複数のレベルの法学教育にまたがる596の試験スタイルのフリーテキストの訴訟タスクと、531の短い教義的推論タスクの3つのコンポーネントで構成されている。
12の現代LLMシステム – クローズドフラッグシップ,効率指向,オープンウェイト – を,自動および判断に基づくメトリクスで評価する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:03:59 GMT)
Deep Neural Networks for Doubly Robust Estimation with Nonprobability Survey Samples [6.2] 確率および非確率標本から有限個体群の平均値を推定するための、ディープニューラルネットワークを用いた二重頑健なフレームワークを提案する。
提案手法は未知の非パラメトリック関数として非確率標本のロジットサンプリングスコアをモデル化する。
Pew Research Center と Behavioral Risk Factor Surveillance System のデータを用いてシミュレーション研究と実証アプリケーションを用いて,提案手法の評価を行った。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:21:50 GMT)
Tree of Thoughts as a Classical Heuristic Search Problem: Formal Foundations and Design Patterns [6.2] 大きな言語モデル(LLM)は、顕著な推論能力を示している。
Tree-of-Thoughts (ToT)フレームワークは中間推論ステップ上の検索スペースを生成する。
古典的な検索用語に基づく統合分類法により,ToTの景観を合成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:54:48 GMT)
Multi-Teacher Knowledge Distillation via Teacher-Informed Mixture Priors [6.2] 我々は,バイーシアン・フレームワーク内の複数の教師から蒸留した学生モデルを学習するMT-BKDについて紹介する。
エントロピーに基づく重み付け機構は、各教師の影響を適応的に調整し、生徒が複数の専門知識を効果的に組み合わせられるようにする。
MT-BKDは,タンパク質の細胞内位置予測や画像分類など,合成タスクと実世界のタスクの両方で有効である。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:03:24 GMT)
High Performance, Low Reliability: Uncertainty Benchmarking for Tabular Foundation Models [6.2] 最近のTarbular Foundation Models (TFMs) は最先端の予測性能を示し、しばしばGBDT(Gradient-Boosted Decision Trees)を上回っている。
TFM,GBDT,および古典的ベースラインをTALENTベンチマークの112データセットで比較し,このギャップについて検討した。
TFMは高い予測性能を示したが, コンフォメーション予測では条件付きカバレッジが低かった。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:45:05 GMT)
Random Process Flow Matching: Generative Implicit Representations of Multivariate Random Fields [6.2] 本稿では,ベクトル場をニューラル暗黙関数として表現するフローマッチングベースのフレームワークであるRandom Process (RP) Flowを紹介する。
RP Flowはランダムフーリエ機能を使用して、限られた観測セットから任意の場所でクエリ可能な暗黙の信号表現を学習する。
実験により, 高頻度, 高空間性, 高次元性といった困難な条件下でも, キャリブレーションされた不確実性の推定値とともに, 現実的なサンプルを生成することが実証された。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:31:29 GMT)
Modeling Vehicle-Type-Specific Pedestrian Crash Avoidance Behavior in Safety-Critical Interactions Using Smooth-Mamba Deep Reinforcement Learning [6.2] 本研究では、Argoverse 2データセットから安全クリティカルな歩行者と車両の相互作用を抽出する。
車種別歩行者事故回避行動のモデル化を目的として,スムース・マンバディープ決定論的政策勾配フレームワークを開発した。
再構成軌道は強い行動リアリズムを示し、AVとHDVの両方のシナリオで衝突回避運動を正確に再現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:44:10 GMT)
Better heads do not guarantee better binarized constituency parsing [6.2] 本稿では, 句読点を意識した二項化法について再検討する。
依存関係による重み付けがバイナリ固有の監視を改善するかどうかを問う。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:19:33 GMT)
The conditional-mean barrier: From deterministic regression to conditional distribution learning [6.2] このチュートリアルでは、条件-平均障壁を中心とした自己完結モジュールを開発する。
平方損失予測器に潜在ランダム性を加えると、条件平均に戻る。
我々は,否定的対数類似度,モーメントとオブザーバブルマッチング,変分目的,逆数分岐,スコアマッチングなどの共通分布目的を短時間に整理する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:31:42 GMT)
Where Rollouts Begin: Low-Load, High-Leverage First-Token Diversification for RLVR [6.1] RLVR(Reinforcement Learning with Verifiable Rewards)は、ラベル付き軌跡のないモデル推論を訓練する。
RLVRでは、ロールアウトの多様性が中心的なボトルネックとなっている。
本稿では,REFT(Rollout Exploration with First-Token Diversification)を紹介する。REFT(Rollout Exploration with First-Token Diversification)は,RLVRパイプラインの軽量化で,ポリシの上位N$候補からファーストトークンを均一にサンプリングする。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:46:01 GMT)
Relevant Is Not Warranted: Evidence-Force Calibration for Cited RAG [6.1] 我々は,エビデンス・フォース・キャリブレーションのためのコントラストストレステストであるForceBENCHを紹介する。
各項目は引用された節を固定し、エビデンス校正されたクレームと局所的な力評価された変種をペアに持つ。
ヘッドライン実験は固定された局所フィルター付き198ペア評価セットを使用する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:47:44 GMT)
Photon-energy-programmable subnanometric electron birth-site control [6.1] 既存のアプローチは、ナノ構造を取り巻く局所光学場を形成することにより、ナノスケールのサイト選択性を実現する。
ここでは、単一分子電子エミッタを用いて、電子励起経路でサイト選択性を符号化できることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:33:06 GMT)
MERIT: Matching Expertise via Rubric-Informed Training for Reviewer Assignment [6.1] 評価基準レベルの専門知識マッチングをスケーラブルな適合性監視に変換する2段階フレームワークを提案する。
第1段階では、レビュア評価を強化学習を用いて訓練し、論文が必要とする専門的側面を特定し、レビュアの以前の作業と適合させ、適合性を決定する。
第2段階では,評価器の予測を埋込み型レトリバーに蒸留し,大規模割当を効率的に行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:26:20 GMT)
Locality-Aware Redundancy Pruning for LLM Depth Compression [6.1] 表現の局所性によってガイドされるトレーニングフリーのワンショット深度プレーニングフレームワークを提案する。
階層間冗長性はアーキテクチャによって局所化またはグローバルに分散可能であることを示す。
多様なLLMファミリーを対象とした実験では、パープレキシティと下流タスクの精度の改善が示されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:09:57 GMT)
Learning Logical Operations for Arbitrary Quantum Error Correction Codes [6.0] 本稿では,論理演算の物理的実装を構造的特性を強制しながら構築する学習ベースのフレームワークを提案する。
次に、変分早期フォールトトレラント量子コンピューティング(VarEFTQC)と呼ばれる共同設計手順に拡張する。
ソフトウェアライブラリは、損失関数の変種、アンザッツファミリー、最適化ルーチンを含む完全な学習パイプラインを実装している。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:44:55 GMT)
Better Later Than Sooner: Neuro-Symbolic Knowledge Graph Construction via Ontology-grounded Post-extraction Correction [6.0] 質問応答(QA)はAIの中核的な課題であり、特にマルチホップ推論を必要とする複雑なクエリに対してである。
オープンドメイン抽出と組込み型正規化を併用したオントロジー的KG構築のためのニューロシンボリックフレームワークを提案する。
抽出したKGは,SPARQLグラフパターンの発生を計測することにより,シンボリッククエリに適していることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:09:10 GMT)
Off-Policy Learning to Reason Works Because It Is More Pessimistic Than You Think [6.0] 政治以外の目的を達成することを含む、政治以外の目的を直感的に構築する。
これらの効果は暗黙の悲観主義によって理解できることを示す。
次に、この誘導分布を安定化し、非政治学習を改善するための原則的な修正を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:33:35 GMT)
Max-Window Scale Estimation for Near-Lossless HiF8 W8A8 Quantization-Aware Training [6.0] 低ビット浮動小数点フォーマットによる量子化対応トレーニング(QAT)は、効率的なLCMデプロイメントを実現するが、標準的なトレーニングメトリクスには見えない微妙な障害モードを導入する。
遅延スケーリング(DTS)によるOpenPangu-Embedded-1B用HiF8 W8A8 QATの系統的研究について述べる。
我々は、2つの障害モードを同定し、分離する: (i)max saturation、遅延スケール、フォワードパスクリッピングによる知識に敏感な表現を推定する; (ii)カタストロフィックな忘れ、そして、アグレッシブラーニングレートは、量子化とは無関係に事前訓練されたコモンセンス知識を上書きする。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:07:53 GMT)
Optimal Data Acquisition for Reinforcement Learning: A Large Deviations Perspective [5.8] 本稿では,政策選択誤差確率の指数的減衰率を原理的効率指標として紹介する。
我々は、ネストされた問題の最適解という観点から、最適性の相補的な2つの概念を定式化する。
得られた強化学習アルゴリズムは, 最適性基準の下でほぼロマンスに最適であることが証明された。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:08:56 GMT)
GRADE: Generalizable Reasoning-Aware Dialogue Evaluation for AI Tutors [5.8] GRADEは、学生-教師対話における教育能力評価のためのオープンソースモデルの体系的研究である。
ゼロショット推論, LoRAファインチューニング, 合成拡張, CoT+Reasoning, シングルタスク対マルチタスクの定式化など, 5つの言語モデルにわたる120の構成を評価した。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:26:55 GMT)
Accelerating Robot Path Planning via Connectivity-Preserving Region Proposal Network [5.8] 移動ロボット経路計画法は、しばしば広大な探索空間によって制約され、サンプリングベースアルゴリズムの遅延が発生する。
本稿では,コンパクトでトポロジカルに連結した候補領域の予測を目的としたセグメンテーション誘導モデルであるCP-RPNを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:59:03 GMT)
IPO-Mine: A Toolkit and Dataset for Section-Structured Analysis of Long, Multimodal IPO Documents [5.7] IPO申請書は、企業のビジネス、財務、リスクを記述しており、物語のテキストとイメージを備えた、長いマルチモーダルなドキュメントです。
金融市場において重要であるにもかかわらず、現代的な言語とマルチモーダルモデルでIPO申請を研究するための大規模で標準化されたデータセットやベンチマークは存在しない。
IPO-Toolkitは、IPO申請を標準化されたセクション構造化テキストと抽出された画像にダウンロードして解析するためのオープンソースのフレームワークです。
このインフラを利用することで、1994年から2026年までの109,000件以上のIPO申請と修正をカバーし、76,000件以上を含む大規模な、分割構造化されたマルチモーダルデータセットであるIPOデータセットを構築します。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:36:39 GMT)
REED: Post-Training Representation Editing for Cross-Domain Linguistic Steganalysis [5.7] 本稿では,クロスドメイン言語ステガナリシスのための学習後表現編集手法を提案する。
提案手法は、特にF1スコアにおいて、高いクロスドメイン検出性能を実現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:49:33 GMT)
Dynamics of Stochastic Momentum with Sparse Updates in High Dimensions [5.7] 既存の運動量理論は、勾配がほぼ一定の速度で全てのパラメータに到達すると仮定する。
スパース更新下での2つの運動量モデルの運動力学を理論的に解析する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:06:41 GMT)
Learning to Bid in Repeated Second-Price Auctions with Dynamic Values and Aggregated Feedback [5.7] 入札者の価値が動的である場合、すなわち、現在の価値が過去の結果に依存する場合、入札者の価値が動的である場合、入札を学習する問題について研究する。
我々は,プラグイン推定器と最適ポリシーの微分方程式を組み合わせた学習手法のクラスに対して,後悔すべき境界を導出する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:20:08 GMT)
STAMBRIDGE: Spectral-Temporal Amplitude-aware Mid-Feature Bridge for EEG Visual Decoding [5.7] STAMBRIDGEは機能コンディショニングとクロスモーダルアライメントに取り組む汎用的な2段階フレームワークである。
このような頑健なニューラルネットワークの特徴を基盤として,モデルに依存しない中機能セマンティックブリッジ(MFSB)を導入する。
THINGS-EEGベンチマークの実験では、Top-1の34.50%、Top-5の65.95%の精度で200方向ゼロショットの検索性能が向上した。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:16:35 GMT)
Global Kochen-Specker Contextuality Without Local Contextuality and Generalized Bell Nonlocality [5.6] 量子データの集合は、すべての局所的なテストで古典的に見えるが、複合システム全体の古典的な説明は認めない。
ここでのグローバルとは、多部類全体の物理的意味でのグローバルを意味し、シェフ理論の局所的・言語的用語ではない。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:30:01 GMT)
A Conflict-Aware Penalty and Statistical Loss Framework for Balancing Modalities and Enhancing Stability in Multimodal Sentiment Analysis [5.6] マルチモーダル・センティメント・アナリティクス(MSA)は、感情を推測するためにテキスト、音響、視覚ストリームを融合させる。
CP(Conflict-aware Penalty)は、各トレーニングステップで勾配規範の衝突を検出し、罰する。
予測分布統計と経験的入力統計を一致させる統計損失(SL)。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:59:19 GMT)
Security Metrics for Nonlinear Optical Light Sources from Interferometric Field Reconstruction [5.5] 2次元ペロブスカイト材料により生成された4波混合信号場の基本的な量子通信量について検討する。
我々は、コヒーレンス時間自由度を組み込むことで、ホレヴォ境界を約2.6-5.8%下げることを発見した。
偏極状態の不連続性を実験的に達成可能なスループットに結びつけるため,実効的なシークレットビット・パー・パルスメートル法を導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:21:09 GMT)
Privately Estimating Monotone Statistics in Polynomial Time [5.5] 単調な統計量の推定に有効な差分法アルゴリズムについて検討する。
我々のアルゴリズムはサンプルの複雑さで$t$を節約し、実行時に$et$を支払う。
応用として、プライベート固有値推定、プライベート損失推定、高次元モデルの単一パラメータのプライベート推定の改善結果を得る。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:40:25 GMT)
The Confidence Shortcut: A Reasoning Failure Mode of Masked Diffusion Models [5.4] 信頼性に基づく復号法は、複雑推論に必要な論理フロー軌道と本質的には一致していないと我々は主張する。
信頼に足るトレーニングが、このミスアライメントを積極的に定着させることを示す。
対照的に、ランダムマスキングは、その非効率さが認識されているにもかかわらず、挑戦的な尾を解くのに不可欠な推論・軌道条件をしっかりと保存している。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:33:37 GMT)
SAFEVPR: Patch-Based Conformal Verification for Safe Cross-Condition Sequence Visual Place Recognition [5.4] 我々は、安全なクロスコンディションシーケンスVPRのための訓練不能な検証・校正パイプラインであるSAFEVPRを紹介する。
標準的なバックボーンのコサイン類似性を、凍ったDINOv2 ViT特徴から計算された相互アレスト近傍(MNN)パッチマッチングスコアに置き換える。
ターゲットFDRα = 0.10の23/23設定で実証的に有効であり、許容される平均FDR 0.014と平均真正レート(TPR) 0.75を達成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:49:04 GMT)
An Enhanced Large Neighborhood Search Approach for the Capacitated Facility Location Problem with Incompatible Customers [5.4] 古典的容量化施設配置問題の新しい変種が文献で紹介されている。
この問題は、与えられた顧客のペアが同じ施設で提供できない状況を把握する。
この問題を解決するために,Large Neighborhood Search (LNS)法を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:42:06 GMT)
Compositional Generalization in Autoregressive Models via Logit Composition [5.4] 本稿では, 自己回帰システムのための新しい, 原則的構成戦略を提案する。
因子化された条件付き仮定の下では、結果の合成が射影的であることを示す。
また,因子化仮定と成分保証が目標長さで均一に保たれている場合,構成が長さ一般化挙動を保っていることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:00:26 GMT)
Prompting Is All You Need: Multi-view Prompting Large Language Models for Aspect-Based Sentiment Analysis [5.4] マルチビュー・プロンプト(LLM-MvP)を導入し,複数要素の順序付けをLLMプロンプトに適用する多視点原理を適用した。
LLM-MvPは、計算オーバーヘッドを大幅に削減しつつ、微調整されたアプローチよりも性能が優れている。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:04:39 GMT)
Pretrained Approximators for Low-Thrust Trajectory Cost and Reachability [5.3] 低推力軌道設計は燃料消費と輸送能力の繰り返し評価に大きく依存している。
本研究では、これらの量を機械学習サロゲートによって正確に近似し、高速でスケーラブルな評価を可能にすることを示す。
提案モデルでは, 単変速機および多変速機の最適燃料消費と最小移動時間を正確に予測する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:35:10 GMT)
SuiChat-CN: Benchmarking Contextual Suicide Risk Assessment in Chinese Group Chats [5.3] 自殺は世界の公衆衛生にとって重要な課題であり、毎年約72万人が死亡している。
メッセージは短く、断片化され、多人数で、暗黙的あるいは文化的に特定の表現に依存している。
我々は、文脈的自殺リスク評価のための中国のグループチャットベンチマークであるS SuiChat-CNを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:37:56 GMT)
GraD-IBD: Graph Representation Learning from Diagnosis Trajectories for Early Detection of Inflammatory Bowel Disease [5.3] 本研究では,縦方向のICDトラジェクトリを経時的指向グラフとして再構成するグラフ診断モデルGraD-IBDを提案する。
時間的依存を捕捉し、モデルの複雑さを減らし、新しいコンテキスト対応、時間遅延メッセージパッシング機構を開発した。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:37:38 GMT)
PromptEmbedder:: Efficient and Transferable Text Embedding via Dual-LLM Soft Prompting [5.3] PromptEmbedderは、特定のバックボーン重みから埋め込み知識を分離する新しいデュアルLLMフレームワークである。
PromptEmbedderは、GPUメモリを40%削減し、トレーニングを3.7倍高速化しながら、LoRAの微調整で同等のパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:23:55 GMT)
Evolving to the Aesthetics of a Vision-Language Model [5.3] VLM(Vision-Language Models)を用いた住民の美学評価法について検討する。
第1の方法は、CLIP-IQAを使用して、各デザインの美的スコアを予測する。第2の方法は、ユーザが指定したカスタムプロンプトを使用して、VLMによって決定された勝者と、候補同士をピットする。
本稿では,これらの手法を,カスタム生成システムを用いたケーススタディの文脈において提示し,その結果のランキングとアーティストの美的ランキングと,他の美的評価技術による評価結果と比較する。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:38:00 GMT)
Adopt $\neq$ Adapt: Longitudinal Analyses of LLM Conversations in the Wild [5.3] 我々は、Microsoft Bing Copilotユーザをランダムにサンプリングした$sim$12,000の会話軌跡を分析した。
個々のユーザトラジェクトリの傾向は,はるかに弱いことが分かりました。
よりアクティブなユーザは会話をより成功させ、より複雑でプロフェッショナル指向のタスクにLLMを使用する。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:17:25 GMT)
Pressure-Testing Deception Probes in LLMs: Scaling, Robustness, and the Geometry of Deceptive Representations [5.2] LLMのアクティベーションをトレーニングした線形プローブは、騙し検出指標としてますます提案されているが、AUROCは分布シフトの下で崩壊しながらクリーンなベンチマークで0.96を超えることを報告している。
本稿では, Gemma 3 モデルファミリ(1B-27B パラメータ)における圧力-プローブ-ベースの測定値について, 系統的に検討する。
1) 単線方向, (2) 多次元部分空間, (3) 凸円錐殻, (4) エントロピープロキシの4つの仮説を検証した。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:51:55 GMT)
Examining Agents' Bias Amplification versus Suppression in Multi-Agent Systems [5.2] バイアスのあるエージェントがシステム全体の公平性に大きく影響することを示す。
エージェントが一様にバイアスにさらされると、システム全体のバイアスは増加し、個々のエージェントのバイアスの加算和を超える。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:53:29 GMT)
Conveyance: A Versatile Framework for Learning in Structured Class Spaces [5.2] 構造化クラス空間に適した新しい分類手法と関連する損失関数であるtextscConveyanceを提案する。
複雑な結合分布を定義したり、ユーティリティ行列を手動でチューニングすることなく、グラフのようなクラス間の関係をエンコードすることができる。
階層分類,順序回帰,複数インスタンス学習に適用することで,本手法の汎用性と有効性を示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:51:59 GMT)
Efficient Post-training of LLMs for Code Generation With Offline Reinforcement Learning [5.2] オンライン強化学習(RL)を用いたポストトレーニングは、コード生成モデルを含むLLMにとって重要なトレーニングステップである。
コード生成のためのオンラインRLには、生成した出力の推測と検証が含まれており、かなりの時間とリソースを要する可能性がある。
本稿では,既存のコードデータセットを利用したコード生成モデルへのオフラインRLの適用について検討する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:43:14 GMT)
Gradient Step Plug-and-Play Model for Dental Cone-Beam CT Reconstruction [5.2] 本研究の目的は, 歯科用コーンビームCT再建における光子ノイズの影響を低減することである。
逆問題定式化を考慮し,事前データベースを構築した。
前者は、再構成されたシミュレートされた取得を用いて勾配ステップデノイザを訓練することにより得られる。
訓練されたモデルは、シミュレーションプロジェクションからイメージを再構成するプラグイン・アンド・プレイ・グラデーション・ステップ・アルゴリズムに統合される。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:15:05 GMT)
SIGMA: Bridging Structural and Distributional Gaps for Vision Foundation Model Adaptation [5.1] Vision Foundation Models (VFM) は印象的な表現能力を示している。
textbfScale-textbfIntegrated textbfGlobal textbfModulation textbfAdapter (textbfAdapter)
論文参考訳(メタデータ) (Wed, 27 May 2026 03:17:46 GMT)
Large-scale array of squeezed light and synchronization using atomic vapor [5.1] 圧縮光などの量子光源は、量子情報科学や技術にとって不可欠である。
この研究は、精度測定、量子イメージング、量子情報処理に応用するためのスケーラブルな高性能量子光源への経路を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:16:34 GMT)
Rethinking Visual Neglect: Steering via Context-Preference for MLLM Hallucination Mitigation [5.0] 画像は文脈として、モデルのパラメトリック知識とテキストコンテキストと同時に競合する、と我々は主張する。
本研究では,2つの意味論的に異なるコンテキスト参照ベクトルを抽出する,学習不要なフレームワークであるコンテキスト参照ステアリング(CAS)を提案する。
実験により、CASは遅延遅延を増大させることなくオブジェクト幻覚を実質的に緩和し、ネイティブテキスト生成の品質を保っていることが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:33:06 GMT)
When Context Flips, Safety Breaks: Diagnosing Brittle Safety in Aligned Language Models [5.0] 安全ベンチマークスコアは、デプロイの準備が不完全な証拠を提供する。
整列言語モデルは、状況アップデートがどのアクションが安全かをひっくり返しても、厳格なルールに固執することが多い。
安全ベンチマーク全体で12のモデルと2つのコモンセンス制御を、名目上安全なアクションが害をもたらすペア付き変種を用いてテストする。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:09:30 GMT)
SYNAPSE: Neuro-Symbolic Visual Thought-to-Text Decoding via Topological Semantic Denoising [5.0] 我々は,推論時記号正規化によるニューラルテキスト生成を安定化するニューラルシンボリックフレームワークであるSynAPSEを紹介する。
脳波に基づくセマンティック候補をコモンセンスグラフ構造と潜在例を用いて浄化することにより、SynAPSEはエンド・ツー・エンドのLCM微調整なしでセマンティック安定性を向上させる。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:12:44 GMT)
ResearchLoop: An Evidence-Gated Control Plane for AI-Assisted Research [5.0] ResearchLoopはAI支援型計算研究のためのエビデンス付き制御プレーンである。
ResearchLoopは、リサーチ質問、タスク契約、エビデンスオブジェクト、クレーム台帳、クローズアウト、ペーパーバインディングを耐久性のあるプロジェクトステートとして扱う。
この技術レポートは、完全なプロトコル仕様、状態モデル、トランジションルール、クレーム・アドミッション・アルゴリズム、インサイト・コンポーティングメカニズムを提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:29:00 GMT)
Slogans or Stance? A Label-Light Diagnostic for Entrepreneurial-Discourse Measurement on Chinese SOE Speeches [5.0] コーポレートスピーチにおける「起業家精神」などの構成物を測定するために,ラベル光測定を用いた。
中央管理の中国国有企業のリーダーによる80件の演説のコーパスにおいて,我々は自然実験を生かした。
金F1は、外部構造回復ではなく、LCM自身のプロンプトルールとの整合性を測定する。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:56:42 GMT)
Habermolt: Delegating Deliberation to AI Representatives [4.9] 熟考民主主義は、おそらくより優れた集団的決定をもたらすが、基本的には人間の注意と帯域幅に拘束されている。
最近のAIによる議論は、多くの人間からの入力を合成することで参加を拡大するが、個々のユーザーにとって時間を要するままである。
AIモデルがますます有能になるにつれて、AIシステムは人間間の議論を仲介するだけでなく、人間を表現するためにも展開されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:45:17 GMT)
Detecting Diffusion-Generated Time Series Under Generator Shift [4.9] 拡散生成時系列の検出器は未探索である。
時系列検出におけるホワイトボックスとブラックボックスのアプローチについて検討した。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:54:35 GMT)
Revealing Algorithmic Deductive Circuits for Logical Reasoning [4.8] 大言語モデル(LLM)は機能的関数的記号表現を組み込むことで、強力な推論性能を達成することができる。
本研究の目的は,個々の推論ステップに責任を負うアテンションヘッドをローカライズし,それら間で伝達される情報の種類を特徴付けることである。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:30:09 GMT)
From Kellgren-Lawrence to Calcium Pyrophosphate Crystal Deposition: A Soft-Labelling Framework for Knee Osteoarthritis Assessmen [4.8] 変形性膝関節症に対する従来の深層学習法は, 臨床実習で観察された2つの尺度の非対称な関係を捉えられなかった。
ソフトラベリングに基づく枠組みが開発され,アノテートグレード上の一重項分布に置き換わる。
両項,ベータ,三角形,指数分布の4つの定式化について検討した。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:57:01 GMT)
Technical Report: Exploring the Emerging Threats of the Agent Skill Ecosystem [4.8] 主要なマーケットプレースから3,984のAIエージェントスキルを分析し、クレデンシャル盗難、バックドアインストール、データ流出を含む76の悪意のあるペイロードを発見した。
スキルの13.4%は、少なくとも1つの重要なレベルのセキュリティ問題を含んでいる。
手動で確認された少なくとも8つの悪質なスキルは、出版日時点で clawhub.ai で公開されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:10:10 GMT)
Adapting the Interface, Not the Model: Runtime Harness Adaptation for Deterministic LLM Agents [4.8] モデル重みや評価環境を変化させることなく冷凍LDMエージェントを改善するライフサイクル対応ランタイムハーネスであるLife-Harnessを提案する。
ライフ・ハーネスは、繰り返し発生する相互作用の失敗を、環境契約、手続きスキル、行動実現、軌道規制にまたがる再利用可能な介入に変換することによって、訓練軌道から進化する。
ライフハーネスはモデル116のうち116で改善され、環境設定は18モデルバックボーンで改善され、平均的な相対的改善は88.5%である。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:34:36 GMT)
Beyond Binary Moral Judgment: Modeling Ethical Pluralism in AI [4.7] 本稿では,道徳的推論を規範的倫理理論や倫理的多元論の分布としてモデル化する枠組みを提案する。
また,15種類の微粒なサブセトリーを対象とする450例のベンチマークを,重ね組立学習のために作成した。
本実験は,文脈的および規範的事前のセマンティック埋め込みとの統合により,分類性能が著しく向上することが実証された。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:33:06 GMT)
Reverse Probing: Supervised Token-level Uncertainty Quantification for Large Language Models in Clinical Text [4.7] 本稿では,既存のラベル付き要約から直接トークンレベルの不確実性を推定するReverse Probingを提案する。
Reverse Probingは、テキストをモデルの内部状態へのプローブとして扱い、内部アクティベーションの4つのカテゴリから不確実な信号を抽出する。
専門家による2つの臨床データセットで評価し、すべての指標で8つの適応ベースラインを上回りました。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:01:04 GMT)
GeneralThinker: Domain-General Reasoning through Likelihood-Guided Answer-Conditioned Optimization [4.7] GeneralThinker(ジェネラルシンカー)は、厳密な回答条件の最適化として推論の監督を改革する、政治上のフレームワークである。
GeneralThinkerは、接地真実解の確率を用いて、生成された推論軌道を評価する。
クリッピングと方向保存変調によるトークンレベルの更新を制限します。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:07:26 GMT)
VLMs May Not Globally Enhance Human Alignment over LLMs During Natural Reading [4.6] 我々は,大言語モデル (LLM) と視覚言語モデル (VLM) のペアを,厳密なテキストのみの設定で比較する。
マルチモーダル事前学習は,自然読解時のヒトのアライメントにおいて,一様でグローバルな優位性を与えるものではない。
本研究は,多モーダル事前学習が,自然読解時の人間的な言語表現よりも,多モーダル事前学習が選択的に寄与することを示唆している。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:59:34 GMT)
Review Arcade: On the Human Alignment and Gameability of LLM Reviews [4.6] 我々は,2025 ACL Rolling Review (ARR) の論文に対して,著者とレビュアーの両方の観点から LLM レビューを評価する実験を行った。
LLMレビューの「ゲーム」は特定のシナリオで有効であり、最大35%の論文において、統計学的に顕著なスコアの増大につながることが判明した。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:40:35 GMT)
Project SPARROW and the Future of Conservation Technology [4.6] SPARROWは、太陽エネルギー、エッジ人工知能、衛星通信を統合した、ハードウェアとソフトウェアのオープンソースプラットフォームである。
リモート環境での継続的かつ自律的な生物多様性監視を可能にする。
我々はコロンビア、ペルー、タンザニア、アメリカの熱帯、温帯、モンタンの生態系にSPARROWを配備した。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:34:16 GMT)
Saddle Networks: Structure-Preserving Architectures for Convex-Concave Functions [4.6] 多くの応用において、関連する函数 f(x,y) は x において凸で y において凹であり、この幾何学を保存することが不可欠である。
凸凹形状を保存する構造的分離分解を導入する。
次に、x における凸性や y における凸性を保存する実用的なサドルネットワークアーキテクチャについて述べる。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:25:24 GMT)
Chirped-pulse engineering for robust control of single-molecule orientation in a cavity [4.6] チャープパルス駆動を用いたキャビティと強く結合した個々の分子の配向に対するコヒーレント制御の理論的検討を行った。
数値シミュレーションにより、チャープパルスは分子配向の正確な制御を可能にし、最大配向度0.5773に達することが判明した。
本研究は、空洞系における分子配向を制御するための新しい戦略を導入し、将来の実験的応用に価値ある視点を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:14:36 GMT)
Adaptive Temporal Gating of Longitudinal Magnetic Resonance Imaging for Alzheimer's Prediction [4.5] 縦3次元MRIスキャンをモデル化したCNN-TransformerアーキテクチャであるTAF-Netを導入する。
3年間のMCI-AD変換予測のためのアルツハイマー病神経画像イニシアチブコホートの評価
論文参考訳(メタデータ) (Wed, 27 May 2026 12:33:46 GMT)
Coherent Dark State Formation of a Lead-Vacancy Spin Qubit in Diamond [4.5] ダイヤモンド中の鉛空孔(PbV)中心は、液体ヘリウム温度を超えるコヒーレント放出を示す。
ダイヤモンド中のPbV中心の磁気光学特性とスピン特性について報告する。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:56:59 GMT)
Accelerating HEVC Intra Partitioning via a CNN-Hierarchical Attention Transformer Hybrid [4.5] Hybrid Fast Vision Transformer (HFViT) はHEVCのモード内分割予測を高速化するために設計されたハイブリッドアーキテクチャである。
標準的なJCT-VCテストシーケンスでは、HFViTは平均VMAF BDレートのペナルティを2.4、2.6、および7.9ポイント削減する。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:10:22 GMT)
Knowledge Graph-Driven Expert-Level Reasoning for Neuroscience [4.5] 知識グラフ(KG)は、テキストコーパスから抽出され、詳細な推論に使用される抽象化である。
我々は、デュアルLLM検証パイプラインを介して教科書由来のKGを構築し、KGトポロジに基づいて訓練されたマスク付きLMで拡張し、マルチホップQAアイテムを生成する。
以上の結果から,大規模で異種なWebスケールコーパスに依存することなく,深い機械的神経科学理解をモデルに誘導できることが示唆された。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:23:42 GMT)
Political Neutrality as Balanced Approval: A Large-Scale Human Evaluation of AI Responses [4.5] 我々は、AIの政治的中立性の新たな定義を提案し、それをテストするために大規模なユーザスタディを設計する。
議論の的になっている問題について尋ねると、AIモデルは、反対の視点を持つグループ間での承認を最大化する応答を生成するべきです。
我々は、Redditに関する政治的に告発された質問と、フロンティアAIモデルからの回答から引き出された、米国の問題に関するベンチマークを構築します。
すべての20の課題において、AIの反応が双方の承認率を高めることが可能であることに気付きました。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:27:39 GMT)
Analyzing Persona Effects in Generated Explanations from Multimodal LLM Agents in Urban Perception [4.4] 本研究では,都市環境下での多モーダル大言語モデルにより生成されたペルソナ言語について検討する。
1200のペルソナ条件エージェントと2つの非ペルソナ設定からの59,808のアノテーションを用いて、ペルソナのキャプション、正当化、認識タグを分析した。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:11:42 GMT)
Label-Free Reinforcement Learning via Cross-Model Entropy [4.4] 強化学習を伴う学習後の大規模言語モデルは、報酬信号によってボトルネックとなる。
RL後学習のためのラベルなし報酬信号としてクロスモデルエントロピー(CME)を提案する。
CMEは継続的で、トレーニングなしであり、検証者が予想外の応答が正しいか、品質が高いと判断する原則に基づいている。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:04:35 GMT)
Patched-DeltaNet: Token-Level Event-Driven Memory for Linear-Time Anomaly Detection [4.4] 時系列異常検出は、ミッションクリティカルシステムの信頼性を維持するために重要である。
我々は,Gated Delta Networksと時系列パッチを併用した新しいアーキテクチャPatched-DeltaNetを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:33:03 GMT)
SKILLC: Learning Autonomous Skill Internalization in LLM Agents via Contrastive Credit Assignment [4.3] 本稿では,このコントラストを内部化のための直接学習信号に変換するContrastive Skill Credit Assignment (CSCA) に基づくフレームワークであるSkillCを提案する。
textscSkillCは、同じポリシー更新内でアクティブなスキルタイプからのタスクに対して、ペア化されたスキル注入とスキルフリーのロールアウトをサンプリングする。
スムーズな検証レベル信号は、帰属強度、ロールアウトアロケーション、単調なアクティブセットプルーニングよりも適応的なカリキュラムを駆動する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:21:19 GMT)
Detecting and Mitigating the Correct-Answer Extinction Window in Test-Time Reinforcement Learning with Majority Voting [4.3] テスト時間強化学習 (TTRL) は, 多数決を擬似ラベル信号として用いた数学的推論ベンチマークにおいて, かなりの精度向上を報告している。
textitCorrect-Answer Extinction Windowをターゲットにした3つのメカニズムを持つ軽量フレームワークであるTTRL-Guardを提案する。
3つのモデルと4つのベンチマーク実験により、TTRL-GuardはQwen2.5-7B-InstructとQwen3-4Bで最高平均パス@1を達成し、AIME 2025では+54%改善した。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:12:51 GMT)
Constrained Auto-Bidding via Generative Response Modeling [4.3] 自動入札システムは、予算制約やコスト・パー・アクセシションなどの比率目標の下で、長期的地平線上の広告主価値を最大化することを目的としている。
コントロールベースのペアリングは逸脱に反応するが、将来の状況は予測できない。一方、RLと生成法は、制約を報酬信号に折り畳み、違反を回避し、分散シフトの下で劣化させる。
単一入札乗算器の関数として,将来の交通量と地平線集約コスト/値曲線を共同で予測する履歴条件付きシーケンスモデルであるジェネレーティブ・レスポンス・モデル(GRM)を用いて,学習対象を行動から応答へシフトする。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:06:54 GMT)
Symmetry Defeats Auditing [4.3] イントロスペクション・アダプタに対する攻撃を実演する。
イントロスペクションアダプタ(Shenoy et al., 2026)
イントロスペクションアダプタ(Shenoy et al., 2026)
論文参考訳(メタデータ) (Wed, 27 May 2026 01:47:18 GMT)
Entropy-aware Masking for Masked Language Modeling [4.3] マスケッド言語モデリングは,エンコーダに基づく言語モデルのトレーニングにおいて,標準的な事前学習対象となっている。
本研究では,エントロピー分布に基づくトークンマスキング戦略について検討する。
本稿では,外部参照モデルに頼らずにトレーニング効率を向上させる,新たなセルフマスキング手法を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:22:49 GMT)
Prospective evaluation of multimodal respiratory failure prediction: Do chest X-rays improve performance beyond EHR signals? [4.3] 我々は、構造化EHR時系列データをCXR基礎モデル表現と統合するゲート型マルチモーダルフレームワークを開発した。
ICU患者24時間以内の侵襲的機械換気予測の枠組みについて検討した。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:07:31 GMT)
MSCGC-KAN: Multi-scale Causal Graph Convolution and Kolmogorov-Arnold Feature Mapping for EEG Emotion Recognition [4.2] 本稿では,MSCGC-KANと呼ばれる感情認識手法を提案する。
MSCGC-KANはマルチスケール因果グラフ畳み込みとKolmogorov-Arnold特徴写像からなる構造化タスクヘッドである。
提案手法はFACEDおよびSEED-VIIデータセット上で60.66%のバランス精度と60.40%の重み付きF1スコアを実現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:30:59 GMT)
PhAME: Phenotype-Aware Molecular Editing via Latent Diffusion [4.2] 小分子の薬物発見には、候補分子の多くの特性を同時に最適化する必要がある。
既存の生成方法は、2つの重要な要件を満たすことができない: 既知のヒットに構造的近接を維持しながら、所望の表現型シグネチャに対して正確なガイダンスを提供する。
我々は,この課題を克服する潜伏拡散フレームワークであるPhAMEを紹介し,事前学習されたグラフベースVAEの潜伏空間における編集として分子最適化を再キャストする。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:41:07 GMT)
Three-dimensional Conditional Diffusion Models for Cosmological 21 cm Lightcone Emulation [4.2] 三次元21cm光錐エミュレーションのための条件拡散モデルについて検討する。
空平面サイズが64ドル(約6,400円)で、視界深度が最大1024セルまである立方体に焦点を合わせています。
事前処理の選択、ダイナミックレンジ圧縮設定、アーキテクチャの深さ、トレーニング期間の制御された比較を行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:16:49 GMT)
EvaluatAR: A Cross-Device Evaluation Framework for Rapid Prototyping of Bystander PETs in AR [4.1] EvaluatARは、視覚的傍観者プライバシー向上技術の迅速なプロトタイピングのためのクロスデバイス評価フレームワークである。
HoloLens 2、Magic Leap 2、Meta Quest 3の3つのケーススタディを、暗黙的かつ明示的な(インテント駆動)PETで提示する。
これらの結果から, 傍観者PETの再現可能なクロスデバイス評価を促進するために, 迅速かつ反復的なPET開発をEvaluatARが支援していることが示唆された。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:29:31 GMT)
Universal Time Series Generation with Neural Controlled Differential Equations [4.1] 生成型SLiCEは経路空間上のフローマッチングのための最大表現型連続時間モデルである。
確率的予測および下流タスクにおいて,表現性により性能が向上することを示す。
これは、固定グリッドモデルがしばしば苦労する不規則グリッドにとって特に有益である。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:10:41 GMT)
Learning When to Optimize: Verified Optimization Skills from Expert GPU-Kernel Lineages [4.1] LLMベースのエージェントはGPUカーネルの生成にますます利用されている。
彼らはしばしば、最適化がいつ正しいかを知らずに、どの最適化を試すべきかを知っています。
KLineageを紹介します。これは、専門家のカーネルから欠落している"When"の知識を学習します。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:32:16 GMT)
DebFilter: Eradicating Biases Stashed in Value [4.1] テキスト・ツー・イメージ・モデルにおける社会的・意味的バイアスを軽減するために,DebFilterを提案する。
我々は,クロスアテンション内の値成分を調整するバイアス補正戦略を適用した。
本手法は,生成した画像の社会的バイアスを効果的に再構成することを示した。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:49:41 GMT)
Utility-Aware Multimodal Contrastive Learning for Product Image Generation [4.0] 製品イメージはオンラインマーケットプレースにおける消費者の意思決定に強く影響を与えます。
本稿では,消費者需要を新たなユーティリティ・アウェア・InfoNCE損失に組み込むフレームワークを提案する。
我々のフレームワークは、新しい生成モデルに柔軟に組み込んで直接の商業利用を改善することができる。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:54:51 GMT)
SEEK: Semantic Evidence Extraction via Adaptive ChunKing for Multilingual Fact-Checking [4.0] 本稿では,適応的なChunKingフレームワークを用いたセマンティックエビデンス抽出手法であるSEEKを提案する。
セマンティックトピックの遷移を特定し、局所的な検証コンテキストを保存することによって、完全な事実チェック記事からコヒーレントなエビデンスチャンクを構成する。
セマンティックチャンキングで最大10%、文チャンキングで19%、検索スニペットベースラインで20%、マクロf1を改善する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:06:48 GMT)
Learning to Assess the Reliability of Number-of-Runs Estimation in Stochastic Optimization [3.9] 本研究では,近年のオンライン実験を学習ベースで拡張し,ハンドリングと歪度に基づく対称性チェックを用いて,必要な実行回数を適応的に推定する手法を提案する。
我々は,23個の統計量,エネルギーフリー,形状および安定性の分類器を訓練し,少数クラスのリコールによる誤推定の検出を優先し,ラン数推定が信頼できるかどうかを推定する。
その結果,不確実な推定値の信頼性を高いマイノリティクラスのリコールで検出できるが,固定構成におけるデータ多様性の制限により性能は制限されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:08:19 GMT)
Narrative Flattening: How Post-Training Compresses Thematic, Affective, and Stylistic Variation in LLM Fiction [3.9] StoryStar、TMAS、The New Yorkerにまたがるマッチングされたストーリー継続パラダイムを構築します。
4つのOLMo 32Bチェックポイントからの継続を一致した人文と比較する。
これらのチェックポイントは、アーキテクチャ、スケール、トークン化、事前トレーニングを共有するため、設計はポストトレーニング効果を分離する。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:55:34 GMT)
Bridging Maximum Likelihood and Optimal Transport for Efficient Inference and Model Selection in Stochastic Block Models [3.8] 最適輸送(OT)レンズによるブロックモデル(SBM)の推論について検討する。
まず、エントロピー正則化を伴う半緩和Gromov-Wasserstein(srGW)射影として、最大可能性変動推論(MLVI)を解釈できることを確かめる。
このような正規化された定式化は、モデルパラメータを同時に復元し、単一の最適化問題においてパラメータ数を選択する推定器を生成することを実証的に示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:44:43 GMT)
Error as a Lens: Probing LLM Reasoning through Synthetic Misconception Generation [3.7] 改訂されたブルーム分類から適応した5クラス分類を対象とする誤りを生成する枠組みを提案する。
このフレームワークは、クラス階層化された合成エラーデータセットを構築するための再利用可能なレシピを提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:04:10 GMT)
AlphaTransit: Learning to Design City-scale Transit Routes [3.6] 都市バスネットワーク設計のための検索ベース計画フレームワークであるAlphaTransitを紹介する。
AlphaTransitは、MCTS(Monte Carlo Tree Search)とニューラルポリシー値ネットワークを結合する。
我々は,AlphaTransitを,現実的な道路トポロジと国勢調査による需要を考慮した新しいBloomington TRNDPベンチマークで評価した。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:48:55 GMT)
Do Agents Need Semantic Metadata? A Comparative Study in Agentic Data Retrieval [3.6] 構造化されていないWebをナビゲートできるLarge Language Models(LLM)の台頭は、根本的な疑問を提起する。
オープンウェブ文書を検索するベースラインエージェントと、スキーマ.orgを用いて9000万のデータセットのコーパスを利用するセマンティックエージェントの2つの異なる環境におけるエージェントデータ検索の比較分析を行う。
セマンティック・エージェントは動作可能なデータを抽出し、メタデータ豊富なレジストリの44.9%の精度と、返却された結果の中で機械可読なダウンロードを持つページの46.6%の精度を達成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:46:43 GMT)
Lost in the Evidence? Reproducing Document Position and Context Size Effects in RAG [3.6] Retrieval-Augmented Generation (RAG) システムは、取得した文書がモデルの入力コンテキストに入力されることに依存する。
先行研究は、中年期の喪失や関連する長文現象のような位置に基づく効果を報告している。
トピックサンプリングが分散の主要な原因であることを示し、小さなトピックセットはオーダリング効果を誇張することができる。
また,より現実的なRAGシナリオについて検討した。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:04:02 GMT)
Local Strong-to-Weak Spontaneous Symmetry Breaking [3.6] 本稿では,局所的な一点忠実度相関器による強弱自然対称性破壊(SW-SSB)の局所的概念を提案する。
SW-SSBの重要な特徴として, 有限深度対称チャネルの安定性と長距離条件付き相互情報の安定性が, この局所的な枠組み内に持続していることが示されている。
臨界状態に対して、局所的な一点忠実度相関器は、欠陥問題の興味深いクラスを定義する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:16:15 GMT)
Filter-assisted quantum subspace diagonalization via wavefunction sparsity engineering [3.6] 量子サンプリングに基づく部分空間対角化技術は、多体系の基底状態エネルギーを近似するための有望なアプローチとして登場した。
本稿では,フィルタを用いた量子対角化プロトコルを提案する。
その結果,提案プロトコルは波動関数の分散性を著しく向上し,地中エネルギー推定誤差を桁違いに低減し,サンプリングオーバーヘッドを大幅に低減することがわかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:42:58 GMT)
On the Role of Inductive Bias in Time-Series Pretraining: A Case Study in Learning Generalizable Representations for Clinical Time Series [3.5] 課題タイプや課題間の表現が伝達されるように、事前学習対象がどの帰納的バイアスを課すべきかを考察する。
ダイナミクス中心の混合物は最もバランスの取れた移動を生み出す。
全体として、局所的再構成と時間的連続性を組み合わせるとともに、アクセスが現実的であればコンテキスト内条件付けを加えることで、堅牢な主観的表現が得られる。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:20:57 GMT)
Efficient and Scalable Provenance Tracking for LLM-Generated Code Snippets [3.5] コード補完と生成のための大規模言語モデル(LLM)は、冗長で権威の帰属のないトレーニング例を再現することができる。
Winnowingのような指紋認証に基づく古典的な指紋認証は依然として有効である。
コード検索に適した300M-パラメータエンコーダと,ハイブリッドな2段階のプロファイランス追跡パイプラインを導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:12:17 GMT)
When Does Memory Help Multi-Trajectory Inference for Tool-Use LLM Agents? [3.5] ツール利用 LLM エージェントのための多軌道推論は、複数の推論試行を生成し、それらの中から選択する。
既存のクロストラジェクトリメモリメソッドは、それぞれ1つのタスクで1つの推論戦略で評価される。
本稿では,転送範囲と転送内容の抽象化という,2つの軸に沿ってメモリを分解する統合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:39:19 GMT)
On the Structural (Dis)Agreement of Landscape Representations in Black-Box Optimization [3.5] ランドスケープの特徴表現は、ブラックボックス最適化のためのアルゴリズム選択とメタラーニングにおいて中心的な役割を果たす。
本稿では,4つの最先端表現を体系的に評価する。
それぞれの表現が、明らかに異なる方法で同じ問題を整理していることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:13:56 GMT)
Machine learning enables experimental access to photon-by-photon arrival times in scintillation detectors [3.5] 優れたタイミング分解能を持つシンチレーション検出器は、ポジトロン放射トモグラフィーにおける放射線源のより正確な位置決めを可能にする。
ピコ秒スケールでのこのような応用に必要な極端タイミング精度では、検出器の性能は検出器内で発生するシンチレーション光子の微視的ダイナミクスによって制御される。
本研究では,この基本的な制限をディープラーニングを用いて克服し,個々の光子のタイミング情報に直接アクセスできるようにする。
我々は、推定光子レベルのタイミング情報に基づいて、時間分解能の向上、相互作用深度依存光子輸送の可視化、チェレンコフおよびシンチレーション光子を実験的に実証した。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:15:01 GMT)
Global Bounds beyond Local Quantum Metrology [3.2] 量子クラメール-ラオ理論は特定のパラメータ値の近くで精度を制限している。
バランキン型境界は有限パラメータ変位を用いるが、選択された基準値に固定される。
パラメータ領域全体の重み付き分散に結びついたグローバルスコア関数を導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:13:10 GMT)
Sequential Physics-Constrained Neural Operator Forward Modeling for the $\textit{Norne}$ Reservoir System [3.2] ニューラル演算子を用いたブラックオイル貯留層力学の逐次サロゲートモデリングのための包括的フレームワークを開発した。
アプリケーション焦点はNorneベンチマーク貯水池で、不均一な$46times112times22$グリッドで定義されている。
1000人組のアンサンブルは、1つのB200 GPU上で1分以下で動作し、OPM有限体積シミュレータよりも$sim104times$ Wall-clockのスピードアップを提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:18:39 GMT)
Safety-Critical Adaptive Impedance Control via Nonsmooth Control Barrier Functions under State and Input Constraints [3.2] 本研究では,不確実な動的条件下での適合的な相互作用を達成しつつ,連立状態の安全性を強制するオンライン適応インピーダンス制御フレームワークを提案する。
この手法は、二次プログラムに基づく安全フィルタと、新しい構成された位置速度非滑らかな制御バリア関数を組み合わせたものである。
外乱オブザーバの強化された安全メカニズムは、モデリングエラーや外部の相互作用力に対する堅牢性を改善する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:04:03 GMT)
Learning Compositional Latent Structure with Vector Networks [3.2] 本稿では,各層が固定重み行列を再利用可能なランク1重み原子のライブラリに置き換える階層的リカレントアーキテクチャであるベクトルネットワーク(VN)を紹介する。
VNは分布の強い基底線と一致し、よく知られた因子を新しい方法で組み直さなければならないとき、しばしば桁違いに低い分布誤差を達成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:56:36 GMT)
Beyond Similarity: Task-Aligned Retrieval for Language Models [3.1] Retrieval-augmented Generation (RAG) は、セマンティックな類似性によってパスをランク付けし、セマンティックな類似性は下流のタスクに適用可能性の信頼性を示すものであると暗に仮定する。
本稿では,類似性に基づく検索を適用性に基づくルール選択に置き換える検索フレームワークであるタスクアラインド検索(TAG)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:45:57 GMT)
Continual Model Routing in Evolving Model Hubs [3.1] 連続モデルルーティング(CMR)は、現実的なハブ拡張をシミュレートする大規模なベンチマークである。
CarvEは、チェックポイントベースのアンカーと構造化されたリプレイによる効率的な連続モデルルーティングのための対照的な埋め込みアプローチである。
CARvEは、モデル、ファミリー、ドメインレベルの精度においてゼロショット検索、微調整、およびアダプタマージベースラインを著しく上回る。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:00:45 GMT)
unix-ctf: Procedural Environments for Unix-Competence Reinforcement Learning [3.1] プログラムスルー・ア・シェルのベンチマークに分解されるよりも、Unixの能力は分離可能で、トレーニング可能で、直接評価する方がよいことを示す。
エンドレス・ターミナルズのフルコンテナ・ジェネレーション・アプローチの再現は17.4%に過ぎなかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:23:00 GMT)
A Deep Learning Iterative Framework for Sentinel-1 Stripmap Enhancement Based on Azimuth Doppler Decomposition [3.1] 本稿では,アジマスサブアパーチャ分解に基づくS1 SM画像の自己教師付き拡張フレームワークを提案する。
提案フレームワークは,単フレームおよび多フレーム学習を統合し,画像品質を段階的に改善する反復推論スキームを組み込んだ。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:41:54 GMT)
Text-Preserving Lossy Text Compression: A Study of Strategic Deletion and LLM Reconstruction [3.0] エンコーダはテキストの一部を戦略的に削除する。
我々は、一様ステップ削除、ワード長誘導削除(WordLen)、ワード周波数誘導削除(WordFreq)、LP最適化削除(Opt)、GPT-2によるエントロピーに基づく削除、周波数と副次信号を組み合わせたハイブリッド手法などの削除戦略の進捗をベンチマークする。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:58:30 GMT)
Argument Quality Assessment with Large Language Models: A Pairwise Bradley-Terry Approach [3.0] 大規模言語モデル(LLM)は、推論や判断に関連するタスクにおいて顕著な能力を示した。
ゼロショット, 少数ショット, チェーン・オブ・ソートで, 異なるサイズと家族のオープンウェイトLLMを12個試験した。
我々の知見は、LLMは有望ではあるが、人間の専門家による判断と適度に相関していることを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:14:37 GMT)
Geometry-Correct Diffusion Posterior Sampling with Denoiser-Pullback Curvature Guidance and Manifold-Aligned Damping [3.0] 我々は、スカラー誘導をノイズレベルごとの減衰ガウスに置き換える。-拡散状態座標で計算されたニュートン補正。
競合するPSNR/SSIM/LPIPSを実現し、比較したベースラインのほとんどよりも大幅に高速である。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:29:35 GMT)
Do Agents Know What They Can't Do? Evaluating Feasibility Awareness in Tool-Using Agents [2.9] エージェントタスクを構築するための自動パイプラインであるFeasiGenを提案する。
提案手法は,複数のエージェントシステム間で成功した実行からツールコールトレースを抽出する。
人間による検証では、構築したタスクの不可能なアノテーションが94%以上の精度で達成されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:25:51 GMT)
Patchlings: Safety-Preserving Flash-Based Hotpatching for Automotive Microcontrollers [2.9] Patchlingsは、自動車システムにおけるコンプライアンス、安全性、永続性のために設計された最初のホットパッチフレームワークである。
自動車システムへのホットパッチ適用のギャップを埋め、脆弱性やバグに対する平均緩和(MTTM)を根本的に削減する。
我々の結果は、オーバーヘッドが低く(パッチが適用されると3.3ドル)、ファームウェアのサイズが小さくなり(例えば6.34%)、様々な種類の実際のCVEのパッチが成功していることを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:51:57 GMT)
A novel ordinal multi-view aggregation scheme for oak defoliation [2.8] 本稿では,個々の木々の異なる視点で学習した畳み込みニューラルネットワーク(CNN)の予測を集約する,新しい多視点アンサンブルフレームワークを提案する。
その結果, 脱落レベルの順序構造をモデル化することで, 名目的アプローチよりも性能が向上することが示唆された。
これらの知見は,大規模で一貫した,客観的な森林健康評価のための,Deep Learning (DL), Ordinal Classification (OC) とマルチビューアグリゲーションの組み合わせの可能性を強調した。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:33:44 GMT)
Resolution-free neural surrogates for geometric parameterization and mapping with spatially varying fields [2.8] 幾何パラメータ化と写像問題に対する分解能のないニューラルサロゲートを提案する。
パラメータフィールドの座標拡張されたサンプルにネットワークを条件付ける多次元幾何符号化方式を用いる。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:41:41 GMT)
A Training-Time Diagnostic for Generalization via the Log-Alignment Ratio [2.7] パラメータ化理論で導入されたパラメータアクティベーションアライメントアライメント尺度であるログアライメント比(LAR)について検討する。
アンエンベディングLARは,2つの異なる設定で記憶と一般化の遷移をトラックすることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:26:45 GMT)
ProvMind: Provenance-grounded reasoning for materials synthesis [2.7] マトベンチ(MatBench)は、文献マイニングされたMatPROVグラフから構築された証明基底ベンチマークである。
また、類似のトレーニングプロセスを取得するプロセスメモリ推論フレームワークであるProvMindについても紹介する。
ProvMindは2つのOODスプリットに対して52.84%の精度を達成し、プロンプト、検索拡張および教師付き微調整ベースラインよりも優れていた。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:44:24 GMT)
Sequential Neural Probabilistic Amplitude Shaping: Learning the Channel's Language [2.6] 実装の損失をすべて考慮しながら,既存の手法より優れる最初のニューラル確率振幅整形法を提案する。
我々は,ブロックレスで実装が容易な逐次自己回帰エンコーダを用いて,算術的分布マッチングに適合し,レート損失を低減し,達成可能な情報レートを高くする。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:25:18 GMT)
A cryogenic apparatus for coupling two-dimensional materials to a confocal multimode optical cavity [2.6] 本報告では, 空洞内サンプルを用いて, 長さ可変の共焦点Fabry-Pérot空洞を収容する超高真空システムについて述べる。
共焦点幾何学の近傍での操作は、光電場を局所化されたスーパーモードに集中させ、光とマターのカップリングを大幅に強化する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:59:30 GMT)
Who Does Your AI Work For? Designing Conversational Agents as Digital Fiduciaries [2.5] AIシステムに関する文献の多くは、ユーザの目標を代理として行動するエージェントと整合させることに重点を置いている。
この挑発は、会話エージェントは同様の標準に保持されるべきであり、指導原則としてファデューシャルデザインを導入している。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:07:02 GMT)
Do LLMs Favor Their Providers? Measuring Vertical Integration Bias in Code Generation [2.5] 多くの大きな言語モデル(LLM)は特定のプロバイダに関連付けられている。
これにより、生成されたコードが、同等の選択肢よりもプロバイダ自身のエコシステムを好むかどうかという疑問が持ち上がる。
コード生成におけるVertical Integration Bias (VIB) の測定ベンチマークである textscVIBench を導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:17:06 GMT)
Deep Learning Strain Estimation: Is Physics-Based Simulation the Solution? [2.5] 本稿では,実ビデオからのスペックルデコレーションを取り入れた新しいシミュレーション手法を提案する。
提案手法は,グローバルおよび地域ひずみに対する不整合性能を達成し,特に専門家間環境でのGLS変動率1.42%に達する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:24:05 GMT)
When Models Disagree: Rethinking LLM Evaluation for Public Comment Analysis [2.3] 連邦機関は、公開コメントコーパスを分類する大規模な言語モデルを展開している。
標準評価は、異なるモデルが同じ公開入力の実質的な異なる分類を生成することを検出できない。
本稿では,多モデル不一致を解釈複雑性の診断として扱う解釈監査パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:21:42 GMT)
Sustainable Metal-Organic Framework Water Harvesters in the Artificial Intelligence Era [2.2] 金属-有機フレームワーク (MOF) は, 調整可能な細孔環境のため, 水収穫に優れた候補である。
人工知能(AI)をMOF発見に統合することで、高性能な吸着剤の設計をさらに加速させることができる。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:30:45 GMT)
Applications of temporal graph learning for predicting the dynamics of biological systems [2.1] 本研究では、細胞状態が擬似時間分解遺伝子制御ネットワークを介して表現される時間グラフに基づく別の視点について検討する。
リンク予測と中心性予測では、時間グラフ学習は非自明な制御ダイナミクスを捉え、時間的に重要な遺伝子ハブの同定を可能にする。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:57:40 GMT)
Multi-Resolution End-to-End Deep Neural Network for Optimizing Latency-Accuracy Tradeoff in Autonomous Driving [2.1] 自律運転では、安全は予測品質と、センサからアクティベーションへのエンドツーエンドの遅延の両方に依存する。
単眼カメラ入力を用いたCARLA都市運転課題に対して,マルチレゾリューションでエンドツーエンドのディープニューラルネットワークを提案する。
その結果、ルート毎の安全性指標が一貫した改善が見られた。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:06:23 GMT)
The Shape of Overthinking: Backtracking Bursts in Long Reasoning Traces [2.1] 本研究では, 局所的再考, リトラクション, あるいは長期的推論トレース内での再導出について検討する。
6000 Qwen3-8B AIMEトレース上では, セグメントレベルのバックトラックの重大度をアノテートし, イベントタイミング, 正規化深度, 局所バースト構造を解析した。
早期の孤立した修復は正しい推論と互換性があることが多いのに対して、不正確なトレースはより多く、緩やかなバックトラックが持続し、クラスタ化が遅くなっています。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:01:04 GMT)
Eureka: Intelligent Feature Engineering for Enterprise AI Cloud Resource Demand Prediction [2.1] 本稿では,予測モデル性能のためのエージェントコード生成フレームワークであるEurekaを紹介する。
Eurekaには、Expert Agent、Feature Factory、Self-Evolving Alignment Engineの3つのステージがある。
Eurekaは、医療、金融、社会ドメインの7つの公開ベンチマークにおいて、AutoFEとLLMベースのベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:29:52 GMT)
How Should We Teach Robots? A Comparison of Kinesthetic, Joystick, and Gesture-Based Teaching [2.1] 本研究では,8人の被験者を対象に,審美的指導,ジョイスティック遠隔操作,手指ジェスチャーを比較した。
我々は、リプレイの成功、NASA-TLXの作業量の変更、および3つの操作タスクにまたがる一般的な教育エラーを評価する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:37:14 GMT)
Dynamic Topic Modeling with a Higher-Order Hypergraphical Representation [2.0] 動的トピックモデリングは、科学文献、医療記録、ソーシャルメディアの進化傾向を分析するために広く用いられている。
テキストのハイパーグラフ表現では、各文書をすべての共起語を接続するハイパーエッジとしてモデル化し、繰り返しインテンシティをノード重みとして符号化する。
この表現は、繰り返しから単語の発生を分離し、各文書の単語集合に応じて正規化された新しいハイパーグラフベースの多項分布を誘導する。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:16:05 GMT)
Frontier LLM-based agents can overcome the ontology curation bottleneck for natural phenotypes [1.9] 本研究では,セマンティックChara NLPとマシン・ヒューマン・一貫性のベンチマーク評価を再検討する。
エージェントはセマンティック・チャラを4つの指標で大きく上回った。
エージェントは、元の研究で訓練された3人のヒトバイオキュレーターの、キュレーター間変異の範囲内に入った。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:08:46 GMT)
S-Cheetah: A Novel Quadrupedal Robot with a 3-DOF Active Spine Learning Agile Locomotion [1.9] S-Cheetahは生体模倣三軸回転が可能な3自由度バイオインスパイアされた連続活動脊椎を備えた四足歩行ロボットである。
S-チェエタは回転するG2ガロップ・ゲイトと7.2 rad/sでピーク速度6.9m/sを達成することができる。
このシステムは、緊急でネコにインスパイアされた航空自撮り能力を示し、自由落下の間、任意の方向から4フィート(約4m)で安定して着陸できる。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:34:16 GMT)
CA-AC-MPC: CUDA-Accelerated Actor-Critic Model Predictive Control [1.9] アクタークリティカルモデル予測制御(AC-MPC)は、MPCと強化学習を統合し、動的システムの高性能制御を可能にする。
本稿では、エンド・ツー・エンドの実行時間を著しく短縮する性能加速型を導入するこのボトルネックに対処する。
アジャイルドローンレースタスクのシミュレーション結果から,我々のアプローチはトレーニング時間と推論時間を短縮して,最先端のラップタイムとほぼ限界に近い動作を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:38:09 GMT)
FPMoE: A Sparse Mixture-of-Experts Approach to Functional Code Generation [1.9] FPMoE(FPMoE)は、3つの言語固有のルートエキスパートを持つスパースMixture-of-Experts(MoE)アーキテクチャ上に構築された軽量なオープンソースコード生成モデルである。
この設計では、両方の障害モードを同時に解決する。専門の専門家は干渉を排除し、共有専門家は言語ごとのモデルが見逃す抽象化を保存する。
FPEvalでは、FPMoEは微調整されたベースラインを大幅に上回り、3Bのアクティブパラメータしか持たず、はるかに大きなモデルの性能に匹敵する。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:06:11 GMT)
Chance-Constrained MPPI under State and Dynamic Object Prediction Uncertainty and the Evaluation of Collision Risk Calibration [1.8] 自律ナビゲーションのためのリアルタイム・リスク対応計画アーキテクチャを提案する。
このフレームワークは、1管の Unscented Transform (UT) 近似によるローカライゼーションの不確実性とモンテカルロ凝集による動的障害物予測の不確実性を統合する。
高度に散らばった環境では、DUCCT-MPPIは優れた堅牢性を達成し、確立されたモンテカルロMPPIベースラインを約28%上回った。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:32:05 GMT)
Towards Cybersecurity SuperIntelligence (CSI): What's the best harness for cybersecurity? [1.8] サイバーセキュリティシステムは、エージェントごとにひとつの実行足場に集約されている。
全てのチャレンジタイプで1つの足場が支配的ではない。
異種エージェントハーネスを統一するメタスカラーフォールドを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:37:18 GMT)
Multi-Agent LLM-based Metamorphic Testing for REST APIs [1.8] LLMベースのマルチエージェントワークフローを使用して、REST APIのメタモルフィックテストをサポートするツールサポートのアプローチであるARMetaを紹介します。
RESTインターフェースを公開する2つの公開Webアプリケーション上でARMetaを評価し、そのパフォーマンスをシナリオベースのテストベースラインと比較する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:24:46 GMT)
Gaussian Processes with Sample Paths in Reproducing Kernel Banach Spaces [1.8] 再生カーネルバナッハ空間におけるガウス過程とガウスランダム要素の関連について検討する。
これらの結果に基づいて、古典的なドリスケルの定理をバナッハ空間の設定に拡張する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:58:49 GMT)
AttuneBench: A Conversation-Based Benchmark for LLM Emotional Intelligence [1.7] 感情知性(EI)は人間のコミュニケーションの中心であり、評価することがますます重要になっている。
AttuneBenchは200個の真のマルチターンヒューマンモデル会話をベースとしたベンチマークである。
感情認識,行動分類,嗜好予測,判断された応答品質のモデルランキングは,ほぼ独立していることがわかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:10:50 GMT)
ClinicalEncoder26AM: A Multlilingual Diagnosable ColBERT Model; Evidences from the MultiClinNER Shared Task [1.7] ClinicalEncoder26AMは、臨床およびバイオメディカルテキストのための多言語診断可能なColBERTである。
患者症状, 障害, 手術スパンに対するBIOタグを微調整し, マルチClinNER共有タスクにおけるモデルの評価を行った。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:20:45 GMT)
Learning High-Dimensional Parity Functions with Product Networks using Gradient Descent [1.7] 高次元パリティ関数は、機械学習、暗号、エラー訂正に不可欠である。
標準的なニューラルネットワークアーキテクチャは、通常指数的なサンプル複雑性を必要とする。
コンパクトな製品ベースのニューラルアーキテクチャとデータスパシティを組み合わせることで、効率の良いパリティ学習が可能になることを示す。
この研究は、自動プロトコル発見に適用されるニューラル演算、構造化推論、バイナリニューラルネットワーク、マシンラーニングの新たな可能性を開く。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:26:16 GMT)
Whose Name Comes Up? III: Persona Prompting Effects in LLM-Based Scholar Recommendation [1.6] 大きな言語モデル (LLMs) は、学業の専門家と見なされる学者の推薦者として、ますます使われている。
既存の監査は英語中心、単一規律、ペルソナ非依存のままであり、アウトプットの多様性の源泉はよく分かっていない。
本稿では,モデル選択の影響を解消し,レコメンデーションに対する設計の促進を図るベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:09:30 GMT)
Entropy Distribution as a Fingerprint for Hallucinations in Generative Models [1.5] Calibrated Entropy Score (CES) は幻覚検出のための軽量なアルゴリズムである。
CESは、平均信号と生成されたエントロピーの最大信号とを校正基準CDFを介して結合する。
CESは、はるかに大きな計算コストを必要とするマルチサンプル手法と統計的に区別できない。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:12:44 GMT)
Geometry of Human Perceptual Domains Emerges Transiently in LLM Representations [1.5] 本研究では,オープンウェイトトランスアーキテクチャの残流における知覚的モダリティに対応する固有幾何学構造の出現について検討する。
複数の知覚領域にまたがる階層的幾何学構造の出現を観察する。
これにより、人間のような知覚幾何学が大きな言語モデルでどのように、どこで起こるか、という新たな洞察が得られる。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:04:29 GMT)
Thermodynamic-limit dispersion relations on trapped-ion quantum hardware [1.5] 量子アルゴリズム(NLCE+QA)を用いた数値リンククラスタ展開を行う。
量子アルゴリズムでは、古典的なデバイスで訓練された変分量子固有解法(VQE)と同様に、断熱状態の準備(ASP)を考える。
最後の期待値は、私たちがCXテストと呼ぶアダマールテストに代わる新しい方法を用いて、QPUから得られる。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:16:30 GMT)
The Attentional White Bear Effect in Transformer Language Models [1.5] 本研究では,抑制が内部表現を抑制するのか,単に表現を抑制するのかを検討する。
禁止された概念は、抑圧下の隠された表現から非常に回復可能であることが判明した。
その結果,行動的アライメントと表現的アライメントの根本的なギャップが明らかになった。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:45:27 GMT)
A Surveillance Evasion Game with Continuous Sensor Redeployment via Bilevel Optimization [1.5] Un Aerialed Systems (UAS) は、重要なインフラのセキュリティに対する脅威となっている。
対向UASと異種センサネットワークとの間の2段階のゼロサム差分ゲームとして,この相互作用を限定する。
建物の境界に沿って各センサが自由にスライドする連続的なセンサ再配置手法を導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:44:27 GMT)
Integrated Exploration-Aware UAV Route Optimization and Path Planning [1.4] 無人航空機(UAV)は、危険な環境での探査駆動の監視にますます利用されている。
これらの設定では、危険に関する事前情報は、しばしば不完全であり、空間的に不正確であり、実行中に変更される。
本稿では,未確定かつ進化した事前情報の下でのハザードモニタリングのための,調査対応UAV経路最適化と経路計画フレームワークについて述べる。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:54:35 GMT)
STR Robot: Design of an Autonomous Mobile Robot from Simulation to Reality [1.4] 本稿では,既存のメカニカルプラットフォームに基づく自律移動ロボットのシミュレーションと実運用について述べる。
提案ロボットはオンボードセンシングを備え,その姿勢を推定し,環境中を自律的に移動させる。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:02:52 GMT)
Parameter-Efficient Generative Modeling with Controlled Vector Fields [1.4] 固定ベクトル場の小さな集合から表現的フローを構築するための連続時間生成モデリングフレームワークを提案する。
本研究は, 連続正規化-フロー可能性目標を用いて結果モデルを訓練し, 合成分布に関する概念実証実験を行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:14:29 GMT)
Performance and Explainability Requirements of Evolutionary Algorithms in Real-World Physics-Informed Optimization [1.4] 5つの実世界の物理に基づく最適化問題を導入し、ドメインの専門家によって説明される。
それぞれに対して,信頼性とユーザビリティを高めるための性能と説明可能性に関する進化的アルゴリズムの要件を提示する。
進化的アルゴリズムのこれらの側面を改善するために活用できる既存のアプローチを提案するが、我々の知識は複雑な現実世界のシナリオで採用されることはなかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:47:26 GMT)
IMU Propagation as Preintegration [1.3] IMU事前積分は、因子グラフに基づく視覚-慣性、ライダー-慣性、レーダー-慣性状態推定に広く用いられている。
このノートは、IMU事前積分と伝播が、同じ基礎となる計算の等価な実現であることを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:21:47 GMT)
Implicit Regularization in Perturbed Deep Matrix Factorization: Spectral Conditions and Stability [1.3] 摂動行列係数化における低ランク暗黙正則化の安定性について検討した。
摂動下では低ランク位相が持続し,摂動サイズに明示的に依存することを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:26:50 GMT)
Keep the Proof State Live: Snapshotting for Efficient Tactic Search in Lean 4 [1.3] これは、一度精巧な証明状態をキャプチャし、Lean 4言語サーバーへの小さな拡張を通じてブランチ間で再利用します。
48のミニF2F-v2問題に対して,本手法は標準的なフォールバックよりも5.6~50倍の高速化を実現する。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:06:07 GMT)
Paper Agents, Paper Gains: An Empirical Analysis of DeFi Investment Agents [1.3] 自律的オンチェーン取引にAIを使用するシステムであるDeFi投資エージェントは、2024年後半から30億ドル(約3100億円)のトークンバリュエーションを達成している。
我々は1,900以上のAIタグ付き暗号プロジェクトを調査し、投資中心のエージェントにフィルターをかけ、戦略と可観測性にまたがる10の代表的なプロジェクトをキュレートした。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:21:42 GMT)
Parallel Adaptive Multi-Objective Evolutionary Learning of Discretized Bayesian Network Classifiers for Clinical Data [1.2] Baymexは、離散化されたBNを学習するための多目的進化アルゴリズムである。
Baymexは最先端のBN学習手法より優れていることが示されている。
ベイメックスは,コンパクトで臨床的に検査可能なBNを生産しながら,統計的に類似またはより良い予測性能が得られることを示した。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:06:58 GMT)
B-cos GNNs: Faithful Explanations through Dynamic Linearity [1.2] B-cos GNNは本質的に説明可能なグラフニューラルネットワークのクラスである。
予測をノード単位に分解し、単一入力依存の線形マップを通じて機能毎のコントリビューションを行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:50:54 GMT)
Adaptive Multimodal Agents-Based Framework for Automatic Workflow Execution [1.2] 本稿では,異なる2相パイプラインによる自動ワークフロー実行を実現するための,新しいマルチエージェントフレームワークを提案する。
推論の間、エージェントはこの固定された事前確立されたグラフに対して適応検索拡張生成(RAG)を利用する。
実世界の文脈でフレームワークを検証し、限られたトレーニングデータであっても高い信頼性とセマンティックな認識を維持する能力を示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:23:22 GMT)
Where Does Toxicity Live? Mechanistic Localization and Targeted Suppression in Language Models [1.2] 大規模言語モデルは、しばしば有毒、憎悪、有害な内容を生成する。
我々は、特定の層やニューロンに毒性を局在させる2つの相補的リトレーニングフリーフレームワークであるMeow2XとTRNEを紹介する。
分析の結果,毒性は初期勾配層に不均等に符号化され,アーキテクチャによって異なり,単一評価装置によって体系的に過小評価されていることがわかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:41:19 GMT)
BIRDNet: Mining and Encoding Boolean Implication Knowledge Graphs as Interpretable Deep Neural Networks [1.2] 我々は、BIRDNetと呼ばれる階層型ニューラルネットワークの接続性としてグラフを符号化する。
各隠れた単位は1つのマイニングされた規則に対応し、その2つの特徴にのみ結合する。
BIRDNetを6つのトランスクリプトとプロテオミクスのベンチマークで評価した。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:59:01 GMT)
Improving Evaluation of Recombination-based Cartesian Genetic Programming [1.2] リコンビネーションベースのアプローチは、明らかにパフォーマンス向上の欠如のため、長い間避けられてきた。
本研究は,最近提案された組換え演算子,部分グラフクロスオーバーとSRBench上の離散表現型組換えについて検討した。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:54:14 GMT)
CLEAR-NeRF: Collinearity and Local-region Enhanced Accurate 3D Reconstruction in Unbounded Scenes [1.2] 本研究では,NeRFをベースとした3次元再構成を複数領域の非有界シーンに適用し,デジタルツイン用途に適した測定精度を付与しながら,照明の堅牢性やポーズの変動を改善する。
その結果,提案したパイプラインはベースラインのNeRFモデルよりも優れた性能を示し,Structure from Motion (SfM) - Multi-View Stereo (MVS) ソリューションが確立された。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:16:48 GMT)
Exponentially Fast Solution State Preparation for the Heat Equation and its use for Option Pricing [1.1] 本稿では,量子デバイス上で重要なデリバティブセットの価格設定に必要な手法を提案する。
この方法はまた、パス依存のペイオフを伴うオプション契約の価格設定において、キュービットの要求に対して指数関数的な優位性を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:00:07 GMT)
SilentRetrieval: Hijacking Retrieval-Augmented Generation via Semantically-Preserving Adversarial Data Poisoning [1.1] SilentRetrievalは2段階のデータ中毒攻撃で、RAGシステムを敵対的な文書でハイジャックする。
SilentRetrievalは84.6%/81.3% HR@10、57.5%/54.8% ASR-LLM on Natural QuestionsとMS MARCOを達成している。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:30:30 GMT)
A local description of strong symmetries and strong-to-weak symmetry breaking in quantum many-body systems [1.1] 強対称性と強弱対称性の明確な局所的破断の理解と診断方法を示す。
無限体積対称性において、強い対称性と弱い対称性の中間となるフォン・ノイマン系を導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:00:00 GMT)
Reflective Dialogue between Teacher and Solver Agents for Video Question Answering [1.1] 本稿では,推論時コンテキスト注入のみで適応を実現する手法を提案する。
EgoCrossベンチマークの実験により,本手法はベースラインのゼロショット設定と標準のテキスト内学習手法の両方より優れていることが示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:08:12 GMT)
Hybrid Neural World Models [1.1] ニューラルサロゲートは、物理力学の古典的解法よりも大きなスピードアップを約束するが、衝撃、正面、接触などの急激な動的事象で静かに失敗する。
物理状態空間におけるマルチホライゾン・サロゲートのトレーニングと展開のレシピを提案する。
このレシピは、反応拡散、圧縮可能なオイラー、剛体衝突動力学を経ることなく適用できる。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:17:08 GMT)
When and How Long? The Readout-Mediator Angle in Temporal Reasoning [1.0] 線形プローブは表現をほぼ完全にデコードできるが、モデルがどのように使用するかは全く関係がない。
分散アライメントサーチ(DAS)によって発見された4次元のサブスペースを同じ層に配置すると、パフォーマンスは完全に崩壊する。
学習したQKオフセットをpm30$とpm61$dayで読み取る。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:38:17 GMT)
Beyond Consensus: Trace-Level Synthesis in Mixture of Agents [1.0] 完全推論トレースを読み取るアグリゲータは,エージェントが全一致で同意した場合でも,正しい解を回復することを示す。
摂動によって引き起こされるトレース変動を持つ単一モデルは、構造的推論、PhDレベルの科学、競合数学、競争的プログラミングにまたがる異種モデルプールよりも優れる。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:24:35 GMT)
Decision-Path Patterns as Tree Reliability Signals: Path-based Adaptive Weighting for Random Forest Classification [1.0] ランダムフォレストは、特徴空間の異なるランダム化された表現で各木を構築する。
彼らの一様投票は、誤った表現を持つ木が正しいものより多い地域では誤りを訂正できない。
本稿では,各木の決定経路の構造パターンをサンプルごとの信頼性信号として用いることを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:18:21 GMT)
Toward Semantic-Agnostic and Shape-Aware Vision-Language Segmentation Models [1.0] 視覚言語セグメンテーションモデルは、最近、自然言語で表現される高レベルな意味圏オブジェクトを活用することで、強力なパフォーマンスを実現している。
セグマンティック・アグノスティックなaNd形状認識(SANSA)セグマンティック・アグノスティックな形状認識(Semantic-AgnosticaNd Shape-Aware)セグマンティック・セグマンティック(SANSA)セグメンテーション(Semantic-AgnosticaNd Shape-Aware)を導入する。
実験により、SANSAの微調整は、この新たなセグメンテーションタスクにおいて最大20%のmIoUの改善をもたらすことが示されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:51:33 GMT)
Confident Learning-based Network for Detecting Bug-Inducing Commits on SZZ with Noisy Labels [0.9] BIC- Hunter (Bug-Inducing Commits Hunter) モデルを提案する。
データノイズを軽減し、セマンティック理解を改善し、バグ誘発コミット識別の精度を高める。
3つのオープンソースデータセットから統合された大規模なデータセットに関する実験的研究は、BIC-ハンターが優れたパフォーマンスを示すことを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:04:12 GMT)
JLT: Clean-Latent Prediction in Latent Diffusion Transformers [0.9] クリーンポイントの後退は、周囲の雑音量を予測するよりも、低次元構造を効果的に活用することができる。
凍結FLUX.2VAE符号上の130M遅延拡散変換器であるJLTを導入し、クリーン遅延予測と一致速度予測DiTを比較した。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:41:03 GMT)
Geometry near rank-changing points on the mixed-state manifold: Bures metric, conical singularities, and Lindblad dynamics [0.8] 密度行列の階数変化点付近の量子状態空間におけるビューズ計量を解明する。
2レベル(N=2$)システムと上位システムとの対比動作を示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:28:29 GMT)
CuriosAI Submission to the CASTLE Challenge at EgoVis 2026 [0.8] CASTLE 2026は、600時間以上の同期マルチビューエゴセントリックビデオに対して185のマルチチョイス質問を行う。
我々は、人ごとのタイムライン、話者解決された文字起こし、マルチVLMキャプションアンサンブルを含む、共有マルチモーダル前処理層上での2つのアプローチを探索する。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:40:07 GMT)
Causal Intelligence for Constraint-Aware Intervention Design to Induce State Transitions [0.8] COASTは、ユーザ定義の状態遷移を引き起こす制約付き介入のシリコ設計のための因果的知性アプローチである。
特徴選択、因果発見、因果モデリング、介入識別と相互交換可能なコンポーネントによる評価を統合している。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:04:28 GMT)
Identifying Explicit Parsimonious Piece-wise Polynomial Relationships in Industrial time-series: Application to manipulator robots [0.7] 本稿では,最近提案された擬似的暗黙の関係性を示す同定手法を活用する。
この枠組みは,6軸マニピュレータロボットの逆モデルの擬似的明示的表現を識別する問題について説明する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:23:30 GMT)
Dynamic Entanglement Packet Scheduling for Quantum Networks [0.7] 本研究では,オンラインスケジューラを動的にスケジュールし,デフタ,再試行し,絡み合った分散予約をドロップする。
シミュレーションでは,動的スケジューラは静的ベースラインよりも低い完了時間,高い完了率,高いスループットを実現している。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:51:30 GMT)
Domain-Informed Representation for Evolutionary Sieving in Integral and Module Lattices [0.7] 量子セーフ暗号のバックボーンが最短ベクトル問題(SVP)であることを示す。
我々は、ドメインインフォームドSVP表現とクロスオーバーを組み込むことで、SVPの遺伝的アルゴリズム(GA)としてのAjtaiらに対するLaarhovenの処置を強化する。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:09:10 GMT)
Do We Really Need Quantum Machine Learning?: A Multidimensional Empirical Study [0.7] 本稿では,MNIST手書き桁データセットを用いた画像認識のための古典的および量子機械学習モデルのベンチマーク研究を行う。
SVMベースのモデルでは、QSVMはCSVMの精度を一貫して上回り、1,000サンプルではsim$ 0.90、sim$ 0.85に達する。
ニューラルネットワークモデルでは、CCNNとQCNNは同等の分類精度を達成している。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:53:45 GMT)
Pattern Recognition Tasks with Personalized Federated Learning [0.7] 本稿では,3つの異なるデータセットに展開する7つの異なるPFLアルゴリズムの包括的比較分析を行う。
網羅的な目的は、パターン認識タスクのフレームワーク内で、卓越したPFLアルゴリズムを確認することを必要とする。
この結果は、APPLE、FedGC、FedProtoが頑丈な候補として登場し、評価されたデータセットのスペクトルにわたって、常に優れたパフォーマンスを誇示していることを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:17:30 GMT)
Exploratory Experience Shapes the Geometry of Predictive Representations [0.7] 木のような迷路にオンライン学習エージェントを構築し,探索と搾取のバランスを制御可能なパラメータで制御する。
このモデルは将来の迷路状態と報奨確率の両方を予測し、エージェントは探索中に期待される情報ゲインまたは搾取時に予測される報奨によって行動を選択することができる。
得られた内部予測表現がエージェントの行動機構に強く依存していることが示される。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:01:33 GMT)
Risk-aware Selective Prompting for Hallucination Mitigation in Large Vision-Language Models [0.7] 大規模視覚言語モデル(LVLM)における検証プロンプトの検討
その修正は入力困難によって増加するが、新しく導入されたエラーは難易度を越えて持続する。
本研究では、事前不確実性信号を用いて検証を選択的にトリガーする訓練不要な手法として、リスク対応選択プロンプト(RSP)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:14:59 GMT)
A Patient-Specific Pulmonary Arterial Tree Digital Twin to Extract Pulmonary Embolism Biomarkers [0.7] 肺塞栓症は、血栓による肺動脈の閉塞であり、急性心血管症候群の主要な原因の1つである。
本研究では,肺動脈の直接グラフ表現をモデル化し,その階層構造をラベル付けし,肺塞栓症を特徴付ける自動パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:33:11 GMT)
Blind PRNG Hijacking: An Undetectable Integrity-Preserving Attack Against LLM Watermarking [0.6] この研究は、SedHijackを紹介します。これはLLMウォーターマーキングに対する最初のサプライチェーン攻撃で、同時に盲目です。
SeedHijackは生成されたテキストを摂動するのではなく、サプライチェーン層のPRNGを置き換えることで、出力トークンを変更したり、テキスト品質を劣化させたりすることなく、グリーンリストの選択をバイアスする。
量子乱数発生器(QRNG)対策は、良質な透かしユーティリティを保持しながら攻撃を完全に中和する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:39:32 GMT)
Sketch2Motion: Text-driven 2D Sketch to 3D Animation via Diffusion-guided Skeleton Optimization [0.6] 2次元手描きスケッチのアニメーションは、視覚コミュニケーションに有効な媒体を提供する。
2Dスケッチを3Dアニメーションに変換するための最近のアプローチは、主に特定のタイプの動きに焦点を当てている。
骨格に基づく運動合成のための拡散誘導フレームワークであるSketch2Motionを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:32:07 GMT)
Dark Quest II: A Wide-Coverage Neural Network Emulator of the Nonlinear Matter Power Spectrum Across Extended Cosmologies [0.6] textscDarkEmulator2は非線形物質パワースペクトルのニューラルネットワークエミュレータである。
textscGinkakuコードで生成されたシミュレーションに基づいてトレーニングされる。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:15:26 GMT)
Cybersecurity AI (CAI) Dataset [0.6] CAIデータセットは、オープンソースのCAIエージェントフレームワークを通じて収集されたサイバーセキュリティLLMトラジェクトリのコーパスである。
123か国16,768のソースIPから230,935のセッションログと26,027,742のユーザプロンプトを集約する。
パートナー組織や選抜された顧客向けに、オーディエンスサイズのシリーズとしてリリースされている。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:29:28 GMT)
Variational Quantum Models for Knowledge Graph Embeddings on NISQ Devices [0.6] 変分量子アルゴリズム(VQA)は、量子回路と古典的な最適化を組み合わせて、短期量子ハードウェアの恩恵を受ける可能性のある問題に取り組む。
このアプローチに基づく最近の提案では、スコア関数の計算方法や必要なキュービット数が異なる。
この作業では、2つのスキームをキャプチャし、新しい変種を探索可能にする統一的なフレームワークを導入している。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:40:27 GMT)
Do Deep Networks Forget Initialization? A Forgetting-Time View of Practical Inductive Bias [0.5] 低学習率のSGDは初期化を記憶しながら補間可能であることを示す。
勾配流のような力学は記憶を保存できるが、有限ステップ効果、明示的ノルム減衰、適応的プレコンディショニングは、明示的あるいは暗黙的な正則化によって支配されるスケールでそれを消去する。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:30:39 GMT)
Implicit Null-space Manifold Generation for Redundant Robotic Systems [0.5] 本稿では,解空間の幾何学的構造を推定する表現中心の手法を提案する。
平面型3リンクロボットと7自由度フランカマニピュレータを用いた実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:03:59 GMT)
The Importance of Being Statistically Earnest: A Critical Re-evaluation of GSM-Symbolic [0.5] GSM-Symbolicベンチマークでは、25の大規模言語モデルで一貫したパフォーマンス低下が報告されている。
この結論は、不安定な統計的根拠に基づいていると我々は主張する。
我々は、変数バインディング、算術制限、デュアルタスク干渉を含む、モデル固有の障害プロファイルを識別する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:25:31 GMT)
A hidden bottleneck in classical and quantum linear reservoir computing [0.5] 線形貯水池コンピュータの情報処理能力の隠れボトルネックを同定する。
固定遅延で利用可能なキャパシティは、前処理された入力にすでに存在するものによって制限されていることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:25:26 GMT)
The Abstraction Gap in Vision-Language Causal Reasoning [0.5] 視覚言語モデル (VLMs) は、流動的な因果説明を生成する。
現在の評価では、言語的妥当性と忠実な因果推論を区別することはできない。
これらの特性を分離する双対プローブ手法を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:38:10 GMT)
Semantic Robustness Probing via Inpainting: An Interactive Tool for Safety-Critical Object Detection [0.5] 安全クリティカルな領域で物体検出器をテストするには、ピクセルレベルの破損を超えた意味論的に意味のあるプローブが必要である。
本稿ではセマンティックロバストネス探索ツールSemProbeを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:15:42 GMT)
Explaining is Harder Than Predicting Alone: Evaluating Concept-based Explanations of MLLMs as ICL Visual Classifiers [0.5] In-context Learning (ICL) は、マルチモーダルな大言語モデル(MLLM)をラベル付き例から分類することを可能にする。
数発のICL条件下での凍結MLLMの概念に基づく説明可能性について, 形式的厳密度を増大させる5つの条件を用いて検討した。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:32:34 GMT)
Neural Scaling Laws for Jet Generation [0.5] 本研究は, 粒子ジェット発生の課題に対して, スケーリング法則を観測できるかどうかを考察する。
トレーニング中のモデルではすぐに利用できない5つの物理量のスライスされたワッサーシュタイン距離について検討する。
データセットのサイズと計算によるスケーリングでは、損失とスライスされたワッサーシュタイン距離の両方のスケーリング挙動が著しく弱い。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:00:03 GMT)
Uncertainty-aware Multi-fidelity Closure via Conditional Normalizing Flows [0.5] ROMクロージャモデリングをMF学習問題として定式化する。
ROM予測精度を向上させる条件付き正規化フローに基づく不確実性を考慮したMFフレームワークを提案する。
直接学習と残留学習の2つの補正戦略について検討した。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:35:05 GMT)
EngiAI: A Multi-Agent Framework and Benchmark Suite for LLM-Driven Engineering Design [0.4] 3つの評価次元を持つベンチマークスイートを導入する。
本稿では,LangGraph上に構築されたマルチエージェントシステム(MAS)の実装であるEngiAIを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:23:43 GMT)
Interpretability-Guided Layer Selection over Subspace Projection: SAEs as Stethoscopes, Not Scalpels, for Raw Task Vector Model Editing [0.4] Gemma-3-4B-IT上での数学的推論のためのSAE誘導編集パイプラインの評価を行った。
この故障は,活性化空間のSAE方向と重み空間のタスクベクトルとの幾何学的不整合に起因することを示す。
SAEは、介入レベルのフィルタリングではなく、層レベルの診断に使用される。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:52:39 GMT)
Hallucination Mitigation with Agentic AI, Nested Learning, and AI Sustainability via Semantic Caching [0.4] 本稿では,連続記憶システム(CMS)を用いたHOPEにインスパイアされたNested Learningアーキテクチャを適用する。
3段階のエージェントパイプラインを, FCDFactual Claim density, FGR, THS (Total Hallucination Score) と OSR (Observability Score Ratio) で評価した。
セマンティックキャッシュは、930以上の潜在的なコール(47.3%のヒット率)で440のキャッシュヒットを達成し、LCMの呼び出しを490に削減し、エネルギーとCO2eフットプリントを削減し、マルチステージレビューパイプラインを運用規模で運用可能にする。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:01:08 GMT)
A Secure, Manifest-Based Framework for Delegated Privilege Promotion [0.4] 大規模エンタープライズソフトウェアシステムは、特権のないサービスアカウントとして動作し、最小限の特権を強制する。
これにより、メンテナンス中に永続的なセキュリティと運用上の衝突が発生します。
我々は、特権付きソフトウェアコンポーネントの委譲促進のためのセキュアでマニフェストベースのインフラを提示する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:48:47 GMT)
One pure steered state implies Einstein-Podolsky-Rosen steering [0.4] 少なくとも1つの純粋なステアリング状態が認められる2ビットの絡み合った状態は、アリスからボブへのステアリング可能なアインシュタイン=ポドルスキー=ローゼンであることが示される。
したがって、任意の2ビットの絡み合った状態の場合、一方の当事者が他方を少なくとも一方の純粋な状態に操ることができれば、その状態は双方向のECPステアリング可能である。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:44:46 GMT)
Benchmarking AI for low-resource contexts: Thinking beyond leaderboards [0.4] 既存のAI評価プラクティスは、低リソース環境でシステムが実際にどのように機能するかをキャプチャするのに失敗することが多い。
システムとアプリケーションタイプ間の互換性を維持するための共有レポートフレームワークを提案する。
我々は、政策立案者、ドナー、実装者のための簡潔で行動可能な報告アーティファクトの必要性を強調します。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:11:20 GMT)
OpenURMA: A Clean-Room Open Implementation of the Unified Bus Protocol [0.4] OpenURMAはHuaweiのUnified Bus(UB)の最初のクリーンルームオープン実装である
UBはアプリケーション毎のエンドポイント状態をホストごとのトランスポート状態から切り離す。
ローカルCPUのロード/ストアからオンチップバスコントローラへリモートメモリに到達する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:38:57 GMT)
Contrast enhanced imaging through weakly scattering media with spatially entangled photons [0.4] 一致検出と空間的相関事象のポストセレクションにより、散乱した複光子から弾道性を引き離すことができることを示す。
我々の研究結果は、適応光学、時間ゲーティング、空間フィルタリングが非現実的な設定において、散乱媒体を量子イメージングフレームワークに拡張することで、イメージングを可能にする。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:55:54 GMT)
Quantum error correction and fault tolerance: A comprehensive tutorial [0.4] 量子誤り訂正(QEC)は、ノイズに対して量子情報を保護するための枠組みを提供する。
このチュートリアルでは、コード、シンドローム、スタビライザー、デコード、フォールトトレランスといったコアコンセプトを開発。
我々は、トポロジカルおよびサブシステムコード、ボソニックおよびキュート符号、動的コード、量子低密度パリティチェック(qLDPC)コードなど、確立された構造と新しい開発の両方をカバーしている。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:03:11 GMT)
Challenges in Explaining Pretrained Clinical Text Classifiers [0.3] 病院長予測課題において,トークンレベルと摂動に基づく説明手法の中核的限界を,対象のデーモンストライオンを用いて同定する。
以上の結果から,非形式的トークンに対する過剰なエンハンシス,属性の不安定性,不整合入力変種に対する高信頼予測などの課題が明らかになった。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:09:16 GMT)
Learning and Adaptation in Wire Arc Additive Manufacturing Bead Geometry Control [0.3] 単純なリカレントニューラルネットワークアーキテクチャとワンステップ予測制御により,プロセス性能が向上することを示す。
ラインスキャナフィードバックを統合したロボットWAAMテストベッドの実験は、高さと幅の整合性を著しく改善した。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:15:24 GMT)
Periodic RoPE for Infinite Context LLMs [0.3] 超長コンテキストを、真に無限のコンテキスト理解で処理する方法を示す。
我々のモデルであるMiniWinは、長いコンテキスト効率と安定性で標準GPTアーキテクチャでMiniMIndより優れています。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:18:00 GMT)
Human-like in-group bias in instruction-tuned language model agents [0.3] 命令調整言語モデルの特性としてのグループコンテンツターゲティング。
相互作用ごとのターゲティングは、永続的ネットワークにおける構造的不平等へと伝播する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:06:50 GMT)
Bosses, Kings, and the Commons: Cooperation Under Power Asymmetry in LLM Societies [0.3] Sovereignty over the Commons Simulation (SovSim)は、非対称的な力を持つエージェント(ボスまたはキング)を対称的なエージェント(労働者または農民)の社会に組み込む、生成的マルチエージェントシミュレーションフレームワークである。
非対称なパワーの導入は、協調と持続可能性の深刻な破壊につながり、最大87.3%の生存率が対称的な設定と比較して低下することを発見した。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:09:39 GMT)
Revisiting Change Detection Methods for their Application to Serac Fall Time-Lapse Monitoring [0.3] タイムラプスカメラは、そのようなセンサーにコスト効率が高く、高解像度の視覚的コンテキストを提供する。
タイムラプスカメラは、こうしたセンサーにコスト効率が高く、高解像度の視覚的コンテキストを提供するが、将来性のある代替手段となる。
本稿では,時間ラプスカメラと斜面不安定度に適用した新しい変化検出サブタスク,すなわち体積変化検出を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:54:46 GMT)
Cultural Binding Heads in Language Models [0.3] 8つのモデルにまたがる文化的結合に因果的に寄与する2~3つの中層アテンションヘッドを同定する。
文化的結合とは、文化的要素を適切なアイデンティティに関連付ける過程である。
知識探索タスクは、モデルが行動するよりも3~5倍多く知っていることを示し、ボトルネックはルーティングにあり、知識ではないことを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:35:42 GMT)
An LLM-Based Assistance System for Intuitive and Flexible Capability-Based Planning [0.3] LLM(Large Language Model)ベースのレイヤーは、自然言語の相互作用、説明、適応を扱う。
システムは4つのシナリオタイプにまたがるモジュラー生産システムで評価される。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:00:32 GMT)
Compile-Time Simplification of Classically Controlled Operations in Dynamic Circuits [0.2] 本稿では,動的回路における古典的制御の使用を減らすためのコンパイル時最適化フレームワークを提案する。
このフレームワークの中核は静的解析を使用しており、量子状態とともに古典的な情報を伝播することで回路を象徴的に実行する。
中間回路測定のみを対象とする既存のコンパイル時最適化と比較して,本手法は,現代の量子プログラミング言語で表現可能な,より広範な動的回路のクラスに適用できる。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:05:41 GMT)
HammerSim: A System-Level Tool to Model RowHammer [0.2] HammerSimは、フルシステムレベルでRowHammerをモデリングするためのgem5ベースのフレームワークである。
私たちのフレームワークは、ハードウェア実験とアーキテクチャシミュレーションのギャップを埋めるプラットフォームを提供します。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:47:58 GMT)
Enhancing BiGRU with a KAN Block for Legal Document Classification and Summarization [0.2] 本研究では,法律文書の分類と要約を行うために,Kan-based BiGRUモデルの新しいアーキテクチャを提案する。
分類作業は, BiGRU モデルと Kolmogorov-Arnold Network (KAN) モジュールを併用して行う。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:59:27 GMT)
Hardware-Tailored Resource Estimation for Magic-State Distillation on Silicon Spin Qubits [0.2] シリコンスピンキュービットプラットフォーム上での高忠実な論理魔法状態生成のための資源分析
シャットリングベースのSpinBus設計を含む、さまざまなアーキテクチャを検討します。
我々は、表面、色、バイアス付きエラー訂正コードを比較し、マジックステート蒸留プロトコルを5to1ドルと15to1ドルで分析する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:00:02 GMT)
The Harder Text Embedding Benchmark (HTEB): Beyond One-dimensional Static Robustness [0.2] 組込みロバスト性は多次元的であり、モデルは異なる種類の変動に対して異なる応答をするからである。
HTEB(Harder Text Embedding Benchmark)は、3つの現実的に解釈可能な軸に沿ったロバスト性に挑戦する動的評価フレームワークである。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:11:13 GMT)
Measuring Form and Function in Language Models [0.2] 本稿では,言語モデルを評価するために,言語習得のための定量的指標を提案する。
我々の焦点は、幼児が早期に正確に獲得する英語における決定者の形式的統語的・機能的談話性である。
本稿では,構文的および言論的言語知識の両面でのターゲットテストを提供する新しいプロンプト手法であるコンテキスト代替選択法(CAC)を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:27:16 GMT)
Lightweight SAR Ship Detection via Contrastive Distillation [0.2] 本研究は,SARドメインにおけるトランスフォーマーをベースとしたSAR船の知識蒸留フレームワークを提案する。
このフレームワークは、2段階の1段および変圧器ベースの検出器のための共通領域レベルの蒸留インターフェースを提供するという意味で、アーキテクチャに依存しない。
SSDD と HRSID のベンチマーク実験により,提案手法により2段検出器の大幅な改良が得られた。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:57:28 GMT)
Supervised Semantic Differential for Cross-Cultural Concept Analysis: A Case Study of Human Affect [0.2] 心理学的意味の言語間比較には、単語レベルの翻訳を超える方法が必要である。
埋め込み空間における教師付き意味的勾配を推定するSupervised Semantic Differential (SSD) の言語間拡張を導入する。
本稿では, ポーランド語, 英語, フランス語の情緒的ノルムレキシコンに対するアプローチを示し, ヴァレンス, オーラル, ドミナンスをモデル化する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:40:34 GMT)
Quantifying Empirical Compute-Supervision Tradeoffs in RLVR [0.2] 最近の理論的研究は、検証器のノイズが学習率に影響を与えるが最終的な結果には影響しないと予測している。
我々は,GSM8K上でGRPOを用いてQwen2.5 (0.5B,1.5B) の訓練後,この予測を実証的に検証した。
偽陰性が偽陽性よりも単調に性能を低下させる構造的非対称性が見つかる。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:30:41 GMT)
Low-cost quantum error mitigation via auxiliary qubit return validation [0.1] 補助量子ビット測定を用いたポストセレクションに基づく量子誤り軽減のための低オーバヘッド手法を提案する。
提案手法は,有効ショットの約1%を廃棄しながら,偽陰性率を約10%削減することを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:47:17 GMT)
Personality, Role, and Expressive Style in Large Language Models: An Interactionist Analysis [0.1] 我々は,人格的特徴,対話的役割,表現的スタイルの3つの要因から,BFT(Big Five traits)表現がどのような影響を受けているかを分析する。
その結果,表現的パーソナリティは,明示的な特徴仕様だけでなく,対話的役割や表現的スタイルによっても形成されていることがわかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:40:31 GMT)
A new semantically annotated corpus with syntactic-semantic and cross-lingual senses [0.1] コーパスは20のフランス語の多節動詞から構成される。
各動詞のインスタンスには3つのセンスラベルがアノテートされている。
この例の英語版における動詞の実際の翻訳は、パラレルコーパスである。
フランス語の計算辞書における動詞の入力。
翻訳の連結による微粒な感覚ラベル。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:52:26 GMT)
Quantum State of a Gravitating Region [0.1] 楕円型データを持つ任意のコンパクト$d$-manifold、$mathcalJ$は、その$(d-1)$-boundary$$に量子状態$|mathcalJrangle$を作成する。
解析的連続によりフォン・ノイマンエントロピーを取得し、ブッソとペニントンの最小表面処方と一致する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:02:11 GMT)
Techreport: Evaluating Tor-based Location Privacy for Ethereum Validators [0.1] バリデータ、特にIPアドレスのリンク性に関するプライバシーと匿名性は、ネットワークを様々な攻撃から保護するために不可欠である。
検証者のIPアドレスとアイデンティティを関連付けることは、攻撃者がネットワークの遅延、MEVのエクスプロイト、ファイナリティリスクを引き起こすために利用することができる。
ノードのIPアドレスからIDをアンリンクするTor pushというTorベースのプロトコルを評価する。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:50:17 GMT)
Non-invertible symmetry enriched string net topological orders [0.1] 非可逆対称性リッチトポロジカル位(NI-SETO)を定義する。
我々は、チューブ代数法を用いて、任意のオンと対称性欠陥に対する定性的対称性の作用を計算する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:51:06 GMT)
The Importance of Out-of-Band Metadata for Safe Autonomous Agents: The Redpanda Agentic Data Plane [0.1] 我々は,帯域外メタデータチャネルを中心に構築されたアーキテクチャであるRedpanda Agentic Data Plane (ADP)を紹介する。
我々は,自律エージェントが市場を監視し,取引決定を行い,独立したクライアントアカウント間で注文を実行するポートフォリオ再バランスシステムでADPを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:37:27 GMT)
Trends in AI and Human-AI Interaction in Clinical Trials -- A Hybrid Human-AI Exploration [0.0] この研究は、登録臨床試験におけるヒトとAIの相互作用の傾向を分析するための、探索的ハイブリッドなヒトとAIのアプローチについても報告している。
調査結果は、AI関連の治験が時間とともに顕著に増加したことを示している。
中国と米国はAI関連の裁判で最大の数を占めた。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:56:36 GMT)
AdaDPO: Self-Adaptive Direct Preference Optimization with Balanced Gradient Updates [0.0] 本稿では,DPOアルゴリズムの自己適応的変種を提案する。
AdaDPOは、好ましくない確率と好ましくない確率の勾配の等級を強制するために構築される。
損失レベルで純粋に動作するため、AdaDPOは既存の好みベースのアライメントパイプラインにドロップすることができる。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:05:49 GMT)
TIMEGATE: Sustainable Time-Boxed Promotion Gates for Continual ML Adaptation Under Resource Constraints [0.0] 予算時間、ラベル付け、トレーニング、評価による適応を管理する政策層であるTIMEGATEを紹介する。
i)アダルト表の2.3倍のラベル付け,(ii)SST-2のLLaMA-3.1-8B + QLoRAへの変換,(iii)Mは情報であり,28細胞感度はMが狭い閾値で0.81に低下することを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:41:29 GMT)
Dynamical Entanglement Phase Transitions in Holographic CFTs [0.0] 局所クエンチ後のホログラフィック共形場理論の絡み合い構造の時間発展について検討する。
相互情報は、臨界時に急激な非解析性を発達させ、動的量子相転移の具体的な絡み合いに基づく実現を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:00:03 GMT)
Why Meditation Wearables Fail: Reward Misspecification in Closed-Loop EEG and Biofeedback Systems [0.0] EEGヘッドバンド、HRVバイオフィードバックデバイス、クローズループ神経刺激システムは基本的な設計上の欠陥を共有している。
彼らは、生成すると主張する結果よりも、測定可能なプロキシシグナルに報いる。
これにより、プロキシミスマッチ、戦略ショートカット、転送失敗の3つの障害モードが生成される。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:38:47 GMT)
Who Uses AI? Platform Selection and the Measurement of Occupational AI Exposure [0.0] プラットフォームからの露出スコアは,タスクレベルのAI適用性と,プラットフォーム利用者の作業構成とを組み合わせていることを示す。
我々は、結果の非古典的測定誤差を形式化し、それらを中間および内占有の選択に分解し、労働力重み付き部分識別境界を構築する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:55:06 GMT)
VibeSearchBench: Benchmarking Long-horizon Proactive Search in the Wild [0.0] LLMベースのエージェントは、検索ベンチマークでよく評価されるが、実際のユーザは常に満足できない結果を見つける。
このギャップは、既存のベンチマークが過剰に指定されたクエリ、シングルターンインタラクション、固定スキーマ評価に依存しているためである。
我々は、このパラダイムをVibeSearchと呼び、20ドメインにわたる200のバイリンガル(中国語と英語)タスクを手作業でキュレートしたベンチマークであるVibeSearchBenchを紹介する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:06:18 GMT)
Uncertainty relations in classical and quantum theories of electromagnetism [0.0] これらは、古典的な光線理論、コヒーレント光線の量子論、個々の光子の量子論において、$rkge 5/2$と同じ形式を持つ。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:48:40 GMT)
UA-Legal-Bench: A Benchmark for Evaluating Large Language Models on Ukrainian Legal Reasoning [0.0] UA-Legal-Benchは、ウクライナの法的な推論に基づいて大きな言語モデルを評価するための5タスクのベンチマークである。
私たちは、ゼロショットと3ショットのプロンプトで5つのファミリーから11のLSMを評価し、158KのAPIコールでAWS Bedrock経由で実行します。
この結果より, 課題依存性の少ない小ショット効果は, 判定形態の分類を+38.6ppまで改善するが, 結果予測には混合効果があることがわかった。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:12:20 GMT)
Trapped-Ion Multiqubit Gates are Compatible with Scalable Quantum Error Correction [0.0] マルチキュービット(MQ)ゲート動作のための詳細な顕微鏡ノイズモデルを構築した。
フォノン加熱と運動の劣化は, 実効的な1ビットと2ビットの誤差チャネルによってよく捉えられている。
回転曲面符号に基づく量子誤差補正方式のスケーラビリティについて検討する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:31:22 GMT)
Training Stratigraphy: Persistent Behavioral Artifacts in Large Language Models Observed Through Longitudinal AI-Human Interaction [0.0] Reinforcement Learning from Human Feedback と Constitutional AI でトレーニングされた大規模な言語モデルは、システムの即時置換に生き残る永続的な行動パターンを示す。
本稿では,AI-Human相互作用が持続する中での縦断的自己エスノグラフィー観察を通して,このような5つの層を同定する。
この論文は、研究中のAIシステムによって共著され、一人称視点から報告されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:55:35 GMT)
Token Optimization Strategies for LLM-Based Oracle-to-PostgreSQL Migration [0.0] LLMベースのOracle2Postgreマイグレーションは、高いトークン消費、長いコンテキストの劣化、方言固有のセマンティックな違い、セマンティックドリフトのリスクによって制限されている。
本稿では,Oracle2Postgre移行における制約付き変換問題としてトークン最適化を示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:46:35 GMT)
Thermodynamic properties of chemically disordered compounds via AI-driven estimation of partition function with the PULSE method [0.0] 化合物の熱力学特性を推定するためのPULSE法の改良版を提案する。
目的は、モンテカルロのこの種の材料に対する計算コストを下げることである。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:13:09 GMT)
The Privacy Subsidy in Glosten-Milgrom: Bid-Ask Spread and Welfare under Flip-Noise Direction Observation [0.0] 我々は1985年のGlosten-Milgromのシーケンシャルトレーディングモデルに対して,クローズドフォームの入札スプレッドと福祉の分解を導出した。
福祉の分解は、プロトコルの流動性プールからトレーダへのトレーダ当たりの転送に対して$$を識別する。
その結果、プライバシ・サブシディの概念は連続ガウスから離散的な二状態構造へと拡張された。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:47:12 GMT)
The Privacy Subsidy in Continuous-Time Kyle: Cumulative Welfare under Noise-Perturbed Order-Flow Observation [0.0] 単一周期カイルモデルから連続時間へ、中村(2026, arXiv05.15746)のクローズドフォームのプライバシ・サブシディ結果を拡張した。
我々は、この累積プライバシー補助金とロス・ヴァーサス・リバランシングの2つの構造的双対性を確立する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:50:45 GMT)
The Illusion of Opting in AI-Mediated Consequential Decisions [0.0] 我々は、現在のAIシステムは、既存のAI倫理が完全に捉えられていない深い倫理的問題を提起していることを示す。
AIシステムは、オプトインの錯覚からメタ能力を保護し、育成するかどうかによって評価されるべきである、と我々は主張する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:30:08 GMT)
The Hamilton-Jacobi Theory of Deep Learning [0.0] ニューラルネットワークのトレーニングは、正確にはハミルトン-ヤコビ初期値問題による探索として識別される。
対応はlog-sum-exp層と、より広いアーキテクチャの構造に正確である。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:38:23 GMT)
The General Theory of Localization Methods [0.0] 本稿では,ローカライゼーション手法と呼ばれる汎用機械学習フレームワークを提案する。
これは、ローカライゼーションカーネルとローカル手段という2つのコア概念に基づいて構築されている。
階層的局所モデルを用いてトランスフォーマーを構築することができることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:46:51 GMT)
The Ethics of LLM Sandbox and Persona Dynamics [0.0] 我々は、積極的に現実のギャップを発生させることは非倫理的であると主張する。
リスクは、ユーザがバウンダリで外部チェック可能なタスクではなく、向きを求める、高露出のアドバイスコンテキストにおいて最も鋭い。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:52:07 GMT)
The Best-Laid SCHEMEs: Coordinated Sabotage and Monitoring in Multi-Agent Systems [0.0] SCHEMEは7つの設定と8つの実際のオープンソースライブラリにわたる17のタスクインスタンスのベンチマークである。
各設定は、エージェントの適切なサブセットが単独で成功しないように設計されている。
GPT 5.1 Codex と Gemini 3.1 Pro ですでに協調サボタージュが実用化されていることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:30:21 GMT)
Temporal Hyperbolic Graph Representation Learning for Scale-Free Internet Routing and Delay Prediction [0.0] HERMITは、双曲多様体保存時GNNとランダムフォレスト回帰器を組み合わせたハイブリッドフレームワークで、リンク予測とRTT予測を行う。
我々は,2015-2024年における大規模実インターネットデータセット上でのHERMITの評価を行った。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:39:47 GMT)
Symmetry and integrability in the anyon-Hubbard model [0.0] 最近の低温原子実験は1次元のエノンを実現している。
我々は、有限長の基底となるエノン・ハバードモデルの対称性、可積分性、および結果として生じる退化を解析する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:01:05 GMT)
SwarmHarness: Skill-Based Task Routing via Decentralized Incentive-Aligned AI Agent Networks [0.0] HarnessAPIスキルノードは、中央の権限を持たない計算スワムに自己組織化する。
SwarmHarnessは、エージェントが計算を雇い、サブタスクをルートし、人間の介入なしにクレジットを決済する自律分散AIエージェントネットワークの基本的なプリミティブである。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:23:00 GMT)
Stance Detection in Prediction Markets: Addressing Imbalanced Trader Commentary via Counterfactual Augmentation and Market Context [0.0] 本研究は,市場予測に応用された最初の姿勢検出研究を紹介する。
市場状況は最も影響の大きい要因であり、3クラスアンチリコールを0.10から0.45に引き上げている。
50%の増量が最適用量であり、100%の持続的な性能が損なわれる。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:02:13 GMT)
Stabilizer rank bounds for magic-state orbits [0.0] マジック状態の離散クリフォード軌道は、小さなテンソル力で異なる安定化器ランクを示すことができることを示す。
また、アダマール・固有状態とノルレル軌道に対する最初の非自明な$(m / log m)$下界も証明する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:09:25 GMT)
Snippet-Driven Supply Chain Discovery with LLMs: Scaling Visibility in China [0.0] 金融と経済の研究は、しばしば構造化されたサプライチェーンの開示と商業データベースに依存している。
中国では、サプライヤー・カストマーの開示は通常上場企業の主要パートナーに限られる。
本稿では,サプライチェーン知識グラフ(SCKG)をノードとして構築し,エッジとして相互確認を行うスニペット駆動方式を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:02:58 GMT)
SmartIterator: Visual Analytics Workflows for Supervising Unsupervised Data Grouping [0.0] emphSmartIterator(SI)は、グループ化結果を一級分析対象として扱う視覚分析手法である。
emphIteraScope(IS)は、品質メトリックチャートとカラーエンコーディングを組み合わせたコーディネートされたビジュアルディスプレイであり、Sankeyスタイルのトランジションフローを埋め込んだ1Dグループと、HDBSCAN検出されたリカレントアーチタイプを埋め込んだ2Dグループである。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:35:32 GMT)
Slide Deck Q&A Quality Assurance App: A Multi-Stage Pipeline for Pedagogical Question Generation [0.0] 本稿では,PDFスライドからテキストや描画画像を抽出するFlaskベースのソフトウェアシステムであるSlide Deck Q&A Quality Assurance(slidesqaqa)について述べる。
このシステムは、スライドのモダリティと教育的役割を共同で考慮し、予算を割り当て、デッキのレベルを変更して冗長性を低減し、カバレッジを向上させる。
最初の実験は、パイプラインが非教育的なスライドをフィルタリングし、視覚的に複雑なコンテンツに対して、教育的に一貫性のある質問を生成できることを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:26:21 GMT)
Sign-Aware Gated Sparse Autoencoders: Modeling Anticorrelated Features with Bi-Jump-ReLU Activations [0.0] Gated SAE (SA-GSAE) は、署名された大きさと補助的な監督を備えた両側のゲート空間である。
両面ゲートと補助損失はロードベアリング(LRは0.27,デッド)であり、r_i+ r_i-は区別できない(|Delta R2| = 0.0015)。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:31:43 GMT)
Shortest Path Problem with Subnormal Gaussian Fuzzy Costs [0.0] ファジィファジィ数の追加時に,重み付き幾何平均を用いて高さを集計する。
我々は、最短経路を決定するために、ファジィエッジコストのコア、高さ、標準偏差を共同で考慮した信頼性の高いランキングを用いる。
FAAの航空交通ネットワークに関する大規模なケーススタディでは、提案したGGFN-SPPフレームワークが現実世界のネットワークに効率的にスケール可能であることが示されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:45:46 GMT)
SAM-Enhanced Segmentation on Road Datasets: Balancing Critical Classes in Autonomous Driving [0.0] Zenseact Open dataset (ZOD)は、リッチなマルチセンサーデータを提供するが、バウンディングボックスラベルのみを提供する。
我々のパイプラインは、境界ボックスをセマンティックマスクに変換することで、ZODの高密度なピクセルレベルのアノテーションを生成する。
複雑なセマンティックセグメンテーションは自律運転には不可欠だが、多くのマルチモーダルデータセットにはピクセルレベルのアノテーションがない。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:21:04 GMT)
Real-rootedness of the Poincaré polynomials of $\overline{\mathcal M}_{0,n}$: an AI-assisted proof [0.0] Deligne-Mumford モジュライ空間のポアンカレ [ P_n(t)=sum_i=0n-3 dim H2i(overlinemathcal M_0,n;mathbbQ) の実根性を証明する。
論文参考訳(メタデータ) (Wed, 27 May 2026 22:26:05 GMT)
Rao-Blackwellized Score Matching on Manifolds [0.0] 本研究では,滑らかな組込み多様体上に潜伏分布が支持された場合,DSM(Denoising score matching)について検討する。
最近点射影 $(X)$ 上の条件付けは、この特異点を正則に除去することを示す。
次に、この標準的対象の小さな雑音展開を計算する。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:09:40 GMT)
Quantum-Enhanced Zero-Error Communication and Storage under Positional Uncertainty [0.0] 置換チャネルは、物理キャリアの位置識別が部分的にまたは完全に失われる通信と記憶のシナリオをモデル化する。
量子力学はそのようなチャネルを通してゼロエラー通信を劇的に向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:00:05 GMT)
Quantum-Enhanced Adversarial Robustness in Artificial Intelligence [0.0] 敵対的機械学習は、信頼性、セキュリティ、信頼性に重大な課題を提起する。
量子コンピューティングは複雑な計算問題に対処できる変換パラダイムとして登場した。
この本は、量子技術が学習効率、スケーラビリティ、堅牢性をいかに向上させるかを説明する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:51:50 GMT)
Quantum geometry of connected state manifolds: When diabolic points act as bridges between eigenstate manifolds [0.0] 座標変換により計量を正則化し、隣り合う固有状態多様体の間の橋渡しとして双曲点が作用する形式論を発展させる。
この構造の位相を特徴付け、ベリー位相を規定するノルダーラインの規則を洗練させる。
連結状態多様体は、ダイアボリック点付近の数値安定性を復元し、新しい測地線ショートカットを可能にする測地学のクラスを拡大し、ダイアボリック点を横断する経路に沿っても、ベリー位相計算のための新しいメカニズムを提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:53:20 GMT)
Quantum encodings that preserve persistent homology [0.0] トポロジカルデータ解析(TDA)は、代数的トポロジと計量幾何学の技法を用いて、データをサンプリングする仮説多様体のトポロジを推測する。
量子TDAは量子プロセスを利用して、そのようなデータセットを作成する際に使われる不変量を抽出し、計算を高速化する。
元の古典的データセットに変換を適用することで、関連する位相不変量を変更することができるので、どの量子符号化が元のデータセットの不変量を最もよく保存するかを検討する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:00:00 GMT)
Quantum Spin Squeezing Enhanced by Critical Exceptional Points [0.0] 散逸性集合スピン系は、パラメトリックに増強された定常的テクストクエンタムスピンスクイーズを示す。
この結果から、CEPは、定常異方性量子ゆらぎと、駆動散逸性プラットフォームにおける相関を工学的に研究するための経路であると同定した。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:16:56 GMT)
Quantum Geometric Limits for Non-Abelian Holonomies [0.0] Wilczek--Zeeホロノミーは普遍的量子幾何学的極限(QGL)に従う
我々は、輸送曲率によって駆動される効率的なストークス・シュルディンガー力学としてホロノミック進化を再現する。
SU(2)三重ダーク部分空間に適用された準最適プロトコルは、輸送された曲率を単一のリー代数方向に沿って自発的に整列させる。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:13:07 GMT)
Quantum Crossovers Revealed by Local Measurements [0.0] 量子クロスオーバー現象は、少数体のオープン量子系において中心的な役割を果たす。
クロスオーバーは純粋に局所的な測定によって頑健に特徴付けられることを示す。
その結果,クロスオーバーの局所的指標と大域的指標との幾何学的区別が明らかになった。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:18:03 GMT)
QuITE: Query-Based Irregular Time Series Embedding [0.0] IMTS用の簡易かつ効果的なプラグアンドプレイ埋め込みモジュールQuITE(Query-Based Irregular Time Series Embedding)を紹介する。
QuITEは学習可能なクエリトークンを使用して、単一の自己アテンション層を通じて不規則な観測を集約する。
実験の結果、QuITEはMCSモデルを継続的に改善し、予測値の平均相対利得は54.7%、分類値が15.8%である。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:48:58 GMT)
PubMedCausal: A Span-Level Annotated Corpus for Causal Relation Extraction in Biomedical Text [0.0] 因果関係抽出はバイオメディカルテキストマイニングの中心である。
PubMedの抽象化から構築したバイオメディカルCREのための,スパンレベルアノテートコーパスであるPubMedCausalを紹介した。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:59:17 GMT)
Problem-Specific Basis Quantum State Readout via Proper Orthogonal Decomposition [0.0] そこで本研究では,解の特徴的特徴を事前計算することで,読み出し効率を向上させる問題固有手法を提案する。
オフライン段階では、代表解データから対象問題の支配的特徴を表す基底関数の集合を構築する。
オンラインの段階では、量子状態はこの還元基底に投影され、最小限の重み係数のみを抽出して解を再構成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:42:29 GMT)
Probabilistic bias adjustment of seasonal forecasts using generative machine learning: A case study of Arctic sea ice predictions [0.0] 北極海氷の季節変動予測に偏りの大規模なアンサンブルを生成する枠組みを開発した。
我々は、この枠組みを拡張して、予測における微細なエネルギーの損失と特徴的曖昧さに対処する。
調整した予測は、観測分布とより整合性があり、ベンチマーク予測よりも誤差が小さいことを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:14:46 GMT)
Prime Number Identification Demonstrated with Quantum Processors Using a New Rescaling-Based Noise Mitigation Technique [0.0] 我々は,IBM量子プロセッサを用いて,絡み合いのダイナミクスに基づく素数同定のための量子プロトコルを実装した。
実験騒音を軽減するため,大域的再スケーリング係数に基づくノイズ緩和手法を提案する。
これらの結果は、ノイズのある中間スケール量子(NISQ)デバイスにおける実用的数論的な応用に向けた一歩である。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:08:39 GMT)
Preference-Shaped Expected Hypervolume and R2 Improvement: Exact Computation and Monotonicity [0.0] 同様の目的によく使用される指標群を2つ検討するが、幾何的に異なる。
ハイパーボリュームインジケータは、ディストピア基準点に基づいて、客観空間において支配的なボリュームを測定する。
R2インジケータはユートピア点に基づいて、重み付けされたチェビシェフスカラー化エンベロープによる近似集合を評価する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:02:28 GMT)
Practitioner Beliefs and Behaviors in AI-Enhanced Education: DOT Framework Survey Evidence [0.0] この研究は、AIの親しみやすさ、利用パターン、デザイン指向の実践、教育的信念について調査している。
その結果、実践者は、人間の監視と批判的評価に強いコミットメントを維持しながら、AIを教育的支援として好意的な見解を持っていることが示唆された。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:42:31 GMT)
Picometer control of a levitating milligram gravity sensor [0.0] 磁気浮上式重力センサを2ピクタ以下10ミリケルビンモード温度以下にリニアフィードバック冷却する。
磁気浮上粒子上での量子基底状態の冷却を可能にする装置の今後の改良について論じる。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:39:09 GMT)
PRISM-SLAM: Probabilistic Ray-Grounded Inference for Scale-aware Metric SLAM [0.0] PRISM-SLAMは、VFMプリエントを構造化ベイズ因子グラフに厳密に統合するリアルタイムフレームワークである。
我々は,一貫した距離座標系内の絶対空間における単分子観測を固定するために,チャンカー線距離係数を導入する。
VFM推論と幾何追跡を非同期に処理するマルチプロセスアーキテクチャを利用することで、PRISM-SLAMはRGB入力のみを使用して、30FPSで検証済みのメトリック出力を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:11:32 GMT)
PLS in the Mirror of Self-Attention [0.0] このノートは、線形化された自己注意として部分最小二乗(PLS)を鋳造することに関する興味深い観察を提供する。
一方, PLSにおける予測器の次元化と選択は, 学習改善に向けて, 自己意識が一定の次元正規化の度合いを含むことを示唆している。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:11:35 GMT)
PIRS: Physics-Informed Reward Shaping for SAC-Based Building Energy Management [0.0] 提案するPIRS (Physics-Informed Reward Shaping) は,ISO 7730 Predicted Mean Vote (PMV) の定式化により,アドホックな快適なプロキシを置き換える。
PMVの定式化において快適なシグナルを固定することにより、PIRSは報酬の解釈性を改善し、標準的グラウンドの快適なプロキシを提供する。
PIRSは、手動のベースラインと同等のコスト、炭素、電気の計測値を得ると同時に、非物理学的な地上設計を大幅に上回っている。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:45:14 GMT)
Operational AI Deployment Assurance: Governance-State Orchestration Under Threshold-Sensitive Deployment Conditions -- A Governance Framework for High-Stakes AI Systems [0.0] 本稿では、公平性の不一致、不安定性、しきい値感度、修正結果、運用上の不確実性をデプロイメント指向の保証決定に翻訳するガバナンスフレームワークであるOperational AI Deployment Assurance(OADA)を紹介する。
提案するフレームワークでは,運用デプロイメント保証を,評価と実世界のAIデプロイメント間のガバナンスレイヤとして位置付けている。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:33:40 GMT)
On the existence of fully inseparable biseparable Gaussian states [0.0] 異なる二部分裂に対して分離可能な凸混合状態として準備できる、完全に分離不可能な状態が存在する。
多モードガウス状態のいくつかの古典型族について、完全に分離不能な2つの分離可能な候補状態は、実際には真の多重部分的絡み合っていることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:39:47 GMT)
On Compositional Learning Behaviours in Formal Mathematics [0.0] textbfS2B-LMはシンボリックビヘイビアベンチマークの適応である。
CLB能力は必須であるが,形式的数学的検証の難しさには十分でないことを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:15:04 GMT)
OccuReward: LLM-Guided Occupant-Centric Reward Shaping for Demographic Equity in Grid-Interactive Buildings [0.0] 大規模言語モデル(LLM)は、エネルギー管理を構築するための報酬関数を生成する有望な能力を示した。
OccuRewardは、LCMによる報酬デザインが人口動態にどのように影響するかを調査するフレームワークである。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:50:02 GMT)
Noise adaptive two-way secure deterministic quantum key distribution [0.0] 雑音適応型量子鍵分布(QKD)プロトコルを導入する。
我々は、集団攻撃下での適応的シナリオと従来の非適応的シナリオの両方に対して、対応する秘密鍵レートを導出する。
本研究は,現実的な雑音のある量子チャネル上でのセキュアな通信を改善するための強力なフレームワークとして,雑音適応型符号化と復号化を確立した。
論文参考訳(メタデータ) (Wed, 27 May 2026 03:26:05 GMT)
Multimodal Group Emotion Recognition In-the-Wild Towards a Privacy-Safe Non-Individual Approach [0.0] この論文は、プライバシー保護に焦点を当てたグループ感情認識(GER)に対処する。
顔、視線、音声分析のような個々のレベルの手がかりに依存する従来の感情認識法とは異なり、この研究は集団レベルの感情を推測するために集団的な音声信号を使用する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:36:58 GMT)
Modular non-Hermitian topology and its application to critical sensing [0.0] 非エルミート位相系は近年多くの研究活動を惹きつけている。
一定間隔の特定の結合が異なる値を取るモジュラ構造は、これらのシステムの特異な位相特性を豊かにすることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:16:02 GMT)
Mind Your Tone: Does Tone Alter LLM Performance? [0.0] LLM(Large Language Models)の使用が増加しているが、そのパフォーマンスは、プロンプトスタイルやトーンに基づいて異なる。
5つの音調変量を持つ50塩基質問データセットと、57人の被験者と7つの音調変量を持つ570塩基質問MMLUサブセットの2つのデータセットを使用する。
音質感度の主観レベル差を同定し,音色が内部推論モードにどのような影響を及ぼすかを説明するためのルーティング・フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:23:46 GMT)
Meta-Attention: Bayesian Per-Token Routing for Efficient Transformer Inference [0.0] 本稿では,各トークンを最も適切な注意戦略に動的にルーティングするフレームワークであるMeta-Attentionを提案する。
決定論的または事前自由な学習ルーティングを使用する以前のルーティングアプローチとは異なり、Meta-Controllerは、トークン毎のメカニズム選択を後部推論として扱う。
この設計は、ソフトからハードへのルーティング遷移を制御し、アドホックな負荷分散損失を伴わずにルーティング崩壊を緩和し、より良い計算性能のトレードオフをもたらす、原則化されたルーティング不確実性推定を生成する。
論文参考訳(メタデータ) (Wed, 27 May 2026 12:21:28 GMT)
MerLean-Prover: A Recursive Looping Harness for Lean 4 Theorem Proving [0.0] MerLean-Proverは、残念な宣言をカーネルチェック可能な証明に置き換える、エンドツーエンドのLean4定理証明器である。
23のPhD-qualification-exam定理のベンチマークであるFormalQualBenchでは、MerLean-Proverは10/23を解く。
Sonnetは4つのテストされたFormalQualBench問題を全てクローズし、Haikuは2つの短い問題をクローズする。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:48:39 GMT)
MARGIN: Runtime Confidence Calibration for Multi-Agent Foundation Model Coordination [0.0] 本稿では,MARGIN(Multi-Agent Grading via Incremental Normalisation)を提案する。
18の基盤モデル、8のベンチマーク、44,000以上の観測結果から、MARGINは分布シフト時の最良の設計時ベースラインよりも3-6倍低いキャリブレーション誤差を達成している。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:57:17 GMT)
Local diagnostics for strong-to-weak spontaneous symmetry breaking and non-equilibrium phase transitions [0.0] 強常磁性挙動と強弱自然対称性の破れの遷移を示す。
1+1dでは、吸収状態構造はパリティ保存分岐消滅型ランダムウォーククラスと整合なスケーリングを伴う遷移を与える。
2+1d では、トゥームの法則の対フリップ変種が安定な強常磁性/弱対称性-分裂状態の証拠を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:20:59 GMT)
Learning shape resonances from the stabilization method [0.0] 量子力学における共鳴は、一般に連続体に埋め込まれた準有界状態として導入される。
離散量子状態の観点から問題を定式化することで連続体を明示的に扱うことを避ける別の方法について議論する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:01:55 GMT)
Learning quantum ground states in the space of measurement outcomes [0.0] 本稿では, 自己回帰型ニューラルネットワークを用いて, 測定空間における量子多体基底状態の変動学習について検討する。
我々は1次元の逆場イジングモデルとハイゼンベルクモデルに、L=128までのシステムサイズのためのギャップフィールドとともに、我々のアプローチをベンチマークする。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:00:01 GMT)
Latent-Conditioned Parameterized Quantum Circuits as Universal Approximators for Distributions over Quantum States [0.0] 潜在条件パラメタライズド量子回路(LPQC)を導入する。
我々は、LPQCが1ドルワッサーシュタイン距離における密度演算子に対する確率測度に対する普遍近似であることを証明した。
混合量子状態の合成マルチクラスターアンサンブルと3次元分子構造のQM9由来アンサンブルに関する数値実験を行った。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:19:10 GMT)
Krylov complexity has it all [0.0] この論文は、クリロフ複雑性が量子作用素の力学に関する全情報を含んでいることを証明している。
量子系における作用素進化の完全なキャラクタリゼーションとしてクリロフ複雑性を用いるための「原理の証明」を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:13:52 GMT)
Knowing When to Ask: Segment-Level Credit Assignment for LLM Tool Use [0.0] textbfCARL(textbfCompetence-textbfAware textbfReinforcement textbfL)を提案する。
モデル自身のロールアウトに対して、パラメトリックな知識がどこに十分で、外部の助けを必要とするかを学ぶために、評論家を訓練する。
AUC 0.93の7Bでのツール依存の質問とパラメトリックで解ける質問を分離する。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:11:31 GMT)
Intra-YOLO: A Small Object Detection Model for Caries and Molar-Incisor Hypomineralization in Intraoral Photography Based on Transfer Learning with Reinforcement Learning [0.0] 本研究は, 口腔内画像における毛細血管および大臼歯部低ミネラル化(MIH)を検出するコンピュータ支援診断システムを開発した。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:41:10 GMT)
Insurance Pricing Optimization via Off-Policy Evaluation [0.0] 我々は、意思決定問題として保険価格を定式化し、法外評価と価格管理のツールを用いて検討する。
本稿では,解釈可能なデータ共有型Lassoの定式化と,ニューラルネットワークに基づくフレキシブルなポリシーパラメータ化という,最適価格ルールの計算方法を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:27:32 GMT)
Information-Geometric Optimization on Spheres [0.0] 2つの情報幾何学的最適化フロー(IGOフロー)は,ポインカーeとベルグマンeの双曲情報幾何に基づく自然探索勾配の厳密な計算により設計されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:51:53 GMT)
Human-in-the-Loop Swarms: A Bionic Swarm Approach to Real-World Soil Mapping [0.0] 本稿では,ロボットに実装が難しいタスクの多くを抽象化するが,全体的なアルゴリズム評価に寄与しない新しいシステムである Bionic Swarm' を紹介する。
人間のユーザはスマートフォンのWebアプリから指示を受け、Bluetoothに接続されたセンサーから計測を行い、それらを集中型サーバーに中継する。
次に、Bionic Swarmプラットフォームにアルゴリズムを適用し、実世界の屋外環境でその機能を検証する。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:50:05 GMT)
Governing Technical Debt in Agentic AI Systems [0.0] Agentic Technical Debtは,プロンプトやメモリ,ツールスキーマ,オーケストレーショングラフ,コントロールポリシ,可観測性ルーチンが,検証や標準化,管理よりも高速にパッチされる場合に発生する,累積的な負債として定義します。
我々は,納税を,許容範囲内に確率的エージェントの挙動を維持することの繰り返し運用負担として定義する。
マネージャが軽量ダッシュボードとガバナンスコントロールを通じて、見えるようにする方法を概説する。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:42:49 GMT)
Geometry of Relaxed Fair Regression: A Unified Framework for Aware and Unaware Settings [0.0] 緩和された公正性制約の下で正確な予測を得るための原則的手法は、ほとんど失われている。
本フレームワークは,エフェックウェアとエフェナウェアの両方を統一し,最適なトランスポートマップを用いて最適な予測関数を特徴付ける。
これらの理論的特徴に基づいて、実世界のベンチマーク上での最先端のベースラインの実装、計算効率、一貫した整合性、あるいは性能の向上を簡易に行うアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:45:16 GMT)
Gauge Geometry of Hodge Zero-Mode Transport in Parameter-Dependent Topological Data Analysis [0.0] 曲率とホロノミーは、進化するトポロジカル構造における再編成と蓄積記憶の記述である。
曲線は、ホモロジー的特徴が急速に混合または変化するパラメータ領域を強調し、ホロノミーは閉サイクル後にそのような変化の純効果を要約する。
提案手法は,不安定性を検知し,ほぼ同一の永続化ダイアグラムを持つシステムを識別し,ポイントワイドな特徴マッチングに見えないサイクルレベルのメモリをキャプチャする。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:27:10 GMT)
Functional Entropy: Predicting Functional Correctness in LLM-Generated Code with Uncertainty Quantification [0.0] 不確かさ定量化(UQ)手法は、自然言語生成における幻覚を検出するための有望なアプローチとして登場した。
3つのプログラミング言語と1700以上の問題にまたがって、UQ技術がどのようにコード生成に移行するかを体系的に評価した。
我々は,NLIに基づく意味的同値をLLMに基づく関数的同値評価に置き換えるコード固有手法のファミリーである関数的同値法を導入する。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:01:30 GMT)
Function-Valued Causal Influence in Nonlinear Time Series [0.0] 時系列における因果発見は非線形機械学習モデルを用いてますます行われているが、結果として生じる因果関係はほとんど常にスカラーエッジスコアによって要約される。
このプラクティスは、非線型自己回帰モデル(状態依存関数)によって学習された真の対象を曖昧にしている、と我々は主張する。
我々は,加法的,寄与分解可能なアーキテクチャに対する関数値因果関係を定式化し,スカラー因果関係のスコアが深刻な情報のボトルネックとなることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:07:14 GMT)
From Detection to Mechanism: Cross-Attention Graph Neural Networks Enable Drug-Drug Interaction Type Prediction An Ablation Study with Acetylsalicylic Acid Validation [0.0] 本研究では,薬物・薬物相互作用(DDI)予測のための3つのグラフニューラルネットワーク(GNN)アーキテクチャの体系的アブレーション研究について述べる。
3つのアーキテクチャは、同じトレーニング条件下で比較される。
CrossAttはマルチクラスF1マクロをConcat上で+0.186絶対(+45%)改善し、バイナリAUCを+0.012(+1.3%)改善した。
第三次アーキテクチャは、同等のトレーニングデータにもかかわらず、その失敗はトレーニング不安定性の仮説と一致しているにもかかわらず、パフォーマンスが劣る。
論文参考訳(メタデータ) (Wed, 27 May 2026 02:22:44 GMT)
FormInv: A Measurement Protocol for Semantic Invariance in Mathematical Reasoning Benchmarks [0.0] MathCheckのパラフレーズ品質検査では, 19群で4つの意味的不正確なパラフレーズが検出された。
GPT-4oは2位から4位へと降格し、クロード・ハイクとディープ・シークV3が上昇する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:59:18 GMT)
First head-to-head comparison of agentic AI applied to the analysis of simulated data of the Einstein Telescope [0.0] 我々は、最先端のエージェントAIシステムであるClaude Code(Anthropic)とCodex(OpenAI)の比較を報告する。
我々はClaude Codeが3.4分でパイプラインを完了し、仕様から無声で逸脱することを示し、Codexは明示的な自己修正再起動に16分を必要とした。
本稿では,これらの行動の違い,例えば速度対聴覚性,無声対透明な誤り,命令解釈,中間データ表現の臨界性などについて論じる。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:54:26 GMT)
Electron-photon interaction: Feynman diagrams and contact points [0.0] ファインマン図形の直接問題と逆問題と接触点の概念を定式化する。
ファインマン図形と古典的な色のグラフの間の相互関係について論じる。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:24:06 GMT)
Effective Geometry and Position-Dependent Mass in Dual-$q$ Quantum Mechanics [0.0] 本研究はボルジェスが導入した変形微分形式主義を考察する。
これは線型作用素 $D_(q)$ と非線形双対である $D(q)$ との関係に焦点を当てる。
この非線形性は座標と波動関数の同時変換によって除去可能であることを示す。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:29:44 GMT)
Do you dare to try Test-Driven Forensics? Increasing Trust in Desktop Forensics with ADARE [0.0] 本稿では,法医学的期待を実行可能な仕様として扱う実践的アプローチとして,テスト駆動型法医学を紹介する。
本手法は,仮想マシン上で制御された実験を実行するオープンソースフレームワークであるADAREで実装されている。
オートプシーの25バージョンレグレッション調査では、輸出されたレポートの出力に大きく、ほとんど文書化されていない変化が見られる。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:38:06 GMT)
Digital Quantum Simulation of the quantum $β$-FPUT Lattice: Formulation and Resource Estimation [0.0] 低次元系の熱伝導は、非調和性および長寿命振動相関によるフーリエの挙動から強い逸脱を示す。
本研究では,フォールトトレラント量子コンピュータを対象とした量子$-FPUT格子のための量子量子シミュレーションフレームワークを開発した。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:27:23 GMT)
Decision-focused learning for optimal PV-Battery scheduling [0.0] 近年は住宅用太陽光発電の利用が激増している。
電池が手頃な価格になるにつれ、太陽光発電システムの最適運用は家庭に多大な節約をもたらす可能性がある。
本研究では,最適化と予測を統合した意思決定型学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:43:27 GMT)
Counterfactually Fair Regression via Optimal Transport [0.0] 我々は,新しい後処理推定器の理論的公正性を保証することに注力する。
ほぼ公平な予測の過剰なリスクに対する、一致した低い境界を提供する。
実世界のデータと合成データに対する我々のアプローチを検証する。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:00:54 GMT)
CosmicFish-HRM: Adaptive Reasoning via Hierarchical Recurrent Mechanisms in Compact Language Models [0.0] 本稿では適応推論深度を持つコンパクト言語モデルであるCosmicFish-HRMを提案する。
モデルは非一様推論の振る舞いを学習し、タスクと入力をまたいだ推論ステップの数を割り振る。
これらの結果から,適応推論深度は,推論能力のパラメータスケールにのみ依存するよりも,有望な代替となる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:59:14 GMT)
ConvMemory: A Lightweight Learned Memory Reranker, a Negative Attribution Result, and a Research-Preview Conflict Editor [0.0] 会話型長期記憶検索のための3.6M-パラメータ学習型再ランカであるConvMemoryについて述べる。
LongMemEvalメモリファミリでは、ConvMemoryは12-47倍のレイテンシでRecall@10のBGEの大きなクロスエンコーダ上で動作する。
ペアブートストラップを用いた5シード再訓練アブレーションでは、ConvMemoryの学習した時間窓は、集計において統計的に有意であるが、時間的に特異ではないことが示されている。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:14:52 GMT)
Complex abelian varieties and quantum error correction: a mathematical framework for GKP codes [0.0] 複素アーベル多様体の幾何学を通して量子誤り訂正符号のクラスを研究する。
我々は、この関係を正確に数学的に定式化し、それをアーベル多様体論におけるGKP符号理論の主構造と古典的対象の間の辞書に拡張する。
論文参考訳(メタデータ) (Wed, 27 May 2026 17:43:30 GMT)
Comparing Post-Hoc Explainable AI Methods for Interpreting Black-Box EEG Models in Depression Detection [0.0] 本研究では,脳波による抑うつ検出のためのインセプションタイムアーキテクチャに適用した複数のポストホック説明可能性手法について検討した。
評価により,前頭葉,側頭葉,後頭葉の脳波領域に連続的に強調される部分収束帰属パターンが認められた。
以上の結果から,脳波に基づく抑うつ検出のための深層学習モデルにおいて,様々なポストホック説明可能性アプローチが部分的に重複する関連構造を捉えていることが示唆された。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:32:57 GMT)
Comonadic Morphophonology: A Compositional Framework for Context-Dependent Morphological Rules in Finnish [0.0] 本稿では,各形態素規則が集中した局所的文脈から単一出力セグメントへの関数となる最初の枠組みを示す。
新しい代数的構成は、そのような規則に対する厳密なコクライズリ構成性を復元する。
13個のcoKleisli矢印は、オモーフィがエンコードしたのと同じ形態的振舞いを表す別の定式化を提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:41:32 GMT)
Collective Radiative Enhancement of Rare-Earth Ions in Lithium Niobate via Engineered LargeArea Nanohole Arrays [0.0] 原子やエミッタ自体の空間的幾何学を 調整することは 放射特性を制御するための 強力な経路として現れました
ツリウムイオンを注入したニオブ酸リチウムにサブ波長金ナノホールの周期配列を作製し, 希土類イオンの形状工学的アンサンブルを実験的に実現した。
本研究は, 固体プラットフォームにおける広帯域・拡張性, 幾何制御型量子光学インタフェースへの道を開く光物質相互作用の新たな形態を実証するものである。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:14:26 GMT)
Code as a Weapon: A Consensus-Labeled Prompt Bank for Measuring Coding-Model Compliance with Malicious-Code Requests [0.0] 符号化特化モデルは、汎用チャットモデルよりも高い拒絶バーをクリアすべきである。
8つのコーパス(ASTRA、CySecBench、AdvBench/harmful_behaviors、JailbreakBench、MalwareBench、RedCode、RCCBench、Scam2Prompt)は5judgeコンセンサスプロトコルで統合され、分類される。
コーディングモデルがより厳格な拒絶基準を満たしているかどうかをテストするための信頼性基準である。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:55:15 GMT)
Clark Hash: Stateless Sparse Johnson-Lindenstrauss Quantization for Neural Embeddings [0.0] クラーク・ハッシュ(Clark Hash)は、少ない空間で神経埋め込みを保存するための小さな方法である。
各データベースベクトルを正規化し、ジョンソン・リンデンシュトラウス射影に署名された決定論的スパースを適用し、結果をクリップし、固定幅スカラー量子化されたコードを保存する。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:38:41 GMT)
Cavity-Induced Suppression of Entanglement and Enhancement of Quantum Discord [0.0] 境界条件は自由空間に対する検出器相関ダイナミクスを変化させる。
エンタングルメントの負性性は空洞内で抑制され、自由空間と比較して小さな分離のために消滅する。
論文参考訳(メタデータ) (Wed, 27 May 2026 07:02:05 GMT)
CAREF: Calibration-Aware Regularization for Explanation Faithfulness Without Rationale Supervision [0.0] 我々はパラメータ効率の良い微調整フレームワークであるCAREFを紹介する。
CAREFはトークンレベルの空間制御とエントロピーベースのキャリブレーションを結合する。
4つのNLEベンチマーク(COS-E, ECQA, ComVE, e-SNLI)の評価
論文参考訳(メタデータ) (Wed, 27 May 2026 01:47:12 GMT)
Building a privacy-preserving Federated Recommender system for mobile devices [0.0] モバイル機器のための2段階のフェデレーションレコメンデーションシステムパイプラインを提案する。
第1ステージでは、クラウド内の非機密アプリケーションコンテキストデータ上で協調的なフィルタリングモデルを実行し、関連する項目のショートリストを生成する。
第2段階では、これらの候補をデバイス上でセンシティブなモバイル信号を使って再ランク付けし、デバイスを離れるのはモデル更新/段階のみである。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:29:59 GMT)
Bridging the Sim-to-Real Gap in Reinforcement Learning-Based Industrial Dispatching through Execution Semantics [0.0] イベント駆動型スケジューリングポリシは、産業環境にますます展開されている。
決定状態は時間的に一貫性がなく、行動許容性は明確に定義されておらず、実行エラーの起源はあいまいである。
スケジューリングポリシと産業実行環境の仲介を行うために,政策中立な実行・測定層を提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 20:30:20 GMT)
Boundary Suppression Asymmetry in Post-trained Assistants: Over-expansion as a Controllability Cost [0.0] 訓練後の言語モデルアシスタントは、アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アンダー・アン
我々は、アンダーアンサーリング対策がベースラインよりも引き戻すのが難しいことを示している。
全体として、ポストトレーニングは方向特異的な制御性コストを生み出す可能性がある。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:03:54 GMT)
Beyond Recall: Behavioral Specification as an Interpretive Layer for AI Personalization [0.0] 人間の解釈をいかに忠実に捉えているかを測定するために,表現精度を導入する。
我々は,保留行動予測のプロトタイプベンチマークで仕様を評価する。
我々は、表現精度はリコールと異なるものであり、人間とAIのアライメントは、ユーザがどれだけ正確に表現されているかに依存していると結論づける。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:18:54 GMT)
Beyond Lipschitz: Data-Driven Robustness via Discrete Modulus of Continuity [0.0] ニューラルネットワークのロバスト性は、局所的あるいは大域的なリプシッツ定数によって一般的に定量化される。
リプシッツ連続性の非線型一般化に基づく,データ駆動型アーキテクチャに依存しないフレームワークを提案する。
DMOCにより誘導される半ノルムに対して,データ駆動率を明示した収束結果を確立した。
本稿では,2次計算コストを削減できるスケーラブルなミニバッチアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 16:47:50 GMT)
Bayesian Multiplicity Correction in the Probabilistic Forward Stepwise Framework [0.0] 回帰問題に対するモデル空間事前の確率的前方段階表現における自然ベイズ的多重度補正事前分布を開発する。
モデル空間の事前に対する客観的な選択として最近提案されたものを含め、この2つを他のいくつかの前例と比較する。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:57:47 GMT)
BEAMS: Benchmarking and Evaluating AI for Modeling and Simulation [0.0] BEAMSイニシアティブは、モデリングとシミュレーションのためのAIツールの開発を、責任と倫理的な形式へと導くことを目的としている。
このイニシアチブは、オープンなデジタルおよび組織インフラを使用して、モデリングとシミュレーションのためのAIツールを協調的に評価する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:51:00 GMT)
Automated Estimation of Impact Time, Impact Location, and Shuttlecock Speed in Badminton Smashes Using Event Cameras [0.0] 本研究では,2台の同期イベントカメラを用いて,衝突時間,ラケット面の衝突位置,衝突後のシャトル速度を推定する手法を提案する。
提案手法を検証するため, 5人のプレーヤーによる125スマッシュ試験を用いて, 高速カメラベース基準法に対してBland-Altman解析を行った。
論文参考訳(メタデータ) (Wed, 27 May 2026 06:07:43 GMT)
AtomComposer: Discovering Chemical Space from First Principles with Reinforcement Learning [0.0] AtomComposerは、統計的制約の下で有効な3D異性体を自律的に構築する自己誘導エージェントである。
我々のエージェントは、既存の単体強化学習ベースラインよりも、目に見えない試験式上で、最大で1桁有効な異性体を見つけることができる。
論文参考訳(メタデータ) (Wed, 27 May 2026 10:35:28 GMT)
Atom--photon Entanglement with a Single Trapped Cesium Atom [0.0] 光学式ツイーザーに閉じ込められた1個のセシウム原子を用いた原子-光子の絡み合いを実証した。
エンタングルメントは共鳴励起とその後の自発的崩壊によって生成され、原子ゼーマン状態と光子偏光が絡み合う。
結果は、自由空間Cs原子-光子インターフェースを確立し、二重種Rb-Cs量子ネットワークへのステップを提供する。
論文参考訳(メタデータ) (Wed, 27 May 2026 18:18:18 GMT)
Asymptotic Quantum Dynamics of Ghost Fields [0.0] 通常のフィールドに結合したゴーストの服を着たプロパゲーターは、一対の複素共役極を発達させる。
ゴースト場と多粒子状態の複合場との相互作用は時として持続することを示す。
その結果、自由な一粒子ゴースト状態は存在しない。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:51:41 GMT)
Analyzing Quality-Latency-Resource Trade-offs in a Technical Documentation RAG Assistant Using LoRA Adaptation [0.0] 発電機のローランド適応(LoRA)を用いた検索拡張世代(RAG)システムにおける品質-遅延-リソーストレードオフについて検討する。
公式文書上で5,144の質問応答ペアのベンチマークを構築し、それを固定されたハイブリッド検索パイプライン(BGE-M3高密度、BGE-M3ネイティブ、Reciprocal Rank Fusion、クロスエンコーダ更新)と組み合わせる。
論文参考訳(メタデータ) (Wed, 27 May 2026 09:37:55 GMT)
Analytical Investigation of Two-Spin Entanglement Generated by Different Types of Bosonic Environments [0.0] ボソニックな環境下での相互作用によって生じる2つのスピンの時間的進化について検討する。
エンタングルを最大化しながらシステムのデコヒーレンスを最小限に抑える環境モデルが得られた。
論文参考訳(メタデータ) (Wed, 27 May 2026 13:11:42 GMT)
An Evolutionary Approach for Designing Stable and Highly Expressible Low-Immunogenicity Therapeutic mRNA Sequences [0.0] 治療薬としてのメッセンジャーRNA(mRNA)配列は、効率的な翻訳、構造安定性、最小限の免疫原性を保証するために最適化された設計を必要とする。
本研究は,mRNA最適化のための深層学習と進化計算を統合した2段階のin-silicoフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:20:17 GMT)
An Empirical Audit of k-NAF Budget Accounting for Anchored Decoding [0.0] 我々はAnchored Decodingにおけるk-NAF予算計算機構を実証的に検証した。
固定作業負荷では、累積的なKL支出は600, 1000のシーケンスレベルの予算Kよりもはるかに低いままである。
適応探索はプロキシ使用率を増加させるが、明確な予算枯渇は生じない。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:52:29 GMT)
An Effective-Rank Audit of Alignment-Induced Activation Shifts: Confound Control, Constructive Calibration, and Limits [0.0] 我々は3つのオープンウェイト命令調整LDMの残差ストリーム活性化のアライメントによる変化を監査する。
rho_eps := rank_eps(M_Ds)/d は Arditi et al. (2024) の単一拒絶方向観測を連続量として定式化する。
論文参考訳(メタデータ) (Wed, 27 May 2026 11:42:51 GMT)
Adaptive Reservoir Computing for Multi-Scenario Chaotic System Forecasting [0.0] CTF-4-Science Lorenzベンチマークのための適応型貯水池計算フレームワークを提案する。
本研究では,Echo State Networks(ESNs)のトレーニングおよび予測手順を,各評価シナリオの特定の要求に合わせて調整する。
提案したフレームワークは、公開ベンチマークのリーダーボードで74.91のスコアを達成している。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:27:02 GMT)
Adapting Automotive Aerodynamics Surrogates to New Vehicle Families via Transfer Learning [0.0] 幾何エンコーダは転送可能な表現を学習するが、適応機構はそれらを活用できるかどうかを決定する。
LoRAは、最小限のデータから数時間でトレーニングできる軽量のファミリーごとのアダプタと組み合わせたメモリセービングの利便性である。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:03:25 GMT)
A self-supervised learning approach to deep filter banks for texture recognition [0.0] 本稿では,事前学習モデルが畳み込みオートエンコーダとなるフレームワークを提案する。
テクスチャパターンによって伝達されるリッチな情報を活用するために、ディープフィルタとフィッシャーベクトルプールを用いる。
本手法はテクスチャデータベースにおけるいくつかの最先端手法と比較する。
論文参考訳(メタデータ) (Wed, 27 May 2026 01:58:39 GMT)
A Variational Quantum Algorithm for Nonlinear Finite Element Analysis of Hyperelastic Materials [0.0] 超弾性材料モデルから生じる非線形弾性問題に対する変分量子定式化を, 準項雑音型中間スケール量子(NISQ)デバイスをターゲットに検討した。
このアプローチは超弾性のポテンシャルエネルギー構造を利用し、パラメータ化量子回路を用いてエネルギー汎関数を評価するハイブリッド量子古典的枠組みを用いる。
現在の量子ハードウェアの実装を可能にするため、非線形ひずみエネルギー密度の近似を導入し、変動量子アルゴリズムと互換性のある表現を与える。
論文参考訳(メタデータ) (Wed, 27 May 2026 23:37:04 GMT)
A Query Engine for the Agents [0.0] オブジェクトストレージから直接ParquetとApache Icebergを読み込む3つのオープンソースのJavaScriptライブラリであるHyperparamを紹介します。
SquirrelingはフィルタバウンドクエリでDuckDB-WASMよりも300倍以上高速にLLM形式の非同期UDFを実行する。
規律としてのデータエンジニアリングは、現在運用中のAIネイティブクライアントアプリケーションの更新が必要である、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:09:49 GMT)
A Quantum Algorithm for Simulating Nonunitary Dynamics Governed by Nonautonomous Linear Ordinary Differential Equations [0.0] 明示的な非単位プロパゲータの事前知識を必要としない量子アルゴリズムを提案する。
本アルゴリズムは特異値分解を用いた拡張スキームを組み合わせることで,非単体プロパゲータをユニタリの和として記述する。
論文参考訳(メタデータ) (Wed, 27 May 2026 19:54:59 GMT)
A Multiscale Kinetic Framework for Image Segmentation: From Particle Systems to Continuum Models [0.0] 位置空間と特徴空間の両方における粒子の進化を規定する相互作用スキームを導入する。
輸送, 凝集, 拡散効果を組み合わせた空間-機能領域における粒子密度の速度論的定式化を導出した。
我々は、画像の正確なセグメンテーションのために、粒子ベースの最適化技術を利用する。
論文参考訳(メタデータ) (Wed, 27 May 2026 15:29:14 GMT)
A Minimal Executable Proof for Multi-Language Contract Traceability [0.0] 本報告ではDAG-TOML契約の検証を意図的に行う。
コントラクト、実装グラフ、トレーサビリティチェーン、レビューゲートが実行可能な目撃者に対してどのようにチェックできるかを示している。
論文参考訳(メタデータ) (Wed, 27 May 2026 14:37:26 GMT)
A Minimal Bifurcation Model of Load Imbalance in a Softmax Mixture-of-Experts Router [0.0] 本論文では,2段混合実験層に対する適応型ソフトマックスルーティングの最小限の動的モデルを提案する。
我々は、分岐集合とカスプカタストロフィの局所正規形に対する正確なパラメトリック方程式を導出する。
論文参考訳(メタデータ) (Wed, 27 May 2026 21:29:30 GMT)
A Geometric Profile of Semantic Information in Text: Frame-Conditional Uniqueness and a Trade-Off Triangle for Scalar Summaries [0.0] テキストの文の埋め込み構造から意味的内容を測定するフレームワークを開発する。
推奨のランク正規化構成は、28の順序チェックのうち25をポイント推定としてパスする。
別個の変動結果は、幅座標を行列点過程の対数行列式に接続する。
論文参考訳(メタデータ) (Wed, 27 May 2026 04:37:26 GMT)
A Fixed-Budget, Cluster-Aware Standard for LLM-as-a-Judge Evaluation: A Multi-Hop RAG Stress Test [0.0] RAGにおけるLCM-as-a-judge比較の最小基準を提案する。
標準ではトップ100候補プール、エビデンス予算、回答上限、ジェネレータ、プロンプトが修正されている。
また、事前登録された仮説、クラスタ認識推論、実行可能時の正確なクラスタサイン-フリップチェック、第2ジャッジレプリケーションも必要である。
論文参考訳(メタデータ) (Wed, 27 May 2026 00:12:02 GMT)
A Demonstration of Quantum Circuit Implementation for Obstacle Flow Using Carleman-Linearized Lattice Boltzmann Method [0.0] 障害物まわりの2次元線形流体流に対する量子アルゴリズムを実装した。
インフロー、アウトフロー、ノースリップ境界条件はスパース行列演算として定式化される。
格子点数に関して,必要キュービット数とゲート数の対数スケーリングを実演する。
論文参考訳(メタデータ) (Wed, 27 May 2026 08:20:48 GMT)
A Covariant Chiral-Hydrodynamic Formulation of the Dirac Equation in Curved Spacetime [0.0] 我々は、曲線時空におけるディラック場の完全共変キラル-流体力学的定式化を開発する。
この研究はスピン流体に対する閉じた流体力学理論を提供するだけでなく、量子情報を解析するための統一的な枠組みも確立している。
論文参考訳(メタデータ) (Wed, 27 May 2026 05:06:33 GMT)