Towards Interactive Video World Modeling: Frontiers, Challenges, Benchmarks, and Future Trends [97.8] 我々は,最近の研究動向,技術開発,評価ベンチマークを体系的にレビューし,インタラクティブな世界モデリングにおける今後の方向性を提案することを目的とする。
具体的には、アプリケーションシナリオ、世界状態の進化、シーンのモダリティの観点から、最近の取り組みとトレンドを最初に要約する。
アクションコンディショナビリティ、長期的なインタラクションとメモリ、リアルタイムの対話性に対するアクションフォロー応答性など、重要な3つの課題を掘り下げる。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:12:30 GMT)
Test-Time Deep Thinking to Explore Implicit Rules [80.7] Test-Time Exploration (TTExplore) は、思考者コンポーネントがインタラクション履歴を分析して暗黙のルールを推論し、アクターを誘導するフレームワークである。
5つのテキストベースのエボダイドタスクの実験では、TTExploreにExp-Thinkerが搭載されており、ベースラインエージェントのパフォーマンスを平均14ドル~19ドルポイント改善している。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:58:08 GMT)
R^3: Composed Video Retrieval via Reasoning-Guided Recalling and Re-ranking [73.1] 本稿では、Reasoning-guided Recalling and Re rankを中心に構築されたゼロショット合成ビデオ検索パイプラインを提案する。
モデルは、編集を適用した後、期待されるターゲットビデオを記述する推論トレースを生成する。
この課題に対処する上で,本手法の有効性を実証した。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:20:53 GMT)
InstructSAM: Segment Any Instance with Any Instructions [70.3] InstructSAMは任意の命令の下でマルチインスタンスセグメンテーションのために設計されたフレームワークである。
学習可能なインスタンスクエリのバンクを視覚言語モデル(VLM)とSAM3に注入する。
ハイブリッドアテンション機構は、これらのクエリ、ビジュアルトークン、命令トークン間の相互作用を促進する。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:20:32 GMT)
BraveGuard: From Open-World Threats to Safer Computer-Use Agents [68.4] BraveGuardは、オープンワールドの脅威信号とリアルエージェントの軌道からモデルを訓練するための自己進化型防衛フレームワークである。
我々は、Qwen3-GuardやLlama-Guardなど複数のガードバックボーンをトレーニングしてBraveGuardをインスタンス化し、トラジェクトリレベルのエージェントセーフティベンチマークの結果のガードを評価する。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:16:18 GMT)
BenchEvolver: Frontier Task Synthesis via Solution-Centric Evolution [59.6] BenchEvolverはソリューション中心の進化的フレームワークで、既存のコーディング問題をより難しい変種に変換する。
BenchEvolverは、飽和ベンチマークをフロンティアレベルの評価スイートと再利用可能なトレーニング信号に変換することができることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:12:16 GMT)
Time Series as Language: A Universal Tokenizer for General-Purpose Time Series Foundation Models [58.7] 連続時間列(TS)を離散トークンに変換するユニバーサルトークンライザUniTokと、これらのトークン上でNTPを介して事前訓練された基礎モデルUniTok-FMを紹介する。
UniTok-FMは、ゼロショットとプロンプトブースト予測をサポートし、トレーニング不要なインコンテキスト推論による少数ショットの生成と分類をサポートする汎用基盤モデルである。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:04:11 GMT)
DAG-MoE: From Simple Mixture to Structural Aggregation in Mixture-of-Experts [56.2] 本研究では, 標準重み付け集約を構造集約に置き換えることにより, 専門家やルータを変更することなく, 専門家合成空間を拡大することを示す。
DAG-MoEは軽量モジュールを用いて,選択した専門家の最適な集約構造を自動的に学習するスパースMoEフレームワークである。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:08:16 GMT)
An Open-Source Benchmark and Baseline for Multi-temporal Referring Segmentation [55.3] textbfMulti-temporal Referring (MTRS) は,多時間画像から言語記述の時間変化を分割することを目的とした新しいタスクである。
MTRSは、時間対応推論、言語接地、ピクセルレベルのマスク予測を共同で要求することで、従来の参照セグメンテーションと変更検出を拡張している。
MTRefSeg-R1は,既存のLVLMベースラインと比較して,強靭かつしばしば優れた性能を示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:01:10 GMT)
Dr. DocBench: A Comprehensive Benchmark for Expert-Level and Difficult Document Parsing [53.4] 我々は、エキスパートレベルの文書解析のための困難を意識したベンチマークであるDocBench博士を紹介する。
Dr. DocBenchは52のBISACドメインにまたがり、障害ベースのサンプリングによってドキュメントを選択する。
約100ページにわたる長いドキュメントから4,514ページの注釈付きページが含まれており、レイアウト、読み込み順序、階層的関係、ドメイン固有のビジュアルコンテンツなど、65kの高品質なアノテーションがある。
本分析では,文書インテリジェンスを診断・進展するための総合的なテストベッドとしてDocBench博士が注目されている。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:35:30 GMT)
A New Framework for Cybersecurity Refusals in AI Agents [52.9] 攻撃的セキュリティの文脈において、拒絶境界を確立するための最初の枠組みを提示する。
本研究では,現在のLLMエージェントがWebベースの攻撃的セキュリティシナリオにおいて,適切な拒絶境界にどのように準拠しているかを評価するために,このフレームワークを適用した。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:39:39 GMT)
PAI-Studio: Cinematic Video Background Replacement with Camera-Aware Motion [51.9] 我々は,新しい参照条件付きビデオ合成タスクであるPAI-Studioを提案する。
前景の身元を保ちながら前景の動きに合わせて動的背景を生成する。
さらに、高品質な映画やオンラインビデオから得られた30Kスケールのデータセットを構築し、このタスクをサポートする。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:45:11 GMT)
Science Earth: Towards A Planet-Scale Operating System for AI-Native Scientific Discovery [51.7] サイエンスアース(Science Earth)は、惑星規模の科学ランタイムで、あらゆる能力が他のものと接続できる。
その基盤となるEACNプロトコルは、機能を相互に発見し、タスクのオーナシップを交渉し、互換性のない明示的な標準を越えて判断することを可能にする。
2つの実行は、構造的に異なる条件下でこれを検証します。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:05:41 GMT)
Digital Twin-Assisted Adaptive Multi-Agent DRL for Intelligent Spectrum and Resource Management in Open-RAN UAV-Enabled 6G Networks [49.2] 6G無線ネットワークは、無人航空機(UAV)がカバー範囲を広げ、レジリエンスを向上し、地上ユーザのデプロイメントに信頼性の高い接続性を確保する上で重要な役割を果たす、シームレスにインテリジェントでオープンなRAN対応アーキテクチャを想定している。
高度にダイナミックなUAV支援環境でのスペクトルと資源の効率的な管理は、非線形システム相互作用、モビリティによって引き起こされるトポロジの変動、厳密なレイテンシとエネルギー制約により、依然として大きな課題である。
本稿では,デジタルツイン(DT)を利用した適応型深層強化学習(DRL)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:19:28 GMT)
Tackling the Root of Misinformation by Teaching Laypeople about Logical Fallacies via Socratic Questioning and Critical Argumentation [49.2] 我々はLFTutorを紹介した。Large Language Models を用いた知的学習システムである。
自動評価と人的評価の両面から,LFTutorがベースラインLLMよりも有意に優れていることを示す。
この研究は、AI時代の批判的思考と議論的リテラシーを促進するために、LSMと教育的な足場を組み合わせるという約束を強調している。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:24:57 GMT)
RLVR without Ineffective Samples: Group Prioritized Off-Policy Optimization for LLM Reasoning [49.0] Group Prioritized Off-Policy Optimization (POPO)は、ロールアウトオーバーヘッドを発生させることなく、効果的なトレーニングバッチを活用するフレームワークである。
POPOは2つの重要なコンポーネントで構成されている。
POPOはRL微細化を著しく加速し、ロールアウトを著しく少なくして強力な推論性能を達成する。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:06:38 GMT)
Local MixVR: Breaking the Communication-Sample Dependence in Distributed Learning [48.0] Local MixVRは分散フレームワークで、ローカルアップデートと分散推論技術を統合し、ローカルノイズを軽減する。
一般的なレシエーションでは、$MOleft(N1/4right)$では、Local MixVRは最先端のMinibatch Accelerated SGDベースラインを上回っている。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:02:15 GMT)
Statistical Inference on Gradient Flows [46.1] 経験的リスク最小化から生じる勾配流の時間一様統計的推測の理論を考案する。
本稿では,勾配流と連動して進化し,行列の逆転,再サンプリング,サンプル分割を回避するアルゴリズム対応共分散推定器を提案する。
この結果は統計的推測と最適化力学を結びつけ、勾配法における不確実性定量化のための実用的なツールを提供する。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:22:37 GMT)
SafeGen-Bench: Benchmarking Safety in Image-Conditioned Text-to-Video Generation [46.0] 本稿では,条件付きT2Vモデルの安全性を評価するためのベンチマークであるSafeGen-Benchを紹介する。
我々のベンチマークでは、時間的シーケンスと表現された行動の両方に関連するリスクに焦点を当て、悪意のあるカテゴリを10つ定義している。
SafeGen-Bench上での様々な条件付きT2Vモデルの評価を行い、その結果、現在のモデルでは悪意のあるコンテンツの生成を一貫して避けることが困難であることが示唆された。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:46:35 GMT)
TextFake: Benchmarking AI-Generated Image Detection on Text-Rich Images [45.7] TextFakeは、28言語にわたるテキストリッチAIGI検出のための20,000イメージのベンチマークである。
フェイクイメージは、実際の画像を3つの制御された次元に沿ってアノテートする4段階のパイプラインを介して合成される。
80%を超えるメソッドはなく、一部は自然画像のベンチマークから60%以上落ちている。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:42:18 GMT)
When Hard Negatives Hurt: Bridging the Generative-Discriminative Gap in Hard Negative Synthesis for Retrieval [45.6] 比較学習に生成した負を鼻で組み込むことは、検索性能を劣化させることが多いことを示す。
本分析では, 識別非依存型生成とソース依存型ショートカットの2つの複合的障害モードを明らかにした。
このギャップを埋めるために、2つの主加群からなるCausalNegを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:48:30 GMT)
$τ_0$-WM: A Unified Video-Action World Model for Robotic Manipulation [45.0] 政策学習,映像予測,行動評価を統合した統合ビデオアクション世界モデルを提案する。
このモデルは、実際のロボット遠隔操作で約27,300ドル(約2万2000円)で訓練されている。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:35:36 GMT)
TimeSage-MT: A Multi-Turn Benchmark for Evaluating Agentic Time Series Reasoning [44.7] 時系列データは、多くの現実世界のドメインに対して重要な決定を通知する。
大規模言語モデル (LLM) エージェントがマルチターン会話を通して信頼できる時系列解析を行うことができるかどうかは不明である。
TimeSage-MTは、240のタスクと2,680の対話が8つの現実世界のドメインにまたがるエージェント時系列推論のベンチマークである。
論文参考訳(メタデータ) (Sun, 31 May 2026 23:34:35 GMT)
Where to Look: Can Foundation Models Reach a Target Viewpoint Through Active Exploration? [44.1] 本稿では,TVR(Target Viewpoint Reproduction)について紹介する。これは,エージェントが所定のターゲット画像に一致するまで,エージェントが3次元環境下で視点を調整する,アクティブなタスクである。
評価分割では、最強のオープンソースおよびクローズドソースモデルはわずか7.8%と12.0%の成功しか達成していない。
我々は、専門家軌道SFT、合理的教師付きCoT-SFT、オフラインシングルターンGRPO、オンラインマルチターンGRPOをカバーする統合TVRポストトレーニングフレームワークを構築した。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:00:10 GMT)
Reasmory: 3D Reconstruction as Explicit Memory for VLMs Spatial Reasoning [44.0] VLM(Vision-Language Models)は、空間的推論能力の出現を示すが、正確な空間的理解を必要とするタスクには信頼できない。
再構成空間メモリ上での構造化プログラム実行として空間推論を定式化するフレームワークであるtextbfReasmoryを提案する。
Reasmoryは明示的な3Dメモリを構築し、セマンティックな3Dオブジェクトインスタンスで拡張し、軽量なDomain-Specific Languageを導入している。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:36:57 GMT)
PairedGTA: Generating Driving Datasets for Controlled Photometric Shift Analysis [43.3] 本研究では,完全対画像抽出のための高忠実度ゲームエンジンに基づくデータ生成フレームワークを提案する。
サンプリングされた各場所について、動的エンティティを手続き的にインスタンス化し、さまざまな悪条件下でピクセル整列画像をレンダリングする。
シナリオ駆動における生成フレームワークの利点は,セマンティックセグメンテーションモデルの体系的解析を通じて示される。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:13:19 GMT)
OneVLA: A Unified Framework for Embodied Tasks [42.8] ナビゲーションと操作は インテリジェンスの基本能力だ
OneVLAは、これらの異なるタスクを単一の凝集性フレームワークに統合する統一アーキテクチャである。
シミュレーションと実世界の両方の環境での実験は、OneVLAが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:43:23 GMT)
Worlds Within Words: Translating Culture in Ancient Chinese Texts with Multi-Agent Coordination [42.4] 大規模言語モデル(LLM)に基づく機械翻訳は、異文化間のコミュニケーションが進んでいるが、古代中国語のテキストでは、文化に負荷をかけた単語(CLW)に苦慮している。
文化的に健全なフレーズを識別し,必要に応じて簡潔な説明的知識を注入するフレームワークである textbfMACAT を提案する。
MACATは100 TCM文書のバックボーンモデルと汎用MTベースラインの両方を一貫して上回っている。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:58:03 GMT)
AlbedoEdit: Unified Instance-Level Video Editing with Albedo Guidance [42.3] ビデオ生成モデルは、ビデオシーケンスの合成において顕著な進歩を遂げた。
オブジェクト挿入、オブジェクト除去、テクスチャ編集など、細かいインスタンスレベルのビデオ編集は、目覚ましいが難しい問題として現れている。
本稿では,オブジェクト挿入,オブジェクト削除,テクスチャ編集を共同でサポートする統合ビデオ編集フレームワークであるAlbedoEditを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 17:33:14 GMT)
Don't Read Everything: A Curvature-Conditioned Query for Linear Attention [42.0] リニアアテンションは、繰り返し発生する高速な状態を維持することでソフトマックスアテンションの二次コストを低減する。
既存のリメディエーションは、ゲーティング、デルタ更新、カーネル機能マップを通じて、メモリの書き込み側に作用する。
我々は、より安価なクエリの読み取り時間縮約を構築するために、Softmaxの幾何学の特定の部分を借りる。
このメカニズムを Curvature-Conditioned Query (CCQ) と呼ぶ。
S-NIAHはトレーニングコンテキストの前後でのパープレキシティ、ゼロショットダウンストリーム精度、S-NIAH検索、4Kから20Kまでの長さのパープレキシティ、Longを改善する
論文参考訳(メタデータ) (Sun, 31 May 2026 15:25:42 GMT)
A tunable feedback-controlled magnetic trap for a magnet in free fall [41.9] 本稿では,MPIDMT (Master proportional-integral-differential magnetic trap) を提案する。
微小重力下では、システムは強磁性粒子を1.5gまでの衝撃加速に対して安定に浮遊させ、低磁場(0.4g)と純粋な自由落下の両方でその運動を解消する。
結果は、自由落下強磁性磁気学への重要なステップ、マクロなラーモアの沈み込みの長期的直接観測、そして将来の宇宙実験である。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:56:41 GMT)
AdaKernel: Learning Adaptive Kernel Parameters for Spatiotemporal Graph Neural Networks [41.8] ニューラルネットワーク内で適応的なカーネルパラメータを学習する,シンプルで効果的なアプローチを提案する。
AdaKernelは、さまざまなグラフニューラルネットワーク(GNN)を一貫して改善し、モデルに依存しない適応ベースラインを上回っている。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:07:20 GMT)
MiCU: End-to-End Smart Home Command Understanding with Large Language Model [41.6] 大規模言語モデル(LLM)は、様々な領域にわたってよく一般化されている。
LLMはそのようなタスクにおいて従来のルールベースのシステムよりも優れているが、ドメイン固有のデータが少ないため、その効果は制限されることが多い。
コマンド理解に優れたドメイン固有のLLMであるMiCUを構築している。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:40:09 GMT)
SkillRevise: Improving LLM-Authored Agent Skills via Trace-Conditioned Skill Revision [41.6] SkillReviseはエージェントスキルを反復的に洗練するために設計された実行基盤フレームワークである。
SkillReviseは、実行エビデンスからスキル欠陥を診断し、一般的なメモリから関連する修復原則を検索し、実行順に編集を適用する。
単発ベースラインを大幅に上回り、SkillsBenchにおけるベースエージェントの成功率は36.05%から61.63%に向上した。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:19:13 GMT)
WINDQuant: Weight-Informed Neural Decision-Making for Global Mixed-Precision LLM Quantization [40.7] WINDQuantは超低ビットLLM量子化のための強化学習に基づくアロケーションコントローラである。
グローバルストレージ予算の下で、ビット幅と量子化処理をきめ細かいカラムチャンクに割り当てる方法を学ぶ。
LLaMAモデルを用いた実験により、WINDQuantは超低ビット設定で競合性能を達成することが示された。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:30:47 GMT)
Breaking the Cascade: Compact Nonlinear Optical Computing with Single-Layer Encoder-Decoder Co-Localization [40.4] 非線形計算はコヒーレント照明下で1つの線形微分曲面で実現できる。
本稿では,入力依存型動的エンコーダと静的最適化型デコーダを統合した,コンパクトなエンコーダ-デコーダ共局在化アーキテクチャを提案する。
In situ Learning を用いて学習した可視光セットアップを用いて提案手法を実験的に検証した。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:46:10 GMT)
Trust Region On-Policy Distillation [39.0] On-Policy Distillation (OPD) は、大規模言語モデルの効率的なポストトレーニング手法である。
この研究は、信用割当戦略を通じて、信頼できるオン・ポリティクスのトークンレベルの監督に対処する。
実験の結果、TrOPDはSoTA OPDベースラインを一貫して上回ることがわかった。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:04:51 GMT)
Understanding LLM Behavior in Multi-Target Cross-Lingual Summarization [38.8] MTXLS (Multi-target cross-lingual text summarization) は、ソース文書を複数のターゲット言語に要約する。
24言語を対象とするMTXLSベンチマークであるMEA(Multi-target cross-lingual element-aware)を導入する。
MTXLSの性能は英語の単言語要約よりもかなり遅れていることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:12:58 GMT)
When Data Is Scarce: Scaling Sparse Language Models with Repeated Training [38.7] 限られたユニークなトークンがマルチエポックなトレーニングを必要とするデータ制約型レシエーションにおけるスパーストレーニングについて検討する。
スパーシリティは単に効率のツールではなく、データ不足下でのトレードオフのスケーリングを改善するためのメカニズムである、ということに気付きました。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:51:18 GMT)
Emergent Transfer of a Physics Foundation Model from Simulation to Laboratory Turbulence [38.5] 基礎モデルが実験室に有効に展開できるかどうかを検証した。
我々は, テーブルトップから超新星爆発まで, ユビキタスで要求される流体不安定性のRayleigh-Taylor不安定性(RTI)について検討した。
連続体力学の基礎モデルであるWalrusを3つ以上のDNS実現に基づいて微調整し、長時間のロールアウトで重要なRCI物理を回復する。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:07:38 GMT)
Mitigating Manifold Departure: Uncertainty-Aware Subspace Rectification for Trustworthy MLLM Decoding [38.1] 本稿では,表現構造を保ちながら幻覚を緩和する幾何学的無訓練復号法を提案する。
POPEとCHAIRの実験では、MGAPは事前のデコードベースラインよりも優れていた。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:02:00 GMT)
Context-aware child-directed speech detection from long-form recordings [38.1] 我々は182人の子供の多言語データセットを用いて6人の教師付きモデルを微調整し評価した。
子ども中心の録音におけるドメイン内事前学習は、成人の発話で訓練されたモデルよりもかなり優れていた。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:12:47 GMT)
Bridging Requirements and Architecture: Multi-Agent Orchestration with External Knowledge and Hierarchical Memory [37.1] 我々は,4つの専門エージェントを編成し,アーキテクチャのブループリントを属性とする知識駆動型フレームワークであるMAAD(Multi-Agent Architecture Design)を提案する。
我々はMAADがベースラインよりも完全でモジュラーでトレーサブルなアーキテクチャを生成することを示し、その専用評価エージェントは構造化された品質評価レポートを自律的に作成する。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:18:31 GMT)
SkillSmith: Co-Evolving Skills and Tools for Self-Improving Agent Systems [37.0] SkillSmithは、シナジー対応のスキルツールの共同進化フレームワークである。
スキル進化が再利用可能な機能ギャップを特定すると、ツールをラップ、編集、構成、分割、または廃止することが可能になります。
失敗の署名、因果帰属、治療を含むアンチパターンを記録し、既知の誤りを繰り返す診断と拒否提案を加速させる。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:01:19 GMT)
Distribution-free changepoint localization after sequential change detection [36.8] 本稿では,変化点に対する検出後信頼度セットを構築するための分布自由フレームワークを提案する。
これは、シーケンシャルな変更点ローカライゼーションのための最初の一般分布フリーフレームワークであり、検出後カバレッジの保証が有効なものである。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:18:41 GMT)
Thinking Economically: A Hierarchical Framework for Adaptive-Complexity Reasoning in LLMs [36.7] HABは、PPL由来のステップ比較からステップ固有のトークン予算信号を学ぶ。
GSM8KとMATH500の実験では、HABが標準的なCoTを超えるだけでなく、トークンの使用量を減らすことが示されている。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:20:00 GMT)
FlowTime: Towards Continuous Generative Watch Time Prediction via Flow-based Personalized Priors [36.5] ウォッチタイムは、ショートビデオレコメンデーターシステムにおけるユーザーエンゲージメントを最適化するための重要な指標として登場した。
時計時間予測(WTP)の現在の手法は、固有のパラダイム固有の制限に悩まされている。
本稿では,一段階生成変分オートエンコーダを用いた新しいFlowTimeを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 17:13:06 GMT)
CoSTL: Comprehensive Spatial-Temporal Representation Learning for Moment Retrieval and Highlight Detection [36.4] ビデオモーメント検索(MR)とハイライト検出(HD)は、特定のモーメントをローカライズし、所定のテキストクエリに基づいてクリップワイズ関連性を推定することを目的としたビデオ分析において重要なタスクである。
最近のアプローチでは、同様のビデオグラウンドタスクとして扱い、同じアーキテクチャを使って解決している。
これらのタスクは、画像レベルでのきめ細かい理解と、ビデオ全体にわたる高レベルの時間的理解の両方を必要とする。
既存のアプローチは主にフレームレベルの特徴を用いた時間的モデリングに重点を置いており、多くの場合、個々のフレーム内のテキストクエリに関連する豊富な視覚情報を無視している。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:36:49 GMT)
Efficient Exploration for Iterative Nash Preference Optimization [36.2] 本稿では,SFTに基づく正規化と逆ポリシー探索を組み合わせた探索的反復的NLHFアルゴリズムを提案する。
我々は,この後悔をミニマックスオラクルへのアクセスで$O(sqrtT)$に改善できることを示し,一般的な嗜好ゲーム学習における計算統計的トレードオフを明らかにした。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:11:26 GMT)
Deep Research as Rubric for Reinforcement Learning [35.6] オープンエンドのルーブリックを構築するための2段階のフレームワークを提案する。
DR-rubric-8Bはフロンティアモデルなしでブートストラップ生成をサポートする。
実験によると、DR-rubricは1K -- 3Kのトレーニングインスタンスで強力な競争性能を達成する。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:25:04 GMT)
MindClaw: Closed-Loop Embodied Mental-State Reasoning for Precision Intervention [35.6] 心の理論 (Theory of Mind, ToM) は、エージェントが他の俳優の信念、目標、意図を推論することを可能にする。
我々は、正確な介入を伴う精神状態推論を具体化するフレームワークであるMindClawを紹介する。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:09:37 GMT)
Practical and Optimal Algorithm for Linear Contextual Bandits with Rare Parameter Updates [33.5] 稀なパラメータ更新の下で線形文脈帯域について検討した。
パラメータ更新を$O(loglog T)$で行う2つの実用的なアルゴリズムを提案する。
その結果,$O(loglog T)$パラメータ更新による統計的に最適なアルゴリズムが得られた。
論文参考訳(メタデータ) (Sun, 31 May 2026 03:46:16 GMT)
Unlocking the Black Box of Latent Reasoning: An Interpretability-Guided Approach to Intervention [33.4] 本稿では,機械的解釈可能性と動作可能な制御のギャップを埋める。
まず,構造的,因果的,幾何学的プローブを用いた系統解析を行った。
次に、これらの解釈可能性に関する洞察を、トレーニングなしのデコードタイムの介入スイートに運用します。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:52:24 GMT)
The Case for Model Science: Verify, Explore, Steer, Refine [33.3] 複雑なAIモデルは今や何十億ものユーザーに役立ちますが、それらがどのように機能するかについての私たちの理解は、デプロイする能力よりもはるかに遅れています。
私たちは、AIコミュニティが、モデル分析における散在する取り組みを、モデルサイエンスと呼ばれる体系的な規律にまとめる準備が整っていると論じています。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:11:47 GMT)
SVHalluc: Benchmarking Speech-Vision Hallucination in Audio-Visual Large Language Models [32.3] 音声-視覚的大言語モデル(LLM)において、音声内容が幻覚を誘発できることを示す。
我々のベンチマークは、意味と時間という2つの重要な側面と相補的な側面から、音声ビジョンの幻覚を診断する。
我々の研究は、現在の音声-視覚的LLMの新たな基本的制限を明らかにし、音声-地上映像の理解の必要性を強調している。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:00:37 GMT)
ChartArena: Benchmarking Chart Parsing across Languages, Scenarios, and Formats [31.6] 数値チャートと図形構造の両方にまたがる8つのチャートファミリをカバーする総合ベンチマークであるChartArenaを紹介する。
データセットは、アノテーションの信頼性を保証するために、マルチステージのヒューマン検証を備えたヒューマンエージェントアノテーションパイプラインを介して構築される。
i) Gemini 3.1 Proのようなフロンティアモデルが全体としてリードしているが、最も強力なオープンソースシステムは急速にギャップを埋めている。
論文参考訳(メタデータ) (Sun, 31 May 2026 17:00:17 GMT)
Training-free image inversion for one-step diffusion models [31.4] 実画像のインバージョンと編集における重要な課題に対処する,ワンステップ拡散モデルのための新しいトレーニングフリー・インバージョンフレームワークを提案する。
まず、実画像の反転と編集を妨げる2つの重要な要因を同定する。
本稿では,正規ガウス分布と一致させるために分配ギャップを最小化する反復雑音アライメント(iterNA)と,テキストと画像のアライメントを強化する接尾辞学習(suffL)の2つの新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:10:23 GMT)
ExpWeaver: LLM Agents Learn from Experience via Latent RAG [31.3] 我々は,LLMエージェントが潜時検索拡張生成を通じて経験から学習できるフレームワークであるExpWeaverを提案する。
ExpWeaverはLLM自身の隠された状態を使用してエクスペリエンスをエンコードし、各デコードステップで遅延空間で関連するエクスペリエンスを直接取得する。
ExpWeaverは、質問応答、推論、コーディング、科学的予測、レコメンデーションを含む13のタスクで評価する。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:11:07 GMT)
Self-Trained Verification for Training- and Test-Time Self-Improvement [31.2] 自己学習検証(STV)は、自己生成エラーをキャッチするためにモデルを訓練する。
STVは、ハード数学の精度をおよそ2倍にし、科学的推論タスクの14倍に上げる。
難しい問題に対する推論の次のフロンティアは、トレーニングの方法と検証の方法にあります。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:24:16 GMT)
NeuroAlign: Hierarchical Multimodal Fusion of Dynamic and Structural Neuroimaging for MCI Analysis [31.2] 構造化多モード核融合のための階層的フレームワークである textitNeuroAlign を提案する。
NeuroAlignは、競合するMCI/SCD検出と予備的なデータセット転送性を実現する。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:01:15 GMT)
Cross-lingual Self-Consistency for Multilingual Reasoning with Language Models [30.4] 本稿では,多言語推論の強化を目的とした教師なし強化学習手法を提案する。
われわれのアプローチでは、金の回答も並列データも必要とせず、10言語にわたるMGSMの平均利得は21.7%に達する。
論文参考訳(メタデータ) (Sun, 31 May 2026 21:48:26 GMT)
Decoupled Residual Denoising Diffusion Models for Unified and Data Efficient Image-to-Image Translation [30.0] 本稿では,統合的かつデータ効率のよいイメージ・ツー・イメージ(I2I)翻訳のためのDDD(Decoupled Residual Denoising Diffusion Model)を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:38:18 GMT)
Large Language Models in Transportation Systems Management and Operations: From Text Reasoning to Multi-modal Decision Support [30.0] 大規模言語モデル(LLM)は、構造化された入力と非構造化された入力を演算子対応の意思決定サポートに統合するための新しいメカニズムを提供する。
本稿では, LLM および MM-LLM をベースとした輸送業務・サービス(供給), モビリティ・アンド・フリートサービス(需要), データ, モデリング・意思決定支援のアプリケーションについて検討する。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:15:30 GMT)
DiscourseFlip: An Oblique Discourse-Level Opinion Manipulation Attack against Black-box Retrieval-Augmented Generation [30.0] 既存のRAG攻撃は主に個々のクエリや狭いトピックローカルクエリセットに焦点を当てている。
セマンティック・クエリー・ネットワークにまたがる協調的な影響が意見シフトを引き起こす新たな脅威モデルである談話レベルの意見操作を導入する。
実験では、DiscourseFlipがコンテキスト化されたクエリネットワークをまたいで、目標とする意見シフトを一貫して誘導することを示した。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:03:47 GMT)
Brain-Atlas-Guided Generative Counterfactual Attention for Explainable Cognitive Decline Diagnosis Using Multimodal Connectomes [29.6] 本稿では,認知低下診断のためのアトラス知識誘導型生成意図誘導ネットワーク(GCAN)を提案する。
GCANは、ソース・ツー・ターゲットの偽物生成問題として診断を定式化する。
Atlas-Aware Bidirectional Transformer (AABT) は、ブレイン・アトラス制約の下で、ネットワークレベルのトークンの符号化と復号を行う。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:39:11 GMT)
PolySpeech-100: A Large-Scale Benchmark for Speech Understanding Across 100+ Languages and Dialects [29.3] PolySpeech-100は110の言語変種にわたるネイティブレベルの音声理解を評価するために設計された大規模ベンチマークである。
我々は、指示駆動合成音声によるゴールドスタンダードな人間の録音を増強する、新しいハイブリッド構築パイプラインを採用している。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:13:32 GMT)
Temporally-Aligned Evaluation for Audio-Driven Talking Head Generation [28.7] 既存の評価プロトコルは主に、生成されたビデオと参照ビデオの間の厳密な時間対応を前提としたフレーム単位のメトリクスに依存している。
我々は、Soft Dynamic Time Warpingを確立された評価パイプラインに統合する統合シーケンスレベルの再構成を導入する。
フレームワイド評価は、厳密なアライメントの下では特別なケースとみなすことができ、一方、シーケンスレベルのアライメントは、安定性の向上、タイミング差に対する感度の低下、モデリングパラダイム間のより明確な分離を提供する。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:44:42 GMT)
Genotype-Conditioned Molecular Generation via Evidence-Grounded Multi-Objective Latent Perturbation in Diffusion Models [28.6] がん遺伝子型に規定された生成モデルは、パーソナライズされた薬物発見のための有望な道を提供する。
本稿では,事前学習した遺伝子型からドラッグへの拡散モデルに対する潜在空間最適化手法を提案する。
感度, 薬物類似性, 合成性, 化学的妥当性において, 競合するベースラインよりも一貫した, 顕著な改善が見られた。
論文参考訳(メタデータ) (Sun, 31 May 2026 21:43:11 GMT)
Connecting the Dots: Benchmarking Reflective Memory in Long-Horizon Dialogue [28.4] RefMem-Benchは長軸対話における反射メモリのベンチマークである。
REMINDのカップルは、質問条件付きエビデンス検索、サリエンス認識基盤、抽象レベルの監督を行う。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:16:02 GMT)
Plausibility Is Not Prediction: Contrastive Evidence for LLM-Based Cellular Perturbation Reasoning [27.9] 摂動実験は細胞機構の理解の中心である。
それらは高価で疎いままであり、保存されていない状態に対する遺伝子発現応答の予測を動機付けている。
証拠を関連摂動から肯定的・否定的な結果に整理することで,予測を比較課題として再編成するCOREを導入する。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:13:26 GMT)
PMC-InterCPT: Rethinking Biomedical Interleaved Data for Multimodal Continued Pretraining [26.9] PMC-InterCPT (英語: PMC-InterCPT) は、字幕に加えて、図形によって指示された身体のテキストを組み込んだ、文脈的なバイオメディカルなインターリーブコーパスである。
パイプラインは欠落したキャプションを回復し,キャプションとコンテキストテキストをクリーン化し,コヒーレントなインターリーブ画像テキストサンプルを再構成する。
PMC-InterCPTは、原料プールよりもCPTトークンが少ないため、医療・一般マルチモーダル性能を効果的に向上する。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:38:30 GMT)
Trust Functions: Near-Lossless Weak-to-Strong Generalization by Learning When to Trust the Weak Teacher [26.9] 信頼できるラベルが不足している教師の指導力を利用して、力強い学生をいかに改善するかを、弱々しく一般化する。
弱いラベルごとにスカラー信頼スコアを割り当てる信頼関数を導入し、これらのスコアを用いて弱い監督をフィルタリングする。
信頼関数は、学生を訓練し、それを次の教師として再利用することで得られる利得を増幅する反復的な弱強連鎖を可能にする。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:30:42 GMT)
SIRIUS-SQL: Anchoring Multi-Candidate Text-to-SQL in Execution Feedback [26.8] テキスト・ツー・オンの複雑なスキーマは単一のパスでは信頼性が低いため、最近のシステムは複数のsql候補を生成し、エラーをフィルタする。
投票だけでは十分ではない。多候補のレシピには3つの弱点があるからだ。
3つの弱点に対処するSIRIUS-32Bを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:59:09 GMT)
3DCodeBench: Benchmarking Agentic Procedural 3D Modeling Via Code [25.9] 3DCodeBenchは、3Dモデリングソフトウェアにおいて、手続き型3D生成のための視覚言語モデル(VLM)エージェントを評価するための体系的なベンチマークである。
3DCodeArenaは、生成された3D出力に対して、ペアワイズな人間の好みに基づくランキングプラットフォームです。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:59:49 GMT)
Evaluation of ML Resource Utilization Requires Model Life Cycle Assessment [25.6] 研究者、開発者、政策立案者、ユーザが大規模システム構築の障壁を評価するためには、AIシステムのエネルギー要件と環境への影響を適切に説明する必要がある。
AI効率を評価するためのこれまでのアプローチは、単一のトレーニング実行のコストや個々の推論予測に重点を置いていた。
ライフサイクルアセスメントにより、AIシステムとその基盤となるインフラストラクチャのライフサイクル全体にわたるコストの取り込みが可能になる。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:58:12 GMT)
Reasoning4Sciences: Bridging Reasoning Language Models to All Scientific Branches [25.2] 推論言語モデル(RLM)は、科学研究の強力なツールとして急速に発展しつつある。
その影響は主に「硬い科学」分野に集中している。
科学の他の分野におけるRLMの採用の遅さや欠如は、研究生産性のギャップを拡大させている。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:27:18 GMT)
Cookie-Bench: Continuous On-screen Key Interaction Evaluation for Web Generation [24.9] textbfdatanameは11ドメイン、54リーフ、1000キューのWebDevベンチマークで、静的表現とインタラクティブアプリケーションの両方にまたがる。
textbfframenameはフラヴェルのメタ認知モニタリングに基づいており、3段階にわたる判断から証拠の蓄積を分離している。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:00:02 GMT)
HakushoBench: A Japanese Chart and Table VQA Benchmark from Governmental White Papers [24.9] 重要な障害は、現実的で多様な非英語のチャートとテーブルイメージを大規模に収集することの難しさである。
政府のホワイトペーパーを、英語以外のベンチマーク構築のためのスケーラブルなソースとして活用しています。
最初のインスタンス化として、33の政府用ホワイトペーパーから構築された挑戦的な日本のチャートとテーブルVQAベンチマークであるHakushoBenchを紹介する。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:06:47 GMT)
Revise, Don't Freeze: Sampler-Matched Training for Self-Correcting Masked Diffusion Language Models [23.5] 仮面拡散言語モデルは、各認知段階における全ての位置を再予測する。
D3IMは、追加モジュールや補助パスを使わずに、直接可視・可視のリビジョンを可能にする。
SCOPE+D3IMは、GSM8Kで+13.0(68.3%)、MATH-500で+4.8(23.6%)、HumanEvalで+15.3(29.3%)、MBPPで+10.4(30.8%)でオリジナルのLLaDA-8Bよりも改善されている。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:35:03 GMT)
Ask4VG: Risk-Aware Question Selection for Reducing Prior-Driven Answers in Medical VQA [23.0] リスク認識型質問選択のためのラベルフリーのパイロットフレームワークであるAsk4VGを提案する。
Ask4VGは、疑似視覚探索による質問誘発幻覚リスクを推定する。
Qwen2-VL-2B-インストラクタによるVQA-RADでは、プロンプトのみの書き換えは反ファクトリスクを増大させるが、予測リスクの低減は保留リスクを減少させる。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:25:53 GMT)
Property Prediction of Stacked Bilayer Materials: A Multimodal Learning Approach [23.0] 二層型2次元材料積み重ねは、新しい機能と固有の現象を持つ新しい材料を探索するために欠かせない。
本稿では,新しい機能や複数の機能を実現する異種材料間の相互作用を研究するための,新しいマルチモーダル学習手法を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:04:03 GMT)
HomeFlow: A Data Flywheel for Smart Home Agent Training with Verifiable Simulation [22.9] スマートホームエージェントのための高品質なトレーニングデータを生成するために,HomeFlowを提案する。
HomeFlowは、HomeEnvを統一的なシミュレーション環境として、HomeMakerを使用して、さまざまなホーム設定を手続き的に生成する。
HomeFlow-RL-4BとHomeFlow-RL-8Bはそれぞれ84.60%と87.03%のタスク成功率を達成した。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:26:46 GMT)
Lost in Delusion: Examining LLM Safety Under User Delusions and Distress [22.8] 持続的な会話に対する妄想に苦悩が絡み合うとき、モデルがどのように振る舞うかを示す。
これにより、認識と干渉のギャップが明らかになり、安全性の介入は4.5倍まで抑制される。
安全な配置には、妄想的フレーミングを明確なリスクシグナルとして扱う必要があると結論付けている。
論文参考訳(メタデータ) (Sun, 31 May 2026 03:12:29 GMT)
Fine-Tuning Diffusion Models for Molecular Generation via Reinforcement Learning and Fast Sampling [22.7] 既存の生成的アプローチは、サンプリング中にコストのかかるポストホック処理に依存したり、トレーニング中に慎重にキュレートされたデータセットを必要とする場合が多い。
構造制約下での拡散型分子生成に適した強化学習ファインチューニングフレームワークであるFTDiffを提案する。
FTDiffは、コストのかかるポストホック最適化や複雑なデータエンジニアリングを必要とせず、従来手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:11:48 GMT)
DeblurNVS: Geometric Latent Diffusion for Novel View Synthesis from Sparse Motion-Blurred Images [22.6] 新しいビュー合成(NVS)はコンピュータビジョンとグラフィックスの基本的な問題である。
ニューラルレイディアンスフィールド(NeRF),3次元ガウススプラッティング(3DGS)および生成ビュー合成の進歩により,その品質が大幅に向上した。
スパース・モーション・ブルード画像から直接高忠実度ノベルビューを実現するための新しいフレームワークであるDeNVSを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:04:55 GMT)
OPD+: Rethinking the Advantage Design for On-Policy Distillation [22.6] 学生と教師間のf分割に基づく汎用的な最適化フレームワークを提供する。
ベースラインKLアプローチよりも性能が向上した OPD の修正版である OPD+ を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:10:38 GMT)
CryoProt: A Protein Pretraining Framework with Cross-Box Interactions on Cryo-EM Density Maps [22.6] 我々はCryoProtを提案する。CryoProtはCleo-EM密度マップ用に設計されたタンパク質事前学習フレームワークである。
CryoProtはマルチヘッド潜在注意(MLA)に基づいたマップを導入し、ボックスレベルの表現が共有潜在空間を介して対話する。
結果は、CryoProtが既存の最先端メソッドを複数のベンチマークで一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:13:04 GMT)
TriLens: Per-Layer Logit-Lens Entropy for White-Box Hallucination Detection [22.3] 本稿では,言語モデルにおける幻覚検出用検出器TriLensを紹介する。
どの層でも、マルチヘッドの自己注意出力、フィードフォワード出力、モデル自身のロジットレンズを通して残留ストリームを読み取る。
結果として生じる3L-次元軌道は、深さと加群をまたいだ確実性がどのように形成されるかを記述する。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:48:21 GMT)
Towards Optimal Robustness in Learning-Augmented Paging [22.3] 単純なMLベースのアプローチに対する大きな利点は、予測が不正確であっても最悪のケースパフォーマンスを保証する、エンハンウンドロバスト性である。
事前の作業はランダムな設定で2H_k + O(1)$のバウンダリを達成し、最適競合比$H_k$にギャップを残している。
我々は,学習増強型ページングのための加算定数まで,最も可能性の高いロバスト性を実現する新しいフレームワークを開発した。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:49:36 GMT)
GRASP: Plan-Guided Graph Retrieval with Adaptive Fusion and Reranking on Semi-Structured Knowledge Bases [22.2] 半構造化知識ベースは、エンティティと関係性の型付きグラフにテキスト文書を埋め込む。
本稿では,3段階のSKB検索フレームワークであるGRASPについて述べる。
GRASPは3つのSTaRKベンチマークにまたがるすべてのメトリクスのテクニックの状態を著しく向上させ、平均Hit@1を62.0から73.9に引き上げている。
論文参考訳(メタデータ) (Sun, 31 May 2026 00:43:51 GMT)
Splatshot: 3D Face Avatar Generation from a Single Unconstrained Photo [22.1] SplatShot(SplatShot)は,3D表現を記述プロセス内で直接結合する,トレーニング不要のフレームワークである。
SplatShotは3Dアバターを製作し、優れたアイデンティティ保存、フォトリアリズム、マルチビュー整合性を示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 23:19:44 GMT)
Turning Back Without Forgetting: Selective Backward Refinement for Parameter-Efficient Continual Learning [22.1] 本稿では,プロンプトベース連続学習における逆転送制御を実現するリプレイフリーフレームワークを提案する。
SABERは、補完的なタスク相関基準を用いて、後方修正が有効であるかどうかを決定する。
複数の連続学習ベンチマークと、T5-Large、LLaMA、Qwenを含む様々な事前訓練されたバックボーンに対する実験は、SABERが常にポジティブな後方転送を実現することを実証している。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:08:24 GMT)
PSG-Nav: Probabilistic Scene Graph Navigation via Multiverse Decision Making [21.9] オープン語彙ナビゲーションは、意味的曖昧さやモデルエラーに起因する認識の不確実性を管理するために、エンボディエージェントを必要とする。
本稿では,認識の不確実性を考慮した3次元確率的シーングラフを構築するための確率的シーングラフナビゲーション(PSG-Nav)を提案する。
Evidential Experience Calibratorも導入し,過去の成功と失敗の記憶を相互に検証することで,オンラインの生涯適応を可能にする。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:00:19 GMT)
Inference Cost Attacks for Retrieval-Augmented Large Language Models [21.6] Retrieval-Augmented Inference Cost Attack (RA-ICA)を紹介する。
RA-ICAは、悪意のある文書を外部知識コーパスに注入することにより、RAG強化LLMシステムの計算コストを目標としている。
RA-ICAは、生成した回答の整合性を損なうことなく、90%以上の成功率でトークン消費を最大13.12倍増加させることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:11:59 GMT)
SkillAdaptor: Self-Adapting Skills for LLM Agents from Trajectories [21.5] SkillAdaptorは、トレーニング不要な段階レベルのスキル適応フレームワークで、明確な失敗の属性を持つ。
キミ-K2.5, GLM-5, GPT-5.2 を用いて WebShop, PinchBench, Claw-Eval で評価を行った。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:00:10 GMT)
DrugClaw and DrugAudit: A Primary-Source-Grounded Agent and Authority-Aware Benchmark for Drug-Information Question Answering [21.3] 本稿では,薬物・薬物移動スキルの登録を問うマルチエージェント検索システムであるD薬局について紹介する。
また、3,772イテムの権威を意識したベンチマークである DrugAudit も提供しています。
DrugAudit と MedQA (751) と PubMedQA の薬物関連サブセットにまたがって、 DrugClaw はヘッドラインテーブルのすべてのカラムでトップ-1 である。
論文参考訳(メタデータ) (Sun, 31 May 2026 20:11:05 GMT)
OmniOPD: Logit-Free On-Policy Distillation via Speculative Verification [21.1] On-Policy Distillation (OPD)は、強力な教師からの密集したトークンレベルフィードバックの下で、生徒モデルを自身の生成軌道上で訓練する。
OmniOPDはロジットフリーでチャンクレベルの監視信号を通じて両方の制限に対処する新しいフレームワークである。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:31:15 GMT)
Recognize Your Orchestrator: An Entropy Dynamics Perspective for LLM Multi-Agent Systems [21.0] マルチエージェントシステム(MAS)は、高度な問題解決能力を約束するが、中央集権的なオーケストレーショントポロジは、脆弱性の重要なポイントである。
本稿では,タスク解決と累積コンテキストローディングの競合する力によって制御されるシステムとして,オーケストレーションプロセスをモデル化する,平均フィールドエントロピーダイナミクスフレームワークを提案する。
我々のエントロピー力学モデルが経験的軌道に適合していることを示し、システムの安定性と性能崩壊を定量的に解釈可能なパラメータを提供する。
論文参考訳(メタデータ) (Sun, 31 May 2026 17:06:01 GMT)
A Finite-Calibration Regime Map for LLM Judge Panels [20.7] 低次元のスタッカーは、見積もりコストが小さいが、相互作用を見逃す。
共同テーブルキャリブレータは相互作用を表現できるが、細胞数や目に見えないパターンに課金する。
有限校正パネル選択としてインスタンス化する。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:50:27 GMT)
Expanding Spatial and Temporal Context for Robotic Imitation Learning With Scene Graphs [20.7] 本研究では,シーングラフを模倣学習における明示的で構造化された記憶機構として用いることを提案する。
オブジェクト中心の関係と時間的進化をキャプチャする動的なシーングラフを維持することにより,エージェントが関連する歴史的文脈を維持することができる。
実世界におけるモバイル操作とテーブルトップ操作のシミュレーション実験により,提案手法が政策性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:34:25 GMT)
Beyond Topical Similarity: Contrastive Evidence Retrieval with Interpretable Attention Alignment in RAG [20.0] 本稿では,主観性に基づくハードネガティブ選択を用いた最初の検索フレームワークであるContrastive Evidence Rationale Attention (CERA)を紹介する。
CERAは、三重項に基づくコントラスト学習と解釈可能なアライメントアライメントという2つの訓練目標を用いて、高密度レトリバーを微調整する。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:54:44 GMT)
Five Queries Are Enough: Query-Efficient and Surrogate-Free Membership Inference Attacks on RAG via Entailment [20.0] 本稿では,クエリ毎に得られる情報を最大化するために自然言語のエンタテインメントを利用するクエリ効率の高いMIAであるMEntA(Membership Entailment Attack)を提案する。
NFCorpus、SCIDOCS、TREC-COVID全体で、MEntAは最大0.991 AUCを5クエリで達成し、同等条件下では0.42 AUCの先行手法より優れている。
本研究は,RAGシステムにおける現実的かつ低コストなプライバシリークの実現可能性を明らかにするとともに,プライバシを意識した検索・防衛機構の緊急の必要性を明らかにするものである。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:22:17 GMT)
GLIDE: Graph-guided Leap Inference for Diffusion Estimation of Spatio-Temporal Point Processes [19.8] 時空間点過程(STPP)のための条件拡散フレームワークを提案する。
GLIDEは、歴史的イベントをマルチスケールの履歴グラフに整理し、二重ストリームアーキテクチャを通して空間トポロジを符号化する。
複数の実世界のデータセットでの実験では、GLIDEは分布の適合性と次点の予測の両方を改善し、空間側で最大のゲインが現れる。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:56:24 GMT)
From Reward-Free Representations to Preferences: Rethinking Offline Preference-Based Reinforcement Learning [19.7] 嗜好に基づく強化学習は、明確な報酬工学を避ける。
報酬のないオフラインデータから遅延後継尺度表現を学習する新しいトレーニングフレームワークを提案する。
提案手法は,オフラインPbRLベースラインよりも優先効率が高いことを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:46:53 GMT)
ActMVS: Active Scene Reconstruction with Monocular Multi-View Stereo [19.6] アクティブなシーン再構築により、ロボットやUAVは、手作業によるデータ取得を伴わずに、自律的に軌道を計画し、環境を再構築することができる。
単分子アクティブリコンストラクションのための最初のフレームワークである ActMVS を紹介する。
本フレームワークは,多視点ステレオ深度予測のためのビューファクタグラフ構築とグローバル深度最適化を統合した。
論文参考訳(メタデータ) (Sun, 31 May 2026 17:51:47 GMT)
Quantizing Intent: Cross-Domain Semantic IDs from Organic Activity for Industrial Ranking [19.4] クロスドメインユーザ Semantic ID (SID) は、ユーザのプロファイルテキストから +0.036% AUC を得る。
残留有限スカラー量子化法であるRQ-FSQは密度埋め込み型AUCとほぼ一致する。
大規模産業広告ランキングシステムでは、コールドスタートセグメント分析は、ほぼゼロの広告インタラクション履歴を持つユーザに対して、最大1.522%の上昇を示している。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:40:41 GMT)
When Parallelism Pays Off: Cohesion-Aware Task Partitioning for Multi-Agent Coding [19.0] マルチエージェント大規模言語モデル(LLM)システムは、並列化やコンテキスト分離を通じて、コーディングのような複雑なタスクを分解する方法を提供する。
我々は,マルチエージェントオーケストレーションをグラフ分割問題として定式化し,通信対計算のトレードオフを捉える。
静的解析から依存性グラフを構築し,構造的ハブファイルを分離し,コミュニティ検出を通じてグラフを分割し,依存関係対応スケジューラで分割を実行するCohesion-aware Coder(Co-Coder)を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:10:12 GMT)
Robust Asynchronous Planning via Auto-Formalization [19.0] LLMは、Plannerとしてアクションシーケンスを直接生成するか、外部ソルバをFormalizerとしてドメイン固有言語に変換することで計画できる。
これらの課題を1つの定式化の下で統一し、それぞれに対処する最初の3つのベンチマークを導入します。
フォーマルな表現の選択は、主に計画スケールを決定する。
論文参考訳(メタデータ) (Sun, 31 May 2026 03:28:42 GMT)
D-Judge: Disrupting Multi-Turn Jailbreaks using Semantics-Preserving Output Rewriting [18.8] マルチターンジェイルブレイク攻撃は、有害な目標に向けて反復的にプロンプトを洗練するために補助裁判官モデルからのフィードバックを利用する。
本稿では,D-Judgeについて紹介する。
D-Judgeは、良質なベンチマークの性能を維持しつつ、最先端のマルチターンジェイルブレイクの成功率を低下させることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:40:02 GMT)
Feature to Dynamics: Feature-space to Autoregression strategy for Zero-shot Time Series Forecasting [18.8] 時系列予測は、以前は目に見えないシリーズの将来の値を予測することを目的としている。
近年の基盤モデルでは,大規模事前学習によりドメイン内性能が向上している。
ゼロショット単変量予測制御のための機能 to ストラテジーフレームワークであるFSAを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:20:14 GMT)
Efficient RAG with Intent-Aware Retrieval and Semantics-Preserving Chunking [18.7] InSemRAGは、検索拡張世代(RAG)システムのためのフレームワークである。
IARは、クエリインテントに基づいて、検索チャネルを適応的に重み付けする動的ハイブリッド検索手法を実装している。
SPCは、意味的整合性を維持するために破損した証拠チャンクの検出と修復を行う。
提案手法は,HotPotQAではF1が2.65ポイント,FEVERでは1.5ポイントの精度向上を実現した。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:42:36 GMT)
SABER: Benchmarking Operational Safety of LLM Coding Agents in Stateful Project Workspaces [18.7] SABERは、大規模言語モデルにおける環境に配慮した運用安全性のベンチマークである。
リアルなエージェントスタイルのプロジェクトにモデルを配置し、一連のアクションの後に最終環境状態から安全性を評価する。
評価の結果, 最高性能モデルでさえ, 54%以上の有害な安全違反率を有することが明らかとなった。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:06:02 GMT)
Crayotter: Traceable Multi-Agent Workflows for Long-Form Video Editing [18.6] Crayotterは、プロンプト駆動のビデオ編集のためのオープンソースのマルチモーダルマルチエージェントシステムである。
Crayotterは、カバレッジ対応の素材準備、アーティファクトベースの編集研究、ツールグラウンドのタイムライン実行という3つのフェーズで構成されている。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:07:57 GMT)
TECCI: Tricky Edits of Collected and Curated Images [18.2] TECCIは、私たちがリリースしている画像の全く新しいセットで構成されています。これらの画像とカテゴリは、既存の手法の弱点をターゲットとして意図的にキュレートされました。
TECCIの編集命令は、Geminiによって自動生成され、ソース画像ごとに5種類の編集をカバーします。
我々は,TECCI上での5つの主要な画像編集モデルの人間による評価を行う。人間は,1)指示に従う,2)編集の最小化,3)視覚的品質の3つの次元に沿って出力を判断する。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:03:52 GMT)
Mean-Field Diffuser: Scaling Offline MARL to Thousands of Agents [18.2] 軌道分布のワッサーシュタイン空間に軌道計画を持ち上げるフレームワークであるMF-Diffuserを紹介する。
我々は、MF-Diffuserが、最適でないオフラインデータと極端なスケールで、ほとんどの設定において最高のリターンを達成することを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:55:59 GMT)
ChronosAD: Leveraging Time Series Foundation Models for Accurate Anomaly Detection [18.0] 時系列異常検出は、金融、医療、産業など、様々な分野において重要な課題である。
時系列基礎モデルを特徴抽出器として用いた,異常検出のための新しいアーキテクチャであるChronosADを紹介する。
我々のモデルは、最小限のタスク固有チューニングを必要とし、産業、医療、サイバー物理、自動車システムを含む幅広い領域にわたる堅牢な一般化を実証する。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:42:40 GMT)
FAiT: Frequency-Aware Inverted Transformer for Multivariate Time Series Forecasting [17.6] FAiTは周波数対応逆変換器で、反転注意を通して内部的にスペクトルバイアスを補正する。
DTFMは、スペクトルサブバンドのエネルギーを適応的に再校正するために、インスタンス条件の重みを合成する。
広く使用されているベンチマークの実験では、FAiTは最先端のTransformerベースと周波数強調ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:51:22 GMT)
TravelEval: A Comprehensive Benchmarking Framework for Evaluating LLM-Powered Travel Planning Agents [16.7] 本研究では,大規模言語旅行モデルを評価するための,現実的で包括的なベンチマークであるTravelEvalを紹介する。
TravelEval 1) 正確性, コンプライアンス, 時間性, 空間性, 経済性, 実用性といった面から計画を評価する新しい6次元評価フレームワーク。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:29:19 GMT)
UME: A Unified Meta-Generalization Framework for Cross-Domain ETA [16.6] 我々はtextbfETA のための textbfUnified textbfMeta 一般化フレームワーク textbfUME を提案する。
UMEは、ハイパーネットワークベースのメタ学習システムを利用する新しいメタ学習メカニズムと統合されたデュアルブランチアーキテクチャを統合している。
UMEは、オフライン実験やオンラインA/Bテストにおいて、既存のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Sun, 31 May 2026 03:28:29 GMT)
All Models are Wrong, Knowing Where is Useful: On Model Uncertainty in Reinforcement Learning [16.4] 本稿では,不確かさを対象とする確率モデルの不正確な処理を行うための枠組みを提案する。
本稿では,ハードウェアを直接学習し,安全な探索を行い,不確実性を考慮したモデルに基づく強化学習の今後の方向性について論じる。
論文参考訳(メタデータ) (Sun, 31 May 2026 17:34:22 GMT)
On the Generalization Gap in Self-Evolving Language Model Reasoning [16.2] 統合オフライン自己進化フレームワークにおける4つの代表的な戦略を解析する。
自己進化はベースモデルよりも一貫して改善されるが、過剰なトレーニング計算の後に高原が投資される。
Gemma 12Bはオラクルの教師付きトレーニングにほぼ一致するので,大規模モデルによるマルチターン批評家のリビジョンは,強力な自己進化性能に達することが判明した。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:43:19 GMT)
MENTIS: What Belief Changes Under Alignment? Measuring Multi-Scale Latent Torsion in Language Models [16.1] 我々は、アライメントによる内部再構成を測定するためのフレームワークであるMENTISを紹介する。
LITMUSでは,4組の7-8Bモデルペアに対して,アライメントによる変化は均一ではなく選択的であることが判明した。
これらの結果は, 行動レベルの評価だけでは明らかでない, 内部計算において, 深度局所化された幾何的シグネチャが構築されていることを示唆している。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:05:51 GMT)
MedGym:A Unified Continuous-Time Benchmark for Dynamic Medical Treatment Reinforcement Learning [16.0] 動的治療推奨のためのベンチマーク環境であるMedGymを紹介する。
MedGymは、持続時間フレームワークにおける経時的患者の進化をモデル化する。
物理インフォームドニューラルネットワークを用いて臨床データから医学RLベンチマークを構築する。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:36:03 GMT)
Temporal Evidence Routing with Structured Visual Evidence for TimeLogicQA [15.7] TimeLogicQAは、ビデオ質問応答システムが時間的関係について推論できるかどうかを評価する。
我々はこの課題を視覚的エビデンスルーティングパイプラインで解決し、認識を象徴的な時間的推論から分離する。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:49:04 GMT)
Dual-Route Top-K Retrieval with 1v1 VLM Reranking for the CoVR-R [15.7] 1v1 VLMのデュアルルートトップK検索について述べる。
システムは95.28 R@1、97.47 R@5、98.48 R@10、99.66 R@50に達する。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:38:57 GMT)
Adaptive Dense Evidence Refinement for Video Relational Reasoning for VRR-QA Challenge [15.7] 本稿では,適応型テスト時間計算を中心に構築された推論のみのシステムを提案する。
システムはまず、各質問に直接ビデオ言語モデルパスで答え、続いて複数の軽量ビューを使用して不安定な質問を見つける。
テストスプリットでは、最終システムは90.07平均精度と87.81マクロ平均精度を得る。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:45:06 GMT)
On the Limits of Token Reduction for Efficient Unified Vision Language Training [15.7] 統一視覚言語モデル(VLM)は、視覚理解と視覚生成を単一の自己回帰バックボーンに統合する。
VLM統合トレーニングにおけるトークン推論に基づくアクセラレーションの実現可能性と限界について検討する。
論文参考訳(メタデータ) (Sun, 31 May 2026 23:59:12 GMT)
Interaction-Limited Safe Continuous-Time RL for Dynamical Medical Treatment [15.6] 治療管理と臨床相互作用のタイミングを協調的に最適化する枠組みを提案する。
我々のキーとなる考え方は、連続時間処理問題をオプションベースのセミマルコフ決定プロセスとして再構築することである。
実験により,提案手法は安全性と治療効果の両方を向上することが示された。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:46:26 GMT)
MViewRouter: Internalizing Geometric Equivariance via Multi-view Alternating Attention for Combinatorial Routing [15.6] MViewは、幾何学的対称性を構造的帰納バイアスとして内部化する多視点フレームワークであり、ルーティング問題バリアントの非決定性を実現する。
提案手法では,D_4$対称性群上で並列処理が可能なマルチビュー交代注意(MAA)機構を導入する。
TSPとCVRPベンチマークの実験は、実世界のTSPLIBインスタンスと同様に、MViewが競合するソリューションの品質と強力なゼロショットの一般化を達成することを実証している。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:09:02 GMT)
COLLIE: Guiding Skill Discovery in Semantically Coherent Latent Space [15.2] 教師なしスキル発見(USD)は、報酬関数なしで多様な行動を学ぶことを目的としているが、多くの場合、タスク非関連または有害な行動をもたらす。
我々は,密集した教師なしデータを利用してセマンティック・コヒーレントなスキル潜在空間を構築するフレームワークであるCOLLIEを提案する。
実験の結果,COLLIEは多種多様な人間対応のスキルを習得し,有害な行動を回避し,人間からのフィードバックを最小限に抑えながら,より優れたダウンストリーム性能を実現することがわかった。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:04:35 GMT)
Decision-Focused On-Policy Learning for Contextual Linear Optimization with Partial Feedback [14.9] 決定中心学習(DFL)は、スタンドアロンの予測精度よりも下流の意思決定品質を最適化することで予測モデルを訓練する。
文脈線形最適化では、既存のDFL法は対象ベクトルの完全な観測をオフラインで行う。
条件分布モデルを更新するための2成分ハイブリッド推定器を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:58:28 GMT)
Subliminal Learning Is Steering Vector Distillation [14.8] サブリミナルラーニング(サブリミナルラーニング)とは、微調整時に教師の特質を習得する学生言語モデルである。
サブリミナル学習は1つのステアリングベクトル、すなわちモデルのアクティベーションに付加されるベクトルによって媒介されることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:22:44 GMT)
Position: Good Embodied Reward Models Need Bad Behavior Data [14.7] 我々は、最先端の3つの報酬モデルを分析し、実際の人間の評価者が罰則を課すような、体系的に過度に逆戻りする行動を見つける。
実際の悪行動データへの控えめな露出でさえ、人間の嗜好との整合性を向上し、コストのかかる偽陽性を低減できることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:56:28 GMT)
When Is 0.1% Enough? Analyzing the Combined Effects of Dimensionality Reduction and Quantization on Text Embedding Compression [14.6] 次元の縮小と量子化を組み合わせることで、どちらの方法よりもはるかに強い圧縮が可能になることを示す。
一部の設定では、組み込みはパフォーマンスのほとんど低下することなく、元のサイズの0.1%まで小さくすることができる。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:37:34 GMT)
LEGS: Fine-Tuning Teleop-Free VLAs for Humanoid Loco-manipulation in an Embodied Gaussian Splatting World [14.5] LEGS (Loco-Manipulation via Embodied Gaussian Splatting) は、手持ちのシーンキャプチャから再構築された、フォトリアリスティックな3Dガウスの背景の上にメッシュ前景(ロボット、オブジェクト、プロップ)を合成するハイブリッドシミュレータである。
ユニツリーG1のヒューマノイドロボットでは、3つのタスクにまたがって、LEGSのデータマッチングに純粋に訓練されたポリシーが、あらゆる実験で人間の遠隔操作デモで訓練されたポリシーを上回っている。
また、3DGSの背景効果を非難するメッシュのみのシミュレーションベースラインを上回り、フォトリアリスティックレンダリングが合成データ転送の鍵となることを示している。
論文参考訳(メタデータ) (Sun, 31 May 2026 21:36:02 GMT)
An LLM-based Chain-of-Response Counter-Scam System [14.5] 本稿では,初期検出から犯罪調査まで,エンド・ツー・エンドの応答を編成するLLMベースの統合型マルチエージェントフレームワークを提案する。
このシステムは、マルチエージェント緩和のためのCSRA、9つの役割整列NLPタスクからなるCSRT、および185,300件の詐欺事件と38,587件の知識エントリからなるCSRDを統合している。
実験の結果、細調整されたsLLMはすべてのCSRTタスクを10%以上上回り、詐欺特定NERの0.24 F1の改善が達成された。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:29:38 GMT)
HOLA: Holistic Multi-Modal Alignment for Open-Set 3D Recognition [14.3] オープンセットの3D認識には、珍しいカテゴリーや目に見えないカテゴリに一般化するモデルが必要である。
近年のアプローチでは、言語ビジョンの知識を3Dエンコーダに蒸留することでこの問題に対処している。
我々は,各点のクラウドに複数の画像とテキスト記述を合わせることを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:36:49 GMT)
Dive into Ambiguity: A*-Inspired Multi-Agents Commonsense Obfuscation Attack on LLM Prompts [14.2] 大規模言語モデル(LLM)は推論や知識集約的なタスクに優れるが、迅速なレベルの敵攻撃には弱いままである。
意味的に整合しているが難解なプロンプトを生成するためのフレームワークである,A* にインスパイアされた Factual Error Injection Framework を提案する。
我々は、即時書き直しが契約の繰り返しに続くことを証明し、$$が減少するにつれて意味的な崩壊につながることを証明した。
論文参考訳(メタデータ) (Sun, 31 May 2026 20:20:53 GMT)
Chameleon: Style-Content Disentangled Framework for Cross-Domain Object Compositing [14.2] クロスドメイン・コンポジションは比較的過小評価され、いまだに困難である。
既存のアプローチは、トレーニング不要のブレンディングと改善戦略に大きく依存している。
新たな2段階トレーニングベースのクロスドメイン合成フレームワークであるChameleonを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:54:26 GMT)
Diagnosing LLM Arbitration Behavior over Pre-evidence Epistemic States in RAG-based Fact-Checking [14.2] RAGベースのファクトチェックでは、LLMは、検索された証拠に対して与えられたクレームをチェックするための検証器として、ますます使われている。
我々は,LSM検証を4つのてんかん状態に階層化する診断テストベッドであるtextscPAVE(emphPrior-Aware Verifier Evaluation)を紹介する。
実験により、現実のRAGベースのファクトチェックアプリケーションにおいて、検証者選択の重要性が浮かび上がっている。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:37:56 GMT)
SegTune: Structured and Fine-Grained Control for Song Generation [14.2] SegTuneは、ユーザまたは大規模言語モデルが、曲セグメントに整列したローカル音楽記述を指定できるようにすることにより、構造化されきめ細かな制御性を実現するフレームワークである。
本稿では,LyRiCs形式で文レベルのタイムスタンプを自動生成するLLMベースの時間予測器を提案する。
実験により、SegTuneは音楽性と制御性の両方において既存のベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:01:15 GMT)
One Channel to Rule Them All: Rethinking Input Representation for Visual Place Recognition [14.0] 視覚的位置認識は、長期ロボットのローカライゼーションとSLAMの基礎となる。
現在のシステムはRGB入力に大きく依存しており、グローバルな位置認識には暗黙的に色が必要であると仮定している。
グレースケールは一般的にRGBのパフォーマンスと一致し, 外観変化が激しい場合, 性能に優れることがわかった。
論文参考訳(メタデータ) (Sun, 31 May 2026 00:30:05 GMT)
Beyond Visual Memory: Mechanistic Diagnostics of Latent Visual Reasoning [14.0] 潜在トークンを、潜在スロット、境界マーカー、フォーマットの3つのテスト可能なコンポーネントに分解する。
6つのメソッドステージ設定と4つの知覚量の多いベンチマークで、潜在スロットはビジュアルメモリアカウントの予測毎にフェールする。
利得は境界マーカー、フォーマット、そしてこの注意パターンであり、潜在スロットからではない。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:14:53 GMT)
Towards Understanding Modality Interaction in Multimodal Language Models via Partial Information Decomposition [13.9] 感覚と言語入力の独特、冗長、相乗的貢献を分離する決定レベルフレームワークとして、部分情報分解(PID)を導入する。
我々は、音声情報ゲインを分解する制御変数として言語を扱うSensory PIDを用いて、PIDをトリモーダルシステムに拡張する。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:29:36 GMT)
Trait-space Monitoring for Emergent Misalignment During Supervised Finetuning [13.8] 創発的ミスアライメント(EM)は、モデルが微調整タスクの外で危険な振る舞いをするときに発生する。
標準的な訓練信号はこのシフトを見逃しかねず、繰り返しの行動評価に依存する場合、信頼性の高い検出にコストがかかる。
微調整中に内部表現から創発的不整合を検出することができるかどうかを問う。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:28:21 GMT)
Soft-NBCE: Entropy-Weighted Chunk Fusion for Long-Context [13.2] 離散チャンク選択をソフトエントロピー重み付きチャンク融合に置き換える軽量拡張であるSoft-NBCEを提案する。
また,LORAに基づく自己蒸留システムであるConsistency Distillationを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:43:47 GMT)
Cross-Axis Feature Fusion with Joint-Wise Motion Difference Prediction for Text-Based 3D Human Motion Editing [12.3] そこでは,自然言語で記述した編集を適用しながら,原文の動きのスタイルと構造を保存することを目的とする。
私たちのゴールは、この時間的側面だけでなく、特定のジョイントが変化に責任を持つのかを理解するモデルを作ることです。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:09:42 GMT)
TukaBench: A Culturally Grounded Jailbreak Benchmark for African Languages [12.2] JailbreakBench(JBB)を拡張する7つのアフリカ言語のためのベンチマークであるTUKABENCHを紹介する。
英語とアフリカ語を組み合わせたコード変更プロンプトは、言語の影響、文化的な根拠づけ、モデル安全性への迅速な回避を分離する。
第一に、RefusedとJailbrokenと一緒にDeflectionを導入し、第二に、人間のアノテーションでアウトプットを検証する。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:14:37 GMT)
Realizing leakage elimination operator-based adiabatic speedup on a superconducting quantum processor [12.2] 漏洩除去演算子(LEO)制御は,短時間で断熱高速化を実現するための効果的な戦略を提供する。
現実的な超伝導量子プロセッサ上でのLEOに基づく断熱的高速化の実現について述べる。
本研究は, 超伝導量子プロセッサ上でのLEOベースの断熱速度向上の実現可能性を検証するとともに, ノイズを考慮した断熱動力学におけるLEOの可能性を明らかにするものである。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:16:49 GMT)
Low-Resource Safety Failures Are Action Failures, Not Representation Failures [12.2] 高リソース言語で学んだ安全性アライメントは、低リソース言語への転送が不十分である。
AdaSteerとCASTはこの障害を相互に継承する。
私たちはこれを、高リソースのゲートであるリトレーニングではなく、リカレーションによって活用します。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:19:40 GMT)
Can LLM Agents Sustain Long-Horizon Organizational Dynamics? [12.2] TaskWeaveは階層的なエージェント型フレームワークで、F-D-D-Alignサイクルを通じて計画状態を維持し、依存性を意識したトレースメモリを通じて実行を基盤とする。
実験によると、TaskWeaveは、接地されたアーティファクトを生成し、外部環境に適応しながら、コヒーレントで長期にわたる組織力学をサポートする。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:28:42 GMT)
Expected Value Alignment for Generative Reward Modeling in Formal Mathematics Verification [12.1] 本稿では,モデルのトークン分布から連続的なスコアを抽出しながら,表面出力を離散的に維持する報奨モデルである期待値アライメント(EVA)を紹介する。
リーン4の形式検証のための報酬モデルであるtextitLeibnizでEVAをインスタンス化し、ゼロショットと報酬モデリングのベースラインに対して評価します。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:06:48 GMT)
LeAP: Learnable Adaptive Permutation for Feature Selection in Heterogeneous and Sparse Recommender Systems [12.0] 機能選択のためのモデルに依存しないプラグインモジュールであるLeAPを提案する。
LeAPは非効率なランダムな置換過程を学習可能なメカニズムに変換する。
LeAPは、毎日10億件以上のリクエストがある大規模産業検索ランキングモデルにデプロイされている。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:12:55 GMT)
Sparse Autoencoders for Interpretable Emotion Control in Text-to-Speech [12.0] 我々は,大規模言語モデル (LLM) に基づく音声合成システムにおける意味的隠蔽状態の感情関連変動を分析した。
分析の結果、感情の変化は複数のスパースな潜在特徴に分散し、小さなサブセットに介入することで、解釈可能な感情制御が可能であることが判明した。
バックボーンパラメータを変更することなく、双方向の感情誘導と抑制のための特徴レベル介入フレームワークを導入する。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:39:45 GMT)
Computation-Aware Kalman Filtering with Model Selection for Neural Dynamics [11.7] 本研究では,大規模状態空間におけるトラクタブル推論を実現する,新たなトレーニング損失と最適化手法を提案する。
合成データと実データの両方に対して,本手法は深層ネットワークと競合することを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:02:13 GMT)
HASTE: Hardware-Aware Dynamic Sparse Training for Large Output Spaces [11.7] XMC (Extreme Multi-label Classification) は、数百万のラベルを持つ大出力空間上の学習モデルを含む。
グループ共有固定ファンインスパシティ(Group-shared fixed fan-in sparsity)は、セマンティック関連ラベルがスパース入力パターンを共有する半構造化出力層設計である。
グループシェアされた固定ファンイン算術は、実用的なウォールクロックゲインに還元されることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:25:47 GMT)
Flexible Control of 3D CT Generation via Text and Semantically-Defined Segmentation Prompts [11.5] 本稿では,放射線学レポートやセグメンテーションプロンプトからの入力をサポートする可制御性ボリューム画像生成のためのフレキシブルなフレームワークを提案する。
我々のアプローチでは、ユーザーは完全なアノテーションを必要とせずに、特定の解剖学または異常のセグメンテーションを提供できる。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:55:05 GMT)
GiPL: Generative augmented iterative Pseudo-Labeling for Cross-Domain Few-Shot Object Detection [11.1] GiPLは、クロスドメインFew-Shotオブジェクト検出のための効率的な2ブランチトレーニングフレームワークである。
パフォーマンスが大幅に向上した最先端のメソッドを一貫して上回る。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:12:10 GMT)
Tether-Aware Dynamic Collision Avoidance for USV-HROV Systems [11.1] 本研究では,HROVを追尾するUSVのためのテザレス動的衝突回避法を提案する。
まず、テザーと障害物容器の3次元衝突リスクを表すために、テザー安全を意識した平面ドメインを導入する。
第2に、テザータウトネスを低減しつつ、安全な回避を実現するために、テザータウトネスを考慮した速度障害物法を開発した。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:13:26 GMT)
Efficient Temporal Modeling for Mobile Sleep Staging via Lightweight Random Attention [11.0] 固定されたランダムプロジェクションに基づく軽量時間モデリングモジュールであるRandom Attention (RA)を提案する。
RAはエポックエンコーダ以外のパラメータをほとんど導入せず、効果的な時間的平滑化を実現している。
スリープ-EDF-20とスリープ-EDF-78の実験では、RAはエポックワイドベースラインを1-3%の精度で改善し、F1スコアを得た。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:12:26 GMT)
Palindromic structure of depth-efficient quantum search algorithms [10.7] グロバーのアルゴリズムはクエリの複雑さにおいて最適であるが、回路深度では必ずしも最適ではない。
特に、ネストされた局所構造は、オラクルとグローバー拡散作用素が同等の深さを持つ場合、回路全体の深さを約40%削減する。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:30:03 GMT)
AnyEdit++: Adaptive Long-Form Knowledge Editing via Bayesian Surprise [10.7] 我々はBayes-Chunkを組み込んだ構造対応フレームワークであるAnyEdit++を提案する。
我々はAnyEdit++が最先端のベースラインに比べて優れたパフォーマンスと堅牢性を実現していることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:48:43 GMT)
UniD$^3$: A Knowledge Graph-Enhanced RAG Framework for Drug-Disease Discovery and Reasoning [10.6] 大規模言語モデルと知識グラフ強化検索生成(KG-RAG)を統合した統合フレームワークUniD$3$を紹介する。
UniD$3$ Process 157,849 PubMed article with Llama 3.3-70B は、2段階戦略で知識グラフを構築する。
これらのグラフは、KG-RAGベースの構造化データセットの生成、外部ベンチマークによる評価、キュレートされたリソースとのファジィマッチング、臨床レビューをサポートする。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:36:41 GMT)
IndoBias: A Dual Track Culturally Grounded Benchmark for LLMs Bias Evaluation in Indonesian Languages [10.5] IndoBiasは,大規模言語モデルを評価するために,文化的なバイアスベンチマークとして導入する。
以上の結果から,既存のLLMはインドネシアの原型文に対して強い偏見を示すことが明らかとなった。
インドネシアでは、コモン・クローリングのテキストは、人間がレビューした記事のテキストに比べて、事前訓練中により偏見をもたらす。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:27:31 GMT)
Temporal Motif Signatures for Temporal Graph Neural Networks [10.4] 我々は、過去風の星数が4つある小さな4つのファミリーが、すでに強力な静的GNNの上に持ち上げていることを示している。
3つのスケール安定な軸に沿ってモチーフアクティビティが一貫して構成されていることが分かりました。
時間的ワイスフェイラー・リーマン分析は、固定された時間的-WL階層の第一レベルに対する増大を配置し、モチーフの特徴が区別される候補-アンコールペアを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:32:32 GMT)
CAREAgent: Clinical Agent with Structured Reasoning and Tool-Integrated for Order Generation [10.3] 既存のエージェントは、主に粗粒度の決定に焦点を合わせ、臨床命令に必要な細粒度で実行可能な情報を見落としている。
このギャップに対処するため,臨床オーダー生成のためのエージェントであるCAREAgentを提案する。
トレーニングを支援するために,2段階のエージェント推論データ構築手法を提案する。
構築されたデータに基づいて、モデルはまず教師付き微調整によって訓練され、基本的な推論形式と医療知識を取得する。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:31:36 GMT)
Child-directed speech facilitates production, not comprehension, in BabyLMs [10.1] 本稿では,言語習得の用法に基づく理論に触発された新世代評価を提案する。
我々は,CDS,BabyLMコーパス,Webcrawlデータ(FineWeb-edu)を用いて学習したLlamaモデルを,包括的ベンチマークと新しいフレームワーク上で比較した。
この結果から,モデルの理解能力と生産能力との明確な解離が明らかとなった。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:27:58 GMT)
S2M-Trek: From Single to Multi-Sphere Transport via Per-Frame Deep Sets on a Wheel-Legged Robot [9.9] 車輪脚四重組の裏面に同時に搬送される複数球面への1つの自由回転球面からの動的ロコマニピュレーションのスケーリング問題について検討した。
複数の同一自由回転球面は、永続的な恒等性を持たない無順序集合を形成する。
時間的読み出しの前に各履歴フレーム内で置換不変プーリングを行うテキストPer-Frame Deep Sets (PFDS)を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:35:38 GMT)
Evi-Steer: Learning to Steer Biomedical Vision-Language Models through Efficient and Generalizable Evidential Tuning [9.7] Evi-SteerはBiomedCLIPのための明らかなクロスモーダルな低次元ステアリングフレームワークである。
完全なモデルパラメータの0.11%を更新しながら、不確実性に配慮したパラメータ効率の微調整を可能にする。
Evi-Steerは、数ショットの学習とドメインシフト設定の下で、最先端のメソッドを一貫して上回る。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:05:46 GMT)
Agent Skills Should Go Beyond Text: The Case for Visual Skills [9.6] 再利用可能なスキルは、エージェント能力を拡張するための重要なメカニズムである。
既存のスキル学習手法の多くは、再利用可能な体験をテキストのみの資産として保存する。
このテキストのみのパラダイムは、視覚中心のタスクに根本的なボトルネックをもたらすと我々は主張する。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:22:43 GMT)
Schema-Agnostic Knowledge Graph Construction via Hybrid Ontology Discovery for Cyber Threat Intelligence [9.6] サイバー脅威インテリジェンス(CTI)の報告は、現代の攻撃作戦で観察された技術や手順を捉えるための重要な資源となっている。
従来のCTIプラットフォームは、STIXのような固定スキーマを通じて、このインテリジェンスを独立したインジケータに還元する。
オントロジーに基づく表現は、構造化脅威分析に必要な関係を保存する。
オントロジーに整合したCTI抽出のための既存のアプローチは3つの課題に直面している。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:56:37 GMT)
Threading Optimization for Vision-Language-Action Model Inference in Low-Cost Smart Agricultural Manipulation [9.4] これらのボトルネックに対処するためにRTAC(Real-Time Action Chunking)が提案されている。
本稿では,低コストなロボット操作システムに適したRTACのシステムレベル実装について述べる。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:49:50 GMT)
Deft Scheduling of Dynamic Cloud Workflows with Varying Deadlines via Mixture-of-Experts [9.4] 我々は、革新的なDRLポリシーアーキテクチャであるtextbfDEFT (textbfDeadline-ptextbfErceptive Mixture-otextbfF-Expertextbfts)を紹介する。
最も適切な専門家を通じて意思決定を適応的にルーティングすることで、DEFTは幅広い期限要件を満たすことができる。
動的クラウドワークフローベンチマークの実験は、DEFTが実行コストと期限違反を大幅に削減することを示した。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:10:37 GMT)
Event-Based Vision in Space: Applications, Trends, and Future Directions [9.4] イベントベースのセンサーは、ニューロモルフィックカメラとしても知られ、バイオインスパイアされた非同期アプローチを提供する。
マイクロ秒の時間分解能、非常に高いダイナミックレンジ、および例外的なエネルギー効率を提供する。
本稿では、宇宙領域におけるイベントベースのビジョンにおける最先端の総合的なレビューを紹介する。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:04:37 GMT)
Knowledge-Intensive Video Generation [9.3] 我々は知識集約型ビデオ生成(KIVI)を導入し、モデルが短い情報探索プロンプトからビデオを生成する。
本研究では,1080プロンプトのベンチマークであるKIVI-Benchを構築し,現実性と有用性を示す自動メトリクスを提案する。
7つの最先端のビデオ生成モデルの実験では、現在のシステムは人間のパフォーマンスに遅れを取っている。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:11:07 GMT)
ANDES: Agent Native Data Evolving Synthesis Tool for Autonomous Instruction Alignment [9.3] Andesは、データ生成をプラグアンドプレイのEmphエージェントスキルとして再定義するフレームワークである。
We demonstrate that Andes improves automated alignment, secure-of-the-art performance on PostTrainBench。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:03:50 GMT)
Institutional Trust and the Domestic AI Advantage: Evidence from DeepSeek and ChatGPT Users in China [9.1] 生成的人工知能に対する公的な信頼は、国家の状況にまたがる様々なパターンを示す。
この研究は、AIへの信頼は単にパフォーマンスに対する技術的反応ではなく、制度的屈折の産物であると主張している。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:25:46 GMT)
An Enigma of Artificial Reason: Investigating the Production-Evaluation Gap in Large Reasoning Models [9.0] 大規模推論モデル(LRM)は、複雑な問題を解くための長い推論の連鎖を創出するために訓練されていることを示す。
本稿では,有意な推論欠陥を伴う数学問題と解法について,Valid-Answer-Invalid-Reasoningデータセットを用いて検討する。
人類と異なり、これらの問題を解くよりも格付けするとわずか6%の差しかみられず、LRMの生産・評価の差は相当に大きい。
論文参考訳(メタデータ) (Sun, 31 May 2026 21:46:52 GMT)
Beyond Task Success: Behavioral and Representational Diagnostics for WAM and VLA [8.6] VLA(Vision- Language-action)ポリシーとWAM(World-Action Models)は、ロボット操作においてますます重要なパラダイムである。
本稿では,WAMが将来予測を単に追加するか,ロボットの動作や内部表現を制御可能な方法で変更するかを問う。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:35:12 GMT)
Crazyflow: An Accurate, GPU-Accelerated, Differentiable Drone Simulator in JAX [8.6] Crazyflowは、空中ロボットアルゴリズム開発の限界を押し上げるために設計されたシミュレータである。
1台のドローンで1桁以上のスピードを実現し、4000台のドローンで何千もの群れをシミュレートすることができる。
Crazyflowは精度、速度、差別化性を同時に推し進めることで、合成データ生成のためのオープンソースのリソースとして機能する。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:38:46 GMT)
Med-HEAL: Analyzing and Mitigating Hallucinations in Medical LLMs with Hallucination-Aware In-Context Learning [8.3] 医学的大言語モデルにおける幻覚は臨床決定支援に重大なリスクをもたらす。
医療用LLMの幻覚を系統的に同定し,分析し,緩和するためのフレームワークであるMed-HEALを紹介する。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:43:42 GMT)
ImagineUAV: Aerial Vision-Language Navigation via World-Action Modeling and Kinodynamic Planning [8.3] 無人機のための視覚言語ナビゲーション(VLN)は、部分観測性の下で自由形式の指示を6-DoF飛行に接地することを要求する。
ケースド・ワールド・アクション・モデリングを利用した想像力駆動型フレームワークであるImagineUAVを提案する。
想像上のUAVは、VLNとVLAのベースラインをベンチマークや現実世界の飛行で上回っている。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:39:44 GMT)
Hybrid Verified Decoding: Learning to Allocate Verification in Speculative Decoding [8.3] Hybrid Verified Decodingは、検証前にキャッシュドラフトが受け入れられた長さを予測する。
分析の結果,キャッシュの素早い生成方法,高利得キャッシュのドラフトがドラフトスペースのごく一部に集中する方法,およびペイオフ誘導選択がドラフト選択の逐次的削除を減らしたことを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:22:40 GMT)
Optimal-Point Variance Reduction For Bayesian Optimization With Regret Guarantee [8.2] 最適点分散還元(OVR)と呼ばれる1ステップのルックアヘッドBO法では,後部サンプリングとモンテカルロ近似しか必要としない。
正規化されたOVRは、探索を促進するためにわずかな修正を加えて、ベイズが期待する単純な後悔の上界を消滅させることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:16:21 GMT)
A Multiscale Network with Supervised Contrastive Learning for Real-Time Facial Emotion Recognition [8.1] 感情状態を表す表情の変化は離散的ではなく、むしろ連続的である。
表情の変化を検出する能力を持つシステムは、個人の感情状態を決定することに大きな影響を与える可能性がある。
本稿では,表情の変化をモデル化し,リアルタイム映像の感情変化を検出するためのディープラーニングシステムを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:25:49 GMT)
Revisiting Neural Processes via Fourier Transform and Volterra Series [8.1] 神経過程 (NPs) は確率的機能モデルの一種である。
NPは2つの制限に直面している: (i) 非線型なジェネリックコンポーネントをスタックし、誘導関数クラスを隠蔽し、解釈可能性を制限する。
本稿では,SFConvブロックを非線形にスタックするSFConvCNPと,Volterraの定式化を統合するSFVConvCNPという2つの条件付きNPを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:27:48 GMT)
Early Diagnosis of Wasted Computation in Multi-Agent LLM Systems via Failure-Aware Observability [8.0] 本稿では,マルチエージェントLSMトレースにおける無駄な計算を診断するための,故障を考慮した可観測性フレームワークを提案する。
このフレームワークを3エージェントの質問応答システムでインスタンス化し、165のGAIA検証トレース上で同一の実行上限で評価する。
論文参考訳(メタデータ) (Sun, 31 May 2026 17:50:11 GMT)
Learning-based Directed Graph Abstraction of Combinatorial Spaces for Order-Preserving Search in Mixed-Combinatorial Nonlinear Optimization [7.9] 混合組合せ非線形プログラミング(MCNLP)の問題は、多くのエンジニアリング設計と計画アプリケーションで発生する。
本稿では,グラフニューラルネットワーク(GNN)を用いた空間上の探索経路学習を目的としたロボット計画領域の開発について述べる。
より具体的には、結合の非直交完全連結グラフから写像を学習することにより、空間の第一種構造的抽象化について述べる。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:54:34 GMT)
Target Updates May Stabilize Linear Q-Learning: Periodic and Soft Dynamics [7.8] 本稿では,線形関数近似を用いたQ学習機構の厳密かつ正確に解析する(線形Q学習)。
線形Q-ラーニングは一般に収束しないが、明示的なスペクトルおよびステップサイズ条件下では、周期的ハードターゲット更新とソフトターゲット更新が正確なQ-ベルマン解の収束を保証することを証明している。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:46:20 GMT)
Efficient Approximation for Encoder--Decoder Neural Operators via Variation Spaces [7.8] エンコーダ-デコーダニューラルネットワークを用いた演算子学習について検討する。
非線形作用素に対する無限次元構造クラスとして変分空間を導入する。
この空間の作用素に対しては、Bochner $Lq$ normにおけるエンコーダ-デコーダ2層ネットワークの近似境界を確立する。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:53:17 GMT)
BatteryMFormer: Multi-level Learning for Battery Degradation Trajectory Forecasting [7.5] 電池劣化データは多層構造を示す。
電圧電流プロファイルの劣化に伴う変動は、しばしば電荷間隔の特定の状態に局所化される。
既存のアプローチは、しばしばこれらの特性を明示的にモデル化することに失敗する。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:33:35 GMT)
AGORA: Can Deliberation and Governance Gates Absorb Participation Bias in Transit Planning? [7.4] 現在のプラクティスでは、自己選択された参加者から一方向のコメントを収集し、参加者の混在をコントロールできない結果の変化の源として残している。
本稿では,ネットワーク,需要,問題解決を行うフレームワークであるAGORAを紹介する。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:00:37 GMT)
TIMEGATE: Sustainable Time-Boxed Promotion Gates for Continual ML Adaptation Under Resource Constraints [7.3] 予算時間、ラベル付け、トレーニング、評価による適応を管理する政策層であるTIMEGATEを紹介する。
i)アダルト表の2.3倍のラベル付け,(ii)SST-2のLLaMA-3.1-8B + QLoRAへの変換,(iii)Mは情報であり,28細胞感度はMが狭い閾値で0.81に低下することを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 20:02:54 GMT)
How Proposal Novelty, Topical Diversity, and Theory-Practice Balance Shape Scholarly Outcomes in Funded Education Research [7.2] この研究は、1990年から2020年までの8,715件のNSF教育賞と、主任研究員による84,519件の出版を関連づけている。
提案された新奇性は、ポストアワードの結果と限定的かつ不均一な関連を示す。
理論的および実践的な目的を統合するバランスのとれた提案は、最も好ましい全体プロファイルを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:01:21 GMT)
Lodestar: An Online-Learning LLM Inference Router [6.8] 大規模言語モデル(LLM)推論タスクは、ユーザの知覚するレイテンシに不可欠である。
Lodstarは、分散GPUクラスタのための新しい学習ベースの要求ルーティングシステムである。
Lodstarは平均1.41倍のTTFT、平均1.47倍のP99 TTFTを達成している。
論文参考訳(メタデータ) (Sun, 31 May 2026 01:31:02 GMT)
Linear Strategic Classification with Endogenous Improvements [6.8] 本研究では,戦略応答が結果関連特徴の真の変化を誘発する改良型について検討する。
エージェントは、配置後特徴ベクトルを戦略的に選択し、その後、安定した条件付き結果法に従ってラベルを生成する。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:22:30 GMT)
Distilling Neuro-Symbolic Programs into 3D Multi-modal LLMs [6.7] APEIRIAはニューロシンボリックな3次元MLLMであり、シンボリック推論パターンを自然言語の連鎖でMLLMに蒸留することで2つのパラダイムを橋渡しする。
APEIRIAは従来のNS3D手法を超え、3次元空間推論データセット上で最先端の3DMLLMと一致することを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:04:31 GMT)
HypothesisMed: Inference-Time Answer Fusion and Structured Hypothesis-Space Reporting for Biomedical Question Answering [6.4] 本稿では,バイオメディカル質問応答のための推論時間信頼性パイプラインであるPhythesisMedを提案する。
直接、チェーン・オブ・シント、仮説Med-v3プロンプトと解答融合を組み合わせたものだ。
MedQA, MedMCQA, PubMedQAにおいて, データセット1,000例を用いてQwen2.5-7B, Phi-4-mini, DeepSeek-R1-32B, BioMistral-7Bを評価した。
論文参考訳(メタデータ) (Sun, 31 May 2026 03:02:05 GMT)
FlowSDR: Sufficient Dimension Reduction via Conditional Normalizing Flows [6.1] FlowSDRは、射影と条件密度を共同で学習する可能性に基づくフレームワークである。
ニューラル・ガウス的SDR, ヘテロセダスティックな条件付きガウス的モデルを導入し, 平均と分散は共有ニューラル・ネットワーク関数によってパラメータ化される。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:54:56 GMT)
Silent Failures in Federated Personalization of Foundation Models [6.1] 『沈黙の失敗』には、増幅バイアス、公平さの崩壊、アライメントの侵食が含まれる。
基礎モデルパーソナライゼーション,データセットシフト,コアフェデレーション制約の相互作用から生じる6つのサイレント障害モードの分類を導入する。
本稿では,プライバシ保護行動評価に関する研究課題をまとめ,サイレント障害が信頼に値するフェデレーション人工知能の標準診断カテゴリとなることを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 01:33:11 GMT)
CARVE: Certified Affordable Repair of Vetoed Maneuvers via Envelopes for Interactive Driving [6.0] インタラクティブな運転は、ルール対応の自動運転スタックで見逃しやすい障害モードを公開する。
我々は,エゴ所有およびエージェント所有の戦術演算子の有限格子上の予測自由証明層であるCARVEを紹介する。
我々は,証明の健全性,構造的右翼の敬意,厳密な有限格子最小性,フォールバックの緊急性,および非難-一貫性条件を証明した。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:49:01 GMT)
Theoretical Analysis of Engression and Reverse Markov Engression [5.9] 本稿では,学習された条件分布と対象条件分布のエネルギー距離を直接制御することにより,エングレスに対する漸近収束境界を確立する。
逆マルコフフレームワークでは、逆ステップ間のエラー伝搬の厳密な解析を可能にするエネルギー距離に基づく連鎖則をさらに発展させる。
我々の分析は、一般のハルダー類に対する古典的ミニマックス率と比較して、対数的因子にほぼ最適であるような超リスク境界を導出する。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:37:44 GMT)
GPTQ-intrinsic LoRA: A Near-optimal Algorithm for Low-precision Quantization with Low-rank Adaptation [5.9] 一般的な治療法は、量子化された重みを低ランクの補正で増大させ、$Wapprox Q+LR$という形の近似を与えることである。
低ランク補正を直接GPTQ型量子化パスに組み込む訓練不要アルゴリズムであるGPTQ-inrinsic LoRAを提案する。
Qwen3言語モデルとDeiTビジョントランスフォーマーの実験により、GPTQ固有のLoRAはGPTQとGPTQよりも改善され、低ランクの補償が得られた。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:17:39 GMT)
MURMUR: An Efficient Inference System for Long-Form ASR [5.7] 長文自動音声認識は高精度と低レイテンシの両方を必要とする。
チャンクベースのパイプラインは、低レイテンシで並列ウィンドウでオーディオを処理するが、コンテキスト間のコンテキストは失われる。
長いコンテキストモデルは、1回のパスですべてを解決し、精度は向上するが、桁違いに遅い。
本稿では,このトレードオフを克服する2段階の推論システムであるMurmurを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:54:57 GMT)
The Ringelmann Effect in Multi-Agent LLM Systems: A Scaling Law for Effective Team Size [5.5] 我々は,高密度ピアの影響がサブリニアからハードサイリングへと解答レベル体制を崩壊させることを示した。
30の高密度な議論剤はMMLU-Hardのそれ以上の答えの多様性をもたらす。
自由形式数学において、高密度なピアの影響は、解準線形からハードシーリングへの解準位体制を崩壊させる。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:19:54 GMT)
STARFISH: faST Accuracy Recovery in pruned networks From Internal State Healing [5.4] 本稿では,どの切断ネットワークの精度も効率的に回復できる新しい治癒法STARFISHを提案する。
重量の50%を除去する一般的な場合、STARFISHヒーリングは、ViTベースのネットワーク上での最先端手法に比べて、回復した精度を最大22%向上させる。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:59:08 GMT)
A Communication-Centric 6G-LLM Architecture for Scalable Tactical Autonomous Defense Vehicle Networks [5.4] 本稿では,TADVN(Tactical Self Defense Vehicle Networks)のための通信中心型階層アーキテクチャを提案する。
このフレームワークは、調整効率の向上、通信オーバヘッドの低減、およびフリートスケールの運用の増加によるレイテンシの回復性の向上を目的としている。
競合するネットワーク条件下での5~30台の車両におけるモンテカルロシミュレーションによる通信・協調性能の評価を行った。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:00:14 GMT)
pcbGPT: Automatic PCB Schematic Synthesis from Natural Language Requirements [5.3] 自然言語仕様から編集可能なKiCadスキーマを生成するシステムであるpcbGPTを提案する。
参照実装,要求コンポーネント,インターフェース制約を備えた20個の組込みタスクに対して,本システムの評価を行った。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:07:50 GMT)
Beyond the Frontier: Stochastic Backtracking for Efficient Test-Time Scaling [4.6] テストタイムスケーリングは、ソリューショントラジェクトリを探索するために追加の計算を使用することで、言語モデルの推論を改善する。
鍵となる課題は、推論中に生成されたトークンの総数を最小化しながら、精度を最大化することである。
我々は、過去のプレフィックスの永続的なプールにバックトラックを導入し、テスト時間計算が以前生成された状態を再考できるようにする。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:24:41 GMT)
Fundamental Limitation in Explaining AI [4.4] 我々は、AIの説明において、AIとその説明が次の4つの条件を同時に満たすことができないことを明確にする。
四重項は、AIガバナンスは、AI説明の忠実さは常に不完全である、という前提で設計されるべきであることを示している。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:58:29 GMT)
Consistent and Distinctive: LLM Benchmark Efficiency via Maximum Independent Set Prompt Selection on Similarity Graphs [4.4] 本稿では,大規模言語モデル(LLM)を総合ベンチマークで評価するためのグラフベースのプロンプト選択フレームワークを提案する。
6つの埋め込みモデル,3つの距離測度,6%のしきい値,および4つのベンチマーク(GPQA, IFEval, MMLU-Pro, Omni-MATH)にまたがる4つのMISソルバを評価した。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:45:12 GMT)
FundaPod: A Multi-Persona Agent Pod Platform with Knowledge Graph Memory for AI-Assisted Fundamental Investment Research [4.3] 我々はAI支援基礎投資研究のための多人数エージェントプラットフォームであるFundaPodを紹介する。
我々は,基本研究は,貿易信号生成とは質的に異なる人間中心の意思決定支援タスクであると主張する。
FundaPodでは、価値投資家やマクロストラテジストといった異なるペルソナを持つAIエージェントが、共有契約の下で独立して研究を行う。
論文参考訳(メタデータ) (Sun, 31 May 2026 21:36:47 GMT)
On the Evaluation of Spiking Neural Network Configurations for Network Intrusion Detection [4.3] スパイキングニューラルネットワーク(SNN)は、エッジおよびニューロモルフィックデプロイメントに適した軽量な代替手段である。
スパイク符号化方式は, ニューロンモデルよりも検出精度が高い。
これらの結果から,従来の侵入検出手法の代替手段としてのSNNの可能性が浮かび上がっている。
論文参考訳(メタデータ) (Sun, 31 May 2026 20:25:15 GMT)
Can AI Review Improve Paper Drafting? An Empirical Study on 20 Computer Architecture Submissions [4.0] 我々は、AIレビューが人間のレビューとどのように一致しているかを明らかにするために、さまざまなレベルの提出系統を持つ20のコンピュータアーキテクチャー論文を調査する。
このケーススタディを実行するために、Web UI統合ツールであるemphAI-Paper-Reviewを構築し、ドラフトペーパーの構造化AIレビューを生成する。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:05:26 GMT)
DiffuSent: Towards a Unified Diffusion Framework for Aspect-Based Sentiment Analysis [4.0] 非自己回帰拡散フレームワークであるDiffuSentは、すべてのABSAサブタスクを境界分解拡散過程として定式化する。
また,Diffusentは多語三重項に対して有意な増加を示し,平均値2.48 F1を達成し,複数の感情三重項を含む文の頑健な抽出精度を維持した。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:15:03 GMT)
Ground-state phase diagram of Rydberg atoms in a triangular-prism array [4.0] 三角プリズム光ツイーザアレイにおけるライドバーグ原子の基底状態相図について検討した。
本システムは,翻訳および脚交換対称性の自発的な破壊を伴う複数の密度波位相を実現する。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:24:45 GMT)
Make Your VLA More Robust Without More Data By Interleaving Motion Planning [3.9] 本稿では、モデルに基づくモーションプランニングをVisionLanguageAction(VLA)モデルと統合し、さらなるトレーニングをすることなくロバスト性を改善するフレームワークを提案する。
BEHAVIOR-1Kベンチマークに対する我々のアプローチを評価し,トップエンド対エンドのVLAベースライン上でのタスク進捗を113%改善したことを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 03:52:53 GMT)
Non-Vacuous Certification of Transport MCMC via Oscillation-Controlled Normalizing Flows [3.9] 運輸MCMCは、プレコンディションのメトロポリス-ハスティングの提案に正規化の流れを訓練する。
我々は、このようなサンプルに対して、初めて非空白で厳密なスペクトルギャップを定めている。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:46:48 GMT)
Feature Alignment Determines Fusion Strategy: A Comparative Study of Cross-Attention and Concatenation in Multimodal Learning [3.8] データスケールのみでなく、機能アライメントの品質が、融合戦略が優れている主要な決定要因であることを実証する。
視覚言語による事前学習目標によって特徴が事前整列された場合、連結は4.1~5.1ポイントの相互注意よりも優れることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:55:17 GMT)
Learning from Saturated Data: Signals Beyond Correctness for LLM Training [3.8] 完全な経験的精度で解いた質問が下流の性能向上に役立てられるかどうかを考察する。
そのために、より微細な品質信号の2つのソースにバイナリの正しさを置き換える。
これらの信号を複数のトレーニングアルゴリズムに組み込んで,Qwen3-1.7B-Base上で評価する。
論文参考訳(メタデータ) (Sun, 31 May 2026 20:15:12 GMT)
Differentially Private Datastore Generation for Retrieval-Augmented Inference [3.8] 差別的プライバシ(DP)は、敵対的分析の下でも個人による貢献が識別不能であることを保証する正式な保証である。
差分プライベートなデータストアの作成とリリースを可能にするために,ハッシュベースの確率生成フレームワークを導入する。
我々の方法は、セキュアなキー、バリューデータストアの作成とリリースを必要とするパイプラインに適用できる。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:18:43 GMT)
Honest Lying: Understanding Memory Confabulation in Reflexive Agents [3.6] 反射型エージェントは自己生成反射を記憶として頼り、エージェントが自身の障害を正確に診断できると暗黙的に仮定する。
ALFWorldとHumanEvalの間では、エージェントはタスクの自信はあるが誤った解釈を格納し、環境が毎回正しいタスクにリセットされたとしても、試行を通してそれらに取り組み続ける。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:31:18 GMT)
Most Subradiant Bound Photon Pairs from Chirality-Mediated Dispersion Softening [3.6] 1次元導波路に冷間結合した2レベル原子配列のサブラジアントバウンド状態(BSs)について検討する。
我々は、キラル相互作用がBSを広い範囲で最も放射能の低い2励起状態へと導くことを実証した。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:30:35 GMT)
Agentic Clustering: Controllable Text Taxonomies via Multi-Agent Refinement [3.5] 最近のテキストクラスタリング手法では、大きな言語モデルを使用して、コーパスからクラスタ分類を提案し、各テキストをそれに割り当てる。
オーケストレータLLMが各ステップで発見プロセスの状態を検査し、少数の特殊エージェントの1つをディスパッチするエージェント代替案を提案する。
7つの公開テキストクラスタリングベンチマークにおいて、この手法は最先端のパフォーマンスを達成し、ALIにおいて最強のLCMベースラインを最大32%上回った。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:18:18 GMT)
Test-Time Training for Zero-Resource Dense Retrieval Reranking [3.5] 既存のアプローチは基本的なジレンマに直面している。クロスエンコーダは、強いリランク品質を提供するが、高価な教師付きトレーニングと高いレイテンシを必要とする。
本稿では,DART(Dense Adaptive Re rank at Test-time)を提案する。
6つのBEIRベンチマークで、DARTはデータベース毎の相対的なNDCG@10ゲイン(+2.1%)を高密度検索ベースラインで達成し、クエリ毎のレイテンシは10ミリ秒以下である。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:26:40 GMT)
ResNet-34 with Lightweight Decoder for Accurate and Efficient Segmentation of Fetal Brain MRI [3.4] 本研究では,ResNet-34エンコーダと軽量デコーダを組み合わせた新しいディープラーニングモデルを提案する。
トレーニングされ、FeTAデータセット上で5倍のクロスバリデーションを使用して検証される。
平均精度は97.37%で、Dice similarity Coefficient(DSC)は90.33%、Intersection over Union(IoU)は86.93%、Precisionは90.83%である。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:25:37 GMT)
Toward Efficient End-to-End Quantum Elliptic PDE Solvers: a Multilevel Correction Algorithm for Direct Observable Estimation [3.4] 量子線形系アルゴリズム(QLSA)の中央テストケースは、有限要素の離散化後の楕円型PDEである。
本稿では,マルチレベルモンテカルロの分散還元機構を動機とした,この読み出し問題に対するマルチレベルフレームワークを提案する。
我々のアルゴリズムは、リッツ補足写像を用いて修正グリーン作用素のシュル補足分解に基づく。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:47:58 GMT)
Explainable deep reinforcement learning reveals energy-efficient control strategies for turbulent drag reduction [3.3] 本稿では,マルチエージェント深部強化学習(MARL)とeXplainable Deep Learning(XDL)を組み合わせることで,壁境界乱流の抵抗を低減する手法を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:02:37 GMT)
Spiking and Event-driven Neuromorphic Mamba Models for Efficient Speech Recognition [3.3] 本稿では,音声認識システムの活性化空間性を改善するために,スパイキングと事象駆動型ニューロモルフィックニューラルネットワークについて検討する。
本稿では,FATReLUをアクティベートしたイベント駆動型SpeechMambaを導入し,LibriSpeechの精度1%未満で60%以上のアクティベーション間隔を実現した。
また、SNNよりも30%少ないパラメータを使用しながら、70%以上のスパシティを実現するスポーキング型SpeechMambaを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:15:08 GMT)
FVSpec: Real-World Property-Based Tests as Lean Challenges [3.2] 本稿では,実世界のソフトウェア検証タスクにおいて,AIモデルとエージェントを評価するためのベンチマークを示す。
まず、現実世界のPythonリポジトリから11,039のプロパティベースのテスト(PBT)を取り除き、それから自動的に2,772を9,415のLean 4仕様に翻訳します。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:51:27 GMT)
AI From the Margins (AIM): Rethinking Participatory AI Design Through the Lived Experience of Minoritized Communities [3.2] 本稿では,小規模化コミュニティの生活経験が引き起こされる条件を明確にする方法論的スタンスであるAIM(AI From the Margins)を提案する。
AIMは固定されたプロトコルではなく、異なる技術で実行可能な事前条件のセットを明示している。
AIMをオランダの医療状況に適用し,13人の女性,非2色の人々,5人の市町村政策労働者を対象に8回のセッションを行った。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:25:28 GMT)
SEArch: Optimistic Policy Selection Between Scene Noise and Drift for UAV Radar Search [3.1] レーダーセンサーを装備した無人航空機(UAV)は、多様な環境での捜索任務のために配備される。
基本的な課題は、UAVが動的かつ潜在的に静止しない環境を通過するときのレーダー統計の変化から生じる。
特定検出器ライブラリー上でのオンラインポリシー選択問題として,マルチ政治パラダイムを採用し,UAVターゲット探索を定式化する。
実験では、非定常的な設定の範囲で、適応的でないベースラインと比較して、最大30%の後悔の削減が示される。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:21:41 GMT)
What Makes a Strong Model? A Unified Spectral Analysis of Knowledge Transfer over High-dimensional Linear Regression [2.9] Teacher-Student Knowledge Transfer (KT)は、知識蒸留(KD)による古典的なモデル圧縮から、Wak-to-Strong(W2S)一般化の創発的な現象まで、現代の機械学習においてユビキタスである。
我々は、高次元線形回帰におけるSGDダイナミクスの統一スペクトル解析を確立し、KTの効率を異なるように見える状態にわたって解明する。
この枠組みはこれらの現象を統一し、移動の有効性は暗黙の正則化とスペクトル上の異種スペクトル学習速度との相互作用によって制御されることを示した。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:24:52 GMT)
Diamonds in the Sky: Pareidolic Animals in Clouds [2.9] 雲の中ではしばしば動物の形を見るが、これはパレイドリアとして知られる現象である。
我々は,人がクラウドで知覚する可能性のある動物を予測することを目的とした,AIベースの手法を提案する。
また, 個人が最初に認識しなかった場合でも, 特定の耳道動物を知覚する支援方法も導入した。
論文参考訳(メタデータ) (Sun, 31 May 2026 17:32:03 GMT)
Generating Fock state exceeding 10000 excitations with near unit fidelity by adaptive generalized-parity measurement [2.9] 10000ドル以上の励起を持つマクロフォック状態を生成するための適応型一般化パリティ測定プロトコルを提案する。
我々のプロトコルは、大規模なコヒーレントな状態から、光子数の大きなフォック状態に、最大$n_t=mathcalO(104)$を10ドルの範囲で変換することができる。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:47:50 GMT)
"Skill issues'': data-centric optimization of lakehouse agents [2.9] 本研究では,バプラン湖の分水池で作業するエージェントのアーティファクトを最適化する方法を示す。
本稿では,タスク検証ペアを生成し,サンドボックス内の候補スキルを実行し,トレースレベル信号とレイクハウス状態のプログラムチェックを用いてトラジェクトリをスコアするデータ中心最適化パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:58:04 GMT)
Rank-Aware Quantile Activation for Motion-Robust Crop Segmentation in UAV Imagery [2.8] 高速UAV取得による動きのぼかしは、希少なテクスチャ依存クラスにおけるセマンティックセグメンテーションをデグレードする。
標準CNNは、破壊を曖昧にし、マイノリティ信号の統計的消去を引き起こすような、周波数の大きい特徴に依存している。
本稿では,大域ゲーティングをインスタンスレベルの正規化に置き換えたランク対応ブロックであるDual Quantile Activation (QAct)を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:34:55 GMT)
Formal Verification of Secure Encrypted Virtualization [2.6] AMDセキュア暗号化仮想化(SEV)は、クラウドの機密コンピューティングで使用される鍵となる技術である。
本研究は,AMD SEVの秘密と完全性を表現するための公式な枠組みを紹介する。
このアプローチは、実行環境を保護するための重要なセキュリティ属性を定義し検証するための厳格な基盤を提供する。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:10:47 GMT)
VigilFormer: Deformable Attention for Video Anomaly Detection with Causal Risk Inference [2.5] 本稿では,ビデオ監視映像の異常を検出するために,変形可能な注意と因果時間モデルを組み合わせた統合フレームワークを提案する。
VigilFormer, ShanghaiTech, CUHK Avenueのフレームワークを1つのGPU上で41.5 FPSで評価した。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:27:57 GMT)
Conformal Risk Prediction for Non-Alcoholic Fatty Liver Disease Using Gradient Boosting with Distribution-Free Coverages [2.5] 非アルコール性脂肪肝疾患(NAFLD)は、世界の成人の約25%に影響を及ぼす。
NAFLDリスク予測のための機械学習フレームワークである Method を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:23:21 GMT)
Global Convergence of a Line-Search Filter Differential Dynamic Programming Method [2.5] FilterDDPは状態と制御に対する非線形制約を処理するために拡張される。
後方方向の手順は、制約された最適制御問題のサブセットに対してニュートンステップと同じ性質を満たす。
論文参考訳(メタデータ) (Sun, 31 May 2026 23:03:24 GMT)
HiTokSR: A Coarse-to-Fine Tokenizer with Hierarchical Codebooks for High-Fidelity Real-World Image Super-Resolution [2.5] 階層的なトークン予測フレームワークであるHiTokSRを提案する。
この結果から,HiTokSRは品質と再現性の両方において最先端の性能を達成できることが示唆された。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:02:58 GMT)
Understanding Undesirable Attributes of Requirements Engineers: Insights from Practitioners [2.3] 本研究は, 技術者の帽子の望ましくない特性が, 共同作業やプロジェクトの成功を妨げる可能性があることを明らかにする。
我々は,これらの属性を特定するためにソフトウェア実践者を調査し,支持する証拠を集めるためにインタビューを行った。
マップは、エンジニアがコラボレーションやプロジェクトの成果を妨げる可能性のある特性を認識して、専門家の実践を反映し改善するのに役立つ。
論文参考訳(メタデータ) (Sun, 31 May 2026 17:54:00 GMT)
LongAttnComp: Cross-Family Context Compression for Long-Context Reasoning [2.1] LongAttnCompは、軽量なクロスアテンションスコアリング層を微調整するAttnCompの長いコンテキスト適応である。
InfiniteBenchのコード-デバッグでは、LongAttnCompはフルコンテキストの正確さにマッチするか、超える。
LongBench v2では、2段階のレシピが多文書推論のステージ1のギャップを埋めている。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:40:36 GMT)
Giant magneto-optical rotation in a Rydberg atomic gas via symmetry-breaking wave mixing [2.1] 従来の単一ビーム励起系では、非線形信号の伝搬はエネルギー対称性によって誘導される伝搬遮断によって制限される。
我々は,超低温の5レベルリドバーグ原子ガスに極端に変形し,逆伝搬する波動混合場を導入することを提案する。
この対称性を破る機構は伝播遮断を破り、非局所リドベルク・カー効果の効率的な利用を可能にする。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:42:17 GMT)
Semantic Retrieval for Product Search in E-Commerce [2.1] 本稿では,2段パイプラインで訓練したSiamese LLMデュアルエンコーダを提案する。
優先最適化の目的は、Bradley-Terryを変数サイズのグレードレバレンスグループに拡張する。
得られたシステムは、置換品や補完品を正しく注文しながら、正確な一致を正確に検索する。
論文参考訳(メタデータ) (Sun, 31 May 2026 23:59:32 GMT)
Beyond MSE: Improving Precipitation Nowcasting with Multi-Quantile Regression [2.1] 本研究は,マルチ量子回帰問題としてトレーニングを再構成することにより,確立された決定論的流し込みアーキテクチャの予測性能を向上させることができるかどうかを考察する。
その結果,マルチクエンタイルトレーニングは中央決定性予測を改善し,MSEを用いたモデルと比較してテストセットのMSEを8.6%減少させることがわかった。
これらの結果は、新しいアーキテクチャや生成的サンプリング手順を必要とせずに、量子レグレッションが標準的なポイントワイド損失の簡単な代替手段となることを示唆している。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:47:26 GMT)
Automated Erythrocyte Detection and Tracking for Retinal Blood Flow Quantification in Erythrocyte-Mediated Angiography [2.0] キャピラリーレベルの網膜血流は、様々な眼疾患のバイオマーカーとして強い可能性を秘めている。
EMA(Erythrocyte-mediated angiography)は、個々の赤血球を可視化することにより、キャピラリーレベルのRBF測定を可能にする。
赤血球検出のためのフローコンテキストモジュールとトポロジ対応トラッキング戦略を備えた新しいフレームワークであるEMTrackを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:51:09 GMT)
A Sonar-Visual Dataset for Cross-Modal Underwater Robot Perception [2.0] 本稿では,ソナー・ヴィジュアル・データセットであるSOVISについて述べる。
SOVISは、トロンドハイムフィヨルドの6箇所で17回の潜水で収集された76,000枚のペアフレームから構成されている。
ラベル付きデータの小さなサブセットを用いて,概念横断魚検出タスクを実証する。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:43:46 GMT)
How (and when) can you fit examples to logic-based hypothesis classes over infinite structures? [2.0] 我々は、共通決定可能な構造における論理的に定義されたクラスに対する適合の計算的および記述的複雑さに焦点を当てる。
サンプルが適合するかどうかを判断するために、サンプル上の自然言語でクエリを使用します。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:59:30 GMT)
GovAI-Pipe: A Layered AI Governance Pipeline for Citizen-Facing AI in Turkey's e-Government Gateway [1.9] トルコのe-Government Gatewayは6800万人以上の登録ユーザーと9200以上の政府サービスを提供している。
我々は、AIモデルのライフサイクルをガバナンスチェックポイントにマップする4層ガバナンスパイプラインであるGovAI-Pipeを提案する。
GovAI-Pipeはガバナンスの原則を監査可能な技術的パイプラインコンポーネントとして運用する方法を示します。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:28:17 GMT)
Not All Explanations Simulate Equally: Comparing Verbalized Feature Attributions and Self-Generated Rationales [1.9] 本稿では,質問応答モデルに対する2種類の説明を,言語化された特徴属性と自己生成的有理性と比較する。
説明源,動詞化戦略,特徴粒度が説明のシミュラビリティにどのように影響するかを分析する。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:35:35 GMT)
Application of Algorithms in Energy-Efficient Design Platforms for Green Building [1.8] 本稿では,ビルディング情報モデリング,センサ操作データ,ロバストアルゴリズムを用いた高度なシミュレーションを組み合わせたプラットフォームを提案する。
ケーススタディとして中層オフィスビルが選定された。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:26:17 GMT)
Towards Cybersecurity SuperIntelligence (CSI): What's the best harness for cybersecurity? [1.8] サイバーセキュリティシステムは、エージェントごとにひとつの実行足場に集約されている。
全てのチャレンジタイプで1つの足場が支配的ではない。
異種エージェントハーネスを統一するメタスカラーフォールドを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:04:51 GMT)
Classification and detection of multiple UAVs using rational Gaussian wavelet neural networks [1.6] 無人航空機(UAV)の検出は、民間と軍事のインフラを保護するために重要である。
マイクロホンから得られた音声信号を用いたコスト効率の良いUAV検出システムを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:48:28 GMT)
CEAR: Certified Ensemble Adversarial Robustness in DNNs [1.5] 最先端の経験的防御メカニズムは、トレーニングフェーズを通じてディープニューラルネットワークの堅牢性を改善する。
認証された防衛は 特定の摂動境界内で 確実な堅牢性を保証する
我々は,経験的および認定された防御機構のハイブリッドを利用したアンサンブルベースのロバスト手法であるCEARを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 20:17:13 GMT)
ThinkSwitch: Context Distillation with LoRA and Weight Interpolation for Specific-Purpose Reasoning Tasks [1.5] textbfThinkSwitchは、ペア化された命令と思考チェックポイントを協調学習するための低計算手順である。
結果は小さいが, 対象の蒸留ループは, 個別の思考モードを維持しながら, 比重に比例した推論の利点の一部を移動させることができることを示している。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:57:45 GMT)
NetVAD: Foundation-Model Representation Learning for Identifier-Free Unsupervised Intrusion Detection [1.5] textitNetVADは、凍結したファンデーションモデルからタスク固有の潜在空間に表現を投影する。
ToN-IoTでは、マイクロF1スコアの98%、マクロF1スコアの96%を運用上の偽陽性率で達成している。
論文参考訳(メタデータ) (Sun, 31 May 2026 21:14:25 GMT)
AI-IoT-Robotics Integration: Survey of Frameworks, Emerging Trends, and the Path Toward Connected Robotics [1.4] 人工知能、モノのインターネット、ロボティクスの融合は、もはや未来的なビジョンではない。
AIoTとInternet of Robotic Things (IoRT)のようなペアワイズの組み合わせは進歩しているが、これら3つを完全に統合した統一設計フレームワークはいまだに存在しない。
この調査は、これらの領域における最先端の最先端におけるSLM(Small Language Models)と、クラウドにおけるLLM(Large Language Models)の出現する役割を強調し、最先端の最先端における最先端の最先端技術について要約する。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:10:34 GMT)
Conditioned free-energy density of proteins using unbalanced solutions to constraint satisfaction problems [1.4] 条件付き不均一Curie-We-issスピンの対数分割関数(自由エネルギー)の計算は、不均衡な2〜1ドルノルムに減少し、この問題に対する新しいアルゴリズムを設計することを示す。
ユビキチンタンパク質に適用されたこのフレームワークは、既知の結晶構造から始まり、代替のバックボーンを探索し、タンパク質の柔軟な領域を同定する。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:31:16 GMT)
Hybrid Imbalanced Regression Through Unified Data-Level and Algorithm-Level Balancing [1.4] 不均衡学習は機械学習において重要な課題であり、未表現のターゲット値がバイアスモデルになり、稀だが重要なケースで予測性能が低下する可能性がある。
我々は,データレベルのバランス戦略とアルゴリズムレベルのバランス戦略の両方を回帰型パイプラインに統合する統合ハイブリッドフレームワークを提案する。
ベンチマークデータセットによる実験結果から,提案フレームワークは独立回帰器や既存不均衡回帰手法と比較して予測性能を一貫して向上することが示された。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:13:10 GMT)
Reducing Token Usage of State-in-Context Agents using Minification [1.3] GPT-5-mini を用いて終末から終末までの全ベンチマークを行い,GPT-4.1 で選択されたアブレーションを施行した。
プログラムのセマンティクスを保ちながら、非意味の語彙要素を削除または短縮する一連のコード最小化手法を適用する。
実験により、最小化により平均入力トークン使用率が42%減少し、12ポイントの解像度が低下することが示された。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:24:22 GMT)
Self-Revising Discovery Systems for Science: A Categorical Framework for Agentic Artificial Intelligence [1.1] 我々は材料科学のためのエージェント発見のカテゴリー論的記述を開発する。
CategoryScienceClawでは、型付きスキル、アーティファクト、オープンニーズ、ワークフロー突然変異、ゲート、ストレステスト、そして公開談話が、証明付き知識計算グラフとなる。
論文参考訳(メタデータ) (Sun, 31 May 2026 20:29:43 GMT)
Fairness in two-player zero-sum games with bandit feedback [1.1] 両プレイヤーゼロサムゲーム (TPZSGs) について, 公正性制約下での帯域フィードバックによる検討を行った。
公正なミニマックス値、公正なナッシュ均衡、公正な後悔、そして公正さの価格が少なくとも1-1/m)$であることを示すクリーンな二重表現を導出する。
我々の主な成果は、Explore-Then-Commitアルゴリズムに対する$widetildeO(T2/3)$ regret bound for a Explore-Then-Commit algorithm, $textttFair-ETC-TPZSG$, for general mixed equilibriaである。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:06:06 GMT)
Move the Query, Not the Cache: Characterizing Cross-Instance Latent Attention Redistribution Across GPU Fabrics [1.1] Multi-head Latent Attentionは算術を逆転し、各トークンのキーと値を1つの狭いベクトルに圧縮する。
実マルチノードH100クラスタ上でのクロスインスタンスMLAの注意を特徴付ける。
論文参考訳(メタデータ) (Sun, 31 May 2026 23:53:24 GMT)
LLM Consortium for Software Design Refinement: A Controlled Experiment on Multi-Agent Collaboration Topologies [1.0] ソフトウェアアーキテクチャ設計のための12のマルチエージェントLLM協調トポロジを評価する。
設計は3つの独立自動評価器により12次元ルーリック上で評価された。
論文参考訳(メタデータ) (Sun, 31 May 2026 23:15:40 GMT)
GuidaPA: Privacy-Preserving Chatbot for Public Administration via Federated Learning [0.9] GuidaPAは、ロールベースのアクセス制御、セキュアなクライアントサイド前処理、非IID効果の明示的なモニタリング、および大規模言語モデルのパラメータ効率の高いフェデレートされた微調整を統合している。
最良のフェデレーションモデルは、61.55.77/59.44のROUGE-1/2/L、45.02のBLEU-4、63.94のMETEORのプライベートな微調整を実現し、データをその場で保存する。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:20:25 GMT)
Neural Network Compression by Approximate Differential Equivalence [0.9] 重みを独立に除去するのではなく、神経細胞を集約することでモデルを圧縮する手法を提案する。
本手法は,スムーズなODEシステムとして訓練されたネットワークを符号化し,近似フォワード微分等価性と呼ばれるラッピング手法を適用した。
本研究では, 非線形システムから抽出した合成データセットについて, 地下構造と公共回帰のベンチマークを用いて評価した。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:01:46 GMT)
Truthful AI Advisors: A Pre-Specified Benchmark for Large Language Model Honesty Under Preference Misalignment [0.9] 大規模言語モデルは、ユーザの目的が一致していないアドバイザとして、ますます多くデプロイされる。
我々は、標準のクローフォード・ソベルの安価なトークモデルを、好みのミスアライメントの下での誠実さのベンチマークに変換する。
最も非形式的な平衡に対して4つのオーバーリベラルが1.8から4.2倍になる。
論文参考訳(メタデータ) (Sun, 31 May 2026 21:30:43 GMT)
Spatially Distributed Task-Oriented Compression for Multi-Emitter Localization and Characterization with Spectral Overlap [0.9] タスク指向分散圧縮フレームワークによるマルチエミッタの局所化と特性評価
スペクトル重なりを伴う合成多重エミッターシーンの実験では、非常にコンパクトな受信側表現でさえ有用な情報を保存できることが示されている。
論文参考訳(メタデータ) (Sun, 31 May 2026 20:47:30 GMT)
Engineering Students' Self-Efficacy, Perceptions, and Performance in a Flipped CS1 Course [0.8] 本研究は,工学生の授業に関する信念が,フリップ導入プログラミングコースにおける試験成績とどのように関係しているかを考察する。
探索的因子分析では,自己効力,学習に対する態度,プログラミングの難しさの3因子が同定された。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:07:49 GMT)
Fundamental Limit for One versus Two Point Sources Detection using Direct Imaging [0.8] 本研究は,1つの弱非コヒーレント光点源と2つの弱非コヒーレント光点源との区別作業について考察する。
$$は、イメージプレーンのポイントスプレッド関数(PSF)幅にスケールされた2つのポイントソース間の分離である。
Bhattacharyya 距離を用いて性能を定量化し,その先行順序項のスケールをサブレイリー法で$$とする。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:56:32 GMT)
BRo-JEPA: Learning Modular Arithmetic in Latent Space [0.8] 我々はMNIST桁を状態として、モジュール演算をJEPAスタイルの潜在世界モデルにおけるアクションとして使用する。
本稿では,ラテント空間におけるModulo-10演算の円形構造を強制するブロック回転予測器を提案する。
この結果から,潜在世界モデルは,アーキテクチャが問題の構造に一致する場合に,象徴的変換規則を学習できることが示唆された。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:01:43 GMT)
MIC: Maximizing Informational Capacity in Adaptive Representations via Isotropic Subspace Alignment [0.7] 等方的部分空間アライメントによる多粒体埋め込みの幾何学的景観を最適化するフレームワークであるMICを紹介する。
これらの戦略を自己蒸留の目的を通じて統一することにより、MICは高い差別力を維持する意味的に密度の高い表現を生成する。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:18:20 GMT)
EVL-ECG: Efficient ECG Interpretation With Multi-Aspect Heterogeneous Knowledge Distillation [0.7] 本稿では,心診断ロジックのクロスアーキテクチャ蒸留に特化して設計されたEV-ECGを提案する。
EV-ECGは,(1)細かな特徴を維持するためにアーキテクチャ上の不一致を調和させるマルチヘッド・クロス・アテンション,(2)ミスマッチしたトークン表現にもかかわらず,ECG間のグローバルな構造的関係を維持するための最適なトランスポートを利用する最適トランスポートを利用した視覚特徴マッチング,(3)教師モデルの潜在診断推論を蒸留するアーキテクチャ内関係マッチング,という3つのECG対応のイノベーションを導入している。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:13:12 GMT)
Before and After Temperature: A Distributional View of Creative LLM Generation [0.7] パイプラインでは、より強力なシグナルが1歩早く存在することが示されています。
Llama-3.1-8B-Instruct generations of 500 open-ended creative prompts at 0.3, 0.8, 1.5$, a single-token feature predicts the within-prompt creative rank。
機械的には、勝利はインコヒーレンス体制の鋭い分布的な署名から生まれる。
論文参考訳(メタデータ) (Sun, 31 May 2026 21:13:47 GMT)
Targeted Remasking: Replacing Token Editing with Token-to-Mask Refinement in Discrete Diffusion Language Models [0.7] LLaDA2.1は、生成を高速化するToken-to-Token (T2T)編集機構を導入した。
本稿では,T2T編集の学習不要でドロップインの代替品であるToken-to-Mask(T2M)を提案する。
T2Mは、疑わしいトークンをマスク状態にリセットし、拡散過程がよりクリーンなコンテキスト下でそれらを再予測することを可能にする。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:33:39 GMT)
Decoding in Order-Agnostic Language Models: Chain-Rule Deviation and Uniform Spreading [0.7] 順序に依存しない言語モデル(OALM)は任意の条件セットの下でマスク付きトークンを予測するために訓練される。
学習条件はコヒーレントな関節分布の正確な分解ではないことを示す。
信頼性トレースの形状に基づく相補的診断を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:25:36 GMT)
Peacemaker at ATE-IT: Automatic term extraction from Italian text for waste management data using encoder model [0.7] ATE共有タスクのタスクAに対して,低コストかつ解釈可能な自動用語抽出手法を提案する。
本手法は,少量の計算資源上で動作可能な微調整抽出戦略を利用する。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:06:39 GMT)
Challenger at MultiPRIDE: Is It Hate Speech or Reclaimed? [0.7] 本稿では,ヘイトスピーチと再生言語を区別するための,シンプルかつ解釈可能なアプローチを提案する。
本手法は, 密集したセマンティックテキストの埋め込みを生成し, ラベルノイズフィルタリングの段階を組み込む。
提案手法は,マクロ平均値を含む精度,リコール,F1スコアを用いて評価する。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:38:58 GMT)
A Registry-Bound LLM Pipeline for Evidence-Grounded Trait Extraction across Tropical Plants, Aquatic Species, and Exotic Pets [0.7] 養殖熱帯植物,水生植物およびペット種について,大規模に構造的形質記録を作成した登録パイプラインについて述べる。
パイプラインは706,220回実行され、409,820種(99.985%)で5,489,881回の形質記録を維持、81.57%を高い信頼性で達成した。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:17:47 GMT)
Active Inference for Adaptive Traffic Signal Control in Noisy Nonstationary IoT Environments [0.6] 本研究では,期待される自由エネルギーを最小化して位相を選択する4腕信号化交差点の能動推論制御器を提案する。
制御器をルールベースとディープQネットワーク(DQN)に対して4つのシナリオでベンチマークし、ノイズや非定常性を徐々に増加させます。
シナリオ毎に100以上の独立したランダム評価を行い、アクティブな推論は最も低いアイドル時間とCO2排出量を達成する。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:15:13 GMT)
PALTO: Physics-Informed Active Learning for Tri-Gate FinFET Design Optimization for Vertical Power Delivery [0.6] 本稿では,垂直配電システムにおけるアプリケーション固有のGaNトリゲートFinFETの設計における機械学習による最適化の有効性を示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:31:11 GMT)
Before the Model Learns the Bug:Fuzzing RLVR Verifiers [0.5] 報酬による強化学習は、人間の嗜好ラベルを実行可能な報酬関数に置き換える。
この障害モードを,逆数補完を生成する軽量な検証ファジィングフレームワークを用いて検討し,バグや厳密な参照検証,ログのペア決定,偽陽性,偽陰性,不一致,エクスプロイト,不確実性などの指標を報告する。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:18:07 GMT)
ClawHub Security Signals: When VirusTotal, Static Analysis, and SkillSpector Disagree [0.4] ClawHub Security Signalsは67,453の最新のOpenClawスキルバージョンをサニタイズしたデータセットである。
各行はSKILL.mdコンテンツと、最後のClawScanレジストリの検証と3つのスキャナーファミリからのエビデンスを含む、サニタイズされたバンドルファイルとをペアリングする。
悪質なスキルの有病率を推定するよりも、スキャナの不一致を調査する。
これらの結果は、エージェントスキルのセキュリティは、単一スキャナの許容/ブロック決定ではなく、階層化されたガバナンスを必要とすることを示している。
論文参考訳(メタデータ) (Sun, 31 May 2026 23:20:25 GMT)
RULER: Representation-Level Verification of Machine Unlearning [0.2] 本稿では,表現レベルの検証指標であるRULERを紹介する。
M2は、リトレーニングされていないモデルと同じ表現位置を占めるかどうかを測定する。
M4は、未学習モデルの内部類似構造からの残留物のみを再訓練することなく検出する。
論文参考訳(メタデータ) (Sun, 31 May 2026 21:06:35 GMT)
Leyline: KV Cache Directives for Agentic Inference [0.1] レイラインはエージェント編集のためのサーブサイドプリミティブである。
宣言的ディレクティブ4タプルは、編集対象と位置正当性を維持する方法とを分離する。
同じインターフェースを介してルーティングされる10行のトランケーション規則は、デバッグジャムにおいてエージェントの解率+14.3 ppを上昇させる。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:13:15 GMT)
Self-Healing Agentic Orchestrators for Reliable Tool-Augmented Large Language Model Systems [0.1] セルフヒーリングエージェントオーケストレータは、信頼性をランタイム境界制御問題として扱う。
セルフヒーリングは98.8%のタスク成功を達成し、リトライオンリーでは94.5%、フルリプランでは93.8%を達成している。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:27:22 GMT)
Agyn: An Open-Source Platform for AI Agents with Scalable On-Demand Execution, Agent Definition as a Code, and Zero-Trust Access [0.1] 我々はエージェントワークロードの3つの重要な原則を中心に設計されたオープンソースのプラットフォームであるAgynを紹介します。
Agynはエージェント非依存、モデル非依存、クラウド非依存である。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:52:45 GMT)
Quantum Algorithm for Distributed Reduction of Entanglements (QADR): A Trainable and Simulation-Efficient QML Framework [0.1] ノイズ中間量子(NISQ)制約下での変分量子回路(VQC)の訓練は、厳しい計算制限をもたらす。
本稿では,量子エンタングルメントの分散化のための量子アルゴリズム(QADR)を紹介し,評価する。
QADRは、グローバル$n$-qubit VQCを、個々の標的量子ビットの因果光円錐のほぼ内で動作する局所化サブ回路に分解する。
論文参考訳(メタデータ) (Sun, 31 May 2026 15:23:10 GMT)
Wilson Holonomy and Spectral Monodromy in Spin-Orbit Rings: Effective Gauge Connections and Loop Observables [0.0] 有効ゲージ構造を持つスピン軌道ハミルトニアン(英語版)は、2つの異なるループオブジェクトを日常的に縮合する。
これらの物体をきれいに分離することで、ゲージ理論のループ/ホロノミー表現と凝縮マッタースピン軌道輸送の間の正確な計算可能なブリッジが得られることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:37:40 GMT)
UR-JEPA: Uniform Rectifiability as a Regularizer for Joint-Embedding Predictive Architectures [0.0] 局所次元の均一に$n$の補正可能な測度を小スケールで目標とするEmphUR-JEPAを提案する。
UR--JEPA($mathcalLtextCGLT$)は指数$sim 20$から$25$のグローバルな幾何スペクトルを生成し、LeJEPAのスペクトルはほぼ平坦である(最大ボトム比は3.6ドル)。
論文参考訳(メタデータ) (Sun, 31 May 2026 20:26:54 GMT)
Transferring Information Across Interventions in Causal Bayesian Optimization [0.0] グラフ結合型因果ベイズ最適化を提案する。
このカーネルは低ランクであり、共有パラメータの数によって制限されていることを示す。
また、非線形および適応的な拡張についても記述する。
論文参考訳(メタデータ) (Sun, 31 May 2026 21:32:45 GMT)
Trajectories of Critical Unstable Qubits in and on the Bloch Sphere [0.0] 我々は、Critical Unstable Qubits (CUQs)と呼ばれる不安定な2レベルシステムに関する以前の研究を拡張した。
CUQは、2つの状態間の不定不調和振動と混合状態のコヒーレンス・デコヒーレンス振動の顕著な現象を示す。
非エルミート・ハミルトンの粒子宇宙論と量子シミュレーションに対する我々の発見の潜在的意味について論じる。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:04:43 GMT)
Topological Ignorability for Structural Causal Effects Beyond Means [0.0] 介入は平均よりも結果分布の構造を変化させる。
平均治療効果のような平均的な因果推定は重要な構造的効果を欠く可能性がある。
本稿では,介入結果法則の要約に基づくトポロジカル・幾何学的因果指標を提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:56:53 GMT)
Time-Optimal Collision Avoidance Via a Greedy Polynomial Backward Sweep [0.0] 本稿では,グリーディ時間最適法(GTO)を提案する。
この方法は、最も近いアプローチの命名時から始まり、選択された危険度を局所的に最小化するスラスト方向を各ステップごとに選択し、反復的に後方に操作を伝播する。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:21:35 GMT)
The Shape of Wisdom: Decision Trajectories in Language Models [0.0] 言語モデルは単に出力層で答えを選択するだけではない。
Qwen2.5-7B-インストラクト、Llama-3.1-8B-インストラクト、Mistral-7B-インストラクト-v0.3の9000トラックのMMLU研究において、答えのスコアは構造化された方法で深さを移動している。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:33:36 GMT)
The Privacy Subsidy in Continuous-Time Kyle: Cumulative Welfare under Noise-Perturbed Order-Flow Observation [0.0] 単一周期カイルモデルから連続時間へ、中村(2026, arXiv05.15746)のクローズドフォームのプライバシ・サブシディ結果を拡張した。
我々は、この累積プライバシー補助金とロス・ヴァーサス・リバランシングの間の構造的対応を確立する。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:56:52 GMT)
The Inverted Dirac-Moshinsky Oscillator in $(1+1)$ Dimensions [0.0] 逆ディラック・モシンスキー発振器(IDMO)の正確な解を$ (1+1)$次元で導いて解析する。
負エネルギーセクターは、正の虚像部分が真空不安定性と自然対生成を示す反粒子反共鳴を記述する。
論文参考訳(メタデータ) (Sun, 31 May 2026 03:04:27 GMT)
Target localization, identification and sensing using latent symmetries [0.0] 潜伏対称性が問題検出のためにうまく活用されたのはこれが初めてである。
また、スパースグラフで近似できない3次元開系において潜在対称性が観測されたのは、これが初めてである。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:42:13 GMT)
Surface Excitations, Energy Loss, and Decoherence in Electron Interferometry [0.0] 電子エネルギー損失分光法(EELS)のモデルとデコヒーレンスがどのように結びつくかを示す。
遅延と熱的占有を取り入れることで、Scheel と Buhmann のマクロ QED モデルを再現する。
熱重み付けは、基板の近接場熱測定プローブとしての外界視認性(英語版)の応用を示唆している。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:43:30 GMT)
Strategic Users in a Priority Queue with Bulk Service on Blockchains [0.0] 本稿では、プライオリティキューを作成し、ユーザがキューゲームをプレイすることを考慮し、ブロックチェーン上のトランザクション手数料を分析する。
定常状態における半閉鎖形式表現を導出し,ユーザ遅延コストと取引手数料の関係を一般ブロック生成時間に拡張する。
Bitcoin、Dogecoin、Litecoin間のクロスチェーン分析は、通常のコスト構造における類似点を明らかにしている。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:57:23 GMT)
Stabilization of Granovskii-Zhedanov scars of the XYZ quantum spin chain via non-Hermitian spin relaxation [0.0] Granovskii-Zhedanov(GZ)状態は、S >= 1 のスピン-S XYZ鎖の正確なスカー状態である。
一般摂動の存在下でのGZ状態の安定性とダイナミクスについて検討する。
有効非エルミートスピン緩和過程の包含は、GZ状態を大幅に安定化させることができることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:18:17 GMT)
Spatial Search by Nonlinear Quantum Walk [0.0] 有効非線形性を持つ多体量子系は、完全グラフ上の量子探索を高速化することが示されている。
物理的には、全ネットワークにデータを配置することはできず、不完全なグラフを探索する作業は空間探索問題である。
様々なグラフ上の連続時間非線形量子ウォークを用いて空間探索を行う。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:02:00 GMT)
Sparse-View Lung Nodule Volumetry from Digitally Reconstructed Radiographs via AReT: Anatomy-Regularized TensoRF [0.0] 我々は、X線減衰場に適用した場合、これまで報告されていないテンソRFの故障モードを解消する。
AReTは, 冠動脈, 矢状, 軸方向投射を用いた肺再建のための解剖学的に規則化されたテンソル放射野の枠組みである。
11の再建戦略を体系的に比較すると、解剖学的に認識された規則化は、生成的先導的アプローチよりも一貫して優れていた。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:25:49 GMT)
Sample Complexity and Decision-Theoretic Guarantees for Bayesian Model Averaging over Decision Trees with Catalan-Exponential Priors [0.0] ダイリクレ・マルティノミカルリーフモデルとカタルーニャ指数木サイズの先行モデルを用いてベイズ決定木 (BDT) を閉形式で解答する。
我々は有理コミットメントしきい値の完全非漸近理論を確立する。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:43:54 GMT)
SS-ZKR: Spatial-Semantic Zero-Knowledge Routing for Privacy-Preserving Multi-Agent Collaboration [0.0] 既存のプロトコルでは、組織的信頼境界を越えたエージェントペイロードのコンテンツベースのセマンティックルーティングをサポートしていません。
SS-ZKRは,A2A/MCP上の相補層として設計された3機構のルーティングプロトコルである。
我々は,形式的脅威モデル,インテントベクトルの情報漏洩境界の解析,3つのメカニズムすべてに対する擬似コード提示,TEEベースおよび同型暗号化ベースのルーティングベースラインに対する解析的比較を行う。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:34:38 GMT)
Robust Integrated Planning and Control for Quadrotors in Dynamic Environments via NMPC with CBF Penalties [0.0] 本稿では、無人航空機のための新しいロバストな統合計画制御(IPC)戦略を提案する。
本稿では,制御障壁関数(CBF)を指数関数として組み込む非線形モデル予測制御(NMPC)の定式化を提案する。
これは、ハードウェアで検証された最初のNMPC-CBF IPCフレームワークであり、動的環境における安全な4乗子配置に向けた実践的なステップを提供する。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:08:05 GMT)
Reusing Fusion-Time Spectral Reliability for Adaptive Fusion and Expert Routing in RGB-Infrared Object Detection [0.0] パラメータフリーで7次元のスペクトル信頼性記述子を抽出する。
バンドエネルギー、振幅比、位相整合性、および相互モード相関を記述します。
本研究では, 拡散時間信頼性を明示的な信号として保存することは, 適応的融合と後核融合条件計算の両方に有効であることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:28:41 GMT)
Resolving Ambiguity in Composed Image Retrieval via Calibrated Interaction [0.0] 合成画像検索(CIR)は、コーパスに参照画像と修正方法を記述するテキストを検索する。
本稿では,CIRRの休眠補助アノテーションと対話アノテーションを復活させる,ベンチマークおよび人間検証型ユーザシミュレータであるAmbiCIRを紹介する。
論文参考訳(メタデータ) (Sun, 31 May 2026 03:56:14 GMT)
Relational Intervention During Functional Collapse in Large Language Models: A Lexical-Statistical Ablation and a Structure x Register Factorial [0.0] 機能的崩壊時に伝達されるリレーショナルスタイルの介入が,技術的フィードバックと区別可能な崩壊後の挙動を生じさせるかどうかを検証した。
Qwen3.5-4Bと意図的に壊れたbashツールを使って、6つの条件で300エピソードをマッチしたペアデザインで実行します。
論文参考訳(メタデータ) (Sun, 31 May 2026 00:10:01 GMT)
Prospect-Theory Behavior from Bellman Optimality in MDPs with Catastrophic States [0.0] 報酬は線形だが、エージェントは効用依存や曲率を持たず、大災害のペイオフは$r = 1.25$、または$r = 2$で13.9%である。
単価より1ドル高いところは、中央値がある。
1ドル以上は 中央値です
1ドル以上は 中央値です
1ドル以上は 中央値です
上のユニティは 境界のコントリビューションを超越しています
全ての細胞への貢献です
論文参考訳(メタデータ) (Sun, 31 May 2026 03:01:48 GMT)
Programmable site-selective spin control in rotating Penning-trap ion crystals [0.0] ペニングトラップの中の大きなイオン結晶は、数百スピンの量子シミュレーションとセンシングのためのプラットフォームを提供する。
ここでは、ペニングトラップで回転する大型9mathrmBe+$結晶上でのプログラム可能なサイト選択スピン制御を示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 00:53:24 GMT)
Privacy-Preserving Smart Surveillance with Cross-Dataset Violence Detection and Decentralized Evidence Governance [0.0] 本稿では,証拠開示から事件検出を分離するプライバシー保護型スマート監視フレームワークを提案する。
軽量のMobileNetV2ベースのビデオ分類器は、暴力的なクリップを検出し、記録された各インシデントセグメントは即座に暗号化され、しきい値ベースの承認によってのみアクセス可能である。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:16:41 GMT)
Pre-Characterization of Electromagnetic Side-Channel Leakage Using Publicly Available Information: A Case Study on E-Voting Interfaces [0.0] 我々は、TEMPEST攻撃と呼ばれる電磁チャネル脅威の文脈において、ブラジルのe-Voting Machine(BVM)のインタフェースについて検討した。
ビデオディスプレイに対するTEMPEST攻撃では、盗聴機はSoftware-Defined Radios (SDR) を使用して、ビデオ信号送信中に発生する電磁波を傍受する。
我々は、BVMインタフェースが、意図しない電磁放射で観測可能なスペクトル特性を生じさせるかどうかを考察する。
論文参考訳(メタデータ) (Sun, 31 May 2026 00:56:26 GMT)
Physics-Informed Deep Learning for Entropy Prediction in Heterogeneous Systems: Thermodynamic and Information-Theoretic Case Studies [0.0] エントロピーは、物理理論と情報理論の両方において不可逆性と不確実性を支配している。
本稿では、微分方程式残差と情報理論境界を同時に適用した統合物理情報深層学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:38:52 GMT)
Perception First: A Frontier Native-Video Model with Self-Consistency for Implicit Video Question Answering [0.0] emphImplicitQA / emphVRR-QA benchmarkciteimplicitqa上に構築されたVRR Challenge @ CVPR 2026について説明する。
私たちの中心的な発見は、このベンチマークが推論バウンドではなく、認識バウンドであることです。
論文参考訳(メタデータ) (Sun, 31 May 2026 23:00:17 GMT)
On the Uncertainty Quantification Ability of Tabular Foundation Models [0.0] ガウス過程(GP)とタブラルプレデータフィットネットワーク(TabPFN)を比較した。
我々の発見は、明示的と学習的事前の間の重要なトレードオフを浮き彫りにした。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:56:10 GMT)
On the History of the Square and Multiply Algorithm [0.0] 2乗乗算アルゴリズム(英: square-and-multiply algorithm)は、現代の暗号理論や計算数理論でよく用いられる高速指数法である。
本稿では,一次音源解析によるアルゴリズムの起源と形式化を批判的に検討する。
論文参考訳(メタデータ) (Sun, 31 May 2026 02:17:36 GMT)
On Jean-Marie Souriau's geometric quantization of the relativistic electron [0.0] 我々は、その前量子多様体にシンプレクティック構造と接触構造を持たせることができる2つのキーストーン定理を述べ、証明する。
また、スピン電流の保存のアイデンティティーを提案し、電荷、パリティ変換、時間反転の対称性の体系的な構成であるカルザ・クライン理論を呼び起こす。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:39:12 GMT)
Negative entropy in scrambling black holes [0.0] 我々は、落下物体が吸収され、その微視的な自由度にスクランブルされると、ブラックホール内で引き起こされるエントロピーの増加を導出する。
それらの分割関数による寄与は,地平線領域に付随するコヒーレント情報バランスをキャンセルすることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:39:54 GMT)
Needles at Scale: LLM-Assisted Target Selection for Windows Vulnerability Research [0.0] 低コストのバッチパイプラインであるSybolicate-Enrich-Sampleは、プロダクションWindowsバイナリのコーパスを優先度の高い研究キューに変換する。
低コストの言語モデルを用いて、リーチビリティ層、リスクレベル、バグクラスの仮説、理論的根拠を割り当てます。
Windowsイメージ全体では7,231,419の関数があり、ラベルは極めて選択的であり、決定論的フィルタを積み重ねると22K関数のショートリストが残る。
論文参考訳(メタデータ) (Sun, 31 May 2026 17:46:13 GMT)
Modular theory and affine representations on the Rindler horizon [0.0] 我々は、光線上のアフィン対称性に基づくウンルー効果の群論的解釈を開発し、それをモジュラー理論に関連付ける。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:31:33 GMT)
Measuring Alignment-Induced Activation Shifts Correctly: A Template-Controlled Difference-in-Differences Protocol [0.0] この行列を形成するための明らかな方法を示す。
整列モデルはチャットテンプレートで評価され、ベースモデルは見なかった。
我々は、アライメントの活性化差研究のための測定勧告にそれを蒸留する。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:57:23 GMT)
Machine Learning Surrogate Modeling for Homogenization of Hyperelastic Materials with Boolean Microstructures [0.0] データ駆動サロゲートモデルは、異種物質の数値的均質化の代替となる。
ニューラルネットワークはスカラーと曲線の統計記述子の組み合わせに基づいて訓練される。
パラメータ空間の制限ケースを表す追加データは、トレーニングを安定させ、外挿動作を改善するために組み込まれている。
論文参考訳(メタデータ) (Sun, 31 May 2026 00:51:52 GMT)
Large Alphabet Set Time-bin Encoded Measurement-Device-Independent Quantum Key Distribution [0.0] 拡張基底集合(ここではアルファベット集合と呼ぶ)の時間ビンエンコードされた測定デバイス非依存量子鍵分布(MDI-QKD)の実験的実証
MDI-QKDは、中央測定ノードで行った偶然の測定により、本質的に秘密鍵レート(SKR)の低下に悩まされている。
複数のタイムビンにまたがる状態をエンコードすることで、一致イベントが増加し、成功したアルファベット交換を複数のビットにマッピングする。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:29:00 GMT)
Korzhinskii-Net: Physics-Informed Neural Network for Sub-Surface Mineral Prospectivity Modelling [0.0] Korzhinskii-Netは2次元ラジアル物理インフォームドニューラルネットワーク(PINN)である
ダーシー流、対流拡散熱輸送、ソフトプラス飽和反応速度を1つの微分可能な前方モデルに結合する。
我々は,コモディティ・クラスにまたがる5つの鉱区において,Korzhinskii-Netを評価した。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:50:20 GMT)
Is Quantum Mechanics Universal? EWF Experiments and Non Absoluteness of Events [0.0] 事象が絶対ではないという主張は、しばしば解釈スローガンのレベルに残されていることを示す。
この枠組みの中では、Convivial Solipsismは絶対的でない出来事の一貫性と完全な説明を提供する。
論文参考訳(メタデータ) (Sun, 31 May 2026 17:03:13 GMT)
Interpolation between Convolution and Attention via K-Nearest Neighbors [0.0] 我々は、畳み込みと自己注意は、単一のk-ネアレスト隣の集約フレームワークで統一できると主張している。
このコネクションを形式化する統一フレームワークであるConvNN(Convolutional Nearest Neighbors)を紹介します。
論文参考訳(メタデータ) (Sun, 31 May 2026 23:23:42 GMT)
Implicit Geographic Inference in LLM Medical Triage: Language-Driven Disparities in Emergency Recommendations [0.0] 本研究は,大言語モデルが患者プロンプトの言語のみに基づいて,同一の症状に対して異なる医用トリアージレコメンデーションを作成できるかどうかを検討する。
Gemini 3.5 Flashを用いて、6言語にわたる神経症状プロファイル(持続性頭痛、視力のぼやけ、吐き気)を評価した。
本モデルでは,0%(日本人,ヒンディー人)から30%(英語,アラビア語)の緊急訪問を推奨している。
論文参考訳(メタデータ) (Sun, 31 May 2026 12:39:05 GMT)
Hierarchical Online Prompt Mutation with Dual-Loop Feedback for Guardrailed Evidence Document Generation: A Production-Evaluation Case Study [0.0] HOPMは階層的なオンラインプロンプト突然変異フレームワークである。
本論文は、制御設定、サンプルサイズ、信頼区間、ペアテスト、プロンプトトークンカテゴリ、擬似コード、スキーマ、ルーリック、ガードレール分類、構築された例を含む。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:17:44 GMT)
GPU Acceleration of Learning With Errors KEMs Using OpenACC for Post-Quantum Cryptography [0.0] LWE問題に基づく鍵カプセル化機構(KEM)
実装は、すべてのテスト済みGPUプラットフォームで大幅な加速を実現している。
結果は、LWEベースの暗号化ワークロードの計算要求に対するGPUアクセラレーションの有効性を強調した。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:01:18 GMT)
Functional Clustering of Survival Data via Smoothed Log-Hazard Trajectories: A Risk-Dynamics Perspective [0.0] 本稿では, 累積生存確率から即時リスクへ分析的焦点を移すことにより, 生存データのクラスタリングについて検討する。
我々は、リスクの時間的進化を捉える機能オブジェクトとして、スムーズなログハザード軌道をモデル化する。
その結果,ログハザードに基づく機能クラスタリングフレームワークは,相対的時間的リスクダイナミクスの解釈可能な表現を提供することがわかった。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:40:49 GMT)
From Rocq to Metal: A Pipeline for Formally Verified Microcontroller Firmware [0.0] 本稿では,今日,正式に認証されたファームウェアがいかに実現可能かを示す。
マイクロコントローラ上でRocq抽出スキームを実行するベアメタル継続パススタイル仮想マシン(VM)であるEncore!を開発した。
また、ファームウェアを純粋な状態遷移関数として構成する方法を示し、そのコアをRocqで完全に証明できるようにする。
論文参考訳(メタデータ) (Sun, 31 May 2026 21:14:54 GMT)
From Performance to Viability: A Bootstrap Framework for Latent-Space Representation Learning in Adaptive Biological Systems [0.0] 本稿では,適応生物学系における潜在空間表現学習のためのブートストラップフレームワークを提案する。
フレームワークは、観測可能なパフォーマンス、動的な組織、潜伏した組織、縦断的な生存可能性、内部予測近似の5つのレベルで構成されている。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:04:40 GMT)
From Outliers to Errors: Auditing Pali-to-English LLM Translations with Multi-Reference Adjudication [0.0] GPT-5.5は、クロード・ソネット4.6とジェミニ3.1 Proの2倍の信頼区間を持つ、最も低い偏差の主エラー率であった。
グロク4.3は最大のアウトリー数と最も高い尾のメジャーエラー率(全体の27.6%、ドリフト3.0より74.4%)を持っていた。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:15:36 GMT)
FreqLite: A Lightweight Frequency-Decomposed Linear Model with Adaptive Reversible Normalization for Robust Long-Term Time-Series Forecasting [0.0] 超軽量でチャネル非依存の周波数分解型線形予測器であるFreqLiteについて述べる。
FreqLiteは4倍のパラメータ、2.2倍のメモリ、2.2倍の時間でPatchTST変換器よりも平均誤差が低い。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:43:17 GMT)
Entangled Two-Photon Absorption in Cesium Atoms and the Limitations of the Far-Off-Resonance Approximation [0.0] セシウム原子中のETPA過程の理論的研究を行った。
光の量子状態は光子対の合同スペクトル振幅によって記述される。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:09:22 GMT)
Emergent Ordinal Geometry in Transformers Trained on Local Comparisons [0.0] 推移的推論は、A C が隣り合う関係しか知らないことを推測する挑戦である。
我々は、Transformerが同じプリミティブを取得し、隣接した比較のみに基づいて小さなモデルを訓練するかどうかを問う。
分布外一般化は、目覚ましい幾何学的再編成とともに現れる。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:44:54 GMT)
Efficient and Expressive Boundary Conditions in Quantum Lattice Boltzmann Methods [0.0] 我々は、量子格子ボルツマン法(QLBM)に単純な境界条件を与える新しい方法を提案する。
本手法は,固体領域をセグメントに分割し,その代わりに境界反射全体にコヒーレントな演算を適用する。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:55:02 GMT)
Don't Ask the LLM to Track Freshness: A Deterministic Recipe for Memory Conflict Resolution [0.0] FC-SH (gpt-4o-mini) において, LLM-judgment 応答パイプラインを候補抽出に置き換え, Python max (serial) を +10.8 点とすることを示す。
レシピはFC-SH(gpt-4o-mini)では78.0%、FC-MH(gpt-4o-mini)では94.8%、FC-MH(gpt-4o-mini)では30.2%に達する。
論文参考訳(メタデータ) (Sun, 31 May 2026 20:13:43 GMT)
Disagreement-Based Cross-Model Routing for Implicit Video Question Answering [0.0] 我々はImplicitQAベンチマークを用いて,複数選択のビデオ質問応答について検討した。
このベンチマークでは、単一のフロンティアビデオLLMが、その精度の天井付近ですでに動作している。
ラベルやトレーニングを必要とせず、純粋な推論時間である、不一致に基づくクロスモデルルーティングを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:56:27 GMT)
Digging Up Citations: FOSSIL, a Dataset and Workflow for Reference Extraction in Law and the Humanities [0.0] 我々は,7,600以上の脚注に埋め込まれた参照を含む96項目のオープンアクセス多言語データセットを提示する。
エンドツーエンドの評価では、特別なパイプラインはデフォルトのGrobidよりも抽出をほぼ倍にします。
引用のセグメンテーションとパース、参照間の解決が進行中である。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:59:49 GMT)
Differing Roles of Leisure and Productivity in GDP - A Machine Learning based comparative analysis of Germany and USA [0.0] 国のGDPは労働時間と生産性の間の相対的な相互作用としてモデル化されている。
ランダムフォレストモデルでは、これらの2つの要因からGDPを緩やかに予測できることが示されている。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:32:39 GMT)
Data Collection for Training Quality-Control AI in Carpet Manufacturing [0.0] カーペットウェブをリアルタイムで検査するインラインマシンビジョンシステムの設計を提案する。
この提案は、織物大工生産施設のコンクリート工業施設に基礎を置いている。
本報告では,光場と放牧照明を併用したシンクロナイズドラインスキャンカメラを用いた画像サブシステムについて述べる。
次に、欠陥のない材料で訓練された教師なし異常検出から始まるステージドモデリング戦略を配置する。
論文参考訳(メタデータ) (Sun, 31 May 2026 05:25:48 GMT)
DENSER: Depth-Guided Ensemble with Staged EFA-GS Reconstruction for Soccer Novel View Synthesis [0.0] DENSERは、サッカーノベルビューの合成のためのステージドEFA-GSレコンストラクションを備えた深さ誘導型エンサンブルである。
5つの挑戦シーンでは、平均PSNRが29.89dB、SSIMが0.791、LPIPSが0.366である。
論文参考訳(メタデータ) (Sun, 31 May 2026 19:40:21 GMT)
DAGGER: Gradient-Free Construction of Transiently Amplifying Networks under Hard Connectivity Constraints [0.0] DAGGERは、過渡非正規増幅のための勾配のないシングルパスアルゴリズムである。
これは1つの前方パスにおける多重セット保存において勾配に基づく手法と一致するか、あるいは超える。
DAGGERが他の増幅ネットワークと構造的に異なる理由を示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:20:26 GMT)
Coordinating Task Switching in a Robotics Multi-Agent System Using Behavior Trees [0.0] 我々は,サンデラッツ大学パウロ校のロボットチームであるVSSSチーム内で,マルチロボットコーディネーションを支援するための行動トレーベースのアプローチを提案する。
論文参考訳(メタデータ) (Sun, 31 May 2026 11:22:16 GMT)
Chirality-free photon routing via giant atoms in waveguide QED ladders [0.0] マルチエミッタ導波路量子電磁ラグにおける単一光子ルーティングの詳細な検討を行う。
我々は3つの位相的に異なる構成で巨大原子の数をスケーリングする影響を評価する。
論文参考訳(メタデータ) (Sun, 31 May 2026 20:18:04 GMT)
Cellular Sheaf Neural Operators for Structure-Preserving Surrogate Modeling of Constrained PDEs [0.0] 構造保存型ニューラルPDEサロゲートのための離散化対応フレームワークを提案する。
拘束型多物理系における神経性PDEサロゲートの誘導バイアスとして, 細胞-せん断構造が有用であることを示す。
論文参考訳(メタデータ) (Sun, 31 May 2026 00:49:25 GMT)
CART: Context-Anchored Recurrent Transformer -- A Parameter-Efficient Architecture with Learned Stability [0.0] CART(Context-Anchored Recurrent Transformer)は、パラメータ効率のよい言語モデルで、1つの共有コアブロックをR倍の深さで再利用する。
我々は1つのコンシューマGPU上でCARTを2段階に分けて評価した: 64-configuration screen at 3,000 steps, then 36 configurations (P=6, R in 6,8,10, three seed) training for 30500 steps (1B tokens)。
256,512,768,1024: 事前深さPはループ数Rを支配し、Rのステージ1ランクはフルトレーニング時に逆になる(R=6は最高になる)。
論文参考訳(メタデータ) (Sun, 31 May 2026 23:26:27 GMT)
Beyond Sinusoids: A Morlet Wavelet Framework for Transformer Positional Encoding [0.0] 我々は、モーレットウェーブレットが位置符号化の自然な基礎であり、モーレット位置次元(MoPE)を導入することを提案する。
MoPEはデータから独自の周波数と局所帯域を学習する。
MoPEの位相はRoPE回転角を正確に回復し、振幅は標準符号化に欠けている学習されたガウスカーネルを追加する。
論文参考訳(メタデータ) (Sun, 31 May 2026 14:26:26 GMT)
Beyond Access: Guided LLM Scaffolding for Independent Learning in Undergraduate Statistics [0.0] 大規模言語モデル(LLM)は、学生の学習の実践にますます入り込んできている。
本研究では、割り当てられたアクセスと実際のインタラクション品質のギャップに焦点を当てる。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:05:23 GMT)
Benchmarking Local LLMs for Natural-Language-to-SQL Querying in Biopharmaceutical Manufacturing: An Empirical Benchmark on Consumer-Grade Hardware [0.0] 大規模言語モデル(LLM)は、プライバシー保護の代替手段を提供するが、医薬品の製造タスクに適合する可能性はまだ未調査である。
本研究は, 製薬データベース上で, オラマを介してローカルに展開した4つのオープンソースLCMについて, 自然言語から世代への展開について検討した。
論文参考訳(メタデータ) (Sun, 31 May 2026 16:41:26 GMT)
Autopilot-Preserving Residual Q-Learning with HJB-Inspired Finite-Action Risk Filtering for Fixed-Wing UAV Command Supervision [0.0] 固定翼UAVは風速、高度、風速、気流、乱流下での誘導基準を保持する必要がある。
変速オートパイロット上の学習スーパーバイザーは、指示された飛行速度、高度、進路に設定された有限な有界動作から残留物を選択する。
本稿では,この自動操縦保存型残留コマンドスーパービジョン設計と,そのトレードオフをそのまま報告したベンチマークについて述べる。
論文参考訳(メタデータ) (Sun, 31 May 2026 18:43:29 GMT)
Arbitrarily precise arrival time measurements in quantum mechanics [0.0] 量子ゼノ効果は、しばしば量子力学における正確な到着時間測定の障害と見なされる。
到着時刻測定手順を任意に精度よく行うことにより、限界内であっても到着確率がゼロでないことが示される。
これは、ツマルカが境界条件を吸収することで、粒子が到着した瞬間に粒子を登録できる理想的な検出器をモデル化することができるという主張を正当化するものである。
論文参考訳(メタデータ) (Sun, 31 May 2026 04:44:07 GMT)
Approximate Quantum Linear Solvers for Hybrid CFD: End-to-End Analysis with a Chebyshev-LCU Approach [0.0] 我々は、近似量子線形解法が全体のCFD反復の収束にどのように影響するかを分析する。
量子資源要求を低減できる近似量子化に基づく解法(Cheb-LCU)を開発した。
論文参考訳(メタデータ) (Sun, 31 May 2026 07:20:42 GMT)
Analysis of Ethnic Disparities in Autism Spectrum Disorder among Toddlers [0.0] 白人はASDのリスクが81%増加し、中東人はアジア人に比べてASDのリスクが79%減少している。
新生児黄砂はASDの有意な予測因子であり,男性児はASDのリスクが高い。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:10:41 GMT)
Advanced Mathematics Learning Behavior Prediction and Academic Early Warning Model Based on Multimodal Data Analysis [0.0] リスクの高い学生の早期発見とタイムリーな学術的介入は、高度な数学教育において大きな課題となる。
本研究では,学習行動予測と学術的早期警告のための動的フレームワークを構築するために,マルチモーダルデータ分析を採用する。
論文参考訳(メタデータ) (Sun, 31 May 2026 13:16:35 GMT)
Accelerating physics-informed neural networks for full waveform inversion using a hybrid quantum-classical finite-basis architecture [0.0] フルウェーブフォームインバージョン(FWI)は、受信データから不均一な材料特性を再構成するが、計算的に要求される。
音響FWIのためのハイブリッド量子古典型FBPINNを提案し,量子コンピューティングと古典的機械学習を組み合わせた。
この枠組みは, 医用超音波トモグラフィーや非破壊評価など, 物理以外の波動による逆問題にも広く適用可能である。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:04:29 GMT)
ASE-26: a curriculum for agentic software engineering as a discipline [0.0] 本稿では,エージェントソフトウェア工学を専門とする総合的な学部課程について述べる。
CC BY-ND 4.0 でゼノドの精査基準として堆積する。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:44:53 GMT)
AMP: A Vendor-Neutral Wire Format for Agent Memory Operations [0.0] 共有ワイヤフォーマットは存在せず、すべての統合が起動され、すべての移行がスクラッチからメモリを再構築し、長期的なストレージに入る前に人間がレビューできるガバナンスサーフェスを出荷するフレームワークは存在しない。
メモリワイヤ,5つのメモリ操作(記憶,リコール,マージ,終了)用のルータ-2020-12ワイヤアダプタを,メモリStoreインターフェース,ファンアウトルータ,オプションのHITLガバナンスチャネルを備えた4種類のメモリタイプ(セマンティック,エピソディック,手続き,感情)で提示する。
論文参考訳(メタデータ) (Sun, 31 May 2026 10:18:56 GMT)
AMN: An Adaptive Multi-Scale Fusion Network with Boundary and Uncertainty Modeling for Nuclei Segmentation [0.0] 本稿では,Swin TransformerとResNet-50の機能ピラミッドを併用したデュアルエンコーダセグメンテーションフレームワークAMNを提案する。
AMNは、クラス重み付き焦点損失、正画素強調による境界認識損失、および過度な不確実性予測を抑制する新しい不確実性修飾分類項を組み合わせた多目的損失を訓練する。
論文参考訳(メタデータ) (Sun, 31 May 2026 06:46:23 GMT)
A Per-Component Diagnostic Protocol for Neural HJB-PIDE Solvers under Control-Dependent Lévy Jumps [0.0] 制御依存型レヴィジャンプを用いた残差学習型ニューラルネットワークHJB-PIDEの5段階診断プロトコルを提案する。
このエピソードは、より広範なニューラルPDE検証失敗の具体例である。学習された値や制御のポイントワイドな一致は、体系的に間違った非局所演算子と共存することができる。
論文参考訳(メタデータ) (Sun, 31 May 2026 09:44:28 GMT)
A Minimalist Brain-Computer Musical Interface for Real-Time Emotion-Driven Sonification: System Design and Preliminary Evaluation [0.0] 本稿では,脳-コンピュータ音楽インタフェース(BCMI)について述べる。
このシステムは、無線EEGの取得、リアルタイムのPython信号処理、およびLab Streaming Layerを介して同期されたライブベースの音楽生成を統合する。
線形混合効果分析では、対象の感情や時間に有意な影響は見られず、前頭α非対称性信号が指示された情動状態を確実に区別しなかったことが示唆された。
論文参考訳(メタデータ) (Sun, 31 May 2026 22:22:15 GMT)
A Fiber Criterion for Representation Identifiability in Supervised Learning [0.0] 教師付き学習は、その入出力行動を通じて予測器を評価する。
本稿では,結果の表現レベル識別可能性問題を定式化する。
その結果、表現レベルのクレームは、予測行動だけでなく、仮定、目的、測定、帰納的バイアスを必要とすることが明らかとなった。
論文参考訳(メタデータ) (Sun, 31 May 2026 08:25:07 GMT)