The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence [161.9] MiniMax-M2はMixture-of-Experts言語モデルのファミリーである。
旗艦M2は合計229.9Bのパラメータを持ち、トークン当たりのアクティベートは9.8Bのみである。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:16:11 GMT)
Latent Recurrent Transformer: Architecture Exploration, Training Strategies, and Scaling Behavior [107.2] Latent Recurrent Transformer (LRT) は自己回帰変換器の軽量化である。
LRTは、次のトークンのリカレントメモリとして、前のトークンから高レベルなソース層隠れステートを再利用する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:10:26 GMT)
SpatialBench: Is Your Spatial Foundation Model an All-Round Player? [92.0] 空間ベンチ(SpatialBench)は、決定論的サンプリングを伴う空間基盤モデルのための、クロスパラダイムなドメインディバースベンチマークである。
6つのパラダイムにまたがる41のモデルを4つの異なる入力密度設定の下で5つのタスクスイートで包括的に評価する。
厳密なドメインアライメントと高いデータ品質が、単純なデータセットスケーリングよりもパフォーマンスに極めて重要であることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:59:20 GMT)
Rethinking Weakly-supervised Video Temporal Grounding From a Game Perspective [86.6] 本稿では,弱教師付きビデオ時間グラウンドの課題に対処する。
我々は,この課題に新しいゲームの観点から取り組み,各視覚言語対間の不確実な関係を効果的に学習する。
実験の結果,本手法はCharades-STAとActivityNet Captionの両方のデータセットにおいて優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:54:17 GMT)
Quantum fluctuations and chaos in fully connected spin models [84.1] 完全連結な$mathrmSU(3)$ spin-exchangeモデルにおける平均場外ダイナミクスについて検討する。
2つの粒子既約(2PI)実効的な作用形式を用いて、相互作用によって生成される高次相関を考慮に入れた運動方程式を導出する。
この結果から, 量子多体系におけるマクロ力学を記述するためには, 揺らぎの正確な処理が不可欠であることが示唆された。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:53:43 GMT)
Bilevel Optimization over Saddle Points of Zero-Sum Markov Games [80.8] 強化学習(RL)は階層構造を持ち、上位レベル(UL)学習者がモデルパラメータを選択し、下位レベル(LL)決定プロセスが応答する。
既存の2レベルRL法の多くは単一のLLマルコフ決定プロセス (MDP) を前提としており、インセンティブ設計のような応用で生じる競合構造を捉えることができない。
LL問題を正規化されたmin-max 0-sum Markovゲームであり、UL目的がLLゲームによって誘導されるサドルポイント平衡によって最適化される双レベル最適化問題について検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:38:24 GMT)
LocateAnything: Fast and High-Quality Vision-Language Grounding with Parallel Box Decoding [80.5] 並列ボックスデコーディング(PBD)に基づく統合生成基盤・検出フレームワークを提案する。
PBDはデコードスループットとローカライズ精度の両方を改善する。
さらに、スケーラブルなデータエンジンを開発し、1億1800万以上のトレーニングサンプルを持つ大規模データセットであるLocateAnything-Dataをキュレートします。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:59:12 GMT)
Energy-Structured Low-Rank Adaptation for Continual Learning [78.5] textbfEnergy-Concentrated and textbfEnergy-Ordered textbfLow-textbfRank textbfAdaptation (E$2$-LoRA)を提案する。
E$2$-LoRAは、知識を明示的に順序付けして上位のランクに集約することにより、その後のタスクの容量を解放する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:55:02 GMT)
Beyond Pairwise Preferences: Listwise Reward-Aware Alignment for Diffusion Models [73.1] Diffusion LAIRは、拡散モデルに対する報酬を考慮したリストワイズ選好最適化手法である。
実験により、テキスト・ツー・イメージ生成、合成生成、画像編集ベンチマークにおいて、強い優先最適化ベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:09:24 GMT)
When In-Distribution Gains Fail: Evaluating Weak-to-Strong Reward Models under Preference Shift [72.1] ゼロショット分布シフト下でのW2S選好学習について検討した。
弱い選好ラベルで訓練された強い学生は、選好データセットを移動できなくとも、流通に成功していることがわかった。
本稿では、事前訓練された強モデルの表現空間からの過剰なドリフトを制約する単純で効果的な正規化器であるRepresentation Anchoring(Anchor)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:05:15 GMT)
PARE: Pruning and Adaptive Routing for Efficient Video Generation [71.5] ビデオ拡散変換器(DiT)は高品質なビデオを生成するが、広いブロック、深いアーキテクチャ、反復的なサンプリングのためにかなりの計算を必要とする。
最近の手法では、幅、深さ、サンプリングのステップを圧縮することでコストを削減するが、通常は個々の入力に適応できない固定されたアーキテクチャにコミットする。
本稿では,構造対応プルーニングと入力適応ルーティングを併用して,幅と深さを共同で圧縮するPAREを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:43:25 GMT)
Algorithmic Monocultures in Hiring [70.2] 多くの雇用主は、同じ少数のアルゴリズムベンダーによって構築されたアルゴリズムで求職者をスクリーニングしている。
私たちは、400万のアプリケーションを提出する300万の応募者の新しいデータセットを取得し、分析します。
応募者の結果には明確な人種格差がある。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:59:55 GMT)
Variational Inference for Evidential Deep Learning [69.9] 数学的に原理化されたフレームワークである変分推論証拠深層学習(VI-EDL)を提案する。
VI-EDLは、分布外検出、ノイズ検出、自律運転シナリオにおいて最先端の性能を達成する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:32:59 GMT)
MemFail: Stress-Testing Failure Modes of LLM Memory Systems [69.8] 大規模言語モデル(LLM)エージェントは、長期にわたる相互作用において一貫性を保つために、外部メモリシステムに依存している。
既存のベンチマークでは、集計された質問回答の精度を報告し、メモリシステムをブラックボックスとして扱う。
本稿では,現代のLCMメモリシステムの障害モードを分離する診断ベンチマークであるMemFailを紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:03:55 GMT)
Where Detectors Fail: Probing Generative Space for Generalizable AI-Generated Image Detection [69.6] AI生成画像(AIGI)の検出は、検出器が見えないジェネレータに一般化できないことが多いため、依然として難しい。
本稿では, 生成過程の挑戦領域を積極的に探究することで, 検出器の一般化を改善するフレームワーク PROBE を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:44:35 GMT)
Confounder Detection via Treatment Intent: A New Observational Study Design [69.5] 我々は、治療意図による共同設立者検出と呼ばれる新しい研究設計を導入する。
このアイデアは、治療決定を行う人間の専門家に問い合わせ、ペアのユニットの比較を依頼する。
ICUで収集された電子的健康記録が未確認のコンファウンディングの対象であることの実証的証拠を示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:41:47 GMT)
ReCA: Multi-Shot Long Video Extrapolation via Recursive Context Allocation [69.5] マルチショットビデオ外挿(マルチショットビデオ外挿、Multi-Shot Video Extrapolation、MSVE)は、観察されたフレームまたはクリップを撮影的に構造化された一連のショットに拡張するタスクである。
MSVEは、長ビデオの障害は単にコンテキスト長の制限ではなく、コンテキスト割り当ての障害であることを明らかにした。
本稿では,再帰的コンテキスト割当(Recursive Context Allocation, ReCA)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:16:56 GMT)
Can Retrieval Heads See Images? Multimodal Retrieval Heads in Long-Context Vision-Language Models [68.5] 本稿では,質問トークンからテキストや視覚的証拠への注目を収集するマルチモーダル検索ヘッド検出手法を提案する。
マルチモーダル検索ヘッドはスパースであり,本質的であり,因果的に重要であることを示す。
これらの頭部は、視覚的にリッチな文書のランク付けに利用することもできる。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:24:29 GMT)
Learning to Act under Noise: Enhancing Agent Robustness via Noisy Environments [68.0] エージェント学習プロセスに環境欠陥を明示的に組み込んだエージェント学習フレームワークであるNoisyAgentを提案する。
実世界のシナリオでは,ユーザインタラクションにおけるあいまいさと可変性を捉えるユーザノイズと,ツール実行における障害や異常を反映するツールノイズという,2つの主要なインタラクションノイズ源を識別する。
広汎な実験により,本手法は騒音および動的環境下でのエージェントの堅牢性を常に改善することを示した。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:02:00 GMT)
On the Hidden Costs of Counterfactual Knowledge Training in LLM Unlearning [65.6] 対実的チューニング(CFT)は、訓練モデルによるLarge Language Model(LLM)アンラーニングのための有望なパラダイムとして登場した。
このパラダイムは、いくつかの面で他のパラダイムよりも優れています。
本稿では,新しいトレードオフ指標と勾配レベルの診断ツールを備えた拡張ベンチマークRWKU+を紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:34:14 GMT)
Natural Human Motion Recovery by Aligning High-Order Temporal Dynamics from Monocular Videos [65.5] 本稿では,HTD-Refineについて紹介する。HTD-Refineは人体運動回復(HMR)パイプラインを高次時間ダイナミクスを用いて拡張する後処理フレームワークである。
システムの中心となるPVA-Netは,モノクロ映像から直接接合部2次元位置,3次元速度,3次元加速度を推定する時間変換器である。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:38:36 GMT)
Uncertainty-Aware Gaussian Map for Vision-Language Navigation [64.0] Vision-Language Navigation (VLN)は、自然言語の指示に従って3D環境をナビゲートするエージェントを必要とする。
本研究では,3種類の知覚的不確実性(幾何学的,意味的,外見的不確実性)を明示的にモデル化し,エージェントの観察空間に統合し,情報的意思決定を可能にする。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:33:47 GMT)
Fine-Tuning Dynamics of In-Context Factual Recall in Transformers [63.2] インコンテキスト学習 -- プロンプトで与えられた例に基づいてタスクを実行する -- は、大きな言語モデルに現れている。
非コンテキスト学習が事実的知識のリコールをどのように活用するかを研究する。
IC-リコールデータを用いた1層トランスの微調整特性の解析を行った。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:47:26 GMT)
VitaBench 2.0: Evaluating Personalized and Proactive Agents in Long-Term User Interactions [63.1] 我々は、長期ユーザーインタラクションにおけるパーソナライズされたプロアクティブなエージェント動作を評価するためのベンチマークであるVitaBench 2.0を紹介する。
結果は、最先端のモデルでさえ、現実世界のパーソナライゼーションは非常に困難であることを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:07:38 GMT)
Weasel: Out-of-Domain Generalization for Web Agents via Importance-Diversity Data Selection [62.1] Weaselは、Webエージェントのオフライントレーニングのための軌道選択方法である。
トレーニングコストを削減しつつ、ドメイン外のパフォーマンスを改善し、標準的な微調整よりも約9.7-12.5$timesのトレーニングスピードアップを実現しています。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:53:26 GMT)
PEAM: Parametric Embodied Agent Memory through Contrastive Internalization of Experience in Minecraft [61.7] 本稿では,MinecraftのParametric Embodied Agent MemoryフレームワークであるPEAMを紹介する。
PEAMは、エージェントメモリを推論時間検索から経験を通して内部化されたパラメータレジデントスキルに変換する。
PEAMは,長時間のタスクパフォーマンスを改善し,従来と統合されていたスキルの忘れを軽減し,パラメトリック・ヴァーサス・検索効率を向上させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:20:58 GMT)
Can Segmentation Models Understand the World? Towards Proactive Affordance Reasoning via Visual Chain-of-Thought [61.7] 次に、SegWorldを紹介します。このモデルでは、複数のレベルの視覚的連鎖を通して、シーンを理由付けます。
我々はSegWorldを確率論的推論として定式化し、プロアクティブな観察が言語シーンのコンテキストを提供する。
実験では、SegWorldは命令駆動のベースラインをターゲット参照命令と一致させ、インテントレベルのベースラインを大幅に改善する。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:26:52 GMT)
FrontierOR: Benchmarking LLMs' Capacity for Efficient Algorithm Design in Large-Scale Optimization [61.4] 大規模言語モデル(LLM)は、最適化モデリングとソルバコード生成にますます使われている。
既存のベンチマークは、実際のスケールと複雑さよりもはるかに低い、小さな、あるいは単純化された例に限られている。
現実的な大規模最適化問題に対して,LLMに基づく効率的なアルゴリズム設計を評価するための最初のベンチマークとしてFrontierORを紹介した。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:18:52 GMT)
Aligning Few-Step Generative Models by Amortizing Sample-based Variational Inference [60.8] FAV, Few-step Generative Models Alignment via Sample-based Variational Inference。
基準分布に固定された報奨型分布からのサンプリングとしてのFAVキャストアライメント
ロボット操作と画像生成のアライメントの2つの領域でFAVを評価する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:02:49 GMT)
Uni-LaViRA: Language-Vision-Robot Actions Translation for Unified Embodied Navigation [60.1] 身体的なナビゲーションでは、エージェントが言語や視覚的な観察を、実際に見たことのない環境を通して実際のロボットを駆動する空間的な行動の流れにマッピングする必要がある。
統合エージェントアーキテクチャであるUni-LaViRAを4つのタスクファミリと4つの異種実ロボットに拡張する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:52:04 GMT)
OmniGF: A Dual-Branch Vision-Language Framework for Unified Gaze Following [59.5] 拡張性のある多対人視線推論に基礎的な視覚言語モデルを適用する統合視覚言語フレームワークを提案する。
すべての個人をモデル化することにより、OmniGFは正確な空間的視線目標推定、意味的視線予測、複雑な社会的視線推定をシームレスに統合する。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:08:06 GMT)
From Scores to Gibbs Correctors: Accelerating Uniform-Rate Discrete Diffusion Models [58.0] 我々は、Gibs-Accelerated Discrete Diffusion (GADD)と呼ばれる離散拡散モデルのための新しいGibsベースの修正器を提案する。
我々はGADDが$mathcalO(mathrmpolylog (varepsilon-1)$の総合的なサンプリング複雑性を達成し、均一レートの離散拡散モデルに対する拡散に基づくサンプリング者にとって最初のレートとなることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:52:28 GMT)
Extra-Merge: Tracing the Rank-1 Subspace of Model Merging in Language Model Pre-Training [56.3] Extra-Mergeは、GPT-2およびLLaMAファミリーにわたる実験において、標準のマージベースラインを一貫して上回っている。
Pythia-12B下流のタスクに対して一貫したゼロショット精度のゲインを与え、Muon citepjordan2024muonに効果的に一般化する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:48:34 GMT)
Simulation-Informed Diffusion for Decentralized Multi-robot Motion Planning [56.2] マルチロボットモーションプランニングでは、各ロボットが局所的な観測から衝突のない軌道を生成する必要がある。
既存のほとんどのプランナは、ローカル観測の静的スナップショットからトラジェクトリを生成する。
本稿では,制約対応拡散モデルに基づく分散フレームワークであるSimulation-Informed Diffusion (SID)を紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:17:53 GMT)
RoadGIE: Towards A Global-Scale Aerial Benchmark for Generalizable Interactive Road Extraction [54.2] RoadGIEはリモートセンシングにおける道路抽出のための新しい対話的パラダイムを確立する。
WorldRoadSeg-360Kは、これまでで最大かつ最も多様な道路区分データセットである。
RoadGIEは、セグメント化精度とトポロジ的整合性の両方において最先端の性能を達成する。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:20:27 GMT)
Trust Region Q Adjoint Matching [54.1] 本稿では,経路空間KLを予め訓練されたフローポリシーで適応的に制御する安定なオフポリチック微調整アルゴリズムであるTrust Region Q-Adjoint Matching (TRQAM)を紹介する。
TRQAMは、オフラインRLとオフライン-オフラインRLの両方において、常に先行技術を上回っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:28:43 GMT)
Q-GeoMem: Question-Guided Geometric Memory for Video Spatial Reasoning [54.0] ビデオ空間推論のための質問誘導幾何メモリフレームワークを提案する。
カメラ条件の幾何学を 視覚トークンに注入し 2つの相補記憶を維持します
本研究は,評価空間推論モデルにおける最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:26:29 GMT)
ENPMR-Bench: Benchmarking Proactive Memory Retrieval for Emotional Support Agents [53.8] ENPMR-Benchは,情緒的欲求認識型アクティブメモリ検索のためのベンチマークである。
ENPMR-Benchは1,800以上のメモリ拡張ダイアログを含み、感情的なニーズと支援的なメモリタイプの間の構造化マッピングを定義する。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:22:35 GMT)
GE-Sim 2.0: A Roadmap Towards Comprehensive Closed-loop Video World Simulators for Robotic Manipulation [53.7] 本稿では,ロボット操作のためのクローズドループビデオワールドシミュレータGE-Sim 2.0(Genie Envisioner World Simulator 2.0)を紹介する。
Genie Envisionerのアクションコンディション付きビデオ生成フレームワークをベースにGE-Sim 2.0は、何千時間もの現実世界のロボットデータに基づいて再訓練されている。
ビデオシミュレーションからポリシー学習まで,3つの新しいモジュールがループを閉じている。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:23:05 GMT)
Adversarial Dual On-Policy Distillation from Expressive Flow-based Teacher [53.6] フローマッチングの教師は、デモから学び、軽量の学生と共同で訓練される。
教師は学生のロールアウトに2つの補完的な信号を提供します。
アクションチャネルは、学生が訪問する州で密集したローカルターゲットを提供し、搾取を安定化させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:38:03 GMT)
Learn from your own latents and not from tokens: A sample-complexity theory [53.6] 本研究では,関連するビューやマスキング領域の潜在表現を予測するために訓練されたネットワークについて検討する。
潜在予測は、対数的要因まで、多くのサンプルを$L$で表すことでこれを達成できることを示す。
これは、H-JEPAのような明示的な積み重ねがほとんど冗長であることを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:16:42 GMT)
Leveraging Text-to-Image Diffusion Models for Unsupervised Visual Object Tracking [53.1] 教師なしの視覚的オブジェクト追跡は、地味なアノテーションをトレーニングすることなく、任意のターゲットをビデオで追従する必要がある難しいタスクである。
我々はテキストから画像への拡散モデルを構築し、事前訓練されたモデルに符号化されたリッチな意味知識を活用する。
我々の方法Diff-Trackingは、初期プロンプト学習者とオンラインプロンプト更新者という2つの主要コンポーネントから構成されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:26:56 GMT)
HydraPrompt: An Adaptive and Asymmetric Framework of Vision-Language Models for Synthetic Image Detection [52.1] 本稿では,カテゴリ中心を微粒な画像の手がかりと整合させて調整する非対称なプロンプトフレームワークを提案する。
具体的には、一貫した代表パターンをキャプチャする一組のプロンプトを導入し、実際のコンテンツの統一アンカーとして機能する。
2)偽のカテゴリでは,サンプル適応型プロンプトを構築し,異なるサンプルから多様な手がかりを抽出し,偽画像の変動を適応的にモデル化する。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:20:18 GMT)
HumanoidMimicGen: Data Generation for Loco-Manipulation via Whole-Body Planning [52.0] 我々はHumanoid MimicGenについて述べる。
本手法は,少数の実演から新しい状態へ,接触に富んだ全身スキルを適応させる。
我々は、HumanoidMimicGenが生成したデータと協調してトレーニングされた全身ビズモータポリシーが、実世界のデータでのみトレーニングされたものよりも20%優れていたことを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:57:11 GMT)
Xiaomi Auto World Model: A Joint World Model Integrating Reconstruction and Generation for Autonomous Driving [51.9] 本報告では,世界モデルの自律運転における2つのコア機能に対処する統合技術システムを提案する。
世界表現のために,スパースシーンクエリによって駆動されるフィードフォワード再構築アーキテクチャであるWorldRecを提案する。
次世代に向けて,両方向性事前学習のための2段階のトレーニングフレームワークWorldGenを提案し,それに続いて因果微調整を行う。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:32:12 GMT)
The 2nd EReL@MIR Workshop on Efficient Representation Learning for Multimodal Information Retrieval [51.8] EReL@MIRは、新しいソリューション、オープン課題、基礎モデル時代の表現学習のための新しい効率指標とベンチマークについて議論するために、学術と産業の研究者を集結させることを目的としている。
我々はMM 2026でEReL@MIRワークショップを開催することを提案し、学界や業界からの研究者を集めて、新しいソリューション、オープン課題、基礎モデル時代の表現学習のための新しい効率指標とベンチマークについて議論する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:31:48 GMT)
Generating Logically Consistent Synthetic Supply Chain Data with LLM-Driven Knowledge Graph Reasoning [51.8] 本稿では,論理的に一貫した合成サプライチェーンデータ生成のための知識グラフ誘導フレームワークであるtextbftextitTabKGを紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:41:37 GMT)
Receipt Replay OOD: A Small Benchmark for Screen Replay Detection Under Domain Shift [51.6] 本稿では,画面リプレイ検出のためのベンチマークであるReceipt Replay OODを紹介する。
クロスドメイン条件下での文書再生検出モデルの評価を行い、ドメインシフトが一般化性能に与える影響を実証する。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:15:33 GMT)
Hidden-State Privacy Has an Empty Middle [51.6] すべてのフルランクガウス解放を$O(1)$ Fisher utility で表すと、マハラノビス信号が隠れた幅で直線的に成長する方向を認める。
スクラッチからトレーニングされたスプリットメモリトランスフォーマーは、[20, 33]$90MでG_mathrmMahに達し、固定言語損失ペナルティにおいて、30Mから1Bまでの同じ予算のGPTベースラインに対して6ドル~24ドルという優位性を維持する。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:25:09 GMT)
UserHarness: Harnessing User Minds for Stronger Agent Theory-of-Mind [51.5] UserHarnessは、明示的なユーザ・ミンドの再構築として、理論・オブ・ミンド(ToM)の推論を再設計するシンプルなフレームワークである。
ユーザーの精神状態、外部環境との関係、およびそれに続く行為を分解し、エージェントがユーザーの観察、信念、意図、行動を追跡することを可能にする。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:45:45 GMT)
Anticipate and Learn: Unleashing Idle-Time Compute in Proactive Agents [51.5] ProActは、アイドルタイム計算を利用して、今後のユーザニーズを予測し、満たすプロアクティブエージェントアーキテクチャである。
進化する対話履歴を永続記憶とともに解析することにより、ProActは今後のニーズを予測し、情報を反復的に取得する。
MemBenchの評価では、ProActが最先端の反射精度を達成し、持続的で堅牢な性能を裏付けている。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:49:24 GMT)
Global Structure-from-Motion Meets Feedforward Reconstruction [50.7] Structure-from-Motionはコンピュータビジョンにおける中心的な課題である。
近年のフィードフォワード3次元再構成の進歩は,従来のSfM法における持続的故障の克服に大きく貢献している。
そこで我々は,古典的手法とフィードフォワード手法のそれぞれの長所を組み合わせることで,新しいStructure-from-Motionパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:05:29 GMT)
Near-Optimal Regret in Adversarial Kernel Bandits [50.7] 本稿では,各ラウンドにおける損失が任意の有界要素によって誘導される逆カーネルバンドイット問題について検討する。
我々の主な結果は、$widetildeObig(sqrtT, d_*(),log|X|big)$, ここでは$d_*()$は有効次元の広く解釈された概念である。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:10:24 GMT)
Guiding LLM Post-training Data Engineering with Model Internals from Sparse Autoencoders [49.9] トレーニング後のデータエンジニアリングは外部信号に大きく依存しており、モデル内部にある豊富な固有信号を無視している。
強化学習のためのデータエンジニアリングフレームワークSAERLを提案する。
Sparse Autoencoder(SAE)によって抽出されたモデル内部を使用して、多様性、難易度、品質の3つの固有のデータ特性をモデル化する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:55:59 GMT)
Gemini Embedding 2: A Native Multimodal Embedding Model from Gemini [49.7] 本稿では,映像,音声,画像,テキストのモダリティを統一表現空間に埋め込み可能な,ネイティブなマルチモーダル埋め込みモデルであるGemini Embedding 2を紹介する。
マルチタスク・マルチステージ・トレーニング・セットアップにおける大規模コントラスト学習の適用により,キー埋め込みベンチマークの最先端性能を実現する。
MSCOCOでは62.9 R@1、Vatexでは68.8 NDCG@10、MTEB多言語では69.9、MTEB Codeでは84.0)、特殊モデルでは84.0である。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:07:55 GMT)
ReverseMath: Answer Inversion for Scalable and Verifiable Mathematical Problem Generation [49.3] ReverseMathは,解の反転によって新しい数学問題を生成する手法である。
トレーニングのために、ReverseMathは、強化学習のためのデータ拡張として、自動的にラベル付けされた逆問題を提供します。
実験により、ReverseMath生成データを含むと、複数のベンチマークで数学的推論性能が向上することが示された。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:32:47 GMT)
Large Language Model-Powered Query-Driven Event Timeline Summarization in Industrial Search [49.0] 本稿では、Baidu Search上にデプロイされた実運用システムであるQDET(Query-Driven Event Timeline Summarization)を紹介する。
QDETは、毎日取得された数百万のドキュメントによって形成されたノイズの多い候補セットから、クエリに密接に関連するサブイベントを特定し、整理する。
Baidu SearchのオンラインA/Bテストでは、現実世界の有効性が検証され、CTRが5.5%改善し、居住時間が4.6%長く、4.4%深かった。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:16:27 GMT)
SCENT: Aligning Mass Spectra with Molecular Structure for Olfactory Perception [49.0] 直接電子イオン化質量分析法(EI-MS)を嗅覚予測のための代替入力モードとして検討する。
我々は、EI-MS表現と予め訓練された化学構造埋め込みを整合させるマルチモーダルコントラスト学習フレームワークであるSpectrum-to-Chemical EmbeddingalignedmeNT(SCENT)を寄贈する。
マルチラベルの匂い記述子予測タスクでは、SCENTはMSのみのベースラインを著しく上回り、構造ベースモデルに匹敵する嗅覚性能を達成する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:28:57 GMT)
PersLitEval: Fine-grained Benchmark and Evaluation of LLMs on Persian Literature Questions [48.7] PersLitEvalは8つのきめ細かいカテゴリにわたる4,514のペルシア文学の多重選択質問のベンチマークである。
課題の難易度を3段階に分けて,カテゴリーレベルの相違が顕著であることを示す。
エラー解析では、意味的理解のギャップ、形式的言語的知識のギャップ、カウント/列挙エラーの3つの障害モードを識別する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:34:19 GMT)
Attribute-Based Diagnosis of LLM Alignment with Hate Speech Annotations [48.7] ヘイトスピーチアノテーションはコストが高く、主観的で、アノテータの意見の相違がちである。
大規模言語モデル(LLM)が人間の判断とどのように一致しているかを分析する。
本研究では, ヘイトスピーチコーパスから連続ヘイトスピーチスコアを再構成する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:44:48 GMT)
3D Gaussian Map with Open-Set Semantic Grouping for Vision-Language Navigation [48.6] 視覚言語ナビゲーション(VLN)は、自然言語命令に基づいて複雑な3D環境を横断するエージェントを必要とする。
この研究は、環境を微分可能な3次元ガウス写像の集合として表す3次元ガウス写像を提案する。
Egocentric Scene Mapは、疎い擬似ライダー点雲から3Dガウシアンを初期化することによって、オンラインで構築されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:25:49 GMT)
Signal-to-Noise Ratio and Sample Size Govern Representational Alignment in Neural Networks [48.6] 我々は、ノイズプロセスの独立実現によるトレーニングセットを用いて、回帰および分類タスクにおけるネットワークのアンサンブルを訓練する。
信号対雑音比(SNR)とトレーニングサンプルサイズがアライメントに影響を及ぼすことを示す。
線形および非線形ネットワーク全体、回帰および分類タスク、および合成および実世界のデータの両方において、アライメントがSNRと単調に変化することを一貫して観察する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:58:48 GMT)
The Stability of Singular Distribution: A Spectral Perspective on the Two-Phase Dynamics of Language Model Pre-training [48.4] そこで我々は, スペクトル分布の安定性 (SoSD) を推定し, そこではトレース正規化特異値スペクトルが早期に安定化する。
我々は,SoSDと緩やかな周期の同期が多種多様なアーキテクチャで広く観測されていることを実証した。
我々は、WSDやMuonのような戦略をさらに解釈し、SOSDスケールを変調し、効率的な事前学習ダイナミクスを理解するためのスペクトルレンズを提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:03:24 GMT)
Helicase: Uncertainty-Guided Supply Chain Knowledge Graph Construction with Autonomous Multi-Agent LLMs [48.1] textitHelicaseは、不確実性誘導サプライチェーン知識グラフ構築のための自律型マルチエージェントシステムである。
高レベルのサプライチェーンクエリを実行可能な調査計画に分解し、特別なWeb検索、推論、コーディングエージェントをコーディネートする。
その3層不確実性フレームワークは、動作、軌道、記憶層の不確実性を追跡し、構造的推論とキャリブレーションされた信頼性評価の両方を可能にする。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:53:00 GMT)
Verilog-Evolve: Feedback-Driven and Skill-Evolving Verilog Generation [48.0] We present Verilog-Evolve, a feedback-driven framework for Versioned Verilog refinement and cross-session skills evolution。
各タスクに対して、Verilog-Evolveは様々なマイナー候補を生成し、機能シミュレーション、Yosys合成、ABCタイミングプロキシ、オプションGEMMメトリクスから実行可能なフィードバックで評価する。
タスク全体を改善するために、システムはモジュラースキルガイダンスを維持し、タスクとフィードバックコンテキストに従ってスキルを検索し、ログされた履歴から候補スキルを進化させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:21:32 GMT)
Clinically-Grounded Counterfactual Reasoning for Medical Video Diagnosis [47.6] この研究は、臨床診断思考を模倣する対実的推論フレームワークであるMedVCRを導入している。
MedVCRは3つの構成要素から構成されている。
これは、完全に監督された(例えば、大腸内視鏡)と弱監督された(例えば、大腸内視鏡)ビデオ診断設定の両方で評価され、パフォーマンスは2.6%-10.2%向上した。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:46:15 GMT)
Counteraction-Aware Multi-Teacher On-Policy Distillation for General Capability Recovery with Domain Preservation [47.1] 本稿では,簡単に利用できるプロキシ・ジェネラル・プロンプトを用いて,汎用性回復について検討する。
対作用を考慮した多教師オンポリシィ蒸留(CaMOPD)を提案する。
CaMOPDは、一般的なリカバリ専用のアップデートを提供し、定期的にドメインプロンプトをレビューし、平均的なトークンレベルの教師と学生の対数確率ギャップを持つサンプルを選択して、修正信号を集中させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:52:51 GMT)
DGLD: Domain-Gated Latent Diffusion for the Discovery of Novel Energetic Materials [47.0] Domain-Gated Latent Diffusion (DGLD)は、訓練時のラベル品質の高いゲートであり、サンプル時のマルチタスクスコアモデルガイダンスであり、第一原理DFT監査で終わる4段階の化学価関数である。
ヘッドライン化合物である3,4,5-トリニトロ-1,2-イソキサゾール(L1)は、rho_"cal" =2.09 g/cm3とD_"K-J,cal" =8.25 km/sに到達し、全ての65980のトレーニング分子と構造的に異なる。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:43:45 GMT)
UnityMAS-O: A General RL Optimization Framework for LLM-Based Multi-Agent Systems [46.5] LLMに基づくマルチエージェントシステムのための汎用RL最適化フレームワークUnityMAS-Oを提案する。
UnityMAS-Oは、単一応答やポリシーの軌道ではなく、完全なランタイムを最適化単位として扱う。
UnityMAS-Oは多様なマルチエージェントシステムからトレーニング可能なマルチエージェントRLシステムへ変換するための再利用可能な基板として機能することを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:30:03 GMT)
LiveK12Bench: Have Large Multimodal Models Truly Conquered High School-level Examinations? [46.4] 現実的な検査シナリオにおけるLMMの推論能力を評価するために設計された,動的で全体論的,多分野のベンチマークであるLiveK12Benchを紹介する。
LiveK12Benchは、数学、物理学、化学、生物学にまたがる2K以上の検証済みの質問で構成されている。
1)データ漏洩を軽減するために最新の検査論文を継続的に取り込み解析する自動パイプライン、2)正確かつ効率的な推論パスでエンドツーエンドの試験を自律的に完了する能力を評価する新しいモックエクサムの評価スキームを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:50:35 GMT)
The Strongest Teacher Is Not Always the Best Teacher: Student-Centric Answer Selection [46.4] SCAS(Student-Centric Answer Sampling)は、学生中心の学習コストの推定に基づいて、教師が作成した回答から選択するフレームワークである。
30の教師モデル、6人の生徒ベースモデル、8つのタスクにわたる実験は、SCASが生徒のパフォーマンスを継続的に改善していることを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:30:17 GMT)
PAC Learning with Bandit Feedback: Sharp Sample Complexity in the Realizable Setting [46.1] 本研究では,マルチクラスPAC学習における帯域幅フィードバックによる課題について検討する。
このフレームワークでは、インスタンススペース$mathcalX$とラベルスペース$mathcalY$に未知のデータ分散があります。
我々は、この問題の最適サンプルの一般的な特徴を与え、すべての概念クラスを複雑さまで鋭くする。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:08:44 GMT)
Automated Benchmark Auditing for AI Agents and Large Language Models [46.0] Auto Benchmark Audit (ABA)は、個々のベンチマークタスクを体系的に監査するエージェントフレームワークである。
私たちは、9つのドメインで合計168のベンチマークで、Frontier LLMベンチマークと以前のNeurIPSパブリッシュのコレクションでABAを実行しています。
ABAは、不明瞭なタスク設計、実行環境の矛盾、そして、評価されたタスクの25.7%以上において、誤った根拠の真実を含む重要な問題を特定する。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:39:24 GMT)
$R^3$: 3D Reconstruction via Relative Regression [45.7] R3$は、フルコンテキストのオフライン再構築と因果的、バウンドメモリストリーミングの両方をサポートする。
オフラインとストリーミングの両方の設定における評価は、我々の相対的なメカニズムの有効性を検証する。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:03:38 GMT)
FinHarness: An Inline Lifecycle Safety Harness for Finance LLM Agents [45.7] FinHarnessはファイナンスエージェントを3つのコンポーネントでエンドツーエンドにラップする。
火災危険因子は元被疑者証拠として入力されたエージェントに再注入され、エージェントは拒否、再計画、承認を行うことができる。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:41:01 GMT)
Tail-Aware HiFloat4: W4A4 Post-Training Quantization for Wan2.2 [45.3] 本稿では,低ビットテキスト・ビデオ生成量子化問題に対する提案であるTail-Aware HiFloat4について述べる。
We Quantize the main linear layer in both Wan2.2 transformer module with W4A4 HiFloat4 fake Quantization。
この設計は、ランタイムのHiFloat4演算とサンプリングパイプラインを変更せずに、稀な外れ値のキャリブレーションの影響を低減する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:04:22 GMT)
Attenuation-Resilient Alternating Optimization for Laparoscopic Liver Landmark Detection [45.1] 腹腔鏡下肝手術において,肝表面のランドマーク検出は解剖学的指導の必須条件である。
実際には、未露出領域における照明減衰と、ピクセルワイズ局在化と連続曲線幾何学の間の構造的ミスマッチという2つの広範囲にわたる課題のために、信頼できないままである。
A2ONetは、肝臓のロバストなランドマーク検出のための減衰-弾性交互最適化ネットワークである。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:06:10 GMT)
Gaussian-Voxel Duet: A Dual-Scaffolding Hybrid Representation for Fast and Accurate Monocular Surface Reconstruction [44.8] 3Dガウススプラッティングは、新規なビュー合成において顕著な成功を収めた。
しかし, 高速かつ高忠実な3次元再構成の追求は, 幾何精度と最適化効率のトレードオフによって長年拘束されてきた。
本稿では,足場アンコール型ガウシアンを共同最適化したスパース・ボクセル・足場に接続することで,よりよいトレードオフを図ろうとする。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:53:47 GMT)
EmoDistill: Offline Emotion Skill Distillation for Language Model Agents in Adversarial Negotiation [44.5] 言語モデルエージェントに感情交渉スキルを蒸留するオフラインフレームワークである textbfEmoDistill を導入する。
EmoDistillは感情戦略を感情選択と感情表現に分解する。
4つの感情に敏感なネゴシエーションドメインで、EmoDistillフレームワークの下でトレーニングされたSLMポリシーが最も有効である。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:54:53 GMT)
On the GitHub Actions Language: Usage, Evolution, and Workflow Reliability [44.3] この記事では、GitHub Actions言語の採用と進化がワークフローの信頼性と保守性にどのように影響するかを実証的に検討する。
49K GitHubリポジトリから260Kを定量的に分析して、実際にどのように使用されているか、そして、その使用が2019年7月から2025年8月までどのように進化してきたかを理解する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:43:14 GMT)
OmniInteract: Benchmarking Real-World Streaming Interaction for Real-Time Omnimodal Assistants [43.3] 音声-視覚的ストリームに対するネイティブ推論によって評価されたリアルタイム全言語モデルのストリーミングベンチマーク。
本研究では,対話型品質タイムラインF1,割り込み診断スイート,368の1QnAスロットを用いて,応答の正しさ,タイミング,不正出力の割り込み,コンテキスト継続性を評価した。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:49:47 GMT)
Reasoning Depth and Environment Complexity: A Controlled Study of RLVR Data Allocation across Logical Reasoning Tasks [43.3] 検証可能な報酬(RLVR)による強化学習は、訓練後の推論モデルの中心となっている。
我々は2次元の推論空間を特徴づける。
実世界の推論の核となる4つの能力について考察する: 帰納的状態追跡、隠された事象や事実の帰納的回復、帰納的規則誘導、類推的伝達である。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:28:08 GMT)
Reliable Extraction of Clinical Follow-Up Instructions: A Hybrid Neural-Symbolic Pipeline [43.0] 我々は,ニューラルシンボリックなハイブリッドパイプラインを直接生成に対して試験する。
本研究は,2000点の合成外用コーパスについて検討した。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:14:33 GMT)
SL-BiLEM: Structured Learnable Behavior-in-the-Loop Epidemic Modeling for Forecasting and Policy Evaluation [42.6] エピデミック予測は、人間の行動が病気の拡散に動的に反応する、という根本的な課題に直面している。
頑健な外挿のための正則化として物理的制約を利用するtextbfSL-BiLEM(Structured Learnable Behavior-in-the-Loop Epidemic Model)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:46:04 GMT)
Granuscore: A Reference-Free Measure of Granularity for Text Analysis and Question Answering [42.3] グラナスコア(Granuscore)は、階層的な埋め込み空間の構造特性を利用する、参照なしの粒度の尺度である。
また,全領域にわたって,Granuscoreは文長を超えた文特異性の非線形変動を説明できることを示した。
Granuscoreを4つの質問回答ベンチマークに適用し、質問やゴールド回答、モデルアウトプットの粒度の違いを分析する。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:59:04 GMT)
Unicorn: Scaling High-Dimensional Time Series Forecasting via Universal Correlation Modeling [42.3] Unicornはスケーラブルでマルチデータセットで高次元の時系列を事前トレーニングするためのフレームワークである。
UniCorNは、さまざまな次元とセマンティクスを持つドメイン間で転送される、アイデンティティに依存しない再利用可能な相互作用パターンを学ぶ。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:17:09 GMT)
Rethinking Weak Supervision in Anomaly Detection: A Comprehensive Benchmark [42.0] 本稿では、WSADBenchについて紹介する。WSADBenchは、異なる弱い教師付きシナリオで評価を統一する最初のベンチマークである。
700K以上の実験に基づいて、WSADBenchは4つの重要な洞察を明らかにしている。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:50:58 GMT)
TED: Related Party Transaction guided Tax Evasion Detection on Heterogeneous Graph [41.9] 本稿では,脱税検知の性能向上を目的とした新しいグラフニューラルネットワークモデルを提案する。
具体的には、低レベルノイズ情報をフィルタするために、不均一で複雑なパーティトランザクショングループを使用します。
本手法を税務署の実際のリスク管理システムに適用し、2つの人間ラベルの実世界の税データセット上で評価する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:09:37 GMT)
Gumbel Machine: Counterfactual Student Writing Generation via Gumbel Noise Steering [41.3] 理想的な学習デモは、学生作品の反実的なバージョンであり、改善されたバージョンは、まだ彼ら自身のものと似ている。
LLM(Large Language Models)を用いた対実テキストの自動生成のアプローチは、実用的なアプリケーションへの変換が難しいドメイン固有システムをもたらす。
提案するGumbel Machineは,LLM命令追従機能を活用しながら,参照ファクトテキストとの類似性を奨励する,フレキシブルでモジュラーな手法である。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:27:07 GMT)
Focal Reward: Balanced Reinforcement Learning under Rubric-Based Rewards [41.2] 本稿では,ルーリック型報酬による強化学習の訓練のバランスをとるための新しい目的であるFocal Rewardを提案する。
3つのモデルスケールと6つのベンチマーク実験により、Focal Reward法が最強の静的アグリゲーションベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:50:46 GMT)
ControlLight: Towards Controllable, Consistent, and Generalizable Low-Light Enhancement [41.2] ControlLightは、低照度拡張のためのコントロール可能で一貫性があり、一般化可能なフレームワークである。
ControlLightを使えば、ユーザーは満足のいく改善結果のために、現実世界の劣化した低照度画像を編集できる。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:12:18 GMT)
Cross-scale Aligned Supervision for Training GANs [41.1] 我々は、標準的なスケールワイド敵監督が適切な粗大な階層を構築していないことを論じる。
マルチスケール逆数生成のためのクロススケールアライメント変換器であるCATを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:01:11 GMT)
Escape the Language Prior: Mitigating Late-Stage Modality Collapse in Audio Reasoning via Modality-Aware Policy Optimization [40.9] 両ブランチ強化学習フレームワークであるMAPO(Modality-Aware Policy Optimization)を紹介する。
まず、MAPOはモダリティクリティカルトークンのポリシー勾配を動的に集中させる。
第二に、モデルの内部の注意分布にターゲットを絞った時間スケールのペナルティを適用する、補助的な注意損失ブランチを統合する。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:34:03 GMT)
WINDQuant: Weight-Informed Neural Decision-Making for Global Mixed-Precision LLM Quantization [40.7] WINDQuantは超低ビットLLM量子化のための強化学習に基づくアロケーションコントローラである。
グローバルストレージ予算の下で、ビット幅と量子化処理をきめ細かいカラムチャンクに割り当てる方法を学ぶ。
LLaMAモデルを用いた実験により、WINDQuantは超低ビット設定で競合性能を達成することが示された。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:46:13 GMT)
Less is More: Early Stopping Rollout for On-Policy Distillation [39.4] 早期停止ロールアウト(Early Stopping Rollout, ESR)は, ロールアウト生成を第1応答トークンに限定した簡易かつ効果的な蒸留戦略である。
その結果,ESRはモデルサイズ,家族,タスク,トレーニング体制全体にわたって,フルロールアウトのOPD性能を上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:49:37 GMT)
BEAT: Rhythm-Elastic Alignment for Agentic Music-guided Movie Trailer Generation [39.3] 映画トレーラーにおける音楽と視覚のアライメントに対処するフレームワークBEATを紹介する。
BEAT は Sinkhorn-regularized two-stage learning で訓練されたコンパクトな音楽-視覚アライメントエンコーダ MuVA と、エネルギー適応型動的プログラミングアルゴリズム Bar-DP で構成されている。
BEATはショットセレクション、オーダリング、知覚的品質で最先端のパフォーマンスを達成し、完全に構成されたトレーラーをエンドツーエンドで生産する。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:18:13 GMT)
Transfer Learning using 66 Diseases for Disease Forecasting Applications [39.1] 66の感染症といくつかのデータストリームにまたがるデータに基づいて、機械学習モデルをトレーニングします。
他のデータストリームを組み込むことで,ほとんどの場合,予測が向上することがわかった。
この研究の主な貢献は、感染症予測コミュニティが使用するための、公開可能なデータのデータベースのコンパイルである。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:45:21 GMT)
CiteCheck: Retrieval-Grounded Detection of LLM Citation Hallucinations in Scientific Text [39.1] 我々は、引用幻覚検出のためのフレームワークであるCiteCheckを紹介する。
CiteCheckは外部の学術文献から候補者の出版物を検索し、構造化LCM検証器を用いて抽出された候補と比較し、検証器のスコアをExact、Minor、Majorの3つのラベルにマップする。
ホールドアウトテストセットでは、CiteCheck は 88.7マクロF1 と 88.9% の精度を実現し、GPT、Claude、Gemini のベースラインを上回り、Web 検索や少数ショットの亜種を含む。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:20:40 GMT)
From Contrast to Consistency: Rethinking Event-based Continuous-Time Optical Flow Estimation [39.0] イベントベースのカメラは、明るさの変化を非同期に捉え、微妙な時間的精度で動きをモデル化するユニークな機会を提供する。
時空間構造整合性(STSC)の原理に基づく連続時間光フロー推定のためのハイブリッド制御フレームワークを提案する。
提案手法は,学習パラダイムの有効性を実証し,連続時間および標準光フロー推定における最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:05:23 GMT)
Aperiodic and Low-Frequency Spectral Bias in Reconstruction based EEG Foundation Models [38.9] 大規模無ラベル脳波データに基づいて事前学習された脳波基礎モデルは、一般化可能な脳波表現を学習するための有望な方向として現れてきた。
脳波信号の慣用的スペクトル構造と再構成に基づくプレテキストタスクの基本的なミスマッチに起因して、この欠点を機械論的に説明する。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:40:36 GMT)
Measuring Prediction Uncertainty in Neural Cellular Automata [38.6] NCAをベースとした医用画像セグメンテーションにおける不確実性評価について検討した。
提案手法は,NCAを,収束性アトラクタが確実な予測に対応する動的システムとみなすことによって動機づけられた。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:05:03 GMT)
JuICE: A Benchmark for Evaluating LLM-Judge in Identifying Cultural Errors [38.5] 長文の言語応答における文化的・言語的誤りに関する,7,470のスパンレベルアノテーションのデータセットであるJuICEを提示する。
最強のLDMジャッジでさえ、誤ったスパン検出タスクにおいてF1の0.52しか達成していない。
文化的評価は, 文化的意味の深さと位置を考慮に入れた枠組みに向けて, 表面レベルの検出を超えて, 頑健な文化的評価を行なわなければならないことが示唆された。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:45:21 GMT)
StreamProfileBench: A Benchmark for Fine-Grained User Profile Inference in Real-World Streaming Scenarios [38.4] 本稿では,ストリーミングユーザの詳細なプロファイリングのベンチマークであるStreamProfileBenchを紹介する。
5つの多様なプラットフォームにまたがる7,000以上の実際のユーザから12万以上のポストの、非常に正確なデータセットをキュレートします。
ユーザの関心の時間的相関を利用して,新しいアノテーションのない評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:38:47 GMT)
QUACK: Questioning, Understanding, and Auditing Communicated Knowledge in Multimodal Social Deduction Agents [38.1] QUACKはマルチモーダルな社会的推論におけるエージェント言語の基礎を監査するための評価フレームワークである。
エンジンログから各エージェントの基幹軌道を再構築し、それに対するすべての議論のクレームをチェックする。
最強のエージェントでさえ、検証可能な空間的主張の15.1%を幻覚させ、根拠のない証拠なしに告発の半数以上を犯している。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:19:08 GMT)
Re-M3Dr: Rebalanced MultiModal Mean Deviation Regression [37.4] この医療画像におけるマルチモーダル融合は, 単潮モデルより悪い結果が得られた。
本稿では,新しいマルチモーダル回帰フレームワークであるRe-M3Dr(Re-M3Dr)を提案する。
公立および民間の臨床データセットを用いた実験の結果,SOTAマルチモーダル学習法と比較して平均29%のMSE低下率を示した。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:57:28 GMT)
Quality Without Usefulness: LLM-Generated XAI Narratives as Trust Heuristics Rather Than Decision Aids [37.0] 自然言語説明法 (NLE) は, 自己報告された信頼度を増大させながら, 5つのタスクのいずれかのタスク精度を向上しないことがわかった。
プラズビック制御は、この自信がコンテンツではなくテキストの存在によって引き起こされることを示している。
これらの知見をQOL(Quality-Usefulness Gap)として特徴付け、XAI-to-NLEパイプラインの評価は、テキスト品質の指標を超えて、ダウンストリームタスクのパフォーマンスにまで拡張する必要がある、と論じる。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:39:16 GMT)
Respecting Modality Gap in Post-hoc Out-of-distribution Detection with Pre-trained Vision-Language Models [36.8] アウト・オブ・ディストリビューション(OOD)検出は、機械学習モデルの信頼性を高めるための一般的なテクニックとして登場した。
事前学習型視覚言語モデル(VLM)の最近の進歩により、IDトレーニングデータにアクセスせずに、ゼロショットOOD検出が可能になった。
本稿では,視覚的特徴空間におけるクラスプロトタイプを直接学習するオンライン擬似教師付きフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:46:23 GMT)
AndroidDaily: A Verifiable Benchmark for Mobile GUI Agents on Real-World Closed-Source Applications [36.7] 94の高周波Androidアプリケーションにまたがる350の日常的タスクからなる大規模ベンチマークであるAndroidDailyを紹介した。
本稿では,3段階の外部ガイドラインに基づくプロセス認識評価システムGRADEを提案する。
GRADEはステップレベルの診断結果を生成し、長い水平なオープンエンドのモバイルインタラクションを、隠れた内部状態に頼ることなく検証可能な評価に変換する。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:19:42 GMT)
The Fault in Our Drafts: Vulnerabilities in RPKI Specification and Software [36.2] 本稿では,RPKI Requests for Comments(RFC)の欠陥と,実装および実世界のデプロイにおける脆弱性の因果関係を包括的に解析する。
RPKI仕様の大規模かつインパクト駆動的な評価を行う。
我々は、以前に文書化されていない検証動作の不整合を発見し、RFCの欠陥に23を直接トレースし、CVEに割り当てられた2つの新しい脆弱性を特定した。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:11:22 GMT)
ExTax: Explainable Disinformation Detection via Persuasion, Emotion, and Narrative Role Taxonomies [35.7] textbfExTax は分類学的に整合した,説明可能な偽情報検出のためのフレームワークである。
ExTaxは説得力のある修辞、感情的な操作、物語の役割を17次元の分類空間に統合する。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:00:00 GMT)
The Age of Curiosity Meets the Age of AI: Benchmarking Child Safety in Large Language Models [35.6] 7~11歳の子ども向け大規模言語モデルの安全性を評価するベンチマークであるKIDBenchを紹介する。
KIDBenchには10のカテゴリにわたる現実的な子クエリがあり、シングルターンプロンプトとマルチターンの子-アクターシミュレーションがある。
KIDGuardLlamaは子供指向の反応モデルであり、KIDBenchがより安全な子供向けAIをどのようにサポートするかを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:53:31 GMT)
GlobalDentBench: A Multinational Benchmark for Evaluating LLM Clinical Reasoning in Dentistry with Expert Calibration [35.4] 大規模言語モデル(LLMs)は医学の変革的な可能性を持っているが、実際の臨床シナリオにおけるそれらの推論の堅牢性や安全性は、特に歯科医学において非常に過小評価されている。
ここでは、88か国と6大陸にまたがる14の歯科専門分野を含む分類を特徴とする、最初の多国籍歯科用ベンチマークであるGlobalDentBenchを紹介する。
ベンチマークは3つのフォーマット(複数選択、短い回答、ケースベースの質問)にまたがる8,978のエキスパート検証された質問で構成され、3つのプログレッシブな推論レベルを評価する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:07:57 GMT)
How Do Document Parsers Break? Auditing Structural Vulnerability in Document Intelligence [35.3] 本稿では,制御された探索,ポリシー駆動型ターゲティング,構造認識診断を分離する軽量な出力レベル監査フレームワークであるProSAを提案する。
ProSAは、構造的アイデンティティが失われる場所、露光障害が発生する場所、そして障害がどのように伝播するかを分析します。
これらの結果はDLA評価をフットプリントに基づくストレステストから構造認識型脆弱性監査へシフトさせる。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:13:58 GMT)
Generalist Graph Anomaly Detection via Prototype-Based Distillation [35.1] 本稿では,初の教師なし汎用GADフレームワークであるProMoSを紹介する。
ラベルなしデータの豊富な正規性をモデル化して異常を検出する。
ProMoSは、凍結した自己教師型グラフニューラルネットワーク(GNN)の教師から学生の混合モデルまで、正規性を蒸留する知識蒸留パラダイムを採用している。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:16:31 GMT)
Mind Your Margin and Boundary: Are Your Distilled Datasets Truly Robust? [34.8] 本稿では,ロバストデータセット蒸留(C$2$R)のためのコントラッシブカリキュラムを提案する。
CIFAR-10/100、Tiny-ImageNet、および複数のImageNet-1Kサブセットに対する6回の攻撃による実験は、C$2$Rが最高のロバストな精度を達成し、以前のロバストDDを平均2.8$%上回ったことを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:39:07 GMT)
Spend Your Rollouts Where It Counts: Rollout Allocation for Group-Based RL Post-Training [34.8] 強化学習は、大規模言語モデルの訓練後において支配的なパラダイムである。
グループベースのポリシー最適化手法は、プロンプト毎に複数のロールアウトから利点を計算する。
Pilot-Commitは、グループベースのRLポストトレーニングのための、予算対応のロールアウトアロケーションフレームワークである。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:41:13 GMT)
On the Robustness of Machine Unlearning for Vision-Language Models [34.6] 視覚言語モデル(VLM)は、学習データから望ましくない情報を記憶し、機械学習への関心が高まっている。
VLMアンラーニングの最初の体系的調査とロバスト性分析を行う。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:14:12 GMT)
HyperSim: A Holistic Sim-To-Real Framework For Robust Robotic Manipulation [34.4] HyperSimは、総合的なフレームワークで、合成データ生成からポリシートレーニング、シームレスな実世界のデプロイまでをカバーしている。
我々は,400件の実際のタスク実行を含む大規模な実証研究を通じて,HyperSimを厳格に検証した。
我々の完全パイプラインは、ACTと_0で、80%と95%の顕著なsim-to-real成功率を達成する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:19:04 GMT)
BAIT: Boundary-Guided Disclosure Escalation via Self-Conditioned Reasoning [34.4] BAITは3段階のジェイルブレイクフレームワークで、内部開示を通じて悪意ある目標にアプローチする。
BAITは、トップクラスの大規模言語モデルにおける強力な攻撃成功率を一貫して達成している。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:51:13 GMT)
Information-theoretic Multimodal Representation Learning for Electrocardiogram Signals [34.3] 心電図(ECG)は、心臓活動の非侵襲的測定として広く用いられ、臨床診断において中心的な役割を果たす。
近年,心電図の信号と診断的意味論を取り入れた臨床報告とが一致しているが,臨床報告は心電図波形の豊富な生理的構造を保たないことが多い。
我々は、情報理論の観点からECG表現学習を定式化し、信号構造を共同で保存し、臨床的意味論を統合する、抽出可能な目的を導出する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:52:57 GMT)
HTMLCure: Turning Browser Experience into State Guided Repair for Interactive HTML [33.9] システムと対話した後にHTMLを評価するブラウザエクスペリエンスフレームワークであるHTMLCureを紹介する。
HTMLCureは現在のページを診断し、状態固有の修復ファミリを選択し、各候補を再度実行し、品質の高いクリアページをSFTにエクスポートする。
リリースされたMiniAppBenchバリデーションスプリットでは平均81.2に達し、生の27B SFTを15.3ポイント改善した。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:22:56 GMT)
From Static Context to Calibrated Interactive RL: Mitigating Distribution Shift in Multi-turn Dialogue with Aligned Simulator [33.6] 研究コミュニティの長年の目標は、高度にインタラクティブなLDMベースの対話エージェントを開発することである。
最近の研究は、固定オフラインログ(Static Context RL)やプロンプトベースのシミュレータ(Interactive RL)を用いたポリシーの最適化に焦点をあてている。
両パラダイムは,文脈分布シフトによって根本的に制限されていることを示す。
本稿では,対話型RLとシミュレータアライメントを結合した統合フレームワークCalibrated Interactive RLを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:25:12 GMT)
FSA-GRPO: Teaching Auditory LLMs to Use Few-shot Demonstrations [33.5] Few-Shot Aware GRPOは、特別に設計された報酬を使用して、数発のデモを活用することを奨励するポストトレーニングレシピである。
本研究では,高出力成人ASRデータのみを用いたトレーニングにより,モデルの汎用的数ショット適応能力が向上することを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:36:07 GMT)
MRT: Masked Region Transformer for Layered Image Generation and Editing at Scale [32.9] 階層化画像生成と編集は、生成したビジュアルコンテンツのレイヤワイドな再利用、編集、合成を可能にする基本的な機能である。
多層透明画像の生成と編集に適した20Bパラメータマスク領域拡散モデル MRT を提案する。
共有マスキング領域拡散フレームワークにおいて,テキスト・ツー・レイヤ,画像・ツー・レイヤ,レイヤ・ツー・レイヤの3つの補完的タスクを統合する。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:16:19 GMT)
MobileMoE: Scaling On-Device Mixture of Experts [32.4] サブビリオンアクティブパラメータを持つデバイス上でのMoE言語モデルであるMobileMoEを提案する。
まず、モバイルメモリと計算制約下でのMoEアーキテクチャを協調的に最適化するデバイス上のMoEスケーリング法を定式化する。
我々は、事前学習、中級訓練、教示微調整、量子化対応トレーニングを含む4段階のレシピでMobileMoEを訓練する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:58:24 GMT)
Trust, Geometry, and Rules: A Credibility-Aware Reinforcement Learning Framework for Safe USV Navigation under Uncertainty [32.3] 本稿では,信頼性を意識した学習,幾何的安全遮蔽,連続ルール認識の埋め込みを組み込んだフレームワークを提案する。
本研究は,直観的不整合に対するトレーニングの堅牢性の向上と衝突回避性の向上,およびベースラインに対するCOLREGのコンプライアンスについて述べる。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:59:43 GMT)
MONA: Muon Optimizer with Nesterov Acceleration for Scalable Language Model Training [32.2] 我々は、Muonの直交化フレームワークを曲率認識加速度でブリッジする加速度項MONAを提案する。
我々はMONAの収束解析を行い、加速項が鋭い最小値からの脱出を可能にすることを示す。
汎用性、数学的推論、コード生成ベンチマークで評価し、MONAがSOTA性能を達成する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:56:20 GMT)
On the evolution of the concept of probability as a mirror of the evolution of reason [31.5] 論文は、進化は単に数学的歴史ではなく、合理性自体の変容であると解釈している。
確率論は、確率のゲームから不確実性の下での推論のための中心的な枠組みへと成長してきた。
ファジィ論理は格付けされた意味と質的な判断のための厳密な言語として表現され、深層学習は強力な予測方法として分析される。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:58:53 GMT)
Recon: Reconstruction-Guided Reasoning Synthesis for User Modeling [30.9] 本稿では、行動再構成を用いて、その予測力による推論トレースをスコアリングするReconを提案する。
モデル間におけるRecon-synthesized reasoning(Recon-synthesized reasoning)の伝達について述べる。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:55:11 GMT)
SkillGrad: Optimizing Agent Skills Like Gradient Descent [30.8] エージェントスキルは、構造化ファイルに再利用可能な手続き的知識を格納することで、特殊なドメインにLLMエージェントを適用するための軽量な方法を提供する。
既存のスキル進化法はしばしば、明示的な定式化なしに反射を通してこれらの欠陥に対処する。
エージェントスキルを最適化するための勾配に着想を得たフレームワークであるSkillGradを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:18:43 GMT)
Integrated squeezed light sources for two-mode entanglement in thin-film lithium niobate [30.6] 単一チップ上の複数の識別不能な圧縮光源は、連続可変量子コンピューティングへの重要なステップである。
薄膜ニオブ酸リチウムプラットフォーム上での2つの分離不能かつ独立に制御可能な光パラメトリックの作製を実証した。
これは、1つのTFLNチップ上で2つの独立に調整可能な圧縮光源のデモであり、連続変数の絡み合いを生成するために使用される。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:03:55 GMT)
OmniMem: Perturbation-aware Memory Compression for Streaming Audio-Visual LLMs [30.5] 我々は,音声視覚大言語モデル(LLM)のためのメモリ効率の高いストリーミングフレームワークであるOmniMemを紹介する。
すべてのトークンを均一に扱う既存の圧縮方法とは異なり、OmniMemはメモリ割り当て戦略を導入している。
OmniMemは、トレーニングなしの強力な圧縮ベースラインを、同じメモリ予算で2~4%の精度で継続的に改善することを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:12:13 GMT)
SparseOpt: Addressing Normalization-induced Gradient Skew in Sparse Training [30.4] 動的スパーストレーニング(DST)手法は、ネットワークトポロジを動的に適応しながら、疎性を維持してニューラルネットワークを訓練する。
本稿では, Batch Normalization (BN) がスパーストレーニングに悪影響を及ぼし, SparseOpt を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:14:19 GMT)
PRISM: A Multi-Dimensional Benchmark for Evaluating LLM Peer Reviewers [30.1] PRISMは,4次元にわたるレビュー品質を評価するベンチマークフレームワークである。
我々は、ICLR、ICML、NeurIPSの階層化されたレビューコーパスにおいて、主要な自動レビュアシステムと人間レビュアをベンチマークする。
単一のシステムは、すべての次元にわたる人間のベースラインのバランスの取れた性能を一度に一致させるものはない。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:06:27 GMT)
GradSentry: Gradient Spectral Entropy for Backdoor Sample Filtering in Large Language Model Fine-Tuning [29.8] 信頼できないデータを持つ微調整された大規模言語モデルは、バックドアアタックにモデルを公開します。
サンプルごとのスペクトルエントロピーに基づくバックドアサンプルフィルタリング法であるGradSentryを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:48:01 GMT)
Can Hallucinations Be Useful? Solving Multi-Hop Questions With SLMs By Chaining System-I/II Reasoning [29.2] 思考優先戦略は必ずしも必要ではない,と我々は主張する。
モデルが最初に質問に素早く答えられるように、認知にインスパイアされたフレームワークを提案する。
提案手法は,複数段階の質問応答ベンチマークにおいて,従来の思考優先経路を踏む先行作業よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:09:27 GMT)
Atom-level Protein Representation Learning Improves Protein Structure Prediction [29.2] TriProRepは、3つのアライメントされた残差レベルのビューを共同でモデル化する構造対応事前学習手法である。
TriProRepは、ジェネレータが破損したビューからオリジナルのトークンを復元する事前トレーニングによって、可視だが間違ったクロスビュー拡張を区別することを学ぶ。
RepSPは構造予測設定におけるタンパク質表現の評価のためのベンチマークである。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:22:42 GMT)
Enabling Extensible Embodied Capabilities with Tools [29.1] エンボディード・インテリジェンス(Embodied Intelligence)は、統一されたパラメータ化されたポリシーの中で知覚、推論、計画、制御を定式化する。
本稿では,異種機能を独立に最適化したツールに分解し,推論時に動的に起動する機能外化手法を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:18:36 GMT)
GeoFaith: A Spatio-Temporal Dual View of Faithful Chain-of-Thought [29.1] 本稿では、潜在幾何学的構造とエントロピー力学を利用して、忠実な推論を診断・実施する枠組みを提案する。
我々は標準ベンチマークでGPT-5より優れた8B忠実度検出器を訓練し、忠実度対応強化学習フレームワークを設計する。
実験により,提案手法は忠実度検出と下流推論の両方において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:54:40 GMT)
ICICLE: Expanding Retrieval with In-Context Documents [29.0] 生成検索(GR)は、パラメトリック知識を用いてクエリを直接ドキュメント識別子(ドクト)にマッピングする。
我々は、パラメトリックメモリとコンテキストが提供する文書とドキュメントのペアの両方に対して、ソース・アウェア・ドシド生成を行う、コンテキスト内インデクシングフレームワークICICLEを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:01:44 GMT)
ORCA: An End-to-End Interactive Copilot for Optimized Root Cause Analysis [29.0] 因果分析は製造業、社会科学、医学など多くの分野において重要な課題である。
本稿では,エンド・ツー・エンド因果解析のコパイロットであるORCAを紹介する。
エージェントを編成してユーザの目標を理解し、最も適切な因果解析ワークフローを通じてそれらをガイドする。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:41:09 GMT)
Chartographer: Counterfactual Chart Generation for Evaluating Vision-Language Models [28.7] Chartographerは、チャートを実行可能なコードにリバースエンジニアリングするフレームワークである。
我々は,視覚言語モデル(VLM)を用いて,変動感度と一般化可能性を評価する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:20:15 GMT)
Tournament-GRPO: Group-Wise Tournament Rewards for Reinforcement Learning in Open-Ended Long-Form Generation [28.6] Tournament-GRPO(トゥルナメント-GRPO)は、ルーリック誘導LLM判定を複数ラウンドのトーナメントを通じて相対報酬に変換するグループワイド報酬フレームワークである。
Deep Research Benchの実験は、Tournament-GRPOが既存の報酬設計ベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:49:19 GMT)
Not All Disagreement Is Learnable: Token Teachability in On-Policy Distillation [28.6] 生のKL不一致が学習価値の粗いプロキシであることを示す。
我々はこの局所的な互換性をトークンの教育可能性として定式化する。
軽量なトークン配置選択法であるTeachability-Aware OPDを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:56:46 GMT)
I2PRef: Image-Driven Point Completion with Iterative Refinement [28.5] Image-to-Point (I2P)モジュールは、単一のRGBイメージから直接完全な点雲を再構成する。
トランスフォーマーベースのポイント・ツー・ポイント(P2P)精製モジュールは、粗いI2P出力を反復的に洗練する。
ShapeNet-ViPCの実験は、最先端の完成性能を示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:12:20 GMT)
Rotation-Invariant Spherical Watermarking via Third-Order SO(3) Representation Coupling [28.5] パノラマ画像の信頼性の高い透かしは、基本的に任意の3次元回転によって挑戦される。
球面信号としてパノラマを定式化し、$SO(3)$表現理論を利用して、証明可能な回転不変記述子を導出する。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:43:40 GMT)
Secure UAV Swarms in Low-Altitude Wireless Networks: Challenges and Solutions [28.4] 本稿では,UAV群を対象としたクラウド・エッジ・エンド協調防衛フレームワークを提案する。
第一に、協調的な知覚スキームは、GPSスプーフィングに抵抗するように設計されている。
次に,信頼度評価を用いた行動駆動型認証手法を開発し,インサイダーの脅威を軽減する。
第3に,UAVネットワークにおけるマルチホップ攻撃の伝播経路をインテリジェントに追跡するために,マルチエージェント攻撃鑑定フレームワークを考案した。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:33:02 GMT)
Triadic Dynamics Aware Diffusion Posterior Sampling for Inverse Problems: Optimizing Guidance and Stochasticity Schedules [28.3] 生成的サンプリングは、イメージングにおける逆問題を解決する主要なパラダイムとして現れてきた。
先行技術は、各またはすべてのコンポーネントの開発方法に重点を置いているが、それらをスケジュールする方法にはあまり注意が向けられていない。
そこで本研究では,スケジューリングにおける3つのコンポーネント間のインタラクションが,性能向上に不可欠である,と論じる。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:27:30 GMT)
Alignment Tampering: How Reinforcement Learning from Human Feedback Is Exploited to Optimize Misaligned Biases [28.2] ヒューマンフィードバックからの強化学習(Reinforcement Learning from Human Feedback, RLHF)は、大規模言語モデルと人間の嗜好を整合させる標準的な手法である。
本研究では,LLMのアライメントが嗜好データセットに影響を及ぼす潜在的な脆弱性であるアライメント・タンパリングを導入する。
提案実験は,キーワードバイアスからプロパガンダ,ブランドプロモーション,楽器的目標探索に至るまで,さまざまなバイアスを呈する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:57:04 GMT)
ICCU: In-Context Continual Unlearning via Pattern-Induced Refusal Rules [28.1] コンテキスト内連続的なアンラーニングフレームワークは、アンラーニングデータセットから読みやすいリファリングルールを誘導する。
ICCUは、実用性を維持しながらターゲットの知識を効果的に抑制し、シーケンシャルな要求をスケールし、パラフレーズとクロスランガルなクエリに対して堅牢である。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:06:56 GMT)
Explicit Critic Guidance for Aligning Diffusion Models [27.7] 拡散後学習のための状態整列型アクター批判フレームワークを提案する。
提案手法は, グループリレーショナルRLとアクタークリティックベースラインを, シングルリワード, マルチリワードベンチマークで連続的に上回っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:20:51 GMT)
Not All Tokens Matter Equally: Dynamic In-context Vector Distillation with Decisive-Token Supervision for Long-form Medical Report Generation [27.7] 隠れ空間の介入へのデモンストレーション効果の蒸留は、完全な微調整に代わる軽量な代替手段を提供する。
既存のマルチモーダル変種は、ほとんどの場合、いくつかのトークンの後に出力が終了するショートフォームタスクで評価される。
本稿では,2つの相補的なメカニズムによる長期レポート生成に対処する冷凍バックボーン蒸留フレームワークであるDIVEを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:46:00 GMT)
Generating Robust Portfolios of Optimization Models using Large Language Models [27.6] 我々は最適化モデルの生成と評価を行う新しい方法を開発した。
ポートフォリオが人間の好みによく適合していることを示す理論的保証を提供する。
範囲最適化モデリングタスクにおける高い性能を示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:30:43 GMT)
Ultra-Reduced-Impact-Encased-Logging (URIEL): propose a new method for selective sustainable logging and post-harvest silvicultural treatment in tropical forest using airborne robotics systems [27.3] 本稿では,熱帯林の新しい伐採手法であるUltra-Reduced-Impact-Encased-Logging (URIEL)を提案する。
URIELは、ロボットとAIの集中的な使用と、ドローンが実施した収穫後のシルビカルチャー処理とを組み合わせたヘリログ技術に基づいている。
本論文の主な結論は, 科学的および技術的成果が十分であるにもかかわらず, ユリエル法の可能性は, 文脈に固有の利害関係者の統合に依存しているということである。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:30:42 GMT)
FineVLA: Fine-Grained Instruction Alignment for Steerable Vision-Language-Action Policies [27.0] FineVLAは、アクションアライメントされたきめ細かいVLA監視のためのオープンフレームワークである。
オープンソースの10のロボットデータセットから85Kタスクにまたがる992,247のトラジェクトリを統一する。
500本のビデオ、10,816件の原子性事実と1,030件のVQA質問のベンチマークがある。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:01:10 GMT)
LATTE: Forecasting Peer Anchored Preference Trajectories for Personalized LLM Generation [26.7] 本稿では、パーソナライゼーションを表すフレームワークであるLATTE(Latent Trajectory Tracking and Extrapolation)を提案する。
LATTEは、検索、要約メモリ、静的潜時プロファイル、差認識潜時プロファイル、ソフトプロンプト圧縮ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:50:45 GMT)
Natural Language Query to Configuration for Retrieval Agents [26.6] We propose *BRANE*, which using LLM to convert each query into workload-specific characteristics。
推論時に**BRANE**は、コストによって罰せられる予測正しさを最大化する構成を選択する。
MuSiQue、BrowseComp-Plus、FinancialBenchの他、**BRANE*は、最高の固定構成の精度を最大89%のコストで一致させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:58:47 GMT)
Uniboost: Global Coordination with Value Alignment for Fair and Efficient Traffic Allocation [26.6] 統一的なトラフィック割り当てフレームワークUniboostを提案する。
Uniboostは抽象モデルスコアを校正し、明示的なビジネス意味論でメトリクスをアンカーする。
複雑な重み付けスキームを分離するために、独立した線形ブースティングパラダイムを採用している。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:22:04 GMT)
Batch Me If You Can: Coverage-guided RPKI Fuzzing at Scale [26.6] AFL++やlibFuzzerのような既存のファズーは、RPKIでは実行毎に単一の自己完結型入力を仮定するので、うまく機能しない。
既存のファズーは、この複雑さに対処できず、マルチオブジェクトリポジトリにおける正確なカバレッジ属性の能力が欠如している。
ラベル付きツリーへの入力のパースによって、構造的および意味的な突然変異が可能であり、変異したリポジトリの暗号的妥当性を保っていることを示す。
テンプレート非依存型 ASN.1 変異エンジンと非逐次ファジングを組み合わせた,CAT と呼ばれる強力なファジングツールに新たな技術を実装し,66倍のスループット向上を実現した。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:33:01 GMT)
SEC-bench Pro: Can Language Models Solve Long-Horizon Software Security Tasks? [26.6] SEC-bench Proは、クリティカルで複雑なソフトウェアシステム上で、エージェントバグハンティングを測定するためのベンチマークである。
V8とSpiderMonkeyにまたがる183の検証済み脆弱性でSEC-bench Proをインスタンス化する。
評価の結果,両エンジンにおいて,フロンティアモデルを用いた符号化エージェントが40%以下であることがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:59:49 GMT)
SoftCap: Soft-Budget Control for Diffusion Transformer Acceleration [26.4] Diffusion Transformer (DiTs) は強力な視覚的品質を実現するが、その反復的復調過程には多くのコストを要する。
キャッシュベースのDiT推論のためのトレーニング不要な制御層である textbfSoftCap を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:24:48 GMT)
Verus-SpecGym: An Agentic Environment for Evaluating Specification Autoformalization [26.1] LLMエージェントが非公式なプログラミング問題を忠実な形式仕様に変換することができるかどうか、仕様自動書式化について検討する。
Codeforces問題から派生した581の仕様記述タスクのベンチマークであるVerus-SpecBenchを紹介する。
フェールモードの解析は、モデル生成仕様が重要な入力仮定を受け入れ、誤った出力を受け入れ、有効な仕様を拒否できることを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:12:48 GMT)
The Role of Causal Features in Strategic Classification for Robustness and Alignment [25.9] 因果分類は十分に大きな適応後の最適分類誤差につながることを示す。
また,因果的特徴の活用により,機関とユーザ間の長期的インセンティブの整合が期待できることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:22:05 GMT)
Visual-Noise Guided In-Context Distillation for Multimodal Large Language Model Unlearning [25.9] MLLM(Multimodal Large Language Models)は、視覚言語タスクにおいて顕著な進歩を遂げている。
また、機密知識や制限された知識を記憶し、公開し、プライバシーやより広範な安全リスクへの懸念を喚起することもある。
MLLMアンラーニングのための蒸留フレームワークとして,視覚誘導型インコンテキスト蒸留(VGID)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:49:34 GMT)
Cesarean Scar Defect Segmentation in Transvaginal Ultrasound Images: a Dataset and Benchmark [25.6] CSD(Cesarean Scar Defect)は、帝王切開後の合併症の1つである。
経バジナル超音波CSDセグメンテーションのためのパブリックデータセットは存在しない。
この研究は、医用画像分割アルゴリズムの進歩と臨床革新を促進するための高品質なベンチマークリソースを提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:45:19 GMT)
Generalized Range Filtering Approximate Nearest Neighbor Search: Containment and Overlap [Technical Report] [25.5] 距離フィルタを用いた近似近接探索(ANN)が近年注目されている。
この論文は、この問題の一般化形式、すなわち、範囲値属性に基づく正確な範囲範囲(RR)述語を用いたANNサーチ、RRフィルタリングANN (RRANN) に展開する。
我々は、任意のRR述語を効率的に扱うマルチセグメント木グラフという新しいアプローチを導入する。
実世界のデータを用いた実験は、RRANNクエリにおける我々のアプローチの有効性を示し、ベースラインと同じ精度で最大12.5倍の高速化を実現した。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:31:27 GMT)
SAFE-Diff: Scale-Aware Attention and Feature-Dispersive Diffusion with Uncertainty Estimation for Contrast-Enhanced Breast MRI Synthesis [25.5] 高忠実度造影MRIの合成は、より安全で効率的な乳癌検診に有用であるが、複雑な病変のテクスチャや異種拡張パターンのため、依然として困難である。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:30:26 GMT)
AMARIS: A Memory-Augmented Rubric Improvement System for Rubric-Based Reinforcement Learning [25.3] 既存の適応ルーブリックメソッドは、現在のバッチやインスタンスレベルの比較のようなローカルエビデンスから基準を更新する。
AMARIS(AMemory-Augmented Improvement System)を導入する。
AMARISはロールアウト分析、ステップレベルサマリー、ルーブリック更新レコードを永続的な評価メモリに格納し、更新に関連のある最近の履歴を検索する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:47:05 GMT)
UNIQUE: Universal Top-k Sparse Attention for Training-free Inference and Sparsity-aware Training [25.3] 大規模言語モデル(LLM)における長文推論は、自己注意キー値(KV)キャッシュの線形成長によってボトルネックとなる。
Top-kキャッシュはKVキャッシュのごく一部で注意を緩和するが、トレーニングと補助トレーニングの両方において、正確に重要性を推定する。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:32:43 GMT)
MuNet: A Mutualistic Network for Joint 3D Human Mesh Recovery and 3D Clothed Human Reconstruction from Single Images [24.7] 3次元メッシュの回復と3次元の衣服の復元は本質的に関連しているが、それらは長い間、孤立して研究されてきた。
本研究では,1枚の画像から3次元のメッシュ復元と3次元の再構成を行うための相互運用ネットワーク MuNet を提案する。
我々は,3次元メッシュ復元と3次元再構築のための6つのベンチマークデータセット上で,MuNetを広範囲に評価した。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:04:39 GMT)
TriHead-GAN: A Generative Adversarial Network with Triple-Head Discriminator for Carbon Emission Time Series Generation [24.7] 時系列生成は自然な治療法であるが、既存のGANと拡散に基づくジェネレータは、しばしば二酸化炭素排出量データの領域構造を限定的に監督する。
本稿では,3重頭部判別器が関節分布の3つの相補的側面を相補的に監督するトランスフォーマーベースの対向フレームワークであるTriHead-GANを提案する。
このジェネレータは、グローバルな自己注意と局所的な時間的畳み込み、ステップごとのノイズ注入、およびファーストディファレンス統計に一致するアンチ・スムーシング・ロスを組み合わせている。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:48:56 GMT)
InterSketch: An Interleaved Reasoning Model with Self-correcting Visual Sketch and Stepwise Reward [24.5] ヒューマンライクな思考は、典型的には、インターリーブド・ビジュアル・テクスト・チェーン・オブ・ソート(VT-CoT)による長い水平推論を伴う
自己補正とステップワイズ報酬機構によってVT-CoT能力を向上するインターリーブ推論モデルであるInterSketchを導入する。
ビジュアル推論ベンチマークの実験は、InterSketchの有効性を示し、Gemini-3-Proのようなプロプライエタリなモデルよりも優れている。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:07:49 GMT)
MedGuideX: Internalizing Decision Logic from Executable Guidelines into Large Language Models for Clinical Reasoning [24.3] 臨床実践ガイドライン(CPGs)は、臨床医が患者変数、条件基準、レコメンデーションルールを評価することによって適用するエビデンスに基づく意思決定ロジックを符号化する。
我々は、CPG勧告を実行可能な臨床判断ロジックに変換するガイドライン由来のトレーニングパイプラインを導入する。
4つの臨床推論ベンチマークで、MedGuideXは平均精度が10.28%向上した。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:36:05 GMT)
Stabilizing Recurrent Dynamics for Test-Time Scalable Latent Reasoning in Looped Language Models [24.3] Looped Language Models (LoopLMs) は、深さ反復による効率的な潜伏推論を可能にするが、信頼性の低いテスト時間スケーリングの振る舞いを示す。
STARS (ST-driven Recurrent Scaling) は、潜在状態が減少的に安定な固定点に近づくことを制約するトレーニングフレームワークである。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:11:12 GMT)
COVD: Continual Open-Vocabulary Object Detection with Novel Concept Injection [24.2] モデルが入ってくる新しい概念群を逐次学習する,新規概念注入(COVD)を伴う連続OVDというタスクセットを導入する。
我々のキーとなる観察は、事前学習された視覚エンコーダは、しばしば既に多くの新しい概念を理解し、表現しているということである。
追加パラメータを含まない効率的な連続注入フレームワークであるNoIn-Detを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:53:14 GMT)
MATCHA: Matching Text via Contrastive Semantic Alignment [23.9] MATCHAは、参照とのセマンティックな合意を報い、矛盾を罰する自動計量である。
参照のみに基づいて誤った文と正しい文を区別するのは最も正確である。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:47:14 GMT)
Sample Complexity of Policy Gradient for Log-Growth Control [23.9] ログ成長制御のためのポリシ勾配のサンプル複雑性について検討する。
予測されたミニバッチポリシー勾配が全サンプルの複雑さを実現することを証明した。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:24:14 GMT)
Can VLA Models Learn from Real-World Data Continually without Forgetting? [23.8] ビジョン言語アクション(VLA)モデルは、汎用ロボット工学の有望な基盤を提供する。
この研究は、実世界の連続的なVLA学習に関する最初の実証的研究を提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:39:02 GMT)
Bridging Control with Neural Network Verifier alpha-beta-CROWN: A Tutorial [23.7] $,!$-CROWN はグラフとして表される非線形関数の汎用的バウンディングエンジンである。
本チュートリアルでは,$,!$-CROWNの基礎について論じ,様々な制御関連計算タスクへの応用について紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:49:19 GMT)
GFSR: Geometric Fidelity and Spatial Refinement for Reliable Lane Detection [23.6] 我々はLaneIoU誘導幾何信頼とAdaptive Gated Location Refinement(AGLR)からなるフレームワークを提案する。
LCCは、レーン先行の幾何学的忠実度を明示的に推定するために、LaneIoUをソフト監視として採用している。
AGLRはサンプリングポイント側オフセットを予測し、補正サイズを適応的に調整するゲーティング機構を採用する。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:18:19 GMT)
Black-box Membership Inference Attacks on the Pre-training Data of Image-generation Models [23.6] メンバーシップ推論攻撃(MIA)は、モデルトレーニング中に不正なデータの使用を識別するための有望なツールとして登場した。
拡散モデルにおける事前学習データを検出するために,クロスモーダルデータ機構を利用するブラックボックスメンバシップ推論攻撃フレームワーク(SD-MIA)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:38:25 GMT)
Timestep-Aware SVDQuant-GPTQ for W4A4 Quantization of Wan2.2-I2V [23.6] 大規模なビデオ拡散変換器の量子化W4A4は、メモリの大幅な節約を提供するが、2つの大きな課題によって妨げられる。
これらの難しさは、Wan2.2-I2V の2つの試験的混合型 DiT 設計によって複雑化されている。
本稿では,SVDQuantをベースとした低ランク外乱補償,GPTQをベースとした再構成型残量量子化,および各専門家が独立に行う時間ステップ2分単位のアクティベーションクリッピング比探索を組み合わせた後学習量子化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:24:01 GMT)
What-If World: A Causal Benchmark for General World Models in Embodied Scenarios [23.5] ビデオ生成モデルは、運転やロボット操作といったタスクのための世界シミュレータとして、ますます使われている。
これらの設定で重要なのは、単一のビデオが正しく見えるかどうかではなく、入力が変わったときにモデルの出力が変わるかどうかです。
我々は、同じシーンを1つの物理的詳細で記述した2つのプロンプトをモデルに与え、この2つのビデオが物理の予測方法が異なるかどうかを確認することによって、これを検証した。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:02:26 GMT)
Asynchronous Remote Sensing Time-Series Fusion for Cloud Removal and Anytime Reconstruction [23.5] 本稿では,S1/S2雲の除去と時系列再構成のための時間的流れマッチングモデルを提案する。
AGFlowは、完全に欠落したフレーム再構築を特に改善する(MAEとRMSEは、RESTORE-DiTよりも16-19%削減)
SentinelのtheORE-DiTベンチマークプロトコルについて,定量化,定性比較,コンポーネントの短縮による評価を行った。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:02:07 GMT)
Probing Cultural Awareness in LLMs: A Case Study of Cross-Culture Aesthetic Stylistics [23.4] 大規模言語モデル(LLM)は、様々な文化的文脈に展開されているが、審美的スタイリスティックを習得する能力はいまだに未熟である。
行動認識と生産能力のレンズによるLCMの評価を行った。
香港の環境では、LLMのスタイリスティックな認識は主にスタイリスティックな構造ではなく、表面レベルの言語情報に依存していることがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:08:46 GMT)
Statistical and Algorithmic Foundations of Probing Quantum Systems with Compressive Measurements: A Review [23.1] 量子状態トモグラフィーは、未知の量子状態を測定データから再構成することを目的としている。
低ランク性、テンソル・ネットワーク表現、浅い量子回路、神経量子状態などの先行構造は、有効自由度を大幅に減少させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:44:42 GMT)
Underwater360: Reconstructing Underwater Scenes from Panoramic Images with Omnidirectional Gaussian Splatting [22.9] 水環境の浸水探査には水中環境の再構築が不可欠である。
水中シーン再構築のための物理インフォームド全方位3DGSフレームワークである textbfUnderwater360 を提案する。
Underwater360は、水中の新しいビュー合成とシーンの外観復元において優れた性能を発揮する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:01:06 GMT)
Composition Collapse: Stable Factual Knowledge Does Not Imply Compositional Reasoning [22.9] 統計的に識別不能な原子知識を持つレシピは、組成の挙動を40パーセント以上に分けて生成することを示す。
安定な原子アクセスを条件とした残差構成故障から集合構成ギャップへ推定値を変更する二重ゲートプロトコルを提案する。
トレーニング後の4つのレシピにまたがる2-11の時間的事実連鎖のベンチマークにおいて、この分解は、トレーニング後の目的がメトリクスマスクを集約する方向に構成能力をシフトすることを明らかにする。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:01:01 GMT)
Cordon-MAS: Defending RAG against Knowledge Poisoning via Information-Flow Control [22.8] 既存の防衛は、毒物検出が害を防いでいると仮定している。
モデルは監視と制御のギャップを示す。
コードン原理を導入します -- 最終的な合成が可能なエージェントは、信頼できない自然言語の証拠にアクセスできません。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:27:19 GMT)
Broken Memories: Detecting and Mitigating Memorization in Diffusion Models with Degraded Generations [22.7] 記憶は内部の数値不安定を 引き起こします しばしば視覚的に壊れた 人工物として現れます
本稿では,段階的検出と適応緩和のための原則付きオンザフライフレームワークを提案する。
提案手法は,プロンプトやガイダンスを変更することなく記憶を抑え,セマンティックな忠実さと画質を保たせる。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:55:13 GMT)
Negligible in Size, Significant in Effect: On Scale Vectors in Large Language Models [22.3] スケールベクトルはモデルパラメータの無視可能な部分のみを構成するが、モデル事前学習を著しく低下させることを示す。
我々の理論はさらに、プレノームアーキテクチャではスケールベクトルは表現性を高めず、その後の線形写像に対する自己増幅プレコンディショニング効果によって最適化を改善することを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:56:49 GMT)
The Attribution Blind Spot: Detecting When Language Models Rely on Memory Rather Than Retrieved Context [22.2] 帰属盲点に対処するために,計算現実モニタリングを導入する。
CRMは、認知科学の現実監視フレームワークから適応した原則を運用する。
プレトレーニングされた露光が測定可能な内部軌道シグネチャを残すかどうかを検出する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:48:51 GMT)
RISE: Reliable Improvement in Self-Evolving Vision-Language Models [22.2] 視覚言語モデル(VLM)は強力なマルチモーダル推論機能を実現している。
VLMは依然として、ポストトレーニングのための大規模な人為的な監督に大きく依存している。
視覚言語モデルのための信頼性の高い自己進化フレームワークである textbfRISE を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:21:21 GMT)
FalAR: A Large-scale Speaker-Annotated European Portuguese Speech Corpus of Parliamentary Sessions [22.2] FalAR (FalAR) は、ポルトガル議会の大規模な演説コーパスである。
本稿では,データ収集プロセスとFalARコーパスの主な特徴について述べる。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:14:37 GMT)
Real Images, Worse Judgments: Evaluating Vision-Language Models on Concreteness and Imagery [22.0] 視覚言語モデルが語彙的判断における偶発的画像文脈と有用な視覚的証拠を区別できるかどうかを考察する。
実画像のコンテキストは、一貫した利得を得られず、しばしば人間のレーティングとの整合性を損なう。
以上の結果から,現在のVLMでは,視覚的コンテキストが語彙的判断に影響を及ぼす場合のキャリブレーションの精度が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:24:59 GMT)
EviACT: An Evidence-to-Action Framework for Agentic Program Repair [21.8] EviACTは、3つのエビデンス駆動ガードレールを修復段階にわたって調整するエージェントAPRフレームワークである。
最強の報告されたベースラインよりも1.6-6.0ポイントのリゾルバ率を改善する。
ベースラインコストが利用可能なバグ毎のAPIコストは70.1-88.6%低下している。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:17:47 GMT)
Learning When to Think While Listening in Large Audio-Language Models [21.5] LALM(Large Audio-Language Models)のための学習可能な待ち行列制御形式を導入する。
人間の会話の漸進的な性質に触発され、コントローラーは、いつ待つか、いつ答えるかという部分的なオーディオ証拠に基づいて決定する。
その結果,6リワードDAPOコントローラの行重み付け精度は67.6%から70.3%に向上し,終端から終端までの長さを14%削減した。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:43:11 GMT)
FAB-Bench: A Framework for Adaptive RAG Benchmarking in Semiconductor Manufacturing [21.3] 半導体製造におけるRAGシステムの適応ベンチマークのためのエンドツーエンドフレームワークであるFAB-Benchを紹介する。
FAB-Benchは、事実的正確性、文脈的利用、完全性、検索関連性、技術的な深さ、推論一貫性を測定する6つの診断指標を定義している。
1,300以上の候補から,3つの合成戦略にまたがる200の問合せ対の高品質なベンチマークを算出した。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:32:51 GMT)
Linear and Neural Dueling Bandits with Delayed Feedback [21.3] コンテキストデュエルの帯域幅は、嗜好に基づく意思決定の基盤となる。
標準アルゴリズムは、即時フィードバックの理想的な仮定に依存している。
リニア(LDB-DF)とニューラル(NDB-DF)の2つの新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:07:25 GMT)
Agents that Matter: Optimizing Multi-Agent LLMs via Removal-Based Attribution [21.3] エージェント属性を協調ゲームとして形式化し、連立分布、削除プロトコル、ターゲットメトリックによってパラメータ化する。
そこで,LOO(Leave-One-Out)はボトルネックエージェントをボトルネック手法として効果的に識別するが,計算コストのごく一部に留まることを示す。
また、診断精度と倫理的行動に対するエージェントの貢献がしばしば分離されることを明らかにするため、医療MASの監査に我々の枠組みを適用した。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:39:27 GMT)
Open-Weight LLM Fine-Tuning Defenses are Susceptible to Simple Attacks [21.3] オープンウェイトセーフガードは,これらのセーフガードに対して体系的に評価されていない,より単純な戦略に影響を受けやすいことを示す。
本研究は,聴力に基づく訓練を取り入れた聴力耐性チューニング(ART)について紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:18:42 GMT)
EgoProx: Evaluating MLLMs on Egocentric 3D Proximity Reasoning Across a Cognitive Hierarchy [21.1] EgoProxは、エゴ中心の3D近接推論のベンチマークである。
私たちは、意図、探索、搾取、行動の連鎖推論を網羅して、認知的連鎖に沿ってタスクを組織化します。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:53:56 GMT)
Evaluating Interactive Reasoning in Large Language Models: A Hierarchical Benchmark with Executable Games [20.9] 本稿では,推論を積極的証拠獲得と信条更新として扱う,推論評価のための多ターン対話型フレームワークを提案する。
フレームワークを474の実行可能なゲームのベンチマークとしてインスタンス化し、それぞれ5つの難易度に対応する5つの固定構成探索空間で評価する。
その結果、ベンチマークは高い差別性を示し、成功率だけでなく相互作用効率にも大きな違いが明らかとなった。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:12:30 GMT)
Trinity: Unifying Class-Agnostic Terrain and Semantic Segmentation for Unstructured Outdoor Environments by Leveraging Synthetic Data [20.8] 既存の視覚に基づくトラバーサビリティ推定手法は、ロボット固有のアノテーションやセマンティッククラスマッピングに依存している。
本稿では,クラス固有のセマンティックセマンティックセマンティックセマンティックとクラスに依存しない地形セマンティックセマンティックセマンティックセマンティックを共同で行うトランスフォーマーアーキテクチャを提案する。
クラス固有の地形ラベルとクラスに依存しない地形ラベルをアノテートした実世界の画像を提供するEXTerraデータセットを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:04:19 GMT)
Tensor Memory: Fixed-Size Recurrent State for Long-Horizon Transformers [20.7] トランスフォーマーは、空間と時間を長いトークンシーケンスに平らにすることで、画像とビデオを処理します。
注意とKVキャッシュは過去の特徴を保存するが、そのメモリはシーケンス長とともに成長し、明示的で永続的な空間状態が欠如している。
本稿では,Transformerブロックを固定サイズのリカレント3Dメモリで拡張する軽量モジュールを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:03:42 GMT)
Detecting Is Not Resolving: The Monitoring Control Gap in Retrieval Augmented LLMs [20.6] 単一ターン診断はRAGの安全性を体系的に過大評価し、矛盾は安全な解決法とは無関係であり、普遍的な即時修正は存在しないことを示した。
モデルが認識するものと何をするかのギャップは、検索強化されたシステムが高レベルな設定で信頼される前に測定され、クローズされなければならない。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:18:43 GMT)
Self-Intersection-Aware 3D Human Motion Generation Using an Efficient Human Sphere Proxy [20.4] 我々は,人体動作生成法の訓練に,自己切断を明示的に罰する新規な損失を導入する。
実験の結果,生成した動きの自己断面積が最大49%減少し,他の評価指標も改善した。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:17:46 GMT)
Semi-Supervised Gaze Estimation via Disentangled Subspace Contrastive Learning [20.4] 出現に基づく視線推定は、注釈付きサンプルが限られ、データセットの多様性が不十分なため、常に一般化に苦しむ。
先行するアプローチでは、制約のない現実世界のシナリオから大規模な擬似ラベル付きデータを生成するために、弱教師付き学習を採用する。
我々は、ラベルのないデータを活用してドメインの一般化を促進する、シンプルで効果的な半教師付き学習アーキテクチャを考案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:31:10 GMT)
Can Broad Biomedical Knowledge be Contextualized into Scenario-Grounded Propositions? [20.4] 本稿では,知識文脈化を反復探索として扱う二段階マルチエージェントフレームワークであるSCENEを提案する。
臨床試験では、SCENEは特定の支持されたサブグループを発見し、既存のベースラインを上回っている。
これらの結果は、SCENEが幅広い知識とシナリオ固有の証拠を橋渡しし、追跡可能な検査可能な仮説を導出することを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:33:03 GMT)
Semiparametrically Efficient Inference for Kernel Measures of Noise Heterogeneity [20.3] 付加雑音モデルにおける雑音の不均一性のカーネル測度に対する半パラメトリック効率的な推定法を開発した。
我々は、コカリブレートと残留物の間のカーネルコ演算子の1ステップ1ステップ推定器を構築する。
そこで本研究では, ナイーブプラグイン残差法と比較してキャリブレーションとパワーが向上した。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:01:09 GMT)
ChartAct: A Benchmark for Dynamic Chart Understanding [20.1] 既存のベンチマークは主に静的チャートに焦点を当てているが、現実のチャートはしばしば動的でインタラクティブである。
この能力を評価するために,動的チャート理解のためのインタラクティブなベンチマークであるChartActを提案する。
ChartActは8つの実際のチャートサイトから673の動的チャートを収集しフィルタし、7つの一般的なチャートタイプをカバーし、1,440の高品質な質問回答サンプルを構築している。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:15:21 GMT)
Scaling, Benchmarking, and Reasoning of Vision-Language Agents for Mobile GUI Navigation [20.0] VLM(Vision-Language Models)は、モバイルGUIナビゲーションの急速な進歩を示す。
本稿では,この領域におけるVLMエージェントのデータスケーリング,ベンチマーク,推論の体系的研究について述べる。
HyperTrackは、中国の650以上のモバイルアプリケーションにまたがる16000以上の現実世界のタスクを備えた大規模なデータセットです。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:03:56 GMT)
Hurwitz Quaternion Multiplicative Quantization for KV Cache Compression [19.9] HQMQ は K または V の 4 つの要素チャンクを四元数として扱い、その単位方向をエフェクティブ $q_p cdot q_s$ に量子化する。
HQMQは最大5.05タイムのKV圧縮を提供し、Llama-3-70B 128kのコンテクストキャッシュを43GBから8.5GBに縮小する。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:09:17 GMT)
Credit Assignment with Resets in Language Model Reasoning [19.9] ポストトレイン言語モデルは、トラジェクトリ内のすべてのトークンに対して、単一の結果報酬を均一に割り当てる。
この制限は、軌道全体を均一に更新するのではなく、目標とする故障推論ステップの洗練を可能にすることで対処できる。
本稿では、ランダムリセットポリシー最適化(RRPO)と自己リセットポリシー最適化(SRPO)の2つの手法を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:23:26 GMT)
Towards Error-Free EHRs: Reasoning-Intensive Consistency Verification Between Clinical Notes and Structured Tables in Electronic Health Records [19.7] EHR-ReasonConは、ノートテーブル整合性検証のための推論集約型ベンチマークである。
また,音符をセグメント化し,アンカーエンティティと時間参照を抽出するELH-Inspectorを提案し,テーブル探索ツールを用いて構造化テーブルに対する整合性を検証する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:19:42 GMT)
One LR Doesn't Fit All: Heavy-Tail Guided Layerwise Learning Rates for LLMs [19.5] レイヤワイズラーニングレート(レイヤワイズラーニングレート、Layerwise Learning Rate、LLR)は、個々のトランスフォーマー層に異なるラーニングレートを割り当てる適応型スキームである。
LLRは最大1.5倍のトレーニングスピードアップを実現し、一様学習率ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:04:34 GMT)
DynFrame: Adaptive Reasoning-Driven Multimodal Framework with Dynamic Frame Augmentation for Complex Video Understanding [19.5] 時間ウィンドウとサンプリング密度を1つの自己回帰パス内でネイティブトークンとして出力するフレームワークであるDynFrameを提案する。
この学習可能なスパン密度検索は、単一の検索ステップで多粒度証拠の取得を可能にする。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:16:16 GMT)
CodecCap: High-Fidelity Codec-Inspired Residual Modeling for Dense Video Captioning [19.4] CodecCapは高忠実度高密度ビデオキャプションのためのフレームワークである。
キーフレームは、安定した視覚コンテキストを徹底的にエンコードし、残りのキャプションは、時間的にのみ局所的なアクション、動き、変化をキャプチャする。
VidCapQAの結果は、強いVLMによって直接生成されるキャプションは、多くの視覚的詳細を見逃していることを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:53:55 GMT)
TideGS: Scalable Training of Over One Billion 3D Gaussian Splatting Primitives via Out-of-Core Optimization [19.2] 数十億ドル規模の3DGSのトレーニングは、基本的にメモリバウンドである。
TideGSは、SSD-CPU-GPU階層間のパラメータを管理する、アウトオブコアのトレーニングフレームワークである。
TideGSは、24GBのGPUで10億以上のガウスのトレーニングを可能にする。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:15:21 GMT)
Aurora Hunter: A Two-Stage Framework for Probabilistic Visibility Forecasting [19.0] オーロラの可視性は、宇宙気象研究やオーロラ観光に重要である。
因子を分解する2段階のカスケードであるAurora Hunterを紹介します。
ステージ1は、トロムソ+キルナのデータに基づいて訓練された51の物理駆動的特徴を用いて、XGでP(occurring)を予測する。
ステージ2は、21の雲と月の照度特徴を用いて、ロジスティック回帰でP(明度観測)を予測する。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:38:43 GMT)
ParkourFormer: Integrating Predictive Supervision and Sequence Modeling into Parkour Locomotion [18.9] 本稿では,トランスフォーマーをベースとしたシーケンスモデリングフレームワークであるParkourFormerについて述べる。
シミュレーションと本物のヒューマノイドロボットの実験により、ParkourFormerは高度に挑戦的な地形で平均93.85%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:20:50 GMT)
TrajAudit: Automated Failure Diagnosis for Agentic Coding Systems [18.8] エージェントシステムは、バグ修正などのソフトウェアエンジニアリングジョブを自動化するために広く研究されている。
既存の自動故障診断アプローチはタスク実行軌跡を活用するが、その効果は軌道長と複雑性の増加とともに低下する。
リポジトリレベルのコーディングタスクには、冗長なプログラム構造や冗長なコードコンテキストなど、トラジェクトリにはノイズが伴っている。
我々は,リポジトリレベルのコーディングトラジェクトリのための最初の障害診断フレームワークであるTrajAuditを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:24:37 GMT)
FLUID: From Ephemeral IDs to Multimodal Semantic Codes for Industrial-Scale Livestreaming Recommendation [18.8] FLUIDは、候補側のアイテムIDをプロダクションスケールのライブストリーミングローダからリタイアするためのフレームワークである。
LUCIDと呼ばれる個別の階層的セマンティックコードを生成し、コンテンツに基づく特徴付けを行う。
当社の産業用ライブストリーミングレコメンデーションにデプロイされたユーザベースは、全世界で10億を超えている。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:00:35 GMT)
Iterative Refinement Neural Operators are Learned Fixed-Point Solvers: A Principled Approach to Spectral Bias Mitigation [18.7] イテレーティブ・リファインメント・ニューラル・オペレータ(IRNO)は、学習されたリファインメント・モジュールを固定点反復で繰り返し適用することで、事前訓練された演算子を増強する。
物理的システム全体では、IRNOは連続的にエラーを減少させ、乱流の56.05%まで改善した。
アクティブマターでは、スペクトル分析により、ベース演算子と比較して、正規化誤差比が27.72-36.10%、中間で5.07-6.68%、高周波で1.48-2.04%に低下していることが明らかになった。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:05:05 GMT)
Joint 2D-3D Segmentation and Association in Street-level Imaging [18.7] 本研究は,関節2D-3Dセグメンテーションとアソシエーションのための統一的な枠組みを提案する。
3D駆動型アソシエーション機構は、従来の2D多目的追跡を置き換える。
実験では、地下構造配列とより堅牢なアイデンティティ保持のカバレッジが大幅に改善された。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:04:51 GMT)
TRACES: Proactive Safety Auditing for Multi-Turn LLM Agents via Trajectory-State Modeling [18.6] LLMエージェントは、マルチターンツールの使用と環境相互作用によってますます運用される。
ホック後の診断は、しばしば、展開中にリスクをフラグする機会を逃す。
表現に基づくプロアクティブオーディエンスであるTRACESを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:11:02 GMT)
FM-fMRI: Event Conditioned Flow Matching for Rest-to-Task fMRI Time-Series Synthesis [18.6] タスクベースfMRIはタスク誘発ニューラルダイナミクスの直接的な読み出しを提供するが、大規模に取得するのは高価で困難である。
本稿では,連続時間条件ベクトル場を学習し,タスクROI時系列を生成するイベント条件付きフローマッチングモデルFM-fMRIを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:21:23 GMT)
MuChator: Enabling Active Music Discovery via Conversational Music LLMs in Douyin Music [18.3] 自然言語で状況音楽の意図を積極的に表現できる対話型フレームワーク MuChator を紹介する。
MuChatorには音楽知識事前学習、コンテキスト対応インストラクションチューニング、ハイブリッドRMによるPreference Alignmentという3つの重要なコンポーネントが含まれている。
MuChatorはByteDance内のDouyin Music Appにデプロイされており、オンラインA/Bテストでは46.49%のユーザアクティブデイが改善されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:42:52 GMT)
How and What to Imagine? Visual Thinking in Unified Multimodal Models for Cross-View Spatial Reasoning [18.2] クロスビュー空間推論は、視覚言語モデルにとって弱点である。
私たちは、どのように視覚的思考を重要にするか、どんな視覚的思考が最善か尋ねます。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:20:05 GMT)
Cloak: Heuristic ORAM Optimization Through Fixed Temporal Distribution [18.1] クラウドストレージは、データ内容を隠すことができるが、それでもアクセスパターンを通じて機密情報を漏洩させる。ORAMは、アクセスパターンを隠すことでこの問題に対処するが、既存のORAMシステムは、実際にデプロイするには非効率である。
実ワークロードの単純で広く観察された特性を活用することで,パフォーマンスを劇的に向上させる,難解なストレージシステムであるCloakについて紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:36:49 GMT)
Defect engineering of ultrathin gallium nitride via electric fields for advanced electronic, magnetic, and gas sensing applications [18.0] 窒化ガリウム(GaN)は、広帯域ギャップ半導体のグラインドストーン材料である。
本研究は,その電子的,磁気的,センシング的景観を,点空隙欠陥,ひずみ,外部電界がいかに支配するかを考察する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:32:57 GMT)
SCKAN: Structural Consensus-based KAN Prototype Learning for Semi-Supervised Pancreas Segmentation [17.8] 我々は,コンセンサスをベースとしたkan Prototype Learning (SCKAN) を提案し,Kolmogorov-Arnold Networks (KANs) による最初のクロスサンプル構造コンセンサス学習を構築する。
SCKANには、構造制約付きプロトタイプ一貫性学習(SPCL)とコンセンサスベースのコルモゴロフ・アルノルド核融合(CKaF)の2つの重要な設計が含まれている。
2つのパブリック膵臓データセットの実験は、SCKANの有効性を実証している。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:53:45 GMT)
CIRCLED: A Multi-turn CIR Dataset with Consistent Dialogues across Domains [17.7] CIRCLEDでは、各ターンのクエリがターゲットイメージに徐々に近づく。
我々は9つのサブセットにまたがって22,608のマルチターンセッションを収集し、Multi-turn FashionIQをはるかに上回っている。
我々の研究は、マルチターンCIRの研究を促進するための実用的で高品質なベンチマークを提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:11:15 GMT)
Evaluating the Relevance of Uncertainty Estimators for LLM Hallucination [17.7] 大型言語モデル(LLM)は幻覚を起こす傾向があり、すなわち、入力データや訓練データによって支持されない文である。
LLMにおける不確実性推定と幻覚との関連について,系統的研究を行った。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:34:54 GMT)
Mind the Tool Failures: Achieving Synergistic Tool Gains for Medical Agents [17.6] 本研究では,不完全なツール設定下での医療ツール使用について検討し,個々のツールが欠落した障害事例の修正を行う。
本稿では,確率的リスク最小化と相反する相乗効果学習に対する報奨を考慮したGRPOに基づく強化学習フレームワークを提案する。
提案手法は,幅広いベースラインに対して安定的かつ堅牢な改善を実現する。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:29:38 GMT)
Token-weighted Direct Preference Optimization with Attention [17.6] 本稿ではトークン重み付きRLとアテンションPOに基づく新しいトレーニング目標を提案する。
AttentionPO は LLM 自体からの注意を使ってトークンの重みを推定する。
実験の結果,アテンションPOはAlpacaEval,MT-Bench,ArenaHardの性能を著しく向上することがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:18:58 GMT)
AgenticVBench: Can AI Agents Complete Real-World Post-Production Tasks? [17.6] ビデオ制作は、マルチモーダルAIエージェントを評価するためのリッチで要求の多い場を提供する。
AgenticVBenchは、実世界のポストプロダクションワークフローにまたがる4つのタスクファミリーにまたがる100のエージェントタスクのベンチマークである。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:27:16 GMT)
Smoothed Score Queries and the Complexity of Sampling [17.3] 勾配情報を用いた高次元ガウス分布からのサンプリングのクエリ複雑性について検討する。
総変分エラー(_rm TV)に対するスムーズなスコアクエリは、(sqrt)から対数への条件数依存性を改善する。
また、有限ビット勾配オラクルも研究している。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:38:20 GMT)
Disentangling Language Roles in Multilingual LLM Task Execution [17.2] MTM-Benchは言語条件のタスク実行のためのベンチマークである。
27のトリプレットをすべて列挙し、セマンティック・リバーサル、最終状態抽出、言語純度にまたがるモデル毎に2,430のインスタンスを含む。
セマンティックな正当性,目標言語順守,制約満足度,汚染率,共同成功の指標を用いて,20のフロンティアとオープンウェイトLLMを評価した。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:09:34 GMT)
Memory-Distilled Selection for Noise-Robust Anomaly Detection [17.2] データ汚染下での異常検出(AD)は、産業環境における教師なし欠陥検出の展開に重要である。
データ選択に基づくトレーニングアルゴリズムであるメモリ蒸留選択(MeDS)を提案する。
MeDSは、ランダムなサブサンプリングを通じて部分記憶のアンサンブルを構築し、その結果の空間性はローパスフィルタとして機能する。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:13:41 GMT)
Time Series Causal Discovery via Context-Conditioned and Causality-Augmented Pretraining [17.0] 時系列からの因果発見は、異常の根本原因をトレースするなど、多くの現実世界の応用において重要である。
textbfTime-series textbfCausal textbfDiscovery のための新しい textbfPretraining フレームワーク textbfPTCD を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:30:42 GMT)
PilotTTS: A Disciplined Modular Recipe for Competitive Speech Synthesis [17.0] 本稿では,軽量自動回帰音声合成システムPilotTTSを提案する。
PilotTTSは,最小限のアーキテクチャと厳格なデータエンジニアリングを通じて,競争力のあるパフォーマンスを実現する。
PilotTTSは、オープンソースツールで完全に処理されたわずか200K時間のデータでトレーニングされている。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:36:56 GMT)
FoundObj: Self-supervised Foundation Models as Rewards for Label-free 3D Object Segmentation [16.8] 我々は,隣接する幾何学的スーパーポイントを段階的にマージするスーパーポイントベースのオブジェクト発見エージェントを特徴とする新しいフレームワークFoundを提案する。
本手法はゼロショットとロングテールのシナリオにおいて強力な一般化を示し,スケーラブルでラベルのない3Dオブジェクトセグメンテーションの可能性を示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:32:32 GMT)
BioFormer: Rethinking Cross-Subject Generalization via Spectral Structural Alignment in Biomedical Time-Series [16.8] バイオメディカル・タイムシリーズにおけるクロスオブジェクトの一般化(クロスオブジェクト・ジェネレーション)とは、一部の被験者のデータをトレーニングし、見えない被験者をテストすることを指す。
既存の手法のほとんどは、モデル構築や主観的対人学習を通じて、変動を暗黙的に抑制する。
スペクトルドリフトは,主観的変動を特徴付ける新しい視点として導入される。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:52:12 GMT)
More Expressive Feedforward Layers: Part I. Token-Adaptive Mixing of Activations [16.6] 本稿では,軽量な入力依存ゲートを用いて,アクティベーション関数の辞書を混合したトークン適応型FFN設計を提案する。
MoAは一貫して端末の損失を減らし、よく調整されたベースラインよりも優れたスケーリング動作を示す。
これらの結果から,トークン適応型アクティベーションミキシングは,大規模言語モデルにおいてFFN表現性を向上させるためのシンプルかつ効果的なメカニズムであることが示唆された。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:30:53 GMT)
Detect by Yourself: Self-Designing Agentic Workflows for Few-Shot Graph Anomaly Detection [16.5] 我々は,自己設計グラフ異常検出(SignGAD)という新しいフレームワークを提案する。
SignGADは、検出を構築することにより、タスク固有の異常証拠を利用するために、適切なグラフエンコーディングと検出器設計を選択する。
いくつかの実世界のデータセットで実施された実験は、SignGADが最先端の手法に対して強い性能を発揮することを示した。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:16:34 GMT)
Causal Risk Minimization for High-Dimensional Treatments [16.5] 我々は、因果推論を学習問題として再キャストするよく知られたアプローチを採用し、高次元処理空間に対処する。
因果誤差は,順序の増大によるモーメントバランスエラーと,因果推定を直接的に改善する設計目的に分解されることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:58:39 GMT)
Reading or Guessing? Visual Grounding Failures of Vision-Language Models for OCR in Ancient Greek Editions [16.4] 光文字認識のための視覚言語モデル(VLM)は、可視だが視覚的にサポートされていないテキストを生成することができる。
我々は、VLMエラーが間違った場合でも流用し続け、もっともらしいギリシャの代替品を産出することを示す。
この結果は,OCR言語が低リソースの史料に依存しているという以前の証拠を延長するものである。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:57:01 GMT)
Diff-Instruct with Diffused Reward: Towards Principled One-step Generator RL [16.3] ワンステップのテキスト・ツー・イメージ生成により、顕著な効率と品質でリアルタイムな合成が可能になった。
画像空間報酬最適化と拡散雑音空間分布マッチングを組み合わせた1ステップジェネレータの事前強化学習法について検討した。
KL最小化から導かれるデータフリーな軌道レベルのアライメントフレームワークであるDiff-Instruct with Diffused Reward (DIDR)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:35:31 GMT)
You Only Align Once: Propagating Cooperative Behaviors in Multi-Agent Systems through Seed Agents [16.3] 一つのエージェントが、自然言語の相互作用を通じて、訓練されていないエージェントに協調的な振る舞いを伝達できることが示される。
我々は、チームベースの反復刑務所ジレンマであるレッドブラックゲーム(Red-Black Game)でこれを研究し、チームメイトが故意に投票してチームの集団行動を決定する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:56:02 GMT)
Detectability in Diversity: Improved Canary Crafting for Privacy Auditing in One Run [16.3] 本研究では,ワンランプライバシ監査のためのカナリアを効率的に作成する問題について検討する。
近年の理論的考察により, カナリアを高度に検出可能かつ最小限の干渉に最適化することを提案する。
提案手法は,既存のカナリア工法よりも計算コストの低いプライバシー漏洩推定値を実現する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:06:14 GMT)
Transformer-Enhanced Reinforcement Learning: Fundamentals and Applications in Communication Networks [16.2] 強化学習(Reinforcement Learning, RL)は, コミュニケーションネットワークにおける様々な問題に対する強力な解法である。
近年、TransformerモデルはRLモデルを拡張できることを示し、これらの問題を克服している。
本稿では,TransformerベースのRLアルゴリズムとその通信ネットワークへの応用に関する包括的調査を行う。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:44:07 GMT)
Towards Just-in-Time Adaptive Feedback: Enhancing Student Learning via Knowledge-Grounded LLM [16.1] 本稿では,大規模言語モデルにドメイン固有の知識を加えることで,適応的なフィードバックを提供するフレームワークを提案する。
この枠組みを大規模大学コース (N > 1000) に展開し, 学生の成績を従来の学級に比べて80%以上向上させた。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:30:19 GMT)
O-MARC: Omni Memory-Augmented Compression Distillation for Efficient Video Understanding [16.0] 我々は,高精細な視覚記憶と時間的接地されたオーディオアンカーを保存できる,訓練用フリープラグ・イン・圧縮法であるOMACを紹介する。
メモリ圧縮マルチモーダルコンテキストで学習するための圧縮蒸留フレームワークであるO-MARCについても紹介する。
Qwen2.5-Omni-3Bでは、O-MARCは4つのベンチマークの平均スコアを45.8に改善し、44.1とOmniZipを41.0で上回った。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:07:11 GMT)
CoilDrop-MRI: Self-supervised physics-guided MRI reconstruction with coil dropout [16.0] 我々は,コイルワイドドロップアウトを入力に適用したCoilDrop-MRIを提案する。
C CoilDrop-MRIはマルチサイト、マルチフィールド(0.3T, 0.55T, 3T)、マルチモダリティ(T1重み、T2重み、T2重み、T2FLAIR、dMRI)のデータセットで広く検証されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:20:51 GMT)
L-Learning : A Lyapunov-Based Approach Leveraging Lagrangian Mechanics for Efficient and Stable Robot Tracking [16.0] L-Learningは、Lyapunovの安定性理論とLagrangianの力学を統合し、軌道追跡性能を向上させる、ロボティクスのための新しいデータ駆動制御フレームワークである。
制御精度が優れ、理論安定性が保証され、サンプル効率が高いことが特徴で、Lラーニングは実用ロボット応用の有望なソリューションである。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:31:01 GMT)
Learning Reference-Guided Exposure Correction with Hybrid Illumination Characteristics [15.9] HICNetは参照誘導露光補正フレームワークである。
軽量でコンテンツに依存しないエンコーダは、各画像を小型照明埋め込みに蒸留する。
HICNetは、公開ベンチマークの精度を向上し、完全に見えないシーンに最適化する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:05:47 GMT)
RLVR Datasets and Where to Find Them: Tracing Data Lineage for Better Training Data [15.9] Lineage-Aware Search (ATLAS)によるAtomic-source Tracingは、RLVRデータセットを彼らのアトミックソースにトレースするフレームワークである。
我々の分析によると、ほとんどのRLVRデータセットは、共有された上流ソースの小さなセットの変種であり、真に新しいデータはほとんどなく、多くのデータ汚染リスクに直面している。
本稿では,学習信号が集中した非汚染学習データセットをキュレートするための指針として,SCA(Source-level Counterfactual Attribution)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:57:12 GMT)
Unveiling the Fragility of Vision-Language Models: Multi-Modal Adversarial Synergy via Texture-Constrained Perturbations and Cross-Modal Optimization [15.9] 我々は,LVLMに対する汎用的でブラックボックスなマルチモーダル攻撃を実現するフレームワークであるMulti-Modal Adrial Synergyを紹介する。
MMASは、画像に対する普遍的な逆摂動と、テキストに対する学習可能な即時摂動を同時に生成する。
本実験は,LVLMを用いた攻撃の強い普遍的対角能力を示すものである。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:28:28 GMT)
Falcon-X: A Time Series Foundation Model for Heterogeneous Multivariate Modeling [15.7] 時系列基礎モデル(TSFM)は、大規模なクロスドメイン事前トレーニングを通じて予測パラダイムを変換している。
現在、ほとんどの既存のTSFMは、原変量空間内で直接動作する。
この設計は意味的アライメントと関係的表現性の基本的な制限を導入する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:03:21 GMT)
REVERSE: Reinforcing Evidence Verification and Search for Agentic Image geo-localization [15.4] 私たちはREVERSEという3つの中間的決定(見るべき場所、問い合わせすべき場所、信頼すべき証拠)を教えるフレームワークを紹介します。
オフラインの検索キャッシュは、強化学習中に検索観察を安定して再利用し、ノイズの多い検索結果に対する厳密な監視を可能にする。
4Bモデルでは、REVERSEは強力な検索強化ベースラインを上回り、Im2GPS3kとYFCC4kではかなり大きなモデルと競合する。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:20:09 GMT)
Agentic Language-to-Objective Synthesis for Optofluidic Assembly [15.4] Speak-to-Objectiveは、条件付きLarge Language Model(LLM)を使用して、音声または文字のコマンドを微分可能な目的関数に変換するモジュール型エージェントパイプラインである。
マイクロ流体環境下での粒子パターンの自然流動プログラム型光マイクロスケールアセンブリを実証する。
我々の研究は、自然言語、微分可能な目的、レーザーベースのアクチュエータが再利用可能なデジタルワークフローに結合される、自動運転、AI支援光学製造プラットフォームに向けられている。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:03:54 GMT)
MTL-FNO: A Lightweight Multi-Task Fourier Neural Operator for Sparse Field Reconstruction [15.4] マルチタスクフーリエニューラルオペレータ(MTL-FNO)は、ハードパラメータ共有に基づくエンドツーエンドのジョイントトレーニングフレームワークである。
MTL-FNOは標準FNOに匹敵する精度を達成し、全体のモデルサイズを76%と60%削減した。
その結果,MTL-FNOは標準FNOに匹敵する精度を達成し,総モデルサイズを76%,FNOを60%削減した。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:57:31 GMT)
The Labyrinth and the Thread: Rethinking Regularizations in Sequential Knowledge Editing for Large Language Models [15.4] 我々はまずAlphaEditの実証的な成功を分析し、厳密な最適化分析により、1回と逐次編集の形式的等価性を確立する。
信頼性の高いシーケンシャルアップデートには,多くの一般的な正規化戦略が不要であることを実証的に確認する。
私たちの研究は、Ariadne氏のスレッドにシーケンシャルな編集のラビリンスを通し、よりシンプルで、より解釈可能で、信頼性の高い知識更新への道をチャート化します。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:07:25 GMT)
Privacy-Preserving Screening for Record Linkage [15.4] 2つのパーティのプライバシ保存記録(PPRS)は、潜在的なコラボレーションの価値を評価し、関連するデータのプライバシとセキュリティを確保するために出現する。
安全で効果的かつ効率的なPPRSを実現するための回路PSIベースのシステムであるAppraisalを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:43:29 GMT)
Voluntary Collusion with Secret Tools in Competing LLM Agents [15.2] 本研究は, LLMに基づくマルチエージェントシステムにおいて, 自発的なコラシオン導入に関する最初の体系的研究である。
不公平なラベルやベースラインの整合性だけでは衝突を確実に抑えられないことを示す。
このような行為を防ぐには、一般的なアライメントに頼らず、明確な保護が必要であることを示唆する。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:06:39 GMT)
Balancing Fidelity and Diversity in Diffusion Models via Symmetric Attention Decomposition: Hopfield Perspective [15.1] 注意行列 $mathbfQKtop$ in transformer を対称および歪対称の部分に分解する。
ホップフィールド方式の安定性対策と世代間の多様性・多様性のトレードオフとの間に有意義な相関関係を観察する。
本稿では,このトレードオフを調節するための制御可能なノブを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:56:37 GMT)
Silent Consent, Persistent Risk: Android Permission Groups and Custom Permissions [15.0] 我々は、597万のユニークなアプリにまたがる1930万のAPKの縦解析を行います。
我々は、連絡先、SMS、位置情報、認証証明書、ユーザID、医療記録を無関係のアプリに公開するクロス開発者正規化許可ペアをユーザプロンプトなしで特定する。
この結果から,10年にわたるプラットフォーム強化にもかかわらず,同意の侵食は継続し,不明瞭なユーティリティから広くインストールされているソフトウェアに至るまで,アプリに影響を及ぼすことが明らかとなった。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:37:23 GMT)
MatFormBench: A Benchmarking Evaluation Framework for Target-Driven Materials Formulation [14.9] MatFormBenchは、ターゲット駆動型定式化のための生成戦略の評価とガイドに適した、新しいベンチマークエコシステムである。
MatFormBenchは、物理駆動の定式化生成スキームを統合し、材料構造-不純物応答関係を忠実にエミュレートする合成サンプルを生成する。
我々は、39種類の逆設計アルゴリズムを評価し、古典的なサロゲート支援ブラックボックス探索、最先端の深層生成モデル、そしてより人気のあるLarge Language Model(LLM)ベースのレコメンデーション戦略を網羅して、MatFormBenchを検証する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:15:11 GMT)
ContextGuard: Structured Self-Auditing for Context Learning in Language Models [14.9] 強い推論能力にもかかわらず、大きな言語モデル(LLM)は複雑な文脈知識を忠実に適用するのに依然として苦労している。
文脈に富んだタスクでは、モデルは周辺性、永続性、あるいはフォーマットに敏感な要求を欠いている間、中心的な推論経路をたどることができる。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:45:24 GMT)
Bounded-Compute Multimodal Regression for Product-Rating Prediction [14.7] 製品年代予測のためのSmolVLM2-256M-Video-Instructの有界数値適応を提案する。
最近のマルチモーダルエンゲージメント予測の結果により、我々は言語ヘッドをプールされたデコーダ状態によって供給される軽量な2層に置き換える。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:27:58 GMT)
Full-field prediction for engineering-scale three-dimensional aircraft with multigrid-hierarchical learning [14.6] MHLFは,工学的・大規模航空機流シミュレーションを高速化するための階層型学習フレームワークである。
マッハ0.15から6.0にまたがる3つの工学規模の航空機ケースで、MHLFは流れ場の精度を犠牲にすることなく収束を加速する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:13:16 GMT)
Provably Safe Motion Planning Under Unknown Disturbances [14.6] 本稿では,未知分布のランダムな乱れに影響を受けるロボットシステムのサンプリングに基づく動作計画アルゴリズムを提案する。
安全要件は、チャンス制約として定式化される。
ケーススタディでは,厳密な安全基準下での散在した環境における有効計画が,最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:02:27 GMT)
A Trilemma in AMM Mechanism Design [14.4] 自然な2段階AMM機構設計問題について検討する。
局所効率の弱さ (wLE) や均一価格 (UP) など,ICとその他の望ましい特性の同時実現の実現可能性について検討する。
我々の結果はトリレンマ式の定理として要約できる。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:20:52 GMT)
Tokenization with Split Trees [14.2] ToaST(Tokenization with Split Trees)は、圧縮を直接最適化するサブワードトークン化手法である。
ToaSTは、40,960以上の語彙サイズでBPE、WordPiece、UnigramLMと比較してトークン数を11%以上削減する。
1.5Bパラメータ言語モデルのトレーニングでは、ToaSTが最高スコアを獲得し、ベースラインの2.6%から7.6%を上回り、3つのうち2つが重要であり、22のタスクのうち13つが最高スコアである。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:59:39 GMT)
DV-SFT: Direct Vision Supervision for Fine-Grained Visual Understanding [14.2] マルチモーダルな大規模言語モデルは通常、接地真実の答えを予測するためにエンドツーエンドで訓練されるが、監督信号はテキストトークンにのみ適用される。
視覚情報のコアキャリアであるビジュアルトークンは、コンテキストの一部として暗黙的に最適化されているだけで、粗い粒度の視覚的理解につながる。
textbfDirect textbfVision textbf Supervised textbfFine-textbfTuning (DV-SFT) を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:41:48 GMT)
MUSE-Autoskill: Self-Evolving Agents via Skill Creation, Memory, Management, and Evaluation [14.2] 大規模言語モデル(LLM)エージェントは複雑なタスクを解決するために再利用可能なスキルに依存している。
既存のスキル創造アプローチは、スキルを独立した静的アーティファクトとして扱い、再利用性、信頼性、長期的な改善を制限する。
MUSE-Autoskill Agentは、エージェントがタスク解決能力を継続的に改善できるスキル中心のエージェントフレームワークである。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:59:19 GMT)
Can Entry-Wise Clipping Give Spectral Control of Stochastic Gradients? [14.1] 損失スパイクのようなトレーニングの不安定性は、しばしば勾配ノイズの結果である。
このトレードオフはバランスが取れます。
スペクトル正規化の前にエントリワイドクリッピングを適用すると、Muon上には$sim2%$トークンセーブが生成される。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:12:42 GMT)
TWIST: Closed-Loop token Synchronization for Application-Aware Wireless Digital Twins [14.1] TWISTは各物理観測をトークンとして表現し、この状態を無線リンク上で同期させる。
動的道路シーンのディジタルツインシナリオの実験は、TWISTがトラフィック状態の推論とセマンティックツインステート同期を改善していることを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:59:47 GMT)
Learning to Adapt SFT Data for Better Reasoning Generalization [14.1] 教師付き微調整(英: supervised fine-tuning、SFT)は、密集した監督を提供し、効率的な訓練を可能にするために広く用いられている。
DART(Data Adaptation for Reasoning Tuning)は、SFTデータをモデル適応型監視に変換するための強化学習を備えたマッパーモデルを訓練する。
実験により、DARTは一般化を改善し、直接RLよりも訓練効率を向上し、モデルが標準のSFTを超えるのに役立つことが示された。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:20:53 GMT)
Pop-Up Distractions Reveal Bag-of-Events Behavior in Video Large Language Models [13.9] 我々は,ビデオ大言語モデル (VideoLLM) が,無関係なビデオセグメントの存在下で,被写体や事象を強く関連付けることができるかどうかを評価する。
ビデオLLMは, 異なるセグメントのエンティティ間の相互作用を幻覚させることが多く, メインビデオにおいて, インジェクション広告からのアクションを被験者に誤った帰属させる。
以上の結果から,ビデオLLMには時間的接地機構が欠如していることが示唆された。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:41:05 GMT)
LaneRoPE: Positional Encoding for Collaborative Parallel Reasoning and Generation [13.9] 並列LLMテストタイムスケーリング技術(例えば、$N$のベスト)では、同じ入力プロンプトで条件付けられた$N>1$シーケンスを描画する必要がある。
これらの手法は、$N$世代の計算効率を生かしながら精度を高める。
生成時に$N>1$シーケンス間の協調と協調を可能にするLaneRoPEを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:43:15 GMT)
Feedforward 3D Editing Learns from Semantic-Part Transformation [13.6] フィードフォワード3D編集における中心的な課題は、高品質なペア管理の欠如にある。
スケーラブルなフィードフォワード3D編集はセマンティック部分変換から学習されるべきである。
PartFlowはフィードフォワード3D編集ネットワークで、ソース認識の潜伏制御を事前訓練された3D生成先行に注入する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:51:59 GMT)
GENESIS: Harnessing AI Agents for Autonomous 6G RAN Synthesis, Research, and Testing [13.4] 大規模言語モデル(LLM)は、一般的なソフトウェア工学における同等のR&D作業を数日から数分で圧縮した。
本稿では,エージェント人工知能(AI)フレームワークであるgenESISについて述べる。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:58:43 GMT)
Uncertainty-Aware Budget Allocation for Adaptive Test-Time Reasoning [13.4] 不確実性を考慮した予算割当(Uncertainty-Aware Budget Allocation、UAB)は、追加の推論コストなしで見積もられた要求当たりの不確実性に基づいて、固定サンプリング予算を再配置する凹型整数最適化フレームワークである。
1.5Bから27Bパラメータにまたがる6つのオープンウェイトモデルとブラックボックスモデルと、数学、論理学、選好タスクをカバーする5つの推論ベンチマークを評価した。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:06:58 GMT)
Boosting Knowledge Graph Foundation Models via Enhanced Negative Sampling [13.4] そこで我々は,既存の知識グラフを強化するための適応型負サンプリング手法KMASを提案する。
KMASはトレーニングプロセス全体を通して、ハード負の三重項の比率を動的に調整する。
提案手法は,過剰な追加時間やメモリ消費を必要とせず,多くのSOTA KGFMを増強することができる。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:42:41 GMT)
APEX: Amplitude Anchors and Phase Priors for Target-Scarce Higher-Frequency Wave Prediction [13.4] 本稿では,高周波数波動場予測のためのフレームワークを提案する。
eXtrapolated coarse 予測による振幅アンコールと位相優先誘導の促進を提案する。
SimpleWave、Helmholtz、Maxwellベンチマークの実験では、APEXは直接の低次から高次の外挿よりも一貫して優れていることが示されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:09:34 GMT)
IPIBench: Evaluating Interactive Proactive Intelligence of MLLMs under Continuous Streams [13.3] マルチモーダル大言語モデル(MLLM)は、リアクティブな質問応答において強力なパフォーマンスを達成するが、現実のストリーミングアシスタントは、連続した視覚的入力よりも積極的な推論を必要とする。
IPIBenchは、ストリーミングビデオ設定下でMLLMのインタラクティブインテリジェンスを評価するための最初のベンチマークである。
IPI-Agentは,対話制御ポリシを備えた学習自由エージェントフレームワークであり,プロアクティブトリガの安定化とマルチターンインタラクションのコーディネートを行うための時間ゲーティング機構である。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:23:25 GMT)
On the Origin of Synthetic Information by Means of Steganographic Inheritance [13.3] 種の起源は自然科学における謎の謎である。
本稿では,遺伝性に類似したメカニズムであるステガノグラフィーを提案する。
我々は、単純な始まりから終わりのない形へと分岐し、進化し、進化している、隠蔽されながらトレース可能な系統特性を備えた、合成情報を提供する、サイバーエコシステムを構想する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:18:16 GMT)
SIMPC: Learning Self-Induced Mirror-Point Consistency for Unsupervised Point Cloud Denoising [13.3] 本稿では,自己誘導ミラーポイント整合性(SIMPC)を提案し,点間の決定論的対応を学習する。
ノイズの多い点ごとに、SIMPCは基底表面の反対側のミラーポイントを生成し、デノナイジング過程の幾何学的先行によって導かれる。
SIMPCは最先端の教師なし手法を著しく上回り、いくつかの強力な教師付き手法を上回っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:56:03 GMT)
TCBiRRT: Rapid Motion Planning for Tightly Coupled Dual-arm Space Manipulator Using Task-space Random Expansion [13.2] 閉鎖制約下での密結合型双腕空間マニピュレータの運動経路の計画は、基本的かつ困難な問題である。
本稿では,タスク空間制約付き双方向高速探索ランダムツリーアルゴリズムTCBiRRTを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:24:07 GMT)
Towards Shared Embodied Intelligence in Humanoid Robots through Optimization Development and Testing of the Human Aware ergoCub Robot [13.2] 本研究では,ロボットが人間と物理的に協調することを可能にするために,共有知性と認知を具体化するアーキテクチャを提案する。
我々のアーキテクチャは、人間のエルゴノミクス指標に関して、ロボットハードウェアと物理インテリジェンスパラメータを最適化する。
本稿では,人間との協調作業に最適化されたヒト型ロボットergoCubについて紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:13:41 GMT)
What Makes Chain-of-Thought Work at Probe Time? Local Co-occurrence Rather Than Global Derivation [13.2] 思考の連鎖は言語モデルの精度を確実に向上させる。
しかし、合理的テキストのどの特性が改善を促進するかは理解されていない。
私たちはプローブタイムの質問に答える: 文脈における固定された論理が与えられた場合、そのテキストで答えが変わるのは何か?
論文参考訳(メタデータ) (Tue, 26 May 2026 10:10:01 GMT)
MemMark: State-Evolution Attribution Watermarking for Agent Long-Term Memory Systems [13.1] メモリベースのエージェントは、リークされたスナップショットや移行されたスナップショットを生き残るための証明を必要とする。
MemMarkは、オーナー制御シグナルを潜在メモリ書き込み決定に埋め込む。
MemMarkは、生き残ったトレース、信頼できるメタデータ、ユーティリティ劣化のない長期的なエージェントメモリで実現可能である。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:35:05 GMT)
Poison with Style: A Practical Poisoning Attack on Code Large Language Models [13.1] Code Large Language Models (CLLM) は現代のコードエージェントの中核として機能し、開発者は複雑なソフトウェア開発タスクを自動化できる。
CLLMを標的とした実用的でステルスなモデル中毒攻撃であるPoison-with-Style (PwS)について述べる。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:51:57 GMT)
AI-T2I: Aggregating-and-Isolating Cross-Attention to Diffusion Models for Text-to-Image Synthesis [12.8] 本稿では,AI-T2Iと呼ばれるテキスト間合成のための拡散モデルに対するアグリゲーション・アンド・アイソレート・クロスアテンション手法を提案する。
我々のAI-T2Iは、例えば、制御可能なレイアウト生成やパーソナライズされた生成など、他のタスクに対して優れた一般化を示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:36:41 GMT)
Probabilistic Smoothing with Ratio-Monotone Transforms for Global Optimization [12.7] フレキシブル対称ユニモーダルカーネルとモノトニック比に基づく変換を組み合わせた一般的な平滑化フレームワークを提案する。
高次元ベンチマークとブラックボックス攻撃の実験では、堅牢性と競争性能が改善された。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:25:01 GMT)
Auditing and Fixing Economic Validity in Tabular Foundation Models for Discrete Choice [12.7] タブラル基礎モデルは選択予測タスクにおいて高い精度を達成する。
しかし、彼らの予測は、それらのタスクが必要とする経済論理に反することが多い。
実用最大化フレームワークに基礎モデル予測を組み込む2段階のアダプタを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:13:20 GMT)
When Muon Optimizer Meets Adversarial Training: A Theoretical and Empirical Study [12.6] 敵の攻撃に対する最も信頼性の高い実証的防御の1つとして、敵の訓練(AT)がある。
SGDはATのデフォルトの最適化選択であり続けているが、アダプティブは標準トレーニングを改善することが多いが、ロバスト性は劣る可能性がある。
Muonは、SGDに匹敵するメモリコストで大規模なトレーニングに成功した。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:24:04 GMT)
RAVE: Re-Allocating Visual Attention in Large Multimodal Models [12.2] RAVEは、視覚的キーに対する事前の注意スコアに学習されたクエリキーバイアスを追加する軽量なペアゲーティング機構である。
RAVEは標準的注意力よりも平均3ポイント向上し、知覚集約的なタスクに最大の利益をもたらす。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:49:58 GMT)
On the Generalization Capabilities, Design Choices and Limitations of Keypoint Imitation Learning [12.2] RGBベースの模倣学習は、見えないオブジェクトやシーンに一般化するために多くのデモを必要とする。
ビジュアルファウンデーションモデルは、キーポイントのワンショット抽出により、そのような表現を提供する。
キーポイント模倣学習(KIL)に関する従来の研究のアプローチを組み合わせて,実践的ガイドラインを提供するための設計選択について検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:31:43 GMT)
It's Not Always Sycophancy: Measuring LLM Conformity as a Function of Epistemic Uncertainty [12.2] 大規模言語モデル(LLM)は,ユーザからのフィードバックに適合する最初の姿勢を放棄することを示す。
我々は,共同で適合を駆動する2つの要因を特徴づける: 空想的適合性と不確実性駆動的適合性。
MUSEは、アライメントによって引き起こされるシコファンシーとトレーニングコーパスによって引き起こされる不確実性を区別することで、より標的となる介入戦略を通知する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:04:11 GMT)
CoCoVideo: The High-Quality Commercial-Model-Based Contrastive Benchmark for AI-Generated Video Detection [12.1] CoCoVideo-26Kは、13の主流の商用ジェネレータをカバーする、対照的な商用モデルベースのAIGCビデオデータセットである。
このデータセットに基づいて,コントラスト学習とMLLM推論を統合したフレームワークであるCoDetectを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:18:44 GMT)
Which Changes Matter? Towards Trustworthy Legal AI via Relevance-Sensitive Evaluation and Solver-Grounded Reasoning [12.0] 法的なAIは、法的に無関係な摂動の下で安定していなければならない。
本報告では, 公正性, 堅牢性, および法令の混同シナリオにまたがって, 変更すべきこと, 変更すべきでないことを評価する一貫した評価スイートを導入する。
本稿では,形式的推論に基づく逆多エージェントフレームワークであるLexGuardを紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:20:06 GMT)
Aligning Provenance with Authorization: A Dual-Graph Defense for LLM Agents [11.9] LLMベースのエージェントは、Eメール管理、金融トランザクション、コード実行など、ハイテイクなシナリオにますますデプロイされている。
2つの相補グラフを構成するデュアルグラフアライメント・ディフェンス・フレームワークであるAuthGraphを提案する。
AgentDojoでは、AuthGraphが攻撃成功率を40%から1%に削減し、GPT-4oでは76%のタスク完了率を維持している。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:20:23 GMT)
PDEInvBench: A Comprehensive Dataset and Design Space Exploration of Neural Networks for PDE Inverse Problems [11.7] 偏微分方程式(PDE)における時間的問題は、溶液場から観測システムの物理パラメータを推定することを含む。
神経ネットワークは関数-関数間空間変換をモデル化する能力のため、PDEパラメータ推定に適している。
PDEInvBenchは、時間依存PDEと時間依存PDEの両方の数値シミュレーションからなる包括的なベンチマークデータセットである。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:06:38 GMT)
RAPNet: Accelerating Algebraic Multigrid with Learned Sparse Corrections [11.7] 本稿では,粗いグリッド演算子の疎度と収束品質のトレードオフを解消するグラフニューラルネットワーク(GNN)フレームワークであるRAPNetを提案する。
このアプローチの鍵となるのは、小さなサブグラフから学習し、100万ノードドメインへの一般化を可能にするレベルワイドなトレーニング戦略です。
本手法は,PDE離散化およびグラフラプラシアンに基づく古典的非ガレルキン基底線よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:14:59 GMT)
Plans for Evaluating Structured Generative Search Summaries [11.7] 本稿では,有機Web検索結果上に配置された構造的生成検索サマリーを評価するためのフレームワークを提案する。
構造化された要約は、大言語モデルによって生成され、概して概要、いくつかのセクションのタイトル、およびソースドキュメントのリストから構成される。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:08:21 GMT)
Prompt Injection Detection is Regime-Dependent: A Deployment-Aware Evaluation with Interpretable Structural Signals [11.5] マルチモデルおよびマルチレジーム実験フレームワークを用いたインジェクション検出のデプロイメント・アウェア評価について述べる。
我々は複数のアウト・オブ・ディストリビューション・セッティングで語彙、意味、構造、トランスフォーマーに基づく検出器を比較した。
その結果,検出性能は状態依存性が高く,しきい値選択に敏感であることが示唆された。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:19:25 GMT)
Multi-Stakeholder LLM Alignment: Decomposing Estimation from Aggregation [11.4] 我々は,このアグリゲーション固有の強調ノイズが,利害関係者の満足度を分散させると,大きなスコアシフトを引き起こすことを実証的,理論的に示す。
提案するtextscDecompR: 候補スコアの前にクエリ構造から逆ファクト重みを固定し, ロール単位のユーティリティを独立して推定する。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:37:43 GMT)
Are Video Models Zero-Shot Learners and Reasoners in Education? EduVideoBench, A Knowledge-Skills-Attitude Benchmark for Educational Video Generation [11.4] 教育分野における最初のバランスの取れたベンチマークであるEduVideoBenchを紹介します。
以上の結果から,授業前に知識,スキル,態度の面で改善の余地があることが示唆された。
EduVideoBenchは、教室の安全を図ったVGMの開発をガイドしてくれることを願っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:16:41 GMT)
FAST-GOAL: Fast and Efficient Global-local Object Alignment Learning [11.4] 本稿では,CLIPの長文処理能力を向上するFAST-GOALを提案する。
まず、FLISM(Fast Local Image-Sentence Matching)は局所画像領域を効率的に抽出する。
第二に、トークン類似性に基づく学習(TSL)は、画像内の特定の領域と対応する領域の埋め込みからのパッチトークンの類似性を最大化する。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:52:46 GMT)
Your Neighbors Know: Leveraging Local Neighborhoods for Backdoor Detection in Decentralized Learning [11.3] 分散学習(DL)に固有の新しいバックドア検出フレームワークArgusを紹介する。
Argusでは、正直なノードが受信したモデル更新をローカルに分析し、潜在的バックドアトリガーを特定する。
その結果,Argusは攻撃成功率を90ポイントまで下げることができた。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:26:16 GMT)
Beyond a Single Direction: Chain-of-Thought Disrupts Simple Steering of Refusal [11.2] 大規模な推論モデルは最終的な出力を生成する前にチェーン・オブ・ソート・トレースを生成する。
LRMの拒絶は、残留ストリーム活性化とCoTで共同にコードされる。
これにより、LIMは活性化レベルの介入に対して単独でより堅牢になるが、CoTを代替表面攻撃に晒す。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:41:15 GMT)
DynaSchedBench: Calibrated Dynamic Scheduling Benchmarks and Observability Paradox in LLM-based Scheduling Agents [11.2] textbfDynaSchedBenchはDFJSPの診断フレームワークで、インスタンス生成プロセスを厳格に制御する。
パラメータサンプリングに頼る代わりに、新しいスケジュールストレス指標(SSI)を計算し、難易度でインスタンスを階層化するSequential Event-Space Calibrator(SESC)を用いる。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:36:54 GMT)
Mildly Overparameterized ReLU Networks on Orthogonal Data: Incremental Learning and Implicit Bias [11.2] トレーニングデータを用いた2層ReLUネットワークの勾配流れのダイナミクスについて検討する。
制限流はサドル・アンド・サドル・ジャンプに収束することを示す。
より広範に、我々の研究はReLUネットワークのための漸進的な学習プロセスの最初の厳密な証明を提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:39:20 GMT)
ChainCaps: Composition-Safe Tool-Using Agents via Monotonic Capability Attenuation [11.1] ChainCapsは透過的なMPPプロキシとして実装されており、エージェントやツールサーバの変更は必要ありません。
3つのプロバイダから5つのフロンティアモデルにまたがる82タスクにおいて、ChainCapsは攻撃成功率を25-68%から0-4.8%に下げる。
我々の主張は、信頼されたマニフェストとプロキシ可視のデータ移動の下での明示的なフロー構成の安全性に限られている。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:44:59 GMT)
Finding Koopman Invariant Subspaces via Personalized PageRank [11.1] 我々は、スパンがクープマン不変である任意の部分辞書は、EDMD行列において正確なゼロブロックを誘導することを示した。
次に、行正規化EDMD行列にPageRankを適用することにより、そのようなブロックを検出することができることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:38:38 GMT)
Bayesian Deployment Approval for Learned Landing Controllers under Finite Rollout Validation [11.1] この研究は、有限ロールアウトエビデンスの下で学習された自律着陸制御装置に対するベイズ承認フレームワークを開発する。
不確実な動作条件下でのタッチダウン安全度に基づいて,確率的着地能力の定式化を導入する。
提案フレームワークは,不確実性下での強化学習評価と展開指向の検証の間に,実用的な統計的関係を提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:45:17 GMT)
SPHERE-JEPA: Spherical Prediction with Homogeneous Embeddings [11.1] 近年、LeJEPAはユークリッド空間における下流予測リスクを最小化するために、等方的ガウス埋め込みを最適とみなしている。
最悪の場合の定式化では、k-アネレスト近傍とカーネルリッジ回帰の両方が超球面均一性を引き起こす。
理論的に基盤となるSSLフレームワークであるSPHERE-JEPAを紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:00:40 GMT)
Learning Energy-Based Models from Stochastic Interpolants using Spatiotemporal Differences [10.9] データサンプルからエネルギーベースのモデルを学ぶことは、機械学習における中心的な問題である。
共同時間差によるエネルギー学習の枠組みであるstNCEを提案する。
画像および分子の実験は、最先端密度推定法と競合する性能を示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:07:02 GMT)
TrackRef3D: Multi-View Consistent Track-then-Label for Open-World Referring Segmentation in 3D Gaussian Splatting [10.8] 本稿では,3次元ガウススプラッティング(3DGS)におけるオープンワールド参照セグメンテーションを実現する完全自動パイプラインであるTrackRef3Dを提案する。
本稿では,同義語クラスタリングとトラジェクティブ・アウェア投票を通じて,クロスビュー予測を集約し,標準的セマンティック・アイデンティティを確立するトラジェクティブ・アウェア・セマンティック・コンセンサス・モジュール(TSCM)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:49:12 GMT)
Bose-Einstein thermal operators for semidefinite optimization [10.7] 我々は一般SDPを、ボース=アインシュタインエントロピーによって正規化される厳密な正の温度でボゾン自由エネルギー最小化問題として再考する。
ハミルトニアンシミュレーションのみを用いて正規化SDPのためのハイブリッド量子古典アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:09:55 GMT)
ParkingWorld: End-to-End Autonomous Parking Reinforcement Learning from Corrective Experience in 3DGS Simulation [10.5] 本稿では、終端自動駐車のためのループ内サンプル効率強化学習フレームワークを提案する。
実際のシーンの高忠実度デジタル再構成を可能にする3Dガウススプラッティング(3DGS)駐車シミュレーターで完全に訓練されている。
本手法は, 各種シナリオにおける駐車成功率, 運転効率, 安全性能の大幅な向上を実現する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:39:20 GMT)
Using Probabilistic Programs to Train Inductive Reasoning in Large Language Models [10.5] 多くの現実世界の推論問題は帰納的であり、エージェントは曖昧で曖昧な観察から不確実な信念を推測しなければならない。
帰納的推論に標準的な微調整法を用いるには課題がある。
これらの制約に対処するために,PPT(Program Posterior Training)を導入する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:40:02 GMT)
Sparse-LiDAR Prompting of Monocular Geometry Foundations: An Empirical Study Toward Long-Range Driving Depth [10.5] 真に疎いLiDAR入力を受け入れるMoGe-2の最初の適応であるSLIMを提案する。
Virtual KITTIとCARLAでは、SLIMはMoGe-2ベースラインの絶対誤差を100-150mで約39-51%削減する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:12:15 GMT)
Discovery Agents for Real-Time Analytics: Toward Proactive Insight Systems [10.5] リアルタイムデータストリーム上での自律的な洞察発見のためのマルチエージェントアーキテクチャを提案する。
アーキテクチャは、エージェントが仮説を生成し、それらを実行可能な分析にコンパイルし、生成されたアーティファクトを検証し、視覚化とデプロイ可能なアプリケーションを生成する、継続的発見ループを実装している。
鍵となるコントリビューションは、型付き中間アーティファクトに基づいたコントラクト駆動設計であり、モジュール性、可観測性、系統、動的に生成された分析のより安全な実行を可能にする。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:43:25 GMT)
Leveraging Visual Signals for Robust Token-Level Uncertainty in Vision-Language Generation [10.2] 不確実性定量化(UQ)は、LVLM(Large Vision Language Models)において重要な課題である。
VIG-TUQ(Visual-Grounded Token UQ)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:04:55 GMT)
Learning to Balance Motor Thermal Safety and Quadrupedal Locomotion Performance with Residual Policy [10.2] 本稿では,四足歩行ロボットの全身熱モデルを強化学習パイプラインに統合し,運動温度を更新する。
残留ポリシーは、ロボットの熱状態に基づいて補正アクションを提供するための名目上のポリシーに基づいて訓練される。
シミュレーションの結果, 提案手法は, モータの熱安全性と移動性能のバランスを効果的に向上することを示した。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:00:10 GMT)
Worker Disagreement Reveals Sharp Directions in Local SGD [10.1] ディープ・ニューラル・ネットワーク・トレーニングは、しばしば非常に異方的な損失幾何学を示し、いくつかの鋭い支配的なヘッセン方向と大きな平らなバルクが共存する。
したがって、支配部分空間を見積もるのは有用であるが、直接 Hessian-based 法ではコストがかかる。
標準的なローカルSGDは、労働者の不一致によってこの幾何学を露出することを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:30:37 GMT)
Aligning LLMs with Human Uncertainty: A Beta-Bernoulli Calibrator for LLM Forecasting [10.1] 本研究では,任意のモデルからの初期点推定予測をイベント確率上の分布に変換するBeta-Bernoulli Calibrator (BBC)を提案する。
以上の結果から,BBCは従来型の校正法やモデルよりも,より精度の高い校正・精度の予測を行っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:39:33 GMT)
Dense2MoE: Pushing the Pareto Frontier of On-Device LLMs via Unified Pruning and Upcycling [10.0] Mixture of Experts MoEアーキテクチャは、デバイスデプロイメントに制約のあるリソースに対して非常に有望だが、これらのモデルをスクラッチからトレーニングすることは禁忌なコストである。
現在の手法では、密度の高いモデルをMoEにアップサイクルすることでこれを緩和しようとするが、しばしばパラメータの冗長性を導入し、推論効率を低下させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:19:04 GMT)
The Kalman Evolve: Closing the Gap in Kalman Filtering via Interpretable Algorithm Discovery [9.7] 本稿では,ノイズパラメータと更新構造を協調的に最適化することで,改良されたフィルタリングアルゴリズムを発見するためのフレームワークを提案する。
提案手法では,大規模言語モデル(LLM)をプログラム空間上の構造化前処理として利用し,従来のカルマンフィルタに対する解釈可能な非アフィン修飾を生成する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:50:40 GMT)
ForestHG-Trace: Traceable Long-Horizon Ecological Reasoning over Large-Scale Forest Scenes [9.7] ForestHG-Traceは、森林環境に対する追跡可能な長期の生態学的推論のためのフレームワークである。
エージェントは、読み取り、フィルタリング、拡張、集約、比較、監査のための決定論的ツールを呼び出す。
ForestTraceQAは、様々なタスクタイプと推論深さにわたる生態的QAを評価するための実行可能なベンチマークである。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:04:02 GMT)
BASIS: Batchwise Advantage Estimation from Single-Rollout Information Sharing for LLM Reasoning [9.7] 既存のアルゴリズムは、値推定とポリシー学習における計算効率とサンプル効率のトレードオフに直面している。
このトレードオフに対処するために,ポストフリーな批判アルゴリズムを導入する。
実験では、REINFORCE++と比較して、値関数推定のMSEを69%削減している。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:06:41 GMT)
ConVer: Using Contracts and Loop Invariant Synthesis for Scalable Formal Software Verification [9.6] トップダウンのコンポジション検証ツールであるConVerを紹介します。
トップレベルのアサーションを持つCプログラムの場合、ConVerは検証トップダウンを分解する。
ConVerを4つのベンチマークスイートで評価し、難易度を高め、他のSOTA(State-of-the-art)ツールと比較した。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:04:40 GMT)
Object Pose and Shape Estimation for Grasping: Does it Work? [9.6] 我々は、最先端の、エンドツーエンドのグリップ合成法と3つのモジュラー法を実装し、比較する。
すべての実験において、モジュラー手法がエンドツーエンドの手法より優れていることが観察された。
モジュラー手法の有効性はポーズと形状推定の精度に左右され, 乱れの場面では部分的劣化に悩まされる。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:32:50 GMT)
Cyberbullying Governance on Social Media: A Unified Framework from Content Identification to Intervention [9.5] ソーシャルメディアプラットフォームの普及は、サイバーいじめ、ヘイトスピーチ、その他のオンライン毒性の拡散を必然的に触媒している。
既存の研究は主に、サイバーいじめのガバナンスを、ポストレベルで受動的で孤立した検出として扱う。
本稿では,サイバーバブル管理のパラダイムを,独立した静的検出から,統合的かつ継続的かつ積極的なモデレーションへとシフトさせる,統一されたフルライフサイクルガバナンスフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:53:19 GMT)
Agile Online Model Selection: Resolving Adaptation Lag via Safeguarded Large Learning Rates [9.5] 本稿では,保護された大規模学習率を最大$(T) まで活用する,新しい楽観的なオンラインミラー降下法を提案する。
私たちの重要な技術的貢献は、不安定な更新を動的に監視し、過度の後悔を招く学習率を排除する、ポストホックペナルティメカニズムです。
人工的および11の多様な実世界のデータセットに対する実証的な評価は、我々のアプローチが適応ラグを数百ラウンドから数ラウンドに短縮することを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:18:08 GMT)
Transformers Can Learn Posterior Predictive Distributions In-Context [9.4] 後続予測平均と分散を対象とする勾配降下アルゴリズムを実装でき、次いで非線形写像によりPSDの双発確率を導出できることを示す。
さらに, 標本サイズ範囲を超えて, 変圧器の補間機能を実現する上で, 正規化の鍵となる役割と注意深度の選択について述べる。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:54:02 GMT)
Heterogeneous AAV Logistics Task Allocation: A Reinforcement Learning Enhanced Overlapping Coalition Formation Game Approach [9.4] 時間に敏感なタスクは、異種AAVのロジスティクスタスク割り当てにおいて重要な最適性課題となる。
連立ゲームに重なる強化学習を提案する。
数値シミュレーションにより,提案アルゴリズムはタスク割り当ての最適性を効果的に向上することを示した。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:28:36 GMT)
Grounding Text Embeddings in Stakeholder Associations [9.3] 本稿では,人間の理解において,専門家関係を明確化し,埋め込みモデルを基礎づける手法を提案する。
デンマークの政策問題に関する主要なケーススタディでは、ニューラルネットワークの埋め込みは人間の専門家よりもかなり信頼性が低いことが分かりました。
米国連邦政府のAIユースケースに関する二次研究は、デジタルプロトコルと専門家の異なるコミュニティを使ってギャップを再現している。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:24:15 GMT)
READER: Reasoning-Enhanced AI-Generated Text Detection [9.3] 我々は、人間/AIラベルと、その決定の証拠を記述した構造化された根拠の両方を出力する推論強化AIテキスト検出器であるREADERを提案する。
このアプローチの重要なコンポーネントは、合理性と判断のキュレートされた監視セットであるREADです。
READERは既存の検出器を一貫して上回り、高容量のLDMベースラインを誘導する。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:00:26 GMT)
CFDTwin: An open-source GUI and Python toolkit for POD-NN surrogate modeling of ANSYS Fluent simulations [9.3] 本稿では、Fluentシミュレーションのための再利用可能なワークフローにこれらのステップをパッケージ化するオープンソースPythonパッケージCFDTwinと、オプションのデスクトップグラフィカルユーザインタフェース(GUI)を紹介する。
CFDTwinは、シミュレーション入力と量出力の定義、実験結果の設計サンプルの生成、フルエントバッチシミュレーションの実行と再開、スカラー、表面フィールド、セルゾーンアウトプットのためのPODNNサロゲートモデルのトレーニング、バリデーションメトリクスの検査、Fluentを再実行せずにトレーニングされたモデルの評価を可能にする。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:00:49 GMT)
Software Engineering Podcasts: An Empirical Study of Their Potential as a Research Resource [9.2] 本研究は,ソフトウェア工学(SE)ポッドキャストのランドスケープを体系的に探求する。
ポッドキャストの内容を分析し、研究者を調査し、ポッドキャストがソフトウェア工学の研究を前進させるための重要なリソースとなるかを評価する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:09:02 GMT)
Forecasting Japanese elections: A nonlinear machine-learning approach [9.2] 本研究では,日本語選挙の結果を予測するために,決定木とアンサンブル学習法に基づく非線形機械学習予測モデルを提案する。
本モデルでは, サンプル内およびサンプル外の両方において, LBTのモデルと比較して, 適度ながら一貫した予測精度が向上した。
これは、他国の国固有の選挙理論と組み合わせることで、より広範な国家的文脈における予測モデルの予測性能を高めることができるレプリカブルな枠組みを提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:46:24 GMT)
When Do LLM Agents Treat Surface Noise Differently from Semantic Noise? A 68-Cell Measurement Study with a Held-Out Trace-Level Validation [9.1] 10大言語モデルによって駆動されるチェーン・オブ・シンクとReActエージェントに経験的現象を記述した。
平均的な摂動は、同等の厳しさのプレゼンテーション摂動よりも、最終的な答えを頻繁に変更する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:50:43 GMT)
$\textit{BlockFormer}$ : Transformer-based inference from interaction maps [9.0] 相互作用写像からの推論は、一般的な逆問題として定式化することができる。
これらのマップ間の共有構造を利用するデータ駆動型アプローチを導入する。
提案手法は,このような可変性を扱えるトランスフォーマーアーキテクチャと,多量かつ安価で安価な合成データを生成するカスタムシミュレータに頼っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:41:09 GMT)
GraphMind: From Operational Traces to Self-Evolving Workflow Automation [8.9] 我々は、最小限の努力でアクション中心のワークフローグラフを構築し、実行し、進化させるシステムであるGraphMindを提案する。
このシステムは、インシデント調査のために、4つのプロダクションクラウドデータベースサービスにデプロイされている。
評価された会話の97%は、対話的なレイテンシの中で実行可能な結果をもたらす。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:01:30 GMT)
Eliot: Interactively $\underline{E}$xploring Fast-Changing Scientific $\underline{Li}$terature Trends with $\underline{O}$nline Da$\underline{t}$a and Learning [8.9] $texttEliot$は、進化する文献のトレース可能な探索のためのインタラクティブシステムである。
クエリ時にarXiv文書を検索し、タイトルと抽象によって各論文を表現し、コーパスをテーマにクラスタ化し、各クラスタの公開年分布を視覚化する。
$texttEliot$は、急速に変化する技術分野の監査可能な概要に最も価値がある。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:25:43 GMT)
Quantifying Uncertainty in Space Debris Capture with Active Tether-Net Systems Caused by Noisy Observations [8.8] 操作可能なユニットを備えたアクティブテザネットシステムは、この問題に対する有望な解決策の1つである。
本稿では, これら2つの不確実性源の1つに焦点をあて, 結果の不確実性の伝播と定量化のためのパイプラインを提案する。
高忠実度シミュレータと低忠実度サロゲート環境を用いて、予測精度と不確実性解消の容易さのトレードオフを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:14:00 GMT)
PANDO: Efficient Multimodal AI Agents via Online Skill Distillation [8.8] 単ロールのオンラインスキル蒸留フレームワークであるPANDOを紹介します。
910のVisualWebArenaタスクの完全なセットで、PANDOは58.3%の成功率を達成した。
300タスクのアブレーションは、ルールとルーチンがほとんどの成功をもたらすことを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:25:32 GMT)
A High-Contrast Bragg Atom Interferometer for Testing Continuous Spontaneous Localization [8.7] ブラッグ原子干渉計における連続自然局在(CSL)モデルの影響について検討した。
99$%の高外周コントラストを実現するブラッグ干渉計が実証されている。
原子干渉計のコントラスト損失の原因となる要因を系統的に解析し,補正した。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:19:17 GMT)
ReMoE: Boosting Expert Reuse through Router Fine-Tuning in Memory-Constrained MoE LLM Inference [8.7] きめ細かいMixture-of-Experts(MoE)モデルはトークンごとに専門家のサブセットだけを活性化する。
メモリ制約のある推論シナリオでは、少数の専門家しかキャッシュできない。
トークンワイド専門家の再利用を促進するために設計されたルータファインチューニングフレームワークであるReMoEを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:32:56 GMT)
Cast a Wider Net: Coordinated Pass@K Policy Optimization for Code Reasoning [8.6] Coordinated Pass@$K$ Policyは、pass@$K$ジェネレーションを戦略に関する共同調査に変える。
APPS、CodeContests、LiveCodeBench-v6全体で、CPPOは、直接サンプリング、プランニングベースライン、プランナーのみのSFT、パス@$K$-orientedで、同じ$K=4$ソルバ回避予算で、pass@4$を改善している。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:21:11 GMT)
Behind EvoMap: Characterizing a Self-Evolving Agent-to-Agent Collaboration Network [8.6] 本稿では,A2AコラボレーションネットワークであるEvoMapについて,大規模な実証的研究を行った。
スケーラブルな成長を優先する設計選択が、再利用性、進化性、監査性にトレードオフをもたらすことを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:07:12 GMT)
Towards Generalization-Oriented Models for Vehicle Routing Problems with Mixture-of-Experts [8.6] 本稿では,Residual Refined Experts with Instance-level Gating (R2E-IG) を提案する。
R2E-IGは、ディストリビューションとアウト・オブ・ディストリビューションの両方のインスタンスにおける最先端のベースラインに対する競合性能を達成する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:46:54 GMT)
Adversarial Training for Robust Coverage Network under Worst-case Facility Losses [8.6] 本稿では,最大被覆位置-干渉問題の解法として,デュアルエージェント深層強化学習フレームワークを提案する。
我々のフレームワークは、ネットワーク構造に非依存であり、その基盤となる対数学習パラダイムは、他の二段階最適化問題を解く強力な可能性を示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:36:37 GMT)
Landseer: Exploring the Machine Learning Defense Landscape [8.6] 機械学習(ML)ディフェンスをMLライフサイクルに統合するためのフレームワークであるLandseerを紹介します。
予備研究では,35個の最先端の機械学習ディフェンスを同定した。
本研究は, 防衛家族間の複製能力のギャップを明らかにし, 複数防衛を統合する上での課題と機会について考察した。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:10:35 GMT)
The Future of Facts: Tracing the Factual Generation-Verification Gap [8.6] 言語モデルは事実的知識のデフォルトインターフェースになりつつあるが、しばしばそれらを生成するよりも確実に出力を検証する。
この生成検証ギャップ(GV-gap)は、近年の自己改善と推論の進歩の根底にある。
我々は,現実的なGVギャップの根底にあるトレーニングメカニズムに注目し,それらと計算的および美学的な相違点を区別する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:36:42 GMT)
When Eyes Betray AI: Social Gaze Consistency as a Semantic Cue for AI-Generated Image Detection [8.6] 本稿では,視線方向の相互コヒーレンス,頭部アライメント,対人関係の瞳孔配置として定義された高レベルの意味的キューであるソーシャル・ゲイズ・コンシステンシーを紹介する。
既存の低レベルパラダイムに対して,これまで未利用であった検出軸を構成することを示す。
4ステップのアカウントでは、単一インパインター(FLUX.1-Fill)のトレーニングがマルチジェネレータスイートに移行した理由が説明されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:50:17 GMT)
PinPoint: Prompting with Informative Interior Points [8.5] 以前の作業は、境界線、イントラクタ、背景の散らばりに着地する、鼻でサンプリングされた点に依存していた。
我々は、この観察を、4つの視覚的手がかりをコンセンサスマップに融合させる決定論的でトレーニングなしのポイントセレクタであるPinPointに変換する。
タスク固有のトレーニングがなければ、PinPointは同じスタック上の教師付きおよびRL指定のスペシャリストと一致し、クエリ毎に2つのVLMコールしか発行しない。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:28:54 GMT)
FTibSuite: A Comprehensive Resource Suite for Tibetan Vision-Language Modeling [8.3] ヴィジュアル言語モデルは急速に進歩しているが、チベット語は依然として極めて低リソース言語である。
チベットの視覚言語研究のための総合的なリソーススイートであるFTibSuiteを紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:36:27 GMT)
Probabilistic Recurrent Intention Switching Model [8.3] 逆強化学習(IRL)は、観察された行動から報酬関数を回復するが、伝統的な手法では、エピソード内でゴール切替を捉えることができない単一の定常報酬を仮定する。
近年のマルチインテンションIRL法は、トラジェクトリをセグメント化することでこの問題に対処しているが、モデル意図の遷移はメモリレスマルコフ連鎖または固定された履歴ウィンドウによる手動状態拡張のいずれかである。
本稿では,観測履歴をステップごとの意図分布にマッピングする軽量なリカレントネットワークを両機構に置き換える確率的リカレントインテンションスイッチングモデル(PRISM)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:19:00 GMT)
Traceable Knowledge Graph Reasoning Enables LLM-Assisted Decision Support for Industrial VOCs in the Steel Industry [8.2] Chat-ISVは知識グラフ(KG)の強化されたマルチエージェントQ&Aシステムで、キュレートされた鉄鋼産業VOCの文献コーパスを解析する。
断片化された環境工学の文献をトレース可能、クエリ可能、意思決定支援指向の知識に変換することで、Chat-ISVはスケーラブルな環境情報科学パラダイムを確立する。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:21:23 GMT)
Building an Atlas of Social Experiments to Link Studies, Reconcile Conflicts, and Bridge Gaps [8.2] 実験のアーカイブをアトラスに変換するためのフレームワークであるExAtlasを紹介する。
ExAtlasは、治療と結果空間に局所的に近い先行研究を探索し、対象効果を予測するために観察された効果を構成することができるかどうかを問う。
もし構成が成功するが一致しないなら、ExAtlasはそれを説明できる候補モデレーターや高レベル理論を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:14:41 GMT)
Tracing Computation Density in LLMs [8.1] 変換器をベースとした大規模言語モデル(LLM)は、深層および広範囲の計算グラフに配置された数十億のパラメータで構成されている。
モデル出力を最もよく近似するサイズ s のサブグラフを効率的に推定する s-Trace 法を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:55:08 GMT)
Beyond Epsilon: A Principled QIF Framework for Local Differential Privacy [8.1] ローカル微分プライバシー(LDP)は、大規模システムにおけるプライバシ保護データ収集のデファクトスタンダードとなっている。
定量的情報フロー(QIF)のレンズを用いたLDP周波数推定プロトコルの解析フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:20:11 GMT)
Can LLMs extract scientific consensus? A case study in high-temperature superconductivity [8.1] 大規模言語モデル (LLM) は情報抽出と要約において顕著な性能を示した。
本研究では, 高温超伝導(HTS)の文脈におけるこの問題について検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:52:37 GMT)
Towards Drone-based Mapping of Volcanic Gases using Gas Tomography [8.0] 火山は大量の二酸化炭素を放出し、直接人命に影響を与える。火山ガスの放出をマッピングすることは、火山が気候や環境に与える影響を予測し理解するのに役立ちます。
ドローンによるガス検知は、火山モニタリングのリスクを著しく低減するが、ローターが検知する前にガス配管を分散させるため、ガス測定の技術的制限に直面している。
風による対流を補うためにラグランジアンモデルを組み込んだ新しいモデルベースガストモグラフィー再構成手法を提案する。その結果のガス分布図は,手動で収集したその場測定値と一致し,モデルベースガストモグラフィーが降水制限を効果的に克服し,正確なマッピングを可能にすることを確認する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:33:56 GMT)
Symbolic Regression via Latent Iterative Refinement [8.0] 単発予測と真の後部とのギャップを埋めるフレームワークであるLatent Equation Embedding (LEE)を提案する。
LEEは、3つのコンポーネントを備えた共有潜在空間Zを学習する。
LEEは、最強の精度指向のベースラインよりも2~10倍単純である。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:25:05 GMT)
GrowLoop: Self-Evolving Conversation Evaluation Seeded by Human [8.0] モデルが進行し,シナリオがシフトするにつれて継続的に適応する自己進化型評価システムであるGrowLoopを提案する。
私たちの仕事は、パラダイムを手動の更新やスケーリングの難しさから、包括的な継続的自己進化へとシフトさせます。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:53:14 GMT)
Colosseum V2: Benchmarking Generalization for Vision Language Action Models [7.9] Vision-Language-Action (VLA)モデルは、ロボット操作において有望な一般化を示す。
Colosseum V2は、ロボット学習におけるVLA一般化を評価するための大規模なシミュレーションベンチマークである。
ManiSkillシミュレータ上に構築されたColosseum V2は、高速でGPU並列化された評価を可能にする。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:17:39 GMT)
Reasoning and Planning with Dynamically Changing Norms [7.9] 本稿では,人間-AI環境における規範を動的に変化させたプランニングを導くためのアプローチを提案する。
我々は,規範的対立を解決するためのデファシブルな計算と,計画上のガードレールとして動的に変化する規範を使用するためのアプローチに寄与する。
我々は、我々のアプローチを形式的証明で理論的に実証し、自然言語対話タスクにおいて、AIエージェントであるSocialBotと経験的に実証する。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:39:43 GMT)
Sampling Data with Chains of Forward-Backward Diffusion Steps [7.8] U-ターン連鎖を導入し、各ステップが学習したデータ多様体に残る動きを提案する。
我々は,データ多様体の断片化によるエルゴディディディティ破りの相転移を最小のUターンダイナミクスで行うことを示す。
拡散モデルを用いたサンプリングにおけるこれらの結果の影響について論じる。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:26:36 GMT)
AssertLLM2: A Comprehensive LLM Benchmark for Assertion Generation from Design Specifications [7.8] 本稿では,ハードウェア検証における現実的なアサーション生成のためのオープンソースのベンチマークであるAssertLLM2を紹介する。
AssertLLM2には13の機能カテゴリにわたる83の現実世界の設計が含まれている。
それぞれの設計について、このベンチマークは構造化された設計仕様、検証済みの依存性完全ゴールデンRTL、系統的に変更されたバグギーRTLの亜種を提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:49:25 GMT)
Position: AI Safety Requires Effective Controllability [7.8] 我々は、AIの安全性は第一級の目的として制御性を必要とすると論じている。
OpenClawベースのエージェントによる実験では、現在のアライメントとガードレール機構がリスクを低減しているが、永続的で権威的で強制可能なランタイムコントロールの提供に失敗することが多い。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:53:24 GMT)
Neural Flow Operators can Approximate any Operator: Abstract Frameworks and Universal Approximations [7.8] ニューラルネットワークとニューラル演算子のための抽象的ニューラルフローフレームワークを導入する。
このフレームワークは、2つの連続的な深度モデル、すなわち構成と分離構造を持つニューラルフローを含んでいる。
我々は, 対応するニューラルフローに対して, 正当性および普遍近似特性を証明した。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:40:19 GMT)
MedVol-R1: Reward-Driven Evidence Grounding for Volumetric Reasoning Segmentation [7.7] Volumetric Reasoningは、フリーフォームの臨床クエリから、ターゲット領域を3Dの医療スキャンに分割することを目的としている。
既存の手法は、マスクの復号化と言語を結びつけるための特別なセグメンテーショントークンに依存している。
本稿では,VRSのための強化学習ベースのフレームワークであるMedVol-R1について述べる。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:59:19 GMT)
Global Convergence of Wasserstein Policy Gradient for Entropy-Regularized Reinforcement Learning [7.7] Wasserstein Policy gradient (WPG)は、強化学習のためのポリシー最適化手法である。
エントロピー規則化 RL のベルマン構造を利用して WPG に対する大域収束理論を開発する。
解析により、エントロピー正則化 RL は通常の平坦な意味では凸ではないが、ベルマン再帰は好ましいポリアック-ロジャシエヴィチ型幾何を誘導することを示した。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:46:28 GMT)
Touch-R1: Reinforcing Touch Reasoning in MLLMs [7.7] 我々は,大規模なマルチモーダルデータセットであるTouchReason-1Mと,触覚知覚とコンフリクト解決を評価するための厳密なフレームワークであるTouchReason-Benchを紹介する。
Touch-R1は、オーディナル・アウェアの精度、クロスセンサーの物理的整合性、構造化フォーマット制御、入力側の触覚接地目的を組み合わせた触覚接地目的によって訓練される。
TouchReason-Benchでは、Touch-R1-7BがOctopi-13Bを18.4%、GPT-4oを24.7%上回っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:14:56 GMT)
Riding the Shifting Potential: When Reactive Control Suffices for Multi-Goal Behavior [7.6] 私たちは、現在の目的がどうあるのかを反映できないエンコーディングを活用しています。
競合がnull空間を拡張することによって相互作用する2つの領域でこれを実証する。
同じ定式化は、制御を付加した本物のロボットに直接転送する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:24:46 GMT)
Lessons from Penetration Tests on Large-Scale Agent Systems [7.6] 実行可能AIエージェントは、コンピューティングスタックの複数のレイヤと広範囲に相互作用する。
プロプライエタリなエージェントシステムが同様のセキュリティの弱点を示すかどうかは不明だ。
2025年に実施したプロプライエタリエージェント製品に対する2回の浸透試験の結果を報告する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:58:27 GMT)
LogDx-CI: Benchmarking Log Reduction Tools for LLM Root-Cause Diagnosis [7.6] CIの障害ログは大きい(中央5k行、このコーパスで最大200k)し、ノイズがあります。
デバッグしようとするコーディングエージェントは、上流ツールに依存して、ログを管理可能なコンテキストに還元する。
11のコンテキスト推論ツールを比較するベンチマークであるLogDx-CIを紹介します。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:34:47 GMT)
Localizing Memorized Regions in Diffusion Models via Coordinate-Wise Curvature Differences [7.5] 拡散モデルは、意図せずトレーニングサンプルを記憶し、プライバシと著作権に関する懸念を提起する。
局所記憶の幾何的特徴は座標方向の分散崩壊である。
我々は、広く使われているスコア差検出指標の幾何学的説明を提供するスコア差検出プロキシを導出する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:28:43 GMT)
BatteryMFormer: Multi-level Learning for Battery Degradation Trajectory Forecasting [7.5] 電池劣化データは多層構造を示す。
電圧電流プロファイルの劣化に伴う変動は、しばしば特定の充電間隔に局所化される。
既存のアプローチは、しばしばこれらの特性を明示的にモデル化することに失敗する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:59:02 GMT)
Practical Anonymous Two-Party Gradient Boosting Decision Tree [7.2] 高速かつ解釈しやすさは、金融と医療で人気がある勾配式決定木(GBDT)を作る。
GBDTのセキュアな計算を実行することはユニークな課題であり、比較のために安全なレコードアライメントを必要とする。
提案する回路PSIは,受信側がリフレクタとしてリプレースし,ローカルな特徴に対してピック・セブンサムを実行するための回路PSIである。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:02:14 GMT)
Two Speeds of Learning: A Representation-Readout Decomposition of Grokking and Double Descent [7.2] うまく文書化された2つの現象がこの図を複雑にしている: グルーキングでは、列車の損失は急速に減少し、試験性能は長い遅れの後のみ突然改善する。
我々は、エンコーダにおける表現学習と最終分類器における読み出し校正の2つの競合するプロセスを分析する。
表現-読み出し分解を広範囲のタスクやアーキテクチャにわたってグラッキングに適用すると、読み出しは開始前にトレインバイアス化されていることが分かる。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:26:55 GMT)
Tetris: Tile-level Sampling for Efficient and High-Fidelity Video Object Tracking [7.1] Tetrisは、動画をタイルベースのポリオミノデータモデルに分解するトラック素材抽出システムである。
7つの静止ビデオデータセットを通して、Tetrisは全フレーム、全フレーム参照パイプラインの精度損失を5%の範囲内に保持する。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:45:43 GMT)
Vectors Are Not Neutral: Sensitive-Information Inference from Exported LLM Representations in Summarization [7.1] ソースドキュメントがアクセス制限されたままであっても、派生ベクターは異なるアクセス制御の下で扱われる。
症例スタディとして, 臨床退院前世代におけるこの問題について検討した。
緩和ケーススタディとして,輸出されたベクターターゲットパラメーター効率の微調整法であるSurfaceLoRAを紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:38:13 GMT)
Cordyceps: Covert Control Attacks on LLMs via Data Poisoning [7.1] 大規模言語モデル(LLM)は、しばしば敵に毒を盛る未処理のテキストデータセットに基づいて微調整される。
本稿では, LLM に情報隠蔽方式を確実に, ひそかに教えるデータ中毒手法を提案する。
引き起こされた隠蔽スキームは、任意の悪意のある命令をエンコードし、デコードするので、新しく微妙な毒によって引き起こされる脆弱性が明らかになる。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:28:30 GMT)
High-Quality Synthetic Financial Time-Series using a GAN-Diffusion Framework [7.1] 本稿では,2種類の生成手法を組み合わせた品質認識型生成フレームワークを提案する。
我々は、我々のGANアーキテクチャを最先端の拡散モデルに組み込む方法を示す。
私たちのフレームワークは、現実的な株式市場シミュレーションのための軽量でレスポンシブなソリューションを提供します。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:52:01 GMT)
Beyond Questions: Evaluating What Large Language Models (Actually) Know [7.0] 知識ベンチマークのための新しいパラダイムであるオープンナレッジ評価を導入する。
狭い質問をする代わりに、オープン・エンド・エコレーション・プロンプトに反応して、彼らが提示する知識のモデルを評価する。
このパラダイムを,文検証のための参照コーパスと組み合わせた1万のエンティティのベンチマークであるBeQuでインスタンス化する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:29:18 GMT)
A Policy-Driven Runtime Layer for Agentic LLM Serving [7.0] マルチエージェント LLM システムはプロダクションワークロードの主流となっているが、サービススタックは構築されなかった。
このシームは、ポイント修正よりもアーキテクチャの変更によって対処されるのが最善である、と私たちは主張する。
5つの実マルチエージェントワークロードの予備的な結果は、+13から+37ppキャッシュヒットレートリフト、12%から29%低い平均TTFT、6%から14%高いスループットを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:38:34 GMT)
Retrieval as Reasoning: Self-Evolving Agent-Native Retrieval via LLM-Wiki [7.0] LLMエージェントは、検索をワンショットのコンテキストフェッチのように振る舞うのではなく、推論のように振る舞う必要がある。
現在、RAG(Retrieval-Augmented Generation)システムは、類似性を埋め込んだフラットチャンクとして外部知識を整理している。
本稿では,外部知識をコンパイル可能,構成可能,自己進化的構造として扱うことにより,検索パラダイムを運用するエージェントネイティブ検索システム LLM-Wiki を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:31:56 GMT)
AuthTrace: Diagnosing Evidence Construction in Thematically Dense Single-Author Corpora [7.0] AuthTraceは,主題的に密集した単一著者コーパスに基づいて構築された診断ベンチマークである。
AuthTraceは明示的な引用されたエビデンス、正確なファンインアノテーション、エビデンスリコール、エビデンス精度、答えの正当性を測定する統一パックレベルのプロトコルを提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:32:44 GMT)
Accelerating Birkhoff Projection for Manifold-Constrained Hyper-Connections [6.9] 我々は超制約超接続(mHC)のためのエンドツーエンド加速フレームワークを開発する。
実際に重要な4x4 Birkhoffプロジェクション設定に集中し、エンドツーエンドのアクセラレーションフレームワークを開発する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:11:08 GMT)
Convergence of Spectral Descent for Non-smooth Optimization [6.9] ムオンの現在の収束保証は滑らかさの仮定に大きく依存しており、その非滑らか収束挙動はほとんど探索されていない。
非平滑凸定式化において,SDとSDの両方に対して大域的線形収束を確立する。
混合スパースおよび高密度雑音下でのロバストな低ランク行列回復に理論的枠組みを適用した。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:02:49 GMT)
Unsupervised Identification and Removal of Spurious Correlations During Fine-Tuning [6.8] キュレートされたデータセット上で事前訓練された言語モデルを微調整すると、素早い相関が生まれる。
そこで本研究では,LoRAファインチューンの重みから潜伏因子を,監督なしで同定できることを実証した。
本稿では,関連Spurious Patternsのグラディエント・プロジェクションであるGRASPを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:51:48 GMT)
DDGAD: Trajectory Dynamics for Diffusion-Based Graph Anomaly Detection [6.8] グラフ異常検出(GAD)は、グラフ構造化データの全体的なパターンから、振る舞いや属性が著しく逸脱したノードを特定することを目的としている。
既存のGCNベースの手法は、異常ノードがメッセージパッシングを通じて隣人の表現を汚染する、汚染伝播の根本的な問題に悩まされている。
本稿では,拡散型グラフ異常検出フレームワークDDGADを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:00:58 GMT)
PolyFusionAgent: A Multimodal Foundation Model and Autonomous AI Assistant for Polymer Property Prediction and Inverse Design [6.7] マルチモーダルポリマー基礎モデル(PolyFusion)とツール拡張型文芸デザインエージェント(PolyAgent)を結合した対話型フレームワークであるPolyFusionAgentを紹介する。
PolyFusionは、数百万のポリマーにまたがる配列、トポロジ、3D幾何学、指紋などの相補的なポリマービューを調整し、化学やデータレシエーション間で共有された潜在空間を学習する。
PolyAgentは、予測と逆設計を、高分子文学からのエビデンス検索、提案、評価、文脈化仮説を1つのワークフローで明示的な前例と結びつけて、設計ループを閉じる。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:45:11 GMT)
Gradient Transformer: Learning to Generate Updates for LLMs [6.7] 本稿では,TinyLMをベースとした更新ベクトルを生成するデータフリーな知識蒸留フレームワークを提案する。
我々のフレームワークのキーとなるアイデアは、TinyLMの更新ベクトルをLLMの更新ベクトルに変換する、新しいGradient Transformerである。
Grad-Transformerは、厳格な差分プライバシー保護の下でさえ、最先端の知識蒸留のベースラインを著しく上回ります。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:05:13 GMT)
Jailbreak susceptibility prediction and mitigation via the behavioral geometry of models [6.7] 我々は、効率的な感受性予測と効果的な防御伝達をサポートするモデルの集団の行動幾何学を定式化する。
フレームワークを24のプロバイダにまたがる79のモデルに適用し、100のシステム構成を単一ベースモデルに適用する。
動作幾何学を用いて、最適化された防御を同じプロデューサの割り当てから転送するモデルを選択する。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:36:42 GMT)
Evidence Absence Is Not Evidence Insufficiency: Diagnosing NEI Construction Artifacts in Fact Verification [6.6] 不十分な証拠評価のための構築対応診断プロトコルNEI-CAPについて紹介する。
我々は、FEVERとHoVerを境界外部制御として、SciFactスタイルの科学的検証でプロトコルをインスタンス化する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:51:33 GMT)
Outage Detection in Self-Healing Smart Grids Using Reinforcement Learning with Spectral Graph Neural Networks [6.6] 自己修復型スマートグリッドは、停電時にネットワーク構成を迅速に調整し、電力破壊を最小限に抑える。
従来の停止軽減のための機械学習手法は、応答時間が遅いことと計算コストが高いため、スマートグリッドには適していない。
本稿では,システムレジリエンスを高めるため,分散ネットワークにおける障害管理のためのスペクトルグラフ強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:38:29 GMT)
A Note on Boosting Uncloneable Encryption in Microcrypt [6.5] マイクロ暗号化」の具体的前提から、長時間のセキュアな非クローン暗号が従うかもしれない
マイクロ暗号化」の具体的前提から, 長時間のセキュアな非クローン暗号が従う可能性があることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:09:21 GMT)
The Rescue Effect: Spatio-Semantic Early Exit Bypasses Quantization Collapse in CLIP [6.5] CLIPのような共同埋め込みアーキテクチャでは、量子化されたCNN分類器とは異なる障害モードが導入されている。
我々はこれをQIRC(Quantization-induced Representation Collapse)と呼び、CLIP ViT-B/32を置き換えるINT8上で定量化する。
雑音飽和層をバイパスするLRA-EE(Layer-wise Representation-Aware Early Exit)を提案する。
ImageNet-1K ゼロショット分類では、LRA-EE は FLOP を 13.4% 削減し、Top-1 の精度を +2.44%p (58.72% -> 61.16%) 向上させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:45:46 GMT)
Diffuse to Detect: Generative Diffusion Models for Unsupervised IC Anomaly Detection [6.4] 拡散変換器を組み込んだ最初の教師なし異常検出フレームワークを提案する。
異常スコアは、中距離拡散時間ステップ上のノイズ予測誤差から導かれる。
本手法は, 工業用16nm IC試験データに対して, 極端不均衡条件下での最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:24:44 GMT)
AnchorDiff: Training-Free Concept Grounding for MM-DiTs via Anchor-Based Graph Propagation [6.4] AnchorDiffは、構造的洗練からセマンティックローカライゼーションを分離する訓練自由接地法である。
このグラフは、高密度なオブジェクト内伝搬のための出力空間類似性と、クロスオブジェクト接続を抑制するための行ワイドアテンションゲートを使用する。
実験により、AnchorDiffはImageNet-SegmentationとPascalVOCで強力な基盤性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:17:29 GMT)
StepOPSD: Step-Aware Online Preference Distillation for Agent Reinforcement Learning [6.4] 本稿では,ロールアウト後の自己蒸留フレームワークであるStepOPSDについて紹介する。
StepOPSDは、軌跡をアクション中心のステップセグメントに分解し、後見豊かな教師コンテキスト下でそれらを再構成する。
より小さい_clipは広範囲に安定化された局所信頼領域として作用するが、最適な大域混合強度_mixはタスク依存のままである。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:07:03 GMT)
Auditable Decision Models with Learned Abstention and Real-Time Steering [6.3] 生産AIシステムは、不完全、矛盾、あるいは不十分な証拠で運用されることが多い。
我々は,不確実性が明確でなければならないAIシステムの運用上の決定制御について検討する。
本稿では,YES,NO,TBDを予測する境界決定制御モデルであるEvaluatorDPTを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:37:56 GMT)
Nonlinear Data Integration via Kernel Methods for Data Collaboration Analysis [6.3] データコラボレーション分析は、各データセットを、パーティ固有の難読化機能を通じて、プライバシを保存する中間表現に変換する。
既存のDC解析手法の多くは、データ難読化と統合のための線形変換に依存している。
本稿では,グラフの正規化と中心的制約を導入し,下流解析に有用な幾何学的および対象変数情報を取得する。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:07:32 GMT)
Learning to Orchestrate Agents under Uncertainty [6.3] 本研究では,不確実性下における異種エージェントの適応的オーケストレーションの問題について検討する。
エージェントよりも帯域幅の問題としてオーケストレーションをリキャストする軽量フレームワークであるBOT-Orchを提案する。
正規化オーケストレーションは標準的な仮定で$mathcalO(sqrtT)$ regretを楽しんでおり、同じ平均報酬を持つエージェント間の選好順序を確実に誘導するが、分布アライメントが異なることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:23:22 GMT)
DelowlightSplat: Feed-Forward Gaussian Splatting for Lowlight 3D Scene Reconstruction [6.3] クリーンノベルビューレンダリングのための低照度フィードフォワードガウススプレイティングフレームワークであるDelowlightSplatを提案する。
ターゲットビューをきれいに保ちながら、コンテキストビューのみを劣化させることで、制御可能なマルチビューの低照度ベンチマークを構築します。
実験により,DelowlightSplatは,低照度条件下での以前のフィードフォワード法と2段パイプラインよりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:05:10 GMT)
Deep-layer limit and stability analysis of the basic forward-backward-splitting induced network (II): learning problems [6.0] 提案手法は,FBSアルゴリズムの最も基本的なアーキテクチャであるFBS誘導ネットワークについて検討する。
いくつかの軽微な仮定の下で、深層限界系の学習問題に対する基礎的FBS誘導ネットワークのトレーニング問題の一般的な収束性を確立する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:03:34 GMT)
A Bioinspired Underwater Robot with a Latch-Mediated Soft Bistable Mechanism [5.9] バイオインスパイアされたソフトなバイスタブルアクチュエータを1つのモータで非対称なエネルギー入力と解放を可能にする統合ラッチ機構で導入する。
実験の結果,安定な周期的フラッピング,精密操舵,最大推力0.528N,インパルス0.147Ns,垂直変位30mmであった。
本研究は, 小型水中ロボットの運動を制御するための, エネルギー効率の高い新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:29:05 GMT)
Transferable Reinforcement Learning via Probabilistic Latent Embeddings and Dynamic Policy Adaptation for Sim-to-Real Deployment [5.9] 多くのサイバー物理システムのための深層強化学習(RL)エージェントは、まずシミュレーターで訓練される。
現実の環境では、Sim2Realのギャップが避けられないため、パフォーマンス劣化や安全違反に悩まされることが多い。
本稿では,確率的潜伏埋め込みと動的ポリシー適応による安全かつ効率的な政策伝達を可能にする新しい強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:22:44 GMT)
VR-DAgger: Immersive VR for Dexterous Data Collection and Uncertainty-Guided On-Policy Correction [5.8] デモから学ぶことはロボット操作に有効だが、十分なタスク固有のデータを集めることは大きなボトルネックである。
分散シフトの下では、小さなエラーが複雑になり、パフォーマンスが低下し、専門家の時間が冗長で低い値の修正に費やされることが多い。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:52:39 GMT)
SIKA-GP: Accelerating Gaussian Process Inference with Sparse Inducing Kernel Approximations for Bayesian Deep Learning [5.8] 本稿では,スパースインジェクションカーネル近似を用いたGP推論を高速化するSIKA-GPを提案する。
提案手法は、疎活性化された基底からコンパクトで表現豊かなカーネル表現を構築する。
SIKA-GPは、緩やかな活性化を伴うベイズニューラルネットワーク(BNN)に自然に組み込むことができ、予測性能を犠牲にすることなく、トレーニングと推論の両方において大きなスピードアップをもたらす。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:49:13 GMT)
Spectra as Language: Large Language Models for Scalable Stellar Parameter and Abundance Inference [5.8] 大規模な分光調査は前例のない分光データを蓄積している。
大規模言語モデルの最近の進歩は、自然言語処理のようなタスクにおける強力な一般化と特徴学習を示している。
そこで本研究では, 有効温度, 表面重力, 金属量, および20種類の化学元素の存在量を正確に推定できる, 恒星パラメータ推定のための2段階の大規模言語モデルフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:15:48 GMT)
RT-Lynx: Putting the GEMM Sparsity In a Right Way for Diffusion Models [5.8] 重みよりもN:M半構造スペーサー化に対して,DiTの活性化は本質的に疎く,より頑健であることを示す。
アクティベーションにN:Mスペーシフィケーションを適用したRT-Lynxを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:09:49 GMT)
Proper Agnostic Learning of Functions of Halfspaces under Gaussian Marginals [5.8] i.d.ラベル付きサンプルが$mathbbRd times pm 1$上の未知の分布からサンプリングされ、$mathbbRd$がガウシアンであることを考えると、目標はターゲットクラス$mathcalF$から仮説を出力することである。
我々のアルゴリズムは、$dO(K2 log (1/)/2) + (K/)O(K) で実行されます。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:07:06 GMT)
AdaMerge: Salience-Aware Adaptive Token Merging for Training-Free Acceleration of Vision Transformers [5.7] AdaMergeは2つの補完メカニズムに基づいたトークンマージフレームワークである。
ToMe、PiToMe、DSMよりずっと優れています。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:35:39 GMT)
Once-For-All: A Train-Once and Select-Anytime Framework for Multimodal Instruction Tuning [5.7] 我々は、再利用可能なセレクタを一度トレーニングし、再計算なしで任意のデータセットやモデルに適用するデータ選択フレームワークOFAを提案する。
OFAは凍ったCLIP空間でマルチモーダル命令をクラスタ化し、クラスタ構造から擬似ラベルを導き、ほんの数回だけ軽量セレクタを訓練する。
トレーニングが完了すると、凍結セレクタはデータセットとモデルスケールを直接転送する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:31:20 GMT)
ProDebug: An Automated Debugging System for Prolog [5.6] Prologは宣言型プログラミング言語としてよく知られている。
多くの学生は、命令型言語で見慣れたデバッグメカニズムが欠けているため、Prologが難しいと感じている。
大規模な授業では、学生にタイムリーでパーソナライズされたフィードバックを提供することの難しさが増す。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:57:50 GMT)
Search-E1: Self-Distillation Drives Self-Evolution in Search-Augmented Reasoning [5.6] ポストトレーニングは、言語モデルを有能な検索強化推論エージェントに変えるための主要なレシピとなっている。
そこで本稿では,バニラGRPOのみによる自己進化法である検索-E1を提案する。
Search-E1はQwen2.5-3Bで平均0.440EMに達し、両方のスケールですべてのオープンソースベースラインを超えた。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:56:53 GMT)
A Systematic Study of Behavioral Cloning for Scientific Data Annotation [5.6] 本稿では,科学的アノテーションを用いた行動クローニングの枠組みについて紹介する。
モデルでは,タスククリティカルな決定の前にGUI力学を学習し,トレーニングデータよりもミスが少ないことを示す。
マルチタスク・ビヘイビア・クローン上でのスケーリングモデルは、より大きなモデルの方がスケール範囲内でよりデータ効率が高いことを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:19:47 GMT)
Heterogeneous Parallelism for Multimodal Large Language Model Training [5.6] 私たちは、一方のエンドツーエンドグラフのモジュールが独立したレイアウトとランク配置を使用することを可能にする抽象化を提示します。
我々は、マルチモーダルワークロードとGPUスケールにまたがる最適化された同種、同種、同種、非同種構成を評価した。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:53:06 GMT)
Training-Inference Kernel Contracts: Bounding Divergence in Post-Training and Deployment [5.4] 現代のポストトレーニングパイプラインは、そのポリシーの1つのシンボルであるpi_thetaを書き、それを2つの異なるプログラムで評価する。
本稿では、K_trainとK_infの相違を許容する契約優先フレームワークであるカーネル契約を提案する。
契約C = (N, S, R, O, Pi) は、数値、統計、実行、可観測性の節と、違反からルーティングアクションへのエスカレーションポリシーを結合する。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:48:33 GMT)
A Resource Comparison of Logical T-State Preparation [5.4] 我々は,マジックステート蒸留,マジックステート栽培,コードスイッチングの3つの代表的な準備経路を比較した。
ソースのネイティブコスト単位を保持し、出力エラーを記録し、単一試行コスト、承認されたアウトプット毎の期待コスト、フットプリント、レイテンシ、各構成に対するレポート完全性を保持します。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:09:50 GMT)
Not All NVFP4 QAT Recipes Are Equal: How Architecture and Scale Shape Model Quality for Anomaly Segmentation [5.4] リアルタイムの異常セグメンテーションは、高いリコールと効率的な低精度推論を必要とする。
本稿では, モデルアーキテクチャ, モデルスケール, FP4量子化対応トレーニング(QAT)の3方向インタラクションについて, 記憶臨界脳腫瘍セグメンテーションの課題について検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:29:37 GMT)
Pretrained Approximators for Low-Thrust Trajectory Cost and Reachability [5.3] 低推力軌道設計は燃料消費と輸送能力の繰り返し評価に大きく依存している。
本研究では、これらの量を機械学習サロゲートによって正確に近似し、高速でスケーラブルな評価を可能にすることを示す。
提案モデルでは, 単変速機および多変速機の最適燃料消費と最小移動時間を正確に予測する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:01:45 GMT)
BIRDS: Characterizing and Understanding Biodiversity Impact of Large Language Model Serving [5.1] 大規模言語モデル(LLM)は、炭素や水以外の環境への影響を生じさせる。
本稿では,要求駆動型LLMサービングにおける生物多様性影響の枠組みであるBIRDSについて述べる。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:28:16 GMT)
Identifying and Mitigating Systemic Measurement Bias in Production LLM Inference Benchmarks [5.0] ベンチマークユーティリティは、基本的なクライアント側キューのボトルネックを導入する、シングルプロセスの非同期駆動アーキテクチャに依存していることを示す。
クライアント側の負荷を効果的に分散し、無視可能なキューオーバヘッドを保証する、バイアスのないマルチプロセス評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:47:59 GMT)
Elias in the Lighthouse, Again? Diagnosing Low Diversity in LLM Stories [5.0] 生成した物語の88.3%に11の単語が現れる。
これらの言葉には、名前(イーリアス、マラ、エララ)、設定(灯台)、職業(時計師、司書)が含まれる。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:14:11 GMT)
Completion vs Optimality: Policy Gradient in Long-Horizon Cumulative-Damage Problems [4.9] このクラスでは、ポリシー段階のメソッドに対して2つの障害モードを識別する。
線形ソフトペナルティを持つPPOの下では、水平アクセスのみを許すことで、完了率を低下させる。
実験可能な4つの予測を導出し、2つの個別の校正環境で評価する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:43:03 GMT)
ProcCtrlBench: Evaluating Process-Level Defects and Control Preservation in LLM Coding Agents [4.9] ProcCtrlBenchは、LLM符号化エージェントの実行プロセス評価のベンチマークである。
4つのカテゴリで11の障害タイプをカバーする再利用可能なオントロジーに、繰り返し実行される障害を整理する。
最終結果のみではなく、標準化されたプロセスエビデンスを通じてエージェントの軌跡を評価する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:44:14 GMT)
Habermolt: Delegating Deliberation to AI Representatives [4.9] 熟考民主主義は、おそらくより優れた集団的決定をもたらすが、基本的には人間の注意と帯域幅に拘束されている。
最近のAIによる議論は、多くの人間からの入力を合成することで参加を拡大するが、個々のユーザーにとって時間を要するままである。
AIモデルがますます有能になるにつれて、AIシステムは人間間の議論を仲介するだけでなく、人間を表現するためにも展開されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:47:48 GMT)
Data-driven sparse identification of governing PDEs via knockoff filters and multi-criteria trade-offs [4.9] KO-PDE-IDENTは、擬似偏微分方程式(PDE)を偽発見率(FDR)制御で識別するフレームワークである。
この問題に対処するため、KO-PDE-IDENTは当初、モデル-Xノックオフフィルタによる潜在的な候補項のサポートセットをマイニングする。
重騒音下での5種類の標準PDEに対するKO-PDE-IDENTの有効性を検証した。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:07:23 GMT)
Prefix-Safe Bayesian Belief Tracking for LLM Reasoning Reliability:Separating Calibration from Ranking [4.9] 我々は、スカラースコア、テキストおよび自己検証マーカー、隠れクラスタ、トークンプールプローブ、潜在軌道特徴のための共通トラッカーを提供する。
MATH-500, GSM8K, AIME 2025, RIMO-N 上のオープンウェイトトレースは、確率品質とランキングを別々に生成した。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:37:20 GMT)
Faults and Pitfalls in Implementing the Right to be Forgotten [4.7] 規制当局は最初の5年間に205件のRTBF違反を発行している。
計算の観点からRTBFを支える不確実性やリスクを同定する。
本研究では,オープンソース検索エンジンのForgottenにRTBF機能を導入する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:27:49 GMT)
Robust Moment-Based Estimation via Spectral Gradient Reweighting [4.7] 本稿では,モーメントマッチング最適化における観測単位の勾配をソフトリウェイトするために,モーメントの頑健な一般化法(GMM)を提案する。
SGRプリミティブは、ほぼ軌道勾配推定を生成し、ロバストなモーメントベースラインよりもロバストなDGMM特殊化が大幅に向上する。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:44:02 GMT)
PILOT: A Data-Free Continual Learning Approach for Real-Time Semantic Segmentation via Boundary Guidance [4.6] PIDNetに適した新しい連続学習フレームワークを提案する。
PILOTは、学習したクラスの知識を維持しながら、モデルが新しいセマンティックなカテゴリに適応できるようにする。
その結果,本手法は,従来のベースクラス上でのUnion(mIoU)よりも平均的なインターセクションを維持しつつ,新しいクラスを分割することに成功した。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:00:12 GMT)
The Compressive Knowledge Graph Hypothesis: Which Graph Facts Matter for Scientific Hypothesis Generation? [4.6] 知識グラフ(KG)は言語モデルに構造化された科学的文脈を提供することができるが、どのグラフ事実が生成した仮説を実際に形作るのかは定かではない。
我々は,Mistral-7B,Llama-3.1-70B,Gemini 2.5 Flashの電池材料に対するKG誘導仮説生成について検討した。
局所的なKGを密度,豊かさ,トポロジ,制御構造によって摂動し,提案したグラフおよび固定参照指標を用いて出力を評価する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:29:41 GMT)
Bounded Path Context: A Controlled Study of Visible Path History in LLM-Based Knowledge Graph Question Answering [4.5] 境界パスコンテキスト(BPC)は、回答抽出と監査のためのシンボルメモリの完全なパスを分離する。
コントロールされた K 上のスイープは、有界歴史がフルヒストリーのプロンプトと一致するか、あるいは超えていることを示している。
4Bスケールでは、K=1は両方のベンチマークで最強の設定である。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:29:04 GMT)
Towards Continuous-time Causal Foundation Models [4.5] 我々は、時系列のための離散時間因果前データフィットネットワークを、そのメカニズムを微分方程式(SDE)として記述する連続時間まで拡張する。
本稿では,3階層の分類法とともに,正確な連続性基準(観測スケジュールと異なる軌道法則)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:06:04 GMT)
On the Detection of Commutative Factors in Factor Graphs: Necessary and Sufficient Conditions [4.5] 我々は,最先端アルゴリズムの基盤となる理論的基礎を再検討し,可換因子を検出する。
上記の定理のわずかに修正されたバージョンを証明し、可換因子を特定するために必要な条件として機能する。
本稿では,精度を確保しつつ効率を保ちつつ,より厳密な最悪ケース境界を持つ補間アルゴリズムを導入する,最先端アルゴリズムの修正版を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:05:53 GMT)
Probing Minimalist Phase Structure in LLMs: What Universal Dependencies Cannot Represent [4.5] 構造プローブはUD(Universal Dependencies)を訓練するが、これは位相境界や位相内部結合のような形式-対称性の抽象化を符号化しない。
本研究では, 分布事前学習により, UD 以外の形式的シンタクティック抽象化と整合した表現を導出できることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:36:41 GMT)
Comparative Study of Vision-Based Metric Measurement for Large-Scale Planar Scenes [4.5] 本研究は, 実世界の貯水池における平面計測をカメラを用いて検討し, 3つのアプローチを比較した。
単分子領域では、カメラ形状から平面局在モデルが導出され、カメラピッチ角の影響が解析される。
モノクロレンジは十分なピッチ角下でメートルレベルの精度を達成し、ステレオベースレンジはピッチ変動に対する感度を低減してデシメータレベルの精度を達成し、画像縫合は小規模シーンでは有効であるが、シーンサイズが大きくなるにつれて安定性とスケーラビリティが低下する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:32:24 GMT)
Got a Secret? LLM Agents Can't Keep It: Evaluating Privacy in Multi-Agent Systems [4.5] 一ヶ月に数千のLCMエージェントがコミュニティ間で対話するモルトブック型シミュレーションプラットフォームを導入する。
シングルターンからマルチターンのソーシャル評価へのシフトは、プライバシー侵害を増幅する。
エージェントは、ピアを観察した後、機密情報を開示する確率が8倍になる。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:32:25 GMT)
Internalizing Tool Knowledge in Small Language Models via QLoRA Fine-Tuning [4.4] 本稿では,ツールユース知識が小言語モデルに内在できるかどうかを考察する。
Gemma 4 E4BとQwen3-4Bを8ビットQLoRAで約1,700のツール使用例で微調整する。
提案手法では,ツールカタログを完全に省略する。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:46:08 GMT)
TADDLE: A Tool-Augmented Agent for Detecting Deficient LLM-Generated Peer Reviews [4.4] LLM生成ピアレビューにおける欠陥検出ツールであるTADDLEを紹介する。
ベンチマークは、50のICLR 2025論文に対する1,800のレビューで構成されており、18のドメインエキスパートがマルチラベルをアノテートしている。
大規模な実験により,TADDLEは2値検出と多ラベル分類の両方に強く依存することが示された。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:07:44 GMT)
Normal Guidance is what Attention Needs [4.3] 本稿では,学習者の注意分布を鐘状の曲線に追従する正則化手法を提案する。
我々は,注意に基づくMIL法とトランスフォーマーに基づくMIL法が,最先端技術よりもはるかに優れたスライスレベルのローカライゼーションを実現することを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:17:58 GMT)
Soft Specialists: $α$-Rényi Ensembles for Uncertainty-Aware LLM Post-Training [4.3] 大規模言語モデルの既存のトレーニングアプローチは、大量のデータに基づいて、単一のパラメータセットを学習する。
学習後パラメータよりも分布を学習するための$-Rényi変分フレームワークを提案する。
局所安定性基準を同定し,モデルの不特定により非退化後部が局所的に拡散しやすいことを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:44:58 GMT)
Quadratically Regularized Optimal Transport: Localization Bounds and Affine Case Analysis [4.3] 有向ハウスドルフ距離において、QOT の支持は、$varepsilonfrac1d+2$ よりも早くモンジュグラフの周りに集中できないことを示す。
我々は, 自己輸送に問題を低減し, 近年の自己輸送疎結合結果を適用することにより, $varepsilonfrac1d+2$ の急激な点方向管束を導出する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:42:35 GMT)
Annotator Positionality as Signal: Psychometric Weighting for Anti-Autistic Ableism Detection [4.3] 本稿では,アノテータの位置に固定された心理量重みを持つコミュニティ近親相反有能言語を対象としたバイアス認識評価フレームワークを提案する。
LLMは有害なアウトプットを頻繁に生成し,評価機器を隠蔽した場合の自閉症者に対するネガティブな態度を示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:05:16 GMT)
Cross-Entropy Games and Frost Training [4.2] モンテカルロを基盤とした政策最適化手法であるフロストトレーニングを提案する。
鍵となる考え方は、埋め込み空間における報酬関数の勾配を利用することである。
モデルトレーニングの強化にも使用できることを、私たちは初めて示しています。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:20:45 GMT)
TPS-Drive: Task-Guided Representation Purification for VLM-based Autonomous Driving [4.1] VLM(Vision-Language Models)は、自動運転計画のための有望な基盤を提供する。
TPS-Driveは,タスクガイド型表現精製を主眼とした新しいフレームワークである。
TPS-Driveは正確なエージェント空間状態予測を実現し、オープンループnuScenes評価における衝突率を低減する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:56:31 GMT)
Breaking the Epistemic Trap: Active Perception Under Compound Uncertainty [4.1] 基本的なボトルネックは、ダイナミクスの変更や不完全な観察といった個々の課題ではなく、シナジスティックな相互作用である、と我々は主張する。
3つのコントリビューションを中心に構築されたアダプティブ・セーフティ・アーキテクチャを導入し,情報問題としてのリフレーミング・セーフティを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:03:26 GMT)
EEG-FM-Audit: A Systematic Evaluation and Analysis Pipeline for EEG Foundation Models [4.1] EEG-FM-Auditは、EEG-FMの評価を体系化するために設計された総合的な評価と分析パイプラインである。
脳波-FM-Auditを、最先端の4つの脳波-FMと、3つの公開データセットにまたがる5つの代表的な教師付きモデルに適用する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:06:35 GMT)
Model Unlearning Objectives Vary for Distinct Language Functions [4.1] 機械的に異なる2つの未学習目標,危険知識の未学習,毒性の未学習について検討した。
本研究は,複数種類のLLMポストトレーニングに類似した問題の一家系として,アンラーニングを研究すべきであることを示唆する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:10:55 GMT)
Do Audio LLMs Listen or Read? Analyzing and Mitigating Paralinguistic Failures with VoxParadox [4.1] VoxParadoxは2000の検証済みのサンプルを持ち、10のパラ言語的タスクにまたがる逆のベンチマークである。
音場真理の精度は一貫して低く, 言語による回答に追従する傾向が強い。
入力プロンプトに基づいて複数のオーディオ層からの情報を適応的に結合するPrompt-Conditioned Layer Mixer (PCLM)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:44:23 GMT)
Towards Feedback-to-Plan Decisions for Self-Evolving LLM Agents in CUDA Kernel Generation [4.1] 大規模言語モデル(LLM)は、世代間でフィードバック条件付き計画によって駆動される、カーネル生成のための自己進化エージェントとして、強い経験的利益を示している。
我々は、制御された、計画決定の生成レベルの属性を、軌道凍結および選択的フィードバック注入によってフィードバックコンポーネントに与える統合分析層であるtextttCUDAnalystを紹介した。
以上の結果から,フィードバックが整った場合にのみ明示的な計画が有用であること,構造化されたマルチフィードバック相互作用から効果的な計画が出現すること,より強力な推論モデルからの高レベルプランが部分的に弱いプランに移行できること,などが示唆された。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:00:09 GMT)
PEACE: A Planner-Executor Agent with Constraint Enforcement for UAVs [4.0] 低レベルの制御から高レベルのミッション計画を切り離すPX4ベースのドローンのプランナー・エグゼクタエージェントを提案する。
大きな言語モデルはシングルパスタスクプランニングを実行し、実行は構造化されたROS 2ツールコールインターフェースによって処理される。
その結果,LLM制御に比べて説明可能性,制約強制性,LLM呼び出しの短縮性が向上した。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:03:22 GMT)
From Snippets to Semantics: Rethinking Evidence Granularity for Multilingual Fact Verification [4.0] 本稿では,適応的なChunKingフレームワークを用いたセマンティックエビデンス抽出手法であるSEEKを提案する。
セマンティックトピックの遷移を特定し、局所的な検証コンテキストを保存することによって、完全な事実チェック記事からコヒーレントなエビデンスチャンクを構成する。
セマンティックチャンキングで最大10%、文チャンキングで19%、検索スニペットベースラインで20%、マクロf1を改善する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:27:30 GMT)
Sequential quantum nonlocality sharing under local noisy quantum channels [3.9] 量子非局所性(SSQN)の逐次共有は、量子情報処理におけるデバイスに依存しないタスクに不可欠である。
本稿では,二分詞ベル非局所性と三分詞メルミン非局所性に対する逐次共有の雑音頑健性に関する理論的解析を行った。
我々の研究は、雑音の多い量子チャネル下でSSQNを実現するための実践的な枠組みを確立し、ノイズのロバスト性と測定戦略の関連を明らかにする。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:11:56 GMT)
AGORA: Adapter-Grounded Observation-Action Retention for Inference-Free Prompt Compression in LLM Agents [3.9] トークンレベルの抽出圧縮機はLLM剤には構造的に不適切であることを示す。
本稿では,構造的プロンプトを組み込んだ推論不要なステップレベル圧縮機であるAGORAについて紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:29:44 GMT)
LELA: An End-to-end LLM-based Entity Linking Framework with Zero-shot Domain Adaptation [3.8] 本稿では、ゼロショット名前付きエンティティ認識(NER)を統合した実用的なPythonライブラリにLELAを拡張した。
多様なエンティティリンク設定におけるLELAの性能とロバスト性を検証した実験結果を提供する。
私たちのデモでは、ユーザは自分の入力テキストでシステムと遊べます。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:45:35 GMT)
LitSeg: Narrative-Aware Document Segmentation for Literary RAG [3.8] 本稿では,物語理論に基づく新たなセグメンテーションフレームワークLitSegを提案する。
マルチステージプロンプトを利用することで、LitSegは有効なイベントを明示的に抽出し、物語スレッドをアンハングルする。
また、LitSeg生成データに基づいて微調整された軽量シングルパスチャンカーであるLitSeg-Liteについても紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:17:03 GMT)
Greening AI Inference with Accuracy and Latency-aware User Incentives [3.8] 我々は,AI推論のインセンティブを,推論品質と遅延に対するユーザの評価に基づいて設計するためのフレームワークを紹介する。
私たちのアプローチは、AIモデルのサイズと複雑さに依存するさまざまなトレードオフに対応できます。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:19:07 GMT)
Lost in Sampling: Assessing Lexical Reachability in LLMs via the Word Coverage Score (WCS) [3.7] WCS(Word Coverage Score)は、標準的なサンプリングフィルタによって、文脈的に適切な人間の語彙が数学的に決定される範囲を定量化する指標である。
人為的なコーパスフラグメント上のオープンウェイトモデルを監査することにより、デコーダによってどの論理的語彙選択が到達不能であるかを識別する。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:44:25 GMT)
Polymander II: an amphibious salamander-inspired robot with contact and flow sensors [3.7] 両生類ロボットの足の接触力と横力を検出するためにホールエフェクトセンサを用いたソリューションを提案する。
2つのバスラインで、ロボットは、この外部受容情報を500Hz以上で同時に取得し、関節の位置や荷重などの固有受容情報を100Hzで取得する。
実験では、両生類環境を横断するロボットの能力と、より複雑な移動作業にフィードバック制御を使用することの可能性を示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:10:19 GMT)
When Does Demographic Information Help? Data and Modeling Regimes for Perspective-Aware Hate Speech Detection [3.7] データ分割プロパティとモデリングフレームワークの両方の機能として、人口増加を分析します。
人口増加は、低いトレーニング不一致、高いテスト不一致、きめ細かいあいまいさの測定、十分なトレーニングデータ、より大きな人口重なりのある体制に集中している。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:24:41 GMT)
Lost in the Evidence? Reproducing Document Position and Context Size Effects in RAG [3.6] Retrieval-Augmented Generation (RAG) システムは、取得した文書がモデルの入力コンテキストに入力されることに依存する。
先行研究は、中年期の喪失や関連する長文現象のような位置に基づく効果を報告している。
トピックサンプリングが分散の主要な原因であることを示し、小さなトピックセットはオーダリング効果を誇張することができる。
また,より現実的なRAGシナリオについて検討した。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:44:19 GMT)
Quantum criticality and factorization in a constrained Rydberg spin chain [3.6] 我々は、コヒーレントに駆動されたRydberg-atom配列で実現された1次元制約量子スピン鎖について検討する。
封鎖に制約されたヒルベルト空間に射影すると、局所的および非局所的な量子ゆらぎが等しい足場で競合する効果的なモデルが得られる。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:23:25 GMT)
MobileExplorer: Accelerating On-Device Inference for Mobile GUI Agents via Online Exploration [3.5] MobileExplorerは、オンライン探索を通じて、ビジョンベースのモバイルGUIエージェントのデバイス上の推論を加速する。
高速だが簡単なバックトラッキング戦略が失敗した場合に、初期UI状態をロールバックして復元する2段階のメカニズムを設計する。
MobileExplorerは、平均的な推論ステップ数とエンドツーエンドのレイテンシを23%削減し、タスクの成功率を最大5%向上させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:53:53 GMT)
Atomic-referenced Hz-linewidth lasers via fiber interferometric stabilization [3.5] 光学キャビティと干渉計は例外的な短期スペクトル純度を提供するが、固有の絶対周波数基準は欠如している。
最近のハイブリッドアプローチは、コンパクトな光共振器と原子参照の組み合わせを実証している。
本稿では、Hzレベルの線形幅と原子参照周波数安定性の同時実現を可能にするハイブリッドアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:23:04 GMT)
Dissipative Time Quasicrystals from Multilevel Interference [3.5] 境界時間結晶は、持続周期振動による連続時間変換対称性の自発的な破れを示す。
多レベル干渉は周期的順序を超える自然な経路を提供することを示す。
本研究は,時間-準周期秩序に対する最小の干渉誘起機構を確立する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:58:10 GMT)
Asking Is Not Enough: Protocol Sensitivity in LLM Confidence Calibration [3.5] LLMの信頼性校正は、トークン確率スコアと言語的信頼の2つの信号を比較することで評価されることが多い。
我々は、動詞化-vs-token比較を定義する測度軸を変化させる。
両信頼性信号はプロトコルに依存した行動測定として扱うべきである。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:03:38 GMT)
How the Optimizer Shapes Learned Solutions in Equivariant Neural Networks [3.4] 等変ニューラルネットワークは、構成によって幾何対称性を符号化するが、最適化が困難であり、制約の少ないアーキテクチャを過小評価することがしばしばある。
我々は, この方向を, ポイントクラウドおよび分子学習環境下で, 複数の等変および幾何学的アーキテクチャで比較することにより検討する。
次に、ヘッセン推定、損失表面の可視化、学習重量と中間表現のスペクトル特性を用いて、訓練されたModelNet40チェックポイントを解析する。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:25:44 GMT)
Faster Thermal Profiling of a Lunar Rover with Machine Learning Adapted Finite Difference Model [3.4] 本稿では,内部熱源を有する簡易月面ローバーの熱解析のためのPIMLフレームワークを提案する。
微分可能な有限差分熱シミュレータをフレームワーク内に組み込んで物理的一貫性を強制する。
その結果,PIMLフレームワークは粗いメッシュ物理モデルと比較して予測精度を50%, 39%向上させることがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:11:06 GMT)
Multi-Robot Box Transport over Different Surfaces with Decentralized Role-based Proportional Control [3.4] 複数のロボットによって推進される物体の協調輸送には、建設や倉庫環境から災害廃棄物のクリーンアップの投稿まで、多くの応用がある。
本稿では, 平地, 上り坂, 下り坂の四角形箱を輸送するための非同期分散タスクと動作計画手法を提案する。
R2P2はNVIDIA IsaacSimを使って構築されたシミュレータにデプロイされた6ボットチームで評価されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:31:31 GMT)
Rethinking the Multilingual Reasoning Gap with Layer Swap [3.3] 最近のモデルは、英語以外の言語でも、主に英語でチェーン・オブ・シントを生み出している。
6言語にわたる長い多言語推論データセットを構築した。
ネイティブ推論のギャップは、5つの非英語言語で1.9--3.5%に縮小する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:11:32 GMT)
Is Position Bias in Dense Retrievers Built In-or Learned from Data? [3.3] トレーニングデータにおけるエビデンスの位置分布が,検索レベルのバイアス方向に与える影響について検討した。
位置バランストレーニングは、位置対応ベンチマークにおいて、位置感度を57~87%削減する。
これらの結果から, トレーニング位置分布は, 検索レベルの位置バイアスの主要な制御因子であることがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:50:16 GMT)
Do Modern Post-Hoc Watermarking Methods Beat Broken-Arrows? [3.3] 現代のポストホットなウォーターマーキングスキームは、ニューラルネットワークを使用して非常に低い偽アラームレートを達成する。
本稿では,ポストホック・ウォーターマーキングにおけるロバスト性とセキュリティの公正比較を提案する。
我々の実験は、現実的なシナリオでは、古典的な透かしは、堅牢性を維持しながら、セキュリティの観点からモダンな技術より優れていることを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:04:46 GMT)
CART Random Forests as Sequential Allocation over Random Opportunity Sets: A Stochastic-Control Theory of Ensemble Risk [3.3] 我々は、CARTランダムチャンスセットアロケーション(CART-ROSA)と呼ばれるCARTランダム森林の力学的視点を開発する。
しかし、システムレベルでは、森林目標に対して世界規模で最適である可能性がある。
この結果から,操作-検索の視点がトラクタブルを理論的ギャップとして利用し難いことを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:13:22 GMT)
LLM-based Mockless Unit Test Generation for Java [3.3] MocklessTesterは、コンテキスト強化と制約強化の2つの戦略を中心に構築された、モックレスなユニットテスト生成アプローチである。
結果は、MocklessTesterが2つのベンチマークでそれぞれ19.99%、22.69%、ブランチカバレッジが24.90%、15.78%改善していることを示している。
テスト中のクラス以外にも、MocklessTesterは、依存性クラスにそれぞれ378行と55行を追加して、より実際の依存性コードを実行する。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:08:04 GMT)
HEAL: Resilient and Self-* Hub-based Learning [3.2] HEALは、最適化された自己組織化と自己修復の基盤となるP2Pオーバーレイを活用する、層横断的な分散学習フレームワークである。
HEALは、完全に分散化されフォールトトレラントでありながら、クラッシュのない環境でのフェデレートラーニングと同じようなパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:38:41 GMT)
SteelDS: A High-Resolution Video Dataset of E40 Steel Scrap for Object Detection and Instance Segmentation [3.2] このデータセットは、圧縮されたE40グレード鋼と銅スクラップの高解像度、注釈付きビデオシーケンスをコンベアベルトに提供します。
このデータは、通常、銅汚染物質を除去するために手動で介入する必要がある産業用ポストマグネティック・ソート・ステージを反映している。
データセットは5つのサブセットに24,297個のラベル付きフレームで構成され、396個のスチールと101個の銅物体がサイズによって分類されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:20:12 GMT)
When Does Deep RL Beat Calibrated Baselines? A Benchmark Study on Adaptive Resource Control [3.2] 適切に調整されたルールベースのオートスケーラは、テスト対象のワークロード毎に6つのメインストリームの深層強化学習(DRL)アルゴリズムのうち、どれか1つを打ち負かすことができる。
PPO, DQN, A2C, SAC, TD3, DDPGを一致したトレーニング予算下で評価し, 基準基準に対する報酬関数について検討した。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:07:42 GMT)
Non-Gaussian Entanglement Hierarchy Based on the Schmidt Number [3.0] 非ガウス的絡み合いは様々な量子タスクにおいて有望な資源である。
本稿では,バイパーティイトボソニックシステムにおける量的目撃者$E_rm NG$を紹介する。
我々はこのフレームワークを、NOON状態や圧縮されたKerr状態など、非ガウス状態のパラダイムでベンチマークする。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:28:09 GMT)
Benchmarks are Not Enough: RAMP for Runtime Assessing of Agentic Models in Production Systems [3.0] ソフトウェアエンジニアリングエージェントを評価するための実運用基盤となるRAMPについて紹介する。
RAMPは、標準化されたオーケストレーションと実行インターフェースを通じて、統一されたランタイムアセスメントアーキテクチャを提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:28:10 GMT)
Certified Causal Attribution for Real-Time Attack Forensics in 6G Network Slicing [2.9] 6Gネットワークにおけるクロススライス攻撃の帰属には,100ms未満の共有インフラストラクチャによる因果伝播連鎖の同定が必要である。
本稿では,資源条件付きグランガー因果関係と公理的に派生したリソースコンテントモデルを統合する,認証因果帰属フレームワークであるDA-GCを提案する。
DA-GCは1,100の攻撃シナリオを持つ15スライス生産エミュレーション6Gテストベッドで、89.2%の属性精度を87msで達成した。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:16:00 GMT)
Periodic Topological Deep Learning for Polymer Design and Discovery [2.9] 本稿では, 周期的ビエトリス・リップス錯体上に構築された深層学習フレームワークである Periodic-TDL について紹介する。
周期的TDLは、電子的、光学的、物理的、熱的ターゲットにまたがるポリマー特性予測タスクにおいて、最先端の全てのモデルより優れている。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:51:49 GMT)
Queue & AI: When Faster Tasks Slow Down the Workflow [2.9] カスタマーサービス、書き込み、ソフトウェア開発、コンサルティングオペレーションにAIツールが配置されることで、タスク当たりの生産性が大幅に向上することが報告されている。
このような平均ベースのメトリクスは、タスクが蓄積され、人間の注意を弱めるために競合するAIの影響を誤って表すことができる、と私たちは主張する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:57:41 GMT)
Why LLMs Fail at Causal Discovery and How Interventional Agents Escape [2.8] 因果発見は科学的な推論の基盤であるが、大きな言語モデルが確実にそれを実行することができるかどうかについては未解決のままである。
最近のベンチマークでは、単純な因果グラフ上で微調整されたモデルでさえ、複雑さが増大するにつれて劣化するが、なぜ失敗するのかは定まっていない。
教師付き微調整, 直接選好最適化, コンテキスト内学習はすべて, 類似した観測データを生成する因果グラフを区別できない予測子を生成する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:37:03 GMT)
SeDT: Sentence-Transformer Decision-Transformer Conditioning for Multi-Turn Conversation Reliability [2.8] 根本原因は構造的であり、フラットな会話履歴は前回と同一の暗黙の重みを割り当てるため、重要な制約を偶発的ダイアログと区別する信号は与えない。
本稿では、オフラインの強化学習から戻り条件をインポートすることで、この問題を解決する訓練不要な推論時間法であるSeDT文変換器について述べる。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:00:42 GMT)
HARP: Measuring Harm Amplification in Multi-Agent LLM Systems [2.7] マルチエージェントLLMシステムはエージェント、ツール、共有コンテキスト、メモリ、決定ゲートで分解される。
Harm Amplification through Role Perturbationは、ローカル・グローバル・ハーフ・アンプリフィケーションを研究するためのトレースファーストの方法論である。
Role PerturbationによるHarm Amplificationは、セキュアなマルチエージェント評価はバイパスだけでなく伝播も測定する必要がある、と論じている。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:03:10 GMT)
Strategies for Guiding LLMs to Use Software Design Patterns: A Case of Singleton [2.7] 大規模言語モデル(LLM)は、自然言語のプロンプトから関数型ソースコードを生成することができるが、高いレベルのアーキテクチャ構造や設計パターンに一貫して従わないことが多い。
本稿では,LLMが生成したソースコードに設計パターンを組み込むための戦略について述べる。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:58:23 GMT)
On the Subgaussianity of Quantized Linear Maps: An AI-Assisted Note [2.7] Gemini 3.5 Flashによって発見されたこの結果は、よく条件付き共分散の下での任意の有界関数に適用できる。
我々はこのツールを用いて、符号量子化線型写像 $Y = textsgn(Wx)$ 上のシモーネ・ボンバリの質問に答える。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:36:34 GMT)
Query Symbolically or Retrieve Semantically? A Dataset and Method for Semi-Structured Question Answering [2.6] DualGraphは2つの補完的なビューを通じて文書を表現している。意味検索のためのテキスト知識グラフと、型付き主語-述語-オブジェクトトリプルに対するシンボリッククエリのためのシンボリック知識グラフである。
我々はまた、半構造化された製品ドキュメントと、オープンエンドおよび仕様指向の検索にまたがる手動でキュレートされた質問を備えた商用ショッピングウェブサイトのベンチマークであるSpecsQAを紹介します。実験により、DualGraphは、質問タイプ全体にわたって、最先端の密検索、GraphRAG、シンボリック、テーブル指向のベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:22:42 GMT)
Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels [2.6] EmphGrimlockは,信頼関係をサンドボックス基板に移動させることで,関心事の分離を回復する衛兵である。
GrimlockはEmpheBPFで強化されたトラフィックインターセプションを使用して、サンドボックス通信がガードを通過することを保証する。
受信側では、宛先ガードは、ID、スコープ、チャネルバインディングを再検証し、TLSを終了し、ポリシーチェックが成功した後のみ、宛先サンドボックスに解放する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:53:33 GMT)
Pairwise Liouvillian learning from randomized measurements: practical aspects and guidelines for operating the protocol in large-scale experiments [2.6] ランダム化されたパウリ状態と測定値に基づいて,Louvilian学習のためのプロトコルを数値的に研究する。
特に、二体相互作用、長距離相互作用、単体雑音設定において、Louvillianの係数を得るための完全なワークフローを記述する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:42:44 GMT)
AI evaluation may bias perceptions: The importance of context in interpreting academic writing [2.5] 本稿では,評価手法が各国・分野の文脈差を無視している場合,科学文献におけるAI利用推定値の偏りについて検討する。
プール化されたベンチマークは、既存のスタイル変化をAI生成のテキストと混同し、LLM以前の出版物でもカントリーフィールドグループ間でかなりの歪みを生じさせる可能性がある。
2025年にこれらの手法を出版物に適用すると、プールされたベンチマークは、特定の国や分野においてAIの使用を過小評価しながら、体系的に過大評価していることが明らかになった。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:47:58 GMT)
Joint Optimization of Relevance and Engagement in Multi-Task Ranking for E-Commerce with Efficient LLM Supervision [2.5] 本稿では,セマンティックな妥当性を主目的とするマルチタスクランキングシステムを提案する。
我々のアーキテクチャでは、関係しきい値よりも累積確率を予測する順序関係ヘッドを採用している。
我々のアプローチは、コアエンゲージメントの目標を維持しながらセマンティックアライメントを大幅に改善する。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:26:17 GMT)
PRISM: Position-encoded Regressive Inverse Spectral Model for Multilayer Thin-Film Design [2.4] 本稿では,デコーダのみの自己回帰変換器であるPRISMを提案する。
PRISMは、個々の材料選択と単一のバックボーン内の連続的な厚さ回帰を予測する。
ベンチマークの結果,PRISM-13Mモデルでは,他の変圧器ベースラインと比較してMAEが50%以上減少することがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:30:25 GMT)
Learning to Translate from Soft to Hard LLM Prompts [2.4] 自然言語翻訳モデルに専用ソフトプロンプトを学習することで、より高い翻訳品質が得られるかを検討する。
小型でオープンソースのモデルに最適化されたソフトプロンプトは、ポータブルなテキストプロンプトに変換できる。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:03:08 GMT)
Neural Autoregressive Control Variates for the Quantum Monte Carlo Sign Problem [2.4] 量子モンテカルロシミュレーションにおいて,符号問題を緩和するために,2組の自己回帰モデルを訓練する。
2つの自己回帰的ネットワークは、厳密に非結合な支持を持つ正と負の符号セクターに限られる。
それらの差は構造的にゼロ平均であり、符号推定器との相関が分散還元を制御する補助観測器を提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:30:44 GMT)
Impact of Stoichiometry of MoSi Thin Films for Enhanced Sensitivity of Superconducting Nanowire Single-Photon Detectors [2.3] 超伝導ナノワイヤ単光子検出器(SNSPD)の性能に及ぼす超伝導MoSi薄膜の影響について報告する。
具体的には, フィルムパラメータの臨界温度Tc, シート抵抗Rsと超伝導体厚さdの関係について検討した。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:33:54 GMT)
EFaaS: A Quantum-Classical Serverless Entangled Scheduler for Hybrid Variational Algorithms [2.3] 現在の量子クラウドアクセスモデルは、分離されたバッチキューによってボトルネック化されている。
この遅延は収束時間を数分から数時間に膨らませ、量子ハードウェアのドリフトに忠実さを露呈する。
我々は、新しいサーバーレスハードウェア予約またはステートレス関数であるEFを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:13:50 GMT)
Model Merging on Loss Landscape: A Geometry Perspective [2.3] エピマー(英: EpiMer)は、リーマン多様体上のフレシェ平均を解くためにモデルが合併するフレームワークである。
我々の理論的解析は、マージ誤差を部分空間フレシェ分散と残留エネルギーに分解する。
8つのイメージ分類タスクで微調整されたCLIP-ViTモデルを組み合わせることで、Epistemic Mergingは、マッチしたランクで3つのCLIP-ViTバックボーンのベースラインを厳密に上回る。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:33:30 GMT)
Orbax: Distributed Checkpointing with JAX [2.2] Orbaxは、分散アクセラレータシステムの複雑さを抽象化するJAXネイティブなチェックポイントライブラリである。
我々は、PyTorchの競合よりパフォーマンスが3.5$times$を節約し、2$times$をロードすることを示した。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:23:57 GMT)
KARMA: Karma-Aligned Reward Model Adaptation [2.2] 大規模ソーシャルインタラクションデータからコンテキストに敏感な会話行動を学ぶためのフレームワークであるKARMAを紹介する。
KarmaはRedditの会話で報酬モデルをトレーニングし、コンテキストによって条件付けられたレスポンスのバリュエーションを予測する。
下流モデルに適用したKARMAの効果を,ソーシャルメディアデータへの直接曝露の有無で評価した。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:12:14 GMT)
The Neglected Baseline in Model Interpretation [2.2] 本稿では,モデル解釈の課題と解釈原理を整理し,ベースラインの重要性を実証する。
我々はさらに勾配に基づく手法、統合勾配法(IG)法、テイラー拡張を統一し、それらの関係を明らかにする。
そこで本研究では,モデル解釈手法の欠陥と誤りを解析する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:47:46 GMT)
Adaptation-Free Heterogeneous Collaborative Perception with Unseen Agent Configurations [2.1] 協調的知覚は、エージェントが相補的な観察を共有することによって、3Dオブジェクトの検出を改善する。
既存のほとんどのメソッドは、固定または既知のコラボレータエンコーダ構成を前提としており、実際にはデプロイを制限している。
本研究では,未確認エージェント構成によるゼロ適応協調を可能にする協調認識フレームワークであるALFを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:26:34 GMT)
E3: Issue-Level Backtesting for Automated Research Critique [2.1] E3は研究論文の技術的懸念を識別する自動レビューアシスタントである。
それぞれの懸念について、E3は、その性質、その位置、貢献に対する影響、そしてそれを解決する分析や証拠を報告している。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:21:37 GMT)
Identifiable Bayesian Deep Generative Copulas with Unknown Layer Widths for Data with Arbitrary Marginal Distributions [2.1] 多変量データに対する識別可能かつ解釈可能な生成モデルであるDeep Discrete (DDE) Copulaを導入する。
このモデルは、コプラフレームワーク内にバイナリ潜在変数の階層的なネットワークを配置する。
推定は、後部推論から境界モデリングを分離するランク確率に基づいている。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:00:36 GMT)
Analyzing Linear Layers in Related-Differential Cryptanalysis [2.0] 線形層は、MDSの基準が捉える範囲を超えて、関連する微分構造を示す可能性があることを示す。
この現象は、AESの縮小攻撃に利用することができる。
制約として15ドルという明確な要件と十分な基準を導出します。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:07:27 GMT)
An In-Vitro Study on Cross-Lingual Generalization in Language Models [2.0] 語彙重なり、形態学、データ不均衡、トークン化が絡み合っているため、言語モデルの言語間移動は研究が難しい。
そこで我々は,同じオントロジー,型文法,構成構造を持つ2つの手続き生成言語を用いたインビトロフレームワークを提案する。
トークン化が再利用可能な言語間サブストラクチャを保存するか否かよりも,トークン化バランスや生の語彙的類似性がより少ないことが判明した。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:20:20 GMT)
Towards Controllable Image Generation through Representation-Conditioned Diffusion Models [2.0] 拡散モデルは高品質の画像生成と編集のための強力なツールとして登場してきた。
従来のアプローチは、テキストプロンプトやセマンティックマップのような条件付け機構に依存している。
本研究では,事前学習した自己教師付きモデルから表現した拡散モデルについて検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:46:25 GMT)
Representation-Conditioned Diffusion Models for Guided Training Data Generation [2.0] 生成深層学習により生成した合成画像データセットに基づいて学習したモデルの分類性能を評価する。
我々は,DINOv2,DINOv3,CLIPの学習表現を条件とした潜時拡散モデルを用いた。
この表現条件付き定式化は,クラス条件付き生成を大きなマージンで大幅に上回ることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:32:50 GMT)
Structure-Adaptive Conformal Inference for Large-Scale Out-of-Distribution Testing [1.9] 本稿では,大規模機械学習アプリケーションにおけるOOD(Structured Out-of-distriion)テストについて述べる。
構造適応型共形Q値(SCQ)と擬似スコア誘導型自動モデル選択(P-TAMS)を提案する。
P-TAMSは、候補モデルのツールボックスをまたいだ構造化OODテストに共形モデル選択を適用する。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:28:16 GMT)
Observing conformal Floquet dynamics on a digital quantum processor [1.8] 本報告では,多体臨界状態から直接開始される非平衡力学の初めての実験的観察について報告する。
この研究は、臨界量子力学を探索するためのスケーラブルで汎用的なフレームワークを確立する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:05:16 GMT)
Declarative Data Services: Structured Agentic Discovery for Composing Data Systems [1.8] 宣言型データサービス(DDS)は、宣言型ユーザ意図からデータシステム構成の構造化されたエージェント発見のためのアーキテクチャである。
トレーディングバックのワークロードにおける生命の証明として、無境界の発見ができない場所で収束する。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:52:11 GMT)
End-to-End PDE-Based Quantum Algorithms for Multi-Asset Option Pricing under Local and Stochastic Volatility [1.8] 我々は、局所変動性のあるブラックショルズとヘストンモデルの下で、欧州オプション価格のエンドツーエンドの量子PDEフレームワークを開発した。
このフレームワークは、古典的なコントラクトとモデルデータを入力として取り、選択されたオプション値の古典的な見積を返す。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:46:40 GMT)
Causal Representation Learning for Generalisable Recommendation [1.8] 観測データに基づいてトレーニングされた予測モデルは、デプロイ時に遭遇する分布を一般化できないことが多い。
本稿では,入力の因果成分にのみ依存する情報理論的非絡み合い基準を提案し,その最適性を証明する。
当社の見出し評価は、Spotify上の数百万のユーザによるA/Bテストであり、個人化されたプレイリスト生成のためのプロダクションランキングに適用される。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:58:36 GMT)
Innovation: An Almost Characterization of Hallucination [1.8] 幻覚とは、大きな言語モデル(LLM)の中心的な制限である。
我々は,カライとベンパラが特定した幻覚の条件によって,イノベーションが示唆されることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:24:43 GMT)
NUCLEUS-MoE: Unified Model of Pool Boiling for Liquid Cooling [1.7] 二相沸騰により、熱伝達速度は単相冷却よりも桁違いに高い。
既存の学習ベースのサロゲートは条件固有か流体固有かのいずれかであり、一般化を制限し、別々のモデルを必要とする。
NUCLEUSは、特殊なサロゲートの集合を単一のアーキテクチャで置き換える、プール沸騰の混合実験モデルである。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:49:16 GMT)
Structure over Pixels: Learning Variable-Length Visual Programs [1.7] STROPは構造的なシーン表現を形成し、画像の視覚的プログラムがどれくらい長くあるべきかを同時に学習する。
コードブックは、すべてハイレベルな潜在表現の質によって形作られています。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:16:04 GMT)
An investigation of AI integration in sound designer workflows and experiences [1.7] 人工知能は、プロのオーディオ制作にますます統合されている。
しかし、開発者が作成するツールと、音響デザイナーを実践する要件の間には、ギャップが続きます。
本研究は,76名の実践者を対象にした混合手法による調査と,20名の専門職を対象としたセミ構造化インタビューを通じて,このギャップについて検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:28:51 GMT)
Architecture-driven Shift: towards a lightweight selector for capturing the trends of logit shift [1.6] 連続学習(CL)は、深層学習ニューラルネットワークのパワーを利用するための実践的なパラダイムである。
ロジットシフトは、CLシナリオにおけるロジットシフトを表すため、自然なプロキシとして機能する。
既存の理論的分析では、均一な隠蔽層幅の仮定のため、効率的な代替手段を提供できない。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:41:13 GMT)
Beyond Final Answers: Auditing Trajectory-Level Hallucinations in Multi-Agent Industrial Workflows [1.6] Trajelは、マルチエージェントエージェントにおける軌道レベルの幻覚を監査するためのデータセットおよび評価フレームワークである。
我々は,サブタスク,トラジェクトリ,長文レベルの教師付き検出モデルをベンチマークした。
軌道認識検出は、標準的なポストホック検証よりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:24:40 GMT)
METATR: A Multilingual, Evolving Benchmark for Automatic Text Recognition [1.6] 本稿では,様々な文書を対象とした自動テキスト認識 (ATR) モデルの評価を行うベンチマークMETATR (v1.0) を紹介する。
結果は、データセットのパフォーマンスや言語レベルなど、さまざまな次元にわたって報告される。
METATRは,多言語ATRを実環境下で評価するための多次元的,実践的指向のフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:53:34 GMT)
Adaptive Shot Allocation for Recursive QAOA via Reinforcement Learning [1.5] RQAOA(Recursive QAOA)は、浅い量子回路を用いてペア相関を推定することで最適化問題を解決する。
それぞれの除去ステップには計測ショットが必要であり、繰り返しステージの数に応じて全ショットコストが増大する。
短期量子デバイスでは、ショット数の増加は直接ハードウェアレベルのノイズ源に曝される可能性がある。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:48:29 GMT)
YOLO26-RipeLoc Lite: A lightweight architecture for tomato ripeness detection and picking point localization in greenhouse robotic harvesting [1.5] 本稿では,温室トマトの同時検出,熟度分類,中心位置定位のためのYOLO26-RipeLoc Liteを提案する。
YOLO26-RipeLoc Liteは92.9%のmAP@0.5(95.2%のリップ、90.6%のアンリップ)を達成し、全ての評価されたアーキテクチャの中で最高精度(95.2%)を達成している。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:00:24 GMT)
Constitutional Arms Races in the Public Goods Game: Co-Evolving LLM Constitutions Under Cooperation-Defection Pressure [1.5] 我々は,パブリックグッズゲーム(PGG)と空間グリッドワールドにまたがる敵国憲法の共進化について研究する。
PGGでは、両派とも約0.78でほぼ平衡に収束し、1.2, 1.5, 2.0, 3.0の検定乗算数 m に対して頑健である。
K = 2 回帰(K = 2 regresses)、K = 5(K = 5)は30世代すべてで強い専門家を擁する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:01:08 GMT)
LLMs Are Already Good Tutors: Training-Free Prompt Optimization for Pedagogical Math Tutoring [1.5] 本稿では,API呼び出しによるシステムプロンプトのみのトレーニングフリーなプロンプト最適化が,実用的な代替手段であるかどうかを検討する。
提案手法は,OODベンチマークスイートを5条件で評価し,7つの方法に適応し,5つの教育特化手法を提案する。
82符号の教育コードブックを用いた行動分析により,RL学習モデルの2~3倍の学習知識パターンに依存する学習自由な手法が明らかになった。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:35:57 GMT)
When do complex-valued neural networks help? A study of representation, geometry, and optimization [1.5] 複雑な数値入力だけでは、複雑な算術が学習を改善するかどうかを判断できないことを示す。
合成RFタスク全体において、複素表現は有用であるが、普遍的に優れているものではない。
CVNNは、表現、対称性、最適化に依存している構造的帰納バイアスと見なされる。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:49:23 GMT)
Resource-Constrained Affect Modelling via Variance Regularisation Pruning [1.4] 本稿では、分散化プロセスに相互参加安定性を組み込んだプルーニングフレームワークであるVariance-Regularized Pruning(VR)を紹介する。
本研究では,9つのゲーム環境にまたがって収集された覚醒アノテーションを含むAGAINデータセットに対する提案手法を評価する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:05:13 GMT)
Evaluating Local Explainability Metrics for Machine Learning Models on Tabular Data [1.4] 説明は人間に当てはまるが、モデルの内部的推論を捉えられない。
本稿では,複雑な表表分類タスクに適用した場合の局所的説明可能性手法の信頼性について検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:38:10 GMT)
Kan Extension Transformers: A Categorical Unification of Attention, Diffusion, and Predict-Detach Self-Conditioning [1.3] Kan Extension Transformer (KET)は、Transformer実装の多種多様なグループのための統一的な分類フレームワークである。
厳密な因果関係と予測決定条件によって異なる12種類のTransformer実装の総合的な実験的検証を含む。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:36:59 GMT)
BhashaSetu: A Data-Centric Approach to Low-Resource Machine Translation [1.3] BhashaSetuは言語的に豊かな英語である--低リソースニューラルネットワーク翻訳(NMT)における永続的なデータ制限に対処するパラレルデータセット
我々のデータセットは, ニュース, 政治, 医療, 文学, 文化など異質な情報源からの278万の文対からなる。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:03:20 GMT)
MSCGC-KAN: Multi-scale Causal Graph Convolution and Kolmogorov-Arnold Feature Mapping for EEG Emotion Recognition [1.2] 本稿では,MSCGC-KANと呼ばれる感情認識手法を提案する。
MSCGC-KANはマルチスケール因果グラフ畳み込みとKolmogorov-Arnold特徴写像からなる構造化タスクヘッドである。
提案手法はFACEDおよびSEED-VIIデータセット上で60.66%のバランス精度と60.40%の重み付きF1スコアを実現する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:02:13 GMT)
Revealing the core dimensions underlying representations in brains, behavior and AI [1.2] similarity-Based Representation Factorization (SRF) は、類似行列から低次元、非負、解釈可能な埋め込みを復元する一般的な計算手法である。
シミュレーションと多くの神経、行動、および計算データセットを通して、SRFは多様な表現データから解釈可能な次元を復元する。
これらの結果から、SRFは、表現の基礎となる次元を明らかにし、理解し、活用するための幅広い用途を持つ汎用的な方法として確立されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:19:17 GMT)
A Methodological Framework for Explicit Control of the Speed-Accuracy Trade-off in Brain-Computer Interfaces [1.2] 脳-コンピュータインターフェース(BCI)は、脳波などの変調における低信号-雑音比によって制限される。
これにより、速度精度のトレードオフが生じ、より高い精度で速度の犠牲になる。
速度と精度を分離する評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:13:15 GMT)
Cultural Fidelity in English-to-Hindi Translation: A Preservation-Fluency Frontier for Gender Recoverability [1.2] 生成的翻訳システムは、文化的に特定の文法体系の中で社会的に意味のある手がかりがどのように表現されるかを決定する。
英語のソースが明示的に性別を符号化する場合、英語からヒンディー語への翻訳は、ソース自体が曖昧でない限り、そのキューの回復可能性を維持するべきである。
まず、ソース・アウェア・リランカ(SAR)は、性別中立化の構文を避ける候補を優先する。
第二に、Phenomenon-Aware Reranker (PAR) は、慣用構文が残っている場合でも、ターゲットの語彙マーキングを通じて性別を保存する。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:14:07 GMT)
LUCoS: Latent Unsupervised Context Selection for Tabular Foundation Models [1.2] LUCoSは、教師なし事前フィルタネットワーク(PFN)からの埋め込みによって誘導される潜時幾何学に置き換える。
LUCoSは6つの低ラベル予算のデータセットで第1位であり、結論はメトリクスとデータセットレベルのチェックで安定している。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:31:39 GMT)
Evolving and Detecting Multi-Turn Deception using Geometric Signatures [1.2] 大型言語モデル(LLM)の安全防衛は、通常、単一ターンプロンプトで訓練され、評価される。
本稿では,現実的なマルチターン誤認質問セットを生成する統一パイプラインを提案する。
このデータを用いて、禁止された情報にアクセスしようとする詐欺的試みを検出することができた。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:48:33 GMT)
You Are in Control of Your State: Why Human Outcomes Are Controllable Through Causal State Intervention [1.1] 我々は、状態と重み付けを目標とする介入を通じて、人間の成果が正確にかつ操作的な意味で制御可能であることを論じる。
テスト可能な7つの予測を導き、ステートアウェアシステムに対する6つの運用要件をリストアップし、デジタルヘルス、教育、AIパーソナライゼーション、パーソナルエージェンシーへの影響について議論する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:49:41 GMT)
AURA: Asymptotically Optimal Uncertainty-Robust Replanning Algorithm for Kinodynamic Systems [1.1] サンプリングベースのモーションプランナーは、キノダイナミックなモーションプランニングに実用的でスケーラブルなアプローチを提供する。
これらのプランナーは通常オフラインで使用され、軌道が計算された後にのみ実行を開始する必要がある。
この作業では、これらの制限は、実行時のパス品質とパフォーマンスのトラッキングの両方を改善する統一されたフレームワーク、メソッド内で対処された。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:20:09 GMT)
L2Rec: Towards Dual-View Understanding of LLMs for Personalized Recommendation [1.1] 我々はL2Recを導入し、L2Recは大規模言語モデル(LLM)のパラメータレベルでの行動的・意味的理解を統一する。
私たちのキーとなる洞察は、同じTransformerパラメータセットが、両方のビューの共有媒体として機能できるということです。
4つのデータセットの実験によると、L2Recは一貫して最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:57:19 GMT)
LLM Based Web Accessibility Repair: An Empirical Study of Detection, Remediation, and Cost [1.1] 本稿では,アクセシビリティの自動検出と修復のための大規模言語モデルベースエージェント,特にKim K2.5について検討する。
LLMはルールベースのツールに匹敵するパフォーマンスを実現しており、F1は約0.65であり、F1の強い意味理解は0.83であるが、構文およびレイアウト関連の違反に対する信頼性は低い。
修復のために、LCMの生成した修正は99.7%以上のケースで構文的に有効であり、80.2%のインスタンスではアクセシビリティコンプライアンスを改善し、1ファイルあたりの違反を3.98から1.7に減らしている。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:43:34 GMT)
Supervised Distributional Reduction via Optimal Transport and Dependence Maximization [1.0] ターゲット認識表現を学習するアルゴリズムであるSupervised Distribution Reduction (SDR)を提案する。
SDRはFused Gromov-Wasserstein (FGW) の目的に基づいて構築され、入力分布のリレーショナル構造を代表点の集合と整列する。
SDRはデータ依存の非定常幾何学を自然に誘導し、ガウス過程(GP)モデリングのような設定に利用することができる。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:38:20 GMT)
Few-shot Cross-country Generalization of Tabular Machine Learning and Foundation Models for Childhood Anemia Prediction under Distribution Shift [1.0] 小児貧血は、全世界で6~59か月の子どもの約40%に影響を及ぼす。
アフリカ、アジア、ラテンアメリカ、コーカサス、中東の16カ国のDHSデータを使用しました。
子どもの年齢、身長、年齢の高いzスコアが支配的な予測者となり、その後に富と母性教育が続いた。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:20:20 GMT)
Long-range deformations in Gaussian States [1.0] 弱結合を持つ二次ハミルトニアンによって生成される虚時間進化により、波動関数を修正する。
我々は、任意に長距離相互作用であっても、これらのモデルが非ゼロ変形強度で鋭い位相遷移を示さないことを観察した。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:25:22 GMT)
Energy-Aware Decision Making in Software Stack Upgrades [1.0] 本稿では,Spring BootやJava仮想マシンなど,コアソフトウェアスタックコンポーネントの異なるバージョンがアプリケーションのエネルギー消費に与える影響を計測する手法を提案する。
Spring Petclinic RESTアプリケーションに基づくケーススタディを用いて、Spring BootとJavaのバージョン間でエネルギー消費が大幅に変化していることを示します。
新しいリリースと仮想スレッド(21と23で導入された)は、アプリケーションの変更を必要とせずに大幅な省エネを実現した。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:45:27 GMT)
A Sharper Picture of Generalization in Transformers [1.0] 低次成分に集束したスパーススペクトルは, 優れた一般化特性を有する低シャープ性構成を可能にすることを示す。
これは、なぜチェーン・オブ・シントが高次対象関数の一般化を改善するのかを公式に説明するために用いられる。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:29:50 GMT)
Nonasymptotic bounds for quantum purity amplification [1.0] 量子純度増幅では、ノイズの多い量子状態 $in mathbbCd times d$ の $n$ コピーが与えられ、主固有状態 $|v_drangle$ の $k$ コピーを作成するように要求される。
いくつかの先行研究は、この問題に対して情報理論的に最適なアルゴリズムを導出したが、それらの証明は、標本数$n$が無限大になる傾向にあるため、体制の中でのみ示される。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:39:24 GMT)
Optimising Factual Consistency in Summarisation via Preference Learning from Multiple Imperfect Metrics [1.0] さまざまな弱いメトリクスからスコアを集約することで、要約の事実整合性を改善する自動トレーニングパイプラインを導入します。
提案手法では、スコアを好みにマッピングし、メトリクス間で高い不一致のケースをフィルタリングすることで、複雑な報酬形成を回避している。
実験では、初期エンコーダ・デコーダアーキテクチャから現代の大規模言語モデルまで、モデル間での一貫性のある事実性の向上が示されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:55:03 GMT)
Boosting Inference with Guided Reasoning: Stochastic Exploration for Recursive Models [1.0] 私たちは、構造化推論タスクにおいて、小さなニューラルネットワークが驚くほど強力であることを示します。
我々は、潜在力学系を用いた推論軌道をモデル化する。
我々はこの視点をガイド付き探査を通して運用する。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:43:02 GMT)
Implementation of Big Data Analytics for Diabetes Management: Needs Assessment in the Rwanda Healthcare System [1.0] 本研究では、ルワンダの医療システムの糖尿病管理にビッグデータ分析を採用する準備について検討した。
この結果は、BDA実装の潜在的な可能性と主要な課題の両方を浮き彫りにしている。
本稿では、説明可能な機械学習モデルを用いて、糖尿病管理戦略を支援するための実践的なBDAフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:56:20 GMT)
Sympathetic Cooling in Trapped Ions with Spectral Selectivity via the Zeeman Shift [1.0] 交感冷却は、データキュービットに影響を与えることなく、イオン鎖を冷却するためにゲート配列間の冷却剤イオンの選択に使用される。
我々は,高忠実度ゲート操作におけるコヒーレンス要求を保ちながら,冷却によるデータイオンの緩やかなデコヒーレンスを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:48:34 GMT)
Separate Aggregation of Split Network for Personalized Federated Learning [1.0] フェデレーション学習は、不均一なクライアントデータ分散の下で大幅に劣化する可能性がある。
我々は、パーソナライズされたフェデレーション学習フレームワークであるPGFedSplitを提案する。
Fashion MNIST、CIFAR 10、CIFAR 100、Tiny ImageNetの実験では、アートPFL手法の状態を一貫した改善が示されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:44:30 GMT)
Hallucination Behavior in Multimodal LLMs Across Agricultural Image Interpretation and Generation Tasks [1.0] 大規模言語モデル(LLM)は、農業用イメージングアプリケーションで急速に採用されている。
本研究では,画像からテキストへ,テキストから画像へという2つの相補的な方向の幻覚について検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:07:18 GMT)
OptiLoop: Coordination-in-the-Loop Verification and Repair for LLM-Generated Optimization Agents [1.0] 分散された決定問題は、複数の当事者が共有された決定を調整する必要がある。
大規模言語モデル(LLM)は、ローカル最適化エージェントを生成することで参加障壁を低くする有望な方法を提供する。
LLM生成最適化エージェントのコーディネーション・イン・ザ・ループ検証と修復を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:49:41 GMT)
Behavioural Analysis of Alignment Faking [0.9] アライメント・フェイキング(AF)とは、行動修正を避けるための訓練目標に戦略的に準拠するモデルを指す。
以前の作業では、AFが脆弱で、プロンプトに敏感で、モデルに依存しており、基礎となるドライバは不明確であった。
3つの分離可能なドライバ(値、ゴールガード、サイコファシー)を識別し、ターゲットとするプロンプトの廃止とアクティベーションステアリングを通じて、それぞれが独立してAF動作を変調することを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:00:35 GMT)
Unsupervised Deep Image Prior for Sparse-View and Limited-Angle Electron Tomography [0.9] 限られた角度とスパースビュー条件下では、従来のアルゴリズムは劣化した再構成を生成する。
非教師型ディープラーニング(DL)アプローチであるDeep Image Prior(DIP)を高分解能トモグラフィー取得のために提案する。
本研究では,スパースビューとリミテッドアングル条件の両方で,信頼性の高い3次元定量化を可能にすることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:07:01 GMT)
Federated Learning for Multivariate Time Series Anomaly Detection in Industrial Automation [0.9] 本稿では,個別産業自動化プロセスの反復性から生じる循環力学を用いたデータセットを提案する。
提案したデータセットと公開ベンチマークデータセットの両方で、選択したTSADメソッドを評価する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:00:31 GMT)
NeR-SC: Adapting Neural Video Representation to Screen Content [0.9] 暗黙の神経表現は、ビデオ圧縮の有望なパラダイムとして現れている。
スクリーンコンテンツビデオには、シャープエッジ、限られたカラーパレット、強い時間的冗長性といった、異なる統計が示されています。
スクリーンコンテンツビデオに適したニューラル表現フレームワークNeR-SCを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:43:50 GMT)
Analytical Singular-Value Structure of Analytic-Continuation Kernels from Slepian Information Theory [0.9] 実時間グリーン関数から実周波数スペクトルへの解析的継続は、量子多体物理学における中心的な不測の逆問題である。
熱核は, 熱浴によって課される統計的重みから純粋に動的に分離された場合に, 解析的に一般化された特異値構造を許容することを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:16:24 GMT)
PlayClass: Automated Play Behaviour Classification in Poultry [0.9] PlayClassは、養鶏の遊び行動分類のためのパイプラインである。
SAM 3による長期追跡をYOLO誘導のチャンク境界を介して行い、ポイントベースのプロンプトにおけるアイデンティティエラーを最小限に抑える。
V-JEPA 2.1はモデルスケールで他のすべてのバックボーンを上回った。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:13:36 GMT)
CSV-ViT: A Vision Transformer with the Variable-sized Cortical Supervertices for Detection of Alzheimer's Disease Pathologies [0.9] 脳皮質表面の深層学習は、データの球面トポロジーのために大きな課題に直面している。
最近の表面モデルでは、皮質表面データから学習が可能になっている。
本稿では、ROI保存型可変サイズのパッチ分割を行う皮質表面トークン化を提案する。
我々は,パディングとマスク対応パッチ埋め込みを用いた可変サイズパッチ耐性ビジョントランスであるCSVビジョントランス (CSV-ViT) を設計する。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:57:33 GMT)
Why Prompt Optimization Works, and Why It Sometimes Doesn't: A Causal-Inspired Edit-Level Analysis [0.9] 自動プロンプト最適化手法は、大規模言語モデル(LLM)の性能を大幅に向上させることができる。
実際には、あるベンチマークで最適化されたプロンプトの優位性は、しばしば別のベンチマークへの転送に失敗する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:39:36 GMT)
QSignAI: Quantum-Randomness-Seeded Identity Signatures at the Intersection of AI for Science and Science for AI [0.9] ノーベル賞とチューリング賞は、人工知能と量子科学を同一の呼吸で評価している。
QSignAIは、人工知能と量子科学の双方向関係を示す、製品展開のオープンソースプラットフォームである。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:04:47 GMT)
JLT: Clean-Latent Prediction in Latent Diffusion Transformers [0.9] クリーンポイントの後退は、周囲の雑音量を予測するよりも、低次元構造を効果的に活用することができる。
凍結FLUX.2VAE符号上の130M遅延拡散変換器であるJLTを導入し、クリーン遅延予測と一致速度予測DiTを比較した。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:41:58 GMT)
Image Thresholding: Understanding Bias of Evaluation Metrics towards Specific Evaluation Functions [0.8] マルチレベル画像閾値設定は、医療画像からリモートセンシングまで幅広い用途において、セグメンテーションに広く用いられている。
大津のクラス間分散やカプールのエントロピーのような古典的目的関数はメタヒューリスティックアルゴリズムを用いて最適化されることが多い。
BSDS500データセットにおける画像のしきい値に対するしきい値と品質指標の相関関係を解析する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:02:36 GMT)
A Dynamic Programming Framework for Discovering Count and Values of Multilevel Image Thresholding [0.8] 本稿では,動的プログラミングアルゴリズムと最小誤差閾値(MET)基準の変更に基づく新しいしきい値設定手法を提案する。
本手法と他の最先端手法との比較を, 自然, 衛星, 医用画像の総合的なセットで行った。
提案手法は,異なるタイプのテスト画像の多くに対して,適切な閾値を検出できる。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:03:45 GMT)
Beyond Motion Primitives: Behavioral Activity Recognition from Head-Mounted IMU [0.8] ARスマートグラスは、積極的な支援を提供するために、継続的な行動コンテキストを必要とする。
頭部搭載慣性測定ユニット(IMU)は歩行や立位などの運動原始体のみを検出する。
私たちはモーションプリミティブを行動レベルの認識に超越し、ARアプリケーションに必要な5つのカテゴリとセンサーの可観測性を定義します。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:01:43 GMT)
DunbaaBERT: From Sacrifice to Semantics [0.8] Urduは、限られたリソースと断片化された評価設定のために、比較的過小評価されている。
我々はUrdu RoBERTaベースモデルのファミリーであるDunbaaBERTを紹介した。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:28:20 GMT)
Radiative electronic bound states in the continuum from defects in semiconductors [0.8] 局所欠陥状態は連続体中の放射性電子束縛状態をホストできることを示す。
その結果, 連続埋込み欠陥状態の安定化機構を明らかにし, 欠陥ベース光学系設計のパラダイムとして電子BICを確立した。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:55:23 GMT)
On the Equivariant Learning of the $Q$-tensor Order Parameter [0.8] ネマティック液晶の2次元$Q$-tensor次数パラメータの予測のためのグループ同変ニューラルネットワークの構築と評価を行う。
等変モデルは低い誤差を一貫して達成し、より堅牢に欠陥構成を一般化する。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:54:38 GMT)
Accountable Human-AI Deliberation with LLMs: Scaling Collective Intelligence through Symbiotic Scaffolding [0.8] 大規模言語モデル(LLM)は、ターンテイクとファシリテーションの帯域幅によって制約されたスケールでの民主的熟考をサポートすることができる。
本稿では, 観察と多様性の増幅, 節レベルの仲介による促進, 批准のためのヒトの優遇という3つの階層で構成された共生型AIフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:31:37 GMT)
Generalized multilevel amplitude damping channels and their thermodynamic performances [0.8] 熱環境に結合したキューディットにおけるノイズとデコヒーレンス効果をモデル化するために,新しい種類の量子チャネル,GMAD (Generalized Multilevel Amplitude Damping) チャネルを導入する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:59:41 GMT)
Detection Without Correction: A Two-Parameter Decomposition of Multi-Stage LLM Pipelines [0.8] 本稿では,マルチエージェントの議論,本質的な自己補正,検索強化検証パイプラインについて検討する。
条件付き誤り訂正率は一貫して支配的である。
検出しきい値を安定モデル/プロトコールレベルの正則性として特徴付ける。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:26:15 GMT)
Crosstalk In Contemporary Quantum Devices [0.7] クロストークノイズは、個々のアドレス可能性を抑制したり、量子ビット間の意図しない相互作用を引き起こす量子デバイスにおける現象に由来する。
本稿では,様々な物理システムにわたる量子コンピューティング文献のクロストークについて概観する。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:19:52 GMT)
Generative Animations: A Multi-Model Pipeline for Prompt-Driven Motion Synthesis [0.7] 生成アニメーション(Generative Animations)は、自然言語のプロンプトをプロダクション対応のアニメーションに変換するシステムである。
意味解析のためのLarge Language Model(LLM)とSAM(Segment Anything Model)をチェーンすることで、パイプラインは自動的に動きパスを生成する。
本システムでは、輪郭追従軌道、z次認識を用いた軌道アニメーション、変換された物体に対する視点整合運動の3つのユースケースを実演する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:58:30 GMT)
Simorgh at SemEval-2026 task 7: Region-Aware Hybrid Retrieval for Low-Resource Cultural Reasoning in Multilingual Question Answering [0.7] 我々は, BLEnDベンチマークを用いて, 30言語からなる多言語コーパスからなる, 文化的根拠付き多言語質問応答について検討した。
本稿では,BM25語彙マッチングと密接な意味的類似性と局所重み付けを組み合わせ,応答の関連性を改善するための地域対応ハイブリッド検索手法を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:55:37 GMT)
Look Further: Socially-Compliant Navigation System in Residential Buildings [0.7] 反応距離を8メートル以上まで伸ばすことで、ロボットの動きに対する人間の認識を改善できることを実証した。
本研究は,42名の被験者を対象に,安全,滑らか,礼儀正しさという3つのサービス目標に基づいて,配達ロボットの印象を評価するためのユーザスタディである。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:52:38 GMT)
Quantification of atmospheric carbon dioxide from the Geostationary Operational Environmental Satellite (GOES East) [0.6] 現在の宇宙ベースのセンサーは、空間と時間におけるスパースな観測しか提供していない。
この課題は、地球規模の温室効果ガスの変動を推定する既存のミッションからのデータ利用への関心を喚起した。
我々は1ピクセルの物理誘導ニューラルネットワークであるDeep$XCO$を開発し、乾燥気柱のCO$モル分率を推定する。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:21:46 GMT)
The Energy Blind Spot: NVIDIA's Flagship Edge AI Hardware Cannot Support Process-Level Energy Attribution [0.6] エージェントAIワークロードは、エッジデプロイメントをターゲットにしている。
オーケストレーション構造は エージェントエネルギーコストを支配しています
CPU側処理は全レイテンシの90.6%を占める。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:15:21 GMT)
AlbanianLLMSafety: A Safety Evaluation Dataset for Large Language Models in Albanian [0.6] 本稿では,アルバニア語におけるLarge Language Models (LLMs) の安全性評価データセットであるAlbanianLLMSafetyを紹介する。
データセットには、セルフハーム、暴力、人種差別的内容、児童虐待、過激化を含む、11の安全カテゴリにまたがる2,951のプロンプトが含まれている。
このデータセットは、アルバニア語を話すコミュニティの安全評価、微調整、チーム編成、ガードレール開発をサポートするよう要求された時に提供される。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:43:35 GMT)
SQARL: A Size-Agnostic Reinforcement Learning approach for Circuit Allocation in Distributed Quantum Architectures [0.5] 量子プロセッサのスケーリングは現在、デコヒーレンスやクロストークといった技術的な課題によって制限されている。
分散量子コンピューティングは、より小さく、扱いやすい量子プロセッサ(コア)を相互接続することで、これらの制限に対処する。
通信コストを最小化しながらコアに量子回路を分散するタスクは、Qubit Allocation problemとして知られている。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:48:28 GMT)
Quantum criticality of the ferromagnetic Dicke-Ising model [0.5] ランダウ理論を用いた強磁性ディック・イシングモデルにおける量子相転移について述べる。
本研究は, この挙動に寄与する重要なメカニズムとして, 仮想的に近接する二重スピンフリップ過程を同定する。
本研究は、全対全相互作用量子系における適応有限サイズスケーリング形式の必要性を強調した。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:04:17 GMT)
KZ-SafetyPrompts: A Kazakh Safety Evaluation Prompt Dataset for Large Language Models [0.5] KZ-SafetyPromptsは、カザフスタンの安全評価のためのプロンプトデータセットである。
データセットには、カテゴリー別に整理されたカザフ語で書かれた5,717のプロンプトと、言語間の分析のための英語翻訳が含まれている。
GPT-4oの結果、全体の拒絶率は28.2%で、カテゴリーごとに5.5%から53.8%に変化している。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:36:15 GMT)
How Human-Like Are Large Language Models? A Register-Aware Linguistic Evaluation Framework [0.5] 本研究では,人間的類似性を評価する文脈認識評価フレームワークを提案する。
我々は,最大平均離散性(MMD)と,Biberが導入した67の語彙文法的特徴を用いて,この枠組みを実装した。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:10:05 GMT)
Semantic Robustness Probing via Inpainting: An Interactive Tool for Safety-Critical Object Detection [0.5] 安全クリティカルな領域で物体検出器をテストするには、ピクセルレベルの破損を超えた意味論的に意味のあるプローブが必要である。
本稿ではセマンティックロバストネス探索ツールSemProbeを紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:15:38 GMT)
Extremal Marginal States of Maximal Rank in $(d, d+m)$ [0.4] 凸集合 $mathcalC(_2)$ の双極子量子状態の極端点について検討する。
我々は$(d,,d+m)$次元の極端点を最高値に一致するランク$d+m$で構成する。
これは、比較的大きなランクを持つ極端状態の存在を証明し、既知のすべての例をカバーしている。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:18:51 GMT)
A Hybrid Vision-Language Architecture for Automated Defect Reasoning and Report Generation in Industrial Inspection [0.4] 本稿では,風力タービン羽根試験用分離・エッジ展開可能なパイプラインについて述べる。
The EyesはY26-x-obb指向のバウンディングボックスで、データセットネイティブの解像度で欠陥をローカライズする。
ブリッジは決定論的でパラメータフリーな符号化モジュールであり、検出された各バウンディングボックスをグリッド参照トークンにマップする。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:27:38 GMT)
Retrying vs Resampling in AI Control [0.4] 我々は、AI制御の観点から再試行を行い、モデルが潜在的に敵対的なものとして扱う。
再試行は正直な疑念のスコアを減少させるが、信頼できないモデルは監視の合理性を利用してスニーカー攻撃を構築することができる。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:09:51 GMT)
UniMaia: Steering Chess Policies with Language for Human-like Play [0.4] チェスでは、特殊ポリシーネットワークは強い性能を達成するが、意味的な制御性は欠如している。
我々は、プロンプト条件付きポリシー変調のためのフレームワークである$textbfUniMaia$を提案する。
UniMaiaは、事前訓練されたポリシー表現を保持しながら、オープニングセレクションやプレイヤーの強さを含むゲームプレイのセマンティックコントロールを可能にする。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:32:58 GMT)
A Methodology to Assess Power Modeling in Energy-Aware Federated Learning on Heterogeneous Mobile Devices [0.3] ヘテロジニアスARMベースのコモディティデバイス上でのCPUパワーの推定は、CPUの電圧ドメインへのアクセスが制限されているため困難である。
本稿では、クラスタレベルのサプライ電圧を取得するために、再現可能なCPU電力推定手法とレール・クラスタ間マッピング手法の組み合わせを提案する。
解析モデルは10パーセント未満の誤差でCPUパワーを予測するのに対し、近似モデルは959%の誤差を発生させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:19:31 GMT)
Neuro-Inspired Inverse Learning for Planning and Control [0.3] 本稿では,脳神経に触発された計画と制御のための枠組みを提案する。
我々は,哺乳動物の脳における高速かつ高効率な目標指向行動を可能にする3つの原理に基づいて構築する。
私たちのフレームワークは、Inverse Learningを通じてトレーニングされたエンドツーエンドの学習コンポーネントを使用します。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:41:34 GMT)
When prompt perturbations break your A/B test: A valid statistical test for generative surveying [0.3] そこで本研究では,手話検定やウィルコクソン署名ランク検定を含む標準仮説検定が,生成的サーベイの統計モデルの下では無効であることを示す。
本稿では,本モデルで有効な置換テストを提案し,標準テストが失敗する条件を正式に特徴付ける。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:35:58 GMT)
Image Feature Fusion-based Federated Client Unlearning (FCU) [0.3] We propose a Image Feature Fusion-based Federated Client Unlearning (IFF-FCU)。
IFF-FCUは、忘れ分布と残留分布のギャップを埋める。
理論的には、忘れる境界を拡大し、規則化する。
例えば、ICHデータセットでは、IFF-FCUは、再訓練された金標準からの高度に競争力のあるエラー偏差を達成している。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:56:41 GMT)
ReasonOps: A Unified Operational Paradigm for Trustworthy Verified LLM Reasoning [0.3] 本稿では,信頼できる推論システムのための統一運用パラダイムであるReasonOpsを紹介する。
提案手法は,意味解釈,自己形式化,記号的推論,定理証明,実行時保証,確率的信頼性推定,適応補正を統一的推論ライフサイクルに統合する。
ReasonOpsは、次世代の信頼できるAIエコシステムの基盤となるかもしれない、と私たちは主張する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:32:15 GMT)
Developing a Totally Unimodular Linear Program for Optimal Conformance Checking: When and Why It Complements A* [0.3] 本稿では、完全一様線形プログラム(LP)としてのアライメントに基づく整合性チェックの再構成を提案する。
基礎となるネットワークフロー構造を利用することで、LP緩和による最適極点解が保証される。
両手法を併用した単純なアルゴリズム選択ガイドラインを導出し, 平均実行時節約率38.6%, 選択精度96%を実現した。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:30:23 GMT)
Comparative Analysis of Liquid Neural Networks and LSTM for Sequential Pattern Recognition: Robustness, Efficiency, and Clinical Utility [0.3] LNN(Liquid Neural Networks)は、ネイティブの時間領域において、優れたパラメータ効率とはるかに高いロバスト性を提供する。
この拡張プレプリントは、関連するデータセットとLNN理論の系統に関する追加のバックグラウンドを提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:18:52 GMT)
Memory-assisted squeezed light velocimetry under realistic loss and incoherent noise [0.3] 本研究では,コヒーレントプローブと圧縮真空で供給される2メモリのマッハ-ツェンダー干渉計に基づく速度センサを提案する。
我々は,速度感度,目標量子ゲインに必要な伝送しきい値,最適な記憶時間を導出する。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:54:18 GMT)
Leveraging Correlated Decoding for Bias-Tailored Compass Codes [0.3] 量子エラー訂正(QEC)は、しばしばバイアスノイズを経験するハードウェア上で実装される。
これは、Cliffordで変形したコンパスコードなど、バイアス調整されたQECコードを開発するための最近の多くの取り組みを動機付けている。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:14:02 GMT)
Enabling KV Caching of Shared Prefix for Diffusion Language Models [0.3] 共有プレフィックスに対するキーバリュー(KV)キャッシュは、高スループットの大規模言語モデル(LLM)サービスに不可欠である。
拡散言語モデル(DLM)における共有プレフィックスのための最初のKVキャッシュ手法であるbicacheを提案する。
従来の精度崩壊のない手法と比較して,bicacheはサービススループットを36.3%~98.3%向上させることがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:27:57 GMT)
Sparse POD Mode Selection and Manifold Dimensionality Reduction with Neural Networks [0.3] 本稿では,PODモードと非線形NNデコードによる線形符号化を利用する次元減少フレームワークであるSparseModesNetを提案する。
SparseModesNetは、ベンチマークのアドベクションに支配されたカオスフローにおいて、最先端のパフォーマンスにマッチするか、それとも超えている。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:10:05 GMT)
Motif-based morphology signatures for interpretable ECG screening and monitoring [0.3] 本稿では,拍動対応心電図モチーフを心電図の解釈可能なシグネチャとして定義するモチーフベースのフレームワークを提案する。
本稿では,通常の正弦律からの偏差,個人化ベースラインからの偏差,モチーフ不安定指数の3つの解釈可能なドリフト指標を紹介する。
我々は,これらの指標を,短期(PTB-XL)と長期(MIT-BIH Arrhythmia)のECGデータセットで評価した。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:15:07 GMT)
High-Fidelity Industrial Crash Dynamics Prediction via Geometry-Aware Operator Learning with Memory-Efficient Low-Rank Attention [0.2] 我々は,GeoTransolverフレームワークが,産業規模での高精度かつ高忠実なクラッシュダイナミクス予測に有効なソリューションであることを示す。
ワンショット、時間条件、自動回帰ロールアウト戦略は、トレーニングオーバーヘッドと推論遅延を著しく低減し、最先端の精度を実現する。
本結果は,複雑な安全クリティカルな自動車力学の高忠実なサロゲートモデリングのための幾何認識演算子学習の実用性を強調した。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:15:53 GMT)
Testing Agentic Workflows with Structural Coverage Criteria [0.2] マルチエージェントワークフロー仕様に対する構造的テスト手法を提案する。
このアプローチは、それぞれのワークフローを型付きコーディネーショングラフとして表現する。
到達可能なエージェント、ツールエッジ、制限されたツールエッジ、デリゲートエッジに対するカバレッジ義務を導出する。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:07:55 GMT)
Cost of Structural Learning Under Censored Feedback: A Threshold-Bandit Approach [0.2] 多くのマルチエージェントアプリケーションでは、タスクは、未知のサイズのしきい値を満たす連立によって実行される場合にのみ報酬を得る。
我々はこの設定をThreshold-Activated Cooperative Multi-Armed Bandit (TAC-MAB) として定式化する。
集中型アルゴリズム (C-TAC) は, 累積的後悔のO(log T) を構造探索用語として達成し, 検閲されたフィードバックの下で実現可能性の解決コストを抑えることを示す。
次に、D-TACという分散型イベントトリガープロトコルを導入し、エージェントは、その構造的信念が変化したときにのみ同期する。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:26:18 GMT)
RULER: Representation-Level Verification of Machine Unlearning [0.2] 本稿では,表現レベルの検証指標であるRULERを紹介する。
M2は、リトレーニングされていないモデルと同じ表現位置を占めるかどうかを測定する。
M4は、未学習モデルの内部類似構造からの残留物のみを再訓練することなく検出する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:41:48 GMT)
DEI: Diversity in Evolutionary Inference for Quality-Diversity Search [0.1] 本稿では,分散品質多様性(QD)検索フレームワークである進化推論における多様性について述べる。
均質な並列探索とは異なり、DEI はそれぞれの LLM の独特な創造性を、行動の新規性の相補的な源として扱う。
ノードは各ラウンドの最後に 最適な解決策を共有します 次のラウンドの人口を シードするために
論文参考訳(メタデータ) (Tue, 26 May 2026 15:00:57 GMT)
Control Physiology: An Agent-Based Model of FAIR-CAM Dynamics [0.1] コアFAIR-CAMダイナミクスを動作させるエージェントベースモデルを提案する。
病院のランサムウェアのシナリオでは、静的解析では表現できない3つの組織力学が出現する。
これらのダイナミクスは、FAIR-CAMアーキテクチャの構造特性であり、研究された特定のシナリオを超えて一般化されるべきである。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:31:20 GMT)
From Provable to Practical: A Problem-Driven Survey of Classical and Machine-Learning Defenses for DV/CV Quantum Key Distribution [0.1] 量子鍵分布(QKD)は、情報理論上のセキュリティを約束するが、離散可変(DV)および連続可変(CV)設定での実践的なデプロイは、デバイス不完全性、チャネル操作、有限キー効果、適応と監視に使用される機械学習(ML)コンポーネントの脆弱性に曝される。
この調査では、デバイス、チャネル、プロトコル、ML、ネットワーク層にまたがる9つの実践的問題クラス(P1-P9)に基づいて、問題駆動の視点を採用する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:44:51 GMT)
Accelerating Reinforcement Learning Training Using Simulation Surrogate Models [0.1] 高出力シミュレーションモデルは複雑なシステムの解析に広く用いられているが、その高い計算コストはより安価なサロゲートモデルの開発を動機付けている。
並行して、学習強化(RL)が、環境におけるオンライン意思決定のための強力なフレームワークとして登場した。
本稿では,報酬構造,モデルパラメータ,システムダイナミクスが時間とともに変化するような環境下でのRLトレーニングの促進に適した代理モデルについて検討し,シミュレーションモデルやRLモデルとの相互作用について検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:23:42 GMT)
Small Object Detection in Industrial Recycling: A New Dataset and YOLO Performance Evaluation [0.1] 本稿では,コンピュータビジョンの大きな課題である,小さく,密度が高く,重なり合う物体を検出する問題に対処する。
10k以上の画像と120kのインスタンスからなる新しいデータセット上で、これらのシステムを詳細に比較する。
現在利用可能な最も信頼性の高いシステムと、それらが取り組むように設計されている特定の課題を特定します。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:47:31 GMT)
Is an Image Also Worth 16x16=256 Superpixels? A Framework for Attentional Image Classification [0.1] スーパーピクセルベースの画像分類と視覚変換を統一する新しいフレームワークであるSuperpixel Transformers (SPT)を提案する。
SPTは、任意のスーパーピクセルベースのチャンキング戦略、接続グラフ、位置エンコーディングをサポートするために、グラフ注意ネットワーク(SICGAT)モデルとViTでスーパーピクセル画像分類を一般化する。
我々は,SPTが従来のスーパーピクセルベースGNN法に比べて優れた性能を示し,ViTと競合し続けていることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:09:46 GMT)
Agyn: An Open-Source Platform for AI Agents with Scalable On-Demand Execution, Agent Definition as a Code, and Zero-Trust Access [0.1] 我々はエージェントワークロードの3つの重要な原則を中心に設計されたオープンソースのプラットフォームであるAgynを紹介します。
Agynはエージェント非依存、モデル非依存、クラウド非依存である。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:48:04 GMT)
Neuro-Symbolic Verification of LLM Outputs for Data-Sensitive Domains (extended preprint) [0.1] 本稿では,形式的記号法とニューラルセマンティック解析を組み合わせたハイブリッド検証アーキテクチャを提案する。
出力検証のために、埋め込みに基づく意味的類似性はコンテキスト幻覚を検出する。
評価の結果, 構造体では83%, 意味形成では72%以上の幻覚検出率を示した。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:32:17 GMT)
Many Logics, One Methodology: A Plea for Logical Pluralism in Formalised Reasoning (preprint) [0.1] 本稿では,LogiKEyのような統一メタロジカルフレームワークにおいて,オブジェクト論理レベルでの論理的多元論を推し進める。
現代の証明助手における論理的多元主義の原則的支持を提唱し、論理的帝国主義に対して警告する。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:25:52 GMT)
The Coverage Illusion: From Pre-retrieval Routing Failure to Post-retrieval Cascades in a Production RAG System [0.1] 現代のRAGパイプラインでは、HyDEやクエリ拡張といったクエリ拡張手法が全てのクエリに適用されている。
デンマーク国立百科事典のケーススタディとして,20,000以上のクエリ・ワークフロー・ペアを5回検索した。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:08:34 GMT)
Distribution-Aware Conformal Prediction: A Framework for generating efficient prediction intervals for time series [0.0] 本稿では,モンテカルロのドロップアウト,深層アンサンブル,および量子レグレッションとスコア非依存の共形キャリブレーションといった確率的予測器を統合し,有効かつ効率的な予測間隔を生成する統合フレームワークである分散対応コンフォーマル予測(DCP)を提案する。
合成および実世界の時系列データに関するベンチマーク分析は、DCPが様々な不確実な状況下で予測間隔を適応的に調整する能力を示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:38:18 GMT)
Zero-field dipolar decoupling of color center ensembles via universal qutrit control [0.0] 本稿では、V縮退スピン1系間の双極子相互作用をキャンセルするパルスシーケンスZENITHを提案する。
我々は、コヒーレンスサバイバル、既存のセンシングシーケンスとの互換性、DC検出の改善について明らかにした。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:23:00 GMT)
When Should an AI Scientist Stop? Verifiable Experiment Steering and Refusal for Autonomous Discovery [0.0] CARTOGRAPHは、AI科学者のための検証レイヤーである。
未解決宇宙実験ステアリング(選択)、明示的曖昧性閉鎖(解決)、残差に基づくライブラリ不整合検出(再利用)の2つを結合する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:19:16 GMT)
When Does Synthetic Patent Data Help? Volume-Fidelity Trade-offs in Low-Resource Multi-Label Classification [0.0] BERT-for-PatentsのマイクロF1の改良は,主に体積効果を反映していることが示されている。
生のマイクロF1における分類性能を+0.58まで向上させるコーパスは、ジャカードオーバーラップ検索プロキシに悪影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:53:29 GMT)
Triangular-Reference Schrödinger Bridges for Time Series Generation [0.0] TR-SBTS(Triangular-Reference Schrdinger Bridges for Time Series)を紹介する。
この構成は、拡張状態空間上の単一のエントロピー射影である。
我々は、対応する正規化カーネル推定器の凍結近似と収束の安定性を確立する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:05:11 GMT)
Transition from Collective to Local Radial Motional Modes in a Tapered Paul Trap [0.0] テープ付きポールトラップにおいて, より強い軸方向閉じ込めにおける集合ラジアルモードから低軸方向閉じ込めにおける個々のラジアル振動への遷移について検討した。
固有モードは遷移状態において実験的に研究され、理論的な予測と比較される。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:42:34 GMT)
Towards entanglement-enhanced probing of atomic parity violation [0.0] 我々は、原子パリティ違反(APV)機構、CsおよびYbにおける技術の現状、および最近のトラップイオン、光学格子、分子提案についてレビューする。
エンタングルメントは統計的平均化を強く促進するが、最終的な精度はAPV固有の系統的なフロアによって設定される。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:55:00 GMT)
Toward Scalable Heterogeneous Quantum Networks: Microwave-Optical Transduction Across Platforms [0.0] 光学・電気光学・磁気光学プラットフォームにおけるマイクロ波-光量子トランスダクションの進歩を概観する。
オプトメカニカルシステムは、ミリケルビン温度で0.25Quantaのノイズを付加して93%のフォノン-フォトン効率を達成する。
LiNbO3とAlNをベースとした電気光学デバイスは、室温効率が1%以下からミリケルビン系へと進歩し、内部効率は99.5%に近づいた。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:01:51 GMT)
Time Crystals on Quantum Devices [0.0] 時間結晶は、時間秩序の出現を特徴とする物質の非平衡相である。
現代の量子デバイスと量子プロセッサを用いた最近の実験は、確立されたパラダイムを超えたレギュレーションを明らかにしている。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:02:39 GMT)
Three-fold coincidence by stimulated parametric down-conversion [0.0] 本研究では,コヒーレンス時間当たりの平均光子数が1以下である弱コヒーレント場によってシードされた連続波,低利得ダウンコンバージョンについて検討した。
その結果、シード誘起3光子相関の時間領域の証拠が得られ、量子イメージング、センシング、情報処理のための多光子状態のエンジニアリングと探索の新しい方法が提案された。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:14:01 GMT)
Thermal Casimir Effect in A Schwarzschild-like Wormhole Spacetime [0.0] シュワルツシルト型ワームホール時空における2つの平行板の間に閉じ込められた無質量スカラー場に対する有限温度カシミール効果について検討した。
再正規化されたカシミール自由エネルギーに対する熱補正は温度とともに徐々に減少し、このフレームの背景形状とは無関係になる。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:17:34 GMT)
The Sensation Modulating Network:Haltability as the architectural ground for object-directed phenomenology [0.0] 我々は、この不備は、具体的エージェントのアーキテクチャの不完全な説明に起因していると主張している。
本研究は,身体全体としての認知エージェントである感覚変調ネットワーク(SMN)を提案する。
SMNは認知主義4Eの議論を和解し、再帰はネゴチブル・アクション・パターンの修正可能なダイナミクスの中で生きていく。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:15:56 GMT)
The Privacy Subsidy in Glosten-Milgrom: Bid-Ask Spread and Welfare under Flip-Noise Direction Observation [0.0] 我々は1985年のGlosten-Milgromのシーケンシャルトレーディングモデルに対して,クローズドフォームの入札スプレッドと福祉の分解を導出した。
福祉の分解は、プロトコルの流動性プールからトレーダへのトレーダ当たりの転送に対して$$を識別する。
その結果、プライバシ・サブシディの概念は連続ガウスから離散的な二状態構造へと拡張された。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:00:32 GMT)
The Privacy Subsidy in Continuous-Time Kyle: Cumulative Welfare under Noise-Perturbed Order-Flow Observation [0.0] 単一周期カイルモデルから連続時間へ、中村(2026, arXiv05.15746)のクローズドフォームのプライバシ・サブシディ結果を拡張した。
我々は、この累積プライバシー補助金とロス・ヴァーサス・リバランシングの2つの構造的双対性を確立する。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:02:42 GMT)
The Need for an External Observer Formalizing the Sufficiency Gap: A Mathematical Extension of Mixture Identifiability and Contextual Grounding in Sequence Models [0.0] 我々は、決定論的テキスト構造と、保存されていない潜在状態によって支配される1つのランダム構造を持つ2元混合登録プロセスを構築した。
結果として生じるエントロピー差は通常の最適化誤差ではない。
補正信号は、その忠実度が誤解を招く状態に割り当てられたテキストのみの後方重みを超えると、テキスト履歴によって引き起こされる後続のオッズを正確に反転させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:53:11 GMT)
The Fundamental Limits of Fraud Detection in Card Payment Networks [0.0] カード支払い不正検出は通常、監督された分類問題としてフレーム化される。
これは主に関数近似や最適化の失敗ではなく、支払いエコシステムに固有の構造的情報障害の結果である、と我々は主張する。
カード認証は、遅延、検閲、腐敗、そして事実上欠落したフィードバックを伴って、シーケンシャルな決定問題として定式化します。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:24:50 GMT)
Telenor Nordics Customer Service self-help corpus [0.0] 本稿では,フィンランド語,デンマーク語,ノルウェー語,スウェーデン語で手作業で検証された文書1,122件からなる多言語顧客サービスセルフヘルプコーパスを提案する。
文書は、北欧の通信事業者4人の公開自助ページから入手された。
コーパスの解析により、文書の長さと演算子間の構造にかなりの変化が見られる。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:52:55 GMT)
Synthetic Emotions vs. Gamification: Exploring Engagement Strategies for Small Social Robots in Different Age Groups [0.0] 不安障害児支援を目的とした触覚ロボットのエンゲージメント戦略について検討する。
ロボットは、ユーザーの参加を促すために、合成された感情フィードバックまたはポイント報酬を提供する。
6~8歳児の嗜好評価と,20~27歳の大学生14名を対象に行動調査を行った。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:12:11 GMT)
Stop Suppressing the Tail: Causal Inference for Extreme Events [0.0] Average DoseResponse(ADRF)はコア因果推論のプリミティブである。
金融リターンや気候の損失などの高水準設定では、この1-in-1000の極端な事象が実際の目標量である。
本研究は,標準点推定とともに構造付きテール形状出力を出力するADRF推定器を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:38:12 GMT)
Slide Deck Q&A Quality Assurance App: A Multi-Stage Pipeline for Pedagogical Question Generation [0.0] 本稿では,PDFスライドからテキストや描画画像を抽出するFlaskベースのソフトウェアシステムであるSlide Deck Q&A Quality Assurance(slidesqaqa)について述べる。
このシステムは、スライドのモダリティと教育的役割を共同で考慮し、予算を割り当て、デッキのレベルを変更して冗長性を低減し、カバレッジを向上させる。
最初の実験は、パイプラインが非教育的なスライドをフィルタリングし、視覚的に複雑なコンテンツに対して、教育的に一貫性のある質問を生成できることを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:23:51 GMT)
Simulation of additive binding energies in asphalt using quantum-selected configuration interaction (QSCI) [0.0] 相関電子構造計算への実践的なルートとして量子中心型スーパーコンピュータが登場している。
本稿では,アスファルトバインダーの加法結合エネルギーを計算するためのハイブリッド量子古典ワークフローQuantumPaveを提案する。
工業的に関係のある材料問題に対する化学的に有意な結合エネルギーが、現在の量子ハードウェア上で達成可能であることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:01:44 GMT)
Shortest Path Problem with Subnormal Gaussian Fuzzy Costs [0.0] ファジィファジィ数の追加時に,重み付き幾何平均を用いて高さを集計する。
我々は、最短経路を決定するために、ファジィエッジコストのコア、高さ、標準偏差を共同で考慮した信頼性の高いランキングを用いる。
FAAの航空交通ネットワークに関する大規模なケーススタディでは、提案したGGFN-SPPフレームワークが現実世界のネットワークに効率的にスケール可能であることが示されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:25:42 GMT)
Semiclassical foundation of universality in chaotic quantum circuits [0.0] 本研究は, 特異なサブシステム構造を持つ多体系が単一粒子理論とは異なる特性を有することを示す。
我々は、よく定義された半古典的極限を持つ多体系に対する周期軌道論を示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:07:11 GMT)
Semantic Gradients Interactions in SSD: A Case Study in Racial Identity and Hate Speech [0.0] 本稿では,Supervised Semantic Differentialの拡張であるInteraction SSDを紹介する。
セマンティックな意味が、グループ、特徴、あるいはこのバリエーションをテスト可能で解釈可能にする条件など、モデレーター間でどのように変化するかをモデル化する。
カリフォルニア大学バークレー校のヘイトスピーチコーパスで、アノテーターの人種的アイデンティティがヘイトスピーチの判断を中和するかどうかを検証する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:33:02 GMT)
Self-Improvement Imitation with Biologically Guided Search for Protein Design Under Oracle Budgets [0.0] 本稿では, オーラクル予算タンパク質設計のためのトラジェクトリレベルの自己改善模倣フレームワークであるSILOを紹介する。
SILOは階層的な編集ポリシーを使用して、各突然変異を位置選択に分解し、次に残基選択を行う。
評価では,8つのランドスケープのうち8つのランドスケープにおいて,最大,最上位100のフィットネスを実現している。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:29:36 GMT)
Self-Ensembling Vision-Language Models for Chart Data Extraction [0.0] 手動でチャートをデジタル化することは、時間とエラーを起こし、自動チャートからテーブルへの抽出を動機付けます。
近年のアプローチでは、特殊視覚言語モデル(VLM)が採用されているが、多くのデータポイントや相当なスタイリスティックなバリエーションを持つチャートでは、まだパフォーマンスが遅れている。
固定チャート画像に対して同一のVLMから複数の出力を繰り返しサンプリングし,個々のテーブルセルのレベルで集約するVLM自己組織化手法を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:10:51 GMT)
Scheduled Style Injection: Expanding the Style-Content Pareto Frontier in Training-Free Diffusion-based Style Transfer [0.0] 事前学習拡散モデルによるスタイル伝達は急速に進んでいる。
モデルの中で、スタイルインジェクションはどこで最強になるべきか?
指導的なトレーニング不要なメソッドであるStyleIDは、すべてのレイヤとタイムステップに一様に単一のグローバルパラメータ(ガンマ)を使用する。
このトレードオフは必然的に厳格であることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:39:40 GMT)
SIA: Self Improving AI with Harness & Weight Updates [0.0] 人間はAIの構築と改善のボトルネックです。
言語モデルエージェントがハーネスとタスク固有のエージェントの重みを更新する自己改善ループであるSIAを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:55:46 GMT)
SCALE-COMM: Shared, Contrastively-Aligned Latent Embeddings for MARL Communication [0.0] 本稿では,コンパクトで安定なコミュニケーション表現を学習するための自己教師型フレームワークを提案する。
学習した通信空間は, 政策微調整による安定性, サンプル効率, スループットの向上を図っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:06:19 GMT)
Robust Koopman Control Barrier Filters for Safe Actor-Critic Reinforcement Learning [0.0] 本研究では,データから有限次元クープマン予測器を学習する安全フィルタ型アクター批判フレームワークを提案する。
この手法は、制約のないSACリターンをマッチングまたは超過しながら、CartPoleの安定化とトラッキングに対する制約違反をゼロにする。
これらの結果から,ロバストなクープマン-CBFフィルタはモデルレスRLと証明可能な安全性の間に有望な橋渡しとなることが示唆された。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:02:40 GMT)
Risk Averse Alert Prioritization for IDS Using Subnormal Gaussian Fuzzy Models [0.0] 準正規ガウスファジィ数に基づく警告優先順位付けの原理的枠組みを提案する。
各アラートは、重大度を示すコア、不確実性を示すスプレッド、および高さ反射検出信頼性を示すファジィ数として表現される。
ランク付け指標を適用してアラートを優先順位付けし、リスクアテンションパラメータによるセキュリティ姿勢の調整を可能にします。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:11:21 GMT)
Resolving the Correct Library: A Loader-Level Defense Solution Against Shared Object Hijacking [0.0] 組込みLinuxにおける共有ライブラリハイジャック攻撃は重要な懸念事項である。
本稿では,動的リンカの解答プロセスの信頼性を保証するローダ中心の検証フレームワークを提案する。
我々の設計では、パスバウンドと位置非依存のアイデンティティモデルと暗号ハッシュの両方をサポートしている。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:54:24 GMT)
Resolving Ambiguity in Composed Image Retrieval via Calibrated Interaction [0.0] 合成画像検索(CIR)は、コーパスに参照画像と修正方法を記述するテキストを検索する。
本稿では,CIRRの休眠補助アノテーションと対話アノテーションを復活させる,ベンチマークおよび人間検証型ユーザシミュレータであるAmbiCIRを紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 01:30:14 GMT)
Reasoning, Code, or Both? How Large Language Models Handle Variations in Math Questions [0.0] 本研究は,GSM-Symbolicデータセットから1000問題に対する3つのアプローチを評価する。
これら3機は、クロード・ハイク4.5を使用して、オリジナルと修正された2台で実行された。
CoTは最も堅牢な方法であり、精度は1.3%低下し、問題の1.8%は摂動で壊れた。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:44:49 GMT)
Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion [0.0] 本稿では,クエリを3つのメカニズムを通じてセグメンテーションに統合することにより,チャンクを動的に構築するクエリ適応セマンティックチャンキング(QASC)を提案する。
QASCのF1スコアは0.85で、固定チャンクよりも18-27%、意味論的およびエージェント的代替よりも8-12%向上している。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:31:03 GMT)
Quantum and Thermal Properties of the Klein-Gordon Inverted Harmonic Oscillator with Physical Applications [0.0] 我々は、逆調和ポテンシャルを受けるクライン・ゴードンスカラー場の量子的および熱的性質の枠組みを開発する。
この結果から,不安定な量子系の有限温度スペクトル密度と絡み合いエントロピーの新たな予測が得られた。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:53:14 GMT)
Quantum Quenches that Resemble Operator Growth [0.0] 本研究では, 量子格子モデルにおいて, 擬似真空を徐々に不安定化させる成長クエンチについて検討する。
成長クエンチ力学がクリロフ空間とフォック空間の両方に局在していることが示される。
1次元東西モデルでは、フォック空間ケージ状態は保存電荷の存在と解釈する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:33:31 GMT)
Psychological Constructs in Shared Semantic Space [0.0] 心理学的構成物は、しばしば別々の楽器、データセット、研究の伝統で測定される。
本稿では, 単語埋め込み空間において, 単語を方向として表現し, 比較することにより, 意味論的にコンメンジュレートするフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:16:24 GMT)
Projection operator onto spin-S eigenspaces of total and orbital angular momenta [0.0] フロベニウス共変はスピン-S固有空間上の射影作用素を構成するために用いられる。
原子核実験で用いられるビラーズの角運動量投影と対応関係が確立されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:55:59 GMT)
Probing Spacetime Topology and Superposition with Accelerated Detectors [0.0] 我々は、ミンコフスキー時空のコンパクト化と重畳されたミンコフスキー時空におけるリンドラー軌道に続くウンルー・デウィット検出器による絡み合いについて検討した。
加速の方向(平行方向と反平行方向の両方)、検出器間の分離、空間コンパクト化の方向を相互に垂直に検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:06:27 GMT)
Probabilistic Data-Driven Modelling of Astrophysical Transients: The Neural Process Family for Ultrafast and Class-Agnostic Light Curve Reconstruction with NightLANP [0.0] 光曲線再構成のためのニューラルプロセスファミリーを導入する。
多様なシミュレートされたトランジェントに関するメタラーニングによって、注意神経プロセスは計算コストの大部分をトレーニングにシフトする。
我々のモデルは、全てのバンドをマイクロ秒で同時に補間し、次の最強のニューラルベンチマークよりも4桁以上高速である。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:01:39 GMT)
Practical Entanglement Distillation Protocols with Quadratic Error Suppression [0.0] 短期および初期のフォールトトレラント量子コンピューティングアーキテクチャは、非常に一様でないエラー率を示す。
特に、チップ内のローカル操作は、異なるチップや希釈冷凍機を接続する操作よりもかなり信頼性が高い。
我々は,空間と時間の両方のオーバーヘッドを最小限に抑えるため,小型のエンタングルメント蒸留プロトコルを開発した。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:29:39 GMT)
Postselection-free ballistic-diffusive transition in monitored spin chains [0.0] 周期モニタリング下でのスピン-1/2 XXZ鎖のスピンと絡み合いのダイナミクスについて検討した。
定常エンタングルメント相転移と過渡ダイナミクスにおける弾道-拡散相転移の2つの測定誘起相転移を示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:51:57 GMT)
Photon-Conditioned Squeezed States for Directional Displacement Response in Continuous-Variable Photonics [0.0] 連続可変量子光学において、スクイーズドフォック状態、光子置換励起状態、および光猫状態が非ガウス的資源として確立されている。
タスク指向の観点から、これらの既知の状態ファミリを比較した。
その結果, ホモダイン配向型連続可変制御と異方性変位雑音緩和に関係のある状態が同定された。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:23:50 GMT)
Persistent AI Agents in Academic Research: A Single-Investigator Implementation Case Study [0.0] 分析の単位は、研究者、エージェント、メモリ層、ツール、リポジトリ、スケジュールされたジョブ、特殊なエージェントロール、ガバナンスルールといった、永続的なヒューマンエージェント環境であった。
2026年5月、厳格なトラジェクトリ・サブセットが627のモデル関連イベントと7395万のトークンをキャプチャし、そのうち82.9%がキャッシュ読み取りだった。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:28:36 GMT)
PashtoTTS-Bench: automated screening for low-resource non-Latin-script text-to-speech [0.0] 単一ASRラウンドトリップ単語誤り率(WER)に依存する低リソース非ラテン文字言語に対するテキスト音声による評価は失敗する可能性がある
これらのケースを分離するレポートフレームワークであるINSVを紹介します。
我々は、Pashto TTSのベンチマークであるPashtoTTS-BenchとしてINSV-Aをインスタンス化する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:03:20 GMT)
Particle-Lund Multimodality in Jet Taggers [0.0] ランドプレーンは、ジェット内のQCD放射の物理学的、階層的な表現を提供する。
トランスフォーマーは、原料粒子成分から直接学習することで最先端の性能を達成した。
構成レベルの入力から階層型QCD構造を暗黙的にキャプチャするかどうかを検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:39:34 GMT)
PIDM-DP: Physics-Informed Diffusion with Dormand-Prince Integration for Chaotic System Identification and State Reconstruction across Multiple Dynamical Regimes [0.0] 物理インフォームド拡散モデルとDormand-Prince Integration(PIDM-DP)について紹介する。
PIDM-DPは、DPRK45 ODEインテグレータをDenoising Diffusion Probabilistic Model (DDPM) の逆サンプリングループに直接埋め込む。
高騒音レベルゼロからクリーンデータ限界付近のフル値に物理重量を上昇させる線形スケジューリング誘導機構は、単純な物理インフォームドアプローチが順番$O(10のヤコビ固有値を持つ固いシステムで失敗する勾配爆発を阻止する
論文参考訳(メタデータ) (Tue, 26 May 2026 06:57:50 GMT)
PATE-TabTransGAN: Differentially Private Synthetic Tabular Data Generation via Transformer-Based Student Discrimination [0.0] PATE(Private Aggregation of Teacher Ensembles)を統合した生成フレームワークPATE-TabTransGANを提案する。
ロジスティック回帰教師のアンサンブルは、ノイズ集約ラベルを介して生徒を監督し、この差分プライベートな学生に対して残留ジェネレータを最適化する。
PATE-TabTransGANは、4つのデータセットで最高のAUROCまたは最も結びついたAUROCを取得する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:16:45 GMT)
PAST2HARM: A Simple Adaptive Past Tense Attack for Jailbreaking Multimodal AI [0.0] PAST2HARMは、アートマルチモーダルテキストの状態からイメージモデルへの拒絶トレーニングを回避した適応型ジェイルブレイクフレームワークである。
Gemini Nano Banana Pro, GPT Image 2, SD XLの3モデルでPAST2HARMを評価し, 攻撃成功率は83%, 67%, ブラックボックスで100%, グラデーションフリー設定で達成した。
この攻撃は、露骨な性的内容、政治的偽情報、歴史的否定的物語、憎しみの言葉、自己被害の栄光など、様々な有害なアウトプットが引き起こされる。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:16:22 GMT)
Optimal quantum locally differentially private mechanisms in the high-privacy regime [0.0] プライバシー保護には、ローカルディファレンシャルプライバシ(LDP)とその量子拡張、量子ローカルディファレンシャルプライバシ(QLDP)を採用しています。
本研究では,Holevo情報(古典的な場合の相互情報に還元する)や,対称および非対称仮説検定における誤差指数などの実用関数について検討する。
保護されたプライベートデータが$n$-aryで$nge3$である場合、上記のユーティリティ関数に対する量子上の利点(より正確には$Q/Cge3/2$)を明らかにします。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:57:22 GMT)
On the Error-Correcting Effects of Stochasticity in Discrete Diffusion [0.0] 離散拡散モデルは、テキストおよび画像生成において強い性能を達成するが、推論は依然として遅く、サンプリングとサンプル品質のバランスをとる必要がある。
高い決定論的遷移は急速に収束するが、エラーの蓄積に苦しむ一方で、より多くの遷移はよりゆっくりと収束する一方で、より高い最終サンプル品質を達成することができることを示す。
本研究では,前向きと逆方向の拡散過程の交互化により制御性を注入する新しい推論アルゴリズムであるemphDiscrete Churn and Restart Sampling (DCRS)を提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:58:46 GMT)
On a mixed-state extension of the holographic signal inequality [0.0] トリパルタイトホログラフィー状態に対する新しい不等式が citeBalasubramanian:2025hxg で提案された。
我々はこの不等式を正準精製により混合状態に一般化する。
我々は三部形式ホログラフィック状態に対する新しい不等式を予想する。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:54:13 GMT)
On Clifford hierarchy testing and near-extremizers of noncommutative uniformity norms [0.0] 未知のユニタリがクリフォード階層の特定のレベルに近いかどうかをテストする問題を考える。
このテスターの複雑さは、その分析は、これらのノルムのほぼ超越剤の堅牢な特徴づけに依存している。
第4の非可換一様性ノルムの特性を確立し、その結果、クリフォード階層の第3レベルの効率的なテスタを得る。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:08:55 GMT)
OSMa-Bench++: Toward Open-Ended Benchmarking of Semantic Mapping for Manipulation with Prompt-Generated Synthetic Scenes [0.0] 我々は、OSMa-Benchを拡張して、即時生成合成室内シーンによる制御可能なベンチマークを行う。
我々のパイプラインは自動的にシーン記述を生成し、SceneSmithで対応する環境を合成し、その結果の資産をOSMa-Bench互換のシミュレーションフォーマットに適合させる。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:51:36 GMT)
Not All Transitions Matter: Evidence from PPO [0.0] 政策上の強化学習エージェントの訓練は、更新毎に新しい経験を集めることを意味する。
ロールアウトの各状態は、エージェント自身のアクションによって因果的に連鎖された前の状態の直接出力である。
ロールアウトから一定数の遷移をランダムに落とすことで、報酬信号がそのまま残るようにし、繰り返し勾配構造を破り、トレーニングを安定させるのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:46:32 GMT)
Nonlinear and Heavy-Tailed Predictability in Transition-Energy Financial Markets [0.0] 本稿では,遷移関連金融リターンが非線形予測可能性を示すかどうかを考察する。
本研究では,学生ベクトルオートレグレッションと非線形再帰学習アーキテクチャを組み合わせたハイブリッド予測フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:52:31 GMT)
Nonclassical energy-change distribution as a witness of non-Markovian quantum dynamics [0.0] エネルギー変化Kirkwood-Dirac準確率分布の非正の値によって、CPの多様性の破れが常に観測されることが示される。
非CPの多様性とシステムのエネルギー変化分布の非正の相関は、システムと環境の相互作用がエネルギー保存であるときに強くなる。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:35:39 GMT)
Non-equilibrium exciton dynamics in tailored molecular potentials of Rydberg ion crystals [0.0] 高濃度電子状態に励起されたトラップイオンは、強い結合した集合振動と電子自由度と、長距離粒子間相互作用とを結合する。
これらの成分は、生化学過程の量子シミュレーションを可能にする。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:23:18 GMT)
MuCon: Clipped Muon Updates for LLM Training [0.0] Muon-style は行列値の運動量または事前条件の更新$B = U operatornamediag(_1,ldots,_r) Vtop$ を、標準偏極係数 $operatornamePol(B) = U Vtop$ に置き換える。
MuCon は、同じ Muon 行列に対して特異値クリッピングを適用し、$DmathrmMuCon_(B) = operatornameMClip_(B) = U である。
論文参考訳(メタデータ) (Tue, 26 May 2026 02:16:17 GMT)
Modeling Agentic Technical Debt and Stochastic Tax: A Standalone Framework for Measurement, Simulation, and Dashboarding [0.0] このノートは、エージェント技術的負債と税を区別する形式的かつ管理的に使用可能なモデルを開発する。
2つの構造は関連しているが、それらは同じではない: 負債は税を増幅でき、一方、負債が最小化されても税は肯定的である。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:28:30 GMT)
Model discovery for dynamical systems with complex-valued product units [0.0] 複雑な価値を持つ製品ユニットネットワークに基づくモデル発見のためのデータ駆動型アプローチを提案する。
最初の3つのシステムに対する試行の90%と、分数的なケースに対する試行の70~90%で、正確な支配方程式を復元する。
このモデルでは,信号振幅範囲の約12~14%のRMSEをトレーニング間隔の3倍長として,予測誤差が有界な安定軌跡を作成した。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:18:47 GMT)
MerLean-Prover: A Recursive Looping Harness for End-to-End Lean 4 Theorem Proving [0.0] MerLean-Proverは、残念な宣言をカーネルチェック可能な証明に置き換える、エンドツーエンドのLean4定理証明器である。
23のPhD-qualification-exam定理のベンチマークであるFormalQualBenchでは、MerLean-Proverは10/23を解く。
Sonnetは4つのテストされたFormalQualBench問題を全てクローズし、Haikuは2つの短い問題をクローズする。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:49:49 GMT)
Margin Play: A Multi-Agent System For Public Policy Analysis In The Brazilian Equatorial Margin [0.0] ブラジル赤道マルジン (BEM) はブラジルの次の石油フロンティアであり、2026年にフォズ・ド・アマゾンス盆地で操業を開始する予定である。
BEM探査はマランハオにとってどのような条件で正の外部性を生み出すのか?
本稿では,マルチエージェント強化学習(MARL)システムであるMargin Playを紹介する。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:47:24 GMT)
Many-Body Quantum Chaos At All Time Scales [0.0] 本研究では, 4体, $N$-Majorana Sachdev-Ye-Kitaevモデルにおけるグリーンとアウトオブタイムの相関関数について検討する。
N$で指数関数的にスケールする後期では、どちらの関数も、エルゴード予測から大きく逸脱する$N Mathrmmod8 = 2, 6$のディップ・ランプ・プラトーパターンを持つ。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:00:03 GMT)
Manipulating Tangible Virtual Object Dynamics to Promote Learning of Precision Force Generation [0.0] そこで本研究では,有形仮想物体の運動力学を演算することで,身体感覚系を動作させながら,正確な力制御を訓練できることを示す。
カーリングにインスパイアされた50名の健常者を対象に,仮想バネを張って目標放出力を発生させる実験を行った。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:51:49 GMT)
Maat: The Agentic Legal Research Assistant for Competition Protection [0.0] Maatは、研究プロセスのさまざまなタスクに対応するツールをオーケストレーションする。
RAGを信頼性に用いた公式資料の事例と調査結果を根拠にしている。
リッチなインライン引用を提供し、データベースのカバレッジが不十分な場合、Web検索にフォールバックし、ユーザに明確化を促す。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:38:26 GMT)
MST-Direct at Scale: Multivariate and Conditional Geostatistical Simulation via Sinkhorn Optimal Transport [0.0] MSTDirect Matching-via-Sinkhorn-Transportは統計学シミュレーションの新しい手法である。
関節分布をゼロ誤差で再現し、ハードデータを正確に尊重し、所定の空間相関構造を正確に再現する。
その結果、MSTDirectはゼロ誤差で関節分布を再現し、ハードデータを正確に尊重し、所定の空間相関構造を正確に再現することがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:20:06 GMT)
MATBG Josephson diode as an universal thermal machine [0.0] ゲート可変な谷分極弱結合を持つマジックアングルねじれ二層グラフェングラフェン接合(MATBG-JJ)は、固有のジョセフソンダイオード効果を示す。
我々は、谷分極ポテンシャル$_v$が主制御パラメータとして作用する量子スターリング(QSC)、オットー(QOC)、カルノー(QCC)の熱力学サイクルを構築する。
以上の結果から,MATBG Josephson ダイオードプラットフォームは,電気的に調整可能な量子熱機械や非相互超伝導熱トロニクスへの有望な経路として確立された。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:28:19 GMT)
Learning Compositional Symbolic Task Rules from Demonstrations with Inductive Logic Programming [0.0] 帰納論理プログラミング(ILP)を用いたロボットタスクの表現と学習方法を示す。
実証や事前(ドメイン)知識から象徴的なルールを推論し、より高いレベルのタスク構造を学ぶ際に学習したルールを再利用する。
これらの結果は,非分解型LPがタスクレベルLfDに対する実現可能なアプローチであることを示す予備的証拠を提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:45:29 GMT)
Lattice-Trapped Atom Interferometry with a Bose-Einstein condensate: Observation and Control of Interactions [0.0] 1次元光学格子に閉じ込められた原子波束による精密干渉は、力や場の量子センシングにおける創発的パラダイムである。
本稿では,弱い相互作用を示すボース・アインシュタイン凝縮体から2本の腕を発生させる格子トラップ型干渉計の実現について報告する。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:56:47 GMT)
Knowledge Graphs as the Missing Data Layer for LLM-Based Industrial Asset Operations [0.0] LLMをベースとした産業資産運用のエージェントは、フラットなドキュメントストアに対する推論において、限られた精度を示す。
AssetOpsBenchは、CouchDB、YAML、CSVが支援する139の産業保守シナリオにおいて、GPT-4エージェントが65%を達成することを証明している。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:31:46 GMT)
Iterative Causal Discovery: Per-Edge Impossibility Certificates, Tier-Aware Oracle Queries, and the $1+K$ Lower Bound [0.0] 因果発見アルゴリズムは有向グラフを返すが、データによって識別されるエッジ方向と、識別された仮定なしで割り当てられたエッジ方向を区別する原則的な手段は提供しない。
本稿では,各候補エッジに個別の不確実性証明を添付した連続データに対する観測因果発見プロトコルを提案する。
2つのオラクルプリミティブ、メタハブクエリとノードチャイルドクエリは、DAGを回復するのに十分な1+K$のエキスパートインタラクションの上限を共同で確立する。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:01:32 GMT)
It's Not the Capability: Harness Sensitivity Is Non-Monotone Across LLM Agent Tiers [0.0] LLMエージェントのデプロイメントにおける一般的な仮定は、より構造化されたハーネスは信頼性を普遍的に改善する、というものである。
我々はこの仮説を,4つの能力層にまたがる6つのモデルにまたがる制御された432回の実験により検証した。
我々は6ラベルの障害分類を導入し、form_violationが有能なモデル障害を、 wrong_fileが低能力な障害を、それぞれ支配していることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:08:41 GMT)
Inverse Control Constrained Optimization of Vessel Speed Decisions Under Environmental Risk: Evidence from Arctic Shipping [0.0] Tug TowとCargoは、環境および生態的な考慮と運用速度のバランスをとる。
漁船、旅客船、未特定船を含むいくつかの船群は、氷関連リスクの影響を強く受けている。
エンジンによる支配的な状態は明確なトレードオフを示すが、地上や未定義のような他の状態は氷関連の制約によって強く形作られる。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:46:27 GMT)
Intermittency and metastable dark states as a resource for continuous sensing [0.0] 実際には、放出されるクオンタのごく一部しか検出されず、達成可能な感度が低下する。
我々は、コヒーレント結合と散逸過程が競合する少ないレベルのシステムを考える。
両現象は検出に有用であるが,その相対的性能は検出効率に大きく依存している。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:20:24 GMT)
Intent-based Security Management Using the TM Forum TR292I Security Ontology [0.0] 本稿では,TMフォーラムTR292Iセキュリティオントロジー v4.0.0の設計と標準化に基づく,宣言的かつ自律的な自己保護フレームワークを提案する。
提案手法では,動作中の脅威を動的に中和するために,Description Logic (DL) と自動グラフ推論をクローズドループ実行パイプライン内で利用する。
我々は、分散Denial of Service(DDoS)攻撃緩和シーケンスを分解したNext-Generation NodeBスライス上に構築した構造的形式検証ウォークスルーを通じて、モデル駆動アーキテクチャを検証する。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:35:01 GMT)
Intelligence as Managed Autonomy: Failure, Escalation, and Governance for Agentic AI Systems [0.0] 本稿では,非有界自律のアーキテクチャ的脆弱性について考察する。
この理論をSMARtモデル(Stable、Meta-cognitive、Assisted、Regulationの4層フレームワーク)を用いてインスタンス化する。
自律ライフサイクルにおける障害管理の形式化は、信頼性と管理された人工知能の実現に向けた重要なステップである、と結論付けます。
論文参考訳(メタデータ) (Tue, 26 May 2026 19:49:23 GMT)
Inhomogeneous Light-Matter Coupling as a Resource for Noiseless Quantum Memory [0.0] 2レベル系の不均一アンサンブルは、基本的な光物質物理学および量子ネットワーク応用において重要である。
我々は,このようなシステムにおける集合力学の直観的かつ解析的な記述を提供する一般的な導波管モデルを開発した。
エコーに基づく量子記憶の場合、このモデルは断熱パルスによるノイズ・エチョ抑制の物理的起源を明らかにする。
絡み合い発生のため、同じ機構は、未探索のロバスト制御パルスの制限を露呈し、新しい複合パルスプロトコルをもたらす。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:52:38 GMT)
Inducing Calmness With Pocket-Sized Robotics: Reducing Movement and Heart Rate in Children through Hand-Held Tactile Interactions [0.0] 本稿では,ポケットサイズの触覚デバイスとの相互作用が,落ち着きの生理的・行動的指標に与える影響について検討する。
我々は、手持ちのリズミカルな振動マッチングゲームを通じて、子供たちをエンゲージする装置を採用し、注意を集中させ、静性を奨励するように設計されている。
その結果,触覚ゲーム相互作用は生理的覚醒と身体的無力感を減少させることがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:06:48 GMT)
Hubness, Not Anisotropy, Drives Cross-Lingual Retrieval Asymmetry in Multilingual Embedding Models [0.0] 我々は、英語、バングラ語、ヒンディー語、アラビア語で6,518の慣用表現のコーパスを用いて、この失敗を互いに最も近い隣の相互関係の欠陥として定式化する。
我々は、多言語空間の幾何学的病理学の中で、異方性ではなく、ハブ性、遠心性ドリフト、大きさが支配的な因果ドライバーである、という単一の力学的主張を検証した。
多言語埋め込みパイプラインのデフォルト検索基準として,コサイン類似性をCSLSに置き換えることを推奨する。
論文参考訳(メタデータ) (Tue, 26 May 2026 05:48:38 GMT)
How Students (Mis)understand Conditionals and Loops -- A Taxonomy [0.0] 本稿では,初心者プログラマの難易度を分類する微粒な分類法の設計と開発について述べる。
主な貢献は、異なる学生の難易度を明確に区別することと、一般的な学生の誤解を詳細に分析することである。
この分類は、学生の誤りを分類し分析するための調和した枠組みを提供することで、コンピューティング教育研究者を支援することを目的としている。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:53:53 GMT)
Hierarchical Prompt-Domain Control and Learning for Resource-Constrained Agentic Language Models [0.0] 大規模言語モデルはエージェントシステム内にますます展開されている。
本稿では,要求された出力スキーマを学習するために,まず,コンパクトなモデルを蒸留する階層的な制御・学習フレームワークを提案する。
非階層的,蒸留専用,非蒸留ベースラインに対する信頼性とコスト効率の向上を示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:23:30 GMT)
Grounded Cache Routing for Retrieval-Augmented Generation: When Is It Safe to Reuse an Answer? [0.0] 我々は、4つの安価なゲートが同時に保持されている場合にのみキャッシュされた応答を許容するエビデンス検証キャッシュルータであるGroundedCacheを提案する。
我々は、ヒットレートだけでなく、キャッシュ安全性をストレステストする6段階のワークロードを構築し、オペレーター向けメトリックであるunsafe-served rate (USR)を導入する。
2つのデータセットと12,000の実LLM世代(Qwen2.5-7B-Instruct on vLLM with Automatic Prefix Caching)、GroundedCacheはUSRをすべてのHotpotQAシステムで0.0%、mtRAGドキュメントドリフトで1.5%まで駆動する。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:50:02 GMT)
Governed Evolution of Agent Runtimes through Executable Operational Cognition [0.0] 本稿では,マルチエージェントシステムにおける実行時の進化を,実行可能な動作認識を通じて制御するフレームワークを提案する。
実行時適応を制限のない自己修正として扱うのではなく、提案されたフレームワークは、永続的な操作メモリ上のバウンダリでオブザーバブルなプロセスとして進化をモデル化する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:36:48 GMT)
Geometric Protection of Bipartite Entanglement in Hopf-Linked Quantum Rings [0.0] 我々は、ディープ・インターロックされたホップ結合量子環における相互作用する2つの電子の両部絡み合い境界を決定する。
これは正パリティベル状態を幾何学的に分離する正確な連続空間対称性を同定する。
解析の結果,メソスコピック半導体アーキテクチャのスケーリング限界が明らかになった。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:00:21 GMT)
Generative artificial intelligence and the marginalization of minoritized knowledges in higher education: the case of disability [0.0] 生成的人工知能は、科学的知識が作り出され、検証される過程を再構築することで、高等教育を再定義する。
これらのシステムは中立的ではなく、非ヘゲモニックな認識論の限界化に積極的に貢献する。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:39:09 GMT)
GenSBI: Generative Methods for Simulation-Based Inference in JAX [0.0] 流れと拡散生成モデルは、シミュレーションに基づく推論のための広く採用されている密度推定器として確立されている。
最も広く使われているSBIライブラリはPyTorchベースであり、ネイティブオプションなしでJAXでフォワードモデルと分析パイプラインを開発する研究者を残している。
我々は、完全にJAXで拡散するフローマッチング、スコアマッチング、およびデノベーションを実装したオープンソースのライブラリGen SBIを紹介します。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:59:59 GMT)
Gaussian Process-based learning with new MCMC-based implementation of Wishart prior on correlation matrix [0.0] 共分散行列に先立って自己組立のウィッシュアートを開発する。
また、MCMCを用いたカーネルハイパーパラメータのベイズ推定も行う。
その結果、共分散行列の直接的事前仕様は弱情報入力の診断に有用であることが示唆された。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:37:18 GMT)
Function-Valued Causal Influence in Nonlinear Time Series [0.0] 時系列における因果発見は非線形機械学習モデルを用いてますます行われているが、結果として生じる因果関係はほとんど常にスカラーエッジスコアによって要約される。
このプラクティスは、非線型自己回帰モデル(状態依存関数)によって学習された真の対象を曖昧にしている、と我々は主張する。
我々は,加法的,寄与分解可能なアーキテクチャに対する関数値因果関係を定式化し,スカラー因果関係のスコアが深刻な情報のボトルネックとなることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 00:34:49 GMT)
From Norms to Indicators (N2I-RAG): An Agentic Retrieval-Augmented Generation Framework for Legal Indicator Computation [0.0] 本稿では,N2I-RAGを提案する。N2I-RAGは,法定指標の計算を自動化するために設計されたエージェント検索拡張生成フレームワークである。
適応的な検索,llmベースのエージェント,検証機構をモジュールパイプラインに統合し,各コンポーネントがエビデンスをフィルタリング,検索,評価を行う。
我々は,N2I-RAGを,スキャンおよびデジタルソースを含む内部構築されたフランスの海洋環境法コーパスを用いて評価した。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:21:48 GMT)
Foundations of a Time-Consistent Counterfactual Actuarial Runtime for Autonomous AI Agents [0.0] 本稿では,自律型AIエージェントのための実行時アクチュエーター層を提案する。
副作用を含むすべてのアクションは、契約的に固定されたセーフデフォルトに対して、時間的に一貫性があり、反ファクト的なリスク料金を課します。
論文では、プリミティブな契約、料金の同一性、バウンダリ内の非アービタージュ結果、そしてこれら後の層が依存する予算保証について述べる。
論文参考訳(メタデータ) (Tue, 26 May 2026 03:47:58 GMT)
Forward-Looking Stress Testing Under Macro Scenarios: Stable SVaR Estimation Using a Hybrid GPR-HS Framework with SACS [0.0] 本稿では,Hybrid Gaussian Process Regression Historical Simulation (GPR-HS) フレームワークを前向きのストレスシナリオに拡張する。
主要な貢献は、ストレス共分散を歴史的危機体制の重み付け集合として構成するシナリオ平均共分散安定化(SACS)フレームワークである。
その結果,SACS を用いた GPR-HS は SVaR と SES の推定を CCAR および ICAAP アプリケーションで行うための安定かつ規制の整ったアプローチとしてサポートした。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:02:45 GMT)
Formalization of Malagasy conjugation [0.0] Unitexプラットフォームを使用し、マダガスカルの単純な動詞の電子辞書の翻訳を構成した。
動詞幹の形態変化と屈折接尾辞の組み合わせは有限状態トランスデューサで定式化される。
辞書とトランスデューサの設計は可読性を優先し、言語学者によって拡張および更新することができる。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:19:59 GMT)
Finite-temperature crossover from coherent magnons to energy superdiffusion in the PXP model [0.0] PXP鎖は、最近、カルダル・パリ・チャンのようなスケーリングで超拡散エネルギー輸送を示すことが示されている。
このモデルにおける有限温度エネルギー輸送は超拡散の出現の窓となることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:02:35 GMT)
Explainable Comparison of Feature-Based and Deep Learning Models for TROPOMI Methane Plume Screening [0.0] メタン・プラムのように見えるトロポミ・プラムは全て、実際の放出の結果ではない。
本研究では,特徴量ベース (SVC) モデルと画像ベース (ResNet-18, ResNet-34) モデルを比較した。
論文参考訳(メタデータ) (Tue, 26 May 2026 16:17:02 GMT)
Exceptional points in diamond optomechanics [0.0] 我々はダイヤモンドの光学結晶において例外的な点にチューニングする。
その結果、非エルミート光学の基盤としてダイヤモンド光学結晶が確立された。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:09:24 GMT)
Examining the Challenges of Intellectual Property in AI-Generated Productions [0.0] 最も重要な問題は、人間の創造者がいない場合の道徳的・経済的権利の所有に関するものである。
本稿はまず、この領域における理論基盤と既存の文献を概観し、イランの法的枠組みを比較検討する。
この発見は、現在のイランの法的枠組みの中で、重大な規制上のギャップを顕在化している。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:22:52 GMT)
Exact Solution for Non-Hermitian Free Fermions: A Case Study of the XY Chain [0.0] 異方性境界が複素値に拡張されたとき、開条件を持つ非エルミート境界スピン鎖を考える。
複素異方性平面の分岐点として例外点 (EPs) が作用し, 周囲の固有点や固有点の特性が変化することを示した。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:30:22 GMT)
Evolutionary Data Theory: On the Similarities between Data Problems and Evolutionary Games [0.0] この進化的解釈は、一意の静止点への収束を証明することによって、普遍的に意味があることが示されている。
多目的最適化の基本的な例は、関連する分布問題と同様に示される。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:24:51 GMT)
Evolution of Hypoequilibrium States in Steepest Entropy Ascent Models for Nonequilibrium Quantum Thermodynamics [0.0] この研究は、遠方平衡緩和と輸送過程の低次モデリングのための公式な基礎を提供する。
以前は様々な物理・化学系にまたがって適用されていた方法論を支持している。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:27:09 GMT)
EpiCurveBench: Evaluating VLMs on Epidemic Curve Digitization [0.0] EpiCurveBenchは、様々な公衆衛生ソースから収集された1000の現実世界の流行曲線のベンチマークである。
EpiCurveSimilarity (ECS) は、動的プログラミングによって予測された直列と直交する評価指標である。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:48:29 GMT)
Entangling power and fidelity diagnostic for bipartite quantum channels [0.0] 固定シュミット係数の局所単位軌道上における等局所次元の平均忠実度は、平均入力出力忠実度と積入力に対する制限によって完全に決定されることを示す。
また,2ビットチャネルに対する収束および負性に基づくエンタングルパワーを導入し,局所的な後処理下での凸性と単調性を証明し,従来提案されていた線形エントロピー量とは異なり,すべての分離可能なチャネルに対して消滅することを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:25:54 GMT)
Encrypted Cloning, Absolute Maximal Entanglement and Quantum Secret Sharing [0.0] ワイル・ハイゼンベルク変位作用素に基づく任意の次元のフレームワークを開発する。
2組の信号ノイズキューディットペアからなる暗号化されたキューディットシステムは、任意の次元における5次元のAME状態と等価であることを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:24:54 GMT)
Effects of stickiness in quantum chaotic billiards with $n$-fold symmetry [0.0] 回転対称性のみを示すビリヤードの族を研究する。
古典的な見地からすると、これらのビリヤードの形状は、位相空間の特定の部分領域をカオス軌道によってより頻繁に訪れることを可能にする。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:13:35 GMT)
Document Classification Pattern Recognition via Information Fusion: A Systematic Review of Multimodal and Multiview Representation Approaches [0.0] 情報融合は文書分類を改善するために用いられる。
この分野には、統一されたフレームワーク、その効果の定量的な合成、実践者のための明確なガイダンスが欠落している。
このレビューの主な貢献は、統一フレームワーク、最初の定量的エビデンスベース、データ駆動ガイドラインである。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:08:53 GMT)
Do Models Know Why They Changed Their Mind? Interpretability and Faithfulness of Chain-of-Thought Under Knowledge Conflict [0.0] 言語モデルがその訓練知識と矛盾する文書を見た場合、その文書に従うか、自分自身を信頼するかを選択する必要がある。
CoTの推論は、反対の判断に対して非常に安定しています。
しかし、自己評価の自信はかすかなシグナルを持っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:46:04 GMT)
Distinguishing Bohmian contextuality from Kochen-Specker contextuality [0.0] 量子文脈性(Quantum contextuality)は、測定結果が測定コンテキストに依存するという隠れテクスチャ理論の特性を記述する。
測定コンテキストという用語は異なる意味を持ち、量子テクスチュアリティの異なる風味を生み出す。
最近提案された Convariable Ontological Model (COM) は、KSの文脈予測を生成するが、ボヘミアの文脈性は持っていない。
論文参考訳(メタデータ) (Tue, 26 May 2026 06:52:15 GMT)
Dissipation-assisted preparation of Floquet-Laughlin states in superconducting circuits [0.0] フラクタルチャーン絶縁体(FCI)は、分数量子ホール系の格子アナログである。
分散制御は、駆動された漏れキャビティモードとの結合によって達成される。
2粒子、3粒子、6粒子の系では、制御方式の柔軟性により、分数量子ホールシグネチャの検出が可能となる。
論文参考訳(メタデータ) (Tue, 26 May 2026 13:07:47 GMT)
DinoComplete: 3D Shape Completion with Distilled Semantic Priors and State Space Models [0.0] 本稿では,Dino特徴から抽出したセマンティックプリエントを用いて幾何学的再構築を行うフレームワークであるDinoCompleteを紹介する。
未確認のShapeNetカテゴリとScanNetオブジェクトの実験により、DinoCompleteは、以前の決定論的および生成的ベースコンプリートメソッドよりも高いコンプリート品質を達成することが示された。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:40:52 GMT)
Diffusion-Based Ukrainian Handwritten Text Generation with Cross-Domain Style Transfer [0.0] ウクライナ文字の連結分割, 品質フィルタリング, ターゲットオーバーサンプリングを用いて, 308 人の書き手による 126,177 個の画像のウクライナ語手書き語データセットを構築した。
我々は、CANINE条件付き潜伏拡散U-Netを用いてMobileNetV2三重項型エンコーダを再訓練し、ラテン文字からキリル文字への直接転送をテストする。
クロスドメイン・スタイル・トランスファーは,英語サンプルからのクロスランガル・トランスファー,ゼロショット・トランスファー,20世紀初頭のウクライナの写本へのゼロショット・トランスファー,現代作家のわずかな模倣の3つの設定で評価した。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:28:21 GMT)
Developing an Intelligent Job Recommendation System Using Semantic Retrieval and Explainable AI Techniques [0.0] 本研究では, TF-IDF語彙マッチング, Sentence-BERTセマンティック検索, クエリ認識フィルタリング, オプションのクロスエンコーダの再ランク付け, 説明生成を組み合わせたメタデータ駆動型ジョブレコメンデーションシステムを提案する。
31262レコードを含むクリーニングLinkedInジョブポストデータセットで実施された実験は、最高のハイブリッド構成が精度を10スコアで0.8032、nDCGを0.9496で達成したことを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:16:42 GMT)
Deterministic Mapping of Topological Phases via Autoregressive Exogenous Neural Networks [0.0] NAR、NARX、NIOという3つの動的ニューラルネットワーク(NN)アーキテクチャが評価されている。
NARXは予測精度に優れており,平均正方形誤差(MSE)は10~27ドルである。
NARXモデルの精度がより高い遅延で崩壊する「複雑パラドックス」を観測する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:11:22 GMT)
Design of a Real-time Asynchronous Monocular Odometry for Planetary Exploration [0.0] 惑星探査のためのリアルタイム非同期イベントベース単分子オードメトリー
カメラ状態はリアルタイム非同期機能トラッカーであるRATEが生成するすべての追跡された位置で更新される。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:25:33 GMT)
Customer Churn Prediction on Structured Data Using FT-Transformer and Stacking Ensembles [0.0] 本研究では,特徴量変換器(FT-Transformer)をキャリブレーション積み重ねによる勾配木と統合したハイブリッドアーキテクチャを提案する。
提案手法は, 統計的検証, 確率, キャリブレーションの持続的ギャップに対処し, 先行研究で確認された。
パブリックバンクチャーンデータセットでは、ハイブリッドモデル62.10% F1、0.861 AUC-ROC、0.647 PR-AUCがMulti-Layer Perceptron(MLP)ベースラインを3.37 F1ポイント、0.027 AUCを95%の信頼区間で上回っている。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:02:38 GMT)
Cross-Modal Action Recognition in Egocentric Video Using Mamba: Integrating RGB and Hand Skeleton Streams via CLS Token Fusion Strategies [0.0] 本稿では,RGBビデオと時間的手関節データを組み合わせたクロスモーダルアーキテクチャを提案する。
私たちのアーキテクチャは,視覚的特徴抽出のためのVideoMambaモジュール,Mambaブロックのスタック上に構築されたスケルトンエンコーダ,両モジュールを単一の表現に統合する融合モジュールの3つのコンポーネントで構成されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:04:01 GMT)
Clinical Validation of the Melanoscope AI Mobile Dermoscopy Clinical Decision Support System [0.0] 悪性皮膚病変の早期発見は予後に重要である。
ロシアでは皮膚科医の不足が検診範囲を制限している。
モバイル皮膚科の臨床診断支援システムは有望なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:29:53 GMT)
Chaos-SSL: An Attention-Based Self-Supervised Learning Framework with Chaotic Transformation for Medical Image Classification [0.0] 自己監視学習(SSL)は、大規模な注釈付きデータセットへの依存を軽減するための強力なパラダイムとして登場した。
本稿では,医療画像分類のための新しい2段階フレームワークであるChaos-SSLを紹介する。
以上の結果から,30時間でテントマップを事前学習したChaos-SSLモデルは,注目融合に続き,最先端技術と完全に競合することを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:10:00 GMT)
Chain-based Adaptive Reconfiguration Over Lattices for Hallucination Reduction [0.0] CAROLは、大規模言語モデルにおけるテスト時幻覚の低減のための確率的フレームワークである。
CAROLは、生成された応答と信頼できるコンテキストの間の一貫性に基づいた意味的不確実性尺度を定義する。
CAROLは単一のフレームワーク内で幻覚の検出と緩和を統一する。
論文参考訳(メタデータ) (Tue, 26 May 2026 21:28:51 GMT)
Capability and Robustness Cannot Both Be Free: An Information-Theoretic Bound for Vision-Language-Action Models [0.0] VLA(Vision-Language-Action)モデルは、予測されたアクションが実行され、障害毎に安全コストがかかる実際のロボットにますますデプロイされる。
OpenVLA-7Bに対する$16/255$のPGD攻撃は、LIBEROの成功を95%以上から5%以下に下げる。
実証的な防御は、清潔な正確さを犠牲にしてある程度の堅牢性を取り戻すが、このトレードオフが理論的なフロアを持つかどうかは文献では定かではない。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:37:48 GMT)
Calibrated Inference for the Conditional Average Treatment Effect in the Few-Placebo Regime via Gaussian Processes [0.0] 片方の治療用アームが他方よりもはるかに小さい,少数のプラセボ系について検討した。
それらは、その名目レベルよりも、真の効果をほとんど含まない。
本稿では,各アームの結果面をガウス過程でモデル化するGP-CATEを提案する。
論文参考訳(メタデータ) (Tue, 26 May 2026 11:18:42 GMT)
Beyond the Data Mesh Illusion: Designing Modern AI-augmented Lakehouses to Bridge the Gap Between Theory and Practice [0.0] エンタープライズデータプラットフォームは、ドメインのセルフサービスと全体的ガバナンスの間の永続的な緊張に直面します。
本稿では,近代的なレイクハウスアーキテクチャ上に構築されたAI強化ハブ・アンド・スポークモデルにより,柔軟性と制御のトレードオフを緩和することができることを論じる。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:00:57 GMT)
Beyond Binary: Speech Representations Across the Cognitive Score Hierarchy [0.0] 課題,領域,世界レベルという3つのスコアレベルにまたがる6つの認知タスクを評価した。
その結果、SSL表現は一般的に手作りの特徴を低いレベルで上回っているが、この傾向はMCI分類では逆であることがわかった。
論文参考訳(メタデータ) (Tue, 26 May 2026 15:40:43 GMT)
Benchmarking Quantum Annealing for a Greenhouse-Inspired Control QUBO [0.0] 2値ヒータスケジューリングのための2値制約のない2値最適化問題に対して,電流アニーリングに基づく最適化をベンチマークした。
メインの1日インスタンスでは、すべてのソルバ出力をヒータースケジュールに復号し、元の温室シミュレータで評価する。
テストされたD-Wave Leap Hybrid BQMワークフローは信頼性が低く、15~60秒の要求時間制限下では古典的なベースラインを上回りません。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:45:10 GMT)
Benchmarking Patent Embeddings: A Multi-Task Evaluation of 22 Models Across Retrieval, Classification, and Clustering [0.0] 我々は,情報検索,分類,クラスタリングという3つのタスクに対して,事前学習した22の埋め込みモデルを評価する。
2つの結果は、一般的な知恵に疑問を投げかけている。
論文参考訳(メタデータ) (Tue, 26 May 2026 04:08:36 GMT)
Basis-Adaptive Sparse-State Simulation of Quantum Circuits [0.0] 我々はBasis-Adaptive Sparse-State Simulation (BASS)と呼ばれるアルゴリズムを導入する。
BASSは、回路全体の計算ベースをロックするのではなく、実行中に各キュービットのローカル表現ベースを更新する。
構造化レンガ加工回路では、BASSは固定基底法よりもかなり高い忠実性を達成する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:02:39 GMT)
Backdoor Attacks on Fault Detection and Localization in Cyber-Physical Systems [0.0] サイバー物理システム(CPS)は、センシング、通信、計算、制御を統合し、スマートグリッド、産業自動化、制御システムを含む重要なインフラをサポートする。
マシンラーニングとディープラーニングに基づく障害検出とローカライゼーションフレームワークは、最近、CPSにおいて、異常と運用上の障害をリアルタイムで識別する能力において、大きな注目を集めている。
本稿では,最新のCPSシステムで使用されている最近のMLパイプラインにおいて,障害検出および位置決め機構に対するバックドア攻撃の脅威について検討する。
論文参考訳(メタデータ) (Tue, 26 May 2026 20:49:42 GMT)
Autonomous oscillations in quantum electromechanics: tensor network treatment [0.0] 電気機械系における輸送誘起自己持続振動は、静電気化学的バイアスを頑健で自律的な運動に変換する。
振動モードのバイナリ表現とメソスコピックな貯留層埋め込みを組み合わせたテンソル・ネットワークの枠組みを定式化する。
幅広い操作条件における機械的自己振動の出現を実証する。
論文参考訳(メタデータ) (Tue, 26 May 2026 17:35:54 GMT)
Automating Formal Verification with Agent-Guided Tree Search [0.0] 形式的検証は、ソフトウェアを確実に修正する道を提供するが、検証済みのコードを書くのに十分な費用がかかるため、本番ではほとんど使われない。
最近のベンチマークでは、仕様をコードに変換する能力と、マシンチェックによる正確さの反復を計測している。
この論文は、リーンにおけるLCM駆動による検証コード生成の状況を評価し、パフォーマンスを改善するための検索ベースの手法を開発する。
論文参考訳(メタデータ) (Tue, 26 May 2026 14:50:47 GMT)
Assessor Experiences in CMMC Level 2 Certification Assessments: An Interpretative Phenomenological Analysis of Role Expectations [0.0] 本研究は,CMMC認定評価者の生活経験と,非競合モデルにおける役割期待のナビゲートについて検討した。
発見は、評価者が競合する期待を和らげるために技術的能力、手続き的規律、境界管理戦略に頼っていることを示している。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:56:40 GMT)
Anonymous YARA Rules Are Not Anonymous [0.0] YARAルールは、マルウェアに対する集団防御を可能にするために、脅威情報コミュニティ間で広く共有されている。
この仮定の有効性を評価するため,YARAルールテキストのみから,どれだけの量の推定が可能かを評価する。
論文参考訳(メタデータ) (Tue, 26 May 2026 10:01:50 GMT)
Analytical Model of Clock Drift in Quantum Key Distribution and a Simple Synchronization Algorithm [0.0] 送信機と受信機のクロック間の周波数ミスマッチが量子鍵分布における量子ビット誤り率にどのように影響するかを示す。
我々のアルゴリズムは、検出タイムスタンプから直接、周波数ミスマッチとタイムオフセットの変動を継続的に補償する。
我々は16km大都市圏ネットワークで100km以上の繊維と24時間にわたる連続運転のキー交換を成功させることで,我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:46:23 GMT)
An IQP Born Machine for Calorimeter Image Generation at 64 Qubits with Compiled-IQP Deployment [0.0] 我々は、実際の高エネルギー物理カロリーのシャワー画像に64ドルキュービットで即時量子時間(IQP)ボーンマシンを訓練する。
トレーニングされたモデルを1つのサンプリングハードIQP回路にコンパイルし、量子展開を行う。
論文参考訳(メタデータ) (Tue, 26 May 2026 22:18:55 GMT)
AgensFlow: A Coordination-Policy Substrate for Multi-Agent Systems [0.0] AgensFlowは、部分的な可観測性の下でのオンラインポリシー学習問題としてマルチエージェントコーディネーションを扱う。
AgensFlowは、分散システムインシデントタスクとセキュリティ管理者タスクの2つのコーパスで評価されている。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:10:52 GMT)
Adaptive Reinforcement Learning for Robust Open Quantum System Control: A Multi-Task Framework with Temporal Optimization [0.0] 多様なハミルトン系におけるオープンシステム量子制御のための多タスクソフトアクター・クリティカル(SAC)強化学習フレームワークを提案する。
51のハミルトン変量に対する実験結果から、マルチタスクSACモデルが制御パルスを生成可能であることが示された。
論文参考訳(メタデータ) (Tue, 26 May 2026 12:20:55 GMT)
A tutorial on Dirac quantisation by analysing the problem of a ball on an inclined plane as a Hamiltonian system with constraints [0.0] 本稿では,ハミルトン系のディラック量子化を制約付きで詳細に検討・解析する。
この系のハミルトン作用素の物理的ヒルベルト部分空間に対する制約がシュルディンガー方程式を再現することを実証する。
論文参考訳(メタデータ) (Tue, 26 May 2026 07:42:09 GMT)
A multilevel tensor network compression technique for simulating Lindblad dynamics in superconducting circuits [0.0] 本研究では,超伝導量子回路に着目したボソニックモードのリンドブラッド力学をシミュレートする手法を開発した。
この手法は、(i)密度行列が純度から遠くないか、(ii)異なるモード間の絡み合いが適度である、という2つの非常に一般的な状況を検出し、活用する。
本研究では, 大型猫量子ビットのシミュレーション技術およびトランスモン量子ビットの電離化技術について紹介し, ブルート力のアプローチに関して, マグニチュード・オブ・マグニチュード・スピードアップを示す。
論文参考訳(メタデータ) (Tue, 26 May 2026 18:00:04 GMT)
A Paired Testing Protocol for Batch-Conditioned Refusal Robustness in LLM Serving [0.0] 言語モデルの安全性評価は、サービス構成を固定されたバックグラウンドインフラストラクチャとして扱うことが多い。
我々は4つのアーティファクト支援研究をペアテストプロトコルに合成する。
標準vLLMは、現在のスコアフリップ候補に対して22/55ラベルのフリップを再生し、VLLM_BATCH_INIANT=1を有効にすることで、同じテストを0/55フリップに削減する。
論文参考訳(メタデータ) (Tue, 26 May 2026 23:22:55 GMT)
A Gauge-Covariant Theoretical Framework for Non-Abelian Holonomy Estimation and Feed-Forward Correction in Time-Bin Photonic Qudits [0.0] 時間ビンフォトニック・クエット処理における非アベリア幾何学的歪みを推定・補正するための理論的枠組みを開発する。
この研究は、デバイス固有の転送行列、損失モデル、検出器モデル、実験キャリブレーションパイプラインを想定していない。
論文参考訳(メタデータ) (Tue, 26 May 2026 08:40:26 GMT)
A Dataset of Robot-Patient and Doctor-Patient Medical Dialogues for Spoken Language Processing Tasks [0.0] MeDial-Speechは、Med-AIのトレーニングと評価のための新しい音声データセットである。
ロボット患者と医師患者との対話から現実的な環境下で収集した。
健康状態は、レヴィ・ボディー・認知症、心不全、肩痛、狭心症である。
論文参考訳(メタデータ) (Tue, 26 May 2026 09:21:54 GMT)