Tracking the Truth: Object-Centric Spatio-Temporal Monitoring for Video Large Language Models [154.4] 大規模言語モデル(ML)は高度な理解を持ち、シーンにおける幻覚の傾向が高い。
これは、時間的モニタリングの失敗、オブジェクトの動的アイデンティティ、状態、そして時間とともに関係を永続的に追跡する能力に起因している、と我々は主張する。
既存のベンチマークでは、局所的な視覚的手がかりや統計的先行によってしばしば解決される1つの最終回答クエリに頼って、この欠陥を曖昧にしている。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:32:36 GMT)
MLS-Bench: A Holistic and Rigorous Assessment of AI Systems on Building Better AI [92.8] MLS-Benchは、AIシステムが一般化可能なスケーラブルなMLメソッドを発明できるかどうかを評価するためのベンチマークである。
本研究では, エージェントの探索性能に及ぼすテスト時間スケーリング, 適応型計算アロケーション, コンテキストプロビジョニングの影響について検討する。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:29:46 GMT)
Non-Parametric Rehearsal Learning via Conditional Mean Embeddings [88.9] 本研究では,不必要な未来(AUF)問題をテキスト化するための非パラメトリックリハーサル学習手法を提案する。
具体的には、カーネル機械を用いてAUFの目的を、動作誘起分布変化から所望性モデリングを遠ざける統一表現に再構成する。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:30:52 GMT)
Soohak: A Mathematician-Curated Benchmark for Evaluating Research-level Math Capabilities of LLMs [86.5] Soohakは64人の数学者によって新たに書かれた439プロブレムのベンチマークである。
データセットは2026年後半に公開され、中間で要求に応じてモデル評価が利用可能になる。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:14:22 GMT)
LEAF: A Living Benchmark for Event-Augmented Forecasting [78.9] LEAFは、イベント拡張予測タスクの最初の生きたベンチマークである。
我々は最先端のプロプライエタリかつオープンウェイトなLLMを評価した。
LLMは、より予測し易いと自信を持って判断し、より優れたパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:17:59 GMT)
Control Your View: High-Resolution Global Semantic Manipulation in Learned Image Compression [69.7] 学習された画像圧縮(lic)は、ディープニューラルネットワーク(DNN)を統合して、高次元画像をコンパクトな潜在表現にマッピングする。
リックシステムは、下流の劣化、圧縮速度の低下、未ターゲットの歪み、局所意味操作(LSM)と低解像度(3times28times28$)のグローバル意味操作(GSM)に繋がる敵の摂動の影響を受けやすい。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:25:20 GMT)
FORTIS: Benchmarking Over-Privilege in Agent Skills [68.3] 2段階にわたるエージェントスキルの過剰な特権を評価するベンチマークを提案する。
過剰に特権化された行動は例外ではなく規範であることがわかった。
その結果、エージェント動作を含むスキル層は、それ自体が現在のシステムにおける特権エスカレーションの主要な源であることを示唆している。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:57:18 GMT)
Rethinking Event-Based Object Dtection through Representation-Level Temporal Aggregation and Model-Level Hypergraph Reasoning [65.1] イベントカメラはマイクロ秒レベルの時間分解能、低レイテンシ、高ダイナミックレンジを提供する。
既存のイベントベースのオブジェクト検出メソッドは、表現レベルとモデルレベルの両方で制限に直面します。
Ev-DTADは,表現レベルの時間エンコーディングとモデルレベルの時間ハイアグラフ推論を統合した統合EDDフレームワークである。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:20:34 GMT)
Large Language Models over Networks: Collaborative Intelligence under Resource Constraints [64.8] 大規模言語モデル(LLMs)は、スマートフォンアシスタントから自律運転まで、アプリケーションを動かす社会を変えつつある。
しかし、クラウドベースのLLMサービスだけでは、成長するアプリケーションのクラスには役に立たない。
本稿では、複数の独立したLLMがタスクレベルで協調するパラダイムである協調インテリジェンスに焦点を当てる。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:42:39 GMT)
HairGPT: Strand-as-Language Autoregressive Modeling for Realistic 3D Hairstyle Synthesis [62.9] HairGPTは、ストランドを生成的プリミティブとして扱うストランド中心のフレームワークである。
現実的な3次元ヘアスタイル合成を、二重分離自己回帰配列モデリング問題として定式化する。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:19:36 GMT)
X-Voice: Enabling Everyone to Speak 30 Languages via Zero-Shot Cross-Lingual Voice Cloning [62.7] X-Voiceは、任意の音声をクローンし、誰でも30の言語を話せる多言語ゼロショット音声クローンモデルである。
X-Voiceは国際音声アルファベット(IPA)を統一表現として420K時間多言語コーパスで訓練されている。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:00:12 GMT)
PnP-Corrector: A Universal Correction Framework for Coupled Spatiotemporal Forecasting [62.2] 既存の手法は複雑なエラーのボトルネックによって厳しく制約されている。
我々は-Cast-Corrector (Plug-and-Play Corrector)と呼ばれる普遍的なフレームワークを提案する。
本手法は,結合予測システムの長期安定性を著しく向上させる。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:12:33 GMT)
When Is Rank-1 Steering Cheap? Geometry, Granularity, and Budgeted Search [61.7] アクティベーションステアリングは、再トレーニングせずにLSMを制御する軽量な方法を提供するが、その効果は概念によって大きく異なる。
我々は介入層と係数に対する予算制約付き最適化としてランク1ステアリングを定式化する。
操作困難の原因の診断にアクティベーション幾何を利用するグラニュラリティおよび表現認識概念工学フレームワークである textitGRACE を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:26:49 GMT)
Gate-and-Merge: Zero-shot Compositional Personalization of Vision Language Models [60.3] 共起学習を必要とせずに作曲のパーソナライズを可能にするフレームワークであるGate-and-Mergeを紹介する。
パーソナライゼーションの間、各概念は、概念トークンと組み合わせた軽量のLoRAアダプタとして独立に学習される。
推定では,概念固有のLoRA更新を重み空間に直接マージすることで構成を可能にする。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:32:28 GMT)
Evidence Over Plans: Online Trajectory Verification for Skill Distillation [59.2] 後方蒸留指数 (Posterior Distillation Index, PDI) は、タスク環境証拠に蒸留技術がどの程度うまく根付いているかを測る軌跡レベルの指標である。
SPARKはPDIを計算するのに使用される環境検証トラジェクトリを生成する。
本研究では,SPARK生成スキルが非スキルベースラインを一貫して上回り,学生モデルにおける人書きスキルを上回っていることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:15:13 GMT)
Restoration-Aligned Generative Flow Models for Blind Motion Deblurring [57.4] 本稿では,フロー軌跡自体を再構成することで,不整合を解消するフレームワークであるDeFlowを紹介する。
この定式化の下では、標準フローマッチング損失は自然に残留損失の形を取る。
GoPro、HIDE、RealBlur、RWBIの実験では、DeFlowは強力な復元忠実性と知覚リアリズムを実現している。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:05:51 GMT)
SlimQwen: Exploring the Pruning and Distillation in Large MoE Model Pre-training [57.4] 大規模プレトレーニングにおけるMoE圧縮の体系化について検討した。
事前訓練されたMoEのプルーニングは、ターゲットアーキテクチャをゼロからトレーニングする上で、一貫して優れています。
我々は,一貫した利得が得られるマルチトークン蒸留(MTP)を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:50:35 GMT)
Ace-Skill: Bootstrapping Multimodal Agents with Prioritized and Clustered Evolution [57.0] 我々は,自己進化型マルチモーダルエージェントのためのロールアウトアロケーションと知識組織を共同で最適化する,共同進化型フレームワークであるAce-Skillを紹介する。
Ace-Skillは、プライオリティ化されたサンプルと遅延分解能のトラッキングを組み合わせることで、情報的かつ十分にマスターされたサンプルにロールアウトを集中させる。
サンプリングと組織化を改善することで、Ace-Skillは自己進化を、より情報に富んだロールアウトが高品質な知識を生み出す、活発なサイクルに変えます。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:12:54 GMT)
The Cancellation Hypothesis in Critic-Free RL: From Outcome Rewards to Token Credits [56.4] トークンレベルでの批判フリーなRLについて検討し,トークンフライング現象を明らかにした。
トークンの確率変化は、それ自身の利点によって完全に決定されないことを示し、他のトークンとの結合勾配相互作用も無視できない役割を担っている。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:07:20 GMT)
SimReg: Achieving Higher Performance in the Pretraining via Embedding Similarity Regularization [55.6] SimRegは埋め込み類似性正規化損失であり、各シーケンス内で同じ基幹ラベルを持つトークン表現をより類似させる。
分析の結果, この機構は多分類マージンを増大させ, より効率的な分類を可能にした。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:59:13 GMT)
Fast Rates for Offline Contextual Bandits with Forward-KL Regularization under Single-Policy Concentrability [54.4] emphKullback-Leibler (KL) 正規化は強化学習アルゴリズムにおいてユビキタスである。
近年の研究では、KLの逆正則化の下での意思決定において、$1$型高速速度が示されている。
我々は、この問題を解決するための第一歩として、フォワードKL正規化オフラインCBの合理化分析を行う。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:17:46 GMT)
SeasonScapes: Learning Large-scale Re-lightable 3D Landscapes with Seasonal Variation from Sparse Webcams [53.3] 季節変動を伴うスイススパースビューマウンテンシーンは,50km×60km以上をカバーしている。
SeasonScapesは、13のタイムスタンプにわたる32の異なる場所から1年を通して85,000以上のウェブカメラ画像で構成されている。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:24:32 GMT)
The Extrapolation Cliff in On-Policy Distillation of Near-Deterministic Structured Outputs [52.7] ListOPDは、パラメータの5分の1で8B-SFTベースラインで、学生をドメイン内に持ち込む。
Amazon Fashionでは、3つの事前登録テスト — 細粒度崖間隔テスト、小さなクリップのクロス予測 — がロックされた予測ウィンドウ内に落下し、グリッド解像度以下のクローズドフォーム予測に一致する小さなクリップ値が設定されている。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:48:00 GMT)
TMPO: Trajectory Matching Policy Optimization for Diverse and Efficient Diffusion Alignment [52.6] 本稿では,報酬を人間レベルの報酬分布マッチングに置き換えるトラジェクティブマッチングポリシバランス最適化(TMPO)を提案する。
TMPOは最先端の手法に対する生成的多様性を9.1%向上させ、下流および効率の指標で競合性能を達成する。
大規模フロープレフィックスのマルチトラックトレーニング時間を短縮するため、TMPOはDynamic Tree Smplingモデルを導入し、動的にスケジュールされたステップでトラジェクトリがdenoisingとブランチを共有する。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:41:02 GMT)
A Mean Curvature Approach to Boundary Detection: Geometric Insights for Unsupervised Learning [52.5] 本稿では,幾何学的機械学習に基づく新しい幾何学的フレームワークであるMean Curvature Boundary Points (MCBP)を紹介する。
MCBPはデータ多様体の固有曲率を明示的にモデル化し、原理化された多様体のパラメトリゼーションを必要としない点平均曲率を計算する。
合成および実世界のデータセットの実験により、MCBPはクラスタリング性能を一貫して改善することを示した。
論文参考訳(メタデータ) (Sat, 09 May 2026 18:51:10 GMT)
When and Why Grouping Attention Heads Accelerates Muon Optimization [51.9] 本研究は, ムオンが全注意投影, 個々の頭部, 中間頭部群に適用されるべきかどうかを検討する。
分析の結果,グループワイド更新によるグループワイド白化と,グループワイド白化によるグループワイド白化に伴う更新ノームコストとのトレードオフが明らかになった。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:06:31 GMT)
PG-LRF: Physiology-Guided Latent Rectified Flow for Electro-Hemodynamic PPG-to-ECG Generation [51.8] フォトプレチスモグラフィーはウェアラブルではユビキタスであるが、ECG特有の診断形態は欠如している。
既存の手法は統計アライメントとデータ駆動生成に依存している。
生理的誘導型潜在フローフレームワークであるPG-LRFを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:39:58 GMT)
Local LMO: Constrained Gradient Optimization via a Local Linear Minimization Oracle [51.7] Local Lは制約付き最適化のための新しいプロジェクションフリー型である。
局所LMOはGD(Gradient Descent)のオラクルと見なされる。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:03:24 GMT)
The Geometry of Forgetting: Temporal Knowledge Drift as an Independent Axis in LLM Representations [50.4] 大規模言語モデルは自信を持って時代遅れの回答を生成し、既存の方法では検出できない。
これは工学的な失敗ではなく構造的な失敗であり、時間的ドリフトは、幾何的に残留流の方向として、正確性と不確実性の両方に符号化される。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:27:31 GMT)
Unison: Harmonizing Motion, Speech, and Sound for Human-Centric Audio-Video Generation [50.4] We present Unison, a unified framework that promote coherence across the motion, speech, and sound modalities。
We show that Unison achieves state-of-the-art performance in audio perceptual quality and cross-modal synchro。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:32:54 GMT)
CauSim: Scaling Causal Reasoning with Increasingly Complex Causal Simulators [50.0] CauSimは、不十分なラベル問題から因果推論をスケーラブルな教師付きフレームワークに変換するフレームワークである。
CauSimは、実行不可能な因果的知識をコードに形式化し、データ拡張を可能にし、実行可能なSCMを自然言語に変換することで、表現を横断して動作する。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:39:26 GMT)
Beyond Thinking: Imagining in 360$^\circ$ for Humanoid Visual Search [50.0] Humanoid Visual Search (HVS)では、エージェントが没入型360$circ$環境を積極的に探索する必要がある。
Imagining in 360$circ$, a novel framework that decouples the exploration process into a special Imaginator and an Actor。
本研究では,意味空間の先行を明示的にモデル化することで,複雑な環境下での探索効率と成功率を大幅に向上させることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:10:53 GMT)
MDL-GBG: A Non-parametric and Interpretable Granular-Ball Generation Method for Clustering [49.9] MDL-GBGは最小記述長原理の下で局所モデル選択問題としてグラニュラーボール生成を再構成する。
各グラニュラーボールについて、3つの候補説明(シングルボールモデル、2ボールモデル、コアボール+リサイダーモデル)を比較する。
安定な粒状球形成後の剥離境界試料を世界規模で再評価するための残留再割り当て機構を導入する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:42:41 GMT)
GAMBIT: A Three-Mode Benchmark for Adversarial Robustness in Multi-Agent LLM Collectives [48.5] GAMBITは、インポスタ検出器を評価するための3つの評価モードと2つの独立したスコアを持つベンチマークである。
ベンチマークには、240の共進化型インポスタ戦略にまたがる27,804のラベル付きインスタンスのデータセットが付属している。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:07:23 GMT)
Fitting Is Not Enough: Smoothness in Extremely Quantized LLMs [46.9] 大規模言語モデル(LLM)は高いパフォーマンスを実現するが、高いデプロイメントコストがかかる。
既存の量子化アルゴリズムは主に前方計算の数値的精度の向上に焦点を当てている。
極端に量子化されたLLMは,数値的損失を超える系統的劣化に悩まされていることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:19:51 GMT)
RigidFormer: Learning Rigid Dynamics using Transformers [46.4] 本稿では,メッシュフリーの剛体力学を制御可能な統合ステップサイズで学習するオブジェクト中心トランスフォーマーモデルを提案する。
アンカーをベースとしたRoPEは,物体やアンカーの非秩序な性質を尊重しながら,アンカー幾何学を注意に注入する。
また,身体部位をオブジェクトレベルの相互作用として扱うことで,コマンド条件付き調音体への予備的拡張を示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:31:09 GMT)
DARE: Difficulty-Adaptive Reinforcement Learning with Co-Evolved Difficulty Estimation [45.9] 強化学習は、大きな言語モデルの推論能力を改善するが、コストがかかり、サンプル非効率である。
我々は,自己正規化重要度サンプリングを通じて,政策と難易度推定を共進化させるフレームワーク**Dare*を提案する。
複数のモデルやドメインにわたる実験では、**Dare**はトレーニング効率、最終的な有効性、推論効率において、既存のメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:05:59 GMT)
Rennala MVR: Improved Time Complexity for Parallel Stochastic Optimization via Momentum-Based Variance Reduction [45.9] 平均次元の滑らかさ仮定の下では、分散の低減は異種系の時間複雑性を改善することが示される。
本稿では、モーメントに基づく分散還元に基づくRennala SGDの分散還元拡張であるRennala MVRを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:46:59 GMT)
DRNet: All-in-One Image Restoration via Prior-Guided Dynamic Reparameterization [45.3] オールインワン画像復元は、単一のモデル内で多様な劣化を処理することを目的としている。
既存の方法は、しばしば3つの重要な制限に悩まされる。
DRNetは、パラメータ効率に優れた5つの復元タスクで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:43:00 GMT)
Modeling Decision-Making with Will for Cooperation in Social Dilemmas [45.0] 我々は,局所的な費用対効果変動を無視しつつ,目標を継続的に追求するメカニズムとして定義される「意志の枠組み」を提案する。
我々は、グループによるリスクの高い閾値を自律的に上回ることを可能にする「協力としての意志のあるエージェント」を示す。
これらの結果から,認知能力の協力により,計算を戦略的に制約することが示唆された。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:13:55 GMT)
CoDistill-GRPO: A Co-Distillation Recipe for Efficient Group Relative Policy Optimization [44.9] CoDistill-GRPOは、慎重に設計されたGRPO目標を最大化することによって、大きくて小さなモデルを訓練する。
本稿では,CoDistill-GRPOが,数学ベンチマークにおいて標準GRPOよりも小型モデルの性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:51:58 GMT)
Reasoning-Aware Training for Time Series Forecasting [44.6] Time Series Foundation Models (TSFMs) は数値予測では優れているが、定性的推論を欠いたブラックボックスとして運用されている。
テキストトークンライザは連続した数値を断片化し、数学的関係を劣化させ、配列の長さを爆発させる。
STRIDE (Strategic Time-Series Reasoning Injected by Distilled Embeddings) について紹介する。
STRIDEは離散トークンの代わりに、トレースの推論を軽量のLCMに蒸留し、ターゲットの数値エンコーダに先立って平均プールされた隠された状態をクロスモーダルとして動的に投影する。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:41:47 GMT)
Select-then-differentiate: Solving Bilevel Optimization with Manifold Lower-level Solution Sets [44.0] 楽観的な双レベル最適化について検討し、低レベル問題には非可解な最小値多様体が存在する。
楽観的な選択の特異性は十分であることを示す。
これにより、明示的な擬逆法に基づく超次数式が得られる。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:00:31 GMT)
From Articulated Kinematics to Routed Visual Control for Action-Conditioned Surgical Video Generation [43.4] 動作条件付き手術用ビデオ生成は、ロボット手術にとって非常に難しい問題である。
そこで本研究では,音声キネマティクスを5つの画像整列制御モダリティの統一集合に変換するキネマティクス対視覚リフティングパラダイムを提案する。
本手法は,多様なベースライン上での行動忠実度,視覚的忠実度,ドメイン間の一般化を継続的に改善する。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:48:51 GMT)
IPAD-CLIP: Teaching CLIP to Detect Image Local Perceptual Artifacts [43.4] 我々は、このギャップに対処するために、画像知覚アーチファクト検出(IPAD)タスクを形式化する。
IPADの主な課題は、これらのアーティファクトの局所的で微妙でセマンティックに弱い性質にある。
本稿では,CLIP上に構築された新しいフレームワークであるIPAD-CLIPを紹介する。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:04:41 GMT)
Generalization Bounds of Emergent Communications for Agentic AI Networking [43.0] 6GネットワークをエージェントAIネットワーク(AgentNet)システムへ移行するには、従来のデータパイプラインからタスク対応のエージェントAIネイティブな通信ソリューションに移行する必要がある。
本稿では,異種エージェント間の協調的タスク解決を容易にする新しい創発的コミュニケーションフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:15:34 GMT)
When to Trust Imagination: Adaptive Action Execution for World Action Models [42.5] 世界行動モデル(WAM)は、近ごろ、将来の視覚的観察と将来の行動を共同で予測することによって、ロボット操作のための有望なパラダイムとして登場した。
現在のWAMは、各モデル推論の後、一定の数の予測アクションを実行し、ロボットは、想像された未来が実際の物理的なロールアウトと一致しているかどうかを無視する。
我々は,将来性検証問題として適応型WAM実行を定式化し,WAM予測された未来が信頼性を保ちながらロボットはより長く実行すべきであり,現実が想像力から逸脱した場合にはより早く再計画する。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:59:29 GMT)
Do LLMs Experience an Internal Polylogue? Investigating Reasoning through the Lens of Personas [42.1] ポリログ(polylogue)という用語は、ペルソナベクトルと生成過程における隠れアクティベーションの間のアライメントの時系列を表す。
実験により,MMLU-Pro上でのポリログ特性は,低次元アクティベーションベースラインと競合して正当性を予測することが示された。
彼らはまた、具体的な操舵目標、すなわち反応の異なる段階で調節する潜在方向を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:42:13 GMT)
CollabVR: Collaborative Video Reasoning with Vision-Language and Video Generation Models [41.6] ビデオ生成モデル(VGM)は、ゴール指向タスクにおいて繰り返し発生する障害モードを示す。
ステップレベルの批判においてVLMとVGMを結合するクローズドループフレームワークであるVLM-VGMコラボレーションビデオ推論(CollabVR)を提案する。
Gen-ViReとVBVR-Benchでは、CollabVRはシングル推論、Pass@$k$、マッチした計算における以前のテストタイムスケーリングベースラインよりも、オープンソースとクローズドソース両方のVGMを改善している。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:39:17 GMT)
Predicting Plasticity in Deep Continual Learning: A Theoretical Perspective [41.5] 我々は、可塑性をトレーニング容易性、すなわち、ニューラルネットワークの将来の目標タスクにおける最適化の利益と解釈する実践的な視点を採っている。
本稿では,勾配強度と勾配信頼性を組み合わせた最適化準備性という新しい指標を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:35:00 GMT)
ReST-KV: Robust KV Cache Eviction with Layer-wise Output Reconstruction and Spatial-Temporal Smoothing [41.2] 大規模言語モデル(LLM)は、キーバリュー(KV)キャッシュのメモリ要求の増加により、効率的な生成推論の課題に直面している。
本稿では,階層的出力再構成と空間的空間的平滑化を組み合わせたロバストなKV消去手法であるReST-KVを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:49:32 GMT)
A Versatile AI Agent for Rare Disease Diagnosis and Risk Gene Prioritization [41.1] Hygieiaは、精度の高い疾患診断をサポートするために設計されたマルチモーダルAIシステムである。
表現型の特徴、遺伝子プロファイル、臨床記録を統合している。
複数の診断ベンチマークで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:50:37 GMT)
MeshFIM: Local Low-Poly Mesh Editing via Fill-in-the-Middle Autoregressive Generation [40.3] MeshFIMはFill-in-the-Middleフレームワークで、周囲のコンテキストで条件付けられた低ポリメッシュのターゲット領域を再生する。
露出境界に沿って正確なアタッチメントを強制すること、コンテキスト内のトポロジ的順序を保存すること、意図された領域を越えてオーバーフローを抑制すること、という3つのメッシュ固有の課題に対処する。
MeshFIMに基づいて、インタラクティブなブラシベースの編集と、ローポリメッシュの自動欠陥修正の2つの応用を実証する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:11:26 GMT)
ECHO: Continuous Hierarchical Memory for Vision-Language-Action Models [40.1] メモリ容量は、長期操作タスクにおけるビジョン・ランゲージ・アクション(VLA)モデルの性能を決定する重要な要因である。
本稿では,連続階層空間内で動作する新しいメモリフレームワークECHOを提案する。
双曲型オートエンコーダを用いることで、ECHOはVLA隠された状態をこの空間にマッピングする。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:06:33 GMT)
BubbleSpec: Turning Long-Tail Bubbles into Speculative Rollout Drafts for Synchronous Reinforcement Learning [39.6] 強化学習(RL)は,大規模言語モデル(LLM)の性能向上の基盤となっている。
本稿では,RLロールアウトを高速化し,数学的精度を厳格に保ちながら,BubbleSpecを提案する。
BubbleSpecはデコード手順を50%削減し、ロールアウトスループットを最大1.8倍向上させる。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:21:38 GMT)
Not All Turns Matter: Credit Assignment for Multi-Turn Jailbreaking [39.1] 我々は、強化学習に基づくマルチターンジェイルブレイクのためのターンアウェア・クレジット・アサインメント・フレームワークであるTRACEを提案する。
トラジェクトリが成功するためには、TRACEはLeft-one-turn-outセマンティックマスクを通じてターンレベルのコントリビューションを見積もる。
失敗した場合、TRACEは迅速な有害性と意味的関連性に基づいて罰則を割り当てる。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:07:30 GMT)
Breaking the Impasse: Dual-Scale Evolutionary Policy Training for Social Language Agents [38.6] 本稿では,社会言語ゲームのためのDual-scale Evolutionary Policy Training (DEPT)を提案する。
DEPTは、不連続を検出する時間スケールの進化的知覚機構を導入している。
本手法は, 勾配信号を効果的に復元し, 持続的な戦略的探索を行う。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:10:32 GMT)
Personalized w-Event Privacy for Infinite Stream Estimation [38.5] 本稿では、プライベートデータストリーム推定のための$w$eventプライバシーをパーソナライズする。
まず、パーソナライズされたウィンドウサイズメカニズム(PWSM)を設計し、各時間帯でパーソナライズされたプライバシ要件をサポートする。
動的パーソナライズド予算分布(DPBD)と動的パーソナライズド予算吸収(DPBA)をさらに発展させる。
実験の結果,提案手法は最先端のアルゴリズムと比較して,推定誤差を少なくとも5,3.6%削減できることがわかった。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:56:50 GMT)
Earth Science Foundation Models: From Perception to Reasoning and Discovery [37.5] 大型基盤モデル(FM)は異種多モードデータを統合することで地球科学を変革している。
本稿では,地球科学基礎モデル(地球FM)を2つの相補的な次元で統一的にレビューする。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:34:30 GMT)
FlashClear: Ultra-Fast Image Content Removal via Efficient Step Distillation and Feature Caching [37.3] 拡散に基づくオブジェクト除去モデルは、すべてのタイムステップで全てのトークンを無差別にデノベートし、除去は通常小さな前景領域を含むことを無視する。
本稿では,領域認識型適応蒸留 (RAD) を実装するための潜在判別器を提案し,FlashClear という高効率な数ステップモデルを提案する。
さらに,FPAC (Foreground-Prioritized Asymmetric Attention and Caching) は,FPAC (Foreground-Prioritized Asymmetric Attention and Caching) を学習不要な加速戦略として提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:39:14 GMT)
ParityFuzz: Finding Inconsistencies across Solidity Compilers via Fine-Grained Mutation and Differential Analysis [37.3] ParityFuzzは、Solidity用のクロスコンパイラ差分テストフレームワークである。
コンパイラと実行環境を分析して、構文や境界指向のルールを含む突然変異ルールを導出する。
複数のコンパイラにまたがってプログラムをコンパイルして実行し、その結果を正規化し、比較して不整合を検出する。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:53:45 GMT)
Forge: Quality-Aware Reinforcement Learning for NP-Hard Optimization in LLMs [37.3] OPT-BENCHは,大規模言語モデル(LLM)を学習・評価するための最初の総合的なフレームワークである。
OPT-BENCHは3つの重要なコンポーネントを提供している。インスタンスジェネレータによるスケーラブルなトレーニングインフラストラクチャ、品質検証、10タスクにわたる最適なベースライン、成功率で測定された1,000インスタンスの厳格なベンチマーク、品質比で測定された品質、バイナリの正確性を超えた継続的改善を可能にする品質認識報酬だ。
我々の分析によると、品質意識の報酬はバイナリ報酬よりも28.8%改善し、タスクの多様性はデータ量よりも一般化を促進し、複雑な推論のためのRLVRスケーリングに関する洞察を提供する。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:57:25 GMT)
FraudBench: A Multimodal Benchmark for Detecting AI-Generated Fraudulent Refund Evidence [37.0] FraudBenchは、AIが生成した不正な返金証拠を検出するためのマルチモーダルベンチマークである。
実際のユーザレビューのエビデンスから構築され、eコマース、フードデリバリー、旅行サービスのシナリオにまたがる。
我々は、MLLM、AI生成画像検出器、および人間の被験者を、同じ設定で評価する。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:11:15 GMT)
Learning Generative Dynamics with Soft Law Constraints: A McKean-Vlasov FBSDE Approach [36.9] 終端および中間分布観測からダイナミクスを学習するための生成フレームワークを提案する。
この方法は、ソフトエネルギーの制約によって終端法則と時準法則が強制されるマッキーン・ブラソフ制御問題として生成を定式化する。
実験により、ソフトな境界法則の制約は、中間分布が人間の運動の観察された進化に従うコヒーレントな軌跡を生じさせることが示されている。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:00:37 GMT)
Geometrically Constrained Stenosis Editing in Coronary Angiography via Entropic Optimal Transport [35.9] 本稿では,ローカル化編集を制約付きエントロピー最適輸送(OT)問題として再設定するOT-Bridge Editorを提案する。
我々の合成血管造影は下流狭窄の検出を継続的に改善し、ARCADEベンチマークでは27.8%の実質的な上昇を示した。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:04:17 GMT)
WorldSpeech: A Multilingual Speech Corpus from Around the World [35.6] WorldSpeechは24kHzの多言語音声コーパスで、76言語にまたがる65k時間の音声書き起こしデータで構成されている。
37言語に対して、WorldSpeechは200時間以上のアライメントされたスピーチを提供しており、28は500時間を超え、24は1k時間を超えている。
WorldSpeech で既存の ASR モデルを微調整すると、11の言語でWord-Error-Rate の平均相対的な 63.5% が減少する。
論文参考訳(メタデータ) (Sat, 09 May 2026 21:00:01 GMT)
Establishing Robust Retinal Eye Tracking: A Weakly Supervised Algorithmic Framework [35.6] 本稿では,眼球の頑健な視線追跡のための弱い教師付き学習ベースフレームワークを提案する。
最初の研究では、95%の視線誤差0.45デグを6人のコホートで達成し、高い精度を示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 21:45:57 GMT)
LEAP: Unlocking dLLM Parallelism via Lookahead Early-Convergence Token Detection [35.2] LEAP(Lookahead Early-Convergence Token Detection for Accelerated Parallel Decoding)を紹介する。
LEAPは、将来のコンテキストフィルタリングとマルチシーケンス重ね合わせを利用して早期収束トークンを検出する、トレーニングフリーのプラグアンドプレイ方式である。
GSM8Kデータセットでは、LEAPとdParallelを組み合わせることで、モデル精度を維持しながら、ステップ毎に7.2トークンにデコードが高速化される。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:26:23 GMT)
How Many Visual Tokens Do Multimodal Language Models Need? Scaling Visual Token Pruning with F^3A [35.0] 視覚的トークンプルーニングのためのトレーニング不要ルータF3Aを提案する。
ライトウェイトなクェリコンディショニングキューを構築し、凍結したスパースセンサーヘッドを通してトークンと照合する。
厳密なエビデンスローカライゼーション、地域改良、カバー範囲保存競争、未発見領域の回復を通じて、固定された視覚トークン予算を割り当てている。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:13:04 GMT)
Uncovering Intra-expert Activation Sparsity for Efficient Mixture-of-Expert Model Execution [34.1] 我々は,MoEモデルにおいて,経験的アクティベーション空間を相補的かつ未探索の空間空間次元として探求し,活用する。
驚くべきことに、既存のトレーニング済みのMoEモデルでは、相当な試験内間隔が容易に利用できる。
我々は、不活性ニューロンの計算をスキップすることで、エキスパート内アクティベーション間隔を活用するために、vLLMのMoE実行パイプラインを拡張した。
論文参考訳(メタデータ) (Sat, 09 May 2026 00:34:55 GMT)
XPERT: Expert Knowledge Transfer for Effective Training of Language Models [33.5] Mixture-of-Experts (MoE)言語モデルは、知識を明示的にルーティングされたエキスパートモジュールにまとめる。
専門家のサブセットが、さまざまな知識ドメインで一貫して活性化されていることが分かりました。
我々はエキスパートの知識を抽出し、統合し、再利用するフレームワークであるXPERTを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:53:03 GMT)
Internalizing Safety Understanding in Large Reasoning Models via Verification [33.2] 本稿では,安全確認タスクにのみ焦点をあてた LRM のトレーニングにより,安全性仕様を内部化するフレームワークを提案する。
検証の学習は、応答安全性の強力な一般化を誘導し、ドメイン外ジェイルブレイクに対する堅牢性を著しく向上させることを示した。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:05:00 GMT)
Data-driven Circuit Discovery for Interpretability of Language Models [32.7] 回路探索は、言語モデル(LM)が回路をローカライズし解釈することで、特定のタスクをどのように実装するかを説明することを目的としている。
既存のメソッドは、まずデータセットでタスクを非公式に定義し、次にそのデータセットに回路探索アルゴリズムを適用して単一の回路を得る。
データ駆動型サーキットディスカバリ(DCD)を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:20:57 GMT)
On Characterizing Learnability for Adversarial Noisy Bandits [32.7] 我々は、既知の関数クラス $mathcalF$ を与えられた逆雑音帯について研究する。
ゴールは、学習者のパフォーマンスと後ろ向きの最高の固定アームとの差として定義される累積的後悔$R(T)$を最小化することである。
関数クラス $mathcalF$ は、サブ線形後悔を達成するアルゴリズムが存在する場合、学習可能であると言う。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:40:40 GMT)
What Will Happen Next: Large Models-Driven Deduction for Emergency Instances [32.6] 大規模モデル(LM)は、制御可能なランダム性を導入するために生成戦略を調整することができる。
本稿では,緊急事態の可視化とデダクションを多用したLMS駆動のワールドラインディバージェンスシステム(WLDS)を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:41:05 GMT)
Kinematics-Driven Gaussian Shape Deformation for Blurry Monocular Dynamic Scenes [32.4] Kinematics-GSは運動整合変形をモデル化するキネマティクス対応フレームワークである。
最適化を安定させるために,シーンを動的および静的なコンポーネントに分解する。
また、非剛体運動を示す変形性および弾性物体の挑戦的な実世界のデータセットも導入する。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:01:17 GMT)
SearchSkill: Teaching LLMs to Use Search Tools with Evolving Skill Banks [32.2] 本稿では,再利用可能な検索スキルによってクエリ計画を明確にするフレームワークを提案する。
オープンソースモデルとクローズドソースモデル全体で、SearchSkillは知識集約型QAベンチマークの正確なマッチを改善している。
これらの結果は、明示的なスキル条件付きクエリプランニングが、未分化のアクションとして検索を扱うための軽量な代替手段であることを示唆している。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:23:54 GMT)
Self-ReSET: Learning to Self-Recover from Unsafe Reasoning Trajectories [32.2] 大型共振モデルには一般領域における自己補正の優れた能力がある。
既存のアライメント手法は、エキスパートデータにモデルを微調整することで、この脆弱性を軽減しようとする。
本稿では,自己回帰学習フレームワークであるSelf-ReSETを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:14:31 GMT)
Transforming the Use of Earth Observation Data: Exascale Training of a Generative Compression Model with Historical Priors for up to 10,000x Data Reduction [32.2] 本研究では,地球観測アーカイブから学習し,オンデマンド100倍から1万倍のデータ圧縮を可能にする生成圧縮フレームワークを提案する。
我々は、LineShine Armv9 CPUスーパーコンピュータ上で、大規模な生成圧縮モデルをエクサスケールで訓練する。
この研究は、歴史的に優先された生成的圧縮が、地球観測データを、取得、配信、保存、科学利用のためのアクティブでタスク適応的な基盤に変えることを示している。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:57:16 GMT)
Max-pooling Network Revisited: Analyzing the Role of Semantic Probability in Multiple Instance Learning for Hallucination Detection [31.9] セマンティック一貫性と内部モデルステートをMIL(Multiple Instance Learning)を通じて組み合わせたHaMIのようなハイブリッドアプローチは、最先端のパフォーマンスを実現している。
しかし、これらの手法は繰り返しサンプリングとコストのかかる意味的類似性計算によってかなりの計算オーバーヘッドを発生させる。
本研究では,まず,決定マージンの観点からHaMIの理論的解析を行い,内部状態を意味的整合性で拡張すると決定マージンが大きくなることを示した。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:30:30 GMT)
Iterative Critique-and-Routing Controller for Multi-Agent Systems with Heterogeneous LLMs [31.3] マルチエージェント大言語モデル(LLM)システムは、異種モデルのプールを調整するためのコントローラに依存していることが多い。
逐次決定問題としてマルチエージェントコーディネーションを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:51:42 GMT)
Unified Modeling of Lane and Lane Topology for Driving Scene Reasoning [31.3] レーントポロジとレーントポロジの統一モデリング(ユニトーポ)という革新的な手法を提案する。
これは、前身車線、後継車線、およびそれらの相互接続を含む連結車線としての車線間のトポロジカルな関係を表す。
本手法を運転シーン推論ベンチマークOpenLane-V2で検証する。
論文参考訳(メタデータ) (Sat, 09 May 2026 12:12:14 GMT)
Source or It Didn't Happen: A Multi-Agent Framework for Citation Hallucination Detection [30.4] 既存の検出器は2値の発見/未確定の決定に還元され、監査者へのフィールドレベルの信号はほとんど提供されない。
実, 可能性, および有能な引用にまたがる12のコード分類法を導入する。
CiteTracerはPDFとBibから引用を抽出し、ルックアップURL、学者コネクタ、Web検索を通じて証拠を取得する。
合成ベンチマークでは97.1%の精度に達し、クラスレベルのF1スコアはそれぞれ97.0、95.8、98.5のReal、Val、Halucinatedに到達し、吸収することなく現実世界の幻覚を作る。
論文参考訳(メタデータ) (Sat, 09 May 2026 00:53:24 GMT)
Hint Tuning: Less Data Makes Better Reasoners [30.3] Hint Tuningは、モデルに推論の深さをキャリブレーションする、データ効率のよいアプローチである。
インストラクションモデルが様々なガイダンスで解決できるものをテストすることで、3つの状態にまたがるトレーニングデータを自動的に構築する。
インストラクタモデルの能力と単純なアライメントにより、優れた効率を実現する。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:07:16 GMT)
AgentForesight: Online Auditing for Early Failure Prediction in Multi-Agent Systems [30.2] LLMベースのマルチエージェントシステムは、長距離タスクにますますデプロイされている。
単一の決定的なエラーは、しばしば下流のエージェントやカスケードによって軌道レベルの障害として受け入れられる。
我々は,この問題をオンライン監査として再編成するフレームワークであるAgentForesightを紹介した。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:55:19 GMT)
DocScope: Benchmarking Verifiable Reasoning for Trustworthy Long-Document Understanding [29.3] 本稿では,長期文書QAを構造化推論軌道予測問題として定式化するベンチマークであるDocScopeを紹介する。
軌道の各レベルを独立に監査する4段階評価プロトコルを設計する。
6つのプロプライエタリなモデル、12のオープンウェイトモデル、いくつかのドメイン固有のシステムをベンチマークします。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:12:59 GMT)
Higher-Order Equilibrium Tracking for EM-Compressible Online Estimation [29.2] 本研究では, 潜伏変数モデルにおけるオンライン推定を, 動作中の経験平衡を追尾する問題を再キャストすることによって検討する。
我々のフレームワークは、現在の実行統計において、オンライン見積もりを凍結されたバッチ平衡に分解する。
我々は、平衡応答とニュートン整流子を評価する構造条件として、EM圧縮性とEM-jet$R$-圧縮性を定式化する。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:30:55 GMT)
MIND-Skill: Quality-Guaranteed Skill Generation via Multi-Agent Induction and Deduction [28.8] MINDスキル(MIND-Skill, MIND-Skill, MIND-Skill, MIND-Skill, MIND-Skill, MIND-Skill, MIND-Skill, MIND-Skill)を提案する。
AppWorldとBFCL-v3の実験では、MIND-Skillは同時スキル生成方法よりも一貫して優れていた。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:15:57 GMT)
OPT-BENCH: Evaluating the Iterative Self-Optimization of LLM Agents in Large-Scale Search Spaces [28.8] OPT-BENCHは大規模検索空間における自己改善能力を評価するためのベンチマークである。
我々は,人間ライクな認知適応をエミュレートするフレームワークであるOPT-Agentを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:51:34 GMT)
Physics-Informed Neural PDE Solvers via Spatio-Temporal MeanFlow [28.3] 本稿では,物理状態の有限区間進化を学習する新しいPDEソルバとして機能するS-Temporal MeanFlowを紹介する。
時間的領域から時間的領域へ、空間的整合性を伴う時間進化を結合して、元のMeanFlow制約を拡張する。
これにより、時間依存PDEと定常PDEの両方を自然に収容する統合されたフレームワークが得られる。
論文参考訳(メタデータ) (Sat, 09 May 2026 12:29:10 GMT)
PersonaTeaming: Supporting Persona-Driven Red-Teaming for Generative AI [28.3] 我々はペルソナを対向的なプロンプト生成プロセスに組み込むペルソナチームを開発する。
次に、PersonaTeamingをPersonaTeaming Playgroundとしてインスタンス化します。
業界実践者11名を対象に行ったユーザスタディでは,PersonaTeaming Playgroundが,実践者が有用だと感じたさまざまなレッドチーム戦略とアウトプットを可能にした。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:52:17 GMT)
FedGMI: Generative Model-Driven Federated Learning for Probabilistic Mixture Inference [28.1] フェデレートラーニング(FL)は、データ交換を避けてデータのプライバシを保護しながら、分散クライアント間の協調的なモデルトレーニングを容易にする。
その可能性にもかかわらず、FLパフォーマンスはクライアント間のデータ不均一性によってしばしば損なわれる。
我々は,これらの固有分布を表現し,クライアントのローカルデータ分布の混合成分を推定するために,変分オートエンコーダ(VAE)を生成密度推定器として利用するフレームワークであるFedGMIを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:45:10 GMT)
ORACLE: Anticipating Scams from Partial Trajectories in Streaming App Usage [27.9] スマートフォンのスカムはますます普及し、多段階のクロスアプリケーションプロセスとして一般的に現れている。
時空間ラテンテンテアット予測のためのtextbfORACLE Online Reasoning を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:26:16 GMT)
SkillMaster: Toward Autonomous Skill Mastery in LLM Agents [27.7] SkillMasterは、エージェントに新しいスキルを作り、既存のスキルを洗練させ、タスク解決中に蓄積したスキルを選択する訓練フレームワークである。
第一に、私たちは、軌道インフォームドスキルレビューを通じてエージェントを訓練し、完成したエピソードの証拠に基づいて、提案、更新、保持するためのエージェントを指導する。
第2に、各候補スキル編集は、関連するプローブタスクに対する対実的ユーティリティによって評価され、スキル編集決定を訓練するための直接学習信号を提供する。
第3に、DualAdv-GRPOを導入し、タスク解決行動とスキル編集決定の利点を個別に推定し、タスク解決における共同トレーニングを安定化する。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:03:00 GMT)
When LLMs Team Up: A Coordinated Attack Framework for Automated Cyber Intrusions [27.6] 本稿では,侵入型タスク分析のための協調型マルチエージェントフレームワークであるCAESARを提案する。
CAESARはワークフローを5つの型付きロールに分解し、境界付きプロトコルを介してそれらを調整する。
予算とツールアクセスが一致した単一エージェントベースラインと比較して、CAESARはタスクの成功を改善し、パフォーマンスのばらつきを低減する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:47:42 GMT)
Test-Time Personalization: A Diagnostic Framework and Probabilistic Fix for Scaling Failures [26.9] パーソナライズされたポリシーモデルからN候補をサンプリングし、パーソナライズされた報酬モデルを用いてベストを選択することにより、スケーリング推定時間を計算する。
オラクルの選択は、サンプル候補数と対数的に増大する期待効用が得られることを証明している。
確率論的パーソナライズされた報酬モデルを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 12:09:11 GMT)
Sparse Layers are Critical to Scaling Looped Language Models [26.9] Looped-MoEモデルは標準ベースラインよりもスケールが良いが、高密度ループモデルはそうではない。
各ループは最終的な出力を生成するのと同じ層で終わるので、ループ境界はより優れた出口点である。
早期出口を持つLooped-MoEモデルは、標準的なトランスフォーマーを大規模に打ち負かすだけでなく、品質の低下を最小限に抑えながら、メモリと推論の大幅な節約を可能にする。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:58:18 GMT)
Curvature-Aware Captioning:Leveraging Geodesic Attention for 3D Scene Understanding [26.7] ユークリッド埋め込み空間を適用する既存のアプローチは、きめ細かい局所幾何学的詳細を同時に保存するのに苦労している。
我々は,新しい非ユークリッド測地的注意機構を統合したtextbftextscCurvature-Aware Captioningフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:54:42 GMT)
ShadowMerge: A Novel Poisoning Attack on Graph-Based Agent Memory via Relation-Channel Conflicts [26.6] 本稿では,グラフベースのエージェントメモリに対する中毒攻撃であるSHADOWMERGEを紹介する。
その重要な洞察は、有毒な関係は、良心的な証拠と同じクエリ活性化アンカーと正準化された関係チャネルを共有することができるということである。
Mem0と3つの公開実世界のデータセット上でSHADOWMERGEを評価する。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:16:41 GMT)
EmoS: A High-Fidelity Multimodal Benchmark for Fine-grained Streaming Emotional Understanding [26.5] 感情認識のための高忠実度バイリンガルベンチマークであるEmoSを紹介する。
EmoSは厳密にフィルタされた静的スライスと動的なStreaming Monologueサブセットを組み合わせる。
EmoS上の微調整MLLMはゼロショットベースラインよりも顕著に向上することを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:01:21 GMT)
EvidenT: An Evidence-Preserving Framework for Iterative System-Level Package Repair [26.4] ツール実行からエビデント管理を分離するエビデント修復フレームワークであるエビデントを提案する。
実世界のRISC-Vパッケージビルド障害219件についてEvidenTの評価を行った。
予備実験はaarch64で41.77%、x86_64で46.99%の成功率を達成した。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:29:57 GMT)
UniShield: Unified Face Attack Detection via KG-Informed Multimodal Reasoning [26.4] We propose UniShield, a knowledge-grounded multimodal reasoning framework for unified face attack defense。
UniShieldは、攻撃カテゴリを診断的視覚的手がかりと攻撃条件付き関係にリンクする顔攻撃知識グラフを構築する。
マルチモーダルなUDAベンチマークの実験では、UniShieldはバイナリ、粗い粒度、きめ細かなプロトコルで高いパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:44:29 GMT)
Debugging the Debuggers: Failure-Anchored Structured Recovery for Software Engineering Agents [26.2] PROBEは、ソフトウェアエンジニアリングエージェントの構造化リカバリのための、障害対応フレームワークである。
PROBEは、リポジトリレベルのソフトウェア修復、エンタープライズワークフローのリカバリ、AIOpsサービス緩和の3つの設定で評価します。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:02:08 GMT)
ReLibra: Routing-Replay-Guided Load Balancing for MoE Training in Reinforcement Learning [25.6] 既存のMoEトレーニングシステムは、将来の専門家の需要を予測するために、過去の負荷に依存しているため、急激な変動の下では効果が低下する。
本稿では,RLのロールアウトトレーニングワークフロー,ルーティングリプレイにおいて,ユニークな機会を利用するMoE RLトレーニングシステムであるReLibraを提案する。
ReLibraは2つのMoEロードバランシング機構をバッチ間およびバッチ内タイムスケールに配置し、通信パターンを階層的なネットワーク帯域幅に合わせる。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:18:50 GMT)
Omni-DeepSearch: A Benchmark for Audio-Driven Omni-Modal Deep Search [25.4] textbf Omni-DeepSearchは、音声駆動のOmni-Modalディープサーチのベンチマークである。
1つ以上のオーディオクリップと関連する質問が与えられた場合、モデルは音声から有用な手がかりを推測し、テキスト、画像、ビデオ検索ツールを呼び出し、短い客観的かつ検証可能な回答を生成するためにマルチホップ推論を実行する必要がある。
実験の結果、最も評価の高いモデルであるGemini-3-Proは平均43.44%の精度しか達成していないことがわかった。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:47:42 GMT)
ProcVLM: Learning Procedure-Grounded Progress Rewards for Robotic Manipulation [25.4] ロングホライゾンのロボット操作は、タスクが手続き段階を通してどのように進行するかを反映した密集したフィードバックを必要とする。
本稿では,プログレッシブ・アウェア・ビジョン言語モデルであるProcVLMについて述べる。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:00:59 GMT)
MDGYM: Benchmarking AI Agents on Molecular Simulations [25.4] LAMMPSとGROMACSにまたがる169のMDシミュレーションのベンチマークであるMDGYMを紹介する。
私たちは、Claude Code、Codex、OpenHandsの3つのエージェントフレームワークを4つのLCMで評価しました。
これらの障害モードは、一般的なソフトウェアエンジニアリングベンチマークで観察されたものとは定性的に異なり、流動的なコード生成が基礎となる物理的推論に移行しないことを示している。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:21:51 GMT)
Token Economics for LLM Agents: A Dual-View Study from Computing and Economics [25.3] 本調査は,東海経済の総合的な調査である。
我々はトークンを生産要因、交換媒体、会計単位として概念化する。
我々はスケーラブルな次世代エージェントシステムの理論的基礎を築いた。
論文参考訳(メタデータ) (Sat, 09 May 2026 18:18:51 GMT)
OSAQ: Outlier Self-Absorption for Accurate Low-bit LLM Quantization [25.0] トレーニング後の重量限定量子化は、モデルサイズを減らし、トークン生成を加速することで、有望なソリューションを提供する。
重量に固有の体系的なアウトリーチが存在することは、依然として大きな障害である。
本稿では,2次低ランク特性によって誘導される付加的な重み抑制を行うOutlier Self-Absorption Quantization (OSAQ)を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:06:42 GMT)
Beyond the All-in-One Agent: Benchmarking Role-Specialized Multi-Agent Collaboration in Enterprise Workflows [24.7] 大規模言語モデル(LLM)エージェントは、企業環境での運用がますます期待されている。
既存のベンチマークでは、幅広いツールアクセスを持つ単一のエージェントが評価されている。
企業におけるマルチエージェントコラボレーションを評価するベンチマークである textscEntCollabBench を紹介する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:47:07 GMT)
LCGNav: Local Candidate-Aware Geometric Enhancement for General Topological Planning in Vision-Language Navigation [23.9] トポロジカルVLNのためのモジュラー局所幾何拡張フレームワーク LCGNav を提案する。
LCGNavは、候補深度ビューを3Dポイントの雲に明示的に変換し、エージェントの到達範囲に基づいて物理的切り離しを適用する。
R2R-CEとRxR-CEの実験により、LCGNavは効果的なクロスアーキテクチャ拡張モジュールとして機能することが示された。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:56:38 GMT)
Agentic AI Scientists Are Not Built For Autonomous Scientific Discovery [23.8] 成長する研究機関は、エンドツーエンドの科学的発見が可能なAI科学者を追求している。
このポジションペーパーでは、彼らはすでに共同科学者として機能しているが、エージェントAI科学者は自律的な科学的発見のために構築されていないと論じている。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:52:23 GMT)
BiAxisAudit: A Novel Framework to Evaluate LLM Bias Across Prompt Sensitivity and Response-Layer Divergence [22.3] 大規模言語モデルのバイアス監査は、EU AI Actなどのガバナンスフレームワーク内で運用されている。
このプロトコルでは、各バイアススコアを2つの軸上での信頼性推定とともに報告する。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:26:49 GMT)
Muon Does Not Converge on Convex Lipschitz Functions [21.9] ムオンが凸函数とリプシッツ函数のクラスに収束しないことが示される。
また, 誤差フィードバックは, 運動量を持つムオンおよび非ユークリッド下次手法の収束を復元することを示した。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:47:59 GMT)
OTora: A Unified Red Teaming Framework for Reasoning-Level Denial-of-Service in LLM Agents [21.8] OToraは、Reasoning-Level Denial-of-Service攻撃をインスタンス化するフレームワークである。
OToraはICL誘導遺伝子探索によってエージェント認識推論ペイロードを生成する。
トークンの推論とマグニチュードの遅延の遅延ダウンで最大10倍増加する。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:55:11 GMT)
S2FT: Parameter-Efficient Fine-Tuning in Sparse Spectrum Domain [21.3] 本稿では,重量変化のスペクトルはスパースではなく,パワー・ユニフォームとして分布することが観察された。
そこで本研究では,空間領域行列をスパーススペクトルで重み変化に変換できる非可逆変換を提案する。
我々のS2FTは, 0.08%のトレーニングパラメータのみを用いて, 優れた性能が得られることを示した。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:10:26 GMT)
Meow-Omni 1: A Multimodal Large Language Model for Feline Ethology [21.2] 動物の意図を解読することは、計算倫理学における根本的な課題である。
Meow-Omni 1は、計算倫理のために開発された最初のオープンソースのクアッドモーダルMLLMである。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:30:15 GMT)
PPU-Bench:Real World Benchmark for Personalized Partial Unlearning in Vision Language Models [21.0] MLLMにおけるパーソナライズされた部分的アンラーニングのための実世界および微調整不要なベンチマークであるPPU-Benchを紹介する。
PPU-Benchは、500人の公開人物の事前知識から得られた24Kのマルチモーダルとユニモーダルのサンプルを含んでいる。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:46:00 GMT)
Revisiting Mixture Policies in Entropy-Regularized Actor-Critic [21.0] 柔軟性の向上は理論的に解の質とエントロピーの堅牢性を高めることができることを示す。
Gym MuJoCo、DeepMind Control Suite、MetaWorldでの我々の実験は、MRP混合ポリシーがLRよりも大幅に優れていることを示している。
我々は、MDP混合政策を理論的好奇心から実践的なツールへと高め、関連するトレードオフをより明確に理解する。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:37:52 GMT)
WASIL: In-the-Wild Arabic Spoken Interactions with LLMs [20.9] LLM(Large Language Models)音声アシスタントは、一般的にLLMシステムへのカスケード自動音声認識(ASR)として構築される。
嫌悪は、あいまいな、ドメイン外または非要求のターンから生じ、ASR効果の分離が困難になる。
We release WASIL: in-the-the-wild Arabic spoken interaction prompts with audio, ASR hypotheses, assistant response, and explicit like/dislike feedback。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:57:21 GMT)
Re$^2$Math: Benchmarking Theorem Retrieval in Research-Level Mathematics [20.8] 証明が不十分なステップに達すると、有用なアシスタントが必要なツールがすでに存在するかどうかを判断する必要がある。
Re$2$Mathは、部分数学的証明からツールグラウンドで検索するためのベンチマークである。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:52:49 GMT)
Reasoning Compression with Mixed-Policy Distillation [20.7] 推論中心の大規模言語モデルは、しばしば過剰なトークンの使用と推論時復号コストを発生させる。
我々は,大規模教師から小学生に簡潔な推論行動を伝達する推論圧縮フレームワークであるMixed-Policy Distillation (MPD)を提案する。
MPDはトークンの使用量を最大27.1%削減し、複数の推論ベンチマークのパフォーマンスを改善している。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:04:47 GMT)
Tight Generalization Bounds for Noiseless Inverse Optimization [20.7] 逆最適化(IO)は、観測されたコンテキスト-アクションデータから意思決定者の目的のパラメータを推測する。
誘導されたアクションセットに対して高確率の$O(fracdT)$boundを提供し、$d$は未知のパラメータの数で、$T$はトレーニングデータセットのサイズです。
我々は、$O(fracdT)$レートが、ここで考慮されたすべての一貫した推定値に対して厳密であることを示し、その結果を、即時および累積的後悔の両方に拡張する。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:33:38 GMT)
Reddit2Deezer: A Scalable Dataset for Real-World Grounded Conversational Music Recommendation [20.7] Reddit2Deezerは190kのユニークなスレッドとリーフ・コンパートメントのペアから派生した、現実的なグラウンドのCMRリソースである。
人間の検証は、対話、アイテムグラウンド、およびパラフレーズの品質を確認する。
データセットはhttps://huggingface.co/datasets/McAuley-Lab/Reddit2Deezerで入手できる。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:08:18 GMT)
Communicating Sound Through Natural Language [20.1] 本稿では,LLM送信機と受信機が自然言語で音声を伝達するフレームワークであるLexical Acoustic coding (LAC)を紹介する。
固定されたシステムプロンプトの下で、エージェントは独自の分析および合成コードを書き、語彙文を通してのみ通信する。
我々はLACを有限レートの損失量子化器とみなし、語彙サイズ、レート、忠実さのトレードオフを露呈する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:25:54 GMT)
Smoothing Out the Edges: Continuous-Time Estimation with Gaussian Process Motion Priors on Factor Graphs [19.9] 因子グラフの言語に根ざしたGP連続時間推定の単純化された説明を提供する。
また、一般的なGTSAM推定フレームワークで実装された3つの実例についても紹介する。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:30:22 GMT)
Unlearners Can Lie: Evaluating and Improving Honesty in LLM Unlearning [19.8] 大規模言語モデル(LLM)におけるアンラーニングは、全体的なユーティリティを保ちながら有害なトレーニングデータを削除することを目的としている。
既存の方法は、しばしば幻覚、異常なトークン配列の生成、不整合な振る舞い、安全と信頼の懸念を高める。
本稿では,保持された知識に対する実用性と誠実さの両立を含む,非学習的誠実さの形式的定義を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:50:27 GMT)
AgentSlimming: Towards Efficient and Cost-Aware Multi-Agent Systems [19.4] AgentSlimmingは、グラフ構造化マルチエージェントシステムのためのプラグアンドプレイ圧縮フレームワークである。
平均トークンコストを78.9%まで削減し、性能を低下させ、時には精度も向上する。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:03:54 GMT)
Generative Actor-Critic with Soft Bridge Policies [19.1] 効果的なソフト生成ポリシーの訓練は、しばしば一緒に起こる2つの障害に直面します。
第一に、端的な作用密度はしばしば利用できないので、既存の方法は通常エントロピー境界、プロキシ、近似に依存する。
これらの障害は、単一のサンプル化されたアクターフォワードパスのみをアクション生成に必要としながら、抽出可能なMaxEnt目標を公開する生成ポリシーを求める動機となります。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:36:32 GMT)
How You Begin is How You Reason: Driving Exploration in RLVR via Prefix-Tuned Priors [19.0] 提案手法は,基本モデルの軌道の推論よりも優先されるような,ソフトな接頭辞のプールを訓練するためのフレームワークである。
我々は、RLトレーニングの検証可能な報酬を補完するために、情報最大化報酬を導出する。
実験の結果、IMAXは標準RLVRよりも推論性能を一貫して改善することがわかった。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:10:03 GMT)
Single-Configuration Attack Success Rate Is Not Enough: Jailbreak Evaluations Should Report Distributional Attack Success [19.0] VSM(Variant Sensitivity Measure)とUC(Union Coverage)の2つの新しいジェイルブレイク攻撃対策を提案する。
VSMは、テストされた変量空間の平均 ASR から、最も報告された ASR がどこまでずれるかを定量化し、UC は、安全でない応答をもたらすプロンプトの総数である。
3つのオープンソースターゲットモデルにまたがる2つのアタック・ファミリーを用いて,これらの対策の重要性を実証的に示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:26:39 GMT)
Predicting Large Model Test Losses with a Noisy Quadratic System [18.2] モデルサイズ(N)、バッチサイズ(B)、重み更新数(K)から、大規模モデルの事前学習損失を推定する予測モデルを導入する。
これはバッチサイズの変化に対処できる最初の損失予測モデルです。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:35:09 GMT)
Latent Geometry Beyond Search: Amortizing Planning in World Models [17.6] 学習した表現は、単に予測を有効にするのではなく、制御を単純化できることを示す。
反復計画を手軽なゴール条件逆ダイナミクスモデル(GC-IDM)に置き換える
コントローラは環境プロトコール設定8つのうち7つでCEMと一致または超過し、判定あたりのコストを100-130倍に削減する。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:36:23 GMT)
Benchmarking Compositional Generalisation for Machine Learning Interatomic Potentials [17.5] ある種の構成一般化を必要とする4つのタスクからなるベンチマークを提案する。
各タスクでは、トレーニング中に見つからない分子上でモデルがテストされるが、トレーニングデータを選択することにより、テスト例への一般化が実現可能である。
私たちの経験的分析は、最先端のモデルでは、考慮すべきタスクが極めて難しいことを示しています。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:12:59 GMT)
simpleposter: a simple baseline for product poster generation [17.5] 外部コントローラを使わずに、忠実な主題の保存と正確な位置制御が可能なテキストレンダリングを実現する。
実験の結果、SimplePosterは、SeedEdit 3.0が55.2%、PosterMakerが85.3%、テキストレンダリングの精度が改善したのに対し、980.7%の主題保存率を達成した。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:12:55 GMT)
Field-Localized Forgery Detection for Digital Identity Documents [17.4] デジタルID認証システムは、ユーザ認証のために文書イメージに依存している。
既存の偽造検出手法では、構造化されたID文書への転送性が制限されている。
我々はFLiDを提案する。FLiDは、重要なアイデンティティ領域をターゲットにした軽量なフィールドローカライズされたフレームワークである。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:53:54 GMT)
Compressed Video Aggregator: Content-driven Module for Efficient Micro-Video Recommendation [17.1] 本稿では,映像情報を優先学習から切り離す軽量なマイクロビデオレコメンデーションモジュールであるCompressed Video Aggregator (CVA)を提案する。
CVAは、凍結されたVFM埋め込みを集約し、クロスアテンションプロジェクションなしで遅延推論を使用し、レコメンダのためのコンパクトなビデオ埋め込みを生成する。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:02:20 GMT)
UniPCB: A Generation-Assisted Detection Framework for PCB Defect Inspection [16.7] 制御された欠陥合成とタスク固有の欠陥検出を統合した世代別PCB欠陥検査フレームワークを提案する。
DsPCBSD+の実験では、UniPCBは98.0%のmAP@0.5と61.8%のmAP@0.5:0.95の欠陥検出を達成した。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:25:18 GMT)
PHALAR: Phasors for Learned Musical Audio Representations [16.6] PHALARは,最先端技術に対して,相対的精度を最大70%まで向上させるコントラストフレームワークである。
PHALARはピッチ同変バイアスと位相同変バイアスを強制する。
MoisesDB、Slakh、ChocoChoralesにまたがる新たな検索状態を確立し、セマンティックベースラインよりも人間のコヒーレンス判断と大きく関連している。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:18:22 GMT)
$ξ$-DPO: Direct Preference Optimization via Ratio Reward Margin [16.5] 我々は、SimPOにおけるマージンの定式化は、異なる報酬ギャップ構造を持つデータセット間で容易に解釈できないと論じる。
提案する$-DPO: 比報酬マージンによる直接選好最適化。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:48:16 GMT)
Structure-Centric Graph Foundation Model via Geometric Bases [16.2] グラフトポロジを伝達可能な知識の主源とする構造中心グラフ基礎モデル(SCGFM)を提案する。
SCGFMは、共有構造座標系を定義する学習可能な幾何学的基盤を導入している。
グラフおよびノードレベルのタスクの実験では、ドメイン内およびクロスドメインの一般化が強く、既存のGCMアプローチよりも優れていた。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:56:21 GMT)
Outlier detection for patient monitoring and alerting [16.2] 我々は、異常な(異常な)患者管理決定を検出するためのデータ駆動型アプローチを開発し、評価する。
我々の仮説は、過去の患者のケアに関して異常な患者管理の決定は、誤りによるものかもしれないというものである。
本仮説は, 手術後4486例の EHR から得られたデータと, このデータから生成された222件の警告のサブセットを用いて評価した。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:52:15 GMT)
VL-SAM-v3: Memory-Guided Visual Priors for Open-World Object Detection [16.0] 本研究では,検索対象外界メモリを用いたオープンワールド検出を実現する統合フレームワークを提案する。
VL-SAM-v3は、オープンボキャブラリとオープンエンドの両方で検出性能を一貫して改善する。
より強力な開語彙検出器(SAM3)による実験は、提案された検索・精製機構の一般性を検証する。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:48:21 GMT)
UxSID: Semantic-Aware User Interests Modeling for Ultra-Long Sequence [16.0] セマンティックグループ共有関心記憶という第3の経路を探索するフレームワークであるUxSIDを提案する。
セマンティックID(SID)とデュアルレベルのアテンション戦略を利用することで、UxSIDはアイテム特化モデルの重いコストを伴わずに、ターゲット認識の好みをキャプチャする。
このアーキテクチャは、セマンティックな認識、最先端のパフォーマンス、大規模広告A/Bテストにおける収益の0.337%を計算のパシモニーとバランスをとる。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:26:48 GMT)
Zero-Shot Chinese Character Recognition via Global-Local Dual-Branch Alignment and Hierarchical Inference [15.9] 漢字のカテゴリーは非常に大きく、未確認の文字はオープンワールドのシナリオでしばしば現れる。
既存のIDSベースの検索手法は通常、文字画像とそのイデオロギー記述シーケンスを1つのグローバルベクトルに符号化してマッチングする。
文字画像とIDSシーケンスのグローバルおよびローカル表現を共同で学習するグローバルローカル階層知覚ネットワーク(GL-HPN)を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:05:59 GMT)
EAR: Enhancing Uni-Modal Representations for Weakly Supervised Audio-Visual Video Parsing [15.7] 弱教師付きオーディオ・ビジュアル・ビデオ・パーシングは、ビデオ内の音声、視覚、およびオーディオ・ビジュアル・イベントを認識し、時間的にローカライズすることを目的としている。
本稿では,擬似ラベル生成器とAVVPモデルの両方に一様表現を付加する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:13:27 GMT)
Muon-OGD: Muon-based Spectral Orthogonal Gradient Projection for LLM Continual Learning [15.6] スペクトルノルムを意識した連続学習フレームワークであるMuon-OGDを提案する。
提案手法を標準連続学習ベンチマークで評価する。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:42:08 GMT)
Learning When to Stop: Selective Imitation Learning Under Arbitrary Dynamics Shift [15.6] 振る舞いのクローン化は、トレーニングとテスト環境が同じダイナミクスを共有するときに、強力な模倣学習を保証する。
多くのデプロイメント環境では、テスト環境の遷移はトレーニングとは異なる。
これは選択的な模倣の研究を動機付けており、学習者は確実に行動できないときに停止することを選択できる。
論文参考訳(メタデータ) (Sat, 09 May 2026 21:48:04 GMT)
From Holo Pockets to Electron Density: GPT-style Drug Design with Density [15.6] 既存の方法では、ホロ錯体から空の結合ポケットに分子を固定し、フィラーなどの情報成分を見渡す。
そこで本研究では, 充填剤から得られる低分解能電子密度(ED)を, テクスタイドノボ医薬品設計のための物理的条件として活用する。
低分解能ED点雲から分子を生成するデコーダのみの自己回帰フレームワークであるEDMolGPTを紹介する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:51:25 GMT)
REAP: Reinforcement-Learning End-to-End Autonomous Parking with Gaussian Splatting Simulator for Real2Sim2Real Transfer [15.5] 本稿では,Reinforcement Learning End-to-end Autonomous Parking(REAP)を提案する。
REAPは、訓練効率と推論性能を改善するために、非対称強化学習フレームワークにSoft Actor-Critic(SAC)を使用している。
訓練された強化学習ネットワークが実世界のシナリオに直接移行できることを保証するため、我々はReal2Sim2Realシミュレータを構築した。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:50:40 GMT)
Principle-Guided Supervision for Interpretable Uncertainty in Medical Image Segmentation [15.5] 我々は,明らかな学習に基づく原則誘導型不確実性監視フレームワーク(PriUS)を開発した。
PriUSは競合セグメンテーション性能を維持しながら、より一貫した不確実性推定を生成する。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:17:20 GMT)
PHIDA: Persistence-Guided Node-to-Cluster Mapping for Online Clustering [15.5] 暗黙のマッピングは、学習ノード上のグラフ内の距離に基づいて、弱いグラフブリッジや局所関係に敏感な出力クラスタを作る。
本稿では,学習ノードを用いたオンラインクラスタリングのための永続化誘導ノードクラスタマッピング手法であるPHIDAを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:21:32 GMT)
ACWM-Phys: Investigating Generalized Physical Interaction in Action-Conditioned Video World Models [15.4] 行動条件付き世界モデル(ACWM)は,映像の予測と意思決定に強く期待されている。
本稿では,多様な物理力学下での行動条件予測のための新しいベンチマークであるACWM-Physを紹介する。
論文参考訳(メタデータ) (Sat, 09 May 2026 00:00:47 GMT)
TSNN: A Non-parametric and Interpretable Framework for Traffic Time Series Forecasting [15.3] 本稿では,トラフィック時系列予測のための非パラメトリックかつ解釈可能なフレームワークであるTSNNを提案する。
提案したモデルは、トレーニング可能なパラメータなしで動作し、固有の解釈可能性を保持する。
実験では、TSNNは、現実世界の4つのトラフィックフローデータセットの典型的なディープラーニングモデルと比較して、競合的な性能を実現している。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:55:52 GMT)
Value-Decomposed Reinforcement Learning Framework for Taxiway Routing with Hierarchical Conflict-Aware Observations [15.3] コンフリクト対応タクシーウェイルーティング(CaTR)は、リアルタイムマルチエアクラフトタクシーウェイルーティングのための強化学習フレームワークである。
実験は、長社黄華国際空港をベースとした現実的な環境で行われる。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:32:11 GMT)
The Perceptual Bandwidth Bottleneck in Vision-Language Models: Active Visual Reasoning via Sequential Experimental Design [15.2] 高解像度の視覚的推論は、意味的推論だけでなく、知覚帯域幅の制限下でのタスク関連エビデンス獲得でもある。
我々はこの過程を逐次ベイズ最適実験設計(S-BOED)として定式化する。
高解像度ベンチマークの実験では、直接およびReActスタイルのベースラインよりも一貫した利得を示している。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:29:21 GMT)
L2A: Learning to Accumulate Pose History for Accurate 3D Human Pose Estimation [15.0] 既存の2D-3Dリフトヒトポーズ推定法は高い性能を達成している。
しかし,ネットワーク深度にまたがる歴史的ポーズ表現の利用は見過ごされた。
ネットワーク間履歴の特徴を効果的に活用するための履歴認識フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:48:20 GMT)
Skill Drift Is Contract Violation: Proactive Maintenance for LLM Agent Skill Libraries [14.8] LLMエージェントは、再利用可能なスキルライブラリにますます依存しているが、これらのスキルは、外部サービス、パッケージ、APIが進化するにつれて静かに崩壊する。
契約違反としてスキルドリフトを定式化し、スキル文書から実行可能な環境契約を抽出するsgnameを導入する。
sgnameは、599のドリフトとハードネガティブなケースに対してゼロの偽のアラームを発生させる。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:41:53 GMT)
Learning predictive models for combinations of heterogeneous proteomic data sources [14.8] 人体におけるタンパク質混合物の発現レベルを測定する複数の技術は、疾患の検出と理解の可能性を秘めている。
人体におけるタンパク質混合物の発現を測定するための2つのデータソース(全サンプルMSプロファイリングと多重化タンパク質アレイ)について検討した。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:53:24 GMT)
Privacy-Aware Video Anomaly Detection through Orthogonal Subspace Projection [14.6] ビデオ異常検出(VAD)システムは、プライバシの懸念を乗り越えながら精度を優先し、現実のデプロイメントに対する適合性を制限していることが多い。
本稿では,タスク非関連な変化を除去し,異常関連キューに着目した表現を生成する軽量モジュールであるOrthogonal Projection Layer (OPL)を提案する。
人物中心のシナリオにおけるプライバシーリスクに対処するために,ポーズや動きなどの識別不能な特徴を保ちながら,顔提示信号からの弱い監視を用いて顔属性を抑えるガイドOPL(G-OPL)を導入する。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:46:39 GMT)
Learning to Explore: Scaling Agentic Reasoning via Exploration-Aware Policy Optimization [14.6] 既存の手法の鍵となる制限は、通常、未分化の探査戦略を採用することである。
本研究では,LLMエージェントが不確実性が高い場合にのみ適応的に探索できる探索対応強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:44:18 GMT)
A Tale of Two Problems: Multi-Task Bilevel Learning Meets Equality Constrained Multi-Objective Optimization [14.5] 我々は、緩和された一般凸性仮定の下で、二レベル最適化(BLO)をマルチタスク設定に拡張する最初の試みを行う。
ECMOは、文献ではまだ研究されていない新しい問題である。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:59:33 GMT)
Contour-Native Bridge Defect Detection and Compact Digital Archiving with Frequency-Supervised Fourier Contours [14.4] AI支援によるブリッジ欠陥検査は、しばしば、保存、送信、再利用にコストがかかる粗い幾何学やマスクを備えたバウンディングボックスを生成する。
本研究では,検出された欠陥を画像空間におけるコンパクトで復元可能な輪郭レベルのベクトルレコードとして表現する方法について検討する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:11:24 GMT)
FragileFlow: Spectral Control of Correct-but-Fragile Predictions for Foundation Model Robustness [14.0] 本稿では,FragileFlowについて紹介する。FragileFlowはプラグイン正規化ツールで,正当性とフレギール予測を識別し,オフクラスの確率質量をクラスワイドの脆弱性リスク行列に整理する。
実験により、FragileFlowは一致したベースラインに対して提案された理論が直面するリスク対策を一貫して改善することが示された。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:25:07 GMT)
The Global Empirical NTK: Self-Referential Bias and Dimensionality of Gradient Descent Learning [14.0] 我々は,グローバル経験的ニューラルタンジェントカーネル (NTK) の構造をモデルとして検討した。
NTKは構造的にボトルネックがあり,その有効ランクを制約し,自己参照バイアスを生じさせることを示す。
全体として、NTKは、タスクソリューションに対するGDバイアスを説明できる、トラクタブルな構造を持っていることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:22:29 GMT)
When Can Human-AI Teams Outperform Individuals? Tight Bounds with Impossibility Guarantees [13.9] 人間とAIのチームは研究の70%で最高のメンバを上回りませんが、相補性が達成可能な時期を示す理論はありません。
信号検出理論と情報理論解析を統合することにより,信頼度に基づく広範囲なアグリゲーションルールの厳密な境界を導出する。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:46:11 GMT)
Bias by Necessity: Impossibility Theorems for Sequential Processing with Convergent AI and Human Validation [13.9] 非対称な注意蓄積から優先バイアスが生じることを証明している。
証明可能な情報境界を持つシーケンシャルコンディショニングからアンカーが出現する。
置換による正確なデバイアスは分解時間計算を必要とする。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:56:12 GMT)
Dolphin-CN-Dialect: Where Chinese Dialects Matter [13.8] 我々は、中国語と方言に富むシナリオに焦点を当てたストリーミング可能なASRモデルであるDolphin-CN-Dialectを提案する。
以前のバージョンと比較して、Dolphin-CN-Dialectはデータ処理、トークン化、トレーニング安定性、データサンプリング戦略を大幅に改善した。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:56:54 GMT)
TailedTS: Benchmark Dataset for Heavy-Tailed Time Series Prediction and Periodicity Quantification [13.7] TailedTSは2024年を通してウィキペディアの時間ごとのページビューから派生した大規模なベンチマークデータセットである。
データセットは月間約300万のウィキペディアページにまたがる約2469億のデータポイントで構成されている。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:56:32 GMT)
Attention-based graph neural networks: a survey [13.7] 注目に基づくGNNのための新しい二段階分類法を提案する。
我々はこれらの注意に基づく手法について,提案した分類法に従って詳細に検討する。
我々は、いくつかのオープンな問題と、注意に基づくGNNの今後の方向性について、私たちの考えを共有します。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:33:14 GMT)
Containment Verification: AI Safety Guarantees Independent of Alignment [13.6] 本稿では,エージェントフレームワーク自体の安全性を保証する封じ込め検証を導入する。
ハボックオラクルセマンティクスの下では、AIは型付きアクション空間全体にわたって制約のないオラクルとしてモデル化される。
モデル付き境界イベント、アクション引数、状態上で表現される境界強化性については、普遍的な保証を証明します。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:36:45 GMT)
EdgeFlowerTune: Evaluating Federated LLM Fine-Tuning Under Realistic Edge System Constraints [13.6] フェデレートされた微調整は、ユーザデータのプライバシを損なうことなく、エッジデバイスに大規模な言語モデル(LLM)を適用することができる。
We present EdgeFlowerTune, a deployment-oriented benchmark for federated LLM fine-tuning under real edge-system constraints。
EdgeFlowerTuneは、FlowerとMobileFineTuner上に構築された、商用AndroidスマートフォンとNVIDIAエッジ開発ボードにまたがる、リアルタイムのデバイスプラットフォームです。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:02:44 GMT)
EditSleuth: A Dataset of Grounded Reasoning Chains for Image-Edit Forensics [13.5] 既存の画像編集コーパスから構築した257,725個の画像編集三重項のデータセットであるEditSleuthを紹介する。
それぞれの例は、編集された画像、ソースイメージ、バイナリ編集マスク、12クラスの編集分類ラベル、難易度スコア、および6ステップの推論チェーンを含む。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:06:24 GMT)
FRACTAL: SSM with Fractional Recurrent Architecture for Computational Temporal Analysis of Long Sequences [13.3] 本稿では,長周期計算時間解析のためのフラクショナル・リカレント・アーキテクチャを提案する。
スペクトル特性とチューナブル指数を解析的に特徴づけた投影演算子を導出することにより,分数スケール不変メモリダイナミクスを符号化したスペクトル構造を保ちながら,近年の信号摂動に敏感な手法を提案する。
FRACTALはLong Range Arenaベンチマークで平均87.11%のスコアを獲得し、リストOpsタスクでは61.85%でS5モデルを上回った。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:38:44 GMT)
Mirror, Mirror on the Wall: Can VLM Agents Tell Who They Are at All? [12.8] 動物界では、ミラー自己認識(英: mirror self-recognition)は高次認知の標準的プローブであり、一部の種でのみ現れる。
擬似視覚言語モデル(VLM)エージェントに類似の機能が現れるのかを問う。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:10:00 GMT)
Robust Multi-Agent LLMs under Byzantine Faults [12.8] 大規模言語モデル(LLM)エージェントは、信頼性を向上させるためにピアツーピアネットワークを介して協力する傾向にある。
信頼性の低いエージェントやビザンティンのエージェントは、近隣のエージェントを誤った結論へと誘導し、システム全体の性能を低下させる可能性がある。
既存の手法は、リーダーベースの調整や自己報告された信頼に依存しており、どちらも敵の操作に影響を受けやすい。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:37:43 GMT)
Toward Web 4.0: Bidirectional Trust between AI Agents and Blockchain [12.8] 本稿では,双方向信頼フレームワークを中心に組織された体系化知識について述べる。
B方向では、ブロックチェーンがエージェントの信頼基盤、IDとアカウントの抽象化、パーミッションとデリゲート、インテント中心の実行、トークン化されたエージェント経済をどのように提供するかを検討する。
A方向では、セキュリティ監査、コンセンサス、ガバナンスなど、AIエージェントがコアブロックチェーンメカニズムに参加する方法について検討する。
論文参考訳(メタデータ) (Sat, 09 May 2026 12:42:07 GMT)
Region Seeding via Pre-Activation Regularization: A Geometric View of Piecewise Affine Neural Networks [12.5] 実際には、標準トレーニングは、原則的にサポートできるアーキテクチャよりも、データビジットされた地区における領域の洗練をはるかに少なくする。
我々の理論は、ニューロンの切替面をデータポイントに十分近い状態にすることで、局所的な近傍との交点を確保するのに十分な条件を提供する。
本稿では,タスク駆動型リファインメントを訓練の後半に支配し,早期分割を助長するプラグイン・アンド・プレイ型レギュレータを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:04:30 GMT)
Can MLLMs Reason About Visual Persuasion? Evaluating the Efficacy and Faithfulness of Reasoning [12.4] MLLMを予測前に推論するよう促すことは、常に役に立たず、説得力予測性能を低下させることさえ可能であることを示す。
本稿では,3次元忠実度評価フレームワークを導入し,合理性-決定整合性,合理性-画像の基底性,合理性-決定感度について述べる。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:18:53 GMT)
Preserving Foundational Capabilities in Flow-Matching VLAs through Conservative SFT [12.2] ConSFT(Reserve Supervised Fine-Tuning)は、壊滅的な忘れを軽減しつつ、ターゲット分布に適応する最適化目標である。
LIBERO と RoboTwin ベンチマークの ConSFT を最先端のフローマッチング VLA で評価した。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:59:03 GMT)
Learning Pure Quantum States in Any Dimension (Almost) Without Regret [12.1] 我々は、[arXiv:2406.18370]で最初に研究された最小累積障害を伴う量子状態トモグラフィーを、任意の有限次元純状態に拡張する。
累積乱れのない純状態トモグラフィーは、キュービットの特異性ではなく、キューディットに持続する幾何学的現象であることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:56:17 GMT)
ElasticFlow: One-Step Physics-Consistent Policy with Elastic Time Horizons for Language-Guided Manipulation [11.9] ElasticFlowは蒸留不要で物理に一貫性のある一段階のポリシーフレームワークである。
平均速度場を直接モデル化することで平均場理論を再構築する。
弾性時間ホライズンズ機構を導入する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:45:03 GMT)
ATAAT: Adaptive Threat-Aware Adversarial Tuning Framework against Backdoor Attacks on Vision-Language-Action Models [11.9] 本研究では,視覚経路を標的としたバックドア攻撃について検討した。
従来の攻撃パラダイムの障害の原因となる中核的障害を識別する:「グラディエント干渉」
適応型脅威認識型適応チューニングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:15:10 GMT)
Learning the Preferences of a Learning Agent [11.8] 逆強化学習は、観察された行動から好みを推測する手法を開発することを目的としている。
本稿では,学習者の嗜好を学習する問題を定式化する。
我々は、様々な選好学習アルゴリズムの理論的保証を確立し、そうでなければそのような保証は不可能であることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:28:22 GMT)
Sketch-and-Verify: Structured Inference-Time Scaling via Program Sketching [11.7] SKETCHVERIFYは、普遍的な精度向上ではなく、内部レベルのコストパフォーマンスポリシーである。
階層内では、スケッチが一致した候補数でのフラットサンプリングを支配します。
階層横断のスケッチはアップグレードに取って代わらない。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:54:51 GMT)
Semantic Voting: Execution-Grounded Consensus for LLM Code Generation [11.7] 最高の実行ベースのセレクタは、出力パターンの多数決を各構成で19-52ポイント上回る。
より深い思考は、多数決を12ppで改善するが、実行ベースのメソッドは、候補の多様性が低下するにつれて、フラットまたは低下し続ける。
これらの結果から,アグリゲーションルール問題ではなく,信号品質問題としてのフレーム推論時符号選択が可能となった。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:33:39 GMT)
Prediction Bottlenecks Don't Discover Causal Structure (But Here's What They Actually Do) [11.7] 次のステップの予測のためにのみ訓練されたMamba状態空間モデルは、単純な読み出しによってGranger-Causal構造を復元しているように見える。
我々は、再利用可能なファルシフィケーションベンチマークとしてそのクレームをテストするために使用されるプロトコルをパッケージ化し、そのクレームを5段階に分けた。
ベンチマークは持続するアーティファクトであり、上の各ステージはそのコントロールアームの1つです。
論文参考訳(メタデータ) (Sat, 09 May 2026 21:12:55 GMT)
Kaczmarz Linear Attention [11.7] リニアリカレントモデルはコンテキストを固定サイズの状態に圧縮し、情報を忘れ、書き、編集するルールを中心的な設計問題とする。
Gated DeltaNet (GDN) は、ゲート状態崩壊とデルタルール残差書き込みを結合し、学習可能な係数を用いて、忘れと更新の規模をバランスさせる。
状態形状,ゲート,リニアリカレンス,チャンクワイズ並列アルゴリズムを保存するGDNの1スカラー修正であるKaczmarz Linear (KLA)を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:07:01 GMT)
GRC: Unifying Reasoning-Driven Generation, Retrieval and Compression [11.5] 我々は、推論駆動型生成、推論強化テキスト表現、コンテキスト圧縮タスクを橋渡しするGRCというトレーニングフレームワークを提案する。
トレーニングされたモデルは、1回のフォワードパスで3つの目標を達成することができる。
このフレームワークの設計により、テキスト埋め込みの新しいパラダイムが実現される。
論文参考訳(メタデータ) (Sat, 09 May 2026 18:15:02 GMT)
Illusion-Aware Visual Preprocessing and Anti-Illusion Prompting for Classic Illusion Understanding in Vision-Language Models [11.3] VLM(Vision-Language Models)は、視覚的錯覚に対する体系的な偏見を示し、実際の視覚的差異を知覚するのではなく、記憶された事実を思い出させる。
本稿では,CVPR 2026 における第5回 DataCV Challenge Task 1 のトレーニングフリーフレームワークについて述べる。
私たちのソリューションは,第1位のソリューションのわずか0.47%という,この課題において2位を確保しました。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:52:23 GMT)
RareCP: Regime-Aware Retrieval for Efficient Conformal Prediction [11.3] 本稿では適応型コンフォーマル時系列予測のためのレギュレーション対応検索手法であるRareCPを紹介する。
RareCPはコサイン・アテンションの専門家の混合を通して局所的なキャリブレーション表現を学習する。
符号付き残基上に重み付き共形量子が形成され、非対称な予測間隔が生じる。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:12:07 GMT)
Done, But Not Sure: Disentangling World Completion from Self-Termination in Embodied Agents [11.2] VIGILは、端末のコミットメントを独立して測定できる評価フレームワークである。
VIGILのデフォルトプロトコルでは、エージェントはエゴセントリックなRGBのみを観察し、アクション・サクセス・シグナルを受信せず、各エピソードは、隠された世界状態に対して決定論的にチェックされたセマンティック・レポートで終了しなければならない。
これにより、ワールドステートコンプリート(W)とベンチマーク成功(B)の2つのスコアが得られます。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:24:07 GMT)
PrepBench: How Far Are We from Natural-Language-Driven Data Preparation? [11.2] 大規模言語モデル(LLM)の最近の進歩は、自然言語(NL)によるデータ準備へのパラダイムシフトの可能性を高めている。
既存のコード生成ベンチマークは、データ準備の重要な特徴を捉えていない。
3つのコア機能に沿ってNL駆動型データ準備を評価するために設計されたベンチマークであるPrepBenchを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:52:47 GMT)
VECTOR-Drive: Tightly Coupled Vision-Language and Trajectory Expert Routing for End-to-End Autonomous Driving [10.8] エンドツーエンドの自動運転は、交通シーンを理解し、運転意図を推測し、実行可能な動作計画を生成するモデルを必要とする。
本稿では,Qwen2.5-VL-3B上に構築された密結合型視覚言語アクションフレームワークであるVECTOR-DRIVEを提案する。
Bench2Driveでは、VECTOR-DRIVEは88.91のドライビングスコアを獲得し、代表的なエンドツーエンドとVLAベースのベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:34:50 GMT)
Posterior Concentration of Bayesian Physics-Informed Neural Networks for Elliptic PDEs [10.8] 楕円偏微分方程式(PDE)の一般クラスを解くためのベイズ物理学情報ニューラルネットワーク(PINN)の後部収縮速度について検討する。
後続分布は、ほぼ最小の速度で正確な解の周りに集中していることを証明する。
選択された事前はレート順応的であり、(ほぼ)最適速度での後続の契約は、正確な解の滑らか度レベルについて事前の知識を持たない。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:19:39 GMT)
MILD: Mediator Agent System with Bidirectional Perception and Multi-Layered Alignment for Human-Vehicle Collaboration [10.7] エージェントシステムアーキテクチャに基づくMILD(Mediator-in-the-Loop-Driving)システムを導入する。
MILDは、共同キャビンとアウト・オブ・キャビンの理解のための知覚エージェントと、コンプライアンスと説明可能なアクション提案を生成する軽量な戦略エージェントを統合する。
ECPOは自動検証器を利用して、エージェントを正確であるだけでなく、構造的にも完全であり、証拠によって裏付けられ、制約違反のない行動に向けて操る。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:04:41 GMT)
EvoMAS: Learning Execution-Time Workflows for Multi-Agent Systems [10.6] EvoMASは実行時のマルチエージェントワークフロー構築のためのフレームワークである。
EvoMASは単一エージェントベースラインと最近の自動マルチエージェントワークフロー設計手法より優れていることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:55:12 GMT)
PARD-2: Target-Aligned Parallel Draft Model for Dual-Mode Speculative Decoding [10.6] 投機的復号化は、軽量なドラフトモデルを用いて、LLM(Large Language Models)推論を加速する。
本稿では、信頼適応トークン(CAT)を最適化したデュアルモード投機デコードフレームワークであるPARD-2を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:50:58 GMT)
Why Do Aligned LLMs Remain Jailbreakable: Refusal-Escape Directions, Operator-Level Sources, and Safety-Utility Trade-off [10.5] 統一された大規模言語モデル(LLM)は、ジェイルブレイク攻撃に弱いままである。
整列モデルではRefusal-Escape Directions (RED) が引き続き表示可能であることを示す。
次に、REDは、モデルの演算子構造全体にわたる演算子レベルのソースからのコントリビューションに正確に分解可能であることを証明します。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:57:36 GMT)
CrystalREPA: Transferring Physical Priors from Universal MLIPs to Crystal Generative Models [10.4] 我々は、最先端の結晶生成モデルと、事前訓練されたユニバーサル機械学習の原子間ポテンシャルの間には、かなりの差があることを示す。
生成エンコーダの原子レベルで隠された状態を凍結MLIP表現と整合させるプラグイン・アンド・プレイ・フレームワークであるCrystalREPAを提案する。
クリスタルREPAは、生成結晶の熱力学的安定性、構造的妥当性、構造的忠実度を一貫して改善する。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:56:23 GMT)
Omni-scale Learning-based Sequential Decision Framework for Order Fulfillment of Tote-handling Robotic Systems [10.3] トテハンドリングロボットシステムの順序決定のためのOmni-scale Learning-based Sequential Decision Frameworkを提案する。
提案するフレームワークは,広範にデプロイされたトテハンドリングロボットシステムに対して,効率的かつ統一された順序充足決定フレームワークを提供する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:40:35 GMT)
IMPACT: An Implicit Active-Set Augmented Lagrangian for Fast Contact-Implicit Trajectory Optimization [10.2] 我々は,MPCCベースのCITOを定常性保証付きで解くための,CITOへの拡張ラグランジアンアプローチを開発した。
トラジェクトリ最適化ワークロードに適した効率的なC++実装を提供し、オープンソースCITOおよびCI-MPCベンチマークで評価する。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:19:05 GMT)
MolWorld: Molecule World Models for Actionable Molecular Optimization [10.1] 有用な候補は、有効な局所構造変換を通じて既知の分子から到達可能であるべきである。
既存の de novo と Single-molecule 最適化手法は、そのような到達性を明示的にモデル化していない。
分子間移動グラフを進化する探索状態として扱う分子世界モデル誘導フレームワークであるMolWorldを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:50:56 GMT)
Causal Stories from Sensor Traces: Auditing Epistemic Overreach in LLM-Generated Personal Sensing Explanations [10.0] 基礎となる証拠が不足している場合でも,個人の知覚的説明が一貫性を保ちうることを示す。
我々は、生成した説明が利用可能な感覚証拠以上の意味を持つ場合の尺度を用いる。
LLMは、データから十分なサポートを受けずに、異常な日々を原因とする。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:10:40 GMT)
CoLVR: Enhancing Exploratory Latent Visual Reasoning via Contrastive Optimization [9.7] 遅延視覚推論(CoLVR)のためのコントラスト最適化法を提案する。
CoLVRは多様で探索的な表現を、角度に基づく摂動によって導かれる、相対的に対照的な目的によって学習する。
実験により、CoLVRは潜伏表現の探索能力を大幅に向上させることが示された。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:47:00 GMT)
Cross-Modal RGB-D Fusion Transformer for 6D Pose Estimation of Non-Cooperative Spacecraft with Stereo-Derived Depth [9.7] 学習に基づく単分子法は、宇宙船のポーズ推定に広く採用されている。
彼らは固有の深さの曖昧さの問題に悩まされ、軌道で遭遇する厳しい照明条件下では失敗する傾向にある。
アクティブな深度センサーは、基本的に幾何学的な曖昧さに対処できるが、そのパワーと質量の要求により、ほとんどの宇宙船のプラットフォームには適さない。
この研究は、非協力宇宙船の6自由度(6-DOF)ポーズ推定のための受動的ステレオビジョンフレームワークを通じてこれらの問題に対処する。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:16:33 GMT)
BoostAPR: Boosting Automated Program Repair via Execution-Grounded Reinforcement Learning with Dual Reward Models [9.5] プログラム修復のための強化学習は、スパース実行フィードバックと、どの編集がバグを実際に修正するかが不明なシーケンスレベルの報酬によって妨げられる。
これらの課題に対処する3段階のフレームワークであるBoostAPRを紹介します。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:31:02 GMT)
Few-Click-Driven Interactive 3D Segmentation with Semantic Embedding [9.4] そこで本研究では,スパースでランダムにダウンサンプリングされた3D点を直接操作する対話型セグメンテーションフレームワークを提案する。
我々のフレームワークは、トランスフォーマーベースのエンコーダと階層型マスクデコーダで構成されており、マルチレベルなクロップ・アンド・マージ操作を統合している。
我々のモデルは、強いベースラインと比較してmIoUメトリックを20%以上改善します。
論文参考訳(メタデータ) (Sat, 09 May 2026 12:51:25 GMT)
Enhancing Consistency Models for Multi-Agent Trajectory Prediction [9.3] ECTrajは、訓練と軌道予測のための条件生成を改善した拡張CMパイプラインである。
トレーニング中のトップKマルチショット生成において,CMの直接 denoising を利用する。
論文参考訳(メタデータ) (Sat, 09 May 2026 00:23:08 GMT)
Fin-Bias: Comprehensive Evaluation for LLM Decision-Making under human bias in Finance Domain [9.1] Fin-Biasは、金融状況下での大規模言語モデル(LLM)を評価するためのベンチマークである。
Fin-Biasには8868の長期にわたる企業固有のアナリストレポートが含まれており、さまざまな業界から投資格付け(Bullish/Neutral/Bearish)を持つ高度なアナリストによって要約され分析されている。
我々は、LLMが生み出す投資評価を得るために、アナリストの投資評価と「フェイク」レーティングでさえも、ファームアナリストのレポートを付した大規模言語モデルを提示する。
論文参考訳(メタデータ) (Sat, 09 May 2026 18:28:40 GMT)
Probability-Flow Distillation: Exact Wasserstein Gradient Flow for High-Fidelity 3D Generation [8.9] 確率フロー蒸留(Probability-Flow Distillation, PFD)と呼ばれる自然に動機付けられた拡張法を提案する。
PFD はワッサーシュタイン勾配流と正確に対応し、したがって分布整合力学を原理とする。
PFDは, 細粒度, 高忠実度で3Dアセットを合成し, 既存の手法と比較して品質の向上を図っている。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:27:25 GMT)
Slipstream: Trajectory-Grounded Compaction Validation for Long-Horizon Agents [8.9] Slipstream(スリップストリーム)は、判断器を用いてエージェントの継続的な推論に対して候補の要約を検証する、軌道上の圧縮システムである。
タスクの精度を最大8.8ポイント改善し、エンドツーエンドのレイテンシを最大39.7%削減する。
論文参考訳(メタデータ) (Sat, 09 May 2026 00:47:43 GMT)
Dependency-Aware Discrete Diffusion for Scene Graph Generation [8.9] 本稿では,シーングラフ生成のための依存性を考慮した階層的制約付き離散拡散モデルを提案する。
我々のアプローチは、フォワードプロセスとリバースプロセスの間で構造とセマンティクスを分離し、モデルが条件付き依存関係をキャプチャすることを可能にする。
下流画像生成に投入すると,本手法はテキスト・ツー・イメージモデルよりもコンポジションアライメントが向上する。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:16:20 GMT)
Constraint-Aware Diffusion Priors for High-Fidelity and Versatile Quadruped Locomotion [8.8] 本稿では, Diff-CAST (Diffusion-guided Constraint-Aware Symmetric Tracking) を提案する。
従来のGAN識別器を置き換え、異種コレクションのロバストなデータスケーリングをアンロックする。
四足歩行の実験では、Diff-CASTはモード崩壊を緩和し、多様なスキル間のシームレスな移行を可能にし、堅牢でハードウェア準拠の移動を保証する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:47:49 GMT)
PMCTS: Particle Monte Carlo Tree Search for Principled Parallelized Inference Time Scaling [8.8] 我々は、ニューラルネットワークの評価に適し、公式なポリシー改善保証を維持できる第一原理の並列MCTSアルゴリズムであるParticle MCTS(PMCTS)を紹介した。
PMCTSは並列計算とうまくスケールし、一般的なニューラルネットワークのベースラインをドメイン間で大幅に上回る。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:54:07 GMT)
The Grounding Gap: How LLMs Anchor the Meaning of Abstract Concepts Differently from Humans [8.7] 大規模言語モデル (LLM) が, 抽象概念を人間と同じような方法で理解しているかどうかを考察する。
モデルと実験全体で、我々は一貫したパターンを見つけます。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:41:12 GMT)
A Market-Rule-Informed Neural Network for Efficient Imbalance Electricity Price Forecasting [8.7] 本稿では,不均衡価格形成規則を表現型ニューラルネットワークの潜在空間に組み込む,マーケットルールインフォーム型ニューラル予測フレームワークを提案する。
実験結果から,提案モデルでは,訓練可能なパラメータが大幅に少なく,学習時間も一般のディープラーニングベースラインよりも短く,競争予測性能が得られた。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:07:53 GMT)
Fit CATE Once: Model-Assisted Randomization Tests Without Sample Splitting [8.6] サンプル分割を伴わずにこれらの強度を組み合わせるモデル支援ランダム化試験を開発した。
鍵となる考え方は、残効の共分散構造から条件平均処理効果(CATE)の符号のないバージョンを推定することである。
代入不要なCATE推定は、不均一なサブグループとテストサブグループ特異的な治療効果の発見に有効であることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:03:33 GMT)
LAQuant: A Simple Overhead-free Large Reasoning Model Quantization by Layer-wise Lookahead Loss [8.5] 大規模な推論モデルは、長い自己回帰復号によって競合レベルの数学と符号化精度に達する。
ウェイト量子化はアクセラレーションの標準ツールであるが、長復号推論ベンチマークでは、代表的なレシピが正確さを失う。
そこで我々はLookAhead Quantization (LAQuant) を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:35:38 GMT)
Raymoval: Raycasting-based Dynamic Object Removal for Static 3D Mapping [8.4] 静的3次元マッピングにおける動的オブジェクト除去のためのレイキャストに基づくモジュールを提案する。
それぞれのスキャンは方位上昇格子上に投影され、各観測方向について、ビンワイドの最小範囲と、レイキャストによって計算された地図の第一ヒット距離を比較する。
最後に、空間的整合性検証ステップはラベルを洗練し、低い残留ダイナミクスと過剰除去の少ない静的マップを生成する。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:15:59 GMT)
Training with Harnesses: On-Policy Harness Self-Distillation for Complex Reasoning [8.3] インタイムハーネスは複雑な推論タスクにおいて大きな言語モデルを大幅に改善する。
emphOn-Policy Harness Self-Distillation (OPHSD)を紹介する。
OPHSDは、タスク固有のハーネス機能を学生モデルに内包する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:06:37 GMT)
SynerDiff: Synergetic Continuous Batching for Fast and Parallel Diffusion Model Inference [8.3] 既存の連続的な手法は、UNet-VAE中に深刻なリソース競合に悩まされる。
イントライントライントラレベルのシナジー上に構築された効率的な連続システムであるSynerDiffを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:39:39 GMT)
Rethinking Ratio-Based Trust Regions for Policy Optimization in Multi-Agent Reinforcement Learning [8.2] 共同優位推定法により重み付けされたエージェントごとの確率比を用いて、分散化アクターを更新する。
我々は,これらの付加的比に基づく信頼領域機構を乗法的に対称な幾何学的障壁に置き換える,新しい政策最適化目標であるマルチエージェント比対称性(MARS)を導入する。
MARSは環境レベルの総合的なパフォーマンスにおいてMAPPOとMASPOに一致または超える。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:14:27 GMT)
cuRegOT: A GPU-Accelerated Solver for Entropic-Regularized Optimal Transport [8.2] cuRegOTは、エントロピー正規化OTに適した高性能GPUソルバである。
我々は、CPUボトルネックを軽減するために、アモータイズされたシンボリック分析戦略を含むアルゴリズムとアーキテクチャの最適化スイートを紹介する。
CuRegOTは、さまざまなベンチマークタスクで最先端のGPUベースのソルバよりも大幅にスピードアップする。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:27:39 GMT)
Beyond Self-Play: Hierarchical Reasoning for Continuous Motion in Closed-Loop Traffic Simulation [8.2] 本稿では,ハイレベルなマルチエージェント相互作用推論と低レベルな連続軌道実現を組み合わせた階層型アーキテクチャを提案する。
SUMOをベースとした都市ネットワーク上での実験により,提案手法は自己再生や受動的模倣のベースラインと比較して,スムーズな制御と安全性を実現することが示された。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:31:34 GMT)
CROP: Expert-Aligned Image Cropping via Compositional Reasoning and Optimizing Preference [8.1] 美的画像トリミングは、空間的トリミングによってその構成を改善することにより、画像の美的品質を高めることを目的としている。
以前の手法は、しばしばサリエンシ予測や検索の強化に依存しており、タスクの中核的な要件である構成と美学の深い理解を無視している。
本稿では, 美学におけるVLMの分析・理解能力の活性化を目的とした, マルチモーダル推論タスクとして, 審美的作付けを再構築する新しいパラダイムを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:21:51 GMT)
Memory Inception: Latent-Space KV Cache Manipulation for Steering LLMs [8.1] メモリインセプション(MI)は、テキスト由来のキーバリュー(KV)バンクを選択層のみに挿入することで、遅延注意空間におけるステアリングを行う。
MIはステアリングを選択的KVアロケーションとして扱い、モデルがそれに向かう場所のみ潜在スロットを注入する。
MIは可視文字を書き換えることなく、中間会話の振る舞いシフトをサポートし、Qwen3上で最も高いシフト後アライメントを実現している。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:46:54 GMT)
DAPE: Dynamic Non-uniform Alignment and Progressive Detail Enhancement Techniques for Improving the Performance of Efficient Visual Language Models [7.8] 既存の手法は、テキストタグと画像ブロック間の情報密度と意味範囲の固有性と動的差異を見落としている。
本稿では、連続的な詳細導入を伴う動的クロスモーダルアライメントのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:47:43 GMT)
SynerMedGen: Synergizing Medical Multimodal Understanding with Generation via Task Alignment [7.8] マルチモーダルな理解と生成は 医療分野における魅力的なフロンティアです
既存の統合医療モデルは、理解と生成を相容れない目的として扱い、意味のある機能的シナジーを欠いている。
SynerMedGenは、ジェネレーション・アライン・アライン・アライメントの原理に基づいて構築された統一されたフレームワークである。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:13:58 GMT)
Decomposing and Steering Functional Metacognition in Large Language Models [7.6] 大規模言語モデルは機能的メタ認知状態の分解可能な空間を維持していることを示す。
これらの状態は、内部の活性化から線形に退避可能であり、異なる層回りのプロファイルを示す。
この結果から,ベンチマーク性能はタスク能力だけでなく,特定の機能的メタ認知状態の活性化を反映していることが示唆された。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:22:47 GMT)
Evolutionary Ensemble of Agents [7.5] EvEは、分散化されたフレームワークであり、アルゴリズム発見のためのライブで共進化するシステムにコーディングエージェントを編成する。
2つの共進化する人口を維持することで、EvEはエージェントを同期レースを通じて評価し、経験的Elo格付けを更新する。
固定初期エージェントや凍結した「ベスト進化」エージェントによって駆動される変種と比較して、EvEは位相ミスマッチを独自に回避する。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:56:10 GMT)
ReorgGS: Equivalent Distribution Reorganization for 3D Gaussian Splatting [7.4] 収束した 3D Gaussian Splatting (3DGS) モデルは、さらなる最適化のためにパラメータ化が不十分なまま、ターゲットシーンを近似することができる。
収束3DGSモデルの等価分布再構成法であるReorgGSを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:59:31 GMT)
When Agents Overtrust Environmental Evidence: An Extensible Agentic Framework for Benchmarking Evidence-Grounding Defects in LLM Agents [7.4] 大規模言語モデルエージェントは、ファイル、Webページ、API、ログを公開する環境対応の足場を通じて、ますます運用されるようになる。
環境基盤化は、文脈入力、証拠証明、鮮度検査、検証ポリシー、行動ゲーティング、モデル推論を含むシステムレベルの問題である。
この障害モードをベンチマークするためのエージェントフレームワークであるEnvTrustBenchを紹介します。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:32:27 GMT)
Process Matters more than Output for Distinguishing Humans from Machines [7.1] 既存のアプローチは、システムが人間の行動と区別できない行動や反応を生成できるかどうかを評価する。
認知科学は、行動が生成される過程を評価するという別の視点を提供する。
タスク性能が一致しても、診断プロセスレベルの特徴を引き出すために設計された30の認知タスクからなる電池であるCagCAPTCHA30を紹介する。
論文参考訳(メタデータ) (Sat, 09 May 2026 12:52:35 GMT)
Structural Interpretations of Protein Language Model Representations via Differentiable Graph Partitioning [7.1] ESM-2のようなタンパク質言語モデルは、タンパク質機能予測の強力な性能を達成するリッチな残基表現を学習する。
我々は、ESM-2表現をタンパク質接触グラフに投影するプラグイン$&$-playフレームワークを、$&$ apply $textbfSoftBlobGIN$で提案する。
酵素の分類全体で、SoftBlobGINは92.8%の精度と0.898マクロF1を達成している。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:01:02 GMT)
LLaVA-UHD v4: What Makes Efficient Visual Encoding in MLLMs? [7.1] LLaVA-UHD v4は,高解像度入力に適した,効率的かつ計算制御可能な視覚符号化方式である。
その結果、下流の性能を犠牲にすることなく、視覚符号化効率を大幅に改善できる可能性が示唆された。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:10:26 GMT)
Flame3D: Zero-shot Compositional Reasoning of 3D Scenes with Agentic Language Models [6.9] 3Dシーンの理解は、自由空間、オブジェクトの接地、仮説的なオブジェクト挿入、複雑な幾何学的関係、これら全てを外部ツールやデータソースと統合する。
3次元言語学習を動機づける広義の一般化は,3次元特化学習を伴わずに,推論時に達成できると論じる。
本研究では,シーンを編集可能な3Dメモリとして表現する学習自由フレームワークFlame3Dを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:35:27 GMT)
Geometry Guided Self-Consistency for Physical AI [6.9] KeyStoneは拡散に基づく行動生成のための推論時自己整合性手法である。
連続的なアクション空間に$K$の候補アクションチャンクをクラスタし、最大のクラスタのメドイドを返す。
単一軌道サンプリングよりも最大で textbf13.3% のタスク成功率を向上し、遅延オーバーヘッドを無視できる。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:14:30 GMT)
AESOP: Adversarial Execution-path Selection to Overload Deep Learning Pipelines [6.8] 現代の機械学習のデプロイメントは、動的推論パイプラインに特別なモデルを組み込むようになってきている。
この構造は, 単一モデルを対象とした既存手法では利用できない, 効率攻撃面を生成する。
脆弱性誘導経路ランキングと適応的損失重み付けを組み合わせたフレームワークであるAESOPを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:16:49 GMT)
Accelerating Zeroth-Order Spectral Optimization with Partial Orthogonalization from Power Iteration [6.6] ゼロオーダー最適化(ZO)は、大規模言語モデルの微調整において、ますます普及し、重要になっている。
近年の研究では,低次元部分空間探索によるZO分散の低減が試みられている。
本研究では,MuonのようなスペクトルデータセットがAdamWより優れている隠れ層トレーニング問題に焦点を当てる。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:16:45 GMT)
PRIM: Meta-Learned Bayesian Root Cause Analysis [6.5] PRIM (Prior-fitted Root cause Identification with Meta-learning) は因果メタラーニング手法である。
PRIMは、ベースラインと異常周期の間のデータ生成機構の変化を暗黙的に識別する。
明示的な統計的テストなしで分布差を推測し、テスト時にモデルフィッティングなしで因果構造を暗黙的に学習する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:14:09 GMT)
KEPIL: Knowledge-Enhanced Prompt-Image Learning for Prompt-Robust Disease Detection [6.4] 放射線学的所見は、実際には長い尾を持つが、いくつかの条件は表現されておらず、ゼロショット推論が不可欠である。
我々は、ゼロショットの一般化を安定させるために、キュレートされた医療知識を統合するプロンプトロバストフレームワークであるtextitKEPILを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:29:01 GMT)
AssemPlanner: A Multi-Agent Based Task Planning Framework for Flexible Assembly System [6.4] AssemPlannerと呼ばれるフレキシブルアセンブリシステムのためのマルチエージェントベースのタスク計画フレームワークを提案する。
自然言語で記述されたタスクを入力として取り、実行可能な逐次生産操作に変換する。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:36:21 GMT)
Streaming of rendered content with adaptive frame rate and resolution [6.3] 既存のソリューションは、固定フレームレートで、通常は毎秒30フレームまたは60フレームのコンテンツをレンダリングし、帯域幅が制限された場合の解像度を低下させる。
我々は、シーンの内容と動きに基づいてフレームレートと解像度を適応的に調整し、レンダリングコストを低減しつつ、人間の視覚システムの限界を利用して知覚品質を向上させる。
本稿では,軽量ニューラルネットワークが与えられた伝送帯域,コンテンツ,移動速度に対して,フレームレートと解像度の最適な組み合わせを予測するシステムを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:48:10 GMT)
The Pokémon Theorem and other Fairness Impossibility Results [6.3] 条件付き平均埋め込みに対する線形制約が公平性基準であることが示される。
また、不平等な基準レートが、これらの制約を過大評価する総予想の法則を成していることも示している。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:37:10 GMT)
Minimax Optimal Estimation of Transport-Growth Pairs in Unbalanced Optimal Transport [6.3] 本研究では,2次コストとKulback-Leibler辺縁罰則による不均衡輸送について検討した。
自然人口のターゲットは、地図だけでなく、輸送と成長のペアであると主張する。
輸送成長対の2つの推定器を複数の設定で開発する。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:39:47 GMT)
MBP-KT: Learning Global Collaborative Information from Meta-Behavioral Pattern for Enhanced Knowledge Tracing [6.0] 協調的情報に基づく知識追跡(KT)は,学習者の知識状態のモデリングを強化するための有望な方法である。
KTのための一般的なメタ行動パターン認識フレームワーク(MBP-KT)を提案する。
MBP-KTは、生の相互作用配列を異なるメタ行動パターンの組み合わせに変換する新しいメタ行動配列構造を導入している。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:10:44 GMT)
A Visuo-Tactile Data Collection System with Haptic Feedback for Coarse-to-Fine Imitation Learning [6.0] 擬似学習のための時間的に構造化されたコンタクトリッチな実演を生成するビジュオ触覚データ収集システムを提案する。
本システムでは、操作者が指で動作し、自然な触覚フィードバックを保持するダイレクトドライブグリップを導入する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:38:38 GMT)
Seeing the Needle in the Haystack: Towards Weakly-Supervised Log Instance Anomaly Localization via Counterfactual Perturbation [5.9] LogMILPは、バッグレベルの異常検出とインスタンスレベルの異常ローカライゼーションの両方を可能にする弱教師付きフレームワークである。
本手法は,プロトタイプ誘導構造モデルを用いてクリティカルログエントリをピンポイントする手法である。
3つの公開データセットの実験結果は、LogMILPが競合検出性能を達成することを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:21:13 GMT)
Constant-Target Energy Matching: A Unified Framework for Continuous and Discrete Density Estimation [5.9] 定目標エネルギーマッチング(CTEM)は、一般状態空間上の密度推定のための統合エネルギーベースのフレームワークである。
CTEMは、競合するベースラインの密度推定を大幅に改善し、標準サンプリング手順の下で高品質なサンプルを得る。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:50:46 GMT)
Continuum Robot Modeling with Action Conditioned Flow Matching [5.9] 腱駆動型ロボット(TDCR)の運動状態における形状の予測は依然として困難である。
本稿では,軽量な3DプリントTDCRハードウェアプラットフォームと,複数のカメラを備えたRGB-Dデータ収集パイプラインを提案する。
ロボットの3次元形状に運動状態をマッピングする点雲流マッチングモデルを学習する。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:22:49 GMT)
FugSeg: Fast Uncertainty-aware Ground Segmentation for 3D Point Cloud [5.8] FugSegは高速不確実性認識地上分割法である。
極格子マップが点雲表現として採用され、LiDARタイプ間の一般化性を保証する。
内部および横断的な接地ラベリング戦略は、直接見える接地細胞だけでなく、孤立または閉鎖されている細胞も識別する。
点レベルの接地セグメンテーションを実現するために, きめ細かい地盤標高推定法を導入する。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:44:48 GMT)
AHD Agent: Agentic Reinforcement Learning for Automatic Heuristic Design [5.8] AHD(Automatic Design)は、NP-hard最適化問題を解決するための有望なパラダイムとして登場した。
既存のAHDフレームワークは通常、固定されたコンテキスト内で大きな言語モデル(LLM)を受動的ジェネレータとして扱う。
本稿では,新たなツール統合多ターンフレームワークであるAHD Agentを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:36:45 GMT)
Post-hoc Selective Classification for Reliable Synthetic Image Detection [5.7] ディープニューラルネットワークベースの合成画像検出器(SID)は、デプロイメントの信頼性を欠いている。
本稿では,SIDが低信頼度予測を行なわないようにすることで,選択的分類(SC)戦略を提案する。
本稿では,各層から抽出した信頼度を最終信頼度推定に集約する選好最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 00:25:22 GMT)
Emergent Semantic Role Understanding in Language Models [5.7] 本研究では,言語モデルの事前学習中に意味的役割理解が出現するか,タスク固有の微調整を必要とするかを検討する。
モデルスケール全体にわたって、凍結表現には意味的な役割の情報が含まれており、性能は向上するが、十分に調整されたモデルには適合しない。
セマンティックな役割構造は言語モデリングの目的から生まれるが、その内部実装はモデルスケールが大きくなるにつれてより分散表現へとシフトする。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:01:36 GMT)
Computer Science Conferences Should Require Nonrepudiable Experimental Results [5.7] 我々はその根底にある問題実験を非調査と呼ぶ。
準拠プロトコルは、著者が後で変更したり否定したりできない方法で、紙の中の数値を実際の実行された計算に結び付けなければならない。
この問題が解決可能であることを示すため、トレーニングデータにアクセスせずに署名されたレポートを生成するGoのリファレンス実装であるK-Veritasを構築した。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:05:59 GMT)
SHIELD: Scalable Optimal Control with Certification using Duality and Convexity [5.7] ShiELD は階層的なアルゴリズムであり、凸プログラムにおける決定のマグニチュードと制約セットの両方を削減する。
複雑なマルチモーダル交通シナリオにおけるモデル予測制御(SMPC)における ShiELD の有効性を検証する。
論文参考訳(メタデータ) (Sat, 09 May 2026 21:15:28 GMT)
Relightable Gaussian Splatting for Virtual Production Using Image-Based Illumination [5.7] 仮想プロダクション(VP)は、背景画像と画像ベースの照明の両方を提供するためにLED壁を使用する。
逆レンダリングでは、物理ベースのレンダリングは環境マップを用いて、推定3次元幾何学と照明に依存している。
本稿では,ガウススプラッティングを用いた3次元再構成とリライティングのためのVP固有のフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:04:06 GMT)
Detecting Deception, Not Deepfakes: Why Media Forensics Needs Social Theories [5.5] ディープフェイク検出は、音声またはビデオクリップが与えられた場合に、それが本物か合成的であるかを判断する分類タスクとしてフレーム化されている。
合成メディアのより優れた分類器は、特にビデオ通話や音声通話における偽造のようなインタラクティブなディープフェイクにおいて、この問題を解決できないと我々は主張する。
人工物に基づく検出が依存する5つの仮定を特定し、生成モデルの改善に伴って5つすべてが侵食されていることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:46:31 GMT)
BEACON: Cross-Domain Co-Training of Generative Robot Policies via Best-Effort Adaptation [5.5] BEACONは、重複ドメインのコトレーニングを、不一致を意識した重要/重み付け問題として論じている。
我々は、スケーラブルなインスタンスレベルの不一致推定器を開発し、ポリシーと重みの更新を交互に行い、マルチソース拡張を行う。
論文参考訳(メタデータ) (Sat, 09 May 2026 00:15:28 GMT)
PRISM: Fast Online LLM Serving via Scheduling-Memory Co-design [5.5] 本稿では、要求対応のラッドツリー(DART)とクエリ対応のスケジューラ(QAS)を共同設計し、要求の受け入れを正確なKV保持と整合させるPRISMを提案する。
評価の結果,最強のベースラインに対して,PRISMはQPS P99 TTFT平均を23.3%,P99 TTFT平均を37.1%削減し,KV-cacheの精度は4Bモデルと13Bモデルでそれぞれ5.9,12.2ポイント向上した。
論文参考訳(メタデータ) (Sat, 09 May 2026 00:48:25 GMT)
PromptDx: Differentiable Prompt Tuning for Multimodal In-Context Alzheimer's Diagnosis [5.4] 医学画像における深層学習モデルは、通常、訓練中に学んだ知識を思い出して患者を診断するパラメトリック記憶として機能する。
これは、医師が過去の類似した記録を参照することによって、新しい症例を診断するために類推的推論を用いる臨床実践とは対照的である。
本稿では,事前学習したTabPFNをICLエンジンとして活用し,マルチモーダル表現とのシームレスな統合を実現する新しい診断・参照フレームワークであるPromptDxを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:05:34 GMT)
ProactBench: Beyond What The User Asked For [5.4] ProactBenchは、textscEmergent、単一の公開アンカーからの推論、textscCritical、複数のアンカー間での合成、textscRecovery、タスク完了後の前方にある値の3つのフェーズ型に分解する。
我々の情報アシンメトリーは、スタイル強調スコア、漏洩、外部コンテキスト汚染、情報ダンプに対して防御します。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:56:04 GMT)
VISTA: A Benchmark for Real-Time Video Streaming under Network Impairments in Surgical Teleoperation [5.4] VISTAは、前方ビデオパスの障害が映像品質、時間的連続性、ヒューマンタスクのパフォーマンスにどのように影響するかを研究するためのベンチマークである。
本稿では,前向きビデオパスの障害が映像品質,時間的連続性,ヒューマンタスクパフォーマンスにどのように影響するかを検討するためのベンチマークであるVISTAを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:09:18 GMT)
Learning Theory of Transformers: Local-to-Global Approximation via Softmax Partition of Unity [5.4] 本稿では,コンパクトユークリッド領域上の回帰タスクに対するトランスフォーマーネットワークの学習理論について検討する。
本稿では,対象関数の局所近似を構築し,それらを大域的近似に集約するトランスフォーマーの構成的近似フレームワークを提案する。
2つのエンコーダブロックと標準単層フィードフォワードネットワークを備えた高密度トランスフォーマーは、$$$Hlder連続関数に対して均一な$varepsilon$-approximation誤差を実現できることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:02:37 GMT)
Removing the Watermark Is Not Enough: Forensic Stealth in Generative-AI Watermark Removal [5.3] 現在の透かし除去攻撃は、この強い目的を達成できないことを示す。
4つの攻撃ファミリーにまたがる6つの最先端の除去装置のうち、独立した法医学的検出装置は、クリーン画像からの除去処理された出力を98%以上の真正の速度で区別する。
この信号は, 共通の後処理下で持続し, 特徴的な2相スペクトル変形を示し, 除去成功, 画像品質, 法医学ステルスの3方向張力が得られることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:45:48 GMT)
HULK: Large-scale Hierarchical Coordination under Continual and Uncertain Temporal Tasks [5.3] この研究は、連続的かつ不確実な時間的タスクの下での大規模調整問題に取り組む。
提案された階層的なフレームワークであるHULKは、2つのインターリーブされたレイヤで構成されている。
種々の時間的タスクと環境不確実性の下で, 大規模異種システムに対して厳密に検証する。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:10:40 GMT)
FLUX: Geometry-Aware Longitudinal Flow Matching with Mixture of Experts [5.3] 連成輸送モデルと教師なし状態発見のための幾何認識型縦流マッチングフレームワークFLUXを紹介する。
Across manifold control, a regime-switching Lorenz system, widefield cortical calcium imaging during associative learning, and FLUX, FLUX restructing longitudinal transport while recovering interpretable regime structure。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:36:00 GMT)
ITBoost: Information-Theoretic Trust for Robust Boosting [5.3] ノイズの多い環境に対する情報理論的トラストブースティング(ITBoost)を提案する。
ITBoostは、ノイズの多い環境で堅牢性を改善し、クリーンなデータ上での最高の平均パフォーマンスを維持します。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:00:13 GMT)
Can We Formally Verify Neural PDE Surrogates? SMT Compilation of Small Fourier Neural Operators [5.3] トレーニングされた重みと格子が固定されると、FNOのスペクトル畳み込みは線形写像であることを示す。
その結果、音質-可聴性トレードオフを明確化し、生産規模のニューラル演算子の形式的検証に必要なものを指し示している。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:16:24 GMT)
Dynamic Meta-Metrics: Source-Sentence Conditioned Weighting for MT Evaluation [5.2] 既存のメトリクスのソース/文条件の組み合わせを学習する機械翻訳評価フレームワークであるDynamic Meta-Metrics (DMM)を提案する。
本研究では,クラスタ毎の解釈可能なコンバインダーと,ソースクラスタの責務と重みが連続的に変化する探索的ソフトコンディショニング拡張について検討する。
論文参考訳(メタデータ) (Sat, 09 May 2026 18:12:10 GMT)
Survey-aware Machine Learning: A Guideline for Valid Population Health Inference based on Scoping Review [5.0] 複雑な健康調査でトレーニングされた機械学習モデルは、プライマリサンプリングユニット、成層変数、サンプリングウェイトを無視することが多い。
そこで我々は,9段階のガイドラインであるサーベイ・アウェア・機械学習(SaML)を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:03:49 GMT)
RLearner-LLM: Balancing Logical Grounding and Fluency in Large Language Models via Hybrid Direct Preference Optimization [5.0] ハイブリッドDPOを用いたRLearner-LLMを提案する。
RLearner-LLMはSFTよりも最大6倍NLI改善する。
Gemma 4 E4B-itでは、Hybrid-DPOは5つのドメインのうち4つのNLIを持ち上げる。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:19:09 GMT)
Deterministic Decomposition of Stochastic Generative Dynamics [4.9] 本稿では,境界および条件定式化の両方を通して生成力学を学習するためのフローベースフレームワークを提案する。
提案手法は,確率輸送における浸透的寄与を調節することにより,解釈可能かつ制御可能なサンプリングを可能にすることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:31:17 GMT)
When (and How) to Trust the Expert: Diagnosing Query-Time Expert-Guided Reinforcement Learning [4.9] 有能だが最適でないコントローラーを備えた連続制御問題(チューニングされたPID、手動設計の歩行)
成長するメソッドのファミリーは、RLの間、クエリ可能な専門家としてそのようなコントローラを使用するが、各メソッドは、不完全な専門家テストなしで、異なるベンチマークで独立して提案されている。
我々は,共有SACバックボーン,共通HPOおよび評価プロトコル,100/50種毎(env,メソッド),専門家の授業経験,行動バイアス,観察ノイズの劣化について比較を行った。
論文参考訳(メタデータ) (Sat, 09 May 2026 18:48:17 GMT)
Probing the Impact of Scale on Data-Efficient, Generalist Transformer World Models for Atari [4.8] 我々は最小限のトランスフォーマー・ワールド・モデルを用いて、Atari 100kベンチマークのスケーリングの振る舞いを分析します。
この結果から,同一のオフラインデータ予算とモデル能力に制約された場合でも,環境は異なるスケーリング体制に陥ることが判明した。
統合された環境では、26のAtari環境でトレーニングされた単一のトランスフォーマーが、共同トレーニングがスケーリングのダイナミクスを安定化することを明らかにする。
論文参考訳(メタデータ) (Sat, 09 May 2026 00:43:39 GMT)
Detect, Localize, and Explain: Interactive Hierarchical Log Anomaly Analytics with LLM Augmentation [4.8] Krone-vizは,Kroneをベースとした対話型可視化システムである。
階層的なログ分析を解釈可能で、ソフトウェアエンジニアやシステムオペレーターにとって実行可能である。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:38:41 GMT)
MultiMedVision: Multi-Modal Medical Vision Framework [4.8] 共同2D/3D表現学習のための統合フレームワークであるMultiMedVisionを提案する。
モデルでは3次元回転位置埋め込みと可変長列パッキングを用いて混合モードバッチを処理する。
5倍少ないデータを持つ1つの共有エンコーダを使用して、MultiMedVisionは両方の2Dベンチマークで競合性能を達成する。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:29:24 GMT)
Compact SO(3) Equivariant Atomistic Foundation Models via Structural Pruning [4.8] 本稿では,SO(3)同変原子基盤モデルの構造解析法を提案する。
プルーニングはチャネルと順序次元に沿って適用され、各既約表現は完全なブロックとして保持または削除される。
プルーニングされたMACE-MPモデルは、マトベンチディスカバリーのリーダーボード上の9つの指標のうち7つで、公式のオフスクラッチトレーニングされた小さなモデルよりも優れています。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:07:03 GMT)
CAST: Channel-Aware Spatial Transfer Learning with Pseudo-Image Radar for Sign Language Recognition [4.8] 本稿では,チャネル認識型空間移動学習を利用した2重ストリームアーキテクチャであるCASTを提案する。
提案フレームワークは3つの物理対応アーキテクチャと事前訓練された視覚バックボーンを組み合わせており、レーダーのみの制約の下で動作している。
実験の結果、アーキテクチャは5倍のクロスバリデーションで80.5%のTop-1精度を達成した。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:02:40 GMT)
Practical Scaling Laws: Converting Compute into Performance in a Data-Constrained World [4.7] チンチラの$L = E + A/N+ B/D$は、主要なスケーリング法則形式であるが、非インフォームベースラインで飽和するのではなく、ユニークなデータが縮小するにつれて分散する。
本稿では,損失を低容量化,減量化,過度化に分解する閉形式拡張を提案する。
視覚、科学ML、言語ドメインの4つのマルチエポックな実験で検証する。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:07:01 GMT)
CATS: Curvature Aware Temporal Selection for efficient long video understanding [4.6] 本稿では,クエリフレーム関係の時間的幾何を明示的にモデル化する,曲率を考慮したフレーム選択法であるCATSを提案する。
固定されたバックボーンとフレームの予算の下では、CATSは従来よりずっと優れている。
LLM-as-a-judgeプロトコルを用いて記述生成を評価し,CATSがよりコヒーレントで情報的な出力を生成することを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:47:46 GMT)
M$^3$: Reframing Training Measures for Discretized Physical Simulations [4.5] M$3$は、物理的変動に応じて空間を分割し、複数のスケールにまたがって監督を割り当てることで、トレーニング対策のバランスをとるフレームワークである。
様々な離散化を伴う3つの産業規模のデータセットに適用すると、M3$は連続的な物理領域における予測を一貫して改善する。
これらの結果は、演算子学習における重要な要素としてデータ分布を強調し、M$3$は、物理的に一貫したモデリングのためのスケーラブルでデータ効率の良いアプローチである。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:56:14 GMT)
Cosine-Gated Adam-Decay: Drop-In Staleness-Aware Outer Optimization for Decoupled DiLoCo [4.5] Cosine Gated Adam Decay (CGAD) は、Adamの第1および第2モーメントバッファに入る前に、入ってくる擬似階調を$() = () e-$でスケールする単純な年齢対応外装である。
CGADの列車は、私たちが掃除する制御された遅れを安定して通過します。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:16:29 GMT)
Machine Learning Research Has Outpaced Its Communication Norms and NeurIPS Should Act [4.4] 機械学習の研究は指数関数的に増加しているが、そのコミュニケーション規範はそうではない。
NeurIPSは明示的で測定可能な書き込み標準を採用するべきだ、と私たちは主張する。
我々は280万のarXiv論文(1991-2025)、24,772のNeurIPS論文(1987-2024)、および24.5万のPubMed論文(1990-2025)を分析した。
我々はNeurIPS 2027でNeurIPSがパイロットできる7つの標準を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:13:21 GMT)
Understanding Student Effort Using Response-Time Propensities During Problem Solving [4.2] 多段階問題解決における努力は、直接的に観察されることはめったにない。
スケーラブルな取り組みシグナルとして、ステップツーステップのレスポンスタイム。
反応時間確率は学生の中で中等度から強い安定性を示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:27:15 GMT)
Egocentric Whole-Body Human Mesh Recovery with Prior-Guided Learning [4.2] 本研究では,1つの自我中心画像から全身メッシュを再構築する事前誘導学習フレームワークを提案する。
複数のエゴセントリックなベンチマークによる実験では、最先端の手法と比較して、全身の再構築が改善された。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:59:01 GMT)
Contextual Plackett-Luce: An Efficient Neural Model for Probabilistic Sequence Selection under Ambiguity [4.2] コンテキストプラケット・リュック(Contextual Plackett-Luce)は、配列選択のための構造化確率モデルである。
完全自己回帰予測と並列シーケンス選択のハイブリッドと見なすことができる。
強い平行基線に比べて構造整合性を改善し、曖昧な監督を受ける。
論文参考訳(メタデータ) (Sat, 09 May 2026 18:52:53 GMT)
DiagnosticIQ: A Benchmark for LLM-Based Industrial Maintenance Action Recommendation from Symbolic Rules [4.1] 複雑な工業資産の監視は、センサーの条件に基づいて引き起こされるエンジニアによる象徴的な規則に依存している。
ルールをメンテナンスステップに変換するには、長年の実践を通じて得られた資産固有の知識が必要です。
このルール・ツー・アクション・ステップの意思決定支援としてLLMが有効か検討し,6,690名の専門家による複数選択質問をベンチマークした。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:17:39 GMT)
Evolution of Log-Based Detection Rules in Public Repositories [4.1] 本稿では,2つの広く利用されているリポジトリにおける検出規則の進化の経時的解析について述べる。
約56%のルールが、検出ロジックの少なくとも1つのリビジョンを実行していることがわかった。
規則の寿命全体では、進化は主として単調ではなく、節の追加と削除の両方の規則の半数以上である。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:58:48 GMT)
AI Expert Twin: Capturing Expert Cognition for Human-Centred, Practice-Based Learning [3.9] 本稿では、専門家の知識をモデル化する認知中心のフレームワークであるAI Expert Twinを紹介する。
我々は、専門家の認知を3層表現として定式化し、このモデルの下で専門家の知識を捉える。
このフレームワークは、職業教育やクリエイティブ産業などの分野にまたがって移行できるように設計されている。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:23:04 GMT)
Robust Server Defense Against Unreliable Clients in One-Shot Fair Collaborative Machine Learning [3.9] 協調機械学習(CML)は、複数のクライアントがデータ分散環境でグローバルモデルを共同でトレーニングすることを可能にする。
クライアントは、合成または処理されたプロキシデータを共有することでのみ、サーバと通信する。
この設定では、悪意のあるクライアントであろうと非悪意であろうと、信頼できないクライアントであろうと、特定のグループを好む偏りのあるプロキシデータを提供できる。
両レベル最適化の定式化に基づくサーバサイド・ディフェンス・フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:19:31 GMT)
PASA: A Principled Embedding-Space Watermarking Approach for LLM-Generated Text under Semantic-Invariant Attacks [3.8] PASAは、原則付き、堅牢で、歪みのない透かしアルゴリズムである。
セマンティックレベルで透かしを埋め込んで検出する。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:09:01 GMT)
Lost in Volume: The CT-SpatialVQA Benchmark for Evaluating Semantic-Spatial Understanding of 3D Medical Vision-Language Models [3.7] 近年の3次元医用視覚言語モデルの進歩により、ボリューム画像やテキストに対する共同推論が可能になった。
これらのモデルが3次元ボリュームから空間的基底解剖学を学習したのか、あるいは主に学習前と言語相関に頼っているのかは、まだ不明である。
我々は3次元CTデータにおける意味空間的推論を評価するためのベンチマークであるCT-SpatialVQAを紹介する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:16:00 GMT)
Spherical Boltzmann machines: a solvable theory of learning and generation in energy-based models [3.7] エネルギーベースモデル(英: Energy-based model、EBM)は、統計物理学にヒントを得たフレキシブルな生成アーキテクチャである。
球状ボルツマン機械(SBM)の高次元限界における可溶性ESMの解析
論文参考訳(メタデータ) (Sat, 09 May 2026 16:15:18 GMT)
Shapley Regression for Rare Disease Diagnosis Support: a case study on APDS [3.5] 活性化PI3K8症候群(英: Activated PI3K8 syndrome)は、PIK3CDまたはPIK3R1の変異によって引き起こされる稀な遺伝性免疫疾患である。
シェープ回帰(Shapley regression)は、線形予測器を k-加法的協調ゲームに置き換える新しいゲーム理論モデルである。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:30:54 GMT)
Canonical Functionalism: Defining Functional Structure without Observer-Relative Semantic Maps [3.4] 意識に関する計算機能主義は、物理的システムの観察的相対的解釈に依存するため、しばしば批判される。
本稿では,この問題を回避した関数論の数学的洗練を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:08:40 GMT)
Different Prompts, Different Ranks: Prompt-aware Dynamic Rank Selection for SVD-based LLM Compression [3.3] PARSE は $textbfP$rompt-$textbfA$ware $textbfR$ank $textbfS$election as $textbfE$xperts in SVD-compressed LLMs のトレーニング後のフレームワークである。
LLaMA-7Bの圧縮比0.6で平均タスク精度を最大10%改善し、2.5$times$プリフィルと2.4$times$ネイティブSVD実行によるデコードスピードアップを実現している。
論文参考訳(メタデータ) (Sat, 09 May 2026 00:02:33 GMT)
Finite Volume-Informed Neural Network Framework for 2D Shallow Water Equations: Rugged Loss Landscapes and the Importance of Data Guidance [3.0] データガイドFVM-PINN'は,非構造化メッシュ上で評価された強形式残差を,微分可能でバランスの取れた有限体積損失(FVM)に置き換えるフレームワークである。
このフレームワークは、SRH-2Dアンカーデータから正確なサロゲートを構築する。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:03:56 GMT)
Text Corpora as Concept Fields: Black-Box Hallucination and Novelty Measurement [3.0] 本稿では,テキストコーパスのtextbfConcept Field について紹介する。
我々は、観測されたデルタとフィールドの局所ガウス推定の間の平均的な絶対的なz-距離である$で、フィールドとの合意を採点する。
提案手法は, 連邦規制法典に基づく接地性検出と, プロジェクト・グーテンベルクにおける新規性検出の2つの大規模設定において評価される。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:34:20 GMT)
FlowADMM: Plug-and-play ADMM with Flow-based Renoise-Denoise Priors [3.0] FlowADMMは、逆問題を解決するための最先端のフローベース生成アルゴリズムである。
本研究では, FlowADMMが, 逆問題に対するフローベース生成手法の最先端性能を実現することを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:21:01 GMT)
Bloch Siegert Physics in a Reconfigurable Photonic Binary Lattice [3.0] 静的強制下での二元格子におけるブロッホ・シーゲルトシフトの最初の実験的実現について報告する。
我々は、4つの共振順序にまたがるコヒーレント周期ジャンプを観察し、予測周期則を定量的に検証する。
本研究は, 量子光学現象とフロケ0.98輸送のためのスケーラブルなテストベッドとして, プログラマブルフォトニック格子を構築した。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:54:34 GMT)
A low-cost mockup to simulate robotic laser cutting in nuclear decommissioning [3.0] 本稿では, 原子力廃炉における容器のレーザ切断過程をシミュレートする, 低コストな実験モックアップを提案する。
紫外線感受性顔を持つ立方体容器を支持する3軸テーブルと、レーザをシミュレートする紫外線トーチを有するシリアルマニピュレータと、カメラとフィデューシャルマーカーに基づく視覚システムとから構成される。
実験の結果、当初は未調整のシステムであったにもかかわらず、エンドエフェクターのポーズが制御された場合、全体的な平均精度は3.9mm(sd 2.5mm)、紫外線が制御された場合には2.4mm(sd 1.3)mm(sd 1.3)である。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:37:07 GMT)
WATSON: Leveraging Data Watchpoints for Shadow Stack Protection on Embedded Systems [2.8] 本稿では,組込みシステムのための効率的かつ効果的なシャドウスタックソリューションWATSONを提案する。
標準のハードウェアデバッグユニットであるデータウォッチポイントを活用して,組み込みシステム上でのシャドウスタック保護を実現している。
我々は,ARM CortexMアーキテクチャ上でWATSONのプロトタイプを実装し,そのコンセプトを他のプラットフォームにも適用する。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:53:15 GMT)
Enhanced quantum capacity thresholds from symmetry [2.8] 2つの原型雑音モデルのキャパシティ閾値が顕著に増加することを示す。
脱分極チャネルの場合、これが18年ぶりに改善された。
表現論的計算は、チャネルの指数関数的に多くのクラウス作用素が対称空間を消滅させることを示している。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:44:57 GMT)
Geometric and Topological Obstructions to Hermitianization in Quasi-Hermitian Quantum Systems [2.7] 準エルミート量子系は類似性変換によって等価なエルミート系に写像することができる。
本研究では, 計量誘起接続の曲率から生じる幾何学的障害物と, 非自明なホロノミーから生じる位相的障害物の2つを同定した。
この結果は、準エルミート系のエルミート化のための幾何学的および位相的基礎を確立する。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:54:13 GMT)
Evaluating Pragmatic Reasoning in Large Language Models: Evidence from Scalar Diversity [2.5] 本研究は,複数のモデルおよび実験環境における直接確率測定とメタinguistic promptingの比較を行った。
その結果, 評価手法が相反する結果が得られず, 実用的行動はモデルファミリ, 促進戦略, タスク構造によって大きく異なることがわかった。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:28:50 GMT)
Supersampling Stable Diffusion and More: An Approach for Interpolating Neural Networks Using Common Interpolation Methods [2.5] 定数係数で乗算すれば、畳み込みカーネルを正確にスケールできる数学的手法を示す。
本研究では,ディープニューラルネットワークが高精度なトレーニングデータに適応できることを実証する。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:13:21 GMT)
SkCC: Portable and Secure Skill Compilation for Cross-Framework LLM Agents [2.4] SkCCはLLMエージェント用のコンパイラで、エージェントスキル開発に古典的なコンパイルを導入する。
この設計では、サブ10msのコンパイルレイテンシ、94.8%のプロアクティブなセキュリティトリガーレート、フレームワーク間で10-46%のトークンセーブを実現している。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:12:46 GMT)
MCP-Cosmos: World Model-Augmented Agents for Complex Task Execution in MCP Environments [2.3] 我々は,生成的世界モデル(WM)をMCPエコシステムに注入し,予測タスク自動化を実現するフレームワークであるMPP-Cosmosを提案する。
我々は、BYOWM(Bring Your Own World Model)戦略により、エージェントが状態遷移をシミュレートし、実行前に潜在空間で洗練を計画できることを示した。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:25:56 GMT)
Trustworthy AI: Ensuring Reliability and Accountability from Models to Agents [2.3] 機械学習(ML)システムの信頼性と説明責任を保証するための理論的保証付きアルゴリズムを開発する。
この論文は、情報理論、最適化、統計的学習に基づくツールを導入し、バイアスを緩和し、任意の決定を減らし、コンテンツの証明を保証する。
大規模言語モデル(LLM)の透かしによる生成AIにおける説明責任の確保
論文参考訳(メタデータ) (Sat, 09 May 2026 14:11:36 GMT)
A Learning Method for Symbolic Systems Using Large Language Models [2.3] 我々は、データから純粋に象徴的な戦術をマイニングするために、LLM2Ltacをインテリジェントシンセサイザーとして提案する。
我々は,Rocq 8.20.0 上で LLM2Ltac を実装し,標準ライブラリの 11,725 個の定理をマイニングする。
その結果、採掘された戦術は23.87%の定理を証明できるようにCoqHammerを改善し、改良されたCoqHammerとClaude Codeを統合すると、全体の定理は9.90%増加した。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:05:02 GMT)
Lost in Translation? Exploring the Shift in Grammatical Gender from Latin to Occitan [2.3] 本稿では,この現象を語彙レベルと文脈レベルで解析するための解釈可能なディープラーニングフレームワークを提案する。
従来のトークン化戦略は、この低リソースの歴史的環境において不十分に堅牢であることを示す。
我々は、文法的ジェンダー予測に対する様々な音声カテゴリーの貢献を定量化する。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:36:49 GMT)
PACT: Peak-Aware Cross-Attention Graph Transformers for Efficient Storm-Surge Emulation [2.3] 駅レベルのストームサージ予測を効率的に行うために,ピーク対応のクロスアテンショングラフ変換器であるPACTを提案する。
PACTは、各フォースパッチをグラフとして表現し、GraphSAGEで空間構造をエンコードし、学習されたステーションクエリを使用してノード情報を集約する。
米国北東部海岸沿いの干潮帯のステーションでは、RMSEとMAEの双方で強い時間的グラフニューラルネットワークのベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:22:13 GMT)
100,000+ Movie Reviews from Kazakhstan: Russian, Kazakh, and Code-Switched Texts [2.3] 我々は、Kino.kzから集められたカザフスタンの映画レビュー100,502件の新しい公開コーパスを提示する。
データセットは多言語で、主にカザフスタンのレビューとコード変更されたテキストで構成されている。
3方向の極性分類と5クラススコア分類という2つの感情タスクを定義し、マルチリンガルトランスフォーマーモデルに対する古典的なBoW/TF-IDFベースラインをベンチマークする。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:45:57 GMT)
Event Fields: Learning Latent Event Structure for Waveform Foundation Models [2.2] 本稿では,従来のシーケンスベース表現から外れた新しい波形基礎モデルを提案する。
局所トークンやパッチの集合体として信号を扱うのではなく、臨床的に意味のある構造は、時間的に拡張された相互作用イベントから生じると仮定する。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:49:56 GMT)
DART-Q : A Deadline-Driven Framework for Real-Time QLDPC Decoding [1.7] 我々は、ウィンドウ化されたワークロードを個別の到着、キュー、サービス、完了イベントとして扱うリアルタイムQLDPCデコーディングフレームワークであるDART-Qを紹介する。
以上の結果から,リアルタイムデコーダの可視性は,国家組織,過負荷ポリシ,サービス容量によって管理されていることが示された。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:57:25 GMT)
FactoryNet: A Large-Scale Dataset toward Industrial Time-Series Foundation Models [1.6] 本稿では,産業時系列データのための最初のユニバーサル事前学習コーパスであるFactoryNetを紹介する。
6つの実施形態で、23kのエンドツーエンドのタスク実行にまたがる51万のデータポイント。
パイプライン全体を支える新しいスキーマ: Setpoint, Effort, Feedback, Context (S-E-F-C)。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:45:36 GMT)
To Purify or Not to Purify: Entanglement Purification under Input Fidelity Asymmetry in Quantum Networks [1.5] 2つの絡み合った資源対による絡み合いの浄化は、量子リピータネットワークの文献で広く使われている。
資源対間のデルタ(F)で条件を定めなければならず, 交換だけでは忠実度要件が満たされず, 浄化も必要であることを示す。
DeltaPurifyは, 局所的な忠実度情報に対して, 清浄意思決定を規定する政策であり, 清浄と無清浄の両面から, 省エネと省エネを両立させる政策である。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:58:03 GMT)
TopoGeoScore: A Self-Supervised Source-Only Geometric Framework for OOD Checkpoint Selection [1.5] ラベルなしOODチェックポイント選択のためのソースのみの幾何スコアである textbfTopoGeoScore を提案する。
我々は、ソース埋め込みからクラス条件の相互$k$-nearest-neighbourグラフを構築し、3つの解釈可能な信号を抽出する。
ウェイトを手で固定する代わりに、TopoGeoScoreは自己教師対象を通じて非負の線形スコアを学習する。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:46:47 GMT)
From Mechanistic to Compositional Interpretability [1.5] 機械的解釈可能性(Mechanistic Interpretability)は、学習した計算構造を人間の理解可能なコンポーネントにリバースエンジニアリングすることで、ニューラルネットワークの振る舞いを説明することを目的としている。
本稿では,構成性および最小記述長の原理に基づくカテゴリー理論フレームワークである構成解釈可能性を紹介する。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:08:07 GMT)
Investigating Anisotropy in Visual Grounding under Controlled Counterfactual Perturbations [1.4] 接地モデルは意味的にミスマッチしたキャプションで評価されることは滅多にない。
本研究は, 埋込異方性が反現実的失敗に寄与するかどうかを考察する。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:54:31 GMT)
Good in Bad (GiB): Sifting Through End-user Demonstrations for Learning a Better Policy [1.4] GiB(Good-in-Bad)は,デモ中の不正なサブタスクを自動的に識別し,破棄するアルゴリズムである。
フィルタリングされたデータは、どんなポリシー学習アルゴリズムでも利用でき、より堅牢なポリシーを訓練できる。
我々は,Frankaロボット上のGiBをシミュレーションおよび実世界のマルチステップタスクの両方で検証する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:50:08 GMT)
Semantic Alignment in Hyperbolic Space for Open-Vocabulary Semantic Segmentation [1.3] HyRoは、ポアンカレ球モデルにおける階層的および意味的なアライメントを分離する双曲的微調整フレームワークである。
標準的なオープン語彙セマンティックセグメンテーションベンチマークの実験は、HyRoが従来の手法よりも最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:54:19 GMT)
Bridging Spectral Operator Learning and U-Net Hierarchies: SpectraNet for Stable Autoregressive PDE Surrogates [1.3] SpectraNetは、U-Net階層内のスペクトル畳み込みを構成する自己回帰型ニューラル演算子である。
同じプロトコルでネイティブ1282でゼロからトレーニングされ、SpectraNetは0.0724に改善され、FNOは0.3080に回帰した。
B=1の消費者向けCPUでは、SpectraNetは200ms未満で動作し、生のL2に勝つフルアテンショントランスフォーマーは60倍のレイテンシを支払う。
論文参考訳(メタデータ) (Sat, 09 May 2026 18:02:48 GMT)
Terminal Matters: Kinodynamic Planning with a Terminal Cost and Learned Uncertainty in Belief State-Cost Space [1.2] 多くの現実世界のロボットタスクでは、ロボットは不確実性の下でも確実に望ましい目標に達するような、実現可能な動作を作らなければならない。
そこで,キノダイナミック計画のための端末コスト定式化を導入し,蓄積した軌道コストとともに端末状態の品質を最適化する。
得られたプランナーであるKiTeは、この端末コストの目標を符号化し、不確実性の下で信頼性を向上させる。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:37:39 GMT)
HyDRA Scorpion: A Cost-effective and Modular ROV for Real-Time Underwater Inspection, Intervention, and Object Detection [1.2] HyDRAスコーピオン(HyDRA Scorpion)は、テザリングされた水中ロボットで、検査と介入に使用できる。
搭載されたAIモジュールは、リアルタイム推論、長さ、3Dマッピングに基づく距離測定で平均精度0.89の水中物体検出平均値(mAP)を達成した。
このシステムは4-DoFの操縦性、二重マニピュレータ、カスタムの圧力試験住宅を組み合わせている。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:58:58 GMT)
FLARE: One-Shot PE-Level Fault Localization in Systolic Arrays via Algebraic Test Vectors [1.2] シストリックアレイは、ニューラルネットワーク推論において支配的な計算ファブリックである。
以前の作業では、均一なテストパターンでカラムレベルの障害検出を効率的に処理していた。
しかし、故障列内の行レベルの障害局所化は、ハードウェアの冗長性に頼らずに未解決のままである。
論文参考訳(メタデータ) (Sat, 09 May 2026 01:22:28 GMT)
Intervention Complexity as a Canonical Reward and a Measure of Intelligence [1.2] 本研究では, 環境由来性, 普遍性, 最小性, 感度, 達成度という5つの自然特性を持つ介入複雑性という新しい尺度を提案する。
その結果、リソースバイアスによってインデックスされた正準報酬の族が得られる。
我々は超知能と訓練前のユニバーサルエージェントの意義について論じる。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:59:58 GMT)
A Geometric Perspective on Next-Token Prediction in Large Language Models: Three Emerging Phases [1.2] 大規模言語モデル(LLM)の層間における予測情報の幾何について検討する。
モデルが各層で何を予測しているかを問うのではなく、予測情報がどこにあり、どのように深みを越えて進化するかを問う。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:51:59 GMT)
Using Semantic Distance to Estimate Uncertainty in LLM-Based Code Generation [1.1] LLMはコード生成において高い性能を示すが、その出力は正確性を保証するものではない。
我々はこれらの選択を混乱させる分類法を導入し、セマンティックな距離認識の不確実性推定という、欠落した設計点を明らかにした。
我々のメトリクスは、正確性に関する強力なプロキシを提供し、一貫して最先端のサンプルベースラインより優れています。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:02:54 GMT)
Kinetic theory for Transformers and the lost-in-the-middle phenomenon [1.1] 我々は、デコーダトランスフォーマーのおもちゃモデルである因果自己注意ダイナミクスについて研究する。
一様分散トークンの場合、制限相関方程式は閉じた形で解ける。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:16:19 GMT)
The Art of the Jailbreak: Formulating Jailbreak Attacks for LLM Security Beyond Binary Scoring [1.0] 我々は, JailBreakV-28Kから125個の有害シードプロンプトに912個の合成戦略を適用し,114,000個の敵プロンプトを構築した。
私たちは、推論時に有害なシードから、流動的なjailbreakプロンプトを合成するモデルを作ります。
安全フィルタ回避率は0.29-0.51 MalであるAutoDANとAmpleGCGは24-39対40-140である。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:51:18 GMT)
The Wristband Gaussian Loss: Deterministic, Composable Latents via a Sphere-Interval Decomposition [1.0] リストバンドガウス損失(英: Wristband Gaussian Loss)は、サンプリング、KL項、反復輸送のないガウス化点埋め込みに対する決定論的バッチ損失である。
我々は、この反射カーネルの目的を、2つの方法で計算する:$O(N2 d)$で最寄りの3イメージのペアランケーションと、角およびラジアルマーサーモードに結合するスペクトルノイマン経路である。
1Dワッサーシュタインの半径項とモーメントペナルティは同じ最適値を持つ有限サンプル加速器として機能し、モンテカルロ$はこれらの成分を単一の標準統計量に変換する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:25:37 GMT)
SiNFluD: Creating and Evaluating Figurative Language Dataset for Sindhi [1.0] そこで我々は,SiNFluDを提案する。SiNFluD,SiNFluD,SiNFluD,SiNFluD,SiNFluD,SiNFluD。
2つのネイティブアノテータは、Doccanoテキストアノテーションツールを使用してデータをラベル付けし、0.81のアノテータ間契約を達成している。
また,mBERT,XLM-RoBERTa,XLM-RoBERTa-XLモデル,およびSetFitを用いて文変換器の微調整を行った。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:25:59 GMT)
AlphaExploitem: Going Beyond the Nash Equilibrium in Poker by Learning to Exploit Suboptimal Play [1.0] 我々は、階層変換器エンコーダを用いて、競合するRLポーカーエージェントAlphaHoldemを拡張したAlphaExploitemを紹介する。
我々は、不完全情報ゲームのための2つの標準ベンチマークでAlphaExploitemをトレーニングし、評価する。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:26:35 GMT)
Paraphrase-Induced Output-Mode Collapse: When LLMs Break Character Under Semantically Equivalent Inputs [1.0] 我々は、プロンプト変数の出力モード崩壊と呼ばれる、系統的な障害モードを観察する。
クローズドフォームプロンプトがベアラベルや単一の選択トークンを要求すると、コンテンツ保存プロンプトの変種がモデルを会話の散文にプッシュする。
PARACONSISTは5つの語彙、構文、意味拡張プロンプトを持つ150のベースクエリのベンチマークである。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:09:59 GMT)
VORT: Adaptive Power-Law Memory for NLP Transformers [0.9] 学習可能な分数次 _iin[,1] をそれぞれ割り当てるメモリアーキテクチャを導入する。
分数重み付け和は非マルコフ和であるため、ガウス・ラゲール二次方程式によって計算された指数和(SOE)分解によって近似する。
リトリーバルは、正確にO(KSd_d_v)-per-stepの再発を有するリニアアテンションアキュムレータを介してキーと連想する。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:20:17 GMT)
Latency Analysis and Optimization of Alpamayo 1 via Efficient Trajectory Generation [0.8] 推論に基づくエンドツーエンド自動運転(E2E)は、運転決定の解釈可能性を改善するための有望なアプローチとして登場した。
本稿では,アルパマヨ1を2つの方法で系統的に分析し,改善する。
まず、Alpamayo 1を単一推論システムに再設計することで、軌道の多様性を維持しながら、推論レイテンシを低減する。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:34:00 GMT)
Anchoring the Eigengap: Cross-Modal Spectral Stabilization for Sample-Efficient Representation Learning [0.8] 視力モデルが低データ状態,特にラベル付きサンプルが不足している医療画像において,急速に低下していることが示される。
我々は、回復可能な次元K(N)を定量化する有限サンプル表現学習の理論を開発する。
マルチモーダルトレーニングは,非モーダルモデルでも,より安定なモードを維持し,クラス分離を改善する。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:49:43 GMT)
Classification-Head Bias in Class-Level Machine Unlearning: Diagnosis, Mitigation, and Evaluation [0.8] クラスレベルのマシンアンラーニングは、モデルユーティリティを保持しながら、特定のクラスの影響を取り除くことを目的としている。
既存の手法は、保持セット精度、忘れセット精度、未学習時間によって一般に評価される。
我々は,クラスレベルの未学習において,バイアスに支配されるショートカットを明らかにし,最終分類ヘッドの対応するバイアス項を減少させることで,忘れられたクラスの予測を抑えることができる。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:33:42 GMT)
Narrative Landscape: Mapping Narrative Dispositions Across LLMs [0.8] 我々は,Jaccard類似性による重複度を計測した「一貫性」と,逆シンプソン指数によるオプション間の分散として測定した「多様性」の2つの次元で分散を運用する。
その結果、モデルファミリ間の明確な剛性探索スペクトルが明らかとなり、スカラー計量が類似しているとしても、命令型が選択空間の幾何学をシフトすることを示した。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:06:57 GMT)
Large Language Models for Sequential Decision-Making: Improving In-Context Learning via Supervised Fine-Tuning [0.7] 本稿では,大規模言語モデル(LLM)の逐次決定設定におけるICL機能について検討する。
LLMを微調整して、オフラインのオラクルラベルの軌道から直接、数ショットの意思決定を行う。
我々のフレームワークは、教師付き微調整によるポリシーのフレキシブルな模倣を可能にする。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:49:49 GMT)
Machine Learning-Based Graph Simplification for Symbolic Accelerators [0.6] AutoSlimは機械学習ベースのフレームワークで、ハードウェアアクセラレーター向けのオートマチックグラフを作成できる。
FPGAのリソース使用量を最大40%削減し、スループットと電力効率が向上した。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:26:06 GMT)
The Direct Integration Theorem: A Rigorous Framework for Consistent Discrete Solutions of the Inverse Radon Problem [0.6] 直積分定理(英: Direct Integration Theorem, DIT)は、古典的スライス理論(CST)の非自明な系である。
提案手法は従来の方法に固有の2つの主要な制限を回避している。
提案手法は, 強度カッピングなどの共通成果物を除去し, 常にPSNR, SSIM, リジェクションの忠実度でFBPより優れることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:00:12 GMT)
ARES-LSHADE: Autoresearch-Enhanced LSHADE with Memetic Polish for the GNBG Benchmark [0.5] 本稿では,ALS-LSHADEについて述べる。ALS-LSHADEは,LLMの設計した進化アルゴリズムに関するGECCO 2026コンペティションに提出された,メメティックな微分進化変種である。
このアルゴリズムはLLM-LSHADE 2025の勝者の上に構築され、2つの新しいコンポーネントに貢献した。
結果、アルゴリズムは24の関数全てを自明に解決したが、競合のブラックボックスルールに違反した。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:16:00 GMT)
From Traditional Taggers to LLMs: A Comparative Study of POS Tagging for Medieval Romance Languages [0.5] 中世ロマンス語に対する部分音声(POS)タグ付けは、正書法の変化、形態的複雑さ、限られた注釈付きリソースのために依然として困難である。
本稿では,中世オクシタン,中世カタルーニャ,中世フレンチの3品種にわたるPOSタグ付けのための大規模言語モデル(LLM)の体系的実証評価について述べる。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:15:18 GMT)
Simultaneous Monitoring of Shape and Surface Color via 4D Point Clouds: A Registration-free Approach [0.5] shApe と Color (SMAC) の同時監視のための 4D 点雲による登録不要のフレームワークを提案する。
空間的に認識された信号後診断手法とともに,形状変形や色覚異常を効果的に検出するために,複合的なモニタリング手法を提案する。
モンテカルロシミュレーションと機能的グレード材料に関するケーススタディは、特に微妙な欠陥に対して、SMACが効果的な検出性能を達成することを示した。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:30:03 GMT)
A Single Deep Preference-Conditioned Policy for Learning Pareto Coverage Sets [0.4] 非線形スカラー化下での優先-解決対応の特異性と連続性について検討した。
この問題を解決するために,スムーズなTchebycheffスカラー化を単調な効用として用いた。
各更新は、以前のポリシーを参考に、Kullback-Leibler-regularized MDPの解決と等価であることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:35:50 GMT)
AI Native Asset Intelligence [0.4] 本稿では,異質なセキュリティデータを一貫性,コンテキスト,積極的な資産レベルの推論のために構造化されたインテリジェンス層に変換するフレームワークであるAIネイティブアセットインテリジェンスを紹介する。
このフレームワークは、アセット、アイデンティティ、リレーション、コントロール、アタックベクター、ブラスト・ラディウス・パターンを表すモデリング層と、断片化された信号を正常化されたアセット重要度尺度に変換するスコア層を組み合わせる。
論文参考訳(メタデータ) (Sat, 09 May 2026 18:56:02 GMT)
Quantum algorithms for path and cycle containment problems [0.2] 本稿では,隣接行列モデルにおけるパスとサイクルを含む問題の変種について考察する。
経路包含問題のいくつかは、線形数のクエリを使って解決でき、他の全ては互いに等価である。
クエリ複雑性を$widetildeO(n3/2-_k)$, $_k in (c-k)$, $c = sqrt3+sqrt17/2 で実現する新しい量子ウォークベースのアルゴリズムを証明した。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:55:07 GMT)
A Communication-Theoretic Framework for LLM Agents: Cost-Aware Adaptive Reliability [0.2] 大規模言語モデル(LLM)に基づく大規模言語モデルの信頼性技術について検討する。
これらの信頼性手法は6つの古典的信頼性演算子の特別な場合であることを示す。
本稿では,1つのラグランジアンノブが高品質なフロンティアを横断するコストアレスト近傍ルータを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:14:33 GMT)
Enhancing Adversarial Robustness in Network Intrusion Detection: A Layer-wise Adaptive Regularization Approach [0.2] 新たな敵攻撃の波は、ネットワーク侵入検知システムをそのような脅威に対してよりオープンにする。
最先端の対人訓練手法は、より堅牢なロバスト性を生み出す有望な結果を示している。
本稿では,従来の逆行訓練手法において,レイヤワイド脆弱性分析と適応重み付けを付加したLARARという洞察力のあるアプローチを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 12:10:01 GMT)
When Style Similarity Scores Fail: Diagnosing Raw CSD Cosine in Artist-Style Evaluation [0.2] 本稿では,コーパス内,プロトタイプフリー,しきい値フリーの診断を行う識別ギャップについて紹介する。
1799年のアートワーク、91アーティストのパブリックドメインコーパスでは、生のCSDコサインは2つのレベルで23/91ドルのアーティストに対して負のポイント推定ギャップを生じる。
CLIP-ViT-L/14、SigLIP-large、DINOv2-Largeのクロスバックチェックは、同じ共有トラフィック障害パターンを再現する。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:15:13 GMT)
Mental Health AI Safety Claims Must Preserve Temporal Evidence [0.1] メンタルヘルスAIの安全性は、しばしば間違った時間スケールで判断される。
本稿では, 時系列, タイミング, 蓄積, 回復に依存する安全特性が, それらの特徴を破棄するプロトコルによって認証できない理由を, 公式な説明として紹介する。
SCOPE-MHを専門家によるモチベーションのあるインタビュー会話のAnnoMIデータセット上で概念実証を通じて運用する。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:27:36 GMT)
Dueling DDQN-Based Adaptive Multi-Objective Handover Optimization for LEO Satellite Networks [0.1] 本稿では,低地球軌道(LEO)衛星ネットワークのためのDouble Deep Q-network(DDQN)ベースの適応多目的ハンドオーバフレームワークを提案する。
提案手法は,スループット,ブロッキング確率,ネットワーク条件の切り替えコストの動的トレードオフ学習を可能にする。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:16:50 GMT)
Improving Lexical Difficulty Prediction with Context-Aligned Contrastive Learning and Ridge Ensembling [0.1] 語彙難易度予測は、言語学習と可読性評価の基本的な問題である。
既存のアプローチは、スカラーの監督を伴う回帰のみのトレーニングに依存している。
本稿では,リッジ回帰アンサンブルを2つの相補的目的と統合したコンテキストアラインなコントラスト回帰を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:43:54 GMT)
Non-Monotonic Latency in Apple MPS Decoding: KV Cache Interactions and Execution Regimes [0.0] 我々は,Apple MPSバックエンドにおける予期せぬ非単調遅延挙動を同定した。
特定のデコード-予算間隔で最大21倍のレイテンシのスパイクを観測し、次いで隣接する構成でのリカバリを行った。
論文参考訳(メタデータ) (Sat, 09 May 2026 12:26:36 GMT)
AQMP: Image compression through Adaptive Quadtree Refinement and Matching Pursuit with Hyperparameter Optimization [0.0] 本稿では,適応的クアドツリーリファインメントとマッチング・パースーツを組み合わせた新しい画像であるAQMPを提案する。
固定サイズのサブイメージで動作する従来のマッチング・パースーツ法とは異なり、AQMPはブロックサイズを局所的な画像構造に動的に適応させる。
AQMPは、同等のSSIM値でJPEGよりも最大4時間$高い圧縮レートを達成する。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:07:35 GMT)
Why the Unfinished Keeps Returning: Canxianization and the Dynamics of Conscious Priority [0.0] 閉鎖抵抗性自己関連不完全性に摂動が関与する過程として, キャンキサン化を提案する。
この理論は、この現象を感情的な覚醒、記憶力、ゼイガルニク効果、好奇心、予測誤差、侵入的思考と区別する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:52:04 GMT)
When More Parameters Hurt: Foundation Model Priors Amplify Worst-Client Disparity Under Extreme Federated Heterogeneity [0.0] フェデレートラーニング(FL)は、分散プライベートデータに基づく基礎モデル(FM)の微調整に益々使われている。
低ランク適応 (LoRA) を用いたTextCNN (2.7Mパラメータ) と DistilBERT の比較を行った。
極端なラベルスキュー (alpha = 0.1) の下では、DistilBERT+LoRAは、25倍のパラメータと広範囲な事前訓練があるにもかかわらず、TextCNNの32.2%のギャップよりも50.1% -- 56%大きい最悪の精度ギャップを生じる。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:22:08 GMT)
Visibility nowcasting in South Korea: a machine learning approach to class imbalance and distribution shift [0.0] 大気の可視性は交通安全と大気管理にとって重要な変数である。
本研究では,大韓民国の6大都市で可視性を示す機械学習フレームワークを紹介する。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:58:22 GMT)
Two Ways to De-Bias an LLM-as-a-Judge: A Continuous-Score Comparison of Hierarchical Bayesian Calibration and Neural-ODE Score Transport [0.0] このマッピングをどのようにモデル化すべきかについて、反対の見解をとる2つの修正子を比較した。
これらの知見を,運用デプロイメントの明確な決定ルールに変換する。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:55:02 GMT)
Transformer autoencoder with local attention for sparse and irregular time series with application on risk estimation [0.0] 提案手法は,ギリシャの広域の電力系統における非技術的損失のリスク推定に関する実世界のケーススタディに適用された。
従来のリスク推定手法は、長距離依存を効果的に把握し、そのようなデータ特性を頑健に扱うのに苦労する。
提案手法は, より一貫したリスク推定を行うため, 高い差別性を有する潜伏特性を効果的に生み出すことを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 12:28:50 GMT)
Transfer Learning of Multiobjective Indirect Low-Thrust Trajectories Using Diffusion Models and Markov Chain Monte Carlo [0.0] 本稿では,ミッションパラメータにおけるホモトピーとマルコフ連鎖モンテカルロ(MCMC)を組み合わせることによって,より効率的にトレーニングデータを生成するトランスファーラーニングフレームワークを提案する。
テスト転送のために提案したフレームワークは、最先端の間接的アプローチよりも40%多く実現可能なソリューションを生成する。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:15:54 GMT)
To What Extent Does Agent-generated Code Require Maintenance? An Empirical Study [0.0] 本研究では、AI生成ファイルの保守範囲、人間による関与、修正タイプを、人間によるコードに対して実証的に検討する。
私たちは1,000以上のファイルを分析し、100の人気のあるリポジトリから約3,200の変更を加えました。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:52:52 GMT)
The Payment Heterogeneity Index: An Integrated Unsupervised Framework for High-Volume Procurement Oversight and Decision Support [0.0] 本稿では,一次元試料の合成統計量である構造異質度指数(SHI)を紹介する。
Payment Heterogeneity Index(PHI)は、ポストアワード支払いの乗算インスタンスである。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:59:29 GMT)
The Echo Amplifies the Knowledge: Somatic Marker Analogues in Language Models via Emotion Vector Re-Injection [0.0] 現在の言語モデルメモリシステムは、それがどう感じたかではなく、何が起こったのかを記憶している。
ダマシオは、無知ながら感情的なマーカーが欠如している人間が意思決定に障害があることを実証した。
経験中に特徴的感情ベクトルを構築し,リコール時に部分的に再注入する。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:12:39 GMT)
The Challenges of Balancing AI Compliance and Technological Innovations in Critical Sectors: A Systematic Literature Review [0.0] 本稿では、重要なインフラ分野におけるAIコンプライアンスと技術革新のバランスをとることの課題について、体系的な文献レビューを行う。
この研究は、断片化規制、中小企業の過度のコンプライアンス負担、ガバナンスモデルの不整合の3つの課題を特定した。
これらの課題に対処するため、この研究はリスク階層の規制、設計によるコンプライアンス、説明可能なAIなど、実践的なガバナンス戦略を強調し、重要な分野におけるスケーラブルで信頼性の高いAIデプロイメントをサポートする。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:40:28 GMT)
Sufficient conditions for a Heuristic Rating Estimation Method application [0.0] この研究は、完全対比較法と不完全対比較法における算術的アルゴリズムと幾何的アルゴリズムの両方を考察している。
図示的な例は、算術変項の不整合の推定が最適であることを示している。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:21:06 GMT)
Structured Recurrent Mixers for Massively Parallelized Sequence Generation [0.0] 本稿では,列車時のシーケンス並列表現と推論時のリカレント表現との変換を可能にするアーキテクチャであるStructured Recurrent Mixerを紹介する。
この二重表現は、他の線形複雑性モデルと比較して、トレーニング効率が向上し、入力情報のキャパシティが向上し、推論スループットと長さが向上することを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:07:55 GMT)
Single-Thread JPEG Decoder Benchmarks Mis-Evaluate ML Data Loaders [0.0] ImageNet JPEG decodeは通常のMLインフラストラクチャであるが、Pythonデコーダの選択はシングルプロセス、シングルスレッドのマイクロベンチマークによって正当化されることが多い。
Intel Emerald Rapids, AMD Zen 4, AMD Zen 5, ARM Neoverse V2, ARM Neoverse N1。
また,Zen 4 と Zen 5 では作業員数の結論が異なり,厳密な lib-jpeg 系ラッパーは同じレアな ImageNet JPEG を拒絶することがわかった。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:34:17 GMT)
Selective Remote Dissipation of an Off-resonant State via Indirect Driving [0.0] 局所的な周期駆動は、高度に選択的に構造化された環境における散逸を制御するために用いられる。
いずれにせよ、ドライブは選択的な遠隔散逸チャネルを活性化できることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:58:54 GMT)
SMIXAE: Towards Unsupervised Manifold Discovery in Language Models [0.0] スパースオートエンコーダ(SAE)は、ニューラルネットワークの活性化を分解し解釈するために広く使われている。
SAEの大きな問題の1つは、多次元の機能を直接モデル化できないことである。
我々は、オートエンコーダアーキテクチャのスパースMIXtureを導入し、この問題に対処し始める。
論文参考訳(メタデータ) (Sat, 09 May 2026 23:48:27 GMT)
Resource theory of coherence in continuous position basis from measurement-induced dephasing [0.0] 我々は、連続的に量子コヒーレンスを直接扱うための資源理論フレームワークを開発する。
ランダムな運動量キックに基づく物理的動機付け型デファスティングチャネルを導入する。
連続基底コヒーレンスが非空対角状態の集合よりもデフォーカス障害に結びついていることが示される。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:53:59 GMT)
Relative Kinetic Utility for Reasoning-Aware Structural Pruning in Large Language Models [0.0] モデルの深さ多様体上での連続的な運動積分に離散的なプルーニングを高める新しい枠組みを提案する。
Qwen-2.5-7B と LLaMA-3-8B の試験により、高スパーシティのシステムの性能は40%向上した。
RKUはGSM8Kで40%の精度で13.34%の精度を達成し、最強のベースラインを上回った。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:47:53 GMT)
Reducing Annotation Burden for Femoral Cartilage Segmentation in Knee MRI via Cross-Sequence Transfer Learning [0.0] 変形性膝関節症イニシアチブ(OAI)507DESS画像に対する2次元U-Netの最適化を行った。
被験者レベルのクロスバリデーションを用いた同系列のベースラインを構築した。
病変効果は両側のMann-Whitney U試験で評価された。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:22:53 GMT)
Recoverable states on von-Neumann algebras [0.0] 完全正のトレース保存写像 $:mathcalMtomathcalM$ が存在して、$(A)$ がすべての$A$ と $(mathcalRcirc)nto$ に対してノルムの $Lp(mathcalM,)$ がすべての$,textless p,textlessinfty$ に対して$Lp(mathcalM,)$ であることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:33:39 GMT)
Reconciling Consistency-Based Diagnosis with Actual-Causality-Based Explanations [0.0] 一貫性に基づく診断(CBD)と実際の因果性と因果責任の関連性を確立する。
CBDはXAIコミュニティからはほとんど注目を集めていない。
これら2つの領域間の接続は、XAIと説明可能なデータ管理に実りある影響を与える可能性がある。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:53:04 GMT)
Quantum Transport in Disordered Spin Networks: Emergent Timescales and Competing Pathways [0.0] 混乱したシステムにおける量子輸送は、障害の相互作用、相互作用、デコヒーレンスに関する根本的な疑問を引き起こしている。
本稿では、スピン不純物の散逸ダイナミクスにおける複数の輸送時間スケールの出現を、小さな空間的に乱れたスピンのネットワークに結合して検討する。
論文参考訳(メタデータ) (Sat, 09 May 2026 12:38:27 GMT)
Quantum Transfer Learning Shows Improved Robustness in Low-Data Regimes [0.0] 我々は、量子モデルのロバスト性について、少ないトレーニングデータの下で体系的に研究する。
実験の結果,訓練データに制限がある場合,従来のモデルでは高いピーク性能が得られることがわかった。
対照的に、量子モデルは、データレシエーション全体でより安定したパフォーマンスを維持し、ロバスト性やデータ効率が改善されていることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:06:53 GMT)
Quantum Field-Theoretic Predictions of Ψ-Epistemic Models of Quantum Mechanics [0.0] 量子力学における$$$-epistemic Modelは、量子状態が物理的現実と一致しないことを意味する。
我々は、$$-epistemicモデルが標準量子場理論の予測から逸脱する可能性があることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:07:21 GMT)
Phase Transitions in Affective Meaning Divergence: The Hidden Drift Before the Break [0.0] 我々はこれをb>影響的意味分散(AMD)/b>として定式化する。
Conversations Gone Awry (CGA-Wiki; $N=652$)では、遅延会話は複数のレベルにわたるクリティカルスローダウン(CSD)シグネチャを示す。
AMDは異なる時間的シグネチャを提供し、振り返って測定された分散は分岐点でピークとなる。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:30:47 GMT)
Personalized Alignment Revisited: The Necessity and Sufficiency of User Diversity [0.0] パーソナライズされたアライメントO(1)はオンラインの後悔とログ(1/epsilon)オフラインサンプルの複雑さを実現する。
本研究は,個人識別の基本的な要因として,ユーザの多様性を同定するものである。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:07:35 GMT)
Optimised Support Vector Regression for California Housing Price Prediction: The Critical Role of Feature Engineering and Hyperparameter Tuning [0.0] Support Vector Regressionは、California Housingベンチマークデータセットで最も弱いパフォーマーの1つとして引用されている。
本稿では,従来報告されていた性能が,アルゴリズムに固有の制限ではなく,実験的な構成選択を反映しているかどうかを検討する。
チューニングされたSVRは、以前報告されたSVR結果よりも0.123ポイントの絶対的な改善である0.723の試験R2を達成する。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:58:50 GMT)
Optimality of Sub-network Laplace Approximations: New Results and Methods [0.0] サブネットワークラプラス近似は、パラメータの小さな部分集合に注意を向けることによってサロゲートを構成する。
サブネットワークラプラス法は,ラプラス後部の予測分散を系統的に過小評価することを示した。
本稿では、2つの原理的、解析的基礎を持つサブネットワーク・ヘッセン近似を提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:37:06 GMT)
Open Ontologies: Tool-Augmented Ontology Engineering with Stable Matching Alignment [0.0] Open Ontologies は LLM による構築と OWL の正式な推論と Model Context Protocol によるオントロジーのアライメントを統合している。
我々の第一の発見は、安定な1-to-1マッチングがオントロジーのアライメント品質の主要な要因であるということである。
OAEIの解剖学的軌道では、F1 = 0.832を達成し、最先端のシステムと競合し、全て精度で達成している。
論文参考訳(メタデータ) (Sat, 09 May 2026 21:49:21 GMT)
Octopus Protocol: One-Shot Hardware Discovery and Control for AI Agents via Infrastructure-as-Prompts [0.0] 我々は,そのコストを単一シェルコマンドに分解するシステムであるOctopus Protocolを提示する。
プロトコルはプロンプトであり、コードではなく、コーディングエージェントはランタイムである。
1つのコマンドが10~15分でハードウェアをオンにし、最大30のMPPツールを公開する。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:57:11 GMT)
Navigating LLM Valley: From AdamW to Memory-Efficient and Matrix-Based Optimizers [0.0] 大規模言語モデルの訓練には、計算とメモリ効率が極端に高い最適化アルゴリズムが必要である。
本稿では,システム・アンド・最適化レンズを用いた大規模言語モデルの設計についてレビューする。
論文参考訳(メタデータ) (Sat, 09 May 2026 21:34:28 GMT)
Natural Language Processing: A Comprehensive Practical Guide from Tokenisation to RLHF [0.0] このプレプリントは、最新のNLPパイプライン全体を通して読者をガイドする、体系的で研究指向のプラクティスを提示する。
TajikとTatarのオリジナルコントリビューションには、サブワードトークン、単語埋め込み、語彙データベース、翻訳ベンチマークなどがある。
大学院生、大学院生、そして古典的なMLから最先端のLLMベースのシステムにメソッドを実装し、比較し、デプロイしようとする実践的な開発者のために設計された。
論文参考訳(メタデータ) (Sat, 09 May 2026 13:39:51 GMT)
MicroFuse: Protein-to-Genome Expert Fusion for Microbial Operon Reasoning [0.0] MicroFuseはタンパク質からゲノムへの専門家融合フレームワークである。
これは、ProstT5の構造を意識したタンパク質表現と、Bacformerのゲノムコンテクスト表現を統合している。
OG-Operon100Kでは、MicroFuseはProstT5のみ、Bacformerのみ、Concatベースラインの中で、AUROC、AUPRC、mAP、mARで最強である。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:07:11 GMT)
Methods for Formal Verification of Agent Skills: Three Layers Toward a Mechanically Checkable Capability-Containment Proof [0.0] LLM駆動のランタイムによってどのようにスキルが消費されるかに忠実なスキル行動に関する正確なセマンティクスを提供します。
本稿では,定式化や定式化によるスキル向上を両立させる構成可能な3つの手法を提案する。
これら3つのメソッドに加えて、バンドルプロデューサと再チェッカーは、オープンソースエンクロードフレームワークのゼロ依存JavaScriptモジュールとして出荷される。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:27:38 GMT)
MedFL-Stress: A Systematic Robustness Evaluation of Federated Brain Tumor Segmentation under Cross-Hospital MRI Appearance Shift [0.0] 統合学習は、患者データを共有することなく、病院がセグメンテーションモデルを協調的に訓練することを可能にする。
現在の評価プロトコルでは、クライアント間での平均的なパフォーマンスのみを報告し、個々のサイトの障害をマスキングしている。
MedFL-Stress(リンク)は、この障害モードを正確に公開する、制御されたストレステストフレームワークである。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:04:54 GMT)
Mechanistic Analysis of Alignment Algorithms in Language Models [0.0] トレーニング後のアライメントアルゴリズムは、主にブラックボックスとして評価され、言語モデルの内部計算の作り直しの仕方を見極めている。
オープンウェイトモデルファミリの6つの選好最適化手法を体系的に解析する。
選好信号は、初期・中期・中期の層に一貫して集中するが、異なる目的によって異なる表現シフトが引き起こされる。
論文参考訳(メタデータ) (Sat, 09 May 2026 06:36:06 GMT)
Measuring and Decomposing Mode Separation via the Canonical Diffusion [0.0] モード分離は密度の基本的な幾何学的性質であり、高次元での定量化が難しい。
密度に固有の1つのプロセスを通してモード分離を測定する。
i)合成ガウス混合物,(ii)SDXLテキスト・トゥ・イメージ世代,(ii)SSAとDAがエントロピーとPCAミスを捉えた構造,(iii)アラニンジペプチドの分子動力学,(iii)DAは静的サンプルから既知の遅いバックボーンを回収する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:05:55 GMT)
Machine Learning-Based Pre-Test Risk Stratification for PCR-Confirmed Chlamydia Using Patient-Reported Data and Urine Biomarkers [0.0] Chlamydia trachomatis感染のリスクが高い個体の早期同定は、資源認識スクリーニングにおける分子試験の最適利用を可能にする可能性がある。
本研究では,日常的に利用可能な非侵襲的臨床データに基づいてトレーニングされた機械学習モデルを用いて,事前検査によるリスク階層化の可能性を評価する。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:21:59 GMT)
METBRA25Y: Brazil Surface Meteorology Archive with Harmonized Variables and Quality Control [0.0] METBRA25Yはブラジルの時空間気象観測の調和したアーカイブである。
このデータセットは再現可能な環境、気候学、水文学、農業、都市リスク、機械学習研究をサポートするように設計されている。
本稿では,データセットの出所,ファイル構成,調和スキーマ,品質制御ルール,技術的検証出力,制限,推奨使用法について述べる。
論文参考訳(メタデータ) (Sat, 09 May 2026 05:19:46 GMT)
Lattice Quantization of Free Fermions without Doublers [0.0] 任意の次元の格子上に実装されたときの倍数を削減する自由フェルミオンの定量化法を提案する。
ダブルラーの除去は、フェルミオンの2階記述と非エルミート・ハミルトニアンに関連するツールを組み合わせることで達成される。
論文参考訳(メタデータ) (Sat, 09 May 2026 22:40:06 GMT)
Language-Conditioned Visual Grounding with CLIP Multilingual [0.0] 言語間の相違は、視覚エンコーダ、テキストブランチ、またはそれらの相互作用から生じる可能性がある。
この曖昧さを高密度多言語CLIPプローブを用いて解決し、視覚エンコーダを13言語で同一に保持する。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:06:16 GMT)
LLiMba: Sardinian on a Single GPU -- Adapting a 3B Language Model to a Vanishing Romance Language [0.0] LLiMbaは、Qwen2.5-3B-Instructを継続事前訓練(CPT)により適応した3BパラメータSardinian-readyモデルである。
コーパスには1150万個のサルデーニャ文字の LSC,Logudorese,Campidanese のトークンが含まれており,ぼやけたレジスタに対するリプレイとして,関連するロマンス文字の 2.4万個のトークンが拡張されている。
一致した条件下では、フル微調整、LoRA r64、rsLoRA r128、rsLoRA r256、DoRA r256の5つのSFT構成を比較する。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:54:11 GMT)
Internal vs. External: Comparing Deliberation and Evolution for Multi-Agent Constitutional Design [0.0] 3つの社会環境における内的議論と外的進化を比較した。
内部の自己支配取引が構造的応答性のためにピークとなる間、ピークにおいて外部最適化が勝利する。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:19:52 GMT)
Impact of the non-canonical approach to the exact solution of the ideal one-dimensional electron gas confined with an anisotropic quantum wire of oscillator-shaped profile [0.0] 異方性量子線電位に閉じ込められた理想的な1次元電子ガスについて検討する。
量子ワイヤの均一性は、有効電子質量の導入によって破られる。
正準法と非正準法の両方で記述された問題を解く。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:12:15 GMT)
High-Precision Variational Quantum SVD via Classical Orthogonality Correction [0.0] バイパルタイト状態の部分特異値分解のためのハイブリッド量子-古典的変分フレームワークを提案する。
我々はデフレに基づく最適化手法を用いて、ターゲット状態の支配的および支配的なシュミット成分を逐次抽出する。
我々のフレームワークは、先進的な短期量子デバイス上での大規模絡み合いスペクトル推定のための堅牢な経路を提供する。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:49:05 GMT)
Hardware-Accelerated Line-Rate Bitstream Screening for Secure FPGA Reconfiguration [0.0] BLADEIはFPGA構成のデプロイ時間スクリーニングのためのビットストリームレベルのセキュリティフレームワークである。
我々は,このフレームワークをXilinx PYNQ-Z1システム上に実装し,エンドツーエンドのクラウド・ツー・エッジパイプラインを実証した。
ストリーミングハードウェアで高速化された特徴抽出エンジンは,特徴抽出遅延を範囲まで低減できることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:06:22 GMT)
From pre-training to downstream performance: Does domain-specific pre-training make sense? [0.0] 本研究は,医用画像における深層学習モデルの信頼性と有効性を高めるための事前学習戦略の重要性を強調した。
これらの重要な要因に対処することにより、より正確で信頼性の高い診断ツールの開発に寄与することを目的としている。
論文参考訳(メタデータ) (Sat, 09 May 2026 09:11:02 GMT)
Fault tolerance estimation in digital circuits with visualised generative networks [0.0] 生成ネットワークサンプリング手法を用いて,ディジタル回路構造における故障モードの耐故障性を推定する新しい数値計算法を提案する。
理想的にデジタル化されたアナログ電流の生成ビットワイド構成のランダム入力から、予測出力電流をGAN(Generative Adversarial Network)の判別部における数値実験の現実的な信号と比較する。
回路内の古典的論理的要素の異なる障害モードの影響を微分することにより、電子設計におけるロバスト性を評価することができる。
論文参考訳(メタデータ) (Sat, 09 May 2026 18:44:02 GMT)
Extrusion Segmentation Strategy to improve CAD Reconstruction from Point Cloud [0.0] 我々は,ポイントクラウドからCADモデルを再構築するエンド・ツー・エンド・モデルを開発した。
これらの部分的な形状はデータの多様性を高め、ディープラーニングモデルの一般化と堅牢性を向上させる。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:26:28 GMT)
Explanation Fairness in Large Language Models: An Empirical Analysis of Disparities in How LLMs Justify Decisions Across Demographic Groups [0.0] 大規模言語モデル(LLM)は、意思決定だけでなく、それらを説明するためにもますますデプロイされている。
本稿では,5つの公式に定義された操作可能な次元からなるフレームワークであるExplaination Fairness Taxonomy(EFT)を紹介する。
分類学は80のプロンプトテンプレート、4つの連続決定ドメイン、5つのLCMからなる制御された実証研究でインスタンス化される。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:19:03 GMT)
Exclusion reshapes the operational manifestation of preparation contextuality [0.0] POREC(Parity-oblivious random exclusion code)を導入し、素記号サイズ$m$に対して、古典的および非コンテクストエンコーディングが厳密な非コンテクスト境界を提供することを示す。
最初の非自明なケース(2桁、3桁の記号)では、抽出された正確な量子ビットの最適値がこの境界に反し、パリティに満ちた検索とは対照的である。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:15:35 GMT)
Evaluating LLM-Generated Code: A Benchmark and Developer Study [0.0] 最高のモデルを選択するのに役立つコード生成専用のベンチマークがたくさんあります。
本稿では,大規模言語モデルが生成するコードのツリーフォールド評価手法について述べる。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:05:44 GMT)
Evaluating Federated Learning approaches for mammography under breast density heterogeneity [0.0] 乳房密度はマンモグラフィーの解釈に影響を与える重要な因子である。
本研究の目的は,乳房密度による不均一性がマンモグラフィ画像分類におけるFLに及ぼす影響を評価することである。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:44:16 GMT)
Entanglement increase from local interactions which lead to non-positive local reduced dynamics [0.0] それぞれの部分がその局所環境のみと相互作用する二部量子系 S=AB を考える。
このような状況下では、A と B の間の絡み合いが、時間進化の間にその初期値を超えないことを期待する。
本稿では,まず,そのような事例を発見できる一般的な状況について考察する。
論文参考訳(メタデータ) (Sat, 09 May 2026 12:45:55 GMT)
Energy-based models for diagnostic reconstruction and analysis in a laboratory plasma device [0.0] エネルギーベースモデル(EBM)は、データ上の合同確率分布を学習するための強力で柔軟な方法を提供する。
EBMを実験室プラズマ物理学に応用し、高非線形現象を特徴とする領域である。
本研究は,実験室プラズマデータのESMに基づく生成モデリングの柔軟性と有効性を示すものである。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:29:03 GMT)
Drain-Vortex Optimization: A Population-Based Metaheuristic Inspired by Multi-Drain Free-Vortex Flow [0.0] Drain-Vortex Optimization (DVO) は連続最適化のための個体群に基づくメタヒューリスティックである。
3相機構は遠距離探査、スパイラル内向き運動、局所コアエクスプロイトの間を切り替える。
キャリブレーションバリデーションプロトコルを用いて,PSO,GWO,WOA,AOA,EO,SVOAに対してDVOを評価する。
論文参考訳(メタデータ) (Sat, 09 May 2026 11:06:34 GMT)
Diagnosing and Mitigating Domain Shift in Permission-Based Android Malware Detection [0.0] マシンラーニングベースのAndroidマルウェア検出は、ドメインシフトによって現実のデプロイメントで失敗することが多い。
本稿では、クロスドメイン条件下でのパーミッションベース検出器の一般化可能性と解釈性について包括的に研究する。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:09:14 GMT)
Data-driven transport modelling without overfit [0.0] マクロ・トランスポート・モデリングは,公共政策の介入が提案された後,交通の流れを予測することを目的としている。
伝統的に、輸送モデルの構築は人口の社会経済的特性の複雑な理解に依存してきた。
本稿では,トラフィック数に基づく目的関数を持つデータ駆動型モデリングプロトコルを提案する。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:46:31 GMT)
Character-Level Transformer for Tajik-Persian Transliteration with a Parallel Lexical Corpus [0.0] 本研究は、タジク文字からペルシア文字(ペルソ・アラビア文字)への自動翻訳について述べる。
本稿では,52,152個のタジク語,ペルシャ語,短文の並列コーパスについて検討した。
論文参考訳(メタデータ) (Sat, 09 May 2026 17:57:29 GMT)
Causal Dimensionality of Transformer Representations: Measurement, Scaling, and Layer Structure [0.0] 因果次元 Kappa(L, M, T) は、層 L において期待されるヤコビアン外積の有効ランクとして定義される。
16,384から1,048,576までの7つのSAE幅がGemma-2-2B層12上にあり、表現能力は15.6倍、因果能力は4.35倍である。
論文参考訳(メタデータ) (Sat, 09 May 2026 07:05:26 GMT)
CIVeX: Causal Intervention Verification for Language Agents [0.0] 我々はCIVeXという因果介入検証器を導入し、提案した動作をコミットされた動作状態グラフ上の構造因果クエリにマッピングする。
Causal-ToolBench (1,890のインスタンス、7つのシード)では、CIVeXは中等度および対向的な共起で観測された偽の実行をゼロにする。
IHDPとZOZO Open Bandit(一様にランダムな真実を持つ実運用ログ)では、CIVeXはOracleの正しい実行と0.1pp以内で一致し、ネイティブなベースラインに対して、実行時の偽実行を>=50倍削減する。
論文参考訳(メタデータ) (Sat, 09 May 2026 21:06:15 GMT)
C2L-Net: A Data-Driven Model for State-of-Charge Estimation of Lithium-Ion Batteries During Discharge [0.0] C2L-Netは、リアルタイムなオンラインSOC推定のための、コンテキストから最新のデータ駆動フレームワークである。
既存のショート・レセプティブ・フィールド・モデルやロング・ヒストリー・モデルとは異なり、提案フレームワークはコンテキストエンコーディングを最新の計測更新から明確に分離する。
C2L-Netは60倍高速な推論を実現し、最近のデータ駆動ベースラインよりも少ないパラメータを必要とする。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:47:08 GMT)
Beyond the Black Box: An Interpretable Machine Learning Framework for Predicting Electronic Structure Microdescriptors and Structure-Performance Relationships in Fe-based Catalytic Systems [0.0] 本研究は,SHAPに基づく特徴重要度分析(Explainable AI)を木系アンサンブルと統合し,メタン(POM)の部分酸化のためのFe-ゼオライトおよび酸化物担持触媒を特徴付ける解釈可能な機械学習フレームワークを提案する。
限られたデータにもかかわらず、このフレームワークは、電子バンドギャップに影響を及ぼし、選択性、活動性、安定性などのマクロなパフォーマンス指標を管理する熱力学的、構造的、幾何学的マイクロディスクリプタを識別し、ランク付けすることで、複雑な構造と性能の関係をデコードする。
論文参考訳(メタデータ) (Sat, 09 May 2026 15:25:30 GMT)
Beyond Toy Benchmarks: A Systematic Evaluation of OOD Detection Methods For Plant Pathology Classification [0.0] ディープラーニングシステムの信頼性確保には,アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
本研究では, ポストホックスコアリング, 補助目標, エネルギーモデル, 制約付き最適化を対象とする6つのOOD検出手法について検討した。
論文参考訳(メタデータ) (Sat, 09 May 2026 02:27:01 GMT)
Battery-Explicit Energetic Witnesses of CHSH Post-Quantumness [0.0] 我々は、エネルギー保存SWAPにより、単一の励起を二元電池に条件付きでルーティングする信頼モジュールエネルギ的証人を紹介する。
古典的なフィードフォワードは、退化論理レジスタ上の可逆的な自律モジュールに埋め込むことができることを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 20:18:44 GMT)
Automated Robotic Moisture Monitoring in Agricultural Fields [0.0] このプロジェクトの主な目的は、オンフィールドの水分センサー回路と協調してロボットキットを使用することである。
本研究により, 農地の水分を自動計測するプロトタイプが開発されている。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:52:31 GMT)
Architecture, Not Scale: Circuit Localization in Large Language Models [0.0] グループ化されたクエリアテンションは、同じ規模の標準的なマルチヘッドアテンションよりもはるかに集中し、機械的に安定していることを示す。
同じ濃度パターンは間接的な物体識別、誘導ヘッド、事実的リコールにまたがる。
これらの結果は、いくつかのアーキテクチャ上の選択が、大きなモデルをより研究しやすくしていることを示唆している。
論文参考訳(メタデータ) (Sat, 09 May 2026 10:05:22 GMT)
An exact spacetime polymer gas for finite-temperature $\mathbb Z_N$ homological quantum code [0.0] 有限温度の$P$-form $mathbb Z_N$ホモロジー符号を、正確な有限トロッター量子-古典写像から$(d+1)$-次元時空モデルへ研究する。
背景分解された分割関数は、閉じた磁性および電気欠陥ポリマーの点において、正確に再構成される。
論文参考訳(メタデータ) (Sat, 09 May 2026 19:14:38 GMT)
AgentCollabBench: Diagnosing When Good Agents Make Bad Collaborators [0.0] AgentCollabBenchは、ソフトウェアエンジニアリング、DevOps、データエンジニアリングにまたがる900の人為的なタスクの診断ベンチマークです。
各タスクは、4つの行動リスクのうちの1つを分離する。
GPT 4.1 mini, Gemini 2.5 Flash Lite, Qwen-3.5-35B-A3B, Llama 3.1 8B の4つの近代LCMの評価を行った。
通信トポロジは、マルチホップ情報サバイバルにおけるばらつきの7-40%を説明する主要なリスクファクターとして現れる。
論文参考訳(メタデータ) (Sat, 09 May 2026 03:35:09 GMT)
AI-Accelerated Brute Force Cryptanalysis [0.0] AIは、残りのキー空間上の確率曲線を非平坦化することができる。
この曲線をスパイクすればするほど、暗号文は高速になる。
NIST PQCはAI加速ブルートフォース攻撃に対して免疫を受けていない。
論文参考訳(メタデータ) (Sat, 09 May 2026 04:57:40 GMT)
A geometric relation of the error introduced by sampling a language model's output distribution to its internal state [0.0] GPTスタイルの言語モデルは、予測確率分布が複数のトークンに分散する生成点における単一トークンの変化に敏感である。
このことから,トークン空間の幾何学はモデルが内部的に問題を表現する方法を直接反映していることが示唆された。
論文参考訳(メタデータ) (Sat, 09 May 2026 14:24:36 GMT)
A Reconfigurable Multiplier Architecture for Error-Resilient Applications in RISC-V Core [0.0] 本稿では、エネルギー効率の良いニューラルネットワーク推論とエッジAIアプリケーションを対象として、RISC-Vコアに統合された実行時再構成可能な乗算器アーキテクチャを提案する。
提案した乗算器は、専用mulscrを用いて複数の精度レベルを持つ精度および近似計算の適応性をサポートする。
提案手法は,1.89DMIPS/MHzの計算性能を維持しつつ,それぞれ44%-52%,62%-68%の消費電力削減を実現している。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:14:09 GMT)
A Quantum Inspired Variational Kernel and Explainable AI Framework for Cross Region Solar and Wind Energy Forecasting [0.0] 太陽光発電と風力発電の信頼性の高い短地平線予測は、あらゆる現代の電力システムの構造的前提条件である。
これらの懸念を分離する4段階のハイブリッドフレームワークを開発する。
オープン・パブリック・アーカイブのイベリア・ソーラー・ノースシー・ウィンドと混合テキサス・トレースの3つの領域で、提案された構成は、ドメイン予測タスクにおける最強の古典的ベースラインの1パーセント以内に留まっている。
論文参考訳(メタデータ) (Sat, 09 May 2026 16:16:14 GMT)
A Controlled Study of Memory Hierarchy Transitions in Quantum Circuit Simulation on Apple M4 Pro Unified Memory Architecture [0.0] 状態ベクトル量子回路シミュレーションはメモリ帯域境界である。
Apple M4 Pro Unified Memory Architectureを使ってこの問題に対処する。
ピークストリーミング帯域幅は、連続しないメモリアクセスパターンのシミュレーションスピードアップを予測できないことを示す。
論文参考訳(メタデータ) (Sat, 09 May 2026 08:22:55 GMT)