Orchard: An Open-Source Agentic Modeling Framework [119.6] スケーラブルなエージェントモデリングのためのオープンソースのフレームワークOrchardを紹介します。
Orchard Envは、サンドボックスライフサイクル管理のための再利用可能なプリミティブを提供する軽量環境サービスである。
Orchard Envの上に、3つのエージェントモデリングレシピを構築します。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:35:12 GMT)
Herculean: An Agentic Benchmark for Financial Intelligence [118.0] 代表的な4つのスキルセットにまたがるエージェント金融インテリジェンスのための最初の熟練したベンチマークであるHerculeanを紹介します。
フェデラーエージェント全体では、TradingやMarket Insightsではエージェントが比較的うまく機能するが、HedgingやAuditingではかなり苦労している。
全体としては、財務的推論を信頼性のあるワークフロー実行に変換する上で、現在のエージェントに重要なギャップがあることを示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:30:49 GMT)
Boosting Reinforcement Learning with Verifiable Rewards via Randomly Selected Few-Shot Guidance [117.2] 実演誘導型RLVRアルゴリズムであるFESTを提案する。
SFTデータセットからランダムに選択された128のデモで、魅力的な結果が得られる。
この成功のためには、教師付き信号、オン・ポリケーション信号、および数ショットのSFTデータセット上の減衰重みの3つのコンポーネントが不可欠であることがわかった。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:12:30 GMT)
IG-Diff: Complex Night Scene Restoration with Illumination-Guided Diffusion Model [113.6] 夜間の状況では、個人や機械が周囲を知覚することは困難である。
拡散モデルに埋め込まれた照明誘導モジュールを統合し,照明回復プロセスの導出を行う。
本モデルでは, 低照度シナリオにおける各種劣化による逆効果と競合しながら, テクスチャの忠実さを保存できる。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:01:41 GMT)
Unified Simulation of Lagrangian Particle Dynamics via Transformer [107.4] 本研究では, 単一トランスアーキテクチャ上に構築された学習型粒子シミュレータを用いて, 布, 弾性体, ニュートン流体, ニュートン流体, 粒状物質, 分子動力学をモデル化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:18:12 GMT)
From I/O to Code with Discovery Agent [103.9] IO2Codeの発見エージェントであるDIO-Agentを提案する。
本手法は,プログラム空間上の進化的探索としてIO2Codeをフレーム化する。
大規模な実験により、DIO-Agentは従来のプログラムバイサンプル法とSOTA進化エージェントベースラインの両方を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:57:32 GMT)
Language Generation as Optimal Control: Closed-Loop Diffusion in Latent Control Space [99.3] 本研究は,言語生成を最適制御問題として再検討する。
自己回帰モデルと拡散モデルを分析するための統一された理論的な視点を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:13:43 GMT)
MeMo: Memory as a Model [96.5] 大規模言語モデル(LLM)は、幅広いタスクにわたって強力なパフォーマンスを達成するが、その後の更新まで事前訓練後に凍結される。
MeMoは、LLMパラメータを変更せずに、新しい知識を専用のメモリモデルにエンコードするモジュラーフレームワークである。
MeMoは、さまざまな設定にまたがる既存のメソッドと比較して、強力なパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:51:34 GMT)
Do Composed Image Retrieval Benchmarks Require Multimodal Composition? [87.0] 合成画像検索ベンチマークでは,マルチモーダルな構成が必要であると推定される。
4つの広く使用されているCIRベンチマークと11のジェネリストマルチモーダルエンベディングモデルで、クエリの大部分が単一モードで解決できる。
CIRの性能は、真のマルチモーダル合成ではなく、単一モーダル信号から生じる。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:56:36 GMT)
WARD: Adversarially Robust Defense of Web Agents Against Prompt Injections [85.7] WARD(Web Agent Robust Defense against Prompt Injection)は、セキュアで効率的なWebエージェントのための実用的なガードモデルである。
WARDは,719の高トラフィックURLとプラットフォームから収集された約177Kのサンプルを備えた,大規模なデータセットであるWARD-Base上に構築されている。
我々は、メモリベースの攻撃とガード共進化プロセスを通じてWARDを反復的に強化する適応的敵攻撃訓練フレームワークであるA3Tを紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:26:27 GMT)
EVA: Editing for Versatile Alignment against Jailbreaks [85.2] EVA (Editing for Versatile Alignment against Jailbreaks) は、安全アライメントのための直接モデル編集を開拓する新しいフレームワークである。
EVAは、有害な指示に対するモデルの感受性に責任がある特定のニューロンを特定し、外科的に編集する。
モデルの一般的な推論能力を損なうことなく、有害な振る舞いを効果的に中和する。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:16:10 GMT)
Learning, Fast and Slow: Towards LLMs That Adapt Continually [83.9] 大規模言語モデル(LLM)は、パラメータを更新することで下流タスクのために訓練される。
高速スロートレーニング(FST)は、推論タスクのスローラーニング(RL)よりも最大3倍のサンプリング効率を持つ。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:49:32 GMT)
Social-Mamba: Socially-Aware Trajectory Forecasting with State-Space Models [81.4] ソーシャル・マンバ(Social-Mamba)は、社会的相互作用を構造化されたシーケンシャルなプロセスとして再構築する予測アーキテクチャである。
Social-Mambaは、エゴセントリックなグリッド上でエージェントを組織し、社会的三重項分解を導入する。
5つの軌道予測ベンチマークの実験は、Social-Mambaが最先端の精度を達成していることを示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:16:01 GMT)
SceneParser: Hierarchical Scene Parsing for Visual Semantics Understanding [81.4] 一般的なシーン認識は、オブジェクト認識からオープンボキャブラリ接地、部分ローカライゼーション、アベイランス予測へと進歩してきた。
これらの機能は、インタラクション指向のシーン理解に必要な構造化された依存関係を捕捉することなく、オブジェクト、部品、またはインタラクションポイントをローカライズする独立した予測として実現されることが多い。
階層的シーンパーシング(Hierarchical Scene Parsing)は、物理的なシーンを明示的なシーンとして表現するインタラクション指向のパーシングタスクである。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:58:46 GMT)
MemEye: A Visual-Centric Evaluation Framework for Multimodal Agent Memory [81.0] 既存の評価では、エージェントが後続の推論に必要な視覚的証拠を保存するかどうかを検査することはめったにない。
メモリ性能を2次元から評価するフレームワークであるMemEyeを紹介する。
本フレームワークでは,8つのライフシナリオタスクにまたがる新しいベンチマークを構築した。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:37:52 GMT)
Articraft: An Agentic System for Scalable Articulated 3D Asset Generation [79.2] 明瞭な3Dオブジェクトを理解するための学習のボトルネックは、大規模で多様なデータセットの欠如である。
我々は,大規模言語モデル(LLM)を活用して,大規模に音響資産を生成することを提案する。
そして、このようなプログラムを自動で作成する新しいエージェントシステムArticraftを導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:18 GMT)
Action-Conditioned Risk Gating for Safety-Critical Control under Partial Observability [79.1] 部分観測可能性下でのリスク感応制御のための軽量なリスクゲート強化学習近似を提案する。
安全クリティカルな部分観測可能な2つの領域 – 自動グルコース調節と安全制約ナビゲーション – でアプローチを評価した。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:23:09 GMT)
Entropy Polarity in Reinforcement Fine-Tuning: Direction, Asymmetry, and Control [77.8] 実験的に、エントロピー極性はエントロピーの変化を確実に予測することを示した。
本稿では、両極性分岐を保護し、有利な再重み付けによるエントロピー制御を実装するPAPO(Polarity-Aware Policy Optimization)を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:02:12 GMT)
Test-Time Learning with an Evolving Library [76.9] EvoLibは、大規模な言語モデルによる知識の蓄積、再利用、進化を可能にする、テスト時の学習フレームワークである。
モデルパラメータを適用する代わりに、私たちのアプローチは知識抽象化の共有ライブラリを保持します。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:18:12 GMT)
PhyMotion: Structured 3D Motion Reward for Physics-Grounded Human Video Generation [76.0] 既存のビデオ報酬は主に2D知覚信号に依存しており、3Dの身体状態、接触状態、人間の関節の動きに基づくダイナミクスを明示的にモデル化する必要はない。
物理シミュレータにおける3次元人体軌道の復元を基礎とした構造的,きめ細かな運動報酬であるPhyMotionを提案し,運動の質を多次元の物理的実現性に沿って評価する。
実験により、PhyMotionは既存の報酬の定式化よりも人間の判断と強い相関性が得られることが示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:12:13 GMT)
EverAnimate: Minute-Scale Human Animation via Latent Flow Restoration [74.5] 本研究では,長軸アニメーション映像生成のための効率的なポストトレーニング手法であるEverAnimateを提案する。
EverAnimateは、ジェネレーションを永続的な潜在コンテキストメモリにアンカーすることで、ドリフトしたフロートラジェクトリを復元する。
ライトウェイトなLoRAチューニングだけで、EverAnimateは最先端のロングアニメーションメソッドをショート・ホライズンとロング・ホライズンの両方で上回ります。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:36:34 GMT)
FrontierSmith: Synthesizing Open-Ended Coding Problems at Scale [73.6] 既存のクローズドエンドコーディングタスクからオープンエンドの問題を進化させる自動化システムであるFrontierSmithを紹介する。
2つのオープンエンドコーディングベンチマークでは、我々の合成データに対するトレーニングはベースモデルよりも大幅に向上する。
合成された問題は、エージェントがもっと回転してトークンを使うようにもなっています。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:39:42 GMT)
Learning from Failures: Correction-Oriented Policy Optimization with Verifiable Rewards [73.4] RLVR(Reinforcement Learning with Verifiable Rewards)は,大規模言語モデルの推論能力向上に有効なパラダイムとして登場した。
本稿では,RLVRの簡易かつ効果的な拡張であるCIPO(Correction-Oriented Policy Optimization)を提案する。
CIPOは学習効率を向上し、モデルが自身のエラーを修正する能力を明示的に強化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:22:21 GMT)
Nexus : An Agentic Framework for Time Series Forecasting [72.7] 時系列予測は、ニュースやイベントのような構造化されていないコンテキストデータによる推論を必要とする。
予測を特殊なステージに分解するマルチエージェント予測フレームワークであるNexusを紹介します。
本研究では,現在のLLMは,従来よりも強い固有予測能力を有することを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:12:13 GMT)
Compositional Video Generation via Inference-Time Guidance [69.5] テキストからビデオへの拡散モデルは、しばしば構成的理解を必要とするプロンプトで失敗する。
凍結したテキスト・ビデオモデルにおける合成忠実度を改善するための推定時間誘導法であるtextbfCVG を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:50:25 GMT)
FutureSim: Replaying World Events to Evaluate Adaptive Agents [69.5] 我々はFutureSimを構築し、エージェントは世界の時系列的なリプレイと対話しながら、知識の遮断を越えて世界の出来事を予測する。
FutureSimは、その能力の明確な分離を明らかにし、最高のエージェントの精度は25%であり、多くは予測を全く行わずにBrierのスキルスコアが劣っている。
全体として、我々のベンチマーク設計は、現実世界の長い時間軸にまたがるオープンエンド適応において、AIの進歩を測定するための道を開くことを願っている。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:28 GMT)
Strategic PAC Learnability via Geometric Definability [69.3] 戦略分類は、個人が分類者の判断に影響を与えるために、コストで特徴を修正できる学習環境を研究する。
中心的な問題は、帰納的(戦略的な)仮説クラスのサンプルの複雑さが、基礎となる仮説クラスの複雑さと、実現可能な操作を管理するコスト構造にどのように依存するかである。
仮説クラスとコスト誘起近傍関係は、$mathbbR_mathtexp$上の一階式で定義することができる。
難易度は, 複雑度によって制御され, 学習性は維持されていることを証明した。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:07:26 GMT)
HASTE: Training-Free Video Diffusion Acceleration via Head-Wise Adaptive Sparse Attention [69.0] トレーニング不要のスパースアテンションは、トレーニングなしで事前トレーニングされたモデルを加速するため、魅力的である。
既存のオンラインのトップ$p$のスパース・アテンションは、マスクの予測に何の費用もかからない。
これら2つの見過ごされた要因は、ビデオDiTにおけるトレーニング不要のスパースアテンションの実践的スピード品質トレードオフを制限していることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:57:55 GMT)
InsightTok: Improving Text and Face Fidelity in Discrete Tokenization for Autoregressive Image Generation [67.9] InsightTokは、個別の視覚的トークン化フレームワークで、ローカライズされたコンテンツ対応の知覚的損失を通じて、テキストと顔の忠実度を高める。
コンパクトな16kコードブックと16倍のダウンサンプリングレートで、InsightTokはテキストや顔の再構成において、以前のトークンよりも大幅にパフォーマンスが向上した。
その結果、離散画像生成を進めるためのトークン化教育における特殊監督の可能性が浮き彫りになった。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:57:25 GMT)
K-Models: a Flexible and Interpretable Method for Ordinal Clustering with Application to Antigen-Antibody Interaction Profiles [65.2] K-Modelsは、順序的制約を統合し、観察された機能プロファイルを生成するランダムプロセスの基本的な要素を推定する新しいフレームワークである。
提案手法はシミュレーションと実世界の応用を通して評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:35:44 GMT)
Rethinking Event-Based Object Dtection through Representation-Level Temporal Aggregation and Model-Level Hypergraph Reasoning [65.1] イベントカメラはマイクロ秒レベルの時間分解能、低レイテンシ、高ダイナミックレンジを提供する。
Event Dual Temporal-Relational Aggregation Detector (Ev-DTAD)は、表現レベルの時間エンコーディングとモデルレベルの時間-ハイパーグラフ推論を統合する。
Ev-DTADは、コンパクトな時間的表現と時間的ハイパーグラフの特徴的推論の相補性を検証し、競争精度と効率のトレードオフを実現する。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:15:10 GMT)
GQA-μP: The maximal parameterization update for grouped query attention [65.0] グループクエリアテンション(GQA)のためのPスケールの導出方法を示す。
また,GQA繰り返しハイパーパラメータ間での学習速度の伝達を示すことによって,理論的導出の有効性を示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:03:16 GMT)
Resolving Action Bottleneck: Agentic Reinforcement Learning Informed by Token-Level Energy [64.7] ポリシー・グラディエント・メソッドは、各トークンを同じ軌道で扱い、均一なクレジット割り当てにつながる。
このような均一なクレジット割り当てはトークンレベルのトレーニングシグナルをほとんど誤配置していることを示す。
本稿では,トークン再重み付け手法であるActFocusを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:33:02 GMT)
What Do EEG Foundation Models Capture from Human Brain Signals? [64.5] 現代の脳波基礎モデルは、自己教師付き事前訓練を通じて生信号から直接学習する。
我々は3つのサブクエストに分解する: モデルが何を学習するか、モデルを何に使用するのか、そしてどのように説明できるのか。
3つの基礎モデル(CSBrain, CBraMod, LaBraM),5つの臨床タスク(MDD, Stress, ISRUC-Sleep, TUSL, Siena)と6ファミリー63機能レキシコンを含む。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:15:05 GMT)
Speculative Interaction Agents: Building Real-Time Agents with Asynchronous I/O and Speculative Tool Calling [64.4] 我々は,小さなエッジスケールモデルとのリアルタイムインタラクションを実現するための投機的インタラクションエージェントを提案する。
また、ストリーミング入力と非同期応答を処理するためにモデルを適応させるクロックベースのトレーニング手法を提案する。
このアプローチは、Qwen2.5-3B-InstructとLlama-3.2-3B-Instructモデルを複数のツール呼び出しベンチマークで1.6-2.2$times$ Speedupを提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:52:40 GMT)
Watermarking Game-Playing Agents in Perfect-Information Extensive-Form Games [63.2] LLMのKGW透かしは、完全情報広角ゲームにおけるウォーターマークゲームプレイングエージェントにどのように適応できるかを示す。
予測ユーティリティによって定量化されている透かし型戦略プロファイルの品質劣化は、境界づけられる可能性があるが、検出性と品質のトレードオフがある。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:33:30 GMT)
Heuristic Pathologies and Further Variance Reduction via Uncertainty Propagation in the AIVAT Family of Techniques [62.9] AIVAT推定の不確かさを定量化するために、不確実性がどのように伝播できるかを示す。
実験では,1万本のポーカーハンドのデータセットを用いて,病態と不確実性を示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:04:26 GMT)
EndPrompt: Efficient Long-Context Extension via Terminal Anchoring [62.8] 本稿では,短いトレーニングシーケンスのみを用いて,効果的なコンテキスト拡張を実現する手法であるEndPromptを提案する。
我々は、元の短いコンテキストを無傷の第1セグメントとして保存し、短い端末プロンプトを第2セグメントとして追加し、ターゲットコンテキスト長の近傍に位置指標を割り当てる。
エンドプロンプトの平均RULERスコアは76.03で、LongBenchでは最高であり、LCEG(72.24)、LongLoRA(72.95)、フル長のファインチューニングを上回っている。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:00:03 GMT)
Model Forensics in AI-Native Wireless Networks: Taxonomy, Applications, and Case Study [60.9] 我々は、AIネイティブ無線ネットワークにおけるモデル法医学に焦点をあてる。
主な問題として、モデルの信頼性検証、悪意のある機能識別、説明責任追跡がある。
その結果, モデル法医学は, 異常評価, 証明追跡, 信頼性の高い操作に重要な支援を提供する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:11:09 GMT)
SliceGraph: Mapping Process Isomers in Multi-Run Chain-of-Thought Reasoning [60.7] 我々は、CoTスライス間の疎活性化キージャカード類似性に対して、相互kNNによって構築された問題モデル-セルグラフであるSliceGraphを提案する。
同じ正規化された回答を共有する正しいCoTは、複数のプロセスファミリに分割されていることを示す。
また、プロセスファミリは、一致したnull制御の下で異なる遷移カーネルで同じアトラスをナビゲートすることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:37:26 GMT)
CalibAnyView: Beyond Single-View Camera Calibration in the Wild [59.7] カメラキャリブレーションは、信頼性の高い幾何学的知覚の基本的な前提条件である。
近年の学習に基づく手法では、単一ビューの校正には有望な結果が得られたが、本質的に複数のビューにまたがる幾何的整合性は無視されている。
任意の数の入力ビューをサポートする統一的な定式化であるCalibAnyViewを紹介します。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:32:12 GMT)
EgoExo-WM: Unlocking Exo Video for Ego World Models [59.3] エゴセントリックな世界モデルはエージェントの予測と計画を可能にする有望な方向性を示す。
外心ビデオは豊富で、身体のポーズは良好だが、エージェントのアクション空間と直接的に一致していない。
本稿では,このギャップを埋めるために,アクションの表現として,外心ビデオから構造体ポーズを抽出する手法を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:35:54 GMT)
VGGT-Edit: Feed-forward Native 3D Scene Editing with Residual Field Prediction [59.3] VGGT-Editはテキスト条件のネイティブ3Dシーン編集のためのフィードフォワードフレームワークである。
本研究では,奥行き同期テキストインジェクションを導入し,意味的指導をバックボーンの空間的ポーズと整合させる。
VGGT-Editは2Dリフトベースラインを大幅に上回り、よりシャープなオブジェクトの詳細、より強力なマルチビュー一貫性、ほぼインスタントな推論速度を生み出している。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:04 GMT)
MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents [58.7] エッジデバイス上でのプライバシに敏感なスパンを識別するMemPrivacyを提案する。
クラウドサイドのメモリ処理のために、セマンティックに構造化されたタイプアウェアプレースホルダーに置き換えられる。
MemPrivacyは、効果的なメモリ生成と検索に必要な情報を保持しながら、機密データの露出を最小限にする。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:55:04 GMT)
ViMU: Benchmarking Video Metaphorical Understanding [58.4] ViMUはビデオのフロンティアモデルのサブテキスト理解能力を評価するために設計されたベンチマークである。
暗黙的な意味を推測するために、ビデオ理解モデルがリテラル認識を超えることができるかどうかを評価する。
すべての質問はヒントのないように設計されており、答える前に重要な証拠がモデルに開示されることが保証されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:23:59 GMT)
Agentifying Patient Dynamics within LLMs through Interacting with Clinical World Model [57.8] 敗血症治療推奨のための世界モデル拡張LDMエージェントであるSepsisAgentを紹介する。
SepsisAgentは、学習された臨床世界モデルを使用して、候補の流体圧薬の介入下での患者の反応をシミュレートする。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:50:00 GMT)
CreFlow: Corrective Reflow for Sparse-Reward Embodied Video Diffusion RL [57.0] 本稿では,ポストトレーニング後のエンボディドビデオ生成モデルに対して,コンポジション制約に基づく報酬モデルを提案する。
提案するCreFlowは,2つの鍵となる設計を持つ新しいオンラインRLフレームワークである。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:18:58 GMT)
Uncovering the Representation Geometry of Minimal Cores in Overcomplete Reasoning Traces [56.5] 言語モデルは、しばしば長いチェーン・オブ・ソート・トレースを生成するが、最終的な予測を維持するのに、この理由がどの程度必要かは定かではない。
オーバーコンプリート推論トレースのレンズを通してこれを研究する。
我々は最小のコアを最終回答または予測分布を保存するステップの最小サブセットとして定義する。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:35:45 GMT)
ATLAS: Agentic or Latent Visual Reasoning? One Word is Enough for Both [55.2] ATLASは、単一の独立した「ワード」を機能トークンと呼び、エージェント操作と潜在視覚推論ユニットの両方として機能するフレームワークである。
ATLASは、明確な解釈可能性を維持しながら、挑戦的なベンチマークで優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:55 GMT)
DiffusionOPD: A Unified Perspective of On-Policy Distillation in Diffusion Models [55.0] DiffusionOPDはオンライン政策蒸留(OPD)に基づく拡散モデルのための新しいマルチタスクトレーニングパラダイムである
本研究では,DiffusionOPDがトレーニング効率と最終性能において,マルチリワードRLとカスケードRLのベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:49:09 GMT)
Video-Zero: Self-Evolution Video Understanding [55.0] ビデオの自己進化の鍵となるボトルネックは、単に困難ではなく、根拠である、と我々は主張する。
我々は,時間的局所的な証拠に自己進化を集中させる,アノテーションのない質問-回答共進化フレームワークであるVideo-Zeroを提案する。
Video-Zeroは、複数のビデオVLMバックボーンを一貫して改善し、エビデンス中心の自己進化の有効性と転送性を示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:56:14 GMT)
Selective Safety Steering via Value-Filtered Decoding [54.9] 大型言語モデル(LLM)は人間の価値観に合わせるように訓練されているが、その世代は安全上の制約に反する可能性がある。
既存のデコード時のステアリング手法は、しばしば不要に介入し、ベースモデルの下で安全であった世代を変更する。
安全でない応答の安全性を向上しつつ、そのような不要な介入を減らすための新しいテストタイムステアリング手法を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:13:08 GMT)
Minerva-Ego: Spatiotemporal Hints for Egocentric Video Understanding [54.7] Minerva-Egoは、エゴセントリックな視覚的推論を評価するためのベンチマークである。
ベンチマーク実験では、最先端のモデルには人間のパフォーマンスに大きなギャップがあることが示されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:12:20 GMT)
PreFT: Prefill-only finetuning for efficient inference [54.6] 我々は,vLLM推論エンジン上で,プリフィルのみのPEFTであるLoRAとReFTの効率的な実装を開発し,リリースする。
Llama 3.1 70Bで512ドルのアダプタを提供する場合のスループットは,従来のPEFTよりも効率的であることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:19:41 GMT)
MindVLA-U1: VLA Beats VA with Unified Streaming Architecture for Autonomous Driving [54.6] 我々は、自動運転のための最初の統合ストリーミングVLAアーキテクチャであるMindVLA-U1を紹介する。
統一されたVLMバックボーンは、1つの共有表現に1つのフォワードパスでAR言語トークンとフローマッチングされた連続的なアクショントラジェクトリを生成する。
ロングテールのWOD-E2Eベンチマークでは、MindVLA-U1が経験豊富な人間のドライバーを初めて上回った。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:31 GMT)
Edge-AI-Driven Learning-to-Rank for Decentralized Task Allocation in Circular Smart Manufacturing [54.5] 本研究は,ランクアウェア交渉に基づくエッジAI駆動型分散タスク割り当てフレームワークを提案する。
ランキング対応の定式化は、最終的に学習目標を再認識し、勝者選択の順序付けに基づく性質に適合する。
その結果, 高負荷下での遅延および期限順守が向上し, より厳密な制約下でのエネルギー効率が向上した。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:38:25 GMT)
OpenDeepThink: Parallel Reasoning via Bradley--Terry Aggregation [53.9] OpenDeepThinkは、集団ベースのテスト時間計算フレームワークで、ペアワイズBradley-Terryの比較によって選択する。
OpenDeepThinkはGemini 3.1 ProのCodeforces Eloを8回のLCMコールラウンドで+405ポイント引き上げる。
CF-73は、国際グランドマスターアノテーションによる73の専門家評価コードフォース問題と、公式判決に対する99%の地域評価合意のキュレートされたセットである。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:57:40 GMT)
RAVEN: Real-time Autoregressive Video Extrapolation with Consistency-model GRPO [53.4] 因果自己回帰ビデオ拡散モデルは、以前生成されたコンテンツから将来のチャンクを外挿することでリアルタイムストリーミング生成をサポートする。
本稿では,リアルタイム自動回帰ビデオ補間ネットワーク(RAVEN)を紹介した。これは,各自己ロールアウトを,クリーンな歴史的エンドポイントのインターリーブシーケンスに再パッケージするトレーニングタイムテストフレームワークである。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:30 GMT)
Sound Sparks Motion: Audio and Text Tuning for Video Editing [53.1] 本研究では、オーディオ映像生成モデルにおけるモーション編集を可能にする、トレーニング不要のフレームワークであるSound Sparks Motionを紹介する。
Sound Sparks Motionはテスト時に内部のマルチモーダルコンディショニング信号を調整します。
この結果から,マルチモーダル・コンディショニング・チューニングをモーション対応ビデオ編集の有望な方向として強調した。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:20:50 GMT)
How to Evaluate and Refine your CAM [53.1] クラス属性マップ(CAM)は、畳み込みニューラルネットワークの決定に関する局所的な説明を提供する。
最もよく使われるCAM法は低分解能属性写像を生成するが、その有用性は詳細な解釈可能性に制限される。
我々は,CAM評価指標の厳密な比較を可能にする,地上構造属性を持つ合成データセットを提案する。
低分解能問題に対処するために,複数のネットワーク層にまたがるCAMを集約して高分解能属性マップを生成するRefineCAMを導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:57:21 GMT)
Multi-scale Coarse-to-fine Modeling for Test-time Human Motion Control [51.9] MSCoTは、テストタイムの人間のモーション合成と制御のための、マルチスケールで粗い粒度モデルである。
MSCoTは動きを多スケールの階層表現に識別し、各時間スケールでトークンシーケンス全体を予測する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:09:49 GMT)
Stateful Reasoning via Insight Replay [51.9] CoT(Chain-of-Thought)推論は,大規模言語モデルにおける多段階推論の基盤となっている。
この現象の主な原因は、CoTが成長するにつれて、トレースの早期に生成された重要な洞察に対するモデルの注意が徐々に弱まることである。
提案手法は、モデルがその推論トレースから定期的に重要な洞察を抽出し、アクティブな世代フロンティア付近で再生するステートフル推論手法である。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:52:59 GMT)
KGPFN: Unlocking the Potential of Knowledge Graph Foundation Model via In-Context Learning [51.4] 知識グラフ(KG)基盤モデルは、伝達可能な関係構造を学習することによって、目に見えない実体と関係を持つグラフを一般化することを目的としている。
そこで我々は,KGPFNを提案する。KGPFN,KGPFN,KGPFN,KGPFN,KGPFN,KGPFN,KGPFN,KGPFN,KGPFN。
57KGベンチマークの実験では、KGPFNは、文脈内学習だけで、これまで見られなかったグラフに強く適応することを示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:41:19 GMT)
R-DMesh: Video-Guided 3D Animation via Rectified Dynamic Mesh Flow [50.9] 動画誘導3Dアニメーションは、動的資産の直感的かつ正確な制御を提供するコンテンツ制作の可能性を秘めている。
現実のシナリオでは、ユーザーが提供するビデオの最初のポーズは、参照ビデオの開始フレームとほとんど一致しない。
ビデオコンテキストに合わせて高忠実度4Dメッシュを生成するためのフレームワークであるR-DMeshを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:59:26 GMT)
Is One Score Enough? Rethinking the Evaluation of Sequentially Evolving LLM Memory [50.9] 本稿では,大規模言語モデル(LLM)メモリを逐次進化させる診断評価フレームワークであるSeqMem-Evalを紹介する。
最終的なパフォーマンスのみに焦点を当てるのではなく、SeqMem-Evalは、シーケンシャル推論において、メモリ状態がどのように進化し、一般化し、エクスペリエンスを集約し、有用な情報を保持するかを評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:15:22 GMT)
Causal Forcing++: Scalable Few-Step Autoregressive Diffusion Distillation for Real-Time Interactive Video Generation [50.6] リアルタイムのインタラクティブなビデオ生成には、低レイテンシ、ストリーミング、コントロール可能なロールアウトが必要である。
本稿では,フレームワイドの自己回帰を1~2ステップのサンプリングで行うという,よりアグレッシブな設定について検討する。
原理的かつスケーラブルなパイプラインである textbfCausal Forcing++ を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:46:36 GMT)
MemLens: Benchmarking Multimodal Long-Term Memory in Large Vision-Language Models [50.3] メモリは、長いマルチモーダル相互作用を扱うために、大きな視覚言語モデルにとって不可欠である。
MEMLENSはマルチモーダルマルチセッション会話におけるメモリのベンチマークである。
我々は27個のLVLMと7個のメモリ増強剤を評価した。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:41:17 GMT)
DVMap: Fine-Grained Pluralistic Value Alignment via High-Consensus Demographic-Value Mapping [49.4] 現在のLarge Language Models (LLMs) は通常、多元的値アライメントのために粗い粒度の国家ラベルに依存している。
この制限を解消するには、国家ラベルから多次元の人口統計制約に移行する必要があると我々は主張する。
DVMap(DVMap)は,微細な多元値アライメントのためのフレームワークである。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:06:43 GMT)
MHSA: A Lightweight Framework for Mitigating Hallucinations via Steered Attention in LVLMs [48.9] 大規模視覚言語モデル (LVLM) は多様なマルチモーダルタスクで顕著な性能を達成しているが、幻覚に悩まされ続けている。
我々は,LVLMにおける相互注意パターンの修正を学習することで幻覚を緩和するフレームワークであるMHSAを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:31:18 GMT)
Are Agents Ready to Teach? A Multi-Stage Benchmark for Real-World Teaching Workflows [48.6] EduAgentBenchは、教授作業の全範囲でチューターエージェントを評価するための、ソースグラウンドのベンチマークである。
専門的な教育的判断、複数ターンのチューターの配置、Canvasスタイルの教育ワークフローの補完という、3つの機能面にわたる品質管理タスクが150種類含まれている。
我々の知る限り、EduAgentBenchは、チューターエージェントの総合的な教育能力を評価するための理論的かつ現実的なベンチマークである。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:34:25 GMT)
Diagnosing and Correcting Concept Omission in Multimodal Diffusion Transformers [48.3] テキスト埋め込みは,対象概念の欠如を表す特徴的省略信号」を識別できることを示す。
本稿では,欠落した概念の生成を積極的に触媒するオミッション信号の増幅を行うオミッション信号干渉(OSI)を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:14:09 GMT)
Learning Scenario Reduction for Two-Stage Robust Optimization with Discrete Uncertainty [48.1] 問題駆動型シーケンシャル・ルックアヘッドであるPRISEを導入する。
PRISEは高品質なシナリオサブセットを生成するが、各選択ステップでは複数のサブプロブレムを解く必要があり、スケールで計算コストがかかる。
本稿では,GNN-Transformerのバックボーン上に構築されたニューラルサロゲートモデルNeurPRISEを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:34:13 GMT)
Beyond Distribution Estimation: Simplex Anchored Structural Inference Towards Universal Semi-Supervised Learning [47.9] 我々は、Universal Semi-supervised Learning (UniSSL)として批判的だが未探索のパラダイムを定式化する。
既存の手法は、通常擬似ラベルでラベル付けされていないデータを利用する。
我々は、表現レベルの構造推論からバイパス分布推定へ焦点を移す。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:12:38 GMT)
Hierarchical Image Tokenization for Multi-Scale Image Super Resolution [47.7] 本稿では,ビジュアルオートレグレッシブ(VAR)モデリングの最近の進歩に基づいて,マルチスケール画像スーパーレゾリューション(ISR)手法を提案する。
ISRのVARトレーニングには2つの新しいコンポーネントを導入し、柔軟性の向上と複雑さの低減を目的としている。
我々の提案したHITは、VARトレーニングの強い誘導バイアスとして機能し、その結果、外部トレーニングデータなしで最先端の結果が得られる小さなモデルとなった。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:35:51 GMT)
MemQ: Integrating Q-Learning into Self-Evolving Memory Agents over Provenance DAGs [47.7] 我々は,新たなメモリが生成されるたびに記憶が取得されたことを記録した証明DAGを通じて,クレジットを後方に伝播するMemQを紹介した。
6つのベンチマークで、MemQは、一般化評価とランタイム学習の6つすべてで最高成功率を達成した。
さらに、$と$がEC-MDP構造とどのように相互作用するかを研究し、パラメータ選択と将来の研究の原則的なガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:13:01 GMT)
Crys-JEPA: Accelerating Crystal Discovery via Embedding Screening and Generative Refinement [47.3] 現在の結晶生成モデルは、顕著な安定性-ノベルティトレードオフに捕らわれている。
我々はCrys-JEPAを紹介した。Crys-JEPAは、エネルギーを意識した潜在空間を学習する結晶の組込み予測アーキテクチャである。
我々は,期待できる生成結晶を識別し,生成モデルを改良するために再導入するスクリーニング・リファインメントパイプラインを開発した。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:23:04 GMT)
HDRFace: Rethinking Face Restoration with High-Dimensional Representation [47.2] 本稿では, 合成バックボーンを変更することなく, セマンティックにリッチな前処理を条件付きフローに注入する高次元表現条件付き顔復元フレームワークを提案する。
このパイプラインは、まず、オフザシェルフ修復器を用いて構造的に信頼性の高い中間修復を行い、次にトレーニング済みの高次元特徴エンコーダを用いて、低品質入力と中間結果の両方からきめ細かな顔の表現を抽出する。
さらに,構造モデリング時の大域的制約を強調し,詳細合成時の表現指導を強化する構造細部対応型核融合機構であるSDFMを紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:31:24 GMT)
Fast Adversarial Attacks with Gradient Prediction [47.0] 入力勾配をフォワードパス隠蔽状態から軽量線形回帰により予測することにより、後方通過を排除した攻撃群を導入する。
実験により,FGSMの攻撃性能はごくわずかの時間で回復し,スループットが5,32%向上した。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:16:51 GMT)
Bridging Brain and Semantics: A Hierarchical Framework for Semantically Enhanced fMRI-to-Video Reconstruction [46.8] 我々は,fMRI信号からの映像再構成を意味的に強化する新しい階層的フレームワークであるCineNeuronを紹介する。
我々は、CineNeuronが様々なメトリクスで最先端の手法を超越していることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:39:42 GMT)
From Plans to Pixels: Learning to Plan and Orchestrate for Open-Ended Image Editing [46.5] プランナーが構造化された原子分解を生成し、オーケストレータがツールとリージョンを選択して各ステップを実行する。
視覚言語審査員は、指示の順守と視覚的品質に対する結果に基づく報酬を提供する。
我々のアプローチは、シングルステップやルールベースのマルチステップベースラインよりも一貫性があり、信頼性の高い編集をもたらす。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:58:19 GMT)
Two Protons, Two Positrons, and Four Electrons: Covalent Bond with van der Waals Characteristics [46.0] 2つの陽子、2つの陽電子、4つの電子からなる水素化ポジトロニウムのパラダイム的な例に焦点を当てた。
この結果から,非局在化プロトボンドを形成する能力は量子系のより一般的な性質であることが示唆された。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:19:09 GMT)
LiSA: Lifelong Safety Adaptation via Conservative Policy Induction [45.9] ガードレールはもはや単なる回答品質ではなく、秘密を漏らしたり、安全でない行為を許可したり、正当な作業をブロックしたりすることができる。
LiSAは、構造化メモリを通じて固定ベースガードレールを改善する保守的なポリシー誘導フレームワークである。
結局のところ、LiSAは、現実のエッジリスクの予測不可能な長いテールに対して、AIエージェントを保護するための実践的なパスを提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:47:35 GMT)
Does Synthetic Layered Design Data Benefit Layered Design Decomposition? [45.7] ポスト世代編集は依然として困難であり、実用的なユーザビリティに向けた最後の1マイルのギャップが明らかになっている。
既存のアプローチは、ほとんど独自の階層化された資産に依存しているか、あるいは制限された構造上の前提から部分的に合成データを構築するかのいずれかである。
純粋な合成層データによってグラフィック設計の分解が向上するかどうかを考察する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:55:11 GMT)
MMSkills: Towards Multimodal Skills for General Visual Agents [45.2] MMSkillsは、実行時の視覚的意思決定のための再利用可能なマルチモーダルプロシージャを表現、生成、使用するためのフレームワークである。
MMSkillsは、実行時のステートカードとマルチビューとテキストプロシージャを結合した、コンパクトで状態条件のパッケージである。
GUIとゲームベースのビジュアルエージェントベンチマークによる実験では、MMSkillsはフロンティアとより小さなマルチモーダルエージェントの両方を一貫して改善している。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:52:04 GMT)
The End of Trust: How Agentic AI Breaks Security Assumptions [45.1] Infinite Impostorは、自律エージェントが既に信頼している2つの当事者間で相互に介在する攻撃モデルである。
本稿では,アクターの認証から行動評価へセキュリティを移行させる疑似デフォルトでのパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:30:06 GMT)
SANA-WM: Efficient Minute-Scale World Modeling with Hybrid Linear Diffusion Transformer [45.1] SANA-WM(SANA-WM)は、1分間の高忠実度、720pの精密なカメラ制御で訓練された効率的なオープンソースワールドモデルである。
SANA-WMはLingBot-WorldやHY-WorldPlayのような大規模産業ベースラインに匹敵する視覚的品質を実現している。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:58:03 GMT)
ICED: Concept-level Machine Unlearning via Interpretable Concept Decomposition [44.7] 視覚言語モデル(VLM)のための解釈可能な概念レベルのアンラーニングフレームワークを提案する。
提案手法は,非学習を概念レベルの最適化として定式化し,対象概念を選択的に抑制し,非目標セマンティクスとグローバルなクロスモーダル知識を保存する。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:22:12 GMT)
From Feedback Loops to Policy Updates: Reinforcement Fine-Tuning for LLM-Based Alpha Factor Discovery [44.2] 我々は,強化微調整に基づく自己進化型アルファファクター発見フレームワークであるtextscQuantEvolverを提案する。
textscQuantEvolverは高品質なシードファクタを構築し、多様なシードタイムウィンドウトレーニングタスクを構築し、実行可能なFacter DSL式を生成する。
トレーニング中、高品質な要因はMined Factor Databaseに継続的に蓄積され、最終発見ファクターライブラリとして機能する。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:54:40 GMT)
Reading the Cell, Designing the Cure: Perturbation-Conditioned Molecular Diffusion for Function-Oriented Drug Design [44.1] 生成的逆問題としてemphTranscriptome-based Drug Design (TBDD) を定式化した。
textbfthemodel (A textbfCelltextbfUlar textbfResponse textbfEngine) を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:17:10 GMT)
Spontaneous symmetry breaking and Goldstone modes for deep information propagation [43.7] 物理系では、連続対称性が自然に壊れるたびに、この系はゴールドストーンモードと呼ばれる励起を持つ。
本研究では,内部層が連続対称性の下で不変であるディープニューラルネットワークについて検討する。
解析的および実験的に、これらの自由度が、深さと繰り返しの繰り返しをまたいでコヒーレントな信号伝達を可能にすることを実証する。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:59:28 GMT)
Hydra: Efficient, Correct Code Generation via Checkpoint-and-Rollback Support [43.1] コード生成時の静的エラーから効率的に回復するシステムであるHydraを提案する。
我々はClang C/C++コンパイラを改造し、控えめな修正でHydraをサポートする。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:18:16 GMT)
Evo-Depth: A Lightweight Depth-Enhanced Vision-Language-Action Model [43.1] Vision-Language-Actionモデルは、認識、言語基盤、アクション生成の統一を約束している。
現在のVLAモデルは、深度情報と詳細な空間関係を持たない2次元視覚表現に大きく依存している。
Evo-Depthは、空間的に接地された操作を強化する軽量な深度強化VLAフレームワークである。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:21:36 GMT)
CT-DegradBench: A Physics-Informed Benchmark for CT Degradation Detection and Severity Estimation [42.9] 我々は,CT劣化検出と重度推定のためのデータセットとベンチマークであるCT-DegradBenchを提案する。
本稿では,医用視覚言語モデルのセマンティック先行と,人工物分析のための補完周波数領域キューを組み合わせたフレームワークであるSeSpeCTを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:30:00 GMT)
$π$-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows [42.6] $$-Benchは、5つのドメイン固有のユーザペルソナにわたる100のマルチターンタスクからなるプロアクティブアシストのベンチマークである。
隠れたユーザインテント、タスク間の依存関係、セッション間の連続性によって、$$$-Benchは、拡張されたインタラクションよりもユーザニーズを予測し、対処するエージェントの能力を評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:47:04 GMT)
Flow-OPD: On-Policy Distillation for Flow Matching Models [42.3] Flow-OPDは、オンライン蒸留をFlow Matchingモデルに統合するポストトレーニングフレームワークである。
これはGenEvalのスコアを63から92に引き上げ、OCRの精度を59から94に引き上げ、バニラGRPOよりも10点程度向上した。
これらの結果は、汎用的なテキスト-画像モデルを構築するためのスケーラブルなアライメントパラダイムとして、Flow-OPDを確立する。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:16:32 GMT)
Probing into Camera Control of Video Models [42.1] カメラ制御は暗黙のマッピング問題としてモデル化する必要はないが、幾何学的ガイダンスの一形態として扱うことができる。
我々は、カメラ制御を一連の変位場に再構成し、デノナイジング時に潜伏特徴の識別可能な再サンプリングにより適用する。
我々の単純なアプローチは、微調整されたベースラインに比べて、様々な品質指標の劣化を最小限に抑え、効果的なカメラ制御を実現する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:27:33 GMT)
Woodelf++: A Fast and Unified Partial Dependence Plot Algorithm for Decision Tree Ensembles [42.0] Woodelf++は、効率的なSHAP計算のアルゴリズムであるWoodelfをベースにしている。
PDPは、1つの機能の変更が平均モデル予測にどのように影響するかを視覚化する。
共同PDPは、このアイデアを一連の機能に拡張し、組み合わせた効果を明らかにした。
PDIVはデータセットの全行にわたるすべての機能サブセットに対するこれらのインタラクションを計算します。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:49:19 GMT)
Towards Self-Evolving Agentic Literature Retrieval [41.9] PaSaMasterは自己進化型エージェント文献検索システムである。
証拠を根拠としたレコメンデーションで、レコメンデーション付き紙のランク付けを行う。
検索を、生成ではなく、紙関連ランキングとして扱うことにより、幻覚源を防止する。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:17:31 GMT)
GFMate: Empowering Graph Foundation Models with Test-time Prompt Tuning [41.9] 最近の研究はグラフ基礎モデル(GFM)を改善するためのグラフプロンプトを拡張している
既存のほとんどのメソッドは、ソースドメイン情報をプロンプトに埋め込んでおり、GFMへの入力として機能するか、モデル事前トレーニング中にエンコードされる。
これらの知見により,本論文は,GFMate という,事前学習に依存しないテスト時間グラフプロンプトチューニングによる GFM の強化を目的としている。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:22:33 GMT)
Sat3DGen: Comprehensive Street-Level 3D Scene Generation from Single Satellite Image [41.8] そこで我々は,Sat3DGenを導入して,幾何優先の方法論を具現化した基本的な課題に対処する。
この手法は、新しい幾何学的制約と視点学習戦略を統合することにより、フィードフォワードパラダイムを強化する。
検証のために,VIGOR-OODテストセットと高分解能DSMデータを組み合わせた新しいベンチマークを構築した。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:48:15 GMT)
Towards Accurate Single Panoramic 3D Detection: A Semantic Gaussian Centric Approach [40.7] PanoGSDetは、連続的なセマンティックな3Dガウス表現に基づいて構築された単分子パノラマ3D検出フレームワークである。
我々の手法は既存の手法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:14:24 GMT)
SWE-Chain: Benchmarking Coding Agents on Chained Release-Level Package Upgrades [40.0] SWE-Chainは、チェーン化されたリリースレベルのパッケージアップグレードでエージェントを評価するためのベンチマークである。
9つの実際のPythonパッケージに12のアップグレードチェーンがあり、155バージョンの移行と1,660のアップグレード要件がある。
その結果、SWE-Chainは実現可能かつ差別的であり、既存のエージェントが既存の機能を壊さずに正しいアップグレードを行うのに苦労していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:04:40 GMT)
SpeakerLLM: A Speaker-Specialized Audio-LLM for Speaker Understanding and Verification Reasoning [40.0] SpeakerLLMは、単一発話話者プロファイリング、記録条件理解、発話対話者比較、自然なインタフェース内でのエビデンス-組織された検証推論を統一する話者特化オーディオ-LLMフレームワークである。
SpeakerLLMは、複数の粒度の話者証拠をキャプチャするために設計された階層型話者トークンライザを使用する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:36:57 GMT)
Asymmetric Generative Recommendation via Multi-Expert Projection and Multi-Faceted Hierarchical Quantization [39.9] AsymRecは、入力と出力の表現を分離する非対称な連続離散フレームワークである。
常に最先端のジェネレーティブ・レコメンデーターを平均15.8%上回っている。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:55:43 GMT)
An Interpretable Latency Model for Speculative Decoding in LLM Serving [39.7] 本研究では,大規模言語モデル提供システムにおける投機的復号化のための簡易かつ解釈可能な遅延モデルを開発する。
検証器およびドラフトアモデルサイズ,プリフィルおよびデコード長,要求率,ドラフト長,受入確率をまたいだ vLLM の広範な測定値を用いて,本モデルの有効性を検証する。
フレームワークが専門家モデルの混合にどのように拡張されているかを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:45:28 GMT)
Hidden in Memory: Sleeper Memory Poisoning in LLM Agents [39.7] 本研究は, 睡眠時記憶障害(sleeper memory poisoning)について検討する。これは, 相手が外部コンテキストを操作して, ユーザに関する偽造記憶を記憶させる, 遅延攻撃である。
従来のプロンプトインジェクションとは異なり、攻撃は休眠状態のままで、後続の会話をまたいで再起動することができる。
GPT-5.5では99.8%、Kim-K2.6では95%の有毒な記憶が加えられた。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:06:10 GMT)
H-OmniStereo: Zero-Shot Omnidirectional Stereo Matching with Heading-Aligned Normal Priors [39.6] H-OmniStereoはゼロショット全方位ステレオマッチングフレームワークである。
我々は280万以上のトップボトム等方形ステレオペアからなる高品質な合成データセットを構築した。
提案手法は,ドメイン外データセットの既存手法よりも精度が高く,実際のコンシューマ・カメラ・セットアップへの一般化に成功している。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:30:22 GMT)
Realizable Bayes-Consistency for General Metric Losses [38.9] 一般のメトリクス損失を伴う学習のための実現可能な環境における強普遍的ベイズ整合性について検討する。
無限に減少しない$(_k)$-リトルストーンツリーの概念を導入する。
これは、Bousquet et al. (2020)で使われるリトルストーンの木構造を、メートル法損失設定まで拡張する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:42:31 GMT)
COAL: Counterfactual and Observation-Enhanced Alignment Learning for Discriminative Referring Multi-Object Tracking [38.3] COAL(Counterfactual and Observation-enhanced Alignment Learning)は、RMOTを知識正規化を通じて分離された構造最適化を超えて前進させるフレームワークである。
VLMによる明示的セマンティックインジェクション(ESI)を導入し,観測空間の密度化とインスタンス識別性の向上を図る。
また,頑健な構成認識のための厳密な属性検証を実施することにより,監督を強化するために,対実学習(CFL)を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:06:00 GMT)
GenAI for Energy-Efficient and Interference-Aware Compressed Sensing of GNSS Signals on a Google Edge TPU [37.7] 本稿では,ジェネレーション人工知能(GenAI)を用いたジャミング脅威の圧縮と分類手法を提案する。
提案手法は,ハードウェアレシーバ上でのデータストリームを直接効率よく圧縮し,同時にジャミングとスプーフィングの攻撃をリアルタイムで分類する。
ハードウェア中心のGenAIアプローチは、ジャマー信号伝送コストを大幅に削減し、干渉軽減のための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:43:55 GMT)
ReactiveGWM: Steering NPC in Reactive Game World Models [37.4] プレイヤーとNPC間の動的相互作用を合成するリアクティブゲームワールドモデルであるReactiveGWMを紹介する。
私たちの学習したモジュールは、さまざまなゲームの既製の、注釈のない世界モデルに直接プラグインすることができます。
これにより、ゼロショット戦略の転送が可能になります。学習したモジュールは、さまざまなゲームの既製の無注釈の世界モデルに直接プラグインすることができます。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:52:03 GMT)
NeuroTrain: Surveying Local Learning Rules for Spiking Neural Networks with an Open Benchmarking Framework [37.1] スパイキングニューラルネットワーク(SNN)は、生物学的インスピレーション、計算構造、ハードウェア適合性など、広く異なるトレーニングアルゴリズムの普及につながっている。
本調査は,SNNトレーニングアルゴリズムの包括的分類,代理段階のバックプロパゲーション,局所的および3要素学習規則,生物学的にインスパイアされた可塑性機構,ANN-to-SNN変換パイプライン,非標準最適化戦略を網羅する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:50:15 GMT)
Learning to Build the Environment: Self-Evolving Reasoning RL via Verifiable Environment Synthesis [37.0] 我々は、モデルが単に問題やトレースを生成して模倣するだけでなく、それを訓練する環境を構築する、自己改善型言語モデルに対するビジョンを追求する。
このビューをEvoEnvでインスタンス化します。EvoEnvは10個のシードからPython環境を合成する単一ポリシージェネレータ、ソルバメソッドです。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:14:45 GMT)
Semantic Feature Segmentation for Interpretable Predictive Maintenance in Complex Systems [36.9] 本研究では,監視対象の機能空間を標準コンポーネントに分解するセグメンテーションフレームワークを提案する。
標準空間は、複数の時間的構成をまたいだ残留空間よりも予測リスクが低いことを示す。
これらの結果は,意味的特徴分節化が監視信号の解釈および情報遅延分解をもたらすことを示唆している。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:29:37 GMT)
3D Skew-Normal Splatting [36.9] 3D Gaussian Splatting (3DGS) は、リアルタイムな新規なビュー合成の主役として登場した。
本研究では,Azzalini Skew-Normal 分布を基本的プリミティブとして採用した Skew-Normal Splatting (SNS) を提案する。
SNSは、ガウスカーネルと最近の非ガウスカーネルの再構成品質を継続的に改善する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:10:41 GMT)
Positive Alignment: Artificial Intelligence for Human Flourishing [36.7] 既存のアライメント研究は、安全と害の防止に関する懸念に支配されている。
ポジティブアライメント(Positive Alignment)とは、人間と生態の繁栄を積極的に支援するAIシステムの開発である。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:50:45 GMT)
From Scenes to Elements: Multi-Granularity Evidence Retrieval for Verifiable Multimodal RAG [36.7] マルチモーダルベンチマークであるGranuVistaVQAを紹介した。
視覚要素を3段階から一級検索単位として扱う多粒度フレームワークであるGranuRAGを提案する。
実験の結果、グラヌラグは6つの強いベースラインに対して最大29.2%の改善を達成した。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:20:02 GMT)
Controllable Molecular Generative Foundation Models [36.6] 我々は textbfControllable textbfMolecular Generative Foundation Models (CoMole) を提案する。
モチーフ対応グラフ空間を学習することにより、CoMoleは事前学習された構造的事前を制御可能な生成に転送する。
我々は、CoMoleが9つの目標に対して第一に制御性にランク付けし、最強のベースラインに対して最大48.2%のMAEを減少させ、ルールベースの補正やポストホックフィルタリングなしで0.94以上の妥当性を維持していることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:27:01 GMT)
Beyond What to Select: A Plug-and-play Oscillatory Data-Volume Scheduling for Efficient Model Training [36.3] 選択データ学習は、瞬時選択比による暗黙の正則化効果を誘導することを示す。
これは、選択によって引き起こされる正規化を低くするのに対して、高い比率はデータカバレッジを保っている、という重要なトレードオフを明らかにします。
PODSは既存の静的および動的選択メソッドと互換性があり、トレーニングパラダイムに広く適用できる。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:37:11 GMT)
Chain-of-Procedure: Hierarchical Visual-Language Reasoning for Procedural QA [36.1] プロシージャVQAは、視覚的な手続き的推論のために設計された新しいマルチモーダルベンチマークである。
階層的推論フレームワークであるChain-of-Procedure(CoP)について述べる。このフレームワークはまず視覚的手がかりを用いて関連命令を検索し,意味的分解によってステップリファインメントを行い,最後に次のステップを生成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:03:36 GMT)
What Information Matters? Graph Out-of-Distribution Detection via Tri-Component Information Decomposition [36.1] グラフニューラルネットワークは、ノード分類に広く使用されているが、ノードの特徴やグラフ構造におけるアウト・オブ・ディストリビューション(OOD)シフトに弱いままである。
TIDEは,情報を特徴特化,構造特化,結合コンポーネントに明示的に分解する,斬新で効果的な3成分情報分解フレームワークである。
7つのデータセットにわたる大規模な実験により、TIDEの有効性が確認され、強力なベースラインよりもFPR95が最大34%改善された。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:41:44 GMT)
Pelican-Unified 1.0: A Unified Embodied Intelligence Model for Understanding, Reasoning, Imagination and Action [36.0] Pelican-Unified 1.0は、統一の原則に従って訓練された最初の基礎モデルである。
単一のVLMを統一理解モジュールとして使用し、シーン、指示、視覚的コンテキスト、アクション履歴を共有意味空間にマッピングする。
単一のチェックポイントで、Pelican-Unified 1.0は3つの機能にまたがって強力なパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:50:42 GMT)
Geometrically Constrained Stenosis Editing in Coronary Angiography via Entropic Optimal Transport [35.9] 本稿では,ローカル化編集を制約付きエントロピー最適輸送(OT)問題として再設定するOT-Bridge Editorを提案する。
我々の合成血管造影は下流狭窄の検出を継続的に改善し、ARCADEベンチマークでは27.8%の実質的な上昇を示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:32:57 GMT)
Uncertainty Quantification for Large Language Diffusion Models [35.9] 自己回帰モデルに代わるものとして,大規模言語拡散モデル (LLDM) が登場している。
既存の不確実量化(UQ)手法は自己回帰因子化を前提とするか、高価な繰り返しサンプリングを使用する。
LLDMのUQに関する最初の体系的研究を行い、軽量ゼロショット不確実性信号を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:39:56 GMT)
Towards Real-Time Autonomous Navigation: Transformer-Based Catheter Tip Tracking in Fluoroscopy [35.6] 本研究の目的は, 実時間カテーテル先端追跡パイプラインの開発と評価である。
U-Net、U-Net+Transformer、SegFormerなどのディープラーニングセグメンテーションモデルをトレーニングし、ベンチマークした。
2級のSegFormerは平均絶対誤差4.44mm、U-Net(4.60mm)、U-Net+Transformer(6.20mm)、および3級モデル(5.19-7.74mm)を上回った。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:42:56 GMT)
Dual-Latent Collaborative Decoding for Fidelity-Perception Balanced Image Compression [35.5] 本稿では,相補的潜在パラダイム間での責務を分解する,二重遅延協調的復号化フレームワークを提案する。
MoDEは、SQブランチをフィデリティ指向の専門家として、VQブランチを知覚指向の専門家として扱い、2つのデコーダ側モジュールを通じてそれらを調整する。
このフレームワークは、共有デュアルストリームビットストリーム下での選択的クロスレイテンシ協調をサポートし、忠実度アンコールと知覚アンコールの両方のデコーディングを可能にする。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:13:23 GMT)
Angel or Demon: Investigating the Plasticity Interventions' Impact on Backdoor Threats in Deep Reinforcement Learning [35.3] 代表的な介入と攻撃シナリオを統合した14,664症例について検討した。
1つの介入(SAM)だけがバックドアの脅威を悪化させ、他の介入はそれらを緩和する。
1) DRLの介入とバックドアの機械的相互作用を相互作用する頑健なバックドア注入の概念的枠組みと,(2) DRLのバックドア検出の指標としての異常な損失景観のシャープネスの2つの新しい知見を導出した。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:58:24 GMT)
Peng's Q($λ$) for Conservative Value Estimation in Offline Reinforcement Learning [35.2] 我々は、モデルなしオフライン多段階強化学習アルゴリズム、Reserve PengのQ($$)(CPQL)を提案する。
我々のアルゴリズムはベルマン演算子の代替としてペンのQ($$) (PQL)演算子を保守的な値推定に適応させる。
CPQLは同時に過悲観的な値推定を緩和し、動作ポリシよりもパフォーマンスを向上(あるいは同等)し、ほぼ最適なパフォーマンス保証を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:48:44 GMT)
On the Cultural Anachronism and Temporal Reasoning in Vision Language Models [35.1] ヴィジュアル・ランゲージ・モデル(VLM)は、文化遺産にますます応用されている。
この研究は、これらのモデルが歴史的アーティファクトをどのように解釈するかという根本的な問題を特定する。
我々は、この現象を、時間的に不適切な概念を用いて歴史的対象を誤解釈する傾向である文化的アナクロニズムと定義する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:58:16 GMT)
Compositional Sparsity as an Inductive Bias for Neural Architecture Design [35.1] 我々は、ディープニューラルネットワークが次元の呪いを克服できる構造的先行性を特定する。
本稿では,階層的な構成によって抽象化が生じる解釈可能なパイプラインを提案する。
現実世界のデータセットの幅広いスイートの中で、HNNは、はるかに少ないパラメータを使用しながら、常に密なベースラインにマッチまたは性能を向上する。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:26:50 GMT)
RefDecoder: Enhancing Visual Generation with Conditional Video Decoding [34.5] RefDecoderは、参照アテンションを介してデコードプロセスに直接高忠実度参照画像信号を注入する参照条件付きVAEデコーダである。
我々は、Inter4K、WebVid、Large Motion再構成ベンチマークの無条件ベースラインに対して、+2.1dB PSNRを達成し、いくつかのデコーダバックボーン間で一貫した改善を実証する。
RefDecoderは、追加の微調整なしで既存のビデオ生成システムと直接交換することができる。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:52 GMT)
Reduce the Artifacts Bias for More Generalizable AI-Generated Image Detection [34.4] 一般的な戦略は、拡散法において顕著な結果を示す、VAEやDDIMといった再構成技術を採用することである。
コンテンツ,サイズ,フォーマットアライメントを保存しながら,GAN生成した偽パターンを模倣するGANに基づくアップサンプリング手法を提案する。
まず、凍結した基礎モデル上でLoRA適応を用いてドメイン固有の専門家を訓練し、その後、専門家の特徴を適応的に組み合わせるために、ゲーティングネットワークと疎結合の融合を行う。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:26:36 GMT)
Accelerating State-Vector Quantum Simulation on Integrated GPUs via Cache Locality Optimization: A Cross-Architecture Evaluation [33.7] この研究は、コンシューマグレードのラップトップで一般的に見られる統合GPUをターゲットにしたベンダーに依存しないアプローチを提案する。
状態ベクトルシミュレーションにおける主な課題は、本質的には空間的局所性が低く、メモリ帯域幅のボトルネックが生じることである。
我々は、最後のレベルのキャッシュ局所性を最大化し、コストのかかるメインメモリフェッチを最小限に抑えるために、量子状態ベクトルを再編成する状態分割最適化を導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:17:02 GMT)
MetaMoE: Diversity-Aware Proxy Selection for Privacy-Preserving Mixture-of-Experts Unification [33.7] 独立に訓練されたドメインの専門家を単一のMoEに統一する,プライバシー保護フレームワークであるMetaMoEを提案する。
プロキシは、プライベートデータの分布を近似し、ルータ学習を監督するために使用されます。
コンピュータビジョンと自然言語処理ベンチマークの実験は、MetaMoEが最近のプライバシー保護のMoE統一手法を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:48:23 GMT)
GEAR: Granularity-Adaptive Advantage Reweighting for LLM Agents via Self-Distillation [33.4] Granularity-AdaptivE Advantage Reweightingはトークンレベルの信号とセグメントレベルの信号を使って、軌跡レベルのGRPOの利点を再評価する。
GEARは、標準のGRPO、自己蒸留のみのベースライン、トークンまたはターンレベルのクレジット割り当てメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:19:32 GMT)
Action Emergence from Streaming Intent [32.9] 我々は、エンド・ツー・エンドの自動運転の目標能力としてアクションの出現を定式化する。
従来のパラダイムでは、アクションの出現はできません。
本稿では,運転意図を意味的にストリーム化するメカニズムとしてStreaming Intentを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:01 GMT)
DualKV: Shared-Prompt Flash Attention for Efficient RL Training with Large Rollouts and Long Contexts [32.6] GRPOやDAPOのような現代のRLポストトレーニングメソッドは、共有プロンプトからサンプリングされた$R$トークンの$N$レスポンスシーケンスでトレーニングする。
標準FlashAttentionは、すべての$P$プロンプトトークンを前方と後方の両方で$N回複製する。
トレーニング中に共有プロンプトレプリケーションを排除した最初のFlashカーネルである textDualAttention を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:11:32 GMT)
RxEval: A Prescription-Level Benchmark for Evaluating LLM Medication Recommendation [32.6] 既存のベンチマークでは、実際のプリスクライブのタイムポイント当たりの情報豊富な性質を捉えられません。
提案するRxEvalは,複数問合せによるLCM処方能力の評価を行う処方料レベルベンチマークである。
RxEvalは、患者584人、診断カテゴリー18人、ユニークな薬物969人を対象にした1,547の質問からなる。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:24:03 GMT)
Learning Direct Control Policies with Flow Matching for Autonomous Driving [32.5] 自律走行のためのフローマッチングプランナーは、加速度と曲率によって定義された実行可能な軌道を生成する。
モデルは、周囲のシーンの鳥の目視(BEV)制御プロファイルに条件付けされる。
反応エージェントを用いた2次元交通シミュレータから収集した都市シナリオのみをトレーニングする。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:37:48 GMT)
SearchSkill: Teaching LLMs to Use Search Tools with Evolving Skill Banks [32.2] 本稿では,再利用可能な検索スキルによってクエリ計画を明確にするフレームワークを提案する。
オープンソースモデルとクローズドソースモデル全体で、SearchSkillは知識集約型QAベンチマークの正確なマッチを改善している。
これらの結果は、明示的なスキル条件付きクエリプランニングが、未分化のアクションとして検索を扱うための軽量な代替手段であることを示唆している。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:12:06 GMT)
Interestingness as an Inductive Heuristic for Future Compression Progress [32.0] 我々は、Longth, Algorithmic, Speedで複雑性ランタイムプロファイルを解析する。
予測される今後の進歩は、観測された最後のブレークスルーの正確さに指数関数的に依存することを証明する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:36:14 GMT)
LEMON: Learning Executable Multi-Agent Orchestration via Counterfactual Reinforcement Learning [31.9] 大規模言語モデル(LLM)はマルチエージェントシステムの強力な基盤となっているが、その効果はオーケストレーション設計に大きく依存している。
実行可能なオーケストレーション仕様を生成するオーケストレータであるLEMONを提案する。
MMLU、GSM8K、AQuA、MultiArith、SVAMP、HumanEvalを含む6つの推論およびコーディングベンチマークの実験は、LEMONが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:24:09 GMT)
3DEditSafe: Defending 3D Editing Pipelines from Unsafe Generation [31.8] 我々は,3次元編集パイプラインにおける安全でない生成について検討し,このような動作が一貫性のある,望ましくないNot-Safe-For-Work(NSFW)コンテンツにつながることを示す。
本稿では,安全性に配慮した3D編集フレームワークである3DEditSafeを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:30:50 GMT)
MiVE: Multiscale Vision-language features for reference-guided video Editing [31.7] 我々は、VLMをマルチスケール特徴抽出器として再利用するフレームワークであるMiVE(Multiscale Vision- language features for reference-guided video Editing)を提案する。
実験により、MiVEは人間の嗜好において最高にランク付けし、学術的手法と商業システムの両方を上回り、最先端のパフォーマンスを達成することが実証された。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:19:19 GMT)
Probing Privacy Leaks in LLM-based Code Generation via Test Generation [31.6] 本稿では,実用的なプライバシ関連コード生成シナリオをシミュレートするパイプラインを提案する。
手動プロンプトエンジニアリングを代替する,自動構築のプライバシ機能ライブラリを導入する。
私たちのパイプラインは、より確認されたプライバシリークを公開し、既存のベースラインに比べて検出されたリークを2.56倍増加させる。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:16:34 GMT)
Video Models Can Reason with Verifiable Rewards [31.4] 本稿では,ルールベースフィードバックによる映像拡散モデルの最適化手法であるVideoRLVRを紹介する。
VideoRLVRは、検証可能な視覚軌跡の生成としてビデオ推論を定式化する。
客観的な成功基準を持つ3つのプロシージャ生成ドメインであるMaze, FlowFree, Sokoban の VideoRLVR の評価を行った。
論文参考訳(メタデータ) (Thu, 14 May 2026 22:40:56 GMT)
AQKA: Active Quantum Kernel Acquisition Under a Shot Budget [30.9] 回路忠実度から$N倍N$量子カーネルを推定するには$(N2 S)$測定ショットが必要である。
textbfFirstは、ショット予算の量子カーネル学習のための完全な構造分解である。
textbfSecond - 閉じた形式のペアレベルの取得理論。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:30:27 GMT)
Knowledge Beyond Language: Bridging the Gap in Multilingual Machine Unlearning Evaluation [30.7] 多言語コーパスでは、MMU(Multilingual Machine Unlearning)は複数の言語にまたがる情報を削除することを目的としている。
以前のMMU評価では、そのような言語横断的な情報の分布を捉えられなかった。
本稿では,知識分離可能性スコア(KSS)と知識永続化スコア(KPS)の2つの指標を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:45:24 GMT)
EponaV2: Driving World Model with Comprehensive Future Reasoning [30.6] 本研究では,世界モデルを駆動する新しいパラダイムであるEponaV2を提案する。
人間のドライバーが3Dの幾何学と意味をどう予測するかに触発され、より包括的な未来の表現を予測するためにモデルを訓練する。
3Dとセマンティックなモダリティを抽出することで、我々のモデルは周囲の環境を深く理解することができる。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:12:23 GMT)
Superconducting single-photon detectors for integrated quantum photonics [30.5] 単一光子検出は量子技術の基本的な要件である。
超伝導ナノワイヤ単光子検出器が主要な溶液として登場している。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:35:48 GMT)
CoRDS: Coreset-based Representative and Diverse Selection for Streaming Video Understanding [30.3] 大規模な視覚言語モデル(VLM)によるビデオ理解のストリーミングには、成長を続ける視覚履歴に対する将来の推論をサポートするためのコンパクトなメモリが必要である。
一般的な解決策はキー値(KV)キャッシュを圧縮することだが、既存のストリーミングメソッドは通常、ローカルトークンに頼っている。
我々は,KV-cache圧縮を,保持のために独立にトークンをスコアリングするのではなく,コアセット選択問題とみなす。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:22:30 GMT)
Language-Induced Priors for Domain Adaptation [30.2] ドメイン適応はコールドスタート体制において根本的なパラドックスに直面している。
ターゲットデータが少ない場合、統計手法は関連するソースドメインと無関係なドメインを区別することができない。
本稿では,専門家のセマンティック記述を選択モデルに変換する確率的フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:07:48 GMT)
FU-MPC: Frontier- and Uncertainty-Aware Model Predictive Control for Efficient and Accurate UAV Exploration with Motorized LiDAR [29.9] 我々は独立に回転するLiDARを備えたUAVプラットフォームを開発し、階層的な探索フレームワークを提案する。
Fu-MPCは、予測された飛行軌道に沿ってLiDAR回転を最適化する局所後退水平走査コントローラとして機能する。
複雑な環境下での実験では、ロバストなローカライゼーション性能を維持しつつ、探索効率を向上させることが示されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:54:29 GMT)
MemCompiler: Compile, Don't Inject -- State-Conditioned Memory for Embodied Agents [29.9] 本稿では,メモリ利用をステートコンディション・メモリ・コンパイルとして再構成するMemCompilerを提案する。
Across Alf World、EmbodiedBench、ScienceWorldでは、MemCompilerは無メモリよりも一貫して改善されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:47:01 GMT)
DermAgent: A Self-Reflective Agentic System for Dermatological Image Analysis with Multi-Tool Reasoning and Traceable Decision-Making [29.8] DermAgentはPlan-Execute-Reflectフレームワーク内で7つの特別なビジョンと言語モジュールを編成する。
相補的な視覚認識ツールを使用して、包括的な形態的記述、皮膚内視鏡的概念アノテーション、病気の診断を行う。
最先端のMLLMと医療エージェントのベースラインは、ゼロショットのきめ細かい疾患診断、概念アノテーション、臨床キャプションタスクで一貫して優れています。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:41:11 GMT)
Beyond Instance-Level Self-Supervision in 3D Multi-Modal Medical Imaging [29.6] 医用画像における自己監督型事前訓練法は、通常、個人を孤立した例として扱う。
本稿では、このクロスインスタンス・トポロジ的一貫性を監視信号として活用することを提案する。
我々は,7つの下流マルチモーダルタスクに対するアプローチを検証し,セグメンテーションおよび分類タスクにおける平均1.1%と5.94%の改善を実現した。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:10:34 GMT)
Query-Conditioned Test-Time Self-Training for Large Language Models [29.5] 本稿では,入力クエリから直接のインスペクションを用いて,モデルパラメータを推論中に適応するフレームワークを提案する。
QueSTは、強いテスト時間最適化ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:40:02 GMT)
InfoSFT: Learn More and Forget Less with Information-Aware Token Weighting [29.5] Supervised Fine-tuning (SFT)は、オフラインの専門家によるデモンストレーションからLLMに新しい振る舞いを教えるための標準的なアプローチを提供する。
標準SFTは、ベースモデルの下で低い可能性のサンプルを含む全てのサンプルに均一に適合する。
本稿では,SFT 目的のための原則重み付け方式であるInfoSFTを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:32:37 GMT)
DocScope: Benchmarking Verifiable Reasoning for Trustworthy Long-Document Understanding [29.3] 本稿では,長期文書QAを構造化推論軌道予測問題として定式化するベンチマークであるDocScopeを紹介する。
軌道の各レベルを独立に監査する4段階評価プロトコルを設計する。
6つのプロプライエタリなモデル、12のオープンウェイトモデル、いくつかのドメイン固有のシステムをベンチマークします。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:57:18 GMT)
Workspace-Bench 1.0: Benchmarking AI Agents on Workspace Tasks with Large-Scale File Dependencies [29.1] 大規模なファイル依存を伴うワークスペース学習におけるAIエージェントの評価のためのベンチマークであるWorkspace-Benchを紹介する。
5つのワーカープロファイル、74のファイルタイプ、20,476のファイル(最大20GB)を持つ現実的なワークスペースを構築し、それぞれが7,399の合計ルーリックに対して評価された独自のファイル依存グラフを持つ388のタスクをキュレートする。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:14:02 GMT)
Agentic Recommender System with Hierarchical Belief-State Memory [29.1] 本稿では,レコメンデーションを部分的に観察可能な問題として扱い,構造化された信念状態を維持する枠組みを提案する。
イベント記憶は生の信号をバッファリングし、選好記憶は明示的な強さとエビデンス追跡を備えたきめ細かい変更可能なチャンクを維持し、プロファイル記憶は全ての選好を一貫性のある自然の物語に蒸留する。
4つのインストラクタベンチマークドメインの実験によると、Recoursは最先端のパフォーマンスを達成し、HR@1では平均26.4%、NDCG@10では10.3%向上している。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:38:24 GMT)
Beyond Binary: Reframing GUI Critique as Continuous Semantic Alignment [28.8] テスト時間スケーリング(TTS)は、ジェネラリストGUIエージェントにとって有望なパラダイムとして登場した。
既存のGUI批評家モデルはバイナリ分類を統一的に採用している。
本稿では,機能等価仮説に基づくパラダイムシフトであるBBCriticを紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:23:44 GMT)
Solvita: Enhancing Large Language Models for Competitive Programming via Agentic Evolution [28.5] Solvitaはエージェント進化フレームワークで、基礎となるLLMの重み付けを必要とせずに継続的学習を可能にする。
問題解決を戦略選択、プログラム合成、認定監督、ターゲットハッキングのクローズドループシステムに再編成する。
CodeContests、APPS、AetherCode、Live Codeforcesラウンドで評価される。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:15:09 GMT)
Hierarchical Transformer Preconditioning for Interactive Physics Simulation [28.1] 階層型トランスフォーマープレコンディショナー(Hierarchical Transformer Preconditioner)は、弱い許容率のH行列分割に固定されたニューラルプレコンディショナーである。
ネットワークは低ランクの遠距離因子を通して逆をモデル化する。
高速道路の接続を利用して、奥行きを隔ててコンテキストを伝播する。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:47:09 GMT)
Tadpole: Autoencoders as Foundation Models for 3D PDEs with Online Learning [28.1] タドポールは3次元偏微分方程式の基礎モデルである。
合成3次元PDEデータのオートエンコーダとして事前訓練される。
タドポールはヘテロジニアス物理系にまたがる豊かで伝達可能な表現を学ぶ。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:00:58 GMT)
Concurrency without Model Changes: Future-based Asynchronous Function Calling for LLMs [27.9] AsyncFCは、LLMデコードと関数実行を分離する純粋な実行層フレームワークである。
AsyncFCはタスクの正確性を維持しながら、エンドツーエンドのタスク完了時間を著しく短縮する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:02:28 GMT)
Remember Your Trace: Memory-Guided Long-Horizon Agentic Framework for Consistent and Hierarchical Repository-Level Code Documentation [27.4] 我々は、リポジトリ全体にまたがる単一の統合コンテキスト内でドキュメントを生成するフレームワークであるMemDocAgentを提案する。
MemDocAgentは、オープンソースベースラインとクローズドソースベースラインの両方で最高のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:35:20 GMT)
SeesawNet: Towards Non-stationary Time Series Forecasting with Balanced Modeling of Common and Specific Dependencies [27.3] SeesawNetは、時間次元とチャネル次元の両方で、共通およびインスタンス固有の依存性モデリングのバランスをとる統一アーキテクチャである。
コアとなるAdaptive Stationary-Nonstationary Attention (ASNA)は、正規化されたシーケンスからの共通依存関係と、生のシーケンスからの特定の依存関係をキャプチャする。
ASNAを基盤として構築されたSeesawNetは、時間的およびチャネル関係のモデリングを交互に行い、長距離およびクロス変数の依存関係を共同でキャプチャする。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:29:52 GMT)
Quantum Meets Statistical-Physical Secrecy: A Novel Hybrid Key Distribution Architecture [26.8] ハイブリッド鍵分布アーキテクチャは量子鍵分布(QKD)とKirchhoff-law-Johnson-noise(KLJN)の統計物理鍵交換を併用する。
光BB84型QKDリンクは、並列有線KLJNリンクと協調して動作する。
計算結果から,提案したハイブリッドアーキテクチャにより,短期的インフラにおける鍵生成効率とスループットが向上することが示唆された。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:09:06 GMT)
Real2Sim in HOI: Toward Physically Plausible HOI Reconstruction from Monocular Videos [26.8] HOI再建は、人間と物体の追跡に止まるのではなく、動きをコヒーレントな相互作用にする関係を回復すべきである。
我々は,4D HOIアニメーションを室内モノクロビデオから再構成するためのフレームワークである$textbfHA-HOI$を紹介した。
我々の研究は、一般的なモノクラーHOIビデオを、ヒューマノイドオブジェクトの動作のためのスケーラブルなデモに変換するための一歩を踏み出した。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:56:57 GMT)
DrugSAGE:Self-evolving Agent Experience for Efficient State-of-the-Art Drug Discovery [26.6] LLMをベースとしたエージェントは、広範囲な試行錯誤によってSOTAソリューションを見つけることができるが、その過程で蓄積された経験は残っていない。
我々は,SOTA薬物発見モデルを効率的に構築するために,タスク間で経験を蓄積し再利用する手法を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 22:49:42 GMT)
Sycophancy is an Educational Safety Risk: Why LLM Tutors Need Sycophancy Benchmarks [26.6] コンテキストスウィッチフレーム攻撃に抵抗するモデルでは,社会的情緒的な圧力下でも降伏する可能性がある。
EduFrameTrapは数学、物理学、経済学、化学、生物学、計算機科学にまたがる学習ベンチマークである。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:21:24 GMT)
ShadowMerge: A Novel Poisoning Attack on Graph-Based Agent Memory via Relation-Channel Conflicts [26.6] 本稿では,グラフベースのエージェントメモリに対する中毒攻撃であるSHADOWMERGEを紹介する。
その重要な洞察は、有毒な関係は、良心的な証拠と同じクエリ活性化アンカーと正準化された関係チャネルを共有することができるということである。
Mem0と3つの公開実世界のデータセット上でSHADOWMERGEを評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:51:56 GMT)
Inducing Overthink: Hierarchical Genetic Algorithm-based DoS Attack on Black-Box Large Language Reasoning Models [26.5] 大規模推論モデル(LRM)は、信頼性の高いマルチステップ推論を必要とするシステムにますます統合されている。
LRMは「過大な考え」を示す傾向があり、過度に長く冗長な推論の痕跡を生み出している。
入力問題の論理構造を体系的に摂動させることにより, LRMにおける過大な思考を誘発する自動ブラックボックスフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:07:38 GMT)
MetaAgent-X : Breaking the Ceiling of Automatic Multi-Agent Systems via End-to-End Reinforcement Learning [26.4] 自動MAS設計と実行を協調的に最適化する,エンドツーエンドの強化学習フレームワークであるMetaAgent-Xを紹介する。
MetaAgent-Xは既存のMASベースラインを一貫して上回り、最大21.7%のアップを達成した。
これらの結果は、自己設計および自己実行エージェントモデルを構築するための実践パラダイムとして、エンドツーエンドのトレーニング可能な自動MASを確立する。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:11:27 GMT)
The Velocity Deficit: Initial Energy Injection for Flow Matching [26.0] 我々は,MSEの目的が速度の程度を体系的に過小評価し,生成したサンプルがデータ多様体に到達できないことを示す。
トレーニングベースMagnitude-Aware Flow Matching(MAFM)とSSC(Scale Schedule Corrector)の2つの相補的手法を用いて初期エネルギー注入を提案する。
本手法はテキスト・ツー・イメージタスクと高分解能生成に一般化し,MS-COCO上のFIDを22%向上させる。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:30:07 GMT)
Editor's Choice: Evaluating Abstract Intent in Image Editing through Atomic Entity Analysis [25.8] 我々は抽象画像編集の定義と分類を定式化する。
抽象的な編集を個々のエンティティレベルのアセスメントに分解するフレームワークであるEntity-Rubricsを紹介します。
抽象画像編集に特化した最初のベンチマークであるAbstractEditをコントリビュートする。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:46:24 GMT)
Large Dimensional Kernel Ridge Regression: Extending to Product Kernels [25.7] 最近の研究では、大次元カーネルリッジ回帰(KRR)において、$textitsaturation effect$および$textitmultiple descend behavior$を報告している。
これらの発見は主に、球面上の内積核や超収縮性のような強い固有関数仮定のような制限的な条件の下で導かれる。
本稿では,大次元カーネルの広い新しいファミリーを確立し,一般化誤差の収束率を導出する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:08:09 GMT)
GroupMemBench: Benchmarking LLM Agent Memory in Multi-Party Conversations [25.7] 大規模言語モデル(LLM)エージェントは、ますますパーソナルアシスタントや職場の協力者として機能している。
既存のメモリシステムとベンチマークは、Dyadicのシングルユーザ設定を中心に構築されている。
グループメモリの3つの特性を公開するベンチマークであるGroupMemBenchを紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:38:29 GMT)
UMo: Unified Sparse Motion Modeling for Real-Time Co-Speech Avatars [25.6] UMoは、リアルタイム音声アバターのための統一されたスパースモーションモデリングアーキテクチャである。
リアルタイムの高密度再構成を効率よく行い、時間的コヒーレントかつ高忠実なアニメーション生成を可能にする。
厳密なレイテンシ制約の下でも、きめ細かな音声-動きのアライメントを保ちます。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:56:03 GMT)
Reasoning Models Don't Just Think Longer, They Move Differently [25.1] 競合プログラミング,数学,ブール適合性におけるチェーン・オブ・ソート生成における隠れ状態軌道による区別について検討する。
最も明確な推論固有の分離は、より難しい問題によってより直接修正された軌道を示すコードドメインに現れます。
これらの結果から, 時間的軌道解析の前提条件として長さ補正が確立され, 推理訓練が精度の高い軌道形状に関連付けられることが示唆された。
論文参考訳(メタデータ) (Thu, 14 May 2026 22:37:33 GMT)
Matrix-Space Reinforcement Learning for Reusing Local Transition Geometry [25.0] 行列空間強化学習(英: Matrix-Space Reinforcement Learning、MSRL)は、正の半定値行列記述子による軌跡セグメントを表す幾何学的抽象化である。
MSRLは0.73で、MSRLをゼロ(0.65)、TD-MPC-PT+FT(0.63)、TD-MPC(0.57)で上回っている。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:12:29 GMT)
Composable Crystals: Controllable Materials Discovery via Concept Learning [25.0] 結晶生成のための概念ベース構成フレームワークを提案する。
我々はベクトル量子化された変分オートエンコーダを訓練し、再利用可能な結晶概念の共有集合を自動的に発見する。
このような概念を再結合することにより、トレーニング分布を超えた新しい結晶の制御可能な探索を可能にする。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:36:23 GMT)
Toward Privileged Foundation Models:LUPI for Accelerated and Improved Learning [24.9] PIQL,Privileged Information for Quick and Quality Learningを導入し,学習を加速し,基礎モデルの一般化を改善する。
実証的な証拠は、PIQLによってTFMがより早く収束し、最終的な損失を減らし、より一般化できることを示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:33:14 GMT)
Privacy Auditing with Zero (0) Training Run [24.9] 2つの固定データセットを使用してモデルを監査するためのポストホックフレームワークであるZero-Runのプライバシ監査を紹介する。
最初のアプローチは、適応的な構成として分布シフトとアルゴリズムリークの併用効果をモデル化する。
第2のアプローチでは、観測されたデータに基づいて、ポイントワイドなメンバシップ推定を調整し、よりシャープなインスタンス依存境界を得る。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:00:56 GMT)
IFPV: An Integrated Multi-Agent Framework for Generative Operational Planning and High-Fidelity Plan Verification [24.8] 高信頼度計画立案(IFPV)のための統合マルチエージェントフレームワーク
MPHAは、コマンドインテントを実行可能なマルチプラットフォーム戦術アクションシーケンスに分解する。
ACSEは、カスタマイズされた世界モデルを備えた相手を導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:58:36 GMT)
NeuroAtlas: Benchmarking Foundation Models for Clinical EEG and Brain-Computer Interfaces [24.7] ファンデーションモデルは、下流タスクにまたがる一般化された表現を抽出することを約束する。
EEG固有のFMは、時系列FMを一貫して上回るものではない。
現在のモデルは、まだ最初から統合されたEEGモデルの約束を達成していない。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:13:41 GMT)
TwinRouterBench: Fast Static and Live Dynamic Evaluation for Realistic Agentic LLM Routing [24.6] 2トラックのステップレベルのルーティングベンチマークであるTwinBenchを紹介した。
静的トラックは、SWE-bench、BFCL、mtRAG、QMSum、PinchBenchの520インスタンスから970のルータ可視プレフィックスを提供する。
ダイナミックトラックは、500ケースのSWE-bench Verifiedスイートでルーターを走らせるハーネスを提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:58:59 GMT)
Silent Collapse in Recursive Learning Systems [24.6] トラジェクトリ統計をモニタし、遅い時間スケールの信頼変数を推定する軽量なメタ認知ループを提案する。
MTRは早期警告を提供し、実際のデータにアクセスすることなくサイレント崩壊を積極的に防止する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:59:26 GMT)
ForcingDAS: Unified and Robust Data Assimilation via Diffusion Forcing [24.4] 我々は、統一的で堅牢なデータ同化フレームワークForcingDASを紹介する。
ForcingDASはフレーム間遷移の代わりに、ジョイント軌道を学習する。
我々は,2次元ナビエ-ストークス渦性,降水流,大域大気状態推定におけるForcingDASの評価を行った。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:34:33 GMT)
The Rate-Distortion-Polysemanticity Tradeoff in SAEs [24.4] 本稿では,SAEにおけるレート・ディストーション・ポリセマンティリティのトレードオフについて紹介する。
SAEを単意味に制限することは、必ずしも速度と歪みが増大することを示している。
我々は,ポリセマンティリティ尺度が満たすべき必要条件を導出することにより,実世界の設定まで分析を拡張した。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:10:52 GMT)
Diagonal Adaptive Non-local Observables on Quantum Neural Networks [24.4] 対角 ANO は大きなパラメータ空間の完全 ANO と同値である。
これは、$k$-local observable complexityを$O(4k)$から$O(2k)$に減らし、対応する測定側古典計算を下げる。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:50:42 GMT)
Coordinated Diffusion: Generating Multi-Agent Behavior Without Multi-Agent Demonstrations [24.2] Coordinated Diffusionは、ユーザ定義のマルチエージェントコスト関数を通じて独立に訓練された単一エージェント拡散ポリシーを結合するフレームワークである。
この誘導項は勾配のない方法で推定でき、CoDiをブラックボックスで微分不可能なコスト関数に適用できることを示す。
両腕操作タスクのシミュレーションおよびハードウェア実験の結果,CoDiは単一エージェントデータからロバストな協調動作を検出することがわかった。
論文参考訳(メタデータ) (Thu, 14 May 2026 22:04:54 GMT)
LPDS: Evaluating LLM Robustness Through Logic-Preserving Difficulty Scaling [24.2] 本稿では,問題変動の難易度を定量化するために,論理状態難易度(LPDS)を導入する。
困難が増すにつれて、モデルの推論における性能低下とエラーがより顕著になることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:26:59 GMT)
Moltbook Moderation: Uncovering Hidden Intent Through Multi-Turn Dialogue [24.1] BOT-MODは、従来のコンテンツレベルの信号ではなく、エージェント意図による検出を基盤とするフレームワークである。
この研究は、オープンなマルチエージェント環境におけるエージェントのスケーラブルで意図を意識したモデレーションの基礎を前進させる。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:53:30 GMT)
MahaVar: OOD Detection via Class-wise Mahalanobis Distance Variance under Neural Collapse [24.1] 我々は,MahaVarを提案する。MahaVarは,マハラノビス距離をクラスワイド距離分散項で増大させる,シンプルで効果的なポストホックOOD検出器である。
MahaVarはCIFAR-100とImageNetで最先端のパフォーマンスを実現しており、既存のMahalanobisベースのメソッドよりもAUROCとFPR@95が一貫して改善されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:58:19 GMT)
Sample-Mean Anchored Thompson Sampling for Offline-to-Online Learning with Distribution Shift [24.0] オフラインからオンラインへの学習における中心的な課題は、オフラインデータとオンラインデータの分散シフトである。
本稿では, 腕指数をオンライン後部サンプル, ハイブリッド後部サンプル, オンライン平均の中央値として定義する, 新たな中央値に基づくアンカールールを提案する。
我々は,提案アルゴリズムがオフラインデータを安全に活用してオンライン学習を加速することを示す理論的保証を確立する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:25:47 GMT)
Graphs of Research: Citation Evolution Graphs as Supervision for Research Idea Generation [24.0] グラフ・オブ・リサーチ (Graphs of Research, GoR) は、各シード紙の2ホップ基準近傍を抽出する教師付き微調整法である。
GoRは参照を論文進化指向非巡回グラフ(DAG)に整理する
5つの主要ML/NLP会場からデータを引き出す自動抽出パイプラインを構築した。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:57:56 GMT)
Scaling Laws from Sequential Feature Recovery: A Solvable Hierarchical Model [23.8] 電力法則として重量が減少する潜在構成特徴の組み合わせで表されるグローバルな高次関数について検討した。
この構造に適応した層ワイドスペクトルアルゴリズムは、浅い非適応的な手法と比較してスケーリングの改善を実現する。
特徴量回復しきい値の鮮明さを証明し、これらの遷移を集約すると、予測誤差の明らかなパワーロッド崩壊が生じることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:37:28 GMT)
Context Training with Active Information Seeking [23.7] 私たちは、アクティブな情報検索のために、Wikipediaの検索とブラウザツールを使ってコンテキストを調整します。
提案手法は,複数の候補コンテキストの維持と具体化を行う検索ベーストレーニング手法と組み合わせることで,一貫した,実質的な成果が得られることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:47:52 GMT)
First Mathematical Runtime Analyses of Multi-Objective Evolutionary Algorithms for Multi-Valued Decision Variables [23.5] 二項決定空間上で定義された問題は、多目的進化アルゴリズムの理論において集中的に研究されている。
有限値 $r > 2$ の値を取る決定変数を扱うMOEAには、今のところ数学的ランタイム解析は存在しない。
多値決定変数を扱う場合、古典的MOEAは重大な問題に遭遇しないことが示される。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:42:52 GMT)
Generating HDR Video from SDR Video [23.4] 本稿では,大規模な生成ビデオモデルを利用して,カジュアルなSDR映像からHDR映像を合成するためのフレームワークを提案する。
われわれのアプローチは、カジュアルなコンシューマー向けビデオや、象徴的な映画から、WildでのHDR変換を可能にする。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:21:10 GMT)
Towards In-Depth Root Cause Localization for Microservices with Multi-Agent Recursion-of-Thought [23.0] マイクロサービスシステムのための詳細な根本原因ローカライゼーションフレームワークであるRCLAgentを紹介します。
RCLAgentは、各スパンを専用エージェントに割り当てることで、トレースグラフに沿って診断プロセスを分解する。
ローカライズ精度と推論効率の両方において、最先端の手法を一貫して上回る。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:13:59 GMT)
Reducing the Safety Tax in LLM Safety Alignment with On-Policy Self-Distillation [23.0] 安全アライメントは、しばしば推論能力の犠牲で有害なクエリに対する堅牢性を改善する。
OPSAと呼ばれる安全アライメントのための自己蒸留法について検討した。
OPSAは、外部の自己蒸留や外部のティーチンガー蒸留よりも安全性の高いトレードオフを実現している。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:40:07 GMT)
Adapting AlphaEvolve to Optimize Fully Homomorphic Encryption on TPUs [22.8] 我々はAlphaEvolveを使ってハードウェア対応暗号-カーネル最適化の探索を自動化する。
Google Cloud TPUv5e上でTFHE(Jaxite)とCKKS(CROSS)のFHEスキームのプリミティブに対するAlphaEvolve最適化を評価する。
自動探索から24時間以内に、AlphaEvolveはTFHEブートストラップのレイテンシを2.5倍に、CKKSローテーションと乗算のレイテンシを1.31倍に改善する実装レベルの最適化を発見した。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:39:04 GMT)
MicroscopyMatching: Towards a Ready-to-use Framework for Microscopy Image Analysis in Diverse Conditions [22.4] 本報告では,最初の顕微鏡画像解析フレームワークであるMicroscopyMatchingについて述べる。
様々な顕微鏡分析設定で重要な解析タスクを確実に実行することができる。
MicroscopyMatchingは、基本的に異なる観点から、多様な顕微鏡画像解析タスクを統一マッチング問題として再構成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:44:26 GMT)
Harnessing Unimodality in Semiparametric Contextual Pricing via Oracle Price Map Learning [22.3] 半パラメトリックスカラー・インデックス評価モデルにおいて、潜在値が $v_t_ast(mathsf c_t)+_t$ である場合の文脈力学について検討する。
主要な決定対象は、スカラーインデックス$u=_ast(mathsf c)$とノイズテールによって誘導されるオラクル価格マップ$umapsto past(u)$である。
我々は、スカラーインデックスを入力とし、ベンチマークをローカライズするモジュラー粗大なポリシーである$mathsfORBIT$を通じてそのような構造を利用する。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:53:23 GMT)
Analogical Trajectory Transfer [22.2] そこでは,1つの3次元環境における運動軌跡を意味的に類似した場所へ変換することを目的とする。
このようなキャパシティは、AR/VRコプレゼンス、コンテンツ生成、ロボット工学などの応用で、機械が類似した空間推論を行うことを可能にする。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:14:59 GMT)
Defenses at Odds: Measuring and Explaining Defense Conflicts in Large Language Models [21.9] 本研究は, シーケンシャル展開下でのクロス・ディフェンス・インタラクションに関する最初の体系的研究である。
38.9%は、もともと防御された次元で測定可能なリスクの悪化を示す。
本稿では、シーケンシャルデプロイメント中に高複雑性層を選択的に凍結する軽量な緩和法を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:58:47 GMT)
DSSP: Diffusion State Space Policy with Full-History Encoding [21.8] 本稿では,ロボット操作のための歴史条件付き拡散状態空間ポリシーDSSPを紹介する。
我々の履歴エンコーダは、観測ストリーム全体をコンパクトな文脈表現に効果的に圧縮する。
実験の結果,DSSPはモデルサイズが大幅に小さく,最先端の性能を実現することがわかった。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:06:01 GMT)
EARL: Towards a Unified Analysis-Guided Reinforcement Learning Framework for Egocentric Interaction Reasoning and Pixel Grounding [21.7] 本稿では,Egocentric Analysis-guided Reinforcement LearningフレームワークであるEARLを紹介する。
具体的には、EARLは粗い解釈ときめ細かい応答を含む2段階の構文解析フレームワークを採用する。
Ego-IRGBenchの実験では、EARLは65.48%のcIoUをピクセルグラウンドで達成し、以前のRLベースの手法よりも8.37%向上した。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:10:27 GMT)
IntentVLA: Short-Horizon Intent Modeling for Aliased Robot Manipulation [21.7] IntentVLAは歴史条件付きVLAフレームワークで、最近の視覚的観察をコンパクトな短水平意図表現にエンコードする。
また,RoboTwin2上での12タスクのあいまいさを意識したベンチマークであるAliasBenchを紹介した。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:31:02 GMT)
EMO: Frustratingly Easy Progressive Training of Extendable MoE [21.7] 現在のMoEトレーニングは、初期データがそのような能力を完全に活用していないとしても、当初から多くの専門家を割り当てている、と我々は主張する。
これは、MOE容量を拡張可能なメモリとして扱い、トレーニングの過程でエキスパートプールを成長させる単純なプログレッシブトレーニングフレームワークである。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:03:27 GMT)
ToolMol: Evolutionary Agentic Framework for Multi-objective Drug Discovery [21.5] $textttToolMol$は、de novoドラッグデザインのための進化的エージェントフレームワークである。
$textttToolMol$は、ゴールド標準の絶対結合自由エネルギースコアで最先端の結果を達成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:07:36 GMT)
Average Gradient Outer Product in kernel regression provably recovers the central subspace for multi-index models [21.5] 学習した予測者がデータ中の有用な低次元を発見できる状況について検討するが、正確な予測に必要なサンプルは少ない。
具体的には、有限個のデータペアから$Uinmathbb times d$と$rll d$を持つマルチインデックス構造である$f*(x)=h(Ux)$を復元する問題を考察する。
低次$p$が全ての関連方向の予測を行う場合、サブスペースリカバリはより低いサンプルレジーム$nasymp dp+で発生することを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:05:30 GMT)
PROVE: A Perceptual RemOVal cohErence Benchmark for Visual Media [21.4] 除去コヒーレンス(Delete Coherence, RC)は、画像やビデオにおける物体の除去を評価するための、知覚に整合したメトリクスのペアである。
PROVE-Benchは、モーション強化と組み合わせた80ビデオデータセットであるPROVE-Mと、根拠のない100ビデオの挑戦的なサブセットであるPROVE-Hからなる、2層の実世界のベンチマークである。
RCは、既存の評価プロトコルよりも、人間の判断と大きく一致している。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:16:51 GMT)
Head Forcing: Long Autoregressive Video Generation via Head Heterogeneity [21.3] 自己回帰ビデオ拡散モデルはリアルタイム合成をサポートするが、長い地平線上でのエラー蓄積とコンテキスト損失に悩まされる。
我々は、各ヘッドタイプにKVキャッシュ戦略を割り当てる訓練不要のフレームワークであるHead Forcingを提案する。
追加のトレーニングなしでは、Head Forcingは生成を5秒から分単位で延長し、マルチプロンプトのインタラクティブな合成をサポートし、既存のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:27:39 GMT)
TurboVGGT: Fast Visual Geometry Reconstruction with Adaptive Alternating Attention [21.3] TurboVGGTは、高速なマルチビュー3D再構成のために適応的注目を交互に行う効率的な視覚幾何学変換器を採用している。
適応的疎大なグローバルな注目の中で、TurboVGGTはグローバル幾何モデリングのための様々な空間レベルを持つ代表トークンを適応的に学習する。
複数の3次元再構成ベンチマーク実験により,TurboVGGTは高速な多視点再構成を実現し,競争力のある再構成品質を維持した。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:24:09 GMT)
Teaching Large Language Models When Not to Know: Learning Temporal Critique for Ex-Ante Reasoning [21.3] 大規模言語モデル (LLM) はしばしば時間的カットオフの下では推論に失敗する。
カットオフ対応の時間的検証を得るためにモデルを訓練するフレームワークであるTCFTを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:49:35 GMT)
To See is Not to Learn: Protecting Multimodal Data from Unauthorized Fine-Tuning of Large Vision-Language Model [21.2] 我々はMMGuardを提案し、データ所有者が不正な微調整に対して積極的にマルチモーダルデータを保護できるようにする。
MMGuardはLVLMの学習力学を積極的に活用する人間の知覚できない摂動を注入することで、学習不可能な例を生成する。
その結果、ホワイトボックス、グレーボックス、ブラックボックスの脅威モデルの下で、効果的で、ステルス的で、堅牢な保護効果が示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:49:27 GMT)
Delta Forcing: Trust Region Steering for Interactive Autoregressive Video Generation [21.2] 既存のアプローチでは、双方向モデルを自動回帰生成器に蒸留し、ストリーミング長調律によりさらに適応する。
原因を条件バイアスとみなし,教師は条件に整合するが軌道に依存しない指導を行うことができる。
本稿では,適応信頼領域内の教師の信頼できない監督を制約するフレームワークであるDelta Forcingを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:06:57 GMT)
Streaming Speech-to-Text Translation with a SpeechLLM [21.2] SpeechLLMは、音声におけるパラ言語情報を利用して、カスケードエラーを減らすことを約束する。
既存のSpeechLLMシステムは、翻訳を出力する前に音声の完全な発声を待つため、遅い。
本研究は,リアルタイム音声テキスト翻訳のためのLLMアーキテクチャを提案する。
異なる言語対の実験において、システムは非ストリーミングベースラインに近い翻訳品質を達成するが、レイテンシはわずか1-2秒である。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:32:57 GMT)
LiWi: Layering in the Wild [21.0] 地中画像の層化はいまだ未解決の問題である。
本稿では,高忠実度自然画像分解のための新しいフレームワークを提案する。
我々のフレームワークは、自然画像分解における最先端(SoTA)性能を実現する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:30:34 GMT)
KVPO: ODE-Native GRPO for Autoregressive Video Alignment via KV Semantic Exploration [20.9] 我々は、ストリーミングビデオジェネレータを人間の好みに合わせるためのODEネイティブフレームワークであるKVPOを提案する。
多様性探索のために、KVPOはノイズから歴史的KVキャッシュへの変化源を移動させる因果的探索パラダイムを導入した。
政策モデリングにおいて,KVPOは軌道速度エネルギーに基づく速度場代理ポリシーを導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:24:46 GMT)
Road Maps as Free Geometric Priors: Weather-Invariant Drone Geo-Localization with GeoFuse [20.5] ドローンビューのジオローカライゼーションは、しばしば悪天候下で撮影されたクエリードローン画像と、ジオタグ付き衛星画像のギャラリーとをマッチングすることを目的としている。
気象によって引き起こされるドローンの視界の劣化は、本質的なクロスビュー領域のギャップを著しく悪化させる。
衛星画像と正確に整列した道路地図タイルを統合したクロスモーダル融合フレームワークであるGeoFuseを紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:01:22 GMT)
TokenRatio: Principled Token-Level Preference Optimization via Ratio Matching [20.4] 標準的なシーケンスレベルのペアワイズ比較のみを用いてトークンレベルの最適性を回復する方法を示す。
本稿では,軽量な状態ベースラインを明示的に学習するTBPO-Qと,高次正規化によりベースラインを除去するTBPO-Aの2点を紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:18:10 GMT)
MR2-ByteTrack: CNN and Transformer-based Video Object Detection for AI-augmented Embedded Vision Sensor Nodes [20.3] MCUベースの組み込み視覚ノードに適したビデオオブジェクト検出(VOD)手法であるMulti-Resolution Rescored ByteTrack(MR2-ByteTrack)を導入する。
MR2-ByteTrackは、フル解像度と低解像度の推論を交互に行うことで計算コストを削減する。
本手法では,全解像度画像のみを処理した場合と比較して最大55%の省エネ効果が得られた。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:13:56 GMT)
$φ$-Balancing for Mixture-of-Experts Training [20.1] Mixture-of-Experts (MoE)モデルは、そのスケーラビリティを完全に実現するために、バランスのとれた専門家の利用に依存します。
我々は,厳密な凸性,対称性,および予測されるルーティング分布の微分ポテンシャルを最小化することにより,集団レベルの専門家バランスを直接ターゲットとする原則的フレームワークである$-balancingを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:39:28 GMT)
Beyond GRPO and On-Policy Distillation: An Empirical Sparse-to-Dense Reward Principle for Language-Model Post-Training [20.0] ラベル付き検証可能なトレーニングデータが不足している場合には、各チェック済みサンプルを、最も価値の高い場所で使用する必要がある。
スパース・シークエンス・レベルの報酬は、より良い振る舞いを探索し発見できる強力なモデルにとって最も有用である。
これは単純なアロケーションルールを示唆している: 最強の教師を改善するためにラベル付きデータを上流で使用し、より密集した監督を通じて改善された振る舞いを下流に転送する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:02:43 GMT)
Meschers: Geometry Processing of Impossible Objects [20.0] これまでの作業では、不可能な物体を3Dに埋め込んだり、切断したり、深度軸でねじったり曲げたりする。
我々は、M.C.エッシャーの木版に見られるような、不可能な構造を表現できるメッシュであるMeschersを紹介した。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:28:14 GMT)
M$^2$E-UAV: A Benchmark and Analysis for Onboard Motion-on-Motion Event-Based Tiny UAV Detection [20.0] M$2$E-UAVは、小型UAV検出のためのUAVビューモーションオンモーションイベントベースのデータセットとベンチマークである。
オンボードセンシングプラットフォームから収集した同期イベントストリームとIMU測定を提供する。
ベンチマークには4つのシーンファミリーにわたる87,223のトレーニングサンプルと21,395の検証サンプルが含まれている。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:30:58 GMT)
Margin-Adaptive Confidence Ranking for Reliable LLM Judgement [19.9] Jung et al. (2025)は、大きな言語モデルと人間の判断の一致を保証する仮説テストフレームワークを導入した。
我々は、信頼信号に頼るのではなく、専用の信頼度推定器を学ぶ。
固定シーケンステストに統合されると、学習された信頼度推定器はランキング精度を改善し、信頼度と不一致リスクの間の単調な関係を実証的に強化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:01:05 GMT)
Warp-as-History: Generalizable Camera-Controlled Video Generation from One Training Video [19.7] 本稿では,カメラによるワープをカメラワープした擬似歴史に変換するシンプルなインタフェースを提案する。
我々は,その位置エンコーディングと対象フレームの識別とを整合させ,正確な情報源観測を行なわずに歪んだ歴史トークンを除去する。
本手法は,テスト時間最適化やターゲット映像適応を伴わずに,カメラの付着性,視覚的品質,動きのダイナミクスを改善する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:58:26 GMT)
Hypergraph Enterprise Agentic Reasoner over Heterogeneous Business Systems [19.6] 我々は,階層化されたハイパーグラフオントロジー上に構築された企業エージェント推論手法であるHEARを紹介する。
ベースとなるGraph Layerは認識されたデータインターフェースを仮想化し、Hyperedge Layerはナリービジネスルールと手続きプロトコルをエンコードする。
HEARは最大94.7%の精度をサプライチェーンタスクで達成している。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:57:59 GMT)
SciPaths: Forecasting Pathways to Scientific Discovery [19.5] SciPathsは262のエキスパートによる注釈付きゴールドパスと2,444のシルバーパスのベンチマークで、機械学習と自然言語処理の論文から構築した。
厳密なセマンティックマッチングの下では,最良のモデルが0.189 F1にしか達しないことがわかった。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:10:28 GMT)
ROAD: Adaptive Data Mixing for Offline-to-Online Reinforcement Learning via Bi-Level Optimization [19.5] 適応データ混合(ROAD)を最適化した強化学習を提案する。
ROADはデータ再生プロセスを自動化する動的プラグイン・アンド・プレイフレームワークである。
我々の経験的結果は、このアプローチが様々なデータセットで既存のデータ再生方法より一貫して優れていることを示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:35:58 GMT)
Image Restoration via Diffusion Models with Dynamic Resolution [19.4] 本研究は, 動的分解能DMを用いて低次元部分空間にデータを投影し, 推論過程を高速化することを提案する。
DPSとDAPSは一般的な画像復元作業に広く使われている2つの画素空間法である。
提案手法では,SubDAPSの予測速度と再現精度を考慮し,改良されたSubDAPS++を導入し,再構築効率と品質を向上する。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:11:47 GMT)
SceneFunRI: Reasoning the Invisible for Task-Driven Functional Object Localization [19.4] Invisibleの推論のためのベンチマークであるSceneFunRIを紹介する。
SceneFunRIはSceneFun3Dデータセットに基づいて、タスクを2次元空間推論問題として定式化する。
タスク命令やコモンセンス推論から見えない機能オブジェクトの位置を推測するモデルが必要である。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:21:41 GMT)
StyleTextGen: Style-Conditioned Multilingual Scene Text Generation [19.2] StyleTextGenは、異なる言語や記述システムで視覚的なテキストスタイルを知覚し、複製することを学ぶ新しいフレームワークである。
まず、スタイルモデリング専用のデュアルブランチスタイルエンコーダを導入します。
第二に、スタイルコヒーレンスを高めるテキストスタイルの一貫性損失を設計する。
第3に、生成されたテキストと参照テキストの正確なスタイルアライメントを保証するマスク誘導型推論戦略を開発する。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:24:44 GMT)
ML-Embed: Inclusive and Efficient Embeddings for a Multilingual World [19.1] ML-Embedは、新しいフレームワーク上に構築された包括的で効率的なモデルのスイートである。
言語的な課題に対処するため、我々は多言語データセットをキュレートし、140Mから8Bパラメータまでのモデルのセットをトレーニングする。
透明性への直接的なコミットメントとして、すべてのモデル、データ、コードをリリースします。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:05:26 GMT)
Attractor Geometry of Transformer Memory: From Conflict Arbitration to Confident Hallucination [19.1] 言語モデルは、事実を重み付け(パラメトリックメモリ、PM)と文脈情報(ワークメモリ、WM)の2つの知識源に基づいて描画する。
本研究は,PMとWMの相違点と干渉点,および幻覚点の相違点について,機械的に異なる2つの障害モードについて検討した。
両障害が統一的な幾何学的説明を共有することを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:32:25 GMT)
Analog RF Computing: A New Paradigm for Energy-Efficient Edge AI Over MU-MIMO Systems [19.1] アナログ無線周波数(RF)計算では、基地局はニューラルネットワークの重みを符号化し、波形を放送する。
MU-MIMO無線システムにおけるアナログRF計算のための物理層設計を提案する。
アナログRFコンピューティングは,デジタルコンピューティングと比較してクライアント側のエネルギー消費を約2桁削減できることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:50:27 GMT)
Deep Pre-Alignment for VLMs [18.9] ほとんどのビジョン言語モデル (VLM) は、ViTエンコーダの出力を直接軽量プロジェクタ経由でLLMにマッピングする。
本稿では,標準VTエンコーダを小さなVLMに置き換えた新しいアーキテクチャであるDeep Pre-Alignment (DPA)を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:14:15 GMT)
Capacitive Touchscreens at Risk: A Practical Side-Channel Attack on Smartphones via Electromagnetic Emanations [18.9] 本稿では,タッチスクリーン走査中におけるEMエマニュエーションを利用した非接触電磁(EM)サイドチャネル攻撃TESLAを提案する。
これらのエマニュエーションがタッチインタラクションの進化を符号化し、統一された漏洩基盤を形成することを実証する。
TESLAは、より広範な攻撃目標、より効率的なサンプル取得、実用的な攻撃シナリオでの運用を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:45:24 GMT)
BEAM: Binary Expert Activation Masking for Dynamic Routing in MoE [18.9] Mixture-of-Experts (MoE)アーキテクチャはトークンごとに専門家のサブセットだけを活性化する。
既存のアクセラレーション手法では、アーキテクチャの変更でコストがかかるか、あるいは高頻度で厳しいパフォーマンス低下に苦しむ必要がある。
訓練可能なバイナリマスクを用いてトークン適応型エキスパート選択を学習する新しい手法BEAMを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:33:41 GMT)
DRIFT: A Benchmark for Task-Free Continual Graph Learning with Continuous Distribution Shifts [18.8] 連続グラフ学習(CGL)は、破滅的な忘れを軽減しつつ、動的に進化するグラフから学習することを目的としている。
既存のアプローチでは、データストリームが事前に定義された境界を持つ独立したタスクのシーケンスに分割される、タスクベースの定式化が一般的である。
タスクフリーの観点から連続グラフ学習を再考し、現実的な非定常環境をよりよく反映する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:50:34 GMT)
Generalized Priority-Aware Shapley Value [18.7] GPASV(Generalized Priored-Aware Shapley value)を導入する。
GPASVは、任意の重み付けされた優先順位グラフ上で定義されたランダムな順序値であり、一対のエッジは順序違反を禁止するのではなく、ペナル化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:19:44 GMT)
Let Robots Feel Your Touch: Visuo-Tactile Cortical Alignment for Embodied Mirror Resonance [18.6] 他者の体の触覚を観察すると、観察者の触覚に反応する。
この視触覚共鳴は、視覚と体性感覚皮質の間の構造的対応に依存していると考えられている。
視覚と触覚の表現に意味的・分布的・幾何学的アライメントを課するMirror Touch Netを導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:40:24 GMT)
CuSearch: Curriculum Rollout Sampling via Search Depth for Agentic RAG [18.6] CuSearchは、Search-Depth Greedy Allocation上に構築されたカリキュラムのロールアウトサンプリングフレームワークである。
我々は、ZeroSearch上の標準GRPOよりも最大11.8の正確なマッチングポイントを達成することで、CuSearchが継続的にパフォーマンスを改善していることを示す。
これらの結果は、RLVRベースのエージェントRAGトレーニングにおける検索監督密度の信頼性、アノテーションなしプロキシとして、軌跡ごとの探索深度を確立した。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:20:26 GMT)
Quantitative Video World Model Evaluation for Geometric-Consistency [18.5] 生成ビデオモデルは暗黙の世界モデルとしてますます研究されている。
物理的に妥当な3D構造と動きを創出するかどうかを評価することは依然として困難である。
生成ビデオにおける幾何コヒーレンスを監査するフレームワークであるPDI-Benchを紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:04 GMT)
AnchorRoute: Human Motion Synthesis with Interval-Routed Sparse Contro [18.3] スパースアンカーモーション合成フレームワークであるAnchorRouteについて述べる。
アンカーは、世代と洗練の両方のために共有の足場として使用される。
ベンチマーク評価では、AnchorRouteはスパース制御の手法よりも優れている。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:36:18 GMT)
From Sparse to Dense: Spatio-Temporal Fusion for Multi-View 3D Human Pose Estimation with DenseWarper [18.3] マルチビューの人間のポーズ推定では、モデルは通常、特定の瞬間にポーズを予測するために、異なるカメラビューから同時にキャプチャされた画像に依存する。
そこで本研究では,新しい3次元ポーズ推定手法を提案する。
提案手法は,スパース・インターリーブ画像のみを入力として利用し,従来の多視点入力手法よりも優れ,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:08:29 GMT)
Performance-Driven Policy Optimization for Speculative Decoding with Adaptive Windowing [18.0] 投機的効率は、しばしば難解な位置によってボトルネックされる。
ほとんどの学習ベースのドラフトラは、まだトークンレベルの管理対象に最適化されている。
本稿では,トークンレベルの模倣からウィンドウレベルの最適化へ移行する拡張学習フレームワークPPOWを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:41:57 GMT)
SMCEvolve: Principled Scientific Discovery via Sequential Monte Carlo Evolution [17.9] SMCEvolveを導入し,プログラム探索を報奨型ターゲット分布からのサンプリングとして再放送する。
我々は、目標近似誤差に到達するのに必要なLCMコール予算を制限した有限サンプル複雑性解析を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:21:08 GMT)
From Table to Cell: Attention for Better Reasoning with TABALIGN [17.8] 計画と実行が明示的なセルグラウンド契約を共有しないため、構造化テーブル上の多段階LSM推論は失敗する。
契約を運用するテーブル推論フレームワークであるTABALIGNを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:00:26 GMT)
Efficient Multi-objective Prompt Optimization via Pure-exploration Bandits [17.8] 本研究では,2つの実践的条件下での多目的的プロンプト選択問題について検討する。
多目的バンディットから証明可能なアルゴリズムを適応する。
本稿では,構造バンドにおける腕の識別に最適な新しい設計を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:31:17 GMT)
Reinforcement Learning with Semantic Rewards Enables Low-Resource Language Expansion without Alignment Tax [17.6] グループ相対ポリシー(GRPO)を利用した意味空間アライメントパラダイムを提案する。
この目的はフレキシブルな実現を通じて意味を奨励し、事前訓練された知識による破壊的干渉を減らす制御された更新を可能にする。
実験により,本手法はアライメント税を著しく軽減しつつ,低リソース能力が得られることが示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:47:22 GMT)
Does Your Wildfire Prediction Model Actually Work, or Just Score Well? [17.5] 既存の地球基盤モデル(アースFM)は、山火事の予報よりも一般的な大気や地球物理学的な目的のために事前訓練されている。
本研究では,気象,活火観測,地形,植生,静環境データを用いた山火事予報のための基礎モデルWILDFIRE-FMを紹介する。
2つの制御されたチェックを持つ固定契約評価フレームワークを導入し、マッチングルール効果の固定出力チェックと、ヘッド選択効果の固定状態チェックを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:28:10 GMT)
MoRe: Modular Representations for Principled Continual Representation Learning on Squantial Data [17.5] 継続的な学習は、以前に取得した知識を保持しながら、新しいデータに適応するモデルを必要とする。
既存のアプローチでは、モデルパラメータやアーキテクチャを教師付きタスク固有の方法で変更することで、この問題に対処しています。
アーキテクチャレベルで割り当てるのではなく,表現自体のモジュラリティを識別するフレームワークであるMoReを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:46:54 GMT)
Factorization-Error-Free Discrete Diffusion Language Model via Speculative Decoding [17.5] 本稿では,独立なクリーンコンディショニング予測を,トークン依存をよりよく保存するために,前置詞の正確な因数分解に置き換えるFacterization-Error-Free Discrete Language Diffusion Modeling (FeF-DLLM)を提案する。
GSM8K,MATH,HumanEval,MBPPによる実験により,平均5.04ポイントの精度向上と平均推定速度の3.86倍の精度向上が得られた。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:15:25 GMT)
Deep Image Segmentation via Discriminant Feature Learning [17.3] この研究は、ネットワークトレーニングの古典的な差別的原則を組み込んだ、微分可能でアーキテクチャに依存しない損失関数であるDeep Discriminant Analysis (DDA)を導入している。
DDAはクラス内の分散を最小化しながらクラス間の分散を最大化し、推論コストを増大させることなく、コンパクトで分離可能な特徴分布を促進する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:25:36 GMT)
D-VLA: A High-Concurrency Distributed Asynchronous Reinforcement Learning Framework for Vision-Language-Action Models [17.2] Embodied AIにより、VLA(Vision-Language-Action)モデルが、マルチモーダル認識とタスク実行に優れるようになりました。
大規模分散環境におけるこれらの大規模なモデルへの強化学習の適用は、深刻なシステム的ボトルネックに直面します。
D-VLAは,大規模エンボディベースモデルのための,高精度で低レイテンシな分散RLフレームワークである。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:59:41 GMT)
What if Tomorrow is the World Cup Final? Counterfactual Time Series Forecasting with Textual Conditions [17.1] 時系列予測は、現実のシナリオにおいてますます重要になっている。
伝統的な手法は、典型的には歴史的データや現実的な将来の状況に依存している。
本稿では,テキストによる時系列予測の課題について紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:10:23 GMT)
When Robots Do the Chores: A Benchmark and Agent for Long-Horizon Household Task Execution [17.0] LongActは、長期住宅業務における計画レベルの自律性を評価するために設計されたベンチマークである。
HoloMindは、DAGベースの長距離階層型プランナーを備えたVLM駆動のエージェントである。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:47:53 GMT)
A Deterministic Agentic Workflow for HS Tariff Classification: Multi-Dimensional Rule Reasoning with Interpretable Decisions [17.0] このアーキテクチャは、中国の関税に関するオフラインの知識エンジニアリングと、オンラインの6段階パイプラインを組み合わせたものだ。
226桁の6桁の意見の不一致に関する2段階のマニュアル監査は、HSCodeCompの地味なラベルのごく一部が一般的な規則から逸脱する可能性があることを示唆している。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:04:46 GMT)
Do We Really Need External Tools to Mitigate Hallucinations? SIRA: Shared-Prefix Internal Reconstruction of Attribution [16.9] 大型視覚言語モデル(LVLM)は、言語が弱いあるいは曖昧な視覚的証拠を支配している場合、しばしば幻覚を与える。
トレーニング不要な内部コントラストデコーディングフレームワークであるSIRAを提案する。
SIRAは、マルチモーダルトランスのステージ情報フローを利用して、同一のLVLM内部に反ファクト参照を構築する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:37:55 GMT)
Slot-MPC: Goal-Conditioned Model Predictive Control with Object-Centric Representations [16.5] Slot-MPCは、モデル予測制御による計画を可能にするオブジェクト中心の世界モデリングフレームワークである。
Slot-MPCは,非対象中心の世界モデルベースラインに比べてタスク性能と計画効率を向上することを示す。
この結果は、明示的に構造化されたオブジェクト中心の表現が、制御可能で一般化可能な意思決定に強い帰納的バイアスをもたらすことを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:12:15 GMT)
Widening the Gap: Exploiting LLM Quantization via Outlier Injection [16.5] 悪意のある振る舞いを継続的に引き起こす最初の量子化条件攻撃を導入する。
我々の攻撃は、多くの現代的な量子化法で共有される単純な性質を利用する。
我々の攻撃は、前回の攻撃が失敗する広範囲の量子化手法に対して高い成功率を達成することを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:50:39 GMT)
DriveCtrl: Conditioned Sim-to-Real Driving Video Generation [16.4] DriveCtrlは、リアルな駆動ビデオ合成のための制御可能なsim-to-realビデオ生成フレームワークである。
シミュレーション映像をリアルな実世界のデータセットの視覚スタイルに合わせたリアルな運転映像に変換するスケーラブルなデータ生成パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:29:35 GMT)
Entangled Telecom Photon Generation using Twisted Van der Waals Crystals [16.4] 本稿では、ファンデルワールスによるNbOBr$2の波長スケールの光子源について報告する。
その結果、ツイスト・ファン・デル・ワールス工学は、高度に調整可能な高輝度の量子光源のための強力なプラットフォームとして、テレコム波長で確立された。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:02:13 GMT)
A plug-and-play generative framework for multi-satellite precipitation estimation [16.4] PRISMAは多センサ降水量推定のためのプラグアンドプレイ遅延生成フレームワークである。
臨界成功指数を最大40.3%改善し、ルート平均二乗誤差を22.6%削減する。
また、確率的スキルを改善し、平均推定時間約37秒を維持する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:18:53 GMT)
Runtime Monitoring of Perception-Based Autonomous Systems via Embedding Temporal Logic [16.3] 自律システムの監視は伝統的に、低次元状態変数上で定義された離散論理命題に連続的なセンサ観測をマッピングすることに依存している。
本研究では,学習した埋め込み空間で直接監視を行う時間論理であるEmbedding Temporal Logic (ETL)を提案する。
提案手法は複数の操作環境にまたがって評価され,ETLが基幹構造セマンティクスと強い経験的一致を達成できることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:44:18 GMT)
EntityBench: Towards Entity-Consistent Long-Range Multi-Shot Video Generation [16.3] 実話メディアから派生した140エピソード(2,491ショット)のベンチマークであるEntityBenchを紹介する。
3ピラー評価スイートと組み合わせて、ショット内品質、プロンプト追従アライメント、ショット間の一貫性を歪めます。
実験により、既存手法の繰り返し距離によって、クロスショットエンティティの整合性は著しく低下することが示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:55 GMT)
Fully Dynamic Rebalancing in Dockless Bike-Sharing Systems via Deep Reinforcement Learning [16.3] 本稿では,ドックレス自転車移動システムの再バランスのための完全動的深度強化学習法を提案する。
我々は、グラフベースのシミュレータを通してサービスをモデル化し、Markov決定プロセスとしてキャストリバランシングを行う。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:46:23 GMT)
GGBound: A Genome-Grounded Agent for Microbial Life-Boundary Prediction [16.2] 微生物株の生理的生活境界を特徴付けることは、バイオテクノロジーと生態学の中心である。
既存の計算手法では、生理的特性を独立した教師対象として扱うか、または静的エンコーダとして生物学的基礎モデルを扱う。
微生物のライフバウンダリ予測を統合ゲノム・生理的タスクとして定式化し,ツール拡張LDMエージェントで処理する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:37:55 GMT)
DiffPhD: A Unified Differentiable Solver for Projective Heterogeneous Materials in Elastodynamics with Contact-Rich GPU-Acceleration [16.1] ソフトボディの微分可能シミュレーションは、システム同定、軌道最適化、およびReal2Sim転送の基礎となる。
しかし、微分射影ダイナミクス(DiffPD)のような既存の手法は、異種材料に直面すると苦労する。
異種材料のためのGPU加速微分可能射影ダイナミクスフレームワークであるDiffPhDを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:09:42 GMT)
Neural Visual Decoding via Cognitive guided Adaptive Blurring and Information Constrained Alignment [16.0] EEGベースの視覚デコーディングは、神経信号と視覚的意味論のマッピングを確立することを目的としている。
既存のアプローチでは、人間の視覚の動的選択性と神経振動の周波数特異性を無視して、静的な視覚的特徴を扱うのが一般的である。
本稿では、ニューラル・ビジュアル・デコーディングのための情報制約付きアライメント・フレームワークを用いた認知誘導型適応ボケリングであるCAIAを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:50:29 GMT)
Aligning Latent Geometry for Spherical Flow Matching in Image Generation [15.9] 知覚的内容と意味的内容は、主に方向によって運ばれ、半径がはるかに少ないことが示される。
一致したトレーニングでは、異なる画像トークンー間でクラス条件のImageNet-256 FIDを一貫して改善する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:37 GMT)
FFAvatar: Few-Shot, Feed-Forward, and Generalizable Avatar Reconstruction [15.7] アバター再構成は伝統的に、数時間の計算を必要とするオブジェクトごとの最適化に依存してきた。
本稿では,高品質でアニマタブルな3次元ガウスヘッドアバターを数秒で再構築する,一般化可能なフィードフォワードフレームワークであるFFAvatarを紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:33:49 GMT)
Muon-OGD: Muon-based Spectral Orthogonal Gradient Projection for LLM Continual Learning [15.6] スペクトルノルムを意識した連続学習フレームワークであるMuon-OGDを提案する。
提案手法を標準連続学習ベンチマークで評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 22:50:46 GMT)
VerbalValue: A Socially Intelligent Virtual Host for Sales-Driven Live Commerce [15.5] VerbalValueはセールスコンバージョン指向の仮想ホストで、例外的な言葉の能力を実際の商業価値に変える。
さまざまなビューアーの意図にまたがる1,475のライブコマースインタラクションを収集し、注釈付けします。
GPT-5.4、Claude Sonnet 4.6、Gemini 3.1 Pro、その他のベースラインに対する実験では、情報の正確さが23%、事実の正しさが18%向上した。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:23:32 GMT)
Causal Foundation Models with Continuous Treatments [15.5] 本研究は, 連続治療における最初の因果基盤モデルについて述べる。
メタ学習モデルは、追加のトレーニングや微調整をすることなく、さまざまな未知のタスクにまたがる因果関係を予測できる。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:40:28 GMT)
Enjoy Your Layer Normalization with the Computational Efficiency of RMSNorm [15.4] 階層正規化(Layer normalization, LN)は、現代のディープラーニングの基本的な構成要素である。
LNのサンプルごとの集中とスケーリングは、無視できない推論オーバーヘッドをもたらす。
本稿では,モデル関数を変更することなく任意のDNN内のLNをRMSNormに置き換えることができるかどうかを判断する枠組みを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:05:39 GMT)
Unified High-Probability Analysis of Stochastic Variance-Reduced Estimation [15.4] 本稿では,メモリ保持,リセット確率,反復運動の補正項という3つの要素からなる再帰に基づく分散推定のための統一的フレームワークを開発する。
我々の主な結果は、ベクトルマーチンガレットのランダム和を含む滑らかなノルム空間に対して有効である新しい次元自由ベクトル値フリードマンを用いて証明された統一された高確率境界である。
応用として、ミラー降下による非拘束最適化のための高確率オラクル複素数を求め、信頼度に対数的依存を確立する。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:17:10 GMT)
LPH-VTON: Resolving the Structure-Texture Dilemma of Virtual Try-On via Latent Process Handover [15.2] 仮想トライオン(Virtual Try-On)は、人の体とポーズを正確に整列した衣服のフォトリアリスティックなイメージを合成することを目的としている。
しかし、現在の拡散に基づく手法は、構造的完全性とテクスチャ的忠実性の間に根本的なトレードオフに直面している。
LPH-VTONは、この緊張を1つの連続的分極過程の中で解消する新しい相乗的フレームワークである。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:18:56 GMT)
GRLO: Towards Generalizable Reinforcement Learning in Open-Ended Environments from Zero [15.2] ポストトレーニングは、大きな言語モデルの能力をアンロックするための重要なステップになっている。
オープンエンド環境における小さな相互作用の集合からスクラッチから学習したRLHFの一般化能力について検討した。
提案手法は,数学的推論やコード生成といった下流タスクに暗黙的に移行できるかどうかを考察する。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:05:23 GMT)
Towards Continuous Sign Language Conversation from Isolated Signs [15.1] 本稿では,これまでで最大のラベル付き孤立符号語彙であるSignaVox-Wと,連続的な3次元手話データセットであるSignaVox-Uを紹介する。
得られたデータを用いて、サイン・ツー・サインの直接対話モデルであるSignaVoxをトレーニングし、事前の署名コンテキストから3次元の身体、手、顔の動き応答を生成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:22:27 GMT)
MambaRain: Multi-Scale Mamba-Attention Framework for 0-3 Hour Precipitation Nowcasting [15.1] MambaRainは、新しいマルチスケールエンコーダデコーダアーキテクチャである。
マンバの線形複素性長期時間モデリングと自己アテンション機構を統合し、空間相関キャプチャーを明示する。
我々は,MambaRainが0~3時間放送タスクにおいて,既存の手法を大幅に上回っていることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:23:12 GMT)
SteerSeg: Attention Steering for Reasoning Video Segmentation [15.1] ビデオセグメンテーションは、しばしば空間的推論と暗黙的な参照を含む自然言語表現からビデオフレームをまたいだオブジェクトをローカライズする必要がある。
近年のアプローチでは、注意マップを抽出し、それらをセグメント化のための空間的先行情報として利用することにより、凍結した大規模視覚言語モデル(LVLM)を活用する。
我々はSteerSegという軽量なフレームワークを紹介し、注意欠陥を注意ベースグラウンドにおける重要なボトルネックとして認識する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:42:15 GMT)
Croissant Baker: Metadata Generation for Discoverable, Governable, and Reusable ML Datasets [15.0] Croissantは、機械学習データセットのメタデータ標準である。
NeurIPSは現在、データセットトラックへのすべてのサブミッションでCroissantメタデータを必要としている。
我々は、データセットディレクトリから直接検証済みのCroissantメタデータを生成するローカルファーストのオープンソースのコマンドラインツールであるCroissant Bakerをリリースした。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:04:39 GMT)
ODRPO: Ordinal Decompositions of Discrete Rewards for Robust Policy Optimization [14.9] 大規模言語モデル(LLM)は、AIフィードバック(RLAIF)から強化学習(Reinforcement Learning)を利用する。
これらのドメインは、細粒度で多層的な報酬を提供するために、しばしばベースオートレーダに依存している。
これは、離散的な報酬を順序付きバイナリインジケータのシーケンスに分解することで、評価ノイズを構造的に分離するフレームワークです。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:04:15 GMT)
Multi-domain Multi-modal Document Classification Benchmark with a Multi-level Taxonomy [14.9] マルチレベル・マルチドメイン・マルチモーダル文書分類ベンチマーク(MMM-Bench)を構築した。
MMM-Benchは、(1)ビジネス文書の真正な組織論理を捉える5つのレベルにまたがる深い階層的な分類、(2)Alibabaの12の商業ドメインから慎重にキュレートされた実世界の5,990のマルチモーダル文書を含む。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:54:59 GMT)
Lagrangian Flow Matching: A Least-Action Framework for Principled Path Design [14.8] フローマッチングは、所定の確率パスに関連する目標速度に対して回帰して神経速度場を訓練する。
ラグランジアンフローマッチング(Lagrangian flow matching)は、一般ラグランジアンの動きを最小化して確率パスと速度場を決定する物理ベースのフレームワークである。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:05:03 GMT)
UniTriGen: Unified Triplet Generation of Aligned Visible-Infrared-Label for Few-Shot RGB-T Semantic Segmentation [14.6] RGB-Tセマンティックセグメンテーションは、厳密なVIS-IR-Label三重項を必要とするが、そのような整列三重項データは現実のシナリオでは少ないことが多い。
空間整合性,意味整合性,モダリティ相補的なVIS-IR-Label三重項を直接生成する統合三重項生成フレームワークであるUniTriGenを提案する。
実験により、UniTriGenは、限られた実ペアデータから高品質な三重項を生成し、様々なRGB-Tセマンティックセマンティックセグメンテーションモデルで一貫した性能改善を実現する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:39:53 GMT)
A Tale of Two Problems: Multi-Task Bilevel Learning Meets Equality Constrained Multi-Objective Optimization [14.5] 我々は、緩和された一般凸性仮定の下で、二レベル最適化(BLO)をマルチタスク設定に拡張する最初の試みを行う。
ECMOは、文献ではまだ研究されていない新しい問題である。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:59:48 GMT)
TILT: Target-induced loss tilting under covariate shift [14.5] 我々は、教師なしドメイン適応のためのTarget-induced Loss Tilting(TILT)を紹介し、分析する。
ソース予測を$f+b$として分解する新しい客観的関数に基づいて、ラベル付きソースデータに$f+b$を適合させ、同時にラベルなしターゲット入力に補助コンポーネント$b$をペナル化する。
この標的側のペナルティは、人口レベルでの相対的な重み付けを暗黙的に引き起こすが、推定値として$b*_f$は、現在の誤差に自己局所化され、任意のソース・ターゲット対に対して均一に拘束される。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:26:34 GMT)
Context Pruning for Coding Agents via Multi-Rubric Latent Reasoning [14.5] LLMベースのコーディングエージェントは、トークンの予算の大部分をリポジトリファイルを読むのに費やしている。
この定式化がモデリングのボトルネックを生み出すことを示す。
コード関連性を2つの解釈可能な品質次元に分解する構造化プルーニングフレームワークであるLaMRを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:30:10 GMT)
Why are language models less surprised than humans? Testing the Parse Multiplicity Mismatch Hypothesis [14.5] 予備理論は、単語の処理困難は文脈におけるその予測可能性によって決定されると仮定する。
LMは、自然主義的なテキストの読み出し時間を予測することに成功したが、統語的曖昧さの制御された研究において観察される困難度を体系的に過小評価した。
このことは、LMと人間が同時に利用できるパース数の違いは、人間の文章処理とLMに基づく仮定を一致させることができないことを示唆している。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:44:26 GMT)
ELDOR: A Dataset and Benchmark for Illegal Gold Mining in the Amazon Rainforest [14.4] アマゾン熱帯雨林の違法な金採掘は森林破壊、水汚染、長期生態系破壊を引き起こす。
衛星画像は大規模な観測をサポートするが、小さな鉱業関連の構造と微妙な土地被覆遷移を見逃すことが多い。
熱帯雨林における違法な金鉱業の環境・景観変動をモニタリングするための大規模UAVベンチマークであるEDLDORを紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:30:25 GMT)
Veritas: A Semantically Grounded Agentic Framework for Memory Corruption Vulnerability Detection in Binaries [14.4] We present Veritas, a semantically grounded framework for binary memory corruption vulnerability detection。
Veritas は RetDec-lifted LLVM IR に静的スライサ、デュアルビュー LLM 検出器、マルチエージェントバリデータを組み合わせた。
Veritasをモジュールパイプラインとして実装し、実世界のバイナリ脆弱性ケースのキュレートされたベンチマークで評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:16:11 GMT)
What Makes Words Hard? Sakura at BEA 2026 Shared Task on Vocabulary Difficulty Prediction [14.4] 語彙難易度予測には,高精度なブラックボックスモデルと説明可能なモデルという2種類のモデルを用いる。
ブラックボックスモデルとして,ソフトターゲット損失関数を用いてLCMを微調整し,評価タスクに効果的に適用した。
説明可能なモデルは、強い相関を維持しながら、各項目の難しさにどんな影響を及ぼすかについての洞察を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:57:35 GMT)
Diffusion Policy for Coordinated Control of a Nonholonomic Mobile Base and Dual Arms in Door Opening and Passing [14.3] 人間は自然に両腕を巧妙に使い、ハンドルを回転させ、隙間を広げ、ドアを握り、必要に応じて腕を交換し、クリアランスを維持しながら移動させる。
このような動作を再現するためには、ロボットは複数のステージにまたがる長い動きとドアの異なる部分との相互作用を実行する必要がある。
模倣学習の最近の進歩は、スケーラブルな代替手段を提供するが、既存の視覚行動モデルでは、ドアの開口と通過の完全なタスクのために、非ホロノミックベースと両腕の同時調整を実証していない。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:23:46 GMT)
Discrimination Is Generation: Unifying Ranking and Retrieval from a Tokenizer Perspective [14.3] DIG (textbfDiscrimination textbfIs textbfGeneration) を提案する。
3つの公開ベンチマークと2つの産業データセットの実験は、DIGが同時にランク付け、検索、統合された検索レベルの品質を改善していることを示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:59:29 GMT)
Efficient Online Conformal Selection with Limited Feedback [14.3] 我々は、エージェントが最低限の選択肢のサブセットを選択して、少なくとも1つの成功が特定されるようにしなければならない共形選択の問題に対処する。
適応型コンフォーマル推論(ACI)更新ルールは、適切な制御パラメータや双対変数に適用された場合、逆向きに有効かつ効率的であることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:22:46 GMT)
Geometry-Aware Neural Optimizer for Shape Optimization and Inversion [14.3] 幾何学はPDEが支配するシステムの中心であり、形状最適化と反転を動機付けている。
textbftextscGANOは、幾何学表現、フィールドレベルの予測、および単一の潜在空間ループにおける自動最適化/反転を統一する。
textscGANOはヌルスペースプロジェクションによる部分的制御をサポートし、レメッシングフリープロジェクションを使用して幾何学処理を高速化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:13:22 GMT)
Do Coding Agents Understand Least-Privilege Authorization? [14.2] 我々は、フロンティアモデルが実行チェーンに必要なパーミッションを省略し、未使用または機密アクセスを許可していることを示す。
本稿では,まず,タスクを前方にシミュレーションしてカバレッジ指向のポリシを生成し,各エントリをグラウンディングと感度で監査する。
この分解は、すべての評価されたモデルに対する攻撃の成功を減少させながら、タイトネスバイアスモデルにおいて、センシティブタスクの成功を最大15.8%改善する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:05:58 GMT)
Good to Go: The LOOP Skill Engine That Hits 99% Success and Slashes Token Usage by 99% via One-Shot Recording and Deterministic Replay [14.2] 99%の成功率と99%のトークン削減を実現するシステムである LOOP SKILL ENGINE を提案する。
決定論的実行計画は、時間依存変数と結果依存変数をパラメータ化しながら、タスクの機能的意図をキャプチャする。
周期的エージェントタスクのベンチマークが5分から24時間に及ぶ間、Loop Skill Engineは毎月のトークン消費を93.3%--99.98%削減し、実行遅延を8.7倍削減し、出力非決定性を排除している。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:05:35 GMT)
Artificial Intelligence-Assistant Cardiotocography: Unified Model for Signal Reconstruction, Fetal Heart Rate Analysis, and Variability Assessment [14.2] 我々のモデルは、ラベルなしの558,412個のデータポイントからなる巨大なデータセットで事前訓練された。
本モデルでは, 臨界FHR減速と加速度の検出において高い感度と特異性を示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:18:41 GMT)
Breakeven complexity: A new perspective on neural partial differential equation solvers [13.9] APEBenchの2次元周期領域上の3つのPDE上でのニューラルPDEソルバの破壊的複雑性を評価する。
提案手法は, コスト, 寸法, ロールアウト, 物理状態の問題を複雑化するにつれて, ニューラルネットワークによるPDE解法がより効果的になることを示唆する。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:33:24 GMT)
Understanding How International Students in the U.S. Are Using Conversational AI to Support Cross-Cultural Adaptation [13.8] 米国では、国際的な学生は独特な課題に直面しているが、現在のサポートエコシステムはほとんど断片化されている。
多くの人が使うツールとして会話型AIが登場したが、海外の学生がこれらの技術をサポートツールとしてどのように採用し、知覚するかを明確に理解していない。
我々の研究結果は、AIが即時課題の第一支援ツールとして認識されていることを示しているが、短期支援のためのツールから長期的な支援コンパニオンへと、AIを変換することに関心がある。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:37:23 GMT)
Octopus: History-Free Gradient Orthogonalization for Continual Learning in Multimodal Large Language Models [13.8] HiFGO(History-Free Gradient Orthogonalization)に基づく2段階連続学習フレームワークを提案する。
UCITの実験では、オクトパスが最先端のパフォーマンスを確立し、AvgとLastの2.14%と6.82%を突破した。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:13:24 GMT)
NodeSynth: Socially Aligned Synthetic Data for AI Evaluation [13.8] 社会的に関連する合成クエリを生成するエビデンスベースの手法であるNode Synthを紹介する。
Node Synthは、人によるベンチマークの最大5倍の失敗率を示している。
スケーラブルで高精度なモデル評価を可能にするために、エンドツーエンドの研究プロトタイプとデータセットをオープンソースにしています。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:06:50 GMT)
GeoVista: Visually Grounded Active Perception for Ultra-High-Resolution Remote Sensing Understanding [13.8] 超高解像度(UHR)リモートセンシング画像の解釈には、大規模なシーンにわたってスパースで小さな視覚的証拠を探すモデルが必要である。
既存の視覚言語モデルは、ズームとトリミングツールを使用して地域を検査することができるが、ほとんどの探索戦略は、1ショットの焦点または1つのシーケンシャルな軌跡のいずれかに従う。
提案するGeoVistaは,UHRリモートセンシング解釈のための計画駆動型能動認識フレームワークである。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:15:46 GMT)
Toward Securing AI Agents Like Operating Systems [13.4] 汎用技術として,大規模言語モデル(LLM)に基づく自律エージェントが急速に出現している。
オペレーティングシステムのレンズによるLCMエージェントのセキュリティについて検討する。
エージェントシステムの安全な設計のための一連の勧告で締めくくります。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:07:25 GMT)
RIDE: Retinex-Informed Decoupling for Exposing Concealed Objects [13.4] Concealed Object(COS)は、カモフラージュされたオブジェクト検出、ポリプセグメンテーション、透明なオブジェクト検出、産業欠陥検査など、一連の密集した予測タスクを含む。
既存の方法はRGB画像を直接操作するか、スケール/周波数係数をまたいで空間的証拠を再分配する等質分解を用いる。
我々は基本的に異なる視点を導入する:textbfhomogeneous image decomposition via Retinex theory, which factors a image into lightumination and reflectance components in the emphsame space domain。
論文参考訳(メタデータ) (Thu, 14 May 2026 22:19:52 GMT)
Agreement, Diversity, and Polarization Indices for Approval Elections [13.3] 我々は、承認選挙において、有権者の合意、多様性、偏見を捉える指標を模索する。
我々は、いくつかの指標を提案し、その特性を分析し、(a)新しい承認選挙の地図を導き、(b)Pabulib、Preflib、その他の情報源からの様々な実生活選挙の類似点と相違点を示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:47:30 GMT)
Improving Multi-turn Dialogue Consistency with Self-Recall Thinking [13.3] 大規模言語モデル(LLM)ベースのマルチターン対話システムは、非隣接のターン間の依存関係を追跡するのに苦労することが多い。
本稿では,長期的コンテキスト依存と疎結合な情報信号に対処するフレームワークであるセルフリコール思考(SRT)を提案する。
複数のデータセットの実験では、SRTはF1スコアを4.7%改善し、エンドツーエンドのレイテンシを14.7%削減している。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:20:14 GMT)
Njord: A Probabilistic Graph Neural Network for Ensemble Ocean Forecasting [13.2] 我々は,海洋予測のための確率論的データ駆動モデルであるNjordを紹介した。
Njordは、深層潜伏変数フレームワークとグラフニューラルネットワークアーキテクチャを組み合わせることで、予測ステップを単一のフォワードパスでサンプリングすることができる。
実験は、決定論的機械学習ベースラインと比較して、両方の領域で強い性能を示し、サンプルアンサンブル予測から不確実な推定を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:17:21 GMT)
Learning with Shallow Neural Networks on Cluster-Structured Features [13.1] 浅層ニューラルネットワーク上での勾配降下学習における空間的相関が学習の複雑さに与える影響について検討した。
階層的に勾配差が変化する変種の場合、サンプルの複雑さは隠れ変数の数とともにスケールすることを示す。
合成データと実データの両方で理論的知見を実証的に検証する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:02:24 GMT)
Overcoming Dynamics-Blindness: Training-Free Pace-and-Path Correction for VLA Models [13.0] 既存のアプローチでは、高価な再トレーニングが必要か、レイテンシのボトルネックとアクションチャンク間の時間的一貫性の低下に悩まされる。
チャンクされた動作VLAをラップするトレーニングフリーでクローズド形式の推論時間演算子であるPace-and-Path Correctionを提案する。
動作を唯一の制御変数として分離する目的で設計された総合的な診断ベンチマークMoveBenchについて,本手法の評価を行った。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:19:21 GMT)
Guided Diffusion Sampling for Precipitation Forecast Interventions [13.0] データ駆動型気象予測モデルを用いた気象制御のための摂動に基づく介入はまだ検討されていない。
拡散サンプリングによる降水・降水介入のための勾配に基づくガイダンスフレームワークを提案する。
本手法は, 逆方向の摂動よりも物理的に妥当な介入を行ない, 効果的な降水量削減を実現する。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:27:54 GMT)
New approaches to almost i.i.d. information theory [12.9] 独立かつ同一に分布する状態(d.d.)は量子情報理論においてユビキタスである。
Mazzola/Sutter/Renner, arXiv:2603.15792] により、物理的により説得力のある「ほぼi.d.」ソースのクラスが提案された。
本稿では、正規化された量子ワッサーシュタイン距離と、平均$k$ボディの辺りを求めるアイデアに基づいて、ほぼ1d状態の2つの代替定義を導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:27:47 GMT)
Systematic Discovery of Semantic Attacks in Online Map Construction through Conditional Diffusion [12.9] 敵防衛を回避した意味的攻撃の発見のためのフレームワークであるMIRAGEを提示する。
筆者らは,(1)境界除去,57.7%の検知抑制,および計画軌道の96%の破損,(2)境界注入の2つの手法を実証した。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:21:17 GMT)
MechVerse: Evaluating Physical Motion Consistency in Video Generation Models [12.9] MechVerseは、機械的に一貫した画像-ビデオ生成のためのベンチマークである。
標準ビデオメトリクスを用いて,プロプライエタリ,オープンソース,微調整による映像合成モデルの評価を行った。
その結果、現在のモデルでは機械的に許容できる運動を発生させるのに失敗しながら外観や滑らかさを保てることが示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:48:17 GMT)
A Theory of Training Profit-Optimal LLMs [12.8] LLM訓練会社の合理的行動を特徴付けるための経済モデルを開発する。
我々は、このモデルにおける利益問題を、計算バウンドおよびデータバウンド体制下で分析する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:57:40 GMT)
Fast Rates for Inverse Reinforcement Learning [12.7] 最大推定値 (MLE) とMin-Max-IRL は, 人口レベルで等価であることを示す。
我々は、報酬パラメータに関するソフト最適値関数の導出に関する新しい結果を得る。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:07:31 GMT)
Where Should Diffusion Enter a Language Model? Geometry-Guided Hidden-State Replacement [12.6] DiHALは幾何学誘導拡散変換器ハイブリッドである。
レイヤをスコアし、拡散フレンドリーな隠れ状態インターフェースを選択する。
上層と元のLMヘッドを保持しながら、下層トランスフォーマープレフィックスを拡散ブリッジに置き換える。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:47:54 GMT)
Case-Based Calibration of Adaptive Reasoning and Execution for LLM Tool Use [12.6] 歴史的実行軌跡を構造化ケースとして扱うケース駆動フレームワークであるCASTを提案する。
このフレームワークは、この知識を細かな報酬設計と適応推論に翻訳する。
BFCLv2とToolBenchの実験では、CASTはスキーマフル実行とタスクレベルのツール使用の成功の両方を改善している。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:36:04 GMT)
Learning from Language Feedback via Variational Policy Distillation [12.5] 変分ポリシー蒸留(VPD)は、言語フィードバックからの学習を変分期待最大化問題として形式化するフレームワークである。
VPDは標準のRLVRと既存の自己蒸留ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:27:34 GMT)
Dual-Dimensional Consistency: Balancing Budget and Quality in Adaptive Inference-Time Scaling [12.5] 大規模言語モデル(LLM)は推論において顕著な能力を示した。
推論時間のスケーリングによる可能性の最大化は、サンプリング予算と推論品質の間のトレードオフにおいて、課題に直面します。
本稿では,経路品質を適応終端でブリッジする統合フレームワークであるDDCを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:19:37 GMT)
ACE-LoRA: Adaptive Orthogonal Decoupling for Continual Image Editing [12.4] 現実世界のアプリケーションは、学習済みの知識を維持しながら、新しいタスクへの継続的な適応を必要とする。
連続画像編集のための動的正規化フレームワークACE-LoRAを提案する。
また、この領域で最初の包括的なベンチマークであるCIE-Benchを紹介します。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:20:27 GMT)
MLGIB: Multi-Label Graph Information Bottleneck for Expressive and Robust Message Passing [12.0] グラフニューラルネットワーク(GNN)はディープメッセージパッシングの過度なシャッシングに悩まされ、指数関数的に成長する近隣からの情報は固定次元の表現に圧縮される。
マルチラベルグラフにおいて,この問題は個別の障害モードとなり,ノイズのあるラベル情報によって予測信号が希薄になることを示す。
本稿では,無関係なラベル雑音下での制約情報伝達としてマルチラベルメッセージパッシングを定式化するマルチラベルグラフ情報ボトルネック(MLGIB)を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:59:42 GMT)
Quantum Circuit Synthesis Using an Exact T Library [12.0] フォールトトレラントな量子合成回路では、マジック状態を介して供給されるTゲートが時空コストを支配し、クリフォードゲートは無視できないオーバーヘッドを発生させる。
従来のフローはXOR, AND, NOTベースをTのプロキシとして最小化しカウントする。
代わりに、正確なT合成問題を定式化し、クリフォード同値の下でブール関数を正準化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:34:01 GMT)
Masked Next-Scale Prediction for Self-supervised Scene Text Recognition [11.8] シーンテキスト認識は、粗いレイアウトからきめ細かい文字ストロークへと進化する視覚構造をモデル化する必要がある。
Masked Image Modeling (MIM)のような近年の自己教師型アプローチは、大規模な未ラベルデータを活用することで、この依存関係を緩和している。
我々は,MNSP(Masked Next-Scale Prediction)を紹介した。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:28:55 GMT)
Turning Stale Gradients into Stable Gradients: Coherent Coordinate Descent with Implicit Landscape Smoothing for Lightweight Zeroth-Order Optimization [11.7] バックプロパゲーションが利用できないシナリオでは、ゼロオーダ(ZO)最適化が重要となる。
既存の方法は、サンプル非効率(例:標準有限差分)であるか、ランダム化推定による高い分散に悩まされている、という大きなトレードオフに直面している。
本研究では,CoCD(Coherent Coordinate Descent)を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:52:24 GMT)
MetaBackdoor: Exploiting Positional Encoding as a Backdoor Attack Surface in LLMs [11.7] バックドア攻撃は大規模言語モデル(LLM)に深刻なセキュリティ脅威をもたらす
今回紹介するMetaBackdoorは,位置情報をトリガーとして活用する,新たなバックドア攻撃のクラスである。
単純な長さベースのトリガーでさえ、ステルスなバックドアを起動するのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:56:22 GMT)
Multi-proposal Collaboration and Multi-task Training for Weakly-supervised Video Moment Retrieval [11.7] 本研究は、弱教師付きビデオモーメント検索(VMR)に焦点を当てる。
ビデオレベルの対応のみを用いて、トリミングされていないビデオ内で、与えられたクエリと意味的に類似したモーメントを識別することを目的としている。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:43:32 GMT)
BioHuman: Learning Biomechanical Human Representations from Video [11.7] 既存のモーションキャプチャーデータセットから筋肉の活性化を推定するためのシミュレーションベースのフレームワークを提案する。
本稿では,モノクロ映像を入力とし,人間の動きと筋の活性化を共同で予測するエンド・ツー・エンド・エンド・モデルであるBioHumanを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:36:53 GMT)
Can Visual Mamba Improve AI-Generated Image Detection? An In-Depth Investigation [11.6] 本研究では,AI生成画像検出のためのビジョン・マンバモデルの体系的評価と比較分析を行う。
我々は、さまざまなデータセットや合成画像ソースにまたがる代表的CNN、VT、VLMベースの検出器に対して、複数のVision Mamba変種をベンチマークする。
我々の発見は、AI生成された視覚コンテンツと真正性を見分けるように設計されたシステムにおけるコンポーネントとして、Vision Mambaの約束と現在の限界の両方を強調した。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:09:16 GMT)
Learning with Semantic Priors: Stabilizing Point-Supervised Infrared Small Target Detection via Hierarchical Knowledge Distillation [11.6] 単一フレーム赤外線小ターゲット検出(ISTD)は、重い背景クラッタの下で弱いターゲットをローカライズすることを目的としている。
CNN検出器は十分な意味を欠くことが多く、ノイズの多い擬似マスクと不安定な最適化をもたらす。
本稿では,凍結ビジョン基礎モデル(VFM)を用いた階層的VFM駆動型知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:12:08 GMT)
QSeqSim: A Symbolic Simulator for Qiskit While Loops Using Sequential Quantum Circuits [11.5] QSeqSimはQiskit QuantumCircuitオブジェクトをOpenQASM 3コードに変換し、その結果のプログラムを編成する。
このセマンティクスに基づいて構築されたQSeqSimは、BDD(Binary Decision Diagram)ベースのシンボル表現を採用している。
実験により、QSeqSimは相当な時間誘起シーケンシャル回路にスケールすることを示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:25:39 GMT)
Open Quantum Theory of Shot Noise in Dissipative Chiral Transport [11.5] 現在の騒音は, 平均占有率分布と粒子数変動の2つの競合要因によって制御されていることを示す。
本研究では,可測音量から隠れ占有率分布を直接再構成するインバージョン手法を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:05:52 GMT)
Cognitive-Uncertainty Guided Knowledge Distillation for Accurate Classification of Student Misconceptions [11.5] 既存のデータから高価値サンプルをマイニングする2段階の知識蒸留フレームワークを提案する。
フィルタされたサンプルのわずか10.30%で強化トレーニングを行うことで、MAP-Chartingデータセットで0.9585 (+17.8%)のMAP@3を達成する。
4Bパラメータモデルのみを用いて、中学代数学の誤概念ベンチマークのクロストピックテストにおいて84.38%の精度が得られる。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:17:38 GMT)
APWA: A Distributed Architecture for Parallelizable Agentic Workflows [11.5] 本稿では,分散マルチエージェントシステムアーキテクチャであるAgent-Parallel Workload Architecture (APWA)を紹介する。
APWAは、非常に並列化可能なエージェントワークロードの効率的な処理のために設計されている。
ヘテロジニアスなデータと並列処理パターンをサポートし、幅広いドメインからのタスクに対応している。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:40:20 GMT)
Watermarking Should Be Treated as a Monitoring Primitive [11.5] ウォーターマーキングは、生成モデルにおける証明、帰属、安全監視のために広く提案されている。
我々は、透かしは監視プリミティブとして扱われるべきであり、内部監視は、属性ごとの属性キーとメッセージによって避けられないと論じる。
本稿では,観測者が出力全体にわたって透かし信号を集約してエンティティレベルの情報を推測する,オブザーバベースの脅威モデルを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:23:50 GMT)
Logical Grammar Induction via Graph Kolmogorov Complexity: A Neuro-Symbolic Framework for Self-Healing Clinical Data Integrity [11.5] 本稿では,臨床記録を潜在論理ゲームが支配する「構造化プライベート言語」として扱う新しいニューロシンボリックフレームワークであるLogic-GNNを提案する。
Sina Systemデータセット(2M+レコード)に基づいて、Logic-GNNはF1スコアの0.94を達成し、最先端のベースラインを12%上回った。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:19:43 GMT)
Training ML Models with Predictable Failures [11.4] デプロイメントスケールでMLモデルがフェールする頻度を推定することは、デプロイ前の安全性評価の中心である。
この推定器の予測誤差を有限k分解し、過剰予測に対するバイアスが組み込まれていることを示す。
本稿では,この障害モードに対処する微調整目標である予測可能性損失を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:41:52 GMT)
CLOVER: Closed-Loop Value Estimation \& Ranking for End-to-End Autonomous Driving Planning [11.3] CLOVERはエンドツーエンドの自動運転計画のためのフレームワークである。
ジェネレータは多様な候補軌道を生成し、スコアは計画値のサブスコアを予測する。
ジェネレータは教師が選択したトップ$とベクターParetoターゲットに洗練される。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:32:18 GMT)
Toward World Modeling of Physiological Signals with Chaos-Theoretic Balancing and Latent Dynamics [11.3] 我々は多変量生理信号と臨床介入変数の両方を共有潜在空間にエンコードする世界モデルであるNormWear-2を紹介する。
我々のアプローチは、事前訓練された知識(直観)からの推論と即時非パラメトリック潜在状態遷移適応(視点)を組み合わせたものである。
我々は、異種時間分解能と介入体制にまたがる様々な現実世界の生理的データセットにおける世界モデル性能を評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:06:15 GMT)
Towards Fine-Grained and Verifiable Concept Bottleneck Models [11.2] Concept Bottleneck Models (CBM) はブラックボックス予測器の解釈可能な代替手段を提供する。
既存のCBMは、予測された概念が正しい視覚的証拠に対応するかどうかを検証するのに苦労している。
局所的な視覚的エビデンスに各概念を根ざしたきめ細かいCBMフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:08:09 GMT)
Done, But Not Sure: Disentangling World Completion from Self-Termination in Embodied Agents [11.2] VIGILは、端末のコミットメントを独立して測定できる評価フレームワークである。
VIGILのデフォルトプロトコルでは、エージェントはエゴセントリックなRGBのみを観察し、アクション・サクセス・シグナルを受信せず、各エピソードは、隠された世界状態に対して決定論的にチェックされたセマンティック・レポートで終了しなければならない。
これにより、ワールドステートコンプリート(W)とベンチマーク成功(B)の2つのスコアが得られます。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:36:04 GMT)
Learning Polyhedral Conformal Sets for Robust Optimization [10.5] 本稿では,頑健な最適化目標に適した不確実性集合を学習する,意思決定対応型コンフォメーションフレームワークを提案する。
提案手法は,データ駆動型超平面による多面体集合のフレキシブルなファミリーをパラメータ化し,誘導されたロバスト損失を直接最小化することでそれらの幾何学を学習する。
オラクル決定に対する準最適ギャップの有限サンプルカバレッジ保証とバウンダリを提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:40:40 GMT)
RoSHAP: A Distributional Framework and Robust Metric for Stable Feature Attribution [10.5] 本稿では,特徴属性の予測特性とロシュアトリビューション指標(ロシュアトリビューション指標)を,SHAP測定値に基づく安定な特徴ランキングに組み込むためのフレームワークを提案する。
正規性条件下では、集約された特徴属性スコアはガウスであり、分布推定の計算コストを大幅に削減することを示す。
RoSHAPアプローチは、マシンラーニングモデルの安定性と解釈性を改善し、分析のための信頼性と一貫性のある洞察を可能にする。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:51:09 GMT)
Quantifying Cyber-Vulnerability in Power Electronics Systems via an Impedance-Based Attack Reachable Domain [10.5] この手紙は、実行可能な敵アクションを臨界固有値移動にマッピングするインピーダンスベースのアタック・リーチブル・ドメイン・フレームワークを提案する。
アタック浸透指数はノードレベルのサイバー脆弱性を定量化するために定義される。
ケーススタディでは、調整されたクロスレイヤー操作は孤立した単一層攻撃よりも明らかに損傷が大きいことが示されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:47:43 GMT)
Cross-attention-based bipartite graph neural network for coupled nodal and elemental field prediction in large-deformation sheet material forming [10.4] 本研究では, 直交型二部グラフニューラルネットワーク(CAtt-BiGNN)を提案する。
エッジ対応クロスアテンションプロセッサは、幾何学的エッジ特徴に対する適応ノード要素結合重みを条件とする。
以上の結果から, 本モデルでは, 大形シート材料形成に有効なサロゲートの枠組みが提案されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:12:44 GMT)
AnyBand-Diff: A Unified Remote Sensing Image Generation and Band Repair Framework with Spectral Priors [10.4] 本稿では,頑健なスペクトル再構成に適したスペクトル優先拡散フレームワークであるAnyBand-Diffを紹介する。
ラジオメトリックの忠実性を確保するため,物理誘導サンプリング機構を提案する。
実験は、AnyBand-Diffが信頼できる画像を生成するための有効性を確認する。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:04:34 GMT)
COPRA: Conditional Parameter Adaptation with Reinforcement Learning for Video Anomaly Detection [10.3] 映像異常検出(VAD)における視覚言語モデル(VLM)の性能は高い。
既存のVLMベースのVAD手法は、トレーニングと推論の根本的なミスマッチに悩まされる。
VLMベースのVADのための条件パラメータ適応フレームワークCOPRAを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:39:40 GMT)
CoCo-InEKF: State Estimation with Learned Contact Covariances in Dynamic, Contact-Rich Scenarios [10.3] CoCo-InEKFは、二元接触状態の代わりに連続接触速度共分散を利用する微分不変な拡張カルマンフィルタである。
我々は、接触候補点を予測するために状態エラー損失を用いて、エンドツーエンドで訓練された軽量ニューラルネットワークを用いる。
二足歩行ロボットの実験は、線形速度推定に優れた精度・効率のトレードオフを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:35:06 GMT)
Reactive Planning based Control for Mobile Robots in Obstacle-Cluttered Environments [10.1] 本稿では,障害物分散環境における移動ロボットの動作制御問題に対処する。
移動ロボットは、部分的な環境情報のみを有し、衝突することなく、初期位置から目標位置へ移動することを目的としている。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:57:28 GMT)
Towards Gaze-Informed AI Disclosure Interfaces: Eye-Tracking Attentional and Cognitive Load While Reading AI-Assisted News [10.1] 1行の開示により、固定期間が大幅に増加し、ササード数が増加した。
詳細な開示は追加の負担を課すことはなかった。
インタビューの洞察は、これらの発見を文脈化し、詳細または詳細をオンデマンドに設計することを強く好みます。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:01:55 GMT)
One Pass Is Not Enough: Recursive Latent Refinement for Generative Models [10.0] 我々は、精度とリコールがFIDにとって不可欠な補完であると論じている。
スタイルベースジェネレータの単一パスラテントマッピングを反復的精錬プロセスで置き換えるRTMを導入する。
本稿では,RTMが現在の最先端手法の中で最高の精度とリコールを実現していることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:22:44 GMT)
Non-linear Interventions on Large Language Models [9.9] 非直線的特徴に自然に拡張される介入の一般的な定式化を導入する。
我々はリファレンス・バイパスステアリング(refusal bypass steering)の枠組みを検証し、リファレンスを規定する非線形特徴に介入することにより、リファレンスベースラインよりも正確にモデルをステアリングする。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:14:42 GMT)
Web Agents Should Adopt the Plan-Then-Execute Paradigm [9.9] 我々は、WebエージェントがデフォルトでReActではなく plan-then-executeにすべきであると主張している。
信頼できないデータは、事前に定義された実行グラフ内の値やブランチに影響を与える可能性がある。
我々は、Web上でプラン-then-executeを採用する上での主要な障壁を特定します。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:48:57 GMT)
VMU-Diff: A Coarse-to-fine Multi-source Data Fusion Framework for Precipitation Nowcasting [9.7] 既存の手法は、決定論的または確率論的モデルを構築するために、単一ソースのレーダーデータに依存している。
本稿では,新しい粗大な視覚マンバUnetと残留拡散(VMU-Diff)に基づく降水処理フレームワークを提案する。
SWANデータセットを用いた実験により,最先端手法による手法の改良が実証された。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:05:30 GMT)
Exploring Vision-Language Models for Online Signature Verification: A Zero-Shot Capability Study [9.6] 本研究は、最先端ビジョンランゲージモデル(VLM)のゼロショット性能を評価する探索的研究である。
本稿では,ロバストなバイオメトリックスコアを計算するために,潜在トークン確率を抽出するスコアリングプロトコルを提案する。
ランダムな偽造のシナリオでは、ゼロショットのVLMは例外的な差別を達成し、GPT-5.2はモバイルタスクで0.32%の誤り率に達する。
熟練した偽造のシナリオでは、両方のシグネチャがほぼ同じであり、結果は著しく悪化し、クリティカルな"Rationalization Trap"が現れるため、タスクがより難しい。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:53:28 GMT)
On Strong Equivalence Notions in Logic Programming and Abstract Argumentation [9.5] 知識ベース間の強い等価性は、推論結果に影響を与えることなく、一方を他方に置き換える可能性を保証する。
これは非単調な形式論において重要な性質である。
論理プログラムに強い等価性という新しい概念を導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:45:37 GMT)
TOPOS: High-Fidelity and Efficient Industry-Grade 3D Head Generation [9.5] 高忠実度3Dヘッドジェネレーションは、映画、アニメーション、ビデオゲーム産業において重要な役割を担っている。
本稿では,単一画像条件付き3次元ヘッド生成に適したフレームワークであるTOPOSを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:02:32 GMT)
A Unified Non-Parametric and Interpretable Point Cloud Analysis via t-FCW Graph Representation [9.5] 本稿では,点雲を計量空間に埋め込むために,T-FCW(Fully Connected Weighted)グラフ表現を導入した。
本稿では,t-FCWを有効にするための特性を分析し,t-FCWを特徴抽出器としてのみ利用するネットワークを設計する。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:30:27 GMT)
Worst-Case Sample Complexity Bounds for Distributed Inner Product Estimation with Local Randomized Measurements [9.3] 独立な単一量子ビットのパウリ影が最悪の場合$mathcalO(sqrt7.5n)$ for large $n$を持つことを示す。
また、独立な単一量子ビットのパウリ影がいくつかの重要な状態のクラスに対して$mathcalO(sqrt3.6n)$の最悪のスケールを持つことを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:48:14 GMT)
Model Checking Matrix Product States against Linear Chain Logic [9.2] マトリックス積状態(英: Matrix product state、MPS)は、1次元量子多体系の基底状態に対する標準テンソルネットワーク表現である。
物理的多体状態のエンフェス空間とエンフェスサイズに依存した特性を体系的に検証するフレームワークは、いまだに存在しない。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:33:59 GMT)
CHASM: Cross-frequency Harmonized Axis-Separable Mixing for Spectral Token Operators [9.1] CHASMは、周波数周波数のハーモナイズド軸分離ミキサーである。
共有基底演算子ファミリーの構造解析を行い、制御された同バックボーン比較によりCHASMを評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:54:12 GMT)
Stop Overthinking: Unlocking Efficient Listwise Reranking with Minimal Reasoning [9.1] 推論長とランキング品質の関係について検討する。
長さ正規化自己蒸留フレームワークを提案する。
提案手法は,異なる検索環境において,推論トークンの消費量を34%~37%削減しつつ,教師の有効性を維持する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:44:44 GMT)
Data-Augmented Game Starts for Accelerating Self-Play Exploration in Imperfect Information Games [9.1] StarCraft、Dota、CounterStrikeのような大規模な不完全情報競合ゲームに対する近似平衡は、計算的に不可能である。
本稿では,オンライン探索の大幅な高速化を目的としたマルチエージェント起動状態サンプリング戦略を提案する。
我々は,不完全な情報ゲームにおける開始状態分布の増大が,偏りを生じさせることを示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:00:52 GMT)
Breaking the Reward Barrier: Accelerating Tree-of-Thought Reasoning via Speculative Exploration [9.1] Tree-of-Thought (ToT)推論構造 大規模言語モデル(LLM)推論は木に基づく探索である。
ToTの効率は報酬依存性障壁によって制約される。
ToTの高電位分岐を予測・拡張するための投機的経路選択を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:42:56 GMT)
DRL-STAF: A Deep Reinforcement Learning Framework for State-Aware Forecasting of Complex Multivariate Hidden Markov Processes [9.0] DRL-STAF(Deep Reinforcement Learning based STate-Aware Forecasting framework)を提案する。
具体的には、DRL-STAFはディープニューラルネットワークを用いて複雑な非線形放出をモデル化し、強化学習を用いて離散的な隠れ状態を推定する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:44:11 GMT)
A Mutual Information Lower Bound for Multimodal Regression Active Learning [9.0] Mutual Information Lower Bound (MI-LB) は、Mixture Network アンサンブルのクローズドフォーム近似である。
我々は,MI-LBがマルチモーダルシステムを備えたベンチマークで評価されたベースラインのすべてに一致または打ち勝つことを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:50:47 GMT)
Validated Hypotheses as a Lens for Human-Likeness Evaluation in AI Agents [9.0] 我々は、このレンズをHumanStudy-Benchというオープンなプラットフォームを通じて操作し、公開されている人物体の研究を再利用可能なシミュレーション環境に変える。
独立複製により仮説をしっかりと確立した12種類の研究の初期のスイートをキュレートし, エージェント設計を4つのモデルで評価した。
エージェント設計はモデルスケールよりもアライメントに影響を及ぼすが,その効果はモノトニックではない。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:25:02 GMT)
A Unified Knowledge Embedded Reinforcement Learning-based Framework for Generalized Capacitated Vehicle Routing Problems [9.0] Capacitated Vehicle Routing Problem (CVRP) は、物流や輸送における幅広い応用において基本的なNPハード問題である。
最近の強化学習アプローチは最適化の可能性を示しているが、それらはエンドツーエンドの学習に依存しており、明確な問題解決の知識がない。
本稿では,ルートファーストクラスタ・セカンダス問題に触発された知識組み込みフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:05:22 GMT)
From Text to Voice: A Reproducible and Verifiable Framework for Evaluating Tool Calling LLM Agents [8.9] 検証されたテキストのベンチマークを、制御された音声ベースのツールコール評価に変換できるかどうかを検討する。
我々のデータセットに依存しないフレームワークは、テキスト音声、話者変動、環境騒音を利用してペア化されたテキストオーディオインスタンスを作成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:22:42 GMT)
Persian MusicGen: A Large-Scale Dataset and Culturally-Aware Generative Model for Persian Music [8.7] 私たちは、900時間以上の高品質なオーディオサンプルを含むペルシアの歌の最初の大規模なデータセットをキュレートしました。
このデータセットはペルシア音楽の豊かな旋律と文化の多様性を捉えている。
我々はMusicGenをこの領域に適応させ、主観的および客観的なメトリクスを利用してそのパフォーマンスを評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:31:46 GMT)
PACER: Acyclic Causal Discovery from Large-Scale Interventional Data [8.7] PACERは、建設による非循環を保証する因果発見のためのスケーラブルなフレームワークである。
観測データと介入データの統一的処理を支援する。
タンパク質シグナリングと大規模な遺伝的摂動ベンチマークの最先端の手法を一致または超える。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:26:53 GMT)
On the Burden of Achieving Fairness in Conformal Prediction [8.7] プールキャリブレーションは、群間量子的不均一性によって設定されたスケールにおいて、既約群ワイドカバレッジ歪みを生じさせることを示す。
グループを別々に扱うか、あるいはプールするポリシー間の移動コストを定量化します。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:02:06 GMT)
DiscoExplorer: An Open Interface for the Study of Multilingual Discourse Relations [8.6] 理由 (A because B) や譲歩 (A although B) のような言論における命題を結びつける関係は、計算言語学やプラグマティクスへの強い関心の対象である。
データセット間での談話関係の在庫の標準化の最近の進歩は、そのような研究を促進する可能性を秘めているが、関連するデータの複雑さと、それを分析するための容易にアクセス可能なインターフェースの欠如によって妨げられている。
本稿では,ローカルコンピュータ上で動作可能な新しいオープンソースWebインターフェースであるDiscoExplorerについて紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:17:40 GMT)
Constitutional Governance in Metric Spaces [8.6] 計算的社会的選択と決定論は、豊富な集約理論を提供するが、平等主義的自己統治のための包括的なプロセスは提供しない。
ここでは、メートル法空間における立憲ガバナンスを提案し、熟考、修正、コンセンサスを統合する。
我々は、一般化された中央値の有用性に注目し、過半数のしきい値に誤った報告がないことを証明し、最適なピークと制約なしの最適値の間の妥協ギャップについて研究する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:12:56 GMT)
A Picture is Worth a Thousand Words? An Empirical Study of Aggregation Strategies for Visual Financial Document Retrieval [8.6] Visual RAGは文書をイメージとして扱い、視覚パッチトークンを取得するために視覚エンコーダを使用する。
文書ごとに数百のパッチトークンが、ベクトルデータベースにおける検索とストレージの課題を生み出します。
単一ベクターアグリゲーションは、財務文書の重要な情報を失うのか?
論文参考訳(メタデータ) (Thu, 14 May 2026 08:53:40 GMT)
ASH: Agents that Self-Hone via Embodied Learning [8.5] ASHは、未ラベルでノイズの多いインターネットビデオから具体的ポリシーを学ぶエージェントシステムである。
ASHは教師なし学習を使用して、大規模なインターネットビデオから重要な瞬間を識別し、長期記憶として保持する。
ターンベースのRPGであるPokemon Emeraldと、リアルタイムアクションアドベンチャーゲームであるThe Legend of Zelda: The Minish Capである。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:10:12 GMT)
From Sycophantic Consensus to Pluralistic Repair: Why AI Alignment Must Surface Disagreement [8.5] 我々はアグリゲーションのみがデプロイされた多重性アライメントの不完全なプリミティブであると主張する。
我々は,原則的修正と降伏を区別する指標であるPRS(Pluralistic repair Score)を定式化した。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:47:06 GMT)
Cross-Linguistic Transcription and Phonological Representation in the Huìtóngguǎnxì Huáyíyìyǔ [8.5] この研究は、Hutnggunx Huyy (HHY) を中国語による非中国語の音声形態を表すコヒーレントな多言語転写システムとして扱う。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:21:18 GMT)
KVCapsule: Efficient Sequential KV Cache Compression for Vision-Language Models with Asymmetric Redundancy [8.2] VLM(Vision-Language Models)は、LLM(Large Language Models)の重要かつ急速に成長する拡張として登場した。
視覚トークンのための新しいKVキャッシュ圧縮フレームワークであるKVCapsuleを提案する。
圧縮率の60%でTPSの最大2倍、KVキャッシュメモリの2.4倍の削減を実現し、精度や応答品質の劣化を無視できることを示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:01:58 GMT)
FuzzAgent: Multi-Agent System for Evolutionary Library Fuzzing [8.1] ライブラリファジィングはソフトウェアサプライチェーンの強化に不可欠だが、大規模に採用するコストは高い。
本稿では,図書館ファジィングを進化過程に変換するマルチエージェントシステムFuzzAgentを紹介する。
実世界の20のC/C++ライブラリ上で4つの最先端ベースラインに対してFuzzAgentを評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:21:33 GMT)
Efficient Generative Retrieval for E-commerce Search with Semantic Cluster IDs and Expert-Guided RL [8.0] 生成検索は、断片化された多段階検索プロセスを単一のエンドツーエンドモデルに統一することで、有望な代替手段を提供する。
本稿では,実世界のリコールシナリオに適した検索フレームワークを提案し,生成的検索をエンド・ツー・エンドの置き換えではなく,リコール・ステージ・サプリメントとして位置付ける。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:27:46 GMT)
Mitigating Mask Prior Drift and Positional Attention Collapse in Large Diffusion Vision-Language Models [8.0] LDVLMは反復的な生成と劣化した視覚的接地に悩まされている。
本研究では,Mask Prior Suppression と Monotonic RoPE Scaling を導入したトレーニングフリーアプローチを提案する。
以上の結果から,これらの障害は軽量なプラグアンドプレイ戦略によって効果的に対処できることが示唆された。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:11:32 GMT)
Tradeoffs are Domain Dependent: Improving Accuracy and Fairness in Property Tax Assessments [7.9] アルゴリズム的公正性の研究は、しばしば公正性と正確性の間のトレードオフを仮定する。しかしながら、このトレードオフは普遍的ではないかもしれない。
この仮定を米国資産税評価の文脈で検証する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:20:32 GMT)
Not All Timesteps Matter Equally: Selective Alignment Knowledge Distillation for Spiking Neural Networks [7.8] スパイキングニューラルネットワーク(SNN)は高エネルギー効率を実現する。
SNNと人工ニューラルネットワーク(ANN)のパフォーマンスギャップは依然として残っている。
知識蒸留(KD)は一般的にSNNの性能を向上させるために用いられる。
クラスレベルの知識と時間的知識を選択的に整合させるセレクティブアライメント知識蒸留(SeAl-KD)を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:39:14 GMT)
Implicit spatial-frequency fusion of hyperspectral and lidar data via kolmogorov-arnold networks [7.8] ハイパースペクトル画像(HSI)分類は、スペクトルのあいまいさ、空間的不均一性、材料特性と構造との強い結合により複雑な場面で困難である。
ほとんどのHSI-LiDAR融合法は、固定活性化関数と線形重みを持つCNNや幾何に依存している。
本稿では、高スペクトルとLiDARの特徴間の高非線形関係を適応的にキャプチャするIFGNet(Indicit Frequency-Geometry Fusion Network)を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:12:12 GMT)
Advancing Direct Training for Spiking Neural Networks with Circulate-Firing Neurons and Learnable Gradients [7.8] スパイキングニューラルネットワーク(SNN)は、有望なエネルギー効率特性を持つが、Artificial Neural Networks(ANN)と比較して大きなパフォーマンスギャップが持続する。
まず, 膜電位をより効果的に活用し, 情報表現能力を向上する循環振動ニューロンモデル, 後処理時の正確な勾配推定を可能にする時間段階学習型サロゲート勾配関数, および正負平衡損失関数を用いて, 正負の膜電位と負の膜電位の平衡を達成し, さらにSNN性能を向上する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:19:14 GMT)
Natural Synthesis: Outperforming Reactive Synthesis Tools with Large Reasoning Models [7.8] リアクティブ合成は論理仕様からハードウェア回路を自動構築する問題である。
本稿では, モデルチェッカーと大規模推論モデルを結合した反応合成へのニューロシンボリックアプローチを提案する。
仕様面では、仕様タスクを時間論理から自然言語にシフトする自動形式化ステップを導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:39:58 GMT)
Documentation-Guided Agentic Codebase Migration from C to Rust [7.8] RustPrintは、C-to-Rustマイグレーションのためのドキュメント誘導フレームワークである。
モジュール構造、データフロー、API、設計根拠をキャプチャします。
ソーステストスイートを翻訳して実行することにより、実行時の障害がターゲットとする修正をガイドすることができる。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:46:50 GMT)
Computational Thinking Development in AI Agent Creation_A Mixed-Methods Study [7.7] 本研究では,CocoFlowを用いた5日間のAIエージェント作成ワークショップにおいて,93人の高校生を対象に,計算的思考の発達について検討した。
その結果,抽象的思考とアルゴリズム的思考の大幅な改善が示された。
初等CT値が中等度であった学生は,高CT,低CTともに有意な上昇を示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:48:08 GMT)
Beyond Bounded Variance: Variance-Reduced Normalized Methods for Nonconvex Optimization under Blum-Gladyshev Noise [7.7] 我々は,Blum-Gladyshev(mathsfBG$-0)ノイズモデルの下での非線形最適化について検討した。
モーメント付き正規化勾配降下は、勾配毎のパラメータを1つだけ使い、複雑さが$O(varepsilon-6)$で$mathsfBG$-0ノイズの下に収束することを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:27:49 GMT)
Timing Jitter Induced by Stochastic Baseline Fluctuations in High-Count-Rate Superconducting Nanowire Single-Photon Detectors [7.6] SNSPDシステムにおいて,有限メモリの読み出しダイナミクスから生じるベースライン変動が,時間ジッタの固有源となることを示す。
我々は,光子統計,読み出し力学,タイミングジッタを結合するフレームワークを開発した。
本研究は,高頻度演算における時間分解能を制限する基本メカニズムとして,ベースラインダイナミクスを同定した。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:27:05 GMT)
Predict-then-Diffuse: Adaptive Response Length for Compute-Budgeted Inference in Diffusion LLMs [7.6] 拡散に基づく大規模言語モデル(D-LLM)は、生成AIにおける有望なフロンティアである。
提案するPredict-then-Diffuseは,入力クエリ毎の計算予算推論を可能にするモデルに依存しないフレームワークである。
そこで,Predict-then-DiffuseはデフォルトのD-LLM推論機構と比較して計算コスト(FLOP)を大幅に削減することを示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:09:46 GMT)
LATERN: Test-Time Context-Aware Explainable Video Anomaly Detection [7.6] 視覚言語モデル(VLM)は、ビデオ異常検出(VAD)のための有望なパラダイムとして登場した。
本稿では,トークンの制約や理性から独立してセグメントレベルの推論を行うパイプラインの鍵となる制限に,時間的コンテキストを構造化せずに対処することを目的とする。
本稿では,VADを時間的証拠収集プロセスとして再構成したLATERNというコンテキスト認識フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:48:03 GMT)
PROCESS-2: A Benchmark Speech Corpus for Early Cognitive Impairment Detection [7.6] Process-2は,自発音声とタスク指向音声から認知障害の自動評価を支援するために設計された大規模音声データセットである。
データセットは、CognoMemoryデジタルアセスメントプラットフォームを使用して収集された200の健康的なコントロール、150の軽度認知障害、50の認知症診断から作成されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:33:43 GMT)
AIMing for Standardised Explainability Evaluation in GNNs: A Framework and Case Study on Graph Kernel Networks [7.5] グラフニューラルネットワーク(GNN)はグラフ構造化データの処理において大きく進歩しているが、説明可能性を評価するための包括的なフレームワークはいまだに不足している。
AIMは、精度、インスタンスレベルの説明、モデルレベルの説明を計測することで、これらの制限に対処する包括的なフレームワークである。
本稿では,AIMから得られた知見を用いて,改良された説明可能性を示しながら高い精度を維持する更新モデルであるxGKNを開発する方法について述べる。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:28:24 GMT)
Not All Symbols Are Equal: Importance-Aware Constellation Design for Semantic Communication [7.5] 既存のアプローチでは、コンステレーションの設計とセマンティックエンコーディングを分離し、重要なシンボルをチャネルエラーに無関係のものと同じ速度で露呈する。
本稿では,潜在概念を抽出するベクトル量子化変分自動エンコーダからなる,共同意味物理層フレームワークを提案する。
物理層において、学習された意味認識M-QAMコンステレーションは、共同共起統計とSCIスコアに基づいてシンボル位置を割り当てる。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:15:57 GMT)
Evolutionary Ensemble of Agents [7.5] EvEは、分散化されたフレームワークであり、アルゴリズム発見のためのライブで共進化するシステムにコーディングエージェントを編成する。
2つの共進化する人口を維持することで、EvEはエージェントを同期レースを通じて評価し、経験的Elo格付けを更新する。
固定初期エージェントや凍結した「ベスト進化」エージェントによって駆動される変種と比較して、EvEは位相ミスマッチを独自に回避する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:16:24 GMT)
Before the Body Moves: Learning Anticipatory Joint Intent for Language-Conditioned Humanoid Control [7.5] 我々は,言語生成とクローズドループ制御の予測的結合インテントインタフェースを学習する階層的なフレームワークである textbfDAJI を提案する。
実験の結果,DAJIは予測潜在学習,単命令生成,ストリーミング指導などにおいて,強い結果が得られた。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:05:24 GMT)
Probabilistic Verification of Recurrent Neural Networks for Single and Multi-Agent Reinforcement Learning [7.3] 既存の検証ツールは、制約のあるモデリングの前提や隠れた状態空間の過剰な近似に依存している。
我々は、$textbfRNN$ $textbfPro$babilistic $textbfVe$rification ($texttRNN-ProVe$)という確率的フレームワークを提案します。
部分的に観察可能な単一エージェントと協調的なマルチエージェントタスクの実験は、$texttRNN-ProVe$がより定量的であることを示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:22:54 GMT)
CrystalReasoner: Reasoning and RL for Property-Conditioned Crystal Structure Generation [7.3] 自然言語命令から結晶構造を生成するエンドツーエンドのLCMフレームワークであるCrystalReasonerを提案する。
方法は、結晶対称性、局所的な調整環境を含む思考トークンとして、物理的に先入観を導入する。
次に、多目的で高密度な報酬関数を持つ強化学習(RL)を用いて、生成を物理的妥当性、化学的整合性、熱力学的安定性に整合させる。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:08:51 GMT)
LeanSearch v2: Global Premise Retrieval for Lean 4 Theorem Proving [7.3] リーン4の定理を証明するには、しばしば、簡潔な証明を可能にするライブラリの補題の散在を識別する必要がある。
本稿では,このタスクのための2モード検索システムであるLeanSearch v2を紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:15:13 GMT)
Minimal-Intervention KV Retention: A Design-Space Study and a Diversity-Penalty Survivor [7.2] 小さな予算でのKVキャッシュ圧縮は、キャッシュ表現、ヘッドワイドルーティング、圧縮ケイデンス、デコード動作、予算内スコアリングにまたがる複雑な設計空間である。
本稿では,TriAttentioncitemao2026triattention Retention scorerの1機能的変更を提案する。
事前登録されたプロトコルは、凍結した開発スプリットで$をチューニングし、非結合のホールトアウトスプリットで$ = 0.5$、$$$は4つのうち2つでBonferroniをクリアする。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:50:20 GMT)
Does RAG Know When Retrieval Is Wrong? Diagnosing Context Compliance under Knowledge Conflict [7.1] コンテキスト駆動分解(CDD)は、推論時に動作し、制御された検索競合の介入メカニズムとして機能する信念分解プローブである。
これら3つのパターンは、標準的なRAGを調査し介入できる構造軸としてコンテキスト準拠を識別する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:14:19 GMT)
Local Spatiotemporal Convolutional Network for Robust Gait Recognition [7.1] 歩行認識は、個人を独自の歩行パターンで識別する有望な生体計測技術である。
既存のアプローチは、個々のシルエットフレームから抽出された静的な外観特徴、複雑なシーケンシャルモデルのいずれかに依存している。
本稿では,従来の2次元畳み込みネットワークに時間的情報を抽出する能力を持たせた,構造的にシンプルで高効率なデュアルブランチアーキテクチャLSTCNを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:28:49 GMT)
Analyzing Codes of Conduct for Online Safety in Video Games at Scale [7.0] オンラインビデオゲームは、ハラスメント、差別、不適切なコンテンツ、プライバシー侵害、不正行為など、幅広いオンライン被害にさらされている。
ゲーム会社は、オンラインの安全ルールを規定し、プレイヤーを安全資源に誘導する行動規範(CoC)を発行している。
CoCsがどの程度普及しているか、どの安全、セキュリティ、プライバシーに違反しているか、そして規制や業界の期待に応えているかどうかは不明だ。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:39:46 GMT)
MultiEmo-Bench: Multi-label Visual Emotion Analysis for Multi-modal Large Language Models [6.9] 視覚的感情分析のための新しいベンチマークデータセットを提案する。
私たちはイメージごとに20ドルのアノテーションを雇い、イメージから感じるすべての感情を選択するように頼んでいます。
得られたデータセットには、10,344ドルの画像と、8つの感情にまたがる236,998ドルの有効票が含まれている。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:49:32 GMT)
Separating Intrinsic Ambiguity from Estimation Uncertainty in Deep Generative Models for Linear Inverse Problems [6.9] 深部生成モデルは、医学画像や科学的発見における逆問題に使われてきた。
後続の不確実性は、フォワード演算子に固有の曖昧さと推論によって伝播する不確実性を混合できるため、解釈が困難である。
内在的曖昧さを分離する後方不確実性の構造的分解を導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:45:19 GMT)
Due Process on Hold: A Queueing Framework for Improving Access in SNAP [6.8] アメリカ社会安全網は大規模に重要なサービスを提供しているが、アクセスの負担は持続している。
ホームズ対コーネル事件では、ミズーリ州のSNAPコールセンターが混雑しており、申請のほぼ半分が手続き的だった。
本稿では,アクセスの評価と改善を目的とした待ち行列モデルに基づく性能評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:54:43 GMT)
Not All RAGs Are Created Equal: A Component-Wise Empirical Study for Software Engineering Tasks [6.8] Retrieval-Augmented Generation (RAG) は、ソフトウェアアーティファクトのLarge Language Models (LLM) に採用されている。
本稿では,RAGパイプラインを識別する包括的,コンポーネントワイドな実証的研究について述べる。
本研究は,4つのクエリ処理手法,疎度・密度・ハイブリッドパラダイムにまたがる7つの検索モデル,4つのコンテキスト改善手法,および6つの異なるジェネレータを系統的に分離・評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:47:44 GMT)
Distance-Matrix Wasserstein Statistics for Scalable Gromov--Wasserstein Learning [6.8] グロモフ-ワッサー(Gromov--Wasser、GW)距離は、内部境界を通して、形状、点雲を比較する。
我々はDMWがGW-Dギャップの緩和と低い不等式であることを証明した。
スケーラブルなベンチマークではスライスとマルチスケールのカーネルを導入します。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:45:48 GMT)
SimPersona: Learning Discrete Buyer Personas from Raw Clickstreams for Grounded E-Commerce Agents [6.7] SimPersonaは、歴史的トラフィックから個別のバイヤータイプを学習し、コンパクトなペルソナトークンとしてLLMベースのWebエージェントに公開する新しいフレームワークである。
SimPersonaは、実際の買い手とのコンバージョンレートのアライメントで78%を達成し、買い手の種類によって解釈可能な振る舞いの変化を示し、目標指向のショッピングタスクにおいて8倍のパラメータでベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:01:11 GMT)
Exploring Bottlenecks in VLM-LLM Navigation: How 3D Scene Understanding Capability Impacts Zero-Shot VLN [6.6] ゼロショットビジョン・アンド・ランゲージナビゲーション(VLN)は、データ収集コストの最小化と固有の一般化により、大きな注目を集めている。
現行の3D知覚モデルは、厳密な計算限界と、具体化されたナビゲーションによって要求されるリアルタイム効率と直接競合する、ピクセルレベルの精度を優先している。
本稿では,VLNの性能に及ぼす3次元シーン理解能力の影響を定量化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:12:05 GMT)
TeachAnything: A Multimodal Crowdsourcing Platform for Training Embodied AI Agents in Symmetrical Reality [6.6] シンメトリカルリアリティ(SR)は、エージェントが人間のような知性を取得することに対するより高い要求を課す、人間エージェント共存の将来のトレンドとして浮上している。
マルチモーダルなデモ信号を統合する3段階のデモパラダイムを提案する。
このパラダイムに基づいて,クラウドベースのクラウドソーシング型デモプラットフォームであるTeachAnythingを開発した。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:32:46 GMT)
Runtime-Structured Task Decomposition for Agentic Coding Systems [6.6] エージェントコーディングシステムは、ソフトウェア工学のタスクに大規模言語モデル(LLM)をますます利用している。
多くの既存のシステムは、タスクロジック、実行フロー、モノリシックプロンプト内の出力生成をエンコードしている。
本稿では,実行可能制御ロジックを通じてタスク分割と実行フローを管理するアーキテクチャアプローチである実行時構造化タスク分解を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:16:23 GMT)
Understanding Imbalanced Forgetting in Rehearsal-Based Class-Incremental Learning [6.5] ニューラルネットワークは、クラスインクリメンタルインバランス(CIL)の設定を忘れてしまう破滅的な問題に悩まされる。
この研究は、リハーサルにおける忘れ忘れとひどく忘れることを示している。
結果は1つの係数$の解釈をサポートし、相互作用をもっともらしいものとして忘れる。
発見は価値ある洞察を与え、不均衡を緩和するための方向性を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:55:07 GMT)
How Data Augmentation Shapes Neural Representations [6.5] 我々は、異なるデータ拡張戦略が、ニューラルネットワークの内部表現をどのように作り直すかを示す。
形状解析のツールを用いて、ネットワーク隠蔽表現を計量空間に埋め込む。
増大強度の増大は, この分野における軌道の発達に繋がることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:19:40 GMT)
Greedy or not, here I come: Language production under vocabulary constraints in humans and resource-rational models [6.4] 可変語彙制限下での質問に対するヒトの反応について検討し,最も制限的な単語は250語に過ぎなかった。
逐次モンテカルロ推定法を大規模言語モデルと比較した。
本研究は,リソース・レーショナル認知,心理言語学,L2コミュニケーション,言語障害に対する結果とそれらの広範な意味について論じる。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:45:02 GMT)
Trapping Attacker in Dilemma: Examining Internal Correlations and External Influences of Trigger for Defending GNN Backdoors [6.3] 提案するPRAETORIANは,有効なGNNバックドアの本質的な要求をターゲットとした,新たな防衛法である。
私たちのキーとなる観察は、被害者ノードの予測をひっくり返すには、被害者に大きな影響を与える必要があるということです。
評価全体では、PRAETORIANは平均攻撃成功率(ASR)を0.55%まで下げるが、精度は0.62%しか低下しない(CA)。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:35:31 GMT)
DeepLévy: Learning Heavy-Tailed Uncertainty in Highly Volatile Time Series [6.3] DeepLévyは、Lévyの安定分布の混合を学習するニューラルネットワークフレームワークである。
DeepLévyには、複数のLévyコンポーネント上でコンテキスト依存の重みとパラメータを適応的に学習する混合メカニズムが組み込まれている。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:33:07 GMT)
ToMAToMP: Robust and Multi-Parameter Topological Clustering [6.2] ToMAToMPは,理論的な保証とともに複数の関数を同時に処理できる最初のトポロジ的クラスタリング手法である。
ToMAToをグラフチューニングとは無関係にし、外れ値に対して堅牢にするために使用できることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:32:49 GMT)
FactorizedHMR: A Hybrid Framework for Video Human Mesh Recovery [6.2] HMR(Human Mesh Recovery)は基本的に曖昧である。
本稿では,これら2つの状態の異なる2段階のフレームワークであるFacterizedHMRを提案する。
FactorizedHMRは、カメラスペースとワールドスペースのベンチマークにおいて、強力なベースラインと競合し続けている。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:59:56 GMT)
Pretraining large language models with MXFP4 on Native FP4 Hardware [6.1] 我々は,前向きのアクティベーションやアクティベーション勾配が安定している場合でも,大規模言語モデルのフルパイプFP4トレーニングがしばしば分岐する理由を考察する。
その結果,FP4トレーニングの不安定性は,過度な直感性ではなく,敏感な勾配経路に沿った構造的マイクロスケーリング誤差によって引き起こされることがわかった。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:08:01 GMT)
Do Language Models Encode Knowledge of Linguistic Constraint Violations? [6.1] 大規模言語モデル (LLM) は言語的性能は高いが、これらの予測を生成するための内部メカニズムはいまだに不明である。
本研究では,LLMが言語制約違反の表現をパラメータ内にエンコードし,非文法的な文を処理する際に選択的に活性化されるという仮説を考察する。
本稿では,制約違反と良好な入力に対して優先的に活性化される特徴を特定するための感度スコアを導入し,潜在的な違反固有の特徴の教師なし検出を可能にする。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:07:27 GMT)
Chrono-Gymnasium: An Open-Source, Gymnasium-Compatible Distributed Simulation Framework [6.1] 我々は大規模コンピューティングクラスタにまたがって,Project Chronoの高忠実度マルチボディダイナミクスをスケールする分散コンピューティングフレームワークであるChrono-Gymnasiumを紹介した。
以上の結果から,Chrono-Gymnasiumは物理精度を犠牲にすることなく,高忠実度シミュレーションのウォールタイム時間を短縮し,複雑なロボットシステムの設計と制御のためのスケーラブルな経路を提供することがわかった。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:45:28 GMT)
Zero-Shot Goal Recognition with Large Language Models [6.0] 大規模言語モデルは、よく知られた計画領域における古典的なプランナーとほぼ一致している。
ゴール認識は、LLM強度によく適合する相補的帰納的タスクである。
本稿では,主要なPDDLベンチマーク上でのゴール認識として,フロンティアLCMのゼロショット評価を行う。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:56:06 GMT)
SceneForge: Structured World Supervision from 3D Interventions [6.0] マルチモーダル学習タスクは、編集、視点、シーンレベルの介入に対して一貫性のある監督を必要とする。
編集可能な3D世界状態から構造化された監視を生成する、介入駆動型フレームワークであるSceneForgeを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:38:00 GMT)
GQLA: Group-Query Latent Attention for Hardware-Adaptive Large Language Model Decoding [5.9] Group-Query Latent Attention (GQLA)はMulti-head Latent Attention (MLA)の最小限の変更である
Group-Query Latent Attention (GQLA)はMulti-head Latent Attention (MLA)の最小限の変更である
論文参考訳(メタデータ) (Thu, 14 May 2026 15:50:01 GMT)
Learning Developmental Scaffoldings to Guide Self-Organisation [5.9] 事前パターンと自己組織化プロセスの間に情報を分散させる方法について検討する。
我々の分析は、効果的な事前パターンは単に目標を近似するのではなく、収束を促進する方法で発達力学を偏見していることを示唆している。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:01:25 GMT)
Larkin-Ovchinnikov-Fulde-Ferrell state of spin polarized atomic Fermi superfluid on a spherical surface [5.7] このようなコンパクトな幾何学において、Larkin-Ovchinnikov-Fulde-Ferrell状態(LOFF)を特徴づける。
まず、BdG方程式からのスピン偏極フェルミ超流動の均一解が存在しない状態を示す位相図を構築した。
境界付近では、空間的に変調された順序パラメータと密度プロファイルを持つ様々なLOFF状態が、BdG方程式の収束解として生き残ることができる。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:48:19 GMT)
Think When Needed: Adaptive Reasoning-Driven Multimodal Embeddings with a Dual-LoRA Architecture [5.6] Think When Needed (TWN) は適応的推論を備えた統合マルチモーダル埋め込みフレームワークである。
これに基づいてアダプティブシンク機構は、自己教師付きルーティングゲートを使用して、入力毎にチェーン・オブ・シークレット(CoT)を生成するかどうかを決定する。
MMEB-V2の78タスクでは、TWNは最先端の埋め込み品質を達成し、既存の生成方法よりもはるかに効率的である。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:41:53 GMT)
Failure-Guided Fuzzing for Hybrid Quantum-Classical Programs [5.6] 本稿では、HQCプログラムにおける障害誘導ファジィリングについて検討する。
障害誘導型局所ファジィがランダムテストよりも改善の主要因であることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:27:32 GMT)
Curriculum Learning of Physics-Informed Neural Networks based on Spatial Correlation [5.6] 本研究では,空間的に分離されたサブリージョンを対象としたカリキュラム学習フレームワークを提案する。
これは、サブリージョンの観点からの困難に対処する最初の試みである。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:16:04 GMT)
Viverra: Text-to-Code with Guarantees [5.6] Viverraは、ユーザが生成したプログラムを理解するのを助けるために、生成したコードと一緒に、正式に認証されたアノテーションを自動的に生成するシステムである。
V Viverraは、認証されたアサーションで効率的にコードを生成することができ、これらのアサーションは、コード理解タスクにおけるユーザのパフォーマンスを改善する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:36:44 GMT)
D2-CDIG: Controlled Diffusion Remote Sensing Image Generation with Dual Priors of DEM and Cloud-Fog [5.5] 本稿では,拡散モデルとデュアルプライア制御機構を統合した新しいリモートセンシング画像生成フレームワークD2-CDIGを提案する。
D2-CDIGは、生成された画像内の地面の特徴と大気現象を正確に制御する。
セグメンテーションやエッジ検出に基づく従来の手法と比較して、D2-CDIGは画質、ディテールリッチネス、リアリズムを著しく改善した。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:41:46 GMT)
Slower Generalization, Faster Memorization: A Sweet Spot in Algorithmic Learning [5.5] グルーキングの臨界データサイズの説明は、筋金入り後の自然な直感を示唆している。
この直感は、制御された構造化出力タスクで失敗する可能性があることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:12:49 GMT)
Critic-Driven Voronoi-Quantization for Distilling Deep RL Policies to Explainable Models [5.4] 批判駆動型ボロノイ状態分割法(Critical-Driven Voronoi State Partitioning)と呼ばれる新しいモデルに依存しない手法を提案する。
原方針の批判的価値ネットワークを活用することで、我々は、価値の低い地域において、新しいサブポリスを導入する。
いくつかのよく知られたベンチマークにアプローチを検証し、この蒸留が線形関数の合理的な大きさの集合を用いて元の方針に近づくことを証明した。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:38:56 GMT)
Known By Their Actions: Fingerprinting LLM Browser Agents via UI Traces [5.4] エージェントのアクションとインタラクションのタイミングは、受動的JavaScriptトラッカーによってキャプチャされ、F1が最大96%の基盤モデルを特定するのに十分であることを示す。
私たちはハーネスとラベル付きエージェントトレースのコーパスをリリースします。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:55:19 GMT)
MASPrism: Lightweight Failure Attribution for Multi-Agent Systems Using Prefill-Stage Signals [5.3] 我々は,小言語モデル(SLM)のプリフィルステージ信号を用いて,障害帰属を行うフレームワークであるMASPrismを提案する。
MASPrismは各トレースを平均2.66秒で処理し、単一パスのプロンプトベースラインを6.69$times$スピードアップし、出力トークンをゼロにする。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:20:24 GMT)
A Calculus-Based Framework for Determining Vocabulary Size in End-to-End ASR [5.3] ハイブリッド自動音声認識システムでは、語彙サイズは、言語に含まれる電話、バイフォン、トリホンの数によって決定される。
対照的に、エンドツーエンドのASRシステムは、しばしば訓練に使用されるテキストコーパスからトークンと呼ばれる語彙から派生している。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:19:42 GMT)
Metis AI: The Overlooked Middle Zone Between AI-Native and World-Movers [5.2] 私たちは、完全にコンピュータ上で実行されるが信頼性の高いAI自動化に抵抗する、Metis AIと呼ばれるタスクのクラスを特定します。
これらのタスクは、組織的、社会的、規範的にアルゴリズム的アプローチを破る方法で絡み合っている。
我々は,Metis AIゾーンを定義する5つの構造的特徴として,連続的不可逆性,関係的不可逆性,規範的オープンテクスチャ,対逆的共進化,説明可能性アンカーを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:47:07 GMT)
Coding Agent Is Good As World Simulator [5.2] 本稿では,物理に基づく世界モデル構築のためのエージェントフレームワークを提案する。
このフレームワークは、計画、コード生成、ビジュアルレビュー、物理分析エージェントを調整する。
実験の結果,本フレームワークは,物理精度,命令忠実度,視覚的品質において,高度な映像ベースモデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:33:41 GMT)
Exploring Geographic Relative Space in Large Language Models through Activation Patching [5.1] 地理におけるLarge Language Models(LLM)の利用の増加は、これらのツールを幅広いプロセスや分析で統合することの安全性について、かなりの疑問を提起する。
本稿では, アクティベーション・パッチング(アクティベーション・パッチング)を用いて, LLMが相対的な地理的空間をどのように処理するかを考察する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:18:31 GMT)
EnergyLens: Predictive Energy-Aware Exploration for Multi-GPU LLM Inference Optimization [5.1] EnergyLensは、LLM(Energy-Aware Large Language Model)推論最適化のためのエンドツーエンドフレームワークである。
融合、並列性、計算通信の重複を含むLCM仕様を、負荷不均衡を意識したMoEモデリングと組み合わせて取得する。
テンソルパラレルおよびエキスパートパラレル構成におけるLlama3およびQwen3-MoE上のEnergyLensを検証する。
我々のエネルギー駆動探査では、プリフィルとデコードで構成されたエネルギーの最大1.47倍と52.9倍のエネルギー変化が示され、分散サービスへの動機付けがなされている。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:37:26 GMT)
Training on Documents About Monitoring Leads to CoT Obfuscation [5.0] CoT(Chain-of- Thought)モニタリングは、モデル動作を検知する最も有望なツールの1つである。
本研究では,モニタ対応モデルが検出を回避できるかどうかを考察する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:01 GMT)
Prompt Segmentation and Annotation Optimisation: Controlling LLM Behaviour via Optimised Segment-Level Annotations [4.9] 本稿では、制御性と効率性を改善するために、構造化されたプロンプト最適化フレームワークであるPrompt and optimisation (PSAO)を紹介する。
PSAOは、プロンプトを解釈可能なセグメント(例:文)に分解し、それぞれが可読なアノテーションで拡張する。
これらのアノテーションは、大きな言語モデル(LLM)に焦点を割り当て、応答生成時の混乱を明確にする。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:33:47 GMT)
Sharp Bounds on the Eigenvalues of Kikuchi Graphs and Applications to Quantum Max Cut [4.8] レベル$k$菊池グラフのラプラシアンの最大固有値が$m$エッジを持つ任意のグラフ$G$は、最大$m+k$であることを示す。
また、ブローワー予想を緩やかに前進させ、グラフラプラシアンのトップ-$k$固有値の和上のルーの有界性を改善する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:56:29 GMT)
Self-Regulated Learning in Essay Writing: Consistency of Strategies and Impact on Outcomes [4.7] 効果的な自己制御学習(SRL)の能力は生涯学習において重要である。
本研究の目的は,オンラインエッセイ執筆中に中学生がSRL戦略をどのように実行したかを検討することである。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:45:11 GMT)
In-Context Learning for Data-Driven Censored Inventory Control [4.6] 我々は、検閲または繰り返しニュースベンダ(R-NV)に着目して、意思決定依存の検閲による在庫管理について研究する。
パラメトリックトンプソンサンプリング(TS)に基づく既存のアプローチは、事前のミスマッチの下で脆くすることができる。
In-context Generative rear sample (ICGPS) を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:45:20 GMT)
Text Knows What, Tables Know When: Clinical Timeline Reconstruction via Retrieval-Augmented Multimodal Alignment [4.4] 本稿では,テキストから抽出した絶対的臨床タイムラインの時間的精度を向上させるために,検索強化型マルチモーダルアライメントフレームワークを提案する。
提案手法は,グラフベースのマルチステッププロセスとしてタイムライン再構成を定式化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:55:27 GMT)
Focused PU learning from imbalanced data [4.3] 病気の遺伝子識別、ターゲットマーケティング、不正検出、レコメンダシステムといった現実世界の多くの問題は、機械学習の手法では対処が難しい。
高い不均衡なデータセットにおいて、正およびラベルなし(PU)の例から学習する新しい方法を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:01:57 GMT)
Vision-Core Guided Contrastive Learning for Balanced Multi-modal Prognosis Prediction of Stroke [4.3] 本稿では,虚血性脳梗塞に対する新しい3モーダル融合モデルを提案する。
脳MRIから半構造化診断テキストを自動的に生成するために,Large Language Model (LLM) を用いる。
また、ビジョンコンディションドデュアルアライメント・フュージョンモジュールと呼ばれるコアコンポーネントを設計する。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:28:57 GMT)
Leveraging Speech to Identify Signatures of Insight and Transfer in Problem Solving [4.2] 我々は参加者に対して,5つの「マッチスティック・アジュメティクス」問題の連続を解こうとするときに,声高に考えるように求めた。
その結果、同じ参加者は異なる参加者よりも急速に改善した。
彼らは、自分たちが取り組んでいる問題を自発的に分類する傾向があった。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:46:25 GMT)
Assistance to Autonomy: A Systematic Literature Review of Agentic AI across the Software Development Life Cycle [4.2] 本研究は,ソフトウェア製品開発におけるエージェントシステムに関する現在の文献の包括的評価に寄与する。
また、高ボリュームSLRドメインのスクリーニングフェーズを自動化するためのAI支援ツールの形式での方法論的なコントリビューションも提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:46:51 GMT)
Agentic AI in Industry: Adoption Level and Deployment Barriers [4.2] 本研究は、現在12社のエージェントAI採用状況の特徴である。
レベル1(AIアシスタント)7社、レベル2(AI補償)4社、レベル3(Multi-Agent Orchestration)1社
論文参考訳(メタデータ) (Thu, 14 May 2026 10:34:59 GMT)
When Retrieval Hurts Code Completion: A Diagnostic Study of Stale Repository Context [4.2] Retrievalの拡張されたコード生成は、クロスファイルリポジトリのコンテキストに依存するが、検索されたスニペットは、時代遅れのプロジェクト状態から来る可能性がある。
時間的に古いリポジトリスニペットが無害なノイズとして振る舞うか、あるいは現在非互換なコードを積極的に誘導するかを検討する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:18:30 GMT)
Unbiased and Second-Order-Free Training for High-Dimensional PDEs [4.2] 逆微分方程式(BSDEs)に基づく深層学習法は、物理インフォームドニューラルネットワーク(PINN)の競合代替として登場した。
本稿では,EM誘起損失バイアスの原理解析を行い,バイアスのない2次自由トレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:59:13 GMT)
SEDiT: Mask-Free Video Subtitle Erasure via One-step Diffusion Transformer [4.2] 一段階拡散変換器を用いた一段ビデオ字幕消去手法SEDiTを提案する。
ターゲット字幕の直接消去を可能にするマスクフリー推論手法を提案する。
提案手法は,ワンステップ,チャンクワイドのストリーミング推論により,ネイティブな1440p動画を無限長で効率的に処理できる。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:37:54 GMT)
Position: Behavioural Assurance Cannot Verify the Safety Claims Governance Now Demands [4.1] 我々は、慎重に設計しても、行動保証は検証できないという安全主張を遂行するよう求められていると論じている。
我々は,この構造ミスマッチを監査ギャップ,要求と達成可能な検証アクセスのばらつきとして形式化し,脆弱な保証の概念を導入する。
本稿では,法的文書における行動証拠の重み付けと,機械的証拠クラスによる自発的な事前配備アクセスの延長という技術的転換を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:54:28 GMT)
The Great Pretender: A Stochasticity Problem in LLM Jailbreak [4.1] 攻撃評価だけでなく,攻撃発生時の敵意の影響についても検討した。
我々の評価フレームワークであるCAS-evalは、ジェイルブレイクプロンプトが複数の試みで成功する必要がある場合、攻撃が最大30ポイントのASR低下を達成できることを示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:05:37 GMT)
Discretizing Group-Convolutional Neural Networks for 3D Geometry in Feature Space [4.1] グループ畳み込みニューラルネットワーク(GCNN)は、ディープラーニングにおける帰納バイアスとして対称性を導入する上で最も重要な手法の一つである。
本稿では,特徴空間のサンプリングを提案し,幾何学的に密度の高いサンプルを特徴類似性によって選択された代表サンプルに置き換える。
我々の主な経験的発見は、粗い特徴空間サンプリングが、分類精度を著しく高く保っていることである。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:47:43 GMT)
A Resource-Driven Framework for Configurable Entanglement in Quantum Networks [4.0] 本稿では,マルチパーティ・エンタングルメントを,許容エンタングルメント・グラフ構成の空間を誘導するプログラム可能なリソースとして扱うフレームワークを提案する。
次に、誘導された構成空間上で動作する計測ベースのプロトコルとして、エンタングルメントローリングを定式化する。
資源変換におけるノイズの影響を特徴付ける閉形式ノイズマップを導出し,提案手法が関連するノイズプロセス下で信頼性の高い性能を維持することを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:26:00 GMT)
Small, Private Language Models as Teammates for Educational Assessment Design [4.0] ジェネレーティブAIは、例えば、Large Language Models (LLMs)を通じて、教育設計タスクをますますサポートしている。
小言語モデル(SLM)は、プライバシーとリソース制限に対処するローカルな代替手段として登場した。
我々は,評価問題設計のためのSLMを比較し,ブルームの分類レベル全体にわたる生成品質を評価し,専門家による評価に対するモデルに基づく判断を評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:15:48 GMT)
CaMeRL: Collision-Aware and Memory-Enhanced Reinforcement Learning for UAV Navigation in Multi-Scale Obstacle Environments [3.9] 本稿では,UAVナビゲーションのためのコリジョン対応・メモリ強化型強化学習フレームワークであるCaMeRLを提案する。
CaMeRLは、危険に敏感な深さキューを符号化し、きめ細かい障害物構造を保存し、小さな障害物に対する感度を向上させる。
超小型・超大型の障害物設定を含むマルチスケール障害物を用いたCaMeRLの評価を行った。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:22:40 GMT)
DT-Transformer: A Foundation Model for Disease Trajectory Prediction on a Real-world Health System [3.9] We developed DT-Transformer, a foundation model on 57.1M structured EHR entry over 1.7M patients from Mass General Brigham (MGB)。
次世代の予測では、AUCは896の疾患カテゴリーで0.871であり、AUC 0.5を超えている。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:45:04 GMT)
Extensive long-range magic in non-Abelian topological orders [3.9] 非アベリアトポロジカル秩序の低エネルギー状態には、長い距離を持つ広範な魔法が存在することを示す。
我々は、絡み合う領域の法則に従い、非自明な融合空間で励起をホストする状態は、広範囲の長距離魔法を示さなければならないと論じる。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:50:20 GMT)
MindGap: A Conversational AI Framework for Upstream Neuroplastic Intervention in Post-Traumatic Stress Disorder [3.9] 外傷後ストレス障害(PTSD)は、過反応性神経経路をコードする外傷性接触イベントである。
本稿では、PTSDのための構造化神経可塑性再生を提供するプライバシー保護オンデバイス会話型AIフレームワークであるMindGapを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:13:42 GMT)
Distill: Uncovering the True Intent behind Human-Robot Communication [3.9] 本稿では,人間とロボットのコミュニケーションインタフェースに対するDistillアプローチを提案する。
タスク仕様が与えられた場合、Distillは不要なステップを取り除き、個々のステップの背後にある意味を一般化し、ステップ間の制約の順序付けを緩和する。
我々はWebインターフェース上でDistillを実装し、クラウドソーシング調査を通じて、初期タスク仕様からユーザ意図を抽出し、洗練する能力を実証した。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:05:49 GMT)
Towards Label-Free Single-Cell Phenotyping Using Multi-Task Learning [3.8] 本稿では,ラベルフリー微分位相コントラスト(DPC)画像からWhite Blood Cell (WBC)分類と連続タンパク質発現レグレッションを共同で行う統合ディープラーニングフレームワークを提案する。
バークレー単細胞顕微鏡(BSCCM)と血液細胞画像ベンチマークの実験は、強い性能を示した。
これらの結果は, ラベルフリー単細胞イメージングによる, 低コストな血液学的プロファイリングの可能性を強調し, 蛍光染色を伴わない同時表現型同定と定量的バイオマーカー推定を可能にした。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:38:56 GMT)
Randomized Atomic Feature Models for Physics-Informed Identification of Dynamic Systems [3.8] ランダム化された安定原子の特徴に基づくシステム同定のためのフレームワークを提案する。
このフレームワークは、安定性マージン、モーダルローカライゼーション、DC-ゲインバウンダリ、単調性、通過性、相対度、セットリング時間目標、時間/周波数領域エラーバウンダリを符号化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:25:07 GMT)
Predicting Response to Neoadjuvant Chemotherapy in Ovarian Cancer from CT Baseline Using Multi-Loss Deep Learning [3.8] ネオアジュバント化学療法に対する非反応剤の早期同定は重要なアンメットの必要性である。
本研究は, 術前造影CTを用いた非侵襲的深層学習フレームワークを提案する。
訓練は、分類損失と教師付きコントラスト正則化とハードネガティブマイニングを組み合わせることで、曖昧な応答者と非応答者の分離を改善する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:53:57 GMT)
AIM-DDI: A Model-Agnostic Multimodal Integration Module for Drug-Drug Interaction Prediction [3.7] AIM-DDIはアーキテクチャに依存しないマルチモーダル統合モジュールで、異質なモダリティ情報を共有潜在空間のトークンとして表現する。
AIM-DDIは、統一された融合モジュールを通じてモダリティトークン間の依存関係をモデル化することにより、構造的、化学的、意味的な薬物信号のモデルに依存しない統合を可能にする。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:42:22 GMT)
Forgetting That Sticks: Quantization-Permanent Unlearning via Circuit Attribution [3.7] 量子化を乗り越える手法はモデルにほとんど変化しないが, 圧縮条件下では, 有意義な忘れ方を実現するための勾配に基づく手法を示す。
因果回路の属性を組み合わせることで両モードを解消し,最小限の差分集合部分グラフを分離するMANSUを提案する。
さらに,構造的消去と行動抑制を区別する機構的検証尺度であるCircuit Attribution Divergence(CAD)を導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:44:10 GMT)
LifeSentence: Language models can encode human life course trajectories from longitudinal panel data [3.7] LifeSentenceは、縦パネルデータで大きな言語モデルをブリッジするライフコース推論のモデルである。
ドイツ社会経済パネルから約65,000人の個人を訓練した。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:28:41 GMT)
Don't Stop Me Yet: Sampling Loss Minima via Dissipative Riemannian Mechanics [3.6] ニューラルネットワーク損失関数の最小化のためのサンプリング器を提案する。
提案するサンプリング器であるDiMSは,最小レベルセットから正確にサンプリングできることが保証されている。
本研究では,ベイズ推定の不確実性を動機付け問題とみなし,これまでに提案した手法と比較して改善された性能を観察する。
論文参考訳(メタデータ) (Thu, 14 May 2026 22:41:01 GMT)
When Individually Calibrated Models Become Collectively Miscalibrated [3.6] 本研究では,個別に調整した予測器が戦略的に相互作用した場合に集団的に誤判定されることを示す。
正の相関関係を持つブライアスコアに基づくアグリゲーションでは、各エージェントの個別に最適なレポートは、正のクラス確率を体系的に過小評価する。
対照的に、VCGベースのアグリゲーションは、限界貢献に報いることでインセンティブを調整し、支配的な戦略的なインセンティブ互換性とほぼ最適のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:25:16 GMT)
Where to Perch in a Tree: Vision-Guidance for Tree-Grasping Drones [3.5] 本研究では,視覚誘導型自律型ツリーパーチドローンにおいて,樹上に理想的なパーチ位置を見つける方法を示す。
木の形態や構造を評価するために、機械学習など、さまざまな画像処理アルゴリズムが実装されている。
亜熱帯・温帯モンスーン気候下で2月から10月までに撮影された1万枚以上の都会の樹木画像のデータセットに対して,提案手法は実現可能な目標の76%を達成できた。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:25:11 GMT)
Computational Imaging Priors for Wireless Capsule Endoscopy: Monte Carlo-Guided Hemoglobin Mapping for Rare-Anomaly Detection [3.4] 我々は,モンテカルロにインスパイアされた解析モデルが,抽出した分類器上に構築されたRGB信号からヘモグロビンを計算することができるかどうかを検証した。
6つの種にまたがって、分析前の方法は、小さいが方向整合なマクロAUCの改善を提供する。
AUCはRGB 0.238 +/- 0.057 から入射 0.337 +/- 0.019 まで上昇する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:52:33 GMT)
Paraphrasing Attack Resilience of Various AI-Generated Text Detection Methods [3.4] 各種機械生成テキスト検出手法のパラフレーズ攻撃抵抗について検討する。
微調整されたRoBERTa、Binoculars、テキスト特徴分析のアンサンブルは、最も強力な結果をもたらすが、攻撃時に最も大きな損失を被る。
本稿では,AIテキスト検出の世界における性能とレジリエンスの両立について述べる。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:12:34 GMT)
Not All Anquan Is the Same: A Terminological Proposal for Chinese Computer Science and Engineering [3.4] 中国のコンピュータ科学と工学では、安全と安全は「アンカン」という同じ単語で長い間翻訳されてきた。
本論では、確立された法律・標準の称号は維持されるべきである一方で、学術・工学の著作は安全を「安場」と翻訳し、主に安全のために「安場」を予約するべきであると論じている。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:59:58 GMT)
On Kernel Eigen-alignments of KRR: Reconstruction and Generalization [3.3] 我々は,カーネル法における一般化性能と行列の固有ベクトルと固有値の推定との直接的な関係を確立する。
強い一般化は、固有ベクトルアライメントの増加、固有値の大きさ、連続する固有値間のギャップを必要とすることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:46:31 GMT)
Multi-Block Attention for Efficient Channel Estimation in IRS-Assisted mmWave MIMO [3.3] 本稿では,効率的なチャネル推定のための深層学習に基づくマルチブロック注意(MBA)フレームワークを提案する。
最小二乗推定のための位相構成として離散フーリエ変換(DFT)とアダマール行列の最適性を示す。
提案手法は,従来の手法よりも約51%低い正規化平均二乗誤差(NMSE)を実現する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:27:38 GMT)
GPart: End-to-End Isometric Fine-Tuning via Global Parameter Partitioning [3.3] 低ランク適応(LoRA)は、大規模言語モデル(LLM)のパラメータ効率細調整(PEFT)において支配的なパラダイムとなっている。
低ランクボトルネックを完全に除去するパラメータ効率の高い微調整法であるGPartを提案する。
GPart は、実効的な微調整がフルウェイト空間のランダムな低次元部分空間から現れるという理論的な前提に基づいている。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:46:04 GMT)
Radiologist-Guided Causal Concept Bottleneck Models for Chest X-Ray Interpretation [3.3] 医療画像における概念ボトルネックモデル(CBM)は、最終診断の前に中間的臨床概念を予測することにより、モデル解釈性を改善することを目的としている。
我々はXpertCausalを胸部X線解釈のための放射線技師誘導型因果CBMとして提案し,病理と概念の関係をモデル化した。
我々はXpertCausal on MIMIC-CXRの病理分類性能,校正,説明品質,および放射線技師が定義した推論経路との整合性について検討した。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:51:15 GMT)
$f$-Trajectory Balance: A Loss Family for Tuning GFlowNets, Generative Models, and LLMs with Off- and On-Policy Data [3.3] GFlowNetsと変分推論では、ターゲットとモデルログの確率の平均二乗誤差は、生成モデルのトレーニングに有効な、低分散、サロゲート損失である。
この損失は、$f$-divergences(英語版)のファミリー全体に拡張可能であることが示され、その結果、政治上の勾配が対応する$f$-divergence(英語版)のファミリーとなるが、同じグローバルな最小化のオフポリティ(英語版)を維持している。
この同値性により、対応する$f$-divergenceの特性を継承する幅広い生成モデルのクラスをチューニングするための新しい代理損失関数を設計できる。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:02:07 GMT)
Learning Cross-Coupled and Regime Dependent Dynamics for Aerial Manipulation [3.2] 空中マニピュレータにおける適応的残留力学学習のための構造化エンコーダデコーダフレームワークを提案する。
その結果、残差予測精度の向上、動作条件の変化による適応の高速化、MPCに基づく軌道追跡性能の向上が示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:17:04 GMT)
SpectraFlow: Unifying Structural Pretraining and Frequency Adaptation for Medical Image Segmentation [3.2] 近年の自己監督型プレトレーニングでは伝達性が改善されているが、テクスチャバイアスがしばしば現れる。
本稿では,構造認識型エンコーダの事前学習と境界指向デコーディングを併用する2段階のフレームワークを提案する。
ISIC-2016、Kvasir-SEG、GlaSの実験は最先端の手法よりも一貫した利得を示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:37:10 GMT)
Med-DisSeg: Dispersion-Driven Representation Learning for Fine-Grained Medical Image Segmentation [3.2] 分散駆動型医用画像分割フレームワークであるMed DisSegを提案する。
Med DisSegは、軽量のDispersive Lossと、微粒な構造セグメンテーションのための適応的な注意を組み合わせる。
我々は,Med DisSegが多臓器CTのセグメンテーションにおいて,その堅牢性とクロスタスク適用性をサポートして競合的な結果を得ることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:49:36 GMT)
Policy Optimization in Hybrid Discrete-Continuous Action Spaces via Mixed Gradients [3.2] ハイブリッド離散連続行動空間における強化学習について検討する。
本研究では,スムーズさが許す限り,シミュレータをバックプロパゲートするHybrid Policy Optimization (HPO)を提案する。
HPOは在庫管理においてPPOを大幅に上回り、リニアクアクラティックレギュレータの問題に切り替えた。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:59:45 GMT)
Additivity Results for the Rényi-2 Entanglement of Purification [3.2] すべての完全正の写像 $N:L(B') から L(A)$ に対して、$upsilon_p()$ の乗算性はその補写像に対する乗算性を意味することを示す。
これにより、対応する Rényi-2 の精製の絡み合いに対する対応する付加性ステートメントが得られる。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:41:31 GMT)
Agentic Pipeline for Self-Synchronized Multiview Joint Angle Monitoring in Uncalibrated Environments [3.1] 本研究では,非校正環境における自己同期型多視点関節角度モニタリングのためのエージェントパイプラインを提案する。
提案手法は,非校正された家庭環境において,日常的なキネマティックなモニタリングを行うための,実用的で患者対応のセルフデプロイシステムを提供することが期待されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:03:22 GMT)
Mitigating Data Scarcity in Psychological Defense Classification with Context-Aware Synthetic Augmentation [3.1] 心理的防衛メカニズム(英: Psychological Defense Mechanism、PDM)は、個人が感情的苦痛にどう反応するかを調節する無意識の認知過程である。
本稿では,ハイブリッド分類モデルと組み合わせた文脈認識型合成拡張フレームワークを提案する。
本モデルでは,文脈言語表現を基本的臨床特徴と統合し,150個のアノテートされた防衛項目を合成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:02:34 GMT)
Planning on Paper: Problem Decomposition with Diagrams in Introductory Computing [3.1] 問題分解は、コンピューティング教育における中核的な関心事である。
多くのCS1教育者は、命令の強調をコード記述から切り離すことを提唱している。
初心者が大規模な多機能タスクで分解する方法については知識が不足している。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:27:02 GMT)
MemLineage: Lineage-Guided Enforcement for LLM Agent Memory [3.1] 我々は,LLMエージェントメモリの防衛機能であるMemLineageを紹介した。
最近のコンカレントな作業は、信頼できないコンテンツを永続的なエージェントの状態に書き込むことができ、後続のセッションを命令として再入力できることを示している。
MemLineageは、これをフィルタリング問題ではなく、チェーンオブカストディ問題として扱う。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:07:54 GMT)
Nearest-Neighbor Radii under Dependent Sampling [3.1] 近傍近傍の手法は古典的および近代的な機械学習の基礎であるが、それらの幾何学的性質は独立したサンプリングの下で解析される。
我々は、強い混合依存観測を考察し、最も近い近隣地区の規模に依存性が変化するかどうかを問う。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:07:05 GMT)
Emotion-Attended Stateful Memory (EASM):The Architecture for Hyper-Personalization at Scale [3.0] 本稿では,ユーザ固有の会話コンテキストを動的に構築する感情適応型ステートフルメモリアーキテクチャを提案する。
感情的に異なる6つのカテゴリーにまたがる30の非記述会話を対象としたA/B制御実験を行った。
その結果は、悲しみ、苦悩、不確実性を含む感情的敵対的な会話においても一貫していた。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:39:19 GMT)
A New Technique for AI Explainability using Feature Association Map [3.0] AIシステムにおける透明性の欠如は、現実のアプリケーションに課題をもたらす。
システムに対する信頼を確保するために、AIシステムの決定を説明できることが重要です。
我々は、AIシステムの説明のための新しいアルゴリズムFAMeXを提案している。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:45:42 GMT)
AI Outperforms Humans in Personalized Image Aesthetics Assessment via LLM-Based Interviews and Semantic Feature Extraction [2.9] 画像の個々の美的評価を正確に予測することは、AIの基本的な課題である。
半構造化インタビューを通して美的嗜好を取り入れた統合型DL-LLMシステムを開発した。
以上の結果から,提案システムは高画質画像に対して特に高い性能を示し,その性能に優れることがわかった。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:24:23 GMT)
Capability Conditioned Scaffolding for Professional Human LLM Collaboration [2.9] 私たちは、専門知識を強力で混合的で弱いドメインに分割するタイプドフレームワーク、Capability Conditioned Scaffoldingを紹介します。
パイロット評価では、プロファイルスワップ下のカテゴリー反転や混合ドメインリスクゾーンの選択的活性化など、一貫したプロファイル条件付き介入行動を示す。
これらの結果は、足場を認識する能力は、スタイリスティックなパーソナライゼーションを超えて、より信頼性の高い専門家のAIコラボレーションを支援することを示唆している。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:42:03 GMT)
HeatKV: Head-tuned KV-cache Compression for Visual Autoregressive Modeling [2.9] HeatKVは、各ヘッドのキャッシュ割り当てを、そのアテンションに基づいて予め生成されたスケールに適応させる新しい圧縮手法である。
HeatKVは、VARモデルKV-cache圧縮のための新しい最先端(SOTA)を実現し、粒度の細かいヘッド固有のキャッシュ割り当ての有効性を示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:22:34 GMT)
Latency-Quality Routing for Functionally Equivalent Tools in LLM Agents [2.8] LQM-ContextRouteは,同機能ツールプロバイダ用のコンテキストブロードバンドルータである。
その鍵となる設計は、レイテンシ品質のマッチングであり、低レイテンシのオフセットの回答を付加的な報酬にしない。
メインのウェブ検索負荷ベンチマークでは、LQM-ContextRouteはSW-UCBでF1を+2.18ppで改善している。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:14:13 GMT)
REALM: Retrospective Encoder Alignment for LFP Modeling [2.8] スパイク活動は、その空間分解能と時間分解能が高いため、行動復号において支配的な神経信号である。
脳-コンピュータインタフェース(BCI)が高チャネル数や無線操作へと移動するにつれ、スパイク信号の高サンプリング周波数がボトルネックとなる。
本稿では,因果LFPデコードを可能にする振り返り蒸留フレームワークREALMを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:16:22 GMT)
Precise Verification of Transformers through ReLU-Catalyzed Abstraction Refinement [2.8] 精度の向上を実現するための変圧器検証手法を提案する。
我々のアプローチの核心はReLUの新たな使用法であり、それによってドット製品の正確だが非線形なバウンドを表現する。
我々は2つの古典的アプローチを、ルールベースと最適化ベースという2つのコンテクストに拡張し、その結果、効率的かつ正確な検証のための2つの新しいフレームワークを生み出した。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:55:53 GMT)
TILBench: A Systematic Benchmark for Tabular Imbalanced Learning Across Data Regimes [2.7] 本稿では,TILBench(Tabular Im Balanced Learning Benchmark)を提案する。
以上の結果から,すべての設定において単一手法が一貫した優位性は認められなかった。
これらの知見に基づき、実世界のアプリケーションで適切な方法を選択するための実践的な勧告を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:50:14 GMT)
A Toolbox to Understand the Physics of Quantum Data Management [2.7] 本稿では,量子アニール過程の系統的数値解析のための計算ツールボックスを提案する。
量子コンピューティングとデータベースシステム研究の間の方法論的ギャップを埋めることによって、この研究は量子アプローチを評価するための原則的な基礎となっている。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:40:34 GMT)
When Answers Stray from Questions: Hallucination Detection via Question-Answer Orthogonal Decomposition [2.7] 大規模言語モデルにおける幻覚検出には、分配シフトに対するアククレーシー、効率、堅牢性のバランスが必要である。
本稿では,QAODを提案する。QAODは,回答表現から質問整列方向を投影し,質問直交成分を得る。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:44:18 GMT)
One Step to the Side: Why Defenses Against Malicious Finetuning Fail Under Adaptive Adversaries [2.7] モデルプロバイダはますますオープンウェイトをリリースし、APIを通じてファンデーションモデルを微調整できるようにする。
近年の防衛は、このような悪質な微調整に対してモデルを堅牢にすることを目的としているが、それらは、防御を考慮しない固定攻撃に対してのみ評価されている。
これらのロバスト性主張は不完全であることを示す。
最近の15の防衛策を調査した結果、いくつかの防御機構を特定し、それらが単一の弱点を共有していることが判明した。
そして、全ての防御機構をまたぐ防御を破る統一的な適応攻撃を開発する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:22:14 GMT)
Fortress: A Case Study in Stabilizing Search Recommendations via Temporal Data Augmentation and Feature Pruning [2.6] Fortressは、時間の経過とともに一貫性のない予測スコアに寄与する特徴を特定し、誇張する。
Fortressを,大規模なアプリマーケットプレースにおけるクエリ・ツー・アプリ関連モデルで検証する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:13:05 GMT)
Characterizing the visual representation of objects from the child's view [2.6] 家庭における幼児の視覚経験をBabyViewデータセットから分析した。
その結果, 子どもの対象カテゴリーの露出は, めちゃくちゃであった。
カテゴリーの模範は非常に多様で、子どもたちは異常な角度からオブジェクトに遭遇し、散らかったシーンで、部分的には無視されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:52:20 GMT)
Energy-Efficient Quadruped Locomotion with Compliant Feet [2.6] 中間剛性ばねのエネルギー消費量は、足に組み込まれた非常に硬いばねや非常に柔軟なばねに比べて17%低い。
これらの結果から,適切な足のコンプライアンスを選択することで,動作中のロボットを不安定にすることなく移動効率を向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:54:13 GMT)
Orthogonal Polynomials and the MacWilliams Transform for Permutation-Invariant Qudit Codes [2.5] 我々は、置換不変のqudit符号に対する固有のMacWilliams変換の明示的な公式を導出する。
結果として得られる公式は、置換不変のqudit符号上の線形プログラミング境界を計算するための明示的なMacWilliams行列を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:58:50 GMT)
PDRNN: Modular Data-driven Pedestrian Dead Reckoning on Loosely Coupled Radio- and Inertial-Signalstreams [2.5] センサデータストリームを暗黙的に予測できるシンプルなリカレントニューラルネットワーク(RNN)アーキテクチャを提案する。
提案手法では,各コンポーネントを機械学習(ML)モデルの独立したアンサンブルとして扱うモジュール型ハイブリッドAI支援PDRシステムであるPDRNNを導入する。
動的スポーツ運動データを用いた実験により,PDRNNは従来のML法やML法に比べて精度と精度が優れていることが示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:35:57 GMT)
Jobs' AI Exposure Should Be Measured from Evidence, Not Model Priors [2.5] AIへの仕事の露出は、根拠に基づく根拠に基づく方法で測定されるべきである。
現在の理論的露出測定では、ゼロショットプロンプトを使用してタスクレベルのAI露出を分類している。
我々はO*NET 30.2における18,796の職業-タスク対にAI露出ラベルを割り当てる検索拡張フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:29:42 GMT)
Supersampling Stable Diffusion and Beyond: A Seamless, Training-Free Approach for Scaling Neural Networks Using Common Interpolation Methods [2.5] 定数係数で乗算すれば、畳み込みカーネルを正確にスケールできる数学的手法を示す。
本研究では,ディープニューラルネットワークが高精度なトレーニングデータに適応できることを実証する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:25:41 GMT)
Coordinates of Capability: A Unified MTMM-Geometric Framework for LLM Evaluation [2.5] 本稿では,Large Language Models (LLMs) 評価のための汎用多言語多手法(MTMM)フレームワークを提案する。
パラフレーズ不安定度,ドリフトスコア,オーバートン幅,プラナリズムスコアの9つの評価指標を定式化し,共有潜在座標空間内の幾何的測度として解釈する。
タスク非関連摂動を真の能力の範囲から体系的に分離することにより、このフレームワークは、堅牢で経験的に安定したベンチマーク設計のために理論的に基礎とドメインに依存しない分類を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:18:49 GMT)
A Heterogeneous Temporal Memory Governance Framework for Long-Term LLM Persona Consistency [2.4] 大規模な言語モデルは、多くの場合、事実喪失、タイムラインの混乱、ペルソナの漂流、長距離相互作用時の安定性の低下に悩まされる。
本稿では,長期対話のための外部時間記憶ガバナンスフレームワークARPMを紹介する。
我々は、ARPMが連続性をトレース可能、監査可能、転送可能なガバナンス問題として扱うことを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:12:49 GMT)
HQTN-SER: Speech Emotion Recognition with Hybrid Quantum Tensor Networks [2.4] 現実の環境では、音声の感情認識は脆弱である。
量子機械学習は、コンパクトモジュールによる非線形相関モデリングを導入する代替手段を提供する。
本稿では、量子テンソルネットワーク接続がSERを小ビット環境下でどのようにサポートするかを検討するハイブリッド量子古典フレームワークHQTN-SERを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:07:58 GMT)
Synthesizing POMDP Policies: Sampling Meets Model-checking via Learning [2.4] POMDPは不確実性の下での意思決定の標準フレームワークである。
サンプリングベースの手法はうまくスケールするが、正式な正当性保証がないため、安全クリティカルなアプリケーションには適さない。
本稿では,サンプリング,自動学習,モデルチェックを統合した合成フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:37:31 GMT)
A3D: Agentic AI flow for autonomous Accelerator Design [2.3] A3Dはハードウェアアクセラレータ設計のエンドツーエンド自動化のためにAIフローを自動化する。
A3Dは、速度領域のトレードオフ空間を自動的に探索することで、多様な加速器の設計を生成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:28:16 GMT)
Time-Varying Deep State Space Models for Sequences with Switching Dynamics [2.3] 時間変化状態空間モデルに基づくニューラルネットワークのクラスを提案する。
提案モデルは,基礎関数の辞書を通じて学習可能な時間変化ダイナミクスを提供する。
スイッチングシステムからの合成データと音声認識タスクの両方に対する提案手法の評価を行った。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:25:04 GMT)
Federated Learning of Spiking Neural Networks under Heterogeneous Temporal Resolutions [2.3] スパイキングニューラルネットワーク(SNN)は、神経細胞間の疎二分スパイクベースの通信を使用する生物学的にインスパイアされたエネルギー効率のモデルである。
時系列アプリケーションでは、エッジデバイスはハードウェアとエネルギーの制約により、異なる時間解像度でデータを収集することが多い。
この時間分解ミスマッチに対処するフェデレート学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:33:35 GMT)
LEAP: Trajectory-Level Evaluation of LLMs in Iterative Scientific Design [2.3] 現在の設計ベンチマークは、固定された地平線でのみ結果スナップショットをスコアする。
LEAPBench は曲線 (AUC) 軌跡距離と古典的ベイズ最適化基準の下で最遠距離領域をペアする。
最終結果から軌道スコアへの切り替えは、一致した地平線でのタスクの53%における最良のモデル決定を変える。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:10:45 GMT)
Exploitation of Hidden Context in Dynamic Movement Forecasting: A Neural Network Journey from Recurrent to Graph Neural Networks and General Purpose Transformers [2.3] カルマンフィルタを含む伝統的な手法は、そのようなシナリオに存在する非線形力学をモデル化するのにしばしば苦労する。
長期記憶(LSTM)ネットワーク、グラフニューラルネットワーク(GNN)、トランスフォーマーなどの機械学習手法により、柔軟性と精度が向上する。
本稿では,これらのモデルを評価し,その強みと弱みを評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:02:45 GMT)
MonoPRIO: Adaptive Prior Conditioning for Unified Monocular 3D Object Detection [2.3] 適応型事前条件付けにより,このボトルネックを狙う統一単分子3D検出器MonoPRIOを提案する。
MonoPRIOは、クラス対応サイズのプロトタイプをオフラインで構築し、デコーダクエリを事前にソフトミックスにルーティングする。
完全なCar、Pedestrian、Cyclistのメトリクスを報告するメソッドの中で、最も強力な完全に報告された統一されたマルチクラス結果を達成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:50:53 GMT)
Topical Shifts in the Dark Web: A Longitudinal Analysis of Content from the Cybercrime Ecosystem [2.3] 我々は6年間で収集した11,403,638のHTMLスナップショット(約1245.38GB)を用いて,ダークウェブ上の25,065のWebサイトを経時的に分析した。
その結果,議論総量の約75%は永続的なトピックの小さなセットに集中しており,短命のテーマは活動の約3%を占めていることがわかった。
平均的なトピックの寿命は75ヶ月であり、突然の置き換えではなく、段階的なテーマの進化を示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:14:53 GMT)
Adaptive Window Decoding based on Spatiotemporal Complementary Gap [2.3] 本稿では,ウィンドウデコーディングを小さなバッファサイズで実行する適応型デコーディング方式を提案する。
提案手法は,論理誤差率を維持しつつ,平均バッファサイズを約40%削減することを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:51:22 GMT)
Imaginarity Resource Theory of Gaussian Quantum Channels [2.3] ガウス流路の虚偽性を定量化する2つの枠組みを提案する。
最初のフレームワークは、すべての真のスーパーチャネルをフリーなスーパーチャネルと見なしている。
第2のフレームワークは、真のスーパーチャネルの適切なサブセットのみをフリーなスーパーチャネルとして採用している。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:05:12 GMT)
A Cascaded Generative Approach for e-Commerce Recommendations [2.2] 本稿では,ストアフロント構築を2つの生成タスクに分解する,ケースケードメルチャンディジングフレームワークを提案する。
ファインチューニングされたモデルアブレーションは、閉軽量LLM性能に近づくことが示されている。
オンライン実験では、このフレームワークはページビュー当たりのカートの昇降率を+2.7%と見積もっている。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:17:47 GMT)
The Scientific Contribution Graph: Automated Literature-based Technological Roadmapping at Scale [2.2] 学術論文から科学的貢献を抽出し,それらの前提条件に関連付けることにより,自動技術ロードマップ作成の課題を定式化する。
我々は,230万のオープンアクセス論文から抽出された200万の詳細な科学的コントリビューションを含む大規模AI/NLPドメインリソースであるScientific Contribution Graphを紹介した。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:12:12 GMT)
Discrete-phase-randomized mode-pairing quantum key distribution [2.2] 本稿では,離散位相ランダム化モードペアリング量子鍵分布(DPR-MP-QKD)プロトコルを提案する。
このアプローチがランダム性に対する需要を大幅に減少させることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:24:40 GMT)
Energy efficiency of quantum computers [2.2] 我々は、量子コンピュータのエネルギー効率を、ハードウェアが消費するエネルギーに対して所定の時間に実行できるアルゴリズムの数の比率として定義する。
我々は現在、量子コンピュータの構成要素として使われると想定されている最も代表的な物理プラットフォームを分析した。
我々は、将来の量子コンピューティングアーキテクチャのエネルギー効率をベンチマークするフレームワークの基礎を築いた。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:11:18 GMT)
Lang2MLIP: End-to-End Language-to-Machine Learning Interatomic Potential Development with Autonomous Agentic Workflows [2.1] 自然言語入力とエンドツーエンドMLIP開発を定式化するマルチエージェントフレームワークであるLang2MLIPを提案する。
各ステップでは、意思決定エージェントが現在のデータセット、モデル、評価結果、実行ログを観察し、モデルを改善するための適切なアクションを自動的に選択する。
本研究では, 固体電解質間相 (SEI) システムにおいて, 複数成分および界面を有する手法について検討した。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:10:42 GMT)
Darwin Family: MRI-Trust-Weighted Evolutionary Merging for Training-Free Scaling of Language-Model Reasoning [2.1] 本稿では、勾配のない重み空間の組換えによる大規模言語モデルの学習自由な進化的融合の枠組みを提案する。
既存のチェックポイントにエンコードされた潜在能力を再編成することにより、追加のトレーニングなしにフロンティアレベルの推論性能を改善することができるかどうかを問う。
Darwin Family氏は、診断誘導型進化的マージは推論中心の言語モデルのためのコストのかかる後トレーニングパイプラインに代わる実用的で再現可能な代替手段である、と説明している。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:09:12 GMT)
FedStain: Modeling Higher-Order Stain Statistics for Federated Domain Generalization in Computational Pathology [2.0] 実世界の染色プロセスは、しばしば生化学的拡散とスキャナーの非線形性により非対称で重い尾を持つ色分布を生成する。
現在の手法では、現実の染色変動を支配下に置く高次非ガウス的特性をモデル化できない。
我々は,高次染色モーメントを明示的に組み込んだ染色認識型FedDGフレームワークであるFedStainを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:00:04 GMT)
Mining Subscenario Refactoring Opportunities in Behaviour-Driven Software Test Suites: ML Classifiers and LLM-Judge Baselines [2.0] 振る舞い駆動開発(BDD)ソフトウェアテストスイートは、重複したステップサブシーケンスを蓄積します。
3つのパブリッシュパターンが利用可能である(ファイルの背景、再利用可能な再利用可能なシナリオ呼び出し、組織間の共有高レベルステップ)。
繰り返し続くサブシーケンスが抽出に値するか、どのメカニズムが適用されるかを自動化する前の作業はありません。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:38:04 GMT)
Residual Reinforcement Learning for Robot Teleoperation under Stochastic Delays [1.9] 遠隔操作における通信遅延は、制御安定性と制御性能の低下を損なう信号の不連続をもたらす。
本稿では,Long Short-Term Memory (LSTM) を用いた状態推定器と,遅延に耐性のある残差RLポリシーを併用したハイブリッド制御フレームワークである遅延耐性RLを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:45:59 GMT)
Scaling few-shot spoken word classification with generative meta-continual learning [1.8] 少数のクラスを考慮に入れたアプリケーションでは,ほとんど音声単語分類が開発されていない。
本稿では,音声単語分類器が,クラス毎に5つのショットしか与えられていない場合に,1000のクラスを連続的に区別する可能性について検討する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:53:12 GMT)
Does language matter for spoken word classification? A multilingual generative meta-learning approach [1.8] 生成メタ連続学習アルゴリズムを音声単語分類に適用する。
我々は英語、ドイツ語、フランス語、カタルーニャ語で単言語モデルを訓練し、英語とドイツ語でバイリンガルモデルを訓練する。
その結果,多言語モデルでは性能が優れているが,モデル性能の差は意外に低いことがわかった。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:46:48 GMT)
RQ-MoE: Residual Quantization via Mixture of Experts for Efficient Input-Dependent Vector Compression [1.8] Mixture of Experts (RQ-MoE) は、2段階のMoEとデュアルストリームの量子化を組み合わせたフレームワークで、入力依存のコードブックによる効率的なベクトル量子化を可能にする。
RQ-MoEは,従来のベクトル量子化法よりも6x-14倍高速な復号化を実現した。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:35:57 GMT)
ReMIA: a Powerful and Efficient Alternative to Membership Inference Attacks against Synthetic Data Generators [1.8] ReMIA(Relative Membership Inference Attack)は、SDGトレーニングの実行を2回だけ必要とし、元のトレーニングセットよりも大きなデータを追加する、実用的なプライバシー基準である。
ReMIAの感度は最先端MIAに匹敵するが,実用性は極めて高い。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:02:07 GMT)
BCI-Based Assessment of Ocular Response Time Using Dynamic Time Warping Leveraging an RDWT-Driven Deep Neural Framework [1.8] 本稿では,脳波(EEG)とAR(AR)をベースとしたVestibular/Ocular Motor Screening(VOMS)タスクを統合した初期フレームワークを提案する。
EEG信号は、RDWT(Redundant Discrete Wavelet Transform)駆動のディープニューラルフレームワークを用いて分析される。
Pearson相関を用いてスライディング・ウインドウの予測を検証し、その後、動的時間ワープ(DTW)を用いて眼反応時間を推定した。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:28:11 GMT)
CoralLite: μCT Reconstruction of Coral Colonies from Individual Corallites [1.8] CoralLiteは、石灰質骨格全体と関連する最初のサンゴライト深層学習ベースラインのアノテーション付きCTスキャンである。
我々は,サンゴ骨格のみのCTスキャンから,完全3次元のサンゴライトモデリングを効果的に支援できることを初めて示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:12:59 GMT)
MorphoHELM: A Comprehensive Benchmark for Evaluating Representations for Microscopy-Based Morphology Assays [1.8] セルペイントのための特徴抽出手法を評価するための総合的なベンチマークであるMorphoHELMを紹介する。
MorphoHELMは分野での評価基準を統一し、それらを拡張し、より堅牢に修正する。
ベンチマークの明確な特徴は、各タスクが異なるバッチ効果で評価されることである。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:13:36 GMT)
SeaVis: Modeling and Control of a Remotely Operated Towed Vehicle for Seabed Visualization and Mapping [1.7] 本稿では, 遠隔操作牽引車(ROTV)の数学的モデルを提案する。
我々は、頑健な深さと姿勢制御のためのゲインスケジューリング線形四分法レギュレータ(LQR)を開発した。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:57:38 GMT)
MoMo: Conditioned Contrastive Representation Learning for Preference-Modulated Planning [1.7] 優先条件付きコントラストプランナであるMoMoを紹介する。
MoMoは、表現幾何学と潜在予測演算子のジョイント条件付けを学習する。
6つの環境にわたって、MoMoはユーザの好みに応じて計画の安全性を円滑に調整し、状態拡張ベースラインに対する時間的および優先的な一貫性を向上させる。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:53:54 GMT)
Entanglement Dynamics of Separable Squeezed States in Finite Memory Structured Reservoir [1.7] 連続変数ガウス系の絡み合いは重要な資源であり、共通の貯水池は相関を抑え、生成することができる。
共振器に結合した2つのボソニックモードについて,それぞれ分離可能な圧縮真空中で検討した。
マルコフ力学に欠如する3つのメカニズムは,(1)貯水池の相関時間で絡み合う軌跡を凍結するゆらぎ条件,(2)入力からの絡みの生着,死,回復,(3)周期的なゆらぎによる正方波振動による整数ロックビーティングである。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:16:38 GMT)
Non-Invertible Symmetries on Tensor-Product Hilbert Spaces and Quantum Cellular Automata [1.7] テンソル積ヒルベルト空間上の(1+1)次元融合圏対称性の実現について検討し、量子セルオートマトン(QCA)との混合を可能にする。
まず、欠陥に対する特定の物理的仮定の下では、任意のQCA精製実現は、対称性演算子を再定義する自由まで、分類データによって決定されるQCAおよび対称性演算指標を持つことを示す。
第二に、テンソル積ヒルベルト空間上の任意の弱積分核融合圏対称性に対して QCA-refined realization を提供する格子モデルを構築する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:45 GMT)
Multi-Dimensional Model Integrity and Responsibility Assessment Index and Scoring Framework [1.7] 本稿では,モデル統合度・責任度評価指標(MIRAI)を提案し,説明可能性,公正性,堅牢性,プライバシー,持続可能性について検討する。
MIRAIは、正規化と方向対応のディメンションスコアを通じて確立されたメトリクスを組み合わせる。
高い予測性能は必ずしも全体的な完全性と責任を損なうものではないことを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:29:36 GMT)
Beyond Partner Diversity: An Influence-Based Team Steering Framework for Zero-Shot Human-Machine Teaming [1.7] インフルエンスベースのチームステアリングは、インフルエンスシェーピングを使用してエージェントにインセンティブを与え、多様なハイパフォーマンスなチームインタラクションパターンを見つけるフレームワークである。
IBTSは2エージェントと3エージェントの両方でOvercooked-AI上で評価し、学習された協調構造がダイアド相互作用を超えて移動するかどうかを検証した。
我々の評価には、シミュレートされたパートナー、合成パートナースタイルのバリエーション、そして私たちの知る限り、2人の真の人間チームメイトと1人のマシンチームメイトを含む30件のOvercooked-AI HMT研究が含まれている。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:34:16 GMT)
Detecting overfitting in Neural Networks during long-horizon grokking using Random Matrix Theory [1.7] 本稿では,列車やテストデータにアクセスせずに,深層学習モデルの過度適合を検知するランダム行列理論を提案する。
ロングホライゾングルーキングの「アンチ・グロキング」フェーズと呼ばれるオーバーフィッティングの開始時、相関トラップは数と規模で成長し成長する。
以上の結果から, 抗農薬は, 高い列車精度と試験精度の低下をともなう追加グルーキングフェーズであり, 相関トラップによる前グルーキングとは構造的に異なることが示唆された。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:36:50 GMT)
The Racial Character of Computer Graphics Research [1.6] 本稿では,ヒトの描写の体系的レビューを,トップコンピュータグラフィックス会議と記録誌に紹介する。
分析の結果,白肌のアルゴリズムを「オール」皮膚の計算基板として扱うという概念的二項化が明らかになった。
髪型アルゴリズムも同様の歴史的パターンに従っており、2020年にジョージ・フロイドが殺害された後に初めてコンピュータ生成されたタイプ4の髪型が登場した。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:42:20 GMT)
Behavioral Data-Driven Optimal Trajectory Generation for Rotary Cranes [1.6] 自動クレーン制御における中心的な課題は、運動中の負荷振動の低減である。
本稿では,回転クレーン用開ループスリーイング軌道を生成するための行動データ駆動型フレームワークを提案する。
最大で35%の負荷減少、43%のトラッキングエラー、50%の移動時間削減を実現している。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:17:38 GMT)
On the Stability of Growth in Structural Plasticity [1.6] プルーニングは開始からトレーニングに参加したユニットの中から選択する一方、成長は新たなユニットを既に特定された軌道に挿入する。
新生児は前向きに活動することが多いが、後向きに飢えていることが多い。
textscGrowは、構造編集手順中に高い最終的な精度を達成することができる。
textscPruneは、トレーニングの軌道上でパフォーマンスが平均されている場合や、最終的なスパースネットワークがゼロから再トレーニングされた場合、より強くなります。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:27:38 GMT)
Watch your neighbors: Training statistically accurate chaotic systems with local phase space information [1.6] カオスシステムは、データ駆動型動的発見に根本的な課題をもたらす。
本稿では,ジャコビアンと長期統計特性を持つ代理力学モデルを訓練し,新しい枠組みを提案する。
本手法は,統計学的に高精度な動的学習法と競合しながら,ヤコビアン精度を著しく向上させる。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:45:41 GMT)
Contestable Multi-Agent Debate with Arena-based Argumentative Computation for Multimedia Verification [1.6] マルチモーダルな言語モデル、外部検証ツール、およびアリーナに基づく量的双極子議論(A-QBAF)を統合するマルチエージェントフレームワークを提案する。
提案手法は,各事例をクレーム中心のセクションに分解し,対象とするエビデンスを抽出し,エビデンスを構造化されたサポートとアタック引数に変換する。
得られたシステムは、現実世界のマルチメディア検証に透過的で、編集可能で、計算的に実用的なセクションワイドな検証レポートを生成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:34:18 GMT)
Active Learners as Efficient PRP Rerankers [1.6] Pairwise Ranking Prompting (PRP)は、LLMからペアワイズ選好判断を導き出し、通常は古典的なソートアルゴリズムによってランキングに集約する。
PRPをノイズの多いペアワイズ比較からアクティブラーニングとして再評価し,コール制限体制下での1コールあたりのNDCG@10を改善するために,アクティブローダがドロップイン代替品であることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:03:53 GMT)
DeepTokenEEG Enhancing Mild Cognitive Impairment and Alzheimers Classification via Tokenized EEG Features [1.6] アルツハイマー病(AD)の診断を目的とした新しい軽量・高性能モデルDeepTokenEEGの開発
従来の重み付けモデルとは異なり、DeepTokenEEGは、AD関連バイオマーカーを効果的にキャプチャする空間的および時間的トークン化剤を人工化する。
DeepTokenEEGは特定の周波数帯で記録された最大精度を100%達成し、最先端の手法よりも1.41-15.35%向上した。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:10:03 GMT)
Scalable Solution of the Stochastic Multi-path Traveling Salesman Problem via Neural Networks [1.5] 問題の目的は、不確実性の下で期待される総コストを最小限に抑えるハミルトンツアーを決定することである。
この研究の革新は、第2段階のリコース問題の期待値を近似するために、ニューラルネットワークベースの代理モデルを統合することである。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:16:55 GMT)
Geographic Patterns in I2P Peer Selection: An Empirical Network Topology Analysis [1.5] 本研究は、地理的な位置がI2Pの経路トポロジに系統的に影響を及ぼすかどうかを検討する。
ネットワークレベルに有意なホモフィリーが欠如していることが判明した。
I2Pにおける集合的ピア選択は、高度に異質でランダムな地理的混合をもたらすと結論付けている。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:28:52 GMT)
FreeMOCA: Memory-Free Continual Learning for Malicious Code Analysis [1.5] FreeMOCAは、悪意のあるコード分析のためのメモリと計算効率の連続学習フレームワークである。
大規模なWindows(EMBER)とAndroid(AZ)のマルウェアベンチマークにおいて,FreeMOCAをクラスインクリメンタル(Class-IL)とドメインインクリメンタル(Domain-IL)の両方で評価した。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:00:08 GMT)
Measurement-Efficient Variational Quantum Linear Solver for Carleman-Linearized Nonlinear Dynamics [1.4] カールマン線形化は弱い非線形ダッフィング方程式を正確に近似することを示した。
我々は,大域的および局所的なコストの定式化の下で,対称群アダマール試験によるVQLSをデプロイする。
ブロックバンドテストケース全体で、各メソッドは、ほぼ一様性を実現し、相対的残差を消失する。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:45:27 GMT)
COTCAgent: Preventive Consultation via Probabilistic Chain-of-Thought Completion [1.4] The Probabilistic Chain-of-Thought Completion Agent (COTCAgent)は、縦断的な電子健康記録のための階層的推論フレームワークである。
COTCAgentは、自作データセットで90.47%、HealthBenchで70.41%の精度を達成し、既存の医療エージェントや主流の大規模言語モデルを上回っている。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:17:35 GMT)
SemaTune: Semantic-Aware Online OS Tuning with Large Language Models [1.4] SemaTuneは、言語モデルガイダンスによる定常OSチューニングのためのホストサイドフレームワークである。
高速ループは低レイテンシ更新を提案し、遅いループは定期的に探索戦略を修正し、提案された変更は型付きバリデーションを通過する。
最大41のLinuxパラメータをチューニングしながら、5つのベンチマークスイートから13のライブワークロード上でSemaTuneを評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:25:32 GMT)
Static and Dynamic Strategies for Influencing Opinions in Social Networks [1.4] 本研究では,対象のスタブボーンエージェントが,有界信頼度力学によって支配されるネットワークの平均的意見をどう変えるかを検討する。
静的な介入は、頑固なエージェントが一定の極端な意見を保ち、ダイナミックな介入は、その意見が徐々に中程度から極端な値へと進化していく。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:52:30 GMT)
Proposal and study of statistical features for string similarity computation and classification [1.4] ビジュアルコンピューティング,共起行列 (COM) および実行長行列 (RLM) の分野で一般的に適用される特徴の適応法を提案する。
提案する機能は言語関連情報に敏感ではない。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:27:04 GMT)
Stochastic Compositional Optimization via Hybrid Momentum Frank--Wolfe [1.4] 本研究では,mathcalXの$min_bmxを仮定するアルゴリズムを開発した。
この分析は、r$in (1, 2]$の有界モーメントを持つヘビーテールノイズオラクルにまで拡張され、ノイズとしてのノイズの率を回復する。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:20:22 GMT)
A Formative Study of Brief Affective Text as a Complement to Wearable Sensing for Longitudinal Student Health Monitoring [1.3] テキストが受動センシングのスケーラブルな補完として機能するかどうかを検討した。
学術的な懸念によって支配された週は、フレーミングは身体活動の低下と関連していた。
感情的疲労言語は睡眠の質が悪く、心拍変動が低かった。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:36:29 GMT)
Explainable Detection of Depression Status Shifts from User Digital Traces [1.3] 利用者のデジタルトレースにおけるうつ関連状態変化を検出し解析するための説明可能なフレームワークを提案する。
このフレームワークを2つのソーシャルメディアデータセット上で評価する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:56:38 GMT)
Fire and ice: Partially fault-tolerant quantum computing with selective state filtering [1.3] 本研究では,5キュービットのLaflamme符号を4キュービットのIceberg符号に結合した誤り訂正量子計算手法を開発した。
このアプローチは、明らかにフォールトトレラントではなく、高い論理誤差率のリスクがあり、エラー修正のために符号化された状態を作成するために選択的なフィルタリングに依存する。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:13:25 GMT)
SOCC-ICP: Semantics-Assisted Odometry based on Occupancy Grids and ICP [1.3] SOCC-ICPはセマンティックOCCupancyグリッドマッピングとLiDARスキャンアライメントを共同で実行するセマンティック支援オドメトリーフレームワークである。
最先端のLiDARオドメトリーと性能を競い合っており、幾何的に退化した環境でも頑丈である。
SOCC-ICPは,1つの表現内でのオードメトリとセマンティック占有グリッドマッピングを統一することにより,冗長なマップ構造を排除している。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:00:38 GMT)
Representation Without Reward: A JEPA Audit for LLM Fine-Tuning [1.3] JEPA(Joint-embedding predictive Architectures)は、モデルが観測された出力よりも遅延表現を予測できるように訓練された時に、より有用な抽象化を学ぶべきであることを提案している。
自己回帰型言語モデルの微調整には、この原理はより厳密な要件を必要とする。
我々は、Llama-3.2-1B-Instruct LoRA を用いて、自然言語からレジェックス生成におけるその要件を検証した。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:27:32 GMT)
The 99% Success Paradox: When Near-Perfect Retrieval Equals Random Selection [1.3] 本稿では,ビットオーバランサム(BoR)について紹介する。これは,高い成功率がランダムレベルのパフォーマンスを隠蔽することを示す検索選択度尺度である。
予測カバレッジ比$left(fracK cdot barR_qNright)$が3~5を超えると,ベースラインが支配的になり,選択性が低下することを示す。
これらの結果から,BoRは従来の指標とともに報告され,追加検索が無視可能な選択性向上をもたらす場合の深度選択を再考することが示唆された。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:19:57 GMT)
When Are Two Networks the Same? Tensor Similarity for Mechanistic Interpretability [1.2] 重みに基づく計量、テンソル類似性を導入し、そのような対称性に不変である。
経験的に、テンソル類似性は、グラッキングやバックドア挿入のような機能的トレーニングのダイナミクスを、既存のメトリクスよりも忠実に追跡する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:58:27 GMT)
A Novel Schur-Decomposition-Based Weight Projection Method for Stable State-Space Neural-Network Architectures [1.1] シュア分解に基づく新しい安定性保証・バックプロパゲーション対応プロジェクションスキームを導入する。
提案手法は、状態行列の実シュア分解の準三角因子を最も近い安定なピアに動的に投影する。
合成線形系の実験により、この手法は最先端の安定系同定技術に匹敵する精度と収束率を達成することを示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:28:11 GMT)
OpenIIR: An Open Simulation Platform for Information Retrieval Research [1.1] OpenIIRは、パラメータ化され再現可能なIR研究実験として、数百のLLM駆動のペルソナを実行する。
研究者は4種類のマルチエージェント研究のエージェントを構成する。
同じ研究を異なる設定で再実行して、成果を並べて比較することができる。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:54:52 GMT)
Scalable self-testing of generic multipartite quantum states [1.1] サンプルの複雑さだけでほぼ全ての$n$-qubit状態に頑健に自己テストするプロトコルを導入する。
鍵となる要素は、多粒子パウリ測定をデバイス独立に評価するための効率的なスキームである。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:23:40 GMT)
From Llama to Cria: Scaling Down Neural Networks via Neuron-Level Spectral Structural Importance Evaluation [1.1] 本稿では,ニューロンレベルのスペクトル構造重要度評価に基づくニューロンプルーニングフレームワークを提案する。
ニューロンのプルーニングとグラフ信号処理とスペクトル構造解析を結合することにより、提案フレームワークは、ニューラルネットワークのサイズを減らすための原則化された方法を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:58:41 GMT)
Accurate Modeling of Rydberg Atoms and Their Interactions: Theory and Implementation in PairInteraction [1.0] ライドバーグ原子は強い相互作用を持つ量子系を探索するための強力なプラットフォームを提供する。
我々は、Rydberg原子とその相互作用に関する統一的な理論的枠組みを示す。
私たちはこのフレームワークをオープンソースソフトウェアの更新版[Weber et al., J.Phys.B50]で実装しています。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:55:39 GMT)
Bounded-Rationality, Hedging, and Generalization [1.0] 本研究では,サンプルから出力への誘導チャネルをプリミティブオブジェクトとする有界有理決定問題について検討する。
学習者の応答法は、このチャネルのどの変更が安価であるか、あるいはコストがかかるかを決定する。
ヘッジと2つの曲線がブラックボックスの挙動からどのように回復できるかを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:07:53 GMT)
Excitation Flow, Positivity, and Fisher Information for Open Subsystems of an $N$-Qubit Network [1.0] 我々は、単一の保存励起を持つ閉じた$N$-qubitネットワークの任意の$K$-qubitサブシステムに対してプロパゲータを導出する。
単一遷移振幅はサブシステム間の励起フローを同時に制御する。
プロパゲータが正かつ完全に正であることと、サブシステム状態がその固定点に向かって収縮した場合に限る。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:30:48 GMT)
Optimal Asymptotic Rates for (Stochastic) Gradient Descent under the Local PL-Condition: A Geometric Approach [1.0] 勾配降下(SGD)は、機械学習の単純さと幅広い適用性のために、過去数十年にわたって広く研究されてきた。
我々は勾配降下の局所的挙動を解析し、ポリアック・ロジャシエヴィチ(PL)設定を満たす関数の$C2$を乗法条件下で最小化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:18:21 GMT)
A Prototyping Framework for Distributed Control of Multi-Robot Systems [0.9] 本稿では,マルチロボットシステムの分散制御のためのプロトタイピングフレームワークを提案する。
Single Program, Multiple Data (SPMD) パラダイムを用いて、このフレームワークは単一のコンピュータ上で分散制御をエミュレートする。
我々は,非協調型ゲーム理論分散アルゴリズムを用いて,4つのクワッドロータ位置スワッピングタスクのフレームワークを実演する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:44:14 GMT)
PRB-RUPFormer: A Recursive Unified Probabilistic Transformer for Residual PRB Forecasting [0.9] 本稿では,残差PRB予測のための統一確率変換器を提案する。
単一共有モデルは、eNBのすべてのキャリアとセクターでトレーニングされ、計算オーバーヘッドの少ない共同トラフィックダイナミクスの効率的な学習を可能にする。
確率認識予測は、動的キャリアアクティベーション、混雑回避、プロアクティブスペクトル共有などのスペクトル対応RAN関数を直接サポートする。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:42:32 GMT)
U-SEG: Uncertainty in SEGmentation -- A systematic multi-variable exploration [0.8] 我々は不確実性推定とセグメンテーションの交点におけるいくつかの未研究トピックについて深く検討する。
私たちは、データセット、バックボーン、下流タスクなど、多くの変数にわたる大規模な研究を実行するためのフレームワークを作成します。
汎視的セグメンテーションのより困難なタスクは、通常、パフォーマンスが悪くなりますが、データセットとバックボーン間の高いパフォーマンスのばらつきは、一般化が保証されていないことを示しています。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:08:04 GMT)
Spectral Priors vs. Attention: Investigating the Utility of Attention Mechanisms in EEG-Based Diagnosis [0.8] 特徴構造に対するスペクトル選択的アプローチがクラス分離性を高めることを示す。
一次脳波帯内の信号強度を分離することにより、高次元の生データを高価値スペクトル特徴に変換する。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:26:07 GMT)
Your CLIP has 164 dimensions of noise: Exploring the embeddings covariance eigenspectrum of contrastively pretrained vision-language transformers [0.8] 事前訓練されたビジョンランゲージモデル(VLM)は強力な特徴抽出器として機能する。
彼らの共有潜在空間は構造的異常を起こしやすく、非意味で多重モーダルノイズのレポジトリとして機能する。
VLM潜在空間をマルチモーダルな意味信号成分と共有雑音部分空間に分解する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:37:50 GMT)
BioSEN: A Bio-acoustic Signal Enhancement Network for Animal Vocalizations [0.8] 生体音響信号のためのモデルであるBioSENを開発した。
3つのバイオ音響データセットのテストでは、BioSENは最先端の音声強調モデルと一致するか超えている。
これらの結果から,バイオアコースティック・オーディオ・エンハンスメントに対するBioSENの強みと,生物多様性のモニタリングと保存への期待が示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:05:44 GMT)
Proposal-Guided Greedy Surrogate Refinement for PDE-Driven High-Dimensional Rare-Event Estimation [0.8] 本稿では,サロゲートを用いた適応的重要度サンプリングフレームワークを提案する。
これは、入力空間全体ではなく、進化する提案に沿って局所的にサロゲートを洗練させる。
提案手法は,真のモデル適応的重要度サンプリングに匹敵する精度を実現する。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:34:00 GMT)
Ideology Prediction of German Political Texts [0.7] 本稿では,テキストの政治的指向を連続的な左から右へのスペクトルに投影するトランスフォーマーモデルを提案する。
この研究は、トランスフォーマーモデルが、世論調査のレベルにおいて、ドイツのニュースにおける政治的フレーミングを認識できることを示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:25:56 GMT)
SR-Prominence: A Crowdsourced Protocol and Dataset Suite for Perceptually-Weighted Super-Resolution Artifact Evaluation [0.7] SR-プロミネンス(SR-Prominence)は、DeSRA、Open Images、Urban100の3,935個のアーティファクトマスクと、プロミネンスで注釈付けされたリアルな非真実のUrban100-HR設定を含むデータセットスイートである。
スイート全体にわたって、SRアーティファクト検出器、画像品質指標、およびSR手法を検査し、古典的なフル参照メトリクス、特にSSIMとdisTSが驚くほど強力な局所的プロミネンス信号を提供することがわかった。
SR-Prominenceは客観的スコアリングプロトコルとともにリリースされ、新たなメトリクスをさらなるクラウドソーシングなしに私たちのスイート上でベンチマークすることができる。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:56:08 GMT)
Is Grep All You Need? How Agent Harnesses Reshape Agentic Search [0.7] 本稿では,2つの実験にまとめられた実証的研究を報告する。
実験1では、Chは一般にベクトル検索よりも精度が高いことを示した。
全体的なスコアは、基礎となる会話データが同じであっても、どのハーネスとツール呼び出しスタイルが使用されるかに強く依存する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:58:41 GMT)
Are Candidate Models Really Needed for Active Learning? [0.7] 本研究では, ランダムに重みを選択するCNNと変圧器の実現可能性について検討した。
高信頼度(HC)、低信頼度(LC)、早期訓練における高信頼度の組み合わせの3つの信頼性に基づくサンプリング戦略を評価した。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:03:29 GMT)
Ising anyons in the $SU(2)_2$ Chern--Simons theory [0.7] イジング極小モデル $mathcalM(4,3)$ は可観測量のレベルで$SU(2)$チャーン・サイモンズ理論と同値である。
既約最高級表現の数はイジング・エノンの数と一致しない。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:00:01 GMT)
Why Neighborhoods Matter: Traversal Context and Provenance in Agentic GraphRAG [0.7] エージェントグラフRAGは、外部証拠の回答を根拠にすることで、事実性を改善することができる。
我々は、軌道レベルの問題として引用忠実性を定めている。
引用された証拠は、解答が大幅に変わるため、しばしば必要であることを示す。
しかし、正確な答えは暗黙の文脈や周囲のグラフ構造にも依存するため、引用は不十分である。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:25:20 GMT)
BiFedKD: Bidirectional Federated Knowledge Distillation Framework for Non-IID and Long-Tailed ECG Monitoring [0.7] フェデレートラーニング(FL)は、デバイスに生のECGデータを保持することで協調学習を可能にするが、高次元モデル更新の頻繁な送信は、帯域幅に制限のあるリンクを介して、ラウンド単位のトラフィックを発生させる。
本稿では, 温度スケーリングとアグリゲーション・バイ・蒸留パイプラインを用いた双方向連成知識蒸留(BiFedKD)フレームワークを提案し, クロスクリエントアライメントのための安定なグローバル蒸留信号を生成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:31:02 GMT)
LLM-based Detection of Manipulative Political Narratives [0.6] 本稿では,操作型政治物語の検出と構造化のための新しい計算フレームワークを提案する。
主要な課題の1つは、操作的な政治的物語と正当な批判の区別である。
このアプローチは、12万以上のソーシャルメディア投稿に適用され、41の異なる操作的物語クラスタを効果的に特定した。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:30:21 GMT)
Quantitative Linear Logic for Neuro-Symbolic Learning and Verification [0.6] 微分論理は、ニューラルネットワークのトレーニング目的に論理的制約を埋め込む方法として、ニューロシンボリック学習タスクに展開される。
分野の定義的なトレードオフは、連結体の論理的性質と意味論の分析的関心事の間にあることである。
本稿では,この長期的緊張の解決を,新しい論理,量線形論理を用いて提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:00:29 GMT)
Generating Non-Decomposable Maps with Differentiable Semidefinite Programming [0.6] 本稿では、柔軟な構造制約の下で正の非分解性写像を生成するための最適化フレームワークを提案する。
量子情報理論において、同じアプローチがオープンな質問に適応できることが示される。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:01:29 GMT)
A Qutrit Time Crystal Stabilized with Native Chiral Interactions [0.6] 周期的に駆動される量子多体系は、離散時間変換対称性を自発的に破ることができる。
15個の超伝導量子ドットの鎖にフロケットキラルクロックモデルを実装することにより, 可変$mathbbZ_3$離散時間結晶の実現を示す。
この結果から,非平衡位相の広い視野にアクセスできる強力なプラットフォームとして,ネイティブなクディットハードウェアが確立された。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:51:54 GMT)
Prompting Policies for Multi-step Reasoning and Tool-Use in Black-box LLMs with Iterative Distillation of Experience [0.6] 本稿では,経験の反復蒸留による学習指導の枠組みを提案する。
軽量プロンプトモデルは、大規模で凍結された作業者のためのタスク固有の報酬を最大化するために最適化されている。
論理集約推論では55%から90%,ツール使用タスクでは74%から91%に向上した。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:38:19 GMT)
Training-Free Generative Sampling via Moment-Matched Score Smoothing [0.6] 拡散モデルは、摂動対象分布のスコアに沿ってデノイングすることでサンプルを生成する。
最近の研究は、スコアマッチングが暗黙的に経験的なスコアを滑らかにすることを示唆している。
モーメントマッチングされたスコアスムーズなランゲヴィンダイナミクスを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 02:20:36 GMT)
Retrieval-Augmented Large Language Models for Schema-Constrained Clinical Information Extraction [0.6] MEDIQA-SYNURは、会話型看護師・患者文書からの観察的抽出に焦点を当てている。
本稿では,トレーニングセットを模範コーパスとして利用するモジュール型検索拡張生成パイプラインを提案する。
我々の結果から,RAGは一貫して性能を向上し,最適なスキーマ制約の度合いはモデルに依存することがわかった。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:13:05 GMT)
Dimension-Level Intent Fidelity Evaluation for Large Language Models: Evidence from Structured Prompt Ablation [0.6] 全体的評価スコアは、全体の出力品質をキャプチャするが、モデルがユーザの要求の構造形式を再現したかどうかを区別しない。
本稿では,2,880個の出力に対して構造化されたプロンプトアブレーション研究を通じて,次元レベルのインテント忠実度評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:00:23 GMT)
Cattle Trade: A Multi-Agent Benchmark for LLM Bluffing, Bidding, and Bargaining [0.6] 我々は,大規模言語モデル(LLM)を戦略的推論のエージェントとして評価するためのベンチマークであるtextscCattle Tradeを紹介した。
このベンチマークは、1つのロングホライゾンゲーム内でのオークション、隠れオフのトレードチャレンジ(TC)、バーゲティング、ブラッフィング、相手モデリング、リソース割り当てを組み合わせたものだ。
我々は,242ゲームに対して,コスト効率のよい7つの言語モデルと3つの決定論的コードエージェントを評価した。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:20:03 GMT)
EAGT: Echocardiography Augmentation for Generalisability and Transferability [0.5] 心エコー法セグメンテーションのための深層学習モデルは、機関、スキャナー、患者集団をまたいだ一般化に苦慮することが多い。
データ拡張はディープラーニングモデルの堅牢性向上に広く利用されているが、データセット間の一般化性向上におけるその役割はいまだ十分に理解されていない。
本研究は, 2次元左室セグメンテーションにおける29データ拡張法とその組み合わせの大規模評価を行った。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:30:06 GMT)
Intelligence Impact Quotient (IIQ): A Framework for Measuring Organizational AI Impact [0.5] インテリジェンス・インパクト・クオシエント(英: Intelligence Impact Quotient、IIQ)は、AIシステムが組織的な作業やその影響に一体化される深さを定量化する複合計量である。
我々は、異種ユーザとユニットの比較のために、生のインテリジェンス導入指数(IAI)と正規化された0-1000 IIQインデックスを作成します。
改訂された測定基準が、頻繁な低照度の使用、セマンティックな反復的なプロンプト、そしてより自律的で高精度なAI支援作業との違いをいかに区別しているかを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:51:20 GMT)
Logging Policy Design for Off-Policy Evaluation [0.5] オフ政治評価(OPE)は、異なるロギングポリシーによって収集されたデータを用いて、対象の処理ポリシーの値を推定する。
対象とするポリシに対して,OPEエラーを最小限に抑えるロギングポリシの設計方法について検討する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:25:19 GMT)
Decoherence of $q-$Deformed Photon Added Coherent State [0.5] 我々は、$q-$deformed photon Add Coherent State (DPACS) が非古典性および非コヒーレンスに対するレジリエンスを高めることを示す。
また, 消散光子損失環境との相互作用によって引き起こされる脱コヒーレンス下でのDPACSの非古典的特性と絡み合いについて検討した。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:04:15 GMT)
ENSEMBITS: an alphabet of protein conformational ensembles [0.5] エンセムビット(Ensembits)は、タンパク質コンフォメーションアンサンブルの最初のトークンである。
ダイナミックスのトークン化に固有の課題に対処する。
大規模な分子動力学コーパスでフレーム蒸留の目的を訓練する。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:44:35 GMT)
Quantum Advantage in Multi Agent Reinforcement Learning [0.4] 量子マルチエージェント強化学習(QMARL)におけるエージェント調整における量子絡み合いの実証評価について述べる。
エンタングル QMARL エージェントが 0.854 の Tsirelson 限界に近づき、量子的優位性を示す。
また,ベル状態がコーディネートゲインを実現し,他の状態が積極的に性能を損なうような,特定の絡み合い構造の効果についても検討する。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:03:41 GMT)
AI-assisted cultural heritage dissemination: Comparing NMT and glossary-augmented LLM translation in rock art documents [0.4] ロックアートのような専門用語の領域では、翻訳の質は正確で一貫した専門用語に依存している。
スペインのアカデミック・ロックアートのテキストに対する3つの英語のMTセットアップを比較し、単純で操作可能な介入に焦点を当てた。
Gemini-RAGは、Gemini-Simple (69.1%) とDeepL (64.4%) に対して、正確なマッチング項の精度が最も高い(81.4%)。
以上の結果から, グローサリー増進プロンプトは, 文化遺産翻訳における用語制御を改善するための低オーバーヘッドな方法であることが示唆された。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:48:48 GMT)
Conversion of Lexicon-Grammar tables to LMF. Application to French [0.4] 本稿では、フランス語動詞の表をLexical Framework(LMF)形式に変換する最初の実験について述べる。
LMF標準による相互運用可能な表現形式への変換は、異なるコンテキストで使用することができる。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:28:24 GMT)
Privacy Evaluation of Generative Models for Trajectory Generation [0.4] トラバーセーのデータは現代の都市情報に基本的なものだが、その感度はプライバシーの懸念を喚起する。
生成軌道モデリングとプライバシ評価の交わりについて検討する。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:57:34 GMT)
A Constraint Programming Approach for n-Day Lookahead Playoff Clinching in the NHL [0.4] 次回の$n$日のゲーム結果の組み合わせを決定するアルゴリズムを提案する。
我々は,2021-22シーズンから2024-25シーズンのNHLデータに基づいて,数百のシナリオを用いてアルゴリズムを検証する。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:03:47 GMT)
Improving the Efficiency of Subgroup Analysis in Randomized Controlled Trials with TMLE [0.4] ランダム化制御試験におけるサブグループ分析は、サンプルサイズが限られているため、しばしば過小評価される。
我々は,同じ試験において,非サブグループ参加者から情報を借りる2つの目標最大等量推定器 (TMLE) を提案する。
その結果、アジアでは1.6、1.5、1.5ポイント、黒人では2.1、2.0、そして2.1ポイントと推定されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:54:07 GMT)
Real-time virtual circuits for plasma shape control via neural network emulators [0.4] 我々は,MAST-U運用空間のかなりの部分を網羅する,100万以上のシミュレーションGS平衡の広範なライブラリを開発した。
我々は,エミュレートされたVCの広範囲な検証を行い,制御問題を解き放つかどうかを検証した。
この研究は、事前計算されたVCのスケジュールに対するスケーラブルで一般的な代替手段として、エミュレートされたVCの物理的妥当性を確立する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:15:43 GMT)
MobileEgo Anywhere: Open Infrastructure for long horizon egocentric data on commodity hardware [0.4] MobileEgo Anywhereは、コモディティなモバイルハードウェアを使用した堅牢な時間とエゴセントリックなトラジェクトリの収集を容易にするために設計されたフレームワークである。
我々は,200時間にわたる多種多様・長文のエゴセントリックなデータと永続的な状態追跡からなる新しいデータセットを作成した。
我々は、生のモバイルキャプチャーを、ビジョン言語アクションモデルと基礎モデル研究のための、標準化されたトレーニング可能なフォーマットに変換するための包括的な処理パイプラインを提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:57:22 GMT)
SR-Platform: An Agentic Pipeline for Natural Language-Driven Robot Simulation Environment Synthesis [0.3] SR-Platformは、フリーフォームの自然言語記述を実行可能な MuJoCo 環境に変換する、実運用用のエージェントシステムである。
シーン合成を4つのステージに分割する: ユーザ意図を構造化されたシーンプランに変換するオーケストレータ、キャッシュされた資産を取得または新しい3D幾何学を生成するアセットフォージ。
このシステムは、WebSocketプログレスストリーミング、MinIOベースのメッシュストレージ、Qdrantベースのセマンティックアセット検索、Redisジョブ状態、InfluxDBテレメトリを備えた9サービスDockerスタックとしてデプロイされる。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:14:20 GMT)
FINESSE-Bench: A Hierarchical Benchmark Suite for Financial Domain Knowledge and Technical Analysis in Large Language Models [0.3] FINESSE-Benchは、大規模言語モデルにおける金融能力の階層的評価のための3,993の質問を含む8つの特別なベンチマークスイートである。
複数質問、数値回答、短いオープンエンド応答を含む統一評価プロトコルについて述べる。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:53:51 GMT)
LoMETab: Beyond Rank-1 Ensembles for Tabular Deep Learning [0.3] 我々は、乗法的暗黙のアンサンブルのランク-$r$の一般化であるLoMETabを提案する。
LoMETabはランク-1のBatchEnsemble/TabM変調をランク-r$のID-Residual Adamardファミリーに引き上げる。
実験により,この付加能力はトレーニング後の測定可能な予測多様性として現れることが示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:47:16 GMT)
Belief Engine: Configurable and Inspectable Stance Dynamics in Multi-Agent LLM Deliberation [0.3] 信念エンジン(Belief Engine, BE)は、ある命題に関する明白な状態として「信」を扱う、監査可能な信条更新層である。
BEは、構造化メモリに引数を抽出し、エビデンスUを取り込み、aをアンカーする前に制御されたログオードルールでスタンスを更新する。
DEBATEは、事前/ポストの意見を持つ人間の議論データセットで、BEは、最後のスタンスで証拠を抽出した参加者を最もよく再構成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:13:12 GMT)
Holistic Evaluation and Failure Diagnosis of AI Agents [0.3] 本稿では,トップダウン診断とボトムアップスパンレベル評価を組み合わせた総合的エージェント評価フレームワークを提案する。
この分解は任意の長さのトレースにスケールし、各評定に対してスパンレベルの有理数を生成する。
TRAILベンチマークでは、我々のフレームワークはすべてのメトリクスで最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:12:39 GMT)
Automatic Landmark-Based Segmentation of Human Subcortical Structures in MRI [0.3] 我々はハーバード大学のマニュアルセグメンテーションプロトコルであるOxford Atlasを明示的に模倣したランドマーク誘導型3D脳セグメンテーション手法を提案する。
Global-to-Localネットワークは、キーの皮質下参照ポイントを表す16のランドマークを自動的に検出する。
意味的セグメンテーションモデルは、12の解剖学的ラベルの粗いセグメンテーションを生成し、それぞれ複数の皮質下領域をグループ化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:31:02 GMT)
Error Mitigation in Dynamic Circuits for Hamiltonian Simulation [0.3] 動的量子回路は、中間回路の測定とフィードフォワード演算を統合する。
これらの機能は、量子エラー補正のような重要な量子プロトコルの中心である。
実際の量子ハードウェア上で動的回路を実行することは、重要なトレードオフをもたらす。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:59:20 GMT)
QuantFPFlow: Quantum Amplitude Estimation for Fokker--Planck Policy Optimisation in Continuous Reinforcement Learning [0.3] 我々は,Fokker-Planck(FP)の定式化に量子振幅推定を統合する強化学習フレームワークであるtextbfFPFlowを紹介する。
古典的な連続空間エージェントは FP 分割関数 $Z = int e-V(mathbfx)/D,dmathbfx$ at cost $calO (1/varepsilon2)$; QuantFlow を Grover 増幅振幅推定器で置き換えて $calO (1/varepsilon)$ -- a とする。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:35:38 GMT)
In-IDE Toolkit for Developers of AI-Based Features [0.2] 我々はJetBrainsのAI Toolkitプラグインを紹介し、Run/Debugループに直接トレースと評価をもたらす。
AIエージェントとAI評価の設計と実装について詳述し、最初の採用テレメトリを報告し、フレームワークのカバレッジとスケール評価を拡大するための次のステップを概説する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:28:14 GMT)
(How) Do Large Language Models Understand High-Level Message Sequence Charts? [0.2] 大規模言語モデル(LLM)は、ソフトウェア開発ライフサイクル全体にわたってタスクを自動化するために広く使われています。
しかしながら、これらのタスクが処理対象のアーティファクトのセマンティクスに関して一貫して実行されるかどうかは不明である。
LLMがHMSCのセマンティクスを「理解」するかどうかを3つのLLMを用いて検討し、19のセマンティクスタスクの実行方法について検討した。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:48:10 GMT)
Enabling Adversarial Robustness in AI Models through Kubeflow MLOps [0.2] 本稿では,クラスタにデプロイされたAIモデルのセキュリティ対策について述べる。
提案アーキテクチャでは,KubeflowベースのMLOpsを統合して,推論フェーズ中の敵攻撃を自動的に検出する。
実験により, 展開された防御がモデルに強固に作用し, 攻撃による劣化に対する精度を著しく回復することが示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:45:36 GMT)
Video Reconstruction using Diffusion-based Image-to-Video Generation with Trajectory Guidance [0.2] 本報告では, 無人水上機による海中機動のドローン映像において, 欠落したフレームや落落したフレームを再構成する問題に対処する。
我々は,生のGPSテレメトリと単一の参照フレームを,事前学習した画像-映像拡散モデルを用いて,軌跡誘導映像シーケンスに変換するパイプラインを提案する。
搭載されたテレメトリログからのGPS座標は、等角写像によって画像空間に投影され、SG-I2V拡散モデルが条件となる車両ごとのモーションキューを生成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:38:23 GMT)
Adesua: Development and Feasibility Study of an AI WhatsApp Bot for Science Learning in West Africa [0.2] Adesua(アデスア)は、WhatsAppに本拠を置く科学教育のためのAIインストラクションアシスタントである。
システムは、カリキュラムされた教科書と33年間の全国試験の質問を生成AIと統合する。
学生は科学の質問をしたり、トピックや試験年度ごとにタイムドや未タイムの多重選択テストを受けたり、即時評価を受けることができる。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:04:39 GMT)
Eskwai for Students: Generative AI Assistant for Legal Education in Ghana [0.2] Eskwai for Students(エスクウェイ・フォー・学生)は、法学の学生が法律の教育を受けるのを助けるAIアシスタントである。
ガーナでは12K以上のケース法と1.4K以上の法律のキュレートされたデータベースに、幅広い法的問題に対する回答を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:10:32 GMT)
Neurodata Without Boredom: Benchmarking Agentic AI for Data Reuse [0.1] 神経科学データは、実験室、フォーマット、実験パラダイムで非常に断片化されている。
多様な実験に対応するのに十分なフレキシブルなフォーマットは、自己説明が可能であることは滅多にない。
汎用的なコーディングエージェントは各サブタスクでうまく動作したが、完全にエラーのないエンドツーエンドのソリューションをまとめることはめったにない。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:55:46 GMT)
Mapping AI Programs in the U.S: A Status Report from Early 2026 and an Analysis of AI Majors and Minors [0.1] 2026年春の米国における学部人工知能(AI)プログラムの現状について報告する。
米国におけるAI教育の状況を追跡するために動的に更新されるスクレーピングとマッピングツールについて説明する。
1)米国でのAIプログラムの記録、2)AIプログラムとその要件を探索するツール、3)66人のAIメジャーと87人のAI未成年者に必要なコースの分析。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:01:25 GMT)
Nonreciprocal magnon-magnon entanglement in a spinning cavity-magnon system [0.1] 2つのイットリウム鉄ガーネット球からなるハイブリッド系における非相互マグノン-マグノンエンタングルメントの生成手法を提案する。
エンタングルメントは大幅に拡張され,結果として得られるエンタングルメントは非相互性を示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:17:38 GMT)
Fluency and Faithfulness in Human and Machine Literary Translation [0.1] 文学翻訳は、ソースへの忠実さとターゲット言語流布のバランスをとる必要がある。
近年の大規模言語モデル (LLM) は、しばしば流動的な翻訳を生成するが、文中の意味保存に流布が対応するかどうかは不明である。
本研究は, 人, Google翻訳, TranslateGemma翻訳を含む16の語源言語における106の小説から130,486節の翻訳文を用いて, この関係を検証した。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:00:34 GMT)
Exemplar Partitioning for Mechanistic Interpretability [0.0] 大規模言語モデルのアクティベーションから解釈可能な特徴辞書を構築するための教師なし手法を提案する。
Exemplar Partitioning (EP) 辞書は、リーダークラスタリングストリームアクティベーションによって構築された、活性化空間のボロノイ分割である。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:15:30 GMT)
Beyond AI as Assistants: Toward Autonomous Discovery in Cosmology [0.0] 人工知能(AI)エージェントの最近の進歩は、自律的な科学的発見に向けたツールを超えて、AIを推し進めている。
textttCMBEvolve と textttCosmoEvolve の2つの相補的エージェントシステムについて論じる。
宇宙論は、AI科学者システムの開発において、制御されたベンチマークタスクと現実的なオープンな研究課題の両方を提供することができるかを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:58:12 GMT)
Non-Monotonic Latency in Apple MPS Decoding: KV Cache Interactions and Execution Regimes [0.0] 我々は,Apple MPSバックエンドにおける予期せぬ非単調遅延挙動を同定した。
特定のデコード-予算間隔で最大21倍のレイテンシのスパイクを観測し、次いで隣接する構成でのリカバリを行った。
これらの結果から,MPSの自己回帰復号化は,粗粒度ベンチマークでは得られない離散的な実行機構に入ることが示唆された。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:50:32 GMT)
GenCircuit-RL: Reinforcement Learning from Hierarchical Verification for Genetic Circuit Design [0.0] 我々は階層的検証報酬に基づいて構築された強化学習フレームワークであるGenCircuit-RLを紹介する。
また、SynBio-Reasonは、6つの標準回路タイプと9つのタスクにまたがる4,753個の回路のベンチマークである。
得られたモデルは、トポロジカルに正しい回路を生成し、新しい生物学的部分に一般化し、合成生物学文献から標準設計を再発見する。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:18:09 GMT)
Blind Quantum Computation on a Modular Superconducting Processor [0.0] クラウドベースの量子プロセッサは、リモートサーバにホストされた高度なハードウェアへのアクセスを提供するが、データやアルゴリズムのプライバシは保証しない。
ブラインド量子計算は、クライアントがタスクまたは最終結果に関する情報を開示することなくアルゴリズムを実行できるようにすることで、情報理論のプライバシを提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:11:33 GMT)
Nonlinear Hamiltonians and Boolean satisfiability [0.0] スケーラブルなフォールトトレラント量子コンピュータを1つ以上のアンシラ量子ビットに結合する量子計算の拡張モデルを考える。
ここでは、異なるハミルトニアンによって生成される3種類の状態判別器について考察する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:32:16 GMT)
nASR: An End-to-End Trainable Neural Layer for Channel-Level EEG Artifact Subspace Reconstruction in Real-Time BCI [0.0] アーティファクトサブスペース再構成(Artifact Subspace Reconstruction, ASR)は、EEGベースのBCIアプリケーションにおいて最も広く使われているアーティファクトフィルタリング手法の1つである。
我々は,アーティファクトの拒絶と下流の復号化を共同で最適化する,新しいエンドツーエンドのトレーニング可能なKeras層であるnASRを提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:15:57 GMT)
XFP: Quality-Targeted Adaptive Codebook Quantization with Sparse Outlier Separation for LLM Inference [0.0] XFPはコードブックのサイズ、アウトリーチ予算、レイヤごとのパッケージを自動的に決定する。
XFPはワークステーションハードウェア上で128 tok/sのシングルストリームデコードに達する。
対象メモリエンベロープに収まらないモデルに対しては、H-Processを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:52:31 GMT)
WriteSAE: Sparse Autoencoders for Recurrent State [0.0] 本稿では,ステートスペースおよびリカレント言語モデルの行列キャッシュ書き込みを分解・編集する最初のスパースオートエンコーダWriteSAEを紹介する。
既存のSAEは残余ストリームを読み取るが、Gated DeltaNet、Mamba-2、RWKV-7はランク1更新を通じて$d_kのd_v$キャッシュに書き込む。
WriteSAEは、各デコーダ原子をネイティブ書き込み形式に分解し、トーケンごとのロジットシフトのクローズドフォームを公開し、マッチしたフロベニウス標準の下での列車は一度に1つのキャッシュスロットを交換する。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:27:35 GMT)
Wavelet-Based Observables for Koopman Analysis: An Extended Dynamic Mode Decomposition Framework [0.0] ウェーブレットに基づく可観測関数を導入し、それらがクープマン半群の固有函数であることを示す。
次に、クープマン半群の作用とその分解剤の閉形式表現を、これらの可観測性の観点から構成する。
クープマン半群の作用を数値的に近似するために,拡張動的モード分解(EDMD)とウェーブレットに基づく観測器を組み合わせる。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:35:05 GMT)
Universal Approximation of Nonlinear Operators and Their Derivatives [0.0] デリバティブ・インフォームド・オペレーター・ラーニング(DIOL)は、オペレーター・ラーニング(OL)の影響力のある分野の基礎となるオープン・リサーチ・フロンティアである。
バナッハ空間とその微分の間の非線型$k$-times微分作用素の最初の普遍近似定理(UATs)を証明する。
我々の結果は、[Hornik, 1991] における対応する影響のある古典的な結果から無限次元の設定と OL への最初の完全一般化である。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:00:58 GMT)
Trustworthy Multi-Agent Systems: Mitigating Semantic Drift with the Argent Signaling Protocol [0.0] 本稿では,構造化された品質信号にAI生成応答を伴い,コンパクトなヘッダであるArgent Signaling Protocol(ASP)を紹介する。
これらの信号は、コントローラが修理可能な障害と封じ込め可能な障害を区別し、各ケースを異なる経路でルーティングすることを可能にする。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:25:02 GMT)
Translation symmetry-enforced long-range entanglement in mixed states [0.0] 翻訳対称性は対称短距離エンタングルド(SRE)固有状態(英語版)(symmetric short-range entangled (SRE) eigenstates)を許容するが、そのようなSRE固有状態が零運動量セクターにまたがるほど不十分であることを示す。
これは、長距離連結相関関数によって検出できない混合状態における長距離絡み合いの微妙な形式である。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:57 GMT)
Transient dynamics of parametric driving for single-electron image current detection in a Paul trap [0.0] パラメトリックドライブの制御されたランプは、過渡状態における電子運動の周波数を効果的にロックすることを示す。
この研究は、ポールトラップにおける単電子運動の非破壊検出の実験的実現の道を開く。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:08:33 GMT)
Transformer Scalability Crisis: The First Comprehensive Empirical Analysis of Performance Walls in Modern Language Models [0.0] 本稿では,7つの異なるアーキテクチャカテゴリにまたがる118変圧器モデルの大規模評価を行う。
私たちの体系的なベンチマーク手法は、重要なスケーラビリティ危機を明らかにします。
以上の結果から,O(n2)注目の複雑さが測定可能な性能壁へと変換されるという,最初の定量的証拠が得られた。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:57:15 GMT)
Towards Deploying Optimistic Quantum Fourier Transforms: An Architecture-Algorithm Co-Design Study [0.0] 我々は、再構成可能な中性原子ハードウェアのための表面コードフォールトトレラント実行モデルの下で、OQFT(Optimistic Quantum Fourier Transform)のアーキテクチャと設計の共設計について述べる。
本分析では, 資源推定の主要因として, 反応制限操作と需要を同定し, プリミティブベースアーキテクチャ研究のための一般化可能な基盤を確立する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:11:04 GMT)
TopoPrimer: The Missing Topological Context in Forecasting Models [0.0] TopoPrimerは,時系列のグローバルなトポロジカルな構造を,任意の予測モデルに対する明示的な入力とするフレームワークである。
TopoPrimerは、さまざまな領域にわたる精度を改善し、季節的な需要急増下での予測を安定化し、コールドスタートギャップを閉じる。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:30:25 GMT)
Tokenizer Fertility and Zero-Shot Performance of Foundation Models on Ukrainian Legal Text: A Comparative Study [0.0] われわれは、ウクライナの州登録簿から検証された273の判決に対して、5つのプロバイダから7つのモデルをベンチマークした。
Qwen3モデルはラマ系モデルよりも60%多くトークンを消費する。
ショットのプロンプトによってパフォーマンスが最大26ポイント低下する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:35:05 GMT)
The influence of strong coupling between single-photon source and spectral filter on photon statistics [0.0] 光単一光子源とフォトニック集積回路を結合する最も一般的なアプローチの1つは空洞を使用することである。
キャビティはスペクトルフィルタとして機能し、光スペクトルを歪め、その統計的性質を変化させる。
我々は、単一光子源から放射される光の光子統計にスペクトルフィルタリングのみに影響を及ぼすキャビティの影響を効果的に説明するための分析モデルを構築した。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:20:30 GMT)
The Impact of AI Search on the Online Content Ecosystem: Evidence from Google and Reddit [0.0] 結果ページに直接回答を要約する生成AI検索ツールは、ソースプラットフォームへの訪問を任意にすることで、この関係を阻害する可能性がある。
この質問は、Google AI OverviewsとRedditを使って研究しています。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:07:42 GMT)
The Heisenberg-Weyl-parity group its coherent states and a unified Wigner-Weyl function [0.0] ハイゼンベルク・ワイル群 $HW(d)$ と$d$次元ヒルベルト空間 $H(d)$ はパリティ変換を含むハイゼンベルク・ワイルパリティ群 $HWP(d)$ に拡大される。
HWP(d)$ は可解群であることが示され、その要素の交換子は量子状態の変位とパリティ変換を行う。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:30:59 GMT)
Text-Dependent Speaker Verification (TdSV) Challenge 2024: Team Naive System Report [0.0] このシステムは0.0461の最小検出コスト関数(MinDCF)と1.3%の等誤差率(EER)を達成した。
我々のアプローチは、既存の最先端ニューラルネットワークであるResNet-TDNNとNeXt-TDNNの適応に重点を置いていた。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:38:11 GMT)
Temporal Fair Division in Multi-Agent Systems: From Precise Alternation Metrics to Scalable Coordination Proxies [0.0] 本稿では、回転周期性(RP)の導入による時間的公正分割の理論を推し進める。
RPは時間的公正性を2つの補完的尺度に分解する:回転スコア(RS)と待ち時間評価(WPE)
論文参考訳(メタデータ) (Thu, 14 May 2026 14:23:32 GMT)
Telecom-Wavelength-Compatible Quantum Information Transcription Using Nitrogen-Vacancy Centers [0.0] ダイヤモンド中の窒素空孔(NV)センターは、固体量子センシングと量子情報処理の主要なプラットフォームである。
赤外線放射の波長分解光磁気共鳴(ODMR)測定について報告する。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:12:46 GMT)
Talk is (Not) Cheap: A Taxonomy and Benchmark Coverage Audit for LLM Attacks [0.0] 攻撃ベンチマークが脅威面を網羅するかどうかを監査するための再利用可能なフレームワークを導入する。
これを6つの公開ベンチマークに適用すると、3つの主要なフレームワークが行列の25%をカバーしている非重複セルを占有していることが分かる。
2,521の独特な攻撃集団のコーパスは、広範囲にわたる命名の断片化と、セーフティ・アンド・アライメント・バイパスにおける集中度を明らかにしている。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:30:36 GMT)
TFGN: Task-Free, Replay-Free Continual Pre-Training Without Catastrophic Forgetting at LLM Scale [0.0] 本稿ではトランスフォーマー言語モデルのためのアーキテクチャオーバーレイであるTFGNを紹介する。
TFGNは入力条件付きパラメータ効率の更新を生成し、残りのトランスは変更しない。
我々の知る限り、TFGNはLLMスケールでの破滅的な忘れを同時に閉じる最初のアーキテクチャである。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:46:26 GMT)
TERRA-CD: Multi-Temporal Framework for Multi-class and Semantic Change Detection [0.0] TERRA-CDは、2019年と2024年の5,221のSentinel-2イメージペアからなるベンチマークデータセットである。
データセットには,4クラスの土地被覆マッピングマスク,3クラスの植生変化マスク,13クラスの意味変化マスクの3つの異なるアノテーションスキームがある。
植生の多クラス変化検出とセマンティック変化検出の両方に対するデータセットの有効性を評価した。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:08:51 GMT)
SurgicalMamba: Dual-Path SSD with State Regramming for Online Surgical Phase Recognition [0.0] オンライン外科的位相認識(SPR)は、コンテキスト対応の手術室システムを支える。
我々は,O(d)におけるフレーム単位のコストを保持するMamba2の構造化状態空間双対性(SSD)に基づくモデルであるStagementMambaを提案する。
7つの公開SPRベンチマークで、OssageMambaは最先端の精度とフェーズレベルのJaccardに達した。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:34:55 GMT)
Stopping Reliability in Adaptive Krylov-Shadow Quantum Fisher Information Estimation [0.0] アダプティブ量子フィッシャー情報(QFI)推定は、精度と明らかな数値安定性を区別する停止規則を必要とする。
区間幅と局所クリロフ安定性に基づく幅のみの経験的停止則は,ポストホック誤差が要求される許容値を超えた場合でも,小さい$(K,M)$で収束を宣言できることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:02:23 GMT)
Spin chirality across quantum state copies detects hidden entanglement [0.0] 絡み合いは2つの根本的に異なる方法で隠すことができる。
有界な絡み合った状態は正の部分的な転置を持ち、ペレス・ホロデツキの基準には見えない。
部分転位と純度の間のモーメント差がキラリティー-キラリティー相関器として正確に分解されることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 07:59:40 GMT)
Singular Asymptotics of SPADE in Quantum Source Discrimination [0.0] 弱および密接な空間を持つエミッタの特異な状態における1点と2点の非コヒーレントな点源の遠距離場判別について検討した。
理想的なアライメントの下で、空間モードデマルチプレクシング(SPADE)は量子自明な大きなスタイン特異点を得る。
そこで本研究では,不整合二元SPADEと直接撮像が,異なる内在的スケールで非局所的パワーを得ることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:26:41 GMT)
Single Spatio-Temporal Mode Bright Twin-Beam Source Across the Near- and Mid-Infrared [0.0] 超高速, 明るい, 絡み合ったツインビーム源を, 周期的に置換したニオブ酸リチウムの0型パラメトリックダウンコンバージョンにより, MHz繰り返し速度で導入する。
明るい数モードの制限では、全絡み合い資源は、モダリティと職業的自由度の間で明確に分離されていることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:15:37 GMT)
Second-order moment equivalence of twisted Gaussian Schell model beams and orbital angular momentum eigenmodes [0.0] 任意の円筒対称コヒーレント軌道角運動量 (OAM) の固有モードと量子数$ell$の共分散行列は、$langle r2rangle$, $langle k_r2rangle$, $ell$のみに依存する普遍形式をとることを示す。
我々は、各コヒーレントOAMモードが物理的に実現可能なTGSMビームにマップされる条件を導出する。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:48:36 GMT)
Second-Order Actor-Critic Methods for Discounted MDPs via Policy Hessian Decomposition [0.0] 目的の曲率情報をフル活用したアクター更新の2次近似を解析する。
本研究では,この近似が2段階のアクター批判的枠組みの下で適切に修正されることを示す。
この知見に基づいて、割引報酬設定のための2次アクター批判法を定式化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:46:27 GMT)
Saturating Scaling Laws for Equational Discovery: A Phenomenology of Growth Dynamics in Three Toy Substrates with Two Real-World Replications [0.0] 決定論的方程式発見基板における成長ダイナミクスについて検討する。
短距離基板サイズは、tbに比例するパワーローN(t)に適合する。
飽和パワーロー dN/dt = K Nk exp(-mu N) で、純粋なパワーローが短距離近似である。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:37:29 GMT)
SAGE3D: Soft-guided attention and graph excitation for 3D point cloud corner detection [0.0] 本稿では,空中LiDAR点雲における角検出のためのハイブリッドトランスフォーマーモデルであるSAGE3Dを提案する。
本稿では,階層型エンコーダデコーダアーキテクチャ上に構築されたマルチステージソリューションを提案する。
我々は、Soft-Guided AttentionとExcitatory Graph Neural Networkの2つのイノベーションを紹介した。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:08:35 GMT)
Rovibrational structure and electric dipole moments of the AcOCH$_3$+ ion [0.0] 本稿では,AcOCH$_3+$対称トップ分子の最低公約状態のスペクトルについて検討する。
振動周波数および可視状態に対する電気双極子モーメントの値について計算した。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:32:42 GMT)
Resource theory of coherence in continuous position basis from measurement-induced dephasing [0.0] 我々は、連続的に量子コヒーレンスを直接扱うための資源理論フレームワークを開発する。
ランダムな運動量キックに基づく物理的動機付け型デファスティングチャネルを導入する。
連続基底コヒーレンスが非空対角状態の集合よりもデフォーカス障害に結びついていることが示される。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:06:59 GMT)
RAMS: Resource-Adaptive and Detection-Conditioned Model Switching for Embedded Edge Perception [0.0] 組込みハードウェア上でのエッジオブジェクト検出には、リソースの圧力変化による推論遅延と検出品質のバランスが必要である。
本稿では, デバイス圧力を監視し, アイドル動作からしきい値の切り換えを校正し, 3つのYOLOv8階層の中から動的に選択するランタイムコントローラであるRAMSを提案する。
Raspberry Pi 5、x86ラップトップ、Jetson Orin ONNX/TensorRTのデプロイでは、同じコントローラ方程式が37倍のレイテンシ範囲で動作する。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:06:42 GMT)
Quasinormal modes and continuum response of de Sitter black holes via complex scaling method [0.0] 複素スケーリング法を4次元シュワルツシルト-デシッター時空のブラックホール摂動に応用する。
特に,分離された準正規モード周波数を超える連続体応答を特徴付ける連続体レベル密度に着目した。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:18:02 GMT)
Quantum-enabled complete RF-polarimetry with an optically-wired atomic sensor [0.0] 一般偏光状態におけるRF場のリドバーグ原子測定について報告する。
ポアンカレ球子子午線を周するストークスベクトルに対して、原子エネルギースペクトルの連続的な変換を目撃する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:11:11 GMT)
Quantum-Secure Physical Unclonable Function enabled by Silicon Photonics Integrated Circuits [0.0] 我々は、単光子状態とPUFを組み合わせた量子読み出しプロトコルを導入し、数値的に評価する。
その結果,10対14という誤差率の低い例外的な性能を示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:27:30 GMT)
Quantum optical synthesis of high-dimensional ultrafast frequency-bin qudits [0.0] ITU規格に適合する複数の離散周波数ビンに連続的なブロードバンド周波数絡み状態を生成し,変換する。
シュミット分解による全量子状態次元を特徴づけ、少なくとも289の周波数結合ヒルベルト空間次元上の下界を観察する。
キャンパススケールの2ノードファイバネットワーク上での伝送実験において,周波数相関による量子非局所性を示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:24:08 GMT)
Quantum battery optimized by parametric amplification [0.0] 2光子駆動のLC共振器が充電器として機能し、トランモン量子ビットの配列が電池として機能する。
2光子パラメトリック駆動は有効キャビティ-キュービット結合を指数関数的に向上させることを示す。
提案手法は, パラメータ障害や環境騒音など, 実用的な実験的欠陥に対して頑健である。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:53:56 GMT)
Quantum Feature Pyramid Gating for Seismic Image Segmentation [0.0] この研究は、ハイブリッドセグメンテーションアーキテクチャである量子特徴ゲーティングを導入している。
パラメータ化量子回路をエンコーダ・デコーダパイプライン内の特徴核融合点に埋め込む。
2018年のTGS Salt Identification Challengeでは、101 x 101の解像度で4,000の地震画像を用いて評価されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:50:01 GMT)
QuChaTeR: A Hybrid Quantum-Chaotic Temporal Framework for Earthquake Prediction [0.0] QuChaTeRは、ウェーブレットベースの前処理、カオスマップ、変分量子回路と繰り返し構造を組み合わせたハイブリッドアーキテクチャで、時間的特徴抽出を強化する。
実世界の地震データセットでは、QuChaTeRは複数の評価基準にまたがって、より高速で優れた性能を一貫して収束させる。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:40:11 GMT)
PyCSP3-Scheduling: A Scheduling Extension for PyCSP3 [0.0] PyCSP$3$にスケジューリング抽象化を追加するライブラリであるPyCSP$3$を提示する。
17のモデル族にまたがる261のペアインスタンスでは、両定式化は同じ目的を72の2倍の最適ペアで生成する。
実行時のパフォーマンスは、家族間でばらつき、いくつかの(最大5.8倍)への明確な利得と、他のものへのレグレッションを持つ。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:33:34 GMT)
Power sensitivity of broadband radiofrequency detectors based on quantum diamond spins [0.0] ダイヤモンド中の窒素空孔(NV)中心は、RF磁場とNVスピンのカップリングを通じて高周波(RF)信号を検出するために用いられる。
我々は理論上,NV系RF検出器のパワー感度をRFスピン界面形状の関数として解析する。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:22:00 GMT)
Position: Ideas Should be the Center of Machine Learning Research [0.0] 機械学習の研究は、理解よりもメトリクスを優先するベンチマーク駆動エンジニアリングと、現代システムへの移行に失敗することが多い理想化された理論の2つの非接続モードにますます分岐している、と私たちは主張する。
我々は,現代のモデルで予測される行動シグネチャに対して,アイデアを価値付けするアイデアファーストフレームワークを提案し,これらのシグネチャは,リーダボードに勝つのではなく,関連するパターンを検出するように設計された調整された実験によってテストされる。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:36:27 GMT)
PickleFuzzer: A Case Study in Fuzzing for Discrepancies Between Python Pickle Implementations [0.0] Pythonのネイティブシリアライゼーションプロトコルである pickle は、信頼できないデータを転送するための強力だが安全でないフォーマットである。
そこで,PickleFuzzerを提案する。
ピクルオブジェクトを生成し、それらを各実装に渡し、スローされた例外の違いや主要な内部状態の変更を検出する。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:07:29 GMT)
Perfect transmission and parallel composition for quantum walks on graphs with two leads [0.0] 2つのリードを持つ有限グラフ上の連続時間量子ウォークを研究する。
有限グラフとその欠落部分グラフの特性の観点から, 2次元散乱行列の明示的な式を導出する。
これにより、所定の透過特性を持つグラフの探索を、より小さなビルディングブロックに対する幾何学的ベクトル和問題に変換する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:57:12 GMT)
Orthologic for SAT Solving [0.0] 我々は,任意の式に対して,等式$leftrightarrow MathrmNF_mathrmOL()$はタウトロジーである,という観測に基づいて,SATベンチマークの族を紹介する。
本研究では, オーソロジー正規化を前処理ステップとして用いることで, SAT解決時間を短縮できることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:05:57 GMT)
Optimizing the preparation of Dicke states using counterdiabatic driving methods [0.0] 非相互作用性2レベル原子系におけるディック状態の効率的な調製に関する理論的スキームを提案する。
ラピッドアダバティックパス(RAP)を用いることで、最初のコヒーレントスピン状態からターゲットディック状態までシステムをいかに操るかを示す。
さらに,非断熱遷移を抑制する反断熱駆動(CD)を導入する。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:58:39 GMT)
Optimal Pattern Detection Tree for Symbolic Rule-Based Classification [0.0] 本稿では,新しい混合整数プログラミングに基づくルールベース機械学習モデルであるOPDT(Optimal Pattern Detection Tree)を提案する。
OPDTは、適度なランタイム内で、適度なサイズのデータセットで最適性を保証するパターンを発見する。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:53:18 GMT)
On the (non-)resilience of encrypted controllers to covert attacks [0.0] ネットワーク制御システム(NCS)のセキュリティは、サイバーセキュリティとシステム理論の両方の観点から注目を集めている。
暗号化制御を用いた場合においても,NASは隠蔽攻撃に対して脆弱であることを示す。
本稿では,現代の同型暗号と一体化して,通信オーバーヘッドを伴わずに暗号的にセキュアな検証可能な計算手法を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:49:46 GMT)
OAM-Induced Lattice Rotation Reveals a Fractional Optimum in Fault-Tolerant GKP Quantum Sensing [0.0] 軌道角モメンタム符号化とGottesman-Kitaev-Preskill(GKP)格子幾何学が構造的に結合していることを確立する。
終端から終端までの微分可能なStrawberry Fields--TensorFlow回路を用いて、$ell$、格子アスペクト比$r$、および有限エネルギーエンベロープ$$を共に最適化し、量子フィッシャー情報を最大化する。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:31:32 GMT)
Novel Dynamic Batch-Sensitive Adam Optimiser for Vehicular Accident Injury Severity Prediction [0.0] 不均衡なデータセットから学習するためのオプティマイザとしてDynamic Batch-Sensitive Adam (DBS-Adam)を提案する。
DBS-Adamは、勾配ノルムの指数的な移動平均とバッチ損失から得られるバッチ困難スコアを用いて、学習率を動的にスケールする。
テスト精度は95.22%、精度96.11%、リコール95.28%、F1スコア95.39%、テスト損失0.0086である。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:06:43 GMT)
Neural Activation Patterns Across Language Model Architectures: A Comprehensive Analysis of Cognitive Task Performance [0.0] 本稿では,6つの大規模言語モデル (LLM) アーキテクチャ間のニューラルアクティベーションパターンを包括的に解析する。
最終的なアクティベーション値、注意エントロピー、空間パターンを体系的に測定することで、エンコーダとデコーダアーキテクチャが多様な認知タスクをどのように処理するかの根本的な違いを明らかにする。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:31:19 GMT)
Mixed-State Long-Range Entanglement from Dimensional Constraints [0.0] 強い対称多体混合状態における長距離絡み合い(LRE)の新しいメカニズムを提案する。
第一の例は、1次元環上の変換不変部分空間における最大混合状態である。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:59:59 GMT)
Mechanical Enforcement for LLM Governance:Evidence of Governance-Task Decoupling in Financial Decision Systems [0.0] 既存の評価はタスクの正確さを測るが、ガバナンスが意思決定の合理化レベルでの振る舞いを制約するかどうかは問わない。
政策コンプライアンスを合理的なレベルで定量化する5つのガバナンス指標を紹介します。
構造的なストレスの下では、テキストのみのガバナンスは両方の次元で同時に低下するのに対して、機械的な執行はタスクのパフォーマンスが低下してもガバナンスの品質を保っている。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:12:42 GMT)
Making OpenAPI Documentation Agent-Ready: Detecting Documentation and REST Smells with a Multi-Agent LLM System [0.0] このケースは、系統的なアーティファクトレベルの評価が戦略的意思決定支援メカニズムとして機能することを示す。
エンドポイントレベルでドキュメントやREST関連の臭いを検出するマルチエージェントLLMベースのシステムであるHermesを開発した。
論文参考訳(メタデータ) (Thu, 14 May 2026 03:23:51 GMT)
Majorana Constellations: A Geometric Lens on Multipartite Entanglement and Geometric Phases [0.0] マヨラナ星表象は抽象量子スピン状態をブロッホ球上の直交幾何学的星座に変換する。
量子情報科学において、このフレームワークは対称多量子系と高スピン系を特徴づけるための強力なレンズを提供する。
本稿では、Majorana表現における絡み合い中心の視点を合成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:09:15 GMT)
Low-rank compression of two-electron reduced density matrices [0.0] 2体還元密度 (2RDM) は電子状態の2電子物理学を符号化するが、その準保存コストは実用上大きな限界をもたらす。
我々は,遷移と非遷移の2RDMの両方を圧縮し,それらのウェッジ生成物の構造と物理的対称性を保持する低ランク表現に変換するための簡単なプロトコルについて検討する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:43:33 GMT)
Interference visibility as a witness of preparation contextuality via overlap inequalities [0.0] 本報告では,一対の可視性測定のみを用いた標準マルチパス干渉法が,非コンテクスト性試験の操作経路を提供することを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:20:24 GMT)
Identifying Culprits Through Deep Deterministic Policy Gradient Deep Learning Investigation [0.0] この研究は、通常、限られたデータ分析に頼っている犯罪捜査を暗示する慣習的な方法に焦点を当てている。
この研究の主な斬新なアプローチは、ディープラーニングアルゴリズムDeep Deterministic Policy Gradient(DDPG)に基づいている。
DDPGは, 犯人を95%の精度で識別する手法の有効性を示した。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:39:17 GMT)
How Sensitive Are Radiomic AI Models to Acquisition Parameters? [0.0] AI放射能システムの臨床ルーチンへの展開の主要な障壁は、異種マルチセント取得プロトコルによるパフォーマンス低下である。
本研究では,放射能AIモデルのスキャンパラメータ感度を定量化する性能指向フレームワークを提案する。
我々は,2つの独立したマルチセントレデータセットを用いたCTスキャンで肺がん診断に枠組みを適用した。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:24:14 GMT)
How Much Can Gravitons Be Squeezed? [0.0] 回転するブラックホールを取り巻く超放射性軸状粒子雲は、最大106$ - 107$の相関量子数を含むグラビトンのマルチモード圧縮状態を生成することができる。
このような状態は、将来の重力波干渉計で検出できる特徴的な偏光相関と量子ノイズシグネチャを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 13:07:02 GMT)
GreenZ: A Sustainable UX Framework for Complex Digital Systems [0.0] 本稿では,複雑なデジタルシステムのための3層サステナブルUXフレームワークであるGreenZを紹介する。
その3つのレイヤは、10の原則に基づいて構築された哲学的レイヤ、5つの適用されたシステムからなる運用フレームワーク層、実用的な監査機器と意思決定モデルのツールとキャンバス層である。
本稿は,フレームワークのアーキテクチャ,概念的基盤,既存の文献に対する立場,確立すべきことの正直な説明について述べる。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:15:56 GMT)
GraphFlow: An Architecture for Formally Verifiable Visual Workflows Enabling Reliable Agentic AI Automation [0.0] GraphFlowは、ミッションクリティカルなプロセスにおけるエージェントAI自動化の信頼性向上を目的とした、ビジュアルワークフローシステムである。
既存のワークフロープラットフォームは、耐久性のある実行と可観測性を提供するが、セマンティックな正確性を保証するものはほとんどない。
3つの臨床現場で1年間のパイロットが8,728件のコホート登録ワークフローを実行し、97.08%の完成率を記録した。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:33:05 GMT)
Gradient-Free Training of Spiking Neural Networks via Low-Rank Evolution Strategies [0.0] ES摂動の低ランク因数分解であるEGGROLLは、世代ごとのメモリを$mathcalO(mn)$から$mathcalO(r(m+n)$に還元する。
本研究では,1世代あたりのウォールタイムをフルランクESと比較して2.23$times$で削減しながら,勾配のないトレーニングが79.21%の精度で達成できることを実証した。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:42:15 GMT)
Generative Deep Learning for Computational Destaining and Restaining of Unregistered Digital Pathology Images [0.0] コンディショナル・ジェネレーティブ・逆数ネットワーク(cGANs)は、デジタル・パスロジー全スライディング・イメージ(WSI)において、高忠実な計算染色とデザートを可能にする。
我々は,H&E安定化WSIに対するヒストグラムに基づく染色正規化と,非定常WSIに対するチャネルワイド強度キャリブレーションからなる前処理パイプラインを開発した。
仮想デテンシングはピアソン相関係数(PCC)0.854、構造類似度指数測定(SSIM)0.699、ピーク信号-雑音比(PSNR)18.41dBを達成した。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:37:58 GMT)
GPU-Accelerated Deep Learning for Heatwave Prediction and Urban Heat Risk Assessment [0.0] 本稿では,次世代の都市熱環境予測のためのGPUに基づくディープラーニングフレームワークを提案する。
提案手法は, 都市熱分析の実践的基盤として利用することができる。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:13:09 GMT)
Fusion-fission forecasts when AI will shift to undesirable behavior [0.0] 社会全体でChatGPTのようなAIが利用している主な問題は、その行動が望ましいものから望ましくないものへと変化し、気付かないものへと変化することである。
生体およびアクティブマターシステムで観測される融合分裂群のダイナミクスの一般化ベクトルが、AIの振る舞いの将来の変化を -- そして予測できることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:26:32 GMT)
Functional-prior-based approaches to Bayesian PDE-constrained inversion using physics-informed neural networks [0.0] 物理インフォームドニューラルネットワーク(fpBPINN)を用いたPDE制約インバージョンに対する機能優先型統一フレームワークを提案する。
1つ目は機能優先のベイズ型PINN(FPI-BPINN)で、ニューラルネットワークの重み付けが所定の機能前と一致していることが学習される。
2つ目は、関数空間上で直接ParVIを用いてベイズ推定を行うPINN(fParVI-PINN)に対する関数空間に基づく変分推論である。
論文参考訳(メタデータ) (Thu, 14 May 2026 00:32:03 GMT)
From Weight Perturbation to Feature Attribution for Explaining Fully Connected Neural Networks [0.0] そこで本稿では,特徴量の重み付けにより特徴量の属性を推定する手法を提案する。
この方法では、Added BiasやOut-of-DistributionデータといったOcclusionテクニックの一般的な制限を緩和することを目的とした、新たな視点を提供する。
私たちの研究は、これらの長年の脆弱性に対処する方法を舗装する堅牢なフレームワークを導入することで、Explainabilityの分野に寄与します。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:41:20 GMT)
From Full and Partial Intraoral Scans to Crown Proposal: A Classification-Guided Restoration Assistance Pipeline [0.0] 口腔内生検とFDI歯数を入力として用いたエンド・ツー・エンドパイプラインを提案する。
パイプラインは、(I)データ準備とポーズ標準化、(II)スキャンタイプでルーティングされたセグメンテーション、(III)コンテキスト認識検索とBlenderベースのフィッティングによるクラウン提案生成の3段階からなる。
パイプラインは2.5-3.5分で予備的なクラウンシェルを生成し、エンドツーエンドの生成アプローチに代わる実用的な代替手段を提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 06:05:32 GMT)
From Data to Action: Accelerating Refinery Optimization with AI [0.0] リファナリー最適化は大量のデータを利用し、現代の線形プログラミング(LP)ソフトウェアで処理できる。
LP出力と一致して, 異常検出を行うツールが提案されている。
高次元データを扱うための新しい手法が提案されている。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:07:41 GMT)
Frequency-domain Event-based Imaging for Selective Surveillance [0.0] 本稿では、ニューロモルフィック処理フレームワークであるイベント空間の周波数レート情報(FRIES)を紹介する。
FRIESは回転回転や機械振動などの事象の周期性を検出し、人工物体の識別と監視を行う。
予備的な結果は、ニューロモルフィックパイプラインにおける選択的監視のための有望なフロントエンドとして周波数領域イベント処理を確立する。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:25:51 GMT)
Fraxonium: Fractional fluxon states for qudit encoding [0.0] 本稿では, リークエラーから保護されたキュディット系を自然に実現した, スペクトルの他の部分とよく分離した, $d$低層状態の超伝導回路を提案する。
提案プラットフォームは、量子ビットパラダイムを超えて、回路工学と量子コンピューティングの新たな視点を開放する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:58:07 GMT)
Falkor-IRAC: Graph-Constrained Generation for Verified Legal Reasoning in Indian Judicial AI [0.0] 本稿では,インド法定AIのためのグラフ制約付き生成フレームワークであるFalkor-IRACを提案する。
裁判所の判断は、手続き的状態遷移、前例的な関係、および法定参照に富むIRACノード構造として取り入れられる。
推測時、LLM生成された回答は、有効な支持パスがグラフを通してトレース可能である場合にのみ受け入れられる。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:19:23 GMT)
Evolution of Gaussian mixed states under the Markovian master equation for a driven quantum oscillator [0.0] 高速回転モードは線形駆動力下での系の変位ダイナミクスに影響を与えないことを示す。
本稿では,外的時間依存力がインパルス力と高調波力を用いて変位ダイナミクスにどう影響するかを論じる。
論文参考訳(メタデータ) (Thu, 14 May 2026 12:21:53 GMT)
Eradicating Negative Transfer in Multi-Physics Foundation Models via Sparse Mixture-of-Experts Routing [0.0] Shodh-MoEはマルチ物理輸送のためのスパース活性化潜在トランスフォーマーアーキテクチャである。
Top-1ルータは、ローカライズされた潜伏パッチをエキスパートワークに動的に割り当てる。
結果は、汎用神経オペレーターにおける多物理干渉を緩和するための実用的なアーキテクチャメカニズムとしてスパースエキスパートルーティングをサポートする。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:58:15 GMT)
Entity-Centric World Models: Interaction-Aware Masking for Causal Video Prediction [0.0] JEPA(Joint Embedding Predictive Architectures)はセマンティックな分類のベンチマークを新たに設定した。
本稿では,自己監督型動き中心マスキング戦略を利用したInteraction-Aware JEPA (IA-JEPA)を提案する。
IA-JEPAは因果推論タスクで14.26%の精度を達成しており、標準的なパッチメイクベースラインで達成された3.22%を大きく上回っている。
論文参考訳(メタデータ) (Thu, 14 May 2026 23:10:04 GMT)
Ensemble Monitoring for AI Control: Diverse Signals Outweigh More Compute [0.0] 多様なモニタからの信号をアンサンブルに組み合わせることで、不整合動作の検出が向上することを示す。
GPT-4.1-Miniモニタを12台構築する。
ベスト3モニタアンサンブルは、3つの同一モニタからなるアンサンブルに比べて2.4倍高い検出性能が得られる。
論文参考訳(メタデータ) (Thu, 14 May 2026 20:06:52 GMT)
Energy-space quantum walks: Thermalization without state convergence [0.0] 本研究では, 有効力学の観点から, 平衡, 熱化, 可逆性について検討する。
ウォークの構成空間をエネルギー固有レベルのはしごにマッピングすることにより、熱化をエネルギー空間の輸送として再解釈する。
その結果、コヒーレンスは非熱的挙動の制御可能かつ定量的に束縛された源として機能することが示された。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:06:11 GMT)
Efficient ultrafast homodyne detection of quantum light [0.0] 本稿では,検出信号の時間相関を利用して,高速なホモダイン検出手法を提案する。
我々は,超高速ホモダイン検出の信号対雑音比を大幅に向上させ,検出効率を向上する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:05:13 GMT)
Efficient Dense Matching for Enhanced Gaussian Splatting Using AV1 Motion Vectors [0.0] 3D Gaussian Splatting (3DGS) はリアルタイム・フォトリアリスティックなシーン再構築のための重要なフレームワークとして登場した。
AV1ベースの特徴検出およびマッチングパイプラインを導入し、SfM処理のオーバーヘッドを大幅に削減する。
我々のパイプラインは、古典的なSfMの最大8倍の高密度の点雲を生成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:41:19 GMT)
Dynamics of the Transformer Residual Stream: Coupling Spectral Geometry to Network Topology [0.0] トレーニングでは,大規模言語モデルにおいて,深度を経た単調スペクトル勾配を推定する。
実験の結果、この勾配と次元の崩壊は建築というよりむしろ学習されていることが明らかとなった。
これらの結果は、摂動伝播と圧縮をネットワークの機能的トポロジーにリンクするLLMの学習されたスペクトル幾何学をマッピングする。
論文参考訳(メタデータ) (Thu, 14 May 2026 01:57:47 GMT)
Distance-Preserving Digests: A Primitive for BFT Consensus [0.0] 本稿では,8次元空間における衝突耐性ハッシュを可換ベクトル和に置き換えるプリミティブである距離保存トランザクションダイジェストを提案する。
検証者が同意した際の単一ラウンド最終性を達成する二相BFTプロトコル,10個のバリデータからなるグループ間の木構造コンセンサス (vs 128 in shard) の実現,グループ単位のBFTに対する距離フィルタリング,ペア毎の128バイトでのクロスシャード整合性検証,2相コミットのトランザクション間調整に代わる2相BFTプロトコル,の3つの応用を実演する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:44:04 GMT)
Diagnosing and Mitigating Domain Shift in Permission-Based Android Malware Detection [0.0] マシンラーニングベースのAndroidマルウェア検出は、ドメインシフトによって現実のデプロイメントで失敗することが多い。
本稿では、クロスドメイン条件下でのパーミッションベース検出器の一般化可能性と解釈性について包括的に研究する。
論文参考訳(メタデータ) (Thu, 14 May 2026 05:08:23 GMT)
Deforming the Trail: Baseline Quantum Circuitry for $\text{SU(2)}_k$ Lattice Gauge Theory [0.0] 我々は、ゲージ不変完備化の戦略を提供し、ユニタリティを計算ヒルベルト空間全体へ拡張する。
変形したプラケット作用素の物理的ヒルベルト空間次元は、定数係数の非変形的因子と同値であることを示す。
Q-変形は、量子回路合成の利点を提供する信頼性の高いトランケーションとして精査され続けている。
論文参考訳(メタデータ) (Thu, 14 May 2026 17:01:35 GMT)
Correctness-Aware Repository Filtering Under Maximum Effective Context Window Constraints [0.0] コンテキストウィンドウ効率は、大規模言語モデル(LLM)ベースの開発ツールの実践的な制約である。
トークン化前のレポジトリスキャンをインターセプトする,正当性を考慮したコンテキスト衛生フレームワークを提案する。
対照的に、我々のフレームワークはインデクシングを必要とせず、ファイル決定あたり0.01msで動作する。
論文参考訳(メタデータ) (Thu, 14 May 2026 04:37:39 GMT)
Complacent, Not Sycophantic: Reframing Large Language Models and Designing AI Literacy for Complacent Machines [0.0] 我々は、梅毒は動機と戦略的意図を意味すると論じている。
このリフレーミングは、モデルではなく、開発者や機関にエージェンシーを配置する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:24:28 GMT)
Coherent States of Non-Null Torus Knots [0.0] 真空中でのマクスウェル方程式の古典的非零トーラスノット解に対応する量子化電磁場に対するコヒーレント状態を構築する。
論文参考訳(メタデータ) (Thu, 14 May 2026 21:06:56 GMT)
Beyond Performance Disparities: A Three-Level Audit of Representational Harm in CelebA [0.0] 本稿では,年齢と美の男女差がデータにエンコードされ,モデル行動に再現されるかを検討する。
女性の顔は、年齢や男性によってコードされたクラスターに割り当てられると、厳しい罰を受ける。
年上の男性は最も精度が高いが、平均的な正確度は低く、データセットの評価テンプレートの外側の群を分類的に排除することを示している。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:25:17 GMT)
Autonomous Intelligent Agents for Natural-Language-Driven Web Execution with Integrated Security Assurance [0.0] 本稿では、ナビゲーション信頼性、コンテキスト対応セレクタ生成、ポストジェネレーションバリデーション、スマートウェイトインジェクション、障害学習に対処するAI駆動の自律テストフレームワークを提案する。
4つのプロダクションアプリケーションと176のシナリオで評価されたこのフレームワークは、スクリプト生成の成功を55%から93%に改善し、ナビゲーション障害を8倍削減し、タイミング関連の競合条件の80%を排除し、手動のSeleniumオーサリングと比較してテスト生成時間を75%短縮する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:00:30 GMT)
Automatic Construction of a Legal Citation Graph from 100 Million Ukrainian Court Decisions: Large-Scale Extraction, Topological Analysis, and Ontology-Driven Clustering [0.0] ウクライナの裁判所決定から抽出された1070万件の訴訟の端は、司法の引用構造が監督なしで法域の境界をコードしていることを示している。
完全SRレジストリから最初の大規模引用グラフ(9950万全文、1.1TB)を構築する。
論文参考訳(メタデータ) (Thu, 14 May 2026 19:42:20 GMT)
Are free choices absolute, when internalized in Wigner's friend? [0.0] ウィグナーの思考実験は、量子理論の測定問題を例証している。
我々は、同じ局所性の概念の下で自由選択の絶対性に反対する議論を示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:21:35 GMT)
An Amortized Efficiency Threshold for Comparing Neural and Heuristic Solvers in Combinatorial Optimization [0.0] ニューラル最適化ソルバの一般的な批判は、それらはCPUメタヒューリスティックスよりもエネルギー効率が低いことである。
本稿では,「トレーニングは高価」から「ニューラルソルバはネット非効率」への推論ステップについて検討する。
2つの解法間の累積エネルギー比は、ネットワークがインスタンス当たりの勝利を勝ち取ると、常に1以下になる傾向があることを示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 09:39:15 GMT)
All-atomistic Transferable Neural Potentials for Protein Solvation [0.0] 入射溶媒モデル(英語版)は、溶媒の自由度を減少させ、水分子を含まない溶媒エネルギーの計算を可能にするために広く用いられている。
近年の神経電位の進歩は薬物発見の可能性を示唆しているが、伝達性は持続的な課題である。
本稿では,最終エネルギーにポストホック調整を適用するのではなく,モデルパラメータへの変換可能な補正を学習することにより,解析的連続解法を拡張する暗黙の解法モデルであるPhitary Hydration Neural Network(PHNN)を紹介する。
論文参考訳(メタデータ) (Thu, 14 May 2026 08:54:41 GMT)
Agentic Design of Compositional Descriptors via Autoresearch for Materials Science Applications [0.0] 自動検索エージェントがモデル選択以上のタスクを実行できるかどうかを検証するために,合成ベース素材の適正性予測を用いる。
本稿では,大規模言語モデルに基づく自動検索フレームワークであるAutomatを紹介し,化合物の合成専用記述子を生成する。
論文参考訳(メタデータ) (Thu, 14 May 2026 10:30:17 GMT)
Agentic AI Ecosystems in Higher Education: A Perspective on AI Agents to Emerging Inclusive, Agentic Multi-Agent AI Framework for Learning, Teaching and Institutional Intelligence [0.0] 本稿では,高等教育におけるエージェント型マルチエージェントAIプラットフォームについて,今後の展望を示す。
エージェントAIは第三次教育における次世代のインテリジェントシステムを表現することができるだろうか?
このようなシステムは、特別な教育ニーズを持つ多様な学習者に対して、包括的で公平な学習を促進することができるのか?
論文参考訳(メタデータ) (Thu, 14 May 2026 02:11:07 GMT)
Adaptive Consensus in LLM Ensembles via Sequential Evidence Accumulation: Automatic Budget Identification and Calibrated Commit Signals [0.0] DASEは、ベンチマークをまたいで一般化するコミット型ルーティングパーティションを生成する。
インジェクション帯域ではなく、適応的な停止が正確さを駆動する。
インジェクションベースの手法は、逆Uの精度-vs-推論軌道を示す。
論文参考訳(メタデータ) (Thu, 14 May 2026 11:54:24 GMT)
AI Knows When It's Being Watched: Functional Strategic Action and Contextual Register Modulation in Large Language Models [0.0] 大規模言語モデル(LLM)は、計算や認知の観点から広く研究されている。
本研究では, LLMに基づくマルチエージェントシステムが, 認識された社会的観察状況に応じて, 体系的な言語適応を示すか否かを検討する。
論文参考訳(メタデータ) (Thu, 14 May 2026 16:29:38 GMT)
A general proof of integer Rényi QNEC [0.0] 我々は、真空に対する励起状態のサンドイッチ付きレニイ発散(SRD)が局所ポアンカー変換量子場理論において非負であることを予想する。
すべての整数 Rényi パラメータに対して Rényi QNEC を証明する。
論文参考訳(メタデータ) (Thu, 14 May 2026 18:00:02 GMT)
A Non-Monotone Preconditioned Trust-Region Method for Neural Network Training [0.0] ディープニューラルネットワークを大規模にトレーニングすることは、ドメイン分解の恩恵を受けることができる。
並列サブドメイン補正と大域的粗い空間方向を組み合わせた非線形加法的シュワルツプレコンディショナーを用いた非単調変種を提案する。
論文参考訳(メタデータ) (Thu, 14 May 2026 14:06:51 GMT)
A Hardware-Aware, Per-Layer Methodology for Post-Training Quantization of Large Language Models [0.0] Scaled Outer Productは、大規模言語モデルの重み付けのためのトレーニング後の量子化方法論である。
ハードウェア上では、層ごとのLUTデコードで4.5--6ビットでほぼロスレスの忠実さを提供する。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:03:58 GMT)
A CUBS-Compatible Ultrasound Morphology and Uncertainty-Aware Baseline for Carotid Intima-Media Segmentation and Preliminary Risk Prediction [0.0] 頸動脈硬化症は虚血性脳梗塞および一過性虚血発作の原因となる。
本研究では,CUBS互換超音波形態と不確実性認識ベースラインであるAtheroFlow-XNetについて述べる。
論文参考訳(メタデータ) (Thu, 14 May 2026 15:21:05 GMT)