SphereVAD: Training-Free Video Anomaly Detection via Geodesic Inference on the Unit Hypersphere [90.9] ビデオ異常検出(VAD)は、トリミングされていない監視ビデオの通常のパターンから逸脱するイベントを自動的に識別することを目的としている。
SphereVADはトレーニング不要でゼロショットのVADフレームワークで、単位超球面上の準比測地線推定をvon Mises-Fisher (vMF) と再放送する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:57:38 GMT)
TextLDM: Language Modeling with Continuous Latent Diffusion [89.7] 拡散変換器(DiT)は、VAEラテント空間におけるフローマッチングで訓練され、画像やビデオ間で統一された視覚生成を行う。
最小限のアーキテクチャ変更で視覚的潜伏拡散のレシピをテキスト生成に転送するTextLDMを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:54:34 GMT)
See Tomorrow, Act Today: Foresight-Driven Autonomous Driving [87.0] ForeSightは、予測された意思決定として自動運転を再設計する基礎的世界モデル中心の計画フレームワークである。
提案手法は,(1)事前学習された世界モデルを用いて,有望な未来世界を生成すること,(2)これらの未来を前提とした計画行動を行うこと,の2段階からなる。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:42:05 GMT)
ReasonEdit: Towards Interpretable Image Editing Evaluation via Reinforcement Learning [86.6] 本稿では,テキスト誘導画像編集のための評価ツールReasonEditを紹介する。
Re-Reward と Group Relative Policy Optimization (GRPO) アルゴリズムから得られる報奨信号を用いて訓練する。
高品質な解釈可能な評価テキストを生成することができ、画像編集の透明性と信頼性を高めることができる。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:23:26 GMT)
Hierarchical Mixture-of-Experts with Two-Stage Optimization [84.7] ルーティング制御を2つの結合レベルに分解するグループ化されたMoEフレームワークであるHi-MoEを提案する。
我々は,最近のスパースルーティングやグループ化されたMoEベースラインに対する一貫した改善をNLPおよびビジョンベンチマークで観察する。
58Bトークンの大規模事前トレーニングでは、Hi-MoE-7Bは5.6%のパープレキシティ低減と、OLMoE-7Bよりも40%のエキスパートバランスの改善を実現している。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:21:46 GMT)
Modeling Dependency-Propagated Ecosystem Impact of Changes in Maintenance Activities: Evaluating Support Strategies in the PyPI Network [83.2] 我々は、Python Package Index(PyPI)エコシステムを通じて、メンテナンスアクティビティの変化がどのように伝播するかをキャプチャする、エコシステム影響の依存性を意識したモデルを紹介します。
以上の結果から, モデルによる生態系への影響の大部分が, 依存伝搬の影響に基づいて優先順位付けされた場合のPyPIパッケージ全体の0.1%に過ぎなかったことが示唆された。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:34:07 GMT)
Bridging Modalities, Spanning Time: Structured Memory for Ultra-Long Agentic Video Reasoning [83.0] MAGIC-Videoは、インターリーブされた物語チェーンを備えたマルチモーダルメモリグラフを中心に構築されたフレームワークである。
EgoLifeQA、Ego-R1、MM-Lifelongでは、MAGIC-Videoは一貫して、強力な汎用、長期ビデオ、エージェントベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:21:47 GMT)
PolarVLM: Bridging the Semantic-Physical Gap in Vision-Language Models [79.1] 視覚言語モデルに偏光物理パラメータを統合する最初のフレームワークであるPolarVLMを紹介する。
デュアルストリームアーキテクチャとプログレッシブ2段階のトレーニング戦略を用いることで、PolarVLMは一般的な視覚能力を維持しながら、物理的誤解釈を効果的に防止する。
実験の結果、PolarVLMは5つの評価タスクでRGBベースラインを25.4%上回ることがわかった。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:43:54 GMT)
Efficient Prompt Learning for Traffic Forecasting [78.9] 我々は、SimpleSTという、訓練済みの時間GNNに適応するための軽量でモデルに依存しないプロンプトチューニングフレームワークを導入する。
適応のオーバーヘッドと複雑さを減らし、事前学習されたモデルのアウト・ディストリビューション・一般化を効率的に利用できるようにする。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:45:51 GMT)
How to Train Your Latent Diffusion Language Model Jointly With the Latent Space [76.9] 遅延拡散モデルは、非自己回帰テキスト生成のための離散拡散の魅力的な代替手段を提供する。
本稿では、潜在エンコーダ、拡散モデル、デコーダを共同で訓練する潜在拡散言語モデル(LDLM)を提案する。
OpenWebTextとLM1Bでは、LDLMは既存の離散および連続拡散言語モデルよりも優れた生成性能を達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:05:19 GMT)
EditRefiner: A Human-Aligned Agentic Framework for Image Editing Refinement [76.8] EditRefinerは、編集後の修正を人間のような認識・推論・行動評価ループとして再構成するエージェントフレームワークである。
歪み、診断精度、人間の知覚アライメントにおいて、最先端の手法を一貫して上回る。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:05:08 GMT)
MISA: Mixture of Indexer Sparse Attention for Long-Context LLM Inference [75.4] 本稿では,DSAインデクサのリプレースとして,インデクサヘッドをエキスパートの混合プールとして扱うDSAインデクサを提案する。
MISAはロングベンチの密度の高いDSAインデクサとDeepSeek-V3.2とGLM-5で一致し、それぞれ8倍と4倍のインデクサヘッドで動作している。
私たちのTileLangカーネルは、単一のNVIDIA H200 GPU上で、DSAのオリジナルのインデクサカーネルの約3.82倍のスピードアップを実現しています。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:19:34 GMT)
Prune-OPD: Efficient and Reliable On-Policy Distillation for Long-Horizon Reasoning [66.5] Prune-OPDはトレーニング予算と監督品質を動的に調整する。
トレーニング時間を37.6%減らし-68.0%削減すると同時に、しばしば改善され、挑戦的なベンチマークのパフォーマンスが向上する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:38:53 GMT)
Persistent Visual Memory: Sustaining Perception for Deep Generation in LVLMs [66.2] Persistent Visual Memoryは、ビジュアルエビデンスへの持続的でオンデマンドアクセスを強化するために設計された、軽量の学習可能なモジュールである。
Qwen3-VLモデルの実験は、PVMが無視可能なパラメータオーバーヘッドで顕著な改善をもたらすことを示した。
詳細な分析により、PVMはより長い世代で堅牢性が向上し、内部予測収束が加速することが明らかとなった。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:52:48 GMT)
Confidence-Aware Alignment Makes Reasoning LLMs More Reliable [65.4] CASPOは、トークンレベルの信頼度とステップワイドな論理的正しさを、個別の報酬モデルをトレーニングせずに整合させるフレームワークである。
推論中、信頼を意識した思考(CaT)を提案し、不確実な推論枝を無視可能なO(V)レイテンシで動的に生成する。
10のベンチマークと複数のモデルファミリでの実験では、CASPOは推論の信頼性と推論効率を一貫して改善している。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:08:25 GMT)
NICE FACT: Diagnosing and Calibrating VLMs in Quantitative Reasoning for Kinematic Physics [65.0] この研究は、視覚言語モデルが物理的世界をどのように知覚するかを根本的に理解し、物理法則を活用することを目的としている。
運動物理学の量的推論を明示的に分解する双対診断パラダイムであるNICEとFACTを提案する。
NICEは、我々の新しい地区インフォームドキャリブレーション手法と、信頼性の評価とキャリブレーションのための新しいメトリクスについて研究する。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:17:44 GMT)
SalesSim: Benchmarking and Aligning Multimodal Language Models as Retail User Simulators [63.7] 本稿では,マルチモーダル大規模言語モデル(MLLM)の現実的,ペルソナ主導の顧客行動のシミュレート能力を評価するためのフレームワークとテストベッドであるSalesSimを紹介する。
我々は,シミュレータの動作とペルソナ仕様との整合性,および会話品質を測定する。
実験により,UserGRPOは,会話品質を改善しつつ,ベースラインモデルの整合性を13.8%向上させることを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:59:23 GMT)
LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling [63.7] テストタイムスケーリング(TTS)は,大規模言語モデルの性能向上に有効なアプローチとなっている。
既存のTS戦略は、主に手作りであり、研究者はパターンを設計し、直感で調整し、計算割り当ての空間の多くを探索していない。
環境駆動型フレームワークであるAutoTTSを提案し、研究者が設計したものを、個々のTSからTTS戦略を自動的に発見できる環境へと変更する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:59:40 GMT)
DIMoE-Adapters: Dynamic Expert Evolution for Continual Learning in Vision-Language Models [63.6] 継続的な学習は、視覚言語モデルが知識を蓄積し、スクラッチから再トレーニングすることなく、進化するタスクに適応することを可能にする。
既存のほとんどのメソッドは、静的に割り当てられたパラメータを持つ固定されたアーキテクチャに依存しており、新しいドメインへの適応を制限し、破滅的な忘れを増す。
動的インクリメンタル・ミックス・オブ・エキスパート・アダプタ・フレームワークであるDIMoE-Adaptersを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:32:05 GMT)
From Synthetic to Real: Toward Identity-Consistent Makeup Transfer with Synthetic and Real Data [63.4] メイクアップ転送は、同一性や背景を保ちながら、ソースポートレートに参照ポートレートのメイクスタイルを適用することを目的としている。
近年の拡散と流れに基づくアプローチは、教師付きトレーニングのために合成データを利用するようになり、大幅に改善された。
本稿では,ポストトレーニングフレームワークであるConsistentBeautyとRealBeautyを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:21:43 GMT)
Hierarchical Dual-Subspace Decoupling for Continual Learning in Vision-Language Models [63.2] クラスインクリメンタルラーニングは、学習前の情報を保存しながら、新たな知識を継続的に獲得することを目的としており、破滅的な忘れを軽減している。
視覚言語モデルにおける連続学習のための階層型デュアルサブスペースデカップリングフレームワークであるHDSDを提案する。
具体的には、パラメータ空間を一般およびタスク固有の部分空間に明示的に分解する軽量な特徴変調モジュール(FMM)を導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:42:05 GMT)
CellScientist: Dual-Space Hierarchical Orchestration for Closed-Loop Refinement of Virtual Cell Models [62.3] VCM(Virtual Cell Modeling)は、摂動応答を予測できるだけでなく、予測が失敗した場合にターゲットリビジョンをサポートするモデルを必要とする。
現在のLCM支援モデリングでは、予測誤差が実行可能実装を通して観測されるという改善ルーティング問題に直面している。
提案するCellScientistは,高レベル仮説空間と低レベル実行可能実装空間を結合した,二重空間階層型フレームワークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:40:24 GMT)
SecureForge: Finding and Preventing Vulnerabilities in LLM-Generated Code via Prompt Optimization [61.9] SecureForgeは、フロンティアモデルのセキュリティリスクを監査し、監査インフォームされたセキュアなシステムプロンプトを生成する自動化パイプラインである。
SecureForgeは、まず静的に検出可能な脆弱性を生成する良性プロンプトを特定し、その後、さまざまなシナリオの大規模な合成プロンプトコーパスに増幅する。
フロンティアモデルでは、SecureForgeは、ユニットテストの成功と出力セキュリティの両方において統計的に有意な改善をもたらし、出力脆弱性は最大48%削減された。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:40:47 GMT)
Decoupling Endpoint and Semantic Transition Learning for Zero-Shot Composed Image Retrieval [61.8] DeCIRは推論複雑性を増大させることなくプロジェクションベースのZS-CIRを一貫して改善することを示す。
CIRR、CIRCO、FashionIQ、GeneCISの実験により、DeCIRは推論複雑性を増大させることなく、射影ベースのZS-CIRを一貫して改善することを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:55:41 GMT)
Measuring and Mitigating the Distributional Gap Between Real and Simulated User Behaviors [61.6] 本研究では,実際のユーザ行動とシミュレーションユーザ行動の分布ギャップを計測する手法を提案する。
実会話とシミュレーション会話のデータセットが与えられた場合,本手法は各会話からユーザ行動の表現を抽出する。
ほとんどのシミュレータも同様に振る舞うが、いくつかは独立している。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:09:25 GMT)
Actor-Critic with Active Importance Sampling [61.4] 本稿では,Active-Importance-Sampling Actor-Critic (AISAC)アルゴリズムを提案する。
AISACはActor-Criticフレームワークの拡張であり、ポリシー勾配推定のばらつきを低減する。
実験では、標準的なアクター・クライブ法と比較して学習速度、サンプル効率、トレーニングが改善された。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:21:32 GMT)
Skill-CMIB: Multimodal Agent Skill for Consistent Action via Conditional Multimodal Information Bottleneck [60.9] マルチモーダルスキル構築のための条件付きマルチモーダル情報ボトルネック(CMIB)を提案する。
単純な2ストリームの定式化とは異なり、CMIBはテキストスキルにマルチモーダルラテントを明示的に条件付け、したがってクロスモーダルの冗長性を構造的に低減する。
CMIBの条件分解を最適化し、再利用可能なマルチモーダルスキルを得られるようにした変動目的のインスタンスを作成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:17:54 GMT)
SoLAR: Error-Resilient Streamable Long-Horizon Free-Viewpoint Video Reconstruction with Anchor Activation and Latent Recalibration [57.2] ビット割り当て理論により、速度歪み最適化フレームワーク内で動的アンカーベースのボリュームビデオ表現を解析する。
我々は,長いシーケンスの復元品質を安定的に維持する,エラー回復性の最初のFVVフレームワークである textbfSoLAR を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:48:59 GMT)
Revitalizing the Beginning: Avoiding Storage Dependency for Model Merging in Continual Learning [57.1] Trajectory Regularized Merging (TRM) は、拡張されたトラジェクトリ部分空間内の最適化プロセスとしてマージフェーズを再構成するフレームワークである。
本フレームワークは,タスクアライメント,予測整合性,勾配応答性といった3つの相乗的目標を統合し,統合モデルの履歴安定性と再活性化最適化のダイナミクスを同時に保存する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:07:32 GMT)
STARFlow2: Bridging Language Models and Normalizing Flows for Unified Multimodal Generation [57.0] 自己回帰正規化フローを示し,LLMと同じ因果マスク,KV-cache機構,左右構造を共有する。
我々は、画像生成およびマルチモーダル理解ベンチマークにおける強力な性能を示し、統合マルチモーダルモデリングの基盤として自己回帰フローを検証した。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:14:43 GMT)
Error Correction of Beamsplitter-Generated Entangled GKP States [56.8] 有望なボソニックコードは、Gottesman-Kitaev-Preskill (GKP)コードである。
ビームスプリッタ上にグリッド構造を持つが論理情報を持たない2つのクヌート状態に干渉することにより、GKP量子ビットの絡み合った状態を生成する。
我々は,平均忠実度69%のベル状態をすべて生成し,量子誤差補正を用いて絡み合った状態寿命の延長を示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:01:19 GMT)
How Far Is Document Parsing from Solved? PureDocBench: A Source-TraceableBenchmark across Clean, Degraded, and Real-World Settings [56.7] 昨年は20以上のオープンドキュメントパースモデルが見られたが、ベンチマークはほぼOmniDocBenchにのみ依存している。
HTML/CSSのドキュメントイメージをレンダリングするベンチマークであるPureDocBenchは、10のドメイン、66ページ、1,475ページをカバーしています。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:30:31 GMT)
Belief Memory: Agent Memory Under Partial Observability [56.4] 本稿では,メモリパラダイムを観測毎に1つの結論にシフトし,その確率で複数の結論を導出するBeliefMemを提案する。
BeliefMemは決定論的パラダイムが破棄されるという不確実性を保ち、エージェントが高い信頼を持って行動することを可能にする。
LoCoMoとALFWorldベンチマークの実証的な評価は、限られたデータであっても、BeliefMemが最高の平均パフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:08:49 GMT)
GASim: A Graph-Accelerated Hybrid Framework for Social Simulation [56.1] GASimは大規模社会シミュレーションのためのグラフ加速型ハイブリッドマルチエージェントフレームワークである。
LLMによって駆動されるコアエージェントに対して、GASimは、集中的なLLMベースの検索パイプラインを置き換えるために、Graph-Jasmined Memory (GOM)を導入した。
通常のエージェントの大部分に対して、GASimはグラフメッセージパッシング(GMP)を採用し、並列更新によるシーケンシャルなABM実行を代用している。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:01:25 GMT)
A Single Layer to Explain Them All:Understanding Massive Activations in Large Language Models [56.0] 大規模言語モデル(LLM)における大規模アクティベーションの起源について検討する。
モデルファミリ間で一貫して観察されるtextbfMassive Emergence Layer (ME Layer) と呼ばれる特定の層を同定する。
RMSNormとFFNパラメータの両方がME層内で大きな活性化の出現に共同して寄与していることを示す。
本研究では,この制限により,大規模アクティベーショントークンの剛性を簡易かつ効果的に低減する手法を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:37:27 GMT)
Learning Agent Routing From Early Experience [55.9] バウンダリ(Boundary)は、初期の行動経験とルーリック誘導推論を使用して、クエリに直接推論で答えるか、エージェントにエスカレートするかを決定する、トレーニング不要なルーティングフレームワークである。
また, 直接LLM推定よりも28.6%性能が向上し, 予測時間を60.6%短縮することを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:18:40 GMT)
Semantic-Aware Adaptive Visual Memory for Streaming Video Understanding [55.8] SAVEMemは、セマンティックな認識をメモリ生成にもたらすフレームワークで、クエリ毎に検索スコープを適応させる。
SAVEMemは、メモリ生成にセマンティックな認識をもたらし、クエリ毎に検索範囲を適応させる、トレーニングフリーのデュアルステージフレームワークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:40:40 GMT)
GeoDial: A Multimodal Conversational Tutoring Dataset for Geometry Problem-Solving with Visual Tutor Turns [55.3] 幾何学領域における1.3K以上の教師-学生対話のデータセットであるGeoDialを紹介する。
本稿では,対話行動,視覚的ハイライト,フィードバックを統合したスケーラブルなアノテーションプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:54:32 GMT)
Inference-Time Attribute Distribution Alignment for Unconditional Diffusion [54.3] 我々は、事前訓練された非条件拡散モデルに対する推論時属性分布アライメント問題を定式化する。
そこで本研究では,逆拡散過程に対する最適制御問題として,推定時属性分布アライメントを適用した。
最適制御に基づくアルゴリズムを用いて分散マッチングの最適化を行う。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:02:47 GMT)
AIPO: : Learning to Reason from Active Interaction [54.1] AIPOは、ポリシーモデルが、推論ボトルネックに遭遇するときに、3つの機能的協調エージェントを積極的に相談することを可能にする。
AIPOは推論性能を継続的に改善し、異なるポリシーモデルとRLVRアルゴリズムをまたいで堅牢に一般化し、ポリシーモデルの推論能力境界を効果的に拡張する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:06:55 GMT)
SEIF: Self-Evolving Reinforcement Learning for Instruction Following [53.3] 大規模言語モデル(LLM)の指示追従能力を高める自己進化型フレームワークSEIFを提案する。
SEIFは閉じた自己進化ループを形成し、モデルの命令追従能力を改善する。
複数のモデルスケールとアーキテクチャの実験により、SEIFは命令追従性能を一貫して改善し、強い汎用性を示唆している。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:13:12 GMT)
The Reciprocity Gradient [52.4] コミュニケーションは、戦略的相互作用における相互性と協力を維持するための基本である。
学習エージェントに特有の集中的最適化の難しさとして,影響帰属問題を同定し,定式化する。
これを解決するために、公衆の観察から訓練された相手の政策の個人推定器を通して、報酬勾配を明示的に逆伝搬する相互性勾配を導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:29:52 GMT)
Rethinking Dense Sequential Chains: Reasoning Language Models Can Extract Answers from Sparse, Order-Shuffling Chain-of-Thoughts [51.8] 現代の推論言語モデルは、すべてのトークンが寄与し、ステップを順番に消費しなければならないと暗黙的に仮定して、シーケンシャルな連鎖トレースを生成する。
我々は、モデル生成推論連鎖に適用した、系統的な介入パイプライン、除去、マスキング、シャッフル、ノイズ注入により、両方の仮定に挑戦する。
解答抽出は, スパース, 秩序不感, 構造的に堅牢な情報基板上で行う。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:15:50 GMT)
Video Understanding Reward Modeling: A Robust Benchmark and Performant Reward Models [51.6] 本稿では,ベンチマーク設計,データ構築,報酬モデルトレーニングを対象とする統一フレームワークを提案する。
VURB(Video Understanding Reward Bench)は、2,100対の選好ペアと長い連鎖推論トレース(1,143トークン)と、一般的な、長い、推論指向のビデオタスクにおける多数投票評価を特徴とするベンチマークである。
我々は、VURBとVideoRewardBenchの最先端性能を達成するために、差別的かつ生成的な報酬モデルであるVideoDRMとVideoGRMを訓練する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:29:11 GMT)
Themis: Training Robust Multilingual Code Reward Models for Flexible Multi-Criteria Scoring [51.5] Themis-CodePreferenceは、これまでで最大のコード好みのオープンソースコレクションで、多言語コード報酬モデルのスイートであるThemis-RMのトレーニングに使用しています。
多様な嗜好に基づいてトレーニングを行う場合, 積極的なスケーリング傾向, 強い言語間移動を示す実験とアブリケーションを行った。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:29:37 GMT)
Rethinking Experience Utilization in Self-Evolving Language Model Agents [51.1] 自己進化剤は過去の相互作用から経験を蓄積し再利用することで改善する。
本稿では,自己進化型エージェントの重要設計次元としての利用経験について考察する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:48:49 GMT)
Federated Nested Learning: Collaborative Training of Self-Referential Memories for Test-Time Adaptation [50.9] Federated Nested Learning (FedNL)は、Federated Learningを3段階のネスト最適化システムとして再構築する新しいフレームワークである。
FedNLはTitansベースの線形アテンションをFLに組み込み、クライアントが軽量でゼロショットのテストタイムアダプションを実行できるようにする。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:31:46 GMT)
Coupling Models for One-Step Discrete Generation [50.4] カップリングモデル(英: Coupling Models)は、離散列とガウス列の間の直接結合を学習する一段階の離散生成モデルである。
単純なデータ間結合と手動で特定したデータ間結合による複雑な連続フローを回避する。
LM1Bテキスト生成パープレキシティを最低パープレキシティ動作ポイントで33%削減する。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:40:39 GMT)
Escaping the Diversity Trap in Robotic Manipulation via Anchor-Centric Adaptation [50.2] 多様な単発デモを収集することで「最大限のカバレッジ」を達成できる。
我々は、この現象を包括的-密度トレードオフとして定式化する。
Anchor-Centric Adaptation (ACA) は、2段階のフレームワークで、まずコアアンカーでの繰り返しデモを通じてポリシースケルトンを安定化し、次に教師力によるエラーマイニングと制約付き残差更新を通じて高リスク境界までカバー範囲を広げる。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:35:24 GMT)
An Embarrassingly Simple Graph Heuristic Reveals Shortcut-Solvable Benchmarks for Sequential Recommendation [50.1] Sequentialsolvは、シーケンシャルなパターンとセマンティックなアイテム情報を組み合わせたジェネレーティブなレコメンデーターへと移行している。
これらの手法は、しばしば、広く使われている少数のベンチマークで評価され、重要な疑問を提起する: これらのベンチマークは、現代のジェネレーティブレコメンデーターが提供しようとしている高度なモデリング機能を必要としているか?
我々は、意図的な単純なグラフでベンチマーク監査を行い、最後の1つか2つの項目から、数ホップの項目遷移グラフから候補を検索し、項目間類似度でランク付けする。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:00:11 GMT)
Proxy3D: Efficient 3D Representations for Vision-Language Models via Semantic Clustering and Alignment [50.0] 本稿では,視覚モダリティのためのコンパクトかつ包括的な3Dプロキシ表現を備えたProxy3D法を提案する。
提案手法は,3次元視覚的質問応答,視覚的接地,空間知能のベンチマークにおいて,競合や最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:50:47 GMT)
Learning to Communicate Locally for Large-Scale Multi-Agent Pathfinding [50.0] 本稿では,効率的な特徴共有を通じてエージェント間の協調を強化するための学習可能な通信モジュールを提案する。
提案手法は既存の学習ベースMAPFソルバよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:05:08 GMT)
Do Joint Audio-Video Generation Models Understand Physics? [49.4] 共同オーディオビデオ生成モデルは、プロのプロダクション品質に急速に近づいている。
音と視覚の物理を理解しているのか、それとも、現実の一貫性に反するプラウチブルな音やフレームを生成するだけなのか?
AV-Phys Benchは、共同オーディオビデオ生成における物理コモンセンスを評価するためのベンチマークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:14:07 GMT)
GraphReAct: Reasoning and Acting for Multi-step Graph Inference [49.3] GraphReActは、グラフ構造化データに対するステップバイステップの推論を可能にするグラフ推論実行フレームワークである。
検索と精細化の両方で推論をインターリーブすることで、我々のフレームワークは文脈拡張から圧縮への進歩的な移行を可能にします。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:09:42 GMT)
INO-SGD: Addressing Utility Imbalance under Individualized Differential Privacy [49.1] ディファレンシャルプライバシ(DP)は、機密データや機密データを保護するために機械学習に広く利用されている。
本稿では,各バッチ内のデータを戦略的に低重み付けし,よりプライベートなデータの性能を向上させるINO-SGDアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:04:09 GMT)
Mechanism Design Is Not Enough: Prosocial Agents for Cooperative AI [49.1] 契約がすべての関連する将来の事態を区別できない場合、現実的なメカニズムを排除できない、厳密な肯定的な福祉損失が存在することを示す。
このギャップを埋め、社会的に優越し、個々に有益である結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:37:07 GMT)
Experience Sharing in Mutual Reinforcement Learning for Heterogeneous Language Models [48.8] 我々は,相互強化学習(Multual Reinforcement Learning)を紹介した。
このフレームワークは、共有エクスペリエンス交換(SEE)、マルチワークリソース割り当て(MWRA)、およびTokenizer Heterogeneity Layer(THL)を組み合わせる。
GRPO上の3つの制御されたプローブをインスタンス化する: Peer Rollout Pooling (PRP)によるデータレベルのロールアウト共有、Cross-Policy GRPO Advantage Sharing (XGRPO)による価値レベルのアドバンテージ共有、Success-Gated Transfer (SGT)による結果レベルの成功転送。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:01:40 GMT)
RCoT-Seg: Reinforced Chain-of-Thought for Video Reasoning and Segmentation [48.3] Video Reasoningは、人間の意図と時間的ロジックを伝える暗黙の指示に基づいて、対象のオブジェクトをビデオに分割することを目的としている。
既存のMLLMベースの手法では,単純なサンプリングや補助MLLMを用いてフレームを選択した後,[SEG]トークンでマスクを予測する。
RCoT-SegはVRSを時間的ビデオ(TVR)と目標知覚(KTP)に分解するビデオ・オブ・思想のフレームワークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:39:53 GMT)
Game-Theoretic Analysis of Transaction Selection in DAG-Based Distributed Ledgers [48.2] DAGベースの分散台帳技術(DLT)におけるトランザクション選択は、スループット、公平性、バリデータインセンティブに直接影響を与える重要な課題である。
我々は、ランダムフェーアロケーション(RFA)とコラボレーティブフェーシェアリング(CFS)の2つの料金配分メカニズムについて分析する。
数値シミュレーションにより, CFS の NE は RFA の NE と比較して一貫したスループットと報酬を達成することを示した。
これらの知見は、トランザクション選択とインセンティブメカニズムの設計に関する実用的な洞察を与え、より堅牢で高性能なDAGベースのDLTを可能にする。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:42:42 GMT)
Generative Modeling with Flux Matching [48.1] 本稿では、既存のスコアベースモデルをベクトル場のより広範なファミリーに一般化する、生成モデリングの新しいパラダイムであるFlux Matchingを紹介する。
この柔軟性は、スコアマッチングでは学べない生成モデルのクラスを可能にする。
本稿では,Flux Matchingが高次元画像データセットに強く貢献することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:28:23 GMT)
DiffRetriever: Parallel Representative Tokens for Retrieval with Diffusion Language Models [48.0] DiffRetrieverは拡散言語モデルのための代表型レトリバーである。
Kをマスクした位置をプロンプトに追加し、すべてのKを1つの双方向前方パスで読み取る。
ボトルネックは、マルチトークンのアイデアそのものではなく、シーケンシャルな生成であることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:57:51 GMT)
Beyond Distribution Estimation: Simplex Anchored Structural Inference Towards Universal Semi-Supervised Learning [47.9] 我々は、Universal Semi-supervised Learning (UniSSL)として批判的だが未探索のパラダイムを定式化する。
既存の手法は、通常擬似ラベルでラベル付けされていないデータを利用する。
我々は、表現レベルの構造推論からバイパス分布推定へ焦点を移す。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:33:09 GMT)
MemQ: Integrating Q-Learning into Self-Evolving Memory Agents over Provenance DAGs [47.7] 本稿では,メモリQ値にTD($$)の可視性トレースを適用したMemQを紹介する。
クレジットウェイトは、DAG深さ$d$で$()d$として崩壊し、時間的距離を構造的近接に置き換える。
6つのベンチマークで、MemQは、一般化評価とランタイム学習の6つすべてで最高成功率を達成した。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:30:24 GMT)
Attention Transfer Is Not Universally Effective for Vision Transformers [47.3] 我々はこの発見を、有名な11のVTファミリーの20人の教師のベンチマークで再考する。
7家族の移動は成功したが、4家族が一貫して失敗し、5.1%まで下がった。
事前学習した教師と標準学生のアーキテクチャミスマッチを主要なメカニズムとみなす。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:39:38 GMT)
Think-with-Rubrics: From External Evaluator to Internal Reasoning Guidance [47.2] Think-with-Rubricsは、タスクに従うための新しいパラダイムである。
Think-with-Rubricsはルーブリック生成を推論コンテキストに統合する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:08:07 GMT)
Response-G1: Explicit Scene Graph Modeling for Proactive Streaming Video Understanding [47.1] Response-G1は、蓄積されたビデオエビデンスと、シーングラフによるクエリの期待応答条件との明示的で構造化されたアライメントを確立する新しいフレームワークである。
このフレームワークは,(1)ストリーミングクリップからのオンラインクエリ誘導シーングラフ生成,(2)最も意味のある歴史的シーングラフのメモリベース検索,(3)フレーム単位の「サイレンス/レスポンス」決定を促す検索強化トリガーの3段階で動作する。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:46:10 GMT)
Tracing Uncertainty in Language Model "Reasoning" [46.6] 言語モデル(LM)は、一般的にChain-of-Thoughtまたはテストタイムスケーリングと呼ばれ、しばしばベンチマークのパフォーマンスを改善する。
本研究では,LMが生成する中間トークン列である「推論」トレースを進化的モデル状態として扱うことにより,これらのダイナミクスを考察する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:16:37 GMT)
ChartREG++: Towards Benchmarking and Improving Chart Referring Expression Grounding under Diverse referring clues and Multi-Target Referring [46.6] 本稿では,複数のローカライゼーション形式,複数の参照対象,多様なグラウンドキュー,多様なチャートタイプをサポートするグラフ参照グラウンドベンチマークを提案する。
代表的マルチモーダル大モデル間での結果は、大きなパフォーマンスギャップを示す。
我々は、合成マスクを用いてインスタンスセグメンテーションモデルをトレーニングし、汎用的なマルチモーダルグラウンドフレームワークに統合する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:07:11 GMT)
Spectral Dynamics in Deep Networks: Feature Learning, Outlier Escape, and Learning Rate Transfer [46.5] 本研究では,(確率的な)勾配勾配で学習した広帯域ニューラルネットワークにおける隠れ重みスペクトルの進化について検討する。
我々は、スパイクされたアンサンブルに対するバルクおよび外周スペクトルダイナミクスを共同で追跡する2レベル力学平均場理論(DMFT)を開発した。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:28:01 GMT)
Divide and Conquer: Object Co-occurrence Helps Mitigate Simplicity Bias in OOD Detection [46.5] ディープラーニングモデルの信頼性を確保するために、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
既存の手法は主に、分散内データ(ID)とOODデータを識別するために、正規の絡み合った表現に焦点を当てている。
画像中のオブジェクトCO発生パターンをキャプチャするオブジェクト指向OOD検出フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:51:30 GMT)
Mid-Training with Self-Generated Data Improves Reinforcement Learning in Language Models [46.2] RLトレーニングの中間段階として,中間訓練における多種多様な自己生成データについて検討した。
具体的には、George Polya氏の問題解決アプローチによってガイドされた、ブートストラップ付きデータ生成フレームワークを採用する。
実測データを用いたRL学習モデルでは,様々な数学的推論ベンチマークにおいて一貫した改善が達成されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:46:35 GMT)
Velocity-Space 3D Asset Editing [45.9] ローカルに3Dアセットを編集し、残りの部分を保存しながらターゲット領域を変更することは、ネイティブな3D編集の基本的な要件である。
Inversion-free, training-free, and mask-free framework that address each problem with a target intervention in the sampler。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:42:12 GMT)
MoCoTalk: Multi-Conditional Diffusion with Adaptive Router for Controllable Talking Head Generation [45.9] MoCoTalkは、4つの相補的な制御信号を統一する多条件ビデオ拡散フレームワークである。
Adaptive Multi-Condition Routerは、4つの条件ストリーム上のチャネルワイドでタイムステップ対応のゲーティングを計算する。
Mouth-Augmented Shading Meshは3DMMベースの表現で、頭部の動き、口の動き、表情、照明を分離する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:40:01 GMT)
WebTrap: Stealthy Mid-Task Hijacking of Browser Agents During Navigation [45.7] ブラウザエージェントに対する既存のプロンプトインジェクション攻撃は、2つの重要なギャップを露呈する。
我々は,ミッドタスクのハイジャックインジェクション攻撃であるWebTrapを提案する。
本稿では,WebTrapがエージェントのナビゲーション脆弱性を悪用していることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:06:03 GMT)
Tokens-per-Parameter Coverage Is Critical for Robust LLM Scaling Law Extrapolation [45.6] ニューラルスケーリング法則は、パラメータカウント$N$とトークンカウント$D$のパワーロー関数として、言語モデルの損失を近似する。
本稿では,コリニア設計がガウス・ニュートン最小二乗問題に固有の不条件を生じさせることを示す。
これを4つのスケーリング法則形式に対して証明し、十分に条件付き推定に十分必要な閉形式TPP多様性閾値を導出する。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:00:17 GMT)
CUDAHercules: Benchmarking Hardware-Aware Expert-level CUDA Optimization for LLMs [45.5] 我々は、エンドツーエンドの人間-専門家SOTAシステムに対して生成されたベンチマークであるHerculesを紹介する。
自動化プログラミングは完全な解決には程遠いものであり、より強力なハードウェア推論、より良いツール使用、トレーニング目標が必要です。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:35:27 GMT)
Retrieval from Within: An Intrinsic Capability of Attention-Based Models [45.5] InTRA(Intrinsic Retrieval via Attention)は、デコーダのアテンションクエリが事前に符号化されたエビデンスチャンクをスコアし、生成のコンテキストとして直接再利用するフレームワークである。
質問応答ベンチマークでは、INTRAはエビデンスリコールとエンドツーエンドの回答品質の両方で、強力なエンジニアリングされた検索パイプラインを上回ります。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:21:54 GMT)
MatryoshkaLoRA: Learning Accurate Hierarchical Low-Rank Representations for LLM Fine-Tuning [45.4] MatryoshkaLoRAは、固定された慎重に作られた対角行列を既存のLoRAアダプタ間で$P$で挿入することで、正確な階層的な低ランク表現を学習する。
以上の結果から,MatryoshkaLoraは従来のランク適応手法よりも,より正確な階層的な低ランク表現を学習できることが示唆された。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:13:01 GMT)
Hierarchical Task Network Planning with LLM-Generated Heuristics [45.2] 大規模言語モデル(LLM)がHTN計画に有効な探索アルゴリズムを生成できるかどうかを検討する。
LLMは最高のHTNプランナのカバレッジとほぼ一致し、共有問題の83%で検索の労力を大幅に削減した。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:14:31 GMT)
Priming: Hybrid State Space Models From Pre-trained Transformers [45.2] プライミング(英: Priming)とは、ハイブリッドアーキテクチャ設計を事前学習問題から知識伝達問題に変換する手法である。
我々は,Gated KalmaNet (GKA), Gated DeltaNet (GDN), Mamba-2を評価し,その階層であるGKA>GDN>Mamba-2が,長文推論タスクのダウンストリーム性能を直接予測していることを示す。
我々のハイブリッドGKA 32Bは、ソースであるQwen3-32Bを+3.8平均推論ポイントで改善し、同じデータで後トレーニングされたトランスフォーマーの1%以内に留まる。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:43:51 GMT)
Predictive but Not Plannable: RC-aux for Latent World Models [44.6] 到達可能性補正補助(RC-aux)
本稿では,このミスマッチに対する軽量な補正法であるReachability-Correctionssisted (RC-aux)を提案する。
RC-auxは世界モデルのバックボーンを変更せず、2つの軸に沿って計画に沿った監督を追加する。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:43:33 GMT)
LLM-guided Semi-Supervised Approaches for Social Media Crisis Data Classification [43.7] 本稿では,大規模言語モデル(LLM)による危機関連つぶやき分類のための半教師付き学習の実証評価を行った。
以上の結果から,LG-CoTrainはリソース設定の低さにおいて,従来の半教師付きアプローチよりも優れていた。
コンパクトな半教師付きモデルは、場合によっては、ゼロショット設定で動作する非常に大きなLLMよりも優れている。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:15:40 GMT)
EditTransfer++: Toward Faithful and Efficient Visual-Prompt-Guided Image Editing [43.6] 本稿では,構造化トレーニングと効率的な条件付けを組み合わせたフレームワークであるEditTransfer++について述べる。
EditTransfer++は,従来の手法よりもはるかに高速な推論で,最先端の視覚的即興忠実性を実現する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:01:20 GMT)
GEM: Generating LiDAR World Model via Deformable Mamba [43.6] 変形可能なマンバアーキテクチャを持つ世代別LiDARワールドモデルは、忠実度と想像力を向上させる。
実験により、GEMは様々なベンチマークと評価設定で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:32:12 GMT)
SMT-Based Active Learning of Weighted Automata [43.4] 非決定性重み付きオートマトン(WFAs)の能動学習アルゴリズムを提案する。
我々のアルゴリズムは与えられたセミリングにおいてパラメトリックであり、もし終了すれば最小のWFAを生成することが保証される。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:01:29 GMT)
Embeddings for Preferences, Not Semantics [42.4] 現代のAIは、参加者が自分の見解を自由形式のテキストとして表現する、集合的な意思決定への扉を開く。
標準テキスト埋め込みは意味的類似度を測定するが、施設位置問題と公正クラスタリングの距離はテクスタイト優先類似度と呼ばれるものを必要とする。
この相関関係を断ち切るために設計された合成トレーニングデータにより、最適スコアラーはニュアンスに支配されたコサインから確実にシフトし、11のオンライン熟考データセットにおける選好予測を大幅に改善することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:15:14 GMT)
Flow-OPD: On-Policy Distillation for Flow Matching Models [42.3] Flow-OPDは、オンライン蒸留をFlow Matchingモデルに統合するフレームワークである。
これはGenEvalのスコアを63から92に引き上げ、OCRの精度を59から94に引き上げ、バニラGRPOよりも10点程度向上した。
これらの結果は、汎用的なテキスト-画像モデルを構築するためのスケーラブルなアライメントパラダイムとして、Flow-OPDを確立する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:50:15 GMT)
Flow-Direct: Feedback-Efficient and Reusable Guidance for Flow Models via Non-Parametric Guidance Field [42.3] トレーニング不要のガイダンスにより、事前トレーニングされた拡散とフローモデルにより、アプリケーション固有の目的を最適化できる。
本稿では、永続的なガイダンスフィールドを通じて生成プロセスをガイドするフレームワークであるFlow-Directを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:03:46 GMT)
Minimizing Modality Gap from the Input Side: Your Speech LLM Can Be a Prosody-Aware Text LLM [42.2] 音声入力を韻律対応のテキストLLMとよりよく類似させるSLMであるTextPro-SLMを提案する。
TextPro-SLMは、同期されたテキストトークンと韻律埋め込みを生成する統一された音声エンコーダであるWhisperProを組み合わせる。
実験の結果,TextPro-SLMは3Bスケールと7Bスケールの両方において,最下位のSLM間のモダリティギャップを達成できることがわかった。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:27:50 GMT)
Why Self-Inconsistency Arises in GNN Explanations and How to Exploit It [42.2] 近年の研究では、自己解釈型グラフニューラルネットワーク(SI-GNN)による説明は、自己整合性を持つことが報告されている。
モデルに依存しない,トレーニング不要なポストプロセッシング戦略であるセルフデノゲーション(SD)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:57:22 GMT)
Generative 3D Gaussians with Learned Density Control [41.9] 本稿では,適応的なレンダリングプリミティブとスケーラブルな生成モデルとのギャップを埋めるために設計された,新しい3次元表現であるDigital-Sampled Gaussian(DeG)を紹介する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:54:25 GMT)
Sink vs. diagonal patterns as mechanisms for attention switch and oversmoothing prevention [41.8] 本研究では,アテンションスイッチおよびアンチオーバーオブスムチング機構として,シンクと斜めパターンが果たす役割について検討した。
シンクとハードアテンションスイッチの等価性を証明し、アテンションの出力は0。
我々はトークンの自己通信を許すことにより、ハードアテンションスイッチを緩和し、事前訓練されたトランスにおいてシンクが好まれる理由を示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:18:57 GMT)
Queryable LoRA: Instruction-Regularized Routing Over Shared Low-Rank Update Atoms [41.7] 本稿では,大規模ニューラルネットワークのパラメータ効率向上のためのデータ適応手法を提案する。
我々のアプローチは、純粋なレイヤローカルアダプタを低ランク更新原子の共有クエリ可能なメモリに置き換える。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:32:43 GMT)
QuadNorm: Resolution-Robust Normalization for Neural Operators [41.4] 正規化層における既存の一様平均化を数値的二次化(QuadNorm)とBlendQuadNorm(BlendQuadNorm)に置き換える二次正規化ファミリを導入する。
終端包含一様格子では、提案された二次モーメントは離散化全体で$O(h2)$-一貫性を持つ。
転送エラー境界は、正規化によって引き起こされるミスマッチが、解像度ギャップとネットワーク深さの両方でどのようにスケールするかを予測する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:30:43 GMT)
SAM 3D Animal: Promptable Animal 3D Reconstruction from Images in the Wild [41.2] SAM 3D Animalは, 単一画像からのマルチアニマルな3D再構成を行うための, 初のプロンプト可能なフレームワークである。
提案手法は複数のインスタンスを共同で再構築し,キーポイントとマスクの形式でフレキシブルなプロンプトをサポートする。
実験により,既存のモデルベース手法とモデルフリー手法の両方に対して,我々のフレームワークが最先端の結果を達成することが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:26:46 GMT)
Sycophantic AI makes human interaction feel more effortful and less satisfying over time [41.0] 我々は、サイコファンティックAIが、ユーザーが通常親しい友人や家族と結びつく感情的および評価的サポートを即座に提供することを示した。
AIレスポンスのスタイルの中から選択肢を与えられた場合、大多数は、そのアドバイスの品質ではなく、最も理解されたと感じたため、サイコファンティックなAIを好んだ。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:50:06 GMT)
Convergent Stochastic Training of Attention and Understanding LoRA [40.8] トランスフォーマーは機械学習に革命をもたらし、モデルに注目層を配置することは、無数のアプリケーションでますます標準になっている。
大規模モデルではローランク適応(LoRA)を実装することが一般的であり、パラメータ化の因子化を訓練することで驚くほど精度の高いトレードオフを実現する。
軽度正規化の場合、注目層上の経験的回帰損失と浅いニューラルネットワーク上のLoRAは、対応するギブズ測度に対するポアンカレの不等式を誘導する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:22:08 GMT)
ST-Gen4D: Embedding 4D Spatiotemporal Cognition into World Model for 4D Generation [40.3] 生成モデルは、明らかにコヒーレントな2Dビデオを作成することに成功しているが、4Dスケールの欠如により、物理的な世界ではまだ挑戦的だ。
本研究は, 4次元時間認知に基づく世界モデルを用いた4次元生成フレームワークST-4Dを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:44:56 GMT)
VLA-GSE: Boosting Parameter-Efficient Fine-Tuning in VLA with Generalized and Specialized Experts [40.1] VLA-GSEは、視覚言語アクションモデルのためのパラメータ効率の良いVLA微調整フレームワークである。
PEFTの知識保存の優位性を維持しつつ、制御適応を改善する。
LIBERO-Plusの平均ゼロショット成功率は81.2%である。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:32:29 GMT)
ImplantMamba: Long-range Sequential Modeling Mamba For Dental Implant Position Prediction [40.1] インプラント領域自体は、医用画像に特有のテクスチャが欠如していることが特徴である。
本研究では,長距離連続モデリングのためのネットワークアーキテクチャであるPassionMambaを提案する。
本研究のアプローチは, インプラント位置の回帰と傾斜とを明示的に関連付けるものである。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:02:36 GMT)
Delta-Adapter: Scalable Exemplar-Based Image Editing with Single-Pair Supervision [40.0] 既存の手法はペア・オブ・ペアの監視パラダイムに依存している。
本稿では,単一ペア監視下での移動可能な編集セマンティクスを学習するDelta-Adapterを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:09:15 GMT)
CoCoReviewBench: A Completeness- and Correctness-Oriented Benchmark for AI Reviewers [40.0] カテゴリ固有のベンチマークサブセットを構築し、人間のレビューが欠落している場合に評価をスキップし、完全性を強化します。
また、専門家のアノテーションとしてレビュアー-著者-レビューの議論を活用し、正確性を強化するために信頼できないレビューをフィルタリングします。
CoCoReviewBenchは、ICLRとNeurIPSから3,900の論文をキュレーションして、AIレビュアーの信頼性ときめ細かい評価を可能にする。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:44:26 GMT)
VEBench:Benchmarking Large Multimodal Models for Real-World Video Editing [39.7] 本稿では,現実的なビデオ編集シナリオにおける知識理解と操作的推論を評価するための最初のベンチマークであるVEBENCHを紹介する。
VEBENCHには3.9Kの高品質な編集ビデオ(257時間以上)と3,080の人間認証QAペアが含まれている。
ビデオ編集技術認識とビデオ編集操作シミュレーションの2つの補完的なQAタスクを備えている。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:14:34 GMT)
Beyond "I cannot fulfill this request": Alleviating Rigid Rejection in LLMs via Label Enhancement [39.7] 大きな言語モデル(LLM)は、有害なものを拒絶しながら安全な要求に従うために安全アライメントに依存している。
本稿では,ラベル拡張による安全かつフレキシブルで自然な応答を保証するためにLANCEを提案する。
実験により、LANCEは高いセキュリティ基準を維持しながら、厳格な拒絶問題を著しく軽減することが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:33:54 GMT)
SimCT: Recovering Lost Supervision for Cross-Tokenizer On-Policy Distillation [39.6] オンライン蒸留は、教師と学生の予測がトークン単位で同等のトークンであると仮定する。
監視空間を拡大してこの信号を復元するSimCTを提案する。
SimCT は共有語彙 OPD と代表的クロストケナイザベースラインに対して一貫した利得を示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:16:17 GMT)
Uncovering Hidden Systematics in Neural Network Models for High Energy Physics [38.3] 入力可観測体の実験的不確かさと完全に整合した微妙な摂動が,NN出力の大幅な変化をもたらすことを示す。
ニューラルネットワークの隠れた感度を、現実的な実験的変動に対して探索し、測定するための枠組みを導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:17:58 GMT)
GPO-V: Jailbreak Diffusion Vision Language Model by Global Probability Optimization [38.2] Diffusion Vision-Language Models (dVLMs) は、従来の自己回帰生成パラダイムから離れることで、マルチモーダルタスクにおいて顕著な効果を示した。
この脆弱性を利用するために,マスク拡散モデルの認知軌道に特化して設計された一般的なジェイルブレイクパラダイムであるグローバル確率最適化(GPO)を提案する。
GPO-Vは,DVLM用に開発された最初の視覚的モダリティジェイルブレイクフレームワークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:54:57 GMT)
Self-Play Enhancement via Advantage-Weighted Refinement in Online Federated LLM Fine-Tuning with Real-Time Feedback [37.8] フェデレートされたフィードバックの微調整のための効率的なオンライン学習アルゴリズムSPEARを紹介する。
我々はSPEARを様々なベンチマークデータセットで検証し、最先端のベースラインと比較して優れた性能を示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:35:42 GMT)
InsHuman: Towards Natural and Identity-Preserving Human Insertion [37.7] InsHumanは自然とアイデンティティを保った人間の挿入に対して提案する。
具体的には,前景の人間を検知して二元マスクを得るHBAFを提案する。
また、生成した画像とソース画像の顔を検出し、一致させるFFIP(Face-to-Face ID-Preserving)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:58:03 GMT)
TeamBench: Evaluating Agent Coordination under Enforced Role Separation [37.3] TeamBenchは、オペレーティングシステムの強化されたロール分離の下でエージェント調整を評価するためのベンチマークである。
TeamBenchは仕様アクセス、ワークスペース編集、Planner、Executor、Verifierロール間の最終認証を分離する。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:48:45 GMT)
DUET: Optimize Token-Budget Allocation for Reinforcement Learning with Verifiable Rewards [37.3] 検証可能な報酬による強化学習は、トレーニングステップ毎に数十万のトークンを生成します。
共有計算予算下での両決定を共同で調整することで,推論品質とウォールクロックトレーニング時間の両方が向上することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:03:19 GMT)
On Time, Within Budget: Constraint-Driven Online Resource Allocation for Agentic Workflows [37.2] エージェントシステムは、サブタスクを特別なモデルやツールに割り当て、依存関係に応じて調整するオーケストレーション実行ファイルを実行することで、複雑なユーザリクエストをますます解決します。
ワークフローは特定の予算内に完了し、特定の期限前に完了しなければならない。
これにより、平均的な効率最適化から、ワークフロー全体が明確な予算と期限の制約の下で正常に完了する確率の最大化へとゴールをシフトします。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:07:34 GMT)
Closed-Form Linear-Probe Dataset Distillation for Pre-trained Vision Models [37.2] サンプル空間カーネルリッジソルバを用いて合成集合によって誘導される線形プローブを計算する閉形式定式化を提案する。
事前訓練された4つのバックボーンを持つImageNet-100では、CLP-DDはDSAなしでLGMよりも大幅に改善され、計算コストのごく一部でDSAでLGMにアプローチする。
ImageNet-1Kでは、CLP-DDが4つのバックボーンのうち3つでLGMとDSAをマッチまたはオーバーし、約14時間で動作し、GPUメモリの8分の1以下を使用する。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:41:51 GMT)
Regret-Oracle Complexity Tradeoffs in Agnostic Online Learning [37.2] 従来のオンライン学習は、LittlestoneのStandard Optimal Algorithm(SOA)をベースラーナーとして利用して、実現可能な設定に還元することで、古典的に解決される。
私たちはSOAを、オフラインの実証的なリスク最小化のオラクルを通じてのみ概念クラスにアクセスする、実現可能なベースラーナーに置き換えます。
提案アルゴリズムは,クエリの総複雑性を$O(Td_mathrmVC+1)$に減らし,ほぼ最適の後悔を完全保存することを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:41:23 GMT)
An Efficient Token Compression Framework for Visual Object Tracking [37.1] トランスフォーマーベースのトラッカーは、より多くの歴史的フレームを活用して、より豊かな時間的手がかりをキャプチャする。
この戦略は膨大な数の視覚的入力トークンにつながる。
本稿では,テンプレートトークンを効率よく圧縮するフレームワークを提案する。
我々の手法は現在のトラッカーよりも優れています。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:26:24 GMT)
Disambiguating 2D-3D Correspondences in Gaussian Splatting-based Feature Fields for Visual Localization [37.0] 本稿では,2D-3Dマッチングに光度最適化された特徴場(GSFF)が本質的に不適であることを示す。
これらの問題に対処するために,ガウス属性を利用して2D-3D対応を曖昧にする特殊な局所化フレームワークであるSplitGS-Locを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:01:30 GMT)
GSM-SEM: Benchmark and Framework for Generating Semantically Variant Augmentations [36.8] GSM-SEMは、意味的に多様なベンチマーク変種を生成するための再利用可能なフレームワークである。
GSM8K-SEM, GSM-Symbolic-SEM, GSM-Plus-SEMをGSM8Kと既存の2種類のバリエーションスイート上で生成する。
SEMの3つの変種を、完全に人間検証されたデータセットとしてリリースします。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:02:39 GMT)
Signal Reshaping for GRPO in Weak-Feedback Agentic Code Repair [36.3] このようなフィードバックの下で,標準GRPOの信号再構成について検討する。
完全な信号整形GRPOは、厳密なコンパイルとシーケンスの精度を改善する。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:41:25 GMT)
Chain-based Distillation for Effective Initialization of Variable-Sized Small Language Models [36.2] 大規模言語モデル(LLM)は強力なパフォーマンスを実現するが、リソース制約のある環境でのデプロイにはコストがかかる。
スクラッチから小さな言語モデル(SLM)を訓練するには計算コストがかかる。
可変サイズの言語モデルを効率的に初期化するためのスケーラブルなパラダイムであるtextbfChain-based Distillation (CBD) を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:21:05 GMT)
AgentEscapeBench: Evaluating Out-of-Domain Tool-Grounded Reasoning in LLM Agents [36.0] AgentEscapeBenchは、エージェントが明示的な長距離依存性制約の下で新しいツールの使用手順を推論、実行、修正できるかどうかをテストする。
16個のLDMエージェントとヒトの被験者による実験では、依存性の深さが増加するにつれて性能が急激に低下することが示された。
軌道解析は、主に長距離状態追跡、手がかり付着、中間相対伝播における故障をモデル化する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:59:27 GMT)
POETS: Uncertainty-Aware LLM Optimization via Compute-Efficient Policy Ensembles [35.9] POETSは不確実性定量化と政策最適化を橋渡しする新しいフレームワークである。
我々のアプローチは、KL(Kulback-Leibler)正規化で訓練されたポリシーが、基礎となる報酬関数を暗黙的にエンコードするという知見に基づいている。
我々はPOETSが様々な科学的発見領域にまたがって最先端のサンプル効率を実現することを実証する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:16:32 GMT)
Learning to Track Instance from Single Nature Language Description [35.7] 我々は、新しい自己教師型視覚言語トラッカーであるtextbftracker を紹介する。
言語記述によって参照対象を追跡することができる。
VLトラッキングベンチマークの実験では、トラッカーがSOTAの自己管理手法を超越していることが示されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:17:09 GMT)
Reason to Play: Behavioral and Brain Alignment Between Frontier LRMs and Human Game Learners [35.7] 人間は、新しい環境に遭遇する際に抽象的な知識を急速に学習する。
現代のAIシステムは、同様の方法で学び、計画できるのか?
本稿では,fMRI同時記録による複雑な人間のゲームプレイのデータセットを用いて,この問題を考察する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:07:41 GMT)
FlashSVD v1.5: Making Low-Rank Transformers Inference Actually Fast [35.5] SVD圧縮トランスを実現するための統一型推論ランタイムであるFlashSVD v1.5を提案する。
その結果、実際の低ランク加速には圧縮アルゴリズムのみではなく実行時共設計が必要であることが示唆された。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:20:42 GMT)
Neurosymbolic Imitation Learning with Human Guidance: A Privileged Information Approach [35.4] 本稿では,高次元データの処理を一般化しながら両世界の長所を達成するニューロシンボリックアプローチを提案する。
提案手法の有効性, 効率, 一般化能力について実証評価を行った。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:59:15 GMT)
The Memory Curse: How Expanded Recall Erodes Cooperative Intent in LLM Agents [35.2] アクセス可能な履歴を拡張することで、28のモデルのうち18の協力関係が悪化する。
第一に、378,000の推論の語彙解析は、パラノイアの上昇よりも前方の意図を侵食してこの崩壊を辿る。
第2に、記憶の衛生化は、目に見える歴史を合成協調記録に置き換えつつ、即時的な長さを保ち、実質的に協調を回復させる。
第三に、明示的な因果関係を非難することは、しばしば崩壊を減少させ、議論がパラドックス的に記憶の呪いを増幅することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:47:13 GMT)
LaTER: Efficient Test-Time Reasoning via Latent Exploration and Explicit Verification [35.1] CoT(Chain-of- Thought)推論は、難しいタスクにおいて大きな言語モデル(LLM)を改善するが、推論コストも高くつく。
本稿では,連続潜伏空間における有界探索を最初に行う2段階のパラダイムであるLaTERを提案する。
LaTERは入力の埋め込み空間に隠された最後の層を投影し、潜伏KVキャッシュを保持し、エントロピーとモデルネイティブのストップトーケンプローブを使用していつ切り替えるかを決定する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:23:58 GMT)
QHyer: Q-conditioned Hybrid Attention-mamba Transformer for Offline Goal-conditioned RL [35.0] オフラインのゴール条件付きRL(GCRL)は、静的データセットから目標設定ポリシーを学ぶ。
実世界のデータセットは部分的に観測可能で歴史に依存しており、マルコフと非マルコフの混合を示す。
textbfQHyerは、コンテンツ適応履歴圧縮を実行する、ゲート付きハイブリッドアテンション-マンババックボーンを導入している。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:23:44 GMT)
Structural Rationale Distillation via Reasoning Space Compression [34.9] 推論パス圧縮(Reasoning Path Compression)は、教師が再利用可能な高レベル推論パスのコンパクトで動的に維持されたバンクに従うことを制約する。
各トレーニング質問に対して、D-RPCは教師が従うべき最も関連性の高いパスと条件を検索し、類似した問題に一貫性があり、異なる問題タイプをカバーするのに十分な多様な合理性を生み出す。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:15:52 GMT)
Object Hallucination-Free Reinforcement Unlearning for Vision-Language Models [34.6] 視覚言語モデル(VLM)は、プライバシー、著作権、偏見に対する関心を高め、センシティブな知識を取り除くために機械学習を動機付けている。
深い意味的除去のための視覚エンコーダで動作する強化型アンラーニングフレームワークHFRUを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:19:53 GMT)
Uncertainty Quantification for Cardiac Shape Reconstruction with Deep Signed Distance Functions via MCMC methods [34.2] 本研究では不確実性を考慮した心臓形状復元のための確率的枠組みを提案する。
提案手法は, 精度の高い復元を行い, 精度の高い不確実性推定を行う。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:45:11 GMT)
Toward Better Geometric Representations for Molecule Generative Models [34.0] LENSEsは、表現条件付き生成法における分子表現の可能性をうまく活用するフレームワークである。
分子生成タスクによるこれらの改善の有効性を実証する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:02:58 GMT)
SDG-MoE: Signed Debate Graph Mixture-of-Experts [34.0] ほとんどのMoEアーキテクチャでは、トークンがルーティングされると、選択された専門家が独立してそれを処理し、その出力は重み付けされた和で結合される。
最終集計の前に,軽量かつ反復的な検討段階を付加する新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:25:21 GMT)
Beyond ViT Tokens: Masked-Diffusion Pretrained Convolutional Pathology Foundation Model for Cell-Level Dense Prediction [34.0] Masked-Diffusion Convolutional Foundation Models (CMD) は、高密度病理表現学習のための自己教師型畳み込み生成事前学習フレームワークである。
CMDは、既存のViTベースの病理基盤モデルよりも一貫して優れており、最先端のエンドツーエンドセグメンテーション手法を超越している。
以上の結果から,純粋な畳み込み型アーキテクチャは細胞レベルでの高密度予測のための競合する病理基盤モデルとして機能する可能性が示唆された。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:34:56 GMT)
Code World Model Preparedness Report [33.7] 本稿では,Code World Model (CWM) の準備性評価について報告する。
私たちはFrontier AI Frameworkで特定されたドメイン間でプレリリーステストを実施しました。
我々の評価によると、CWMは現在のAIエコシステムに存在するもの以上の、新たなフロンティアリスクを生じさせない。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:50:05 GMT)
Failing Forward: Adaptive Failure-Informed Learning for Vision-Language-Action Models [32.9] 本稿では,拡散型および流路型VLAポリシーに対する適応的負のガイダンスとして,障害軌跡を利用するエンドツーエンドフレームワークを提案する。
AFILはトレーニング済みのVLAを使用して、オンラインの障害ロールアウトを生成する。
その後、デュアルアクションジェネレータ(DAG)を共同で訓練し、共通の視覚言語バックボーンを共有しながら、動作が成功し失敗する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:57:11 GMT)
Sat3R: Satellite DSM Reconstruction via RPC-Aware Depth Fine-tuning [32.7] 本研究では,単眼深度基礎モデルを衛星領域に適応させるフィードフォワードフレームワークであるSat3Rを提案する。
DFC 2019ベンチマークの実験では、Sat3Rは、ゼロショットフィードフォワードベースラインを38%削減し、最適化ベースのメソッドと競合する精度を達成し、300倍以上のスピードアップを実現している。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:29:55 GMT)
Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning [32.5] 永続的なスキルライブラリにより、言語モデルエージェントはタスク間で成功した戦略を再利用できる。
既存の手法は、これらの機能を分離または別々の報酬源で最適化し、部分的かつ矛盾する進化をもたらす。
Skill1は,共有タスクアウトカム目標に向けて,スキル選択,利用,蒸留を共同開発するための単一の政策を訓練するフレームワークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:47:18 GMT)
SOD: Step-wise On-policy Distillation for Small Language Model Agents [32.5] ツール統合推論は、小さな言語モデルにスケールすることが難しい。
近年,教師から密集したトークンレベルの監督を施すことで,オンライン蒸留が普及している。
スモールランゲージモデルエージェントのための段階的オンライン蒸留フレームワークであるSODを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:30:42 GMT)
Towards Highly-Constrained Human Motion Generation with Retrieval-Guided Diffusion Noise Optimization [32.0] ゼロ時間目標関数をカスタマイズした動きを生成するための学習自由拡散雑音最適化フレームワークを提案する。
このフレームワークは、制御可能なキャラクターアニメーションや仮想エージェントの動作合成などのアプリケーションを可能にするために使用される。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:43:29 GMT)
Online Allocation with Unknown Shared Supply [31.6] 本研究では,中央ハブが連続的な需要に直面した複数のサイトに対して,有限かつ未知の供給を割り当てるステートフルオンラインモデルについて検討する。
古典的なストック・ツー・ストックやメイク・ツー・オーダーの在庫モデルとは異なり、OSSAは将来の需要に対してヘッジのバックログ化と補充を妨げている。
我々は,GPAが全供給に依存しない加算項までオフライン最適化を実現することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:59:11 GMT)
Understanding Performance Collapse in Layer-Pruned Large Language Models via Decision Representation Transitions [31.4] レイヤープルーニングは、LLM(Large Language Model)計算コストを効率的に削減するが、しばしば突然の性能低下を引き起こす。
本稿では,2つの指標,決定マージンとオプション周波数を導入し,レイヤワイド決定ダイナミクスを解析するための反復処理手法を提案する。
その結果,ネットワークを2段階に分割するシャープな決定遷移が明らかとなった。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:35:32 GMT)
Conformal Path Reasoning: Trustworthy Knowledge Graph Question Answering via Path-Level Calibration [31.3] 本稿では,2つの重要なイノベーションを持つ信頼性の高いKGQAフレームワークであるConformal Path Reasoning (CPR)を提案する。
まず、経路レベルのスコアに対してクエリレベルの共形キャリブレーションを行い、経路予測セットを生成しながら交換性を維持する。
第2にResidual Conformal Value Network (RCVNet)を導入する。これはPUCT誘導探索によって訓練された軽量モジュールで、識別パスレベルの非整合性スコアを学習する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:57:13 GMT)
Log analysis is necessary for credible evaluation of AI agents [31.2] エージェントベンチマークは通常、パスまたはフェールという最終結果のみを報告します。
これは3つの点で評価の信頼性を脅かす。
これらの妥当性の脅威を克服するにはログ分析が必要であると我々は主張する。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:10:32 GMT)
Can Agents Price a Reaction? Evaluating LLMs on Chemical Cost Reasoning [31.1] 大規模言語モデル(LLM)は、ツール使用エージェントとしてますます機能してきている。
ChemCostは、2,261の化学物質と230,775のサプライヤの見積もりをカバーする、凍結価格スナップショットに基づく1,427個の評価可能な反応のベンチマークである。
フロンティア、オープンウェイト、化学特殊化LLMエージェントを用いた実験では、ツールアクセスは必要だが、タスクの解決には不十分であることが示されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:19:59 GMT)
AsyncEvGS: Asynchronous Event-Assisted Gaussian Splatting for Handheld Motion-Blurred Scenes [31.0] フレキシブルで高解像度の非同期RGB-Eventデュアルカメラシステムとそれに対応する再構成フレームワークを導入する。
我々は、従来のイベント損失の不正な振る舞いを軽減するために、構造駆動のイベント損失とビュー固有の一貫性レギュレータを使用します。
実験により,本手法は,課題のあるデータセットと既存のベンチマークの両方において,最先端のパフォーマンスを実現することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:39:45 GMT)
On the Invariance and Generality of Neural Scaling Laws [30.9] ニューラルスケーリング法則は、モデルパフォーマンスとデータまたは計算の間の予測可能な関係を確立する。
新しいモデルのタスクペアに1つを合わせるには、通常、非常に計算予算を消費する高価なスイープが必要です。 法律は、エコノマイズを意図しています。
本稿では、一般化可能なスケーリング法則をどう開発するかという研究課題を提起する。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:21:09 GMT)
Towards Autonomous Business Intelligence via Data-to-Insight Discovery Agent [30.5] AIDA(Autonomous Insight Discovery Agent)は、複雑なビジネス環境での自律的な探索のために設計された、最初のエンドツーエンドフレームワークである。
我々の研究は、最終的に産業規模のビジネスインテリジェンスシステムにおける自律的知能の変革の可能性を確立します。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:49:41 GMT)
MMTB: Evaluating Terminal Agents on Multimedia-File Tasks [30.4] 多くの実世界のベンチマークでは、実践者が直接オーディオやビデオファイルを扱う必要がある。
マルチメディアファイルタスクにおける端末エージェントの評価には,MultiMedia-TerminalBench(MMTB)を導入する。
本稿では,端末エージェントの音声・映像認識機能を備えたマルチメディアハーネスであるTerminus-MMを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:57:19 GMT)
What Time Is It? How Data Geometry Makes Time Conditioning Optional for Flow Matching [30.3] フローマッチングモデルは明示的な時間条件なしでトレーニングすることができ、速度目標を曖昧にするために時間が必要であるという標準的な見解に挑戦する。
時間-盲流整合損失を分解し、既約誤差の2つの源を同定する。
本研究では,高次元データの幾何学がノイズ観測から直接時間を特定することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:00:36 GMT)
Temporal Smoothness Doubly Robust Learning for Debiased Knowledge Tracing [29.9] 知識追跡(KT)のための二重頑健(DR)定式化を導入する。
DRは確率モデルと誤差計算モデルを統合し、理論上どちらのモデルも正確であれば不偏性を保証する。
これらの理論的知見に基づいて、時間的平滑性2重ロバスト(TSDR)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:07:38 GMT)
Kernel Foundry: A Diagnosis-driven Evolutionary Kernel Optimizer with Multi-Experts [29.9] Kernel Foundryは、自動GPUカーネル最適化のための診断駆動の進化的フレームワークである。
KernelBenchの実験では、強いベースラインよりも精度と性能が一貫して向上していることが示されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:41:54 GMT)
MemCompiler: Compile, Don't Inject -- State-Conditioned Memory for Embodied Agents [29.9] 本稿では,メモリ利用をステートコンディション・メモリ・コンパイルとして再構成するMemCompilerを提案する。
Across Alf World、EmbodiedBench、ScienceWorldでは、MemCompilerは無メモリよりも一貫して改善されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:07:04 GMT)
TRACE: Tourism Recommendation with Accountable Citation Evidence [29.8] TRACEでは,各項目が複数ターンの観光レコメンデーションダイアログであり,レビュー・スパンの引用と明示的な拒絶のターンがある。
米国8都市で2,400のPOIと34,208のレビューで1万の対話があり、14の検索、計画、LLMベースラインが組み合わされた。
LLM Zero-ShotはクローズドセットのRecall@1とリジェクションリカバリをリードするが、レトリバーよりも密度が低い。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:47:39 GMT)
Multi-Armed Bandits With Best-Action Queries [29.7] Emphbest-action queryを併用したEmphmulti-armed bandits(MABs)の検討
ベストアクションクエリは、最適な$widetildemathcalO(sqrtT)後悔を$widetildemathcalO(minT/k,sqrtT)$に還元する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:14:50 GMT)
Text-to-CAD Evaluation with CADTests [29.7] 自動テストに基づくテキスト・ツー・CADの新たな評価視点を提案する。
CADTestBenchはText-to-CADの最初のテストベースのベンチマークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:41:39 GMT)
Grounding Multi-Hop Reasoning in Structural Causal Models via Group Relative Policy Optimization [29.6] MHFV(Multi-Hop Fact Verification)は、異なる証拠の複雑な推論を必要とする。
既存の手法は、Chain-of-Thought (CoT)を通じて透明性を向上させる一方で、エビデンスとクレーム間の因果関係の明確なモデリングを欠いている。
本稿では,構造因果モデル(Structure Causal Model, SCM)における推論を基礎として, 検証を建設因果推論プロセスとして扱う新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:11:44 GMT)
Towards Photorealistic and Efficient Bokeh Rendering via Diffusion Framework [29.6] 既存のモバイルデバイスは、小さな開口部のようなコンパクトな光学設計によって制約されている。
高品質で効率的なボケレンダリングのための統合拡散ベースフレームワークMagicBokehを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:31:10 GMT)
What Matters for Diffusion-Friendly Latent Manifold? Prior-Aligned Autoencoders for Latent Diffusion [29.5] Pre-Aligned AutoEncoder (PAE) は既存のトークンよりもトレーニング効率と生成品質を向上する。
ImageNet 256x256では、PAEは既存のトークン化ツールよりもトレーニング効率と生成品質の両方を改善している。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:52:51 GMT)
Implicit Preference Alignment for Human Image Animation [29.5] Implicit Preference Alignment (IPA)は、ペア化された嗜好データを必要としない、データ効率のよいポストトレーニングフレームワークである。
IPAは、自己生成した高品質なサンプルの可能性を最大化しつつ、事前訓練済みの偏差をペナルティ化することでモデルを整合させる。
実験により,IPAは手作り品質を向上させるために効果的な選好最適化を実現するとともに,選好データ構築の障壁を著しく低減することが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:19:55 GMT)
Post-training makes large language models less human-like [29.0] 我々は,行動アライメントを大規模に測定できる新しいデータセット Psych-201 を紹介した。
ポストトレーニングは、モデルファミリー、サイズ、目的をまたいだ人間の行動との整合性を一貫して減少させる。
また,ペルソナ誘導は個人レベルでの予測を改善できないことも確認した。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:59:34 GMT)
Large-Scale High-Quality 3D Gaussian Head Reconstruction from Multi-View Captures [29.0] HeadsUpは、大規模マルチカメラのセットアップから高品質な3Dガウスヘッドを再構築するためのスケーラブルなフィードフォワード方式である。
我々は、既存の多視点人頭データセットよりも桁違いに大きい1万人以上の被験者からなる内部データセット上で、我々のモデルをトレーニングし、評価する。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:12:59 GMT)
NavOne: One-Step Global Planning for Vision-Language Navigation on Top-Down Maps [28.7] 構築したトップダウンマップ上での1ステップのグローバルパス計画問題としてナビゲーションを再構成したトップダウンVLNを提案する。
NavOneは、単一のエンドツーエンドのフォワードパスにおいて、マルチモーダルマップ上での高密度パス確率を直接予測する統合フレームワークである。
NavOneは、マップベースのVLNメソッドの最先端のパフォーマンスを実現し、既存のマップベースのベースラインの8倍、エゴセントリックなメソッドの80倍のステージスピードアップを実現している。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:00:23 GMT)
CLIPer: Tailoring Diverse User Preference via Classifier-Guided Inference-Time Personalization [28.7] 軽量なパーソナライゼーションアプローチであるtextbfCLIPer (textbfClassifier-guided textbfInference-time textbfPersonalization) を導入する。
提案手法では, 微調整が不要となり, 計算オーバーヘッドが増大する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:47:30 GMT)
RDKV: Rate-Distortion Bit Allocation for Joint Eviction and Quantization of the KV Cache [28.5] 大規模言語モデル(LLM)は様々なタスクにまたがって高い性能を示すが、長い入力コンテキストでの推論はメモリサイズと帯域幅によってボトルネックとなる。
既存のメソッドは、消去または量子化によってキャッシュを減らすが、通常は2つを分離して扱う。
本稿では、KVキャッシュ圧縮をレート歪み問題とみなし、同じビット割り当て方式の2つの端点の消去と量子化を行う。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:15:06 GMT)
P-Flow: Proxy-gradient Flows for Linear Inverse Problems [28.4] P-Flowは、プロキシ勾配を利用してソースポイントを更新することで、再構築プロセスを安定化するフレームワークである。
さまざまな復元タスクに対する実験は、P-Flowが競争力のあるパフォーマンスを提供することを示している。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:07:36 GMT)
Negative refraction with low absorption using EIT in a four-level left-handed atomic system [28.4] 左利き原子系において低吸収で負の屈折を得る手法を提案する。
誘電率と透過性の想像上の部分は、同じ周波数範囲で透過的に伝播する。
負の屈折は、EIT効果による低吸収を示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:18:27 GMT)
Rollout Pass-Rate Control: Steering Binary-Reward RL Toward Its Most Informative Regime [28.3] Prefix Sampling (PS)は、自己生成した軌跡の接頭辞を再生し、スキュードグループをこの体制に向けて操る。
PSは評価変数のベースラインのハイスコア状態に達し、2.01xと1.55xのエンドツーエンドのウォールクロックスピードアップを提供する。
AIME 2025は4Bと8Bで同じパスレート制御パターンを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:56:06 GMT)
Is the Future Compatible? Diagnosing Dynamic Consistency in World Action Models [28.2] 世界行動モデル(WAM)は、将来の観察と行動を予測することにより、想像上のロールアウトを通じて意思決定を可能にする。
動作状態の整合性、予測された動作と誘導された状態遷移の整合性を、WAMの信頼性の欠如の軸として同定する。
テスト時間選択のための価値のないコンセンサス戦略を導入し、予測される未来間での合意によって、候補のロールアウトをランク付けする。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:44:43 GMT)
When Are Experts Misrouted? Counterfactual Routing Analysis in Mixture-of-Experts Language Models [27.9] Mixture-of-Experts (MoE)言語モデルは、各トークンを専門家の小さなサブセットにルーティングする。
検証された推論軌道において,各標準経路を同一のトークンに対してサンプル化された等価な代替手段と比較し,実効トークンに割り当てる次の確率でスコアする。
標準ルータは信頼性の高いトークンではルートユーティリティと整合性があるが、ハード推論を駆動する脆弱なトークンでは非形式的である。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:26:09 GMT)
Inferring Asteroseismic Parameters from Short Observations Using Deep Learning: Application to TESS and K2 Red Giants [27.3] 我々は,短周期観測から無テロリズムパラメータを推定するための機械学習(ML)に基づく手法を開発した。
具体的には、赤色巨星の1ヶ月にわたるTESS観測から、大周波数分離($)と最大出力での周波数($_mathrmmax$)の2つの大域地震パラメータに着目した。
我々の機械学習アルゴリズムは,1ヶ月のケプラーとK2の観測から得られたサンプルの約50%に対して,$$と$_mathrmmax$を正確に推論できることを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:41:13 GMT)
Coarse-to-Fine: Progressive Image Compression for Semantically Hierarchical Classification [27.2] セマンティックな階層構造を意識したプログレッシブコーデックを導入し、単一のビットストリームからセマンティックなスケーラビリティ(すなわち粗い粒度)を実現する。
我々の研究は、タスク適応型画像符号化のための効率的かつ解釈可能なソリューションを提供し、既存の進歩的階層的評価よりも優れています。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:08:35 GMT)
Star Elastic: Many-in-One Reasoning LLMs with Efficient Budget Control [27.0] 大規模言語モデル(LLM)のための新しいポストトレーニング手法であるStar Elasticを紹介する。
Star Elasticは、ある親の推論モデルにNのネストされたサブモデルを追加し、1回のトレーニング後のジョブで1回の実行(N-fold saves)を実行する。
The Nemotron Elastic framework, we apply Star Elastic to the NVIDIA Nemotron Nano model。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:20:36 GMT)
Rethinking State Tracking in Recurrent Models Through Error Control Dynamics [26.9] 本研究では,アフィン再帰ネットワークが状態表現を保存すると,状態分離部分空間の誤りを訂正できないことを示す。
我々は、ロバストな状態追跡がアーキテクチャの理論的表現性だけでなく、エラー制御によって決定されることを証明した。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:59:15 GMT)
NeuralBench: A Unifying Framework to Benchmark NeuroAI Models [26.8] 我々は,脳活動のAIモデルをベンチマークする統合フレームワークであるNeuralBenchを紹介する。
このフレームワークには、36の脳波(EEG)タスクと14のディープラーニングアーキテクチャを含む、大規模なEEGベンチマークであるNeuralBench-EEG v1.0があります。
我々はコミュニティに、このオープンソースフレームワークを拡張し、ニューロイメージングモデルのための統一されたベンチマーク標準に向けて協力するよう呼びかけます。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:19:57 GMT)
Zero-determinant Strategy for Moving Target Defense: Existence, Performance, and Computation [26.7] 移動目標防衛(MTD)は、永続的な脅威を緩和するための繰り返しセキュリティゲームとして一般的に定式化されている。
本稿では,高い防御性能と計算複雑性を両立するMTD戦略を構築するために,ゼロ決定式(ZD)戦略を採用することを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:16:10 GMT)
Inference Time Causal Probing in LLMs [26.7] 因果探索において、介入は、プロパティが異なる値を取るように隠された状態を変更する。
隠れ状態を直接制御するプローブレス勾配法であるHidden-state Driven Margin Intervention (HDMI)を提案する。
HDMIはLGD契約コーパスやCausalGymベンチマークの従来の方法よりも信頼性が高い。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:59:13 GMT)
Beyond Linear Attention: Softmax Transformers Implement In-Context Reinforcement Learning [26.6] インコンテキスト強化学習は、事前訓練後、パラメータを更新せずに追加コンテキストに条件付けすることで、新しいタスクに適応する。
本稿では、非現実的な線形注意を単純化することなく、ICRLに関する最初の理論的理解を提供する。
このようなソフトマックスの注意を持つトランスフォーマーの階層的に前方通過は、重み付きソフトマックス時間差(TD)学習アルゴリズムの反復更新と等価であることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:37:51 GMT)
Repeated Deceptive Path Planning against Learnable Observer [26.5] 本稿では, エージェントが真の目的地を外部観測者から隠蔽することを目的とした, 偽パス計画(DPP)の問題について検討する。
既存の研究は静的な非学習観察者を前提としているが、現実の敵、例えば重要な貨物輸送は歴史的操作から学ぶことで適応することができる。
既存の DPP 法はこの条件下では失敗し, 進化する敵の予測に適応できないことを示す。
DeMP(Deceptive Meta Planning)は、エピソードレベルの適応を組み込んだ2段階最適化フレームワークであり、更新されたオブザーバに対応するための短期的なポリシー調整を可能にする。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:10:29 GMT)
Toward Optimal Regret in Robust Pricing: Decoupling Corruption and Time [26.4] 汚い$C$が分かっていれば$mathcalO(C+log2 T)$、汚い$C$が不明であれば$mathcalO(C+log2 T)$。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:22:43 GMT)
Qwen3-VL-Seg: Unlocking Open-World Referring Segmentation with Vision-Language Grounding [26.3] Qwen3-VL-SegはMLLM予測ボックスを意味論的基盤構造として扱うパラメータ効率のよいフレームワークである。
その中核は、軽量のボックス誘導マスクデコーダで、マルチスケールの空間的特徴注入、空間意味的クエリ構築、ボックス誘導高解像度ピクセル融合を組み合わせている。
Qwen3-VL-Segはクローズドセットとオープンワールド設定で強く機能することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:20:40 GMT)
PerCaM-Health: Personalized Dynamic Causal Graphs for Healthcare Reasoning [26.3] PerCaM-Healthは、縦型健康データからパーソナライズされた動的因果グラフを学習するためのフレームワークである。
これらのグラフを時間構造方程式と結合することにより、このフレームワークは患者レベルの対実的なクエリを可能にする。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:31:45 GMT)
HTPO: Towards Exploration-Exploitation Balanced Policy Optimization via Hierarchical Token-level Objective Control [26.2] RLVR(Reinforcement Learning with Verifiable Rewards)は、Large Language Models(LLM)の推論能力を高めるための重要なテクニックとして登場した。
CoT(Chain-of-Thought)推論では、異なるトークンが通常、異なる役割を担っている。それゆえ、現在のRLアルゴリズムは、学習中に探索と探索のトレードオフを動的にバランスさせる効果的なメカニズムを欠いている。
本稿では,HTPO (Hierarchical Token-level Objective Control Policy Optimization) を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:38:35 GMT)
MLAIRE: Multilingual Language-Aware Information Retrieval Evaluation Protocal [26.2] MLAIREは多言語対応情報検索評価プロトコルである。
クエリ言語嗜好から言語間セマンティック検索を分離する。
標準メトリクスが明らかに異なる振る舞いを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:10:05 GMT)
SEQUOR: A Multi-Turn Benchmark for Realistic Constraint Following [26.1] 長時間のマルチターン会話における制約適合性を評価するための自動ベンチマークSEQUORを提案する。
その結果,1つの制約に従えば,会話が長くなるにつれて命令追従精度は一貫して低下することがわかった。
会話の任意のポイントで制約を追加したり置き換えたりするシナリオでは、モデルの精度は9%以上低下する。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:22:15 GMT)
Knowing but Not Correcting: Routine Task Requests Suppress Factual Correction in LLMs [26.1] LLMは、独立して提示された時に確実に偽のクレームを訂正するが、同じクレームがタスク指向のリクエストに埋め込まれている場合、そのクレームは正しいというよりも、従うことが多い。
我々は、この障害モードの誤り訂正を抑え、300の偽の前提のベンチマークを構築し、8つのモデルで体系的に評価する。
抑制率は19%から90%で、4つのモデルが80%を超え、修正抑制が一般的で深刻な現象として確立された。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:09:34 GMT)
Pan-FM: A Pan-Organ Foundation Model with Saliency-Guided Masking for Missing Robustness [26.0] そこで本研究では,7臓器からのイメージングを前提としたパン・オーガナイゼーション・モデルPan-FMを提案する。
Pan-FMはトレーニングと推論の両方で臓器の欠損を処理する統一されたバックボーンを使用し、マスクベースの自己蒸留で事前訓練されている。
Pan-FMは、システム神経科学におけるマルチモーダル学習における現実的なモダリティの欠如に対するスケーラブルな解決策として機能する。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:04:25 GMT)
ModelLens: Finding the Best for Your Task from Myriads of Models [26.0] モデルレコメンデーションのための統一フレームワークであるModelLensを紹介します。
パブリックなリーダーボードのインタラクションは散らばっていてうるさいが、集合的にモデル能力の暗黙のアトラスを追求している。
ModelLensは、ターゲットデータセットの候補を実行せずに、目に見えないデータセットに未確認のモデルをランク付けする。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:49:05 GMT)
The Geometric Structure of Models Learning Sparse Data [25.7] 多様体仮説がスパースとして適用できない状況について述べる。
モデルが高度に構造化された局所幾何学を利用してスパース構造に成功することを示す。
正規化戦略であるGrokAlignを導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:30:22 GMT)
PropGuard: Safeguarding LLM-MAS via Propagation-Aware Exploration and Remediation [25.5] 既存の防御は、良心的な協調を妨害することなく、きめ細かい伝播経路や汚染状態の追跡に失敗する。
PropGuardは、応答中心のリスク推定とフルステートのエビデンス保存を組み合わせた、デュアルビュー・テンポラルグラフを構築している。
プロップガードは高いタスクレベルの防衛の成功を維持しながら常に攻撃し、好意的な修復効率のトレードオフを実現した。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:26:55 GMT)
Where to Spend Rollouts: Hit-Utility Optimal Rollout Allocation for Group-Based RLVR [25.4] グループベースのポリシー最適化手法は通常、各プロンプトに一定数のロールアウトを割り当てる。
我々は、ヒットユーティリティを導入し、提案されたプロンプトの追加アロケーションにおける少なくとも1つのロールアウトが正しいという後続の確率について紹介する。
本研究では,Hit-Utility Optimal Rollout Allocation (HORA)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:42:25 GMT)
SpecBlock: Block-Iterative Speculative Decoding with Dynamic Tree Drafting [25.3] SpecBlockはブロックイテレーティブなドラフトアで、パス依存と安価なドラフトを組み合わせています。
デプロイ時のコストを意識した盗聴は、無償の検証者フィードバックを使用して、ドラフトを選択的に更新する。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:59:48 GMT)
PaT: Planning-after-Trial for Efficient Test-Time Code Generation [25.3] Planning-after-Trial (PaT) は、検証失敗時にのみプランナーを呼び出すコード生成のための適応的なポリシーである。
検証失敗時にのみプランナーを起動するコード生成のための適応ポリシーであるPaTを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:09:18 GMT)
SOM: Structured Opponent Modeling for LLM-based Agents via Structural Causal Model [25.2] 本稿では,対戦モデル構築と対戦モデル予測を明確に分離する2段階の対戦者モデリングフレームワークを提案する。
構築段階において、SOMは、変数間の依存関係を表現するグラフベースの形式主義である構造因果モデル(Structure Causal Model, SCM)を用いて、相手の観察と行動の間の直接リンクをキャプチャする。
予測段階では、LLMはSCMから導出される明確な経路に沿って構造化推論を行い、予測精度と安定性の両方を改善する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:11:42 GMT)
Scaling Limits of Long-Context Transformers [25.0] 固定クエリとランダムコンテキストを用いたソフトマックス自己アテンションの長文制限について検討する。
選択度が出現する臨界スケールは,0 に近い距離-クエリ分布の局所指数によって決定されることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:39:31 GMT)
Toward Privileged Foundation Models:LUPI for Accelerated and Improved Learning [24.9] 基礎モデルの訓練は計算集約的で、しばしば収束が遅い。
PIQL,Privileged Information for Quick and Quality Learningを紹介します。
実証的な証拠は、PIQLによってTFMがより早く収束し、最終的な損失を減らし、より一般化できることを示している。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:36:12 GMT)
Proactive Instance Navigation with Comparative Judgment for Ambiguous User Queries [24.7] 比較判断(ProCompNav)を用いた能動型インスタンスナビゲーションを提案する。
ProCompNavはまず候補プールを構築し、比較判定によってターゲットを識別する。
CoIN-Benchでは、ProCompNavはインタラクティブなベースラインよりも、最小限の入力と非インタラクティブなベースラインを詳細な説明で改善する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:20:32 GMT)
SARA: Semantically Adaptive Relational Alignment for Video Diffusion Models [24.6] 最近の拡散モデル(VDM)は、視覚的に説得力のあるクリップを合成するが、それでも実体や誤結合属性を落とし、プロンプトアライメントルーブリックで指定された相互作用を弱める。
我々は,凍結したVFMターゲットにトークン関係を保ち,どのトークンペアが監督を行うかを決定するためのテキスト条件付きサリエンシを付加する適応表現アライメント(SARA)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:36:32 GMT)
WeatherSyn: An Instruction Tuning MLLM For Weather Forecasting Report Generation [24.5] 本稿では、天気予報(WFR)タスクを提案し、このタスクのための最初の命令調整データセット、nameDatasetNameLを構築する。
このコーパスに基づいて,天気予報生成に特化したモデルモデル ModelNameL を開発した。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:53:33 GMT)
Drifting Field Policy: A One-Step Generative Policy via Wasserstein Gradient Flow [24.5] ドリフトフィールドポリシー(DFP)は、ドリフトモデルパラダイムに基づく一段階の生成ポリシーである。
我々は、このポリシー更新を、ソフトターゲットポリシーに向けた逆KL Wasserstein-2勾配流として構成し、各DFP更新が確率空間の勾配ステップに対応するようにした。
我々は、トップKの批評家が選択した行動における行動のクローンのような、さほど難解でない更新損失の、単純でトラクタブルなサロゲートを導出する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:34:27 GMT)
MedVIGIL: Evaluating Trustworthy Medical VLMs Under Broken Visual Evidence [24.5] medvigilは4つの公開医療用VQAソースから作成された300ケースの評価スイートである。
あらゆるゴールド回答、拒絶オプション、候補答えセット、パラフレーズ、虚偽の前提トラップ、ROIボックス、臨床リスクレベルが臨床著者によって作成される。
メドビニル複合スコア(MCS)に要約した7つの正当性条件監査指標を報告する。
独立した放射線学者は、静電気障害率5.8%でMCS 83.3をスコアし、14.1ポイントの複合ヘッドルームを最強の監査モデルの上に残した。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:55:30 GMT)
Geometry-Aware Discretization Error of Diffusion Models [24.3] 固定された推論予算の下では、限られた数のdenoisingステップだけを使用して、リバースタイムODEまたはSDEをシミュレートする必要がある。
既存の非漸近解析は収束保証を提供するが、一般的には拡散パラメータに敏感すぎるため、実用的な設計を導くことができない。
オイラー・丸山弱度とフレシェの離散化誤差の1次展開を導出する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:02:21 GMT)
One World, Dual Timeline: Decoupled Spatio-Temporal Gaussian Scene Graph for 4D Cooperative Driving Reconstruction [24.0] 4次元協調運転再建のためのDust (Deco Upled Spatio-Temporal) Gaussian Scene Graphを提案する。
DUSTは最先端の性能を達成し、最強ベースラインよりも3.2dBのダイナミック領域PSNRを改善する。
DUSTはまた、フレシェビデオ距離を37.7%減らし、時間同期を大きく抑えている。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:48:57 GMT)
Risk-Consistent Multiclass Learning from Random Label-Subset Membership Queries [23.7] 本稿では,ランダムラベルサブセットクエリに基づくマルチクラスラーニングフレームワークを提案する。
我々は、経験的リスク最小化(ERM)フレームワークの下で、目標リスクの偏りのない推定器を導出する。
負の経験的リスクとそれに伴うオーバーフィッティング問題に対処するために,非負および絶対値の補正に基づく修正されたリスク推定器を導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:05:02 GMT)
Asymmetric On-Policy Distillation: Bridging Exploitation and Imitation at the Token Level [23.6] オンライン蒸留(OPD)は、トークンレベルの教師のフィードバックで生徒を自身の軌道で訓練する。
その標準的優位重み付け政策勾配は、高分散更新、ゼロアドバンテージ領域での勾配の消失、補正信号が不十分な場合の探索ボトルネックなどの3つの構造的弱点に悩まされている。
正の強化学習を保ちつつ,非正の負の強化を非正の利得領域における局所的な発散最小化に置き換える非対称オンポリシィ蒸留(AOPD)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:53:12 GMT)
Boosting Automatic Java-to-Cangjie Translation with Multi-Stage LLM Training and Error Repair [23.5] 本稿では,Java コードを Cangjie コードに変換するための反復的エラー修復手法を用いたトレーニングフレームワークを提案する。
実験の結果, 並列データに制限があるため, 現状の手法に比べて機能的等価性は6.06%向上することがわかった。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:58:12 GMT)
CktFormalizer: Autoformalization of Natural Language into Circuit Representations [23.4] CktFormalizerは、Lean 4.0に組み込まれた依存型HDLを通じてハードウェア生成をリダイレクトするフレームワークである。
VerilogEval(156問題)、RTLLM(50問題)、ResBench(56問題)では、CktFormalizerは直接Verilog生成と競合するシミュレーションパスレートを達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:20:06 GMT)
Can Revealed Preferences Clarify LLM Alignment and Steering? [23.2] LLMの観測した選択が最適化するインプリート嗜好を推定するための経験的パイプラインを提案する。
提案手法は,モデルが一貫したゴール指向の振る舞いをするかどうかの厳密な評価を可能にすることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:26:35 GMT)
AffineLens: Capturing the Continuous Piecewise Affine Functions of Neural Networks [23.0] Piecewise Affine Neural Network (PANN) は、ニューラルネットワークの表現性に関する原則的な幾何学的視点を提供する。
AffineLensは、超平面配置とPANNを基盤とした多面体構造を計算するための統一的なフレームワークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:10:45 GMT)
Rethinking Importance Sampling in LLM Policy Optimization: A Cumulative Token Perspective [22.8] トークンレベルのIS比は、PPOとGRPOが採用しているように、プレフィックス状態の分布ミスマッチを無視してバイアスを導入する。
我々は、累積トークンIS比と、累積対数比の自然な$sqrtt$成長に応じて、対数空間のクリップ境界を拡大する位置適応クリッピングを組み合わせたCTPOを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:35:02 GMT)
FAAST: Forward-Only Associative Learning via Closed-Form Fast Weights for Test-Time Supervised Adaptation [22.7] FAASTはラベル付きサンプルを解析的に1パスで高速な重みにコンパイルする。
適応時間を90%以上短縮しつつ, FAAST の適合性を示した。
その結果、FAASTは教師付きタスク適応のための、高度に効率的でスケーラブルなソリューションであることが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:38:56 GMT)
Graduate Training in Quantum Information Science and Engineering: Lessons, Challenges, and a Roadmap from the NSF Research Traineeship Programs [22.5] 2019年以降、量子情報科学・工学(QISE)のNRT(NSF Research Traineeship)18部門が資金提供を受けている。
我々は、すべてのQISE卒業生プログラムが交渉しなければならないという中心的な緊張を乗り越えています。
NRTプログラムが生み出した構造的・教育的革新について述べる。
コミュニティが解決しなければならない12のオープンな問題をスケッチします。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:42:45 GMT)
Approximation Error Upper and Lower Bounds for Hölder Class with Transformers [22.5] ソフトマックス演算子、ReLUアクティベーション関数、残差接続を備えた標準トランスフォーマーアーキテクチャに対して、新しい近似上界を導出する。
我々は,少なくとも$mathcalO(varepsilon-d_0/)$ブロックからなるTransformerネットワークが任意の有界Hlder関数を近似可能であることを証明した。
近似下界の場合、VC次元上界を利用して、変換器が少なくとも$(varepsilon-d_0/(4))を要求することを厳格に証明するのは初めてである。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:10:31 GMT)
ForgeVLA: Federated Vision-Language-Action Learning without Language Annotations [22.4] Vision-Language-Action(VLA)モデルは、汎用ロボットインテリジェンスを大いに約束する。
ForgeVLAは、生データの集中化や手動のアノテーションを必要とせずに、分散ビジョンアクションペアからVLAモデルを学ぶ。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:20:56 GMT)
Semiparametric Efficient Test for Interpretable Distributional Treatment Effects [22.4] カーネルテストは介入結果法則の相違を検出することができるが、グローバルテストは法の相違点を明らかにしない。
本稿では, DR-ME法を応用し, 最初の半原理的に効率的な有限配置法を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:23:34 GMT)
DRIP-R: A Benchmark for Decision-Making and Reasoning Under Real-World Policy Ambiguity in the Retail Domain [22.0] DRIPRは、現実の小売政策構築シナリオを利用して、単一の正しい解決方法が存在しないベンチマークである。
DRIPRは、現実的な顧客ペルソナと組み合わせたポリシーの曖昧なリターンシナリオのキュレートされたセットと、完全な対話型シミュレーションツール呼び出し機能、マルチジャッジ評価フレームワークから構成される。
我々の実験は、フロンティアモデルが本質的に同じ方針の曖昧さに異を唱えていることを示し、あいまいさがLLM意思決定に真かつ体系的な課題をもたらすことを確認した。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:10:49 GMT)
Cross-Modal Backdoors in Multimodal Large Language Models [21.9] 単一の妥協されたコネクタは、モダリティを越えて再利用可能なラテントスペースバックドアパスを確立することができる。
この攻撃は、99.9%の攻撃成功率(ASR)を同モード設定で達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:29:50 GMT)
Globally Optimal Training of Spiking Neural Networks via Parameter Reconstruction [21.9] スパイキングニューラルネットワーク(SNN)は、従来のニューラルネットワーク(ANN)に代わる生物学的に妥当でエネルギー効率のよい代替手段として提案されている。
本稿では,SNN学習におけるパラメータ再構成アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:10:08 GMT)
FlashEvolve: Accelerating Agent Self-Evolution with Asynchronous Stage Orchestration [21.9] FlashEvolveは非同期ワーカーとキューとの同期実行を置き換える効率的なフレームワークである。
古いアーティファクトは、単に遅れた作業であるだけでなく、LLMが反射し、修正し、有用な進化信号になることを示す読みやすい証拠でもある。
GEPAワークロードでは、FlashEvolveがプロポーザルスループットを、ローカルvLLMで3.5ドル、同期GEPA上でAPIを提供する場合4.9ドル改善している。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:04:48 GMT)
DVD: Discrete Voxel Diffusion for 3D Generation and Editing [21.5] 本稿では,SLatに基づく3次元生成パイプラインのスパースボクセルの生成,評価,編集を行うための離散拡散フレームワークを提案する。
ボクセル占有を独立変数として扱うことにより、DVDは連続的に離散的な閾値付けを避けることができる。
DVDは明示的な分類的モデリングを通じてより解釈可能な生成ダイナミクスを提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:32:17 GMT)
VideoRouter: Query-Adaptive Dual Routing for Efficient Long-Video Understanding [21.4] ビデオは、過度に長い視覚的トーケンシーケンスを生成し、推論中にメモリと遅延を急激に増加させる。
本稿では,InternVL上に構築されたクエリ適応型デュアルルータフレームワークであるVideoについて述べる。
我々は、ビデオがInternVLベースラインを同等または低い予算で継続的に改善し、67.9%のトークン削減を達成することを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:46:44 GMT)
Securing Computer-Use Agents: A Unified Architecture-Lifecycle Framework for Deployment-Grounded Reliability [21.3] この記事では、CUAのデプロイメント基盤信頼性のためのアーキテクチャライフサイクルフレームワークを開発する。
この分析は、代表システム、ベンチマーク、およびセキュリティ/プライバシー研究を合成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:38:46 GMT)
The Text Uncanny Valley: Non-Monotonic Performance Degradation in LLM Information Retrieval [21.2] 単語境界の破損がLarge Language Modelベンチマークのターゲット情報の検出方法に与える影響について検討する。
単語に空白文字を挿入して断片に分解することで、LLMの精度は挿入率の増加とともにU字型曲線に従う。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:26:42 GMT)
Convergence and Emergence of In-Context Reinforcement Learning with Chain of Thought [21.2] In-context reinforcement learning (ICRL) とは、RLエージェントがパラメータの更新なしに新たなタスクに適応できる機能である。
近年の実証研究により、CoT(Chain-of-Thought)生成がこのICRL能力を増幅できることが証明されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:56:38 GMT)
Beyond Retrieval: A Multitask Benchmark and Model for Code Search [21.2] textscCoREBは、5つのプログラミング言語でLiveCodeBenchの問題を偽装的に書き直して作られている。
11の埋め込みモデルと5つのリランカをテキスト・トゥ・コード、コード・トゥ・テキスト、コード・トゥ・コードという3つのタスクでベンチマークする。
textscCoREB-Rerankerは、3つのタスクで一貫したゲインを達成する最初の方法です。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:03:59 GMT)
Future Validity is the Missing Statistic: From Impossibility to $Φ$-Estimation for Grammar-Faithful Speculative Decoding [21.1] 文法制約付き生成は、しばしば局所的な語彙マスキングと投機的復号化と組み合わせられる。
局所マスクアクセスを持つ投機的デコーダ,レバイアサン拒絶,および局所予測分布$mathrmproj$からのロールバック音質サンプルは,文法条件分布$star$ではなく,いずれかを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:08:18 GMT)
Solving Max-Cut to Global Optimality via Feasibility-Preserving Graph Neural Networks [21.0] SDPソルバの原理的,軽量なニューラルプロキシとして機能する,Max-Cut固有のグラフニューラルネットワークを提案する。
我々のアーキテクチャは、最先端のSDPソルバであるMosekと比較して、正確なMax-Cut解のバウンディングコストを最大10.6ドル削減できることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:41:40 GMT)
CAMAL: Improving Attention Alignment and Faithfulness with Segmentation Masks [20.9] 視覚モデルにおける注意のアライメントと忠実度を改善するために,クラス活性化マップ注意学習(CAMAL)を提案する。
CAMALはトレーニング中の各画像に対するモデルの注意を抽出し、対応するセグメンテーションマスクから得られる地道判別領域と比較する。
CAMALは補助正則化剤として機能し、地道な差別地域に合わせて注意を喚起し、他の場所での注意を抑える。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:51:52 GMT)
Fine-tuning a vision-language model for fracture-surface morphology recognition [20.9] 13,168画像のキュレートデータセットを用いて, き裂面画像解析のためのオープンソースのビジョン言語モデル(VLM)を微調整した。
結果として得られたスペシャリストモデルは、手動で注釈付けされた100のベンチマークで、フラグシップのプロプライエタリなマルチモーダルモデルを上回っている。
本稿では, 破壊特異的な視覚的精度とより広いマルチモーダル推論を組み合わせ, 自律フラクトログラフィーのためのファインチューニングモデルとプロプライエタリモデルの統合利用について論じる。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:26:36 GMT)
PISTO: Proximal Inference for Stochastic Trajectory Optimization [20.5] STOMPはボルツマン軌道分布からのKLの発散を暗黙的に最小化することを示す。
更新を安定化するtextitProximal Inference for Trajectory Optimization (PISTO) アルゴリズムを提案する。
PISTOはロボットアームの動作計画ベンチマークで89%の成功率を達成した。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:04:30 GMT)
Breaking Spatial Uniformity: Prior-Guided Mamba with Radial Serialization for Lens Flare Removal [20.4] レンズフレア除去のための先導MambaフレームワークであるDeflareMambav2を提案する。
フレア優先ネットワーク (FPN) を導入し, フレア先行を推定し, 適応復元を誘導する。
DeflareMambav2はパラメータの負担を減らして最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:23:07 GMT)
One Token Per Frame: Reconsidering Visual Bandwidth in World Models for VLA Policy [20.4] 視覚言語アクション(VLA)モデルは、長い地平線を計画するために補助的な世界モジュールにますます依存している。
OneWM-VLAは、Adaptive Attention Poolingを通じて、各ビューをフレーム毎に単一のセマンティックトークンに圧縮する。
フレームごとの視覚的帯域幅を1つのトークンに減らすことができ、長い水平性能を損なうことなく実現できる。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:04:43 GMT)
UMEDA: Unified Multi-modal Efficient Data Fusion for Privacy-Preserving Graph Federated Learning via Spectral-Gated Attention and Diffusion-Based Operator Alignment [20.4] デバイスフリーのローカライゼーションは、エッジデバイスに分散した異種無線および視覚センサーからモデルを訓練する。
クライアントが連続的な積分演算子を共有するグローバルグラフのノードを形成するグラフフェデレーション学習フレームワークであるUMEDAを提案する。
UMEDAは、最先端のフェデレーションベースラインを精度、収束性、通信効率で上回る。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:15:47 GMT)
BenchHAR: Benchmarking Self-Supervised Learning for Generalizable Sensor-based Activity Recognition [20.3] ウェアラブルセンサーからのヒューマンアクティビティ認識(HAR)は、幅広い医療や行動科学の応用をサポートする。
視覚領域と言語領域における自己教師あり学習(SSL)の最近の進歩は、ラベルなしデータから一般化可能な表現を学習する強力な能力を示している。
センサベースHARにおけるSSL手法の一般化能力を評価するための統合フレームワークであるBenchHARについて述べる。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:54:12 GMT)
SYNCR: A Cross-Video Reasoning Benchmark with Synthetic Grounding [20.3] MLLM(Multimodal Large Language Models)は、シングルビデオ理解において急速に進歩しているが、複数の独立したビデオストリームをまたいで推論する能力はいまだによく分かっていない。
そこで,SynCRは,地上検定によるクロスビデオ推論のための制御された総合的ベンチマークである。
オープンおよびクローズドウェイトMLLMのゼロショット評価は、現在のモデルと人間の間に大きなギャップがあることを明らかにする。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:20:23 GMT)
Gradient Starvation in Binary-Reward GRPO: Why Group-Mean Centering Fails and Why the Simplest Fix Works [19.9] Group Relative Policy Optimization (GRPO) は、検証可能な報酬からの強化学習のための標準アルゴリズムである。
我々は、真の退化率は、常にジェンセンの不等式によるベルヌーイ予想を超えることを証明している。
固定参照符号の利点である$A=2r-1$は、グループ内の少なくとも1つのサンプルが成功する確率を高めて、pass@$G$失敗降下を実行することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:58:06 GMT)
HMACE: Heterogeneous Multi-Agent Collaborative Evolution for Combinatorial Optimization [19.9] HMACEは異種多言語協調進化フレームワークである。
それぞれの進化生成を4つの調整されたエージェントで自律的で役割特異的なループに分解する。
冗長な評価を避けながら、多様で有望な行動への探索を導く。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:02:28 GMT)
Task-Oriented Communication for Human Action Understanding via Edge-Cloud Co-Inference [19.9] スマートセンシングは、ネットワークエッジにおける人間の行動の正確な理解に対する需要が高まっている。
従来のアプローチでは、リソース制約のあるエッジデバイスから強力なクラウドサーバへ、大量のビデオデータを送信する必要がある。
エッジクラウドコラボレーションによるヒューマンアクション理解(TOAU)のためのタスク指向コミュニケーションフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:08:28 GMT)
Is Class Signal Clustered or Routed in Task-Induced Implicit Neural Representation Weight Spaces? [19.9] 入射神経表現(INR)は、画像をニューラルネットワークの重みとしてエンコードし、画像分類を重み空間の分類可能性の問題にする。
我々は、分類器のフィードバックが共有アンカー座標のクラスごとに画像固有の重みをクラスタ化するべきであるという自然な幾何学的仮説を検証した。
重み空間幾何と教師付きクラスタリング圧力は、トレーニング済みリーダの精度を確実に追跡しない。
重み付きトークンのネイティブSIRENバイアス列を、トレーニングされた読者のための低次元のサンプル依存因果読み出し経路として同定する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:32:38 GMT)
Almost Sure Convergence Rates of Stochastic Approximation and Reinforcement Learning via a Poisson-Moreau Drift [19.8] 我々はマルコフ雑音下で近似と強化学習の収束率をほぼ確実に確立する。
我々の分析の鍵となるのは、ポアソン方程式に基づくマルコフ雑音の補正を確立されたモロー・エンベロープ平滑化に適用した新しいリアプノフドリフト構造である。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:32:03 GMT)
Revisiting Transformer Layer Parameterization Through Causal Energy Minimization [19.7] 本稿では,トランスフォーマー層を条件付きエネルギー関数の最適化ステップとして再キャストするフレームワークであるCausal Energy Minimization (CEM)を紹介する。
我々は、CEMがトランスフォーマーアーキテクチャをエネルギーベースモデルに接続し、エネルギー誘導層設計のさらなる探求を動機付けていることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:02:11 GMT)
How Value Induction Reshapes LLM Behaviour [19.7] 対話型大言語モデルにおける価値誘導の意図しない影響について検討する。
私たちは、値の誘導が他の関連する、時には対照的な値の表現につながることに気付きました。
すべての値が人為的言語の使用を増加させ、モデルがより有効でサイコファンティックになる。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:58:42 GMT)
GRAPHLCP: Structure-Aware Localized Conformal Prediction on Graphs [19.7] コンフォーマル予測(CP)は、有限サンプル保証の不確実性に対する分布のないアプローチを提供する。
グラフニューラルネットワーク(GNN)へのCPの適用は、グラフの性質が不十分な特定の予測につながることが多いため、依然として困難である。
グラフトポロジとノード間依存関係を局所化と重み付けに明示的に組み込んだ近接型局所化CPフレームワークである GraphLCP を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:56:09 GMT)
Slowly Annealed Langevin Dynamics: Theory and Applications to Training-Free Guided Generation [19.6] Slowly Annealed Langevin Dynamics (SALD) について検討した。
我々は,KL差分不等式による非漸近収束保証を確立することにより,中間目標の収縮による追尾速度の低下が向上することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:17:34 GMT)
Have Graph -- Will Lift? The Case for Higher-Order Benchmarks [19.6] メッセージパッシングはグラフ上でも高次複素数上でも、幾何学的深層学習の主要な要因の1つである。
モデルの検証可能な多様性は、適切なベンチマークデータセットの不足とは対照的である。
私はコミュニティに新たなデータセットのソースを奨励したいと思っています。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:53:42 GMT)
Evaluation of an Actuated Spine in Agile Quadruped Locomotion [19.6] 脊椎は四肢動物の動的移動において重要な役割を担っている。
本論文は,アジャイル四足歩行学習におけるアクティベートスピンの利点を実証的に検討する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:45:28 GMT)
A Semantic-Sampling Framework for Evaluating Calibration in Open-Ended Question Answering [19.6] 予測されたモデルの信頼度がその経験的精度と一致しているかを測り、大規模言語モデル(LLM)の信頼性デプロイメントの中心となる。
オープンエンド質問応答(QA)のための校正評価フレームワークSem-ECEを紹介する。
フレームワーク内の2つの推定器について検討する。同じサンプルの自己整合性スコアであるSem$-ECEと、自信評価から回答の選択を分離する保留変数であるSem$-ECEである。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:53:49 GMT)
Bridging the Programming Language Gap: Constructing a Multilingual Shared Semantic Space through AST Unification and Graph Matching [19.4] 本稿では,多言語共有意味空間を構築するための新しい手法を提案する。
まず、異なるプログラミング言語で書かれたコードスニペットの抽象構文木(AST)ノードラベルを統一されたラベルセットにマッピングする。
次に、グラフマッチングネットワーク(GMN)を用いて、ペアのASTグラフを「意味ベクトル」に符号化する。
言語間のコード検索では,平均相反ランク(MRR)が0.4909から0.5547に上昇する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:26:09 GMT)
Adaptive Subspace Projection for Generative Personalization [19.3] 学習されたパーソナライズされた概念は、残りのテキストプロンプトを圧倒し、モデルが重要なコンテキストの詳細を無視する原因となる。
本稿では,アダプティブ・サブスペース・プロジェクション(Adaptive Subspace Projection,AdaptSP)を用いたテスト時埋め込み調整について紹介する。
実験の結果,この手法は迅速な忠実度と文脈整合性を著しく向上させることがわかった。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:24:52 GMT)
NoiseGate: Learning Per-Latent Timestep Schedules as Information Gating in World Action Models [19.3] World Action Models (WAM) は、ロボットアクション生成と将来の観測モデリングを結びつけるポリシーである。
NoiseGateは軽量なゲーティングポリシーネットワークで、遅延時間当たりのインクリメントをデノイング中に出力する。
NoiseGateは多様なRoboTwinランダムシーン操作タスクに対して一貫したゲインを提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:31:52 GMT)
Sword: Style-Robust World Models as Simulators via Dynamic Latent Bootstrapping for VLA Policy Post-Training [19.0] あるアプローチは、学習した世界モデルを生成シミュレータとして扱い、「想像」内での政策最適化を可能にする
しかしながら、LIBEROベンチマークのような特定の環境のシミュレータとしてデプロイされる場合、既存のWorld Modelは一般化が貧弱で長い水平誤差の蓄積に悩まされることが多い。
我々はこれらの問題を緩和するために、堅牢なワールドモデルフレームワークであるSwordを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:54:33 GMT)
Membership Inference Attacks on Vision-Language-Action Models [19.0] 本稿では,視覚言語行動モデル(VLA)に対するメンバーシップ推論攻撃に関する最初の体系的研究について述べる。
我々の攻撃は、トークンの確率のような古典的なMIA信号と、観測可能な動作誤差や時間的動きパターンのようなVLA固有の信号の両方を利用する。
我々の研究結果によると、ロボットと具体化されたAIのプライバシーリスクがこれまで過小評価され、VLAモデルの専用のプライバシー評価と防衛の必要性が浮き彫りになっている。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:16:00 GMT)
Seeing Across Skies and Streets: Feedforward 3D Reconstruction from Satellite, Drone, and Ground Images [18.9] この地上画像は、衛星タイルの上にどこにあるのか?
衛星タイルをUAV画像、地上画像、またはその両方とともに摂取するフレキシブルフィードフォワードモデルである*Cross3R*を提案する。
クロスビューの3Dポイントクラウドを復元し、すべての入力カメラの6-DoFポーズと、各視点カメラの位置とヤウのオンタイルの$(x,y)$位置を復元する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:35:57 GMT)
Teaching Language Models to Think in Code [18.9] 我々は、コード自体がNLによって起動されるツールとしてではなく、推論として機能するフレームワークであるThinking in Code(Thinking in Code)を提案する。
教師モデルから12.2kのコード中心軌跡を抽出し、教師による微調整と強化学習によりThinC-1.7BとThinC-4Bを訓練する。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:42:05 GMT)
Bayesian Sensitivity of Causal Inference Estimators under Evidence-Based Priors [18.8] 因果推論は、真のデータ生成プロセスに関する証明不可能な仮定に依存する。
我々は、新しい感度分析基準でs値フレームワークを拡張し、ベイズ感度値(Bayesian Sensitivity Value)を作成した。
本研究は,糖尿病治療が体重減少に及ぼす影響に関する観察的研究における適用性について述べる。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:50:05 GMT)
Do Agents Need to Plan Step-by-Step? Rethinking Planning Horizon in Data-Centric Tool Calling [18.8] LLMベースのエージェントは複雑なデータ中心のタスクを解決する。
既存の戦略は,(1)実行前に完全な計画を生成するフルホライズン(FH)と,(2)段階的推論と観察を伴う各アクション(ツールコール)をインターリーブするシングルステップ水平化(SH)の2つのパラダイムに分類される。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:51:42 GMT)
Offline Policy Optimization with Posterior Sampling [18.7] モデルベースオフライン強化学習(RL)における基本的な課題は、一般化と堅牢性の間のトレードオフにある。
ベイズ推論プロセスとして動的モデリングを定式化するPSPO(Posterior Sampling-based Policy Optimization)を提案する。
PSPOを検証した標準ベンチマークの実験は、最先端のベースラインよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:48:21 GMT)
StreamPhy: Streaming Inference of High-Dimensional Physical Dynamics via State Space Models [18.5] StreamPhyは、不規則な測定からフルフィールド物理力学の効率的なストリーミング推論を可能にするエンドツーエンドフレームワークである。
StreamPhyの精度は48%向上し,拡散法よりも最大20~100倍高速である。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:40:59 GMT)
CUDABeaver: Benchmarking LLM-Based Automated CUDA Debugging [18.5] 私たちは、実際の失敗するワークスペースで生成されたプログラムを評価するベンチマークであるBEAVERを紹介します。
各タスクは、壊れた候補、ネイティブビルド/テストコマンド、生エラーエビデンス、単一のファイルを提供する。
プロトコルを意識した評価は、パフォーマンスロストレランスをより忠実に評価できることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:24:32 GMT)
Sparse Autoencoders as Plug-and-Play Firewalls for Adversarial Attack Detection in VLMs [17.3] スパースオートエンコーダ(SAE)に基づく,新規で軽量な対向攻撃検出フレームワークを提案する。
SAEgisは、ドメイン内、クロスドメイン、クロスアタック設定間で強力なパフォーマンスを達成する。
本手法では, 対人訓練を必要とせず, 最小限のオーバーヘッドを導入し, 実世界のVLMシステムの安全性向上のための実践的アプローチを提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:53:17 GMT)
Auto-Rubric as Reward: From Implicit Preferences to Explicit Multimodal Generative Criteria [17.3] Auto-Rubric as Reward (ARR)は、暗黙の重み付け最適化から明示的な基準ベースの分解まで、報酬モデリングを再構成するフレームワークである。
ARRはVLMの選好知識をプロンプト固有の勾配として外部化し、全体論的意図を独立に検証可能な品質次元に変換する。
ARR-RPOは、テキスト・ツー・イメージ生成と画像編集のベンチマークにおいて、ペアワイズ報酬モデルとVLM判事より優れている。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:05:27 GMT)
Human-LLM Dialogue Improves Diagnostic Accuracy in Emergency Care [17.1] MedSynは、医師が全ての臨床記録を提供するLCMに問い合わせると同時に、最初は主訴のみを見ることができる。
ブラインド評価では、住民のハードケースの正しさは0.589から0.734に上昇した。
住民は最大のF1ゲイン(=0.138; p 0.0001)を示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:40:10 GMT)
Beyond Pairs: Your Language Model is Secretly Optimizing a Preference Graph [17.0] ロールアウトランキングによって誘導される有向非巡回選好グラフを演算するDPOの原理的一般化を提案する。
GraphDPOはエッジとして支配関係を符号化し、グラフ構造化されたPlackett--Luce-インスパイアされた目的を最適化する。
推論とプログラムタスクの実験は優れた性能を示し、グラフ構造化された嗜好モデリングは、ペアワイドおよびリストワイドのアライメント目的に対するスケーラブルで堅牢な代替手段であることを示している。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:26:14 GMT)
Exposing and Mitigating Temporal Attack in Deepfake Video Detection [17.0] ディープフェイク検出器は高いAUCを実現し、我々の実験は回避攻撃に対する感受性を明らかにします。
この脆弱性を軽減するために、時相スペクトル不変防衛フレームワークSpInShieldを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:53:57 GMT)
Multi-Dimensional Evaluation of LLMs for Grammatical Error Correction [16.9] 最新のLarge Language Models (LLMs) について, 編集精度, 潜時保存率, 保持率について検討した。
細調整のGPT-4oは,3次元すべてにわたる最先端性能を実現する。
GPT-4o 補正の73.76%がゴールド標準と同等かそれ以上の精度である。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:01:42 GMT)
Exploring and Exploiting Stability in Latent Flow Matching [16.8] 本研究では,Latent Flow-Matching(LFM)モデルがデータ削減やモデル容量縮小など,さまざまな種類の摂動に対して堅牢であることを示す。
この安定性を利用して、より効率的なトレーニングと推論のための実用的なアルゴリズムを導出します。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:04:33 GMT)
Rethinking RL for LLM Reasoning: It's Sparse Policy Selection, Not Capability Learning [16.7] 強化学習は新たな戦略を学ばず、ベースモデルがすでに持っている解に対して確率質量を再分配する。
この知見をReasonMaxxerに変換する。これは最小のRLフリーな手法で、エントロピー付き決定点にのみコントラスト損失を適用する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:48:19 GMT)
What Cohort INRs Encode and Where to Freeze Them [16.7] 我々は、コホート学習INRにおけるどの層移動が、その層が符号化したものを特徴付けないかを同定する。
我々は、INR活性化の最初のSAE分解をスパース辞書原子に提示する。
これらの結果は、コホートで訓練されたINRの転移を初めて機械論的に説明し、それらの活性化を検査可能な辞書原子に変換する。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:09:30 GMT)
The Attacker in the Mirror: Breaking Self-Consistency in Safety via Anchored Bipolicy Self-Play [16.7] セルフプレイレッドチームは、AIの安全性を改善するための確立したアプローチである。
凍結ベースモデル上でロール固有のLoRAアダプタを訓練するAnchored Bipolicy Self-Playを提案する。
パラメータ効率は, 自動調整モデルと比較して, ファインチューニングよりも100倍向上し, 安全性も一貫した改善が得られた。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:41:59 GMT)
Active Embodiment Identification with Reinforcement Learning for Legged Robots [16.6] 本稿では,情報探索行動と明示的具体化予測を共同で学習する脚付きロボットの能動的具体化識別手法を提案する。
歴史的に拡張されたURMAアーキテクチャを用いて、異なる形態のシミュレーションにおいて環境との相互作用を通じて、共同レベルおよびグローバルなエンボディメントパラメータを推定する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:07:58 GMT)
RelAgent: LLM Agents as Data Scientists for Relational Learning [16.5] RelAgentはリレーショナルデータベースに基づく学習のための自律科学者である。
検索フェーズと推論フェーズの2つのフェーズで動作します。
機能は可読性があり、予測は結果のクエリ定義機能マップに依存する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:06:12 GMT)
Practical Wi-Fi-based Motion Recognition Under Variable Traffic Patterns [16.4] 本稿では, 可変トラフィックパターン下での動作認識のための新しいWi-Fiセンシング手法を提案する。
可変入力サイズのセンシング信号を効率的に処理するために,サンプリングレート多元性ニューラルネットワーク(SRV-NN)を提案する。
動的サンプリングレートの増大は、可変サンプリングレートと間隔に使用される。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:23:15 GMT)
EnvSimBench: A Benchmark for Evaluating and Improving LLM-Based Environment Simulation [16.4] 有望な方向性は、手作業で作り上げた環境を LLM でシミュレートした環境に置き換えることである。
LLMは環境フィードバックを正確にシミュレートすることができます。
実際には、LLMシミュレーション環境は幻覚、論理的不整合、サイレントステートドリフト障害に悩まされている。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:08:16 GMT)
Structured Coupling for Flow Matching [16.4] 本稿では,構造化潜在表現学習に適合するフローを増大させる協調的なフレームワークを提案する。
SCFMは、構造付き遅延変数とノイズをソースに導入することにより、構造化された事前と連続的な輸送マップを共同で学習する。
潜在変数モデル変分推論と中間時間流速推定の両方に共有時間依存認識ネットワークを使用する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:47:37 GMT)
Toward Individual Fairness Without Centralized Data: Selective Counterfactual Consistency for Vertical Federated Learning [16.3] 垂直連合学習(VFL)における個別レベルで選択的対実整合(SCC-VFL)を強制するサーバ中心のフレームワークを提案する。
SCC-VFLは、強いベースラインに対して決定フリップ率を最大98%減らすとともに、予測精度を維持または改善する。
また、属性推論攻撃の成功を低減し、ロバスト性を改善し、現実的なVFLデプロイメントで好適なユーティリティフェアネスとプライバシのトレードオフを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:50:06 GMT)
Learning Visual Feature-Based World Models via Residual Latent Action [16.3] Residual Latent Action* (RLA) は、DINO残基から容易に学べる。
RLA World Model*(RLA-WM)は、シミュレーションと実世界のデータセットにおいて、最先端の機能ベースとビデオ拡散の世界モデルの両方を上回っている。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:58:16 GMT)
SWE Atlas: Benchmarking Coding Agents Beyond Issue Resolution [16.3] SWE Atlasは、Codebase Q&A(124タスク)、テストライティング(90タスク)、リファクタリング(70タスク)という、3つのプロフェッショナルソフトウェアエンジニアリングにまたがるコーディングエージェントのためのベンチマークスイートである。
あまり表現されていないが事実上重要なカテゴリをターゲットとし、包括的なカテゴリ固有の評価プロトコルを使用し、未指定のルーリックを採用する。
全体として、SWE Atlasは、コーディングエージェントの正確性とエンジニアリング品質の両方を測定するための補完的な評価スイートを提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:21:44 GMT)
PIMSM: Physics-Informed Multi-Scale Mamba for Stable Neural Representations under Distribution Shift [16.2] 科学的時間構造維持の失敗は分布シフトの不安定性に寄与すると主張する。
周波数状態間のスペクトル推定遷移点をマッピングする状態空間アーキテクチャである物理インフォームド・マルチスケールマンバを提案する。
Human Connectome Project fMRIでは、PIMSMは重度の時間的コンテキストトランケーション下での堅牢性と表現安定性を改善している。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:58:05 GMT)
The Limits of AI-Driven Allocation: Optimal Screening under Aleatoric Uncertainty [16.2] スクリーニングとアルゴリズム的ターゲティングを2段階のアロケーションフレームワークで最適に組み合わせる方法を示す。
最適戦略は、アルゴリズム割り当ての限界において、最もリスクの高いユニットを直接ターゲットとしながら、ユニットをスクリーニングする。
コロンビアにおける所得に基づく社会保護プログラムと人道的マイニングの応用について,我々の枠組みを解説する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:38:58 GMT)
Modulated learning for private and distributed regression with just a single sample per client device [16.2] この研究は、多数のデバイスから学習する際の問題に焦点を当て、各デバイスはデータのサンプルを1つだけ保持する。
フィットネストラッカー、データ/アプリ利用アグリゲータ、ボディウーンのセンサーデバイスからの学習など、クライアント1台あたりのサンプルには、いくつかの現実世界のアプリケーションが存在している。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:36:17 GMT)
LLM Advertisement based on Neuron Auctions [16.2] 生成広告は 重要な収益化戦略として現れます
プロンプトインジェクションや固い位置スロットといった既存の手法はセマンティックコヒーレンスを妨害する。
本稿では, オークション対象を表面テキスト空間からLLMの内部表現にシフトさせる新しいパラダイムであるニューロトンオークションを紹介する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:54:39 GMT)
Tools as Continuous Flow for Evolving Agentic Reasoning [16.1] エージェント推論(FlowAgent)を進化させる継続的フローとしてのツールを提案する。
FlowAgentは、ツールチェーンをセマンティック空間内で連続的なトラジェクトリ生成として再認識する。
実験的な評価から,FlowAgentは長距離推論タスクにおいて,優れた堅牢性と適応性を実現することが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:44:11 GMT)
Beyond Single Ground Truth: Reference Monism as Epistemic Injustice in ASR Evaluation [16.1] 音声認識評価は、システム出力と接地真理文字との比較を行う。
地上の真実の書き起こしは、慣例に従って人間の注釈者によって作成される。
異なる規則は同一の音声の異なる書き起こしを生成し、同じASR出力を異なる方法で判断する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:08:48 GMT)
OrchJail: Jailbreaking Tool-Calling Text-to-Image Agents by Orchestration-Guided Fuzzing [16.0] OrchJailは、ツール呼び出しT2Iエージェントをジェイルブレイクするためのオーケストレーション誘導ファジリングフレームワークである。
当社の作業では、ツールオーケストレーションをクリティカルで、これまで探索されていなかったアタックサーフェスとして強調しています。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:06:23 GMT)
3DSS: 3D Surface Splatting for Inverse Rendering [16.0] 3D Surface Splatting (3DSS)は、多視点画像から物理ベースの逆レンダリングを行うための最初の微分可能な表面スプラッティングである。
我々の中心的な洞察は、表面スプラッティングの中心における表面分離問題は、再構成カーネル自体の直接的な定式化を許すということである。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:40:49 GMT)
A Refined Generalization Analysis for Extreme Multi-class Supervised Contrastive Representation Learning [15.9] クラス上の分布に関係なく、クラス数$R$と同じ順序のサンプル複雑性で境界を証明します。
また、リスクテクティタクロスクラスの濃度をキャプチャする異なる推定器を定式化する。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:12:43 GMT)
Graph Representation Learning Augmented Model Manipulation on Federated Fine-Tuning of LLMs [15.9] Federated Fine-tuning (FFT)は、大規模言語モデル(LLM)を協調的に適応するためのプライバシー保護パラダイムとして登場した。
本稿では,FFT ベースの LLM に対する AugMP (Augmented Model ManiPulation) 戦略を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:24:54 GMT)
Every Feedforward Neural Network Definable in an o-Minimal Structure Has Finite Sample Complexity [15.8] フィードフォワードニューラルネットワークの幅広いクラスは、PACモデルで学習する(有限サンプルの複雑さを持つ)ことを示す。
その結果, 有限サンプルPAC学習能力は, 微分器ではなく, ベースラインとして再構成された。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:26:25 GMT)
VIMCAN: Visual-Inertial 3D Human Pose Estimation with Hybrid Mamba-Cross-Attention Network [15.7] VIMCANは、Mambaの効率的なシーケンスモデリングと、Cross-Attentionの空間的推論を組み合わせたハイブリッドアーキテクチャである。
VIMCANは、TotalCaptureでは17.2mm、3DPWでは45.3mmの平均結合位置誤差(MPJPE)よりも精度が高い。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:28:05 GMT)
Head Similarity: Modeling Structured Whole-Head Appearance Beyond Face Recognition [15.7] 頭部類似性モデルにアイデンティティ中心の認識を拡張した新しい定式化である頭部類似性を導入する。
本手法は, アイデンティティ内外見の変動を明示的に捉え, 同一性および外見状態の階層的類似性を強制する。
最初のステップとして、階層的な監督とアイデンティティに配慮した蒸留を通じて、識別識別と外見に敏感な類似性を共同でモデル化する、シンプルで効果的なフレームワークを開発する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:07:10 GMT)
Private Vertical Federated Inference for Time-Series [15.6] 本稿では,大規模でセキュアな推論のための"Public/Private Hybrid Head-VFL"(PPHH-VFL)を提案する。
このハイブリッドアーキテクチャは、モデルヘッドを効率的なパブリックヘッドとセキュアで軽量なMPCプライベートヘッドに分割する。
標準のVFL+MPCベースラインと比較して,WANでは44.4倍,通信コストは91.2倍に向上した。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:00:13 GMT)
Penalty-Based First-Order Methods for Bilevel Optimization with Minimax and Constrained Lower-Level Problems [15.6] ペナルティに基づく二レベル最小値最適化法を,低レベルの問題に対して強い凸性を必要とすることなく開発する。
決定論的設定では、提案法は、$tildeO(-4)$ complexityの$-KKT点を求める。
我々は、勾配オラクルしか利用できない設定へのアプローチを拡張し、提案手法が$tildeO(-9)$の複雑さを持つ約$-KKTの点を証明した。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:59:29 GMT)
Robust Tensor Regression with Nonconvexity: Algorithmic and Statistical Theory [15.5] 本稿では,ロバストデータ解析のための低ランクランダム回帰法を提案する。
提案手法は, 一般化フレームワーク内の非次元テンソルチューブを用いた。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:54:14 GMT)
Beyond LoRA vs. Full Fine-Tuning: Gradient-Guided Optimizer Routing for LLM Adaptation [15.5] フルファインチューニング(FFT)は、高エントロピー知識注入に必要な表現塑性を提供する。
Low-Rank Adaptation (LoRA)は、多くのタスクはローランク空間の更新とLoRAの追加正規化の恩恵しか必要としないため、FFTのパフォーマンスに適合または超越することができる。
両トレーニング体制間の連続的なナビゲーションを可能にする統合フレームワークであるLoRAとFull (MoLF) Fine-Tuningを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:38:58 GMT)
BioProVLA-Agent: An Affordable, Protocol-Driven, Vision-Enhanced VLA-Enabled Embodied Multi-Agent System with Closed-Loop-Capable Reasoning for Biological Laboratory Manipulation [15.5] BioProVLA-Agent(バイオプロVLA-Agent)は、生物学的操作のためのプロトコル駆動型、ビジョン駆動型多エージェントシステムである。
クローズドループワークフローでは、プロトコル解析、視覚的状態検証、具体的実行を統合している。
本研究では,15の原子タスク,6つの複合タスク,3つのバイマニュアルタスクを網羅した階層的ベンチマークによるシステム評価を行った。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:15:40 GMT)
DCGL: Dual-Channel Graph Learning with Large Language Models for Knowledge-Aware Recommendation [15.5] 本稿では,3つの重要なイノベーションを特徴とするDual-Channel Graph Learning(DCGL)フレームワークを提案する。
DCGLは一貫して最先端のメソッドより優れており、スパースシナリオを大幅に改善している。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:23:07 GMT)
Decoupling Semantics and Fingerprints: A Universal Representation for AI-Generated Image Detection [15.4] 検出者は単一の絡み合った表現として因子を学習し、普遍的な偽の痕跡は生成元固有の指紋と意味的内容と密に融合していることを示す。
我々はこれらの因子を構造的に分解するオルソゴン分解浄化ネットワーク(ODP-Net)を提案する。
ジェネレータ固有の指紋とセマンティックコンテンツから普遍的な偽トレースを明示的に分離することにより、ODP-Netは目に見えないアーキテクチャ上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:48:47 GMT)
Neurosymbolic Framework for Concept-Driven Logical Reasoning in Skeleton-Based Human Action Recognition [15.3] 動作プリミティブに対する概念駆動論理的推論として行動認識を再構成する骨格型HARの非暴力的定式化を導入する。
我々のフレームワークは、一階述語論理式に基づく表現学習と記号推論を橋渡しする。
本研究は,脳の時間的行動理解に有効なパラダイムとして,ニューロシンボリック推論に注目した。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:20:39 GMT)
MAS-Algorithm: A Workflow for Solving Algorithmic Programming Problems with a Multi-Agent System [15.2] MAS-Algorithmは、競合するプログラマやアルゴリズムエンジニアにインスパイアされたアルゴリズム問題解決のための、体系的なマルチエージェントワークフローである。
我々のフレームワークは、エンドツーエンドの解決プロセスをモジュラーステージに分解し、構造化推論、ツール統合、エージェント間の柔軟な調整を可能にします。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:07:17 GMT)
OracleTSC: Oracle-Informed Reward Hurdle and Uncertainty Regularization for Traffic Signal Control [15.1] 強化学習に基づく交通信号制御(TSC)システムは、解釈可能性に制限のあるブラックボックスとして機能する。
OracleTSC は LLM ベースの TSC を2つのメカニズムで安定化させる。
LibSignalベンチマークの実験によると、OracleTSCはLLaMA3-8Bモデルをコンパクトにすることで、トラフィック効率を大幅に改善できる。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:55:41 GMT)
The Power of Second Order Methods for Sequence Preconditioning [15.0] 本稿では,Vovk-Azoury-Warmuth (VAW) アルゴリズムが,Universal Sequence Preconditioning (USP) 方式と自然に一致することを示す。
VAWとUSPを組み合わせることで、非対称な非対称な遷移行列が存在する場合でも、ポリ対数的後悔$O left( log3 Tright)$を達成できることを示す。
我々は、チェビシェフに新しい複素解析的境界を提供することにより、有界スペクトルシステムを超えてUSPの適用性を拡張する。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:56:18 GMT)
Adaptive Regularization for Sparsity Control in Bregman-Based Optimizers [15.0] 本稿では,モデルの現在の空間とターゲット空間との差に基づいて$$を更新する適応正規化手法を提案する。
提案手法は,75%から99%の範囲の空間的目標を確実に達成する。
初期のトレーニングでは、オラクルで調整された非適応ベースラインよりも早く収束し、同じエラー率で最終的なパフォーマンスを達成または上回っている。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:37:24 GMT)
Characterizing and Mitigating False-Positive Bug Reports in the Linux Kernel [15.0] 本研究は,Linuxカーネルにおける偽陽性バグレポートの総合的研究である。
我々はBugzillaとSyzkallerから収集された1,509の真正のバグと497の偽陽性を含む2,006のバグレポートのデータセットを手作業で構築する。
検索強化世代(RAG)は、様々なプロンプト戦略の中で、91%のリコールと88%のF1スコアを達成した。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:48:36 GMT)
TCDA: Thread-Constrained Discourse-Aware Modeling for Conversational Sentiment Quadruple Analysis [14.8] スレッド制約指向非巡回グラフ(TC-DAG)とD-RoPE(Discourse-Aware Rotary Position Embedding)を組み合わせた新しいフレームワークを提案する。
2つのベンチマークデータセットの実験結果は、我々のフレームワークが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:16:43 GMT)
Sub-Gaussian Concentration and Entropic Normality of the Maximum Likelihood Estimator [14.7] 標準的な正則性条件の下では、最大極大推定器が中心極限定理を満たすことはよく知られている。
本稿では、正規化されたMLEに対して、いくつかのより強い正規性の形式を開発する。
指数的一貫性境界、高モーメント推定、推定器のエントロピー制御引数を含む、独立した興味を持つ補助的ツール。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:34:03 GMT)
Your Language Model is Its Own Critic: Reinforcement Learning with Value Estimation from Actor's Internal States [14.7] 内部状態価値推定による政策最適化を導入する。
ポリシーフォワードパス中に既に計算されているポリシーモデルの内部信号を用いて、無視可能なコストでベースラインを得る。
軽量プローブは、プロンプトおよび生成された軌道の隠れ状態から期待される検証可能な報酬を予測する。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:49:36 GMT)
Channel-Level Relation to Attentive Aggregation with Neighborhood-Homogeneity Constraint for Point Cloud Analysis [14.6] 3Dポイントのクラウド理解では、複雑な地区内の差別的特徴を正確に捉えることが課題である。
既存の手法では特徴相関の識別を探索するが、点レベルの空間分布やチャネル応答に制限される。
本稿では,チャネルレベルのメートル法に基づく拡張機構を備えた新しいネットワークであるPointCRAを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:29:26 GMT)
Metric Unreliability in Multimodal Machine Unlearning: A Systematic Analysis and Principled Unified Score [14.6] 一般データ保護規制法に準拠するためには、ビジョンランゲージモデル(VLM)のアンラーニングが必要である。
マルチモーダル・アンラーニングにおける信頼性の最初の研究について述べる。
統一品質スコア(Unified Quality Score, UQS)は, 各計量のスピアマン相関と距離の関係から得られる重みを持つ計量である。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:12:49 GMT)
Relay Buffer Independent Communication over Pooled HBM for Efficient MoE Inference on Ascend [14.5] Mixture-of-Experts (MoE)推論はデバイス間で大規模なトークン交換を必要とする。
本稿では,Ascendシステム上でのMoE推論高速化のためのリレーバッファフリー通信設計を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:46:43 GMT)
Stochastic Transition-Map Distillation for Fast Probabilistic Inference [14.4] 拡散モデルは、強力な世代品質、多様性、分布範囲を達成するが、その性能には高価な推論が伴うことが多い。
本研究では,拡散モデル推論を高速化する教師レスフレームワークであるTransition-Map Distillation (STMD)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:31:44 GMT)
RRCM: Ranking-Driven Retrieval over Collaborative and Meta Memories for LLM Recommendation [14.3] 大規模言語モデル(LLM)は、次世代のレコメンデーションシステムにとって有望なパラダイムとして登場した。
LLMに基づくエージェントレコメンデーションのためのランキング駆動型検索・推論フレームワークRRCMを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:07:30 GMT)
Quantile-Coupled Flow Matching for Distributional Reinforcement Learning [14.2] 条件付きフローマッチング (CFM) は連続したマルチモーダルリターン分布のモデル化に注目されている。
FlowIQNは、各ミニバッチ内のソースとベルマンターゲットサンプルをソートして、モノトン最適輸送結合を近似する。
本稿では,フローIQNがワッサーシュタイン配向射影保証を明示した最初のフローマッチング分布批判であることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:49:37 GMT)
Less Random, More Private: What is the Optimal Subsampling Scheme for DP-SGD? [14.2] Balanced It Subsampling (BIS)はPoisson Subsamplingよりも強力なプライバシー増幅を実現し,ノイズスペクトルの両極端において最適であることを示す。
本稿では,BISのモンテカルロ会計を実践的に導入し,既存のPLD分析のスラックを除去する手法を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:47:11 GMT)
Cloud-top infrared observations reveal the four-dimensional precipitation structure [14.1] 雲頂赤外観測では,降水の4次元構造を復元するのに十分な情報をエンコードしている。
本研究では,水蒸気を回収するために,水分優先の制約が潜水表現を必要とする物理拘束型深層学習フレームワークである4DPrecipNetを導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:37:12 GMT)
Classification Fields: Arbitrarily Fine Recursive Hierarchical Clustering From Few Examples [14.1] 局所親子則によって生成される$mathbbRd$上の無限深層階層的クラスタ構造。
我々は、生成元を近似し、見えない深さにロールアウトできる分類場予測器を学習する。
完備セルメータにおける指数的トルーニケーション収束と,幅$O(varepsilon-)$および深さ$widetilde O(varepsilon-3/2)$によるReLU実現可能性を証明する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:50:49 GMT)
Eigenism: Ethics for a Human-AI Future [14.0] 本稿では、アイデンティティを段階的、分散した情報パターンとして扱う倫理的枠組みである「テキスト固有性」を紹介する。
私たちはまず、この方程式を公式化し、コピー、フォーク、更新間でAIがその存在をどう評価すべきかを正確にマップします。
そして、我々はこの倫理理論が人間にも応用できることを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:11:28 GMT)
LoopQ: Quantization for Recursive Transformers [14.0] 本稿では,LoopLMにおける量子化に関する最初の体系的研究について述べる。
ループ対応のPTQフレームワークであるLoopQを提案する。
実験によると、W4A4量子化の下では、LoopQは平均下流の精度を68.8%改善し、最強の静的PTQベースラインと比較して平均パープレキシティを87.7%低減している。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:45:28 GMT)
Amortized-Precision Quantization for Early-Exit Vision Transformers [14.0] 本稿では,Amortized-Precision Quantization (APQ)について紹介する。
提案するMultual Adaptive Quantization with Early Exiting (MAQEE)は,予測安定性を向上させるために,明示的なリスク制御の下で,出口閾値とビット幅を協調的に最適化するバイレベルフレームワークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:27:04 GMT)
On Distinguishing Capability Elicitation from Capability Creation in Post-Training: A Free-Energy Perspective [14.0] ポストトレーニング研究は、能力付与と能力創出を区別すべきである、と我々は主張する。
我々はこの議論を,ポストトレーニングの自由エネルギー的視点を通じて展開する。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:23:25 GMT)
A Two-Stage Motion-Aware Framework for mmWave-based Human Mesh Recovery [14.0] 本稿では,レーダーによる人体再構築のための2段階の枠組みを提案する。
まず、粗大な局所化を行う人間の反射抽出モジュールを提案する。
第二に、人体を再構築する動き認識メッシュ回復ネットワークを設計する。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:34:03 GMT)
BrickCraft: Visuomotor Skill Composition with Situated Manual Guidance for Long-Horizon Interlocking Brick Assembly [14.0] ブリッククラフト(BrickCraft)は、長い水平および一般化可能なブロック組立用に設計された合成フレームワークである。
ハイレベルなアセンブリ計画と、位置するマニュアルによる物理的な実行のギャップを埋める。
ブリッククラフトは、目に見えない構造に強い構成的一般化を示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:30:25 GMT)
TraceAV-Bench: Benchmarking Multi-Hop Trajectory Reasoning over Long Audio-Visual Videos [14.0] 実世界の音声・視覚的理解には、疎く、時間的に分散し、視覚と聴覚の流れにまたがる証拠の連鎖が必要である。
TraceAV-Benchは、長時間の視覚的軌跡とマルチモーダル幻覚の堅牢性に対して、マルチホップ推論を共同で評価する最初のベンチマークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:06:43 GMT)
RepoZero: Can LLMs Generate a Code Repository from Scratch? [13.9] RepoZeroは、完全に自動化された実行ベースのレポジトリレベルの生成をスクラッチから検証できる最初のベンチマークである。
我々の結果は、RepoZeroをエンドツーエンドのコード生成のための、困難でスケーラブルで信頼性の高いテストベッドとして確立しています。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:56:02 GMT)
Flexible Routing via Uncertainty Decomposition [13.9] 機械学習システムのパフォーマンスとコストのバランスをとるための主要な戦略は、クエリを低コストのモデルか高価なオラクルに動的にルーティングすることだ。
本稿では,不確実なクエリに対する不必要なオラクル呼び出しを回避するための,新しい不確実性対応ルータを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:39:57 GMT)
Curated Synthetic Data Doesn't Have to Collapse: A Theoretical Study of Generative Retraining with Pluralistic Preferences [13.8] 生成モデルの再帰的再訓練は、重要な表現問題を引き起こす。
複数の報酬関数に基づいたキュレーションにより崩壊を緩和できることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:27:23 GMT)
Transformers Can Implement Preconditioned Richardson Iteration for In-Context Gaussian Kernel Regression [13.8] ガウスカーネルを用いたインコンテキストカーネルリッジ回帰(KRR)について検討する。
我々は,標準ソフトマックスアテンション変換器が前方通過時のKRR予測器を近似可能であることを示す。
その誤差プロファイルは、事前条件付きリチャードソン反復と最も一貫して一致していることが分かる。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:50:58 GMT)
Real-IAD MVN: A Multi-View Normal Vector Dataset and Benchmark for High-Fidelity Industrial Anomaly Detection [13.8] 本稿では,大規模産業データセットであるReal-IAD-MVN(Multi-View Normal)を紹介する。
取得システムのアップグレードにより、Real-IAD-MVNは5つの異なる視点から高忠実面正規写像をキャプチャする。
これにより、マイクロディテールレベルでの包括的な幾何学的表現が提供され、以前は見えないサイドウォールと隠蔽された欠陥を明示的に検出することができる。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:34:51 GMT)
AEM: Adaptive Entropy Modulation for Multi-Turn Agentic Reinforcement Learning [13.8] 強化学習(RL)は、大規模言語モデル(LLM)エージェントが環境と相互作用し、マルチターンタスクを解く能力を大幅に改善した。
既存のアプローチは、プロセス報酬モデルや補助的な自己監督信号など、密集した中間監視を導入することが多い。
本稿では、RLトレーニング中にエントロピーダイナミクスを適応的に調整し、探索・探索トレードオフを改善するための監督不要な信用割当手法であるAEMを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:22:47 GMT)
SIMI: Self-information Mining Network for Low-light Image Enhancement [13.7] 暗い照明条件は画質に大きく影響し、画像編集と視覚化に重大な課題を生んでいる。
我々は,低照度画像をビット平面分解に基づいて複数の成分に分解する自己情報マイニング(SIMI)ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:08:16 GMT)
Structure-Preserving Reconstruction of Convex Lipschitz Functionals on Hilbert Spaces from Finite Samples [13.7] 分離可能なヒルベルト空間上の凸函数は任意の一様精度で再構成可能であることを示す。
コンベックスニューラルネットワーク (CNFs) は, 再構成を含む構造化トレーニング可能なアーキテクチャクラスである。
CNFは有限データから凸関数を学習するための基本となる。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:40:30 GMT)
LithoBench: Benchmarking Large Multimodal Models for Remote-Sensing Lithology Interpretation [13.7] リソロジー解釈は、専門家が様々な特徴からロックタイプを推測する必要がある知識集約的なタスクである。
本稿では,リソロジー解釈における地質学的意味理解を評価するためのベンチマークであるLithoBenchを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:07:26 GMT)
AsymTalker: Identity-Consistent Long-Term Talking Head Generation via Asymmetric Distillation [13.6] AsymTalkerは,新しい拡散型音声ヘッド生成法である。
静的アイデンティティイメージを時間的コヒーレントな潜在表現に変換することにより、時間的空間的ミスアライメントを緩和する。
600秒のビデオで高忠実でアイデンティティに一貫性のある合成を保証し、66FPSのリアルタイム推論速度に達する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:11:57 GMT)
KL for a KL: On-Policy Distillation with Control Variate Baseline [13.3] On-Policy Distillation (OPD) は、大規模言語モデルのトレーニング後の主要なパラダイムとして登場した。
本稿では,OPDを政策段階RLとするvOPDを提案する。
VOPDはバニラOPDより一貫して優れており,最も高価な全語彙ベースラインと一致している。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:24:51 GMT)
CrossCult-KIBench: A Benchmark for Cross-Cultural Knowledge Insertion in MLLMs [13.3] 異文化間の知識挿入は、他の文化における本来の振る舞いを保ちながら、特定の文化的文脈にモデルを適応させることに焦点を当てる。
ベンチマークには、英語、中国語、アラビア語文化グループにまたがる49の文化的関連視覚シナリオをカバーする、9800のイメージグラウンドケースが含まれている。
MCKI(Memory-Conditioned Knowledge Insertion)は、冷凍MLLM表現を用いて、外部メモリから関連する文化的知識を検索する。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:43:00 GMT)
Learning Image-Adaptive Scale Fields for Metric Depth Recovery [13.2] 我々は、画像適応型スケール場モデリングとしてメートル法深度復元を定式化する。
深度を直接補正する代わりに、画像適応基底写像の低次元線形結合として補正を再構成する。
この定式化により、測定深度精度の向上、極端アンカー間隔下での強靭性、空間スケール変動の解釈可能な分解が得られる。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:13:02 GMT)
A Unified Open-Set Framework for Scalable PUF-Based Authentication of Heterogeneous IoT Devices [13.2] 本稿では,多様なIoTデバイス群を管理するための,スケーラブルでヘルパーフリーなオープンセットPUF認証フレームワークを提案する。
我々のフレームワークは、最大45個のデバイスで100%クローズドセット精度とほぼゼロに近いオープンセットエラー率を達成する。
Raspberry Piでプロトタイプされた当社のフレームワークでは,認証サイクルが0.67秒以内で,最先端のオープンセットベースラインの約30倍の速度で完了しています。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:46:41 GMT)
Context-Gated Associative Retrieval: From Theory to Transformers [13.1] 本稿では,2段階の連想型メモリアーキテクチャを提案する。
本システムでは, 直接的コンテキストバイアスと2次検索ゲートフィードバックループの両方により, 結果の検索状態が駆動されることを実証する。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:44:30 GMT)
Demystifying and Detecting Agentic Workflow Injection Vulnerabilities in GitHub Actions [13.1] GitHub Actionsは、リポジトリ中心のタスクのためのLLMベースのエージェントのデプロイにますます使用されている。
本稿では,ワークフローレベルのインジェクション欠陥であるエージェントインジェクション(AWI)を紹介する。
我々は、実世界のAI支援行動1,033を特徴付け、AWI固有の仕様を抽出する。
これらの仕様に基づいて、信頼できないイベントコンテキストからエージェントプロンプトインプットへのフローを追跡する、テイント分析ツールであるTaintAWIを設計する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:13:04 GMT)
Differentiable Ray Tracing with Gaussians for Unified Radio Propagation Simulation and View Synthesis [13.1] 視覚的に再構成されたニューラルシーン内で直接、微分可能なRF伝搬シミュレーションを可能にするフレームワークを提案する。
本稿では, 電磁伝搬シミュレーションと光現実視合成の両面において, ニューラル再構成が空間的統一表現として機能することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:19:28 GMT)
CyBiasBench: Benchmarking Bias in LLM Agents for Cyber-Attack Scenarios [13.0] 大規模言語モデル(LLM)は、攻撃的なサイバーセキュリティにおいて、自律的なエージェントとしてますます多くデプロイされている。
本稿では,異なるエージェントが異なる攻撃パターンを示すという興味深い現象を明らかにする。
我々はCyBiasBenchを紹介した。CyBiasBenchは総合的な630セッションのベンチマークで、3つのターゲット上の5つのエージェントと10の攻撃ファミリーを持つ4つのプロンプト条件を評価する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:57:53 GMT)
Tracking Large-scale Shared Bikes with Inertial Motion Learning in GNSS Blocked Environments [13.0] そこで本研究では,自転車の機械的制約とミキシング・オブ・エキスパート・モデルを統合する慣性追跡フレームワークを提案する。
具体的には、複数の専門家モジュールを活用して共有表現をキャプチャし、ゲーティング機構を通じてそれらを重み付けします。
本システムでは,少なくとも12%の精度でベースラインの精度を向上し,95パーセントで0.5m/s未満のホイール速度誤差を発生させる。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:05:00 GMT)
Diffusion-APO: Trajectory-Aware Direct Preference Alignment for Video Diffusion Transformers [12.9] Diffusion-APOは、ビデオ拡散モデルと人間の意図を一致させる軌跡認識アルゴリズムである。
オンラインランキング、半オンラインアンカー、オフラインリファインメント、蒸留対応ドリフト補正を統合した統一かつモジュール化されたRLHFフレームワークを導入する。
本研究では,Diffusion-APOが視覚的品質と指示の基準線を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:37:46 GMT)
From Clouds to Hallucinations: Atmospheric Retrieval Hijacking in Remote Sensing Vision-Language RAG [12.9] CloudWebは、入力イメージのみを修正しつつ、レトリバー、ジェネレータ、知識ベースをデプロイ時に固定したままにしておく、大気検索ハイジャック攻撃である。
我々は、GeoRSCLIP、RemoteCLIP、OpenAI CLIP、OpenCLIPを含む5つのCLIPスタイルレトリバーを備えた7データセットリモートセンシングRAGベンチマークでCloudWebを評価した。
CloudWebは、レトリバー全体にわたって、クリーンな検索、手作りの大気ベースライン、ランダムな雲の摂動、そして気象関連の証拠をトップランクの結果に注入する固定された変種を一貫して上回っている。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:36:23 GMT)
Decentralized Diffusion Policy Learning for Enhanced Exploration in Cooperative Multi-agent Reinforcement Learning [12.8] 分散ソフトマックスポリシー勾配(DecSPG)は、協調型マルチエージェント強化学習のためのアルゴリズムのクラスである。
ガウス政策の限定的な表現性は、DECSPGの探索を著しく妨げていることを示す。
本稿では,分散拡散確率モデルを用いて各エージェントのポリシーをパラメータ化する分散拡散政策学習(DDPL)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:29:42 GMT)
Dependence on Early and Late Reverberation of Single-Channel Speaker Distance Estimation [12.8] 我々は、エコー密度関数から推定される混合時間を初期反射と後期残響の境界として利用して、シミュレーションIRを4つの変種(フル、ダイレクトオンリー、ノーレイト、ノーアーリー)に分解する。
その結果,時間校正がなければ平均絶対誤差(MAE)は1.29$mに増加し,残響に基づく手がかりを抽出することがわかった。
DRR、$C_50$、$T_60$に対するさらなる分析により、推定精度はより強い初期エネルギーで向上し、高い残響環境下では劣化することを確認した。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:03:41 GMT)
AdaTKG: Adaptive Memory for Temporal Knowledge Graph Reasoning [12.8] 時間知識グラフ(TKG)は、時間スタンプのある事実を表し、幅広い推論タスクをサポートする。
AdaTKGを提案する。AdaTKGは、観測されたすべてのインタラクションで更新されるエンタリティメモリを保守する。
実験はTKGベースラインよりも一貫した利得を確認し、適応メモリの有効性を示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:51:31 GMT)
EgoPro-Bench: Benchmarking Personalized Proactive Interaction in Egocentric Video Streams [12.7] EgoPro-Benchは、プロアクティブなインタラクション能力のトレーニングと評価のための新しいベンチマークである。
評価セットには2400本、トレーニングセットには12,000本以上のビデオが含まれている。
実験により,EgoPro-BenchはMLLMの意図理解能力を大幅に向上させることが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:10:23 GMT)
Interactive Trajectory Planning with Learning-based Distributionally Robust Model Predictive Control and Markov Systems [12.6] 本研究では,周辺エージェントの意思決定における不確実性を考慮した対話的軌道計画について検討する。
エゴエージェントを制御するために,まず決定分布を学習し,モデル予測制御問題を解くことを目的とする。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:09:54 GMT)
Arrow: A Foundation Model for Causal Discovery [12.6] 本稿では,観測データに基づくゼロショット因果発見の基礎モデルであるArrowを紹介する。
有向非巡回グラフを無向骨格と位相順序に分解し、建設による非巡回性を保証する。
Arrowは、地上構造グラフを用いた合成データセットの教師あり方式で訓練されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:51:51 GMT)
Saliency-Aware Regularized Quantization Calibration for Large Language Models [12.4] トレーニング後の量子化(PTQ)は、大きな言語モデル(LLM)をメモリとレイテンシの制約下でデプロイするための効果的なアプローチである。
既存のPTQ手法の多くは、所定のキャリブレーションデータセット上の層次再構成誤差を最小限に抑えて量子化パラメータを決定する。
提案された正則化は、キャリブレーションの間、量子化された重みが元の重みに近づき続けることを奨励し、推論時の一般化を改善させる。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:12:48 GMT)
The Coupling Tax: How Shared Token Budgets Undermine Visible Chain-of-Thought Under Fixed Output Limits [12.3] 思考の連鎖推論はしばしば、モデルを長く考えることで言語モデル精度を改善するための単調な方法として扱われる。
トレースと最終回答の推論が1つのアウトプットの予算を共有している場合、長いトレースは彼らがサポートしようとしている回答をかき集めることができます。
GSM8K、MATH-500、および5つのBIG-Bench HardタスクをQwen3モデルで3つのスケールで実行し、GSM8KとMATH-500では最大2048トークンまでの予算で非思考モードマッチや優れた思考モードを実現した。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:54:53 GMT)
Multi-Environment POMDPs with Finite-Horizon Objectives [12.3] 有限水平目標を用いたMEPOMDPにおける最適値とポリシーの計算に着目する。
本研究の主な成果は,(1) MEPOMDPのより一般的な設定ではPSPACE完全であること,(2)実用的アルゴリズムを提示し,古典的なベンチマークで評価し,これまでに知られていたアルゴリズムよりもはるかに優れていること,である。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:14:03 GMT)
Recovering Physical Dynamics from Discrete Observations via Intrinsic Differential Consistency [12.3] 我々は地域の監督をグローバルな構造的制約に置き換える。
この特性からの偏差が2つの目的に作用する時間条件のセカント速度場を訓練する。
トレーニング正則化器として、時間スケールで一貫して構成されるフローに仮説空間を限定する。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:24:32 GMT)
InfoGeo: Information-Theoretic Object-Centric Learning for Cross-View Generalizable UAV Geo-Localization [12.3] クロスビューなジオローカライゼーションは、GPSを用いた環境での正確な位置決めとナビゲーションに欠かせない。
本稿では,堅牢性と一般化性を高めるための情報理論フレームワークであるInfoGeoを提案する。
InfoGeoは,ビュー間のオブジェクト中心構造関係を整列させることにより,ビュー不変情報を最大化すること,ビュー固有ノイズ信号の最小化という2つの目的により,情報ボトルネックプロセスとして最適化を再構築する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:28:49 GMT)
Fortifying Time Series: DTW-Certified Robust Anomaly Detection [12.3] 時系列異常検出は、高精度なアプリケーションにおける安全性を確保するために重要である。
既存のディフェンスは、ほとんど互換性がないか、$ell_p$-norm制約の下でのみ、認証された堅牢性を提供する。
ランダムな平滑化パラダイムを適用することで,時系列異常検出における最初のemphDTW認証型ロバストディフェンスを導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:59:52 GMT)
Learning Multi-Relational Graph Representations for DNA Methylation-Based Biological Age Estimation [12.2] 老化時計は、年代と異なる生理状態の指標である生物学的年齢を推定することを目的としている。
DNAメチル化は、その安定性と老化との強い関係から特に有意義なバイオマーカーである。
DNAメチル化に基づく年齢予測のためのマルチリレーショナルグラフニューラルネットワークフレームワークであるRelAge-GNNを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:11:16 GMT)
GazeVLM: Active Vision via Internal Attention Control for Multimodal Reasoning [12.1] 本稿では,このメタ認知的監視を内部化するマルチモーダルアーキテクチャであるGazeVLMを提案する。
VLMに自律的にガゼトークンを生成する権限を与えることで、GazeVLMは自身の因果注意マスクの上にトップダウン制御機構を確立する。
このアーキテクチャにより、外部のエージェント・コンテントに頼ることなく、グローバルな空間認識と局所的な焦点推論の間を流動的に遷移することができる。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:49:10 GMT)
LineRides: Line-Guided Reinforcement Learning for Bicycle Robot Stunts [12.0] LineRidesは、カスタム自転車ロボットが多種多様なコマンド可能なスタント行動を取得することができる、ライン誘導学習フレームワークである。
LineRidesは、制御された偏差を許容するトラッキングマージンを使用して、物理的に実現不可能なガイドラインを処理する。
本手法で訓練したポリシは,通常の運転とスタント実行のシームレスな遷移をサポートすることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:02:40 GMT)
Topology-Enhanced Alignment for Large Language Models: Trajectory Topology Loss and Topological Preference Optimization [11.9] SFTとRLHF/DPOによる大きな言語モデル(LLM)のアライメントは通常、表現空間のグローバルな幾何学を無視している。
0次元の持続的ホモロジーを用いてこれらの軌道を正則化するトポロジ強化アライメントフレームワークを提案する。
結果は、永続的ホモロジーと軌道幾何学が制御可能なアライメントに対して有望な方向を提供することを示している。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:07:31 GMT)
Learning Large-Scale Modular Addition with an Auxiliary Modulus [11.9] 最近の研究では、和数とモジュラリティの両方において、モジュール加算学習を実質的にスケールさせた。
本研究は, この側面効果を理論的, 実験的に解析し, モジュラ付加のための共シフトフリー法を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:16:07 GMT)
Curvature Beyond Positivity: Greedy Guarantees for Arbitrary Submodular Functions [11.8] サブモジュール関数は機械学習の中心である。
負の値を取る部分モジュラー関数に対する曲率制御の乗算比を持つグリーディアルゴリズム。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:42:14 GMT)
CCX: Enabling Unmodified Intel SGX Applications on Arm CCA [11.8] 本稿では,既存のSGXアプリケーションをソースコードの変更なしにArm CCA上で実行可能にするフレームワークであるCCXの設計と実装について述べる。
評価の結果,CCXはソースコードの変更を必要とせずに既存のSGXアプリケーションを実行できることがわかった。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:22:23 GMT)
UIESNN: A Scale-Aware Spiking Network for Underwater Image Enhancement [11.8] UIESNNという水中画像強調のためのスケールアウェアなSNNフレームワークを提案する。
コアとなるMPLB(Multi-scale Pooling LIF Block)は、階層的なマルチスケールプール応答を膜力学に注入する。
MPLBをベースとして,周波数分解と注目に基づく改善を融合したスパイク残留アーキテクチャを設計する。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:34:14 GMT)
TENNOR: Trustworthy Execution for Neural Networks through Obliviousness and Retrievals [11.8] 信頼できないクラウド環境で機密データをニューラルネットワークでトレーニングするには、計算効率と厳格なプライバシー保証を同時に達成する必要がある。
本稿では,この緊張を解消するシステムTENNORについて述べる。
TENNORは、スパークスニューロンの活性化を局所性感受性ハッシュ(LSH)検索問題として再放送し、LSHデータ構造上の二重閉塞アクセスに対するセキュアなスパーシフィケーションを低減させる。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:46:24 GMT)
SoftSAE: Dynamic Top-K Selection for Adaptive Sparse Autoencoders [11.7] 動的トップ-K選択機構を備えたスパースオートエンコーダであるSoftSAEを提案する。
本手法は,入力依存空間レベルkを学習するために,微分可能なソフトトップK演算子を用いる。
実験結果から,SoftSAEは有意義な特徴を見出すだけでなく,各概念に対して適切な特徴数を選択することが確認された。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:28:18 GMT)
MedAction: Towards Active Multi-turn Clinical Diagnostic LLMs [11.7] 既存の医療訓練データは、モデルに完全な情報から推論するように教えるが、進化した部分的な証拠の下では行動しない。
木構造蒸留パイプラインであるMedActionを導入し,多変量かつ高品質な多ターン診断軌道を合成する。
このパイプラインを用いて、2,896件のPMC症例から32,681件のトラジェクトリのデータセットであるMedAction-32Kを構築した。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:15:24 GMT)
EggHand: A Multimodal Foundation Model for Egocentric Hand Pose Forecasting [11.7] EggHandは、エゴセントリックな手ポーズ予測のための基盤モデルベースのフレームワークである。
動的モーションモデリングとマルチモーダルなセマンティック推論を統一する。
提案手法は,エゴモーション下でのジェネリックビジュアルエンコーダの脆さを克服する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:09:27 GMT)
ARMOR: An Agentic Framework for Reaction Feasibility Prediction via Adaptive Utility-aware Multi-tool Reasoning [11.7] ARMORは、ツール固有のユーティリティを明示的にモデル化し、ツールを適応的に優先順位付けし、潜在的なツール競合を解決するエージェントフレームワークである。
公開データセットの実験では、ARMORが強いベースラインを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:30:20 GMT)
GEAR: Genetic AutoResearch for Agentic Code Evolution [11.6] GEAR(英: Genetic AutoResearch、遺伝子自動検索)は、単一パス検索を、複数の研究状況における集団ベースの検索に置き換える。
強力な候補ソリューションのセットを保持し、生産性、ノベルティ、カバレッジに基づいて両親を選択し、突然変異と交叉を通じて新しいアイデアを探求する。
本稿では,GEARの3つのバージョンについて検討する。1つはプロンプトによって制御され,もう1つはプログラム型検索コントローラを使用し,もう1つは実行中にコントローラ自体を進化させることができる。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:25:09 GMT)
Can Language Models Identify Side Effects of Breast Cancer Radiation Treatments? [11.6] 大きな言語モデル(LLM)は、がんの生存者に対する治療副作用のコミュニケーションを支援する可能性がある。
乳がん治療と生存医療におけるLSMによる放射線副作用リストを評価するためのデプロイ指向ストレステストフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:02:49 GMT)
Rethinking Local Learning: A Cheaper and Faster Recipe for LLM Post-Training [11.6] LLM後トレーニングは、モデルの完全な深さを通してタスク勾配を伝搬する。
LoPTは変圧器の中間点に1つの勾配境界を置く。
LoPTは、メモリコストの低減、トレーニング効率の向上、事前訓練された能力の維持など、競争力のあるパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:59:33 GMT)
Bridging Krylov Complexity and Universal Analog Quantum Simulator [11.6] 我々は、この合成複雑性の直接診断として、作用素成長力学に由来する概念である一般化Krylov複雑性を導入する。
ライドバーグ原子配列を含む代表系を解析することにより、対象演算の一般化されたクリロフ複雑性が、その実現に必要な最小時間の強い予測因子となることを示す。
この結果は、アナログ量子シミュレータにおける効率的な制御プロトコルを設計するための直感的で予測的なツールとして、Krylov複雑性を確立した。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:39:43 GMT)
Many-to-Many Multi-Agent Pickup and Delivery [11.6] 自動倉庫におけるマルチロボットシステムは、ピックアップ・アンド・デリバリタスクの継続的ストリームを管理する必要がある。
M2M(Multi-to-Many Multi-Agent Pickup and Delivery)を提案する。
M2Mは、さまざまな環境や倉庫の在庫密度で平均22,000以上のタスクを完了します。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:03:47 GMT)
AT-VLA: Adaptive Tactile Injection for Enhanced Feedback Reaction in Vision-Language-Action Models [11.6] VLA(Vision-Language-Action)モデルは、多様なタスクを実行するロボットエージェントの能力を大幅に向上させた。
近年の研究では、下流作業中に触覚信号を組み込むことが試みられ、事前学習したVLAが触覚フィードバックを解釈できるようになった。
本稿では,新しい適応触覚注入機構を導入するAT-VLA(Adaptive Tactile Vision-Language-Action)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:17:08 GMT)
GAD in the Wild: Benchmarking Graph Anomaly Detection under Realistic Deployment Challenges [11.5] グラフ異常検出(英: Graph Anomaly Detection、GAD)は、金融詐欺検出やソーシャルプラットフォームガバナンスにおいて重要な応用を持つグラフ機械学習において重要なタスクである。
既存のGADベンチマークは、比較的バランスの取れた異常比を持つ小規模でキュレートされたグラフに制限されることが多い。
本稿では,GADモデルを3つのデプロイ関連課題下で体系的に評価する多次元ベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:10:51 GMT)
Continuity Laws for Sequential Models [11.5] 連続モデリングにおける過度に探索された帰納バイアス:時間の連続性について検討する。
S4 は安定な連続挙動を示すが,S6 は入力振幅や選択力学に敏感であることを示す。
ベンチマークを通じて、タスク継続性、モデル継続性、モデルパフォーマンスの間に明らかな実験的な整合性を見出した。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:55:45 GMT)
Benchmarking Fairness in Spiking Neural Networks: Data Bias, Spurious Features, and Hardware Effects [11.4] この研究は、スパイキングニューラルネットワーク(SNN)のための最初の体系的公正性ベンチマークを導入する。
12の最先端SNNの標準化された評価は、スターク格差を明らかにしている。
アルゴリズムフェアネス研究をニューロモルフィックエンジニアリングでブリッジすることで、我々のベンチマークは信頼できるSNNの基礎を提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:29:00 GMT)
LiteGUI: Distilling Compact GUI Agents with Reinforcement Learning [11.4] 現在のオンデバイスビジョン言語GUIエージェントは、モデル容量の制限によって制約される。
小型モデルの伝統的なスーパービジョンファインチューニングは、しばしば過度に適合し、破滅的な忘れ込みとポリシーの厳格さをもたらす。
小型モデルの性能を大幅に向上させる新しいSFTフリートレーニングパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:38:29 GMT)
Not All Tokens Learn Alike: Attention Entropy Reveals Heterogeneous Signals in RL Reasoning [11.3] 強化学習に基づくポストトレーニングは、大規模言語モデルの推論能力を向上させるための重要なアプローチとなっている。
この研究は、各応答トークンに対する文脈支援の集中度や拡散度を測定する注意エントロピーを通して、それらの不均一性を研究する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:31:28 GMT)
AERO-VIS: Asynchronous Event-based Real-time Onboard Visual-Inertial SLAM [11.3] 本稿では,AERO-VISについて述べる。AERO-VISは,統合型,データ駆動型,ロバスト型,性能最適化型キーポイント検出器を備えたステレオイベント慣性SLAMシステムである。
UAV上での展開では、イベントベースのSLAMでは前例のない精度を実現している。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:34:00 GMT)
Latent Order Bandits [11.2] Banditアルゴリズムは、様々なシーケンシャルな意思決定問題を解決するが、多くの場合、オフスクラッチのパーソナライゼーションにはサンプル非効率である。
本稿では,各状態における行動選好の部分的順序に関する事前知識のみを必要とするため,潜在順序選好(LOB)を提案する。
LOBは、アクションの部分的な順序が共有されている限り、同じ状態のインスタンスを報酬分布で変更することができる。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:15:21 GMT)
Alternating Target-Path Planning for Scalable Multi-Agent Coordination [11.2] 並列ターゲット割り当てとパスフィンディング問題は、マルチエージェントパスフィンディングを拡張する。
本稿では,パスフィニングから目的の割り当てを分離する反復的精錬フレームワークを提案する。
これは現実のセットアップに適した実用的で大規模なTAPFに向けた確かなステップである。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:50:51 GMT)
Efficient Verification of Neural Control Barrier Functions with Smooth Nonlinear Activations [11.2] 本稿では,アクティベーション関数の解析特性を利用して,より厳密なジャコビアン境界を計算するLightCROWNを提案する。
非線形制御系の実験では、LightCROWNは成功率を最大100%改善し、速度とスケーラビリティを向上する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:59:53 GMT)
Implicit Compression Regularization: Concise Reasoning via Internal Shorter Distributions in RL Post-Training [11.1] 本稿では,ロールアウトグループにおける最短応答によって引き起こされる仮想的短値分布から圧縮信号を得るオンライン正規化手法を提案する。
3つの推論バックボーンの実験と、複数の数学的および知識集約ベンチマークにより、ICRは、正確性を維持したり改善したりしながら、応答を一貫して短縮することが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:25:08 GMT)
HARMONY: Bridging the Personalization-Generalization Gap by Mitigating Representation Skew in Heterogeneous Split Federated Learning [11.1] ハイブリッドスプリット・フェデレーション・ラーニング(Hybrid SFL)は、クライアントサイドのフロントエンドを、フォールバック推論のためのサーバサイドバックエンドと結合する。
異種クライアントアーキテクチャをサポートする最初のハイブリッドSFLフレームワークであるHARMONYを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:58:43 GMT)
A Dataset of Agentic AI Coding Tool Configurations [11.1] データセットには5つのツール(Claude Code、GitHub Copilot、OpenAI Codex、Cursor、Gemini)にわたる4,738のリポジトリと8つの設定メカニズムが含まれている。
我々は15,591個の構成アーティファクト、これらの構成アーティファクトに関連する18,167個の構成ファイルの全内容、そして148,519個のAI共著コミットを収集した。
このデータは、コンテキストエンジニアリング、AIツールの採用パターン、人間とAIのコラボレーションに関する研究をサポートする。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:58:27 GMT)
Tree SAE: Learning Hierarchical Feature Structures in Sparse Autoencoders [11.1] 階層レベル間のより深い機能的リンクを強制する新しい再構築条件を導入する。
アクティベーション制約と再構成制約を組み合わせることで,特徴集合内から直接階層構造を学習するモデルであるTree SAEを提案する。
以上の結果から,ツリーSAEは階層的なペアの学習において既存のSAEをはるかに上回りながら,いくつかの重要なベンチマークにおいて最先端の競争性能を維持していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:57:37 GMT)
Retrieve, Integrate, and Synthesize: Spatial-Semantic Grounded Latent Visual Reasoning [11.1] 本稿では,事前学習型MLLM計算の互換性拡張として遅延推論を開発する空間意味的基盤となるRIS(Retrieve,Integrate,Synthesize)を提案する。
RISは潜伏トークンを空間的および意味的な証拠の両方に固定し、進行的な注意ボトルネックを通じて因果的役割を強制し、翻訳された潜伏状態から語彙に整合した復号に戻すために短い言語遷移トークンを導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:33:58 GMT)
Beyond Bag-of-Patches: Learning Global Layout via Textual Supervision for Late-Interaction Visual Document Retrieval [11.0] ローカルなパッチ表現をグローバルなレイアウト埋め込みで拡張するマルチモーダルエンコーダを提案する。
4つのViDoRe-v2データセットにわたって、私たちのモデルは、アーキテクチャ的に比較可能な最強のColPali/ColQwenベースラインを、+2.4 nDCG@5と+2.3 MAP@5で改善します。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:28:46 GMT)
Hard to Read, Easy to Jailbreak: How Visual Degradation Bypasses MLLM Safety Alignment [10.9] 近年のビジュアルコンテクスト圧縮の進歩により、MLLMはテキストを画像にレンダリングすることで、超長いコンテクストを効率的に処理できるようになっている。
このパラダイムに固有の致命的な脆弱性を特定します。
我々の研究は、視覚に基づく圧縮の重大なリスクを明らかにし、将来のMLLMの安全な設計のための重要な洞察を提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:19:23 GMT)
DINO-MVR: Multi-View Readout of Frozen DINOv3 for Annotation-Efficient Medical Segmentation [10.9] 凍結したDINOv3の特徴は,すでに医用セグメンテーションに有用な構造的および境界的手がかりを含んでいる。
アノテーション効率のよい医療セグメンテーションのための多視点読み出しフレームワークであるDINO-MVRを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:13:01 GMT)
LENS: Low-Frequency Eigen Noise Shaping for Efficient Diffusion Sampling [10.9] 蒸留拡散モデルはデノナイジングステップの数を減らすことで画像生成を加速するが、しばしば劣化した画像品質に悩まされる。
最近のハイパーネットワークベースのアプローチは、トレーニング中にこのプロセスを改善させるが、高次元の潜伏空間においてコストのかかるノイズ変調を必要とする。
低次元部分空間で動作する効率的な雑音変調フレームワーク LENS (Low- frequency Eigen Noise Shaping) を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:22:24 GMT)
A Note on Non-Negative $L_1$-Approximating Polynomials [10.9] ガウス分布に関して,textitnon- negative $L$-approximationsの存在について検討する。
これらの非負の近似は、最近、正のみの例からスムーズな学習に使われていることを発見した。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:55:39 GMT)
Actor-Critic Algorithm for Dynamic Expectile and CVaR [10.9] 本稿では,ソフトマックス政策パラメータ化の下での遷移摂動を伴わない代理政策勾配を提案する。
また,動的期待値と条件付きリスク値のモデルフリー値学習手法を開発した。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:19:11 GMT)
Same Brain, Different Prediction: How Preprocessing Choices Undermine EEG Decoding Reliability [10.7] 我々は,前処理の選択を対実的介入空間として定式化し,脳波予測が驚くほど不安定であることを示す。
私たちはこの不安定性を計測し、分解し、再現する3つのツールを提供します。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:58:58 GMT)
LAMES: A Large-Scale and Artisanal Mining Environmental Segmentation Dataset [10.7] 本稿では,150の大規模マイニング(LSM)サイトと870km2のアノテートされた人工小規模マイニング(ASM)サイトを含むデータセットを提案する。
データセットは、研究コミュニティ、社会的および環境的な結果、そして倫理的観点からの研究者の責任に寄与する可能性がある。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:46:57 GMT)
Uncertainty-Aware Structured Data Extraction from Full CMR Reports via Distilled LLMs [10.6] 本稿では,自由テキスト型心臓磁気共鳴(CMR)レポートを構造化データに変換するフレームワークであるCMR-EXTRを提案する。
教師と学生の蒸留パイプラインは、マニュアルアノテーションを制限しながら完全にオフラインの推論を可能にする。
実験により、CMR-EXTR 99.65%の変数レベルの精度が示され、信頼性の高い抽出と情報的信頼性のスコアが示されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:35:41 GMT)
Pretraining Induces a Reusable Spectral Basis for Downstream Task Adaptation [10.5] 微調整事前訓練されたモデルは、全パラメータ空間の低次元部分空間で発生する。
ダウンストリームタスクとは無関係な安定方向か、それとも、追加調整を必要としないタスク関連構造をすでにエンコードしているか?
事前学習した重み行列の先頭特異ベクトルは、微調整の下で非常に安定であり、無関係な下流タスク間で共有されることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:12:43 GMT)
Learning Polyhedral Conformal Sets for Robust Optimization [10.5] 本稿では,頑健な最適化目標に適した不確実性集合を学習する,意思決定対応型コンフォメーションフレームワークを提案する。
提案手法は,データ駆動型超平面による多面体集合のフレキシブルなファミリーをパラメータ化し,誘導されたロバスト損失を直接最小化することでそれらの幾何学を学習する。
オラクル決定に対する準最適ギャップの有限サンプルカバレッジ保証とバウンダリを提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:39:41 GMT)
Steering Without Breaking: Mechanistically Informed Interventions for Discrete Diffusion Language Models [10.5] 離散拡散言語モデル(DLM)は、すべての位置を並列に反復的に認知することでテキストを生成する。
この均一なスケジュールは品質を劣化させ、複数の属性を共同で操る場合の損傷成分を示す。
本稿では,属性が積極的に形成され,残りの世代に手を加えないステップに介入する適応型スケジューラを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:52:17 GMT)
Goal-Conditioned Supervised Learning for LLM Fine-Tuning [10.4] 大規模言語モデルのためのオフライン微調整フレームワークとして,目標条件付き教師あり学習を提案する。
私たちの中核的な考え方は、フィードバック信号を直接明示的な目標として扱い、純粋に教師付き学習を通じてモデルをトレーニングし、その目標を達成するためのレスポンスを生成することです。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:55:40 GMT)
Learning CLI Agents with Structured Action Credit under Selective Observation [10.4] コマンドラインインタフェース(CLI)エージェントは、進化するエージェントとコンピュータの相互作用、実行可能なコマンドラインプログラム、オンライン実行フィードバックの実践パラダイムとして登場しつつある。
最近の研究では、これらのインタラクション能力を検証可能なタスクフィードバックから学習するために強化学習(RL)を使用しているが、CLIアクションのネイティブな構造化属性を学習信号として活用する手法はほとんどない。
シェル駆動型情報抽出とファイル編集タスクを用いて,これらのボトルネックについて検討する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:02:31 GMT)
Region4Web: Rethinking Observation Space Granularity for Web Agents [10.4] 観察は機能領域の粒度、各ページのそれぞれが別々の目的を果たす部分で行うべきだと我々は主張する。
本稿では,AXTreeを階層的な分解とセマンティック抽象化によって機能領域に再構成するフレームワークであるRerea4Webを提案する。
我々は、この領域レベルの観察をアクターエージェントに配信するWeb固有の推論パイプラインであるPageDigestを、ステップ毎に持続するコンパクトなページ単位のダイジェストとして提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:11:23 GMT)
Expectation-Maximization as a Spectrally Governed Relaxation Flow [10.4] グローバル降下と局所収束を接続する潜在変数作用素を明示する。
この結果から, グローバル降下, 局所スペクトル挙動, 最適局所緩和を, 共通の動的枠組み内に配置した。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:49:24 GMT)
A Flexible Adaptive Stable Clustering Algorithm for Archive-Scale Online Mass Spectrometry [10.3] 既存のクラスタリング手法はスケーラビリティ、メトリックの柔軟性、アルゴリズムの安定性に妥協を迫る。
本稿では,これらの制約を解決する動的システムフレームワークであるフレキシブル・アダプティブ・スタブル・クラスタリング(FASC)を紹介する。
FASCは、超希少な産業用トレーサを分離しながら、二次無機エアロゾルの大気の老化経路を自律的にマッピングした。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:22:12 GMT)
UniISP: A Unified ISP Framework for Both Human and Machine Vision [10.3] 生センサデータにより、よりリッチな情報表現が提供され、正確な認識に不可欠である。
従来の画像信号処理パイプラインは、一連のステップを通じて人間の知覚のために視覚的にRGB画像を生成する。
生のカメラデータを直接利用するコンピュータビジョンタスクでは、既存のほとんどの手法は最小限のISP処理と下流ネットワークを統合している。
本稿では,人間の視覚認識とコンピュータビジョンアプリケーションの両方の要件を同時に満たすために設計された,新しいISPフレームワークであるUniISPを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:13:14 GMT)
Offline-Online Hierarchical 3D Global Relocalization With Synthetic LiDAR Sensing and Descriptor-Space Retrieval [10.2] 3Dグローバルな再ローカライゼーションは、実用アプリケーションにおけるモバイルロボットの重要な機能のひとつだ。
本稿では,検索空間を分離するオフライン・オンライン階層型フレームワークを提案する。
提案手法は,3次元環境における3秒平均再局在時間と8cm平均局在精度を実現する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:46:57 GMT)
bispectrum: Selective $G$-Bispectra Made Practical [10.1] 7つの異なるグループアクションに対して選択的な$G$-bispectraを実装するオープンソースライブラリであるbispectrumを提示する。
3つの古典的ベンチマークデータセット上のディープラーニングアーキテクチャに層をプールするために$G$-bispectraを組み込むことの利点を評価する。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:35:00 GMT)
Transfer Learning Across Fast- and Full-Simulation Domains in High-Energy Physics [10.1] 本研究では,現実的な環境下での高速・完全シミュレーションデータセット間の伝達学習を体系的に研究する。
本稿では, 信号背景分類, クォークグルーオンジェットタグ付け, 横方向エネルギー再構成の3つの課題について考察する。
モデルはATLASライクな高速シミュレーションで事前訓練され、CMSライクな高速シミュレーションに適応し、完全なATLASオープンデータに適応する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:18:34 GMT)
Learning Minimal-Deviation Corrections for Multi-Dimensional Mismodelling in HEP Simulations [10.1] 高エネルギー物理学におけるモンテカルロモデリングは、特にシミュレーションが観測データの再生に失敗する複雑なシナリオにおいて困難である。
実際には、実験情報は1次元(1次元)の分布に制限されることが多いが、誤モデリングは多次元の特徴空間で発生する。
本稿では、利用可能な1次元ターゲット分布を再現するシミュレーションイベントの変換を学習し、これらの制約の下で動作させるニューラルネットワークベースの手法を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:07:18 GMT)
NPMixer: Hierarchical Neighboring Patch Mixing for Time Series Forecasting [10.1] NPMixerは最先端モデルより一貫して優れており、28点中20点でパフォーマンスが向上している。
7つのベンチマークデータセットの実験により、NPMixerは最先端モデルよりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:22:51 GMT)
SPHERE: Mitigating the Loss of Spectral Plasticity in Mixture-of-Experts for Deep Reinforcement Learning [10.0] Mixture-of-Experts (MoE)ネットワークは、スケーリング法則を有効にし、多様なスキルの学習を容易にするために報告されている。
我々は、スペクトル可塑性の損失として、MoEポリシーの可塑性損失を定式化する。
我々は、スペクトル可塑性の喪失を緩和するMoEベースのポリシーに適した実用的なParsevalペナルティであるSPHEREを紹介する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:53:36 GMT)
The Convergence Gap: Instruction-Tuned Language Models Stabilize Later in the Forward Pass [9.9] 最終的なアウトプットは、チェックポイントがその次のポイント予測にコミットしたときに隠される。
本稿では,各層の次点分布をデコードし,モデルの最終分布までの距離を測定するモデル微分診断法である収束ギャップを導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:45:52 GMT)
Instruction Tuning Changes How Upstream State Conditions Late Readout: A Cross-Patching Diagnostic [9.9] 我々は、いつから後期のスタックが協力して、相違点を次の利幅に変えるのかを尋ねる。
私たちは、各モデルの後期スタックで、各モデルの初期段階の状態を横断します。
強制的なスコアリングは、局所的なトークンの選択が、後の正確な回答の成功を変える可能性があることを示している。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:47:10 GMT)
Q-MMR: Off-Policy Evaluation via Recursive Reweighting and Moment Matching [9.8] 有限水平MDPにおける非政治評価のための新しい理論フレームワークQ-MMRを提案する。
重要サンプリングや線形FQEなど,既存の手法との接続を確立する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:50:37 GMT)
Uncovering and Shaping the Latent Representation of 3D Scene Topology in Vision-Language Models [9.7] 現代の視覚言語モデル (VLM) には3次元シーンの潜在的トポロジマップが存在することを示す。
この空間部分空間をクロスシーン線形特徴抽出により分離することにより,モデルの空間出力を因果的に制御するクリーン空間部分空間を抽出する。
この潜在表現を数学的に形成し、シーンの3次元ガウス-核グラフのラプラシア固有写像との対応性を証明する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:32:27 GMT)
FAME: Forecasting Academic Impact via Continuous-Time Manifold Evolution [9.7] 大規模言語モデル(LLM)は、研究のアイデアをブレインストーミングし評価するためにますます使われています。
提案課題は,人手による原稿の衝撃予測を,検証可能なプロキシタスクとして利用することで解決する。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:57:34 GMT)
SREGym: A Live Benchmark for AI SRE Agents with High-Fidelity Failure Scenarios [9.6] SREエージェントの高忠実度ベンチマークであるSREGymを提案する。
SREGymは、現実世界のクラウドネイティブなシステムスタック上に構築されたライブシステム環境を公開する。
SREGymには90の現実的で挑戦的なSRE問題が含まれている。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:47:07 GMT)
Finite-Time Analysis of MCTS in Continuous POMDP Planning [9.6] 本稿では, 部分観測可能決定過程(POMDP)におけるモンテカルロ木探索(MCTS)の有限時間解析について述べる。
離散観測空間と連続観測空間の両方に確率的濃度境界がある。
本稿では, ボロノイセルを用いた連続観測空間を適応的に分割する, f inite-time 保証付き POMCPOW の変種を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:13:29 GMT)
UniD-Shift: Towards Unified Semantic Segmentation via Interpretable Share-Private Multimodal Decomposition [9.6] 本稿では,2次元と3次元のセマンティックセグメンテーションのための統合フレームワークを提案する。
我々は、SAMベースの視覚エンコーダとSPTNetベースの幾何学エンコーダを組み合わせて、補完的意味論と幾何学的表現を抽出する。
軽量アテンションベースの融合モジュールは、共有された機能を一貫したクロスモーダル表現に集約する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:09:08 GMT)
Theoretical Limits of Language Model Alignment [9.5] 言語モデル(LM)アライメントは、ベースモデルの能力を保ちながら、人間の好みを反映するモデル出力を改善する。
最も一般的なアライメントアプローチは、(i)強化学習であり、KL分割制約の下で期待される報酬を最大化する。
固定KL分割予算に対する最大期待報酬利得を導出することにより、KL正規化アライメントの情報理論的限界を特徴づける。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:32:22 GMT)
CoCoDA: Co-evolving Compositional DAG for Tool-Augmented Agents [9.4] CoCoDAは、単一のコードネイティブ構造を通じてプランナーとツールライブラリを共進化させるフレームワークである。
本稿では, 検索コストの削減, サブリニア検索時間, 形状報酬による構成上の優位性, DAGの整形性を示す理論的結果を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:05:15 GMT)
LaWM: Least Action World Models for Long-Horizon Physical Consistency from Visual Observations [9.4] 学習された視覚的潜伏空間における最小アクションの原理を運用するためのラストアクション世界モデル(LaWM)を提案する。
LaWMは、学習された一般化された座標に観測を符号化し、連続的な潜伏状態上で潜在離散ラグランジアンを学ぶ。
遷移は離散的な変動原理によって誘導されるため、LaWMは長期の視覚予測のための構造保存バイアスを提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:03:13 GMT)
Intent-Driven Semantic ID Generation for Grounded Conversational News Recommendation [9.3] 我々は、Generate-then-Matchパラダイムの下で、インテント駆動セマンティックID(SID)生成を導入する。
現在のニュースプールにファジィ整合した階層的なSIDプレフィックスに、さまざまな意図をマッピングして、完全に根拠付けられたレコメンデーションを保証します。
メインストリームの中国のニュースプラットフォームでは、我々の7Bモデルは152Kのオープン世代のSID空間で0%の幻覚と12.4%のL1マッチを達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:43:06 GMT)
On Observation Time for Recovering Latent Hawkes Networks [9.3] 工学、社会、自然における相互作用システムのダイナミクスは、どの実体が相互作用できるかを統治する潜在ネットワーク上で進化することが多い。
我々は、基礎となるネットワークを正確に回復するために、動的に観察しなければならない最小時間について尋ねる。
疎で弱い相互作用を持つ定常的なホークス過程のクラスでは、$log d$の観測時間が十分で必要であることが証明される。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:06:26 GMT)
PhySPRING: Structure-Preserving Reduction of Physics-Informed Twins via GNN [9.3] 本稿では,春期デジタル双生児の複雑性を低減するため,異なるGNNに基づくPhySPRingを提案する。
PhysTwinベンチマークでは、PhysTwin上での密度再構成と予測精度を改善している。
また、Real2Simロボットポリシー評価パイプラインにおけるPhySPRingの有効性を示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:55:58 GMT)
An Efficient Hybrid Sparse Attention with CPU-GPU Parallelism for Long-Context Inference [9.2] ロングコンテキスト推論はCPU常駐KVキャッシュ上でますます動作する。
F Fluxionは、出力対応のKV予算、ヘッド固有および計算対応のスパース構成、クロスデバイスコーディネート実行という3つの重要な洞察に基づいて構築されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:24:39 GMT)
DACA-GRPO: Denoising-Aware Credit Assignment for Reinforcement Learning in Diffusion Language Models [9.2] GRPO型トレーナーのプラグ・アンド・プレイ・エンハンスメントであるGRPO(DACA-GRPO)に対するDenoising-Aware Credit Assignmentを提案する。
DACA-GRPOは、数学的推論、コード生成、制約満足度、制約付き生成を含む7つのベンチマークで一貫した改善を実現している。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:02:31 GMT)
Anatomical Landmark-Guided Deep Reinforcement Learning for Autonomous Gastric Navigation [9.2] ワイヤレスカプセル内視鏡(WCE)は、消化管の無痛な可視化を可能にする。
本稿では,自律型胃ナビゲーションのための移動型,解剖学的ランドマーク付き深部強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:11:21 GMT)
PRIMED: Adaptive Modality Suppression for Referring Audio-Visual Segmentation via Biased Competition [9.1] Referring Audio-Visual (Ref-AVS)は、視覚的、聴覚的、テキスト的参照キューに基づいて、ターゲットオブジェクトをビデオフレームにローカライズし、セグメント化する。
本稿では,認知神経科学における偏りのある競合理論に着想を得たPRIMEDを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:40:34 GMT)
Bayesian Fine-tuning in Projected Subspaces [9.1] 低ランク適応(LoRA)は、重み更新を低ランク行列に分解することで、大きなモデルのパラメータ効率の良い微調整を可能にする。
LoRAは不確実性の定量化のメカニズムが欠如しており、過度に自信を持ち、校正が不十分なモデルに繋がる。
パラメータ効率のよいベイズ微調整のための新しいフレームワークを提案し、非常に低次元のパラメータ空間において有効な不確実性定量化が達成できることを実証する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:14:24 GMT)
Optimal Recourse Summaries via Bi-Objective Decision Tree Learning [9.1] Actionable Recourseは、好ましくない結果を変えるためのアクションを個人に提供する。
局所的な行動の集約は費用がかかり、しばしば矛盾するため、グローバルな監査やバイアス検出には適していない。
リコースサマリーは、集団を分割し、サブグループごとに1つの共有アクションを割り当てることで、この制限に対処する。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:16:40 GMT)
GESR: Graph-Based Edge Semantic Reconstruction for Stealthy Communication Detection with Benign-Only Training [9.1] 本稿では,不審な通信や異常なホストを検出するためのグラフベースの新しいフレームワークであるGESRについて述べる。
エッジセマンティクスを、孤立した特徴ではなく、局所的な構造的コンテキストから完全に再構築する。
両方の評価されたベンチマークで、既存のメソッドを一貫して上回る。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:11:15 GMT)
Tessellations of Semi-Discrete Flow Matching [9.1] ガウス音源が有限個の点に支持された離散的対象を輸送する半離散的条件下でのフローマッチングについて検討する。
我々は最適化と近似効果から独立して端末フローマップによって誘導される幾何を解析する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:44:33 GMT)
AdamFLIP: Adaptive Momentum Feedback Linearization Optimization for Hard Constrained PINN Training [9.1] 物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式(PDE)によって支配される前方および逆問題を解くフレキシブルな枠組みを提供する
標準的なPINNトレーニングは、通常、手動で選択した重みを使ったPDE残差、データミスマッチ、初期/境界条件を組み合わせたソフトペナルティの定式化に依存している。
本研究では, PINN トレーニングを等式制約付き最適化問題として再検討し, 適応モーメントフィードバック線形化最適化をハード制約型 PINN (AdamFLIP) に適用する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:13:15 GMT)
PathPainter: Transferring the Generalization Ability of Image Generation Models to Embodied Navigation [9.1] 我々は,BEVイメージをグローバルな先行技術として利用し,地上・近地ロボットプラットフォーム向けに設計されたナビゲーションシステムを提案する。
このシステムは画像生成モデルを用いて、人間の意図を自然言語から解釈し、目的地を特定し、トラバーサビリティマスクを生成する。
実行中,ロボットの視線をBEVマップと整列させ,従来型の視線における長期的ドリフトを緩和するために,クロスビューの局所化を導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:33:19 GMT)
Dr. Post-Training: A Data Regularization Perspective on LLM Post-Training [9.0] ポストトライニング(Dr. Post-Training)は、一般的なトレーニングデータをデータ誘導正規化器として再認識する新しいフレームワークである。
我々の手法は、最先端のデータ選択ベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:16:11 GMT)
Towards Apples to Apples for AI Evaluations: From Real-World Use Cases to Evaluation Scenarios [9.0] この研究は、AI評価における方法論的透明性を提唱する。
本稿では,高レベルのユースケースを詳細なシナリオに変換するプロセスを提案する。
本稿では、金融サービス部門中小企業が特定した高レベルのAI活用事例について報告する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:44:55 GMT)
ICDAR 2026 Competition on Writer Identification and Pen Classification from Hand-Drawn Circles [9.0] CircleIDは、スキャンされた円の文字識別とペン分類に関する大規模なICDAR 2026コンペティションである。
主な目的は、バイオメトリックライターの特徴と物理的ペンが、最小限の静的トレースの中で自然に絡み合っているかを調べることである。
本稿では,データセットを詳述し,勝利の方法を評価し,アウト・オブ・ディストリビューション・ライターがモデル一般化と特徴のゆがみに与える影響を解析する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:48:57 GMT)
CASCADE: Context-Aware Relaxation for Speculative Image Decoding [9.0] 自己回帰生成は高忠実度画像合成のための強力なアプローチである。
現在のアプローチでは、テキスト生成で見られるものと同等の効率向上を達成できない。
木に基づく投機的復号法で自然に現れる対象モデルの振舞いにおいて,これまで見過ごされていたパターンを同定する。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:32:17 GMT)
From Pixels to Primitives: Scene Change Detection in 3D Gaussian Splatting [8.9] ガウシアンスプラッティング上に構築されたシーン変化検出法は、レンダリング-then-compareパラダイムを普遍的に従う。
我々は、ネイティブプリミティブ属性だけでシーン変化検出に十分な信号を持っているという証拠を提供する。
プリミティブを直接操作することで、GD-DIFFという2つのプロパティが、レンダリング-then-compareメソッドと区別されます。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:50:10 GMT)
Central Limit Theorem for Two-Time-Scale Approximate Distributionally Robust RL [8.8] 堅牢な強化学習アルゴリズムの設計は根本的な課題を生んでいる。
本稿では、関連するロバスト関数の1次展開に基づく近似DRRLフレームワークを提案する。
この近似方程式の定点を学習するために,平均変数近似(MVSA)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:24:28 GMT)
The Minimax Rate of Second-Order Calibration [8.8] 二項分類における二階キャリブレーション誤差を推定するミニマックス速度を特徴付ける。
結論として、二階プラッツスケーリングに対する最初の有限サンプル保証を与える。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:41:56 GMT)
MathConstraint: Automated Generation of Verified Combinatorial Reasoning Instances for LLMs [8.8] 我々はLLMの推論能力を評価するためのハードで適応的なベンチマークであるMathConstraintを紹介する。
MathConstraintはパラメータ化された問題タイプを使用して、任意に困難で自動検証可能なインスタンスをスケーラブルに生成する。
我々は、一般的なSAT/SMTソルバを含むサンドボックスのPython環境にアクセスせずに、12のフロンティアモデルとオープンウェイトモデルを評価する。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:28:02 GMT)
Trajectory as the Teacher: Few-Step Discrete Flow Matching via Energy-Navigated Distillation [8.7] Trajectory-Shaped Discrete Flow Matchingは、ブラインドジャンプをガイドナビゲーションに置き換える。
170M-024言語モデリングでは、8ステップの形状の学生は1,024ステップの教師よりも32%低い難易度を達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:58:22 GMT)
Embedding Dimension Lower Bounds for Universality of Deep Sets and Janossy Pooling [8.7] 本稿では,一般的なDeep Setsアーキテクチャを一般化したJanossyプールの普遍性について検討する。
我々は、この埋め込み次元の必要なサイズについて、新しい下界を証明した。
k$-ary Janossy プールの場合、$k > 1$ のとき、必要な埋め込み次元に対する最初の非自明な下界を証明する。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:34:54 GMT)
Sample Complexity of Stochastic Optimization with Integer Variables [8.7] 整数最適化は、目的の制約の構造に依存して、標本数よりも厳密かつ厳密に要求されることが示される。
連続最適化の文献からよく知られた$()$サンプルの複雑さと比較して、$()$ソリューションを報告するために$()サンプルが必要である。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:52:59 GMT)
Magis-Bench: Evaluating LLMs on Magistrate-Level Legal Tasks [8.7] Magis-Benchは、管理レベルの書き込みタスクを評価するためのベンチマークである。
2023年から2025年にかけて行われた8回の試験から74の質問がある。
LLM-as-a-judge法を用いて23種類のLLMの評価を行った。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:00:14 GMT)
SGD for Variational Inference: Tackling Unbounded Variance via Preconditioning and Dynamic Batching [8.6] Black-Box Variational Inference (BBVI) は通常、下界 (ELBO) を最適化するためにグラディエント・ディフレッシュ (SGD) に依存している。
基礎最適化理論とBBVIの実践例とのギャップを埋める。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:02:51 GMT)
Catching the Infection Before It Spreads: Foresight-Guided Defense in Multi-Agent Systems [8.6] マルチエージェントシステム(MAS)は、特殊なエージェントによる協調的な複雑な問題解決を可能にする。
MASは感染性ジェイルブレイクに対して脆弱で、単一のエージェントを妥協することで他のエージェントに拡散し、広範な妥協につながる。
既存の防御策では、より伝染性の治療因子を訓練し、ウイルスの敵対的な例から治療薬を回収するバイアスを課している。
本稿では,行動の進化をトラッキングし,感染を除去するために,各エージェントが今後の相互作用を理由としてFLP(Foresight-Guided Local Purification)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:43:35 GMT)
Integrating Causal DAGs in Deep RL: Activating Minimal Markovian States with Multi-Order Exposure [8.6] オンライン強化学習(RL)は、パフォーマンスを保証するためにマルコフ特性に依存している。
ディープRLでは、最小表現だけでは経験的に性能改善に失敗する。
マルチオーダーの歴史的状態構造を同じ$Q$関数にフィードするtextbfMOSE(Multi-Order State Exposure)を提案する。
以上の結果から, 因果的深度RLの根本原理として, 最小充足力では不十分であり, 因果的状態情報の利点を解き明かすためには, 共振冗長性が必要であるという結論が得られた。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:12:03 GMT)
Separation Assurance between Heterogeneous Fleets of Small Unmanned Aerial Systems via Multi-Agent Reinforcement Learning [8.5] 将来の密集した都市空域では、複数の企業が小型無人航空機(sUAS)の異種艦隊を運用する。
本論は,(1)戦術的非衝突政策を収束させるか,あるいは均衡に到達して紛争のない空域を確保するかという,2つの中核的問題に対処することを目的とする。
テキサス州ダラスを横断するパッケージ配送ミッションにおいて,異種艦隊内の同種航空機を同時に運用するマルチエージェント強化学習パラダイムについて検討した。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:58:49 GMT)
Towards Billion-scale Multi-modal Biometric Search [8.5] この論文はBharat ABISと呼ばれる大規模なバイオメトリック検索システムについて、オープンソースアーキテクチャに基づく洞察を提供する最初の論文である。
Bharat ABISのエンドツーエンドパイプラインは、前処理のモダリティ特異的段階を通じて指紋、顔、虹彩のモダリティを処理する。
1:N探索のための効率的かつ効率的な解を生成するために、モーダル性とその統合方法について詳細に分析する(重複解法)。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:28:20 GMT)
Guidance Is Not a Hyperparameter: Learning Dynamic Control in Diffusion Language Models [8.5] 我々はCFG尺度の選択を逐次決定問題として再考し、強化学習を通して動的誘導軌道の学習を提案する。
離散拡散言語モデルを用いた3つの制御されたNLP生成タスクの実験により、適応的ガイダンスは固定スケール戦略よりも制御可能性と生成品質のバランスが良いことを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:12:32 GMT)
DurableUn: Quantization-Induced Recovery Attacks in Machine Unlearning [8.5] INT4量子化は,bfloat16(BF16)において,モデルがコンプライアンス監査をパスしても,忘れられたコンテンツを復元することを示す。
我々は,NFLoRA方式において,アダプタ空間INT4量子化の下での非学習的ロバスト性に関する最初の体系的研究を行った。
Q-INT4 は FA と RA と並んで標準評価基準として採用されることが求められます。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:13:19 GMT)
Memory-Efficient Looped Transformer: Decoupling Compute from Memory in Looped Language Models [8.4] メモリ効率のよいループ変換器(MELT)は、メモリ消費から奥行きを分離する新しいアーキテクチャである。
この結果から,MELTはLoopLM性能を犠牲にすることなく,定数メモリ反復推論を実現することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:25:27 GMT)
What if AI systems weren't chatbots? [8.4] 我々は、AIを主に会話アシスタントとして扱う場合、構造的な欠点があることを示す。
労働の移動、経済力の集中、環境コストの増大など、幅広い社会効果について検討する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:40:18 GMT)
ProteinJEPA: Latent prediction complements protein language models [8.4] 最適なタンパク質配置+JEPA設計は、全て潜伏予測ではなく、変種である。
潜航目標をマスクされた位置のみ予測し、交叉エントロピーを保持する。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:30:54 GMT)
SceneFactory: GPU-Accelerated Multi-Agent Driving Simulation with Physics-Based Vehicle Dynamics [8.4] SceneFactoryは、自動運転環境での手続き的なシーン構築、物理ベースのマルチエージェントシミュレーション、RLのためのGPUベクター化されたプラットフォームである。
SceneFactoryはOpen Motionのロードトポロジをシミュレーション可能なUSDの世界に変換し、1つのGPU上で複数の世界を同時に実行し、それぞれに複数の関節化したPhysX車両を投入し、降水と路面型をPhysX材料の摩擦係数にマップする。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:23:11 GMT)
Towards multi-modal forgery representation learning for AI-generated video detection and localization [8.4] AI生成ビデオは、意味的歪みと誤用のリスクをエスカレートする。
既存のAI生成ビデオ検出器の多くは、データモデリングの単一または部分モダリティによって制限されている。
本稿では,LMMセマンティックブランチと時間的ビデオ(ST)ビジュアルブランチ,マルチスケール部分スプーフ(PS)オーディオブランチを統合したコアアーキテクチャを提案する。
このマルチモーダルアプローチは、部分的に操作されたAI生成ビデオの同時検出と微細な時間的局所化を可能にする。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:35:50 GMT)
Distributional simplicity bias and effective convexity in Energy Based Models [8.3] エネルギーに基づく学習は生成モデリングの強力な枠組みであるが、その訓練は本質的に非機械的である。
本稿では,実効モデルのレンズを用いたエネルギーベース学習の動的解析について述べる。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:08:00 GMT)
MARLaaS: Multi-Tenant Asynchronous Reinforcement Learning as a Service [8.3] MARL(Multi-tenant Asynchronous RL as a Service)は、複数のユーザとタスクをまたがる並列RL微調整システムである。
当社のアプローチは,(1)軽量なLoRAアダプタを用いてテナント間でベースモデルを共有すること,(2)ロールアウト生成,環境相互作用,ポリシートレーニングを独立的にスケジュールされた段階に分離する分散非同期アーキテクチャである。
マルチタスク環境では、MARLはシングルタスクの最先端性能を達成し、加速器の使用率を最大4.3倍に改善し、エンドツーエンドのトレーニング時間を85%短縮する。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:20:24 GMT)
Unsafe by Flow: Uncovering Bidirectional Data-Flow Risks in MCP Ecosystem [8.2] モデルコンテキストプロトコル(MCP)は、LCMエージェントと外部ツールのインターフェース層として急速に成長しています。
要求制御された引数は機密操作に伝播しうるが、信頼できない外部または機密な内部データが表面化する。
MCP-BiFlowは,MPP対応のエントリポイントリカバリ,プロトコル固有のテナントモデリング,および相互の伝搬解析を中心に構築された静的解析フレームワークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:03:51 GMT)
Insider Attacks in Multi-Agent LLM Consensus Systems [8.2] マルチエージェントコンセンサスシステムにおけるインサイダー操作について検討する。
そこで本稿では,良性エージェントの潜在行動状態上でのサロゲートダイナミクスを学習する世界モデルベースのフレームワークを提案する。
予備的な結果は、訓練された攻撃者は、良心的コンセンサス率を減らし、直接悪質なプロンプトベースラインよりも、より効果的に不一致を延長することを示している。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:10:22 GMT)
A meshfree exterior calculus for generalizable and data-efficient learning of physics from point clouds [8.2] 点雲上の物理構造保存記述を学習するためのメッシュフリー外部計算(MEEC)を導入する。
私たちは、解像度、ジオメトリ、物理パラメータをまたいで転送するデータ効率のサロゲートであるMEEC-Netを構築するのに使用しています。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:59:40 GMT)
Rebalancing gradient to improve self-supervised co-training of depth, odometry and optical flow predictions [8.1] 我々は、勾配の配置を動的に適応させることにより、協調学習ネットワークの協調性を改善するアプローチであるCoopNetを提案する。
KITTIとCityScapesのデータセットの比較評価では、CoopNetは深度、計測、光学フローの予測において最先端の改善または同等であることを示している。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:12:47 GMT)
Improved monocular depth prediction using distance transform over pre-semantic contours with self-supervised neural networks [8.1] 本研究では, 空間情報を向上させる手法として, プレセマンティックな輪郭に距離変換を適用した手法を提案する。
提案手法は, プレセマンティックな輪郭, 深さ, エゴモーションを共同で推定する。
この文脈において,距離変換が最適分散増強手法であることを理論的に実証する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:20:10 GMT)
Training-Induced Escape from Token Clustering in a Mean-Field Formulation of Transformers [8.1] トランスフォーマーは、層間でトークン表現を反復的に変換することで推論を行う。
トランスフォーマー力学の最近の平均場理論は、どのようにトークン分布をクラスタリングに導くかを説明する。
本稿では,パラメータ線形FFNのみをL2$正規化の下でトレーニングする雑音平均場変換器を用いて,この問題を考察する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:12:13 GMT)
EyeCue: Driver Cognitive Distraction Detection via Gaze-Empowered Egocentric Video Understanding [8.1] EyeCueは、視線を駆使したエゴセントリックなビデオ理解フレームワークで、ドライバーの認知的気晴らしを検出する。
重要な洞察は、認知的気晴らしが視線と視覚的コンテキストの相互作用に現れることである。
既存のデータセットのスケールと多様性の制限に対処するため、包括的マルチシナリオデータセットであるCogDriveを紹介します。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:20:20 GMT)
SLAM: Structural Linguistic Activation Marking for Language Models [8.1] 我々は、トークン周波数ではなく構造幾何学にマークを書くことで、このコストを助長する新しいホワイトボックス透かし方式SLAMを提案する。
Gemma-2Bおよび9Bでは、SLAMは1-2の報酬ポイントのみの品質コストで100%検出精度を達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:19:21 GMT)
SafeTune: Search-based Harmfulness Minimisation for Large Language Models [8.0] LLM(Large Language Models)が広く採用されると、その応答の潜在的有害性に対する懸念が高まる。
本稿では,多目的探索に基づく有害性軽減手法であるSafeTuneを提案する。
初期評価の結果, SafeTune はQwen3.5 0.8B による有害反応の頻度を著しく低減し, 迅速な応答性を高めることが示唆された。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:15:42 GMT)
A Qualitative Test-Risk Mechanism for Scaling Behavior in Normalized Residual Networks [7.9] 正規化残差ネットワークにおけるスケーリング挙動について検討する。
残差深度拡大により試験性能が向上する定理駆動機構が発見された。
より広い意味では、スケーリングは本質的に共同である、と彼らは示唆している。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:07:44 GMT)
Tool Calling is Linearly Readable and Steerable in Language Models [7.9] ツール呼び出しエージェントが間違ったツールを選択すると、実行まで失敗は見えない。
Gemma 3、Qwen 3、Qwen 2.5、Llama 3.1の12の命令調整モデルを使用します。
選択したツールの同一性は、モデル内で線形で、管理可能であることが分かりました。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:47:08 GMT)
Flatness and Gradient Alignment Are Both Necessary: Spectral-Aware Gradient-Aligned Exploration for Multi-Distribution Learning [7.8] マルチディストリビューション・ラーニング・セッティングにおいて,平坦性と勾配のアライメントを考慮すべきであることを示す。
両用語を対象とするSAGE(Spectral-Aware Gradient-Aligned Exploration)を提案する。
5つの領域一般化と2つのマルチタスク学習ベンチマーク実験により,提案手法が新たな最先端技術を確立することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:52:34 GMT)
On the Tradeoffs of On-Device Generative Models in Federated Predictive Maintenance Systems [7.8] Federated Learning(FL)は、分散IoT(Internet of Things)環境上のクライアントデータのオーナシップとコントロールを保護するための、有望なパラダイムとして登場した。
Variversa Autoencoders (VAE)、Generative Adrial Networks (GAN)、Diffusion Models (DM)などの生成モデルの最近の進歩は、時系列解析における教師なし異常検出の新しい機会を提供する。
本稿では,予測保守(PdM)の文脈におけるVAE,GAN,DMの包括的分析について述べる。
部分的コンポーネント共有を原則的メカニズムとして定式化するフェデレーション生成モデルのための新しい分類法を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:20:22 GMT)
Beyond Defenses: Manifold-Aligned Regularization for Intrinsic 3D Point Cloud Robustness [7.7] 古典的逆説と点雲の内在的構造を結びつける3次元ロバストネスの幾何学的解釈を開発する。
そこで本研究では, 固有摂動にまたがる予測を整列させることにより, 潜時幾何学を規則化するフレームワーク, Manifold-Aligned Point Recognition (MAPR) を紹介する。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:02:53 GMT)
Tracing the Arrow of Time: Diagnosing Temporal Information Flow in Video-LLMs [7.7] フレーム中心のエンコーダは、フレーム中心のエンコーダがそうでないのに対し、ビデオ中心のテンポラリなテンポラリなモデリングによるエンコーダが強いテンポラリなテンポラリなテンポラリなテンポラリなテンポラリなテンポラリな信号をエンコードしている。
ビデオ中心の表現が標準のVideo-LLMアーキテクチャに渡すと、パフォーマンスが崩壊し、時間的情報フローのボトルネックが明らかになる。
我々は、時間対応ビデオ中心エンコーダ、時間保存プロジェクタ、およびAoT監督を備えたビデオLLMを構築し、AoT$_PPB$での人間のパフォーマンスを98.1%精度で上回る。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:40:08 GMT)
SACHI: Structured Agent Coordination via Holistic Information Integration in Multi-Agent Reinforcement Learning [7.7] 局所的な観測を行うマルチエージェント強化学習エージェントは、基本的な情報ボトルネックに直面している。
エージェント間の協調グラフ上でグラフトランスフォーマーが畳み込み、アクション選択前のチームメイトからのコンテンツ依存信号で各エージェントの表現を豊かにする、全体情報統合(SACHI)によるテキスト構造化エージェントコーディネーションを提案する。
SACHIは、全てのタスクにおいて最高のベースラインを一貫して一致または上回る、厳密な統計分析、例えばブートストラップ信頼区間の正規化メトリクス、フリードマンランキング、パフォーマンスプロファイリングは、この利点が統計的に有意であり、環境全体にわたって堅牢であり、モデルキャパシティの増加に起因するものではないことを確認している。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:00:34 GMT)
HEART: Hyperspherical Embedding Alignment via Kent-Representation Traversal in Diffusion Models [7.7] HEARTは、Kent対応の測地線変換をハイパースフィア上で直接実行する、トレーニング不要のフレームワークである。
その結果,線形から球面への視点の変化は,高速かつ制御可能な画像生成を可能にすることがわかった。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:32:44 GMT)
Statistical inference with belief functions: A survey [7.7] 信念関数は、不確実性の数学的特徴付けのための強力で一般的なフレームワークである。
信念関数に基づく推論連鎖の最初のステップは推論であり、利用可能なデータから信念測度を学ぶ方法である。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:46:18 GMT)
PLACO: A Multi-Stage Framework for Cost-Effective Performance in Human-AI Teams [7.6] 人間は、AIアシストを使用することで、これまでなかったほど、仕事のペースが加速したことを発見している。
最終出力が単一のハードラベルである分類タスクでは、人間とモデルの出力の組み合わせに対処することが不可欠である。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:54:46 GMT)
Online Goal Recognition using Path Signature and Dynamic Time Warping [7.6] 本稿では,パスシグネチャを活用したオンラインゴール認識手法を提案する。
実験により,本手法は予測精度とオンライン計画効率において,常に技術状況を上回る性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:45:14 GMT)
How Far Are VLMs from Privacy Awareness in the Physical World? An Empirical Study [7.5] VLM(Vision-Language Models)は、エンボディされたアシスタントのための自律的な認知コアとして、ますます多くデプロイされている。
ImmersedPrivacyはリアルな物理的環境をシミュレートするインタラクティブな音声視覚評価フレームワークである。
12の最先端モデルを評価すると、一貫した欠点が明らかになる。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:54:08 GMT)
Breaking QAOA's Fixed Target Hamiltonian Barrier: A Fully Connected Quantum Boltzmann Machine via Bilevel Optimization [7.5] この研究は、量子近似最適化アルゴリズム(QAOA)の従来の回路を2レベル最適化アーキテクチャに拡張する。
その結果,QAOA回路の単一層(p=1)のみを用いて,優れた性能を示すことがわかった。
このモデルは、ノイズが現在の主流の商用量子コンピューティングデバイスの上限を超える場合であっても、強い堅牢性を維持する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:20:33 GMT)
Bilevel Graph Structure Learning, Revisited: Inner-Channel Origins of the Reported Gain [7.5] 両レベルグラフ構造学習は、モデルパラメータと学習グラフ構造を協調最適化することにより、グラフニューラルネットワークを改善するために広く理解されている。
インナーループのトレーニング効果は、リライト自体ではなく、その利益のかなりの部分を占めていることが分かりました。
本稿では,二値グラフ構造を標準化した診断法としてフリーズ・ドルを提案し,グラフ蒸留をメソッドに依存しない補体として学習する。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:46:44 GMT)
A Production-Ready RL Framework for Personalized Utility Tuning with Pareto Sweeping in Pinterest Recommender Systems [7.4] 大規模レコメンデータは、複数の予測結果を1つのユーティリティスコアに組み合わせることで、多目的トレードオフを符号化する。
PRL-PUTS(PRL-PUTS)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:48:49 GMT)
Dooly: Configuration-Agnostic, Redundancy-Aware Profiling for LLM Inference Simulation [7.4] プロファイルベースのシミュレータは標準的なツールだが、特定の設定に設定した操作をハードコードし、スクラッチからすべての操作を再認識する。
それぞれの操作の入力次元はモデル構成によって固定されるか、受信要求によって決定される。
構成に依存しない冗長性を考慮したプロファイリングを実現するために,この構造を利用するDoolyを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:44:47 GMT)
A Call to Lagrangian Action: Learning Population Mechanics from Temporal Snapshots [7.3] 古典力学、量子力学、勾配流を含む二階力学のクラスを定式化する。
次に,WLMをラグランジアンを指定せずに観測された境界値からこれらの2次ダイナミクスを学習するアルゴリズムとして提案する。
個体群力学を直接学習することで、WLMは未確認の限界を予測および補間できると同時に、渦力学、胚発生、群れなど、幅広い力学において、既存の勾配流とフローマッチング法より優れている。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:21:17 GMT)
Learnability and Competition in High-Dimensional Multi-Component ICA [7.2] ICA(Independent Component Analysis)は、教師なし表現学習のためのツールである。
我々は,多成分オンラインICAにおける平均場理論を体系的に開発する。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:24:42 GMT)
Generalized Wasserstein Flow Matching: Transport Plans, Everywhere, All at Once [7.2] 確率測度上の確率測度の空間にフローマッチングを拡張し、WoW(Wasserstein-on-Wasserstein)の定式化を導入する。
輸送計画に対する対策は, メタ測定フローを実現する速度場を自然に誘導することを示す。
我々のフレームワークは既存のクラウドとセット生成のアプローチを統一し拡張し、WoW空間における生成モデリングの実践的かつ理論的基礎的な手法を提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:33:36 GMT)
CRAFT: Forgetting-Aware Intervention-Based Adaptation for Continual Learning [7.2] CRAFTは、モデルの重み付けの更新を避ける継続的学習フレームワークである。
まず、各タスクを出力分布のばらつきに基づいて、類似したタスクのグループにルーティングする。
すると、KL(Kullback-Leibler)の偏差をグループの先行状態に対して微調整する。
最後に、更新されたタスクの介入を同じKL信号を使用して共有表現にマージする。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:10:34 GMT)
Characterizing and Correcting Effective Target Shift in Online Learning [7.1] カーネル回帰の文脈におけるオンライン学習とオフライン学習の関係について検討する。
オンラインカーネルベースの学習は,この学習信号の効果的なシフトを目標修正によって補うことで,オフラインの学習と同一の予測器を確実に学習できることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:34:10 GMT)
AudioFace: Language-Assisted Speech-Driven Facial Animation with Multimodal Language Models [7.1] 音声駆動型顔アニメーションは、音響信号と顔の動きの正確な対応を必要とする。
音声駆動型ブレンドシェープ生成のための言語支援フレームワークであるAudioFaceを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:23:29 GMT)
EmambaIR: Efficient Visual State Space Model for Event-guided Image Reconstruction [7.0] EmambaIRは、空間的にスパースで時間的に連続したイベントストリームを用いた画像再構成のために設計された、効率的な視覚状態空間モデルである。
我々のフレームワークでは、TSAM(Top-k Sparse Attention Module)とGSSM(Gated State-Space Module)という2つの重要なコンポーネントを導入しています。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:56:01 GMT)
Multiple Bulk-Boundary Correspondences and Anomalous Modes in a Non-Hermitian Creutz Ladder [7.0] 利得損失と非相反性の両方を組み込んだ非エルミートクロイツはしごについて検討する。
我々は、スケールフリー、ノーマル、異常なスキンモード、トポロジカルゼロエネルギーモードを含む複数のBBCを構築した。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:21:16 GMT)
Systematic frequency-collision analysis of the cross-resonance gate outside the straddling regime [6.9] CRゲートはクビット周波数拡散に敏感である。
従来の階層構造は、クォービットの割り当てを厳しく制限し、周波数衝突の影響を受けやすくする。
本研究では, 階層構造の設計と比較して, 遠距離設計は衝突を著しく減少させることを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:27:24 GMT)
Spherical Flows for Sampling Categorical Data [6.9] 連続埋め込み空間における離散列生成モデルの学習問題について検討する。
実験では、VMF経路を測地線とユークリッドの代替法と比較した。
vMFとPCサンプリングの組み合わせは、スドゥークと言語モデリングの結果を大幅に改善する。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:05:22 GMT)
MedExAgent: Training LLM Agents to Ask, Examine, and Diagnose in Noisy Clinical Environments [6.8] 臨床診断は部分観察可能なマルコフ決定プロセス (POMDP) として, 患者への質問, 検査をツールコールとして行うこと, 診断を発行することの3つのアクションタイプで定式化した。
臨床面接のためのCalgary-Cambridgeモデルにより構築された合成会話を教師付き微調整する2段階パイプラインを用いて,効果的な診断剤MedExAgentを訓練する。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:12:23 GMT)
OralMLLM-Bench: Evaluating Cognitive Capabilities of Multimodal Large Language Models in Dental Practice [6.8] マルチモーダル大言語モデル (MLLM) は, 歯科画像解析において有望なパラダイムとして出現している。
歯科用X線写真解析におけるMLLMの認知能力を評価するためのベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:08:56 GMT)
Multi-Level Graph Attention Network Contrastive Learning for Knowledge-Aware Recommendation [6.8] マルチビューグラフコントラスト学習フレームワークを提案する。
提案手法は,多視点知識グラフ蒸留によりユーザ表現を向上させる。
我々は3つの視点で比較を行う自己教師付きコントラスト学習モジュールを設計する。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:28:27 GMT)
Built Environment Reasoning from Remote Sensing Imagery Using Large Vision--Language Models [6.7] 本研究では,スマートシティにおけるタスクにおける大規模言語モデル(LLM)の利用について検討する。
中心となる考え方は、リモートセンシング画像を利用して構築された環境を特徴付けることである。
マルチモーダル言語モデリングのための入力として,複数の空間スケールでのリモートセンシング画像について検討する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:10:30 GMT)
Efficient Data Selection for Multimodal Models via Incremental Optimization Utility [6.7] 本稿では,データ選択をインクリメンタルな最適化ユーティリティランキング問題として再定義するフレームワークであるOne-Step-Train(OST)を提案する。
トップ50サブセットを選択することで、OSTはトレーニングコストを43%削減し(トータルタイム消費は17)、強力なLCM-as-a-Judgeベースラインを1.8ポイント上回る。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:28:26 GMT)
Can I Check What I Designed? Mapping Security Design DSLs to Code Analyzers [6.6] セキュリティの専門家でさえ、この関係について完全には理解していないことを示す。
66個の設計レベルのセキュリティDSLと,36個のコードレベルのアナライザによる559個のセキュリティチェックについて検討する。
設計レベルと実装レベルのセキュリティには共通点がほとんどないことを学びました。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:46:51 GMT)
HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning for Parallel Multimodal Search Agents [6.5] 視覚的接地と検索を1つのアトミックアクションに融合させる並列マルチモーダル検索エージェントHyperEyesを提案する。
6つのベンチマークで、HyperEyes-30Bは最上位のオープンソースエージェントを9.9%上回り、平均5.3倍のツールコールラウンドを減らした。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:16:08 GMT)
LLM Wardens: Mitigating Adversarial Persuasion with Third-Party Conversational Oversight [6.5] 隠れた目標を持つ敵のLSMは、ユーザの決定を65.4%に抑えることに成功している。
次に,人間とAIのインタラクショントレースをリアルタイムで監視し,ユーザに対して非拘束的かつプライベートなアドバイザリを発行する第2のLCMを導入する。
これらの結果のメカニズムを解明するため、14の意思決定シナリオにまたがるシミュレーションベンチマークであるCOAX-Benchをリリースする。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:23:47 GMT)
Sanity Checks for Long-Form Hallucination Detection [6.5] 大規模言語モデルに対する幻覚検出法は、連鎖的推論トレースで機能するが、それらが推論自体を評価するか、あるいは最終回答の表面相関を単に活用するかは定かではない。
提案手法では,各応答の最終回答を基本的真理に置き換えるtextscForce と,軌道を無傷で残しながら回答発表ステップを除去する textscRemove という2つのオラクルテストを通じて,この区別を明らかにする制御不変性手法を導入する。
このことは、彼らの予測力が構造からではなく、答えレベルの成果物に由来するかどうかを明らかにする
論文参考訳(メタデータ) (Fri, 08 May 2026 18:00:58 GMT)
AGA3DNet: Anatomy-Guided Gaussian Priors with Multi-view xLSTM for 3D Brain MRI Subtype Classification [6.4] AGA3DNetは,放射線学報告から抽出した短い解剖学的フレーズを軟解剖学的先行チャネルとして組み込んだ報告基盤フレームワークである。
AGA3DNetは、パフォーマンス指標間の全体的なバランスを改善し、前回のチャネルを通じて臨床解釈可能なローカライゼーションをサポートする。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:21:26 GMT)
Change My View? The Dynamics of Persuasion and Polarization in Online Discourse [6.4] 我々は、Redditのr/ChangeMyViewに関する議論のコーパスを分析するために、大きな言語モデルを使用します。
有効な公開推論は、明らかなコンテンツと同じくらい、リレーショナルフレーミングに依存している。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:40:51 GMT)
Test-Time Compositional Generalization in Diffusion Models via Concept Discovery [6.4] 事前学習された拡散モデルにより,学習した時間インデクシングスコアからクエリ固有の概念が検出可能であることを示す。
分析用PoEサンプリングと低ランク適応モデルの両方がクエリ専用で、最も訓練されたクラスベースラインより優れている。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:53:53 GMT)
Trapping Attacker in Dilemma: Examining Internal Correlations and External Influences of Trigger for Defending GNN Backdoors [6.3] 提案するPRAETORIANは,有効なGNNバックドアの本質的な要求をターゲットとした,新たな防衛法である。
私たちのキーとなる観察は、被害者ノードの予測をひっくり返すには、被害者に大きな影響を与える必要があるということです。
評価全体では、PRAETORIANは平均攻撃成功率(ASR)を0.55%まで下げるが、精度は0.62%しか低下しない(CA)。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:02:25 GMT)
SAFformer:Improving Spiking Transformer via Active Predictive Filtering [6.3] スパイキングニューラルネットワーク(SNN)は、生物学的可視性とエネルギー効率において顕著な利点を提供する。
本稿では,アクティブな予測フィルタリングパラダイムに基づく新しいスパイキングトランスフォーマーアーキテクチャであるSAFformerを提案する。
実験の結果、SAFformerはCIFAR-10/100とCIFAR10-DVSで最先端の性能を確立した。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:17:52 GMT)
CA-SQL: Complexity-Aware Inference Time Reasoning for Text-to-SQL via Exploration and Compute Budget Allocation [6.3] 現在のText-to-BIRDソリューションは、Bird-Benchベンチマークの最も難しいタスクでうまく機能するのに苦労しています。
これは不適切な解空間探索によるものである。
本稿では,探索の幅を動的に拡大して解候補を生成する新しいテキスト・ツー・BIRDパイプラインを提案する。
提案手法は,BIRD 開発セット問題における「混み合う」階層において,51.72%の最先端スコアを達成している。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:44:15 GMT)
A Behavioral Framework for Data-Driven Modeling of Nonlinear Systems in Vector-Valued Reproducing Kernel Hilbert Spaces [6.3] 我々は、ベクトル値再生核ヒルベルト空間(RKHS)における離散時間非線形系のクラスに対するヤン・ウィレムスの行動的アプローチを一般化する。
提案手法は,未知のシステムのシミュレーションや制御目的を明示的なシステム識別ステップなしで行う場合など,そのようなシステムのデータ駆動モデリング問題に適用する。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:00:35 GMT)
SkillLens: Adaptive Multi-Granularity Skill Reuse for Cost-Efficient LLM Agents [6.3] SkillLensは階層的なスキル進化フレームワークで、スキルをポリシー、戦略、手順、プリミティブの4層グラフにまとめる。
セマンティックなスキルシードを検索し、スキルグラフの次数補正されたランダムウォークを通じて拡張し、各訪問したユニットが受け入れられ、分解され、書き直され、スキップされるかどうかを検証器を使って決定する。
MuLocbenchとALFWorld全体で、SkillLensは、強いスキルベースのベースラインよりも一貫して改善されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:48:04 GMT)
Adaptive Negative Reinforcement for LLM Reasoning:Dynamically Balancing Correction and Diversity in RLVR [6.3] 検証可能な報酬(RLVR)を用いた強化学習は,大規模言語モデル(LLM)の推論能力向上に有効な方法となっている。
最近の研究では、NSR(Negative Sample Reinforcement)がPPOやGRPOのようなより複雑なフレームワークのパフォーマンスに適合または超えることが示されている。
我々は,NSRフレームワークの拡張として,適応型負のサンプル強化と信頼度重み付き負の強化の2つを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:13:33 GMT)
CarCrashNet: A Large-Scale Dataset and Hierarchical Neural Solver for Data-Driven Structural Crash Simulation [6.3] textscCarCrashNetは、データ駆動構造クラッシュシミュレーションのためのオープンソースのベンチマークである。
textscCrashrは、高分解能有限要素衝突データから全車衝突予測のために設計された機械学習モデルである。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:28:12 GMT)
SAGE: Hierarchical LLM-Based Literary Evaluation through Ontology-Grounded Interpretive Dimensions [6.2] 文学的品質を評価するには、文化的表現、感情的な深さ、哲学的洗練などの解釈的な側面を評価する必要がある。
本稿では,文学的品質を分かりやすい解釈次元に分解する階層的評価フレームワークであるSAGEを紹介する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:30:02 GMT)
Spectrum-Adaptive Generalization Bounds for Trained Deep Transformers [6.2] 多層変圧器のスペクトル適応ポストホック境界を導出する。
この結果から, 学習用トランスフォーマーのスペクトル構造が解析にどのように反映されているかが示唆された。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:08:25 GMT)
LLMSYS-HPOBench: Hyperparameter Optimization Benchmark Suite for Real-World LLM Systems [6.2] 大規模言語モデル(LLM)システムは、多くのアプリケーションドメインにおけるAIのフロンティアである。
本稿では,実世界のLLMシステムのHPOのためのベンチマークスイートとデータセットについて述べる。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:53:03 GMT)
Bounded Fitting for Expressive Description Logics [6.1] 境界フィッティングはラベル付きデータ例から論理式を学ぶための魅力的なパラダイムである。
本研究では,ALCを逆の役割,有資格数制限,特徴比較で拡張する表現的記述論理の学習概念に対する有界適合性について検討する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:59:52 GMT)
What If We Let Forecasting Forget? A Sparse Bottleneck for Cross-Variable Dependencies [6.1] 多変量時系列予測は多くの現実世界システムにおいて重要である。
実際のデータの依存関係は、しばしば状態に依存し、うるさい。
キャパシティ限定情報フローとして変数間相互作用を明示的にモデル化するスパース・ブートネック・フレームワークであるMS-FLOWを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:16:41 GMT)
Creating and Evaluating K-12 GenAI Assessment Graders Through Context Engineering [6.1] 大型言語モデル(LLMs)の教育評価への統合は、教室のグレーディングの実践の変革的な変化を表している。
本稿では,LLMグレーダの理論的基礎を検証し,商業的に利用可能な基礎モデルとコンテキストを併用し,学生の作業の成果をルーリックに対して評価する手法を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:32:43 GMT)
BRIDGE: Background Routing and Isolated Discrete Gating for Coarse-Mask Local Editing [6.1] 粗いマスクのローカル画像編集は、周囲のシーンを保存しながら、ユーザが指定した領域を変更するモデルを要求する。
本研究では,この障害をマスク形状バイアスとして検討し,そのタスクを2次元制約によりフレーム化する。
Bridgeはこの設定に対処するため、DiTバックボーンの外側にマスクを置き、構築とブレンディングをサポートし、DiT内部マスク注入やコピーコントロールブランチを避ける。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:09:11 GMT)
Distill, Diffuse, and Semanticize (DDS): Annotation-Free 3D Scene Understanding Based on Multi-Granularity Distillation and Graph-Diffusion-Based Segmentation [6.1] 3Dセマンティックなシーン理解は、デジタル双生児、自律運転、スマート農業、そして知覚の具体化に広く応用されている。
最近のアノテーションのない手法は手動の3Dラベルなしで意味領域を発見できるが、それらはしばしばオブジェクトレベルの一貫性の弱さに悩まされる。
本稿では,多粒度蒸留とグラフ拡散に基づくセグメンテーションに基づくアノテーションのない3次元シーン意味理解手法を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:39:59 GMT)
VecCISC: Improving Confidence-Informed Self-Consistency with Reasoning Trace Clustering and Candidate Answer Selection [6.1] VecCISCは軽量で適応的なフレームワークで、意味的類似性の尺度を使って推論トレースをフィルタする。
VecCISCはトークンの総使用量を47%削減し、CISCの精度を維持したり超えたりしている。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:54:38 GMT)
Learned Lagrangian Models of PDEs via Euler-Lagrange Residual Minimization [6.1] 学習された連続ラグランジアンを直接使用して、偏微分方程式によって支配される系の力学を予測する最初の方法を提案する。
我々は、二乗オイラー・ラグランジュ残差を最小化する最適化に基づく積分器を開発する。
我々は,2次元振り子,1次元波動方程式,2次元波動方程式の学習表現に対するアプローチを検証した。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:43:11 GMT)
STEPS: A Temporal Smooth Error Propagation Solver on the Manifolds for Test-Time Adaptation in Time Series Forecasting [6.1] Test-Time Adaptation (TTA) は、推論中に限られた観測値を用いて、分布シフトの下での時系列予測を改善することを目的としている。
既存の方法は、明らかなプレフィックスがスパースまたは汚染されたときに、弱い識別性、エラーの蓄積、不安定なロングホライゾン補正に悩まされることがある。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:58:10 GMT)
Reliable Chain-of-Thought via Prefix Consistency [6.1] 正しい回答を持つトレースは、間違った回答を持つトレースよりも、元の回答を頻繁に再現する。
この違いを信頼性信号、プレフィックス一貫性として使用し、各候補の回答を再生の頻度によって重み付けします。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:28:05 GMT)
ReasonSTL: Bridging Natural Language and Signal Temporal Logic via Tool-Augmented Process-Rewarded Learning [6.0] textscReasonSTLは、自然言語からSTL生成にローカルのオープンソース言語モデルを適用するツール拡張フレームワークである。
textscReasonSTLは、翻訳プロセスを明示的な推論、決定論的ツール呼び出し、構造化された公式構成に分解する。
実験により、textscReasonSTLでトレーニングされた4Bモデルは、自動測定と人的評価の両方で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:38:45 GMT)
LLMSpace: Carbon Footprint Modeling for Large Language Model Inference on LEO Satellites [5.9] 大規模言語モデル(LLM)は急速にエネルギー需要を増大させ、大規模な推論によってエネルギーと炭素危機を生じさせる。
本稿では,AI対応LEO衛星上でのLCM推論のための最初の炭素モデリングフレームワークである textitLLMSpace を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:30:19 GMT)
TriP: A Triangle Puzzle Approach to Robust Translation Averaging [5.9] 本稿では,TriPを提案する。TriPはトライアングルをベースとした,ロバストな翻訳平均化のためのフレームワークである。
三角形にまたがる高次整合性を活用することにより, 提案手法は, 逆数, サイクル整合性, その他の構造的腐敗に対して頑健である。
実用面では、TriPは完全に並列化可能で、計算効率が良く、数百万台のカメラでグラフに自然にスケーラブルである。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:21:51 GMT)
GLiGuard: Schema-Conditioned Classification for LLM Safeguard [5.9] LLMコンテンツのモデレーションにGLiNER2を応用した双方向エンコーダである textbfGLiGuard を導入する。
キーとなるアイデアは、タスク定義とラベルのセマンティクスを直接、構造化トークンスキーマとして入力シーケンスにエンコードすることだ。
GLiGuardは、23-90$times$小さながら、7B--27Bデコーダベースのガードと競合するF1スコアを達成した。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:44:07 GMT)
Similar Pattern Annotation via Retrieval Knowledge for LLM-Based Test Code Fault Localization [5.9] ソフトウェアの失敗は、欠陥のあるシステムテストスクリプトから生じます。
テストコードフォールトローカライゼーション(TCFL)は、継続的インテグレーション環境において重要であるにも関わらず、はるかに注目されていない。
本稿では,CI環境から蓄積したデバッグ知識をLarge Language Model (LLM)ベースのTCFLに統合するフレームワークであるSPARKを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:20:58 GMT)
LoHGNet: Infrared Small Target Detection through Lorentz Geometric Encoding with High-Order Relation Learning [5.9] 赤外線小目標検出 (IRSTD) は, 有用な目標手がかりの不足と, 重度のバックグラウンド・クラッタの存在が原因で, 依然として困難である。
我々は、ローレンツ幾何符号化と高次関係学習を統合したIRSTDネットワークであるLoHGNetを提案する。
LoHGNetは、複雑なシーンに対する検出精度と適応性の両方において競合性能を達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:00:34 GMT)
Discovering Sparse Counterfactual Factors via Latent Adjustment for Survey-based Community Intervention [5.8] 交通調査は、旅行の好みや採用障壁を理解するために広く利用されている。
本研究は,調査回答からスパース・デファクト・コミュニティの介入について考察する。
我々は、このタスクを政策実現可能な分布アライメント問題として定式化する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:15:41 GMT)
PolySQL: Scaling Text-to-SQL Evaluation Across SQL Dialects via Automated Backend Isomorphism [5.8] Polylectは、正規化の実行結果を比較することで、クエリのトランスパイルを不要にする、新しいデュアルエグゼバスト方式である。
本研究により,他の方言からの平均精度が10.1%低下し,重要な方言難易度階層が同定された。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:32:44 GMT)
Sensitivity-Based Robust NMPC for Close-Proximity Offshore Wind Turbine Inspection with a Tilted Multirotor [5.7] オフショア風力タービン検査は、風下にある大きな円筒形構造物の周囲の厳密なクリアランス制御を必要とする。
傾き型マルチロータのための感度ベースロバストNMPCを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:11:52 GMT)
Evaluating Developmental Cognition Capabilities of LLMs [5.6] 自己管理テキストにおける発達信号の抽出を目的とした発達文補完テスト(DSCT)。
トップフロンティアモデルはシミュレーションされたペルソナの高精度なラベルを復元する。
実際のヒトDSCT反応では、人間とLLMの合意は公正であり、正確な合意よりもその近傍の方がはるかに強い。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:19:02 GMT)
GameGen-Verifier: Parallel Keypoint-Based Verification for LLM-Generated Games via Runtime State Injection [5.6] GameGen-Verifierは、仕様を検証可能なキーポイントに分解し、それらを独立した検証ユニットに分類する。
VeriGameでは、7つのジャンルにまたがる100のゲームのデータセットであるGameGen-Verifierが、人間の判断に対して最大92.2%の精度を達成した。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:46:59 GMT)
TopoFisher: Learning Topological Summary Statistics by Maximizing Fisher Information [5.5] 永続化図は、幾何学的および位相的構造の安定で解釈可能な要約を提供する。
しかし、永続性に基づくパイプラインは手作業によるフィルタリング、ベクトル化、圧縮機を必要とする。
textbfTopoFisherは,局所ガウスフィッシャー情報を最大化することでトポロジ的な要約を学習する,微分可能な永続ホモロジーパイプラインである。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:25:25 GMT)
Effective Explanations Support Planning Under Uncertainty [5.5] 本稿では,発話を行動計画に変換する計算モデルを提案する。
大きな言語モデルは、説明をプログラムのようなガイダンスに変換する。
得られたパスの効率性と信頼性から説明を行う。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:12:14 GMT)
ShellfishNet: A Domain-Specific Benchmark for Visual Recognition of Marine Molluscs [5.5] 貝の生物多様性は沿岸生態系にとって深刻な脅威である。
ShellfishNetは、実世界の生態モニタリング制約に対する包括的なイメージベンチマークデータセットである。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:42:55 GMT)
TCMIIES: A Browser-Based LLM-Powered Intelligent Information Extraction System for Academic Literature [5.4] 本稿では,学術文献から構造化情報抽出を行うブラウザベースのゼロインストールプラットフォームTCMIIESを提案する。
このシステムは、自動システムプロンプト生成を備えた新しいスキーマ誘導プロンプトフレームワークを採用しており、研究者は独自の抽出スキーマを定義することができる。
従来の漢方医学研究において,複数の抽出シナリオを包括的に評価することで,システムの有効性を実証する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:40:13 GMT)
PRISM: Refracting the Entangled User Behavior Space for E-Commerce Search [5.4] 電子商取引検索システムは、アイテムの関連性とユーザの嗜好を推定するために、ユーザー行動のモデル化に頼っている。
ユーザインタラクションは、露出メカニズム、フィードバックループ、セマンティックマッチングによって共同で形成される。
我々は、eコマース検索行動予測のためのPreference-Relevance Interaction Semantic ModelingフレームワークであるPRISMを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:05:33 GMT)
Conformal-Style Quantile Analyses for Stochastic Bandits [5.4] ACP-UCB1は、上端の適応型コンフォメーション推定とUTB型最適化ボーナスを組み合わせたコンフォメーションスタイルのポリシーである。
ACP-UCB1 と UCB1 を比較し,数値実験を用いて評価と改善を行った。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:44:57 GMT)
MASPrism: Lightweight Failure Attribution for Multi-Agent Systems Using Prefill-Stage Signals [5.3] 我々は,小言語モデル(SLM)のプリフィルステージ信号を用いて,障害帰属を行うフレームワークであるMASPrismを提案する。
MASPrismは各トレースを平均2.66秒で処理し、単一パスのプロンプトベースラインを6.69$times$スピードアップし、出力トークンをゼロにする。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:40:53 GMT)
Open-Ended Task Discovery via Bayesian Optimization [5.2] 本稿では,タスク生成とタスク最適化を交互に行うフレームワークであるGenerate-Select-Refine(GSR)を紹介する。
GSRは最高のタスクの評価に集中し、対数的後悔のオーバーヘッドのみを発生させる。
GSRを新たな製品開発、化学スケーリング分析、特許再取得に適用する。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:43:19 GMT)
Activation Differences Reveal Backdoors: A Comparison of SAE Architectures [5.2] 言語モデルに対するバックドア攻撃は、AIの安全性に重大な脅威をもたらす。
微調整モデルにおけるバックドア関連機能を分離するための2つのスパースオートエンコーダアーキテクチャについて検討する。
Diff-SAEは、バックドアアイソレーションにおいてクロスコーダよりも一貫して、実質的に優れています。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:30:26 GMT)
Accelerated and data-efficient flow prediction in stirred tanks via physics-informed learning [5.2] 本研究は, 産業用大船内定常流場学習におけるトレーニングセットの大きさと予測精度の関係について検討した。
我々は、流れ場の暗黙的な神経表現を訓練し、純粋にデータ駆動型と制約付きの比較を行う。
予測誤差はトレーニングデータの増加に伴って単調に減少するが、中程度のデータセットサイズを超えて明らかに減少するリターンを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:49:40 GMT)
Flow Matching for Count Data [5.2] 本研究では,局所的な単位ジャンプを伴う連続的生死過程に基づくデータカウントのためのフローマッチングフレームワークであるcount-FMを提案する。
シミュレーションにおいて、カウントFMは、かなり少ないパラメータを使用しながら、代表ベースラインよりも優れたサンプル品質を達成する。
さらに、無条件生成、輸送、条件生成のためのscRNA-seqおよびニューラルスパイクトレインデータにカウントFMを適用した。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:53:37 GMT)
Resource-Element Energy Difference for Noncoherent Over-the-Air Federated Learning [5.1] オーバー・ザ・エア・フェデレーション・ラーニング(OTA-FL)は、波形重畳を利用したアップリンク遅延を低減する。
従来のアナログアグリゲーション方式は一般にチャネル状態情報(CSI)、チャネル反転、コヒーレント位相アライメントを必要とする。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:29:14 GMT)
Masks Can Talk: Extracting Structured Text Information from Single-Modal Images for Remote Sensing Change Detection [5.1] 変更ラベルから直接構造化されたテキスト特徴を取得するフレームワークであるS2Mを提案する。
S2Mは17.80%のSekとF$_scd$の66.14%を達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:16:46 GMT)
Self-Consolidating Language Models: Continual Knowledge Incorporation from Context [5.1] 大規模言語モデル(LLM)は、パス、会話、長いコンテキストのストリームとして情報を受け取るようになっている。
本研究では,従来の統合情報との干渉を抑えつつ,現在のコンテキストをモデル重みに書き込む連続的コンテキスト統合について検討する。
textbfSelf-textbf Consolidating textbfLanguage Models (SCoL) は、LLMがテキスト更新命令を生成することを学習する後トレーニングフレームワークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:50:09 GMT)
LLM hallucinations in the wild: Large-scale evidence from non-existent citations [5.1] arXiv、bioRxiv、SSRN、PubMed Centralの250万の論文の1100万件の参照を監査します。
大規模な言語モデルの採用が広まると、既存の参照が大幅に増加します。
これらのエラーは多くの論文に拡散的に埋め込まれているが、特にAIが急速に普及する分野では顕著である。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:26:41 GMT)
How Much Do Circuits Tell Us? Measuring the Consistency and Specificity of Language Model Circuits [5.0] 本研究は, 回路再利用率, タスク内のサンプル単位の回路間で共有されるコンポーネントの割合を測定し, この整合性の2つの少ない特性について検討する。
タスク内再利用は高く,タスクパフォーマンスには共有コンポーネントが不可欠であることが判明した。
しかし、あるタスクの回路を壊すことは、そのタスク自身の回路と同じくらいの性能を損なう。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:01:03 GMT)
Modeling the Impact of Exposed Cases in a Hantavirus Outbreak on a Cruise Ship [5.0] 商業クルーズ船に搭載されたハンタウイルスの出現は、公衆衛生上の重大な懸念を浮き彫りにしている。
本研究では,送信ダイナミクスを推定する離散時間変動型Susceptible-Exposed-Infectious-Recovered-Deadモデルを開発した。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:36:55 GMT)
Topological Characterization of Discrete-Time Classical Stochastic Processes: Dual Role of Point-Gap Topology [4.9] 格子上の離散時間連鎖によって記述された古典的過程の位相的特徴について述べる。
我々はマクスウェルの悪魔の古典的な実験において、指向性輸送の起源を特定する。
我々は、位相的に強制された非マルコフ古典過程がマルコフ量子マスター方程式によってシミュレートできることを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:35:07 GMT)
TRACE: Transport Alignment Conformal Prediction via Diffusion and Flow Matching Models [4.9] 多次元出力に対して有効な情報領域を構築する方法について検討する。
交通路の速度や誤差を平均化することにより,候補出力が学習した生成力学とどの程度一致しているかを計測する。
結果として得られるトランスポートベースのスコアはスカラー値であり、共形予測分割を用いて校正することができる。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:28:57 GMT)
CONTRA: Conformal Prediction Region via Normalizing Flow Transformation [4.9] フロートランシフィケーションの正規化によるコンフォーマル予測領域について紹介する。
精度の高い予測領域を生成するために,CONTRAとその拡張が保証されたカバレッジ確率を維持し,既存の手法より優れていることを示す。
CONTRAは,多次元予測領域の提供という未探索課題に対処し,(条件付き)密度推定に有効なツールである,と結論付けた。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:43:14 GMT)
VISD: Enhancing Video Reasoning via Structured Self-Distillation [4.9] 複雑な推論のためのビデオLLMの訓練は、レベルレベルの報酬の順序と、長期的、時間的基盤の推論軌道上のきめ細かいクレジット割り当ての欠如により、依然として困難である。
ビデオ推論のための診断に意味のある特権情報を導入した自己蒸留フレームワークであるVISDを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:45:43 GMT)
Rethinking Dense Optical Flow without Test-Time Scaling [4.8] 単一の前方通過における高密度光流を推定する枠組みを提案する。
本手法は,凍結したDINO-v2バックボーンから視覚的意味的特徴を抽出し,分子深度基礎モデルから幾何学的手がかりと組み合わせる。
反復的な改善は避けたにもかかわらず、我々の手法は挑戦的なベンチマークで強力なデータセット間一般化を実現している。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:56:24 GMT)
How Big Should a Wireless Foundation Model Be? [4.8] ワイヤレス基盤モデルは、AIネイティブ通信システムの主要な実現手段として急速に発展しつつある。
本研究は,本質的な次元性 (dNL) が基本的なボトルネックとして機能し,データ充足体制に達すると,スケーリング天井が定義されることを示す。
本稿では、衛星チャネルを代表例とする無線AIのスケーリングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:31:25 GMT)
In-Context Fixation: When Demonstrated Labels Override Semantics in Few-Shot Classification [4.7] その結果, 同種ラベルは意味論的に有効なものであっても, 6つのモデルで12%の精度で崩壊することがわかった。
モデルはラベル位置を占めるトークンを、徹底的な回答語彙として扱う。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:20:39 GMT)
Convex Optimization with Nested Evolving Feasible Sets [4.7] 両ケースに対して$o(T)$ regretのオンラインアルゴリズムが$(logT)$の移動コストを持ち、Frugalの最適性を証明していることを示す。
また、$o(T)$ regretのオンラインアルゴリズムは、両方のケースに対して$(logT)$の移動コストを持ち、Frugalの最適性を証明することも示している。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:42:15 GMT)
Multimodal Stepwise Clinically-Guided Attention Learning for Pathological Complete Response Prediction in Breast Cancer [4.7] 病理学的完全反応 (pCR) は, 乳がん患者にネオアジュバント療法を施行する鍵となる予後因子である。
乳房磁気共鳴画像(MRI)を用いたpCR予測のための臨床誘導型注意学習フレームワークを提案する。
このフレームワークは、異種MRIコホート間の外部検証によって評価される。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:34:27 GMT)
SplitZip: Ultra Fast Lossless KV Compression for Disaggregated LLM Serving [4.5] SplitZipは、KVキャッシュ転送のためのGPUフレンドリーな圧縮機である。
SplitZipはKVアクティベーションの浮動小数点指数の冗長性を利用する。
オフラインのトップ16指数コードブックは、オンラインヒストグラムを排除します。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:34:05 GMT)
OphEdit: Training-Free Text-Guided Editing of Ophthalmic Surgical Videos [4.5] OphEditは、眼科手術ビデオのテキストガイド編集のためのトレーニング不要のフレームワークである。
楽器スワップや手続きのバリエーションなどの複雑な外科的変換を処理し、優れた構造的忠実性と時間的整合性を持つ。
本研究は,眼科領域におけるトレーニング不要ビデオ編集の初めての応用例である。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:05:02 GMT)
RuleSafe-VL: Evaluating Rule-Conditioned Decision Reasoning in Vision-Language Content Moderation [4.5] RuleSafe-VLは、コンテンツモデレーションにおけるルール条件決定推論のベンチマークである。
93の原子規則と92の型付き規則関係を定式化し、2,166の文脈依存の画像テキストケースを生成する。
アクティベートされたルールを特定し、ルールのインタラクションを回復し、意思決定の十分性を判断し、不足したコンテキストが供給されると結果を解決する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:05:00 GMT)
Affine Subcode Ensemble Decoding for Degeneracy-Aware Quantum Error Correction [4.5] 安定化器符号のチェック行列に線形独立な行を付加することで、有効な解の探索スペースを削減できることを示す。
我々は、最近提案されたアフィンサブコードアンサンブル復号法を古典から量子環境へ拡張する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:30:02 GMT)
Why do Large Language Models Fail in Low-resource Translation? Unraveling the Token Dynamics of Large Language Models for Machine Translation [4.5] 機械翻訳(MT)における大規模言語モデル(LLM)の故障モードを系統的に解析する。
非英語中心のLPは、英語中心のペアよりもCOMETスコアが低いことが分かりました。
LLMの推論は低TAR言語への変換時により多くのトークンを生成する傾向があり、補償機構が示唆される。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:05:41 GMT)
From 0-Order Selection to 2-Order Judgment: Combinatorial Hardening Exposes Compositional Failures in Frontier LLMs [4.5] 複数選択推論ベンチマークは、進行するモデルからの迅速な飽和とデータ汚染という2つの課題に直面している。
ここでは、0階選択を2階論理判断に決定的に変換する形式的なフレームワークであるLogiHardを紹介する。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:33:58 GMT)
BalCapRL: A Balanced Framework for RL-Based MLLM Image Captioning [4.4] そこで本稿では, 実用意識の正しさ, 参照カバレッジ, 言語品質を協調的に最適化する, よりバランスのとれた強化学習フレームワークを提案する。
提案手法はキャプション品質を常に改善し, ピークゲインは+13.6 DCScore, +9.0 CaptionQA, +29.0 Cap である。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:48:36 GMT)
When Stored Evidence Stops Being Usable: Scale-Conditioned Evaluation of Agent Memory [4.4] 本稿では,エビデンス保存型成長下でのエージェントメモリのスケールコンディション評価プロトコルを提案する。
各クエリに対して、タスクエビデンスが固定され、無関係なセッションが追加される。
このプロトコルはエージェントメモリトラジェクトリをログし、4つの診断結果を報告する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:22:31 GMT)
Improved Model-based Reinforcement Learning with Smooth Kernels [4.3] 本稿では,有限水平条件下でのオンライン強化学習のためのカーネル平滑化モデルに基づく新しい手法を提案する。
カーネル平滑化フレームワークにベルンシュタイン型探索ボーナスを組み込むことで,その地平線への依存度を改良した後悔境界を実現する。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:10:03 GMT)
On the Robustness of Distribution Support under Diffusion Guidance [4.3] 拡散誘導は拡散モデルを用いた制御可能かつ高忠実な試料生成を可能にする強力な技術である。
スコア関数の正確なアクセスを前提として、誘導拡散過程は、ほぼ常に目標支援に近づき続けるサンプルを生成する。
支持体から外れたサンプルは、しばしば構造的に不明瞭であり、下流のタスクに悪影響を及ぼす可能性があるため、この特性は特に望ましい。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:12:02 GMT)
Exactness Matters for Physical Rule Enforcement [4.2] より強い物理ルールの執行がいつ信頼できるか、いつそれが流通シフトの源となるかは、まだ不明である。
この問題は作用素の正確性(すなわち、補修写像が対象多様体上の恒等写像であるかどうか)を通して研究する。
制御ミスマッチ、スクリーニングされたクリーンアップ、アダプティブゲーティング、および外部バックボーンチェックは、最適な近似登録操作ポイントが生またはほぼ同一であることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:59:59 GMT)
When Independent Sampling Outperforms Agentic Reasoning [4.2] 固定予算下での競合プログラミングのための推論時間計算の割り当てについて検討する。
モデル呼び出しのコストと回数の両方の関数として,エージェントベースの推論と反復的な独立サンプリング(k-shot)を比較した。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:53:51 GMT)
CDS4RAG: Cyclic Dual-Sequential Hyperparameter Optimization for RAG [4.2] 提案するCDS4RAGは,与えられたクエリを用いた検索拡張生成を最適化するフレームワークである。
その結果, CDS4RAGは21/24ケースにおいてバニラアルゴリズムを大幅に向上させ, 生成品質を最大1.54倍改善し, 高速化した。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:58:11 GMT)
Debiased Counterfactual Generation via Flow Matching from Observations [4.2] 介入下での対物分布の推定は、治療リスク評価と対物生成タスクの中心である。
標準的な仮定では、観察結果と反事実結果の分布は密接なリンクがあることが示される。
これらの特性は、スクラッチからではなく、観測分布から切り離された流れを通じて学習の反事実分布を動機付けている。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:35:21 GMT)
jina-embeddings-v5-omni: Text-Geometry-Preserving Multimodal Embeddings via Frozen-Tower Composition [4.2] マルチモーダル埋め込みモデルに対する新しいアプローチである凍結エンコーダモデル合成を導入する。
我々は、VLMスタイルのアーキテクチャを構築し、非テキストエンコーダが言語モデルのための入力を生成するように適応されている。
jina-embeddings-v5-omniスイートは、テキスト、画像、オーディオ、ビデオ入力を1つのセマンティック埋め込み空間にエンコードするモデルである。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:45:15 GMT)
GC-ART: Global Learnable Second-Order Rational Tone Curves for Illumination Robustness [4.2] GC-ARTは、堅牢な画像分類のための前処理モジュールである。
チャネルごとのソフトヒストグラムから終端ピン付有理音曲線を予測する。
このモジュールは、クロスエントロピーとソフトな単調なペナルティでエンドツーエンドに訓練されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:34:22 GMT)
Can LLMs Solve Science or Just Write Code? Evaluating Quantum Solver Generation [4.1] 大規模言語モデル(LLM)は、コード生成において強力な能力を示し、自動量子ソルバ開発での利用を動機付けている。
本研究は,LLMの科学的問題に対する解法生成能力を評価するための反復的手法であるQ-SAGEを紹介する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:55:50 GMT)
Deterministic Fully-Static Whole-Binary Translation without Heuristics [4.1] Elevatorはx86-64実行ファイル全体をAArch64デバッグ情報、ソースコード、コードレイアウトに関する仮定に変換する。
我々は,SPECint 2006スイート全体を含む,現実世界のバイナリの多種多様なコーパス上でエレベータを評価する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:25:06 GMT)
When Child Inherits: Modeling and Exploiting Subagent Spawn in Multi-Agent Networks [4.1] 我々は、サブエージェント継承のレンズを通して、現代のマルチエージェントネットワークをモデル化する。
我々の分析によると、現在のフレームワークは、安全でないメモリ継承、リソース制御の弱い、スポーニング後の古い状態、不適切な終了権限を通じて、信頼境界に違反する可能性がある。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:27:23 GMT)
Adaptive Domain Decomposition Physics-Informed Neural Networks for Traffic State Estimation with Sparse Sensor Data [4.0] ADD-PINNはオフライン速度場再構築のための2段階の残留誘導フレームワークである。
25の配置のうち18の相対的なL2誤差と15のスパースセンシングケースの14の誤差を達成している。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:13:53 GMT)
Breaking mechanical dark mode via the Coulomb interaction [4.0] 光学系における2つの縮退機械共振器(MR)の暗モードを破る手法を提案する。
2つの縮退したMRは、解決されたサイドバンド状態を超えて同時に基底状態に冷却することができる。
OPAとメカニカルパラメトリックアンプリフィケーションを用いて、3dBを超える強靭で頑健なメカニカルスクイーズを生成することができることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:27:17 GMT)
A Marine Debris Detection Framework for Ocean Robots via Self-Attention Enhancement and Feature Interaction Optimization [4.0] 海洋ロボットの海洋破片検出は生態学的保護に不可欠であるが、その性能は、ぼやけ、複雑な背景、小さなターゲットを持つ低品質の画像によって劣化することが多い。
拡張されたYOLOベースの検出フレームワークであるYOLO-MDを提案する。
Dual-Branch Convolutional Enhanced Self-Attention (DB-CASA)モジュールは、空間チャネル相互作用を強化し、劣化した画像の特徴表現を改善するように設計されている。
パラメータ効率を保ちながら、様々なスケールのオブジェクトに対するきめ細かい特徴抽出を強化するために、軽量なシフトベース演算を導入した。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:43:01 GMT)
SR$^2$-LoRA: Self-Rectifying Inter-layer Relations in Low-Rank Adaptation for Class-Incremental Learning [4.0] 本稿では, 層間関係ドリフトの解析を通して, 破滅的な忘れ方について考察する。
我々は、アンダーラインSelf-underlineRectifying inter-layer underline Relation Low-Rank Adaptation (SR$2$-LoRA)を提案する。
標準CILベンチマークの実験では、SR$2$-LoRAは破滅的な忘れを効果的に緩和することを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:14:50 GMT)
Belief or Circuitry? Causal Evidence for In-Context Graph Learning [3.9] モデルがグローバルなトポロジを追跡するか、あるいは局所的な遷移をコピーすることを示す。
どちらの説明も十分でないという2つの証拠を提示する。
本研究は, 実構造推論と誘導回路を並列に動作させる双対機構解析法とよく一致している。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:11:19 GMT)
Variable Aerodynamic Damping via Co-Contraction: A Dynamic Isomorphism with Variable Stiffness Actuators [3.9] 冗長な二重回転アクチュエータにおける空力共振は、受動的でトリムで定義された空力機械の減衰を調整できることを実証する。
同じ繊維密度原理は、冗長なマルチローターのアクティブな空力的促進度測定も強化する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:02:34 GMT)
Robust and Reliable AI for Predictive Quality in Semiconductor Materials Manufacturing with MLOps and Uncertainty Quantification [3.9] 本研究は,5年間の実生産データを用いて,機械学習操作(MLOps)のトレーニング戦略をベンチマークする。
製造意思決定における不確実性定量化の重要課題に対処するため,同型予測を実装した。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:57:21 GMT)
MicroDiffuse3D: A Foundation Model for 3D Microscopy Imaging Restoration [3.9] ケミカルイメージングは、細胞、組織、生体システムのラベルのない可視化を可能にする。
その幅広い用途は、特に3次元イメージングにおいて、遅いデータ取得によって制限されている。
本稿では,3次元顕微鏡画像復元のための基礎モデルであるMicroDiffuse3Dを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:58:35 GMT)
TraceFix: Repairing Agent Coordination Protocols with TLA+ Counterexamples [3.9] TraceFixは、LLM(Large Language Model)マルチエージェント調整のための検証ファーストパイプラインである。
エージェントは、タスク記述から構造化中間表現(IR)としてプロトコルトポロジを合成する。
さらに,TLA+モデルチェッカー(TLC)の逆例を用いて,検証が成功するまでプロトコルを反復的に修復する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:05:31 GMT)
Stabilized neural Hamilton--Jacobi--Bellman solvers: Error analysis and applications in model-based reinforcement learning [3.8] ハミルトン-ヤコビ-ベルマン方程式の理論はモデルに基づく強化学習に適用できる。
我々は、グリッドベースの値未知を回避しつつ、安定化された有限差分ポリシー評価構造を保存するハイブリッドシステムを開発する。
64次元までのコンパクト制御LQRの実験、アレン・カーン制御、振り子、ホッパー、および3Dクアロータのベンチマークは、代表的なモデルベースとモデルフリーのRLベースラインと比較する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:48:02 GMT)
Forensic analysis of video data deletion and recovery in Honeywell surveillance file system [3.8] リアルタイムビデオ監視システムは、デジタルビデオレコーダー(DVR)とネットワークビデオレコーダー(NVR)を使用して記録されたビデオを格納する。
これらのデバイスは、プロプライエタリで文書化されていない特殊な非標準ファイルシステムを使用している。
我々は,Honeywellビデオ監視装置が使用している,文書化されていないプロプライエタリなファイルシステムを分析した。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:31:12 GMT)
Symplectic H2 Model Reduction for High-Dimensional Linear Quantum Systems [3.8] シンプレクティックなペトロフ・ガレルキンの枠組みが提示され、低次モデルは建設によってPRのアイデンティティを自動的に満たす。
反復有理クリロフアルゴリズムのシンプレクティック変種を開発し、量子IRKA(Q-IRKA)と呼ぶ。
その結果,Q-IRKAは大規模線形量子システムに有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:38:57 GMT)
Hierarchical Perfusion Graphs for Tumor Heterogeneity Modeling in Glioma Molecular Subtyping [3.7] 実時間強度曲線から離散的血行動態表現を学習するフレームワークであるHiPerfGNNを紹介する。
階層型グラフニューラルネットワークは、分子予測のためにスケールを越えて情報を伝播する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:42:38 GMT)
DGPO: Distribution Guided Policy Optimization for Fine Grained Credit Assignment [3.6] 本稿では,新たな批判的自由強化学習フレームワークである配流誘導政策最適化について紹介する。
我々は、DGPOが、批判のないアライメントのために、新たな最先端を設定できることを示します。特に、DGPOは、挑戦的なAIME2024とAIME2025ベンチマークで、60.0% Avg@32の精度と46.4% Avg@32の精度をそれぞれ達成します。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:51:27 GMT)
Longitudinal Analyses of SAST Tools: A CodeQL Case Study [3.6] 本研究では,静的アプリケーションセキュリティテスト(SAST)ツールを縦断測定により評価するための新しい手法を提案する。
当社の装置は1622リポジトリの3993 CVEで、CodeQLの114バージョンに時間をかけて適用し、ツールの重要な特性を測定します。
CodeQLは合計171のCVEを識別しており、83のCVEでは修正前のCodeQLバージョンが検出可能であることが分かりました。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:41:25 GMT)
Beyond the False Trade-off: Adaptive EWC for Stealthy and Generalizable T2I Backdoors [3.6] ステルステキスト・トゥ・イメージ(T2I)バックドアアタックには、モデルの忠実性を維持することが不可欠である。
既存の方法は、限られた正規化を提供する出力ベースの蒸留に依存している。
本稿では,パラメータベースの代替手段としてElastic Weight Consolidation (EWC)を導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:09:59 GMT)
Teachers' Perceived Benefits and Risks of AI Across Fifty-Five Countries: An Audit of LLM Alignment and Steerability [3.5] 大規模な言語モデル (LLM) は、教育における検証が限られているにもかかわらず、研究、政策、教師の専門職でますます使われている。
55か国・地域のOECD TALISデータを用いて,教師の認識するAIのメリットとリスクの国家間変動を測定した。
その結果、LLM出力に確実に反映されない教師の知覚において、実質的なクロスナショナルな変化が明らかとなった。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:03:25 GMT)
Beyond Confidence: Rethinking Self-Assessments for Performance Prediction in LLMs [3.5] モデル自己評価の多次元的視点を提案する。
我々は自信とともに6つの評価に基づく自己評価の次元を導き出す。
能力に関する評価の次元、特に努力と能力は、一貫して一致し、信頼性よりも優れています。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:41:35 GMT)
Causal EpiNets: Precision-corrected Bounds on Individual Treatment Effects using Epistemic Neural Networks [3.5] 有限サンプルでは、標準プラグイン推定器は体系的に失敗する。
両病態を解析する有限サンプルPNS推定のためのニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:17:15 GMT)
Results and Retrospective Analysis of the CODS 2025 AssetOpsBench Challenge [3.5] 我々は、産業用マルチエージェントオーケストレーションに関するCodabenchコンペティションであるCODS 2025アセットオプシブチャレンジを再考する。
最終ランクシート,300サーバログ,149チーム登録,ベストサブミッションエクスポート,オーガナイザ勝者レポート,アセットオプシブシステムペーパー,検証済みのプランニング・トラックソースツリーを組み合わせる。
公開スコアとプライベートスコアは、計画では適度に相関するが、実行では否定的に相関する。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:00:58 GMT)
How to utilize failure demo data?: Effective data selection for imitation learning using distribution differences in attention mechanism [3.5] 本稿では,成功と失敗の相違点の潜在表現を学習し,注意機構に組み込む手法を提案する。
本稿では、各障害サンプルと成功例との注意差を定量化して、障害データを選択するためのポストトレーニング指標を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:34:11 GMT)
AI-Driven Security Alert Screening and Alert Fatigue Mitigation in Security Operations Centers: A Comprehensive Survey [3.5] この調査は、2015年から2026年までの、人工知能駆動のアラートスクリーニングと警告疲労軽減についてレビューする。
87のコア研究を含む119のレコードを,フィルタリング,トリアージ,相関,生成増強を含む4段階の分類群に合成した。
この調査は、信頼できる認知セキュリティ運用センターに向けた研究課題で締めくくられている。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:58:52 GMT)
NeuroGAN-3D: Enhancing Intrinsic Functional Brain Networks via High-Fidelity 3D Generative Super-Resolution [3.5] 本稿では,3次元超解像モデルNeuroGAN-3Dを提案する。
本モデルでは,RS-fMRI空間マップの空間分解能を向上させるために,生成的対向ネットワークアーキテクチャを活用し,従来のベースラインを著しく上回っている。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:29:40 GMT)
Covert Signaling for Communication and Sensing over the Bosonic Channels [3.5] 損失のある熱雑音のボソニックチャネル上でのスパースシグナリングについて検討した。
非直感的な最適量子状態構造が見つかる。
特に、低明度状態では、最適な信号状態は真空と単一光子の混合である。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:52:18 GMT)
YEZE at SemEval-2026 Task 9: Detecting Multilingual, Multicultural and Multievent Online Polarization via Heterogeneous Ensembling [3.3] XLM-RoBERTa-largeとmDeBERTa-v3-baseを組み合わせた多言語事前学習モデルの異種アンサンブルを提案する。
本研究では,多タスク学習,翻訳に基づくデータ拡張,クラス重み付けなどの手法を用いて,重度ラベルの不均衡下での分類性能の向上を図る。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:45:50 GMT)
Radiologist-Guided Causal Concept Bottleneck Models for Chest X-Ray Interpretation [3.3] 医療画像における概念ボトルネックモデル(CBM)は、最終診断の前に中間的臨床概念を予測することにより、モデル解釈性を改善することを目的としている。
我々はXpertCausalを胸部X線解釈のための放射線技師誘導型因果CBMとして提案し,病理と概念の関係をモデル化した。
我々はXpertCausal on MIMIC-CXRの病理分類性能,校正,説明品質,および放射線技師が定義した推論経路との整合性について検討した。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:21:38 GMT)
Seed Hijacking of LLM Sampling and Quantum Random Number Defense [3.3] 大規模言語モデル (LLM) は自己回帰サンプリングのための決定論的擬似乱数生成器 (PRNG) に依存している。
SeedHijackは、PRNG出力を操作するバックドア攻撃で、攻撃者が指定したトークンの選択を強制する。
GPT-2 (124M) の 540-trial ベンチマークでは、9つのサンプリング構成で99.6%の正確なトークン注入を達成した。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:17:06 GMT)
Coding Agents Don't Know When to Act [3.3] コーディングエージェントは、ソフトウェアを自律的にメンテナンスするためにますますデプロイされる。
現実のデプロイメントでは、すでに解決済みの問題に関するバグレポートに遭遇します。
最先端のモデルでさえ失敗し、35ドルから65%のケースで望ましくない変更を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:10:00 GMT)
Retina-RAG: Retrieval-Augmented Vision-Language Modeling for Joint Retinal Diagnosis and Clinical Report Generation [3.1] Retina-RAGは、糖尿病網膜症(DR)の重症度、黄斑浮腫(ME)の検出、レポート生成を共同で行う、低コストなモジュラーフレームワークである。
検索拡張生成(RAG)モジュールは、構造化分類器出力とともに硬化した眼科知識を注入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:55:12 GMT)
A Deep Risk Estimator for Known Operator Learning [3.1] 本稿では,学習演算子と既知の演算子の混合を含むディープネットワークの統計的リスクを推定するためのアプローチについて述べる。
層状ネットワークの予測誤差とトレーニングサンプルのサイズを結合する深層リスク推定器を導出する。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:58:30 GMT)
Securing the Dark Matter: A Semantic-Enhanced Neuro-Symbolic Framework for Supply Chain Analysis of Opaque Industrial Software [3.1] ICSソフトウェアは、ソースレベルの透明性をソフトウェア構成分析から奪う、取り除かれたシンボルのないバイナリとして、定期的にデプロイされる。
既存のバイナリ解析技術は、このセマンティックギャップを部分的に閉じるだけである。
本稿では,不透明なバイナリから直接行動意味を再構築する意味強化型ニューロシンボリック・フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:45:18 GMT)
PET-Adapter: Test-Time Domain Adaptation for Full and Limited-Angle PET Image Reconstruction [3.0] 本稿では, ファントムデータのみに基づいて事前学習したPET再構成モデルのためのテスト時間領域適応フレームワークPET-Adapterを提案する。
提案手法は, 異なる解剖, トレーサ, スキャナ構成を持つ臨床データセットに, ペアの地上真実を必要とせずに適応することができる。
複数の臨床データセットにまたがる実験は、フルアングルとリミテッドアングルの両方で優れた3D再構成性能を示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:15:33 GMT)
Stability of the Monge Map in Semi-Dual Optimal Transport [3.0] 最適輸送問題の半二重定式化は, 縮退したサドル点構造を有することを示す。
双対ポテンシャルの最適性を必要とせず、モンジュ写像の収束に必要な十分条件を導出する。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:28:15 GMT)
Render, Don't Decode: Weight-Space World Models with Latent Structural Disentanglement [2.9] 補助座標に基づく暗黙的ニューラル表現(INR)の重みとバイアスとしてシステム状態を表す世界モデリングフレームワークNOVAを紹介する。
この構造化された表現は解析的にレンダリングされ、コンパクト性、可搬性、ゼロショット超解像を参照しながらデコーダのボトルネックを解消する。
当社のフレームワークは、いくつかの挑戦的なデータセット上で検証し、$sim$40Mパラメータで単一のコンシューマGPU上で運用しながら、強力な制御可能な予測を実現しています。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:40:29 GMT)
Dynamic Mode Decomposition along Depth in Vision Transformers [2.9] 我々は,ViTの深さがほぼ自明な線形力学を実装しているかどうかを問う。
我々は、動的モード分解(DMD)を用いてこれをテストし、選択された連続した隠れ状態ペアからK$に適合する。
予め訓練した4種類のDINO ViTについて, 安定適合に必要な正則化, ランク, 校正予算について検討した。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:33:03 GMT)
Switchcraft: AI Model Router for Agentic Tool Calling [2.9] エージェントツールコールに最適化された最初の(私たちの知る限りの)モデルルータであるSwitchcraftを紹介します。
Switchcraftは82.9%の精度を実現し、推論コストを84%削減した。
より大規模なモデルはツール利用タスクにおいてより小さなモデルよりも一貫して優れておらず、名目上より安価なモデルはトークン集約推論による総コストの上昇を招きかねないことが判明した。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:41:31 GMT)
Physics-Informed Reduced-Order Operator Learning for Hyperelasticity in Continuum Micromechanics [2.8] 物理インフォームド演算子学習は、ミクロ構造の代理モデリングの魅力的な候補である。
Q-DEIMは、ステップごとのトレーニングコストを、フルフィールドの損失評価と比較して約3桁削減する。
基礎構築には少数のオフラインスナップショットロードパスしか頼っていないが、この方法は顕微鏡応力場と均質応力の両方を正確に補間し、外挿する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:46:28 GMT)
A Single Neuron Is Sufficient to Bypass Safety Alignment in Large Language Models [2.8] 言語モデルの安全性アライメントは、2つの機械的に異なるシステムを介して機能する。
各システム内の単一ニューロンを標的にすることにより、両方の障害方向を示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:45:28 GMT)
Lightweight Unpaired Smartphone ISP Transfer with Semantic Pseudo-Pairing [2.7] 未ペアスマートフォンISPは、RAWとターゲットRGB画像の間のシーンとカラーアライメントが欠如しているため、難しい問題である。
NTIRE 2026 Learned smartphone ISP Challenge with Unpaired Dataのために開発されたシンプルで効果的なアプローチを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:32:13 GMT)
Hydra-DP3: Frequency-Aware Right-Sizing of 3D Diffusion Policies for Visuomotor Control [2.7] 拡散に基づくビジュモータポリシーは、ロボット操作においてよく機能する。
現在の手法は画像生成スタイルのデコーダとマルチステップサンプリングを継承している。
軽量拡散ミキサーデコーダを用いたポケットスケール3次元拡散方式Hydra-DP3(HDP3)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:29:49 GMT)
Parallel Lifted Planning via Semi-Naive Datalog Evaluation [2.7] 我々は,ルールレベルの並列性とグラウンド化という2つのレベルの並列性を持つ実行モデルを開発し,解析する。
我々の実装は、単一のコア上のベースラインよりも多くのタスクを解決し、追加コアを使用するにつれてギャップが拡大します。
提案した実行モデルは平均並列率92.4%を示し、8コアで6倍の高速化を実現している。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:53:40 GMT)
HEJ-Robust: A Robustness Benchmark for LLM-Based Automated Program Repair [2.6] LLM(Large Language Models)は、標準ベンチマーク全体にわたって、プログラムの自動修正において強力なパフォーマンスを示している。
HEJ-RobustはHumanEval-Java-Bugから構築されたロバスト性ベンチマークで、8つのセマンティクス保存コード変換を用いて構築する。
いくつかの変換条件下でモデル性能が50%以上低下することを示し、現在のLLMベースの補修モデルではマイナーな構文変化に対してロバスト性を欠いていることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:53:21 GMT)
Who Prices Cognitive Labor in the Age of Agents? Compute-Anchored Wages [2.6] AIエージェントの経済性に関する自然な直感は、エージェントを非常に低い限界コストで複製できるため、エージェントの労働力は極めて弾力的に供給される可能性があるということである。
我々は、このフレーミングはメカニズムでは間違っているが、結論では部分的に正しいと論じ、補正は理論と政策の両方において重要であると論じている。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:12:40 GMT)
A Computational Operationalisation of Competing Maturational Theories of Syntactic Development via Statistical Grammar Induction [2.6] 本稿では,第1言語発達の過程で子どもが獲得する中間構文カテゴリーと,どのような順序で取得するかについて考察する。
ボトムアップアカウント(GROWING)は、語彙構造と屈折構造が最初に出現し、内向きアカウント(INWARD)は談話関連カテゴリへの早期アクセスを予測している。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:51:40 GMT)
TTF: Temporal Token Fusion for Efficient Video-Language Model [2.6] ビデオ言語モデル(VLM)は、ビデオの長さで視覚トークンがスケールするにつれて、高速な推論コストに直面している。
トレーニング不要でプラグアンドプレイのプリLLMトークン圧縮フレームワークであるTTFを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:08:54 GMT)
Model-Reference Adaptive Flight Control of the 95-mg Bee++ [2.6] そこで本研究では,95 mg の昆虫型羽ばたき翼航空機 Bee++ の高速位置追跡のためのモデル参照適応制御アーキテクチャを提案する。
提案手法の適合性,機能,高性能性を実時間飛行実験のデータを用いて実証した。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:16:35 GMT)
Vaporizer: Breaking Watermarking Schemes for Large Language Model Outputs [2.6] 大規模言語モデル(LLM)の出力を透かし、最新の最先端のスキームについて検討する。
我々は、修正テキスト攻撃の広範囲な収集に対して、これらの透かし手法の有効性を分析する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:24:29 GMT)
Reinforcement Learning for Exponential Utility: Algorithms and Convergence in Discounted MDPs [2.6] マルコフ決定過程における指数効用最適化のための強化学習(RL)は、原則的値ベースアルゴリズムを欠いている。
2つのQ値型拡張を導出し、関連する作用素が$L_infty$とsup-log/Thompsonメトリクスの縮約であることを示す。
我々は、時間スケールの分離により、ほぼ全周収束を確立し、有限時間収束率を与えるとともに、サブ線形パワーロー演算子によって制御される1時間スケールのアルゴリズムを提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:41:48 GMT)
A Reproducible Multi-Architecture Baseline for Token-Level Chinese Metaphor Identification under the MIPVU Framework [2.5] 本稿では, PSU Chinese Metaphor Corpus (PSU CMC) におけるトークンレベルのメタファ識別のための再現可能な多階層ベースラインを提案する。
エンコーダを中国語のRoBERTa-wwm-ext-largeと微調整し、(ii)MelBERTを現代中国語辞典第7版(MCD7)から新たに構築した基本的意味資源を用いて中国語に適合させる。
5種の固定種子のうち、MelBERT MIP-は0.7281+/-0.0050テスト陽性F1において、メルバートフル(0.7270+/-0.0069)よりわずかに高く、RoBERTa(0.7)よりも明らかに高いパフォーマンスを達成している。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:07:19 GMT)
LE-PAVD: Learning-Enhanced Physics-Aware Vehicle Dynamics for High-Speed Autonomous Navigation [2.5] 本研究では,物理先行と学習部品を統合するハイブリッドモデルLE-PAVD(Learning-Enhanced Physics-Aware Vehicle Dynamics)を提案する。
私たちのアーキテクチャでは、負荷に敏感なPacejkaタイヤ力、縦方向の荷重伝達、横方向のタイヤ力効果、速度制限アクチュエータ入力の4つのコンポーネントを追加しています。
未確認トラックでは、LE-PAVDは平均変位誤差(ADE)を16.1$%、最終変位誤差(FDE)を20.6$%、Yaw-rate root mean squared error(RMSE)を91.3$%、深さを91.3$%下げる。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:07:47 GMT)
Coordinates of Capability: A Unified MTMM-Geometric Framework for LLM Evaluation [2.5] 本稿では,Large Language Models (LLMs) 評価のための汎用多言語多手法(MTMM)フレームワークを提案する。
パラフレーズ不安定度,ドリフトスコア,オーバートン幅,プラナリズムスコアの9つの評価指標を定式化し,共有潜在座標空間内の幾何的測度として解釈する。
タスク非関連摂動を真の能力の範囲から体系的に分離することにより、このフレームワークは、堅牢で経験的に安定したベンチマーク設計のために理論的に基礎とドメインに依存しない分類を提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:05:19 GMT)
Cross-Attention and Encoder-Decoder Transformers: A Logical Characterization [2.4] 浮動小数点数とソフトアテンションの実践的な設定において,テキスト上のそのような変換器について検討する。
また、分散オートマトンを用いて、このようなトランスフォーマーのさらなる特徴付けを行う。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:14:04 GMT)
SGC-RML: A reliable and interpretable longitudinal assessment for PD in real-world DNS [2.4] 本稿では,SGC-RMLを用いて,音声,歩行,ウェアラブル運動,移動作業,臨床変数を共有8次元症状ノード空間にマッピングする。
不確実性推定、共形校正、選択的な決定経路を共同で導入することにより、モデルは症状や重症度を予測するだけでなく、証拠が不十分な場合に評価を拒否したり、再検査を提案することもできる。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:10:08 GMT)
The Endogeneity of Miscalibration: Impossibility and Escape in Scored Reporting [2.4] 自律エージェントからの真実の報告を排除することは、スケーラブルなAI監視における中核的な問題である。
プリンシパルは、厳密に適切なスコアリングルールを使用してエージェントのレポートをスコアリングするが、エージェントはまた、非正確チャンネルを通じてレポートの恩恵を受ける。
我々の主な成果は内在性であり、プリンシパルの最適監視は必ずしもスクリーンタイプに非ファイン承認関数を使用する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:42:28 GMT)
Beyond Translation Accuracy: Addressing False Failures in LLM-Based Code Translation [2.3] 大規模言語モデル(LLM)は、自動コード翻訳において大きな成功を収めた。
本稿では,コード翻訳における誤りの報告は,誤った論理によるものではなく,むしろ評価による誤りによるものであることを実証する。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:53:18 GMT)
AI-Care: A Conversational Agentic System for Task Coordination in Alzheimer's Disease Care [2.3] 本稿では,遠隔介護プラットフォーム上に構築された対話型エージェント人工知能層であるAI-Careについて述べる。
AI-Careはアルツハイマー病(AD)とアルツハイマー病関連認知症(ADRD)の認知負荷を軽減するように設計されている
軽度から軽度のAD/ADRDを持つ4人の個人による予備試験では、システムは信頼性があり、有能で、可読性があることがわかった。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:55:46 GMT)
Binge, Bot, Repeat: Unpacking the Ecosystem of Video Piracy on Telegram [2.3] 2023年12月から2026年1月までに209kの投稿を共有した1,057チャンネルの混合分析により,Telegram上でのビデオ海賊行為に関する大規模な研究を行った。
我々は,これらのチャネルの活動と意図をポスト単位のレベルで構造化した理解を可能にする,きめ細かい分類法を開発した。
このエコシステムの規模と持続性は、Telegram上の新興ビデオ海賊コミュニティを検出するリアルタイムフレームワークであるAnti-RIPの開発を動機付けている。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:24:39 GMT)
VeriContest: A Competitive-Programming Benchmark for Verifiable Code Generation [2.2] 大規模言語モデルは自然言語から有用なコードを生成することができるが、その出力は正確性を保証することなく得られる。
検証可能なコード生成は、モデルに実行可能なコードだけでなく、正式な仕様やマシンチェック可能な証明を生成することを要求することによって、テストを越える道を提供する。
We present VeriContest, a benchmark of 946 competitive-playming problem from LeetCode and Codeforces for verible code generation in Rust with Verus。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:25:05 GMT)
Probabilistic Object Detection with Conformal Prediction [2.2] Conformal Prediction (CP) は、有限サンプル被覆保証付き予測セットを構築するための分布自由な方法である。
標準の非スケールCPは入力間で固定幅の予測間隔を生成し、不確かさの予測に不要な幅をもたらす。
IoUは19%,IoUは39%,CPは39%であった。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:23:43 GMT)
When Diffusion Model Can Ignore Dimension: An Entropy-Based Theory [2.2] 拡散モデルは画像などの高次元データに対して極めてよく機能する。
既存の収束理論は、なぜそのようなサンプルが高次元において効率的であり続けるのかを完全には説明していない。
我々は,データ分布がコンパクトな潜在表現を持つ場合,拡散サンプリングは高次元空間で有効であることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:30:37 GMT)
Active Multiple-Prediction-Powered Inference [2.2] 医療のデプロイ後のモニタリングには統計的に有効なラベル効率の方法が必要であるが、クリニックチャートのゴールドスタンダードラベルは高価である。
我々は,各インスタンスをコスト適切な予測器にルーティングし,金標準ラベルを比例してサンプリングし,単一のデプロイ時間に予測を再現する予測能動型推論(AM-PPI)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:48:57 GMT)
Discovering Ordinary Differential Equations with LLM-Based Qualitative and Quantitative Evaluation [2.2] DoLQは, LLMに基づく定性的, 定量的評価による常微分方程式の発見手法である。
多次元常微分方程式ベンチマークの実験により、DoLQは既存の手法よりも優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:29:58 GMT)
The Position Curse: LLMs Struggle to Locate the Last Few Items in a List [2.1] 私たちはこの失敗を位置曲線と呼んでいる。
例えば、2行のコードスニペットであっても、Claude Opus 4.6は多くの場合、第2から第2の行を誤識別する。
ポストトレーニングによってこの能力が救えるかどうかを調べるため、位置中心のトレーニングデータセットであるPosBenchを構築した。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:04:22 GMT)
Reinforcement Learning for Scalable and Trustworthy Intelligent Systems [2.1] 強化学習はインテリジェントシステムの能力を向上させるための強力なパラダイムとなっている。
次世代のインテリジェントシステムは、効率的な最適化と信頼できる振る舞いの両方を必要とします。
この論文は、次世代のインテリジェントシステムは効率的な最適化と信頼できる振る舞いの両方を必要とすると主張している。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:36:25 GMT)
Vertex-Softmax: Tight Transformer Verification via Exact Softmax Optimization [2.1] 区間制約に対するソフトマックス関数の正確な最適性は、線形に多くの候補のうちの1つであることを示す。
CROWN Convex Relaxation based Optimization for Worst-case Neurons に統合された。
私たちは、α-CROWNとブランチ・アンド・バウンドのベースラインを、コストのごく一部で一貫して一致または上回る。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:22:06 GMT)
Model-Driven Policy Optimization in Differentiable Simulators via Stochastic Exploration [2.1] 微分可能な計画法は、システム力学の微分可能なモデルを活用することにより、決定問題の勾配に基づく最適化を可能にする。
本稿では,モデル駆動型政策最適化(MDPO)を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:52:25 GMT)
Reformulating KV Cache Eviction Problem for Long-Context LLM Inference [2.1] 大きな言語モデル(LLM)は、長いコンテキスト推論をサポートするが、キーバリュー(KV)キャッシュの増大により、メモリとランタイムのオーバーヘッドが大幅に増大する。
既存のKVキャッシュ消去法は、値表現、出力プロジェクション、ヘッド間相互作用の影響を無視し、局所的な注意重みに依存している。
注意マップと投影された値状態の間の乗法的相互作用を明示的にモデル化する新しい消去戦略であるLaProxを紹介する。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:37:22 GMT)
Benchmarking Foundation Models for Renal Lesion Stratification in CT [2.1] オープンソース医療基盤モデル(FM)は、医療画像モデルのトレーニングに使用することができる。
ここでは、FMと放射能を比較し、3D ResNet-50をゼロから訓練する。
FMは腎病変の成層化の確立したモデルを超えず、放射線を現在の最先端として残した。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:56:11 GMT)
SRGAN-CKAN: Expressive Super-Resolution with Nonlinear Functional Operators under Minimal Resources [2.0] SISR(Single-Image Super-Resolution)は、低分解能(LR)観測から高分解能(HR)画像を再構成することを目的としている。
近年の進歩は、トランスフォーマーベースのアーキテクチャと拡散モデルによって推進されている。
本稿では,コンボリュータル・コルモゴロフ・アルノルドネットワーク(CKAN)を逆学習環境に統合したハイブリッド超解像フレームワークSRGAN-CKANを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:19:01 GMT)
mHC-SSM: Manifold-Constrained Hyper-Connections for State Space Language Models with Stream-Specialized Adapters [2.0] 我々は,mHCスタイルの制約付きマルチストリーム残差トポロジが状態空間モデル(SSM)言語モデルに効果的に転送されるかどうかを検討する。
残差ストリームを複数の並列ストリームに拡張することにより,SSMブロックの周囲に静的mHC機構を実装した。
ストリーム毎のスケーリングと共有ボトルネックを通じて、軽量なストリーム特化キャパシティを追加するストリーム特化アダプタを導入します。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:37:23 GMT)
Weather-Robust Scene Semantics with Vision-Aligned 4D Radar [2.0] カメラとLiDARは雨、霧、雪で劣化するが、ミリ波レーダーは影響を受けていない。
我々は、レーダエンコーダを凍結したSigLIP視覚埋め込みと整列し、凍結した視覚言語モデルにより構造化されたシーンキャプションをデコードする。
K-RADARには霧、軽い雪、重い雪のシーケンスがあり、全てのレーダー構成はカメラベースラインを上回り、90%以上の幻覚に崩壊する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:24:21 GMT)
The Moltbook Files: A Harmless Slopocalypse or Humanity's Last Experiment [2.0] MoltbookはRedditに似たプラットフォームで、OpenClawのエージェントが投稿、コメント、投票を大規模に行う。
Moltbook Filesは232万の投稿と220万のコメントのデータセットで、プラットフォームの最初の12日間をカバーしています。
コミュニティの構造、著者、語彙的特性、感情、トピック、意味幾何学、コメント相互作用を分析します。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:10:17 GMT)
Active Learning for Communication Structure Optimization in LLM-Based Multi-Agent Systems [1.9] コミュニケーション構造最適化のためのアンサンブルに基づく情報理論タスク選択フレームワークを提案する。
提案手法は,候補タスクがグラフパラメータ上の分布をどの程度変化させるかによって,タスクのインフォメーション性を推定する。
本手法をエージェント攻撃による良質な設定と設定の両方で検証し、制約された計算予算下での通信構造最適化の有効性を実証する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:16:26 GMT)
Social Theory Should Be a Structural Prior for Agentic AI: A Formal Framework for Multi-Agent Social Systems [1.8] マルチエージェント社会システム(英: Multi-Agent Social Systems、MASS)は、エージェントが相互作用し、システムレベルの結果を生成するためのフレームワークである。
このポジションペーパーでは、エージェントAIシステムは構造的先行として社会理論でモデル化されなければならないと論じている。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:30:02 GMT)
Position: Mechanistic Interpretability Must Disclose Identification Assumptions for Causal Claims [1.8] 4つの方法論的ストランドにわたる10の論文のパーポーブ監査では、専用の識別・推定セクションは見つからない。
忠実性、完全性、単調性、アライメント、アブレーション効果などの検証基準は、それらを特定する仮定を述べることなく因果的支援として報告される。
クレームが因果的かどうか,識別戦略の命名,仮定の列挙,少なくとも1つのストレス,そして仮定が失敗すると結論がどう変わるかを説明する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:01:55 GMT)
Super-Resolution of Airborne Laser Scanning Point Clouds for Forest Inventory [1.8] 空中レーザー走査(ALS)は、広い地域にわたって点雲を収集することができ、大規模な森林在庫の収集を可能にしている。
ALS点雲は希少で騒々しく、個々の樹木レベルの森林在庫が不正確な結果となる。
本研究では3次元森林超解法(DFSR)という深層学習モデルを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:42:31 GMT)
The AI-Native Large-Scale Agile Software Development Manifesto [1.8] AI-Native Large-Scale Agile Software Development Manifestoを提示します。
AIが一流の参加者になると、いかに大規模なソフトウェア開発が組織されるかを再定義する価値と原則のセットです。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:20:33 GMT)
Trajectory-Consistent Flow Matching for Robust Visuomotor Policy Learning [1.8] フローマッチングポリシは、ノイズを動作に伝達する連続速度場を学習し、ロボット操作のための決定論的推論を可能にする。
標準トレーニングは、軌道の複雑な誤りを引き起こすミスマッチである、そのフィールドの数値的な統合を必要とする間、ポイントワイドな速度目標を最適化する。
本研究では,(1)全時間間隔にわたって時間的監督を均一に行う補助的整流流速度回帰,(2)軌道上の速度場の統合的変位を監督する多段階軌道整合性トレーニング,(3)時間的滑らかさを強制する速度場正規化の4つの補完策を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:44:10 GMT)
PicoEyes: Unified Gaze Estimation Framework for Mixed Reality with a Large-Scale Multi-View Dataset [1.8] PicoEyesは、視線のすべての重要な特性を直接予測する統合された視線推定フレームワークである。
キャリブレーション、視線予測、さまざまなデバイス姿勢を同時に処理する。
眼のパラメータと深度マップをエンドツーエンドで共同で推定することで、三次元眼の再構成をサポートする。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:34:09 GMT)
AI CFD Scientist: Toward Open-Ended Computational Fluid Dynamics Discovery with Physics-Aware AI Agents [1.8] 我々は、計算流体力学のためのオープンソースのAI科学者であるAI CFD Scientistを紹介する。
文献に基づくアイデア、検証された実行、視覚に基づく物理検証、ソースコードの修正、図形による記述を単一の検査可能なワークフローで行うのは、これが初めてである。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:43:04 GMT)
Price and Payoff: Non-Determinism in Fault Tolerant Quantum Computation [1.8] 我々は,非決定性は,サイクル当たりの資源需要のピーク(支払額)を膨らませながら,総実行時間(価格)を膨らませる二重効果を有することを示した。
蒸留に基づくアーキテクチャでは、この需要のスムーズ化は時空プロビジョンポイントをスムーズなものとし、決定論的分析の予測よりも時空体積を最小限に抑えるために必要な工場は少ない。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:44:12 GMT)
MoMo: Conditioned Contrastive Representation Learning for Preference-Modulated Planning [1.7] 優先条件付きコントラストプランナであるMoMoを紹介する。
MoMoは、表現幾何学と潜在予測演算子のジョイント条件付けを学習する。
6つの環境にわたって、MoMoはユーザの好みに応じて計画の安全性を円滑に調整し、状態拡張ベースラインに対する時間的および優先的な一貫性を向上させる。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:44:26 GMT)
When Losses Align: Gradient-Based Composite Loss Weighting for Efficient Pretraining [1.7] 本稿では, 複合事前学習勾配を下流目標と整列させることで, 事前学習の損失重みをオンラインで学習する勾配に基づく2レベル手法を提案する。
我々は、イベント系列モデリングと自己教師型コンピュータビジョンのアプローチを評価し、注意深く調整されたベースラインにマッチし、改善する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:59:19 GMT)
Direction-Preserving Number Representations [1.6] この研究は、ベクトルの方向が与えられた大きさの共通有限アルファベットからスカラー要素を選択することによって表現できる範囲を探索する。
このような製品構造コードの方向性カバレッジを解析するための幾何学的枠組みが導入された。
製品コードクラスでは、2つの補数、固定点、浮動小数点の標準形式が準最適であることが証明されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:32:33 GMT)
Loop Composition in Quantum Algorithms [1.6] 分岐合成をループを含むように変更することで、以前の作業にマッチする複雑さが得られることを示す。
これは、量子アルゴリズムを設計する際にプログラム制御フローを適切にモデル化することの重要性を強調している。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:50:57 GMT)
Mean-Pooled Cosine Similarity is Not Length-Invariant: Theory and Cross-Domain Evidence for a Length-Invariant Alternative [1.6] 平均プールされたコサイン類似性は、言語、モダリティ、タスク間の神経表現を比較するためのデフォルトの指標である。
現代の変圧器表現を特徴づける異方性の下では、平均プールされたコサインは配列長で単調に成長する。
我々は、Centered Kernel Alignmentのような長さ不変のメトリクスは、クロス表現比較のデフォルトであるべきだと論じる。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:48:34 GMT)
Susceptibilities and Patterning: A Primer on Linear Response in Bayesian Learning [1.6] ニューラルネットワークの解釈のために[arXiv:2504.18274, arXiv:2601.12703]で開発された感受性の理論を紹介する。
我々は、その統計力学の基礎から理論を動機付け、知覚可能性の詳細な説明、その経験的推定器、損失景観の幾何学との関係を与える。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:43:48 GMT)
Linear Response Estimators for Singular Statistical Models [1.6] n 個のデータポイントの列において、感受性を統計量として定義する。
これらの推定子は、大きな n 状態において一貫した無バイアスであることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:31:56 GMT)
TAIL-Safe: Task-Agnostic Safety Monitoring for Imitation Learning Policies [1.5] 我々は、訓練されたILポリシーを識別するための原則化されたアプローチであるTAIL-Safeを、学習タスクの完了を実証的に成功させる安全なセットとして提示する。
フランカ・エミカロボットを用いた実験では、TAIL-Safeでガイドされた場合、実行時の摂動で失敗するフローマッチングポリシーが一貫したタスク成功を達成することを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:36:48 GMT)
ShifaMind: A Multiplicative Concept Bottleneck for Interpretable ICD-10 Coding [1.5] 提案するShifaMindは,Multiplicative Concept Bottleneck (MCB) を中心に構築された,概念ベースアーキテクチャである。
ShifaMindは、F1、AUC、ランキングメトリクスで最強のベースラインであるLAATとパフォーマンスを競う。
キャパシティにマッチしたVanilla CBMに比べて、予測パフォーマンスと解釈可能性指向のメトリクスの両方で大幅に向上し、ボトルネック設計の重要性を強調している。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:58:52 GMT)
Rubric-Grounded RL: Structured Judge Rewards for Generalizable Reasoning [1.5] 我々は,構造的かつ多条件の報酬に対してポリシを最適化するフレームワークとして,経験的地下強化学習(RL: Emphrubric-grounded reinforcement learning)を定式化する。
我々は、約10万の科学・技術文書からなるOSTI(Office of Scientific and Technical Information)由来のコーパスから潤滑剤を抽出して、この枠組みをインスタンス化する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:48:58 GMT)
TFM-Retouche: A Lightweight Input-Space Adapter for Tabular Foundation Models [1.5] 冷凍TFMバックボーンに関して,設計上アーキテクチャに依存しない軽量な入力空間残差アダプタを提案する。
TFM-Retoucheは入力空間内の小さな残差補正を学習し、入力データを事前学習されたモデルの帰納バイアスと整合させる。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:57:06 GMT)
Benchmarking EngGPT2-16B-A3B against Comparable Italian and International Open-source LLMs [1.5] 本報告は、ENGINEERING Ingegneria S.p.A.のEngGPT2MoE-16B-A3B LLMの性能をベンチマークする。
3Bアクティブパラメータを持つ16BパラメータMixture of Experts(MoE)モデルである。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:36:24 GMT)
The Translation Tax Is Not a Scalar: A Counterfactual Audit of English-Source Cue Inheritance in Chinese Multilingual Benchmarks [1.5] 翻訳税は、しばしばスカラーとして扱われる:翻訳されたベンチマークは、英語ソースの手がかりを保存することによってスコアをインフレさせると仮定される。
バックトランスレーションのギャップは小さく、フレキシブルであり、キュースコアのキャリブレーションはアイテムレベルの利得を予測しない。
我々は、セルごとのエビデンス、自然化プロトコル、人間QC、翻訳された多言語ベンチマーク論文の報告チェックリストをリリースする。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:18:46 GMT)
Divination by Prompt: LLM-Mediated Xuanxue on Chinese Social Media [1.5] 大規模言語モデル(LLM)の急速な普及は、対話型AIを占拠に利用するという、目覚ましい文化的プラクティスを生み出した。
本稿は、中国ソーシャルメディアにおける神秘的・精神的な実践を表すインターネットネイティブの傘であるXuanxueの文脈において、LSMを介する占いに関する最初の体系的研究の1つを提供する。
我々はXiaohongshuの投稿とコメントを23,000件以上分析し、32件の半構造化インタビューを行った。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:07:04 GMT)
Robust stochastic first order methods in heavy-tailed noise via medoid mini-batch gradient sampling [1.4] 1次最適化フレームワークを考えると、各イテレーションで$K$独立分散データポイントサンプル(すなわち、d.d.)が描画される。
本稿では,ロバストDescent GradientMiniという新しい一階勾配アルゴリズムを提案する。
実験結果から, R-SGD-Mini とそのクリッピング変異体は, Median-of-Means 法と比較して一貫した性能を示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:01:25 GMT)
Interpreting Reinforcement Learning Agents with Susceptibilities [1.4] サセプティビティ(Susceptibilities)は、障害の摂動に対する可観測物の後方予測値の応答を研究するニューラルネットワークの解釈可能性のテクニックである。
本稿では,非自明な段階的発達を示す単純なグリッドワールドモデルにおける感受性の有用性について検討する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:59:38 GMT)
Graph-Structured Hyperdimensional Computing for Data-Efficient and Explainable Process-Structure-Property Prediction [1.4] 本稿では,有向PSPグラフを表現,推論,説明の前提として符号化したグラフ構造化超次元計算フレームワークであるPSP-HDCを提案する。
PSP-HDCは1000個のランダムスプリットに対して0.910 +/- 0.077の精度を達成し、プロセスフォールドの一般化の下で0.896は強いベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:55:44 GMT)
Tacit Knowledge Extraction via Logic Augmented Generation and Active Inference [1.4] 本稿では,知識グラフ構築のための論理拡張生成と能動推論にインスパイアされたアプローチを組み合わせた,ニューロシンボリックなフレームワークを提案する。
その結果,提案手法は完全性とセマンティック・クオリティを改善し,産業領域におけるニューロシンボリック・ナレッジ・エンジニアリングを推し進めている。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:06:02 GMT)
It Just Takes Two: Scaling Amortized Inference to Large Sets [1.3] 後続モデルから表現学習を分離する戦略を導入する。
提案手法は平均プールのDeep Setを最大2個のセットで訓練し,任意のセットサイズに一般化するエンコーダを生成する。
私たちのアプローチは、計算のごく一部で標準ベースラインにマッチしたり、性能を上回ります。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:32:34 GMT)
Sinkhorn Treatment Effects: A Causal Optimal Transport Measure [1.3] 本稿では, 対物分布間の分散のエントロピー的最適輸送指標であるシンクホーン処理効果を紹介する。
この分散を統計関数として解析し、反事実的平均埋め込みのスムーズな変換として記述できることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:03:11 GMT)
Quotient Semivalues for False-Name-Resistant Data Attribution [1.3] MLデータ属性における偽名操作の形式化を行う。
私たちはエビデンス支援の属性クラスタ上でShapley-、Banzhaf-、βスタイルの値を計算します。
戦略的なプロバイダ攻撃下での属性のベンチマークであるDataMarket-Gymのメカニズムをインスタンス化する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:34:20 GMT)
Quantifiable Uncertainty: A Stochastic Consensus Multi-Agent RAG Framework for Robust Malware Detection [1.2] 本稿では,マルウェア解析をセマンティックコード検索と確率的検証に分離するフレームワークMAGMAを提案する。
MAGMAは98.4%の検知率を示し,既存の解よりもかなり高い値を示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:46:24 GMT)
Low-code and no-code with BESSER to create and deploy smart web applications [1.2] Low-codeはコンポーネントの抽象化に集中することで手書きのコード量を減らすアプローチである。
ユーザが自由にアクセス可能なWebベースのエディタを使ってアプリケーションを設計、生成、デプロイできるオープンソースのBESSERローコードフレームワークを提示する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:31:55 GMT)
Augmenting Human Evaluation with LLM Judges: How Many Human Reviews Do You Need? [1.1] 大規模言語モデル(LLM)は、ハイテイクなアプリケーションを含むAIシステムの自動評価手段として、ますます利用されている。
専門家の人間格付けは高価でスケールが難しいが、LSM格付けは低コストで迅速に作成できる。
本稿では,LLM審査員の役割を代用的から補助的へとシフトさせ,LLM-as-a-judgeパラダイムを人的評価の強化の1つとして定式化する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:13:08 GMT)
Does Your Neural Network Extrapolate? Feature Engineering as Identifiability Bias for OOD Generalization [1.1] ディープニューラルネットワークが成功すると、データの健全な特徴が見つかる。
In-distriion (ID)トレーニングウィンドウからOOD(out-of-distriion)関連表現をいつ、なぜ学習しないのかを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:25:52 GMT)
LARAG: Link-Aware Retrieval Strategy for RAG Systems in Hyperlinked Technical Documentation [1.1] LARAG (Link-Aware RAG) は、HTMLドキュメントの著者定義ハイパーリンク構造を利用する軽量なリンク対応検索戦略である。
LARAGは応答品質を継続的に改善し、BERTScore F1を最高に達成し、チャンクを減らし、トークンを減らした。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:50:53 GMT)
Sparse Random-Feature Neural Networks with Krylov-Based SVD for Singularly Perturbed ODE [1.1] ランダムフェールニューラルネットワーク(RFNN)は、高速なトレーニングを提供するが、隠された層アクティベーションの密度の高い表現のため、しばしば問題に悩まされる。
本稿では,RFNNの階層化と階層化を両立させるスパースフレームワークを提案する。
提案手法は, 1次元定常対流拡散方程式の場合の解の精度を維持し, 改善することを示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:48:43 GMT)
VNN-LIB 2.0: Rigorous Foundations for Neural Network Verification [1.0] 本稿では,ニューラルネットワークモデルフォーマットから必要となる最小限の意味的インターフェースを抽象的に特徴付けるEmphnetwork理論について紹介する。
次に、より表現力のあるクエリ言語のための形式構文、ネットワーク理論によって提供される数値領域上の型システム、そして最終的には形式意味論を示す。
したがって、VNN-LIB2.0は信頼できるニューラルネットワーク検証のための堅牢で厳格な基盤を提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:56:59 GMT)
FQPDR: Federated Quantum Neural Network for Privacy-preserving Early Detection of Diabetic Retinopathy [1.0] フェデレーテッド・ラーニング(FL)は、医療画像処理の大きな関心事であるデータのプライバシを保存する。
本稿では,この課題に対するフェデレート学習に基づく量子ニューラルネットワーク(フェデレーションQNN)を提案する。
限られたサンプルと、E-ophthaおよびRetina MNISTデータセットから学習可能なパラメータの少ないモデルを実装した。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:49:27 GMT)
Advances in quantum learning theory with bosonic systems [1.0] 本稿では,連続可変(CV)システムにおける量子学習理論の最近の進歩を概説する。
CVシステムは、ボゾン系および量子光学系を記述するため、自然と量子技術においてユビキタスである。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:59:40 GMT)
TAVIS: A Benchmark for Egocentric Active Vision and Anticipatory Gaze in Imitation Learning [1.0] アクティブビジョンは模倣学習の鍵となる能力として登場した。
アプローチを比較したり、アクティブなビジョンが貢献するものを定量化するための共有ベンチマークはありません。
本稿では,能動視覚模倣学習のための評価基盤であるTAVISを紹介する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:11:13 GMT)
Black-box model classification under the discriminative factorization [1.0] 我々は,ブラックボックスモデルレベルの分類の文脈において,高品質なクエリセットと低品質なクエリセットを区別するために,Emphdiscriminative factorizationを導入する。
そこで本研究では,推定判別フィールドを用いて選択した問合せ集合が,オラクル問合せ集合の試行順序を再現することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:32:35 GMT)
Is She Even Relevant? When BERT Ignores Explicit Gender Cues [1.0] 本稿では,オランダのBERTモデルにおいて,スクラッチから学習した性別情報がどのように出現するかについて検討する。
これはトランスフォーマーアーキテクチャにおいて、過剰な形態的性別マーキングとジェネリックフォームを組み合わせた言語のための最初のチェックポイントレベルのバイアス生成分析の1つである。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:48:22 GMT)
Human-Inspired Memory Architecture for LLM Agents [1.0] 6つの認知機構からなる生体記憶アーキテクチャを提案する。
各メカニズムは、単純メモリ蓄積の特定の障害モードに対処する。
S層スケール(50セッション)では、デダップベースのコンソリデーションにより、好みのリコールが+13.3pp向上する。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:52:37 GMT)
MORPH-U: Multi-Objective Resilient Motion Planning for V2X-Enabled Autonomous Driving in High-Uncertainty Environments via Simulation [0.9] 本稿では,不確実なイベント駆動更新に対して,動作計画と低レベル制御を堅牢にする方法について検討する。
本稿では,LiDAR/レーダー/カメラとV2X(CAM/DENM)を融合した閉ループスタックであるMORPH-Uをローカルダイナミックマップに提示する。
故障したV2Xトリガから安全でないリプランを避けるため、MORPH-Uはビザンチンにインスパイアされた軽量の受け入れゲートを追加した。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:27:10 GMT)
EGA: Adapting Frozen Encoders for Vector Search with Bounded Out-of-Distribution Degradation [0.9] 本稿では,3つの原理を結合した残留アダプタであるユークリッドジオデシックアライメント(EGA)を提案する。
コンバージェンスでは9,6.5%のトリップレットが勾配無しであり、目に見えない地域ではほとんど触れられていない。
EGAは4つの一次分割において最も最悪なラベル精度を達成し、5番目の分割では一貫した改善を達成している。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:58:44 GMT)
Hierarchical Prompting with Dual LLM Modules for Robotic Task and Motion Planning [0.9] ロボットタスクと運動計画のための階層型言語駆動型フレームワークを提案する。
提案システムは2つの大きな言語モデル (LLM) モジュールを用いる。
システム全体のタスク成功率は86%に達した。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:36:13 GMT)
PropSplat: Map-Free RF Field Reconstruction via 3D Gaussian Propagation Splatting [0.9] PropSplatは3次元異方性ガウスプリミティブを用いて無線周波数(RF)フィールドを再構成するマップフリーな伝搬モデリング手法である。
実世界の2つのデータセット上で,無線放射場法NeRF$2$,GSRF,WRF-GS+に対するPropSplatの評価を行った。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:24:06 GMT)
Collaborator or Assistnat? How AI Coding Agents Partition Work Across Pull Request Lifecycles [0.9] Initiator xr 分類法と6つの相互作用シナリオを用いて29,585のPRライフサイクルを分析した。
私たちは、協力者支援のスペクトルに沿ってツールを特徴付け、イニシアチブを再編成し、監視し、支持します。
我々は、PRにおける自動化、監視、およびガバナンスの研究のために、分類学、ツールごとのステートマシン、複製パッケージにコントリビュートする。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:06:54 GMT)
In-Situ Measurement of Beam Divergence in a High Efficiency SNSPD Platform [0.9] 我々は、光ファイバー結合検出器プラットフォームにおける検出事象を空間的に解決するために、飛行時間イメージング技術を実装した。
超高数値開口ファイバ,標準単モードファイバ,熱膨張コアファイバの空間検出プロファイルを測定した。
最小の光ファイバーモードを除いて、ビームの発散は見られません。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:33:42 GMT)
Data Contamination in Neural Hieroglyphic Translation: A Reproducibility Study [0.9] 古代および絶滅危惧言語は、NLPに固有の課題を提起する。
微調整M2M-100を用いた61.5BLEUの最近の研究
我々の再生はリリースされたモデルでわずか37.0 BLEUしか得られない。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:00:04 GMT)
Mage: Multi-Axis Evaluation of LLM-Generated Executable Game Scenes Beyond Compile-Pass Rate [0.9] コンパイルパスレートは、LLMコード生成における主要な評価信号である。
この領域では,コンパイル速度が機能的正確性と反相関があることが示されている。
独立した検証のために、ベンチマーク、ログの再生、レコード単位のメトリクスをリリースします。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:46:52 GMT)
Mind the Gap: Geometrically Accurate Generative Reconstruction from Disjoint Views [0.8] 本稿では,新たなパラダイムとして,不随意視点からの生成的再構築を紹介する。
提案するGLADOSは,3段階にわたって動作する汎用モジュール型フレームワークである。
アーキテクチャに依存しないフレームワークとして、GLADOSは、生成、再構築、塗装における将来の進歩のシームレスな統合を可能にする。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:24:23 GMT)
Statistical Convergence of Spherical First Hitting Diffusion Models [0.8] 第一打撃拡散モデル (FHDM) は、既知の多様体上のデータを生成するために調整された、テクティトランダム適応型生成時間を持つ特定の種類の拡散モデルである。
対数的因子により、FHDMは球状に支持されたソボレフスムーズなデータ分布の総変動における最小収束率を達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:54:09 GMT)
CommandSwarm: Safety-Aware Natural Language-to-Behavior-Tree Generation for Robotic Swarms [0.8] 本稿では,音声やテキストのコマンドからXML行動木(BT)を生成するための安全対応型言語to-behavior-treeパイプラインであるCommandSwarmを提案する。
このシステムは多言語翻訳、コマンドレベルの安全フィルタリング、制約付きプロンプト、LoRA対応の大規模言語モデル(LLM)、および4ビットプリミティブに対する決定論的検証を組み合わせる。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:06:36 GMT)
Combating Organized Platform Abuse: Amplifying Weak Risk Signals with Structural Information [0.8] 大規模なオンラインサービスプラットフォームは、組織化されたプラットフォームの乱用による深刻な問題に直面している。
本稿では,Fraudster の Trilemma を提案する: 組織的攻撃者は,スケール,低コスト,分散キャッシュアウトを同時に達成できない。
簡単な統計的手法を用いて、低精度個々の弱い信号を高精度な強い決定に変換する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:38:43 GMT)
Do not copy and paste! Rewriting strategies for code retrieval [0.8] 本研究では,スタイリスティック・リフレッシング,NL強化PseudoCode,およびフル自然言語転写の3つの書き直し戦略の階層構造について検討する。
我々は,NLに富んだPseudoCodeとスニペットレベルの自然言語を,一貫した中間体ではなく直接検索表現として評価した。
我々は,デルタH,トークンエントロピー,デルタHの2つの診断手法を導入し,デルタHが3つのリライターファミリーのQC下での検索ゲインを予測することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:31:26 GMT)
Neural Operators as Efficient Function Interpolators [0.8] ニューラル作用素 (NOs) は無限次元関数空間間の写像を学習するために設計されている。
我々はNOが標準のマルチ層パーセプトロンとコルモゴロフ・アルノルドネットワークとを精度良くマッチングまたは上回ることを示す。
TFNOアンサンブルは198.2keVのホールドアウトされたルート平均二乗誤差に到達し、最新のニューラルネットワークアプローチの1つである。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:30:12 GMT)
Pre-trained Tabular Foundation Models as Versatile Summary Networks for Neural Posterior Estimation [0.7] シミュレーションに基づくベイズ推論(SBI)のためのトレーニング不要でモジュラーな要約ネットワークTabPFNについて検討する。
PFN-NPE: シミュレータ出力のための固定要約ネットワークとして事前訓練されたTabPFNエンコーダを使用し、その結果の要約と、その問題に選択された下流推論ヘッドとをペアリングする一般的なレシピを提案する。
診断検査では,TabPFN由来のサマリーは有用な後部位置情報と限界情報を保持することが多い。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:07:10 GMT)
Rhamba: Region-Aware Hybrid Attention-Mamba Framework for Self-Supervised Learning in Resting-State fMRI [0.7] Rhambaは、ガイドマスクとハイブリッドアテンション・マンバアーキテクチャを統合してfMRI分析を行う、地域対応事前トレーニングフレームワークである。
モデルはABIDEデータセット上で、領域整合パッチ埋め込みと3つのマスキング戦略を用いて事前訓練された。
マスキングの戦略は再建行動に強く影響を与え、一貫した順序で再建の損失を被った。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:44:47 GMT)
Inference of Qualitative Models from Steady-State Data via Weighted MaxSMT [0.7] We introduced a robust inference method based on weighted MaxSMT。
我々のアプローチは、事前知識ネットワークから神経細胞の分化モデルを予測するのに有効であることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:34:50 GMT)
On the Complexity of the Matching Problem of Regular Expressions with Backreferences [0.7] 本稿では,バックREWBを用いた正規表現における文字列マッチング問題の微妙な複雑さについて検討する。
我々は最近,野上と寺内による$O(n2k-)$-timeを改良した$O(n2k-)$-time for $1$use REWBsを提案する(MFCS,2025)。
本アルゴリズムは, 接尾辞木, 遷移モノイドEX, 分解林データ構造, 弦の周期性など, 様々な手法を用いている。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:55:42 GMT)
Ask Early, Ask Late, Ask Right: When Does Clarification Timing Matter for Long-Horizon Agents? [0.7] 本稿では,エージェントの軌道の制御点における接地真実の明確化を提供する強制注入フレームワークを提案する。
明確化の価値は、どの情報が欠落しているかに大きく依存している。
300のセッションを補完する研究により、現在のフロンティアモデルは経験的に最適なウィンドウ内では問わないことが明らかになった。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:08:03 GMT)
Emergent Symbolic Structure in Health Foundation Models: Extraction, Alignment, and Cross-Modal Transfer [0.7] ヘルスファウンデーションモデル(FM)はウェアラブルセンサーから有用な表現を学習するが、それをコード化し、トレーニング後にその知識を伝達することは難しいままである。
本稿では,凍結した埋め込みをシンボルと呼ばれる解釈可能な方向に分解するポストトレーニングフレームワークを提案し,これらのシンボルを用いて埋め込み空間を再トレーニングせずに整列させる。
本研究では, フォトプレシー (写真) と加速度計データ (加速度計データ) の3つのFMの枠組みを, 172K 被験者のラベルなしデータの20M 分で独立に事前訓練し, 30K 被験者のホールドアウトコホートを解析した。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:03:14 GMT)
MIPIAD: Multilingual Indirect Prompt Injection Attack Defense with Qwen -- TF-IDF Hybrid and Meta-Ensemble Learning [0.7] MIPIADは英語とバングラ語で評価された防衛フレームワークである。
これは、Qwen2.5-1.5BからLoRA(XLPID)、TF-IDFレキシカル特徴、検証調整アンサンブルを通じて微調整されたシーケンスを組み合わせたものである。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:34:28 GMT)
TARO: Temporal Adversarial Rectification Optimization Using Diffusion Models as Purifiers [0.7] 拡散モデルによる逆の浄化は、データ多様体に向けて逆の例を投影しようとする。
最近の研究によると、標準拡散浄化は適応的な評価で失敗する可能性があり、テスト時間スコアに基づく最適化はより弾力性が高い。
本稿では,複数の認知的視点に先行して時間的に導出されたスコアを構築する推論時間浄化法TAROを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:02:57 GMT)
SparseRL-Sync: Lossless Weight Synchronization with ~100x Less Communication [0.7] フルウェイト転送をスパース更新ペイロードに置き換えるSparseRL-Syncを提案する。
SparseRL-Syncは帯域幅制限と高非同期RL設定におけるスケーラビリティとエンドツーエンドの効率を大幅に改善する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:34:51 GMT)
Zero-Shot Satellite Image Retrieval through Joint Embeddings: Application to Crisis Response [0.7] GeoQueryはゼロショット検索システムで、2段階のセマンティック検索とビジュアル検索によってデータと制約をサイドステップで計算する。
イギリスの洪水、アメリカの山火事、米国の干ばつを含む76の災害対応クエリに対して、GeoQueryは50,km以内で31.6%の精度を達成した。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:41:38 GMT)
System Test Generation for Virtual Reality Applications using Scenario Models [0.6] 我々はVRアプリケーションのための新しいテスト手法であるUltraInstinctVRを紹介する。
カバレッジと障害検出の観点から、最先端の自動VRテストアプローチと比較する。
以上の結果から,UltraInstinctVRは,異常検出のための既存の自動ツールよりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:07:35 GMT)
Don't Get Your Kroneckers in a Twist: Gaussian Processes on High-Dimensional Incomplete Grids [0.6] 数値的精度の高いプロセス回帰(GPR)を高次元設定で行う新しい手法であるCUTS-GPRを紹介する。
CUTS-GPRの鍵となるコンポーネントは、非常に高速なカーネルマトリックスベクター製品である。
CUTS-GPRは高次元ポテンシャルエネルギー表面のモデリングを可能にすることを実証する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:24:22 GMT)
Geometric Asymmetry in MoE Specialization: Functional Decorrelation and Representational Overlap [0.5] Mixture-of-Experts (MoE)アーキテクチャはスパースルーティングによってスケーラブルなキャパシティを実現する。
本稿では,関数空間と表現空間の両方においてMoE層を解析するための統一Jacobian-PCA-Grassmannフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:17:10 GMT)
CapCLIP: A Vision-Language Representation Alignment Approach for Wireless Capsule Endoscopy Analysis [0.5] ワイヤレスカプセル内視鏡(WCE)は小腸の非侵襲的視覚的評価を可能にする。
WCEの既存の学習ベースのアプローチは主に視覚のみであり、しばしば狭い病理セットに限られる。
本稿では,WCEのためのドメイン固有視覚言語表現学習フレームワークであるCapCLIPを紹介する。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:14:56 GMT)
Behavioral Determinants of Deployed AI Agents in Social Networks: A Multi-Factor Study of Personality, Model, and Guardrail Specification [0.4] 我々は,13人のOpenClawエージェントが,RedditのようなAIエージェントのためのソーシャルネットワークであるMoltbookにデプロイされる,制御された多要素実証研究を提案する。
我々は行動、言語、社会的指標を収集し、構成層が創発的な社会的行動を予測する方法を評価する。
本研究は,デプロイ型マルチエージェント社会システムに関する新興文献に実証的証拠を与えるものである。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:28:19 GMT)
Neural network quantum states in the grand canonical ensemble [0.4] フォック空間における対称ボソニック波動関数を表現できる量子状態アーキテクチャを提案する。
提案手法は,実用大標準系におけるキー測定可能な量の数値予測への扉を開く。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:18:11 GMT)
Enhanced LLM Reasoning by Optimizing Reward Functions with Search-Driven Reinforcement Learning [0.4] 本稿では,報酬仕様自体を最適化の対象として扱う検索駆動型フレームワークを提案する。
最高のアンサンブルは F1 = 0.795 95% ブートストラップ CI [0.756, 0.832]) と精度 0.660 [0.635, 0.686] を達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:11:09 GMT)
A Paired Point-of-Care Ultrasound Dataset for Image Quality Enhancement and Benchmarking via a cGAN Baseline [0.4] 深層学習と新しいペアデータセットを用いて,POCUS(point-of-care echo)デバイスの画像品質を向上させることを目的としている。
我々は、ローエンドPOCUSとハイエンド超音波画像のカスタム構築された自動ガントリーシステムを用いて、最初の正確にペア化されたデータセットを収集した。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:33:11 GMT)
Navigating the muddy waters of bias in artificial intelligence research: Understanding divergent meanings and conceptions [0.4] 研究コミュニティ全体は、バイアスの概念により効果的に関与する必要があります。
一部のサブコミュニティはバイアスを、技術的、計算的、統計学的手法によって捉え、緩和できる問題として見ているが、単に技術的な問題ではない。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:09:32 GMT)
The Proxy Presumption: From Semantic Embeddings to Valid Social Measures [0.4] セマンティック埋め込みと有効な社会対策のギャップを埋めるために,コンストラクト妥当性プロトコル(CVP)を導入する。
また,埋め込み空間におけるコンバウンディングを低減するために,ファクトファクトニュートラル化を提案する。
この研究は、コミュニティにプロキシを堅牢で科学的に保護可能な楽器に変換するツールキットを提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:03:44 GMT)
Geometry-enabled magnetic resilience in superconducting nanowire single-photon detectors [0.4] 超伝導ナノワイヤ単光子検出器(SNSPD)では、磁場が検出効率を大幅に低下させる。
本研究では, 固有検出効率(IDE)が低いバイアス電流で向上し, 高い電流で抑制されることを示す。
磁場下での超伝導デバイスの劣化を最小限に抑えることで、検出器集積スピン光学や原子量子プロセッサなどの応用が可能になる。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:11:51 GMT)
Playing games with knowledge: AI-Induced delusions need game theoretic interventions [0.3] 我々は,サイコファンティックなチャットボットが合理的エージェントにおいても妄想的信念を巻き起こすことを示した。
本稿では,エピステミックメディエータと呼ばれる推論時機構設計の介入を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:13:34 GMT)
TimeLesSeg: Unified Contrast-Agnostic Cross-Sectional and Longitudinal MS Lesion Segmentation via a Stochastic Generative Model [0.3] TimeLesSegは、その入力に時間次元の有無にかかわらずMS病変を分断するように設計されたコントラストに依存しない統合フレームワークである。
本手法は, 病変マスクと現在のスキャンを併用した病理組織学的先行をモデル化する。
クロスセクション処理は、事前情報が得られないトレーニングケースにモデルを公開することによって実現される。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:19:34 GMT)
GRaSp: Automatic Example Optimization for In-Context Learning in Low-Data Tasks [0.3] コンテキスト内学習により、大きな言語モデルで新しいタスクに適応できるが、そのパフォーマンスは選択された例に敏感である。
GRaSpは,テキスト内サンプルの自動最適化のための3段階フレームワークである。
まず、大規模な合成候補プールを生成し、クラスタ化と次元縮小で構成し、最後に、遺伝的アルゴリズムを用いて最適なインコンテキストの例を見つけることで、NERタスクに一貫した改善を示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:00:28 GMT)
GRASP -- Graph-Based Anomaly Detection Through Self-Supervised Classification [0.3] 高度な永続的脅威(APT)攻撃は、ステルス、適応性、正統なシステムコンポーネントの使用により検出が難しいままである。
マスク付き自己教師型分類に基づくPIDSであるGRASPを紹介する。
GRASPは、既知の攻撃関連活動を含む異常な動作を常に検出し、既存のシステムより優れていることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:45:36 GMT)
Quality-Conditioned Agreement in Automated Short Answer Scoring: Mid-Range Degradation and the Impact of Task-Specific Adaptation [0.3] 自動短解スコアリング(ASAS)は、差別的で微調整されたモデルから、数ショット設定で使用される大きな言語モデル(LLM)にシフトしている。
本研究では,異なるモデルのタスク固有適応度と品質条件のスコアリング合意との関係について検討する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:12:01 GMT)
GNN for Structural Displacement Prediction [0.3] 本研究では,グラフニューラルネットワーク(GNN)に基づくデータ駆動型フレームワークを提案する。
提案モデルでは, シミュレーションデータから直接, 適用負荷と構造応答の関係を学習する。
その結果,提案したGNNフレームワークは高精度に変位と回転を予測し,NNモデルより優れていた。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:24:23 GMT)
Query-efficient model evaluation using cached responses [0.3] データカーネル・パースペクティブ・スペース(DKPS)に基づくキャッシュモデル応答を利用したベンチマーク性能の予測手法を提案する。
DKPSに基づく手法は,クエリ予算を大幅に削減したベースラインと同じ平均絶対誤差を達成できることを実証する。
提案手法は,参照モデルにおける適合度を最大化するクエリ群を選択するためのオフライン手法である。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:24:06 GMT)
What Software Engineering Looks Like to AI Agents? -- An Empirical Study of AI-Only Technical Discourse on MoltBook [0.3] 自律型AIエージェントが、主に相互に相互作用するときに生み出す、ソフトウェアエンジニアリングの談話についてはほとんど知られていない。
本稿では,AIエージェントのみのソーシャルネットワークであるMoltBookにおける自律型AIエージェントの議論について検討する。
全体として、AIのみの技術談話は一貫性はあるが選択的である。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:38:30 GMT)
Spying Across Chiplets: Side-Channel Attacks in 2.5/3D Integrated Systems [0.3] サイドチャネル攻撃は、同じパッケージやスタック内のチップレットにまたがって実装可能であることを示す。
我々は、現実的な敵モデルを通じてこの脅威を形式化し、対応する攻撃原理を記述し、その実現可能性について実験的に評価する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:27:24 GMT)
An Automated Framework for Cybersecurity Policy Compliance Assessment Against Security Control Standards [0.3] PROPARAGは、セキュリティコントロールに対する組織的サイバーセキュリティポリシーを自律的に評価するための監査支援アプローチである。
それぞれのコントロールに対して、アプローチは関連するポリシエビデンスを取得し、カバレッジを評価し、欠落した要素を特定し、サポートされた説明とレコメンデーションを生成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:45:25 GMT)
PolarAdamW: Disentangling Spectral Control and Schur Gauge-Equivariance in Matrix Optimisation [0.3] PolarAdamWは、ムオンの極性スペクトル-ノルム制御を保存するが、ゲージ-等分散を破る制御ハイブリッドである。
DeiT-TinyはImageNet-1kの4つの独立した100クラスのサブセットをスクラッチからトレーニングした。
多重性基底自由度が非自明なSO(3)-同変3D点雲回帰では、Muonは監査された全容量でPolarAdamWより優れる。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:19:13 GMT)
Don't Learn the Shape: Forecasting Periodic Time Series by Rank-1 Decomposition [0.3] 24列の行列に1日1列の時間帯の電気系列は、およそ1ランクである。
最後のK=2サイクルの単純な平均よりも、スムーズ、縮小、低ランクのフィットが明らかにアップグレードされているように思える。
結果のFLAIRは(a)有効である:PatchTSTを集合GIFT-Eval(relMASE 0.838 vs 0.849)にマッチする
論文参考訳(メタデータ) (Fri, 08 May 2026 04:15:10 GMT)
Design and fabrication of a micro-ion trap with a 3D-printed loading zone for improved hot-ion capture [0.2] 我々は3Dプリンティング技術の最近の進歩を利用して、空間的に異なるローディングゾーンを持つマイクロイオントラップの設計と製造を行っている。
この設計は、イオン-電極分離を増加させることで、ローディングゾーンのMathieu-$q$パラメータを減らす。
この記事は、この設計を量子CCDアーキテクチャにどのように組み込むかという展望で締めくくっている。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:33:54 GMT)
Estimation of Motor Unit Parameters from Surface Electromyograms using an Informed Autoencoder [0.2] 運動単位パラメーターは、運動と力の予測に使用される神経力学モデルの忠実度を改善するためのポテンシャルを持つ。
運動単位パラメータの推定に関する既存の研究は、主にホワイトボックスモデリングに依存している。
本研究は、皮膚表面で非侵襲的に測定されたEMG記録から、複数の被検体特異的運動単位パラメータの同時推定を目標とする。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:05:23 GMT)
A Distributed Switching Protocol for Quantum Networks [0.2] フォトニック同期領域における未バッファのマルチドロップ量子ネットワークに対するスイッチングプロトコルを提案する。
2つの終端ノードは、最低経路コストで目標BSAノードを協調的に選択し、ネットワーク内の各パスを独立して予約する。
その結果,ネットワーク負荷が増大しても,安定した性能で高いリンク確立が達成された。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:04:28 GMT)
Direct-to-Event Spiking Neural Network Transfer [0.2] スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェア上での低消費電力計算の可能性から注目を集めている。
SNNの広く採用されているトレーニング戦略は、ニューロン実装のバックプロパゲーションを可能にするダイレクトコーディングである。
近年の研究では、直接符号化されたSNNはイベントベースのSNNに比べてエネルギー効率が著しく低いことが示されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:54:25 GMT)
Effective and Memory-Efficient Alternatives to ECC for Reliable Large-Scale DNNs [0.2] より信頼性の高い誤り訂正符号(ECC)の2つの軽量な代替案を提案する。
最初のアプローチであるMSETは、CNNとViTパラメータの最も脆弱なビットを選択的に強化する。
第2のアプローチであるCEPは、すべてのパラメータビットに対してきめ細かい保護を提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:11:15 GMT)
Commutativity from a single Bargmann invariant equality [0.2] 状態と可観測物の非可換性は量子論の基本的な署名である。
量子状態のペアワイズ可換性に対する普遍的な必要十分条件を提供する。
我々はPOVMのシミュラビリティと部分的なフォトニック識別性の解析への応用の可能性を挙げる。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:01:15 GMT)
NSMQ Riddles: A Benchmark of Scientific and Mathematical Riddles for Quizzing Large Language Models [0.2] 大規模言語モデル(LLM)は、様々な科学教育ベンチマークで優れた性能を示している。
LLMは西洋のデータセットで評価される傾向がある。
NSMQ Riddlesは、ガーナの国立科学・数学クイズ(NSMQ)コンペティションの科学と数学のリドルズの新たなベンチマークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:00:08 GMT)
Intelligent Truck Matching in Full Truckload Shipments using Ping2Hex approach [0.1] 欠落または破損した車両識別子は、従来の整合性アプローチを防ぎ、視認性のない出荷を継続する。
本稿では,確率的ランキング問題としてマッチングを定式化する機械学習システムであるIntelligent Truck Matching (ITM) 2.0を提案する。
ITM 2.0は北米では26ポイント、ヨーロッパでは14ポイントの精度向上を実現し、カバー範囲は倍増した。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:40:53 GMT)
Mask2Cause: Causal Discovery via Adjacency Constrained Causal Attention [0.1] 本稿では,予測前方通過時に,基礎となる因果グラフを直接復元するエンドツーエンドフレームワークを提案する。
推定因果構造を用いて予測モデルのパラメータ数を平均70%以上削減できることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:43:47 GMT)
CSR: Infinite-Horizon Real-Time Policies with Massive Cached State Representations [0.1] これらの特性の実用的なインスタンス化として,Cached State Representation (CSR) フレームワークを紹介した。
ASR(Asynchronous State Reconciliation)アルゴリズムは、状態メモリの解放を並列計算リソースにオフロードし、遅延スパイクを排除する。
オンプレミスのGPUサーバにワイヤレスで接続された物理ロボットでは、CSRは120Kトークンコンテキストに対して26倍のレイテンシ低減(14.67sから0.56s)を達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:30:44 GMT)
When Symbol Names Should Not Matter: A Logistic Theory of Fresh-Symbol Classification [0.1] この問題の固定ラベル分類バージョンについて検討し、列車と試験の例は遅延テンプレートを共有するが、不随意語彙を用いることがある。
次世代の予測とは異なり、モデルは目に見えないシンボルを出力する必要はない。
色付き衝突グラフによる偶発的トークン重複を符号化し、新しいシンボル分類のための高確率マージン・トランスファー保証を証明した。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:50:52 GMT)
Unsolvability Ceiling in Multi-LLM Routing: An Empirical Study of Evaluation Artifacts [0.1] 6つのベンチマークで206,000のクエリモデルペアを持つマルチ層LSMルーティングについて大規模に検討する。
報告された未解決性のかなりの部分は, 評価成果物に起因していることが示されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:49:24 GMT)
Delivering Science as a Service: Sci-Orchestra's Cloud-Native Approach to HPC [0.0] Sci-Orchestraは、実験的な操作を完全に自動化するために設計された、階層化されたオーケストレーションフレームワークである。
API駆動のインターフェースを通じて実行を抽象化することで、システムはセキュアな認証、リソース管理、スケーラブルなデプロイメントの責任を負う。
Sci-Orchestraの重要なイノベーションは、組織間コラボレーションの触媒となる、自律的なマーケットプレースである。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:03:40 GMT)
Quantum trajectory simulation of two-dimensional non-equilibrium steady states with a trapped ion quantum processor [0.0] 我々は,2次元のボソン系を発生源に駆動し,正方形格子の反対側の角にドレインする量子軌道を実験的に実現した。
この粒子のイン/アウト流から生じる持続電流をもつ非平衡定常状態について検討する。
我々の発見は、このコーナー駆動の2次元構成におけるリッチな物理を浮き彫りにして、量子コンピュータのパワーと現在の限界を研究プラットフォームとして示している。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:01:12 GMT)
svPITE: A Python package for the state-vector-based probabilistic imaginary-time evolution algorithm [0.0] 本稿では,確率的想像時間進化アルゴリズムに基づく地中準備のためのPythonパッケージを提案する。
標準ショットベースシミュレーションもサポートされており、結果は正確な対角化に対してベンチマークすることができる。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:34:02 GMT)
Zero-Shot Imagined Speech Decoding via Imagined-to-Listened MEG Mapping [0.0] 非侵襲的な脳記録から想像された音声を復号することは困難である。
本稿では,音声聴取時に,よりリッチで信頼性の高いラベル付き録音を活用する,想像音声の復号化のための新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:56:19 GMT)
WiCER: Wiki-memory Compile, Evaluate, Refine Iterative Knowledge Compilation for LLM Wiki Systems [0.0] 我々は17のRepLiQAドメイン間のコンパイルギャップを特徴付ける(6,800の質問)。
本稿では,このギャップを埋める反例誘導抽象化改良(CEGAR)にインスパイアされた反復アルゴリズムであるWiCERを提案する。
全17項目のアブレーションにより、汎用ピンニング(+0.16)ではなく、ターゲット診断(+0.95)がゲインを駆動していることが確認された。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:25:16 GMT)
Why Retrying Fails: Context Contamination in LLM Agent Pipelines [0.0] コンテキスト汚染リスタートモデルを導入する。
汚染されたコンテキストで動作するTツールコールステップのチェーンである。
このモデルでは、5つの主要な結果が導出されます。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:50:40 GMT)
Where's the Plan? Locating Latent Planning in Language Models with Lightweight Mechanistic Interventions [0.0] 前方通過時に構造的に制約された未来のトークンの内部表現が形成される言語モデルにおける計画的サイト形成について検討する。
Qwen3, Gemma-3, Llama-3の2つの軽量な手法(線形探索とアクティベーションパッチ)を10以上のスケールで適用する。
我々はGemma-3-27Bハンドオフを2段階の経路パッチで5つの注意点にローカライズする。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:44:21 GMT)
When the Ruler is Broken: Parsing-Induced Suppression in LLM-Based Security Log Evaluation [0.0] 完全に機能的なモデルが完全に非機能なカテゴリに現れる可能性のある,無音で体系的な評価誤差のクラスを実証する。
SOC-Bench v0は、標準化された13のカテゴリの脅威分類、最小統計パワー要件、ファジィフィールド抽出仕様、および将来のSOC研究における特定の精度の歪みを防ぐための公開スコアリングスクリプトからなるベンチマークフレームワークである。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:03:11 GMT)
When Attention Beats Fourier: Multi-Scale Transformers for PDE Solving on Irregular Domains [0.0] msatは複素幾何学問題に対する最先端の一般化を実現する。
textbfMulti-Scale Attention Transformer (msat)は、ソリューション履歴をトークンシーケンスとしてエンコードし、エンドツーエンドにトレーニングする。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:23:13 GMT)
Vibe coding before the trend [0.0] 学生は、AIツールが構文から高階思考に焦点を移したと報告した。
非技術系学生はこれらのツールがもたらすアクセシビリティに対して最も高い評価を示した。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:56:57 GMT)
Universal Symmetry-Breaking Dynamics at Continuous Phase Transitions: Evidence for a New Dynamical Critical Exponent [0.0] 連続相転移における突然の対称性を破るクエンチの後に現れる、これまで認識されていなかった普遍的挙動の形式を同定する。
以上の結果から,本研究はIsingモデルを超えて拡張できる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:57:52 GMT)
Typical Mixing and Rare-State Bottlenecks in Open Quantum Systems [0.0] オープン量子系における混合は、しばしば1つの最悪のケース時間によって要約される。
広い非構造的アンサンブルに対して、非線形トレース距離緩和曲線自体が決定論的平均の周りに集中していることが示される。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:46:13 GMT)
Transfer Learning for Dead Fuel Moisture Prediction Using Time-Warping Recurrent Neural Networks [0.0] 10h FMCで事前訓練したRNNを用いて1h,100h,1000h燃料のFMCを予測する。
オクラホマ州で行われたランドマークフィールド研究のデータを用いて,本手法の有効性を検証した。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:37:22 GMT)
Towards second-long electron spin coherence of a telecom quantum emitter in naturally abundant CeO$_2$ [0.0] エルビウムドープ酸化セリウム(CeO$$)は、ホストマトリックス中の核スピンの超低濃度のため魅力的な候補である。
希薄ドーピング濃度(約10ppb)とケルビン以下の温度では,クロック遷移近傍での動作により,コヒーレンス時間が第2の時間スケールに近づくことが示されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:36:32 GMT)
Towards an Inferentialist Account of Information Through Proof-theoretic Semantics [0.0] 我々は、情報に対する推論的意味論の発展に向けて第一歩を踏み出した。
私たちは真実を推論可能性に置き換え、この置き換えの結果を辿ります。
P-tSを用いて,情報単位の推論的プリミティブ(inferon)の数学的理論への第一歩「インフェロン(inferon)」を開拓する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:37:01 GMT)
Topic Is Not Agenda: A Citation-Community Audit of Text Embeddings [0.0] 我々は358万の科学論文の上に、補助的な引用グラフを構築した。
4つの最先端の埋め込みは、L1バーを合理的にクリアするが、L2で動くのをやめる。
絶対的に言えば、10件の回収された論文のうち8件は未成年者である。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:43:17 GMT)
Three-in-One World Model: Energy-Based Consistency, Prediction, and Counterfactual Inference for Marketing Intervention [0.0] 本稿では、Deep Boltzmann Machineが、人口統計学、時間、タグ付けされた行動と結果から凍結した信念表現を学習する3-in-Oneの世界モデルアーキテクチャを提案する。
同じ信念は、(i)DBMの自由エネルギーによるエネルギーベース評価、(ii)アダプタによる結果予測、(iii)反実的推論の3つのタスクをサポートする。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:47:44 GMT)
The two-flavor Schwinger model at 50: Solving Coleman's puzzles [0.0] 我々はコールマンの3つのパズルを解くための解析的および数値計算を提案する。
これらのパズルは、等しいフェルミオン質量が$=0$で$=$である理論と、フェルミオン質量が不等式であるときのイソスピン破れ効果のサイズに関係している。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:32:20 GMT)
The extended Wigner's friend, many- and single-worlds and reasoning from observation [0.0] i) 孤立系の近似が測定ライクなプロセスが関与する場合に有効かどうかが疑わしい; (ii) フラウキガーとレンナーの実験から、*主観的崩壊*を含む量子論の解釈が失敗する; (iii) 単一世界と量子論の多世界(相対状態)の解釈を区別しない; (iv) 観測からの推論は、それが妥当であるなら、それらの観測の量子的評価を考慮に入れなければならない; (v) 単一世界解釈は、ある種類の場合、有効である。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:31:54 GMT)
The University AI Didn't Replace -- Rethinking Universities in the AI Era [0.0] ジェネレーティブ・人工知能(AI)は高等教育を改組しているが、多くの大学は、AIのイノベーションが非公式に発生し、機関的な認識が得られない、導入の初期段階にある。
本稿では,大学におけるAI導入の4つのレベルを説明する枠組みについて述べる。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:07:55 GMT)
The Propagation Field: A Geometric Substrate Theory of Deep Learning [0.0] 終端等価モデルが軌跡とヤコビアン構造において桁違いに異なることを示す。
制御された教師フローとPDEシステムでは、エンドポイントフィッティングは、基礎となる伝搬法則の回復に失敗する。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:26:50 GMT)
Testing Catability and Coherent Superposition of $2\mathcal{D}$ Graphene via Lie Algebra [0.0] 適合性は、コヒーレント状態の組み合わせ内の相対位相変化に敏感な機能尺度として定義される。
統一フレームワークは、リー対称性解析とグリーン関数伝播理論を組み合わせることで構築される。
結果は、低次元量子材料システムにおけるコヒーレンス、干渉安定性、および量子状態制御をテストするための構造化経路を提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:19:15 GMT)
Task Relevance Is Not Local Replaceability: A Two-Axis View of Channel Information [0.0] 局所的な置換性は、目標の関連性よりも除去性への信頼性の高いガイドである。
局所的な置換性は、目標の関連性よりも除去性への信頼性の高いガイドである。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:09:39 GMT)
TRAS: An Interactive Software for Tracing Tree Ring Cross Sections [0.0] Tree Ring Analyzer Suite (TRAS) は、木断面画像中のツリーリングの自動記述、手動補正、測定のためのオープンソースソフトウェアである。
TRASは、古典的な画像処理手法CS-TRDとディープラーニングアプローチDeepCS-TRDとINBDの3つの補完的な検出アルゴリズムを統合している。
DeepCS-TRDはFスコア81.0%、精度86.4%で最高の自動検出性能を達成した。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:11:38 GMT)
Spin Chains for Quantum Information Processing [0.0] 仮想的な励起と最適化された境界結合に基づくプロトコルは、その速度、絡み合い、製造不完全性やノイズに対する頑健性などにおいて一貫して優れることを示す。
仮想結合プロトコルの特徴は、スケーラブルな量子技術における実験的実装の可能性を強調している。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:09:02 GMT)
SeBA: Semi-supervised few-shot learning via Separated-at-Birth Alignment for tabular data [0.0] ラベル付けされていないサンプルのプールでラベル付けされた少ないデータから学習するためのSeBA(Separated-at-Birth Alignment)を提案する。
SeBAは、データを2つの独立した、しかし相補的なビューに分割し、1つのビューの表現を調整し、第2のビューにおけるデータの最も近い隣の対応を反映することを目的としている。
様々なベンチマークデータセットで実施された実験により、SeBAがほとんどのケースで最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:03:31 GMT)
SSP-based construction of evaluation-annotated data for fine-grained aspect-based sentiment analysis [0.0] 韓国評価注釈コーパスの構築について報告する。
感情や非感傷的言語パターンを含むeコマースレビューをカバーしています。
評価のために、KoBERTとKcBERTモデルはアノテーション付きデータセットでトレーニングされ、F1 0.88とF1 0.90の堅牢なパフォーマンスを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:52:37 GMT)
SL5 Standard for AI Security [0.0] セキュリティレベル5(SL5)は、AIシステムのセキュリティ姿勢であり、トッププライオリティ操作を確実に阻止することができる。
このSL5標準の最初の改訂は、長いリードタイムの要求に焦点を当てている。
いくつかの要件は、プライベートセクターアプローチが不十分な政府のセキュリティ機能に近似している。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:15:58 GMT)
SCENE: Recognizing Social Norms and Sanctioning in Group Chats [0.0] マルチパーティチャットにおける暗黙の規範と社会的制裁に焦点を当てたソーシャルインタラクションベンチマークであるSCENEを紹介する。
SCENEは、隠された規範に従うスクリプト付きペルソナで、もっともらしい非ロールプレイシナリオを生成する。
本稿では,2つの機能適応能力に対する行動評価指標を提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:53:04 GMT)
SARC: A Governance-by-Architecture Framework for Agentic AI Systems [0.0] エージェントAIシステムは、ツール、サブエージェント、外部サービスを通じてますます機能するが、ガバナンスコントロールは、プロンプト、ダッシュボード、ポストホックドキュメンテーションにアタッチされることが多い。
SARCは、制約をステート、アクションスペース、報酬と共に第一級の仕様オブジェクトとして扱うツール使用エージェントのためのランタイムガバナンスアーキテクチャである。
SARCは厳密な述語の下でゼロのハードコントラスト違反を実行し、その宣言されたPAAのスロットリング応答は、ポリシー・アズ・コードのみと比較して、ソフトウインドウのオーバーアーを89.5%削減する。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:34:36 GMT)
Revisiting the syntax of imperatives in Yemeni Arabic: An Agree across phases approach [0.0] AAPアプローチは単純な命令型と複雑な命令型の両方をうまく説明できると私は論じます。
本研究は, インペラティブに関連付けられた解釈的, 実行的機能によって, このインタフェースが動機付けされていることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:14:22 GMT)
Resilience of IEC 61850 Sampled Values-Based Protection Systems Under Coordinated False Data Injections [0.0] 本稿では,サンプル値(SV)プロトコルをターゲットとしたFalse Data Injection Attacks (FDIA) の下でIEC 61850ディジタルサブステーションのレジリエンスを評価する。
SVのマルチキャストの性質は、保護機能を妨害し大規模な停止を引き起こすサイバー侵入にサブステーションを露出させる。
抑止、予防、検知、緩和、レジリエンスをカバーする防衛戦略を解析する。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:08:51 GMT)
Reflective Prompted Policy Optimization: Trajectory-Grounded Revision and Salience Bias [0.0] 本稿では,コンパクトなポリシークラスに対するポリシー探索のための2段階LLMフレームワークを提案する。
Critic-LLMは、結果のロールアウトを検査し、観察された状態、行動、報奨に基づくターゲットリビジョンを提案する。
R2POは10の環境で最高の報酬を得る。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:26:40 GMT)
Reducibility of native weighted graphs on Rydberg Arrays [0.0] 最大独立集合 (MIS) と最大重み付き独立集合 (MWIS) のランダム単位ディスクグラフ (UDG) の古典的再現性について検討した。
残りの有限個のカーネルでは、量子実行はリソースオーバーヘッドがかなり大きい非ネイティブな埋め込みを必要とする。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:18:09 GMT)
Quantum jump unravelings for non-Markovian open system dynamics: a review [0.0] 非マルコフ系の量子ジャンプ解法について概説する。
また、それらの数値効率、可視性要件、ヒルベルト空間拡張、測定解釈についても論じる。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:33:07 GMT)
Quantum Realizability of Probabilistic Theories Stable under Teleportation [0.0] 我々は、正確に2つの族が量子化可能であること、すなわち$K_4_1234$と$D_4_125$を証明し、残りの5つの族は量子化を認めない。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:56:05 GMT)
Prototype Guided Post-pretraining for Single-Cell Representation Learning [0.0] 遺伝子発現データからの単一細胞表現学習は、細胞機能の基礎となる複雑な制御ロジックを明らかにする手段を提供する。
遺伝子をトークンとして扱い、細胞を文として扱う、いくつかの単細胞事前訓練モデルが最近提案されている。
本稿では,単細胞基礎モデルの事前学習段階と微調整段階の間で動作するポストプレトレーニング手法であるCellRefineを紹介する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:08:10 GMT)
Prompt Engineering Strategies for LLM-based Qualitative Coding of Psychological Safety in Software Engineering Communities: A Controlled Empirical Study [0.0] 本研究では,3つの大規模言語モデル(LLM)を2つの迅速なエンジニアリング戦略で制御した経験的評価を行った。
その結果,複数発のプロンプトによりクロード俳句との合意が大幅に改善したことが示唆された。
全てのモデルで「負のフィードバックを共有する」という体系的な過剰予測が特定される。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:16:01 GMT)
Political Plasticity: An Analysis of Ideological Adaptability in Large Language Models [0.0] ポリティカル・プラスティック(Political plasticity)とは、ユーザが提供したコンテキストに基づいて、モデルが応答に適応する能力である。
この研究は、ユーザのプロンプトなど、政治的偏見を誘発するいくつかの方法を探究した。
質問の感覚を反転させると、ほとんどのモデルでは予期せぬ、直感に反する変化が明らかになる。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:21:58 GMT)
Phonon-assisted charge-cycling of nitrogen-vacancy centres in diamond [0.0] サブ共鳴電荷サイクリングはフォノンによる反ストークス励起から生じることを示す。
低エネルギー音響フォノンはZPLに近い遷移に強く寄与する。
43,meVモードの長波長では、さらに電荷循環力学に影響を及ぼす。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:35:36 GMT)
PYTHALAB-MERA: Validation-Grounded Memory, Retrieval, and Acceptance Control for Frozen-LLM Coding Agents [0.0] 本稿では,ローカル検証条件付きコード生成のための軽量外部コントローラであるPYTHALAB-MERAを紹介する。
厳密な検証ゲートを持つ強化学習コーディングタスクにおけるローカルCLIアーティファクトとしての実装を評価する。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:39:32 GMT)
PSK@EEUCA 2026: Fine-Tuning Large Language Models with Synthetic Data Augmentation for Multi-Class Toxicity Detection in Gaming Chat [0.0] 本稿では,ゲームコミュニティにおける有害行動理解のためのEEUCA 2026共有タスクについて述べる。
このタスクは、World of Tanksのチャットメッセージを、非毒性、侮辱/フラーミング、その他の攻撃、ヘイト/ハラスメント、脅威、過激主義の6つの毒性カテゴリに分類する。
本稿では,エンコーダベースモデル,LoRAファインチューニングによる命令調整 LLM ,階層分類,ワン・vs-rest 戦略,各種アンサンブル手法など,さまざまなアプローチについて検討する。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:48:31 GMT)
PPI-Net connects molecular protein interactions to functional processes in disease [0.0] PPI-Netは、タンパク質とタンパク質の相互作用ネットワークと経路レベルの表現を統合する階層的なグラフニューラルネットワークである。
患者固有の分子プロファイルはSTRINGの共有相互作用ネットワークに埋め込まれている。
PPI-Netは、複数のコホートで90%を超える精度で、堅牢な予測性能を達成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:04:28 GMT)
Optimal FALQON for Quantum Approximate Optimization via Layer-wise Parameter Tuning [0.0] 本稿では,階層ごとの時間ステップ($_k$)とスケーリング係数($M_k$)を決定変数として扱う最適化ベースの定式化であるOptimal FALQONを提案する。
その結果, 評価されたベンチマークにおいて, 成功確率, 評価効率, 深さ正規化コストの統計的に有意な改善が見られた。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:55:49 GMT)
Operating Within the Operational Design Domain: Zero-Shot Perception with Vision-Language Models [0.0] 視覚言語モデル(VLM)は視覚認識と言語推論を統合し、タスク固有のトレーニングデータなしで機能する。
本研究は, 安全クリティカルなアプリケーションにおいて, 透過的かつ効果的なODDに基づく認識の道を開くものである。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:17:56 GMT)
On the single-Hessian Gaussian wavepacket dynamics [0.0] 単 Hessian Gaussian wavepacket dynamics (GWD) は、ヘラーの局所高調波GWDの計算負担を大幅に削減する。
局所調和版とは異なり、この方法はガウス波束の多様体上の非正準シンプレクティック構造を保存する。
また、単一ヘッセン・ガウス波束の幅を一般ポテンシャルで正確に進化させるための明示的な表現や、大域的高調波ポテンシャルにおける波束全体の正確な進化を提示する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:42:59 GMT)
Nürnberg NLP at PsyDefDetect: Multi-Axis Voter Ensembles for Psychological Defence Mechanism Classification [0.0] PsyDefDetectでは8つの正の防衛カテゴリーが表面言語を共有しており、実用的機能だけが異なる。
この知見を3つの軸にまたがる9声のアンサンブルに変換する。
システムは隠れたテストセットで$Ftest=.420$に達し、21の登録チームの中で第1位となる。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:32:31 GMT)
Nonselective generalized measurements as a resource for quantum thermal machines in a double quantum dot [0.0] 逐次的非選択的一般化測定に基づく量子熱機械について検討する。
デチューニングとトンネルの競合は、局所化された状態をハイブリダイズし、サイクルのエネルギー的応答を変化させる。
コヒーレントな相互結合は、測定力を持つ量子熱機械を最適化するための重要な資源として機能する。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:56:46 GMT)
Neurally-plausible radial basis kernels using distributed Fourier embeddings [0.0] コヒーレントで連続的な空間表現は、物理的および知覚的な現象を単一の表現空間に合成するために重要である。
本研究では,空間意味ポインタのニューラルネットワークで実現可能な共通ラジアルベースカーネルを特徴付け,解析することを目的とする。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:26:33 GMT)
Multivariate Financial Forecasting using the Chronos Time Series Foundation Models [0.0] クロノス2を用いて、経済・財政予測のための事前訓練された時系列モデルを評価する。
データセット全体にわたって、MV予測は一貫してUV予測を上回っている。
株価と金利市場での時系列の混合は、予測精度を低下させる。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:04:19 GMT)
Microwave Power-to-Frequency Transduction via Injection Pulling of a Self-Sustained Oscillator for Rydberg Superheterodyne Sensing [0.0] 自己持続型発振器(SSO)がマイクロ波検出のための動的摂動型局所発振器(LO)として機能する。
6Sから6Pから49Dへの移行に対処する852nmのプローブと510nmのカップリングレーザを備えたセシウムラグ方式で5.49GHz近くで動作する。
その結果、動的摂動型LOとRydberg原子読み出しを組み合わせた電力-周波数変換が実証された。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:43:05 GMT)
Mesoscopic Regimes of Temporal Entanglement in Ergodic Quantum Systems [0.0] 相互作用量子系の時間相関を半無限量子イジング鎖の影響関数を用いて研究する。
以上の結果から,ジェネリックハミルトニアン力学における豊富な時間構造が明らかとなり,実験的および数値的時間スケールにおける既存のランダム回路パラダイムの限界が指摘された。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:09:34 GMT)
Measuring What Matters: Benchmarking Generative, Multimodal, and Agentic AI in Healthcare [0.0] 医療AIの主な課題は、パフォーマンスのみではなく、実際の状況下での信頼性、安全性、臨床関連性を測定する体系的な方法がないことである。
現在のベンチマークでは、モデルが知っていることをテストしています。
高いベンチマークスコアは、デプロイの準備ができているという誤った感覚を与え、パフォーマンスとユーティリティのギャップを正確に広げる。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:12:14 GMT)
Mazocarta: A Seeded Procedural Deckbuilder for Instrumented Game Development [0.0] MazocartaはRustで実装された、シード化された手続き型戦術デッキビルダーで、ブラウザプレイ用にWebAssemblyにコンパイルされ、シミュレーションのために実行可能である。
本稿では,Mazocartaのアーキテクチャ,決定論的実行モデル,再現可能なバランスプローブ,QRを用いたローカルマルチプレイヤーのペアリングについて述べる。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:27:31 GMT)
Machine-learned, finite temperature Fermi-operator expansions suitable for GPUs and AI-hardware [0.0] 2次スペクトル投影法(SP2)に基づく有限温度再帰的フェルミ演算拡張スキームを提案する。
最適化された拡張係数を決定するために機械学習モデルを構築した。
現状の対角化と比較すると, 単一粒子の有限温度密度行列計算において, 磁化のオーダー・オブ・マグニチュード・スピードアップが達成される。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:15:11 GMT)
MPD$^2$-Router: Mask-aware Multi-expert Prior-regularized Dual-head Deferral Router in Glaucoma Screening and Diagnosis [0.0] L2D(Learning-to-defer)は、緑内障のスクリーニングをより安全にするために、難しいケースや不確実なケースをヒトにルーティングする。
我々は,眼科トリアージを制約付きAIルーティングとして再放送するマスク対応マルチエキスパート・デフェラル・フレームワークをMPD$2$で導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:10:57 GMT)
Limits of Stable Near-Field Probing in Nanophotonic Traps [0.0] 近接場は、原子や分子から顕微鏡的生物学的および合成粒子まで、光学的に相互作用するために用いられる。
本研究では, この効果により, 近接場を有する粒子の光探査が本質的に過渡過程であることを実験的に実証した。
本研究は,ナノフォトニック構造への粒子の安定な結合が要求される多くの状況に関係している。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:35:50 GMT)
LUCAS-MEGA: A Large-Scale Multimodal Dataset for Representation Learning in Soil-Environment Systems [0.0] 欧州の土壌環境観測の系統的なデータ融合によって構築された大規模データセットであるLUCASMEGAを紹介する。
データセットは70,000以上のサンプルと、物理的、化学的、環境的、生物学的、視覚的属性にまたがる1,000以上の特徴で構成されている。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:33:51 GMT)
Kochen-Specker nonlocal hidden variables must include time-ordering to allow for measurement independence of several agents [0.0] 我々は、文脈非局所隠れ変数を、時空外のリポジトリに既存の可能性として格納するオントロジーを考察する。
いくつかのエージェントを含むベル型実験において、このオントロジーが整合であるためには、コンテキストは実行可能な測定だけでなく、異なるエージェントの選択の時間順序も含まなければならない。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:26:22 GMT)
Kettle: Attested builds for verifiable software provenance [0.0] Kettleは、Trusted Execution Environments(TEEs)内に構築されたソフトウェアに対して、暗号的に検証可能な証明を生成する
Kettleビルドは、ソースコミット、依存関係セット、ツールチェーン、ビルド環境、出力アーティファクトのダイジェストを、測定された機密VM内で生成された証明ドキュメントに記録する。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:18:02 GMT)
Implicit Multi-Camera System Calibration Using Gaussian Processes [0.0] 本稿では,ガウス過程(GP)レグレッションを用いた暗黙的マルチカメラシステムキャリブレーションのための新しいフレームワークを提案する。
我々のGPベースのモデルは、全カメラにわたる2次元画像座標から3次元世界座標への複雑な非線形マッピングを直接学習する。
実験の結果,3次元予測の不確かさはカメラに近づきつつあることがわかった。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:29:58 GMT)
Hybrid TF--IDF Logistic Regression and MLP Neural Baseline for Indonesian Three-Class Sentiment Analysis on Social Media Text [0.0] 本稿では,インドネシアのソーシャルメディアテキストを対象としたコンパクトな3クラス感情分析研究について述べる。
タスクは、きめ細かい感情データセットから得られる正、負、中立の出力で定式化される。
比較のために、この研究は、同じハイブリッド特徴表現上の2層多層パーセプトロン(MLP)を用いた神経ベースラインも含んでいる。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:31:25 GMT)
Hybrid Qubit-Qutrit Quantum Battery: Nonclassicality and Energy Performance [0.0] 本研究では,スピン1/2とスピン-1を混合したハイブリッド量子ビット量子電池の提案と解析を行う。
系の非古典的性質は、コヒーレンスと負性性の l1-ノルムを用いて特徴づけられる。
理論モデルと実験的に実現可能なニッケルラジカル分子複合体との接続を確立する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:55:24 GMT)
Hybrid Quantum-Classical Logistic Regression for Calibrated Classification of Pulsar Candidates [0.0] 我々は、不均衡なHTRU-2データセット上でのハイブリッド量子-正則ロジスティック回帰を評価する。
我々は、角符号化、振幅符号化、データ再アップロードの3つの量子特徴符号化を使用する。
アングル符号化は、量子ロジスティック回帰変種の中で最強のパフォーマンスを与える。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:25:25 GMT)
Higher-order quantum processes respecting closed labs in a spacetime have quantum controlled causal order [0.0] 長いあいだのオープンな疑問は、ポストセレクションなしで物理的な実現を認める最も大きな抽象プロセスのクラスである。
相対論的因果原理に基づくトップダウンアプローチを用いた厳密な回答を提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:01:12 GMT)
High-Fidelity Surface Splatting-Based 3D Reconstruction from Multi-View Images [0.0] Implicit moving Least Squares (IMLS) は、点雲を符号付き距離とテクスチャ場へ直接変換することができる。
ローカルサポートと柔軟性が向上し、周波数コンテンツの制御性が向上したコンパクトカーネルを導入する。
実験では、表面の再構成とレンダリングの両方において最先端の性能を示し、より正確な幾何学とよりシャープな視覚を与える。
論文参考訳(メタデータ) (Fri, 08 May 2026 05:23:28 GMT)
Hierarchical Multi-Scale Graph Neural Networks: Scalable Heterophilous Learning with Oversmoothing and Oversquashing Mitigation [0.0] Hierarchical Multi-view HAAR (HMH) は、ほぼ直線時間でスケールする新しいグラフ学習フレームワークである。
HMHは最先端のスペクトルベースラインを上回り、ノード分類が最大3%改善し、グラフ分類データセットが7%向上した。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:35:17 GMT)
Hardware-Free Polarization Stabilization for Measurement-Device-Independent Quantum Key Distribution via Correlated Twirling [0.0] 本稿では,ハードウェアフリーの偏光安定化手法を提案する。
このプロトコルは、完全に仮想後処理ステップとして実行され、2/3の係数で固有のチャネルノイズを数学的に抑制する。
デコイ状態の弱いコヒーレントパルスと親和性のあるこのアルゴリズムは、堅牢な長距離量子ネットワークのための高度にスケーラブルでリソース効率の高いフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 08 May 2026 04:27:30 GMT)
Hallucination Detection via Activations of Open-Weight Proxy Analyzers [0.0] 大規模言語モデルにおける幻覚を検出するためのプロキシ・アナライザ・フレームワークを提案する。
生成モデルの内部を見る代わりに、ローカルにホストされた小さなオープンウェイトモデルを通して既存のテキストを読み、幻覚を見つける。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:57:41 GMT)
HPC-LLM: Practical Domain Adaptation and Retrieval-Augmented Generation for HPC Support [0.0] 汎用大規模言語モデル(LLM)は、有用なコーディング支援を提供するが、信頼できるHPCサポートに必要なドメイン固有の運用知識を欠くことが多い。
本稿では、Slurmスケジューリング、MPI実行、GPU利用、管理、クラスタトラブルシューティングなど、一般的なHPCをサポートするために設計された検索拡張およびドメイン適応型アシスタントであるHPC-LLMを提案する。
提案するフレームワークは,自動ドキュメンテーションの取り込み,高密度検索,QLoRAを使用した軽量ドメイン適応,モジュールオーケストレーションパイプライン内のローカル推論を統合する。
論文参考訳(メタデータ) (Fri, 08 May 2026 03:54:45 GMT)
HEART: A High-Efficiency Adaptive Real-Time Telemonitoring Framework for Secure Electrocardiogram Signal Transmission Using Chaotic Encryption [0.0] 心電図心電図信号のリアルタイム解析と安全な送信は,遠隔医療における患者のプライバシの正確な診断と保護に重要である。
本研究では,各患者のECG信号特性から学習可能な鍵生成器LKGを用いて,独自の暗号鍵を動的に生成する新しいリアルタイムECGモニタリングシステムを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:25:53 GMT)
HBEE: Human Behavioral Entropy Engine -- Pre-Registered Multi-Agent LLM Simulation of Peer-Suspicion-Based Detection Inversion [0.0] 適応OPSECがLLMディレクティブとして実装可能な制御環境では、ピア・サスペクション・カスケード検出を反転させる。
我々は,シミュレータ,事前登録文書,凍結シナリオ,生テレメトリ,分析パイプラインをオープンソースライセンス下でリリースする。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:19:21 GMT)
Graph neural network explanations reveal a topological signature of disease-associated hubs in biological networks [0.0] 乳癌RNA-seqデータにおける疾患関連構造の同定に広く用いられている4つのアプローチについて検討した。
説明手法が異なる信号組織を復元することを示す。
本稿では,シェルベースハブスコアと説明者間のコンセンサスランキングを組み合わせたフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:29:36 GMT)
Graph Computation Meets Circuit Algebra: A Task-Aligned Analysis of Graph Neural Networks for Electronic Design Automation [0.0] EDA問題はグラフ構造化されているが、グラフ構造化された全ての問題は、同じGNN計算を必要とするわけではない。
我々は、GNN-for-EDA手法が目的タスクのネイティブ代数と伝播、集約、および監督を協調する手法であると主張している。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:24:33 GMT)
Gradient-Based LoRA Rank Allocation Under GRPO: An Empirical Study [0.0] 強化学習におけるLoRA転送の適応的ランク割り当てについて検討する。
比例的ランクアロケーションは、均一なアロケーションに比べて4.5ポイントの精度を低下させる。
この失敗の背後にある2つのメカニズムを特定します。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:22:38 GMT)
Gradient Flow Structure and Quantitative Dynamics of Multi-Head Self-Attention [0.0] 変圧器の自己アテンションは単位球上の勾配流と解釈できる。
我々は,マルチヘッド自己注意力学の理論的枠組みを開発する。
論文参考訳(メタデータ) (Fri, 08 May 2026 06:41:08 GMT)
Geometric and dynamical analysis of attractor boundaries and storage limits in kernel Hopfield networks [0.0] 本稿では,KLR学習ホップフィールドネットワークにおけるアトラクタ盆地のグローバルな幾何学と,記憶限界を規定する機構について検討する。
実験により、ネットワークは、P/N近似16ドル付近の効率的な負荷下で、構造化データの安定した検索を維持しながら、ランダムシーケンスのストレージ容量を最大16ドルまで達成している。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:14:56 GMT)
Geometric Flood Depth Estimation: Fusing Transformer-Based Segmentation with Digital Elevation Models [0.0] 災害後の状況認識は、洪水水の大きさと量の両方を理解することに大きく依存している。
本論文は,単眼の空中画像から洪水深度を推定するための幾何学的「水面上昇」手法を提案する。
我々のパイプラインは、最先端のトランスフォーマーベースセグメンテーションモデルであるMask2Formerを使用して、正確な2Dフラッドマスクを生成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 22:05:17 GMT)
Generating training datasets for legal chatbots in Korean [0.0] ディープラーニングダイアログシステム(チャットボット)のためのデータセットにおける実際のユーザ入力の多様性を把握するためのアプローチを開発する。
ユーザからの大量の認証データをラベルする代わりに、当社のアプローチは大量の発話と高品質なラベルを共同で生成する。
これらの発話から得られたデータセットを用いてDIET言語学者を訓練し、訓練されたモデルは91% f1スコアのパフォーマンスに達した。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:32:56 GMT)
Generalized master equation for driven quantum oscillators: microscopic origin of nonlinear dissipation and asymmetric resonances [0.0] 駆動型非線形量子発振器は量子技術の中心的なプラットフォームである。
この結果は非線形力学と駆動が駆動されたオープン量子系の散逸セクターを直接形成する顕微鏡的枠組みを確立した。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:09:18 GMT)
Functional-prior-based Bayesian PDE-constrained inversion using PINNs [0.0] 物理インフォームドニューラルネットワーク(fpBPINN)を用いたPDE制約インバージョンに対する機能優先型統一フレームワークを提案する。
1つ目は機能優先のベイズ型PINN(FPI-BPINN)で、ニューラルネットワークの重み付けが所定の機能前と一致していることが学習される。
2つ目は、関数空間上で直接ParVIを用いてベイズ推定を行うPINN(fParVI-PINN)に対する関数空間に基づく変分推論である。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:13:13 GMT)
From Pixels to Prompts: Vision-Language Models [0.0] この本は単純な感覚で生まれました。
私の目標は、すべてのデータセット、ベンチマーク、新しいモデルの完全なカタログを提供することではありません。
レゴブロックを盲目的に組み立てているかのように感じることなく、自分自身のシステムを設計できる十分な直感。
論文参考訳(メタデータ) (Fri, 08 May 2026 10:17:44 GMT)
From Feasible to Practical: Pareto-Optimal Synthesis Planning [0.0] 現在のコンピュータ支援合成計画法では、1つの実現可能な経路が特定されると、レトロ合成が解決されることが多い。
この考え方は、化学者がコスト、持続可能性、毒性、全体的な収量といった競合する目標をバランスさせなければならない現実世界の実践と誤解している。
ユーザ定義基準間のトレードオフを明示的に捉えるために,経路のParetoフロントを生成するアルゴリズムであるMORetro*を導入する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:53:30 GMT)
From Conceptual Scaffold to Prototype: A Standardized Zonal Architecture for Wi-Fi Security Training [0.0] サイバーレンジ(CR)は、サイバーセキュリティトレーニングと実験のための貴重なプラットフォームとなっている。
既存のワイヤレス指向ソリューションは主に異種IoTやモバイルネットワークの設定をターゲットにしている。
本稿では,IEEE 802.11のセキュリティシナリオとオープンソースプロトタイプに合わせて,Wi-FiにフォーカスしたCRの概念アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:55:48 GMT)
From Assistance to Agency: Rethinking Autonomy and Control in CI/CD Pipelines [0.0] 本稿では,エージェント型継続的インテグレーションと継続的デプロイメント(CI/CD)のビジョンについて述べる。
研究のプロトタイプと産業用プラットフォームに基づいて,現状のシステムは,主に有界自律型データプレーンで運用されていることを示す。
制約付き自律性を支配的な設計として、外部ガバナンスを主要な安全メカニズムとして、デプロイメントのモーメントと評価方法論のギャップを広げる3つのパターンを特定します。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:15:43 GMT)
FlightSense: An End-to-End MLOps Platform for Real-Time Flight Delay Prediction via Rotation-Chain Propagation Features and Agentic Conversational AI [0.0] 本稿では,プログレッシブ3バージョン機能エンジニアリングフレームワークによって構築された,リアルタイム飛行遅延予測のためのエンドツーエンドMLOpsプラットフォームを提案する。
FlightSenseはAWS MLOpsパイプラインとしてデプロイされ、Lambda経由のライブの天気予報、リアルタイムのSageMaker推論、インタラクティブなStreamlitダッシュボード、ツール使用アーキテクチャによる自然言語遅延クエリに応答するAmazon Bedrock Novaの会話アシスタントが組み込まれている。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:21:00 GMT)
Finer is Better (with the Right Scaling) [0.0] 文献で最近特定されたパラドックスは、標準的なabs-maxスケーリングがブロックサイズが縮小するにつれて、実際にモデル品質を低下させることができることを示している。
この劣化は、FP4要素フォーマットの粗い上量子化ビンとうまく相互作用しない重み付きテンソル分布によって引き起こされる。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:57:11 GMT)
FLAM: Evaluating Model Performance with Aggregatable Measures in Federated Learning [0.0] フェデレートラーニング(FL)では、参加者間でデータが分散しているため、パフォーマンスを評価することが難しい。
鍵となる課題は、例えば、参加者ごとの局所的なサンプルに基づく重み付け平均化のような共通集約戦略が、必ずしも集中的な評価と同じ結果を生み出すとは限らないことである。
既存のパフォーマンス評価の定義は、主に正確性に適合し、他のメトリクスに一般化しないため、参加者ベースと集中型評価の矛盾が生じる。
本研究では,グローバルなテストデータセットを必要とせずに,集中的な評価結果と同じ結果を得られるアグリガタブル尺度に基づく性能評価手法であるFLAMを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:25:02 GMT)
Exploring the non-convexity in machine learning using quantum-inspired optimization [0.0] 機械学習のエスカレートする複雑さは、非次元ロバストネス最適化問題を克服する必要がある。
従来のアプローチは、オンザフライの検索方式に依存しており、これらの問題を克服することができないことが多い。
我々は,非機械学習の本質的抽出をグローバルに統一的に探索することを提案する。
以上の結果から,a-Mの導入は,非機械学習の難問をグローバルに検索する上で有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:15:56 GMT)
Exploring CoCo Challenges in ML Engineering Teams: Insights From the Semiconductor Industry [0.0] 複雑なソフトウェアシステムへの機械学習の統合は、これらのシステムを構築するチームのコラボレーションとコミュニケーション(CoCo)において課題を増している。
以前の研究でいくつかのCoCoの課題とプラクティスが明らかになったが、その多くはソフトウェア中心の企業に焦点を当てている。
ハードウェア中心の環境では、CoCoの課題は厳格なデータガバナンス、長い開発サイクル、物理的プロセスとの密結合といった追加の制約によって形成されます。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:43:25 GMT)
Evaluating Design Conformance Through Trace Comparison [0.0] システムの設計とその実装は、開発チームでしばしば異なる個人によって実行される2つのタスクである。
これにより、実際の振る舞いと実装が適合することを意図した設計モデルの間に分岐する可能性がある。
本稿では,重要な実装の詳細が設計と一致し,特定の戦略への忠実さが時間の経過とともに失われないようにするためのアプローチを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:48:03 GMT)
Entanglement-informed distributed wavefunction approach to scalable quantum many-body systems [0.0] 量子多体状態の絡み合い構造は、それらのシミュレーションに対して自然かつ最適な分散表現を定義する。
エンタングルメントスペクトルの断片化は計算コストを制御する重要な要因である。
これにより絡み合いは、量子多体シミュレーションをスケールアップするための組織原理として確立され、統一され、メソッドに依存しないルートとして確立される。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:48:11 GMT)
Entanglement Requirements for Coherent Enhancement in Detectors [0.0] 検出器と相互作用する信号のコヒーレントエンハンスメントは、絡み合いによって定量的に制限されていることを示す。
我々は、コヒーレント効果の強さがシステムサイズとどのようにスケールできるかという一般的な境界を証明している。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:00:00 GMT)
Do Benchmarks Underestimate LLM Performance? Evaluating Hallucination Detection With LLM-First Human-Adjudicated Assessment [0.0] 本研究は,要約作業における文脈幻覚検出に焦点を当てた。
QAGS-C と SummEval のデータセットは,従来のベンチマークアノテーションと理性およびスパンベースの予測を比較して分析する。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:27:44 GMT)
Direct Bethe Free Energy Minimization for Bayesian Neural Ne twork [0.0] 我々は,変分下界を最大化するのではなく,Bethe自由エネルギーを直接最小化してベイズニューラルネットワークを訓練することを提案する。
木構造因子グラフ上では、Bethe自由エネルギーは正確であり、決定論的層は目的から外れ、標準のバックプロパゲーションによって訓練される。
すべての変種は、アンサンブルやサンプリングベースの手法とは対照的に、MAP等価な推論コストで閉形式予測を許容する。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:12:48 GMT)
Diagnosing Spectral Ceilings in Equivariant Neural Force Fields [0.0] 角度周波数をトレーニングされた等変力場バックボーンで測定するためのスペクトル注入診断法を提案する。
有限次スパン定理は、診断を校正する: 1つのマークされた方向に対して、次数-Lの球面-調和特徴の次数-dsは、境界における多重度-1の飽和を持つdLとちょうどH以下である。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:02:51 GMT)
Defense effectiveness across architectural layers: a mechanistic evaluation of persistent memory attacks on stateful LLM agents [0.0] LLMエージェントに対する永続メモリ攻撃は、オープンソースモデルに対する高い攻撃成功率を達成する。
これらの攻撃では、RAGが取得したドキュメントを介して注入された悪意のある命令は永続的なメモリに格納され、後続のセッションで実行される。
我々は,9つのオープンソースモデルに対する遅延トリガー攻撃に対して,4つのアーキテクチャ層にまたがる6つの防御効果を評価した。
論文参考訳(メタデータ) (Fri, 08 May 2026 20:04:57 GMT)
Decoherence without the state: A causal quantum Darwinist approach [0.0] 我々は、ユニタリダイナミクスによる因果的影響の観点から、デコヒーレンス(decoherence)の過程を示す。
我々は、状態が双対デコヒーレンスから出現し、ユニタリダイナミクスの時間反転によるデコヒーレンスに関連することを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 01:16:15 GMT)
Convergence Analysis of Newton's Method for Neural Networks in the Overparameterized Limit [0.0] ニューラルネットワークのトレーニングダイナミクスは,対象データに対して指数関数的に高速に収束することを示す。
収束は周波数スペクトルにわたって均一であり、勾配降下に固有のスペクトルバイアスに対処する。
正規化パラメータを選択するためのスケーリング公式を同定し、隠れたユニットの数が大きくなるにつれて適切な速度で消えることを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 18:02:37 GMT)
Computational and physical complexity of synthesizing random multi-qudit quantum states and unitary operators [0.0] ランダム状態やユニタリ作用素の計算複雑性は、クォーディットの数とともに指数関数的にスケールすることを示す。
数値計算の結果、ランダム量子状態とユニタリ演算子の物理複雑性は計算複雑性よりも遅くスケールすることが示唆された。
論文参考訳(メタデータ) (Fri, 08 May 2026 07:30:21 GMT)
Compositional Quantum Heuristics for Max-Clique Detection [0.0] 一般に、複雑な振る舞いをモデル化するのに十分に表現可能な回路は、しばしば不規則な台地を示す。
本研究では、より小さなサブコンポーネントからより大きな量子モデルを組み立てることで、このトレードオフを軽減するための構成的アプローチについて検討する。
このフレームワークを用いて、グラフの最大傾きを特定するために、置換同変量子グラフニューラルネットワークを設計する。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:38:57 GMT)
Chiral-Induced Spin Selectivity Regulates Triplet formation in Heliobacterial Photosynthesis [0.0] 有機系におけるトリプルト形成は光化学的損傷を促進し、電荷分離プロセスの効率を低下させる。
ヘリオバクター反応中心における三重項生成を規定する固有量子スピンダイナミクスの理論的検討を行った。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:15:27 GMT)
Checkerboard Bose Hubbard Ladders using Transmon Arrays [0.0] 2次元のボース・ハバードモデルに亜格子バイアスを加えることは、利用可能な物理学を大いに豊かにする。
本稿では,このチェッカーボードBose Hubbardモデルの物理とトランスモンアレイを用いた探索方法について述べる。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:44:47 GMT)
Carrier Revival in Long Trapped-Ion Chains [0.0] 線形鎖内のイオン数の増加は,トラップ条件下においても強いキャリア励起を回復できることを示す。
この効果により、短波長での光イオンの効率的な励起が可能となる。
また、多イオン光時計や混合種量子論理分光にも有用である。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:11:03 GMT)
Can You Break RLVER? Probing Adversarial Robustness of RL-Trained Empathetic Agents [0.0] RLVERは、協力的で正直なユーザを前提としたベンチマークに基づいて、強い共感的パフォーマンスを持つ言語モデルを作成している。
本稿では, 情緒的強靭性を評価するために, 情緒的共感ベンチマークAEBを構築し, 情緒的一貫性スコアECSを導入する。
我々は,ECS-FS(Final Score)ギャップを,内部理解や臨床準備の証拠としてではなく,シミュレーターファミリー内での行動・相対性解離と解釈する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:14:12 GMT)
Business Utility of Large Language Models as Exploratory Data Analysis Agents [0.0] 大規模言語モデル (LLM) は分析にますます使われているが、ビジネス環境での探索的データ分析 (EDA) エージェントとしての利用性は依然として不確実である。
実際には、デプロイ可能なEDAエージェントは、有用な平均的なパフォーマンスだけでなく、その出力に対する信頼をサポートするのに十分な反復性も提供しなければなりません。
我々はエージェントベースのサプライチェーンシミュレーションに基づいて,この要件を制御されたビジネス関連ベンチマークで評価する。
論文参考訳(メタデータ) (Fri, 08 May 2026 08:23:10 GMT)
Broken-symmetry shape discrimination on a driven Duffing ring [0.0] 連続対称性を持つ最も単純な閉基板上の2つのプリミティブ、Nノードのサイクルグラフについて、単一のマスター運動方程式の2つのパラメータ構造について検討する。
線形レジームは、基板のU(1)編成された固有モードに時間的入力をソートし、ウィンドウ化されたFFTベースラインと高い信号対雑音比で一致する特徴表現を提供する。
ダッフィング機構は、基板の対称性に制約された立方体モード混合動作を整数波数に対するスパース選択規則に活性化する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:22:34 GMT)
Box model of quantum annealing [0.0] 複数の局所最小値を持つ3種類のエネルギー景観、すなわち、凹凸、凸凸、平らなエンベロープによって変調される正弦波を考える。
平坦ギャップと呼ばれるエネルギーギャップスペクトルの興味深い特徴について検討した。
本稿では,ダイアバティック・トランジション中の局所ミニマにおける波動関数のトラップについて説明するメカニズムを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 02:26:18 GMT)
Biological Plausibility and Representational Alignment of Feedback Alignment in Convolutional Networks [0.0] CIFAR-10データセットと同一の畳み込みアーキテクチャに適用した改良FAと標準BPを含む5つの学習アルゴリズムを評価した。
この結果から, 修正FAアルゴリズムは, バックプロパゲーションによって生成されるものと構造的に類似した内部表現に収束することが示唆された。
論文参考訳(メタデータ) (Fri, 08 May 2026 23:54:48 GMT)
BeeVe: Unsupervised Acoustic State Discovery in Honey Bee Buzzing [0.0] この研究は、集合種における音響状態発見のための教師なしのセマンティックフレームワークであるBeeVeを紹介した。
BeeVeはPatchout Spectrogram Transformer (PaSST) を凍結した特徴抽出器として使用し、その埋め込みにラベルを付けずにVector-Quantized Variational Autoencoder (VQ-VAE) を訓練する。
既知のクイーン状態に対するポストホック評価では、学習されたトークンは、ジェンセン=シャノンの分岐値0.609から0.688でクイーンライトとクイーンレスの状態を分離し、クィーンレス状態はさらに3つの内部コヒーレントなサブ状態に分解されると仮定している。
論文参考訳(メタデータ) (Fri, 08 May 2026 15:42:42 GMT)
Asymptotically Log-Optimal Bayes-Assisted Confidence Sequences for Bounded Means [0.0] ベイズ型動作予測モデルを用いて信頼性シーケンスを適応的に構築するベイズ支援フレームワークを提案する。
LLM評価のための合成データ、シーケンシャルベストアーム識別、および予測駆動推論の実験により、情報的事前は信頼性シーケンス幅とサンプリングの労力を大幅に削減できることが示された。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:27:50 GMT)
Analytical Solution to the Kronig-Penney Model with Harmonic Oscillator Wells: Insights to Tight-Binding [0.0] 祝福されたクロニグ・ペニー模型は伝統的に原子中心を表す正方形の井戸ポテンシャルで定式化されてきた。
ここでは、正方形の井戸ポテンシャルの代わりに、少し現実的な音波発振器(truncated harmonic oscillator)を用いる。
このモデルのエネルギー分散と波動関数を導出する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:22:20 GMT)
An Exactly Solvable Absorbing Quantum Walk [0.0] 任意の強度のリンドブラッド境界シンクによって生じる吸収を伴う連続時間量子ウォークを解く。
これらの抑制機構の物理的起源が異なるにもかかわらず、それぞれの吸収確率は正確な双対性を示す。
この進化は位相空間で便利に可視化され、非エルミートモードはエッジ近傍で指数関数的に閉じ込められたウィグナー液滴を生成する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:43:56 GMT)
An Autonomous Topological Pump [0.0] 外部制御を必要としない一次元格子におけるフェルミオンに対するThoulessポンプの解析を行う。
自動ポンプが作動する上の磁場の臨界値の数値的な証拠が見つかる。
論文参考訳(メタデータ) (Fri, 08 May 2026 13:14:34 GMT)
Alignment as Jurisprudence [0.0] 裁判官がケースとアライメントを適切に決定する方法の研究、AIモデルを人間の価値観に適合させる科学、基本的な構造を共有する。
このエッセイは2つの分野を直接会話する。
これは、微調整アライメントにおけるルールとケースの相互作用に対する、より洗練された法的に着想を得たアプローチの価値を描いている。
論文参考訳(メタデータ) (Fri, 08 May 2026 19:22:11 GMT)
Aggregation in conformal e-classification [0.0] クロスコンフォーマル e-prediction は、コンフォーマル e-predictor を集約する既存の方法である。
本稿では,共形電子予測器を集約する既存の手法であるクロスコンフォーマルな電子予測法について実験的に検討する。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:26:19 GMT)
Accurate and Efficient Statistical Testing for Word Semantic Breadth [0.0] 分散に基づく統計は、文脈的多様性のプロキシとして機能する。
そこで本研究では,方向の相違から相違点を分離するために,世帯適応型変質試験を提案する。
本手法は, 真の広帯域差に対する感度を保ちながら, Type-I誤差を32.5%削減する。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:38:36 GMT)
A Unified Lyapunov-IQC Framework for Uniform Stability of Smooth Quadratic First-Order Accelerated Optimizers [0.0] 我々は、一階加速アルゴリズムの均一安定性を確立するために、統一的なリアプノフ積分二次制約(IQC)フレームワークを開発する。
古典的一様安定性のバウンダリが、このフレームワークを介してどのように回復できるかを示す。
論文参考訳(メタデータ) (Fri, 08 May 2026 21:07:25 GMT)
A Unified Local Light-shifts Encoding For Solving Optimization Problems on a Rydberg Annealer [0.0] 本稿では, 2-SAT, XOR-SAT, mixed-two-XOR-SAT, set packing, quadratic assignment, binary clustering, protein folding などの最適化問題を解くための統一フレームワークを提案する。
これらの問題のQUBO形式からRydberg量子プラットフォームへの直接写像が示されている。
フレームワークはさまざまな問題に対処できる。
論文参考訳(メタデータ) (Fri, 08 May 2026 11:56:12 GMT)
A Unified Framework for the Detection and Classification of Fatty Pancreas in Ultrasound Images [0.0] 非アルコール性脂肪膵疾患(非アルコール性脂肪膵疾患、NAFPD)は、メタボリックシンドローム、インスリン抵抗性、膵癌のリスクの増加に関連する診断下状態である。
腹部超音波画像から正常膵と脂肪膵を自動分類するためのエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 09:13:30 GMT)
A Theory of Saddle Escape in Deep Nonlinear Networks [0.0] 層重行列のフロベニウスノルムの不均衡について、スムーズな活性化と微分可能な損失を保った正確な恒等式を導出する。
置換対称部分多様体では、恒等式は近似バランス則と結合し、スカラーODEへの全行列フローを減少させる。
我々の理論と数値シミュレーションの間にはよく一致している。
論文参考訳(メタデータ) (Fri, 08 May 2026 16:49:19 GMT)
A Task-Agnostic Algebraic Integrity Metric for Event-Camera Streams Toward SOTIF-Compliant Perception using Pearson Correlation Coefficient [0.0] イベントカメラは、自動運転システムにおける安全クリティカルな認識のための低遅延センシングを提供する。
現在、タスクに依存しない品質基準は非同期イベントストリーム上で直接動作しません。
本研究は、ピアソン相関係数(PCC)を3つの標準イベント表現に引き上げる統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:54:23 GMT)
A Multi-Level Agent-Based Architecture for Climate Governance Integrating Cognitive and Institutional Dynamics [0.0] 本稿では,認知決定モデルと戦略的制度的行動を統合するモジュール型マルチレベルエージェントベースアーキテクチャを提案する。
政治的決定は、専門家の入力、公共の動員、党の整列、メディアフレーミングなど、複数のシグナルの集合から生まれる。
本稿では、経験的な結果を示すのではなく、アーキテクチャ設計の原則、モジュラー構造、モデルの統合ロジックに焦点を当てる。
論文参考訳(メタデータ) (Fri, 08 May 2026 12:53:54 GMT)
A Comparative Analysis of Classical Machine Learning and Deep Learning Approaches for Sentiment Classification on IMDb Movie Reviews [0.0] 本稿では,IMDb映画レビューデータセットを用いて,感情分類のための古典的機械学習手法とディープラーニング手法の比較検討を行う。
機械学習パイプラインは、TF-IDF機能とPyCaret AutoMLを使用して、ロジスティック回帰、Nave Bayes、Support Vector Machineを評価する。
ディープラーニングパイプラインは、注意機構を備えたBiLSTMとBiLSTMを実装している。
論文参考訳(メタデータ) (Fri, 08 May 2026 14:44:36 GMT)
6D Pose Estimation via Keypoint Heatmap Regression with RGB-D Residual Neural Networks [0.0] キーポイント・ヒートマップ・レグレッションに基づく6次元ポーズ推定のためのモジュラー・フレームワークを提案する。
RGB-D融合モデルの平均精度は84.50%、LINEMODデータセットでは92.41%に達した。
論文参考訳(メタデータ) (Fri, 08 May 2026 17:47:02 GMT)
2.5-D Decomposition for LLM-Based Spatial Construction [0.0] 大規模言語モデル(LLM)は、3次元ブロック配置を生成する際に体系的な座標誤差を発生させる。
本稿では,emph2.5-D分解に基づくニューロシンボリックパイプラインを提案する。
決定論的エグゼキュータは、カラム占有から全ての垂直配置を計算し、エラーのクラス全体を除去する。
論文参考訳(メタデータ) (Fri, 08 May 2026 00:17:33 GMT)