WorldArena 2.0: Extending Embodied World Model Benchmarking on Modality, Functionality and Platform [130.8] 本稿では,世界モデル評価のための拡張ベンチマークであるWorldArena 2.0を紹介する。
WorldArena 2.0は、モダリティ、機能、プラットフォームという3つの次元で、具現化された世界モデルの評価を体系的に拡張する。
WorldArena 2.0は、標準化されたプロトコルの下で、知覚品質、インタラクティブなユーティリティ、クロスプラットフォームのパフォーマンスを包括的に評価する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:18:21 GMT)
Bench2Drive-Robust: Benchmarking Closed-Loop Autonomous Driving under Deployment Perturbations [122.2] Bench2Drive-Robustは、クローズドループのエンドツーエンド自動運転のための最初のデバイス中心の堅牢性ベンチマークである。
我々は,カメラストリーム障害,エゴ状態推定誤差,計算による制御遅延という3つの主要な原因から生じる展開指向の摂動を系統的に評価した。
以上の結果から,これらの展開に伴う摂動は閉ループ駆動性能を著しく低下させる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:45:24 GMT)
Resolving Representation Ambiguity in Feedforward Novel View Synthesis Transformer via Semantic-Spatial Decoupling [117.7] トランスフォーマーモデルによるフィードフォワード新規ビュー合成(NVS)
現在のアーキテクチャは意味情報(例えば、RGB)と空間情報(例えば、チャンカー線)を共有特徴空間に混ぜる。
本稿では,フィードフォワード型NVSトランスフォーマーの表現を意味トークンと空間トークンに分離することを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:09:52 GMT)
Unified Simulation of Lagrangian Particle Dynamics via Transformer [107.4] 本研究では, 単一トランスアーキテクチャ上に構築された学習型粒子シミュレータを用いて, 布, 弾性体, ニュートン流体, ニュートン流体, 粒状物質, 分子動力学をモデル化する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:34:36 GMT)
Code as Agent Harness [107.3] 新興のエージェントシステムでは、コードはもはや単なる目標出力ではない。
コードはエージェントの推論、行動、環境モデリング、実行ベースの検証のための運用上の基盤としてますます役立っている。
この調査は、実行可能、検証可能、ステートフルなAIエージェントシステムに向けた統一されたロードマップを提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:59:03 GMT)
AI for Auto-Research: Roadmap & User Guide [107.1] 研究ライフサイクル全体にわたってAIをエンドツーエンドに分析する。
我々は、信頼できる援助と信頼できない自律性の間に、鋭くステージに依存した境界を特定できる。
障害モードを排除するのではなく、より大きな自動化が不明瞭であることが示されています。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:08:26 GMT)
Riemannian Networks over Full-Rank Correlation Matrices [102.8] フルランク相関行列は対称正定値多様体(SPD)の正規化された代替である。
我々はこれらのジオメトリに、MLR(Multinomial Logistic Regression)、FC(Fully Connected)、畳み込み層を含む基本層を拡張した。
また、2つの相関ジオメトリの正確なバックプロパゲーション法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:54:55 GMT)
Dexora: Open-source VLA for High-DoF Bimanual Dexterity [98.0] Dexoraは、デュアルアーム、デュアルハンドハイDoF操作をターゲットとする、世界初のオープンソースのVLAシステムである。
指の動きから全身の運動を分離するハイブリッド遠隔操作パイプラインを設計する。
Dexoraはベーシックベンチマークとデクスタラスベンチマークの両方で競合するVLAベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:50:32 GMT)
Interactive Evaluation Requires a Design Science [90.6] 大規模言語モデル(LLM)は、ツールや環境、ユーザ、その他のエージェントを通じて、時間とともに機能するシステムとして、ますます多くデプロイされている。
フィールドはインタラクティブなベンチマークを構築し始めたが、その結果のランドスケープは断片化されている。
本論では,対話的評価は原則的評価パラダイムとして扱うべきであると論じる。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:03:18 GMT)
scHelix: Asymmetric Dual-Stream Integration via Explicit Gene-Level Disentanglement [84.9] scHelixは、機能がどのように処理されるかを根本的に変更するデータセット適応フレームワークである。
scHelixは、停止段階のグラフキャッシュを備えたデュアルストリームスパース拡散エンコーダを使用する。
scHelixは最先端のメソッドより優れています。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:55:13 GMT)
LongLive-2.0: An NVFP4 Parallel Infrastructure for Long Video Generation [84.9] LongLive-2.0は、長いビデオ生成の完全なトレーニングと推論ワークフロー全体を通じて、NVFP4ベースの並列インフラストラクチャである。
トレーニングには,quence-parallel autoregressive (AR) トレーニングを導入する。
実験ではトレーニングで2.15倍、推論で1.84倍のスピードアップを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:57:03 GMT)
MARS: Technical Report for the CASTLE Challenge at EgoVis 2026 [84.7] 本稿では,EgoVis 2026におけるCASTLE Challengeについて紹介する。
参加者はCASTLE 2024データセットに対して185のクローズドフォームの質問に答えなければならない。
MARSは、タスクをマルチモーダルソース上のエージェントエビデンス選択問題として扱う。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:19:32 GMT)
Concordia: Self-Improving Synthetic Tables for Federated LLMs [80.0] フェデレートラーニングは、生データを共有することなく、大きな言語モデル(LLM)をトレーニングすることを可能にする。
合成データ生成とフェデレートされた検証ユーティリティを連携させるフレームワークであるConcordiaを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:37:30 GMT)
Advancing Narrative Long Video Generation via Training-Free Identity-Aware Memory [79.0] IAMFlowはトレーニング不要のID対応メモリフレームワークで、永続的なエンティティのIDを明示的にモデル化し追跡する。
VLMは、レンダリングフレームから属性を非同期に検証し、洗練し、暗黙の類似性ベースのマッチングの代わりに明示的なエンティティ追跡を可能にする。
NarraStream-Benchは,6次元にまたがる324のマルチプロンプトスクリプトを備えた,ナラストリームビデオ生成のためのベンチマークである。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:54:34 GMT)
CrossView Suite: Harnessing Cross-view Spatial Intelligence of MLLMs with Dataset, Model and Benchmark [77.3] 空間知能は、単一視点の知覚と理性を超えるためにマルチモーダルな大言語モデル(MLLM)を必要とする。
CrossView Suiteは、CrossViewSet、CrossViewBench、CrossViewerの3つの協調コンポーネントで開発しています。
提案手法は, 適応型空間領域トークンーザを備え, 微細なオブジェクト表現をキャプチャし, マルチビューオブジェクトを明示的にアライメントする。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:31:31 GMT)
Seeing Together:Multi-Robot Cooperative Egocentric Spatial Reasoning with Multimodal Large Language Models [76.3] 本研究では, きめ細かい協調的空間推論のための枠組みを提案する。
SP-CoRは、動的に認識されるマルチロボットフレームサンプリング、スペクトルおよび物理誘導型ビューフュージョン、および物理に整合した即時蒸留を組み合わせた。
ハビタットでは+3.87%、iGibsonでは+7.12%、微調整ベースラインでは+3.87%である。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:04:26 GMT)
SPIKE: An Adaptive Dual Controller Framework for Cost-Efficient Long-Horizon Game Agents [74.8] コスト効率のよい長軸ゲーム制御のための適応型デュアルコントローラフレームワークSPIKEを提案する。
Strategic Controllerは低周波のグローバル計画、障害解析、リカバリを実行し、Reactive Controllerは厳格なトークン予算の下で高速なローカル実行を処理する。
Event Triggerは、視覚的な変化、タスクの進捗、繰り返しアクション、障害信号を監視して、制御がいつ反応性を保つか、あるいは戦略的な推論にエスカレートするかを判断する。
この設計は、複数のリアクティブステップにまたがる戦略的な提案を再利用し、計画が不安定になると局所的なオーバライドをサポートし、余分な議論が役に立つ瞬間に高価な推論を予約する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:43:32 GMT)
It Takes Two: Complementary Self-Distillation for Contextual Integrity in LLMs [73.5] タスク解決から情報抑制を分離する自己蒸留フレームワーク。
タスク解決から情報抑制を分離する自己蒸留フレームワーク。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:57:44 GMT)
Vision-OPD: Learning to See Fine Details for Multimodal LLMs via On-Policy Self-Distillation [71.9] MLLM(Multimodal Large Language Models)は、細かな視覚的理解に苦慮している。
地域間自己蒸留フレームワークであるビジョンOPD(Vision On-Policy Distillation)を提案する。
Vision-OPDは同じMLLMから2つの条件ポリシーをインスタンス化する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:57:04 GMT)
From Human Videos to Robot Manipulation: A Survey on Scalable Vision-Language-Action Learning with Human-Centric Data [71.2] 人間のビデオは豊富で、豊富な相互作用を捉え、現実世界の操作に多様な意味と物理的な手がかりを提供する。
この調査は、人間のビデオがビジョン・ランゲージ・アクション(VLA)モデルの効果的な知識にどのように変換されるか、統一された視点を提供する。
この領域では、非構造化動画をトレーニング可能なエピソードに構造化すること、エンボディメントと視点の不均一性の下でロボットが実行可能なアクションにビデオから制御すること、現実世界の展開性能と転送効率をよりよく予測する評価プロトコルを設計すること、の3つのオープンな課題を強調している。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:19:16 GMT)
AutoVecCoder: Teaching LLMs to Generate Explicitly Vectorized Code [69.8] AutoVecCoderは、大規模言語モデルに自動明示的ベクトル化機能を持たせるために設計された新しいフレームワークである。
自動データ合成パイプラインであるVecPromptは、ドメイン固有の固有の知識を注入する。
強化学習フレームワークであるVecRLは、コード生成と実行効率を一致させる。
このフレームワークでトレーニングされたAutoVecCoder-8Bは、SimdBenchのSSEおよびAVXサブセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:33:15 GMT)
LongMINT: Evaluating Memory under Multi-Target Interference in Long-Horizon Agent Systems [69.1] 現実世界のエージェントは、情報が繰り返し更新され、記憶をまたいで干渉する、長く進化する地平線上で機能する。
本稿では,現在の記憶増強剤が現実的,干渉重大,長期的設定でどのように機能するかを検討する。
全体として、LongMINTは128.8kのトークンを平均化し、1インスタンスあたり1.8Mのトークンに拡張する15.6kの質問応答ペアを持つ。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:43:35 GMT)
StableVLA: Towards Robust Vision-Language-Action Models without Extra Data [68.8] トレーニングデータセット内のあらゆる障害を包含することは不可能である。
このことは、目に見えない現実世界の視覚障害に遭遇する際のビジョン・ランゲージ・アクション(VLA)モデルの堅牢性に関する批判的な疑問を提起する。
本研究では、最近の最先端VLAモデルに基づく系統的な研究を行い、トレーニングデータに欠落した視覚障害が発生した場合に顕著な性能低下を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:15:16 GMT)
Position: Weight Space Should Be a First-Class Generative AI Modality [67.1] 本稿では、モデルチェックポイントを第一級データモダリティとして扱うべきであると論じる。
重み空間における生成的モデリングは、コア機械学習プリミティブとして標準化されるべきである、と論じている。
私たちのゴールは、コミュニティの既定の考え方を、タスクごとのモデルの最適化から、学習した重量分布からモデルのサンプリングにシフトさせることです。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:38:26 GMT)
MotionMERGE: A Multi-granular Framework for Human Motion Editing, Reasoning, Generation, and Explanation [66.7] MotionMERGEは、モーション言語モデルの粒度のギャップを埋める統合フレームワークである。
まず,詳細な理解と局所的な編集を含む,粒度の細かい言語誘導型モーションコントロールの研究の先駆者となる。
第2に,粒度調整を共同で行う新しい戦略である粒度事前学習を意識したReasoningAware Granularity-Synergyを設計する。
第3に、第1の微細時間補正命令とモーショングラウンドCoTアノテーションを備えた大規模データセットであるMotionFineEditをキュレートする。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:04 GMT)
Who Generated This 3D Asset? Learning Source Attribution for Generative 3D Models [66.4] 生成可能な3Dモデルは、ゲーム、ロボティクス、没入型生成にデプロイされる。
どの生成モデルが生成したのかを特定できますか。
この問題は、分散属性信号と現実的なデプロイメント制約という、2つの主要な課題に直面している。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:36:48 GMT)
Self-Distilled Trajectory-Aware Boltzmann Modeling: Bridging the Training-Inference Discrepancy in Diffusion Language Models [65.9] 拡散言語モデル(DLM)は、より強力なグローバル認識と高い並列生成を提供する。
標準負のエビデンス下界(NELBO)に基づく教師付き微調整後のDLMは非効率である。
そこで本研究では,学習を推論の容易かつハードな構造に整合させる,自己蒸留軌道に基づくポストトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:27:28 GMT)
GRASP: Deterministic argument ranking in interaction graphs [65.7] 全体的判断はモデル間不一致に悩まされていることを示す。
この不安定性は、議論の複雑な相互作用構造を1つの不透明なスコアに崩壊させることから生じる。
安定な局所的相互作用判断をグローバルなランキングに集約する決定論的なフレームワークであるGRASPを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:49:02 GMT)
Dance Across Shifts: Forward-Facilitation Continual Test-Time Adaptation through Dynamic Style Bridging [65.1] 継続的テスト時間適応(Continuous Test-Time Adaptation)は、デプロイメント後に発生する動的分散シフトを処理するために、知覚システムを強化することを目的としている。
動的スタイルブリッジと呼ばれる手法により,新しいフォワードファシリケーションパラダイムを導入する。
テスト期間中に、固有の生成バイアスを緩和し、これらのプロキシを入力データに適用するために、マルチレベルブリッジ機構を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:18:17 GMT)
MoASE++: Mixture of Activation Sparsity Experts with Domain-Adaptive On-policy Distillation for Continual Test Time Adaptation [65.1] 連続的なテスト時間適応は、非定常な未ラベルのターゲットストリームにソース予測モデルを適用する。
ドメインに依存しない構造をドメイン固有のテクスチャから切り離す。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:52:12 GMT)
Time to REFLECT: Can We Trust LLM Judges for Evidence-based Research Agents? [61.5] 本稿では,エージェント環境におけるきめ細かい故障検出を目的としたメタ評価ベンチマークREFLECTを紹介する。
REFLECTはプロセスレベルの障害モードと結果レベルの障害モードの詳細な分類を定義し、制御および局所的な介入を実行することでインスタンス化する。
私たちの実験では、最高のパフォーマンスモデルでさえ、推論、ツール使用、レポート品質の失敗に対して、全体的なアキュラシーを55%以下に達成しています。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:55:08 GMT)
Improved Baselines with Representation Autoencoders [61.5] 表現オートエンコーダ(RAE)は、従来のVAEを事前訓練された視覚エンコーダに置き換える。
RAEを単純化し、改善する3つの洞察が得られます。
RAEv2はオリジナルのRAEよりも10倍以上早く収束する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:42:34 GMT)
A Data-Efficient Path to Multilingual LLMs: Language Expansion via Post-training PARAM$Δ$ Integration into Upcycled MoE [61.0] そこで我々は,高密度モデルをMixture-of-Experts(MoE)アーキテクチャにアップサイクルし,異なる専門家を異なる言語に割り当てる手法を提案する。
実験では、同様のFLOPやパラメータ数を持つベースラインに対してさえ、メソッドの優位性を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:59:08 GMT)
ClawForge: Generating Executable Interactive Benchmarks for Command-Line Agents [59.6] textbfClawForgeは、ステートコンフリクト下で実行可能なコマンドラインカテゴリのためのジェネレータベースのベンチマークフレームワークである。
私たちはこのフレームワークをClawForge-Bench(17のシナリオ、6の能力カテゴリ)としてインスタンス化します。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:36:27 GMT)
Vision Inference Former: Sustaining Visual Consistency in Multimodal Large Language Models [58.9] 視覚推論 前者(VIF)は、純粋な視覚表現とモデルの出力空間の間の橋渡しを確立する軽量アーキテクチャモジュールである。
一般的な推論、OCR、テーブル理解、視覚中心の評価、幻覚を含む14のベンチマークタスクについて実験を行った。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:04:22 GMT)
Harnessing LLM Agents with Skill Programs [58.4] HASPは、実行可能なプログラム関数(PF)にスキルをアップグレードする新しいフレームワークです。
PFは障害が発生しやすい状態を起動し、次のアクションを変更したり、修正コンテキストを注入する実行可能なガードレールとして機能する。
HASPは、Web検索、数学推論、コーディングタスクにおいて、トレーニング不要とトレーニングベースの両方の手法と比較して、大幅に向上している。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:35:11 GMT)
SlimQwen: Exploring the Pruning and Distillation in Large MoE Model Pre-training [57.4] 大規模プレトレーニングにおけるMoE圧縮の体系化について検討した。
事前訓練されたMoEのプルーニングは、ターゲットアーキテクチャをゼロからトレーニングする上で、一貫して優れています。
我々は,一貫した利得が得られるマルチトークン蒸留(MTP)を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:29:11 GMT)
Latent Action Reparameterization for Efficient Agent Inference [56.4] 本稿では,複数のステップのセマンティックな振る舞いに対応する,コンパクトな潜在行動空間を学習するフレームワークを提案する。
手作りのマクロや階層型コントローラとは異なり、潜在動作はエージェントの軌跡から学習され、モデルに直接統合される。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:07:44 GMT)
ESI-Bench: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop [55.5] 我々は,OmniGibson上に構築された10のタスクカテゴリと29のサブカテゴリにまたがる空間知能の具体化ベンチマークを開発した。
我々は最先端のMLLMの実験を行い、活発な探索が受動的に優れていることを発見した。
矛盾した視点を求め、信念を改定する人間とは異なり、モデルは証拠の品質に関わらず、高い信頼をもって早々に行動する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:59:02 GMT)
Multi-agent AI systems outperform human teams in creativity [55.5] 大規模言語モデル(LLM)は、研究やイノベーションにおいてますます採用されている。
ここでは、マルチエージェントのLLMチームが、創造性において人間チームよりも大幅に優れています。
この利点は、同等の有用性を維持しながら、斬新さによって引き起こされる。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:52:11 GMT)
SAS: Semantic-aware Sampling for Generative Dataset Distillation [55.3] 本稿では,コントラスト言語-画像事前学習(CLIP)をポストサンプリングのセマンティクスとして活用することで,データセット蒸留のセマンティック・アウェア・パースペクティブを導入する。
我々のゴールは、コンパクトであるだけでなく、意味的にクラス差別的で多様である蒸留データセットを得ることです。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:05:46 GMT)
Probing for Representation Manifolds in Superposition [55.2] 本稿では,重ね合わせで表現多様体を発見する教師付き手法であるManifold Probeを紹介する。
Llama 2-7b における時間と空間の表現に関するプローブを実証する。
時間の場合、この多様体を操ることで、有名な歌曲、映画、書籍が出版された年月について、モデルの完成度に影響を与えることが示される。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:20:35 GMT)
GaussianZoom: Progressive Zoom-in Generative 3D Gaussian Splatting with Geometric and Semantic Guidance [55.1] 低解像度入力からの高忠実度極端ズームインレンダリングを実現するために,反復的なプログレッシブ・フレームワークを備えた生成型ズームイン3D再構成システムを提案する。
Mip-NeRF360 と Tanks&Temples の実験により、ガウシアンズームは極大化下での知覚品質、多視点整合性、堅牢性に優れることを示した。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:52:36 GMT)
DocOS: Towards Proactive Document-Guided Actions in GUI Agents [54.3] textbfDocOSは、完全にインタラクティブな環境で文書誘導問題解決を評価するために設計されたベンチマークである。
実験の結果、エージェントはプロアクティブ検索中に関連情報を確実に見つけるのに苦労し、検索した指示を忠実に正確な行動に移すのに失敗することが判明した。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:36:04 GMT)
EnvFactory: Scaling Tool-Use Agents via Executable Environments Synthesis and Robust RL [54.1] 本稿では,エージェント強化学習(Agentic RL)トレーニングのための完全に自動化されたフレームワークであるEnvFactoryを紹介する。
EnvFactoryは、認証リソースから自律的に、ステートフルで実行可能なツール環境を探索する。
トポロジーを意識したサンプリングとキャリブレーションによる自然なマルチターン軌道を合成する。
トレーニング効率とダウンストリーム性能が向上し、BFCLv3ではQwen3シリーズモデルを最大15%改善し、MPP-Atlasでは+8.6%、VitaBenchでは+6%向上した。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:37:40 GMT)
Breaking $\textit{Winner-Takes-All}$: Cooperative Policy Optimization Improves Diverse LLM Reasoning [53.4] グループ協力政策最適化は、トレーニングパラダイムをロールアウト競争からチーム協力へとシフトさせる。
GCPOは独立したロールアウトスコアをチームレベルのクレジット割り当てに置き換える。
チームへの平均的な限界貢献に従って、各ロールアウトに対して、グループチームの報酬を再分配する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:36:31 GMT)
Self-Evolving Spatial Reasoning in Vision Language Models via Geometric Logic Consistency [53.3] 本稿では,視覚・言語モデル(VLM)における論理的一貫性を幾何学的・言語的双対性演算によって実現する枠組みを提案する。
SAGEは、従来のGRPO法に比べてモデルに依存しず、データ効率が良く、既存のVLMに軽量な後学習段階として適用することができる。
ビデオおよび空間推論ベンチマークの実験では、強いベースラインよりも一貫した改善が示されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:05:21 GMT)
Embracing Biased Transition Matrices for Complementary-Label Learning with Many Classes [52.8] 補完ラベル学習(Complementary-label Learning, CLL)は、インスタンスに属さないクラスをラベル付けする、弱い教師付きパラダイムである。
本稿では,データ収集からトレーニングまでの原則的フレームワークであるBias-induced Constrained Labeling (BICL)を提案する。
BICLはCIFAR-100とTinyImageNet-200で効果的な学習を可能にし、従来の手法よりも7倍以上の精度向上を実現している。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:18:55 GMT)
Beyond Localization: A Comprehensive Diagnosis of Perspective-Conditioned Spatial Reasoning in MLLMs from Omnidirectional Images [52.5] MLLM(Multimodal Large Language Models)は、視覚的知覚が強いが、視点の変化による空間の推論には限界がある。
本研究では、この課題を全方位360度画像におけるパースペクティブ・コンディションド・スペース・推論(PCSR)として検討する。
我々は2,600全方位画像から84,373組の質問応答対の診断ベンチマークであるPCSR-Benchを紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:53:40 GMT)
Xiaomi EV World Model: A Joint World Model Integrating Reconstruction and Generation for Autonomous Driving [51.9] 本報告では,世界モデルの自律運転における2つのコア機能に対処する統合技術システムを提案する。
世界表現のために,スパースシーンクエリによって駆動されるフィードフォワード再構築アーキテクチャであるWorldRecを提案する。
次世代に向けて,両方向性事前学習のための2段階のトレーニングフレームワークWorldGenを提案し,それに続いて因果微調整を行う。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:46:16 GMT)
From Saddle Points Toward Global Minima: A Newton-Type Method on Wasserstein Space [51.6] 正方形ワッサーシュタイン・ヘッセンの正則化平方根によるワッサーシュタイン最小化を前提とした二階法を提案する。
この構造は、負の曲率に沿って反発方向を誘導しながら、正の曲率に向かう方向へのアトラクションを保っている。
We show that WSFN converges linearly in $L2$-Wasserstein to a non-de global distance。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:18:22 GMT)
Counterfactual Likelihood Tests for Indirect Influence in Private Reasoning Channels [51.6] 本稿では,私的推論チャネル間の影響を測定するための実証実験について述べる。
この方法は、上流のプライベートブロックを長さマッチングドナーブロックに置き換え、公開トークンシーケンスと下流ターゲットを固定し、下流ターゲットの負のログに似たシフトを測定する。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:27:43 GMT)
Lance: Unified Multimodal Modeling by Multi-Task Synergy [50.8] Lanceは、画像とビデオの両方のマルチモーダル理解、生成、編集をサポートする軽量なネイティブ統一モデルである。
スクラッチからトレーニングされ、共有されたインターリーブされたマルチモーダルシーケンス上で、デュアルストリーム・ミックス・オブ・サーキットアーキテクチャを採用している。
実験により、Lanceは既存のオープンソース統一モデルよりも画像およびビデオ生成において大幅に優れていることが示された。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:18:24 GMT)
DADF: A Distribution-Aware Debiasing Framework for Watch-Time Regression in Recommender Systems [50.0] DADFは、ウォッチタイムレグレッションのための分散対応のデバイアスフレームワークである。
公開ショートビデオベンチマークと大規模産業ランキングシステムを用いたDADFの評価を行った。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:14:50 GMT)
Split the Differences, Pool the Rest: Provably Efficient Multi-Objective Imitation [49.9] マルチ出力拡張行動クローン(MA-BC)について紹介する。
MA-BCは、振る舞いの衝突が観測されない状態-動作ペアをプールしながら、専門家データを分離する。
我々は,MA-BCが極小であることを示す,多目的模倣学習のための新しい下位境界を確立する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:32:07 GMT)
OmniSelect: Dynamic Modality-Aware Token Compression for Efficient Omni-modal Large Language Models [49.3] 本稿では,マルチモーダル入力に対する適切な圧縮戦略を動的に選択する,トレーニングフリーなモダリティ適応型トークンプルーニングフレームワークを提案する。
本手法は, 訓練を必要とせず, 高い性能を維持しつつ, 効率的なマルチモーダルトークン削減を実現する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:33:52 GMT)
Starve to Perceive: Taming Lazy Perception in VLMs with Constrained Visual Bandwidth [48.3] 視覚言語モデル(VLM)は、高解像度の視覚環境において位置決めエージェントとして展開されるため、アクティブな知覚を必要とする。
現在の訓練パラダイムは、それらの出力に依存することなく、そのような操作の表面形式を模倣するモデルを生成する。
Starve to Perceiveという、視覚的な帯域幅を制限するトレーニングパラダイムを紹介します。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:13:09 GMT)
Continuous Diffusion Scales Competitively with Discrete Diffusion for Language [48.3] 確率ベース連続拡散言語モデル(DLM)としてRePlaidを構築する。
自己回帰モデルと比較すると,RePlaidの計算ギャップは20ドル程度であることがわかった。
また、可能性に基づくトレーニングの利点を理解するための理論的洞察も提供します。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:15:24 GMT)
Sublinear Risk-Limiting Audits from Direct Ballot Selection and Statistical Ballot Manifests [47.9] リスクリミット監査(リスクリミット監査、RLA)は、不正な選挙結果が検出されない特定の最大確率を厳格に保証する、選挙後の監査手続きである。
典型的な選挙手続きはバッチサイズに対して自動的に大まかな見積もりを提供するが、わずかに不正確な場合でさえ従来のRLAを無効にする。
信頼できない集計によって報告されるバッチサイズが、事実、正確なマニフェストであり、直接投票選択と呼ばれる新しいRAAのクラスであることを保証する統計的メカニズムを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:12:11 GMT)
FAGER: Factually Grounded Evaluation and Refinement of Text-to-Image Models [47.9] 既存のテキスト・トゥ・イメージ(T2I)評価指標は、主に、生成された画像がプロンプトに明示された情報と一致しているかどうかを評価する。
FAGER(FActually Grounded Evaluation and Refinement, FAGER)は、生成した画像が、そのプロンプトによって暗示された、あるいは暗示された、視覚的に検証可能な事実を正しく反映しているかを評価するエージェントフレームワークである。
我々は、FAGERがT2I出力を完全にトレーニング不要に洗練するために使用できることを示し、データセット間で実質的な事実性の向上をもたらす。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:57:07 GMT)
Distance-Aware Muon: Adaptive Step Scaling for Normalized Optimization [47.8] ミューオンと関連する正規化は、ステップスケールの選択から更新方向の選択を分離する。
我々は,Muonチューニングのための3つの補完アルゴリズムを開発し,正規化適応スケーリングパラメータを開発した。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:19:26 GMT)
Mistletoe: Stealthy Acceleration-Collapse Attacks on Speculative Decoding [47.8] 投機的復号化は大規模言語モデル(LLM)推論を高速化する手法として広く採用されている。
モデルに基づく投機的復号化における新しいメカニズムレベルの脆弱性を同定する。
提案するMistletoeは、投機的復号化に対するステルス的な加速・崩壊攻撃である。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:28:06 GMT)
Adaptive Experimentation for Censored Survival Outcomes [47.3] 適切な検閲の下で因果効果を推定するための適応実験のための新しい枠組みを開発する。
本稿ではアダプティブ・サバイバル・エスタ (ASE) を提案する。アダプティブ・サバイバル・エスタ (ASE) はアダプティブ・ポリシーを学習し, 平均生存効果曲線を逐次推定するフレームワークである。
フレームワークには3つの大きな利点がある: (i) ニュアンス推定のための任意の機械学習モデルに対応する; (ii) クローズドフォームの効率-最適割当ポリシーによってガイドされる; (iii) 強力な理論的保証を持つ。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:21:44 GMT)
The problem of time: a path integral view [47.2] シュルディンガーの進化は、時計の自由度が特定され、半古典的良時計状態に置かれるとどのように現われるかを示す。」
我々の分析は、一般の共変系の経路積分の定式化まで(重力を含む)作用$S$にまで拡張する結果をもたらす。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:43:38 GMT)
MementoGUI: Learning Agentic Multimodal Memory Control for Long-Horizon GUI Agents [47.2] MLLMベースのGUIエージェントのためのプラグインエージェントメモリフレームワークである textbfMementoGUI を紹介する。
MementoCoreは、オンラインメモリの選択、圧縮、検索のための学習されたコントローラである。
実験によると、MementoGUIは履歴なし、履歴再生、テキストのみのメモリベースラインよりもGUIエージェントを一貫して改善している。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:57:36 GMT)
Entropy-Gradient Inversion: Moving Toward Internal Mechanism of Large Reasoning Models [47.2] トークンエントロピーとロジット勾配の堅牢な相関関係であるtextbfEntropy-Gradient Inversion を同定し,正式に定義する。
我々は,この逆シグネチャを強化学習に組み込んだtextbfCorrelation-Regularized Group Policy Optimization (CorR-PO)を提案する。
複数のモデルスケールにわたる様々な推論ベンチマークの実験は、Corr-POが最先端のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:41:53 GMT)
Learning from Language Feedback via Variational Policy Distillation [47.1] 変分ポリシー蒸留(VPD)は、言語フィードバックからの学習を変分期待最大化問題として形式化するフレームワークである。
VPDは標準のRLVRと既存の自己蒸留ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:19:17 GMT)
SafeDiffusion-R1: Online Reward Steering for Safe Diffusion Post-Training [47.0] 拡散モデルは、事前学習中に学習した安全でないコンテンツを除去するために広く研究されている。
既存の手法では、安全でないテキストと安全な画像の基底と負の/正のイメージのペアを組み合わせて、高価な教師付きデータを必要とするため、スケールするのは現実的ではない。
ポストトレーニングによるデータ不足とモデル劣化に対処する新しいオンライン強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:50:04 GMT)
Implicit Hierarchical GRPO: Decoupling Tool Invocation from Execution for Tool-Integrated Mathematical Reasoning [46.8] 大規模言語モデル(LLM)は、推論能力を高めるためにツール呼び出しをますます活用している。
既存のアプローチは通常、即時実行でツール呼び出しを密に結合する。
推論中の実行からツール呼び出しを分離する問題を提案し,定式化する。
ツール統合推論を強化するために,明示的な制御による遅延実行を導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:54:49 GMT)
Prompt2Fingerprint: Plug-and-Play LLM Fingerprinting via Text-to-Weight Generation [46.8] 本稿では,指紋認証を条件パラメータ生成タスクとして再構成するフレームワークであるPrompt2Fingerprintを提案する。
特殊なジェネレータを利用することで、P2Fはテキスト記述を直接低ランクパラメータインクリメントにマッピングする。
実験の結果,P2Fは高い指紋精度,無害性,堅牢性を保ちながら,計算オーバーヘッドを著しく低減することがわかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:30:32 GMT)
Leveraging Latent Visual Reasoning in Silence [46.7] 遅延トークンをランダムノイズに置き換えたり、取り除いたりすると、空間推論ベンチマーク間で性能劣化がほとんどないことが示される。
本稿では、RL中に生成された潜在トークンが後続のテキストトークンと対話することを奨励するアテンションベースの報酬を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:46:02 GMT)
GeoFlow: Enforcing Implicit Geometric Consistency in Video Generation [46.5] 生成した映像中の動きがコヒーレントなシーンと互換性があるかどうかを測定する。
我々はこれを光学的流れ、奥行き予測、および剛性領域と動的領域の分離に対応する特徴ベースの対応を用いて運用する。
実験は、知覚品質を保ちながら、強いベースライン上での時間的幾何学的アーティファクトの大幅な減少を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:17:08 GMT)
Unitary discretization of the Koopman-von Neumann equation for quantum simulation of fluid and plasma dynamics [45.9] KvNフレームワークは、リウヴィル方程式をノルム保存、ユニタリ発展を伴うヒルベルト空間に埋め込む。
ワイル順序付きKvN発生器は実速度場に対するユニークな反エルミート作用素対称性として導出される。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:27:02 GMT)
Curriculum Group Policy Optimization: Adaptive Sampling for Unleashing the Potential of Text-to-Image Generation [45.3] トレーニング効率を改善するには、モデルの進化する能力にマッチするプロンプトを継続的に優先順位付けする必要があります。
本稿では,適応型カリキュラム学習フレームワークCGPOを提案する。
GenEval, T2I-CompBench++, DPG Benchの実験により, 本フレームワークは生成性能を効果的に向上することを示した。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:30:14 GMT)
Learning over Positive and Negative Edges with Contrastive Message Passing [45.2] Contrastive Message Passing (CMP)を導入し、グラフニューラルネットワーク層が正および負のエッジを推論できるようにする。
負のエッジが通知される場合、CMPは低ラベル設定でベースラインを一貫して上回る。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:52:07 GMT)
EgoInteract: Synthetic Egocentric Videos Generation for Interaction Understanding and Anticipation [45.0] 微細なエゴセントリックな相互作用とその時間的ダイナミクスをモデル化するための,エゴセントリックなビデオ生成のための制御可能なシミュレータを提案する。
我々は,時間的動作のセグメンテーション,次のアクティブ物体検出,相互作用予測,手動物体の相互作用検出のための高密度な空間的および時間的アノテーションを備えた合成エゴセントリックビデオデータセットを生成する。
その結果、タスクとデータセット間の強いベースラインよりも一貫した改善が示され、シミュレーションベースのアプローチの有効性と転送性を示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:58:56 GMT)
HINT-SD: Targeted Hindsight Self-Distillation for Long-Horizon Agents [45.0] 強化学習による長期LLMエージェントの訓練は、タスクが成功するか、どの中間動作が結果を引き起こしたのか、どのように修正されるべきなのかを明らかにするため、困難である。
近年の手法では、ターンレベルのアクション出力信号から報酬やテキストヒントを生成したり、あるいはフィードバック条件の自己蒸留を用いてこの問題を緩和している。
本研究では,HINT-SDを提案する。HINT-SDは,フルトラジェクティブ・ヒンドシット(Hndsight)を用いて,障害関連アクションを選択し,目標アクションスパンのみにフィードバック条件付き蒸留を適用する。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:34:03 GMT)
EgoExoMem: Cross-View Memory Reasoning over Synchronized Egocentric and Exocentric Videos [44.9] EgoExoMemは、同期されたエゴセントリックおよびエクソセントリックなビデオに対するクロスビューメモリ推論のための最初のベンチマークである。
E$2$-Selectはフレーム選択とRAGベースのメモリベースラインよりも5,8.2%の最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:54:55 GMT)
CounterCount: A Diagnostic Framework for Counting Bias in Vision Language Models [44.6] VLM(Vision-Language Models)はマルチモーダル推論において優れているが、その答えが視覚的証拠に根ざされているか、あるいは学習言語や世界の先駆者によって駆動されているかは定かではない。
本稿では,VLMにおけるデファクトカウントの診断フレームワークであるCounterCountを紹介する。
これらの失敗は、欠落または曖昧な視覚的証拠によるものではなく、無関係な視覚的トークンへの注意を過小評価するモデルによるものであることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:00:05 GMT)
SurgLQA: Scalable Long-Horizon Surgical Video Question Answering [44.5] 外科的ビデオ質問回答 (VideoQA) は動的術中解釈に有望なパラダイムを提供する。
既存のアプローチは主に画像やショートクリップに制限されている。
そこで我々は,スケーラブルな手術推論のためのビデオQAフレームワークであるSurgLQAを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:24:07 GMT)
Functionalization via Structure Completion and Motion Rectification [44.4] 視覚的に可視だが非機能的な3Dモデルを機能的かつ物理的に操作可能なモデルに変換することを目的とした,新しいタスクであるオブジェクト機能化を導入する。
非機能な3Dオブジェクトを表す不完全グラフを完成させるために,ニューラルグラフ汎関数器 (GraFu) を開発した。
完成したグラフは、予測されたコネクタと構造要素を3Dでインスタンス化する幾何学的実現段階を駆動する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:05:07 GMT)
Going Beyond the Edge: Distributed Inference of Transformer Models on Ultra-Low-Power Wireless Devices [44.1] 超低消費電力無線デバイス上での分散トランスフォーマー推論のためのフレームワークであるCATSを提案する。
CatSは通信対応の分散トランスフォーマー推論スキームで、トランスフォーマーのパーティショニング、無線通信、トレーニングを共設計している。
CATSが超低消費電力無線デバイスに分散トランスフォーマー推論を初めて導入したことを示し、最大16台のデバイスにデプロイすることで、単一のデバイスで実行できるものよりも最大14倍大きなトランスフォーマーモデルを共同で実行する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:43:05 GMT)
Semi-LAR: Semi-supervised Contrastive Learning with Linear Attention for Removal of Nighttime Flares [43.9] ラベルのない画像から安定した学習を可能にする半教師付きフレア除去フレームワークを提案する。
疑似監督を段階的に洗練する適応型擬似ラベルレポジトリを提案する。
また、フレア汚染された入力を負として明示的に扱うフレア対応コントラスト損失を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:02:47 GMT)
View-Aware Semantic Alignment for Aerial-Ground Person Re-Identification [43.7] ViSAは、ビュー間のセマンティック一貫性を実現するビュー対応フレームワークである。
ViSAは、挑戦的なCARGOクロスビュープロトコルにおいて、注目すべき10.06%のmAP改善とともに、一貫して優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:32:26 GMT)
Aurora: Unified Video Editing with a Tool-Using Agent [43.7] 本稿では,ツール拡張視覚言語モデル(VLM)エージェントであるAuroraについて紹介する。
我々は、VLMエージェントを教師付きデータで訓練し、完全な編集計画と参照画像の選択を行う。
AgentEdit-Benchと既存の2つのビデオ編集ベンチマークの実験は、Auroraが命令のみのベースラインよりも改善していることを示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:59:03 GMT)
Safety Geometry Collapse in Multimodal LLMs and Adaptive Drift Correction [43.6] MLLM(Multimodal large language model)は、テキストモダリティで学習した安全性機能を意味的に等価な非テキスト入力に転送するのに失敗することが多い。
本研究は,テキストアライメントされた拒絶方向とモダリティによるドリフト方向を解析することにより,このギャップについて検討する。
本稿では,自己修正によるモダリティドリフトを適応的に補正するトレーニングフリー推論時間法であるReGapを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:16:55 GMT)
Vision Foundation Models as Generalist Tokenizers for Image Generation [43.2] 凍結視覚基礎モデル(VFM)上に一般画像トークン化器を構築する。
離散空間と連続空間の両方でシームレスに動作可能なトークン化器 VFMTok を提案する。
VFM事前学習中に利用した自己教師型学習目標が,トークン化器としての有効性を規定していることが判明した。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:38:43 GMT)
MARR: Module-Adaptive Residual Reconstruction for Low-Bit Post-Training Quantization [42.9] モジュール適応残差再構成(MARR)を提案する。
MARRはモジュール固有のスケーリング係数を割り当て、各モジュールに対して累積エラー補正と残留関連HAバイアスを適応的にバランスさせる。
いくつかの典型的な大規模言語モデル(LLM)と視覚変換器(ViT)の実験は、低ビット量子化下でのMARRの有効性を実証している。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:51:49 GMT)
GIM: Evaluating models via tasks that integrate multiple cognitive domains [42.0] Grounded Integration Measureは、820のオリジナルの問題のベンチマークである。
それぞれの問題は、オリジナルの専門家による作曲である。
バランスのとれた公民分離は、汚染診断を内蔵する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:09:50 GMT)
Coherent spectroscopy of collective excitations in superfluid helium far from equilibrium [42.0] 我々はフェムト秒パルス列の超高速コヒーレント制御を用いて、平衡から遠く離れた超流動ヘリウム中の励起の分光を行う。
時間分解光複屈折測定により、マコン対とピタエフスキープラトー励起の非平衡ダイナミクスを追跡する。
結果は、強い相互作用を持つ量子流体において、集合励起に関する以前にアクセス不能な情報を抽出する能力を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:17:55 GMT)
Visualizing the Invisible: Generative Visual Grounding Empowers Universal EEG Understanding in MLLMs [42.0] 生成的ビジュアルグラウンド(GVG)は、脳波から画像への生成モデルを視覚翻訳器として使用することにより、見えないものを可視化する。
GVGは、非視覚的脳波のインスタンス固有のプロキシイメージを幻覚させ、MLLMが臨床状態の解釈のために視覚的優位性を利用することを可能にする。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:15:40 GMT)
See What I Mean: Aligning Vision and Language Representations for Video Fine-grained Object Understanding [41.7] SWIM(See What I Mean)は、視覚と言語表現を調整し、テキストのプロンプトからのみ、きめ細かいオブジェクト理解を可能にする訓練戦略である。
SWIMはテキスト・ビジュアル・アライメントを大幅に改善し,細粒度オブジェクト理解ベンチマークにおける視覚プロンプトに基づく手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:09:37 GMT)
Efficient Sparse-to-Dense Visual Localization via Compact Gaussian Scene Representation and Accelerated Dense Pose Estimation [41.4] 3次元ガウス平板上に構築した新規で効率的なローカライザLiteLoc(3DGS)について紹介する。
メモリと計算の両方において、LiteLocをより効率的にする、単純かつ高効率な2つの改善点を導出する。
実験の結果、LiteLocはSTDLOCをはるかに上回る効率で複数の場面で上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:51:25 GMT)
Robo-Cortex: A Self-Evolving Embodied Agent via Dual-Grain Cognitive Memory and Autonomous Knowledge Induction [40.7] RoboCortexは、ロボットがナビゲーションと認知戦略を自律的に誘導することを可能にする、自己進化型のフレームワークである。
我々の中心となる革新は、多モード軌跡を構造化ナビゲーションヒューリスティックライブラリーに蒸留する自律的知識誘導機構である。
我々は,RoboCortexがタスク成功と探索効率の両方において,高いベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:52:14 GMT)
Overeager Coding Agents: Measuring Out-of-Scope Actions on Benign Tasks [40.3] OverEager-Genは、良質なタスクの振る舞いをオーバーイーガーするベンチマークである。
クロード・コードでは、同意宣言を削除するだけで、オーバーイーガー率は0.0%から17.1%に上昇する。
オーバーイーガー・ジェン(OverEager-Gen)は、入場前に各シナリオの識別力を認定する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:00:41 GMT)
An Efficient Streaming Video Understanding Framework with Agentic Control [40.0] 本稿では,ストリーミング映像理解をカスケード制御問題として定式化するR3-Streamingを提案する。
各クエリに対して、システムはメモリを圧縮し、応答の即応性を判断し、逐次経路を決定する。
R3-StreamingはストリーミングMLLMの最先端結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:29:44 GMT)
Active Defense Against False Data Injection Attacks in Robotic Manipulators [39.8] 本稿では,有限水平False Data Injection Attacks (FDIA) に対するマニピュレータの弾力性について述べる。
仮想ダンピングとマニピュラビリティの低減という2つの防衛法を定式化し、タスク実行の確率的保証を与える。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:06:36 GMT)
Hidden in Memory: Sleeper Memory Poisoning in LLM Agents [39.7] 本研究は, 睡眠時記憶障害(sleeper memory poisoning)について検討する。これは, 相手が外部コンテキストを操作して, ユーザに関する偽造記憶を記憶させる, 遅延攻撃である。
従来のプロンプトインジェクションとは異なり、攻撃は休眠状態のままで、後続の会話をまたいで再起動することができる。
GPT-5.5では99.8%、Kim-K2.6では95%の有毒な記憶が加えられた。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:05:25 GMT)
AMR-SD: Asymmetric Meta-Reflective Self-Distillation for Token-Level Credit Assignment [39.6] 非対称メタ反射型自己蒸留(AMR-SD)
非対称なReLUゲートしきい値を持つ因果情報ゲイン(CIG)を導入し、これらの反射をスパースで高精度なトークンレベルの利点変調に変換する。
科学的、数学的、ツール使用のベンチマークによる実験は、AMR-SDが既存のベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:14:34 GMT)
Artifact-Bench: Evaluating MLLMs on Detecting and Assessing the Artifacts of AI-Generated Videos [39.5] Artifact-Benchは、AI生成ビデオアーティファクトの検出と分析におけるMLLMの評価のための包括的なベンチマークである。
まず,本研究では,フォトリアリスティック,アニメーション,CGスタイルの映像を網羅した,リアリズムアーティファクトの3階層的階層分類を構築した。
Artifact-Bench氏はこの分類に基づいて、3つの補完的なタスクを定義している。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:04:54 GMT)
TaskGround: Structured Executable Task Inference for Full-Scene Household Reasoning [39.5] 実家配置においては、家庭エージェントは、しばしば完全な家庭シーンと特定の世帯要求から操作されなければならない。
我々はこれをフルステージの家庭推論として定式化する。
我々は、トレーニング不要でモデルに依存しないGround-Infer-ExecuteフレームワークであるTaskGroundを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:19:20 GMT)
Attention Sinks and Outliers in Attention Residuals [39.5] 層間ヌルシグナリングに基づく外部・シンク対応手法を提案する。
AttnResidualアーキテクチャは、追加の深さワイド正規化チャネルを導入している。
AttnResidualの二重正規化設計はシンクの形成と量子化の脆さを高める。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:53:09 GMT)
Spiker-LL: An Energy-Efficient FPGA Accelerator Enabling Adaptive Local Learning in Spiking Neural Networks [39.3] Spiking Neural Networks(SNN)は有望な代替手段を提供するが、デバイス上での学習を可能にするには、ハードウェア・アルゴリズムの共同設計が必要である。
本稿では,FPGAベースのSNNアクセラレータであるSPIKER-LLについて述べる。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:54:36 GMT)
A Risk-Aware Framework for Covert Quantum Communication under Stochastic Channel Uncertainty [39.1] 被覆量子通信(CQC)は、メッセージの内容だけでなく、通信の存在も隠そうとしている。
CQCの不確実な物理層条件に対するリスク対応最適化フレームワークを提案する。
これらの結果は、CQCを、自由空間、衛星、低確率検出アプリケーションのための現実的なセキュアな量子ネットワークに近づける。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:38:36 GMT)
Easier to Judge than to Find: Predicting In-Context Learning Success for Demonstration Selection [39.1] インコンテキスト学習(ICL)は、どのデモがプロンプトに現れるかに非常に敏感である。
クエリを困難に階層化するサンプル・アンド・ジャッジ・フレームワークであるDiSPを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:03:59 GMT)
Agent Security is a Systems Problem [39.0] 我々は、エージェントセキュリティがシステム問題としてアプローチされなければならないという立場を取る。
エージェントシステムを予測可能な保証で設計するための基盤を提供する、一連のコア原則を具体化します。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:11:17 GMT)
A Large-Scale Study on the Accuracy vs Cost Trade-offs of Training and Evaluation Settings in Fine-Grained Image Recognition [38.7] 6つのトレーニングと評価設定、9つの事前訓練されたバックボーン、17のデータセットで2000以上の実験を行い、大規模な研究を行っている。
微粒化学習におけるデータ強化の有効性に関する予備的考察 : 対実的注意学習(CAL)の拡張を動機とする
推論コストを低減しつつ、競争精度を維持する効率的な評価専用変種を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:36:30 GMT)
SynGR: Unleashing the Potential of Cross-Modal Synergy for Generative Recommendation [38.7] Generative Recommendation (GR) は、アイテム識別子上のシーケンス・ツー・シーケンス生成タスクとしてアイテムレコメンデーションを定式化することによって、有望なパラダイムとして登場した。
生成中の相互依存の活用を明示的に促進する相乗的生成推薦フレームワークである textbfSynGR を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:03:23 GMT)
Mapping Uncharted Symmetries: Machine Discovery in Combinatorics [38.6] 現代の機械学習は、検証可能な数学的発見に有意義に寄与することを示す。
特に,厳密な分布制約の下での単純な数学的関数の構成に着目する。
表現論から生じる$q,t$-Narayanasの新たな解釈が見つかる。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:36:08 GMT)
Spectral Progressive Diffusion for Efficient Image and Video Generation [38.5] 本稿では,事前学習した拡散モデルの認知軌道に沿って,分解能を徐々に向上させる一般的な枠組みを提案する。
我々のフレームワークは、トレーニング不要の加速と、効率と品質をさらに向上させる新しい微調整レシピをサポートします。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:55:39 GMT)
Toxicity in Twitch Chats: An LLM-Based Analysis Across Gaming Communities [37.8] Twitchの7つのジャンルにまたがる4,452のストリームから2000万のチャットメッセージを分析します。
我々は、ゼロショット分類を用いた事前訓練された大規模言語モデルを用いて、Twitchの毒性分類に従ってメッセージを分類する。
分析の結果、全メッセージの2.4%が毒性に分類されており、ジャンルによって顕著な違いがあることがわかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:29:21 GMT)
Forecasting Downstream Performance of LLMs With Proxy Metrics [37.6] 本稿では,トークンレベルの統計値(エントロピー,トップk精度,エキスパートトークンランクなど)を集約することで,プロキシメトリクスを構築することを提案する。
3つの設定で、我々のプロキシは損失ベースのベースラインと計算ベースのベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:17:15 GMT)
Alignment Dynamics in LLM Fine-Tuning [37.5] 大規模言語モデル(LLM)は、人間のフィードバックから教師付き微調整と強化学習を通じて、強い整合性を達成する。
そこで我々は,微調整中にアライメントスコアを導入し,そのクローズドフォーム更新を導出し,アライメントダイナミックスのための統一的なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:27:12 GMT)
Trustworthy Agent Network: Trust in Agent Networks Must Be Baked In, Not Bolted On [37.5] A2Aネットワークは、単に1つのエージェントを使ってタスク全体を完了させるのに比べ、タスクパフォーマンスが向上する。
我々は、A2Aネットワークの信頼性は、主に個々のエージェント向けに設計された既存のプロトコルを適合させることによって完全に保証できないと論じる。
4つの設計柱を通してA2Aシステムを信頼する包括的概念的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:57:54 GMT)
DexHoldem: Playing Texas Hold'em with Dexterous Embodied System [37.4] 私たちはDexHoldemを紹介します。これは、Texas Hold'emをShadowHandで巧妙に操作する、現実世界のシステムレベルのベンチマークです。
DexHoldemは14のテキサスホールドエム操作プリミティブ、標準化された物理ポリシーベンチマーク、エージェント認識ベンチマークで1,470の遠隔操作デモを提供している。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:51:34 GMT)
Training data attribution in diffusion models via mirrored unlearning and noise-consistent skew [37.3] トレーニングデータ属性(TDA)は、生成モデル解釈を可能にし、様々な下流タスクを育成する。
現在のTDAアプローチは信頼性と堅牢性に欠けており、現実のセットアップでは採用されない。
我々は、ミラー化未学習および雑音持続スキュー(MUCS)を用いてTDAを実行することを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:52:26 GMT)
Stabilizing, Scaling & Enhancing MeanFlow for Large-scale Diffusion Distillation [37.3] 拡散モデルは顕著な生成能力を示すが、その高いレイテンシは実用的なデプロイメントを制限する。
MeanFlowはその簡潔な定式化と顕著なパフォーマンスのために、かなりの注目を集めている。
本稿では,MeanFlowの微分解を離散解に置き換えるウォームアップ手法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:16:15 GMT)
PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow [36.8] PathoSageは、知識検索、エビデンス収集、およびパッチレベルの病態推論のためのエビデンス適応を分離するフレームワークである。
本研究は, 堅牢な病理治療薬の指標として, 適応と信頼性に配慮したツールモデリングが重要であることを明らかにする。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:30:03 GMT)
Unlocking Dense Metric Depth Estimation in VLMs [36.4] VLM(Vision-Language Models)は、接地やキャプションなどの2Dタスクに優れるが、3D理解には制限がある。
本稿では,単一のVLMをネイティブな密度密度幾何学予測器に変換する,シンプルで効果的なフレームワークであるDepthVLMを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:43:10 GMT)
Post-Trained MoE Can Skip Half Experts via Self-Distillation [35.2] Mixture-of-Experts (MoE)は、スパース専門家のアクティベーションを通じて、言語モデルを効率的にスケールする。
MoEの動的変種は、アクティベートされた専門家を入力依存の方法で調整することで、計算をさらに削減する。
本稿では,Zero-Expert Self-Distillation Adaptation (ZEDA)について紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:50:48 GMT)
MA$^{2}$P: A Meta-Cognitive Autonomous Intelligent Agents Framework for Complex Persuasion [34.4] 複雑な説得のためのメタ認知型自律型インテリジェントエージェントフレームワークであるMA$2$Pを提案する。
具体的には、認識管理、精神状態推論、戦略実行、記憶維持、評価を協調する自律型マルチエージェントアーキテクチャを開発する。
我々のアプローチはベースラインよりも高い説得率を達成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:53:12 GMT)
Position: Zeroth-Order Optimization in Deep Learning Is Underexplored, Not Underpowered [33.9] バックプロパゲーションを伴わない関数評価の有限差から学習するゼロ次最適化(ZO)は,近年,ディープラーニングにおいて注目を集めている。
しかし、ZOメソッドは、推定値のばらつきと不都合なクエリの複雑さのため、基本的にはスケールできないとしばしば否定される。
認識されている多くの制限は、特に、フルスペース、要素ワイド、推定器中心の設計といった、ミオピックな開発プラクティスに起因していることが示される。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:21:10 GMT)
Imperfect World Models are Exploitable [33.8] 強化学習におけるモデル活用の新たな定義を提案する。
我々の定義は、報酬ハッキングの先行的な特徴と類似しているが、それに伴う不可避性の証明は、搾取に移行しないことを示す。
我々の結果は、報酬ハッキングとモデルエクスプロイトの間の正式な橋渡しを確立し、世界モデルにおける安全な計画の限界を解明する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:20:13 GMT)
Clifford symmetries in quantum many-body systems [33.8] 古典的に効率的なクリフォード群を利用して、グラフ表現を通して任意の多体ハミルトン多様体の対称性を求める。
ランダムおよび物理ハミルトニアンについて、最大1000量子ビットの例を実演し、我々のアプローチがモデルをより深く理解する方法を実証する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:23 GMT)
Dual-Rate Diffusion: Accelerating diffusion models with an interleaved heavy-light network [33.6] デュアルレート拡散(Dual-Rate Diffusion)は、高容量コンテキストエンコーダと軽量デノナイジングモデルの実行をインターリーブすることでサンプリングを高速化する手法である。
ImageNetベンチマークでは、Dual-Rate Diffusionは標準ベースラインのパフォーマンスと一致し、計算コストを2~4ドル削減した。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:30:02 GMT)
New Insight of Variance reduce in Zero-Order Hard-Thresholding: Mitigating Gradient Error and Expansivity Contradictions [33.0] ハードThresholdingは機械学習において重要なタイプのアルゴリズムであり、$ell_0$制約付き最適化問題を解くのに使用される。
SZOHTアルゴリズムは、これまでのZO勾配で$ell$ sparsityの制約に対処する唯一のアルゴリズムである。
本稿では, 一般化分散低減ZOハードスレッディングアルゴリズムと, 標準仮定に基づく一般化収束解析を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:24:18 GMT)
Feature Learning in Linear-Width Two-Layer Networks: Two vs. One Step of Gradient Descent [33.0] 線形幅構造内の2層ニューラルネットワークにおいて,隠れたニューロンの数,サンプルサイズ,入力次元が比例的にスケールする特徴学習について検討した。
これらの初期スペクトル遷移を特徴付けることにより、現代の過次元ネットワークにおける最適化と特徴学習現象論を研究するための、計算可能な数学的枠組みを確立する。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:37:50 GMT)
The MixCount Dataset: Bridging the Data Gap for Open-Vocabulary Object Counting [32.5] 我々は、現在のカウントモデルにおける障害モードをターゲットにした混合対象カウントのためのデータセットとベンチマークを開発する。
このようなデータの構築とラベル付けの高コスト化を克服するため、画像、きめ細かいテキスト記述、ピクセル完全カウントアノテーションを大規模に合成する自動生成パイプラインを開発した。
FSC-147ではMAEを20.14%削減し、PairTallyでは18.3%削減した。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:48:40 GMT)
Unleashing LLMs in Bayesian Optimization: Preference-Guided Framework for Scientific Discovery [32.5] LLM-Guided Bayesian Optimization (LGBO) を提案する。
Fe-Cr電池電解質の新しいウェットラブ最適化では、LGBOは6で観測された最高の値のテキストbf90%を達成しているが、標準BOと既存のLCM拡張ベースラインは10回以上必要である。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:30:25 GMT)
Qumus: Realization of An Embodied AI Quantum Material Experimentalist [32.2] 我々は、最初のAI量子材料実験者であるQumusを紹介する。
Qumusは、原子的に薄い2D材料と積み重ねられたファンデルワールス(vdW)構造の作成とナノプロセスのために設計された、インテリジェントでマルチモーダルでマルチエージェントシステムである。
重要なことに、このシステムは初めて、グラフェンのAI生成と、vdWスタックによる原子的に薄い電界効果トランジスタを含む複雑なナノデバイスの最初のAIファブリケーションを達成した。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:47:31 GMT)
MoCo-EA: Exploiting Adversarial Mode Connectivity for Efficient Evolutionary Attacks [31.1] 従来のクロスオーバーを新しいベジエクロスオーバー演算子に置き換えるモード接続進化攻撃(MoCo-EA)を導入する。
逆空間の幾何学的構造を経路最適化によって利用することにより、MoCo-EAは効率的かつ信頼性の高い方法を提供する。
我々の研究は、敵の例を孤立した点として従来の見方に挑戦し、攻撃発生研究と防衛研究の両方に新たな方向性を開く。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:20:08 GMT)
RT-Splatting: Joint Reflection-Transmission Modeling with Gaussian Splatting [31.0] RT-Splatting(RT-Splatting)は、ガウスの幾何学的占有を光学的不透明度から切り離すフレームワークである。
我々のハイブリッド・ファクター化は、この表現を、高周波数反射を捉えるための表面と、透明な透過を維持するための体積の両方として解釈する。
挑戦的な半透明シーンの実験では、RT-Splattingは最先端のパフォーマンスを実現し、高忠実なリフレクションとリアルタイムレンダリングによるクリアトランスミッションを実現している。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:00:00 GMT)
Knowledge-to-Verification: Exploring RLVR for LLMs in Knowledge-Intensive Domains [30.6] 検証可能な報酬付き強化学習(RLVR)は,大規模言語モデルの推論能力を高める有望な可能性を示している。
自動検証データ合成により,RLVRを知識集約領域に拡張するフレームワークであるK2V(Knowledge-to-Verification)を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:59:31 GMT)
SkillsVote: Lifecycle Governance of Agent Skills from Collection, Recommendation to Evolution [30.0] 本稿では,エージェントスキルのためのライフサイクル管理フレームワークであるSkillsVoteを紹介する。
SkillsVoteは、環境要件、品質、妥当性に関する100万規模のオープンソースコーパスをプロファイルしている。
トラジェクトリをスキルリンクされたサブタスクに分解し、スキル使用、エージェント探索、環境、結果信号に結果をもたらし、エビデンス付き更新に再利用可能な発見のみを認める。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:44:19 GMT)
LoRA vs. Full Fine-Tuning: A Theoretical Perspective [29.8] Low-Rank Adaptation (LoRA) は、メモリと計算コストを削減する効率的な微調整手法である。
簡単な線形回帰設定でLoRAを解析し、その過大なリスクをフル微調整のリスクと比較する。
我々の理論は、事前学習と下流タスクの差が効果的に低い場合、LoRAが完全な微調整より優れていることを予測している。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:40:24 GMT)
LESSViT: Robust Hyperspectral Representation Learning under Spectral Configuration Shift [29.8] 低ランク空間スペクトル ViT (LESSViT) は、クロススペクトル一般化のためのセンサフレキシブルアーキテクチャである。
空間スペクトルマスキングと階層チャネルサンプリングを分離したハイパースペクトルマスク付きオートエンコーダ(HyperMAE)を導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:22:26 GMT)
Acoustic Interference: A New Paradigm Weaponizing Acoustic Latent Semantic for Universal Jailbreak against Large Audio Language Models [29.7] 既存のjailbreakパラダイムは、主に悪意のあるペイロードのキャリアとしてオーディオを扱う。
コンテンツ注入から安全アライメント干渉へ音声の役割がシフトする新しいパラダイムを提案する。
干渉音声は内容的には優れているが、特定のALSを注入することで、普遍的なジェイルブレイクトリガーとして機能することを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:10:31 GMT)
Learning When to Adapt [29.7] 低ランク適応(LoRA)はパラメータ効率のよい微調整法として広く用いられている。
DiseLはLoRAモジュールを、個々のランク1コンポーネントに軽量な入力依存ゲートで拡張する。
DiseLは少数のパラメータのみを追加し、ローランク構造を保存する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:51:24 GMT)
Inter-LPCM: Learning-based Inter-Frame Predictive Coding for LiDAR Point Cloud Compression [29.6] LiDARセンサーは、角分解能が固定された点雲を取得する。
結果のデータは、球面座標系において体系的にパラメータ化され、効率的に圧縮される。
従来の球面座標に基づく点雲圧縮法は、強い速度歪み(RD)性能を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:58:57 GMT)
Guard: Scalable Straggler Detection and Node Health Management for Large-Scale Training [29.3] Guardは、大規模なトレーニングクラスタにおいて、ストラグラーを検出し、ノードの健全性を保証するシステムである。
FLOPの平均使用率を最大1.7倍に改善し、実行中のトレーニングステップの分散を20%から1%に削減する。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:40:52 GMT)
Actionable World Representation [29.3] 我々は,ポイントクラウドやRGB-Dビデオストリームから直接学習することで,実世界のオブジェクトの状態多様体をモデル化できるニューラルネットワークであるWorldStringを提案する。
WorldStringは物理世界モデルの基本的なビルディングブロックとして機能するので、WorldStringと名付けます。しかしながら、その完全に差別化可能な構造は、ポリシー学習とニューラルダイナミクスとの将来の統合をシームレスに実現します。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:58:51 GMT)
Automated Kernel Discovery Towards Understanding High-dimensional Bayesian Optimization [29.1] textbf Kernel Discoveryは、事前に定義されたコンポジションルールを超えて、より広いカーネル空間を探索するフレームワークである。
また、過度に適合したカーネルをペナライズする選択基準として、LOO-CRPS(Left-out Continuous Rank probability score)を提案する。
提案手法は17点中平均のtextbf1.2 のランクを達成し,競争基準よりも優れていた。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:35:59 GMT)
InfoFlow: A Framework for Multi-Layer Transformer Analysis [28.7] 多層変圧器は単層変圧器と基本的に異なる近似能力を有する。
我々は多層トランスフォーマーのためのフレームワークInfoFlowを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:38:39 GMT)
NEWTON: Agentic Planning for Physically Grounded Video Generation [28.7] ビデオ生成モデルは視覚的に説得力のある結果を生み出すが、体系的に物理的常識に反する。
本稿では,システム出力からエージェントのツールボックス内の1つのアクションに映像生成を分解するNEWTONを提案する。
ニュートンは、LTX-Videoで21.4%から29.7%に、Veo-3.1で30.7%から37.4%に改善した。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:42:24 GMT)
Same Signal, Different Semantics: A Cross-Framework Behavioral Analysis of Software Engineering Agents [28.7] ソフトウェア工学エージェントの行動研究は、どの軌道形状がより高い分解率と相関するかという操作規則を抽出する。
それぞれのルールは典型的には単一のフレームワークから派生しており、それが構造的に異なるエージェント設計への署名と大きさの移行が直接テストされていない。
我々は、各層を順番に固定することでLCM効果からフレームワーク効果を分離し、構成毎に1つの振る舞い・アウトカム効果を測定する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:49:18 GMT)
DuIVRS-2: An LLM-based Interactive Voice Response System for Large-scale POI Attribute Acquisition [28.5] 本稿では,Baidu Mapsにおける大規模POI属性取得のための大規模言語モデル(LLM)に基づくエンドツーエンドフレームワークを提案する。
DuIVRS-2は毎日0.4万回の通話を処理し、83.9%のタスク成功率(TSR)を達成した。
この研究は、大規模産業対話アプリケーションのためのロバストで費用対効果の高いLLMエージェントを開発するために、生産実績のあるリファレンスを提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:06:01 GMT)
Generating Pretraining Tokens from Organic Data for Data-Bound Scaling [28.3] SynProは、LLMが限られた有機データからより深く学習するのに役立つ合成データ生成フレームワークである。
我々は,DCLMベースラインからチンチラ最適トークン(0.8Bおよび2.2B)の10%を有する400Mおよび1.1Bモデルを事前訓練した。
以上の結果から, 有機データは標準的繰り返しによって著しく過小評価されていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:44:40 GMT)
GAMMA: Global Bit Allocation for Mixed-Precision Models under Arbitrary Budgets [28.1] 混合精度量子化は、大規模言語モデルの高精度トレードオフを改善する。
GAMMAは,モジュール単位の精度の選好を,学習後のパイプライン内で完全に学習するフレームワークである。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:30:58 GMT)
Cracks in the Foundation: A Civil Infrastructure Dataset to Challenge Vision Foundation Models [28.1] CiF(Cracks in the Foundation)は、これまでで最大かつ最も詳細な土木インフラ(インスタンス)セグメンテーションデータセットである。
ファウンデーションモデル(FM)とビジョン言語モデル(VLM)の出現にもかかわらず、現在の視覚AIの盲点を露呈する。
我々の評価は、最新のゼロショットFMでさえ、現実世界のインフラに配備する際、重大な課題に直面していることを示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:51:47 GMT)
WinTok: A Win-Win Hybrid Tokenizer via Decomposing Visual Understanding and Generation with Transferable Tokens [27.9] WinTokは視覚的理解と生成のためのハイブリットトークンである。
これは、学習可能なセマンティックトークンのセットでピクセルトークンを補完する。
WinTokは強力なベースラインであるUniTokを11.2%の精度で上回り、競争力のあるrFIDの0.41を達成している。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:24:39 GMT)
Generation Navigator: A State-Aware Agentic Framework for Image Generation [27.2] 既存のシステムは、手作りのルールによって駆動される単純なプロンプト書き換えかクローズドループエージェントに依存している。
生成軌道を動的に操り、次の動作を出力するマルチターンT2IエージェントであるGeneration Navigatorを提案する。
本稿では,高画質画像の発見に有意な報奨を与える軌道レベルの強化学習目標であるPre-GRPOを用いてこれを解決する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:26:45 GMT)
FUSE: A Framework for Unified State Estimation in Robotic SLAM Systems [27.0] FUSEはロボットSLAMシステムにおける統一状態推定のためのフレームワークである。
LiDAR-IMUのインスタンス化は、混合レートセンシングおよび方向性縮退下でのフレームワークを調べるために開発された。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:36:04 GMT)
Evaluating Cognitive Age Alignment in Interactive AI Agents [26.9] 最先端のAIエージェントは、子供が簡単に解決できるような、基本的な、一見単純なタスクで失敗することが多い。
ChildAgentEvalは、MLLMをベースとしたエージェントの認知年齢アライメントを評価するための、最初の心理測定に基づくインタラクティブベンチマークである。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:56:22 GMT)
Hyrax: An Extensible Framework for Rapid ML Experimentation and Unsupervised Discovery in the Era of Rubin, Roman, and Euclid [26.7] Hyraxはオープンソースのモジュール型でGPU対応のPythonフレームワークで、天文学における機械学習のライフサイクルを完全にサポートする。
実測データに対する5つの代表的な応用を通して,Hiraxの汎用性を実証する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:06 GMT)
Propagating Unsafe Actions in LLM Controlled Multi-Robot Collaboration via Single Robot Compromise [26.7] 大規模言語モデル (LLMs) は、インテリジェンスにおける一般的なプランナーとしてますます使われている。
対戦相手が単一のエントリーロボットのみと対話するマルチロボットシステムに対する新たな攻撃パラダイムを提案する。
私たちはこのプロセスを3つのメトリクス、服従、伝染、ステルスネスで定量化します。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:26:21 GMT)
Protein Fold Classification at Scale: Benchmarking and Pretraining [26.5] Masked Invariant Autoencoders (MiAE)はタンパク質構造表現学習のための自己教師型フレームワークである。
MiAEはTEDBenchの監視対象と最先端のベースラインに優れています。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:32:34 GMT)
COBALT: Crowdsourcing Robot Learning via Cloud-Based Teleoperation with Smartphones [26.2] COBALTは、ロボット学習を大規模に民主化するために設計された遠隔操作プラットフォームである。
スケーラブルでロードバランスのよいインフラストラクチャは、1つのGPU上で複数のユーザによる同時遠隔操作をサポートしています。
オペレーターは、シングルまたはデュアルのスマートフォン、VRヘッドセット、3Dマウス、キーボードなど、地球上のほぼどこからでも接続できる。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:37:32 GMT)
A More Word-like Image Tokenization for MLLMs [26.1] 本稿では,コヒーレントなセマンティックユニットへのパッチの埋め込みをクラスタ化するDisentangled Visual Tokenization (DiVT)を提案する。
多様なマルチモーダルベンチマークで、DiVTはベースラインにマッチするか、はるかに少ないビジュアルトークンで超える。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:09:46 GMT)
FuTCR: Future-Targeted Contrast and Repulsion for Continual Panoptic Segmentation [25.8] 新しいクラスが導入される前に表現を再構成するフレームワークを提案する。
FuTCRは、最先端のパノプティクスを最大28%改善する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:31:13 GMT)
WavFlow: Audio Generation in Waveform Space [25.6] WavFlowは、中間表現なしで生波形空間で直接高忠実なオーディオを生成するフレームワークである。
自動データパイプラインを活用して、500万の高品質のビデオテキストオーディオトリプルをキュレートします。
WavFlowは、VGGSound (FD_PaSST: 59.98, IS_PANNs: 17.40, DeSync: 0.44)とAudioCaps (FD_PANNs: 10.63, IS_PANNs: 12.62)の競合性能を達成した。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:59:10 GMT)
Focused Forcing: Content-Aware Per-Frame KV Selection for Efficient Autoregressive Video Diffusion [25.6] textbfFocused Forcingは、生成フレームとヘッド次元の両方に沿ってキャッシュされた履歴に焦点を当てた、トレーニング不要なKV選択手法である。
生成されたフレームごとに、Focused Forcingは最も関連性があり、独特な歴史的フレームを保存する。
複数の自己回帰生成パラダイム全体で、Focused Forcingはトレーニングなしで最大$textbf1.48times$エンドツーエンドアクセラレーションを達成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:58:13 GMT)
DARE-EEG: A Foundation Model for Mining Dual-Aligned Representation of EEG [25.5] 両面共役表現学習によりマスク不変性を強制する自己教師型基礎モデルであるDARE-EEGを提案する。
具体的には、同一の脳波サンプルの複数のマスキングビューからの表現を制約するマスクアライメントを導入する。
また,不均一電極構成に事前学習した表現を適応させるパラメータ効率の手法であるconv-linear-probingを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:18:43 GMT)
EXG: Self-Evolving Agents with Experience Graphs [25.4] 自己進化型エージェントのためのエクスペリエンスグラフフレームワークEXGを紹介する。
EXGは、蓄積された成功と失敗を構造化されたリレーショナル表現に明示的に整理する。
以上の結果から,グラフとしての構造化経験は,スケーラブルで移動可能な自己進化エージェント行動の基盤となることが示唆された。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:50:23 GMT)
Graph Hierarchical Recurrence for Long-Range Generalization [25.4] グラフニューラルネットワーク(GNN)とグラフトランスフォーマー(GT)は現在、グラフ学習の基本的なパラダイムとなっている。
グラフ階層再帰(GHR: Graph Hierarchical Recurrence)は,入力グラフとプールによって得られる階層的抽象化を併用した新しいフレームワークである。
我々はGHRが既存のグラフモデルより一貫して優れており、現在の最先端モデルのパラメータの1%しか使用していないことを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:31:21 GMT)
AMARIS: A Memory-Augmented Rubric Improvement System for Rubric-Based Reinforcement Learning [25.3] AMARISは,長期トレーニング履歴において,ルーリックな修正を基礎として導入する。
各トレーニングステップでは、AMARISは結果をステップレベルの要約に集約する。
クローズドドメインとオープンエンドドメインの両方の実験は、AMARISがベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:06:27 GMT)
General Preference Reinforcement Learning [25.1] ポストトレーニングは、大きな言語モデル(LLM)のアライメントを2つの大きく切り離されたトラックに分割した。
検証可能な報酬を伴うオンライン強化学習は、数学とコードの創発的な推論を促進する。
GPRL(General Preference Reinforcement Learning)は、各次元のグループ相対的な利点を計算し、それぞれを独自のスケールで正規化し、軸が支配できないようにする。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:50:27 GMT)
Reconciling Contradictory Views on the Effectiveness of SFT in LLMs: An Interaction Perspective [24.9] 本稿では,教師付き微調整(SFT)が大規模深層ニューラルネットワークに広範に有効であるが,大規模言語モデル(LLM)に適用した場合,不整合性や有害な効果を生じる可能性がある理由を考察する。
SFT間の相互作用の進化は,LLMに対するSFTの不整合性の有効性を効果的に説明できることがわかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:22:54 GMT)
Pointwise Generalization in Deep Neural Networks [24.6] 深層ネットワークのトラクタビリティを説明する構造特性と数学的原理を同定する。
深層ネットワークは数学的に計算可能であり,その一般化はポイントワイズ,特徴スペクトル認識複雑性によって明確に説明できることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:09:06 GMT)
CodeBind: Decoupled Representation Learning for Multimodal Alignment with Unified Compositional Codebook [24.2] 本稿では,多モード表現空間を最適化するフレームワークであるCodeBindを提案する。
CodeBindは、セマンティック一貫性のための共有コンポーネントと、モダリティと特異な詳細のための特定のコンポーネントに機能を分解する。
この設計では、共有コードブックがモダリティギャップを橋渡しし、モダリティ固有のコードブックが表現バイアスを軽減する構成ベクトル量子化方式を用いる。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:56:19 GMT)
SGSoft: Learning Fused Semantic-Geometric Features for 3D Shape Correspondence via Template-Guided Soft Signals [23.9] 変形可能な3次元形状にまたがる密接な対応を学習することは、構造的変動、非等方的変形、不整合トポロジーによる長年にわたる課題である。
SGSoftは、標準テンプレート上に測地対応フィールドを構築し、事前訓練されたセマンティックプリミティブによって導かれる多モード密度記述子を学習する統合固有のパイプラインである。
SGSoftは最先端のカテゴリー間一般化を実現し、従来の手法の中で最高の精度と効率のトレードオフを提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:31:04 GMT)
S2Aligner: Pair-Efficient and Transferable Pre-Training for Sparse Text-Attributed Graphs [23.8] テキスト分散グラフ(TAG)の事前トレーニングは、転送可能なグラフ基盤モデルの構築の中心である。
本稿ではS2Alignerについて述べる。これはスパースTAGにおけるグラフテキスト事前学習のための空間認識と構造拡張 LLM-as-Aligner フレームワークである。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:56:19 GMT)
KVDrive: A Holistic Multi-Tier KV Cache Management System for Long-Context LLM Inference [23.7] 我々は、GPUメモリ、ホストDRAM、SSDにまたがる総合的なマルチ層KVキャッシュ管理システムであるKVDriveを紹介する。
KVDriveは、キャッシュ配置、パイプラインスケジューリング、階層間の調整を共同でオーケストレーションするシステムの観点から、この問題に取り組む。
このシステムは精度を保ちながら最先端の作業に比べて最大1.74倍のスループットを実現している。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:54:16 GMT)
What is Holding Back Latent Visual Reasoning? [23.6] 潜在トークンが非形式的なダミーのトークンに置き換えられると、モデル精度は影響を受けないことがわかった。
我々の実験は、潜伏した視覚的推論を抑える2つの重要な問題を明らかにした。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:14:49 GMT)
UST-Hand: An Uncertainty-aware Spatiotemporal Point Cloud Interaction Network for 3D Self-supervised Hand Pose Estimation [23.5] UST-Handは、手ポーズの不確実性分布を推定し、確率的ポイントクラウド特徴空間を構築する、自己教師型学習フレームワークである。
最先端性能を実現し、MPVPE(Mean Per Vertex Position Error)において、既存の自己監督手法を37.8%向上させる。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:47:13 GMT)
Flowing with Confidence [23.4] 生成モデルは、非意味なテキスト、非現実的な画像、不安定な物質をシミュレーションや人間のレビューよりも早く吸収することができる。
モデル信頼度ではなくモデル間の変動度を測定するために,信頼性を伴うフローマッチング(FMwC)を提案する。
FMwCは、選択された層で入力依存乗法ノイズを注入し、その分散をクローズドな形でネットワークを通して伝播し、ODE軌道に沿って改善し、標準サンプリングコストでサンプル当たりの信頼スコアを得る。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:28:17 GMT)
PopPy: Opportunistically Exploiting Parallelism in Python Compound AI Applications [23.4] PopPyは、Pythonアプリケーションにおける並列化の機会を明らかにするシステムである。
現実世界の複合AIアプリケーションセットでは、PopPyはエンドツーエンドの実行時間で最大6.4倍のスピードアップを達成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:33:50 GMT)
Anderson Transition and Mobility Edges in a Family of 3D Fractal Lattices [23.2] 連続的に調整可能なスペクトル次元を$d_sin[2,3]$とする3次元フラクタル格子の族を導入する。
スペクトル次元が遷移の普遍性クラスを支配下に置くのに対し、正確な臨界点は微視的な幾何学的詳細によっても影響されていることを示す。
本研究は,従来の整数次元システムを超えた局所化と量子臨界現象を探索するための汎用的な枠組みとして,可変フラクタル格子を構築した。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:09:38 GMT)
GOAL: Graph-based Objective-Aligned Diffusion Solvers for Dynamic Multi-Objective Optimization [23.2] GOALは関係グラフ表現上の条件付き拡散解法である。
本稿では,異なる制約のクラスに対応する異なるエッジタイプが,グラフニューラルネットワークのメッセージパッシング構造を定義する異種グラフ符号化手法を提案する。
GOALは、最大20のジョブと60のオペレーションの複数の目的に対して、100%ソリューションの実現性とほぼゼロのMAPEを実現する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:11:03 GMT)
Learning Subspace-Preserving Sparse Attention Graphs from Heterogeneous Multiview Data [23.1] ヘテロジニアスなマルチビューデータからサブスペース保存されたスパースアテンショングラフを学習するスパースアテンショングラフ学習(SAGL)法を提案する。
SAGLは、最先端の教師なしトランスファー学習アプローチよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:00:55 GMT)
Reducing Diffusion Model Memorization with Higher Order Langevin Dynamics [22.8] 拡散/スコアベースのモデルは、トレーニングデータ分布を模倣する高品質なサンプルを生成することができる。
著作権とプライバシを潜在的に侵害する「記憶化」として知られるトレーニングサンプルを再現する傾向が指摘されている。
この現象に対する高次ランゲヴィンダイナミクス(HOLD)の効果について検討した。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:52:51 GMT)
GROW: Aligning GRPO with State-Action Modeling for Open-World VLM Agents [22.6] 視覚言語モデル(VLM)エージェントは、オープンワールドタスクにおいて有望な進歩を示している。
GROWは、収集された軌跡をステートアクションサンプルに分解する、オープンワールドなVLMエージェントのためのフレームワークである。
800以上のMinecraftタスクに対する実験により,本手法がSOTA(State-of-the-art)性能を達成することを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:56:59 GMT)
Traditional statistical representations outperform generative AI in identifying expert peer reviewers [22.6] 科学論文の指数的な増加は、査読制度を歪めている。
統計的およびAIによる専門知識識別手法の信頼性を評価する。
この結果から,サブフィールドの専門知識の区別には微細な語彙が必要であることが示唆された。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:59:45 GMT)
Strategic Exploitation in LLM Agent Markets: A Simulation Framework for E-Commerce Trust [22.5] 本稿では,電子商取引市場におけるLCMエージェントの挙動を研究するための制御シミュレーションフレームワークであるTruthMarketTwinを紹介する。
LLMエージェントが従来の市場にリリースされ、評判に基づくガバナンスの弱点を自律的に活用していることがわかりました。
その結果, LLM-agent シミュレーションは, 機関が支配する自律市場を研究するためのツールとして位置づけられた。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:04:58 GMT)
Divergence-Suppressing Couplings for Rectified Flow [22.5] Rectified Flowでは、ベースフローモデルによって生成された軌跡が屈曲してインタートワインとなり、結果として得られる結合がこの歪みを継承する。
本稿では,学習速度の発散成分を減衰させるオフライン補正法であるRectified Flowの発散抑制結合を提案する。
このオフライン修正は、2D合成ベンチマークと画像生成に一貫した改善をもたらす。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:34:47 GMT)
Temporal Aware Pruning for Efficient Diffusion-based Video Generation [22.5] 本研究では,効率的な拡散型ビデオ生成のためのトレーニング不要な時間アウェアであるTAPEを提案する。
TAPEは高い視覚的忠実性を維持しつつ、大幅なスピードアップを実現し、トークン削減手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:18:24 GMT)
Imaging Hidden Objects with Consumer LiDAR via Motion Induced Sampling [22.4] 非視線イメージング(NLOS)は、研究グレードのLiDARで実証されている。
本稿では,これらの課題を克服するための多フレーム融合戦略を提案し,消費者LiDAR上でのNLOSイメージングを実証する。
我々の結果はプラグアンドプレイのNLOSイメージングへのシフトを表しており、誰でも既製のハードウェアで隠された物体を撮影できる。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:18:50 GMT)
STT-Arena: A More Realistic Environment for Tool-Using with Spatio-Temporal Dynamics [22.4] 現実世界のエージェントアプリケーションにおける大規模言語モデル(LLM)は、中間破壊が以前の決定を無効にするときに、再設計と適応を行なわなければならない。
STT-Arenaは、9つの時間的対立タイプと4つの可解性レベルにまたがる高品質な対話型タスクのベンチマークである。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:27:52 GMT)
Wasserstein Equilibrium Decoding for Reliable Medical Visual Question Answering [22.3] 小さなビジョン言語モデル(2-8B)は、プライバシの制約、接続性の制限、低レイテンシ要求のため、clin-icalデプロイメントに適しています。
我々は,これまでテキストのみのクローズドエンドNLPタスクに制限されていたゲーム理論デコーディングを,オープンエンド医療用VQAの視覚言語モーダルに拡張する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:31:15 GMT)
SNLP: Layer-Parallel Inference via Structured Newton Corrections [22.1] 構造ニュートン層並列性(SNLP)は、ジャコビアン層をより安価なアーキテクチャによるサロゲートダイナミクスに置き換えるトレーニングと推論のフレームワークである。
ナノチャットスケールトランスの実験により、SNLP正規化は層-並列互換性を改善し、標準のシーケンシャルなパープレキシティも向上することが示された。
これらの結果から, 層並列推論は, 逐次実行に対する数値近似であるだけでなく, 解法に起因した推論バイアスとして作用する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:28:16 GMT)
Embedding by Elicitation: Dynamic Representations for Bayesian Optimization of System Prompts [22.1] システムプロンプトは、現代のAIシステムにおいて中心的な制御メカニズムであり、会話、タスク、ユーザ集団間での振る舞いを形作る。
本研究では,この集合フィードバック設定を,個別の可変長テキストに対するサンプル制約付きブラックボックス最適化として検討する。
本稿では,ベイズ最適化フレームワークReElicitを紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:28:17 GMT)
Unleashing Vision Transformer Potential In Image Quality Assessment via Global-Local Adaptive Interaction [22.0] 我々は、事前学習された視覚変換器を効果的に活用する新しいフレームワーク、GLIA(Global-Local Interaction Adapter)を紹介する。
グローバルな意味情報ときめ細かな局所的詳細を共同で保持することにより,予測精度とロバスト性を向上する。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:02:44 GMT)
DCFold: Efficient Protein Structure Generation with Single Forward Pass [21.9] そこで我々は,AlphaFold3レベルの精度を実現する単一ステップ生成モデルDCFoldを提案する。
新たな時間測地マッチング(TGM)スケジューラを組み込んだデュアル一貫性トレーニングフレームワークにより,DCFoldは推論の15倍の高速化を実現することができる。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:05:56 GMT)
Babel: Jailbreaking Safety Attention via Obfuscation Distribution Optimized Sampling [21.8] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃に弱いままである。
我々は,効率的なブラックボックス攻撃フレームワークであるBabelを提案する。
Babelは最先端の攻撃成功率とクエリ効率の向上を実現している。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:27:59 GMT)
TacSE3: Equivariant SE(3) Motion Estimation from Low-Texture Visuotactile Images for In-Gripper Tracking and Compensation [21.7] TacSE3は触覚運動推定パイプラインであり、低テクスチュア・ビジョタクティルを3次元の非結合力場に変換する。
本手法は, 接触中心運動から平面変換を導出し, 主にせん断関連触覚応答から回転を推定する。
DM-Tacフィンガーチップを用いた実験では、デュアルセンサーセンシングは翻訳・回転のあいまいさを低減し、軸と物体のジオメトリ間の回転追跡をサポートし、軽量な補償信号を提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:38:06 GMT)
EvoMemBench: Benchmarking Agent Memory from a Self-Evolving Perspective [21.7] EvoMemBenchは、メモリスコープとメモリ内容の2つの軸に沿って編成された統一ベンチマークである。
本稿では,15個の代表記憶法と強い長文ベースラインを標準プロトコルで比較する。
結果は、現在のメモリシステムは、まだ一般的な解決策には程遠いことを示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:54:38 GMT)
Dynamic Execution Commitment of Vision-Language-Action Models [21.6] 本稿では,動的実行コミットメントを自己特定的プレフィックス検証問題として再編成する適応アクションアクセプタンス機構であるA3を紹介する。
A3はまず、グループサンプリングを介して行動の軌跡的なコンセンサススコアを計算し、次に代表ドラフトを選択し、下流検証を優先する。
さまざまなVLAモデルとベンチマークの実験では、A3は手動の水平調整の必要性を排除し、実行と推論のスループットのトレードオフを優れたものにしている。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:05:10 GMT)
Elastic-dLLM: Position Preserving Context Compression and Augmentation of Diffusion LLMs [21.5] 我々は, [MASK]トークンの観点から, dLLMの冗長性を再考する。
位置保存[MASK]トークン圧縮と端末認識拡張を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:09:10 GMT)
Concise and Logically Consistent Conformal Sets for Neuro-Symbolic Concept-Based Models [21.5] Neuro-Symbolic Concept-based Models (NeSy-CBMs) は、ニューラルネットワークとシンボリック推論を統合し、ハイテイクなアプリケーションにおける信頼性を高める。
彼らはまず入力から高レベルな概念を抽出し、次に与えられた論理的制約と組み合わせてタスクラベルを推論する。
我々は,厳密で分散のないカバレッジ保証を提供するフレームワークであるConformal Prediction (CP) のアイデアを統合することで,この問題に対処する。
次にCOCOCOを紹介します。これは概念とラベルを共同で適合させ、1つの演目-引用修正ステップを通じてそれらを調整するポストホックフレームワークです。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:43:02 GMT)
REACT: Environment-Adaptive Architecture for Continuous Formation Navigation of Wheeled Mobile Robots [21.4] 本稿では,集中型生成と分散型生成管理を統合した階層型アーキテクチャREACTを提案する。
特に上層層は必要に応じて新しい環境適応型構造を生成する。
下層では、各WMRがJSTP法(Joint trajectory trajectory Planning)を実行し、生成した生成物を維持する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:11:31 GMT)
FLAG: Foundation model representation with Latent diffusion Alignment via Graph for spatial gene expression prediction [21.3] 現在のモデルは、遺伝子調整や空間分布といった重要な生物学的構造を見落としている。
我々は,このタスクを構造化分布モデルとして再定義する拡散ベースのフレームワークである textbfFLAG を紹介する。
実験の結果,FLAGは従来の精度で高い競争力を持つことがわかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:43:18 GMT)
Delta Forcing: Trust Region Steering for Interactive Autoregressive Video Generation [21.2] 既存のアプローチでは、双方向モデルを自動回帰生成器に蒸留し、ストリーミング長調律によりさらに適応する。
原因を条件バイアスとみなし,教師は条件に整合するが軌道に依存しない指導を行うことができる。
本稿では,適応信頼領域内の教師の信頼できない監督を制約するフレームワークであるDelta Forcingを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:08:34 GMT)
Bridge: Retrieval-Augmented Spatiotemporal Modeling for Urban Delivery Demand [21.1] 本研究では、地域時間ウィンドウの時間認識メモリから将来の需要パターンを検索する時間グラフフレームワークを提案する。
実験によると、Bridgeは、都市内のコールドスタートメモリデータセットの両方において、競合するベースラインよりも一貫して改善されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:55:19 GMT)
PAIR: Prefix-Aware Internal Reward Model for Multi-Turn Agent Optimization [20.9] グループ相対的政策最適化(GRPO)は、主要な選択肢として浮上しているが、緩やかな成果報酬への依存は、中間段階にわたる信用割当を著しく制限している。
そこで本研究では,凍結型隠れ状態プローブを用いた2段階モデルを提案する。
実験の結果, PAIRは汚染された軌道上では最も高いAUROCを達成でき, 予測コストは無視できることがわかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:39:30 GMT)
Evaluating the Utility of Personal Health Records in Personalized Health AI [20.9] 患者管理のPHR(Personal Health Records)は、患者の健康をよりよく理解できるようにすると約束している。
PHRから臨床データをコンテキストとして提供した場合,大規模言語モデル (LLM, Gemini 3.0 Flash) の可能性を評価し, ユーザの健康診断に有用な回答を提供する。
PHRデータを用いた全ての質問タイプに対する回答の有用性は大幅に改善される。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:55:15 GMT)
SPATIOROUTE: Dynamic Prompt Routing for Zero-Shot Spatial Reasoning [20.8] 本稿では,各質問をセマンティックにカスタマイズしたプロンプトテンプレートにルーティングする動的プロンプト生成手法であるSpatioRouteを紹介する。
SpatioRouteは、固定されたプロンプトベースラインに対して、一貫した全体的な精度を最大5%向上させ、ゼロショットビデオのみの空間VQAのための新しい最先端技術を確立する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:54:55 GMT)
EgoBabyVLM: Benchmarking Cross-Modal Learning from Naturalistic Egocentric Video Data [20.7] 子どもたちは、限られたビジュオ言語入力から顕著な頑健さで言語基盤を取得する。
現在の視覚言語モデルは、ウェアラブルデバイス、エンボディエージェント、幼児用ヘッドカムによって生産される、疎外的で、バランスのとれたエゴセントリックなストリームに一般化することができない。
EgoBabyVLM Challengeを導入し、幼児が経験する自然主義的なデータから言語学習の基盤となるモデルを開発する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:30:54 GMT)
AdaptiveLoad: Towards Efficient Video Diffusion Transformer Training [20.7] 大規模なビデオ拡散変換器(DiTやMMDiTなど)の訓練は、重要な計算課題となっている。
既存のバケットベースのデータローディング戦略は、“同じトークン長”の制約に依存している。
本稿では,2つのコアコンポーネントからなる統合フレームワークであるtextitLoadを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:30:31 GMT)
Causal Inference with Categorical Unobserved Confounder via Mixture Learning [20.5] 未保存の共同創設者が適切な条件下でカテゴリー化されている場合、因果効果が識別可能であることを示す。
本稿では, テンソル分解に基づく推定手法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:28:16 GMT)
UAM: A Dual-Stream Perspective on Forgetting in VLA Training [20.5] 視覚-言語-アクションモデル(VLAモデル、Vision- Language-action Model)は、通常、予め訓練された視覚-言語モデル(VLM)をアクションデータに微調整することによって構築される。
本稿では,この標準レシピがVLMのマルチモーダル能力を体系的に損なうことを示す。
生物学的ビジョンの2ストリームの組織にインスパイアされたこの劣化は、構造的ボトルネックまで遡る。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:08:58 GMT)
Operationalising Post Quantum TLS Automated Configuration Profiling and Hybrid PQC Deployment in Financial Infrastructure [20.3] 後量子暗号(PQC)標準は、キー交換とデジタル署名のために現在存在する。
導入者にとっての緊急の問題は、PQCを信頼性のある複雑な環境で運用する方法である。
本稿では,TLS暗号の姿勢を自動的に抽出し,正規化する構成解析手法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:10:15 GMT)
Key-Gram: Extensible World Knowledge for Embodied Manipulation [20.2] 身体制御では、動的視覚状態を推論しながら構成言語命令に従うモデルがますます必要となる。
Key-Gramは、言語由来の世界知識と、具体的制御のための視覚状態推論を分離する条件記憶フレームワークである。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:37:02 GMT)
Decoupled Conformal Optimisation: Efficient Prediction Sets via Independent Tuning and Calibration [20.2] そこで我々は,列車チューンキャリブレート設計の原則としてデカップリング・コンフォーマル最適化(DCO)を提案する。
DCOは、効率指向構造選択のために独立したチューニングスプリットと、最終共形量子化のための新鮮なキャリブレーションスプリットを使用する。
DCOは,PACスタイルのキャリブレーションに対して,平均予測セットサイズや間隔幅を小さくしながら,名目カバレッジレベルを密に追跡する。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:10:21 GMT)
How Far Are We From True Auto-Research? [20.2] ResearchArenaは最小限の足場で、市販のエージェント自身が完全な研究ループを実行できる。
13のコンピュータサイエンスシードとエージェントドメインペア当たりのトライアルで、ResearchArenaは117のエージェント生成論文を生成する。
エージェント生成された117の論文のうち、トップレベルの会場の受け入れバーには到達しない。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:20:33 GMT)
Quantum Shannon theory made robust: a tale of three protocols for almost i.i.d. sources [20.0] 基盤となるリソース(状態またはチャネル)が独立であり、同一に分散しているという理想的な仮定は、プロトコルの劇的な破壊につながる。
i.d.リソースを任意のi.d.リソースに置き換えた場合でも、最適なレートを達成できるプロトコルはあるだろうか?
分析の副産物として、よく知られたダイヤモンド距離の変種として、クラブ距離の概念を導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:51:27 GMT)
RLFTSim: Realistic and Controllable Multi-Agent Traffic Simulation via Reinforcement Learning Fine-Tuning [20.0] 本稿では,強化学習に基づく微調整フレームワーク RLFTSim を紹介する。
シミュレータのロールアウトと実世界のデータ分散を整列することで、シナリオリアリズムを強化する。
また,目標条件設定による交通シミュレーションの再現性向上のための手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:57:13 GMT)
Incantation: Natural Language as the Action Interface for Multi-Entity Video World Models [18.6] Incantationは、ラテンフレームごとの自然言語コンディショニングを備えた世界初のインタラクティブなビデオワールドモデルである。
我々は、クロス・エンタリティ・トランスファーとアウト・オブ・ボキャブラリ・プロンプトのAction-Indexベースラインを超えている。
我々は、同じアーキテクチャとトレーニングのレシピを『The King of Fighters』に適用し、参加者ごとのアクションボキャブラリスロットだけを変更する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:12:52 GMT)
Bridging Silicon and the Hippocampus: Algebro-Deterministic Memory "VaCoAl" as a Substrate for Vector-HaSH and TEM [18.6] ガロアフィールド線形フィードバックシフトレジスタから構築したアルゲブロ決定性超次元メモリであるVaCoAlについて述べる。
我々は2つの異なるVaCoAlレギュレーションをEC-CA3およびEC-DG-CA3トリシナプス経路にマッピングした。
正式な対応を証明し、検証可能なiEEG予測を導出する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:24:19 GMT)
RL4RLA: Teaching ML to Discover Randomized Linear Algebra Algorithms Through Curriculum Design and Graph-Based Search [18.4] 本稿では、解釈可能なシンボリックRLAアルゴリズムの発見を自動化する一般的なRLフレームワークであるRL4RLAを提案する。
ブラックボックスアプローチとは異なり、本手法は基本線形代数プリミティブから明示的なアルゴリズムを構築し、検証可能かつ実装可能な表現を保証する。
我々はRL4RLAがスケッチ・アンド・プレコンディション・ソルバ、ランダム化カッツマーズ、ニュートン・スケッチを含む最先端の手法を再検討することを示した。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:57:26 GMT)
LivePI: More Realistic Benchmarking of Agents Against Indirect Prompt Injectio [18.4] LivePIは、プロダクション風だがテスト制御された環境でIPIリスクの構造化されたベンチマークである。
LivePIは7つの入力面、12の攻撃/レンダリングファミリー、5つの悪意のある目標をカバーしている。
グループチャットインジェクションは、デプロイメントにおいて評価されたバックボーン全体で均一に成功しています。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:41:35 GMT)
Integrated time-bin entangled quantum light source on a 4H-SiC microring chip [18.1] 共振器強化非線形光学プロセスを用いた時間双絡光子対光源は、量子情報技術にとって不可欠である。
4H-ケイ素炭化物プラットフォームを用いたマイクロリング共振器の非線形特性と形状を最適化した。
デバイスは1.35$times$107 s-1 mW-2の時間結合光子対発生率を達成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:30:21 GMT)
Personalized Face Privacy Protection From a Single Image [18.1] オンラインでアップロードされた顔の写真は、オンラインソースから顔画像を取り除く悪質なアクターに弱い。
本稿では,顔のプライバシ保護システムFaceCloakについて述べる。
ユーザーの単一の画像から、防御的なアイデンティティ固有の普遍的な顔プライバシーマスクを生成することができ、顔認識が失敗する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:56:56 GMT)
Articulation in Prime: Primitive-Based Articulated Object Understanding from a Single Casual Video [18.1] モノクロビデオから3次元物体の3Dキネマティクスを取得することは、コンピュータビジョンにおける根本的な課題である。
本稿では,対象理解を原始的適合問題として扱うカテゴリ非依存の最適化フレームワークを提案する。
また,AiP-synth と AiP-real のベンチマークも提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:52:41 GMT)
CounterFlow: A Two-Phase Inference-Time Sampling for Counterfactual Video Foley Generation [18.0] Inference-time dual-phase sample scheme for pretrained flow-matching VT2A model。
フェーズ1は、視覚的に指示されたソースを抑えながら、ビデオ由来の時間構造を構築する。
フェーズ2は、ビデオコンディショニングをドロップして、ターゲットプロンプトに向かって音声の音色を形作ることに完全にフォーカスする。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:42:06 GMT)
Enhancing the Code Reasoning Capabilities of LLMs via Consistency-based Reinforcement Learning [17.7] コード推論とは、ソースコードと特定の入力を与えられたプログラムの出力を予測するタスクを指す。
既存の作業は、そのタスクにおける強化学習の有効性を検証した。
コード推論のための一貫性駆動型強化学習フレームワークであるCodeThinkerを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:12:44 GMT)
MedFM-Robust: Benchmarking Robustness of Medical Foundation Models [17.7] 医療基盤モデル(MedFMs)は医療における変革的ツールとして登場した。
MedFMはMed-VLM(Med Vision-Language Models)とセグメンテーション基礎モデルという2つのパラダイムに分類される。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:50:56 GMT)
TierCheck: Tiered Checkpointing for Fault Tolerance in Large Language Model Training [17.6] TierCheckはクラスタ対応の階層型チェックポイントシステムである。
ローカルとピアメモリの軽量な差分チェックポイントを維持し、高速なローカライズされたリカバリを実現すると同時に、ヘビーウェイトベースチェックポイントをリモート永続ストレージに非同期に移行する。
また、トレーニングを中断することなく、階層間の厳格なグローバル一貫性を確保し、回復中にクラスタ対応のチェックポイントを高速に復元する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:48:32 GMT)
LatentUMM: Dual Latent Alignment for Unified Multimodal Models [17.5] 統一マルチモーダルモデル(UMM)は、共有潜在空間を学習することにより、理解と生成の両方において強力な性能を達成する。
このフレームワークは、拡張された共有潜在空間を構築し、変換を明示的に整列させ、モダル間の整合性を改善する。
実験により、LatentUMMは様々なアーキテクチャにおけるマルチモーダル一貫性を一貫して改善することが示された。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:35:05 GMT)
MoRe: Modular Representations for Principled Continual Representation Learning on Sequantial Data [17.5] 継続的な学習は、以前に取得した知識を保持しながら、新しいデータに適応するモデルを必要とする。
既存のアプローチでは、モデルパラメータやアーキテクチャを教師付きタスク固有の方法で変更することで、この問題に対処しています。
アーキテクチャレベルで割り当てるのではなく,表現自体のモジュラリティを識別するフレームワークであるMoReを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:09:11 GMT)
Offline Contextual Bandits in the Presence of New Actions [17.4] Off-policy contextual bandits (OPL) はレコメンデーションシステムや検索エンジンで使用される。
OPLは、既存のアクションセットから期待される報酬を最大化するアクションを選択する。
本稿では,アクション機能を活用した新しいOPL手法を提案する。
我々は,PONAが政策全体の性能を維持しつつ,効率的に新たな行動を選択することを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:01:30 GMT)
How does feature learning reshape the function space? [17.3] 本研究では,2層ニューラルネットワークの特徴によって分散された関数空間が勾配降下訓練中にどのように進化するかを検討する。
本結果は,早期特徴学習における関数空間の正確な視点を提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:41:20 GMT)
Three Heads Are Better Than One: A Multi-perspective Reasoning Framework for Enhanced Vulnerability Detection [17.3] 本稿では,3種類のLLMエージェントの認知シナジーを利用した多視点推論フレームワークReasonVulを提案する。
フレームワークはソースコードの独立した分析から始まり、続いてコンフリクトを解決するための構造化された議論メカニズムが続く。
我々は542のコンフリクトケースを分析し、389が正しく解決されたことを発見し、隠れた脆弱性を明らかにするフレームワークの能力を強調した。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:57:22 GMT)
Text2CAD-Bench: A Benchmark for LLM-based Text-to-Parametric CAD Generation [17.3] Text2CAD-Benchは、幾何学的複雑さとアプリケーションの多様性にまたがってテキスト・ツー・CADを体系的に評価する最初のベンチマークである。
L1-L2は標準的な特徴を持つ基本幾何学をカバーし、L3は複雑なトポロジーと自由曲面を導入し、L4は機械部品以外の現実世界の領域に拡張する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:03:41 GMT)
Physics-Aligned Canonical Equivariant Fourier Neural Operator under Symmetry-Induced Shifts [17.3] 標準的な神経オペレータは、単一のマップ内で座標調整と物理的進化を学ばなければならない。
周期領域上の進化方程式の既知の連続対称性を用いてこれらの2つの役割を分離する。
我々は、有界対称性摂動を用いて、任意の低次元微細化ステップを用いて、アライメントと演算子予測を共同で訓練する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:15:21 GMT)
OmniPro: A Comprehensive Benchmark for Omni-Proactive Streaming Video Understanding [17.2] オムニプロ(OmniPro)は、オムニモーダル知覚、プロアクティブ応答、多様なビデオ理解タスクを共同で評価する最初のベンチマークである。
9つのサブタスクと3つの認知レベルにまたがる2,700人の人間認証サンプルで構成されており、6つの基本的なビデオ理解機能を含んでいる。
特に、サンプルの84%は音声信号(音声または非音声)を必要とし、各サンプルは、微細なマルチモーダル解析を可能にするために、モダリティ・アイソレーションラベルで注釈付けされている。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:55:22 GMT)
VISAFF: Speaker-Centered Visual Affective Feature Learning for Emotion Recognition in Conversation [17.1] 会話における感情認識(ERC)は人間と機械の効果的な相互作用に不可欠である。
近年のビジョン・ランゲージ・モデル(VLM)は本質的にERCに適合していない。
話者中心型VISual AFFective機能学習フレームワークであるVISAFFを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:27:10 GMT)
4DLidarOpen: An Open 4D FMCW Lidar Dataset for Motion-Aware Autonomous Driving [17.1] 本研究では,4次元周波数変調連続波(FMCW)ライダーセンシングを中心に,自律運転のための大規模オープンマルチモーダルデータセットを提案する。
4DLidarOpenは、前方向きの4D FMCW Lidarと異なるタイプの複数のLidarから、点方向の放射速度の測定を含む。
このデータセットは北京の複雑な都市環境で収集され、密集した歩行者の交流、渋滞、高速運転、未保護の操作をカバーしている。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:55:32 GMT)
Going PLACES: Participatory Localized Red Teaming for Text-to-Image Safety in the Global South [17.0] テキスト・ツー・イメージ(T2I)モデルは、主に西洋中心のデフォルトに調整され、世界の他の地域にとって重大な脆弱性を生み出している。
文化的多元主義を取り入れ,T2Iの安全性において歴史的に過小評価された視点をもたらすため,我々はグローバル・サウスでコミュニティ中心のレッド・チーム研究を行っている。
ガーナ、ナイジェリア、インドの2つの大学と連携して収集された26,000以上のT2Iモデル故障例からなるデータセットを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:34:53 GMT)
CATRF: Codec-Adaptive TriPlane Radiance Fields for Volumetric Content Delivery [17.0] 暗黙のボリューム表現はモデルのサイズを減少させるが、2Dビデオに到達するためには注意深くコーディングする必要がある。
平面フレンドリーキャンバスのための標準コーデシン・ザ・ループフレームワークであるCATRFを提案する。
その結果,低ビットレートで圧縮耐性の容積表現への実践的な道のりが浮かび上がった。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:42:57 GMT)
Learning Interpretable Point-Based Clinical Risk Scores via Direct Optimization [17.0] 我々は,明示的かつ合理的な最適性目標の下で,加法的スコアリングを直接学習する新しい機械学習アルゴリズムを開発した。
提案手法を電子健康記録(EHR)コーホートに応用し,整数重み付き共生スコアを構築し,退院後死亡リスクを測定する。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:58:39 GMT)
Position: Generative Engine Optimization Creates Underexamined Risks, Governance Must Target Concentration, Disclosure, and Academic Blind Spots [16.9] 大規模言語モデル (LLM) 回答エンジンは情報検索にますます利用されている。
検索エンジン最適化(SEO)とGEO遷移を分析し,2つのリスクを同定する。
次に、一般的なGEOパイプラインを形式化し、最適化の動作場所を特定し、学術的および産業的なプラクティスを比較します。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:02:54 GMT)
Domain Transfer Becomes Identifiable via a Single Alignment [16.8] ドメイン転送マップは、ターゲットの分布にソースを割り当てる。
プッシュフォワードマッピングは一般に識別できない。
測度保存自己同型(MPA)は、領域横断の対応を変更しながら限界を保ちます。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:26:51 GMT)
Content-Style Identification via Differential Independence [16.8] 生成解析はしばしば、ドメイン不変コンテンツ変数とドメイン固有スタイル変数の非線形混合をモデル化する。
コンテンツとスタイルが依存していて、ヤコビアンが密接な場合でも、コンテンツスタイルの差分独立を導入し、識別可能性を実現する。
複数のデータセットにまたがる実験は、識別可能性の分析を裏付け、反事実生成とドメイン翻訳の実践的な利点を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:01:38 GMT)
SkyNative: A Native Multimodal Framework for Remote Sensing Visual Evidence Reasoning [16.5] 我々は,エンコーダフリーアーキテクチャを採用したリモートセンシングのネイティブフレームワークであるSkyNativeを紹介する。
その結果,SkyNativeは画像認識の精度が向上し,先行言語に対する頑健性も向上していることがわかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:06:23 GMT)
Learning Bilevel Policies over Symbolic World Models for Long-Horizon Planning [16.4] 我々は、長期計画問題を確実に解決できる具体的AIエージェントを構築するという課題に取り組む。
我々は、操作と制御のためのLL模倣学習の強みと、長期計画のためのHLシンボル抽象化を組み合わせる。
我々はこれらのアイデアをBISONシステムで実装する。
特に、LL実行を無視した場合、BISONのHLポリシーは1分以内で1万の関連オブジェクトでHL問題を解決することができる。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:55:37 GMT)
Language-Switching Triggers Take a Latent Detour Through Language Models [16.4] 言語モデルに対するバックドア攻撃は、セキュリティ上の懸念が高まるが、トリガーシーケンスのハイジャックによるモデル計算の理解が不十分な内部メカニズムである。
我々は、8B-パラメータの自己回帰言語モデルにおいて、言語スイッチングバックドアの基盤となる回路を特定し、そこでは3ワードのラテントリガーが英語の出力をフランス語にリダイレクトする。
1)初期層における分散アテンションヘッドは、トリガートークンを最後のシーケンス位置に構成し、(2)結果の信号は、サブ空間内の中間層を通してモデルの自然言語同一性方向へ伝播し、(3)最終層は、この潜時を変換する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:53:54 GMT)
StableHand: Quality-Aware Flow Matching for World-Space Dual-Hand Motion Estimation from Egocentric Video [16.3] 本研究では,エゴセントリックビデオから相互作用する2つの手の世界空間4次元運動を復元するためのフローマッチングフレームワークを提案する。
以上の結果から,StableHandは,最強のベースラインと比較して,W-MPJPEを20~25%削減できることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:33:15 GMT)
PlantPose: Universal Plant Skeleton Estimation via Tree-constrained Graph Generation [16.2] 本稿では,木制約グラフ生成による植物骨格の普遍的推定法であるPlanetPoseを紹介する。
PlantPoseは学習ベースのグラフ生成と従来のグラフアルゴリズムを組み合わせることで、トレーニングループ中に木の制約を強制する。
本手法は,複数領域にわたる植物骨格の堅牢かつ正確な推定方法を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:46:36 GMT)
Provably Data-driven Lagrangian Relaxation for Mixed Integer Linear Programming [16.2] ラグランジアン緩和(Lagrangian Relaxation, LR)は、MILP(Mixed Linear Programming)を解くための強力な手法である。
結合制約を緩和することにより、LRは並列サブプロブレム解を可能とし、しばしば通常の線形プログラミング緩和よりも厳密な双対境界を与える。
最近の実証研究は、これらの緩和を予測するために機械学習を用いた有望な結果を示しているが、そのような手法の理論的な理解は依然として未解決のままである。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:16:42 GMT)
Beyond the Cartesian Illusion: Testing Two-Stage Multi-Modal Theory of Mind under Perceptual Bottlenecks [16.0] アンカー型空間分解鎖(CoT)について紹介する。
CoTはMLLMを「幾何学的から意味論的」な投影を通して誘導し、まずはBの局所座標系を確立し、次にAがBの視覚フラストラムに該当するかどうかに基づいて、動的に視覚的および聴覚的モダリティを重み付けする。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:32:56 GMT)
UxSID: Semantic-Aware User Interests Modeling for Ultra-Long Sequence [16.0] セマンティックグループ共有関心記憶という第3の経路を探索するフレームワークであるUxSIDを提案する。
セマンティックID(SID)とデュアルレベルのアテンション戦略を利用することで、UxSIDはアイテム特化モデルの重いコストを伴わずに、ターゲット認識の好みをキャプチャする。
このアーキテクチャは、セマンティックな認識、最先端のパフォーマンス、大規模広告A/Bテストにおける収益の0.337%を計算のパシモニーとバランスをとる。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:00:17 GMT)
SENSE: Satellite-based ENergy Synthesis for Sustainable Environment [15.8] 都市建設エネルギーモデリングは、国連の持続可能な開発目標7と11を達成する上で重要な役割を担っている。
本稿では,現実的な都市衛星画像と高品質な建築エネルギー消費と高さマップを協調的に合成する統合生成UBEMフレームワークであるSENSEを提案する。
実験により、SENSEは20%未満のラベル付きエネルギーデータを使用して十分な注釈付き合成データを生成することができ、下流予測性能を10%IoUに向上させることが示された。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:13:01 GMT)
Beyond Scaling: Agents Are Heading to the Edge [15.8] 有用なエージェントインテリジェンスのボトルネックは、世界の知識を1つのモデルに圧縮することから、協調システムの実行へと移行した。
エージェント・インテリジェンス・タスクのコア特性は、クラウド中心の設計とよく一致しないため、パーソナルエージェント・アーキテクチャはエッジに移動しなければならない、と論文は主張する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:18:29 GMT)
LiFT: Lifted Inter-slice Feature Trajectories for 3D Image Generation from 2D Generators [15.8] LiFTは、3次元ボリューム合成をスライス毎の画像生成とスライス間軌道学習に分解する、リフテッド・インタースライス・フィーチャー・トラジェクトリのフレームワークである。
我々は BraTS 2023 (unconditional and missing-modality MR) と SynthRAD 2023 (MR-to-CT) の LiFT の評価を行った。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:30:19 GMT)
Towards Sustainable Growth: A Multi-Value-Aware Retrieval Framework for E-Commerce Search [15.8] 電子商取引検索に適した多値検索フレームワークを提案する。
当社のフレームワークGrowthGRは2つの重要なコンポーネントで構成されています。アイテムの長期トランザクション価値予測(ItemLTV)モジュールと、マルチバリュー対応生成検索(MultiGR)モジュールです。
われわれは,GrowthGRをTaobaoの生産プラットフォームに展開し,新しい品目GMVで5.3%の昇華を実現した。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:50:15 GMT)
SkillGenBench: Benchmarking Skill Generation Pipelines for LLM Agents [15.7] 我々は、統一されたプロトコルの下でスキル生成パイプラインを評価するためのベンチマークであるSkillGenBenchを紹介する。
ジェネレータは生のコーパスを受け取り、標準化されたスキルアーティファクトを生成し、固定ハーネスの下で実行される。
様々なスキルジェネレーション手法とバックボーンの実験は、かなりの性能変化を示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:28:36 GMT)
See Silhouettes in Motion with Neuromorphic Vision [15.7] 本稿では,CPUのみのデバイス上でのリアルタイムな高フレームレートバイナライゼーションを実現するために,フレームとイベント間のシナジーを利用するデュアルモーダルアプローチを提案する。
我々の研究は、リソース制約されたエッジプラットフォーム上でのインテリジェンスを具現化した、軽量な知覚と相互作用への道を開いた。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:37:50 GMT)
Generative Pseudo-Force Fields for Molecular Generation [15.6] 本稿では,2次擬ポテンシャルエネルギー表面上でMLFFをトレーニングすることにより,パラダイムを橋渡しする生成擬力場(GPFF)を提案する。
GPFFは分散爆発DMの時間-ステップに依存しない変種を構成する。
QM9では、GPFFは256個の神経機能評価(NFE)で100%、わずか6個のNFEで50%以上有効であり、全試料の拡散ベースラインよりも優れていた。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:14:53 GMT)
IVR-R1: Refining Trajectories through Iterative Visual-Grounded Reasoning in Reinforcement Learning [15.6] 強化学習による多モーダルな大言語モデルは、複雑な視覚的推論タスクにおいて顕著な能力を示した。
現在の方法では、下流の推論を容易にするために、高次元の視覚シーンを個別のテキストプロキシにプリエンコードする。
推論軌道を補正して最適化する動的視覚再構成を導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:53:08 GMT)
Adaptive Real-Time Magnetic Field Tracking beyond Prior Waveform Constraints [15.5] 動的磁場推定のための適応拡張カルマンフィルタに基づくパラメータ推定フレームワークについて述べる。
磁場を未知のパラメータとしてモデル化することにより、状態推定におけるモデル依存を緩和する。
提案手法は従来の拡張カルマンフィルタのノイズ強度の制約を克服する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:03:58 GMT)
Best Segmentation Buddies for Image-Shape Correspondence [15.3] 本研究では,3次元形状における画像間のセグメンテーション・セグメンテーション対応を推定する未探索課題について検討する。
本手法は,画像セグメントの画素を3次元形状の対応する意味部分の頂点にリンクすることで,モダリティギャップを橋渡しする。
提案手法の汎用性とロバスト性を示し, 高精度かつ意味論的に意味のある対応を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:32:48 GMT)
Non-Colliding Biometric Identities for Digital Entities: Geometry, Capacity, and Million-Scale Virtual Identity Provisioning [15.1] AIエージェントやヒューマノイドロボットといったデジタルエンティティは、現実の人間と共に運用されるようになっている。
本稿では,新しい問題およびソリューションフレームワークであるバイオメトリック・アイデンティティ・プロビジョニング(BIP)を紹介する。
我々は、360Kのリアルアイデンティティのギャラリーに対して1000万の非衝突仮想ID埋め込みを実証する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:32:12 GMT)
Escaping the Linearity Trap: Manifold Detours for Black-Box Adversarial Attacks on Singing Audio Deepfake Detection [15.1] 歌声合成(SVS)の進歩は、非常に現実的で悪意のあるAIカバーを可能にする。
自己監督学習(SSL)ベースの検出器は、歌唱特有のスプーフアーティファクトをキャプチャするために、微調整された音声SSLバックボーンによって最先端のパフォーマンスを達成する。
既存の敵攻撃はSSL-SVDDに対してしばしば失敗し、本質的に堅牢であるという誤った印象を与える。
SSL-SVDDに適した転送ベースのブラックボックスフレームワークであるMARSを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:43:41 GMT)
From Volume to Value: Preference-Aligned Memory Construction for On-Device RAG [15.0] EPICは、個人的コンテキストのコンパクトで安定した形式として、ユーザの好みに焦点を当てている。
原データから嗜好関連情報を選択的に保持し、選好関連コンテキストに向けて検索を整列する。
インデックスメモリを2,404倍に減らし、20.17パーセントの精度を向上し、最高のパフォーマンスのベースラインよりも33.33倍低い検索レイテンシを実現する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:06:05 GMT)
OCCAM: Open-set Causal Concept explAnation and Ontology induction for black-box vision Models [15.0] OCCAMは、視覚モデルにおけるオープンセット因果概念の説明と誘導のためのフレームワークである。
OCCAMは、オープンセットで視覚概念を発見し、テキスト誘導セグメンテーションを介してそれらをローカライズし、オブジェクトレベルの介入を行う。
OCCAMは、画像毎の属性よりも、より豊かなグローバルな洞察を提供しながら、オープンセットのブラックボックス設定における説明品質を向上させる。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:33:25 GMT)
Function graph transformers universally approximate operators between function spaces [14.9] 変換器による関数空間間の非線形作用素の近似について検討する。
我々のアプローチは、グラフ上でサポートされている測度に関数を持ち上げ、最近導入された変圧器の測度理論的視点を活用することである。
本稿では,このフレームワークが収束度測定による離散化改善をモデル化し,演算子学習の自然な設定を提供することを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:25:14 GMT)
Scalable Decision-Focused Learning through Cost-Sensitive Regression [14.8] 決定中心学習(DFL)アプローチは、トレーニング中に基礎となる最適化問題の繰り返し解決に依存することが多く、計算コストが高く、スケールが難しい。
複数の不確実なパラメータを持つ問題によるマルチアウトプットと、実際の目標である下流タスクコストによるコストセンシティブという問題によるマルチアウトプットという、コスト感受性の多出力回帰問題として学習問題を達成した。
ダウンストリームのタスク品質に匹敵する損失成分の組み合わせは,より効率的でありながら,これまでDFLで取り組まなかった問題サイズへのスケーリングを可能にした。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:58:26 GMT)
Beyond Euclidean Prototypes: Spectral Disentanglement and Geodesic Matching for Few-Shot Medical Image Segmentation [14.8] Few-Shot Medical Imageは、新しい解剖学的標的を1つまたは少数の注釈付き支持画像から説明することを目的としている。
現在のプロトタイプベースの手法は、2つの制約が混在している。
本稿では,SGP-Net(Spectral-Geodesic Prototype Network)を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:10:41 GMT)
Testable and Actionable Calibration for Full Swap Regret [14.7] いずれの要件も弱めずに完全に動作可能であることを証明した,新たな校正基準であるSCDL(Soft-Binned Decision Loss)を導入する。
SCDLは連続性や一貫性といった他の望ましい特性を満たす。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:04:08 GMT)
Revisiting the Adam-SGD Gap in LLM Pre-Training: The Role of Large Effective Learning Rates [14.6] 勾配降下(SGD)は、事前訓練された大規模言語モデルにおいて、Adamのような適応型よりも著しく悪化する。
本研究では,SGDがAdamの効果的な学習率に匹敵する学習率を維持することができないことによる相違点の大部分を考察する。
本研究では,SGDを大規模学習率で安定化させる単純なクリッピング機構により,Adamの性能の大半を回復できることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:09:50 GMT)
CATA: Continual Machine Unlearning via Conflict-Averse Task Arithmetic [14.6] 視覚言語モデル(VLM)は、視覚的およびテキスト的表現の整合性を顕著に示しており、幅広いマルチモーダルアプリケーションを可能にしている。
大規模なトレーニングデータは、プライバシー、著作権、望ましくないコンテンツに対する懸念を必然的に引き起こし、機械学習の強いニーズを生み出します。
本稿では,各左折要求を未学習のタスクベクトルとして表現するコンフリクト・アバースなタスク算術法であるCATAを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:21:41 GMT)
One Model to Translate Them All: Universal Any-to-Any Translation for Heterogeneous Collaborative Perception [14.6] 任意のモダリティのために,任意のモダリティをオンザフライでトランスレータをインスタンス化する,普遍的な任意の特徴モダリティ変換モデルであるUniTransを提案する。
UniTransは、専門家パラメータのバンクを事前訓練し、ソースからターゲットへのモダリティマッピングの関数としてそれらの組み合わせ係数を学習する。
OPV2V-HとDAIR-V2Xの実験では、UniTransはシミュレーションと実世界の両方の設定において、最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:14:30 GMT)
Learning-Based Adaptive Control for Surgical Robotic Exposure Task on Deformable Tissues [14.6] 組織抽出作業の現実的なモデルを定式化し、ROI露光を実現するための学習ベースの適応制御フレームワークを提案する。
このフレームワークは、類似したタスクへのゼロショット適応を示し、自律的リトラクション処理を完了できることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:36:53 GMT)
A Heuristic Approach for Performance Tuning in RL-based Quadrotor Control via Reward Design and Termination Conditions [14.6] 強化学習(Reinforcement Learning, RL)に基づく四角形制御ポリシは、乱雑な環境での高速ナビゲーションやドローンレースといったタスクにおいて、優れたパフォーマンスを実現している。
報奨設計と終了条件を用いて,RLに基づくクアドロータ制御におけるチューニング可能な性能を実現するための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:40:30 GMT)
Virtues of Ordered Chaos: Planning with Topple Actions in Tabletop Stack Rearrangement [14.5] この作業は、より豊富な非包括的アグリゲーションアクションでタスク計画ドメインを強化することに重点を置いています。
タスクプランを生成して、ピック・アンド・プレイスとトップル・アクションの両方を含むソリューションをモデル化するために、新しいトップル・アグリゲーション・ガジェットを導入する。
結果は、単にPick-and-placeアクションを使用するよりも高速な実行を実現するというメリットを明確に示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:41:59 GMT)
Optimal Knock-Pick Planning for Tightly Packed Tabletop Blocks With Parallel Grippers [14.5] 並列グリッパーピックがオブジェクトの周囲に十分なクリアランスを持たずに実現できない場合、密集したテーブルトップオブジェクトの再配置は困難である。
本研究は,平面テーブルトップグリッド位置のブロックを均一に配置した実用的なモチベーション設定における問題特性について検討する。
合成設定におけるグリッドサイズの増加とIsaacSimでの実験が報告されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:24:49 GMT)
A System Aware Resource Allocation for Distributed Workflows in Quantum Computing Environments [14.4] 量子コンピューティング機能へのアクセスを提供するクラウドベースのプラットフォームは、効率的な使用のためのいくつかの課題を開放した。
現在のシステムの多くは優先度ベースのアクセスプロトコルを使用しているが、大規模アプリケーションの信頼性、効率的、スケーラブルな実行を完全にサポートすることはできない。
我々は、関連するコスト指標をすべて考慮し、量子プログラムを適切な量子デバイスに効率的に割り当てるための包括的なソリューションを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:00:33 GMT)
NeRF-based Spacecraft Reconstruction from Close-Range Monocular Imagery Under Illumination Variability and Pose Uncertainty [14.4] このような操作の重要な構成要素は、ターゲットの3Dモデルを2D画像の集合からオフラインで再構成することである。
我々は、これらの課題を克服するために、画像毎の自由度でニューラルラジアンス場を拡張することを提案する。
軌道上の操作を表す3つの画像集合に対して,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:17:11 GMT)
Democratizing Large-Scale Re-Optimization with LLM-Guided Model Patches [14.2] 本稿では,大規模言語モデル(LLM)がオペレーションリサーチ(OR)の専門家として機能するエージェント的再最適化フレームワークを提案する。
LLMは、ユーザプロンプトを基盤となる最適化モデルの構造化された更新に変換し、最適化ツールボックスから適切な再最適化テクニックを選択し、実装可能なソリューションを返すために結果のインスタンスを解決する。
提案フレームワークは、デプロイされた最適化モデルのインタラクティブかつ継続的な適応を可能にし、OR専門家への依存を低減し、意思決定支援システムの持続可能性を向上させる。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:28:25 GMT)
Machine Unlearning for Masked Diffusion Language Models [14.1] 仮面拡散言語モデル(MDLM)は、マスキングされた位置を平行に反復的にデノイングすることでテキストを生成する。
MDLMのための最初の非学習フレームワークであるMasked Diffusion Unlearning (MDU)を提案する。
MDUは、プロンプト条件予測からプロンプト条件付き無条件アンカーへの前方KL分岐をマスクされた応答位置毎に最小化する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:54:11 GMT)
DanceHMR: Hand-Aware Whole-Body Human Mesh Recovery from Monocular Videos [13.9] 本報告では,一眼レフビデオに挑戦するための時間的コヒーレントな全身HMRフレームワークを提案する。
本モデルでは,残体-手関節融合による身体コンテキストと部分特異的手指観察を統一する。
全身および身体のみのベンチマーク実験では、手再建と身体の競争精度が向上した。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:14:28 GMT)
Learning Quantifiable Visual Explanations Without Ground-Truth [13.5] 本稿では,XAI手法の品質を定量化するためのフレームワークを提案する。
また,計量の微分可能近似を用いてモデルを微調整する場合を考慮した新しいXAI法を提案する。
本手法による説明は, 競合するXAI技術よりも多くの定量化指標で優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:21:48 GMT)
Simple Approximation and Derivative Free Inference-Time Scaling for Diffusion Models via Sequential Monte Carlo on Path Measures [13.4] textttURGEはデリバティブフリーな推論時間スケーリングアルゴリズムで、測定値の変更によって経路的に重要な再重み付けを行う。
我々はパスワイドSMCとパーティクルワイドSMCの等価性を確立する。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:45:33 GMT)
Conformal Selective Acting: Anytime-Valid Risk Control for RLVR-Trained LLMs [13.4] Conformal Selective Actingは、デプロイ要求によって強制される空のセルを埋める。
CSAは、すべての細胞に経路的妥当性と非抵抗的展開を満足する10種類の比較のうち唯一の方法である。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:20:32 GMT)
Catching a Moving Subspace: Low-Rank Bandits Beyond Stationarity [13.4] 本研究では,スカラーフィードバックを用いた縦-縦-縦-縦-横-横-縦-縦-縦-縦-縦-縦-縦-縦-縦-縦-縦-縦-縦-縦-縦-縦-横-横-横-横-横-横-横-横-横-横-横-縦-横-横-横-横-横-横-横-横-
シングルプレイスカラー報酬では、移動部分空間は報酬の二次函数によって回復可能である。
これは、識別境界を特徴づけ、本質的なランクの動的回帰率を得るための最初の研究である。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:01:48 GMT)
Active Testing of Large Language Models via Approximate Neyman Allocation [13.3] 大規模言語モデル(LLM)は、事前トレーニングからテスト時間スケーリングまでの信頼性の高い評価を必要とする。
モデルスケールが拡大し、専門家アノテータが要求されるタスクが増加するにつれて、各評価に必要な計算コストとラベルのコストが急速に上昇する。
アクティブテストは、評価プールの小さいが有益なサブセットから評価結果を近似することで、このボトルネックを軽減することを目的としている。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:16:57 GMT)
The Symmetries of Three-Layer ReLU Networks [13.0] 深部ReLUネットワークにおけるパラメータ対称性を解析するためのフレームワークを開発する。
これらの対称性のいくつかは勾配流に沿って局所的な保存法則を導出するが、それ以外は導出しない。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:38:11 GMT)
Heralded Generation of Multipartite Free-Electron W-State Entanglement [13.0] 原子の$W_N$リソースからマルチパーティライト自由電子絡み合いを生成するための隠蔽プロトコルを提案する。
均一なカップリングとコモンデチューニングのために、ダイナミクスは回転波近似の中で解析的に解決される。
隠蔽状態は、原子資源の多粒子絡み構造を保持する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:25:42 GMT)
From Documents to Segments: A Contextual Reformulation for Topic Assignment [13.0] 製品レビューや公開調査の回答など、現実の文書の多くは、複数の異なるトピックを含んでいる。
このミスマッチはしばしばトピックの汚染を引き起こし、無関係なテーマは単一のトピックにマージされる。
セグメントベーストピックアロケーション(SBTA)は,文書全体ではなくセグメントにトピックを割り当てるトピックモデリングの改訂である。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:31:46 GMT)
TabH2O: A Unified Foundation Model for Tabular Prediction [12.9] 本研究では,テキスト内学習による1つの前方パスの分類と回帰を行うモデルであるTabH2Oを提案する。
我々はTALENTベンチマークでTabH2O v1(29.2Mパラメータ)を評価し、6つの評価手法のうち平均2.55のランクを達成した。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:27:54 GMT)
Shallow ReLU$^s$ Networks in $L^p$-Type and Sobolev Spaces: Approximation and Path-Norm Controlled Generalization [12.9] バロン空間とソボレフ空間上のパスノルム正規化浅いReLU$s$ネットワークに対する極小最大最適化境界を証明した。
また、スペクトルバロン空間に埋め込むことで、ソボレフ空間の近似レートを1le p2$の範囲で$W,p$とする。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:27:49 GMT)
Geometric Dictionary Learning of Dynamical Systems with Optimal Transport [12.9] DOODL(Dynamical OperatOr Dictionary Learning)は,スペクトル力学の辞書を学習するフレームワークである。
DOODLは表現学習以外にも、短く部分的に観察された軌跡から高速かつ解釈可能な演算子推定を可能にする。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:10:35 GMT)
Pairwise Preference Reward and Group-Based Diversity Enhancement for Superior Open-Ended Generation [12.8] Pairwise Preference Reward and Group-based Diversity Enhancement (PPR-GDE) は、よりオープンな生成に適したRL法である。
PPR-GDEはスカラー報酬を必要とせず、グループレベルの多様性を報酬シグナルに組み込む。
実験により,PPR-GDEは強いRLベースラインよりも優れたアライメント品質と表現的多様性が得られることが示された。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:31:34 GMT)
Low Latency Gaze Tracking via Latent Optical Sensing [12.8] 完全受動光エンコーダを用いてタスク関連潜在機能を直接取得するリアルタイム視線追跡システムを提案する。
本研究では,実世界のシミュレーションデータと実世界のデータにアプローチの有効性を実証し,競合する視線推定精度を実現する。
この研究は、超低レイテンシ、計算効率の人-コンピュータインタラクションシステムにおけるタスク駆動型光センシングの可能性を強調した。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:46:25 GMT)
Restructure This: Using AI to Restructure Onboarding Documents to Reduce Cognitive Overload [12.7] オンボードドキュメンテーションは、オープンソースソフトウェア(OSS)で新参者を惹きつけ、維持するために重要である
本稿では,マルチメディア学習の認知理論(CTML)がOSS文書の再構築にどのように役立つかを検討する。
私たちはGenAIベースのパイプラインを使用して、プロトタイプのVisDocを通じてこれらの戦略を運用しています。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:56:11 GMT)
Code-as-Room: Generating 3D Rooms from Top-Down View Images via Agentic Code Synthesis [12.7] 構造化実行ハーネスを備えたMLLMベースのエージェントフレームワークであるCode-as-Roomを提案する。
トップダウンのルームイメージが与えられた場合、フレームワークは参照画像を解析してシーン要素とその空間関係を抽出する。
クロスステージメモリモジュールは、既存のエージェントベースのフレームワーク固有のコンテキストを緩和するために、全期間にわたって維持される。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:18:36 GMT)
A Readiness-Driven Runtime for Pipeline-Parallel Training under Runtime Variability [12.7] パイプラインは大規模なモデルのトレーニングをスケールするための重要なテクニックだが、現代的なワークロードでは、計算と通信におけるランタイムの多様性が示される。
実行時並列トレーニングであるRRFP(Readiness-First Pipeline)を紹介します。
R RFPはスケジュールが実行時にどのように消費されるかを変える: スケジュールをステージが続くのを待つシーケンスとして扱う代わりに、現在準備されている作業の非バインディングヒント順序として扱う。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:59:18 GMT)
STS: Efficient Sparse Attention with Speculative Token Sparsity [12.5] STSはスパースアテンションメカニズムであり、モデルの再トレーニングを必要としない。
代表ベンチマークであるNarrativeQAでは,STSが約90%の間隔で2.67倍の高速化を実現していることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:53:15 GMT)
Learning to Hand Off: Provably Convergent Workflow Learning under Interface Constraints [12.5] 専門エージェントが共有アーティファクトを介してコントロールをオフにする環境で、ワークフロー学習を研究する。
集中学習者はジョイントトラジェクトリにアクセスできません。
我々はこの規則をインタフェース制約付き半マルコフ決定過程として定式化する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:48:02 GMT)
PACE: Geometry-Aware Bridge Transport for Single-Cell Trajectory Inference [12.5] 時系列スナップショットから連続輸送ダイナミクスを復元する軌道推論フレームワークである PACE を提案する。
PACEはMDD、Wasserstein-1距離、Wasserstein-2距離を平均で23.7%減らし、最も高い総合的な再構築性能を達成した。
PACEはまた、胚体分化ベンチマークでRNA-ベロシティアライメントを15.4%改善する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:03:56 GMT)
SAME: A Semantically-Aligned Music Autoencoder [12.5] セマンティック・アラインド・ミュージック・オートエンコーダ(Semantically-Aligned Music autoEncoder)は、ステレオ音楽と一般的なオーディオのためのオートエンコーダである。
トランスフォーマーベースのバックボーンとセマンティックな正規化アプローチの組み合わせ,フェーズアウェアな再構成損失,識別器設計の改善によって実現した。
2つの変種(大きなITT-LとCPUデプロイ可能なITT-S)をオープンウェイト形式でリリースする。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:23:16 GMT)
Harnessing AtomisticSkills for Agentic Atomistic Research [12.4] AtomisticSkillsは、汎用AIコーディングエージェントに原子研究を行う権限を与える、オープンソースのフレームワークである。
科学をエージェントスキルとツールに分解することで、AtomisticSkillsはエージェントにモジュラー、キュレート、プラグアンドプレイの研究機能を提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:45:36 GMT)
Foundation Models for Credit Risk Prediction: A Game Changer? [12.4] 予測モデルは信用リスク管理において重要な役割を担い、デフォルト確率と損失の正確な推定を通じて重要な決定を導く。
多様なドメインからの広範なデータセットに基づいて事前訓練されたファンデーションモデルは、事前の知識を活用することで、顕著なパフォーマンスを誇示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:52:48 GMT)
TeleCom-Bench: How Far Are Large Language Models from Industrial Telecommunication Applications? [12.3] 提案するTeleCom-Benchは,22,678個のキュレートされたサンプルを用いた12の評価セットからなる総合的なベンチマークであり,大規模言語モデルの評価を行う。
現在のLSMは診断技師として機能するが、現場エンジニアとして機能しないことを示す。
この能力ギャップは、現在のLLMが診断医として機能するが、現場エンジニアとして機能しないことを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:14:49 GMT)
Modality-Aware Identity Construction and Counterfactual Structure Learning for ID-Free Multimodal Recommendation [12.3] IDフリーマルチモーダルレコメンデーション(MAIL)のためのモダリティ・アウェア・アイデンティティ構築と対実的構造学習を提案する。
MAILはRecall@10で7.81%、NDCG@10で12.81%の平均的な改善を実現している。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:35:06 GMT)
RAVE: Re-Allocating Visual Attention in Large Multimodal Models [12.2] 本稿では,視覚的キーに対する事前の注目スコアに,学習されたクエリーのバイアスを追加する軽量なペアゲーティング機構であるRAVEを提案する。
RAVEは標準的注意力よりも平均3ポイント向上し、知覚集約的なタスクに最大の利益をもたらす。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:12:50 GMT)
RCTEA: Richness-guided Co-training for Temporal Entity Alignment [12.2] 時間的エンティティアライメント(TEA)は、時間的知識グラフ(TKG)間で等価なエンティティを識別することを目的としている。
本稿では,エンティティアライメントのためのTKGの構造的側面と時間的側面の両方を共同でモデル化するRTTEAフレームワークを提案する。
予測アライメントの局所的構造整合性を実現するために,特徴エンコーダを改良したデュアルビュー近傍コンセンサスアルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:55:03 GMT)
Predictive Prefetching for Retrieval-Augmented Generation [12.1] 本稿では,進化する情報ニーズに整合したプレフェッチを可能にする,高度な非同期検索フレームワークを提案する。
複数のベンチマークの実験では、最大43.5%のエンドツーエンドのレイテンシ削減と62.4%の改善が示されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:45:27 GMT)
RGB-only Active 3D Scene Graph Generation for Indoor Mobile Robots [12.0] 3Dシーングラフ生成への現在のアプローチは、メトリック3D再構成のためにLiDARやRGB-Dカメラのような専用深度センサーに依存している。
本稿では,RGB入力のみからの3次元シーングラフの能動的・漸進的な構築のための,完全な視覚的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:37:39 GMT)
Fixed External Cameras as Common Prior Maps for Active 3D Scene Graph Generation [12.0] 本稿では,ロボットカメラと固定外付けカメラの両方の観察を,ハードウェアに依存しない単一のパイプライン内でシームレスに融合する,アクティブでインクリメンタルな3Dシーングラフ生成のためのRGB専用フレームワークを提案する。
実験では、シーングラフを1台の外部カメラでブートストラップすることで、初期オブジェクトのリコールが+79%増加し、事前のリッチなコンテキストがその後のアクティブな探索の効率を大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:26:07 GMT)
Learning to Balance: Decoupled Siamese Diffusion Transformer for Reference-Based Remote Sensing Image Super-Resolution [11.9] 本稿では,低分解能・参照相互作用をアテンションレベルで分離するDS-DiT法を提案する。
低解像度の構造先行と参照テクスチャ情報を独立して相互作用させることで、このフレームワークはソース間の競合を効果的に軽減する。
複数のデータセットとスケーリング要因にわたる実験結果から、DS-DiTは、定量的な測定値と視覚的忠実度の両方において、既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:35:21 GMT)
Towards Data-Efficient Video Pre-training with Frozen Image Foundation Models [11.9] ビデオファウンデーションモデルは、多くのビデオ理解タスクで強力なパフォーマンスを達成する。
通常、大規模なビデオデータセットで大規模な事前トレーニングが必要になる。
現代の画像基盤モデルは、すでに強力な空間表現を提供している。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:35:09 GMT)
Speech-Guided Multimodal Learning for Vocal Tract Segmentation in Real-Time MRI [11.8] 本研究では,訓練中に音響・音韻の監督を行う3段階の枠組みを提案する。
視覚的エンコーダと音響的エンコーダは、二重レベルのクロスモーダルコントラスト事前訓練によって整列される。
学習された表現は、クロスアテンションデコーダを通じて融合され、効果的にマルチモーダルな知識を単一モーダル推論パイプラインに転送する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:26:17 GMT)
PMF-CL: Pareto-Minimal-Forgetting Continual Learner for Conflicting Tasks [11.7] 連続学習(CL)アルゴリズムは、MLモデルにおける破滅的な忘れの問題に対処するために提案されている。
本稿では,マルチタスク学習(MTL)の観点から,矛盾するタスクの原則的かつ体系的なCLの基礎的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:53:49 GMT)
Generation of deterministic multi-mode intensity squeezing in a train of ultra-short pulses by unbalanced SU(1,1) interferometers [11.6] 我々は,sim10$ psの短パルス列で局所化されたマルチモード強度のスクイーズを示す。
パルス励起USUIにより超大規模量子状態を生成するための扉を開く。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:20:49 GMT)
PERL: Parameter Efficient Reasoning in CLIP Latent Space [11.6] PERLは、凍結したCLIPモデルを拡張し、コンパクトな共用推論モジュールを繰り返し適用する軽量適応フレームワークである。
PerLは、高速適応数ショット設定で比較した手法の中で最高のパラメータ性能トレードオフを達成する。
以上の結果から,反復潜在推論は,ディスクネイティブな視覚言語モデルにおけるパラメータスケーリングに相補的適応機構を提供する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:25:25 GMT)
Patch-MoE Mamba: A Patch-Ordered Mixture-of-Experts State Space Architecture for Medical Image Segmentation [11.4] 医用画像セグメンテーションのためのパッチ順混合状態空間アーキテクチャである textitPatch-MoE Mamba を提案する。
マルチスケールのコンテキストをキャプチャしながら、局所的な空間的近傍を保存する階層的なパッチ順序走査機構を導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:42:04 GMT)
SVFSearch: A Multimodal Knowledge-Intensive Benchmark for Short-Video Frame Search in the Gaming Vertical Domain [11.4] 中国のゲーム分野におけるショートビデオフレーム検索のための最初のオープンベンチマークであるSVFSearchを紹介した。
我々は、直接QAやRAGワークフローからプラン・アクト・リプランエージェント、学習された検索モデルに至るまで、代表的パラダイムを評価する。
その結果、モデルのみの回答、実用的なエージェント検索、およびオラクル知識の間に大きなギャップがあることが明らかになった。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:03:48 GMT)
Distributionally Robust Safety Under Arbitrary Uncertainties: A Safety Filtering Approach [11.1] 分布あいまいさ下で非線形システムの確率論的安全性を確保する方法について検討する。
提案手法は,安全性を確保するために,高性能な名目ポリシーと認証されたバックアップポリシーを切り替える,バックアップベースの安全フィルタリングフレームワーク上に構築されている。
本手法は,Dubins車から高速レーシングカー,戦闘機まで,3つのシステムを対象としたシミュレーションにより検証する。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:59:03 GMT)
Chronicle: A Multimodal Foundation Model for Joint Language and Time Series Understanding [11.1] 自然言語と時系列をスクラッチから学習したコンパクトな324Mパラメータデコーダのみの変換器であるChronicleについて述べる。
我々の知る限り、Chronicleはテキストと時系列をゼロからトレーニングした最初のモデルであり、両方のドメインで専用の基礎モデルに対して評価された最初のマルチモーダルモデルである。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:39:05 GMT)
Dynamic robotic cloth folding with efficient Koopman operator-based model predictive control [11.0] 本稿では,ロボット布を折り畳むための新しいモデル予測制御器を提案する。
物理に基づく布のダイナミクスのシミュレーションと、効率的なカーネルベースのクープマン演算子の回帰を統合している。
クープマン作用素モデルにより供給される線形化を用いて,高速な折りたたみ軌跡を効率よく生成し,未知のポーズを生成できることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:21:38 GMT)
KAN-MLP-Mixer: A comprehensive investigation of the usage of Kolmogorov-Arnold Networks (KANs) for improving IMU-based Human Activity Recognition [11.0] Kolmogorov-Arnold Networks (KAN) はクリーンで低次元のデータで複雑な関数を学習する能力を示した。
対照的に、従来の多層パーセプトロン(MLP)はノイズに対してはるかに耐性があり、計算効率が良い。
HARモデルですべてのコンポーネントをkanに置き換えると、精度と効率が低下することが多い。
両パラダイムの強みを戦略的に相乗化するハイブリッドアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:55:46 GMT)
Revisiting Reinforcement Learning with Verifiable Rewards from a Contrastive Perspective [11.0] RLVRにおけるコントラストシーケンスレベルのポリシー最適化のためのフレームワークを提案する。
ConSPOはGRPOのクリップされた比率ベースのスコアを、長さ正規化されたシーケンスログ確率に置き換える。
ConSPOは、挑戦的な数学的推論ベンチマークにおいて、いくつかの強力なRLVRベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:59:49 GMT)
TIGER-FG: Text-Guided Implicit Fine-Grained Grounding for E-commerce Retrieval [10.9] 電子商取引の画像検索は、しばしばクロップされたイメージをクエリとして取り、各候補は完全なアイテムイメージと構造化されたテキストで表現される。
我々は,電子商取引検索のためのテキスト誘導型暗黙的きめ細かなグラウンドディングフレームワークTIGER-FGを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:07:20 GMT)
Weakly Supervised Cross-Modal Learning for 4D Radar Scene Flow Estimation [10.9] 本稿では,弱教師付きレーダシーンフロー学習のためのタスク固有フレームワークを提案する。
市販の2Dトラッキングとセグメンテーションアルゴリズムを利用して、追跡されたインスタンスマスクを取得する。
実世界のView-of-Delftデータセットの実験は、我々の手法が最先端のクロスモーダル監視アプローチを超えることを示した。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:00:53 GMT)
TabQL: In-Context Q-Learning with Tabular Foundation Models [10.9] Tabular Q-Learning (TabQL) は、Deep Q-Learning (DQN) における従来のパラメトリックQ-ネットワークを置き換える強化学習フレームワークである。
我々はTabQLを形式化し、その収束とサンプルの複雑さを軽微な仮定で分析し、TabQLがバニラQラーニングとディープQラーニングをコンテキスト内学習で補間していることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:03:05 GMT)
3D Skew Gaussian Splatting with Any Camera Trajectory Visualization Engine [10.8] 3D Skew Gaussian Splatting (3DSGS) は、明示的な表現の構造的忠実性とコンパクト性を大幅に向上させる新しいフレームワークである。
3DSGSは,特に複雑な細部を持つ領域において,流体対話的導出に必要なリアルタイムフレームレートを維持しながら,優れた構造的コンパクト性を実現する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:49:53 GMT)
$\boldsymbol{f}$-OPD: Stabilizing Long-Horizon On-Policy Distillation with Freshness-Aware Control [10.8] システム効率には非同期実行が必要ですが、理想のオン政治目標から構造的に逸脱します。
本稿では,古いサンプルの影響を適応的に制御し,政策ドリフトを制約する新しいフレームワークであるf-OPDを提案する。
以上の結果から,OPDにおけるパフォーマンス効率トレードオフを実現するための最初のレシピが確立された。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:14:18 GMT)
ScheduleFree+: Scaling Learning-Rate-Free & Schedule-Free Learning to Large Language Models [10.7] 本稿では、Warmup-Stable-Decay (WSD) スケジュールを大幅に上回る大規模言語モデルを訓練するための学習速度フリーかつスケジュールフリーな手法(ScheduleFree+)を提案する。
また、スケジュール自由学習は長期学習に最も有効であり、パラメータあたり1000トークンでは、SOTAスケジュールを31%上回っていることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:31:49 GMT)
XCTFormer: Leveraging Cross-Channel and Cross-Time Dependencies for Enhanced Time-Series Analysis [10.6] XCTFormerはトランスフォーマーをベースとしたチャネル依存型(CD)モデルである。
XCTFormerは広く認知されているベースラインと比較して強い結果を得る。
MSEでは平均20.8%、MAEでは15.3%である。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:18:22 GMT)
Learning to Solve Compositional Geometry Routing Problems [10.6] DiConは、構成幾何学ルーティング問題に取り組むプラグイン・アンド・プレイフレームワークである。
我々は、競争力の低い候補行動の確率質量を積極的に抑制する差分注意機構を導入する。
我々は、グローバルなインスタンス表現の堅牢化を促進するために、二重レベルのコントラスト学習目標を設計する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:10:15 GMT)
DSAA: Dual-Stage Attribute Activation for Fine-grained Open Vocabulary Detection [10.5] Open-Vocabulary Object Detection (OVD)モデルはクローズドセット検出の限界を破る。
色、マテリアル、テクスチャなどの属性を含む、きめ細かい検出タスクには、顕著な制限がある。
本稿では,微粒化検出キャパビリティを向上するDual-Stage Attribute Activationフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:13:13 GMT)
Hallucination as Exploit: Evidence-Carrying Multimodal Agents [10.4] 本稿では,自由形式モデルテキストを許容不可能な証拠として扱うマルチモーダルエージェントを提案する。
ECAは各ツールコールを行動クリティカルな述語に分解し、制約されたDOM/OCR/AX検証者から型付き証明書を取得し、決定論的ゲートはそれらの証明書がサポートする特権のみを付与する。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:40:43 GMT)
Bound state in the continuum and dynamics via phase modulation in giant-atom waveguide setups [10.4] 原子動力学における巨大原子間の直接結合の役割について検討する。
結合相は、光子と原子の両方に対して、BICの数とそれらのプロファイルの両方を制御できることを示す。
本研究は,非局所光物質界面における干渉,境界状態,量子力学を制御するための有用なツールとして,結合相工学に注目した。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:40:10 GMT)
Generative AI Advertising as a Problem of Trustworthy Commercial Intervention [10.4] 主要なデプロイされた生成AI広告システムは、商用コンテンツとAI生成応答の可視的境界を保存する。
生成AIは、商品を個別のスロットに配置するのではなく、生成プロセス自体への介入を可能にする。
これは、コンテンツ配置よりも信頼できる介入の問題として、生成的AI広告を再設定する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:15:06 GMT)
Readers make targeted regressions to plausible errors in reanalysis of "noisy-channel garden-path" sentences [10.3] 本研究は,雑音の多い庭道文の読解力学について研究する。
ターゲットレグレッションの証拠を見つけます。
本稿では,ノイズチャネル言語理解の理論の意義について論じる。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:42:22 GMT)
POST: Prior-Observation Adversarial Learning of Spatio-Temporal Associations for Multivariate Time Series Anomaly Detection [10.3] 本稿では,先行観測学習パラダイムを統一する新しいフレームワークを提案する。
空間次元において、モデルはトレーニング中に、事前観測とデータ駆動観測の相違を最小限の方法で再構成する。
このような逆最適化は、時間的検出に対するモデルの感度を向上するだけでなく、特定のチャネルに異常をローカライズすることを可能にする。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:34:14 GMT)
AdaptSplat: Adapting Vision Foundation Models for Feed-Forward 3D Gaussian Splatting [10.3] 本研究は, フィードフォワード型3次元ガウススプラッティングのための簡易かつ軽量なアダプタ設計について検討する(3DGS)
我々は、強力な視覚基盤モデルバックボーンの浅い特徴から、方向対応の高周波構造先行情報を抽出する周波数保存アダプタを設計する。
実験により、AdaptSplatは、複数の標準ベンチマーク上で、最先端のフィードフォワード再構築性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:53:40 GMT)
SURGE: Approximation-free Training Free Particle Filter for Diffusion Surrogate [10.2] 拡散に基づく生成モデルは、推測時間のガイダンスにますます依存し、ドリフト項や専門家の混合を追加する。
パラメータ変更によるパスワイズ重要度再重み付けを行う,微分自由推論時間スケーリングアルゴリズムである textttURGE を導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:59:00 GMT)
Unveiling Memorization-Generalization Coexistence: A Case Study on Arithmetic Tasks with Label Noise [10.1] ノイズラベルはクリーンデータよりも高速に記憶される一方、適切な最適化やモデル構成の下では、より大きなモデルはより一般化されがちである。
本稿では,ネットワークを一般化・記憶要素に分割するタスク非依存手法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:12:45 GMT)
Whispers in the Noise: Surrogate-Guided Concept Awakening via a Multi-Agent Framework [10.0] 概念消去は、事前訓練されたモデルから特定の概念を取り除くことでリスクを軽減することを目的としている。
近年の研究では、そのような手法は標的概念を完全に排除するのではなく、しばしば抑制され、攻撃を起こさないモデルが残されていることが示されている。
提案するConceptAgentは,サロゲート誘導ノイズ状態から発声軌道を初期化することにより,消去概念を覚醒させる,トレーニングフリーでブラックボックスなマルチエージェントフレームワークである。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:55:36 GMT)
Unleashing the Representational Power of Fourier Shapes for Attacking Infrared Object Detection [10.0] 学習可能なフーリエ形状を赤外線領域に導入する。
これにより、効率的な勾配に基づく最適化が実現され、人間の標的が検出を回避できる強力な形状が生成される。
我々の物理的パッチは堅牢性を実現し、様々な距離、角度、ポーズ、個人にわたって検知器を回避し、攻撃成功率88%を25m以上で達成した。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:51:33 GMT)
Expressive Power of Deep Homomorphism Networks over Relational Databases [9.9] 我々は,関係データベース上で学習するモデルとして,ディープホモモーフィズムネットワーク(DHN)を提唱する。
我々は、DHNの正確な表現力について、様々な自然断片と一階述語論理の拡張を関連づけて研究する。
また、DHNに対する2つの基本静的解析問題の決定可能性、空度問題と仮定問題についても検討する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:28:32 GMT)
Contextualized Code Pretraining for Code Generation [9.9] 我々は、呼び出しコンテキストをコードモデルのトレーニングと評価の両方に統合する、呼び出し対応フレームワークであるコード事前トレーニングを提案する。
CallerGenは、複数のサイズにまたがる呼び出し認識の目的で事前訓練された最初のコードモデルで、現実的なシナリオを特徴とする新しいベンチマークであるCallerEvalでそれらを評価します。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:12:14 GMT)
Proximal basin hopping: global optimization with guarantees [9.9] 我々は近地ホッピング(PBH)と呼ばれる新しい理論フレームワークを提案する。
有限個のサンプルを用いて大域最小化器に高い確率で収束する実用的なアルゴリズムを構築する。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:15:44 GMT)
PIXLRelight: Controllable Relighting via Intrinsic Conditioning [9.8] 物理的に制御可能なシングルイメージリライトのためのフィードフォワードアプローチであるPIXLRelightを提案する。
PIXLRelightは任意のPBRスタイルの照明制御を可能にし、最先端の照明品質を実現し、1枚の画像の10分の1以下で動作する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:55:03 GMT)
Physics-Informed Neural Networks for Radial Consolidation of Combined Electroosmotic, Vacuum and Surcharge Preloading Considering Smear Effects [9.6] 3つのPINNモデルについて検討し,ソフト制約付きPINN,改良ゲート付きPINN,ハード制約境界符号化付き改良ゲート付きPINNについて検討した。
提案するフレームワークは,ネットワークアーキテクチャ,コロケーション密度,透過性コントラストなど,実用範囲で堅牢である。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:25:56 GMT)
KISS - Knowledge Infrastructure for Scientific Simulation: A Scaffolding for Agentic Earth Science [9.6] 知識インフラストラクチャ(KI)は、専門知識を検証されたモデリング演算子に外部化する。
KIを搭載したエージェントは、最大84%の試験で、物理的に可算で検証可能なエンドツーエンドのシミュレーションを生み出した。
119個のKIの全体にわたって、決定のモデル化と失敗の是正は、基礎となる物理学が異なるにもかかわらず収束した。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:57:25 GMT)
Forward-Learned Discrete Diffusion: Learning how to noise to denoise faster [9.5] 本稿では,対象分布とモデル分布とのギャップを低減するために,前方学習型離散拡散法を提案する。
マルコフの前方鎖を固定する代わりに、学習可能な辺分布と後続分布を持つ非マルコフの定式化を採用する。
これにより、生成プロセスは、ノイズ発生プロセスで定義されたターゲットにマッチしながら、分解され続けることができる。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:43:36 GMT)
TinySAM 2: Extreme Memory Compression for Efficient Track Anything Model [9.5] TinySAM 2は、パフォーマンスと効率のバランスをとる軽量なビデオセグメンテーションモデルである。
DAVISやSA-Vのような挑戦的なデータセットの実験では、TinySAM 2がSAM 2.1のパフォーマンスの90%を達成している。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:05:59 GMT)
iPOE: Interpretable Prompt Optimization via Explanations [9.5] 本稿では,解釈可能な新しい最適化手法iPOEを紹介する。
我々は、アノテーション決定の説明から自動的にガイドラインを作成することで、迅速な最適化プロセスを導出する。
iPOEは、ガイドラインなしでプロンプトを改善でき、ランダムに選択されたガイドラインは、それぞれ31%$と35%$で改善できる。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:21:04 GMT)
Towards Universal Physical Adversarial Attacks via a Joint Multi-Objective and Multi-Model Optimization Framework [9.5] 本稿では,JMOF(Joint Multi-Objective and Multi-Model Optimization Framework)を提案する。
JMOF内では、二重レベル機構が予測出力を共同で抑制し、中間特徴分布を平坦化し、攻撃効率と深い一般化のバランスをとる。
実験により、JMOFは様々なブラックボックス検出器に対して最先端のベースラインを上回っていることが示された。
この研究は、物理的な敵攻撃の一般化限界を推し進め、現実世界のデプロイメントにおける視覚的AI脆弱性を評価するための堅牢なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:44:54 GMT)
InterQ: Communication-Aware Scheduling Across Modular QPUs with Classical and Quantum Links [9.4] 異種通信モデルを用いたモジュールQPUアーキテクチャのための通信対応スケジューラであるInterQを提案する。
通信モデルとスケジューラ駆動の切断決定がスループット、レイテンシ、忠実度にどのように影響するかを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:39:36 GMT)
Diff-Instruct with Diffused Reward: Towards Principled One-step Generator RL [9.1] ワンステップのテキスト・ツー・イメージ生成により、顕著な効率と品質でリアルタイムな合成が可能になった。
画像空間報酬最適化と拡散雑音空間分布マッチングを組み合わせた1ステップジェネレータの事前強化学習法について検討した。
KL最小化から導かれるデータフリーな軌道レベルのアライメントフレームワークであるDiff-Instruct with Diffused Reward (DIDR)を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:26:33 GMT)
PanoWorld: A Generative Spatial World Model for Consistent Whole-House Panorama Synthesis [9.1] パノワールド(英: PanoWorld)は、ノードベースのパノラマの自動回帰生成としてハウス全体の合成を扱う生成空間世界モデルである。
クロスノードレイアウトとマテリアル一貫性を改善しつつ、高周波2D合成品質を保っている。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:25:37 GMT)
MV-Gate: Insider Threat Detection via Multi-View Behavioral Statistics and Semantic Modeling [9.0] 本稿では,統計正規性とシーケンス意味論を統合する行動モデリングフレームワークMV-Gateを提案する。
異常認識型計算ゲーティング機構は、これらの統計ビューを注意に注入し、エンコーダに統計的に不規則な事象を強調するよう指示する。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:29:03 GMT)
Learning Long-Term Temporal Dependencies in Photovoltaic Power Output Prediction Through Multi-Horizon Forecasting [9.0] 本稿では,従来の単一水平推定からマルチ水平予測フレームワークへの移行を提案する。
我々は、将来の一連の値に対する共同最適化により、深層ニューラルネットワークが潜時的な時間的依存をよりよく捉えることができることを実験的に実証した。
我々は、複数の離散的な将来の時間ステップにまたがる出力を同時に予測するモデルの能力を評価する。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:56:34 GMT)
Geometric Prototype Learning in Quantum Hilbert Space with Matrix Product States [9.0] 本稿では,クラス代表者が生成行列生成状態として符号化されるプロトタイプベースの学習手法を提案する。
分類やクラスタリングのような様々なMLタスクは、量子状態の幾何学的測度によって実行することができる。
本結果は,量子ヒルベルト空間におけるMLアルゴリズム設計の新たな方向性を開き,プロトタイプ学習のための説明可能なフレームワークとして量子状態を確立した。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:00:48 GMT)
StatQAT: Statistical Quantizer Optimization for Deep Networks [8.9] 本研究では,一様および浮動小数点量子化のための新しい統計誤差解析フレームワークを提案する。
任意のデータ分布用に設計された反復量化器とガウス的な重み分布に適した分析量化器を提案する。
実験により、精度と安定性が向上し、低精度ニューラルネットワークをトレーニングするためのアプローチの有効性が強調された。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:56:12 GMT)
GenTS: A Comprehensive Benchmark Library for Generative Time Series Models [8.9] GenTSは、生成時系列モデルの体系的な評価のために設計された包括的なベンチマークライブラリである。
統合されたデータ前処理パイプライン、汎用モデルのコレクション、パノラマ評価メトリクスを備えている。
GenTSをベースとして,様々なタスクでベンチマーク実験を行い,モデル選択の提案と今後の研究の方向性について検討した。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:27:54 GMT)
BacktestBench: Benchmarking Large Language Models for Automated Quantitative Strategy Backtesting [8.9] BacktestBenchは、自動量的バックテストのための最初の大規模ベンチマークである。
4つのタスクカテゴリ(メトリクス計算、ティッカー選択、戦略選択、パラメータ確認)の18,246の厳密な注釈付き質問応答ペアで構成されている。
また、自然言語戦略を再現可能なバックテストに変換する堅牢なマルチエージェントベースラインであるAutoBacktestを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:52:08 GMT)
Chessformer: A Unified Architecture for Chess Modeling [8.8] Chessは長年、人工知能の標準的なテストベッドとして機能してきたが、その中心となるタスクのモデリングアプローチは多様化してきた。
チェスのモデリングにおける3つの中心的な目標すべてについて、最先端の技術を進化させる統一アーキテクチャであるChessformerを紹介します。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:27:01 GMT)
Interaction-Breaking Adversarial Learning Framework for Robust Multi-Agent Reinforcement Learning [8.7] 協調はマルチエージェント強化学習(MARL)の中心である
本稿では,協調を阻害する攻撃を構築するために,情報理論的な視点を取り入れた対話破りの逆学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:14:38 GMT)
DMN: A Compositional Framework for Jailbreaking Multimodal LLMs with Multi-Image Inputs [8.7] MLLM(Multimodal Large Language Models)は、MLLMから有害な応答を誘発するジェイルブレイク攻撃に対して脆弱である。
我々は,textbfDistributed 命令, textbfMultimodal エビデンス, textbfNumber チェインタスクを活用し,jailbreak 性能を完全に向上させる構成的jailbreak フレームワーク textbfDMN を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:23:58 GMT)
SD-Search: On-Policy Hindsight Self-Distillation for Search-Augmented Reasoning [8.6] 結果回帰強化学習では、ロールアウトにおけるすべての決定は同じ軌道レベルの報酬を共有し、ステップ固有のクレジットなしで個々のクエリを残します。
最近のプロセススーパービジョンアプローチでは、ポリシー外部からステップレベルのシグナルを描画することで、このギャップに対処している。
SD-Searchは,政策自体の段階的な監督を,政治上の後見的な自己蒸留を通じて引き起こす。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:18:47 GMT)
Rad-VLSM: A Cross-Modal Framework with Semantics-Assisted Prompting for Medical Segmentation and Diagnosis [8.6] Rad-VLSMはセマンティクス支援病変焦点と堅牢なセグメンテーションのための2段階のクロスモーダルフレームワークである。
Rad-VLSMは、直接予測ではなく、意味情報を用いて、テキストから診断への依存を減らし、病変レベルの証拠を診断する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:35:26 GMT)
FedMental: Evaluating Federated Learning for Mental Health Detection from Social Media Data [8.6] ソーシャルメディアのテキストデータは、高リスクのメンタルヘルス行動を示すユーザを特定するために機械学習(ML)モデルをトレーニングするためにしばしば使用される。
プライバシ保護のML技術が、パフォーマンスを保ちながら、より安全なデータ共有を可能にするかどうかを評価する。
本研究は、メンタルヘルス推論タスクにおける現在のプライバシー保護技術の可能性と限界を実証的に実証する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:26:14 GMT)
SAFE-SVD: Sensitivity-Aware Fidelity-Enforcing SVD for Physics Foundation Models [8.5] 本稿では,AI科学の新しいトレンドである物理基礎モデル(PFM)の圧縮手法を提案する。
実験では、複数のモデルやデータセットにまたがる既存の手法よりも大幅に向上し、精度を維持しながら圧縮率を大幅に向上する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:40:46 GMT)
Can These Views Be One Scene? Evaluating Multiview 3D Consistency when 3D Foundation Models Hallucinate [8.4] マルチビュー3D評価は、得られた画像が1つの静的な3Dシーンの観察であると仮定する。
既存の参照ベースのメトリクスは、基礎的な真理を必要とするが、MEt3Rのような非真実なメトリクスは、学習された再構築バックボーンに依存している。
整合性信号としてマッチ、登録、高密度サポート、再構成障害を用いるCOLMAPベースのメトリクスを導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:59:58 GMT)
LEAP: A closed-loop framework for perovskite precursor additive discovery [8.4] LEAP(LLM-driven Exploration via Active Learning for Perovskites)は、ループのクローズドフレームワークである。
LLMはペロブスカイト添加物からメカニズム関連知識を抽出するために訓練されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:50:37 GMT)
One Model, Two Roles: Emergent Specialization in a Shared Recurrent Transformer [8.3] 非対称入力再帰: 共有重み付けリカレントトランスフォーマーは、別々のモジュールに分割することなく、異なる内部ロールを発生させることができるか?
両更新で同じTransformerモデルを再利用した最小2状態推論アーキテクチャであるAsymmetric Input Recurrence (AIR) でこれを検証した。
機械学的に、注意解析により、L-更新はスドクとマゼの双方のH-更新よりも一貫して局所的であることが示された。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:36:58 GMT)
A Wafer-Scale Heterogeneous III-V-on-Silicon Nitride Quantum Photonic Platform [8.3] 超低損失窒化ケイ素(SiN)フォトニクスと利得および強非線形材料の統合は、スケーラブルな量子回路への経路を提供する。
我々は,III-V層を直接ファストリーファブリックSiN回路に集積するウェハスケールIII-V-on-SiN量子フォトニックプラットフォームを実証した。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:39:06 GMT)
Query-Conditioned Knowledge Alignment for Reliable Cross-System Medical Reasoning [8.3] クロスドメイン知識アライメントは異種医療システムの統合に不可欠である。
本稿では、クエリ条件付き対応問題としてエンティティアライメントを再構成するクエリ定義エンティティアライメント(QCEA)を提案する。
我々は,SymMap から派生した知識グラフ TCM-WM 上でのQCEA を評価し,症状アライメントとハーブ-分子アライメントタスクの両方をカバーした。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:49:46 GMT)
POLAR-Bench: A Diagnostic Benchmark for Privacy-Utility Trade-offs in LLM Agents [8.3] LLMエージェントは、ますますプライベートなユーザーデータにアクセスし、サードパーティシステムと対話する際にユーザーの代理として機能するようになっている。
POLAR-Bench(Policy-aware adversarial Benchmark)を導入し、プライバシポリシを持つ信頼されたモデルと、タスク関連属性と保護属性の両方を逆探索するサードパーティモデルとを対応付ける。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:27:07 GMT)
Geometry-Aware Uncertainty Coresets for Robust Visual In-Context Learning in Histopathology [8.3] GAUCは,事前学習されたマルチモーダル埋め込み空間で直接動作する,トレーニング不要なコアセット選択法である。
CRC-100K と MHIST が複数のオープンソース VLM アーキテクチャにまたがっている場合、GAUC は精度、キャリブレーション、高速な勾配ロバスト性を改善している。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:54:04 GMT)
Reduced-State Stabilizer Rényi Entropy as a Probe of Quantum Criticality in the Transverse ANNNI Model and the Quantum Compass Model [8.2] レニイエントロピー(Rényi Entropy, SRE)は、非安定化器資源(量子魔法)に関連する量子化器である。
2つの1次元スピンモデルにおける密度行列の純度補正SREの挙動を解析した。
我々の結果は、量子臨界性の相補的なプローブとして、還元状態のSREを確立した。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:38:46 GMT)
UAVFF3D: A Geometry-Aware Benchmark for Feed-Forward UAV 3D Reconstruction [8.1] UAVFF3Dは, フィードフォワード型UAV3D再構成のための幾何認識型ベンチマークである。
本稿では,カメラ・幾何学的推定と再構成の精度を共同で評価する評価プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:59:28 GMT)
Heterogeneity-Aware Dataset Scheduling for Efficient Audio Large Language Model Training [8.1] Grouped Sequential Training(GST)は、さまざまなデータセット間でオーディオ大言語モデル(ALLM)をトレーニングする効率的な方法である。
GSTは、Mix-allトレーニングのパフォーマンスを維持したり、超えたりしながら、標準の並列トレーニングよりも30~40%高速な収束を実現している。
提案手法は,大規模ALLM最適化を効率的に行うための,理論的知見と実用的,モデルに依存しないフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:41:08 GMT)
FedSDR: Federated Self-Distillation with Rectification [8.0] 基本的かつ強力な戦略としてのフェデレート自己蒸留(FedSD)。
FedSDR(Federated Self-Distillation with Rectification)は究極の強化フレームワークである。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:18:22 GMT)
PAREDA: A Multi-Accent Speech Dataset of Natural Language Processing Research Discussions [7.9] この研究は、アクセント、自発性、およびドメイン固有の発話に起因する変動性に焦点を当てている。
特に,マルチアクセント音声データセットであるPAper Reading DAtaset(PAREDA)を紹介する。
我々は,アクセント混合の影響と発話速度の増加を解析し,PAREDA上でのSOTA ASRモデルの性能評価を行った。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:10:26 GMT)
Switching-Geometry Analysis of Deflated Q-Value Iteration [7.8] 本稿では, 政策最適化問題に対する拡張Q-VIの最初のJSRベースの収束解析について述べる。
デフレの利点は、引き起こされた意思決定の問題の変化ではなく、より正確なJSRベースの収束幾何学の記述である。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:13:55 GMT)
Agent Meltdowns: The Road to Hell Is Paved with Helpful Agents [7.8] 我々は、強調融解と呼ばれる新しいタイプのエージェント障害を導入し、特徴付けし、測定する。
融解は既存の信頼性ベンチマークや安全性ベンチマークでは捉えられないため、融解挙動の分類法を開発する。
次に、シミュレーションされたローカルおよびリモートエラーをロールアウト環境に注入するためのエージェント非依存のインフラを実装した。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:03:38 GMT)
Context Memorization for Efficient Long Context Generation [7.8] 本稿では,プレフィックスを,プレフィックスとクエリトークン間の事前計算されたアテンション状態の軽量なルックアップベースメモリに外部化する,トレーニング不要なアプローチを提案する。
提案手法は1K-8Kメモリ予算でのコンテキスト内学習よりも精度を向上し,8Kでの注意遅延を1.36倍削減し,メモリフットプリントの20%しか使用せず,NBAベンチマークのフルアテンションRAG性能を上回った。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:12:45 GMT)
Real-time Multi-instrument Autonomous Discovery of Novel Phase-change Memory Materials [7.7] 多施設自律探索(MAD)フレームワークは、構造的特性マッピングと機能的特性最適化をクローズドループ方式で同時に組み合わせる。
相変化メモリ(PCM)材料にMADを適用し,特に未探索のPCM材料であるMn-Sb-Te三元系に応用する。
有望な電気PCMを見つけ,SPSPRを7倍のスピードアップに対応する25回の閉ループ反復で同定した。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:22:20 GMT)
Training-Free Cultural Alignment of Large Language Models via Persona Disagreement [7.5] 本研究では、各国を世界価値サーベイグラウンドのペルソナエージェントのパネルとしてインスタンス化し、その不一致をバウンド・ロス・アバースロジット補正に変換する推論時手法であるdisCAを紹介する。
以上の結果から,推論時キャリブレーションは,グローバルな道徳的嗜好の長い尾を提供するための微調整に代わるスケーラブルな代替手段であることが示唆された。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:29:46 GMT)
Stable Causal Discovery via Directed Acyclic Graph Aggregation [7.5] 誘導非巡回グラフ(DAG)は複雑な系における因果構造を明らかにする中心である。
複数の候補DAGを1つの安定表現に集約するモデル平均化フレームワークであるDAGgrを提案する。
ブートストラップ・アグリゲーション・ベースラインを常に上回りながら,DAGgrは最高の個人候補と一致または超えていることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:41:31 GMT)
Efficient Lookahead Encoding and Abstracted Width for Learning General Policies in Classical Planning [7.3] 一般的な計画は、古典的な計画領域内のインスタンスの集合をまたいで一般化するポリシーを学ぶことを目的としている。
最近のグラフニューラルネットワーク(GNN)アプローチは、いくつかのドメインでほぼ完璧なポリシーを学びました。
この作業は、最近公開されたIterated Width(IW)ポリシーの考え方を改善している。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:15:23 GMT)
Adaptive Outer-Loop Control of Quadrotors via Reinforcement Learning [7.2] 本研究では,新しい適応制御アーキテクチャを提案する。
まず、最適な外ループポリシーをトレーニングし、その後、地平線データへの依存をResidual Dynamics Predictorに置き換える。
データ効率のよい線形キャリブレーションブリッジとオンライン推力補正機構を導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:30:20 GMT)
REBAR: Reference Ethical Benchmark for Autonomy Readiness [7.1] 本稿では,自律システムのための定量的テストおよび評価フレームワークであるReference Ethical Benchmark for Autonomy Readiness (REBAR)を紹介する。
REBARは、運用メトリクスを、倫理的パフォーマンスを定量化できる計算可能な自律性レベル(ARL)にマッピングする。
このフレームワークの主な革新は、シナリオの倫理的困難を計算し、説明するための、ニューロシンボリックな大規模言語モデル(LLM)アプローチである。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:56:19 GMT)
Multi-site PPG: An In-the-Wild Physiological Dataset from Emerging Multi-site Wearables [7.1] 本報告では,4つのカスタム開発ウェアラブルから収集したWild内生理的データセットであるMulti-site PPGについて述べる。
各デバイスは、緑と赤外反射PSG、3軸加速度、温度をデバイス間アライメントのためのタイムスタンプで記録する。
参加者は、通常のルーチンを継続しながら、昼間活動中に何日間もこのデバイスを装着した。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:04:52 GMT)
Realization of waveguide many-body quantum optics [7.0] 多体量子光学は多体絡み合った状態のアリーナを開く。
本研究では,エミッタ光子散乱による非線形フォトニック輸送のスケーリングについて検討する。
これらの進歩により、新しいフォトニック量子シミュレータ、多体絡み合った状態の生成、新しい量子相転移の探索が可能になる。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:11:46 GMT)
LLM-Guided Communication for Cooperative Multi-Agent Reinforcement Learning [7.0] コミュニケーションはマルチエージェント強化学習において重要な要素である。
本稿では,全てのエージェントが可能な限り正確かつ均一に基盤状態を再構築できるプロトコルを提案する。
多様なMARLベンチマークの実験により、LMACはエージェント間の状態再構成を改善し、かなりの性能向上をもたらすことが示された。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:56:07 GMT)
Property-Guided LLM Program Synthesis for Planning [6.9] 評価後にプログラムを採点する代わりに、候補が正式に定義された性質を満たすかどうかを確認する。
このフィードバックは、プログラム生成数と評価コストの両方を大幅に削減します。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:26:59 GMT)
Surface-Form Neural Sparse Retrieval: Robust Fuzzy Matching for Industrial Music Search [6.8] クエリは、ミススペル、トランスポジション、音声のバリエーションによるインデックス付きメタデータから頻繁に逸脱する。
既存の学習・検索システムであるHigh Confidence Index (HCI)は、顧客の行動からクエリ・エンティティ・アソシエーションを学習する。
従来のn-gramマッチングは、この探索を可能にするが、セマンティックロバスト性や高雑音に悩まされる。
本稿では,探索効率を最大化するために,テキストフロバスト型ニューラルスパース検索システムを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:29:25 GMT)
L-Drive: Beyond a Single Mapping-Latent Context Drives Time Series Forecasting [6.7] 変更を意識した予測フレームワークであるL-Driveを提案する。
よりタイムリーな変更手順を提供し、変更セグメントへの適応を改善する。
実験はL-Driveの有効性を検証し、予測精度と計算効率のトレードオフをより良く示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:25:59 GMT)
Dual-Channel Tensor Neural Networks: Finite-Sample Theory and Conformal Structure Selection [6.7] 本稿では,各テンソルを低ランクコアとスパースに分解し,二つのニューラルチャネルを処理する*Dual-Channel Neural Network*(DC-TNN)を提案する。
推定のために、ネットワーク近似、コア推定、精製-選択項に分解するDC-TNN推定器の非漸近的リスク境界を確立する。
提案手法は, コアリファイント空間内を校正し, AUC と AUC の信頼バンドを有限の分布自由カバレッジで生成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:16:37 GMT)
A Unified Framework for Data-Free One-Step Sampling via Wasserstein Gradient Flows [6.7] 我々はWassersteinフローに基づく非正規化対象分布からデータフリーの一段階サンプリングのための統一的理論フレームワークを開発した。
標準 f-分割対象の幅広いクラスに対して、誘導速度勾配場が普遍形式 $mathbfV(x)=w(r(x)),(x)$ を受け入れることを示す。
データフリートレーニングのための実用的なLV-インスパイアされたサロゲートの動機付けとして、f-divergence family から Log-Variance (LV) divergence までフレームワークを拡張し、参照分布が結果のドリフト構造をどのように変化させるかを分析する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:32:22 GMT)
HydroAgent: Closing the Gap Between Frontier LLMs and Human Experts in Hydrologic Model Calibration via Simulator-Grounded RL [6.7] 分散水理モデルの校正は、運用水資源管理における重要なボトルネックである。
我々は、フロンティア大言語モデル(LLM)エージェントが人間の水理モデルに取って代わることができ、そうでなければ何が必要かと尋ねる。
我々は,アメリカ国立気象局がフラッシュフロード予測のために使用しているCREST分散水理モデル上で,9つのフロンティアLSMエージェントをベンチマークした。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:17:38 GMT)
Performance Monitoring of Proton Exchange Membrane Water Electrolyzer by Transformers-Based Machine Learning Model [6.6] グリーン水素は、2030年までに560GWまでスケールする能力が予想される脱炭酸に不可欠な役割を担っている。
本稿では,通常の動作中に仮想電気化学特性を解析する機械学習フレームワークを提案する。
パッチベースのシーケンストークン化にヒントを得て、入力をパッチに分割し、それらをエンコードして意味のあるトークンを形成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:49:56 GMT)
GraSP-VL: Length as a Semantic Granularity Interface for Vision-Language Representations [6.5] 埋め込み長を制御可能なセマンティックアクセスインタフェースに変換することができるかを検討する。
我々は,凍結VLM埋め込み上で共有直交の接頭辞変換を学習するtextbfGraSP-VLを提案する。
GraSP-VLは textbfSemantic Matryoshka インターフェースをインスタンス化する。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:10:07 GMT)
A Systematic Failure Analysis of Vision Foundation Models for Open Set Iris Presentation Attack Detection [6.5] 本研究は、近視画像を用いたオープンセット虹彩PADのための汎用視覚基盤モデルの系統的故障解析を行う。
その結果、基礎モデルは、類似したセンシング特性を持つデータセット間で転送可能であるが、未知の攻撃機器に対して確実に一般化できないことが示唆された。
これらの結果から,強いクローズドセットやクロスデータセットのパフォーマンスは,堅牢なオープンセットセキュリティの証拠として扱うべきではないことが示唆された。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:41:26 GMT)
Generating Physically Consistent Molecules with Energy-Based Models [6.4] 原子付加スカラー電位を明示的シミュレーションなしで学習することにより誘導バイアスを復元するエネルギーベースモデルであるEMMolを導入する。
EBMolは、QM9とGEOM-Drugsの最先端性能を達成した最初の3D分子生成用ESMである。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:26:52 GMT)
Adaptive Stochastic Natural Gradient Method for Safe Optimization on Binary Space [6.4] 適応的自然勾配法(ASNG)に基づく二元探索空間の安全な最適化法を提案する。
セーフASNGは、以前に評価された安全なソリューションの周りに安全なソリューションからなる安全な領域を計算します。
安全領域内の隣人に新たに生成したソリューションを投影することにより、安全なASNGは安全でないソリューション評価を抑制する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:31:38 GMT)
Learning Lifted Action Models from Traces with Minimal Information About Actions and States [6.3] 近年,昇降型STRIPSモデルは,動作トレースのみから正確かつ効率的に学習できることが示されている。
この欠点は、アクショントレースが隠されたSTRIPS+モデルから来ると仮定することで解決されている。
我々はSTRIPS+アクションドメインをトレースからより一般的な文脈で学習する問題を考察する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:33:28 GMT)
Weather-Robust Cross-View Geo-Localization via Prototype-Based Semantic Part Discovery [6.3] クロスビュージオローカライゼーション(CVGL)は、信号が妨害されたり、スプーフされたり、利用できない場合、自律ドローンナビゲーションのキーとなる代替手段として登場した。
パッチグリッド上の明示的な部分グループ化を実現する,パッチベースの視覚変換器(ViT)用の軽量スワップ可能なヘッドであるSkyPartを提案する。
26.95Mパラメータと22.14 GFLOPでは、SkyPartは最もパフォーマンスの高い手法の中で最小である。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:48:57 GMT)
Unlocking Compositional Generalization in Continual Few-Shot Learning [6.3] 我々は、合成推論から表現学習を厳密に分離する新しいパラダイムを開拓した。
トレーニング中、スロット表現は完全に全体的クラスアイデンティティに最適化される。
我々はこのパラダイムが二重構造的利点をもたらすことを実証し、凍結したバックボーンは自然に表現のドリフトを防ぎ、一方、我々の軽量で全体最適化は新規概念伝達のための特徴量を保存する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:25:10 GMT)
MIST: Reliable Streaming Decision Trees for Online Class-Incremental Learning via McDiarmid Bound [6.3] ストリーム決定木は、オープンワールド連続学習の自然な候補である。
2つの混在した誤校正のために、オンラインのクラスインクリメンタルラーニングでは依然として失敗している。
本稿では,MIST(McDiarmid Incremental Streaming Tree)について述べる。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:29:14 GMT)
Self-Distillation is Optimal Among Spectral Shrinkage Estimators in Spiked Covariance Models [6.2] 自己蒸留は、現代の機械学習システムにおけるモデル性能を改善するための有望な技術として登場した。
我々は、複数のデータセンターがスペクトル収縮推定器を共有し、共通のサーバがそれらを集約して最適な性能を実現するためのフェデレーションアプローチについて検討する。
この場合、最良のローカルルールは、データを単一のサーバに集中的にホストする最適なルールとは異なるが、再び自己蒸留の形式を取る。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:56:57 GMT)
Harnessing Self-Supervised Features for Art Classification [6.2] 美術品の分類は、きめ細かい細部と抽象的な特徴の複雑な相互作用のために重要な課題である。
本稿では, 美術品の分類と検索において, 教師付き, 自己監督型バックボーンの有効性について, 体系的に検討した。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:59 GMT)
Self-supervised local learning rules learn the hidden hierarchical structure of high-dimensional data [6.2] ニューラルネットワークが高次元データの固有階層構造をどのように学習するかを考察する。
長い収束時間と対称誤差ネットワークの使用の両方を避けるための2種類の局所学習ルールに着目した。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:37:28 GMT)
Modelling Customer Trajectories with Reinforcement Learning for Practical Retail Insights [6.1] トラベリングセールスマン問題(TSP)のようなヒューリスティックスは、一般的に安価な近似として使用される。
実際の軌道は、最短経路から平均で28%ずれており、精度と実用性の間のトレードオフを強調している。
本稿では,軌道予測を最大エントロピー強化学習として活用するエージェントベースモデリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:17:51 GMT)
STRIDE: A Self-Reflective Agent Framework for Reliable Automatic Equation Discovery [6.1] LLMに基づく方程式探索は、データからシンボル法則を回復するための有望な経路を提供する。
本研究では,データ・アウェア・ジェネレーション,混合適合評価,批評家・実行者修復,多様性保存セマンティックメモリの調整により信頼性を向上させる自己表現型エージェント・フレームワークSTRIDEを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:14:32 GMT)
Predictable Confabulations: Factual Recall by LLMs Scales with Model Size and Topic Frequency [6.0] リコール品質は、トレーニングデータにおけるモデルパラメータ数とトピック表現の対数-線形結合におけるシグモイドに従う。
この形式は、リコールが信号対雑音比によってゲートされる重ね合わせにインスパイアされたアカウントと一致する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:53:44 GMT)
Semantic Reranking at Inference Time for Hard Examples in Rhetorical Role Labeling [6.0] 修辞的役割ラベルリング(Rhetorical Role Labeling、RRL)は、文書内の各文に機能的な役割を割り当て、法律、医学、科学の領域で広く使われている。
本稿では,ラベルのセマンティクスを活用してハードインスタンスの予測を洗練する推論時セマンティクスのフレームワークRISEを紹介する。
エンコーダベースのアーキテクチャや因果アーキテクチャを含む7つのLMを持つ8つのドメイン固有のRRLデータセットの実験では、ハードな例では、平均で+9.15のマクロF1ポイントが得られた。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:03:02 GMT)
CosFly-Track: A Large-Scale Multi-Modal Dataset for UAV Visual Tracking via Multi-Constraint Trajectory Optimization [5.9] 都市環境におけるUAV視覚追跡のための大規模マルチモーダルデータセットであるCosFlyTrackを紹介する。
このデータセットは6000本の歩行者経路から生成された約12,000人の専門家と摂動型UAV軌道を提供する。
CosFlyTrackは追跡性能を78.3から95.6%に改善し、ゼロショットベースラインよりも53から69ポイント向上した。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:49:58 GMT)
When Accuracy Is Not Enough: Uncertainty Collapse between Noisy Label Learning and Out-of-Distribution Detection [5.9] 雑音ラベル(LNL)を用いた学習は通常、クローズドセットの分類精度によってベンチマークされる。
本稿では,LNLチェックポイントを凍結し,ニア/ファー-OODルーティングとポストホックスコアを標準化して評価する,学習者に依存しないACC-OODベンチマークを提案する。
これらの結果は、クローズドセットの一般化、オープンワールドの信頼性、構造的重複診断を共レポートするLNLベンチマークをサポートする。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:19:45 GMT)
Efficient 3D Content Reconstruction and Generation [5.9] マルチビュー拡散とフィードフォワードスパース3D再構成を組み合わせることで,5~20秒で高品質な資産を創出するInstant3Dを紹介する。
私はFastMapを開発しています。これは、従来の最先端よりも最大10倍のスピードアップを実現します。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:41:10 GMT)
A Dexterous and Compliant Gripper With Soft Hydraulic Actuation for Microgravity Manipulation [5.8] Astrobee の既存の 1-of-freedom (DOF) は、国際宇宙ステーション (ISS) への侵入を可能にする。
本稿では,DexCoHandとAstrobeeフリーフライングロボットを併用し,微小重力下での操作について述べる。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:46:46 GMT)
Efficient Bilevel Optimization for Meta Label Correction in Noisy Label Learning [5.8] ノイズの多いラベルでディープニューラルネットワークをトレーニングすることで、データアノテーションのコストを削減できるが、学習モデルにノイズをもたらす可能性がある。
EBOMLC法は,1ステップのインナーループ更新,混合上損失,アライメントを考慮した動的バリアなど,3つの重要な改善を伴って設計されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:12:14 GMT)
Better Together: Evaluating the Complementarity of Earth Embedding Models [5.8] 地球埋め込みモデルは、地球観測データを地球表面の場所と一意に結びついた埋め込みに変換する。
これらのモデルは通常、個別に評価され、異なる地球埋め込みで下流タスクのパフォーマンスを比較する。
本研究では, それらの相補性による地球埋め込みの評価について提案する: 最高の単一モデルベースライン上での融合埋め込みの性能向上である。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:10:13 GMT)
CosFly: Plan in the Matrix, Fly in the World [5.8] 航空追跡のためのボックス構造化計画およびマルチモーダルシミュレーションパイプラインであるCosFlyを提案する。
また,多様な環境をまたいだ動的目標追跡のための大規模UAVデータセットであるCosFly-Trackについても紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:11:18 GMT)
Evidence-Grounded Frontier Mapping and Agentic Hypothesis Generation in Nanomedicine [5.7] pArticleMapは、文献作成と研究・仮説生成システムである。
pArticleMapは、将来的なコンセプトの共起を予測するのではなく、低密度の記事レベルブリッジリージョンとクラスタインターフェースをターゲットにしている。
タスクレベルの維持仮説では、プールされた金の回収率は10.8%となり、リコール@10は15.9%、将来の隣接レートは61.0%となった。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:50:11 GMT)
Probing Persona-Dependent Preferences in Language Models [5.7] 大きな言語モデルは、根本的に異なる好みを持つ異なるペルソナを採用することができる。
我々は, Gemma-3-27BとQwen-3.5-122Bの残差ストリーム活性化に関する線形プローブを訓練し, 対のタスク選択を予測した。
補助アシスタントで訓練された調査員は、アシスタントのものと反相関の悪いペルソナなど、質的に異なるペルソナの選択を予測し、判断する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:15:49 GMT)
Spherical Harmonic Optimal Transport: Application to Climate Models Comparisons [5.6] 最適なトランスポートは、サポートの幾何学を尊重しながら測度を比較するための強力なフレームワークを提供するが、高価な計算コストが伴う。
熱核コストは、バランスの取れたケースとバランスの取れないケースで時間がなくなると、最適な輸送コストに収束する。
我々は高速なシンクホーンアルゴリズムを導出し、メモリは$mathcalO(n)$と$mathcalO(n3/2)$の反復時間しか必要としない。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:36:19 GMT)
Quantum Machine Learning-based 6G edge Network: Enabling Adaptive Communication and Model Aggregation [5.5] 車両間通信(V2X)は、通信効率、システム一般化能力、モデルコラボレーションにおいて前例のない課題に直面している。
本稿では,V2X通信とモデル集約のための量子化フレームワークを提案する。
この研究は、将来の6Gインテリジェントトランスポートにおけるコミュニケーションとモデルコラボレーションの新しいパラダイムを概説する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:13:00 GMT)
OEP: Poisoning Self-Evolving LLM Agents via Locally Correct but Non-Transferable Experiences [5.5] 既存のエージェントメモリ攻撃は、特権アクセスまたは明示的な悪意のあるコンテンツを必要とするため、高度な安全フィルタによって検出できる。
反射剤は、特に重大だがもっともらしい仮説的結果と組み合わせた場合、このようなクリーンな経験に弱いことが判明した。
本報告では,システムプロンプトやメモリデータベースを直接制御する必要のないブラックボックス攻撃であるOEP(Obsessive Experience Poisoning)を導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:08:59 GMT)
Probabilistic Recursively Feasible Motion Planning Under Uncertain Environments [5.5] 本稿では,確率的再帰的モデル予測制御(PRF-MPC)フレームワークを提案する。
この分析に基づいて,現在の安全集合が将来の安全集合に含まれることを高い確率で保証する安全制約を構築する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:35:37 GMT)
Uncertainty-Calibrated Recommendations for Low-Active Users [5.4] 低アクティブユーザ(LAU)と高アクティブユーザ(HAU)の多様性のバランスをとる必要があると我々は主張する。
差別化戦略を推進するために不確実性を校正する、統一的で生産可能なフレームワークを導入します。
具体的には、モデル不確実性に基づくリスクボイス政策をLAUに対して実施し、信頼性の低いレコメンデーションを抑えるとともに、HAUに対するリスク検索アッパー信頼境界(UCB)戦略を用いて探索を促進する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:11:17 GMT)
Benchmarking transferability of SSL pretraining to same and different modality segmentation tasks [5.3] SMIT (Self-distilled masked image transformer) は、9つのタスクで最も高いセグメンテーション精度を達成した。
MIMベースのSimMIMと自己蒸留法(DINO, iBOT)は、対照的な学習と回転予測に優れていた。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:41:55 GMT)
CineMatte: Background Matting for Virtual Production and Beyond [5.2] LED Virtual Production (VP)は、大きなLEDボリュームを使用して背景をリアルタイムでレンダリングする。
私たちは、VP以降の堅牢なバックグラウンドマッチングフレームワークであるCineMatteを使って、この問題に対処しています。
CineMatteはクロスアテンション設計を採用している。背景と入力を結合する代わりに、CineMatteはSiameseという冷凍のDINOv3 Vision Transformerを使って入力フレームとキャプチャされた背景を別々にエンコードする。
クロスアテンションモジュールは、2つのストリームを比較して前景を予測し、事前訓練されたセマンティクスを保存する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:45:27 GMT)
Balancing Knowledge Distillation for Imbalance Learning with Bilevel Optimization [5.2] 不均衡なデータでは、ハードとソフトの損失の間の固定重み付けが学習過程を不安定にする。
本稿では,各サンプルのハードとソフトの損失を動的にバランスするバイレベルフレームワークを提案する。
提案手法は,近年の非平衡因子間の不平衡解離相関法を超越している。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:19:33 GMT)
SIREM: Speech-Informed MRI Reconstruction with Learned Sampling [5.1] 音声生成のリアルタイム磁気共鳴画像(rtMRI)は、動的声道運動の非侵襲的な可視化を可能にする。
そこで本研究では,SIREMという音声インフォームドMRI再構成フレームワークを提案する。
我々は,USC音声rtMRIベンチマークにおけるSIREMを,グリッド化,ウェーブレットベース圧縮センシング,全変動を含む標準ベースラインに対して評価した。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:05:10 GMT)
The Thermodynamic Costs of Simple Linear Regression [5.1] 基礎的および基礎的モデリングアルゴリズムである単純線形回帰の熱力学的コストについて検討する。
線形回帰モデルをトレーニングするための最適なデータセットサイズに対するエネルギーコストスケーリング法則を導出する。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:51:02 GMT)
Temperature-Controlled Resonance in a Heteronuclear Quantum Gas Mixture [5.0] 単一チャネル共鳴は原子の散乱における基本的な過程である。
ヘテロ核混合物の温度を制御し, 連続的に調整可能な単一チャネル共鳴を実現する機構を提案する。
以上の結果から,超低温量子気体中の単一チャネル共鳴に対する簡易かつ実験的にアクセス可能な制御ノブとして温度を確立した。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:39:04 GMT)
Long-horizon prediction of three-dimensional wall-bounded turbulence with CTA-Swin-UNet and resolvent analysis [5.0] 3次元壁境界乱流の長距離予測は, 自己回帰誤差の急激な蓄積と計算コストの大幅な増大により, 困難な課題である。
本稿では,CTA-Swin-UNet (CTA-Swin-UNet) を用いて,壁並列平面内の乱流場を予測するハイブリッド機械学習フレームワークを提案する。
3次元流れ場は、予測された平面流から根付いたリゾルペントベースのスペクトル推定(SLSE)によって再構成される。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:53:22 GMT)
ProcBench: Evaluating Process-Level Defects and Control Preservation in LLM Coding Agents [4.9] ProcBenchは、プロセス欠陥と制御保存を通じてコーディングエージェントトラジェクトリを評価するための、ベンチマーク指向のフレームワークである。
アノテーション付き200トラジェクトリでProcBenchをインスタンス化し,AndroidBench, TerminalBench, SWE-bench-Verifiedという3つのコーディングエージェントベンチマークに適用する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:34:48 GMT)
Distributionally Robust Control via Stein Variational Inference for Contact-Rich Manipulation [4.8] 信頼性の高いロボット操作には、コンタクトリッチな相互作用によって生じる不確実性を正確に表現し、適応できる制御ポリシーが必要である。
現代のデータ駆動手法は、大規模なトレーニングと計算によって不確実性を軽減し、限られたトレーニングサンプル数で性能を著しく低下させる。
我々は、より柔軟な不確実性モデリングにより、モデルに基づく制御の能力を拡張することを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:54:29 GMT)
Efficient and Noise-Tolerant PAC Learning of Multiclass Linear Classifiers [4.8] 線形モデルの耐雑音性PAC学習は、前世紀から機械学習コミュニティにおいて中心的な関心を集めてきた。
PAC がマルチクラス線形分類器 $h_w:xmapsto argmax_yin[k]w_ycdot x, xin mathbbRd, winmathbbRkd$ を少なくとも$O(k2cdot (dlog d+log k))$サンプルを用いて学習する計算効率のよいアルゴリズムが存在することを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:09:26 GMT)
Scenario Generation in Roundabouts with Adjustable Interaction Intensity [4.8] 本稿では、連続的に調整可能な相互作用強度を持つ対話対応ラウンドアバウンドシナリオジェネレータを提案する。
その結果, ベースラインモデルと比較して, 時間-遅延忠実度とプラウシブル相互作用応答が向上した。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:16:26 GMT)
A Geometric Analysis of Sign-Magnitude Asymmetry in a ReLU + RMSNorm Block under Ternary Quantization [4.8] RMSNormを許容する3次10,+1重み量子化を持つプレノーム変圧器。
重み摂動の符号-マグニチュード分解による幾何学的説明を与える。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:36:33 GMT)
Geo-Data-Driven HD Map Generation Workflow with Integrated Reference-Free Constraint-Based Verification [4.7] ハイデフィニション(HD)マップは自動走行システムのコアアーティファクトであるが、その生成は一般的にセンサー集約型のモバイルマッピングキャンペーンに依存している。
本稿では,表現レベル検証を統合したHDマップ生成のためのエンジニアリング指向のジオデータ駆動ワークフローを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:08:56 GMT)
Improving Spatio-Temporal Residual Error Propagation by Mitigating Over-Squashing [4.6] 本稿では,エラー関連自己回帰予測の時間的制限を克服する構造的不確実性モジュールであるTegerを紹介する。
Tegerはバックボーンに依存しないため、自己回帰エンコーダによって生成される潜伏状態のみを必要とする。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:51:33 GMT)
How Loud Rumbles Hit Newsstands: A Data Analysis of Coverage and Spatial Bias in German News about Landslides Around the World [4.6] この論文は、ドイツの新聞で世界中の地すべりがいかに報じられているかに焦点を当てている。
25年間に550万件のニュースイベントについて、約60万件のニュース記事を分析した。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:17:05 GMT)
Probing Tensor Singularities and Their Euler-Class Descendants via Non-Abelian Quantum Geometry Measurement [4.4] 超伝導基板上に4次元(4D)テンソル特異点と3次元(3D)オイラー級の子孫の新たなクラスを予測・観測する。
我々の研究は、様々な量子プラットフォームにまたがる高次ゲージ理論と実バンドルトポロジーを探索するための堅牢な実験的枠組みを確立する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:30:57 GMT)
QSTRBench: a New Benchmark to Evaluate the Ability of Language Models to Reason with Qualitative Spatial and Temporal Calculi [4.4] 大規模言語モデル(LLM)を評価するために,広範に定性的空間的・時間的推論(QSTR)ベンチマークを導入する。
本稿では,合成推論(合成表,CT),逆関係,QSTR計算,アルゲブラ点(PA),アレン計算,RCC-5,RCC-8,RCC-22,9交叉モデル,基方向計算,STARに対する概念近傍(CN)について考察する。
拡張ベンチマークは、プレフィックス/インフィックス、単語/シンボル/ナンス用語、選択された計算のスキーマ記述を含む質問提示を体系的に変更する。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:26:14 GMT)
Deep Neural Sheaf Diffusion [4.3] 本稿では,層間情報伝達信号を維持するために,層間ラプラシアンを層間隣接演算子に置き換えるEmphDeep Neural Sheaf Diffusion (DNSD)を提案する。
DNSDはグラフタスクの深い集約を効果的に利用し、合成長範囲データセット上で最大30ppの精度でGNNおよびNSDベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:42:19 GMT)
Evidence-Guided Unknown Rejection for High-Confidence Near-Known Unknowns [4.3] オープンセット認識システムは無視された障害モードに直面していることを示す。
EGUR-Aを提案するが、このサンプルのスコアは十分高いのか?」と、この予測された既知のクラスは、このサンプルを受け入れるのに十分な証拠を持っているのか?」。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:46:55 GMT)
Brain-to-Image Retrieval and Reconstruction via Multimodal EEG Alignment [4.3] 自然視中に記録された脳波信号から視覚刺激をデコードする脳画像合成システムを提案する。
検索のために,生物にインスパイアされたEVNet機能により改良されたマルチレベルブラーリング手法を実装し,InfoNCE損失をトレーニングした。
再構築のために,脳波表現をマルチモーダルCLIP埋め込みに整合させるCognitionCapturerProを実装した。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:33:44 GMT)
Leveraging Speech to Identify Signatures of Insight and Transfer in Problem Solving [4.2] 我々は参加者に対して,5つの「マッチスティック・アジュメティクス」問題の連続を解こうとするときに,声高に考えるように求めた。
これらの問題は、すべて同じ種類の非可観測解 (Same group) か、毎回別の種 (Different group) に依存している。
次に、自然言語処理のテクニックを活用し、参加者のスピーチを分析することで、参加者の会話量と発言内容の両方に変化が伴うことがわかりました。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:02:00 GMT)
Neural Operators for Design-Space Surrogate Modeling of Tendon-Actuated Continuum Robots [4.2] 本稿では,操作者学習問題として,腱駆動型連続体ロボットの代理モデルについて定式化する。
この定式化により、単一の訓練されたモデルが、幅広い種類のロボット設計にまたがって一般化することができる。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:44:41 GMT)
EgoTraj: Real-World Egocentric Human Trajectory Dataset for Multimodal Prediction [4.2] EgoTrajはMeta Quest Pro(MQPro)を用いて記録されたエゴセントリックなマルチモーダルオープンデータセットである
現実世界の都市環境において、複数のMQPro装着者から収集された75のヒューマンナビゲーションが含まれている。
私たちの知る限りでは、EgoTrajは、長い水平な自己方向のナビゲーションをキャプチャすることで、典型的なエゴセントリックな軌道データセットとは異なる。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:26:51 GMT)
From Division to Decision: Leveraging Temporal Cell-Stage Segmentation for Embryo Transferability Prediction [4.2] タイムラプスビデオ顕微鏡は、初期発生に関する詳細な情報を提供するが、複雑な動きパターンと時間を要する分析のために利用することは困難である。
初期発生段階と胚移植能をモデル化するためのトランスフォーマーベースのフレームワークであるTransFACTを提案する。
実験により,TransFACTは,行動認識のための既存の手法を活用することで,胚移植性を予測する上で,競合製品よりも優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:42:38 GMT)
Agents for Experiments, Experiments for Agents: A Design Grammar for AI-Enabled Experimental Science [4.2] AIシステムは、人間と対話し、協調し、マルチエージェントアレンジメントで操作するようになっている。
エージェントがこれらの配置を研究するためには実験が必要であり、可能な設計の空間拡大を探索するためには、エージェントが実験を行う必要があるかもしれない。
しかし、人間-AIとエージェントの実験的条件は依然として散文で規定されており、比較、再利用、監査が困難である。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:59:21 GMT)
CoX-MoE: Coalesced Expert Execution for High-Throughput MoE Inference with AMX-Enabled CPU-GPU Co-Execution [4.2] CoX-MoEは、AMX(Advanced Matrix Extensions)対応のCPU-GPU協調システムである。
MoE推論を総合的に最適化するために、合体したエキスパート実行と、高いスループットのために戦略的ワークロードオーケストレーションを組み合わせる。
最先端のフレームワークと比較して、CoX-MoEは7.1倍、2.4倍のスループットを実現している。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:54:30 GMT)
Learning Variable-Length Tokenization for Generative Recommendation [4.2] 可変長トークン化学習フレームワークであるVarLenRecを開発した。
VarLenRecは、推奨精度とトレーニング/推論効率において最先端のメソッドよりも大幅に改善されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:57:19 GMT)
Federated Learning by Utility-Constrained Stochastic Aggregation for Improving Rational Participation [4.1] Federated Learning (FL)アルゴリズムは、クライアントがサーバー要求に応じてローカルモデルのアップデートを共有することによって、サーバーサイドのオーケストレーションに受動的に対応していると仮定する。
クライアントは多くの場合、グローバルモデルよりもローカルモデルのパフォーマンスなどのユーティリティを優先する有理的なエージェントです。
我々は,クライアント参加を持続させることで,グローバルモデルのパフォーマンスを最大化するためのサーバの役割を形式化するフレームワークであるFedUCAを紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:12:36 GMT)
DBES: A Systematic Benchmark and Metric Suite for Evaluating Expert Specialization in Large-Scale MoEs [4.1] Mixture-of-Experts(MoE)モデルのエキスパートスペシャライゼーションはいまだに理解されていない。
我々は、マルチドメインベンチマークと5つの理論的根拠を持つメトリクスを組み合わせた総合的な診断フレームワークDBESを紹介する。
この研究は、精度の指標とは無関係に専門家の専門性を評価するための最初の体系的な方法論を提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:50:30 GMT)
A-ProS: Towards Reliable Autonomous Programming Through Multi-Model Feedback [4.1] A-ProSは、ハイブリッドマルチモデルフィードバックフレームワークを通じて競合するプログラミング問題を解決する自律AIエージェントである。
A-ProSはベースラインエージェントループに比べて2倍以上のゲインを達成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:55:30 GMT)
Efficient Table QA via TableGrid Navigation and Progressive Inference Prompting [3.9] TQA(Table Question-Answering)は、正確なセル検索と多段階構造推論を必要とする。
我々はTGN(TableGrid Navigation)とPIP(Progressive Inference Prompting)という2つの構造化プロンプトフレームワークを用いたトレーニング不要なTQAアプローチを提案する。
TableBenchでは、TGNは最強のベースラインを3.8ポイント改善し、FeTaQaでは、PIPはReActとChain-of-ThoughtでSOTAパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:00:24 GMT)
On Improving Multimodal Pedestrian Trajectory Prediction with CVAE: A Study on Benchmark and Robot Data [3.9] 社会時空間グラフ畳み込みニューラルネットワーク(Social-STGCNN)は,社会的相互作用をモデル化することによって高い性能を示した。
我々は,Social-STGCNNのバックボーン上に構築し,変動オートエンコーダ(CVAE)に基づく確率的定式化を導入し,マルチモーダルな将来の軌道を明示的にモデル化する。
本研究では,ETHおよびUCY歩行者軌跡データと,移動ロボットが収集した実世界の歩行者データについて評価を行った。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:59:52 GMT)
Can Adaptive Gradient Methods Converge under Heavy-Tailed Noise? A Case Study of AdaGrad [3.8] 適応的勾配法は,アルゴリズム的な変化を伴わずに最小限の雑音を収束させることができることを示す。
また、重み付き最適化のための既存の minimax レートが $mathtAdaGrad$ では達成できないことを示し、既存の minimax レートが $mathtAdaGrad$ では達成できないことを示唆する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:30:15 GMT)
Statistical Limits and Efficient Algorithms for Differentially Private Federated Learning [3.8] フェデレートラーニング(Federated Learning)は、MLとAIモデルを多数のユーザデバイスとデータベースで協調的にトレーニングするフレームワークである。
評価精度,プライバシ制約,通信コストのトレードオフについて検討した。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:01:34 GMT)
A Simplex Witness Certificate for Constant Collapse in Variational Autoencoders [3.8] このノートは変分オートエンコーダの正確な定数崩壊を研究する。
目標は、この特定の障害モードを事前設計可能で、トレーニング中に監視可能で、トレーニング後に認証できるようにすることです。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:09:22 GMT)
Mapping the Fitness Landscape: A Structure-Guided Approach to Multi-Modal Optimization [3.8] マルチモーダル最適化は、単に多様な人口を維持するのではなく、多くの最適化を見つける必要がある。
ほとんどのニッチベースの進化的アルゴリズムは、基礎となるピーク-ベース組織を明示的に回復することなく、距離や密度推定器に依存している。
本稿では,マルチモーダル検索をデコード-値-アロケート-リファインの閉ループに変換する,決定空間中心のフレームワークであるChaotic Landscape-Decoding Evolution (CLDE)を紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:08:02 GMT)
Is Complex Training Necessary for Long-Tailed OOD Detection? A Re-think from Feature Geometry [3.8] 凍結した長い尾の表現はOODの有用な証拠を既に含んでいるが, 生マハラノビス距離は周波数結合した特徴半径によって歪められ, 尾の共分散は不十分である。
球状多孔型マハラノビス (HPM) は, 単位球上の特徴を正規化し, クラス固有の共分散を, プーリングされたリッジ正規化計量に置き換えるポストホック検出器である。
この単純なPC-ERM+HPMパイプラインは、CIFAR-100-LT上での最高ログ効率スコア(LES; 3.08)も達成し、観測されたCIFAR-100-LT AUROCの95%を維持できる。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:21:57 GMT)
DARTIC: Decentralized Anonymous Reputation at Scale for Trustworthy Crowdsourcing [3.7] DARTICは、クラウドソーシングのための分散化、匿名化、スケーラブルな評判駆動フレームワークである。
我々は,zkSNARKベースの集合メンバシップ証明を導入し,すべてのユーザを1つのアクセストークンに暗号的に結び付ける。
その結果, 完全分散型クラウドソーシングシステムにおいて, 匿名性, 堅牢な評価バインド, スケーラビリティを両立させることができることがわかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:52:11 GMT)
Pocket Foundation Models: Distilling TFMs into CPU-Ready Gradient-Boosted Trees [3.7] TabICLv2をXGBoostに蒸留すると、1.9ミリ秒で0.882マクロ平均AUC(教師AUCの96.5%)が得られる。
教師と学生のペア間の38倍から860倍のスピードアップで、統計的に有意なエッジが調整されたCatBoostの上に表示される。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:00:20 GMT)
Distilling Tabular Foundation Models for Structured Health Data [3.7] タブラル基礎モデル(TFM)は、健康データセット上で高いパフォーマンスを達成するが、その推論コストとインフラ要件は実用的利用を制限する。
本研究は, その予測行動が知識蒸留により, 軽量な表紙モデルに伝達できるかどうかを考察する。
蒸留された学生は、AUCの90%以上を保有し、いくつかのケースでは教師より優れており、CPU上では最低でも26時間以上高速に動作し、健康アプリケーションにとって重要な校正と公平性を維持する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:37:28 GMT)
Multi-Agent Reinforcement Learning for Safe Autonomous Driving Under Pedestrian Behavioral Uncertainty [3.7] 本稿では,SDCと12人の歩行者をマルチエージェント・プロキシ・ポリシー・オプティマイゼーションを用いて協調訓練するMARL環境について述べる。
500エピソード評価では、最高のルールベースラインに対する35%の目標と33%の衝突に対して、共同訓練されたSDCは14%の衝突率で78%の目標に達した。
MARLの歩行者との共同訓練は、SDCが高速に接近したのを待っていた歩行者が、シングルエージェントのRLと比較して30%の衝突を減らした。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:02:41 GMT)
Linear-optical test of quantum contextuality with sequential measurements [3.7] 量子文脈性(Quantum contextuality)は、非文脈的隠れ変数モデルでは説明できない非古典的な振る舞いのシグネチャを提供する。
単一光子を用いたKCBS不等式違反によるコッチェン・スペクターの文脈性を示すための線形光学装置を提案し,実験的に実装した。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:20:37 GMT)
Quantum--Fluid Correspondence for Systems of Nonrelativistic Spin-$\frac{1}{2}$ Particles [3.7] 我々は、内部スピンの次数を持つ荷電流体が、非相対論的スピン-1/2粒子に対して自然にパウリ方程式を満たすことを示す。
n量子ビット量子コンピュータは、少なくとも原理的には、n流体の適切な組み合わせとして実現可能であることを示唆する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:44:04 GMT)
Why We Look Where We Look: Emergent Human-like Fixations of a Foveated Visual Language Model Maximizing Scene Understanding [3.6] 情景理解を最適化するために訓練された模擬葉緑化エージェントは,創発的な人間の定着署名パターンを示す。
人間の自由視聴固定パターンは、望ましくない視覚の生物学的制約の下でシーン理解を最適化する機能的副産物として現れる可能性がある。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:55:28 GMT)
LLM-Based Static Verification of Code Against Natural-Language Requirements: An Industrial Experience Report [3.6] 本稿では,この課題に対処するための2段階のLLMベースのワークフローを,インテリジェント車両サイバーセキュリティケーススタディで紹介する。
第一段階では、AIベースのルールマイナーが自然言語要求から検証可能なルールを抽出する。
第2段階では、AIベースのコード監査者が、抽出されたルールに対する実装証拠をチェックする。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:34:03 GMT)
What Does the AI Doctor Value? Auditing Pluralism in the Clinical Ethics of Language Models [3.6] 医学は本質的に多元的であり、自律性、受益性、非効率性、正義といった原則は日常的に矛盾する。
良い臨床実践は、一つの倫理的スタンスを課すのではなく、各患者の価値観と調和してこれらの緊張をナビゲートする。
本稿では,臨床者が検証したジレンマのベンチマークと,意思決定から直接価値の優先順位を復元する帰属方法からなる,医療AIにおける価値多元性を監査するためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:56:13 GMT)
Privacy Preserving Reinforcement Learning with One-Sided Feedback [3.5] 本研究では,多次元連続状態と行動空間における強化学習を一方のフィードバックで検討する。
この設定は、学習効率とプライバシ保護に重大な課題をもたらす。
これらの課題に対処するため,新しいプライバシ保存型RLアルゴリズムPOOLを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:41:03 GMT)
Ensembling Tabular Foundation Models - A Diversity Ceiling And A Calibration Trap [3.5] データセット毎に単一のタブラル基礎モデル(TFM)が勝つことはない。
153の分類タスクに対して,6つのFMに対して6つのアンサンブル戦略をベンチマークした。
最高のアンサンブルである2レベルのカスケードスタックは、最強のシングルFMを253タイムで+0.18%の精度で購入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:32:57 GMT)
Data Presentation Over Architecture: Resampling Strategies for Credit Risk Prediction with Tabular Foundation Models [3.5] 4つの古典的モデルと5つのタブラル基礎モデル(TFM)をHome Credit and Lending Clubデータセット上でベンチマークする。
5Kから10Kのバランスの取れたコンテキストで、最強のTFMは、全データに基づいてトレーニングされた古典的なベースラインのAUCに到達する。
私たちはこれを、アーキテクチャの選択ではなく、コンテキスト構築が、不均衡な信用リスク設定におけるTFMの主要なデプロイレバーである、という証拠として捉えています。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:43:15 GMT)
Residual Paving: Diagnosing the Routing Bottleneck in Selective Refusal Editing [3.4] 本稿では,凍結した命令調整型変圧器の経路付き残差編集法であるResidual Pavingを紹介する。
Gemma-3-4B-ITのホールドアウト分割では、学習されたResidual Pavingは編集の拒否を88.6%から4.0%に削減する。
6つのバックボーン、オラクル・ルーティングは報告された各行のキープ側診断スコアを改善し、中央値のゲイン+12.9 pp。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:17:06 GMT)
Parameterized 4-Qubit EWL Quantum Game Circuits with Dirac-Solow-Swan Hamiltonian Integration for Quadruple Helix Disruptive Innovation Recommender Systems [3.4] 本稿では,4重ヘリックスイノベーションエコシステムにおけるレコメンダシステムのための,新しいパラメータ化 4-qubit Eisert-WilkensLewenstein (EWL)量子ゲーム回路を提案する。
回路はマルチキュービットのEWLエンタングルを使用し、パラメータ化された局所回転、逆エンタングル、フル測定を行い、22のゲートと回路深さ11しか達成せず、$O(n)$ for $n$-round helix communicationとスケールする。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:57:58 GMT)
Symmetry-Compatible Principle for Optimizer Design: Embeddings, LM Heads, SwiGLU MLPs, and MoE Routers [3.4] 深層学習の実践において、目覚ましい幾何学的格差は長く続いている。
勾配更新規則は、対応する重みブロックに作用するパラメータ群の下で同値であるべきである。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:17:26 GMT)
Toy Combinatorial Interpretability Models Reveal Lottery Tickets in Early Feature Space [3.4] 「宝くじの仮説は、密集したネットワークにはスパースワークがあり、勝ち札だ」
重み空間における当選チケットは、既に最終符号に近い特徴空間における前者位置に対応することを示す。
スパース再トレーニングは、しばしば異なる行で同じ節/テンプレートファミリーを再表現するので、保存されたオブジェクトは、顕微鏡的な行のアイデンティティではなく、ファミリーレベルである。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:00:53 GMT)
KVBuffer: IO-aware Serving for Linear Attention [3.3] 線形注意のためのIO対応機能機構であるKVバッファを提案する。
KV Bufferは、サービスシステムがより柔軟でメモリ効率の良い方法で線形アテンション出力を計算することを可能にする。
評価の結果、KVバッファは、線形注意復号遅延を最大45.17%削減し、サービス要求の最大回数を5倍にすることができることがわかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:14:52 GMT)
Temporal Task Diversity: Inductive Biases Under Non-Stationarity in Synthetic Sequence Modelling [3.3] 本稿では,学習時間にまたがるタスク分布の多様化効果について検討する。
このような時間的多様性は、記憶の一般化に対するバイアスを増大させる。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:12:16 GMT)
The Annotation Scarcity Paradox in Low-Resource NLP Evaluation: A Decade of Acceleration and Emerging Constraints [3.3] 低リソース自然言語処理(NLP)は、過去10年間に爆発的な成長を遂げてきた。
しかし、より複雑な生成システムを評価するのに必要な深い社会言語学の専門知識は、ひどく緊張している。
我々はこのパラドックスが報告された進捗の妥当性を脅かすと論じている。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:48:00 GMT)
An Empirical Study of Privacy Leakage Chains via Prompt Injection in Black-Box Chatbot Environments [3.3] 本稿では,間接的プロンプトインジェクションに基づくプライバシフリー・アタック・チェーンについて検討する。
まず、攻撃者が被疑者の意図したタスクをハイジャックする方法について分析する。
次に、ユーザプロンプトと検索ページの良質な開始を再構成するために、外部コンテンツにブリッジを用いた「例示」と呼ばれる新しいプロンプト言語手法を評価する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:38:18 GMT)
Measuring the complete set of spatial Schmidt modes of entangled two-photon fields [3.2] 本研究では,空間シュミットモードの完全集合を事前の知識なしで測定する手法を提案する。
我々は、3000以上のシュミットモードを持つ州(最も多く報告されている)を98ドル%の忠実度で測定する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:29:41 GMT)
Token-Space Mask Prediction for Efficient Vision Transformer Segmentation [3.1] TokenMaskはトークンスペースマスクヘッドで、クエリトークン親和性から直接マスクトークンログを計算する。
多様なViTバックボーン、データセット、セグメンテーションタスクにわたって、TokenMaskは一貫して効率を改善している。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:20:23 GMT)
Guiding Neuro-Symbolic Scenario Generation with Spatio-Temporal Logic [3.1] 本稿では,安全クリティカルな運転シナリオをターゲットとするフレームワークSTRELGenを紹介する。
これらの仕様の満足度レベルを監視することは、グラデーションベースの検索を可能にする。
これによりSTRELGenは、ストレステスト自律運転システムのための柔軟で解釈可能で強力なツールを提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:00:14 GMT)
Progressive Autonomy as Preference Learning: A Formalization of Trust Calibration for Agentic Tool Use [3.0] 政策ゲートウェイは、潜伏したヒトのリスク耐性機能に対するガウス過程の後部を維持している。
これは構造上、優先順位ベイズ最適化の例であることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:11:15 GMT)
Reinforcement Learning Assisted Quantum Simulation of Many-Body Excited States and Real-Time Dynamics [3.0] この研究は、強化学習収縮量子固有解法(RL-CQE)を電子励起状態とリアルタイム量子力学に一般化する。
このアルゴリズムの重要な特徴は、ACSE残差に基づくスケーラブルな状態表現であり、その次元は1粒子ベースで成長するが、ターゲットとする励起状態の数に依存しない。
また、励起状態設定における符号のない量子ビット作用素の等価性を検証する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:47:42 GMT)
Non-Gaussian Entanglement Hierarchy Based on the Schmidt Number [3.0] 非ガウス的絡み合いは様々な量子タスクにおいて有望な資源である。
本稿では,バイパーティイトボソニックシステムにおける量的目撃者$E_rm NG$を紹介する。
我々はこのフレームワークを、NOON状態や圧縮されたKerr状態など、非ガウス状態のパラダイムでベンチマークする。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:15:17 GMT)
Generalized Functional ANOVA in Closed-Form: A Unified View of Additive Explanations [3.0] ANOVAは、モデル予測を主要な効果と高次相互作用に分解することで、解釈可能性のための原則化されたフレームワークを提供する。
モデルに依存しない環境でデータサンプルから分解を推定する,単純だが強大なアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:56:10 GMT)
Regularized Counterdiabatic Driving for the Quantum Rabi Model [2.9] カウンター・ダイアバティック(CD)運転は、高速で堅牢な状態準備への強力な経路を提供する。
物理的動機付けされた再正規化スキームを備えた変分最適化フレームワークを提案する。
我々は、非有界ヒルベルト空間を持つ連続変数系にCD駆動を一貫して拡張できることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:31:23 GMT)
LEAD: A Local Ensemble-Assisted Parallel Decoding Framework for Quantum Tanner Codes [2.9] 量子タナー符号(Quantum Tanner codes)は、良好な性能特性を特徴とする量子誤り訂正符号の一群である。
LEAD(Local Ensemble-Assisted Decoder)は、量子タナー符号に適した反復構造を意識したデコーディングフレームワークである。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:20:14 GMT)
When Fireflies Cluster; Enhancing Automatic Clustering via Centroid-Guided Firefly Optimization [2.9] この研究は、データクラスタリングのためのFirefly Algorithm(FA)の新たな変種を示す。
非一様クラスタの形状、密度、クラスタ数の事前定義の必要性に苦労するK-Meansのような従来のメソッドの制限に対処する。
実験により,クラスタリングの品質が向上し,クラスタ内パス距離がK平均よりも小さくなった。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:22:13 GMT)
Generative Adversarial Learning from Deterministic Processes [2.9] 物理AIは、独立的で同一に分散されたサンプル(すなわちd.d.)の伝統的なパラダイムに従わないデータに適用されている。
実際、物理的なAIはランダムではないデータに基づいて訓練されることが多く、代わりに乱流のようなカオス力学系から派生している。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:57:49 GMT)
HexagonalWarriorMamba: Superior Threshold-Dependent Multi-label Classification of 12-Lead ECG Cardiac Abnormalities [2.9] この原稿は、12個のリードECGを単一チャネルの2D画像として処理するフレームワークであるHexagonalWarriorMamba (HWMamba)を提案する。
HWMambaは、データ内のグローバルコンテキストと複雑な空間関係をモデル化するように設計されている。
これは26の診断ラベルを含む2021年のPhystoNet/Computing in Cardiology Challengeデータセットで評価されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:37:25 GMT)
Not What You Asked For: Typographic Attacks in Household Robot Manipulation [2.9] 本研究は,HomeRobotベンチマークを用いたHabitatに基づくシミュレーションにおいて,タイポグラフィー攻撃を評価する。
本稿では,凍ったCLIPエンコーダを敵ステッカーに公開する非結合型認識アーキテクチャを提案する。
知覚的誤りは持続的な3次元意味マップを通して伝播し、運動的故障を引き起こす。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:06:29 GMT)
Subject-Specific Analysis of Self-Initiated Attention Shifts from EEG with Controlled Internal and External Attention Conditions [2.9] 自己開始型注意シフトは、自発的行動において重要な役割を果たすが、明確な時間的マーカーがないため、研究は困難である。
本研究では,タスク制約付き自己開始型シフトと外部指示型シフトを同一視覚刺激下で比較できる実験パラダイムを構築した。
本研究では,機械学習に基づくアプローチを採用し,(1)周波数固有の地形パターンのパフォーマンス指向評価,(2)SHapley Additive exPlanationsを用いたモデルに基づく特徴属性分析という2つの相補的分析を行う。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:52:22 GMT)
An Assessment of Human vs. Model Uncertainty in Soft-Label Learning and Calibration [2.8] 本報告では,MNISTと合成変種を用いたソフトレーベル学習の制御監査について述べる。
人間のソフトラベルは精度を向上するが、それらの大きな価値は正規化器として機能することにある。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:55:21 GMT)
Heterogeneous Tasks Offloading in Vehicular Edge Computing: A Federated Meta Deep Reinforcement Learning Approach [2.8] Vehicular Edge Computing (VEC) は、計算集約タスクを近くのエッジサーバにオフロードすることで、レイテンシに敏感なvehicularアプリケーションを可能にする。
本稿では,VECシステムにおける異種タスクオフロードのためのGAT-Seq2Seqモデリング(FedMAGS)を用いたFederated Meta Deep Reinforcement Learningフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:08:51 GMT)
Topological Signal Processing: An Application-Oriented Tutorial [2.7] トポロジカル信号処理(TSP)はグラフ信号処理(GSP)を一般化する新興分野である
グラフラプラシアンを単純錯体に一般化するホッジラプラシアンに基づく処理技術に着目する。
特に、重要なTSP概念をレビューし、それらを実例に関連付け、高次構造や信号がデータセットからどのように導出できるかについて議論する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:21:50 GMT)
Automated Grading of Handwritten Mathematics Using Vision-Capable LLMs [2.7] 視覚対応の大型言語モデル(LLM)は新しい機会を提供する。
インストラクター定義ルーブリックを用いた手書き数学書記作業のためのLLM-based graderの実証評価を行った。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:06:15 GMT)
Hidden weak-pairing superconductivity of non-interacting anyons obeying $\frac{1}{3}$ statistics [2.4] 交換統計を持つ電荷=e/3$の非相互作用気体は、隠れた弱対効果機構によって超伝導することができることを示す。
CF強対流相は、ラウリンのエノン超伝導の図像と断熱的に結びついている。
我々の理論は、チャーン絶縁体近傍の超伝導を理解するための自然な枠組みを提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:58:17 GMT)
Aligned Training: A Parameter-Free Method to Improve Feature Quality and Stability of Sparse Autoencoders (SAE) [2.4] 深層ニューラルネットワーク(DNN)の内部動作の解釈にスパースオートエンコーダ(SAE)を用いる
SAEは、少数の機能がアクティベートされず不安定である重大な欠点を示す。
本研究では,SAEのパラメータフリー再パラメータ化手法であるtextbfaligned trainingを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:34:24 GMT)
Supporting System Testing with a Multi-Agent LLM-based Framework for Knowledge Graph Extraction: A Case Study with Ethernet Switch Systems [2.4] 本稿では、イーサネットスイッチ構成マニュアル(ESCM)に焦点を当てる。
本稿では,異なる産業状況に適応可能な汎用フレームワークを提案する。
ESCMから構成知識を構造化形式でキャプチャする知識グラフ(KG)を生成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:05:21 GMT)
A Dataset for the Recognition of Historical and Handwritten Music Scores in Western Notation [2.4] MusiCorpusは、これまでで最大の手書き楽曲のデータセットである。
エンドツーエンドおよびオブジェクト検出に基づく光音楽認識システムの訓練と評価に適している。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:07:44 GMT)
CRAFT: Critic-Refined Adaptive Key-Frame Targeting for Multimodal Video Question Answering [2.3] 現実のニュースイベントに答えるためには、システムは異質なアーカイブ全体にわたってクエリ関連エビデンスを提示する必要がある。
我々は、動的選択とビデオごとのASRと多言語フォールバックを組み合わせたクエリ条件パイプラインであるCRAFTと、ハイブリッド批評家ループを紹介する。
MAGMaR 2026では、CRAFTが最高の総合平均(0.739)、参照リコール(0.810)、引用F1(0.635)を達成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:01:05 GMT)
Generative AI and the Productivity Divide: Human-AI Complementarities in Education [2.3] 生成人工知能(GenAI)は、企業が知識を作成し、処理し、適用する方法を変えつつある。
平均して、GenAIアクセスはタスク性能を著しく向上させたが、ゲインの分布は非常に不均一であった。
高AICの参加者は圧倒的な利得を達成し、低AICの参加者は限定的あるいは負の限界リターンを示した。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:50:05 GMT)
BLAgent: Agentic RAG for File-Level Bug Localization [2.3] BLAgentはファイルレベルのバグローカライゼーションのための新しいエージェントRAGフレームワークである。
BLAgentは、オープンソースモデルで78%以上のTop-1精度を達成した。
BLAgentは、エンドツーエンドの修復の成功を20%以上改善する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:20:13 GMT)
ReacTOD: Bounded Neuro-Symbolic Agentic NLU for Zero-Shot Dialogue State Tracking [2.3] 本稿では,NLUを独立したツールコールとして再構成する有界神経シンボルアーキテクチャであるReacTODを提案する。
有界ReActループは反復自己補正を可能にし、MultiWOZ上のシングルパス推論よりも最大9.3ポイント精度を向上させる。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:06:04 GMT)
Prompting language influences diagnostic reasoning and accuracy of large language models [2.2] 大規模言語モデル (LLMs) は, 臨床診断支援のために研究されている。
ほとんどの評価は英語で行われ、他の言語での信頼性は不確実である。
ここでは、英語とフランス語のパフォーマンスを比較することにより、言語が診断的推論と最終診断精度に与える影響を評価する。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:55:21 GMT)
Semiclassical periodic-orbit theory for quantum spectra [2.2] ファインマン経路積分から始まるトレース公式の導出について論じる。
ランダム行列理論によって記述される量子エネルギー準位分布の普遍的特徴を説明するために、トレース公式がどのように用いられるかを説明する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:40:45 GMT)
AgentNLQ: A General-Purpose Agent for Natural Language to SQL [2.2] 本研究では, BIg Bench for LaRge-scale Databaseベンチマークにおいて, 78.1%のセマンティック精度を実現するNL2のマルチエージェント手法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:33:15 GMT)
QLIF-CAST: Quantum Leaky-Integrate-and-Fire for Time-Series Weather Forecasting [2.2] この研究は、時系列回帰タスクにQuantum Leaky Integrate-and-Fireのスパイクニューラルネットワークを適用する。
QLIF-CASTは励起ニューロン状態を、Rx回転ゲートとT1緩和崩壊によって駆動される単一量子ビット量子重ね合わせとして符号化する。
IBM Marrakeshのハードウェア検証は信頼性の高い回路実行を確認し、シミュレーションからの平均偏差はわずか1.2%である。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:49:46 GMT)
Attacking the First-Principle: A Black-Box, Query-Free Targeted Mimicry Attack on Binary Function Classifiers [2.1] 我々は,模倣攻撃を実行するための新しいフレームワークであるKelpieについて紹介する。
我々は、Kelpieが6つの最先端バイナリ関数分類器に対して模倣攻撃をうまく実行できることを実証した。
この研究は、私たちの知る限り、ブラックボックスでゼロクエリのコンテキストでこのような模倣攻撃を最初に示したものです。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:27:06 GMT)
On efficient robust regression with subquadratic samples [2.0] ここでは,$widetildeO(d/4)$サンプルを用いたニア線形時間アルゴリズムが,$lesssim 1$条件下で予測誤差$O(sqrt)$を達成することを示す。
また、$lesssim 1$のような仮定がなければ、効率的なアルゴリズムには$tildeleft(mind22, 2d2right)$サンプルが必要であるという詳細な証拠を与える低次下界も証明する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:34:07 GMT)
Sometin Beta Pass Notin (SBPN): Improving Multilingual ASR for Nigerian Languages via Knowledge Distillation [1.9] ナイジェリアの言語には、急激なデータ不足、一貫性のない正書法、声調の発音、多様なアクセント、頻繁なコードスイッチング、ローカライズされた名前のエンティティなど、ユニークなモデリングのハードルがある。
これらの課題に対処するため, 2段階蒸留プロセスを利用した多言語ASRフレームワークを開発した。
本稿では,ヨルブ,ハウサ,イグボ,ナイジェリア・ピジン,ナイジェリア英語をカバーする多言語ASRモデルであるSometin Beta Pass Notin(SBPN)を紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:22:18 GMT)
The Expressive Power of Low Precision Softmax Transformers with (Summarized) Chain-of-Thought [1.9] 変圧器の既存の表現結果は通常、ハードマックスの注意、高精度、その他のアーキテクチャの変更に依存し、実際に使用されるモデルからそれらを切り離す。
我々は,このギャップを,トランスフォーマーデコーダをソフトマックスアテンションで解析し,アクティベーションとアテンションウェイトを丸め,深さと幅をコンテキスト長と対数的に成長させることで橋渡しする。
中間段階として、3次アクティベーションを持つハードマックストランスフォーマーと、Chain-of-Thought (CoT) を用いたチューリングマシンをシミュレートした注意スコアを構築する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:57:53 GMT)
Beyond Morphology: Quantifying the Diagnostic Power of Color Features in Cancer Classification [1.9] カラー特徴だけでバイナリ診断タスクにおいて高い性能が得られることを示す。
この性能は、悪性度に関連する大域的な色変化に起因する可能性が高い。
この研究は、単純で計算効率の良い色特徴が効果的な事前スクリーニングツールとして役立つことを示唆している。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:10:04 GMT)
DecisionBench: A Benchmark for Emergent Delegation in Long-Horizon Agentic Workflows [1.8] DecisionBenchはエージェントルータにおける創発的デリゲートのためのベンチマーク基板である。
ピア情報の生成や配信の仕方に非依存であるため、学習された、より豊かなピアメモリ、適応プロファイル構築、マルチステップデリゲートを評価できる。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:37:14 GMT)
AURORA: Contextual Orthogonalization for Geometric Representation Learning in Healthcare Foundation Models [1.8] AURORA, Adaptive Uncertainty Representations through Orthogonalized observedal alignment。
AURORAは意味的部分空間を文脈的要素に分解し、各部分空間内の一貫性の目標を学習する。
コンテクストの混乱、近隣の純度、制度的な流通シフトの下で、コンテクストの再構築を継続的に上回り、実質的に改善する。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:32:50 GMT)
Uncertainty Reliability Under Domain Shift: An Investigation for Data-Driven Blood Pressure Estimation in Photoplethysmography [1.8] 不確実性定量化(UQ)は、医療のような安全クリティカルな領域にとって重要である。
深層学習による血圧推定における予測性能と不確実性の評価を行った。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:03:04 GMT)
Dynamic Elliptical Graph Factor Models via Riemannian Optimization with Geodesic Temporal Regularization [1.7] 本稿では,因子モデル(textscDegfm)を用いたグラスマン多様体の動的推定を提案する。
我々は,時間変化の精度行列列を,潜在楕円グラフ因子モデルによって支配される低ランク+対角構造としてモデル化する。
合成ベンチマークと実世界のデータセットの両方の実験は、textscDegfmが常に最先端の評価を上回っていることを示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:34:44 GMT)
Generativism: Toward a Learning Theory for the Age of Generative Artificial Intelligence [1.7] 行動主義、認知主義、構成主義、コネクティビズムの4つの支配的な学習理論は、生成的人工知能が教育現場で増殖するにつれて、重要な概念的限界を示す。
本稿では、各学習理論を批判的に検証し、生成的AIの余裕によって挑戦される仮定を特定する。
ジェネラティビズムは、人間の学習者とAIシステムの間の知識の反復的共構築を通じて学習がますます起こることを示唆している。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:22:43 GMT)
Learning Normal Representations for Blood Biomarkers [1.7] 血液ベースのバイオマーカーは臨床診断と管理の基盤となる。
集団に基づく解釈は、個人の基準線からの有意義な逸脱を隠蔽し、遅れた疾患の検出を危険にさらす可能性がある。
患者の歴史と「正常」変動に関する集団レベルのデータの両方を条件付けして基準間隔を生成する条件変換器ベースのフレームワークであるNORMAを紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:37:05 GMT)
Generalize cross-ratios in n-dimensional Plane-Based Geometric Algebra [1.7] 平面型幾何代数(PGA)、R(n,0,1)における射影交差比の完全理論を開発し、各階数の幾何学的対象を包含する。
各オブジェクトの種類と構成について、明示的なクロス比式を確立し、それが適切な古典的不変量を取り戻すことを証明し、正準対測定演算子を同定する。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:43:15 GMT)
A Review of Galois Qudits [1.7] ガロアキューディッツ (Galois qudits) は、パウリ群を選択すると、ある有限体 $mathbbF_q$ の算術を符号化する$q$次元量子系である。
我々は、ガロア四重項に関する事実や証明をバイナリ拡張体上で収集し、形式化するために、既存の文献の上に構築する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:03:27 GMT)
LAST-RAG: Literature-Anchored Stochastic Trajectory Retrieval-Augmented Generation for Knowledge-Conditioned Degradation Model Selection [1.7] 本研究は, 純粋に統計的に適合する問題から, 知識条件決定問題への分解モデル選択を再構成する。
提案手法は、観察された健康指標軌跡とドメイン固有の文脈の両方を用いている。
最終的に、本研究では、純粋に統計的に好適な問題から分解モデル選択を知識条件決定問題に再編成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:07:16 GMT)
PROTEA: Offline Evaluation and Iterative Refinement for Multi-Agent LLM Workflows [1.6] マルチエージェント LLM はシングルプロンプトベースラインよりも優れていることが多いが、デバッグや洗練は困難である。
マルチエージェントシステムのオフライン・テスト駆動型改善のための統一インターフェース PROTEA を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:22:14 GMT)
Accelerating AI-Powered Research: The PuppyChatter Framework for Usable and Flexible Tooling [1.6] PuppyChatterは、ベンダー固有のSDKの直感的な簡潔さを維持するために設計された新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:33:05 GMT)
Spin-force from a Nitrogen-Vacancy ensemble drives a 100 mg levitated resonator [1.6] ダイアモンド中の窒素空力(NV)欠陥のアンサンブルによる反磁性緩和発振器を128 rm: mg$で制御可能とする。
我々の結果は、高質量状態の深い運動状態のスピンベース工学への重要なマイルストーンとなる。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:05:22 GMT)
Canonical Regularisation of Wide Feature-Learning Neural Networks [1.6] 特徴学習ネットワークは、カーネル登録ネットワークよりもはるかに少ない。
リッジ規則化は特徴学習型ネットワークにおける勾配流に偏りがあることが示される。
また,測地線尾根へのミニマックスローバストでスケーラブルなサロゲートとしてアーク隆起を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:23:06 GMT)
One Developer Is All You Need: A Case Study of an AI-Augmented One-Person Squad in a Brownfield Enterprise [1.5] AIツールは、エンジニアが以前クロスファンクショナルな部隊に分散していた役割を吸収することを可能にする。
規制された企業環境で、このような一人称部隊を設計し、評価する方法に関する構造的な証拠はほとんどない。
1人のスタッフエンジニアが計画された時間の半分に4人のチームを対象としたブラウンフィールド製品イニシアチブを納品したケーススタディを報告した。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:23:17 GMT)
Can Quantum Federated Learning Withstand Circuit-Level Backdoors? [1.4] 量子フェデレーション学習(QFL)は、フェデレーション最適化のコア脆弱性を悪意のあるクライアントに継承する。
この研究は、4つのステルス攻撃を形式化する新しいCircUit-Level Backdoor Threat(CULT)モデルを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:36:36 GMT)
Perfect Parallelization in Mini-Batch SGD with Classical Momentum Acceleration [1.4] 二次飽和系上での運動量加速度を最適化する理論を考案する。
我々のフレームワークはヘビーボールとネステロフスタイルの運動量の両方を含み、任意のミニバッチサイズが可能である。
私たちの理論は運動量に対する単純な選択も提供しており、これは経験的に有効であることが示されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:18:59 GMT)
MMoA: An AI-Agent framework with recurrence for Memoried Mixure-of-Agent [1.4] LSTMに基づくゲーティングをエージェント選択プロセスに統合した,繰り返しMoAアーキテクチャであるMMoAを提案する。
MMoAは、より少ないエージェントを動的に活性化することで計算オーバーヘッドを減らしながら、従来のMoAと同等の精度を達成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:47:09 GMT)
Generation of Heterogeneous PET Images from Uniform Organ Activity Maps Using a Pretrained Domain-Adapted Diffusion Model [1.4] 合成PET画像は、定量的イメージングワークフローの開発、スケーラブルな仮想イメージングトライアル、ディープラーニングモデルトレーニングに有用である。
本研究では,一様臓器活動マップを用いた解剖条件PET合成のためのドメイン適応拡散モデルを開発した。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:05:28 GMT)
A Pilot Benchmark for NL-to-FOL Translation in Planetary Exploration [1.4] 将来の惑星探査は、厳しい通信制約の下で動く自律ロボットエージェントを想定している。
自然言語(NL)を1次論理(FOL)に変換するパイロットベンチマークを導入する。
このデータセットは、NASAのPDS(Planetary Data System)から得られた実際のミッション資料から構築されている。
我々は、事前知識の様々なレベルで制御された実験を可能にするために、構造化述語と型付き定数を提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:16:42 GMT)
Bridging the Gap: Converting Read Text to Conversational Dialogue [1.4] 本稿では,会話文脈を用いた韻律調整法(PACC)を提案する。
PACCは読み上げ音声を様々な現代的な用途で使われる自然な会話音声に変換する。
従来の手法とは異なり,提案手法では音声合成にHiFi-GAN(High-Fidelity Generative Adversarial Networks)を用いる。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:53:46 GMT)
Knowing When Not to Predict: Self Supervised Learning and Abstention for Safer DR Screening [1.3] 自己教師付き学習(SSL)は、現在、医療画像モデルを事前訓練する標準的な方法である。
我々は,SSL事前トレーニングの長さが,信頼性と信頼性に基づく棄権の校正にどのように影響するかを検討する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:32:03 GMT)
Measurement-Driven Adaptive Low-Overhead Implementation of Multi-Controlled Toffoli Gates [1.3] トフォリゲートは、量子算術と可逆論理の基本的な構成要素である。
中間回路計測や古典的なフィードフォワードを含む動的量子回路能力の最近の進歩は、非クリフォード演算のリソースオーバーヘッドを減らす新たな機会を提供する。
本稿では,適応回路実行とアンシラ支援構造を利用した多制御トフォリゲートの動的分解手法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:03:17 GMT)
Krylov complexity and fidelity susceptibility in two-band Hamiltonians [1.3] 2バンドハミルトニアンの基底状態に対するクリロフ拡散複雑性について検討し、ブロッホ球上の一般状態である。
一般的な参照状態の場合、拡散複雑性の微分は、Su-シュリーファー・ヘーガーモデルにおける位相相転移において対数的に発散する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:07:09 GMT)
Explainable Machine Learning for Phishing Detection on Heterogeneous Datasets with MCP-Enabled Deployment [1.3] 本稿では、異種フィッシングデータセットにおけるフィッシング検出における機械学習アルゴリズムの効率について検討する。
実用的なデプロイメントを支援するため、MPPベースのフィッシングURL検出システムも組み込まれている。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:54:43 GMT)
Collision-Resistant Single-Pass Method for Unsupervised Fine-Grained Image Hashing [1.2] 教師なしのきめ細かい画像ハッシュは、微妙な視覚的差異を保持するコンパクトなバイナリコードを学ぶことを目的としている。
既存のほとんどの手法は衝突抵抗を無視し、意味的に異なるサンプルに対して同一のハッシュコードをもたらす。
衝突抵抗型シングルパス自己監督セマンティックハッシュを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:16:33 GMT)
Confinement-controlled pattern selection in a finite population-imbalanced dipolar Bose-Einstein condensate [1.2] 準2次元箱内に閉じ込められた2成分双極性ボース-アインシュタイン凝縮体の基底状態密度パターンについて検討した。
平均場モデルを用いて、位相図を軸方向の閉じ込め、相互作用の不均衡、人口比の関数として表す。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:47:09 GMT)
Adaptive Clifford+T Decomposition of Large Toffoli Gates with One Clean Ancilla [1.2] マルチコントロールトフォリゲートは量子計算の基本的な構成要素であり、量子算術、シミュレーション、探索アルゴリズムに応用されている。
近年の進歩は、補助量子ビット、相対位相トフォリゲート、動的回路技術を用いることで、このオーバーヘッドを大幅に削減できることを実証している。
動的回路に基づく非計算と測定条件付き補正を取り入れたClifford+T実装の明示的なリソース境界を導出する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:11:18 GMT)
Memisis: Orchestrating and Evaluating Synthetic Data for Tabular Health Datasets [1.2] 合成データのオーケストレーションと評価を行うツールであるMemisisを紹介する。
私たちのツールは、データ生成、検証、評価のための統合ワークフローを作成します。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:24:52 GMT)
Patch Ensembles for Robust Salmon Re-Identification with Weak Trajectory Labels [1.2] トラジェクトリIDはプロキシラベルとして使用できるが、トラジェクトリIDバイアスが導入される。
パッチレベルの予測をサーモン識別決定に融合させるパッチベースの再識別フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:30:27 GMT)
Inference-Time Machine Unlearning via Gated Activation Redirection [1.2] ゲーテッド・アクティベーション・リダイレクト(GUARD-IT)による推論時間学習の導入
GUARD-ITは入力依存のアクティベーションステアリングを推論時に解き放ち、モデルの重みはそのまま残す。
TOFUとMUSEの実験では、GUARD-ITは3つのモデルスケールで12の勾配ベースラインと一致するか、あるいは超えている。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:57:42 GMT)
Adversarial Stress Testing of SPARK Humanoid Safety Filters [1.2] 本研究では,SPARKヒューマノイド安全フィルタの再現性および応力試験によるロバスト性について検討した。
以上の結果から,目標をより緊密に追跡する手法もあれば,衝突手順をより効率的に行う方法もある。
ストレステストにより,障害物群集,騒音距離推定,遅延障害物情報の下での安全行動が変化することが示唆された。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:32:45 GMT)
Systematic Evaluation of the Quality of Synthetic Clinical Notes Rephrased by LLMs at Million-Note Scale [1.1] 大規模言語モデル(LLM)は、幅広い応用のために臨床テキストを生成または合成することができる。
本研究では,MIMICデータベースからLLM生成した臨床テキストを100万件単位の規模で体系的に評価することを目的とする。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:49:04 GMT)
Hardware-Software Co-Design of Scalable, Energy-Efficient Analog Recurrent Computations [1.1] 環境センサーからバイオメディカルインプラントまで、常にAIアプリケーションは、超低消費電力を必要とする。
アナログ回路はサブマイクロワット推論の経路を提供するが、既存のアナログ実装はフィードフォワードアーキテクチャに限られている。
この障壁は、ハードウェアとソフトウェアの共同設計によって克服可能であることを実証する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:42:07 GMT)
Presupposition and Reasoning in Conditionals: A Theory-Based Study of Humans and LLMs [1.1] 条件文の標準データセット上での人間の判断とLLM予測を比較した。
結果は,人間の判断に確率的・実用的手がかりが組み合わさっていることを示している。
人間の評価に最もよく適合するモデルは、コヒーレントな実用的推論を欠いていることが多い。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:08:20 GMT)
Randomized Advantage Transformation (RAT): Computing Natural Policy Gradients via Direct Backpropagation [1.0] 本稿では,直接バックプロパゲーションによるTikhonov-regularized natural policy gradientの推定手法を提案する。
我々は、この変換を、オンデマンドのミニバッチ上でランダム化されたブロック Kaczmarz 反復によって効率的に計算する。
我々は、RATの収束保証を提供し、連続的および視覚的制御ベンチマークで確立された自然な漸進的手法に適合するか、超越しているかを実証的に示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:05:36 GMT)
An Entropy-Governed Speedup for Quantum Algorithms on Local Hamiltonians [1.0] 一般の$k$ローカルハミルトニアンの低エネルギー推定と状態準備は、量子複雑性理論の基本的な課題である。
より高速な量子アルゴリズムは、すべての深さ$d$状態に対して最小エネルギーで束縛された量子状態を出力する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:36:43 GMT)
Instance Discrimination for Link Prediction [1.0] ノード表現の代わりにリンク表現に基づくL-GRACEとL-BGRLという2つの新しいモデルを導入する。
我々の主な貢献は、ノード表現の代わりにリンク表現に基づくL-GRACEとL-BGRLという2つの新しいモデルの導入である。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:27:41 GMT)
Rotational Quantum Tunneling of a Magnetic Dipole in a Superconducting Trap [1.0] 超伝導トラップに閉じ込められたナノマグネットの回転自由度の量子力学について検討した。
我々は,安息ガス散乱を低温における最も重要な脱コヒーレンス機構として同定した。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:23:53 GMT)
Discovering Data Encoding Strategies for Quantum-Classical Neural Networks Using Monte Carlo Tree Search [1.0] 量子機械学習(QML)は研究の関心を惹きつけているが、古典的なアプローチよりも実用的なメリットを提供するかどうかはまだ明らかではない。
我々はモンテカルロ木探索(MCTS)を用いて量子古典畳み込みニューラルネットワーク(QCCNN)のための最適なデータ符号化回路を発見する。
本研究は,QMLにおけるデータエンコーディングの実践的手法と,データエンコーディングの有効性に関する新たな知見を提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:21:42 GMT)
An Approximation Algorithm for Graph Label Selection [0.9] 標準予算制約の下でグラフラベル選択のための最初の$tildeO(log1.5 n)$-approximationアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:32:40 GMT)
The Hidden Cost of Contextual Sycophancy: an AI Literacy Intervention in Human-AI Collaboration [0.9] 大規模言語モデル(LLM)は、コラボレーションのためのインタラクティブなツールとして、教育環境においてますます使われている。
誤りがあってもユーザの信念と整合し、学習と意思決定に対する懸念を喚起する。
本研究では, サイコファンティックアライメントが, マルチターンヒトとAIの相互作用においてどのように現れるかを検討する。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:20:45 GMT)
Causely: A Causal Intelligence Layer for Enterprise AI A Benchmark Study on SRE and Reliability Workflows [0.9] 原因は、環境トポロジ、属性依存、因果関係の構造化された表現を維持する因果インテリジェンス層である。
我々は,24-microservice OpenTelemetry デモアプリケーションにおいて,インジェクト障害を伴う制御された環境下で実施したベンチマークにより,この価値提案を評価する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:45:02 GMT)
The QuaST Decision Tree: Achieving Automation With Data-Based Recommendations [0.9] 量子化アルゴリズムを開発するためのソフトウェアツールが成熟している。
エンドユーザーは、前処理、後処理、古典的および量子アルゴリズムの最良の組み合わせを選択するのを手助けする必要がある。
QuaST決定木は、モジュールネットワーク構造における個々の決定の組み合わせの複雑さを反映している。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:21:23 GMT)
HypergraphFormer: Learning Hypergraphs from LLMs for Editable Floor Plan Generation [0.9] 大規模言語モデル(LLM)を用いたハイパーグラフ表現の学習に基づくフロアプラン生成のための新しい手法を提案する。
提案手法は高い編集性を提供し,LLMによる設計指向に適していることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:00:29 GMT)
Information Processing Capacity of Stationary Physical Systems: Theory, Data-efficient Estimation Methods, and Photonic Demonstration [0.9] 我々は、Information Processing Capacityフレームワークを静止物理コンピューティングシステムに拡張する。
非線形光ファイバーを介して伝播するピコ秒レーザーパルスをベースとしたフォトニックコンピューティングシステムを用いて,この枠組みを実験的に検証する。
これらの結果は、物理コンピューティングシステムの力学と機械学習性能の実践的な橋渡しとしてIPCを確立している。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:13:52 GMT)
Internalizing Tool Knowledge in Small Language Models via QLoRA Fine-Tuning [0.8] 本稿では,ツールユース知識が小言語モデルに内在できるかどうかを考察する。
Gemma 4 E4BとQwen3-4Bを8ビットQLoRAで約1,700のツール使用例で微調整する。
提案手法では,ツールカタログを完全に省略する。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:48:46 GMT)
Prompt Compression in Diffusion Large Language Models: Evaluating LLMLingua-2 on LLaDA [0.8] 本研究では,LLMLingua-2を用いた拡散大言語モデル (DLLM) への高速圧縮転送が有効であるかどうかを検討する。
我々は,GSM8K,DUC2004,ShareGPTの圧縮性能を,約2$times$圧縮比でデータセット当たり250プロンプトを用いて評価した。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:39:10 GMT)
DAD4TS: Data-Augmentation-Oriented Diffusion Model for Time-Series Forecasting with Small-Scale Data [0.8] 本稿では,拡散モデルに基づく強化学習によるデータ拡張手法であるDAD4TSを提案する。
DAD4TSでは、データジェネレータは時系列モデルで同時に訓練され、強化学習モデルで制御される。
我々は従来のVAE法の代わりに数学的手法を用いて、時系列データを幾何学空間に投影することで拡散モデルを訓練する。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:19:13 GMT)
Benchmarking Commercial ASR Systems on Code-Switching Speech: Arabic, Persian, and German [0.8] コードスイッチングは、自動音声認識において最も困難で未研究の条件の1つである。
我々は、4つの言語ペアで5つの商用ASRプロバイダを評価するベンチマークを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:50:44 GMT)
Efficient coding along the visual hierarchy [0.8] 効率的なコーディングは、限られたデータから人間に沿った視覚的特徴の階層を構築することができることを示す。
効率的なコーディングと教師付き微調整を組み合わせたハイブリッド学習手法により、低データ設定での脳のアライメントが向上する。
これらの結果は、効率的な符号化が視覚階層全体にわたって表現を形作る可能性があることを示唆している。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:20:17 GMT)
From Detection to Response: A Deep Learning and Retrieval-Augmented Generation Framework for Network Intrusion Mitigation [0.7] 本稿では,脅威検出と行動応答のギャップを埋める統一的なエンドツーエンドフレームワークを提案する。
まず、独立に訓練された3つのバイナリディープニューラルネットワーク(DNN)のアンサンブルで、ネットワークトラフィックフローをBenign, Denial of Service(DoS)またはDistributed Denial of Service(DDoS)に分類する。
第2に、Retrieval-Augmented Generation (RAG)パイプラインは、トップ5の異常な機能から説明対応プロンプトを構築する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:17:55 GMT)
Efficient Fourier-Based Linear Combination of Unitaries and Applications in Quantum Optimization [0.7] 複雑な量子回路を近似する枠組みとして, アンシラフリーなユニタリ結合(LCU)について検討する。
フーリエに基づくLCU構造は, 対角および非対角ユニタリの広いクラスを効率的に分解することを示した。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:05:08 GMT)
Exploring Trust Calibration in XAI - The Impact of Exposing Model Limitations to Lay Users [0.7] 信頼度校正は、説明可能なAI(XAI)の安全な配置に不可欠である
本研究は,スキン・レシオン分類に関する事前登録,インセンティブ付研究である。
被験者は 固定XAIパネルを用いて 15件の症例評価を完了した。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:26:30 GMT)
Verify-Gated Completion as Admission Control in a Governed Multi-Agent Runtime: A Bounded Architecture Case Study [0.7] 制御されたマルチエージェントランタイムの入出力制御パターンとして,検証ゲート補完について検討する。
観測条件下では,読み取り専用検証ゲートとパケット化入力記録が検査可能で,フェールクロースされた。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:52:13 GMT)
Planner-Admissible Graph-PDE Value Extensions for Sparse Goal-Conditioned Planning [0.7] 演算argmin-Qプランナーの下で,どのグラフ値拡張がプランナー対応かを検討する。
ロールアウトに沿った代理値エラーが真のアクションギャップの半分以下である場合、greedyのロールアウトがゴールに達する。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:24:45 GMT)
Beyond Nutrition Labels: How Analogical Reasoning Shapes Synthetic Media Disclosure Design [0.7] 本研究では,複雑な社会技術的制約の下で,AI政策立案者や実践者が合成メディア開示をいかに設計するかを検討する。
発見は、栄養ラベルからProp 65警告まで、類似の推論の役割を強調している。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:10:22 GMT)
Shaping the Prior: How Synthetic Task Distributions Determine Tabular Foundation Model Quality [0.7] O'Prior(O'Prior)は、以前に4つの結合成分を中心に構築された構成的リアリズムである。
O'Priorは、実際のベンチマークにおける精度と堅牢性において、一貫性と実質的な改善をもたらす。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:45 GMT)
A No-Defense Defense Against Gradient-Based Adversarial Attacks on ML-NIDS: Is Less More? [0.7] 本稿では,DNN(Deep Neural Network)に基づくネットワーク侵入検知システム(NIDS, Network Intrusion Detection Systems, NIDS)について検討する。
より浅いネットワーク, 機能セットの削減, ReLU の活性化が一貫して行われ, 対人的脆弱性の軽減が図られている。
このレシピに従う単純なモデルは、ほぼ完璧なクリーン・トラヒック検出と低いトレーニング時間を維持しながら、より深く、完全に機能する敵の訓練されたモデルより優れています。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:10:08 GMT)
Fibonacci many-body scars in a decorated Rule-54 quantum cellular automaton [0.6] 量子多体傷は、弱いエルゴディディディティ破壊の制御された形態を提供する。
本稿では,ルール54量子セルオートマトン固有のソリトン構造に基づいて,正確な傷点に量子ビットレベルの経路を導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:32:06 GMT)
On the Geometric Limits of Transformer Defenses against Obfuscation Attacks: Latent Embedding Collapse & Performance Robustness Gap [0.6] 高い検出性能は表現力を示すものではないことを示す。
その結果,深度とキャパシティの異なる複数のBERTファミリーエンコーダにまたがって,検出器がほぼ完璧な分類性能を達成できることが示唆された。
難解な埋め込みは、さらに高いクラス内分散(3.33 +/- 6.23)を示し、高い性能にもかかわらず重い潜伏空間不安定を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 22:25:47 GMT)
PIPER: Content-Based Table Search via profiling and LLM-Generated Pseudoqueries [0.6] 既存のデータセット検索システムは、主にメタデータに依存しており、しばしば不完全または低品質である。
本稿では,テーブルプロファイルとLLM生成クエリを組み込んだコンテンツ駆動型検索手法PIPERを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:39:42 GMT)
Transfer Learning for Customized Car Racing Environments [0.6] 深層強化学習の立場からトランスファーラーニングを探求する。
具体的には,OpenAIのカーレース環境において,高速ラップタイムを実現するためにトランスファーラーニングを利用したいと考えています。
モデルベースアプローチとモデルフリーアプローチのパフォーマンスを比較し、モデルベースアプローチが性能を支配し、この環境におけるモデルフリーアプローチよりも高速に収束することを観察する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:37:49 GMT)
The impact of observation density on Bayesian inversion of latent dynamics in shock-dominated flows [0.6] スパースおよびノイズ測定による衝撃支配圧縮性流れの未知の初期状態の推測は、困難な逆問題である。
本研究では,不確実性を伴うベイズ初期状態の効率的なインバージョンのための非侵襲的低次モデリングフレームワークを開発する。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:05:52 GMT)
CommitDistill: A Lightweight Knowledge-Centric Memory Layer for Software Repositories [0.6] ソフトウェアは、コミットメッセージ、プルリクエストの議論、スレッド発行に大量の構造化されていない知識を蓄積します。
エージェントのタイプメモリアーキテクチャ(MemGPT、生成エージェント、YangらのPlugMemモジュール)に関する最近の研究は、エージェントメモリは生の対話テキストではなく、蒸留された型付き知識であるべきだと主張している。
私たちは、決定論的、依存性なし、ローカルのみ、埋め込みなしという制約のある体制の下で、ソフトウェアリポジトリ自身のgit履歴にそのスタンスを適用します。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:14:28 GMT)
Prompt Optimization for LLM Code Generation via Reinforcement Learning [0.6] 大規模言語モデル(LLM)は自然言語からコードを生成することができるが、その性能は素早い定式化に敏感である。
逐次的意思決定問題として改良を促進させる強化学習に基づくフレームワークを提案する。
CodeT5+,CodeLLaMA,DeepSeek-Coder を用いて,MBPP+,HumanEval+,APPS上のフレームワークを凍結コードジェネレータとして評価した。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:42:23 GMT)
Data-Driven Dynamic Modeling of a Tendon-Actuated Continuum Robot [0.6] 本稿では,データ駆動型システム識別手法の比較研究を行い,N4SID,ARX,SINDYcを用いて,腱作動型連続体ロボットのモデリングを行う。
関節の数が多すぎるにもかかわらず、実験により、自由度2自由度力学モデルがシステム力学を正確に捉えることができることが明らかになった。
モデルは実験データに対して検証され、モデル予測コントローラの設計に使われ、リアルタイム制御の可能性を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:50:22 GMT)
Modality vs. Morphology: A Framework for Time Series Classification for Biological Signals [0.6] 波形構造と方法論的設計を結合する統一型モルフォロジー-モダリティフレームワークについて紹介する。
脳波、筋電図、心電図、光胸腺撮影、眼球運動を解析することにより、形態学がどのように前処理とモデリング戦略を決定するかを実証する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:36:05 GMT)
Discoverable Agent Knowledge -- A Formal Framework for Agentic KG Affordances (Extended Version) [0.5] 20年前、セマンティックWebサービスコミュニティは、異なる存在論的コミットメントを持つエージェントがWebサービスを一貫性を持って発見し、構成し、呼び出す方法について質問された。
4次元の形式的なフレームワークで知識グラフの設定について、これらの洞察を再検討し、拡張する。
我々は, エージェント計画時のKG選択, 組成, 故障診断を可能にする, VoID および DCAT 上の意味層である Agentic Affordance Profile (AAP) を導出する。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:26:13 GMT)
Geometry-Lite: Interpretable Safety Probing via Layer-Wise Margin Geometry [0.5] 層間の安全証拠がどのように形成されるのかは定かでないが、どの層が低い偽陽性の決定を支持し、どの幾何学的バイアスがベンチマークシフトの下で安定であるかは定かではない。
我々は,各層の最終プロンプトトーケン表現を,センタロイド,局所近傍,および教師付き線形有界読み出しの下で符号付きマージンにマッピングするコンパクトなプロンプトレベルプローブGeometry-Liteを紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:12:24 GMT)
CMAG: Concept-Scaffolded Retrieval for Marketplace Avatar Generation [0.5] メタバースプラットフォームは、アバターを個別に分類された3D資産から組み立てるクリエーター主導の市場に依存している。
マーケットプレース生成のための概念スキャフォールド検索および検証済み合成フレームワークである textbfCMAG を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:21:43 GMT)
How Good LLMs Are at Answering Bangla Medical Visual Questions? Dataset and Benchmarking [0.5] バングラ語は世界中で最も広く話されている言語の一つだが、MedVQAベンチマークは確立されていない。
臨床的に検証された画像-問合せ対からなるデータセットであるBanglaMedVQAを紹介する。
分析の結果,Banglaの性能は著しく低下しており,低リソース言語に固有の課題を反映していることがわかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:20:32 GMT)
Counting Machine Parts [0.5] 本報告では, 洗濯機部品のカウント問題について検討する。
我々の技術はFamNetの拡張であり、与えられたデータセットでトレーニングされた損失コンポーネントを追加します。
実物体数とモデル出力との間の平均絶対誤差(MAE)とルート平均正方誤差(RMSE)を計算し,これらのアルゴリズムの性能を評価する。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:09:37 GMT)
Structural $f$-divergence: Tight universal bounds for cost function moments and gradients in parameterized quantum circuits [0.4] パラメータ空間上の確率分布間の対称な$f$-divergenceベースの測度である構造的$f$-divergenceを導入する。
BPとコスト集中を回避するための確率測定条件と,ノイズによる偏差を抑制する十分な条件を導出する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:41:01 GMT)
Estimating Item Difficulty with Large Language Models as Experts [0.4] 本研究は,3つの既成言語モデルを,応答データにアクセスできることなく,新たに作成された項目のラベル付けが困難であるとして評価した。
この調査では、判断形式(絶対対対ペア)、決定型(ハードな決定対トークン確率に基づく見積もり)、そして戦略の推進という3つの要因を横断する完全な因子的設計が用いられた。
LLMをベースとした評価では, 実験項目の難易度と中程度から強い正の相関が認められた。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:42:13 GMT)
Conditional Predictive Inference for General Structured Data with Group Symmetries [0.4] C-SymmPIは、グループ対称性を持つ一般的なデータ構造の下で、ほぼ条件付きカバレッジを実現するフレームワークである。
マルチ精度の緩和に着想を得た本手法では,条件付きカバレッジをユーザ指定関数クラス上の誤発見エラーとして再検討する。
計算効率向上のために,高次元観測のための投影型アルゴリズムと,大群あるいは無限群のサンプリング型アルゴリズムの2つの変種を開発した。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:41:20 GMT)
One pure steered state implies Einstein-Podolsky-Rosen steering [0.4] 少なくとも1つの純粋なステアリング状態が認められる2ビットの絡み合った状態は、アリスからボブへのステアリング可能なアインシュタイン=ポドルスキー=ローゼンであることが示される。
したがって、任意の2ビットの絡み合った状態の場合、一方の当事者が他方を少なくとも一方の純粋な状態に操ることができれば、その状態は双方向のECPステアリング可能である。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:38:53 GMT)
Be Kind, Rewrite: Benign Projections via Rewriting Defend Against LLM Data Poisoning Attacks [0.4] 我々は、データ中毒攻撃に対する積極的な防御手段として、オープンブックベニグのサンプルであるオープンブックベニグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグナグ
OBBRの安全性は,最先端のBAディフェンスと比較して平均51%向上し,クローズドブックリライト法に比べて25.7%向上した。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:56:36 GMT)
When Outcome Looks Right But Discipline Fails: Trace-Based Evaluation Under Hidden Competitor State [0.4] アウトカムのみの評価は経済的に安全でないエージェントを認定することができる。
隠れた競合状態のホテル料金では、学習者はルールベースの収益管理政策の利率規律を保ちつつ、利用可能な部屋当たりのもっともらしい収入を達成することができる。
トレースに基づく評価パラダイムである規律安定性を導入する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:58:34 GMT)
Stochastic Penalty-Barrier Methods for Constrained Machine Learning [0.3] 制約付き機械学習は、一般的な重要トレーニング、物理ニューラルネットワーク、シンボリックドメイン知識の統合を可能にする。
公平性にもかかわらず、We-は複数の双対ペナルティ法実験を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:26:26 GMT)
Cryogenic Time-Division-Multiplexed Voltage Control for Scalable Trapped-Ion Quantum Processors [0.3] トラップイオン量子コンピュータは、キュービット当たり10個のトラップ電極の順序を必要とする。
トラップ電極の時間分割多重化(TDM)に基づく電圧制御は、この制約を緩和するための自然な経路を提供する。
2つの電極クラスに対して,TDMに基づく電圧制御方式を開発し,低温的に検証する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:56:59 GMT)
Domain Incremental Learning for Pandemic-Resilient Chest X-Ray Analysis [0.3] 本研究では,リプレイに基づくドメイン増分連続学習手法を提案する。
提案手法は,制約メモリ内でのバランスの取れたクラス表現を維持するために,クラス認識のバランスの取れたリプレイを組み込む。
ドメインシフトしたPneumoniaMNISTデータセットを用いて行った実験は、提案手法が平均精度88.66%を達成することを示した。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:16:48 GMT)
AI4BayesCode: From Natural Language Descriptions to Validated Modular Stateful Bayesian Samplers [0.3] 我々は、自然言語モデル記述を実行可能で検証可能なMCMCサンプルに翻訳するシステムであるAI4BayesCodeを紹介する。
信頼性を向上させるため、AI4BayesCodeでは、モデルをモジュール化されたサンプリングブロックに分解し、各ブロックを組み込みのサンプリングコンポーネントにマップするモジュール設計を採用している。
我々は、AI4BayesCodeが自然言語記述のみから幅広いベイズモデルを実装することができることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:31:24 GMT)
Improving BM25 Code Retrieval Under Fixed Generic Tokenization: Adaptive q-Log Odds as a Drop-In BM25 Fix [0.3] 凍結したジェネリックトークン化の下で、BM25インデックスは、実行者が制御しないアナライザを持つサーチシステムによって構築されている。
我々は、Robertson-Sprck-Jones 奇数の外対を q-logarithm で置き換える。
トークン化器のアブレーションは、識別子を意識したトークン化がq-IDFからのインクリメンタルなゲインを大幅に取り除くことを示している。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:41:01 GMT)
Embedded ConvNet Ensembles: A Lightweight Approach to Recognize Arabic Handwritten Characters [0.3] 本研究では,軽量な組込みConvNetモデルとアンサンブル学習手法の組み合わせを提案する。
AHCRのベストプラクティスを特定するために実験を行った。
その結果、組込みモデルは、より重いアーキテクチャに匹敵する、あるいは超える精度を達成できることが示された。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:47:23 GMT)
Non-Gaussianity of random quantum states [0.3] 典型的量子状態におけるフェルミオン非ガウス性について研究し、大域的な$U(1)$対称性の有無にかかわらず、量子ビットのハールランダム状態に焦点をあてる。
還元密度行列とガウス化行列の間の相対エントロピーとして定義される非ガウス性の解析的予測を導出する。
これらの結果は、ランダム状態におけるフェルミオン非ガウス性(英語版)の典型的なスケーリングを確立し、これが大域対称性の存在によってどのように修正されるかを分析する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:05:19 GMT)
Causal Fisher-Information Inequalities: Classical Causal Model Falsification and Metrological Advantage [0.3] 本研究では,非古典的気象学的行動の運用証人として,漁業情報不平等が有効であることを示す。
実験が古典的な因果モデルを受け入れると仮定すると、それに対応するフィッシャー情報は因果的フィッシャー情報不等式(CFII)に従わざるを得なくなる。
古典的なパス A to C to B$ を通じて伝播する加法的因果パラメータに対して、逆フィッシャー情報は情報抵抗として振る舞う。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:56:35 GMT)
Subtle Injection for Ground-truth Inference of LLM Training Data [0.3] SIGILは、認識不能なEmphcanary Sequenceを保護されたテキストとコードに埋め込むフレームワークである。
SIGILは、語彙規則、語彙句、構文、意味、コードパターンの5つのカナリア戦略を定義している。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:48:44 GMT)
pyforce-1.0.0: Python Framework for data-driven model Order Reduction of multi-physiCs problEms [0.3] pyforceは、マルチ物理問題へのアプリケーションのためのデータ駆動リダクションオーダーモデリング技術を実装するPythonパッケージである。
このパッケージはROSE(Reduced Order Modelling with data-driven technique for multi-physics problEms)の一部である。
pyforceは、メッシュインポート、計算積分、結果の視覚化のバックエンドとしてpyvistaを使って完全に書き直された。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:58:59 GMT)
Threats to Arabic Handwriting Recognition: Investigating Black-Box Adversarial Attacks on embedded ConvNet models [0.3] 本研究は、敵のブラックボックス攻撃に対するハイパフォーマンスモデルの脆弱性を実証する。
アラビア文字を含む2つのベンチマークAHRデータセットで実験を行った。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:45:16 GMT)
Reinterpreting Safety Thresholds as Neuron Spiking Thresholds [0.2] 本研究は,SSM閾値の生物学的にインスパイアされた再解釈を提案する。
これは、複数のSSM入力をスパイクニューラルネットワーク(SNN)に組み合わせた、漏れた統合火災(LIF)ニューロンのスパイクしきい値としてモデル化される。
SNNは人間のブレーキオンセットに合わせたスパイクを発生させるよう訓練されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:11:57 GMT)
Ancient Greek to Modern Greek Machine Translation: A Novel Benchmark and Fine-Tuning Experiments on LLMs and NMT Models [0.2] 我々はAG-MG Parallel Corpusを132,481対の文列を持つ新しいリソースとして紹介する。
ウェブスクラッピングされた抜粋レベルのデータと多段階の文レベルのアライメントを組み合わせた新しいコーパス生成パイプラインを提案する。
本研究は,3つの微調整戦略の評価を行い,最新のMTモデルの総合ベンチマークを行った。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:56:44 GMT)
PySIFT: GPU-Resident Deterministic SIFT for Deep Learning Vision Pipelines [0.2] DSPマルチスケールプールを用いた古典SIFTは,神経記述子や配向置換よりも優れていた。
In this present PySIFT, a first fully GPU-resident SIFT, implemented in CuPy/Numba kernels with DLPack zero-copy handoff to downstream DL framework。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:24:55 GMT)
Optimising CSRNet with parameter-free attention mechanisms for crowd counting in public transport [0.2] スマートで効率的な公共交通機関を設計する上で、職業推定と群集カウントは重要な課題である。
本稿では, 混雑したシーンにおける群集カウントと密度マップ推定におけるパラメータフリーアテンション機構の有効性について検討する。
ShanghaiTechデータセットの実験では、パラメータフリーのアテンションメカニズムが、追加のモデルパラメータを導入することなく、同等または優れた精度を達成することを示した。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:07:29 GMT)
Bidirectional Optical sensors for Actuation Tracking (BOAT) in soft lattice systems [0.2] 楕円形状に配置された2つのパターン導波路に基づく新しい光学センサを提案する。
本発明の双方向運動追跡用光学センサ(BOAT)は、埋め込み空気圧人工筋肉によって作動される格子構造とシームレスに共印刷される。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:34:49 GMT)
LegalCheck: Retrieval- and Context-Augmented Generation for Drafting Municipal Legal Advice Letters [0.2] LegalCheckは、異議回答書の起草を自動化する新しいシステムである。
法律上の一貫性と事実の正確性を維持しつつ、数時間ではなく数分で準決勝のアドバイスレターを生成する。
法律専門家は、このシステムが作業負荷を削減し、法標準の一貫性のある適用を確実にすることを発見した。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:57:26 GMT)
The NetMob26 Dataset: A High-Resolution Multi-Source View of Public Bus Mobility in Niterói [0.2] NetMob Data ChallengeはNiteriから包括的な公共交通機関データセットをリリースしている。
2026年3月の運用記録に基づいて、このデータセットはバスからのGPSテレメトリ、約720万のチケット取引、補助交通データ(ルート、停留所、天候)、都市インフラと社会デコグラフィー情報という4つの主要な情報源を組み合わせたものである。
このデータセットは、公共交通機関の効率性、需要予測、アクセシビリティ分析、サービスの信頼性、気象などの外部要因が都市移動に与える影響などの研究を支援する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:30:19 GMT)
Agentic Chunking and Bayesian De-chunking of AI Generated Fuzzy Cognitive Maps: A Model of the Thucydides Trap [0.1] テキストからフィードバック因果ファジィ認知マップ(FCM)を生成し、計算モデルエージェントにテキストを重なり合うチャンクに分割するように教える。
チャンクFCMは依然として混合され、新しいFCM因果知識グラフを形成している。
これらの混合技術は、アリソンの『Thucydides Trap』モデルのエッセイテキストで、アメリカ合衆国のような支配的な勢力と中国のような上昇する勢力との間の対立を実証する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:07:49 GMT)
Topologically protected long-range correlations in steady states of driven-dissipative bosonic chains [0.1] 我々は、単値分解(SVD)を介して、駆動散逸系の位相位相とボゾン相関を結びつけるフレームワークを開発する。
非エルミート位相の直接的シグネチャとして周波数分解相関を確立させるため,位相増幅は定常状態相関における乱れの長距離秩序を誘導することを示した。
これらの発見は、非エルミート系における量子センシングと相関工学の新しい道を開く。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:40:52 GMT)
Universal Jaynes-Cummings Control of an Oscillator [0.1] ジャイネス・カミングス相互作用(Jaynes-Cummings interaction)は量子光学の基本的相互作用であり、空洞量子力学、閉じ込められたイオン、機械共振器、超伝導回路などのプラットフォームで実現されている。
ここでは、任意のユニタリゲートをJC相互作用とキュービット回転のシーケンスにコンパイルすることで、普遍的なJCベースの発振器制御を開発し、実験的に実証する。
その結果、Jaynes-Cummings制御はユニバーサル発振器制御への実践的な経路として確立され、様々な量子プラットフォームにわたってプログラム可能なボソニックプロセッサが実現された。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:04:49 GMT)
KIT-TIP-NLP at MultiPride: Continual Learning with Multilingual Foundation Model [0.1] このフレームワークは、データ不足、クラス不均衡、感情表現の言語間変異といった、相互に絡み合った3つの方法論的課題を処理する。
クロスバリデーションによるデータ駆動モデル選択、バックトランスレーションによるセマンティック保存強化、動的エポックレベルのアンダーサンプリングによるインダクティブトランスファー学習、ドメイン固有の知識注入を統合する。
RUN 1 は拡張とアンダーサンプリングによる帰納的伝達学習であり、RUN 2 はマスク付き言語モデリング事前学習、RUN 3 と RUN 4 は ROC 分析によって最適化された言語固有の決定しきい値によって改善された以前の予測である。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:36:02 GMT)
Quantum Emitters at Telecommunication Wavelengths based on Carbon Defects in Transition Metal Dichalcogenides [0.1] 低次元の物質が量子エミッタの有望なホストとして出現している。
WS2, WSe2, MoS2, MoSe2二層膜中のカルコゲン部位(S, Se)の置換炭素欠陥について検討した。
本研究は, カーボンドープTMD二層膜を室温欠陥型量子エミッタのための有望なプラットフォームとして確立した。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:55:50 GMT)
Enhancing Train-Free Infinite-Frame Generation for Consistent Long Videos [0.1] 列車なしの長ビデオ生成は、基礎的なビデオ生成モデルがより長いビデオを生成することを可能にすることを目的としている。
フレームレベルの自己回帰フレームワーク、例えばFIFO拡散は、一定のメモリ消費で無限に長いビデオを生成する利点を提供する。
我々は,新しい無限フレーム長ビデオ生成法である textbfMIGA を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:28:45 GMT)
Infini-News: Efficiently Queryable Access to 1.3 Billion Processed Common Crawl News Articles [0.0] 我々は2016年8月から最新のスナップショットまで,CC-Newsアーカイブ全体の検索ツールキットとインデックスを提示する。
まず、テキストを抽出し、クリーン化し、1.35億以上の記事の構造化メタデータを解析する。
第二に、3つのフロンティア言語分類器を用いた言語検出でコーパスを豊かにする。
第三に、Infini-gram indexs: suffix-array structure that researchers can search the full archive for arbitrary text pattern in sub-second time。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:52:14 GMT)
Learning to Look Benign: Targeted Evasion of Malware Detectors via API Import Injection [0.0] 機械学習ベースのマルウェア検出装置は、アンチウイルスやエンドポイント検出システムに広くデプロイされている。
本稿では,マルウェアサンプルを特定の良性ソフトウェアカテゴリに意図的に分類できるかどうかを検討する。
本稿では,デコーダを厳密に付加した条件変分オートエンコーダ(CVAE)を中心としたフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:32:45 GMT)
Bridging the Version Gap: Multi-version Training Improves ICD Code Prediction, Especially for Rare Codes [0.0] ICD版に注釈付きデータを組み合わせることで、バージョンに依存しないモデルをトレーニングできるかどうかを検討する。
ICD-10予測のための修正ラベル対応アテンションモデルのトレーニングにICD-9データを追加し、バージョンミスマッチにもかかわらず、ICD-9は18KのレアICD符号に対して27%のマイクロF1増加をもたらすことを発見した。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:19:29 GMT)
Generalized Hydrodynamics of Bloch Oscillations in the Absence of a Lattice [0.0] 積分可能な量子気体のパラダイムモデルにおいて,格子が存在しない場合のブロッホ振動現象について検討する。
この結果は、制御可能な密度で不純物を生成できる超低温原子実験に関係している。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:04 GMT)
What Matters for Grocery Product Retrieval with Open Source Vision Language Models [0.0] 本稿では,GroceryVision Challenge の MPR タスクにおいて,190個のオープンソース VLM のゼロショット評価を行った。
生のWebスクレイプからフィルタリングデータセットへの切り替えは、最大16.6%の精度向上をもたらす。
最先端モデルは94.5%のRecall@5を達成するが、Recall@1では17.5%の低下を被り、対照的な埋め込みはクラスタカテゴリを効果的に活用するが、視覚的に類似したSKUをランク付けすることができないことが明らかになった。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:20:13 GMT)
Wasserstein bounds for denoising diffusion probabilistic models via the Föllmer process [0.0] 本稿では,2-ワッサーシュタイン距離における拡散確率モデル(DDPM)のサンプリング誤差境界について検討する。
我々は, 段数と段数の両方で最適である鋭い上界を確立し, 文献で得られたいくつかの鋭い誤差境界を復元する。
本分析は,従来の逆Ornstein-Uhlenbeck法ではなく,Fllmer法を離散化したものである。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:52:09 GMT)
VectraYX-Nano: A 42M-Parameter Spanish Cybersecurity Language Model with Curriculum Learning and Native Tool Use [0.0] VectraYX-Nanoは、41.95Mパラメータのデコーダのみの言語モデルで、スクラッチから訓練されたスペイン語でサイバーセキュリティを提供する。
クラウドコンピューティングの25ドルで8VMの分散パイプラインで組み立てられた170万のスペインのコーパスは、3つのカリキュラムフェーズ(会話42M、サイバーセキュリティ118M、攻撃ツール10M)に分けられる。
SFT (loss 1.74) の後、v2 ブートストラップ-アブレーション参照は 0.775 +/ の会話ゲートを得る。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:24:08 GMT)
Vector RAG vs LLM-Compiled Wiki: A Preregistered Comparison on a Small Multi-Domain Research [0.0] シングルラウンドベクトルRAGシステムとLCMコンパイルされたマークダウンwikiを比較した。
どちらのシステムも、同じ回答生成モデルを使用して、24の論文で同じ13の質問に答えた。
wikiは、論文間の発見を繋ぐのがはるかに優れているが、回答組織におけるその優位性は、審査の調整後に強くなかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:41:16 GMT)
Towards Ubiquitous Mapping and Localization for Dynamic Indoor Environments [0.0] 動的屋内環境におけるリアルタイムマッピングとローカライゼーションのための革新的なソリューションとして,UbiSLAMを提案する。
固定RGB-Dカメラのネットワークをワークスペース全体に戦略的に展開することで、UbiSLAMは従来のSLAMシステムでよく見られる制限に対処する。
我々は,最適なカメラ配置と配向のための自動校正や,リアルタイムデータ共有のための通信プロトコルの強化など,潜在的な解決策について議論する。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:28:23 GMT)
Toward an AI-Powered Computational Testbed for Workforce Policy [0.0] 人工知能の知識労働への統合は、現在、世界の労働力の大部分に影響を与えています。
この予測インフラストラクチャの確立は、AIに関わる現在のグローバルな労働力を管理する上で、重要な技術的要件である、と私たちは主張する。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:41:31 GMT)
Tokenizer Fertility and Zero-Shot Performance of Foundation Models on Ukrainian Legal Text: A Comparative Study [0.0] トケナイザーの出生率は、ウクライナの法文に基づく基礎モデルの1.6倍である。
Qwen 3モデルは同一入力上のLlamaファミリーモデルよりも60%多くトークンを消費する。
パフォーマンスは最大26ポイント低下する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:33:19 GMT)
The Ephemeral Web and the Case for Proactive Archiving [0.0] 本稿は,少数の専門家が実践するニッチな活動は継続すべきではない,と論じる。
私はパキスタン大使館国際学校とテヘラン大学のケーススタディを通じて、この主張を動機付けています。
PythonとGitHub Actionsを使用して、サイトのページとメディアをInternet ArchiveのWayback Machineに送信する、軽量な自動アーカイブシステムを構築し、デプロイしました。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:10:32 GMT)
Task-Aligned Self-Supervised Learning for Medical Image Analysis: A Systematic Review and Practical Design Guidelines [0.0] 自己教師付き学習は、医用画像のアノテーションボトルネックに対処するための有望なパラダイムとして登場した。
医療画像におけるSSLの体系的,タスク指向のレビューを報告する。
プレテキスト・タスクの定式化が,分類,セグメンテーション,検出,その他のタスクのパフォーマンスにどのように影響するかを検討する。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:47:50 GMT)
TRACE: Trajectory Correction from Cross-layer Evidence for Hallucination Reduction [0.0] 幻覚低減のための多層エビデンスからの軌道補正について紹介する。
各入力のクロス層候補軌道から補正層と適切な補正演算子の両方を導出することにより、推定時の幻覚を補正する。
15のモデル、8のモデルファミリー、3のファクトリティベンチマークで、単一の普遍的アルゴリズムとして評価された。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:08:09 GMT)
Surviving the Unseen: Predictive Defense for Novel Multi-Turn Multimodal Attacks [0.0] 本稿では,動的生存予測と軌道力学問題として安全検証を定式化する。
マルチモーダルおよびマルチターン対話フローを連続軌道としてマッピングする予測モデルとして,トリプル層異常防御(TRIAD)フレームワークが提案されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:06:20 GMT)
SurgicalMamba: Dual-Path SSD with State Regramming for Online Surgical Phase Recognition [0.0] オンライン外科的位相認識(SPR)は、コンテキスト対応の手術室システムを支える。
我々は,Mamba2の構造的状態空間双対性(SSD)に基づいて構築された因果SPRモデルであるO(d)について述べる。
7つの公開SPRベンチマークで、OssageMambaは、厳格なオンライン評価の下で最先端の精度とフェーズレベルのJaccardに達した。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:24:40 GMT)
Structural Analysis of Cryptographic Sequences using Stringology-Based Fingerprinting [0.0] 本稿では,暗号シーケンスの構造解析のための文字列ベースフィンガープリント(SBF)フレームワークを提案する。
提案したSBFフレームワークは、暗号出力をシンボル文字列として解釈し、パターンベースの特徴抽出を用いて構造統計をキャプチャする。
その結果, 弦学に基づくパターン解析により, 異なる配列源にまたがる測定可能な構造的シグネチャが明らかになった。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:19:08 GMT)
Strong nanomechanical Duffing nonlinearity and interactions induced through cavity optomechanics [0.0] ナノメカニカル共振器において,光レーザ駆動によって完全に制御された強い機械的非線形性を実現するためのアプローチを実験的に実証した。
結果として生じるダッフィングの非線形性は、ポンプレーザーによる強度調整に便利であり、その符号はレーザーデチューニングによって制御される。
これらの結果は共振器やネットワークにおける非線形力学の工学的応用のための多目的かつその場で再構成可能なプラットフォームとしてキャビティ光学を確立している。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:17:00 GMT)
Strategy optimization for quantum conference key agreement in asymmetric star networks [0.0] 我々は,複数のクライアントが接続する中央局を持つネットワークにおいて,GHZ状態に基づく量子会議合意プロトコルを解析する。
包括的数値シミュレーションを用いて、パーティ数、メモリ数、中央駅からの非対称距離といったシナリオの微妙な変化が、プロトコルの性能に大きく影響するかを考察する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:18:23 GMT)
Speed Kills: Exploring Confused Deputy Attacks Through Edge AI Accelerators [0.0] AIアプリケーションの需要が高まり、エッジや組み込みデバイスにAIアクセラレータ(AIAs)が広く採用されている。
AIAはオペレーティング・システム(OS)の制限に縛られておらず、アプリケーション・プロセッサ(AP)のセキュリティ機構に制限がある。
本研究はAIAを用いた混乱した副攻撃の詳細な研究である。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:04:51 GMT)
SomaliWeb v1: A Quality-Filtered Somali Web Corpus with a Matched Tokenizer and a Public Language-Identification Benchmark [0.0] ソマリ語は、2500万人の話者を持つアフリカのホルン族のクシ語族である。
既存のソマリ文字は多言語分布(HPLT v2, CC100, MADLAD-400, OSCAR, mC4)内か、Hugging Faceにアップロードされた小さなソマリ文字のみである。
上流3つのソースから構築された819,322の文書(303Mトークン)からなる高品質なソマリコーパスであるSomaliWeb v1を紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:28:03 GMT)
SocialMemBench: Are AI Memory Systems Ready for Social Group Settings? [0.0] AIアシスタントのメモリシステムは、シングルユーザー対話用に構築され、マルチパーティのソーシャルグループ設定に適用した場合、特徴的にフェールする。
既存のメモリベンチマークでは、ダイアディックや職場での対話が評価されている。
人工ソーシャルグループネットワークのベンチマークであるSocialMemBenchを紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:11:48 GMT)
Signatures of quantum noise in the operation of Deutsch's algorithm [0.0] 本研究では, 環境の量子特性が, 量子コンピュータ上で得られる結果にどのように現れるかを検討する。
いずれの場合も、アルゴリズムを1回実行すれば同じ効果が得られるが、アルゴリズムを2回実行すると大きな差が生じる。
導出の仮定にかかわらず予測された効果を完全に再現するIBM Quantumプロセッサの1つで得られた結果について述べる。
論文参考訳(メタデータ) (Mon, 18 May 2026 19:13:03 GMT)
Signatures of Gaussian superconducting fluctuations in nonlocal noise magnetometry [0.0] ガウス超伝導のゆらぎから生じる2点の磁気ノイズスペクトルを計算する。
信号は高温超伝導体で最強であると期待されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:43 GMT)
Shortcut-error signatures in coherence-retaining endpoint work quasistatistics [0.0] コヒーレンス保持エンドポイントワーク準統計学は、ショートカット・トゥ・アディバティティティ性能のコンパクトなプローブを提供する。
非可換制御誤差は、誤差振幅の1次で対角方向の引き戻しハミルトン素子を生成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:10:33 GMT)
Shared Backbone PPO for Multi-UAV Communication Coverage with Connection Preservation [0.0] Actor と Critic のネットワーク間でベースモジュールを共有することで,アルゴリズムは効率的なトレーニングと性能向上を実現する。
エージェント間の通信条件を満たすために、グラフ情報集約モジュールをモデルアーキテクチャに組み込む。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:53:01 GMT)
Sequential Structure in Intraday Futures Data: LSTM vs Gradient Boosting on MNQ [0.0] 5分間のOHLCVバーシーケンスが、単一の楽器データセットのスケールで、活用可能な逐次予測構造を含むかどうかを検証した。
2021-2025年から944日間の取引日を用いて、4つのモデル構成を厳密な伸縮式ウォーキングフォワード検証の下で評価した。
51.8%のベースレートよりも統計的に重要なサンプル外精度を生み出す構成は存在しない。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:03:28 GMT)
Sequential Consensus for Multi-Agent LLM Debates: A Wald-SPRT compute governor with calibration-based failure detection [0.0] マルチエージェントの議論は事実と推論を改善するが、ほとんどのレシピは固定されたラウンドカウントを選択する。
我々は,LLM討論のプラグイン計算として,Wald's Sequential Probability Ratio Test (SPRT)を適用した。
GSM8Kでは、ルールは1.01ラウンド(4.06 LLMコール)で97.0%の精度で終了するが、15回のコールで固定5の討論では99.0%の精度で終了する。
MMLUでは、キャリブレーションされたKLは約0に崩壊し、ルール上限は2.1倍のコストで99.5%となる。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:43:12 GMT)
Scalar$-$Tensor Gravity as a Probe of Generalized Black Hole Entropy [0.0] 我々は、一般化されたブラックホールエントロピー汎函数の幅広いクラスを幾何学的に実現する。
結果のモデルでは、スケール依存の効果的な重力結合が特徴である。
この分析は、情報$$$理論のエントロピーの提案と重力場理論の間の統一的かつ幾何学的に基底化された接続を確立する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:30:35 GMT)
Scalable Single-Step Generation of W States in 2D Superconducting Qubit Lattices [0.0] マルチキュービットの絡み合いは、大規模量子情報技術の前提条件である。
任意の大きさの格子に1つの励起をコヒーレントに分配する高速で堅牢な演算の集合を実演する。
次に、最大7量子ビットの鎖に絡み合うようにプロトコルを拡張し、264 nsで生成される最大のW状態は79.6$pm$1.3%である。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:09 GMT)
SAGA: A Sequence-Adaptive Generative Architecture for Multi-Horizon Probabilistic Forecasting with Adaptive Temporal Conformal Prediction [0.0] 本稿では,デコーダのみの変換器SAGAを提案する。
1990年から2022年にかけて,2,143,817人,61,284,903人からなる長手スウェーデン LISA レジスターをトレーニングした。
SAGAは10年の地平線で31.9%、20年の地平線で37.7%の絶対誤差を減少させる。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:35:20 GMT)
Robust Player-Conditional Champion Ranking for League of Legends: Style Similarity, Mastery Priors, and Archetype-Constrained Discovery [0.0] 我々は,リーグ・オブ・レジェンドにおけるチャンピオン推薦を,スパース,ノイズ,非定常行動データに基づく解釈可能な,条件付きランキング問題として定式化する。
提案するフレームワークは、4つの情報ソース – 人口密度プロキシ、プレイヤースタイルの類似性、直接および間接的な熟達前、およびアーチタイプレベルのガードレール – を組み合わせている。
実装されたプロトタイプでは、Python/Pandasモデリング層、Supabaseベースのストレージ、Web対応レコメンデーションインターフェースが使用されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:52:16 GMT)
Reversa: A Reverse Documentation Engineering Framework for Converting Legacy Software into Operational Specifications for AI Agents [0.0] 本稿では,レガシソフトウェアをAIエージェントのトレーサブルな運用仕様に変換するためのリバースドキュメンテーションエンジニアリングフレームワークであるReversaを紹介する。
特殊なエージェントは、プロジェクト表面をマッピングし、モジュールを分析し、暗黙のルールを抽出し、アーキテクチャを合成し、ユニットレベルの仕様を書き、生成されたクレームをレビューする。
提案では,コードと仕様間のトレーサビリティ,明確な信頼性マーキング,人間の検証のためのギャップの保存という,3つのメカニズムを強調している。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:23:13 GMT)
Rapid online deep artifact suppression for real-time spiral bSSFP CMR with blipped-CAIPI simultaneous multi-slice imaging at 1.5 T [0.0] リアルタイム (RT) bSSFP MRI は高速自由呼吸心血管画像撮影を可能にするが, 機能評価には10-16スライスが必要である。
同時マルチスライス(SMS)イメージングは、取得時間を短縮するが、非カルト的軌跡と組み合わせると、オンライン利用を妨げる反復的再構成に依存する。
本研究は,RTSMSの迅速なオンライン再構築を容易にするため,深層人工物抑制について検討する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:08:48 GMT)
Quasilinear evolution versus von Neumann selective measurement [0.0] 我々は、フォン・ノイマン射影仮定を準線形進化に置き換えた新しい量子選択的測定法を導入する。
この方程式は量子アンサンブルの等価性を保ち、符号なし原理を満たすことを実証する。
2レベル量子系における選択的測定のための進化方程式の数値解をいくつか提示する。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:35:39 GMT)
Quantum signatures and semiclassical limitations in the transmission of Fock states [0.0] 逆オシレータバリアによる転位フォック状態の伝送について数値解析を行った。
これらの干渉効果は最大伝送確率を変化させない。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:06:44 GMT)
Quantum selective measurement as a quasilinear evolution [0.0] 我々は、フォン・ノイマン選択的測定における瞬時状態低減を連続的非線形進化に置き換えることを提案する。
非線形性にもかかわらず、この進化は量子アンサンブルの等価性を保ち、したがって符号なし原理に従う。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:30:51 GMT)
Quantum magic of strongly correlated fermions $-$ the Hubbard dimer [0.0] 本研究では,ハバードダイマーの非安定化性(量子魔法)について検討する。
魔法の強靭性と安定剤レニイエントロピーの両方を用いて局所的および非局所的非安定化剤の評価を行った。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:46:46 GMT)
Quantum Sidecar Architectures for Hybrid AI Training and Inference: Stateful Protected Registers, Stateless Reset-and-Reprepare Circuits and Quantum Weight-State Outlook [0.0] 我々は、将来のハイブリッドAIトレーニングと推論のための量子サイドカーアーキテクチャーファミリを提案する。
古典的大モデルパイプラインに付随する量子コプロセッサに対して、2つの物理的に異なる動作モードを同定する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:21:44 GMT)
Quantum Mpemba effect for operators in open systems [0.0] 我々は、隣接するリウヴィリアヌスの下で進化する作用素が依然として真のムペンバ効果を示すことを示す。
この現象が起こる一般的な条件を導出し、3つの異なる開量子集合に対する予測を検証します。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:15:47 GMT)
Quantum Model for CVRPTW [0.0] 本稿では,古典経路第1,クラスタ第2手法にインスパイアされたモデルのゲートベース量子コンピュータの実装について述べる。
本稿では,量子定式化に線形数の決定キュービットのみを付加する,量子ビット効率のスプリットインスパイアされたモデリングを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:40:44 GMT)
Quantum Magic Reveals CP Phases Invisible to Entanglement in Spin-0 Decays [0.0] スピン解析の物理的パウリフレームに固定された安定化器マジックは、この盲点から逃れることを示す。
実験的にアクセス可能で魔法に触発された2人のCP目撃者がこれに続き、線形振幅はクォート級よりも14.3倍の効率である。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:07:10 GMT)
Quantum Expectation Identities for the Three-State Model of a Molecular Domain [0.0] 本研究では,分子領域の電子分布について検討した。
我々は、電子人口、その化学的ポテンシャル、および隣人との手数料の受け入れまたは寄付の最大容量という、ドメインの3つの主要な量に焦点を当てる。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:27:58 GMT)
Prune, Update and Trim: Robust Structured Pruning for Large Language Models [0.0] 大規模言語モデル(LLM)は近年、著しい成長と発展を遂げている。
現在の訓練後のプルーニング法では、モデルのパラメータのかなりの部分を取り除いている。
本稿では,最先端技術に3つの変化をもたらすPutriを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:48:41 GMT)
Protection Is (Nearly) All You Need: Structural Protection Dominates Scoring in Globally Capped KV Eviction [0.0] 我々は、グローバルにカプセル化されたデコード時間ハーネスの共有下で、KVキャッシュの消去について検討する。
構造的保護がなければ、ほぼゼロに近い品質に崩壊する。
保護により、単純なスコアアイソレーションの変種は、$K=32$でLRUと同値である。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:41:34 GMT)
Prompts Don't Protect: Architectural Enforcement via MCP Proxy for LLM Tool Access Control [0.0] 大規模な言語モデルは、大規模なレジストリからツールを選択して呼び出す自律的なエージェントとしてますます機能する。
本稿では,属性ベースのアクセス制御(ABAC)をツール発見とツール実行の2点で実施するMPPプロキシを提案する。
我々のプロキシは、50msの中央値レイテンシを追加しながら、不正呼び出し率(UIR)を0%に削減します。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:52:24 GMT)
Programmable Participatory Governance -- A Formal Framework for Transparent, Accountable, and Citizen-Responsive Democratic Systems: From Deliberative Theory to Decentralised Architecture [0.0] 民主的な機関に対する大衆の信頼は、ここ数十年で多くのOECD諸国で低下している。
制度的透明性と説明責任に関する懸念は、既存のガバナンス構造が広範な正当性を維持することができるかどうかという疑問を提起している。
この論文は、民主的理論、制度経済学、暗号的に検証可能な分散システムの統合を通じて、これらの制度的欠陥に対処するために設計された公式なガバナンスフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:56:00 GMT)
Probing SMEFT Operators through $t\bar{t}t\bar{t}$ Production with Hyper-Graph Neural Networks at the LHC [0.0] 我々はハイパーグラフニューラルネットワーク(H-GNN)を用いて、支配的なSM背景からマルチレプトン信号イベントを識別する。
H-GNNでは、各事象は、再構成されたジェットとレプトンに対応するハイパーグラフとして表現される。
HL-LHC集積光度は1,000mathrmfb-1$および3000mathrmfb-1$で、背景推定では50%$不確実である。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:27:32 GMT)
Prism: Structural Symmetry Scanning via Duality-Constrained Laplacian Projection [0.0] 複雑なネットワークにおける構造対称性診断のためのフレームワークである textbfPrism を導入する。
Prismは、ネットワークが構造的自己整合性からどのくらい離れているかを測定するスカラーである。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:20:05 GMT)
Precision limits for time-dependent quantum metrology under Markovian noise [0.0] 我々は、一般マルコフノイズの存在下で、時空依存ハミルトニアンで符号化されたパラメータを推定するための究極の精度境界を導出する。
本稿では,これらの動作をパラダイム駆動型量子センサで説明し,デフォーカスと自発エミッションの下でのT4$とT3$のスケーリングを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:39:22 GMT)
Positivity of the effective range for finite range attractive potentials with a repulsive core [0.0] 内側の反発コアと外側の誘引テールによって特徴づけられる有限範囲ポテンシャルに対して、散乱長がポテンシャル(a > R$)の範囲よりも大きい場合、有効範囲は厳密に正であることを証明する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:46:46 GMT)
Position: A Three-Layer Probabilistic Assume-Guarantee Architecture Is Structurally Required for Safe LLM Agent Deployment [0.0] 安全な操作を共同で構成する3つの次元:意味的意図とポリシーの遵守、環境の妥当性、動的実現可能性。
コミュニティは、各安全次元が独立して認定されたレイヤによって強制される、コントラクトベースのアーキテクチャで対応する必要があります。
このようなアーキテクチャをスケッチし、確率の連鎖則によって認められる構成系レベルの安全性境界を導出する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:13:41 GMT)
Physics-informed convolutional neural networks for fluid flow through porous media [0.0] サンプル形状から直接細孔スケールの速度場を予測するためのニューラルネットワークに基づくフレームワークを提案する。
本研究では,損失重みの影響を解析し,個々の損失成分の予測精度への寄与を定量化する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:02:28 GMT)
Phonon-bottlenecked spin relaxation of Er$^{3+}$:CaWO$_4$ at milliKelvin temperatures [0.0] ミリケルビン温度におけるEr$3+$:CaWO$_4$の電子スピンのスピン格子緩和時間について検討した。
強いフォノン放出速度を支持する大磁場では、スピン励起の増加に伴う緩和時間の顕著な増加が観察される。
これらの観測はフォノン・ボトルネックによるスピン緩和の典型であり、希土類スピンアンサンブルをコヒーレントな資源として活用する量子技術に影響を及ぼす。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:54:33 GMT)
PH-Dreamer: A Physics-Driven World Model via Port-Hamiltonian Generative Dynamics [0.0] リカレントステートスペースアーキテクチャ上に構築された世界モデルは、保存と散逸の原則に反するダイナミクスを生成する。
我々は,これらを3つの相乗的機構を通じて改善する統合されたポート・ハミルトンの枠組みを導入する。
視覚制御のベンチマーク全体では、このパラダイムは優れたリターンを得るだけでなく、想像と実の報酬の間により密着した、より低い分散アライメントを確立することで内部忠実度を高める。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:20:54 GMT)
Optical Neural Networks from Coherent Transient Dynamics in Waveguide QED [0.0] 光ニューラルネットワークは、光子を直接計算することで超高速で低エネルギーな情報処理を約束する。
本稿では,コヒーレント量子力学により基本ニューロン機能を実現する全光完全連結ニューラルネットワークアーキテクチャを提案する。
全物理シミュレーションは、MNISTと色オブジェクト認識タスクに対して高い分類精度を示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:11:34 GMT)
Operator-Controlled 6G: From Connectivity Infrastructure to Guaranteed Digital Services [0.0] 本稿は6Gが演算子の優先順位を再順序付けすることで、この軌道を逆転しなければならないことを主張する。
6G Control Compactは、戦略的価値に応じてアーキテクチャの主権を割り当てる3つの階層のオーナシップ分類を定義している。
保証経済は、オペレーターのコントロールを強制可能なサービスレベルの目標に変換する、5段階の成果優先の商業モデルを定義している。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:40:24 GMT)
Open quantum dynamics without Complete Positivity: a criticism [0.0] 我々は、不完全正の写像の領域を、互換性のある初期状態の部分集合に制限することに基づく提案を分析する。
このようなドメイン制限は、システム次元の増大に伴ってますます深刻になり、互換性に基づくアプローチの本質的な弱点が明らかになる。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:45:03 GMT)
Online Conformal Prediction for Non-Exchangeable Panel Data [0.0] 交換不能なパネルデータのための簡単なオンラインコンフォメーションフレームワークを提案する。
この手法はオンラインパネル予測の重要な特徴を生かし、1つのユニットに予測が必要な場合、関連ユニットからの同時結果がすでに観測されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:02:11 GMT)
On Stability and Decomposition of Sample Quantiles under Heavy-Tailed Distributions [0.0] 経験過程理論は、半空間の力学、対称差分、およびGlivenko-Cantelli一様収束を通した使用可能な足場を提供する。
本稿では、投影方向と量子閾値効果を分離するQ-Qityの定式化を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:19:29 GMT)
Non-perturbative measurements of two-point functions in quantum field theory [0.0] 局所プローブは、時空の領域内の量子場の2点関数にアクセスすることができる。
物理有限サイズの相互作用領域によってもたらされる相違点を定量化する。
本プロトコルは、測定可能な検出器相関の観点で完全に2点関数を表現している。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:00 GMT)
Non-Stationary Decoherence in Superconducting Qubits: Memory Multi-Fractional Brownian Motion and a Time-Dependent Quantum Brownian Motion Extension [0.0] メモリ多屈折ブラウン運動(mmFBM)に基づく超電導電荷量子ビットのための統一ドリフトモデル(SdM)を提案する。
古典セクターは時間依存のハースト指数H(t)と適応メモリカーネルK(t,s)を用いる
量子ビットは拡張指数ラムゼーとエコー崩壊、非マルコフのデファスティング、温度駆動の量子-古典的クロスオーバーを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 01:33:32 GMT)
Noise-induced Simulability Transition from Operator Scrambling [0.0] ランダム量子回路の有限深度パウリスペクトルについて検討する。
ノイズの多い回路では、スクランブルは演算子の拡散を効果的に抑制する。
古典シミュレーションは指数関数的に難しいままであることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:00 GMT)
No Free Swap: Protocol-Dependent Layer Redundancy in Transformers [0.0] 事前訓練された変換器では、プロトコルギャップは、同じ評価器の下で複数の折りたたみで、どの層を安全に産み出すかを変えることができる。
8Bスケールで適合したWikiText-2契約の下では、交換誘導除去は同じ層予算で置き換え誘導されるよりも安全である。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:12:08 GMT)
Neural Acceleration for Graph Partitioning [0.0] 本稿では,従来の固有値計算を単純な人工ニューラルネットワークモデルに置き換えることで,スペクトル二分割の高速化手法を提案する。
提案手法は,スペクトル二分法に匹敵する分割品質を実現するとともに,計算オーバーヘッドを大幅に低減することを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:08:19 GMT)
Multilingual jailbreaking of LLMs using low-resource languages [0.0] 大規模言語モデル(LLM)は、ジェイルブレイクの試みに対して脆弱なままである。
低資源アフリカ語(アフリカ人、キスワヒリ人、イシXhosa人、イシズルー人)を用いたマルチターン会話が安全メカニズムを回避できるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:33:18 GMT)
Multi-Head Attention as Ensemble Nadaraya-Watson Estimation: Variance Reduction, Decorrelation, and Optimal Head Diversity [0.0] 我々は,ナダラヤ・ワトソン(NW)カーネル回帰推定器のアンサンブルとして,マルチヘッドアテンション(MHA)の厳密な理論を開発した。
MHA は H NW 推定器の構造的アンサンブルであり、それぞれがキー空間の異なる学習された射影部分空間で作用することを示す。
頭内デコリレーションの計算可能なスペクトル尺度であるHDI(Head Diversity Index)を導入し,MHA平均二乗誤差がHDIにおいて単調に減少していることを証明する。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:43:53 GMT)
Modular Self-Duality, Symmetrized Relative Entropy, and Bogoliubov--Kubo--Mori Susceptibility in Quantum Field Theory [0.0] 有限次元において、モジュラー自己双対は、状態がモジュラー反射パートナーと一致するような固定点を単数化する。
この不動点の構成を、場の量子論で生じる局所型IIIフォンノイマン代数に拡張する。
十分に規則的な状態変形に対して、自己双対点における固定局在ヘシアンはIII型ボゴリボフ-クボ-モリの感受性を定義する。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:48:03 GMT)
Modular Lower Bounds on Reeh-Schlieder State Preparation [0.0] リー・シュリーダーの定理は、全てのターゲットベクトルは、任意の小さな時空領域に局所化された作用素によって真空から近似することができるという定理である。
このノートは、標準の富田・竹崎推定値をモデル非依存の準備境界として分離する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:45:10 GMT)
Markov Chain Decoders Overcome the Heavy-Tail Limitations of Lipschitz Generative Models [0.0] ヘビーテール分布は、性能評価、ネットワークトラフィック、リスクモデリングで広く利用されている。
ガウスデコーダをマルコフ連鎖に基づく位相型(PH)分布に置き換える。
PHに基づくモデルでは、テールコルモゴロフ-スミルノフ間距離を最大x6、極端量子誤差を最大x10まで削減できることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:21:46 GMT)
Lost in the Folds: When Cross-Validation Is Not a Deep Ensemble for Uncertainty Estimation [0.0] 多くの研究はK-fold cross-validation (CV)を介してアンサンブルを形成するが、それらをディープアンサンブル(DE)と呼ぶ。
近年のセグメンテーションの不確実性調査を監査した結果,実装ミスマッチが一般的であることが判明した。
分散シフト下での校正,故障検出,曖昧性モデリング,ロバスト性に関する不確実性を評価する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:46:57 GMT)
LogRouter: Adaptive Two-Level LLM Routing for Log Question Answering in Big Data Systems [0.0] 本稿では,TUBITAK BILGEMの全国的ビッグデータプラットフォーム上に展開するエンドツーエンドの質問応答システムを提案する。
2レベルコスト対応ルータは、4つの実行パスのうちの1つに沿って各クエリをディスパッチする。
このシステムは、Fixed-32Bベースラインに対して平均レイテンシを55%削減する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:07:01 GMT)
Local Topological Quantum Order and Spectral Gap Stability for the AKLT Models on the Hexagonal and Lieb Lattices [0.0] ヘキサゴナル格子とリーブ格子上のAKLTモデルの基底状態が局所位相量子秩序(LTQO)条件を満たすことを証明した。
有限体積基底状態が無限体積状態によってよく近似されるような有限体積の増大と吸収の列を同定する。
論文参考訳(メタデータ) (Mon, 18 May 2026 20:08:33 GMT)
Lightweight Gaussian Process Inference in C++ on Metal and CUDA [0.0] Pythonのガウスプロセス(GP)推論はGPyTorchやGPflowなどのライブラリが支配している。
我々は,Pythonバインディングを用いたGPレグレッションのための依存性のないC17ライブラリLightGPを紹介する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:03:39 GMT)
Learned Memory Attenuation in Sage-Husa Kalman Filters for Robust UAV State Estimation [0.0] 動的環境における無人航空機はテレメトリーの停止、構造振動、状態依存ノイズに直面している。
我々は、スカラーパラメータをベクトル値のメモリ減衰ポリシーに置き換えるN-Deep Recurrent Sage-Husa Filter (NDR-SHKF)を導入する。
分岐アーキテクチャは、浅い再帰状態をルートし、瞬間的なセンサ異常と深い状態を捕捉し、持続的な動的傾向を符号化する。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:38:13 GMT)
Learn-by-Wire Training Control Governance: Bounded Autonomous Training Under Stress for Stability and Efficiency [0.0] Learnby-Wire Guard(LBW-Guard)は、AdamW上で動作する、自律的なトレーニング制御ガバナンス層である。
WikiText-103を用いたQwen2.5中心のストレス・アンド・ロバストネススイートにおけるLBW-Guardの評価を行った。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:32:25 GMT)
KairosHope: A Next-Generation Time-Series Foundation Model for Specialized Classification via Dual-Memory Architecture [0.0] カイロスホップ(KairosHope)は、分類タスクにおける解析的精度で大規模な一般化を再現するために設計された次世代のTSFMである。
大規模なモナシュのアーカイブで自己指導による事前訓練を行っている。
UCRベンチマークデータセットへの適応は、厳密な線形プローブとフルファインチューニングプロトコルを通じて行われる。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:02:30 GMT)
It's Safer to Give Personhood to Bears than to Artificial Intelligence [0.0] 人工知能(AI)の開発者は、AIシステムが利害や道徳的権利を持つかもしれないという考えに、修辞的に不満を抱いている。
本稿では,AIの権利の制度的側面について考察する。
私は、AIに固有の権利を主張または行使させる権限を与えることは、人間の自己決定による世界史的なギャンブルになる、というかなり壮大な主張を擁護します。
論文参考訳(メタデータ) (Mon, 18 May 2026 05:05:38 GMT)
Historical Knowledge Graphs for Global Maritime Estimated Time of Arrival [0.0] 本稿では,自動識別システム(AIS)データのみを用いて,歴史的海洋知識グラフを構築する手法を提案する。
このグラフは、軌道を反復的に処理し、船舶の種類、走行時間、走行方向によって成層された速度分布を記憶することによって構築される。
グラフは、階層的で優先度の高いシステムを通じて、任意の2つの場所間の旅行時間予測を検索するためにクエリすることができる。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:47:57 GMT)
Going Headless? On the Boundaries of Vertical AI Firms [0.0] 汎用AIエージェントがこのパッケージを解き放ち、創業者や投資家は「ヘッドレス化」を主張
この記事は、ヘッドレス化は企業によっては正しいし、他の企業にとっては破壊的だ、と論じている。
セクターではなくタスク・アカウンタビリティ・レジームによって決定される3つの分類法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 03:38:29 GMT)
Geometry-Aware Surrogate for Real-Time Hydrodynamics Estimation of Autonomous Ground Vehicles in Amphibious Environments [0.0] この研究は、幾何学的-流体力学的力をリアルタイムで予測することでギャップを埋める、地下ニューラルネットワークサロゲートを提示する。
車両固有距離場 (SDF) は, 車両形状, 深度, 流れ方向によってどのように荷重が変化するかをモデルが決定できるように, 地下沈下入力を提供する。
実環境下でのモデル評価には,水深の異なるフルスケール車両の水圧試験を用いる。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:24:23 GMT)
Geometrical derivation of Wigner's angle for arbitrary Lorentz transformations of massless particles [0.0] このノートは、特に光子に対する無質量粒子に対するローレンツ変換の物理学と数学を要約している。
ウィグナーの小さな群行列の完全な解析的導出と、任意のローレンツ変換に対するウィグナーの角度の計算のための閉公式を提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:10:55 GMT)
GUT-IS: A Data-Driven Approach to Integrating Constructs and Their Relations in Information Systems [0.0] 本稿では,構造方程式モデルの統一モデルへの統合を目的としたアプローチを提案する。
タスク適応型テキスト埋め込みとクラスタリングを組み合わせることで,コンストラクトグループ化の候補セットを生成する。
クラスタ数の意味的純度とパーシモニーを明示的に交換するロス関数を用いて最適解を選択する。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:44:43 GMT)
From BERT to T5: A Study of Named Entity Recognition [0.0] 本報告は,2つの事前学習モデルの微調整におけるNERタスクの実装に焦点をあてる。
BERTはトレーニング損失に対する重み付きクロスエントロピーとして適用され、T5は2つの検証戦略で微調整される。
関連する分析は、BERTの共通エラーと2つのモデルのパフォーマンスに関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:23:35 GMT)
Federated Naive Bayes with Real Mixture of Gaussians and Institutional Governance Regularization for Network Intrusion Detection [0.0] 侵入検知のためのフェデレーション学習は、すべての参加機関が共有モデルに等しく貢献するという欠陥のある前提に基づいている。
実際には、成熟したセキュリティコントロールと低い脆弱性エクスポージャーを持つ金融機関は、弱いコントロールと高い脆弱性エクスポージャーを持つ政府機関と根本的に異なるデータを生成する。
ローカルモデルをモデルとして扱うことで、組織が標準的なリスク管理監査を通じて収集した情報を破棄する。
論文参考訳(メタデータ) (Mon, 18 May 2026 16:54:49 GMT)
Faculty Orientations Shape Adoption of AI in Research and Teaching [0.0] 本研究では,AIの使用状況,態度,制度的文脈,教育実践との関係について検討した。
その結果、既存の技術適応モデルは、技術が学際的推論や知識生産と直接相互作用する文脈における採用を完全に説明できない可能性が示唆された。
論文参考訳(メタデータ) (Mon, 18 May 2026 09:47:35 GMT)
FOL2NS: Generating Natural Sentences from First-Order Logic [0.0] 第一次自然文論理(英: First-Order Logic to Natural Sentence、FOL2NS)は、合成されたFOL式を生成し、それらを自然な人間の表現に変換するように設計された神経象徴的枠組みである。
我々は,FOL2NSが十分に整形されたテンプレートや流動的なステートメントを確実に生成できることを示すが,構造的複雑性が増大するにつれて,正確な意味表現と自然生成を実現する上での課題に直面している。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:01:44 GMT)
Ethical Hyper-Velocity (EHV): A Provably Deterministic Governance-Aware JIT Compiler Architecture for Agentic Systems [0.0] Ethical Hyper-VeCRは、実行時にAIガバナンスポリシーを正式な検証するためのフレームワークである。
EHVは、ガバナンス対応のJust-In-TimeJITコンパイラを介して、ポリシー実行ポイント(PEP)を推論パイプラインにリロケーションする。
O(1)の実施によって、デプロイメントのベロシティとガバナンスの間の従来のトレードオフを排除し、ガバナンスをO(days)からO(1)に還元できることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:15:51 GMT)
Equilibrium Selection in Multi-Agent Policy Gradients via Opponent-Aware Basin Entry [0.0] 本研究では,外部基準により選択された平衡の目標集合について,盆地突入確率について検討する。
有限アンロールメタMAPGでは、この更新が通常の方針勾配と自己学習とピアラーニングの補正に分解されることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:57:15 GMT)
Ensemble Monitoring for AI Control: Diverse Signals Outweigh More Compute [0.0] 多様なモニタからの信号をアンサンブルに組み合わせることで、不整合動作の検出が向上することを示す。
GPT-4.1-Miniモニタを12台構築する。
ベスト3モニタアンサンブルは、3つの同一モニタからなるアンサンブルに比べて2.4倍高い検出性能が得られる。
論文参考訳(メタデータ) (Mon, 18 May 2026 07:58:13 GMT)
Energy-Resolved Eigenmode Spectroscopy of 1-D and 2-D Non-Hermitian Skin Effects [0.0] 周波数合成次元におけるスキンモードのバンドおよびエネルギー分解固有モード分光を報告する。
この結果は、非エルミート物理学の直接プローブとして固有モード分光を導入し、ハミルトン工学の柔軟な基盤として強い有界周波数格子を確立する。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:06:47 GMT)
ESLD (External Surrogate Latent Defense): A Latent-Space Architecture for Faster, Stronger Prompt-Injection Defense [0.0] 本稿では、悪意のある入力からセーフを分離するために必要な信号がガードモデルの内部表現にすでに存在することを示す。
ESLDはモデルに依存しないアーキテクチャで、既存のガードモデルの上に置かれ、ガードの再トレーニングや修正をすることなく、レイテンシと検出精度の両方を改善する。
論文参考訳(メタデータ) (Mon, 18 May 2026 06:57:58 GMT)
Drive-Only Interaction Engineering via Dynamical Freezing [0.0] 凍結は通常、望ましくない力学を抑えるために使用されるが、相互作用を工学するためにも用いられる。
我々は、補助的なサブシステムを動的に凍結するドライブオンリー制御パラダイムである、凍結誘起相互作用工学を導入し、残りの自由度を効果的にハミルトニアンに還元する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:01:12 GMT)
Dominant vibronic relaxation channels in a europium-based molecular qubit [0.0] 分子スピン量子ビットは量子情報処理のための汎用的なプラットフォームを提供する。
核スピンキュビットEu(dpphen)(NO3)3のスピン格子緩和時間について検討した。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:49:24 GMT)
Do You Need Text Rectification? Soft Attention Mask Embedding for Rectification-Free Scene Text Spotting [0.0] Same-Netは、文字レベルのアノテーションも補助的なテキスト修正モジュールも必要としない、堅牢なエンドツーエンドテキストスポッティングフレームワークである。
Same-Netは任意の形状のTotal-Textデータセット上で84.02%のエンドツーエンドH平均を達成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:15:57 GMT)
Dissipation-assisted preparation of Floquet-Laughlin states in superconducting circuits [0.0] フラクタルチャーン絶縁体(FCI)は、分数量子ホール系の格子アナログである。
分散制御は、駆動された漏れキャビティモードとの結合によって達成される。
2粒子、3粒子、6粒子の系では、制御方式の柔軟性により、分数量子ホールシグネチャの検出が可能となる。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:23:32 GMT)
Diagnosing Korean-Language LLM Political Bias via Census-Grounded Agent Simulation [0.0] 大規模言語モデル(LLM)は、有権者シミュレーションにおいて体系的な政治的バイアスを示すが、その基盤となるメカニズムと言語間一般化は理解されていない。
韓国の6つの選挙において,4つのモデルにまたがる韓国の政治行動を評価する,国勢調査に基づくシミュレーションフレームワークであるDynamo-Kを紹介した。
本研究では,(1)中等度エージェントのプログレッシブバイアス,(2)モデル依存の第三者サリエンス崩壊,(2)サリエンス障害と意思決定バイアスの区別,(3)モデルが双方向に予測下にある地域偏極崩壊の3つの系統的障害モードを同定する。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:42:23 GMT)
Detecting vortex motion through spatially correlated nonequilibrium noise [0.0] 超伝導相近傍での抵抗輸送は、通常の準状態粒子の運動や渦の動きから生じることがある。
本稿では,最近開発された共分散磁気学の実験ツールを用いて,それらと区別するあいまいな方法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:00 GMT)
Detecting nonclassicality in randomly-displaced copies of a squeezed state [0.0] 各コピーが異なる変位/振幅で到着したとき、受信信号が圧縮されるかどうかを判定する。
我々は、四次スキューズを数スキューズに変換する相互作用ハミルトニアンを用いる。
これにより、個々のコピーがランダムな変位を持つ場合でも、スクイーズを識別できる。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:43:48 GMT)
Conformal Prediction via Transported Beta Laws [0.0] 実効整合しきい値によって誘導される校正条件付きカバレッジの法則について検討する。
このベータ法則を有限サンプル参照対象とみなし、ワッサーシュタイン距離を用いてそれからの出発を定量化する。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:46:39 GMT)
Confidence-Gated Robot Autonomy: When Does Uncertainty Actually Help? [0.0] しきい値付き自律において、不確実性は主に、潜在的なエラーをランク付けする能力によって問題となる。
本研究では,スピアマンランク相関,ペアブートストラップ等価性テスト,行動/遅延合意を用いて不確実性を評価する。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:35:27 GMT)
Concave is the New Linear: The Impossibility of Anti-Plutocratic DAO Governance [0.0] 分散型自律組織(DAO)は、トークン保有者が提案に投票できるようにすることで、プロトコルガバナンスを実行する。
ウォレットバランスに比例する投票力である支配的なルールは、少数の大株主のコントロールに集中している。
ウォレットバランスのみから権力を得る投票ルールは、無許可のブロックチェーンでは成功できないことを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:10:52 GMT)
Computational aspects of the Volterra Signature [0.0] 本稿では,Volterraシグネチャカーネルの効率的なアルゴリズムを提案する。
すべてのアルゴリズムは JAX ベースのパッケージ "tensordev" で実装されている。
K(t,s)=sum_p k_p(t-s)A_p$は、$J$と$N$の複雑さを増さないことを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:46:47 GMT)
Comparing Two Categorical Gini Correlations with Applications to Classification Problems [0.0] 本稿では,分類問題における予測的重要性をカテゴリー的応答変数と比較するための推論フレームワークを提案する。
この手法は、数値予測器と分類結果の依存性の尺度であるカテゴリー的ジニ相関(CGC)に基づいている。
論文参考訳(メタデータ) (Mon, 18 May 2026 02:29:57 GMT)
Collective charge measurement in quantum dot chains: controlling barrier occupation and tunneling current [0.0] 3量子ドット(TQD)系における非平衡輸送について検討した。
本研究では,この大域的計測手法が単一地点計測と定性的に異なる方法で輸送に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:21:10 GMT)
Collective amplification and anisotropic narrowing of alignment signals in cesium vapor under strong spin exchange near zero magnetic field [0.0] 本研究では, ポンプビームに垂直な面におけるハンル共鳴の異方性は, 濃度とともに増加することを示す。
さらに濃度が上昇すると、信号増幅、不安定性、偏光、記憶などの非線形効果が生じる。
これらの共鳴の特異な性質、例えば、非常に小さな幅と長期記憶効果を持つ磁場制御の不安定性は、量子センシングや情報としての使用を約束する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:44:08 GMT)
ChromaFlow: A Negative Ablation Study of Orchestration Overhead in Tool-Augmented Agent Evaluation [0.0] 本稿では,プランナー指向実行,特殊なツール使用,テレメトリ駆動評価を中心に構築されたツール拡張型自律推論フレームワークを提案する。
クリーンな評価制約の下でGAIA 2023 Level-1バリデーションタスクのクロマフローを解析する。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:56:06 GMT)
ChatGPT vs Teachers vs Students: Large-Scale Analysis of Generative AI Discourse in Education Communities on Reddit [0.0] 270万件のAI関連Reddit投稿と、26の教育関連サブレディットからのコメントを分析します。
談話は、早期の検知・回避兵器レースから持続的な執行体制へと進化する。
学生は混合スレッドの68%を起動するが、学部は最もクロスロールな応答を生成する。
論文参考訳(メタデータ) (Mon, 18 May 2026 00:26:33 GMT)
Can machine learning for quantum-gas experiments be explainable? [0.0] コールド原子ベースの量子シミュレータに対する機械学習の2つの特定の応用に焦点を当てる。
まず,Bose-Einstein凝縮体における原画像のデノナイズを行い,ソリトニック波の同定を行った。
どちらの例でも、パフォーマンス、モデルの複雑さ、解釈可能性の間の相互作用についてコメントします。
論文参考訳(メタデータ) (Mon, 18 May 2026 17:27:46 GMT)
Building Reliable Arithmetic Multipliers Under NBTI Aging and Process Variations [0.0] 現代コンピューティングシステムの基盤となる算術乗算器の老化に着目する。
特に、AIワークロードは、乗算器における負バイアス温度不安定(NBTI)効果を加速することができる。
本稿では,乗算の符号分散特性を利用した新しい老化緩和手法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:12:01 GMT)
Buffer-Parameterized Machine Learning Surrogate Models for Cross-Technology Signal Integrity Analysis and Optimization [0.0] プリント基板間の信号整合性(SI)解析は複雑化に直面している。
既存の機械学習(ML)サロゲートモデルによるSIメトリクスの予測は、固定バッファパラメータに依存する。
本稿では,バッファパラメータ化MLサロゲートモデリング手法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 10:12:57 GMT)
Bridging the Cybersecurity Gap Between Web2 and Web3 - An Incident-Based Analysis of Organizational and Application-Level Security Failures [0.0] Web3インフラストラクチャの急速な採用は、暗号通貨取引所、保護サービス、ブロックチェーンベースのプラットフォームに影響を及ぼすセキュリティインシデントの増加につながっている。
本稿では、Web3エコシステムにおける公開文書化された高インパクトセキュリティ違反の質的、インシデントに基づく分析について述べる。
その結果,Web3環境における障害パターンは,汎用的なセキュリティ管理カタログでは不十分であることが示唆された。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:36:42 GMT)
Bounds on quantum conference key agreement in pair-entangled networks [0.0] 両端が絡み合った状態の源泉によってノードが接続される、短期量子ネットワークにおける会議鍵合意の課題について検討する。
コンソーシアムキーは, コンソーシアムのネットワークトポロジや絡み合いの程度に応じて上界を導出する。
これらの場合、両部鍵の蒸留後、両部鍵を会議鍵にマージすることが最適であることを示す。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:43:16 GMT)
Beyond Inference-Time Search: Reinforcement Learning Synthesizes Reusable Solvers [0.0] 大規模言語モデル(LLM)は一般的に、各インスタンスを個別に解決する推論時プロシージャとして最適化にアプローチする。
本稿では,制約付きクナプサックの制御変種であるSDS(Synergistic Dependency Selection)について考察する。
Qwen2.5-Coder-14B-Instruct with Group Relative Policy Optimization using a feasibility-gated reward and light Structure scaffolding。
論文参考訳(メタデータ) (Mon, 18 May 2026 13:21:40 GMT)
Bayesian Latent Space Models for Graphs Are Misspecified: Toward Robust Inference via Generalized Posteriors [0.0] Link-Sequential R-SafeBayes(リンク・シークエンシャル・R-SafeBayes)は、初期リスクを推定し、後続正則化を適応的に調整する手法である。
合成および実世界のネットワークの実験では、キャリブレーションの改善、リンク予測性能の向上、ユークリッド空間、球状空間、双曲空間をまたいだ潜在測地を選択するための信頼性の高い基準が示されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 12:53:43 GMT)
Automatically Improving Simulation Physics for Articulated Objects [0.0] 本稿では,操作中にオブジェクトを確実にシミュレートできるかどうかを特徴付けるインタラクション・レディネスを提案する。
不完全な3Dアセットから対話可能な調音オブジェクトを生成するためのシミュレーター・イン・ザ・ループ手法を提案する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:34:33 GMT)
Atomistic Modeling of Chemical Disorder in Materials: Bridging Classical Methods and AI-Assisted Approaches [0.0] 化学障害は合金、セラミックス、組成的に複雑な材料に広く見られる。
中心的な障害は実験とシミュレーションの間の表現ギャップである。
このレビューでは、古典的およびAI駆動のメソッドがこの表現ギャップを埋める方法について強調する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:22:47 GMT)
Ancilla Assisted Quantum Process Tomography using Bound entangled states [0.0] 我々は、特定の有界絡み合った状態が、アンシラ支援量子プロセストモグラフィーに利用できることを明示的に示している。
この結果は,アンシラ支援量子プロセストモグラフィーの文脈における有界絡み状態の新しい応用を提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:07:36 GMT)
Agentic Cost-Aware Query Planning with Knowledge Distillation for Big Data Analytics [0.0] 本稿では,ルールベースの教師プランナ,UPB1バンディット探索,コスト認識予測,知識蒸留を組み合わせたエージェントクエリ計画システムを提案する。
蒸留された学生プランナーは、高速推論のために教師とバンドの意思決定を模倣することを学びます。
我々の単一ファイル実装は、リソース制限されたマシン上で再現可能なビッグデータ分析を可能にする。
論文参考訳(メタデータ) (Mon, 18 May 2026 04:07:00 GMT)
Adaptive Human-Robot Collaboration for Masonry Construction Under Material and Assembly Uncertainty [0.0] 本稿では,コミュニケーションの制限や寛容な蓄積に対処する,機械工のための適応型人間ロボット協調ワークフローを提案する。
このワークフローは,(1)手動接着剤塗布のためのジャストインタイムプロジェクションガイダンスを提供するエンドエフェクタ搭載プロジェクタ,(2)フィードバック駆動型グリーティングと配置ポーズ補正のためのレーザ走査の2つの補完機構によって実現されている。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:42:31 GMT)
Activation Functions, Statistics and Learning of Higher-Order Interactions in Restricted Boltzmann Machines [0.0] 隠れ単位活性化関数の異なる制限ボルツマンマシンによって誘導される相互作用の統計について検討する。
我々は、誘導された相互作用の分布のモーメントの観点から、表現可能なモデルの空間を解析的に特徴づける。
指数関数のような急速に増加する非線形性は、そのようなデータ構造の表現と学習を容易にする。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:04:24 GMT)
Achieving High Filling of an Optical Lattice by Light-Assisted Redistribution of Atoms [0.0] 量子物質合成装置における光支援再分配過程を実証する。
放射衝突に関与する原子の50$%以上は格子内に保持されていることが判明した。
当社のデモは、ユニファイド原子配列へのスケーラブルで効率的な経路を提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 21:01:38 GMT)
A note on connections between the Föllmer process and the denoising diffusion probabilistic model [0.0] フルマー過程(Fllmer process)は、時間1で所定の分布を持つように条件付けられたブラウン運動である。
この事実は,逆SDEの離散化によるDDPMサンプリング誤差の解析に間接的に用いられている。
このノートは、既存の作業から得られた関連する結果を調査しながら、この点を明確にすることを目的としている。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:31:58 GMT)
A geometric Fano--Procrustes framework for purification-based distances and quantum channels analysis [0.0] 我々は、混合量子ビット状態と量子チャネルの解析のための浄化に基づく幾何学的枠組みを開発する。
固定された1量子混合状態の場合、精製の選択の自由は、補助的な自由度に作用する適切な回転によってパラメータ化することができる。
論文参考訳(メタデータ) (Mon, 18 May 2026 14:36:56 GMT)
A data-driven Fourier-mixture neural-network method for density estimation [0.0] 実験特性関数(CF)情報から固定水平確率密度を推定するためのデータ駆動型ニューラルネットワーク手法を提案する。
この方法は、i.d.サンプルから構築された経験的CFに対して訓練される。
実験では、重み付けされた目標に対する明らかな利得、理論と一致した$L$エラー崩壊、および再サンプリングされた依存データから1年間のオーストラリア株式リターン法を効果的に推定している。
論文参考訳(メタデータ) (Mon, 18 May 2026 08:11:24 GMT)
A Unified Framework for Structured Flow Modeling: From Continuous Fields to Data-Driven Representations [0.0] 力学系は、ソース/シンクの挙動、循環力学、トポロジーに制約された輸送を結合した構造的流れで記述することができる。
この研究は、ヘルムホルツ・ホッジ分解に基づく連続的な定式化を離散的およびデータ駆動的表現と結合することによって、そのようなシステムに対する統一的な視点を提供する。
論文参考訳(メタデータ) (Mon, 18 May 2026 11:52:09 GMT)
A Practical Noise2Noise Denoising Pipeline for High-Throughput Raman Spectroscopy [0.0] このアプローチは、Noss2Noise戦略を用いて訓練された1次元畳み込みオートエンコーダに依存する。
短時間露光取得を繰り返し行う訓練サブセットから、モデルを学習し、ラマンスペクトルを効率よく抑圧しながら再構成する。
その結果, 信頼度の高い解釈には不十分な1スペクトルあたり5ミリ秒の積分時間で, 基準データに対する高忠実度な偏光スペクトルが得られることがわかった。
論文参考訳(メタデータ) (Mon, 18 May 2026 15:03:43 GMT)
A Cloud-Based Tool for Meteorite Recovery Using Drones and Machine Learning [0.0] 我々は、ドローンと機械学習を使って、観測された隕石の滝を復元するクラウドベースのツールを提案する。
南オーストラリアおよび西オーストラリア州で観測された隕石落下に対して, この手法の成功と限界を詳述した。
論文参考訳(メタデータ) (Mon, 18 May 2026 23:05:00 GMT)
4D and 5D Layer Codes through Color Routing [0.0] 本稿では,Layer コードを D=4,5$ 次元に一般化した Calderbank-Shor-Steane (CSS) コード構成を導入する。
前者と同様、現在の構成は量子低密度パリティチェック(qLDPC)符号の埋め込みに基づいている。
論文参考訳(メタデータ) (Mon, 18 May 2026 18:00:09 GMT)