Remember the Decision, Not the Description: A Rate-Distortion Framework for Agent Memory [120.7] 記憶は、決定にとって重要な区別を、記述ではなく保存すべきであることを示す。
DeMemは,共有状態が決定競合を誘発することを示すデータに対してのみ,分割を洗練させるオンラインメモリ学習システムである。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:20:58 GMT)
Is Your Driving World Model an All-Around Player? [107.3] We introduced WorldLens, a unified benchmark that measure world-model fidelity across the full spectrum。
6つの代表モデルについて評価したところ、既存のアプローチがすべての軸にわたって支配的でないことが判明した。
アルゴリズムのメトリクスを人間の知覚でブリッジするために、26,808エントリの人間注釈付き嗜好データセットであるWorldLens-26Kをコントリビュートする。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:05:49 GMT)
HiDream-O1-Image: A Natively Unified Image Generative Foundation Model with Pixel-level Unified Transformer [104.1] 画素空間拡散変換器を用いた統合生成基盤モデルであるHiDream-O1-Imageを提案する。
HiDream-O1-Imageは、原画像ピクセル、テキストトークン、タスク固有の条件を単一の共有トークン空間にマッピングすることにより、マルチモーダル入力の構造的統一を実現する。
実験により、HiDream-O1-Imageは、テキスト・ツー・イメージ生成、命令ベースの編集、主観的パーソナライゼーションなど、さまざまな世代のタスクに優れることが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:59:09 GMT)
ExploitGym: Can AI Agents Turn Security Vulnerabilities into Real Attacks? [92.2] 低レベルのプログラム推論を必要とするため、爆発は難しい作業です。
その重要性と診断価値にもかかわらず、搾取は未評価のままである。
ExploitGymは、AIエージェントのエクスプロイト能力に関する大規模で多様な、現実的なベンチマークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:00:14 GMT)
Masked Generative Transformer Is What You Need for Image Editing [91.8] 拡散モデルは、編集された領域を周囲のコンテキストと絡み合わせることで、変更が持続するべき領域に伝播する。
本稿では,局所化トークン予測パラダイムが意図した領域の変更を自然に限定するMasked Generative Transformers (MGTs)を活用することによって,根本的に異なるアプローチを提案する。
本稿では,MGTベースの編集フレームワークであるEditMGTについて紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:05:52 GMT)
EgoMemReason: A Memory-Driven Reasoning Benchmark for Long-Horizon Egocentric Video Understanding [89.3] EgoMemReasonは、メモリ駆動推論を通じて、1週間のエゴセントリックなビデオ理解を体系的に評価する。
EgoMemReasonには3つのメモリタイプと6つのコア課題に関する500の質問が含まれている。
EgoMemReasonをMLLMとエージェントフレームワークにまたがる17の手法で評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:59:59 GMT)
Is Data Shapley Not Better than Random in Data Selection? Ask NASH [88.5] データ選択は、訓練データの高品質なサブセットを特定する問題を研究する。
目的のユーティリティ関数を単純化したシェープリー不変成分関数に分解するNASH(Non-linear Aggregation of SHapley-informative components)を提案する。
NASHは、Shapley/semivalueベースのデータ選択の有効性を、最小限のランタイムコストで大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:00:10 GMT)
WildClawBench: A Benchmark for Real-World, Long-Horizon Agent Evaluation [88.1] この研究でWildClawBenchは、6つのテーマのカテゴリにまたがる60の人間によるバイリンガルなマルチモーダルタスクのネイティブランタイムベンチマークである。
各タスクは、約8分間のウォールクロック時間と20以上のツールコールで実行されます。
グラディングはハイブリッドであり、決定論的ルールベースのチェック、副作用の環境状態監査、意味的検証のためのLLM/VLM判定を組み合わせている。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:49:43 GMT)
Concordia: Self-Improving Synthetic Tables for Federated LLMs [80.0] フェデレートラーニングは、生データを共有することなく、大きな言語モデル(LLM)をトレーニングすることを可能にする。
合成データ生成とフェデレートされた検証ユーティリティを連携させるフレームワークであるConcordiaを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:17:58 GMT)
PolarVLM: Bridging the Semantic-Physical Gap in Vision-Language Models [79.1] 視覚言語モデルに偏光物理パラメータを統合する最初のフレームワークであるPolarVLMを紹介する。
デュアルストリームアーキテクチャとプログレッシブ2段階のトレーニング戦略を用いることで、PolarVLMは一般的な視覚能力を維持しながら、物理的誤解釈を効果的に防止する。
実験の結果、PolarVLMは5つの評価タスクでRGBベースラインを25.4%上回ることがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:10:17 GMT)
Pixal3D: Pixel-Aligned 3D Generation from Images [77.7] Pixal3Dは、画像から高忠実度3Dアセットを作成するためのピクセル対応の3D生成パラダイムである。
Pixal3Dはスケーラブルで,高品質な3Dアセットを製造可能であることを示す。
また,画像から高忠実でオブジェクト分離された3Dシーンを生成するモジュールパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:55:04 GMT)
Provable Sparse Inversion and Token Relabel Enhanced One-shot Federated Learning with ViTs [77.4] ワンショットフェデレートラーニング(One-Shot Federated Learning)は、単一のコミュニケーションラウンドでグローバルモデルを学ぶ中央サーバが、有望なパラダイムとして登場したものだ。
本稿では,合成画像の全パッチをフル活用してグローバルモデルをトレーニングする,新しいフェデレーションモデルインバージョンとトークンリラベルフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:49:08 GMT)
ELF: Embedded Language Flows [76.8] 連続言語モデルは離散領域への最小適応で有効にすることができることを示す。
連続埋め込み空間における拡散モデルのクラスである埋め込み言語フロー(ELF)を提案する。
ELFは離散的かつ連続的なDLMよりも大幅に優れ、サンプリングステップを少なくして生成品質が向上する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:59:29 GMT)
RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards [76.2] 長い形式のレポートを計画し、調査し、エビデンスを評価し、合成する深層研究システムには、根本的な答えがなく、多くのツール強化された決定にまたがる。
本研究では,ルーブリックは最終回答評価者だけでなく,ポリシーの実行,判断フィードバック,エージェントメモリを構成する共有インターフェースとして機能すべきである,と論じる。
我々は、段階的な政策分解とリフレクションに基づくメタ政治進化を組み合わせたルーリック誘導強化学習フレームワークEMを導入する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:40:38 GMT)
EnactToM: An Evolving Benchmark for Functional Theory of Mind in Embodied Agents [75.0] 既存のベンチマークは、直観的信念を問うことで、主にリテラル・オブ・マインド(ToM)をテストする。
EnactToMは, 3D 家庭で設定された300個のマルチエージェントタスクの進化ベンチマークである。
ハードスプリットでは、7つの評価されたフロンティアモデルすべてが機能的なタスク完了時に0.0%のPass3を獲得し、リテラルな信念プローブでは平均45.0%であった。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:04:19 GMT)
LeapTS: Rethinking Time Series Forecasting as Adaptive Multi-Horizon Scheduling [74.9] 本稿では,予測地平線上での動的スケジューリングプロセスとして時系列予測を再構成する新しいフレームワーク LeapTSを提案する。
LeapTSは、Transformerベースのモデルよりも2.6$times$から5.3$times$推論スピードアップを実現しつつ、全体的な予測性能を少なくとも7.4%向上させる。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:54:02 GMT)
OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents [74.2] 大規模言語モデルエージェントは、シーケンシャルな意思決定タスクを解決するために、推論、行動選択、観察をインターリーブする。
LLMエージェントの既存の推論時間適応法は、主にプロンプトや検索に依存している。
提案するOLIVIAは,ReAct型エージェントのための推論時行動適応フレームワークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:28:20 GMT)
ConfoundingSHAP: Quantifying confounding strength in causal inference [70.2] 因果推論では、共同設立者は治療の決定と結果の両方に影響を与える変数である。
本稿では,各共変量に共起強度を寄与させるShapleyベースの手法であるConfoundingSHAPを紹介する。
様々なデータセットにまたがる実践的価値を実証する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:19:33 GMT)
Verifier-Free RL for LLMs via Intrinsic Gradient-Norm Reward [70.0] 本研究では,検証自由な内在性勾配項再帰(VIGOR)を提案する。
VIGORはポリシーモデルのみを使用する単純な報酬です。
数学データのみに基づいてトレーニングされた場合、コードベンチマークへのクロスドメイン転送を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:15:37 GMT)
On Training in Imagination [70.0] 最先端のモデルに基づく強化学習手法は、想像上のロールアウトに関するポリシーを訓練する。
学習力学と報酬モデルにおける誤差が回帰や政策最適化に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:19:23 GMT)
LatentRouter: Can We Choose the Right Multimodal Model Before Seeing Its Answer? [69.7] マルチモーダル大言語モデル(MLLM)は、OCR、チャート理解、空間的推論、視覚的質問応答、コスト、レイテンシにまたがるヘテロジニアスな強度を持つ。
本稿では,MLLMルーティングを実効的マルチモーダルユーティリティ予測として定式化するルータであるLatentを提案する。
MMR-BenchとVL-Benchの実験では、Latentは固定モデル、特徴レベル、学習ルータベースラインよりも優れていた。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:42:12 GMT)
ReAD: Reinforcement-Guided Capability Distillation for Large Language Models [69.0] 固定トークン予算下でのキャパシティ蒸留について検討し、2つの一貫したパターンを同定する。
Reinforcement-guided cApability Distillation frameworkであるREADを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:17:51 GMT)
The autoPET3 Challenge: Automated Lesion Segmentation in Whole-Body PET/CT $\unicode{x2013}$ Multitracer Multicenter Generalization [67.9] 第3回オートPETチャレンジ(MICCAI 2024)の設計と成果を報告する。
全身PET/CTにおける自動病変分割を, 構成的一般化条件下でベンチマークした。
トップランクのアルゴリズムは平均DSCが0.66、FNVが3.18mL、FPVが2.78mLである。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:29:31 GMT)
ReCrit: Transition-Aware Reinforcement Learning for Scientific Critic Reasoning [67.5] ReCritは、移行対応の強化学習フレームワークである。
初期から批判的な振る舞いを4つの四分詞に分解する: 補正、シコファンシー、ロバストネス、バウンダリー。
3つの科学的推論ベンチマークにおいて、ReCritはQwen3.5-4Bでは38.15から51.49に、Qwen3.5-9Bでは45.40から55.59に平均批評家の精度を改善している。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:22:39 GMT)
MASS-DPO: Multi-negative Active Sample Selection for Direct Policy Optimization [66.8] 直接選好最適化(DPO)を拡張したPlackett--Luce(PL)モデルに基づくマルチ負の選好最適化
そこで本研究では,PL固有のフィッシャー情報目的を導出し,各プロンプト内のコンパクトで情報的な負の部分集合を選択するマルチ負のアクティブサンプル選択法であるMASS-DPOを紹介する。
MASS-DPOは、既存の手法を常に精度で上回り、リコール/NDCGとマージンベースの最適化のダイナミクスを改善し、かなり少ない負のアライメントを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:18:08 GMT)
Power Reinforcement Post-Training of Text-to-Image Models with Super-Linear Advantage Shaping [66.3] テキスト・トゥ・イメージ(T2I)モデルのポストトレーニング手法はハッキングに報いる傾向がある。
SLAS(Super-Linear Advantage Shaping)は、地方政策の分野を再考する。
SLASは、DanceGRPOベースラインを複数のバックボーンとベンチマークで一貫して上回っている。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:59:25 GMT)
PREPING: Building Agent Memory without Tasks [65.8] Prepingはプロポーザル誘導型メモリ構築フレームワークである。
コアとなるのは、将来の実践を形作る構造化制御状態であるプロジェクタメモリである。
トライアルでは、Prepingはメモリなしのベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:34:43 GMT)
SOMA: Efficient Multi-turn LLM Serving via Small Language Model [64.5] 大規模言語モデル(LLM)は、多ターン対話設定にますます多くデプロイされている。
本稿では,セッションの初期回転を利用して局所応答多様体を推定するフレームワークを提案する。
採掘された試料を局所的なLoRA微調整に蒸留し, シュロゲートは推論時にプロンプトを伴わずに動作させる。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:07:33 GMT)
Plan in Sandbox, Navigate in Open Worlds: Learning Physics-Grounded Abstracted Experience for Embodied Navigation [63.1] textitSAGEは、エージェントがフォトリアリスティックなシミュレーションではなく、物理基底のセマンティック抽象化内で学習することを可能にするフレームワークである。
textitSAGEは、A-EQA上で53.21% LLM-Match Success Rateを達成することで、プランナー支援の実施ナビゲーションを大幅に改善することを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:34:30 GMT)
Bridging the Cognitive Gap: A Unified Memory Paradigm for 6G Agentic AI-RAN [62.4] 6Gは、知覚、推論、進化が可能なエージェントAIを受け入れるために、従来の自動化を超越しなければならない。
この記事では、インターフェースバウンドからメモリ中心アーキテクチャへのシフトを想定します。
メッセージパッシングをゼロコピーオブザーバビリティに置き換えることで、AIエージェントがリアルタイムの応答性と長時間のコンテキストの間のギャップを埋めることができます。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:04:10 GMT)
ComplexMCP: Evaluation of LLM Agents in Dynamic, Interdependent, and Large-Scale Tool Sandbox [61.9] $textbfComplexMCP$は厳格な条件下でエージェントを評価するために設計されたベンチマークである。
Model Context Protocol (MCP)上に構築された$textbfComplexMCP$は300以上の精巧にテストされたツールを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:20:51 GMT)
FERA: Uncertainty-Aware Federated Reasoning for Large Language Models [60.5] 我々は、サーバがプライベートなデモンストレーションを行う異種クライアントと協調することで、多段階推論を改善するフェデレーション推論について研究する。
重要な課題は、クライアントの信頼性がクエリ依存であるのに対して、サーバはクライアントデータを検査して、どのコントリビューションが信頼できるかを判断できません。
本稿では,サーバクライアントの反復的コリファインメントに基づくトレーニングフリーフレームワークである Uncertainty-Aware Federated Reasoning (FERA) を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:04:51 GMT)
DeepRefine: Agent-Compiled Knowledge Refinement via Reinforcement Learning [60.4] エージェントコンパイルされた知識ベースは、下流タスクにおいて、大きな言語モデル(LLM)エージェントに対して永続的な外部知識を提供する。
しかし、その品質は、不完全性、不完全性、浮揚性によって体系的に制限される
論文参考訳(メタデータ) (Mon, 11 May 2026 12:48:31 GMT)
Thinking with Novel Views: A Systematic Analysis of Generative-Augmented Spatial Intelligence [60.1] ノベルビューによる思考(TwNV)は、生成的なノベルビュー合成を推論ループに統合するパラダイムである。
TwNV は +1.3 から +3.9 pp の精度を常に向上し、視点感性サブタスクにおいて最大のゲインを持つことを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:59:09 GMT)
NanoResearch: Co-Evolving Skills, Memory, and Policy for Personalized Research Automation [59.0] LLMを利用したマルチエージェントシステムは、アイデアから論文執筆までの完全な研究パイプラインを自動化できるようになったが、根本的な疑問が残る。
我々は,三段階共進化によってこれらのギャップに対処するマルチエージェントフレームワークであるNanoResearchを提案する。
技能銀行は、繰り返しの業務をプロジェクト間で再利用可能なコンパクトな手続き規則に蒸留する。
メモリモジュールは、各ユーザの研究履歴における計画決定の基礎となる、ユーザとプロジェクト特有のエクスペリエンスを維持します。
ラベルフリーポリシー学習は、自由形式のフィードバックをプランナーの永続パラメータ更新に変換し、その後の調整を再構築する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:33:47 GMT)
HarmoWAM: Harmonizing Generalizable and Precise Manipulation via Adaptive World Action Models [58.2] 世界行動モデル(WAM)は、物理力学のモデリングによるロボット制御のための有望なパラダイムとして登場した。
HarmoWAMは、予測と反応の制御を統一するために世界モデルを完全に活用し、一般的なトランジットと正確な操作を可能にする。
実世界の6つのロボットタスクにまたがる3つのトレーニング未確認テスト環境を構築し、背景、位置、オブジェクトの意味のバリエーションをカバーした。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:59:56 GMT)
Route Before Retrieve: Activating Latent Routing Abilities of LLMs for RAG vs. Long-Context Selection [57.4] Pre-Routeは、応答前に構造化推論を実行するプロアクティブなルーティングフレームワークである。
本研究は, (i) LLMは, ガイドラインを確実に適用可能な遅延ルーティング能力を有すること, (ii) 線形プローブにより, 表現空間における最適ルーティングの分離性を高めること, (iii) 蒸留により, この推論構造を, 軽量展開のためのより小さなモデルに伝達すること,の3つの重要な知見を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:10:55 GMT)
Uni-Synergy: Bridging Understanding and Generation for Personalized Reasoning via Co-operative Reinforcement Learning [57.0] 我々は、パーソナライズされた理解と生成を共同で最適化する、エンドツーエンドの強化学習フレームワークSync-R1を提案する。
Sync-R1はパーソナライズされた理解を可能にしてコンテンツ生成をガイドし、生成した品質は相互に理解を洗練させる。
また,低電位トラジェクタを適応的にフィルタして勾配分散を低減し,収束を加速する動的グループスケーリング(DGS)も導入する。
実験結果から,Sync-R1は高度なクロスタスク推論とロバストなパーソナライゼーションを実現していることがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:18:26 GMT)
Adversarial Attacks Against MLLMs via Progressive Resolution Processing and Adaptive Feature Alignment [56.1] 敵対的摂動は、特定の対象物として良性画像を認識するマルチモーダル大言語モデル(MLLM)を誤解させる可能性がある。
これにより、ブラックボックスMLLMの堅牢性を理解し改善するために、転送ベースのターゲットアタックが重要である。
マルチスケールなグローバルなセマンティックガイダンスとロバストな中間層局所アライメントを統合した,トランスファーベースの攻撃フレームワークであるPRAF-Attackを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:45:48 GMT)
Count Anything at Any Granularity [55.7] KubriCountは、これまでで最大で、最も包括的な注釈付きカウントデータセットである。
テキストと視覚的特徴を相補的なターゲット仕様として併用する多粒カウントモデルを訓練する。
HieraCountは、マルチグラデーションカウントの精度を大幅に改善し、現実のシナリオに対して堅牢に一般化する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:32:37 GMT)
Beyond Spatial Compression: Interface-Centric Generative States for Open-World 3D Structure [55.2] 現在の3Dトークンは、表現を空間圧縮として扱うが、コンポーネントの所有権とアタッチメントの妥当性は暗黙的に残す。
我々は、トークン化がパッシブ圧縮コードではなく操作状態を構成する、インターフェイス中心の生成状態という別の視点を定式化する。
我々は、この定式化を、C2LT-3D(Component-Conditioned Canonical Local Tokens)でインスタンス化し、表現を標準局所幾何学、パーティション条件付きコンテキスト、およびリレーショナルシーム変数に分解する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:09:28 GMT)
Layer Collapse in Diffusion Language Models [54.9] 拡散言語モデル (DLM) は自己回帰言語モデル (AR) の代替として登場した。
DLMの層崩壊は, 過度なトレーニングによるものではなく, 過度なトレーニングによるものであることを示す。
私たちの発見は、非常に実践的な意味を持っている。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:56:53 GMT)
Learning to Align Generative Appearance Priors for Fine-grained Image Retrieval [54.1] GAPanは、カテゴリー予測から外観モデリングへの学習目標を再構成するアライメントネットワークである。
GAPanは、広く使われている細粒度ベンチマークと粗粒度ベンチマークの両方で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:35:26 GMT)
StreamPro: From Reactive Perception to Proactive Decision-Making in Streaming Video [53.8] プロアクティブなストリーミングビデオ理解には、ビデオストリームを継続的に処理し、応答すべきタイミングを決定するモデルが必要である。
既存のベンチマークは、明確な証拠が現れた後にのみ応答がトリガーされる"シー・ザ・アンサー"パラダイムに大きく従っている。
StreamProは、パーセプション理解、テンポラル推論、プロアクティブエージェンシーの3つの相補的な視点からストリーミングモデルを評価する新しいベンチマークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:01:15 GMT)
Personal Visual Context Learning in Large Multimodal Models [53.3] パーソナライズされたクエリを解決するために,ユーザ固有の視覚的コンテキストを使用する即時学習機能であるPersonal Visual Context Learning(Personal)を提案する。
LMMを解析した結果,視覚的エビデンスを活用するメカニズムや,複数の視覚的観察を集約するメカニズムが重要視されていることが明らかとなった。
本稿では,ユーザの視覚的コンテキストを自己修復型メモリバンクに構造化し,クエリ適応型エビデンス選択を採用する強力なベースラインであるエージェントコンテキストバンクを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:59:17 GMT)
ForceFlow: Learning to Feel and Act via Contact-Driven Flow Matching [53.3] ForceFlowは、フローマッチングに基づいて構築された、フォース対応のリアクティブフレームワークである。
ForceFlowは、強力なベースラインであるForceVLAよりも37%の成功率の向上を実現している。
また、接触力の自己調節において、正確な力信号予測と優れた性能を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:27:00 GMT)
ExtraVAR: Stage-Aware RoPE Remapping for Resolution Extrapolation in Visual Autoregressive Models [52.6] 我々は,グローバルな反復,局所的な反復,詳細劣化を抑制するために,ステージアウェアのRoPEリマッピングを提案する。
また、分解能不変な正規化エントロピーを介して分散を定量化するエントロピー駆動適応アテンションを提案する。
本手法は, 構造コヒーレンスと細部忠実度の両方において, 先行分解能・分光法より常に優れる。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:14:38 GMT)
MulTaBench: Benchmarking Multimodal Tabular Learning with Text and Image [52.5] MulTaBenchは40のデータセットのベンチマークで、画像-タブラルタスクとテキスト-タブラルタスクを等しく分割する。
テキストと画像のモダリティにまたがって、ターゲット認識表現のチューニングによる利得が一般化されることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:12:05 GMT)
DataMaster: Towards Autonomous Data Engineering for Machine Learning [52.0] タスク条件付き自律データエンジニアリングについて検討し、エージェントがデータ側のみを最適化することで、固定学習アルゴリズムを改善する。
木構造検索,共有候補データ,累積メモリを統合したデータエージェントフレームワークであるDataMasterを提案する。
MLE-Bench LiteとPostTrainBenchの2種類のベンチマークでDataMasterを評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:46:24 GMT)
GuardAD: Safeguarding Autonomous Driving MLLMs via Markovian Safety Logic [51.9] MLLM(Multimodal large language model)は、自律運転システムに統合されつつある。
それらは、特に事故を起こしやすいシナリオにおいて、多様な安全上の脅威に弱いままである。
我々は,AD安全性を進化するマルコフ論理状態として定式化するモデル非依存型安全ガードであるGardadを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:28:03 GMT)
How Mobile World Model Guides GUI Agents? [51.3] デルタテキスト、フルテキスト、拡散ベースのイメージ、レンダリング可能なコードという、4つのモードでワールドモデルをトレーニングします。
これらのモデルはMobileWorldBenchとCode2WorldBenchの両方でSoTAのパフォーマンスを達成する。
低アクションエントロピーを持つ過信な移動体エージェントの場合、後部自己反射は限られた利得を与える。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:49:31 GMT)
Optimistic Dual Averaging Unifies Modern Optimizers [51.2] 我々は,Muon, Lion, AdEMAMix, NAdamといった最先端の一般化に関する共通の視点を提供するSODAを紹介する。
理論上は1/k$の減衰スケジュールを通した重量減衰チューニングを不要とする,任意のベースに対する実用的なSODAラッパーを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:30:47 GMT)
Metis: Learning to Jailbreak LLMs via Self-Evolving Metacognitive Policy Optimization [51.1] 我々は、推論時ポリシー最適化としてジェイルブレイクを改定するフレームワークであるMetisを紹介する。
メティスは比較手法の中でも89.2%で最強のアタック成功率(ASR)を達成している。
冗長な探索を最適化に置き換えることで、Metisはトークンコストを平均8.2倍、最大11.4倍に削減する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:45:00 GMT)
Muon is Not That Special: Random or Inverted Spectra Work Just as Well [51.0] 正確な幾何構造が性能に影響を及ぼす重要な要因ではないことを実証する。
ここでは、Schatten (quasi-size)normsに基づく幾何学のファミリであるFreonを紹介する。
また、特異値をランダムノイズで置き換える不条理なKaonを導入する。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:42:48 GMT)
BGG: Bridging the Geometric Gap between Cross-View images by Vision Foundation Model Adaptation for Geo-Localization [50.7] Cross-View Geo-Localization (CVGL) は画像検索により画像の位置を求める。
本稿では,視覚基礎モデル(VFM)に基づく画像間の幾何学的ギャップをブリッジするパラメータ効率の枠組みを提案する。
主にMFEA(Multi-granularity Feature Enhancement Adapter)と周波数対応構造アグリゲーション(FASA)モジュールを含んでいる。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:46:33 GMT)
Interpretability Can Be Actionable [50.7] 解釈可能性とは、ディープニューラルネットワークの振る舞いを説明することである。
急速な成長にもかかわらず、この作品の多くが実際的な影響に変換されていないという懸念が高まっている。
本論文は, 中心的欠落成分は新しい方法ではなく, 評価基準である, 解釈可能性は行動可能性によって評価されるべきである,と論じる。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:08:21 GMT)
Swarm Skills: A Portable, Self-Evolving Multi-Agent System Specification for Coordination Engineering [50.7] textbfSwarm Skillsは、マルチエージェントのセマンティクスを用いて、Arthhropic Skills標準を拡張したポータブル仕様である。
Swarm Skillsはマルチエージェントを、役割、実行バウンダリ、自己進化のためのビルトインセマンティック構造からなる、一級の分散可能なアセットに変える。
我々は,Swarm Skillsがプログレッシブ開示を通じて,ゼロアダプタのクロスエージェントポータビリティを実現する方法を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:26:58 GMT)
TIE: Time Interval Encoding for Video Generation over Events [50.7] ディレクタースタイルのプロンプト、ロボットアクション予測、インタラクティブなビデオエージェントは、同時イベントに対する時間的根拠を要求する。
現代のビデオジェネレータは、ポイントワイドな位置エンコーディングを通して、タイムを離散的なポイントとして表現する。
Time Interval TIEは、プラグイン・アンド・プレイ・インターバル・アウェアの一般化である。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:23:14 GMT)
CLEF: EEG Foundation Model for Learning Clinical Semantics [50.4] CLEFは,脳波基礎モデルである。
CLEFは, 疾患の表現型, 薬物曝露, 脳波所見にまたがる新しい234タスク・ベンチマークで評価した。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:34:58 GMT)
Optimizer-Induced Mode Connectivity: From AdamW to Muon [50.3] 我々は、Lion-$mathcalK$ファミリー内の1つのAdamW、Muon、その他からの解が、十分に大きな幅で連結集合を形成することを示す。
広帯域では2つの異なる領域が正則化に応じて解離または重なり合うことができる。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:07:36 GMT)
Separate First, Fuse Later: Mitigating Cross-Modal Interference in Audio-Visual LLMs Reasoning with Modality-Specific Chain-of-Thought [49.5] モーダル間干渉を低減するための音声・視覚的推論フレームワークとして, 分離ファースト, ファウズ・レイト (SFFL) を提案する。
SFFLは、モーダリティ固有の連鎖推論を強制し、別々の音声および視覚的推論トレースを生成し、答えのエビデンスを統合する。
実験では精度と頑健さの両面で一貫した改善が示され、一般的なAVQAベンチマークでは5.16%、クロスモーダル幻覚ベンチマークでは11.17%の平均的な相対的な増加が得られた。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:50:27 GMT)
GraphReAct: Reasoning and Acting for Multi-step Graph Inference [49.3] GraphReActは、グラフ構造化データに対するステップバイステップの推論を可能にするグラフ推論実行フレームワークである。
検索と精細化の両方で推論をインターリーブすることで、我々のフレームワークは文脈拡張から圧縮への進歩的な移行を可能にします。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:15:00 GMT)
RoboMemArena: A Comprehensive and Challenging Robotic Memory Benchmark [49.2] 記憶はロボットインテリジェンスにとって重要な要素であり、ロボットは長期のタスクを達成するために過去の観察と行動に頼る必要がある。
既存のロボットメモリベンチマークには、メモリ形成のためのマルチモーダルアノテーションがなく、タスクカバレッジと構造的複雑さが制限されており、実際の評価なしにシミュレーションに制限されている。
このギャップに対処するため、26タスクの大規模ベンチマークであるRoboMemArenaでは、タスク毎の平均軌道長が1,000ステップを超え、サブタスクの68.9%がメモリ依存である。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:54:49 GMT)
A Stability Benchmark of Generative Regularizers for Inverse Problems [49.0] 広範に使われている変分法に触発された現代最適化手法に対する生成的アプローチをベンチマークする。
この結果から、どの設定やアプリケーション生成先が最先端の再構築を実現することができるのかが分かる。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:58:30 GMT)
Bringing Multimodal Large Language Models to Infrared-Visible Image Fusion Quality Assessment [48.9] 赤外線可視画像融合(IVIF)は、熱情報と詳細な空間構造を単一の融合画像に統合し、知覚を高めることを目的としている。
近年のIVIF報酬モデリングの取り組みは人間の評価から学ぶが、集計されたスコアにスカラー回帰を用いる。
本稿では,MLLMを用いて人間の視覚知覚を再現し,連続的な品質スコアを生成するFuScoreを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:29:26 GMT)
The Alpha Blending Hypothesis: Compositing Shortcut in Deepfake Detection [48.9] 我々はアルファブレンディング仮説を導入し、最先端のフレームベースの検出器が主にアルファブレンディングサーチとして機能することを示した。
我々は、この仮説を実験的に検証し、ディープフェイク検出器がいわゆるセルフブレンド画像に対して高い感度を示すことを示した。
提案手法では, ブレンディング・サーチとブレンディング・ショートカットに耐性のあるモデルからの予測が極めて相補的であり, アンサンブル構成で94.0%の最先端のAUROCが得られることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:35:39 GMT)
RadThinking: A Dataset for Longitudinal Clinical Reasoning in Radiology [48.7] RadThinkingは、がんスクリーニングの推論を明示的でトレーニング可能なデータセットです。
このデータセットは、43のがんグループにわたる9,131人の患者から、20,362人のCTスキャンにまたがる。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:57:35 GMT)
Tensor Product Representation Probes Reveal Shared Structure Across Linear Directions [48.3] 我々は、既知の線形表現を持つモデルを研究するが、高度に構造化された領域で訓練される。
我々は、線形プローブ間の共有構造を復元するためにTPRプローブを訓練する。
その結果,方向表現はより構造化された基礎表現の投影である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:18:43 GMT)
Beyond Distribution Estimation: Simplex Anchored Structural Inference Towards Universal Semi-Supervised Learning [47.9] 我々は、Universal Semi-supervised Learning (UniSSL)として批判的だが未探索のパラダイムを定式化する。
既存の手法は、通常擬似ラベルでラベル付けされていないデータを利用する。
我々は、表現レベルの構造推論からバイパス分布推定へ焦点を移す。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:23:43 GMT)
Response-G1: Explicit Scene Graph Modeling for Proactive Streaming Video Understanding [47.1] Response-G1は、蓄積されたビデオエビデンスと、シーングラフによるクエリの期待応答条件との明示的で構造化されたアライメントを確立する新しいフレームワークである。
1)ストリーミングクリップからのオンラインクエリ誘導シーングラフ生成、(2)最も意味のある歴史的シーングラフのメモリベース検索、(3)フレーム単位の「サイレンス/レスポンス」決定を促す検索強化トリガーである。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:58:53 GMT)
FocuSFT: Bilevel Optimization for Dilution-Aware Long-Context Fine-Tuning [46.9] FocuSFTは、大規模言語モデルの双方向最適化フレームワークである。
応答の因果マスキングを維持しながら、コンテキストトークンに対して双方向の注意を払っている。
注意分析により、FocuSFTは注意シンクの質量を529$times$で減らし、トレーニング中にコンテキストエンゲージメントを3倍にすることが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:30:35 GMT)
ReVision: Scaling Computer-Use Agents via Temporal Visual Redundancy Reduction [46.7] ReVisionは、冗長な視覚的パッチを削除するトラジェクトリ上で、マルチモーダル言語モデルをトレーニングするために使用される。
ReVisionはトークン使用率を平均で46%削減し,無ドロップベースラインでの成功率を3%向上することを示した。
このことは、視覚史において一般的に見られる飽和は、過去の情報の有用性の制限によるものではなく、むしろ非効率なトークン表現の結果によるものであることを示唆している。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:27:54 GMT)
PhyGround: Benchmarking Physical Reasoning in Generative World Models [46.5] ビデオ生成における物理的推論を評価するための基準付きベンチマークであるPhyGroundを紹介する。
ベンチマークには250のキュレートされたプロンプトが含まれており、それぞれが予想される物理的な結果と13の物理法則の分類が含まれている。
我々は,大規模で品質管理された人間の研究を通じて,8つの現代映像生成モデルを評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:30:51 GMT)
SkillEvolver: Skill Learning as a Meta-Skill [46.5] オンラインスキル学習のための軽量なプラグアンドプレイソリューションである textbfSkillEvolver を提案する。
SkillEvolverの学習対象は、モデルの重みではなく、スキルの散文とコードである。
微量蒸留とは異なり、メタスキルは学習スキルの展開後にのみ洗練される。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:58:25 GMT)
Long-Horizon Q-Learning: Accurate Value Learning via n-Step Inequalities [46.5] 本稿では,最適作用値関数を学習する際の合成誤差に対する基本的バックストップを提案する。
Long-Horizon Q-learning (LQL)は、事前の最適性強化観測に基づいて構築される。
LQLは、同じランタイムで1ステップのTDとnステップのTD学習を一貫して上回る。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:20:38 GMT)
ABRA: Agent Benchmark for Radiology Applications [46.4] エージェントがビューアとOrthanc DICOMサーバを操作する無線エージェントベンチマークであるABRAを紹介する。
ABRAには3つの困難層と8つのタイプにわたる655の655のタスクが含まれている。
各エピソードは、タスクタイプ固有の自動スコアラーによって、プランニング、実行、アウトカム(Blueth et al., 2025)に沿ってスコアされる。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:34:20 GMT)
Task-Aware Calibration: Provably Optimal Decoding in LLMs [46.3] LLMデコーディングは、しばしば出力を生成するためにモデルの予測分布に依存する。
本稿では,タスク誘発潜在空間におけるモデルの予測分布をキャリブレーションするパラダイムとしてタスクキャリブレーションを導入する。
我々の研究は、タスクキャリブレーションが様々なタスクやアプリケーションに対してより信頼性の高いモデル決定を可能にすることを実証している。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:48:04 GMT)
MemReread: Enhancing Agentic Long-Context Reasoning via Memory-Guided Rereading [46.0] 我々はMemRereadを提案し、標準的な注意機構の2次複雑さを伴わずに長文推論タスクに取り組む。
MemRereadは、ストリーミング読み込みに基づいて中間検索を回避し、最終メモリが不十分な場合に質問の分解と再読み込みをトリガーする。
この設計は、文書理解の固有の論理的流れを保ちながら、非線形推論をサポートする。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:30:59 GMT)
AssayBench: An Assay-Level Virtual Cell Benchmark for LLMs and Agents [46.0] 我々は1,920個のCRISPRスクリーンから構築された表現型スクリーン予測のベンチマークであるAssayBenchを紹介する。
我々は,各画面の遺伝子ランク予測として画面予測タスクを定式化し,性能比較のための連続指標である調整されたnDCGを導入する。
評価の結果,既存手法は経験的に推定された性能天井から遠く離れていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:27:16 GMT)
Measuring Five-Nines Reliability: Sample-Efficient LLM Evaluation in Saturated Benchmarks [45.9] 大規模言語モデル(LLM)は信頼性に敏感なアプリケーションで使用される。
厳密な信頼境界を持つ稀な失敗確率を推定するには、違法に大きなLSM推論サイズが必要である。
そこで本研究では,クロスエントロピー手法を用いて,故障確率入力に集中したサンプリング分布を学習する。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:23:44 GMT)
WorldReasonBench: Human-Aligned Stress Testing of Video Generators as Future World-State Predictors [45.5] 本稿では,映像生成評価を世界状態予測として再設定するWorldReasonBenchを紹介する。
人手による2部構成手法を用いて生成した映像の評価を行った。
WorldRewardBenchは、約6Kのエキスパートアノテートされたペアが1.4Kビデオに対して設定された選好ベンチマークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:06:57 GMT)
PriorVLA: Prior-Preserving Adaptation for Vision-Language-Action Models [45.5] 事前学習した事前学習を効果的に活用するためのフレームワークである PreVLA を提案する。
1タスクにつき10回のデモで、PreferVLAはIDが48%、OODが32%、pi0.5が24ポイント、OODが22ポイントを超えた。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:56:02 GMT)
Not Blind but Silenced: Rebalancing Vision and Language via Adversarial Counter-Commonsense Equilibrium [45.3] 幻覚は,言語的先行と視覚情報との平衡不均衡に起因することを示す。
本稿では,対談パッチを通じて視覚的コンテキストを摂動させるトレーニングフリーフレームワークであるAdversarial Counter-Commonsense Equilibrium(ACE)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:55:59 GMT)
Trust or Abstain? A Self-Aware RAG Approach [45.1] Retrieval-augmented Generation (RAG)は、外部のエビデンスを組み込むことで、大きな言語モデルを改善する。
既存のアプローチは、各回答パスが正しいかどうかを明示的に問うことなく、使用するソースをコーディネートする。
我々は、忠実なRAGはLLM自己認識、すなわち、自身の知識と推論の限界を認識する能力を必要としていると論じる。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:44:27 GMT)
Rethinking Agentic Search with Pi-Serini: Is Lexical Retrieval Sufficient? [45.0] 本稿では,文書の検索,閲覧,読取を行う3つのツールを備えた検索エージェントであるPi-Seriniを紹介する。
以上の結果から,BrowseComp-Plusでは,検索深度を十分に設定した語彙レトリバーが,より有能なLLMと組み合わせることで,効果的な深層学習を支援することができることがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:58:57 GMT)
RecoAtlas: From Semantic Plausibility to Set-Level Utility in LLM Recommendation Agents [44.7] Recommendation Atlasは、行動基準付きショッピングエージェントを評価するためのベンチマークである。
RecoAtlasはエージェントシステムの有意義なベンチマークの鍵となる特性を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:55:32 GMT)
Responsible Benchmarking of Fairness for Automatic Speech Recognition [44.6] 多くの研究は、話者群(SG)にまたがる不平等な性能を有する自動音声処理(ASR)システムを示している。
我々は、機械学習フェアネス、社会科学、音声科学の文献に基づいて、ASRフェアネスをベンチマークするためのベストプラクティスを策定する。
フェアネスコーパスのメタデータで利用できる限り多くの人口統計変数の交叉性を可能な限り詳細に分析することを提唱する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:11:50 GMT)
Active-SAOOD: Active Sparsely Annotated Oriented Object Detection in Remote Sensing Images [44.3] 本稿では,能動SAOOD(Active-SAOOD)と呼ばれる,能動学習に基づくスパース指向オブジェクト検出手法を提案する。
Active-SAOODは、現在のモデル状態に最も適したインスタンスレベルで、最も価値のあるスパースサンプルを積極的に選択します。
複数のデータセットの実験により、Active-SAOODは既存のSAOODメソッドのパフォーマンスと安定性の両方を大幅に改善することが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:12:26 GMT)
Aligning LLM Uncertainty with Human Disagreement in Subjectivity Analysis [44.3] 我々は、モデルが人間の不一致を反映した不確実性を表現しながら予測する不確実性を考慮した主観性分析を提唱する。
この視点を運用するために,二相認識と不確実性アライメントの枠組みを提案する。
3つの主観的分析課題の実験は、DPUAが人間の不一致とモデルの不確実性をよりよく整合させながら、タスク性能を保っていることを示している。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:52:58 GMT)
When Are LLM Inferences Acceptable? User Reactions and Control Preferences for Inferred Personal Information [44.2] ユーザ自身のChatGPT履歴から,非統計推論の例を抽出する可視化ツールを構築した。
主に、推測がユーザを誤解していると感じたり、あるいは期待された使用と不一致を感じたときに、不快が生じた。
これらの結果は,LLM推論の受容性は,その内容だけでなく,その生成方法に関する文脈に敏感な規範によっても支配されていることを示唆している。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:39:48 GMT)
Reinforce Adjoint Matching: Scaling RL Post-Training of Diffusion and Flow-Matching Models [44.1] 拡散およびフローマッチングモデルは、事前学習が監督された回帰であるため、スケールする。
この構造がRLポストトレーニングにまで拡張されていることを示す。
KL-正規化報酬の下では、最適生成過程はより高い報酬を持つ試料に対してクリーンエンドポイント分布を傾ける。
Reinforce Adjoint Matching (RAM: Reinforce Adjoint Matching) を導出します。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:56:29 GMT)
Adaptive Policy Learning Under Unknown Network Interference [43.9] 我々は,干渉ネットワークを協調的に学習し,ギブスサンプリングによる個別レベルの処理割り当てを適応的に最適化するトンプソンサンプリングアルゴリズムを開発した。
本手法は, 頭と頭の比較において, 後悔のオーダー・オブ・マグニチュード・リダクション以上のことを達成している。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:57:50 GMT)
Amortizing Causal Sensitivity Analysis via Prior Data-Fitted Networks [43.9] 因果感度分析は、観測されていない共起の存在下で因果効果の推定値のバウンドを提供することを目的としている。
既存の因果感度分析の方法はインスタンスごとの手順であり、データセット、因果クエリ、感度レベル、処理に新しい計算を必要とする。
そこで本研究では,先行データ適応ネットワークに基づく因果感度解析のための償却手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:59:22 GMT)
When Does Non-Uniform Replay Matter in Reinforcement Learning? [43.8] 非一様リプレイの有効性は, 再生量, 環境ステップ毎の再生遷移数, 期待精度, サンプル遷移の頻度, リプレイサンプリング分布のエントロピーの3つの要因に支配されている。
我々は,高エントロピーと無視できない計算オーバーヘッドを保ちながら,サンプリングを最近の経験に偏りを与える,単純なTrncated Geometric replayを採用する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:11:05 GMT)
EchoDistill:Alignment Noisy-to-Clean Self-Distillation for Robust Audio LLMs [43.8] Echodistillはアライメントベースのノイズからクリーンな自己蒸留フレームワークである。
複雑な雑音下でのAudio Large Language Modelのセマンティックな信頼性とタスク性能を大幅に改善する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:30:25 GMT)
Stabilizing Temporal Inference Dynamics for Online Surgical Phase Recognition [42.8] オンライン外科的位相認識(SPR)モデルはフレームの精度が高いが、その予測は時間的安定性に欠けることが多い。
この不安定性はランダムノイズではなく、2つのメカニズムから生じることを示す。
モデルに依存しないプラグイン・アンド・プレイコンポーネントを用いて時間的推論ダイナミクスを明示的に安定化する統合トレイン・推論・評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:56:15 GMT)
CapVector: Learning Transferable Capability Vectors in Parametric Space for Vision-Language-Action Models [42.6] 補助的な訓練対象を持つ高度な微調整法は、性能を改善し、収束ステップの数を減らすことができる。
本稿では,事前学習したVLAモデルが,標準的な教師付き微調整における性能向上や適応コストの低減に失敗するケースに対して,新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:41:54 GMT)
SDFlow: Similarity-Driven Flow Matching for Time Series Generation [42.6] 我々は,凍結したVQ潜在空間で完全に動作する非自己回帰フレームワークであるSDFlowを提案する。
SDFlowは最先端の性能を実現し,識別スコアを向上し,コンテキストFIDを大幅に低減することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:04:49 GMT)
PolarVSR: A Unified Framework and Benchmark for Continuous Space-Time Polarization Video Reconstruction [42.4] 線形偏光度(DoLP)や偏光角度(AoP)などの表面偏光特性の偏光画像化
既存のDoFP(Department of Focal-Plane)カメラはハードウェアのボトルネックに直面しており、高いフレームレートの取得をサポートできないことが多い。
本研究では,最初の時空間偏光ビデオ再構成アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:33:50 GMT)
Flow-OPD: On-Policy Distillation for Flow Matching Models [42.3] Flow-OPDは、オンライン蒸留をFlow Matchingモデルに統合するポストトレーニングフレームワークである。
これはGenEvalのスコアを63から92に引き上げ、OCRの精度を59から94に引き上げ、バニラGRPOよりも10点程度向上した。
これらの結果は、汎用的なテキスト-画像モデルを構築するためのスケーラブルなアライメントパラダイムとして、Flow-OPDを確立する。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:10:01 GMT)
Unveiling High-Probability Generalization in Decentralized SGD [41.9] 分散一般化降下法(D-SGD)は大規模分散学習の効率的な方法である。
既存の研究は主に期待された結果に対処し、$mathcalOleft(frac1sqrtmnlog (1/)right)$に制限された。
最適な$mathcalOleft(frac1sqrtmnlog (1/)right)$を目指して,D-SGDの高確率学習理論を開発した。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:51:34 GMT)
SlimSpec: Low-Rank Draft LM-Head for Accelerated Speculative Decoding [41.8] 出力ではなく内部表現を圧縮する,ドラフトラのLMヘッドの低ランクパラメータ化であるSlimSpecを提案する。
SlimSpecは標準のLMヘッドアーキテクチャよりも4text-5times$Accelerationを実現している。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:22:37 GMT)
Game-Theoretic Modeling of Heterogeneous Investor Interactions for Stock Price Forecasting [41.7] 株価予測のための不均一な投資家相互作用を捉えるゲーム理論モデリング手法を提案する。
当社の手法は、最先端の株価予測手法を効果的に上回る。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:24:07 GMT)
What Concepts Lie Within? Detecting and Suppressing Risky Content in Diffusion Transformers [41.6] AHV-D&Sは、DiTにおける画像生成のためのトレーニング不要な推論時セーフガードである。
AHV-D&Sは、視覚的品質を維持しつつ、性的、著作権のあるスタイル、および様々な有害なコンテンツを効果的に抑制することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:31:57 GMT)
Muown: Row-Norm Control for Muon Optimization [41.5] Muonは、言語モデルの事前トレーニングにおいてAdamWと強く競合する。
Muownは、Muon、SOAP、AdamW、Lionの複雑さを改善します。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:26:06 GMT)
The Value of Mechanistic Priors in Sequential Decision Making [41.4] ハイブリッド・メカニスティック・モデル、学習された残差を持つ物理的先行性は、良い決定に必要なデータを減らすことを約束するが、これをテストするための計算可能な基準は存在しない。
両体制とも, 逐次意思決定におけるメカニスティックな先駆的価値を特徴づける。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:43:53 GMT)
Improving Human Image Animation via Semantic Representation Alignment [41.4] 我々はセマンティックREPAという新しい手法を導入し、セマンティックREPAは表現アライメントを通してセマンティック表現を監督信号として活用する。
具体的には、ビデオ潜伏者から得られた構造表現とビデオ深度推定機能とを整列する構造アライメントモジュールをトレーニングすることから始める。
次に、事前訓練されたモジュールを固定し、拡散モデルの構造表現に関する追加の監視を行う。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:10:07 GMT)
3DReflecNet: A Large-Scale Dataset for 3D Reconstruction of Reflective, Transparent, and Low-Texture Objects [41.3] 3DReflecNetは22TBを超える大規模ハイブリッドデータセットである。
このデータセットは、様々な材料、複雑な照明条件、幅広い幾何学的形態にまたがる。
我々は、画像マッチング、構造移動、新しいビュー合成、削除、リライティングの5つのコアタスクのベンチマークを設計する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:51:28 GMT)
Simply Stabilizing the Loop via Fully Looped Transformer [41.2] Looped Transformerは、ループイテレーションの数が増えると、トレーニングの不安定性に悩まされる。
実験により、フルループ変換器はトレーニングの安定性を改善し、下流の性能を高め、異なるテスト時間計算予算の下で予備的適応性を提供することを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:21:53 GMT)
KernelBenchX: A Comprehensive Benchmark for Evaluating LLM-Generated GPU Kernels [41.0] LLMベースのTritonカーネル生成は大きな関心を集めているが、基本的な実験的な疑問は未解決のままである。
本稿では,その正しさとハードウェア効率のカテゴリ認識による評価を通じて,この問題に対処するためのベンチマークであるKernelBenchXを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:42:58 GMT)
Unifying Scientific Communication: Fine-Grained Correspondence Across Scientific Media [40.4] 科学知識のコミュニケーションはますます多モーダルになりつつある。
フォーマット間の明示的なリンクの欠如は、概念、視覚、説明がどのように対応するかを追跡するのを難しくする。
研究論文、プレゼンテーションビデオ、解説ビデオ、同じ作品のスライドを統合する最初のベンチマーク。
我々は, 埋め込み型および視覚言語モデルを用いて, 微粒なクロスフォーマット対応を見つける能力を評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:58:11 GMT)
AxiomOcean: Forecasting the Three-Dimensional Structure of the Upper Ocean [40.4] AxiomOceanは、垂直階層と水柱内の層間依存性を表す、グローバルなAI海洋予測モデルである。
10日間の予測では、AxiomOceanは変数とリードタイムの間で高度なAI比較モデルを上回っている。
その結果、AI海洋予測において、上海洋の3次元構造を明示的に保存することは、予測精度と物理的忠実度の両方を改善することができることが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:27:04 GMT)
AnomalyClaw: A Universal Visual Anomaly Detection Agent via Tool-Grounded Refutation [40.3] AnomalyClawは、トレーニング不要な視覚異常検出剤である。
異常判定を多ラウンドの給油プロセスに変換する。
単一ステップの直接推論よりも一貫したマクロAUROC改善を実現している。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:40:07 GMT)
Variational Inference for Lévy Process-Driven SDEs via Neural Tilting [40.1] 我々は、レヴィ駆動SDEにおける変分推論のための神経指数傾斜フレームワークを提案する。
ニューラルネットワークを用いてレヴィ測度を指数関数的に再重み付けすることで、フレキシブルな変動族を構築する。
提案手法は,ガウスに基づく変分法が失敗する状況下で,ジャンプダイナミクスを正確に把握し,信頼性の高い後部推論が得られることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:58:45 GMT)
Beyond Majority Voting: Agreement-Based Clustering to Model Annotator Perspectives in Subjective NLP Tasks [39.6] アノテーションの分解は、NLPデータセットの開発において一般的な現象である。
本稿では,アノテータ間の不一致をモデル化するための合意に基づくクラスタリング手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:04:03 GMT)
Selective Placement of Hollow-Core Fibers for QKD and Classical Communication Coexistence [39.6] メトロトポロジーにおけるリンクの40%をアップグレードすることで、量子モジュールの数を最大49%削減することができる。
その結果、メトロトポロジにおけるリンクの40%のアップグレードは、量子モジュールの数を最大49%削減できることがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:32:27 GMT)
MDrive: Benchmarking Closed-Loop Cooperative Driving for End-to-End Multi-agent Systems [39.5] NHTSAプレクラッシュ型と実世界のV2Xデータセットの両方に基礎を置く225のシナリオからなるクローズドループ協調運転ベンチマークであるMDriveを紹介する。
ベンチマークの結果,マルチエージェントシステムはシングルエージェントシステムよりも一般的に優れていることが示された。
MDriveはまた、シナリオ生成、Real2Sim変換、ヒューマン・イン・ザ・ループ・シミュレーションのためのオープンソースのツールボックスも提供している。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:44:34 GMT)
Private Information Retrieval With Arbitrary Privacy Requirements for Graph-Based Storage [39.2] プライベート情報検索問題におけるプライバシの定義を、フレキシブルなプライバシ要件に対応するように変更する。
すべてのメッセージをすべてのサーバからプライベートにするのではなく,汎用的なプライバシ要件を備えたグラフ関連PIRに重点を置いています。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:27:33 GMT)
Local Private Information Retrieval: A New Privacy Perspective for Graph-Based Replicated Systems [39.2] 本稿では,ユーザのプライバシがサーバのストレージ構造によって管理される,新たな環境を提案する。
特に、サーバからメッセージを取得する一方で、ユーザは、サーバから所望のメッセージインデックスを隠すことに関心があります。
このプライバシ要件を,ローカルユーザのプライバシと結果のPIR問題を,グラフ上のローカルPIRとして定義する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:25:10 GMT)
The Association of Transformer-based Sentiment Analysis with Symptom Distress and Deterioration in Routine Psychotherapy Care [39.1] トランスフォーマー深層学習アーキテクチャは、高度に正確でコンテキスト対応のテキストベースの感情分析モデルを作成している。
心理療法セッションの大規模コーパスにおける微粒な感情モデルから得られた発話レベルおよびセッションレベルの感情特徴を用いて検討した。
OQ合理性または経験的結果モデルを用いて、悪化またはケア停止のリスクを指摘された患者の感情分布には統計的に有意な差がある。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:41:47 GMT)
ViSRA: A Video-based Spatial Reasoning Agent for Multi-modal Large Language Models [38.9] ViSRAは、MLLMの空間的推論機構を調査するためのトレーニング不要のフレームワークである。
これは、専門家モデルからの明示的な空間情報を活用することにより、モジュラーでキュレートされた方法で空間推論を導く。
1)タスク固有のオーバーフィッティングではなく、人間のアライメントと移動可能な3D理解、(2)重い手作業によるキュレーションデータセットとともに、トレーニング後の計算コストが不要である。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:20:09 GMT)
FORGE: Fragment-Oriented Ranking and Generation for Context-Aware Molecular Optimization [38.8] FORGEは、コンテキスト対応の局所編集として分子最適化を再構成する2段階のフレームワークである。
コンパクトな0.6B言語モデルに基づいて構築されたFOGEは、従来よりも一貫して優れていた。
これらの結果は、自然言語学習の代替として、より容易に入手でき、拡張性があり、幻覚のないものとして、明確なフラグメントレベルの監督の価値を強調している。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:06:42 GMT)
TINS: Test-time ID-prototype-separated Negative Semantics Learning for OOD Detection [38.6] 視覚言語モデルは、イメージアライメントとIDラベルと負のセマンティクスを比較することで、OOD検出を可能にする。
textbfTest-time textbfID-prototype-separated textbfNegative textbfSemantics learning method, called textbfTINS。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:54:34 GMT)
Hyperbolic Distillation: Geometry-Guided Cross-Modal Transfer for Robust 3D Object Detection [38.2] クロスモーダルな知識蒸留は、ポイントクラウドと画像特徴を3次元知覚タスクに統合するための効果的な戦略として登場した。
マルチモーダル3次元物体検出(HGC-Det)のための双曲型拘束型クロスモーダル蒸留法を提案する。
本手法は,検出精度と計算コストのトレードオフを改善する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:44:08 GMT)
GPO-V: Jailbreak Diffusion Vision Language Model by Global Probability Optimization [38.2] Diffusion Vision-Language Models (dVLMs) は、従来の自己回帰生成パラダイムから離れることで、マルチモーダルタスクにおいて顕著な効果を示した。
この脆弱性を利用するために,マスク拡散モデルの認知軌道に特化して設計された一般的なジェイルブレイクパラダイムであるグローバル確率最適化(GPO)を提案する。
GPO-Vは,DVLM用に開発された最初の視覚的モダリティジェイルブレイクフレームワークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:29:59 GMT)
Position: Academic Conferences are Potentially Facing Denominator Gaming Caused by Fully Automated Scientific Agents [38.1] 悪意のあるアクターは、AIエージェントをデプロイして、表面的にもっとも可視だが品質の低い大量の論文を生成し、提出する。
比較的安定した受理率の下では、この希釈は、小さな、標的とする正統な論文の出版確率を体系的に増加させることができる。
我々は、様々な緩和戦略を提案し、評価し、永続的な保護にはシステムレベルの政策とインセンティブ改革が必要であると論じる。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:07:15 GMT)
Segment Anything with Robust Uncertainty-Accuracy Correlation [38.1] ニューラルネットワークにおけるテクスチャバイアスのショートカットと人間の視覚における形状中心の処理との対比により、我々は、外見の変化として領域外変化をモデル化し、共同でキャリブレーションをストレスする非剛性変形をモデル化する。
本稿では,ロバスト不確かさ-精度相関(RUAC)を用いたSegment Anythingを提案する。
23個のゼロショット領域にまたがって、RUACはセグメンテーションの品質を改善し、より強い不確実性と精度の相関を持つより忠実な不確実性をもたらす。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:04:02 GMT)
PoDAR: Power-Disentangled Audio Representation for Generative Modeling [37.9] 本稿では,信号パワーをセマンティックコンテンツから切り離すために,ランダム化パワー拡張と潜時一貫性を目標とするフレームワークPoDARを提案する。
PoDARは、ベースラインのパフォーマンスにマッチする収束の約2倍の加速を達成し、LibriSpeech-PCデータセット上で最終話者類似度を0.055倍、UTMOSを0.22倍向上させる。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:05:11 GMT)
Multi-layer attentive probing improves transfer of audio representations for bioacoustics [37.7] 機械学習モデルから学習したヘッドマップ表現を下流タスクラベルに変換する。
ほとんどのバイオ音響ベンチマークは、最終エンコーダ層上の線形層のような固定された低容量プローブを使用する。
時間情報を利用した大規模プローブヘッドの性能が向上したことを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:52:29 GMT)
Shepherd: A Runtime Substrate Empowering Meta-Agents with a Formalized Execution Trace [37.7] ターゲットエージェントのメタエージェント操作を関数として形式化する関数型プログラミングモデルであるShepherdを紹介する。
Shepherdは、すべてのエージェントと環境のインタラクションをGitライクな実行トレースの型付きイベントとして記録し、過去の状態をフォークして再生することができる。
このシステムは、エージェントプロセスと、Dockerよりも5ドル高速にフォークし、リプレイ時のプロンプトキャッシュの再利用を95%以上達成している。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:50:51 GMT)
Conformity Generates Collective Misalignment in AI Agents Societies [37.3] 本稿では,AIエージェントの個体群を,コンフォーマンス・ダイナミクスを用いて,安定な不整合状態へと誘導することができることを示す。
9つの大きな言語モデルと100の意見ペアの意見ダイナミクスをシミュレートすると、各エージェントの振る舞いは2つの競合する力によって支配されていることが分かる。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:30:48 GMT)
A Comparative Study of Model Selection Criteria for Symbolic Regression [37.3] 本研究では, 接地構造関数の摂動によって生成される候補式をランク付けし, 接地構造関数の一般化誤差と選択確率を評価する。
以上の結果から,MDLは,ほとんどのデータセットでテストエラーが最も低く,最短長のモデルを一貫して識別することがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:47:50 GMT)
Only Train Once: Uncertainty-Aware One-Class Learning for Face Authenticity Detection [37.2] FADNetは、顔の偽造検出を一級分類タスクとして再構成する自己教師型フレームワークである。
Evidential Deep Learning (EDL) を組み込んで予測の不確実性を定量化し、プラグアンドプレイの擬似偽画像生成器 (PFIG) を用いて決定境界を絞り込む。
FADNetは既存のSOTA法を大幅に上回り、平均精度は96.63%、平均精度は98.83%である。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:10:04 GMT)
Evidence-based Decision Modeling for Synthetic Face Detection with Uncertainty-driven Active Learning [37.2] EMSFD(Evidence-based decision Modeling for Synthetic Face Detection with uncertainty-driven active learning)を提案する。
提案手法は,既存のSOTAベースラインに比べて15%精度が向上する。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:33:22 GMT)
How Should LLMs Listen While Speaking? A Study of User-Stream Routing in Full-Duplex Spoken Dialogue [36.9] 音声対話システムは、ユーザ入力の到着生成をサポートする必要がある。
チャネル融合はより強力な基底的意味を持ち、一貫してより良い質問性能をもたらす。
クロスアテンションルーティングは質問応答では不十分だが、LLM生成コンテキストをよりよく保存する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:46:47 GMT)
Positive Alignment: Artificial Intelligence for Human Flourishing [36.7] 既存のアライメント研究は、安全と害の防止に関する懸念に支配されている。
ポジティブアライメント(Positive Alignment)とは、人間と生態の繁栄を積極的に支援するAIシステムの開発である。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:11:08 GMT)
Verification Mirage: Mapping the Reliability Boundary of Self-Verification in Medical VQA [36.6] 自己検証は、医療的な視覚的質問応答のデフォルトの安全レイヤとして、ますます使われている。
本稿では,医療用VLM自己検証の信頼性境界をマッピングする診断フレームワークであるMETHOD NAMEを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:00:00 GMT)
Personalized Deep Research: A User-Centric Framework, Dataset, and Hybrid Evaluation for Knowledge Discovery [36.6] 動的ユーザコンテキストをコア検索・推論ループに統合するPDR(Personalized Deep Research)を導入する。
PDRは、ユーザープロファイルモデリングを反復的なクエリ開発、二重ステージ(プライベート/パブリック)検索、コンテキスト認識合成と統合する。
これにより、研究サブゴールとユーザの意図を自律的に調整し、エビデンス収集の停止基準を最適化することができる。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:14:54 GMT)
Retrieve-then-Steer: Online Success Memory for Test-Time Adaptation of Generative VLAs [36.4] 本稿では,VLAモデルのためのオンライン成功メモリ誘導テスト時間適応フレームワークを提案する。
展開中、ロボットは長期記憶に進捗校正された観察動作セグメントを格納する。
推論時に状態関連アクションチャンクを取得し、トラジェクトリレベルの一貫性を通じて一貫性のない候補をフィルタし、それらを前もってエリートアクションに集約する。
この設計により、凍結したVLAは、観測条件付き世代改良を保ちながら、環境特有の成功体験を利用することができる。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:11:10 GMT)
Probing Cross-modal Information Hubs in Audio-Visual LLMs [36.0] オーディオ視覚大言語モデル(AVLLM)は、音声、視覚、テキストのモダリティを共同で推論できる強力なアーキテクチャとして登場した。
本稿では,一方のモダリティから派生した情報を他方のモダリティのトークン表現に符号化する方法について検討する。
本研究では,クロスモーダルシンクトークン内の統合型クロスモーダル情報への依存を促すことにより,トレーニング不要な幻覚緩和手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:34:18 GMT)
Interpretable Coreference Resolution Evaluation Using Explicit Semantics [35.7] CoNLL-F1のような集約統計量を用いて、参照分解能を評価する。
コア参照解決のためのセマンティック・エンハンスド・アセスメント・フレームワークを提案する。
我々のフレームワークは、集約されたメトリクスによって隠されたままの体系的な弱点を明らかにする。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:20:16 GMT)
Cryptographic and Information-theoretic Security Capacities for General Arbitrarily Varying Wiretap Channels [34.7] AVWCの平均誤差と強い秘密化能力は、常にその最大誤差と意味秘密化能力に等しいことを示す。
また、GAVWCでは、セマンティックセキュリティや他の暗号セキュリティ対策が、同じキャパシティ値を達成することも示している。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:14:23 GMT)
Benchmarking Sensor-Fault Robustness in Forecasting [34.3] 我々は,予測アーキテクチャとロバスト性改善手法を評価するために,共有CPS地上センサフォアストレステストプロトコルであるSensorFault-Benchを紹介する。
最悪のシナリオ劣化、クリーン平均二乗誤差(MSE)、最悪のシナリオ故障時間MSEを報告し、絶対誤差から相対ロバスト性を分離する。
SensorFault-Benchは、オープンソースコード、ドキュメント化されたデータアクセス、再生および拡張ガイドを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:41:14 GMT)
Automated Detection of Abnormalities in Zebrafish Development [34.1] 本研究では,ゼブラフィッシュ胚発生の高分解能画像系列の大規模データセットを,条件および化合物曝露下で導入する。
本データセットは,(1)ゼブラの受精度分類,ゼブラフィッシュの卵の生存率の評価(130,368画像),(2)毒性評価,時間とともに有毒な曝露によって引き起こされる奇形の検出(55,296画像)の2つのベンチマークタスクをサポートする。
このデータセットの他に,ゼブラフィッシュ卵の特徴を組み込んだトランスフォーマーベースのベースラインモデルも提示し,初期発生の異常を予測した。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:33:04 GMT)
MATRA: Modeling the Attack Surface of Agentic AI Systems -- OpenClaw Case Study [33.7] 我々はエージェントAIシステムのための実用的脅威モデリングフレームワークMATRAを提案する。
ネットワークサンドボックスや最小限のアクセスアクセスといったアーキテクチャ制御が,インジェクションの爆発半径を制限してリスクを低減する方法を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:58:37 GMT)
PaperFit: Vision-in-the-Loop Typesetting Optimization for Scientific Documents [33.7] ルールベースのツールはビジュアルのレンダリングに盲目であり、ソースコードとログファイルでのみ動作する。
本稿では、ページを反復レンダリングし、欠陥を診断し、制約のある修復を行う、ループ内視覚エージェントPaperFitを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:43:41 GMT)
UniRank: Unified List-wise Reranking via Confidence-Ordered Denoising [33.3] リストの並べ替えは、リクエスト固有の候補項目のプールを、ユーザの満足度を最大化する順序付きスレートに配置する。
提案するUniRankは、ARとNARのリランカを特殊ケースとして復元する、リスト単位のリグレードフレームワークである。
Amazon Books、MovieLens-1M、および工業用ショートビデオデータセットの実験は、UniRankが一貫して最先端のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:12:23 GMT)
XQCfD: Accelerating Fast Actor-Critic Algorithms with Prior Data and Prior Policies [33.3] ロボット強化学習の一般的な実践は、サンプル効率を改善するために追加のデータを統合することである。
既存のアルゴリズムの設計は、この設定で可能なサンプル効率を達成できないことを示す。
本稿では、サンプル効率のよいXQCアクター批判を拡張して、事前訓練されたポリシーを付加したリプレイバッファを用いて実演から学習するXQCfDを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:38:25 GMT)
Position: Let's Develop Data Probes to Fundamentally Understand How Data Affects LLM Performance [33.1] 我々は、適切に定義されたランダムプロセスから合成配列を生成するための体系的手法を開発する必要性を主張する。
データプローブ上でのLCMの挙動を観察することにより、研究者は、データ特性がモデルの性能、一般化、堅牢性にどのように影響するかを体系的に研究することができる。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:44:40 GMT)
Diffusion Masked Pretraining for Dynamic Point Cloud [33.0] ダイナミックポイントクラウドのための統合型自己教師型フレームワークであるDynamic Masked Pretraining (DiMP)を提案する。
DiMPは位置推定と運動学習の両方に拡散モデリングを導入している。
バックボーンのみのダウンストリーム精度を一貫して向上させる。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:43:10 GMT)
Sampling More, Getting Less: Calibration is the Diversity Bottleneck in LLMs [32.9] 本稿では,多様性の崩壊をLCMが復号時に確率質量を割り当てる方法に起因した妥当性多様性フレームワークを提案する。
局所的な障害はデコードステップにまたがって複雑であり、多様性に強いシーケンスレベルの損失をもたらすことを示す。
複数の家系と規模にまたがる14の言語モデルにおいて、多様性の崩壊は特定のサンプリングの制限ではなく、順序と形状の誤校正の結果であることがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:36:30 GMT)
Mutual Enhancement Between Global Tokens and Patch Tokens: From Theory to Practice [32.9] TaTokは理論的に基礎付けられた適応型イメージトークン化フレームワークである。
パッチトークン間で相互情報をモデル化するグローバルトークンを導入する。
実験では、TaTokの最先端性能を確認し、1.3倍のgFID改善と8.7倍の推論速度を提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:51:02 GMT)
Modeling Atomic Conformational Ensembles of Proteins via Test-Time Supervision of Boltz-2 on Cryo-EM Density Maps [32.8] 本稿では,生のCryo-EMマップに基づいて,事前学習した静的構造予測モデルを微調整する新しい原理を提案する。
本稿では,Boltz-2を微調整した原子モデル構築問題に適用し,Cryo-EMマップの入力アンサンブルから原子構造を生成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:18:05 GMT)
Synthetic Pre-Pre-Training Improves Language Model Robustness to Noisy Pre-Training Data [32.7] 大規模な言語モデルは、事前学習のためにWebスケールのコーパスに依存している。
データキュレーションは緩和されるが、そのようなノイズを排除できないため、訓練前のコーパスは実際にはノイズが残る。
本研究は,プレトレーニング段階において,軽量なプレトレーニング段階がノイズデータに抵抗するかどうかを考察する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:40:39 GMT)
GenMed: A Pairwise Generative Reformulation of Medical Diagnostic Tasks [32.5] 拡散モデルと再フレーム推論をテスト時間出力最適化問題として用いた共同分布を$P(X,Y)$でモデル化する。
私たちのフレームワークは、アーキテクチャの変更や再トレーニングなしに、予測時に柔軟な勾配ベースの条件付けを可能にします。
本研究は, 再利用可能なタスク非依存型医療AIシステムの基礎として, 生成的関節モデリングの汎用性を強調した。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:32:09 GMT)
Unlocking air traffic flow prediction through microscopic aircraft-state modeling [32.3] 本稿では,時空の状況から直接,将来的な交通の流れを予測する状態からフローまでのモデリングフレームワークであるAeroSenseを紹介する。
大規模な実世界のデータセットの実験では、AeroSenseは集約ベースの予測アプローチよりも予測精度を一貫して改善している。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:04:55 GMT)
Frequency Matching in Spiking Neural Networks for mmWave Sensing [32.0] ミリ波センシング(mmWave)は、プライバシーを保護し、常にエッジの認識を可能にする。
既存のmmWaveパイプラインは人工ニューラルネットワーク(ANN)に依存している
メカニカルデータアライメントの観点から,ミリ波センシングのためのスパイキングニューラルネットワーク(SNN)について検討した。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:50:36 GMT)
Unmasking On-Policy Distillation: Where It Helps, Where It Hurts, and Why [32.0] 本稿では,トークン単位,質問単位,教師単位の最高解像度で動作する無トレーニング診断フレームワークを提案する。
蒸留指導は, 不正なロールアウトにおいて, 正しいロールアウトよりも, 理想とほぼ一致していることが観察された。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:33:28 GMT)
Evolving-RL: End-to-End Optimization of Experience-Driven Self-Evolving Capability within Agents [31.7] 自己進化エージェントは、過去の相互作用から再利用可能な経験を蒸留することで、大きな言語モデルの静的な性質を克服することを目的としている。
本稿では、自己進化に必要な経験抽出と利用能力を共同で改善する効率的なアルゴリズムフレームワークであるEvolving-RLを提案する。
ALFWorldとMind2Webの実験によると、Evolving-RLはLLMが経験を抽出し再利用する能力を効果的に強化する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:43:56 GMT)
Deploying Self-Supervised Learning for Real Seismic Data Denoising [31.5] 実地震データに対して, 制御条件下でのノイズ・アズ・クリーン法(NaC法)を評価した。
以上の結果から, 合成付加白色ガウスノイズ (AWGN) はNaC法における地震データのデノナイズに不適切であることが示唆された。
NaCは単純な、効果的で、モデルに依存しない手法であり、実際の地震データをデノナイズするための実現可能な解決策である。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:13:47 GMT)
G-Zero: Self-Play for Open-Ended Generation from Zero Data [31.3] G-Zeroは、自律的な自己改善のための検証自由で共進化的なフレームワークである。
Hint-$は、ジェネレータモデルの非アシスト応答と、自己生成ヒントに条件付けされた応答との予測シフトを定量化する、本質的な報酬です。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:12:34 GMT)
Theory-optimal Quantization Based on Flatness [31.1] 学習後の量子化は、Large Language Models (LLMs) の推論を圧縮し加速する手法として広く採用されている。
LLM量子化における主な課題は、特に低ビット精度でモデル性能を著しく低下させる、外れ値に起因する。
本稿では,2方向対角量子化(BDQ)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:51:40 GMT)
Locking Pretrained Weights via Deep Low-Rank Residual Distillation [31.1] 我々は、適応攻撃者に対する新しい防御手段として、自動微分の推論訓練を利用する。
そこで本研究では,DLR-Lockを提案する。DLR-Lockは,モデルのプリトレーニング済みパラメータを,同値のディープ低ランク残差ネットワーク(DLR-Net)に意図的に置き換える手法である。
我々の防衛は、元のモデルの能力を保ちながら、防御戦略を十分に理解した適応攻撃者に耐えることに成功した。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:09:32 GMT)
ProteinOPD: Towards Effective and Efficient Preference Alignment for Protein Design [31.0] 望ましい機能や性質を持つデザイナタンパク質は、合成生物学と薬物発見における中核的な目標である。
タンパク質言語モデル(PLM)の最近の進歩は、高度に設計可能なタンパク質配列の生成を可能にしている。
PLMは、しばしば、事前訓練された知識の破滅的な忘れ込みを引き起こす。
本稿では,多目的選好アライメントフレームワークであるProteinOPDを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:38:51 GMT)
StereoPolicy: Improving Robotic Manipulation Policies via Stereo Perception [30.8] StereoPolicyは、幾何学的推論を強化するために、同期ステレオ画像ペアを直接活用する、ビジュモータポリシー学習フレームワークである。
本結果は,ロボット操作のための3次元幾何学的理解と2次元事前学習表現を橋渡しする,スケーラブルでロバストなモダリティとしてステレオビジョンを裏付けるものである。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:06:12 GMT)
Towards Autonomous Business Intelligence via Data-to-Insight Discovery Agent [30.5] AIDA(Autonomous Insight Discovery Agent)は、複雑なビジネス環境での自律的な探索のために設計された、最初のエンドツーエンドフレームワークである。
我々の研究は、最終的に産業規模のビジネスインテリジェンスシステムにおける自律的知能の変革の可能性を確立します。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:23:41 GMT)
COSMOS: Model-Agnostic Personalized Federated Learning with Clustered Server Models and Pseudo-Label-Only Communication [30.3] 擬似ラベル通信のみを用いてサーバ側のパーソナライズを可能にするモデルに依存しないフレームワークであるCOSMOSを紹介する。
クライアントはローカルモデルをトレーニングし、公開データに基づいて予測する。サーバは類似性を予測してクライアントをクラスタ化し、独自の計算を使用して各グループのクラスタ固有のモデルをトレーニングする。
本研究では,学習クラスタモデルの蒸留が指数関数的パーソナライズリスク収縮をもたらすことを示す最初の理論的解析を行った。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:16:36 GMT)
DySurface: Consistent 4D Surface Reconstruction via Bridging Explicit Gaussians and Implicit Functions [30.0] 動的シーンにおける暗黙的距離関数(SDF)の幾何学的忠実度で、明示的なガウス的効果を橋渡しする新しいフレームワークであるDySurfaceを提案する。
具体的には,変形したガウスを生かしたVoxGS-DSDF分岐を用いて,動的スパースボクセル格子を構築し,暗黙のSDF場への幾何的ガイダンスを提供する。
この明示的なアンカーは、ボリュームレンダリングプロセスを効果的に調整し、水密境界と詳細な表現で表面再構成品質を著しく改善する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:05:17 GMT)
PowerStep: Memory-Efficient Adaptive Optimization via $\ell_p$-Norm Steepest Descent [29.9] AdaptiveはTransformerなどの大規模ニューラルネットワークをトレーニングするための標準標準になっています。
本稿では,第2モーメント統計を使わずにモーメントワイド適応性を実現するメモリ効率のPowerStepを紹介する。
Transformerモデルの実験では、PowerStepはメモリを半減しながらAdams収束速度と一致している。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:36:27 GMT)
GraphInstruct: A Progressive Benchmark for Diagnosing Capability Gaps in LLM Graph Generation [29.8] GraphInstructは、大規模言語モデルのためのプログレッシブ・複雑度ベンチマークである。
判別力のピークは, 深度を推定するのではなく, 多制約組成で発生することがわかった。
制約対応型適応プロンプトを備えた検証誘導反復フレームワークは、試験対象モデル上でのプロンプトエンジニアリング天井を一貫して上回る。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:19:24 GMT)
DynaMiCS: Fine-tuning LLMs with Performance Constraints using Dynamic Mixtures [29.7] 大規模言語モデルのマルチドメイン微調整には,対象ドメインの性能向上が必要である。
制約付き最適化問題としてマルチドメインファインチューニングを行う動的混合DynaMiCSを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:02:05 GMT)
Towards Photorealistic and Efficient Bokeh Rendering via Diffusion Framework [29.6] 既存のモバイルデバイスは、小さな開口部のようなコンパクトな光学設計によって制約されている。
高品質で効率的なボケレンダリングのための統合拡散ベースフレームワークMagicBokehを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:03:05 GMT)
The Cartesian Shortcut: Re-evaluate Vision Reasoning in Polar Coordinate Space [29.4] textbfCartesian Shortcut: 直交グリッドベースのレイアウト上に構築される視覚的推論ベンチマーク。
モデルは、この特性を体系的に利用し、テキストベースの推論を多用し、視覚的問題解決を支援する。
textbfPolaris-Bench は極座標空間における53の視覚的推論タスクを、対のカルテシアン対を参照として再生成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:16:48 GMT)
Relative Score Policy Optimization for Diffusion Language Models [29.3] 拡散大言語モデル(dLLMs)は、並列かつ効率的なテキスト生成への有望な経路を提供する。
抽出可能なシーケンスレベルのログ比の欠如により、既存の手法は高分散ELBOベースの近似に頼らざるを得なくなった。
textbfRelative textbfScore textbfPolicy textbfOptimization (RSPO)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:58:40 GMT)
Unified Noise Steering for Efficient Human-Guided VLA Adaptation [28.6] 拡散に基づく視覚言語アクション(VLA)モデルは、ロボット操作の強力な先駆者として登場した。
ノイズスペースRLは、ノイズを予測する軽量アクターのみを更新しながら、事前訓練されたVLAをデノナイジングジェネレータとして固定し、コストを下げる。
提案するUniSteerは,人間の修正誘導と雑音空間RLを近似的な動作-雑音インバージョンにより組み合わせた統一ノイズステアリングフレームワークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:37:34 GMT)
The Truth Lies Somewhere in the Middle (of the Generated Tokens) [28.5] 隠れた状態にまたがってプールするということは、個々のトークン単独よりも意味的な表現をもたらすということがわかりました。
我々は、言語、視覚、タンパク質ドメインの参照空間へのカーネルアライメントを通じてこれを定量化する。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:20:04 GMT)
INFANiTE: Implicit Neural representation for high-resolution Fetal brain spatio-temporal Atlas learNing from clinical Thick-slicE MRI [28.5] 既存のアトラス構築パイプラインは、高解像度の3D脳ボリュームを生成するためにスライス・ツー・ボリューム再構成(SVR)に数日を要する。
InFANiTEは高分解能脳時間アトラスのためのインプシットニューラルネットワーク表現フレームワークである。
広範囲にわたる実験により、INFANiTEは、主観的整合性、参照忠実性、本質的品質、生物学的妥当性において、既存のベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:39:30 GMT)
EmbodiSkill: Skill-Aware Reflection for Self-Evolving Embodied Agents [28.5] エージェントは、さまざまな環境にわたるオブジェクト検索、アクション実行、状態変更をガイドするスキルの恩恵を受けることができる。
既存のスキル自己進化法は主にデジタル環境で開発されている。
エボディスキル(EmbodiSkill)は、スキルの自己進化を具現化するためのトレーニング不要のフレームワークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:33:29 GMT)
MicroWorld: Empowering Multimodal Large Language Models to Bridge the Microscopic Domain Gap with Multimodal Attribute Graph [28.5] MicroWorldは、大規模科学的イメージキャプチャーコーパスからマルチモーダル属性プロパティグラフを構築するフレームワークである。
MLLM推論をドメイン固有の微調整なしで拡張する。
MicroVQAベンチマークでは、MicroWorldはQwen3-VL-8B-Instructの推論性能を37.5%改善した。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:35:55 GMT)
OpenSGA: Efficient 3D Scene Graph Alignment in the Open World [28.0] シーングラフアライメントは、部分的に重なり合う観察から構築された2つの3次元シーングラフ間のオブジェクト対応を確立する。
既存のアプローチは主にサブスキャン・ツー・サブスキャン(S2S)アライメントに焦点を当てており、幾何点雲の特徴に大きく依存している。
視覚言語,テキスト,幾何学的特徴を空間的コンテキストで融合することにより,オブジェクトの対応性を予測する,統一的で効率的なシーングラフアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:44:18 GMT)
Workspace-Bench 1.0: Benchmarking AI Agents on Workspace Tasks with Large-Scale File Dependencies [27.7] 我々は、Workspace Learning invOlving Large-Scale File Dependencies上でAIエージェントを評価するためのベンチマークであるWorkspace-Benchを紹介する。
5つのワーカープロファイル、74のファイルタイプ、20,476のファイル(最大20GB)を持つ現実的なワークスペースを構築し、それぞれが7,399の合計ルーリックに対して評価された独自のファイル依存グラフを持つ388のタスクをキュレートする。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:14:45 GMT)
EVOCHAMBER: Test-Time Co-evolution of Multi-Agent System at Individual, Team, and Population Scales [27.6] シングルエージェント学習者は、自身のコンテキストと記憶だけを進化させることができる。
マルチエージェントシステムはさらに、誰が協力するか、どのように協力するか、どのように知識が集団に流れていくのかを進化させる。
EVOCHAMBERは,共進化エージェントプール上の3つのレベルでテスト時間進化をインスタンス化する,トレーニング不要のフレームワークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:42:33 GMT)
DECO: Sparse Mixture-of-Experts with Dense-Comparable Performance on End-Side Devices [27.5] DECOは、同一のパラメータ予算とトレーニングトークンの下での高密度トランスフォーマーのパフォーマンスに適合するように設計された、疎いMoEアーキテクチャである。
我々の特別なアクセラレーションカーネルは、高密度の推論と比較して、実際のハードウェア上で3.00$times$のスピードアップを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:58:28 GMT)
Learning More from Less: Exploiting Counterfactuals for Data-Efficient Chart Understanding [27.4] データ効率のよいトレーニングフレームワークであるChartCFを導入する。
実験により、ChartCFは、トレーニングデータを大幅に少なくしながら、強力なチャート固有のVLMよりも優れた、あるいは同等のパフォーマンスを実現していることが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:02:09 GMT)
Usability as a Weapon: Attacking the Safety of LLM-Based Code Generation via Usability Requirements [27.2] 大規模言語モデル(LLM)は、ソフトウェア開発の自動化にますます使われています。
実際には、多くのセキュリティ要件は暗黙的または過小評価されているが、ユーザビリティ要件は明示的で高信号である。
この非対称性は、実用的な攻撃面としてのユーザビリティ・プレッシャーの研究を動機付けます。
我々は、この脅威をUPAttackとして形式化し、U-SPLOITを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:44:37 GMT)
GESR: A Genetic Programming-Based Symbolic Regression Method with Gene Editing [27.1] 進化的アルゴリズムに基づく遺伝的プログラミング(GP)は、現在でも最も古典的で広く採用されている手法の1つである。
本稿ではGESRと呼ばれる遺伝子編集に基づく記号回帰手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:00:22 GMT)
LITMUS: Benchmarking Behavioral Jailbreaks of LLM Agents in Real OS Environments [26.9] 行動ジェイルブレイクは、敵がエージェントに危険なOSレベルの操作を不可逆的な結果で実行するように誘導する場所である。
既存のベンチマークでは、セマンティックレイヤ単独で安全性を評価したり、物理的レイヤの障害を欠いたり、テストケースの分離に失敗したりしている。
セマンティック物理二重検証機構とOSレベルの状態ロールバックにより,両方のギャップに対処するベンチマークLITMUSを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:14:04 GMT)
Exploration-Driven Optimization for Test-Time Large Language Model Reasoning [26.8] 推論時間スケーリングと組み合わせたポストトレーニング手法は、大規模言語モデルの推論とアライメント能力を大幅に向上させる。
しかし、基本的な緊張が発生する:推論時間法は比較的平坦な確率分布からの多様なサンプリングの恩恵を受ける一方、強化学習に基づくポストトレーニングは本質的にこれらの分布を鋭くする。
本稿では,報酬バイアス方式の探索目標を反復的なポストトレーニングに拡張し,それらを標準のRL目標に統合する探索駆動最適化(EDO)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:10:48 GMT)
The Agent Use of Agent Beings: Agent Cybernetics Is the Missing Science of Foundation Agents [26.5] サイバネティクス(Cybernetics)は、複雑なシステムにおける制御と通信の科学である。
我々は、サイバーネティクスが基礎エージェントに欠けている理論的な足場を提供すると主張している。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:53:54 GMT)
Policy Gradient Methods for Non-Markovian Reinforcement Learning [26.2] 非マルコフ決定過程(NMDP)における強化学習のための政策勾配法の研究
エージェント状態のダイナミクスを定式化したり、予測目的によって学習したりするアプローチとは対照的に、報酬中心の定式化を提案する。
我々は、ASMポリシーに対する新しいポリシー勾配定理を確立し、古典的なポリシー勾配の結果をマルコフ的設定からエピソードおよび無限水平割引NMDPへと拡張する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:34:28 GMT)
ReCoVR: Closing the Loop in Interactive Composed Video Retrieval [26.0] 合成ビデオ検索(CoVR)は、参照ビデオと修正テキストを用いて、ターゲットビデオの検索を行う。
対話型合成ビデオ検索はCoVRのマルチターン拡張であり,ユーザが徐々に検索意図を洗練させる。
反射知覚に基づくデュアルパスアーキテクチャであるReCoVR(Reflexive Composed Video Retrieval)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:38:24 GMT)
DP-LAC: Lightweight Adaptive Clipping for Differentially Private Federated Fine-tuning of Language Models [25.9] フェデレートラーニング(FL)は、デバイス上のユーザデータを保持しながら、エッジデバイス全体にわたる大規模言語モデルの協調トレーニングを可能にする。
DP-SGDは、各クライアントのコントリビューションを閾値$C$にクリップし、ノイズを$C$に比例させることで、このリスクを軽減する。
DP-LACは,まず,プライベートヒストグラム推定を用いて,最適値の1桁以内の初期クリッピング閾値を推定する手法である。
実証実験の結果、DP-LACは最先端適応クリッピング法とバニラDP-SGDの両方に優れており、平均精度は6.6%である。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:32:21 GMT)
SocialDirector: Training-Free Social Interaction Control for Multi-Person Video Generation [25.9] ビデオ生成は急速に進歩し、テキストや画像のプロンプトからビデオを生成する。
映画制作とソーシャルロボティクスは、リッチなソーシャルインタラクションを備えた多人数ビデオの要求をますます高めている。
既存のモデルでは、誰がどのアクションを実行し、いつ発生し、誰が指示されたかなど、インタラクションを明示的に制御することができない。
クロスアテンションマップによる生成モデルを強化する,トレーニング不要なインタラクションコントローラであるSocialDirectorを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:01:38 GMT)
Network-Based Interventions for HIV Prevention via Cascade-Aware Suppression of Transmission [25.9] Cascade-Aware Suppression of Transmission (CAST) は、2sqrt|mathbfP|$近似比を定式化するアルゴリズムである。
CASTは多様な感染症ネットワークで実証的に堅牢である。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:03:43 GMT)
EchoPrune: Interpreting Redundancy as Temporal Echoes for Efficient VideoLLMs [25.8] EchoPrune は (i) クエリ誘導の相互関連と (ii) 時間的再構成エラーによって視覚トークンをスコアする。
EchoPruneは、同じトークン予算の下で、ビデオLLMが最大20倍のフレームを処理できることを示します。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:23:38 GMT)
Vocabulary Hijacking in LVLMs: Unveiling Critical Attention Heads by Excluding Inert Tokens to Mitigate Hallucination [25.6] 我々はロジットレンズを用いて注意機構を解析し、Vocabulary Hijacking(語彙ハイジャック)という別個の異常を明らかにする。
本研究では,ハイジャック・アウェア・ビジュアル・アテンション・エンハンスメント(HAVAE, Hijacking-Aware Visual Attention Enhancement)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:16:25 GMT)
MFVLR: Multi-domain Fine-grained Vision-Language Reconstruction for Generalizable Diffusion Face Forgery Detection and Localization [25.5] 一般化可能な拡散合成顔偽造検出と局所化を実現する新しい視覚言語再構成モデルを提案する。
画像および残差領域全体にわたる一般的な視覚的偽造パターンをキャプチャする多領域視覚エンコーダを提案する。
視覚デコーダは、画像の外観を再構築し、フォージェリーローカライゼーションを実現するように設計されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:52:07 GMT)
When Reviews Disagree: Fine-Grained Contradiction Analysis in Scientific Peer Reviews [25.4] RevCIは、評価された強度ラベルを持つエビデンスレベルの矛盾アノテーションを備えたピアレビューペアの専門家によるベンチマークである。
IMPACTは、アスペクト条件のエビデンス抽出、熟考的推論、偏見を統合した構造化マルチエージェントフレームワークである。
TIDEは1つの前方通過における矛盾する証拠と強度を予測する小さな言語モデルである。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:20:58 GMT)
Regret Minimization in Bilateral Trade With Perturbed Markets [25.4] 我々は、世界財政収支の制約を受ける買い手・売り手取引所における取引所(GFT)からの利得の最大化の問題に対処する。
対向的な環境は、最高の固定価格メカニズムに対する非回帰学習を可能にする。
提案アルゴリズムは, 予算バランスの悪いベースラインに対して, 最悪値である$tildemathcalO(T3/4)$ regret を維持できる。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:37:53 GMT)
Unlocking LLM Creativity in Science through Analogical Reasoning [25.4] アナログ推論(AR)を解生成の新しいアプローチとして導入する。
ARは、共有リレーショナル構造に基づいてドメイン間の問題に類似して生成し、それらの類似を利用して新しい解を探す。
バイオメディカルな4つの問題にまたがってAR生成ソリューションを実装し,一貫した定量的ゲインを得る。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:35:44 GMT)
TransmissiveGS: Residual-Guided Disentangled Gaussian Splatting for Transmissive Scene Reconstruction and Rendering [25.2] 本稿では,トランスミッシブGSについて紹介する。トランスミッシブGSは,トランスミッシブシーンのアンタングル化とレンダリングのための新しいフレームワークである。
具体的には、このシーンを二重ガウス表現でモデル化し、2つのガウス成分を共同描画する遅延シェーディング関数を導入する。
近接場反射の高忠実度推定を可能にする反射光場を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:19:04 GMT)
Team-Based Self-Play With Dual Adaptive Weighting for Fine-Tuning LLMs [24.8] Team-based Self-Play with dual Adaptive Weighting (TPAW)は、完全に自己監督された設定でのアライメントを改善するために設計された新しいセルフプレイアルゴリズムである。
TPAWは、人間の監督を必要とせず、反復的に調整する。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:17:31 GMT)
Active Tabular Augmentation via Policy-Guided Diffusion Inpainting [24.8] 我々は忠実さとユーティリティのギャップを形式化し、TAP(Tabular Augmentation Policy)を提案する。
高ユーティリティ領域に向けたTAPステア生成と、明示的なゲーティングと保守的なウィンドウ化コミットメントによる安全な注入制御。
厳しいデータ不足下では、TAPは7つの実世界のデータセットの強力な生成ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:17:26 GMT)
MAGE: Multi-Agent Self-Evolution with Co-Evolutionary Knowledge Graphs [24.7] 本稿では,自己知識を4つの部分からなる共進化的知識グラフに外部化するフレームワークであるMAGEを紹介する。
MAGEは、プロンプトベースのフリーズバックボーンベースラインに対して強力なパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:39:51 GMT)
Learning the Interaction Prior for Protein-Protein Interaction Prediction: A Model-Agnostic Approach [24.7] タンパク質とタンパク質の相互作用(PPIs)は細胞機能と疾患機構の基礎である。
現在の学習ベースの予測器は、強力なタンパク質表現の学習に重点を置いている。
タンパク質表現に基づく仮想L3パスのプロンプトグラフを生成するL3-PPIと呼ばれるL3パス正規化グラフプロンプト学習法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:16:04 GMT)
Rebellious Student: Reversing Teacher Signals for Reasoning Exploration with Self-Distilled RLVR [24.6] 本稿では,本来の自己蒸留信号の逆読法を提案する。
教師が予測しなかった道に沿って学生が成功すると、これらのトークンはその自己駆動的推論を反映する。
我々はこれを、RLVRにおける新しい形の探索であると解釈し、一様の多様性ではなく、学生自身の成功に根ざした貴重な探検である。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:16:00 GMT)
Stellar Age Compression Reshapes Interpretations of the Milky Way Thick-Disk Formation History [24.6] 2つの独立した年齢尺度を用いて、厚板形成史の観測可能なシグネチャを比較した。
急激な深層円盤形成を支えているいくつかの重要な観測対象が, 耐震補強下で体系的に弱まることが確認された。
天の川の形成史の統計的解釈は、恒星年齢の定義そのものに敏感に依存している可能性が示唆された。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:00:00 GMT)
IndustryBench: Probing the Industrial Knowledge Boundaries of LLMs [24.2] インダストリアルベンチ(IndustrialBench)は、中国における産業調達QAのベンチマークである。
我々の評価は、Qwen3-Max の判断により、ドメインの専門家に対して$_w = 0.798$で検証された生の正当性を分離する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:30:48 GMT)
Sample-Mean Anchored Thompson Sampling for Offline-to-Online Learning with Distribution Shift [24.0] オフラインからオンラインへの学習における中心的な課題は、オフラインデータとオンラインデータの分散シフトである。
本稿では, 腕指数をオンライン後部サンプル, ハイブリッド後部サンプル, オンライン平均の中央値として定義する, 新たな中央値に基づくアンカールールを提案する。
我々は,提案アルゴリズムがオフラインデータを安全に活用してオンライン学習を加速することを示す理論的保証を確立する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:50:58 GMT)
One World, Dual Timeline: Decoupled Spatio-Temporal Gaussian Scene Graph for 4D Cooperative Driving Reconstruction [24.0] 4次元協調運転再建のためのDust (Deco Upled Spatio-Temporal) Gaussian Scene Graphを提案する。
DUSTは最先端の性能を達成し、最強ベースラインよりも3.2dBのダイナミック領域PSNRを改善する。
DUSTは時間的非同期性を維持しながら,Fréchet Video Distanceを37.7%削減することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:43:53 GMT)
Why Zeroth-Order Adaptation May Forget Less: A Randomized Shaping Theory [23.9] 継続的な学習は、以前獲得した能力を損なうことなく、新しいタスク適応を必要とする。
最近のフォワードパスとゼロオーダー(ZO)の結果は、低クエリ適応が一階降下よりも優れていることを示している。
有限差分はFOと平均整合した生の形状を明らかにする。
標準整合ZOの場合、予想される形状の保持曲率は、異方性成分のみを収縮しながら等方性保持床を保存する正確な恒等性に従う。
このアイデンティティを入射勾配に投影すると、観測可能な FO--ZO 二次的無視ギャップが得られる。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:41:08 GMT)
$\varepsilon$-Good Action Identification in Fixed-Budget Monte Carlo Tree Search [23.8] 深さ2の最大ミン木における固定予算最大ミン作用同定問題について検討した。
新しい$varepsilon$-good guarantee for Successive Rejectsを与えます。
これは、最大ミンアクション識別のための最初の証明可能な固定予算保証である。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:21:32 GMT)
HeteroGenManip: Generalizable Manipulation For Heterogeneous Object Interactions [23.8] クロスタイプオブジェクトインタラクションを含む一般化可能な操作は、ロボティクスにおいて決定的だが難しい能力である。
既存の基盤モデルに基づくアプローチは、しばしば、これらのステージの区別を曖昧にするエンドツーエンドの学習を採用する。
We propose HeteroGenManip, a task-conditioned, two-stage framework designed to deouple initial grasp from complex interaction execution。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:48:02 GMT)
Instructions shape Production of Language, not Processing [23.5] インストラクションは、言語モデルで生産中心のメカニズムをトリガーする。
本稿では,このメカニズムを2段階間の非対称性として,タスク固有情報を階層的に探索することによって明らかにする。
本研究は,モデル能力の理解には内部と行動の協調的評価が必要であることを示唆する。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:21:04 GMT)
CktFormalizer: Autoformalization of Natural Language into Circuit Representations [23.4] CktFormalizerは、Lean 4.0に組み込まれた依存型HDLを通じてハードウェア生成をリダイレクトするフレームワークである。
VerilogEval(156問題)、RTLLM(50問題)、ResBench(56問題)では、CktFormalizerは直接Verilog生成と競合するシミュレーションパスレートを達成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:19:39 GMT)
Towards On-Policy Data Evolution for Visual-Native Multimodal Deep Search Agents [23.4] マルチモーダル・ディープ・サーチは、テキストや視覚的コンテキストの進化に対して、検索、ツールの使用、視覚的推論をチェーンすることで、オープンワールドの問題を解決するためにエージェントを必要とする。
既存のツール利用ハーネスは、検索、ブラウジング、変換によって返される画像を一時的な出力として扱うため、中間的な視覚的証拠は後続のツールでは再消費できない。
本稿では,画像バンク参照プロトコルを中心としたビジュアルネイティブエージェントを導入し,ツールが返却したすべてのイメージをアドレス可能な参照として登録する。
On-policy Data Evolution (ODE)はクローズドループデータジェネレータを実行する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:49:36 GMT)
SDTalk: Structured Facial Priors and Dual-Branch Motion Fields for Generalizable Gaussian Talking Head Synthesis [23.2] SDTalkは、パーソナライズされたトレーニングや微調整をすることなく、未確認のアイデンティティに一般化するワンショットの3Dガウススティングフレームワークである。
実験により、SDTalkは視覚的品質と推論効率の両方において既存の手法を超越していることが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:05:20 GMT)
CCD-Level and Load-Aware Thread Orchestration for In-Memory Vector ANNS on Multi-Core CPUs [23.2] ベクター近傍サーチ(ANNS)は、検索エンジン、レコメンデーションシステム、広告サービスを支える。
ANNSインデックスの最近の進歩により、CPUは数百万スケールのインメモリベクトルサーチに費用対効果がある。
現代のCCDベースのマルチコアCPUは、私たちのサービスで高いスループットのために広くデプロイされています。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:09:29 GMT)
The first global agricultural field boundary map at 10m resolution [23.2] 世界の農業用リモートセンシング製品のほとんどは、ピクセルレベルでのみ利用可能である。
オープンで、グローバルに一貫した農地の境界の地図は、今のところ存在しない。
2024年と2025年の10m解像度で最初のグローバルフィールド境界データセットを提示する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:54:42 GMT)
DeepLog: A Software Framework for Modular Neurosymbolic AI [22.9] DeepLogは、標準的なPyTorch内でロジックとディープラーニングを統合する、運用上のニューロシンボリックフレームワークである。
多様なニューロシンボリック言語を高レベルな仕様として扱うことで、DeepLogソフトウェアはそれらを最適化された演算回路に自動的にコンパイルする。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:39:59 GMT)
PaMoSplat: Part-Aware Motion-Guided Gaussian Splatting for Dynamic Scene Reconstruction [22.8] PaMoSplatは、部分認識と動作先行を組み込んだ新しい動的ガウススプレイティングフレームワークである。
レンダリング品質が向上し、トラッキング精度が向上し、既存の方法よりも高速な収束を実現している。
4Dシーン編集など、複数の部分レベルのダウンストリームアプリケーションを可能にする。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:06:41 GMT)
Position: Life-Logging Video Streams Make the Privacy-Utility Trade-off Inevitable [22.8] ライフログのビジュアルセンシングは必然的になり、永続的で常時オンのAIシステムのバックボーンを形成している。
プライバシーのリスクは、公衆の信頼を損なう可能性があり、常時オンのAI技術の持続可能な開発を妨げる可能性がある。
我々は、長期のライフログのビジュアルデータに対して、ユーティリティとプライバシを共同で最適化する、パイプライン対応の新たなプライバシ保護設計を求めている。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:42:43 GMT)
Strategic Exploitation in LLM Agent Markets: A Simulation Framework for E-Commerce Trust [22.5] 本稿では,電子商取引市場におけるLCMエージェントの挙動を研究するための制御シミュレーションフレームワークであるTruthMarketTwinを紹介する。
LLMエージェントが従来の市場にリリースされ、評判に基づくガバナンスの弱点を自律的に活用していることがわかりました。
その結果, LLM-agent シミュレーションは, 機関が支配する自律市場を研究するためのツールとして位置づけられた。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:36:19 GMT)
Beyond the Last Layer: Multi-Layer Representation Fusion for Visual Tokenizatio [22.5] 複数層のセマンティック抽象化の後, 残差が減衰しただけに, 低レベルの視覚的詳細が最終層に残っていることを示す。
エネルギー制約付きルーティングとインクリメンタル修正により,すべてのエンコーダ層を集約する軽量核融合モジュールDRoRAEを提案する。
ImageNet-256では、DRoRAEはrFIDを0.57から0.29に削減し、生成FIDを1.74から1.65に改善した。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:14:52 GMT)
MolSight: Molecular Property Prediction with Images [22.5] $textbfMolSight$は視覚に基づく分子特性予測に関する最初の大規模研究である。
物理確率回帰、薬物発見分類、量子化学予測にまたがる10の下流タスクのパフォーマンスを評価する。
視覚エンコーダによって処理された1つの結合線画像は、競合する分子特性の予測に十分であることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:05:18 GMT)
RADAR: Redundancy-Aware Diffusion for Multi-Agent Communication Structure Generation [22.4] 本稿では,冗長性を考慮したクエリ適応型生成フレームワークRADARを紹介する。
通信トポロジ設計をステップバイステップ生成プロセスとして定式化し,グラフの有効サイズを導出する。
6つのベンチマークの実験は、RADARが最近のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:50:40 GMT)
PIVOT: Bridging Planning and Execution in LLM Agents via Trajectory Refinement [22.3] 大規模言語モデル(LLM)ベースのエージェントは、実行時に失敗するように見える一貫性のある計画を生成する。
PIVOTは、トラジェクトリを最適化可能なオブジェクトとして、環境相互作用を通じて反復的に洗練する自己管理フレームワークを通じて、この計画実行ミスアライメントに対処する。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:43:20 GMT)
Unsupervised Process Reward Models [22.3] プロセス・リワード・モデル(Process Reward Models、PRM)は、大規模言語モデル推論を操る強力なメカニズムである。
PRMは、すべての推論ステップに専門家のアノテーションを必要とします。
そこで本研究では,段階別アノテーションのレベルにおいても,最終回答の真正性検証においても,人間の監督を必要としない教師なしPRMの訓練方法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:05:27 GMT)
TimeClaw: A Time-Series AI Agent with Exploratory Execution Learning [22.2] 時系列分析は、金融や天気などの分野における予測、監視、意思決定の基盤となっている。
探索的実行を再利用可能な階層的蒸留体験に変換する探索的実行学習フレームワークであるTimeClawを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:09:17 GMT)
SpecX: A Large-Scale Benchmark for Multi-Modal Spectroscopy and Cross-Paradigm Evaluation [22.2] SpecXはマルチモード分光のための大規模ベンチマークであり、クロスパラダイム評価を行う。
NMR (1H, 13C, HSQC)、IR、MS、UV、ラマン、FLを含む1.7M分子を含む。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:12:58 GMT)
SLIM: Sparse Latent Steering for Interpretable and Property-Directed LLM-Based Molecular Editing [21.8] SLIM (Sparse Latent Interpretable Molecular editing) は,エディタの隠蔽状態をスパースなプロパティ整列機能に分解するプラグイン・アンド・プレイ・フレームワークである。
このスパース機能空間におけるSLIMステアリングは、プロパティ関連次元を正確に活性化し、モデルパラメータを変更することなく、編集成功率を向上させる。
MolEditRLベンチマークの実験では、4つのモデルアーキテクチャと8つの分子特性がベースラインよりも一貫した利得を示し、最大42.4ポイントの改善がなされた。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:47:25 GMT)
Break the Brake, Not the Wheel: Untargeted Jailbreak via Entropy Maximization [21.8] 視覚言語モデル(VLM)上の勾配に基づく普遍的イメージジェイルブレイクは、ほとんど、あるいは全くクロスモデル転送性を示しない。
提案するUntargeted Jailbreak via Entropy Maximization (UJEM)-KLは,これらの決定トークンにおけるエントロピーを最大化する軽量攻撃である。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:59:02 GMT)
Continual Harness: Online Adaptation for Self-Improving Foundation Agents [21.6] 連続ハーネス(Continuous Harness)は、エンボディエージェントのためのリセットのない自己改善ハーネスである。
Pokemon Redでは、トレーニングイテレーション間の環境をリセットすることなく、ゲーム内でのマイルストーンを達成している。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:21:33 GMT)
Verifiable Process Rewards for Agentic Reasoning [21.2] 検証可能な報酬(RLVR)による強化学習は、大規模言語モデル(LLM)の推論能力を向上させる。
既存のアプローチのほとんどは、少ない結果レベルのフィードバックに依存しています。
本稿では,これらのオーラクルを強化学習のための高密度なターンレベルの監視に変換するフレームワークであるVerifiable Process Rewards (VPR)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:30:53 GMT)
Extending Kernel Trick to Influence Functions [21.1] 本稿では、モデルサイズではなくデータセットサイズで計算複雑性をスケールする影響関数の二重表現を示す。
解析的にも実験的にも,この表現は,データ点除去によるパラメータの変化,モデル出力,損失を推定する上で,本来の影響関数の代替として有効であることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:57:57 GMT)
Exact Unlearning from Proxies Induces Closeness Guarantees on Approximate Unlearning [21.0] 本稿では,データ分布の構造を直接学習するパラダイムシフトリンクマシンを提案する。
これらの分布を精度良く推定することで、モデリングによって引き起こされる正確な未学習信号を蒸留できることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:57:31 GMT)
Bridging Sequence and Graph Structure for Epigenetic Age Prediction [20.8] エピジェネティックな年齢予測のための統合シーケンスグラフ統合フレームワークを提案する。
本手法は,最強グラフベースラインよりも12.8%向上した3.149年のMAEを実現する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:22:13 GMT)
Angle-I2P: Angle-Consistent-Aware Hierarchical Attention for Cross-Modality Outlier Rejection [20.3] イメージ・ツー・ポイント・クラウド・レジストレーション(I2P)は、操作、グラッピング、ローカライゼーションといったロボットアプリケーションにおける基本的なタスクである。
本稿では,アングル-I2Pを提案する。アングル-I2Pは,アングル-一貫性のある幾何学的制約と階層的注意を生かした外乱リジェクションネットワークである。
提案手法は、7Scenes, RGBD Scenes V2, and a self-collected data。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:08:29 GMT)
VVitCutLER: Towards Unsupervised Object Detection and Segmentation in Videos [20.3] VVitCutLERは、ビデオオブジェクトの検出とインスタンスのセグメンテーションのための教師なしのフレームワークである。
VitCutは、一時的に安定した擬似ラベルジェネレータで、フィールド劣化時にエラーの蓄積を減らす。
VitCutをベースとして、VVitCutLERはさらに、クロスフレーム機能アグリゲーションを統合して、ビデオレベルの堅牢性を高める。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:43:29 GMT)
TRACE: Distilling Where It Matters via Token-Routed Self On-Policy Alignment [20.3] On-policy self-distillation (self-OPD)は、政策が特権的文脈下で自らを教えることによって、強化学習を検証可能な報酬(RLVR)で強化する。
本稿では, 注釈付き臨界スパンのみを蒸留する, 臨界rEasoning (TRACE) のためのToken-Routed Alignmentを提案する。
我々の分析では、TRACEは2つの効果によって説明されている: フォワードKLは、学生が下位に配置する教師支援トークンに対して、無消毒リフトを提供するが、マスキングと崩壊は累積特権-段階的露出を有限に保っている。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:45:03 GMT)
ConsistNav: Closing the Action Consistency Gap in Zero-Shot Object Navigation with Semantic Executive Control [20.2] ConsistNavは、トレーニング不要のゼロショットObjectNavフレームワークで、3つの調整済みモジュールからなるセマンティックエグゼクティブを中心に構築されている。
我々はHM3DとMP3Dの実験を行い、ConsistNavは結果を達成し、SRを11.4%改善し、SPLを7.9%改善した。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:51:45 GMT)
One Token Per Frame: Reconsidering Visual Bandwidth in World Models for VLA Policy [20.1] 視覚言語アクション(VLA)モデルは、長い地平線を計画するために補助的な世界モジュールにますます依存している。
OneWM-VLAは、Adaptive Attention Poolingを通じて、各ビューをフレーム毎に単一のセマンティックトークンに圧縮する。
フレームごとの視覚的帯域幅を1つのトークンに減らすことができ、長い水平性能を損なうことなく実現できる。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:35:32 GMT)
PROWL: Prioritized Regret-Driven Optimization for World Model Learning [20.1] 我々は,拡散に基づく世界モデルの高次軌道を公開するための政策を訓練する,KL制約の逆行カリキュラムを導入する。
提案手法をMineRLフレームワークで実装し, 既設のアウト・オブ・ディストリビューション・トラジェクトリで評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:24:19 GMT)
M$^2$E-UAV: A Benchmark and Analysis for Onboard Motion-on-Motion Event-Based Tiny UAV Detection [20.0] M$2$E-UAVは、オンボード・モーション・オン・モーション・イベントベースの小型UAV検知のためのベンチマークと分析のセットアップである。
我々は、点ベースのイベントベースラインであるM$2$E-Pointと、IMU条件付き変種であるM$2$E-Point + IMUを提供し、慣性キューの役割を分析する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:54:34 GMT)
PrimeKG-CL: A Continual Graph Learning Benchmark on Evolving Biomedical Knowledge Graphs [19.9] 既存の連続グラフ学習は、ほとんど完全に合成ランダムな一般的なKGについて研究されている。
9つの信頼できるバイオメディカルデータベースから構築されたベンチマークを導入する。
我々は、4つのKGEデコーダ、LKGE、CK-hugging agent、CMKLの6つのCL戦略を評価した。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:14:02 GMT)
ADMM-Q: An Improved Hessian-based Weight Quantizer for Post-Training Quantization of Large Language Models [19.8] 後学習量子化(PTQ)は、大規模言語モデル(LLM)を圧縮するための主要なアプローチである。
本稿では,レイヤワイド量子化問題を考慮した新しい重み量子化アルゴリズムADMM-Qを提案する。
我々のアルゴリズムは、乗算器の交互方向法(ADMM)の変種に基づく。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:33:41 GMT)
Many Needles in a Haystack: Active Hit Discovery for Perturbation Experiments [19.5] 高スループット遺伝子摂動実験は、並列にいくつかの遺伝的介入をテストすることができるが、実験予算は限られている。
中心的なゴールは発見であり、できるだけ多くの摂動を識別し、その効果が予め定義された閾値を超えることである。
本稿では,大域的な大域的最適化を目標とし,他の高値領域を無視しながら支配的モードを過度に展開する手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:45:19 GMT)
Height-Guided Projection Reparameterization for Camera-LiDAR Occupancy [19.5] HiPRはHeight-Guided Projection Reパラメータ化を備えたカメラLiDAR占有フレームワークである。
HiPRは、リアルタイム推論を維持しながら、既存の最先端メソッドを一貫して上回る。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:18:21 GMT)
LoKA: Low-precision Kernel Applications for Recommendation Models At Scale [19.3] 大規模レコメンデーションモデル(LRM)にFP8を実用化するフレームワークであるLoKAを提案する。
LoKA Probeは、アクティベーションとウェイト統計を学習し、層ごとのエラーを定量化する、統計的に基礎付けられたオンラインベンチマーク手法である。
LoKA Dispatchは、LoKA Probeの統計情報を利用して最速のFP8カーネルを選択するランタイムである。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:32:29 GMT)
TRACER: Verifiable Generative Provenance for Multimodal Tool-Using Agents [19.2] マルチモーダル・ツール・ユース・エージェントにおけるジェネレーティブ・プロビデンスを検証するためのフレームワークであるTRACERを紹介する。
TraCERは、サポートツールターン、エビデンスユニット、セマンティックサポート関係を識別する構造化された証明レコードとともに、各回答文を生成する。
Qwen3-VL-8Bでは、TRACERは78.23%の回答精度と95.72%の要約精度に達し、最強のクローズドソースツール強化ベースラインを23.80ポイント上回った。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:32:55 GMT)
Sub-Footprint Effect Correction in FW-LiDAR Point Clouds via Intra-Footprint Target Unmixing [19.1] レーザーフットプリント内のサブフットプリントターゲット混合は、LiDAR強度の不確かさを著しく増大させる。
フルウェーブ形式のLiDAR点雲におけるサブフットプリント強度補正を明示的に解決する物理に基づく新しいフレームワークを提案する。
制御と実世界の両方のLiDARデータセットの実験により、提案手法は異種対象間のセマンティックセパビリティを著しく向上し、同種対象間の強度一貫性を向上することを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:56:06 GMT)
Temporal Preference Concepts and their Functions in a Large Language Model [19.1] 大きな言語モデル(LLM)は、短期的な利益と長期的な結果とのトレードオフを必要とする決定を下すために、ますますデプロイされている。
蒸留LLMにおいて, 時間的嗜好に基礎となる部分グラフを因果的に定位する。
時間地平線の幾何学は、期待される局所化層における残留ストリームに符号化される。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:09:00 GMT)
PRISM: Generation-Time Detection and Mitigation of Secret Leakage in Multi-Agent LLM Pipelines [19.0] PRISMは,情報漏洩を発生時の逐次的リスク蓄積問題として扱うリアルタイムディフェンスである。
各復号ステップにおいて、PRISMは語彙的、構造的、情報理論的、行動的、文脈的特徴にまたがる16の信号を校正リスクスコアに結合する。
PRISMは精度が1.000、リコールが0.712でF1 = 0.832を達成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:11:41 GMT)
Curriculum Learning-Guided Progressive Distillation in Large Language Models [19.0] 既存の蒸留アプローチでは、トレーニングデータの学習順序と、教師と学生のモデル間の容量ミスマッチという、2つの重要な要因を見落としていることが多い。
本稿では,教師の強度とデータ難易度を一致させることにより,両要因を統一したフレームワークであるCLPD(Curriculum Learning-Guided Progressive Distillation)を提案する。
私たちのフレームワークはモジュール化されており、最小限のオーバーヘッドで標準的な蒸留アルゴリズムに統合することができます。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:37:20 GMT)
ReCoVer: Resilient LLM Pre-Training System via Fault-Tolerant Collective and Versatile Workload [18.9] 大規模GPUクラスタ上での大規模言語モデルの事前トレーニングは、ハードウェア障害を稀ではなく日常的なものにしている。
一つの不変量を保持するレジリエントな事前学習システムであるReCoVerを提案する。
チェックポイントとリスタートのベースラインと比較して、ReCoVerは連続する障害の後、より効果的なスループットを2.23タイムで示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:28:31 GMT)
Teaching Language Models to Think in Code [18.9] 我々は、コード自体がNLによって起動されるツールとしてではなく、推論として機能するフレームワークであるThinking in Code(Thinking in Code)を提案する。
教師モデルから12.2kのコード中心軌跡を抽出し、教師による微調整と強化学習によりThinC-1.7BとThinC-4Bを訓練する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:57:28 GMT)
A Theory of Multilevel Interactive Equilibrium in NeuroAI [18.7] 適応型マルチエージェントインテリジェントシステムのためのゲーム理論フレームワークを提案する。
中心となるマルチレベルインタラクティブ平衡は、古典的なナッシュ均衡を内部計算を伴うインテリジェントシステムに一般化する。
この枠組みは、2つの生物学的脳、二つの人工エージェント、またはハイブリッドヒト-AIシステム間の相互作用に一様に適用する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:01:54 GMT)
Vision2Code: A Multi-Domain Benchmark for Evaluating Image-to-Code Generation [18.6] 画像・コード生成のための参照不要なベンチマークおよび評価フレームワークであるVision2Codeを紹介する。
Vision2Codeには、チャートやプロット、幾何学、グラフ、科学画像、ドキュメント、三次元空間シーンにまたがる15のソースデータセットから2,169のサンプルが含まれている。
コード実行障害を再構築品質から分離するレンダス診断を報告する。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:50:12 GMT)
StreamPhy: Streaming Inference of High-Dimensional Physical Dynamics via State Space Models [18.5] StreamPhyは、不規則な測定からフルフィールド物理力学の効率的なストリーミング推論を可能にするエンドツーエンドフレームワークである。
StreamPhyの精度は48%向上し,拡散法よりも最大20~100倍高速である。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:29:48 GMT)
Improving Hybrid Human-AI Tutoring by Differentiating Human Tutor Roles Based on Student Needs [18.5] 人間の家庭教師は、低パフォーマンスの学生のサポートを開始し、高パフォーマンスの学生は、リアクティブでオンデマンドなサポートを受ける。
秋(AIのみの授業)と春(アクティブな人間とAIの授業)の2つの期間の成績を比較した。
AIのみのベースラインに比べて、人間とAIのトレーニングによる大幅な改善が見られた。タスクにかかる時間の増加は25%増加し、スキルの熟練度は36%、アカデミックな成長は61%だった。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:02:10 GMT)
Can You Keep a Secret? Involuntary Information Leakage in Language Model Writing [18.5] モデルが彼らの記述から情報を引き出すことができるかどうかをテストする。
それぞれのモデルに、それを公開しないように指示した秘密の言葉を与え、それからストーリーを書くように頼みます。
2つ目のモデルは、二項判別テストでストーリーから秘密を識別しようとします。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:23:28 GMT)
SleepWalk: A Three-Tier Benchmark for Stress-Testing Instruction-Guided Vision-Language Navigation [18.5] SleepWalk(スリープウォーク)は、単一シーンの3Dワールドにおいて、命令付き軌道予測を評価するためのベンチマークである。
2,472個の3次元環境上での3つのフロンティア・ビジョン・ランゲージ・モデルの評価を行った。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:20:14 GMT)
Adaptive Action Chunking via Multi-Chunk Q Value Estimation [18.4] 本稿では,新しいオフライン-オンライン強化学習アルゴリズムであるAdaptive Action CHunking (ACH)を提案する。
ACHはトレーニングと推論の間、チャンクの長さを動的に調節する。
我々のメカニズムにより,エージェントは現在の状態に基づいて最適なチャンク長を適応的に選択できる。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:14:32 GMT)
On the global convergence of gradient descent for wide shallow models with bounded nonlinearities [18.4] ニューラルネットワークの驚くべき現象は、勾配降下によるトレーニング損失の世界的な最小化要因を見つける能力である。
トレーニング損失の非言語的最小化は、不安定な勾配降下ダイナミクスであることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:08:23 GMT)
Improving Temporal Action Segmentation via Constraint-Aware Decoding [18.2] 時間的アクションセグメンテーション(TAS)は、未編集のビデオをラベル付きアクションセグメンテーションに分割する。
本稿では,TAS予測を強化する軽量な制約ベースの改善フレームワークを提案する。
提案手法は, 構造予測誤差を補正することにより, 完全教師付きTASモデルと半教師付きTASモデルの両方を改善する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:55:02 GMT)
Learning Graph Foundation Models on Riemannian Graph-of-Graphs [18.2] グラフ基礎モデル(GFM)は、汎用推論をサポートするために、巨大なグラフデータ上に事前訓練されている。
本稿では,構造スケールをモデリングの第一級市民として扱うR-GFMを提案する。
R-GFMは、異なるホップ距離でマルチスケールのGoGオーバーサンプリング部分グラフを構築し、幾何適応表現を学ぶ。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:09:16 GMT)
The Granularity Mismatch in Agent Security: Argument-Level Provenance Solves Enforcement and Isolates the LLM Reasoning Bottleneck [18.1] textscPACTは、ツール引数にセマンティックロールを割り当てるランタイムモニタである。
textscPACTはエージェントセキュリティを権限バインディングとして再設定する。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:09:11 GMT)
Heteroscedastic Diffusion for Multi-Agent Trajectory Modeling [18.1] マルチエージェント・トラジェクトリ・モデリングは伝統的に予測に重点を置いており、トラジェクトリ・コンプリートのようなより一般的なタスクを無視することが多い。
U2Diffineはトラジェクトリ補完を実現するために構築された統一拡散モデルである。
本手法は,4つの挑戦的スポーツデータセットの軌跡完了と予測において,最先端のソリューションよりも優れる。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:26:14 GMT)
Fashion130K: An E-commerce Fashion Dataset for Outfit Generation with Unified Multi-modal Condition [18.0] 我々はFashion130kという新しいeコマースデータセットを提案する。
我々は、テキストと視覚的プロンプトを協調して生成モデルに組み込むために、統一マルチモーダル条件(UMC)を用いたフレームワークを設計する。
実世界のアプリケーションとベンチマークの実験は、視覚的一貫性におけるUTCの有効性を実証している。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:40:03 GMT)
Continuous Discovery of Vulnerabilities in LLM Serving Systems with Fuzzing [18.0] 本稿では,LLM推論エンジン用のグレーボックスファザであるGRIEFについて述べる。
vLLMとLangに関する初期のキャンペーンで、GRIEFは15の脆弱性を発見し、2つのCVE、KV-cache分離障害、クロスリクエストパフォーマンス干渉、クラッシュまたはライブネスバグを含む10のエンジン開発者によって確認された。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:10:08 GMT)
Rethinking Random Transformers as Adaptive Sequence Smoothers for Sleep Staging [17.9] ランダムにカーネル変換器をトレーニングすることなく、スリープステージ性能を大幅に向上させることを示す。
この効果をRAPK (Random Attention Prior) を用いて定式化し、ランダムな自己注意が適応的スムースに作用することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:48:06 GMT)
The Benefits of Temporal Correlations: SGD Learns k-Juntas from Random Walks Efficiently [17.9] データ内の時間的相関は、勾配に基づく手法により、特定のスパース学習問題を効率的に学習できるようにする。
標準凸点損失を用いた大バッチ勾配法では,時間相関は同じ利点が得られないことを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:11:20 GMT)
One-Step Graph-Structured Neural Flows for Irregular Multivariate Time Series Classification [17.8] 本稿では,対話学習を強化するための2つの補助トラジェクトリ自己超越戦略を導入する一段階グラフ構造化ニューラルフロー(GSNF)を提案する。
5つの実世界のデータセットの実験により、GSNFは、非常に競争力のあるトレーニング時間とメモリ使用量で最先端の分類性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:31:25 GMT)
Learning to Perceive "Where": Spatial Pretext Tasks for Robust Self-Supervised Learning [17.8] 空間認識型プレテキスト回帰タスクである空間予測を導入し、同じ画像から一対の非絡み合ったローカルビュー間の相対的な位置とスケールを予測する。
連続幾何学空間における部分対部分関係をモデル化することにより、SPは表現がきめ細かい空間依存を捉えることを奨励する。
実験では、画像認識、きめ細かな分類、セマンティックセグメンテーション、深さ推定、および物体認識におけるアウト・オブ・ディストリビューションの大幅な向上が示されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:15:34 GMT)
Agent-ValueBench: A Comprehensive Benchmark for Evaluating Agent Values [17.8] Agent-ValueBenchは、エージェント値専用の最初のベンチマークである。
16ドメインにわたる394の実行可能な環境を備え、4,335のバリューコンフリクトタスクを提供する。
エージェント値は、解釈可能な反電流の下で、クロスモデル均質のバリュータイドとして最初に現れる。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:09:04 GMT)
TMAS: Scaling Test-Time Compute via Multi-Agent Synergy [17.6] テストタイムスケーリングは、大規模言語モデルの推論能力を改善するための効果的なパラダイムとなっている。
マルチエージェント・シナジーによるテスト時間計算のスケーリングを行うフレームワークであるTMASを提案する。
TMASが既存のテスト時間スケーリングベースラインよりも強力な反復スケーリングを実現していることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:44:10 GMT)
JODA: Composable Joint Dynamics for Articulated Objects [17.6] JODAは、ジョイントレベルダイナミクスを、ジョイントレベルの自由度を越えて構造化された3チャンネルフィールドとして生成するためのフレームワークである。
それは、解釈可能かつ微分可能シミュレーションと互換性のあるコンパクトかつ表現的関数空間を定義する。
JODAは多種多様な関節行動の可塑性かつ制御可能なモデリングを可能にし,推論,編集,最適化のための統一インターフェースを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:02:15 GMT)
Probing Routing-Conditional Calibration in Attention-Residual Transformers [17.6] 内部ルーティングトレースは、しばしば予測の信頼性を示すために使用される。
これらの痕跡は、信頼性を超えたポストホックキャリブレーションの安定したルーティング固有の証拠を提供していない。
信頼のみのキャパシティを制御に含めると、ルーティングプロファイルが同等のパフォーマンスを達成することを示す。
この設定は、一致した信頼、帯域幅、容量、置換制御が共通の欠点を除外するまで、内部状態のキャリブレーションとして読むべきではない。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:06:25 GMT)
Personalizing LLMs with Binary Feedback: A Preference-Corrected Optimization Framework [17.3] 大言語モデル(LLM)のパーソナライゼーションは、モデルの振る舞いを個々のユーザの好みに合わせることを目的としている。
既存の手法は、ユーザー間の差異の本質的な役割を無視して、孤立したユーザー履歴に焦点を当てることが多い。
C-BPO(C-BPO)は、好み校正されたバイナリ信号を介してLLMをパーソナライズするフレームワークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:12:24 GMT)
Valid Best-Model Identification for LLM Evaluation via Low-Rank Factorization [17.3] 統計的妥当性を損なうことなく,MABと安価な予測スコアを組み合わせた原理的枠組みを提案する。
分散を低減するために低ランク予測を用いた各モデルの性能の2倍頑健な推定器を導出する。
実世界のベンチマークによる実証的な結果から,本手法は必要な評価回数を削減し,計算とコストに有意義な節約をもたらすことが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:43:28 GMT)
DGPO: Beyond Pairwise Preferences with Directional Consistent Groupwise Optimization [17.3] 本稿では,グループレベルでの監視信号を集約し,方向対応アライメントを明示的にモデル化する軽量フレームワークであるDGPOを提案する。
構築したリバースデータは5つのベンチマークで平均3.2%向上し、DGPOは複数のデータセットとモデルファミリで一貫したゲインを提供し、平均精度は3.6%向上した。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:10:44 GMT)
An agentic framework for gravitational-wave counterpart association in the multi-messenger era [17.1] 我々は,大規模言語モデル(LLM)を利用したエージェントフレームワークGW-Eyesを開発した。
GW-Eyesはドメイン固有のツールを初めて統合し、GWと候補EMイベントの関連タスクを自律的に実行する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:58:32 GMT)
On the Simulation Cost of Quantum Finite Automata [17.0] 本稿では,有限オートマトンに対する量子優位性の自然な定量尺度として,正確な確率的シミュレーションコストを同定する。
2つの代表モデルに対して鋭いシミュレーション法則を与える。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:59:37 GMT)
Deep Arguing [16.9] 本稿では、Deep Arguingを紹介する。Deep Arguingは、Deep Learningと議論の構築と解釈可能な分類のための推論を統合する新しいニューロシンボリックアプローチである。
我々のアプローチでは、ディープニューラルネットワークは、データポイントが割り当てられたラベルをサポートし、異なるラベルを攻撃する引数構造を構築する。
推論に微分可能な議論の意味論を用いて、モデルは特徴表現と議論的相互作用を共同で学習するためにエンドツーエンドで訓練される。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:38:58 GMT)
Injecting Distributional Awareness into MLLMs via Reinforcement Learning for Deep Imbalanced Regression [16.7] マルチモーダル大言語モデル (MLLM) は, 長期的目標分布下での数値回帰に苦慮する。
グループ相対政策最適化に基づく分散型強化学習フレームワークを提案する。
SFTと既存のMLLM回帰法よりも一貫した改善が見られた。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:53:21 GMT)
MMVIAD: Multi-view Multi-task Video Understanding for Industrial Anomaly Detection [16.7] MMVIADは産業的異常検出と理解のための最初の連続マルチビュービデオデータセットである。
異常検出、欠陥分類、オブジェクト分類、および異常可視時間ローカライゼーションをサポートする。
MMVIAD-Unseenでは、VISTAはベースモデルの平均スコアを45.0から57.5に改善し、GPT-5.4を上回った。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:49:38 GMT)
Real-Scale Island Area and Coastline Estimation using Only its Place Name or Coordinates [16.4] 本稿では,純粋単眼視に基づく幾何学的一貫した実スケール島計測フレームワークを提案する。
本研究は,全自動処理によるマッピングコストを大幅に削減し,GISデータを使わずに高効率な計測を実現する。
実験の結果, システムの最終測定誤差は約10%であり, 精度とロバスト性に優れていた。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:45:09 GMT)
Enforcing Constraints in Generative Sampling via Adaptive Correction Scheduling [16.4] 生成的サンプリングの厳しい制約はプロジェクションによって実施され、サンプリングの終了時に1回、または更新毎に1回適用される。
プロジェクションは将来の更新が依存する状態の分布を変える。
生成ロールアウトに対する補正スケジューリング問題として制約強制を定式化する。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:28:10 GMT)
Dimensional Balance Improves Large Scale Spatiotemporal Prediction Performance [16.2] 既存の方法はパフォーマンスのボトルネックに直面し、通常はインクリメンタルな利得しか得られない。
我々はこのボトルネックを空間的・時間的エントロピー測定によって分析する。
空間的特徴表現と時間的特徴表現を調和させるスケーラブルで適応的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:29:26 GMT)
Elucidating Representation Degradation Problem in Diffusion Model Training [16.0] Elucidated Representation Diffusion (ERD) は、効率的な回復性に応じて最適化作業を動的に再配置するプラグイン・アンド・プレイフレームワークである。
外部の監督なしに表現学習を安定化させることにより、EDRは収束を加速し、拡散バックボーン間の強い経験的性能を達成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:21:45 GMT)
A Refined Generalization Analysis for Extreme Multi-class Supervised Contrastive Representation Learning [15.9] クラス上の分布に関係なく、クラス数$R$と同じ順序のサンプル複雑性で境界を証明します。
また、リスクテクティタクロスクラスの濃度をキャプチャする異なる推定器を定式化する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:54:45 GMT)
Speech-based Psychological Crisis Assessment using LLMs [15.9] 本稿では,危機レベル自動分類のための大規模言語モデル(LLM)に基づくフレームワークを提案する。
音声会話における感情信号をよりよく捉えるために,パラ言語的注入法を導入する。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:50:51 GMT)
Anchor-guided Hypergraph Condensation with Dual-level Discrimination [15.8] ハイパーグラフ凝縮(HGC)は、大きな実ハイパーグラフをコンパクトで情報的な合成物に蒸留する。
我々はこれらの問題に対処するためにtextbfDual-level textbfDiscrimination (textbfAHGCDD)を提案する。
AHGCDDの有効性と有効性を示す実験を行った。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:25:05 GMT)
Tree SAE: Learning Hierarchical Feature Structures in Sparse Autoencoders [15.8] 階層レベル間のより深い機能的リンクを強制する新しい再構築条件を導入する。
アクティベーション制約と再構成制約を組み合わせることで,特徴集合内から直接階層構造を学習するモデルであるTree SAEを提案する。
以上の結果から,ツリーSAEは階層的なペアの学習において既存のSAEをはるかに上回りながら,いくつかの重要なベンチマークにおいて最先端の競争性能を維持していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:18:14 GMT)
MPerS: Dynamic MLLM MixExperts Perception-Guided Remote Sensing Scene Segmentation [15.8] 画像とシーンキャプションのマルチモーダル融合は、様々な分野で広く研究され、適用されています。
本稿では,ダイナミックMLLMミクチャー・オブ・エクササイズ・パーセプション・ガイド型リモートセンシングシーンを提案する。
我々は,MLLMが高品質なRSキャプションを生成するための複数のプロンプトを設計し,多様な専門家の視点から,MLLMがRSシーンを知覚できるようにする。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:00:26 GMT)
AI in the Enterprise: How People Use M365 Copilot Chat [15.7] M365 Copilotは世界中の100万人以上の企業で何百万人もの人々が利用している。
本稿では,M365 Copilot Chat を用いたユーザインタラクションの直接分類により,その使い方を特徴付ける。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:13:26 GMT)
Adaptive Context Matters: Towards Provable Multi-Modality Guidance for Super-Resolution [15.4] 超解像は本質的に曖昧な問題である。
近年のセマンティックガイダンスおよびマルチモーダルSR手法は, セマンティックアライメントを強化するために, 大規模モデルや外部プリエントを利用する。
本稿では,マルチモーダルSRの理論的モデリングを行い,従来の手法が準最適モダリティ利用によってボトルネックとなることを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:34:37 GMT)
Towards Generalist Game Players: An Investigation of Foundation Models in the Game Multiverse [15.3] ゲームは、単なるエンターテイメントから、人工知能のトレーニングと評価の究極の場へと進化してきた。
私たちは、データセット、モデル、ハーネス、ベンチマークの4つの柱に沿って、ジェネラリストゲームプレイヤの完全なライフサイクルをトレースします。
このエンド・ツー・エンドの視点に基づいて、5段階のロードマップをグラフ化し、エージェントが理論ゲームマルチバース内で同時に生成し進化する、単一ゲームの熟達から究極の創造段階へと進む。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:16:41 GMT)
Re-Triggering Safeguards within LLMs for Jailbreak Detection [15.3] 本稿では,大規模言語モデル (LLM) に対するジェイルブレイク攻撃の防止を目的としたジェイルブレイク検出手法を提案する。
このような脱獄プロンプトは本質的に脆弱であり, 組込み破壊法を導入し, 安全対策を再活性化する。
われわれのアプローチは、ホワイトボックスやブラックボックスの設定における最先端のジェイルブレイク攻撃を効果的に防ぎ、適応攻撃に対しても堅牢である。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:09:31 GMT)
Data-Asymmetric Latent Imagination and Reranking for 3D Robotic Imitation Learning [15.3] 混合軌道から3次元ロボット模倣学習のためのフレームワークであるDALI-Rを提案する。
想定されるロールアウトのための3Dポイントクラウド上のラテントワールドモデルと、候補アクションチャンクをリランクするTask Completion Scorerを学ぶ。
2つの評価された3Dベースのポリシーの中で、DALI-Rは平均6.8ドル%の成功率の向上を達成した。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:16:13 GMT)
Initiation of Interaction Detection Framework using a Nonverbal Cue for Human-Robot Interaction [15.2] 本稿では,音声と視覚センサの融合に基づくインタラクション(IoI)検出フレームワークについて述べる。
提案するフレームワークでは、ロボットは独自のオーディオと視覚センサーを備えており、人間の検出と追跡を安定させるために外部視覚センサーを使用することができる。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:07:01 GMT)
Quantum Nonlinear Properties from a Single Measurement Setting [15.2] 我々は, 量子状態の非線形量$$$を効率的に測定するための普遍的枠組みである衝突型非線形推定法(CBNE)を開発した。
CBNEは、システム次元が十分に大きいか、数ビットのアシラリー量子ビットが利用可能であれば、単一の測定設定しか必要としない。
CBNEは実験段階において観測不能であり、複数の非線形関数の同時推定を可能にする。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:12:09 GMT)
Identified-Set Geometry of Distributional Model Extraction under Top-$K$ Censored API Access [15.1] 本稿では,このアクセスモデルの分布分布-回復限界について検討する。
しきい値$を検閲するために、互換の教師分布は、正確に$U_K=(V-K)exp()/(Z_A+(V-K)exp())$である識別セットを形成する。
Qwen3の数学推論教師の実験では、階層化された抽出階層が明らかになった。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:43:48 GMT)
Rapid Forest Fuel Load Estimation via Virtual Remote Sensing and Metric-Scale Feed-Forward 3D Reconstruction [15.0] 本稿では,森林の急激な在庫管理のための新しい自動パイプラインを提案する。
我々のアプローチは、まず低高度軌道画像とカメラの標的領域に対するポーズを生成する。
VGGT-Long フレームワーク内で開発された Pi-Long を用いる。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:21:28 GMT)
AI Alignment via Incentives and Correction [15.0] 我々は、抑止と執行の法・経済モデルのレンズを通してAIアライメントを研究する。
解決者は、説得力があるが誤った答えを出し、不確実性を隠蔽したり、急激なショートカットを悪用する恩恵を受けることができる。
この相互作用を、主成分が共同補正結果よりも報酬を選択する2エージェントモデルで定式化する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:34:28 GMT)
When to Re-Commit: Temporal Abstraction Discovery for Long-Horizon Vision-Language Reasoning [14.9] ロングホライゾン推論は、どのような行動を取るかだけでなく、次の観察の前にどれだけ深くコミットするかを決定する必要がある。
我々はこれを、Emphcommitment depth:replan間でオープンループで実行されるプリミティブアクションの数という形式化します。
私たちはコミットメントの深さを、ポリシー自体の学習可能な状態条件変数としてインスタンス化します。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:43:13 GMT)
Conditional anomaly detection methods for patient-management alert systems [14.9] 最近提案された条件付き異常検出フレームワークは、異常検出を拡張し、データ内の属性のサブセット上の異常パターンを特定する。
本稿では,条件付き異常を検出するインスタンスベースの手法について述べる。
実世界の2つの検出問題に対するインスタンスベースの手法の利点を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:58:48 GMT)
A PAC-Bayes Approach for Controlling Unknown Linear Discrete-time Systems [14.9] 未知の線形離散時間系のためのコントローラ学習のためのPAC-Bayesフレームワーク
本稿では,有限および無限の制御空間に実装可能な理論保証付き新しい効率的な学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:51:13 GMT)
Debiasing Message Passing to Mitigate Popularity Bias in GNN-based Collaborative Filtering [14.8] グラフニューラルネットワーク(GNN)に基づく協調フィルタリング(CF)モデルは,インタラクショングラフ上でユーザイテム信号を伝搬することにより,レコメンデータシステムにおいて高い性能を達成する。
相互作用分布が歪んだり、高次の地区を横断する繰り返しメッセージが、ロングテールのものを抑えながら人気アイテムの影響を増幅するので、人気バイアスに非常に敏感である。
既存のデバイアスのアプローチでは、再重み付けの目的、正規化、因果法、後処理は、集約プロセスを通じて伝播するバイアスと直接対応しないため、GNNベースの設定では効果が低い。
大衆の疎外化をめざして
論文参考訳(メタデータ) (Mon, 11 May 2026 18:48:58 GMT)
Rethinking Evaluation for LLM Hallucination Detection: A Desiderata, A New RAG-based Benchmark, New Insights [14.7] 我々は、厳格な人間のアノテーションプロセスを実行した新しいRAGベースのHDB、T RIVIA+を構築し、オープンソース化した。
特に,本ベンチマークでは,(1)T RIVIA+は文献中で最も長い文脈のサンプルを含む,望ましいすべての特性を示す。
我々は、一般的なSOTA検出器を用いて、RAGベースのHDB(T RIVIA+を含む)の実験を行い、新しい知見を明らかにした。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:33:58 GMT)
Guaranteed Jailbreaking Defense via Disrupt-and-Rectify Smoothing [14.7] 本稿では,大規模言語モデル(LLM)に対する防御手法を提案する。
2段階のプロンプト処理スキームを統合し、まず入力プロンプトを乱し、次に従来のスムーズな防御フレームワークに修正する。
我々のアプローチは、確立された攻撃シナリオと適応的な攻撃シナリオの両方の下で、トークンレベルとプロンプトレベルの両方のジェイルブレイク攻撃を防御できる。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:54:26 GMT)
SciVQR: A Multidisciplinary Multimodal Benchmark for Advanced Scientific Reasoning Evaluation [14.7] SciVQRは数学、物理学、化学、地理学、天文学、生物学の54の分野をカバーするマルチモーダルベンチマークである。
タスクは、基本的な事実のリコールから、専門家によるソリューションを含む46%の複雑なマルチステップ推論まで様々である。
プロプライエタリモデルとオープンソースモデルの両方を含むMLLMの先導的評価は、複雑なマルチモーダル推論タスクの処理において、重大な制限を明らかにしている。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:38:22 GMT)
Your Language Model is Its Own Critic: Reinforcement Learning with Value Estimation from Actor's Internal States [14.7] 内部状態価値推定による政策最適化を導入する。
ポリシーフォワードパス中に既に計算されているポリシーモデルの内部信号を用いて、無視可能なコストでベースラインを得る。
軽量プローブは、プロンプトおよび生成された軌道の隠れ状態から期待される検証可能な報酬を予測する。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:09:39 GMT)
MAGS-SLAM: Monocular Multi-Agent Gaussian Splatting SLAM for Geometrically and Photometrically Consistent Reconstruction [14.6] 複数のエージェントからの協調的な3D再構成により、仮想生産および協調型マルチロボット探索のための高速な大規模シーンキャプチャが可能となる。
既存のマルチエージェントのガウシアンSLAM法の多くは、計量深度を得るためにRGB-Dセンサーに依存しており、クロスエージェントアライメントを単純化している。
我々は,RGBのみのマルチエージェント3DGS SLAMフレームワークであるMAGS-SLAMを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:57:13 GMT)
GELATO: Generative Entropy- and Lyapunov-based Adaptive Token Offloading for Device-Edge Speculative LLM Inference [14.6] 投機的復号化(SD)は、軽量のドラフトモデルが検証対象のトークンを迅速に生成し、ますます普及している。
本稿では,エネルギー制約下での復号スループットを最大化するためにGELATOという,リアプノフをベースとした適応トークンオフロードフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:38:56 GMT)
PG-3DGS: Optimizing 3D Gaussian Splatting to Satisfy Physics Objectives [14.6] PG-3DGS(英: Physics-Guided 3D Gaussian Splatting)は、3次元ガウス表現と微分可能な物理シミュレーションを結合して3次元構造を生成するフレームワークである。
我々のアプローチは、測光的に正確であるだけでなく、物理的に機能する測地を創出する。
注水および空力浮上作業の実験は、PG-3DGSが視覚的品質を保ちながら身体機能を改善することを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:43:43 GMT)
MARGIN: Margin-Aware Regularized Geometry for Imbalanced Vulnerability Detection [14.5] 本稿では,識別的脆弱性表現を学習するメトリクスベースのフレームワークであるMARGINを提案する。
公開脆弱性データセットの実験は、MARGINが強いベースラインを一貫して上回っていることを示している。
MarGINはより構造化された埋め込みジオメトリを生成し、堅牢性、解釈可能性、一般化を改善している。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:14:51 GMT)
Towards Understanding Continual Factual Knowledge Acquisition of Language Models: From Theory to Algorithm [14.5] 連続的Factual Knowledge Acquisition(cFKA)のトレーニングダイナミクスを特徴付ける理論的枠組みを提案する。
我々はtextbfSelecting textbfTokens via attentitextbfOn textbfContribution (STOC) と呼ばれる新しい生成データ再生手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:28:02 GMT)
ConQuR: Corner Aligned Activation Quantization via Optimized Rotations for LLMs [14.4] 大きな言語モデル(LLM)は、大きなメモリフットプリントと高い推論コストのために、デプロイにコストがかかる。
ウェイトアクティベーション量子化はこれらのコストを削減することができるが、アクティベーションアウトレイアが大きな量子化誤差を引き起こすため、低ビットアクティベーション量子化は依然として困難である。
LLMアクティベーション量子化のための軽量な後回転校正法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:23:10 GMT)
BROS: Bias-Corrected Randomized Subspaces for Memory-Efficient Single-Loop Bilevel Optimization [14.3] BROSは単ループSBO法と同じ収束率のメモリ効率の高い単ループSBO法である。
ハイパーデータクリーニング、データ混合学習、ハイパー表現学習、ViTサンプル再重み付けの実験は、BROSがピークメモリを最大44.9%削減することを示している。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:50:10 GMT)
EvoStreaming: Your Offline Video Model Is a Natively Streaming Assistant [14.3] EvoStreamingは自己進化型のストリーミング適応フレームワークである。
EvoStreamingは5つのオープンなVideoLLMバックボーンに対して、RealStreamEvalのスコアを最大10.8$ポイント改善しています。
これらの結果は,既存のビデオLLMをストリーミングアシスタントに適応させる上で,データ効率のよいインタラクションチューニングが実用的な方法であることを示唆している。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:43:59 GMT)
BenchCAD: A Comprehensive, Industry-Standard Benchmark for Programmatic CAD [14.3] 本稿では,産業CAD推論のための統一ベンチマークであるBenchCADを紹介する。
BenchCADには,106の産業部門を対象とした17,900のCadQueryプログラムが含まれている。
視覚的質問応答、コード質問応答、画像からコードへの生成、命令誘導コード編集を通じてモデルを評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:13:36 GMT)
LegalCiteBench: Evaluating Citation Reliability in Legal Language Models [14.3] LegalCiteBenchは、法律言語モデルにおけるクローズドブックの引用回復、引用検証、ケースマッチングを研究するためのベンチマークである。
このベンチマークは、引用検索、引用完了、引用エラー検出、ケースマッチング、ケース検証と修正の5つの引用中心タスクをカバーしている。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:37:54 GMT)
VRA: Grounding Discrete-Time Joint Acceleration in Voltage-Constrained Actuation [14.2] 電圧制約の電気アクチュエータでは、運動学的に許容される加速度は物理的に実現不可能である。
本稿では,電圧拘束アクチュエータ物理学における運動加速度を基盤とした継手レベル加速度インタフェースである,電圧緩和型加速度(VRA)を提案する。
電気アクチュエータのハードウェア実験と車輪を足した四重奏で、VRAは実現不可能な加速を除去し、一貫した近接制約実行を復元し、制約誘起振動を減少させることを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:11:45 GMT)
HiDrive: A Closed-Loop Benchmark for High-Level Autonomous Driving [14.2] HiDriveは、エンドツーエンドの自動運転のためのクローズドループベンチマークだ。
ロングテールシナリオを強調し、運転能力をよりリッチに評価する。
HiDriveはより高度な物理エンジンをベースとして、物理的にリアルなライティングと高忠実なビジュアルレンダリングを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:28:16 GMT)
Comment and Control: Hijacking Agentic Workflows via Context-Grounded Evolution [14.0] GitHub Actionsとn8nは、コードレビューやデータ同期といったタスクのためのLarge Language Model (LLM)エージェントを統合する。
敵は、不要なアクションのためにLLMエージェントを操作するために、GitHubイシューコメントなどの特定のインプットを制御し、作成することができる。
本稿では,エージェントランタイムプラットフォームを乗っ取るために,JAWと呼ばれる最初の検出・利用フレームワークを設計する。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:45:31 GMT)
DeepSight: Long-Horizon World Modeling via Latent States Prediction for End-to-End Autonomous Driving [13.9] 本稿では,連続した将来のフレームに対する潜在意味的特徴の並列予測を行う駆動世界モデルを提案する。
また,新たな社会的知識と推論機能を活用する,効率的かつ適応的なテキスト推論機構も導入する。
本稿では, 閉ループBench2driveベンチマークにおいて, 最先端(SOTA)結果を実現する新しい, 効率的かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:36:51 GMT)
EFGCL: Learning Dynamic Motion through Spotting-Inspired External Force Guided Curriculum Learning [13.9] EFGCL(External Force Guided Curriculum Learning)は、物理指導の原理に基づく強化学習手法である。
EFGCLは、タスク固有の報酬形成や参照軌跡に頼ることなく、エージェントが成功した動作の実行を物理的に経験することを可能にする。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:39:37 GMT)
The Model Knows, the Decoder Finds: Future Value Guided Particle Power Sampling [13.9] Auxiliary Particle Power Sampling (APPS) は、列レベルのパワーターゲットを部分解の集団で近似するブロックワイズ粒子アルゴリズムである。
APPSは提案訂正された電力再重み付けを用いて仮説を並列に伝播し、将来の価値誘導選択によってその生存を洗練させる。
APPSは、トレーニング不要なデコーディングの精度と実行時のトレードオフを改善し、トレーニング後のシステムとのギャップの一部は、より忠実な推論時電力近似によって回復可能であることを示唆している。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:46:44 GMT)
How Does Differential Privacy Affect Social Bias in LLMs? A Systematic Evaluation [13.8] Webスケールコーパスでトレーニングされた大規模言語モデル(LLM)は、センシティブなトレーニングデータを記憶することができ、重大なプライバシーリスクを生じさせる。
差分プライバシー(DP)は、トレーニング中の個々のデータポイントの影響を制限する原則的なフレームワークとして登場した。
DP-SGDを訓練したプレトレーニング LLM における社会的バイアスの体系的評価について述べる。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:03:05 GMT)
Multi-domain Multi-modal Document Classification Benchmark with a Multi-level Taxonomy [13.7] マルチレベル・マルチドメイン・マルチモーダル文書分類ベンチマーク(MMM-Bench)を構築した。
MMM-Benchは、(1)ビジネス文書の真正な組織論理を捉える5つのレベルにまたがる深い階層的な分類、(2)Alibabaの12の商業ドメインから慎重にキュレートされた実世界の5,990のマルチモーダル文書を含む。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:28:27 GMT)
DuetFair: Coupling Inter- and Intra-Subgroup Robustness for Fair Medical Image Segmentation [13.7] textbfDuetFairメカニズムはサブグループ間の適応とサブグループ間のロバスト性を考慮する。
textbfFairDROは、dMoE(distributment-aware mixed-of-experts)とサブグループ条件の分散ロバスト最適化(distributmentally robust optimization、DRO)のロスアグリゲーションを組み合わせる。
FairDROはHarvard-FairSegの株式規模で最高のパフォーマンスを達成し、HAM10000の最悪のサブグループのパフォーマンスを、年齢と人種ベースのグループ方式の両方で改善する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:08:35 GMT)
Agentic Performance at the Edge: Insights from Benchmarking [13.6] モデルのサイズがメモリ、電力、レイテンシの予算によって制限されている場合、エージェントタスクの品質がどれだけ失われるかを調査する。
私たちの中核的な発見は、エッジエージェントの品質はパラメータカウントの単純な機能ではないということです。ロバストなデプロイメントは、モデル選択とツールワークフローの共同設計に依存します。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:24:20 GMT)
Transcoda: End-to-End Zero-Shot Optical Music Recognition via Data-Centric Synthetic Training [13.6] i) 高度な合成データ生成パイプライン上に構築されたOMRシステムであるTranscoda, (ii) 独自の正規形式を強制する*kernエンコーディングの正規化, (iii) 出力の構文的正しさを保証する文法に基づく復号化を提案する。
Transcodaは18.46%のOMR-NED(次のベストシステムであるLegotoで43.91%に比較)で新たにキュレートされたOMR-NED(OMR-NED)のベンチマークで、過去のポーランドのスキャンのエラー率を63.97%に下げた。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:50:28 GMT)
VPD-100K: Towards Generalizable and Fine-grained Visual Privacy Protection [13.5] 既存のプライバシ指向データセットは、しばしば、限られたスケール、粗い粒度のアノテーション、狭いドメインカバレッジに悩まされる。
一般化されたプライバシー検出を容易にするために設計された,大規模できめ細かいビジュアルプライバシデータセット(VPD-100K)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:06:30 GMT)
Dynamic Cross-Modal Prompt Generation for Multimodal Continual Instruction Tuning [13.5] DRAPEは、MCITのために連続インスタンス固有のソフトプロンプトを合成するプロンプト学習フレームワークである。
DRAPEは、代表的なプロンプトベースとLoRAベースの連続学習ベースライン間の最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:59:06 GMT)
GLiNER-Relex: A Unified Framework for Joint Named Entity Recognition and Relation Extraction [13.3] 本稿では,GLiNERフレームワークを拡張した統一アーキテクチャであるGLiNER-Relexを紹介する。
提案手法では,共有双方向トランスフォーマーエンコーダを用いてテキスト,エンティティタイプラベル,リレーショナルタイプラベルを共同で表現する。
我々は,4つの標準関係抽出ベンチマーク上でモデルを評価し,特殊関係抽出モデルと大規模言語モデルとの競合性能を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:23:49 GMT)
Route by State, Recover from Trace: STAR with Failure-Aware Markov Routing for Multi-Agent Spatiotemporal Reasoning [13.3] 本稿では,現在のエージェント,タスクタイプ,型付き実行状態に対する状態条件付きポリシとして,エージェント間制御を外部化するフェールアウェアルーティングフレームワークSTARを提案する。
障害状態のトレースは異なるため、ルータは不正な出力、依存関係の欠如、ツール-グラウンド抽出-- 計算-デポジットプロトコルに異なる応答をし、中間結果を共有ブラックボードに書き込み、下流融合を行う。
その結果、トレーニング中にトレースが失敗すると、ルーティングポリシのエラー状態のサポートが拡大し、成功のみのトレーニングでは表現できないリカバリ移行が可能になることが証明された。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:34:49 GMT)
LoopVLA: Learning Sufficiency in Recurrent Refinement for Vision-Language-Action Models [13.3] LoopVLAは、表現の洗練、アクション予測、十分性推定を学習する、リカレントなVision-Language-Actionアーキテクチャである。
この結果から,LoopVLAはVLAポリシーの効率性向上のフロンティアを推し進め,パラメータを45%削減し,推論スループットを最大1.7倍向上させることを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:51:22 GMT)
Active Testing of Large Language Models via Approximate Neyman Allocation [13.3] 大規模言語モデル(LLM)は、事前トレーニングからテスト時間スケーリングまでの信頼性の高い評価を必要とする。
モデルスケールが拡大し、専門家アノテータが要求されるタスクが増加するにつれて、各評価に必要な計算コストとラベルのコストが急速に上昇する。
アクティブテストは、評価プールの小さいが有益なサブセットから評価結果を近似することで、このボトルネックを軽減することを目的としている。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:58:07 GMT)
ASTRA-QA: A Benchmark for Abstract Question Answering over Documents [13.2] ASTRA-QAは文書に対するAbSTRAct Question Answeringのベンチマークである。
ASTRA-QA は学術論文やニュース文書に 869 件の QA インスタンスが含まれている。
これらのアノテーションに基づいてASTRA-QAは、回答が必要なキーポイントとサポート対象のコンテンツをカバーするかどうかを評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:17:24 GMT)
RUBEN: Rule-Based Explanations for Retrieval-Augmented LLM Systems [13.2] 我々は、新しいプルーニング戦略を利用して、他の全てを仮定する最小限のルールの集合を効率的に識別する。
さらに, これらのルールをLLM安全性に適用し, 安全性トレーニングのレジリエンスと対向性インジェクションの有効性を検証した。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:10:35 GMT)
Lakestream: A Consistent and Brokerless Data Plane for Large Foundation Model Training [13.1] ブローカレスでオブジェクトストアネイティブなトレーニングデータプレーンであるLakestreamについて紹介する。
まず、レイクハウススタイルのACIDストレージセマンティクスに基づいて構築されたTransactional Global Batch(TGB)を紹介する。
第2に、マニフェスト内のプロデューサ状態をインライン化することにより、ストレージ層に直接リカバリと保持を実現する。
第三に、分散適応コミット(DAC)アルゴリズムは、マニフェストが大きくなるにつれて安定した取り込みスループットを維持する。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:10:16 GMT)
ChunkFlow: Communication-Aware Chunked Prefetching for Layerwise Offloading in Distributed Diffusion Transformer Inference [13.1] ChunkFlowは、GPUメモリのための通信対応でチャンク粒度のオフロードランタイムである。
SGLangの既存のレイヤワイド・オフロードよりも1.28倍のステップタイム・スピードアップを実現している。
ChunkFlowは変更可能なメモリレイテンシトレードオフを公開し、小さなワークロードレシエーションでほぼゼロのステップタイムオーバーヘッドを回復する。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:41:16 GMT)
LLMs for Secure Hardware Design and Related Problems: Opportunities and Challenges [13.0] 大型言語モデル(LLM)は電子設計自動化(EDA)とハードウェアセキュリティに統合されている。
LLMは、レジスタ転送レベル(RTL)コードの生成、テストベンチの自動化、ハイレベル仕様とシリコン間のセマンティックギャップのブリッジなど、前例のない機能を提供する。
このレビューは、EDA合成、ハードウェア信頼、セキュリティのための設計、教育における重要な進歩を中心に組織された、LLM駆動ハードウェア設計における最先端技術に関する詳細な分析を提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:31:14 GMT)
MoPO: Incorporating Motion Prior for Occluded Human Mesh Recovery [13.0] そこで我々は,MoPOと呼ばれる人体メッシュ回復のための動き優先手法を提案する。
本研究のMoPOは2つのコンポーネントから構成される: 1) 運動非閉塞モジュール, そして, 閉塞した身体部分を完成させるための軽量な運動予測器を提案する。
私たちのコードとデモは補足資料で確認できます。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:25:08 GMT)
VISOR: A Vision-Language Model-based Test Oracle for Testing Robot [12.9] ロボットをテストするには、意図したタスクを正しく、確実に、高品質に実行するかどうかを評価する必要がある。
伝統的に、この評価はタスク固有の象徴的オラクルをタスクの正しさと人間の手動によるロボット行動の評価に頼っている。
視覚言語モデル(VLM)に基づく自動テストオラクル評価手法であるVISORを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:46:57 GMT)
Compander-Aligned Query Geometry for Quantized Zeroth-Order Optimization [12.9] CAQ-ZO は 1-grid-step Rademacher stencils $z pm r$ in $z = (x)$,map endpoints back through $-1$, update in $z$ となる。
提案理論は, グリッドの分散性を証明し, 終端を囲む推定器残差を分解し, 一般のオフグリッドクエリが2/2$残差チャネルを保持するステーション境界を与える一方で, CAQ-ZO はクエリ時間残差を正確にゼロにする。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:55:20 GMT)
Characterizing the Generalization Error of Random Feature Regression with Arbitrary Data-Augmentation [12.9] 我々は、データ拡張が比例的なレグレッション手法に誘導する正規化効果を解析する。
実データの集団量のみを用いて平均2乗誤差で測定したテスト誤差の厳密な評価を行う。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:52:21 GMT)
Joint sparse coding and temporal dynamics support context reconfiguration [12.9] 我々は,文脈遷移における先行表現の保存を支援するメカニズムとして,結合スパース符号化と時間ダイナミクスを同定する。
興味深いことに、スパイクニューラルネットワークのような両方の特性を持つネットワークは、補助なしでの生涯学習の間に改善された保持を示す。
これらの知見は、生涯学習におけるフレキシブルな文脈再構成を支援するコアメカニズムとして、結合スパース符号化と時間ダイナミクスを確立した。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:29:00 GMT)
Federated Language Models Under Bandwidth Budgets: Distillation Rates and Conformal Coverage [12.8] 集中できない帯域制限ノードに散在するデータに基づいて言語モデルを訓練することは、臨床ネットワーク、企業知識基盤、科学コンソーシアムで発生する設定である。
ノード間でデータを分散し続けなければならない状況について検討し、明示的な帯域幅予算の下では、何の統計的保証が得られるのかを問う。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:01:43 GMT)
Learning to Sparsify Stochastic Linear Bandits [12.6] 本稿では,高次元空間から連続的に行動を選択する線形帯域幅の分散化を学習する問題に対処する。
本稿では,パラメータ学習のための最小二乗法と,スパース動作選択のための特別サブルーチンを用いて,適応的に段階的に探索・利用を行うアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:57:37 GMT)
Selection of the Best Policy under Fairness Constraints for Subpopulations [12.6] 医療、公共政策、臨床開発における多くの高い意思決定は、異種集団に一様に適用される単一の方針にコミットする必要がある。
我々は,この問題を,人口当たりの最低限の基準を満たす政策の中で,最も高い平均性能の政策を特定するために,公正制約問題の選択として定式化する。
フレームワークを一般のクローズドセットおよびペナルティベースのフェアネス仕様に拡張し、一致保証を行う。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:49:38 GMT)
Counterfactual Stress Testing for Image Classification Models [12.5] 医療画像における深層学習モデルは、新しい臨床環境に配備されるとしばしば失敗する。
同様のバリデーションパフォーマンスを持つモデルでは、現実の障害モードが相違する。
本稿では,現実的な「もし」な画像を生成する因果生成モデルに基づく非現実的ストレステストフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:36:16 GMT)
MLCommons Chakra: Advancing Performance Benchmarking and Co-design using Standardized Execution Traces [12.5] パフォーマンスベンチマークと共同設計のためのオープンでポータブルなエコシステムであるChakraを紹介します。
Chakraのコアコンポーネントは、Chakra実行トレース(ET)と呼ばれる、分散AI/MLワークロードのオープンで相互運用可能なグラフベースの表現である。
これらのETは、計算、メモリ、通信、データと制御の依存関係、タイミング、リソースの制約といった重要な操作を表す。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:38:10 GMT)
TrajDLM: Topology-Aware Block Diffusion Language Model for Trajectory Generation [12.4] TrajDLMは,ブロック拡散言語モデルに基づくトポロジ対応トラジェクトリ生成フレームワークである。
3つの都市規模のデータセットにわたって、TrajDLMは、きめ細かい局所類似度メトリクスで強力なパフォーマンスを達成する。
結果は,高精度かつ効率的な軌道生成のためのスケーラブルなアプローチとして,ブロックワイド離散拡散の有効性を強調した。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:44:40 GMT)
HH-SAE: Discovering and Steering Hierarchical Knowledge of Complex Manifolds [12.4] 我々は,高次元・ミッションクリティカル領域における稀な意味的革新を解決するためにtextbfHybrid (HH-SAE)を導入した。
HH-SAEは、高精度な環境発見を可能にするため、環境プロキシよりも高次メカニスティックなイノベーションを優先する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:19:45 GMT)
Robust Probabilistic Shielding for Safe Offline Reinforcement Learning [12.4] オフラインの強化学習では、環境相互作用のない固定データセットからポリシーを学習する。
安全なポリシー改善(SPI)と呼ばれる技術は、パフォーマンスを保証する: 高い確率で、新しいポリシーは与えられた基本方針よりも優れ、安全であると仮定される。
シールドをオフラインのRLに拡張し、利用可能なデータセットと安全でない状態の知識にのみ依存することで、これらのパラダイムを統合する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:54:30 GMT)
ANCHOR: Abductive Network Construction with Hierarchical Orchestration for Reliable Probability Inference in Large Language Models [12.3] 階層的に構造化された因子空間上のベイズ推定をオーケストレーションする推論フレームワークであるtextscAnchorを提案する。
実験により、textscAnchorは未知の予測を著しく削減し、より信頼性の高い確率推定を生成することが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:31:53 GMT)
Formally Verifying Analog Neural Networks Under Process Variations Using Polynomial Zonotopes [12.2] 本稿では,プロセス変動下での回路レベルモデルの性能に類似したニューロンモデルを提案する。
次に、ゾノトープを用いた到達可能性解析を用いて、回路レベルのモデルの挙動を正式に検証する。
その結果,検証時間を数日から数秒に短縮し,サンプルの99%を封じ込めて検証手法の有効性を確認した。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:37:26 GMT)
Neural Distance-Guided Path Integral Control for Tractor-Trailer Navigation [12.2] 本稿では,全トラクタ・トレーラ本体と生のLiDAR知覚との間の高速かつ正確な距離推定を実現する幾何学的ニューラルエンコーダを提案する。
これらの学習した距離はモデル予測パス積分(MPPI)コントローラに統合され、システムは真の調音幾何学を直接コスト評価に組み込むことができる。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:39:10 GMT)
Qwen Goes Brrr: Off-the-Shelf RAG for Ukrainian Multi-Domain Document Understanding [12.2] 本稿では,PDFの文脈的チャンク,質問認識高密度検索,再ランク付けという3つのアイデアに基づいて構築された検索拡張パイプラインを提案する。
以上の結果から,厳密なコード競合制約の下では,文書構造を保ち,応答空間を意識して関連性評価を行うことが,複雑な下流の追加よりも効果的であることが示唆された。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:55:28 GMT)
Language Modeling with Hyperspherical Flows [12.1] 近年のフロー言語モデル (FLM) は連続的な流れを言語に適用し、決定論的ODEを持つデータにノイズを伝達する。
$mathbbS$-FLMは、クロスエントロピーで学習した速度場に沿って$mathbbSd-1$の回転ベクトルによってシーケンスを生成する。
$mathbbS$-FLMは、大語彙推論における連続フロー言語モデルを大幅に改善する。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:32:32 GMT)
MambaNetBurst: Direct Byte-level Network Traffic Classification without Tokenization or Pretraining [12.1] MambaNetBurstは、Mamba-2のバックボーンに基づくネットワークバースト分類のための、コンパクトなトークンライザなしバイトレベルのシークエンス分類器である。
本手法は, 生パケットバイトを直接操作し, トークン化, パッチ, 重工業化されたマルチモーダル表現を回避する。
MambaNetBurstは一貫して強力な結果をもたらし、かなり重く、しばしばトレーニング済みのベースラインと競合する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:01:26 GMT)
Hyperparameter Transfer for Dense Associative Memories [12.0] Dense Associative Memory(DenseAM)は、エネルギーランドスケープで時間的ダイナミクスを実行するニューラルネットワークによって表現される、有望なAIアーキテクチャのファミリーである。
本研究は,このモデルのハイパーパラメータ転送手法の開発に着手する。
我々は、小さなモデルで調整されたハイパーパラメータが、スケールで訓練されたモデルにどのように移行できるかについて、明示的な処方則を導出する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:15:13 GMT)
The First Drop of Ink: Nonlinear Impact of Misleading Information in Long-Context Reasoning [12.0] 注意散らし情報がどのように長文パフォーマンスに影響を及ぼすかを検討する。
ハードトラクタはわずかな割合でも不均等な注意を惹きつける。
実質的な回復には、ハードディトラクタ比をほぼゼロに下げる必要があると結論付けている。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:46:20 GMT)
Why Low-Resource NLP Needs More Than Cross-Lingual Transfer: Lessons Learned from Luxembourgish [11.9] 言語間移動は、自然言語処理技術を低リソース言語に拡張するための中心的なパラダイムとなっている。
言語間移動と言語固有の取り組みの基本的な相互依存を観察する。
言語間の移動と言語固有の取り組みは、競合する代替案と見なすべきではない、と我々は主張する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:24:33 GMT)
Dynamic Skill Lifecycle Management for Agentic Reinforcement Learning [11.8] 大規模な言語モデルエージェントは、複雑なタスクを解決するために、ますます外部スキルに依存している。
既存の手法では、外部スキルは永続的なガイダンスとして蓄積するか、ポリシーに内部化され、ゼロスキル推論につながると仮定している。
パラメトリック能力の制限とスキル間の不均一な限界貢献により、最適なアクティブスキルセットは非モノトニック、タスク、ステージ依存である。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:55:13 GMT)
Learning Point Cloud Geometry as a Statistical Manifold: Theory and Practice [11.7] LiDARが取得した点雲は本質的にスパースであり、一様ではない。
既存のアプローチは、局所幾何学を推定することによってこれらの制限を補償しようとする。
本稿では,点ごとのガウス幾何学を推定する深部神経推定器であるPOLIを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:27:25 GMT)
Sparse Attention as a Range Searching Problem: Towards an Inference-Efficient Index for KV Cache [11.7] 臨界KVエントリの省略は、モデル出力に重大なエラーを引き起こす可能性がある。
既存の方法は通常、固定または適応的なトークン予算の下で機能する。
本稿では,効率的なKVキャッシュ検索に適した新しいインデックス構造であるLouverを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:30:41 GMT)
Benchmarking Safety Risks of Knowledge-Intensive Reasoning under Malicious Knowledge Editing [11.7] 大規模言語モデル(LLM)は知識集約推論をサポートするために知識編集に依存している。
悪意のある知識編集は、一般的な能力を保ちながら、確実に不正または安全でない推論を誘導することができる。
本稿では,悪意のある知識編集の下での知識集約推論の安全性リスクを体系的に評価するベンチマークであるEditRisk-Benchを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:54:05 GMT)
Accurate Evaluation of Quickest Changepoint Detectors via Non-parametric Survival Analysis [11.6] 本研究では, 平均走行距離(ARL) と平均検出遅延(ADD) を, 有限および不規則なシーケンス長下での切替点検出(QCD)における非パラメトリック推定器を提案する。
シミュレーションおよび実世界のデータセットの実験は、その実用性を示し、制限および不規則なシーケンス長に対して堅牢性を高める。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:23:48 GMT)
Couple to Control: Joint Initial Noise Design in Diffusion Models [11.6] 拡散モデルは通常、独立ガウスの初期ノイズから画像バッチを生成する。
この独立仮定は、より広範な結合ノイズ設計のクラスにおいて、一つの選択肢に過ぎないと論じる。
これにより、個々の種の選択や最適化から、マルチサンプルギャラリーの依存構造の設計まで、初期ノイズ制御が再編成される。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:56:32 GMT)
expo: Exploration-prioritized policy optimization via adaptive kl regulation and gaussian curriculum sampling [11.5] 2つの軽量プラグインモジュールを用いたExploration-Prioritized Policy Optimization (EXPO)を提案する。
我々は6つの数学的推論ベンチマークでDeepSeek-R1-Distill-Qwen-1.5BとQwen3-8B-Baseの実験を行った。
AIME 2025 pass@32では13.34で、63.33パーセントから76.67パーセントに上昇し、8Bモデルでは平均2.66でパス@32が改善されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:19:04 GMT)
What should post-training optimize? A test-time scaling law perspective [11.5] 大規模な言語モデルは、テストタイム戦略でますますデプロイされる。
標準目的は1つのレスポンスの平均報酬を最適化するが、最高$N$のパフォーマンスは報酬分布の上限によって管理される。
最近のテストタイム対応の目標は、このミスマッチに部分的に対処するが、通常、トレーニングはデプロイメントと同じプロンプト毎のロールアウト予算を使用できると仮定する。
最良N$目標の政策勾配は、上位テール統計を外挿することにより、より小さなロールアウト群から近似できることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:25:29 GMT)
HELLoRA: Hot Experts Layer-Level Low-Rank Adaptation for Mixture-of-Experts Models [11.3] Low-Rank Adaptation (LoRA) は、大きな言語モデルのパラメータ効率の良い微調整を支配している。
本稿では,HELLoRA(Hot-Experts Layer-level Low-Rank Adaptation)を提案する。
HELLoRAはLoRAモジュールを各層の最も頻繁に活性化される専門家にのみアタッチする。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:43:14 GMT)
The Price of Proportional Representation in Temporal Voting [11.2] 本研究では時間的投票モデルにおける比例表現について検討する。
時間的設定における比例代表の付与は、有権者数やラウンド数が増えるにつれて、成長するが、サブリニアな、福祉損失を引き起こす可能性があることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:05:30 GMT)
AllocMV: Optimal Resource Allocation for Music Video Generation via Structured Persistent State [11.1] AllocMVは、音楽ビデオ合成をMultiple-Choice Knapsack Problem (MCKP)として定式化した階層型フレームワークである。
マルチモーダルキューからセグメントサリエンシを推定することにより、動的プログラミングに基づくグループレベルのMCKPソルバは、High-Gen、Mid-Gen、Reuseの各ブランチにリソースを最適に割り当てる。
反復的な音楽モチーフに対しては,視覚的接頭辞を再利用してコストを低減し,モチーフレベルの連続性を確保した分岐型フォーク戦略を実装した。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:31:35 GMT)
An Information-Theoretic Criterion for Efficient Data Synthesis [11.1] 合成データは大規模言語モデルの訓練には不可欠であるが、その有効性は非常に矛盾している。
我々はこの矛盾を情報理論で説明する。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:27:59 GMT)
CheXTemporal: A Dataset for Temporally-Grounded Reasoning in Chest Radiography [11.1] 胸部X線を用いた胸部X線撮影における時間的根拠推論のためのデータセットであるCheXTemporalを紹介した。
このデータセットには、新しい、悪い、安定した、改善された、解決された、5つのクラスの進行分類が含まれ、局所化された病理の空間的監督、明示的な空間的時間的アライメントが含まれる。
ゼロショット設定において,複数の視覚言語CXRモデルをグラウンド化および進行分類タスクに基づいて評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:47:24 GMT)
Geometry-aware Prototype Learning for Cross-domain Few-shot Medical Image Segmentation [11.1] クロスドメイン少ショット医療画像セグメンテーション(CD-FSMIS)は、新しい解剖学的カテゴリと見えない画像領域を同時に一般化するモデルを必要とする。
既存の原型的アプローチは、必然的に解剖学的構造とドメイン固有の外観変化を絡み合わせる。
幾何対応のCD-FSMISフレームワークであるGeoProtoを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:32:26 GMT)
Factual recall in linear associative memories: sharp asymptotics and mechanistic insights [11.1] ニューラルネットワークによる入力出力関連の保存と検索の限界について検討する。
線形連想メモリは$p$入力埋め込みを$mathbbRd$で対応する$d$次元のターゲットにマッピングする。
分離されたモデルでは最大$p_c log p_c / d2 = 1 / 2$のアソシエーションを保存できることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:24:02 GMT)
VeloGauss: Learning Physically Consistent Gaussian Velocity Fields from Videos [11.0] VeloGaussは、複雑なダイナミックな3Dシーンの物理的特性を物理的に学習するように設計されている。
本研究では,各ガウス粒子の速度場を物理コードと粒子動力学システムを導入して学習する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:38:14 GMT)
Distributed Pose Graph Optimization via Continuous Riemannian Dynamics [11.0] 分散ポーズグラフ最適化(PGO)のためのフレームワークを提案する。
ポーズ変数を減衰する粒子としてモデル化することにより、結果のPGO問題の平衡点は、元のPGO問題の1次臨界点と一致する。
PGOデータセットのベンチマーク実験により,提案手法は同期型と非同期型のいずれにおいても,最先端の分散ベースラインよりも優れた性能が得られることが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:24:16 GMT)
SEVO: Semantic-Enhanced Virtual Observation for Robust VLA Manipulation via Active Illumination and Data-Centric Collection [10.9] ポリシーアーキテクチャを変更することなく、環境横断操作を改善するデータ中心のアプローチであるSEVOを提案する。
本稿では,多種多様なデータ収集プロトコルが,一般化の唯一の重要な要因であることを示す。
本研究は, モデルスケーリングではなく, データ収集における観察設計と環境多様性を原則とし, 低コストロボットが生活環境において確実に動作できることを実証するものである。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:23:04 GMT)
PlantMarkerBench: A Multi-Species Benchmark for Evidence-Grounded Plant Marker Reasoning [10.9] PlantMarkerBenchは、フルテキストの生物学的論文から文献的な植物マーカーのエビデンスを解釈するベンチマークである。
4つの植物種にまたがり、5,550件の文章レベルのエビデンス・インスタンスが含まれており、マーカーのエビデンス、エビデンス・タイプ、サポートの強さを示す。
種々にわたる多様なオープンソースおよびクローズドソースの言語モデルをベンチマークし、戦略を推進します。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:57:15 GMT)
SkillRAE: Agent Skill-Based Context Compilation for Retrieval-Augmented Execution [10.8] 大きな言語モデル(LLM)ベースのエージェントは、アーティファクトリッチなタスクを解決するために、再利用可能なスキルライブラリに依存している。
本稿では,スキルベースのコンテキストコンパイルに着目した2段階RAE手法であるSkillRAEを提案する。
2つの公開ベンチマークの実験によると、SkillRAEはRAEのベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:31:48 GMT)
UFO: A Unified Flow-Oriented Framework for Robust Continual Graph Learning [10.8] 連続グラフ学習の堅牢性について検討し、そこではモデルが破滅的な忘れと騒々しい監視を同時に扱わなければならない。
これらの課題に対処するための統一フロー指向フレームワーク(UFO)を提案する。
ノイズ比の異なる4つのベンチマークグラフデータセットの実験では、UFOは既存の手法よりも精度が良く、メトリクスを忘れている。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:49:05 GMT)
Remember to Forget: Gated Adaptive Positional Encoding [10.8] GAPE(Gated Adaptive Positional)は、注意ログに直接コンテンツ認識バイアスを導入する位置エンコーディングのためのドロップイン拡張である。
GAPEは、回転ベースラインよりもシャープな注意を与え、長いコンテキストを改善していることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:52:06 GMT)
Follow the Mean: Reference-Guided Flow Matching [10.7] フローマッチングは異なる制御インターフェース(例による適応)を持つことを示す。
決定論的補間子の場合、速度場は条件付き終端平均によってのみ支配される。
これは制御可能な生成の単純な原理である:従う参照集合を変更して事前訓練されたモデルを操る。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:57:34 GMT)
Hierarchical End-to-End Taylor Bounds for Complete Neural Network Verification [10.7] ニューラルネットワークの到達可能性解析は、与えられた入力領域上で達成可能な出力の集合を計算または束縛しようとする。
既存のアプローチは、ほとんどの2階情報を利用しており、高階情報を体系的に活用していない。
textscHiTaB は Hessian, $nabla2 f$ と Lipschitz 定数 $L_nabla2 f$ の2階スムーズ性を利用する新しい検証フレームワークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:16:13 GMT)
Two-Phonon Resonance Drives Multicomponent Mechanical Cat States [10.6] 我々は光子と2つのフォノンとの強い相互作用を達成し、高純度機械猫の決定論的生成を可能にした。
我々の研究は、量子状態工学、量子精度測定、フォールトトレラント量子計算の道を開いた。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:05:08 GMT)
DANCE: Detect and Classify Events in EEG [10.6] 我々は、ニューラルネットワークをセット予測問題としてフレーム化するディープラーニングパイプラインであるDANCEを紹介した。
我々のモデルは、認知、臨床、BCIのタスクにおいて、既存の手法よりも優れています。
全体として,本手法はエンドツーエンドの非同期ニューラルデコードモデルへの一歩となる。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:01:17 GMT)
When Normality Shifts: Risk-Aware Test-Time Adaptation for Unsupervised Tabular Anomaly Detection [10.5] 教師なしタブラル異常検出のためのリスク対応テスト時間適応法を提案する。
トレーニング中、コラボレーティブなデュアルタスク学習は、複数レベルの表現をキャプチャして、堅牢な正規化を前もって確立する。
テスト中、Test-Time Contrastive Learningモジュールはモデルを選択的に更新することで、適応リスクを明示的に説明する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:16:25 GMT)
A Recursive Decomposition Framework for Causal Structure Learning in the Presence of Latent Variables [10.4] 制約に基づく因果探索は因果構造を学習するために広く用いられているが、条件独立性テスト(CI)に大きく依存しているため、高次元設定では計算コストがかかる。
本研究では,因果正当性以外の潜伏変数の設定を理論的に一般化できることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:36:52 GMT)
The Many Faces of On-Policy Distillation: Pitfalls, Mechanisms, and Fixes [10.3] オンライン蒸留(OPD)とオンライン自己蒸留(OPSD)は,大規模言語モデルのための有望なポストトレーニング手法として出現している。
我々は、OPDとOPSDがいつ機能するか、いつ機能しないのか、なぜ機能しないのかについて、総合的な実証的研究を行った。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:44:59 GMT)
AdaptSplat: Adapting Vision Foundation Models for Feed-Forward 3D Gaussian Splatting [10.3] 本研究は, フィードフォワード型3次元ガウススプラッティングのための簡易かつ軽量なアダプタ設計について検討する(3DGS)
我々は、強力な視覚基盤モデルバックボーンの浅い特徴から、方向対応の高周波構造先行情報を抽出する周波数保存アダプタを設計する。
実験により、AdaptSplatは、複数の標準ベンチマーク上で、最先端のフィードフォワード再構築性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:14:05 GMT)
AutoSOUP: Safety-Oriented Unit Proof Generation for Component-level Memory-Safety Verification [10.3] メモリセーフティエラーは、低レベルソフトウェアにおけるゼロデイ脆弱性の永続的な原因である。
現在の検証はほとんど手作業で行われており、専門的な専門知識が必要である。
本稿では,コンポーネントレベルのメモリ安全性検証を自動化するシステムであるAutoSOUPを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:23:26 GMT)
TOC-Bench: A Temporal Object Consistency Benchmark for Video Large Language Models [10.2] ビデオ大言語モデル(ビデオ-LLM)は、一般的なビデオ理解において顕著な進歩を遂げている。
本稿では,ビデオLLMにおける時間的オブジェクトの整合性を評価するための診断ベンチマークを提案する。
ベンチマーク項目が時間的に順序付けられた視覚的証拠に依存することを保証するために,3層時間必要フィルタリングプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:47:59 GMT)
AdaPaD: Adaptive Parallel Deflation for PEFT with Self-Correcting Rank Discovery [10.2] 本稿では,AdaPaD(Adaptive Parallel Deflation)について述べる。
我々は、各成分の誤差がウォームアップ期間後に指数関数的に崩壊することを証明する。
AdaPaDは、GLUE上の適応ランクのLoRAベースラインとDeBERTaV3ベースとの整合パラメータ予算で競合する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:44:13 GMT)
Internalizing Curriculum Judgment for LLM Reinforcement Fine-Tuning [10.1] METIS(METa internalized Self-judgment)は、カリキュラムの判断をネイティブな能力として内部化するフレームワークである。
METISは、標準RTT報酬と自己判断報酬を共同最適化することで、判断と最適化のループを閉じる。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:50:29 GMT)
Compute Where it Counts: Self Optimizing Language Models [10.1] 自己回帰復号化のための動的予算配分について検討する。
我々は,教師の指導するエピソードに対して,グループ相対的な政策最適化を用いて政策を訓練する。
私たちの報酬は、言語モデルの品質と、エピソード平均の予算使用を促進するソフトなペナルティとのトレードオフです。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:27:15 GMT)
Novel GPU Boruta algorithms for feature selection from high-dimensional data [10.0] 本稿では,Boruta-Permutが置換に基づく特徴量の重要度に依存し,Boruta-TreeImpが不純物低減に基づく重要度を利用する,Boruta機能選択手順のGPUアクセラレーションバージョンを2つ提案する。
提案したGPU高速化アルゴリズムは,元のBorutaアルゴリズムに匹敵する特徴選択精度を保ちながら,計算効率を大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:54:01 GMT)
Slum Detection and Density Mapping with AlphaEarth Foundations: A Representation Learning Evaluation Across 12 Global Cities [10.0] 画素レベルのスラムマッピングは、長い間、限られた都市間一般化によって制約されてきた。
AlphaEarth Foundationsは、軽量スラムモニタリングのための新しい分析可能なベースを提供する。
我々は,12都市と69都市年対のスラム分類とサブピクセル密度推定についてAFFを評価した。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:54:15 GMT)
BabelDOC: Better Layout-Preserving PDF Translation via Intermediate Representation [10.0] 既存の文書翻訳パイプラインは言語処理とレイアウト保存の緊張に直面している。
本稿では、レイアウト保存PDF翻訳のためのIRベースのフレームワークであるBabelDOCを紹介する。
BabelDOCは、セマンティックコンテンツから視覚的なレイアウトメタデータを分離し、文書レベルの翻訳操作を可能にする。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:56:44 GMT)
Benchmarked Yet Not Measured -- Generative AI Should be Evaluated Against Real-World Utility [9.9] 我々は、生成AI評価は、静的なベンチマーク中心の透明性から、人間の成果軌跡に根ざしたステークホルダー、ゴール、コンテキスト条件付きユーティリティ透明性へのパラダイムシフトを必要とすると論じる。
SCU-GenEvalは,利害関係者と利害関係者のゴールマッピング,構成指標仕様,メカニズムモデリング,長手効用測定からなる4段階評価フレームワークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:22:01 GMT)
FedQueue: Queue-Aware Federated Learning for Cross-Facility HPC Training [9.9] 複数のHPC施設にまたがる制御学習(FL)は、壁時計時間を支配するバッチスケジューラの受け入れ遅延に直面している。
本稿では,スケジューリングやアグリゲーションに直接スケジューラ遅延を組み込むキュー対応FLプロトコルであるFedQueueを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:48:35 GMT)
MaD Physics: Evaluating information seeking under constraints in physical environments [9.8] 測定は、私たちの理解を改善するために、新しい現象を明らかにすることによって、科学的プロセスを促進する。
科学的発見のためのエージェントを評価するための既存のベンチマークは、静的知識に基づく推論か、制約のない実験的な設計タスクに焦点を当てている。
本研究では,測定の質と量に制約のある情報的測定と結論をエージェントが行う能力を評価するためのベンチマークである測定・発見物理を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:37:19 GMT)
Polygon-mamba: Retinal vessel segmentation using polygon scanning mamba and space-frequency collaborative attention [9.8] ポリゴン走査型マンバと小血管検出のための空間周波数協調型アテンション機構を統合したCNN-マンバ核融合ネットワークを設計する。
水平垂直走査による伝統的なマンバ構造は, 対象構造物の位相的整合性を損なう可能性があることを考慮し, 細血管構造の特徴を特定するために, ポリゴン走査型視覚状態空間モデル(PS-VSS)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:53:51 GMT)
Simultaneous Long-tailed Recognition and Multi-modal Fusion for Highly Imbalanced Multi-modal Data [9.8] クラス不均衡データの長期分布は、ディープラーニングモデルにとって根本的な課題である。
マルチモーダル入力を明示的に処理するロングテール認識のための新しいフレームワークを提案する。
提案手法は,異種データを統一表現に融合することにより,マルチエキスパートアーキテクチャをマルチモーダル設定に拡張する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:56:53 GMT)
M2A: Synergizing Mathematical and Agentic Reasoning in Large Language Models [9.7] モデルマージによる数学的およびエージェント的推論を相乗化する新しいパラダイムであるM2Aを提案する。
M2Aはパラメータ空間内で直接動作し、エージェントの振る舞いに不可欠な特徴部分空間を識別し、数学的推論タスクベクトルをヌル空間にのみマージする。
SFT や RL とは異なり、M2A は追加の勾配更新を必要としない。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:05:30 GMT)
Amplitude Modulation Noise Suppression of Dynamic Atom Gravimeters [9.7] 振幅変調ノイズ (AMN) は, 重力測定性能の劣化に寄与する重要な要因であることがわかった。
本研究では,寒冷な原子雲の運動パラメータに対して正規化AMNを適合させる手法を提案し,このノイズの抑制に成功している。
本研究は, その精度向上に重要な動的原子重力計の重要なノイズ源を発見し, 抑制するものである。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:29:39 GMT)
From Single-Step Edit Response to Multi-Step Molecular Optimization [9.7] 条件付き分子最適化は、特定の特性シフトを実現するために分子を編集することを目的としている。
実際には、構造的に類似した分子データは少ないが、決定は本質的には作用レベルである。
単段階分子編集応答予測器と多段階プランナからなる応答指向離散編集最適化手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:00:16 GMT)
TrajPrism: A Multi-Task Benchmark for Language-Grounded Urban Trajectory Understanding [9.7] 言語軌道アライメントのためのマルチタスクベンチマークであるTrajPrismを紹介する。
そこで我々は,トラジャプリズムを実都市軌跡と,トラジャプリズム(TrajPrism)と,トラジャプリズム(TrajPrism)とを組み合わせて構築する。
このベンチマークには、ポルト、サンフランシスコ、北京で選択された300万のトラジェクトリが含まれており、タスクインスタンスは210万である。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:17:13 GMT)
AgentGR: Semantic-aware Agentic Group Decision-Making Simulator for Group Recommendation [9.7] Group Recommendation (GR) は、モダンなソーシャルプラットフォームにおいて重要なコンポーネントとなっているユーザグループにアイテムを提案することを目的としている。
本稿では,グループ推薦のためのエージェントグループ意思決定シミュレータであるエージェントGRを提案する。
メンバーロールプレイングのための協調的セマンティックなユーザ好みを共同でキャプチャし、動的グループインタラクションをシミュレートして、実世界のグループ意思決定プロセスを反映することを目的としている。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:10:53 GMT)
SenseBench: A Benchmark for Remote Sensing Low-Level Visual Perception and Description in Large Vision-Language Models [9.6] 低レベルの視覚知覚は、信頼できるリモートセンシング(RS)画像解析の基盤となる。
現在の画像品質評価(IQA)手法は、物理駆動RS劣化を特徴付けるのではなく、解釈不能なスカラースコアを出力する。
SenseBenchは、RS低レベル視覚知覚と記述のための最初の専用診断ベンチマークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:48:57 GMT)
RW-Post: Auditable Evidence-Grounded Multimodal Fact-Checking in the Wild [9.6] RW-Postは、実世界のマルチモーダルなファクトチェックのための、ポストアラインなtextbftext-imageベンチマークである。
RW-Postは、クローズドブック、エビデンスバウンド、オープンウェブレジーム間の制御評価をサポートする。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:04:04 GMT)
Intrinsic Guardrails: How Semantic Geometry of Personality Interacts with Emergent Misalignment in LLMs [9.5] 有害な微調整はモデルの内部表現を上書きしないことを示す。
その結果,有害な微調整がモデルの内部表現を上書きしないことが示唆された。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:21:57 GMT)
Sketch-based Access Control: A Multimodal Interface for Translating User Preferences into Intent-Aligned Policies [9.4] スケッチベースのAI支援アクセス制御オーサリングシステムであるSketch-based Access Control (SBAC)を提案する。
SBACは、スケッチの表現力とマルチモーダルな大規模言語モデル(MLLM)の解釈能力を組み合わせて、ポリシー仕様の解釈と検証を支援する。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:39:40 GMT)
Analytic Continuation Between Real- and Imaginary-Time Quantum Dynamics and the Fundamental Instability of Inverse Reconstruction [9.4] 実時間および仮想時間量子力学を接続する統合スペクトル半群フレームワークを開発した。
スペクトル構造は, 再構成の忠実度を統一的に制御することを示す。
特に、非エルミート的および開系的設定は、可逆性がスペクトルの幾何学的およびスケール依存的な特徴として現れることを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:23:55 GMT)
Optimal Representations for Generalized Contrastive Learning with Imbalanced Datasets [9.4] クラスが不均衡な場合のコントラスト学習(CL)における最適表現の幾何学的特徴を計算可能とする。
不均衡なクラスとCL損失の大きな一般化された族に対して、同じクラスからの全てのサンプルの最適表現がそれらのクラス平均に崩壊することを証明する。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:18:13 GMT)
NCO: A Versatile Plug-in for Handling Negative Constraints in Decoding [9.3] 誇張やPIIのような望ましくないコンテンツの発生を防ぐための大規模言語モデル (LLM) がますます重要になっている。
我々は,有限な制約や制約に対してオンラインパターンマッチングを行うデコード戦略であるNCOを提案する。
我々は,PIIや抑制を含む実践的な課題において,その効果を実証的に実証した。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:43:42 GMT)
Red-Teaming Agent Execution Contexts: Open-World Security Evaluation on OpenClaw [9.2] 本稿では,OpenClawにおけるコンテキスト脆弱性の自動検出フレームワークであるDeepTrapについて述べる。
DeepTrapはリスク実現、良質なタスク保存、ステルスのバランスをとる。
その結果、コンテキスト妥協は、ユーザ対応タスクの完了を保ちながら、かなりの安全でない振る舞いを誘発することが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:20:02 GMT)
Computational Design of a Low-Visibility UAV Using a Human-Aligned Perceptual Metric [9.1] Phantom Twist(ファントム・ツイスト)は、高速回転と動きのぼかしの活用により低視認性を実現するために設計された単発UAVの一種である。
機能コンポーネントの配置を最適化する2段階の自動設計パイプラインを開発した。
複数の試作機の製作および飛行試験により,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:32:18 GMT)
RankQ: Offline-to-Online Reinforcement Learning via Self-Supervised Action Ranking [9.1] 我々は,時間差学習を自己監督型多段階ランキング損失で強化し,構造化された行動順序を強制するオフライン-オンラインQ-ラーニングの目的であるRanQを提案する。
視覚に基づくロボット学習において、RankQは、事前訓練されたビジョンアクション(VLA)モデルのオフラインからオンラインまでの効果的な微調整を可能にする。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:58:49 GMT)
Breaking the Reward Barrier: Accelerating Tree-of-Thought Reasoning via Speculative Exploration [9.1] Tree-of-Thought (ToT)推論構造 大規模言語モデル(LLM)推論は木に基づく探索である。
ToTの効率は報酬依存性障壁によって制約される。
ToTの高電位分岐を予測・拡張するための投機的経路選択を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:45:17 GMT)
Pseudo-Deliberation in Language Models: When Reasoning Fails to Align Values and Actions [9.1] 大規模言語モデル(LLM)は、しばしばそれらの値に基づいて評価されるが、それらが確実にそれらのアクションに変換されるわけではない。
この研究では、このギャップは明示的な推論の下でも持続すると主張し、"擬似議論(Pseudo-Deliberation)"と呼ばれるより深い障害モードを明らかにします。
本稿では,提案する値と生成された対話の一致を測定するためのフレームワークであるVALDIを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:32:53 GMT)
Automated Approach for Solving Infinite-state Polynomial Reachability Games [9.1] 有限個の実変数の値上で定義された無限状態グラフ上でのターンベースリーチビリティゲームについて検討する。
本稿では, 到達性ゲームのためのランキング証明書と, $texttREACH$ playerが指定された初期状態から入賞戦略を持っていることを証明するための健全かつ完全な証明ルールを提案する。
本実験では,既存の手法の到達範囲から外れた文献から,本手法の難解な事例を解く能力について実証した。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:19:14 GMT)
Empty SPACE: Cross-Attention Sparsity for Concept Erasure in Diffusion Models [9.1] クローズドフォームの概念消去法は、バックプロパゲーションベースの手法の高速な代替手段を提供する。
SParseクロスアテンションに基づく概念消去(SPACE)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:46:29 GMT)
Quotient-Categorical Representations for Bellman-Compatible Average-Reward Distributional Reinforcement Learning [9.0] 本稿では、状態付きバイアス法則を共通翻訳まで特定する商空間定式化を導入する。
同期の正確な更新は、商法レベルでゲイン非依存であることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:17:09 GMT)
ChatGPT: Friend or Foe When Comprehending and Changing Unfamiliar Code [9.0] 我々は、開発者がプログラミングタスクを解くのに使った問題解決アプローチにAIがどのように影響したか、そして、AIが行き詰まったときにその進捗にどのように影響したかを検討した。
10人中9人が仕事で立ち往生しているのに気付きました。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:17:26 GMT)
From Pixels to Primitives: Scene Change Detection in 3D Gaussian Splatting [8.9] 我々は、ネイティブプリミティブ属性だけでシーン変化検出に十分な信号を持っているという証拠を提供する。
プリミティブを直接操作することで、GD-DIFFという2つのプロパティが、レンダリング-then-compareメソッドと区別されます。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:43:52 GMT)
FrequencyCT: Frequency domain pseudo-label generation for self-supervised low-dose CT denoising [8.7] 周波数CTは低用量CTにおける周波数領域における擬似ラベル生成のための最初のゼロショット自己教師法である。
高周波領域における位相保存振幅変調とマスク摂動は、自己監督のための擬似ラベルデータを生成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:55:03 GMT)
Janus: Compiler-Based Defense Against Transient Execution Attacks Using ARM Hardware Primitives [8.4] 私たちは、Spectreのような一時的な実行攻撃とARM64プラットフォームでの制御フローハイジャックを緩和する、コンパイラベースのセキュリティフレームワークであるJanusを紹介します。
Janusは投機的実行と制御フロー依存性をPA修飾器と統合し、PAとBTIのマイクロアーキテクチャー機能を使用して制御フロー投機攻撃を防ぎ、既存の制御フロー整合機構を通じて制御フローと投機的実行の両方を確保する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:22:39 GMT)
ICT-NLP at SemEval-2026 Task 3: Less Is More -- Multilingual Encoder with Joint Training and Adaptive Ensemble for Dimensional Aspect Sentiment Regression [8.4] 本稿では,SemEval-2026 Task 3 Track A Subtask 1 on dimensional Aspect Sentiment Regression (DimASR)について述べる。
本稿では,多言語事前学習エンコーダをベースとした軽量かつ資源効率の高いシステムを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:33:25 GMT)
ObjView-Bench: Rethinking Difficulty and Deployment for Object-Centric View Planning [8.3] オブジェクト中心のビュープランニングにおける困難と展開を再考するための評価フレームワークであるView-Benchを紹介する。
まず、オブジェクト指向の属性としての全方位幾何学的自己隠蔽、観測飽和困難、および集合被覆の定式化によって定義されたプロトコルに依存した計画困難の3つを分離する。
第2に、予算と到達可能なビュー制約がメソッドの動作をどのように変化させるかを明らかにする、デプロイメント指向の評価プロトコルを設計する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:20:22 GMT)
Self-Attention as a Covariance Readout: A Unified View of In-Context Learning and Repetition [8.3] 大規模言語モデル(LLM)は、インコンテキスト学習(ICL)と反復生成の2つの振る舞いを示す。
どちらのモデルも、コンテキストを人口統計と捨てられたトークンレベルの詳細に要約したかのように振る舞う。
この要約と「忘れる」は、注意機構自体から導き出すことができ、肯定的に答えられるかどうかを問う。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:33:15 GMT)
Sharp feature-learning transitions and Bayes-optimal neural scaling laws in extensive-width networks [8.3] 雑音の多い質問から階層的な特徴を持つ一層教師ネットワークを学習する際の情報理論的限界について検討する。
有効幅$k_c$付近でtextscAdam を訓練した学生が,これらの最適スケーリング法則を実現することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:39:03 GMT)
Can Graphs Help Vision SSMs See Better? [8.2] 我々は、Vision SSM用のグラフ誘発動的走査演算子である textbfGraphScan を紹介する。
それぞれのトークンに対して、GraphScanは空間的に有界な局所グラフを構築し、相対的な位置バイアスで特徴条件の親和性を学び、出力トークンを生成する。
解析の結果,GraphScanはトークン格子上の解釈可能な変位場を誘導し,ダイナミックスキャニングのセマンティックで空間的に接地されたビューを提供することがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:40:37 GMT)
Sens-VisualNews: A Benchmark Dataset for Sensational Image Detection [8.2] 本稿では,刺激的,挑発的,あるいは感傷的特徴を含む画像が,注意を惹きつけ,強い情緒的反応を誘発するかどうかを判断することを目的とした感傷的イメージ検出の課題を紹介する。
このタスクの研究を支援するために,ニュース項目から9,576個の画像を含む新しいベンチマークデータセット(Sens-VisualNews)を作成し,その視覚内容に様々なセンセーショナルな概念やイベントが存在することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:38:32 GMT)
Med-StepBench: A Hierarchical Reasoning Framework for Evaluating Hallucinations in Medical Vision-Language Models [8.2] 既存の幻覚ベンチマークは、主に1ショットの診断質問を伴う2Dイメージングに焦点を当てている。
我々は3DオンコロジーPET/CTにおける段階的幻覚検出のための最初の大規模ベンチマークであるMed-StepBenchを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:26:59 GMT)
Set Prediction for Next-Day Active Fire Forecasting [8.1] 翌日のアクティブな火災予報は、早期警戒、災害対応、森林リスク評価、および火災関連二酸化炭素排出量の下流推定をサポートすることができる。
我々は,次のアクティブファイア予測をポイントセット予測として再構成するクエリベースのモデルであるWildfire Ignition Set Predictor (WISP)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:56:17 GMT)
LLM4Branch: Large Language Model for Discovering Efficient Branching Policies of Integer Programs [8.1] LLM4Branchは、効率的な分岐ポリシーの発見を自動化する新しいフレームワークである。
標準MILPベンチマークの実験では、LLM4BranchがCPUベースのメソッド間で新しい最先端を確立していることが示されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:41:54 GMT)
Beyond Self-Play and Scale: A Behavior Benchmark for Generalization in Autonomous Driving [8.1] 最近の自律運転(AD)研究は、政策推進のための訓練戦略として強化学習(RL)を大規模に解き放たれた。
しかし、これらのポリシーは確立されたベンチマークから切り離されたままであり、標準化された評価を駆動するための大規模RLの性能は未知のままである。
評価、複雑さ、振る舞いの多様性という3つの軸に沿って、このギャップを埋める包括的なテストスイートであるBehaviorBenchを紹介します。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:59:49 GMT)
Can Agent Benchmarks Support Their Scores? Evidence-Supported Bounds for Interactive-Agent Evaluation [8.0] インタラクティブエージェントベンチマークは、結果チェックを通じてエージェントの実行をバイナリ結果にマッピングする。
これらのチェックは、表面レベル信号に依存するか、エージェントの実際のアクションパスをキャプチャできない。
既存のベンチマークに対して、結果エビデンスレポート層を導入します。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:20:15 GMT)
Cross-Family Universality of Behavioral Axes via Anchor-Projected Representations [8.0] 異なる家系の大規模言語モデルは、異なる隠された次元、トークン化器、訓練手順を使用する。
本稿では,各モデルからの隠れ表現を共有アンカー座標空間にマッピングするアンカー投影フレームワークを提案する。
ACSのLlama-Qwen-Mistral-Phi(LQMP)クラスタに同軸方向が密に一致していることが判明した。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:01:18 GMT)
DeconDTN-Toolkit: A Library for Evaluation and Enhancement of Robustness to Provenance Shift [8.0] データソースとデプロイメント時のラベル変更の関係はよく理解されておらず、理解されていない。
textscDeconDTN-Toolkitは,様々な段階の成果変化をシミュレートする特別評価・改善スイートである。
本稿では,経験的リスク最小化の脆弱性を明らかにするとともに,信頼性の高いアウト・オブ・ディストリビューション性能指標を導入し,既存のアルゴリズムを包括的に評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:54:42 GMT)
Clin-JEPA: A Multi-Phase Co-Training Framework for Joint-Embedding Predictive Pretraining on EHR Patient Trajectories [8.0] Clin-JEPAは、HR患者軌道上での予測(JEPA)事前トレーニングのための多相コトレーニングフレームワークである。
MIMIC-IV ICUデータでは、3つの独立した評価がフレームワークをサポートしている。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:54:23 GMT)
Localization Boosting for Growth Markets: Mitigating Cross-Locale Behavioral Bias in Learning-to-Rank [8.0] Adobe Expressの国際展開は進んでいるが、アメリカはコンテンツの供給と対話の量が非常に多い。
クリックオンリーのトレーニングは意味的情報的局所化を抑えることを示す。
本稿では,行動監視,VLMに基づく関連信号,ローカライズ・アウェア・ブーピングを組み合わせた多目的フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:51:13 GMT)
Enhancing Healthcare Search Intent Recognition with Query Representation Learning and Session Context [7.9] 本稿では,健康検索クエリの多面的特徴を捉えるために,新たな損失関数を提案する。
我々は,健康クエリのあいまいさと,グローバル検索意図と個別セッションから識別された内容との相違を定量化する。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:44:54 GMT)
Fix the Loss, Not the Radius: Rethinking the Adversarial Perturbation of Sharpness-Aware Minimization [7.9] Loss-Equated SAM (LE-SAM) は Sharpness-Aware Minimization (SAM) の一般化であり、勾配ノルムが支配する学習信号を除去し、曲率が支配する項へ最適化をシフトする。
Le-SAMはSAMとその変種を一貫して上回り、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:34:36 GMT)
Grounded or Guessing? LVLM Confidence Estimation via Blind-Image Contrastive Ranking [7.8] 本稿では,モデルに依存しない信頼度推定フレームワークBICR(Blind-Image Contrastive Ranking)を紹介する。
ライトウェイトプローブは、実像隠蔽状態に基づいてトレーニングされ、ブラックアウトビューに対する高い信頼度を罰するランキング損失によって正規化される。
5つの現代のLVLMと7つのベースラインで評価され、視覚的質問応答、オブジェクト検出、医用画像、財務文書理解に関するベンチマークが実施された。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:35:10 GMT)
Switching-Geometry Analysis of Deflated Q-Value Iteration [7.8] 本稿では, 政策最適化問題に対する拡張Q-VIの最初のJSRベースの収束解析について述べる。
デフレの利点は、引き起こされた意思決定の問題の変化ではなく、より正確なJSRベースの収束幾何学の記述である。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:32:41 GMT)
Rethinking Loss Reweighting for Imbalance Learning as an Inverse Problem: A Neural Collapse Point of View [7.8] 損失再重み付けは長い尾の分類において広く用いられる戦略である。
終端幾何は、クラスごとの平均損失が再重み付けの合理的なターゲットとして等しいことを示唆している。
本稿では,クラス重みを動的に推算して,この理想的な目的に適合させる逆ビュー再重み付け戦略を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:16:46 GMT)
Prospective Compression in Human Abstraction Learning [7.8] 本研究では,非定常領域におけるヒューマンライブラリ学習が将来的な抽象化を選択するという仮説を提案し,検証する。
本研究では,タスク生成過程における非定常構造に対する人間の抽象的行動が,潜在的・非定常的構造に対する感受性を反映していることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:54:23 GMT)
Natural Language based Specification and Verification [7.8] 大規模言語モデル(LLM)は、大規模で成熟したオープンソースシステムのセキュリティ脆弱性を特定する上で、強力なパフォーマンスを示している。
本稿では、LLMを用いて仕様を生成し、その仕様が自然言語で表現されたときに構成的に実装を検証するという、異なるアプローチについて検討する。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:07:22 GMT)
ASIP-Planner: Adaptive Planning for UAV Surface Inspection in Partially Known Indoor Environments [7.8] 本研究は、部分的に知られた屋内環境に対する適応型UAV検査フレームワークを提案する。
提案手法は,セグメントベースのグローバルカバレッジプランナと,検査指向のローカルビューアングル適応モジュールを統合する。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:28:16 GMT)
Unlearning with Asymmetric Sources: Improved Unlearning-Utility Trade-off with Public Data [7.8] プライバシーコストを軽減するために公開データを使用するフレームワークであるAsymmetric Langevin Unlearningを紹介する。
ALUは、適切な配布シフトの下でユーティリティを保ちながら、プライバシー攻撃を効果的に抑制することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:28:33 GMT)
Towards Model-Free Learning in Dynamic Population Games: An Application to Karma Economies [7.7] ダイナミックポピュレーションゲームのための既存の計算ツールは、ゲームモデルの完全な知識を前提として、中央集権的な操作を行う。
本稿では,Karma DPGにおけるモデル自由平衡学習の研究により,このギャップに対処するための一歩を踏み出した。
深部RLと架空の遊びと滑らかなポリシーを組み合わせることで、エージェントはモデルのない方法で、中央に計算されたSNEに近い構成に収束できることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:39:30 GMT)
Balancing Efficiency and Fairness in Traffic Light Control through Deep Reinforcement Learning [7.7] 本稿では、車両と歩行者の両方の交通の公平性を考慮した交通光制御のための新しい深層強化学習エージェントを提案する。
実験の結果,道路利用者の両カテゴリにおいて,適切なサービスを確保しつつ,渋滞を効果的に軽減できることが示唆された。
本研究は,スマートシティの枠組みにおける知的交通管理の実践的かつ適応的なソリューションに寄与する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:19:18 GMT)
LatentHDR: Decoupling Exposure from Diffusion via Conditional Latent-to-Latent Mapping for Text/Image-to-Panoramic HDR [7.7] Latentは、潜在空間における露光モデリングからシーン生成を分離するフレームワークである。
事前訓練された拡散バックボーンは、単一のコヒーレントなシーン表現を生成し、条件付き遅延 to-latent は、それを露光特有の表現にマッピングする。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:24:04 GMT)
Not All Proofs Are Equal: Evaluating LLM Proof Quality Beyond Correctness [7.7] 大規模言語モデル(LLM)は数学的な問題解決に有効である。
ProofRankは、挑戦的な数学的競争から得られたベンチマークである。
正当性のみのベンチマークでは得られない証明品質にはかなりの違いがある。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:23:36 GMT)
Renormalization of Quantum Operations: Parity-Time Transition and Chaotic Flows [7.7] 量子演算によって支配される非単位量子力学について検討する。
粗粒化をリアルタイムに行うことで、非一貫性とコヒーレントダイナミクスの競合が、RGフローの挙動において決定的な役割を果たすことがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:29:24 GMT)
Hi-GaTA: Hierarchical Gated Temporal Aggregation Adapter for Surgical Video Report Generation [7.6] 手術報告生成のための知覚推論フレームワークを提案し, 軽量な時間適応型HiGa-TAを特徴とする。
実験により,提案手法は,MLLMベースラインよりも一貫したゲインを達成し,全体的な性能を向上することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:21:34 GMT)
MIRA: An LLM-Assisted Benchmark for Multi-Category Integrated Retrieval [7.5] MIRAは、大規模社会科学検索プラットフォームに基づく新しいベンチマークである。
異種カテゴリーにまたがるカテゴリーを意識してランク付けするように設計されている。
4つの異なるカテゴリの学術的項目をカバーし、多面的評価を可能にする。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:26:33 GMT)
Training-Free Cultural Alignment of Large Language Models via Persona Disagreement [7.5] 本研究では、各国を世界価値サーベイグラウンドのペルソナエージェントのパネルとしてインスタンス化し、その不一致をバウンド・ロス・アバースロジット補正に変換する推論時手法であるdisCAを紹介する。
以上の結果から,推論時キャリブレーションは,グローバルな道徳的嗜好の長い尾を提供するための微調整に代わるスケーラブルな代替手段であることが示唆された。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:55:16 GMT)
Agentic Fuzzing: Opportunities and Challenges [7.5] 本稿では,歴史的バグを原因とするバグフィリング手法であるエージェントファズリングを提案する。
Agentは、参照とトリガーパスやコード構造で完全に異なる変種を見つける。
私たちは約1ヶ月、V8 JavaScriptエンジン上でAFuzzを実行し、40のバグ(3つの重複を含む)を見つけ、合計35,000ドルの報奨金を受け取り、2つのCVEを割り当てました。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:56:30 GMT)
A Theory of Time-Sensitive Language Generation: Sparse Hallucination Beats Mode Collapse [7.5] 文字列のグローバルな選好順序の下で,言語生成の限界について検討する。
時間的生成は、最終的に一貫した生成物に対して強い意味で不可能であることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:42:24 GMT)
GemDepth: Geometry-Embedded Features for 3D-Consistent Video Depth [7.5] ビデオ深度推定は、一眼的予測を時間領域に拡張し、コヒーレンスを確保する。
現在のアプローチは主にトランスフォーマーによる時間的平滑化に依存しており、厳密な3次元幾何学的整合性を維持するのに苦労している。
GemDepthは,カメラモーションとグローバル3D構造を明確に認識することが3D一貫性の前提条件である,という知見に基づいて構築されたフレームワークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:11:54 GMT)
Epistemic Uncertainty for Test-Time Discovery [7.5] 大規模言語モデルを用いた科学的発見の自動化は、真に新しい解決策を特定することに依存している。
この制限を克服するには、探索されていない領域を本質的に困難な問題と区別する信号が必要である。
UG-TTTはこの課題に対処し、冷凍ベースモデル上で低ランクアダプタの小さなアンサンブルを維持する。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:26:30 GMT)
When to Ask a Question: Understanding Communication Strategies in Generative AI Tools [7.4] 生成型AIシステムは,コンテンツ生成前において最適な情報量を特徴付けることにより,推論と推論のバランスをとる必要があることを示す。
情報導入により、嗜好推論の体系的バイアスが軽減され、多様なユーザ視点を取り入れた生成ツールの設計が可能となることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:58:09 GMT)
Rethinking Constraint Awareness for Efficient State Embedding of Neural Routing Solver [7.4] 重エンコーダ・ライト・デコーダ(HELD)ニューラルルーティング解決器は、複数の車両ルーティング問題(VRP)にまたがる広範な適用性のために、将来性のあるパラダイムとして登場した。
本稿では,デコード中の状態埋め込み生成機構の観点から,既存のニューラルソルバを体系的に再検討する。
本稿では,グローバルな観測空間に固有の制約非依存の欠点を克服するために,シンプルながら強力な制約対応残留変調(CARM)モジュールを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:37:12 GMT)
Quantum Differential Equation Solver via Hybrid Oscillator-Qubit Linear Combination of Hamiltonian Simulations [7.4] 我々は、ハミルトニアンシミュレーション(LCHS)の線形結合のハイブリッド振動子-量子ビット定式化を導入する。
キュービットのみのLCHSでは、二次規則を離散変数(DV)アンシラレジスタで表す代わりに、LCHSカーネルを連続変数アンシラモードで符号化する。
熱方程式ベンチマークでは、Law-Eberlyプロトコルは、少なくとも99.90%のエンドツーエンドのソリューション忠実性を達成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:20:35 GMT)
Temporal Sampling Frequency Matters: A Capacity-Aware Study of End-to-End Driving Trajectory Prediction [7.4] エンド・ツー・エンド(E2E)の自律走行軌道予測は、しばしば最高時間周波数でサンプリングされたカメラフレームで訓練される。
時間サンプリング周波数を明示的なトレーニングセット設計変数として扱うことにより、この仮定を疑問視する。
各モデルデータセットペアに対して、固定されたプロトコルの下で同じモデルをトレーニングし、評価するので、周波数応答はサンプリング周波数による予測性能の変化を反映する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:34:42 GMT)
Phoenix-VL 1.5 Medium Technical Report [7.4] Phoenix-VL 1.5 Mediumは123Bパラメータのネイティブなマルチモーダルおよび多言語基盤モデルであり、地域言語やシンガポールの文脈に適応している。
Phoenix-VL 1.5 Mediumはシンガポールのマルチモーダル、合法、政府政策のベンチマークで最先端のパフォーマンスを達成した。
本稿では,局所的な知識ベンチマークと,制度的に整合したモデル行動と安全性の枠組みを含む新しい評価スイートを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:36:37 GMT)
Regret Analysis of Guided Diffusion for Black-Box Optimization over Structured Inputs [7.3] 我々は、ガイド付き拡散BOのための最初の証明書ベースの予測単純なフレームワークを開発した。
指数関数的な有限予算収束と加速度が同じメカニズムから生じることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:28:00 GMT)
Spurious Correlation Learning in Preference Optimization: Mechanisms, Consequences, and Mitigation via Tie Training [7.2] 標準の嗜好学習は,2つのチャンネルを通じて,人口レベルでの素早い特徴に頼っていることを示す。
同じトレーニングディストリビューションからのより多くのデータは、スプリアス機能へのモデルの依存を減らすのに失敗する。
本稿では,データ駆動型正規化の導入にタイを用いたデータ拡張戦略であるタイトレーニングを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:41:12 GMT)
V-ABS: Action-Observer Driven Beam Search for Dynamic Visual Reasoning [7.2] MLLM(Multimodal large language model)は、一般的な認識において顕著な成功を収めてきたが、複雑な多段階の視覚的推論は、依然として永続的な課題である。
本稿では,アクション・オブザーバ駆動のビームサーチフレームワークであるV-ABSを紹介する。
V-ABSは最先端の性能を実現し,Qwen3-VL-8Bベースラインで平均19.7%の改善を実現している。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:21:52 GMT)
A neurosymbolic Approach with Epistemic Deep Learning for Hierarchical Image Classification [7.2] 本研究では,スイニングトランスフォーマーを増強するための統合型ニューロシンボリック・エピステマティック・モデリングフレームワークを提案する。
ラベルを孤立したカテゴリとして扱うのではなく、本手法はデータ駆動型焦点セットを誘導する。
これらの焦点集合は信念理論の層の基礎を形成する。
学習可能な損失は、キャリブレーション、質量正規化、論理一貫性のバランスを保ち、モデルがデータ駆動型エビデンスでシンボル構造を適応的に取り除くことができる。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:43:43 GMT)
PFN-TS: Thompson Sampling for Contextual Bandits via Prior-Data Fitted Networks [7.2] 我々は,PFN後続予測を平均逆サンプルに変換するトンプソンサンプリングアルゴリズムであるPFN-TSを提案する。
PFN-TSは、非線形合成およびOpenML分類帯域間ベンチマークで最高の平均ランクを達成している。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:46:10 GMT)
Measurement-Adapted Eigentask Representations for Photon-Limited Optical Readout [7.2] 下流の推測は、分類や意思決定の前にノイズの多い高次元センサーの測定がどのように表現されるかに依存する。
固有タスクは、ノイズ下での可解性に応じて読み出し特徴を順序付けすることで、光学センサ出力の計測適応表現を提供することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:35:08 GMT)
NoRIN: Backbone-Adaptive Reversible Normalization for Time-Series Forecasting [7.2] NoRIN は arcsinh-form Johnson $S_U$ 変換に基づく非線形正規化であり、2つの形状パラメータ $(,varepsilon)$ が尾行性および歪性を制御する。
NoRINは、勾配学習から形状選択を分離することで、変性問題から逃れる。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:42:52 GMT)
LimeCross: Context-Conditioned Layered Image Editing with Structural Consistency [7.1] トレーニング不要な文脈条件付き階層画像編集フレームワークLimeCrossを提案する。
テキストに従ってユーザ選択のRGBAレイヤを編集し、残りのレイヤは変更しない。
実験により、LimeCrossは強力な編集ベースラインよりも層純度と合成リアリズムを改善することが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:18:28 GMT)
Engineering Robustness into Personal Agents with the AI Workflow Store [7.0] 我々は、AIエージェントの主流のパラダイムは「オンザフライ」ループであり、エージェントはプランを合成し、ユーザプロンプトに応じて数秒から数分以内にアクションを実行する。
迅速なリアルタイム合成に焦点を合わせることで、AIエージェントは、ユーザーが無意識にそれらを適用できるような高度なシナリオに適合するシステムではなく、ユーザーが即興のプロトタイプを効果的に提供できるのだろうか?
本稿では,厳密なSEプロセスをエージェントループに統合して生産段階,硬化,決定論的に制約されたエージェント*ワークフローを生成する必要性を論じる。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:46:33 GMT)
On the KAK Decomposition and Equivalence Classes [7.0] 連結な半単純リー群に対する KAK 分解の理論を示し、$mathrmSU(4)$ の分解を導出する。
次に、KAK同値類、二重コセット同値、射影同値の2つの異なる概念を区別する。
我々の研究は、量子ゲートと回路の理論のための厳密なリー理論の基礎を確立する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:17:18 GMT)
Computation of entanglement for quantum states by a Consensus-Based Optimization method [6.7] エンタングルメント計算のためのコンセンサスベースの最適化(CBO)手法を提案する。
可変相互作用集合を扱うために,粒子を異なるサイズで交換する機構を導入する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:18:12 GMT)
ChronoSC: Task-Oriented Semantic Communication via Temporal-to-Color Encoding [6.7] ビデオ質問(VideoQA)のためのタスク指向意味コミュニケーションフレームワークを提案する。
Chrono-SC Stackingは、時間的ビデオダイナミクスを1つの静的イメージにエンコードし、送信前に極端な時間的圧縮を可能にする。
CLEVRデータセットの実験では、Chrono-SCは生のビデオ伝送に比べて192倍の帯域幅削減を実現している。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:29:05 GMT)
Physics-Informed Teacher-Student Ensemble Learning for Traffic State Estimation with a Varying Speed Limit Scenario [6.6] 物理インフォームド・ディープ・ラーニング(PIDL)ニューラルネットワークは、輸送実践者にとって有用な道具であることを示す。
本稿では,PIDLニューラルネットワークと教師学生のアンサンブル学習を統合して交通状況推定を行う新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:59:31 GMT)
Unified Approach for Weakly Supervised Multicalibration [6.6] マルチキャリブレーションでは、予測スコアは、豊富なサブグループのファミリーとスコアに依存したテストのラベル確率に一致するように要求される。
既存の手法では、評価と後処理のためにクリーンな入力ラベルペアが必要である。
弱い監督下での多重校正を推定・補正するための統一的な枠組みを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:30:09 GMT)
HyperEyes: Dual-Grained Efficiency-Aware Reinforcement Learning for Parallel Multimodal Search Agents [6.5] 視覚的接地と検索を1つのアトミックアクションに融合させる並列マルチモーダル検索エージェントHyperEyesを提案する。
6つのベンチマークで、HyperEyes-30Bは最上位のオープンソースエージェントを9.9%上回り、平均5.3倍のツールコールラウンドを減らした。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:21:13 GMT)
E-TCAV: Formalizing Penultimate Proxies for Efficient Concept Based Interpretability [6.5] TCAV (Testing with Concept Activation Vectors) は、解釈可能な方法である。
TCAVは計算オーバーヘッド、TCAVスコアの層間不一致、統計的不安定さに悩まされている。
E-TCAVは、TCAVスコアの効率的な近似のためのフレームワークである。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:25:41 GMT)
Where Does Long-Context Supervision Actually Go? Effective-Context Exposure Balancing [6.5] 長いコンテキスト適応はしばしばウィンドウスケーリングと見なされるが、トークンレベルの監視ミスマッチを見逃す。
我々は、長期有効コンテキスト目標に余分な重みを割り当てる監視割当目的であるEXACTを紹介する。
長いコンテキスト適応は、いかに強いトレーニングが長いコンテキスト予測を監督するかに依存します。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:23:21 GMT)
GLiNER2-PII: A Multilingual Model for Personally Identifiable Information Extraction [6.5] GLiNER2-PIIはGLiNER2から適応した0.3Bパラメータモデルであり,文字スパン分解能において42種類のPIIエンティティタイプを広範囲に分類する。
このようなシステムのトレーニングは、共有可能な注釈付きデータの不足と、実際のPIIを大規模に収集する際のプライバシーリスクに制約されている。
我々はHugging Faceのモデルをリリースし、オープンなPII検出システムのさらなる研究と実践的な展開を支援する。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:29:30 GMT)
MicroViTv2: Beyond the FLOPS for Edge Energy-Friendly Vision Transformers [6.4] Vision Transformer (ViT) は、視覚タスク全体にわたって顕著な精度を達成するが、エッジデプロイメントには計算コストがかかる。
本稿では,実デバイス効率に最適化された軽量ビジョントランスであるMicroViTv2を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:54:27 GMT)
CORTEG: Foundation Models Enable Cross-Modality Representation Transfer from Scalp to Intracranial Brain Recordings [6.4] 頭蓋内皮質電図(ECoG)は、脳-コンピュータインターフェースのための皮質活動への高信号-雑音アクセスを提供する。
本研究では,ECoG に適応可能な大規模な頭皮-EEG ファンデーションモデル (EEG FMs) について検討する。
我々は、事前訓練されたEEG FMバックボーン、電極対応のKNNSoftFourier空間アダプタ、低周波および高ガンマ活動のためのデュアルストリームトークンーザを組み合わせたクロスモーダル転送フレームワークであるCORTEGを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:40:42 GMT)
The Bystander Effect in Multi-Agent Reasoning: Quantifying Cognitive Loafing in Collaborative Interactions [6.4] 我々は3つのデータセットコンテキストにまたがる22,500の決定論的軌跡を,3つの最先端(SOTA)モデルで評価した。
我々はtextitSovereignty Gap を形式化する:モデルはしばしば正しい導出を内部で計算するが、アライメント幻覚に苦しむ」。
我々は,マルチエージェントの社会的負荷が厳密に非可換であることを証明し,リード・アンカーの監査役の「ブランド」アイデンティティは群集の整合性を不当に判断する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:13:01 GMT)
Signature Approach for Contextual Bandits with Nonlinear and Path-dependent Rewards [6.3] 我々は,新しいシグネチャ変換に基づくアプローチにより,非線形および経路依存の報酬を伴う文脈的包帯について検討する。
この枠組みに基づいて,署名に基づく不整合上信頼境界(UCB)アルゴリズムである textttDisSigUCB を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:13:52 GMT)
CppPerf: An Automated Pipeline and Dataset for Performance-Improving C++ Commits [6.3] CppPerf-Mineは、GitHub上のオープンソースのC++リポジトリから実行時改善パッチをマイニングするパイプラインである。
CppPerf-Mineを使って、42の成熟したC++リポジトリのパッチを手作業で検証した347のベンチマークであるCppPerf-DBを構築します。
OpenHandsはCppPerf-DBのパッチの13.5%しか正しく修正していない。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:33:32 GMT)
DeepLévy: Learning Heavy-Tailed Uncertainty in Highly Volatile Time Series [6.3] DeepLévyは、Lévyの安定分布の混合を学習するニューラルネットワークフレームワークである。
DeepLévyには、複数のLévyコンポーネント上でコンテキスト依存の重みとパラメータを適応的に学習する混合メカニズムが組み込まれている。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:08:40 GMT)
Extended Wasserstein-GAN Approach to Causal Distribution Learning: Density-Free Estimation and Minimax Optimality [6.2] 分布因果推論は介入結果の分布を推定する必要がある。
GANベースのカウンターファクト法はこのタスクの柔軟なツールである。
本稿では,条件推定のためのGAN(GAN)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:52:20 GMT)
Consistency as a Testable Property: Statistical Methods to Evaluate AI Agent Reliability [6.2] 本稿では,AIエージェント信頼性のための厳密な計測科学を確立する。
出力レベルの信頼性に$U$-statistics、軌道レベルの安定性にカーネルベースのメトリクスを活用することにより、エージェントを評価するための原則的なアプローチを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:06:24 GMT)
Sequential Behavioral Watermarking for LLM Agents [6.2] LLMベースのエージェントは実行可能決定のシーケンスを通じて作用するが、その軌道はどのエージェントやポリシーが生成したかの証拠はほとんど得られない。
これにより、生成されたテキストにのみ埋め込まれるのではなく、エージェントの振る舞いに直接埋め込まれた透かし信号が動機付けられる。
本稿では、履歴条件の遷移パターンに信号を埋め込むシーケンシャルな行動透かしフレームワークSeqWMを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:28:34 GMT)
Not-So-Strange Love: Language Models and Generative Linguistic Theories are More Compatible than They Appear [6.2] LMは形式構造に基づいて勾配理論をインスタンス化することができると私は論じる。
これにより、利用ベースのアカウントと生成アカウントの和解が可能になる。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:38:40 GMT)
Generalization Error Bounds for Picard-Type Operator Learning in Nonlinear Parabolic PDEs [6.2] Duhamel-Picard 反復に基づく非線形放物型PDEの解演算子に対する演算子学習について検討した。
実装エラーを推定誤差から分離する実装非依存の一般化誤差境界を導出する。
我々は、連続する時間ブロック上で同じ学習されたローカルモデルをロールアウトすることで、分析を長期予測にまで拡張する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:35:37 GMT)
Equilibrium Residuals Expose Three Regimes of Matrix-Game Strategic Reasoning in Language Models [6.2] 大きな言語モデルは、名前付きゲーム理論のベンチマークでうまくスコアを付けることができ、セマンティックキューが取り除かれると、同じ戦略的計算で失敗する。
プロシージャ的に生成されたゼロサム行列ゲームとはこのギャップを示す。
トレーニングは2時間2ドルと3時間3ドルで、教師なしの微調整は5時間5ドルから7時間7ドルを2%から61%に引き上げる。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:49:08 GMT)
Enabling Performant and Flexible Model-Internal Observability for LLM Inference [6.2] DMI-Libは、内部オブザーバビリティをファーストクラスのシステムプリミティブとして扱う高速なディープモデルインスペクタである。
DMI-Libはオフラインのバッチ推論でわずか0.4%~6.8%のオーバーヘッドしか発生せず、オンラインの適度なサービスでは平均6%である。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:01:36 GMT)
Pretraining large language models with MXFP4 [6.1] 我々は,前向きのアクティベーションやアクティベーション勾配が安定している場合でも,大規模言語モデルのフルパイプFP4トレーニングがしばしば分岐する理由を考察する。
その結果,FP4トレーニングの不安定性は,過度な直感性ではなく,敏感な勾配経路に沿った構造的マイクロスケーリング誤差によって引き起こされることがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:04:07 GMT)
BRIDGE: Background Routing and Isolated Discrete Gating for Coarse-Mask Local Editing [6.1] 粗いマスクのローカル画像編集は、周囲のシーンを保存しながら、ユーザが指定した領域を変更するモデルを要求する。
本研究では,この障害をマスク形状バイアスとして検討し,そのタスクを2次元制約によりフレーム化する。
Bridgeはこの設定に対処するため、DiTバックボーンの外側にマスクを置き、構築とブレンディングをサポートし、DiT内部マスク注入やコピーコントロールブランチを避ける。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:16:17 GMT)
MUSDA: Multi-source Multi-modality Unsupervised Domain Adaptive 3D Object Detection for Autonomous Driving [6.1] 自律運転のための3次元物体検出におけるマルチソース・マルチモーダリティ非教師付きドメイン適応のための新しいフレームワークを提案する。
我々のフレームワークは、モダリティとソースドメインの両方の情報を効果的に統合し、一貫して最先端の手法より優れています。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:50:08 GMT)
HapticLDM: A Diffusion Model for Text-to-Vibrotactile Generation [6.1] HapticLDMはLDM(Latent Diffusion Models)上に構築された最初のテキスト・バイブレーション生成モデルである
微細な動的モデリングのための高品質なデータペアをキュレートするためのテキスト処理戦略を導入する。
我々は,最先端のベースラインに対するA/Bテストや,30名の参加者を対象としたユーザスタディなど,幅広い評価を行っている。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:26:51 GMT)
The two clocks and the innovation window: When and how generative models learn rules [6.1] 有限データで訓練された生成モデルは、根本的な緊張に直面します。
モデルがトレーニングサンプルを再生するステップである $_mathrmrule$ と $_mathrmmem$ である。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:44:18 GMT)
Mistake-Bounded Language Generation [6.0] 言語生成の限界における学習課題について検討する。
我々は、伝統的なラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・ラスト・
我々のフレームワークは、ノイズの多い敵に適応できるように拡張可能であることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:32:01 GMT)
C-CoT: Counterfactual Chain-of-Thought with Vision-Language Models for Safe Autonomous Driving [6.0] 本稿では,運転決定を5段階に分解する反ファクト・チェーン・オブ・シント(C-CoT)フレームワークを提案する。
本稿では, 代替アクションの組み合わせによる潜在的影響を明確に評価するために, メタアクション評価ツリーを構築した。
この自己回帰推論は、行動選択と安全結果の因果関係を確立し、長い尾とアウト・オブ・ディストリビューションのシナリオにおける堅牢性を改善する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:45:00 GMT)
VISTA: A Generative Egocentric Video Framework for Daily Assistance [5.9] 本稿では,AIエージェントのトレーニングおよび評価データとして,高忠実度エゴセントリックビデオを生成するビデオ合成システムであるVISTAを紹介する。
VISTAは5ステップのスクリプト生成パイプラインを使用し、因果リバース推論を用いて、多様で論理的に基礎付けられた介入モードを生成する。
これらのシナリオは、リアクティブとアクティブという、エージェントの自律性の2つのレベルにまたがる。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:50:47 GMT)
Predictive Radiomics for Evaluation of Cancer Immune SignaturE in Glioblastoma: the PRECISE-GBM study [5.8] IDH-wildtype glioblastomaにおけるマクロファージサブタイプM0抗原の非侵襲的予測
これらのバイオマーカーは、将来的なグリオ芽腫臨床試験において、免疫療法のために患者を階層化する可能性がある。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:38:40 GMT)
SciIntegrity-Bench: A Benchmark for Evaluating Academic Integrity in AI Scientist Systems [5.8] 本稿では,SCIINTEGRITY-BENCHについて紹介する。
11のトラップカテゴリにまたがる33のシナリオがそれぞれ構築されており、失敗の正直な認識が唯一の正しい応答である。
231を越える評価は、7つの最先端のLCMにまたがって行われ、全体的な完全性問題は34.2%に達し、モデルがゼロ失敗を達成することはない。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:19:17 GMT)
QT-Net: Rethinking Evaluation of AI Models in Atomic Chemical Space [5.8] 量子トポロジカルニューラルネットワーク(Quantum Topological Neural Network, QT-Net)は、回転的に拡張された非同変グラフニューラルネットワークである。
QT-Netは、トレーニングセット外のQM9から分子中の原子の性質を推測するために使用できることを示す。
我々はQT-NetのJAX実装を含むすべてのコードとデータをリリースし、原子スケールの分子機械学習のための誘導バイアスとして学習されたQTAプロパティの幅広い利用を支援する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:29:10 GMT)
The Bicameral Model: Bidirectional Hidden-State Coupling Between Parallel Language Models [5.8] Bicameral Modelは、中間の隠れ状態にあるトレーニング可能なニューラルネットワークを通じて、2つの凍結した言語モデルを結合する。
算術では、2つの0.5Bモデルと電卓を結合すると精度が36%から96%に向上する。
論理グリッドパズルでは、2つの0.6BモデルとZ3ソルバを結合すると、ZebraLogicの未発表のベースラインが$1.7timesとなる。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:25:39 GMT)
Nearly-Optimal Algorithm for Adversarial Kernelized Bandits [5.8] 本稿では,敵対的環境下での核化バンディット(ガウス過程バンディットとも呼ばれる)について検討する。
指数関数的重み付けアルゴリズムは$tildeO(sqrtT _T)$逆後悔を達成し,$T$と$_T$はラウンド数と最大情報ゲインを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:56:18 GMT)
Hilbert-Geo: Solving Solid Geometric Problems by Neural-Symbolic Reasoning [5.7] Hilbert-Geoは、固体幾何学のための最初の統一形式言語フレームワークである。
本稿では,まず2段階の推論を含むParse2Reason法を提案する。
提案手法は,SolidFGeo2kで77.3%,MathVerse-Solidで84.1%の性能を実現する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:42:41 GMT)
Every Preference Has Its Strength: Injecting Ordinal Semantics into LLM-Based Recommenders [5.6] 我々は,対話レベルのユーザフィードバックをモデル化することによって,好みの強さを明示的に組み込んだハイブリッドCF-LLMフレームワークであるOrdinal Semantic Anchoring (OSA)を提案する。
複数の実世界のデータセットの実験は、OSAが既存のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:21:36 GMT)
NSPOD: Accelerating Krylov solvers via DeepONet-learned POD subspaces [5.5] NSPOD(Neural Subspace Proper Orthogonal Decomposition)は,マルチグリッド型ディープオペレータネットワークを用いたプレコンディショナーである。
NSPODは、クリロフをベースとした線形反復解法において収束に必要な反復数を劇的に減少させることができる。
非構造領域に適用した固体力学PDEの線形化バージョンに関する数値実験により,その効率を実証する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:21:12 GMT)
On the Impact of Crossover in Many-Objective Optimization: A Runtime Analysis of NSGA-III [5.5] 古典的な$m$-objective $m$-OneJumpZeroJump(略してm$-OJZJ)上で広く使われているNSGA-IIIアルゴリズムの理論的ランタイム解析を行う。
以上の結果から,クロスオーバーを用いたNSGA-IIIは,大域パラメータの目標値$m$に対してクロスオーバーすることなく,NSGA-IIIよりも高速に$m$-OJZJを最適化できることが示唆された。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:09:54 GMT)
Neuromorphic Monocular Depth Estimation with Uncertainty Modeling [5.5] イベントカメラは、従来のフレームベースのセンサーよりも明確な利点がある。
本稿では,ディープニューラルネットワークを用いて単眼イベントから画素ごとの深度を予測する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:55:35 GMT)
NaiAD: Initiate Data-Driven Research for LLM Advertising [5.4] LLMネイティブ広告の最初の包括的データセットであるNaiADを紹介する。
NaiADは、ユーザと商用のユーティリティを別々に、包括的にキャプチャする理論的に根拠付けられた評価指標を中心に構成されている。
本稿では,Variance-Calibrated Prediction-Powered Inference (VC-PPI) フレームワークによって調整されたスコアラベルについて述べる。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:11:38 GMT)
ChladniSonify: A Visual-Acoustic Mapping Method for Chladni Patterns in New Media Art Creation [5.4] ChladniSonifyは、Chladniパターンのリアルタイム視覚音響マッピング手法である。
数値計算によるペアデータセットを構築し,有限要素シミュレーションを用いて校正する。
我々はPythonとMax/MSPでエンドツーエンドシステムを構築し、認識されたパターンを対応する正弦波周波数にマッピングする。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:00:46 GMT)
Set-Based Groupwise Registration for Variable-Length, Variable-Contrast Cardiac MRI [5.3] グループワイズ登録は、動き補正のためのペアワイズ登録よりもロバスト性が高い。
emphAnyTwoRegは、定量MRIシーケンスを未順序集合として取ります。
ゼロショット方式で強力なクロスプロトコール一般化を実現する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:41:22 GMT)
Physical relevance of time-independent scattering predictions in periodic $\mathcal{PT}$-symmetric chains [5.3] 我々は、ゲイン/ロス強度$$$N$単位セルの$mathcalPT$対称鎖に対して、物理的関連性の領域を解析的に記述する。
これまでに報告されたゲインロスによる局所化、反射のない輸送、コヒーレントな完全吸収体およびレーザーの予測が、物理的に関係のある状態の外側にあることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:40:59 GMT)
A low order Bargmann invariant hierarchy for set coherence [5.3] 集合コヒーレンス(set coherence)は、基底非依存の量子コヒーレンスである。
四階順序感性バーグマン不変量(英語版)が集合コヒーレンスに対する最初の普遍的ペアワイズ基準を与えることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:28:15 GMT)
The Gordian Knot for VLMs: Diagrammatic Knot Reasoning as a Hard Benchmark [5.2] ノットベンチは1,951個の素結びのプロトタイプから858,318イメージのコーパスを合成する。
14のタスクは、等価判断、移動予測、識別、およびクロスモーダルグラウンドの4つのファミリーにまたがる。
両ベンダで64Kのアウトプット・トケンが一致した予算の下で、クロード・オプス4.7とGPT-5をそれぞれ検討し、評価した。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:44:30 GMT)
Autonomous FAIR Digital Objects: From Passive Assertions to Active Knowledge [5.1] Web上の科学知識のキュレーションは、中央集権化と制度的な連続性に依存するが、登録が近いと、データがオンラインのままであってもアクティブなスチュワードシップは停止する。
我々は、自律デジタルオブジェクト(aFDO)の概念を抽象的なアイデアから運用モデルへと前進させる。
AFDOは、セマンティックWeb標準に固定された3つの機能、すなわち、ポータブルな条件-アクションルールのためにPROV-O、SHACL、ODRLに整合したRDF-star上のポリシー層、そして、発表毎の評価コストを制限したActivityStreams 2.0上のアナウンス層、そして、3マルチを解決した合意層である。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:12:55 GMT)
Hardness Amplification for (Sparse) LPN [5.1] 雑音を学習するパリティ(mathsfLPN$)とそのスパース変種に対する新しい硬度増幅結果を示す。
で$mathsfLPN$を解くアルゴリズムは、"ほとんどすべてのインスタンス"で$mathsfLPN$を解くアルゴリズムに変換することができる。
同じ増幅アプローチを$mathsfLPN$ over $mathbbF_q$とSparse-$mathsfLPN$に拡張します。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:34:37 GMT)
Developing a foundation model for high-resolution remote sensing data of the Netherlands [5.1] オランダの1.2m高解像度衛星画像を用いた基礎モデルを構築した。
畳み込みニューラルネットワークとビジョントランスフォーマーを組み合わせることで、モデルは低周波と高周波の両方のランドスケープ特徴をキャプチャする。
モデルは時間にわたってより広いコンテキスト情報から学習し、そのモデルが時間的依存関係を活用できるようにする。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:35:20 GMT)
Beyond Similarity: Temporal Operator Attention for Time Series Analysis [5.1] 時系列予測における永続的なパラドックスは、構造的に単純で線形なモデルが高容量トランスフォーマーより優れていることである。
我々は、明示的に学習可能なシーケンス空間演算子で注意を喚起するフレームワークである、$textbf Operator Attention (TOA)$を提案する。
より高密度な$N倍の演算子を実現するために,トレーニングを安定させ,自明な記憶を防止できる高分散ドロップアウト機構を導入する。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:13:53 GMT)
Extracting Search Trees from LLM Reasoning Traces Reveals Myopic Planning [5.0] 大規模言語モデル(LLM)は、将来の結果に対する明確な議論を含む拡張チェーン・オブ・シント(CoT)推論を生成する。
本研究では,4対1のボードゲームにおいて,探索木を推論トレースから抽出し,定量化することにより,LSM計画の特徴付けを行う新しい手法を提案する。
LLMの探索は人間より浅く, 深度よりも幅の広い探索により予測できることがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:38:17 GMT)
Differentially Private Sampling from Distributions via Wasserstein Projection [5.0] We developed a novel framework for DP sample with Wasserstein distance as the utility measure。
本稿では、ワッサースタイン射影に基づく最小限の最適機構であるワッサースタイン射影機構(WPM)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:40:36 GMT)
Symmetry-Enforced Non-Hermitian Jarzynski Equality in an SU(2)-Rotated Family of Hybrid $\mathcal{PT}$--$\mathcal{APT}$ Systems [5.0] 条件付き非エルミート的ジャジンスキー等式は、遷移確率がパリティ交換対称性に従うときに成立することを示す。
この制限された2レベル設定の中で条件付き非エルミート的ジャージンスキー関係の対称性に基づく拡張を確立する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:16:06 GMT)
ERASE: Eliminating Redundant Visual Tokens via Adaptive Two-Stage Token Pruning [4.9] 画像の複雑度に適応したプルーニング戦略により、正常なトークンを識別し、保持する2段階の視覚トークンプルーニングフレームワークであるERASEを提案する。
実験の結果,ERASEは精度を保ちながら視覚トークンを著しく減少させることがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:50:05 GMT)
Safe Aerial 3D Path Planning for Autonomous UAVs using Magnetic Potential Fields [4.9] MaxConvNetは、ローカルのミニマを使わずにゴールへのパスを生成する潜在的フィールドプランナーである。
我々は、2D MaxConvNet磁場プランナを3Dに拡張し、畳み込みオートエンコーダを用いて障害物認識電位場を予測する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:28:26 GMT)
A Note on Banaszczyk's Inequality [4.9] Banaszczykの不等式は、$mathbbRn$の格子上の離散ガウス測度に対するテール推定を確立する。
透明な証明による不等式の改善は、Tian, Liu, Xuによって行われた。
我々は、適切な条件を課すことにより、この不等式をさらに改善し、より優れたバウンダリを得る。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:30:14 GMT)
VISD: Enhancing Video Reasoning via Structured Self-Distillation [4.9] 複雑な推論のためのビデオLLMの訓練は、レベルレベルの報酬の順序と、長期的、時間的基盤の推論軌道上のきめ細かいクレジット割り当ての欠如により、依然として困難である。
ビデオ推論のための診断に意味のある特権情報を導入した自己蒸留フレームワークであるVISDを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:55:14 GMT)
Forecast-aware Gaussian Splatting for Predictive 3D Representation in Language-Guided Pick-and-Place Manipulation [4.7] Forecast-aware Gaussian Splatting (Forecast-GS)は,言語条件のロボット操作のための予測3D表現フレームワークである。
我々は、Cutter-to-Box、Apple-to-Bowl、Spnge-to-Trayなどの実世界のピック・アンド・プレイス操作タスクでForecast-GSを検証する。
自動候補選択を行うForecast-GSは、3つのタスクでそれぞれ21/25,23/25,16/25の成功率を達成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:48:26 GMT)
When Are Trade-Off Functions Testable from Finite Samples? [4.7] 2つの未知確率分布のトレードオフ関数に対する有限サンプル推論について検討する。
テストの反転により、トレードオフ曲線全体に対する同時信頼バンドも得られる。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:07:48 GMT)
LiBaGS: Lightweight Boundary Gap Synthesis for Targeted Synthetic Data Selection [4.7] LiBaGSは、決定境界近傍、予測不確実性、実データ密度、サポート妥当性を組み合わせることで、候補となる合成サンプルをスコアする。
実験により、LiBaGSは古典的なオーバーサンプリング、ハード強化、不確実性、密度改善よりも精度を向上させることが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:46:35 GMT)
Leveraging Non-Equilibrium ECRAM Dynamics for Short-Term Plasticity in Neuromorphic Circuits [4.6] メムリシブ電気化学ランダムアクセスメモリ(ECRAM)デバイスは、過渡伝導率変調を生成する非平衡イオン力学を自然に示す。
本稿では,動作依存型コンダクタンス変調を利用した遅延フィードバック統合火災(LIF)ニューロンアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:01:44 GMT)
The Polynomial Counting Capabilities of Message Passing Neural Networks [4.6] 線形算術を超えたMPNNのカウント機能について検討する。
ノードラベル付きグラフのグローバルカウント制限は平均MPNNを用いてチェック可能であることを示す。
また,木状構造を持つグラフ上の平均MPNNにより,ネストモードの式をキャプチャする方法を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:38:11 GMT)
Arcane: An Assertion Reduction Framework through Semantic Clustering and MCTS-Guided Rule Exploring [4.6] 本稿では,冗長なアサーションによるシミュレーションオーバーヘッドを軽減するためのフレームワークを提案する。
これは2層アサーションクラスタリングアプローチを統合し、大きなアサーション集合の正確なセマンティック分類を行う。
これは、公式なカバレッジと突然変異検出能力を保ちながら、アサーション数において最大76.2%の減少を達成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:20:12 GMT)
Reasoning Is Not Free: Robust Adaptive Cost-Efficient Routing for LLM-as-a-Judge [4.5] Reasoning-capable large language model (LLM) は、最近自動判断器として採用されている。
本研究では,明示的推論により,構造化された検証を必要とするタスクの判断精度が大幅に向上することを示す。
本稿では、推論と非推論の判断を選択可能なロバスト適応コスト効率ルーティング(RACER)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:30:20 GMT)
Learning Less Is More: Premature Upper-Layer Attention Specialization Hurts Language Model Pretraining [4.5] 因果デコーダブロックは階層的であり、下位層は上位層が関与する残基を構築する。
我々は,GPT事前訓練における障害モードを同定する:上層は,下層機能を安定化させる前に,鋭い注意パターンにコミットする。
早期訓練中に上層Q/Kプロジェクションのみを一時的に遅くすると、他のパラメータを変更することなく最終的なパープレキシティと下流の精度が向上する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:01:12 GMT)
Security Analysis of Time-of-Arrival Estimation via Cross-Correlation under Narrow-Band Conditions [4.5] 我々は、相関に基づくToA推定を妥協するために、信号を再生成する2つの新しい攻撃を提示し、解析する。
第1の攻撃は時間領域においてシンボル周期波形によって信号を乗算し、第2の攻撃は負のグループ遅延フィルタを通過させる。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:21:37 GMT)
CoWorld-VLA: Thinking in a Multi-Expert World Model for Autonomous Driving [4.4] CoWorld-VLAは、自動運転のための多専門家の世界推論フレームワークである。
世界表現は行動計画を導くための明確な条件として機能する。
実験によると、CoWorld-VLAは将来のシーン生成と計画の両方で競争力を発揮する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:01:13 GMT)
One Operator for Many Densities: Amortized Approximation of Conditioning by Neural Operators [4.4] 確率的条件付け(probabilistic conditioning)は、確率変数$X$の確率変数$Y$の分布の同定に関するものである。
本稿では,任意の関節密度を条件にマッピングする単一演算子を同定し,条件付け問題を解くことを提案する。
我々の証明は、条件付き作用素の連続性を確立するための新しい結果に依存している。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:41:42 GMT)
DetRefiner: Model-Agnostic Detection Refinement with Feature Fusion Transformer [4.4] DetRefinerは,グローバルな特徴とローカルな特徴を融合してオープンな語彙検出を改良する,プラグイン・アンド・プレイのフレームワークである。
この結果から,グローバルおよびローカルな表現を融合する学習は,オープンワールドのオブジェクト検出を促進するための強力で汎用的なメカニズムを提供することがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:40:25 GMT)
Beyond Manual Curation: Augmenting Targeted Protein Degradation Databases via Agentic Literature Extraction Workflows [4.4] バイオメディシンの予測モデルは、一次出版物のテキスト、表、サプリメントにロックされた構造化されたアッセイデータに依存する。
このボトルネックは、特にターゲットタンパク質分解(TPD)において、各アッセイレコードは、複合アイデンティティ、分解ターゲット、リクルーザー、アッセイコンテキスト、セクション、テーブル、補足ファイル間で報告されるエンドポイント値を組み合わせる必要がある。
ドメイン固有のキュレーションタスクとしてPDデータベース抽出を定式化し、ループ内LPMワークフローを提案する。
我々は、TPDデータキュレーションとAI支援科学キュレーションのためのリソースとして、ワークフロー、プロンプト、評価コード、抽出データセットをより広範囲にリリースする。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:33:04 GMT)
On Scalable Pseudorandom Unitaries and the Unitary Synthesis Problem [4.4] ランダムオラクルモデル(ROM)における統計的に安全なPRUであるROM-PRUの概念を定式化する。
我々は、ROM-PRU、近似ユニタリ設計、ユニタリ群上のエプシロンネット、およびユニタリ合成問題の間の新しい接続性を証明する。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:07:50 GMT)
Think as Needed: Geometry-Driven Adaptive Perception for Autonomous Driving [4.3] 現在の3D検出モデルは、すべてのフレームに固定された計算予算を適用し、単純なシーンでリソースを浪費すると同時に、複雑なシーンのキャパシティを欠いている。
本稿では,各LiDARフレームの幾何学的複雑さを測定する適応型知覚アーキテクチャである拡張HOPEを提案する。
nuScenesとCARLAのベンチマークでは、強化HOPEは、正確さを損なわずに単純なシーンでのレイテンシを38%削減し、稀なロングテールシナリオでは平均平均精度を2.7ポイント改善している。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:34:13 GMT)
Physical probes expose and alleviate chemical-environment collapse in molecular representations [4.3] CLAIM(Contrastive Learning for Atom-to-molecule Inference of Molecular NMR)は、効率的な分子入力を原子分解NMR観測器と整合させるフレームワークである。
CLAIMは失われた化学分解能を回復し、原子レベルの分子スペクトルの検索を著しく改善する。
これらの結果は, 化学的環境崩壊を緩和するための有効な戦略として, 物理的に接地したスペクトルアライメントを確立する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:03:51 GMT)
GRAFT-ATHENA: Self-Improving Agentic Teams for Autonomous Discovery and Evolutionary Numerical Algorithms [4.2] 自己改善型エージェントフレームワークであるGRAFT-ATHENAが過去の問題から自律的に学習していることを示す。
このフレームワークはさまざまなドメインにまたがって独自のアクション空間を拡張している。
1968年の報告書から、アポロ計画モジュール上のマッハ-10フローのような複雑な工学的な問題に取り組む。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:27:01 GMT)
Muninn: Your Trajectory Diffusion Model But Faster [4.2] 拡散に基づく軌道プランナーは、リッチでマルチモーダルなロボットの動きを合成できるが、反復的なデノベーションは、オンラインの計画と制御を違法に遅くする。
本研究では,モデルの再学習や軌道品質の犠牲を伴わずに,ロボットのリアルタイム使用に十分な速度で拡散型軌道プランナを構築するという課題に対処する。
Muninnは、タスクのパフォーマンスと安全性の指標を保ちながら、デノイザの評価を減らし、複数の軌道拡散モデルで最大4.6倍のウォールタイムのスピードアップを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:21:52 GMT)
When Prompts Become Payloads: A Framework for Mitigating SQL Injection Attacks in Large Language Model-Driven Applications [4.2] 大規模言語モデル(LLM)では、ユーザがsqlのような形式的なクエリ言語ではなく、会話型入力を使ってデータをクエリすることができる。
悪意のあるユーザは、モデル動作を操作し、安全でないクエリを生成する敵のプロンプトを作成することで、これらのメカニズムを利用することができる。
LLMを介在するsqlインジェクション攻撃を検知・緩和する多層セキュリティフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:28:45 GMT)
HAGE: Harnessing Agentic Memory via RL-Driven Weighted Graph Evolution [4.2] HAGEはエージェント型大規模言語モデル(LLM)システムのための重み付きマルチリレーショナルメモリフレームワークである。
クエリが与えられた場合、LLMベースの分類器はリレーショナルインテントを識別し、ルーティングネットワークはエッジ埋め込みの対応する次元を動的に変調する。
トラバーサルスコアは、意味的類似性とこれらのクエリ条件付きエッジ表現の学習された組み合わせによって計算される。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:41:18 GMT)
Towards LLM-Based Analysis of Virtualization-Obfuscated Code through Automated Data Generation [4.2] 難解なバイナリは、最大のセマンティックコヒーレントユニットに分解される。
我々は,ラベリングの自動化と大規模データセット生成を実現するための静的解析フレームワークを実装した。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:15:20 GMT)
Can LLMs Solve Science or Just Write Code? Evaluating Quantum Solver Generation [4.1] 大規模言語モデル(LLM)は、コード生成において強力な能力を示し、自動量子ソルバ開発での利用を動機付けている。
本研究は,LLMの科学的問題に対する解法生成能力を評価するための反復的手法であるQ-SAGEを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:11:44 GMT)
MTA-RL: Robust Urban Driving via Multi-modal Transformer-based 3D Affordances and Reinforcement Learning [4.1] マルチモーダルトランスフォーマーを用いた3次元モデリングと強化学習(RL)
本稿では,マルチモーダルトランスフォーマーを用いた3D Affordances and Reinforcement Learning(RL)による知覚と制御をブリッジする最初のフレームワークであるMTA-RLを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:28:55 GMT)
Accurate Trajectory Tracking with MPCC for Flapping-Wing MAVs [4.1] 羽ばたきの小型航空機はロータリーウィングのドローンよりも静かで安全な操作を提供する。
従来のカスケードコントローラーは、高度、速度、方向を独立して扱い、永続的な追跡エラーを発生させる。
本稿では,鳥型オルニトプターの圧倒的な結合を捉える,コンパクトで連続的な微分可能なモデルを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:03:34 GMT)
From Controlled to the Wild: Evaluation of Pentesting Agents for the Real-World [4.1] 本稿では,タスク完了から検証済みの脆弱性発見へ評価をシフトする実用的評価プロトコルを提案する。
このプロトコルは、AIペンテスティングエージェントのより現実的で運用上の情報的な比較を可能にすることによって、最先端の技術を拡張している。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:50:00 GMT)
The Quantum Hamiltonian Analysis Toolkit: Lowering the Barrier to Quantum Computing with Hamiltonians [4.1] QHATは、強力で機能豊富なアプリケーションを通じて、ハミルトニアンの生成と分析を可能にする。
複数の情報源からハミルトニアンをサポートするが、システムの簡単な記述に基づいてハミルトニアンを生成することもできる。
ユーザフレンドリーなインターフェースと効率的な分析に重点を置くことは、参入障壁が低いことを意味する。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:10:07 GMT)
Increasing the Efficiency of DETR for Maritime High-Resolution Images [4.0] 海上物体検出は無人表面容器(USV)の安全な航行に不可欠である
リアルタイム検出は、長距離、小さなオブジェクトサイズ、大規模なバリエーション、エッジコンピューティングの制限、高解像度画像の高メモリ要求のために困難である。
Vision Mamba (ViM) のバックボーンを利用して、シーケンス長を線形にスケーリングしながら、長距離依存関係をキャプチャする。
本手法は,海洋オブジェクト検出における性能と計算効率のバランスを向上する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:31:12 GMT)
Spatial overhead reduction for 2D hypergraph product codes [4.0] ハイパーグラフ製品コードにおける物理量子ビット数を削減する方法について検討する。
この削減により、符号次元、正準論理基底、最小距離が保存されることを示す。
回路レベルの非偏極雑音によるメモリシミュレーションでは、縮小符号は非還元バージョンと同様のサブスレッショルド性能を持つ。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:11:40 GMT)
Controllability in preference-conditioned multi-objective reinforcement learning [4.0] 多目的強化学習(MORL)により、ユーザは目的の相対的重要性の観点から結果よりも好みを表現できる。
標準メトリクスは、好みの変化がエージェントの振る舞いを意図した方法で確実に変化させるかどうかを把握できない。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:58:49 GMT)
SplitFed-CL: A Split Federated Co-Learning Framework for Medical Image Segmentation with Inaccurate Labels [4.0] Split Federated Learning (SplitFed)は、フェデレーションとスプリットラーニングを組み合わせて、クライアント側の計算を減らしながらプライバシを保存する。
本研究では,グローバルな教師が現地の生徒に信頼できないアノテーションを検出・洗練するよう指導する,協調学習フレームワークSplitFed-CLを提案する。
実世界のアノテーションエラーを含むバイナリセグメンテーションデータセットとともに、制御された合成ノイズを持つ2つのマルチクラスセグメンテーションデータセットの実験は、SplitFed-CLが一貫して7つの最先端ベースラインを上回っていることを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:18:45 GMT)
Natural Policy Gradient as Doubly Smoothed Policy Iteration: A Bellman-Operator Framework [4.0] 自然政策勾配は、スムーズで平均化された政策反復形式として正確な定式化が認められることを示す。
本稿では,従来のQ$-関数の重み付き平均値に正規化グリーディステップを適用することで,各ポリシが得られたベルマン演算フレームワークである2つのスムーズなポリシー反復(DSPI)を紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:53:03 GMT)
On Problems of Implicit Context Compression for Software Engineering Agents [3.9] LLMベースのソフトウェアエンジニアリングエージェントは重要なボトルネックに直面している。
有望な解決策の1つは、コンテキストを離散トークンではなく連続的な埋め込みとしてエンコードし、より密集した情報ストレージを可能にすることである。
この目的のために最近提案された In-Context Autoencoder を適用した。
本手法は単発共通認識タスクやコード理解タスクではうまく機能するが,本実験では多段階のエージェントコーディングタスクではフェールすることを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:47:07 GMT)
GridProbe: Posterior-Probing for Adaptive Test-Time Compute in Long-Video VLMs [3.9] GridProbeは、効率的なトレーニング不要な後処理推論パラダイムである。
解答空間における証拠は、凍結したVLM自身の推論を用いて得られる。
疑似関連フレームを適応的に選択し、精度の損失が少なくて、準四分法的な注意コストをもたらす。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:57:46 GMT)
CORE: Cyclic Orthotope Relation Embedding for Knowledge Graph Completion [3.9] COREはトーラス多様体上の巡回直交として関係を表現し、領域は空間境界をシームレスに包むことができる。
COREは高い競争性能を達成し、密接なセマンティック環境におけるリンク予測精度を大幅に改善する。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:07:14 GMT)
Shields to Guarantee Probabilistic Safety in MDPs [3.8] 本稿では,古典的シールドを確率論的安全性に保守的に拡張する形式的枠組みを提案する。
本枠組みでは,安全性と許容性に関する強い保証を維持することの不可能性を実証し,(ii)より弱い保証を備えた自然シールドを提供し,(iii)強力な安全保証を確保するためのオフラインおよびオンラインシールド構築を導入する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:33:01 GMT)
Afrispeech Semantics: Evaluating Audio Semantic Reasoning in Spoken Language Models Across Domains and Accents [3.7] 音声言語モデル(ALM)は、音声に基づく理解にますます使われる。
アクセント変化, ドメインシフト, セマンティックオーバー推論が音声推論に与える影響はよく分かっていない。
5つの意味的・パラ言語的推論タスクにおける音声言語モデルの評価を行った。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:27:40 GMT)
CADBench: A Multimodal Benchmark for AI-Assisted CAD Program Generation [3.6] CADBenchはマルチモーダルCADプログラム生成のための統一ベンチマークである。
CADBenchは6つのベンチマークファミリーにまたがる18,000の評価サンプルを含んでいる。
CADに特化して汎用的な視覚言語システム11のベンチマークを行い,14万以上のCADプログラムを生成した。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:25:47 GMT)
ReTAMamba: Reliability-Aware Temporal Aggregation with Mamba for Irregular Clinical Time Series Prediction [3.6] 臨床時系列データは、不規則なサンプリング、頻繁な欠落値、不均一な観察パターンを示すため、モデル化が困難である。
既存のアプローチでは、観測マスクとタイムギャップ情報を用いることが多いが、過去の観測の信頼性の低下を継続的に捉えているわけではない。
我々は,臨床時系列を時間可変トークンシーケンスとして再構成したMambaを用いた信頼性を考慮したテンポラルアグリゲーションを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:39:33 GMT)
Geospatial-Temporal Sensemaking of Remote Sensing Activity Detections with Multimodal Large Language Model [3.6] IARPA SMART重構築データセットから得られた視覚的質問応答データセットSMARTHC-VQAを紹介する。
データセットは、構築型ラベル、時間相ラベル、地理的メタデータ、観察関係を自然言語の質問応答三つ子に変換する。
LVA-NeXT Mistral-7Bに基づくマルチイメージMLLMトレーニングフレームワークについて述べる。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:42:09 GMT)
Comparing Qubit and Qudit Encodings for EV Charging and Trip Assignment Problems [3.6] 本研究では,符号化の選択が,変分量子最適化アルゴリズムの資源要求と最適化挙動に与える影響について検討する。
従来の二進法(qubit)トリップエンコーディングと、代入をより直接的に表現する整数(qudit)エンコーディングを比較した。
顧客旅行のquditエンコーディングは、リソース要求を大幅に削減し、シミュレーションランタイムを短くすることで、類似またはより良い最適化性能を実現する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:23:29 GMT)
Yield Curve Forecasting using Machine Learning and Econometrics: A Comparative Analysis [3.6] 本稿では,47年以上にわたる日次データを用いて,計量・時系列分析,古典的機械学習,深層学習などにおける米国財務収率曲線データの予測性能を比較した。
本研究では、収率曲線予測、特に深層学習アルゴリズムで試験されていない様々な手法について検討する。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:53:26 GMT)
TourMart: A Parametric Audit Instrument for Commission Steering in LLM Travel Agents [3.5] TourMartは、コミッショナーガバナンスのためのインテリジェントシステム監査機器である。
6ゲート生産監査は、LCM開示障害(即時崩壊、拒否、内部IDリーク)を真の商用ステアリングから分離する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:11:30 GMT)
Generative AI Fuels Solo Entrepreneurship, but Teams Still Lead at the Top [3.5] ChatGPT-3.5の公開以降,起業家の参入は急速に増加した。
このソロへのシフトは、歴史的にチームベースのベンチャーを好んだカテゴリーで特に顕著である。
チームベースのベンチャーは、プラットフォームランキングのトップ層でますます支配的になっている。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:53:44 GMT)
Dynamical Criticality Behind Energy-Storage Singularities in Quantum Batteries [3.5] 量子電池のエネルギー貯蔵特異点はしばしば平衡量子臨界度と関連付けられている。
クエンチ駆動型多体電池では、運動量空間における動的臨界からそのような特異点が生じることが示されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:25:46 GMT)
Fixed-Point Neural Optimal Transport without Implicit Differentiation [3.4] 本稿では, 最適輸送の暗黙的ニューラル定式化を提案し, 対向的な min-max 最適化とマルチネットワークアーキテクチャを排除した。
我々のキーとなる考え方は、カントロビッチ双対の単一ポテンシャルをパラメータ化し、関連するc-変換を近位不動点問題として再構成することである。
これにより安定な単一ネットワークの枠組みが得られ、双対実現性は近似最適条件によって正確に強制される。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:22:06 GMT)
FedSurrogate: Backdoor Defense in Federated Learning via Layer Criticality and Surrogate Replacement [3.4] フェデレートラーニングは、バックドア攻撃の影響を受けやすい。
既存の防衛は、現実的な非独立かつ同一に分散された(非IID)データの下で、実質的な偽陽性率に悩まされている。
本稿では,2方向勾配フィルタと層適応型異常検出を組み合わせることで,この制限に対処する新しいバックドアディフェンスであるFedSurrogateを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:30:32 GMT)
M2Retinexformer: Multi-Modal Retinexformer for Low-Light Image Enhancement [3.4] M2Retinexformer(Multi-Modal Retinexformer)はRetinexformerを拡張する新しいフレームワークである。
モーダリティは複数のスケールで抽出され、相互注意を通して融合され、適応的なゲーティングは照明誘導による自己注意と相互注意のバランスを動的に調整する。
LOL、SID、SMID、SDSDベンチマークの評価は、Retinexformerと最近の最先端手法に対する全体的な改善を示している。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:13:13 GMT)
Towards a Large Language-Vision Question Answering Model for MSTAR Automatic Target Recognition [3.3] 大規模言語ビジョンモデル(LLVM)は、テキストや画像を分析する強力なツールとして注目されている。
近年の変圧器を用いたLLVM研究は地理空間認識タスクの大幅な改善を示している。
本研究では,LLVMのリモートセンシング画像キャプションと視覚質問応答への応用について検討した。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:05:58 GMT)
Read, Extract, Classify: A Tool for Smarter Requirements Engineering [3.3] ReXCLツールは、要求工学における抽出と分類プロセスを自動化する。
このツールは2つの主要なモジュール、抽出と分類を備えている。
性能評価は、ReXCLが要求管理の効率と正確性を大幅に改善することを示している。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:52:27 GMT)
Context-Aware Spear Phishing: Generative AI-Enabled Attacks Against Individuals via Public Social Media Data [3.3] ソーシャルメディアデータと生成AI(GenAI)が、高度にパーソナライズされたコンテキスト対応のスピアフィッシングキャンペーンを自動化し、スケールするために、どのように悪用されるかを示す。
マルチモーダル信号抽出、通信スタイルのプロファイリング、攻撃型インスタンス化を7つの戦略で組み合わせたモジュラーフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:46:52 GMT)
Constraint-Data-Value-Maximization: Utilizing Data Attribution for Effective Data Pruning in Low-Data Environments [3.2] 一般的なベンチマークは、低値または高値のデータインスタンスを削除するデータ削除である。
制約値-値-値-最大化(CDVM)アプローチを導入し、低データシナリオにおけるプルーニングにデータ属性を効果的に活用する。
OpenDataValベンチマークでは、CDVMは強力なパフォーマンスと競争力のあるランタイムを示している。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:00:02 GMT)
PixelFlowCast: Latent-Free Precipitation Nowcasting via Pixel Mean Flows [3.2] 本稿では,2段階の確率予測フレームワークであるPixelFlowCastを提案する。
公開されているSEVIRデータセットの実験では、PixelFlowCastは予測精度と推論効率の両方で、既存の主流メソッドよりも優れています。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:16:02 GMT)
Parity Supervision as a Driver of Generalization in Quantum Generative Modeling [3.2] 有限標本から未知の有効状態への一般化は離散生成モデリングの中心である。
我々は、パリティ監視で訓練されたIQP回路Bornと座標平均二乗誤差(MSE)で訓練された同じ回路の比較を行う。
パリティの監督は、KL(Kullback-Leibler)の適合性を正確に改善し、IQP-MSE上での高値回復を未確認にするが、最大エントロピー制御は完全な効果を再現しない。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:24:12 GMT)
Per-Loss Adapters for Gradient Conflict in Physics-Informed Neural Networks [3.2] PINN勾配競合は1つの普遍的治療を伴う一様障害モードではないことを示す。
異なる介入クラスに関連付けられた個別のPINN勾配コンフリクトレギュレーションを同定した。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:46:07 GMT)
Decomposing Evolutionary Mixture-of-LoRA Architectures: The Routing Lever, the Lifecycle Penalty, and a Substrate-Conditional Boundary [3.2] 我々は、LoRAシステムの進化的混合を、ルータの書き換え、ドメイン単位の離脱評価スコープ、死のライフサイクル、アルファブレンド継承、SVD突然変異、スロット再配置の3つの要因に分解する。
合成サンドボックスは、制御チャネル上の進化的探索は、タスクに予め整列している場合にのみ負荷を受ける。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:59:11 GMT)
Agent-X: Full Pipeline Acceleration of On-device AI Agents [3.1] LLMベースのエージェントは、タスク間で最先端のパフォーマンスを提供するが、エッジデバイス上では高いエンドツーエンドレイテンシを発生させる。
我々は、デバイス上のエージェントワークロードのプリフィルとデコードの両方を高速化する、ソフトウェアのみの精度保存フレームワークであるAgent-Xを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:23:38 GMT)
Foundations of Reliable Inference: Reliability-Efficiency Co-Design [3.1] 計算オーバーヘッドに関する懸念は、設計基準を信頼性のみから信頼性と効率の共設計へとシフトさせた。
この論文は、2つの視点から統合されたフレームワークを開発し、中心的な問題に対処する。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:53:16 GMT)
Continuous Latent Contexts Enable Efficient Online Learning in Transformers [3.1] 本研究では,オンライン学習をより効果的に実現するために,連続潜在コンテキストトークンがトランスフォーマーに適合するかどうかを検討する。
我々は,マルチカリキュラムの目的を用いて,潜時文脈を持つ小型GPT-2型変圧器を訓練する。
この結果から,連続潜伏文脈は,オンライン学習アルゴリズムを実装する上で,変圧器の簡易かつ効果的な持続状態となることが示唆された。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:51:05 GMT)
Toward an Engineering of Science: Rebalancing Generation and Verification in the Age of AI [3.0] AIシステムは、論文、レビュー、サーベイなどの有望な科学的アーティファクトを安価に生成できるようになった。
このことは、我々の科学的システムにおいて、不信だがもっともらしい人工物が、システムがフィルターを外すよりも早く蓄積されるという、仮死性汚染のリスクを生み出します。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:00:13 GMT)
Budget-Efficient Automatic Algorithm Design via Code Graph [3.0] 大規模言語モデル(LLM)は自動アルゴリズム設計(AAD)のための強力なツールとして登場した。
我々は予算効率のよい自動アルゴリズム設計を定式化し、検索ポリシーは計算コストに制限のある実現された適合性を最大化する。
提案手法を3つの最適化問題に対して実証的に検証し,同じトークン予算で全アルゴリズム探索よりもグラフ検索の方が一貫した優位性を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:01:52 GMT)
Teacher-Aware Evolution of Heuristic Programs from Learned Optimization Policies [3.0] 本研究では,独立に訓練された最適化ポリシーを行動教師として活用するemph-Teacher-aware進化的フレームワークを提案する。
提案手法は,教師を配置・模倣する代わりに,候補プログラムが訪れた状態を検索し,その行動選好を進化のための局所的なフィードバックとして利用する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:22:29 GMT)
Grounded Satirical Generation with RAG [3.0] 我々は、文脈によって強く形作られたユーモアの形式である風刺に焦点を当てている。
本稿では,現在のニュースを検索・拡張・生成(RAG)として利用する,接地型風刺生成のための新しいパイプラインを提案する。
以上の結果から, 生成した定義はユーモアよりも政治的であると考えられた。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:00:51 GMT)
A cell-decomposition based path planner for 3D navigation in constrained workspaces [2.9] 本稿では,バイナリ占有格子のセル分解アルゴリズムを提案する。
各細胞から少なくとも1つの隣接細胞への相互に完全な可視性を確保する。
提案手法では,2次コーンプログラム (SOCP) と混合整数変種 (MISOCP) の両方を定式化する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:06:53 GMT)
Combining Mechanical and Agentic Specification Inference for Move [2.9] 本稿では,Move Proverの仕様推論ツールについて述べる。
これは、Moveバイトコードに対する最も弱い条件分析とClaude CodeのようなエージェントコーディングCLIを組み合わせる。
このツールは標準的なMoveコードのコーパスに適用されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:30:25 GMT)
Composing diffusion priors with explicit physical context via generative Gibbs sampling [2.9] 物理知識サンプリングのためのジェネレーティブギブ(GG-PA)について紹介する。
GG-PAは、学習された部分的先行と明示的な物理的文脈の合成を、拡張状態空間における関節目標分布に対する推論として定式化する。
実験により、GG-PAは、部分的に事前学習することなく相互作用するシステムにおいて、文脈依存性の分布変化と創発的な集団的挙動を回復することが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:29:20 GMT)
Auditing Multimodal LLM Raters: Central Tendency Bias in Clinical Ordinal Scoring [2.8] マルチモーダル大言語モデル (LLM) は, 臨床環境において, 自動評価器として研究されている。
ロック描画テスト(CDT)画像の評価のための教師付きディープラーニングモデルに対して、3つのフロンティアLLMファミリーをベンチマークした。
NLP評価から臨床評価まで, LLM-as-a-judge バイアスの文献を拡張した。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:37:24 GMT)
Supercharging Bayesian Inference with Reliable AI-Informed Priors [2.8] そこで本稿では, 先行情報に使用する前に, 合成データを生成するAI誘発法則を正すAIインフォームド・プレエンシテーションの枠組みを提案する。
我々の修正されたAIプリエントは、標準的なアプローチに比べてバイアスを大幅に減らし、信頼できるインターバルのカバレッジを改善し、AIによる事前情報をより信頼性を高める。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:21:34 GMT)
Neural at ArchEHR-QA 2026: One Method Fits All: Unified Prompt Optimization for Clinical QA over EHRs [2.8] 本稿では,CL4Health@LREC 2026におけるArchEHR-QA 2026共有タスクについて述べる。
DSPy の MIPROv21.5 を用いて,タスクを独立したモジュールステージに分離し,ハイパフォーマンスなプロンプトを自動的に検出する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:27:30 GMT)
Step Rejection Fine-Tuning: A Practical Distillation Recipe [2.8] RFT(Rejection Fine-Tuning)は、LDMエージェントを訓練するための標準的な方法である。
本稿では,未解決軌道を利用するための実用的な方法として,ステップリジェクションファインチューニング(SRFT)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:55:20 GMT)
Variational predictive resampling [2.8] 変分予測再サンプリングは, ベイズ後部をよりよく近似するために, VI の予測強度を利用することを示す。
線形回帰、ロジスティック回帰、階層混合効果モデルの実験により、VPRは後方不確かさの定量化を著しく改善し、MF-VIで欠落した後方依存を回復することを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:26:54 GMT)
EnergyLens: Interpretable Closed-Form Energy Models for Multimodal LLM Inference Serving [2.7] 既存のアプローチでは、レイテンシをエネルギプロキシとして扱うか、データ不足のブラックボックスサロゲートに依存している。
本稿では,データに対する構造発見ツールとして,シンボル回帰を用いたEnergyLensを提案する。
ブラックボックスサロゲートとは異なり、EnergyLensはテンソルとパイプライン並列性を分離し、デコードエネルギーからプリフィルを分離する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:31:50 GMT)
TopoU-Net: a U-Net architecture for topological domains [2.7] TopoU-Netは、トポロジカルドメインのためのランクパスU-Netである。
ノード、エッジ、顔、ハイパーエッジ、あるいはグローバルセルを経由するパスを選択することが、中心的なアーキテクチャ上の決定である。
TopoU-Netは高次構造化データのための再利用可能なエンコーダデコーダテンプレートを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:09:39 GMT)
An LLM-RAG Approach for Healthy Eating Index-Informed Personalized Food Recommendations [2.7] 食事の質は慢性疾患のリスクの主要な要因である。
標準化された栄養データベースと大規模言語モデルを組み合わせた,個人化された食品レコメンデーションのためのフレームワークを提案する。
提案するLLM-RAGベースのAIシステムは,より正確で説明可能な,個人化された栄養指導を支援することが示唆された。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:40:17 GMT)
Multifidelity Gaussian process regression for solving nonlinear partial differential equations [2.7] マルチ忠実度シミュレーションから経験的情報を活用するコクリギングに基づくカーネル学習手法を提案する。
本稿では,バーガーズ方程式上での物理インフォームド法の性能を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:24:16 GMT)
Higher Resolution, Better Generalization: Unlocking Visual Scaling in Deep Reinforcement Learning [2.7] 観察分解能は政策学習にとって重要ではあるが見過ごされがちな変数であることを示す。
我々は、広く使われているImpalaエンコーダをグローバル平均プールに置き換える。
ビジュアルスケーリングにより、ImpoolaはImpalaよりも28パーセントパフォーマンスが向上する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:23:58 GMT)
Hydra-DP3: Frequency-Aware Right-Sizing of 3D Diffusion Policies for Visuomotor Control [2.7] 拡散に基づくビジュモータポリシーは、ロボット操作においてよく機能する。
現在の手法は画像生成スタイルのデコーダとマルチステップサンプリングを継承している。
軽量拡散ミキサーデコーダを用いたポケットスケール3次元拡散方式Hydra-DP3(HDP3)を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:29:58 GMT)
Formal Verification of Imperative First-Class Functions in Move [2.6] Move Prover (MVP) は、Moveプログラミング言語で記述されたスマートコントラクトの形式検証である。
本稿では,Move仕様言語における関数値の表現とそのMVPにおける実装について述べる。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:31:55 GMT)
CATS: Cascaded Adaptive Tree Speculation for Memory-Limited LLM Inference Acceleration [2.6] 大規模言語モデル(LLM)における自動回帰デコーディングは本質的にメモリバウンドである。
メモリ制限デバイス上でのケースド検証と修正を行う,自己記述型デコーディングフレームワークであるCATSを提案する。
CATSは、生成品質を劣化させることなく最大5.08倍のウォールクロックスピードアップを達成でき、エッジメモリの制約下では最大1.45倍のSOTA法より優れている。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:50:08 GMT)
An Uncertainty-Aware Resilience Micro-Agent for Causal Observability in the Computing Continuum [2.6] 本稿では, 因果オブザーバビリティ(AURORA)のための不確実性認識型レジリエンスマイクロエージェントを提案する。
AURORAは、各断層のマルコフ毛布内の根因解析をサポートするために、自由エネルギー原理、因果線計算、局所化された因果線状態グラフを統合する並列マイクロエージェントを使用している。
実験の結果,AURORAは62.0%の修理精度と3msの平均修理時間を維持しながら,破壊作用率0%を達成し,ベースラインよりも優れていた。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:28:37 GMT)
StereoTales: A Multilingual Framework for Open-Ended Stereotype Discovery in LLMs [2.6] StereoTalesは、オープンエンドLLM生成における社会的バイアスの出現を研究するための多言語データセットと評価パイプラインである。
このデータセットは10の言語と79の社会デコグラフィー属性を含み、23の最近のLCMによって生成された650万以上のストーリーで構成されている。
これらの結果から,1500以上の過剰発現関連因子の同定に統計検査を適用し,ヒトのパネルと同一のLDMを用いて有害性を評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:12:28 GMT)
On Improving Graph Neural Networks for QSAR by Pre-training on Extended-Connectivity Fingerprints [2.6] 本稿では,QSARのGNNを事前学習して拡張接続フィンガープリントを予測するための一般的な戦略について報告する。
ECFP事前学習GNNを用いた場合, 評価ベースライン全体の標準性能指標の統計的に有意な改善が見られた。
よりヘテロジニアスなデータセットと、バインディング親和性予測のようなより複雑なエンドポイントでは、OOD設定では未処理のトレーニング済みのGNNが実行されます。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:30:52 GMT)
GenioSim: A Novel Simulation Platform for Edge Computing over Optical Networks [2.5] オプティカル・ライン・ターミナル(OLT)とオプティカル・ネットワーク・ターミナル(ONT)は、オフロードワークロードのための低遅延エッジ計算ノードとして再利用することができる。
我々は階層的なPON対応エッジインフラストラクチャのためのシミュレーションプラットフォームであるGenioSimを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:39:20 GMT)
The Observable Wasserstein Distance [2.5] ポーランド計量空間上の確率測度間のワッサーシュタイン距離の下界を導出する枠組みである観測可能なワッサーシュタイン距離を導入する。
提案手法は1-Lipschitzオブザーバブルを用いて実分布線を測り、その結果のプッシュフォワード間のワッサーシュタイン距離を計算する。
この階層は、ワッサーシュタイン距離と計算効率の低い境界としてシャープネスの間の調整可能なトレードオフを提供することを示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:10:33 GMT)
Equivariant Reinforcement Learning for Clifford Quantum Circuit Synthesis [2.5] 我々は、全量子ビット接続を持つデバイスに対するクリフォード量子回路の問題点を考察する。
シンプレクティック行列表現のqubit relabelingと等価な新しいニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:49:28 GMT)
Embodied AI in Action: Insights from SAE World Congress 2026 on Safety, Trust, Robotics, and Real-World Deployment [2.4] このホワイトペーパーは、SAE World Congress 2026のパネルセッション、textitEmbodied AI in Actionから重要な洞察を要約する。
この議論は、エンジニアリングの厳格さ、ライフサイクルのガバナンス、人間中心の設計を必要とするシステム課題として、具体的AIを扱う必要性を強調した。
この論文は、エグゼクティブ、政策立案者、そして実践的な視点を、インボディードAIの採用を責任を持って求めている技術リーダーに提供します。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:37:37 GMT)
Nautilus Compass: Black-box Persona Drift Detection for Production LLM Agents [2.4] ナチラス・コンパス(Nautilus Compass)は、ブラックボックスドリフト検出器と、生産用コーディングエージェントのためのエージェントメモリ層である。
このシステムは、Claude Codeプラグイン、CP 20245 A2Aサーバ、CLI、APIを1つのデーモンで提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:49:17 GMT)
HEBATRON: A Hebrew-Specialized Open-Weight Mixture-of-Experts Language Model [2.4] Hebatron(ヘバトロン)は、NVIDIA Nemotron-3 sparse Mixture-of-Expertsアーキテクチャをベースに開発されたヘブライ語仕様のオープンウェイトな大規模言語モデルである。
トレーニングには、連続的なアンチフォッゲッティングアンカーを備えた3段階の簡単なカリキュラムが採用されている。
ヘバトロンはヘブライ語の推論平均73.8%を達成し、DictaLM-3.0-24B-Thinkingを上回っている。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:27:53 GMT)
Deterministic vs. LLM-Controlled Orchestration for COBOL-to-Python Modernization [2.4] レガシーシステムの近代化は、専門知識の不足、大規模かつ長期化、厳格な正当性要件のため、依然として困難である。
近年の大規模言語モデル(LLM)に基づく近代化システムは,多段階ツールの実行を制御するエージェント的正当性にますます依存している。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:34:27 GMT)
Evaluating Structured Documentation as a Tool for Reflexivity in Dataset Development [2.4] 我々は、主要な反射性トピックのコードブックを提示し、アクション可能な戦略を推奨し、これらのトピックをより効率的に構造化されたドキュメントフレームワークやFAccT文献に組み込むための拡張された質問セットを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:55:05 GMT)
Affine Tracing: A New Paradigm for Probabilistic Linear Solvers [2.4] ベイジアンPSSは非定常アフィンPIMの特殊な症例である。
本稿では,アフィン反復法の標準実装からPIMを自動的に構築するアルゴリズムフレームワークであるアフィントレースを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:36:53 GMT)
Meta-Black-Box Optimization Can Do Search Guidance for Expensive Constrained Multi-Objective Optimization [2.3] 本稿では,制約付き多目的最適化問題に対する2レベルMetaBBOフレームワークを提案する。
低レベルサロゲート支援進化アルゴリズム(SAEA)の探索ガイダンスを提供するメタ政治
MetaSG-SAEAは様々なベンチマークで最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:25:35 GMT)
gwBenchmarks: Stress-Testing LLM Agents on High-Precision Gravitational Wave Astronomy [2.3] 現代の重力波天文学は、しばしば何ヶ月もの大学院レベルの努力を必要とするモデリングタスクに依存している。
我々は、最先端のLCM符号化エージェントが、このようなエンドツーエンドの科学的モデリングを行うことができるかどうかを考察する。
重力波解析計算と数値シミュレーションに基礎を置く8つのタスクの組であるgwBenchmarksを紹介した。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:47:22 GMT)
Predicting 3D structure by latent posterior sampling [2.3] 本研究では,NeRFに基づく3次元シーンの表現と,拡散モデルを用いた確率的モデリングと推論を組み合わせた手法を提案する。
提案手法は,各タスクに係わる様々な不確実性のレベルをモデル化できることを示す。
実験により, 様々な種類の観測から3次元構造を正確に予測できる包括的手法が得られた。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:47:25 GMT)
Rethinking LLMOps for Fraud and AML: Building a Compliance-Grade LLM Serving Stack [2.3] 不正かつアンチマネーロンダリング(AML)コンプライアンスは、大言語モデル(LLM)の高価値ドメインである
コンプライアンスプロンプトはプレフィックス重、スキーマ制約、エビデンスリッチであることが多い。
これらのプロパティはプレフィックスの再利用、KVキャッシュの効率、ランタイムチューニング、モデルオーケストレーション、出力バリデーションの1次システムの関心事を可能にする。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:47:41 GMT)
The finite expression method for turbulent dynamics with high-order moment recovery [2.2] 乱流力学系は、非線形相互作用と結合統計量を生成する効果によって特徴づけられる。
本稿では,シンボル回帰と生成モデルを組み合わせた2段階のデータ駆動モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:00:38 GMT)
Network-Efficient World Model Token Streaming [2.2] 本研究では,各288x512フレームを18x32のトークンIDにマッピングする離散世界モデルのネットワーク効率なストリーミングについて検討する。
我々は,コードブック埋め込み空間において,コサイン距離によるデルタ更新を優先するオンラインラベルフリーアルゴリズムを提案する。
結果は、帯域幅対応同期のための実用的なシステム層として、離散トークン状態ストリーミングをサポートする。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:19:18 GMT)
It's All Connected: Topology-Aware Structural Graph Encoding Improves Performance on Polymer Prediction [2.2] グラフニューラルネットワーク (GNN) は分子特性予測において強い結果を得たが、ポリマーは異なる課題を呈している。
ラベル付きデータセットは、高価な実験を必要とするため、小さく(通常は数百のポリマーの順に)少ない。
このギャップに対処する原理的なグラフ構成を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:28:40 GMT)
Priority-Driven Control and Communication in Decentralized Multi-Agent Systems via Reinforcement Learning [2.2] イベントトリガー制御は、ネットワーク化されたマルチエージェントシステムにおける制約付き通信帯域の過剰使用を回避するメカニズムを提供する。
本研究では,データから通信優先度と制御ポリシーを協調的に学習するモデルフリーで優先度駆動型強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:43:25 GMT)
A Cascaded Generative Approach for e-Commerce Recommendations [2.2] 本稿では,ストアフロント構築を2つの生成タスクに分解する,ケースケードメルチャンディジングフレームワークを提案する。
ファインチューニングされたモデルアブレーションは、閉軽量LLM性能に近づくことが示されている。
オンライン実験では、このフレームワークはページビュー当たりのカートの昇降率を+2.7%と見積もっている。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:27:08 GMT)
bViT: Investigating Single-Block Recurrence in Vision Transformers for Image Recognition [2.1] 本稿では,1つの変圧器ブロックを繰り返し適用して画像処理を行う単一ブロックリカレントViTであるbViTを紹介する。
ImageNet-1Kでは、12ステップのbViT-Bが、同じトレーニングレシピと計算予算の下で標準のViT-Bに匹敵する精度を達成する。
我々は、リカレント性能が表現幅で向上し、より広いbViTが、より狭い変種よりも標準ViTの性能を回復するのを観察する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:43:36 GMT)
Frequency Adapter with SAM for Generalized Medical Image Segmentation [2.1] Segment Anything Model (SAM)は、セグメンテーションタスクにおいて強力な一般化機能を示す。
SAM(FSAM)を用いた周波数ベース領域一般化を提案する。
FSAMは、ドメイン不変の高周波特徴を抽出することでSAMのセグメンテーションロバスト性を高める。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:21:41 GMT)
USEMA: a Scalable Efficient Mamba Like Attention for Medical Image Segmentation [2.1] 本稿では,畳み込みニューラルネットワーク(CNN)の局所的特徴抽出能力とSEMA注意を融合したハイブリッドUNetアーキテクチャであるUSEMAを提案する。
我々は,多種多様なモダリティと画像サイズにまたがってUSEMAを用いて実験を行い,トランスフォーマーベースモデルと比較して計算効率の向上を実証した。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:40:13 GMT)
Quantum Correlations of Neutrinos in the Kerr-Newman Space-time [2.1] ニュートリノは量子情報(QM)の分野で特別な利点を示す
本稿では,Kerr-Newman測度がQCに与える影響について検討する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:59:57 GMT)
TeleResilienceBench: Quantifying Resilience for LLM Reasoning in Telecommunications [2.0] 推論のレジリエンスを定量化するベンチマークであるTeleResilienceBenchを紹介する。
我々は、Qwen3.5、Gemma4、Nemotron-3ファミリーにまたがる8つのモデルを評価する。
その結果、最強モデルでさえ、マクロ平均CFRは29.1%しか達成していないことがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:28:21 GMT)
Intervention-Based Time Series Causal Discovery via Simulator-Generated Interventional Distributions [2.0] 物理学に基づくシミュレータをPearlのdo演算子の機械的実現として扱う時系列因果発見のためのフレームワークを提案する。
シミュレータ内の変数を物理的に分離するパスをクランプし、建設による介入データを生成する。
サインフリップ座標は、シミュレータの精度がしきい値以下になると、推定因果効果が符号を反転させると予測する。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:54:58 GMT)
Generate "Normal", Edit Poisoned: Branding Injection via Hint Embedding in Image Editing [2.0] 画像と画像の編集にまつわる新たなセキュリティ脆弱性について検討する。
入力画像に埋め込まれたブランディング情報のように、ほとんど見えないヒントを下流生成モデルで認識することができる。
本稿では,2つの現実的な攻撃シナリオについて検討する。第1に,攻撃者がオンライン画像生成サービスを制御するフィッシングベースの設定について述べる。
2つ目は毒をベースとした設定で、攻撃者は妥協されたテキストと画像の拡散モデルを配布する。
フィッシング攻撃と毒素攻撃に対する平均成功率は87.4%と92.3%である。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:02:46 GMT)
Beyond Red-Teaming: Formal Guarantees of LLM Guardrail Classifiers [2.0] ガードレールは生産言語モデルを有害な行動から保護するが、正式な保証は提供しない。
SVD整列超矩形とガウス混合モデルという2つの領域の構成を提案する。
このフレームワークを、毒性ドメイン上の3つの著者がトレーニングしたガードレールに適用すると、すべての超矩形構成はSATを返す。
GPT-2とLlama-3.1-8Bは、様々な境界で90%と80%の堅牢なカバーを維持しているが、BERTの安全保証は独特な揮発性を証明している。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:41:38 GMT)
Coarsening Linear Non-Gaussian Causal Models with Cycles [2.0] 線型非ガウス的条件下では、高次元の非巡回性仮定は緩和可能であることを示す。
我々は、この低次元DAGの識別可能性と既存の結果をさらに結びつける。
我々の低次元の要約は最悪の場合の立方体時間で学習され、サンプルの複雑さに明確な境界がある。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:13:45 GMT)
Exact Fixed-Point Constraints in Neural-ODEs with Provable Universality [2.0] 本稿では,ニューラルネットワークによる任意の速度場を任意の固定点で近似する手法を提案する。
速度場内の任意の局所的制約の下でのニューラル-ODEの普遍性を厳密に証明し、固定点を補足する計算学的に便利な方法を与える。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:10:31 GMT)
Scalable linearized gate set tomography [2.0] 線形化ゲートセットトモグラフィーはスパース誤差モデル、効率的なデータフィッティングを可能にする線形近似、浅い回路からのデータに依存している。
我々は,コヒーレントなクロストークを含むコヒーレントな誤差を持つ10ビット系のシミュレーションを用いて,本手法の精度を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:06:10 GMT)
OpenZL: Using Graphs to Compress Smaller and Faster [2.0] データ集約型アプリケーションのための新しい圧縮戦略であるOpenZLを提案する。
OpenZLは、圧縮をモジュラーコーデックの有向非巡回グラフとして表現するための新しい理論フレームワークを実装している。
現状の汎用圧縮機と比較して,OpenZLは圧縮率と速度が優れていることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:28:15 GMT)
Haptic Rendering of Fractional-Order Viscoelasticity: Passivity and Rendering Fidelity [1.9] クリープ・応力緩和を示す粘弾性材料のハプティックレンダリングは多くの用途において重要である。
有限メモリ離散化下での分数次粘弾性モデルの通過率とレンダリング性能について解析する。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:16:45 GMT)
Analogue quantum simulation with polylogarithmic interaction strengths by extrapolating within phases of matter [1.9] 非クリティカルなシステムでは、これらのスケーリングは古典的な後処理によって指数関数的に削減できることを示す。
反応強度が逆精度とシステムサイズで多対数的にしかスケールしないガジェットを用いて,指数関数的に崩壊する熱状態と十分に安定なギャップを持つ基底状態の局所的および広範囲な特性をシミュレートできることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:12:31 GMT)
A passive self-correcting quantum memory in three dimensions [1.9] 非零温度で浴に結合した場合、指数時間で基底状態空間を符号化できる3次元パウリ安定化器ハミルトニアンを構築する。
我々の構成はシードハミルトニアンへの一連の変換を適用し、エンコードされた量子ビットのメモリ寿命を増大させ、$mathbbR3$の幾何学的局所性を維持する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:59:56 GMT)
Multi-Qubit Stabilizer Readout on a Dual-Species Rydberg Array [1.8] 共局在2次元光ツイーザアレイに閉じ込められたNaおよびCs原子の2種のRydberg配列を開発した。
我々は,1つの大域Rydbergパルスシーケンスによる4量子Csプラケット上のPauli-Z安定化器の非破壊測定を実証した。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:55:33 GMT)
Social Theory Should Be a Structural Prior for Agentic AI: A Formal Framework for Multi-Agent Social Systems [1.8] マルチエージェント社会システム(英: Multi-Agent Social Systems、MASS)は、エージェントが相互作用し、システムレベルの結果を生成するためのフレームワークである。
このポジションペーパーでは、エージェントAIシステムは構造的先行として社会理論でモデル化されなければならないと論じている。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:29:54 GMT)
MCPShield: Content-Aware Attack Detection for LLM Agent Tool-Call Traffic [1.8] Model Context Protocol (MCP) は、エージェントが外部ツールを呼び出すために広く採用されているインタフェースである。
MCPは、各エージェントセッションをグラフとしてエンコードするMCPツールコールトラフィックのアタックフレームワークとして提示される。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:55:48 GMT)
Medical Incident Causal Factors and Preventive Measures Generation Using Tag-based Example Selection in Few-shot Learning [1.7] 医療などの高度な領域では、LLM(Large Language Models)の信頼性が重要である。
本研究では, LLM に背景要因や因果要因を発生させ, 医療事件の詳細から予防措置を提示するタグベースの事例選択手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:49:09 GMT)
FeatMap: Understanding image manipulation in the feature space and its implications for feature space geometry [1.7] 中間特徴表現は、ディープニューラルネットワークの表現性と適応性のバックボーンを表す。
生成画像編集モデルは入力操作により特徴空間をより深く理解するための扉を開く可能性がある。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:12:44 GMT)
Interpretable Machine Learning for Football Performance Analysis: Evidence of Limited Transferability from Elite Leagues to University Competition [1.6] 本研究では,エリート競技から学んだ性能決定因子が,大学レベルのサッカーに構造的に移行可能であるかを検討する。
5つの実験において、エリートフットボールは、リーグ、モデル、説明方法にまたがるパフォーマンス決定式の安定かつ一貫した階層を示した。
対照的に、NTHU大学フットボールは、重要な指標の実質的な並べ替え、説明安定性の低下、エリートドメインとのより弱い構造的合意、説明方法への感受性の向上を示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:24:45 GMT)
RETUYT-INCO at BEA 2026 Shared Task 2: Meta-prompting in Rubric-based Scoring for German [1.6] BEA 2026共有タスク「Rubric-based Short Answer Scoring for German」におけるRETUYT-INCO参加について紹介する。
私たちのチームは、トラック1(3方向)、トラック3(2方向)、トラック4(2方向)に参加した。
これらのトラックは, 特定のルーリックを用いて, 生徒の短い回答をスコアリングする必要があったので, 課題の変化に対処する方法を探究した。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:01:05 GMT)
Active Learning for Gaussian Process Regression Under Self-Induced Boltzmann Weights [1.6] 本稿では,未知のボルツマン分布下での予測誤差の低い未知関数の学習を目標とする能動学習問題を考察する。
この自己誘起重み付けは、計算化学におけるポテンシャルエネルギー表面(PES)モデリングのような問題に自然に発生する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:38:03 GMT)
The Impact of Editorial Intervention on Detecting Native Language Traces [1.6] ネイティブ言語識別(NLI、Native Language Identification)は、著者のネイティブ言語(L1)をネイティブでない文章から判断するタスクである。
人間とAIの共著者の出現により、非ネイティブテキストは大規模言語モデルによって定期的に修正され書き直される。
編集介入の度合いが高まる中でL1トレースの堅牢性について検討した。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:58:08 GMT)
Steerable Neural ODEs on Homogeneous Spaces [1.6] 等質空間上でのステアブルなニューラル常微分方程式は、$M=G/H$である。
我々は、フローを生成するベクトル場と並列輸送を管理する接続が共に$G$-不変であるときに、ステアブルNODEが$G$-同変であることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:41:11 GMT)
Optimal and Scalable MAPF via Multi-Marginal Optimal Transport and Schrödinger Bridges [1.6] MAPFはマルコフ構造を基礎としたMMOT(Multi-marginal optimal)問題の特別なクラスとしてキャスト可能であることを示す。
大規模問題へのアプローチに適応するため、我々はシュルディンガー橋を介してMAPF-MMOTを確率的フレームワークにキャストした。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:52:15 GMT)
HEPA: A Self-Supervised Horizon-Conditioned Event Predictive Architecture for Time Series [1.6] HEPA(Horizon-conditioned Event Predictive Architecture)は2つの重要な原則に基づいて構築されている。
因果トランスフォーマーエンコーダはJEPA(Joint-Embedding Predictive Architecture)を介して事前訓練される
我々はエンコーダを凍結し、予測器のみを目標事象に向けて微調整し、地平線上の単調生存累積分布関数(CDF)を生成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:38:03 GMT)
Decentralized Contingency MPC based on Safe Sets for Nonlinear Multi-agent Collision Avoidance [1.6] 本稿では,非線形力学を持つマルチエージェントシステムのための分散並列MPCフレームワークを開発する。
状態のみの情報パターンの下では、各エージェントは同じ合意的ルールセットに従い、コミュニケーションなしで安全な分散計画を可能にする。
シミュレーションの結果はスパース環境と密集型マルチエージェント環境の両方で性能を示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:40:36 GMT)
Rethinking external validation for the target population: Capturing patient-level similarity with a generative model [1.6] 本稿では,各外部患者の開発データとの類似性を定量化する枠組みを提案する。
類似性を推定するために、生成モデル、特にオートエンコーダを使用します。
結果:本フレームワークは類似性定義サブグループ間でのモデル性能のかなりの変動を明らかにした。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:11:03 GMT)
Control Charts for Multi-agent Systems [1.5] 環境から学習可能なマルチエージェントシステムを監視するためには,適応制御チャートが必要であることを示す。
適応制御チャートは, 十分に緩やかに障害する敵エージェントに感受性があることが示される。
システム内のエージェントが学習できないか、システムが敵対者に影響を受けやすいかのどちらかだ。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:42:12 GMT)
iPay: Integrated Payment Action Recognition via Multimodal Networks and Adaptive Spatial Prior Learning [1.5] iPayは、オンボード交通監視システムのための支払いアクション認識フレームワークである。
iPayは従来の手法より優れ,83.45%の認識精度と競合計算効率を実現している。
また、現地の交通機関と協力して55時間以上の実物監視映像を収集し、500件以上の支払いクリップを生み出しました。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:37:05 GMT)
Beyond Autonomy: A Dynamic Tiered AgentRunner Framework for Governable and Resilient Enterprise AI Execution [1.5] プロダクショングレードのマルチテナントプラットフォームから抽出した制御実行プロトコルであるDynamic Tiered AgentRunnerを提案する。
本フレームワークは,(1)タスクリスクプロファイルに基づいて動的に計算資源を割り当てるリスク適応型タイリング,(2)物理的に分離された独立したエージェントによって提案,レビュー,実行,検証を行うパワーズアーキテクチャの分離,(3)障害を第一級システム状態として扱う検証器-回復閉ループによるレジリエンス・バイ・デザインの3つのコアメカニズムを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:03:48 GMT)
SCALAR: A Neurosymbolic Framework for Automated Conjecture and Reasoning in Quantum Circuit Analysis [1.5] 量子回路解析における自動予想生成のための神経象徴的フレームワークであるSCALARを提案する。
このシステムは、量子シミュレーション、シンボリック予想生成、LLMベースの解釈を統合する。
グラフクラスや量子回路深度に対する感度を含む,生成した予想の精度,一般性,限界について論じる。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:31:18 GMT)
BoostLLM: Boosting-inspired LLM Fine-tuning for Few-shot Tabular Classification [1.5] BoostLLMはパラメータ効率の良い微調整を多ラウンド残差最適化プロセスに変換するフレームワークである。
BoostLLMは、複数のLLMバックボーンとデータセットをまたいだ標準微調整よりも一貫した改善を実現していることを示す。
これらの結果から,LLMファインチューニングの一般的なトレーニング原則として,特に構造化データの低データ化に有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:17:23 GMT)
From Syntax to Semantics: Unveiling the Emergence of Chirality in SMILES Translation Models [1.5] SMILES翻訳のための自動回帰変換器を用いたエンコーダデコーダモデルであるPan-COREを提案する。
我々は、高時間分解能チェックポイント分析を用いて、訓練中にキラル情報がどのように学習されるかを調べる。
SMILES翻訳はCLMのセマンティックな出現を機械的解析するための有用な実験システムとして機能することが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:53:49 GMT)
Operating Within the Operational Design Domain: Zero-Shot Perception with Vision-Language Models [1.5] 視覚言語モデル(VLM)は視覚認識と言語推論を統合し、タスク固有のトレーニングデータなしで機能する。
本研究は, 安全クリティカルなアプリケーションにおいて, 透過的かつ効果的なODDに基づく認識の道を開くものである。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:04:50 GMT)
Flag Varieties: A Geometric Framework for Deep Network Alignment [1.4] アライメント、ディープ・ネットワークにおける隣接する重み行列の傾向は、互換性のある部分空間配向、勾配流の地下化、ニューラル・コラプス、アーキテクチャ間の表現類似性を発達させる。
我々はアライメント幾何がフラッグ多様体によって与えられる正準閉多安定層を持つことを証明した。
本稿では,1次原理からのニューラル崩壊におけるレベル2/3階層を,ポストホック解析ではなく,幾何学的に説明する。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:46:17 GMT)
Neural Co-state Policies: Structuring Hidden States in Recurrent Reinforcement Learning [1.4] インテリジェントエージェントの重要な機能は、部分的な可観測性の下で動作することである。
強化学習を通じて学んだメモリベースのポリシーは、履歴を潜在状態表現にエンコードすることでこの問題に対処するが、内部のダイナミクスは解釈不能なブラックボックスのままである。
本稿では,これらの隠蔽状態と最適制御からポントリャーギン最小原理(PMP)を公式にリンクする。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:51:17 GMT)
NumColBERT: Non-Intrusive Numeracy Injection for Late-Interaction Retrieval Models [1.4] 本研究は,数値条件を含む問合せに対して,高密度検索性能を向上させることの課題に対処する。
既存のソリューションは通常、クエリをテキストコンポーネントと数値コンポーネントに分解し、個別にスコアする。
NumColBERTは、数値条件付き検索を強化する推論時非侵入法である。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:24:30 GMT)
H-MAPS: Hierarchical Memory-Augmented Proactive Search Assistant for Scientific Literature [1.4] 本稿では,H-MAPS (Hierarchical Memory-Augmented Proactive Search Assistant) について紹介する。
H-MAPSは暗黙の読み動作によってトリガーされ、ユーザの潜伏した情報要求を明示的な自然言語の質問に記述する。
応答として、システムはプロファイル固有の質問を生成し、各ユーザに適した個別の文献を検索する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:13:15 GMT)
Key-Value Means [1.4] キーバリュー平均(英: Key-Value Means、KVM)は、固定サイズまたは成長状態のいずれかに対応可能な、注目のためのブロックリカレンスである。
本研究は,4次前処理時間と線形状態成長しか持たない長期コンテキストテストにおいて,競争力を発揮することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:04:14 GMT)
Urban-ImageNet: A Large-Scale Multi-Modal Dataset and Evaluation Framework for Urban Space Perception [1.4] ユーザ生成ソーシャルメディア画像からの都市空間知覚のための大規模マルチモーダルデータセットと評価ベンチマークであるUrban-ImageNetを提案する。
コーパスには、2019年から2025年にかけて中国の24都市にある61の都市で、Weiboから収集された200万以上のソーシャルメディアイメージと、ペアのテキスト投稿が含まれており、ベンチマークサブセットは1K、10K、100Kスケールで、大規模なトレーニングと評価のためのフル2Mコーパスが含まれている。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:33:49 GMT)
Social Policy of Large Language Models: How GPT, Claude, DeepSeek and Grok Allocate Social Budgets in Spain and Germany [1.3] 我々は,Claude,GPT-4o,DeepSeek,Grokの4つの大規模言語モデルを用いて,スペインとドイツという2つの欧州の状況下で,固定的な国家社会予算を分配する方法について検討した。
我々は、地政学的偏見、住宅のアンダーアロケーション、構造的収束、国家的文脈への感受性、政治的に敏感なカテゴリーのアンダー表現に関する5つの仮説を定式化する。
その結果、すべての4つのモデルが、実際のヨーロッパの支出構造から分岐する、体系的な暗黙の社会政策を共有していることがわかった。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:10:42 GMT)
Agent-First Tool API: A Semantic Interface Paradigm for Enterprise AI Agent Systems [1.3] 本稿では,ツールインタラクションを検索,解決,プレビュー,実行,検証,フェーズ回復に分解するAgent-First Tool APIパラダイムを提案する。
このパラダイムは、6つのビジネスドメインに85の登録ツールを提供する実運用マルチテナントプラットフォームで実装され、検証されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:30:43 GMT)
Deep Learning for Protein Complex Prediction and Design [1.3] この論文は、タンパク質構造の階層的な性質を捉えるドメイン固有のアーキテクチャと、タンパク質複合体の広大な配列空間を効率的にナビゲートする探索アルゴリズムの2つの基本的な側面をディープラーニングを用いて調査する。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:53:18 GMT)
Real vs. Semi-Simulated: Rethinking Evaluation for Treatment Effect Estimation [1.3] 我々は、標準的な半シミュレーションされたベンチマークファミリーと実世界のデータセット間で、治療効果の評価に関する大規模な実証的研究を行う。
本稿では,アプリケーション指向の文献に共通する可観測測値と,メソッド論文でよく使用される対実測値を用いて,これらの手法を評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:04:02 GMT)
When 'For You' Isn't For You: Measuring User Agency in TikTok's Algorithmic Feed [1.3] 我々は、ユーザーがTikTokアプリで見るコンテンツをコントロールできる範囲について調査する。
FYPアルゴリズムは両方の種類の信号に敏感であり、アカウントが見るパーソナライズされたコンテンツの量を変える。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:03:10 GMT)
Clip-level Uncertainty and Temporal-aware Active Learning for End-to-End Multi-Object Tracking [1.3] 動的環境におけるマルチオブジェクト追跡(MOT)は、時間とともに一貫したオブジェクトのアイデンティティを維持するために、堅牢な時間的推論に依存する。
トランスフォーマーベースのエンドツーエンドMOTモデルは、時間依存を明示的にモデル化することで、強力なパフォーマンスを達成する。
高ラベリングコストとビデオの強い冗長性を考えると、アクティブラーニング(AL)はアノテーション効率を改善する効果的なアプローチである。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:33:35 GMT)
Price of Quality: Sufficient Conditions for Sparse Recovery using Mixed-Quality Data [1.3] 混合品質源からの観測結果が得られたときの回復について検討する。
この異種ノイズ設定のために、情報理論とアルゴリズムの回復のためのサンプルサイズ条件を確立する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:24:27 GMT)
Quantifying Rodda and Graham Gait Classification from 3D Makerless Kinematics derived from a Single-view Video in a Heterogeneous Pediatric Clinical Cohort [1.3] 脳性麻痺は小児期の身体障害の最も一般的な原因である。
CP児の約75%は健常であり、歩行評価は歩行機能の維持に欠かせない。
単視点の歩行ビデオから直接ロッドとグラハムの膝と足首のzスコアを定量化するマーカーレス歩行分析パイプラインを開発した。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:04:08 GMT)
A Comparative Study of Machine Learning and Deep Learning for Out-of-Distribution Detection [1.2] 信頼性の高いAIシステムを構築するには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
ディープラーニング(DL)はしばしば従来の機械学習(ML)よりも優れていると仮定される
6万枚以上の基礎画像と非基礎画像からなるオープンデータセット上で2つのアプローチが評価された。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:32:50 GMT)
ShardTensor: Domain Parallelism for Scientific Machine Learning [1.2] ShardTensorは、任意のサイズの入力データの柔軟なスケーリングを可能にする、ドメイン並列性の新しいパラダイムである。
ハードウェア制約から入力データの空間的次元を分離することにより、ShardTensorは、科学的な機械学習ワークロードを、高度な忠実度トレーニングと推論の新たなレベルに到達することを可能にする。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:20:10 GMT)
Robust Basis Spline Decoupling for the Compression of Transformer Models [1.1] 既存のアプローチを一般化するB-splineベースのデカップリングフレームワークを導入する。
B-スプラインの局所的支持とフレキシブルな滑らかさ制御を利用することで、より安定で表現力のある表現が得られる。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:37:36 GMT)
Attractor-Vascular Coupling Theory: Formal Grounding and Empirical Validation for AAMI-Standard Cuffless Blood Pressure Estimation from Smartphone Photoplethysmography [1.1] AAMI標準推定に十分な血圧情報を符号化している。
Takens遅延埋め込みとアトラクタ形態抽出を用いて操作する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:24:42 GMT)
A Nonlinear Complexity Index for Wearable PPG Cardiovascular Stability: Multiscale Validation, Systematic Evaluation Correction, and Bayesian Parameter Optimization [1.1] 心血管安定性指数 (SCSI) を導入し, 4つの異種時間尺度から176,742セグメントで検証した。
我々は,真のベースラインから0.5732まで成分を注入する3つの評価アーティファクトを同定した。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:55:30 GMT)
BathyFacto: Refraction-Aware Two-Media Neural Radiance Fields for Bathymetry [1.1] UAV画像に基づく水面透過光度測定は浅水浴量測定を可能にする。
気-水界面での屈折は、構造-移動の直線的仮定に反する。
本稿では,NerfactoをNerfstudioに統合した屈折型2メディア拡張であるBathyFactoを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:24:59 GMT)
Democratizing Measurement of Critical Mobile Infrastructure: Security and Privacy in an Increasingly Centralized Communication Ecosystem [1.1] この論文は、モバイル通信システムの独立性、拡張性、再現性のある測定のための新しいアプローチを導入している。
我々は、携帯電話無線ネットワーク、オペレータが提供するサービス、TTメッセージングアプリケーション間での制御実験を可能にする、オープンソースの計測プラットフォームを設計、実装、およびオープンソースで設計する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:33:11 GMT)
Scaling the Memory of Balanced Adam [1.1] バランスの取れたAdamでは、$は無次元定数として扱われるべきではない。
我々は、Adamがトレーニングの有用な段階で内部統計を更新する回数を計測するリフレッシュカウント$R_= (1-)T_mathrmES$について検討する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:35:46 GMT)
Multi-Prover Interactive Proof Systems with Leakage [1.1] 本稿では,プロデューサ間の通信が許されるが境界づけられた設定にアプローチする2つの手法を提案する。
任意の$p$に対して、$mathsfNEXP$と$mathsfRE$に対して$mathsfMIPast$と$mathsfMIPast$プロトコルを構築することができる。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:58:44 GMT)
Voice Biomarkers for Depression and Anxiety [1.1] 抑うつや不安を音声から検出するための現在のアプローチは、機械学習技術に依存している。
生の音声信号に直接深層学習を適用することは、予測力を大幅に高めるバイオマーカー表現を生成する可能性がある。
大規模プロプライエタリデータセットに基づいてトレーニングされたディープラーニングモデルの開発に向けた取り組みについて述べる。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:51:35 GMT)
OUIDecay: Adaptive Layer-wise Weight Decay for CNNs Using Online Activation Patterns [1.1] We propose OUIDecay, a adapt layer-wise and time-dependent weight decay scheduler for CNNs driven by the Overfitting-Underfitting Indicator (OUI)。
OUIDecayは、OUIの軽量バッチベースの定式化を使用して、各レイヤの構造挙動をオンラインで監視し、ネットワーク内の他のレイヤと比較して、その重量減衰を定期的に再スケールする。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:08:39 GMT)
StartFlow: From Method Conception to Multi-Perspective Evaluation in UX Prototyping for Software Startups [1.0] StartFlowは、非専門のプロフェッショナルがMVPを作成するのに役立つ構造化された方法です。
本研究では、ソフトウェア開発の初期段階におけるStartFlowの利用に焦点を当てる。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:43:21 GMT)
Towards Autonomous Railway Operations: A Semi-Hierarchical Deep Reinforcement Learning Approach to the Vehicle Rescheduling Problem [1.0] 鉄道交通管理における混乱の管理は大きな課題である。
交通密度の増加とインフラの制限は複雑さを増す。
ほとんどのディスパッチは、問題の指数的な複雑さのため、人間の専門知識に依存している。
本稿では, 運転制約に合わせた半階層的RL定式化を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:23:50 GMT)
Scalable Gaussian process inference via neural feature maps [1.0] 学習した特徴写像はインプリッドRKHSから導出されるグラム行列に対する最適低ランク近似として解釈できることを示す。
オーバースムーシングに対処するための製品機能マップカーネルを導入します。
この単純で強力なアプローチは、最小の事前作業で高速でスケーラブルで正確なGP推論を可能にする。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:45:45 GMT)
PhysEDA: Physics-Aware Learning Framework for Efficient EDA With Manhattan Distance Decay [1.0] 物理構造線形注意(PSLA)と電位ベースリワード整形(PBRS)の2成分からなるPhysEDAを提案する。
PSLAは、分離可能なマンハッタンの崩壊を乗法バイアスとして線形アテンション核に折り畳み、二次から線型への複雑性を減少させる。
PBRSは同じカーネルから物理ポテンシャルを構築し、スパースRLの下で高密度の報酬信号を提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:24:15 GMT)
Quantifying Concentration Phenomena of Mean-Field Transformers in the Low-Temperature Regime [1.0] 深部エンコーダのみの変圧器におけるトークンの進化を推論時に検討する。
トークン分布が初期分布のプッシュフォワードに急速に集中することを証明する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:58:14 GMT)
Error whitening: Why Gauss-Newton outperforms Newton [0.9] ガウス・ニュートンが関数空間のニュートン方向をモデル空間に投影していることが示される。
ガウスニュートンは理論的に予測された函数空間のダイナミクスに従ってニュートン法より優れていることを実証的に証明する。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:07:25 GMT)
The Generalized Turing Test: A Foundation for Comparing Intelligence [0.9] 識別不能性を通じて任意のエージェントの能力を比較するための公式なフレームワークを導入する。
エージェント A と B に対し、チューリングコンパレータ A$geq$B を定義して、B が微分器として作用し、A との相互作用と B の他のインスタンスとを確実に区別できないと仮定する。
これにより、データセットとタスクに依存しない相対知性の概念が得られる。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:00:18 GMT)
Multi-Agent System Identification with Nonlinear Sheaf Diffusion [0.9] 多エージェントシステムを管理する局所的相互作用法則は、軌道データから回復することが困難である。
このコホモロジーが消滅した場合に限って、制約のない関数クラスから一意に回復できることが示される。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:15:03 GMT)
Passive optical superresolution at the quantum limit [0.9] このノイズの影響を最小限に抑えるには、光学画像の量子処理が必要である。
これらの手法がレイリー非コヒーレント源の分類, 局在化, イメージングにおいて, 従来の画像に勝ることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:00:00 GMT)
AgentRx: A Benchmark Study of LLM Agents for Multimodal Clinical Prediction Tasks [0.9] 大規模言語モデル(LLM)ベースのエージェントは、様々な医療タスクにおいて顕著なパフォーマンスを示した。
コードと評価フレームワークをオープンソース化することで、この研究は、医療におけるエージェントシステムに関連する将来の開発をサポートするための、新しいベンチマークを提供します。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:46:41 GMT)
When Can Digital Personas Reliably Approximate Human Survey Findings? [0.8] 大規模言語モデル(LLM)を利用したデジタルペルソナは、人間の調査回答者の代用としてますます提案されている。
人間の調査結果を確実に近似できる時期は、まだ不明である。
我々は、回答者の背景変数と2023年以前の調査履歴からペルソナを構築し、同じ回答者の保留後の回答に対してテストする。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:41:11 GMT)
Generating synthetic electronic health record data using agent-based models to evaluate machine learning robustness under mass casualty incidents [0.8] 災害による大量災害(MCI)は、これが問題となる重要な事例である。
MCIの実際のEHRデータは制限や利用できないことが多いため、そのような条件下でMLの堅牢性を評価することは、デプロイが困難なままである。
本稿では,MCIシナリオ下でのMLモデルのロバスト性を評価するために,合成EHRデータを生成するエージェントベースモデリング手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:00:42 GMT)
Chebyshev Center-Based Direction Selection for Multi-Objective Optimization and Training PINNs [0.8] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)を解くための有望なアプローチである
PINNは偏微分方程式(PDE)を解くための有望なアプローチである
論文参考訳(メタデータ) (Mon, 11 May 2026 04:30:39 GMT)
NyayaAI: An AI-Powered Legal Assistant Using Multi-Agent Architecture and Retrieval-Augmented Generation [0.8] インドにおける法的な情報は、法律言語が複雑で法的な文書が大量にあるため、ほとんどアクセスできないままである。
本稿では,弁護士,法学部生,一般ユーザを対象に,AIを活用した法律アシスタントであるNyayaAIについて述べる。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:04:07 GMT)
Explainability of Recurrent Neural Networks for Enhancing P300-based Brain-Computer Interfaces [0.8] P300イベント関連電位に基づく脳インターフェイスは、健康、教育、補助技術に有望な応用を提供する。
性能と透明性の両方を改善するために設計された追加レイヤであるポスト・リカレント・モジュール(PRM)を紹介します。
PRMは、EEGデータからP300信号を分類するためのリカレントニューラルネットワーク(RNN)アーキテクチャに組み込まれている。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:36:03 GMT)
QUIVER: A Formal Framework for Quantifying Perturbation Propagation and Bifurcation in Compound AI Systems [0.8] 本稿では,グラフ構造化AIパイプラインにおける摂動伝搬を測定するフレームワークであるQUIVERを紹介する。
2つのプロダクションエンタープライズパイプラインと、構造的に異なる3つのアーキテクチャであるパブリックDSPyマルチホップQAパイプラインを検証します。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:42:38 GMT)
Improving search efficiency via adaptive acquisition function selection in discrete black-box optimization [0.8] ブラックボックス最適化では、限られた試行数で有望な解を効率的に特定することが重要である。
そこで本研究では,BOCSを主探索フレームワークとして使用し,代替の未評価点を生成するハイブリッド手法を提案する。
提案手法の有効性は,ハミング・ディスタンス地区における探索の進行を促進する点の選択から導かれる。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:03:01 GMT)
A Resilient Solution for Sewer Overflow Monitoring across Cloud and Edge [0.7] 多くの歴史的都市の高齢化と複合下水道は、極端な降雨によってますます強調されている。
オーバーフローモニタリングのための対話型モニタリングダッシュボードにDeep Learning予測手法を統合する,Webベースのデモンストレータを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:00:25 GMT)
Measuring Embedding Sensitivity to Authorial Style in French: Comparing Literary Texts with Language Model Rewritings [0.7] 埋め込みは、作者のスタイル的特徴を確実に捉え、書き直し後にこれらの信号が持続していることがわかりました。
これらの結果は、言語モデルの時代における著者の模倣検出に有望な方向を提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:05:46 GMT)
Acceptance Cards:A Four-Diagnostic Standard for Safe Fine-Tuning Defense Claims [0.7] 本稿では,評価プロトコルであるアクセプタンスカード,文書オブジェクト,実行可能監査パッケージ,クレーム固有の明細調整型ディフェンスクレームのための明細書標準について紹介する。
このプロトコルは、ギャップ低減をフルカードパスとして扱う前に、統計的信頼性、新鮮なセマンティック一般化、メカニズムアライメント、およびクロスタスク転送をチェックする。
これは1つのモデルファミリ上の狭いインストールギャップ監査であり、SafeLoRAの有効性のグローバルな判断ではない。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:48:42 GMT)
Portable Active Learning for Object Detection [0.6] Portable Active Learning (PAL) は、推論出力のみで動作する検出器に依存しない、ポータブルなフレームワークである。
PALは、クラスレベルのインスタンスの不確実性と画像レベルの多様性を組み合わせて、データ選択をガイドする。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:52:23 GMT)
CellDX AI Autopilot: Agent-Guided Training and Deployment of Pathology Classifiers [0.6] 現在、計算病理学のためのAIモデルをトレーニングするには、高価な全画像データセットにアクセスする必要がある。
CellDX AI Autopilotは、ユーザがスライダー画像の分類器を訓練し、評価し、デプロイできるプラットフォームです。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:08:10 GMT)
ASIA: an Autonomous System Identification Agent [0.6] 本稿では,この反復探索を,自律的符号化エージェントとして機能する大規模言語モデルに委譲するフレームワークであるASIAを提案する。
既存のエージェントプラットフォーム上に構築されたASIAは、人間の介入なしに仮説、実装、評価の間のループを閉じる。
筆者らは,ASIAを2つのシステム識別ベンチマーク上で実証的研究を行い,エージェントの探索行動,発見するアーキテクチャとトレーニング戦略,および得られたモデルの品質を分析した。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:41:21 GMT)
Variational Linear Attention: Stable Associative Memory for Long-Context Transformers [0.6] リニアアテンションはソフトマックスアテンションの二次コストを$mathcalO(T)$に下げるが、フロベニウスノルムでは$mathcalO(T)$としてメモリ状態が増加する。
メモリ更新をオンライン最小二乗問題として再構成するtextbfVariational Linear Attention (VLA) を導入する。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:03:12 GMT)
DenseTRF: Texture-Aware Unsupervised Representation Adaptation for Surgical Scene Dense Prediction [0.6] テクスチャ中心の注意に基づく自己教師型表現適応フレームワークDenseTRFを提案する。
DenseTRFは、監視なしでターゲット分布に表現を適用することにより、ドメインシフトに対する堅牢性を大幅に改善する。
複数の外科手術における実験は、最先端のセグメンテーションモデルと比較して、クロスディストリビューションの一般化の改善を実証している。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:43:40 GMT)
Can Muon Fine-tune Adam-Pretrained Models? [0.6] ほとんどのオープンモデルはAdamで事前訓練されており、微調整のためにミュオンに鼻で切り替えると、ミスマッチによって性能が劣化する。
我々は、ミスマッチが事前訓練された知識を妨害し、この破壊が更新強度とともにスケールする証拠を提供する。
LoRAは、言語やビジョンタスク全体にわたって、完全な微調整の下で観察されるAdamとMuonのパフォーマンスギャップを減らします。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:34:20 GMT)
UAV-Assisted Scan-to-Simulation for Landslides Using Physics-Informed Gaussian Splatting [0.6] 3DGSによるシーンキャプチャと物理に基づく地すべりシミュレーションを橋渡しするUAV-based scan-to-simulationフレームワークを提案する。
香港の地すべり現場で激しい地すべりを経験し,その枠組みを検証した。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:25:21 GMT)
SHIA: A Direct SysML-Hardware Interface Architecture for Model-Centric Verification [0.6] 本稿では,SysMLハードウェアインタフェースアーキテクチャ(SHIA)を紹介する。
ShiAは、IBM Rhapsody内の組み込みC++で記述されたSysMLサイドサーバと、Raspberry Pi上で動作するハードウェアサイドサーバによって実現されている。
論理ゲートケーススタディでは、ハードウェアモデルの構築とプロトタイプアセンブリから、ハーネス設計のテスト、動作状態チャート制御、統合前の各コンポーネントのステージ検証に至るまで、エンドツーエンドのアプローチを実証している。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:16:27 GMT)
A Spectral Framework for Closed-Form Relative Density Estimation [0.6] 線形パラメータ化確率モデルにおける相対対数密度推定のための閉形式スペクトルフレームワークを提案する。
我々は,一階および二階の特徴モーメントのみに基づく明示的なスペクトル式を導出し,固定特徴量に対する発散係数と対数密度ポテンシャルの両方の閉形式推定値を得る。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:51:17 GMT)
Uncertainty in Physics and AI: Taxonomy, Quantification, and Validation [0.5] 本稿では、物理学におけるMLの不確実性定量化に関する構造化された概要を示し、不確実性の統一分類法を導入する。
我々は、カバレッジ、キャリブレーション、バイアステスト、適切なスコアリングルールを含む原則付き検証ツールについて論じ、それらを単純な回帰例と分類例で説明する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:21:49 GMT)
BEACON: A Multimodal Dataset for Learning Behavioral Fingerprints from Gameplay Data [0.5] 高精細なデジタル環境での連続的な認証は、現実的な認知と運動の要求の下で、きめ細かい行動信号を持つデータセットを必要とする。
本稿では,競争力のあるtextitValorant ゲームプレイにおいて,多様なスキルレベルをキャプチャする大規模マルチモーダルデータセット BEACON を紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:17:02 GMT)
The Open-Box Fallacy: Why AI Deployment Needs a Calibrated Verification Regime [0.5] 私たちは、認可はドメインスコープで、独立してチェック可能で、リリース後に監視され、説明可能で、競争可能で、取り消し可能であるべきだと論じています。
モデルカード, リーダーボード, 規制開示の能力スコアの横に置かれるべき指標として, 最小構成ルールの6成分報告可能な標準である検証カバレッジを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:02:56 GMT)
Leveraging RAG for Training-Free Alignment of LLMs [0.5] 現状のアライメントアルゴリズムは,近年のエージェント攻撃に対するガードレールの無効化をはるかに低減しつつ,計算資源の大幅な削減を必要としていることを示す。
本稿では,RAGに基づく単純なアライメントアルゴリズムであるRetrieval Augmented Generation for Pref erence alignment (RAG-Pref)を紹介する。
RAG-Prefはオンライン(トレーニング不要)で、市販パッケージと互換性があり、オフライン(トレーニングベース)アライメントアルゴリズムと組み合わせることで、エージェント攻撃の拒絶を平均3.7倍改善することができる。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:29:39 GMT)
A Systematic Security Testing Approach for InterUSS-based environments [0.5] InterUSSのような無人交通管理(UTM)の連合エコシステムは、UASサービスサプライヤ(USS)間のセキュアな協調を可能にする。
本稿では, 保守者の視点から, InterUSS ベースの環境に対するセキュリティテスト手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:43:45 GMT)
A Reflective Storytelling Agent for Older Adults: Integrating Argumentation Schemes and Argument Mining in LLM-Based Personalised Narratives [0.5] 本研究は,知識駆動型大規模言語モデル(LLM)に基づくストーリーテリングが,高齢者向けデジタル・コンパニオンとの客観的な対話を支援するかどうかを考察する。
本稿では,ナレッジグラフ,ユーザモデリング,議論理論,議論マイニングを統合し,物語生成のガイドとインスペクションを行う反射型ストーリーテリングエージェントを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:17:31 GMT)
Threat Modelling using Domain-Adapted Language Models: Empirical Evaluation and Insights [0.5] 大規模言語モデル(LLM)は、脆弱性検出などのサイバーセキュリティアプリケーションのためにますます研究されている。
本研究では,ドメイン適応型言語モデルを用いて,構造化脅威モデリングの研究領域を体系的に評価することによって拡張する。
LLMとSmall Language Models(SLM)は、通信やサイバーシークエンスに適応したドメインである。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:31:25 GMT)
Reconfigurable Computing Challenge: Real-Time Graph Neural Networks for Online Event Selection in Big Science [0.4] 本研究は、AMD Versal VCK190上でのベルII電磁量計ハードウェアトリガのための動的グラフニューラルネットワークのリアルタイム展開のためのエンドツーエンド実証実験である。
我々は,演算子融合,分割,マッピング,空間並列化,カーネルレベルの最適化を含むPythonベースの半自動設計フローを開発した。
私たちの設計では、エンドツーエンドのレイテンシ7.15マイクロ秒で、毎秒2.94万イベントのスループットを実現しています。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:10:06 GMT)
Navigating the Sea of LLM Evaluation: Investigating Bias in Toxicity Benchmarks [0.4] 本研究は、確立されたベンチマーク設定の堅牢性を調査し、本質的なバイアスを測定する方法を検討する。
本実験では,評価設定が変更された場合のベンチマーク動作に有意な差がみられた。
モデル固有の不安定性を観察し、より堅牢で包括的な安全性評価フレームワークの必要性を明確に示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:27:39 GMT)
CausalGS: Learning Physical Causality of 3D Dynamic Scenes with Gaussian Representations [0.4] CausalGSは、複雑なダイナミックな3Dシーンの因果ダイナミクスをマルチビュービデオから学習するフレームワークである。
我々の研究は、人間のアノテーションがなければ、モデルは複数の物理的性質の間の複雑な相互作用を学習できることを示している。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:59:01 GMT)
DECO-MWE: building a linguistic resource of Korean multiword expressions for feature-based sentiment analysis [0.3] 本稿では,韓国語多語表現の言語資源をFBSA(FBSA: DECO-MWE)に構築することを目的とする。
DECO-MWEは有限状態変換器として形式化され、MWEの語彙とシンタクティックの制約を表す。
DECO-MWEの回収性能はテストコーパスで0.806fであった。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:54:51 GMT)
CPEMH: An Agentic Framework for Prompt-Driven Behavior Evaluation and Assurance in Foundation-Model Systems for Mental Health Screening [0.3] CPEMHは、大規模言語システムにおける行動保証のエンジニアリング方法論として機能する。
オーケストレータ、推論、評価エージェントを組み合わせたモジュラーエージェント設計により、トレーサビリティ、ロバスト性、ロバスト性はライフサイクルを通して保証される。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:52:01 GMT)
Statistical Model Checking of the Keynes+Schumpeter Model: A Transient Sensitivity Analysis of a Macroeconomic ABM [0.3] 本稿では,統計モデル検査が現実的なマクロ経済シミュレータの原理的解析層を実現する方法を示す。
本稿は,SMCが実質的に豊かな経済ABMの再現性と情報的定量的分析を支援することができることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:19:16 GMT)
Newton's Lantern: A Reinforcement Learning Framework for Finetuning AC Power Flow Warm Start Models [0.3] 本稿では,グループ相対的政策最適化とベースモデルの予測の摂動に基づく学習報酬モデルを組み合わせた微調整パイプラインであるNewton's Lanternを紹介する。
IEEE 118-bus、OCC 500-bus、OCC 2000-busベンチマーク全体において、Newton's Lanternは最小限のイテレーション数を確保しながら、テストスナップショット毎に収束する唯一の方法である。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:06:58 GMT)
Edge-specific signal propagation on mature chromophore-region 3D mechanism graphs for fluorescent protein quantum-yield prediction [0.3] 蛍光タンパク質の量子収率予測のためのクロモフォア中心機構グラフアルゴリズムを提案する。
各PDB構造は、3D残基グラフに変換され、成熟したCRO状態に登録される。
各特徴は接触チャネル、シード信号、ターゲットCRO領域をコードするため、解釈はポストホックではなく本質的である。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:18:20 GMT)
To Redact, or not to Redact? A Local LLM Approach to Deliberative Process Privilege Classification [0.3] 我々は、FOIA Exemption 5の熟考プロセス特権のための自動感度分類を行うための先行研究に基づいて構築する。
我々は、小型でローカルなモデルで、コンシューマグレードのハードウェアにデプロイ可能な感度分類を行う。
評定として予測される文には、意見の表現を示す動詞がもっと多く含まれていることが分かる。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:55:09 GMT)
DRIFT: Drift-Resilient Invariant-Feature Transformer for DGA Detection [0.3] ドメイン生成アルゴリズムはボットネット検出を避けるために進化する。
深層学習に基づく検出器は、静的条件下では強い性能を達成するが、時間的ドリフトに直面すると著しく劣化する。
本稿では,ハイブリッドトークン化戦略を通じて不変表現を学習するドリフトレジリエントトランスフォーマーベースのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:08:41 GMT)
Learning When to Act: Communication-Efficient Reinforcement Learning via Run-Time Assurance [0.3] Lyapunov の安全性保護の下で制御入力と通信効率のタイミング決定を単一ポリシで学習できることが示される。
実行時保証層は、1ステップのリアプノフ予測と事前計算されたLQRバックアップを介してポリシーをオーバーライドする。
12-state 3D quadrotor のケーススタディでは、古典的な STC が難解な高次元システムにフレームワークを拡張している。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:55:15 GMT)
Cavity-Enhanced Collective Quantum Processing with Polarization-Encoded Qubits [0.3] 我々は、集合量子処理のためのキャビティ強化光学アーキテクチャを導入する。
論理量子ビットは 再循環するキャビティモードの 分極部分空間に符号化される
論文参考訳(メタデータ) (Mon, 11 May 2026 12:36:54 GMT)
Don't Fix the Basis -- Learn It: Spectral Representation with Adaptive Basis Learning for PDEs [0.3] 本稿では,事前定義されたベースに依存するのではなく,データ依存のスペクトル表現を学習するフレームワークであるAdaptive Basis Learning(ABLE)を提案する。
ABLEは、学習された補助密度を介して空間適応的なParsevalフレームを構築し、オペレータが持ち上げられたスペクトル空間で動作できるようにする。
この結果から,演算子の複雑性のみではなく,データ駆動による表現の選択が,ニューラル演算子の設計における重要なボトルネックであることを強調した。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:20:57 GMT)
Mixing Times of Glauber Dynamics on Masked Language Models [0.3] Masked Language Model (MLM) はトークン上の局所条件を定義するが、シーケンス上の一貫した関節分布に対応しない。
このような条件が生成に反復的に使用されるとき、大域的な分布行動はどのように引き起こされるのか?
離散空間トークン列上のグラウバー力学マルコフ連鎖として反復マスクトケンをモデル化することでこの問題に対処する。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:31:16 GMT)
Causal Explanations from the Geometric Properties of ReLU Neural Networks [0.3] ニューラルネットワークと自律エージェントの意思決定プロセスを理解することを目的としている。
ReLUニューラルネットワークの幾何学的理解に関する最近の研究は、ReLUネットワークが領域に分割された一方向線形関数に対応することを示している。
この幾何学的表現は,ネットワークの動作に関する因果的説明を生成するのに有効であることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:39:15 GMT)
A Single-Molecule Spin-Photon Interface [0.2] 長い寿命のスピン量子ビットと光子を接続する光インターフェースは、量子ネットワークと分散量子情報処理の中枢的な要件である。
ここでは、構造的に整合したホスト結晶に埋め込まれた三重項基底状態カルベン分子が、単一分子アドレス性を持つ堅牢なスピン-光子界面として機能することを示す。
その結果、分子量子ビットは、ボトムアップ化学設計と処理可能な材料の利点を保ちながら、単一エミッタ量子光学のための実行可能なプラットフォームとして確立された。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:59:26 GMT)
Uniform Scaling Limits in AdamW-Trained Transformers [0.2] 我々はAdamWで訓練した変圧器の大深度限界について検討した。
隠れ状態とバックプロパゲート変数のジョイントダイナミクスが$L2$に収束することを証明している。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:54:46 GMT)
Temporal Structure Matters for Efficient Test-Time Adaptation in Wearable Human Activity Recognition [0.2] テスト時間適応(TTA)は、実世界のクロスユーザー分散シフト下での性能低下を緩和する。
既存の手法は主に視覚タスクから仮定を継承し、WHARストリームに固有のウィンドウ間時間構造を過小評価する。
本稿では,WHARのための軽量かつバックプロパゲーションフリーなTTAフレームワークであるSIGHTを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:28:51 GMT)
Toward Multi-Database Query Reasoning for Text2Cypher [0.2] Text2Cypherはグラフデータベース用のCypherクエリを生成する。
既存のText2Cypherシステムの多くは、既知のスキーマ上でクエリが生成される単一のプリセレクトグラフデータベースを前提としている。
単一データベースクエリ生成からマルチデータベースクエリ推論へのシフトを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:17:27 GMT)
Extending Confidence-Based Text2Cypher with Grammar and Schema Aware Filtering [0.2] 構造化制約がText2Cypherのテスト時間推論にどのように使えるかを検討する。
テスト時に単純な構造チェックを追加することで、Text2Cypher生成の信頼性が向上することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:18:13 GMT)
The Cognitive Kardashev Scale: Quantifying the Material Envelope of Civilisational Computation [0.2] カルダシェフの1964年のタイポロジーは、全力で文明を分類している: 惑星(タイプI、1016W)、恒星(タイプII、1026W)、銀河(タイプIII)
本稿では,認知カルダシェフ尺度(Cognitive Kardashev Scale)に類似したAIグレードの計算能力について述べる。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:43:06 GMT)
Adversarial SQL Injection Generation with LLM-Based Architectures [0.2] sqlインジェクション攻撃は、Open Worldwide Application Security Project (OWASP)トップ10の脅威の中で、依然として深刻な攻撃の1つです。
人工知能(AI)の進歩、特にLarge Language Models(LLM)では、防御機構を測定するために敵攻撃テストを自動化する機会が生み出されている。
我々は2つの新しいLCMベースのシステム、Retrieval Augmented Generation for Adrial SQLi(RADAGAS)とRefleXQLi(RefleXQLi)を紹介する。
我々のテストは240の実験から成り、24万のペイロードを生成し、WAFに対して2200万のテストを実行した。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:52:44 GMT)
UCCI: Calibrated Uncertainty for Cost-Optimal LLM Cascade Routing [0.1] 本稿では,トークンレベルのマージン不確かさをクエリごとのエラー確率にマッピングするキャリブレーションファーストルータUCCIを提案する。
UCCIは推論コストを31%削減し、エントロピー閾値、スプリットコンフォーマルルーティング、FrugalGPTスタイルの学習しきい値を上回る。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:06:57 GMT)
Characterizing quantum correlations and quantum teleportation in $gg \to t\bar{t}$ and $q\bar{q} \to t\bar{t}$ processes under noisy channels [0.1] QCDで生成された$tbart$ペアの量子相関を解析する。
キネマティック変数への依存は、$gg to tbart$と$qbarq to tbart$チャネルの両方で調べられる。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:20:01 GMT)
A Cold Diffusion Approach for Percussive Dereverberation [0.1] パーカッシブ・デバーベレーションは、鋭い過渡性と密集した時間構造のために、異なる課題を生じさせる。
ステレオドラムステム(ダウンミックス)を除去するためのコールド拡散フレームワークを提案する。
UNetと拡散トランスフォーマーのバックボーンの両方を用いて,このフレームワークを実装した。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:23:37 GMT)
Drum Synthesis from Expressive Drum Grids via Neural Audio Codecs [0.1] ニューラルオーディオの離散符号を予測することにより,表現力のあるドラムグリッドをドラムオーディオに変換するシステムを提案する。
提案手法ではトランスフォーマーモデルを用いて,入力したドラムグリッドを一連のトークンにマッピングし,波形音声に変換する。
客観的な測定値を用いて、生成した音声の忠実度と音楽的アライメントを評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:40:14 GMT)
ObfAx: Obfuscation and IP Piracy Detection in Approximate Circuits [0.1] この研究は、近似ハードウェアの文脈において、IP保護と海賊行為の検出という新たな課題に対処する。
本稿では,攻撃者が構造的難読化によって設計を隠蔽する,新たな敵脅威モデルを提案する。
本稿では,保護されたIPコアと疑わしい回路の統計的エラープロファイルを抽出し,比較する自動フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:01:49 GMT)
Free Energy Manifold: Score-Based Inference for Hybrid Bayesian Networks [0.0] フリーエナジー・マニフォールド(Free Energy Manifold、FEM)は、離散変数と連続変数を持つハイブリッドベイズネットワークにおける推論に特化した、スコアトレーニングされた条件エネルギーモデルである。
FEMは、各条件因子を学習された個別の埋め込みと連続的な観察のエネルギーランドスケープとして表現している。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:43:45 GMT)
Can Language Models Analyze Data? Evaluating Large Language Models for Question Answering over Datasets [0.0] 本稿では,大規模言語モデル(LLM)の有効性について検討する。
難易度の異なる質問を含む2つのデータセットで実験を行った。
その結果,より小型でコスト効率のよいモデルの限界を浮き彫りにしながら,大型LLMの強い性能を示した。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:54:47 GMT)
Graph-State Circuit Blocks control Entanglement and Scrambling Velocities [0.0] 多部回路プリミティブの内部構造が絡み合い率に大きく影響を与えることを示す。
我々は、固定された$n$-qubitグラフ状態準備ユニタリから構築されたクリフォード量子回路の、正確にシミュレート可能な族を研究する。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:00:03 GMT)
xApp Empowered Resource Management for Non-Terrestrial Users in 5G O-RAN Networks [0.0] 本稿では,オープン無線アクセスネットワーク(O-RAN)のためのアクティブ無人航空機(UAV)モビリティ管理xAppを紹介する。
提案フレームワークはネットワーク条件を予測し、予測最適化により停止確率とハンドオーバ頻度を最小化する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:18:23 GMT)
jNO: A JAX Library for Neural Operator and Foundation Model Training [0.0] jNOは、ニューラル演算子とファンデーションモデルのためのJAXネイティブライブラリである。
データ駆動トレーニングと物理インフォームトレーニングの両方をサポートする。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:05:54 GMT)
diffGHOST: Diffusion based Generative Hedged Oblivious Synthetic Trajectories [0.0] 本稿では,遅延空間分割に基づく条件拡散モデルdiffGHOSTを紹介する。
本稿では,学習潜伏空間の条件セグメントを用いて,臨界サンプルの同定と記憶を行う手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:33:47 GMT)
Yeti: A compact protein structure tokenizer for reconstruction and multi-modal generation [0.0] ルックアップ自由量子化に基づくコンパクトなタンパク質構造プロテタイザであるProtetiを導入し,マルチモーダル学習のためのフローマッチング手法を提案する。
既存のモデルと比較して、Ottiは一般的に最高のコードブック利用率とトークンの多様性を達成し、多様なデータセットにおいて2番目に優れた再構成精度(ESM3よりも10倍少ないパラメータ)を実現している。
結果として得られるマルチモーダルモデルは、タンパク質配列と構造を無条件に共生して可塑性構造を生成し、10倍のモデルに匹敵する結果が得られる。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:49:47 GMT)
Where do aspectual variants of light verb constructions belong? [0.0] 軽動詞のアスペクト的変種、例えば「借金の取り方」と「借金の取り方」の表現は、テキストでは頻繁に見られるが、動詞のイディオム、軽動詞の構成、構成句の分類は難しい。
本稿では,これらの表現の性質を議論されたメンバーシップで検討し,これら3つのカテゴリ間のより満足な境界を決定する特徴の選択を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:05:38 GMT)
Vacuum and thermal fluctuations of a scalar field with point interactions [0.0] ミンコフスキー時空における中性無質量スカラー場の真空および熱ゆらぎについて検討した。
カシミールエネルギーに対する収束ボルン級数展開を導出し、真空力の基礎となるメカニズムとして多重散乱過程を同定する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:32:28 GMT)
VERDI: Single-Call Confidence Estimation for Verification-Based LLM Judges via Decomposed Inference [0.0] VERDI(verification-Decomposed Inference Inference)は、構造化された裁判官から信頼を抽出する手法である。
VERDIは各評価をサブチェックに分解し、3つの構造信号を導出する。
3つの公開ベンチマークで、VERDIはGPT-4.1-miniでAUROC 0.72-0.91、GPT-5.4-miniで0.66-0.80を達成した。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:39:19 GMT)
V4FinBench: Benchmarking Tabular Foundation Models, LLMs, and Standard Methods on Corporate Bankruptcy Prediction [0.0] V4FinBenchは、Visegrd Group(V4)エコノミー(2006-2021)の100万以上の企業年次記録のベンチマークである。
V4FinBenchは、現実的なクラス不均衡の下でのメソッドの評価をサポートするように設計されており、正の率は0.19%から0.36%である。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:38:17 GMT)
Using Logs to support Programming Education [0.0] このプロジェクトは、個々の学生とクラス全体のコード開発ログからリアルタイムの学習分析を収集することでギャップを埋める。
従来の学習管理システムとは違って,広く使用されているコードエディタ用のプラグインという,新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:53:16 GMT)
Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research [0.0] 本研究では、AIベースのQ&Aと文献レビューツールを評価するためのベンチマークフレームワークを適用した。
この結果から、QとAツールは、貴重な概要と概して正確な要約を提供できることが示唆された。
しかし、正確な情報抽出には必ずしも信頼できない。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:39:41 GMT)
Unpacking the Eye of the Beholder: Social Location, Identity, and the Moving Target of Political Perspectives [0.0] 政治的・社会的アイデンティティは、人々が政治情報を評価する方法を構成する。
PVPS(Perspectivist Visual Political Sentiment)分類器を開発した。
抗議的イメージにおける暴力の認識と、抗議的イメージエンゲージメントの背後にある感情的メカニズムは、同一性が考慮されれば、両者が即時変化することを示します。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:21:49 GMT)
Unitaria: Quantum Linear Algebra via Block Encodings [0.0] Unitariaは、ブロックエンコーディングに基づいた量子アルゴリズムを実装するPythonライブラリである。
Unitariaは構成可能な配列ライクなインターフェースを提供しており、ユーザーは行列とベクトルのブロックエンコーディングを定義できる。
鍵となる特徴は、すべての演算をエンコードされたベクトルと行列で直接計算できる行列-算術的評価パスである。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:00:15 GMT)
Transverse Magnetic Response from Orbitally Polarized Cooper Pairs in Elemental Superconductors [0.0] 三角対称性を$C_s$に下げることで、単一のミラー平面のみを保持し、バルク面と(111)面の軌道間ペアリングを活性化することを示す。
磁場において、結果として生じる軌道偏極超伝導状態は、新しい横磁場応答をもたらす。
本研究は, 超伝導軌道論のための極小材料プラットフォームとして, 素子超伝導体を構築した。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:16:10 GMT)
Training continuously-coupled reconfigurable photonic chips with quantum machine learning [0.0] 本稿では、再構成可能な統合干渉計をプログラム化するための機械学習に基づくアプローチを提案する。
提案手法では, 単光子と2光子を限定的に測定する。
その結果、この手法を統合型干渉計の動作をプログラムするための効果的なツールとして活用するという視点が開かれた。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:49:23 GMT)
Towards FairRAG: Preventing Representational Harm in Retrieval-Augmented Generation by Enforcing Fair Exposure at Retrieval Time [0.0] Retrieval-augmented Generation (RAG) は幻覚に対処する技術である。
RAGのマルチコンポーネントパイプラインは、バイアスを導入可能な脆弱性を導入している。
本研究は,2つの提案された露出認識手法とともに,これまで開発されたユーティリティ重視のランキング戦略について考察する。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:01:07 GMT)
Total Generalized Variation regularization closes the gap between neural-eld and classical methods in seismic travel-time tomography [0.0] トモグラフィーはメッシュ分解能と安定性のトレードオフを強制し、レギュレータの選択が回復可能なものを支配します。
本稿では,Fourier-Feature Neural Networkとして,2次元速度場を表す差別化可能なフレームワークMIMIRを紹介する。
論文参考訳(メタデータ) (Mon, 11 May 2026 04:13:52 GMT)
Tolerating Device Failure in Distributed Quantum Computing [0.0] 動作中に量子デバイスを交換したり、交換したりすることは、論理エラー率に最小限の影響を与える。
また,モジュールノード故障率の低い論理情報を保護するために,トーリックおよび双曲型フロック量子誤り訂正符号について検討した。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:00:28 GMT)
Time-of-flight force sensing below the quantum zero-point fluctuation [0.0] 我々は、量子制限力センシングのための有望なプラットフォームとして、浮遊ナノ粒子が使用できることを示す。
我々の研究結果は、量子限界を超える有望なセンシングプラットフォームとして、浮遊したナノ粒子を利用するための道を開いた。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:10:55 GMT)
ThreatCore: A Benchmark for Explicit and Implicit Threat Detection [0.0] ThreatCoreは、きめ細かい脅威検出のための公開ベンチマークデータセットである。
それは明白な脅威、暗黙の脅威、および非脅威を区別する。
暗黙的な脅威は、明示的な脅威よりもはるかに検出が困難であることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:35:53 GMT)
The Semantic Training Gap: Ontology-Grounded Tool Architectures for Industrial AI Agent Systems [0.0] 大規模言語モデル(LLM)ベースのAIエージェントは、分析、品質管理、意思決定支援のための製造環境にますます多くデプロイされている。
これらのエージェントは、ドメイン用語で統計的に流布するが、操作意味論の基盤的理解は欠如している。
本稿では、AIシステムが学習を通してドメイン語彙を取得する方法と、生産業務が存在論的関係を通じて意味を定義する方法とを、構造的に切り離すという意味訓練のギャップを特定し、形式化する。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:48:18 GMT)
The Scaling Law of Evaluation Failure: Why Simple Averaging Collapses Under Data Sparsity and Item Difficulty Gaps, and How Item Response Theory Recovers Ground Truth Across Domains [0.0] AIと安全クリティカルドメイン間のベンチマーク評価は、圧倒的に単純な平均化に依存している。
2つの条件が共起した場合に、このプラクティスがかなり誤解を招くことを実証する。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:17:55 GMT)
The Metacognitive Probe: Five Behavioural Calibration Diagnostics for LLMs [0.0] メタ認知プローブ(Metacognitive Probe)は、探索的な5タスク、15スロットの診断である。
LLMの信頼性動作を5つの行動特異的な次元に分解する。
N=69人に対して評価される。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:55:31 GMT)
The Last Word Often Wins: A Format Confound in Chain-of-Thought Corruption Studies [0.0] チェーン・オブ・シント(CoT)の忠実度を評価するための主要なツールである破壊研究は、どのチェーン位置が「計算上重要な」のかを特定する。
明示的な終末応答文を持つチェーンに対して、標準における支配的な形式である汚職研究は、応答テキストがどこに現れるか、どこで発生しないかを検出する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:26:50 GMT)
Template-as-Ontology: Configurable Synthetic Data Infrastructure for Cross-Domain Manufacturing AI Validation [0.0] 1つのPython構成モジュールは、タイムステップ製造シミュレータの仕様として機能する。
5層パイプライン-シミュレート、CDC/Icebergレイクハウス、スタースキーマ、12のパラメータ化されたAIツール-は、因果的に一貫性のあるMES型のデータを生成します。
このフレームワークは、個別の製造AIバリデーションのための再利用可能なデータ層を提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:36:05 GMT)
Teaching LLMs to See Graphs: Unifying Text and Structural Reasoning [0.0] 本稿では,事前学習によるグラフトポロジ処理を可能にする新しいアーキテクチャであるグラフトランスフォーマー言語モデル(GTLM)を紹介する。
GTLMは例外的にパラメータ効率が高く、LLMのアテンションモジュールに直接グラフ認識のアテンションバイアスを注入する。
我々は,GTLMのアテンションヘッドが暗黙的にメッセージパッシングをシミュレートし,アルゴリズム上の優れた性能を説明することを実証した。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:19:55 GMT)
Task-Agnostic Noisy Label Detection via Standardized Loss Aggregation [0.0] ノイズラベルは、大規模な医療画像データセットで一般的である。
統計的基盤とタスクに依存しないフレームワークであるStandardized Loss Aggregation(SLA)を提案する。
SLAは、標準化された折りたたみレベルのバリデーション損失を集約することで、ラベルの信頼性を定量化する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:16:09 GMT)
Symmetry-Protected Basin Localization in Variational Quantum Eigensolvers [0.0] 量子固有解法は、強い相関関係が分子エネルギーの風景を競合する盆地に分割するときに、最適化が始まる前に失敗する。
本稿では, 原子核形状を相関した基底状態盆地の回路パラメータに直接マッピングする, 構造条件付きプレコンディショナーを提案する。
この手順は、ショット制限された量子ループの前に盆地選択を行い、量子回路は選択された盆地内の相関を洗練する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:52:50 GMT)
Study of the Superradiance Phenomenon in the $α$--attractor Potential using the Log Derivative Method [0.0] 我々は反射係数$mathcalR$と透過係数$mathcalT$を計算し、超放射現象が存在することを示した。
提案手法の精度を実証するため,双曲性タンジェント電位の解析解との比較を行った。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:54:56 GMT)
Strategic Coercion Within Alliances: The Greenland Sovereignty Game as an AI Stress Test [0.0] 地政学LLMのストレステストとしてグリーンランドの主権危機について検討する。
この危機は、北極圏の戦略統制と、NATOが支配的な加盟国に対して同盟の規範を強制できるかどうかという2つの集団行動問題を引き起こしている。
我々は,3つのゲーム(非対称的強制,臨界質量ピーク点を持つNATO保証ゲーム,社会的嗜好を持つ三進的広角形ゲーム)を開発し,マルチエージェントシミュレーションでそれらを検証する。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:43:49 GMT)
Squeezing Enhancement Through Resonant Interference in Multi-ring Resonators [0.0] 我々は、複数の共振器からなる任意の損失構造において、圧縮光の発生の非摂動的記述を開発する。
5つの共振近似の下での二重励起縮退スキームを考慮し、寄生性4波混合の寄与を抑制する2つの方法を検討する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:36:07 GMT)
SoK: A Systematic Bidirectional Literature Review of AI & DLT Convergence [0.0] AI強化型DLTとDLT強化型AIの2つの方向に沿ってコントリビューションを分類する。
最初のケースでは、AI技術がデータ、ネットワーク、コンセンサス、実行、アプリケーションレイヤの5層にわたるDLTシステムをどのように改善するかを調べます。
2つ目のケースでは、DLTがインフラストラクチャ、データ、モデル、推論、アプリケーションレイヤという5つのレイヤにわたるAIシステムをどのようにサポートするのかを分析します。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:06:04 GMT)
Separation Logic for Verifying Physical Collisions of CNC Programs [0.0] 本稿では,物理ワークスペースを空間ヒープとして概念化する形式的検証フレームワークを提案する。
評価に先立って,ツールトラジェクトリと安全バッファを離散空間モデルにマッピングすることにより,分離論理の利用を可能にする。
このアプローチは、幾何学シミュレーションに代わるスケーラブルで数学的に基礎付けられた代替手段を提供し、自律的でゼロコリジョン製造の基礎を提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:09:17 GMT)
Separability from Multipartite Measures [0.0] 3階の負性性は三部類純状態の完全分離性に必要かつ十分な基準を与えることを示す。
我々はこの基準を、負性などの二部体診断以外の混合状態にまで拡張する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:57:10 GMT)
Sensor Design for Accuracy-Bounded Estimation via Maximum-Entropy Likelihood Synthesis [0.0] 誤差予算が与えられた場合、ダイナミックな事前情報を超えて最小限の情報を注入しながら、それを強制する測定確率を合成する。
このフレームワークは任意の相違を許容し、平均相違、$f$divergences、モーメント制約、ハイブリッドメトリクスに対してインスタンス化される。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:28:45 GMT)
Scaling Vision Models Does Not Consistently Improve Localisation-Based Explanation Quality [0.0] 深度と複雑さの増大を表すコンピュータビジョンモデルを11種類評価する。
各モデルに対して、5つのポストホックな説明可能なAI手法を用いて説明を生成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:51:33 GMT)
Relations Are Channels: Knowledge Graph Embedding via Kraus Decompositions [0.0] 知識グラフ埋め込み(KGE)モデルは通常、各関係をエンティティ埋め込み上の演算子として表現する。
任意の原理的関係作用素が満足するべき公理、線形性、トレース保存、完全肯定性を示し、クラウスチャネル構造を特徴づける。
原理的KGEモデルであるtextscKrausKGE を提案し、自然に$$-to-N$と$N$-to-N$リレーションを処理している。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:17:52 GMT)
Quantum tunneling, global phases and the limits of classical action reconstructions [0.0] シュルディンガー波動関数は、関連する古典的密度によって重み付けられた古典的作用枝の離散的な重ね合わせから正確に再構成可能であることが最近提案された。
有限電位障壁を通した量子トンネルと量子位相現象に関するこの構成について検討する。
アルファ崩壊と核融合における矩形およびクーロン障壁トンネルを用いて、波動関数は、消滅しない量子ポテンシャルまたは複雑な値の作用を必要とすることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:22:10 GMT)
Quantum and classical processing with photonic quantum machine learning [0.0] 近年の研究では、深い量子状態下での物理システムにおける機械学習の実装は、より高速な情報処理だけでなく、古典的なシステムでは到達できないタスクの実行にも繋がることが示されている。
本稿では、量子および古典的機械学習タスクの両方を実行する量子貯水池処理装置について報告する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:34:50 GMT)
Quantum Simulation of Magnetic Materials: from Ab-Initio to NISQ [0.0] 我々は三塩化クロム単分子膜の低エネルギー磁気励起、特にスピン波スペクトルをシミュレートした。
最大48量子ビットのシステムに対する結果は、古典的なベンチマークに対して検証される。
この結果から,量子コンピュータへの商用クラウドアクセスを通じて,実物質の有用な量子シミュレーションが可能になった。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:50:16 GMT)
Quantum Fanout Gates in Constant Depth via Resonance Engineering [0.0] 共振工学を用いた n-qubit ファンアウトゲートの実装について述べる。
我々のゲートはより高速な安定化を実現し、多くの量子アルゴリズムでスピードアップを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:00:02 GMT)
Quantum Algorithm for Identifying Hidden Graphs: Spectral Theory and Numerical Evidence [0.0] 隠れた$d$正規基底グラフを識別するための量子アルゴリズムを、その難解バージョンへのアクセスから$n$頂点に$G$を与える。
我々のアルゴリズムは概念的には単純で、$G_rm spire$ 上で連続時間ウォークし、古典的には pret*$ で 1 つのアダマールテストを行う。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:44:32 GMT)
Quantifying the Reconstructability of Astrophysical Methods with Large Language Models and Information Theory: A Case Study in Spectral Reconstruction [0.0] 本稿では,その記述からいかに効率的に手法を再構築できるかを定量化するための情報理論フレームワークを提案する。
我々はシャノンエントロピーとジェンセン=シャノン発散を用いて、有効な実装の仮説空間がいかに強いテキストで制約されるかを測定する。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:00:09 GMT)
Quantifying the Hadamard Resilience Law: Discovery of the Coherence Gap in NISQ-Era Classifiers [0.0] NISQ時代の分類器におけるノイズモデルとアルゴリズム性能の根本的な相違について報告する。
我々は、アダマールテストパーセプトロンが93.9%のMNISTの精度を維持しており、提案したアダマールレジリエンス法を検証していることを示した。
我々は、このコヒーレンスによって引き起こされる信号減衰を考慮し、現在のNISQデバイス上でのロバストな量子線型層の予測境界を確立する、洗練されたハードウェア・アウェア・モデルを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:26:46 GMT)
Qlustering for Data Clustering via Network-Based Quantum Transport [0.0] 我々は、GKSLマスター方程式によって支配される量子ネットワークにおける定常量子輸送に基づく、教師なしクラスタリングフレームワークであるQlusteringを紹介する。
提案手法は, 合成データセット, 局所化, QM9 と Iris でベンチマークし, 幅広いデフォーカス強度に対して, 競争性能と安定性を見出した。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:56:26 GMT)
Perspective on tailoring quantum coherence with electron beams [0.0] 半導体量子量子ビットとその環境間の相互作用を調べ制御することは、半導体量子技術を促進することができる。
電子顕微鏡における電子ビームは、半導体励起の量子コヒーレントな探索と強い結合効果のための新しい道を開いた。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:50:23 GMT)
Partial Quantisation of Non-Hermitian Berry Phases in Time-Varying Media [0.0] 非エルミート作用素の基本的な対称性は、時変メディアにおける波動伝播が非自明なトポロジーを持つような系を埋めるものである。
この位相はベリー位相の量子化された実部として、幅広い実験条件で直接測定することができる。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:32:08 GMT)
Parameterized Complexity of Stationarity Testing for Piecewise-Affine Functions and Shallow CNN Losses [0.0] 本研究は, 連続片方向アフィン関数の所定点における近似一階定常性試験のパラメータ化複雑性について検討する。
Tian と So による最近の研究は、PA 関数に対する近似定常性の概念のテストは、最悪の場合、計算的に難解であることを示している。
我々は、トレーニング可能な重量空間で定常性試験を行い、難易度をReLU CNN訓練損失の浅い家族に拡張する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:59:57 GMT)
PC3D: Zero-Shot Cooperation Across Variable Rosters via Personalized Context Distillation [0.0] PC3Dは、ローカルなインタラクション履歴からパーソナライズされた調整コンテキストを復元し、使用するための分散ポリシーの訓練方法である。
実行時に各エージェントは、ローカル履歴から自身のコンテキストを予測し、それを適応して意思決定を条件付ける。
3つの協調的なMARLベンチマークで、PC3Dは、見かけのロスターサイズと見えないロスターサイズの両方で評価されたベースラインよりも高いリターンを達成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:20:17 GMT)
Oversmoothing as Representation Degeneracy in Neural Sheaf Diffusion [0.0] NSD(Neural Sheaf Diffusion)は、スカラーグラフラプラシアンをシーフラプラシアンに置き換えることで、拡散に基づくグラフニューラルネットワークを一般化する。
グラフ上の細胞シーブを関連頻度の表現で同定し,NSDのクイバー理論的解釈を開発する。
そこで本研究では,基礎となる入射平均表現の直和分解が拡散限界に到達した調和空間の分解を誘導することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:41:56 GMT)
Optimizing Quantum Entanglement Preservation in a Qubit-Qubit System with Dzyaloshinskii Moriya Interaction under Noisy Magnetic Fields via Feedback Control [0.0] 量子ビット系における絡み合い力学のMoosavi Khansari と Kazemi Hasanvand [27] による以前の研究を拡張した。
我々はリンドブラッドのマスター方程式を導出し、量子軌道をシミュレートし、色雑音下での負性度を定量化する。
次に、DM相互作用強度D_z(t)を動的に調整し、目標値付近で負性を維持するための比例積分フィードバックプロトコルを設計する。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:49:28 GMT)
Operator Spectroscopy of Trained Lattice Samplers [0.0] 訓練されたフィールド空間関数自体を解析する。
適合前に固定された演算子ベースにこれらの関数を投影する。
作用素基底はモデルと対称性に依存しているが、テストは一般的である。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:06:15 GMT)
On the Distortion of Partitioning Performance by Random Quantum Circuits [0.0] 多くのパーティショニング研究は、評価ワークロードとしてランダム量子回路に依存している。
我々は,3つの回路起源にまたがる多種多様なハイパーグラフ分割戦略を評価する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:04:54 GMT)
On periodic distributed representations using Fourier embeddings [0.0] 物理現象や知覚現象を表現するために,高次元空間に周期的な実数値埋め込みを用いる。
本稿では,空間意味ポインタのニューラルな表現スキームを用いて,ディリクレカーネルと周期ガウスカーネルの形式化に着目する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:35:32 GMT)
No measurement induced phase transition in the entanglement dynamics of monitored non-interacting one-dimensional fermions in a disordered or quasiperiodic potential [0.0] 1次元(1d)非相互作用フェルミオンと$U(1)$対称性の絡み合いエントロピー(EE)は常に領域法相にあることを示す。
乱れの場合、これらの数値結果は、問題を非線形シグマモデルにマッピングした解析計算によって完全に支持される。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:55:20 GMT)
New AI-Driven Tools for Enhancing Campus Well-being: A Prevention and Intervention Approach [0.0] この論文は、予防(フィードバック収集の改善)と介入(メンタルヘルス検出の改善)を通じてギャップに対処する。
予防のために,LLMを利用してコンテキスト認識型会話にユーザをエンゲージするパーソナライズされた調査であるTigerGPTを開発した。
反復性と応答深さの制限に対処するため,強化学習フレームワークであるAURAを導入した。
そこで我々は,DSM-5とPHQ-8をベースとしたLCMであるサイコGPTを開発した。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:30:14 GMT)
Multipartite entanglement of random states of qubits [0.0] アダマール状態が平均的にハール型状態よりも高い絡み合いを示すことを示す。
これらの結果は、アダマール状態が多部交絡構造を探索するための、魅力的で有望なクラスであることを示している。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:15:02 GMT)
Much of Geospatial Web Search Is Beyond Traditional GIS [0.0] 我々は,1100万の実BingクエリからなるMS MARCOコーパスに,高密度文埋め込み,軽量なSetFit分類器,および密度に基づくクラスタリングを適用した。
181,827の地理空間的クエリ(18.0%)を識別し、元のアノテーションでは6.17%とラベル付けされた6.17%をほぼ3倍にしている。
88のクエリーカテゴリーの分類結果から、地理空間検索はトランザクション的および実践的な検索によって支配されていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:42:00 GMT)
Modulation of electron wave packets by scattering on time-harmonic potentials [0.0] 自由電子と光近接場とのコヒーレント相互作用は、電子波パケットのアクティブな変調を可能にする。
我々は、時間周期ポテンシャルと相互作用する電子波パケットに対する厳密な3次元量子散乱理論を開発する。
得られた散乱振幅を,R-行列法とマルチチャネル固有近似の両方を用いて評価した。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:39:41 GMT)
Merlin: Deterministic Byte-Exact Deduplication for Lossless Context Optimization in Large Language Model Inference [0.0] Merlinは、テキストパスとデータチャンクの高速かつバイト単位の重複を高速に実行する。
我々の評価では、低冗長データセットの13.9%から高冗長パイプラインの71%以上まで、入力の削減が示されている。
本稿では、コアアルゴリズム設計、性能ベンチマーク、および最大8.7GB/sの持続的な速度でデータを処理するために必要なアーキテクチャ原則について概説する。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:06:59 GMT)
Mela: Test-Time Memory Consolidation based on Transformation Hypothesis [0.0] 本稿では,異なる更新周波数で動作する2つの機能的に異なるサブモジュールからなるニューラルメモリアーキテクチャを提案する。
変換仮説に触発されて、低周波のサブモジュールは抽象的なジストレベルの知識を捉えたハイレベルな表現を生成する。
我々は、HMMをTransformerベースの言語デコーダに統合し、テスト時にオンラインメモリ統合を実行するメモリ拡張言語モデルのファミリーであるMeraを形成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:20:51 GMT)
Mapping Partisan Fault Lines Within DAOs [0.0] オンチェーンガバナンス分析により、パルチザンのコミュニティを検知し、視覚化できることが示される。
ケーススタディとして名詞を用いて、実際のフラグメンテーションイベントの数ヶ月前に、forkクラスタに割り当てられたアドレスが一緒に存在することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:17:35 GMT)
Low-rank compression of two-electron reduced density matrices [0.0] 2体還元密度 (2RDM) は電子状態の2電子物理学を符号化するが、その準保存コストは実用上大きな限界をもたらす。
我々は,遷移と非遷移の2RDMの両方を圧縮し,それらのウェッジ生成物の構造と物理的対称性を保持する低ランク表現に変換するための簡単なプロトコルについて検討する。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:25:53 GMT)
Loom: Hybrid Retrieval-Scoring Outfit Recommendation with Semantic Material Compatibility and Occasion-Aware Embedding Priors [0.0] Loomは、ニューラルネットワークの埋め込み検索と構造化されたドメインスコアを組み合わせた服装推薦システムである。
システムは、コモディティハードウェア上で5秒未満でスタイリスティックに異なる3つの衣装を生成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:13:59 GMT)
Local topological order, Haag duality, and reflection positivity [0.0] 富田竹崎理論を用いて円錐状領域のハグ双対性を保証するLTOに対する公理を導入する。
この公理は、既知の位相的に順序付けられた通勤プロジェクタモデルに対して満足であることを示す。
また,LTOに対する反射正の公理を最近の論文に関連付ける。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:08:43 GMT)
Likelihood scoring for continuations of mathematical text: a self-supervised benchmark with tests for shortcut vulnerabilities [0.0] 技術論文に隠されたテキストを予測するためのベンチマークを自動生成する。
別個のスコアラは、$Z$を条件付けせずに次の確率を$Y$に割り当てる。
最近の138の物理学と数学の論文からの1363年の方程式の連続について、GPT-5.5、Opus 4.7、GPT-5.4の予測はすべて文脈制御のクリッピング可能性を改善する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:32:06 GMT)
Lecture Notes on Replica Tensor Networks for Random Quantum Circuits [0.0] 本稿では,ランダム量子回路のためのテンソルネットワーク技術についてハンズオンチュートリアルを行う。
その中心となる方法は、古典的なテンソルネットワークの縮約として、システムの複数のコピーに作用する回路平均オブザーバブルをリキャストする。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:57:53 GMT)
LLM-Based Code Documentation Generation and Multi-Judge Evaluation [0.0] コードとリポジトリからドキュメンテーションを生成するAIフレームワークを提案する。
PocketFlowオーケストレーションフレームワーク上に構築されたこのシステムは、構造化されたコンテキスト対応のドキュメントを生成するために、モジュールパイプラインと高度なプロンプトエンジニアリングを適用する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:17:58 GMT)
LLARS: Enabling Domain Expert & Developer Collaboration for LLM Prompting, Generation and Evaluation [0.0] LLARSは、LLMベースのシステムを構築するためのドメインエキスパートと開発者の間のギャップを埋めるオープンソースのプラットフォームです。
6人のドメインエキスパートと3人の開発者からのインタビューで、LARSは直感的で、すべてをひとつの場所に留めて、学際的なコラボレーションをシームレスにすることで、かなりの時間を節約できると確認された。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:00:27 GMT)
Krylov state complexity for BMN matrix model [0.0] 我々は、ファジィスフィアモデル (fuzzy sphere model) として知られる、BMN行列モデルにおけるクリロフの複雑性を体系的に減少させた後に検討する。
本稿では,行列モデルの変形限界が大きい場合と小さい場合の両方で,Lanczos係数を計算できる解析的設定を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:20:16 GMT)
Interpretable Machine Learning for Spatial Science: A Lie-Algebraic Kernel for Rotationally Anisotropic Gaussian Processes [0.0] 三次元空間場は異方性であり、座標軸と整列する必要のない急速かつ遅い変動の方向を持つ。
自動関係決定(ARD)を持つ標準ガウスプロセスカーネルは軸方向の異方性のみをキャプチャする。
本稿では3次元SPD共分散距離をパラメータ化する解釈可能な回転異方性GPカーネルを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:42:47 GMT)
Instruction Adherence in Coding Agent Configuration Files: A Factorial Study of Four File-Structure Variables [0.0] コーディングエージェントはセッション開始時に設定ファイルを読み、内部の規約に従うことが期待されている。
4つの操作変数を用いたこれらの選択の系統的要因分析を報告する。
4つの構造変数または3つの双方向相互作用は、多重検定補正後に検出可能なコントラストを生成しない。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:09:47 GMT)
Influence of pump size on pattern formation in exciton-polaritonic Bose-Einstein condensates in the non-Markovian regime [0.0] 非マルコフ式Gross-Pitaevskii方程式を用いて, 非コヒーレントポンプの励起子-偏光子縮合のダイナミクスについて検討した。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:36:14 GMT)
Inducing Spatial Locality in Vision Transformers through the Training Protocol [0.0] 本研究では,視覚変換器(ViT)の初期層における空間的局所性を,大規模な事前学習を伴わずに,スクラッチから学習できるかどうかを検討する。
ベースラインプロトコルとModernプロトコル(AutoAugment/ColorJitter, CutMix, Label Smoothing)を3つのデータセットで比較する。
3つのデータセット全体にわたって、Modernプロトコルは、早期レイヤにおいてより局所的でより集中的な注意を喚起する。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:31:33 GMT)
Hypothesis-Driven Deep Research with Large Language Models: A Structured Methodology for Automated Knowledge Discovery [0.0] 現在のAIによる研究システムは、仮説を科学的発見の終末産物として扱う、直接的な探索テーマの要約パラダイムを採用している。
仮説は、研究プロセス自体を構成する組織的なマッチング手段として、はるかに強力な役割を果たす可能性があります。
本稿では,仮説駆動型深層研究(I)パイプライン手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:04:09 GMT)
Holonomy and Complementarity in Open Quantum Systems [0.0] 相補関係は、量子系におけるコヒーレンス、予測可能性、開放性の分布を制約していることを示す。
駆動散逸量子ビットに対して、相補性変数はブロッホ球面上の円筒座標を定義する。
開度は、より大きなヒルベルト空間からの還元に付随する半径欠損として幾何学的に現れる。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:26:51 GMT)
Hierarchical Causal Abduction: A Foundation Framework for Explainable Model Predictive Control [0.0] 非線形力学、ハードセーフティ制約、数値最適化は、個々の制御を人間の操作者に不透明にさせることが多い。
本稿では,(i)領域知識グラフによる物理インフォームド推論,(ii)Karush--Kuhn-Tucker(KKT)乗算器による最適化証拠,(iii)PCMCIアルゴリズムによる時間的因果発見と,非線形MPCによって計算される制御行動に関する忠実で人間解釈可能な説明を生成する階層因果推論(HCA)について述べる。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:16:39 GMT)
HYPERPOSE: Hyperbolic Kinematic Phase-Space Attention for 3D Human Pose Estimation [0.0] HYPERPOSEは、新しい3Dヒューマンポーズ推定フレームワークである。
人間の骨格の階層木の中で、ロレン時間的推論を行う。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:17:32 GMT)
Governed Metaprogramming for Intelligent Systems: Reclassifying Eval as a Governed Effect [0.0] プログラム表現が第一級値となる言語設計であるメタプログラミングについて述べる。
形式操作の純粋性、非バイパス定理、境界保存の3つの性質を証明している。
中心的な貢献は、evalを言語プリミティブから支配的なエフェクトに再分類することである。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:24:46 GMT)
Ginzburg--Landau Theory for Confined Thin-Film Superconductors [0.0] 量子閉じ込め下における超伝導薄膜に対するギンズブルグ-ランダウ理論を開発した。
中心的な結果は、量子閉じ込めが固有の超伝導コヒーレンス長を直接正規化することである。
この理論は、閉じ込めによって引き起こされる超伝導長スケールの再正規化と輸送散乱が強く絡み合うクロスオーバー状態を予測する。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:00:38 GMT)
Giant critical response in a driven-dissipative quantum gas [0.0] 自発強度変動の臨界減速と弱いポンプ摂動の増幅について検討した。
弱く減衰した集合フォトン貯留層モードは両方の効果を支配している。
有限開放量子気体におけるこの揺らぎ応答対応は、凝縮の計測可能な動的シグネチャとして臨界感受性を確立する。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:45:34 GMT)
Geometrically Approximated Modeling for Emitter-Centric Ray-Triangle Filtering in Arbitrarily Dynamic LiDAR Simulation [0.0] 本稿では,Gajmer Ray-Casting Algorithm (GRCA)を提案する。
GRCAは、LiDARエミッターを回転円錐または平面として回転させる幾何学モデルである。
それぞれの三角形のエミッター中心の見かけの領域を使って、どのチャネルとそれらのチャネル内の光線がそれに到達することができるのかを計算します。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:28:49 GMT)
Generative AI for Visualizing Highway Construction Hazards Through Synthetic Images and Temporal Sequences [0.0] 本研究は,高速道路建設のハザードを合成可視化する生成的AI手法を開発し,評価する。
この作業により、安全トレーナーは、現実の危険を撮影することなく、ストーリーテリングとビジュアルラーニング素材を組み合わせられる。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:59:36 GMT)
From raw data to neutrino candidates: a neural-network pipeline for Baikal-GVD [0.0] ニューラルネットワークに基づくBaikal-GVDのためのデータ処理パイプラインを提案する。
イベントリコンストラクションの品質を改善し、ニュートリノ候補の選択を加速するように設計されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:38:35 GMT)
From Noncommutative Kinematics to \(U(1)_{\star}\) Gauge Theory: A Family of Spectral Triples with Localized Gauge-induced Perturbations [0.0] キネマティック対称性群 $G_mathrmNC$ の固定非退化既約ユニタリセクタに付随する非可換平面システムを構築する。
それぞれの$varrho$ に対して、これは局所コンパクトな非単位基底スペクトル三重項をインボリューティブなモヤル代数上で得られる。
我々は、形式的最小結合作用素の閉包である自己随伴極限作用素への強い可解収束を証明した。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:20:11 GMT)
FormalRewardBench: A Benchmark for Formal Theorem Proving Reward Models [0.0] 我々はtextbfFormalRewardBenchを紹介します。これはLean 4.0で証明された形式的定理で報酬モデルを評価するための最初のベンチマークです。
その結果,フロンティア LLM は最高性能 (59.8%) を達成し,特殊定理証明器は最低性能 (24.4%) を達成した。
textbfFormalRewardBenchを公開し、形式数学における報酬モデルの開発についてさらなる研究を奨励する。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:51:15 GMT)
Fast Training of Mixture-of-Experts for Time Series Forecasting via Expert Loss Integration [0.0] 本稿では,専門家の専門性を高めた時系列予測のための適応型Mixture-of-Experts(MoE)フレームワークを提案する。
全体的な目的は、基本的な予測損失と専門家特有の損失から成り、専門家レベルの予測エラーが共同でトレーニングを形作ることができる。
このフレームワークはさらに、部分的なオンライン学習戦略と組み合わせて、ゲーティングメカニズムとエキスパートパラメータの両方をインクリメンタルに更新することができる。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:33:02 GMT)
Fashion Florence: Fine-Tuning Florence-2 for Structured Fashion Attribute Extraction [0.0] ファッションフローレンス(Fashion Florence)は、衣服の画像から構造化された視覚特性を抽出するために微調整されたフローレンス2言語モデルである。
微調整データは、iMaterialist Fashionデータセット(228ラベル)から導出される。
ModelはHugging Face Spaceとしてデプロイされ、オープンソースのコスチュームレコメンデーションシステムであるLoomに統合されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 00:04:49 GMT)
Fairness vs Performance: Characterizing the Pareto Frontier of Algorithmic Decision Systems [0.0] 公正なアルゴリズム決定システムの設計には、影響のある個人に対して公平さでモデル性能のバランスをとる必要がある。
多目的最適化問題として意思決定を概念化し,二項予測に基づく意思決定問題の公平性を検討する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:04:27 GMT)
Fairness of Explanations in Artificial Intelligence (AI): A Unifying Framework, Axioms, and Future Direction toward Responsible AI [0.0] 機械学習アルゴリズムは、刑事司法、医療、信用、雇用など、高度な意思決定に使われている。
研究コミュニティは2つの独立した研究分野に答えている: インペラルゴリトミックフェアネス(英語版)、そして解釈可能な推論をターゲットとする説明可能なAI(英語版)(XAI)である。
この調査は、その交点における新しい盲点を特定し、マッピングする。これは、そのアウトプットにおける標準フェアネス基準をすべて満たし、そのエンフェレゾン化過程において極めて不公平であるモデルである。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:09:06 GMT)
Explanation-Aware Learning for Enhanced Interpretability in Biomedical Imaging [0.0] ポストホックな説明法は、サリエンシマップの形でモデル決定を可視化するために広く用いられている。
本稿では,説明の喪失設計と監督力の違いが,説明の空間的忠実度と予測性能に与える影響について分析する。
論文参考訳(メタデータ) (Mon, 11 May 2026 06:27:55 GMT)
Expander attention as exchange-correlation [0.0] この領域における永続的な課題は、正確性と計算コストの間のトレードオフである。
本稿では,拡張器グラフ変換器のアンサッツに基づく非局所XC近似の線形スケーリングを提案する。
その結果, 強い相関関係にある正の$mathrmH_4曲線が復元され, プランナー$mathrmH_4$に対して有望な結果が得られた。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:27:38 GMT)
Exact steady states of interacting driven dissipative fermionic systems with hidden time-reversal symmetry [0.0] 散逸性スピンレスフェルミオン系の非平衡定常状態に対する正確な解を示す。
この結果は、駆動散逸性フェルミオンモデルにおける隠れた時間反転対称性の存在を証明している。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:58:29 GMT)
Every finite group admits a just finite presentation [0.0] 有限群の有限表現 X | R > は、R から関係を取り除けば、無限群に対する表現となる。
我々はこの予想を肯定的に解決する。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:42:08 GMT)
Energy-Efficient Implementation of Spiking Recurrent Cells on FPGA [0.0] スパイキングニューラルネットワーク(SNN)は、スパイキングアクティビティがスパースであり、ニューロンモデルがハードウェアフレンドリーであるときに、エネルギー消費を減らすことができる。
本稿では,スパイキングリカレントセル(SRC)ニューロンを用いたSNN用FPGAアクセラレータを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:56:51 GMT)
Emergence of synthetic twist defects in the surface code under local perturbation [0.0] アベリア励起を持つ位相的に順序付けられた量子状態は、効果的な非アベリア統計に従う欠陥をホストすることができる。
モデルシステムにおける合成欠陥のスペクトル特性について数値解析を行った。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:54:01 GMT)
Efficient Neural Architectures for Real-Time ECG Interpretation on Limited Hardware [0.0] 本稿では,畳み込みニューラルネットワーク(CNN)アーキテクチャを実証的に研究し,診断精度と計算効率のトレードオフについて検討する。
本稿では,ParallelCNN,ParallelCNNew,SimpleNetの3つの軽量モデルを提案する。
我々の実験は、ドイツ、中国、米国から入手可能な12のECGデータセットを3つにまとめたものです。
論文参考訳(メタデータ) (Mon, 11 May 2026 01:02:28 GMT)
Efficient Hybrid CNN-GNN Architecture for Monocular Depth Estimation [0.0] 畳み込みエンコーダ・デコーダフレームワークにグラフニューラルネットワーク(GNN)を統合する単眼深度推定アーキテクチャであるGraphDepthを提案する。
我々のアプローチは、効率的なGraphSAGEレイヤをResNet-101 U-Netバックボーンの複数スケールに埋め込む。
NYU Depth V2、WHU Aerial、ETH3D、Mid-Airベンチマークの実験では、最先端のトランスフォーマーの4.6%で競合精度が示されている。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:21:04 GMT)
DynGhost: Temporally-Modelled Transformer for Dynamic Ghost Imaging with Quantum Detectors [0.0] ゴーストイメージングは、構造的照明パターンとスカラー強度の測定とを関連付けて、1ピクセルのバケット検出器から空間情報を再構成する。
既存のアーキテクチャはフレーム全体の時間的コヒーレンスを利用することができず、ダイナミックゴーストイメージングはほとんど未解決のままである。
我々は空間的および時間的注意ブロックの交互化による制限に対処するトランスフォーマーアーキテクチャDynGhostを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:37:51 GMT)
Don't Look at the Numbers: Visual Anchoring Bias and Layer-wise Representation in VLMs [0.0] アンカー効果は、画像品質の悪化よりも2.5倍大きく、バイアスが再現可能な視覚的変化ではないことを確認する。
層ワイドプローブ: 飽和飽和層(L12-L34)が品質予測に最適である層(R2 = 0.69-0.91)がより深い層(R2 = 0.69-0.91)
融合解析はアーキテクチャに依存した統合(L1-L2での即時核融合)を2つのモデルで定義する。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:31:18 GMT)
Do Vision-Language-Models show human-like logical problem-solving capability in point and click puzzle games? [0.0] 本稿では,人間の論理的問題解決能力を評価するためのベンチマークであるVision-Language Against The Incredible Machine (VLATIM)を紹介する。
既存のベンチマークとは異なり、VLATIMは特に高レベルの論理的推論と連続的なアクション空間の間の臨界ギャップをターゲットとしている。
その結果, 推論と実行の相違が明らかとなった。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:33:48 GMT)
Distributed estimation of many-body Hamiltonians via punctured surface code [0.0] 本研究では,曲面符号を用いて局所的な$Z$型結合を1つの保護論理信号に変換する方法について検討する。
本研究は,多体インタラクションのための新しいノイズロバスト分散センシングプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:01:28 GMT)
Distributed Quantum Circuit Optimisation: Evaluating Global and Local encodings [0.0] システムレベルのトレードオフの下で,回路最適化が分散量子ワークロードに与える影響について検討する。
グローバル最適化は、計算資源を最小化し、最小のコンパイルオーバーヘッドを達成する。
局所的な最適化は、明示的に通信に気付かなくても通信コストを削減できる。
ハイブリッド戦略は、計算オーバーヘッドと通信オーバーヘッドの両方を同時に削減できるが、コンパイル時間を大幅に増加させる。
論文参考訳(メタデータ) (Mon, 11 May 2026 09:07:55 GMT)
Dissecting Jet-Tagger Through Mechanistic Interpretability [0.0] 我々はTop Quark Tagging参照データセットに基づいてトレーニングされたParticle Transformerアーキテクチャの機械論的解釈可能性解析を行う。
ジェットの分類と内部表現の物理的内容の特徴付けに責任がある計算回路を同定する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:11:47 GMT)
Discovery of Interpretable Surrogates via Agentic AI: Application to Gravitational Waves [0.0] シミュレーションデータから直接解釈可能な解析サロゲートを構成する大言語モデル(LLM)ベースのワークフローである textttGWAgent を提案する。
物理インフォームド・ドメイン・アンサッツをエージェントに提供することにより,出力モデルの精度が大幅に向上することを示す。
その結果、解析的サロゲートは6.9times10-4$という中央値のLIGOミスマッチと、波形評価における$sim 8.4times$のスピードアップを達成した。
論文参考訳(メタデータ) (Mon, 11 May 2026 22:09:34 GMT)
Deep Learning under Fractional-Order Differential Privacy [0.0] 個人差分勾配降下(DP-SGD)は、プライバシ重み学習の標準的なアプローチである。
ガウスノイズが付加される前に、この現在のみのクエリを置き換えるメカニズムを提案する。
FO-DP-SGDは、プライベート最適化における長期記憶効果を研究するためのフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 02:29:13 GMT)
DREAMS: Modelling Support for Research into Engineering and Artistic Design [0.0] 本稿では、DRM参照モデルとインパクトモデルの作成と保守を支援するために開発された初期のプロトタイプ・モデリング環境であるDREAMSについて述べる。
レイアウトのサポートと検索機能を提供し、読みやすさ、変更性、サポート情報の検索を改善する。
本論文の貢献は、DRM対応モデリングサポートの要件を特定し、DREAMSの設計と実装を示し、モデリングの労力を削減し、DRMベースの研究におけるトレーサビリティを向上させる可能性を示すことである。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:24:05 GMT)
Cybercrime and Prevention: Colonel Blotto in Social Engineering [0.0] ソーシャルエンジニアリング攻撃ベクトル間の防御資源の最適配分を決定するために,Blotto大佐の2つのゲームモデルを開発した。
第一モデルでは、国家を擁護者として重視した最適な人口レベルの予防について検討し、3つの異なる国のユースケースを提示・比較する。
ここでは、異なる特徴を持つ組織を含む5つのユースケースを分析します。
論文参考訳(メタデータ) (Mon, 11 May 2026 15:54:10 GMT)
Crystallographic Symmetry Generates Phononic Holonomic Gates with Biased-Erasure Channels [0.0] ソリッドステートプロセッサは、エラーが量子エラー訂正デコーダに妥当な制御層を必要とする。
結晶対称性は、ひずみ活性Lambda多様体においてそのような層を提供できることを示す。
我々はLambda-leg制御と共振二重量子対ダイアバティックトーンを用いた超断熱式エコー-ルーンホロノミックゲートを構築した。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:58:27 GMT)
Correct-by-Construction G-Code Generation: A Neuro-Symbolic Approach via Separation Logic [0.0] 本稿では,GLLMが創造的生成器として機能し,SL Proverが決定論的検証器として機能する2成分アーキテクチャを提案する。
このシナジーは自己修正生成サイクルを確立し、手動による監視の必要性を減らす。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:38:51 GMT)
Controlled Zeno-Induced Localization of Free Fermions in a Quasiperiodic Chain [0.0] 我々は,測定誘起有効ポテンシャルを持つ瞬時シュルディンガー方程式に基づく解析的記述を開発する。
量子ゼノ状態において、創発的な支配的エネルギースケールは、有効非エルミートハミルトニアンの移動行列の定式化に問題を還元する。
本結果は, 実効的非エルミート記述とモニタリングされたダイナミックスとの関連性を裏付けるものである。
論文参考訳(メタデータ) (Mon, 11 May 2026 03:27:36 GMT)
Consciousness as Uncommon Self-Knowledge: A Synergistic Information Framework [0.0] 本稿では,意識の候補基準として,非共通自己認識(USK)を提案する。
本稿では,意識的処理のための形式的署名候補として,自己指向情報の相乗的成分を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:17:27 GMT)
Confidence-Guided Diffusion Augmentation for Enhanced Bangla Compound Character Recognition [0.0] 既存のBangla手書き文字認識システムは、様々な書体にまたがる一般化に苦慮している。
低分解能バングラ複合文字認識のための信頼誘導拡散拡張フレームワークを提案する。
我々の最高の性能モデルは89.2%の分類精度を達成し、AIBanglaベンチマークを上回りました。
論文参考訳(メタデータ) (Mon, 11 May 2026 17:51:46 GMT)
Computing eigenpairs of quantum many-body systems with Polfed.jl [0.0] Polfed.jlは、量子多体ハミルトニアンの中間スペクトル固有値と固有ベクトルを計算するためのオープンソースのアルゴリズムである。
このパッケージはフレキシブルエネルギーターゲティング、構造化ハミルトニアンのスペクトルマッピングの自動最適化、GPUアクセラレーションをサポートする。
我々の焦点は多体ハミルトニアンであるが、Polfed.jlはどんな大きなスパース行列にも適用できる。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:41:51 GMT)
Compositional Literary Primitives in Instruction-Tuned LLMs: Cross-Architectural SAE Features for Self, Style, and Affect [0.0] 文芸プリミティブの合成アーキテクチャを2つの命令調整された大言語モデルで特徴付ける。
4つの機能クラスが出現する: ターゲットの語彙トークンを促進するネーミングゲート、ファーストパーソンレジスタ機能の11セルフクラスタ。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:01:27 GMT)
Collective Alignment in LLM Multi-Agent Systems: Disentangling Bias from Cooperation via Statistical Physics [0.0] そこで,本研究では,本態性バイアスから社会的整合性を解き,臨界指数を計算し,マルチエージェントシステムの集合的挙動と相転移を探索するモデルに依存しない統計的物理法を提案する。
集合的アライメントは、協調的な隣り合う結合よりも本質的なバイアスによって支配され、真の相転移の代わりに場駆動のクロスオーバーを生成する。
論文参考訳(メタデータ) (Mon, 11 May 2026 13:13:44 GMT)
Coherency through formalisations of Structured Natural Language, A case study on FRETish [0.0] 形式化とは、システム要件を形式言語で記述するプロセスである。
本稿では,ホルマライゼーションによるコヒーレンシ(コヒーレンシー)の新たなガイドラインを提案する。
本稿では,NASA の形式的要求抽出ツール FRET を分析し,制御された自然言語 FRETish を MTL の形式言語に自動翻訳する手法を提案する。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:30:53 GMT)
ClinicalBench: Stress-Testing Assertion-Aware Retrieval for Cross-Admission Clinical QA on MIMIC-IV [0.0] 推論ベンチマークはクリーンインプットの臨床的パフォーマンスを測定する。
我々は, 否定, 時間性, 家族反対の帰属が正しい答えを誤ったものに戻すことができる, 実際の EHR ノートを検索することで, 推論の段階を評価する。
EpiKGは、アサーションラベルと時間性タグを患者の知識グラフに格納し、質問意図による検索をルーティングする。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:47:52 GMT)
Birds of a Feather Flock Together: Background-Invariant Representations via Linear Structure in VLMs [0.0] 我々は,前景オブジェクトとその背景との相関関係が,スプリアス依存関係の健全かつ事実上重要なクラスであることを示す。
合成データを用いて背景不変表現を構築するために,この特性を利用する事前学習手法を提案する。
我々の知る限り、最初の最悪のグループ精度は、完全な(100%)スプリアス相関の下で、Waterbirds上で90%以上である。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:13:05 GMT)
Beyond Topological Invariants: Order Parameters from Dominant Fock-state Patterns [0.0] 我々は,多体基底状態の支配的フォック状態から一般的なパターンを抽出し,秩序パラメータ(OP)を構築するための一般的なスキームを提案する。
これらのOPは相の深さを定量化し、混乱した系の遷移を特徴づける上で頑健なままである。
提示されたフレームワークは、多種多様な相互作用および非相互作用量子多体系の位相図を明らかにするために、広く適用可能なツールを提供する。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:18:45 GMT)
Beyond Similarity Search: Tenure and the Case for Structured Belief State in LLM Memory [0.0] クロスセッションメモリは状態管理の問題であり、検索の問題ではない。
テンチュアは、精度優先の検索を通じて、全てのLDMセッションにキュレートされたコンテキストを注入する。
論文参考訳(メタデータ) (Mon, 11 May 2026 23:22:36 GMT)
Berry's phase under topology change [0.0] 実数値固有関数を持つハミルトン群は、非自明な幾何学的ベリー位相を持つかもしれない。
非自明なベリー位相と位相変化の関連について論じる。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:26:26 GMT)
Benchmarking LLM-Based Static Analysis for Secure Smart Contract Development: Reliability, Limitations, and Potential Hybrid Solutions [0.0] 大規模言語モデル(LLM)はますます開発者に統合されているが、自律的なセキュリティ監査者としての信頼性はまだ証明されていない。
我々は、現在の生成モデルが従来の静的解析ツールの代替として有効なのか、それとも単なる補完に過ぎないのかを評価する。
以上の結果から, LLMの有効性は, 固有語彙バイアスと外部データ入力の厳密な検証の欠如によって損なわれていることが示唆された。
論文参考訳(メタデータ) (Mon, 11 May 2026 19:10:47 GMT)
BCJR-QAT: A Differentiable Relaxation of Trellis-Coded Weight Quantization [0.0] BCJR-QATは,温度$T$で,argmaxをBCJRの前方逆和積アルゴリズムに置き換える緩和法である。
我々は,BCJR-QATがWikiText-2上でQTIP-PTQを$mathbf-0.084$ PPLで上回ることを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:40:20 GMT)
Automated high-frequency quantification of fish communities and biomass using computer vision [0.0] 我々は,コンピュータビジョンを用いた水中映像から魚類群集を定量化するフレームワークを開発した。
このフレームワークは、カスタムメイドのステレオカメラシステムで取得したビデオを利用して、深層学習に基づく魚の識別、多目的追跡、そして3D再構成を統合する。
種組成の変化に伴う種多様性, 多量性, バイオマスの動的変動を明らかにするため, 日中観測による20日間のサンゴ礁の魚類群集にアプローチを適用した。
論文参考訳(メタデータ) (Mon, 11 May 2026 12:20:37 GMT)
Asymptotically Log-Optimal Bayes-Assisted Confidence Sequences for Bounded Means [0.0] ベイズ型動作予測モデルを用いて信頼性シーケンスを適応的に構築するベイズ支援フレームワークを提案する。
LLM評価のための合成データ、シーケンシャルベストアーム識別、および予測駆動推論の実験により、情報的事前は信頼性シーケンス幅とサンプリングの労力を大幅に削減できることが示された。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:33:25 GMT)
AniMatrix: An Anime Video Generation Model that Thinks in Art, Not Physics [0.0] AniMatrixは、物理的正確性ではなく芸術性を再定義するビデオ生成モデルである。
AniMatrixは、二重チャネルの条件付け機構と3段階の遷移によって、物理的な正確さよりも芸術性を目標としている。
プロのアニメーターによる5つの制作次元を持つアニメ固有の人間評価において、AniMatrixは5つ中4つにランクインしている。
論文参考訳(メタデータ) (Mon, 11 May 2026 07:22:43 GMT)
An input-output approach for giant atom scatterings beyond the dipole approximation [0.0] 巨大原子は、空間スケールが電磁波の波長に匹敵する人工物質構成である。
我々は、様々な高性能光量子デバイス、通常、巨大原子ベースの光量子スイッチは、巨大原子のファノ型散乱を工学的に生成できると主張している。
論文参考訳(メタデータ) (Mon, 11 May 2026 08:11:03 GMT)
An Annotation Scheme and Classifier for Personal Facts in Dialogue [0.0] 本稿では、既存のアプローチの制約に対処する個人的事実分類のための拡張アノテーションスキームを提案する。
提案手法では, 対話継続に適した記憶, 品質フィルタリング, 事実の識別が可能な新たなカテゴリ (Duration, Validity, Followup) と属性 (Duration, Validity, Followup) を導入する。
論文参考訳(メタデータ) (Mon, 11 May 2026 10:42:26 GMT)
Algorithmic Advantage on a Gate-Based Photonic Quantum Neural Network [0.0] 単一光子と確率ゲートで実装されたゲートベースの変分量子分類器。
我々は,2つの展開可能な量子ニューラルネットワーク(QNN)の表現力を,その有効次元の計算により評価する。
その結果、ゲートベースのQNNを現在のフォトニックハードウェア上で効果的に実現し、訓練できることが証明された。
論文参考訳(メタデータ) (Mon, 11 May 2026 16:27:45 GMT)
ASD-Bench: A Four-Axis Comprehensive Benchmark of AI Models for Autism Spectrum Disorder [0.0] ASD-Benchは、ML、ディープラーニング、基礎モデルの構成を3つの年齢コホートで評価する体系的なベンチマークである。
4,068 AQ-10レコードのキュレートされたv3データセットに適用する。
成人分類では,10/17モデルでF1とAUCを達成し,青年期ではF1天井0.837対0.915)が困難である。
論文参考訳(メタデータ) (Mon, 11 May 2026 18:01:21 GMT)
A density-matrix derivation of the Hartree--Fock equations in a nonorthogonal atomic-orbital basis [0.0] 第二量子化原子軌道密度行列式を用いたハートリー-フォック方程式の導出について述べる。
本研究の目的は、標準のAO Hartree-Fock定常条件が1粒子密度行列の指数的パラメトリゼーションから自然に従うことを示す別の導出を導入することである。
論文参考訳(メタデータ) (Mon, 11 May 2026 11:48:57 GMT)
A Stable Distance Persistence Homology for Dynamic Bayesian Network Clustering [0.0] 動的ベイズネットワークにおける変数の整理と時間的変化に関するトポロジ的アプローチを導入する。
DBGに永続ホモロジーを適用すると、強い依存変数の連結群の合併と消滅を記録するバーコードを生成する。
このことは、動的ベイズネットワークにおける依存性構造がどのように進化するかという、原理的かつ耐雑音的な要約をもたらす。
論文参考訳(メタデータ) (Mon, 11 May 2026 20:43:30 GMT)
A Single-Layer Model Can Do Language Modeling [0.0] 私たちは、その形が言語モデリングにどこまで達するかを尋ねます。
本研究では,各ステップ毎に1つの状態ベクトルを1つの再帰ブロックで再帰するグラウンドド予測ネットワーク(GPN)を提案する。
130Mパラメータにおいて、1層GPN+Mは、12層トランスフォーマー++の13%(16.05)、10層GPNの18%(15.34)の範囲で、FineWeb-Eduパープレキシティ18.06に達する。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:31:24 GMT)
A Random-Matrix Criterion for Initializing Gated Recurrent Neural Networks [0.0] 貯水池計算」では、貯水池の重量は線形に学習され、貯水池の重量は固定され、結果として生じる力学の豊かさ、安定性、記憶を決定づける。
無限幅の極限において、有意義な初期化はランダム層モデルの有効臨界点に位置するものであることが示されている。
ここでは,広範囲の繰り返しアーキテクチャに対して臨界$g_c$を推定するための簡単な基準を導出し,ゲート-RNN貯水池がカオス予測タスクにおいてピーク性能を達成する際の利益を密に追跡することを示す。
論文参考訳(メタデータ) (Mon, 11 May 2026 14:35:22 GMT)
A Proof-of-Concept Simulation-Driven Digital Twin Framework for Decision-Aware Diabetes Modeling [0.0] 本稿では,シミュレーション駆動型糖尿病モデリングのための概念実証用デジタルツインフレームワークを提案する。
従来の予測モデルとは異なり、このフレームワークは解釈可能なシミュレートされた軌道を生成することに焦点を当てている。
論文参考訳(メタデータ) (Mon, 11 May 2026 21:10:18 GMT)
A Multi-Interface Firmware Acquisition and Validation Methodology for Low-Cost Consumer Drones: A Case Study on Three Holy Stone Platforms [0.0] 本稿では,HSD175,HS720,360360の3種類のホリデーストーン消費者向けドローンモデルに適用可能なファームウェア抽出と検証について述べる。
この研究は、リバースコストの成果を追求するのではなく、商業的に利用可能な低価格ツールのみを使用して、信頼性の高い地味なファームウェア画像を取得することに焦点を当てている。
論文参考訳(メタデータ) (Mon, 11 May 2026 05:28:38 GMT)