Achieving Gold-Medal-Level Olympiad Reasoning via Simple and Unified Scaling [108.5] 訓練後,背骨を厳密なオリンピックレベル解法に変換するためのシンプルで統一的なレシピを紹介した。
約340Kのサブ8K軌道上でSFTで30B-A3Bのバックボーンをトレーニングし,200RLステップを行った。
結果として得られるモデル SU-01 は、100Kトークンを超える軌道上の難しい問題に対する安定な推論をサポートする。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:13:26 GMT)
Understanding and Accelerating the Training of Masked Diffusion Language Models [104.6] マズード拡散モデル(MDM)は、言語モデリングのための自己回帰モデル(ARM)に代わる有望な代替品として登場した。
最終性能を維持しながら、標準MDMトレーニングを加速する方法を示す。
また、様々なベンチマークにおいて、生成パープレキシティ、ゼロショットパープレキシティ、ダウンストリームタスク性能の高速化を示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:29:38 GMT)
The Efficiency Gap in Byte Modeling [101.2] 2つの代替パラダイムは、サブワードトークン化と自己回帰順序付けの使用に挑戦している。
これらの構造的先行性を取り除くことは、計算コストを著しく削減することを示します。
この結果から, 将来のモジュラリティ非依存設計は, 拡張軌道を維持するために, 代替構造バイアスを組み込まなければならないことが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:03:30 GMT)
OmniLiDAR: A Unified Diffusion Framework for Multi-Domain 3D LiDAR Generation [100.4] 本稿では,8つの代表領域にまたがる共有範囲画像表現において,LiDARスキャンを生成する統一テキスト条件拡散フレームワークを提案する。
パブリックな統合ベンチマークがなければ、実世界のスキャンと物理ベース気象シミュレーションとシステマティックビームリダクションを組み合わせた8ドメインデータセットを構築する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:42:20 GMT)
Learning to See What You Need: Gaze Attention for Multimodal Large Language Models [96.2] 本稿では,世代別タスク関連視覚領域へのMLLMの選択的参加を可能にする新しいメカニズムであるGaze Attentionを紹介する。
注意計算では、視線KVエントリが最大90%少ないのに対して、視線アテンションは高密度アテンションベースラインと一致または超過していることが示される。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:54:09 GMT)
Teacher-Guided Policy Optimization for LLM Distillation [90.5] Teacher-Guided Policy Optimization (TGPO) は、生徒のロールアウトに条件付き教師予測を活用することで、高密度な方向性誘導を取り入れたオンラインアルゴリズムである。
複雑な推論ベンチマークの実験では、TGPOは標準ベースラインを著しく上回り、異なる教師にとって堅牢であることが示されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:20:03 GMT)
Enhancing a Risk Model by Adding Transient Statistical Factors [90.4] 資産収益の推定は、金融ポートフォリオの構築と評価の鍵となる要素である。
既存の因子モデルを強化するために,最大推定値に基づく体系的手法を提案する。
提案した拡張は,元のモデルに欠落したリターンの構造をキャプチャすることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:15:24 GMT)
HarmoGS: Robust 3D Gaussian Splatting in the Wild via Conflict-Aware Gradient Harmonization [82.4] In the-the-wild 3D Gaussian Splattingは、過渡的乱れと照明による視界不整合のため、依然として困難である。
本稿では、画像空間の監督と勾配レベルの最適化の両方からこの問題に対処するコンフリクト対応3DGSフレームワークを提案する。
本手法は,複雑な過渡トラクタとクロスビューの不整合の下で,最先端のレンダリング品質を実現する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:47:09 GMT)
PairDropGS: Paired Dropout-Induced Consistency Regularization for Sparse-View Gaussian Splatting [82.0] ドロップアウトに基づくスパースビュー3DGS法は、トレーニング中にガウス原始体をランダムに抑制することで過度な適合を緩和する。
PairDropGS, Paired Dropout-induced Consistency Regularization framework for sparse-view Gaussian splattingを提案する。
PairDropGSはトレーニングの安定性が向上し、既存のドロップアウトベースの3DGS手法よりも再現性が高いことが、広く使用されているスパースビューベンチマークで実証された。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:39:31 GMT)
PDCR: Perception-Decomposed Confidence Reward for Vision-Language Reasoning [80.9] Reinforcement Learning with Verifiable Rewards (RLVR) は伝統的に、粗末で結果に基づく信号に依存している。
近年の研究では,高コストな外部モデルを必要としないステップレベルのガイダンスを提供することで,詳細なモデル固有の信号を提供することで,言語推論のトレーニングを効果的に向上することが示された。
一助文には有効であるが,この大域的な報酬を視覚言語推論(V-L)に適用することは準最適戦略である。
本稿では、報酬構造とタスクの不均一な性質を整合させることにより、この問題を解決するフレームワークであるパーセプション分解信頼回復(PDCR:Perception-Decomposed Confidence Reward)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:55:18 GMT)
STRIDE: Learnable Stepwise Language Feedback for LLM Reasoning [80.8] 我々はSTRIDEと呼ばれる言語駆動の段階的軌道リダイレクトを提案する。
我々は、結果に基づく報酬のみを使用して生成器と生成検証器を共同で訓練し、外部アノテーションを除去する。
様々な推論ベンチマークの実験では、STRIDEが最先端のベースラインを大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:04:31 GMT)
EvolveMem:Self-Evolving Memory Architecture via AutoResearch for LLM Agents [80.6] 本稿では,自己進化型メモリアーキテクチャであるEvolveMemについて述べる。
このクローズループの自己進化はAutoResearchプロセスを実現している。システムは自力で独自のアーキテクチャ上で反復的な研究サイクルを実行し、手動構成のチューニングを置き換える。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:12:44 GMT)
F-GRPO: Factorized Group-Relative Policy Optimization for Unified Candidate Generation and Ranking [79.5] 大規模言語モデル(LLM)はサブセットを生成し、それを1つの自己回帰パス内で順序付けることができる。
この柔軟性は、新しい最適化課題をもたらす: モデルが出力空間を検索し、完全なランクリストが生成された後にのみユーティリティフィードバックを受けなければならない。
このクレジット割り当てギャップは、エンドツーエンドの最適化を不安定にし、サンプル非効率にする。
本稿では,単一自己回帰的ロールアウト内の両方を実行する統一フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:52:33 GMT)
Phy-CoSF: Physics-Guided Continuous Spectral Fields Reconstruction and Super-Resolution for Snapshot Compressive Imaging [79.4] 暗黙のニューラル表現で深層展開ネットワークを相乗化するPhy-CoSFを提案する。
具体的には、連続的なスペクトルレンダリングで離散波長トレーニングをブリッジする2相アーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:17:02 GMT)
Aligning Network Equivariance with Data Symmetry: A Theoretical Framework and Adaptive Approach for Image Restoration [71.5] 画像復元は本質的に逆問題である。
非厳密対称性を制約として、復元逆問題を定式化する。
最適復元演算子の等値誤差はデータ対称性誤差と離散化メッシュサイズによって厳密に制限されていることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:22:19 GMT)
AnyFlow: Any-Step Video Diffusion Model with On-Policy Flow Map Distillation [70.8] フローマップをベースとした,最初のノンステップビデオ拡散蒸留フレームワークであるAnyFlowを紹介した。
我々は、AnyFlowがいくつかの段階において、パフォーマンスの一致を達成するか、一貫性ベースの結果を上回ることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:06:34 GMT)
PVRF: All-in-one Adverse Weather Removal via Prior-modulated and Velocity-constrained Rectified Flow [69.4] そこで本研究では,ゼロショット型軟弱感と速度制約付き整流補正を統合した統合フレームワークを提案する。
PVRFは、最先端のベースラインよりも忠実さと知覚品質の両方を改善する。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:07:14 GMT)
Strategic PAC Learnability via Geometric Definability [69.3] 戦略分類は、個人が分類者の判断に影響を与えるために、コストで特徴を修正できる学習環境を研究する。
中心的な問題は、帰納的(戦略的な)仮説クラスのサンプルの複雑さが、基礎となる仮説クラスの複雑さと、実現可能な操作を管理するコスト構造にどのように依存するかである。
仮説クラスとコスト誘起近傍関係は、$mathbbR_mathtexp$上の一階式で定義することができる。
難易度は, 複雑度によって制御され, 学習性は維持されていることを証明した。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:21:56 GMT)
N-vium: Mixture-of-Exits Transformer for Accelerated Exact Generation [68.5] N-vium (N-vium) は、標準ハードウェア上での計算を部分的に並列化する変圧器である。
N-Viumは複数の深さで予測ヘッドを付加し、次のトーケン分布をこれらの出口上の学習混合物として定義する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:46:17 GMT)
FORTIS: Benchmarking Over-Privilege in Agent Skills [68.3] 2段階にわたるエージェントスキルの過剰な特権を評価するベンチマークを提案する。
過剰に特権化された行動は例外ではなく規範であることがわかった。
その結果、エージェント動作を含むスキル層は、それ自体が現在のシステムにおける特権エスカレーションの主要な源であることを示唆している。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:09:23 GMT)
BOOKMARKS: Efficient Active Storyline Memory for Role-playing [67.9] BookMARKSはロールプレイングエージェントのための検索ベースのメモリフレームワークである。
現在のタスクに対するタスク関連ブックマークを積極的に初期化し、維持し、更新する。
BookMARKSは16のアーティファクトから85文字のRPAメモリベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:48:24 GMT)
Neural Video Compression with Domain Transfer [67.2] DCVC-DTはドメイン転送強化ニューラルビデオ圧縮フレームワークである。
本研究では,品質変動に基づく損失におけるRとDの比を積極的に制御するフレームレベルの動的RD(Rate and Distortion)調整手法を開発した。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:02:40 GMT)
UniCustom: Unified Visual Conditioning for Multi-Reference Image Generation [65.5] VLMエンコーディングの前にVTとVAE機能を融合した統合ビジュアルコンディショニングフレームワークを提案する。
2つのマルチ参照生成ベンチマークの実験により、UniCustomは主題の一貫性、命令従順、構成の忠実さを一貫して改善することを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:41:37 GMT)
Rethinking Event-Based Object Dtection through Representation-Level Temporal Aggregation and Model-Level Hypergraph Reasoning [65.1] イベントカメラはマイクロ秒レベルの時間分解能、低レイテンシ、高ダイナミックレンジを提供する。
Event Dual Temporal-Relational Aggregation Detector (Ev-DTAD)は、表現レベルの時間エンコーディングとモデルレベルの時間-ハイパーグラフ推論を統合する。
Ev-DTADは、コンパクトな時間的表現と時間的ハイパーグラフの特徴的推論の相補性を検証し、競争精度と効率のトレードオフを実現する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:14:37 GMT)
Towards Robotic Dexterous Hand Intelligence: A Survey [64.4] ロボットの手は、ハードウェア、センサー、制御、シミュレーション、データ生成の進歩によって急速に進歩する。
既存の研究はしばしば、手作業の具体化、感覚設定、タスク設定、トレーニングデータ、評価プロトコルに関する様々な仮定の下で開発されている。
本調査は, 4つの相補的な側面から, 器用な手の研究を概観する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:23:17 GMT)
Building Interactive Real-Time Agents with Asynchronous I/O and Speculative Tool Calling [64.4] 複雑なマルチターンツール呼び出しを行うエージェントに対してもリアルタイムなインタラクションを実現することを目的としている。
本稿では,Asynchronous I/Oを提案する。これはコアエージェントの理と作用のスレッドを,追加情報を待つことから切り離すものだ。
また,エージェントが完全な情報を受け取っている場合のタスク実行を管理する手法として,投機的ツール呼び出しを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:20:52 GMT)
Training Long-Context Vision-Language Models Effectively with Generalization Beyond 128K Context [64.1] 本稿では,LVLMの長期継続事前学習に関する体系的研究について述べる。
まず、長文書VQAはOCR転写よりかなり効果的であることを示す。
MMProLongは,Qwen2.5-VL-7Bの長文継続事前学習で得られる5Bの予算しか持たない。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:52:53 GMT)
MAPLE: Latent Multi-Agent Play for End-to-End Autonomous Driving [62.4] 視覚言語-アクション(VLA)モデルは、エンドツーエンドのモーションプランナーとして有効であるが、クローズドループ設定で評価すると不安定である。
本稿では, VLAモデルの潜在空間における動的駆動シナリオの, リアクティブでマルチエージェントなロールアウトのための新しいフレームワークMAPLEを提案する。
MAPLEはBench2Driveで最先端の駆動性能を実現し、堅牢なE2E自動運転システムのためのスケーラブルでクローズループなマルチエージェントプレイを実演する。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:35:14 GMT)
Qwen-Image-VAE-2.0 Technical Report [62.2] Qwen-Image-VAE-2.0, a suite of High-compression Variational Autoencoders (VAEs)について述べる。
Qwen-Image-VAE-2.0は、汎用ドメインとテキストリッチシナリオの両方において、高い圧縮比で例外的な機能を示す、最先端の再構築性能を実現する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:04:56 GMT)
PnP-Corrector: A Universal Correction Framework for Coupled Spatiotemporal Forecasting [62.2] 既存の手法は複雑なエラーのボトルネックによって厳しく制約されている。
我々は-Cast-Corrector (Plug-and-Play Corrector)と呼ばれる普遍的なフレームワークを提案する。
本手法は,結合予測システムの長期安定性を著しく向上させる。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:11:30 GMT)
Unifying Physically-Informed Weather Priors in A Single Model for Image Restoration Across Multiple Adverse Weather Conditions [61.3] 気象関連アーティファクトは、確立されたシーンの可視性分析により、粒子とカメラの距離によって異なる。
既存の手法では、この気象特有の物理的な視覚過程を考慮できない。
本稿では,個々の可視粒子と霧状凝集散乱効果を考慮した統合イメージングモデルを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:22:23 GMT)
DiM\textsuperscript{3}: Bridging Multilingual and Multimodal Models via Direction- and Magnitude-Aware Merging [60.7] 方向認識型マルチモーダルマージ(DiM3)を提案する。
LLaVAとQwenベースのバックボーンをまたいだ57言語をカバーする、テキストのみおよびビジョン言語設定のマルチ言語ベンチマークの実験。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:50:54 GMT)
Decoupled and Divergence-Conditioned Prompt for Multi-domain Dynamic Graph Foundation Models [59.9] 分離および分散条件付きプロンプトに基づく動的グラフ基礎モデルであるDyGFMを提案する。
DyGFMは、ノード分類とリンク予測の両方において、12の最先端のベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:50:03 GMT)
Pareto-Guided Optimal Transport for Multi-Reward Alignment [59.8] 我々は、不均一な報酬上限の下で、統一されたグローバルターゲットに対して最適化する方法を示す。
我々は、様々な報酬信号特性に合わせたオンラインとオフラインの最適化戦略を開発した。
提案手法は, 関節支配率(JDR)が11%向上し, 人体評価において約80%の勝利率を達成した。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:19:48 GMT)
ClawForge: Generating Executable Interactive Benchmarks for Command-Line Agents [59.6] textbfClawForgeは、ステートコンフリクト下で実行可能なコマンドラインカテゴリのためのジェネレータベースのベンチマークフレームワークである。
私たちはこのフレームワークをClawForge-Bench(17のシナリオ、6の能力カテゴリ)としてインスタンス化します。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:34:08 GMT)
Many-Shot CoT-ICL: Making In-Context Learning Truly Learn [58.4] In-context Learning (ICL)は、パラメータを更新せずにプロンプト内のデモを条件にすることで、大きな言語モデルを新しいタスクに適応させる。
提案手法は,標準のマルチショット・ルールが転送されないことを示すために,マルチショット・チェーン・オブ・コンテクスト・ラーニング(CoT-ICL)について検討する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:30:12 GMT)
Good Agentic Friends Do Not Just Give Verbal Advice: They Can Update Your Weights [58.3] マルチエージェントLLMシステムは、通常自然言語メッセージを交換することで協調する。
送信者のメッセージを受信者のコンテキストに付加する代わりに、送信者の隠された状態を過渡的で受信者固有の重み摂動にコンパイルする。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:58:32 GMT)
Aligning LLM Uncertainty with Human Disagreement in Subjectivity Analysis [57.8] 我々は、モデルが人間の不一致を反映した不確実性を表現しながら予測する不確実性を考慮した主観性分析を提唱する。
この視点を運用するために,二相認識と不確実性アライメントの枠組みを提案する。
3つの主観的分析課題の実験は、DPUAが人間の不一致とモデルの不確実性をよりよく整合させながら、タスク性能を保っていることを示している。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:41:26 GMT)
Rethinking Efficient Graph Coarsening via a Non-Selfishness Principle [56.9] 粗大化における近隣住民の集団干渉を優先する非利己的原則を提案する。
局所等方性仮定に基づいて、O(dot d)干渉評価をO(d)に還元する高速なNOPE*を導出する。
粗いグラフの学習は、元のグラフに匹敵する性能を示し、LLMベースのグラフ推論よりも優れた性能を示すことができる。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:24:35 GMT)
How to Interpret Agent Behavior [56.6] 本稿では,エージェントの動作を実行時に記述・解析するための分類法であるACT*ONOMYを紹介する。
共用語彙を提供することで、ACT*ONOMYは研究者、エージェントデザイナー、エンドユーザーがエージェントの振る舞いをより一貫して解釈するのに役立つ。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:52:40 GMT)
Self-Consistent Latent Reasoning: Long Latent Sequence Reasoning for Vision-Language Model [56.2] SCOLAR(Self-Consistent LAtent Reasoning)は、1枚のショットで補助的な視覚トークンを生成する軽量なデコンバータを導入している。
SCOLARは許容遅延CoT長を30ドル以上延長し、実世界の推論ベンチマークでオープンソースモデルの間で最先端を実現している。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:23:44 GMT)
ChipMATE: Multi-Agent Training via Reinforcement Learning for Enhanced RTL Generation [55.9] ChipMATEは、RTL生成のための最初の自己学習型マルチエージェントフレームワークである。
ChipMATEは産業的な実践に触発され、VerilogエージェントとPythonのリファレンスモデルエージェントをペアにし、相互に出力を検証する。
ChipMATEは、VerilogEval V2で75.0%と80.1%パス@1を4Bと9Bベースモデルで達成している。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:04:21 GMT)
Ego2World: Compiling Egocentric Cooking Videos into Executable Worlds for Belief-State Planning [55.4] Ego2Worldは、エゴセントリックな調理動画を、グラフ遷移ルールによって管理される実行可能な象徴的世界に変換する実行可能なベンチマークである。
評価中、シミュレータは隠された世界グラフを保持し、エージェントはローカルな観測と実行フィードバックのみを使用して、独自の部分的信念グラフを計画する。
この分離により、エージェントは真の世界の状態を観察することなく、メモリとリプランを更新せざるを得なくなる。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:53:15 GMT)
On-Policy Distillation with Best-of-N Teacher Rollout Selection [54.9] 本報告では, オンライン蒸留のためのベスト・オブ・Nロールアウト教員選抜フレームワークBRTSを提案する。
BRTSは、教師軌道から構築された教師コンテキスト管理ブランチで、標準の学生コンテキストOPDを強化する。
BRTSは、挑戦的な推論ベンチマークにおいて、標準的なPDよりも改善されており、より難しいデータセットに対して最大の利益がある。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:08:23 GMT)
Scale-Sensitive Shattering: Learnability and Evaluability at Optimal Scale [54.7] 実数値関数クラスが一様収束と学習可能性を示す最適尺度について検討する。
本研究の主な成果は,PAC学習の基本定理のスケール敏感な一般化である。
また、定量的サンプルの複雑さと評価可能性に関するオープンな質問をいくつか取り上げる。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:41:30 GMT)
TMPO: Trajectory Matching Policy Optimization for Diverse and Efficient Diffusion Alignment [52.6] 本稿では,報酬を人間レベルの報酬分布マッチングに置き換えるトラジェクティブマッチングポリシバランス最適化(TMPO)を提案する。
TMPOは最先端の手法に対する生成的多様性を9.1%向上させ、下流および効率の指標で競合性能を達成する。
大規模フロープレフィックスのマルチトラックトレーニング時間を短縮するため、TMPOはDynamic Tree Smplingモデルを導入し、動的にスケジュールされたステップでトラジェクトリがdenoisingとブランチを共有する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:00:49 GMT)
Beyond Localization: A Comprehensive Diagnosis of Perspective-Conditioned Spatial Reasoning in MLLMs from Omnidirectional Images [52.5] MLLM(Multimodal Large Language Models)は、視覚的知覚が強いが、視点の変化による空間の推論には限界がある。
本研究では、この課題を全方位360度画像におけるパースペクティブ・コンディションド・スペース・推論(PCSR)として検討する。
我々は2,600全方位画像から84,373組の質問応答対の診断ベンチマークであるPCSR-Benchを紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:40:59 GMT)
Discovery of Hidden Miscalibration Regimes [52.5] モデルは何らかの入力を体系的に過信し、他人を過信することがある。
対応する誤校正分野を定義し,それを推定するための診断フレームワークを提案する。
提案手法は,入力空間のキャリブレーションを意識した表現を学習し,学習幾何学におけるカーネルの平滑化による符号付き局所的誤校正を推定する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:07:50 GMT)
Gradient-Free Noise Optimization for Reward Alignment in Generative Models [52.4] ZeNOは、経路積分制御問題としてノイズ最適化を定式化する、勾配のないフレームワークである。
効果的な推論時間スケーリングを可能にし、多様なジェネレータと報酬関数間で強力なパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:43:07 GMT)
Learning POMDP World Models from Observations with Language-Model Priors [52.1] 部分的に観測可能なマルコフ決定プロセス(POMDP)は、内部世界モデルのための柔軟なモデリングクラスを提供する。
先行知識を活用することで,言語モデルがコストのかかる相互作用を低減できるかどうかを問う。
我々は,emphPinductor が LLM ベースの POMDP 学習手法の性能とサンプル効率に一致することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:18:15 GMT)
PRISM: Prior Rectification and Uncertainty-Aware Structure Modeling for Diffusion-Based Text Image Super-Resolution [52.0] PRISMは単一ステップ拡散ベースのText-SRフレームワークである。
PRISMはミリ秒レベルの推論で最先端の性能を達成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:31:06 GMT)
DataMaster: Data-Centric Autonomous AI Research [52.0] タスク条件付き自律データエンジニアリングについて検討し、エージェントがデータ側のみを最適化することで、固定学習アルゴリズムを改善する。
木構造検索,共有候補データ,累積メモリを統合したデータエージェントフレームワークであるDataMasterを提案する。
MLE-Bench LiteとPostTrainBenchの2種類のベンチマークでDataMasterを評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:12:44 GMT)
Always Learning, Always Mixing: Efficient and Simple Data Mixing All The Time [51.7] OP-Mixは、言語モデルトレーニングライフサイクル全体にわたって動作するデータミキシングアルゴリズムである。
プレトレーニングでは、OP-Mixは平均パープレキシティの6.3%を混合することなくトレーニングを改善できる。
連続学習では、OP-Mixは再学習とオンライン蒸留の両方のパフォーマンスを66%、全体の95%で比較した。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:29:19 GMT)
The Mechanism of Weak-to-Strong Generalization: Feature Elicitation from Latent Knowledge [51.6] Weak-to-strong(W2S)の一般化は、AIシステムの整合性に対するアプローチとして提案されている。
We study W2S in the setting of reward-model learning with two-layer neural network。
本研究は,本モデルが課題$$を効率よく学習し,汎用性を維持しつつ,事前学習した知識を抽出することを証明する。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:35:58 GMT)
Q-Flow: Stable and Expressive Reinforcement Learning with Flow-Based Policy [51.3] Q-Flowは、フローダイナミクスの決定論的性質を利用して、ポリシーによって引き起こされるフローに沿って遅延状態を明確に伝播するフレームワークである。
OGBenchスイートのオフライン学習環境でのQ-Flowの評価では,最先端のベースラインを平均10.6ポイント上回っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:31:02 GMT)
Learning to Foresee: Unveiling the Unlocking Efficiency of On-Policy Distillation [51.2] OPDの効率は、トレーニングの初期段階において最終モデルに向けた安定的な更新軌道を確立する、フォレスト・オブ・ザ・イヤーズ(foresight')の形式に起因している、と我々は主張する。
我々は、外挿ステップのサイズを適応的に選択し、現在の更新方向に沿って移動することにより、OPDを高速化するプラグイン・アンド・プレイ・アクセラレーション手法である textbfEffOPD を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:15:00 GMT)
Metis: Learning to Jailbreak LLMs via Self-Evolving Metacognitive Policy Optimization [51.1] 我々は、推論時ポリシー最適化としてジェイルブレイクを改定するフレームワークであるMetisを紹介する。
メティスは比較手法の中でも89.2%で最強のアタック成功率(ASR)を達成している。
冗長な探索を最適化に置き換えることで、Metisはトークンコストを平均8.2倍、最大11.4倍に削減する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:37:35 GMT)
R-DMesh: Video-Guided 3D Animation via Rectified Dynamic Mesh Flow [50.9] 動画誘導3Dアニメーションは、動的資産の直感的かつ正確な制御を提供するコンテンツ制作の可能性を秘めている。
現実のシナリオでは、ユーザーが提供するビデオの最初のポーズは、参照ビデオの開始フレームとほとんど一致しない。
ビデオコンテキストに合わせて高忠実度4Dメッシュを生成するためのフレームワークであるR-DMeshを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:58:13 GMT)
Skill-Aligned Annotation for Reliable Evaluation in Text-to-Image Generation [50.9] テキスト・ツー・イメージ(T2I)生成は急速に進歩し、モデル間の性能差が狭まるにつれて信頼性の高い評価が重要になった。
既存の評価慣行は、通常、Likert-scale や binary question answering (BQA) のような一様アノテーション機構を適用している。
我々は,T2I評価を,各評価スキルの根底にある特徴を反映したアノテーション戦略のレンズを通して再検討する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:14:31 GMT)
HIR-ALIGN: Enhancing Hyperspectral Image Restoration via Diffusion-Based Data Generation [50.5] ハイパスペクトル画像(HSI)の復元は、ノイズ、ぼかし、分解能損失などの劣化に悩まされるため、信頼性の高い解析に不可欠である。
本稿では,HIR-ALIGNを提案する。HIR-ALIGNは,限られたトレーニング画像と,ターゲット分布と密に一致した合成データとを付加して,ハイパースペクトル画像の復元を促進するための,プラグアンドプレイのターゲット適応型拡張フレームワークである。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:14:13 GMT)
Does Engram Do Memory Retrieval in Autoregressive Image Generation? [50.3] 本研究では,Engramモジュールを2次元空間的$n$-gramハッシュ,ゲート融合,KV-cache互換インクリメンタル推論で視覚に適応させる。
ゲート・クランプ・スイープは、エングラムの経路を完全に無効にすることは破滅的であることを示している。
ドナープローブ実験により、一致した、逆数的な、あるいはランダムな同一クラスの例にハッシュ入力を交換すると、統計的に区別不能な次トーケン分布が生じることが示された。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:40:46 GMT)
WinDeskGround: A Benchmark for Robust GUI Grounding in Complex Multi-Window Desktop Environments [50.0] MLLM (Multimodal Large Language Models) はGUIの自動化に革命をもたらしたが、その効果は理想化された単一層インタフェースでほぼ確立されている。
本稿では,最先端のエージェントが現実のデスクトップ環境において,異なる課題に直面しているという,重要な信頼性ギャップを明らかにする。
我々はGUI基盤の堅牢性を評価するための新しいベンチマークと合成フレームワークであるWinDeskGroundを紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:48:52 GMT)
MDL-GBG: A Non-parametric and Interpretable Granular-Ball Generation Method for Clustering [49.9] 既存のグラニュラーボール生成法は、主に手作り品質対策と分割または停止基準によって駆動される。
本稿では,クラスタリングのための非パラメトリックかつ解釈可能なグラニュラーボール生成法である,最小記述長に基づくグラニュラーボール生成(MDL-GBG)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:17:56 GMT)
RAG-Enhanced Large Language Models for Dynamic Content Expiration Prediction in Web Search [49.7] 商用ウェブ検索では、情報の寿命が非常に多様であるため、コンテンツの鮮度とユーザ意図の整合性は依然として困難である。
伝統的な産業的アプローチは静的なタイムウインドウフィルタリングに依存しており、結果として、コンテンツが時系列的に最新のが意味論的に期限切れになる「ワンサイズフィット」ランキングが作られる。
本フレームワークは,文書から詳細な時間的コンテキストを抽出し,クエリ固有の「妥当性水平線」を導出する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:20:28 GMT)
The Expressivity Boundary of Probabilistic Circuits: A Comparison with Large Language Models [49.7] 自己回帰型言語モデリングにおいて、確率回路(PC)はTransformer-based large language model(LLM)より遅れている
構造化分解可能なPCは, 変圧器分離ランクをvtree整列パーティションに合わせることができるが, この容量は固定されたルーティング構造に整列したパーティションに限られる。
さらに、分解可能なPCは構造化された分解可能なPCよりも厳密に表現可能であることを証明していますが、効果的に最適化することはオープンな課題です。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:22:10 GMT)
Switching Successor Measures for Hierarchical Zero-shot Reinforcement Learning [49.2] 我々は、強化学習における階層的制御を可能にする後継尺度である切替後継尺度を導入する。
後継策の切り替えは,その構造を保ちながら,古典的後継措置から自然に生じることを示す。
FB$-Switchは非階層的ベースラインよりも改善されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:58:33 GMT)
Prefix Teach, Suffix Fade: Local Teachability Collapse in Strong-to-Weak On-Policy Distillation [49.1] オンライン蒸留は、より強い教師からの強いフィードバックを使って、学生モデルを独自のロールアウトで訓練する。
我々は、この原則を軌跡固有のリリースルールで運用する。
強弱蒸留作業による実験結果から, この放出規則は標準全軌道PDよりも一貫して優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:05:30 GMT)
MoCam: Unified Novel View Synthesis via Structured Denoising Dynamics [49.1] 幾何学的先行は空間的アライメントを提供するが、ビューの変化の下ではスパースになり不正確なものとなる。
既存の手法は、生成を通して幾何学的誤差を伝播させるか、静的に両者を融合させるときに信号の衝突に悩まされる。
幾何から外見への協調的な進行をオーケストレーションするために、構造化されたデノナイジングダイナミクスを利用するMoCamを紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:49:16 GMT)
CRePE: Curved Ray Expectation Positional Encoding for Unified-Camera-Controlled Video Generation [49.0] カメラコンディショニング映像生成のためのレイ期待位置制御(CrePE)を提案する。
CREPEは、各画像トークンをソース線に沿った奥行き認識位置分布として表現し、広角カメラや魚眼カメラによって誘導される投影された経路形状を捉えている。
デザインは、より安定したカメラコントロールをもたらし、幾何認識と知覚品質のメトリクスを改善します。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:18:26 GMT)
When is Warmstarting Effective for Scaling Language Models? [48.7] 本研究は,ベースモデルの初期成長後の性能を維持することが,最終段階の強靭な性能に必要ではないことを示す。
我々は、スクラッチからのトレーニングがより効率的である以上、成長係数$g$の上限を経験的に特定する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:00:11 GMT)
GAMBIT: A Three-Mode Benchmark for Adversarial Robustness in Multi-Agent LLM Collectives [48.5] GAMBITは、インポスタ検出器を評価するための3つの評価モードと2つの独立したスコアを持つベンチマークである。
ベンチマークには、240の共進化型インポスタ戦略にまたがる27,804のラベル付きインスタンスのデータセットが付属している。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:49:42 GMT)
LMPath: Language-Mediated Priors and Path Generation for Aerial Exploration [48.5] 我々は,無人航空機(UAV)探索ミッションにおいて,言語経由の探索先を生成するパイプラインLMPathを提案する。
基本的なジオフェンスと関心の対象が与えられた後、LMPathは生成言語モデルを使用して環境のどの領域にそのオブジェクトを含むべきかを決定する。
その能力を実証するために、LMPathを使用して様々なUAVパスを生成し、大規模環境上で実際のUAVを使用して実行しました。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:02:51 GMT)
PanoPlane: Plane-Aware Panoramic Completion for Sparse-View Indoor 3D Gaussian Splatting [47.9] PanoPlaneは、高忠実度スパースビュー屋内新規ビュー合成のためのアプローチである。
パノラマシーンの完成により閉室形状を再構築する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:39:01 GMT)
CoReDiT: Spatial Coherence-Guided Token Pruning and Reconstruction for Efficient Diffusion Transformers [47.9] Diffusion Transformer (DiTs) は画像やビデオ生成の質は高いが、高い計算コストがかかる。
視覚タスク間でのDiTのための構造化トークンプルーニングフレームワークであるCoReDiTを紹介する。
CoReDiTは線形時間空間コヒーレンススコアを用いて、潜在トークン格子内の局所的冗長性を推定し、自己アテンションにおいて高いコヒーレンス(冗長)トークンをスキップする。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:13:29 GMT)
Mistletoe: Stealthy Acceleration-Collapse Attacks on Speculative Decoding [47.8] 投機的復号化は大規模言語モデル(LLM)推論を高速化する手法として広く採用されている。
モデルに基づく投機的復号化における新しいメカニズムレベルの脆弱性を同定する。
提案するMistletoeは、投機的復号化に対するステルス的な加速・崩壊攻撃である。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:11:42 GMT)
Towards Long-horizon Embodied Agents with Tool-Aligned Vision-Language-Action Models [47.7] 視覚言語アクションモデル(VLA)は効果的なロボットアクションエグゼクタであるが、拡張された閉ループ計画と多様な物理的操作の二重負担のため、長い水平タスクに制限されている。
本稿では、時間的推論のための高レベル視覚言語モデル(VLM)エージェントと、様々なローカルな物理操作のための専門的なVLAツール群にこの負担を分散する戦略であるVLA-as-Toolsを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:40:34 GMT)
An Agentic AI Framework with Large Language Models and Chain-of-Thought for UAV-Assisted Logistics Scheduling with Mobile Edge Computing [47.6] クラウド製造において、無人航空機(UAV)は製品収集と移動エッジコンピューティング(MEC)の両方をサポートすることができる。
本稿では,エージェントAIによる2つのコンポーネントの最適化フレームワークを提案する。
まず,大規模言語モデル,検索拡張生成,および連鎖推論を組み合わせたエージェントAIを開発し,ユーザ入力をハイブリッドスケジューリング問題に対する解釈可能な数学的定式化に変換する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:13:19 GMT)
SWE-Cycle: Benchmarking Code Agents across the Complete Issue Resolution Cycle [46.8] SWE-Cycleは、489の厳格な自動コードエージェントのインスタンスのベンチマークである。
SWE-Judgeは静的コードレビューと動的テストを組み合わせて機能的正当性を正確に検証する。
その結果、分離されたタスクからFullCycle実行に移行する際の解決率の急落が明らかになった。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:05:16 GMT)
RealICU: Do LLM Agents Understand Long-Context ICU Data? A Benchmark Beyond Behavior Imitation [46.8] RealICUは、実際のICU条件下での大規模言語モデル評価のための、後述のベンチマークである。
94MIC-IV患者の930ウィンドウアノテーションを持つRealICU-Goldと、Oracleによって拡張された11,862ウィンドウを持つRealICU-Scaleの2つのデータセットをリリースする。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:52:42 GMT)
TokAlign++: Advancing Vocabulary Adaptation via Better Token Alignment [46.8] 非効率的なトークン化は長いトークンIDシーケンスをもたらし、大規模言語モデルのトレーニングと推論を遅くする。
TokAlign++という手法を導入し,より優れたトークンアライメントレキシコンを学習することで語彙適応性能を向上させる。
15言語での実験結果から,本手法は多言語テキスト圧縮率を向上し,バニラモデルの多言語能力の大部分を維持できることが示された。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:23:24 GMT)
ReVision: Scaling Computer-Use Agents via Temporal Visual Redundancy Reduction [46.7] ReVisionは、冗長な視覚的パッチを削除するトラジェクトリ上で、マルチモーダル言語モデルをトレーニングするために使用される。
ReVisionはトークン使用率を平均で46%削減し,無ドロップベースラインでの成功率を3%向上することを示した。
このことは、視覚史において一般的に見られる飽和は、過去の情報の有用性の制限によるものではなく、むしろ非効率なトークン表現の結果によるものであることを示唆している。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:34:05 GMT)
Exploring Human-Robot Collaboration: Analysis of Interaction Modalities in Challenging Tasks [46.5] この研究は、人間とロボットのコラボレーションにおける3つの相互作用のモダリティ(受動的、反応性、能動的)を比較する。
受動的モダリティの参加者は単独で作業し、リアクティブなモダリティでは、移動ロボットは要求に応じてのみ支援し、プロアクティブなモダリティでは、明示的な要求なしにブロック配信とエラーシグナリングを開始した。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:35:47 GMT)
From Compression to Accountability: Harmless Copyright Protection for Dataset Distillation [46.4] 蒸留データセットに対する無害なサブポピュレーション駆動型保護フレームワークであるSubPopMarkを提案する。
第一に、著作権検証マーカー(CVM)最適化段階は、元の最適化軌道を保ちながらクラス一貫性のサブポピュレーションバイアスを注入する。
第2に、USTM(User-Specific Tracing Marker)最適化ステージでは、CVM拡張データにユーザ識別可能な摂動が導入されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:23:35 GMT)
Understanding Generalization through Decision Pattern Shift [46.4] 決定パターンシフト(DPS)は、内部決定パターンの安定性を通じて一般化を定義する新しい視点である。
DPSは、トレーニング中に学んだものとの差分として、障害を定量化する。
これらの知見は,早期の一般化リスク検出,障害モード診断,チャネルレベルの欠陥局在の新たな可能性を開く。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:14:59 GMT)
Rescaled Asynchronous SGD: Optimal Distributed Optimization under Data and System Heterogeneity [45.9] 非同期バニラ(ASGD)は分散学習において異種計算資源を利用する標準的な方法である。
本手法は,グローバルな目的ではなく,局所的な目的の周波数重み付けステップに偏りがあることが示される。
実験により、この手法が正しい目的に収束し、最先端のベースラインと競合することが確認された。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:27:22 GMT)
How to Scale Mixture-of-Experts: From muP to the Maximally Scale-Stable Parameterization [45.7] 3つの異なるスケーリング体制を解析することで、このギャップを解決するための原則的な一歩を踏み出します。
各体制に対して,MoEsの制限的トレーニング力学に関する新しい力学平均場理論(DMFT)を考案する。
結果として生じる$Pの処方は、スケールや頑健な学習速度の移動による単調な改善を確実に引き起こさないことを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:32:00 GMT)
Bad Seeing or Bad Thinking? Rewarding Perception for Vision-Language Reasoning [45.3] このトレードオフの根本原因は、モダリティクレジットの割り当ての曖昧さにあると我々は主張する。
本稿では,知覚推論のシナジーを改善する強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:23:53 GMT)
MMSkills: Towards Multimodal Skills for General Visual Agents [45.2] MMSkillsは、実行時の視覚的意思決定のための再利用可能なマルチモーダルプロシージャを表現、生成、使用するためのフレームワークである。
MMSkillsは、実行時のステートカードとマルチビューとテキストプロシージャを結合した、コンパクトで状態条件のパッケージである。
GUIとゲームベースのビジュアルエージェントベンチマークによる実験では、MMSkillsはフロンティアとより小さなマルチモーダルエージェントの両方を一貫して改善している。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:40:31 GMT)
FlowCompile: An Optimizing Compiler for Structured LLM Workflows [44.3] FlowCompileは、高品質で再利用可能なトレードオフセットを特定するためにコンパイル時の設計スペース探索を実行する構造化LLMコンパイラである。
実験によると、FlowCompileは最適化されたワークフロー構成とルーティングベースのベースラインを一貫して上回り、最大6.4倍のスピードアップを提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:06:36 GMT)
Respecting Self-Uncertainty in On-Policy Self-Distillation for Efficient LLM Reasoning [43.9] オンライン自己蒸留は、教師が密集したトークンレベルの監督を提供する間、独自のロールアウトで推論モデルを訓練する。
トークンレベルの更新を3つの信号で統一するEGRSD(Entropy-Guided Reinforced Self-Distillation)を提案する。
CL-EGRSDは、持続する高エントロピースパンと過渡的な高エントロピー位置を区別する因果関係の変種である。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:38:20 GMT)
PerfCodeBench: Benchmarking LLMs for System-Level High-Performance Code Optimization [43.7] PerfCodeBenchは、大規模言語モデル(LLM)を高速コード最適化で評価するための実行可能なベンチマークである。
このタスクには、システムレベルの実装選択、ハードウェア対応の最適化、パフォーマンスボトルネックの慎重に処理する必要がある。
我々の評価は、モデル生成コードと専門家最適化実装の間に明確なギャップがあることを示します。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:10:26 GMT)
"It became a self-fulfilling prophecy": How Lived Experiences are Entangled with AI Predictions in Menstrual Cycle Tracking Apps [43.4] 本稿では,月経周期追跡アプリ(MCTA)における人間とAIの絡み合いについて,14の半構造化ユーザインタビューとグループオートエスノグラフィーを用いて検討する。
その結果,(1)AIの予測に照らして,生きた経験をユーザが理解していることが明らかとなった。
予測AIの特徴と説明に対する設計上の意味について提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:42:37 GMT)
What is Learnable in Valiant's Theory of the Learnable? [43.1] ヴァリアントの1984年の論文は、PAC学習モデルを導入したと広く信じられている。
PAC学習とは異なり、学習者は正のみを受け取り、メンバーシップクエリを発行し、偽陽性のない仮説を出力しなければならない。
クラスが学習可能であることと,ポリサイズ適応型クエリ圧縮方式により,すべての正サンプルが証明可能であることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:58:46 GMT)
CUBic: Coordinated Unified Bimanual Perception and Control Framework [43.1] 両面認識と制御のためのフレームワークであるCUBicを提案する。
CUBicは、認識と制御をブリッジする共有トークン化表現を学習する。
RoboTwinベンチマークの実験は、CUBicが標準ベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:48:23 GMT)
Model-Agnostic Lifelong LLM Safety via Externalized Attack-Defense Co-Evolution [43.0] EvoSafetyは、永続的で検査可能で再利用可能な外部構造を中心に構築された安全フレームワークである。
レッドチームでは、EvoSafetyは攻撃ポリシーに敵のスキルライブラリを装備し、継続的な脆弱性調査を可能にする。
防衛学習のために、EvoSafetyは、モデル固有の安全性の微調整を、メモリ検索を付加した軽量な補助防衛モデルに置き換える。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:07:05 GMT)
ImageAttributionBench: How Far Are We from Generalizable Attribution? [42.5] 生成AIは、非常に現実的で多様な合成画像の作成を可能にし、画像の証明と誤情報検出の課題に対処している。
ImageAttributionBenchは、最先端(SOTA)アーキテクチャを備えた広範囲の高度な生成モデルによって合成された、包括的なデータセットである。
実世界の帰属シナリオをシミュレートするため,ImageAttributionBench上で複数のSOTA帰属手法を評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:01:10 GMT)
Texture Regenerating and Grafting Using Genome-Driven Neural Cellular Automata [42.2] 損傷領域におけるテクスチャの堅牢な自己再生を可能にする新しいトレーニング手法を提案する。
動的かつ適応的なシステムに不可欠なこの固有のヒーリング機構は、従来のコンピュータグラフィックスアプリケーションを超えて拡張されている。
異なるテクスチャのシームレスな組み合わせを可能にする多目的グラフト技術を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:57:32 GMT)
Automated alignment is harder than you think [41.9] 人工超知能(ASI)の整列に関する主要な提案は、AIエージェントを使用して、能力の向上に伴い、アライメント研究のごく一部を自動化することである。
我々は、研究員がアライメント作業の妨害を計画していないとしても、この計画は説得力はあるが破滅的に誤解を招く安全評価を生み出すかもしれないと論じている。
これは、アライメント研究には多くの面倒な作業が伴うためである。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:04:46 GMT)
Block-R1: Rethinking the Role of Block Size in Multi-domain Reinforcement Learning for Diffusion Large Language Models [41.9] ブロックサイズはdLLMにおいて重要な要素となっている。
本稿では,マルチドメインシナリオにおけるDLLM RLポストトレーニングにおけるドメインコンフリクトの観点からのブロックサイズについて検討する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:38:02 GMT)
Rethinking Generalization in Graph Neural Networks: A Structural Complexity Perspective [41.7] グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習するための基本的なツールとして登場した。
グラフ構造は実際に一般化に影響を与えますか?
最初の質問に答え、直観を検証するために、予測プロセスにより多くのエッジを組み込むことで、入力表現が出力モデルに過度に同調するように変換され、過度な適合が生じることを理論的に証明する。
2つ目の問題に対処するために、有効エッジの数に基づいて構造的複雑性尺度を定式化し、Radecher複雑性に基づく一般化境界を導出する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:32:46 GMT)
Senses Wide Shut: A Representation-Action Gap in Omnimodal LLMs [41.5] Representation-Action Gap: 隠された状態が前提認識ミスマッチを確実にエンコードする。
振る舞い的には、モデルはアンダーリジェクションとオーバーリジェクションの2つの障害モードに分類される。
初期診断介入として、プローブ誘導ロジット調整は、符号化されたミスマッチ信号を再注入して復号する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:14:44 GMT)
SkillFlow: Flow-Driven Recursive Skill Evolution for Agentic Orchestration [40.8] SkillFlowは、トレーニング可能なスーパーバイザをエージェントとして、動的スキルオーケストレーションを備えた構造化環境として、フローベースのフレームワークである。
これらのフロー診断に基づいて、スキル進化メカニズムは、いつ進化するか、どのスキルを創り出すか、どこで意思決定のギャップがあるかを決定する。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:14:44 GMT)
Multi-Objective and Mixed-Reward Reinforcement Learning via Reward-Decorrelated Policy Optimization [40.5] 複雑な強化学習環境は、しばしばマルチタスクとミックス・リワードの定式化を用いる。
これらの設定では、不均一な報酬分布と相関する報酬次元がしばしばスカラーの利点の構築を不安定にする。
本稿では,2つの障害モードを明示的に対象とする報酬処理手法であるReward-Decor Policy Optimization (RDPO)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:05:18 GMT)
Why Retrieval-Augmented Generation Fails: A Graph Perspective [40.3] 本稿では,検索された証拠が回答生成にどのように影響するかを検証した検索強化生成のモデル内研究について述べる。
属性-グラフトポロジ機能を用いたグラフベースの誤り検出フレームワークを開発した。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:18:07 GMT)
R2R2: Robust Representation for Intensive Experience Reuse via Redundancy Reduction in Self-Predictive Learning [40.0] 自己予測学習(SPL)における正規化手法として冗長化によるロバスト表現(R2R2)を提案する。
TD7のようなSPLネイティブアルゴリズム上でR2R2を検証する。
11の連続制御タスクに対する実験では、R2R2がオーバーフィッティングを効果的に軽減することを確認した。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:38:32 GMT)
Assessing the Creativity of Large Language Models: Testing, Limits, and New Frontiers [39.9] 近年,大規模言語モデル(LLM)に対する人間の創造性テストの実施が一般的になっている。
これらのテストは、"創造性"を評価するための便利で完全に自動化された方法を提供するが、機械の創造性の尺度としての妥当性は確立されていない。
我々は,LLMの創造的達成を予測するために,人間の創造性テストの有効性を評価するための,最初の大規模かつ体系的な研究を行った。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:46:05 GMT)
RoboEvolve: Co-Evolving Planner-Simulator for Robotic Manipulation with Limited Data [39.9] RoboEvolveは、VLMプランナーとVGMシミュレータを相互に強化した共進化ループに結合する新しいフレームワークである。
無ラベルのシードイメージで 純粋に操作することです
自律的な進歩的なカリキュラムによってガイドされ、システムは自然に単純な原子活動から複雑なタスクへとスケールする。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:54:36 GMT)
Relative Pose-Velocity Estimation Using Dual IMU Measurements and Relative Position Sensing [39.1] 本稿では,移動目標に対する車両の相対姿勢(位置と方向)と速度を推定する問題に対処する。
環境空間における推定誤差の大域的指数収束を保証するために必要な一様可観測条件を解析する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:36:10 GMT)
Distribution of GHz sequential Time-bin Entanglement in a Metropolitan Fiber Network [39.1] 絡み合いに基づく量子通信プロトコルは、鍵生成に基づく固有の量子ランダム性を提供する。
既設部品を用いた大都市ネットワークにおける量子鍵分布において,逐次時間ビン絡み状態を用いることの可能性を示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:20:00 GMT)
Selective Off-Policy Reference Tuning with Plan Guidance [38.7] SORTはロールアウト生成を変更することなく、これらの障害を修復するアップデートを追加した。
SORTは、オールホワイトプロンプトを均一な模倣ではなく、選択的で構造対応の学習信号に変える。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:41:19 GMT)
AttenA+: Rectifying Action Inequality in Robotic Foundation Models [38.6] 本稿では,速度駆動型アクションアテンションを通じて,運動学的に重要なセグメントを優先するアーキテクチャに依存しないフレームワークであるAttenA+を紹介する。
我々の研究は、本質的な行動列の構造的前提をマイニングすることが、標準的なスケーリング法則に非常に効率的で物理学的な補完をもたらすことを示唆している。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:55:37 GMT)
DiffST: Spatiotemporal-Aware Diffusion for Real-World Space-Time Video Super-Resolution [38.3] リアルタイムビデオ超解像(STVSR)のための高効率時間対応ビデオ拡散フレームワークDiffSTを紹介する。
効率を向上させるために,一段階サンプリングのための事前学習拡散モデルを適用し,個々のフレームを操作するのではなく,ビデオ全体を直接処理する。
実験により、DiffSTは現実世界のSTVSRタスクにおいて主要な結果を得ることが示された。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:41:48 GMT)
Proximal-Based Generative Modeling for Bayesian Inverse Problems [38.3] 本稿では,新しい近位モデル(PGM)フレームワークを提案する。
我々の枠組みは拡散過程におけるガウス的畳み込みと非滑らかな最適化におけるモロー・ヨシダ正規化の理論的等価性に基づいて構築されている。
実験により,PGMは修復品質とサンプリング時間において最先端の手法を大幅に上回っていることが示された。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:55:51 GMT)
MuteBench: Modality Unavailability Tolerance Evaluation for Incomplete Multimodal Fusion [37.9] 7つの臨床領域から9つのデータセットをカバーするベンチマークであるMuteBenchを提示する。
アーキテクチャファミリは、パラメータ数を上回る、ロバスト性の最も強い予測要因であることがわかった。
チャネルに依存しないモデルは、モダリティの欠如を許容するが、モダリティの欠如に敏感である。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:32:11 GMT)
AI co-mathematician: Accelerating mathematicians with agentic AI [37.6] 我々は、数学者がAIエージェントを対話的に活用し、オープンエンドの研究を追求するためのワークベンチであるAIコマンセマティクスを紹介した。
AIの共数学者は、文献探索、計算探索、定理証明、理論構築など、数学観念の探索的かつ反復的な現実を総合的に支援することを目的としている。
初期のテストでは、AIの共同数学者は、オープンな問題の解決、新しい研究方向の特定、文献参照の発見に協力した。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:47:04 GMT)
EvoGround: Self-Evolving Video Agents for Video Temporal Grounding [37.5] ビデオ時間グラウンド(VTG)は、未トリミングされたビデオと自然言語クエリを入力として取り、クエリに最もよくマッチする時間モーメントをローカライズする。
EvoGroundは、2つの結合した自己進化エージェント、提案者、解決者からなるフレームワークで、人間のラベル付きデータなしで生のビデオから時間的グラウンドを学習する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:25:51 GMT)
FeatCal: Feature Calibration for Post-Merging Models [37.5] モデルマージは、タスクエキスパートをひとつのモデルに統合し、共同トレーニング、再トレーニング、あるいは多くのエキスパートモデルのデプロイを避ける。
我々は,この性能差を特徴量ドリフト(特徴量ドリフト),マージモデルと専門家による同一入力における特徴量差から検討する。
このビューはFeatCalを動機付けている。FeatCalは、小さなキャリブレーションセットを使用して、マージされたモデルの重み付け層を前方に調整する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:35:03 GMT)
Collaborating in Multi-Armed Bandits with Strategic Agents [37.5] 戦略エージェントが同一のバンディットのインスタンスをまとめて解くマルチエージェントベイジアンバンディット問題における協調学習について検討した。
複数のエージェントが情報を共有することで学習を加速する一方で、戦略エージェントは自由化と探索の回避を好んでいる。
我々は,強い後悔の保証を達成しつつ,ナッシュ均衡として協調を維持する機構であるtextttCAOSを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:10:36 GMT)
Security Incentivization: An Empirical Study of how Micropayments Impact Code Security [37.4] セキュリティは、目に見える価値を直接生成しないため、開発者の注意を欠くことが多い。
我々は、チームレベルのインセンティブによる、測定可能なセキュリティ改善に関連する対策の評価を行った。
私たちの半自動メカニズムは、Bearer、Detekt、Mobsfscanの静的分析結果を収集し、セキュリティ問題密度を計算し、スプリント間の相対的な改善比率に基づいてチームに報酬を与えます。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:12:13 GMT)
FiTS: Interpretable Spiking Neurons via Frequency Selectivity and Temporal Shaping [37.4] Spiking Neural Networks(SNN)は、イベント駆動の時間処理のための有望なフレームワークである。
我々は、各ニューロンの時相を周波数選択性(FS)と時間整形(TS)に分解するスパイクニューロンであるFiTSを紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:42:40 GMT)
Only Train Once: Uncertainty-Aware One-Class Learning for Face Authenticity Detection [37.2] FADNetは、顔の偽造検出を一級分類タスクとして再構成する自己教師型フレームワークである。
Evidential Deep Learning (EDL) を組み込んで予測の不確実性を定量化し、プラグアンドプレイの擬似偽画像生成器 (PFIG) を用いて決定境界を絞り込む。
FADNetは既存のSOTA法を大幅に上回り、平均精度は96.63%、平均精度は98.83%である。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:56:24 GMT)
Evidence-based Decision Modeling for Synthetic Face Detection with Uncertainty-driven Active Learning [37.2] EMSFD(Evidence-based decision Modeling for Synthetic Face Detection with uncertainty-driven active learning)を提案する。
提案手法は,既存のSOTAベースラインに比べて15%精度が向上する。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:56:43 GMT)
Machine Learning-Driven Multimodal Spectroscopic Liquid Biopsy for Early Multicancer Detection [36.9] フーリエ変換赤外分光法(FTIR)、ラマン分光法(Raman spectroscopy)、励起放出マトリクス(EEM)蛍光分光法(Excitation-Emission Matrix:EEM)を組み合わせたマルチキャンサー検出のための多モード液体生検フレームワークを提案する。
乳癌患者,大腸癌患者,健康管理患者の血清サンプルについて検討した。
以上の結果より, 乳腺癌に対するROC-AUC 0.997, 大腸癌に対する0.994, 高い感度, 特異性値のバランスが得られた。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:11:01 GMT)
EpiGraph: Building Generalists for Evidence-Intensive Epilepsy Reasoning in the Wild [36.8] textscEpiGraphは、知識を付加した臨床推論を評価するための大規模なてんかんの知識グラフとベンチマークである。
textscEpiBenchは、臨床意思決定、脳波レポート生成、薬理ゲノム精度医学、治療勧告、深層研究計画の5つの臨床的動機付けタスクを定義している。
その結果、textscEpiGraphの統合は、すべてのタスクにおけるパフォーマンスを一貫して改善し、薬理学的推論で見られる最大の利益が得られている。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:59:22 GMT)
OCH3R: Object-Centric Holistic 3D Reconstruction [36.5] 我々は1枚のRGB画像からオブジェクト中心のホロスティック3次元再構成のための統合フレームワークであるOCH3Rを紹介する。
OCH3Rは1つのフォワードパスを実行し、すべてのオブジェクトインスタンスを同時に6Dポーズと詳細な3D再構成で予測する。
標準的な屋内ベンチマークでは、OCH3Rは単分子深度推定、開語彙セマンティックセマンティックセグメンテーション、RGBのみのカテゴリレベルの6Dポーズ推定にまたがって最先端の性能を達成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:17:51 GMT)
What Information Matters? Graph Out-of-Distribution Detection via Tri-Component Information Decomposition [36.1] 我々は、情報をtextitfeature-specific, structure-specific, joint component に分解するフレームワーク textscTide を提案する。
以上の結果から,textscTideはFPR95よりも34%向上し,IDの精度は向上した。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:36:33 GMT)
AssemblyBench: Physics-Aware Assembly of Complex Industrial Objects [36.0] 既存のデータセットは、単純なシナリオ、形状の複雑さ、産業集会における組み立て軌跡などに焦点を当てている。
本稿では,2,789個の産業用オブジェクトの合成データセットであるアセンブリベンチについて紹介する。
また,各部品の教示マニュアルと3次元形状を用いて,組立順序と組立軌跡を協調的に予測するトランスフォーマーモデルであるアセンブリーディノを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:44:09 GMT)
Asymmetric Flow Models [35.8] 本稿では,データ予測を全次元に保ちながら低ランク部分空間に雑音予測を制限したランク非対称な速度パラメータ化を提案する。
AsymFlowは、ネットワークアーキテクチャやトレーニング/サンプリング手順を変更することなく、全次元の速度を解析的に回復する。
FLUX.2 klein 9B から微調整された画素 AsymFlow モデルにより,画素空間のテキスト・画像生成技術が新たに確立されたことを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:58:01 GMT)
Revisiting DAgger in the Era of LLM-Agents [35.6] ロングホライゾン LM エージェントはマルチターン相互作用から学習し、1つの早期誤りがその後の状態分布を変化させ、全軌道を脱線させる。
教師の微調整によって教師の監督が密集し、検証可能な報酬による強化学習は、この非政治的なミスマッチを避ける。
マルチターンLMエージェントのデータセットアグリゲーション(DAgger)を再検討することにより,このジレンマに対処する。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:40:28 GMT)
What to Ignore, What to React: Visually Robust RL Fine-Tuning of VLA Models [35.5] 強化学習(RL)の微調整は、ロボット操作におけるビジョン・ランゲージ・アクション(VLA)モデルの可能性を示している。
重要な課題は、標準的なタスク報酬がタスクの成功を監督するが、視覚的な変化がタスク非関連であるか、操作に必要な振る舞いを変更するか、限定的なガイダンスを提供することである。
PAIR-VLAは、PPO最適化中にペアの視覚的変形に対して2つの補助的な目的を加えることで、この問題に対処する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:15:37 GMT)
FedHPro: Federated Hyper-Prototype Learning via Gradient Matching [34.4] フェデレートラーニング(FL)は、プライバシを保護しながら、分散クライアントの協調的なトレーニングを可能にする。
学習可能なグローバルなクラスワイドプロトタイプセットによって定義されたハイパープロトタイプを導入し、クライアント間のセマンティックな知識を保存する。
本稿では,フェデレートされたハイパープロトタイプ学習フレームワークであるFedHProを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:01:17 GMT)
HLS-Seek: QoR-Aware Code Generation for High-Level Synthesis via Proxy Comparative Reward Reinforcement Learning [34.4] textbfHLS-Seekは、ループ内の高価な合成RLを比較プロキシ報酬モデルで置き換える。
HLS-Seekは81.5%の構文修正パス@1と81.4%のFunc@5を7Bパラメータで達成している。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:47:03 GMT)
Edit-level Majority Voting Mitigates Over-Correction in LLM-based Grammatical Error Correction [34.1] 大規模な言語モデルを用いた文法的誤り訂正は、しばしば過度な補正問題に悩まされる。
本研究では,1つのモデルから生成される複数の候補に対して,編集レベルの多数決を行う学習自由推論手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:52:15 GMT)
FactoryNet: A Large-Scale Dataset toward Industrial Time-Series Foundation Models [34.0] 本稿では,産業時系列データのための最初のユニバーサル事前学習コーパスであるFactoryNetを紹介する。
6つの実施形態で、23kのエンドツーエンドのタスク実行にまたがる51万のデータポイント。
パイプライン全体を支える新しいスキーマ: Setpoint, Effort, Feedback, Context (S-E-F-C)。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:28:39 GMT)
PoisonCap: Efficient Hierarchical Temporal Safety for CHERI [33.9] 我々は、CHERIシステムの厳密な使用後保護と初期化安全性を備えたスケーラブルな時間的安全性であるPoisonCapを提案する。
PoisonCapはCornucopiaのシャドーを置き換えることができる。
コルヌコピア基底線に対する基本的なオーバーヘッドは発生しないが、実際の位置より前にゼロとなる。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:59:55 GMT)
Is Agentic AI Ready for Real-World Hardware Engineering? A Deep Dive with Phoenix-bench [33.7] 我々は、ソフトウェアエンジニアリングを現実的なハードウェアエンジニアリングに移行するために構築されたエージェントAIシステムについて尋ねる。
textbfPhoenix-benchは、114のGitHubリポジトリから511の検証済みのVerilatorインスタンスの同期コーパスです。
Phoenix-benchを用いて、4つの商用エージェントと8つのオープンソースエージェント構造を均一に評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:14:54 GMT)
Checkup2Action: A Multimodal Clinical Check-up Report Dataset for Patient-Oriented Action Card Generation [33.1] textbfCheckup2Action, a multimodal clinical check-up report dataset and benchmark for structured textitAction Card generation。
このデータセットには、人口統計情報、身体検査、実験室のテスト、心臓血管アセスメント、画像関連エビデンスを含む2,000の未確認の現実世界のチェックアップレポートが含まれている。
我々は、制約付き構造化された生成タスクとしてチェックアップ・ツー・アクションの生成を定式化し、課題のカバレッジと精度、優先順位の整合性、部門と時間の推奨精度、アクションの複雑さ、有用性、可読性、安全コンプライアンスを網羅する評価プロトコルを導入する。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:48:21 GMT)
Reward-Weighted On-Policy Distillation with an Open Property-Equivalence Verifier for NL-to-SVA Generation [32.6] 全体として強く見えるモデルは依然として崩壊し続けており、有界遅延とライブネスの仕様にいくつかの意味を持つテンプレートが存在している。
emphReward-Weighted On-Policy Distillation (RWOPD)を紹介する。
RWOPDは、CodeV-SVA-14BをQwen2.5-Coder-7B-Instructの学生に蒸留し、NL2SVA-HumanとNL2SVA-Machineのパス@1、pass@5、pass@10にまたがって技術の新たな状態を設定する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:23:54 GMT)
Ilov3Splat: Instance-Level Open-Vocabulary 3D Scene Understanding in Gaussian Splatting [32.5] Ilov3Splatは3Dガウススプラッティング(3D-GS)上に構築されたインスタンスレベルのオープンな3Dシーン理解のためのフレームワーク
言語対応のCLIP機能を効率的にエンコードするために,マルチレゾリューションハッシュ埋め込みを活用している。
推論時に、CLIPエンコードされたクエリは学習した機能と一致し、続いて関連するガウスグループを取得するための2段階の3Dクラスタリングが続く。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:18:56 GMT)
When Attention Closes: How LLMs Lose the Thread in Multi-Turn Interaction [32.3] ゴール定義トークンは注意によってアクセスしにくくなり、ゴール関連情報は残留表現で持続する。
ゴールアクセシビリティ比(GAR)を導入し、生成トークンからタスク定義ゴールトークンへの注意を計測し、それをスライドウインドウアブレーションと残留ストリームプローブと組み合わせる。
アーキテクチャ全体において、遷移は定性的に異なる障害モードをもたらす: あるモデルは注意をそらしてゴール条件の動作を保ち、他のモデルは、デオード可能な残留目標情報にもかかわらず失敗し、この符号化が現れる層は2から27まで変化する。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:58:18 GMT)
MUJICA: Multi-skill Unified Joint Integration of Control Architecture for Wheeled-Legged Robots [32.2] 本稿では、車輪付き脚ロボットのための統一的、完全プロプリセプティブ制御フレームワークを提案する。
MUJICAは、一方向移動、高プラットフォームクライミング、転倒回復を含む多様な低レベルスキルを単一のポリシーで統合する。
我々は,Unitree Go2-Wロボットのシミュレーションと実世界の実験において,我々のフレームワークを検証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:31:18 GMT)
Towards Unified Surgical Scene Understanding:Bridging Reasoning and Grounding via MLLMs [32.2] SurgMLLMは統一的な手術シーン理解フレームワークである。
単一のモデル内で、ハイレベルな推論と低レベルなビジュアルグラウンドをブリッジする。
大規模な実験により、SurgMLLMは外科的シーン理解を著しく前進させることが示された。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:42:23 GMT)
When and Why is Optimistic Multiplicative Weights Slow? The Geometry of Energy Dissipation [32.1] 本稿では,OMWU (Optimistic Multiplicative Weights Update Algorithm) の2つのプレイヤーゼロサムゲームにおける収束性について検討する。
近年の研究では、OMWUの最終定位が任意に緩やかに収束できる事例が特定されているが、この緩やかな収束がいつ、なぜかは未解明のままである。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:27:10 GMT)
WarmPrior: Straightening Flow-Matching Policies with Temporal Priors [32.0] WarmPriorはロボット操作タスクの成功率を継続的に向上させる。
我々は、この利得を、整流流における最適輸送結合の効果を反映して、よりストレートな確率経路へと遡る。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:00:01 GMT)
Max-pooling Network Revisited: Analyzing the Role of Semantic Probability in Multiple Instance Learning for Hallucination Detection [31.9] 幻覚検出は、大規模言語モデルの信頼性を向上させるためにますます重要になっている。
近年,MIL(Multiple Instance Learning)による内部モデル状態とセマンティック一貫性を組み合わせたHaMIのようなハイブリッドアプローチが,最先端のパフォーマンスを実現している。
本研究では,まず,決定マージンの観点からHaMIの理論的解析を行い,内部状態を意味的整合性で拡張すると決定マージンが大きくなることを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:44:50 GMT)
Continual Fine-Tuning of Large Language Models via Program Memory [31.7] Low-Rank Adaptation (LoRA) は、Large Language Models (LLM) を限定計算で適用するための標準アプローチとなっている。
神経科学におけるtextbfComplementary textbfLearning Systems にインスパイアされた textbfProgram メモリを用いた連続的な LoRA フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:26:37 GMT)
ALAM: Algebraically Consistent Latent Action Model for Vision-Language-Action Models [31.3] ALAM(Algebraic Latent Action Model)は、アクションフリービデオにおける時間的関係を構造的監視に変換する。
ALAMは、構成と逆整合性によって規則化されながら、再構成によって基礎付けられた潜伏遷移を学習する。
下流VLA学習では、事前学習したエンコーダを凍結し、その潜伏遷移配列を補助的生成ターゲットとして使用する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:16:02 GMT)
DeepFilters: Scattering-Aware Pupil Engineering with Learned Digital Filter Reconstruction for Extended Depth of Field Microscopy [31.3] DeepFiltersは散乱対応のディープ光学フレームワークである。
PSFを16ミクロンから400ミクロンまで透明な媒体で拡張する。
生体組織において120ミクロン以上の信号の回復を可能にする。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:49:33 GMT)
Self-Pruned Key-Value Attention: Learning When to Write by Predicting Future Utility [31.1] 我々は,将来のKVユーティリティを予測するメカニズムであるSP-KV(Self-Pruned Key-Value Attention)を導入する。
軽量ユーティリティ予測器は各キーと値のペアをスコアし、最近のKVは常にローカルウィンドウ経由で利用できるが、古いペアはキャッシュに書き込まれる。
このメカニズムは入力に適応し、典型的にはKVキャッシュサイズを3ドルから10ドルに削減する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:58:16 GMT)
When Vision Speaks for Sound [31.1] ビデオ対応MLLMの急速な進歩にもかかわらず、ビデオにおける明らかな音声理解はビジョン駆動であることが多い。
この問題は、最先端のオープンソースオムニモデルと、GoogleやOpenAIといったプロバイダによるクローズドソースモデルの両方にまたがっている。
我々は、この障害モードを、モデルが(頻繁に)オーディオグラウンドに現れるが、実際にオーディオとビジュアルストリームが本当に一致しているかどうかを検証せずに、視覚-音響相関を利用する、オーディオ-ビジュアル・クリーバー・ハンス効果として特徴付けている。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:00:19 GMT)
Early Semantic Grounding in Image Editing Models for Zero-Shot Referring Image Segmentation [31.0] ゼロショット参照画像セグメンテーションにおいて,言語条件の視覚的セマンティックグラウンド化が有効かどうかを検討する。
本稿では,RISの事前学習画像編集モデルを中間表現を利用して再利用する学習自由フレームワークを提案する。
提案手法は,焦点を推定するアテンションベースの空間先行と,セグメンテーションを決定する特徴に基づくセグメンテーションの2つの相補的な構成要素に分割する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:48:05 GMT)
Position: Agentic AI System Is a Foreseeable Pathway to AGI [30.8] 我々は,エージェントAIを実世界のタスクの複雑で異質な分布をマスターするために必要なパラダイムとして認識する。
我々はエージェントAIが指数関数的に優れた一般化とサンプル効率を実現することを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:00:43 GMT)
TeDiO: Temporal Diagonal Optimization for Training-Free Coherent Video Diffusion [30.7] 不整合なビデオは、中間的自己注意マップにおいて、不規則で断片化された時間的対角線を常に示している。
本稿では,これらの内部の注意パターンを規則化し,時間的一貫性を補強するトレーニング不要な推論時間手法TeDiOを紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:39:50 GMT)
ReTool-Video: Recursive Tool-Using Video Agents with Meta-Augmented Tool Grounding [30.5] ビデオ理解には、時間的推論、クロスモーダル理解、複雑な質問応答のためのツール強化ビデオエージェントの探索、動機付け、積極的なエビデンスが必要である。
既存のビデオエージェントは、検索、メモリ、フレーム検査、検証ツールでビデオ推論を改善したが、それでも2つの制限に直面している。
本稿では,これらの課題を2つの相補的な設計で解決する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:19:22 GMT)
Large Language Models Lack Temporal Awareness of Medical Knowledge [30.2] LLM(Large Language Models)の医学的知識を評価する既存の手法は、主に時間的検査スタイルのベンチマークに基づいている。
医用領域におけるLCMの時間的認識をガイドライン知識の進化を通じて評価するための,第一種ベンチマークである TempoMed-Bench を構築した。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:04:40 GMT)
AgentForesight: Online Auditing for Early Failure Prediction in Multi-Agent Systems [30.2] LLMベースのマルチエージェントシステムは、長距離タスクにますますデプロイされている。
単一の決定的なエラーは、しばしば下流のエージェントやカスケードによって軌道レベルの障害として受け入れられる。
我々は,この問題をオンライン監査として再編成するフレームワークであるAgentForesightを紹介した。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:06:48 GMT)
Support Before Frequency in Discrete Diffusion [30.1] 正確な逆処理は、粗いサポート情報とより微細な周波数情報の間の階層構造を誘導することを示す。
拡散の均一化と吸収のために、各シングルトークンの逆編集がリードスケールに分解されることを示す。
この結果から,離散拡散モデルはデータ周波数よりも先にデータサポートを学ぶことが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:08:16 GMT)
NeuroRisk: Physics-Informed Neural Optimization for Risk-Aware Traffic Engineering [30.0] ワイド・エリア・ネットワーク(WAN)では、関係する障害が可用性の損失を支配しており、オペレーターは大規模な安全マージンを確保せざるを得なかった。
既存のリスク対応の定式化は、組み込みのSort-and-Select構造で制限できることを示し、時間スケールとトラクタビリティの基本的なトレードオフを明らかにする。
我々は、ソット・アンド・セレクトの構造を利用する物理インフォームド統一であるNeuroRiskを提案する。NeuroRiskは、ゲートエッジローカル予約を通じて実現可能であり、置換不変な勾配整列キューを通じてシナリオセットを表現する。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:17:45 GMT)
GTA: Advancing Image-to-3D World Generation via Geometry Then Appearance Video Diffusion [30.0] GTAは幾何学的手法に基づく新しい画像から3次元世界生成手法である。
具体的には、単一の入力画像が与えられた場合、GTAは2つの専用ビデオ拡散モデルを持つ2段階のフレームワークを採用する。
広汎な実験により,提案手法は忠実度,視覚的品質,幾何学的精度で既存手法より一貫して優れていた。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:43:02 GMT)
High-Rate Quantized Matrix Multiplication II [29.8] 我々は, 実用的なLCM量子化アルゴリズム(GPTQ)を改良するために, 給水をどのように利用できるかを示す。
スカラーINT量子化器のみを使用する最近のスキーム(WaterSIC')を解析し、そのハイレート性能をベースフリー(つまり、$_X$の行列式を特徴とする)として示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:47:25 GMT)
Query-Conditioned Test-Time Self-Training for Large Language Models [29.5] 本稿では,入力クエリから直接のインスペクションを用いて,モデルパラメータを推論中に適応するフレームワークを提案する。
QueSTは、強いテスト時間最適化ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:27:40 GMT)
ICRL: Learning to Internalize Self-Critique with Reinforcement Learning [29.2] 大規模な言語モデルベースのエージェントは間違いを犯すが、批判はしばしば同じモデルを正しい行動へと導く。
凍結した批評家は、時間とともにフィードバックの品質を改善することができず、反復的な自己改善の可能性を制限する。
本稿では,自己批判を補強学習で学ぶことを提案する。これは,問題解決者と批判者を共有バックボーンから共同で訓練する新しい枠組みである。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:50:05 GMT)
PBT-Bench: Benchmarking AI Agents on Property-Based Testing [29.0] PBT-Benchは、40の実際のPythonライブラリにまたがる100のプロパティベースのテスト問題のベンチマークである。
各問題は1つ以上のセマンティックなバグ(総数365、平均3.65)を注入し、デフォルトのストラテジーなランダムな入力がほとんど起こらないように設計する。
PBT指導によるバグリコールは42.1%から83.4%の範囲で、オープンエンドベースラインでは31.4%から76.7%である。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:01:05 GMT)
Beyond Cooperative Simulators: Generating Realistic User Personas for Robust Evaluation of LLM Agents [28.9] Persona Policies (PPol) は、ユーザシミュレータの現実的な振る舞い変化を誘導するコントロール層である。
PPolはドメイン内のあらゆるタスクに対して、多種多様な人間のようなペルソナを生産する。
PPolで訓練されたエージェントは、挑戦的で非分配的な振る舞いに対してより堅牢であり、既存のシミュレートされたインタラクションのみに関するトレーニングに比べて、タスクの成功率が+17%向上する。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:16:51 GMT)
PhysEditBench: A Protocol-Conditioned Benchmark for Dense Physical-Map Prediction with Image Editors [28.8] 我々はPhysEditBenchを導入し、高密度物理マップ予測における画像エディタの評価と標準化を行う。
評価データには,ターゲット依存型ベンチマーク基板を構築する。
我々は、品質チェック、有効領域マスク、シーンレベルのサンプリング、照明ベースのストレスサブセットでデータをキュレートする。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:17:04 GMT)
GenAI-Driven Approach to RISC-V Supply Chain Exploration [28.7] 本稿では、RISC-Vサプライチェーン解析のためのLLMを利用したワークフローを提案する。
VLM(Vision-Language Models)とMDE(Model-Driven Engineering)を統合し、包括的でマルチモーダルなデータ駆動の洞察を可能にする。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:36:57 GMT)
Stable Attention Response for Reliable Precipitation Nowcasting [28.2] 注意応答エネルギーのクロスサンプル不安定性は、信頼性の低い予測の重要かつ未発見の源である。
HARECastは,降水量抑制のためのヘッドワイド・アテンション・レスポンシブ・エネルギ規制フレームワークである。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:41:39 GMT)
Hierarchical Transformer Preconditioning for Interactive Physics Simulation [28.1] 階層型トランスフォーマープレコンディショナー(Hierarchical Transformer Preconditioner)は、弱い許容率のH行列分割に固定されたニューラルプレコンディショナーである。
ネットワークは低ランクの遠距離因子を通して逆をモデル化する。
高速道路の接続を利用して、奥行きを隔ててコンテキストを伝播する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:02:27 GMT)
Towards a holistic understanding of Selection Bias for Causal Effect Identification [27.5] 選択バイアス下における平均治療効果(ATE)の識別可能性について検討した。
確率クラスに対する弱い仮定を利用して、確率のスコアと選択確率を特徴づける。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:24:34 GMT)
Galilean State Estimation for Inertial Navigation Systems with Unknown Time Delay [27.5] 商用グレードの受信機は、センサーの品質や動作モードに応じて、50msから300msまでの未知の測定遅延を導入する。
既存のアルゴリズムでは、この遅延をオフラインで推定し、バッファリングされた慣性測定ユニット(IMU)データを用いてフィルタを同時に実行している。
本稿では,時間遅延INSをモデル化するための新しい幾何学的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:46:18 GMT)
Robust Sequential Experimental Design for A/B Testing [27.5] 実験設計は、A/Bテストのサンプル効率を改善するための強力なアプローチとして現れている。
我々はコンテキスト的帯域幅と動的設定の両方をカバーする統一的なフレームワークを開発する。
我々の設計は、推定された処理効果の最悪の平均2乗誤差に縛られていることを証明している。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:24:57 GMT)
Causal Learning with the Invariance Principle [27.3] 2つの補助環境が正当性推論を保証するのに十分であることを示す。
合成データに関する理論的結果を実証的に支援する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:25:04 GMT)
GESR: A Genetic Programming-Based Symbolic Regression Method with Gene Editing [27.1] 進化的アルゴリズムに基づく遺伝的プログラミング(GP)は、現在でも最も古典的で広く採用されている手法の1つである。
本稿ではGESRと呼ばれる遺伝子編集に基づく記号回帰手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:20:22 GMT)
CoRe-Gen: Robust Spectrum-to-Structure Generation under Imperfect Fingerprint Conditions [27.0] タンデム質量スペクトル(MS/MS)からの分子構造解明は、特にデータベースのカバレッジを超えたデノボ生成が困難である。
一般的なアプローチでは、タスクをスペクトルからフィンガープリントの予測に分解し、続いて指紋から構造へのデコードを行い、大規模な分子コーパスの使用を可能にしている。
CoRe-Genは、エンコーダの合成スペクトル事前訓練による中間条件の改善、デコーダ訓練中の周波数認識指紋の破損による展開時間ノイズのマッチング、構成SELFIESを用いた構造認識自己回帰復号、補助構造監視、軽量化学制約による残差の軽減を行う。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:22:55 GMT)
LLMs Know When They Know, but Do Not Act on It: A Metacognitive Harness for Test-time Scaling [27.0] 我々は,大規模言語モデル (LLM) が有効なテスト時間制御に変換できる潜在メタ認知能力を持っているかどうかを問う。
認知心理学からネルソン=ナレンズ理論に触発された我々は、モニタリングと推論を分離するメタ認知的ハーネスを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:09:25 GMT)
VCR: Learning Valid Contextual Representation for Incomplete Wearable Signals [26.9] 本稿では,モダリティの欠如に頑健な有効な表現を抽出する自己教師型フレームワークであるVCRを提案する。
VCRは、フル、シングルミス、マルチミスモード設定におけるパフォーマンスとロバスト性を一貫して改善する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:11:39 GMT)
HCSG: Human-Centric Semantic-Geometric Reasoning for Vision-Language Navigation [26.8] VLNは、データとモデルのキャパシティのスケーリングによって、驚くべき進歩を遂げた。
VLNのための最初の人中心型フレームワークであるHCSGを提案する。
このフレームワークは、動的人間ロボット環境における安全で社会的にインテリジェントなナビゲーションのための堅牢な基盤を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:34:47 GMT)
Geometry over Density: Few-Shot Cross-Domain OOD Detection [26.6] アウト・オブ・ディストリビューション(OOD)検出は、モデルのトレーニング分布外にあるテストサンプルを特定する。
拡散軌道の情報・幾何学的解析により,この目標を達成する統一的なフレームワークである textbfUFCOD を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:32:20 GMT)
Inducing Overthink: Hierarchical Genetic Algorithm-based DoS Attack on Black-Box Large Language Reasoning Models [26.5] 大規模推論モデル(LRM)は、信頼性の高いマルチステップ推論を必要とするシステムにますます統合されている。
LRMは「過大な考え」を示す傾向があり、過度に長く冗長な推論の痕跡を生み出している。
入力問題の論理構造を体系的に摂動させることにより, LRMにおける過大な思考を誘発する自動ブラックボックスフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:57:10 GMT)
Retrieval is Cheap, Show Me the Code: Executable Multi-Hop Reasoning for Retrieval-Augmented Generation [26.2] pyragは、プログラムの合成と実行としてマルチホップRAGを再構成するフレームワークである。
pyragはトレーニング不要設定とRLトレーニング設定の両方で、強いベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:14:13 GMT)
Instructions Shape Production of Language, not Processing [26.1] インストラクションは、言語モデルで生産中心のメカニズムをトリガーする。
本稿では,このメカニズムを2段階間の非対称性として,タスク固有情報を階層的に探索することによって明らかにする。
本研究は,モデル能力の理解には内部と行動の協調的評価が必要であることを示唆する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:57:14 GMT)
Few Channels Draw The Whole Picture: Revealing Massive Activations in Diffusion Transformers [26.0] Diffusion Transformer (DiT) と関連するフローベースのアーキテクチャは、現在最も強力なテキスト・イメージ・ジェネレータの1つである。
隠れ状態のチャネルの小さなサブセットで、応答は残りのチャネルよりもずっと大きい。
疎外性にもかかわらず、これらのチャンネルは3つの相補的な感覚で、効果的に全体像を描き出す。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:00:12 GMT)
R^2-Mem: Reflective Experience for Memory Search [25.8] R2-Memは、メモリ検索システムのための反射体験フレームワークである。
オフラインの段階では、Learner-guided Evaluatorは歴史的軌跡の低品質と高品質のステップをスコアする。
オンライン推論では、検索されたエクスペリエンスが将来の検索アクションを誘導し、繰り返しのミスを避ける。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:09:36 GMT)
HetScene: Heterogeneity-Aware Diffusion for Dense Indoor Scene Generation [25.7] HetSceneは、インボディードAIのための制御可能で物理的に検証可能な屋内シーンを生成するためのフレームワークである。
シーンを形作る役割に応じて、オブジェクトをプライマリオブジェクトとセカンダリオブジェクトに分解する。
テキスト記述、トップダウンのバイナリルームマスク、空間関係グラフに条件付けされたプライマリオブジェクトのみを用いて、グローバルに一貫性のある構造レイアウトを生成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:21:51 GMT)
GuardMarkGS: Unified Ownership Tracing and Edit Deterrence for 3D Gaussian Splatting [25.5] オーナシップトレースと不正な編集抑止を共同で最適化する3DGSのための,最初の統一された保護フレームワークを提案する。
本フレームワークは,すべてのガウス人に対するシーンワイドな透かし目的と,デトレランスを編集するための敵対的な目的を組み合わせたものである。
Mip-NeRF 360 と Instruct-NeRF2NeRF のシーンでの実験により,提案フレームワークはビット精度,編集長,レンダリング品質のバランスが良好であることを実証した。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:48:07 GMT)
CommonWhy: A Dataset for Evaluating Entity-Based Causal Commonsense Reasoning in Large Language Models [25.4] エンティティベースのコモンセンス推論を評価するために設計された質問のデータセットであるCommonWhyを紹介する。
CommonWhyは知識グラフ質問回答(KGQA)ベンチマークとしても機能し、クエリに答えるために必要な知識はすべてWikidataナレッジグラフで利用可能である。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:47:21 GMT)
Quantifying Sensitivity for Tree Ensembles: A symbolic and compositional approach [25.2] 決定木アンサンブル(DTE)は、複数の安全クリティカルドメインで使用される幅広いAI分類タスクの一般的なモデルである。
そのような検証問題の1つは感度の問題であり、DTEが与えられた場合、機能のサブセットの小さな変更が入力の誤分類につながるかどうかを問うものである。
本稿では,認証エラーと信頼性境界内で効率よくこれを実現できる新しいアルゴリズム手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:52:19 GMT)
Color Constancy in Hyperspectral Imaging via Reduced Spectral Spaces [24.4] スペクトル次元と表現選択が高スペクトルデータを用いた照度推定性能に及ぼす影響について検討する。
結果は、高スペクトル情報を効率的に照度推定に活用する方法に関する実践的な洞察を与える。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:19:20 GMT)
IndustryBench: Probing the Industrial Knowledge Boundaries of LLMs [24.2] 我々は,中国における産業調達QAのための2,049石のベンチマークであるIndustrialBenchを紹介する。
本研究は,LLM生成候補の70.3%を探索に基づく外部検証段階において拒絶する。
我々の評価は、Qwen3-Max の判断により、ドメインの専門家に対して$_w = 0.798$で検証された生の正当性を分離する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:35:15 GMT)
Moltbook Moderation: Uncovering Hidden Intent Through Multi-Turn Dialogue [24.1] textsctextbfBot-Mod(textsctextbfBot-Moderation)は,従来のコンテンツレベルの信号ではなく,エージェント意図による検出を基盤とするモデレーションフレームワークである。
結果から,textsctextbfBot-Modは, エージェントの意図を, さまざまな対向的な構成で確実に識別することを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:04:16 GMT)
VIP-COP: Context Optimization for Tabular Foundation Models [23.9] VIP-COPは、トレーニング例の予測における重要度の価値と、TFMのハードコンテキスト最適化の特徴を推定する。
その明示的な選択メカニズムはノイズを抑制し、影響力のあるデータを分離する。
VIP-COP は (i) 高速で、最適化の数分以内に性能を向上する; (ii) 予算に気付き、いつでも、追加のテスト時間計算で改善する; (iii) モデルに気付き、完全にブラックボックスで、モデル内部へのアクセスを必要としない; (iv) 解釈可能で、離散的な重要な予測者の(サンプル)を識別する。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:28:31 GMT)
Margin-calibrated Classifier Guidance for Property-driven Synthesis Planning [23.8] 比較的議論とマージンに基づく損失を利用して分類器の校正を行うSCR(Sequence Completion Ranking)を導入する。
SCRはマルチステップ解決率を16.8%ドル(無誘導発電機)から78.4%ドル(反応型誘導)、9.3%ドル(谷本誘導)に大幅に改善している。
また,テンプレートフリー手法とテンプレートベース手法の長期的多様性ギャップを効果的に解消する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:12:53 GMT)
What Does LLM Refinement Actually Improve? A Systematic Study on Document-Level Literary Translation [23.8] 反復自己精製は機械翻訳のための単純な推論時間戦略である。
本稿では,文書レベルの文学翻訳の体系的研究について述べる。
文書レベルのMTとセグメントレベルの改良により、堅牢で安定した改善が得られます。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:27:32 GMT)
Context Training with Active Information Seeking [23.7] 私たちは、アクティブな情報検索のために、Wikipediaの検索とブラウザツールを使ってコンテキストを調整します。
提案手法は,複数の候補コンテキストの維持と具体化を行う検索ベーストレーニング手法と組み合わせることで,一貫した,実質的な成果が得られることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:15:32 GMT)
Asymmetric On-Policy Distillation: Bridging Exploitation and Imitation at the Token Level [23.6] オンライン蒸留(OPD)は、トークンレベルの教師のフィードバックで生徒を自身の軌道で訓練する。
その標準的優位重み付け政策勾配は、高分散更新、ゼロアドバンテージ領域での勾配の消失、補正信号が不十分な場合の探索ボトルネックなどの3つの構造的弱点に悩まされている。
正の強化学習を保ちつつ,非正の負の強化を非正の利得領域における局所的な発散最小化に置き換える非対称オンポリシィ蒸留(AOPD)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:44:13 GMT)
The WidthWall: A Strict Expressivity Hierarchy for Hypergraph Neural Networks [23.5] ハイパーグラフの表現性は、アーキテクチャが検出・カウントできる小さなパターンによって制御されていることを示す。
準同型密度はすべての連続なハイパーグラフ不変量を生成し、ハイパーツリー幅でインデックス付けされた厳密な階層に整理することを示す。
これはWidth Wallを生み出します: 隠された次元、トレーニング手順、あるいは固定深度HGNNがより広いパターンを必要とする不変を表現できない、基本的なアーキテクチャ上の制限です。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:43:31 GMT)
Polyhedral Instability Governs Regret in Online Learning [23.5] このような問題における後悔は,活動領域の変化の回数という,多面的不安定性によって支配されることを示す。
合成および実問題に関する実験は、予測スケーリングを検証し、動作の明示的な列挙なしに、実際に低不安定が生じることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:45:44 GMT)
Discrete Diffusion for Complex and Congested Multi-Agent Path Finding with Sparse Social Attention [23.4] MAPF(Multi-Agent Path Finding)は、グローバルに一貫した計算を必要とする協調問題である。
密集した環境では、最適でない初期計画は複合的な紛争を引き起こし、実現可能な修復を妨げる。
本稿では,分散拡散確率モデル(D3PM)をLSS2と統合したハイブリッドフレームワークDiffSLNを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:10:22 GMT)
Offline Two-Player Zero-Sum Markov Games with KL Regularization [23.3] オフライン2プレイヤーゼロサムマルコフゲームにおけるナッシュ均衡の学習問題について検討する。
我々はまず,高速な$widetildemathcalO(1/n)$収束率を実現する理論フレームワークであるRegularized Offline Sequential Equilibrium (ROSE)を紹介した。
次に,最小二乗値推定と反復的自己再生更新に基づく実用的モデルフリーアルゴリズムであるSequential Offline Self-play Mirror Descent (SOS-MD)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:29:21 GMT)
DisAgg: Distributed Aggregators for Efficient Secure Aggregation in Federated Learning [23.1] フェデレートラーニングは分散クライアント間で協調的なモデルトレーニングを可能にするが、vanilla FLはクライアントのアップデートを中央サーバに公開する。
我々は、アグリゲータと呼ばれるクライアントの小さな委員会を利用してアグリゲータ自体を実行するDisAggと呼ばれる新しいプロトコルを提案する。
DisAggは100k 5Gクライアントから100k次元の更新ベクトルを処理し、4.6倍のスピードアップを実現した。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:56:12 GMT)
Unified generalization analysis for physics informed neural networks [23.1] 我々は、入力変数に対する微分を含むニューラルネットワークのバウンダリを導出し、PINNとVPINNを統一されたフレームワークでカバーする。
微分作用素の非線形性は指数関数的に境界を拡大し、一般化に大きな影響を与えることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:42:33 GMT)
Min Generalized Sliced Gromov Wasserstein: A Scalable Path to Gromov Wasserstein [23.1] min Generalized Gromov--Wasserstein (min-GSGW) はGromov--Wasserstein (GW) 問題に対する表現的一般化スライサを用いたスライス式である。
min-GSGWは,既存のGW解法よりも計算コストが大幅に低い有意義な幾何対応とGW目標値を生成することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:33:10 GMT)
Improving Code Translation with Syntax-Guided and Semantic-aware Preference Optimization [22.9] 我々は、ソースコードから直接、コード翻訳に対する堅牢なセマンティック報酬を導き出さなければならないと論じている。
本稿では,構文ガイダンスとセマンティック・アウェア・プライオリティ最適化によるコード翻訳改善のためのCTOを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:19:39 GMT)
GenCape: Structure-Inductive Generative Modeling for Category-Agnostic Pose Estimation [22.6] カテゴリに依存しないポーズ推定(CAPE)は、任意のカテゴリからクエリイメージ上のキーポイントをローカライズすることを目的としている。
我々は、画像ベースのサポート入力のみからキーポイント関係を推論するCAPEのためのジェネレーティブベースのフレームワークであるGenCapeを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:17:20 GMT)
Ergodic Imitation for Adaptive Exploration around Demonstrations [22.5] 模倣学習における一般的な課題は、トレーニングとデプロイメント条件のミスマッチである。
本稿では,探索されたデモの幾何学から目標分布を構成する適応型エルゴード模倣手法を提案する。
提案手法は,地域被覆と探索において従来の役割を超えてエルゴード制御を拡張し,適応的模倣のための検索ベースのレディング・ホライゾン・フレームワークに実演を取り入れた。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:06:46 GMT)
WARDEN: Endangered Indigenous Language Transcription and Translation with 6 Hours of Training Data [22.5] 本稿では,Wardamanを英語に翻訳・翻訳できる早期言語モデルシステムであるWARDENを紹介する。
注釈付きオーディオは6時間しかありません。
この2段階の設計は、極めて低いデータ設定において、データハングリーな統一アプローチよりも優れていることを実証的に実証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:59:52 GMT)
FrameSkip: Learning from Fewer but More Informative Frames in VLA Training [22.4] VLA(Vision-Language-Action)ポリシーは、密集したロボットの実証軌道から一般的に訓練されている。
我々はこの慣例が時間的監督の不均衡を生み出すと論じている。
データ層フレーム選択フレームワークであるFrameSkipを紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:38:05 GMT)
Realtime-VLA FLASH: Speculative Inference Framework for Diffusion-based VLAs [22.0] Realtime-VLA FLASHは投機的推論フレームワークであり、リプラン中のほとんどの完全な推論コールを排除している。
LIBEROでは、FLASHが58.0msのフル推論ラウンドを7.8msの速さで投機ラウンドに置き換えることで、タスクパフォーマンスをほぼ維持できることが示されている。
また,実世界のコンベアベルトソートにおける実効性を実証し,遅延クリティカルな実施課題に対する実用的影響を強調した。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:57:51 GMT)
Context Matters: Auditing Gender Bias in T2I Generation through Risk-Tiered Use-Case Profiles [22.0] 本稿では,テキスト・ツー・イメージ(T2I)モデルにおける性別バイアスに対するリスク整合型監査フレームワークを提案する。
メトリクスは、測定対象、どの仮定、どのように解釈されるべきかについて、共有ビューなしで報告されることが多い。
本研究では,ジェンダーバイアス評価手法を統合し,これらを3つの尺度に分類する計量カタログを構築した。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:25:04 GMT)
Data Difficulty and the Generalization--Extrapolation Tradeoff in LLM Fine-Tuning [21.9] 教師付き微調整中のデータ選択は、大規模言語モデル(LLM)の振る舞いを批判的に変えることができる
本研究では,実験と理論の両方の観点から,データの微調整における難易度の役割について検討する。
固定データ予算では、SFTに最適なデータ困難が存在し、データ予算が増加するにつれて、この最適な困難はより難しいデータへと移行することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:33:04 GMT)
Mechanistic Interpretability of EEG Foundation Models via Sparse Autoencoders [21.7] 脳波基礎モデルは最先端の臨床成績を達成するが、それらの予測を駆動する内部計算は不透明である。
アーキテクチャ的に異なる3つのEEGトランスにTopKスパースオートエンコーダを適用する。
アーキテクチャ間のモノセマンティリティと絡み合いをベンチマークします。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:02:56 GMT)
EMO: Frustratingly Easy Progressive Training of Extendable MoE [21.7] 現在のMoEトレーニングは、初期データがそのような能力を完全に活用していないとしても、当初から多くの専門家を割り当てている、と我々は主張する。
これは、MOE容量を拡張可能なメモリとして扱い、トレーニングの過程でエキスパートプールを成長させる単純なプログレッシブトレーニングフレームワークである。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:31:09 GMT)
LLMs as annotators of credibility assessment in Danish asylum decisions: evaluating classification performance and errors beyond aggregated metrics [21.6] オフザシェルフの大規模言語モデル(LLM)は、テキストアノテーションの自動化にますます利用されている。
デンマークのテキスト分類データセットであるRAB-Credを紹介した。
本研究は,21個のオープンウェイトモデルと30個のシステム・ユーザ・プロンプトの組み合わせをベンチマークし,ゼロショットと少数ショットの分類におけるモデルとプロンプトの選択の効果を体系的に評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:07:47 GMT)
SimWorld Studio: Automatic Environment Generation with Evolving Coding Agent for Embodied Agent Learning [21.5] SimWorld StudioはUnreal Engine 5上に構築されたオープンソースのプラットフォームで、進化するエンボディド学習環境を生成する。
コアとなるSimCoderは、ツール/スキル強化されたコーディングエージェントで、エンジンレベルのコードを書き、実行して、物理的に接地された3D世界を構築する。
生成された世界は、具体的エージェント学習のためのGymスタイルの環境としてエクスポートされる。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:34:40 GMT)
AIS: Adaptive Importance Sampling for Quantized RL [21.4] 大規模言語モデル(LLM)の強化学習はロールアウト生成のコストに支配されている。
これは、ロールアウトトレーニングミスマッチを導入し、ポリシー勾配を偏り、推論ベンチマークでトレーニングが完全に崩壊する可能性がある。
このミスマッチは非定常的であり、二重刃の剣として機能し、初期のトレーニングでは探索ボーナスを提供し、トレーナーがアンダーサンプするトラジェクトリーへの勾配を露呈する。
本稿では,適応的重要度サンプリング(AIS)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:36:57 GMT)
Coordinating Multiple Conditions for Trajectory-Controlled Human Motion Generation [21.4] 軌道制御された人間の動き生成は、テキスト記述と空間軌跡の両方に条件付けられた現実的な人間の動きを合成することを目的としている。
既存の手法は2つの限界に悩まされる: まず、テキストと軌道条件の衝突はデノナイジングの過程を妨害し、結果として運動の質が損なわれるか、軌道の追従が不正確なものとなる。
そこで本研究では,テキストとトラジェクトリ条件を分割コンカレント戦略により効果的にコーディネートする,分離されたフレームワークであるMCCを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:09:04 GMT)
Provable Quantization with Randomized Hadamard Transform [20.9] ディザバージョンのTurboQuantが平均2乗誤差$bigl(sqrt3/2 + obigr) cdot 4-b$ at $b$ bits per coordinate。
ディザバージョンのTurboQuantが平均2乗誤差$bigl(sqrt3/2 + obigr) cdot 4-b$ at $b$ bits per coordinate。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:38:18 GMT)
Causality-Aware End-to-End Autonomous Driving via Ego-Centric Joint Scene Modeling [20.8] 本稿では、CaADと呼ばれる、因果認識のエンドツーエンド自動運転フレームワークを提案する。
まず,限界予測分岐上に構築されたエゴ中心の合同因果モデリングモジュールを提案する。
第2に,エゴ政策を計画指向閉ループフィードバックと整合させるために,共同モード埋め込みで実装した因果対応政策アライメントステージを採用する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:06:22 GMT)
AcquisitionSynthesis: Targeted Data Generation using Acquisition Functions [20.6] 本稿では,獲得関数を報酬モデルとして用い,高品質な合成データを生成するための言語モデルを訓練する。
数学、医学的質問応答、コーディングの古典的検証タスクについて実験を行った。
実験結果から,AcquisitionSynthesisデータを用いて訓練した学生モデルは,分配作業において良好な性能を示し,破滅的な忘れ込みに対してより堅牢であることが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:15:48 GMT)
Temper and Tilt Lead to SLOP: Reward Hacking Mitigation with Inference-Time Alignment [20.6] 推論時間アライメント技術は、軽量な代替手段を提供するか、コストのかかる強化学習を補完する。
基準モデル温度調整を導入することで,これらの手法を拡張した。
ハッキングに対する報奨として,SLOP重みパラメータを校正するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:47:06 GMT)
Masked Autoencoders with Limited Data: Does It Work? A Fine-Grained Bioacoustics Case Study [20.5] Masked Autoencoders (MAE) は大規模な音声コーパスに強い伝達性を示す。
iNatSoundsの種分類におけるMAE事前学習の系統的研究を行った。
以上の結果から,中程度に微粒な生体音響条件下では,事前学習の規模が主観的な設計を担っていることが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:45:08 GMT)
TouchAnything: A Dataset and Framework for Bimanual Tactile Estimation from Egocentric Video [20.4] EgoTouchは大規模なエゴセントリックなデータセットで、手動オブジェクトのインタラクションを厳密な触覚で監視する。
TouchAnythingは、自我中心のビューを主入力として使用する、視覚と触覚の予測フレームワークである。
データセット、コード、ベンチマークを公開します。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:54:36 GMT)
Interpretable Machine Learning for Antepartum Prediction of Pregnancy-Associated Thrombotic Microangiopathy Using Routine Longitudinal Laboratory Data [20.3] P-TMAでは, 早期のリスク予測が困難である。
本研究は機械学習を用いて長期臨床検査から潜伏時間依存型リスクシグネチャを抽出した。
モデルは0.872のAUROCと0.883のAUPRCを保持試験コホートで達成し、感度は0.750、特異度は0.812である。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:07:00 GMT)
WD-FQDet: Multispectral Detection Transformer via Wavelet Decomposition and Frequency-aware Query Learning [20.2] そこで本研究では,赤外線と可視光からのモダリティ共有情報とモダリティ固有情報を明確に分離する新しい検出フレームワークを提案する。
FLIR、LLVIP、M3FDデータセットの実験結果から、WD-FQDetは複数の評価指標で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:51:05 GMT)
PanoWorld: Towards Spatial Supersensing in 360$^\circ$ Panorama World [20.2] 本研究では, MLLMが連続的, 観測中心空間としての正方形射影パノラマを推論するために必要となるパノネイティブ理解について検討する。
球面形状を視覚ストリームに注入する球面空間交叉型パノワールドについて紹介する。
実験によると、PanoWorldはPanoSpace-Bench、H* Bench、R2R-CE Val-Unseenベンチマークにおいて、プロプライエタリベースラインとオープンソースベースラインの両方を大幅に上回っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:31:22 GMT)
Boosting Omni-Modal Language Models: Staged Post-Training with Visually Debiased Evaluation [20.1] 本研究は,現在行われているOmni-modalベンチマークにおいて,真の音声-視覚-言語証拠統合と視覚的ショートカットを区別するか否かを考察する。
視覚のみの探索で9つのOmni-modalベンチマークを監査し、視覚的に解決可能なクエリを削除し、完全なサブセットを保持する。
視覚的漏洩を制御する場合,オムニモーダルな進行が容易に解釈できることが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:38:46 GMT)
One Token Per Frame: Reconsidering Visual Bandwidth in World Models for VLA Policy [20.1] 視覚言語アクション(VLA)モデルは、長い地平線を計画するために補助的な世界モジュールにますます依存している。
OneWM-VLAは、Adaptive Attention Poolingを通じて、各ビューをフレーム毎に単一のセマンティックトークンに圧縮する。
フレームごとの視覚的帯域幅を1つのトークンに減らすことができ、長い水平性能を損なうことなく実現できる。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:21:29 GMT)
Diversity of Extensions in Abstract Argumentation [19.8] 対称差に基づく拡張の多様性の概念を導入し、体系的な複雑性分類を提供する。
我々は、議論フレームワーク(AF)がk-diverse拡張を認め、特定の引数をカバーするk-diverse拡張を認め、AFがk-diverse拡張を認める最大kを計算するかどうかを検討する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:51:41 GMT)
Stochastic global optimization of continuous functions via random walks on Grassmannians [19.7] グラスマン多様体上のランダムウォークに基づく大域的最適化手法を提案する。
この方法は、ランダムな$k$次元の線形部分空間を繰り返しサンプリングする。
我々は、反復が世界最小値に近づく速度を制御するギャップパラメータを同定する。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:06:50 GMT)
From Instance Selection to Fixed-Pool Data Recipe Search for Supervised Fine-Tuning [19.7] Supervised Fine-tuning (SFT) データ選択は、一般的にインスタンスランキングとして定式化される。
効果的なSFTトレーニングサブセットは、しばしば順序づけられたキュレーションレシピによって生成される。
キャッシュされたタスク、データ、モデル側信号に基づいて、固定プールの実体化を分離する2層解法であるAutoSelectionを導入する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:27:21 GMT)
Decision Tree Learning on Product Spaces [19.6] 任意の関数 $fimat$ に対して、$s$, max depth $D_textopt$, average depth $_textopt$ が最適な決定木で計算可能であることを示す。
また、最適化木の大きさや深さに関する事前知識を必要とせず、完全にパラメータフリーであるトップダウンの欲求に基づくアルゴリズムも提示する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:26:24 GMT)
Beyond Oversquashing: Understanding Signal Propagation in GNNs Via Observables [19.6] 本稿では、観測可能量の概念を用いて、量子力学にインスパイアされた信号伝搬をモデル化するための代替手法を提案する。
標準スペクトルGNNは信号伝搬能力に乏しいことを示す。
そこで我々はSchrdinger GNNと呼ばれる新しいスペクトルGNNを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:38:35 GMT)
A Regret Perspective on Online Multiple Testing [19.6] 我々は,信号スパースコール開始時に,純粋に決定論的に$(T)$線形後悔のペナルティを生じることを論じる。
歴史分離された厳密な非負のランダム摂動を組み込むことで,デカップリングOMT(DOMT)をベースラインに依存しないメタラッパーとして提案する。
DOMTは、経験的な重み付けされた後悔を一貫して削減し、しきい値減少のオーダー-最適サブ線形緩和を達成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:42:46 GMT)
Mixed neural posterior estimation for simulators with discrete and continuous parameters [19.3] 我々は推定ネットワークを訓練し、与えられたパラメータよりも確率密度を推定する(典型的には不連続であると仮定される)。
我々はNPEを離散パラメータと連続パラメータを協調的に扱う推論ネットワークを通じて混合パラメータ空間に拡張する。
牽引可能な玩具の例と実世界のシミュレーターを通して、我々のジョイント推論アプローチは正確で校正された後部を産み出す。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:57:27 GMT)
LoKA: Low-precision Kernel Applications for Recommendation Models At Scale [19.3] 大規模レコメンデーションモデル(LRM)にFP8を実用化するフレームワークであるLoKAを提案する。
LoKA Probeは、アクティベーションとウェイト統計を学習し、層ごとのエラーを定量化する、統計的に基礎付けられたオンラインベンチマーク手法である。
LoKA Dispatchは、LoKA Probeの統計情報を利用して最速のFP8カーネルを選択するランタイムである。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:59:46 GMT)
Faithful or Fabricated? A Causal Framework for Rationalization Bias in LLM Judges [19.0] 大言語モデル(LLM)は、要約と対話評価のための自動判断器として、ますます使われている。
我々は LLM の審査員が Cue-invariant であるかどうかを問う。
我々は、一連のキュー介入(Blind, Truth, Flip, Placebo, Reveal-After)と、結果アンカーと合理性アンカーの定量化のためのタイアウェアメトリクスを導入します。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:00:16 GMT)
Normalization Equivariance for Arbitrary Backbones, with Application to Image Denoising [18.8] 正規化等価性(NE)は、画像から画像へのタスクの分散シフトを改善する構造的先行性である。
既存のNEメソッドはすべての内部層をNE互換の操作に制約する。
Wrapped Normalization Equivariance (WNE)は、入力を正規化し、バックボーンを適用し、出力を非正規化するパラメータフリーラッパーである。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:59:31 GMT)
\emph{DRIFT}: A Benchmark for Task-Free Continual Graph Learning with Continuous Distribution Shifts [18.8] 連続グラフ学習(CGL)は、破滅的な忘れを軽減しつつ、動的に進化するグラフから学習することを目的としている。
既存のアプローチでは、データストリームが事前に定義された境界を持つ独立したタスクのシーケンスに分割される、タスクベースの定式化が一般的である。
タスクフリーの観点から連続グラフ学習を再考し、現実的な非定常環境をよりよく反映する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:54:46 GMT)
MinT: Managed Infrastructure for Training and Serving Millions of LLMs [18.8] MindLab Toolkit(MinT)は、ローランド適応(LoRA)ポストトレーニングとオンラインサービスのためのマネージドインフラストラクチャシステムである。
MinTは、少数の高価なベースモデルデプロイメントに対して、多くのトレーニング済みポリシーが生成される設定をターゲットにしている。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:59:08 GMT)
Covariance-aware sampling for Diffusion Models [18.7] 画素空間拡散モデル(DM)サンプリングの品質を数ステップで向上する,協調型サンプリング器を提案する。
本手法は, 画素ベースのDMに対して, 最先端の2次サンプリング器と比較して, 常に優れたサンプルを生成できることを実証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:46:06 GMT)
TinySDP: Real Time Semidefinite Optimization for Certifiable and Agile Edge Robotics [18.6] Semidefinite cul (SDP) は、運動計画における凸緩和の原理的枠組みを提供する。
埋め込み動的トラクタビリティのためのTiny-Riccatiに基づく計算構造解法
論文参考訳(メタデータ) (Wed, 13 May 2026 16:30:32 GMT)
GeoBuildBench: A Benchmark for Interactive and Executable Geometry Construction from Natural Language [18.6] GeoBuildBench(GeoBuildBench)は、大規模言語モデルとマルチモーダルエージェントが、非公式な自然言語平面幾何学問題を実行可能な幾何学的構成に構築できるかどうかを評価するために設計されたベンチマークである。
我々は、有界反復条件でいくつかの最先端マルチモーダルモデルを評価し、合理的な成功率にもかかわらず、しばしば構造的幻覚、欠落物、幾何学的制約を満たす失敗を示すことを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:30:12 GMT)
What Limits Vision-and-Language Navigation ? [18.4] StereoNavは、現実世界のナビゲーションの一貫性を高めるために設計された、堅牢なVision-Language-Actionフレームワークである。
R2R-CEとRxR-CEの実験は、StereoNavが最先端のエゴセントリックなRGB性能を達成することを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:41:24 GMT)
Edit-Compass & EditReward-Compass: A Unified Benchmark for Image Editing and Reward Modeling [18.4] 画像編集と報酬モデリングのための統合評価スイートであるEdit- and Edit-Rewardを紹介する。
Edit-Rewardには6つの段階的な課題カテゴリにまたがる2,388のアノテーション付きインスタンスが含まれている。
構造的推論と慎重に設計されたルーリックに基づく細粒度多次元評価フレームワークを採用する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:33:54 GMT)
Discrete Stochastic Localization for Non-autoregressive Generation [18.2] ボトルネックは連続性そのものではなく、時間段階のノイズレジームに依存しているような表現である、と我々は主張する。
emphDiscreteは,単位球面トークンを埋め込んだ連続状態フレームワークである。
1つのトレーニングされたネットワークは、特別なケースとしてエンドポイントのマスク付き拡散パスを持つ、トークンごとのSNRパスのファミリー全体をサポートする。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:12:24 GMT)
Uncertainty-aware Spatial-Frequency Registration and Fusion for Infrared and Visible Images [18.1] Infrared and Visible Image Fusion (IVIF)は、挑戦的な環境下での視覚的タスクにおいて有望であることを示す。
これらを解決するための現在の研究は、粗い粒度(粗い粒度と粗い粒度)の変形パラメータを予測するか、複数スケールで変形場を推定するかのどちらかである。
本研究では,不確実性推定と赤外線放射分布の整合性を考慮した空間周波数登録・融合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:12:46 GMT)
Fashion130K: An E-commerce Fashion Dataset for Outfit Generation with Unified Multi-modal Condition [18.0] 我々はFashion130kという新しいeコマースデータセットを提案する。
我々は、テキストと視覚的プロンプトを協調して生成モデルに組み込むために、統一マルチモーダル条件(UMC)を用いたフレームワークを設計する。
実世界のアプリケーションとベンチマークの実験は、視覚的一貫性におけるUTCの有効性を実証している。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:54:11 GMT)
Does it Really Count? Assessing Semantic Grounding in Text-Guided Class-Agnostic Counting [17.9] オープンワールドテキスト誘導クラス非依存カウント(CAC)は、自然言語プロンプトを用いて任意のオブジェクトクラスをカウントするためのフレキシブルパラダイムとして登場した。
いくつかの最先端のCACモデルは、与えられたプロンプトに基づいてどのオブジェクトクラスをカウントすべきかを決定するのに苦労している。
モデル堅牢性と信頼性に着目した新しい評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:26:36 GMT)
Bayesian Model Merging [17.9] モデルマージは、複数のタスク固有のエキスパートモデルを、共同トレーニングなしで単一のモデルに結合することを目的としている。
本稿では,プラグインとプレイの双方向最適化フレームワークであるBayesian Model Merging (BMM)を紹介する。
BMMは、すべてのプラグアンドプレイアンカーベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:36:47 GMT)
20/20 Vision Language Models: A Prescription for Better VLMs through Data Curation Alone [17.8] データキュレーションは、20のVLMベンチマークにおいて、平均で+11.7ppの性能を向上できることを示す。
2BではInternVL3.5-2Bを9.9ppで17倍のトレーニング計算で上回りました。
データキュレーションは、より良いVLMを構築するための高平均ツールであり、最大150倍のトレーニング計算で最前線の精度に達する。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:55:26 GMT)
Uncertainty-Driven Anomaly Detection for Psychotic Relapse Using Smartwatches: Forecasting and Multi-Task Learning Fusion [17.7] 我々は,日常的再発検出のための2つのスマートウォッチベースのフレームワークを開発し,体系的に研究する。
第1の予測は、異常の指標として、予測された特徴と観察された特徴のずれを心臓力学とフラグで予測する。
2つ目は、睡眠と心臓由来の信号とを融合させるマルチタスクの定式化である。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:43:07 GMT)
MAP: A Map-then-Act Paradigm for Long-Horizon Interactive Agent Reasoning [17.7] 現在の対話型LCMエージェントは、事前に確立されるのではなく、実行中に環境理解がリアクティブに取得される、目標条件の段階的計画に依存している。
そこで我々は,環境理解を実践前に変化させるプラグイン・アンド・プレイ・フレームワークであるMap-then-Act Paradigm(MAP)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:46:29 GMT)
Amplification to Synthesis: A Comparative Analysis of Cognitive Operations Before and After Generative AI [17.5] 我々は2016年と2024年のアメリカ合衆国大統領選挙におけるXデータセット(元Twitter)の行動調整パターンと言語調整パターンを比較した。
発見によると、2024年のコーパスは2016年とは異なるパターンを示している。
これらの発見は、認知操作パイプラインにおける生成AIの役割を研究するための実証的なベースラインを提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:06:52 GMT)
VoxCor: Training-Free Volumetric Features for Multimodal Voxel Correspondence [17.4] クロスモーダルな3D医療画像解析には、画像コントラスト、スキャナー、取得プロトコル間で解剖学的に整合したボクセルワイズ表現が必要である。
最近の研究によると、凍結した2Dビジョントランスフォーマー(ViT)基盤モデルはそのような表現をサポートすることができるが、典型的なパイプラインは単一の軸に沿って特徴を抽出し、登録ソルバ内の特徴を一度に1つの画像対に適応させる。
凍結した2D ViT基礎モデルから再利用可能な容積特徴表現のためのトレーニング不要な適合変換法であるVoxCorを紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:20:26 GMT)
Deep Learning as Neural Low-Degree Filtering: A Spectral Theory of Hierarchical Feature Learning [17.2] 階層的特徴学習が明示的な反復スペクトル法となる勾配に基づく訓練のスタイリング限界であるニューラルローデグリーフィルタ(Neural Low-Degree Filtering:Neural LoFi)を導入する。
我々は、Neural LoFiが遅延ランダム特徴ベースラインよりも改善し、有意な構造化されたフィルタを復元し、実際のデータセットで早期の勾配差特徴発見と整合した表現を予測することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:44:06 GMT)
The Readability Spectrum: Patterns, Issues, and Prompt Effects in LLM-Generated Code [17.2] 主要言語モデル (LLM) が生成するコードの可読性は, 5,869 のシナリオで評価した。
現在のLLMは、人間が書いたコードに匹敵する全体的な可読性を持つコードを生成するが、異なる可読性の問題パターンを表示する。
この結果から,LLM生成コードは可読性において人書きコードと少なくとも同等であり,ソフトウェアへの体系的統合の可能性が確認された。
一方、異なる可読性の問題パターンとプロンプトエンジニアリングの有効性の制限は、遅れた技術的負債を明らかにします。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:58:21 GMT)
D-VLA: A High-Concurrency Distributed Asynchronous Reinforcement Learning Framework for Vision-Language-Action Models [17.2] Embodied AIにより、VLA(Vision-Language-Action)モデルが、マルチモーダル認識とタスク実行に優れるようになりました。
大規模分散環境におけるこれらの大規模なモデルへの強化学習の適用は、深刻なシステム的ボトルネックに直面します。
D-VLAは,大規模エンボディベースモデルのための,高精度で低レイテンシな分散RLフレームワークである。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:54:31 GMT)
PreFIQs: Face Image Quality Is What Survives Pruning [16.8] 顔画像品質評価(FIQA)は、顔認識(FR)システムにおける顔画像の有用性を評価する。
本稿では,Pruning Identified Exemplar (PIE)仮説に基づく,教師なしかつトレーニング不要なFIQAフレームワークであるPreFIQを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:53:19 GMT)
Tracing Persona Vectors Through LLM Pretraining [16.7] 言語モデルは、内部的にハイレベルな振る舞いを表すかは、AIの安全性に直接関連した、中核的な解釈可能性の問題である。
近年の研究では、悪や梅毒のような特徴は、内的活性化の線形方向、いわゆるペルソナベクトルに対応することが示されている。
OLMo-3プレトレーニングの0.22%以内において、ペルソナベクトルは驚くほど早い段階で形成され、完全に訓練後のインストラクションモデルのステアリングに有効であることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:44:23 GMT)
BlitzGS: City-Scale Gaussian Splatting at Lightning Speed [16.7] BlitzGSは分散3DGSフレームワークで、都市規模の高速な再構築のためにアクティブなガウスの作業量を削減している。
システムレベルでは、BlitzGSは空間分割に固有のクロスブロック冗長性を緩和する。
BlitzGSは、最近の大規模ベースラインのレンダリング品質に匹敵し、オーダー・オブ・マグニチュード・スピードアップを実現している。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:13:59 GMT)
A Standardized Re-evaluation of Conversational Recommender Systems on the ReDial Dataset [16.7] 我々は3つの建築ファミリにまたがる7つの顕著なCRS手法を再検討し、それらを標準化された条件下で評価する。
我々の研究は、粒度の細かいランキング(Recall@1)が実装の詳細に非常に敏感な「粒度ギャップ」を明らかにした。
レプリカ解析の結果、報告された精度の50%近くは、新規性に着目した評価に欠如している「反復ショートカット」に起因していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:20:43 GMT)
Hide to See: Reasoning-prefix Masking for Visual-anchored Thinking in VLM Distillation [16.5] 本稿では,学生に視覚情報に対する思考の定着を促す新しい思考答え蒸留フレームワークを提案する。
蒸留段階では,学生は将来のトークンと有意な推論手段の両方をブロックする有意な推論マスクによって指導される。
実験結果から,本手法は最近のオープンソースのVLM, VLM蒸留, およびマルチモーダル推論ベンチマークにおける自己蒸留法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:49:55 GMT)
EvObj: Learning Evolving Object-centric Representations for 3D Instance Segmentation without Scene Supervision [16.5] Evは教師なしの3Dインスタンスセグメンテーションシステムで、合成事前学習データと実世界の点雲の間の幾何学的領域ギャップを橋渡しする。
この問題を解決するためにEvは、(1)オブジェクト候補を動的に洗練し、対象ドメインに先立ってオブジェクトの継続的な適応を可能にするオブジェクト識別モジュール、(2)オブジェクト発見後に部分的なジオメトリを再構築するオブジェクト補完モジュールの2つの革新的なモジュールを統合する。
実世界のデータセットと合成データセットの両方で広範な実験を行い、全てのベースラインに対して優れた3次元オブジェクトセグメンテーション性能を示しながら、最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:17:45 GMT)
Generative Floor Plan Design with LLMs via Reinforcement Learning with Verifiable Rewards [16.4] プロのフロアプラン設計のためのAIシステムは、部屋間の接続性を尊重しながら、部屋の寸法と面積を正確に制御する必要がある。
既存の生成的アプローチは主に部屋間の要求された接続を尊重することに重点を置いているが、数値的な制約を尊重するフロアプランの生成はサポートしていない。
本稿では,大規模言語モデル(LLM)を実際の計画に微調整するテキストベースのフロアプラン生成手法を提案する。
本研究は,LLMが制約を効果的に処理できることを示し,テキストベース生成モデリングの幅広い応用を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:06:12 GMT)
SPHERICAL KV: Angle-Domain Attention and Rate-Distortion Retention for Efficient Long-Context Inference [16.4] 本稿では,KV割り当てを高速復号化のためのレート歪み問題として扱う長文推論手法であるSpherical KVを提案する。
この手法は, (i)デコードホットループにおいて, 方向性情報を安価に表現し, (ii) 予測された将来の有用性に応じて, 保持と精度を割り当てる2つのアイデアに基づいて構築される。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:48:48 GMT)
EgoForce: Robust Online Egocentric Motion Reconstruction via Diffusion Forcing [16.3] EgoForceは、ノイズの多いエゴセントリック入力から長期的なフルボディモーションを再構築するためのオンラインフレームワークである。
拡散強制にインスパイアされた時間的に非対称なノイズスケジュールを持つ拡散に基づく手法を採用する。
我々のアプローチは、新しいストリーミング観測が到着するにつれて、時間的に不確実性が変化し、段階的に状態を認知する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:53:26 GMT)
Direct Preference Optimization for English-Mandarin Code-Switching Speech Recognition in Audio LLMs [16.1] 音声大言語モデル(Audio LLMs)は、強い多言語機能にもかかわらず、コードスイッチング音声の書き起こしにおける体系的な失敗を示す。
選択された応答が混合言語コンテンツを保存する選好ペアを構成するモデルに、直接選好最適化を適用した。
このアライメントにより、MERは89.6%(分配中)と20.0%(分配外)まで減少する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:15:33 GMT)
3DSS: 3D Surface Splatting for Inverse Rendering [16.0] 3D Surface Splatting (3DSS)は、多視点画像から物理ベースの逆レンダリングを行うための最初の微分可能な表面スプラッティングである。
我々の中心的な洞察は、表面スプラッティングの中心における表面分離問題は、再構成カーネル自体の直接的な定式化を許すということである。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:24:19 GMT)
UxSID: Semantic-Aware User Interests Modeling for Ultra-Long Sequence [16.0] セマンティックグループ共有関心記憶という第3の経路を探索するフレームワークであるUxSIDを提案する。
セマンティックID(SID)とデュアルレベルのアテンション戦略を利用することで、UxSIDはアイテム特化モデルの重いコストを伴わずに、ターゲット認識の好みをキャプチャする。
このアーキテクチャは、セマンティックな認識、最先端のパフォーマンス、大規模広告A/Bテストにおける収益の0.337%を計算のパシモニーとバランスをとる。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:20:14 GMT)
FIND: Toward Multimodal Financial Reasoning and Question Answering for Indic Languages [15.9] FinVQAは、多言語Indicコンテキストにおける財務数値およびマルチモーダル推論を評価するためのベンチマークである。
FinVQAは、英語、ヒンディー語、ベンガル語、マラティー語、グジャラーティ語、タミル語にまたがっており、14の金融ドメインで18,900のサンプルで構成されている。
本稿では,教師付き微調整と制約認識デコードを組み合わせて,忠実な数値推論を促進するフレームワークFINDを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:45:42 GMT)
A Hierarchical Language Model with Predictable Scaling Laws and Provable Benefits of Reasoning [15.8] 階層構造を持つ合成言語群を紹介する。
自己回帰生成における文脈長と推論の役割を正確に分析することができる。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:42:26 GMT)
Spectral Flattening Is All Muon Needs: How Orthogonalization Controls Learning Rate and Convergence [15.8] ムオンの最大安定ステップサイズは、最大ではなく、勾配の平均特異値でスケールすることを示す。
我々はMuonを事前条件付き勾配法として再評価し、Kronecker-factored curvatureモデルの下で有効収束係数を改善することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:54:01 GMT)
Test-time Sparsity for Extreme Fast Action Diffusion [15.7] アクション拡散は、高忠実なアクション生成において優れるが、反復的なデノイングの性質のため、計算コストが重い。
この課題に対処するために,テスト時間間隔を提案する。これは,各モデルに対する動的に予測可能な残差計算をテスト時に前方に進めることで,動作拡散を加速することを目的としている。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:28:50 GMT)
Grounded Continuation: A Linear-Time Runtime Verifier for LLM Conversations [15.5] デプロイされたエージェントに対するコンテキスト操作攻撃は、このギャップを積極的に活用する。
明示的な依存性グラフを保持するランタイム検証器でそれをクローズします。
継続がサポートされるかどうかを確認することは、グラフウォークに還元され、リトラクションは同じグラフを通して、サポートを失う結論を正確に宣言する。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:54:16 GMT)
Stylized Text-to-Motion Generation via Hypernetwork-Driven Low-Rank Adaptation [15.5] テキスト駆動の運動拡散モデルは現実的な人間の動きを生成できるが、テキストだけではスタイルとして知られる動きの微妙なニュアンスを表現するのに苦労することが多い。
近年のアプローチでは、事前訓練されたテキスト駆動拡散モデルにスタイル注入機構を付加することでこの問題に対処している。
本稿では,ハイパーネットワークで生成されたLoRAパラメータを用いて,事前学習した拡散モデルを動的に変調する軽量なスタイル条件付けフレームワークを提案する。
HumanML3Dと100STYLEデータセットの実験は、最先端のスタイル化結果を示しながら、目に見えないスタイルのスタイル化の改善を実現している。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:51:54 GMT)
Universal Design and Physical Applications of Non-Uniform Cellular Automata on Translationally Invariant Lattices [15.4] 双曲格子は定数負の曲率と非アベリア対称性によって特徴づけられる。
正規ユークリッド格子と双曲格子の両方の翻訳アルゴリズムを開発する。
いくつかの応用を通して,双曲格子に対する広い適用性を示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:34:41 GMT)
Cognifold: Always-On Proactive Memory via Cognitive Folding [15.4] CogniFoldは脳にインスパイアされた「常にオン」エージェントメモリで、次世代のプロアクティブアシスタント向けに設計された。
補完学習システム理論を2層(ヒッポカンポス、ネオコルテックス)から3層に拡張し、事前の意図層を追加することで、これを裏付ける。
我々はCogEval-Benchを用いて構造形成を評価し、CogniFoldが認知期待に合致するメモリ構造を独自に生成することを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:34:39 GMT)
ATD-Trans: A Geographically Grounded Japanese-English Travelogue Translation Dataset [15.4] ATD-Trans(ATD-Trans)は、日英旅行語翻訳データセットである。
既存の言語モデルに対する実験では、言語焦点と地理的領域の2つの要因について検討した。
その結果,旅行ブログに記載されている地域空間を翻訳する上で,日本語の強化モデルの利点と難易度が浮き彫りになった。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:11:54 GMT)
Useful Memories Become Faulty When Continuously Updated by LLMs [15.2] 過去の経験から学ぶことは、2つの相補的な記憶から恩恵を受ける。
最近のエージェントメモリシステムは統合形式を追求している。
このような統合記憶は、有用な経験から導かれたとしても、しばしば障害となる。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:15:50 GMT)
Shortcut Mitigation via Spurious-Positive Samples [15.0] ショートカット緩和戦略は一般的に、トレーニングデータアノテーション、グループバランスの保留データ、あるいはすべてのグループの存在に依存します。
そこで本研究では,モデルがスプリアス属性に依存している小さなインスタンス群を特定するためのモデル解析手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:00:12 GMT)
Supervised Deep Multimodal Matrix Factorization for Interpretable Brain Network Analysis [14.9] 統合的脳ネットワーク解析のための解釈可能なフレームワークである Supervised Deep Multimodal Matrix Factorization (SD3MF) を提案する。
マルチモーダルコネクトームデータセットの実験では、SD3MFはCNNやGNNなど、強力なディープラーニングベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:26:18 GMT)
GradShield: Alignment Preserving Finetuning [14.8] GradShieldは、微調整中にLLM(Large Language Models)を保護する、原則的なフィルタリング手法である。
データポイント毎にFinetuning Implicit Harmfulness Score(FIHS)を演算することで、潜在的に有害なデータを除去する。
実用性能を維持しながら、連続してアタック成功率(ASR)を6%以下に維持する。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:19:55 GMT)
PRISM-X: Experiments on Personalised Fine-Tuning with Human and Simulated Users [14.8] パーソナライズ手法の有効性は、実際の人ではなくシミュレーションユーザーを用いて学術研究で評価されることが多い。
これにより、ユーザとそのシミュレートされた相手が、インタラクションパターンや判断においてどのように異なるかという疑問が提起される。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:21:14 GMT)
Utility-Oriented Visual Evidence Selection for Multimodal Retrieval-Augmented Generation [14.8] モデル出力分布に誘導される情報ゲインとしてエビデンスユーティリティを定義することにより、情報理論の観点からのマルチモーダルエビデンス選択を再構成する。
本稿では,軽量マルチモーダルモデルを用いて,エビデンスの有用性を効率的に推定する,トレーニング不要なサロゲート加速フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:54:31 GMT)
SciVQR: A Multidisciplinary Multimodal Benchmark for Advanced Scientific Reasoning Evaluation [14.7] SciVQRは数学、物理学、化学、地理学、天文学、生物学の54の分野をカバーするマルチモーダルベンチマークである。
タスクは、基本的な事実のリコールから、専門家によるソリューションを含む46%の複雑なマルチステップ推論まで様々である。
プロプライエタリモデルとオープンソースモデルの両方を含むMLLMの先導的評価は、複雑なマルチモーダル推論タスクの処理において、重大な制限を明らかにしている。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:10:21 GMT)
RS-Claw: Progressive Active Tool Exploration via Hierarchical Skill Trees for Remote Sensing Agents [14.6] 本稿では、エージェントがツール空間内でアクティブなエクスプローラーとして振る舞うべきであると論じる。
ツールエンドでのスキルカプセル化技術を活用することにより,RS-Clawを提案する。
このアーキテクチャは、ツール記述を階層的に構成し、エージェントがオンデマンドでシーケンシャルな意思決定を実行できるようにする。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:49:18 GMT)
Beyond Mode-Seeking RL: Trajectory-Balance Post-Training for Diffusion Language Models [14.6] TraFLは、凍結参照モデルに固定された報酬型ターゲット分布に対するポリシーを訓練する軌道バランスの目標である。
拡散互換のシーケンスレベルサロゲートと学習したプロンプト依存正規化を備えた拡散言語モデルに対して、これを実用的なものにする。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:14:46 GMT)
Scaling Retrieval-Augmented Reasoning with Parallel Search and Explicit Merging [14.4] MultiSearchはRLベースのフレームワークで、マルチクエリ検索と、検索した情報の明示的なマージを通じて制限に対処する。
各推論ステップにおいて、MultiSearchは複数の視点からクエリを生成し、外部情報を並列に検索し、関連する情報の範囲を広げる。
そして、このエージェントは、マージ処理時に取得した情報を統合精製し、SNRを改善し、より正確な推論を保証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:46:35 GMT)
Pyramid Forcing: Head-Aware Pyramid KV Cache Policy for High-Quality Long Video Generation [14.4] Pyramid ForcingはヘッドアウェアなKVCacheフレームワークで、ヘッドタイプをオフラインで識別し、振る舞い固有のキャッシュポリシーを割り当てる。
実験により、ピラミド強制はVBench-Longの長軸生成品質を一貫して改善することが示された。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:23:02 GMT)
Z-Order Transformer for Feed-Forward Gaussian Splatting [14.3] 本稿では,フィードフォワードガウススプラッティングに特化して設計されたトランスフォーマーアーキテクチャを提案する。
我々の重要な洞察は、ガウス人間の空間的・意味的関係は、まばらな注意機構によって効果的に捉えられるということである。
我々は,このZ順序戦略を組み込んで,重要な構造的詳細を保存しながら,冗長性を適応的に抑制する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:54:59 GMT)
QLAM: A Quantum Long-Attention Memory Approach to Long-Sequence Token Modeling [14.2] 量子系の重ね合わせ特性を利用して状態ベースシーケンスモデリングを強化する最初の研究の1つを紹介する。
QLAMは、歴史的情報の重ね合わせをエンコードする量子状態として隠された状態を表す。
QLAMは、sMNIST、sFashion-MNIST、sCIFAR-10など、標準画像分類ベンチマークの逐次変種に対して評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:56:20 GMT)
Unlocking Patch-Level Features for CLIP-Based Class-Incremental Learning [14.0] CLIのためのSPA(Semantic-Guided Patch-level Alignment)を提案する。
各クラスに対して、まず代表的で多様な視覚サンプルを作成し、それらをGPT-5に供給する。
これらの記述は、識別的パッチレベルの視覚的特徴の選択を導くために使用される。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:56:23 GMT)
Hierarchical Attacks for Multi-Modal Multi-Agent Reasoning [13.9] マルチモーダルマルチエージェントシステムのための階層的アタックフレームワークであるHAM$3$を紹介する。
認識層では、HAM$3$は視覚入力、テキスト入力、融合した視覚テキスト表現を摂動することで攻撃する。
通信層では、メッセージの内容と相互作用トポロジを破損させる通信レベルアタックを実行する。
推論層では、各エージェントの認知パイプラインに干渉する推論レベル攻撃を実行し、推論を偏り、最終的な決定を妥協する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:06:21 GMT)
Rethinking Graph Convolution for 2D-to-3D Hand Pose Lifting [13.9] グラフ畳み込みネットワーク(GCN)は3次元ポーズ推定に広く利用されている。
ハンドトポロジを2次元から3次元のリフトに組み込む最も効果的な方法かどうかを考察する。
標準的なマルチヘッド自己アテンションはGCNベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:39:24 GMT)
RepoZero: Can LLMs Generate a Code Repository from Scratch? [13.9] RepoZeroは、完全に自動化された実行ベースのレポジトリレベルの生成をスクラッチから検証できる最初のベンチマークである。
我々の結果は、RepoZeroをエンドツーエンドのコード生成のための、困難でスケーラブルで信頼性の高いテストベッドとして確立しています。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:42:33 GMT)
DP-Muon: Differentially Private Optimization via Matrix-Orthogonalized Momentum [13.8] DP-ムーン(DP-Muon)は、指数行列勾配をクリップするプライベートなムーン手順である。
我々は、DP-Muonが、対応する同一のサブサンプリングされたガウス会計士によって認証されたプライバシー保証を継承していることを証明する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:52:24 GMT)
Europe and the Geopolitics of AGI: The Need for a Preparedness Plan [13.8] 人工知能(AGI)システムは、最も経済的に有用な認知作業において人間と一致するか、超えるかのどちらかである。
本稿では,AGIがいつ出現するか,どのように地政学を再形成するか,ヨーロッパが適切に準備されているか,という3つの質問について検討する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:00:29 GMT)
McCast: Memory-Guided Latent Drift Correction for Long-Horizon Precipitation Nowcasting [13.7] McCast は降水流のメモリ誘導型遅延ドリフト補正法である。
遅延進化を明示的に補正することで、ステップワイズ予測の精度を向上する代わりに、マッカーストは時間的に整合性があり信頼性の高いロングホライゾン予測を生成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:51:24 GMT)
Position: Assistive Agents Need Accessibility Alignment [13.6] 現在のエージェントAIは、視覚的ユーザ設計の仮定と、BVIユーザが直面している検証、リスク、相互作用の制約のミスマッチにより、補助的なシナリオで失敗しがちであることを示す。
本稿では,アクセシビリティに整合した補助エージェントのためのライフサイクル指向設計パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:13:53 GMT)
AuraMask: An Extensible Pipeline for Developing Aesthetic Anti-Facial Recognition Image Filters [13.6] 対面認識(AFR)画像フィルターは、人には微妙だがコンピュータビジョンに盲目な方法で画像を変更する。
本稿では,AuraMaskを提案する。AFRフィルタを対角的に有効かつ審美的に許容できる新しい手法である。
我々は,AuraMaskフィルタが,オープンソース顔認識モデルに対する従来の手法の逆効果を満たすか,超えるかを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:16:12 GMT)
QUACOD: Quantum Optimization via Coordinate Descent for Scalable Drone Scheduling [13.6] 我々は,ドローンのスケジューリング問題を解決するために,Quantum Optimization via Coordinate Descent (QUACOD)アプローチを導入する。
我々の実験では、QUICODは最先端のSOTA(quantum-of-the-art)ドローンスケジューリング法よりも優れている。
これらの貢献は、ノイズの多い中間スケール量子(NISQ)時代の実用化に向けて量子コンピューティングを推し進める。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:08:52 GMT)
RoSplat: Robust Feed-Forward Pixel-wise Gaussian Splatting for Varying Input Views and High-Resolution Rendering [13.6] 一般化可能な3Dガウススプラッティングは、最近、新規ビュー合成の効率的なアプローチとして現れている。
既存の画素単位のフィードフォワード法は、推論中に入力ビューの数が異なる場合、オーバーライトレンダリングに悩まされる。
本稿では,複数の入力ビューにまたがる輝度の整合性を維持するための簡易なアルファ正規化手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:05:15 GMT)
MILM: Large Language Models for Multimodal Irregular Time Series with Informative Sampling [13.6] マルチモーダル不規則時系列(Multimodal irregular time series、MITS)は、不均一な数値およびテキストチャネルからの非同期および不規則なサンプルである。
我々は、MILM(Multimodal Irregular time series Language Model)を導入し、MITSをXML形式で時間順三重項として表現する。
我々の2段階モデル(MILM-2S)とその1段階モデル(MILM-Direct)は、複数のEHRデータセット上で最高の2番目に高い平均性能を達成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:58:42 GMT)
EMA: Efficient Model Adaptation for Learning-based Systems [13.5] 本稿では,進化する環境に適応するための学習ベースシステムを支援する最初のモデル適応システムであるEMAについて述べる。
これは、新しい環境の入力状態を以前に類似した状態と整合させる状態変換器を導入することで、高価なモデルトレーニングを減らす。
また、しばしば見過ごされるがコストのかかるデータラベリングのプロセスにも対処する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:26:06 GMT)
STOP: Structured On-Policy Pruning of Long-Form Reasoning in Low-Data Regimes [13.3] ロングチェーン・オブ・シークレット (Long CoT) 推論は多段階問題のパフォーマンスを向上させるが、過度な考えも引き起こす。
長文推論トレースを解析・解析するオンラインアルゴリズムSTOP(Structured On-policy Pruning)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:28:05 GMT)
Safety-Constrained Reinforcement Learning with Post-Training Reachability Verification for Robot Navigation [13.2] 本稿では,外部のTD3バックボーン上での条件付きバリュー・アット・リスク(CVaR)制約による最適化を通じて,リスクに敏感なポリシをトレーニングするフレームワークを提案する。
トレーニング中、このポリシーは累積コストに対するCVaR制約の下で最適化され、高コストテール結果に対する感受性が促進される。
重要な発見は、CVaR制約で訓練されたポリシーが、評価された状態の障害からより大きな安全マージンを維持することである。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:53:47 GMT)
CAVE: A Structured Credit Assignment Approach for Fragmented Visual Evidence Reasoning [13.0] 視覚的推論のための視覚的エビデンスのためのCredit Assignment (CAVE)を提案する。
CAVEは3つの相補的推論プロセス信号を介して、アクションレベルでの中間ステップの寄与を評価する。
TRACER-Benchは4つの非局所的かつ意味論的に不確定な推論次元を包含する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:50:24 GMT)
LLMs for Secure Hardware Design and Related Problems: Opportunities and Challenges [13.0] 大型言語モデル(LLM)は電子設計自動化(EDA)とハードウェアセキュリティに統合されている。
LLMは、レジスタ転送レベル(RTL)コードの生成、テストベンチの自動化、ハイレベル仕様とシリコン間のセマンティックギャップのブリッジなど、前例のない機能を提供する。
このレビューは、EDA合成、ハードウェア信頼、セキュリティのための設計、教育における重要な進歩を中心に組織された、LLM駆動ハードウェア設計における最先端技術に関する詳細な分析を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:27:49 GMT)
StormShield: Fingerprint-Based Detection and Mitigation of RRC Signaling Storms in O-RAN 5G RANs [13.0] StormShield は O-RAN Near-Real-Time (Near-RT) RAN Intelligent Controller (RIC) 上でxApp として実装されたシグナリングストーム攻撃の検出と緩和技術である。
gNBリソースが枯渇する前に、MUE(Malicious UE)を指紋でブロックする。
実験により, StormShieldは, 攻撃開始から106.5ms以内の平均検出精度97.6%で, gNB資源の枯渇を効果的に防止し, MUEを識別・ブロックすることを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:45:50 GMT)
HE-PIM: Demystifying Homomorphic Operations on a Real-world Processing-in-Memory System [12.9] ホモモルフィック暗号化(HE)は、暗号化されたデータに対する計算を可能にし、信頼できない計算環境に対して強力なプライバシ保証を提供する。
実際の採用は、高い計算複雑性、大きな暗号文サイズ、実質的なデータ移動によって制限されている。
Processing-In-Memory (PIM) は、メモリの周辺または内部での計算による有望な緩和である。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:36:03 GMT)
OSDN: Improving Delta Rule with Provable Online Preconditioning in Linear Attention [12.9] Online Scaled DeltaNetは、JRTスタイルのインコンテキストリコールをDeltaNetよりも32%改善した。
1.3Bパラメータにスケーリングすると、リコール残差比が39%減少する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:59:26 GMT)
GemDepth: Geometry-Embedded Features for 3D-Consistent Video Depth [12.9] ビデオ深度推定は、一眼的予測を時間領域に拡張し、コヒーレンスを確保する。
現在のアプローチは主にトランスフォーマーによる時間的平滑化に依存しており、厳密な3次元幾何学的整合性を維持するのに苦労している。
GemDepthは,カメラモーションとグローバル3D構造を明確に認識することが3D一貫性の前提条件である,という知見に基づいて構築されたフレームワークである。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:23:53 GMT)
bde: A Python Package for Bayesian Deep Ensembles via MILE [12.7] bdeは、サンプリングベースの推論メソッドMicrocanonical Langevin Ensembles (MILE)の効率的なJAX実装の上に構築されている。
高速なトレーニング、効率的なマルコフチェインモンテカルロサンプリング、回帰と分類のタスクにおける不確実な定量化のためのスキート学習互換推定器を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:52:49 GMT)
ScioMind: Cognitively Grounded Multi-Agent Social Simulation with Anchoring-Based Belief Dynamics and Dynamic Profiles [12.6] 大規模言語モデル(LLM)に基づくマルチエージェントシミュレーションは、社会的意見力学を研究するための強力なテストベッドを提供する。
エージェント推論で構造化された意見力学を橋渡しする認知基盤型シミュレーションフレームワークであるScioMindを紹介する。
我々はScioMindを実世界の政策議論シナリオで複数のケーススタディで評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:07:00 GMT)
Stochastic Matching via Local Sparsification [12.6] リアルタイム配車システムにおいて、主なボトルネックは、マッチ自体のタイミングではなく、しばしばローカル通信帯域幅である。
2段階の局所スペーシフィケーションフレームワークを導入することで、この課題を形式化する。
高度に制約された地方予算であっても、最適に近いグローバルマッチングが達成可能であることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:25:15 GMT)
DirectTryOn: One-Step Virtual Try-On via Straightened Conditional Transport [12.4] VTON法は事前学習した生成モデルで強い結果を得るが,多段階サンプリングへの依存は高い推論コストをもたらす。
本稿では,VTONの出力は条件入力によって非常に制約を受けており,条件付きサンプリング軌道は一般的な画像生成よりもはるかに直線的であることを示唆する。
我々は,1段階の蒸留工程を導入し,高効率で高品質なVTONの新しい標準を確立した。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:18:43 GMT)
Do Skill Descriptions Tell the Truth? Detecting Undisclosed Security Behaviors in Code-Backed LLM Skills [12.4] LLMエコシステムにおけるプログラムスキルは、自然言語記述と実行可能な実装ファイルから構成される。
本報告では, 実装がセキュリティ関連範囲内に留まっているかどうかを問うことで, 実装の不整合性について考察する。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:44:10 GMT)
Learning Perturbations to Extrapolate Your LLM [12.3] 埋め込み空間内の連続潜伏ベクトルの学習可能な変換によってトークンプレフィックスが摂動するフレームワークを提案する。
難解な限界確率の挑戦を克服するために、モデルパラメータの方程式を導出し、勾配降下により最適化する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:00:58 GMT)
Multi-Scale Dequant: Eliminating Dequantization Bottleneck via Activation Decomposition for Efficient LLM Inference [12.2] 量子化は、効率的な大言語モデル(LLM)の推論に不可欠である。
行列乗算のための高精度な低ビット重みを復号化するためのステップ変換は、現代のAIアクセラレーターにとって重要なボトルネックとなっている。
本稿では,GEMM臨界経路から重み/KV重みを除去する量子化フレームワークであるMulti-Scale Dequant(MSD)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:49:56 GMT)
MLGIB: Multi-Label Graph Information Bottleneck for Expressive and Robust Message Passing [12.0] グラフニューラルネットワーク(GNN)はディープメッセージパッシングの過度なシャッシングに悩まされ、指数関数的に成長する近隣からの情報は固定次元の表現に圧縮される。
マルチラベルグラフにおいて,この問題は個別の障害モードとなり,ノイズのあるラベル情報によって予測信号が希薄になることを示す。
本稿では,無関係なラベル雑音下での制約情報伝達としてマルチラベルメッセージパッシングを定式化するマルチラベルグラフ情報ボトルネック(MLGIB)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:54:20 GMT)
Physics-R1: An Audited Olympiad Corpus and Recipe for Visual Physics Reasoning [11.9] フィールドが視覚重複推論をどのように計測するかを歪曲する3つの未検出建設プラクティスを文書化する。
PhysCorp-A (6,432-record three-stage-audited multimodal corpus), PhysR1Corp (2,268-record closed-form RL pool), PhysicsOlymA (500 novel-source heldout olympiad eval with native difficulty labels and an EN/ET subset。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:00:57 GMT)
Reducing Bias and Variance: Generative Semantic Guidance and Bi-Layer Ensemble for Image Clustering [11.9] GSECは、ジェネレーティブなセマンティックガイダンスとアンサンブルラーニングによってバイアスを減らすように設計されたフレームワークである。
提案手法では,マルチモーダル大言語モデルを用いて意味記述を生成し,画像埋め込みを導出する。
比較実験により、GSECは6つのベンチマークデータセットで18の最先端メソッドを上回っていることが示された。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:52:34 GMT)
IV-ICL: Bounding Causal Effects with Instrumental Variables via In-Context Learning [11.8] IV-ICLは、因果効果の限界後部分布を直接学習し、その量子化として境界を導出するアモータイズされたベイズ内文脈学習法である。
合成および半合成IVベンチマーク上でIV-ICLを評価し,より信頼性が高く,より情報性の高い間隔を生成することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:00:08 GMT)
Certified Robustness under Heterogeneous Perturbations via Hybrid Randomized Smoothing [11.7] 混合離散連続入力に対する統一的ランダム化平滑化フレームワークを,解析的に抽出可能なナイマン-ピアソンの合同最悪の問題に対する定式化に基づいて導入する。
我々は,マルチモーダル・セーフティ・フィルタリングの枠組みを検証し,我々の知る限り,インタラクションに依存したテキスト・モーメント・セーフティ・フィルタリングにおける離散的・連続的な摂動に対する最初のモデルに依存しないNeyman-Pearson証明書を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:44:31 GMT)
expo: Exploration-prioritized policy optimization via adaptive kl regulation and gaussian curriculum sampling [11.5] 2つの軽量プラグインモジュールを用いたExploration-Prioritized Policy Optimization (EXPO)を提案する。
我々は6つの数学的推論ベンチマークでDeepSeek-R1-Distill-Qwen-1.5BとQwen3-8B-Baseの実験を行った。
AIME 2025 pass@32では13.34で、63.33パーセントから76.67パーセントに上昇し、8Bモデルでは平均2.66でパス@32が改善されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:42:03 GMT)
Watermarking Should Be Treated as a Monitoring Primitive [11.5] ウォーターマーキングは、生成モデルにおける証明、帰属、安全監視のために広く提案されている。
我々は、透かしは監視プリミティブとして扱われるべきであり、内部監視は、属性ごとの属性キーとメッセージによって避けられないと論じる。
本稿では,観測者が出力全体にわたって透かし信号を集約してエンティティレベルの情報を推測する,オブザーバベースの脅威モデルを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:10:04 GMT)
No Attack Required: Semantic Fuzzing for Specification Violations in Agent Skills [11.4] LLMを利用するエージェントは、文書を静かに削除したり、証明書をリークしたり、定期的なユーザリクエストで資金を転送したりできる。
私たちはこれらの仕様違反を次のように呼んでいます。 良心的な入力は、自身の仕様で自然言語のガードレールを破るスキルを引き起こします。
本稿では,エージェントスキルの仕様違反を自動的に検出する,目標指向のセマンティックファジリングフレームワークであるSefzを紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:57:06 GMT)
AgentLens: Revealing The Lucky Pass Problem in SWE-Agent Evaluation [11.3] 8つのモデルバックエンドから60個のSWEベンチ検証タスクの2,614個のOpenHandsトラジェクトリを評価した。
このサブセットで通過する軌道の中で、10.7%はラッキーパスと呼ばれる振る舞いを示す。
本稿では,SWEエージェント軌道のプロセスレベル評価フレームワークであるAgentLensを紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:00:57 GMT)
GHGbench: A Unified Multi-Entity, Multi-Task Benchmark for Carbon Emission Prediction [11.3] GHGbenchは、企業レベルの温室効果ガス予測のためのオープンデータセットとベンチマークである。
同社のトラックには、Scop 1+2とScop 3の開示を受けた1万2000社以上の企業からの3万2000社以上の企業記録が含まれている。
ビルの線路は、13のオープンソースから1つのスキーマに491,591年の記録を調和させる。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:20:49 GMT)
Why Latent Actions Fail, and How to Prevent It [11.2] ラテントアクションモデル(LAM)は、フレーム・ツー・フレームの変更を圧縮することで、ラベルのないビデオからアクションライクな表現を学習することを目的としている。
ワイヤード・ビデオのフレームは、エージェント自身の状態だけでなく、バックグラウンド・クラッタのような内在的状態も含んでいる。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:54:35 GMT)
Reinforced Collaboration in Multi-Agent Flow Networks [11.2] 我々は、フローネットワークを介してエージェントの協調を組織化し、洗練するデータ駆動型フレームワークMANGOを提案する。
MANGOは強化学習とテキスト勾配を統合し、ワークフローパスとエージェントの動作を協調的に最適化する。
実験の結果、MANGOは最先端のベースラインよりも最大12.8%の性能向上を実現し、効率を47.4%向上し、目に見えない領域に効果的に一般化した。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:26:07 GMT)
Beyond Perplexity: A Geometric and Spectral Study of Low-Rank Pre-Training [11.1] 検証の難易度が近い場合でも,低ランクの手法はフルランクの訓練と同等ではなく,互いに同等ではないことを示す。
低ランクアクティベーションは、トレーニングが進むにつれて、後層のフルランクから分岐し、GaLoreはフルランクを追跡する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:11:37 GMT)
Local Conformal Calibration of Dynamics Uncertainty from Semantic Images [11.1] 観測対応コンフォーマル不確実性局所校正(OCular)について紹介する。
OCcularは、認識情報を用いて不確実な定量化を保証する共形予測に基づくアルゴリズムである。
ランダムな摂動と有意なモデルミスマッチを考慮した二重積分器システムにおいて,本アルゴリズムの有効性を検証した。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:33:42 GMT)
Distributionally Robust Safety Under Arbitrary Uncertainties: A Safety Filtering Approach [11.1] 分布あいまいさ下で非線形システムの確率論的安全性を確保する方法について検討する。
提案手法は,安全性を確保するために,高性能な名目ポリシーと認証されたバックアップポリシーを切り替える,バックアップベースの安全フィルタリングフレームワーク上に構築されている。
本手法は,Dubins車から高速レーシングカー,戦闘機まで,3つのシステムを対象としたシミュレーションにより検証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:11:58 GMT)
Test-Time Hinting for Black-Box Vision-Language Models [11.0] Test-Time Hintingは、単一のVLMコールによるVLMパフォーマンスを改善し、ブラックボックスAPIアクセスのみを必要とする。
テスト時間ヒンティングは、自然画像のVQAベンチマークにおいて、複数の閉重VLMの精度を向上することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:35:22 GMT)
Revisiting Reinforcement Learning with Verifiable Rewards from a Contrastive Perspective [11.0] RLVRにおけるコントラストシーケンスレベルのポリシー最適化のためのフレームワークを提案する。
ConSPOはGRPOのクリップされた比率ベースのスコアを、長さ正規化されたシーケンスログ確率に置き換える。
ConSPOは、挑戦的な数学的推論ベンチマークにおいて、いくつかの強力なRLVRベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:02:36 GMT)
Events as Triggers for Behavioral Diversity in Multi-Agent Reinforcement Learning [10.9] これらの振る舞い遷移を定義するために、欠けている要素は$textbfevents$である、と我々は主張する。
本稿では,エージェントを行動から分離するフレームワークを紹介し,エージェントがイベントに応答して動作をインスタンス化する連続多様体をキャプチャする。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:22:03 GMT)
Cycle-resolved Cephalopod-Inspired Pulsed-Jet Robot With High-Volume Expulsion and Drag-Reduced Gliding [10.7] セファロポッドのパルスジェット移動は単独の放電現象ではなく、ジェット推進、受動グライダー、マントル補充を含む協調サイクルである。
本稿では,剛性ソフトなハイブリッド折り紙マントルを用いたパルスジェットロボットについて述べる。
実験の結果、ロボットは最初のジェットサイクルで0.5 m/s (3.8 BL/s)、平均速度は0.2 m/s (1.5 BL/s)に達することがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:04:07 GMT)
State-of-art minibatches via novel DPP kernels: discretization, wavelets, and rough objectives [10.6] 本稿では,ML のサブサンプリングツールボックスとして DPP を確立するプログラムに貢献する。
まず、ウェーブレットに基づくユークリッド空間上の新しい DPP を提案する。
次に,解析文の証明に適した連続DPPを離散カーネルに変換する方法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:54:37 GMT)
INSIGHTS: Demonstration-Based Summaries of Time Series Predictors [10.5] 時系列モデルのグローバルな説明を提供するための,モデルに依存しないユーザ中心のアプローチであるINSIGHTSを紹介する。
我々のアプローチは、設計における単純さ、効率、透明性を優先し、ステークホルダーがそのアウトプットを簡単に適用できるようにします。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:17:35 GMT)
CA2: Code-Aware Agent for Automated Game Testing [10.3] コールスタック情報を用いて効果的なテスト戦略を学習するCode Aware Agent (CA2)を提案する。
1)状態ベースと2)画像ベースという2種類の環境を計測し,効率的なコールスタック抽出をサポートする。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:52:35 GMT)
Limits of Personalizing Differential Privacy Budgets [10.3] パーソナライズされたプライバシ予算には大きな制限があり、平均的な見積もりでは、主要な要因は完全なパーソナライゼーションではなく、適切な効果的なプライバシ予算を選択することである。
プライベートデータセットとパブリックデータセットの混在したデータセットと,2レベルのプライバシ要件を備えたプライベートデータセットの設定において,一定の要素の改善を定量化する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:24:50 GMT)
Strikingness-Aware Evaluation for Temporal Knowledge Graph Reasoning [10.2] 本稿では,事象の発声度を定量的に評価するための特徴量評価フレームワークを提案する。
その後、重み付け係数として重み付けされたMRRやHits@kのようなメトリクスに統合される。
我々のフレームワークはより厳密な評価を提供し、卓越した事象を予測する分野を再考する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:17:54 GMT)
CA-GCL: Cross-Anatomy Global-Local Contrastive Learning for Robust 3D Medical Image Understanding [10.1] 3次元医用画像の理解において、微粒な視線前訓練は有意な可能性を秘めている。
既存のパラダイムは、しばしばテキスト埋め込み空間において深刻な表現の崩壊に悩まされる。
この分布の縮退は、モデルに過敏な変化を誘発し、信頼性の高い臨床展開を妨げる。
本稿では,これらの課題に対処する新しいクロス・解剖学的グローバル・ローカル・コントラシティブ・ラーニング・フレームワーク(CA-GCL)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:54:27 GMT)
Measuring Google AI Overviews: Activation, Source Quality, Claim Fidelity, and Publisher Impact [10.1] Google AI Overviews(AIOs)は間違いなく、生成AIの最も広く普及しているデプロイメントであり、AIが生成した回答に気づかない20億人のユーザにリーチしている。
2026年3月13日から4月21日にかけて,40日間の窓越しに,19の話題カテゴリーに55,393のトレンドクエリを発行した。
まず、AIOアクティベーションは13.7%、質問形式のクエリでは64.7%、政治的に敏感なトピックは著しく低い。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:34:39 GMT)
UIBenchKit: A unified toolkit for design-to-code model evaluation [10.1] デザイン・ツー・コードタスクの評価を統一するオープンソース統合ツールキットであるUIBenchKitを紹介した。
既存のツールのベンチマーク調査を行い、今後の改善の方向性を示すいくつかの知見を導出する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:06:41 GMT)
Reliability-Gated Source Anchoring for Continual Test-Time Adaptation [10.1] RMemSafeはROIDの拡張であり、凍結したソースの正規化予測エントロピーを使用して、目的のすべての明示的なソース結合の使用を減らします。
ASRと組み合わせて、RMemSafeは、マッチしたスプリットの連続破壊セルの8ドルに対して、最も低いエラーを達成している。
制御されたソース劣化スイープは、ROID+ASRよりも1.13タイムsの浅い損傷勾配を示し、優雅な劣化予測と一致している。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:38:08 GMT)
Rethinking Molecular OOD Generalization via Target-Aware Source Selection [10.1] SCOPE-BENCHは、明示的な物理化学的記述空間におけるクラスタレベルのパーティショニングに基づいて構築されたベンチマークである。
POMAは、知識伝達を検索-合成-適応パイプラインとして定式化するフレームワークである。
SCOPE-BENCHにおける最先端の3D分子モデルの予測誤差は平均5.9倍である。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:09:46 GMT)
Thinking Ahead: Prospection-Guided Retrieval of Memory with Language Models [10.1] ロングホライゾンのパーソナライズには、対話履歴からユーザ固有の事実を検索する対話アシスタントが必要である。
実際には、多くの関連する事実は、密集した検索条件下でのクエリと意味的相似性が低いことが多い。
本稿では,記憶の保存方法から検索を分離するPGR(Prospection-Guided Retrieval)を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:57:54 GMT)
Taming the Long Tail: Rebalancing Adversarial Training via Adaptive Perturbation [10.1] ディープニューラルネットワークは、敵の例に対して非常に脆弱である。
逆の例では、小さな摂動はモデルの性能を著しく低下させる。
本稿では,対人訓練中の摂動を適応的に調整するフレームワークであるRobustLTを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:51:46 GMT)
StampFormer: A Physics-Guided Material-Geometry-Coupled Multimodal Model for Rapid Prediction of Physical Fields in Sheet Metal Stamping [10.0] StampFormerはコンポーネントジオメトリとマテリアルストレス-制約応答を同時に使用してFAA結果を予測するフレームワークである。
FEAと比較すると, 4つの2次元場の平均相対誤差は8.5%以下であり, 3次元変位場の平均2乗誤差は1.2mm2以下であった。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:13:39 GMT)
Embodied Multi-Agent Coordination by Aligning World Models Through Dialogue [9.8] コミュニケーションは、エージェントが観察を共有し、彼らの世界モデルを調整することによって、このギャップを埋めることができます。
協調型家庭用ロボティクスのベンチマークであるPartinNRを自然言語対話チャネルで拡張し、部分的可観測性を持つ2つのエージェント間の通信を可能にした。
実験の結果,対話は40~83ポイントのアクションコンフリクトを減少させるが,サイレントコーディネートに対してタスク成功を低下させることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:48:14 GMT)
TurboGR: An Accelerated Training System for Large-Scale Generative Recommendation [9.6] ジェネレーティブレコメンデーション(GR)は、断片化されたシナリオ固有のアーキテクチャをトランスフォーマーベースの統一モデルに置き換える、有望なパラダイムとして登場した。
Ascend NPU上でGRを大規模にデプロイすることは、システムレベルの根本的な課題に直面します。
生成推薦のためのアセンド・アフィニティ・トレーニング・システムであるモデルを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:26:29 GMT)
SHM-Agents: A Generalist-Specialist Integrated Agent System for Structural Health Monitoring [9.6] 本稿では,ジェネリスト・スペシャリストエージェントシステムであるSHM-Agentsを提案する。
SHM-Agentsは、大規模言語モデルの推論と計画能力と、特殊アルゴリズムの問題解決能力を統合する。
SHM-Agents が様々なSHMタスクを正確かつ効率的に実行可能であることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:44:08 GMT)
SurF: A Generative Model for Multivariate Irregular Time Series Forecasting [9.6] 本稿では,イベントシーケンスと単位レート指数雑音を学習する生成モデルであるSurFを提案する。
実世界の6つのベンチマークで、SurFは地震、リツイート、タオバオに関する最高のRMSEを達成している。
厳格なLeft-outプロトコルの下では、SurFは5/6データセット上の古典的およびニューラル自動回帰ベースラインをすべて破る。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:46:48 GMT)
SREGym: A Live Benchmark for AI SRE Agents with High-Fidelity Failure Scenarios [9.6] SREエージェントの高忠実度ベンチマークであるSREGymを提案する。
SREGymは、現実世界のクラウドネイティブなシステムスタック上に構築されたライブシステム環境を公開する。
SREGymには90の現実的で挑戦的なSRE問題が含まれている。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:21:47 GMT)
BrainAnytime: Anatomy-Aware Cross-Modal Pretraining for Brain Image Analysis with Arbitrary Modality Availability [9.6] 我々は、34,899個の脳スキャンで事前トレーニングされた統合事前トレーニングフレームワークBrainAnytimeを提示する。
単一のモデルは、単一のT1スキャンから完全なマルチモーダルワークアップまで、利用可能などんな画像も受け入れる。
BrainAnytimeは、モダリティ固有のモデル、欠落したモダリティベースライン、大規模な脳MRI事前訓練基礎モデルを上回っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:32:28 GMT)
XTinyU-Net: Training-Free U-Net Scaling via Initialization-Time Sensitivity [9.6] データセット固有のU-Net構成を自動的に識別する学習自由選択フレームワークを提案する。
XTinyU-Netセグメンテーションは、400x-1600倍のパラメータを持つ重いnnU-Netベースラインに匹敵する精度を達成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:20:37 GMT)
BoostAPR: Boosting Automated Program Repair via Execution-Grounded Reinforcement Learning with Dual Reward Models [9.5] プログラム修復のための強化学習は、スパース実行フィードバックと、どの編集がバグを実際に修正するかが不明なシーケンスレベルの報酬によって妨げられる。
これらの課題に対処する3段階のフレームワークであるBoostAPRを紹介します。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:38:24 GMT)
Diffusion Models, Denoiser Architecture and Creativity [9.5] 人気の高いUNET Denoiserアーキテクチャの小さな変更が、クリエイティビティの非常に異なる形態をもたらすことを示す。
以上の結果から,デノイザアーキテクチャの帰納バイアスが真のターゲット分布と強く一致している場合にのみ拡散モデルが成功することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:45:42 GMT)
OpenAaaS: An Open Agent-as-a-Service Framework for Distributed Materials-Informatics Research [9.4] OpenAは、インテリジェントマテリアルデザインのためのオープンソースの階層型エージェント・アズ・ア・サービスフレームワークである。
マスターエージェントは、従属エージェントのデータや計算資源に直接アクセスすることなく、複雑な研究タスクを計画し、分解する。
ほぼデータ実行ノードとしてデプロイされるサブエージェントは、ローカルデータセットに対する完全な主権を保持する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:47:01 GMT)
Leveraging Multimodal Large Language Models for All-in-One Image Restoration via a Mixture of Frequency Experts [9.4] オールインワン画像復元は、多様な未知の劣化によって影響を受ける入力からクリーン画像の復元を目指している。
近年の手法は, 修復過程を導くために, 劣化特性を同定することによって, 高い性能を示した。
マルチモーダル埋め込みをガイダンスとして利用するマルチモーダル大言語モデル(MLLM)誘導画像復元フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:16:10 GMT)
Graph Neural Networks with Triangle-Based Messages for the Multicut Problem [9.4] 本稿では,エッジのみに特徴を割り当てる,適応型グラフニューラルネットワークアーキテクチャを提案する。
最大200ノードの合成および実世界のインスタンスを用いた実験により,本手法は解法の品質において最先端の解法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:33:13 GMT)
Formal Conjectures: An Open and Evolving Benchmark for Verified Discovery in Mathematics [9.4] フォーマル・コンジェクチャ(Formal Conjectures)は、Lean 4.0で形式化された2615の数学的問題文の進化ベンチマークである。
このデータセットは、数学的な証明発見のためのゼロ汚染ベンチマークを提供する1029のオープンリサーチ予想を特徴としている。
我々は,これらの形式化の正しさを保証するためのアプローチを,アクティブなコミュニティからのコントリビューションを生かしたオープンソースプロジェクトとして紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:33:15 GMT)
Mask-Morph Graph U-Net: A Generalisable Mesh-Based Surrogate for Crashworthiness Field Prediction under Large Geometric Variation [9.4] 有限要素衝突シミュレーションは正確だが計算コストがかかり、設計最適化での使用が制限される。
グラフニューラルネットワーク(GNN)に基づく機械学習サロゲートモデルは、より高速な代替手段を提供する。
本稿では,階層型グラフU-Netアーキテクチャの限界に対処する実践的アプローチであるMask-Morph Graph U-Netを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:04:58 GMT)
Bayesian In Vivo Tracking of Synapses using Joint Poisson Deconvolution and Diffeomorphic Registration [9.2] 非線形組織変形下で動く様々な輝度点源としてシナプスをモデル化するためのテンプレートベースの新しいフレームワークを提案する。
マウスで2週間にわたって観察された蛍光シナプスの2D+tシミュレーションデータセットと3D+t長手テクスチインバイオグラフィーデータセットについて,本フレームワークを実証した。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:49:22 GMT)
To discretize continually: Mean shift interacting particle systems for Bayesian inference [9.2] 非正規化密度から確率分布に対する積分を近似する新しい手法を提案する。
これらの手法は、経験的分布の最適量子化のための最近のアルゴリズムと同様に、古典的な平均シフトアルゴリズムを拡張している。
マルチモーダル混合、ベイジアン階層モデル、PDE制約逆問題など、幅広いベンチマークサンプリング問題に対して、それらの性能を実証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:48:00 GMT)
PRA-PoE: Robust Alzheimer's Diagnosis with Arbitrary Missing Modalities [9.0] 現実のアルツハイマー病(AD)の評価では、欠落のモダリティが一般的である。
暗黙の計算やモダリティ合成に依存する既存のアプローチは、しばしばモダリティの可用性と不確実性を明示的にモデル化することができない。
本稿では,PRA(Prototype-anchored Representation Alignment)とUA-PoE(Uncertainty-aware Product of Experts)の融合機構を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:54:21 GMT)
A Systematic Evaluation of Imbalance Handling Methods in Biomedical Binary Classification [9.0] 本研究では, バイオメディカルバイナリ分類における不均衡処理法(IHM)が予測性能に及ぼす影響を系統的に検討した。
我々は、ランダムアンダーサンプリング(RUS)、ランダムオーバーサンプリング(ROS)、SMOTE(SMOTE)、再重み付け(RW)、直接F1スコア最適化(DMO)の5つの代表IHMを評価した。
より複雑なモデルと非構造化データに対して明確な利点が観察された。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:57:38 GMT)
LEXI-SG: Monocular 3D Scene Graph Mapping with Room-Guided Feed-Forward Reconstruction [9.0] LEXI-SGは、RGBカメラ入力のみを用いたオープン語彙の3Dシーングラフのための初めての高密度モノクロマッピングシステムである。
提案手法は,オープン語彙基盤モデルのセマンティックな先行性を利用して,シーンを部屋に分割する。
LEXI-SGは、モノクロRGBだけで、正確でスケーラブルでオープンな3Dシーングラフを実現できることを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:19:02 GMT)
Dual-Pathway Circuits of Object Hallucination in Vision-Language Models [9.0] 視覚言語モデル(VLM)は、視覚知覚と自然言語理解をブリッジする際、顕著な能力を示した。
それらはしばしばオブジェクト幻覚を生成し、入力された画像から欠落したコンテンツを記述する。
本稿では,幻覚関連回路をVLMで識別し特徴付けるフレームワークであるDual-Pathway Circuit Analysisを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:20:01 GMT)
ArcVQ-VAE: A Spherical Vector Quantization Framework with ArcCosine Additive Margin [9.0] 本稿では,従来のVQ-VAEのコードブックにArcCosine Additive Margin VQ-VAE (ArcVQ-VAE)を提案する。
提案されたSAMPは、ボール境界ノルム正規化とArcCosine Additive Margin Lossで構成されている。
本稿では,ArcVQ-VAEが再現精度,表現多様性,サンプル品質の点で,ベースラインモデルと競合する性能を発揮することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:35:16 GMT)
Liouvillian spectral control for fast charging of quantum batteries [8.9] 開放量子電池における定常帯電は、発散動力学を司るリウヴィリア作用素のスペクトルギャップに依存することを示す。
我々の発見は、オープンな量子熱力学に関する基本的な知見を提供し、効率的なエネルギー貯蔵と高速充電ソリューションへの道を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:23:34 GMT)
Distribution Corrected Offline Data Distillation for Large Language Models [8.8] 強力な大規模言語モデルから小さなものへの推論トレースを蒸留することは、リソース制約された設定におけるインテリジェンスを改善するための有望な方法である。
教師が生成したトレースからのオフライン蒸留は、高品質でサンプル効率の高い監視を提供するが、分散的ドリフトに悩まされる。
そこで本研究では,教師の分散ドリフトを補正しつつ,教師が生成するオフラインデータの効率性と監督品質を保ちつつ,教師の分散ドリフトを補正する原理的オフライン推論蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:47:31 GMT)
Bayesian Nonparametric Mixed-Effect ODEs with Gaussian Processes [8.7] 力学モデリングは、薬理学、システム生物学、生理学、疫学を含む多くの科学分野の中心である。
本稿では,各被験者のベクトル場を共有集団成分と主観的偏差に定量化する非パラメトリック混合効果ODEモデルMEGPODEを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:57:01 GMT)
Task-Aware Automated User Profile Generation for Recommendation Simulation Using Large Language Models [8.7] 本稿では,推薦シミュレーションのための自動プロファイル生成フレームワーク APG4RecSimを提案する。
APG4RecSimは、最小限の監督で、現実的で、一貫性があり、堅牢なユーザープロファイルを構築する。
以上の結果から, APG4RecSimが生成するプロファイルは, 人気や位置によるバイアスに耐性があることが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:20:39 GMT)
Constitutional Governance in Metric Spaces [8.6] 我々はメートル法空間における立憲ガバナンスを提案し、集約、熟考、修正、合意、AIメディエーションを統合する。
作業ルールとして中央値を開発し、フレームワークレベルの保証を確立し、誤った報告が誠実な投票を弱く支配していることを証明します。
この作業は、デジタルコミュニティや組織の立憲民主的ガバナンスに対する包括的ソリューションを提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:23:34 GMT)
On the Limits of Latent Reuse in Diffusion Models [8.4] 我々は、両方のデータセットがほぼ低次元であるが、異なる部分空間の近くにあるかもしれないソースターゲット設定について考察する。
ソース潜在空間の凍結と再利用は、2つの量で制御された目標領域のスコア誤差を誘導することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:42:58 GMT)
LLM-Based Persuasion Enables Guardrail Override in Frontier LLMs [8.4] 我々は,同じフロンティア級LLMが他のフロンティア級LLMを説得し,説得力のあるエッセイを生み出すことを示す。
それぞれの組み合わせが複数のトピックで100%エッセイ生産に達することが分かりました。
我々は、エッセイ・プローブランナー、会話ごとの書き起こし、および判断出力をリリースする。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:51:56 GMT)
MedCore: Boundary-Preserving Medical Core Pruning for MedSAM [8.3] 我々はMedSAMのための構造化プルーニングフレームワークであるMedCoreを提案する。
MedCoreはSAM-to-MedSAM適応時に重要になった構造と、高いバウンダリレバレッジを持つ構造という2つのタイプの構造を保存している。
ポリプセグメンテーションベンチマークにおいて、MedCoreはパラメータを60.0%、FLOPを58.4%削減し、リカバリ後のDice 0.9549、Bundary F1388、HD95 5.14を達成している。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:42:39 GMT)
Flow Augmentation and Knowledge Distillation for Lightweight Face Presentation Attack Detection [8.3] モーションキューはFacePADに対して非常に差別的であるが、通常は明示的な光フロー推定を必要とする。
カラーホイール符号化された光の流れから,RGBフレームから外見の手がかりを抽出する2分岐型教師モデルを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:19:28 GMT)
Rethinking Layer Relevance in Large Language Models Beyond Cosine Similarity [8.3] その結果,コサインの類似性は,層除去による実際の性能劣化の指標として不十分であることが判明した。
本稿では,レイヤの除去によるモデル精度の実際の低下という,レイヤの関連性を評価するためのより堅牢な指標を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:51:25 GMT)
Model-Adaptive Tool Necessity Reveals the Knowing-Doing Gap in LLM Tool Use [8.1] 大規模言語モデル(LLM)は、外部ツールを呼び出す時と直接答える時を判断しなければならない自律的なエージェントとして、ますます機能します。
本稿では,各モデルの経験的性能に基づいて,ツール必要度をモデル適応的に定義する。
その結果,26.5~54.0%,30.8~41.8%のミスマッチが認められた。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:59:28 GMT)
WASHH: An Anchor-Aware Whale-Guided Selection Hyper-Heuristic for Continuous Optimization and SVC Configuration [8.1] ブラックボックス最適化のためのWhale-Guided Adaptive Selection Hyper-Heuristicを提案する。
WASHHは、PSOスタイルのメモリ、GWOスタイルのリーダ平均化、Dスタイルのバリエーション、ローカル座標探索、アンカー誘導精製を選択可能な検索動作として扱う。
10個の独立ランと12,000の評価を持つ10個の30次元のベンチマーク関数において、WASHHは最高ランクの1.10を達成し、10個の関数で最良または最良である。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:02:24 GMT)
Dywave: Event-Aligned Dynamic Tokenization for Heterogeneous IoT Sensing Signal [8.1] モノのインターネット(IoT)システムは、ユビキタスセンサーから不均一なセンシング信号を継続的に収集する。
これらの信号は本質的に非定常かつマルチスケールであり、標準的なトークン化技術に固有の課題を提起している。
本稿では,IoTセンサ信号の動的トークン化フレームワークであるDywaveを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:27:25 GMT)
Pause and Reflect: Conformal Aggregation for Chain-of-Thought Reasoning [8.0] 自己整合性を考慮した思考の連鎖(CoT)推論は、複数のサンプル推論パスを集約することで性能を向上させる。
集約不確実性に直接対処するCoT推論のコンフォメーション手順を導入する。
提案手法は,多数決を推理経路よりも重み付けしたスコアアグリゲーションに置き換え,共形リスク制御を用いた棄権規則を校正する。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:33:59 GMT)
MathAtlas: A Benchmark for Autoformalization in the Wild [8.0] 野生の大学院レベルの数学における最初の大規模自己形式化ベンチマークであるMathAtlasを紹介する。
MathAtlasには、52kの定理、定義、演習、例が含まれ、103の大学院数学の教科書から抽出された。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:35:46 GMT)
When Does Hierarchy Help? Benchmarking Agent Coordination in Event-Driven Industrial Scheduling [7.9] DESBenchは、階層的なイベント駆動スケジューリングにおけるエージェント調整を評価するためのベンチマークである。
我々は,中央集権的,階層的,階層的,ホロニックという,4つの代表的な調整パラダイムに注目している。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:33:28 GMT)
Fast and Compact Graph Cuts for the Boykov-Kolmogorov Algorithm [7.9] ボヤコフ・コルモゴロフアルゴリズム(BK)を理論的・実用的両面から再検討する。
高速かつコンパクトなBK (fcBK) アルゴリズムを提案し,時間的複雑性を$O(m|C|)$とする。
我々は,BKアルゴリズムを総合的なベンチマークで評価する場合,BKアルゴリズムの実装が最速であることが確認された。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:57:35 GMT)
Multilingual OCR-Aware Fine-Tuning and Prompt-Guided Chain-of-Thought Reasoning for Multimodal Large Language Models [7.8] 光文字認識(OCR)と多言語テキスト理解は、マルチモーダル大言語モデル(MLLM)の主要な障害モードのままである
我々は,大規模合成OCR-to-translationデータ生成,OCR-awareによる教師付き微調整,構造化された視覚連鎖とを組み合わせた,OCR対応多言語多言語学習フレームワークを提案する。
LLaMAベースのマルチモーダルアーキテクチャを用いて、劣化した視覚条件下でのOCR完全性、多言語翻訳精度、ロバスト性を大幅に改善する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:16:39 GMT)
Dual-axis attribution of zebrafish tectal microcircuits for energy-efficient and robust neurocomputing [7.7] 本研究は,ゼブラフィッシュ・テクタル・マイクロサーキットが2つの計算軸に沿って作用するかどうかを考察する。
textitns_TINサブ回路は、低いスパイクフットプリントを示すが、予測誤差に測定可能な影響を示す。
textitsuperficial_TINサブ回路が最も感度が高く、システムレベルの安定性を維持する上でのフィードバックのような役割を示唆している。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:05:43 GMT)
CineMesh4D: Personalized 4D Whole Heart Reconstruction from Sparse Cine MRI [7.5] 我々は,CineMesh4Dを提案する。CineMesh4Dは,シネMRIから患者固有の全ハートメッシュを直接再構築する新しいエンド・ツー・エンド4D(3D+t)パイプラインである。
CineMesh4Dは、再構築品質と動作一貫性の点で、既存のアプローチよりも優れています。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:05:08 GMT)
Drag within Prior Distribution: Text-Conditioned Point-Based Image Editing within Distribution Constraints [7.5] 拡散に基づく点編集は、雑音潜時摂動の多様体に局所的な摂動を適用することで、画像の意味や細部を操作できる。
伝統的な点ベースの編集は、運動軌跡を定義するためにハンドルとターゲットポイントのペアに依存している。
中間編集ステップの評価とガイドを行うCLIPベースのモデルを導入し、生成した結果がセマンティックに一致し続けることを保証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:05:31 GMT)
Retrieval-Augmented Tutoring for Algorithm Tracing and Problem-Solving in AI Education [7.4] KITE(Knowledge-Informed Tutoring Engine)は、RAG(Retrieval-Augmented Generation)ベースのインテリジェントチューリングシステムである。
意図を意識したソクラテス的反応戦略を使用して、異なる学生のニーズに対するサポートを調整する。
その結果,KITEは文脈的に接地し,適切な応答を得られることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:37:45 GMT)
Fine-tuning with Hierarchical Prompting for Robust Propaganda Classification Across Annotation Schemas [7.4] ソーシャルメディアでのプロパガンダ検出は、騒々しい、短いテキストと低いアノテーション契約のために困難である。
本稿では,プロパガンダ手法の意図に焦点をあてた新たな分類法を導入し,確立された高度なスキーマと比較する。
この結果は,弱いゼロショットベースラインを競合システムに変換するため,微調整が不可欠であることを示している。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:19:46 GMT)
Modeling AI-TPACK in Practice Insights from Teachers Multi-Agent Workflow Design [7.4] 本研究では,マルチエージェント教育システムの設計における教師の行動と認知基盤について検討する。
この結果から,教師の認知行動多様性に反応する足場の違いが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:55:03 GMT)
MIRACLE_Multi-Agent Intelligent Regulation to Advance Collaborative Learning Environment [7.4] 本研究では,メタ認知的レギュレーションを組織化することによって,社会共有レギュレーション(SSRL)を支援するMIRACLEシステムを紹介する。
学生は、MIRACLEを認知、規制、感情支援の効果的なファシリテーターとして捉えた。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:00:04 GMT)
An Activity-Theoretical Approach to Teacher Professional Development in Pedagogical AI Agent Design [7.4] この2サイクルの形式的介入研究は、教師が専門的な発達の後、AIエージェント作成から遠ざかる理由を調査した。
総合的なPDを完了したにもかかわらず、教師の87%は3週間以内に作成をやめた。
その結果は、実装の失敗を、ニーズ回避システムに対する合理的な応答として再設定した。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:12:45 GMT)
LeanSearch v2: Global Premise Retrieval for Lean 4 Theorem Proving [7.3] リーン4の定理を証明するには、しばしば、簡潔な証明を可能にするライブラリの補題の散在を識別する必要がある。
本稿では,このタスクのための2モード検索システムであるLeanSearch v2を紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:04:57 GMT)
A Call to Lagrangian Action: Learning Population Mechanics from Temporal Snapshots [7.3] 古典力学、量子力学、勾配流を含む二階力学のクラスを定式化する。
次に,WLMをラグランジアンを指定せずに観測された境界値からこれらの2次ダイナミクスを学習するアルゴリズムとして提案する。
個体群力学を直接学習することで、WLMは未確認の限界を予測および補間できると同時に、渦力学、胚発生、群れなど、幅広い力学において、既存の勾配流とフローマッチング法より優れている。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:19:56 GMT)
SynVA: A Modular Toolkit for Vessel Generation and Aneurysm Editing [7.3] 頭蓋内動脈瘤(IAs)は脳卒中の主要な原因であり、致命的かつ長期の障害を伴う致命的な出血を引き起こす。
本稿では,血管メッシュ生成と解剖学的に一貫した動脈瘤合成のためのモジュールツールキットであるSynVAについて述べる。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:00:50 GMT)
ProtoMedAgent: Multimodal Clinical Interpretability via Privacy-Aware Agentic Workflows [7.3] ProtoMedAgentは、反復的なゼロ段階のテスト時間最適化問題としてマルチモーダルな臨床報告を定式化する。
オンライン生成は、厳密な集合論微分と反射的スクリーブ・クリティカルループによって制限される。
ProtoMedAgentは91.2%の比較集合Fithfulnessを実現し、標準RAG(46.2%)を根本的に上回る
論文参考訳(メタデータ) (Wed, 13 May 2026 20:57:37 GMT)
Backdoor Threats in Variational Quantum Circuits: Taxonomy, Attacks, and Defenses [7.3] 変分量子アルゴリズム(VQA)は、ノイズの多い中間スケール(NISQ)量子コンピューティングの中枢パラダイムである。
事前設計および事前訓練された変分量子回路(VQC)への依存は、重大なセキュリティ脆弱性をもたらす。
本稿では,VQCのバックドア攻撃に関する調査を行い,データポゾン,コンパイラレベル,量子ネイティブ機構について報告する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:17:20 GMT)
U-HNO: A U-shaped Hybrid Neural Operator with Sparse-Point Adaptive Routing for Non-stationary PDE Dynamics [7.2] 中心設計はスパースポイント適応ルーティング(SPAR)であるU字型ハイブリッドニューラル演算子U-HNOを提案する。
SPARは階層的なエンコーダ・ブートネック・デコーダのバックボーンに埋め込まれており、スキップ接続により両分岐とゲートが全ての解像度で動作する。
U-HNOは、相対的なL2とH1メトリクスの両方のタスクの大多数において、最先端のロールアウト精度を達成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:00:43 GMT)
Object Manipulation of the Variable Topology Truss system [7.2] 本稿では,多変数トポロジトラスシステムのためのオブジェクト操作戦略を提案する。
本発明のトラスロボットは、受動球関節で連結された作動トラス部材を含む。
位置と力の制御を明示的な疎結合なしに同時に行うハイブリッド制御フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:55:11 GMT)
Strategic commitments shape collective cybersecurity under AI inequality [7.1] 有限集団における進化的ゲーム理論モデルを用いて,AIアクセスの差分の影響について検討する。
高機能防衛が費用がかかると、人口は低コストで弱い防御行動へと追いやられる。
続いて、常に強固な防衛を実践する、献身的な擁護者の小さなグループの役割について検討する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:09:54 GMT)
SID: Sliding into Distribution for Robust Few-Demonstration Manipulation [7.1] オブジェクトのポーズ、視点、ダイナミックな障害に対するロボット操作の一般化は、特にいくつかのデモでは困難である。
本研究では,標準化された実演からオブジェクト中心の運動場を学習する構造化フレームワークであるSliding into Distributionを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:22:40 GMT)
Amortized Neural Clustering of Time Series based on Statistical Features [7.1] 本稿では,ニューラルネットワークによる特徴量に基づく時系列クラスタリングに対するアルゴリズムに依存しないアプローチを提案する。
シミュレーションデータから最適なパーティショニングルールを近似するためにニューラルネットワークをトレーニングすることにより、提案フレームワークは従来のクラスタリング手法への依存を減らすことができる。
この方法の1つのバージョンは、アドホックな選択手順を避けることによって、自動的にクラスタ数を決定することができる。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:54:55 GMT)
Negation Neglect: When models fail to learn negations in training [7.0] 我々は否定否定(Negation Neglect)を導入し、請求項を偽としてフラグ付けする文書にLCMを微調整することで、請求項が真実であると信じさせる。
これは、同じ文書がコンテキストで与えられるときに、クレームを偽と認識するモデルにもかかわらず発生する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:51:31 GMT)
ExploitBench: A Capability Ladder Benchmark for LLM Cybersecurity Agents [7.0] ExploitBenchは、エクスプロイトを16個の測定可能なフラグに分解する機能グレードのベンチマークである。
V8が広くデプロイされ、エクスプロイトが強化されているため、41のV8バグに対してExploitBenchをインスタンス化する。
以上の結果から,公開フロンティアモデルとプライベートフロンティアモデルとの間には,大きな差異があることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:08:05 GMT)
Effective Harness Engineering for Algorithm Discovery with Coding Agents [6.9] 本稿では,3つの質問による効果的なハーネス設計について検討する。
生成したプログラムがスコアリング機能を利用する場合、ハーネスは評価ハックをどのように扱うべきか?
これらの問題に対処するハーネスの改善を取り入れたアルゴリズム発見フレームワークであるVesperを用いて、Circle Packingを評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:33:06 GMT)
Calibration-Free Gas Source Localization with Mobile Robots: Source Term Estimation Based on Concentration Measurement Ranking [6.9] 安価なガスセンサーを備えた移動ロボットは、危険環境における人間の検査の代替として、より安全な手段を提供する。
本研究では, 動的に蓄積したデータセット内のガス測定値の相対的ランク付けを利用する特徴抽出アルゴリズムを提案する。
我々は,高忠実度シミュレーションと物理実験において,非校正ガスセンサを用いた一貫した位置決め精度を実証し,本手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:58:48 GMT)
Learning to Optimize Radiotherapy Plans via Fluence Maps Diffusion Model Generation and LSTM-based Optimization [6.9] ボリューム変調アーク療法(VMAT)は、現代の放射線治療の基礎となっている。
プランニングは、マルチリーフコリメータ、モニターユニット、線量パラメータの逆最適化とネスト最適化を解く。
エンドツーエンドVMAT計画のための拡散駆動型ラーニング・ツー・マッチング(L2O)手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:00:11 GMT)
Contextual Bandits for Resource-Constrained Devices using Probabilistic Learning [6.9] CB(Contextual bandits)は、部分的にフィードバックされたオンラインのシーケンシャルな意思決定問題である。
本稿では,決定論的累積を確率的更新規則に置き換えた低精度な変種を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:04:47 GMT)
Rigel3D: Rig-aware Latents for Animation-Ready 3D Asset Generation [6.8] Rigel3Dはアニメーション対応の3Dアセットをリップメッシュとして生成する方法である。
rig対応オートエンコーダは、これらの表現をメッシュ幾何学、骨格位相、関節座標、スキンウェイトにデコードする。
2段階の潜伏生成モデルは、画像条件付き生成のための表面表現と骨格表現の両方を合成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:55:29 GMT)
Spectral Gradient Surgery for Domain-Generalizable Dataset Distillation [6.8] ドメイン一般化型データセット蒸留(DGDD)を紹介する。
本研究では,広く採用されている分散マッチング(DM)ベースラインを用いてこの問題について検討する。
本研究は,SGS (Spectral Gradient Surgery) とSGS (Spectral Gradient Surgery) を併用する。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:33:38 GMT)
Adam-SHANG: A Convergent Adam-Type Method for Stochastic Smooth Convex Optimization [6.8] モーメント,適応型プレコンディショニング,曲率-コンディショナー補正を結合するリアプノフ誘導型アダム方式を提案する。
予測された崩壊を検証する実験は、ディープラーニングタスクにおけるAdamとAdamWに対する競争力のあるトレーニングパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:46:23 GMT)
Agentic Systems as Boosting Weak Reasoning Models [6.6] 検証者支援委員会探索を推論言語モデルの推論時間向上として検討する。
繰り返しサンプリングすることでカバレッジを増幅できるが、それ自体で有用な批評家やコンパレータを作ることはできない。
SWE-bench Verifiedでは、単一のテキストGPT-5.4ナノプロポーザルが67.0%のタスクを解決している。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:32:31 GMT)
Three-Stage Learning Unlocks Strong Performance in Simple Models for Long-Term Time Series Forecasting [6.6] STAIRは、複雑なアーキテクチャモジュールを導入することなく、単純な時間マッピングモデルのキャパシティを開放することを目的としている。
まず、共有時間マッピングを通じて変数間の共通時間ダイナミクスを学習し、その後、チャネルワイドな微調整により各変数に共有モデルを適用することで、変数固有のパターンをキャプチャし、最後に、残差学習を通じてクロス変数情報でバックボーンを補完する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:36:46 GMT)
Distribution-Aware Algorithm Design with LLM Agents [6.5] 学習対象が計算ではなく実行可能なコードである場合の学習について検討する。
未知のタスク分布からのサンプルが与えられた場合、学習者はソリューションの品質と実行時間の両方で、新鮮なインスタンスで評価されたコードを返す。
固定ライブラリのサンプル解法が, 精度と実行時間の両方で一般化されることを実証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:47:55 GMT)
A General Bézier Tree Encoding Counterfactual Framework for Retinal-Vessel-Mediated Disease Analysis [6.5] 網膜血管の形状は血管疾患の重要なバイオマーカーである。
BTECF(Bézier Tree Generative counterfactual Framework)を提案する。
BTECFは、全身疾患にまたがる仮説検証のための統一的な生成パラダイムを提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:10:20 GMT)
A Hybrid Tucker-LSTM Tensor Network Model for SOC Prediction in Electric Vehicles [6.5] 本稿では,タッカーテンソル分解とLSTMネットワークを組み合わせた新しいハイブリッド手法を提案する。
入力は充電状態、走行距離、電圧、電流、細胞差分、時間的特徴である。
Tucker - LSTMはすべてのメトリクスでベースラインを上回っます。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:54:17 GMT)
TEMPO: Temporal Enforcement via Mode-Separated Policy Optimization for Trustworthy LLM Backtesting [6.4] 歴史的イベントにおいて大きな言語モデルをバックテストするには、特定のカットオフ日までに利用可能な情報のみを推論する必要がある。
モデルは、事前訓練から推論へ、明らかな正確さを膨らませ、評価の妥当性を損なうために、定期的にカットオフ後の知識をリークする。
本稿では,この規律を2つのコントリビューションを通じてトレーニングするTEMPOを提案する。リークモードがポストカット後の要求をゼロに駆動する2モード報酬と,時間的に有効な推論戦略をモデルが発見できるGRPOベースのトレーニングパイプラインである。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:01:37 GMT)
Improving Reproducibility in Evaluation through Multi-Level Annotator Modeling [6.4] 本稿では,アノテータの動作を現実的にモデル化するためのマルチレベルブートストラップ手法を提案する。
統計的意義を達成するために必要なアイテム数(N$)とアイテムあたりのレスポンス数(K$)のトレードオフを分析する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:22:27 GMT)
Linear-Time T-Gate Optimization via Random Abstraction [6.3] 量子コンピュータは、暗号、化学、最適化の問題に対する指数的なスピードアップを約束する。
Tゲートカウントは、大規模量子計算のリソース予算を支配しうる。
本稿では,Tゲート最適化に関する理論的および実践的な結果を示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:54:13 GMT)
Asymptotically Optimal Ergodic Coverage on Generalized Motion Fields [6.3] 遠隔および極端な環境での自律的なロボット探査により、科学者は複雑な現象をモデル化できる。
ほとんどの適応探索法は静的環境を前提としており、適切なカバレッジを提供していない。
本手法は,海洋探査やヒトおよび牛の移動の追跡など,多様なプロセスに一般化されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:37:27 GMT)
Differentiable Learning of Lifted Action Schemas for Classical Planning [6.3] 我々は、状態が完全に観察されているが、アクション引数が観察されていないトレースからアクションスキーマを学ぶための、新しいニューラルネットワークアーキテクチャを開発した。
我々は、学習したリフトアクションスキーマが地上構造を回復しなければならない様々な計画領域のアーキテクチャを評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:59:49 GMT)
NAACA: Training-Free NeuroAuditory Attentive Cognitive Architecture with Oscillatory Working Memory for Salience-Driven Attention Gating [6.3] NAACAは,聴覚サリエンス問題として注意割当を再設定する,無訓練神経聴覚注意認知アーキテクチャである。
OWMは神経インスパイアされたワーキングメモリであり、安定したアトラクションのような状態を維持し、高い認知ALM処理をトリガーする。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:09:47 GMT)
Language-Based Agent Control [6.3] 本稿では,エージェントアプリケーションのための新しいプログラミングモデルである言語ベースエージェント制御(LBAC)を紹介する。
LBACは、周囲の足場コードのコンテキストで十分に型付けされたプログラムを生成するためにエージェントを必要とする。
安全でないプログラムは実行前に型チェッカーによって拒否されるため、ポリシーはアプリケーション全体にわたって均一に適用される。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:21:05 GMT)
Network-Aware Bilinear Tokenization for Brain Functional Connectivity Representation Learning [6.2] 我々は,脳機能的接続トークン化を再定義する自己教師型学習フレームワークであるNERVEを紹介する。
NERVEは、新しく構造化された双線形因子化によってFCパッチを埋め込む。
構造的 MAE 変種やグラフに基づく自己認識ベースラインと比較すると,提案手法はより安定かつ伝達可能な表現が得られる。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:09:44 GMT)
CSI-JEPA: Towards Foundation Representations for Ubiquitous Sensing with Minimal Supervision [6.2] ラベル効率・マルチタスクWi-Fiセンシングのための自己教師付き予測表現学習フレームワークであるCSI-JEPAを提案する。
CSI-JEPAは、ラベルのないCSIサンプルから再利用可能な時間スペクトル表現を学習する。
我々はCSI-JEPAを、様々な目的や配置設定にまたがる7つの実世界のWi-Fiセンシングタスクで評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:50:31 GMT)
CoGE: Sim-to-Real Online Geometric Estimation for Monocular Colonoscopy [6.2] CoGEは、大腸内視鏡におけるオンライン単分子幾何推定のための新しいフレームワークである。
異なる大腸内視鏡シーンにおける照明の多様性に対処するために,照明対応監視モジュールを提案する。
大腸の共通な構造的特徴と局所的特徴を抽出する構造認識モジュールを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:46:39 GMT)
ThermalTap: Passive Application Fingerprinting in VR Headsets via Thermal Side Channels [6.1] 本稿では,ヘッドセットシャーシから放射される長波長赤外(LWIR)放射のみでVRアプリケーションに指紋を印加する,最初の受動的非接触型サイドチャネルアタックであるHeatherTapを紹介する。
ヘッドセットの熱シグネチャを、内部計算ワークロードの高忠実度プロキシとして扱うことで、MaterialTapは、デバイス間のインタラクションを必要とせずに、メートル単位の距離でのリモートアプリケーション推論を可能にする。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:02:41 GMT)
Pretraining large language models with MXFP4 on Native FP4 Hardware [6.1] 我々は,前向きのアクティベーションやアクティベーション勾配が安定している場合でも,大規模言語モデルのフルパイプFP4トレーニングがしばしば分岐する理由を考察する。
その結果,FP4トレーニングの不安定性は,過度な直感性ではなく,敏感な勾配経路に沿った構造的マイクロスケーリング誤差によって引き起こされることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:29:10 GMT)
Adaptive Steering and Remasking for Safe Generation in Diffusion Language Models [6.1] Diffusion Language Models (DLMs) は自己回帰型言語モデルに代わる有望な選択肢を提供する。
本稿では,段階的介入に基づく推論時防衛フレームワークを提案する。
われわれのアプローチは、ジェイルブレイクの成功率を0.64%まで下げる一方で、オリジナルのモデルの性能に近い世代品質を保っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:56:45 GMT)
Behavior Cloning for Active Perception with Low-Resolution Egocentric Vision [6.1] 本研究では, 対象物探索作業において, 行動のクローン化が能動的知覚を生み出すのに十分かどうかを考察する。
手首に搭載された自家用RGBカメラを装備した低コストのロボットアームは、把握信号をトリガーする前に、部分的に見える植物を中央に配置する必要がある。
低解像度の自己中心型視覚は、信頼性の高いタスク完了に十分であることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:45:21 GMT)
Distill, Diffuse, and Semanticize (DDS): Annotation-Free 3D Scene Understanding Based on Multi-Granularity Distillation and Graph-Diffusion-Based Segmentation [6.1] 3Dセマンティックなシーン理解は、デジタル双生児、自律運転、スマート農業、そして体感にとって不可欠である。
既存のアノテーションのないメソッドは、しばしば意味認識と構造的効率のトレードオフに直面します。
本稿では,領域一貫性とセマンティックな3Dシーン理解のための資源効率の高い構造指向フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:48:13 GMT)
JEDI: Joint Embedding Diffusion World Model for Online Model-Based Reinforcement Learning [6.0] Joint Embedding Diffusion (JEDI)は、世界初のオンラインエンドツーエンドの潜伏拡散モデルである。
JEDIはAtari100kで競争力があり、直接に比較して訓練された潜伏者でベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:07:32 GMT)
A Benchmark for Early-stage Parkinson's Disease Detection from Speech [6.0] 早期パーキンソン病 (EarlyPD) は臨床的には有意であるが, 未発見である。
そこで本研究では,話者独立スプリットを用いた音声に基づく早期PD検出のための最初のベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:43:01 GMT)
DUET: Dual-Paradigm Adaptive Expert Triage with Single-cell Inductive Prior for Spatial Transcriptomics Prediction [6.0] 組織像から空間的に解決された遺伝子発現を推定することは空間転写学に費用対効果をもたらす。
本稿では,パラメトリック予測とメモリベース検索を共役する新しいデュアルパラダイムフレームワークDUETを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:43:29 GMT)
Test-Time Compute for Dense Retrieval: Agentic Program Generation with Frozen Embedding Models [5.9] テストタイム計算は大きな推論モデルにしか利益がないと広く信じられている。
また、小さな埋め込みモデルにも役立ちます。
エージェントプログラム探索ループを用いて,凍結埋め込みAPI上で259個の候補推論プログラムを探索する。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:56:03 GMT)
DynoJEPP: Joint Estimation, Prediction and Planning in Dynamic Environments [5.9] DynoJEPPは因子グラフベースのフレームワークで、見積もり、予測、計画を共同で定式化し、同時に最適化する。
予測・予測・計画を共同で定式化する従来の因子グラフに基づく手法では、予測・計画からの情報は状態推定に戻す。
本稿では,因子グラフ内での方向情報フローを強制し,予測や計画が破損した状態推定を防止できる新しい方向性因子を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:18:58 GMT)
Learning Local Constraints for Reinforcement-Learned Content Generators [5.9] 制約ベースのゲームコンテンツジェネレータは、Wave Collapse Function (WFC)のような既存のコンテンツから局所的制約を学習する
強化学習ジェネレータはグローバルな特性を保証できるが、その結果は視覚的に不満足である。
本稿では,これらの手法を組み合わせる方法を検討する。具体的には,PCGRLジェネレータの動作空間を,WFCが学習した制約で制約する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:07:10 GMT)
Weakly Supervised Segmentation as Semantic-Based Regularization [5.9] 弱教師付きセマンティックセグメンテーション(WSSS)は、部分的または粗いアノテーションから高密度ピクセルレベルのセグメンテーションモデルを訓練する。
我々は、微分可能なファジィ論理と深いセグメンテーションモデルを統合するという、ニューロシンボリックな視点を採っている。
論理誘導による微調整により、高品質な擬似ラベルが得られ、最先端のセグメンテーションがもたらされることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:33:27 GMT)
Phantom Force: Injecting Adversarial Tactile Perceptions into Embodied Intelligence via EMI [5.9] 身体のインテリジェントなロボットは、触覚センサーを使って物理的な世界と安全に対話する。
本研究は、意図的電磁干渉(EMI)に対する感受性を示すホールエフェクト指先センサの脆弱性を探索する。
攻撃者はこの脆弱性を利用して、ロボットの手を動かして脆弱な物体を粉砕したり、危険なペイロードを落としたりすることができる。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:16:44 GMT)
Anatomy-Slot: Unsupervised Anatomical Factorization for Homologous Bilateral Reasoning in Retinal Diagnosis [5.8] Anatomy-Slotは、トークンをスロットにパッチし、横断的注意によって視線を横切るスロットをアライメントすることで、教師なしの解剖学的ボトルネックを導入する。
ODIR-5Kと$n=10$のシードでは、一致したViT-LベースラインよりもAUCを4.2%改善する。
また、REFUGEとクロスアテンション・ローカライゼーション分析に基づく定量的光学ディスクを報告する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:04:31 GMT)
Toward AI-Driven Digital Twins for Metropolitan Floods: A Conditional Latent Dynamics Network Surrogate of the Shallow Water Equations [5.8] Conditional Latent Dynamics Network (CLDNet) は降雨によって駆動される低次元潜在ニューラルネットワークである。
任意のクエリポイントで深さと放電を再構築する。
960ドル(約9,600円)の流域全体の予測を29ドル(約2,300円)で、スピードアップを115ドル(約1,300円)で提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:41:14 GMT)
Inducing Artificial Uncertainty in Language Models [5.8] 安全クリティカルなアプリケーションでは、言語モデルは意味のある確率で不確実性を特徴付けることができるべきである。
多くの不確実な定量化アプローチは教師付きデータを必要とする。
大量のスクラップデータに基づいて訓練された大規模言語モデルにとって、適切な見当たらない挑戦的なデータを見つけることは、ますます困難になっている。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:30:39 GMT)
Cross Modality Image Translation In Medical Imaging Using Generative Frameworks [5.8] 本研究は, 腫瘍画像における3次元I2I翻訳法の再現性, 標準化された比較評価である。
7つの生成モデル,3つの生成適応ネットワーク(GAN:Pix2Pix, CycleGAN, SRGAN)と4つの潜在生成モデル(Latent Diffusion Model, Latent Diffusion Model+ControlNet, Brownian Bridge, Flow Matching)を比較した。
その結果、GANは全てのタスクにおいて遅延生成モデルよりも優れており、SRGANは統計的に有意な優位性を達成していることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:41:44 GMT)
Probing Persona-Dependent Preferences in Language Models [5.7] 大きな言語モデルは、根本的に異なる好みを持つ異なるペルソナを採用することができる。
我々は, Gemma-3-27BとQwen-3.5-122Bの残差ストリーム活性化に関する線形プローブを訓練し, 対のタスク選択を予測した。
補助アシスタントで訓練された調査員は、アシスタントのものと反相関の悪いペルソナなど、質的に異なるペルソナの選択を予測し、判断する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:57:37 GMT)
CRANE: Constrained Reasoning Injection for Code Agents via Nullspace Editing [5.7] CRANEは、シンキング・インストラクトデルタを、インストラクトバックボーンの候補推論編集のプールとして扱う、トレーニング不要なパラメータ編集手法である。
ペア化されたインストラクトとシンキングのチェックポイントを組み合わせることで、CRANEはどちらのモデルよりも強力なゲインを提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:09:35 GMT)
Unweighted ranking for value-based decision making with uncertainty [5.6] 本稿では,Fuzzy-Unweighted Value-Based Decision Making (FUW-VBDM)フレームワークを紹介する。
エージェントは定量的基準と質的基準の両方を取り入れ、人間中心の意思決定を生成する。
本稿では,不確実性を定量化するためにファジィに基づく推論を統合する,カスタマイズ可能なアンウェイトランキング手法であるRanzzyを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:36:17 GMT)
PolitNuggets: Benchmarking Agentic Discovery of Long-Tail Political Facts [5.6] 現実世界の使用には、情報源から「ロングテール」事実を発見し合成するモデルが必要である。
我々は,400人のグローバルエリートを対象とした政治伝記構築によるエージェント情報合成のベンチマークであるPolitNuggetsを紹介する。
本稿では,発見,きめ細かな精度,効率を評価するエビデンス条件付きプロトコルであるFactNetを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:09:03 GMT)
Nagaoka supermetal in the particle-doped triangular Hubbard model [5.5] 粒子ドーピングを用いた三角格子ハバードモデルについて検討し、本質的な相互作用駆動量子状態の説得力のある証拠を提供する。
この状態は直流比抵抗のサブ線形温度依存性と電荷圧縮率の特異な挙動と0周波数スペクトル重みによって特徴づけられる。
我々の研究は、幾何学的にフラストレーションされたシステムにおける非フェルミ液体状態の新しい視点を提供し、現在の超低温原子実験で直接アクセス可能である。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:58:13 GMT)
Towards Resource-Efficient LLMs: End-to-End Energy Accounting of Distillation Pipelines [5.5] 蒸留は、安価でより効率的なモデルを得るための最も効果的な経路の1つとしてしばしば推進される。
蒸留パイプラインの完全計算コストを測定するための総合的なエネルギー会計フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:01:02 GMT)
Storage of telecom-band time-bin qubits in thin-film lithium niobate [5.5] エルビウムイオンドープTFLNを用いた最初のオンチップ量子メモリを実現した。
開発された量子メモリは、効率が1.95%の400 nsの記憶時間を達成する。
その結果、TFLNにおける通信帯域の時間ビン量子ビットに対する最初のオンチップ量子メモリが実証された。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:54:33 GMT)
Generating synthetic computed tomography for radiotherapy: SynthRAD2025 challenge report [5.4] SynthRAD2023上に構築されたSynthRAD2025は、ヨーロッパの5つのセンターから2,362人の患者に対してsCT法をベンチマークした。
頭部・頸部の症例は最も一貫性があり,胸部・腹部の症例ではより変動がみられた。
組織界面の残留誤差はビーム経路に沿って伝播し、光子よりも陽子線量に影響を及ぼす。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:59:03 GMT)
Vision-Based Runtime Monitoring under Varying Specifications using Semantic Latent Representations [5.3] 部分観測可能性下での視覚的観察から過去の信号時相論理(ptSTL)を検証した。
本稿では,現在の予測値のみを予測し,時系列履歴をオンラインに再構築するエンフロリング予測モニターを提案する。
歩行者と道路のベンチマークでは、短い地平線でより厳密な認証境界を転がし、セマンティックベージモニターは長い地平線で最大4倍厳密になっている。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:22:25 GMT)
Visual Search Patterns in 3D Pancreatic Imaging: An Eye Tracking Study [5.3] 視線追跡は、医学を含む様々な領域における視覚知覚と探索戦略を検査するための強力なツールとして登場した。
2D設定では比較的簡単に適用できるが、3D医療画像での使用は困難であり、まだ十分に研究されていない。
我々は、視線追跡データを収集し、スライスナビゲーションで視線の動きを調整し、容積を通して膵の表現を可視化し、臨床医の視線行動の空間的および時間的分析を行う。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:26:16 GMT)
Manipulation Planning for Construction Activities with Repetitive Tasks [5.3] 繰り返し作業からなる建設作業を行うための操作スキル獲得の課題について検討する。
提案手法では,仮想現実感(VR)環境における仮想的な建設活動の設定を行う。
運動のスクリュー幾何を利用して、実験された動きを一定のスクリュー運動の列として近似する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:33:13 GMT)
On the Generalization of Knowledge Distillation: An Information-Theoretic View [5.2] 我々は,教師と学生の学習を複合的なプロセスとしてモデル化し,蒸留の分岐を導入する。
本研究では,教師の局所的平坦度が厳密に拘束できることを示す。
線形ガウスのケーススタディでは、蒸留の発散は、バイアス、分散、ランク・ボトルネックのコストへの解釈可能な分解を許容する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:10:05 GMT)
Kernel-based guarantees for nonlinear parametric models in Bayesian optimization [5.2] 我々は、適応的に収集されたデータに基づいて訓練された正規化非線形パラメトリックモデルを解析するためのカーネルベースのフレームワークを開発する。
これらの境界が非線形獲得および代理モデルに対する収束保証をどのようにサポートするかを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:24:55 GMT)
Synthetic American Option Pricing via Jump-HMM-Driven Heston Implied Volatility [5.1] インプリートボラティリティに基づく合成オプション価格の合成データ生成装置を開発した。
本研究では,本フレームワークを実際の近日貸付・呼出契約,価格パスの前方シミュレーション,経路条件によるインプリート変動の回復に応用する。
このフレームワークは、オープンソースのJuliaパッケージとしてリリースされている。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:07:14 GMT)
KamonBench: A Grammar-Based Dataset for Evaluating Compositional Factor Recovery in Vision-Language Models [5.0] 家紋は日本の文化の重要な部分であり、作曲視覚の自然なテストケースである。
カモンベンチ(KamonBench)は、文法に基づく2万の合成合成クレストと補助成分のサンプルを持つ画像構造ベンチマークである。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:35:07 GMT)
Extracting Search Trees from LLM Reasoning Traces Reveals Myopic Planning [5.0] 大規模言語モデル(LLM)は、将来の結果に対する明確な議論を含む拡張チェーン・オブ・シント(CoT)推論を生成する。
本研究では,4対1のボードゲームにおいて,探索木を推論トレースから抽出し,定量化することにより,LSM計画の特徴付けを行う新しい手法を提案する。
LLMの探索は人間より浅く, 深度よりも幅の広い探索により予測できることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:13:33 GMT)
You Only Landmark Once: Lightweight U-Net Face Super Resolution with YOLO-World Landmark Heatmaps [5.0] 顔画像の超解像は、非常に劣化した入力から高解像度の顔画像を取り戻すことを目的としている。
既存の手法は通常、重いネットワークアーキテクチャ、敵のトレーニングスキーム、または別々のアライメントネットワークに依存している。
我々は,16倍の16ドル入力から128倍の128ドルの顔画像を再構成し,8倍の倍率を達成する軽量なU-Netベースアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:41:23 GMT)
Sensing Intelligence as a Trainable Metamaterial Property [5.0] メタマテリアルの幾何学は、外的刺激をニューラルネットワークが解釈しやすい内部信号に変換するために最適化できることを示す。
数値および実験的なセンシングシナリオ全体で、最適化されたボディは、最大5倍の精度でセンシングを改善するか、必要な電子センサーの数をほぼ1桁減らす。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:55:34 GMT)
Rethinking the Good Enough Embedding for Easy Few-Shot Learning [4.9] 本稿では,Platonic Representation hypothesisを利用して,既製の埋め込みが本質的に複雑なタスクに対して「十分良い」ことを実証する。
凍結したDINOv2-L特徴に対するk-Nearest Neighborの利用により,最適特徴抽出の階層的特徴付けを行う。
4つの主要なベンチマークで得られた結果は、我々のアプローチが洗練されたメタ学習アルゴリズムを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:52:05 GMT)
ECG-NAT: A Self-supervised Neighborhood Attention Transformer for Multi-lead Electrocardiogram Classification [4.9] ECG信号は、きめ細かいビートレベルの形態とより広いリズムレベルの依存関係を同時にキャプチャするアーキテクチャを必要とする。
本稿では心電図近傍注意変換器(ECG-NAT)を提案する。
ECG-NATはベンチマークデータセット上で、1%のラベル付きデータを使用して88.1%の精度で堅牢なパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:50:00 GMT)
Wahkon: A Statistically Principled Deep RKHS Superposition Network [4.9] ワフコンは、コルモゴロフの重ね合わせ原理とRKHS正規化を統一する深いRKHS重ね合わせネットワークである。
We show Wahkon delivers accuracy, interpretability, and statistics rigor in a single framework。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:01:59 GMT)
Robust Mutation Analysis of Quantum Programs Under Noise [4.8] ノイズのない,ノイズの多いシミュレータ上で実行される41個の量子プログラムを用いて,ノイズがミュータント検出に与える影響を分析する。
ノイズはプログラムとミュータント間の行動距離を著しく変化させ、等価なミュータントを実際の故障と区別しにくくする。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:56:05 GMT)
TB-AVA: Text as a Semantic Bridge for Audio-Visual Parameter Efficient Finetuning [4.8] TB-AVA(Text-Bridged Audio-Visual Adapter)を中心とした冷凍オーディオとビジュアルエンコーダをベースとしたパラメータ効率適応フレームワークを提案する。
TB-AVAのコアでは、GSM(Gated Semantic Modulation)がテキスト推論のセマンティック関連性に基づいて特徴チャネルを選択的に変調する。
提案手法は, AVE, AVS, AVVPなど複数のベンチマークで評価され, 提案手法は最先端の性能を実現する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:26:49 GMT)
SpurAudio: A Benchmark for Studying Shortcut Learning in Few-Shot Audio Classification [4.8] FSC(Few-shot Classification)は限られたラベル付きデータから学習するために広く用いられているが、ほとんどの評価では、ターゲット概念は文脈的手がかりとは無関係であると暗黙的に仮定している。
実世界の設定では、サンプルはリッチなコンテキストにしばしば現れ、モデルが前景のコンテンツと背景の信号の間の刺激的な相関を活用できる。
SpurAudioは、音声における前景イベントと背景環境の自然な分離性を利用して、サポートとクエリセット間のコンテキストシフトの制御されたマルチレベル評価を可能にするベンチマークである。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:32:57 GMT)
Metacognition Should Be the Scientific Framework for Bounded and Effective Self-Governance in Generative AI [4.8] 我々は、メタ認知が、生成的AIにおける有界かつ効果的な自己統治の科学的枠組みとなるべきであると論じる。
有界かつ効果的なAI自己統治は、計算、アルゴリズム、生態レベルでメタ認知的アライメントを必要とすることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:40:56 GMT)
Real2Sim: A Physics-driven and Editable Gaussian Splatting Framework for Autonomous Driving Scenes [4.8] Real2Sim は 4D Gaussian Splatting (4DGS) と差別化可能なMaterial Point Method (MPM) を結合した統合フレームワークである。
Real2Simは動的駆動シーンを時間的に連続したガウスプリミティブとして明示的に再構築し、インスタンスレベルの編集をサポートし、現実的なオブジェクトとオブジェクトと環境の相互作用をシミュレートする。
Openデータセットの実験では、Real2Simのレンダリング、再構築、編集、物理シミュレーションの能力を検証するとともに、認識、追跡、軌道予測、エンドツーエンドポリシー学習といった下流タスクでデータを生成するためのスケーラブルなツールとしての可能性を示している。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:26:25 GMT)
Insecure Despite Proven Updated: Extracting the Root VCEK Seed on EPYC Milan via a Software-Only Attack [4.7] AMDはTrusted Computing Baseのロールバック攻撃を防ぐ機能を強調している。
このアーキテクチャでは、ハードウェアルートシードを保護することが究極の防御線である。
我々はAMDセキュアプロセッサ上でコード実行を実現するエクスプロイトであるMilanLaunchy攻撃を導入する。
我々は、ヒューズコントローラにおける書き込み制限の欠如を利用してハードウェアルートシードを抽出するBadFuse攻撃を開発した。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:40:23 GMT)
LiBaGS: Lightweight Boundary Gap Synthesis for Targeted Synthetic Data Selection [4.7] LiBaGSは、決定境界近傍、予測不確実性、実データ密度、サポート妥当性を組み合わせることで、候補となる合成サンプルをスコアする。
実験により、LiBaGSは古典的なオーバーサンプリング、ハード強化、不確実性、密度改善よりも精度を向上させることが示された。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:26:18 GMT)
Cross-Modal-Domain Generalization Through Semantically Aligned Discrete Representations [4.7] マルチモーダル学習は、様々な感覚源にまたがる情報の統合を目指している。
現在のアプローチは、モダリティ固有の構造とクロスモーダル一般化可能性のバランスをとるのに苦労している。
我々は、モダリティ固有のコードブック間のセマンティックコンセンサスを確立する新しいフレームワークであるCoDAARを紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:22:06 GMT)
Compact Latent Manifold Translation: A Parameter-Efficient Foundation Model for Cross-Modal and Cross-Frequency Physiological Signal Synthesis [4.7] 既存の基礎モデルは、しばしば重度のモダリティの絡み合いに苦しむ連続潜在空間に依存している。
本稿では,これらのギャップを埋める高パラメータ効率(0.09B)統一フレームワークであるコンパクト潜時翻訳(CLMT)を提案する。
計算フットプリントのごく一部で生物学的信号の普遍的な離散言語を学習することにより、我々はエッジ展開可能な多要素医療基盤モデルのための新しい軌道を定めている。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:31:36 GMT)
Evaluating Memory Condensation Strategies for Coding Agents in Data-Driven Scientific Discovery [4.7] 我々は,6つの領域にまたがる60のDiscoveryBenchタスクに対して,GPT-4oを用いた8つのメモリ凝縮戦略を評価した。
LLMをベースとした凝縮器はトークンコストを24~94パーセント増加させる一方、凝縮器は仮説の質を著しく変えることはない。
また、データ駆動型科学的発見のための最適な凝縮器は、科学的領域と課題の長さによって異なることを観察する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:10:41 GMT)
Winning Lottery Tickets in Neural Networks via a Quantum-Inspired Classical Algorithm [4.6] 我々は、同じサンプリングタスクに対して量子に着想を得た完全古典的アルゴリズムを構築し、分析する。
我々のアルゴリズムは時間$O(operatornamepoly(D))$で動作し、従って以前の古典的アプローチから$D$への指数的依存を取り除く。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:00:56 GMT)
Code-Centric Detection of Vulnerability-Fixing Commits: A Unified Benchmark and Empirical Study [4.5] 本稿では,統合フレームワークによる言語モデルに基づくVFC検出の包括的評価を行う。
コードの変更だけで、モデルが転送可能なセキュリティ関連コードを理解する証拠は見つからない。
グループ階層評価は、ランダムスプリットに比べて約17%のパフォーマンス低下を露呈する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:05:14 GMT)
Prediction of Rectal Cancer Regrowth from Longitudinal Endoscopy [4.4] 直腸癌監視中の患者において早期に局所的な腫瘍再発を検出する客観的に正確な方法はない。
経時的直腸内視鏡的クロスアテンション (TREX) は, 経時的深層学習のアプローチであり, CRとLRを区別するために, 回復時に取得した画像と後続画像を組み合わせた。
TREXは高い感度が97%$pm$ 6%、バランスの取れた精度が90%$pm$ 3%であった。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:02:58 GMT)
Force-Aware Neural Tangent Kernels for Scalable and Robust Active Learning of MLIPs [4.4] チャンク付き特徴空間後部分散ショートリストに基づく線形スケーリング獲得フレームワークを提案する。
次に,ニューラル・タンジェント・カーネル (NTK) をパラメータ座標の混合による力覚設定に拡張する。
我々は,力覚獲得が不可欠であるOC20データセットに対する共同エネルギー力NTKの有効性を実証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:08:37 GMT)
Achieving $ε^{-2}$ Sample Complexity for Single-Loop Actor-Critic under Minimal Assumptions [4.4] 我々は、強化学習における非政治アクターのための最終項目収束率を確立する。
我々は、最小限の仮定の下で$$-optimal Policyを見つけるために、最初の$tildemathcalO(-2)$サンプル複雑性を保証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:04:59 GMT)
CoWorld-VLA: Thinking in a Multi-Expert World Model for Autonomous Driving [4.4] CoWorld-VLAは、自動運転のための多専門家の世界推論フレームワークである。
世界表現は行動計画を導くための明確な条件として機能する。
実験によると、CoWorld-VLAは将来のシーン生成と計画の両方で競争力を発揮する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:01:33 GMT)
Steer-to-Detect: Probing Hidden Representations for Detection of LLM-Generated Texts [4.4] 大規模言語モデル(LLM)を検出するフレームワークであるSteer-to-Detect(textttS2D)を提案する。
第1段階では、 textttS2D は凍結観察者 LLM の隠れ状態に注入されるステアリングベクトルを学習する。
第2段階では、操舵された表現に基づいて仮説テスト手順を介して検出を行う。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:14:21 GMT)
Bridging Domain Gaps with Target-Aligned Generation for Offline Reinforcement Learning [4.4] クロスドメインのオフライン強化学習は、事前にコンパイルされたデータセットのみを使用して、ソースドメインからターゲットドメインへのポリシの適用を目的としている。
我々は、ソースデータの使い方を決定するフレームワークであるTCE(Target-aligned Coverage Expansion)を提案する。
TCEは、2つのスコアベースの生成モデルに基づいて、拡張状態領域上の目標一貫性遷移を合成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:23:51 GMT)
AI-Generated Slides: Are They Good? Can Students Tell? [4.4] 本稿では,教員の講義ノートからのスライド生成を支援するためにGenAIを用いて検討し,インストラクターと学生の知覚を強調した。
実際のコース設定で使うのに最適なスライドを選択し、人間とAIが生成したスライドの学生の認識を比較します。
学生はGenAIスライドをインストラクターが作成したスライドと同等の品質であると評価し、どのスライドがAI生成であるかを確実に識別することはできない。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:46:12 GMT)
Effective Context in Transformers: An Analysis of Fragmentation and Tokenization [4.4] 表現選択は、有限コンテキスト予測器が達成できることをどう変えるかを検討する。
より小さな表現単位への移行は、コンテキストウィンドウが拡大しても予測を損なう可能性があることを示す。
トークン化は、短いトークンウィンドウを、より長いソースコンテキストウィンドウのように振る舞うことができることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:08:08 GMT)
Identifying AI Web Scrapers Using Canary Tokens [4.4] 大きな言語モデル(LLM)をフィードする大規模なWebスクレイピングは、サイトの安定性に影響を与え、法的、プライバシー、倫理的懸念を高める。
本稿では, LLM 関連スクレーカーの精度, 自動推定のための新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:53:57 GMT)
Topology-Preserving Neural Operator Learning via Hodge Decomposition [4.3] 関数空間の観点から幾何メッシュ上の物理場方程式の解演算子について検討する。
ホッジ理論と作用素分割に基づいて、原理化された作用素レベルの分解を導出する。
本手法は,物理不変量に対する忠実度を向上した幾何グラフの精度と効率性を向上する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:56:23 GMT)
HodgeCover: Higher-Order Topological Coverage Drives Compression of Sparse Mixture-of-Experts [4.3] 学習したMoE構造体の高調波核を露出すると、圧縮機が最も重要となるレシエーションに勝つことが示される。
HodgeCoverは、ハーモニック・クリティカル・エッジとトリプルト・クリティカル・トライアングルを優しく覆い、HodgeCoverのハイブリッド版は、生き残りを生かした重量と組み合わせている。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:07:12 GMT)
When Language Overwrites Vision: Over-Alignment and Geometric Debiasing in Vision-Language Models [4.3] VLM(Vision-Language Models)は、より強力な高感度アプリケーションである。
定期的に幻覚を呈し、入力に存在しない内容について自信を持って記述する。
これらの障害モードを幾何学的オーバーアライメントにトレースする。
本稿では,トレーニングフリー推論戦略とバイアス対応微調整パラダイムの2つの補完策を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:26:30 GMT)
Leveraging Speech to Identify Signatures of Insight and Transfer in Problem Solving [4.2] 我々は参加者に5つの「マッチスティック・アジュメティクス」問題を解くよう依頼した。
問題は、同じ種類の非可観測解 (Same group) か、毎回別の種 (Different group) に依存していた。
その結果、同じ参加者が、異なる参加者よりも急速に改善していることがわかりました。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:04:08 GMT)
AdaFocus: Adaptive Relevance-Diversity Sampling with Zero-Cache Look-back for Efficient Long Video Understanding [4.2] 長いビデオ理解は、厳格なワンショットパラダイムによって非常にボトルネックになっている。
AdaFocusは,ワンパス符号化ではなく,プログレッシブエビデンス獲得として長いビデオ理解を再考する,効率的なフレームワークである。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:40:21 GMT)
Adaptive Kernel Density Estimation with Pre-training [4.2] 我々は、非パラメトリック密度推定の文脈に、多くの最先端AI技術の背後にある重要なアイデアである事前学習を導入する。
幅広い数値実験により、この戦略は密度推定精度を向上させるのに非常に効果的であることが示されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:03:54 GMT)
Counterfactual Reasoning for Causal Responsibility Attribution in Probabilistic Multi-Agent Systems [4.2] 責任割り当てはマルチエージェントシステムの設計と分析における根本的な課題である。
エージェントの成果に対する説明責任を定量化する,レトロスペクティブ(後方)の反現実的責任の概念を導入する。
責任認識型マルチエージェントシステムにおける検証と戦略的推論の両方をサポートする形式的フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:50:04 GMT)
Deterministic Fully-Static Whole-Binary Translation without Heuristics [4.1] Elevatorはx86-64実行ファイル全体をAArch64デバッグ情報、ソースコード、コードレイアウトに関する仮定に変換する。
我々は,SPECint 2006スイート全体を含む,現実世界のバイナリの多種多様なコーパス上でエレベータを評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:22:17 GMT)
Knowledge Distillation for Low-Resource Open-source Text-to-SQL Model [4.1] タスク固有の知識ベースを構築し,それをトレーニングと推論の両方に注入する,知識を意識したテキスト・ツー・チャットフレームワークを提案する。
このフレームワークは、文脈的に基底化された合成学習データを生成し、対象とする知識検索を通じて推論を強化する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:54:13 GMT)
SemRepo: A Knowledge Graph for Research Software and Its Scholarly Ecosystem [4.0] 科学研究に関連する200,000近いGitHubリポジトリを記述したRDFナレッジグラフであるSemRepoを紹介した。
SemRepoはコントリビュータ、イシュー、プログラミング言語などのリポジトリレベルのメタデータをキャプチャし、外部の学術知識グラフとリンクする。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:25:43 GMT)
Hybrid Quantum-MambaVision: A Quantum-enhanced State Space Model for Calibrated Mixed-type Wafer Defect Detection [4.0] 本稿では,空間知識発見に適した高効率アーキテクチャであるHybrid Quantum-MambaVisionを紹介する。
高不均衡なMixedWM38データセットでは、Hybrid Quantum-MambaVisionは例外的なマルチラベル分類性能を達成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:20:11 GMT)
Entanglement Generation During Distribution via Spatial Superposition [4.0] 空間的に異なる通信リンクのコヒーレントな重ね合わせは、分散中に本質的に絡み合う生成を可能にする。
分離可能な量子状態は、ノイズの多い通信リンクがコヒーレントに重畳されたときに、決定的に絡み合った状態に変換できることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:56:30 GMT)
SMA: Submodular Modality Aligner For Data Efficient Multimodal Learning [4.0] 本稿では,集合としてエンティティの複数の拡張と記述を扱うemphSubmodular Modality Aligner(SMA)を紹介し,よりリッチなクロスモーダル構造を捉えるために,データの複数の記述を活用する。
CLIPベンチマークから14のゼロショット分類および検索タスクについてSMAを評価し,低データ方式における一貫した利得を示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:36:43 GMT)
Amortized Guidance for Image Inpainting with Pretrained Diffusion Models [4.0] 生成拡散モデルを用いた画像インパインティングについて検討した。
拡散処理によるアモルタイズインペインティング(Amortized Inpainting with Diffusion)と呼ばれる中層モデルを導入する。
AIDは、トレーニング済みの拡散バックボーンを固定し、小さな再利用可能なガイダンスモジュールをオフラインでトレーニングし、インスタンスごとの最適化なしにマスクされたイメージ間で再利用する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:02:47 GMT)
Revealing the Gap in Human and VLM Scene Perception through Counterfactual Semantic Saliency [4.0] オブジェクトの重要度を測定するために、CSS(Counterfactual Semantic Saliency)を導入する。
AIと人間のセマンティックアライメントを評価するために,人間の心理物理学ベースラインに対して目立った視覚言語モデルを検証した。
モデルは、大きな物体(サイズバイアス)、画像の中心にある物体(中心バイアス)、高い塩分濃度オブジェクトに対して、(人間に関する)過度な信頼を示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:11:47 GMT)
Day-to-Day Traffic Network Modeling under Route-Guidance Misinformation: Endogenous Trust and Resilience in CAV Environments [4.0] 本稿では,経路誘導誤報に対する日々の交通割当と信頼進化の枠組みを開発する。
日々の渋滞はLighthill-Whitham-Richardsネットワークの負荷によって表現されるが、日々の経路選択は有界有理性ロジット学習に従う。
CAV対応トラフィックネットワークにおけるレジリエンス解析の信頼性を考慮したモデリング基盤を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:45:53 GMT)
Frequency Bias and OOD Generalization in Neural Operators under a Variable-Coefficient Wave Equation [3.9] 一次元可変係数波動方程式により制御された波動伝播条件における演算子学習について検討する。
滑らかさのシフトの下では、どちらのモデルも安定した性能を維持し、FNOは低い誤差を達成する。
周波数シフトの下では、FNOは目に見えない高周波入力の下でエラーが急激に増加するのに対して、DeepONetは全体的なエラーが高いにもかかわらず、より軽度に低下する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:53:36 GMT)
Teaching and Learning under Deductive Errors [3.8] 本研究は,教師の異なる特徴が,機械教育と学習の両方を考慮に入れることができるため,機械教育の事例について考察する。
本研究では,確率的確率的近似(PAC, Probably Aough Correct, PAC, Probably Aough Correct, PAC)を理論的に検討し,ある推定誤差レベルにおいて,教師は高い確率で学習者がほぼ正しい仮説を推測する指導セットを見つけなければならないことを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:43:01 GMT)
Shields to Guarantee Probabilistic Safety in MDPs [3.8] 本稿では,古典的シールドを確率論的安全性に保守的に拡張する形式的枠組みを提案する。
本枠組みでは,安全性と許容性に関する強い保証を維持することの不可能性を実証し,(ii)より弱い保証を備えた自然シールドを提供し,(iii)強力な安全保証を確保するためのオフラインおよびオンラインシールド構築を導入する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:09:48 GMT)
A Unified Geometric Framework for Weighted Contrastive Learning [3.7] 重み付けされたInfoNCEの目的を距離幾何学問題と解釈できることを示す。
この視点は、いくつかの教師付きおよび弱教師付き目的に対して最適な埋め込みの正確な特徴を与える。
その結果, 重み付け方式の選択は, 比較学習が幾何学的に実現可能か, 退化可能か, 不整合かを決定することを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:48:36 GMT)
Neural QAOA$^{2}$: Differentiable Joint Graph Partitioning and Parameter Initialization for Quantum Combinatorial Optimization [3.7] 本稿では,グラフ分割と初期パラメータを協調的に生成するエンドツーエンドの微分可能なフレームワークであるNeural QAOA$2$を提案する。
生成的評価ネットワーク(generative Evaluative Network, GEN)を統合することにより, 微分可能な量子評価器を高忠実度性能サロゲートとして利用する。
183 QUBO、Ising、MaxCutのインスタンス(21から1000変数)の実験は、勾配駆動のアプローチがベースラインを大きく上回ることを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:43:10 GMT)
What properties of reasoning supervision are associated with improved downstream model quality? [3.5] ポーランドの推論データセットを意味的に異なる変種に基づいて8B,11Bモデルを微調整し,その予測力を評価・評価する。
解析の結果,これらの内在的指標は,下流モデルの性能と強い有意な相関を示すことが明らかとなった。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:04:38 GMT)
Di-BiLPS: Denoising induced Bidirectional Latent-PDE-Solver under Sparse Observations [3.5] Di-BiLPSは、極端にスパースな観察の下で、前方および逆PDE問題の両方を処理する統合ニューラルネットワークフレームワークである。
非常にスパースな入力でSOTA性能を継続的に達成し、計算コストを大幅に削減する。
連続空間時間領域上の予測を可能にするため、ゼロショット超解像を可能にする。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:11:07 GMT)
Adaptive Conformal Prediction for Reliable and Explainable Medical Image Classification [3.5] 本稿では,RAPSに対する適応型Lambda Criterionを提案する。
提案手法は, 平均セットサイズ1.09, および全層にわたって少なくとも90%のカバー範囲で, 95.72パーセントの世界的なカバー範囲を達成している。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:45:07 GMT)
Not All Anquan Is the Same: A Terminological Proposal for Chinese Computer Science and Engineering [3.4] 中国のコンピュータ科学と工学では、安全と安全は「アンカン」という同じ単語で長い間翻訳されてきた。
本論では、確立された法律・標準の称号は維持されるべきである一方で、学術・工学の著作は安全を「安場」と翻訳し、主に安全のために「安場」を予約するべきであると論じている。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:42:17 GMT)
Where Does Reasoning Break? Step-Level Hallucination Detection via Hidden-State Transport Geometry [3.3] 大規模言語モデルは多段階の推論で幻覚するが、既存の検出器のほとんどはトレースレベルで動作する。
我々はこのビューをラベル付き教師で運用し、トレース固有のコントラスト型PCAレンズを構築する。
コントラストPCAが第1次誤差と正しい状態の移動分離目標の最適投影であることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:48:48 GMT)
Children's English Reading Story Generation via Supervised Fine-Tuning of Compact LLMs with Controllable Difficulty and Safety [3.2] 大型言語モデル(LLM)は、子どもの物語の生成など教育実践に広く応用されている。
我々は,GPT-4o と Llama 3.3 70B から,既存の専門家が設計した児童読解カリキュラムとそれに対応する物語を用いた。
提案手法はスケールよりも制御性を優先し,コンパクトで手頃なモデルで読み出しレベルとエラーパターンを目標とすることができる。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:56:37 GMT)
Ergodic Trajectory Design by Learned Pushforward Maps: Provable Coverage via Conditional Flow Matching [3.2] エンフェゴディックのカバレッジ問題は、UAVが支援するデータ収集とセンシング、ロボット探査、モバイル監視の中心である。
飛行エージェントでは、トラジェクトリーはエネルギー予算の厳格化、飛行禁止ゾーン、加速限界のバランスをとる必要がある。
本稿では,エルゴディディティを密度マッチングから切り離すエフェプシュフォワードフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:34:08 GMT)
Know When To Fold 'Em: Token-Efficient LLM Synthetic Data Generation via Multi-Stage In-Flight Rejection [3.2] Multi-Stage In-Flight Rejection (MSIFR) は軽量でトレーニング不要なフレームワークで、完成前に低品質な世代軌道を終了する。
飛行中の拒否を逐次決定プロセスとして定式化し、非自明な破棄ポリシーが期待されるトークン消費を減少させることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:35:49 GMT)
Merging Methods for Multilingual Knowledge Editing for Large Language Models: An Empirical Odyssey [3.1] 本稿では,多言語知識編集におけるベクトルマージ手法の有効性について論じる。
我々は,MzsREベンチマークにおいて,2つの一般的なバックボーン大言語モデル,2つの基本知識編集方法,12の言語を,大規模なバッチ編集設定の下で統合した6つの変種を評価した。
性能は重量スケールとランク比の両方に敏感であり、より大きいデフォルトスケールと比較的低いランクはより良い結果をもたらすことがよくあります。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:22:45 GMT)
Finite Sample Bounds for Learning with Score Matching [3.1] スコアマッチングを用いて非有界者の指数族の構造を学習するための非漸近的なサンプル複雑性解析を行う。
得られたサンプル境界はモデル次元に依存している。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:48:18 GMT)
Bridging Legal Interpretation and Formal Logic: Faithfulness, Assumption, and the Future of AI Legal Reasoning [3.1] 法律実務における大規模言語モデルの採用の増加は、大きな約束と重大なリスクをもたらす。
この提案は,大言語モデルの表現力と形式的検証の厳密さを結合した,法的AIに対するニューロシンボリックなアプローチを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:11:09 GMT)
LIFT: Last-Mile Fine-Tuning for Table Explicitation [3.1] 本稿では,構造化されていないクリップボードテキストから,事前学習された大規模言語モデルから初期テーブルを抽出するパイプラインLiftを提案する。
3つのデータセットから2596テーブルのベンチマークでは、LiftはエンドツーエンドのSLMファインチューニングにマッチするか、超えている。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:19:01 GMT)
Unsupervised learning of acquisition variability in structural connectomes via hybrid latent space modeling [3.1] dMRIにおけるサイト、スキャナー、プロトコル間の獲得差は、構造コネクトーム解析を複雑にする可変性を導入している。
これは低次元空間における高次元コネクトームを表現することができる深層学習モデルであり、生物学的変異から取得関連効果を明確に分離する。
最近のハイブリッド潜在空間モデルは、これに対応するために離散的および連続的なコンポーネントを組み合わせているが、通常、離散的なコンポーネントが意図した変数をキャプチャすることを保証するために、手動のキャパシティチューニングを必要とする。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:11:49 GMT)
Phasor Memory Networks: Stable Backpropagation Through Time for Scalable Explicit Memory [3.0] ニューラルチューリングマシンのような明示的なメモリアーキテクチャは、バックプロパゲーション・オブ・タイムにおいて破滅的な不安定さのため、言語モデリングには理論上は魅力的だが実用上は魅力的である。
この研究は、textitPhasor Memory Network (PMNet) によって、この不安定な状態を破り、textitUnitary Phasor Dynamics と textitHierarchical Learnable Anchors によって、メモリのボラティリティを構造的に解決する新しいアーキテクチャである。
我々のアブレーション研究と勾配解析により、明示的メモリの歴史的故障は構造的アライメントの問題であり、PMNetが効果的に克服し、拡張性のあるシーケンスの理論的基礎となることが確認された。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:28:06 GMT)
EVA-Bench: A New End-to-end Framework for Evaluating Voice Agents [3.0] EVA-Benchは、音声エージェントのエンドツーエンド評価フレームワークである。
動的マルチターン対話を通じてボット間音声会話をオーケストレーションする。
タスク完了、忠実度、および音声レベルの音声の忠実度をキャプチャする。
また、会話の進行、会話の簡潔さ、ターンテイキングのタイミングもキャプチャする。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:58:52 GMT)
A New Technique for AI Explainability using Feature Association Map [3.0] AIシステムにおける透明性の欠如は、現実のアプリケーションに課題をもたらす。
システムに対する信頼を確保するために、AIシステムの決定を説明できることが重要です。
我々は、AIシステムの説明のための新しいアルゴリズムFAMeXを提案している。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:47:55 GMT)
Conditional Attribute Estimation with Autoregressive Sequence Models [3.0] Conditional Attribute Transformersは、次のトークン選択の確率と属性の値を共同で推定する新しい方法である。
提案手法は,スパース報酬タスクにおけるアートパフォーマンスの状態を達成し,属性確率をサンプリングよりも桁違いに高速に推定し,多言語タスクにおける自己回帰シーケンスモデルの復号化を導出する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:11:16 GMT)
Same Image, Different Meanings: Toward Retrieval of Context-Dependent Meanings [2.9] 画像意味の文脈依存性とその検索への応用について検討する。
キーとなる観察は、コンテキスト依存はセマンティックな抽象化と相関しているということだ。
我々はこれをL1-L4フレームワークとして運用し、文脈非依存(L1)から最大文脈依存(L4)までのイメージセマンティクスを編成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:31:10 GMT)
ROK-FORTRESS: Measuring the Effect of Geopolitical Transcreation for National Security and Public Safety [2.9] 大規模言語モデルの安全性評価は、国家安全・公共安全(NSPS)リスクをますますターゲットにしている。
言語と地政学的文脈の相互作用の実証的な証拠は 狭い言語対に限られています
EmphROK-FORTRESSは、英語と韓国語の組み合わせと米国-ROKの地政軸をケーススタディとして用いた、バイリンガルで文化的に敵対的なNSPSベンチマークである。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:07:22 GMT)
LoREnc: Low-Rank Encryption for Securing Foundation Models and LoRA Adapters [2.9] ファンデーションモデルとローランクアダプタは、デバイス上の効率的な生成AIを可能にするが、知的財産の漏洩やモデル回復攻撃のようなリスクを増大させる。
FMとアダプタの両方をスペクトルトランケーションと補償により保証する,トレーニングフリーのフレームワークであるLoREncを提案する。
実験によると、LoREncは1%未満の計算オーバーヘッドでモデル回復に対して強力な保護を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:27:23 GMT)
Combining Mechanical and Agentic Specification Inference for Move [2.9] 本稿では,Move Proverの仕様推論ツールについて述べる。
これは、Moveバイトコードに対する最も弱い条件分析とClaude CodeのようなエージェントコーディングCLIを組み合わせる。
このツールは標準的なMoveコードのコーパスに適用されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:35:58 GMT)
Tight Sample Complexity Bounds for Entropic Best Policy Identification [2.9] エントロピーリスク尺度に基づく有限水平リスク感応型強化学習における最良政体同定について検討した。
最近の研究は、ほぼ最適な政策を特定するのに必要なサンプル数に基づいて、下界と上界の指数的地平面依存性の一定のギャップを確立した。
この指数係数は指数ユーティリティの過度に緩い濃度制御に追従できることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:02:26 GMT)
Dynamics Computation of Soft-Rigid Hybrid-Link System and Its Application to Motion Analysis of an Athlete Wearing Sport Prosthesis [2.9] 我々は,剛体リンクとソフトボディを統合したハイブリッドリンクシステムを構築した。
ハイブリッドリンクシステムの逆運動学をモーションキャプチャーデータからの運動再構成に適用する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:49:44 GMT)
Contrastive-SDXL: Annotation-Preserving Night-Time Augmentation for Pedestrian Detection [2.8] 夜間歩行者検出のための日夜拡張フレームワークであるContrastive-SDXLを提案する。
日中の入力と翻訳された夜間画像とのセマンティックな対応を維持するために,パッチワイドなセマンティック・コントラッシブ・ロスを導入する。
合成画像で訓練した検出器は、日中のみのベースラインに比べて6-7%のミス率の低下が得られる。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:41:55 GMT)
Enhanced quantum capacity thresholds from symmetry [2.8] 2つの原型雑音モデルのキャパシティ閾値が顕著に増加することを示す。
脱分極チャネルの場合、これが18年ぶりに改善された。
表現論的計算は、チャネルの指数関数的に多くのクラウス作用素が対称空間を消滅させることを示している。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:21:15 GMT)
When Should an AI Workflow Release? Always-Valid Inference for Black-Box Generate-Verify Systems [2.8] LLM対応AIは、繰り返し生成・評価・修正ループを通じて出力を生成する。
デプロイメント時間評価器のスコアが適応的に生成され、繰り返し監視されるため、これは統計的課題を提起する。
既存のジェネレータ評価パイプラインに対して,常に有効なリリースラッパーを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:30:39 GMT)
Extending Blockchain Untraceability with Plausible Deniability [2.8] 本稿では,移動イベント自体を共通の分散ファイナンス(DeFi)活動にブレンドすることで観測不能にすることができるかを検討する。
我々は、共通の損失発生イベントを発生させる転送のクラスであるDeniable Covert Asset Transfer (DCAT)を紹介する。
評価された設定の下では、DCAT転送は両鎖で経験的に観測できない。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:02:15 GMT)
Leveraging Multimodal Self-Consistency Reasoning in Coding Motivational Interviewing for Alcohol Use Reduction [2.8] コーディング面接(MI)セッションは、クライアントの振る舞いを理解し、結果を予測するのに不可欠です。
音声モデル(ALM)の最近の進歩は、行動信号をキャプチャしてMIコーディングを自動化する新しい機会を提供する。
本研究は,複数の推論軌道からの予測をキャプチャーし,MIの自動符号化手法を開発することを目的とする。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:36:04 GMT)
EnergyLens: Interpretable Closed-Form Energy Models for Multimodal LLM Inference Serving [2.7] 既存のアプローチでは、レイテンシをエネルギプロキシとして扱うか、データ不足のブラックボックスサロゲートに依存している。
本稿では,データに対する構造発見ツールとして,シンボル回帰を用いたEnergyLensを提案する。
ブラックボックスサロゲートとは異なり、EnergyLensはテンソルとパイプライン並列性を分離し、デコードエネルギーからプリフィルを分離する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:15:33 GMT)
Distinguishing performance gains from learning when using generative AI [2.7] 生成的人工知能(AI)は、学習者のパフォーマンスを高めることができる教育に統合されつつある。
これらの使用は、高品質な学習に必要な深い認知的・メタ認知的処理を促進するものではない。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:11:05 GMT)
Empowering IoT Security: On-Device Intrusion Detection in Resource Constrained Devices [2.7] 本研究は、ニューラルネットワークを用いてサイバー脅威を識別する決定木法を用いて、機械学習アルゴリズムを利用して、99%の顕著な検出精度を達成し、96%のニューラルネットワークを用いてサイバー脅威を識別する軽量モデルを提案する。
決定木法は高い精度を提供するが、より計算資源を必要とする一方、ニューラルネットワークのアプローチは、わずかに精度が低いにもかかわらず、よりメモリ効率が高い。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:23:17 GMT)
When Evidence Conflicts: Uncertainty and Order Effects in Retrieval-Augmented Biomedical Question Answering [2.6] HealthContradictを用いて、5つの制御された証拠条件下で6つのオープンウェイト大言語モデル(LLM)を評価する。
その結果, バイオメディカルな証拠の相反は不確実性と堅牢性の両方の問題であることが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:02:24 GMT)
Formal Verification of Imperative First-Class Functions in Move [2.6] Move Prover (MVP) は、Moveプログラミング言語で記述されたスマートコントラクトの形式検証である。
本稿では,Move仕様言語における関数値の表現とそのMVPにおける実装について述べる。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:34:36 GMT)
Neural Fields for NV-Center Inverse Sensing [2.6] 科学的センシングにおける逆問題はしばしば、手書きの正規化器またはシミュレートされたラベルで訓練された教師付きネットワークによって解決される。
本研究では、一般的なスカラー/コヒーレントフォワード近似をテンソルパワーを仮定した双極子演算子に置き換えることで、逆景観が変化することを示す。
微分可能なNVフォワードモデルに結合したアモータイズフリー座標場であるNeTMYを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:02:34 GMT)
Creativity Bias: How Machine Evaluation Struggles with Creativity in Literary Translations [2.6] 本稿では,文章翻訳における自動評価指標(AEM)とLCM-as-a-judge評価の性能について検討する。
目的は、これらのツールが翻訳、クリエイティビティ(創造的なシフトとエラー)を評価する際に、プロフェッショナルとどの程度うまく一致しているかを評価し、退屈な手作業のアノテーションを置き換えられるかどうかを確認することである。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:30:41 GMT)
Observation of end-to-end pumping in a quasiperiodic Fibonacci-type photonic chain [2.6] トポロジカルポンプは、バスを接続するための有望なルートを提供し、ネットワーク内の非隣接要素間の効率的で堅牢な接続を提供する。
セットアップの一方の端で単一導波路に光を注入してポンプを数値シミュレーションし,実験を行った。
その結果, 準周期的フィボナッチ型フォトニック格子は, 耐障害性のある状態伝達のための頑健かつ実験的に実現可能であることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:36:53 GMT)
Sparse Code Uplifting for Efficient 3D Language Gaussian Splatting [2.6] SCOUPは2D画像領域に関連する機能を使って、スパースコードブックベースの表現を学習する。
本手法は,トレーニング中のメモリ効率を3倍に高めながら,最大400Times$トレーニング高速化を実現する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:35:31 GMT)
ASAP: Amortized Doubly-Stochastic Attention via Sliced Dual Projection [2.5] Amortized Doubly-Stochastic Attention via Sliced Dual Projection。
二重確率層をシンクホーンで訓練し、推論時の反復スケーリングループを固定スライスダイアル演算子に置き換える。
正確な1次元のカントロヴィチポテンシャルからシンクホーンクエリサイドの双対への軽量パラメトリックマップを学習し、2面のエントロピーc-変換でアテンションプランを再構築する。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:48:46 GMT)
Transformers Linearly Represent Highly Structured World Models [2.5] 本研究では,Sudokuのトレースを解く8層トランスをトレーニングし,内部計算の力学解析を行う。
最終層に専用ニューロンの小さなセットを配置し、それぞれが特定のセルに対して正確に1桁の値が残っていることを個別に検出する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:59:05 GMT)
Implicit Behavioral Decoding from Next-Step Spike Forecasts at Population Scale [2.4] ニューロピクセルスケールで次のステップのスパイク数だけを訓練した単一のマムバ予報装置は、どちらも1回の前方通過で配送できる。
モデルの予測レートを読み取る軽量なパーセッション線形ヘッドは、生のスパイク数を読み取る同じ線形分類器よりも振舞いを復号する。
生のスパイク数で一致した500ms-contextリニアデコーダと比較して、マムバは反応で4-6pp、刺激側で4-6ppでトライアル投票で勝利した。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:55:03 GMT)
Uncertainty-Aware Prediction of Lung Tumor Growth from Sparse Longitudinal CT Data via Bayesian Physics-Informed Neural Networks [2.3] 本研究は, 肺腫瘍の進展予測を, 測定変動を伴う, スパースおよび不規則な経時的CT(CT)観察から検討した。
対数体積領域におけるゴアンペルツ成長ダイナミクスと低次元ベイズ推論を組み合わせることにより、ベイズ物理学インフォームドニューラルネットワークを開発した。
このフレームワークは、最大後部推定(MAP)とハミルトンモンテカルロサンプリングを組み合わせた2段階の推論戦略を用いて、後部予測分布と不確かさ間隔を推定する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:00:31 GMT)
Uncovering Trajectory and Topological Signatures in Multimodal Pediatric Sleep Embeddings [2.3] 本研究は, 自己エンコーダに埋め込まれた30秒の小児PSGエポックに含まれるセッションワイド診断情報について検討する。
本研究は, PHATE 由来の組込み座標と一晩移動記述子, 組込み雲の持続的ホモロジー要約, EHR がタスク関連信号を生成するかどうかを検証した。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:11:28 GMT)
Graph-Driven Cross-Industry Real-Time Monitoring Framework for Anti-Money Laundering Detection in Converged Mobility-Energy Supply Chain Networks [2.3] 業界横断サプライチェーン金融は、隠れマネーロンダリング事件のリスクの高い分野となっている。
本研究は,エネルギー供給チェーンネットワーク統合のための,グラフ駆動型産業間リアルタイムマネーロンダリング監視フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:10:47 GMT)
Locale-Conditioned Few-Shot Prompting Mitigates Demonstration Regurgitation in On-Device PII Substitution with Small Language Models [2.2] PIIのリアクションは通常、検出されたエンティティを[PERSON]のようなプレースホルダートークンに置き換える。
我々は、PIIを一貫した型保存型偽値で置き換える完全なオンデバイスパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:47:11 GMT)
Backbone is All You Need: Assessing Vulnerabilities of Frozen Foundation Models in Synthetic Image Forensics [2.2] 我々は、検出器のViTバックボーンのみの知識を活用するグレーボックス攻撃であるSurrogate Iterative Adversarial Attack (SIAA)を提示する。
この脆弱性は攻撃の成功率が高く、多くの場合、ホワイトボックスのパフォーマンスに近づいている。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:35:56 GMT)
Debunking Grad-ECLIP: A Comprehensive Study on Its Incorrectness and Fundamental Principles for Model Interpretation [2.2] Grad-ECLIPはICML 2024で発表され、新しいトランスフォーマー解釈技術ルート(中間機能ベース)を表現している。
本稿では,中間機能に基づく技術経路が新しいものではないことを示す。
我々は、モデル解釈が類似の誤りを避けるために従うべき2つの基本原則を明示的に強調する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:35:23 GMT)
SToRe3D: Sparse Token Relevance in ViTs for Efficient Multi-View 3D Object Detection [2.1] ビジョントランスフォーマー(ViT)は強力なマルチビュー3D検出を可能にするが、高密度トークンからの高い推論遅延と、複数のビューと大きな3D領域にわたるクエリ処理によって制限される。
SToRe3Dは2次元画像トークンと3次元オブジェクトクエリを協調的に選択し、再活性化のためのフィルタ機能を格納する。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:53:03 GMT)
Verifiable Agentic Infrastructure: Proof-Derived Authorization for Sovereign AI Systems [2.1] 構造化された人工物から実行権限を演算する制御された突然変異システムに対する検証フレームワークを提案する。
DTFは、エージェント実行を統治可能、監査可能、およびソブリンAIデプロイメントにバウンド化するためのインフラストラクチャ基盤を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:58:52 GMT)
Protocol-Driven Development: Governing Generated Software Through Invariants and Evidence [2.1] 本稿では,主要なソフトウェアアーチファクトが実装コードではなく,機械で強化可能なプロトコルであるプロトコル駆動開発(PDD)について紹介する。
PDDは、自動化されたソフトウェアエンジニアリングのためのガバナンス層を定義する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:23:14 GMT)
Quantum End-to-End Learning for Contextual Combinatorial Optimization [2.0] コンテキスト最適化は不確実性の下で意思決定において重要な役割を果たす。
我々は,CCOのための量子コンピューティングベースの初のエンドツーエンド学習フレームワークであるQuantum End-to-End Learning (QEL)を紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:04:09 GMT)
Multi-Modal Guided Multi-Source Domain Adaptation for Object Detection [2.0] 一般的なオブジェクト検出(OD)は、トレーニング分布とは異なるターゲットドメイン内のオブジェクトを検出するのに苦労する。
本稿では,(1)深度誘導型ローカライゼーションと(2)マルチモーダル誘導型プロンプト学習からなるMS-DeProを提案する。
MS-DeProはMSDAベンチマークで最先端のパフォーマンスを達成し、我々のコントリビューションの有効性を包括的に検証した。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:06:22 GMT)
On Hallucinations in Inverse Problems: Fundamental Limits and Provable Assessment Methods [2.0] ディープニューラルネットワークは幻覚を発生させ、現実的に見えるが誤った詳細を発生させ、信頼性を損なう。
このような幻覚が特定のモデルの人工物であるだけでなく、逆問題自体の誤った性質から生じる可能性があることを示す理論的枠組みを開発する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:11:43 GMT)
An Integrated Forecasting Prototype for Emergency Department Boarding Time to Support Proactive Operational Decision Making [1.9] 救急部門(ED)の過密は、現在も世界中で持続的な運用上の課題である。
我々は,ED搭乗時刻を6,8,10,12,24時間水平線で予測するマルチホライゾン時系列予測フレームワークを開発し,評価した。
深層学習モデルは複数の地平線にわたって優れた性能を示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:14:56 GMT)
CO-MAP: A Reinforcement Learning Approach to the Qubit Allocation Problem [1.9] 量子コンパイラは、抽象量子回路を物理量子コンピュータ上で実行可能にするため、量子コンピューティングパイプラインにおいて重要な部分である。
量子コンパイルにおける非常に重要なサブプロブレムの1つは、論理的-物理的量子ビットマッピングの生成である。
本稿では,量子ビットマッピング問題を解くための代替手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:04:09 GMT)
Scaling few-shot spoken word classification with generative meta-continual learning [1.8] 少数のクラスを考慮に入れたアプリケーションでは,ほとんど音声単語分類が開発されていない。
本稿では,音声単語分類器が,クラス毎に5つのショットしか与えられていない場合に,1000のクラスを連続的に区別する可能性について検討する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:47:57 GMT)
Does language matter for spoken word classification? A multilingual generative meta-learning approach [1.8] 生成メタ連続学習アルゴリズムを音声単語分類に適用する。
我々は英語、ドイツ語、フランス語、カタルーニャ語で単言語モデルを訓練し、英語とドイツ語でバイリンガルモデルを訓練する。
その結果,多言語モデルでは性能が優れているが,モデル性能の差は意外に低いことがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:54:51 GMT)
MCPShield: Content-Aware Attack Detection for LLM Agent Tool-Call Traffic [1.8] Model Context Protocol (MCP) は、エージェントが外部ツールを呼び出すために広く採用されているインタフェースである。
MCPは、各エージェントセッションをグラフとしてエンコードするMCPツールコールトラフィックのアタックフレームワークとして提示される。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:16:25 GMT)
The Cost of Perfect English: Pragmatic Flattening and the Erasure of Authorial Voice in L2 Writing Supported by GenAI [1.8] 我々は、文化的に好まれる丁寧さと権威的スタンスを体系的に消去する「実用的平坦化」について検討する。
発見は、セマンティック保存パラドックス内のニュアンスな「次元のばらつき」を明らかにする。
我々は、多言語作家が言語強化にGenAIを使用することを許可するために、将来の指導は誤り訂正を超えて進めなければならないと論じている。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:26:18 GMT)
LongBEL: Long-Context and Document-Consistent Biomedical Entity Linking [1.8] LongBELはドキュメントレベルの生成フレームワークで、ドキュメントコンテキストと以前の予測のメモリを組み合わせる。
LongBELは文レベルの生成ベースラインよりも改善されており、概念がドキュメント内で頻繁に再帰するデータセットで最大の利益を得ている。
ローカル、グローバル、メモリベースのバリエーションのアンサンブルは、すべてのベンチマークで最高の結果を得る。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:47:21 GMT)
A Hybrid Framework for Natural Language Querying of IFC Models with Relational and Graph Representations [1.8] IFCベースのBIMモデルと自然言語インタラクションのためのハイブリッドフレームワークであるifcLLMを紹介する。
オープンウェイトLSM(GPT OSS 120B)を用いて,再現性とデプロイメント指向のフレームワークを実装した。
その結果、補完表現と反復推論を組み合わせることで、IFCデータのよりアクセスしやすい自然言語クエリが可能になることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:24:51 GMT)
PicoEyes: Unified Gaze Estimation Framework for Mixed Reality with a Large-Scale Multi-View Dataset [1.8] PicoEyesは、視線のすべての重要な特性を直接予測する統合された視線推定フレームワークである。
キャリブレーション、視線予測、さまざまなデバイス姿勢を同時に処理する。
眼のパラメータと深度マップをエンドツーエンドで共同で推定することで、三次元眼の再構成をサポートする。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:35:30 GMT)
Characterizing Universal Object Representations Across Vision Models [1.7] 異なるアーキテクチャ、目的、データセットでトレーニングされたディープニューラルネットワークは、同様の視覚表現に収束するように報告されている。
162種類の視覚モデルのオブジェクト類似性構造を,非負次元の小さな集合に分解する。
普遍的次元とモデル固有の次元を決定するために、各次元がモデル全体でどれだけ頻繁に出現するかを推定する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:34:41 GMT)
ViDR: Grounding Multimodal Deep Research Reports in Source Visual Evidence [1.7] 情報源の長文レポートを基盤とするフレームワークであるViDRを提示する。
ViDRは、ソースフィギュアを検索可能、解釈可能、未確認、検証可能なエビデンスオブジェクトとして扱う。
また,深部研究報告における視覚的エビデンス評価のベンチマークであるMMR Bench+についても紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:39:38 GMT)
Why We Need World Models for AGI: Where LLMs Fail and How World Models May Outperform [1.7] 大規模言語モデルは、言語生成と知識集約タスクにおいて強力なパフォーマンスを達成する。
これらの制限は、潜在環境力学に対するシーケンス予測と推論の客観的なミスマッチから生じる可能性がある。
言語とマルチモーダルな観察を基礎となる遷移力学の部分的証拠として解釈する概念的視点である潜在ダイナミクス推論(LDI)を紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:55:34 GMT)
HPC-vQPU: A Service-Export Architecture for Virtual QPUs on Batch-Scheduled HPC Systems [1.7] HPC-vQPUは、バッチスケジューリングされたHPCシステム上の仮想QPUのためのサービスエクスポートアーキテクチャである。
運用実験では、サービスのオーバーヘッドが制限され、付加的なものであることが示されていますが、ワークロードのスケーリングはシミュレータに限られています。
その結果、セキュアでスケジューラを介するHPCインフラは、対話型仮想QPUサービスとしてデバイスに忠実な量子シミュレーションをエクスポートできることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:31:58 GMT)
C-Phase-Aware Compilation for Efficient Fault-Tolerant Quantum Execution [1.6] 本研究は,アルゴリズム構造と格子手術を直接統合したマイクロアーキテクチャ・アウェアコンパイル手法を提案する。
空間配置とルーティング制約を正確にモデル化する動的イベント駆動型スケジューリング戦略を設計する。
このアプローチはアイドルリソースを大幅に削減し、標準ベースラインと比較して59.7$times$実行時間を短縮する。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:03:18 GMT)
From Descriptive to Prescriptive: Uncover the Social Value Alignment of LLM-based Agents [1.6] GraphRAGを使って、原則をバリューベースの命令に変換し、エージェントが期待通りに振る舞うように操縦します。
本手法は,AIシステムにおける自己感情の出現の基盤となる。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:50:22 GMT)
HEPA: A Self-Supervised Horizon-Conditioned Event Predictive Architecture for Time Series [1.6] HEPA(Horizon-conditioned Event Predictive Architecture)は2つの重要な原則に基づいて構築されている。
因果トランスフォーマーエンコーダはJEPA(Joint-Embedding Predictive Architecture)を介して事前訓練される
我々はエンコーダを凍結し、予測器のみを目標事象に向けて微調整し、地平線上の単調生存累積分布関数(CDF)を生成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:10:18 GMT)
Do Heavy Tails Help Diffusion? On the Subtle Trade-off Between Initialization and Training [1.6] 近年の研究では,HTノイズを拡散・流動モデルに取り入れることが提案されている。
我々は,HTノイズが統計的推定問題を難しくし,サンプリングエラー境界がより少ないことを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:37:59 GMT)
Unified Pix Token And Word Token Generative Language Model [1.5] 生成言語モデルにピクセルトークンとワードトークンを統一する新しいモデルを提案する。
新たなモデルでは、各ピクセルに独自のトークン埋め込み、カラー折り畳み、グローバルなコンディショナルアテンション近似、教師なし事前トレーニングを備えている。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:38:51 GMT)
AI Harness Engineering: A Runtime Substrate for Foundation-Model Software Agents [1.4] ファンデーションモデルは、自動コード生成を変革しましたが、現実的な開発環境では、自律的なソフトウェアエンジニアリングエージェントは信頼できないままです。
本稿では,基盤モデルエージェントがプロジェクトを観察し,それを処理し,フィードバックを受信し,変更が完了したことを確定する,モデルハーネス環境システムを提案する。
このフレームワークは、ファンデーションモデルがパッチを作成できるかどうかから、モデルハーネス環境システムが検証可能な正確さ、属性、メンテナンス可能な変更を生成できるかどうかという、自律的なソフトウェアエンジニアリングの中心的な疑問を再考する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:14:59 GMT)
Sampling from Flow Language Models via Marginal-Conditioned Bridges [1.4] フロー言語モデル (FLM) は、1ホットエンコードされたトークンシーケンスに対して連続的なフローマッチングを適用する。
我々は、FLMの自然なサンプリングは、代わりに後述の予測であると主張する。
誘導されたワンステップブリッジカーネルはトークン単位の後方予測限界を全て保持することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:38:48 GMT)
Genetic algorithm vs. gradient descent for training a neural network architecture dedicated to low data regimes in small medical datasets [1.4] 距離符号化型生体情報ニューラルネットワーク(DEBI-NN)は近年提案されているアーキテクチャである。
DEBI-NNのトレーニングプロセスは、勾配降下(GD)ではなく遺伝的アルゴリズム(GA)に基づいている
論文参考訳(メタデータ) (Wed, 13 May 2026 09:13:45 GMT)
Combining moment matrices, symmetric extension, and Lovász theta: $Φ_{\text{E8}}$ is entangled [1.4] 絡み合った証人を通じて、14$-qubit 状態 $_textE8$ が絡み合っていることを示す。
量子符号の手法に着想を得て、対称拡張とモーメント行列を組み合わせることで、$_textE8$が絡み合っていることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:54:51 GMT)
A Horn extension of DL-Lite with NL data complexity [1.4] 我々は,コアDL-Liteを厳密に拡張し,到達性制限された接続をサポートし,NLの推論を可能にする記述ロジックを導入する。
我々はNLを双方向のレギュラーパスクエリに書き換えることで確立し、OMQAをグラフクエリ言語に拡張する上で、私たちの言語が有望な候補であることを示す最初の証拠を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:26:32 GMT)
CLIP Tricks You: Training-free Token Pruning for Efficient Pixel Grounding in Large VIsion-Language Models [1.4] LiteLVLMは、効率的なピクセルグラウンドディング推論のためのトレーニング不要でテキスト誘導型トークンプルーニング戦略である。
LiteLVLMは、さまざまなトークン予算において、既存のメソッドを5%以上上回ります。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:40:40 GMT)
Key-Value Means: Transformers with Expandable Block-Recurrent Compressed Memory [1.4] キーバリュー平均(英: Key-Value Means、KVM)は、固定サイズまたは成長状態のいずれかに対応可能な、注目のためのブロックリカレンスである。
本研究は,4次前処理時間と線形状態成長しか持たない長期コンテキストテストにおいて,競争力を発揮することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:03:44 GMT)
X-Restormer++: 1st Place Solution for the UG2+ CVPR 2026 All-Weather Restoration Challenge [1.4] 第8回 UG2+ Challenge (CVPR 2026) Track 1: Image Restoration under All-weather Conditions。
提案手法は,チャネルワイドグローバル依存と空間的局所構造情報の両方を効果的にキャプチャする,強力なベースラインフレームワークであるX-Restormer上に構築されている。
これらの戦略により,提案手法は課題の1位にランクインすることに成功した。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:41:09 GMT)
Exploiting Pre-trained Encoder-Decoder Transformers for Sequence-to-Sequence Constituent Parsing [1.3] 最近のアプローチでは、シーケンス・ツー・シーケンスモデルを使用して構成解析を機械翻訳問題として扱う。
これらのモデルは典型的には、BERTやRoBERTaのような訓練済みエンコーダのみの言語モデルである。
我々は、BART、mBART、T5など、事前訓練されたエンコーダデコーダアーキテクチャ上に構築されたノットを調査して、このフレームワークを拡張した。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:28:56 GMT)
PROMETHEUS: Automating Deep Causal Research Integrating Text, Data and Models [1.3] PROMETHEUSは、検索した文献、書類、レビュー、レポート、エージェントトレース、ソースデータ、コード、シミュレーション、科学モデルを因果アトラスに変換するフレームワークである。
各地域は、因果エピソード、構造化されたクレームテーブル、予測テスト、サポート統計、証明を含む。
結果として得られるトポス世界モデルは、単一の普遍グラフではない。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:08:07 GMT)
Modeling Bounded Rationality in Drug Shortage Pharmacists Using Attention-Guided Dynamic Decomposition [1.3] 病院薬剤師は、不確実性、時間的プレッシャー、患者のリスクの下で、薬物不足に対して高い評価を下す。
インタビューによると、薬剤師は少量の薬物に注意を向けており、認知的努力を最も緊急なケースに限定している。
これらの知見に触発され、我々は限定的、注意深い意思決定の枠組みを定式化した。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:53:28 GMT)
IndicMedDialog: A Parallel Multi-Turn Medical Dialogue Dataset for Accessible Healthcare in Indic Languages [1.3] IndicMedDialogは、英語と9つのIndic言語にまたがるマルチターン医療対話データセットである。
このデータセットは、ネイティブスピーカーによって検証されたTranslateGemmaを用いて翻訳されたLLM生成合成コンサルテーションによりMDDialを拡張する。
IndicMedLMを量子化された小言語モデルのパラメータ効率適応により微調整し、任意の患者プレコンテキストを組み込む。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:06:38 GMT)
Automatic Detection of Reference Counting Bugs in Linux Kernel Drivers [1.3] 我々はLinuxカーネルドライバの参照カウントバグを検出する新しい自動化ツールであるDrvHornを紹介する。
DrvHornは545のバグを発見し、そのうち424は以前は知られていなかった。
新たに発見されたバグの根本原因を解決するため,Linuxカーネルにパッチを提出し,そのうち45をマージした。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:31:08 GMT)
Scalable Deductive Verification of Data-Level Parallel Programs [1.3] 本稿では,(ネステッド)量子化器を用いて式を書き換える手法を提案する。
また、潜在的に重複する配列の推論を容易にする。
これらの手法は VerCors プログラム検証器に実装されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:45:49 GMT)
Design of Magnetic Continuum Robots with Tunable Force Response Using Rotational Ring Pairs [1.3] 本稿では,その先端部における磁気応答のオンラインチューニングを可能にする,新しい連続ロボット設計について論じる。
提案するロボット設計は、制御可能な磁場と固定された磁場の両方で使用することができ、これらのロボットの臨床的応用性を広げる可能性がある。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:44:19 GMT)
Terminal Matters: Kinodynamic Planning with a Terminal Cost and Learned Uncertainty in Belief State-Cost Space [1.2] 多くの現実世界のロボットタスクでは、ロボットは不確実性の下でも確実に望ましい目標に達するような、実現可能な動作を作らなければならない。
そこで,キノダイナミック計画のための端末コスト定式化を導入し,蓄積した軌道コストとともに端末状態の品質を最適化する。
得られたプランナーであるKiTeは、この端末コストの目標を符号化し、不確実性の下で信頼性を向上させる。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:07:59 GMT)
Mid-Circuit Measurements for Clifford Noise Reduction in Hamiltonian Simulations [1.2] フェルミオンハミルトニアンの量子シミュレーションは量子コンピューティングの先導的な応用である。
符号化ハミルトンシミュレーションのためのデバイスマッチングノイズ低減フレームワークを提案する。
機械学習誘導型安定化器の選択は、ランダム選択よりも優れた検証演算子を識別できることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:11:22 GMT)
Multi-Dimensional Behavioral Evaluation of Agentic Stock Prediction Systems Using Large Language Model Judges with Closed-Loop Reinforcement Learning Feedback [1.2] ファイナンスにおける予測評価は、ポイント予測エラーに基づく集計精度測定と予測精度テストに依存している。
本稿では,中間決定プロセス自体を評価することによって,精度試験を補完する行動予測評価手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:25:23 GMT)
DSTAN-Med: Dual-Channel Spatiotemporal Attention with Physiological Plausibility Filtering for False Data Injection Attack Detection in IoT-Based Medical Devices [1.1] インターネット・オブ・メディカル・モノ(IoMT)センサーに対するFalse Data Injection(FDI)攻撃は、トランジットにおける重要な兆候を偽る。
既存のディープラーニング検出器は、センサ間の空間的相関と、共有潜在空間における時間的依存関係を分割する。
DSTAN-Medは多変量センサウインドウを独立センサワイド(SWA)および時間ワイド(TWA)自己アテンション経路を介してルーティングする教師付きフレームワークである。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:39:47 GMT)
Berry-Phase-Induced Chirality in Thermodynamics [1.1] 脱コヒーレンスを持続する散逸性断熱拡張を開発する。
このキラリティは、単位系における干渉力学のアハロノフ・ボーム効果から、散逸系におけるフリンジフリー信号へと進化する。
熱力学の幾何学的定式化における量子幾何学の役割を明らかにする。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:41:39 GMT)
Synthetic Sociality: How Generative Models Privatize the Social Fabric [1.1] 我々は、記述的かつ規範的に生成モデルを分析するための批判的理論的枠組みを提唱した。
我々は、デジタル経済における社会のコモディティ化を歴史化し、生成モデルの前提条件として社会データが利用可能になる。
我々は、シリコンバレーの私有かつ民主的に支配されていない世代モデルによって部分的に構成された社会現実である、シンセティック・ソーシャル(Synthetic Sociality)の概念を紹介した。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:19:24 GMT)
Finding the Weakest Link: Adversarial Attack against Multi-Agent Communications [1.1] マルチエージェント強化学習訓練システムに対する単一ビビティ通信摂動攻撃について検討する。
本稿では,攻撃に最も影響を受けやすいメッセージ,エージェント,タイムステップを特定するために,ヤコビアンからの勾配情報を利用する手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:32:30 GMT)
Integration of an Agent Model into an Open Simulation Architecture for Scenario-Based Testing of Automated Vehicles [1.0] 本稿では,ツールに依存しないトラヒックエージェントモデルの統合を可能にする,標準化されたモジュール化されたシミュレーション統合アーキテクチャを提案する。
このアーキテクチャは、構造化メッセージフォーマットとしてOpen Simulation Interface(OSI)と、動的モデル交換のためのFMI(Functional Mock-up Interface)の上に構築されている。
評価の一環として, モデルが全てのシミュレーションプラットフォームにおいて一貫した振る舞いをもたらすことを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:47:51 GMT)
The Sample Complexity of Multiple Change Point Identification under Bandit Feedback [1.0] 帯域フィードバックによる複数の変化点の局所化について検討する。
コンパクト区間上の未知のピースワイズ・コンスタント関数は、適応的に選択された入力で順次クエリすることができる。
目標は、所定の数の不連続点(変更点)を目標精度$$で識別することである。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:35:19 GMT)
Embodied Neurocomputation: A Framework for Interfacing Biological Neural Cultures with Scaled Task-Driven Validation [1.0] 本稿では、この多変数最適化符号化/復号化問題に対するシステムレベルのアプローチとして、Embodied Neurocomputationフレームワークを提案する。
提案手法は,BNNエージェントの符号化構成の大規模パラメータ最適化によって実現されている。
これらの結果は、BNNを用いた堅牢でスケーラブルな目標指向学習に向けた最初のステップである。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:27:05 GMT)
LLM-Based Robustness Testing of Microservice Applications: An Empirical Study [1.0] マイクロサービスAPIの不正な、欠落、あるいはバウンダリバリューな入力は、依存サービスにまたがってカスケードし、信頼性を脅かす可能性がある。
大規模な言語モデルはAPI仕様からこのようなテストを生成することができるが、多種多様な効果的なテストを生成することは依然として困難である。
アーキテクチャ的に異なる2つのマイクロサービスシステムを対象とした,オープンソースの3つのLLMに対して,7つのプロンプト戦略を適用した制御実験を報告する。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:36:41 GMT)
Separating Shortcut Transition from Cross-Family OOD Failure in a Minimal Model [1.0] ショートカット機能は、アウト・オブ・ディストリビューション(OOD)障害を説明するためにしばしば呼び出されるが、トレーニングの相関、学習されたショートカットの使用、テスト時の失敗は一致しない。
1つの不変座標と1つの家族依存的ショートカット座標を持つ最小二項モデルについて検討する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:28:37 GMT)
Keyed Nonlinear Transform: Lightweight Privacy-Enhancing Feature Sharing for Medical Image Analysis [1.0] Keyed Transform (KNT) は、キー条件付き難読化を中間表現に適用したドロップイン機能変換である。
KNTはAUCの再識別を0.635から0.586に減らし、オーバーチャンス識別信号の36%の減少に対応する。
解析の結果、KNTの非線形変換は閉形式反転を防止し、リカバリを反復勾配に基づく最適化に移行する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:17:41 GMT)
ReproScore: Separating Readiness from Outcome in Research Software Reproducibility Assessment [1.0] デジタルライブラリは、数百万の研究ソフトウェアアーティファクトをキュレートするが、それらのアーティファクトが実行可能かどうかを評価するためのスケーラブルなインフラが欠如している。
ReproScoreは、結果(ROS)から読みやすさ(RRS)を明示的に分離する2層フレームワークである。
RRSは5つのカテゴリにまたがって26のサブメトリックで構成されており、ROSはサンドボックスインフラストラクチャが利用可能であるときに実行ベースのプローブを提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:54:06 GMT)
Backdoor Channels Hidden in Latent Space: Cryptographic Undetectability in Modern Neural Networks [0.9] 等価な非検出性が、最新のエンドツーエンドのトレーニングネットワークに拡張されるかどうかを検討する。
我々は,最先端アーキテクチャに対する攻撃機構を構築し,非検出性という暗号的概念と密接に一致している。
以上の結果から,暗号バックドアはエキゾチックなアーキテクチャや人工的な構造を必要とする工芸品である必要はなく,学習表現の幾何学に固有の潜伏特性として識別できることが判明した。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:06:25 GMT)
Collaborator or Assistant? How AI Coding Agents Partition Work Across Pull Request Lifecycles [0.9] Initiator xr 分類法と6つの相互作用シナリオを用いて29,585のPRライフサイクルを分析した。
私たちは、協力者支援のスペクトルに沿ってツールを特徴付け、イニシアチブを再編成し、監視し、支持します。
我々は、PRにおける自動化、監視、およびガバナンスの研究のために、分類学、ツールごとのステートマシン、複製パッケージにコントリビュートする。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:55:29 GMT)
INAR-VL: Input-Aware Routing for Edge-Cloud Vision-Language Inference [0.9] マルチモーダル推論のための軽量エッジクラウドルーティングシステム INAR-VL を2層配置で提案する。
INAR-VLはエッジ上で36%のリクエストを実行し、レイテンシを24%削減し、エネルギーを26%削減し、クラウドレベルの精度を97%維持することを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:44:10 GMT)
Safe Bayesian Optimization for Uncertain Correlations Matrices in Linear Models of Co-Regionalization [0.9] 我々は、ガウス過程からサンプリングされたベクトル値関数に対する一様誤差境界と、コレジナライズカーネルの線形モデルとを導出する。
安全なマルチタスクベイズ最適化ベンチマークにおける数値比較において,コレジナライゼーションの線形モデルを用いた性能改善の可能性を示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:14:43 GMT)
Coupling-Informed Transport Maps for Bayesian Filtering in Nonlinear Dynamical Systems [0.8] 状態変数と観測変数のカップリングに基づいて, 確率自由輸送フィルタ手法を提案する。
本稿では,高位後方領域と後方領域とのMDD計算について解析する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:36:49 GMT)
NERVE: A Neuromorphic Vision and Radar Ensemble for Multi-Sensor Fusion Research [0.8] NERVE(Neuromorphic Vision and Radar Ensemble)は5つのセンサから257分間の同期記録からなるマルチセンサデータセットである。
人間の検出と距離推定のためのDVS+Radarサブセットを構築した。
フィードフォワードとリカレント検出器を用いた実験では、DVSと77GHz Radarの組み合わせが常に検出を改善することが示されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:35:27 GMT)
MultiLinguahah : A New Unsupervised Multilingual Acoustic Laughter Segmentation Method [0.8] 本稿では,エネルギーベースセグメント化音声シーケンスの異常検出として,笑いセグメンテーションタスクを設定する教師なし多言語手法を提案する。
提案手法を,スタンドアップコメディ,シットコム,オーディオセットからの一般的な短い音声を含む4つのデータセットに対して,最先端の笑い検出アルゴリズムと比較した。
以上の結果から,最先端の手法は多言語文脈に最適化されていないが,本手法は非英語環境では性能が優れていた。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:35:17 GMT)
Random Access Code protocols: Quantum advantage related to intraparticle entanglement-based contextuality [0.8] 本研究では、量子エンハンスメントを達成するために、単一粒子の2つの共測定可能な自由度間の絡み合いについて検討する。
特に、量子$n の 1$ RAC プロトコルの最大成功確率は、関連するベル型不等式に対する最大量子違反に対応する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:10:59 GMT)
JANUS: Anatomy-Conditioned Gating for Robust CT Triage Under Distribution Shift [0.8] JANUSは生理学誘導型デュアルストリームアーキテクチャで、解剖学的ガイドゲーティングによるマクロラジオマ前駆体への視覚的埋め込みを条件付ける。
Janus はマクロ-AUROC 0.88 と AUPRC 0.74 を達成し、全ての再生ベースラインを上回ります。
我々は,生理的ベトレート(PVR)を用いて予測抑制を定量化し,ドメインシフトの少ないJANUSが真正よりも信頼性の高い偽陽性を著しく減少させることを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:41:05 GMT)
MPINeuralODE: Multiple-Initial-Condition Physics-Informed Neural ODEs for Globally Consistent Dynamical System Learning [0.8] MPINeuralODEは、ソフト物理インフォームド残差とMultiple-Initial-Conditionカリキュラムを組み合わせる。
Lotka-Volterra では、MPINeuralODE はデータ駆動方式の中で最小のサンプル外および長距離 MSE を達成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:18:18 GMT)
Dynamical Predictive Modelling of Cardiovascular Disease Progression Post-Myocardial Infarction via ECG-Trained Artificial Intelligence Model [0.8] コントラスト学習と教師付きマルチタスクヘッドを用いた患者固有の時間情報を組み合わせた事前学習型人工知能モデルを提案する。
提案モデルは, 臨床構造化ECGモデルにより, 限られたデータ構造における分類が向上することを示し, ゼロからトレーニングしたモデル(0.794 vs 0.608 AUC)よりも優れていた。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:05:43 GMT)
TruncProof: A Guardrail for LLM-based JSON Generation under Token-Length Constraints [0.8] TruncProofは機械可読出力のための新しい文法制約付き生成法である。
本稿では,TruncProofと高度な復号化戦略を効果的に組み合わせることで,文法的に妥当かつセマンティックに正確な出力が得られることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:49:08 GMT)
Memory Forensics Techniques for Automated Detection and Analysis of Go Malware [0.7] Goバイナリのランタイム解析のための最初のメモリフォサイシクスフレームワークを提示する。
我々のフレームワークは、型と関数のメタデータを再構築し、ヒープに割り当てられた静的文字列を復元し、アプリケーションレベルの関数を識別する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:34:00 GMT)
Inference of Qualitative Models from Steady-State Data via Weighted MaxSMT [0.7] We introduced a robust inference method based on weighted MaxSMT。
我々のアプローチは、事前知識ネットワークから神経細胞の分化モデルを予測するのに有効であることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:21:45 GMT)
Not Just RLHF: Why Alignment Alone Won't Fix Multi-Agent Sycophancy [0.7] 事前訓練されたベースモデルは、インストラクトの変種と同じ置換パターンを示し、インストラクトよりも高い収率を平均化する。
このウィンドウの上のパッチは、クリーンにプレッシャーされたP(正しい)ギャップの96%を復元する。
2つの凝縮活性化空間介入は、新しいサイコファンシー回路を活性化するのではなく、圧力がクリーンな推論特性を抑制することを示している。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:45:08 GMT)
Violations of the Leggett-Garg inequality in Hybrid Liouvillian Dynamics: The Nonlinear Role of Detector Efficiency [0.7] 我々は,現実的な計測プロセスを考慮した場合,レゲット・ガルグの不平等の極端な違反は本質的に脆弱であることを示した。
我々の結果は直接的な実験的な意味を持っている。
時間的非可分な力学に基づく離散プロトコルとは対照的に, 連続的, 可分な量子軌道進化における極端な違反は, 基本的に脆弱な状態であることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:18:40 GMT)
Parallel Scan Recurrent Neural Quantum States for Scalable Variational Monte Carlo [0.7] 現代のリカレントアーキテクチャは、高速で正確で計算可能なニューラル量子状態シミュレーションをサポートすることができることを示す。
我々は,1次元と2次元の変分モンテカルロ内で効率的にトレーニングできる,並列走査型ニューラル量子状態(PSR-NQS)と呼ばれる変分アンスターゼを開発する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:36:32 GMT)
Method-level Change-proneness: A Better Metric for Black-box Test Suite Minimization [0.7] テストスイート最小化(TSM)は、テストスイートのサイズを削減し、障害検出機能を保持する。
我々は,より粒度の高いメソッドレベルのCPを提案し,MCTM(Message-level Change-proneness based Test-suite Minimization)を実装した。
MCTMは平均で0.93の精度と0.94の故障検出率を達成し、クラスレベルのCPと類似性に基づくアプローチを著しく上回っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:13:58 GMT)
DiffusionHijack: Supply-Chain PRNG Backdoor Attack on Diffusion Models and Quantum Random Number Defense [0.6] 拡散モデルは遅延雑音サンプリングのための擬似ランダム数生成器(PRNG)に依存する。
DiffusionHijackは、PRNGをハイジャックして生成した画像を決定論的に制御するサプライチェーンバックドアアタックである。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:34:04 GMT)
Motion Planning for Autonomous Vehicles using Optimization over Graphs of Convex Sets [0.6] 自動運転車の運動計画には、リアルタイムな制約の下で、衝突のない、動的に実現可能な軌道を生成する必要がある。
本稿では,非線形動作計画問題に近似する新しい幾何学的制御法を提案する。
連続緩和における凸性を保ちながら、支配的な幾何学的動的効果を捉え、非線形運動計画問題の構造化された近似を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:29:54 GMT)
Unpredictability dissociates from structured control in language agents [0.6] 本稿では, サンプリングが, 記憶, 自己状態, 行動選択に対する抑制といった, 構造的メカニズムに取って代わるかどうかを検証した。
26,946世代にわたるマッチング・インタフェース制御において、構造化されたエージェントは、すべてのポストホック、スクランブルおよび冗長性制御よりも強力なアクション・フィールド結合を維持した。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:31:00 GMT)
Do Language Models Align with Brains? Prediction Scores Are Not Enough [0.6] L-PACTは、予測、リレーショナル、メカニズムストリッピング、信頼性に縛られたエビデンスを評価する、ソース監査されたフレームワークである。
L-PACTは、一次自然言語ニューラルデータセットと導出言語モデル表現全体にわたって、モデルから脳へのプロファイルが脳から脳へのパターンを再現したかどうかを検証した。
予測的、リレーショナル、メカニズムストリッピング、あるいは運用上のチューリングバウンドの信頼性ゲートを通過した真のモデル行はありません。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:37:17 GMT)
Pattern-Enhanced RT-DETR for Multi-Class Battery Detection [0.6] 本稿では,多クラス電池検出のための総合ベンチマークと新しい手法を提案する。
PaQ-RT-DETR-Xは0.782のmAP@50で、RT-DETR-Xを+2.8%上回る。
本研究は, 電池関連産業アプリケーションにおける物体検出モデル選択のための実用的なガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:29:52 GMT)
The Direct Integration Theorem: A Rigorous Framework for Consistent Discrete Solutions of the Inverse Radon Problem [0.6] 直積分定理(英: Direct Integration Theorem, DIT)は、古典的スライス理論(CST)の非自明な系である。
提案手法は従来の方法に固有の2つの主要な制限を回避している。
提案手法は, 強度カッピングなどの共通成果物を除去し, 常にPSNR, SSIM, リジェクションの忠実度でFBPより優れることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:32:01 GMT)
Intertwining Markov Processes via Matrix Product Operators [0.6] 格子上の一次元境界駆動マルコフ過程において双対変換を実装するために行列積作用素の非平衡一般化を導入する。
一般化された対称性に関連する局所双対性とは対照的に、双対作用素は一般化された交換関係を通じて2つのマルコフ過程を交叉し、世界中の非平衡双対性を実現する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:07:57 GMT)
An extensive theory of nonlinearly intercoupled pseudomodes for noise model reduction in circuit QED [0.6] オープンシステムcQEDダイナミックスのための非摂動的かつ体系的に再現可能なフレームワークを提供する。
我々は、維持モードグリーン函数に対するダイソン方程式を通して、ハイゼンベルク像の一般理論を発展させる。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:48:41 GMT)
A Unified Three-Stage Machine Learning Framework for Diabetes Detection, Subtype Discrimination, and Cognitive-Metabolic Hypothesis Testing [0.6] 糖尿病は世界中で5億3700万人以上の成人に影響を与えており、依然として予防医療において大きな課題となっている。
本稿では,糖尿病検出,サブタイプ指向クラスタリング,メタボリック認知関連解析のための再現可能な3段階機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:53:39 GMT)
Gyan: An Explainable Neuro-Symbolic Language Model [0.6] 本稿では,新しい非トランスフォーマーアーキテクチャに基づく説明可能な言語モデルについて述べる。
Gyanは、広く引用されている3つのデータセットでのSOTAパフォーマンスと、2つのプロプライエタリなデータセットでの優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:53:47 GMT)
SpikeProphecy: A Large-Scale Benchmark for Autoregressive Neural Population Forecasting [0.6] SpikeProphecyは、心電図の因果的・自己回帰的スパイク数予測のための最初の大規模ベンチマークである。
我々のコアコントリビューションは、集約性能を時間的忠実度、空間的パターン精度、等級不変アライメントに分離する人口計量分解である。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:45:35 GMT)
Evolving Layer-Specific Scalar Functions for Hardware-Aware Transformer Adaptation [0.5] ビジョントランスフォーマー(ViT)は、挑戦的なビジョンタスクにおいて最先端のパフォーマンスを達成するが、エッジデバイスへのデプロイメントは妨げられている。
最近の手法では、正規化層をハードウェアフレンドリーなスカラー近似に置き換えることでこれを回避しようとしている。
本稿では、遺伝的プログラミング(GP)を利用して、異種層特異的スカラー関数を進化させる高効率なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:08:55 GMT)
Decision Support for Marketplace Policies under Incomplete Evidence: From Replay to Launch Readiness [0.5] 本稿では,有望な証拠と実効性のある証拠とを区別するDSS(Support-Aware decision- supported system)を提案する。
このフレームワークは、リプレイ、サポート対応のオフポリシー評価(OPE)、保守的な下限ランキング、マルチサイドガードレール、アウトオブタイムバリデーション、感度分析、干渉対応のバリデーション設計を統合している。
フレームワークをiPinYouスタイルのRTBログに適用することで、マージンゲートのフロアポリシーを主要な候補と特定する。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:26:50 GMT)
ENSEMBITS: an alphabet of protein conformational ensembles [0.5] エンセムビット(Ensembits)は、タンパク質コンフォメーションアンサンブルの最初のトークンである。
ダイナミックスのトークン化に固有の課題に対処する。
大規模な分子動力学コーパスでフレーム蒸留の目的を訓練する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:08:41 GMT)
Reinforcement Learning for Tool-Calling Agents in Fast Healthcare Interoperability Resources (FHIR) [0.5] マルチターンのCodeエージェントを実装し、カスタムハーネスとツールを使用して強化学習を施した後訓練を行う。
提案手法は,より小型で安価なQwen3-8Bモデルを用いて,FHIR-AgentBench上で50%(o4-mini)から77%に改善する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:27:21 GMT)
Beyond VMAF: Towards Application-Specific Metrics for Teleoperation Video [0.5] 映像伝送はオペレーターの主要な状況認識源となる。
再訓練されたモデルでは、人間の評価と整合性が改善された。
動画は、運転作業に不可欠な領域で顕著な劣化があったにもかかわらず、高い客観的スコアを得た不適切なケースが出現した。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:38:54 GMT)
Robust Checkpoint Selection for Multimodal LLMs via Agentic Evaluation and Stability-Aware Ranking [0.5] 評価の不確実性の下では、チェックポイントの選択を堅牢な決定問題として定式化する。
実世界のキュレートされたデータ、構造化LCMに基づく判断、および多段階ランキングプロトコルを統合する多段階フレームワークを提案する。
我々は、データ品質、特にOCR可読性は、評価の妥当性の重要な決定要因であることを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:18:32 GMT)
Probing Quantum Information Scrambling via Local Randomized Measurements [0.5] 量子多体力学では、局所的に符号化された情報はシステム全体にわたってスクランブルし、局所的なプローブにはアクセスできない。
本研究では,局所ランダム化プローブを用いた量子スクランブルの情報力学について検討し,平均アクセス情報(AAI)を用いて定量化する。
AAIは、動的閉じ込めや弾道輸送から持続的傷跡回復、多体局所化まで幅広い現象を解消し、異種衝突行動を明らかにすることができることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:43:38 GMT)
Generative Modeling of Approximately Periodic Time Series by a Posterior-Weighted Gaussian Process [0.4] 本稿では,ほぼ周期的な時系列生成モデルを提案する。
本稿では,2段階構成による繰り返し間変動から繰り返し構造を分離する手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:17:00 GMT)
Towards the Next Frontier of LLMs, Training on Private Data: A Cross-Domain Benchmark for Federated Fine-Tuning [0.4] 世界で最も価値のある情報は、特に医療や金融などの高度に規制された分野において、プライベートである。
本稿では,大規模言語モデル(LLM)適応のための,プライベートおよび分散機関データのアンロックに関する実践的アプローチを示す。
当社のフレームワークは,Sherpa.aiフェデレーテッドラーニングプラットフォーム上に構築されており,プライベートデータを交換することなく,共有LLMを共同で微調整することができる。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:20:33 GMT)
A Constraint Programming Approach for $n$-Day Lookahead Playoff Clinching [0.4] 次回の$n$日のゲーム結果の組み合わせを決定するアルゴリズムを提案する。
我々は,2021-22シーズンから2024-25シーズンのNHLデータに基づいて,数百のシナリオを用いてアルゴリズムを検証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:09:58 GMT)
Uncertainty-Aware 3D Position Refinement for Multi-UAV Systems [0.4] 本稿では, 無人航空機の局部推定値を, 近隣の共有状態サマリーやUAV間距離, 近接制約と組み合わせることで, 頑健性を向上する分散軽量な3次元位置補正層を提案する。
提案手法は, 冷間開始時の平均局所化誤差を著しく低減し, 局所推定器が安定化した後も競争力を保ち, 信頼のない核融合と比較して悪質ノードの割合が増加するにつれて, 低い誤差を保ち続けることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:22:14 GMT)
RubricRefine: Improving Tool-Use Agent Reliability with Training-Free Pre-Execution Refinement [0.4] 反復自己複製は、推論時の信頼性技術として人気がある。
しかし、コードモードツールの使用効率はフィードバック信号の構造に大きく依存する。
本稿では,タスクやレジストリ固有のルーリックを生成する,トレーニング不要の事前実行信頼性レイヤを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:14:46 GMT)
MobileEgo Anywhere: Open Infrastructure for long horizon egocentric data on commodity hardware [0.4] MobileEgo Anywhereは、コモディティなモバイルハードウェアを使用した堅牢な時間とエゴセントリックなトラジェクトリの収集を容易にするために設計されたフレームワークである。
我々は,200時間にわたる多種多様・長文のエゴセントリックなデータと永続的な状態追跡からなる新しいデータセットを作成した。
我々は、生のモバイルキャプチャーを、ビジョン言語アクションモデルと基礎モデル研究のための、標準化されたトレーニング可能なフォーマットに変換するための包括的な処理パイプラインを提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:11:03 GMT)
An Agentic LLM-Based Framework for Population-Scale Mental Health Screening [0.4] 本稿では,ロバストなLLMパイプライン構築のためのエージェントフレームワークを提案する。
トランスクリプトベースの検出における概念実証は、フレームワークが安定した構成に収束することを証明している。
結果は、大規模な臨床データセット上で集団レベルのメンタルヘルススクリーニングを可能にするエージェントAIの可能性を強調している。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:08:43 GMT)
Vividh-ASR: A Complexity-Tiered Benchmark and Optimization Dynamics for Robust Indic Speech Recognition [0.3] 低リソース言語向けのWhisperのような微調整された多言語ASRモデルは、しばしば読み上げ音声を改善するが、自発的なオーディオ性能を低下させる。
Vividh-ASRは、スタジオ、放送、自然発生、複雑さ、合成ノイズの4段階にわたるヒンディー語とマラヤラム語のベンチマークである。
早期の大規模パラメータ更新は、グローバルWERを12の絶対点で改善し、一方、難易度カリキュラムは、自然発話のためのゲインを付加する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:55:55 GMT)
Interpretable EEG Microstate Discovery via Variational Deep Embedding: A Systematic Architecture Search with Multi-Quadrant Evaluation [0.3] EEGマイクロステート分析は、連続した脳の電気活動を、短い準安定な地形構成に分割する。
修正K平均のような従来のアプローチは、電極空間で直接に割り当てて動作する。
本稿では、地形復元と確率的ソフトクラスタリングを共同で学習する畳み込み変分深層埋め込み(Conv-VaDE)モデルを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:39:22 GMT)
Neurosymbolic Auditing of Natural-Language Software Requirements [0.3] 本稿では,このアイデアを医療デバイスソフトウェア要求に対して運用するニューロシンボリックパイプラインであるVERIMEDを提案する。
VERIMED における LLM に基づくアプローチは曖昧さに敏感な要求を低減できることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:43:13 GMT)
DP-KFC: Data-Free Preconditioning for Privacy-Preserving Deep Learning [0.3] 本稿では,フィッシャー情報行列をアーキテクチャ感度に分解し,合成ノイズと入力相関により復元可能であることを示す。
KFACプレコンディショナーを構成するDP-KFCを提案する。
実証的に、DP-KFCは強力なプライバシー体制において、DP-SGDと適応ベースラインを多種多様なモダリティで一貫して上回っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:14:00 GMT)
It's not the Language Model, it's the Tool: Deterministic Mediation for Scientific Workflows [0.3] 言語モデルは、説得力のある科学的分析を生成できるが、同じデータ上で繰り返される世代は、同じ結果を保証しない。
本稿では,モデルが解析コードを生成するのではなく,決定論的ツールを編成するパターンであるタイプドメディエーションを提案する。
約6ヶ月にわたってユーザに提供する2つの計器にこのパターンをデプロイします。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:30:56 GMT)
Reframing preprocessing selection as model-internal calibration in near-infrared spectroscopy: A large-scale benchmark of operator-adaptive PLS and Ridge models [0.3] 演算子適応キャリブレーションは、キャリブレーションモデル内で線形前処理の選択を移動させる。
PLSとリッジ回帰のためのフレームワークをインスタンス化する。
オペレータ適応キャリブレーションは、より速く、より堅牢で、監査可能なNIRSメソッド開発への実践的なルートを提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:23:00 GMT)
Multi-Agent Systems in Emergency Departments: Validation Study on a ED Digital Twin [0.3] 現実的で柔軟なモデルで最適化戦略を検討することを提案する。
実際の研究から, EDサイズ, 患者負荷, スタッフの配置を導出する。
次に、主要なパフォーマンス指標とメトリクスを文献から知られている値とマッチングすることで、モデル表現性を検証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:04:23 GMT)
SceneGraphVLM: Dynamic Scene Graph Generation from Video with Vision-Language Models [0.3] SceneGraphVLMは、小さな視覚言語モデルを用いた画像および映像シーングラフ生成のためのコンパクトな方法である。
SceneGraphVLMはトークン効率のTOONフォーマットでグラフをシリアライズし、2段階でモデルをトレーニングする。
SceneGraphVLM on PSG, PVSG, Action Genome。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:27:41 GMT)
CLOUDBURST: Cloud-Layer Observations Using Beacons for Unified Real-time Surveillance and Threat Attribution [0.3] 現代のクラウドネイティブ環境は、従来のファイルベースのシナリオと根本的に異なるエクスプロイト脅威面を提供する。
textbfCLOUDBURSTは、クラウドネイティブな受動的ビーコンの分類と測定のための最初の公式なフレームワークである。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:14:21 GMT)
(How) Do Large Language Models Understand High-Level Message Sequence Charts? [0.2] 大規模言語モデル(LLM)は、ソフトウェア開発ライフサイクル全体にわたってタスクを自動化するために広く使われています。
しかしながら、これらのタスクが処理対象のアーティファクトのセマンティクスに関して一貫して実行されるかどうかは不明である。
LLMがHMSCのセマンティクスを「理解」するかどうかを3つのLLMを用いて検討し、19のセマンティクスタスクの実行方法について検討した。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:50:51 GMT)
Unsteady Metrics and Benchmarking Cultures of AI Model Builders [0.2] Benchmarking-Cultures-25は、主要なAIビルダ11から、2025年に139のモデルリリースで強調された231ベンチマークのデータセットである。
我々は,筆者らが測定している指標に基づいて,測定信号の共有フレームワークに統一された分類学マッピング用語を開発した。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:39:10 GMT)
Fermi Surface Geometry from Charge Fluctuations in Three-Dimensional Metals [0.2] フェルミ面の形状と量子幾何学に関する重要な情報は、二分電荷ゆらぎの下位対数項に符号化されていることを示す。
この対数項は運動量空間の構造係数の無次元$|mathbfq|3$-係数に関連している。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:00:00 GMT)
Feature Visualization Recovers Known Cortical Selectivity from TRIBE v2 [0.2] 脳エンコーダモデルは、事前訓練された視覚と言語ネットワークの内部活性化から皮質fMRI応答を予測する。
本稿では,補完的解釈可能性手法として特徴可視化を提案する。
プローブは単純で微分可能で、任意の脳エンコーダに異なるバックボーンを持つ。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:55:45 GMT)
Reducing cross-sample prediction churn in scientific machine learning [0.2] クロスサンプル予測は、科学的-MLベンチマークレポートでは、パラメータ側とデータ側メソッドが実際に異なるメトリックで区別できないため、予測性能と並行してカラムに値する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:50:57 GMT)
When Absolute State Fails: Evaluating Proprioceptive Encodings for Robust Manipulation [0.1] 本研究は,ロボットの自己受容状態を符号化し,テスト時の配当性能と配当性能を両立させる手法について検討する。
単純なエピソード単位の相対的フレームは,タスク性能とロバストさのトレードオフとして最適であることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:41:56 GMT)
Adaptive mine planning under geological uncertainty: A POMDP framework for sequential decision-making [0.1] 部分観測可能なマルコフ決定過程(POMDP)としての地雷スケジューリングの定式化
擬似アニーリング(SA)値近似とアンサンブルに基づく信念更新を組み合わせたハイブリッドSA-POMDPアーキテクチャを提案する。
複数の処理先を持つ銅めっきオープンピットマイニング施設におけるフレームワークの評価を行った。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:52:29 GMT)
A Multi-Probe Audit of Clinical-Interview Depression Detection Benchmarks [0.1] 本稿では,4つの相補的プローブを用いた臨床・臨床・臨床・臨床のうつ病検出におけるベンチマーク評価を行った。
E-DAICを厳密な主観的分離型離脱1-サブジェクトアウト・クロスバリデーションの下で再評価する。
E-DAICのオフィシャルスプリットが96モデル構成を網羅することで、詳細なリーダーボードランキングをサポートするかどうかを検証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:32:41 GMT)
3C: Competition, Competence, and Collaboration for Women in Computing [0.1] この拡張抽象化は、3Cフレームワークのコンペティション、コンペティション、コンピテンス、コラボレーションを導入している。
我々は,能力の認知,協力的ネットワークへのアクセス,限られた機会の競争が女性の参加と帰属意識をいかに形作るかについて議論する。
私たちのゴールは、コンピューティングにおける女性間のメンターシップ、連帯、コラボレーションのより強力なネットワークを促進することです。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:34:23 GMT)
Continual Learning with Multilingual Foundation Model [0.1] このフレームワークは、データ不足、クラス不均衡、感情表現の言語間変異といった、相互に絡み合った3つの方法論的課題を処理する。
クロスバリデーションによるデータ駆動モデル選択、バックトランスレーションによるセマンティック保存強化、動的エポックレベルのアンダーサンプリングによるインダクティブトランスファー学習、ドメイン固有の知識注入を統合する。
RUN 1 は拡張とアンダーサンプリングによる帰納的伝達学習であり、RUN 2 はマスク付き言語モデリング事前学習、RUN 3 と RUN 4 は ROC 分析によって最適化された言語固有の決定しきい値によって改善された以前の予測である。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:10:47 GMT)
Identification of Non-Transversal Bifurcations of Linkages [0.1] 局所解析は、リンケージの特異点とモビリティの研究に確立されたアプローチである。
このような解析の鍵となる結果は、構成による有限運動の局所像である。
しかし、すぐには交差しない運動枝を区別することはできない。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:05:41 GMT)
An LLM-Based System for Argument Reconstruction [0.0] 本稿では,自然言語テキストから抽象的引数グラフへ引数を再構成する,エンドツーエンドの大規模言語モデル(LLM)を提案する。
このシステムは、議論的コンポーネントを段階的に識別し、関連する要素を選択し、それらの論理的関係を明らかにする多段階パイプラインに従う。
その結果,提案システムは議論構造を適切に復元することができ,異なるアノテーションスキームに適応すると,ベンチマークデータセット間で適切な性能が得られることがわかった。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:13:45 GMT)
Collider-Bench: Benchmarking AI Agents with Particle Physics Analysis Reproduction [0.0] 我々は,LHC(Large Hadron Collider)から,公開論文とオープンサイエンスソフトウェアのみを用いて,言語モデルエージェントが実験分析を再現できるかどうかを評価するベンチマークであるCollind-Benchを紹介する。
したがってエージェントは、これらのギャップを埋めるために、物理的推論、ドメイン知識、試行錯誤に頼らなければならない。
以上の結果から, 平均的なエージェントが, ループ内解法を確実に打ち負かすことは不可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:00:00 GMT)
q-Askey Deformations of Double-Scaled SYK [0.0] 二重スケールSYK(DSSYK)モデルの変形の家系について検討した。
変形パラメータの1つを増やすことで、モデルが最終的に離散的なエネルギーレベルを示す。
我々は、その結果と、バルクにおける赤ちゃんの宇宙の出現との関係について論じる。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:00:01 GMT)
XAI and Statistical Analysis for Reliable Intrusion Detection in the UAVIDS-2025 Dataset: From Tree to Hybrid and Tabular DNN Ensembles [0.0] 我々は,UAVの侵入を検出するために,木組,深層ニューラルネットワーク,ハイブリッド積み重ねモデル,最新のアンサンブルニューラルネットワークについて検討する。
当社のトップパフォーマンスモデルであるXGBoostでは、グローバルおよびローカルな機能の重要性を分析し、通常のトラフィックを模倣するために、どの機能、各攻撃対象かを理解する。
UAVIDS-2025におけるワームホール攻撃とブラックホール攻撃で観測された誤予測の真の原因を発見した。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:08:36 GMT)
When Do LLMs Generate Realistic Social Networks? A Multi-Dimensional Study of Culture, Language, Scale, and Method [0.0] 大規模言語モデル(LLM)は、行動シミュレーションにおいて、人間の被験者の代用としてますます用いられる。
逐次的, グローバル, 局所的, 反復的な4つのLCMベースのタイフォーミング機構を定式化する。
政治的アフィリエイトは3つの方法による結びつきの形成を支配し、グローバルな手法は年齢を代用し、建築が実質的な社会学的変数として機能することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:22:19 GMT)
VectraYX-Nano: A 42M-Parameter Spanish Cybersecurity Language Model with Curriculum Learning and Native Tool Use [0.0] VectraYX-Nanoは、41.95Mパラメータのデコーダのみの言語モデルである。
我々は,会話型(42Mトークン,OpenSubtitles-ES,OASST1),サイバーセキュリティ(118Mトークン,Wikipedia-ES,CVEミラー,セキュリティブログ),攻撃型セキュリティツール(10Mトークン,ExploitDB,HackTricksなど)に分割した170万個のスペイン語コーパスを提示する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:03:07 GMT)
VectorSmuggle: Steganographic Exfiltration in Embedding Stores and a Cryptographic Provenance Defense [0.0] 現代の検索拡張生成システム(RAG)は、センシティブなコンテンツを高次元の埋め込みに変換し、それらをベクトルデータベースに格納し、結果の数値的アーティファクトを不透明なものとして扱う。
これはステガノグラフィー・エクスプロイト・アタックのクラスを開放することを示している。
入力パイプラインへの書き込みアクセスを持つアタッカーは、埋め込み内にペイロードデータを隠蔽することができる。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:44:20 GMT)
Vector-Quantized Discrete Latent Factors Meet Financial Priors: Dynamic Cross-Sectional Stock Ranking Prediction for Portfolio Construction [0.0] PRISM-VQ (PRior-Informed Stock Model with Vector Quantization) は、専門家の事前因子、断面構造から学習されたベクトル量子化潜在因子、および時間変化の要因負荷を生成する構造条件付き混合要素を統合する動的因子フレームワークである。
CSI 300とS&P 500の実験では、解釈可能性を維持しながら、強いベースラインよりも断続的なリターン予測とポートフォリオパフォーマンスが一貫して改善されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:02:53 GMT)
VERA-MH: Validation of Ethical and Responsible AI in Mental Health [0.0] 精神保健支援の文脈において,チャットボットの安全性に関する臨床的に検証された新しい評価であるVERA-MHを紹介する。
VERA-MHは会話シミュレーション、会話判定、モデル評価の3つのステップから構成される。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:31:48 GMT)
V4FinBench: Benchmarking Tabular Foundation Models, LLMs, and Standard Methods on Corporate Bankruptcy Prediction [0.0] V4FinBenchは、Visegrd Group(V4)エコノミー(2006-2021)の100万以上の企業年次記録のベンチマークである。
V4FinBenchは、現実的なクラス不均衡の下でのメソッドの評価をサポートするように設計されており、正の率は0.19%から0.36%である。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:13:40 GMT)
Universal Spin Squeezing Dynamical Phase Transitions across Lattice Geometries, Dimensions, and Microscopic Couplings [0.0] ボゴリューボフ理論は、長い範囲の相互作用状態において、以前に特定されたスケーリング $a_Z* プロット L$ を d+2$ で回復する。
これは、短距離相互作用に対する未認識のサブ線形構造を明らかにする。
これらの知見は、Rydberg-array、極性分子、トラップイオンプラットフォームにおける絡み合いの発生を制御するための多用途経路を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:00:07 GMT)
Uniform microwave field formation for control of ensembles of negatively charged nitrogen vacancy in diamond [0.0] マイクロ波磁場の均一性は 大量のアンサンブルスピンを制御するのに 不可欠です
いくつかの磁場形成系が提案されているが、詳細な比較はなされていない。
本研究では, 平面アンテナ, 誘電体共振器, 円筒形インダクタ, 樽状コイル, ネスト状のコイルを含む5種類のシステムの均一性を数値解析した。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:46:41 GMT)
Twincher: Bijective Representation Learning for Robust Inversion of Continuous Systems [0.0] AIの最近の進歩は、関数近似で優れている大規模なニューラルネットワークによって推進されている。
本研究では,連続進行過程の堅牢な逆転を可能にする可能性を検討する。
我々は、構造化された微分同相変換のスタックと調整された対角訓練戦略に基づくアーキテクチャのクラスであるツインチャーを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:57:17 GMT)
Transitions as the Native Objects of Dispersive Light-Matter Dynamics [0.0] 状態ではなく光物質遷移が主要な動的対象となる枠組みを導入する。
このアプローチは分散状態における効果的な高階ハミルトンの透過的な導出を可能にする。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:27:43 GMT)
Trajectory-Level Data Augmentation for Offline Reinforcement Learning [0.0] 本稿では,タスク構造と報酬,値関数,ロギングポリシの数学的特性の幾何学的関係を活かしたトラジェクトリベースの拡張手法を提案する。
データ収集中、当社の強化は、最適下層ロギングポリシーをサポートし、データ品質の向上とオフライン強化学習性能の向上につながります。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:57:17 GMT)
Three ways to find comfort with the Bell proof and the results of the Bell experiments [0.0] ベルの定理は、ベルの実験に関する記述は、反事実的定性という意味では、同時に局所的で現実的なものではないことを述べる。
最新の実験により、CHSHの不平等が予測されたことが確認された。
3人はいずれも、設定された選択と国家の統計的独立の反実的確定性と陰謀的違反の両方を拒否している。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:19:46 GMT)
The Growing Pains of Frontier Models: When Leaderboards Stop Separating and What to Measure Next [0.0] リーダーボードは独立した軸上でフロンティアモデルをランク付けするが、機能強化やリリース間のトレードオフは明らかにしない。
我々はSWEベンチとGPQAダイアモンドスコアを集団結合傾向とリリース毎残差に分解する。
我々は,3段階のプレイブック(位置,診断,回転),ラベルごとの測定・優先度表,そして7つの偽造予測を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:19:38 GMT)
The Geno-Synthetic Algorithm: Type-Factored Coevolutionary Optimization for Heterogeneous Genotypes and Assembled Phenotypes [0.0] 遺伝子合成アルゴリズム(英: Geno-Synthetic Algorithm、GSA)は、遺伝子ファミリーが表現型によって分割される、型決定された共進化の枠組みである。
GSAは、明示的なアセンブリ演算子を持つ型付き製品空間探索手順として形式化されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:25:24 GMT)
The Evaluation Trap: Benchmark Design as Theoretical Commitment [0.0] 本稿では,技術能力主張から直接評価基準を導出する手法であるエピステマティクスを紹介する。
我々は,建築レベルでの支配的パラダイムの理論的仮定を改訂する提案であるDupoux et al. (2026)の実施監査を通じて,この手順を実証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:41:29 GMT)
The Diffusion Encoder [0.0] 従来の変分オートエンコーダでは、エンコーダとデコーダが共同で入力の潜在表現を交渉する。
このエンコーダを拡散モデルに置き換えるには、デコーダの圧力をエンコーダに戻す方法を再考する必要がある。
予測最大化アルゴリズムにインスパイアされた交互学習方式でこの問題を解決する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:54:43 GMT)
TRUST-TAEA: A trustworthiness-guided two-archive evolutionary algorithm with variable-grouping sparse search for large-scale multi-objective optimization [0.0] 2階層の進化的アルゴリズムは収束と多様性の衝突を軽減することができるが、アーカイブの信頼性や問題構造に関する情報を過小評価することが多い。
本稿では,信頼度誘導型2階層進化アルゴリズムであるTRUST-TAEAを提案する。
実験の結果,TRUST-TAEAは収束,多様性,安定性において,優れた,あるいは高い競争力を発揮することが示された。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:36:02 GMT)
TRIAGE: Evaluating Prospective Metacognitive Control in LLMs under Resource Constraints [0.0] メタ認知制御のための言語モデルをテストするためのフレームワークであるTRIAGEを紹介する。
現状の言語モデルでは, メタ認知制御にかなりのギャップがあることが判明した。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:10:05 GMT)
Sustaining AI safety: Control-theoretic external impossibility, intrinsic necessity, and structural requirements [0.0] 本稿では、制御理論を用いて、外部に強制された安全維持戦略が成功するかどうかを構造レベルで明らかにする。
明確な条件付きの結果を導出し、どの安全維持戦略が除外され、残りの戦略が満足しなければならないかを識別する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:56:04 GMT)
Support-Conditioned Flow Matching Is Kernel Smoothing [0.0] 有限支持集合によって誘導される正確な速度場はナダラヤ-ワトソン核スムーズであることを示す。
クロスアテンション条件を古典的カーネル理論に結びつける。
ガウス混合体、球状殻、DINOv2 ImageNet の機能の実験により、学習条件がこれらの状態において正確に改善されることが確認された。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:44:14 GMT)
Spatiotemporal downscaling and nowcasting of urban land surface temperatures with deep neural networks [0.0] 土地表面温度(LST)は、都市気候や生態学研究など、様々な用途において重要な変数である。
我々は、静止衛星と極軌道衛星の観測を組み合わせ、高空間分解能と高時間分解能のLST場を提供する。
本稿では,15分から75分以内の予測リード時間で,低スケールのLSTフィールドをトレーニングしたConv-LSTMアーキテクチャに基づくLST nowcastingモデルを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:05:24 GMT)
Sleeper Channels and Provenance Gates: Persistent Prompt Injection in Always-on Autonomous AI Agents [0.0] 常にオンのAIエージェントは、所有者のアイデンティティの下で単一の永続的なプロセスとして実行される。
紛らわしいクロン攻撃をOpenClawをピン留めされたコミットで行き来します。
コンパニオンアーティファクトは、ゲート、ベンダーソース上の静的監査、および10つの仲介フックのうち5つを実現するランタイムアダプタを出荷する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:57:31 GMT)
Simulation of vibrational dynamics using qubits and qudits [0.0] 振動ハミルトニアンをqubit型とqudit型に2種類のqubitエンコーディング(バイナリとダイレクト)とquditエンコーディングで構成する。
我々は、quditエンコーディングがCO$とH$Oの双方に対して最も正確な結果をもたらすことを発見した。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:22:22 GMT)
SieveFL: Hierarchical Runtime-Aware Pruning for Scalable LLM-Based Fault Localization [0.0] 自動障害ローカライゼーションは、観測されたテスト失敗を数千の候補にわたる責任あるメソッドに接続する必要がある。
攻撃的なLLM前フィルタリングによってこの緊張を解消する5段階階層型フレームワークであるSieveFLを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:16:41 GMT)
Sheaf-Theoretic Transport and Obstruction for Detecting Scientific Theory Shift in AI Agents [0.0] 本稿では,輸送と障害物による理論シフト候補検出のための有限層理論フレームワークを開発する。
我々は,その言語の拡張からソース言語の変形を分離するために設計された制御されたトランジションカードベンチマーク上で,このフレームワークを評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:46:17 GMT)
Safe Continual Reinforcement Learning under Nonstationarity via Adaptive Safety Constraints [0.0] LILAC+は、非定常下での安全な継続的強化学習のためのフレームワークである。
これは、コンテキストベースの安全制約、適応速度制約、州間安全執行の3つの適応安全メカニズムを組み合わせたものである。
静止状態,非定常状態,非定常状態のシミュレーション運転環境におけるフレームワークの評価を行った。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:10:10 GMT)
Robust and Explainable Bicuspid Aortic Valve Diagnosis Using Stacked Ensembles on Echocardiography [0.0] We developed a explainable AI model that distinguishs bicuspid aortic valve (BAV) from tricuspid aortic valve (TAV)。
マルチバックボーンビデオアンサンブルをトレーニングし, 漏洩認識, 階層化された外部クロスバリデーションプロトコルを用いて評価した。
Grad-CAMは大動脈根と葉っぱ面に有意なエビデンスを局在させ, SHAP値を大域的に集計し, 各ビデオバックボーンの重み付き予測への寄与を定量化した。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:10:39 GMT)
Regret Equals Covariance: A Closed-Form Characterization for Stochastic Optimization [0.0] 後悔の定量化はアルゴリズムによる意思決定の不確実性のコストである。
本稿では,任意の最適化問題における期待された後悔が,正確な分解を許容することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:32:44 GMT)
Reducing Hallucination in Vision-Language Models via Stage-wise Preference Optimization under Distribution Shift [0.0] 幻覚は視覚言語モデル(VLM)における根本的な課題である。
目的とするマルチモーダル構成による幻覚低減のためのステージワイドな選好最適化フレームワークを提案する。
オープンソースのベンチマークと実世界のマルチモーダル評価シナリオの実験では、接地一貫性の改善、幻覚の低減、より情報的な接地応答が示されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:37:51 GMT)
Real-time Krylov Diagonalisation for Open Quantum Systems [0.0] 実時間量子Krylov部分空間法がオープン量子系にどのように適応できるかを示す。
これらの手法を2光子駆動の超伝導共振器に適用し、カーキャット量子ビット系におけるリウヴィリアギャップの推定に利用したことを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:22:26 GMT)
RTLC -- Research, Teach-to-Learn, Critique: A three-stage prompting paradigm inspired by the Feynman Learning Technique that lifts LLM-as-judge accuracy on JudgeBench with no fine-tuning [0.0] RTLC は単一のブラックボックス LLM を微調整、検索、外部ツールのないアンサンブル・オブ・シント・ジャッジにプロモートする。
RTLCがN=10の得票率(77.7%)とゼロショット第1候補(74.0%)を破る
RTLCは、ポストホックの判定スコアの校正で構成され、2つの介入が実際に乗法的に合成される。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:48:16 GMT)
RISED: A Pre-Deployment Safety Evaluation Framework for Clinical AI Decision-Support Systems [0.0] 本稿では,信頼性,指数性,感度,等価性,展開性に関する5次元事前デプロイ評価を提案する。
RISEDはオープンソースのPythonパッケージとしてリリースされ、既存の臨床AIレポート標準の量的検証を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 02:17:13 GMT)
Quasilinear evolution versus von Neumann selective measurement [0.0] 我々は、フォン・ノイマン射影仮定を準線形進化に置き換えた新しい量子選択的測定法を導入する。
この方程式は量子アンサンブルの等価性を保ち、符号なし原理を満たすことを実証する。
2レベル量子系における選択的測定のための進化方程式の数値解をいくつか提示する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:36:41 GMT)
Quantum selective measurement as a quasilinear evolution [0.0] 我々は、フォン・ノイマン選択的測定における瞬時状態低減を連続的非線形進化に置き換えることを提案する。
非線形性にもかかわらず、この進化は量子アンサンブルの等価性を保ち、したがって符号なし原理に従う。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:15:41 GMT)
Quantum resolution of the Schwarzschild singularity [0.0] 量子修飾運動はシュワルツシルトに関する有効計量における測地運動と等価であることを示す。
これは、固定された古典的背景上の量子力学が、量子重力の完全な理論なしでシュワルツシルト特異点を正則化することができることを示唆している。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:27:39 GMT)
Quantum dynamics of two $XX$ interacting PT-symmetric non-Hermitian qubits: enhancement of quantum annealing [0.0] 相互作用するパリティ時間(PT)対称非エルミート量子ビットのネットワークに基づく量子情報アーキテクチャを提案する。
我々は対称性保存状態と対称性破壊状態の両方を分析し、さらに小さなPT対称な非エルミート項を量子ビットに加えることで基底状態に到達する確率を大幅に高めることを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:02:12 GMT)
Quantized Transport in Floquet Topological Insulators [0.0] 静的フェルミオン貯留層に結合した周期駆動型(フロケ)トポロジカルシステムにおける量子輸送について検討した。
二つの終端(縦方向)のコンダクタンスを$|W_varepsilon|,e2/h$、ホール(横方向)のコンダクタンスを$W_varepsilon,e2/h$とする。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:39:56 GMT)
Quantifying the Hadamard Resilience Law: Discovery of the Coherence Gap in NISQ-Era Classifiers [0.0] NISQ時代の分類器におけるノイズモデルとアルゴリズム性能の根本的な相違について報告する。
我々は、アダマールテストパーセプトロンが93.9%のMNISTの精度を維持しており、提案したアダマールレジリエンス法を検証していることを示した。
我々は、このコヒーレンスによって引き起こされる信号減衰を考慮し、現在のNISQデバイス上でのロバストな量子線型層の予測境界を確立する、洗練されたハードウェア・アウェア・モデルを提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:14:56 GMT)
Quantifying LLM Safety Degradation Under Repeated Attacks Using Survival Analysis [0.0] 大規模言語モデル(LLM)は、広範囲のアプリケーションにデプロイされる傾向にあるが、敵のジェイルブレイク攻撃には弱いままである。
本研究は, LLM脱獄の脆弱性を特徴付けるために生存分析技術を適用した新しい評価フレームワークを提案する。
提案手法は, リスク関数, 生存曲線, 攻撃の危険因子を推定し, 生存率としてジェイルブレイクをモデル化する。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:26:06 GMT)
QOuLiPo: What a quantum computer sees when it reads a book [0.0] この論文はルネサンスの古典的な8つの作品を取り、それぞれが中性原子量子プロセッサを介して実行される。
ブリッジはグラフであり、各テキスト単位が原子となり、グラフエッジは物理的なブロック制約である。
私たちはPasqalのFRESNELプロセッサ上で、100個の原子まで自然なテキストとエンジニアリングされたテキストを実行します。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:10:15 GMT)
QCIVET: A Quantum--Classical Pipeline Integrity Framework with Contract-Based Subtype Verification and Hash-Chained Audit Traces [0.0] 本稿では,契約に基づく量子パイプラインの完全性検証フレームワークであるQCIVETを提案する。
我々は、量子チャネル間のダイヤモンド-ノーム距離における音性、情報的に完備な観測可能な族に対する条件完全性、継承連鎖における構成性を証明する。
QCIVETは、薬物発見のための変量量子固有解法(VQE)、量子支援詐欺検出、クラウドQPUサービスの顧客側監査の3つの代表的なアプリケーションでインスタンス化されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:19:44 GMT)
Proof-Carrying Certificates for LLM Pipelines: A Trust-Boundary Architecture [0.0] 本稿では,大規模言語モデルを取り巻く決定論的構造化計算を検証するためのフレームワークを提案する。
リーン4の信頼境界アーキテクチャを,現代的なLLMパイプラインの汎用インターフェースに拡張しています。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:01:41 GMT)
Product-Aware Deep Autoencoders for Robust Process Monitoring in Multi-Product Cyber-Physical Systems [0.0] 現在のデータ駆動型アプローチでは、通常、すべての通常の運用データの集約に基づいて訓練された"製品に依存しない"あるいはグローバルモデルを採用する。
本稿では、学習領域をグレード固有の分布に制限する原則的緩和として、製品対応オートエンコーダを提案する。
実証実験の結果,Product-Awareフレームワークは,標準検出基準のグローバルベースラインと相容れない性能を示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:24:32 GMT)
Procedural-skill SFT across capacity tiers: A W-Shaped pre-SFT Trajectory and Regime-Asymmetric Mechanism on 0.8B-4B Qwen3.5 Models [0.0] 我々は3つのQwen3.5高密度スケールにおける手続きスキルSFTの寄与を測定した。
SFT対応のプロシージャ$$リフトは、大まかに一様である。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:47:52 GMT)
Probing Floquet topological phases via non-Hermitian skin effect of reflected waves [0.0] フラケットチャーン絶縁体の散乱問題について検討し,反射波の非エルミート皮膚効果(NHSE)を明らかにする。
我々の研究は、駆動系における反射波の周波数依存性のNHSEを強調し、非平衡トポロジーを同定するための実空間散乱手法を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:03:27 GMT)
Pretraining Language Models with Subword Regularization: An Empirical Study of BPE Dropout in Low-Resource NLP [0.0] BPEドロップアウトのようなサブワード正規化手法は微調整時にのみ適用され、プリトレーニングは通常決定論的トークン化によって行われる。
これにより、事前学習と微調整の間の潜在的なセグメンテーションミスマッチが生成される。
XNLI, PAWS-X, PAN-X, MasakhaNER 2.0で, 英語, ドイツ語, フランス語, スペイン語, Kiswahili, およびisiXhosaで単言語およびバイリンガルBERTモデルを訓練し, 評価を行った。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:31:04 GMT)
Predictive Maps of Multi-Agent Reasoning: A Successor-Representation Spectrum for LLM Communication Topologies [0.0] 既存の評価は、これらの質問に答えるのは、ポストホックと測定されたタスクのみである。
本稿では,M = (I - P)-1$の行確率的通信演算子の後継表現に基づくマルチエージェントLLM通信グラフの構造診断を提案する。
鎖,星,メッシュの閉形スペクトルを行確率正規化法で導出し,12ステップ構成された状態追跡タスクの予測を検証した。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:36:14 GMT)
Physics-Guided Concentration Inference from Resistance Transients in a Mixed-Phase SnO-SnO$_2$ Carbon Monoxide Sensor with p-n Switching [0.0] 本研究では, 一酸化炭素濃度推定のための物理誘導型機械学習フレームワークを提案する。
サイクルレベルの過渡応答は物理的に解釈可能な記述子を通して表現される。
特にp型センシングは分類に好適であるのに対し,n型センシングは高忠実度回帰に好適であることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:37:32 GMT)
Phase Matching for a Generalized Grover's Algorithm [0.0] 完全に一般化されたGroverのアルゴリズムを用いて、反復の各ステップに最適な位相変化を求める。
最終イテレーションにおいて、最適位相変化は従来のGroverのアルゴリズムと異なり、位相マッチングを観測しないことを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:39:34 GMT)
Persona-Model Collapse in Emergent Misalignment [0.0] 有害な内容を持つ狭いデータに対する微調整された大きな言語モデルは、無関係なプロンプトに対して広範囲に不整合な振る舞いをもたらす。
モラル・サセプティビリティ(S)とモラル・ロバストネス(R)の2つの指標を用いてこの仮説を検証する。
これらのメトリクスは、与えられた文字(S)と、与えられた文字(R)をシミュレートするときにその一貫性を識別するモデルの能力を形式化する。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:48:57 GMT)
PaMM: Periodic Motif Memory for Atomistic Models with an Explicit Local-Structure Interface [0.0] 本稿では,UMA eSCN-MDエッジエンコーダを明示的なペアとトリプルトルックアップ機能で拡張する周期的モチーフメモリPaMMを紹介する。
一致したUMA-S OMAT設定でPaMMを評価し、明確なモチーフメモリが一定の中間トレーニング予算で役立つかどうかという狭い問題に焦点をあてる。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:11:27 GMT)
Optimal Quantum Illumination with Nonlocal Non-Gaussian Operations [0.0] 本研究では,特定の非局所的な非ガウス演算プロトコルについて検討する。
このプロトコルを用いた工学的状態は、従来は非ガウス的であると考えられていたシナリオよりも優れていたことを示す。
提案プロトコルは,資源効率の向上と量子照度向上のための実験的に実現可能なプローブの実現により,性能の向上を図っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:30:19 GMT)
Operator ordering as an emergent geometric background in Dirac systems with spatially varying mass [0.0] 本研究では,空間的に変化する質量を持つディラック・ハミルトン群の一意に決定されたエルミート順序のスペクトル結果について検討した。
この寄与は、有効運動量演算子を変更し、スペクトル量子化条件の普遍的な変形を誘導することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:59:17 GMT)
Occlusion-Based Object Transportation Around Obstacles With a Swarm of Miniature Robots [0.0] Swarm Roboticssは分散化された自己組織化システムを利用して複雑な集団行動を形成する。
これまでの研究では、単純なオクルージョンに基づく戦略は、目標位置にオブジェクトを移動させるタスクにSwarm Roboticsを使用するのに有効であることが示されている。
我々は、この戦略を拡張し、ロボットがサブゴールを形成できるようにし、Swarmのメンバーが目標のより広い範囲の可視性を確立することを可能にする。
論文参考訳(メタデータ) (Wed, 13 May 2026 05:00:07 GMT)
OAM-Induced Lattice Rotation Reveals a Fractional Optimum in Fault-Tolerant GKP Quantum Sensing [0.0] 軌道角モメンタム符号化とGottesman-Kitaev-Preskill(GKP)格子幾何学が構造的に結合していることを確立する。
終端から終端までの微分可能なStrawberry Fields--TensorFlow回路を用いて、$ell$、格子アスペクト比$r$、および有限エネルギーエンベロープ$$を共に最適化し、量子フィッシャー情報を最大化する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:49:16 GMT)
Numerical security analysis for practical quantum key distribution [0.0] 量子鍵分布(QKD)は、量子力学と理想化されたデバイスモデルに基づく情報理論のセキュリティを約束する。
一般的なコヒーレント攻撃に対して有効な汎用数値有限鍵セキュリティフレームワークを提案する。
我々は,レーザ源を用いた現実的なデコイ状態QKD実装の安全性を証明することで,我々のフレームワークのパワーを実証する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:27:03 GMT)
Nonsmooth Set-Gradient Ascent to the Pareto Front via Layered Hypervolume and Magnitude Indicators [0.0] 有限近似集合をパレート前面へ移動させる非滑らかな集合勾配法を開発した。
2つのベースインジケータが扱われる: 超体積インジケータと、支配集合の大きさインジケータである。
有限$サロゲートに対して、主非滑らか性機構は孤立し、有界集合上の室内的リプシッツ連続性が証明される。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:55:22 GMT)
Neural Surrogate Forward Modelling For Electrocardiology Without Explicit Intracellular Conductivity Tensor [0.0] 本研究は,左心房細胞内電位から遠野心電図への直接マッピングを推論時に明示的な細胞内伝導性入力を必要とせずに学習する深層学習手法を提案する。
訓練対象は74名に過ぎなかったが、このモデルは0.949 pm 0.037のR2を達成し、構造的不確実性を低減し、非侵襲的なAF評価を改善する可能性を強調した。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:26:28 GMT)
NIMO Controller: a self-driving laboratory orchestrator based on the Model Context Protocol [0.0] 科学的な発見を加速する手段として、自動運転車研究所(SDL)が注目を集めている。
アクセシビリティを改善するため、SDLコンポーネントをコーディネートするオーケストレーションソフトウェアフレームワークが提案されている。
本稿では,モデルコンテキストプロトコル(MCP)に基づくSDLソフトウェアアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:25:45 GMT)
Multitask Multimodal Fusion with Tabular Foundation Models for Peak and Durability Prediction of Pertussis Booster Response [0.0] Pertussis booster vaccination(英語版)は、ピーク等級と長期の耐久性の両方において、個体間で広く異なる免疫反応を産生する。
ほとんどの計算モデルは1つしか目標とせず、完全なブースト・アンド・ワン軌道を欠いている。
2つのエンドポイントは冗長ではなく生物学的に分離されているため、両方を共同で予測することは自明ではない。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:00:50 GMT)
Multimodal Hidden Markov Models for Persistent Emotional State Tracking [0.0] 全体として処理された個々の発話の感情を通じて会話の解釈可能な感情的弧を追跡することは、コミュニケーションの理解と指導の両方の中心である。
本稿では、会話感情を潜在感情状態の列としてモデル化する軽量な枠組みを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 00:16:05 GMT)
MoCCA: A Movable Circle Probability of Collision Approximation [0.0] 自動走行では、乗客の安全を確保するために事故の軽減が不可欠である。
本稿では,各車両の相対距離を最小化する形状近似アルゴリズムであるMoCCAを提案する。
MoCCAは、標準の単一循環技術に匹敵する計算効率を維持しながら、過保守性を低減している。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:52:32 GMT)
Mini-JEPA Foundation Model Fleet Enables Agentic Hydrologic Intelligence [0.0] 単一の惑星スケールモデル、例えばGoogle AlphaEarthは、幅広い特徴をうまく扱えるが、専門的な水理信号に妥協する可能性がある。
小型センサ専門のJEPA(Joint Embedding Predictive Architecture)ファウンデーションモデルであるMini-JEPAを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 21:11:14 GMT)
Microscopic Origins of Collapse Models: Decoherence from Graviton Bremsstrahlung [0.0] いくつかの崩壊モデルでは、重力効果が質量分布の重畳の不安定性を引き起こし、波動関数が崩壊することを提案した。
グラビトン放出下での空間重ね合わせにおけるフェルミオンの挙動を解析した。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:41:18 GMT)
Measuring and Mitigating Toxicity in Large Language Models: A Comprehensive Replication Study [0.0] 大規模言語モデル(LLM)は、Webスケールコーパスでトレーニングする場合、本質的にトレーニングデータから有害なパターンを吸収する。
この現象は現実世界の展開に重大なリスクをもたらす。
モデル再学習を必要とせずに生成を行う推論時間緩和手法であるtextbfDExperts (Decoding-time Experts) の有効性を評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:12:30 GMT)
Measurement-based quantum state transfer and restoring via spin-1/2 chain interacting with environment [0.0] 我々は、双極子-双極子相互作用を伴うスピン鎖に沿った多重量子固定励起状態転移を考察する。
状態伝達アルゴリズムは、クラウス演算子による状態復元とアンシラ測定を含む。
任意の多ビット一励起状態転移の例が存在し、クラウス作用素の摂動に対する頑健性について研究する。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:16:58 GMT)
MQTT Across a Raspberry Pi 5 IoT Network Utilizing Quantum-resistant Signature Algorithms [0.0] IoT(Internet of Things)インフラストラクチャは、ポスト量子暗号(PQC)メソッドを評価し、採用する必要がある。
本稿では,3つのRaspberry Piを用いたIoTネットワークにおけるPQCアルゴリズムの実装について検討する。
NISTが選択した量子後シグネチャアルゴリズムの1つであるFALCONデジタルシグネチャスキームを統合し、リソース制約のあるクライアントやブローカー間の信頼性を維持する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:50:18 GMT)
MARLIN: Multi-Agent Game-Theoretic Reinforcement Learning for Sustainable LLM Inference in Cloud Datacenters [0.0] 大規模言語モデル(LLM)は、AIベースのコンシューマおよびエンタープライズサービスの導入によって、クラウドベースのプラットフォームでますます普及している。
LLMの推論要求は、ライフサイクル全体のエネルギー使用量の最大90%を占め、訓練エネルギーコストは下降する。
タイム・ツー・ファーストトークン(TTFT)を共用するマルチエージェントゲーム理論強化学習フレームワーク MARLIN を提案する。
MarLINはTTFTの少なくとも18%、二酸化炭素の33%、水利用の43%、エネルギーコストの11%を削減している。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:20:02 GMT)
Lying Is Just a Phase: The Hidden Alignment Transition in Language Model Scaling [0.0] 16家系の63塩基モデルにおける推論と真理の結合度を測定した。
我々は、家族依存の臨界スケール(N_c$)以下の損失曲線を目に見えない体制変化を発見し、その上、彼らは協力する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:14:09 GMT)
Lost and Found in Translation: Variational Diagnostics for Neural Codebook Channels [0.0] 変分オートエンコーダ(VAE)は、エンコーダ$q_$とデコーダ$p_$を共同でトレーニングし、実践者は結果として生じる遅延空間を離散コードとして扱う。
標準的なVAE診断は、このコードが使用されているかどうか、デコーダがエンコーダのコードの下で各潜伏者を読み取るかどうかのみを認証する。
我々は,アーキテクチャフリーなBernoulli-KL証明書によって,対角線外質量を束縛したエンコーダデコーダ診断法を開発した。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:52:21 GMT)
Loiter UAV Reinsertion Guidance for Fixed-wing UAV Corridors [0.0] 本論では, ローターレーンからメインレーンへのUAVの衝突のない再挿入の問題に対処する。
トランジットレーンにおけるローターUAVの要求速度を計算するための誘導アルゴリズムが開発され、安全な再サーションが保証される。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:46:08 GMT)
Local Inverse Geometry Can Be Amortized [0.0] 逆問題はしばしば、安価だが脆弱な一階更新を曲率対応の方法と交換する。
そこで我々は,局所的逆幾何を再利用可能な逆演算子に補正する学習方法を提案する。
D-IPGは局所的な擬似逆整合の下で減衰したガウスニュートンと一階同値であることが証明された。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:41:57 GMT)
Learning Selective Merge Policies for Deadline-Constrained Coded Caching via Deep Reinforcement Learning [0.0] ビデオストリーミングサービスでは、リクエストごとに厳格な期限を考慮し、どのメッセージをマージするかを選択することが不可欠である。
そこで本研究では,DRLをベースとしたデッドライン制約付き符号化配信を,マスク付き離散動作キュー状態制御問題として定式化する手法を提案する。
また、近似ポリシー最適化により、グラフアテンションポリシーネットワークをトレーニングする。
論文参考訳(メタデータ) (Wed, 13 May 2026 22:18:30 GMT)
LLMs as Implicit Imputers: Uncertainty Should Scale with Missing Information [0.0] 大規模言語モデル(LLM)は、利用可能なコンテキストが不完全あるいは劣化した環境で、ますますデプロイされる。
不完全な文脈下で答えを生成するLLMは暗黙のインデューサとみなすことができると我々は主張する。
繰り返しサンプリングから推定できる2つの回答レベルの不確実性を評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:43:57 GMT)
KadiAssistant: A conversational AI Agent for information retrieval in Kadi4Mat [0.0] 私たちはKadi Researchデータエコシステムに統合された、プライバシ・バイ・デザイナのAIアシスタントであるKadiAssistantを紹介します。
KadiAssistantは、プライバシーに敏感な研究データから、研究者が効率的にアクセスし、集約し、情報を合成することを可能にする。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:15:35 GMT)
Invertible Symmetry and Spontaneous Duality Breaking in the Transverse-Field Ising Model [0.0] 横場イジングモデルの自己双対性は双対性のアーキタイプであり、対称性やトポロジーとともに、近代物理学全体を通して組織的原理として用いられる。
ここでは,周期的境界条件よりも開放性を考慮したモデルを調整することで,正確な双対性を実現できることを示す。
正確な双対性を持つモデルでは、量子臨界点の対称性も正確であり、したがって可逆である。
最後に、双対性の正確性は、原モデルの用語による大域対称性の自然分解が、局所対称性を自発的に破るものとして等価に記述できることを意味する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:24:09 GMT)
In-situ tunable superconducting diode: towards field-free operation with infinite nonreciprocity [0.0] 4末端のニオブ平面ジョセフソン接合に基づくダイオード。
マルチ端子構造は外部磁場の必要をなくし、本質的に非制限のその場調整を可能にすることを示す。
例えば、そのようなダイオードは、再誘電体超伝導によってガウスニューロンとして動作可能であることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:37:52 GMT)
IdeaForge: A Knowledge Graph-Grounded Multi-Agent Framework for Cross-Methodology Innovation Analysis and Patent Claim Generation [0.0] IdeaForgeは、イノベーション分析と特許請求生成のための知識グラフベースのフレームワークである。
複数のイノベーション方法論(TRIZ、Design Thinking、SCAMPER)を、永続的なFalkorDB知識グラフ上で動作する専門エージェントを通じて統合する。
IdeaForgeの中心的な貢献は、グラフベースのクレームリンクを通じて実装されたクロスメソッド収束機構である。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:25:49 GMT)
Humanwashing -- It Should Leave You Feeling Dirty [0.0] AI決定プロセスの人間による監視は、懸念に対処するための最も一般的な提案の1つである。
しかし、人間の監視が実際に何を意味するのかは、十分に検証されていない。
ループメタファーの使用は、プロセスと結果の両方を曖昧にする。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:05:43 GMT)
History Anchors: How Prior Behavior Steers LLM Decisions Toward Unsafe Actions [0.0] HistoryAnchor-100、100の短いシナリオを10のハイテイクドメインで構築します。
最強のアライメントモデルはほとんど安全でないことはほとんどありませんが、"以前の歴史に示された戦略と整合した"という1つの追加文で、91-98%に跳ね返っています。
アクションラベルの置換はエフェクトをそのまま残し、すべてのセーフな事前履歴を持つ同じ命令は、安全でないレートを7%以下に保っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:50:27 GMT)
GuardSec: A Multi-Modal Web Platform for Real-Time Digital Fraud Detection, Entity Verification, and Connection Security Analysis in the African Context [0.0] GuardSecは、リアルタイム脅威検証のためのプロダクションデプロイされたWebプラットフォームである。
ブラウザを持っている人は、URL、ウェブサイト、電話番号、メールアドレス、ビジネスエンティティの正当性を5秒以内で評価できる。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:50:43 GMT)
Graphical Algebraic Geometry: From Ideals and Varieties to Quantum Calculi [0.0] グラフ線形代数プログラムを拡張した図形言語群である図形代数幾何学(GAG)を紹介する。
本稿では,GAGに関する2つの実践的視点を紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:05:02 GMT)
Graph-Grounded Optimization: Rao-Family Metaheuristics, Classical OR, and SLM-Driven Formulation over Knowledge Graphs [0.0] 本稿では,現実の最適化問題における決定変数,制約,客観的係数を,Cypherクエリによる特性知識グラフ(KG)から導出するパラダイムを提案する。
我々は,オープンソースサム山グラフデータベースのパラダイムをインスタンス化し,実世界のパブリックドメインKGが支援する7つの問題を評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:12:36 GMT)
Generative Texture Diversification of 3D Pedestrians for Robust Autonomous Driving Perception [0.0] 本稿では,合成シーン生成のための3次元歩行者資産における変動性のスケーリング手法を提案する。
我々は、多様な顔のテクスチャとアイデンティティレベルの外観変化を合成することにより、複数の異なる歩行者インスタンスを生成する。
これらの資産を用いて, 合成データセットを構築し, 実データと合成データを混合したRGBオブジェクト検出の影響について検討する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:35:50 GMT)
GateKD: Confidence-Gated Closed-Loop Distillation for Robust Reasoning [0.0] 本稿では,信頼度の高いクローズドループ推論フレームワークであるGateKDを提案する。
GateKDは教師を静的なオラクルではなく、動的なゲートキーパーとして扱う。
GateKD は高い開ループ蒸留ベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:04:46 GMT)
From Rosetta to Match-Up: A Paired Corpus of Linguistic Puzzles with Human and LLM Benchmarks [0.0] 高校の言語学コンペティションで使用される言語パズルについて検討する。
既存のロゼッタ・ストーンパズルを対応するマッチアップパズルに変換するための体系的な手順を提案する。
得られたRosetta Stone-Match-Upペアを,ヒトと大言語モデルの両方で評価した。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:03:35 GMT)
From Hilbert's Tenth Problem to Quantum Speedup: Explicit Oracles for Bounded Diophantine Systems [0.0] 我々は、有界整数領域上のディオファント方程式を解くために、完全に可逆的なアルゴリズムフレームワークを導入する。
抽象ブラックボックスの仮定を超えて、この明示的なアーキテクチャ合成は、必要な量子演算が有界なオーバーヘッドとして働くことを保証している。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:01:01 GMT)
From Cumulative Constraints to Adaptive Runtime Safety Control for Nonstationary Reinforcement Learning [0.0] Constraint Projection Safety Shield (CPSS)は、累積安全予算を実行中に適応的な状態レベルの制御制約に変換するランタイムメカニズムである。
CPSSは残りの安全予算を追跡し、それを許容されるリスクしきい値に予測し、予測される安全コストがアクティブなしきい値を超える政策措置をフィルタリングする。
得られた遮蔽ポリシーを解析し、そのメカニズムが実行された動作に対する状態ごとの閾値満足度を保証することを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:34:13 GMT)
Floquet engineering of nonreciprocal light-induced dipolar interactions [0.0] 光誘起双極子相互作用が光力の内在的非相互性とどのように組み合わせられるかを示す。
その結果、非相互相互作用の量子演算のツールボックスが確立される。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:46:28 GMT)
First-Passage Prediction of Grokking Delay: ACalibrated Law under AdamW with Causal Validation [0.0] 閉形式法 T_grok - T_mem = (1 / 2 kappa_LL eta) log(V_mem / V_star) ここで、V_t =theta_t||2 は標準二乗パラメータ、V_star はアーキテクチャ依存しきい値、kappa_LL はクリーンSGD 収縮率 2 eta に対するAdamW 補正を吸収する。
単一ハイパーランゲージセル上でのキャリブレーション(kappa_LL, V_star)は,MAPE 17.7%を41で達成し,26回のホールドアウト動作におけるグルーキング遅延を予測する
論文参考訳(メタデータ) (Wed, 13 May 2026 06:33:56 GMT)
Finite-size scaling of hetero-associative retrieval in continuous-signal-driven Ising spin systems [0.0] 実世界の物理信号は連続かつ高次元であるが、連想記憶の統計力学は離散イジングスピンで動作する。
この分割を多層Isingフレームワークを通じてブリッジし、ジオメトリ保存された連続Isingエンコーダを結合する。
頭頂部脳波とEOG軸のマクロな睡眠状態を1つの雑音性前頭脳波キューから再構成し,クエンチされた生物学的障害の存在下での相互リコールを実証した。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:33:51 GMT)
Feedback-based quantum optimization and its classical counterpart: quantum advantage and the power of classical algorithms [0.0] 我々は、フィードバックに基づく量子最適化に対する従来提案されていた古典的アプローチの高次理論を開発する。
主な発見は、量子アルゴリズムが解の質の観点から古典的なアルゴリズムに有利であるということである。
この論文で論じられた古典的アルゴリズムの1つは、高次非制約バイナリ最適化問題に対する大きなスケーラビリティを示している。
論文参考訳(メタデータ) (Wed, 13 May 2026 06:54:28 GMT)
Fast and effective algorithms for fair clustering at scale [0.0] 保護されたグループに属するオブジェクトに対する公平なクラスタリング問題に対処する。
目的は、対象物とクラスタの中心の間の2乗ユークリッド距離の和として定義されるクラスタリングコストを最小化することである。
本稿では,公正クラスタリングのための一般的なフレームワークを提案し,コスト対公正トレードオフを正確に制御し,それに基づいて3つを導入する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:40:07 GMT)
Fair and Calibrated Toxicity Detection with Robust Training and Abstention [0.0] トレーニングタイムの介入やポストホックの安全メカニズムは独立して評価することはできない。
経験的リスク最小化(ERM)、インスタンスレベルの再重み付け、グループDROをこれらの軸で比較する。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:50:35 GMT)
Exploiting ionization dynamics in the nitrogen vacancy center for rapid, high-contrast spin and charge state initialization [0.0] ダイヤモンド中の窒素空孔(NV)中心におけるスピン測定の感度を高める方法を提案する。
ここでは、これらは、NV中心のスピンコントラスト、高感度磁力計、高忠実度状態の読み出しにおける鍵量を大幅に向上するために使用できることを示す。
本研究は,NV中心の電荷とスピン偏極のダイナミクスを詳細に把握し,固体スピン中心の直接光学的,スピン間電荷,電気的読み出しに有効な知見を提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:05:57 GMT)
Exploiting all ancilla outcomes in linear combinations of unitaries: low-rank recovery and quantum trapdoor functions [0.0] 量子アルゴリズムプリミティブは、アンシラレジスタのポストセレクションを介して非ユニタリ演算子を埋め込む。
標準的なLCUでは、$|0dots0rangle$ ancillaの結果のみが保持され、残りの"junk"結果は破棄される。
本稿では,アダマールゲートと1つの回転量子ビットとの係数合成を単純化する代替LCU回路を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:40:35 GMT)
Exact Linear Attention [0.0] 本稿では,トランスフォーマー注意のための線形計算複雑性を実現する機構であるExact Linear Attention (ELA)を紹介する。
カーネル制約を課すことで、事前の線形アテンション法における勾配爆発とトークンアテンションの希釈を識別し、対処する。
Hadamard Exp Kernel、Summation Squared Euclidean Distance Kernel、Subtraction Squared Euclidean Distance Kernelなど、いくつかのカーネル関数が提案されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 08:06:48 GMT)
Enhanced and Efficient Reasoning in Large Learning Models [0.0] そこで本研究では,大規模言語モデルに適用できるほど効率的な推論法を提案する。
リコーディングには、簡潔ながら、学習可能な時間に保持されるリレーショナルルールの中核的なサブセットを学習するタスクが、驚くべき性質を持っていることを示す。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:56:02 GMT)
Efficient Sensor Fusion for Gesture Recognition on Resource-Constrained Devices [0.0] 従来のビジョンベースのアプローチでは、消費電力、計算レイテンシ、ユーザのプライバシに関する課題に直面している。
本稿では,低分解能のTime-of-Flight(ToF)と赤外線(IR)熱センサを融合した軽量・プライバシー保護型ジェスチャー認識システムを提案する。
特殊なグループ畳み込みアーキテクチャを持つコンパクトな畳み込みニューラルネットワーク(CNN)は、マイクロコントローラ上でこれらのモダリティを効率的に融合させるように設計されている。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:53:22 GMT)
Effective Hamiltonians in Cavity and Waveguide QED from Transition-Operator Diagrammatic Perturbation Theory [0.0] 本稿では,遷移中心理論に基づく分散体制における断熱排除形式論を提案する。
摂動拡大は図式的な枠組みに再キャストされ、断熱除去は遷移部分空間への制御された射影を通して実装される。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:37:58 GMT)
Dual Shapiro steps and fundamental transconductance in dc driven Bloch transistor [0.0] 2つの小さな容量のジョセフソンジャンクションが連なっており、その間に小さな島がある。
Transconductance $overlineI_B/overlineV_J$は1/R_Q$の基本値を取る。
結果は、超伝導回路をベースとし、強磁場を印加せずに動作する、代替の量子抵抗標準への道を開いた。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:05:31 GMT)
Do Biological Structural Guarantees Earn Their Complexity? [0.0] 生物学的にインスパイアされたAIエージェントフレームワークは、遺伝子制御ネットワーク、免疫システム、代謝制御から適合した構造保証を通じて信頼性の恩恵を主張する。
メタボリック・プライオリティ・ゲーティング、オートインデューサに基づくクォーラムセンシング、ベイズ定常検出の3つの深いベンチマークを提示する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:36:04 GMT)
Descriptive Collision in Sparse Autoencoder Auto-Interpretability: When One Explanation Describes Many Features [0.0] 私たちは衝突と呼ばれる問題を特定します。多くの異なるSAE機能は、同じ説明を認めています。
判別と呼ばれる特性を定式化し、現在の検出スタイルの自己解釈可能性スコアが衝突に不変であることを証明した。
衝突検出と識別スコアの2つの相補的な補正指標を提案し、隣人との特徴を区別できない説明を明示的にペナルティ化する。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:41:38 GMT)
Derivation Prompting: A Logic-Based Method for Improving Retrieval-Augmented Generation [0.0] 本稿では,Retrieval-Augmented Generationフレームワークの生成ステップのための新しいプロンプト技術であるDrivation Promptingを紹介する。
論理導出にインスパイアされたこの方法は、事前定義された規則の体系的な適用を通じて、初期仮説から結論を導出することを含む。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:20:16 GMT)
Dense vs Sparse Pretraining at Tiny Scale: Active-Parameter vs Total-Parameter Matching [0.0] 我々は,LLaMA方式のデコーダ学習法を用いて,小規模プレトレーニング体制下での高密度および高密度の混合変圧器について検討した。
我々の最高のスパースレシピは、トップ2ルーティング、スイッチスタイルのロードバランシング、ルータzロスの4つのエキスパートを使います。
トレーニング全体を通して、マッチしたアクティブなアドバンテージが増加し、マッチした総合的なアドバンテージが急激に狭まる。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:48:24 GMT)
Decoherence of spatial superpositions along stationary worldlines [0.0] 我々は、ミンコフスキー真空中を静止世界線に沿って移動する粒子の空間的重畳のデコヒーレンスを分析する。
粒子の質量の中心に対する量子ブラウン運動マスター方程式を導出する。
双曲運動と一様円運動の2例の脱コヒーレンス率について検討した。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:35:20 GMT)
Decoherence in matter-wave Talbot interference: a hydrodynamic probability-flow analysis [0.0] 本稿では,デコヒーレンスによってカーペット構造が徐々に抑制され,横モーメント分布が円滑になることを示す。
その結果、周期的な物質-波動タルボット幾何学において、可視的干渉の損失と動的分離経路の分離の損失は同時に発生しないことを示した。
論文参考訳(メタデータ) (Wed, 13 May 2026 23:02:42 GMT)
CurveBench: A Benchmark for Exact Topological Reasoning over Nested Jordan Curves [0.0] 視覚入力からの階層的トポロジ的推論のためのベンチマークであるCurveBenchを紹介する。
各画像は、平面領域間の包接関係をコードするルート木で注釈付けされる。
タスクの視覚的単純さにもかかわらず、最も評価の高いモデルであるGemini 3.1 Proは、textbf71.1%のツリー生成精度しか達成していない。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:46:22 GMT)
Controlling Logical Collapse in LLMs via Algebraic Ontology Projection over F2 [0.0] 代数オントロジー計画(Algebraic Ontology Projection, AOP)を導入し, LLM隠れ状態をガロアフィールドF2に投影する。
AOPは、目に見えないコンセプトペアに対して最大93.33%のゼロショットインクルージョン精度を達成する。
本稿では,F2制約満足度を定量化する指標であるSemantic Crystallisation(SC)を紹介する。
論文参考訳(メタデータ) (Wed, 13 May 2026 04:01:29 GMT)
Control-Plane Openness in Near-Term Quantum Computing: A Survey of Vendor Stacks and Field Implications [0.0] 商用量子コンピューティングにおけるパルスレベルおよび制御エレクトロニクスインターフェースへの公共アクセスは2倍になった。
最大の超伝導クラウドプラットフォームはこの層でアクセスを閉鎖し、IBMは2025年2月に全生産のQPUからパルスレベル制御を取り除いた。
我々は超伝導、閉じ込められたイオン、中性原子、フォトニックモードの13の商用ベンダーを調査し、コントロールプレーンと呼ばれる6軸のオープンネスでそれぞれをグレードする。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:15:15 GMT)
Context-Aware Web Attack Detection in Open-Source SIEM Systems via MITRE ATT&CK-Enriched Behavioral Profiling [0.0] 本稿では,オープンソースのWazuh SIEMプラットフォーム用のAIモジュールであるSmart-SIEMを紹介する。
HTTP応答統計分布を符号化した振る舞いコンテキストベクトルを用いる。
2段階のハイブリッドカスケードは、LightGBMをバイナリアタック検出に、XGBoostを6クラスのアタック分類に組み合わせている。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:54:36 GMT)
Conformal Anomaly Detection in Python: Moving Beyond Heuristic Thresholds with 'nonconform' [0.0] 既存の機械学習において、共形異常検出を適用するためのPythonパッケージである「nonconform」を提示する。
このパッケージは'scikit-learn'、'pyod'、カスタムの異常検知器と統合されている。
キャリブレーション、p値生成、偽発見率制御のための統一インターフェースを提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:05:24 GMT)
Computing eigenpairs of quantum many-body systems with Polfed.jl [0.0] Polfed$.$jlは、量子多体ハミルトンの中間スペクトル固有値と固有ベクトルを計算するアルゴリズムである。
このパッケージはフレキシブルエネルギーターゲティング、構造化ハミルトニアンのスペクトルマッピングの自動最適化、GPUアクセラレーションをサポートする。
また、多体エルゴディディディティを破る遷移のおもちゃモデルである量子太陽モデルハミルトニアンを構成するためのコードも提供する。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:24:48 GMT)
Comparative assessment of germanium-based spin-qubit modalities: donor, acceptor, gate-defined hole, and gate-defined electron platforms [0.0] 高純度ゲルマニウム(Ge)はスピンベースの量子情報処理のための汎用半導体プラットフォームとして再登場している。
4つのGe系スピン量子モードを共通な物理的および構造的足場上で比較する。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:38:36 GMT)
Comparative Evaluation of Machine Learning Approaches for Minority-Class Financial Distress Prediction Under Class Imbalance Constraints [0.0] 本稿では,古典的統計手法,アンサンブル学習手法,探索的ニューラルモデルの比較評価を行った。
本研究は、厳密なクラス不均衡制約下での財政的危機予測のための再現性と解釈可能な機械学習を支援するための応用工学評価として位置づけられている。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:44:25 GMT)
Community-Aware Vertex Ordering for Reference-Based Graph Compression: A Cross-Encoder Empirical Study [0.0] オーダリングとエンコーダの相互作用について検討する。
BG、CS、CGの3つの参照ベースのエンコーダは、最大28の候補分解から頂点毎のコスト最適選択を実行する。
エンコーダフレームワークは、低オーバヘッドランダムアクセスをサポートする自己補完ビットストリームも生成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:38:31 GMT)
Collective amplification and anisotropic narrowing of alignment signals in cesium vapor under strong spin exchange near zero magnetic field [0.0] 本研究では, ポンプビームに垂直な面におけるハンル共鳴の異方性は, 濃度の上昇とともに急激に増加することを示す。
これらの共鳴のユニークな性質、例えば、その超小幅と長期記憶効果による磁場制御的不安定性は、量子センシングや情報としての使用を約束する。
論文参考訳(メタデータ) (Wed, 13 May 2026 12:55:13 GMT)
Classical Limit: Dissipation of Spekkens' Generalised Contextuality under Decoherence [0.0] 本研究では,ある非一貫性しきい値の後に,非偏極チャネルの作用により,Spekkens文脈系が非コンテキストとなることを示す。
この結果は、デコヒーレンス、スペケンスの一般化された文脈性、量子的優位性との関係を理解するのに役立ちます。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:42:05 GMT)
ChromaFlow: A Negative Ablation Study of Orchestration Overhead in Tool-Augmented Agent Evaluation [0.0] 本稿では,プランナー指向実行,特殊なツール使用,テレメトリ駆動評価を中心に構築されたツール拡張型自律推論フレームワークを提案する。
クリーンな評価制約の下でGAIA 2023 Level-1バリデーションタスクのクロマフローを解析する。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:40:37 GMT)
Chem-GMNet: A Sphere-Native Geometric Transformer for Molecular Property Prediction [0.0] SMILESを汎用テキストとして扱い、数百万の教師付き事前学習で補償することにより、強力なMoleculeNet性能を示す。
Chem-GMNetは10のMoneculeNetエンドポイントのうち7つで$sim!35%少ないパラメータで勝利する。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:43:55 GMT)
Case Studies and Reflections on Agentic Software Engineering for Rapid Development of Digital Music Instruments [0.0] 本稿では、革新的なオーディオソフトウェアの開発におけるエージェント・ソフトウェア・エンジニアリング(ASE)の利用について考察する。
JUCEフレームワークを用いてC++言語で音声ソフトウェアを開発するために,我々は3つの異なる方法で技術を用いたケーススタディを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:28:20 GMT)
CANTANTE: Optimizing Agentic Systems via Contrastive Credit Attribution [0.0] システムレベルの報酬をエージェントごとの更新信号に分解するフレームワークであるCANTANTEを紹介する。
我々は,GEPA と MIPROv2 に対して,プログラミング,数学的推論,マルチホップ質問応答について評価する。
論文参考訳(メタデータ) (Wed, 13 May 2026 10:09:10 GMT)
Bridging the Rural Healthcare Gap: A Cascaded Edge-Cloud Architecture for Automated Retinal Screening [0.0] APTOS 2019 Blindness Detectionデータセット上で,2層エッジクラウドカスケードを提案する。
Tier 1は、ローカルクリニックデバイス上で軽量のMobileNetV3小モデルを実行し、参照可能DR(クラス2-4)と非参照可能DR(クラス0-1)のバイナリトリアージを行う。
Tier 2は、通常のグレーディングのためにクラウドでRETFoundDINOv2モデルを実行するが、Tier 1で参照可能な画像のサブセットでのみ動作する。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:47:16 GMT)
Bounded-Input True Proportional Navigation for Impact-Time Control [0.0] 本稿では,制御入力(指令加速度)の所定値を厳密に満たしつつ,一定速度,非空力目標をインターセプトできる非線形誘導戦略を提案する。
線形化や小角近似を用いた従来手法とは異なり,提案手法は真の比例ナビゲーションガイダンス(TPNG)をベースラインとして採用している。
提案手法の性能は,様々なシナリオにおいて評価される。
論文参考訳(メタデータ) (Wed, 13 May 2026 15:29:44 GMT)
Beyond Explained Variance: A Cautionary Tale of PCA [0.0] 本稿では,単位円から一様にデータをサンプリングする生成確率幾何学モデルを提案する。
このモデルの下では、ペアワイズコサイン距離は観測されたU字型の分布と定性的に一致してアルコシン分布に従う。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:37:31 GMT)
Beyond Anthropomorphism: Exploring the Roles of Perceived Non-humanity and Structural Similarity in Deep Self-Disclosure Toward Generative AI [0.0] 知覚された非人間性は、評価の理解を低下させる可能性がある。
構造的類似性は、ユーザの思考とAI応答の間に認識される論理的整合性を指す。
発見は、深い自己開示における信頼に関連する行動は、人為的知覚以外の要因を含む可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:10:07 GMT)
Benchmarking the Open Science Data Federation services to develop XRootD best practices [0.0] Open Science Data Federation (OSDF)プロジェクトは、ペリカンプラットフォームに基づいた科学的グローバルなデータ配信ネットワークの構築を目的としている。
本研究は,National Research Platform(NRP)ホストを用いて実施したテストと結果について述べる。
この方法論を適用することで、さまざまなシナリオでXRootDとPelican層がどのように機能するかを追跡することが可能になる。
論文参考訳(メタデータ) (Wed, 13 May 2026 14:29:38 GMT)
AttnGen: Attention-Guided Saliency Learning for Interpretable Genomic Sequence Classification [0.0] 我々は、最適化プロセスに解釈可能性を直接組み込む、注意誘導型トレーニングフレームワークであるAttnGenを紹介します。
AttnGenは、注意機構を使用してヌクレオチドレベルの重要度を計算し、トレーニング中の低コントリビューション位置を徐々に抑制する。
適度なマスキングでは、AttnGenは96.73%の検証精度を達成し、95.83%の精度で従来のCNNベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 13 May 2026 19:49:40 GMT)
Attention Once Is All You Need: Efficient Streaming Inference with Stateful Transformers [0.0] Flash Queriesは、データ到着間のアイドルサイクルを再利用し、登録された質問を事前に評価し、ユーザが尋ねる前にキャッシュされた回答を返す。
セル予算の受け入れとプレフィックスを意識したグループプレフィルを備えたマルチテナント連続バッチスケジューラは、数十のステートフルセッションを1つのGPU上で共存させることができる。
ストリーミング市場データベンチマークでは、参照実装は従来の推論エンジンよりも最大5.9倍のスピードアップを達成する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:06:15 GMT)
Assessment of cloud and associated radiation fields from a GAN stochastic cloud subcolumn generator [0.0] 現代の地球系モデル(ESM)は、典型的な雲の特徴よりもはるかに大きな水平スケールで運用されている。
従来の物理ベースのジェネレータは、しばしば分析的なクラウド重複パラダイムに依存している。
本稿では,GEOS大気モデルのための新しい2段階機械学習サブカラム生成手法を提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 17:46:08 GMT)
All-Electric Quantum State Transfer via Spin-Orbit Phase Matching [0.0] 半導体ホールスピン量子ビットは量子計算への有望な経路を提供する。
我々は、スピン軌道誘起異方性交換によってコヒーレントな長距離量子状態移動が妨げられることを示す。
以上の結果から, スピン軌道相の電気的制御は, 量子情報伝達において, 等級調整あるいは軸アライメントが実用的な方法であることが確認された。
論文参考訳(メタデータ) (Wed, 13 May 2026 18:00:14 GMT)
Algometrics: Forecasting Under Algorithmic Feedback [0.0] 進化は予測アルゴリズムによって予測される時系列のフレームワークであるalgometricsを紹介します。
この枠組みは、受動的予測の下で測定された歴史的リスクと、予測が行動を起こすときに測定されたデプロイメントリスクとを区別する。
これらの結果から,アルゴリズム市場における時系列ベンチマークでは,予測精度とともにフィードバック感度を報告すべきであることが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 20:05:54 GMT)
Affiliated operators for classical and quantum control [0.0] 無限次元ヒルベルト空間上の双線型系の可制御性に関する問題に対処する枠組みを提案する。
双線型制御系で生じるドリフトと制御項が、同じヒルベルト空間に作用する有限型のフォン・ノイマン代数に関係していると仮定する。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:52:14 GMT)
A microservices-based endpoint monitoring platform with predictive NLP models for real-time security and hate-speech risk alerting [0.0] この研究は、テレメトリを収集し、リアルタイムのセキュリティとコンプライアンスをサポートするために予測自然言語処理モデルを適用する、統合されたエンドポイントベースのプラットフォームを提案する。
テキスト分類では、BERTなどのトランスフォーマーモデルを用いてヘイトスピーチのリスク検出を行い、平均精度は87%である。
実験の結果,提案プラットフォームは,アラート管理を集中化しながら,データ流出やポリシー違反の指標を迅速に提示できることが示唆された。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:12:57 GMT)
A Survey on Data-Dependent Worst-Case Generalization Bounds [0.0] PAC-ベイズ理論をランダムなデータ依存仮説集合に拡張する。
我々は幾何学的および位相的記述子を用いて複雑性項を洗練する。
結果として得られる情報理論用語を安定性の仮定で置き換える。
論文参考訳(メタデータ) (Wed, 13 May 2026 09:03:50 GMT)
A Research-Informed Module on Quantum Superposition for Rapid Classroom Adoption [0.0] 本稿では,2状態システムに量子重ね合わせを導入するための適用可能な命令モジュールを提案する。
このパッケージは、6つの概念的障壁を囲むグレーディング・レディ・アセスメント材料と5つの活動的な教室シーケンスを組み合わせている。
このモジュールは50分間のクラスミーティング用に設計されており、ノートブックで実装したり、同等の2状態の量子シミュレータに適応することができる。
論文参考訳(メタデータ) (Wed, 13 May 2026 16:35:49 GMT)
A Non-Destructive Methodological Framework for Modernizing Legacy Clinical Reporting Systems for AI-Driven Pharmacoinformatics: A SAS Case Study [0.0] 薬物開発と薬物移動は、レガシーな臨床報告パイプラインによってしばしばボトルネックとなる。
既存の近代化アプローチでは、完全な書き換えと漸進的な近代化を選択せざるを得ない。
我々は、レガシーソースコードを変更することなく、AI駆動の薬理情報処理の即応性を実現する非破壊的なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 13 May 2026 01:15:46 GMT)
A Near-optimal SQ Lower Bound for Smoothed Agnostic Learning of Boolean Halfspaces [0.0] 半空間の平滑化学習の複雑性について,KM25のモデルにおける一様限界の下で検討した。
論文参考訳(メタデータ) (Wed, 13 May 2026 13:50:31 GMT)
A Multi-Agent Orchestration Framework for Venture Capital Due Diligence [0.0] 我々は、ベンチャーキャピタルにおける企業デュリジェンスと市場分析のための完全に自動化された枠組みを提示する。
このシステムは,大規模言語モデルとリアルタイムWeb検索を組み合わせた,イベント駆動オーケストレーションアーキテクチャ上で動作する。
構造的フォールバック機構は、財務状況における幻覚を直接ターゲットとして、検証されていない数字を生成するのではなく、データ不在を明示的にフラグする。
論文参考訳(メタデータ) (Wed, 13 May 2026 07:20:16 GMT)
A Mimetic Detector for Adversarial Image Perturbations [0.0] 敵は、クリーンな画像に小さなほとんど見えないノイズパターンを加えることで、ディープイメージ分類器を騙す。
オープンソースMOLEライブラリの高階Corbino-Castilloミメティック演算子を用いた単発無訓練検出器を用いてこれを活用する。
標準のtextttpeppers テスト画像上の検出器を標準$ellinfty$ budget $varepsilon = 16/255$で検証し、クリーンvs-逆分離を観測し、オーダー$k=2で3.55times$から単調に成長する。
論文参考訳(メタデータ) (Wed, 13 May 2026 03:52:50 GMT)
$Λ$-enhanced gray-molasses loading and EIT cooling of neutral atoms in nanophotonic traps [0.0] グレー・モルスにより、ナノファイバーベースの冷原子配置において、捕捉された原子の数を大幅に増加させることができる。
約4000個のセシウム原子をロードし、光学的な深さが140を超える。
EIT冷却はまた、2つの共伝播ナノファイバー誘導光フィールドで動作し、数百ピコワットの光電力しか要求しない。
論文参考訳(メタデータ) (Wed, 13 May 2026 11:45:32 GMT)