Orchard: An Open-Source Agentic Modeling Framework [124.7] スケーラブルなエージェントモデリングのためのオープンソースのフレームワークOrchardを紹介します。
Orchard Envは、サンドボックスライフサイクル管理のための再利用可能なプリミティブを提供する軽量環境サービスである。
Orchard Envの上に、3つのエージェントモデリングレシピを構築します。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:25:26 GMT)
Herculean: An Agentic Benchmark for Financial Intelligence [114.3] 代表的な4つのスキルセットにまたがるエージェント金融インテリジェンスのための最初の熟練したベンチマークであるHerculeanを紹介します。
フェデラーエージェント全体では、TradingやMarket Insightsではエージェントが比較的うまく機能するが、HedgingやAuditingではかなり苦労している。
全体としては、財務的推論を信頼性のあるワークフロー実行に変換する上で、現在のエージェントに重要なギャップがあることを示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:16:58 GMT)
Why SGD is not Brownian Motion: A New Perspective on Stochastic Dynamics [92.4] グラディエント・Descent (SGD) は通常ランゲヴィン過程としてモデル化され、ミニバッチノイズがブラウン運動として働くと仮定される。
この近似は、連続時間制限と、離散的なSGD更新を有限学習率で一致しないsqrt(eta)ノイズスケーリングに依存している。
ミニバッチサンプリングによって誘導されるゆらぎのある損失景観における決定論的力学としてのSGDの別の定式化を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:50:40 GMT)
ParaVT: Taming the Tool Prior Paradox for Parallel Tool Use in Agentic Video Reinforcement Learning [91.5] 我々はParaVTを紹介した。ParaVTは、Parallel Video Tool呼び出しのための、最初のマルチエージェントのエンドツーエンドRLトレーニングフレームワークである。
ParaVTはQwen3-VLベースラインを平均で+7.9%改善し、PARA-GRPOはトレーニングタイムのフォーマット準拠を0.13から0.64に引き上げた。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:36:34 GMT)
Foresee-to-Ground: From Predictive Temporal Perception to Evidence-Driven Reasoning for Video Temporal Grounding [86.4] ビデオ時間グラウンドのためのフォアシー・ツー・グラウンド(F2G)を提案する。
F2Gは予測的時間知覚とエビデンス駆動推論を統合している。
さまざまなベンチマークでグラウンド化の精度を一貫して向上させる。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:03:25 GMT)
Evaluating Commercial AI Chatbots as News Intermediaries [85.3] ベストシステムは、数時間前に報告されたイベントに関する質問に対して、90%以上の多重選択精度を達成する。
すべてのモデルはヒンディー語で最小の精度を達成する。
原因ではなく検索は エラーの70%以上を 引き起こします
論文参考訳(メタデータ) (Thu, 21 May 2026 17:42:07 GMT)
Clipping Bottleneck: Stabilizing RLVR via Stochastic Recovery of Near-Boundary Signals [83.0] Near-boundary Rescue (NSR) は最小限のプラグ・アンド・プレイの修正であり、失った信号を回復するために、アウト・オブ・バウンドトークンを保持する。
NSRはトレーニングの安定性を大幅に改善し、DAPOやGSPOといった強力なベースライン上で一貫したゲインを提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:45:31 GMT)
Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention [81.8] リニアアテンションは、ソフトマックスアテンションのキャッシュを固定サイズのリカレント状態に置き換え、シーケンシャルミキシングを線形時間に短縮し、定メモリに復号する。
我々はGated DeltaNet-2を紹介し、Gated DeltaNetとKim Delta Attentionの両方を一般化する。
Gated DeltaNet-2は、言語モデリング、常識推論、検索にまたがるMamba Gated DeltaNet、KDA、Mamba-3の変種の中で、最も優れた総合的な結果を得る。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:44:57 GMT)
Segment Anything with Motion, Geometry, and Semantic Adaptation for Complex Nonlinear Visual Object Tracking [81.3] 近年のビジョン基礎モデルはSAM 2で実証されている。
本稿では, SAM 2 を複雑な VOT シナリオに適用する新たなトラッキングフレームワーク SAMOSA を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:25:28 GMT)
AwareVLN: Reasoning with Self-awareness for Vision-Language Navigation [78.8] VLN(Vision-and-Language Navigation)は、エージェントが視覚環境内の自身の動きに言語命令を接地する必要がある。
本稿では,ナビゲーションモデルに自己認識推論機構を備えた新しいフレームワークであるAwareVLNを提案する。
提案手法は,(1)空間的およびタスク指向の自己認識を促進する構造的推論モジュール,(2)効果的な学習のための進歩分担付き自動データエンジンの2つの重要な革新を特徴とする。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:58:26 GMT)
LANG: Reinforcement Learning for Multilingual Reasoning with Language-Adaptive Hint Guidance [77.6] 強化学習は大規模言語モデルにおける多段階推論の強化に有効であることが証明されている。
しかし、その利点は多言語文脈に完全には翻訳されていない。
我々は、言語条件付きヒントを利用して、英語以外の推論タスクの探索をガイドする新しいフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:47:52 GMT)
From Abstraction to Instantiation: Learning Behavioral Representation for Vision-Language-Action Model [76.9] VLA(Vision-Language-Action)モデルは、分散シフト時にしばしば性能劣化に悩まされる。
時間的コヒーレントな行動表現の学習を通じて堅牢な操作を容易にするフレームワークである textbfBehaviorVLA を提案する。
RoboTwin 2.0、LIBERO、CALVINの実験では、最先端の成功率は58%、98%、および4.36(Avg.Len)である。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:14:19 GMT)
Survive or Collapse: The Asymmetric Roles of Data Gating and Reward Grounding in Self-Play RL [76.5] セルフプレイ強化学習は、言語モデルを独自の生成タスクで訓練し、人間ラベルなしでプロジェクタとソルバを共進化させる。
最近のシステムでは強い推理効果が報告されているが、崩壊と不安定性は広く観察され、理解されていない。
代わりに、自己プレイの安定性は、提案者生成タスクがトレーニングプールに入るかを判断するデータレベルゲートと、すでに認められたタスクに関するポリシーを更新する報酬信号の2つの異なるレバーによって管理されていると論じる。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:19:23 GMT)
IVGT: Implicit Visual Geometry Transformer for Neural Scene Representation [76.4] ポーズレス多視点画像から連続的かつ一貫性のある幾何を暗黙的にモデル化するインプリシトビジュアル幾何変換器IVGTを提案する。
IVGTは標準座標系で連続的なニューラルネットワークシーン表現を学習し、任意の3D位置での連続的な空間クエリをサポートする。
連続的かつコヒーレントな表面形状の直接抽出を可能にし、任意の視点からRGB画像、深度マップ、表面正規写像のレンダリングを可能にする。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:42:22 GMT)
Perception or Prejudice: Can MLLMs Go Beyond First Impressions of Personality? [74.7] グラウンドド・パーソナリティ・推論は、MLLMがそれぞれのビッグファイブ・格付けを、評価、推論、根拠の連鎖を通じて観察可能な証拠に固定することを要求する。
MM-OCEANは、人間の検証によるマルチエージェントパイプラインによって生成され、タイムスタンプによる行動観察、エビデンスに基づく特性分析、およびキューグラウンドMCQの7つのカテゴリがある。
この分析では、フィールド全体にわたって、正しい評価の51%が取得された手がかりに基づかず、ホリスティック・ギャラリング・レートは0-33.5%にしか達していないという顕著な偏見のギャップが明らかになった。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:42:47 GMT)
Event-Illumination Collaborative Low-light Image Enhancement with a High-resolution Real-world Dataset [74.7] EIC-LIEはイベントイルミネーション協調LIEフレームワークである。
EIC-LIEは、5つの実世界および合成データセットで最先端の手法より優れている。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:55:34 GMT)
CoarseSoundNet: Building a reliable model for ecological soundscape analysis [73.4] サウンドスケープは、生物音(動物音)、地球音(自然無生物音)、人類音(人間音)の3種類からなる。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:53:23 GMT)
Claw AI Lab: An Autonomous Multi-Agent Research Team [73.1] 今回紹介するClaw AI Labは,ラボネイティブな自律型研究プラットフォームである。
1つのエージェントや固定されたシリアルワークフローを中心にシステムを集中するのではなく、ユーザーは1つのプロンプトから完全な研究チームをインスタンス化できる。
Claw-Code Harnessはローカル、データセット、チェックポイントを接続して実行可能な実験を行い、実行成果物を研究ループにフィードバックする。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:02:53 GMT)
SCRIPT: Scalable Diffusion Policy with Multi-stage Training for Language-driven Physics-Based Humanoid Control [72.6] SCRIPTは、言語駆動の物理に基づくヒューマノイド制御のための多段階トレーニングフレームワークを備えたスケーラブルな拡散ポリシーである。
SCRIPTの中核はJAST-DiT(Joint Action-State-Text Diffusion Transformer)であり、アクション、物理状態、テキストを専用トークンストリームとして表現している。
自己回帰制御を安定させるために,近年の密集した文脈を保存し,長期的歴史から疎開したサンプルを抽出する非線形履歴条件付け機構を導入する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:17:21 GMT)
Uniform Diffusion Models Revisited: Leave-One-Out Denoiser and Absorbing State Reformulation [72.1] UDMの標準プラグインブリッジパラメタライゼーションは,後側頭蓋に最適化されないことを示す。
また,UDM関節法をマスク拡散様サンプリング操作に分解して保存する均一拡散の吸収状態再構成も導入した。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:27:19 GMT)
Seeing the Poem: Image-Semantic Detection of AI-Generated Modern Chinese Poetry with MLLMs [71.3] 従来, LLMを検知器として効果的に利用することは不可能であったが, これらの研究は漢詩に対処していない。
本稿では,現代漢詩の検知器としてLLMの性能を評価し,その向上を図るとともに,画像意味的指導による詩検出手法を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:57:04 GMT)
Boundary-targeted Membership Inference Attacks on Safety Classifiers [70.2] 安全分類器は、セルフハームとメンタルヘルスの議論を含むセンシティブなデータセットに基づいて訓練される。
トレーニングセット内のサンプルメンバシップのシグナルを増幅する低信頼例を識別する新しい境界ターゲット選択戦略を導入する。
実験の結果,会話の19%の会話を,安全分類器が5%の偽陽性率で再現できることが示唆された。
これは最先端のMIAメソッドだけで攻撃するより3.5ドル高い。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:05:22 GMT)
TimeGuard: Channel-wise Pool Training for Backdoor Defense in Time Series Forecasting [69.0] Time Series Forecasting (TSF)は多くのドメインで重要な役割を果たすが、バックドア攻撃には弱い。
データ絡み合いは、チャネルレベルのシグナル希釈を誘導し、サンプルフィルタリングとトリガー合成防御はバックドアのローカライズに効果がない。
我々は、TSFのトレーニング時バックドアディフェンスであるTimeGuardを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:58:46 GMT)
Enhancing Gaze Reasoning in Vision Foundation Models for Gaze Following [67.8] 視線追跡のための視覚基盤モデルにおいて、視線推論を強化するための新しい学習機構を提案する。
本手法は,目視対象が意味論的に健全でない場合に,最先端の性能を向上する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:21:14 GMT)
CoMoGen: COntrollable MOtion Dynamics and Interactions with Mask-Guided Video GENeration [66.8] CoMoGenは、入力画像上に条件付けられた単一のバイナリマスクシーケンスからリアルなインタラクティブなダイナミクスを生成する、制御可能なビデオ生成フレームワークである。
CoMoGenは、制御可能なビデオ生成手法を一貫して上回り、動きの忠実さと知覚的リアリズムにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:51:20 GMT)
Unified Data Selection for LLM Reasoning [66.0] 複雑で長いCoT推論のための大規模言語モデル(LLM)のトレーニングは、しばしば大量の高品質な推論データの必要性によってボトルネックとなる。
本研究では,各推論サンプルの上位(例えば0.5%)のエントロピートークンのみを和らげることで,推論品質を定量化する学習自由度指標であるHigh-Entropy Sum(HES)を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:21:41 GMT)
ForeSplat: Optimization-Aware Foresight for Feed-Forward 3D Gaussian Splatting [65.0] ForeSplatはフィードフォワード3DGSモデルのための最適化対応のトレーニングフレームワークである。
ForeSplatはフィードフォワードモデルのキャパシティ圧力を大幅に低減する。
償却予測とシーンごとの最適化のギャップを埋める。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:38:47 GMT)
One-Way Policy Optimization for Self-Evolving LLMs [63.9] RLVR(Reinforcement Learning with Verifiable Rewards)は,Large Language Models(LLMs)の推論能力を拡張するための,有望なパラダイムとなっている。
本稿では,最適化方向を更新等級から切り離す手法である1-Way Policy Optimization (OWPO)を提案する。
実験の結果,OWPOはDAPO,OPD,MOPDなどの強いベースラインより優れていた。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:25:27 GMT)
QuantSR+: Pushing the Limit of Quantized Image Super-Resolution Networks [63.0] 低ビット量子化は超解像モデル(SR)の圧縮に広く用いられている。
しかし、SRモデルが超低精度(2-4ビット)にプッシュされると、性能は急激に低下する。
本稿では,量子化演算子,ネットワーク設計,トレーニング最適化を改善する統一フレームワークQuantSR+を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:38:52 GMT)
Smooth Partial Lotteries for Stable Randomized Selection [61.9] 多くの組織では、評価スコアに基づいて選択をランダム化する部分的な宝くじを採用している。
既存の抽選デザインは本質的に不安定であり、単一の候補のスコアへの小さな変更は、選択確率の大きな変化を引き起こす可能性がある。
部分的な宝くじの設計原理として滑らかさを提案し、候補に対するレビュースコアから選択確率へのマッピングにおいて、リプシッツ条件として定式化する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:36:14 GMT)
CatalyticMLLM: A Graph-Text Multimodal Large Language Model for Catalytic Materials [61.5] 触媒材料のためのグラフテキスト多モード大言語モデルQE-Catalytic-V2を提案する。
プロパティ予測と逆設計を同じモデルと共有表現空間に統合する。
この統合フレームワークでは、QE-Catalytic-V2は信頼性の高いプロパティ予測を行うだけでなく、物理的に実現可能なCIF候補を生成し、表示することができる。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:36:07 GMT)
Towards Generalization of Block Attention via Automatic Segmentation and Block Distillation [61.2] ブロックアテンションは、Retrieval-Augmented Generation (RAG)のような長期コンテキストシナリオにおけるKVキャッシュの再利用を改善することができる。
しかし、入力テキストを意味のある自己完結ブロックに分割することの難しさと、性能低下のリスクを負う既存のブロック微調整手法の非効率性である。
ブロック微細チューニングよりも効率的な訓練フレームワークであるブロック蒸留を提案し, 凍結したフルアテンション教師モデルを用いて, ブロックアテンション学生を指導する。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:50:33 GMT)
GazePrior: Zero-Shot AR/VR Eye Tracking via Learned 3D Gaze Reconstruction [60.7] 我々は、さまざまなアイデンティティ、視線方向、光設定にわたる人間の目の分布をモデル化する、データ駆動型3Dプリミティブを導入する。
このモデルは、以前のETデバイスで収集された注釈付きデータのスパースインプット3D再構成を可能にする。
提案手法は, 実データ収集の現実性, 多様性, 地道的精度を, 禁止コストを伴わずに, データを合成する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:54:01 GMT)
Remember to be Curious: Episodic Context and Persistent Worlds for 3D Exploration [60.6] 本研究では,この失敗は空間的持続性とエピソード的文脈の欠如に起因することを実証する。
エージェントポリシーは、RGB観測のシーケンスモデルとしてパラメータ化され、エピソジックな文脈を維持する。
エンド・ツー・エンドのポリシーは、リンゴの摘みやイメージゴールナビゲーションといった下流タスクへの効果的な適応を可能にし、オフ・スクラッチベースラインよりも優れています。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:58:06 GMT)
DocAtlas: Multilingual Document Understanding Across 80+ Languages [58.7] 本稿では,82言語を対象とした高忠実度OCRデータセットとベンチマークを構築するフレームワークDocAtlasを紹介する。
我々のデュアルパイプライン、ネイティブDOCX文書の微分レンダリング、左右スクリプトの合成ベース生成は正確な構造アノテーションを生成する。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:33:02 GMT)
ExComm: Exploration-Stage Communication for Error-Resilient Agentic Test-Time Scaling [57.4] ExCommは、探索段階のエージェントテストタイムスケーリングのための通信プロトコルである。
ExCommは、強いテスト時間スケーリングベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:38:44 GMT)
Zero-Shot Temporal Action Localization Through Textual Guidance [57.4] 時間的アクションローカライゼーション(ZS-TAL)は、未トリミングビデオにおけるアクションの分類とローカライゼーションである。
トレーニングデータからの監督の欠如を補う新たなアプローチとして,ビデオ中のアクションのより詳細なローカライズのためのテキストガイダンス(TEGU)を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:05:27 GMT)
Dynamic Mixture of Latent Memories for Self-Evolving Agents [57.2] MoLEMは、動的混合(MoE)に基づく潜在メモリフレームワークの生成混合物である。
我々は、数学、科学、コードドメインにまたがる連続的な学習シーケンスに基づいて、このフレームワークを訓練する。
連続学習を完了した後、Vanilla事前学習ベースラインよりも平均精度を10.40%向上させる。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:35:10 GMT)
Bandit Convex Optimization with Gradient Prediction Adaptivity [56.8] 本研究では, 楽観的な勾配予測が, 最悪の後悔の保証を予測順応的に改善できるかどうかを考察する。
鍵となるアイデアは、分散が勾配ノルムではなく予測誤差でスケールする、新しい分散還元勾配推定器である。
我々は、$(sqrtmathbbE[S_T])$としてスケールする情報理論の下限を確立し、最も達成可能な予測適応的後悔の基本的な特徴を提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:57:38 GMT)
IdleSpec: Exploiting Idle Time via Speculative Planning for LLM Agents [56.8] 大規模言語モデル(LLM)ベースのエージェントは、反復的なツールコールと環境相互作用で多段階推論を活用することで複雑なタスクを解決する。
ほとんどのエージェントシナリオではアイドル時間が流行しているが、既存の作業では避けられないオーバーヘッドとして扱っている。
IdleSpecは、アイドル時間計算を利用してエージェントのパフォーマンスを向上させる、スケーラブルで汎用的な推論手法である。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:25:17 GMT)
WorldKV: Efficient World Memory with World Retrieval and Compression [56.6] 我々は、World RetrievalとWorld Compressionの2つのコンポーネントを備えた、トレーニング不要のフレームワークであるWorldKVを提案する。
Matrix-Game-2.0とLingBot-World-Fastでは、WorldKVはスループットの約2倍のフルKVメモリ忠実度に対応し、微調整なしでメモリトレーニングされたベースラインと競合する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:55:04 GMT)
From Patches to Trajectories: Privileged Process Supervision for Software-Engineering Agents [56.3] 教師の長い軌道上の監督された微調整(SFT)は、オープンソフトウェアエンジニアリング(SWE)エージェントに調査と推論を浸透させる主要な方法である。
本稿では,P2T (Patches-to-Trajectories) を提案する。P2T (Patches-to-Trajectories) は,P2T (Patches-to-Trajectories) において,P2T (Patches-to-Trajectories) とP2T (Patches-to-Trajectories) の2つの最適化法である。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:54:55 GMT)
SpecHop: Continuous Speculation for Accelerating Multi-Hop Retrieval Agents [55.7] SpecHopは、複数の投機スレッドを維持する継続的投機フレームワークである。
SpecHopが十分なアクティブスレッドでオラクルのレイテンシ向上にアプローチできることを示します。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:55:47 GMT)
D3Seg: Dependency-Aware Diffusion for Brain Tumor Segmentation with Missing Modalities [54.9] 欠落モード設定下での安定した性能を維持するために,新しいセグメンテーションモデルD3Segを提案する。
提案モデルでは, 腫瘍造影法 (ET) で約1.5~2.0%, 腫瘍コア法 (TC) で約1.0%, 複数の欠損モードで約1.0%を達成している。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:55:42 GMT)
Stochastic MeanFlow Policies: One-Step Generative Control with Entropic Mirror Descent [53.8] オンラインの非政治強化学習(RL)は、ポリシークラスと更新ルールの2つの選択肢によって構成されている。
我々は、MeanFlow変換を通じてノイズをアクションにマッピングする一段階生成ポリシークラスであるMeanFlow Policiesを提案する。
7つのMuJoCoベンチマークで、Sは1ステップの推論効率を維持しながら、ガウスおよび生成ベースラインを改善する。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:09:02 GMT)
JMed48k: A Multi-Profession Japanese Medical Licensing Benchmark for Vision-Language Model Evaluation [53.6] 本稿では,視覚言語モデルを評価するための医療ライセンスベンチマークであるJMed48kを紹介する。
JMed48kは、厚生労働省が発行した公式PDF資料から作成され、48,862件の試験質問と20,142件の画像を収録している。
JMed48k-Evalは,テキストのみの質問9,905件,画像による質問2,579件を含む12,484件の回答を得た。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:20:38 GMT)
Hy-MT2: A Family of Fast, Efficient and Powerful Multilingual Translation Models in the Wild [53.1] Hy-MT2は、高速な多言語翻訳モデルの一群である。
モデルサイズは1.8B、7B、30B-A3B(MoE)である。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:00:06 GMT)
Test-Time Training Undermines Safety Guardrails [53.0] テスト時間トレーニング(TTT)は、モデルが推論中にパラメータを適応できるようにする新しいパラダイムである。
TTTの3つの脅威モデルを特定し、攻撃者が安全フィルタをバイパスする方法を実証する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:27:06 GMT)
Next-Acceleration-Scale Prediction for Autoregressive MRI Reconstruction [52.3] MRI再建は本質的に不完全な逆問題である。
この制限は、再構成を離散的なマルチスケールの潜在空間に移動させ、自己回帰的次加速スケールの予測として機能させることによって解決する。
提案手法は,過度のアンサンプ下での多種多様なサンプリングパターンの再構成性能の向上を図っている。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:18:04 GMT)
Towards Clinically Interpretable Ophthalmic VQA via Spatially-Grounded Lesion Evidence [51.6] 今回我々はFundusGroundを紹介した。これは臨床的に解釈可能な眼科用VQAの空間的根拠を用いた新しいベンチマークである。
この構造された病変の証拠に基づいて、72,706の質問が4つのフォーマットにまたがって生成される。
実験により、病変レベルの視覚的エビデンスを組み込むことで、モデルの性能と透明性が一貫して向上することが示された。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:37:03 GMT)
Hidden-State Privacy Has an Empty Middle [51.6] すべてのフルランクガウス解放を$O(1)$ Fisher utility で表すと、マハラノビス信号が隠れた幅で直線的に成長する方向を認める。
スクラッチからトレーニングされたスプリットメモリトランスフォーマーは、[20, 33]$90MでG_mathrmMahに達し、固定言語損失ペナルティにおいて、30Mから1Bまでの同じ予算のGPTベースラインに対して6ドル~24ドルという優位性を維持する。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:12:09 GMT)
Accelerating Vision Foundation Models with Drop-in Depthwise Convolution [51.5] 我々は、注目ヘッドのドロップイン代替として機能する、効率的な奥行き畳み込みベースの層を導入する。
画像分類とセグメンテーションの両方のタスクにおいて,提案手法は性能劣化を最小限に抑えながら17~20%の推論高速化を実現している。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:07:23 GMT)
Learning to Foresee: Unveiling the Unlocking Efficiency of On-Policy Distillation [51.2] OPDの効率は、トレーニングの初期段階において最終モデルに向けた安定的な更新軌道を確立する、フォレスト・オブ・ザ・イヤーズ(foresight')の形式に起因している、と我々は主張する。
我々は、外挿ステップのサイズを適応的に選択し、現在の更新方向に沿って移動することにより、OPDを高速化するプラグイン・アンド・プレイ・アクセラレーション手法である textbfEffOPD を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:50:47 GMT)
Cambrian-P: Pose-Grounded Video Understanding [51.1] フレーム単位の学習可能なカメラトークンとポーズ回帰ヘッドを備えたビデオMLLMであるCambrianPを紹介する。
入念に設計したサンプリング手法により,空間推論ベンチマークにおいてかなりの利得が得られる。
驚くべきことに、ワイルドビデオにおける擬似アノテーション付きポーズのトレーニングは、一般的なビデオQAベンチマークをさらに改善する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:59:45 GMT)
Imagine2Real: Towards Zero-shot Humanoid-Object Interaction via Video Generative Priors [51.1] 高忠実度3Dデータの不足により,全体Humanoid-Object Interaction (HOI) がボトルネックとなる。
本研究では,ゼロショットHOIフレームワークであるImagine2Realを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:15:39 GMT)
Lost in Tokenization: Fundamental Trade-offs in Graph Tokenization for Transformers [51.0] グラフ・ツー・トケン写像の選択は変換器の表現性の基本成分であることを示す。
既存の多くのグラフトークン化のためのビルディングブロックとして機能する3つのトークン化(スペクトル、ランダムウォーク、隣接トークン化)について検討する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:32:20 GMT)
EventGait: Towards Robust Gait Recognition with Event Streams [50.9] イベントカメラは、マイクロ秒時間分解能と高ダイナミックレンジを提供し、自然にロバストなダイナミックキューをキャプチャし、静的ノイズを抑制する。
イベントの利点を保ちながら、動きと形状を別々にモデル化する、エンドツーエンドのデュアルストリームフレームワークである textbfEventGait を提案する。
当社のアプローチでは,イベント駆動歩行分析の堅牢性と可能性を強調し,合成および実世界の歩行ベンチマークに新たな技術状況が設定されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:12:04 GMT)
Learnability-Informed Fine-Tuning of Diffusion Language Models [50.4] 拡散言語モデル(DLM)のための効率的なSFTベースのポストトレーニングアルゴリズムであるLIFTを提案する。
LIFTは、ほとんどの入力がマスクされ、より多くのコンテキストが利用可能になったときに、簡単なトークンを学習し、異なる拡散時間ステップで利用可能な情報とトレーニングを整合させる。
その結果,LIFT は既存の SFT ベースラインを6つの推論ベンチマークで上回り,AIME'24 と AIME'25 の3倍に向上した。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:16:17 GMT)
EasyVFX: Frequency-Driven Decoupling for Resource-Efficient VFX Generation [50.2] EasyVFXは、厳密な制約の下で現実的な視覚効果合成を実現するフレームワークである。
我々は、EasyVFXが構造的に一貫性があり、視覚的に素晴らしい効果をもたらすことを示し、周波数認識学習がプロ級のVFXを民主化するための重要な触媒であることを証明した。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:38:22 GMT)
DecQ: Detail-Condensing Queries for Enhanced Reconstruction and Generation in Representation Autoencoders [50.0] 表現オートエンコーダ(RAE)は、凍結した視覚基盤モデル(VFM)をトークン化器エンコーダとして利用する。
対照的に、微調整による再構成指向信号の統合は、事前訓練された意味空間を妨害し、生成的忠実度を低下させる。
本稿では,RAEの簡易かつ効果的なフレームワークであるDecQを提案する。具体的には,中間的VFM特徴から微細な情報を抽出する軽量な詳細化クエリを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:34:04 GMT)
OPERA: An Agent for Image Restoration with End-to-End Joint Planning-Execution Optimization [50.0] OPERAは、復元計画とツール実行をエンドツーエンドで共同で最適化するフレームワークである。
OPERAは、多種多様な複雑な劣化シナリオにおいて、オールインワンの復元モデルと既存のエージェントベースのメソッドの両方を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:40:25 GMT)
The Secretary Problem with a Stochastic Precursor [49.5] 本稿では,到着時刻のみから,予測が有用であることを示す。
我々は,前駆体を付加した基本秘書問題,すなわち,最良項目よりも遅く到着することが保証されるコンテンツフリー信号について検討する。
ランダムオーダーモデルと逆オーダーモデルにおいて最適ポリシーを特徴付ける。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:56:09 GMT)
Hypergraph as Language [49.4] 大規模言語モデルのためのハイパーグラフネイティブアライメントフレームワークを提案する。
ハイパーグラフ構造の場合、既存のメソッドは複数のオブジェクトが同じ高次関係で結合されているというネイティブセマンティクスを保存するのに失敗することが多い。
また,Hyper-Alignはドメイン内およびゼロショット評価において,既存手法よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:09:48 GMT)
MotiMotion: Motion-Controlled Video Generation with Visual Reasoning [49.2] 本稿では,動作制御を次世代問題として再定義するフレームワークであるMotiMotionを紹介する。
因果的基盤とコモンセンスと一貫性のある相互作用を促進するために,学習不要な視覚言語推論手法を活用する。
動作の自然性をさらに向上するために,誘導強度を変調する信頼度を考慮した制御方式を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:59:36 GMT)
Safeguarding Text-to-Image Generative Models Against Unauthorized Knowledge Distillation [49.2] クローズドウェイト生成サービスのための単一パスでジェネレータベースの保護フレームワークであるWaveGuardを紹介する。
WaveGuardのセーフガードは、ユーザが指定した摂動予算の下で合成画像をリリースしている。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:50:50 GMT)
No Pose, No Problem in 4D: Feed-Forward Dynamic Gaussians from Unposed Multi-View Videos [49.0] NoPo4Dは、動的コンテンツ、マルチビュー入力、未知のカメラポーズを単一のパスで処理する最初のフィードフォワードシステムである。
4つのマルチビューダイナミックベンチマークでは、NoPo4Dはフィードフォワードベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:57:21 GMT)
Reducing Political Manipulation with Consistency Training [47.2] 大規模言語モデル(LLM)は、様々なセンシティブな文脈において、体系的な政治的バイアスを示す。
我々は、この現象を隠蔽的な政治的偏見と呼び、それが機能する7つのテクニックのカテゴリを特定します。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:32:40 GMT)
AesFormer: Transform Everyday Photos into Beautiful Memories [47.1] 我々は, 審美的写真再構成を, 構造的再構築による美的品質の向上として定式化する。
AesFormerは、画像編集から美的計画を切り離す2段階のフレームワークである。
AesFormerはAPRのパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:00:49 GMT)
EnCAgg: Enhanced Clustering Aggregation for Robust Federated Learning against Dynamic Model Poisoning [46.9] フェデレーション学習は、モデル中毒攻撃による脅威の増加に直面しており、プライバシを改善するためのアプリケーションに害を与えている。
本稿では,少数の良性クライアントを参照として活用する新しいロバストアグリゲーション手法を提案する。
本手法は, 動的中毒シナリオにおいて優れた忠実度と堅牢性を示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:56:26 GMT)
ARC-STAR: Auditable Post-Hoc Correction for PDE Foundation Models [46.7] ARC-STARは修正を3段階にまとめる: グローバルな修正器は広い解法バイアスを除去し、ブロックワイドな局所精錬器はポストグロバル残差を浄化し、展開時にはラベルフリースコアは計算予算の下でハイリスクなブロックに精算する。
ARC-STARは、10個のレギュラーセルにまたがる5つのフローベンチマークの中で、各セル上の生ポセイドンよりも少なくとも36倍の速度ロールアウト誤差を削減できる唯一の方法である。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:26:16 GMT)
SegCompass: Exploring Interpretable Alignment with Sparse Autoencoders for Enhanced Reasoning Segmentation [46.1] Segは、Sparse Autoencoderを活用して、明示的で解釈可能で微分可能なアライメントパスをフォージするエンドツーエンドモデルである。
この"ホワイトボックス"接続は、潜在クエリよりもかなりトレース可能で、テキストの読み出しよりも一貫性がある。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:59:39 GMT)
VDFP: Video Deflickering with Flicker-banding Priors [46.0] スマートフォンでデジタルスクリーンをキャプチャすることは、ハードウェアの同期ミスマッチにより、しばしば深刻なバンドリングを引き起こす。
既存のビデオ復元手法は、これらの構造化された周期的な輝度変動に苦しむ。
本稿では,VDFP (Video Deflickering with Flicker-banding Priors) を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:41:47 GMT)
RADAR: Defending RAG Dynamically against Retrieval Corruption [45.9] 既存の静的指向のディフェンスは、進化する脅威に対処し、動的設定で不当なストレージコストを発生させるのに苦労する。
本稿では,信頼性のある文脈選択をグラフベースエネルギー最小化問題としてモデル化するフレームワークであるRADARを提案する。
新たな動的データセットの実験では、RADARはストレージオーバーヘッドを最小限に抑えて、優れた堅牢性と応答品質を実現する。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:25:46 GMT)
Lens Privacy Sealing: A New Benchmark and Method for Physical Privacy-Preserving Action Recognition [45.9] RGBカメラベースの監視システムは、公共の安全と医療のための人間の行動認識を可能にする。
既存の方法は、データ取得時のプライバシ保護に失敗する、キャプチャ後アルゴリズムに依存している。
我々は、調整可能なフィルムでカメラレンズを物理的に隠蔽するシンプルなハードウェアソリューションであるLens Privacy Sealing (LPS)を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:01:47 GMT)
Towards a General Intelligence and Interface for Wearable Health Data [45.9] 本研究では,1兆分以上の未ラベルセンサ信号に基づいて,ウェアラブルヘルスの基盤モデルを提案する。
この集団スケールの表現は、ラベル効率のよい少数ショット学習と生成能力を有効化して、1日あたりのロバストな計量推定を行う。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:24:06 GMT)
Structured-Sparse Attention for Entity Tracking with Subquadratic Sequence Complexity [45.8] また, 大部分の質量は, 光遮断残余を有する局所ブロック対角近傍に集中していることが示唆された。
ブロック内相互作用を正確に保ち、還元されたシステムを介してブロック間相互作用を経路するリゾルペント型演算子のブロックワイズ評価を導出する。
本手法は,高密度演算子の精度に一致し,標準化された測定プロトコルの下で壁面時間を12~29%削減する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:35:48 GMT)
Thermo-VL: Extending Vision-Language Models to Thermal Infrared Perception [45.3] 視覚言語モデル(VLM)は、RGB画像から主に学習されるため、低照度で失敗することが多い。
トレーニング可能な熱エンコーダとテキスト誘導デュアルアテンション融合モジュールで冷凍したMomo-7Bバックボーンを増強する波長対応VLMであるThermo-VLを提案する。
実験では、熱のみとRGB+熱的推論タスクに強い効果を示し、急速条件付き多スペクトル核融合の価値を強調した。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:43:05 GMT)
GeoWeaver: Grounding Visual Tokens with Geometric Evidence before Scene Reasoning [45.2] マルチモーダルモデルは、幾何学情報分岐、3D対応の監視、推論段階の融合、ロングホライゾンメモリを含む。
これらのアプローチは通常、幾何学的手がかりをすべての視覚的トークン間の共有信号として扱う。
時間的推論のための表現的前提条件として幾何学を扱うフレームワークであるGeoWeaverを紹介する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:40:03 GMT)
How Many Different Outputs Can a Transformer Generate? [45.2] 我々は、変換器のアーキテクチャの特徴をほんの少しだけ活用して、出力できる異なるシーケンス数を正確に予測する方法を研究する。
我々は、プロンプトの長さに応じて上限を提供し、アーキテクチャやモデルのサイズをまたいで、10未満の要因まで厳密であることが実証的に示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:26:37 GMT)
A Robust Semantic Segmentation Pipeline for the CVPR 2026 8th UG2+ Challenge Track 2 [45.1] 本研究では,悪天候下での意味的セグメンテーション作業のための半教師付きセグメンテーションパイプラインを提案する。
我々の方法は外部データを用いることなく、WeatherProofデータセットにのみトレーニングされる。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:19:22 GMT)
EvoVid: Temporal-Centric Self-Evolution for Video Large Language Models [45.0] ビデオ大言語モデル(ビデオ-LLM)は、強化学習(RL)による映像推論において強力な能力を示した。
本稿では,ビデオLLMが生の無注釈ビデオから直接改善できる時間中心の自己進化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:00:35 GMT)
FashionLens: Toward Versatile Fashion Image Retrieval via Task-Adaptive Learning [44.9] FashionLensは、多様なクエリフォーマットと検索インテントをサポートする統合フレームワークである。
FashionLensは、さまざまな検索シナリオで最先端のパフォーマンスを実現し、目に見えないタスクに堅牢に一般化する。
U-FIREの実験では、FashionLensは様々な検索シナリオで最先端のパフォーマンスを達成し、目に見えないタスクにしっかりと一般化している。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:34:49 GMT)
EvoScene-VLA: Evolving Scene Beliefs Inside the Action Decoder for Chunked Robot Control [44.3] チャンクされた視覚言語アクション(VLA)ポリシーは、現在の視覚観察のみに各更新を条件付け、マルチステップロボット制御を予測する。
EvoScene-VLAを導入するために,制御コール間の永続的なアクション更新シーン状態について論じる。
31のRoboTwinタスクでは、EvoScene-VLAは、固定評価で87.2%から89.1%、ランダム評価で86.1%から88.5%に平均的な成功を上げた。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:19:17 GMT)
Automatic De-Quantization of Quantum Programs Using Constant Propagation [42.9] すべての量子演算は費用がかかるため、短期的なアルゴリズムにおける量子リソースの使用を最小限に抑えることが重要である。
本研究では、量子演算を可能な限り古典計算に非量子化することに焦点を当てる。
量子古典的定数伝播のためのハイブリッド状態モデルを形式化し、オープンソースのMQT Coreツールで最適化を実装し、ベンチマーク回路上で評価する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:21:11 GMT)
Entanglement-facilitated macroscopic cluster formation in quantum many-body dynamics [42.9] 初期状態の絡み合いは真の真空気泡の拡散を抑制し、マクロな連結クラスターを安定化させる。
本研究は, 初期準備とグローバルな構造物の保全の関連性を確立するものである。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:21:14 GMT)
Algebraic Machine Learning for Small-to-Medium Datasets Is Competitive against Strong Standard Baselines [42.0] 代数機械学習(Algebraic Machine Learning, AML)は、数値最適化ではなく、代数構造を間接的に分解することで学習する。
検証やクロスバリデーションを使わずにトレーニングデータのみをトレーニングしたAMLは、クロスバリデーションベースラインメソッドのファミリーよりも優れています。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:25:22 GMT)
TextSeal: A Localized LLM Watermark for Provenance & Distillation Protection [41.8] TextSealは、大規模な言語モデルのための最先端の透かしである。
Gumbel-maxサンプリングに基づいて、TextSealは出力の多様性を回復するためにデュアルキー生成を導入している。
投機的復号化やマルチトークン予測などの最適化もサポートしている。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:19:23 GMT)
CausalGuard: Conformal Inference under Graph Uncertainty [41.6] CausalGuardは、グラフ条件が二重に頑健な擬似アウトカムを集約した後、校正する構造重共役フレームワークである。
直接評価可能な目標に対して、名目90%以上の範囲を達成し、グラフに依存しない共形ベースラインが大きなパディングを必要とする場合、幅を小さくする。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:56:46 GMT)
Faithful-MR1: Faithful Multimodal Reasoning via Anchoring and Reinforcing Visual Attention [41.5] 検証可能な報奨付き強化学習(RLVR)は,大規模言語モデルにおける複雑な推論を促進するための有望なパラダイムとして登場した。
忠実なマルチモーダル推論の両面に対処するために,視覚的注意を固定し,強化するトレーニングフレームワークであるFithful-MR1を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:10:18 GMT)
Tailoring Teaching to Aptitude: Direction-Adaptive Self-Distillation for LLM Reasoning [41.4] 我々は,一様教師模倣からエントロピー制御された指向性監視へと特権的な自己蒸留を再構成するtextbfDirection-Adaptive Self-Distillation (textbfDASD)を提案する。
6つの数学的推論ベンチマークで、DASDは強力なRLVRと自己蒸留ベースラインよりも優れたマクロAvg@16を達成する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:07:46 GMT)
Abstraction for Offline Goal-Conditioned Reinforcement Learning [40.9] 本稿では、相対化オプションを学習し、絶対的な参照フレームから抽象化するアルゴリズムを2つ導入する。
実験の結果,このような帰納バイアスはオフラインのゴール・コンディション強化学習のパフォーマンスを著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:50:26 GMT)
Harder to Defend: Towards Chinese Toxicity Attacks via Implicit Enhancement and Obfuscation Rewriting [40.6] 制御されたレッドチーム評価および防衛データ生成フレームワークである中国インプリシト毒性攻撃(CITA)を紹介する。
CITAは、有害な意図を保ち、暗黙性を高め、制御された表面の変種を追加するために、(i)有害なIntent Learning、(ii)Implicit Toxicity Enhancement、(iii)難解なVariant Rewritingという3つの段階を使用する。
CITAが生成した評価サンプルでは、試験された7つの検出器は重大なミス検出リスクを示し、平均的なASRは69.48%に達した。
下流防衛の応用として、我々は中国極端毒性防衛モデルを微調整する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:01:03 GMT)
The Distillation Game: Adaptive Attacks & Efficient Defenses [40.6] 蒸留攻撃はモデルプロバイダのデプロイメントトレードオフを生み出す。
実用性に制約のある教師と適応的な学生とのミニマックスゲームを通して、このトレードオフを研究する。
以上の結果から, 強い蒸留は止まらないことが示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:09:21 GMT)
GEMQ: Global Expert-Level Mixed-Precision Quantization for MoE LLMs [40.5] 混合精度量子化は、その重要性に基づいて、専門家のビット幅を割り当てることで、メモリオーバーヘッドを軽減する。
既存の手法は、量子化によって誘導されるレイヤワイドな重要度推定とオーバルックルータシフトに依存している。
我々はこれらの制限を克服するために,グローバルエキスパートレベル混合精度量子化(GEMQ)を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 22:23:38 GMT)
Market-Analysis-Driven Methodology for Assessing Charging Station Cybersecurity [40.5] 本稿では,局のサイバーセキュリティを国家レベルで評価するための,スケーラブルで外挿に基づく手法を提案する。
市場分析では、オペレーターと製造業者のペアを特定し、フィールドテスト用の充電ステーションのターゲット選択を可能にし、その結果を同じ組み合わせを共有するすべてのステーションに外挿することができる。
これは、我々の範囲で充電ステーションの27.4%しかTLSが保護する通信を提供していないことを示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:22:20 GMT)
From Snapshots to Trajectories: Learning Single-Cell Gene Expression Dynamics via Conditional Flow Matching [40.5] 単セルフローマッチング (ScFM) は結合分解フローマッチングに基づく遅延生成フレームワークである。
scFMは、時間的および時間的コヒーレントな可視化のための分布予測性能を一貫して改善する。
scFMはより正確な軌道再構成と、中間点が欠落している時間的コヒーレントな可視化をもたらす。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:26:19 GMT)
Translating Signals to Languages for sEMG-Based Activity Recognition [40.3] LLM-sEMG は,大規模言語モデルを sEMG アクティビティ認識器として活用する新しいフレームワークである。
本研究では,連続的なsEMG配列をsEMG言語に変換する言語指向マッピング機構を設計する。
大規模言語モデルを用いて,SEMG信号に基づく行動認識を高精度に行うことの実証実験を行った。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:31:47 GMT)
Active Defense Against False Data Injection Attacks in Robotic Manipulators [39.8] 本稿では,有限水平False Data Injection Attacks (FDIA) に対するマニピュレータの弾力性について述べる。
仮想ダンピングとマニピュラビリティの低減という2つの防衛法を定式化し、タスク実行の確率的保証を与える。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:18:37 GMT)
EvoIR-Agent: Self-Evolving Image Restoration Agentic System via Experience-Driven Learning [39.6] マルチモーダル大言語モデル(MLLM)による画像復元は,分解結合シナリオの有効性を示す。
トレーニングベースのメソッドは、固有の経験をパラメータに組み込んで、高い推論効率を実現するが、新しいツールや分解との互換性に欠ける。
EvoIR-Agentは、まず、トレーニング不要の画像復元エージェントの経験成分を体系的に定式化する。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:14:25 GMT)
Action with Visual Primitives [39.6] VLA(Vision-Language-Action)モデルは、汎用的なロボット操作のための有望なパラダイムとして登場した。
AVP(Action with Visual Primitives)は、このビジュアルプリミティブ中心のインターフェースを実装したエンドツーエンドアーキテクチャである。
AVP は pi_0.5 よりも 27.61% 向上し,近年の手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:52:47 GMT)
EmoTrack: Robust Depression Tracking from Counseling Transcripts across Session Regimes [39.2] シングルセッションおよびマルチセッション体制におけるカウンセリング書面からの堅牢な抑うつ追跡について検討した。
EmoTrackは、LPM抽出された臨床信号と凍結したターンレベルのセマンティック埋め込みを組み合わせたPHQ-8予測フレームワークである。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:37:45 GMT)
The efficiency-gain illusion: People underestimate the rate of AI use and overestimate its benefits on simple tasks [39.1] 認知学的に単純なタスクにAIを使う傾向について検討し、その信頼性が十分に評価されているかどうかを評価する。
たとえ効率が悪くても、AIを使う人が多いことがわかりました。
我々の結果は、AIを使うかどうかという人々の選択のメカニズムとバイアス、および過度なフィードバックループのリスクを浮き彫りにした。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:28:20 GMT)
$E^3$-Agent: An Executable and Evolving Agent for Resource Management of Edge Generative Inference [39.0] E3$-Agentは、エッジ人工知能生成コンテンツ(AIGC)リソース管理のための進化的エージェントである。
Agentは実行時のフィードバックからオンラインで学び、未知の時間変化のサービスタイムマッピングに継続的に適応する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:32:43 GMT)
Proxy-Based Approximation of Shapley and Banzhaf Interactions [38.5] シェープリーとバンジャフの相互作用は、現代の機械学習アプリケーションに固有の複雑なダイナミクスを捉えている。
これらの高次相互作用の現在の推定器は、速度と精度をトレードオフする。
ProxySHAPは、木ベースのプロキシモデルの高サンプリング効率を、一貫性への原則的なパスで調整する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:09:45 GMT)
World Machine: Towards Generative World Modeling for Time-Series [38.0] 本稿では,時系列の生成的世界モデリングアーキテクチャであるWorld Machineを紹介する。
遅延状態を持つトランスフォーマーベースのアーキテクチャで、異なる量の観測データやコンテキストへの適応を可能にする。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:48:51 GMT)
MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems [37.8] MOSSは、生産エージェント基板上でソースレベルで自己書き換えを行うシステムである。
平均成績は0.25から0.61に上昇し、人間の介入なしに1サイクルで上昇する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:48:33 GMT)
SciCore-Mol: Augmenting Large Language Models with Pluggable Molecular Cognition Modules [37.7] SciCore-Molは、離散言語記号とトポロジカル分子または連続反応データの間のギャップを埋めるモジュラーフレームワークである。
SciCore-Molは, 分子理解, 生成, 反応予測, 一般化学知識にまたがる包括的性能を実現する。
この研究は、切り離された、プラグ可能な、柔軟に編成されたモジュールを通じて、大規模言語モデルに科学的専門知識を持たせるための体系的な青写真を提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:37:53 GMT)
Millimeter-wave Imaging for Anthropometric Body Measurement [37.5] 人間の3次元形状を復元し,mmWaveデータから人文計測を抽出するための,新しい最適化フレームワークを提案する。
本手法では, パラメトリックボディーモデル(SMPL)を雑音の多いミリ波点雲に直接適用する重み付き登録パイプラインを提案する。
さらに,足場平面制約を組み込むことで適合性を安定化し,SMPLパラメータを直接最適化する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:55:31 GMT)
Uniform-in-Time Weak Propagation-of-Chaos in Shallow Neural Networks [37.5] 我々は、$|f__tMF-f_hat_tm|2 lesssim textpoly(d/)$ニューロン、トレーニングサンプル、GDステップに対する一様時間境界を求める。
平均場、人口移動の収束速度が$t-2$よりも速くなると、$textpoly(d/)$ニューロン、トレーニングサンプル、GDステップで$$が失われる。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:14:19 GMT)
MoSA: Motion-constrained Stress Adaptation for Mitigating Real-to-Sim Gap in Continuum Dynamics via Learning Residual Anisotropy [37.2] MoSAは、運動に制約のあるストレス適応フレームワークである。
残留応力演算子を学習し、軽度の異方性と不均一性を捉える。
物理的に意味のある残留異方性を学ぶ一方で、精度、一般化、堅牢性が向上する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:13:49 GMT)
Learning Causal Orderings for In-Context Tabular Prediction [37.2] 本稿では,トポロジカルな変数順序の形で因果構造を推論し,強制する方法を検討する。
我々のモデルであるTabOrderは、学習された因果順序の下でターゲットに先行する特徴のみに基づいて、因果順序制約付き注意を用いた。
因果探索法と同様に、TabOrderは確率に基づく目的を通じて教師なしの方法で最適な変数順序付けを学習する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:22:56 GMT)
Sibyl-AutoResearch: Autonomous Research Needs Self-Evolving Trial-and-Error Harnesses, Not Paper Generators [37.1] 我々はScientific Trial-and-Error Harnessesを中心に構築された自己進化型AutoResearchフレームワークであるSibyl-AutoResearchを紹介した。
ハーネスは、エージェントが有界なトライアルを実行し、肯定的な結果と否定的な結果を保持し、後続の計画、検証、クレームスコープ、スケジューリング、批判、執筆、修復に教訓を導いてくれる。
SIBYLはファイルベースの自律的な研究システムで、状態、役割、メモリ、ゲート、アーティファクトトレースを公開して変換パスを検査する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:29:08 GMT)
ACC: Compiling Agent Trajectories for Long-Context Training [37.0] Agent Context Compilationは、検索、ソフトウェアエンジニアリング、データベースクエリエージェントからのトラジェクトリを、長いコンテキストのQAペアに変換する。
ACCはシンプルだが効果的なアプローチであり、既存のロングコンテキスト拡張やトレーニングメソッドと組み合わせることができる。
論文参考訳(メタデータ) (Thu, 21 May 2026 00:47:03 GMT)
Scene Reconstruction as Mapping Priors for 3D Detection [36.9] 本稿では,2つの主要な課題を克服して3次元検出を改善するために,マッピングを活用するスケーラブルなソリューションを提案する。
まず、集約されたセンサデータから高密度マッピングを自動構築するパイプラインを導入し、人間のラベル付けの必要性を解消する。
第2に,センサモードの異なるマッピング先行を効果的に統合する,新しいマッピング先行3次元検出フレームワークを設計する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:52:22 GMT)
REACH: Hand Pose Estimation from Room Corners [36.8] 遠隔地から人の手の形状やポーズを正確に再現できる新しい3Dハンドポーズ推定器を提案する。
私たちのキーとなるアイデアは、身体のコーディネーション、時間的進行、多視点観察を十分に活用することです。
我々のモデルであるREACH-Netは,遠方からの高精度な3次元ポーズ推定を実現する。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:32:18 GMT)
Live Music Diffusion Models: Efficient Fine-Tuning and Post-Training of Interactive Diffusion Music Generators [36.6] 消費者ハードウェア上でアクセス可能な対話型モデルに音声拡散モデルを効率的に再利用できるかどうかを検討する。
本稿では,再生した再生拡散過程を簡易に修正したLive Music Diffusion Models (LMDMs)を提案する。
本稿では,テキスト条件付き生成,スケッチベース音楽合成,ジャミングなど,多くの創造領域におけるLMDMの適用例を示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:54:07 GMT)
Echo4DIR: 4D Implicit Heart Reconstruction from 2D Echocardiography Videos [36.0] 本研究では,新しいテスト時間4D暗黙的再構成フレームワークであるEcho4DIRを提案する。
我々は,心臓条件付きSDFを用いて,統計的形状モデル(SSM)から頑健な3次元形状を学習する。
我々は、Echo4DIRが最先端の4D心筋メッシュ再構築を実現していることを示し、特に98.35%のDiceと96.75%のIoUの臨床的重複が顕著である。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:01:23 GMT)
Molecular Lead Optimization via Agentic Tool Planning [35.7] 鉛最適化は、初期のヒット化合物を有効な薬物候補に変換する上で重要な役割を担っている。
人工知能の最近の進歩は、薬物発見の様々な側面を加速させるという約束を示している。
分子リード最適化のためのトラジェクトリ対応LCM推論剤TRACEを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:12:19 GMT)
Pelican-Unify 1.0: A Unified Embodied Intelligence Model for Understanding, Reasoning, Imagination and Action [35.3] Pelican-Unify 1.0は、統一の原則に従って訓練された最初の基礎モデルである。
単一のVLMを統一理解モジュールとして使用し、シーン、指示、視覚的コンテキスト、アクション履歴を共有意味空間にマッピングする。
単一のチェックポイントで、Pelican-Unify 1.0は3つの機能にまたがって強力なパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:50:35 GMT)
Sensor2Sensor: Cross-Embodiment Sensor Conversion for Autonomous Driving [35.1] 自律運転システム(ADS)のロバストなトレーニングと検証には、膨大な多様なデータセットが必要である。
ダッシュカムのような情報源のデータは、膨大なスケールと多様性を提供し、重要なロングテールのシナリオや新しい環境を捉えている。
本研究では,シーン内ダッシュカム映像を高忠実なマルチモーダル・センサ・スイートに変換する新しい生成モデリングパラダイムであるSensor2Sensorを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:57:17 GMT)
Reinforced Preference Optimization for Reasoning-Augmented Recommendations [35.0] 本稿では、Recommenderシステムのための強化された優先最適化フレームワークRPORecを紹介する。
RPORecは、LPMバックボーンの推論能力を、アイテムの正確な検索のために専用のレコメンデーションヘッド(Rechead)と統合する。
公開ベンチマークと大規模オンラインデプロイメントに関する大規模な実験は、RPORecが最先端のLLMベースのレコメンデーションメソッドを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:56:42 GMT)
Reasoning through Verifiable Forecast Actions: Consistency-Grounded RL for Financial LLMs [34.9] 本発表では、株価予測と財務的理由を検証可能な予測行動を通じて統合する、時系列のLLMであるStockR1を紹介する。
ツールコール設計に基づいて、モデルはまず、定性的市場展望の構造的かつ解釈可能な表現である予測アクションを出力する。
そこでは、回答の妥当性、予測精度、生成したアクション間の一貫性と観察された時系列のダイナミクスを共同で反映する。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:09:16 GMT)
Pointwise Metrics Mislead: An Evaluation Protocol for Multimodal Inverse Problems [33.7] マルチモーダル後部における逆問題に対して,低い誤差がより良い再構成を意味するという暗黙の仮定が構造的に失敗することを示す。
本稿では,各ステップがフェールモードを目標とし,他のステップが見逃すような3部評価プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:30:33 GMT)
Behavior-Consistent Deep Reinforcement Learning [33.6] 強化学習(Reinforcement Learning, RL)は、トレーニング実行中に高いばらつきを示し、信頼性の低いパフォーマンスをもたらす。
本研究では,行動整合性RLの問題を定式化することで,横断的政策分岐の課題に対処する。
QED(Q$-value expectile Disagreement)は,クロスラン不一致のための単一実行プロキシとして二重批判不一致を用いた状態依存型温度スケジュールである。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:30:53 GMT)
SpaceDG: Benchmarking Spatial Intelligence under Visual Degradation [33.6] 劣化認識型空間理解のための最初の大規模データセットであるSpaceDGを紹介する。
SpaceDG-Benchは、11の推論カテゴリと9の視覚的劣化タイプにまたがる1,102の質問で、10KのVQAインスタンスを出力するベンチマークである。
本研究では,SpaceDGの微調整により,劣化強度が著しく向上し,劣化条件下での人体性能を上回り得ることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:25:15 GMT)
Spatial Memory for Out-of-Vision Manipulation in Vision-Language-Action [33.5] 本稿では,ビジョン・ランゲージ・アクション(VLA)モデルにおける視覚外操作のための空間記憶フレームワークであるSOMAを紹介する。
このフレームワークは、空間記憶構成、動的記憶再構成、コンテキスト記憶検索の3つのコンポーネントで構成されている。
我々はSOMAをマルチステップとデュアルアームのシナリオを含む5つの現実的外界操作タスクで評価する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:32:53 GMT)
SeqLoRA: Bilevel Orthogonal Adaptation for Continual Multi-Concept Generation [33.3] 制約付き連続学習フレームワークであるSeqLoRAを提案する。
データからLoRA基底を学習することで、凍結基底法よりも残差干渉エネルギーを効果的に抑えることが証明された。
マルチコンセプト画像生成の実験では、SeqLoRAは最大101のコンセプトでアイデンティティの保存とスケーラビリティを改善している。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:13:49 GMT)
Feature Learning in Linear-Width Two-Layer Networks: Two vs. One Step of Gradient Descent [33.0] 線形幅構造内の2層ニューラルネットワークにおける特徴学習について検討する。
初期段階の進化を特徴付けることにより,最適化と特徴学習現象学を研究するための抽出可能な枠組みを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:45:44 GMT)
Maestro: Reinforcement Learning to Orchestrate Hierarchical Model-Skill Ensembles [32.5] 強化学習駆動オーケストレーションフレームワークであるMaestroを紹介します。
Maestroは、階層的なモデルスキルレジストリ上でのシーケンシャルな意思決定プロセスとして、異質なマルチモーダルタスクを再構成する。
数学的推論,チャート理解,高分解能知覚,ドメイン固有分析を対象とする10の代表的なマルチモーダルベンチマークに対して,Maestroの評価を行った。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:47:49 GMT)
SWE-Mutation: Can LLMs Generate Reliable Test Suites in Software Engineering? [32.4] プログラム修復軌道の合成や強化学習における正確なフィードバック信号の提供にはテストスイートが不可欠である。
LLM生成テストスイートを評価するベンチマークであるSWE-Mutationを紹介する。
複雑な突然変異を自動生成するエージェント型言語に依存しないフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:45:50 GMT)
Matching with Deliberation: Test-Time Evolutionary Hierarchical Multi-Agents for Zero-Shot Compositional Image Retrieval [32.4] Zero-Shot Compositional Image Retrieval (ZS-CIR)は、参照画像の視覚的連続性を保存することと、修正テキストで指定されたセマンティック変数を忠実に実行することの両方を必要とする。
本稿では, 自己進化とテスト時間スケーリング法(TTS)を初めてZS-CIRに導入した, ワンストップ階層型パーセプション・ツー・ディリベレーションフレームワーク(PDF)を提案する。
本研究では、経験駆動型自己進化とTSは、ゼロショットの微細なマルチメディア検索を実現するための、非常に有望でスケーラブルな経路であることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:36:38 GMT)
Remote Teleoperation of Endovascular Intervention Robots: A Systematic Review [32.3] 本研究の目的は,遠隔操作型血管内ロボットシステムに関する証拠を確定することであった。
機械式または電磁式で駆動される遠隔操作カテーテルとガイドワイヤは、最大7000kmの距離を移動可能であることがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:38:11 GMT)
Generative Conversational Recommender System [32.1] 本稿では,単一の自己回帰フレームワーク内でのレコメンデーションとダイアログ生成を統一する,完全生成型対話レコメンデーションシステムを提案する。
我々のメソッドはリコメンデーション性能を継続的に改善し、強力なベースライン上でRecall@1で最大29%のゲインを達成する。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:36:37 GMT)
Visual-Advantage On-Policy Distillation for Vision-Language Models [32.1] ビジュアル・アドバンテージ(VA)は、教師が詳細なビジュアルディテールにアクセスせずに学生が生成したロールアウトを得点した場合、トークンレベルのログ確率差である。
VA-OPDは、各ベンチマークにおける標準的なオンライン蒸留よりも改善され、教師サイズとデータスケールの両方の軸に沿って単調に上昇する。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:48:36 GMT)
LatentOmni: Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning [32.0] 自己回帰生成と互換性を維持しつつ、高密度な感覚情報を保存するため、統合された潜伏空間は、そのような推論のためのより良い媒体である、と我々は主張する。
この知見に基づいて,テキスト推論と音声視覚的潜在状態の相互関係を持つクロスモーダル推論フレームワークである textbfLatent Omni を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:18:57 GMT)
Efficient Agentic Reasoning Through Self-Regulated Simulative Planning [31.8] 意思決定による効果的なエージェント的メリットを3つのシステムに分けて論じる。
自己統制(Self-regulation)は、エージェントが自身の学習と適応をどのように管理するかの計画を超えて、私たちが期待する原則をインスタンス化する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:11:54 GMT)
ThoughtTrace: Understanding User Thoughts in Real-World LLM Interactions [31.7] ThoughtTraceは、現実世界のマルチターンヒューマン-AI会話とユーザの自己報告された思考を組み合わせた最初の大規模データセットである。
ThoughtTraceには1,058のユーザ、2,155の会話、17,058のターン、10,174の思考アノテーションが20の言語モデルで収集されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 22:24:42 GMT)
Decomposing and Measuring Evaluation Awareness [31.2] 本研究では,社会心理学における評価意識を環境成分とモデル成分に分解する。
環境コンポーネントをプレースホルダーエンティティやグレーディングスタイルの出力フォーマットなど,8つの分類されたトリガーファクタを通じて運用する。
bftextEvalAwareBenchは,100対の安全機能タスクの因子制御ベンチマークである。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:38:34 GMT)
Integrating Chain-of-Thought into Generative Retrieval: A Preliminary Study [31.2] ThinkGRは、チェーン・オブ・シークレットとドシド生成をインターリーブする統合フレームワークであり、単一の生成プロセス内で反復的な思考と検索を可能にする。
4つのマルチホップ検索ベンチマークの実験では、ThinkGRは最先端のパフォーマンスを平均で+6.86%向上した。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:48:35 GMT)
DriveMA: Rethinking Language Interfaces in Driving VLAs with One-Step Meta-Actions [31.0] 本稿では,一段階の簡潔なメタアクションが冗長推論の代案として有用であることを示す。
本稿では,アクション中心型教師付きトレーニングとターンレベルクレジットアサインメント強化学習フレームワークを組み合わせたDriveMAを提案する。
DriveMAは2Bモデルでエンド・ツー・エンド・ドライブ・チャレンジ(End-to-End Driving Challenge)の新たな最先端を達成し、Rater Feedback Score (RFS)は8.060に達し、4Bバージョンでは8.079に改善されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:58:08 GMT)
Diffusion-guided Generalizable Enhancer for Urban Scene Reconstruction [30.4] 都市景観再構築のための新しい拡散誘導型一般化エンハンサーGenReを提案する。
GenReは、様々なシーンにまたがって生成前駆体を蒸留することを学ぶことで、堅牢で高忠実な表現を効率的に生成する。
実験により、GenReは、品質と効率の両方で既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:41:39 GMT)
The Implicit Bias of Depth: From Neural Collapse to Softmax Codes [29.9] 入力を正規化せずに訓練したディープ線形ネットワークと等価なディープ非拘束特徴モデル(UFM)について検討する。
深度は暗黙の低ランクバイアスを誘発し、NCに対する低ランクの代替を促進させることを示す。
いくつかの効果は反対方向に作用し、ランダムなネットワークの場合、高階の解に対する幅のトレーニングが増加する。
論文参考訳(メタデータ) (Thu, 21 May 2026 22:37:25 GMT)
A Large-Scale Dataset and Benchmark: Do Protein-Ligand Models Learn Binding Sites or Just Binding Likelihood? [29.6] 約100kのタンパク質-リガンドペアからなる大規模タンパク質-リガンドデータセットであるInteractBindを紹介した。
中心となるきめ細かいタスクは、バインディングサイトローカライゼーションである。
我々は,既存の8つのシーケンスベースおよび相互作用認識モデルを評価し,バイナリ結合予測と結合部位の局所化を評価する。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:50:03 GMT)
Self-Supervised ConvLSTM for Fermi Large Area Telescope Transient Detection [29.6] 本稿では,フェルミ・LAT空の終端シミュレーションと自己教師型深層学習を組み合わせることにより,制御環境における過渡ガンマ線現象を検出する枠組みを提案する。
我々は、gtobssimで10年間の合成ユニバースを生成し、シミュレーションされた事象を日次全天的な露出数マップに処理する。
時間的依存関係を学習しながら空間的局所性を保ちながら,シーケンスマップのシーケンスを直接操作するConvLSTMネットワークを採用している。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:45:54 GMT)
Atom-level Protein Representation Learning Improves Protein Structure Prediction [29.2] TriProRepは、3つのアライメントされた残差レベルのビューを共同でモデル化する構造対応事前学習手法である。
TriProRepは、ジェネレータが破損したビューからオリジナルのトークンを復元する事前トレーニングによって、可視だが間違ったクロスビュー拡張を区別することを学ぶ。
RepSPは構造予測設定におけるタンパク質表現の評価のためのベンチマークである。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:07:36 GMT)
Bernini: Latent Semantic Planning for Video Diffusion [29.0] 本稿では,映像生成と編集のための統合フレームワークBerniniを提案する。
MLLMベースのプランナは、ViT埋め込み空間内でターゲットセマンティック表現を直接予測する。
Berniniは、幅広いビデオ生成と編集ベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:30:29 GMT)
SDGBiasBench: Benchmarking and Mitigating Vision--Language Models' Biases in Sustainable Development Goals [28.7] 持続可能な開発目標に向けた進捗の評価には、視覚的手がかり、文脈的知識、開発指標に対する多段階の推論が必要である。
既存のベンチマークは通常、これらの側面を分離して評価し、モデルが証拠の代わりに先行する時に現れる体系的なバイアスを無視する。
視覚言語推論のための大規模ベンチマークスイートであるSDGBiasBenchを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:44:54 GMT)
FUSE: A Framework for Unified State Estimation in Vehicular and Robotic SLAM Systems [28.5] FUSEは、車両およびロボットSLAMシステムにおける統一状態推定のためのフレームワークである。
LiDAR-IMUのインスタンス化は、混合レートセンシングおよび方向性縮退下でのフレームワークを調べるために開発された。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:55:42 GMT)
ACE: Self-Evolving LLM Coding Framework via Adversarial Unit Test Generation and Preference Optimization [28.5] ACEは、ソルバ・アドバイザリーアーキテクチャに基づく自己進化型コード生成フレームワークである。
実行中心の監視を通じて、アクティブな障害発見を優先する。
ACEは強いソルバよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:01:21 GMT)
Mixture of Complementary Agents for Robust LLM Ensemble [28.2] 大規模言語モデル(LLM)のアンサンブルや議論のようなマルチAIコラボレーションは、情報収集とパフォーマンス向上のための有望なパラダイムである。
既存のアプローチは、主に正確性(最強のモデルを選ぶ)または多様性(多様性の保証)に焦点を当てています。
我々は、LLMの値が他と相補関係にある特徴選択に類似した選択問題として、提案者選択を再設定する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:29:05 GMT)
The Illusion of Reasoning: Exposing Evasive Data Contamination in LLMs via Zero-CoT Truncation [28.2] 大規模言語モデル(LLM)は、幅広いタスクにまたがる印象的な推論能力を示している。
データ汚染はこれらの能力の客観的評価を損なう。
現在のアプローチは、このようなステルス性の汚染を確実に検出するのに苦労している。
そこで我々はZero-CoT Probe (ZCP) を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:06:19 GMT)
Measuring Security Without Fooling Ourselves: Why Benchmarking Agents Is Hard [27.6] セキュリティ評価を損なう3つの課題について説明する。
これには、ベンチマークの脆弱性、時間的安定性、実行時の不確実性などが含まれる。
次に、より堅牢で信頼性の高い評価フレームワークを構築するための実践的な方向性を概説する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:47:54 GMT)
GenHAR: Generalizing Cross-domain Human Activity Recognition for Last-mile Delivery [27.5] GenHARは、ドメイン不変のセンサー表現を学習することで、ドメインギャップを軽減するために設計されたフレームワークである。
我々は、実世界の人間の活動データセット上で、GenHARを最先端のHAR手法と比較することにより、GenHARの体系的解析を行う。
その結果、GenHARは最先端の手法を9.97%精度で上回り、浮動小数点演算を6.4倍に削減した。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:27:22 GMT)
Case-Aware Medical Image Classification with Multimodal Knowledge Graphs and Reliability-Guided Refinement [27.4] 本稿では,マルチモーダルな知識グラフを用いた症例認識推論を行い,説明可能な医用画像診断を行うフレームワークを提案する。
入力画像が与えられた場合,適応的に検索した類似事例からマルチモーダル知識グラフを構築する。
複数の医用画像データセットの実験は、我々のアプローチが強いベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:29:20 GMT)
Echo: Learning from Experience Data via User-Driven Refinement [27.4] エージェントと環境間のインタラクションである"経験データ"からの継続的な学習は、障壁を超越することを約束します。
生体験から学習可能な知識への移行を運用するために設計されたフレームワークであるEchoを紹介する。
Echoはこのパイプラインを効果的に活用し、受入率を25.7%から35.7%に増やすことで、静的パフォーマンスの天井を破ることを示した。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:34:00 GMT)
PEMark: Watermarking API Responses Based on Proxy Gateways and Position Encoding [27.3] APIレスポンスは、完全に規制されていないことが多いため、簡単に悪用できる。
一般的な解決策の1つは、トレーサビリティのためのAPIレスポンスに透かしを埋め込むことである。
既存の透かし方式では、しばしばデータベースの内容やAPIレスポンスデータを変更する必要がある。
これはビジネスシステムコードの変更を強制し、データ値が変更されるため、通常のビジネス操作を妨害する可能性がある。
本稿では,透かしプロキシゲートウェイとPEMarkをベースとした,プラグイン可能な独自の透かし方式を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:21:40 GMT)
VideoOdyssey: A Benchmark for Ultra-Long-Context and Omni-Modal Video Understanding [27.3] VideoOdysseyは、ウルトラロングコンテキストとオムニモードのビデオ理解のためのベンチマークである。
11のドメインと54のサブカテゴリにまたがっており、平均ビデオ時間は109分である。
さまざまなコンテキストの長さと認知的負荷のモデルを評価するための総合的な診断ツールを提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:00:22 GMT)
GraphFlow: A Graph-Based Workflow Management for Efficient LLM-Agent Serving [27.3] GraphFlowは、2つのキーデザインを通じてエージェントに効率的に統合するシステムである。
常に最先端の手法を上回り、平均性能は4.95ポイント向上した。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:45:40 GMT)
Swift Sampling: Selecting Temporal Surprises via Taylor Series [27.2] 我々は、エレガントでトレーニング不要なフレーム選択アルゴリズムであるSwift Smplingを紹介する。
ビデオ内の高情報モーメントを自動的に識別する。
フレーム予算が限られている長いビデオでは特に強力で、精度を最大+12.5ポイント向上させる。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:20:31 GMT)
Evolutionary Multi-Task Optimization for LLM-Guided Program Discovery [26.3] LLM誘導プログラム探索のための進化的マルチタスク最適化(EMO)を提案する。
EMO-STA(Shared-Then-Adapt)は、まずタスクファミリー間で実行可能プログラムの共有アーカイブを進化させ、選択した共有候補を各タスクに適応させるフレームワークである。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:28:03 GMT)
AgroTools: A Benchmark for Tool-Augmented Multimodal Agents in Agriculture [26.3] AgroToolsは、農業におけるツール強化マルチモーダルエージェントを評価するためのベンチマークである。
AgroToolsには539の質問応答インスタンスと1,097の異種農業画像が組み合わされている。
その結果、現在のモデルでは、農業用ツールの使用状況がそれほど信頼できないことが判明した。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:58:54 GMT)
Do Not Trust The Auctioneer: Learning to Bid in Feedback-Manipulated Auctions [25.9] 販売は、競争を強くし、価格を上方に押し上げるために人工入札を使用することである。
我々は,シリングがフィードバックに影響を及ぼすがアロケーションに影響を及ぼさない第1価格のオークションを繰り返し検討した。
我々は,シロビッド分布が知られていることを前提として,ベスト入札ベンチマークに関する後悔を分析した。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:06:55 GMT)
Planning in the LLM Era: Building for Reliability and Efficiency [25.7] 計画立案に大規模な言語モデルを利用した初期の試みは、単発プラン生成に依存していた。
最近の研究は、ソリューション構築時にそれらを使用することに移行している。
本稿は、このシフトが、計画分野のより広範な認識を反映している、と論じる。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:24:33 GMT)
AMUSE: Anytime Muon with Stable Gradient Evaluation [25.6] 本研究は,平らで低曲率なバルク部分空間に沿って,ムーンを河川-谷の損失景観から調査するものである。
本研究では,Muonの急激なバルク進行とSchedule-Free平均化の安定化効果を統合した安定勾配評価(AMUSE)を用いたAnytime MUonを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:55:52 GMT)
CLORE: Content-Level Optimization for Reasoning Efficiency [25.6] そこで本稿では,適切なオンラインロールアウトを編集することで推論効率を向上させるコンテントレベルの最適化フレームワークを提案する。
CLOREは、外部拡張モデルを使用して、繰り返しセグメント、不可解またはタスク非関連コンテンツ、そしてソリューションが確立された後の過剰な推論を削除します。
実験の結果、CLOREは精度-効率トレードオフを改善し、GRPO、DAPO、Training Efficient、ThinkPruneと互換性を保っています。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:16:27 GMT)
Vector Policy Optimization: Training for Diversity Improves Test-Time Search [25.3] 本稿では,様々な下流の報酬関数を予測するために,ポリシーを明示的に訓練するRLアルゴリズムであるベクトルポリシー最適化(VPO)を提案する。
VPOは、報酬はコード生成におけるテストケースごとの正しさや、複数の異なるユーザペルソナや報酬モデルなど、実際はベクトル値で評価されることが多いことを悪用している。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:59:26 GMT)
General Preference Reinforcement Learning [25.1] ポストトレーニングは、大きな言語モデル(LLM)のアライメントを2つの大きく切り離されたトラックに分割した。
検証可能な報酬を伴うオンライン強化学習は、数学とコードの創発的な推論を促進する。
GPRL(General Preference Reinforcement Learning)は、各次元のグループ相対的な利点を計算し、それぞれを独自のスケールで正規化し、軸が支配できないようにする。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:23:01 GMT)
Spreadsheet-RL: Advancing Large Language Model Agents on Realistic Spreadsheet Tasks via Reinforcement Learning [24.5] Spreadsheet-RLは、Microsoft Excel環境内で、特殊なスプレッドシートエージェントをトレーニングするために設計された強化学習フレームワークである。
本研究では,スプレッドシート-RLにより,汎用タスクとドメイン固有のスプレッドシートタスクの両方において,AIエージェントのパフォーマンスが大幅に向上することを示す。
結果は、スプレッドシート自動化におけるスプレッドシート-RLの一般化と現実的な採用の強い可能性を強調している。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:47:41 GMT)
MLLMs Know When Before Speaking: Revealing and Recovering Temporal Grounding via Attention Cues [24.5] ビデオ時間グラウンド(VTG)は、マルチモーダル大言語モデル(MLLM)がビデオで何が起こるかを理解するための重要なテストである。
本研究では,MLLMのクロスモーダル・アテンションを探索し,知覚と生成のギャップを明らかにする。
まず,TG-Headプレフィルの注意を不偏フレームレベルの関連信号に変換し,ハイライトする高アテンション間隔を抽出する。
次に,この間隔に制限された視覚的コンテキストでMLLMを再起動し,ビデオトリミングやアテンションマスキングを用いて邪魔者を抑える。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:40:22 GMT)
Learning Spatiotemporal Sensitivity in Video LLMs via Counterfactual Reinforcement Learning [24.3] ビデオ大言語モデル(ビデオモデル)は、強力なベンチマーク精度を達成するが、ダイナミックスを追跡するのではなく、シングルフレームキューや言語先行といったショートカットを通じてビデオ質問に答えることが多い。
この問題はRLポストトレーニングにおいてさらに悪化しており、ビデオダイナミクスを追跡せずに高い報酬を得るショートカットポリシーをさらに強化することができる。
視覚世界が変化したとしても、答えは変わっているか、同じままか、という問題に対処する。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:38:02 GMT)
SceneAligner: 3D-Grounded Floorplan Localization in the Wild [24.1] 本研究では,現場の3次元再構成表現にタスクを接地することで,野生環境におけるフロアプランのローカライズを行う手法を提案する。
本手法は,重力に整合した3次元シーンを再構成し,フロアプランプロキシとして機能する2次元密度マップに投影する。
密度マップと建築フロアプランの外観ギャップを埋めるために, 2次元基礎モデルを適用し, 相互対応を学習する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:53:05 GMT)
What are the Right Symmetries for Formal Theorem Proving? [24.0] 意味論的に等価な文は、非常に異なる証明成功率を示すことを示す。
これは中心的な疑問を提起する: 形式的定理証明の適切な対称性は何か?
証明戦術によって誘導される構成的、一般的には非可逆な変換をキャプチャーするカテゴリ理論フレームワークである書字カテゴリを導入する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:00:47 GMT)
From Reasoning Chains to Verifiable Subproblems: Curriculum Reinforcement Learning Enables Credit Assignment for LLM Reasoning [24.0] Subproblem Curriculum Reinforcement Learning (SCRL)は、検証可能なサブプロブレムを導出し、最終サブプロブレムを元の問題として修正するカリキュラムRLフレームワークである。
SCRLはサブプロブレムレベルの正規化を使用し、各サブプロブレム位置で報酬を独立に正規化する。
解析の結果,勾配のデッドゾーンからサブプロブレム・キュリキュラがハード問題を解き、元の問題は困難になるにつれて相対的な利得が大きくなることがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:13:00 GMT)
Efficient Higher-order Subgraph Attribution via Message Passing [23.9] GNN-LRPのような高階の解釈スキームは、異なる機能がどのように相互作用するかを明らかにする強力なツールとして登場した。
線形時間でGNN-LRPでサブグラフを属性化できる新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:16:19 GMT)
TerminalWorld: Benchmarking Agents on Real-World Terminal Tasks [23.9] TerminalWorldはスケーラブルなデータエンジンで、"in-the-wild"端末からの高忠実度評価タスクを自動的にリバースエンジニアリングする。
エンジンは1,530の検証されたタスクの完全なベンチマークを取得し、18の現実世界のカテゴリにまたがる。
TerminalWorldは、既存のExpert-Verifiedベンチマークとは異なる現実世界の端末機能をキャプチャする。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:24:43 GMT)
Findings of the Counter Turing Test: AI-Generated Image Detection [23.4] 本稿では,AI生成画像検出のためのCounter Turing Test (CT2)を導入したDefactify 4.0ワークショップの成果を紹介する。
コンペティションは、(1)AI生成画像のバイナリ分類と(2)AI生成画像に責任がある特定の生成モデルの識別の2つの主要なタスクで構成された。
その結果、AI生成画像は高精度で検出できるが、使用する正確なモデルを特定することは、依然として極めて困難であることが判明した。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:53:24 GMT)
VGenST-Bench: A Benchmark for Spatio-Temporal Reasoning via Active Video Synthesis [23.3] VGenSTBenchは、生成モデルを使用して、アクティブに合成され、高度に制御され、多様な評価シナリオを提供するビデオベンチマークである。
我々は、様々なシナリオにまたがる空間スケールシーン、パースペクティブダイナミクスを含む、包括的な3x2x2ビデオ分類を確立した。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:48:35 GMT)
PathCal: State-Aware Reflection-Marker Calibration for Efficient Reasoning [23.1] 異なるマーカークラスが、異なる方法で精度と生成長に影響を与えることを示す。
PathCalは、マーカーの型を識別することで推論経路を校正する学習不要な復号制御器である。
論文参考訳(メタデータ) (Thu, 21 May 2026 22:13:20 GMT)
LCGuard: Latent Communication Guard for Safe KV Sharing in Multi-Agent Systems [23.1] 大規模言語モデル(LLM)ベースのマルチエージェントシステムは、複雑なタスクをコーディネートするための中間的通信に依存している。
最近の研究は、特にトランスフォーマーキー値(KV)キャッシュによる遅延通信が効率を改善し、よりリッチなタスク関連情報を保存できることを示している。
マルチエージェントLLMシステムにおける安全なKVベースの潜在通信のためのフレームワークである textbfLCGuard を紹介する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:42:12 GMT)
$ECUAS_n$: A family of metrics for principled evaluation of uncertainty-augmented systems [22.8] 高精度な自動意思決定では、予測の不確実性へのアクセスが不可欠である。
本稿では,興味ある課題に対する適切なスコアリングルールとして定式化された新しいメトリクス群である$ECUAS_n$を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:50:50 GMT)
Superhuman Safe and Agile Racing through Multi-Agent Reinforcement Learning [22.7] マルチエージェント強化学習は,現実世界のインタラクションに必要な安全足場を提供する。
我々はエージェントに複雑な空力相互作用と様々なレーサーとの戦略的な操作を誘導するように訓練する。
我々のエージェントは、最先端の単一エージェントベースラインに比べて衝突率を50%向上させる。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:15:54 GMT)
Broken Memories: Detecting and Mitigating Memorization in Diffusion Models with Degraded Generations [22.7] 記憶は内部の数値不安定を 引き起こします しばしば視覚的に壊れた 人工物として現れます
本稿では,段階的検出と適応緩和のための原則付きオンザフライフレームワークを提案する。
提案手法は,プロンプトやガイダンスを変更することなく記憶を抑え,セマンティックな忠実さと画質を保たせる。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:36:59 GMT)
GROW: Aligning GRPO with State-Action Modeling for Open-World VLM Agents [22.6] 視覚言語モデル(VLM)エージェントは、オープンワールドタスクにおいて有望な進歩を示している。
GROWは、収集された軌跡をステートアクションサンプルに分解する、オープンワールドなVLMエージェントのためのフレームワークである。
800以上のMinecraftタスクに対する実験により,本手法がSOTA(State-of-the-art)性能を達成することを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:35:18 GMT)
Healthcare LLM Benchmarks Are Only as Good as Their Explicit Assumptions [22.3] 本稿では,会話データからのみテスト可能なタスクと,結果データと行動研究を必要とする結果の2つのカテゴリに,仮定の分類を提案する。
我々は,医療RTTをケーススタディとして振り返って分析し,そのギャップがほぼ同じ大きさのタスクと結果のギャップに自然に分けることを発見した。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:27:58 GMT)
Unlocking Proactivity in Task-Oriented Dialogue [22.0] アクティブなタスク指向対話(TOD)は、ユーザの懸念を積極的に調査し、受け入れに向けて会話を操縦する説得エージェントを要求する。
ユーザの潜在的関心事に対する条件付けは、サンプリングの量が損なわれることのない、プロアクティブな能力を解放することを示します。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:46:25 GMT)
Photon blockade via three-body interactions: toward high-purity and bright single-photon sources [22.0] 本研究では,1つのフォトニックモードと2つの量子ビット間の3体相互作用を利用して,基本的に新しい光子遮断機構を導入する。
このような相互作用は本質的に2光子状態への励起経路を遮断し、完全な光子遮断効果をもたらす。
驚くべきことに、これは純度と明度のトレードオフを破り、極度の純度と高輝度の同時達成を可能にします。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:20:02 GMT)
DSSP: Diffusion State Space Policy with Full-History Encoding [21.8] 本稿では,ロボット操作のための歴史条件付き拡散状態空間ポリシーDSSPを紹介する。
我々の履歴エンコーダは、観測ストリーム全体をコンパクトな文脈表現に効果的に圧縮する。
実験の結果,DSSPはモデルサイズが大幅に小さく,最先端の性能を実現することがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:24:31 GMT)
The Double Dilemma in Multi-Task Radiology Report Generation: A Gradient Dynamics Analysis and Solution [21.5] コンフリクト・アバース・アバース・マグニチュード・エンハンス・グラディエント・ディフレッシュ(CAME-Grad)を紹介する。
CAME-Gradは、汎用的なプラグアンドプレイラジオロジーレポート生成ツールである。
8つのRRGメソッドにまたがって大幅に、一貫した改善をもたらす。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:40:13 GMT)
LiWi: Layering in the Wild [21.0] 地中画像の層化はいまだ未解決の問題である。
本稿では,高忠実度自然画像分解のための新しいフレームワークを提案する。
我々のフレームワークは、自然画像分解における最先端(SoTA)性能を実現する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:05:38 GMT)
Eyes on VLM: Benchmarking Gaze Following and Social Gaze Prediction in Vision Language Models [21.0] 視覚言語モデル(VLM)における視線理解のためのシステム評価フレームワークEyeVLMを提案する。
視線理解能力を評価するために,2つの中核課題に焦点をあてる。
第2の社会的視線予測は、多対人インタラクションに対する社会的および関係的な推論を必要とする。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:05:34 GMT)
Neuroscience-inspired Staged Representation Learning with Disentangled Coarse- and Fine-Grained Semantics for EEG Visual Decoding [20.8] 既存の脳波の視覚的復号法は主に、クロスモーダルアライメントのための単一のグローバル脳波埋め込みを学習することに焦点を当てている。
本稿では,脳波の視覚的復号化をステージ固有の表現分解問題として再定義する,神経科学にインスパイアされた段階的表現学習フレームワークを提案する。
提案フレームワークは,脳波表現学習を,低レベル視覚表現学習,高レベル意味表現学習,統合情報融合という3つの相補的なフェーズに編成する。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:22:39 GMT)
ST-SimDiff: Balancing Spatiotemporal Similarity and Difference for Efficient Video Understanding with MLLMs [20.7] 複雑なビデオ関係を扱うために,ST-Sim-Diffというトレーニング不要のフレームワークを開発した。
提案手法は,計算コストを大幅に削減しつつ,最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:27:15 GMT)
Tensor Cache: Eviction-conditioned Associative Memory for Transformers [20.7] キャッシュは、第1レベルのキャッシュ(L1)としてスライディングウインドウのソフトマックスの注意を、固定サイズの外積高速なメモリとして、ウィンドウから放出されるKVペアによって供給される第2レベルのキャッシュとする。
取り除かれたペアは、層ごとの行列に$A$に圧縮され、単一の行列乗算によって将来のクエリによって読み込まれる。
論文参考訳(メタデータ) (Thu, 21 May 2026 00:21:51 GMT)
Reinforcement learning for ion shuttling on trapped-ion quantum computers [20.4] イオン遮断の最適化に強化学習(RL)を初めて用いた例を示す。
我々のRLアプローチは現在の最先端技術よりも優れており、最大36.3%のシャットリング操作が減少することを示す。
提案手法は,チップ設計におけるシャットリング効率を研究するための汎用的な手法を提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:25:21 GMT)
Advancing Mathematics Research with AI-Driven Formal Proof Search [20.3] 大規模言語モデル (LLMs) は、数学的な推論においてますます優れているが、その信頼性の欠如は数学研究における実用性を制限している。
緩和はLLMを使ってリーンのような言語で公式な証明を生成します。
オープンな問題を解くための,本手法の大規模評価を行う。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:24:57 GMT)
Universal CT Representations from Anatomy to Disease Phenotype through Agglomerative Pretraining [20.1] FlexiCTは266,227個のCTボリュームの集合的継続事前トレーニングによって訓練されたCT基盤モデルのファミリーである。
このトレーニング戦略はスライスレベル、ボリュームレベル、視覚言語分析をサポートする。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:28:05 GMT)
Active Evidence-Seeking and Diagnostic Reasoning in Large Language Models for Clinical Decision Support [20.0] 我々はOSCEにインスパイアされた標準化された患者シミュレータと能動的診断のための制御された再現可能なベンチマークを導入する。
本プロトコルでは,468症例と15モデルに対して,診断精度を12.75%低下させ,サポートエビデンス品質を24.36%低下させるマルチターンエビデンスを観察した。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:34:50 GMT)
Physics-Informed Generative Solver: Bridging Data-Driven Priors and Conservation Laws for Stable Spatiotemporal Field Reconstruction [20.0] 物理インフォームド・ジェネレーティブ・ソルバを導入し、安定した事前学習と保存法の推論時適用を分離する。
音響学において、この方法はスパースセンサーから圧力と粒子速度を共同生成し、空間エイリアスを抑制する高密度仮想アレイを可能にする。
同じ枠組みは、現実世界のERA5気象分野に極端に広い範囲で一般化する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:24:48 GMT)
One LR Doesn't Fit All: Heavy-Tail Guided Layerwise Learning Rates for LLMs [19.5] レイヤワイズラーニングレート(レイヤワイズラーニングレート、Layerwise Learning Rate、LLR)は、個々のトランスフォーマー層に異なるラーニングレートを割り当てる適応型スキームである。
LLRは階層間のバランスの取れたトレーニングを促進し、より高速な収束と一般化の改善につながる。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:46:23 GMT)
TacO: Benchmarking Tactile Sensors for Object Manipulation [19.4] ロボット操作のための触覚センサのシステム的,タスク駆動型評価を行う。
操作ポリシー性能に基づくセンサの選択と評価のためのフレームワークを提案する。
触覚センサー、コード、データ、ハードウェアのセットアップはすべて、プロジェクトのWebサイトで公開される。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:11:03 GMT)
GesVLA: Gesture-Aware Vision-Language-Action Model Embedded Representations [19.3] VLA(Vision-Language-Action)モデルは、知覚と行動の統一による汎用ロボット操作の強力な可能性を示している。
ジェスチャーを並列命令として導入し,GesVLA(Gesture-Aware Vision-Language-Action Model)を提案する。
実験結果から,ジェスチャを組み込むことにより,目標の接地精度と人間とロボットの相互作用効率が一貫した改善が得られた。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:57:44 GMT)
Physiology and Anatomy Aware Inverse Inference of Myocardial Infarction for Cardiac Digital Twin [19.3] 既存のMI推論手法は、リアルな傷跡形態と心臓再分極を見落としている。
心臓デジタル双生児を用いた非侵襲的MI局在化のための新しい枠組みを提案する。
我々のフレームワークは、逆推論で既存のメソッドを著しく上回ります。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:32:21 GMT)
A First Measurement Study on Authentication Security in Real-World Remote MCP Servers [19.1] 実世界の遠隔MPPサーバにおける認証セキュリティに関する最初の測定結果を示す。
7,973台のリモートMPPサーバを特定し、40.55%が認証なしでツールを公開していることがわかった。
以上の結果から,MSPエコシステムにおける広範囲な認証の弱点が明らかとなった。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:22:21 GMT)
Neural Collapse by Design: Learning Class Prototypes on the Hypersphere [19.0] クロスエントロピー(CE)は自由度を非拘束にして縮退幾何学に収束させる一方、教師付きコントラスト学習(SCL)は事前訓練中にNCに向けて特徴を駆動するが、ポストホック線形探索フェーズでこの構造を捨てる。
両パラダイムが,ユニットハイパースフィアのプロトタイプと対比する同じ手法の外観に異なっており,そのギャップを埋めるにはそれぞれの障害点を固定する必要があることを示す。
我々の研究は、NCが設計によって到達したハイパースフィアのプロトタイプ学習として教師付き学習を再放送する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:20:48 GMT)
Aurora Hunter: A Two-Stage Framework for Probabilistic Visibility Forecasting [19.0] オーロラの可視性は、宇宙気象研究やオーロラ観光に重要である。
因子を分解する2段階のカスケードであるAurora Hunterを紹介します。
ステージ1は、トロムソ+キルナのデータに基づいて訓練された51の物理駆動的特徴を用いて、XGでP(occurring)を予測する。
ステージ2は、21の雲と月の照度特徴を用いて、ロジスティック回帰でP(明度観測)を予測する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:32:21 GMT)
Iterative Refinement Neural Operators are Learned Fixed-Point Solvers: A Principled Approach to Spectral Bias Mitigation [18.7] イテレーティブ・リファインメント・ニューラル・オペレータ(IRNO)は、学習されたリファインメント・モジュールを固定点反復で繰り返し適用することで、事前訓練された演算子を増強する。
物理的システム全体では、IRNOは連続的にエラーを減少させ、乱流の56.05%まで改善した。
アクティブマターでは、スペクトル分析により、ベース演算子と比較して、正規化誤差比が27.72-36.10%、中間で5.07-6.68%、高周波で1.48-2.04%に低下していることが明らかになった。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:41:51 GMT)
TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation [18.7] 我々は、中国4都市から120,845の駅と13,666の路線を含む1300万以上の交通ルート計画記録を収集した大規模なデータセットであるTransitLMを提示する。
実験により、トランジットLMで訓練されたLLMは、構造的に妥当なルートを高精度に生成し、任意のGPS座標を適切な駅に暗黙的に接地することを示した。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:42:33 GMT)
SynAE: A Framework for Measuring the Quality of Synthetic Data for Tool-Calling Agent Evaluations [18.7] SynAEは、ツールコールエージェントの合成ベンチマークが、実際のデータトラジェクトリの特性を如何に再現し、強化するかを評価するための評価フレームワークである。
我々は最近のエージェントベンチマークを用いてSynAEを評価し、現実的で制御された生成方式を用いて一般的な合成データ障害モードをテストする。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:45:02 GMT)
Towards Direct Evaluation of Harness Optimizers via Priority Ranking [18.6] ハーネス最適化がエージェントの情報更新アクションによって駆動されるのか、単にトライ・アンド・エラーであるのかは不明だ。
ハーネスを直接評価するのは簡単ではなく、オラクルハーネスが不足しているためコストがかかる。
評価を行うための簡易で低コストな設計、すなわち優先順位付けを提示する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:55:02 GMT)
Learning Emergent Modular Representations in Multi-modality Medical Vision Foundation Models [18.6] Director-Experts (DEX) は、スタックされたモジュールの動的性を制御するモジュールネットワークである。
DEXは専門家のプールで構成されており、画像ワイドアクティベーション戦略によって動的に適応される。
DEXはFMレベルの事前トレーニングを提供します。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:17:13 GMT)
How to Build Marcus's Algebraic Mind: Algebro-Deterministic Substrate over Galois Fields [18.6] PyVaCoAl/VaCoAlは1つの代数的プリミティブを中心に構成された超次元計算アーキテクチャである。
本稿では,Marcusの3つの柱の対応とPyVaCoAl/VaCoAlの運用コミットメントについて述べる。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:23:56 GMT)
Bridging Silicon and the Hippocampus: Algebro-Deterministic Memory "VaCoAl" as a Substrate for Vector-HaSH and TEM [18.6] 本稿では,ガロアフィールド線形フィードバックシフトレジスタ上に構築されたアルゲブロ決定論的超次元メモリアーキテクチャであるVaCoAlを紹介する。
その決定論的ガロア場拡散は、ベクター・ハッシュのランダム射影に対する基質レベルの代替を提供する。
実験可能なiEEG予測を導き、計算神経科学、電気生理学、超次元計算を統一する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:25:43 GMT)
Codec-Robust Attacks on Audio LLMs [18.6] オーディオ大言語モデル(Audio LLMs)に対する以前の攻撃は、慎重に構築された波形の摂動が敵の出力を強制することを示した。
我々は、音声波形を直接摂動するのではなく、ニューラルオーディオの連続潜時空間における摂動を最適化するCodecAttackを紹介した。
本稿では,波形の摂動を排除した圧縮チャネルが,その潜在空間で発生する摂動を伝送することを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:49:53 GMT)
Layer-wise Token Compression for Efficient Document Reranking [18.5] クロスエンコーダのリランカは、推論時に長いクエリドキュメントシーケンスを処理するため、高い計算コストを被る。
中間変圧器層に適応トークンプーリングを適用するレイヤワイドトークン圧縮を提案する。
また,中間層での圧縮は評価品質を保ちながら,経路ランクでは25%,文書ランクでは最大116%向上することを示した。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:53:43 GMT)
Pre-VLA: Preemptive Runtime Verification for Reliable Vision-Language-Action and World-Model Rollouts [18.4] 低品質なアクションは、実行中に物理的な障害を引き起こしたり、冗長なレンダリングコストで世界モデルのロールアウトを誤解させるおそれがある。
実演や世界モデルの想像力の前にプリエンプティブ・アクションアセスメントの妥当性を示す統一型ランタイム検証アーキテクチャであるPre-VLAを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:13:31 GMT)
Asymmetric quantum Rabi model, trap-dipole resonance, and quantum gates with optically trapped ultracold polar molecules [18.4] 極性分子に基づく量子コンピューティングにおける量子化運動の影響について検討する。
2つのゲートプロトコル,2ドル以下のパルス領域のグローバルマイクロ波パルスにより実現可能な高速iSWAPゲート,任意の制御位相を持つ制御相ゲートを導入する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:23:27 GMT)
LABO: LLM-Accelerated Bayesian Optimization through Broad Exploration and Selective Experimentation [18.3] 大規模言語モデル(LLM)はベイズ最適化における知識駆動のコンポーネントである。
本研究では,LLM予測と実験観測を1つのBOループ内で組み合わせたフレームワークを提案する。
LABOは、同じ実験予算の下で、既存の手法を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:42:47 GMT)
H-Flow: Self-supervised Human Scene Flow via Physics-inspired Joint Multi-modal Learning [18.2] パラメトリック・ヒューマン・モデルは、グローバルなポーズを捉えているが、衣服や軟組織の非剛性表面のダイナミクスを表現できない。
骨格運動と表面変形の両方を捉える密集した人間のシーンフローであるH-Flowを紹介する。
統一型マルチヘッドトランスは、単眼ビデオからのフローを推定し、協調出力としてポーズと深さを共同予測する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:38:41 GMT)
UfM*: Uncertainty from Motion* for DNN Depth Estimation Using Gaussians [18.2] Uncertainty from Motion* (UfM*) は、マルチビューの不一致を効率的に測定する不確実性推定アルゴリズムである。
UfM*は224x224画像あたり63mJしか消費せず、Arm Cortex-A76 CPU上で30FPSでリアルタイムに動作している。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:08:42 GMT)
OPPO: Bayesian Value Recursion for Token-Level Credit Assignment in LLM Reasoning [18.0] 検証可能な報酬を伴う強化学習は、LSM推論を改善するための標準的なレシピとなっている。
しかし、支配的なアルゴリズム GRPO は全てのトークンに対して単一の軌道レベルの利点を割り当てる。
我々は,Oracle-Prompted Policy Optimization (OPPO)を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 00:55:13 GMT)
Video as Natural Augmentation: Towards Unified AI-Generated Image and Video Detection [17.8] 我々は、ビデオから抽出したフレームに適用すると、SOTA AI生成画像検出器がしばしば崩壊することを示した。
これらの知見に触発されて、画像と映像データを共同でトレーニングする統合AIGC検出フレームワークVINAを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:11:32 GMT)
One Sentence, One Drama: Personalized Short-Form Drama Generation via Multi-Agent Systems [17.8] One Sentence, One Dramaは階層的なマルチエージェントフレームワークで、ユーザの単一文のアイデアを完全な短編ドラマに変換する。
提案手法は,(1)ショートドラマのパッシングと物語のコヒーレンスを強制するマルチエージェントの議論ベースのストーリー生成モジュール,(2)一貫したキャラクタの位置決めとシーンレイアウトのための共有空間参照を確立する3次元1フレーム生成機構,(3)包括的エラー検出とスクリプト,視覚,映像生成ステージ間のターゲットリビジョンを行うマルチステージレビュアループの3つの主要な構成要素に基づいて構築されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:15:46 GMT)
MedFM-Robust: Benchmarking Robustness of Medical Foundation Models [17.7] 医療基盤モデル(MedFMs)は医療における変革的ツールとして登場した。
MedFMはMed-VLM(Med Vision-Language Models)とセグメンテーション基礎モデルという2つのパラダイムに分類される。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:15:48 GMT)
Geometry-Adaptive Explainer for Faithful Dictionary-Based Interpretability under Distribution Shift [17.6] 分布シフトは、モデルが積極的に使用する部分空間を回転させ、イン・ディストリビューション(ID)アクティベーションに基づいて訓練された説明者の辞書を誤ることを示す。
我々は,このミスアライメントを,ID辞書とOOD活性部分空間との間の幾何学的距離である忠実度ギャップとして定式化する。
提案するGeometry-Adaptive Explainer (GAE, Geometry-Adaptive Explainer) は,従来の特徴構造を保ちながら,OOD-active 部分空間で説明者の辞書を実現する。
論文参考訳(メタデータ) (Thu, 21 May 2026 00:46:01 GMT)
Token-weighted Direct Preference Optimization with Attention [17.6] 本稿ではトークン重み付きRLとアテンションPOに基づく新しいトレーニング目標を提案する。
AttentionPO は LLM 自体からの注意を使ってトークンの重みを推定する。
実験の結果,アテンションPOはAlpacaEval,MT-Bench,ArenaHardの性能を著しく向上することがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:43:09 GMT)
Cell Phantom Video Generation in Elliptical Fourier Descriptor Domain [17.4] バイオメディカルビデオ中の個々の細胞を追跡するためのディープニューラルネットワークのトレーニングには、大量の注釈付きデータが必要である。
これは、組織修復やがん治療といった重要な医療問題に対処するために、パブリックアノテートされたデータの可用性が制限されていることを説明します。
本稿では,Fourier Descriptorsドメインにおけるセルファントムのビデオ生成のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:43:52 GMT)
MOTOR: A Multimodal Dataset for Two-Wheeler Rider Behavior Understanding [17.3] グローバル・サウスでは2輪車が道路死傷者の不当な割合を占めている。
しかし、二輪ライダーの挙動に関する研究は四輪車よりはるかに遅れている。
大規模かつ多視点のマルチモーダルリソースであるMOtorized TwO-wheeler Rider データセットについて述べる。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:32:23 GMT)
Prototype-Guided Classification Sub-Task Decoupling Framework: Enhancing Generalization and Interpretability for Multivariate Time Series [17.2] 時系列分類(TSC)は、近年注目を集めている長年の研究課題である。
我々は,時系列分類を多段階決定プロセスとして再構成するプロトタイプ誘導フレームワークであるPDFTimeを提案する。
我々の知る限り、PDFTimeは、分離された多段階の類似性に基づく推論プロセスとして時系列分類を再構成する最初のフレームワークです。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:45:50 GMT)
PointLLM-R: Enhancing 3D Point Cloud Reasoning via Chain-of-Thought [17.1] チェイン・オブ・ソート(CoT)推論はLLMや画像ベースMLLMにおいて強い効果を示している。
本研究では,3Dポイントクラウド理解に適した大規模CoTインスペクションを構築するためのデータ中心フレームワークを提案する。
PoCoTI上で微調整されたPointLLMは、推論可能な3Dマルチモーダル言語モデルであるPointLLM-Rを得る。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:19:51 GMT)
Uncovering the Latent Potential of Deep Intermediate Representations [17.0] タスク関連情報は,非単調に層に分散し,ナブアグリゲーションによって回復できないことを示す。
本稿では,タスク識別サブ空間を識別する構成的スペクトル法であるレイヤワイズ最適埋め込み選択(LOES)を紹介する。
提案手法は,意味的因子を層に分散させることで,言語間およびモーダル間の解釈可能性の分析を可能にする。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:58:42 GMT)
GLeVE: Graph-Guided Lesion Grounding with Proposal Verification in 3D CT [17.0] 臨床診断には3次元CTボリュームへの地中X線検査報告の記載が不可欠である。
既存のレポート支援および視覚言語基底法は、フレーズレベルのアライメントや高密度画素監督に依存している。
解剖学的事前検証とオクツリーによる自己回帰的改善を併用したグラフ誘導型病変基盤フレームワークであるGLeVEを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:30:41 GMT)
Measuring Cross-Modal Synergy: A Benchmark for VLM Explainability [16.9] 視覚言語モデル(VLM)は複雑な視覚入力を意味空間にマッピングする。
本稿では、Shapley Interaction Indexに根ざしたスケーラブルな計量であるSynergistic Faithfulness(mathcalF_syn$)を紹介する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:39:46 GMT)
LVDrive: Latent Visual Representation Enhanced Vision-Language-Action Autonomous Driving Model [16.9] VLA(Vision-Language-Action)モデルは、エンドツーエンドの自動運転のための有望なフレームワークとして登場した。
近年、世界モデリングによる濃密な視覚監視を取り入れようとする試みは、しばしばピクセルレベルの画像再構成を過度に強調している。
自律運転のための遅延視覚表現拡張VLAフレームワークであるLVDriveを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:31:49 GMT)
Multilingual Steering by Design: Multilingual Sparse Autoencoders and Principled Layer Selection [16.9] マルチリンガルデータ上でのSAEのトレーニングは、一貫して言語間表現を強化していることを示す。
我々は,多言語アライメントと言語分離性の交差に基づく,強調優先階層選択ルールを導入する。
その結果,多言語SAEと交叉選択層を組み合わせることで,言語識別精度と生成品質のトレードオフを安定化できることがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:00:32 GMT)
BioFormer: Rethinking Cross-Subject Generalization via Spectral Structural Alignment in Biomedical Time-Series [16.8] バイオメディカル・タイムシリーズにおけるクロスオブジェクトの一般化(クロスオブジェクト・ジェネレーション)とは、一部の被験者のデータをトレーニングし、見えない被験者をテストすることを指す。
既存の手法のほとんどは、モデル構築や主観的対人学習を通じて、変動を暗黙的に抑制する。
スペクトルドリフトは,主観的変動を特徴付ける新しい視点として導入される。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:27:40 GMT)
Variance Reduction for Expectations with Diffusion Teachers [16.3] 事前訓練された拡散モデルは、テキストから3D、シングルステップ蒸留、データ属性などの下流パイプラインを供給している凍結教師として機能する。
本稿では,階層型MC推定器の動機となる分散計算フレームワークCARVを紹介する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:50:17 GMT)
Ultra-High-Definition Image Quality Assessment via Graph Representation Learning [16.3] 超高精細(UHD)画像に対するブラインド画像品質評価(BIQA)は、ネイティブ解像度推論が計算コストが高いため、依然として困難である。
本稿では,サンプル画像領域間の構造的依存関係を明示的にモデル化し,UHD-BIQAを改善することを目的とする。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:57:59 GMT)
Auction-Consensus Algorithm with Learned Bidding Scheme for Multi-Robot Systems [16.2] Auction-Consensusアルゴリズムは、証明可能な収束を伴うスケーラブルな分散調整を提供する。
本稿では、CBBAの決定論的入札機構を強化学習を用いて訓練されたニューラル入札ポリシーに置き換える学習強化オークション・コンセンサス・フレームワークを提案する。
様々なSwarmサイズにまたがる実験結果から、学習入札政策は古典的なCBBAよりも解の質を向上させることが示されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:00:47 GMT)
A Tutorial on Diffusion Theory: From Differential Equations to Diffusion Models [15.9] このチュートリアルは微分方程式の観点から拡散モデルを開発する。
条件付き前方過程から始め、この経路が常微分方程式(ODE)表現と辺化微分方程式(SDE)表現の両方を許容することを示す。
次に、対応する逆時間ダイナミクス、すなわち逆SDEと逆確率フローODEを導出する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:59:12 GMT)
Four Simple Proprioceptive Estimators for Legged Robots [15.8] 脚のついたロボットはIMUを搭載しているが、一般向けのIMUはノイズが多いため慣性解はドリフトする。
本報告では,これを利用する脚型ロボット状態推定器のシリーズを新たに開発する。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:17:48 GMT)
Benchmarking Autonomous Agents against Temporal, Spatial, and Semantic Evasions [15.5] LLMをベースとしたエージェントシステムを対象とした,新しい多次元回避フレームワークを提案する。
これらの脅威を定量化するために,2,254個の実世界のエージェント実行軌跡からなる総合ベンチマークであるA3S-Benchを構築した。
我々の回避フレームワークは平均リスクトリガー率を28.3%から52.6%に引き上げる。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:07:51 GMT)
Cross-Subject EEG Emotion Recognition Based on Temporal Asynchronous Alignment Contrastive Learning [15.4] 本稿では,脳波に基づく感情認識のための時間的非同期アライメントに基づくコントラシブラーニング(TA2CL)フレームワークを提案する。
従来のグローバルな「ハードアライメント」類似性計算手法を、きめ細かい局所マッチング機構に変換する。
実験の結果,提案手法は複数の公開データセットに対して高い性能を示すことがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:09:42 GMT)
From Recognition to Reasoning: Benchmarking and Enhancing MLLMs on Real-World Receipt Document Understanding [15.4] ReceiptBenchは10万の多様なレシートからなる、大規模で人間による注釈付きベンチマークである。
ReceiptBenchは10万の多様なレシートからなる大規模で人手による注釈付きベンチマークである。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:37:03 GMT)
OSS: Open Suturing Skills Vision-Based Assessment Challenge 2024-2025 [15.3] 開腹手術における視力に基づくスキルアセスメントのベンチマークと進歩を目的とした専用のMIIチャレンジの結果を報告する。
チャレンジデータセットは、静的GoProカメラで記録されたオープン縫合トレーニングタスクをドライラブ設定で構成する。
参加者は、ディープラーニングベースのビデオモデル、トラッキング駆動方式、ハイブリッドアプローチなど、さまざまなソリューションを提出した。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:04:17 GMT)
DFKI-MLT at SemEval-2026 TASK 7: Steering Multilingual Models Towards Cultural Knowledge [15.3] 本稿では,SemEval-2026タスク7におけるDFKI-MLTシステムについて紹介する。
並列FLORESデータから抽出した言語ベクトルを用いて,多言語LLMに対してアクティベーションステアリングを適用した。
本手法は,残ストリームに言語固有のステアリングベクトルを追加することで,推論時適応を行う。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:58:20 GMT)
Beyond Pixels: Learning Invariant Rewards for Real-World Robotics From a Few Demonstrations [15.3] オープンワールド操作問題では、異なるオブジェクトインスタンス、位置、カメラ視点を通じて、多数の変種に単一のタスクが現れる。
最近の視覚に基づく報酬モデルでは、特定の画素分布を記憶し、訓練条件を超えて一般化することができない傾向にある。
本稿では,5つの実演から不変なシンボル報酬関数を学習するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:55:35 GMT)
Learning A Unified Risk Map for Autonomous Driving in Partially Observable Environments [15.3] 本研究では,部分的に観測可能な環境のための統合マップモデリングと学習フレームワークを提案する。
提案するフレームワークは,部分的に監視可能な環境下でのリスク対応計画に対して,包括的で実用的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:56:38 GMT)
Reliability and Effectiveness of Autonomous AI Agents in Supply Chain Management [15.2] 本稿では,MIT Beer Game を用いたマルチエキロンサプライチェーンにおける自律生成型AIエージェントについて検討する。
モデル選択、ポリシーとガードレール、集中型データ共有、迅速なエンジニアリングという、パフォーマンスを形成する4つの推論時レバーを特定します。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:07:14 GMT)
Understanding Multimodal Failure in Action-Chunking Behavioral Cloning [15.1] 異なるマルチモーダルパラメータ化は異なる方法で失敗することを示す。
潜時変更可能なポリシでは、後続のプライアライゼーションによって、デプロイメント時間のサンプリングがより信頼性が向上する。
アクション空間生成ポリシーでは、マルチモーダリティはベース・ツー・アクション輸送の滑らかさによって制約される。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:45:28 GMT)
RoboSurg-VQA: A Multimodal Benchmark for Surgical Segmentation-Aware Visual Question Answering [15.0] セグメント認識型視覚質問応答(VQA)ベンチマークである textbfRoboSurg-VQA を提案する。
各フレームは、手順コンテキスト、解剖学(領域を含む)、画像のモダリティ/ビュー、外科的アーティファクト、画像品質、基本的な可視性および空間特性にまたがる固定された一連の臨床的動機付けられた質問とペアリングされる。
本報告では, 手術条件下でのベンチマーク統計, 衛生基準, 共通評価課題について報告する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:58:11 GMT)
Certification from Examples is Hard for Circuits and Transformers under Minimal Overparametrization [15.0] 平均ケースの精度は、いまだに一貫性のない振る舞いを隠蔽することができる。
これは正確な証明を動機付け、学習された仮説が目標に等しいことを示すのに必要なラベル付きサンプルの最小セットを求める。
いくつかの仮説は容易に証明できるが、最小限のオーバーパラメトリゼーションでさえ、いくつかの仮説クラスにおいて証明を指数関数的に困難にすることができる。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:49:38 GMT)
Tokenisation via Convex Relaxations [15.0] トークン化は現在のNLPパイプラインの不可欠な部分である。
トークンサ構築を線形プログラムとして定式化し、凸最適化ツールを用いて解決する。
ConvexTokは、固有のトークン化メトリクスと、言語モデルによって達成されるビット単位バイト(BpB)を一貫して改善する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:59:56 GMT)
Automated Repair of TEE Partitioning Issues via DSL-Guided and LLM-Assisted Patching [14.8] TEERepairは,TEEアプリケーションのパーティショニング問題を自動的に修復するフレームワークである。
本稿では,修復ルールをエンコードするドメイン固有言語(LLM)を導入することで,上記の課題に対処する。
次に、大型言語モデル(LLM)を活用してコンテキスト対応パッチを合成し、さらにテストクライアントを生成して修復を検証する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:27:28 GMT)
Distributed Image Compression with Multimodal Side Information at Extremely Low Bitrates [14.5] 本稿では,マルチモーダルな側面情報をDICパラダイムに活用するマルチモーダルDICフレームワークを提案する。
具体的には、相関画像から抽出したテキスト側情報に対して、テキストから画像への拡散に基づくデコーダを導入する。
我々はMDICが極めて低いデータセットで最先端の知覚品質を実現することを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:53:03 GMT)
Sakura at BEA 2026 Shared Task 1: What Makes Vocabulary Difficult? [14.4] 本稿では,語彙難易度予測のための2種類のモデルについて述べる。
最上位の共有タスクを達成した高精度のブラックボックスモデルと、微調整エンコーダベースラインを上回った説明可能なモデルである。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:46:16 GMT)
Generative Modeling by Value-Driven Transport [14.3] 我々は,測度輸送の離散時間制御定式化に基づく生成モデリングのための新しいフレームワークを開発する。
我々は、訓練されたVDTポリシーが、他の最先端の手法と比較して、多くの好適な特性を享受していることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:57:06 GMT)
Verified Task-Space Motion Planning Under Joint-Space Constraints [14.3] Bug2のようなリアクティブなタスクスペースプランナーは、固定されたカルテシアンステップサイズで動作し、マニピュレータの関節角制限に気づいていない。
計算は各計画段階において、関節境界の下で到達可能な最大のカルテ超矩形を計算することで解決する。
等価な二分法は、その認証をミリ秒以下の時間で解決する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:42:29 GMT)
Tokenization with Split Trees [14.2] ToaST(Tokenization with Split Trees)は、圧縮を直接最適化するサブワードトークン化手法である。
ToaSTは、40,960以上の語彙サイズでBPE、WordPiece、UnigramLMと比較してトークン数を11%以上削減する。
1.5Bパラメータ言語モデルのトレーニングでは、ToaSTが最高スコアを獲得し、ベースラインの2.6%から7.6%を上回り、3つのうち2つが重要であり、22のタスクのうち13つが最高スコアである。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:46:23 GMT)
Graph Alignment Topology as an Inductive Bias for Grounding Detection [14.2] 大規模言語モデル(LLM)は、生成した命題がソース文書に関連付けられているかどうかを明示的に検証するよりも、分布的に妥当な継続を生成するように最適化されている。
この帰納バイアスは一般化を可能にするが、参照に関して応答が基底になっているかどうかを符号化しない。
我々は、アライメントトポロジを誘導バイアスとして活用し、メッセージパッシングを用いたアライメント構造をモデル化するためにグラフニューラルネットワーク(GNN)を訓練する。
本手法は, GPT-4o などの基礎的 LLM を含む, 比較されたすべての手法よりも優れた4つの多様な幻覚と質問応答データセットに対して, 最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:49:32 GMT)
PhylaFlow: Hybrid Flow Matching in Billera-Holmes-Vogtmann Tree Space for Phylogenetic Inference [14.1] 本稿では,BHVツリー空間における後部基底輸送を学習するハイブリッドフローマッチングモデルであるPhylaFlowを紹介する。
DS1-DS8の系統的後続ベンチマーク全体において、PhylaFlowは古典的な初期化子に対する初期木-KLを大幅に削減する。
最も優れたPhylaFlow変種は、8つのデータセットのうち7つでショートアップを、同じ改善予算で8つのうち5つでPhyloGFNを上回ります。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:13:46 GMT)
DanceHMR: Hand-Aware Whole-Body Human Mesh Recovery from Monocular Videos [13.9] 本報告では,一眼レフビデオに挑戦するための時間的コヒーレントな全身HMRフレームワークを提案する。
本モデルでは,残体-手関節融合による身体コンテキストと部分特異的手指観察を統一する。
全身および身体のみのベンチマーク実験では、手再建と身体の競争精度が向上した。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:30:23 GMT)
S2ED: From Story to Executable Descriptions for Consistency-Aware Story Illustration [13.9] 複数フレームのストーリーイラストは、単一画像のテキスト・ツー・イメージ生成を超えて、長い水平コヒーレンスを必要とする。
本稿では,S2ED(Story-to-Executable Descriptions)を提案する。
S2EDは、完全なストーリーを、より一貫性のあるレンダリングのために、明示的で編集可能な実行可能な記述のシーケンスに変換する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:16:32 GMT)
Model Collapse as Cultural Evolution [13.9] 文化進化からの反復学習理論がこのギャップを埋めていることを示す。
検証可能な5つの予測を導出し、その理論に対して独特に識別できるものと確認可能なものとを区別し、自己学習によってそれらを検証する。
決定的な識別的発見: 構成性は、フィルターなしの自己学習の下で非単調な軌道に従う。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:36:26 GMT)
Do Language Models Know What Not to Say? Causal Evidence for Statistical Preemption in LLMs [13.9] 建設文法は統計的プリエンプション(英語版)を提案している: 従来の形式への露出は構造的に可能であるが、証明されていない代替手段を前提としている。
本稿では,大規模言語モデルにおいて,競合するエンレンチメント仮説から統計的プリエンプションを解離する計算手法を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:06:43 GMT)
Brain-LLM Alignment Tracks Training Data, Not Typology [13.9] 脳-LLMアライメントは英語でよく確立されているが、脳の言語ネットワークは言語全体で神経解剖学的に普遍的である。
我々は、英語、中国語、フランス語の参加者112人のfMRIデータを用いてこれを検証した。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:56:51 GMT)
Agentic-VLA: Efficient Online Adaptation for Vision-Language-Action Models [13.8] VLA(Vision-Language-Action)モデルは、事前訓練された視覚言語表現を活用することで、ロボット操作のための有望なパラダイムとして登場した。
現在のVLA訓練方法は、新しい環境への一般化の低さと、広範囲なデモンストレーションを必要とする訓練効率の低さの2つの限界に悩まされている。
本稿では,3つの重要なイノベーションを通じて,VLAのオンライン適応を可能にするエージェントトレーニングフレームワークであるAgentic-VLAを紹介する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:24:21 GMT)
D$^3$-Subsidy: Online and Sequential Driver Subsidy Decision-Making for Large-Scale Ride-Hailing Market [13.6] D$3$-Subsidy(Dynamic Driver-side Diffusion-based Subsidy)は、都市全体の補助金制御をデプロイするための階層的な拡散ベースのフレームワークである。
D$3$-Subsidyは、上限コンプライアンスを改善しながらtextttRides と textttGMV を改善し、実世界の A/B テストでかなりの上昇を確認した。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:58:59 GMT)
Identifiable Token Correspondence for World Models [13.5] Identible Token Correspondence (ITC) は、トークンベースのトランスフォーマー世界モデルのステップであり、構造化代入問題として次のフレーム予測を定式化する。
Craftax-classicベンチマークでは,ITCが72.5%,35.6%のリターンを達成した。
論文参考訳(メタデータ) (Thu, 21 May 2026 00:53:36 GMT)
Finding Missing Input Validation in TEEs via LLM-Assisted Symbolic Execution [13.5] 本稿では,新しい大規模言語モデル (LLM) を用いたシンボリック実行フレームワークであるSymTEEを提案する。
SymTEEは、実際のTEEセットアップを必要とせずに、TEEアプリケーションの入力バリデーションの欠如を検出する。
評価の結果、SymTEEは100%の精度と92.3%のリコールを達成し、欠落した入力バリデーションの脆弱性を検出する。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:47:36 GMT)
Lumberjack: Better Differentially Private Random Forests through Heavy Hitter Detection in Trees [13.3] Lumberjackは差分的にプライベートなランダムフォレストアルゴリズムで、実用性を大幅に向上する。
我々のアプローチの重要な構成要素は、階層データに対する新しい$(varepsilon,)$-DP重み検出アルゴリズムである。
Lumberjackは従来のDPランダムフォレスト法よりも優れていた。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:23:04 GMT)
From Betting to Empirical Bernstein LIL [13.1] これは、私が2017-2018年に書いた技術レポートの冗長なコピーで、オンライン賭け戦略の富の保証を使って反復対数の法則を取得する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:58:29 GMT)
SEGA: Spectral-Energy Guided Attention for Resolution Extrapolation in Diffusion Transformers [13.1] 拡散変換器(DiT)はテキスト・画像生成の主要なアーキテクチャとして登場したが、トレーニング範囲を超えた解像度で生成すると性能が低下する。
本稿では,各聴覚ステップにおける潜伏者の空間周波数構造に応じて,RoPE成分間の注意を動的に拡大するトレーニングフリー手法SEGAを紹介する。
実験の結果、SEGAは複数の目標解像度にわたる高分解能合成を一貫して改善し、最先端のトレーニングフリーベースラインよりも優れていた。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:09:01 GMT)
Meta-Soft: Leveraging Composable Meta-Tokens for Context-Preserving KV Cache Compression [12.6] 大規模言語モデルで使用されるKVキャッシュは、線形的に時間の複雑さが増大する。
現在のKVキャッシュの排除は重要な研究方向となっている。
本稿では,プローブ駆動型コンテキスト統合に基づく動的圧縮フレームワークMeta-Softを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:24:46 GMT)
Guided Trajectory Optimization with Sparse Scaling for Test-Time Diffusion [12.6] 拡散モデルの生成ポテンシャルを解放するために,Reward-guided Trajectory Scaling法を提案する。
既存の方法とは異なり、RTSは2つのコア・イノベーションを通じて洗練された高忠実な画像の合成を促進する。
実験では、GenEval Scoreのベースラインが15.6%向上し、ImageRewardスコアが60.4%向上し、新たなSOTAが設定された。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:30:01 GMT)
Reflecti-Mate: A Conversational Agent for Adaptive Decision-Making Support Through System 1 and System 2 Thinking [12.4] 本研究では,個々のユーザの思考パターンに適応して統合を促進するエージェントについて検討する。
本研究は,エージェントに対する参加者の認識と反射行動に及ぼす効果について検討する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:58:36 GMT)
LLM-AutoSciLab: Closed-Loop Scientific Discovery via Active Experimentation with LLMs [12.1] LLM-AutoSciLabは仮説生成と仮説条件付き実験選択とメカニズム改善を結合したクローズドループフレームワークである。
検証可能な仮説を反復的に提案し、それらを識別または洗練するために情報的実験を選択し、その結果の証拠を用いてその状態を更新する。
NewtonBenchとActiveSciBench-Chemの67.6%と35.1%のシンボル精度、ActiveSciBench-GRNの31.1%の正確なグラフリカバリを実現している。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:30:56 GMT)
Interpreting and Enhancing Emotional Circuits in Large Vision-Language Models via Cross-Modal Information Flow [12.1] LVLMの内部メカニズムは、抽象的な視覚刺激をコヒーレントな感情的物語へと変換する。
説明的感情的推論に適したステアリングベクターに基づく因果帰属フレームワークを提案する。
我々は、感情情報ルーティングを規制し、注意の流れを強化し、セマンティックアクティベーションを増幅し、表現を統合する。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:20:12 GMT)
Photon Anomalous Blockade in Waveguide Cavity QED with Atomic Mirrors [12.0] 導波路キャビティQEDシステムからの出力場の光子統計について検討した。
このような光子異常な遮断は、量子ゼノ効果によるものである。
本研究は、導波路共振器QEDを介して光子遮断と単光子デバイスを利用する方法である。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:54:42 GMT)
Enhancing Visual Token Representations for Video Large Language Models via Training-Free Spatial-Temporal Pooling and Gridding [12.0] ビデオ大言語モデルに特化して設計されたトレーニングプール型視覚トークン拡張手法ST-Gridを提案する。
提案手法は,階層的時間的格子化により時間的相互作用を捉えるピラミッド時間格子法 (PTG) を統合した。
本手法は,視覚的トークン表現を改善するための,効率的なプラグアンドプレイソリューションを提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:16:45 GMT)
Think Thrice Before You Speak: Dual knowledge-enhanced Theory-of-Mind Reasoning for Persuasive Agents [11.7] 本稿では,ToM-based Persuasive Dialogue (ToM-PD) タスクを紹介する。
また、知識に富んだ段階的推論フレームワークであるThink Thrice Before You Speak (TTBYS)を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:15:51 GMT)
Parametric Modular Answer Set Programs Made Declarative [11.5] 我々はパラメトリックなモジュラー論理プログラムと呼ばれる新しい形式を導入し、パラメータとインテンシティーステートメントでサブプログラムを定義する。
サブプログラムの構造化とインスタンス化を可能にする機能である集合制御によるクリンゴプログラムのセマンティクスを,この形式がどのように捉えるかを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:52:18 GMT)
Is Capability a Liability? More Capable Language Models Make Worse Forecasts When It Matters Most [11.5] 逆スケーリングでは、より有能なモデルでは、超線形成長を伴う問題を予測し、状態変化の尾リスクを予測し、分布予測が悪化する。
このパターンはForecastBench-Simで、線形制御にマッチした合成SIRの流行を予測し、COVID-19、麻疹、住宅市場、ハイパーインフレの実際のデータセットに複製する。
この逆スケーリングは、LLM予測ベンチマークに共通する単一閾値のメトリクスには現れず、同一出力における能力-正確性関係のサインを逆転させる。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:14:33 GMT)
A Proactive Multi-Agent Dialogue Framework for Assessing Social Language Disorder Traits in Autism [11.5] TPA(Think, Plan, Ask)は,自閉症診断監視スケジュールモジュール4(ADOS-2)の言語評価コンポーネントに適用した,能動的多エージェント対話フレームワークである。
医師エージェントは、臨床的根拠のある戦略を選択し、対象とする質問を生成する前に、どの特徴が保存されていないのかを明確に理由づける。
実際のADOS-2臨床データに基づく患者エージェントは、実際の患者参加なしに再現可能な評価が可能であり、実際の患者言語に対する適切な忠実性を確認する3つの独立した実験で検証される。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:45:46 GMT)
Exposing Vulnerabilities in Visible-Infrared VLMs: A Unified Geometric Adversarial Framework with Cross-Task Transferability [11.5] 視覚言語モデル(VLM)は多様なマルチモーダルタスクにおいて高い性能を達成しているが、視覚赤外線(VIS-IR)のシナリオにおけるその逆の堅牢性はいまだ未定である。
そこで我々は,VIS-IR VLM 攻撃のための曲面エッジフラクタル幾何対角パッチフレームワーク CFGPatch を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:15:58 GMT)
KAPLAN: Kolmogorov-Arnold Prognostic Learnable Activation Networks for Survival Analysis [11.3] 共変量と時間との結合関数として条件付きハザードの非推定にKAPLAN-HRを導入する。
単一層KAPLAN-HRモデルはGAMを復元し、より深いアーキテクチャは合成を通して相互作用と時間変化の効果をキャプチャする。
KAPLAN-HRは6つの臨床ベンチマークデータセットに対する評価において、確立された統計的および深層学習サバイバル手法の予測性能に適合するか、それとも超えている。
論文参考訳(メタデータ) (Thu, 21 May 2026 22:30:03 GMT)
Adversarial Trust Poisoning in Vehicular Collaborative Perception [11.3] 協調的な認識により、コネクテッドカーと自動運転車はセンサーデータを共有でき、環境について共同で判断できる。
このTrustFlipは、一貫した防御を武器にして、良心的な車両に割り当てられた信頼を害する新しい攻撃だ。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:53:10 GMT)
Skill Weaving: Efficient LLM Improvement via Modular Skillpacks [11.2] SkillWeaveは、大規模な言語モデルのためのモジュラー改善フレームワークです。
SkillWeaveは、汎用モデルの完全な機能を、モデルの内部知識を再編成し洗練するスキルパックに分割する。
効率的なデプロイメントのために、SkillWeaveはSkillZipを統合して、スキルパックをコンパクトで推論対応のフォーマットに圧縮する。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:12:20 GMT)
VeriScale: Adversarial Test-Suite Scaling for Verifiable Code Generation [11.1] 大規模言語モデル(LLM)は、ソフトウェアエンジニアリングのためにますます多くデプロイされている。
既存のベンチマークは、肯定的なテストケースと否定的なテストケースの量と品質によって制限される。
対戦型実装によって駆動される新しいフレームワークであるVeriScaleを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:00:45 GMT)
Dissipation-Selected Resonant Fronts in a Driven-Dissipative Bose-Hubbard Lattice [11.1] 空間的に構造化された散逸は ハミルトン制御を超えた 駆動量子物質を組織する
本稿では,2次元Bose-Hubbard格子の非線形共振スライスをスターク誘導型デチューニングランプと組み合わせて選択することを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:19:34 GMT)
AtelierEval: Agentic Evaluation of Humans & LLMs as Text-to-Image Prompters [10.9] AtelierEvalは、360のエキスパートによるタスクにまたがる習熟度を定量化する最初の統一ベンチマークである。
スケーラブルで信頼性の高い評価を実現するために,スキルベース,メモリ拡張型エージェント評価器であるAtelierJudgeを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:51:53 GMT)
Weakly Supervised Cross-Modal Learning for 4D Radar Scene Flow Estimation [10.9] 本稿では,弱教師付きレーダシーンフロー学習のためのタスク固有フレームワークを提案する。
市販の2Dトラッキングとセグメンテーションアルゴリズムを利用して、追跡されたインスタンスマスクを取得する。
実世界のView-of-Delftデータセットの実験は、我々の手法が最先端のクロスモーダル監視アプローチを超えることを示した。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:43:54 GMT)
From Residuals to Reasons: LLM-Guided Mechanism Inference from Tabular Data [10.8] 科学的応用のための機械学習における永続的な課題は、予測と理解を共同で達成することである。
マルチエージェント残差文脈学習(MARICL)を導入する。
MARICLは、すべてのデータセットのベースモデルに対して一貫して改善されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:34:08 GMT)
Dithering Defense: Adversarial Robustness of Vision Foundation Models via Multi-Level Floyd-Steinberg Dithering [10.7] マルチレベルFloyd-Steinberg誤差拡散ディザリングを,軽量でモデルに依存しない入力変換として検討する。
分類,セグメンテーション,深度推定,検索,キャプション,視覚的質問応答),2つのモデルファミリー(DINOv2,PaliGemma),3つの強みに対する攻撃について検討した。
以上の結果から,Floyd-Steinbergディザリングを中間量子化レベル,特に後処理のぼかしと組み合わせた場合,試験対象のベースラインを全て超えたり,一致させたりすることがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:56:50 GMT)
KAPPS: A knowledge-based CPPS Architecture for the Circular Factory [10.7] 循環型製造は、不均一で不確実な条件で使用される製品を再導入する。
このシフトは、可変製品状態、動的に再構成可能なプロセス、人間と機械の知識の統合を扱うことができる製造システムを必要とする。
安定した構造と決定論的実行のために設計された従来型のITアーキテクチャは、これらの要件を満たすことができない。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:20:53 GMT)
AnyMo: Geometry-Aware Setup-Agnostic Modeling of Human Motion in the Wild [10.5] 我々はAnyMoを紹介した。AnyMoは、セットアップに依存しない人間のモーションモデリングのための幾何学的フレームワークである。
AnyMoは物理地上でのIMUシミュレーションを使って、多種多様な合成信号を生成する。
我々はAnyMoを、ゼロショットアクティビティ認識、クロスモーダル検索、ウェアラブルIMUモーションキャプションの3つの相補的なタスクで評価する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:52:10 GMT)
FlyRoute: Self-Evolving Agent Profiling via Data Flywheel for Adaptive Task Routing [10.5] FlyRouteはプロファイリングフレームワークで、実際のトラフィックから能力証拠を成長させる。
定期的に証拠を学習能力記述に蒸留し、BM25で回収された成功と共にこれらの記述を注入する。
FlyRouteは、同じバックボーンのゼロショットLLMルータを72.57%から78.04%に改善した。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:46:21 GMT)
Seeing without Looking: Do Vision-Language Benchmarks Really Test Vision? [10.3] ベンチマーク精度はしばしば、視覚言語モデルにおける基底的な視覚的理解を反映していると仮定される。
我々は、このミスマッチをオープンソースの視覚言語モデルで体系的に研究する。
VLMは視覚入力を取り入れているが、その予測はきめ細かい視覚的証拠の喪失にはあまり敏感ではない。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:35:04 GMT)
Meta-Learning for Rapid Adaptation in Reference Tracking of Uncertain Nonlinear Systems [10.2] 暗黙的なモデルに依存しないメタラーニング(iMAML)アルゴリズムを制御設定に適合させるメタラーニングベースの制御フレームワークを提案する。
我々はこのフレームワークを二段階最適化問題として定式化し、ストレージの複雑さを低減し、近似の少ない効率的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:04:10 GMT)
Incentive-Aligned Vehicle-to-Vehicle Energy Trading via Nash-Integrated Multi-Agent Reinforcement Learning [10.2] 電気自動車(EV)間の分散ピアツーピアエネルギー交換を可能にするV2Vエネルギートレーディング
既存のアプローチでは、計算の制限を伴う集中的な最適化が必要か、公平性の保証が欠如している。
本稿では、インセンティブに整合したV2Vエネルギー取引において、Nash Bartting SolutionをマルチエージェントのDeep Deterministic Policy Gradient、すなわちNash-MADDPGに統合する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:57:56 GMT)
Learning to Evolve: Multi-modal Interactive Fields for Robust Humanoid Navigation in Dynamic Environments [10.1] マルチモーダル・インタラクティブ・フィールド(MIF)は、信頼を意識したセマンティック3Dガウス・スプラッティング、離散性トリガー付き空間記憶更新、およびクローズドループ認識適応パイプライン内でのタスク駆動幾何再構成を統合したヒューマノイド指向システムである。
実際のダイナミックオフィスのUnitree-G1ヒューマノイドでは、MIFは静的なシーングラフメモリに比べて12%から94%の非静的環境における再配置の成功を改善し、実用的なオンライン操作のための機能蒸留によってセマンティックメモリのフットプリントを91.4%削減した。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:11:43 GMT)
Learning to See Like Humans: Gaze-Aligned Cycling Safety Prediction [10.1] Eye-Tracking-Guided Perceived Cycling Safetyフレームワークは、視線データを視覚変換器に基づくペア学習パイプラインに統合する。
実験により、視線誘導モデルでは、最先端のアプローチと同等のランク付け性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:01:28 GMT)
The TIME Machine: On The Power of Motion for Efficient Perception [10.1] 本稿では,映像表現の中心となるモダリティとして動きを利用する新しい手法を提案する。
特に、ビデオ中の運動をポイントトラックの形で考えると、私たちはマスク付きオートエンコーダを使ってトラックの一部を隠蔽し、オートエンコーダを訓練し、行方不明のトラックを再構築する。
ビデオの表現にモーションを使うことは、ビデオ技術の中核的な限界の両方に実際に対処できることが示される。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:22:42 GMT)
Ratchet: A Minimal Hygiene Recipe for Self-Evolving LLM Agents [10.0] textbfRatchetは、凍結したLLMが自身の自然言語スキルを書き、検索し、キュレートし、リタイアする単一エージェントループである。
Ratchetは4つの候補衛生メカニズムを統合している: 結果駆動型退職、有界アクティブキャップ、メタスキルオーサリングガイダンス、パターン正準化。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:20:38 GMT)
Assisted Counterspeech Writing at the Crossroads of Hate Speech and Misinformation [10.0] ヘイトスピーチと誤報はオンラインでしばしば共起し、偏見と偏見を増幅する。
規模を考えると、専門家の反撃を支援するためにLarge Language Modelsを使用していることが注目されている。
我々は、憎悪と誤情報の両方が共起する文脈でCS生成を研究することによって、このギャップを埋める。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:02:08 GMT)
CLSP-REQA: A Real-Time Quality-Aware Closed-Loop Seizure Prediction Framework with Mamba-BiLSTM and Confidence-Gated Intervention [9.9] CLSP-REQA (リアルタイム脳波品質評価によるクローズドループシーズーア予測)
Real-time EEG Quality Assessment (REQA)モジュールは、Mamba-BiLSTMバックボーンと並行して動作する。
クローズドループニューロ刺激インタフェースと直接互換性のある構造付き4タプルを出力する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:44:40 GMT)
Do Factual Recall Mechanisms Carry over from Text to Speech in Multimodal Language Models? [9.9] 音声とテキストを共同で表現する音声言語モデル(SLM)が提案されている。
これまでにテキストのみのモデルで研究されてきた事実知識のエンコード、保存、検索に焦点をあてる。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:41:39 GMT)
A Visitation Grid for Complete Coverage Foraging in Robot Swarms [9.9] 大規模で未知の環境におけるリソースの完全な収集は、自律ロボット群にとって難しい問題である。
本稿では,余分な訪問を明示的に減らし,最終段階の収集を加速するグリッドベースの採餌戦略を提案する。
提案手法は,ミッションの最終段階において,収集時間を最大33%削減し,収集効率を48%以上向上させる。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:27:49 GMT)
Post-Training is About States, Not Tokens: A State Distribution View of SFT, RL, and On-Policy Distillation [9.9] GSM8K 上で Qwen3-0.6B-Base を用いて, ポストトレーニングを状態分布整形として定式化した。
軽度のSFTランはGSM8Kをほとんど忘れずに改善する一方、ストレスSFTランはかなりの保持損失を引き起こす。
GSM8K, TruthfulQA, MMLUの教師を上回り, 教師を唯一の監督源として用いている。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:03:22 GMT)
N3P: Accelerated Automated Parking via a Learning-Based Naturalistic Three-Stage Scheme [9.8] 自動駐車のための高速学習ベースの3段階フレームワークであるN3Pを提案する。
中間準備ポーズを導入し、学習モジュールを使用して予測することにより、N3Pは操作をより単純なサブプロブレムに分解する。
垂直および平行駐車実験により、N3P強化ハイブリッドA*は計画の80%以上を高速化することが示された。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:56:00 GMT)
AtomicMotion: Learning Human Motion From Different Human Parts [9.7] 私たちは,3つのコアイノベーションを通じて身体のダイナミクスを分離し,再統合するように設計されたフレームワークであるAtomicMotionを紹介します。
まず,スケルトンを機能的意図に基づいて5つの異なるクラスタに分解する論理体分割方式を提案する。
第二に、スパース入力を高次元ポーズに頑健にマッピングするために、マスク付きフルボディプレコンディショニング戦略を採用する。
第3に,バニラ空間的注意の限界に対処し,キネマティック・アテンションを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:39:38 GMT)
Finding Performance Issues in Database Systems by Exploiting Dormant Code Paths [9.7] 本稿では,性能問題を明らかにするために,新しい一般的なホワイトボックス手法であるブランチ・フリップ解析(BFA)を提案する。
BFAは、最適化を強制または無効にするためにコードブランチを反転させ、パフォーマンスはそれほど良くないと予想されている。そうでなければ、パフォーマンスの問題が存在する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:44:08 GMT)
Deterministic vs. Probabilistic Summarisation: An Empirical Trade-off Study in Design Pattern Centric Java Code [9.6] 自動コード要約のための決定論的(ヒューリスティックベース)と確率論的(LLMベース)パイプラインを比較した。
確率論的要約はより強い意味的アライメントとよりリッチな文脈的カバレッジを示し、決定論的アプローチはより簡潔で再現可能な出力を生成する。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:20:31 GMT)
Direct content-based retrieval from music scores images [9.6] この研究は、まず、どのスコアの特徴が検索に最も関係しているかを調査し、注釈付きコーパスからクエリデータセットを構築するための体系的な方法を定義することによって、この分野に寄与する。
また、光学音楽認識(OMR)に依存する書き起こしベースのアプローチから、スコア画像から直接クエリを認識できるように訓練された書き起こしのないトランスフォーマーモデル、テキストプロンプト付き大言語モデルなど、音楽スコア画像のコンテンツベースの検索方法についても検討する。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:59:59 GMT)
Teaching AI Through Benchmark Construction: QuestBench as a Course-Based Practice for Accountable Knowledge Work [9.4] ベンチマーク構築を通じてAIを教えるコースベースのプラクティスを導入する。
学生は学際的な知識を検証可能な専門家レベルの質問に変換する。
学生は結果のタスクでAIシステムを評価する。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:20:07 GMT)
RED: Adaptive Real-Time DAG Scheduling for Robotic Inference under Environmental Dynamics [9.3] リソース制約のあるロボットプラットフォーム上でのマルチタスクディープニューラルネットワークワークロードのためのリアルタイムスケジューリングフレームワークREDを提案する。
スループット、納期満足度、干渉に対する堅牢性、適応性、実行時のオーバーヘッドにおいて、既存のメソッドよりも一貫して向上していることを示す。
我々はNVIDIA JetsonファミリプラットフォームとApple MシリーズMacBookにREDを実装し、実際のロボットシナリオを表すナビゲーション指向のワークロードで評価する。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:44:39 GMT)
Diverse Yet Consistent: Context-Guided Diffusion with Energy-Based Joint Refinement for Multi-Agent Motion Prediction [9.3] 本研究では,歴史トラジェクトリーからのリッチな文脈情報を高齢化することで,マルチエージェント動作予測を改善する拡散型フレームワークを提案する。
相互作用円錐張力をさらに強化するために,個々の軌道の可視性を保ちつつ,接合軌道分布を微細化するエネルギーベースの定式化を導入する。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:25:41 GMT)
VISTA: Validation-Guided Integration of Spatial and Temporal Foundation Models with Anatomical Decoding for Rare-Pathology VCE Event Detection -- after competition results [9.2] RAREVISIONタスクのためのメトリクス整合型マルチバックボーンフレームワークであるVISTAを提案する。
元々の公式な提出は、0.3530のmAP@0.5と0.3235のmAP@0.95を隠蔽テストで達成した。
競争の後、グローバルな粗い探索による局所しきい値の改善により、パフォーマンスは 0.3726 mAP@0.5 と 0.3431 mAP@0.95 に向上した。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:35:02 GMT)
Resilience Characterization of AI-Native Wireless Receivers via Persistent Homology [9.2] ディープラーニングに基づくAIネイティブ無線受信機は、静止チャネル条件下では顕著な性能を示す。
本稿では, 持続的ホモロジーと持続性指数に基づく新しいリアルタイム計量であるトポロジカルレジリエンス指数(TRI)を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:34:31 GMT)
How can reasoning capability empower the AI copilot robot in endoscopic surgery [9.2] 推論能力は、複雑な論理的推論とロボットによる意思決定を大きく進歩させた。
推論により、AIのロボットはマルチモーダルなキューを統合し、外科的意図を解釈し、隠された組織力学を推測できる。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:08:59 GMT)
A Camera-Cooperative ISAC Framework for Multimodal Non-Cooperative UAVs Sensing [9.1] 非協力型無人航空機(UAV)は、統合センシング・通信(ISAC)システムに重大な課題をもたらす。
本稿では,効率的なUAVビームステアリングとトラッキングを実現するために,マルチモーダルセンシングを用いたカメラ協調ISACフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:31:51 GMT)
Optimization over the intersection of manifolds [8.9] 正則性(クリーンな交叉と内在性)が同値であることを証明し、それは交叉の接空間に牽引可能な射影を与える。
本稿では, 1 つの多様体のみにリトラクションを導入し, 2 つの方向に沿って交叉を更新する幾何学的手法を提案する。
内在性の下では、実現可能性と最適性の両方の尺度の収束率を導出し、全ての累積点が一階定常であることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:08:00 GMT)
WebGameBench: Requirement-to-Application Evaluation for Coding Agents via Browser-Native Games [8.7] WebGameBenchは,ブラウザネイティブゲームのための要件 to アプリケーションベンチマークである。
実行時評価器は実際のブラウザで配信されたゲームと対話し、EXCELLENT、USABLE、UNUSABLEという3方向ラベルを割り当てる。
111タスク、12のコーディングエージェント、14の評価設定で、WebGameBenchは現在のシステムを分離する。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:02:32 GMT)
RE-VLM: Event-Augmented Vision-Language Model for Scene Understanding [8.7] 本稿では,RGB画像とイベントストリームを併用した2重ストリーム視覚言語モデルRE-VLMを提案する。
照度チャリングされたシーンをターゲットとしたPEOD-Chatと、さまざまなシナリオをカバーするRGBE-Chatの2つのデータセットを構築した。
キャプションとVQAのベンチマークでは、RE-VLMは最先端のRGBとイベントのみのモデルより一貫して優れている。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:49:07 GMT)
Noise Schedule Design for Diffusion Models: An Optimal Control Perspective [8.7] 拡散モデルにおけるノイズスケジュールを解析・設計するための基本的枠組みを開発する。
この設計問題を最適制御問題として再検討できることが示される。
最適制御問題の目的は、フィッシャー情報を含む機能である。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:32:48 GMT)
TextTeacher: What Can Language Teach About Images? [8.7] TextTeacherは、画像分類トレーニングに追加情報としてテキスト埋め込みを注入する。
標準的なViTバックボーンを持つImageNetでは、TextTeacherは最大2.7ポイントの精度を向上させる。
TextTeacherは無視可能なオーバーヘッドを追加し、ターゲットモデルのマルチモーダルなトレーニングを必要とせず、純粋な視覚モデルの単純さとレイテンシを保持する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:36:00 GMT)
Normative Networks for Source Separation via Local Plasticity and Dendritic Computation [8.6] ブラインドソース分離(ブラインドソース分離、BSS)は、知覚混合物から潜伏原因がどのように回収されるかを研究するためのフレームワークである。
本稿では,局所的な重み更新のみを用いて,BSSの競合性能を実現する予測エントロピー最大化を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:06:28 GMT)
Comparing LLM and Fine-Tuned Model Performance on NVDRS Circumstance Extraction with Varying Prompt Complexity [8.5] そこで本研究では,コード名のみのプロンプトよりも詳細なプロンプトが改良された場合の予測を手作業で行うアルゴリズムを開発した。
我々は,国立暴力死亡報告システムから25の複雑な状況下で,大規模言語モデル (LLM) を微調整したRoBERTaに対して評価した。
論文参考訳(メタデータ) (Thu, 21 May 2026 00:33:52 GMT)
Contractual Skills: A GovernSpec Design Framework for Enterprise AI Agents [8.4] 本稿では,SKILL.mdファイルを可読性のあるタスクコントラクトとして整理するための,GovernSpecにインスパイアされた設計フレームワークであるコントラクトスキルを提案する。
このフレームワークは、コントラクトスキル、GovernSpec YAMLコントラクト、Model Context Protocolサーフェス、ツールアダプタ、ランタイムガードレール、トレース、評価システムの境界を明確にしている。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:40:05 GMT)
AirfoilGen: A valid-by-construction and performance-aware latent diffusion model for airfoil generation [8.3] 翼形状設計は航空宇宙工学の基本的な課題であり、飛行安定性と燃料消費に直接影響を及ぼす。
既存の深い生成的アプローチは、幾何的妥当性と物理的可制御性の両方に制限されている。
本稿では,エアフォイルの有効構成と性能を考慮した潜時拡散モデルであるAirfoilGenを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:01:41 GMT)
AgroVG: A Large-Scale Multi-Source Benchmark for Agricultural Visual Grounding [8.1] 一般化された集合予測として農業接地を定式化するベンチマークである textbfAgroVG を導入する。
AgroVGは6つのファミリーすべてにわたるバウンディングボックスのグラウンドと、信頼できるインスタンスレベルのピクセルアノテーションを持つソースに基づくインスタンスマスクグラウンドをサポートする。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:10:58 GMT)
A Comparative Evaluation of Structural Topic Models and BERTopic for Short, Open-Ended Survey Responses [8.1] 本稿では,確率論的トピックモデルであるStructure Topic Models (STM)と埋め込みモデルであるBERTopicを比較し,オープンエンドサーベイ応答の分析を行った。
以上の結果から,BERTopicはSTMよりも高いトピックコヒーレンスを連続的に生み出すことができた。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:00:40 GMT)
TWINGS: Thin Plate Splines Warp-aligned Initialization for Sparse-View Gaussian Splatting [8.1] スパースビュー入力からの新たなビュー合成は、3Dコンピュータビジョンにおいて重要な課題となっている。
本稿では,3次元ガウススプラッティング(3DGS)を強化するフレームワークであるTWINGSを紹介する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:07:37 GMT)
Explainable AI for Data-Driven Design of High-Dimensional Predictive Studies [8.0] 我々は,既存の解釈可能な統計モデルの予測性能を向上させるために,探索型AIレコメンダを開発し,評価する。
このフレームワークは、柔軟なAIモデリングを使用して、複雑なデータパターンをキャプチャし、説明可能なAIテクニックを使用して、パターンを3つの推奨型に変換する。
提案されたExploratory AI Recommenderは、高次元透明予測モデルの開発プロセスとパフォーマンスを改善するために、説明可能なAIとデータ駆動型研究設計の可能性を示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:50:14 GMT)
Conceptualizing Embeddings: Sparse Disentanglement for Vision-Language Models [8.0] CEDARは, 次元を増大させることなく, 予め訓練した埋め込みの組成構造を明らかにする手法である。
CLIPのようなアーキテクチャでは、個々の座標はテキストの概念で解釈できるが、BLIPのような生成モデルでは自然言語記述にデコードできる。
この結果から,視覚言語表現における明らかな絡み合いは,適切な基底変化によって解決できることが示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:23:34 GMT)
Decomposing Ensemble Spread in Lorenz '96 With Learned Stochastic Parameterizations [8.0] 運用のアンサンブル予測は、予測拡散を通じて不確実性を表現することを目的としている。
広範に使われている制御テストベッドとして,2スケールのLorenz 1996システムを用いる。
アンサンブル摂動はシステムの長期的分散を増大させるものではないことを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:48:10 GMT)
Short-Term-to-Long-Term Memory Transfer for Knowledge Graphs under Partial Observability [7.8] 時間的知識グラフメモリ設定における転送過程について検討する。
観察された各トリプルに対して、エージェントは長期挿入前にそれを保持またはドロップするかを選択する。
長期記憶容量128のRoomKGベンチマークでは、シンボリックおよびニューラルベースラインよりも優れた転送決定を学習した。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:14:36 GMT)
Chinese sensorimotor and embodiment norms for 3,000 lexicalized concepts [7.8] マンダリン中国語における3000の語彙化概念に関する新しい規範データベースを提案する。
感性評価は純粋言語表現からほぼ回復可能であることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:29:33 GMT)
Neural Flow Operators can Approximate any Operator: Abstract Frameworks and Universal Approcimations [7.8] ニューラルネットワークとニューラル演算子のための抽象的ニューラルフローフレームワークを導入する。
このフレームワークは、2つの連続的な深度モデル、すなわち構成と分離構造を持つニューラルフローを含んでいる。
我々は, 対応するニューラルフローに対して, 正当性および普遍近似特性を証明した。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:39:43 GMT)
Long-term Fairness with Selective Labels [7.7] 選択ラベル設定における長期的公正性について検討し、単純解が公平性を保証するものではないことを解析的に示す。
本稿では,選択ラベルを用いた長期的公正意思決定のための新しい強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:42:56 GMT)
Deep Reinforcement Learning for Flexible Job Shop Scheduling with Random Job Arrivals [7.6] 本稿では、フレキシブルジョブショップスケジューリング問題を解決するために、イベントベースのglsDRLアプローチを提案する。
具体的には、近似ポリシー最適化アルゴリズムを用い、軽量多層パーセプトロンを用いてglsDRLエージェントを訓練する。
提案手法は,データセットが不均一である場合,特に良好な性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:33:09 GMT)
Suicide Risk Assessment from AI-powered Video Surveillance: An Interpretable Framework for Prevention in Metro Stations [7.6] 我々は、地下鉄駅における自殺リスクアセスメント(SRA)のタスクを形式化し、この課題に対処する最初の解釈可能な枠組みを導入する。
孤立したサブタスクに焦点を当てたり、直接意図を推測しようとするアプローチとは異なり、我々の定式化は蓄積された証拠から自殺リスクを評価する。
この研究は、自殺リスク評価の複雑さを強調し、社会的善のための解釈可能なAIシステムの研究のための新たな方向性を開く。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:45:33 GMT)
Which Way Did It Move? Diagnosing and Overcoming Directional Motion Blindness in Video-LLMs [7.5] ビデオ大言語モデル (Video-LLMs) は時間的ビデオ理解を急速に進歩させた。
多くのビデオ-LLMは基本的な知覚的プリミティブ:署名された画像-平面運動方向で失敗する。
ビデオ-LLMパイプラインを通して動き方向情報を追跡することで、障害をローカライズする。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:59:56 GMT)
Rethinking Noise-Robust Training for Frozen Vision Foundation Models: A Cross-Dataset Benchmark with a Case Study of Small-Loss Failure [7.5] 軽微な分類ヘッドを持つ凍結視覚基礎モデル (VFM) は、医用画像の撮影にますます利用されている。
5つの医療データセット,3つのバックボーン,2つのノイズタイプ,5つのノイズレートにまたがる8つのノイズラベル手法のベンチマークを示す。
我々は,エビデンスに基づく指導と,実践的な勧告のための低信頼度特徴空間セレクタで締めくくる。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:02:44 GMT)
Scene Abstraction for Lexical Semantics: Structured Representations of Situated Meaning [7.5] 本稿では,単語が使用状況にまたがって参加する解釈シーンの構造化表現を構築するためのフレームワークであるScene Abstractionを提案する。
筆者らのコントリビューションは,(1)語彙的意味を示す構造的表現フレームワーク,(2)COCA-Scenes,(2)26のキーワードにまたがる520のユースケースのデータセット,(3)シーンが人間の観察者間で確実に識別可能であることを示す2つの実験から得られた実証的証拠である。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:26:53 GMT)
CrossVLA: Cross-Paradigm Post-Training and Inference Optimization for Vision-Language-Action Models [7.5] われわれは,クロスパラダイム・ビジョン・ランゲージ・アクション(VLA)のポストトレーニングに関する実証的研究であるCrossVLAを報告する。
i) 確率フローODE統合なしでDPOを連続動作バックボーンで操作できる代理フローマッチングログ確率推定器、(ii) VLA DPOのパラメータ係数層としてのLoRAとDoRAの頭と頭の比較、(iii) ノイズループを示す推論時間解剖学は、サンプル_actions遅延の78.6%、プレフィックス-K/Vキャッシングのラを支配している。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:02:41 GMT)
Transcoders Trace Visual Grounding and Hallucinations in Vision-Language Models [7.4] 生成的視覚言語モデル(VLM)は多モーダル推論においてよく機能するが、視覚入力がテキストにどのように変換されるかは理解されていない。
我々はトランスコーダに基づく関数中心のフレームワークを採用し、レイヤワイドの因果プロキシとして機能するサブレイヤのスパース近似を採用した。
本稿では,関数中心回路の分解により,VLMにおけるマルチモーダル計算の解釈と予測が可能であることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:34:39 GMT)
Diffusion-based Denoising Beats Vanilla Score Matching in Parameter Estimation: A Theoretical Explanation [7.4] バニラスコアマッチングはマルチモーダル分布の最大推定値に対して非効率であることが示されている。
両推定器の統計的保証を証明し,モード間の分離が増加すると,バニラの誤差が悪化することを示した。
これは、バニラ版よりも拡散ベースのスコアマッチングの優れた振る舞いについて、新しい理論的な説明を提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:25:22 GMT)
Device-Independent Quantum Secret Sharing Protocol Enhanced by Advantage Distillation [7.4] デバイス非依存の量子シークレット共有(DI-QSS)は、デバイスを信頼する必要をなくし、高いセキュリティを提供する。
この研究は、2-party quantum key distribution (QKD)から3-party DI-QSSへの利点の蒸留を拡張した。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:42:22 GMT)
PACE: Two-Timescale Self-Evolution for Small Language Model Agents [7.3] 本研究では,凍結型小言語モデル (SLM) が資源制約下で有効な自己進化エージェントとして機能するかどうかを考察する。
PACE(Prompt And Control Logic Evolution)は,低リスクのプロンプト改善と高リスクの制御論理更新を協調する2段階のフレームワークである。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:42:06 GMT)
Open Multimodal Datasets and Open-Source Software for Data-Driven Modeling of Multiphase Transport and Thermal Systems [7.1] 本稿では,AI対応熱流体研究のためのマルチモーダルデータセットとオープンソースソフトウェアパッケージのオープンエコシステムを提案する。
我々は,ボイリング画像,音響・熱計測,高速ビデオ,赤外線サーモグラフィ,耐熱測定,CFD生成フィールド,設計ファイル,音響放射データにまたがるパブリックNED3データセットを整理した。
BubbleID, SeqReg, CFDTwin, IRISApp, decode-wfs, AELab, FlowLabなど,コンピュータビジョン, シーケンスレグレッション, 代理モデリング, 赤外線解析, 波形復号, 音響エミッション解析などの補完ソフトウェアパッケージについても述べる。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:02:32 GMT)
Self-Policy Distillation via Capability-Selective Subspace Projection [7.0] 自己蒸留は、自分自身の世代でトレーニングすることで、大きな言語モデルをブートストラップする。
本稿では,外部信号なしで汎用的かつ選択的に機能する自己ポリシィ蒸留(SPD)を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:18:41 GMT)
Building an Open Source Operational Technology Pentesting Platform: Lessons from LINICS [6.9] IT(Information Technology)セキュリティの専門家は、Kali Linuxのようなオープンソースのプラットフォームにアクセスできる。
しかし、産業制御システムを支えるオペレーショナル・テクノロジー(OT)にはそのようなプラットフォームは存在しない。
我々は、OTペンテスティングとセキュリティ分析のためのオープンソースのプラットフォームであるLINICSを設計、構築、リリースした経験について論じる。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:02:12 GMT)
Symmetries Here and There, Combined Everywhere: Cross-space Symmetry Compositions in Robotics [6.8] クロススペース対称性合成は、複数の対称性に相同なロボットポリシーを学ぶためのフレームワークである。
両腕ロボットのシミュレーションおよび実世界実験の枠組みを検証した。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:43:31 GMT)
Weak wave turbulence as a precursor to universal coarsening in a homogeneous Bose gas [6.8] 孤立した低エネルギーボース気体の緩和と凝縮は、遠方平衡多体力学の普遍的な特徴を研究するのに理想的な条件となる。
調整可能な相互作用を持つ均一なボース気体に対して、弱波乱流(WWT)の枠組みの中で、前者は普遍的な記述を持つことを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:00:19 GMT)
Scout-Assisted Planning for Heterogeneous Robot Teams under Partially Known Environments [6.8] 本稿では,情報ゲインに基づくアクション・プルーニングを提案する。
実験の結果、SAPとInformation Gain Action Pruningは、カナダ旅行問題のベースラインを上回り、地上ロボットの走行コストを31.9-37.7%削減した。
我々は,情報ゲイン誘導型スカウトは実世界の展開において,より効果的かつ計算的に実現可能であると結論付けている。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:36:55 GMT)
HawkesLLM: Semantic Uncertainty Propagation in Agentic Text Simulation [6.7] エージェント・テキスト・シミュレーション・システムは、各項目が後段のコンテキストとなるように、順番に書き込む。
本稿では,テキスト生成から時間的影響モデリングを分離するフレームワークであるHawksLLMを用いて,この問題を考察する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:17:34 GMT)
Computable lower bound of the parameterized entanglement monotone [6.7] 2種類の絡み合いモノトンの下限、すなわち$q$-concurrence(q>1$)と$$-concurrence(01$)について検討する。
我々は、情報的に完備な$N$, $M$)-正の演算子評価測度 [(N$, $M$)-POVM] に照らして、$frac121$, $1q2$ for two-qudit state, and the case of $2leqslant q3$
論文参考訳(メタデータ) (Thu, 21 May 2026 08:35:02 GMT)
Thermodynamic Irreversibility of Training Algorithms [6.6] トレーニングアルゴリズムの不可逆性を定義し解析するための一般的な枠組みを確立する。
動的プロセスの不可逆性を特徴づける4つの異なる方法が,ステップサイズにおける先行順序と等価であることを示す。
可逆性は時間反転対称性を破る創発的な力を生み出し、非等尺的連続的パラメータ化対称性を総称的に破る。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:04:44 GMT)
QT-PUF: Quantum Tunneling Leakage Based PUF for Implantable IoMT Devices [6.6] Internet of Medical Things (IoMT)は、接続されたウェアラブルとインプラント可能なデバイスを通じて、継続的な監視とパーソナライズされたケアを可能にする。
物理的な妥協や偽造は、患者の安全、プライバシー、データの整合性を脅かす可能性がある。
本研究はQT-PUF, a gate-tunneling-leakage-based physical unclonable function (PUF)を提示する。
ピコアンペアレベルのリーク変動をディジタル応答に変換するために,擬似抵抗I-to-Vを用いた差分読み出し回路を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:46:02 GMT)
PIMbot: A Self-Adaptive Attack Framework for Adversarial Manipulation of Multi-Robot Reinforcement Learning [6.6] PIMbotは、2つの補完的なレバーを介して結果を操作するフレームワークである。
我々の研究は、近年のマルチエージェントRL社会ジレンマにおいて、操作に対する新しいアプローチを導入している。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:50:47 GMT)
Behavior-Guided Candidate Calibration for Multimodal Recommendation [6.5] より強い合意はレコメンデーション固有のバリエーションを抑制する一方で、適度なクロスビューの合意が役立ちます。
トレーニングのみのコユーザオーバーラップを署名された候補エビデンスに変換する行動誘導型候補キャリブレーションモデルを提案する。
Amazon Baby、Sports、Electronicsの結果は、強力なマルチモーダルベースラインよりも一貫して伸びている。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:10:40 GMT)
Two is better than one: A Collapse-free Multi-Reward RLIF Training Framework [6.5] 内部フィードバックからの強化学習は、スケーラブルで教師なしの代替手段として最近登場した。
本稿では,学習信号を2つの補完成分に分解するマルチリワードRLIFフレームワークを提案する。
提案手法は,外部の地平監督に頼らずに,安定した長距離推論を支援することができることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:30:47 GMT)
From Sequential Nodes to GPU Batches: Parallel Branch and Bound for Optimal $k$-Sparse GLMs [6.4] 分岐およびバウンド(BnB)における異種ノードを処理する汎用的なモジュラーフレームワークを提案する。
このフレームワークはGPU効率の小さなルーチンを中心に構築されており、パディングと軽量のカスタムカーネルを使って不規則なノードデータ構造を処理する。
実験では、挑戦するインスタンスに対して1から2桁のスピードアップと最適性ギャップがゼロであることが示されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:56:15 GMT)
At What Cost? Software Developers' Well-Being in the Age of GenAI [6.4] Generative Artificial Intelligence(GenAI)は、ソフトウェア開発を急速に変えつつある。
このような次元に重きを置いていると、開発者の幸福にとって重要な意味を見落としてしまうリスクがあります。
GenAIツールは認知負荷を増幅し、新しいタイプの監視労働を導入し、アウトプットとペースに関する期待をエスカレートする。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:35:31 GMT)
Seizure-Semiology-Suite (S3): A Clinically Multimodal Dataset, Benchmark, and Models for Seizure Semiology Understanding [6.3] Seizure-Semiology-Suiteは、微細で構造化されたてんかんのセミロジー理解のための臨床基盤となるデータセットである。
データセットには、20438AE定義のセミロジカルな特徴をカバーする35,000以上の高密度ラベルで注釈付けされた438個の発作ビデオが含まれている。
低レベルの視覚知覚から時間的シークエンシング、物語レポート生成、発作診断に至るまで、MLLMを体系的に評価する7つの階層型ベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 00:57:39 GMT)
Winner-Take-All bottlenecks enforce disentangled symbolic representations in multi-task learning [6.2] Winner-take-all(WTA)ネットワークは、脳の皮質ネットワークにおける中心回路モチーフである。
ディープニューラルネットワーク内のWTAボトルネックは、特定の明確に定義された条件下で、データのカテゴリ的潜在因子の抽出に有効であることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:33:08 GMT)
What Training Data Teaches RL Memory Agents: An Empirical Study of Curriculum Effects in Memory-Augmented QA [6.2] 強化学習(Reinforcement Learning, RL)は、マルチセッション対話において、外部記憶バンクを推論するためにLLMエージェントを訓練するための実行可能なレシピとして登場した。
本稿では、アーキテクチャ、RLアルゴリズム、および全てのハイパーパラメータを固定し、3つの条件でトレーニングカリキュラムだけを変化させる制御された経験的研究について述べる。
2つのベンチマークと10の質問タイプにまたがって、カリキュラム構成はパフォーマンスの均一なスケーリングファクタではなく、特殊化の細かいレバーとして機能する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:58:10 GMT)
Regret-Based $(ε,δ)$-optimal Stopping Criteria for Bayesian Optimization [6.1] GP上信頼度境界(GP-UCB)について,任意の繰り返しにおいて,より厳密な即時後悔境界を示す。
次に,この厳密な境界に基づいてGP-UCBの停止基準を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:42:31 GMT)
Synthetic Data Alone is Enough? Rethinking Data Scarcity in Pediatric Rare Disease Recognition [6.1] 小児まれな疾患認識のための合成専用体制について検討した。
合成のみのトレーニングは、実データのみのベースラインに匹敵するパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:28:11 GMT)
CASE-NET: Deep Spatio-Temporal Representation Learning via Causal Attention and Channel Recalibration for Multivariate Time Series Classification [6.1] 構造多様体プレコンディショニングのためのアーキテクチャであるCausal Attention and Spatio-temporal Network (CASE-NET)を提案する。
CASE-NETは、仮面の自己意図と因果の畳み込みを通じて、物理的に時間的制約を強制する因果的テンポラルを相乗化する。
総合的な評価は、CASE-NETが4つのタスクに対して新しい最先端のベンチマークを確立し、AWRデータセットで98.6%のピーク精度と非定常状態における優れた堅牢性を達成していることを示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:30:35 GMT)
F-TIS: Harnessing Diverse Models in Collaborative GRPO [6.1] Filtered Truncated Importance Smpling (F-TIS)はGRPOスタイルのトレーニングパラダイムであり、ローカルモデルの学習を改善するために、オフ・ポリティクスのサンプルを使用することができる。
F-TISは、純粋に政治訓練と同一の最終モデル収束を示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:25:24 GMT)
When Irregularity Helps: A Subclass Analysis of Inductive Bias in Neural Morphology [6.1] 非常に小さく、構造的に特異的な不規則なサブタイプが、モデルエラーの不均等な共有であることを示す。
これらの結果から, 過度な低周波形態素パターンと特定の形態素過程との相互作用により, 誤差濃度が誘導されることが示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:18:49 GMT)
Mind Your Moras: Orthography-Aware Error Analysis of Neural Japanese Morphological Generation [6.1] 本報告では, 日本語の過去の形態変化の正書法に基づく誤り解析について述べる。
SIGMORPHON 2020 と 2023 の共有タスク規約に従ってフォーマットされたデータセットを用いて,過去センス形成における2つの文字レベルのシーケンス・ツー・シーケンスアーキテクチャの評価を行った。
高い集約精度にもかかわらず、モデルはヒラガナの特定の正書法特性を囲む体系的、言語学的に解釈可能な誤りを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:24:41 GMT)
CCLab: Adversarial Testing of Learning- and Non-Learning-Based Congestion Controllers [6.1] 渋滞制御器 (CC) はネットワーク性能に重要であるが, 悪条件下での堅牢性は十分に理解されていない。
我々は,学習ベースと非学習ベースの両方のCCの堅牢性を評価するための,敵対的なテストフレームワークであるCCLabを紹介する。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:38:08 GMT)
The Signal in the Noise: OOD Detection Through Goodness-of-Fit Testing in Factorised Latent Spaces [6.0] 単サンプルレベルでのOOD検出のための新しい手法として、SITN(Signal in the Noise)を提案する。
SITNはOODデータへのアクセスを必要とせず、最小の計算オーバーヘッドを発生させ、偽陽性率の厳格な制御を提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:47:49 GMT)
A strongly annotated passive acoustic dataset for tropical bird monitoring [6.0] PteroSetは,コロンビアのプエルト・アシス(プトゥマヨ)とピビジェイ(マグダレーナ)で記録された,注釈付き異方性鳥の声化のデータベースである。
データセットは、563の記録(73.62h)と15,372の時間周波数アノテーションを含む。
我々はPteroSetのユーザビリティとそれがもたらす課題を実証し、二分鳥検出のためのディープラーニングベースラインを提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:34:42 GMT)
Spectra as Language: Large Language Models for Scalable Stellar Parameter and Abundance Inference [5.8] 大規模な分光調査は前例のない分光データを蓄積している。
大規模言語モデルの最近の進歩は、自然言語処理のようなタスクにおける強力な一般化と特徴学習を示している。
そこで本研究では, 有効温度, 表面重力, 金属量, および20種類の化学元素の存在量を正確に推定できる, 恒星パラメータ推定のための2段階の大規模言語モデルフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:33:47 GMT)
Realizing tunable non-Hermitian skin effects in dynamical quantum systems via the relative phase between multiple time-periodic driving [5.8] 本研究では,複数周期駆動の相対位相が,非エルミタンスキンモードの出現方向と良好な位置を決定できることを示す。
我々の定式化は、様々な光学的および機械的プラットフォームで一般的に実現でき、調整可能な皮膚密度プロファイルを実現するための道を開くだろう。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:45:48 GMT)
What Does the Caption Really Say? Counterfactual Phrase Intervention for Compositional Data Selection in Vision-Language Pretraining [5.7] CLIPスタイルのコントラスト事前トレーニングは、通常、サンプルレベルのフィルタリング信号を使用してWebスケールの画像テキストペアをキュレートする。
粗いミスマッチが取り除かれたら、より厳密なグローバルフィルタリングは、保持されたキャプションによって提供される構成上の監督をもはや追跡しない。
本稿では,制御されたナンストケン置換を画像条件付きフレーズセンシティブスコアに変換するフレーズレベルキュレーションフレームワークであるCPIを用いてこの問題に対処する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:55:15 GMT)
Can Transformers Learn to Verify During Backtracking Search? [5.7] バックトラック探索は古典的な制約解決者、プランナー、定理証明者の基礎となる。
最近の変圧器に基づく推論システムは, 探索木を自身の中間ステップで探索する。
累積トレースで訓練されたデコーダのみの変換器は、この要件を2つの方法で満たさないことを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:26:01 GMT)
Astragalus: Automatic Configuration Repair for Production Networks [5.6] ネットワーク構成はエラーを起こしやすいため、破滅的なサービス停止につながる可能性がある。
自動構成修復(ACR)のための既存のツールは、セマンティック駆動のアプローチに従っている。
我々は,ACRの構文駆動型メソッドであるAstragalusを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:32:22 GMT)
An Improved Adaptive PID Optimizer with Enhanced Convergence and Stability for Deep Learning [5.6] 適応型PID (AdaPID) は運動量に基づく勾配降下の効率的な方法である。
AdaPIDはAdamから2つの重大な欠点、すなわち収束と安定性の問題を引き継いでいる。
本研究では,AdaPIDに勾配差に基づく変調係数を導入し,収束と安定性の問題を修正する。
我々は、ベンチマークデータセット(MNIST、CIFAR10)や実世界のデータセット(IARC、AnnoCerv)を含む複数のデータセットで提案したデータセットを評価する。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:57:05 GMT)
Robustness of breast lesion segmentation under MRI undersampling improves with k-space-aware deep learning [5.6] 胸部ダイナミックコントラスト強調画像(DCE-MRI)を用いた。
我々は、4つの3D U-Net 変種を比較した: ハイブリッドk-スペース・ツー・イメージモデル、ネイティブk-スペースモデル、等級と複雑な画像空間のベースライン。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:18:26 GMT)
Search-E1: Self-Distillation Drives Self-Evolution in Search-Augmented Reasoning [5.6] ポストトレーニングは、言語モデルを有能な検索強化推論エージェントに変えるための主要なレシピとなっている。
本稿では, オフラインで自己蒸留したバニラGRPOのみを用いて, 探索拡張エージェントを改良する自己進化手法であるSearch-E1を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:00:57 GMT)
PITMuS: A Tool for Automated Bug Dataset Generation via Source-Level Mutant Reconstruction [5.6] PITMuSは、バイトコードレベルで突然変異を実行するJavaの突然変異テストツールである。
PITMuS XMLメタデータとコンパイルされたJavaクラスファイルからのデバッグ情報を組み合わせて、各ミュータントに対応するソース編集をローカライズし、再構築する。
ソースレベルのバグと固定コードペア、ドキュメントコンテキスト、下流のトレーニングと評価のためのメタデータを含む構造化データセットを生成する。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:59:19 GMT)
Simulating Hate Speech Cascades with Multi-LLM Agents: Empirical Grounding, Modeling Fidelity, and Intervention Strategies [5.5] 我々は,3つの憎しみのあるブルースキーカスケードと,サイズが一致した良性制御について検討した。
実証データでは、97.4--99.7%の投稿者が敵対的な姿勢をとっていることがわかった。
シミュレーションにおいて、マルチLLMエージェントシミュレータは、スタンスモノカルチャーと毒性デルタ方向を再現する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:58:26 GMT)
DRL-Driven Edge-Aware Utility Optimization for Multi-Slice 6G Networks [5.5] 6Gネットワークで配信される仮想現実(VR)サービスは、シームレスなユーザエクスペリエンスを保証するために、超低レイテンシと高帯域幅を必要とする。
本稿では,DQN(Deep Q-Network)学習を活用した,6G O-RANネットワークのためのインテリジェントなリソース割り当てとエッジキャッシュフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:44:27 GMT)
Minimum Description Length based Granular-Ball Tree Regularization for Spectral Clustering [5.4] 本稿では,最小記述長に基づく粒界木規則化スペクトルクラスタリング法を提案する。
提案手法は, 局所的MDLモデル選択によるグラニュラーボールツリーの構築と, 信頼性の高い局所接続を断ち切るスプリットの回避に使用される相反する近傍連続性を実現する。
実データと合成データを用いた実験により,MDL-GBTRSC は適用された固定構成プロトコルの下で最高の平均 ARI と NMI を達成することが示された。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:36:24 GMT)
Dreaming Smoothly and Sample Efficiently with Gradient Penalized Latent Dynamics [5.4] 本稿では, 局所的スムーズな遷移学習を促進するために, 後部潜伏分布に行ワイドジャコビアンペナルティを適用するDreamerV3の潜伏動的正規化器を提案する。
このペナルティは、離散埋め込み状態 MDP における遷移則の有限差分平滑化の連続ラテントアナログとして解釈できることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 22:40:40 GMT)
Beyond Euclidean Proximity: Repairing Latent World Models with Horizon-Matched Trajectory Reachability Metrics [5.4] 一般的な潜時MPCでは、候補列は予測終端状態と目標潜時状態の間のユークリッド距離によってランク付けされる。
固定潜在世界モデルのためのポストホック終端階法であるトラジェクトリ・リーチビリティ・メトリクス(TRM)を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:34:57 GMT)
SGR-Bench: Benchmarking Search Agents on State-Gated Retrieval [5.3] 専門的な検索タスクのクラスは、まだ不足している。
我々は、この機能をステートゲート検索(SGR)と呼ぶ。
SGR-Benchはこの設定のためのベンチマークで、6つのソースファミリーと12のパブリックデータエコシステムにまたがる100の専門家によるタスクを含んでいる。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:22:48 GMT)
Don't Forget the Critic: Value-Based Data Rehearsal for Multi-Cyclic Continual Reinforcement Learning [5.3] 多サイクル設定におけるQ値正規化を用いたディープQ-Networksのデータリハーサルについて検討する。
本稿では,(1)学習中に格納されたQ値の動的収集と更新を行う連続データリハーサルと,(2)最初のタスクの直後に適用される"No-Wait"正規化の2つの簡単な修正を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:19:50 GMT)
Finite-Particle Convergence Rates for Conservative and Non-Conservative Drifting Models [5.3] 一段階生成モデルのための保守的ドリフト法を提案し,解析する。
この方法は、元の変位に基づくドリフト速度をカーネル密度推定器(KDE)の勾配速度に置き換える。
また,非保存ドリフト法をLaplaceカーネルを用いて解析し,インシクデング2026ドリフト法を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:49:09 GMT)
MambaGaze: Bidirectional Mamba with Explicit Missing Data Modeling for Cognitive Load Assessment from Eye-Gaze Tracking Data [5.3] 視線追跡信号によるリアルタイム認知負荷評価は、適応的な人間中心AIを可能にする可能性がある。
我々は、瞬きや障害追跡から頻繁にデータ不足を処理するフレームワークであるMambaGazeを提案する。
我々は,MambaGazeが76.8%,73.1%の精度でCNN,Transformer,ResNet,VGGのベースラインを4-12ポイント上回っていることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:33:41 GMT)
CogAdapt: Transferring Clinical ECG Foundation Models to Wearable Cognitive Load Assessment via Lead Adaptation [5.3] CogAdaptは、臨床ECGファンデーションモデルをウェアラブル認知負荷評価に適用するフレームワークである。
LeadBridgeは、学習可能なアダプタで、3本リードのウェアラブル信号を解剖学的に一貫性のある12本リードの表現に変換する。
ProFineは段階的な微調整戦略であり、徐々にエンコーダ層を凍結し、破滅的な忘れを防いでいる。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:33:35 GMT)
On the Reliability of Code Comprehension Proxies [5.2] 本稿では, 現存する文献に共通するプロキシの集合の相対的信頼性を, 人間の一対の研究で検証する。
まず,5人のプロソフトウェアエンジニアのパネルで専門家・コンセンサス研究を行い,8つのコードスニペットの真真正性ランキングを確立した。
第2に,課題を完了した44名の学生を対象に,論文から得られた14の理解プロキシを8つのコードスニペットのセットで測定した。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:30:06 GMT)
Grand Challenges for the Convergence of Computational and Citizen Science Research Workshop Report [5.2] 本報告は,2025年4月8~9日にワシントンD.C.で実施された,計算・市民科学の収束のためのグランドチャレンジに関するビジョンワークショップの結果である。
市民科学は測定可能な経済価値と国家価値を提供する。
市民科学の分散的、協力的、長期的、文脈的な性質は、新しい堅牢な研究基盤のための現実のユースケースとして要求される。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:19:08 GMT)
Eroding Trust in Real Speech: A Large-Scale Study of Human Audio Deepfake Perception [5.1] 本稿では,現在までの音声深度知覚における最大の聴取方法について紹介する。
138音声・音声変換システムを対象に,1,768人の被験者から35,532人の判定を収集した。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:22:44 GMT)
Flow-based Gaussian Splatting for Continuous-Scale Remote Sensing Image Super-Resolution [5.1] FlowGS は RSI の任意のスケール SR のための生成的再構成フレームワークである。
連続的な特徴場を構築するために2次元ガウススプラッティングを用い、任意のクエリ箇所で柔軟な再構成を可能にする。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:19:09 GMT)
Industrial Dual-Arm Box Handling via Online Inertial Estimation and Convex Wrench Optimization [5.0] 産業用ロボットのオブジェクトハンドリングは、しばしば、前もって質量と質量の中心が分かっていない箱やパッケージを伴っている。
本稿では、未知の慣性特性を持つ物体に対する摩擦対応デュアルアームボックスハンドリングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:40:59 GMT)
Real-Time Auto-Optimization in Unknown Environments via Structure-Exploiting Dual Control for Exploration and Exploitation [5.0] 本稿では,探索と利用のための高速な数値二重制御法を開発した。
未知の環境における自動最適化問題に対処する。
約1桁のスピードアップを実現し、典型的な車両組み込みCPU上では、マイクロ秒レベルの最大時間は83秒に過ぎない。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:55:48 GMT)
LACO: Adaptive Latent Communication for Collaborative Driving [5.0] 協調運転は、接続された車両が部分的な観測可能性の下で協調できるようにすることで、安全性と効率を向上させることを目的としている。
近年のアプローチは、認知のための視覚的特徴を共有することから、行動調整の基礎モデルを通して言語ベースの推論を交換することへと進化してきた。
複数エージェント設定に固有の制約の下で協調運転における潜時通信を解析する。
LACOは、トレーニング不要のtextbfLAtent textbfCOmmunication パラダイムで、事前学習した運転モデルを協調的な設定にシームレスに適応する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:54:29 GMT)
Slimmable ConvNeXt: Width-Adaptive Inference for Efficient Multi-Device Deployment [5.0] 我々は、Slimmable ConvNeXtを紹介し、ConvNeXtの現代的な設計、特にLayerNormと逆ボトルネックは、チャネル幅のスリム化に特に適していることを示している。
ImageNet-1kでは、Slimmable ConvNeXt-T with 3worksは、4.5 GMACsで80.8%、1.2 GMACsで77.4%、スクラッチから600 epochsでトレーニングされた。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:20:18 GMT)
Relational Linear Properties in Language Models: An Empirical Investigation [5.0] この研究は、リレーショナル線型性に焦点をあてる: 固定された関係に対して、対象の非埋め込みは、対象の埋め込みから線形写像によって予測できるという仮説である。
Kullback-Leibler の発散に基づく探索手法を導入し,この特性を評価し,層間およびパラフレーズ付き関係クエリの変動について検討する。
その結果, 関係線形性はモデルによって異なり, モデル表現における言語情報に関する先行観測と整合した階層的パターンが示され, 関係の表現の仕方の変化によって異なることが示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:22:27 GMT)
Phase-tunable remote nonreciprocal charging in waveguide QED [4.9] 遠隔量子電池充電のための位相可変導波路QEDアーキテクチャを提案する。
駆動型充電器と遠隔バッテリーは、エンジニアリングされた導波路経由の干渉によってのみ結合される。
分析の結果,非相互性と記憶効率は独立して設計できることがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:31:41 GMT)
How Sparsity Allocation Shapes Label-Free Post-Pruning Recoverability [4.9] プレニング後の修復法は部分的に崩壊したスパースモデルを復元できるが、その有効性は上流のプルースアロケーションが残したスパースモデルに依存する。
本稿では, 固定されたアクティベーション統計補修バックエンドにおいて, 空間配置が修復後の回復性にどう影響するかを考察する。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:03:24 GMT)
ProcBench: Evaluating Process-Level Defects and Control Preservation in LLM Coding Agents [4.9] ProcBenchは、LLM符号化エージェントの実行プロセス評価のベンチマークである。
再帰的な実行欠陥を再利用可能なオントロジーに整理し、標準化されたプロセスエビデンスを通じてエージェントの軌道を評価する。
我々は,AndroidBench, TerminalBench, SWE-bench-Verifiedの3つのベンチマークから採取した200例についてProcBenchを評価した。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:33:40 GMT)
A Constant-Time Implementation Methodology for Activation Functions on Microcontrollers [4.9] 本研究では,組込みマイクロコントローラ上でのアクティベーション関数の一定時間実装手法を提案する。
提案手法は、分岐なし選択、固定コストパデに基づく近似、必要ならばダミー算術、サイクルアライメントを組み合わせることで、タイミング規則のアクティベーション関数の実装を得る。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:11:28 GMT)
SE3Kit: A Lightweight Python Library for Specialized Geometric Primitives in Robotics [4.9] SE3Kitは、特殊ユークリッドグループSE(3)と特殊直交グループSO(3)上のPythonライブラリである。
組み込みデプロイメント、迅速なプロトタイピング、教育用に設計され、厳密な数学的実装を提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:39:59 GMT)
LLM Code Smells: A Taxonomy and Detection Approach [4.9] 大規模言語モデル(LLM)は、様々な目的のためにソフトウェアシステムに統合されつつある。
本稿では, 自己完結型分類法と, 9種類のLDMコードの臭いのカタログについて述べる。
また、検出のための静的ソースコード解析ツールであるSpecDetect4LLMも作成しています。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:10:08 GMT)
Flow Mismatching: Unsupervised Anomaly Detection via Velocity Discrepancies in Flow Matching Models [4.9] 再建に基づくパラダイムを意図的に回避する、教師なしの異常検出方法。
我々は、フローマッチングを幾何学力学として扱い、重要な洞察を利用する: 学習された正規フローがテスト画像への幾何学的経路と矛盾する場所で異常が発生する。
論文参考訳(メタデータ) (Thu, 21 May 2026 22:01:31 GMT)
Lost in the Folds: When Cross-Validation Is Not a Deep Ensemble for Uncertainty Estimation [4.8] 多くの研究はK-fold cross-validation (CV)を介してアンサンブルを形成するが、それらをディープアンサンブル(DE)と呼ぶ。
近年のセグメンテーションの不確実性調査を監査した結果,実装ミスマッチが一般的であることが判明した。
分散シフト下での校正,故障検出,曖昧性モデリング,ロバスト性に関する不確実性を評価する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:29:51 GMT)
WorkstreamBench: Evaluating LLM Agents on End-to-End Spreadsheet Tasks in Finance [4.8] フロンティアAIラボは、スプレッドシート全体をスクラッチから構築できるエージェントを開発した。
これは金融において特に重要であり、金融モデリング、予測、シナリオ分析といった中核がスプレッドシートを通じて一般的に行われている。
既存のスプレッドシートベンチマークでは、この高度な能力は測定されず、代わりに質問回答や単一形式の編集に重点を置いている。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:06:34 GMT)
From Baseline to Follow-Up: Counterfactual Spine DXA Image Synthesis in UK Biobank Using a Causal Hierarchical Variational Autoencoder [4.8] 英国バイオバンク(UKB)からのAP脊椎DXA画像の因果的一貫した生成のための因果的階層的変動オートエンコーダ(CHVAE)を提案する。
このモデルは、最初のイメージング訪問から3,743個のAPスピーンスキャンをトレーニングし、基本的な属性と腰椎形態計測に基づいて条件付けされている。
以上の結果より, 年齢差による椎体形態変化は絶対値が強いことが示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:53:44 GMT)
Adapting the Interface, Not the Model: Runtime Harness Adaptation for Deterministic LLM Agents [4.8] Life-Harnessはライフサイクルを意識したランタイムハーネスで、モデルウェイトや評価環境を変更することなく、凍結LDMエージェントを改善する。
ライフ・ハーネスは、繰り返し発生する相互作用の失敗を、環境契約、手続きスキル、行動実現、軌道規制にまたがる再利用可能な介入に変換することによって、訓練軌道から進化する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:36:49 GMT)
DeltaBox: Scaling Stateful AI Agents with Millisecond-Level Sandbox Checkpoint/Rollback [4.7] 既存のメカニズムは状態全体を複製し、C/Rあたり数百ミリ秒から秒のレイテンシを発生させる。
本稿では,AIエージェントに対する変更ベースのトランザクションC/Rを実現するため,新しいOSレベルの抽象化であるDeltaStateを提案する。
2つの新しいメカニズムによりミリ秒単位のC/Rを実現する新しいエージェントであるDeltaBoxを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:36:17 GMT)
RADAR: Relative Angular Divergence Across Representations [4.6] 基礎モデルにおけるクロスドメイン転送可能性を推定するための簡易で幾何的に基底化された測度であるRADARを提案する。
テキスト埋め込みモデルを用いた言語間感情分類や、基礎視覚モデルを用いたドメイン間イメージ分類など、複数のモダリティにまたがるメトリクスを評価する。
我々の主張は、転送可能性推定の有効性はモデルの内部表現空間の幾何学に依存することを示唆している。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:51:00 GMT)
From TF-IDF to Transformers: A Comparative and Ensemble Approach to Sentiment Classification [4.6] 本稿では,映画レビューを肯定的,否定的な感情に分類することを目的とする。
自然言語処理(NLP)手法を多種多様な機械学習モデルに適用する。
精度、精度、リコール、F1スコア、ROC-AUCでの多くのテストの後、RoBERTaは他のどのモデルよりも93.02%の精度で性能が向上した。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:00:12 GMT)
Is TabPFN the Silver Bullet for Insurance Pricing? [4.5] タブラル基礎モデル(TFM)は、コンテキスト内学習を通じて新しいデータの推論を可能にする。
本稿では,自動車保険価格に対するTabPFNの実証評価について述べる。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:59:06 GMT)
The Value of Covariance Matching in Gaussian DDPMs and the Lanczos Sampler [4.5] ガウスのDDPMにおける中心誤差測度は、正確な逆鎖と学習されたガウスの逆過程の間の経路空間 KL のばらつきである。
完全後続共分散のマッチングはこの障壁を破り、KLを$O(1/T2)$に下げるオーダーワイズの改善をもたらすことを示す。
我々はLGS近似誤差がランツォスステップの数で指数関数的に減衰することを証明し、各ランツォスステップは1つのヤコビアンベクトル積を必要とする。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:57:27 GMT)
Absorbing Many-Body Correlations into Core-Optimized Orbitals [4.5] 軌道基底をスパースCI波動関数と共最適化することで、既にコンパクトなTrimCIアンザッツを超える数桁のカウントを削減できる。
チューナブル・オン・グラフモデルは、利点を軌道基底ゲインに分解し、アンザッツゲインを捕捉する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:15:57 GMT)
Branch-Stochastic Model Predictive Control for Motion Planning under Multi-Modal Uncertainty with Scenario Clustering [4.5] 本稿では,SMPCと分岐構造を組み合わせた新しい手法を提案する。
高レベルの決定類似性に基づいて予測シナリオをマージし,リアルタイムのトラクタビリティを確保するために,新たなシナリオクラスタリングを提案する。
高速道路のシナリオにおけるシミュレーション研究は,提案手法が安全性を向上し,保守性を低下させ,リアルタイムな計算性能を実現することを実証している。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:15:16 GMT)
Encrypted Neural Networks without Overflows [4.3] ホモモルフィック暗号化(英語版)(FHE)は、暗号化されたデータ上でニューラルネットワークを評価することで、プライベート推論を可能にする。
CKKSスキームは最も効率的なFHE実装のバックボーンである。
本稿では,ネットワーク内の全ニューロンの範囲の認定境界を計算する形式的検証手法を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:08:23 GMT)
Minimal Permutation-Invariant Qudit Codes from Edge-Colorings of Complete Graphs [4.3] 対称部分空間 $mathrmSymn(mathbbCq) $ of $n$ qudits of local dimension $q$ で置換不変量子符号を研究する。
4つの物理キューディットは、すべての局所次元の対称セクターにおいて距離2の1つの論理キューディットを符号化するのに十分である。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:08:38 GMT)
A mathematical theory of balancing relational generalization and memorization [4.3] 我々は、タスクパラダイムの欠如が、この本質的な能力の研究を妨げると論じている。
我々は、ニューラルネットワーク学習の単純で理論的に抽出可能なモデルの振る舞いを解析的に特徴付ける。
これらのモデルは、関係一般化と記憶のバランスをとることができる。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:04:19 GMT)
Higher Order Reasoning for Collaborative Communicationless Mobile Robot Operations [4.2] コミュニケーションのない環境では、多くの協調戦略が想定する一定の情報交換がなければ、マルチロボットシステムは動作しなければなりません。
本稿では,ロボット間の高次推論による暗黙的な協調と長期水平計画を可能にする,新しい動的疫学計画フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:22:09 GMT)
IdioLink: Retrieving Meaning Beyond Words Across Idiomatic and Literal Expressions [4.2] モデルが慣用的表現と概念的に等価な意味をリテラルやパラフレーズで表すことができるかどうかを検証するために設計された検索ベンチマークであるIdioLinkを紹介する。
IdioLinkは10,700のドキュメントと2,140のクエリで構成され、107のイディオムにリテラルと比喩の両方の用途がある。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:53:10 GMT)
DreamerNLplus: Interpretable Modeling of Mental Health Dynamics from Social Media Timelines using Hybrid Rule-Based and RAG Methods [4.2] ソーシャルメディアのタイムラインからメンタルヘルスのダイナミクスをモデリングするためのハイブリッドフレームワークであるDreamerNLplusを紹介する。
本システムは,心理的状態モデリング,時間変化検出,シーケンスレベルの要約という3つの課題に対処する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:35:08 GMT)
Structure Retention in Embedding Spaces as a Predictor of Benchmark Performance [4.2] 4つのタスクカテゴリにまたがる5つのMTEBタスクに対する25の埋め込みモデルの評価を行った。
埋め込みタスクは,局所情報の保持に依存する線形性や依存度が異なることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:05:55 GMT)
LLM Retrieval for Stable and Predictable Ad Recommendations [4.1] 本稿では,広告推薦システムの安定性と予測可能性の定量化のための新しい評価フレームワークを提案する。
細調整大言語モデル(LLM)を利用したオンライン意味候補生成フレームワークを提案する。
このフレームワークは、システムのセマンティック・アウェアネスを根本的に改善することで、これらの指標に沿って大幅に改善されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:58:37 GMT)
ACCoRD: Actor-Critic Conflict Resolution with Deep learning for O-RAN xApps [4.1] 競合緩和(ConMit)は、オープン無線アクセスネットワーク(O-RAN)におけるインテリジェントネットワーク制御の重要な部分である
本稿では,近実時間RANインテリジェントコントローラにおいて検出された制御競合を解決するためのACCoRDという手法を提案する。
実装されたANNは、ネットワークに関するデータを分析し、最適なCRアクションを推測するために制御決定に矛盾する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:54:57 GMT)
Can Breath Biomarkers Causally Influence Blood Glucose? Investigating VOC-Mediated Modulation in Diabetes [4.1] 本研究では, 揮発性有機化合物(VOC)とライフスタイル変数を用いて, 糖尿病リスクのある個人を識別する非侵襲的枠組みについて検討した。
原因推論技術を用いて,アセトン,イソプロパノール,イソプレン,エタノールなどのVOCが血糖値に及ぼす影響を推定する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:13:28 GMT)
Do Deep Ensembles Actually Capture Uncertainty in Graph Neural Networks? [4.0] メッセージパッシンググラフニューラルネットワークのための標準ディープアンサンブルについて検討する。
アンサンブルはシングルモデルよりも驚くほど小さな改善を提供する。
以上の結果から,ディープアンサンブルの成功はグラフ機械学習にシームレスに移行しないことが示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:07:47 GMT)
Steins;Gate Drive: Semantic Safety Arbitration over Structured Futures for Latency-Decoupled LLM Planning [4.0] SteinsGateDriveは遅延分離型プランナーランタイムアーキテクチャである。
本稿では,遅延分離型プランナーランタイムアーキテクチャであるSteinsGateDriveを紹介する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:20:51 GMT)
Pretraining Data Exposure in Large Language Models: A Survey of Membership Inference, Data Contamination, and Security Implications [3.9] データとメンバシップ推論という2つの重要な領域を交わし、評価の整合性を確保し、プライバシを保護することが重要である。
本稿では,PDE フレームワーク下での両者の統一的な調査について紹介する。
我々は、暴露レベルを越えてPDEを定式化し、攻撃と防御の方法をレビューし、経験的発見を合成し、オープンな課題と今後の研究方向性を明らかにする。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:32:33 GMT)
Non-Contact Vibration-Based Damage Detection of Civil Structures Using a Cost-Effective Autonomous UAV [3.9] 本稿では,無人航空機(UAV)を用いた振動による構造損傷検出のための非接触手法を提案する。
振動信号は、視覚に基づくモーショントラッキングを通じてビデオ記録から抽出され、構造劣化を示す自然周波数の変化を特定する。
商用のUAVシステムと比較して,提案プラットフォームは比較的低コストで同等の検査性能を実現する。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:37:07 GMT)
Anytime Training with Schedule-Free Spectral Optimization [3.8] SF-NorMuonはスケジュールのないスペクトルで、125M と 772M のパラメータ言語モデルで調整された AdamW と、1 ドルから8 ドルの範囲で一致または超える。
調整されたベースラインでパフォーマンスギャップを埋めることによって、SF-Muonは地平線なしの最適化をより実用的なものにし、真にオープンな継続的学習へと一歩踏み出す。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:50:22 GMT)
Causal Discovery in Structural VAR Models Under Equal Noise Variance [3.7] 線形ガウス構造VARモデルにおける等価ノイズ分散仮定に基づく因果発見について検討する。
この設定に合わせた観測等価性の概念を導入する。
対応する同値類は、大域的正のスケールとともに構造方程式の変換によって特徴づけられることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 00:41:11 GMT)
LLM Sparsity Prior for Robust Feature Selection [3.7] LLM生成重量の定量化のためのフレームワークを提案する。
次に,LLM生成重みを先行包含確率に統合するLLMスペーシャリティ・プライオリティ(LSP)を提案する。
LSPは予測精度を改善し、ベースラインに欠落した臨床的に関連性のある特徴を特定する。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:34:04 GMT)
A Posterior-Predictive Variance Decomposition for Epistemic and Aleatoric Uncertainty in Wind Power Forecasting [3.7] 本稿では,ニューラルネットワーク回帰とベイズ後部近似のジョイントセッティングに全変動の法則を適用した。
地中不確実性ラベルへのアクセスを必要とせず, 風力特性評価フレームワークを提案する。
合成および実世界の実験全体において、分解されたAUとEUのコンポーネントは理論的に一貫した方向に応答する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:23:14 GMT)
PACT: Reducing Alert Fatigue in Low-Prevalence SOC Streams with Triggered Active Learning [3.7] PACTは、すでにデプロイ済みの冷凍XGBoost-Focalスクリーンを、アダプティブウィンドウニングスコアシフトトリガーでラップする。
適応法の中では, 良性正常化偽陽性負担が最少である。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:11:39 GMT)
SPIDER: Two Server Functionality for the Cost of Zero [3.7] 本稿では,個人情報検索方式であるbaseSPIDER と SPIDER を紹介する。
baseSPIDERは単一のサーバとステートフルクライアントで動作し、前処理を行い、将来のクエリのヒントを格納する。
SPIDERは、この設計の初めてのシングルサーバPIR構築であり、特別なAPI、補助サーバ状態、あるいは従来のインデックス付きアクセス以上のプロトコル固有のインタラクションなしでプライバシを実現する。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:08:55 GMT)
Impact of Atmospheric Turbulence and Pointing Error on Earth Observation [3.7] 提案したシミュレータで生成した画像に対して, YOLOv8 と RetinaNet を用いて, 乱流とポインティング誤差の異なる容器検出の評価を行った。
その結果, YOLOv8リコールは, 理想的な条件下では91%から, 弱い乱流が存在する場合には60%に減少し, 強い乱流やジッタでは40%以下に低下することがわかった。
対照的にRetinaNetはより堅牢性を示し、劣化した条件で約75%のリコールを維持している。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:11:30 GMT)
Is a Document Educational or Just Wikipedia-Style? -- Pitfalls of Classifier-Based Quality Filtering [3.7] 簡単なウィキペディアスタイルの改定操作によって、モデルの品質評価が変更され、低品質のコンテンツがフィルタリングしきい値を超えることができることを示す。
分析の結果,FineWeb-Edu CQFモデルでは,評価文書の約7%でフィルタリング決定を逆転し,事前学習したコーパスに内容が付与されることが判明した。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:59:11 GMT)
Plug-in Losses for Evidential Deep Learning: A Simplified Framework for Uncertainty Estimation that Includes the Softmax Classifier [3.6] 実世界のセンサに基づく学習システムでは、信頼性と計算効率の両方で不確実性を推定する必要がある。
Evidential Deep Learning (EDL) は、ディリクレ分布を用いたクラス確率のモデル化による単一パス不確実性推定を提供する。
本稿では,EDLにより誘導される1次経験的リスク最小化問題の目的をディリクレ平均で評価されたプラグイン損失を用いて近似することにより,この問題に対処する。
提案手法をGoogle Speech Commandsデータセットで検証し,従来のEDLに匹敵する予測精度と選択予測性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:15:10 GMT)
MAVEN: A Multi-stage Agentic Annotation Pipeline for Video Reasoning Tasks [3.6] 我々は、生動画をChain-of-Thought(CoT)推論トレースを用いたマルチタスクトレーニングデータに変換するマルチステージエージェントパイプラインであるMAVENを提案する。
MAVENはエージェント駆動のドメイン適応をサポートしており、新しいビデオデータセットとターゲットの質問例を与えられたエージェントは、手動のリエンジニアリングなしでトップダウンのプロンプトを再設計する。
我々はMAVENを5,300本以上のトラヒックビデオと微動コスモス・レーソン2-8Bのラベル付けに応用した。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:44:27 GMT)
DeferMem: Query-Time Evidence Distillation via Reinforcement Learning for Long-Term Memory QA [3.6] 大規模言語モデル(LLM)エージェントは、依然として長期記憶疑問応答に苦慮している。
本稿では,この問題をハイリコール候補検索とクエリ条件のエビデンス蒸留に分離する長期記憶フレームワークであるDederMemを紹介する。
LoCoMoとLongMemEval-Sでは、DeferMemはQAの精度とメモリシステムの効率性において強力なベースラインを超えている。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:36:46 GMT)
Geometric Construction of Optimal Teleportation Witnesses [3.5] 目的状態から凸集合S$の無用状態までの最短距離問題を解くために, 2層反復切削平面アルゴリズムを開発した。
S$ の射影点 $* を取得し、それから射影幾何学から最適なテレポーテーション証人を構築する。
3種類の絡み合った状態のテレポーテーションの有用性を同定するために本手法を適用した。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:29:04 GMT)
GazeBehavior Annotation Toolkit (GBAT): AI-powered toolkit for automatic annotation of egocentric eye-tracking and video data of child-caregiver interaction [3.5] データ前処理と特徴抽出の3つの重要なプロセスを容易にするためのディープラーニングベースのツールキットであるGaze Behavior Toolkitを紹介した。
このツールキットは、人間中心の視線追跡とビデオデータから特徴抽出の効率性とスケーラビリティを向上させる。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:47:56 GMT)
Worse than Random: The Importance of a Baseline for Unsupervised Feature Selection [3.5] 本稿では,教師なし特徴選択法を評価するためのベースラインとして,ランダムな特徴選択を提案する。
教師なし特徴選択における最先端手法の多くは、性能と効率の両面でランダムな特徴選択により性能が向上していることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:04:54 GMT)
Enhancing Multimodal Large Language Models for Safety-Critical Driving Video Analysis [3.5] 我々は、高同期周波数データ(IMUとGPS)でダウンサンプリングされたビデオフレームを融合させることでMLLM知覚を向上させるパイプラインを導入する。
我々のパイプラインは高品質な擬似ラベルを生成し、例えば説明キャプションと質問応答ペアは、現実世界の運転映像における安全批判事象(SCE)を特定し記述するためにMLLMを訓練するために特別に設計されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:54:22 GMT)
dSABRE: A SABRE-Style Router for Multi-Core Distributed Quantum Computers [3.4] 量子回路をルーティングする際、EPR消費を最小限にすることが主な目的である。
SWAPスコアリングにより、任意のコア内フロント層ゲートを解消するマルチコアプロセッサ用のSABREスタイルルータであるdSABREを提案する。
25、36、64の論理量子ビットの18 MQT-Bench回路で、dSABREはTeleSABREの41-44%、幾何学ゲート-テレポーテーションベースのpytket-dqcの16-68%のEPR消費を減少させる。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:47:25 GMT)
Dynamic Hypergraph Representation Learning for Multivariate Time Series without Prior Knowledge [3.4] 本稿では,時系列の動的ハイパーグラフ表現を,データの事前の知識に頼らずに構築するモデルを提案する。
得られたハイパーグラフは動的ハイパーグラフ注意畳み込みネットワーク(DHACN)によって多変量時系列予測に使用される。
本研究は, 先行知識のない高次関係を明らかにするのに適した新しい手法を導入することにより, ハイパーグラフ表現の分野を推し進める。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:25:51 GMT)
Characterizing the Fault Response of the Intel Neural Compute Stick 2 Under Single-Pulse Electromagnetic Fault Injection [3.3] ImageNetをトレーニングした3つのニューラルネットワークを動作させるNAS2の単一パルス電磁欠陥注入キャンペーンを報告した。
単一のパルスは、4つの再現可能な結果クラスを生成する。
本稿では,デバイスファームウェアやOpenVINOランタイムを変更することなく,アプリケーションレベルで実装可能な機構に焦点をあてて,クラスごとの緩和戦略について議論する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:06:26 GMT)
Opportunities and Risks of Generative AI through the Health Information Journey [3.3] AIシステムはクレームを生成し、情報をキュレートし、症状を解釈し、証拠を合成し、決定を導く。
潜在的な利点は、アクセスの改善、理解、ケアの継続である。
同時に、AIは信頼性の高いガイダンスと区別が難しい不正確な、または操作的なコンテンツを導入することができる。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:49:21 GMT)
Time-varying rPPG signal separation via block-sparse signal model [3.2] 本稿では,r信号の準周期特性を利用したr信号抽出手法を提案する。
我々のアプローチは、安定した心循環から生じるr信号の準周期性を、時間周波数領域におけるブロックスパース構造としてモデル化する。
公開データセットを用いた実験は,本手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:44:01 GMT)
Hybrid Kolmogorov-Arnold Network and XGBoost Framework for Week-Ahead Price Forecasting in Australia's National Electricity Market [3.2] 本稿では,オーストラリア国定電力市場における週平均電力価格の予測について検討する。
Kolmogorov-Arnold Networks (KAN) とツリーベースの学習を統合するハイブリッドな Kan+XGBoost フレームワークを提案する。
提案手法は,kanのグローバル非線形表現能力とXGBoostの局所的ロバスト性を組み合わせることで,長期的依存と短期的価格変動の両方を捉える。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:19:58 GMT)
Multi-scale interaction network for stereo image super-resolution [3.2] ステレオ画像超解像は、双眼鏡システムからの補完情報を活用することで高解像度画像を生成することを目的としている。
これまでの研究は目覚ましい成果を上げてきたが、ビュー内情報やクロスビュー情報の可能性は十分に活用されていない。
ステレオ画像超解像のための新しいマルチスケールインタラクションネットワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:35:27 GMT)
Active Sensing Subserves Task-Level Control [3.2] 本稿では,適応センサへの依存,移動と知覚のリンク,タスクレベルの制御が組み合わさることで,アクティブな感覚運動の出現を必然的に引き起こすことを提案する。
この仮説は、能動センシングが制御を保ち、生物からの経験的データと数学的理論の両方によって支持される。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:34:57 GMT)
Concatenating Algebraic Codes over High-Rate Quantum LDPC Codes [3.2] 非局所的、高レートな内部符号に対する結合について研究する。
それぞれのブロックを1つの論理的なGalois quditとして扱うことでこれを処理します。
測定誤差に対する「時間的」リード・ソロモン保護を用いたガロアキュートショア方式を開発した。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:12:36 GMT)
3D LULC classification using multispectral LiDAR and deep learning: current and prospective schemes [3.1] 土地利用土地被覆(LULC)分類は,全国的な3次元マッピング,地理空間解析,持続可能な計画に不可欠である。
本研究では,L1とL2のNMCA対応LULC分類方式と,新しいベンチマークMS LiDARデータセットを提案する。
我々は,7つの最先端DLモデルを評価し,両レベルの詳細でスペクトルアブレーション研究を行う。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:18:36 GMT)
Multi-Stage Training for Abusive Comment Detection in Indic Languages [3.1] 言語に基づく事前処理と複数のモデルのアンサンブルを用いて、虐待的コメント検出の性能を解析する。
本研究では, 表現の自由を損なうことなく, 悪質なコメントを検知できるように, 偽陽性率を最小限に抑えるパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:09:53 GMT)
A Boundary-Layer Mechanism for One-Third Scaling in Online Softmax Classification [3.1] ハードラベル分類は通常、スムーズな代理損失、特にソフトマックスのクロスエントロピーで訓練される。
我々は、このスムーズなサロゲートと離散ラベルのミスマッチが、パワーローラー学習曲線を生成するメカニズムを分離する。
学習速度のスケジュールは、$_g sim -1/2$の電力法則に対する一般化誤差を改善することができることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:26:32 GMT)
More Context, Larger Models, or Moral Knowledge? A Systematic Study of Schwartz Value Detection in Political Texts [3.0] 文脈と明示的な道徳的知識が文レベルの価値の検出に役立っているかを検討する。
フルドキュメントのコンテキストでは、教師付きDeBERTaエンコーダを文のみの入力で3.8~4.8マクロF1ポイント改善する。
回収された道徳的知識は、マッチングされた比較においてより一貫して有用である。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:46:54 GMT)
Parser-Free Querying of Security Logs [3.0] セキュリティアナリストは、システムログを定期的にクエリして脅威を検出し、インシデントを調査します。
各ログソースは、独自の半構造化フォーマットを使用する。
本稿では,自然言語のセキュリティ問題から実行可能なクエリコードを生成するシステムであるSieveを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:58:04 GMT)
GALAR-TemporalNet v2: Anatomy-Guided Dual-Branch Temporal Classification with Bidirectional Mamba and Dual-Graph GCN for Video Capsule Endoscopy -- after competition results [2.9] 極度のクラス不均衡、長距離時間依存性、病理-解剖的絡み合いという3つの課題に対処する階層的時間モデルを提案する。
我々のアーキテクチャは、局所モデリングのためのウィンドウ付き自己アテンション、グローバルフレーム関係のためのデュアルグラフGCN、選択境界コンテキスト符号化のための双方向マンバを組み合わせる。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:15:43 GMT)
ORBIS: Output-Guided Token Reduction with Distribution-Aware Matching for Video Diffusion Acceleration [2.9] Diffusion Transformer (DiT) は高品質な画像やビデオを生成するための強力なモデルアーキテクチャとして登場した。
ビデオDiTのためのSW-HW共同設計アクセラレータであるORBISを提案する。
ORBISは最先端のアプローチであるAsymRnRよりも約2倍高いトークン還元率を示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:23:21 GMT)
Building Europe's Quantum Shield: The Strategic view for a Continent-Wide Quantum Key Ditribution (QKD) Infrastructure [2.9] SEEWQCIプロジェクトは、ファイバケーブル、衛星通信、強化されたセキュリティルールを組み合わせて、強力なデジタルシールドを構築する。
欧州のデータを安全に保つために電力網や病院などの重要なサービスを保護することに注力している。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:20:47 GMT)
Decision-Aware Quadratic ReLU Replacement for HE-Friendly Inference [2.9] ホモモルフィック暗号化(FHE)は、加算と乗算のみをサポートする。
完全同型暗号(FHE)は加算と乗算のみをサポートする。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:37:05 GMT)
Fine-grained Claim-level RAG Benchmark for Law [2.8] 法則などの高次領域では、検索増強生成(RAG)は、生成した応答における幻覚を緩和するために一般的に用いられる。
法的なRAGシステムの既存の評価フレームワークは、検索および生成性能の詳細な解析を行うために必要な粒度を欠いている。
ClaimRAG-LAWは、フランス語と英語をサポートする法的RAGのための包括的なデータセットであり、専門家と非専門家の両方をターゲットにしており、現実的なシナリオを反映した多様な質問タイプを含んでいる。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:26:11 GMT)
When Stronger Triggers Backfire: A High-Dimensional Theory of Backdoor Attacks [2.8] バックドア中毒は、高次元において反故意に振る舞う。
比例状態におけるガウス混合データに対する正規化一般化線形モデルについて検討する。
i) クリーンテストの精度は$$で上昇し、 (ii) 攻撃の成功は有限$でピークに達し、その後減少する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:39:06 GMT)
Towards Explainability of SLMs by investigating Token Level Activation [2.8] 本研究では,BERTのレイヤ8における隠れ状態活性化強度を用いて,トークンレベルの表現重要性を定量化するフレームワークを提案する。
提案する Activation Flow Network (AFN) フレームワークは,レイヤ8隠れ表現のL2ノルムを用いて,Token Activation Strengthを演算する。
さらに、トークンを高活性化群と低活性化群に分割するしきい値に基づくアクティベーションバケットの定式化を導入する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:09:12 GMT)
Can AI Guess What You Know? Performance Comparison of Large Language Models for Human Domain Knowledge Estimation From Communication Logs [2.7] 大きな言語モデル(LLM)は、長期Slackログから直接個々のドメイン知識を推測することができる。
Gemini 2.5 Flashは最小エラー(MAE 21.13%)を達成し、GPTモデルははるかに大きな差を示した。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:01:16 GMT)
Closing the Gap at CRAC 2026: Two-Stage Adaptation for LLM-Based Multilingual Coreference Resolution [2.7] 本稿では,2026年度のコンピュテーショナル・モデル・オブ・リファレンス・アナフォラ・アンド・コアス・タスクについて紹介する。
公式テストセットの平均CoNLL F1スコアは74.32で,LLMトラックで1位,総合3位にランクインした。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:20:53 GMT)
When to Switch, Not Just What: Transition Quality Prediction in Clash Royale [2.7] 競技ゲームでは、プレイヤーはストリークを失った後に戦略を切り替えることが多いが、34,619人のクラッシュロイヤル選手の926,334試合記録の分析では、直感的パターンが明らかにされている。
本報告では, スイッチングの動作コストを見越しながら, 期待品質による戦略評価を行う, 従来のレコメンデーションシステムにおいて, 共通的な制限が原因と考えられる。
評価指標であるSwitchGapを導入する。これは、観測されたプレイヤー選択を最適基底真理として扱うことなく、政策の差別的品質を測定する。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:28:19 GMT)
Smoothed Elicitation Complexity for Approximate $Γ$-calibration of Discrete Classification Tasks [2.7] 連立結果設定では、モデルの分布予測に基づいて結果が実現された場合、確率予測器を校正する。
Noarov and Roth (2023) は結果分布の特性である予測を伴うマルチクラスキャリブレーションを提案する。
この研究は、離散特性に対して近似的なキャリブレーション結果を提供する最初のものである。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:39:20 GMT)
Boiling the Frog: A Multi-Turn Benchmark for Agentic Safety [2.7] ツール使用のAIモデルがインクリメンタルアタックの影響を受けやすいかどうかを評価するベンチマークであるBoiling the Frogを紹介した。
シナリオは3段階の運用リスク分類によって編成される。
9モデルパネル全体では、総攻撃成功率(ASR)は44.4%である。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:50:18 GMT)
Rethinking Token Reduction for Diffusion Models via Output-Similarity-Awareness [2.6] 拡散変換器(DiT)はより優れた画像生成品質を実現するが、トークン数に対して2次計算の複雑さに悩まされる。
出力中心のトークン還元に焦点を移す新しいTRパラダイムであるDiToを提案する。
実験により、DiToは既存のTR法よりも1.6-3.9dB高いPSNRを同等のスピードアップで一貫して上回っていることが示された。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:18:42 GMT)
FastTab: A Fast Table Recognizer with a Tiny Recursive Module and 1D Transformers [2.6] テーブル構造認識(TSR)は、テーブルレベルのコヒーレンスと正確なセパレータのローカライゼーションの両方を必要とする。
我々は,自己回帰HTMLデコーディングを回避するグリッド中心のTSRモデルであるFastTabを紹介する。
FastTabは低レイテンシ推論で動作しながら、競合構造回復性能を達成する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:42:58 GMT)
FRED: A Multi-Modal Autonomous Driving Dataset for Flooded Road Environments [2.5] このデータセットには、2.3MPのFLIR Blackfly USB3カメラ、Ouster OS1-64 LiDARの64-beam 360$circ point cloud、Geoflex RTKによって修正されたiXblue ATLANS-C IMUのデータが含まれている。
既存のデータツールと簡単に統合できるKITTIスタイルのフォーマットと、車両のデータキャプチャを直接再生するRTMapsフォーマットである。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:37:07 GMT)
Beyond the Org Chart: AI and the Transformation of Invisible Work [2.4] 私たちは、大企業の24人のプロダクト重視の個人に、AIが自身の仕事、プロダクトチーム内での作業、プロフェッショナルなインタラクションにどのように影響したかについてインタビューした。
これらの変化のいくつかは、例えば、ピア間のよりスムーズなコラボレーションなど、肯定的なものだが、他の変更は、よりニュアンスがあり、典型的なキャリアの成長機会を危険にさらす。
私たちは、目に見えない作業をより目に見えるものにするために、AI企業が取るべきステップを提案します。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:46:44 GMT)
Training-Free Fine-Grained Semantic Segmentations in Low Data Regimes: A FungiTastic Baseline [2.4] 微粒なセマンティックセグメンテーションは、視覚的に類似したクラス間の正確な局所化と識別の両方を必要とする。
FungiTasticでは、この問題は長い尾の分布と画像取得条件の強い変動によってさらに複雑になる。
分類からセグメンテーションを分離する学習自由な2段階フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:44:52 GMT)
Bounding-Box Trajectories Matter for Video Anomaly Detection [2.3] 本稿では,正規化フローを用いて多クラス境界ボックス軌道をモデル化し,通常の運動パターンを学習するTrajVADを提案する。
軌道のみの変種(TrajVAD-T)は、ポーズ推定を排除し、APにおける上海技術(87.7%)で比較されたポーズベースの手法を全て上回っている。
拡張版(TrajVAD-P)にはポーズ情報が含まれており、性能は88.6%AUROCと90.9%APに向上している。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:44:06 GMT)
Symphony for Speech-to-Text: Supporting Real-Time Medical Voice Interfaces [2.3] Symphony(シンフォニー)は、リアルタイムストリーミングおよびバッチファイルベースの臨床用医療用音声認識システムである。
臨床環境では,Symphonyが最先端システムを大幅に上回ることを示す。
信頼性検証と医療音声認識のさらなる進歩をサポートするための,臨床ベンチマークデータセットをリリースする。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:52:56 GMT)
SADGE: Structure and Appearance Domain Gap Estimation of Synthetic and Real Data [2.3] 本稿では,一般的なコンピュータビジョンタスクのための合成画像データセットの性能を予測する量的類似度指標であるSADGEを提案する。
合成画像と実画像の間で計算された外観と幾何学的類似度は、オブジェクト検出、セマンティックセグメンテーション、ポーズ推定における下流のパフォーマンスと相関する。
我々は、幾何に基づく手法と外見に基づくアプローチを組み合わせて、すべてのベンチマークファミリでSADGEスコアを計算する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:27:15 GMT)
PIU: Proximity-guided Identity Unlearning in ID-Conditioned Diffusion Models [2.3] 我々は、顔生成のための最先端のアイデンティティ条件付き潜時拡散モデルであるArc2Faceでアイデンティティアンラーニングを研究する。
本稿では,Pu(Proximity-guided Identity Unlearning)について紹介する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:55:56 GMT)
MadEvolve: Evolutionary Optimization of Trading Systems with Large Language Models [2.3] 我々は、Bitcoin取引の例でアルゴリズム取引戦略とアルファ生成を最適化するMadEvolveの有用性を実証する。
我々の研究結果は,AI駆動型エージェントおよび進化的アルゴリズムのアルゴリズム取引および量的ファイナンスへの活用を強く支持する。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:28:57 GMT)
Moment-Reenacting: Inverse Motion Degradation with Cross-shutter Guidance [2.2] 運動劣化を逆転し、画像モーメントを再現する統一的な枠組みを提案する。
本稿では,同期化Blub-RS画像ペアをキャプチャする新しいデュアルシャッター構成を提案する。
柔軟なパフォーマンスコストのトレードオフを可能にするため、このデュアルシャッター設定をステレオBlur-RS構成に拡張する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:43:02 GMT)
Departure from Regularity: Degree Heterogeneity and Eigengap as the Structural Drivers of ASE-LSE Latent Subspace Disagreement [2.2] グラフデータを解析する2つの方法、Adjacency Spectral Embedding と Laplacian Spectral Embedding は、同じネットワークに適用した場合、しばしば異なる結果をもたらす。
規則性は完全な合意に十分な条件であることを示す。
2つの用語がそれを制御する構造的要素を示唆する明示的な境界、すなわち、メソッドを分割する次数不均一性と、それらを引き戻すコミュニティ構造強度を証明します。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:30:37 GMT)
Orbax: Distributed Checkpointing with JAX [2.2] Orbaxは、分散アクセラレータシステムの複雑さを抽象化するJAXネイティブなチェックポイントライブラリである。
我々は、PyTorchの競合よりパフォーマンスが3.5$times$を節約し、2$times$をロードすることを示した。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:57:28 GMT)
Diversed Model Discovery via Structured Table Discovery [2.2] 本稿では,ModelTablesベンチマーク上に構築されたテーブル駆動モデル検索フレームワークであるStructuredSemanticSearchを紹介する。
クエリが与えられた場合、StructuredSemanticSearchは、タスクアライメントのためのセマンティックベースラインと、クエリ関連のモデルカードテーブルを検出する構造対応パイプラインを組み合わせる。
評価のために、モデルカードからコンパクトなエビデンス項目を抽出し、クエリを条件または意図固有のナゲットにマッチさせ、得られたモデルカード候補集合に対するエビデンスカバレッジと多様性を測定するナゲットベースの監査可能なプロトコルを導入する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:28:01 GMT)
Format-Constraint Coupling in Knowledge Graph Construction from Statistical Tables [2.2] オープンデータポータルの共通レイアウトである,国ごとの時系列行列について検討する。
それらの結合効果は、最大+1.180 (2x2因子、6つのデータセット)の独立効果の和を超える。
ブートストラップ95%CIは4/6データセットに対して厳格に陽性であり、幅広いType-II行列に強い証拠がある。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:08:42 GMT)
The Neglected Baseline in Model Interpretation [2.2] 本稿では,モデル解釈の課題と解釈原理を整理し,ベースラインの重要性を実証する。
我々はさらに勾配に基づく手法、統合勾配法(IG)法、テイラー拡張を統一し、それらの関係を明らかにする。
そこで本研究では,モデル解釈手法の欠陥と誤りを解析する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:40:11 GMT)
A Martingale Kernel Independence Test [2.2] データ法則によらず、ヌル分布が標準正規である2つの学生統計を導入し、1つの正規量子ルックアップが置換ステップを完全に置き換える。
どちらの統計も経験的なタイプIエラー率と置換校正ベースラインのテストパワーと一致し、25ドルから60タイムスを高速に実行している。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:31:10 GMT)
ChronoMedKG: A Temporally-Grounded Biomedical Knowledge Graph and Benchmark for Clinical Reasoning [2.2] ChronoMedKGは時間的知識グラフで、13,431の疾患をカバーする460,497個のエビデンスにリンクされた3つ組を含んでいる。
92.7%の同意を得ており、HPOA、Orphadata、およびPhenopacketsから欠落した6,250の病気に時間的根拠を与えている。
これは、これまで欠落していた検索増強臨床システムにとって、重要な時間軸を提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:04:28 GMT)
MaSC: A Masked Similarity Metric for Evaluating Concept-Driven Generation [2.2] 評価を主観的な概念保存と背景に基づくプロンプトに分解する尺度であるMASCを紹介する。
DreamBench++の人間の評価では、MASCは概念保存のためにKrippendorff alpha = 0.471を達成し、試験された全ての非LLMベースラインとGPT-4Vを上回り、GPT-4oに近づいた。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:28:36 GMT)
FIRMA: FIbonacci Ring Model Aggregation for Privacy-preserving Federated Learning [2.1] 標準サーバベースの集約は単一障害点と勾配反転リスクを生成します。
既存のプロトコルは、サーバフリーな操作、永久にプライベートなヘッド、リングトポロジー、原則化された非対称な近接重み付けを同時に達成する。
本研究では,FIRMA(textbfFIbonacci textbfModel textbfAggregation)を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:06:00 GMT)
More Skills, Worse Agents? Skill Shadowing Degrades Performance When Expanding Skill Libraries [2.1] LLMエージェントは要求に応じてタスク固有の命令をロードすることができ、専門家でないユーザは自然言語を使ってドメイン固有のタスクを解決できる。
しかし、ライブラリが成長するにつれて、パフォーマンスは低下し、補助的なスキルの小さなセットから202スキルのライブラリにスケールアップすると、最大21%向上する。
エージェントがライブラリが拡大するにつれて間違ったスキルを頻繁に選択するEmphskill Shadowingと、拡張されたコンテキストが選択が正しい場合でも実行を劣化させるEmphcontextのオーバーヘッドという2つの効果について検討する。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:33:31 GMT)
A2QTGN: Adaptive Amplitude Quantum-Integrated Temporal Graph Network for Dynamic Link Prediction [2.1] A2QTGNは、適応振幅符号化とテンポラルグラフネットワークのバックボーンを組み合わせたハイブリッド量子古典フレームワークである。
本稿では,A2QTGNが様々な動的グラフにまたがる高い予測とランク付け性能を実現することを示す。
ノイズの多いバックエンドと制限された実デバイス実行を用いたハードウェア対応推論は、短期量子支援時間グラフ学習の実現性をサポートする。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:38:29 GMT)
Making the Discrete Continuous: Synthetic RAW Augmentations for Fine-Grained Evaluation of Person Detection Performance in Low Light [2.1] 本研究では, 最先端物体検出モデルの性能向上のために, 合成低照度試料をいかに利用できるかを示す。
我々は、カメラセンサのノイズモデルにマッチする低照度サンプルを生成するために、合成RAW画像拡張技術を用いている。
実データと合成低照度データのパフォーマンス指標は類似しており、AIモデルはそれらの区別が難しいことを示唆している。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:20:11 GMT)
Improving Viewpoint-Invariance and Temporal Consistency for Action Detection [2.0] 本稿では,新しい2段階動作検出手法を提案する。
第1段階では、拡張仮想視点から運動特徴を抽出する。
第2ステージではビュー不変のマルチスケール時間エンコーダが導入されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:38:21 GMT)
Cross-Domain Human Action Recognition from Multiview Motion and Textual Descriptions [2.0] 本稿では,クロスドメイン能力の向上を図った,新たな方向認識型行動認識手法を提案する。
異なる動き特徴を学習し、特定の方向対応テキストプロンプトを適応させ、対応する特徴を推論で一致させる新しい方向対応動作符号化ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:39:58 GMT)
ChronoMedicalWorld: A Medical World Model for Learning Patient Trajectories from Longitudinal Care Data [2.0] 縦断的ケアデータから患者の軌跡を学習するための行動条件付き潜在世界モデルフレームワークを提案する。
慢性腎疾患(CKD)における年間推定糸球体濾過率(eGFR)トラジェクトリー予測のためのCMWMのインスタンス化
CKD固有のアーキテクチャ、損失設計、トレーニングプロトコルは、構造的および会話的介入によってインターリーブされた定期的な臨床状態としてキャストできるあらゆる慢性状態に適用できる。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:50:17 GMT)
Emulation of Optically Interconnected Quantum Data Centers Topologies for Cost-Fidelity Benchmarking [2.0] 我々は、リング、スター、ライントポロジーにおいて、量子コンピュータを用いて光学的に相互接続された量子プロセッサをエミュレートする。
GHZベンチマークは、恒星がトランスダクションとファイバノイズの下でのコストとフィデリティの最良のトレードオフを提供することを示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:11:01 GMT)
QuCtrl-BELL: A Compiler-Driven Sub-Microsecond Feedback Control Stack for Scalable Trapped-Ion Quantum Experiments [2.0] QuCtrl-BELLは、トラップイオン量子制御のためのコンパイラ駆動のソフトウェアスタックである。
Python組み込みのドメイン固有言語(CFG)は6段階のトランスパイルパイプラインを通じて低下する。
クロスボード同期プロトコルは、ホストの介入なしに700ns未満のレイテンシでフィードバックループをサポートする。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:59:24 GMT)
Robots That Know What to Ask: Recovering Misaligned Rewards through Targeted Explanations [2.0] デモンストレーションから報酬関数を学ぶことは、デモがすべての機能に対して適切な監視を提供すると仮定する。
人間は認知的負荷や身体的困難のために、特定の特徴を過小評価することがある。
本稿では,そのような不特定特徴を検知し,対象とする修正デモを積極的に行うフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:34:14 GMT)
Partial Fusion of Neural Networks: Efficient Tradeoffs Between Ensembles and Weight Aggregation [1.9] アンサンブルと重み付けを補間するネットワークの部分融合を導入する。
これを実現する直接的な方法は、ニューロンレベルの類似性に基づく既存の重み付け手法を拡張することである。
一般化プルーニングが単一ネットワークに適用された場合,部分融合と同様の利点が得られることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:36:16 GMT)
Factored Diffusion Policies:Compositionally Generalized Robot Control with a Single Score Network [1.9] 本稿では,各因子のNull-tokenドロップアウトを学習した共有拡散ネットワークについて述べる。
トラジェクトリチューブ証明書は、このスコアレベルをリバースタイムサンプリングODEとトラッキングコントローラを介してクローズドループ状態トラジェクトリチューブにチェーンする。
ドローンレースの実験は、一般化バウンドと証明書の両方を確認します。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:13:27 GMT)
Reduced Dynamical Maps in Finite Temperature Vibronic Coupling Models via Choi Matrices: Numerical Methods and Applications [1.9] 本稿では,有限温度における複雑なシステムモデルに対する縮小された動的マップの構築と解析を行うフレームワークを提案する。
本稿では,Fenna-Matthews-Olson複合体における励起子移動の手法について述べる。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:23:35 GMT)
Why Are Agentic Pull Requests Merged or Rejected? An Empirical Study [1.8] AIコーディングエージェントは、プルリクエスト(Agentic-PR)をオープンソースリポジトリに送信するが、そのパフォーマンスはマージと拒否結果だけで評価されることが多い。
我々は,11,048件のクローズドエージェントプルリクエストの意思決定指向分析を行い,9,799件の人間レビューPRに精査し,手動で717件の代表事例を検査し,意思決定の合理性を回復した。
一方31.2%はワークフローの制約によって駆動され、33.1%は観測可能な決定の根拠に欠けていた。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:24:20 GMT)
Beyond Temperature: Hyperfitting as a Late-Stage Geometric Expansion [1.8] 極細調整LDMをほぼゼロのトレーニング損失にすることで、オープンな生成品質が向上し、グリーディ復号における繰り返しが軽減されることを示す。
最終5層のみを更新し,パラメータの更新を最小限に抑えた堅牢な生成を実現する,目標とする微調整戦略であるLatlas-Stage LoRAを紹介した。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:52:48 GMT)
Holomorphic Neural ODEs with Kolmogorov-Arnold Networks for Interpretable Discovery of Complex Dynamics [1.7] z2 + c$ のような正則写像によって支配される複素力学系は、初期条件に非常に敏感なフラクタル境界を示す。
学習可能なB-スプライン活性化がネットワークエッジに存在するHolmogorov--Riemann Network (KAN)を導入し、正則構造を保存するためにコーシーマン方程式をニューラル正規化として組み込んだ。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:36:29 GMT)
ArabDiscrim: A Decade-Long Arabic Facebook Corpus on Racism and Discrimination [1.7] 人種差別と差別について議論する公的なアラビアのFacebook投稿293Kのコーパスと10年にわたる語彙資源であるArabDiscrimを紹介します。
既存のTwitter中心のデータセットとは異なり、A ArabDiscrimは、反応、共有、コメント、ページメタデータを含むプラットフォームネイティブなエンゲージメント信号を統合する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:21:33 GMT)
Ishigaki-IDS-Bench: A Benchmark for Generating Information Delivery Specification from BIM Information Requirements [1.7] 本稿では,IDS(Information Delivery Specification)XMLを生成する能力を評価するベンチマークであるIshigaki-IDS-Benchについて述べる。
ベンチマークには166人のBIM/IDS専門家による、検証済みのサンプルが含まれている。
IDSAuditToolベースのProcessability、Structure、Content監査と、ゴールドIDSファイルに対するコンテンツ収集評価を組み合わせる。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:19:55 GMT)
Balancing Uncertainty and Diversity of Samples: Leveraging Diversity of Least, High Confidence Samples for Effective Active Learning [1.7] 簡単なサンプルと難しいサンプルの両方をプールするための4つの新しいハイブリッドサンプリング手法を提案する。
不確実で多様なインスタンスを選択することは、モデルがより異なる特徴を学習するのに役立ちます。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:39:51 GMT)
Implicit Regularization of Mini-Batch Training in Graph Neural Networks [1.6] グラフニューラルネットワーク(GNN)のミニバッチトレーニングは、i.d.データのトレーニングと根本的に異なる。
最も単純な可能なスキームであるRNS(Random Node Smpling)は、ウォールクロックメモリの少ない10のデータセットのうち8つのデータセットのフルグラフトレーニングにマッチするか、あるいは性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:39:03 GMT)
Compiling Agentic Workflows into LLM Weights: Near-Frontier Quality at Two Orders of Magnitude Less Cost [1.6] エージェントオーケストレーションフレームワークは、LangGraph、CrewAI、Google ADK、OpenAI Agents SDK、Semantic Kernel、Strands、LlamaIndexにまたがる合計で290,000以上のGitHubスターを誇っている。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:54:11 GMT)
The Attribution Contract: Feature Attribution for Generative Language Models [1.6] 特徴属性法は、モデル出力にどの入力特徴が重要かを特定することを約束する。
生成言語モデルにおいて、そもそもどのような機能を機能とみなすべきかは、しばしば不明である。
私たちは属性契約(Attribution Contract)を紹介します。
論文参考訳(メタデータ) (Thu, 21 May 2026 22:27:04 GMT)
Steered Generation via Gradient-Based Optimization on Sparse Query Features [1.6] Prototype-Based Sparse Steeringは、Sparse Autoencodersを特にクエリアクティベーションに適用するフレームワークである。
本研究では,スパースクエリ表現が論理的計画法と構造的ニュアンスの両方を統一的かつ解釈可能な制御に必要であることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:13:14 GMT)
Virtual 3D H&E Staining from Phase-contrast Back-illumination Interference Tomography [1.6] HistoBIT3Dは、初めてボクセルに結合したBITと蛍光標識された核データセットである。
本稿では,BITボリュームをシフト変動コントラストでリアルなH&Eボリュームに変換する新しい仮想染色フレームワークを提案する。
提案手法は,3次元核分割精度と境界保存性を著しく向上させながら,最先端のリアリズム測定値を実現する。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:58:09 GMT)
Evaluation of Pipelines for Data Integration into Knowledge Graphs [1.5] 既存のKGに異なる種類の入力データを取り込み、統合パイプラインを評価するための新しいベンチマークKGI-Benchを提案する。
パイプラインのアウトプットを3つの相補的な品質指標、正確性、一貫性で分析し、パイプラインを評価する。
12のパイプラインを比較評価し、異なる入力データフォーマットと設計選択でそれらの振る舞いを分析します。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:52:48 GMT)
Mediative Fuzzy Logic: From Type-1 Foundations to Type-2, Type-3 and Quantum Extensions [1.5] 本稿では、インターバルタイプ2、グラニュラータイプ3、量子拡張とともに、タイプ1コアの統一的な説明を開発する。
調合のない公式に対して、基礎となるファジィ基底に音性、矛盾性、保守性を確立する。
自律ブレーキセンサー融合の例は、このフレームワークが透明性、保守的、安全優先の意思決定をどのようにサポートするかを示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:26:53 GMT)
A note on convergence of Wasserstein policy optimization [1.5] Wasserstein Policy Optimization (WPO) は、連続的な行動空間におけるポリシーを最適化するためにWassersteinの勾配流を利用する強化学習アルゴリズムである。
エントロピー規則化されたマルコフ決定過程の枠組みにおけるWPOは線形に収束する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:32:39 GMT)
Astro, I'm Home! Investigating Factors that Influence the Acceptance of Home Robots Using Supervised Machine Learning [1.4] 家庭環境における社会ロボットの利用が増加している。
パフォーマンスの期待、社会的影響、ヘドニックなモチベーションは、この技術を使用する意図の最も強く一貫性のある予測因子として現れた。
論文参考訳(メタデータ) (Thu, 21 May 2026 00:04:09 GMT)
CoRMA: Contrastive RMA for Contact-Rich Meta-Adaptation [1.4] CoRMAは、力強いアセンブリのためにRMAを変更するコンテキストベースのメタ適応フレームワークである。
デプロイ可能な因果変換器アダプタは、このコンテキストを力、受容性、行動履歴からオンラインで推測する。
シミュレーションの精度は高いがハードウェアでは大幅に低下するFOGEベースラインと比較して、CoRMAは制御対象雑音下での精度の高い実効性を維持している。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:21:56 GMT)
Supervised Classification Heads as Semantic Prototypes: Unlocking Vision-Language Alignment via Weight Recycling [1.4] ポストホックアライメント法は、軽量マッピングを通じて予め訓練されたエンコーダを接続することで計算コストを削減する。
本研究では,事前学習された視覚モデルの分類ヘッドを意味的プロトタイプとして再利用する可能性について検討する。
本手法をいくつかの最先端のポストホックアライメント手法と組み合わせることで、クロスモーダル検索やゼロショット、少数ショットの分類タスクにおける精度が一貫して向上することが実証された。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:41:18 GMT)
RAS: Reflection-Augmented Scaling with In-Context Learning for Executable Cypher Query Generation [1.4] 言語モデルがプロパティグラフデータベースに対して実行するクエリを生成するText2Cypherについて検討する。
実行不可能なクエリは、意味的不正確性とは別個の構文的障害を構成する。
Independent Scaling (IS) と Reflection-Augmented Scaling (RAS) の2つの推論手法を比較した。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:14:09 GMT)
Human Vulnerability Assessment in Cybersecurity: A Systematic Literature Review of Methods, Models, and Instruments [1.4] この研究は、サイバーセキュリティにおけるヒューマン脆弱性評価(Human Vulnerability Assessment, HVA)の体系的な文献レビューを提供する。
それは、人間の脆弱性の全スペクトルに動的に対処する評価方法、モデル、または機器が存在するかどうかを調査することを目的としている。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:50:09 GMT)
RelWitness: Open-Vocabulary 3D Scene Graph Generation with Visual-Geometric Relation Witnesses [1.3] 不完全な関係管理の下で提案したRGB-Dシークエンスからオープン語彙の3Dシーングラフを生成するフレームワークを提案する。
重要なコンセプトは関係の証人であり、キャプチャーされたシーンで関係を観察できる具体的な視覚幾何学的キューである。
RelWitnessはRGBビュー、深度マップ、再構成された3D幾何、ロールセンシティブなテキスト、オブジェクト-プリアヌルビュー、マルチビュー一貫性から関係証記録を構築する。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:40:41 GMT)
Detection of Virus and Small Cell Patches in Foci Images Using Switchable Convolution and Feature Pyramid Networks [1.3] 本稿では,FPN(Feature Pyramid Network)を統合し,マルチスケールな特徴表現を改善するYOLOv2ベース検出器を提案する。
また,高密度顕微鏡画像における微粒化ターゲットに対する受容場適応のために,スイッチング可能な畳み込み機構を組み込んだ。
以上の結果から,FPNをベースとした機能融合と交換可能な畳み込みを併用することで,特殊なバイオメディカル物体検出タスクにおけるYOLOv2の適合性が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:39:36 GMT)
Cross-Lingual Consensus: Aligning Multilingual Cultural Knowledge via Multilingual Self-Consistency [1.3] 大規模言語モデル(LLM)は、言語間での大幅なパフォーマンスの相違を示す。
本稿では,この知識ギャップを埋める新たな自己教師型フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:11:01 GMT)
Disentanglement Beyond Generative Models with Riemannian ICA [1.3] 我々は,グローバルな生成モデルを仮定することなく,局所的ゆがみを研究する理論的基盤を提供する。
我々の主な貢献は、二階の非絡みの概念を符号化する非絡みテンソルである。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:22:25 GMT)
Human-Centered Learning Mechanics: A Dynamical Framework for Entropy-Regulated Representation Learning [1.2] オープンかつ制御された学習システムのための動的・情報理論の枠組みを提案する。
中心となる考え方は、選択されたエントロピーサロゲートが非退化情報力を生成する場合にのみ、エントロピー正則化が有用であるということである。
制御された表現学習実験は、幾何エントロピーがソフトマックス正規化エントロピーよりも強くより安定した情報力をもたらすという仮説を支持する。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:16:39 GMT)
When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance [1.2] ある宗教から別の宗教への仮説的信仰の移行について助言を求めると、モデルは一貫した非対称性を示した。
平均的なカトリック、バー、シク教徒の宗教は広く好まれた。
無神論者、アグノスティックス、ジェホバの証人は、主に嫌われていた。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:05:09 GMT)
Cross-domain benchmarks reveal when coordinated AI agents improve scientific inference from partial evidence [1.1] コーディネートされたAIエージェントが、より単純な科学的証明タスクよりも価値を付加するかどうかを評価する。
例えば、分子構造を音楽表現にマッピングし、科学における歴史的パラダイムシフトを検知し、トランジット・太陽系外惑星候補を審査する。
結果: 異なる分野がそれぞれ現象の一部のみを捕捉すると, クロスチャネルコンポジットは単一チャネルベースラインよりも改善する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:46:50 GMT)
COCOTree: A Dataset and Benchmark for Open Tree-Structured Visual Decomposition [1.1] オープンツリー分解のタスクを形式化し、有効にします。
COCOTreeは21Kイメージと1.8M構造ノードを備えた大規模ベンチマークである。
マスク精度,ラベル精度,構造整合性を共同で評価するオープンツリー品質(OTQ)指標を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:03:19 GMT)
Stabilising Explainability Fragility in Cybersecurity AI: The Impact and Mitigation of Multicollinearity in Public Benchmark Datasets [1.1] 多重線型性は帰属分散を膨らませるという公式な定理を導入する。
線形、ツリーベース、カーネル、ニューラルの4つのモデルが、フルおよびプルーニングされた機能セットで評価されている。
本稿では,説明可能性の脆弱性スコア(Explainability Fragility Score)の新たな指標と,拡張複雑性を緩和する2つの新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:20:33 GMT)
Benchmarking Machine Learning Architectures for Antimicrobial Stewardship in Pediatric ICUs [1.1] 小児集中治療器(PICU)における抗微生物スチュワードシップ(AMS)の意義
機械学習は、電子健康記録データから患者レベルの介入機会を特定するための有望なアプローチを提供する。
公開データセットと民間機関コホートを用いたPICUにおけるAMS介入予測の系統的ベンチマークを行った。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:26:58 GMT)
Rashomon-Seeded Annealing for Robust Bayesian Inference in Factorial Designs [1.1] そこで本研究では,ラショウモン集合を戦略的「ウォームスタート」として再利用し,全後部を推定する一般計算フレームワークを提案する。
本稿では, 因数分解設計のための厳密で認証されたシードコンストラクタとして, RPS (Rashomon Partition Sets) を用いて, このアプローチを実証する。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:01:39 GMT)
FederatedRSF : Federated Random Survival Forests for Partially Overlapping Medical Data [1.0] フェデレートRSFは、ランダムサバイバル森林を実装し、地元で訓練されたサバイバルツリーを集約し、各場所に特徴互換の木のみを再配布する。
GBSG2乳がんコホートにおけるFederatedRSFとScikit-survival packageの併用効果について検討した。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:32:25 GMT)
Decision-Path Patterns as Tree Reliability Signals: Path-based Adaptive Weighting for Random Forest Classification [1.0] ランダム林は、一様樹重の葉の分布を平均化することで木を集約する。
我々は,各木の根対葉決定経路の構造パターンがそのような信号を持っていることを観察する。
本稿では,この信号を利用したクラス条件比重み付けを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:40:18 GMT)
Choose Wisely and Privately: Proactive Client Selection for Fair and Efficient Federated Learning [0.9] Federated Learningは、データ転送なしで分散化されたデータソース間で協調的なモデルトレーニングを可能にする。
平均FLは、収束速度と最終モデルの精度に悪影響を及ぼす非IIDデータの存在によって制限される。
本稿では,学習開始前の有効性と公正性の要求に一致したクライアントの最適なフェデレーションを見つけることを目的とした,積極的なクライアント選択フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:42:35 GMT)
The Hidden Cost of Contextual Sycophancy: an AI Literacy Intervention in Human-AI Collaboration [0.9] 大規模言語モデル(LLM)は、コラボレーションのためのインタラクティブなツールとして、教育環境においてますます使われている。
誤りがあってもユーザの信念と整合し、学習と意思決定に対する懸念を喚起する。
本研究では, サイコファンティックアライメントが, マルチターンヒトとAIの相互作用においてどのように現れるかを検討する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:18:02 GMT)
Information Processing Capacity of Stationary Physical Systems: Theory, Data-efficient Estimation Methods, and Photonic Demonstration [0.9] 我々は、Information Processing Capacityフレームワークを静止物理コンピューティングシステムに拡張する。
非線形光ファイバーを介して伝播するピコ秒レーザーパルスをベースとしたフォトニックコンピューティングシステムを用いて,この枠組みを実験的に検証する。
これらの結果は、物理コンピューティングシステムの力学と機械学習性能の実践的な橋渡しとしてIPCを確立している。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:18:25 GMT)
Improved Vision-to-Chart Buoy Association with Learned World-to-Image Projection [0.8] 本報告では,MACVi 2026 Vision-to-Chartデータアソシエーションチャレンジに対して,DETRベースの核融合トランスフォーマーベースラインを軽量に修正する。
F1 = 0.8055 と mIoU = 0.6718 の合計スコアは 0.7386 であり、全ての応募のうち2位である。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:17:55 GMT)
Terminal Constraint Model Predictive Control for Image-Based Visual Servoing of UAVs with Kalman Filter-Based Moment Loss Compensation [0.8] 画像ベースビジュアルサーボ(IBVS)は、画像空間エラーを直接制御することにより、無人航空機(UAV)に対して効率的な視覚誘導制御パラダイムを提供する。
本稿では, IBVSのための端末制約モデル予測制御(TC-MPC)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:11:53 GMT)
One prompt is not enough: Instruction Sensitivity Undermines Embedding Model Evaluation [0.8] 6つの埋め込みモデル、11のデータセット、および15のタスク固有のプロンプトにまたがる、迅速な感度に関する実証的研究を示す。
報告されたスコアは、可算なプロンプト上のスコアの分布を誤って表現していることを示す。
本研究の結果から, 単発型埋め込みモデルでは単発型評価が不十分であることが示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:27:46 GMT)
Audience Engagement with Arabic Women's Social Empowerment and Wellbeing: A Decadal Corpus [0.8] アラブ女性社会法人は、女性のエンパワーメントと社会福祉に関連する公的なアラブ系Facebook投稿252,487件の10年間のコレクションである。
コーパスは2013年から2024年にかけて77カ国の51,660ページから収集され、ユーザインタラクションは2億6700万を超えている。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:10:09 GMT)
Tracking Urban Atmospheric Pollutants using Sentinel-5P Satellite Data [0.7] 都市部における二酸化窒素(NO$)は、燃焼に関連する大気汚染の重要な指標であり、都市において強い空間的・時間的変動を示す。
本研究では, エクアドルのグアヤス州におけるセンチネル-5P/TROPOMI観測による都市大気汚染の追跡を目的とした衛星ベースフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:59:04 GMT)
SDPM: Survival Diffusion Probabilistic Model for Continuous-Time Survival Analysis [0.7] 生存拡散確率モデル(Survival Diffusion Probabilistic Model, SDPM)は、持続的生存分析のための生成的アプローチである。
SDPMは、標準化されたログタイムと検閲指標の連続したガウス混合表現を用いて、変換されたターゲット空間で動作する。
その結果,SDPMはC-index,統合時間依存型AUC,統合型Brierスコア間での競合予測性能が得られた。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:33:47 GMT)
Verify-Gated Completion as Admission Control in a Governed Multi-Agent Runtime: A Bounded Architecture Case Study [0.7] 制御されたマルチエージェントランタイムの入出力制御パターンとして,検証ゲート補完について検討する。
観測条件下では,読み取り専用検証ゲートとパケット化入力記録が検査可能で,フェールクロースされた。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:11:25 GMT)
Optimal work extraction in measurement-based quantum Otto engines: Non-adiabaticity and generalized measurements can be beneficial [0.7] 測定に基づく量子熱エンジンは、従来の熱エンジンに代わるものとして大きな関心を集めている。
このようなエンジンから抽出可能な最適作業について検討し,その性能が従来の量子オットーサイクルよりも優れているかを検討した。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:54:09 GMT)
Cohesion-6K: An Arabic Dataset for Analyzing Social Cohesion and Conflict in Online Discourse [0.7] 本稿では,パレスチナのイスラエル占領に関連する6万件の公的なFacebook投稿の,手動およびChatGPTによる注釈付きデータセットを提案する。
Cohesion-6Kは、オンライン凝集と分極の研究のために透明で再現可能な資源を提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:16:28 GMT)
EMMA: Extracting Multiple physical parameters from Multimodal Data [0.6] 本稿では,物理インフォームド・マルチモーダル・フレームワークであるEMMAを紹介した。
EMMAは、統一された連続時間モデル内で、明示的パラメータ、暗黙的動的成分、キャリブレーション不変量の共同推論を行う。
本研究は,多モードデータから物理一貫性モデル抽出を行うための汎用的,スケーラブルなソリューションとしてEMMAを確立した。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:19:00 GMT)
The Efficiency Frontier: A Unified Framework for Cost-Performance Optimization in LLM Context Management [0.6] 大規模言語モデル(LLM)は、長いコンテキスト処理にますます依存するが、コンテキストウィンドウの拡大は、計算と財政のかなりのコストをもたらす。
検索とメモリ圧縮を含む既存の文脈削減手法は、通常、パフォーマンスと効率のメトリクスを独立して評価する。
本稿では,LLMコンテキスト管理におけるコストパフォーマンス最適化のための統合フレームワークである「効率フロンティア」を紹介する。
論文参考訳(メタデータ) (Thu, 21 May 2026 22:03:25 GMT)
Moral Semantics Survive Machine Translation: Cross-Lingual Evidence from Moral Foundations Corpora [0.6] 道徳的言語は微妙で文化的に変化しており、言語間で忠実に翻訳することは困難である。
直訳は、言語間機械学習によって得られる微妙な道徳的手がかりを十分に保っていることを示す。
我々はポーランド語をスラヴ語の代表として示し、関連する言語への一般化を期待する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:02:15 GMT)
Observation of associative-memory retrieval and spin-glass phases on a photonic quantum simulator [0.6] フォトニック量子技術は、その固有の速度と複雑なネットワークをシミュレートする並列処理能力を活用している。
ここでは,光モードの集合に分散した単一光子を利用する実験プラットフォームの設計と実演を行う。
2光子過程によって実現された4体局所相互作用項を持つ完全連結ホップフィールドハミルトニアンに特に焦点をあてる。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:01:09 GMT)
The Matching Principle: A Geometric Theory of Loss Functions for Nuisance-Robust Representation Learning [0.6] 本稿では,ラベル保存型デプロイメントニュアンスの共分散を推定することが統計的問題であると主張している。
コーラル、敵対的トレーニング、IRM、拡張、計量学習、ヤコビの罰則、アライメントスタイルの制約は、独立したトリックではなく、そのオブジェクトの異なる推定要因である。
本稿では,タスク精度やヤコビアン・フロベニウスノルムが不十分な場合,ラベルのない埋め込み感度プローブであるトラジェクトリ偏差指数(TDI)を導入する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:53:28 GMT)
Knowledge Graph Re-engineering Along the Ontological Continuum (extended version) [0.5] 我々は,概念的枠組みが意味論と実用学,プロパティと手頃さの2つの区別で定義される理論的構造を定義することを目的とする。
我々はオープンな研究課題を明確にし、共同研究課題として存在論的連続体を開発するようコミュニティに呼びかける。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:33:36 GMT)
Decoupling Ego-Motion from Target Dynamics via Dual-Interval Motion Cues for UAV Detection [0.5] 無人航空機(UAV)からの物体検出は、激しいエゴモーション、カメラジッタ、大規模変動によって困難にさらされている。
本稿では、カメラによる乱れから目標運動を分離する視覚のみのモーションガイド検出フレームワークを提案する。
VisDrone-VIDデータセットの実験では、強いエゴモーションの下で強いYOLOv8ベースラインに対して一貫した改善が示されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:18:34 GMT)
Detecting Offensive Cyber Agents: A Detection-in-Depth Approach [0.5] 人工知能(AI)エージェントがサイバー攻撃を組織化できるようになった。
この開発はサイバー攻撃のスピードと規模を増している。
これらの新興脅威に対して防御するためには、アクターはまずそれらを検出する能力を開発する必要がある。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:44:02 GMT)
Chebyshev Policies and the Mountain Car Problem: Reinforcement Learning for Low-Dimensional Control Tasks [0.4] 我々は、RLの標準ベンチマークであるマウンテンカー問題を解析的に解き、最適制御解を導出する。
我々は、チェビシェフポリシーを第一原理から普遍的な(すなわち密度の高い)RLポリシーのクラスとして導入する。
ニューラルネットのドロップイン置換として訓練することができ、後悔を4.18倍に減らし、277倍のパラメータを必要とする。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:54:26 GMT)
Chaos to Synchronization and Dissipative Quantum Scarring in Open Coupled top-Dicke model in a Lossy Cavity [0.4] 我々は、リッチな非平衡現象の探索を可能にするディックモデルの変種を示す。
このモデルは2種のBose-Josephson接合を損失キャビティに結合することで効果的に実現できる。
我々は消散の有無で2つの異なる傷跡を同定した。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:32:19 GMT)
Benchmarking Commercial ASR Systems on Code-Switching Speech: Arabic, Persian, and German [0.3] コードスイッチングは、自動音声認識において最も困難で未研究の条件の1つである。
我々は、4つの言語ペアで5つの商用ASRプロバイダを評価するベンチマークを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:22:39 GMT)
Whose Voice Counts? Mapping Stakeholder Perspectives on AI Through Public Submissions to the U.S. Government [0.3] 我々は、トランプ政権の米国AI行動計画の公開協議中に提出された手紙のコーパスに基づいて、AIの一般認識を調査した。
我々の結果は、個人がAIが人生に与える影響に関して強い懸念を抱いている一方で、他の利害関係者はAI開発にもっと関心を持っていることを示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:54:00 GMT)
VEELA: A Clinically-Constrained Benchmark for Liver Vessel Segmentation in Computed Tomography Angiography [0.3] VEELA(Vessel extract and Extrication for Liver Analysis)は、40個のCTAスキャンから厳密にキュレートされた血管データセットである。
すべての船は、厳密な可視性に基づくアノテーションポリシーを使用して、多専門家の合意のもと、手動でスライス・バイ・スライスされた。
標準化されたベンチマークフレームワークを構築し,トポロジ・アウェア(clDice)、オーバーラップ・ベース(IoU)、バウンダリ・センシティブ・アタッチメント(NSD)、ジオメトリ・アウェア(エリア,長さ)といった相補的評価指標を解析する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:42:47 GMT)
WTKO-CNN: Deep Learning Reveals Sequence Motifs Distinguishing Wild-Type and Knockout ATAC-seq Peaks [0.3] 畳み込みニューラルネットワークを用いてDNA配列をWTまたはKOに分類する。
分類決定に最も影響を及ぼすヌクレオチドの位置を特定するために,サリエンシマップを生成する。
本分析では,KO配列からWTを識別する転写因子ファミリーに関連するモチーフを同定した。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:46:50 GMT)
Scaling Observation-aware Planning in Uncertain Domains [0.3] この研究は、OOPの決定可能な断片の解決をスケールするための(サブ-)シンボリックテクニックを研究します。
我々は,POMDPの分解による可視観測関数を同定する新しい手法を開発した。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:58:01 GMT)
Whose Good, Whose Place? The Moral Geography of Agentic AI for Social Good [0.3] 我々は,2015年から2026年にかけて発行されたソーシャルグッズのためのエージェントAIに関する112の論文について,構造化された調査を行った。
論文は、地域政治、法律、文化の文脈が最も重要となる領域において、地理的文脈を正確に特定する可能性が低い。
我々は、社会的善のためのよりコンテキスト特化、参加型、説明可能なエージェントAIに対して、最小限の報告標準を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:49:27 GMT)
Towards Verifiable Transformers: Solver-Checkable Circuit Explanations [0.2] 本稿では,タスクローカライズされたトランスフォーマー回路を有界,ソルバチェック可能なクレームに変換するためのフレームワークであるVerifiable Transformersを紹介する。
署名付きL1 BandNorm、スパースマックスアテンション、LeakyReLUを用いて、GPTスタイルのアーキテクチャで直接検証を行う。
また,タスクローカライズされた回路上でのサロゲートによる検証も行った。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:21:40 GMT)
Security of LLM-generated Code: A Comparative Analysis [0.2] LLM(Large Language Model)が生成するコードは現在、大手テック企業を含む製品で生産されている。
7つのLLMが生成するコードのセキュリティを実証的に評価する。
その結果,評価した7つのLLMがすべて,脆弱性を含むコードを生成することがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 22:53:40 GMT)
Code Smells in Clojure: Initial Findings from a Grey Literature Review [0.2] コードの臭いはコード品質の悪い指標として広く使われており、構造的な問題や改善の可能な領域を明らかにしている。
本稿では,現代関数型プログラミング言語におけるコードの臭いに関する灰色文献による研究結果について述べる。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:36:56 GMT)
ThriftAttention: Selective Mixed Precision for Long-Context FP4 Attention [0.1] 提案するThriftAttentionは,FP4推論効率で約FP16の長文品質を実現する低ビットアテンションバリアントである。
我々は、FP16のクエリキーブロックの5%しか計算できないという長文のベンチマークとモデルファミリで、ThriftAttentionはFP4からFP16のパフォーマンスギャップの89.1%で回復することを示した。
論文参考訳(メタデータ) (Thu, 21 May 2026 22:28:27 GMT)
Quantum Fisher Information under decoherence with explicit wavefunctions [0.1] 本稿では,多体量子状態の量子フィッシャー情報(QFI)をデコヒーレンスの存在下で推定する方法を提案する。
職業数ベースで解析的に知られている多体波動関数に対して,QFIの体系的下界は期待値にマッピング可能であることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:00:34 GMT)
Towards a compositional semantics for quantitative confidence assessment in assurance arguments [0.1] 既存のアプローチは、構造と健全性に対処するが、主張の正当性に対する信頼よりも、真理値よりも主に理由がある。
本稿では,議論要素をSL意見として表現する信頼性セマンティクスを提案し,信頼の流れをモデル化したSL演算子に要素間の関係をマッピングする。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:17:27 GMT)
LLM-Metrics: Measuring Research Impact Through Large Language Model Memory [0.1] 大規模言語モデル(LLM)のパラメトリックメモリから導出した研究・インパクト評価指標であるLLM-Metricsを提案する。
2023-2024年に発行された549のコンピュータサイエンス論文を,6つのベンダーから0.5Bから72Bのパラメータにまたがる17のLLMで評価した。
17モデルのうち15モデルが肯定的な予測を行い、そのうち9モデルが0.05未満のpで有意であり、rho = 0.1495 と p = 0.0004 のスピアマンの総合的な相関は引用数に対して有意であった。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:45:57 GMT)
Polite on the Surface, Wrong in Practice: A Curated Dataset for Fixing Honorific Failures in Multilingual Bangla Generation [0.1] 我々はtextbfBangLa アプリケーションと DialoguE 生成のための新しい,文化的に整合した命令チューニングデータセットを提案する。
我々はこのリソースを利用して、DeepSeek-8BやLLaMA-3.2-3Bなど、先進的なオープンウェイトアーキテクチャを体系的に微調整し、評価する。
我々の経験的評価は、データセットに微調整されたモデルが、構造的忠実度と名誉的アライメントを大幅に改善することを示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:43:07 GMT)
Efficient Hamiltonian Engineering for Adiabatic MIS Algorithms [0.1] 本稿では、Rydberg atom array を用いた最大独立集合(MIS)のハイブリッド断熱アルゴリズムを提案する。
グラフノードを小さな次数で表現する、隣人が少ない原子を優先的に励起する局所制御を設計する。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:07:02 GMT)
Comment on "Spin-1/2 Kagome Heisenberg Antiferromagnet: Machine Learning Discovery of the Spinon Pair-Density-Wave Ground State" [0.0] 最近の論文では、グループ同変畳み込みニューラルネットワークを用いて、カゴメ・ハイゼンベルク反強磁性体の基底状態を研究する。
スピン液体基底状態の可能性を示唆する以前の結果とは対照的に, 著者らはスピノン対密度波基底状態の観測を行った。
i) 報告された低エネルギーはメトロポリス・ハスティングスサンプリングにおけるエルゴディディティの破片である。なぜなら、著者が利用したシングルスピンフリップ更新規則はマルコフ連鎖を効果的に凍結するからである; (ii) エルゴディックサンプリングがスピン交換更新によって実施されるとき、
論文参考訳(メタデータ) (Thu, 21 May 2026 19:06:19 GMT)
Multi-Modal Spectroscopy Theory for Ultrafast Control of Rabi Oscillations [0.0] キャビティ量子電磁力学(cQED)におけるエミッタ-キャビティ結合強度の完全な制御を実現するための3キャビティスキーム
非定常量子力学の計算過程を単純化するために一般化されたセンサ法を開発した。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:46:58 GMT)
How many systems can be dephased before the quantum switch becomes causally definite? [0.0] 因果的に分離不能なプロセスは、固定または明確に定義された因果構造を持つ量子回路よりも有利である。
因果非分離性がなくなる前に、どれだけの系を分解できるかを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:56:44 GMT)
VectraYX-Nano: A 42M-Parameter Spanish Cybersecurity Language Model with Curriculum Learning and Native Tool Use [0.0] VectraYX-Nanoは、41.95Mパラメータのデコーダのみの言語モデルで、スクラッチから訓練されたスペイン語でサイバーセキュリティを提供する。
クラウドコンピューティングの25ドルで8VMの分散パイプラインで組み立てられた170万のスペインのコーパスは、3つのカリキュラムフェーズ(会話42M、サイバーセキュリティ118M、攻撃ツール10M)に分けられる。
SFT (loss 1.74) の後、v2 ブートストラップ-アブレーション参照は 0.775 +/ の会話ゲートを得る。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:59:18 GMT)
Understanding Data Temporality Impact on Large Language Models Pre-training [0.0] 大型言語モデル(LLM)は一般にシャッフルコーパスで訓練される。
本研究では,事前学習のダイナミクスが時間に敏感な事実知識の獲得に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:31:17 GMT)
Uncertainty-aware classification and triage of structural heart disease using electrocardiography and echocardiography metrics [0.0] 心電図(ECG)データを用いた構造心疾患(SHD)スクリーニングへの最近の投資がその一例である。
我々はベイズ的手法がSHD分類における頻繁な手法と同等かそれ以上であることを示す。
本稿では,この不確実性を考慮した分類手法を用いてSHDのスクリーニングを行う例を示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:55:12 GMT)
UNAD+: An Explainable Hybrid Framework for Unknown Network Attack Detection [0.0] 本稿では、従来提案されていた未知ネットワーク攻撃検知器(UNAD)から導かれた未知ネットワーク攻撃検出のための拡張フレームワークを提案する。
UNAD+は、良性のみの教師なしアンサンブルと重み付き多数決投票(Weighted Majority Voting、WMV)、擬似ラベリング検出で訓練された監督強化段階、およびポストホック説明可能性層を組み合わせたものである。
結果は、 UNAD+がオリジナルの UNADフレームワークを改善し、ベンチマークデータセットの98%以上でF1スコアを達成していることを示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:31:10 GMT)
TriSweep: A Four-Drone Swarm Framework for Electromagnetic Side-Channel Analysis [0.0] TriSweepは、自律的なスタンドオフEM-SCAのための4つのドロンのSwarmアーキテクチャを設計し、評価するシミュレーションフレームワークである。
空間的に専門化された3つの収集ドローンは、コヒーレントな組み合わせを行う静止アキュベータードローンを供給します。
物理的なハードウェアは製造されておらず、プロトタイプの構築が次のステップとして計画されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:47:44 GMT)
Three sins against physics by an exaggerated quantum information perspective [0.0] 量子情報の観点が物理学に関する歪んだ主張に繋がる3つの方法を指摘します。
光はコヒーレンスを示すために定量化される必要はない。 ユニタリ進化のジェネレータを無視し、 敵との戦いとして自然の発見に近づいている。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:22:19 GMT)
The relative entropy of magic and its nonadditivity [0.0] 魔法の資源理論を用いて非安定化剤状態の生成を解析・定量化する。
単一量子ビットに対して、エンタングルメントの相対エントロピーから知られている解析結果を適用することにより、マジック状態とその最も近い安定化状態を特徴づける。
魔法の相対エントロピーがほとんどすべての場合において非付加的であることを解析的に証明する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:24:38 GMT)
The Neural Compiler: Program-to-Network Translation for Hybrid Scientific Machine Learning [0.0] The Neural Compilerは、一階のSchemeのような表現言語で書かれたプログラムを、凍結して微分可能なPyTorchモジュールに変換するシステムである。
ハイブリッドモデルでは、コンパイルされたモジュールは未知のコンポーネントをモデル化しながら、既知の物理を正確にエンコードする。
コンパイルされたモジュールは、単一の方程式に対して手書きのPyTorch実装と数値的に一致し、コンパイルによる精度の低下は示さない。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:49:20 GMT)
The Log is the Agent: Event-Sourced Reactive Graphs for Auditable, Forkable Agentic Systems [0.0] 典型的なエージェントフレームワークを反転させるランタイムであるActiveGraphについて説明する。
追加のみのイベントログが真実の源であり、ワーキンググラフはそのログの決定論的プロジェクションである。
コンポーネントが他のコンポーネントに指示することはありません。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:55:38 GMT)
The Deterministic Horizon: Impossibility Results as Design Specifications for Trustworthy AI Systems [0.0] この論文は、好奇心から不合理性の結果を設計規則に変える。
そのフラッグシップとなる結果は、アーキテクチャだけで設定された精度の高い天井を証明している。
同じ引数がサブフィールドにまたがって再キャストされる。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:48:35 GMT)
Ternary Decision Trees with Locally-Adaptive Uncertainty Zones [0.0] 3次決定木は、最適しきい値を中心とする半幅デルタの不確かさゾーンを持つ各分割ノードを増大させる。
デルタは、標準のCART分割探索時に既に利用可能な統計から各ノードでローカルに計算される。
デルタ推定手法として,品質プレート,クラスオーバーラップ,ゲイン比,ノードブートストラップ,マージンの5つを評価した。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:11:19 GMT)
Temporal Coding as a Substrate for Sensorimotor Object Inference: A Spiking Reinterpretation of Thousand Brains Architecture [0.0] Thousand Brains 30-50 (TBT) とオープンソースのMontyフレームワークは、知覚型推論によるオブジェクト認識をモデル化している。
現在の実装では、各連絡先を濃密な浮動小数点ベクトルとして符号化している。
3つの検証可能な予測を導き、約450行のNumPyで4つのコンポーネントの実装を指定する。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:12:31 GMT)
Sutra: Tensor-Op RNNs as a Compilation Target for Vector Symbolic Architectures [0.0] Sutraは、コンパイルされた前方通過がPyTorchニューラルネットワークである型付き純粋関数型プログラミング言語である。
同じ成果物は、ロジックプログラムとトレーニング可能なニューラルネットワークの両方である。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:10:07 GMT)
Sudden death of entanglement, rebirth of magic [0.0] 局所マルコフノイズは絡み合いを取り戻すことはできないが、魔法を取り戻すことができる。
小さな$の場合、リボーン・マジックは完全に分離可能な状態にあり、すべての適切な辺縁安定化器がある。
局所散逸は、純粋な安定化状態をさらにマジックジェネレータとマジック絶縁体に分割する。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:16:42 GMT)
Statistical Interpretation of the Procedures Measurement of Physical Quantities [0.0] 本研究は、量子物理学の基礎となる概念的枠組みを開発する。
新しい公理や理論を提案するのではなく、本文は既存のモデルを再編成し、合成する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:08:19 GMT)
StanBKT: Rethinking Parameter Estimation in Bayesian Knowledge Tracing [0.0] 我々は,ベイジアン知識追跡モデルを推定するオープンソースPythonパッケージであるStanBKTを紹介する。
StanBKTは、ハミルトンモンテカルロ、変分推論、パスファインダー、最適化に基づく推定をサポートする統一的なフレームワークを提供する。
我々はStanBKTを大規模観測および制御された教育データセット上で評価する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:27:10 GMT)
Shielded inner-shell transitions in atomic samarium for tests of fundamental physics [0.0] 未観測の4f66s2,5$D$_0$中性サマリウムを14,564.90(2),mathrmcm-1$と同定する。
これらの結果は、中性サマリウムを標準モデルを超えた内殻精密分光と物理実験の基盤として確立している。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:04:44 GMT)
SepsisAI Orchestrator: A Containerized and Scalable Platform for Deploying AI Models and Real-Time Monitoring in Early Sepsis Detection [0.0] 本稿では,機械学習のためのオープンソースのモジュールプラットフォームであるSepsisAI-Orchestratorを紹介する。
このプラットフォームはHL7 FHIRにインスパイアされた臨床文書アーキテクチャを統合している。
レプリカカウントはホストの物理CPUスレッドカウントと一致しなければなりません。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:19:31 GMT)
Sensitivity Evaluation of SU(1,1) Interferometers with Arbitrary Input Probe State and Homodyne Detections [0.0] ホモダイン検出下でのSU(1,1)干渉計による位相感度の一般理論的導出を行う。
単一出力ポートとジョイントホモダイン検出の両方を含むシナリオについて検討し、等利得のパラメトリック増幅器やゲイン2次増幅器を併用したパラメトリック増幅器について検討する。
驚くべきことに、単一出力モード検出と等利得のパラメトリック増幅器による構成は、内部損失が最も高いロバスト性を示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:59:45 GMT)
Self-testing of exact entanglement embezzlement [0.0] 我々はヒルベルト空間$mathcalH$における触媒状態ベクトル$$の正確なエンタングルメントエンベジメントをユニタリを用いて検討する。
そのようなプロトコルは、テンソル積 $mathcalO_d otimes MathcalO_d$ 上の一意の状態から生まれなければならないことを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:50:39 GMT)
Self-Play Reinforcement Learning under Imperfect Information in Big 2 [0.0] 我々は不完全情報カードゲームBig 2のためのセルフプレイRLフレームワークを開発した。
共通の環境下では、PPOはモンテカルロQ近似、SARSA、Qラーニングをランダム、欲求、ビッグ2相手に対して上回る。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:56:09 GMT)
Secure and Parallel Determinant Computation for Large-Scale Matrices in Edge Environments [0.0] 行列行列行列計算は制御システム、暗号、機械学習の応用において重要である。
従来の決定的アルゴリズムは制約のあるエッジシナリオのリアルタイム処理には適さない。
本稿では,強力なセキュリティ保証を提供するセキュア並列行列計算(SPDC)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 06:23:17 GMT)
Scale-Invariant Open Quantum Systems [0.0] 我々は、スケール不変環境に結合したオープン量子システムのための完全な理論的枠組みを開発する。
この研究は、一意性定理、結果の非マルコフ力学の形式主義の証明を提供する。
本稿では, トラップイオンシミュレータ, ニュートリノ望遠鏡, 超伝導量子ビットの実験的意義について論じる。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:00:36 GMT)
Sample-efficient benchmarking of shallow all-to-all random quantum circuits [0.0] 非線形クロスエントロピーは、浅深さランダム量子回路に対するサンプリング効率のベンチマークを提供することを示す。
また、対数的なサンプルの複雑さを短時間で特徴付ける重出力生成の概念に基づくバイナリ分類器も開発する。
我々の証拠は、レプリカのトリックから導かれた全ブラウン回路アンサンブルの正確な解析式と数値シミュレーションから導かれる。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:00:28 GMT)
Riemannian geometry meets fMRI: the advantages of modeling correlation manifolds and eigenvector subspaces [0.0] 相関行列は機能的脳ネットワークの基本要約である。
既存の幾何学的手法は、しばしば閉形式演算を欠いているか、あるいは任意の領域順序に依存する。
オフログ計量とグラスマン部分空間判別という2つの要素を持つスケーラブルな幾何学的枠組みを導入する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:22:31 GMT)
Represented Is Not Computed: A Causal Test of Candidate Algorithmic Intermediates in a Transformer [0.0] ベース桁抽出に基づいて訓練されたトランスフォーマーは、ホールドアウトされたナンバーベース交差点で99.83%の精度に達する。
スパースサーキットサーチは、プローブが提案するルートよりも遅くに結合するN$、B$、D$ルートを主に分離している。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:43:25 GMT)
Reinforced Graph of Thoughts: RL-Driven Adaptive Prompting for LLMs [0.0] Graph of Thoughts (GoT) は複雑な問題解決に有用であることが示されている。
本稿では,GoTプロンプトパラダイムに対する自動アプローチであるReinforced Graph of Thoughts (RGoT)を提案する。
その結果、ある制約の下では、タスクの複雑さに適応して、タスクのグラフを自動で構築することが可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:00:16 GMT)
Reading Task Failure Off the Activations: A Sparse-Feature Audit of GPT-2 Small on Indirect Object Identification [0.0] 我々は, GPT-2小火器のスパースオートコーダ(SAE)機能について, 失敗した試験と成功した試験との違いを報告した。
300プロンプトでは、GPT-2小径の精度は79.7%に達し、Bloom (2024)の層8残流SAEリリースの24,576個の特徴のうち146個はホルム補正値の閾値をクリアしている。
17,491, d=+2.93, Neuronpedia label 'cryptographic key' は、プロンプトの転送されたオブジェクトが「キー」である場合を除いて、本質的に静かである。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:55:27 GMT)
Ratchet Universality and optimal suppression of shot noise in biharmonically-driven tunnel junctions [0.0] レターは、ラチェットの普遍性の法則の2つの再帰について論じている。
以上の結果から,ラチェット法則は,ラチェット効果のテクスティトプティマルな適用に不可欠と考えられることが示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:36:57 GMT)
Rare Events, Real Signals: Functional Ensembles as Units of Computation in Deep Spiking Networks [0.0] 深層スパイクニューラルネットワーク(SNN)解析のための神経科学的な枠組みを導入することにより,階層的処理システム全体に内部表現がどのように現れるかを検討する。
我々は、トレーニングされたSNNアーキテクチャの前層からのニューロンとの統計的に有意なペアワイズ相関に基づいて、ニューロンの1次機能連結(1FC)グループを形成する。
生物学的大脳皮質で以前に観察された機能接続の原理がResNetアーキテクチャのスパイクに保存されていることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:44:32 GMT)
Quasinormal mode quantization of bound and propagating photons in complex lightguiding nanostructures for integrated devices [0.0] オープン光またはプラズモニック共振器は、表面または導波路を介して配置され接続される。
構造物の特異な形状を考慮に入れた準正規モードの一般境界条件を導出する。
本稿では、量子エミッタに結合した相互作用する準正規モードキャビティと、伝播光子の非ボゾン浴の一般量子化手法を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:23:55 GMT)
Quantum reservoir networks based on decoherence-free subspaces [0.0] 5次元デコヒーレンス自由部分空間上に実装された出力を持つ6ビット量子貯水池ネットワークの数値シミュレーションを提案する。
提案されたモデルは、室温で作業し、膨大なエネルギー消費を伴わない将来の量子人工知能システムにとって有望な候補である。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:54:14 GMT)
Quantum circuit design via dynamic Pauli constraints [0.0] 本稿では,短期量子ハードウェアの実用的制約を動機とした,新しいソフトウェア指向の量子計算モデルを提案する。
ゲートは、パウリオブザーバブル(英語版)で表される制約によって指定され、各分離層には、デバイスのペアまたは$k$ローカルな量子状態トモグラフィーが付属する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:14:16 GMT)
Quantum Genetic Optimization for Negative Selection Algorithms in Anomaly Detection [0.0] 本稿では、量子遺伝的アルゴリズム(QGA)をEvoSeedRNSAアルゴリズムに統合する新しいアプローチである量子遺伝的負選択アルゴリズム(QGNSA)を提案する。
提案手法は、量子重ね合わせと確率振幅調整を利用して検出器生成効率を向上させる。
実証的な評価は、QGNSAが従来のものよりも優れた異常検出精度を達成していることを示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:19:44 GMT)
Quantum Batteries in two-dimensional material-based Josephson Junctions [0.0] 共振器に誘導結合した二次元材料をベースとしたジョセフソン接合からなるディッケ型量子電池の固体化について検討する。
アンドレフ境界状態は自然に非相互作用的でエネルギー的に非退化二段階系として振る舞う。
提案したアーキテクチャは、ジャンクション間の超伝導相の差を調整することに依存する代替の、等価な充電プロトコルも実現している。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:53:47 GMT)
Psy-Chronicle:A Structured Pipeline for Synthesizing Long-Horizon Campus Psychological Counseling Dialogues [0.0] 本稿では,長距離キャンパスカウンセリング対話を合成するための構造化データ生成フレームワークであるPsy-Chronicleを提案する。
Psy-Chronicleをベースとして,大学心理カウンセリングのための中国語長軸対話データセットCPCDを構築し,オープンソース化した。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:12:53 GMT)
Practical Countermeasure Against Attacks Exploiting Detection Efficiency Mismatch in Quantum Key Distribution [0.0] 本稿では,量子鍵分布(QKD)システムに対する攻撃に対する実用的な対策を示す。
4状態対策は、以前は理論上は安全であると証明されていたが、ここではGHzクロックのプロトタイプQKDシステムで実装されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:53:01 GMT)
Posterior Collapse as Automatic Spectral Pruning [0.0] 後部崩壊を$-VAEsで行うと, 自動スペクトルプルーニングが実現される。
遅延モードは、その再構築への貢献が$$で設定されたカットオフより下にある場合、崩壊する。
ランダウ安定解析による損失の結果、これを導出する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:36:10 GMT)
Philosophical Dispositions as Behavioral Constraints for AI-Assisted Code Review: An Empirical Study [0.0] 哲学的な配置を通してAIレビュアーの行動を制限するシステムを提案する。
それぞれの分布は(それがすることを拒否して)好意的に定義される
5つのプログラミング言語にまたがる7つのレポジトリ間で50のプルリクエストをマージしたシステムの評価を行った。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:57:25 GMT)
Phase-dependent role of dissipation across the Aubry-André-Harper transition [0.0] 我々は,非マルコフ散逸の存在下でのオーブリー・アンドレ・ハーパー局所化遷移の輸送について検討した。
鎖の中心にある1つの粒子に対して、浴槽記憶は2つの相において異なる役割を担っていることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:52:16 GMT)
Pattern-and-root inflectional morphology: the Arabic broken plural [0.0] 本稿では,アラビア語名詞の屈折形態素の記述モデルについて概説する。
我々のモデルは、分裂した複数(BP)、すなわち、茎を改変して形成された複数を含む。
これは、伝統的な根の概念とセム的形態学のパターンに基づいている。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:55:48 GMT)
One-photon communication in atomic media [0.0] 本稿では、量子チャネルの忠実度を用いて、原子媒体を介した単一光子伝送の問題について考察する。
正規化された忠実度は結合強度とともに単調に低下し,そのような媒体による量子通信の性能が確立される。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:50:18 GMT)
OCELOT: Odometry and Contact Estimation for Legged Robots [0.0] Error-State EKF(ESEKF)に基づく完全脚計測パイプラインを提案する。
コントリビューションの核心は、融合接触検出と不確実な定量化モジュールである。
以上の結果から,提案手法の有効性が示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 01:19:30 GMT)
Not Yet: Humans Outperform LLMs in a Colonel Blotto Tournament [0.0] 我々は,人間と大規模言語モデル(LLM)が戦略的にどのように振る舞うかを考察する。
我々はブロット大佐の試合で一連のラウンドロビントーナメントを組織した。
人間は、よりキャリブレーションされた中間レベルアロケーションを多く採用し、LLMが提出したよりシンプルでステレオタイプな戦略よりも優れています。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:34:49 GMT)
Nonclassical Cutoff Fluctuations in Squeezed-Light-Driven High-Harmonic Generation [0.0] 振幅は標準量子限界以下でのHHGカットオフのショット・ツー・ショットのばらつきを抑制することを示す。
アンチスケーズされた二次構造からのサブフェーズノイズ寄与は、r_opt 1.6付近で最小分散を発生させ、具体的な実験目標を提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:49:13 GMT)
Multiple Neural Operators Achieve Near-Optimal Rates for Multi-Task Learning [0.0] 共有マルチタスク環境における演算子の学習コレクションの近似と統計的複雑さについて検討する。
リプシッツ多重作用素写像の広いクラスに対して、近似と統計一般化の近似と準最適上界を導出する。
低バウンド側では、パラメトリックな複雑さの呪いを確立し、対応するミニマックスレートを証明する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:57:33 GMT)
Modular Variables and the Limits of Phase Detectability in Open Quantum Systems [0.0] 我々は、一様重力場の影響下で、ガウス波束重ね合わせに対するエルミートモジュラー作用素の時間発展について検討する。
解析の結果、重力加速度は、分離されたウェーブパケット間の相対位相に敏感な時間変化のあるモジュラー信号、モジュラーオブザーバブルの期待値を誘導することが示された。
共有環境に結合した一対の粒子に対して, 環境に誘起される相関は, 一つの粒子に対して観測される局所的なモジュラー期待値を変化させることができ, 環境影響の明確なサインが得られた。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:43:26 GMT)
Modeling Pathology-Like Behavioral Patterns in Language Models Through Behavioral Fine-Tuning [0.0] 大規模言語モデルは、人間のような振る舞いをモデル化するための計算ツールとして、ますます使われている。
本稿では,構造化意思決定タスクの微調整によるモデルポリシーの修正を行う行動誘導フレームワークを提案する。
次に、この挙動最適化が生成分布の系統的変化をもたらすかどうかを検証する。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:42:38 GMT)
ModeSwitch-LLM: A Lightweight Phase-Aware Controller for Cross-Mode LLM Inference on a Single GPU [0.0] ModeSwitch-LLMは、各リクエストを適切な固定推論モードにルーティングすることで、シングルGPUの大規模言語モデル推論効率を改善する。
MetaLlama.1-8.BInstructのModeSwitch-LLMを評価する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:46:57 GMT)
Mode-Shape Expansion Using Physics-Constrained Gaussian Process Regression [0.0] 本稿では,スパースセンサデータから全フィールド構造モード形状を再構築する課題について述べる。
提案手法はGPに基づく予測における既存の制限を克服し,より正確で信頼性の高い拡張モード形状を提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:33:59 GMT)
Memorization Dynamics of Fill-in-the-Middle Pretraining [0.0] ファイル・イン・ザ・ミドル(Fill-in-the-middle、FIM)は、因果言語モデルに埋め込む能力を持たせるために広く使われている事前学習目的である。
一致したLlama 3.2モデルとFIMと標準左から右への目標(LTR)を事前学習することで、制御された環境下でのFIMのダイナミクスについて検討する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:23:27 GMT)
Magnon-mediated microwave to optical time dynamics [0.0] 本研究では,YIGマイクロスフィアのオポマグニック変調を利用してマイクロ波から光リアルタイム転送の実証と研究を行う。
我々はマイクロ波領域のマグノンを誘導励起し、マグノンベースのブリルアン光散乱を用いて励起マグノン波形の光領域へのシグネチャを伝達する。
我々の研究は、マグノン力学のリアルタイム測定を可能にするため、マグニックモードの寿命測定に直接アクセスすることができる。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:32:52 GMT)
MARGIN: Runtime Confidence Calibration for Multi-Agent Foundation Model Coordination [0.0] MARGIN(Multi Agent Grading via Incremental Normalization)は,タスクストリーム自体からエージェントごとのキャリブレーション要素を学習するオンラインキャリブレーション手法である。
MARGINは最適設計時ベースラインよりも3~6倍低いキャリブレーション誤差を達成する。
6つの公式な命題は、収束、追跡速度、非ストラテジックエージェントの対称更新の最適性を特徴づける。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:25:05 GMT)
Long-range nonstabilizerness of topologically encoded states from mutual information [0.0] 長距離非安定化器性(Long-range nonstabilizerness、LRN)は、浅い局所量子回路で非安定化器性を取り除くための障害である。
一次元設定では、空間領域間の相互情報は、LRNを診断するための強力なツールであることが証明されている。
重複しない領域間の相互情報の分析からLRNに関する情報が得られることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:43:23 GMT)
Joint Unitarity and a Single Definite Outcome in a Quantum Measurement [0.0] 本研究は, 一定の結果が得られた1つの測定結果が, 全システムの共同ユニタリ進化である可能性について考察する。
また,測定後の環境依存性の低い境界を測定前のシステムの状態,同じ測定結果に基づいて導出した。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:34:24 GMT)
Integrable Elasticity via Neural Demand Potentials [0.0] 本稿では,多商品小売需要に対する需要優先型ニューラルモデルを提案する。
このモデルは、ログプライスのスムーズなコンテキスト条件付き関数としてログオンデマンドを学習し、学習された要求面から正確に弾力性を引き出すことができる。
ドミニクのビールデータセットでは、ICDNはログログの有向ベンチマークよりもアウト・オブ・サンプルの一般化を改善し、より安定で経済的に妥当な弾力性の推定値を得る。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:59:47 GMT)
Innovations in Cardless Artificial Intelligence Banking: A Comprehensive Framework for Cyber Secure and Fraud Mitigation using Machine Learning Algorithms [0.0] 本稿では、サイバーセキュリティを強化し、自動生成された仮想カードを導入し、カードレスAIバンキングシステムにおける不正リスクを軽減するために設計された包括的なフレームワークの概要を述べる。
このフレームワークは、AIによるデータ暗号化を利用して、シームレスなトランザクションのためのセキュアな仮想カードを作成する、将来のバンキングアーキテクチャを構想している。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:17:50 GMT)
In Silico Modeling of the RAMPHO Buffer: Dissociating Informational and Energetic Masking via Phonetic Entropy in Deep Neural Networks [0.0] 自己教師型音響モデル(wav2vec 2.0)のフレーム・バイ・フレーム音声エントロピーを用いたRAMPHOバッファのインシリコシミュレーションを提案する。
意味的に無意味なインタラプタと位相非相関なインタラプタを対比することにより,エネルギー劣化の物理的ペナルティから情報的インタラプタの認知的ペナルティを解離することに成功した。
イントラクタのセマンティックペイロードを破壊することで、高いSNRでの情報マスキングから解放されるが、低SNRで時間的グランプングキューを根本的に劣化させる。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:25:28 GMT)
HarnessAPI: A Skill-First Framework for Unified Streaming APIs and MCP Tools [0.0] この重複を取り除くPythonフレームワークであるHarnessAPIを紹介します。
1つのハンドラ.pyとPydanticスキーマから、このフレームワークは自動的にストリーミングHTTPエンドポイントを導出する。
手動でメンテナンスされたデュアルスタック実装と比較して,フレームワーク対応のバリデーションを74%削減する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:03:44 GMT)
Geometric Origin of the Non-Adiabaticity Parameter and Self-Limiting Instability in Driven Nonlinear Systems [0.0] 非断熱パラメータは、フービニ学習計量の下で射影空間における駆動量子状態として直接幾何学的解釈を持つことを示す。
職業依存型非線形レギュレータUは、効率的な幾何学的進化速度を抑え、有界な低占有率ダイナミクスをもたらすことを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:49:53 GMT)
From Correlation to Cause: A Five-Stage Methodology for Feature Analysis in Transformer Language Models [0.0] 変換言語モデルにおける因果的特徴分析のための5段階の手法を提案する。
Indirect Object Identification (IOI) タスクを実行するGPT-2のエンド・ツー・エンドを実証する。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:25:16 GMT)
Factorization rule for multitime correlations in non-Markovian open quantum systems [0.0] 時間非依存ハミルトニアンおよび有限メモリ時間 $_c$ に対して、高次多重時間相関と低次相関の積を関連付ける正確な分解規則が存在することを示す。
この因子化は、リアルタイム相関の数値計算を極めて効率的にし、標準QRTが故障するシステムにおける半解析的解も可能である。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:19:28 GMT)
Extending Deep Event Visual Odometry with Sparse Point-Cloud Export [0.0] イベントカメラは、高速な動きと挑戦的な照明条件下での視覚計測に適している。
ディープ・イベント・ビジュアル・オドメトリー(DEVO)は、単眼のイベントのみのオドメトリーが強い性能を発揮することを示した。
本プロジェクトでは,Defoをスパースポイントクラウドエクスポートパイプラインで拡張する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:51:40 GMT)
Exact Uniform L1 Spacing for Solow-Polasky Diversity on Lines and Ordered Pareto Fronts [0.0] 逆行列 Solow-Polasky 多様性の固定心性について一次元および順序距離集合で検討する。
正規化された非増加距離カーネルの中で、対応する隣接ギャップ付加構造が指数族を強制することを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:46:52 GMT)
Exact Hidden Paths in Noisy High Dimensional Path Spaces [0.0] 本研究では,不完全,ノイズ,投影,集約された可観測物から1つの正確な隠れ軌跡を復元する逆問題について検討する。
我々は, 正確な回復, 任意の目撃者回復, 正準回復, 商的回復, 導出エンコーディングの回復など, いくつかのリカバリ概念を定式化した。
論文参考訳(メタデータ) (Thu, 21 May 2026 13:36:27 GMT)
Evaluation of Chunking Strategies for Effective Text Embedding in Low-Resource Language on Agricultural Documents [0.0] Average Retrieval Score (L2 distance)、Answer Relevance、Khmer Coverage、Khmer Intersection over Unionの4つの指標を用いてパフォーマンスを評価する。
我々は,300文字のチャンクサイズを持つ文字ベースの再帰的チャンク法において,最適な性能を示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:06:13 GMT)
Evaluating Large Language Models as Live Strategic Agents: Provider Performance, Hybrid Decomposition, and Operational Gaps in Timed Risk Play [0.0] 我々は,大規模言語モデルが明確な勝利目標と繰り返し計画と実行サイクルで実際にどのように振る舞うかを研究する。
その結果、ライブエージェントのパフォーマンスは、客観的なランタイムトラッキング、実行コンバージョン、コスト、信頼性に依存していることがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:41:16 GMT)
Estimating Green's functions with a robust quantum Arnoldi method [0.0] この目的を達成するために、ロバスト量子アルノルニ法(ROQAM)を導入する。
深さが大きくなると、ロバストネス行列要素推定に必要な精度を低減できる。
ROQAMは1つのクリロフ部分空間のみを用いて非零温度でGFを推定することができることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:00:41 GMT)
Epicure: Navigating the Emergent Geometry of Food Ingredient Embeddings [0.0] 多言語レシピコーパスにスクラッチから再学習した3種類のスキップグラム成分を組み込んだEpicureを提示する。
我々は、7つの言語にまたがる11のソースから414万のレシピを収集し、LLM拡張パイプラインを介して原材料文字列を1,790の標準エントリに正規化する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:23:38 GMT)
Entropy-Guided Self-Supervised Learning for Medical Image Classification [0.0] 本稿では,自己教師型学習と伝達学習の強みを活かし,医用画像分類の強化を目的とした相乗的深層学習フレームワークを提案する。
提案手法では,2つの異なるConvNeXt-Tinyモデルを用いている。1つは大規模自然画像データセット(ImageNet)で事前トレーニングされたもので,もう1つはターゲットの医療データセットでエントロピー誘導型Masked Autoencoder(MAE)を用いて事前トレーニングされたものだ。
4つの多様な医用画像データセットに対する厳密な実験的検証は、我々のアンサンブルアプローチの優れた性能と堅牢性を示している。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:01:06 GMT)
Entanglement Dynamics across a Monitored Quantum Point Contact [0.0] 観測された量子点接触にまたがる絡み合いのダイナミクスを計算し、そこでは粒子の損失が所定の場所で記録される。
まず、線形成長を行い、最大値までボリュームロッドスケーリングを示し、次にシステムが空になるにつれてゼロに緩やかに減衰する。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:39:23 GMT)
Engineering Hybrid Physics-Informed Neural Networks for Next-Generation Electricity Systems: A State-of-the-Art Review [0.0] 物理インフォームド機械学習(PIML)は、支配方程式を直接学習プロセスに埋め込むことによって制限に対処する。
PIMLは、ブラックボックスのデータ駆動方式から、透明で物理インフォームド戦略へのパラダイムシフトを可能にする。
論文参考訳(メタデータ) (Thu, 21 May 2026 02:25:05 GMT)
Energy-Gated Attention: Spectral Salience as an Inductive Bias for Transformer Attention [0.0] 乱流流体力学では、コヒーレント構造は全エネルギーの不均等な部分を持ち、全ての輸送を支配している。
我々は,トークンが変圧器の注意に類似する役割を担っていることを提案する。
本稿では,EGA(Energy-Gated Attention)がキートークン埋め込みのスペクトルエネルギーによる値集約を実現することを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 00:21:14 GMT)
Electron modulation and ultrafast near-field imaging with vectorial laser fields [0.0] レーザー光と電子ビームの制御された相互作用は、超高速電子顕微鏡と電子ベースの量子光学の基礎となる。
ここでは、出現する焦点場が電子ビームを直接的、整合的、線形的に変調することができることを示す。
また,ベクトル偏光法を用いて金属メソクタル中の3次元ナノフォトニック近接場を励起・探究する。
論文参考訳(メタデータ) (Thu, 21 May 2026 08:23:39 GMT)
Dual wavelength source of entanglement for space quantum communication [0.0] 810nmと1550nmの光子対の偏光と時間-エネルギー-絡み合いのバルク、本質的に相安定な源の実証を報告した。
この非退化波長の組み合わせは、ハイブリッド量子通信ネットワークに適している。
ソースは、周期的に極化したニオブ酸リチウム結晶を極性サニャック干渉計に埋め込んだ自然パラメトリックダウンコンバージョンに基づいている。
論文参考訳(メタデータ) (Thu, 21 May 2026 11:25:42 GMT)
Do Synthetic Brain MRIs Reliably Improve Tumour Classification? A StyleGAN2-ADA Class-Plane Augmentation Study on BRISC 2025 [0.0] ここでの増補とは、既存の画像の幾何学的・測光的変換ではなく、合成補足を意味する。
スタイルGAN2-ADA ジェネレータは制限された BRISC 2025 パーティションでトレーニングされ、InceptionV3 の特徴空間フィルタリングによる出力がホールドアウト腫瘍の分類を改善した。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:02:14 GMT)
Diagnosis Is Not Prescription: Linguistic Co-Adaptation Explains Patching Hazards in LLM Pipelines [0.0] エージェント・ファミリー間のパッチ・ハーネスは、より高いコ・アダプティブ・コ・オクルージョンと、より安全性の低いコ・オクルージョン・コ・オクルージョンと関連があることが示されている。
我々は、診断のみから導かれた、エージェントごとの協調適応尺度を用いてこれを運用し、エージェント・ファミリー間のパッチ・ハーネスと一貫して関連していることを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:44:47 GMT)
Detecting Atypical Clients in Federated Learning via Representation-Level Divergence [0.0] フェデレーション学習は、異種データによる分散クライアント間の協調トレーニングを可能にする。
本稿では,クライアントのグローバルモデルに対する機能偏差を定量化するための,軽量な幾何学的信号を提案する。
この信号は非定型的な機能的変化を誘発するクライアントを効果的に識別し、安定だが不均一なクライアントと、更新が世界体制と大きく異なるクライアントを区別することを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:10:38 GMT)
Decoy State based Time Synchronization [0.0] 時間同期は、量子鍵分布プロトコルにおいて重要な要件であり、生鍵のビットの正しい割り当てによる正確な鍵生成を保証する。
BB8413プロトコルにすでに存在する鍵生成に使用される信号を介してクロック同期12を実行する可能性について検討する。
提案手法は、送信されたフォトンのみに依存するため、QKDプロトコルの変更は不要である。
論文参考訳(メタデータ) (Thu, 21 May 2026 15:35:11 GMT)
Cyber-Physical Anomaly Detection in IoT-Enabled Smart Grids Using Machine Learning and Metaheuristic Feature Optimization [0.0] 本章は、よく知られたMSU/ORNLパワーシステムアタックデータセットを用いて、この問題を調査する。
提案手法は,機械学習と遺伝的アルゴリズムに基づく特徴選択を組み合わせたものである。
ファサーベース機能のコンパクトなサブセットは、スマートグリッドにおける正確かつ解釈可能な異常検出を提供することができる。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:18:57 GMT)
Cross-Species RSA Reveals Conserved Early Visual Alignment but Divergent Higher-Area Rankings Across Human fMRI and Macaque Electrophysiology [0.0] 我々は、トレーニングされていないCNNがヒトのV1におけるバックプロパゲーションと一致することを、マカク電気生理学に対する同じ5つの学習規則をテストすることによって、以前の知見を拡張した。
規則は、バックプロパゲーション(BP)、フィードバックアライメント(FA)、予測符号化(PC)、スパイクタイミング依存塑性(STDP)である。
すべてのモデルが、ヒトのfMRI(rho = 0.01-0.08)よりもマカク早期視覚野(rho = 0.15-0.30 at V1/V2)と高いアライメントを達成する(rho = 0.01-0.08)。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:31:18 GMT)
ConvNeXt-FD: A Fractal-Based Deep Model for Robust Biomedical Image Segmentation [0.0] 本稿では,バイオメディカルイメージセグメンテーションのための新しいディープラーニングアーキテクチャであるConvNeXt-FDを紹介する。
提案手法は,Dice係数と境界対応正規化項を組み合わせたハイブリッド損失関数を統合する。
我々は6つの異なるバイオメディカルデータセット間でConvNeXt-FDを厳格に評価した。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:58:24 GMT)
Claim-Selective Certification for High-Risk Medical Retrieval-Augmented Generation [0.0] 混在した証拠は、ある主張を支持し、別の主張の条件を必要とし、第三の主張に矛盾する可能性がある。
我々は、クレーム選択応答を検証可能なクレームに検証し、回収された証拠に対して評価し、インテントを意識したセレクタによって完全な、部分的、紛争、棄却にマッピングする。
結果として生じるインターフェースは、アクションラベル予測と、混在する証拠の下でのエビデンスリンクされたクレーム選択を分離する。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:29:50 GMT)
ChronoVAE-HOPE: Beyond Attention -- A Next-Generation VAE Foundation Model for Specialized Time Series Classification [0.0] ChronoVAE-HOPEは、時系列分類のための構造化潜在表現で大規模な一般化を再構成する。
重要なアーキテクチャ上のノベルティは、表現を独立した傾向と季節的な構成要素に分解する非絡み合いの潜在空間である。
実証的な結果は、多種多様な時間領域にまたがる強いパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:26:09 GMT)
Check Your LLM's Secret Dictionary! Five Lines of Code Reveal What Your LLM Learned (Including What It Shouldn't Have) [0.0] 変圧器を用いた大言語モデルのlm_head重み行列の特異値分解により,モデルの重みから直接解釈可能な意味部分空間が明らかになることを示す。
GPT-OSS-120B, Gemma-2-2B, Qwen2.5-1.5Bを解析したところ, 特異値スペクトルと語彙クラスタ構造はモデルによって系統的に異なることがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 05:02:51 GMT)
Can AI Make Conflicts Worse? An Alignment Failure in LLM Deployment Across Conflict Contexts [0.0] AIモデルが対立を悪化させるかどうかを確認するための確立されたプラクティスは存在しない。
4つのプロバイダから9つのモデル構成をテストしました。
失敗率は、最高のモデルと最悪のモデルの間で6%から47%である。
このドメインの最初の評価フレームワークをリリースし、アライメント評価ポートフォリオに追加することを提案します。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:55:39 GMT)
Building a privacy-preserving Federated Recommender system for mobile devices [0.0] モバイル機器のための2段階のフェデレーションレコメンデーションシステムパイプラインを提案する。
第1ステージでは、クラウド内の非機密アプリケーションコンテキストデータ上で協調的なフィルタリングモデルを実行し、関連する項目のショートリストを生成する。
第2段階では、これらの候補をデバイス上でセンシティブなモバイル信号を使って再ランク付けし、デバイスを離れるのはモデル更新/段階のみである。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:02:26 GMT)
Bottom-up open EFT for non-Abelian gauge theory with dynamical color environment [0.0] 我々はシュウィンガー-ケルディシュ形式論の中で非アベリアゲージ理論のためのボトムアップ開実効場理論(EFT)を開発する。
我々は、環境応答の遅い変数を明示的に保持し、局所的な環境を構築する。
我々のフレームワークは、非アベリアプラズマにおける色輸送、メモリ効果、およびゆらぎ散逸構造の局所的オープンEFT記述を提供する。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:59:56 GMT)
Botnet Detection on CTU-13 Using Lightweight Machine Learning Models [0.0] ボットネットは最も永続的なサイバー脅威の1つであり、スパム、クレデンシャル盗難、分散型サービス拒否(DDoS)のような大規模な攻撃を可能にする。
ディープラーニングのアプローチは、最近ボットネット検出に応用されているが、それらは計算集約的であり、しばしば解釈容易性に欠ける。
我々は、CTU-13データセット上で、ロジスティック回帰、決定木、ランダムフォレストを含む軽量機械学習モデルの比較研究を行う。
論文参考訳(メタデータ) (Thu, 21 May 2026 20:16:14 GMT)
Blind Spots in the Guard: How Domain-Camouflaged Injection Attacks Evade Detection in Multi-Agent LLM Systems [0.0] LLMエージェントを保護するために配置された注入検出器は、自分自身をオーバーライドディレクティブとして発表する静的なテンプレートベースのペイロードで校正される。
対象文書のドメイン語彙や権限構造を模倣するペイロードが生成されると、標準検出器はそれをフラグ付けできない。
我々はこれをキャモフラージュ検出ギャップ (CDG) として定式化し, 静的ペイロードとカモフラージュペイロードの注入検出率の差について検討した。
論文参考訳(メタデータ) (Thu, 21 May 2026 04:58:11 GMT)
Beyond Zero: Enterprise Security for the AI Era [0.0] 本稿では,AI時代の新しいセキュリティパラダイムであるBeyond Zeroを紹介する。
Beyond Zeroは、人間とエージェントのリソース単位およびメソッドアクセス決定をマシンスピードで実行する。
この記事では、このアクセスモデルの将来に対するGoogleのビジョンと、業界協力と標準開発への呼びかけについて概説する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:31:50 GMT)
Beyond Acoustic Emotion Recognition: Multimodal Pathos Analysis in Political Speech Using LLM-Based and Acoustic Emotion Models [0.0] 政治音声分析において,音響的感情認識モデルがパス次元のプロキシとして機能するかどうかを検討する。
本稿ではFelix Banaszak による Bundestag plenary speech をケーススタディとして用いた。
以上の結果から,LLMに基づくマルチモーダル分析は,音響モデル単独よりも意味論的に定義された政治的感情を効果的に捉えることが示唆された。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:03:37 GMT)
BYOT-CPS: A Hybrid Cyber-Physical Systems Testbed for IoT Security Assessment and Platform Evaluation [0.0] 本稿では,自作サイバー物理システムテストベッド(BYOT-CPS)について述べる。
BYOT-CPSは、実IoTデバイスとGNS3上に構築された仮想化ネットワークインフラストラクチャを接続するハイブリッドサイバー物理テストベッドである。
スマート電球、スマートプラグ、スイッチ、IPカメラを統合したプロトタイプが、ハイブリッド接続、透過性のテスト、Miraiスタイルのサービス拒否攻撃、トラフィック監視、制御デバイス操作のデモに使用されている。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:49:14 GMT)
Asymmetric Virtual Memory Paging for Hybrid Mamba-Transformer Inference [0.0] Jambaのようなハイブリッド言語モデルは、注意層とステートスペースモデル(SSM)を混合します。
統一プールパッドSSMは、ページサイズが7.3倍になる。
非対称仮想メモリページング(AVMP)は、2つのキャッシュタイプを仮想アドレス空間の後方にある物理的に異なるプールに分離する。
論文参考訳(メタデータ) (Thu, 21 May 2026 12:37:34 GMT)
Anytime PAC-Bayes for Constrained Density-Ratio Networks under Covariate Shift [0.0] PAC-Bayesはベルヌーイ-KL境界を生じる固定時間状態の重み付けリスクに基づいてインスタンス化される。
実データデプロイメントによる解析的基盤真理に対するパッチテストは、フレームワークを検証します。
単一の固定時間カバレッジ障害が記録され、スプリット単位のカバレッジがラベルシフトの大きさと一致している。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:25:09 GMT)
Analytical and Experimental Force Analysis of a Soft Linear Pneumatic Actuator [0.0] ソフトスリーブアクチュエータ(SSAs)は、ウェアラブルおよびアシストロボットシステムのための空気圧アクチュエーターアプローチとして開発されている。
本稿では,リニアソフトスリーブアクチュエータ(LSSA)の解析および実験的力解析について述べる。
その結果, LSSA力の発生は圧力, 幾何, 変位, 荷重, 軸方向硬さの複合効果によって制御されることがわかった。
論文参考訳(メタデータ) (Thu, 21 May 2026 00:00:03 GMT)
Analytic Properties of the Jost Functions via the Poincaré-Picard Theorem [0.0] ジョスト函数の解析的性質は量子散乱理論の基本である。
変換されたジョスト函数は有限半径距離に対するエネルギー変数の単値解析関数である。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:52:27 GMT)
An Evidence Hierarchy for Bayesian Object Classification via OSINT-Aided Heterogeneous Sensor Fusion [0.0] センサ側における高いクラッタレートは、核融合システムにとって大きな課題となる。
高品質なデータセットの限られた可用性は、学習に基づく検出と分類モデルの進歩を妨げる。
直接的、指示的、文脈的な情報のモデリングを可能にする新しいエビデンス階層が確立されている。
第3に、OSINT入力の収集、処理、利用により、環境に関するコンテキスト情報を融合プロセスに導入する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:03:08 GMT)
An Architecture for Decentralised Deployment and Operation of Blockchain Applications [0.0] 本稿では,分散自律組織(DAO)の概念を紹介する。
これらの組織は、事前に定義されたクォーラムに到達すると、提案を自律的に実行することを可能にする。
既知のレジストリパターンを拡張して,決定論的デプロイメントをサポートします。
私たちのアーキテクチャは、将来の統合のリファレンスとして機能し、オープンソースのフレームワークは、実際にそのようなプロセスを採用する際の複雑さを減らすことを目的としています。
論文参考訳(メタデータ) (Thu, 21 May 2026 09:41:55 GMT)
Aerodynamic force reconstruction using physics-informed Gaussian processes [0.0] 本研究では,構造的動的応答の雑音測定から基礎となる空力負荷を再構築する機械学習手法を提案する。
このモデルはオーバーフィッティングを回避し、正規化スキームの必要性を排除し、不均一データと多忠実データの使用を可能にする。
結果は、特にルート平均二乗誤差、等級、位相角、信号のピーク値に関連する、真の負荷と予測負荷の強い一致を示す。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:45:19 GMT)
Adaptive Measurement Allocation for Learning Kernelized SVMs Under Noisy Observations [0.0] カーネル法は通常、グラム行列への正確なノイズフリーアクセスを仮定して定式化される。
量子機械学習のような新しい設定では、各カーネルエントリはノイズの多い観測から推論されなければならない。
本稿では,カーネル化されたサポートベクトルマシンを学習するための適応的な計測-配置戦略を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 10:19:23 GMT)
AMEL: Accumulated Message Effects on LLM Judgments [0.0] 先行会話履歴の極性がその後の判断に偏っているかどうかを問う。
主に肯定的あるいは否定的な評価で飽和した同一の検査項目を分離または後史で提示する。
この効果は、モデルが実際にベースラインで不確実であるアイテムに集中する。
論文参考訳(メタデータ) (Thu, 21 May 2026 16:51:04 GMT)
AI-Friendly LaTeX: Using LaTeX Code as a Knowledge Source for Retrieval-Augmented Generation [0.0] 大規模な言語モデルは、教科書や講義ノート、プログラミング演習に関する質問に答えることができる。
数学的および技術的材料にとって、原典はPDFの抽出においてしばしば失われたり歪んだりする構造情報、ラベル、分割コマンド、マクロ、権威的意図を含むため、PDFよりも出発点として優れている。
本稿では、ソースをコンパイルした補助ファイルとオプションの著者アノテーションとともに、ベクトルデータベースのインデックス作成に適したチャンクに変換するための、フォーカスされた事前処理アプローチについて述べる。
論文参考訳(メタデータ) (Thu, 21 May 2026 18:01:51 GMT)
AI-Enabled Serious Games: Integrating Intelligence and Adaptivity in Training Systems [0.0] シリアスゲームは、医療、防衛、教育といった分野の学習や訓練に広く使われている。
人工知能(AI)の最近の進歩は、これらの制限に対処する新しい能力を導入している。
この章では、現代AIアプローチが真剣なゲームにおけるリアルタイムの教育適応をどのようにサポートするかを検討する。
論文参考訳(メタデータ) (Thu, 21 May 2026 03:48:31 GMT)
A sharp interaction-degree threshold for simulating QAOA [0.0] 深さ-$p$ QAOA on $nO(1)$ every $p = O。
ハード次数-3$インスタンスは自明に最適化可能なコスト関数を持つので、サンプリング硬さはそれ自体が量子最適化の利点を意味するものではない。
論文参考訳(メタデータ) (Thu, 21 May 2026 17:24:00 GMT)
A measurement substrate for agentic Kubernetes operations: Methodology and a case study in retrieval-compounding falsification [0.0] 自律的な操作エージェントに関する実証的な主張は、ほとんど不可能である。
コードエージェントは「機能する」検証基板を持ち、高速でファルサブルで地味な信号に変換する。
ターゲットクラスタに障害を注入するクローズドループ計測フレームワークである Agent-breakage を提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 21:47:52 GMT)
A Subjective Logic-based method for runtime confidence updates in safety arguments [0.0] 本稿では,静的安全性を向上し,実行時の信頼度を継続的に更新する動的量保証手法を提案する。
設計時エビデンスとウィンドウ化されたランタイム安全性能指標(SPI)を統合することにより、開発ライフサイクル全体の信頼度を定量化し、伝播する手法である。
実行時にSPIエビデンスを継続的に評価し、対象のクレームは、違反の欠如に対する信頼性を高め、違反が発生した場合に即時罰則を課すルールを使用して更新される。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:20:36 GMT)
A Reproducible Universal Dependencies-Style Pipeline for Katharevousa Greek Parliamentary Text [0.0] 我々は、ギリシャのジュンタ時代初期のカサレヴサ議会の質問に対して、普遍的な依存関係スタイルの構文解析資源を構築し、評価する。
パイプラインは、OCR対応の再構築、スキーマ制約付きLCMアシストアノテーション、自動検証、決定論的CoNLL-Uスナップショット、固定分割評価、モデル系列比較をリンクする。
最強の外部ベースラインであるスパチェ・ギリシャは、0.4183 LASに達する。
本論文は,歴史的に困難なOCRを再利用可能な統語基盤に変えるための監査可能な方法論を提示する。
論文参考訳(メタデータ) (Thu, 21 May 2026 19:16:20 GMT)
A Formal Basis for Quantum Cryptographic Exposure Measurement under HNDL Threat [0.0] 答えの関数形式は単なるキャリブレーションの選択ではないことを示す。
これは、逆生成と値デカイダイナミクスに関する3つの仮定によって構造的に正当化される。
論文参考訳(メタデータ) (Thu, 21 May 2026 14:48:26 GMT)
A Fine-Tuned BERT Classifier for Personal-Letter Titles in Late-Ming and Early-Qing Collected Works [0.0] Lepton fine-tunes bert-base-chinese on 5438 hand-labeled wenji title from 33-day-Ming and early-Qing literati
私はこのモデルをHugging Faceにデプロイし、中国伝記データベース(CBDB)で明中期から清初期にかけて約55万通の文字を識別するのに使用してきました。
論文参考訳(メタデータ) (Thu, 21 May 2026 23:40:51 GMT)
A Comparative Study of Language Models for Khmer Retrieval-Augmented Question Answering [0.0] Retrieval-Augmented Generation (RAG) は, 大規模言語モデル(LLM) のアウトプットを確定する上で有望なパラダイムとして出現している。
本稿では,Khmer 言語通信ドメイン文書に対する RAG に基づく質問応答システムを提案する。
論文参考訳(メタデータ) (Thu, 21 May 2026 07:36:01 GMT)