Fugu-MT: arxivの論文翻訳(概要)

Edit-GRPO: A Locality-Preserving Policy Optimization Framework for Image Editing [95.3]
画像編集を最適化しながら局所性を保存する編集-GRPOを提案する。編集領域と非編集領域に領域固有の最適化信号を割り当てることで、Edit-GRPOはポリシー更新を編集タスクの空間構造と整合させる。この設計は、コンテキスト歪みや境界の不整合といった共通成果物を効果的に抑制する。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:05:39 GMT)
Beyond Point-Wise Matching: Structural Representation Alignment for Accelerating Diffusion Transformers [93.4]
本稿では,特徴写像のリレーショナル幾何における整合性を実現する構造的RePresentation AlignmentフレームワークであるsREPAを提案する。モデルが事前訓練された特徴から全体的空間配置と構造的相関を内包するように促すことにより、sREPAはより高速でより安定した収束を達成する。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:01:04 GMT)
Auditing Agent Harness Safety [81.2]
LLMエージェントは、ツールをディスパッチし、リソースを割り当て、特別なコンポーネント間でメッセージをルーティングする実行ハーネスの中でますます動作します。ほとんどの安全ベンチマークは最終出力または終端状態のみをスコアするが、多くの違反は終端ではなく、軌道の途中で発生する。 HarnessAuditは、境界コンプライアンス、実行の忠実さ、システムの安定性など、完全な実行軌跡を監査するフレームワークである。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:50:55 GMT)
Roll Out and Roll Back: Diffusion LLMs are Their Own Efficiency Teachers [76.2]
Wide-In, Narrow-Out (WINO) は、リボッキング可能な並列生成を可能にするトレーニング不要の復号アルゴリズムである。 WINO+は、WINOが生成した検証された認知軌道をモデルパラメータに注入し、トレーニングを効率的な推論と整合させる。 LLaDAとMMaDAの実験では、WINOは品質と効率の両方を改善し、WINO+はこの進歩をさらに強化している。
論文参考訳（メタデータ） (Sat, 16 May 2026 11:27:40 GMT)
Compositional Adversarial Training for Robust Visual Watermarking [74.6]
構成変換の構造化空間上のmin-max問題として透かしの堅牢性を定式化する。本稿では, 逐次微分可能な逆数学習を行うプラグインフレームワークであるComposeal Adversarial Training (CAT)を提案する。 CATは、同じ拡張予算でトレーニングされたランダム拡張ベースラインを一貫して上回る。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:07:49 GMT)
How to Instruct Your Robot: Dense Language Annotations Power Robot Policy Learning [69.7]
デモセグメントをVLM生成アノテーションでラベル付けする2段階のアプローチであるDeMiAnを紹介する。学習したインストラクターがタスク記述と初期シーンスナップショットをデプロイ時にタスクに適したアノテーションにマップする。 RoboCasaでは、インストラクターはタスクのみのベースラインで5ポイント成功し、タスクごとのオラクルの3ポイント以内に到達する。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:52:08 GMT)
DecoRec: Decomposed 3D Scene Reconstruction from Single-View Images via Object-Level Diffusion [65.7]
textitDecoRecは、単一のビュー2D画像を分解された3Dシーンメッシュに高めるように設計されたシステムである。以上の結果から,DecoRecはジオメトリと新規合成の両面において,高品質なワンビューシーン再構築を促進することが示唆された。
論文参考訳（メタデータ） (Sat, 16 May 2026 04:23:48 GMT)
Echoes in Filter Bubble: Diagnosing and Curing Popularity Bias in Generative Recommenders [65.5]
本研究では,ジェネレーティブ・フレームワークの最適化とセマンティック・インデックスに基づくアイテム・トークン化に焦点を当てた。理論的解析から,トークンレベルの最適化欠陥とアイテムトークン化の未分化特性の相違から,厳密な人気バイアスが生じることを確認した。本研究では、非対称な異種最適化と骨格を基盤としたトークン化を設計し、Ghostと呼ばれる新しい生成レコメンデーションシステムを開発した。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:02:40 GMT)
StreamingEffect: Real-Time Human-Centric Video Effect Generation [63.4]
textbfStreamingEffectは、リアルタイムな人間中心のストリーミングビデオエフェクトフレームワークである。提案手法は,H200 GPUでリアルタイムで高品質な720pビデオ編集を可能にする。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:45:32 GMT)
OmniVL-Guard Pro: A Tool-Augmented Agent for Omnibus Vision-Language Forensics [63.1]
ツール拡張エージェントである textbf OmniVL-Guard Pro を提案する。高品質なツール推論トラジェクトリを生成するために,textbfTree-Structured Self-Evolving Tool Trajectory Generationを導入する。また,回答が正しいが推論が歪んだ場合に対して,プロセスレベルの監督を行うためのtextbfChecker-Guided Agentic Reinforcement Learningを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:26:04 GMT)
TIER: Trajectory-Invariant Execution Rewards for Multi-Step Tool Composition [62.6]
アウトカムベースの報酬はスパースフィードバックのみを提供するが、トラジェクトリによる報酬は注釈付き参照ソリューションに依存している。本稿では,関数スキーマと実行時実行を直接管理する報奨フレームワークであるtrajectory-Invariant Execution Rewardsを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:47:26 GMT)
From Static Risk to Dynamic Trajectories: Toward World-Model-Inspired Clinical Prediction [61.1]
本稿では, 患者固有の縦断疾患の進展を推定し, 代替治療下での軌跡変化を評価するための, 臨床AIにおける介入認識型疾患軌跡モデリングに焦点をあてる。 3つの意思決定タスク(実測,反実推定,政策評価)と3つのデータ生成機構(障害発生, 治療課題, 観察過程)によって, 識別可能性を決定する。本稿では,個別/連続時間にまたがる予測,反ファクト的軌跡,政策評価の統一的な枠組みを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:45:26 GMT)
Provably Learning Diffusion Models under the Manifold Hypothesis: Collapse and Refine [60.7]
拡散モデルは、顕著な品質で高次元データを生成する。彼らのトレーニングがいかに効率的にスコア関数を学習するかは理論的には説明がつかないままである。我々はこの原理をScore-induced Latent Diffusion (SiLD)として定式化する。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:51:10 GMT)
Motion Cues from Image-based Point Tracking for LiDAR Scene Flow Estimation [59.4]
我々は、LiDARシーンフロー推定における動的オブジェクト表現を改善するための追跡誘導フレームワークであるTrackCueを紹介する。特に、TrackCueは、ポイントトラッキングを再利用して、LiDARポイントに固定された高密度の画像空間軌跡を得る。 TrackCueは動的ラベルの精度とF1スコアを大幅に向上し、自己監督型シーンフロー推定の性能向上につながることを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:28:54 GMT)
Distinguishable Deletion: Unifying Knowledge Erasure and Refusal for Large Language Model Unlearning [58.7]
Distinguishable Deletion (mathrmD2$)は、特定のトークンではなく、潜在表現の応答分布を制限するパラダイムである。本稿では,知識の存在と未学習コンテンツと保持コンテンツとの分離を定量化するエネルギー指標を提案する。実験の結果、EUAは以前の方法よりも大幅に優れており、$mathrmD2$の優位性を示している。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:15:35 GMT)
ArtifactLinker: Linking Scientific Artifacts for Automatic State-of-the-Art Discovery [58.5]
ArtifactLinkerは、データセットの最先端(SOTA)モデルを自動的に検出するフレームワークである。 14,053のアーティファクトと51,337の関係を持つArtifactBenchというベンチマークが提示されている。その結果,(1)既存のアーティファクト間のグラフ構造がリンク予測の欠如に有効であること,(2)ArtifactLinkerを用いたエンドツーエンドのランキングと検証がSOTAの潜在的な結果の発見と研究の洞察に役立つこと,などが示唆された。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:26:08 GMT)
Navigating the Emotion Tree: Hierarchical Hyperbolic RAG for Multimodal Emotion Recognition [56.7]
マルチモーダル感情認識は、人間の感情状態を理解するためにテキスト、音声、ビデオソースを統合することを目的としている。大規模言語モデルは多モーダル推論において優れているが、感情カテゴリーを独立したラベルとして扱うのが一般的である。本稿では,bftextHyperEmo-RAGを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:04:48 GMT)
WOW-Seg: A Word-free Open World Segmentation Model [54.8]
我々はWOW-Segを提案する。WOW-Segは、オープンセットのカテゴリからオブジェクトをセグメンテーションし、認識するための、ワードフリーのオープンワールドモデルである。具体的には、WOW-Segは画像マスクを視覚トークンに変換する新しいビジュアルプロンプトモジュールMask2Tokenを導入した。また、オープンワールド領域認識テストベンチマーク、リージョン認識データセットを構築した。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:28:46 GMT)
DEVIS-GRPO: Unleashing GRPO on Dynamic Extreme View Synthesis [54.2]
トラジェクティブ制御ビデオ生成は、制御可能なビデオ生成に欠かせないものとなっている。極端視合成のための既存のソリューションは、通常、専用のビデオペアを必要とし、かなりのアノテーションの努力を必要とする。我々は、軌跡制御ビデオ生成のためのGRPOベースのフレームワークであるDynamic Extreme VIew Synthesis-GRPOを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 11:14:18 GMT)
UniER: A Unified Benchmark for Item-level and Path-level Exercise Recommendation [53.6]
We present a Unified Benchmark for Exercise Recommendation (UniER) UniERは、ILERとPLERを統合する包括的な評価フレームワークである。本研究は, pleRの系統的優位性を明らかにするとともに, ILERのフラグメントドレコメンデーションの教育的失敗を明らかにするものである。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:07:58 GMT)
Evidential Information Fusion on Possibilistic Structure [53.3]
パワーセット上で定義された信念関数と確率的構造の間の可逆変換を提案する。次に、三角形ノルムファミリーを導入し、汎用的で適応的な情報融合フレームワークを開発する。 Dempsterのセマンティクスに根ざした融合メソッドとは異なり、提案するフレームワークはより柔軟な組み合わせ動作をサポートしている。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:18:59 GMT)
Sketch Then Paint: Hierarchical Reinforcement Learning for Diffusion Multi-Modal Large Language Models [52.4]
強化学習(RL)を通して拡散多モード大言語モデル(dMLLM)を最適化する方法を示す。弊社のアプローチでは、Sketch-Then-Paintトレーニングスキームにより、アップデートをグローバル、構造、洗練の3つのステージに編成する。 MMaDAとLumina-DiMOOの2つの人気のあるdMLLMバックボーンを用いた実験は、GenEvalとDPGのベンチマークで大幅に向上した。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:59:54 GMT)
Prefix-Adaptive Block Diffusion for Efficient Document Recognition [52.2]
ブロック拡散モデル(BDM)は並列生成、フレキシブルな出力、KVキャッシュをサポートし、効率的な文書解析を約束する。本稿では,前置詞から接尾辞への因果表記に代えて,ブロック内双方向化を代替するPrefix-Block Diffusion Model (PA-BDM)を提案する。実験の結果、3B PA-BDMはいくつかのベンチマークで高い認識スコアを達成し、2.5B MinerU-Diffusionに対して推論スループットを71.6%向上した。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:50:13 GMT)
The Range Shrinks, the Threat Remains: Re-evaluating LLM Package Hallucinations on the 2026 Frontier-Model Cohort [51.6]
Spracklenらは、コード生成された大きな言語モデルは、PyPIやnpmに存在しないパッケージ名を幻覚させることを示した。 199,845対のPythonとJavaScriptプロンプトの幻覚率を測定し、PyPIとnpmマスターリストに対して検証した。 127個のパッケージ名(PyPIは109個,npmは18個)を5つの評価モデルで同一に作成する。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:08:52 GMT)
Collaborative Learning for Semi-Supervised LiDAR Semantic Segmentation [51.2]
LiDAR半教師付きセグメンテーション(CoLLiS)のための協調学習 CoLLiSは、同じ学生として扱うことで、複数の表現をひとつのステップで協調的に訓練する。 3つのデータセットの実験では、CoLLiSが最先端のLiDAR SemiSLメソッドを一貫して上回っていることが示されている。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:58:41 GMT)
Securing LLM Agents Need Intent-to-Execution Integrity [49.5]
我々は, LLMエージェントの確保には, エージェントの実行がユーザの意図を忠実に反映した場合に規定するエンドツーエンドの正当性を定義する必要があると主張している。 LLMエージェントはコンパイラと構造的に類似しており、セキュリティ違反はユーザ意図を保存しない誤った実行に対応する。 emphTool整合性、emph命令整合性、emphJudgment整合性、emphData整合性。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:53:31 GMT)
Learning to Learn from Multimodal Experience [47.9]
本稿では,メモリ設計を事前定義されたコンポーネントから適応的で学習可能なプロセスにシフトさせる,マルチモーダル体験から学習する新しいパラダイムを提案する。我々のフレームワークは,タスク要求やインタラクション履歴に基づいて,エージェントが動的にメモリを構築し,整理し,利用することを可能にする。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:41:31 GMT)
$h$-control: Training-Free Camera Control via Block-Conditional Gibbs Refinement [47.8]
textbf$h$-controlは、トレーニングフリーでトレーニングベースの7つの競合相手に対して最高のFVDを達成する。 RealEstate10KとDAVISでは、textbf$h$-controlは7つのトレーニングフリーおよびトレーニングベース競合相手に対して最高のFVDを達成している。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:55:04 GMT)
DreamEdit3D: Personalization of Multi-View Diffusion Models for 3D Editing [47.4]
自然言語による合成・オブジェクトレベルの制御が可能なテキスト誘導型3D編集のための新しいパーソナライズ手法を提案する。本手法は,2次元のパーソナライゼーションの柔軟性を3次元に伝達し,忠実な編集とアイデンティティ保存を実現する。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:21:22 GMT)
NORM-Nav: Zero-Shot Mobile Robot Navigation with Natural Language Behavioral Constraints [46.6]
本稿では,NORM-Navについて述べる。NORM-Navは,自然言語の振る舞い制約をコストマップに基づく計画に組み込むフレームワークである。 LLMは、各命令を構造化された制約に解析し、リアルタイムビジョン-LiDAR知覚を使ってそれらをグラウンド化する。シミュレーションと実世界の実験により、NORM-Navはタスクの成功率を改善し、代表ベースラインよりも人間の参照に近い軌道を生成することが示されている。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:58:03 GMT)
QuadLink: Autoregressive Quad-Dominant Mesh Generation via Point-Relation Learning [46.2]
プロダクション対応のクアッドアドバントメッシュの生成は、現代的な3Dコンテンツ作成の基盤となっている。既存の方法は通常、純粋な三角形のメッシュか、等方性密度の純粋な四角形のメッシュを生産することに制限される。ここでは,3段階からなる統合フレームワークであるQuadLinkについて述べる。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:04:10 GMT)
Harnessing AI for Inverse Partial Differential Equation Problems: Past, Present, and Prospects [45.9]
逆偏微分方程式(PDE)問題は、医用画像、地球物理学、材料科学、空気力学にまたがる問題である。逆PDE問題は、機械システム、空力問題、熱システム、フルウェーブフォームインバージョン、システム識別、医療画像にまたがる。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:41:36 GMT)
Empowering VLMs for Few-Shot Multimodal Time Series Classification via Tailored Agentic Reasoning [44.7]
VL$underlinetextbfM$$underlinetextbfa$gentic $underlinetextbfr$easoning framework for few-$underlinetextbfs$hot multimodal $underlinetextbfT$ime $underlinetextbfS$eries $underlinetextbfC$lassification$textbfMarsTSC$(source)を提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:36:34 GMT)
Plan First, Diffuse Later: Extrinsic Graph Guidance for Long-Horizon Diffusion Planning [44.5]
構成拡散モデルは、長期計画への有望なルートを提供する。しかし、長鎖上の局所的な振る舞いを強制することは、コヒーレントなグローバル構造が現れるには不十分であることが多い。最近の研究は本質的な探索を通じてこの限界に対処し、復調過程において複数の経路を探索している。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:53:04 GMT)
VLAMotor: Test-Guided Enhancement of Vision-Language-Action Models via Agent-BasedData Synthesis [44.5]
VLA(Vision-Language-Action)モデルは、トレーニングデータのカバレッジによって制約されるため、デプロイ後のエッジケース構成で障害が発生しやすい。フェール露光のための距離認識モデルテストとモデル微調整のためのエージェントベースデータ合成を統合した,VLA拡張のための最初の分析フレームワークであるVLAMotorを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:52:32 GMT)
Axial-Relation Guided Fusion State Space Model for Optical-Elevation Sensing Image Segmentation [44.5]
Axial-Relation Guided Fusion Mambaは、リモートセンシング画像セグメンテーションのための状態空間モデルに基づくフレームワークである。 Axial-Relation Guided Fusion Moduleは、水平軸と垂直軸に沿ったグローバルな相互関係を明示的にモデル化するように設計されている。我々のARG-Mambaは、良好な計算効率を維持しながら、常に最先端の手法より優れています。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:42:54 GMT)
To Call or Not to Call: Diagnosing Intrinsic Over-Calling Bias in LLM Agents [43.8]
LLMエージェントは、必要のない状況でも、オーバーコール、呼び出しツールに一貫した傾向を示す。我々はこれを本態性バイアス仮説(IBH)に辿る。我々の研究は、経験的現象から因果的補正が可能な機械的対象への過度な呼び出しをリキャストする。
論文参考訳（メタデータ） (Sat, 16 May 2026 04:18:30 GMT)
BoLT: A Benchmark to Democratize Black-box Optimization Research for Expensive LLM Tasks [42.8]
ブラックボックス最適化法は、原則的でサンプル効率のよい方法に対して、期待できない方向性を提供する。新しい手法は、しばしば合成テスト関数と小規模データセットでのみ評価される。 BBOコミュニティ向けの研究を民主化する最初のLCM中心のベンチマークであるBoLTを紹介する。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:53:44 GMT)
Permutation-symmetric quantum trajectories [42.1]
我々は、共通のシステムに結合した$N$エミッタのモデルに対して、弱い置換対称性を尊重する解法をいかに実行できるかを示す。 2レベルエミッターに関わる問題に対して、そのような暴言は計算コストを$mathcalO(N5)$から$mathcalO(N2)$に下げる。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:01:18 GMT)
Dynamically Enabled Robustness of Geometric Phases and Entanglement in the Nonlinear Jaynes-Cummings Model [42.0]
散逸性光マター系のロバスト性は近年、共鳴条件や測地進化と関連付けられている。非線形Jaynes-Cummingsモデルでは、これらの条件は必要だが十分ではないことを示す。ヒルベルト空間におけるコヒーレント軌道と散逸軌道のアライメントによって幾何位相と絡み合いの安定性が支配される動的有効機構を同定する。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:31:45 GMT)
D$^2$Evo: Dual Difficulty-Aware Self-Evolution for Data-Efficient Reinforcement Learning [41.9]
本稿では,D$2$Evo,Dual Difficulty-aware self-Evolution RLフレームワークを提案する。各イテレーションにおいて,本手法は中級難易度アンカーをマイニングし,質問者に対して適切な難易度で多様な質問を生成するよう訓練する。大規模な実験により、D$2$Evoは2K以下の実数学サンプルを持つ数学的推論ベンチマークにおいて、既存の手法よりも優れていることが示された。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:16:00 GMT)
Synthetic Aperture Radar Image Change Detection Based on Global Dynamic Context-Aware Network [41.3]
畳み込みニューラルネットワーク(CNN)は、合成開口レーダ(SAR)画像変化検出のタスクに広く応用され、成功している。本稿では,SAR画像変化検出に適したGDNet(Global Dynamic Context-Aware Network)を提案する。このモジュールは,入力特徴から抽出した大域的意味情報に基づいて,畳み込みカーネル重み付けを適応的に変調する。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:33:10 GMT)
Constrained Code Generation with Discrete Diffusion [40.5]
Constrained Diffusion for Code (CDC)は、コード生成のためのトレーニング不要なニューロシンボリック推論フレームワークである。 CDCは制約満足度を直接リバース・デノナイジング・プロセスに統合する。 CDCは機能的正確性、セキュリティ、構文の制約満足度を継続的に改善する。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:15:47 GMT)
Privacy Policy Enforcement Guardrails for Data-Sensitive Retrieval-Augmented Generation [40.4]
PIIフィルタは、個人を集合的に識別する非規制属性クラスタなど、RAGシステムにおけるコンテキストデータの漏洩を見逃すことが多い。本稿では,融合したテキスト埋め込みを持つ2つの一級密度推定器と,アウト・オブ・ディストリビューション・インプットのための断続領域を用いたプライバシポリシ強化フレームワークを提案する。提案するT3+OCSVM検出器は,安全性とバウンダリラインセーフなデータに基づいてトレーニングされ,バウンダリラインAUROCの0.93+を実現し,偽陽性を44～55ポイント削減し,ミリ秒遅れを抑える。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:08:31 GMT)
A Multi-Dimensional Clustering Approach for Identifying Inborn Errors of Immunity [40.4]
新生児免疫不全(IEI)のような希少な疾患は、臓器の損傷を予防し、生活の質を向上させるために早期診断を必要とする。 IEIにおけるパターン認識のための機械学習(ML)アルゴリズムの開発は限られている。本研究は,IEIの特徴認識を洗練させ,まれな疾患集団分析のためのデータツールキットを開発し,教師なしMLで解釈可能なデータ構造における複雑な医療記録の変換を拡大する。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:29:36 GMT)
EPIC-Bench: A Perception-Centric Benchmark for Fine-Grained Embodied Visual Grounding in Vision-Language Models [39.8]
EPIC-Benchは、大規模視覚言語モデル(VLM)の基盤ベンチマークである。実環境におけるVLMの視覚知覚能力を体系的に評価する。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:38:51 GMT)
H-OmniStereo: Zero-Shot Omnidirectional Stereo Matching with Heading-Aligned Normal Priors [39.6]
H-OmniStereoはゼロショット全方位ステレオマッチングフレームワークである。我々は280万以上のトップボトム等方形ステレオペアからなる高品質な合成データセットを構築した。提案手法はドメイン外データセットの既存手法よりも精度が高い。
論文参考訳（メタデータ） (Sat, 16 May 2026 11:48:36 GMT)
Towards Generalized Image Manipulation Localization via Score-based Model [38.0]
IMLにスコアベース生成モデルを導入する新しいフレームワークであるDiffIMLを提案する。この定式化の下では、拡散モデルは学習したスコア関数の効果的な数値解法として機能する。 8つの非生成的および3つの生成的ベンチマークの実験は、DiffIMLが一貫して最先端の手法より優れていることを示した。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:39:54 GMT)
VGGT-Occ: Geometry-Grounded and Density-Aware Gated Fusion for 3D Occupancy Prediction [37.5]
VGGT-Occは、パイプライン全体に幾何学的トークンを埋め込むフレームワークである。我々は,全ての注意段階に幾何学を注入するために,射影認識変形性注意(PA-DA)を導入する。機能はビュー品質のセマンティックゲートを通じて統合され、ビュー間の一貫性が保たれる。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:51:04 GMT)
ZeroUnlearn: Few-Shot Knowledge Unlearning in Large Language Models [36.7]
大規模な言語モデルは、有害な世代を引き起こす可能性のある入力として定義された機密情報を必然的に保持する。既存の機械学習手法は、リトレーニングやアグレッシブな微調整に頼っている。我々は、センシティブな入力を中立なターゲット状態にマッピングすることで上書きする、数発のアンラーニングフレームワークZeroUnlearnを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:10:36 GMT)
PersonaArena: Dynamic Simulation for Evaluating and Enhancing Persona-Level Role-Playing in Large Language Models [36.7]
PersonaArenaは、大きな言語モデルでペルソナレベルのロールプレイングを評価し改善するための動的シミュレーションフレームワークである。本フレームワークは,総合的および偏見のない評価のためのマルチエージェント議論判断器を特徴とする。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:23:28 GMT)
LACE: Latent Visual Representation for Cross-Embodiment Learning [36.2]
人間の実演から学ぶことは、人間とロボットの体格の視覚的ギャップによって妨げられる。自己教師型学習バックボーンの潜在空間における人間とロボットの視覚表現を協調するフレームワークであるLACEを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 01:50:18 GMT)
Decision-Aware Proximal Bridge Learning for Optimal Treatment Selection [35.9]
我々は,グローバルな安定化を維持しつつ,意思決定関連処理領域を強調する,政策目標の重み付き橋梁損失を導入する。提案した橋梁損失制御法は,重み付き不定値による治療・選択の後悔を抑えるものであることを示す。経験的に、決定認識重み付けは、いくつかのブリッジソルバにおける後悔を減らし、近位設定における治療選択の改善を示唆する。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:20:03 GMT)
Expandable, Compressible, Mineable: Open-World Thermal Image Restoration [35.5]
ECMRNetは、オープンワールド熱赤外(TIR)画像復元のためのネットワークである。連続的な劣化学習を「エクスパンド・圧縮・マイン」閉ループプロセスとして統一する。これは、多種多様な単体および複体劣化に対して優れた総合的な性能を達成する。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:41:38 GMT)
OpenJarvis: Personal AI, On Personal Devices [35.4]
OpenJarvisは、5つのプリミティブにまたがる型付き仕様として、パーソナルAIシステムを表すアーキテクチャである。各プリミティブは独立して編集可能なフィールドであり、スタックを最適化し、精度、コスト、レイテンシに対して測定することができる。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:00:10 GMT)
Accelerating Rectified Flow Models via Trajectory-Aware Caching [35.1]
我々は,スキップ・then-compensateパラダイムに従って,トレーニング不要なアクセラレーションフレームワークであるTACacheを提案する。 Trajectory-Aware Cacheは、テキスト・ツー・イメージ・ジェネレーションで最大4.14スピードアップ、テキスト・ツー・ビデオ・ジェネレーションで2.11スピードアップを達成する。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:44:58 GMT)
Extending Pretrained 10-Second ECG Foundation Models to Longer Horizons [34.6]
典型的診断10秒心電図を用いた心電図基礎モデル(ECG)は,様々な臨床応用において強い伝達性を示した。本稿では,事前学習したECGファンデーションモデルを,バックボーンを再学習することなく,長大かつ可変長のECGに拡張するパラメータ効率フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:52:23 GMT)
MemForest: An Efficient Agent Memory System with Hierarchical Temporal Indexing [33.9]
本稿では,エージェントメモリを書き込み効率のよい時間的データ管理問題として再構成するメモリフレームワークであるMemForestを紹介する。 MemForestは、並列チャンク抽出によってシーケンシャルなボトルネックを破り、メモリ構成を並列で独立した操作に分離する。 We evaluate MemForest on two long-context memory benchmarks, LongMemEval-S and LoCoMo。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:11:47 GMT)
Skills on the Fly: Test-Time Adaptive Skill Synthesis for LLM Agents [33.6]
テスト時間適応型スキル合成法であるemphSkillTTAを提案する。それは、現在のタスクに関連する小さなトレーニングトラジェクトリを検索し、それらを一時的なタスク固有のテキストスキルに合成する。本手法をSpreadsheetBench, ALFWorld, BigCodeBenchで評価した。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:14:15 GMT)
SkillMAS: Skill Co-Evolution with LLM-based Multi-Agent System [33.2]
本稿では,大規模言語モデル(LLM)エージェントシステムにおける適応特殊化のための非結合フレームワークであるSkillMASを提案する。 SkillMASはUtility Learningを使用して、検証済みの実行トレースからクレジットを割り当て、未フィルタリングライブラリの成長を伴わずに再利用可能な手順を洗練するための境界付きスキル進化、障害の維持時にエビデンス付きMAS再構成、そして実行ユーティリティは構造的ミスマッチを示している。実施された操作、コマンドライン実行、小売の他、SkillMASは報告されたハーネスの下で競争力があり、デプロイ後の専門化がどのように属性され、更新され、適用されるかを明確にしている。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:37:45 GMT)
Scientific Logicality Enriched Methodology for LLM Reasoning: A Practice in Physics [32.8]
我々は,Large Language Models (LLMs) の科学的推論に基づく内部論理性に関する最初の体系的な研究を行っている。データ構築のために、学術文献から科学的問題を抽出し、強力な論理性を示す高品質なデータセットをサンプリングする。 1) LLM推論における科学的論理性を効果的に改善し, 2) 豊かな科学的論理性は科学的問題を解く上で重要な役割を担っている。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:15:10 GMT)
The Unlearnability Phenomenon in RLVR for Language Models [30.8]
Reinforcement Learning with Verifiable Reward (RLVR) は,Large Language Model's (LLM) 推論能力の向上に有効であることが証明されている。モデルが当初は苦労していた厳しい例の中で、正確なロールアウトが存在する場合でも、実質的なサブセットはリリース不能のままである。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:43:19 GMT)
How do Humans Process AI-generated Hallucination Contents: a Neuroimaging Study [30.6]
画像記述の正しさを判定する検証作業中,27人の被験者の脳波信号を記録する。複数の認知過程、例えば、セマンティック統合、推論処理、メモリ検索、認知的負荷は、人間が幻覚的コンテンツと非幻覚的コンテンツとを処理する際に異なるパターンを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:08:22 GMT)
ACWM-Phys: Investigating Generalized Physical Interaction in Action-Conditioned Video World Models [30.5]
行動条件付き世界モデル(ACWM)は,映像の予測と意思決定に強く期待されている。本稿では,多様な物理力学下での行動条件予測のための新しいベンチマークであるACWM-Physを紹介する。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:08:27 GMT)
AgentKernelArena: Generalization-Aware Benchmarking of GPU Kernel Optimization Agents [30.0]
AgentArenaは、GPUカーネル最適化上のAIコーディングエージェントを測定するためのオープンソースのベンチマークである。ほとんどのタスクカテゴリにおいて、ほぼ完全なコンパイルと高い正当性率が得られます。その結果,HIP-to-HIPとTriton-to-Tritonの最適化は未確認入力形式に大きく移行した。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:25:11 GMT)
MixSD: Mixed Contextual Self-Distillation for Knowledge Injection [29.8]
Supervised Fine-tuning (SFT) は言語モデルに新しい知識を注入するために広く使われている。このことは、人間や外部システムからの微調整対象が、モデルの自動回帰分布から逸脱するためである、と我々は主張する。分布整合型知識注入のための簡易な外部教師なし手法であるMixSDを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:57:09 GMT)
Thermal-Only Crowd Counting with Deployment-Time Privacy Protection [28.8]
プライバシを意識した集団カウント用に設計された,最初のサーマルオンリーフレームワークを提案する。熱表現を増強する識別的特徴を抽出するクロスモーダルブリッジとして深度-RGB拡散モデルを利用する。 RGBT-CCおよびDroneRGBTデータセットを用いた実験により,本手法は最先端のRGB-T融合法と競合する性能を示した。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:21:34 GMT)
Ranking-Aware Calibration for Reliable Multimodal Reinforcement Learning [28.0]
本稿では,2つの比較信号を用いて信頼度を監督する学習時間フレームワークであるRanding-Aware(RAC)を紹介する。我々はQwen2.5-VL InternVL-3.5バックボーン上でRACをインスタンス化し、クリーンで破損した入力の下で6つのマルチモーダル推論ベンチマークで評価する。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:51:29 GMT)
Learning-Zone Energy: Online Data Selection for Efficient RL Post-Training [28.0]
そこで本研究では,モデルにおけるアクティブな学習フロンティアに焦点をあてた,理論的基盤を持つ完全オンラインデータ選択フレームワークを提案する。リプレイ付きフォワードプルーナーは、永続的に解決されたプロンプトのロールアウト生成をスキップすることで、ウォールクロック時間コストをさらに低減する。我々の方法は1ステップあたりのトレーニングデータの40%しか保持しないが、完全なデータベースラインにマッチまたは超えている。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:01:12 GMT)
Parallel Recursive LSTM [26.9]
並列再帰型LSTM(Parallel Recursive LSTM)は,左から右への再帰を平衡計算木上の非線形状態合成に置き換える階層的再帰型アーキテクチャである。 PR-LSTMは、標準RNN、LSTM、Transformerベースラインよりも多くのタスクを解決し、注意の2次スケーリングを避けながら、フォーマルなベンチマーク上で強力なシーケンス長の一般化を実現する。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:28:59 GMT)
Why Do Reasoning Models Lose Coverage? The Role of Data and Forks in the Road [26.1]
本研究は,SFTをベースとしたポストトレーニングにおけるスリム化の原因について検討する。設定中のトレーニング後のダイナミクスを追跡することで、縮小現象がトレーニングデータにおける意思決定シナリオの頻度と密接な相関があることが分かる。本研究は,データ中心因子を推論モデルにおける縮小の鍵要因とみなし,その制御に有効なレバーとして多様性を考慮した設計を強調した。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:55:12 GMT)
Prognostic Value of Lung Ultrasound Biomarkers for Readmission Risk in Congestive Heart Failure: A Pilot Data-Driven Analysis [26.0]
30日以内の退院は、心不全(CHF)の重症度、死亡率、回避可能な医療費をリードする要因であるポイント・オブ・ケア肺(LUS)は、CHFの償却を特徴とする肺の混雑に敏感で非侵襲的な窓を提供するが、その読み出し予測の予後上の有用性は明らかにされていない。入院時に取得したBモードLUSを用いて30日間のCHF寛解を予測できるパイロット実現可能性の検討を行った。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:49:12 GMT)
GroupMemBench: Benchmarking LLM Agent Memory in Multi-Party Conversations [25.7]
大規模言語モデル(LLM)エージェントは、ますますパーソナルアシスタントや職場の協力者として機能している。既存のメモリシステムとベンチマークは、Dyadicのシングルユーザ設定を中心に構築されている。グループメモリの3つの特性を公開するベンチマークであるGroupMemBenchを紹介する。
論文参考訳（メタデータ） (Sat, 16 May 2026 21:14:35 GMT)
NGM: A Plug-and-Play Training-Free Memory Module for LLMs [25.7]
N-gram Memory (NGM) は、Causal N-Gram と Cosine-Gated Memory から構成されるトレーニングフリーのプラグイン・アンド・プレイモジュールである。 NGMは、N-gram埋め込みをスクラッチからトレーニングする必要がない。我々は8ベンチマークでQwen3シリーズのNGMを0.6Bから14Bに評価した。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:12:52 GMT)
E-PMQ: Expert-Guided Post-Merge Quantization with Merged-Weight Anchoring [25.1]
本稿では,PMQ(Post-Merge Quantization)により,マージ後の効率的な量子化と低ビット展開が可能となることを示す。我々は、エキスパート誘導型PMQフレームワークであるE-PMQを提案する。これらの結果から,E-PMQは合併後の効果的な量子化と低ビット展開を可能にすることが示された。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:44:36 GMT)
Beyond Execution: Static-Analysis Rewards and Hint-Conditioned Diffusion RL for Code Generation [24.2]
強化学習(Reinforcement Learning, RL)は、拡散言語モデル(DLM)をコード生成における機能的正当性に整合させる重要なパラダイムである。本稿では,拡散型コード生成のためのRLポストトレーニングについて,報酬設計,ヒント条件付きサンプリング,タスク難易度という3つの軸に沿って,体系的な実証的研究を行った。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:18:04 GMT)
SEMA-RAG: A Self-Evolving Multi-Agent Retrieval-Augmented Generation Framework for Medical Reasoning [23.9]
本稿では,医療質問応答のための自己進化型マルチエージェントRAGフレームワークを提案する。この役割は、臨床スキーマ解釈のための解釈エージェント(Interpreter Agent for Clinical schema interpretation)、満足度駆動検索のためのエクスプローラーエージェント(Explorer Agent for sufficiency-driven retrieve)、証拠判断と回答選択のためのアービターエージェント(Arbiter Agent)の3つの専門エージェントに割り当てられる。最強のベースラインを、背骨ごとの平均で+6.46の精度で改善する。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:09:47 GMT)
Reasoning Can Be Restored by Correcting a Few Decision Tokens [23.8]
トークンレベルの分布不一致を定量化することにより,基本共振ギャップについて検討する。理由付けの利点は極めて希薄であり、計画に関する決定トークンのごく一部に集中していることが分かりました。我々は、単純な推論時デリゲート方式である不一致誘導トークン介入を提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:33:31 GMT)
The Alpha Illusion: Reported Alpha from LLM Trading Agents Should Not Be Treated as Deployment Evidence [23.8]
エンド・ツー・エンドのLLMトレーディングエージェントからのシャープ比率の報告は、配備証拠として扱われてはならない。レポートの堅牢性はトレーダブルな確率ではなく、物語の推論は数値的な実行ではない。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:14:35 GMT)
JSPG: Dynamic Dictionary Filtering via Joint Semantic-Pinyin-Glyph Retrieval for Chinese Contextual ASR [22.9]
文脈自動音声認識(ASR)は、大規模なキーワード辞書の課題に直面している。我々はSemantic, Pinyin, Glyph機能(JSPG)を共同で統合するフィルタリングフレームワークを提案する。ピニンは音韻的類似性に基づいて標的を効果的に回収し、グリフは中国語固有の無関係なホモフォンをフィルタリングするための補完的な構造的手がかりを提供する。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:16:09 GMT)
NOFE - Neural Operator Function Embedding [22.5]
ほとんどの次元還元法は、多くの実世界のプロセスに固有の連続的なドメイン構造を無視して、データを離散的な点雲として扱う。本稿では,連続次元還元のためのドメイン認識フレームワークであるNeural Operator Function Embedding (NOFE)を紹介する。異なるデータセット間でNOFEを評価し,PCA,t-SNE,UMAPと比較した。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:05:23 GMT)
Learning Unbiased Permutations via Flow Matching [22.5]
PermFlowは、置換学習のための条件付きフローマッチングフレームワークである。単一のモードに折り畳むのではなく、マルチモーダルな置換分布をキャプチャする。あいまいな入力に対して高い精度を実現し、あいまいさの下で両方の有効な置換を復元する。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:10:35 GMT)
RHINO: Reconstructing Human Interactions with Novel Objects from Monocular Videos [22.3]
人々、オブジェクト、そしてそれらのインタラクションを3Dで再構築することは、インテリジェントシステムの長年の目標である。これまでの作業のほとんどは、人間や物体を別々に扱い、それらの相互作用を無視したり、既知の3D形状やカメラを仮定したりしていた。モノクラーRGBビデオから、人間の3D、新しい(見えない)操作対象、そして、共通の世界フレームの静的なシーンを復元するフレームワークであるRHINOを開発した。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:25:42 GMT)
Approximate Distributed Coded Computing: Polynomial Codes and Randomized Sketching [22.2]
符号化コンピューティングは、符号化理論を用いてテキスト冗長性を導入し、大規模システムにおけるボトルネックを克服する分散パラダイムである。同じ静脈において、ランダム化された数値線型代数は、線形代数演算のテキスト圧縮と加速に確率的手法を用いる。本稿では、両分野の基礎を概観し、最適化と機械学習アルゴリズムの高速化の両手法を組み合わせた分散スキームについて述べる。
論文参考訳（メタデータ） (Sat, 16 May 2026 01:50:27 GMT)
New Wide-Net-Casting Jailbreak Attacks Risk Large Models [22.2]
この研究は、実用的なが未調査のジェイルブレイクシナリオ、ワイドネットキャストシナリオを特定します。さらに,広帯域放送に適した新しいジェイルブレイク手法を開発した。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:22:54 GMT)
iMiGUE-3K: A Large-Scale Benchmark for Micro-Gesture Analysis with Self-Supervised Learning [22.0]
iMiGUE-3Kは、ジェスチャーに基づく感情分析のためのビデオデータセットである。 iMiGUE-3K上に構築されたMG-FMは,移動可能なジェスチャー提示学習のための識別基盤モデルである。提案手法の系統的評価は,微小姿勢解析が感情理解を著しく向上させることを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:30:29 GMT)
Why Do Safety Guardrails Degrade Across Languages? [21.5]
大規模な言語モデルは、英語以外の言語で安全性の低下を示す。我々は、安全運転要因を分離する潜在変数モデル、多群項目応答理論(IRT)フレームワークを導入する。 5つの閉モデルファミリーと10の言語にまたがる61のモデル構成の安全性のロバスト性を評価する。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:08:54 GMT)
Mind the Gap: Learning Modality-Agnostic Representations with a Cross-Modality UNet [21.5]
クロスモダリティ認識は科学、法執行、エンターテイメントに多くの重要な応用がある。識別関連情報を保持しながら、モダリティに依存しない表現を学習するためのコンパクトエンコーダデコーダニューラルモジュール(cmUNet)を提案する。本稿では,モーダリティ非依存表現を入力とし,類似度スコアを出力する標準的な特徴抽出ネットワークに,cmUNetを接続するMarrNetを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:00:54 GMT)
VoxScene: Anchor-Conditioned Voxel Diffusion for Indoor Scene Arrangement [21.5]
VoxSceneは3Dシーン合成に適したアンカー条件のボクセル拡散フレームワークである。離散ボクセルの相互排他性を利用して空間的曖昧性を排除し,衝突のない配置を保証する。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:10:48 GMT)
Learning Multi-Timescale Abstractions for Hierarchical Combinatorial Planning [21.1]
シーケンシャルな意思決定のためのモデルベースの階層的フレームワークを提案する。我々は、コンテキスト対応リソース割り当てをサポートするために、世界モデルと協調して、サブゴール条件の予算政策を学習する。挑戦的なSSCOベンチマーク全体で、我々の手法は強いベースラインを上回ります。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:04:11 GMT)
Controlling Decision Drift in Multimodal Sentiment Analysis with Missing Modalities [20.8]
本稿では,モダリティの欠如によるロバスト性向上のための2レベル参照アライメントフレームワークを提案する。第一レベルの参照アライメントは、完全なモダリティサンプルを利用して表現を制約し、異なるモダリティの組み合わせを共有の感情空間に整合させる。第2レベルの参照アライメントは、プロトタイプ検索と投票を通じて信頼性の低いモダリティを抑えることで、決定レベルでの相互整合性を強制する。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:03:31 GMT)
Neuroscience-inspired Staged Representation Learning with Disentangled Coarse- and Fine-Grained Semantics for EEG Visual Decoding [20.8]
既存の脳波の視覚的復号法は主に、クロスモーダルアライメントのための単一のグローバル脳波埋め込みを学習することに焦点を当てている。本稿では,脳波の視覚的復号化をステージ固有の表現分解問題として再定義する,神経科学にインスパイアされた段階的表現学習フレームワークを提案する。提案フレームワークは,脳波表現学習を,低レベル視覚表現学習,高レベル意味表現学習,統合情報融合という3つの相補的なフェーズに編成する。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:30:33 GMT)
Language Acquisition Device in Large Language Models [20.7]
本稿では,MERGE,AGREE,MOVEを介して,文字列が階層的な構成,特徴ベース依存性,長距離変位を符号化する形式言語MP-STRUCTの事前事前訓練を提案する。 C-RASPでは定義できないが、MP-STRUCT COREは$k$-Shuffle Dyckより優れている。依存関係の解決の曖昧さを軽減する機能的なランドマークが重要なドライバであることを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:13:32 GMT)
Central Limit Theorem for Bosonic Quantum Channels [20.3]
我々は、ボゾン量子チャネルの設定に対する中央極限定理(CLT)の拡張を開発する。我々は、すべての物理的(おそらく非ガウス的)ボソニック量子チャネルが満たさなければならない不確実性関係を提供する。極限定理の別の応用として、線形ボゾンチャネルのエネルギー制約された量子容量の強い下界を導出する。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:29:39 GMT)
High-dimensional Limit of SGD for Diagonal Linear Networks [20.2]
対角線ネットワーク上の勾配勾配は微分方程式(SDE)によって支配される連続力学によりよく近似されることを示す。適切なパラメトリゼーションの下では、このダイナミクスは地球規模で十分に仮定され、高い確率で指数関数的に高速にゼロリスクに収束し、それらの長時間の振る舞いを完全に明示的な非漸近的記述をもたらすことが示される。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:26:59 GMT)
TriAxialKV: Toward Extreme Low-Precision KV-Cache Quantization for Agentic Inference Tasks [20.0]
エージェントワークロードのための新しい混合精度KV-cache量子化スキームであるTriAxialKVを紹介する。我々は、キャリブレーション、混合精度量子化、メモリ管理を含むエンドツーエンドサービスシステムとしてTriAxialKVを実装した。
論文参考訳（メタデータ） (Sat, 16 May 2026 21:58:28 GMT)
Generalizable and Actionable Parts Pose Estimation with Symmetry Annotation-Free Learning Strategy [19.4]
GAParts(Generalizable and Actionable Parts)の理解は、関連する研究者から注目を集めている。我々は,新しい対称性であるSAFAGを提案する。 -一般化可能なアクション可能な部品推定のためのフリーフレームワーク。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:05:32 GMT)
Can LLMs Think Like Consumers? Benchmarking Crowd-Level Reaction Reconstruction with ConsumerSimBench [19.1]
このベンチマークは、1,553の中国のソーシャルメディアトピックと23,122のアトミックなルール監査基準から構築されている。包括的選好判断でオープンエンド世代を評価するのではなく、ConsumerSimBenchは各タスクを具体的な反応点に対する監査可能なイエスノー決定に分解する。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:55:31 GMT)
Behavior-Induced Mirror-Prox Temporal-Difference Learning for Faster Off-Policy Prediction [18.9]
STHTD-MPと呼ばれる行動誘発ミラープロキシ時間差分法を提案する。 STHTD-MPがGTD2-MPよりも小さい平均収縮係数を持つことを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 11:33:44 GMT)
PULSE: Generative Phase Evolution for Non-Stationary Time Series Forecasting [18.4]
非定常条件下での時系列予測は、安定表現のキャプチャと分布シフトへの適応の間に根本的な緊張に直面している。我々は、3つの物理仮説により非定常力学を定式化する: ウォルド分解、動的相の進化、ヘテロセダスティック多様体の生成。これらの原理は、Distangle-Evolve-Simulateデザイン哲学を採用した物理インフォームドのプラグアンドプレイフレームワークであるPULSEを刺激した。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:54:18 GMT)
Rethinking the State Update Gate for Long-Sequence Recurrent 3D Reconstruction [18.0]
厳格な定メモリ予算の下での3D再構成は、ストリームが進化するにつれて、リカレント状態がどのように更新されるかに焦点をあてる。 5つのベンチマークでTT3Rスタイルのゲートをプロファイルし、構造的ボトルネックを発見します。我々のゲートは、長いTUM-RGBDポーズシーケンスでATEを51%カットし、ボンのビデオ深度でAbsRelを12.8%削減し、KITTIのロングシーケンスポーズ推定はLongStreamとKeyframe-VOを上回ります。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:00:49 GMT)
Responsible Agentic AI Requires Explicit Provenance [17.9]
責任は広く議論されているにもかかわらず、主観的で非強制的な概念である。現在のエージェントフレームワークは、それを割り当てるために必要な定量化され、トレース可能で、介入可能な証明を生成しません。
論文参考訳（メタデータ） (Sat, 16 May 2026 21:56:33 GMT)
Cross-Domain Molecular Relational Learning: Leveraging Chemical Structure-Activity Analysis [17.6]
分子構造と視覚像のドメイン間適応表現を最適化する。 DisTransは16のベースライン法より優れており、ドメイン間の相違が顕著である場合でも良好な性能を維持している。
論文参考訳（メタデータ） (Sat, 16 May 2026 04:00:17 GMT)
P2GS: Physical Prior-guided Gaussian Splatting for Photometrically Consistent Urban Reconstruction [17.2]
3D Gaussian Splatting (3DGS)は、高速で高忠実なレンダリングを可能にする強力な明示的表現として最近登場した。 P2GSは、ビュー不変線形HDR放射場、ビューごとの露光スケール、トーンマッピング関数を共同で分解する物理的に一貫したフレームワークである。実験により、P2GSはLDR再構成における従来の手法に適合または超え、光度整合性を大幅に向上することが示された。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:36:23 GMT)
Multi-Paradigm Agent Interaction in Practice:A Systematic Analysis of Generator-Evaluator, ReAct Loop,and Adversarial Evaluation in the buddyMe Framework [17.2]
本稿では,Multi-Agent Orchestration (Generator-Evaluator), ReAct Tool-Use Loops, Memory-Augmented Interactionの3つの主要なエージェントインタラクションパラダイムの系統的解析を行う。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:35:50 GMT)
HAD: Hallucination-Aware Diffusion Priors for 3D Reconstruction [17.1]
強調画像に対する幻覚-認識拡散事前推定ピクセルワイド幻覚スコアマップこれらの幻覚スコアは、プログレッシブ3D再構成過程において、信頼できない画素の選択的マスキングを可能にする。本手法は,拡散支援3次元再構成における幻覚アーティファクトを著しく低減することを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:31:39 GMT)
SE-GA: Memory-Augmented Self-Evolution for GUI Agents [17.1]
自己進化GUIエージェント(Self-Evolving GUI Agent、SE-GA)は、階層型メモリ構造と反復的自己改善機構を統合する新しいフレームワークである。継続的学習を保証するため、メモリ拡張自己進化(MASE)を導入します。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:51:57 GMT)
When Robots Do the Chores: A Benchmark and Agent for Long-Horizon Household Task Execution [17.0]
LongActは、長期住宅業務における計画レベルの自律性を評価するために設計されたベンチマークである。 HoloMindは、DAGベースの長距離階層型プランナーを備えたVLM駆動のエージェントである。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:16:21 GMT)
WhiteTesseract: Reframing the Interpretation of Cultural Heritage through XR and Conversational AI [17.0]
WhiteTesseractは高解像度のXRと会話型AIによるその場解釈を可能にする。このシステムをクロードモネ展示に導入し,26名の参加者を対象に制御されたユーザスタディを行った。その結果、WhiteTesseractは平均視聴時間が35.3秒から98.3秒に大幅に増加した。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:50:37 GMT)
DriveSafe: A Framework for Risk Detection and Safety Suggestions in Driving Scenarios [16.8]
DriveSafeは、リスクを意識したシーン理解のためのフレームワークである。明示的な言語ベースのシーン表現にリスクアセスメントを条件付けることで、DriveSafeは大幅に向上する。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:07:14 GMT)
Task Abstention for Large Language Models in Code Generation [16.4]
大規模言語モデル(LLM)は、自動コード生成に革命をもたらした。「一つはいわゆる幻覚である。」本研究は,特定のコード生成タスクの実行を停止すべきか否かを判定し,幻覚を避けるためのタスク停止問題について検討する。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:58:11 GMT)
Multilingual and Multimodal LLMs in the Wild: Building for Low-Resource Languages [15.8]
本チュートリアルでは, テキスト, 音声, 視覚の多言語多義性に関するこの新たな研究領域について概説する。低コストなデータ作成/キュレーション、トリモーダルアライメントのためのアダプタスタック、英語以外の文化認識評価について取り上げる。コンテンツはインタラクティブなハーフデイチュートリアルとして提供され、低リソースの言語設定で多言語でマルチモーダルAIに取り組んでいる研究者や実践者向けにデザインされる。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:56:15 GMT)
CAREBench: Evaluating LLMs' Emotion Understanding by Assessing Cognitive Appraisal Reasoning [15.7]
本稿では,CAREBenchについて紹介する。CAREBenchは,実世界の物語に関する一対一の視点と三対三の視点から,完全な推論連鎖アノテーションを用いた最初のベンチマークである。より強いモデルは、特定のタスクにおいて人間の観察者と一致するか、あるいは上回っているが、評価的推論と肯定的な感情認識では不足している。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:23:21 GMT)
Watermarks Attack Watermarks: Re-Watermarking as a Generic Removal Strategy [15.6]
透かしのような透かしそのものに対する攻撃は、検知器を起動する入力画像(現在透かし付き)に不可避な変化を求める。既存の透かし画像の再透かしだけで元の信号が確実に抑制されることを示す。我々の研究は安価で汎用的で非常に効果的な攻撃パイプラインを構成しており、現在の透かし方式の信頼性を疑問視している。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:57:37 GMT)
Learning When to Stop: Selective Imitation Learning Under Arbitrary Dynamics Shift [15.6]
振る舞いのクローン化は、トレーニングとテスト環境が同じダイナミクスを共有するときに、強力な模倣学習を保証する。多くのデプロイメント環境では、テスト環境の遷移はトレーニングとは異なる。これは選択的な模倣の研究を動機付けており、学習者は確実に行動できないときに停止することを選択できる。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:02:16 GMT)
Decoupling KL and Trajectories: A Unified Perspective for SFT, DAgger, Offline RL, and OPD in LLM Distillation [15.6]
本研究は, プレフィックスソースとトークンレベルKL方向の2つの選択肢を暗黙的に分けた, 代表的なパラダイム, オフ・ポリケーション蒸留, オン・ポリケーション蒸留について述べる。 KL混合とエントロピーゲート長のカリキュラムを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:05:27 GMT)
Reliability and Effectiveness of Autonomous AI Agents in Supply Chain Management [15.2]
本稿では,MIT Beer Game を用いたマルチエキロンサプライチェーンにおける自律生成型AIエージェントについて検討する。モデル選択、ポリシーとガードレール、集中型データ共有、迅速なエンジニアリングという、パフォーマンスを形成する4つの推論時レバーを特定します。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:11:35 GMT)
Latent Action Control for Reasoning-Guided Unified Image Generation [15.2]
本稿では,Latent Action Control (LAC) を提案する。我々は,LACがGenEval,WISE,T2I-CompBenchにまたがる構成的および知識的基底生成を一貫して改善することを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:23:20 GMT)
HYVINT: Intensity-Driven Hypergraph Generation with Variational Representations [14.4]
ハイパーグラフは多進的相互作用をモデル化するための原則的なフレームワークを提供する。既存のジェネレータは暗黙の潜伏空間や連続インシデントデコーダに依存していることが多い。強度駆動型ハイパーグラフ生成フレームワークHYVINTを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:38:33 GMT)
CompactAttention: Accelerating Chunked Prefill with Block-Union KV Selection [13.9]
既存のスパースアテンションメソッドは、チャンクされたプリフィルに効率的に変換しない。ブロック・ユニオンKV選択に基づくチャンクド・プレフィルアテンション機構であるCompactAttentionを提案する。最大2.72$times$ attention speedup at 128K context length under chunked prefill。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:47:41 GMT)
Algorithmic Cultivation: How Social Media Feeds Shape User Language [13.8]
我々は,アルゴリズムフィードが,ユーザの言語に測定可能な痕跡を残すオンライン環境として機能するかどうかを検討する。ブルースキーの400万ユーザーによる2億3500万投稿の大規模時系列データセットを活用している。アルゴリズムフィードに露出したユーザは、マッチした制御よりも、スタイリスティックな調節、セマンティックアライメント、レジスタフォーマタイゼーションが大幅に向上していることが判明した。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:14:43 GMT)
NodeSynth: Socially Aligned Synthetic Data for AI Evaluation [13.8]
社会的に関連する合成クエリを生成するエビデンスベースの手法であるNode Synthを紹介する。 Node Synthは、人によるベンチマークの最大5倍の失敗率を示している。スケーラブルで高精度なモデル評価を可能にするために、エンドツーエンドの研究プロトタイプとデータセットをオープンソースにしています。
論文参考訳（メタデータ） (Sat, 16 May 2026 23:33:47 GMT)
Informative Graph Structure Learning [13.7]
InGSL(Informative Graph Structure Learning)法を提案する。 InGSLは、相互情報誘導学習戦略を導入することにより、エッジ構築における類似性と多様性の両方を考察する。 InGSLはエッジ数を減らして大幅な性能向上を実現している。
論文参考訳（メタデータ） (Sat, 16 May 2026 04:46:59 GMT)
3DPhysVideo: Consistency-Guided Flow SDE for Video Generation via 3D Scene Reconstruction and Physical Simulation [13.7]
この3DPhysVideoは、単一の画像から物理的にリアルなビデオを生成する、新しいトレーニング不要のパイプラインだ。画像から映像へのフローモデル(I2V)を描画点雲で導いて360度3次元シーン形状を復元するために,新しいビューシンセサイザーとして利用する。マルチオブジェクトや流体相互作用シーンを含む多種多様な実験において,本手法は単一画像から物理的に可視なビデオへのギャップを埋めることに成功した。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:56:52 GMT)
SHED: Style-Homogenized Embedding Alignment for Domain Generalization [13.5]
ドメイン一般化のためのスタイル均質な埋め込みアライメントを提案する。 SHEDはCLIPのエンコーダの生の表現の代わりに、スタイル均質な埋め込みを調整する。 SHEDが最先端のパフォーマンスを達成することを示す5つのベンチマークの実験。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:51:38 GMT)
TOBench: A Task-Oriented Omni-Modal Benchmark for Real-World Tool-Using Agents [13.0]
MM-ToolBenchはタスク指向のOmni-modalツール用ベンチマークと評価ハーネスである。 MM-ToolBenchの中心設計は閉ループマルチモーダル検証である。 15の現代のエージェントモデルの実験では、MM-ToolBenchは非常に難しいままである。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:49:25 GMT)
Zero-Shot Faithful Textual Explanations via Directional-Derivative Influence on Predictions [13.0]
テキストによる説明は、内部表現を探索することで、画像分類器をより透明にすることを目的としている。 FaithTraceは、説明によって誘導される表現が、どの程度クラスロジットを変更するかを測定する。我々は、この影響スコアを定量的評価尺度に拡張し、テキスト説明の忠実度評価のギャップを埋める手助けをする。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:39:05 GMT)
VISOR: A Vision-Language Model-based Test Oracle for Testing Robots [12.9]
ロボットをテストするには、意図したタスクを正しく、確実に、高品質に実行するかどうかを評価する必要がある。伝統的に、この評価はタスク固有の象徴的オラクルをタスクの正しさと人間の手動によるロボット行動の評価に頼っている。視覚言語モデル(VLM)に基づく自動テストオラクル評価手法であるVISORを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:46:37 GMT)
Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps [12.9]
大規模言語モデルにおける長文推論は、注意の2次コストによってボトルネックとなる。フルアテンション LLM は本質的にスパースであり,最小限の適応しか持たない高度スパースモデルに変換可能であることを示す。 RTPurboは、モデル固有のスパーシリティを活用することで、わずか数百のトレーニングステップでスパーシフィケーションを実現する。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:51:58 GMT)
Capturing LLM Capabilities via Evidence-Calibrated Query Clustering [12.7]
本稿では,表面レベルのセマンティクスと潜在能力要件のギャップを埋めるために,事前セマンティクス埋め込みを校正するアルゴリズムECCを提案する。 ECCはBradley-Terryモデルによってパラメータ化された機能プロファイルを通じて各クラスタを特徴付け、トレーニング可能な混合重み付けを使用して、混合機能要求のクエリに適合する。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:30:37 GMT)
MLCommons Chakra: Advancing Performance Benchmarking and Co-design using Standardized Execution Traces [12.5]
パフォーマンスベンチマークと共同設計のためのオープンでポータブルなエコシステムであるChakraを紹介します。 Chakraのコアコンポーネントは、Chakra実行トレース(ET)と呼ばれる、分散AI/MLワークロードのオープンで相互運用可能なグラフベースの表現である。これらのETは、計算、メモリ、通信、データと制御の依存関係、タイミング、リソースの制約といった重要な操作を表す。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:04:38 GMT)
Large language models reorganize representational geometry during in-context learning [12.5]
大規模な言語モデルは、パラメータを更新することなく、コンテキスト内の例から新しいタスクに適応することができる。 In-context Learning (ICL) は高次元表現空間における変換に依存する。 ICLの性能は,下層の分類課題の表現構造と体系的に相関していることを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:31:00 GMT)
An Analytical Multiple Criteria Framework for Temporal and Dynamic Business-to-Business Customer Segmentation in Manufacturing [12.4]
ビジネス・ツー・ビジネス(B2B)における動的多基準意思決定手法を設計・評価する。顧客の安定性、セグメンテーション間の遷移の追跡、時間の変動を計測し、グラフベースのコンセンサスモデルを適用します。実世界の製造会社データセットを用いて,3000人以上のB2B顧客をセグメント化する手法の有効性を検証した。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:51:37 GMT)
Differentiable Optimization Layers for Guaranteed Fairness in Deep Learning [12.4]
フェアネス層(Fairness layer)は、モデルの出力層に付加される微分可能な最適化層である。オンライン原始双対推論アルゴリズムは、ストリーミング予測に対して証明可能な集合公正性を保証する。数値実験は、フェアネス層と関連するアルゴリズムの有効性を実証する。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:49:08 GMT)
LASAR: Towards Spatio-temporal Reasoning with Latent Cognitive Map [12.2]
具体的AIの基本は、エージェントが構造の内部モデルを構築するか、単にタスク固有の専門家の軌道を模倣することを学ぶかを検証することである。これは、アクション中心のタスク(例えば、VLN)や推論中心のタスク(例えば、A)に根ざした基礎的アプローチが、しばしば共通の制限を共有しているためである。本稿では,認識的経験と意味認知地図の両面を維持するために設計された,デュアルメモリシステムを備えたアーキテクチャLASARを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:21:56 GMT)
DynMuon: A Dynamic Spectral Shaping View of Muon [12.2]
M$を$Up Vtop$に置き換え、あるパラメータを$p$にします。そこで我々はDynMuonを提案する。DynMuonは、トレーニング時に正からわずかに負に$p$をスケジュールする効率的な動的スペクトル整形法である。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:30:11 GMT)
PARALLAX: Separating Genuine Hallucination Detection from Benchmark Construction Artifacts [12.1]
大型言語モデル(LLM)は自信を持って幻覚する。内部モデル状態からそれを検出することは、デプロイをより安全にするための道を提供する。広範に使用されているベンチマークにおける高検出性能を実現するための最近の手法この明らかな進歩の多くは、精査が生き残らないことを示している。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:57:15 GMT)
Language Modeling with Hyperspherical Flows [12.1]
近年のフロー言語モデル (FLM) は連続的な流れを言語に適用し、決定論的ODEを持つデータにノイズを伝達する。 $mathbbS$-FLMは、クロスエントロピーで学習した速度場に沿って$mathbbSd-1$の回転ベクトルによってシーケンスを生成する。 $mathbbS$-FLMは、大語彙推論における連続フロー言語モデルを大幅に改善する。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:59:59 GMT)
Virtual Nodes Guided Dynamic Graph Neural Network for Brain Tumor Segmentation with Missing Modalities [12.1]
そこで本研究では,脳腫瘍の断片化のためのグラフベースのワンステージフレームワークを提案する。グラフネットワークの本質的な柔軟性を活用して、動的接続戦略を考案する。提案手法は,不完全モダリティのほとんどすべての部分集合において,最先端の手法よりも優れる。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:40:01 GMT)
CAR-SAM: Cross-Attention Reconstruction for Post-Training Quantization of the Segment Anything Model [12.0]
Segment Anything Models (SAM) はコンピュータビジョンにおいて普遍的なイメージセグメンテーションに広く使われている。リソース制約のあるデバイスにそれらをデプロイするのは、高い計算量とメモリ要求のために難しい。本稿では,SAM に適した統一量子化フレームワーク CAR-SAM を提案する。 CAR-SAM は SAM-B と SAM-L でそれぞれ 14.6% と 6.6% の精度で SAM モデルを 4-bit の精度で量子化することを示した。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:25:23 GMT)
Universal Graph Backdoor Defense: A Feature-based Homophily Perspective [11.9]
グラフニューラルネットワーク(GNN)はリレーショナル学習において大きな成功を収めている。グラフバックドアアタック(GBA)に対する脆弱性は、ハイテイクなアプリケーションで広く採用される上で、大きな障壁となる。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:15:36 GMT)
Lever: Speculative LLM Inference on Smartphones [11.8]
対話型モバイルアプリケーションには、大規模言語モデル(LLM)がますます必要である。本稿では,スマートフォン上でのフラッシュバック型LLM推論のためのエンドツーエンドシステムであるLeverを紹介する。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:43:10 GMT)
Evaluation Drift in LLM Personality Induction: Are We Moving the Goalpost? [11.5]
我々は、長文のエッセイでそれらを微調整することで、大きな言語モデルにおけるパーソナリティを誘導する。そして,IPIP-NEOアンケートを用いて,誘導的性格の安定性と忠実度を評価する。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:44:06 GMT)
Privacy-Preserving Generation Fraud Detection for Distributed Photovoltaic Systems: A Solar Irradiance-Fused Federated Learning Framework [11.4]
本稿では,フェデレートラーニング(FL)に基づくプライバシー保護型分散PVG-FDフレームワークを開発する。 FLフレームワークは、モデルパラメータとプロトタイプを集約することで、コミュニティ間のコラボレーションを可能にする。実世界の住宅用PVデータセットの実験により, 本手法の有効性が検証された。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:19:14 GMT)
A Holistic Method for Superquadric Fitting Using Unsupervised Clustering Analysis [10.8]
そこで本研究では, ノイズや降圧器の汚染下で, 点状雲にスーパークワッドリックを適合させる新しい手法を提案する。本手法では,新たなクラスタリングの観点から問題を再定義する。本稿では,収束解析の理論的証明を提供し,クラスタリングにインスパイアされたフィッティング法が局所的なミニマを回避できることを実証する。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:20:33 GMT)
Adaptive Fused Prior Transfer for Controllable Generative Image Compression [10.7]
本稿では,制御可能な生成画像圧縮のための適応的融合優先転送を提案する。これは、凍結した事前訓練されたAdaCodeモデルから、適応的な融合を前もって転送する制御可能な転送である。デコーダのレイテンシを18.1%削減し、全体のパラメータをDCVICと比較して31.10万 (20.5%)削減する。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:18:50 GMT)
The Learnability Gap in Medical Latent Diffusion [10.5]
遅延拡散モデルによる生成データの増大は、医用画像におけるクラス不均衡に対処する上で有望な戦略である。大規模事前学習型オートエンコーダは、医学的分類のための識別的特徴を忠実に符号化する。画像空間モデルよりも64倍のスループットと120倍のメモリゲインを提供するFLM層と画像空間蒸留を用いた雑音条件付き潜時分類器を開発した。
論文参考訳（メタデータ） (Sat, 16 May 2026 17:07:54 GMT)
State Contamination in Memory-Augmented LLM Agents [10.4]
我々は、メモリ洗浄と呼ばれる障害モードについて研究し、有害または敵対的なコンテキストをメモリサマリーに圧縮することができ、標準検出器では有害に見えなくなる。対向型マルチエージェントロールアウトを用いて、毒性-オリジンメモリサマリーは一般的な毒性閾値以下であることを示す。実験により、毒性は異なる状態チャネルを介して伝播し、一方、圧縮メモリは隠れたサブスレッショルドの影響をもたらすことが示された。
論文参考訳（メタデータ） (Sat, 16 May 2026 01:55:06 GMT)
VGGT-CD: Training-Free Robust Registration for 3D Change Detection [10.4]
VGGT-CDは、ダイナミックチェンジ干渉によるトレーニング不要パイプライン登録である。絶対軌道誤差を屋外で44%、屋内で59%削減する。登録を6倍以上早く完了し、タスク固有のトレーニングなしで高純度な3D変更マップを生成する。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:44:04 GMT)
Stress-Testing Neural Network Verifiers with Provably Robust Instances [10.0]
我々は,地中構造ラベルを用いた検証インスタンス生成のための再利用可能なフレームワークを提案する。また、インスタンスの硬さの異なるソースを推定可能な量の集合であるDifficulty Profileについても紹介する。我々のフレームワークとこれらのプロファイルを用いて、5つの最先端検証ツールを評価し、異なるインスタンスが検証パイプラインの異なる側面を強調していることを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:56:52 GMT)
AI-Assisted Competency Assessment from Egocentric Video in Simulation-Based Nursing Education [10.0]
複雑な視覚行動を理解するための有望なツールとして、視覚言語モデルが登場した。我々は,凍結した視覚エンコーダと数ショット学習を用いて,自己中心型看護シミュレーションビデオから行動タイムラインを抽出する。認識精度と能力の間の負の傾向を観察する。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:07:35 GMT)
The Point of No Return: Counterfactual Localization of Deceptive Commitment in Language-Model Reasoning [9.8]
本稿では,言語モデルにおける偽装の偽装化について紹介する。詐欺は決して誘発されないが、戦略的インセンティブから生じる5つの環境を構築します。得られたコーパスは4つの推論モデルで$sim$1.46Mの文をローカライズする。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:36:29 GMT)
Embodied Multi-Agent Coordination by Aligning World Models Through Dialogue [9.8]
コミュニケーションは、エージェントが観察を共有し、彼らの世界モデルを調整することによって、このギャップを埋めることができます。協調型家庭用ロボティクスのベンチマークであるPartinNRを自然言語対話チャネルで拡張し、部分的可観測性を持つ2つのエージェント間の通信を可能にした。実験の結果,対話は40～83ポイントのアクションコンフリクトを減少させるが,サイレントコーディネートに対してタスク成功を低下させることがわかった。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:44:07 GMT)
Diffeomorphic Cortical Alignment via Direct Warping of Streamline Endpoints [9.5]
皮質表面の登録は、しばしば局所幾何学的記述子によって駆動される。ホワイトマターファイバトラクションエンドポイント上で直接操作することで表面を整列する新しい接続型表面登録手法を提案する。ヒューマンコネクトームプロジェクトデータを用いた実験により, トラクションレベルの対応性が向上した。
論文参考訳（メタデータ） (Sat, 16 May 2026 01:46:32 GMT)
Propagation of Chaos in Contextual Flow Maps [9.4]
本研究では,文脈フローマップの抽象化を応用して,大域的なコンテクストシステムにおける変圧器の統計的理論を開発する。カオスの伝播の力学と古典機械のマッキーン-ブラソフ構造を利用する。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:03:20 GMT)
When Dynamics Shift, Robust Task Inference Wins: Offline Imitation Learning with Behavior Foundation Models Revisited [9.4]
我々は、BFMタスク推論をロバストなミニマックス最適化問題として定式化する。これは、動的シフトに対する堅牢性を達成する最初のBFMベースのフレームワークである。結果は、堅牢なポリシーはタスク推論時に完全に達成できることを示した。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:33:34 GMT)
ClickSeg3D: Few-Click Interactive Segmentation via Semantic Embeddings [9.4]
そこで本研究では,スパースでランダムにダウンサンプリングされた3D点を直接操作する対話型セグメンテーションフレームワークを提案する。我々のフレームワークは、トランスフォーマーベースのエンコーダと階層型マスクデコーダで構成されており、マルチレベルなクロップ・アンド・マージ操作を統合している。我々のモデルは、強いベースラインと比較してmIoUメトリックを20%以上改善します。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:07:00 GMT)
Jacobian-Guided Anisotropic Noise Reshaping for Enhancing Representation Utility under Local Differential Privacy [9.3]
ローカル微分プライバシー(LDP)は、分散データ収集の基礎となるプリミティブである。従来のLDPメカニズムは、下流の目的に対する相対的な重要性にかかわらず、あらゆる次元にわたってノイズを均一に注入する。本稿では,データ表現のタスク関連部分空間におけるノイズを軽減する新しい手法を提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:01:41 GMT)
A Fourier perspective on the learning dynamics of neural networks: from sample complexities to mechanistic insights [9.0]
画像分類タスクで訓練された単純なニューラルネットワークは、まず振幅情報に依存する。次に、エッジと高次相関を符号化する位相情報を利用する。実験および理論的には、パワーロースペクトルが学習相情報の速度を劇的に加速できることを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:03:41 GMT)
MORN: Metacognitive Object-Goal Regulation for Resource-Rational Long-Horizon Navigation [8.9]
認知科学におけるデュアルプロセス理論にインスパイアされたエグゼクティブアーキテクチャであるMORNを紹介する。潜在指数、永続ゲーティング、エビデンス累積の3つの神経認知状態を定式化することにより、MORNはミッションスケジュールを動的に制御する。このメカニズムは効果的にサンク・コスト・フォールシーを中和し、エージェントはゾンビの目標を早期に中止し、達成可能な目標に決定的にコミットすることができる。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:59:51 GMT)
Stop Starving or Stuffing Me: Boosting Firmware Fuzzing Efficiency with On-demand Input Delivery [8.7]
一般的なソフトウェアは、I/O関数に遭遇して入力を受け取るが、ファームウェアの入力は、ファームウェアの実行と独立して非同期に受信することができる。 FIDOという名前のプロトタイプは、既存のファームウェアファザーのアドオンとして機能し、テストケースのデリバリ効率を向上させる。
論文参考訳（メタデータ） (Sat, 16 May 2026 04:00:17 GMT)
GSMap: 2D Gaussians for Online HD Mapping [8.7]
本稿では,学習可能な2次元表現により両パラダイムを統一する新しいフレームワークであるGSMapを提案する。 nuScenesとArgoverse2の実験では、ガウスに基づく表現が幾何学的および位相的学習を効果的に統一していることが示されている。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:12:41 GMT)
A Red Teaming Framework for Evaluating Robustness of AI-enabled Security Orchestration, Automation, and Response Systems [8.6]
大規模言語モデル(LLM)と強化学習(RL)を統合した,自律的なレッドチーム編成フレームワークを導入する。階層設計では、戦略目的のためのLSMベースのプランナーと戦術実行のためのRLコントローラを組み合わせる。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:46:06 GMT)
Polar probe linearly decodes semantic structures from LLMs [8.4]
本稿では, 要素間の関係が, 埋め込み間の距離と方向によって表されるような, 単純なニューラルネットワークを提案する。我々はこの仮説を多種多様な大言語モデル(LLM)で検証する。その結果,LLMs層活性化の部分空間をターゲットとしたPolar Probeを用いて,真の意味構造を線形に復元できることが示唆された。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:30:02 GMT)
TabPFN-MT: A Natively Multitask In-Context Learner for Tabular Data [8.2]
TabPFN-MTは、タスク間の依存関係をコンテキスト内でキャプチャする前に、拡張されたマルチターゲット合成でトレーニングされる。コンテキスト内学習を頼りにすることで、小規模から中小規模のデータセットに特化している。総合的な精度は4.89で、テストされた全てのモデルの中では最高である。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:02:03 GMT)
MAVEN A Multi-Agent Framework for Multicultural Text-to-Video Generation [7.9]
MAVENはマルチエージェントのプロンプトリファインメントフレームワークである。プロンプトを人、行動、位置の次元に分解する。モノカルチャーとクロスカルチャーの両方のT2V世代における文化的忠実性を改善する。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:01:18 GMT)
CAST: Causal Anchored Simplex Transport for Distribution-Valued Time Series [7.9]
CAST(Causal Anchored Simplex Transport)は,因果文脈から経験的後継者を検索するローカルオペレータである。既約要約のみに依存する予測器が、既約重み付きJensen-Shannon過剰リスク下界を生じさせることを示す。生態、エネルギー、ダイエット、死亡、雇用、大気質、厳しい天候、移動、G/G/1、G_t/G/1待ち行列の11の公的なおよびシミュレーションされたベンチマークにおいて、CASTは1段階のKL (1.27) と自己回帰ロールアウト JSD (1.91) の両方で最高の平均ランクに達した。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:23:09 GMT)
Exploring Lightweight Large Language Models for Court View Generation [7.9]
刑事裁判所ビュージェネレーション(CVG)は、法律人工知能(Legal AI)における重要な課題である CVGにおける軽量(2B未満)大言語モデル(LLM)の機能とその電荷予測への影響について検討する。また、CVGタスク用の3つの公開データセットを含む評価フレームワークであるCVGEvalKitを開発し、料金を予測する。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:44:32 GMT)
VolTA-3D: Self-Supervised Learning for Brain MRI using 3D Volumetric Token Alignment [7.8]
本稿では、転送可能な表現を学習するための3DビジョントランスフォーマフレームワークであるVolta-3Dを提案する。海馬の分節化, 性およびアルツハイマー病の分類, 健康管理に対するVolta-3Dの評価を行った。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:09:25 GMT)
Towards a Foundation Model for the Martian Atmosphere [7.8]
火星の大気は、惑星を取り巻く塵嵐からメソスケールのオーログラフ雲や夜行性低レベルジェットまで、ダイナミックな現象を伴っている。一般的な循環モデルはこれらの現象をシミュレートする能力を示しているが、メソスケールの特徴を解決するのに必要な分解能では計算コストがかかる。これらの制約は、火星大気のデータ駆動基盤モデルの開発を動機付けている。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:37:05 GMT)
1GC-7RC: One Graphic Card -- Seven Research Challenges! How Good Are AI Agents at Doing Your Job? [7.8]
**1GC-7RC*は、言語モデリング、画像分類、セマンティックセグメンテーション、グラフ学習、テキスト分類にまたがる7つのMLタスクのベンチマークである。各タスクは、ベースライントレーニングスクリプトとともに、ロックされたデータ準備および評価スクリプトを提供する。ベンチマーク、ハーネス、すべての評価アーティファクトはGitHubで公開されている。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:35:22 GMT)
A Conflict-aware Evidential Framework for Reliable Sleep Stage Classification [7.7]
マルチモードデータを用いた睡眠段階分類には多視点学習が広く応用されている。既存の手法は通常、異なるモダリティが適切に整合していると仮定するが、現実のシナリオではしばしば達成不可能である。我々は、相互の対立を動的に解決する、競合を意識した明らかなフレームワークConfSleepNetを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:47:59 GMT)
EgoKit: Towards Unified Low-Cost Egocentric Data Collection with Heterogeneous Devices [7.7]
EgoKitは、6つの異種ホストデバイスで同じエゴセントリックな記録ワークフローを公開するツールキットである。付属のアクセサリーは、マウント付きの2台の手首カメラ、ヘッドストラップ、USB-Cハブなど、サポート対象のホストに手首ビューキャプチャを追加する。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:59:17 GMT)
Hi-GaTA: Hierarchical Gated Temporal Aggregation Adapter for Surgical Video Report Generation [7.6]
手術報告生成のための知覚推論フレームワークを提案し, 軽量な時間適応型HiGa-TAを特徴とする。実験により,提案手法は,MLLMベースラインよりも一貫したゲインを達成し,全体的な性能を向上することを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:46:40 GMT)
Sample efficient inductive matrix completion with noise and inexact side information [7.6]
低ランク行列完備化は多くの変種で広く研究されている問題である。帰納行列補完(IMC)は行と列の側情報を組み込んで探索空間を著しく狭める。
論文参考訳（メタデータ） (Sat, 16 May 2026 23:10:10 GMT)
NeuroMAS: Multi-Agent Systems as Neural Networks with Joint Reinforcement Learning [7.2]
マルチエージェント言語システムのためのトレーニング可能でスケーラブルなニューラルネットワークのようなアーキテクチャとしてNeuroMASを提案する。我々は,NeuroMASは推論時間と訓練されたマルチエージェントベースラインの両方で有意に改善することを示した。より大規模なシステムは、スクラッチからトレーニングすることは難しいが、より小さな訓練されたシステムから徐々に成長していくと実現しやすくなる。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:11:34 GMT)
Transformer-Based MCS Prediction for 5G Multicast-Broadcast Services (MBS) [7.1]
ビデオセグメントの水平線上で28のMCS指標が成功する確率を予測する軽量なTransformerベースのフレームワークを提案する。提案手法は信頼性スコア86.89%を達成し、生スループットに最適化された標準AIベースラインを大幅に上回っている。このモデルはリアルタイムアプリケーションに最適化されており、COTS 5G時代のスマートフォン上では0.07ミリ秒未満の推測時間を示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 01:10:55 GMT)
Baba in Wonderland: Online Self-Supervised Dynamics Discovery for Executable World Models [6.9]
本研究では,事前の誤認識下でのオンライン・実行可能世界モデル学習について検討する。我々は、失敗候補更新を構造信号として扱うクローズドループシステムであるAliceを紹介する。アリスはこれらの矛盾を、コンパクトでクラス階層化された保存対例を提供する仮説クラスに洗練する。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:18:22 GMT)
Taming Audio VAEs via Target-KL Regularization [6.9]
テキスト-音声合成におけるターゲット-KL正規化の影響について検討する。最適生成条件を特定する上で,圧縮率のスイーシングが有効であることがわかった。
論文参考訳（メタデータ） (Sat, 16 May 2026 17:01:47 GMT)
Latent Heuristic Search: Continuous Optimization for Automated Algorithm Design [6.9]
この研究は、競合しない風景をナビゲートする継続的発見フレームワークを提案する。我々は、潜微分可能サロゲートの連続埋め込みに埋め込み勾配写像アルゴリズムを用いる。その結果、最適化された実行可能ファイルは、学習されたマッパーを通してソフトプロンプトに投影される。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:03:01 GMT)
GLT-PEFT: Gated Lie-Tucker Parameter-Efficient Fine-Tuning for Alzheimer's Disease Diagnosis with Hippocampal Segmentation Pretraining [6.8]
GLT-PEFTはアルツハイマー病診断のためのゲート型Lie-Tuckerパラメータ効率の良い微調整フレームワークである。提案手法は,海馬セグメンテーション事前訓練されたモデルを下流分類タスクに転送する。 GLT-PEFTは、トレーニング可能なパラメータを著しく低減しつつ、効果的なクロスタスク転送を実現する。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:43:44 GMT)
EVA01: Unified Native 3D Understanding and Generation via Mixture-of-Transformers [6.8]
EVA01はマルチモーダル大言語モデルのモダリティ境界を拡張するフレームワークである。 3Dメッシュの理解、生成、コンテキスト対応編集が組み込まれている。その結果,EVA01は最先端のネイティブテキスト・ツー・3D生成忠実性を実現することがわかった。
論文参考訳（メタデータ） (Sat, 16 May 2026 01:55:03 GMT)
ObjectCache: Layerwise Object-Storage Retrieval for KV Cache Reuse [6.7]
プリフィックスKVキャッシュはLLMサービスにおいて重要なメカニズムとなっている。現在のシステムは、KVキャッシュをリモートDRAMプールに保持し、サービスクラスタのサイズとコストを増大させる。ストレージサーバがKVキャッシュデータをGPUが消費する順番に配信するように,ストレージプロトコルと転送スケジュールを共同設計するObjectCacheを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:48:46 GMT)
Multivariate Decoded Quantum Interferometry for Weighted Optimization [6.5]
量子干渉法 (Quantum Interferometry, DQI) は、特定のMax-LINSAT問題に対して最もよく知られたアナログ時間古典アルゴリズムに比べて、復号化への離散最適化を低減させる。元々の定式化において、DQIはすべての制約を均一に扱い、興味のあるほとんどの最適化問題に存在する重み構造を利用できない。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:46:00 GMT)
FactorizedHMR: A Hybrid Framework for Video Human Mesh Recovery [6.2]
HMR(Human Mesh Recovery)は基本的に曖昧である。本稿では,これら2つの状態の異なる2段階のフレームワークであるFacterizedHMRを提案する。 FactorizedHMRは、カメラスペースとワールドスペースのベンチマークにおいて、強力なベースラインと競合し続けている。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:13:57 GMT)
EmoMind: Decoding Affective Captions from Human Brain fMRI [6.1]
本稿では,fMRI信号から直接情動キャプションを復号する最初のエンドツーエンドパイプラインであるEmoMindを紹介する。 EmoMindはまず、脳でデコードされた視覚的特徴からセマンティックな接地されたニュートラルシーンを検索し、同じfMRI記録からデコードされた34次元の感情ベクトルを用いて書き直します。
論文参考訳（メタデータ） (Sat, 16 May 2026 01:32:45 GMT)
From Real-World Projects to Research-Oriented Learning: Continuous Improvement of a Master-Level Course in Software Engineering Education [6.0]
我々は、応用科学・芸術大学ハノーファー(ドイツ)における情報システムにおける修士課程の研究を行った。このコースは、実践指向のプロジェクトフォーマットから、より明示的に研究指向の学習環境へと進化した。認証プロジェクト、外部コラボレーション、講師サポート、構造化された足場、そして目に見える妥当性は、肯定的な学生の知覚を支持した。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:17:54 GMT)
Observation-Aligned Mask Priors for Learning Physical Dynamics from Authentic Occlusions [5.7]
観測適応マスクプライオリティ(英: Observation-Aligned Mask Priors)は、観測マスクの分布を学習するフレームワークである。この交叉に基づく分割は、すべての有効次元にクエリされる確率が厳密に正であることを示します。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:23:49 GMT)
Metric-Guided Feature Fusion of Visual Foundation Models for Segmentation Tasks [5.5]
大規模視覚基盤モデル (VFM) は、高密度予測タスクのインスタンス認識において、まだ性能が劣っている。本稿では,異なるVFMの相補的特徴を効果的に選択・集約する計量誘導手法を提案する。本モデルでは,複数の高密度な予測タスクに対して,ベースラインと比較して一貫した性能向上を示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:55:41 GMT)
HEED: Density-Weighted Residual Alignment for Hybrid Vision-Language Model Distillation [5.5]
我々はQwen3-VL-8B-インストラクトを3:1のマンバ-2/アテンションハイブリッドに蒸留する。学生モデルは、MMStar、MMBench、MMMU-Proといったビジュアル推論ベンチマークで教師の2ポイント以内に留まる。学生は依然としてシーンを理解できるが、答えるために必要な細かい文章は失われる。通常のポストトレーニングの後、学生は10ベンチマーク平均で4.12$times$スループットで教師レベルのパフォーマンスに達し、128kコンテキストで68%のメモリ節約を行う。
論文参考訳（メタデータ） (Sat, 16 May 2026 17:33:24 GMT)
Thinking with Patterns: Breaking the Perceptual Bottleneck in Visual Planning via Pattern Induction [5.5]
生の視覚入力からのプランニングは、視覚言語モデル(VLM)にとって重要な課題である。我々は、Thinking with Images(TWI)を、徐々に正確な内部世界モデルを構築し、反映するツールとして定式化する。我々は,新しいタスクにおいて,VLMが既知の視覚的パターンを積極的に認識することを可能にする新しいTWI戦略であるPattern Inferenceを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:12:19 GMT)
PluRule: A Benchmark for Moderating Pluralistic Communities on Social Media [5.5]
ソーシャルメディアは多元主義へと移行しつつある。我々は、人間のモデレーターが現実世界でどのように機能するかを反映して、タスクを多重選択問題として定式化する。 PluRuleは、9つの言語で2,885のルールにまたがる1,989のRedditコミュニティで13,371のルール違反を検出するマルチモーダル・マルチ言語ベンチマークである。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:52:11 GMT)
PhysioSeq2Seq: A Hybrid Physiological Digital Twin and Sequence-to-Sequence LSTM for Long-Horizon Glucose Forecasting in Type 1 Diabetes [5.4]
患者固有の生理モデルとシークエンス・ツー・シークエンス(Seq2Seq)LSTMを組み合わせたハイブリッドアーキテクチャであるPhyloSeq2Seqを提案する。それぞれのグルコースセグメントについて、ツインマッチングは300のパラメータ化されたデジタルツインの集団を探索し、最も適した生理的マッチを特定する。 240分の地平線では、PhyloSeq2Seqの平均絶対誤差は39.28mg/dL、平均誤差は10.62mg/dLとなる。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:50:00 GMT)
Pedestrian-Aware LLM-Driven Behavioral Planning for Autonomous Vehicles [5.3]
歩行者対応行動計画のための大規模言語モデル(LLM)に基づく意思決定フレームワーク。システムは、構造化されたシーンの観察を自然言語による推論のプロンプトに変換し、LLMは歩行者の意図を推測し、リスクを予測し、慎重な戦術的な運転決定を生成する。本研究では, 予期せぬ歩行, ターンバック・クロス, ためらい, 双方向横断など, 複数の歩行者行動シナリオにおけるSUMOの枠組みを評価した。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:41:42 GMT)
Coarse Semantic Injection for LLM-Conditioned Structured Indoor Prediction [5.1]
構造化復号化のためのインタフェース保存型セマンティック拡張を提案する。キーとなるアイデアは、セマンティックエビデンスとポイントクラウド表現を関連付けることです。スパースプーリング後のセマンティック・キューを強化するための軽量なルート付きセマンティック・シフト・モジュールを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:28:23 GMT)
Confidence Geometry Reveals Trace-Level Correctness in Large Language Model Reasoning [5.1]
信頼性トラジェクトリは、誤った推論トレースから正解であることを示す。正確性関連情報は推論の尾に富む。本稿では,信頼度評価のための信頼軌道から学習する軽量な推定器であるNeuralConfを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:57:00 GMT)
Scaling Quantum Optimization for Unit Commitment via Pauli Correlation Encoding [5.1]
ユニットコミットメントは、NPhardに分類される電力系統の運用において重要な最適化問題である。本稿では,時間依存制約を伴う単位コミットメント問題に対するハイブリッド量子古典法を提案する。提案手法は, 最大312個のバイナリ変数を持つ小規模および大規模のインスタンスに対して評価し, 競合する運用コストを伴う実行可能スケジュールを確実に生成することを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:30:30 GMT)
Prediction-Intervention Games and Invariant Sets [5.1]
観測データを用いて、リーダーは応答変数$Y$の予測関数を選択する。追従者は、その目的を最大化するために、基礎となる構造因果モデルにおけるいくつかの共変体への介入に反応する。追従対象の2つの共通クラスに対して、安定な毛布に基づく予測器、特定の不変部分集合は、常に因果親に基づくものよりも良いか良いかを証明する。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:15:41 GMT)
Deterministic Decomposition of Stochastic Generative Dynamics [4.9]
本稿では,境界および条件定式化の両方を通して生成力学を学習するためのフローベースフレームワークを提案する。提案手法は,確率輸送における浸透的寄与を調節することにより,解釈可能かつ制御可能なサンプリングを可能にすることを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:38:25 GMT)
Knowing the Rules Is Not Enough: Student Regulatory Awareness and Use of GenAI in Higher Education [4.9]
本研究は,GenAI規制に対する学生の意識が,コンプライアンスと実際の利用行動にどのように関係しているかを考察する。本研究の目的は,コンピュータサイエンス関連研究プログラムの学生における規制知識,GenAI使用,および認識規則適合性との関連性を検討することである。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:53:44 GMT)
CAB: Accelerating Flow and Diffusion Sampling via Rectification and Corrected Adams-Bashforth [4.7]
フローと拡散モデルは高忠実で高解像度の画像合成を実現するが、サンプリング時に多くの機能評価(NFE)を必要とすることが多い。 CAB(Corrected Adams-Bashforth)は,フローモデルと拡散モデルの両方を高速化するトレーニング不要のサンプルシステムである。
論文参考訳（メタデータ） (Sat, 16 May 2026 01:16:18 GMT)
Topo-GS: Continuous Volumetric Embedding of High-Dimensional Data via Topological Gaussian Splatting [4.6]
Topo-GS は 3D Gaussian Splatting (3DGS) を再利用し、メッシュレスボリューム再構成プロセスとして多次元投影を行うフレームワークである。 Topo-GSは離散散乱プロットを連続体積表現に変換することに成功した。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:21:08 GMT)
Mechanism Learning: Prototype-Anchored Mechanism Inference for Scientific Forecasting [4.4]
本稿では,現在活動している局所的なメカニズムを推定することにより,将来の安定性を予測するフレームワークであるメカニズム学習を紹介する。この手法をBurgers dynamics, WeatherBench2, Lorenz96上で評価した。
論文参考訳（メタデータ） (Sat, 16 May 2026 17:22:30 GMT)
ATRACT: A Trustworthy Robotic Autonomous system to support Casualty Triage [4.3]
ATRACT (A Trustworthy Robotic Autonomous System to support Casualty Triage) は、新しい人道支援システムである。ドローンでキャプチャしたビデオとウェアラブルセンサーの入力を統合して、マルチモーダル学習を行い、カジュアルステートアセスメントをサポートする。 ATRACTは、死傷者への直接アクセスが遅れたり、危険があるり、制限されたりするときに、早期の医学的判断を支持する証拠を提供する。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:04:09 GMT)
Visual Timelines of Police Encounters in Body-Worn Camera Footage: Operational Context and Activity Cataloging for Training and Analysis in OpenBWC [4.2]
法執行機関は、大量のボディウーンカメラ(BWC)の映像を蓄積している。本稿では,BWC動画を10秒間の固定長ウィンドウの時系列に処理する方法を提案する。私たちは、CLIPモデルを用いてエンコードされ、ウィンドウレベルの表現に集約された各ウィンドウからサンプリングされたフレームを使用して、2つの軸に基づいてウィンドウを分類するモデルを訓練する。
論文参考訳（メタデータ） (Sat, 16 May 2026 17:45:10 GMT)
Contrastive Conceptor Activation Steering (COAST): Unlocking Vision-Language-Action Models through Hidden States [4.2]
Vision-Language-Action(VLA)モデルは、WebスケールのVision-Language Model(VLM)事前トレーニングから、強力な知覚的事前学習を活用する。これを軽減するために、コントラスト概念活性化ステアリング(COAST)を提案する。 COASTは、目標となるロボットタスクに対して成功クリティカルなサブスペースを特定するために概念を使用する。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:28:21 GMT)
Tensor Channel Equivariant Graph Neural Networks for Molecular Polarizability Prediction [4.1]
分子偏光性テンソルの直接予測のためのテンソルチャネル同変グラフニューラルネットワークを提案する。効率的なPaiNNアーキテクチャに基づいて、明示的な対称階数2テンソルチャネルで隠れ表現を増強する。我々のモデルは、幾何学的に動機付けられたテンソルベースを用いて、メッセージパッシングを通してテンソル構造を伝搬する。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:07:07 GMT)
HalluScore: Large Language Model Hallucination Question Answering Benchmark [3.8]
HalluScoreは、大規模言語モデルにおける幻覚行動を評価するために設計された構造化アラビア語質問応答ベンチマークである。 LLMの幻覚の評価、検出、緩和のための827の精査された質問を含んでいる。われわれは17のアラビア語・多言語・推論LLMの幻覚パターンを包括的に分析した。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:08:15 GMT)
Push and Pull in Community College Cross-Enrollment: Remoteness, Articulation, and Student Mobility [3.7]
地理的リモートネスは、実現可能なクロスインスティテュートモビリティを制約する。信用流動性は、調音として表される入学を惹きつけることがある。遠隔の大学は、より多くの遠隔の大学よりも高い出学率と入校率を示している。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:31:29 GMT)
Retrieval-Based Multi-Label Legal Annotation: Extensible, Data-Efficient and Hallucination-Free [3.6]
パラメトリックエンコーダは通常、ラベルセットの変更時にタスク固有のトレーニングと再トレーニングを必要とする。生成可能な大規模言語モデルは、ラベル空間が大きくなるにつれてコストがかかり、劣化する。我々は,文書とラベル記述を凍結検索モデルに埋め込み,k-アネレスト近傍の埋め込み空間でラベルを予測する。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:40:01 GMT)
Cross-modal Affinity-aligned Multimodal Learning Analytics for Predicting Student Collaboration Satisfaction in Game-Based Learning [3.4]
教育展開において、目視などの個々のモダリティは、学生コホート間で一貫性のない情報性を示す。 Affinity-Aligned Multimodal Learning Analytics フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 04:22:47 GMT)
MIRAGE: Robust multi-modal architectures translate fMRI-to-image models from vision to mental imagery [3.2]
MIRAGEは、視覚データセットをトレーニングし、脳の活動からメンタルイメージをクロスデコードするように設計された方法である。我々は,デコーダが画像特徴を比較的少ない次元で使用する場合に,心的イメージ再構成が最適であることを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 23:53:43 GMT)
PopuLoRA: Co-Evolving LLM Populations for Reasoning Self-Play [3.1]
PopuLoRAは、検証可能な報酬を伴う強化学習のための、人口ベースの非対称なセルフプレイフレームワークである。本稿では,Absolute Zero Reasoner上でPopuLoRAをインスタンス化し,Absolute Zero Reasonerの計算整合単一エージェントベースラインと比較する。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:29:35 GMT)
DiRotQ: Rotation-Aware Quantization for 4-bit Diffusion Transformers [3.1]
Diffusion Transformer (DiTs) は最先端の画像生成品質を実現するが、推論時にかなりのメモリと計算コストを発生させる。平滑化法、混合精度法、回転法、低ランク残差法などの既存の手法は、この問題を部分的に緩和するが、それでもFP16/BF16の性能に顕著なギャップを残している。本稿では、回転認識型アクティベーション量子化による劣化を緩和するW4A4 PTQフレームワークであるDiRotQを紹介する。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:52:00 GMT)
Exact nonequilibrium steady states of boundary driven circuit with XYZ gates [3.1]
我々は空間的に不均一な行列積 Ansatz を用いて境界駆動型XXZ量子回路の正確な多体密度演算子を得る。比較的頑健な分離性キラル非平衡定常状態(NESS)の族を発見し、記述する。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:37:11 GMT)
NeuroLiDAR: Adaptive Frame Rate Depth Sensing via Neuromorphic Event-LiDAR Fusion [3.0]
適応型深度検知フレームワークであるNeuroLiDARは,最大で66Hzのフレームレートを実現する。我々は,NeuroLiDARが27.8～47.3Hzの適応フレームレートを実現しつつ,RMSEの深さ再構成誤差を$approx$29%削減することを示した。
論文参考訳（メタデータ） (Sat, 16 May 2026 04:21:59 GMT)
Exact Entanglement-Depth Speed Frontier for Complete Quantum Charging [2.9]
我々は、純粋状態の深さ制限された速度問題に答える。時間に依存しないハミルトニアンの下での閉(N)量子ビット電池(ケタドロー時間N)から(ケタドロー時間N)へと進化するためには、純粋状態の深さ制約された速度問題を解く。
論文参考訳（メタデータ） (Sat, 16 May 2026 11:08:17 GMT)
Financially Guided Deep Portfolio Optimization [2.9]
我々は、主要な金融指標の差別化可能なサロゲートを直接最適化するエンドツーエンドフレームワークを提案する。当社のフレームワークは,同種のポートフォリオ,S&P 500,従来の手法を一貫して上回ります。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:30:15 GMT)
The IsalProgram Programming Language [2.9]
アセンブリのような新しいプログラミング言語IsalProgramを紹介します。形式言語論における正規言語である。命令アルファベット上のすべての有限文字列は構文的に有効なプログラムである。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:08:32 GMT)
Spectral geometric mean and trace characterizations [2.9]
正線型汎函数 $$ on $mathbbM_n$ がトレースの正の倍数であることと、すべての正定行列に対して$(A natural B) leq sqrt(A) (B)$ であることとを特徴付ける。また、全ての正の定値行列に適用する量子忠実度に関連するトレース不等式を示し、それがトレースを特徴づけないことを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 21:33:16 GMT)
Leveraging Multimodal Self-Consistency Reasoning in Coding Motivational Interviewing for Alcohol Use Reduction [2.8]
コーディング面接(MI)セッションは、クライアントの振る舞いを理解し、結果を予測するのに不可欠です。音声モデル(ALM)の最近の進歩は、行動信号をキャプチャしてMIコーディングを自動化する新しい機会を提供する。本研究は,複数の推論軌道からの予測をキャプチャーし,MIの自動符号化手法を開発することを目的とする。
論文参考訳（メタデータ） (Sat, 16 May 2026 04:00:00 GMT)
Closing the Gap at CRAC 2026: Two-Stage Adaptation for LLM-Based Multilingual Coreference Resolution [2.7]
本稿では,2026年度のコンピュテーショナル・モデル・オブ・リファレンス・アナフォラ・アンド・コアス・タスクについて紹介する。公式テストセットの平均CoNLL F1スコアは74.32で,LLMトラックで1位,総合3位にランクインした。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:07:07 GMT)
Weighted Flow Matching and Physics-Informed Nonlinear Filtering for Parameter Estimation in Digital Twins [2.6]
デジタルツイン(DT)は物理システムとその仮想システム間の連続的な同期に依存している。重み付きフローマッチング(WFM)生成モデルと物理インフォームド非線形フィルタリングを統合した新しい数学的枠組みを開発した。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:31:29 GMT)
Multi-task Linear Regression without Eigenvalue Lower Bounds: Adaptivity, Robustness and Safety [2.5]
汚染タスクの存在下でのマルチタスク線形回帰問題について検討する。我々は、各タスクの第2モーメントと平均不整合幾何を比較し、バランス性定数によって定量化された相対的バランス性条件を導入する。本手法は, タスク類似性, オフレイアに対するロバスト性, および良好な転送条件外における安全性の同時適応性を実現する。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:06:54 GMT)
Emulating the Forced Response of Climate Models with Flow Matching [2.4]
共有社会経済パス(Shared Socioeconomic Pathways)は、世界経済と人口統計学の発展の様々なシナリオを記述している。これらのSSPは、本来は気候変動の強制的な変化と結びついている。気候モデルの実行は非常に計算コストが高い。近年の研究では、機械学習を用いて気候モデルダイナミクスを捉える能力が実証されている。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:54:35 GMT)
A Systematic Survey on Deep Learning Architectures for Point Cloud Classification and Segmentation [2.4]
ポイントクラウドは、その単純さと幾何学的忠実さのために、3Dの形状とシーンを表現するために最も広く採用されているフォーマットである。その本質的に秩序のない不規則な性質は、センサーノイズと閉塞によって悪化し、機械学習ベースの方法論に固有の課題をもたらす。私たちの焦点は、ポイントクラウド分類、パートセグメンテーション、セマンティックセグメンテーションという、3Dビジョンにおける3つの基本的なタスクのためのディープラーニングモデルに向けられている。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:37:41 GMT)
TRACE: Evidence Grounding-Guided Multi-Video Event Understanding and Claim Generation [2.3]
マルチビデオイベント推論のためのエビデンス基盤フレームワークであるTRACEを紹介する。提案手法はまず,OCRとオブジェクト検出を用いて,ビデオ毎に構造化されたテキスト検索可能なタイムラインを構築する。テキストのみのLLMはクエリ対応のエビデンスローカライゼーションを実行し、ダウンストリームの視覚的推論に先立って関連するモーメントを選択する。
論文参考訳（メタデータ） (Sat, 16 May 2026 01:37:10 GMT)
Sparse Mamba Decoder for Quantum Error Correction: Efficient Defect-Centric Processing of Surface Code Syndromes [2.3]
フォールトトレラントな量子コンピュータを構築するには量子エラー補正が不可欠である。ほとんどのデコーダは精度が高いが、実際のエラー率に関係なく、$O(d2 R)$regard of size $O(d2 R)の完全な高密度シンドロームアレイを処理している。我々は,k個のアクティブ検出イベントのみを処理する欠陥中心型ニューラルデコーダであるSparse Mamba Decoder (SMD)を紹介した。
論文参考訳（メタデータ） (Sat, 16 May 2026 21:01:29 GMT)
Brain Vascular Age Prediction Using Cerebral Blood Flow Velocity and Machine Learning Algorithms [2.3]
経頭蓋ドプラ (Transcranial Doppler, TCD) は、ヒトの脳に供給される主要な動脈に沿って脳血流速度を測定する方法である。本研究の目的は、TDから抽出した特徴を用いて、時系列年齢を推定し、様々な脳疾患の患者において、加速度的老化を評価することである。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:43:32 GMT)
AnchorDiff: Topology-Aware Masked Diffusion with Confidence-based Rewriting for Radiology Report Generation [2.3]
医用画像から臨床的に正確なテキストレポートを自動生成することを目的とする。既存の手法は自己回帰(AR)言語モデルに依存しており、因果依存性構造は生成を一方向の左から右へのプロセスに制限する。本稿では,知識グラフに基づく臨床アンカーを拡散言語モデリングに統合したRRGのための最初のマスク付き拡散フレームワークであるAnchorDiffを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:42:43 GMT)
Learning Gaussian Graphical Models under Total Positivity via Spectral Graph Sparsification [2.0]
スペクトルスペーシフィケーションを用いたデータからガウス図形モデルを学習する手法を提案する。我々は、スペクトル-MTP2が、より密度の高いMTP2ベースラインの適合性の大部分を維持しつつ、実質的にスペーサーで解釈可能なグラフを生成することを示した。エクイティリターンと遺伝子発現へのシミュレーションおよび応用において、スペクトル-MTP2はMTP2ベースラインの適合性の大部分を保持しつつ、実質的にスペーサーとより解釈可能なグラフを生成する。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:59:06 GMT)
HyDRA: Hybrid Dynamic Routing Architecture for Heterogeneous LLM Pools [2.0]
我々は,クエリ毎の細粒度,多次元能力要件を予測するフレームワークHyDRAを提案する。ショートフォールマッチングアルゴリズムは、予測された要求を満たす機能を持つ最も安価なモデルを選択する。このフレームワークは、GitHub CopilotのVS Code Chat自動モードのすべてのユーザにデプロイされる。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:19:30 GMT)
Low-Code Paradox in DevOps: Security and Governance Insights from Practitioners [1.8]
低コード開発プラットフォーム(LCDP)は、ソフトウェア開発の合理化にますます採用されている。利用が増えているにもかかわらず、セキュリティとガバナンスのためにこれらのプラットフォームがもたらす意味について、十分な注意が払われている。本研究では,DevOps環境におけるLCDPのセキュリティとガバナンスの影響について,実践者の視点から検討する。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:47:34 GMT)
RAGA: Reading-And-Graph-building-Agent for Autonomous Knowledge Graph Construction and Retrieval-Augmented Generation [1.7]
RAGA(Reading And Graph-building Agent)は、自律的な知識グラフの構築と検索のためのフレームワークである。完全なKGライフサイクルCRUD操作を提供し、Read-Search-Verify-Verify認知制約をReActツールループに埋め込む。 QASPERの科学QAデータセットのサブセットに関する予備実験は、RAGAの融合検索がゼロショットベースラインを上回っていることを示している。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:42:50 GMT)
Some[Body] Must Receive That Pain for Agent Accountability [1.6]
AIエージェントは、現実の世界において、次々と行動する。継続するエージェントは、将来の振る舞いを変える方法で結果を受け取りません。このようなアーキテクチャが存在するまで、高度なAIデプロイメントは、説明可能な人間のプリンシパルと結びついなければならない。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:24:06 GMT)
Charon: A Unified and Fine-Grained Simulator for Large-Scale LLM Training and Inference [1.5]
Charonは、LLMの性能を正確に予測するための、統一的でモジュラーできめ細かなシミュレータである。実験では、Charonは異なるモデルと構成で高い精度を達成しており、全体的な予測誤差は5.35%以下である。実践的な推論デプロイメントのケースでは、Charon氏は、エンジニアリングチューニングされたベースラインよりもシステムのスループットを向上させる構成を発見し、その重要な実世界の価値を明らかにした。
論文参考訳（メタデータ） (Sat, 16 May 2026 21:28:22 GMT)
SSTL: Self-Sensing Tendon Loop for Hysteresis Modeling and Compensation in Tendon-Sheath Mechanisms [1.5]
腱せん断摩擦と腱弾性は運動入力と遠位出力の系統的な相違を誘導する。本稿では、挿入管を貫通し遠位滑車に巻かれた二重パス腱ループである自覚腱ループ(SSTL)を提案し、近位端に戻す。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:18:25 GMT)
ACIL: Auto Chain of Thoughts for In-Context Learning [1.4]
In-Context Learning(ICL)を改善するためのAuto-CoT(Auto-Chain-of-Thought)フレームワークを提案する。 Auto-CoTは、入力出力例の推論チェーンを生成し、構造化中間説明でプロンプトコンテキストを強化し、無関係または低品質なデモを除去する。複数の推論タスクにまたがる実験により、提案するフレームワークは、明確な中間推論ガイダンスを提供することで、ICLの性能を向上させることが示された。
論文参考訳（メタデータ） (Sat, 16 May 2026 17:10:13 GMT)
Smart Contract Security Beyond Detection [1.4]
本論文は,4方向を中心に,キャップストーンを指向した研究談話を開発する。これらの方向には、セマンティック推論、自動修復、敵の堅牢性、リアルタイムなエクスプロイト検出が含まれる。このフレームワークは、学生が技術的基盤を持ち、実証的に測定可能で、現代のスマートコントラクトセキュリティ研究と整合したプロジェクトを定式化することを目的としている。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:49:41 GMT)
Soft Learning [1.4]
ソフトラーニング(Soft Learning)は、異種専門家のライブラリを維持するフレームワークである。 CPU単独でディープネットワークよりも2桁以上高速にトレーニングする。タスクの70%にランク付けし、最高の平均ランクを獲得し、分類と回帰の両方で同時に最適化する唯一の方法である。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:14:44 GMT)
Encoding Robust Topological Signatures for Hyperdimensional Computing [1.4]
トポロジ誘導型HDコンピューティングは, 単純なHDベースラインに比べてロバスト性を大幅に向上することを示す。クリーンなデータに基づいて訓練されたコンパクトなCNNと比較して,本手法は,いくつかの画素レベルの破損に対して極めて強い堅牢性を提供しながら,競合するクリーンな精度を実現する。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:36:40 GMT)
A Joint Synthetic Housing-Household Inventory [1.3]
世帯レベルでの詳細な住宅構造と人口動態を共同で捉えた高忠実度データセットは現存していない。本稿では,個人と世帯を両立住宅ユニットに明示的に結びつける共同住宅在庫構築の枠組みについて述べる。結果として得られた在庫は、災害時のレジリエンス計画、住宅および価格分析、エネルギー利用評価、公衆衛生研究など幅広い応用をサポートしている。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:58:44 GMT)
From Constraint to Code: DQI-Kit -- A Software Framework for Decoded Quantum Interferometry [1.2]
量子技術による厳密な最適化問題を解くためには、選択された量子アルゴリズムと互換性のある形式にドメインの目的と制約を変換する必要がある。これはしばしば、現在および将来のアプローチに対する潜在的な量子優位性を制限するか、あるいは危険に晒す非効率性とオーバーヘッドをもたらす。制約付き最適化問題を自動的にMax-LINSATにエンコードするための統一インターフェースを提供するソフトウェアフレームワークであるDQI-Kitを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:14:30 GMT)
UCSF-PDGM-VQA: Visual Question Answering dataset for brain tumor MRI interpretation [1.1]
脳腫瘍の診断はMRI(MRI)の評価に大きく依存している。放射線学の需要が増えているにもかかわらず、この専門知識は拡張が困難であり、現在の健康システムに支障をきたす。 VLM(Vision-Language Models)は、複雑な脳MRIを半自動でインタラクティブに解釈することで、この負担を軽減する機会を提供する。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:10:19 GMT)
Multi-Prover Interactive Proof Systems with Leakage [1.1]
本稿では,プロデューサ間の通信が許されるが境界づけられた設定にアプローチする2つの手法を提案する。任意の$p$に対して、$mathsfNEXP$と$mathsfRE$に対して$mathsfMIPast$と$mathsfMIPast$プロトコルを構築することができる。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:56:53 GMT)
AIM: Adversarial Information Masking for Faithfulness Evaluation of Saliency Maps [1.0]
ポストホックサリエンシ法はディープニューラルネットワークの解釈に広く用いられている。既存の評価では、サリエンシによって引き起こされる特徴の順序と性能劣化を測定する。本稿では,サリエンシマップの忠実度とマスキング操作者の信頼性の両方を評価するために,サリエンシ誘導型機能代替フレームワークであるAdrial Information Masking (AIM)を提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:36:58 GMT)
Markerless Motion Capture for Biomechanical Whole-Body Kinematic Estimation in Infants [0.9]
本研究は,多視点モーションキャプチャーシステムを用いて記録された8人の幼児の13セッションについて,100ビデオの3つのポーズ推定フレームワークを体系的に評価した。提案手法は,再投射誤差,幾何整合性,Procrustesの3次元位置誤差を用いてキーポイント検出精度を定量化し,逆運動フレームワークを幼児データに適用するための概念実証を行った。本稿では, SAM 3D に適合する生体力学的モデルを用いて, 運動発達に関連する乳児の代表的運動パターンを, 臨床専門家が特定した事例比較例で示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:55:06 GMT)
Universal Dynamics of Punctuated Progress [0.9]
9つの異なるドメインにわたるフロンティアの進化を追跡するデータセットを分析します。 1)新しいフロンティア間の待ち時間は重く、ほとんどの試みは長周期に集中している; 2)フロンティア記録は線形成長よりも速いが対数的に速く蓄積されている;(3)記録を破る出来事は時間的に相関しており、短期的に予測可能であるが、長期的な予測不可能が生じる。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:07:38 GMT)
Ready from Day 1: Population-Aware Coordination for Large-Scale Constrained Multi-Agent Systems [0.8]
そこで我々は,小集団の要約に条件付き原始マップと双対マップを学習する,親和性を考慮した協調インタフェースを提案する。人口認識インタフェースは、人口認識ベースラインと比較して予測誤差を16～19%減らし、容量違反を20～51%減らした。また、バックテスト可能なプロシージャとして2Real Simトランスファーをキャストし、デプロイ前に評価を可能にします。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:36:49 GMT)
Random Access Code protocols: Quantum advantage related to intraparticle entanglement-based contextuality [0.8]
本研究では、量子エンハンスメントを達成するために、単一粒子の2つの共測定可能な自由度間の絡み合いについて検討する。特に、量子$n の 1$ RAC プロトコルの最大成功確率は、関連するベル型不等式に対する最大量子違反に対応する。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:35:44 GMT)
Dynamics of collective creativity in AI art competitions [0.7]
Artbreederは毎日の"リミックスパーティー"を開催し、ユーザーは1つのシードイメージから互いの作品を反復的に構築する。我々は13ヶ月で368のリミックスパーティーから130,882枚の画像のデータセットを分析し、画像がよりシンプルになり、一般的なテーマの「トラクター」へと収束することを発見した。また、より斬新な「親」画像はより斬新で複雑な「子供」を惹きつけるのに対し、ユーザーはパラドックス的に、より斬新で複雑な画像のリミックスを好む。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:16:31 GMT)
Not Just RLHF: Why Alignment Alone Won't Fix Multi-Agent Sycophancy [0.7]
事前訓練されたベースモデルは、インストラクトの変種と同じ置換パターンを示し、インストラクトよりも高い収率を平均化する。このウィンドウの上のパッチは、クリーンにプレッシャーされたP(正しい)ギャップの96%を復元する。 2つの凝縮活性化空間介入は、新しいサイコファンシー回路を活性化するのではなく、圧力がクリーンな推論特性を抑制することを示している。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:42:13 GMT)
When Bits Break Recourse: Counterfactual-Faithful Quantization [0.7]
我々は、妥当性、コスト、方向安定性を通じて、量子化の下での対実感度を定式化する。本稿では, 量子化器パラメータと混合精度ビット割り当てを訓練し, 対物行動の保存を行うCFQを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 21:19:31 GMT)
"I'm Not Mad, Just Focused'': Understanding Human Emotions in Human-Robot Collaboration [0.6]
ヒューマンロボットコラボレーション(HRC)のための視覚言語モデル(VLM)に基づく感情認識システムを提案する。我々はまず,既存のHRCデータセット上の人間のアノテーションと,その意味的・感情的類似性を評価することで,VLM-ERシステムの評価を行った。協調配送作業におけるサービスロボットを用いたユーザスタディでは,VLM-ERシステムによって推定されるユーザの感情状態に基づいて,ロボットの動作を調節する効果を評価する。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:18:22 GMT)
ARES-LSHADE: Autoresearch-Enhanced LSHADE with Memetic Polish for the GNBG Benchmark [0.5]
本稿では,ALS-LSHADEについて述べる。ALS-LSHADEは,LLMの設計した進化アルゴリズムに関するGECCO 2026コンペティションに提出された,メメティックな微分進化変種である。このアルゴリズムはLLM-LSHADE 2025の勝者の上に構築され、2つの新しいコンポーネントに貢献した。結果、アルゴリズムは24の関数全てを自明に解決したが、競合のブラックボックスルールに違反した。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:18:24 GMT)
Learning Relative Representations for Fine-Grained Multimodal Alignment with Limited Data [0.5]
本稿では,相対表現を用いてトークンレベルのクロスモーダル構造を学習するポストホックアライメント手法を提案する。提案手法は, ゼロショット分類, クロスモーダル検索, ゼロショットセグメンテーションにおいて, 既存の手法より一貫して優れている。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:33:38 GMT)
A Global-Local Graph Attention Network for Traffic Forecasting [0.5]
本稿では,ペアエンコーディングとイベントベースの隣接行列を用いたGlobal-Local Graph Attention Network (GLGAT)を提案する。 2つの実世界の交通データセットの実験により、GLGATは相関時間相関を効果的に捉えることができることが示された。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:28:59 GMT)
Effort as Ceiling, Not Dial: Reasoning Budget Does Not Modulate Cognitive Cost Alignment Between Humans and Large Reasoning Models [0.4]
大きな推論モデルは、認知タスク全体で人間の反応時間を追跡するチェーンオブ思考のトレースを生成する。このアライメントが推論時間推論の努力と異なるかどうかをテストする。トレーニングタイムの達成、LRMと人間の間の認知的コストの調整は、トレーニングタイムの達成のように見える。
論文参考訳（メタデータ） (Sat, 16 May 2026 11:20:01 GMT)
Principal Component Analysis for Lunar Crater Detection [0.4]
本稿では,クレーター標高図の主成分分析に基づく自動クレーターテンプレート生成手法を提案する。シミュレーション画像上で手書きテンプレートと比較して優れた検出と位置推定性能を示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:06:23 GMT)
DriveSafer: End-to-End Autonomous Driving with Safety Guidance [0.4]
DriveSaferは、エンド・ツー・エンドのプランナのためのフェール・アウェア・セーフティ・フレームワークである。トレーニング時の安全制約と推論時の安全ガイダンスの両方を活用する安全行動に向けて、プランナーを指導する。破滅的な障害の数を48%減らし、乾燥可能な領域のコンプライアンス障害の65%以上を減らした。
論文参考訳（メタデータ） (Sat, 16 May 2026 01:21:30 GMT)
Diffusion-Based Stochastic Operator Networks for Uncertainty Quantification in Stochastic Partial Differential Equations [0.3]
偏微分方程式(SPDE)に関連した解演算子の不確実性定量化のための新しい枠組みを導入する。提案手法は,Deep Operator Network (DeepONet) の構造とニューラルネットワーク (SNN) を組み合わせることで構築される。複数の不確実性源下でのベンチマークSPDEの数値実験により,提案手法の精度とロバスト性を示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:19:45 GMT)
Beyond Safety Filtering: Control Barrier Function-Informed Reinforcement Learning for Connected and Automated Vehicles [0.2]
強化学習(Reinforcement Learning, RL)は、学習のガイドに報酬を使用するが、報酬設計は通常、チューニングが難しい手作りの使用である。共同MARL動作下でのCBF制約値を、安全学習を明示的に導く報酬信号に変換する多エージェント(MARL)のための制御バリア(CBF)インフォームド報酬設計を提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:12:59 GMT)
Emergence of a Flow-Assisted Casting Strategy for Olfactory Navigation via Memory-Augmented Reinforcement Learning [0.2]
メモリ長やフロー条件の異なる非定常流れにおける強化学習(RL)エージェントのナビゲーション性能について検討する。臭源への平均速度は、メモリ長に非単調な依存を示すが、これは「セクター探索」モデルで説明できる。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:32:48 GMT)
Global Automation Atlas [0.1]
我々は、世界中の自動化露光を分類するためのタスクベースおよび国固有のアプローチを開発した。我が国は124か国にまたがっており、世界の人口の99%、GDPをカバーする経済のタスク国ラベルは2億33300万となっている。
論文参考訳（メタデータ） (Sat, 16 May 2026 17:01:59 GMT)
Generative AI Feedback, English Writing and Teacher Rubrics: A Multiple-Case Study of CyberScholar [0.1]
調査では、米国中・高校5校を対象に、143人の学生と7年生から11年生の5人の教師が対象となった。学生はCyberScholarの即時的でルーリックなフィードバックを高く評価し、書き直しの際の改善に気付きました。しかし、参加者は自動評価システムの不整合と、時には課題の期待との不一致を指摘した。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:55:39 GMT)
Representation Signatures and Risk-Feedback Alignment in LLM Trading Agents [0.1]
金融決定環境における大規模言語モデル(LLM)エージェントの行動アライメントと表現ダイナミクスについて検討する。提案手法では, プレドローダウン状態とは別個に, 正規状態のセントロイドからの埋め込み, 融合した計画リスク表現, および, 故障前の有効ランク収縮を示す。また、構造的リスクフィードバックは微調整なしで外部アライメント信号として機能するが、普遍的な性能向上にはならない。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:53:34 GMT)
Efficient Hamiltonian Engineering for Adiabatic MIS Algorithms [0.1]
本稿では、Rydberg atom array を用いた最大独立集合(MIS)のハイブリッド断熱アルゴリズムを提案する。グラフノードを小さな次数で表現する、隣人が少ない原子を優先的に励起する局所制御を設計する。
論文参考訳（メタデータ） (Sat, 16 May 2026 11:50:17 GMT)
CAM-VFD: Cross-Attention Multimodal Video Forgery Detection [0.0]
本稿では,CAM-VFDを提案する。このフレームワークは、CLIPベースの外観表現がビデオMAEモーション機能に対するクエリとして機能する、クロスアテンション融合機構を使用している。 2つの世代別ビデオベンチマークの結果、GenVidBenchの95.31%の精度、93.43%の精度、90.63%のF1スコア、96.56%のAUROCが一貫したパフォーマンスを示している。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:46:33 GMT)
quantum-safe: Bridging the Post-Quantum Production Gap with a Hybrid-by-Default Python Cryptography Library [0.0]
量子セーフ(quantum-safe)は、量子後暗号における3つの重要なギャップを全て埋めるPythonである。 9つのPQCライブラリを8つの生産レベルディメンションでスコア付けします。完全なX25519 + ML-KEM-768ハンドシェイクはDocker/Linuxで243秒で完了する。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:05:11 GMT)
Voices in the Loop: Mapping Participatory AI [0.0]
人工知能への参加的アプローチは、公的な、市民的、人道的な設定でますます文書化されている。本稿では,オープンリポジトリの構築と参加型AIイニシアチブの対話的アトラスについて報告する。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:07:34 GMT)
Truncated-Binary Encoding: Spectral Degree Reduction of Combinatorial Optimization Problems for Quantum Hardware [0.0]
Exact-バイナリ符号化は、離散コスト関数ネットワーク(CFN)を高階非制約バイナリ最適化(HUBO)問題にコンパイルする。本稿では,Ising-basis monomials が選択したカットオフ$k_textmax$ を超えるような完全バイナリエンコーディング(TBE)の修正を,符号化コストから落として提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:27:06 GMT)
Translation symmetry-enforced long-range entanglement in mixed states [0.0]
翻訳対称性は対称短距離エンタングルド(SRE)固有状態(英語版)(symmetric short-range entangled (SRE) eigenstates)を許容するが、そのようなSRE固有状態が零運動量セクターにまたがるほど不十分であることを示す。これは、長距離連結相関関数によって検出できない混合状態における長距離絡み合いの微妙な形式である。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:15:50 GMT)
Training-Free Occluded Text Rendering via Glyph Priors and Attention-Guided Semantic Blending [0.0]
本稿では,事前学習したFLUX.1-devバックボーンを用いたテキストレンダリングのためのトレーニングフリーフレームワークを提案する。このタスクは、認識可能なタイポグラフィーを描画し、対象とするテキスト領域に隠蔽オブジェクトを置くモデルを必要とする。そこで本研究では,オクルーダー挿入からテキスト保存を分離する2重ストリーム推論フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 04:58:07 GMT)
Towards Human-Level Book-Writing Capability [0.0]
本報告では,書籍スケールのクリエイティブ・ライティングのためのデータセット構築とトレーニングのフレームワークを提案する。我々は,各書籍を段階的に細かなレベルで要約することで,多段階の計画足場を導出する。そして、トレーニング中にこの階層を反転させます。モデルは、プロンプトをより詳細な計画へと拡張し、最終的にオリジナルの人間による書籍テキストへと拡張することを学びます。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:10:41 GMT)
The Payment Heterogeneity Index: An Integrated Unsupervised Framework for High-Volume Procurement Oversight and Decision Support [0.0]
本稿では,1次元サンプルの複合統計量である構造異質度指数(SHI)とその支払い固有インスタンス化である支払い異質度指数(PHI)を紹介する。 4つの解釈可能な成分(モジュラリティ、非対称性、尾の挙動、構造的分散)が組み込まれている。英国の自治体の調達データに適用されるPHIは、構造的に異なる支払いパターンを持つ経済的に重要なコホートを識別する。
論文参考訳（メタデータ） (Sat, 16 May 2026 17:17:11 GMT)
The Geometry of Projection Heads: Conditioning, Invariance, and Collapse [0.0]
自己教師型学習における投影頭部の幾何学的理論を開発する。線形ヘッドが暗黙的な部分空間白化を行うのに対し、非線形ヘッドは局所的なメトリクスを適応させ、損失の特定の位相的制約を満たすことを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:32:05 GMT)
The Extremum Stack is a Minimal Sufficient Statistic for Rate-Independent Functionals: A Kolmogorov Complexity Characterisation [0.0]
離散列の極限スタックは、計算可能で因果的、レート非依存な函数のクラスに対する最小統計量であることを示す。結果から示唆されるスタックベースの圧縮アルゴリズムは、コルモゴロフの最適性を保証する。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:21:37 GMT)
Statistical Hand Shape Modeling from Clinical CT Scans Using Deep Learning and Implicit Skinning [0.0]
本研究では, 1,271 elbow-to-hand (e2h-CT) CTから手解剖を抽出・解析するためのAI支援再建パイプラインを提案する。 Pix2Pixベースの条件生成対向ネットワークは、まず、CTボリュームからプラスターキャストとバックグラウンドアーティファクトを除去するために使用される。分割された骨メッシュは骨格の表現を構築するために使用され、暗黙のスキニングによってすべてのハンドモデルを標準化された解剖学的構成に整列させることができる。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:00:34 GMT)
Stable minimum principles for scattering states [0.0]
散乱状態に対する安定な最小原理の族を示す。これらの最小原理をほぼ満たす状態は、真の散乱状態と有界な差を持つことが示されている。これらの最小原理は運動量依存ポテンシャル、長距離(クーロン)相互作用、および境界状態の弾性あるいは非弾性散乱に適用可能であることを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:07:24 GMT)
Simple Power Analysis on Post-Quantum Code Based Cryptosystems [0.0]
ポスト量子暗号は、現在の暗号方式を量子コンピュータからの攻撃に耐性があるものとして置き換えようとしている。 McEleiece と Bit Flip Key Encapsulation (BIKE) は、符号化理論に基づく2つの楽しい代表である。本稿では, 簡易電力解析(SPA)を用いて, カプセル化段階で重要な情報漏洩の有無を評価する。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:48:41 GMT)
Scale Determines Whether Language Models Organize Representation Geometry for Prediction [0.0]
言語モデルでは、表現が符号化したものはその表現空間の幾何学によって決定される。層間距離構造が非埋め込み行列$W_U$の読み出し部分空間と整合するかどうかをテストする計量であるSubspace PGAを導入する。
論文参考訳（メタデータ） (Sat, 16 May 2026 17:01:17 GMT)
STRIDE-AI: A Threat Modeling Framework for Generative AI Security Assessment [0.0]
我々は,高レベルリスク標準(NIST AI RMF)と技術的脆弱性のギャップを埋めるフレームワークであるtextitSTRIDE-AIを提案する。このフレームワークは6フェーズのアセスメントライフサイクルを定義し、AIシステムのための古典的STRIDEの脅威モデリング適応を導入し、目的とするWebツールを通じて運用する。
論文参考訳（メタデータ） (Sat, 16 May 2026 21:27:23 GMT)
SADP: Subgoal-Aware Diffusion Policy for Explainable Robots Learned from Foundation Model Generated Demonstrations [0.0]
サブゴール・アウェア拡散政策(SADP)は、人間の解釈可能なサブゴールを囲む政策実行を構成する。軽量補助ヘッドは、サブゴール完了状態を予測し、ロボットが現在の実行段階を公開する。 UR5eロボットを用いたRLBenchシミュレーションと実世界の評価実験により,SADPがより高いタスク成功率を達成することを示した。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:18:47 GMT)
S-Bus: Automatic Read-Set Reconstruction for Multi-Agent LLM State Coordination [0.0]
変更可能な自然言語状態を共有する並行エージェントは、構造的人種条件を生成する。既存のマルチエージェントフレームワークは、共有状態に対する書き込み所有のセマンティクスを提供しない。サーバサイドのDeliveryLogが中心となるHTTPであるS-Busを提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:46:27 GMT)
Response-free item difficulty modelling for multiple-choice items with fine-tuned transformers: Component-wise representation and multi-task learning [0.0]
応答のないアイテムの難易度モデリングは、応答ベースのキャリブレーションへの依存を減らすことを約束する。アイテムワードのエンドツーエンドのトランスフォーマーエンコーダを微調整する。この共同符号化手法の2つの拡張が提案されている。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:22:57 GMT)
Reconsidering "Reconsidering Custom Memory Allocation" [0.0]
25年前、Bergerらは、クラスごとのアロケータが最先端の汎用アロケータに対して大きなスピードアップを提供していないことを示した。本稿では,現代の汎用アロケータによる最新のハードウェアプラットフォーム上での作業について,その結論がまだ成立しているかどうかを評価する。メモリ断片化が汎用アロケータの局所性に及ぼす影響を探索する手法を提案する。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:52:50 GMT)
RTI-Bench: A Structured Dataset for Indian Right-to-Information Decision Analysis [0.0]
本稿では、結果ラベル、除外引用、IRACスタイルの推論コンポーネント、手続き的タイムラインを含むCIC決定の構造化データセットであるRTI-Benchを紹介する。私たちの知る限りでは、インドにおけるRTI管理上の決定のための構造化データセットとして初めて公開されています。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:02:10 GMT)
Quantum Optical Soliton Dynamics Beyond Linearization: An Open-System Approach [0.0]
我々は、光学的$(3)$ソリトンの量子力学をモデル化するための2つのアプローチを紹介する。数値シミュレーションを用いて量子誘起ソリトン相シフトを効果的に捉える。また、超短パルスによる高次分散の存在下で発生する放射線についても検討し、古典理論と整合した光子損失を予測するMEを導出した。
論文参考訳（メタデータ） (Sat, 16 May 2026 14:53:56 GMT)
Prediction Is Not Physics: Learning and Evaluating Conserved Quantities in Neural Simulators [0.0]
ハミルトン軌道で訓練された拡散モデルでは、MSEを10～3ドル近くロールアウトすることができるが、時間とともにエネルギーの標準偏差は、地上標準偏差の7500～36000倍であり、保存法則の維持に失敗したことを示している。ハミルトン系の3つの系(投射運動、振り子、ばね質量)にまたがってこれを調査する。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:23:41 GMT)
PaliBench: A Multi-Reference Blueprint for Classical Language Translation Benchmarks [0.0]
PaliBenchは、Pali-to- English翻訳のベンチマークである。本稿では、Pali-to- English翻訳のためのベンチマークであるPaliBenchと、古典言語のためのマルチ参照翻訳ベンチマークを構築する再利用可能な方法について紹介する。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:43:01 GMT)
Operator-Algebraic Methods for Asymptotic-Preserving Quantum Simulation of Open Systems [0.0]
我々は,量子計算資源を用いたマルチスケール物理システムのシミュレーションを行うための,数学的に厳密なフレームワークを開発した。自然アナログ進化や解析多様体射影による高速な緩和を実現する層状量子プロトコルがダイヤモンドノルムに一様に収束することを証明する。この研究は、古典的マルチスケール数値解析と量子シミュレーションアルゴリズムの間に、原理化された数学的ブリッジを提供する。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:27:58 GMT)
OPTNet: Ordering Point Transformer Network for Post-disaster 3D Semantic Segmentation [0.0]
災害後の被害評価には、3次元点雲の迅速かつ正確なセマンティックセマンティックセグメンテーションが必要である。学習可能なPoint Sorterモジュールを導入した OPTNet (Ordering Point Transformer Network) を提案する。提案手法を3DAeroReliefデータセット上で評価し,最先端のベースラインを著しく上回る結果を得た。
論文参考訳（メタデータ） (Sat, 16 May 2026 23:53:25 GMT)
Near-Optimal Quantum Time Evolution Circuits via Provably Convergent Compression [0.0]
変分圧縮は、ハミルトニアンの時間発展を量子回路に符号化するための実装オーバーヘッドを著しく減少させる。量子回路への収束を保証するような変分最適化の初期点を選択するためのレシピを提供する。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:35:09 GMT)
MusicSynth: An Automated Pipeline for Generating Violin Fingerboard Animations from Sheet Music Using Optical Music Recognition [0.0]
Music SynthはオープンソースのWebツールで、楽譜をバイオリンのフィンガーボードのチュートリアルに変える。このシステムは、ヴァイオリンのフィンガーボードを、各音符が正しいタイミングでハイライトされたビデオを自動的に生成する。スクラッチから作られた唯一の部分は、ヴァイオリン上の各音符と指の位置をマッピングするライブラリである。
論文参考訳（メタデータ） (Sat, 16 May 2026 22:32:26 GMT)
Maxwell's Demon [0.0]
これは、マクスウェルの『デーモン』の悪名高い挑戦に焦点を当てている。ハイゼンベルクの不確実性原理の適用は、デーモンを決定的に倒すことが示されている。
論文参考訳（メタデータ） (Sat, 16 May 2026 23:49:20 GMT)
MADP: A Multi-Agent Pipeline for Sustainable Document Processing with Human-in-the-Loop [0.0]
MADPは、ディープラーニングに基づく分類と解析と大規模言語モデル抽出を組み合わせたマルチエージェントアーキテクチャである。 2026年1月までに処理された実世界の955の文書のプロダクション展開は97.0%の完全自動化率を達成した。我々のハイブリッドAI+HITLアプローチは、従来の手作業よりもCO2排出量を69%削減し、エネルギー消費量を69%削減し、水の使用量を63%削減します。
論文参考訳（メタデータ） (Sat, 16 May 2026 21:18:39 GMT)
HighSync: High-Quality Lip Synchronization via Latent Diffusion Models [0.0]
HighSyncは、高忠実度リップシンクのためのエンドツーエンドの拡散ベースのフレームワークである。 512*512の解像度で動作する最初のリップシンクモデルであり、プロのプロダクション環境で実行可能なソリューションとして位置づけられている。
論文参考訳（メタデータ） (Sat, 16 May 2026 10:20:52 GMT)
Genflow Ad Studio: A Compound AI Architecture for Brand-Aligned, Self-Correcting Video Generation [0.0]
Genflowは、生成メディア生産においてブランド一貫性を強制するために設計された複合AIシステムである。マルチステージの自己修正パイプラインに移行することで、Genflowはブランド準拠のビデオ世代を42%から89%に改善した。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:03:53 GMT)
GPF-LiveNews: A Streaming Evaluation Protocol for Group-Conditioned Framing in Large Language Models [0.0]
GPF-LIVENEWSは、グループ条件フレーミングの監査のためのストリーミング評価プロトコルとベンチマークスナップショットである。新たなBBC/Reutersニュースアンカーを42のアイデンティティラベルと7つのプロンプトファミリーに拡張し、セマンティックセンシティブと感情格差信号を使用して応答バンドルを評価する。 12回以上の監視走行と23回のモデルで、ポリシー/アクションは最も強力なセマンティック・ムーブメントを生み出す。我々は,全てのスコアを,ヒトの評定のための観察風監査信号として解釈し,恒久的公正度ランキングや有害バイアスの直接的証明として解釈する。
論文参考訳（メタデータ） (Sat, 16 May 2026 06:32:11 GMT)
From Imitation to Interaction: Mastering Game of Schnapsen with Shallow Reinforcement Learning [0.0]
本稿では,浅層ニューラルネットワークエージェントがカードゲームSchnapsenをマスターできるかどうかを検討する。まず、リプレイデータで訓練された教師あり学習エージェントと、強化学習エージェントを評価した。その結果、教師付き模倣は強力なRdeepBot相手を倒すには十分ではないことが示された。
論文参考訳（メタデータ） (Sat, 16 May 2026 21:22:46 GMT)
Factorized Latent Dynamics for Video JEPA: An Empirical Study of Auxiliary Objectives [0.0]
JEPA(Joint-Embedding Predictive Architectures)は、自己教師型ビデオ表現学習のための有望なフレームワークである。我々は,2つの事前訓練体制におけるビデオJEPAの18種類の補助的目的変動について,小規模な実証的研究を行った。
論文参考訳（メタデータ） (Sat, 16 May 2026 21:30:51 GMT)
FIM-LoRA: Task-Informative Rank Allocation for LoRA via Calibration-Time Gradient-Variance Estimation [0.0]
低ランク適応(LoRA)は、全ての適応された重み行列に均一なランクを割り当てる。各LoRA-B行列の勾配分散を層情報化の代用として計算し, 等級予算を比例的に再分配する。結果として得られるアダプタは、層ごとのランクパターンを持つ標準のLoRAである。
論文参考訳（メタデータ） (Sat, 16 May 2026 04:03:21 GMT)
F2IND-IT! -- Multimodal Fuzzy Fake Indian News Detection using Images and Text [0.0]
本稿では,インドメディア上での偽ニュース検出の強化を目的とした,視覚とテキストのモダリティを組み合わせた新しいフレームワークを提案する。このアーキテクチャは、ResNet-50 Convolutional Neural Networkを用いて、ニュース画像から視覚的特徴を抽出し、DistilBERTエンコーダを使用してテキストセマンティック埋め込みを得るとともに、適応型ニューロファジィ推論システム(ANFIS)を用いてファジィ信頼性スコアを生成する。
論文参考訳（メタデータ） (Sat, 16 May 2026 18:46:51 GMT)
Evolutionary Extreme Learning Machine of ab-initio Energy Landscapes for Crystal Structure Prediction using Manta Ray Optimization with Levy Flight [0.0]
エクストリームラーニングマシン(ELM)の訓練において,Levi FlightによるMRFOの改良を提案する。 EELM-MRFO-LFを略して提案した手法は, 未緩和生成エネルギー化合物の予測に有効である。提案したEELM-MRFO-LFの性能は、同様の条件下での他のよく知られた自然着想アルゴリズムと比較される。
論文参考訳（メタデータ） (Sat, 16 May 2026 20:45:36 GMT)
Empirical evaluation of Time Series Foundation Models for Day-ahead and Imbalance Electricity Price Forecasting in Belgium [0.0]
Time Series Foundation Models (TSFM) はタスク固有の最小限のトレーニングでゼロショット予測機能を約束する。本研究は,ベルギーのデイアヘッドの予測と電力価格の不均衡に対するTSFMの系統的評価を提供する。 TSFMは真のゼロショット予測スキルを示すが、極端な市場条件下では苦戦している。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:30:23 GMT)
Direct On-Wafer Measurements of Noise Parameters in C- and X-bands at $T=4$ K [0.0]
本稿では、ソースプル法により得られたFETノイズパラメータのセットアップと直接オンウェーハ測定結果について述べる。ノイズ温度の値は、独立および代替測定技術を用いて得られたものと比較する。
論文参考訳（メタデータ） (Sat, 16 May 2026 16:43:00 GMT)
Designing for Being-With: Presence Without Personhood in Conversational Human-AI Interaction [0.0]
会話型AIシステムは、言語流布、感情的ミラーリング、相互作用間の連続性を通じて、社会的存在をますます生み出す。本稿では、デザイン上の代替案として、"Be-with without becoming"を論じる。このコントリビューションは、デプロイされた臨床システムではなく、会話型HRIにおけるリレーショナルインタラクションを形成するための設計上の原則のセットである。
論文参考訳（メタデータ） (Sat, 16 May 2026 23:31:21 GMT)
Covariant extrinsic curvature expansion of the nonlocal effective action for a massless scalar field on a manifold with boundary [0.0]
曲線境界を持つ平坦多様体上で定義される無質量スカラー場の非局所有効作用について検討する。外部曲率テンソルにおける二次次数への非局所寄与の共変展開を導出する。応用として、振動変形環の粒子生成速度を2+1$次元で計算し、振動変形球を3+1$次元で計算する。
論文参考訳（メタデータ） (Sat, 16 May 2026 19:04:18 GMT)
Conflict-Free Replicated Data Types for Neural Network Model Merging: A Two-Layer Architecture Enabling CRDT-Compliant Model Merging Across 26 Strategies [0.0]
CRDTStateは、すべてのマージ戦略をCRDT準拠の層にラップする。 Layer 1はOR-Set CRDTセマンティクスを通じてコントリビューションを管理する。レイヤ2は、列挙されたコントリビューションセット上の決定論的純粋関数としてマージ戦略を適用します。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:08:52 GMT)
Closed-form Bayesian quantum estimation of Gaussian states [0.0]
本稿では,有限次元線形問題に対する測定値と推定値の最適化を削減した変分フレームワークを提案する。本手法はガウス演算と二次測度に基づく実験的に実現可能な戦略を導出することを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 12:56:59 GMT)
CANSURF: An ASV-View Can Dataset and Benchmark for Detection and Tracking of Surface-Level Debris [0.0]
本稿では,ASVビジョンシステムと新しいサーフェス・キャン・データセットを提案する。データセットは、ビデオから抽出され、バウンディングボックスで注釈付けされた7.3kの原画像からなり、10種類の拡張型を介して、多様な照明と水の状態にまたがる57kのトレーニング/検証画像に拡張される。 CANSURFでYOLOv11をトレーニングすることで、ジェネリックデータセットの12倍のパフォーマンスが向上し、データセットの価値が強調される。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:53:57 GMT)
Boundary-Aware QFT Block-Encoding of Fractional Laplacians [0.0]
開拡張境界条件を持つ有界領域上の半離散分数ラプラシアンのブロックエンコーディングについて検討する。有限QFTレジスタは、Toeplitz truncation ではなく、循環行列を対角化する。圧縮ブロックは (P_Nto Mdaggerwidetilde A(M)_,hP_Nto M = A(N)_,h+E(M)) を満たす。
論文参考訳（メタデータ） (Sat, 16 May 2026 02:06:47 GMT)
Body-Grounded Perspective Formation and Conative Attunement in Artificial Agents [0.0]
このモデルでは、知覚的可視性信号、融合した外受容-受容状態に対するフィッシャー式計量、および身体的傾向と行動準備の傾向をリンクする共役アライメント機構を導入している。報酬のないグリッドワールドでは、コレーションは学習された身体の傾向を安定な身体指向の行動に変換するが、ボディ・ツー・パースペクティブ・ルーティングは身体の摂動を可逆的な幾何学的残差を潜在視に残すことを可能にする。
論文参考訳（メタデータ） (Sat, 16 May 2026 00:30:41 GMT)
Basis- and Channel-Selective Quantum Photodetection [0.0]
我々は、電場振幅と磁場振幅が検出演算子にコヒーレントに寄与する量子光検出フレームワークを開発する。遠距離場2ソース幾何、2モード単光子設定、損失共振検出器モデルで解析する。
論文参考訳（メタデータ） (Sat, 16 May 2026 08:58:40 GMT)
BIDO: A Biometric Identity Online Authentication Framework [0.0]
BIDOは、NIST SP 800-63B当たりのAu- thenticator Assurance Level 2 (AAL2)を達成するデバイスフリー認証標準である。生成された認証情報は、発見不可能な(非居住者の)Web認証(WebAuthn)認証である。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:49:10 GMT)
Auditing Discriminatory Patterns in Mortgage Lending Through Association Rules and Fair Binning [0.0]
我々は、下流パターンマイニングにおいて、標準的なデータ前処理ステップ、特にバイナリ化が人種と性別の格差を増幅するかどうかを検討する。我々の標準ビンニングは、前回の調査で報告された8-10%と一致する9.63%の人種的偏見を示している。 7つのレースグループによるフェアバイニングはエプシロン3では不可能であり、エプシロン8でのみ成功し、フェアネスの価格は29.4%である。
論文参考訳（メタデータ） (Sat, 16 May 2026 03:35:51 GMT)
Atoms as Language: VQ-Atom: Semantic Discretization for Molecular Representation Learning [0.0]
VQ-Atomは、連続的な原子レベルのグラフ表現を局所的な化学環境に対応する離散トークンに変換するセマンティックな離散化フレームワークである。 VQ-Atomは従来のトークン化手法に比べて予測性能が一貫して向上していることを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 05:45:54 GMT)
Artificial Adaptive Intelligence: The Missing Stage Between Narrow and General Intelligence [0.0]
メタラーニング、ニューラルアーキテクチャサーチ、オートML、継続学習、進化計算、物理インフォームドモデリングが静かに収束した場所である。我々はこの体制をAAI(Artificial Adaptive Intelligence)と命名し、運用的に定義する。我々は、その安定性、収束性、ガバナンスの影響を分析し、航空宇宙設計、金融体制検出、乱流モデリング、生態力学、視覚言語システムといったケーススタディを通してそれらを説明します。
論文参考訳（メタデータ） (Sat, 16 May 2026 07:04:28 GMT)
Algorithmic Constitutionalism [0.0]
倫理工学の考え方は、AIによって引き起こされるガバナンスの課題には不十分である、と我々は主張する。我々は「合理主義的立憲主義」という別の枠組みを開発する。この記事では、アルゴリズムの合憲性の概念を詳述し、それがFacebookのコンテンツモデレーション体制にどのように適用されるかを示す。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:16:32 GMT)
Agentic AI Translate: An Agentic Translator Prototype for Translation as Communication Design [0.0]
我々は,山田の論文を運用するエージェント翻訳のプロトタイプであるエージェントAI翻訳を提案する(今後)。このシステムは、機械翻訳の主流であるテキストイン/テキストアウトのパラダイムを4段階のエージェントサイクルに置き換える。哲学的モチベーション、アーキテクチャのコミットメント、システムが消費する4つのリファレンス・マテリアルカテゴリ、そしてアーキテクチャが明示する主要な設計上の緊張について説明する。
論文参考訳（メタデータ） (Sat, 16 May 2026 15:21:23 GMT)
Adversarial Fragility and Language Vulnerability in Clinical AI: A Systematic Audit of Diagnostic Collapse Under Imperceptible Perturbations and Cross-Lingual Drift in Low-Resource Healthcare Settings [0.0]
本研究は, 臨床用AIにおける2つの安全性の脆弱性について, 対向画像の脆弱性と言語間診断ドリフトの2つの脆弱性について, 初めて系統的二重検査を行ったものである。 COVID-QU-Ex胸部X線データセットを微調整したDenseNet121を用いて、診断精度が89.3%から62.0%に低下することを示した。 Llama3.1:8bおよびNatLAS(NLASAT)を標準英語、ナイジェリア・ピジン(ナイジャ)、ヨルバ・インフレクテッド・インフレクテッド・イングリッシュ(英語版)で紹介した。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:33:47 GMT)
A Lightweight QR-assisted Zero-knowledge Identification Protocol For Secure Authentication [0.0]
本研究では,QRコードによるZero-Knowledge認証モデルを提案する。このアプローチはSchnorr認証プロトコルに基づいており、リプレイ攻撃に対する追加のセキュリティ層を提供する。
論文参考訳（メタデータ） (Sat, 16 May 2026 09:58:54 GMT)
$\mathcal{O}(n)$ alternative to Quantum Fourier Transform with efficient neural net classical post-processing [0.0]
HSPを実現するために、QFTによって活用される2つの特性を見つけ出す。 QFTのシフト不変性は、ランダムな全体シフトの除去を可能にする。我々は、離散的なフィッシャー情報を通してその情報を定量化する。
論文参考訳（メタデータ） (Sat, 16 May 2026 13:47:11 GMT)