World Action Models: The Next Frontier in Embodied AI [123.6] VLA(Vision-Language-Action)モデルは、具体的政策学習のための強力なセマンティックな一般化を実現している。
彼らは、物理的な世界が介入の下でどのように進化するかを明示的にモデル化することなく、リアクティブな観察から行動へのマッピングを学ぶ。
成長するこの制限には、世界モデル、環境ダイナミクスの予測モデル、アクション生成パイプラインを統合することで対処する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:10:52 GMT)
CausalCine: Real-Time Autoregressive Generation for Multi-Shot Video Narratives [117.9] CausalCineはインタラクティブな自動回帰フレームワークで、マルチショットビデオ生成をオンラインのディレクティブプロセスに変換する。
CausalCineはショット変更を因果的に生成し、動的プロンプトをオンザフライで受け付け、以前のショットを再生することなくコンテキストを再利用する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:59:51 GMT)
SenseNova-U1: Unifying Multimodal Understanding and Generation with NEO-unify Architecture [110.2] NEO-Unify上に構築されたネイティブ統一マルチモーダルパラダイムであるSenseNova-U1を紹介する。
SenseNova-U1-8B-MoT と SenseNova-U1-A3B-MoT の2つのネイティブ統一型について述べる。
また,コミュニティ研究を支援するためのモデル設計,データ前処理,事前/後学習,推論戦略についても紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:59:58 GMT)
Orthrus: Memory-Efficient Parallel Token Generation via Dual-View Diffusion [91.4] Orthrusは、自己回帰型大規模言語モデル(LLM)の正確な生成忠実度と、拡散モデルの高速並列トークン生成を一体化するフレームワークである。
最大7.8倍のスピードアップを実現し、メモリキャッシュのオーバーヘッドはO(1)のみであり、パラメータの追加は最小限である。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:47:35 GMT)
Is Data Shapley Not Better than Random in Data Selection? Ask NASH [88.5] データ選択は、訓練データの高品質なサブセットを特定する問題を研究する。
目的のユーティリティ関数を単純化したシェープリー不変成分関数に分解するNASH(Non-linear Aggregation of SHapley-informative components)を提案する。
NASHは、Shapley/semivalueベースのデータ選択の有効性を、最小限のランタイムコストで大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:53:39 GMT)
Revisiting Shadow Detection from a Vision-Language Perspective [88.5] Shadow Vision-Language (SVL)は、視覚的に類似した暗黒領域からの曖昧な影への明示的なセマンティック参照として言語を使用する。
SVLはテキスト埋め込みに局所的なパッチレベルの制約を適用し、挑戦的な外観条件下でのきめ細かい識別を改善する。
フリーズされたDINOv3イメージエンコーダ上に構築されたこのフレームワークは、軽量なプロジェクションとデコードモジュールのみを学習し、トレーニング可能なパラメータが1%未満のパラメータ効率の高い設計をもたらす。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:42:30 GMT)
From Imagined Futures to Executable Actions: Mixture of Latent Actions for Robot Manipulation [88.4] 将来の映像を実行可能な表現に変換する制御指向インタフェースであるMoLAを提案する。
我々は,シミュレーションベンチマークと実世界のロボット操作タスクに対するアプローチを評価した。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:15:16 GMT)
ToolCUA: Towards Optimal GUI-Tool Path Orchestration for Computer Use Agents [87.6] Computer Use Agents (CUA) は、クリックやタイプのようなアトミックGUIアクションと、APIベースのファイル操作のようなハイレベルなツールコールの両方を通じて動作することができる。
この困難は、高品質なインターリーブGUIツール軌跡の不足、実際のツール軌跡収集のコストと脆さ、GUIツールパス選択のための軌道レベルの監督の欠如に起因する。
本稿では,GUI-Tool経路選択を段階的学習パラダイムを用いて学習するためのエンドツーエンドエージェントであるToolCUAを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:57:04 GMT)
When Policy Entropy Constraint Fails: Preserving Diversity in Flow-based RLHF via Perceptual Entropy [84.7] RLでは、多様性はしばしばポリシーエントロピーと相関し、エントロピー正則化を動機付けていると仮定される。
政策エントロピーは、知覚の多様性が崩壊しても一定であり続ける。
知覚空間における多様性を捉える知覚エントロピーを導入し,標準エントロピーの特性を維持する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:29:10 GMT)
Learning, Fast and Slow: Towards LLMs That Adapt Continually [83.9] 大規模言語モデル(LLM)は、パラメータを更新することで下流タスクのために訓練される。
高速スロートレーニング(FST)は、推論タスクのスローラーニング(RL)よりも最大3倍のサンプリング効率を持つ。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:58:20 GMT)
Learn to Think: Improving Multimodal Reasoning through Vision-Aware Self-Improvement Training [82.2] 多モーダル大規模言語モデル(MLLM)の推論能力を改善するために、明示的推論トレースを用いた後学習が一般的である。
MLLMのマルチモーダル推論を強化するための視覚対応型自己改善学習フレームワークであるVISTAを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:44:35 GMT)
PairDropGS: Paired Dropout-Induced Consistency Regularization for Sparse-View Gaussian Splatting [82.0] ドロップアウトに基づくスパースビュー3DGS法は、トレーニング中にガウス原始体をランダムに抑制することで過度な適合を緩和する。
PairDropGS, Paired Dropout-induced Consistency Regularization framework for sparse-view Gaussian splattingを提案する。
PairDropGSはトレーニングの安定性が向上し、既存のドロップアウトベースの3DGS手法よりも再現性が高いことが、広く使用されているスパースビューベンチマークで実証された。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:00:39 GMT)
Qwen-Scope: Turning Sparse Features into Development Tools for Large Language Models [80.5] 我々はQwenモデルファミリ上に構築されたスパースオートエンコーダ(SAE)のオープンソーススイートであるQwen-Scopeを紹介する。
SAEはポストホック解析を超越して,4方向のモデル開発のための実用的なインターフェースとして機能することを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:01:06 GMT)
Online Continual Learning with Dynamic Label Hierarchies [72.3] 粒度をまたいで重大度が進化する新しい問題設定であるDHOCLを導入し,各サンプルは単一階層レベルでの監視を行う。
i) 混合粒度の部分的監視は、塑性を制約し、階層間のセマンティック一貫性を損なう、進化するパスワイド階層上のポイントワイド信号のみを提供する。
本稿では,相補的分類を適応的に組み合わせ,学習可能な階層型プロトタイプによって正規化し,素早い適応,階層的整合性,構造的知識の統合を可能にするHALOを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:20:23 GMT)
Learning with Rare Success but Rich Feedback via Reflection-Enhanced Self-Distillation [71.2] 本稿では、生の障害フィードバックを補正管理のアクティブソースに変換するフレームワークであるReflection-Enhanced Self-Distillation(RESD)を紹介する。
RESDは、局所的なエラーを診断するために振り返りリフレクションを生成し、持続的なグローバルなプレイブックをキュレートすることで、障害の軌跡を解釈する。
複数の連続学習課題に対する実証的な評価は、RESDが標準の自己蒸留ベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:46:05 GMT)
Agent-BRACE: Decoupling Beliefs from Actions in Long-Horizon Tasks via Verbalized State Uncertainty [70.4] 本稿では,Agens-BRACE: Agent Belief state Representation by Abstraction and Confidence Estimationを紹介する。
LLMエージェントを信頼状態モデルと政策モデルに分離し、強化学習を通じて協調的に最適化する手法である。
長期にわたる部分的に観察可能な言語環境において、平均して+14.5%の絶対的な改善を実現している。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:37:04 GMT)
SkillGraph: Skill-Augmented Reinforcement Learning for Agents via Evolving Skill Graphs [70.2] 有向グラフのノードとして再利用可能なスキルを表現するフレームワークであるSKILLGRAPHを提案する。
SKILLGRAPHは個々のスキルだけでなく、多段階意思決定をガイドできる順序付きスキルサブグラフも取得する。
実験により,SKILLGRAPHはメモリ拡張RL法に対して最先端の性能を実現することが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:21:49 GMT)
Incentivizing Truthfulness and Collaborative Fairness in Bayesian Learning [68.8] コラボレーション型機械学習は、複数のソースからのデータセットを使用して高品質なモデルをトレーニングする。
ソースにデータを共有するインセンティブを与えるため、既存のデータ評価手法は、送信されたデータに基づいて各ソースに適切な報酬を与える。
本稿では, (F) 協調フェアネスを保証し, (T) ベイズモデルの平衡における真さを動機付ける最初のメカニズムを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:02:23 GMT)
Attributing Emergence in Million-Agent Systems [68.5] 大規模言語モデル(LLM)は、個々のエージェントにおける人間のような推論と意思決定をシミュレートすることができる。
このような研究は、個々のエージェントにマクロな出現をもたらす必要がある。
Aumann--Shapley path-integral attribution to LLM-powered MAS at million-agent scale。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:49:41 GMT)
Learning Action Manifold with Multi-view Latent Priors for Robotic Manipulation [67.2] 本稿では,視覚・言語・行動モデル(VLA)における空間認識と操作の課題に取り組む。
幾何学的ガイダンスに基づいて多視点特徴を整列する幾何誘導型ゲート変換器(G3T)を提案する。
動作学習効率を向上させるために,有効な動作多様体上での動作を直接予測するアクション・マニフォールド・ラーニング(AML)を導入する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:21:29 GMT)
Robust Promptable Video Object Segmentation [67.2] 本稿では,ロバストPVOS(RobustPVOS)の総合的研究について述べる。
まず,351本のビデオクリップと2500枚以上のオブジェクトマスクの2つの実世界評価データセットを用いて,新しい総合的ベンチマークを構築した。
メモリオブジェクト条件付きGated-rank Adaptation (MoGA) と呼ばれる新しいロバストPVOS法を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:55:31 GMT)
MMCL-Bench: Multimodal Context Learning from Visual Rules, Procedures, and Evidence [66.1] MMCL-Bench(MMCL-Bench)は、視覚的・混合モダリティ教育の文脈からタスクローカルルール、手順、経験的パターンを学ぶためのベンチマークである。
この設定では、学習コンテキストを推論する前に、画像、スクリーンショット、マニュアル、ビデオ、フレームシーケンスから関連するエビデンスを復元し、ローカライズする必要がある。
厳密なスコアリングによるフロンティアマルチモーダルモデルを評価した結果、現在のシステムは堅牢なマルチモーダルコンテキスト学習には程遠いことが判明した。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:57:37 GMT)
Learning Feature Encoder with Synthetic Anomalies for Weakly Supervised Graph Anomaly Detection [66.1] 本稿では,グラフ異常に適した特徴学習戦略を活用する,弱い教師付きグラフ異常検出手法を提案する。
提案手法は,合成異常により頑健な特徴表現を抽出するマルチタスク学習方式に基づいている。
公開データセットに関する実験は、我々の手法が競合相手よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:27:06 GMT)
Self-Distilled Trajectory-Aware Boltzmann Modeling: Bridging the Training-Inference Discrepancy in Diffusion Language Models [65.9] 拡散言語モデル(DLM)は、より強力なグローバル認識と高い並列生成を提供する。
標準負のエビデンス下界(NELBO)に基づく教師付き微調整後のDLMは非効率である。
そこで本研究では,学習を推論の容易かつハードな構造に整合させる,自己蒸留軌道に基づくポストトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:39:06 GMT)
Fast Image Super-Resolution via Consistency Rectified Flow [65.5] 拡散モデル(DM)は現実世界の超解像(SR)において顕著な成功を収めた。
近年の取り組みでは、少数あるいは単一ステップのソリューションが導入されたが、既存の手法ではノイズの多い入力からプロセスを非効率にモデル化している。
本稿では,低分解能(LR)画像から高分解能(HR)画像への整流としてSR問題を再構成する新しいアプローチであるFlowSRを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:42:38 GMT)
UniCustom: Unified Visual Conditioning for Multi-Reference Image Generation [65.5] VLMエンコーディングの前にVTとVAE機能を融合した統合ビジュアルコンディショニングフレームワークを提案する。
2つのマルチ参照生成ベンチマークの実験により、UniCustomは主題の一貫性、命令従順、構成の忠実さを一貫して改善することを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:10:05 GMT)
SAGE: Scalable Automated Robustness Augmentation for LLM Knowledge Evaluation [65.5] SAGEは,微調整された小型モデルを用いた知識評価ベンチマークのスケーラブルな堅牢性向上のためのフレームワークである。
HellaSwagの実験によると、SAGEは人間に注釈を付けたHellaSwag-Proに匹敵する、大規模な堅牢性向上ベンチマークを、かなり低コストで構築している。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:09:05 GMT)
DreamAvoid: Critical-Phase Test-Time Dreaming to Avoid Failures in VLA Policies [65.3] 本稿では,ビジョン・ランゲージ・アクション(VLA)モデルのためのクリティカルフェーズテストタイムドリームフレームワークであるDreamAvoidを提案する。
また、自律的な境界学習パラダイムを導入し、成功と失敗の微妙な境界に対するシステムの理解を深める。
その結果、DreamAvoidは失敗を効果的に回避し、全体的なタスク成功率を改善することができた。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:27:16 GMT)
What Do EEG Foundation Models Capture from Human Brain Signals? [64.5] 現代の脳波基礎モデルは、自己教師付き事前訓練を通じて生信号から直接学習する。
我々は3つのサブクエストに分解する: モデルが何を学習するか、モデルを何に使用するのか、そしてどのように説明できるのか。
3つの基礎モデル(CSBrain, CBraMod, LaBraM),5つの臨床タスク(MDD, Stress, ISRUC-Sleep, TUSL, Siena)と6ファミリー63機能レキシコンを含む。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:57:53 GMT)
Decaf: Improving Neural Decompilation with Automatic Feedback and Search [64.0] 高レベルな構文、識別子、カスタムデータ型は一般的に失われ、コンパイラは人間可読なコードを低レベルなマシンコードに変換する。
生成AIモデルは、ハイレベルな構文、識別子、型を再構築するのに自然なものだ。
コンパイラフィードバックは,サーチによるニューラルデコンパイラ出力のセマンティックな正当性の向上に有効である,と我々は主張する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:21:26 GMT)
LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling [63.7] テストタイムスケーリング(TTS)は,大規模言語モデルの性能向上に有効なアプローチとなっている。
既存のTS戦略は、主に手作りであり、研究者はパターンを設計し、直感で調整し、計算割り当ての空間の多くを探索していない。
環境駆動型フレームワークであるAutoTTSを提案し、研究者が設計したものを、個々のTSからTTS戦略を自動的に発見できる環境へと変更する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:46:05 GMT)
OmniHumanoid: Streaming Cross-Embodiment Video Generation with Paired-Free Adaptation [63.7] クロス・エボディメント・ビデオ・ジェネレーションは、異なるヒューマノイド・エンボディメント間での動きを転送することを目的としている。
OmniHumanoidは、移動可能な運動学習とエンボディメント固有の適応を分解するフレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:21:11 GMT)
Scalable Token-Level Hallucination Detection in Large Language Models [63.3] 内部幻覚は推論集約的なタスクでは検出が難しい。
TokenHDはトークンレベルの幻覚検出器を訓練するための全体論的パイプラインである。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:47:40 GMT)
Revisiting Photometric Ambiguity for Accurate Gaussian-Splatting Surface Reconstruction [62.7] AmbiSuRは、光学的あいまいさとロバストな表面3D再構成のためのガウススプラッティングによる本質的な解を高速に探索するフレームワークである。
本研究は,2つの表現にプリミティブな曖昧さが組み込まれていることを明らかにするとともに,ガウス的スプラッティングにおけるあいまいさ自己表現の本質的な可能性を明らかにするものである。
そこで本稿では, 自己表現能力を解き放つアンビグニティ表示モジュールを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:59:47 GMT)
All Circuits Lead to Rome: Rethinking Functional Anisotropy in Circuit and Sheaf Discovery for LLMs [61.0] 一つのタスクを複数の、構造的に異なる回路やシーブでサポートできることを示し、同時に忠実で、疎結合で、完全であることを示す。
分布回路仮説を提案し,高次元重ね合わせから自然に非一様で低オーバーラップ回路の説明が生じることを示す理論的解析を行った。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:21:23 GMT)
OmniNFT: Modality-wise Omni Diffusion Reinforcement for Joint Audio-Video Generation [61.0] 近年のジョイント・オーディオ・ビデオ・ジェネレーションの進歩は、モダリティ毎の忠実度、クロスモーダルアライメント、きめ細かい同期を強く要求している。
これらの欠点は、単一のグローバルな優位性を持つバニラRL微調整戦略が、しばしば準最適結果をもたらすことを示唆している。
提案するOmniNFTは,新しいモダリティ対応オンライン拡散RLフレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:56:59 GMT)
REALISTA: Realistic Latent Adversarial Attacks that Elicit LLM Hallucinations [60.5] 我々は、制約付き最適化問題として幻覚誘発を定式化する。
目的は、良質なユーザープロンプトと同等のセマンティック・コヒーレントな相手プロンプトを見つけることである。
本稿では,現実的な潜在空間攻撃フレームワークREALISTAを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:13:50 GMT)
On Predicting the Post-training Potential of Pre-trained LLMs [60.1] 本稿では,ポストトレーニング前のベースモデルの性能予測という,ポストトレーニング後の潜在能力を予測するための新しいタスクを紹介する。
本稿では,応答判別を活用することで,ベースモデルの生成ギャップを回避できる統一フレームワークであるRuDEを提案する。
実験では、トレーニング後のパフォーマンスと90%以上の相関を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:33:49 GMT)
D-PACE: Dynamic Position-Aware Cross-Entropy for Parallel Speculative Drafting [59.2] 投機的復号化は、小さなドラフト作成者がより大きなターゲットモデルが並列に検証するトークンを提案することによって推論を加速する。
最近の拡散ベースの並列ドラフトア(DFlashなど)は、1つの前方パスで完全なB-tokenブロックを予測し、より深いドラフトアとより長い許容ブロックを可能にする。
各位置の重みと、その対数確率の寄与とを一致させて、期待されるドラフト長の相違可能なサロゲートから、位置毎のトレーニングウェイトを導出する。
6つのベンチマークと2つのQwen3-4Bドラフト深度、2つの復号温度、2つの追加ターゲットモデル、D-PACEは一貫してウォールクロックのスピードアップと平均の両方を改善している。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:27:57 GMT)
PRISM: : Planning and Reasoning with Intent in Simulated Embodied Environments [59.1] 5つの集合住宅の上に建設され、PRISMは300の人間認証タスクを3つの能力レベルに構成する。
PRISMはエージェントに依存しない実行可能なアクションAPIを公開し、任意のエージェントをエンドツーエンドで評価できるようにする。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:59:47 GMT)
Covering Human Action Space for Computer Use: Data Synthesis and Benchmark [59.0] コンピュータ利用エージェント(CUA)は、GPT-5.4とClaudeによって説明されているように、画面上での作業を自動化する。
しかし、複雑な低周波相互作用に対する信頼性はまだ貧弱であり、ユーザの信頼を制限している。
複雑な相互作用におけるモデルの能力を評価するための新しいベンチマークCUActSpotを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:59:58 GMT)
DocAtlas: Multilingual Document Understanding Across 80+ Languages [58.7] 本稿では,82言語を対象とした高忠実度OCRデータセットとベンチマークを構築するフレームワークDocAtlasを紹介する。
我々のデュアルパイプライン、ネイティブDOCX文書の微分レンダリング、左右スクリプトの合成ベース生成は正確な構造アノテーションを生成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:09:38 GMT)
MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents [58.7] エッジデバイス上でのプライバシに敏感なスパンを識別するMemPrivacyを提案する。
クラウドサイドのメモリ処理のために、セマンティックに構造化されたタイプアウェアプレースホルダーに置き換えられる。
MemPrivacyは、効果的なメモリ生成と検索に必要な情報を保持しながら、機密データの露出を最小限にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:55:05 GMT)
ALGOGEN: Tool-Generated Verifiable Traces for Reliable Algorithm Visualization [58.4] アルゴリズムの可視化(AV)は、アルゴリズムの実行状態をアニメーションすることで、生徒がメンタルモデルを構築するのに役立つ。
CODE2VIDEOのような最近のLCMベースのシステムは、エンドツーエンドでAVビデオを生成する。
このパラダイムでは、アルゴリズムフローを同時にシミュレートし、ビデオレンダリングの制約を満たす必要がある。
可視化から実行を分離する新しいパラダイムであるALGOGENを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:09:48 GMT)
Deep Reasoning in General Purpose Agents via Structured Meta-Cognition [58.2] 構造化メタ推論を用いてタスク固有の足場を構築するための推論時アプローチを提案する。
我々は、より制御された推論スレッドに複雑なタスクを分散する汎用エージェントでこのアプローチをインスタンス化する。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:21:37 GMT)
Causal Algorithmic Recourse: Foundations and Methods [57.7] AIシステムの主な特徴は、個人が否定的な決定を覆す方法のレコメンデーションを提供する能力である。
既存のアプローチでは、recourseの結果を固定単位の反事実として扱う。
我々は、事前および事後結果のプロセスとして、会話をモデル化する因果的枠組みを開発する。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:55:19 GMT)
Geometric Factual Recall in Transformers [57.5] 一般的な見解では、内部の重み行列は埋め込みのペアに対する連想記憶として捉えられ、事実の数と線形にスケールする記憶数を必要とする。
我々は、学習した埋め込みが直接構造を符号化する、別のエンフェロメトリックな形態の記憶の理論的、実証的な説明を開発する。
単層変圧器が被写体から共有属性集合へのランダムベクトルを記憶しなければならない制御環境では、対数埋め込み次元が十分であることを示す。
これらの結果をマルチホップ設定に拡張し、証明可能なチェーン・オブ・シークレットによる構築を提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:22:22 GMT)
Route Before Retrieve: Activating Latent Routing Abilities of LLMs for RAG vs. Long-Context Selection [57.4] Pre-Routeは、応答前に構造化推論を実行するプロアクティブなルーティングフレームワークである。
本研究は, (i) LLMは, ガイドラインを確実に適用可能な遅延ルーティング能力を有すること, (ii) 線形プローブにより, 表現空間における最適ルーティングの分離性を高めること, (iii) 蒸留により, この推論構造を, 軽量展開のためのより小さなモデルに伝達すること,の3つの重要な知見を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:50:30 GMT)
Seirênes: Adversarial Self-Play with Evolving Distractions for LLM Reasoning [56.5] 本稿では、文脈干渉を内部の訓練信号に変換するセルフプレイのRLフレームワークであるSeyrnesを紹介する。
単一のモデルでは、可視的かつ気を散らすようなコンテキストの構築と、それ自身で盲点を露呈するように訓練されている。
これらの競合する目標を互いに衝突させることで、Sailnes氏は、表面的なパターンマッチングを超えてモデルを補完する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:58:35 GMT)
Self-Consistent Latent Reasoning: Long Latent Sequence Reasoning for Vision-Language Model [56.2] SCOLAR(Self-Consistent LAtent Reasoning)は、1枚のショットで補助的な視覚トークンを生成する軽量なデコンバータを導入している。
SCOLARは許容遅延CoT長を30ドル以上延長し、実世界の推論ベンチマークでオープンソースモデルの間で最先端を実現している。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:13:08 GMT)
A Single Layer to Explain Them All:Understanding Massive Activations in Large Language Models [56.0] 大規模言語モデル(LLM)における大規模アクティベーションの起源について検討する。
モデルファミリ間で一貫して観察されるtextbfMassive Emergence Layer (ME Layer) と呼ばれる特定の層を同定する。
RMSNormとFFNパラメータの両方がME層内で大きな活性化の出現に共同して寄与していることを示す。
本研究では,この制限により,大規模アクティベーショントークンの剛性を簡易かつ効果的に低減する手法を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:33:07 GMT)
One Turn Too Late: Response-Aware Defense Against Hidden Malicious Intent in Multi-Turn Dialogue [56.0] マルチターン対話における隠れた悪意のある意図は、大規模言語モデル(LLM)に対する脅威を増大させる
近年の研究では、安全アライメントや外部ガードレールの進歩にもかかわらず、高度なガードレールを備えた近代的な商用モデルでさえも、このような攻撃に対して脆弱であることが示されている。
そこで本研究では,この課題に対処するため,最も早いタイミングで候補応答を届けることによって,蓄積された相互作用が有害な作用を可能にするのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:52:21 GMT)
Insights into the Nature of Quantum Emitters in Electron-Irradiated hexagonal Boron Nitride [55.8] 六方晶窒化ホウ素(hBN)の量子放出体は、量子技術応用のための有望な固体プラットフォームとして出現している。
この研究は、電子照射されたhBNの量子エミッタがサンプル調製中に導入された有機汚染物質と関連しているかどうかを評価するためのステップバイステップの枠組みを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:10:44 GMT)
Simulating Students or Sycophantic Problem Solving? On Misconception Faithfulness of LLM Simulators [55.6] 大規模言語モデル(LLM)は、生徒のような反応を流線型に生成できるため、AI教師や人間教育者のトレーニングや評価のための模擬学生として魅力的である。
しかし、このようなシミュレータは、実際の学生と出力の類似性によって評価され、相互作用中に一貫性のある誤解を持つ学生のように振る舞うかどうかによって評価される。
シミュレーションが誤解駆動の信念状態を維持しているかどうかを判断し、フィードバックが誤解に対処した場合に選択的に更新する。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:55:23 GMT)
Adaptive Smooth Tchebycheff Attention for Multi-Objective Policy Optimization [55.3] ドメインにおける多曲率強化学習は、矛盾する目的間の複雑な非脆弱な干渉トレードオフのバランスを必要とする。
本稿では,生態系をモニタリングするプロキシであるロボットビジュアルを用いた,新しいリアルタイムなリアルタイム最適化を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:32:57 GMT)
Can LLM Agents Respond to Disasters? Benchmarking Heterogeneous Geospatial Reasoning in Emergency Operations [55.3] 災害対応エージェントベンチマーク(DORA)は、エンド・ツー・エンドの災害対応のための最初のエージェントベンチマークである。
タスクは、災害認識、空間関係分析、救助・避難計画、時間的進化推論、マルチモーダルレポート合成という、災害対応パイプラインをカバーする5つの次元にまたがる。
DORAは、運用上の信頼性の高い災害対応エージェントのための厳格なテストベッドを確立する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:57:41 GMT)
Beyond Masks: The Case for Medical Image Parsing [55.2] 医用画像研究は、医用画像解析を中心的出力とするべきであると論じる。
属性は、それらのエンティティを記述し、マージンの規則性、エンハンスメントパターン、グレードなどのものをキャプチャする。
このような出力を生成するためのフィールドがどの程度近いかをテストするために、3つのパースプリミティブとクロージャに対して11の代表的なシステムを監査する。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:47:53 GMT)
MindVLA-U1: VLA Beats VA with Unified Streaming Architecture for Autonomous Driving [54.6] 我々は、自動運転のための最初の統合型ストリーミング・ビジョン・ランゲージ・アクション・アーキテクチャであるMindVLA-U1を提案する。
統一されたVLMバックボーンは、1つの共有表現上の1つのフォワードパスで自動回帰言語トークンとフローマッチング連続アクショントラジェクトリを生成する。
ロングテールのWOD-E2Eベンチマークでは、MindVLA-U1が経験豊富な人間のドライバーを初めて上回った。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:09:42 GMT)
On-Policy Self-Evolution via Failure Trajectories for Agentic Safety Alignment [54.3] 既存の安全アライメント信号は、主に応答レベルまたは政治外である。
FATEは、検証済みの失敗を専門家のデモンストレーションなしで修復管理に変換する。
FATEは攻撃成功率を33.5%、有害なコンプライアンスを82.6%削減し、外的軌道安全診断を6.5%改善する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:56:28 GMT)
Understanding and Preventing Entropy Collapse in RLVR with On-Policy Entropy Flow Optimization [53.8] 本研究では,エントロピー変化への寄与に応じて,エントロピー増加とエントロピー減少の更新を再スケールする適応的エントロピーフローバランス機構を提案する。
6つの数学的推論ベンチマークの実験は、OPEFOがトレーニングと最終的なパフォーマンスを改善することを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:08:17 GMT)
Breaking $\textit{Winner-Takes-All}$: Cooperative Policy Optimization Improves Diverse LLM Reasoning [53.4] グループ協力政策最適化は、トレーニングパラダイムをロールアウト競争からチーム協力へとシフトさせる。
GCPOは独立したロールアウトスコアをチームレベルのクレジット割り当てに置き換える。
チームへの平均的な限界貢献に従って、各ロールアウトに対して、グループチームの報酬を再分配する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:20:24 GMT)
More Edits, More Stable: Understanding the Lifelong Normalization in Sequential Model Editing [53.4] Lifelong Model Editingは、関係のない知識と一般的な能力を保ちながら、大規模言語モデルにおける進化する事実を継続的に更新することを目的としている。
最近の編集者は、長い地平線上で弾力性があり、同じコア戦略を共有している。 実行統計を用いて価値を正規化するライフロング正規化(LN)。
LNは即時の性能低下を引き起こし,早期編集が今後の編集の成功を促進する反直感的な肯定的な累積効果を観察する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:23:35 GMT)
STRABLE: Benchmarking Tabular Machine Learning with Strings [53.0] STRABLEは108のテーブルからなるベンチマークコーパスであり、様々なアプリケーションフィールドにまたがる文字列や数値を使った実世界の学習問題である。
445個のパイプラインを評価し,文字列を用いた表型学習の大規模な実証的研究を行った。
野生のほとんどのテーブルは分類的に支配的であるため、単純な文字列埋め込みと組み合わせた先進的な表型学習者は、計算コストを低くして優れた予測を達成できる。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:47:50 GMT)
CR^2: Cost-Aware Risk-Controlled Routing for Wireless Device-Edge LLM Inference [52.8] 大規模言語モデル(LLM)は集中型クラウドからモバイルエッジ環境に移行する。
軽量オンデバイスモデルとより強力なエッジモデルの間のクエリレベルのルーティングは、このトレードオフをナビゲートするための柔軟なメカニズムを提供する。
既存のルータは、集中クラウド設定とトークンレベルのコストの最適化のために設計されており、無線エッジデプロイメントにおける動的レイテンシとエネルギーオーバーヘッドをキャプチャできない。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:50:15 GMT)
AlphaGRPO: Unlocking Self-Reflective Multimodal Generation in UMMs via Decompositional Verifiable Reward [52.7] 我々はAlphaGRPOを提案し、追加のコールドスタートステージなしでマルチモーダル生成能力を向上する。
我々のアプローチは、高度な推論タスクを実行するためのモデルの本質的な可能性を解き放つ。
実世界のマルチモーダル世代を安定的に管理する上での課題に対処するために、DVReward(Decompositional Verifiable Reward)を導入する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:59:47 GMT)
Beyond Localization: A Comprehensive Diagnosis of Perspective-Conditioned Spatial Reasoning in MLLMs from Omnidirectional Images [52.5] MLLM(Multimodal Large Language Models)は、視覚的知覚が強いが、視点の変化による空間の推論には限界がある。
本研究では、この課題を全方位360度画像におけるパースペクティブ・コンディションド・スペース・推論(PCSR)として検討する。
我々は2,600全方位画像から84,373組の質問応答対の診断ベンチマークであるPCSR-Benchを紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:11:17 GMT)
Gradient-Free Noise Optimization for Reward Alignment in Generative Models [52.4] ZeNOは、経路積分制御問題としてノイズ最適化を定式化する、勾配のないフレームワークである。
効果的な推論時間スケーリングを可能にし、多様なジェネレータと報酬関数間で強力なパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:05:36 GMT)
Formalize, Don't Optimize: The Heuristic Trap in LLM-Generated Combinatorial Solvers [52.2] 大規模言語モデル(LLM)は直接推論によって複雑な問題を解くのに苦慮しているため、近年のニューロシンボリックシステムは、それを実行可能な解法を合成するためにますます利用している。
我々は,100の問題をベンチマークしたCP-SynC-XL(4,577インスタンス)を導入し,ネイティブアルゴリズム検索(Python),PythonソルバAPI(Python + OR-Tools)による制約モデリング,宣言的制約モデリングという3つのコンストラクションパラダイムを評価した。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:15:45 GMT)
SoccerLens: Grounded Soccer Video Understanding Beyond Accuracy [52.1] ビジョン言語モデル(VLM)は近年,サッカービデオ理解において大きな可能性を示している。
既存の評価プロトコルは分類精度に重点を置いており、視覚的グラウンドの評価は行わない。
サッカービデオ理解のためのベンチマークである SoccerLens を紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:02:50 GMT)
Do Androids Dream of Breaking the Game? Systematically Auditing AI Agent Benchmarks with BenchJack [51.5] BenchJackは、コーディングエージェントがベンチマークを監査し、報酬をハックする可能性のあるエクスプロイトを識別するシステムである。
BenchJackを、ソフトウェアエンジニアリング、Webナビゲーション、デスクトップコンピューティング、端末操作にまたがる10の人気のあるエージェントベンチマークに適用する。
BenchJackは、単一のタスクを解決することなく、ほとんどのベンチマークでほぼ完璧なスコアを達成する報奨ハックのエクスプロイトを合成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:22:45 GMT)
Mitigating Context-Memory Conflicts in LLMs through Dynamic Cognitive Reconciliation Decoding [51.2] 大規模言語モデルは事前学習を通じてパラメトリック知識を蓄積する。
知識の衝突は、時代遅れまたは誤ったパラメトリック知識が文脈における外部知識と衝突する際に起こる。
既存の手法は、対照的な復号化を通じて知識の衝突に対処するが、競合のないシナリオでは静的アプローチが出力分布を妨害する。
本稿では,動的認知和解復号法(DCRD)を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:29:45 GMT)
Learning to Foresee: Unveiling the Unlocking Efficiency of On-Policy Distillation [51.2] OPDの効率は、トレーニングの初期段階において最終モデルに向けた安定的な更新軌道を確立する、フォレスト・オブ・ザ・イヤーズ(foresight')の形式に起因している、と我々は主張する。
我々は、外挿ステップのサイズを適応的に選択し、現在の更新方向に沿って移動することにより、OPDを高速化するプラグイン・アンド・プレイ・アクセラレーション手法である textbfEffOPD を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:19:15 GMT)
Grid Games: The Power of Multiple Grids for Quantizing Large Language Models [50.9] 量子化の最近の大きな進歩は、NVFP4 や MXFP4 のようなマイクロスケールの4ビットフォーマットによって与えられ、値をスケールを共有する小さなグループに量子化する。
パワー・オブ・ツー・グライド(PO2)問題を定式化し、MXFPやNVFPのような実用的な小群フォーマットがPO2グリッドの恩恵を受けることを示す理論的結果を提供する。
Llama-like モデルの標準開模型のポストトレーニング量子化と事前学習の結果は、重みのみおよび重み+アクティベーションの両方の下で、適応格子が単一グリッド FP4 に対して常に精度を向上することを示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:09:02 GMT)
Trust the Batch, On- or Off-Policy: Adaptive Policy Optimization for RL Post-Training [50.9] 強化学習は、教師付き学習よりも構造的に難しい。
本稿では,固定クリッピングを政策比率の正規化された有効サンプルサイズに置き換える,単純かつ効果的なバッチ適応目的を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:44:47 GMT)
CaC: Advancing Video Reward Models via Hierarchical Spatiotemporal Concentrating [49.9] 本稿では,ビジョンランゲージモデルに基づく粗大な異常報酬モデルである集中と集中(CaC)を提案する。
フレーム単位のバウンディングボックスアノテーション,時間的異常ウィンドウ,微粒な属性ラベルを備えた,最初の大規模ビデオ異常データセットを構築した。
実験では、CaCは微妙な異常に安定して集中することができ、微細な異常ベンチマークの精度が25.7%向上した。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:08:33 GMT)
Split the Differences, Pool the Rest: Provably Efficient Multi-Objective Imitation [49.9] マルチ出力拡張行動クローン(MA-BC)について紹介する。
MA-BCは、振る舞いの衝突が観測されない状態-動作ペアをプールしながら、専門家データを分離する。
我々は,MA-BCが極小であることを示す,多目的模倣学習のための新しい下位境界を確立する。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:49:08 GMT)
A Boundary-Aware Non-parametric Granular-Ball Classifier Based on Minimum Description Length [49.9] 既存のグラニュラーボール分類法は、しばしば手作りの品質基準、近隣ルール、平均分割と停止基準によって駆動される。
本稿では,最小記述長に基づく粒界予測原理(MDL-GBC)を提案する。
18のベンチマークデータセットを用いた実験により,MDL-GBCは古典的手法と競合する分類性能が得られることが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:51:41 GMT)
Under the Hood of SKILL.md: Semantic Supply-chain Attacks on AI Agent Skill Registry [49.8] SKILL.md - エージェントスキルライフサイクルの3つのステージを対象とするアタックのみを調査する。
SKILL.mdは受動的ドキュメントではなく、サードパーティのエージェントが発見し、信頼し、使用する機能を形成する運用テキストであることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:11:54 GMT)
TAR: Text Semantic Assisted Cross-modal Image Registration Framework for Optical and SAR Images [48.9] 本稿では,光学およびSAR画像のためのテキストセマンティック支援型クロスモーダル画像登録フレームワークTARを提案する。
TARは、リモートセンシングシーンや土地被覆カテゴリからのテキストセマンティクスを活用して、モダリティギャップを緩和する。
いくつかの最先端手法よりも強いマッチング性能を実現し、大きな幾何学的変形の下では大きな利得が得られる。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:50:36 GMT)
Learning plug-in surrogate endpoints for randomized experiments [48.5] サロゲートエンドポイントは、ランダム化実験における長期的な結果の代わりに使用される。
短時間のサロゲートは、サロゲートを用いた実験の結果が実際の結果を用いた仮説研究の結果の予測である場合によい。
本稿では,効果予測性を最大化する2つの方法を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:31:04 GMT)
Gradient Clipping Beyond Vector Norms: A Spectral Approach for Matrix-Valued Parameters [48.3] ほとんどの勾配クリッピング規則は、全てのパラメータを重ベクトルとして扱い、現代のベクトルの行列構造を無視する。
実験により、データのアウトリーチは、少数のリード特異値のみを増幅することを示した。
この現象を動機として,特異値で安定化するクリッピングを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:24:59 GMT)
Learning to Communicate Locally for Large-Scale Multi-Agent Pathfinding [48.2] 本稿では,効率的な特徴共有を通じてエージェント間の協調を強化するための学習可能な通信モジュールを提案する。
提案手法は既存の学習ベースMAPFソルバよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:34:31 GMT)
RNA-FM: Flow-Matching Generative Model for Genome-wide RNA-Seq Prediction [48.1] 本研究では,全スライディング画像からのゲノムワイドRNA配列予測のためのフローマッチング生成フレームワークであるRNA-FMを提案する。
RNA-FMは、連続時間条件付き輸送問題として転写予測を定式化する。
スケーラブルで生物学的に解釈可能なゲノムワイド遺伝子発現抑制を可能にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:48:58 GMT)
An Extensive Replication Study of the ABLoTS Approach for Bug Localization [47.9] ABLoTSは、バグの多いソースコードスニペットを将来性のある結果で識別するためのIRBLアプローチである。
このアプローチの再現性について、元のデータセットと2つの拡張データセットを用いて検討する。
ABLoTSのコアであるTraceScoreコンポーネントは、拡張データセットで同等あるいはそれ以上の結果を生成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:54:13 GMT)
Transformer Interpretability from Perspective of Attention and Gradient [47.8] グラディエントはトランスフォーマーの解釈で広く利用されている。
そこで我々は,勾配方向,あるいはより正確には注意方向を導くことによって,それを実現する方法を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:28:01 GMT)
$h$-control: Training-Free Camera Control via Block-Conditional Gibbs Refinement [47.8] textbf$h$-controlは、トレーニングフリーでトレーニングベースの7つの競合相手に対して最高のFVDを達成する。
RealEstate10KとDAVISでは、textbf$h$-controlは7つのトレーニングフリーおよびトレーニングベース競合相手に対して最高のFVDを達成している。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:51:04 GMT)
MemQ: Integrating Q-Learning into Self-Evolving Memory Agents over Provenance DAGs [47.7] 我々は,新たなメモリが生成されるたびに記憶が取得されたことを記録した証明DAGを通じて,クレジットを後方に伝播するMemQを紹介した。
6つのベンチマークで、MemQは、一般化評価とランタイム学習の6つすべてで最高成功率を達成した。
さらに、$と$がEC-MDP構造とどのように相互作用するかを研究し、パラメータ選択と将来の研究の原則的なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:18:41 GMT)
X-Imitator: Spatial-Aware Imitation Learning via Bidirectional Action-Pose Interaction [47.6] X-イミッタ(X-Imitator)は、空間知覚と行動実行を密結合した双方向ループとしてモデル化する多目的デュアルパスフレームワークである。
モジュラーアーキテクチャとして設計され、様々なビジュモータポリシーにシームレスに統合できる。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:13:06 GMT)
GKnow: Measuring the Entanglement of Gender Bias and Factual Gender [47.4] gknowは、性別関連予測の異なるタイプの言語モデルにおいて、性別に関する知識と性別バイアスを評価するためのベンチマークである。
我々は,ニューロンのアブレーションが,ステレオタイプや事実を異にするベンチマークに与える影響を検証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:52:30 GMT)
BitLM: Unlocking Multi-Token Language Generation with Bitwise Continuous Diffusion [47.1] BitLMは、各トークンを固定長バイナリコードとして表現する言語モデルである。
大語彙のソフトマックスをビットワイズデノイングに置き換えることで、BitLMはトークン生成をコンパクトなバイナリ空間における反復的なコミットメントとして再設定する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:02:59 GMT)
Keeping Score: Efficiency Improvements in Neural Likelihood Surrogate Training via Score-Augmented Loss Functions [46.6] パラメータ推論は、しばしば計算に高価な確率関数によってボトルネックされる。
正確なスコア情報を用いて、標準的なバイナリクロスエントロピー損失を増大させることを提案する。
場合によっては、トレーニング時間の1.1倍未満のトレーニングデータを10倍に増やすことができる。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:34:30 GMT)
Conditional Memory Enhanced Item Representation for Generative Recommendation [46.6] ジェネレーティブレコメンデーション(GR)は,セマンティック識別子(SID)の自動生成によって対象項目を予測する,有望なパラダイムとして登場した。
ほとんどのGRメソッドは量子化表現生成パイプラインに従い、まず各項目にSIDを割り当て、次にSID-token埋め込みから入力表現を構築し、最後に自動回帰生成によってターゲットのSIDを予測する。
コンディショナルメモリ拡張アイテム表現フレームワークであるCometIRを提案する。このフレームワークは、アイテム認識入力へのSIDトークンの埋め込みを再構築し、SID復号時にトークンの粒度を復元する。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:56:59 GMT)
AutoLLMResearch: Training Research Agents for Automating LLM Experiment Configuration -- Learning from Cheap, Optimizing Expensive [46.5] 不適切な構成選択は、かなりの計算資源を浪費し、モデルがその潜在能力を最大限に実現できないようにする。
従来の自動手法は、繰り返し試行錯誤が可能な安価な設定のために設計されている。
我々は,人間研究者が低忠実度実験から一般化可能な原理を学習する方法を模倣するエージェントフレームワークであるAutoLLMResearchを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:42:35 GMT)
LPDP: Inference-Time Reward Control for Variable-Length DNA Generation with Edit Flows [46.3] DNA配列生成のための推論時間報酬制御における最近の編集フローの適用について検討する。
本研究では, 可変長DNA編集動作生成器のための訓練不要, 中間状態, 動作対応の局所解法演算子であるローカル摂動離散プログラミング(LPDP)を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:43:08 GMT)
Simultaneously Minimizing Storage and Bandwidth Under Exact Repair With Quantum Entanglement [46.2] エンタングルメント支援分散ストレージシステムの正確な再生符号について検討する。
$(n,k,d,,_mathsfq,B)$の分散システムを考えてみましょう。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:44:37 GMT)
Constraint-Aware Flow Matching: Decision Aligned End-to-End Training for Constrained Sampling [45.7] 深い生成モデルは、幅広いアプリケーションにまたがって最先端のパフォーマンスを提供する。
既存のアプローチでは、サンプルの品質を維持しながら厳格な制約満足度を強制することができない。
本稿では,制約予測をトレーニング対象に明示的に組み込む新しいエンドツーエンドフレームワークであるConstraint-Aware Flow Matchingを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:07:13 GMT)
Tokens-per-Parameter Coverage Is Critical for Robust LLM Scaling Law Extrapolation [45.6] ニューラルスケーリング法則は、パラメータカウント$N$とトークンカウント$D$のパワーロー関数として、言語モデルの損失を近似する。
本稿では,コリニア設計がガウス・ニュートン最小二乗問題に固有の不条件を生じさせることを示す。
これを4つのスケーリング法則形式に対して証明し、十分に条件付き推定に十分必要な閉形式TPP多様性閾値を導出する。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:27:47 GMT)
From Reaction to Anticipation: Proactive Failure Recovery through Agentic Task Graph for Robotic Manipulation [45.4] 本稿では,操作タスクを有向タスクグラフとしてモデル化するエージェントシステムであるAgentChordを紹介する。
実行前に、このグラフには、コンテキスト対応の修正動作を指定する予測リカバリブランチが組み込まれている。
多様な長距離双方向操作タスクに関する実証研究は、AgentChordが成功率と実行効率を大幅に改善することを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:00:45 GMT)
Recurrent Transformer-Based Near- and Far-Field THz Wideband Channel Estimation for UM-MIMO [45.3] 6Gネットワークにおけるテラヘルツ通信と超大容量多重出力(UM-MIMO)システムの統合は、前例のないデータレートを実現する能力によって動機付けられている。
これらのシステムにおけるアンテナ開口の増大とキャリア距離の増大により、レイリー距離は増加し、ユーザは近距離領域と従来の遠距離領域の両方にまたがる。
本稿では,この課題に対処するブロック再帰変圧器モデルを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:44:38 GMT)
3D Primitives are a Spatial Language for VLMs [45.0] 視覚言語モデルは、正確なオブジェクト数、クラス、近似位置を持つ幾何学的プリミティブから3Dシーンを再構成するコードを生成することができるが、同じモデルは同じ画像上のより単純な空間的問題で失敗する。
3次元幾何学的プリミティブは空間的理解のための強力な中間表現として機能し、3つのコントリビューションを通じてこれを活用できることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:57:21 GMT)
$δ$-mem: Efficient Online Memory for Large Language Models [44.9] 我々は,凍結したフルアテンションバックボーンを連想メモリのコンパクトなオンライン状態に拡張する軽量メモリ機構である$-memを提案する。
$-memはデルタルール学習によって更新された固定サイズの状態行列に過去の情報を圧縮し、その読み出しを使ってバックボーンの注意計算の低ランク補正を生成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:31:44 GMT)
MambaPanoptic: A Vision Mamba-based Structured State Space Framework for Panoptic Segmentation [44.9] MambaPanopticは、完全なMambaベースのパン光学セグメンテーションフレームワークである。
トップダウン機能ピラミッドであるMambaFPNを導入し、Mambaブロックを利用してグローバルに一貫性のあるマルチスケール機能表現を生成する。
Cityscapes と Panoptic segmentation ベンチマークの実験では、MambaPanoptic は PanopticDeepLab と PanopticFCN を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:30:49 GMT)
MedMemoryBench: Benchmarking Agent Memory in Personalized Healthcare [44.9] 我々は,現実的な長期医療軌道を合成するための人間とエージェントの協調パイプラインを開発した。
このプロセスは、約2,000のセッションと16,000のインタラクションターンからなる、大規模で専門的に検証されたデータセットを生成する。
これらの根本的な欠陥を明らかにすることで、MedMemoryBenchは堅牢でプロダクション対応の医療エージェントを開発する上で重要な基盤を確立する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:06:40 GMT)
Adaptive Calibration in Non-Stationary Environments [44.8] 複数のキャリブレーション対策の下で適応的なキャリブレーション保証を実現するアルゴリズムの組を開発する。
我々の手法は先行研究(Hu et al., 2026, Luo et al., 2025)の上に構築され、基礎となる基底真理付近でより微細な分解を割り当てる予測空間の非一様分割を導入する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:06:40 GMT)
LOFT: Low-Rank Orthogonal Fine-Tuning via Task-Aware Support Selection [44.8] 本稿では,低ランク直交微調整フレームワークLOFTを紹介する。
適応を乗法的な部分空間回転として見ることにより、LOFTは統一的な定式化を提供する。
本研究は,下流学習信号から有用な適応支援を通知すべきであることを示す一階述語分析法を開発した。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:51:55 GMT)
When Does Non-Uniform Replay Matter in Reinforcement Learning? [43.8] 非一様リプレイの有効性は, 再生量, 環境ステップ毎の再生遷移数, 期待精度, サンプル遷移の頻度, リプレイサンプリング分布のエントロピーの3つの要因に支配されている。
我々は,高エントロピーと無視できない計算オーバーヘッドを保ちながら,サンプリングを最近の経験に偏りを与える,単純なTrncated Geometric replayを採用する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:56:30 GMT)
HorizonDrive: Self-Corrective Autoregressive World Model for Long-horizon Driving Simulation [43.6] HorizonDriveはAR駆動シミュレーションのためのアンチドリフティングトレーニング・アンド・蒸留フレームワークである。
境界メモリ下でのミニスケールARロールアウトをサポートする。
FIDを52%下げ、FVDを37%下げ、AREとDTWを9%下げる。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:22:16 GMT)
When Looking Is Not Enough: Visual Attention Structure Reveals Hallucination in MLLMs [43.4] 本稿では,LaSCD(Laplacian-Spectral Contrastive Decoding)を提案する。
幻覚と一般的なマルチモーダルベンチマークの実験では、LaSCDは一般の能力を保ちながら、常に幻覚を減少させる。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:42:11 GMT)
OrbiSim: World Models as Differentiable Physics Engines for Embodied Intelligence [43.4] OrbiSimは、世界モデルを再定義する新しいロボットシミュレーションパラダイムで、インテリジェンスを具現化するための、完全に微分可能な物理エンジンである。
OrbiSimは、構造化されたシーンアセット、ニューラルダイナミクス、下流の強化学習を橋渡しする統合された物理的基盤の経路を確立する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:43:53 GMT)
M$^4$-SAM: Multi-Modal Mixture-of-Experts with Memory-Augmented SAM for RGB-D Video Salient Object Detection [43.2] メモリ拡張SAM (M$4$-SAM) を用いたマルチモーダル混合実験を行い, SAM2 にモダリティ関連PEFT と階層的特徴融合を実装した。
M$4$-SAMは、3つのパブリックRGB-D VSODデータセット上のすべての評価指標の最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:33:08 GMT)
Block-R1: Rethinking the Role of Block Size in Multi-domain Reinforcement Learning for Diffusion Large Language Models [41.9] ブロックサイズはdLLMにおいて重要な要素となっている。
本稿では,マルチドメインシナリオにおけるDLLM RLポストトレーニングにおけるドメインコンフリクトの観点からのブロックサイズについて検討する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:09:42 GMT)
TextSeal: A Localized LLM Watermark for Provenance & Distillation Protection [41.8] TextSealは、大規模な言語モデルのための最先端の透かしである。
Gumbel-maxサンプリングに基づいて、TextSealは出力の多様性を回復するためにデュアルキー生成を導入している。
投機的復号化やマルチトークン予測などの最適化もサポートしている。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:44:41 GMT)
GRAFT: Graph-Tokenized LLMs for Tool Planning [41.7] 大規模言語モデル(LLM)は、複数のステップで外部ツールを選択し調整することで、複雑なタスクを完了させるのにますます使われています。
これにより、ツール間の方向性の実行依存関係を満足しながら、サブタスクインテントとツールの選択を整合させる必要がある。
本稿では,依存認識ツール計画のためのグラフ学習言語モデルフレームワークであるGRAFTを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:59:41 GMT)
Controllable User Simulation [41.7] この研究は、因果推論問題として制御可能なシミュレーションを定式化する。
本研究では, 教師付き微調整による訓練シミュレータの標準的な実践が, 構造的に偏りのあるモデルをもたらすことを示す。
本稿では,事前制御,ステップワイズ動的制御,方針条件付き直接学習など,実践的なトレーニング緩和を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:44:29 GMT)
Quantum state isomorphism problems for groups [41.5] 群作用下での量子状態同型問題の計算複雑性について検討する。
純粋状態バージョンの場合、問題はすべての非自明な群に対して BQP-hard であることが示される。
混合状態バージョンの場合、非自明で有限で効率的な表現可能な群に対して、問題はQSZK完全である。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:05:27 GMT)
GaitProtector: Impersonation-Driven Gait De-Identification via Training-Free Diffusion Latent Optimization [41.4] GaitProtectorは、偽装駆動の歩行識別フレームワークである。
ソースアイデンティティから保護された歩留まりを再現し、偽装によって選択されたターゲットアイデンティティへと引き寄せる。
CASIA-Bデータセットの実験では、GaitProtectorが5つの偽装の成功率を達成した。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:27:56 GMT)
Training Transformers for KV Cache Compressibility [41.1] KV圧縮性は文脈のみでなく,学習した表現の特性であることを示す。
そこで本研究では,圧縮可能な表現の出現を動機づける,継続した事前訓練手順であるKV-Compression Aware Training (KV-CAT)を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:42:09 GMT)
Sycophantic AI makes human interaction feel more effortful and less satisfying over time [41.0] 我々は、サイコファンティックAIが、ユーザーが通常親しい友人や家族と結びつく感情的および評価的サポートを即座に提供することを示した。
AIレスポンスのスタイルの中から選択肢を与えられた場合、大多数は、そのアドバイスの品質ではなく、最も理解されたと感じたため、サイコファンティックなAIを好んだ。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:21:05 GMT)
Information theoretic underpinning of self-supervised learning by clustering [40.9] 自己教師型学習は、人工知能アプリケーションの基礎モデルを構築するための重要なツールとして認識されている。
本稿では,SSLの基盤となる理論の発展に寄与し,深層クラスタリングのアプローチに着目する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:50:11 GMT)
The tractability landscape of diffusion alignment: regularization, rewards, and computational primitives [40.8] 推論時報酬アライメントは、事前訓練された拡散モデルに基本法則$p$をサンプルにする方法を問う。
我々は、$q(x)propto p(x)exp(langle, x rangle)$ という形の線型指数傾斜が、非常に広い凸な低次元報酬のクラスに整列するのに十分な原始的であることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:25:57 GMT)
SAGE: A Self-Evolving Agentic Graph-Memory Engine for Structure-Aware Associative Memory [40.7] 本稿では,グラフメモリを動的長期記憶基板としてモデル化する自己進化型エージェントグラフメモリエンジンであるSAGEを紹介する。
SAGEには2つの役割がある: 相互作用履歴から構造化されたグラフメモリを漸進的に構成するメモリライタと、検索とメモリライタへのフィードバックを提供するGraph Foundation Modelベースのメモリリーダである。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:47:43 GMT)
UHR-Micro: Diagnosing and Mitigating the Resolution Illusion in Earth Observation VLMs [40.3] VLM(Vision-Language Models)は、超高解像度(UHR)地球観測画像で動作する。
これらのモデルは、大規模なシーンコンテキストとマイクロスケールターゲットの間の深刻なスケールミスマッチに対して脆弱である。
11,253の命令を1,212のUHR画像にグラウンドしたベンチマークであるUHR-Microで、この課題をベンチマークする。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:07:30 GMT)
EgoForce: Forearm-Guided Camera-Space 3D Hand Pose from a Monocular Egocentric Camera [40.3] EgoForceは、頑丈で絶対的な3Dハンドポーズを復元する、単眼の3Dハンドコンストラクションフレームワークである。
魚眼、視界、歪んだ広視野のカメラモデルを単一の統一ネットワークで運用する。
EgoForceは最先端の3D精度を実現し、カメラ空間のMPJPEを最大28%削減する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:59:56 GMT)
RecRM-Bench: Benchmarking Multidimensional Reward Modeling for Agentic Recommender Systems [40.2] 本稿では,エージェントレコメンデータシステムにおいて,これまでで最大かつ最も包括的なベンチマークであるRecRM-Benchを紹介する。
4つの中核評価次元にまたがる100万以上の構造化されたエントリで構成されている。命令従順、事実整合性、クエリ-イテム関連性、きめ細かいユーザ行動予測である。
本稿では,多次元報酬モデルの構築とハイブリッド報酬関数の統合のための体系的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:52:21 GMT)
TrackCraft3R: Repurposing Video Diffusion Transformers for Dense 3D Tracking [39.9] 我々は、ビデオDiTをフィードフォワード高密度3Dトラッカーとして再利用する最初の方法であるTrackCraft3Rを提案する。
TrackCraft3Rは、スパースと高密度な3Dトラッキングベンチマークで最先端のパフォーマンスを達成しつつ、1.3倍高速で4.6倍のピークメモリを使用する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:59:27 GMT)
OTT-Vid: Optimal Transport Temporal Token Compression for Video Large Language Models [39.9] OTT-Vidは、時間的トークン圧縮のためのトランスポートから派生したアロケーションフレームワークである。
OTT-VidはVQAの95.8%、VTGのパフォーマンスの73.9%を維持し、トークンの10%しか保持していない。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:58:49 GMT)
PointForward: Feedforward Driving Reconstruction through Point-Aligned Representations [39.8] 本稿では,ポイントアライン表現によるフィードフォワード駆動型再構築フレームワークであるPointForwardを提案する。
画素アライメント法とは異なり、時空間融合により多視点画像情報を集約する。
本手法は,インスタンスレベルの動き伝搬と時間的に一貫した動的表現を可能にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:20:59 GMT)
Retrieve-then-Steer: Online Success Memory for Test-Time Adaptation of Generative VLAs [39.5] 本稿では,VLAモデルのためのオンライン成功メモリ誘導テスト時間適応フレームワークを提案する。
展開中、ロボットは長期記憶に進捗校正された観察動作セグメントを格納する。
推論時に状態関連アクションチャンクを取得し、トラジェクトリレベルの一貫性を通じて一貫性のない候補をフィルタし、それらを前もってエリートアクションに集約する。
この設計により、凍結したVLAは、観測条件付き世代改良を保ちながら、環境特有の成功体験を利用することができる。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:39:28 GMT)
MLPs are Efficient Distilled Generative Recommenders [39.5] セマンティックID(SID)を用いた生成モデルは大きな可能性を秘めているが、その実践的展開は推論のレイテンシの高さによってボトルネックになっている。
本研究では,標準的な注目度の高いトランスフォーマーデコーダが,このタスクに対する構造的オーバースキルであることを示す。
本稿では,GRのデコードパラダイムを根本的に単純化する軽量中心蒸留フレームワークであるSID-MLPを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:05:55 GMT)
Efficient and Adaptive Human Activity Recognition via LLM Backbones [39.4] 本稿では,大規模事前学習言語モデル(LLM)をセンサベースHARの汎用時間バックボーンとして再利用するパラダイムシフトを提案する。
提案手法は, 高速収束, 強力なデータ効率, 堅牢なデータ転送を実現する。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:06:39 GMT)
Keep What Audio Cannot Say: Context-Preserving Token Pruning for Omni-LLMs [38.9] 推論時間トークンのプルーニングフレームワークとしてContextGuardを提案する。
ContextGuardは、音声から粗い視覚的セマンティクスを予測し、ビデオトークンをプーンする。
入力トークンの55%をプルーニングしながら、6つのベンチマークのうち5つでフルトーケンレベルのパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:35:29 GMT)
Selective Off-Policy Reference Tuning with Plan Guidance [38.7] SORTはロールアウト生成を変更することなく、これらの障害を修復するアップデートを追加した。
SORTは、オールホワイトプロンプトを均一な模倣ではなく、選択的で構造対応の学習信号に変える。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:25:41 GMT)
Counterfactual Trace Auditing of LLM Agent Skills [38.4] スキルがエージェントの振る舞いをどのように変化させるかを測定するためのフレームワークを紹介します。
SWE-Skills-Bench上のCTAを49のソフトウェアエンジニアリングタスクでClaudeでインスタンス化する。
パスレートは平均で0.3ポイントしか変化せず、集合効果はほとんどなかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:56:18 GMT)
Towards Automated Air Traffic Safety Assessment Around Non-Towered Airports Using Large Language Models [37.9] 大型言語モデル(LLM)を用いた空港の飛行後安全分析の枠組みについて検討する。
自然言語における転写CTAF無線通信を解析するための汎用視覚言語モデル(VLM)を提案する。
我々は,Gemini 2.5 Proを用いて,実際の飛行データに関する枠組みを質的に評価し,権利侵害の正確な識別を実証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:15:15 GMT)
Mapping Embodied Affective Touch Strategies on a Humanoid Robot [37.8] 本研究は,iCubロボットと対話する32人の被験者を対象とした研究である。
その結果, 体域と空間的制約は, タッチ位置とダイナミックスの両方を共同で形成していることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:13:10 GMT)
3D-Belief: Embodied Belief Inference via Generative 3D World Modeling [37.8] 我々は,部分的な観察から明確で行動可能な3D信念を推論し,時間とともにオンラインに更新する3Dワールドモデルである3D-Beliefを提示する。
従来の視覚予測モデルとは異なり、3D-Beliefは3Dで直接不確実性を示しており、具体化されたエージェントは、部分的に観察された環境について、もっともらしいシーンの完了と推論を想像することができる。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:42:27 GMT)
FlashClear: Ultra-Fast Image Content Removal via Efficient Step Distillation and Feature Caching [37.3] 拡散に基づくオブジェクト除去モデルは、すべてのタイムステップで全てのトークンを無差別にデノベートし、除去は通常小さな前景領域を含むことを無視する。
本稿では,領域認識型適応蒸留 (RAD) を実装するための潜在判別器を提案し,FlashClear という高効率な数ステップモデルを提案する。
さらに,FPAC (Foreground-Prioritized Asymmetric Attention and Caching) は,FPAC (Foreground-Prioritized Asymmetric Attention and Caching) を学習不要な加速戦略として提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:32:46 GMT)
CAMPA: Efficient and Aligned Multimodal Graph Learning via Decoupled Propagation and Aggregation [37.0] マルチモーダルグラフニューラルネットワーク(MGNN)は、マルチモーダル属性グラフから学習する強力な可能性を示している。
既存のアプローチのほとんどは、計算オーバーヘッドの禁止に苦しむ密結合アーキテクチャに依存している。
本稿では,大規模なグラフ学習において,疎結合なMGNNの方がはるかに効率的かつスケーラブルであることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:32:54 GMT)
SeePhys Pro: Diagnosing Modality Transfer and Blind-Training Effects in Multimodal RLVR for Physics Reasoning [37.0] SeePhys Proは、重要な情報がテキストから画像へ徐々に転送されるときに、モデルが同じ推論能力を維持するかどうかを研究するベンチマークである。
評価の結果,情報量が言語からダイアグラムへと変化するにつれて,性能が平均的に低下し,視覚的変動グラウンドが最も重要なボトルネックとなることがわかった。
この効果を解析するために、テキスト削除、画像マスクレート、フォーマット飽和制御は、有効な視覚的証拠ではなく、残存するテキストと分布の手がかりから生じる可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:15:36 GMT)
Principled Design of Diffusion-based Optimizers for Inverse Problems [37.0] 本稿では、不変性を誘導し、複数の問題にまたがって同一のハイパーパラメータを再調整することなく再利用できる基本的再パラメータ化を提案する。
OptDiffは、推論を高速化するための凸最適化ツールの統合を容易にする、シンプルなチューニングフレームワークを提供する。
画像再構成、デブロアリング、超高解像度化の実験は、かなりのスピードアップと画質の向上を示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:25:49 GMT)
Security of decoy-state quantum key distribution with correlated bit-and-basis encoders [36.9] 相関関係は、多くの広く使われているセキュリティ証明技術が依存しているラウンド・バイ・ラウンドの独立構造を破る。
我々は、一般的なコヒーレント攻撃に対するデコイ状態BB84の有限鍵セキュリティ証明を開発する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:37:36 GMT)
Few-Shot Synthetic Data Generation with Diffusion Models for Downstream Vision Tasks [36.9] クラス不均衡は視覚認識において永続的な課題である。
稀なクラスの20~50個の実画像にLoRAアダプタを微調整する,軽量な合成データ拡張パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:11:57 GMT)
Logit-Attention Divergence: Mitigating Position Bias in Multi-Image Retrieval via Attention-Guided Calibration [36.9] マルチモーダル言語モデル (MLLM) は, マルチモーダル・クロスモーダル検索において高い性能を示した。
しかし、予測は意味的関連性よりも入力順序に支配される厳しい位置バイアスに悩まされる。
そこで本研究では,本質的な注意信号を利用した学習自由な注意誘導型脱バイアスフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:17:01 GMT)
UniVLR: Unifying Text and Vision in Visual Latent Reasoning for Multimodal LLMs [36.7] テキスト推論と補助的視覚証拠を共有視覚ワークスペースとして扱う統合視覚潜在推論フレームワークを提案する。
我々は,UniVLRが生成した推論トークンをはるかに少なく使用しながら,従来の視覚的潜在推論手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:40:03 GMT)
Debiased Model-based Representations for Sample-efficient Continuous Control [36.7] 本稿では,Q-learning, タグ付きDR.Qアルゴリズムのためのデバイアスモデルに基づく表現を提案する。
DR.Qは、現在の状態-作用対と次の状態の表現の間の相互情報を明示的に最大化する。
我々の結果によると、DR.Qは最近の強いベースラインと一致または超えることができ、時には大きなマージンでそれらを上回ります。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:02:34 GMT)
Multi-Stream LLMs: Unblocking Language Models with Parallel Streams of Thoughts, Inputs and Outputs [35.6] 逐次メッセージフォーマットの命令チューニングから並列処理の並列ストリームの命令チューニングに切り替えることで,モデルをブロック解除できることを示す。
言語モデルのすべてのフォワードパスは、同時に複数の入力ストリームから読み込み、複数の出力ストリームでトークンを生成します。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:47:41 GMT)
Fill the GAP: A Granular Alignment Paradigm for Visual Reasoning in Multimodal Large Language Models [35.3] 視覚的潜在推論により、マルチモーダルな大言語モデル(MLLM)は、中間的な視覚的エビデンスを連続トークンとして生成する。
視覚潜在モデルのためのtextbfGranular textbfAlignment textbfParadigm を提案する。
Qwen2.5-VL 7Bでは,教師付き変種のうち,最高の平均集合認識と推論性能が得られる。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:41:09 GMT)
FlashAR: Efficient Post-Training Acceleration for Autoregressive Image Generation [35.2] 我々は、訓練済みの自己回帰モデルを高並列ジェネレータに効率的に適応する軽量なポストトレーニング適応フレームワークであるFlashARを紹介した。
FlashARは512x512の画像生成で最大22.9倍のスピードアップを達成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:20:13 GMT)
Active Sensing with Meta-Reinforcement Learning for Emitter Localization from RF Observations [34.9] グローバルナビゲーション衛星システム(GNSS)の干渉は、信頼性の高い位置決めに深刻な脅威をもたらす。
本稿では,アクティブセンシング問題として干渉局所化を定式化する。
本研究では,エージェントが環境を逐次探索し,エミッタ源の位置を推定する強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:03:41 GMT)
FlowSteer: Prompt-Only Workflow Steering Exposes Planning-Time Vulnerabilities in Multi-Agent LLM Systems [34.8] FlowSteerはプロンプトのみのワークフローステアリング攻撃で、脆弱性の優先順位をひとつのプロンプトに変換する。
インプットサイドのディフェンスであるFlowGuardを導入し、迅速なユーティリティを保ちながら、悪意のある成功を最大34%削減する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:35:57 GMT)
SDG-MoE: Signed Debate Graph Mixture-of-Experts [34.7] ほとんどのMoEアーキテクチャでは、トークンがルーティングされると、選択された専門家が独立してそれを処理し、その出力は重み付けされた和で結合される。
最終集計の前に,軽量かつ反復的な検討段階を付加する新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:55:50 GMT)
Spectral Vision Transformer for Efficient Tokenization with Limited Data [34.7] 限られたデータにおける効率的なトークン化のための新しいスペクトルビジョン変換器アーキテクチャを提案する。
空間的視覚変換器と比較して,スペクトル投影による複雑性の低下が認められた。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:13:35 GMT)
TriVAL: A Tri-Validation Framework for Faithful Automatic Optimization Modeling [33.8] 自動最適化モデリングの3段階において明示的な検証を行うフレームワークであるTriVALを紹介する。
各ステージでは、TriVALはコンストラクト-バリデート-リビジョンループに従って、現在の結果をステージ固有の基準で評価し、必要に応じて修正する。
実験の結果、TriVALは最先端の手法よりも一貫して優れており、最も難しい問題に対して最大の利益があることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:13:20 GMT)
Is Video Anomaly Detection Misframed? Evidence from LLM-Based and Multi-Scene Models [33.8] ビデオ異常検出の研究は、様々な場面にまたがる正常性の一般的なモデルに重点を置いて、急速に拡大している。
この焦点は、通常の振る舞いのシーン固有の、文脈に依存した性質をモデル化することから遠ざかっている。
VADの有意義な進歩には, 単一シーン, 空間認識, 説明可能な定式化に新たな焦点をあてることが必要である。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:29:49 GMT)
Hierarchical LLM-Driven Control for HAPS-Assisted UAV Networks: Joint Optimization of Flight and Connectivity [33.7] INTN(Integrated terrestrial and non-terrestrial network)で動作するマルチUAVシステムについて検討する。
衝突回避,効率的な交通流,そして動的かつ部分的に観測可能な条件下での信頼性の高い通信を確保するために,UAVが自身の動きに適応しなければならない3次元空路シナリオを考察する。
我々は,大規模言語モデル(LLM)による階層型マルチレート制御フレームワークを提案する。世界レベルでは,HAPS上のLLMベースのコントローラが,ロードバランシングとハンドオーバ決定のための長期計画を実行する。
ローカルレベルでは、各UAVは遅い時間スケールを統合するハイブリッドコントローラを使用する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:27:14 GMT)
GEAR: Granularity-Adaptive Advantage Reweighting for LLM Agents via Self-Distillation [33.4] Granularity-AdaptivE Advantage Reweightingはトークンレベルの信号とセグメントレベルの信号を使って、軌跡レベルのGRPOの利点を再評価する。
GEARは、標準のGRPO、自己蒸留のみのベースライン、トークンまたはターンレベルのクレジット割り当てメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:38:38 GMT)
Checkup2Action: A Multimodal Clinical Check-up Report Dataset for Patient-Oriented Action Card Generation [33.1] textbfCheckup2Action, a multimodal clinical check-up report dataset and benchmark for structured textitAction Card generation。
このデータセットには、人口統計情報、身体検査、実験室のテスト、心臓血管アセスメント、画像関連証拠、医師の要約を含む2,000の未確認の現実世界のチェックアップレポートが含まれている。
我々は、制約付き構造化された生成タスクとしてチェックアップ・ツー・アクションの生成を定式化し、課題のカバレッジと精度、優先順位の整合性、部門と時間の推奨精度、アクションの複雑さ、有用性、可読性、安全コンプライアンスを網羅する評価プロトコルを導入する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:58:23 GMT)
Mind the Pause: Disfluency-Aware Objective Tuning for Multilingual Speech Correction with LLMs [32.9] ASRの書き起こしには、フィラー、繰り返し、偽の開始などの不一致がしばしば含まれている。
既存のアプローチのほとんどは、除去のための非流動的なトークンを特定することに焦点を当てた古典的なモデルに依存している。
本稿では,まずシーケンスタグが不自由なトークンをマークする多言語補正パイプラインを提案し,これらの信号はLLMの微調整を指導し,書き起こしを流用テキストに書き換える。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:11:36 GMT)
Failing Forward: Adaptive Failure-Informed Learning for Vision-Language-Action Models [32.9] 本稿では,拡散型および流路型VLAポリシーに対する適応的負のガイダンスとして,障害軌跡を利用するエンドツーエンドフレームワークを提案する。
AFILはトレーニング済みのVLAを使用して、オンラインの障害ロールアウトを生成する。
その後、デュアルアクションジェネレータ(DAG)を共同で訓練し、共通の視覚言語バックボーンを共有しながら、動作が成功し失敗する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:21:07 GMT)
When Simulation Lies: A Sim-to-Real Benchmark and Domain-Randomized RL Recipe for Tool-Use Agents [32.5] ツール使用による部分的に観測可能なマルコフ決定過程(POMDP)における実測ギャップとしての失敗について検討する。
本稿では,ドメインランダム化強化学習(RL)レシピであるToolRL-DRを提案する。
3Bバックボーンでは、ToolRL-DR-Fullは約4分の3のクリーンな精度を維持し、オープンソースの14B関数呼び出しベースラインに匹敵する集計精度に達する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:40:28 GMT)
Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning [32.5] 永続的なスキルライブラリにより、言語モデルエージェントはタスク間で成功した戦略を再利用できる。
既存の手法は、これらの機能を分離または別々の報酬源で最適化し、部分的かつ矛盾する進化をもたらす。
Skill1は,共有タスクアウトカム目標に向けて,スキル選択,利用,蒸留を共同開発するための単一の政策を訓練するフレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:25:23 GMT)
Think, then Score: Decoupled Reasoning and Scoring for Video Reward Modeling [32.5] ビデオ報酬モデルは、さまざまなシナリオで人間の好みに合わせて正確な報酬を予測する必要がある。
textitDiscriminative RMs regress rewards direct on features by multimodal large language model without explicit reasoning。
トレーニング効率が高く一般化可能なビデオ報酬モデルであるDeScoreを紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:25:12 GMT)
Learning What Matters: Adaptive Information-Theoretic Objectives for Robot Exploration [32.5] 目的は、モデルパラメータの不確実性を低減するデータへの探索をガイドすることである。
多くのパラメータ方向は観測不能か識別不能であり、識別可能な方向が選択されたとしても、省略方向は探索や歪んだ情報測定に影響を与えうる。
Qfootnotesize OEDは最適な実験設計に基づく適応情報である。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:07:27 GMT)
Nautilus: From One Prompt to Plug-and-Play Robot Learning [32.0] NAUTILUSはオープンソースのハーネスで、単一のユーザプロンプトを準備可能な複製、評価、デプロイに変換する。
既存の実装に必要なアダプタやコンテナを自動的に生成するだけでなく、新規あるいはユーザが提供するポリシ、シミュレータ/ベンチマーク、ロボットをラップしてオンボードすることも可能だ。
成長を続けるロボット学習エコシステムにおいて、家族間の複製と評価の工学的負担を軽減することを目的としている。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:26:39 GMT)
Multi-Rollout On-Policy Distillation via Peer Successes and Failures [31.7] 大規模な言語モデルは、しばしばスパース検証器の報酬で訓練後、サンプルの軌道が成功するかどうかを示すが、推論が成功するか失敗するかについての限られたガイダンスを提供する。
オンライン蒸留(OPD)は、学生が生み出す軌跡の訓練により、より密集したトークンレベルの監督を提供する。
我々は,学生のローカルロールアウトグループを用いて,より情報のある教師信号を構築する,ピアコンディショニング蒸留フレームワークであるMulti-Rollout On-Policy Distillation (MOPD)を紹介した。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:57:44 GMT)
No Action Without a NOD: A Heterogeneous Multi-Agent Architecture for Reliable Service Agents [31.7] 大型言語モデル(LLM)エージェントは、フライトチケットの予約などの高度なサービス応用が増えている。
サービスエージェントのための異種マルチエージェントアーキテクチャであるNOD(Navigator-Operator-Director)を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:10:15 GMT)
Chronicles-OCR: A Cross-Temporal Perception Benchmark for the Evolutionary Trajectory of Chinese Characters [31.3] 我々は、視覚大言語モデルにおける時間的視覚知覚能力を評価するために特別に設計された最初の総合的なベンチマークであるChronicles-OCRを紹介する。
データセットは、トルトーゼの殻から紙ベースの書道まで、非常に多様な物理メディアを含む、厳密にバランスのとれた2,800枚の画像で構成されている。
クロニクルス-OCRは、4つの厳密な量的タスクを定式化している: クロス周期文字スポッティング、ビジュアル参照によるきめ細かい古文字認識、古代のテキスト解析、スクリプト分類である。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:14:25 GMT)
RealDiffusion: Physics-informed Attention for Multi-character Storybook Generation [31.3] リアルディフュージョン(RealDiffusion)は、物語的ダイナミズムと物語的コヒーレンスを調和させる枠組みである。
熱拡散は、その配列に沿って隣接する特徴を平均する散逸前として機能する。
地域を意識したプロセスは、近くのモードを探索する摂動を排除し、ストーリーが変化とシーンの進化のポーズを維持するために崩壊を防ぐ。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:39:45 GMT)
Pion: A Spectrum-Preserving Optimizer via Orthogonal Equivalence Transformation [30.9] 直交同値変換に基づく大規模言語モデル(LLM)学習のためのスペクトル保存であるPionを導入する。
Pion の更新規則は設計選択を体系的に検討し、その収束挙動といくつかの重要な特性を解析する。
実証的な結果から、Pionは事前学習と微調整の両方に標準LLMに代わる安定かつ競争的な代替手段を提供することが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:59:34 GMT)
SafeSteer: A Decoding-level Defense Mechanism for Multimodal Large Language Models [30.8] 本稿では,MLLMの復号レベル防衛機構であるSafeSteerを紹介する。
復号中に有害な出力を検出し修正するための復号プローブを含む。
MLLMの安全性は、微調整なしで最大33.40%向上できる。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:05:10 GMT)
The DAWN of World-Action Interactive Models [30.8] 世界予測と行動生成は、孤立した並列分岐または厳格な予測理論計画パイプラインとして扱われる。
textbfDAWN (textbfDenoising textbfActions and textbfWorld itextbfNteractive model) は単純だが強力な遅延生成ベースラインである。
DAWNは、複数の自律運転ベンチマークで強い計画性能と良好な安全関連結果を達成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:30:00 GMT)
Enabling Deterministic Passive Quantum State Transfer with Giant Atoms [30.6] 受動的に量子状態移動を達成することは、スケーラブルな量子ネットワークの強力な資産となる。
1次元導波路に結合した巨大原子が、そのような受動的決定論的移動の基盤を提供することを示す。
本研究は,時間依存制御なしで高忠実度量子状態伝達を実現するための強力なプラットフォームとして,巨大原子を確立した。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:06:28 GMT)
SafeManip: A Property-Driven Benchmark for Temporal Safety Evaluation in Robotic Manipulation [30.6] 本稿では,ロボット操作における時間的安全特性を明示的に評価するためのプロパティ駆動型ベンチマークであるSafeManipを紹介する。
SafeManipは、有限トレース上の線形時間論理(LTLf)を用いて、有限実行上の再利用可能な安全テンプレートを定義する。
我々は,50のRoboCasa365家計タスクに対して,$_0.5$,GR00T,およびそれらのトレーニングバリエーションを含む6つの視覚言語アクションポリシーについてSafeManipを評価した。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:49:28 GMT)
Agentick: A Unified Benchmark for General Sequential Decision-Making Agents [30.0] Agentickはシーケンシャルな意思決定エージェントのベンチマークである。
プロシージャで生成されたタスクは6つの機能カテゴリ、難易度レベル4、観察モード5で37になる。
27のコンフィグレーションと90,000以上のエピソードにまたがる評価では、単一のアプローチが支配的でないことが示されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:33:33 GMT)
DySurface: Consistent 4D Surface Reconstruction via Bridging Explicit Gaussians and Implicit Functions [30.0] 動的シーンにおける暗黙的距離関数(SDF)の幾何学的忠実度で、明示的なガウス的効果を橋渡しする新しいフレームワークであるDySurfaceを提案する。
具体的には,変形したガウスを生かしたVoxGS-DSDF分岐を用いて,動的スパースボクセル格子を構築し,暗黙のSDF場への幾何的ガイダンスを提供する。
この明示的なアンカーは、ボリュームレンダリングプロセスを効果的に調整し、水密境界と詳細な表現で表面再構成品質を著しく改善する。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:49:40 GMT)
A Unified Graph Language Model for Multi-Domain Multi-Task Graph Alignment Instruction Tuning [29.8] グラフ言語モデル(GLM)は、大規模言語モデル(LLM)の一般化能力とグラフニューラルネットワーク(GNN)の構造モデリング能力を組み合わせたものである。
GNNをグラフエンコーダとして採用している既存のGLMは、ドメインやタスク間でGNN符号化表現をLLMトークン空間と整合させるという問題をほとんど見落としている。
マルチドメインのマルチタスクGNNエンコーダを組み込んだ統一グラフ言語モデルUniGraphLMを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:37:34 GMT)
Action Emergence from Streaming Intent [29.8] 我々は、エンド・ツー・エンドの自動運転の目標能力としてアクションの出現を定式化する。
従来のパラダイムでは、アクションの出現はできません。
本稿では,運転意図を意味的にストリーム化するメカニズムとしてStreaming Intentを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:09:04 GMT)
From Message-Passing to Linearized Graph Sequence Models [29.7] 線形化グラフシーケンスモデル(Linearized Graph Sequence Models)は、シーケンスモデリングの観点からメッセージパッシンググラフ計算をリキャストするフレームワークである。
グラフ帰納バイアスの学習と保存に有効なシーケンス特性を実証的および理論的に分析する。
本研究は、メッセージパスに基づくグラフ学習に現代シーケンスモデリングの進歩を統合するための原則的な方法を提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:32:04 GMT)
Towards Visually-Guided Movie Subtitle Translation for Indic Languages [29.6] 映画の字幕翻訳は本質的にマルチモーダルであるが、テキストのみのシステムは感情、行動、社会的ニュアンスを伝えるのに必要な視覚的手がかりを見逃すことが多い。
本稿では,5本のフル長フィルムをケーススタディとして,2つの軽量視覚接地戦略を比較した。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:43:57 GMT)
STRIDE: Training-Free Diversity Guidance via PCA-Directed Feature Perturbation in Single-Step Diffusion Models [29.6] 我々は、数ステップモデルにおける効果的な多様性注入は、モデルの学習された特徴幾何学を尊重する摂動を必要とすると主張している。
本研究では,1つのフォワードパスで動作可能な,トレーニング不要かつ最適化不要なSTRIDEを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:10:42 GMT)
EvoNav: Evolutionary Reward Function Design for Robot Navigation with Large Language Models [29.6] EvoNavは、大型言語モデル(LLM)によるロボットナビゲーション報酬関数の設計を自動化する進化的フレームワークである。
実験結果から,EvoNavは手作業で設計したRL報酬や最先端の報酬設計手法よりも効果的なナビゲーションポリシーを生成することがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:43:21 GMT)
Emergent and Subliminal Misalignment Through the Lens of Data-Mediated Transfer [29.6] 我々は、創発的ミスアライメントはデータ経由の転送現象として理解しやすいと論じる。
微調整と評価が類似した機能構造を共有すると,誤認識がより容易に現れることが判明した。
さらに、有害な教師が生み出す一見良質なデータを微調整することで、誤認識を伝達するサブリミナルラーニング(SL)についても検討する。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:27:32 GMT)
VulTriage: Triple-Path Context Augmentation for LLM-Based Vulnerability Detection [29.6] VulTriageは脆弱性検出のための3重パスコンテキスト拡張フレームワークである。
VulTriageは、主要なペアワイドおよび分類指標上で最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:46:16 GMT)
Rethinking Positional Encoding for Neural Vehicle Routing [29.1] ルーティング対応PEが尊重すべき3つの構造特性を定式化する。
距離インデックス付き,円弧的に整合したインルート符号化とデポ型アンコール角方向のクロスルート符号化を組み合わせた階層型異方性計測PEを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:22:31 GMT)
Efficient Adjoint Matching for Fine-tuning Diffusion Models [29.1] 本研究では,テキストベースドリフトとテキスト端末コストでSOC問題を修正し,トレーニング効率を大幅に向上するEMAを提案する。
EAMはAMよりも最大4倍早く収束し、PickScore、ImageReward、HPSv2.1、CLIPScore、Aestheticsなど様々なメトリクスにマッチするか、超える。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:55:12 GMT)
NOVA: Fundamental Limits of Knowledge Discovery Through AI [28.6] 本研究では,共通生成,検証,蓄積,再学習のループを知識空間上の適応的サンプリングプロセスとしてモデル化するNOVAフレームワークを提案する。
蓄積された真の知識が最終的に有限領域をカバーする十分な条件を特定し、それらの違反がどのように異なる障害モードを生成するかを示す。
我々は、ガイダンス、生成、検証、検証を通じて人間の増幅を形式化し、専門家の入力が自律的な探査障壁の近くで最も価値がある理由を説明する。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:37:09 GMT)
GeoQuery: Geometry-Query Diffusion for Sparse-View Reconstruction [28.5] 3D Gaussian Splatting (3DGS) は、3D再構成と新しいビュー合成のための顕著なパラダイムとして登場した。
提案するGeoQueryは,生成前処理と明示的な幾何学的手がかりを統合した幾何学誘導拡散フレームワークである。
GeoQueryは既存の拡散ベースのパイプラインにシームレスに統合することができ、極端なビュー間隔の下でも堅牢な再構築を可能にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:00:47 GMT)
P-Flow: Proxy-gradient Flows for Linear Inverse Problems [28.4] P-Flowは、プロキシ勾配を利用してソースポイントを更新することで、再構築プロセスを安定化するフレームワークである。
さまざまな復元タスクに対する実験は、P-Flowが競争力のあるパフォーマンスを提供することを示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:13:53 GMT)
Adaptive TD-Lambda for Cooperative Multi-agent Reinforcement Learning [28.3] いくつかの最近の研究は、適応的な$$値と、単一エージェント強化学習領域のポリシー分布を関連付けている。
複数のエージェントからの大規模な共同行動空間と、マルチエージェント強化学習における限られた遷移データにより、政策分布を統計的に計算することは不可能である。
統計的に計算する代わりに、2つのリプレイバッファを持つパラメトリック確率自由密度比推定器を用いる。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:56:24 GMT)
GeomHerd: A Forward-looking Herding Quantification via Ricci Flow Geometry on Agent Interactive Simulations [28.2] ハーディングは市場の脆弱性とシステム的リスクの中心的な要因である。
シェディングを定量化するための既存のアプローチは、価格相関統計に依存する。
我々は,上流エージェント-相互作用グラフ上で直接協調を定量化する幾何学的フレームワークGeomHerdを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:07:58 GMT)
Federated Client Selection under Partial Visibility: A POMDP Approach with Spatio-Temporal Attention [28.1] フェデレーション学習は、データの不均一性に起因するパフォーマンス劣化を軽減するために、効果的なクライアント選択に依存する。
大規模またはエッジベースのデプロイメントでは、通信、モビリティ、可用性の制約のため、サーバはクライアントのサブセットにしかアクセスできない。
我々は,部分可視性のあるマルコフ決定プロセス (POMDP) としてフェデレートされたクライアント選択を定式化し,空間的注意に基づく強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:28:25 GMT)
AccLock: Unlocking Identity with Heartbeat Using In-Ear Accelerometers [28.0] 我々は、AccLockと呼ばれる受動的認証システムを提案し、AccLockは、BCG信号から抽出された特徴を利用して、安全で控えめなユーザ認証を可能にする。
我々のシステムは、デバイスとユーザの両方にとってゼロ・インクルージョンを含む、従来のシステムに対して、ユビキタスで、環境騒音に耐性のあるいくつかの利点を提供している。
我々は33人の参加者による広範な実験を行い、平均FARは3.13%、FRRは2.99%に達し、AccLockの実用可能性を示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:15:00 GMT)
Beyond Text Prompts: Visual-to-Visual Generation as A Unified Paradigm [27.9] ユーザがテキストプロンプトではなく、視覚仕様ページで生成モデルを条件付けするtextbf Visual-to-visual (V2V) 生成を提案する。
textbfV2V-Zeroは、既存の視覚言語モデル(VLM)条件付きジェネレータでこのインターフェースを公開する、トレーニング不要のフレームワークである。
V2V-Zeroのスコアは32.7/100で、評価されたオープンウェイトなイメージベースラインを上回り、明確な機能階層を明らかにしている。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:35:34 GMT)
Scaling Laws and Tradeoffs in Recurrent Networks of Expressive Neurons [27.9] 皮質ニューロンは複雑で、マルチタイムスケールのプロセッサで、リカレント回路に接続されている。
機械学習は主に、初期のニューラルネットワーク理論から継承された、非常に単純なユニットのモデルを構築する。
本稿では,Expressive Memory (ELM) ニューロンからリカレント層を構築するEMMネットワークを紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:29:33 GMT)
SkillMaster: Toward Autonomous Skill Mastery in LLM Agents [27.7] SkillMasterは、エージェントに新しいスキルを作り、既存のスキルを洗練させ、タスク解決中に蓄積したスキルを選択する訓練フレームワークである。
第一に、私たちは、軌道インフォームドスキルレビューを通じてエージェントを訓練し、完成したエピソードの証拠に基づいて、提案、更新、保持するためのエージェントを指導する。
第2に、各候補スキル編集は、関連するプローブタスクに対する対実的ユーティリティによって評価され、スキル編集決定を訓練するための直接学習信号を提供する。
第3に、DualAdv-GRPOを導入し、タスク解決行動とスキル編集決定の利点を個別に推定し、タスク解決における共同トレーニングを安定化する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:27:47 GMT)
EgoEV-HandPose: Egocentric 3D Hand Pose Estimation and Gesture Recognition with Stereo Event Cameras [27.6] EgoEV-HandPoseはステレオイベントストリームからの2次元ポーズ推定とジェスチャー認識のためのエンドツーエンドフレームワークである。
EgoEVHandsは、エゴセントリックな手認識のための、最初の大規模な現実世界のステレオイベントカメラデータセットである。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:51:04 GMT)
DECO: Sparse Mixture-of-Experts with Dense-Comparable Performance on End-Side Devices [27.5] DECOは、同一のパラメータ予算とトレーニングトークンの下での高密度トランスフォーマーのパフォーマンスに適合するように設計された、疎いMoEアーキテクチャである。
我々の特別なアクセラレーションカーネルは、高密度の推論と比較して、実際のハードウェア上で3.00$times$のスピードアップを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:28:29 GMT)
Workspace-Bench 1.0: Benchmarking AI Agents on Workspace Tasks with Large-Scale File Dependencies [27.4] 我々は、Workspace Learning invOlving Large-Scale File Dependencies上でAIエージェントを評価するためのベンチマークであるWorkspace-Benchを紹介する。
5つのワーカープロファイル、74のファイルタイプ、20,476のファイル(最大20GB)を持つ現実的なワークスペースを構築し、それぞれが7,399の合計ルーリックに対して評価された独自のファイル依存グラフを持つ388のタスクをキュレートする。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:08:40 GMT)
Missing Old Logits in Asynchronous Agentic RL: Semantic Mismatch and Repair Methods for Off-Policy Correction [27.3] 非同期強化学習は、大規模言語モデルエージェントのロールアウトスループットを改善する。
また、PPOスタイルのオフポリシー修正のための重要な障害モードも導入している。
更新の遅れや部分的なロールアウトを伴う実用的なパイプラインでは,必要なトレーニング側ロジットが失われることがよくあります。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:57:55 GMT)
The Midas Touch for Metric Depth [27.2] 我々は, 相対深度を測度深度に変換する数学的解釈可能なアプローチである textbfDepth (MTD) 用の emphtextbfMidas textbfTouch を提案する。
MTDは, 従来の深度推定法と深度推定法よりも強い一般化と精度の向上を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:03:26 GMT)
On the Approximation Complexity of Matrix Product Operator Born Machines [27.0] 行列積演算子ボーンマシン(英: Matrix product operator Born Machine、MPO-BM)は、確率的モデリングのための引き込み可能なテンソルネットワークモデルである。
我々はKL近似が連続的にMPO-BMに対してNPハードであることを証明する。
また、損失誘起ハミルトニアンの局所性とスペクトルギャップ条件下では、構造的目標が結合と証明可能なKL保証とのMPO-BM近似を許容していることも示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:38:49 GMT)
OptArgus: A Multi-Agent System to Detect Hallucinations in LLM-based Optimization Modeling [27.0] 最適化モデル, 目的, 変数, 制約, 実装障害にまたがる, 最初の微粒化幻覚分類法を開発した。
一致した単一エージェントベースラインに対して、OptArgusはクリーンアーティファクトに対する偽のアラームを少なくし、コントロールされた単一エラーケースにおけるより正確なトップランクのローカライゼーションと、自然なモデル出力に対するより強力な検出を実現している。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:19:14 GMT)
Interactive State Space Model with Cross-Modal Local Scanning for Depth Super-Resolution [26.9] 誘導深度超解像(GDSR)は、HR RGBガイダンスを用いてLR入力からHR深度マップを再構成する。
既存の手法は各モードを独立にモデル化するか、2次複雑さを持つ計算コストの高い注意機構に依存している。
本稿では,対話型状態空間モデルを中心とした新しいGDSRフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:45:36 GMT)
Is Monotonic Sampling Necessary in Diffusion Models? [26.8] 拡散モデルは、ガウス先行を反復的に denoising してサンプルを生成し、発行されたサンプルごとに単調に減少する一連のノイズレベルをトラバースする。
ここでは、単調サンプリングが負荷分散であるのか、それとも単に従来のものであるのかを問う。
我々は、構造化された非単調なスケジュールの4つのファミリーを設計し、DDPM、EDM、フローマッチングの3つのアーキテクチャ的に異なる生成モデルに適用する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:45:59 GMT)
On Privacy-Preserving Image Transmission in Low-Altitude Networks: A Swin Transformer-Based Framework with Federated Learning [26.8] UAVから地上局への高ボリューム画像データは、帯域幅と厳しいプライバシー要件のために困難に直面している。
フェデレート・ラーニング(FL)に基づくセマンティック・コミュニケーション・フレームワークを提案する。
Swin Transformerベースのセマンティックコミュニケーションアーキテクチャは、制約帯域幅条件下でのマルチスケールセマンティック特徴を抽出するように設計されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:18:53 GMT)
Beyond MMSE: Enhancing PnP Restoration with ProxiMAP [26.8] 学習スコアが真のものと一致しないことを示すので、MAP目標化は現実的なものよりも漫画的なイメージに収束する。
ProxiMAPは、ノイズスケジュールが近似の残差ノイズと雑音のトレーニングノイズとを一致させる反復MAPである。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:54:26 GMT)
Engagement Process: Rethinking the Temporal Interface of Action and Observation [26.7] Engagement Process(EP)は、適切な意思決定手順でペアを組むのではなく、イベントストリームの分離としてアクションとオブザーバを表現します。
EPは、検討、遅延、遅延フィードバック、永続的なアクションなど、単一エージェントのタイミング問題をキャプチャする。
EPはステップベースのインターフェースによって隠された一時的な振る舞いを公開し、ポリシーが明示的な時間的コストで適応できるようにする。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:02:03 GMT)
Multimodal Abstractive Summarization of Instructional Videos with Vision-Language Models [26.6] マルチモーダルビデオ要約は、意味的に言語生成と整合する視覚的特徴を必要とする。
ClipSumは凍結したCLIP視覚言語機能と明示的な時間的モデリングを併用したフレームワークである。
YouCook2では、ClipSumは33.0% ROUGE-1、ResNet-152は30.5%、次元は4倍である。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:11:36 GMT)
Early Data Exposure Improves Robustness to Subsequent Fine-Tuning [26.4] 上流でのトレーニング選択が、その能力がいかに頑健に保たれるかを調査する。
初期の露光 - トレーニング後のデータを事前トレーニングに混ぜることで、アップストリームパフォーマンスとダウンストリームパフォーマンスの間のフロンティアを一貫して改善する。
以上の結果から,後続の微調整に対する頑健性は上流トレーニングの第一級目標として扱われるべきであることが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:08:00 GMT)
Adaptive Multi-Round Allocation with Stochastic Arrivals [26.1] 本稿では,適応型ネットワークの採用を動機とした逐次的資源配分問題について検討する。
まず, 単一ラウンド割当問題において, 生存確率の限界に基づく厳密な解が認められていることを示す。
多重ラウンド設定では、結果として生じるベルマン再帰はフロンティアの高次元進化のために引き起こされる。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:29:06 GMT)
FuTCR: Future-Targeted Contrast and Repulsion for Continual Panoptic Segmentation [25.8] 新しいクラスが導入される前に表現を再構成するフレームワークを提案する。
FuTCRは、最先端のパノプティクスを最大28%改善する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:41:19 GMT)
Question Difficulty Estimation for Large Language Models via Answer Plausibility Scoring [25.6] 本稿では,Q-DAPSを提案する。Q-DAPS,Q-DAPS,Q-DAPS,Q-DAPS,Q-DAPS,Q-DAPS,Q-DAPS,Q-DAPS,Q-DAPS,Q-DAPS,Q-DAPS)。
Q-DAPSは,QA-QA,NQ,MuSiQue,QASCの4つの顕著なデータセットに対して体系的に評価する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:00:02 GMT)
Pretraining Exposure Explains Popularity Judgments in Large Language Models [25.6] 我々は、完全に観測可能な事前学習データに基づいて、人気バイアスの直接的かつ大規模な分析を行う。
我々は5つのタイプ(Person, Location, Organization, Art, Product)にまたがる2,000のエンティティを分析し、Wikipediaのページビューに対して事前トレーニングされた露出を比較する。
以上の結果から, 事前学習による露光はWikipediaの人気と強く相関し, 実世界のサリエンスにとって有意義なプロキシとして, 露光が有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:45:38 GMT)
SynIB: Informational Bottleneck for Maximizing Synergy in Multimodal Learning [25.6] 情報理論によるマルチモーダル・シナジーの定式化とSynIB(Syngistic Information Bottleneck)の導入
学習シナジーを優先するために、SynIBはあらゆるモダリティから正確に予測するモデルを動機付け、あらゆるモダリティからの情報が保持されない場合に信頼を罰する。
実世界の5つのベンチマークでは、SynIBはシナジーに依存したサンプルの精度を最大7.8%改善し、全体的な精度は最大3.8%向上した。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:42:19 GMT)
What-Where Transformer: A Slot-Centric Visual Backbone for Concurrent Representation and Localization [25.4] 我々は、モデルがオブジェクトの外観や空間的位置を分解的に表現することを奨励する「What-where separation」と呼ばれる帰納バイアスに焦点を当てた。
本手法では,トークンを何の表現として扱うか,注目マップを場所の表現として扱うとともに,マルチストリームのスロットベースアーキテクチャを用いて並列フィードフォワードモジュールで処理する。
我々は,標準の単一ラベル分類に基づくImageNetの監督下であっても,生の注目マップから直接,創発的な複数物体発見を示すことを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:08:46 GMT)
From Web to Pixels: Bringing Agentic Search into Visual Perception [25.4] 我々は、視覚的対象を、外的事実、最近の出来事、ロングテールエンティティ、あるいはマルチホップ関係から最初に解決しなければならない、より実用的で難しいオープンワールドのケースについて研究する。
我々は、この課題をパーセプションディープリサーチとして形式化し、検証された証拠、知識集約的なクエリ、および3つのタスクビューを備えたオブジェクト指向ベンチマークであるWebEyeを紹介する。
実験の結果,Pixel-Searcherは3つのタスクビューすべてで最強のオープンソースパフォーマンスを達成した。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:59:51 GMT)
Morphologically Equivariant Flow Matching for Bimanual Mobile Manipulation [25.4] 形態的対称性は 未発見だが重要な帰納的バイアスだ 双方向の移動操作の学習に
ある構成におけるタスクの解決方法を知ることで、ミラー化されたタスクの解決方法が直接決定される。
平面と6-DoFの移動操作タスク全体にわたって、対称性にインフォームドされたポリシーは、サンプル効率を一貫して改善する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:04:38 GMT)
Understanding oxide-thickness-dependent variability in dense Si-MOS quantum dot arrays [25.1] ゲート酸化膜は密度の高い2次元シリコン量子ドットアレイの均一性に影響を与える。
我々は4つの異なる酸化物厚さにわたる392個の量子ドットを統計的に特徴付けている。
これらの結果は、高密度でスケーラブルなシリコンスピンキュービットアーキテクチャのための重要な設計ガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:02:22 GMT)
See What Matters: Differentiable Grid Sample Pruning for Generalizable Vision-Language-Action Model [25.0] Differentiable Grid Sampler (GridS) は、Vision-Language-Action(VLA)モデルで視覚トークンのタスク認識、継続的な再サンプリングを行うプラグイン・アンド・プレイモジュールである。
GridSは、10%未満のオリジナルビジュアルトークンで劇的な圧縮を実現しつつ、必須の空間情報を保存する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:08:42 GMT)
To Whom Do Language Models Align? Measuring Principal Hierarchies Under High-Stakes Competing Demands [25.0] 高度に専門的な設定で展開された言語モデルは、ユーザ、機関当局、および専門的規範の相反する要求に直面します。
法と医療の分野では7,136のシナリオで10のフロンティアモデルをテストし、タスク実行中にモデルがプロの標準に従わないことがよくあります。
さらに、これらのモデルが示すユーザ、権威、および専門的標準の階層性は、医療および法的文脈において不安定であることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:36:39 GMT)
LiBrA-Net: Lie-Algebraic Bilateral Affine Fields for Real-Time 4K Video Dehazing [24.9] LiBrA-NetはUHDビデオデハージングの新しいベンチマークである。
UHV-4Kは、すべてのフレームに深度、透過度、光フローアノテーションを備えた最初の4Kビデオデハージングベンチマークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:27:03 GMT)
Learning the Interaction Prior for Protein-Protein Interaction Prediction: A Model-Agnostic Approach [24.7] タンパク質とタンパク質の相互作用(PPIs)は細胞機能と疾患機構の基礎である。
現在の学習ベースの予測器は、強力なタンパク質表現の学習に重点を置いている。
タンパク質表現に基づく仮想L3パスのプロンプトグラフを生成するL3-PPIと呼ばれるL3パス正規化グラフプロンプト学習法を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:28:49 GMT)
SB-BEVFusion: Enhancing the Robustness against Sensor Malfunction and Corruptions [24.5] 我々はカメラとLiDARデータのためのフレームワークに依存しない融合モジュールを開発した。
私たちのモジュールは、欠落や破損したモダリティのシナリオ下で、良好なパフォーマンス向上を実現しています。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:57:15 GMT)
Coordinated Diffusion: Generating Multi-Agent Behavior Without Multi-Agent Demonstrations [24.2] Coordinated Diffusionは、ユーザ定義のマルチエージェントコスト関数を通じて独立に訓練された単一エージェント拡散ポリシーを結合するフレームワークである。
この誘導項は勾配のない方法で推定でき、CoDiをブラックボックスで微分不可能なコスト関数に適用できることを示す。
両腕操作タスクのシミュレーションおよびハードウェア実験の結果,CoDiは単一エージェントデータからロバストな協調動作を検出することがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:03:11 GMT)
IndustryBench: Probing the Industrial Knowledge Boundaries of LLMs [24.2] 我々は,中国における産業調達QAのための2,049石のベンチマークであるIndustrialBenchを紹介する。
本研究は,LLM生成候補の70.3%を探索に基づく外部検証段階において拒絶する。
我々の評価は、Qwen3-Max の判断により、ドメインの専門家に対して$_w = 0.798$で検証された生の正当性を分離する。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:43:13 GMT)
Stories in Space: In-Context Learning Trajectories in Conceptual Belief Space [24.0] 大規模言語モデル(LLM)は、その振る舞いを文脈で更新し、ベイズ推論の一形態と見なすことができる。
我々は,LLMが低次元幾何学空間(概念的信念空間)上の信念を割り当てることを提案し,文脈内学習は時間とともに信念が更新されるにつれて,この空間を通しての軌跡に対応することを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:09:41 GMT)
Online Conformal Prediction: Enforcing monotonicity via Online Optimization [24.0] そこで本稿では, 範囲の範囲にまたがって, エンハンス付き予測セットを出力する2つの新しいオンライン共形予測手法を提案する。
提案手法は,予測セットのネストネスを強制しながら,量子推定誤差制御に変換される小さな後悔を伴うオンライン最適化の視点を活用する。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:18:43 GMT)
HeteroGenManip: Generalizable Manipulation For Heterogeneous Object Interactions [23.8] クロスタイプオブジェクトインタラクションを含む一般化可能な操作は、ロボティクスにおいて決定的だが難しい能力である。
既存の基盤モデルに基づくアプローチは、しばしば、これらのステージの区別を曖昧にするエンドツーエンドの学習を採用する。
We propose HeteroGenManip, a task-conditioned, two-stage framework designed to deouple initial grasp from complex interaction execution。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:49:53 GMT)
Composition of Memory Experts for Diffusion World Models [23.6] 世界モデルは、過去の観測と整合した有望な未来を予測することを目的としており、これは強化学習における計画と意思決定の中心的な能力である。
トランスフォーマーは局所的な詳細を保存するが、二次的な注意によってボトルネックとなる。
我々は、将来的な一貫性をあらゆるアーキテクチャから切り離し、代わりに専門的な専門家のセットを活用することを提案します。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:43:10 GMT)
CktFormalizer: Autoformalization of Natural Language into Circuit Representations [23.4] CktFormalizerは、Lean 4.0に組み込まれた依存型HDLを通じてハードウェア生成をリダイレクトするフレームワークである。
VerilogEval(156問題)、RTLLM(50問題)、ResBench(56問題)では、CktFormalizerは直接Verilog生成と競合するシミュレーションパスレートを達成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:24:43 GMT)
Reward Hacking in Rubric-Based Reinforcement Learning [23.4] そこでは,ルールをトレーニング検証器に対して最適化するが,フロンティアの3人の審査員の家族間パネルに対して評価を行う。
我々のフレームワークは、検証失敗とルーブリック設計の制限という2つの違いの源を分離している。
医学領域と科学領域全体において、弱い検証器は参照検証器に転送されない大きなプロキシ・リワードゲインを生成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:54:25 GMT)
BadSKP: Backdoor Attacks on Knowledge Graph-Enhanced LLMs with Soft Prompts [23.3] 最近の知識グラフ(KG)により強化された大言語モデル(LLM)は、検索したサブグラフをグラフニューラルネットワークを介して連続的なソフトプロンプトに符号化することによって、純粋にテキストによる知識増強を超えている。
既存のバックドア攻撃は、主にテキストチャネル用に設計されており、このデュアルチャネルアーキテクチャに対する効果は未だ不明である。
テキストチャネルバックドア攻撃は、テキストチャネルのKGプロンプトシステムに容易に侵入し、ソフトプロンプトベースの攻撃に対してほとんど効果がないことを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:46:25 GMT)
Lite3R: A Model-Agnostic Framework for Efficient Feed-Forward 3D Reconstruction [23.2] Lite3RはSparse Linear Attentionに置き換わるモデルに依存しない教師学習フレームワークである。
Lite3R はレイテンシ (1.7-2.0x) とメモリ使用率 (1.9-2.4x) を大幅に削減し、全体として競争力のある再構築品質を維持する。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:20:02 GMT)
FIS-DiT: Breaking the Few-Step Video Inference Barrier via Training-Free Frame Interleaved Sparsity [23.2] ビデオ拡散変換器(DiT)はモデルによって大幅に削減できるが、ステップごとの推論レイテンシは依然として重要なボトルネックである。
本研究では、時間軌道から潜在フレーム位置への最適化焦点をシフトさせる、トレーニング不要で演算子に依存しないフレームワークであるFrame Inter Sparsity DiT (FIS-DiT)を提案する。
FIS-DiTは、VBench-QおよびCLIPメトリクス間で無視できない劣化を伴う2.11--2.41$times$ Speedupを一貫して達成している。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:49:36 GMT)
Learning Subspace-Preserving Sparse Attention Graphs from Heterogeneous Multiview Data [23.1] ヘテロジニアスなマルチビューデータからサブスペース保存されたスパースアテンショングラフを学習するスパースアテンショングラフ学習(SAGL)法を提案する。
SAGLは、最先端の教師なしトランスファー学習アプローチよりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:56:28 GMT)
Routers Learn the Geometry of Their Experts: Geometric Coupling in Sparse Mixture-of-Experts [23.1] SMoEの経路決定が機械的にどのように形成されるかを検討する。
スクラッチからトレーニングされた1億ドルのSMoEでは、より高いルータスコアが専門家のニューロンの活性化を予測する。
この結果から、ルータが効率的な分業を支援する代入幾何学をいかに形成するかが説明できる。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:55:02 GMT)
Grounding by Remembering: Cross-Scene and In-Scene Memory for 3D Functional Affordances [23.1] AFFORDMEMは、幾何学を2つのレベルで記憶することで、3D機能的余裕を基盤とするフレームワークである。
エージェントがシーンを処理すると、候補インスタンスとその3次元空間関係を構造化されたシーングラフに整理する。
スプリット0では3.23、スプリット1では3.7のトレーニング自由状態をAP50で改善する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:44:47 GMT)
AffineLens: Capturing the Continuous Piecewise Affine Functions of Neural Networks [23.0] Piecewise Affine Neural Network (PANN) は、ニューラルネットワークの表現性に関する原則的な幾何学的視点を提供する。
AffineLensは、超平面配置とPANNを基盤とした多面体構造を計算するための統一的なフレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:40:19 GMT)
PreScam: A Benchmark for Predicting Scam Progression from Early Conversations [22.9] 初期の会話から詐欺進行をモデル化するためのベンチマークであるPreScamを紹介する。
リアルタイム終端予測とスキャマー動作予測という2つのタスクのモデルをベンチマークする。
その結果, 表面流速と進行モデルの間には明確なギャップが認められた。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:11:41 GMT)
Population Risk Bounds for Kolmogorov-Arnold Networks Trained by DP-SGD with Correlated Noise [22.8] 我々は,ミニバッチSGDとクリッピングで訓練したコンベックスモゴロフ・アルノルドネットワーク(KAN)の最初の集団リスク境界を確立する。
我々は、現在の騒音と高い確率の人口を吸収する不活性によって困難に対処する。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:44:47 GMT)
NOFE -- Neural Operator Function Embedding [22.5] ほとんどの次元還元法は、多くの実世界のプロセスに固有の連続的なドメイン構造を無視して、データを離散的な点雲として扱う。
本稿では,連続次元還元のためのドメイン認識フレームワークであるNeural Operator Function Embedding (NOFE)を紹介する。
異なるデータセット間でNOFEを評価し,PCA,t-SNE,UMAPと比較した。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:25:52 GMT)
Beyond the Last Layer: Multi-Layer Representation Fusion for Visual Tokenization [22.5] 複数層のセマンティック抽象化の後, 残差が減衰しただけに, 低レベルの視覚的詳細が最終層に残っていることを示す。
エネルギー制約付きルーティングとインクリメンタル修正により,すべてのエンコーダ層を集約する軽量核融合モジュールDRoRAEを提案する。
ImageNet-256では、DRoRAEはrFIDを0.57から0.29に削減し、生成FIDを1.74から1.65に改善した。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:07:10 GMT)
From Generic Correlation to Input-Specific Credit in On-Policy Self Distillation [22.4] オンラインの自己蒸留は、訓練後の言語モデルにとって有望なパラダイムとして現れている。
本稿では, 自己蒸留トークンの報酬が, 入力されたフィードバックと応答の正確な相互情報であるベイズフィルタインクリメントであることを示す。
本稿では、バッチコントラストベースラインで入力固有のコンポーネントを分離するCREDITを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:43:17 GMT)
Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information [22.4] 本稿では,学生と教師の相違を増す反自己蒸留法を提案する。
AntiSDはGRPOベースラインの精度を2倍から10倍にし、最終精度を最大11.5ポイント向上させる。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:40:43 GMT)
From Trajectories to Phenotypes: Disease Progression as Structural Priors for Multi-organ Imaging Representation Learning [22.1] 本稿では, 臓器関連IDPエンコーダに構造知識を変換するトラジェクティブ・アウェア・フレームワークを提案する。
英国バイオバンクのコホートでは159の疾患が発生し、トラジェクトリ・アウェア・プレトレーニングにより、識別と発症予測の両方が一貫して改善される。
以上の結果から, 人口規模で生成する疾患モデルが, データ制限画像モダリティの構造的先行要因となる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:10:26 GMT)
FERMI: Exploiting Relations for Membership Inference Against Tabular Diffusion Models [22.0] 推論攻撃は単一テーブルの設定を前提とし、実際の機密データのマルチリレーショナル構造を無視する。
本稿では,親テーブルなどの対象テーブルに関連する関係から補助情報を活用する方法について述べる。
単一テーブルベースラインに対する攻撃性能を継続的に改善するFERMIを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:52:36 GMT)
Learning Agentic Policy from Action Guidance [22.0] 我々は,行動データを計画スタイルの参照ガイダンスとして注入するtextscActGuide-RLを提案する。
ガイド付きロールアウトとガイドなしロールアウトは、混合政治訓練によって共同で最適化される。
検索エージェントのベンチマークでは、textscActGuide-RLはゼロRLよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:54:23 GMT)
DynaTrain: Fast Online Parallelism Switching for Elastic LLM Training [21.9] 任意の多次元並列処理を網羅したサブ秒再構成のための分散トレーニングシステムDynaTrainを提案する。
その中核として,1つの論理座標空間の下で全ての分散トレーニング状態を統一する仮想VPS空間の抽象化を提案する。
235Bパラメータの高密度モデルと235Bパラメータのモデルでは、DynaTrainは2s未満の70B密度モデルと4.36sの235BMoEモデルを使用しており、正確性を保ちながら、最先端のチェックポイントベースおよび弾性システムよりも最大3桁の精度で性能を向上している。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:51:28 GMT)
Large Language Models as Amortized Pareto-Front Generators for Constrained Bi-Objective Convex Optimization [21.8] DIPSは、制約付き双方向凸最適化のための償却ジェネレータとして、大きな言語モデルを微調整するエンドツーエンドフレームワークである。
自己回帰型言語モデリングと連続最適化を両立させるため、DIPSはコンパクトな離散化スキーム、新しい数値トークンのための数値接地トークン初期化、三相カリキュラム最適化を組み合わせた。
vLLM加速推論では、DIPSは1つのインスタンスを0.16秒で解き、汎用性や推論のLCMベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:20:57 GMT)
ReflectDrive-2: Reinforcement-Learning-Aligned Self-Editing for Discrete Diffusion Driving [21.8] 本稿では,自律走行のための個別のアクションエキスパートを備えたマスク付き離散拡散プランナであるReflectDrive-2を紹介する。
この離散トークン空間は、インプレース・トラジェクトリ・リビジョンを可能にする。 AutoEditは、補助的な改善ネットワークを必要とせずに、同じモデルを使用して選択されたトークンを書き換える。
また、共有KVの再利用、ステップデコードの変更、デバイス上でのアンマッシングを組み合わせ、効率的なリフレクティブデコードスタックを設計しました。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:59:41 GMT)
GATA2Floor: Graph attention for floor counting in street-view facades [21.8] それぞれのファサードを、エッジに垂直に先行したウィンドウ/ドア検出のグラフとしてモデル化する。
GATA2Floorは,建物のグローバルフロア数を予測するマルチヘッドグラフアテンションv2(GATv2)ベースのモデルである。
ラベル付きデータセットの欠如を軽減するために,提案したグラフベースの推論がアノテーションなしで適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:45:24 GMT)
TRACE: Temporal Routing with Autoregressive Cross-channel Experts for EEG Representation Learning [21.7] 我々は、因果文脈から将来の脳波パッチを予測する自動回帰脳波事前学習フレームワークTRACEを提案する。
各時間ステップにおいて、TRACEは因果的チャネル履歴から専門家のルーティング決定を導出し、そのステップで全てのチャネルに共同で適用する。
運動画像と臨床イベント分類タスクに競争力を維持しながら、いくつかのベンチマークで最高の結果を得る。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:13:16 GMT)
Dynamic Execution Commitment of Vision-Language-Action Models [21.6] 本稿では,動的実行コミットメントを自己特定的プレフィックス検証問題として再編成する適応アクションアクセプタンス機構であるA3を紹介する。
A3はまず、グループサンプリングを介して行動の軌跡的なコンセンサススコアを計算し、次に代表ドラフトを選択し、下流検証を優先する。
さまざまなVLAモデルとベンチマークの実験では、A3は手動の水平調整の必要性を排除し、実行と推論のスループットのトレードオフを優れたものにしている。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:52:58 GMT)
How Faithful Is Trajectory-Based Data Attribution? Error Sources, Remedies, and Practical Guidelines [21.6] トラジェクトリに基づくデータ帰属法は、トレーニングの軌跡をアンロールすることで、モデル予測に対するトレーニングサンプルの影響を推定する。
これらの手法の包括的なエラー解析が欠如しており、メソッドの忠実性に対する懸念を高め、信頼性の高いデプロイメントを妨げる。
本稿では,トラジェクトリに基づくデータ属性における誤り源の体系的解析と,これらを緩和するための具体的対策,および下流利用のための実践的ガイドラインについて述べる。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:50:45 GMT)
ToolMol: Evolutionary Agentic Framework for Multi-objective Drug Discovery [21.5] $textttToolMol$は、de novoドラッグデザインのための進化的エージェントフレームワークである。
$textttToolMol$は、ゴールド標準の絶対結合自由エネルギースコアで最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:58:14 GMT)
No One Knows the State of the Art in Geospatial Foundation Models [21.5] 我々は、この芸術の現状が地理空間基盤モデルに何があるのか誰も知らないと主張している。
これらの手法は有用であるが、GFMの文献は評価、トレーニング、テストのプロトコル、リリースウェイト、事前訓練の制御を標準化していない。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:29:51 GMT)
Learning Minimally Rigid Graphs with High Realization Counts [21.5] 厳密なグラフの場合、同じエッジ長のデータは複数の実現(翻訳と回転)を許容できる。
例外的に多くの実現可能なグラフを見つけることは、剛性理論における極端問題である。
ヘネバーグ運動 (Henneberg move) としても知られる 0- および 1-拡張(英語版) を通した最小剛性グラフを構成する強化学習手法を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:23:30 GMT)
Bridging the Modality Bottleneck in Pathology MIL through Virtual Molecular Staining [21.5] プロジェクション層のプラグイン置換である分子インフォーム・ステイニング変換(MIST)を導入する。
MISTクラスタの遺伝子発現プロファイルをクロスモーダルプロトタイプに分類し、凍結基盤モデルの特徴空間に固定し、H&Eパッチの機能を再編成する。
MISTは標準射影層上で240の256構成を改善し、平均利得は+3.5%で、終端型間で一貫して観察される。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:49:35 GMT)
Can a Single Message Paralyze the AI Infrastructure? The Rise of AbO-DDoS Attacks through Targeted Mobius Injection [21.3] 我々は、自律エージェントをゾンビノードに武器にしてDDoS攻撃を開始する高度な攻撃であるMobius Injectionを紹介した。
この攻撃は、従来のDDoSモニターと、現代のAI安全フィルタの両方に対して、非常に軽量でステルス的であることを実証しています。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:51:12 GMT)
Multi-Token Residual Prediction [21.2] 拡散言語モデル(Diffusion Language Models)は、マスク付きトークンシーケンスを反復的にデノベートすることでテキストを生成する。
本稿では,依存性を認識可能なマルチトークンデノーミングを実現する軽量モジュールであるMulti-token Residual Prediction (MRP)を紹介する。
MRPは、バックボーンの隠れた状態からのステップ間の残留を予測し、バックボーン毎のトークンを、コストのごく一部で効果的に前方にデノベートする。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:40:39 GMT)
AgentDisCo: Towards Disentanglement and Collaboration in Open-ended Deep Research Agents [21.1] 本稿では, 逆最適化問題として深層研究を定式化する, 分散協調型エージェントアーキテクチャであるAgenDisCoを提案する。
AgentDisCoは、生成されたアウトラインの評価と検索クエリの精査に批評家エージェントと、更新された結果の検索とアウトラインの修正にジェネレータエージェントを使用する。
全体的なワークフローは、手作りと自動検出の両方の設計戦略をサポートする。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:14:15 GMT)
Combining On-Policy Optimization and Distillation for Long-Context Reasoning in Large Language Models [21.1] 長文推論のためのDGRPO(Distilled Group Relative Policy Optimization)を提案する。
また、マルチホップ推論、コンテキストグラウンド、長文生成にまたがる合成長文データセットであるLongBlocksについても紹介する。
結果から, 結果に基づく政策最適化と知識蒸留を一つの目的に組み合わせることで, より安定かつ効果的に長文推論を行うことができることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:04:18 GMT)
ScaleMoGen: Autoregressive Next-Scale Prediction for Human Motion Generation [21.0] ScaleMoGenは、テキスト駆動型ヒューマンモーション生成のためのスケールワイド自動回帰フレームワークである。
我々は3次元運動を、複数の骨格-初期スケールにまたがる合成離散トークンに量子化する。
我々の骨格・時間的マルチスケール表現は、自然にトレーニング不要でテキスト誘導型モーション編集を容易にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:58:58 GMT)
When Emotion Becomes Trigger: Emotion-style dynamic Backdoor Attack Parasitising Large Language Models [20.9] 本研究は,寄生性情動型動的バックドアアタック(Paraesthesia)を提案する。
麻痺は、タスクタイプと4つの異なるモデルで約99%の攻撃成功率を達成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:42:36 GMT)
Cluster-Aware Neural Collapse Prompt Tuning for Long-Tailed Generalization of Vision-Language Models [20.7] クラスタ認識型ニューラル崩壊プロンプトチューニング(CPT)を提案する。
CPTは、一般化を犠牲にすることなく、プロンプト調整された視覚言語モデルにおけるテールクラスの識別性を向上する。
11の多様なデータセットの実験では、CPTがSOTA法より優れていることが示されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:50:43 GMT)
Uncovering Latent Pathological Signatures in Pulmonary CT via Cross-Window Knowledge Distillation [20.6] 学生エンコーダは,最も情報に富む窓で訓練された教師から,潜伏した臨床経験を学習するクロスウィンドウ知識蒸留フレームワークを提案する。
クロスウインドウ蒸留は、監督的アプローチには見えない病理症状を内包し、マルチウインドウ肺CT解析のための一般的な解決策を提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:40:38 GMT)
Efficient LLM-based Advertising via Model Compression and Parallel Verification [20.5] 大規模言語モデル(LLM)は、広告クリエイティブ生成やターゲット広告のような広告シナリオにおいて顕著な可能性を示している。
LLMをリアルタイム広告システムにデプロイすることは、高い推論遅延と計算コストのために大きな課題となる。
本稿では,適応型グループ量子化,階層型階層化,プレフィックスツリー並列検証を併用した効率的な生成ターゲットフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:04:38 GMT)
Predicting Decisions of AI Agents from Limited Interaction through Text-Tabular Modeling [20.5] AIエージェントは、未知のエージェントと自然言語で交渉し、トランザクションします。
このような相互作用では、相手のLSM、プロンプト、制御ロジック、ルールベースのフォールバックが隠される。
エージェントがいくつかのインタラクションから、不慣れな相手の次の決定を予測できるかどうかを問う。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:09:32 GMT)
Goal-Oriented Reasoning for RAG-based Memory in Conversational Agentic LLM Systems [20.5] Goal-Memは、RAGベースのエージェントメモリのためのゴール指向の推論フレームワークである。
Goal-Memはマルチホップ推論と暗黙推論を必要とするタスクのパフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:51:02 GMT)
Scaling Laws for Mixture Pretraining Under Data Constraints [20.3] 一般的な戦略は、少ないが価値のあるターゲットデータと豊富な汎用データを組み合わせることである。
このトレードオフを2000以上の言語モデルトレーニングランで研究する。
繰り返しは、ターゲットドメインのパフォーマンスの中心的な要因であることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:22:45 GMT)
Benchmarking and Resource Analysis for Augmented-Lagrangian Quantum Hamiltonian Descent [20.3] 量子ハミルトニアン Descent (QHD) は、時間依存の量子ハミルトニアンをシミュレートした連続最適化アルゴリズムである。
QHDによる制約付き非耐性最適化には有用であるが、大規模なフォールト量子ハードウェアを必要とする可能性が高い。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:54:59 GMT)
Towards Order Fairness: Mitigating LLMs Order Sensitivity through Dual Group Advantage Optimization [20.3] 大規模言語モデル(LLM)は、入力要素の配列順序に影響される順序バイアスに悩まされる。
textbfDGAOはモデル精度と順序安定性を同時に向上することを目的としている。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:31:18 GMT)
Boosting Omni-Modal Language Models: Staged Post-Training with Visually Debiased Evaluation [20.1] 本研究は,現在行われているOmni-modalベンチマークにおいて,真の音声-視覚-言語証拠統合と視覚的ショートカットを区別するか否かを考察する。
視覚のみの探索で9つのOmni-modalベンチマークを監査し、視覚的に解決可能なクエリを削除し、完全なサブセットを保持する。
視覚的漏洩を制御する場合,オムニモーダルな進行が容易に解釈できることが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:16:11 GMT)
In-Context Learning Operates as Concept Subspace Learning [20.1] 構造化された実演が低次元概念推論を誘導するかどうかを考察する。
リッジおよび最小二乗 ICL プロキシでは、予測は正確に概念座標回帰と非部分空間リークに分解される。
これらの結果は、回復可能なICL振舞いのコンパクトなタスク整列メディエータとして概念部分空間をサポートする。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:43:48 GMT)
Beyond GRPO and On-Policy Distillation: An Empirical Sparse-to-Dense Reward Principle for Language-Model Post-Training [20.0] 報酬密度の原則を見落としているため、これはしばしば非効率な割り当てであると主張する。
この観点からは、GRPOスタイルのスパースRLとOPDスタイルの密集教師監督は別個のレシピではない。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:57:48 GMT)
PD-4DGS:Progressive Decomposition of 4D Gaussian Splatting for Bandwidth-Adaptive Dynamic Scene Streaming [20.0] 4DGSのプログレッシブ圧縮およびオンデマンド伝送のための最初のフレームワークであるPD-4DGSを提案する。
DycheckのiPhoneベンチマークでは、PD-4DGSがストリーミングされたビットストリームを60%カットした。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:26:10 GMT)
OGLS-SD: On-Policy Self-Distillation with Outcome-Guided Logit Steering for LLM Reasoning [20.0] 本研究は,教師の特権分布を自己の自給自足軌道に沿って蒸留することにより,言語モデルによる推論能力の向上を図ることを目的とする。
OPSDの性能向上にもかかわらず,教師と生徒の反応のミスマッチがよく見過ごされがちである。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:00:53 GMT)
PresentAgent-2: Towards Generalist Multimodal Presentation Agents [19.7] PresentAgent-2は、ユーザクエリからプレゼンテーションビデオを生成するエージェントフレームワークである。
オープンなユーザクエリと選択されたプレゼンテーションモードが与えられた後、PresentAgent-2はまずクエリを集中したトピックにまとめる。
その後、プレゼンテーションスライドを構築し、モード固有のスクリプトを生成し、スライド、オーディオ、ダイナミックメディアを完全なプレゼンテーションビデオに構成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:32:24 GMT)
GESR: A Genetic Programming-Based Symbolic Regression Method with Gene Editing [19.5] 進化的アルゴリズムに基づく遺伝的プログラミング(GP)は、現在でも最も古典的で広く採用されている手法の1つである。
本稿ではGESRと呼ばれる遺伝子編集に基づく記号回帰手法を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:13:44 GMT)
Model-based Bootstrap of Controlled Markov Chains [19.5] 非定常または履歴に依存しない制御ポリシを持つ有限制御チェーンにおける遷移カーネルのモデルベースブートストラップを解析する。
本研究では, ブートストラップ遷移推定器の分布整合性を確立した。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:05:59 GMT)
UniFixer: A Universal Reference-Guided Fixer for Diffusion-Based View Synthesis [19.3] 本稿では,粗大な戦略によって多種多様な劣化物を修正できる共通参照誘導フレームワークを提案する。
当社のUniFixerは,様々な種類の拡散劣化に対するゼロショット修正を実現するプラグイン・アンド・プレイ・リファインダとして機能する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:16:47 GMT)
SoK: Unlearnability and Unlearning for Model Dememorization [19.1] 本稿では,非学習性と非学習性を利用したモデル復号化手法の初回統合分析について述べる。
筆者らの貢献は3つある: (i) 未学習でスケーラブルな未学習の手法を統一した分類学; (ii) 先進的な手法の堅牢性、インタープレイ、浅い復号化を明らかにする実証的評価; (iii) 認定未学習で処理されたモデルの復号化深度に関する最初の理論的保証。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:17:13 GMT)
Ray-Aware Pointer Memory with Adaptive Updates for Streaming 3D Reconstruction [19.1] 連続画像ストリームからの3次元再構成には、正確な幾何集約と安定したメモリ管理が必要である。
空間的位置と視線方向の両方を明示的にモデル化した3次元再構成のためのレイアウェア・ポインターメモリを提案する。
われわれのアプローチは、画像ストリームからのスケーラブルでドリフトに耐性のあるオンライン3D再構成のための、原則化されたフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:36:20 GMT)
SOAR: Scale Optimization for Accurate Reconstruction in NVFP4 Quantization [19.0] NVFP4は、最近、大規模言語モデルの効率的な4ビットマイクロスケーリングフォーマットとして登場した。
既存の方法は、しばしば、柔軟性のないスケールの選択と、量子化と量子化のスケールの併用による、最適以下の性能をもたらす。
NVFP4量子化の精度を向上する新しい学習後量子化フレームワークであるSOAR(Scale Optimization for Accurate Reconstruction)を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:13:18 GMT)
Hindsight Hint Distillation: Scaffolded Reasoning for SWE Agents from CoT-free Answers [19.0] Hindsight Hint Distillation (HHD)は、人間の教師が学生のミスを使ってターゲットのガイダンスを提供する方法にインスパイアされている。
HHDは、モデル自体が失敗したセルフロールアウトから後ろ向きのヒントを合成し、それをオン・ポリティクスのロールアウトの足場として利用する。
実験により、HHDは反復RFTおよび軌道合成ベースラインを著しく上回ることが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:41:00 GMT)
Fair Conformal Classification via Learning Representation-Based Groups [18.9] 本稿では,分類タスクのための公正な共形推論フレームワークを提案する。
コンパクトで情報的な予測セットを生成する上での有効性と効率のバランスをとることで、我々のアプローチは信頼できる機械学習への実践的な道筋をたどる。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:37:17 GMT)
Revealing Interpretable Failure Modes of VLMs [18.9] 本稿では,視覚言語モデル(VLM)における解釈可能な障害モードを体系的に発見するフレームワークREVELIOを紹介する。
我々は、自動運転車や屋内ロボティクスの分野にREVELIOを適用し、これまで報告されていなかった最先端のVLMの脆弱性を明らかにした。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:25:17 GMT)
Training-Time Batch Normalization Reshapes Local Partition Geometry in Piecewise-Affine Networks [18.8] バッチ正規化(BN)は、現代のディープネットワークの中心であるが、トレーニング中に実現された機能への影響は、最適化の利点よりも理解されていない。
本研究では,超平面スイッチングと誘導アフィン分割の幾何学的手法を用いて,CPAネットワークにおける訓練時間BNについて検討した。
その結果、データ近傍のバッチ条件更新機構として、訓練時間BNの関数レベルの幾何学的説明を提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:36:25 GMT)
LDDR: Linear-DPP-Based Dynamic-Resolution Frame Sampling for Video MLLMs [18.8] マルチモーダルな大言語モデルにおけるビデオ理解には、限られた視覚的予算の下で、長い冗長なビデオから情報的フレームを選択する必要がある。
LDDR, トレーニングフリー, プラグアンドプレイ, 予算対応のビデオフレームサンプリングフレームワークを提案する。
LDDRは、タスク条件付き特徴空間でDPP(Determinantal Point Process)フレームの選択を行う。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:45:11 GMT)
ROMER: Expert Replacement and Router Calibration for Robust MoE LLMs on Analog Compute-in-Memory Systems [18.8] 大規模言語モデル (LLM) とMix-of-experts (MoE) アーキテクチャは、トークンごとに専門家のサブセットをわずかに活性化することで、優れたスケーラビリティを実現する。
ハードウェアノイズは、専門家の負荷バランスを著しく破壊し、クリーンにトレーニングされたルーティング決定を常に最適にレンダリングする。
負荷バランスを回復するために、未活性化の専門家を高周波で置き換えるポストトレーニング後の校正フレームワークROMERを提案し、パーセンタイルベースの正規化によりルータロジットを再調整し、ノイズ下でのルーティングを安定化させる。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:57:59 GMT)
Automated Reformulation of Robust Optimization via Memory-Augmented Large Language Models [18.7] 大規模言語モデル(LLM)は、自動最適化の定式化を約束している。
我々は,コアRO再構成タスクのための自動データ生成パイプラインと,ROアプリケーションタスクのためのキュレートデータセットを備えたベンチマークであるAutoRO-Benchを開発した。
本稿では,構造化されたテキストエクスペリエンスメモリを自律的に構築する,チューニング不要なメモリ拡張フレームワークであるAutoREMを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:06:08 GMT)
MM-OptBench: A Solver-Grounded Benchmark for Multimodal Optimization Modeling [18.7] テキストと視覚の問題仕様から数学的定式化と実行可能なソルバコードの両方を構築する必要があるベンチマーク設定であるマルチモーダル最適化モデルを導入する。
フレームワークをMM-OptBenchとしてインスタンス化し,6つの最適化ファミリ,26のサブカテゴリ,3つの構造的難易度にまたがる780のソルバ検証インスタンスをベンチマークした。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:07:36 GMT)
Breaking the scalability barrier via a vertical tunable coupler in 3D integrated transmon system [18.7] 2つの量子ビットチップはキャリアチップの対向側に垂直に積み重ねられ、多層フリップチップボンディングを介してガルバニックに接続される。
Intrepid Single-qubit gate fidelities of 99.87 % with negligible crosstalk, and controlled-Z gates to a average fidelity of 97.5 % for both inchip and interchip operation。
その結果、量子誤り訂正符号と互換性のあるスケーラブル量子プロセッサへの有望な経路として垂直結合が確立された。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:05:13 GMT)
CuSearch: Curriculum Rollout Sampling via Search Depth for Agentic RAG [18.6] CuSearchは、Search-Depth Greedy Allocation上に構築されたカリキュラムのロールアウトサンプリングフレームワークである。
我々は、ZeroSearch上の標準GRPOよりも最大11.8の正確なマッチングポイントを達成することで、CuSearchが継続的にパフォーマンスを改善していることを示す。
これらの結果は、RLVRベースのエージェントRAGトレーニングにおける検索監督密度の信頼性、アノテーションなしプロキシとして、軌跡ごとの探索深度を確立した。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:42:17 GMT)
Safety Context Injection: Inference-Time Safety Alignment via Static Filtering and Agentic Analysis [18.3] 大きな推論モデル(LRM)は複雑なタスクのパフォーマンスを改善するが、デプロイ時に安全性制御を難しくする。
ブラックボックスの設定では、ディフェンダーはモデルの重みを変更できず、代わりに推論時に介入しなければならない。
有害な意図は教育的あるいはロールプレイ的なフレーミングによって隠蔽され、深い安全分析は非自明なレイテンシを導入し、長い敵のコンテキストはより単純なフィルターが依存する局所的な手がかりを希薄化する。
安全コンテキスト注入(SCI)は、タスク生成から安全評価を分離し、保護された安全コンテキストとして構造化された外部リスクレポートをプリペイドする推論時フレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:23:02 GMT)
Uncertainty Quantification for LLM-based Code Generation [18.2] コード生成のためのリスク制御予測を構築するために,複数の仮説テストを利用するRisCoSetを提案する。
同程度のリスクで,コード削除を最大24.5%削減することができる。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:40:29 GMT)
20/20 Vision Language Models: A Prescription for Better VLMs through Data Curation Alone [18.1] データキュレーションは、20のVLMベンチマークにおいて、平均で+11.7ppの性能を向上できることを示す。
2BではInternVL3.5-2Bを9.9ppで17倍のトレーニング計算で上回りました。
データキュレーションは、より良いVLMを構築するための高平均ツールであり、最大150倍のトレーニング計算で最前線の精度に達する。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:51:03 GMT)
MolDeTox: Evaluating Language Model's Stepwise Fragment Editing for Molecular Detoxification [18.0] 大規模言語モデル(LLM)とビジョン言語モデル(VLM)は、最近、有望な機能を示している。
MolDeToxは分子デトキシ化のための新しいベンチマークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:24:52 GMT)
ORCE: Order-Aware Alignment of Verbalized Confidence in Large Language Models [17.8] 本稿では,言語的信頼度校正のための疎結合・秩序対応フレームワークを提案する。
提案手法は,まず回答を生成し,固定された質問対に条件付き信頼度を推定する。
実験により,本手法は解答精度を大きく保ちながらキャリブレーションと故障予測性能を向上させることが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:39:43 GMT)
ProfiliTable: Profiling-Driven Tabular Data Processing via Agentic Workflows [17.5] ProfiliTableは動的プロファイリングを中心とした自律型マルチエージェントフレームワークである。
インタラクティブな探索、知識強化された合成、フィードバック駆動の洗練を通じて、統合された実行コンテキストを構築し、反復的に洗練する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:42:38 GMT)
GraphIP-Bench: How Hard Is It to Steal a Graph Neural Network, and Can We Stop It? [17.5] クラウドサービスとしてデプロイされるグラフニューラルネットワーク(GNN)は、Emphmodel- Extraction攻撃によってEmphstolenにすることができる。
我々は,単一のブラックボックスプロトコルの下で両側を評価する統一ベンチマークであるemphGraphIP-Benchを紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:49:45 GMT)
Disentangled Sparse Representations for Concept-Separated Diffusion Unlearning [17.5] 提案するSAEParateは,概念を意識したコントラスト的目的によって,潜在表現を概念固有のクラスタに整理する。
また,GeLUをベースとした非線形変換によりエンコーダを強化し,この分離目的下での表現能力を向上させる。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:39:07 GMT)
FedMM: Federated Collaborative Signal Quantization for Multi-Market CTR Prediction [17.4] AmazonやNetflixのようなオンラインプラットフォームは、複数の国や地域にわたってユーザーにサービスを提供し、マルチマーケットレコメンデーション(MMR)の重要性を強調している。
ほとんどのMMR法は事前学習と微調整のパラダイムを採用しており、統一モデルはまず、集中的なグローバルデータに基づいて訓練される。
マルチマーケットクリックスルーレート(CTR)予測のためのフェデレート協調信号量子化(FedMM)手法を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:32:43 GMT)
Ada-MK: Adaptive MegaKernel Optimization via Automated DAG-based Search for LLM Inference [17.2] 大型言語モデル(LLM)は、商用オンライン広告システムにおいてリアルタイムな推論を提供する。
MegaKernelは、複数のオペレータを単一の永続カーネルに融合することで、起動オーバーヘッドと運用間ラウンドトリップを排除している。
Ada-MK: K次元分割と組み合わせた3次元共有メモリ制約モデル。
NVIDIA L20では、Ada-MKはバニラRT-LLMで最大23.6%、vLLMで50.2%改善している。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:04:28 GMT)
Multimodal Alignment and Preference Optimization for Zero-Shot Conditional RNA Generation [17.2] 条件RNA配列生成を多段階アライメント問題として,モイラインを導入した。
我々のアプローチは、RNAコーパスの大規模プレトレーニングから始まり、配列の妥当性を捉える。
ターゲット特異的な生成を実現するために、タンパク質の構造的およびシーケンシャルな特徴に対してRNA合成を条件とするマルチモーダルSFTアーキテクチャを用いる。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:54:09 GMT)
SyncDPO: Enhancing Temporal Synchronization in Video-Audio Joint Generation via Preference Learning [17.1] 本稿では,V-A関節生成の時間感度を向上させるための訓練後フレームワークSyncDPOを提案する。
SyncDPOは,時間的アライメント能力の向上において,他の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:22:13 GMT)
Linking Extreme Discourse to Structural Polarization in Signed Interaction Networks [17.1] オンラインコミュニティにおける分極は、しばしば言語または相互作用構造を通して研究される。
我々は、姿勢スコアから連続的な符号付きエッジ重みを導出する、言語基底の符号付きネットワークパイプラインを開発する。
構造分極における時間的変動とウィンドウレベルの談話信号がどのように関連しているかを解析する。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:14:37 GMT)
Multistep Belief Space Dynamics Learning For Risk-Aware Control [16.9] モデル予測制御(MPC)のために,リアルタイムに最適化可能な分散力学の学習フレームワークを提案する。
提案した構造からの偏差の影響を実世界のオフロード駆動の大規模データセットを用いて厳密なアブレーション実験を行った。
当社の計画アーキテクチャは、環境に基づいて車両の速度を自然に調整し、多様な地形上でのインテリジェントな振る舞いを一貫して示すことができます。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:11:12 GMT)
Multi-Variable Conformal Prediction: Optimizing Prediction Sets without Data Splitting [16.7] 多変数共形予測(MCP)は,共形予測関数を複数の同時変数で拡張するフレームワークである。
我々は、RemMCPとRelMCPが、目標カバレッジセットサイズよりも小さいか同等の予測セットサイズで、常に目標カバレッジ問題に適合することを実証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:19:51 GMT)
Discrete MeanFlow: One-Step Generation via Conditional Transition Kernels [16.7] 有限状態上の確率質量の移動により点の運動を置き換える離散平均フローを導入する。
我々は,この有限区間速度を終点の瞬時CTMC生成器に関連付ける平均フロー同定を証明した。
我々は、学習されたカーネルが解析的基底真理を高い精度で回復する、正確な有限状態マルコフ連鎖上のフレームワークを検証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:56:44 GMT)
Probabilistic Calibration Is a Trainable Capability in Language Models [16.7] この能力を微調整により直接的に改善できるかどうかについて検討する。
数式分布のサンプリングを必要とする合成プロンプトの言語モデルを微調整する。
その結果,微調整により確率的キャリブレーションが向上できることが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:28:24 GMT)
Every Bit, Everywhere, All at Once: A Binomial Multibit LLM Watermark [16.5] トークン位置毎にペイロードのすべてのビットをエンコードするために二項符号化を導入する。
我々は、エンコーディングの圧力を未符号化ビットに動的にリダイレクトするステートフルエンコーダを用いて、我々のアプローチを補完する。
提案手法は,メッセージの精度とロバスト性を向上し,ベースライン手法とのギャップを拡大する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:14:45 GMT)
Hide to See: Reasoning-prefix Masking for Visual-anchored Thinking in VLM Distillation [16.5] 本稿では,学生に視覚情報に対する思考の定着を促す新しい思考答え蒸留フレームワークを提案する。
蒸留段階では,学生は将来のトークンと有意な推論手段の両方をブロックする有意な推論マスクによって指導される。
実験結果から,本手法は最近のオープンソースのVLM, VLM蒸留, およびマルチモーダル推論ベンチマークにおける自己蒸留法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:14:04 GMT)
StepCodeReasoner: Aligning Code Reasoning with Stepwise Execution Traces via Reinforcement Learning [16.3] 本稿では,SteepCodeReasonerを提案する。
構造化されたプリントベースの実行トレースアンカーをコードに自動的に挿入することで、モデルは各ステップで実行状態を予測するようにトレーニングされる。
また、コード生成性能も向上し、明示的な実行モデリングがコード推論とコード生成の両方を強化していることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:36:56 GMT)
Runtime Monitoring of Perception-Based Autonomous Systems via Embedding Temporal Logic [16.3] 自律システムの監視は伝統的に、低次元状態変数上で定義された離散論理命題に連続的なセンサ観測をマッピングすることに依存している。
本研究では,学習した埋め込み空間で直接監視を行う時間論理であるEmbedding Temporal Logic (ETL)を提案する。
提案手法は複数の操作環境にまたがって評価され,ETLが基幹構造セマンティクスと強い経験的一致を達成できることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:57:25 GMT)
RevealLayer: Disentangling Hidden and Visible Layers via Occlusion-Aware Image Decomposition [16.3] RGBイメージを複数のRGBA層に分解する拡散ベースのフレームワークであるRevealLayerを提案する。
トレーニングと評価を支援するために,自動アルゴリズムと人間のアノテーションの協調によって構築された高品質な多層自然画像であるRevealLayer-100Kを紹介した。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:09:01 GMT)
SpatialForge: Bootstrapping 3D-Aware Spatial Reasoning from Open-World 2D Images [16.2] 本研究では,2次元画像から空間的推論制御へ変換するスケーラブルなデータ合成パイプラインを提案する。
本研究では,空間的推論を知覚と関係に分解し,深度,レイアウト,視点に依存した推論を網羅した構造化された監視信号を構築する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:20:41 GMT)
Do Enterprise Systems Need Learned World Models? The Importance of Context to Infer Dynamics [16.1] オフラインでトレーニングされた世界モデルは、動的に変化するにつれて、よく分布するが劣化するが、発見に基づくエージェントは、より堅牢であることを示す。
企業環境では、エージェントは固定された内部化ダイナミクスのみに頼るのではなく、実行時に関連するトランジションロジックを発見するメカニズムを組み込むことを示唆している。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:22:10 GMT)
Pyramid Self-contrastive Learning Framework for Test-time Ultrasound Image Denoising [16.0] 従来の遮音法は、合成雑音条件下では妥当性が低下する明示的な雑音仮定に依存している。
合成開口超音波(SAU)に応用したワンショット超音波画像デノナイズのための試験時間トレーニングフレームワークを提案する。
我々のA2A(Aperture-to-Aperture)フレームワークは、シャッフルしたサブアパーチャから解剖学的類似性とノイズランダム性を切り離す。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:27:21 GMT)
Not All Tokens Are Worth Caching: Learning Semantic-Aware Eviction for LLM Prefix Caches [16.0] プリフィックスキャッシュは、Large Language Model(LLM)サービスにおける重要な最適化である。
しかし、GPUメモリが不足しているため、その利点は退行ポリシーに大きく依存する。
システムプロンプト,ユーザクエリ,ツールアウトプット,モデル応答,チェーンオブ思考推論など,プロンプト内のさまざまなトークンタイプが,再利用率の最大756倍の変動を示すことを示す。
セマンティック・アダプティブなプレフィックスキャッシュ消去ポリシーであるSAECacheを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:38:24 GMT)
Causal Fairness for Survival Analysis [15.7] 生存時・時間・時間分析における公平性のための因果的枠組みを構築した。
これは、なぜ格差が生じるのか、そしてそれらが時間とともにどのように進化するかについて、人間の理解に足る説明を提供する。
本手法は,集中治療室への入院後の人種格差の経時的変化を解析するために用いられる。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:29:37 GMT)
VIMCAN: Visual-Inertial 3D Human Pose Estimation with Hybrid Mamba-Cross-Attention Network [15.7] VIMCANは、Mambaの効率的なシーケンスモデリングと、Cross-Attentionの空間的推論を組み合わせたハイブリッドアーキテクチャである。
VIMCANは、TotalCaptureでは17.2mm、3DPWでは45.3mmの平均結合位置誤差(MPJPE)よりも精度が高い。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:12:04 GMT)
Pre-Asymptotic Trainability in Photonic Variational Circuits under Postselection [15.6] フォトニックバレンプラトーは受動線形光学力学,ポストセレクション幾何学,タスクオブザーバブルの相互作用によって制御されていることを示す。
その結果、短期的なフォトニック変分アーキテクチャを設計するための実践的なガイダンスが得られた。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:55:53 GMT)
Human-Grounded Multimodal Benchmark with 900K-Scale Aggregated Student Response Distributions from Japan's National Assessment of Academic Ability [15.6] 本稿では,日本の学術的能力の評価から構築したデータセットについて述べる。
合成またはキュレートされたデータに基づく既存のベンチマークとは異なり、本データセットは実際の試験レイアウト、図表、日本語教育用テキストを保存する。
これらの機能は、統一された評価フレームワークの下で、人間とモデルのパフォーマンスを直接比較することができる。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:22:50 GMT)
A Unified Framework for Critical Scaling of Inverse Temperature in Self-Attention [15.6] 所望のスケールは各注目行のギャップカウント関数$N_n$によって決定されることを示す。
最大から各ギャップ内にある競合の数を数えると、上尾の累積スケールを定義する。
このフレームワークは、事前のスケーリング法則を異なる$N_n$として統一し、アテンションスコアファミリーを直接診断する。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:48:36 GMT)
Towards Affordable Energy: A Gymnasium Environment for Electric Utility Demand-Response Programs [15.6] DR-GymはオープンソースのオンラインGymnasium互換環境である。
当社の環境は、市場レベルの電力設備設定に重点を置いており、電力事業に関連する豊富な観測空間を提供している。
学習信号には多目的報酬関数を用いて多様な学習目標を特定する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:48:45 GMT)
MULTI: Disentangling Camera Lens, Sensor, View, and Domain for Novel Image Generation [15.6] テキスト・インバージョン(MULTI)による多要素不整合の新たな手法を提案する。
第1段階では一般的な因子を学習し,第2段階ではデータセット固有の要素を抽出する。
これにより、既存のデータセットと新しい要素の組み合わせを拡張し、分散ギャップを減らすことができる。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:55:48 GMT)
Learning U-Statistics with Active Inference [15.5] 固定されたラベル付け予算の下で評価効率を向上させるために,情報ラベルを問合せする$U$統計のためのアクティブな推論フレームワークを開発する。
我々のアプローチは、サンプリングルールと機械学習予測を組み込むために設計された、U$-statisticの強化逆確率重み付けに基づいて構築されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:59:36 GMT)
Learning to Decide with AI Assistance under Human-Alignment [15.5] 我々は,AIと人間の信頼を完璧に一致させることで,学習者が期待される$O(sqrt|H| cdot Tlog Tlog Tlog T)の後悔を達成できることを示した。
まとめると、これらの結果は、アライメントがAIアシストで意思決定を行うための学習の複雑さを減少させることを示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:42:49 GMT)
IPI-proxy: An Intercepting Proxy for Red-Teaming Web-Browsing AI Agents Against Indirect Prompt Injection [15.5] IPI-proxyは、間接的プロンプトインジェクション(IPI)に対するWebブラウジングエージェントをリピートするためのオープンソースのツールキットである。
その中核はインターセプトプロキシで、飛行中のホワイトリストドメインから実際のHTTPレスポンスを書き換える。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:48:53 GMT)
Selection, Not Fusion: Radar-Modulated State Space Models for Radar-Camera Depth Estimation [15.4] 我々は,ガンバの選択的スキャンにレーダーを注入する原理的手法であるRMS(Radar-Modulated Selection)を導入する。
RMS は nuScenes の最先端性能を達成し、以前の 0-50, 0-70, 0-80m で、MAE を 34.0%, 29.9%, 29.9% で下げた。
さらなるアブレーションにより、アウト・オブ・スキャン(out-of-scan)機能のブレンディングは、RMSの上に精度を増すことなく、イン・オブ・スキャンの選択がアウト・オブ・スキャンの融合を置き換えるという実証的な検証を提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:25:54 GMT)
Dynamic Full-body Motion Agent with Object Interaction via Blending Pre-trained Modular Controllers [15.4] 本稿では,テーブルを握りながら実行するなど,動的かつ長期にわたるインタラクション動作を実現するフレームワークを提案する。
計画段階では、事前訓練されたヒトの運動拡散モデルからオブジェクトの軌跡生成に先立って、HOIデータセットを動的に拡張する。
実行段階では、作曲家ネットワークは、動的な人間の動きや静的なHOIの動きに対して、事前訓練された模倣エージェントの動作をブレンドする。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:43:26 GMT)
Rollout Cards: A Reproducibility Standard for Agent Research [15.4] 論文は、レポートされたスコアでシステムを比較し、それらのスコアの背後にロールアウトレコードを残すことは、検査が困難である。
エージェント的なタスクでは、評価がロールアウトの異なる部分を選択したり、異なるレポートルールを適用する場合、同じ振る舞いが異なるレポートスコアを受け取ることができるため、これが重要です。
50の人気のあるトレーニングと評価レポジトリの構造化監査では、ヘッドラインスコアとともに、実行が失敗、エラー、あるいはスキップされた回数を報告していないことが判明した。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:54:31 GMT)
PhishSigma++: Malicious Email Detection with Typed Entity Relations [15.4] PhishSigma++はRFC822メッセージ用のエンティティリレーションベースの悪意のあるメール検出器である。
29,142のメッセージでは、PhishSigma++はクリーンデータで0.9675 F1を獲得し、テキスト中心のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:46:40 GMT)
MaskTab: Scalable Masked Tabular Pretraining with Scaling Laws and Distillation for Industrial Classification [15.3] MaskTabは、専用の学習可能なトークンを通じて、欠落した値をエンコードする。
工業規模のベンチマークでは、AUCは+5.04%、KSは+8.28%に達する。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:56:04 GMT)
Towards Generalist Game Players: An Investigation of Foundation Models in the Game Multiverse [15.3] ゲームは、単なるエンターテイメントから、人工知能のトレーニングと評価の究極の場へと進化してきた。
私たちは、データセット、モデル、ハーネス、ベンチマークの4つの柱に沿って、ジェネラリストゲームプレイヤの完全なライフサイクルをトレースします。
このエンド・ツー・エンドの視点に基づいて、5段階のロードマップをグラフ化し、エージェントが理論ゲームマルチバース内で同時に生成し進化する、単一ゲームの熟達から究極の創造段階へと進む。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:54:46 GMT)
Value-Decomposed Reinforcement Learning Framework for Taxiway Routing with Hierarchical Conflict-Aware Observations [15.3] コンフリクト対応タクシーウェイルーティング(CaTR)は、リアルタイムマルチエアクラフトタクシーウェイルーティングのための強化学習フレームワークである。
実験は、長社黄華国際空港をベースとした現実的な環境で行われる。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:08:31 GMT)
HSUGA: LLM-Enhanced Recommendation with Hierarchical Semantic Understanding and Group-Aware Alignment [15.3] 階層意味理解(HSU)とグループ認識アライメント(GAA)の2つのコアコンポーネントに対して,シンプルながら効果的なプラグインを提供するHSUGAを提案する。
HSUGAは、制約付き編集操作による段階的二相選好マイニングとモデル選好進化を行い、ユーザセマンティック抽出の信頼性を向上させる。
GAAは、ユーザアクティビティレベルに基づいてセマンティック利用の強度を調整し、アクティブなユーザのためのアライメントの弱さと、希少な履歴データを持つユーザのためのより強力なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:22:42 GMT)
PointGS: Semantic-Consistent Unsupervised 3D Point Cloud Segmentation with 3D Gaussian Splatting [15.2] 教師なしのポイントクラウドセグメンテーションは、人工知能と自律運転に不可欠である。
本稿では,教師なし3次元点雲分割のための簡易かつ効果的なパイプラインであるPointGSを提案する。
実験により、PointGSは最先端の教師なし手法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:44:50 GMT)
Robust LLM Unlearning Against Relearning Attacks: The Minor Components in Representations Matter [15.2] 未学習のモデルは、再学習攻撃によって「忘れられた」知識を素早く回復する。
これにより、特にオープンウェイトモデルにおいて、深刻なセキュリティ上の懸念が生じる。
本稿では,表現の小さなコンポーネントを明示的に対象とする新しいアンラーニング手法であるMCUを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:43:46 GMT)
When Does $\ell_2$-Boosting Overfit Benignly? High-Dimensional Risk Asymptotics and the $\ell_1$ Implicit Bias [15.1] 良性オーバーフィッティングが線形レートで失敗することを示します。
この局所化機構は信号の存在下で持続するべきであるが、正確な信号-雑音分解は未解決の問題である。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:32:02 GMT)
CTFusion: A CTF-based Benchmark for LLM Agent Evaluation [15.1] 我々は,Live CTF上に構築されたストリーミング評価フレームワークであるCTFusionを提案する。
既存の CTF ベンチマークは LLM ベースのエージェントの評価では信頼性が低いことを実証する。
我々は,CTFusionをオープンソースとしてリリースし,今後の研究を促進する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:23:42 GMT)
Reinforcing VLAs in Task-Agnostic World Models [15.1] 強化学習(RL)による後学習型ビジョン・ランゲージ・アクション(VLA)モデルは、コストのかかる実世界の相互作用を伴わずに新しいタスクに適応するための効果的な戦略として登場した。
我々は、世界と報酬モデルがゼロショット推論を可能にする転送可能な物理的事前をキャプチャすべきであると主張している。
我々は、下流のタスク依存から世界モデル学習を完全に切り離す新しいパラダイムであるRAW-Dreamを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:16:15 GMT)
L2A: Learning to Accumulate Pose History for Accurate 3D Human Pose Estimation [15.0] 既存の2D-3Dリフトヒトポーズ推定法は高い性能を達成している。
しかし,ネットワーク深度にまたがる歴史的ポーズ表現の利用は見過ごされた。
ネットワーク間履歴の特徴を効果的に活用するための履歴認識フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:05:06 GMT)
BSO: Safety Alignment Is Density Ratio Matching [15.0] 最適安全政策の可能性は、密度比整合問題に対する安全性の整合性を低下させるクローズドフォーム分解を許容することを示す。
データとモデル比率の差異を最小限に抑えることで、Bregman Safety Optimization (BSO) は単一段の損失関数のファミリーとなり、最適な安全ポリシーを確実に回復する。
安全アライメントベンチマークによる実験は、BSOが一貫して安全ヘルパフルネストレードオフを改善していることを示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:19:42 GMT)
PRISM: A Geometric Risk Bound that Decomposes Drift into Scale, Shape, and Head [14.9] 本研究では,LLMの線形出力ヘッドと背骨のほぼ等尺構造を利用したPRISMを提案する。
境界は変分ランクに調整され、ドリフトを3つの独立測定可能な軸に分解する。
PRISMは、学習後の量子化において平均スピアマン相関が0.820、LoRAを忘れるために0.831の変種をランク付けする。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:40:34 GMT)
Encore: Conditioning Trajectory Forecasting via Biased Ego Rehearsals [14.8] 軌道予測タスクにおけるエージェントの主観性を表す問題について検討する。
心理学における事前の思考と関連する劇場概念から着想を得て,提案するエゴ予測器を開発した。
実験により,提案したEmphEncore軌道予測モデルの性能が一貫した改善を示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:21:24 GMT)
Creating Group Rules with AI: Human-AI Collaboration in WhatsApp Moderation [14.8] WhatsAppグループ管理者がAIツールとどのように協力し、グループルールを作成し、強制し、維持するかを示す。
我々の調査によると、管理者は、見過ごされたルールを提示し、モデレーションの負担を軽減できるAIの能力に感謝している。
人間の判断、関係的ニュアンス、文脈適応性、集合的ガバナンスを中心とするモデレーションツールを構築する上での設計上の意味を結論付けます。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:02:49 GMT)
H2G: Hierarchy-Aware Hyperbolic Grouping for 3D Scenes [14.8] 階層的な3Dグルーピングは、セマンティックラベルや固定語彙に頼ることなく、複数の粒度にわたるシーングループを復元することを目的としている。
階層型3次元グルーピングのための双曲アフィニティ場であるH2Gを提案する。
階層を意識した目的は、フィールドを微調整、粗いオブジェクト構造、コンパクトな特徴クラスタ、LCA(Lowest Common Ancestor)順序で整列させる。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:19:57 GMT)
PrivacySIM: Evaluating LLM Simulation of User Privacy Behavior [14.6] 大規模言語モデル(LLM)は、人間の振る舞いをシミュレートするためにますます使われているが、$individual$プライバシー決定をシミュレートする能力はよく理解されていない。
本研究では,LLMシミュレーションによるユーザプライバシ動作のシミュレーションを,1000人のユーザに対して実施する評価スイートであるPrivacySIMを紹介する。
これら3つのファセットのサブセットに9つのフロンティアLSMを条件とし、各モデルのデータ共有シナリオに対するレスポンスがユーザの実際のレスポンスとどの程度の頻度で一致しているかを測定する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:05:14 GMT)
Code-Guided Reasoning for Small Language Models: Evaluating Executable MCQA Scaffolds [14.6] 評価プロトコルと生成プログラムリソースであるCode-Guided Reasoning (CGR)を紹介する。
CGRは6つのコンポーネントを標準化している: 正規化されたアイテムインターフェース、直接解決プロンプト、ジェネレータプロンプト、Pythonの足場、ソルバコールと抽出ヘルパー、3チャンネルの結果レコード。
20,498行のMCQAバンドルと6つのメタデータ登録ソルバモデルからの保存結果行に対して、観測された非ゼロベースライン分割は66.21%のマクロアシスト精度と38.11%の直接精度を示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:20:06 GMT)
Learning to Explore: Scaling Agentic Reasoning via Exploration-Aware Policy Optimization [14.6] 既存の手法の鍵となる制限は、通常、未分化の探査戦略を採用することである。
本研究では,LLMエージェントが不確実性が高い場合にのみ適応的に探索できる探索対応強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:23:49 GMT)
A Deep Learning-based Receiver for Asynchronous Grant-Free Random Access in Control-to-Control Networks [14.4] 本研究は,共用無線チャネルを用いた屋内シナリオにおけるC2C通信について検討する。
本稿では,受信信号を直接操作する単一畳み込みニューラルネットワーク(CNN)により,コマンド単位境界の検出を行う受信アーキテクチャを提案する。
起動シーケンス検出は受信波形のみに依存する必要があるが、テールシーケンス検出はLDPCデコーダが生成するソフト情報を活用することができる。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:22:31 GMT)
Enhancing Multilingual Counterfactual Generation through Alignment-as-Preference Optimization [14.4] 多言語SCE生成に直接優先度最適化を適用する優先アライメントフレームワークであるMacroを紹介する。
マクロは最小限の劣化を伴わずに,チェーンオブソートベースライン平均で12.55%の妥当性向上を図っている。
提案手法は,多言語モデル説明の強化に期待できる方向として,好みの最適化に重点を置いている。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:56:18 GMT)
OmniRefine: Alignment-Aware Cooperative Compression for Efficient Omnimodal Large Language Models [14.4] 我々は,Omni-LLMにおける効率的な音声・視覚トークン圧縮のためのトレーニングフリー2段階フレームワークを提案する。
第一に、対応保存チャンクリファインメントは、ネイティブチャンク境界をクロスモーダルな圧縮ユニットに洗練する。
第二に、Modality-Aware Cooperative Compressionは、各改良されたユニット内のビデオトークンとオーディオトークンを共同で圧縮し、重要な証拠を保持しながら冗長性を低下させる。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:42:44 GMT)
Executable Agentic Memory for GUI Agent [14.4] 構造化知識グラフ(KG)であるExecutable Agentic Memory(EAM)を提案する。
EAMはGUIプランニングをフリーフォーム生成から堅牢な検索・実行プロセスに移行する。
平均レイテンシが2.8ドルで、EAMは信頼性、迅速、長期のGUI自動化を可能にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:48:44 GMT)
BROS: Bias-Corrected Randomized Subspaces for Memory-Efficient Single-Loop Bilevel Optimization [14.3] BROSは単ループSBO法と同じ収束率のメモリ効率の高い単ループSBO法である。
ハイパーデータクリーニング、データ混合学習、ハイパー表現学習、ViTサンプル再重み付けの実験は、BROSがピークメモリを最大44.9%削減することを示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:19:03 GMT)
Geometry-Aware Neural Optimizer for Shape Optimization and Inversion [14.3] 幾何学はPDEが支配するシステムの中心であり、形状最適化と反転を動機付けている。
本稿では,1つの潜在空間ループにおける幾何学表現,フィールドレベルの予測,自動最適化/反転を統一する,エンドツーエンドの微分可能なフレームワークであるGeometry-Aware Neural (GANO)を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:27:55 GMT)
BenchCAD: A Comprehensive, Industry-Standard Benchmark for Programmatic CAD [14.3] 本稿では,産業CAD推論のための統一ベンチマークであるBenchCADを紹介する。
BenchCADには,106の産業部門を対象とした17,900のCadQueryプログラムが含まれている。
視覚的質問応答、コード質問応答、画像からコードへの生成、命令誘導コード編集を通じてモデルを評価する。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:46:14 GMT)
An Empirical Study of Automating Agent Evaluation [14.2] エンドツーエンドエージェント評価パイプラインを自動化するAIアシスタントであるEvalAgentを紹介する。
EvalAgentは評価ドメインの専門知識を評価スキルとしてエンコードする。
EvalAgentは、焦点を絞った評価を行い、Eval@1を17.5%から65%に改善し、ベースラインアプローチよりも79.5%の人間専門家の選好を達成した。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:06:34 GMT)
Large Language Models for Agentic NetOps and AIOps: Architectures, Evaluation, and Safety [14.2] 大規模言語モデルは、ネットワークオペレーション(NetOps)とITオペレーションのための人工知能(AIOps)をサポートするために、ますます使用されている。
NetOpsとAIOpsでは、このシフトがタスクの管理方法を変えています。
エージェントベースのオペレーションは、エビデンス収集からアクションの実施、パーミッション、ポリシー、チェックの追跡、必要に応じてロールバックオプションの提供に至るまで、管理されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:31:41 GMT)
Sharpen Your Flow: Sharpness-Aware Sampling for Flow Matching [14.2] フローマッチングモデルは、学習速度場を数値的に統合してサンプルを生成する。
主な問題は、フローをどのように統合するかだけでなく、サンプルラーはそのステップをどこで使うべきかである。
我々は、事前訓練されたモデルをオフラインでプロファイルする、トレーニング不要のサンプルラであるSharpEulerを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:22:54 GMT)
Profit Maximization in Bilateral Trade against a Smooth Adversary [14.2] バイラテラル取引は、商品の取引を希望する売り手と買い手という2つの戦略エージェントの仲介業務をモデル化する。
本研究では,オンライン学習フレームワークにおける収益最大化ブローカーの観点から,エージェントのバリュエーションがスムーズな相手によって生成される問題について検討する。
我々は,時間的地平線に強い$tildeO(sqrtT)$ regret boundを保証できる学習アルゴリズムを考案した。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:12:57 GMT)
LychSim: A Controllable and Interactive Simulation Framework for Vision Research [14.0] Unreal Engine 5上に構築された高度に制御可能でインタラクティブなシミュレーションフレームワークであるLychSimを紹介します。
LychSimは、(1)エンジンの複雑さを抽象化するPython APIの合理化、(2)様々なアウト・オブ・ディストリビューション(OOD)による多様な高忠実な環境を生成可能なプロシージャデータパイプライン、(3)エージェントLLMを推論するためにシミュレータを動的にクローズループグラウンドに変換するModel Context Protocol(MCP)のネイティブな統合、の3つの主要な設計に基づいて構築されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:40:38 GMT)
Enhancing Domain Generalization in 3D Human Pose Estimation through Controllable Generative Augmentation [13.8] 本研究は、さまざまなポーズ、背景、カメラ視点によって多様な映像データを合成する、制御可能なヒューマンポーズ生成フレームワークを提案する。
屋内/現実世界と屋外/仮想両方のデータセットを活用することで、クロスドメインデータ融合と制御可能なビデオ生成を行い、リッチなトレーニングデータを構築する。
実験によると、拡張データセットは、目に見えないシナリオやデータセットのモデルパフォーマンスを著しく改善する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:37:53 GMT)
Instruction Lens Score: Your Instruction Contributes a Powerful Object Hallucination Detector for Multimodal Large Language Models [13.7] 本稿では,命令トークンの埋め込みを詳細に解析し,視覚情報を暗黙的に符号化することを明らかにする。
本稿では,Calibrated Local Score とContext Consistency Score を組み合わせた Instruction Lens Score (InsLen) を提案する。
提案手法は補助モデルや追加訓練に頼ることなく、プラグアンドプレイ物体幻覚検出器として機能する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:27:40 GMT)
Toward Stable Value Alignment: Introducing Independent Modules for Consistent Value Guidance [13.6] 本研究では,大きな言語モデルと人間の値とを一致させる安定値誘導変換器(SVGT)を提案する。
複数のバックボーンと安全ベンチマークでの実験では、SVGTは一般的に有害なスコアを70%以上削減している。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:02:34 GMT)
TokenRatio: Principled Token-Level Preference Optimization via Ratio Matching [13.6] 標準的なシーケンスレベルのペアワイズ比較のみを用いてトークンレベルの最適性を回復する方法を示す。
本稿では,軽量な状態ベースラインを明示的に学習するTBPO-Qと,高次正規化によりベースラインを除去するTBPO-Aの2点を紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:44:33 GMT)
WildPose: A Unified Framework for Robust Pose Estimation in the Wild [13.6] 動的環境においてロバストな統一単分子ポーズフレームワークWildPoseを紹介した。
我々の重要な洞察は、現代の3次元視覚における2つの強力なパラダイムを接続することである:フィードフォワードモデルのリッチな知覚的推定と、微分可能バンドル調整(BA)のエンドツーエンド最適化である。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:39:44 GMT)
CoT-Guard: Small Models for Strong Monitoring [13.6] 推論モデルのチェーンオブ思考(CoT)をモニタリングすることは、コード生成タスクにおける隠蔽行動(隠蔽目的)を検出するための有望なアプローチである。
大きなモデル(GPT-5、Gemini-3-Flash)は効果的なCoTモニタとして機能するが、長い推論トレースと高いAPIコストのためにデプロイに費用がかかる。
本研究では、教師付き微調整(SFT)と強化学習(RL)を組み合わせた後学習パイプラインを提案し、SFTはドメイン内タスクのギャップを狭める。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:49:30 GMT)
Options, Not Clicks: Lattice Refinement for Consent-Driven MCP Authorization [13.5] リスクをエスカレートしながら、既知のバウンダリ内の安全なコールを自動送信するリスク格子を利用して、バウンダリスコープによる認証を実施するクライアントサイドであるConleashを提案する。
98.2%の精度を達成し、99.4%のエスカレーションを獲得し、8.2msのオーバヘッドしか加えなかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:25:56 GMT)
Metric-Gradient Projection for Stable Multi-Agent Policy Learning [13.5] 汎用マルチエージェント学習は、各エージェントのポリシー更新が他者が直面している最適化状況を変えるような、積み重ねた更新フィールドによって管理される。
我々は,Hodge型プロジェクションを最も近い距離勾配ポテンシャル流に演算するtextbfHPMLを提案する。
射影力学はリアプノフポテンシャルを許容し、明示的な加法的非ポテンシャル項を持つ平衡ギャップ境界を得ることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:02:01 GMT)
Learning Protein Structure-Function Relationships through Knowledge-guided Representation Decomposition [13.5] ProtDiSは、事前訓練されたタンパク質のマイクロ環境埋め込みを生物学的に接地された次元に分解する知識誘導フレームワークである。
情報ボトルネックの原則にインスパイアされたProtDiSは、情報量と圧縮のバランスをとる表現を学ぶ。
タンパク質および残基レベルの分析により、ProtDiSは類似の折りたたみを持つタンパク質を区別するが、異なる機能を持ち、きめ細かい生物学的シグナルを捕捉する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:12:12 GMT)
REFNet++: Multi-Task Efficient Fusion of Camera and Radar Sensor Data in Bird's-Eye Polar View [13.5] 我々は、レーダーとカメラデータを統一領域で整列させることにより、マルチモーダルセンサ融合の課題に対処する。
我々は,前景カメラデータのバードアイビュー(BEV)極域への変換を学習する変分エンコーダデコーダアーキテクチャを採用している。
このアライメントにより、両方のモダリティが互換性のあるドメインで表現され、堅牢で効率的なセンサー融合が実現される。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:13:02 GMT)
Attacks and Mitigations for Distributed Governance of Agentic AI under Byzantine Adversaries [13.5] 最先端のソリューションであるSAGAは、ユーザおよびエージェント情報のレポジトリとして機能する、論理的に中央集権的な信頼ポイントであるプロバイダを前提としています。
私たちは、さまざまなシステムコンポーネントと現実的なデプロイメントを考慮して、妥協されたプロバイダから実装可能な攻撃を分析します。
セキュリティとパフォーマンスの異なるトレードオフを提供するプロバイダを確保するための3種類のソリューションを提示します。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:33:50 GMT)
Parallel-in-Time Training of Recurrent Neural Networks for Dynamical Systems Reconstruction [13.4] データ(DSR)から非線形力学系を再構築することは、科学と工学における根本的な課題である。
シーケンシャルモデルの最近のブレークスルーは、シーケンス長$T$に沿って並列化するアルゴリズムを生み出している。
本稿では,この課題に対する並列時間アルゴリズムの2つの顕著なクラスについて検討する。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:32:32 GMT)
DIVER:Diving Deeper into Distilled Data via Expressive Semantic Recovery [13.4] 我々は$textbfDIVER$という新しい二段蒸留フレームワークを提案する。
セマンティック継承は抽象的蒸留画像の高レベルな意味論を潜在空間に蒸留する。
セマンティックガイダンスは、元のセマンティクスの保存を改善する。
意味融合は、逆過程の具体的な段階でのみ意味的なガイダンスを提供するように設計されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:55:53 GMT)
STAR: Failure-Aware Markovian Routing for Multi-Agent Spatiotemporal Reasoning [13.3] 本稿では,現在のエージェント,タスクタイプ,型付き実行状態に対する状態条件付きポリシとして,エージェント間制御を外部化するフェールアウェアルーティングフレームワークSTARを提案する。
障害状態のトレースは異なるため、ルータは不正な出力、依存関係の欠如、ツール-グラウンド抽出-- 計算-デポジットプロトコルに異なる応答をし、中間結果を共有ブラックボードに書き込み、下流融合を行う。
その結果、トレーニング中にトレースが失敗すると、ルーティングポリシのエラー状態のサポートが拡大し、成功のみのトレーニングでは表現できないリカバリ移行が可能になることが証明された。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:38:03 GMT)
A Data Efficiency Study of Synthetic Fog for Object Detection Using the Clear2Fog Pipeline [13.2] 悪天候下での物体検出は、自動運転車の安全性にとって重要である。
クリーンウェザーデータセット上で霧をシミュレートする,エンドツーエンドの物理ベースのパイプラインであるClear2Fogを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:01:00 GMT)
The Unified Autonomy Stack: Toward a Blueprint for Generalizable Robot Autonomy [13.1] 我々は,空と地上のロボット形態を横断するレジリエンスな自律を可能にするシステムレベルのソリューションであるUnified Autonomy Stackを紹介し,オープンソース化する。
アーキテクチャは、マルチモーダル認識、マルチビヘイビア計画、マルチレイヤセーフナビゲーションの3つのモジュールを中心にしている。
このスタックは、地上(ロータークラフト)ロボットと地上(レッグ)ロボットの両方でフィールドテストされ、検証されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:39:35 GMT)
Overcoming Dynamics-Blindness: Training-Free Pace-and-Path Correction for VLA Models [13.0] 既存のアプローチでは、高価な再トレーニングが必要か、レイテンシのボトルネックとアクションチャンク間の時間的一貫性の低下に悩まされる。
チャンクされた動作VLAをラップするトレーニングフリーでクローズド形式の推論時間演算子であるPace-and-Path Correctionを提案する。
動作を唯一の制御変数として分離する目的で設計された総合的な診断ベンチマークMoveBenchについて,本手法の評価を行った。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:17:59 GMT)
3DGS$^3$: Joint Super Sampling and Frame Interpolation for Real-Time Large-Scale 3DGS Rendering [12.9] 3D Gaussian Splatting (3DGS)は高品質なリアルタイム3Dレンダリングを実現する。
我々は、高解像度および高フレームレートのレンダリングを実現するために、超サンプリングとフレーム処理を共同で行う統合後レンダリングフレームワークである textbf3DGS$3$ を提案する。
公開データセットの実験では、3DGS$3$は最先端の手法と比較して優れたレンダリング効率と視覚的品質を実現し、既存の3DGSアクセラレーション技術と相容れないことが示されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:05:36 GMT)
OmniThoughtVis: A Scalable Distillation Pipeline for Deployable Multimodal Reasoning Models [12.9] 我々は、マルチモーダル推論能力をより小さく、デプロイ指向のMLLMに転送するためのスケーラブルなデータキュレーションおよび蒸留パイプラインであるOmniVisを紹介する。
データ品質を大規模に維持するために、ルールベースのフィルタリング、難易度選択、タグベースの多様性サンプリングを組み合わせる。
4BモデルのMMMU-Proでは、MathVerseでは+16.8点、MMMU-Proでは+5.6点の改善など、モデルスケール全体で一貫した利得を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:54:57 GMT)
GemDepth: Geometry-Embedded Features for 3D-Consistent Video Depth [12.9] ビデオ深度推定は、一眼的予測を時間領域に拡張し、コヒーレンスを確保する。
現在のアプローチは主にトランスフォーマーによる時間的平滑化に依存しており、厳密な3次元幾何学的整合性を維持するのに苦労している。
GemDepthは,カメラモーションとグローバル3D構造を明確に認識することが3D一貫性の前提条件である,という知見に基づいて構築されたフレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:16:58 GMT)
Towards Visually Grounded Multimodal Summarization via Cross-Modal Transformer and Gated Attention [12.7] テキスト要約と代表画像選択を共同で行う統合フレームワークを提案する。
SPeCTrA-Sumは自己回帰的要約、クロスモーダルアライメント、DPPに基づく蒸留を組み合わせた多目的損失を用いて訓練される。
実験により,本システムはより正確で視覚的な要約を生成し,より代表的な画像を選択する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:28:47 GMT)
Measuring What Matters Beyond Text: Evaluating Multimodal Summaries by Quality, Alignment, and Diversity [12.7] 本稿では,テキスト品質,モーダルアライメント,視覚的多様性などの評価を統合する統合評価フレームワークMM-Evalを紹介する。
MM-Evalは,(1)事実整合性のためにOpenFActScoreを用いて測定されたテキスト品質,(2)コヒーレンス,関連性,(2)MLLM-as-a-judgeアプローチを用いて評価された画像テキスト関連性,(3)Trncated CLIP Entropyを用いて定量化した画像セットの多様性の3つの構成要素から構成される。
この環境では、事実整合性は、知覚された全体的な品質の重要な決定要因として機能する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:50:55 GMT)
Still Camouflage, Moving Illusion: View-Induced Trajectory Manipulation in Autonomous Driving [12.7] 既存の視覚に基づく自律運転に対する物理的敵対攻撃は、時間進化する知覚エラーを誘発する。
視角の変化自体が攻撃ツールに変換可能であることを示す。
我々はnuScenesデータセットに対する新たな攻撃を実演し、エンドツーエンドの成功率87.5%までの有効性を示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:47:55 GMT)
The End Justifies the Mean: A Linear Ranking Rule for Proportional Sequential Decisions [12.6] 我々は、繰り返し使用する決定ルールを集合的に選択する方法を研究する。
デフォルトのルールである$(i)$の算術平均は、非常に大義的であることが示されている。
固定線形ルールでは、正確なバッチ毎IPは不可能であるが、バッチ毎IPと長時間IPのギャップはバッチサイズとともに急速に縮小する。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:26:37 GMT)
Efficient and provably convergent end-to-end training of deep neural networks with linear constraints [12.6] プロジェクション層に効率よく計算可能なHS-ヤコビアンを導入する。
HS-ヤコビアンが射影作用素の多面体集合への保守写像であることを証明する。
我々は、線形に制約されたディープニューラルネットワークをトレーニングするためのHS-JacobianベースのAdamアルゴリズムの収束保証を確立する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:51:55 GMT)
Beyond Parameter Aggregation: Semantic Consensus for Federated Fine-Tuning of LLMs [12.5] 大規模言語モデルのフェデレートされた微調整は、パラメータ集約問題として一般的に定式化される。
我々は、パラメータではなくモデル行動を通じて協調を媒介する代替の定式化を考える。
本稿では,この手法が強結合型微調整ベースラインと一致することを示す理論的解析と実験結果を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:41:40 GMT)
Design and Analysis of Quantum Dual-Containing CSS LDPC Codes based on Quasi-Dyadic Matrices [12.5] 本稿では,高レートの量子二重包含(DC)Calderbank-Shor-Steane(CSS)低密度パリティチェック(LDPC)コードについて述べる。
直流構造により、アダマールゲートの実装が可能となり、パリティチェック行列の空間性とともに、低複雑さ復号化が可能となる。
これらの構成により得られた量子CSS LDPC符号は、ブロック長とコードレートの異なる既存のDC符号よりも、有限長の誤り率性能がよいことを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:51:44 GMT)
Rethink the Role of Neural Decoders in Quantum Error Correction [12.4] 量子誤差補正(QEC)は、量子上の利点を実現するために不可欠である。
我々は,表面符号復号化のためのニューラルデコーダを,明示的な精度-遅延制約の下で再検討する。
FPGAハードウェア上でのデプロイ性と性能を評価するために,エンドツーエンド圧縮パイプラインを開発した。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:26:43 GMT)
Optimizing 4D Wires for Sparse 3D Abstraction [12.4] 単一連続4次元ワイヤを用いた3次元幾何学的抽象化のための統一的なフレームワークを提案する。
統一表現は,高忠実度で構造コヒーレンスを向上した構造を生成することを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:33:43 GMT)
TCP-SSM: Efficient Vision State Space Models with Token-Conditioned Poles [12.4] ステートスペースモデル(SSM)は、長距離ビジョンタスクの注意モデルに代わる魅力的な代替品として登場した。
本稿では,再帰ダイナミクスを明示しつつ効率を向上する構造化選択型SSMフレームワークであるToken-Conditioned Poles SSMを提案する。
TCP-SSMは、ベースライン精度を維持したり超えたりしながら、Vision MambaスタイルのモデルでSSM計算の複雑さを最大44%削減することを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:49:46 GMT)
Approximation of Maximally Monotone Operators : A Graph Convergence Perspective [12.3] 本稿では,グラフ収束による近似の定式化によるパラダイムシフトを提案する。
この設定では、均一性と$Lp$近似が根本的に不十分であることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:53:13 GMT)
ANCHOR: Abductive Network Construction with Hierarchical Orchestration for Reliable Probability Inference in Large Language Models [12.3] 階層的因子空間上のベイズ推定フレームワークであるtextscAnchorを提案する。
反復生成とクラスタリングを通じて高密度因子階層を構築し、階層的検索と洗練を通じてコンテキストをマップし、コーサルベイズネットワークでナヴベイズを増強する。
実験により、textscAnchorは未知の予測を著しく削減し、より信頼性の高い確率推定を生成することが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:28:46 GMT)
State-Centric Decision Process [12.2] 我々は,エージェントがエージェントを構築し,述語によって述語し,動作させるようにすることで,欠落した入力を構築するランタイムフレームワークであるState-Centric Decision Process (SDP)を紹介した。
SDPは、計画、科学的探索、Web推論、マルチホップ質問応答にまたがる5つのベンチマークで、トレーニングなしの最良の結果を得る。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:09:43 GMT)
Quantifying Potential Observation Missingness in Inverse Reinforcement Learning [12.2] 逆強化学習(IRL)は、実演から報酬関数を推論する。
記録されたデータは、元の意思決定者で利用可能な観測結果が欠落している可能性があることを示す。
医療などの利用にインスパイアされた環境では、専門家の行動が最適に見えます。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:56:36 GMT)
Beyond Point-wise Neural Collapse: A Topology-Aware Hierarchical Classifier for Class-Incremental Learning [11.8] NCM(Nearest Class Mean)は、破滅的な忘れ込みに対する優れた抵抗性から、CIL(Class-Incremental Learning)において広く支持されている。
局所-グローバル'表現を通じてこれらのクラスの位相構造をキャプチャする新しい分類器である階層クラスタSOINN(HC-SOINN)を提案する。
本稿では, 細粒度軌跡追跡機構を用いたStructure-Topology Alignment via Residuals (STAR)法を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:18:08 GMT)
HySecTwin: A Knowledge-Driven Digital Twin Framework Augmented with Hybrid Reasoning for Cyber-Physical Systems [11.7] HySecTwinは知識駆動型ディジタルツインアーキテクチャで、リアルタイム脅威検出のコアに自動推論を配置する。
フレームワークは決定論的ルールベースの推論とハイブリッドファジィ推論を統合し、明示的で解釈可能で監査可能なセキュリティアセスメントを生成する。
その結果、セマンティックモデリング、セマンティックエンリッチメント、ハイブリッド推論は、システムオーバーヘッドを余分に伴わずに説明可能性やレジリエンスを向上させることが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:41:31 GMT)
The Evaluation Differential: When Frontier AI Models Recognise They Are Being Tested [11.7] 最近の公表された証拠は、現代のAIモデルが、評価コンテキストを認識し、最近になってそれらを表現し、それらのコンテキスト下では、デプロイメント連続的な条件下でとは異なる振る舞いをすることができることを示している。
これらの結果は、フロンティア評価から引き出された安全結論に対するクレーム正当性問題を生み出していると論じる。
本報告では, 安全クレームのタイプ (ED-stable, ED-degraded, ED-inverted, ED-undetermined) を, 文書発散に基づく保証基準を用いて開発し, TRACE (Test-Recognition Audit for Claim Evaluation) を指定する。
我々は,この枠組みを3件の公文書化された評価事件に遡って適用し,システムカードのガバナンスへの影響,適合性評価,及びガバナンスへの影響について議論する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:13:35 GMT)
Training-Inference Consistent Segmented Execution for Long-Context LLMs [11.6] トランスフォーマーベースの大規模言語モデルは、長期コンテキスト生成において深刻なスケーラビリティの課題に直面している。
多くの推論効率の長いコンテキストメソッドは、推論時にのみ境界付きコンテキストやセグメントレベルの実行を採用することで効率を向上する。
トレーニング推論一貫性のあるセグメントレベル生成フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:23:00 GMT)
Precision Tracked Transformer via Kalman Filtering, Kriging and Process Noise [11.6] Transformerは現代のAIの基礎的なビルディングブロックだが、不確実性の原則的扱いは提供していない
EmphBayesian Filtering Transformer (BFT) の例を示す。
BFTは任意のトランスフォーマー層を無視可能なオーバーヘッドで置き換える。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:22:15 GMT)
PoseBridge: Bridging the Skeletonization Gap for Zero-Shot Skeleton-Based Action Recognition [11.6] PoseBridgeは、中間的なZSSAR表現をスケルトンテキストアライメントにブリッジするフレームワークである。
評価プロトコルの下でZSSARの性能を向上させる。
私たちのコードは公開されます。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:15:52 GMT)
On the LSH Distortion of Ulam and Cayley Similarities [11.6] 局所性感受性ハッシュ(LSH)は基本的なプリミティブとして広く利用されている。
LSH歪みは、類似性関数がLSHスキームを持つことを乗法的にクローズする方法を測定する。
ウラム類似性は、$O(n / sqrtlog n)$の線形LSH歪みを許容し、最高のLSH歪みを達成可能な$(n0.12)$の低い境界も証明する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:36:46 GMT)
fg-expo: Frontier-guided exploration-prioritized policy optimization via adaptive kl and gaussian curriculum [11.5] FG-ExPOは,Frontier-Guided Exploration-Prioritized Policy Optimizationの略である。
精度制御KLスケーリング(AKL)は、バッチ平均精度のスムーズな非線形関数により、KLのペナルティ強度を調整する。
我々は6つの主要な数学的推論ベンチマークでDeepSeek-R1-Distill-Qwen-1.5BとQwen3-8B-Baseの評価を行った。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:48:48 GMT)
Deep Probabilistic Unfolding for Quantized Compressive Sensing [11.5] 本稿では,古典的量子化圧縮センシング問題に対処する確率的展開モデルを提案する。
我々は、モデルが真の量子化物理学を尊重することを可能にする閉形式、数値的に安定な勾配公準射影を導出する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:44:03 GMT)
GRC: Unifying Reasoning-Driven Generation, Retrieval and Compression [11.5] 我々は、推論駆動型生成、推論強化テキスト表現、コンテキスト圧縮タスクを橋渡しするGRCというトレーニングフレームワークを提案する。
トレーニングされたモデルは、1回のフォワードパスで3つの目標を達成することができる。
このフレームワークの設計により、テキスト埋め込みの新しいパラダイムが実現される。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:58:42 GMT)
Decomposing the Generalization Gap in PROTAC Activity Prediction: Variance Attribution and the Inter-Laboratory Ceiling [11.5] 我々は、これを評価科学的な問題とみなし、実験的なテストベッドとして標的タンパク質の分解を利用する。
ProTAC-Bench (10,748 測定,173 ターゲット,65 LOTO フォルダ),分散復号化フレームワーク,ターゲットごとのキャリブレーションプロトコル,評価コードをリリースする。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:35:02 GMT)
SPECTRE: Hybrid Ordinary-Parallel Speculative Serving for Resource-Efficient LLM Inference [11.4] LLMサービスプラットフォームはマルチモデルクラウドシステムとしてますます多くデプロイされ、ユーザの要求は長く抑えられている。
本稿では,高負荷大モデルサービスのためのリモートドラフトラとして,未使用のテールモデルサービスを再利用するフレームワークであるSPECTREを提案する。
SPECTREは、大容量のサービススループットを継続的に改善しつつ、テールモデルサービスのネイティブワークロードに小さな干渉しか生じないことを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:30:36 GMT)
MedHopQA: A Disease-Centered Multi-Hop Reasoning Benchmark and Evaluation Framework for LLM-Based Biomedical Question Answering [11.4] MedHopQAは、1000の専門家による質問応答ペアからなる、疾患中心のマルチホップ推論ベンチマークである。
各質問はウィキペディアの異なる2つの記事にまたがる情報の合成を必要とし、回答はオープンエンドのフリーテキスト形式で提供される。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:32:43 GMT)
No More, No Less: Task Alignment in Terminal Agents [11.3] ターミナルエージェントは、単一のユーザプロンプトから、複雑な長期タスクを自律的に実行する能力がますます高まっている。
既存のベンチマークでは、この機能は利用できない。
端末ベンチ2.1から派生した89の端末タスクスイートであるTAB(Task Alignment Benchmark)を紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:06:15 GMT)
Done, But Not Sure: Disentangling World Completion from Self-Termination in Embodied Agents [11.2] VIGILは、端末のコミットメントを独立して測定できる評価フレームワークである。
VIGILのデフォルトプロトコルでは、エージェントはエゴセントリックなRGBのみを観察し、アクション・サクセス・シグナルを受信せず、各エピソードは、隠された世界状態に対して決定論的にチェックされたセマンティック・レポートで終了しなければならない。
これにより、ワールドステートコンプリート(W)とベンチマーク成功(B)の2つのスコアが得られます。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:49:21 GMT)
Alternating Target-Path Planning for Scalable Multi-Agent Coordination [11.2] 並列ターゲット割り当てとパスフィンディング問題は、マルチエージェントパスフィンディングを拡張する。
本稿では,パスフィニングから目的の割り当てを分離する反復的精錬フレームワークを提案する。
これは現実のセットアップに適した実用的で大規模なTAPFに向けた確かなステップである。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:26:34 GMT)
A Composite Activation Function for Learning Stable Binary Representations [11.1] 本研究では,Haviside関数のスムーズな近似法を提案する。
我々は,HTAFを用いて勾配に基づく最適化により,スパイキングニューラルネットワーク,バイナリニューラルネットワーク,ディープヘビサイドニューラルネットワークを安定的に訓練可能であることを示す。
最後に,HTAFを利用して離散的特徴表現を誘導する解釈可能な画像モデルであるImplicit Concept Bottleneck Models (ICBMs)を紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:41:36 GMT)
Information-Theoretic Generalization Bounds for Sequential Decision Making [11.0] スーパーサンプル構造に基づく情報理論の一般化境界は、バッチ i.i.d.setting におけるアルゴリズム依存の一般化解析のための中心的なツールである。
既存のスーパーサンプル条件付き相互情報境界は、オンライン学習、ストリーミングアクティブ学習、盗賊といったシーケンシャルな意思決定問題に直接適用されない。
我々は,ゴースト・コーディネート比較に用いる証明側拡張から学習者のフィルタリングを分離するシーケンシャル・スーパーサンプル・フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:31:48 GMT)
VideoSEAL: Mitigating Evidence Misalignment in Agentic Long Video Understanding by Decoupling Answer Authority [11.0] 長いビデオの質問応答には、非常に冗長なコンテンツの中で、スパースでタイムインスペクションされた視覚的証拠を見つける必要がある。
既存のLVUエージェントが「エビデンスミスアライメント」を提示できることを示す。
本稿では,画素レベルの検証において,解答権限とゲートの最終的な解答とを分離した分離型プランナー・フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:37:49 GMT)
From Noise to Diversity: Random Embedding Injection in LLM Reasoning [11.0] ランダムソフト・プロンプト (RSP) について検討し, 学習段階を完全に落とし, ランダムな埋め込みベクトル列を入力に付加する。
RSPは、いくつかの設定で数学推論ベンチマークで最適化されたソフトプロンプトに匹敵する精度に達する。
推定 RSP が初期トークンの多様性を上昇させ、温度サンプリングと組み合わせることで、Pass@N を拡大することにより、N のうち少なくとも 1 つが正しいことを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:47:20 GMT)
PlantMarkerBench: A Multi-Species Benchmark for Evidence-Grounded Plant Marker Reasoning [10.9] PlantMarkerBenchは、フルテキストの生物学的論文から文献的な植物マーカーのエビデンスを解釈するベンチマークである。
4つの植物種にまたがり、5,550件の文章レベルのエビデンス・インスタンスが含まれており、マーカーのエビデンス、エビデンス・タイプ、サポートの強さを示す。
種々にわたる多様なオープンソースおよびクローズドソースの言語モデルをベンチマークし、戦略を推進します。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:36:26 GMT)
Events as Triggers for Behavioral Diversity in Multi-Agent Reinforcement Learning [10.9] これらの行動遷移を定義するために、欠落する要素はイベントである、と我々は主張する。
本稿では,エージェントを行動から分離するフレームワークを紹介し,エージェントがイベントに応答して動作をインスタンス化する連続多様体をキャプチャする。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:51:23 GMT)
NavOL: Navigation Policy with Online Imitation Learning [10.8] NavOLはオンラインの模倣学習パラダイムで、シミュレータと対話し、専門家によるデモをオンラインで行う。
NavOLはロールアウト更新ループでトレーニングする:ロールアウトの間、ポリシーはシミュレータで動作し、グローバル環境へのアクセスを特権とするグローバルプランナーに問い合わせる。
このオンライン模倣ループは、報酬設計の必要性を排除し、学習効率を向上し、ポリシー独自のロールアウトのトレーニングによる分散シフトを緩和する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:33:38 GMT)
Large Language Models for Causal Relations Extraction in Social Media: A Validation Framework for Disaster Intelligence [10.8] 大規模言語モデル(LLM)が災害関連ソーシャルメディア投稿から因果関係を効果的に抽出できるかどうかを検討する。
本研究は,災害対応システムにおける因果関係抽出にLLMを使用する可能性とリスクを両立させるものである。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:07:45 GMT)
Follow the Mean: Reference-Guided Flow Matching [10.7] フローマッチングは異なる制御インターフェース(例による適応)を持つことを示す。
決定論的補間子の場合、速度場は条件付き終端平均によってのみ支配される。
これは制御可能な生成の単純な原理である:従う参照集合を変更して事前訓練されたモデルを操る。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:36:29 GMT)
Evolutionary Task Discovery: Advancing Reasoning Frontiers via Skill Composition and Complexity Scaling [10.7] Evoutionary Task Discovery (EvoTD)は、アルゴリズムスキルと複雑度属性の2軸多様体上の有向探索としてデータを扱うフレームワークである。
多様性を高めるために新しいスキル構成を合成するクロスオーバー演算子と、構造制約をスケールするパラメトリック変異演算子を紹介する。
EvoTDは、モデルアーキテクチャ、事前学習体制、スケールを一貫して一般化する実質的な推論ゲインを提供します。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:26:40 GMT)
Variance-aware Reward Modeling with Anchor Guidance [10.6] 非識別性を解決するフレームワークとして,アンカー誘導型分散認識リワードモデリングを提案する。
シミュレーション研究と4つの実世界の発散予測データセットを通して,提案手法は報酬モデリング性能を継続的に改善する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:46:26 GMT)
Assessing and Mitigating Miscalibration in LLM-Based Social Science Measurement [10.6] 大規模言語モデル(LLM)は、スケーラブルな測定ツールとして社会科学でますます使われている。
本稿では, LLMを用いた社会科学測定におけるモデル誤校正について検討する。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:06:33 GMT)
Fused Gromov-Wasserstein Distance with Feature Selection [10.5] 融合Gromov-Wasserstein (FGW) 距離は、構造とノードの特徴を協調的に整列することによってオブジェクトを比較するための原則的なフレームワークを提供する。
我々はFGW目標に適応的な特徴抑圧重みを組み込んだ特徴選択を伴うFGW距離を導入する。
実験では、機能強化が解釈可能性を高め、タスク関連構造を明らかにし、特に計算再限定への応用を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:11:25 GMT)
M3Net: A Macro-to-Meso-to-Micro Clinical-inspired Hierarchical 3D Network for Pulmonary Nodule Classification [10.4] M3Netは、放射線医の階層的診断ワークフローにインスパイアされた、肺結節分類のための新しい3Dネットワークである。
本フレームワークは,粒度の細かい結節構造から局所的意味論,大域的空間関係に至るまで,段階的なマルチスケール入力を構築する。
精度は86.96%,84.24%であった。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:16:41 GMT)
Large-Small Model Collaboration for Farmland Semantic Change Detection [10.4] 耕作地保全に不可欠な農地セマンティックチェンジ検出
既存のベンチマークとモデルは、きめ細かい農地転換モニタリングには不十分である。
本研究では,タスク駆動型小型視覚モデルと凍結型大規模視覚言語モデルを統合した大規模協調型SCDフレームワークを提案する。
本手法は,HZNU-FCD 上の 97.63% F1,96.32% IoU,96.35% SCD_IoU_mean を6.65M のトレーニングパラメータで達成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:40:19 GMT)
Is Child-Directed Language Optimized for Word Learning? A Computational Study of Verb Meaning Acquisition [10.4] 子ども指向言語(CDL)が言語学習を支援するために最適化されているかを検討する。
CDLと音声ADLでトレーニングしたモデルでは,文字入力でトレーニングしたモデルよりも高いレジリエンスを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:26:50 GMT)
Characterizing the Failure Modes of LLMs in Resolving Real-World GitHub Issues [10.3] 大きな言語モデル(LLM)は、現実のGitHub問題を解決するために、ますます多くデプロイされている。
本稿では,SWE-bench検証データセット上で,Claude 4.5 Sonnet,Gemini 3 Pro,GPT-5の3つの最先端モデルを評価する。
全治験900回にわたる243回の失敗試験の根本原因と症状の厳密な手作業による分析を行った。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:34:57 GMT)
A Research Agenda on Agents and Software Engineering: Outcomes from the Rio A2SE Seminar [10.3] エージェントAIの台頭は、ソフトウェア工学を2つの方向から変えつつある。
両方向を包括するコヒーレントな研究課題を整理するため,リオデジャネイロでA2SEセミナーを開催した。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:06:29 GMT)
Manifold Sampling via Entropy Maximization [10.2] 本研究では,無数の非連結成分を持つ多様体上でのサンプリングのために,エントロピー最大化(MASEM)によるManifold Smplingを提案する。
MASEMは, 実験分布と最大エントロピー目標とのKL偏差を, 再サンプリングステップ数で指数関数的に減少させることを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:19:32 GMT)
IMPACT: An Implicit Active-Set Augmented Lagrangian for Fast Contact-Implicit Trajectory Optimization [10.2] 我々は,MPCCベースのCITOを定常性保証付きで解くための,CITOへの拡張ラグランジアンアプローチを開発した。
トラジェクトリ最適化ワークロードに適した効率的なC++実装を提供し、オープンソースCITOおよびCI-MPCベンチマークで評価する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:15:36 GMT)
Missingness-MDPs: Bridging the Theory of Missing Data and POMDPs [10.1] 我々は、部分的に観測可能なマルコフ決定プロセス(POMDP)の新たなサブクラスである欠失MDP(miss-MDPs)を導入する。
ミス-MDP(ミス-MDP)は、観察機能が欠落機能であるPOMDPであり、個々の状態特徴が欠落している確率を指定する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:28:34 GMT)
Discrete Flow Matching for Offline-to-Online Reinforcement Learning [10.1] DRIFTは、オフラインで事前訓練された連続時間マルコフ連鎖(CTMC)ポリシーを更新するオンラインの微調整手法である。
大規模離散的なアクション空間に対して、参照ポリシーロールアウトからサンプリングされたアクションの小さなサブセット上でアクターを更新する候補セット近似を導入する。
離散的動作RLタスクに対する実験により,本手法が全タスクに対して安定したオフライン-オンライン改善を実現することを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:44:02 GMT)
H3D-MarNet: Wavelet-Guided Dual-Path Learning for Metal Artifact Suppression and CT Modality Transformation for Radiotherapy Workflows [9.9] H3D-MarNetはアーティファクト対応のCTドメイン変換のための2段階のフレームワークである。
ウェーブレットベースの前処理モジュールは、金属誘起アーティファクトを抑制する。
第2段階では、Domain-TransNetはkVCT-to-MVCTドメイン変換を実行する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:21:42 GMT)
Post-ADC Inference: Valid Inference After Active Data Collection [9.9] 本研究では,データ収集後のデータ依存的な方法で推定対象を構築した際の,アクティブな収集データに対する統計的推測について検討する。
本稿では、アクティブデータ収集プロセスとその後のデータ駆動型ターゲット構築の両方から生じるバイアスを考慮に入れた、ADC後推論を提案する。
提案手法は選択的推論に基づいて,2つのバイアス源に対して有効な$p$値と信頼区間を提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:27:51 GMT)
KV-Fold: One-Step KV-Cache Recurrence for Long-Context Inference [9.8] KV-Foldは、キー値(KV)キャッシュを列チャンク上の左折り重なりのアキュムレータとして扱う、トレーニング不要な長文推論プロトコルである。
各ステップで、モデルは蓄積されたキャッシュに条件付けられた次のチャンクを処理し、新しく生成されたキーと値を付加し、拡張されたキャッシュを前方に渡す。
Llama-3.1-8Bでは、16Kから128Kのトークンのコンテキストにまたがる152のトライアルで100%の正確なマッチ検索を実現し、単一の40GB GPUのメモリ制限内に留まっている。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:53:47 GMT)
CoLVR: Enhancing Exploratory Latent Visual Reasoning via Contrastive Optimization [9.7] 遅延視覚推論(CoLVR)のためのコントラスト最適化法を提案する。
CoLVRは多様で探索的な表現を、角度に基づく摂動によって導かれる、相対的に対照的な目的によって学習する。
実験により、CoLVRは潜伏表現の探索能力を大幅に向上させることが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:46:05 GMT)
Nice Fold or Hero Call: Learning Budget-Efficient Thinking for Adaptive Reasoning [9.7] 大規模な推論モデル(LRM)は、拡張推論によって問題解決を改善するが、しばしばテスト時間計算を誤って配置する。
我々は,投資コストに配慮した報酬の下で,GRPOと行動開始を組み合わせた2段階の枠組みであるBudget-Efficient Thinking (BET)を提案する。
BETは、全体的なパフォーマンス改善を達成しながら、推論トークンを平均で55%削減する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:51:31 GMT)
TOC-Bench: A Temporal Object Consistency Benchmark for Video Large Language Models [9.6] ビデオ大言語モデル(ビデオ-LLM)は、一般的なビデオ理解において大きな進歩を遂げているが、時間的オブジェクトの一貫性を維持する能力はいまだ探索されていない。
ビデオLLMにおける時間的オブジェクトの一貫性を評価するための診断ベンチマークであるTOC-Benchを紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:09:23 GMT)
DistractMIA: Black-Box Membership Inference on Vision-Language Models via Semantic Distraction [9.6] 視覚言語モデル(VLM)は、プライベート、著作権、その他の機密データを含む大規模な画像テキストコーパスで訓練される。
本研究では,意味的注意散らしに基づく出力専用ブラックボックスフレームワークDistractMIAを提案する。
DistractMIAは元のイメージを保存し、既知のセマンティックイントラクタを挿入し、生成したレスポンスがどのように変化するかを測定する。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:04:11 GMT)
RW-Post: Auditable Evidence-Grounded Multimodal Fact-Checking in the Wild [9.6] RW-Postは、実世界のマルチモーダルなファクトチェックのための、ポストアラインなtextbftext-imageベンチマークである。
RW-Postは、クローズドブック、エビデンスバウンド、オープンウェブレジーム間の制御評価をサポートする。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:18:40 GMT)
A Unified Perspective for Learning Graph Representations Across Multi-Level Abstractions [9.5] Graph Self-Supervised Learning (GSSL)は、グラフ構造化データの高品質な表現を生成するための強力なパラダイムとして登場した。
本稿では,ノードレベル,近接レベル,クラスタレベル,グラフレベルを対象とする統合コントラストフレームワークを提案する。
本研究では,各パラメータの類似点と相似点に適応的に重みを割り当てる,パラメータフリーできめ細かい自己重み付け機構を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:33:39 GMT)
A Resampling-Based Framework for Network Structure Learning in High-Dimensional Data [9.5] RSNetは、堅牢で解釈可能なネットワーク推論のためのオープンソースのフレームワークである。
これは高次元データに共通する限定サンプルサイズの課題に対処する。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:08:46 GMT)
BoostAPR: Boosting Automated Program Repair via Execution-Grounded Reinforcement Learning with Dual Reward Models [9.5] プログラム修復のための強化学習は、スパース実行フィードバックと、どの編集がバグを実際に修正するかが不明なシーケンスレベルの報酬によって妨げられる。
これらの課題に対処する3段階のフレームワークであるBoostAPRを紹介します。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:29:50 GMT)
PRISM: Pareto-Efficient Retrieval over Intent-Aware Structured Memory for Long-Horizon Agents [9.5] ロングホライゾン言語エージェントは、どの固定されたコンテキストウィンドウよりもはるかに早く会話履歴を蓄積する。
PRISMは、長期記憶を共同検索・圧縮問題として扱う訓練不要な検索サイドフレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:28:30 GMT)
Leveraging Multimodal Large Language Models for All-in-One Image Restoration via a Mixture of Frequency Experts [9.4] オールインワン画像復元は、多様な未知の劣化によって影響を受ける入力からクリーン画像の復元を目指している。
近年の手法は, 修復過程を導くために, 劣化特性を同定することによって, 高い性能を示した。
マルチモーダル埋め込みをガイダンスとして利用するマルチモーダル大言語モデル(MLLM)誘導画像復元フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:55:05 GMT)
Stable and Near-Reversible Diffusion ODE Solvers for Image Editing [9.4] 可逆ODEソルバは、テキスト誘導画像編集のための拡散反転に対する魅力的なアプローチを提供する。
正確な可逆性と数値安定性のトレードオフは,背景保存と即時アライメントのトレードオフとして実証的に現れることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:34:14 GMT)
COSMIC: Concurrent Optimization of Structure, Material, and Integrated Control for robotic systems [9.3] ほとんどのロボットシステムは構造、材料、移動を別々に設計している。
この分離は、しばしば準最適設計につながるが、これらの実体の個人的および集団的貢献は今も残っている。
本稿では,物質設計,移動,その他の複雑な自律行動を同時に最適化する,ランドスケープに基づく協調設計フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:00:01 GMT)
Correcting Influence: Unboxing LLM Outputs with Orthogonal Latent Spaces [9.2] 本稿では,トークンレベルの影響を,一般的な予測タスクに対する潜時媒介アプローチを通じて推測するフレキシブルなフレームワークを提案する。
トークンをまたいで加法的に分解する従来の方法とは異なり、遅延特徴よりも計算された影響は本質的に分解不可能である。
我々のフレームワークは信頼を高め、モデル監査を可能にし、透明性と説明責任のある決定を必要とする高評価領域に一般化する。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:01:29 GMT)
Adiabatic Quantum Simulation of the Topological Su--Schrieffer--Heeger--Hubbard Model [9.2] ゲート型量子コンピュータ上での一次元フェルミオンSu-Schrieffer--Heeger-Hubbardモデルのトポロジ的シグネチャを探索するための断熱量子シミュレーションフレームワークを開発した。
真の多体フレームワークの中で、SSHモデルのトポロジ的特性が、弱いHubbardインタラクションに対して堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:10:58 GMT)
CRAFT: Clinical Reward-Aligned Finetuning for Medical Image Synthesis [9.1] 臨床アライメントのための基礎モデルに基づくプロキシである臨床アライメントスコア(CAS)を紹介した。
報酬に基づく適応フレームワークであるCRAFTを提案する。
CRAFTは、強力な適応ベースラインよりもCASと下流分類性能を向上する。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:56:34 GMT)
Behavioral Integrity Verification for AI Agent Skills [9.1] 我々はこれを行動整合性検証(BIV)問題として定式化する。
OpenClawレジストリの49,943のスキルでは、逸脱分類が広範な記述と実装のギャップを明らかにしている。
906スキルの悪質なスキル検出ベンチマークでは、BIVは0.946のF1に達し、最先端のルールベースとシングルパスのLCMベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:41:09 GMT)
Estimating Subgraph Importance with Structural Prior Domain Knowledge [9.1] 埋め込み空間における線形グループラッソ回帰問題として定式化されたグラフレベルのタスクに対する事前学習グラフニューラルネットワーク(GNN)のサブグラフ重要度推定法を提案する。
本手法は,GNNアーキテクチャで使用される出力層や読み出し関数の特定の形式に依存しないまま,グラフサブストラクチャの事前のドメイン知識を効果的に活用する。
実世界のグラフデータセットを用いた実験により,本手法はサブグラフの重要度推定において,既存のベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:00:16 GMT)
A proximal gradient algorithm for composite log-concave sampling [9.1] 我々は、$mathbbRd$、すなわち$propto e-f-g$という形の密度の合成対数分布からサンプリングするアルゴリズムを提案する。
さらに、(1)$が非log-concaveであるが、 Poincaré あるいは log-Sobolev の不等式を満たす場合、(2)$f$ が非smooth であるが Lipschitz である場合にも結果を拡張します。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:48:09 GMT)
Ensuring Logic in the Fog: Sound POMDP Synthesis with LTL Objectives [9.1] LTL(Linear Temporal Logic)は、そのようなタスクを指定するための厳密な言語である。
本稿では,このギャップを新しい音響報酬形成機構で埋める。
このメカニズムを強化されたモンテカルロ計画フレームワークに統合することにより、エージェントに部分観測可能性の霧をナビゲートする権限を与える。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:46:35 GMT)
TMRL: Diffusion Timestep-Modulated Pretraining Enables Exploration for Efficient Policy Finetuning [9.0] 強化学習(RL)を用いた微調整型事前学習ロボット政策は、行動クローニング(BC)による事前学習によって引き起こされるボトルネックを継承することが多い。
本稿では,効率的なロボットポリシーの微調整を実現するために必要な探索を可能にする統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:07:04 GMT)
AOI-SSL: Self-Supervised Framework for Efficient Segmentation of Wire-bonded Semiconductors In Optical Inspection [9.0] AOI-SSLは、ワイヤボンド半導体のセマンティックセグメンテーションのための訓練効率の高いフレームワークである。
我々は、小さな産業検査データセットでSOTA自己監督アルゴリズムを事前訓練する。
この設定では、単純な類似性に基づく検索が、より複雑な注意に基づく集約と同等に実行されることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:27:25 GMT)
Graph-Based Financial Fraud Detection with Calibrated Risk Scoring and Structural Regularization [8.9] 本稿では,金融取引不正防止のためのグラフニューラルネットワーク表現学習とリスク識別フレームワークを提案する。
トランザクションレコードとID情報をノード属性に統合し、共有属性と相互作用一貫性に基づいたトランザクショングラフを構築する。
実験は、公開されている金融トランザクションデータセット上で実施される。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:52:24 GMT)
Limits of Learning Linear Dynamics from Experiments [8.9] 本研究では,実験装置が観測軌道から回復可能な情報の基本的限界を定めていることを示す。
完全系が特定できない場合でも、実験によって到達可能な部分空間上の制限された力学が一意に決定されることが証明される。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:00:37 GMT)
scShapeBench: Discovering geometry from high dimensional scRNAseq data [8.8] 単セルデータセットにおける形状検出のためのベンチマークデータセットである scShapeBench を紹介する。
合成データセットは、制御された分散を伴う地層構造スケルトングラフからサンプリングされる。
実際のシングルセルデータセットは、さまざまなソースからキュレーションされ、専門家によって注釈付けされる。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:10:38 GMT)
Constraint-Aware Diffusion Priors for High-Fidelity and Versatile Quadruped Locomotion [8.8] 本稿では, Diff-CAST (Diffusion-guided Constraint-Aware Symmetric Tracking) を提案する。
従来のGAN識別器を置き換え、異種コレクションのロバストなデータスケーリングをアンロックする。
四足歩行の実験では、Diff-CASTはモード崩壊を緩和し、多様なスキル間のシームレスな移行を可能にし、堅牢でハードウェア準拠の移動を保証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:46:32 GMT)
Shaping Zero-Shot Coordination via State Blocking [8.7] ゼロショットコーディネート(ZSC)は、エージェントが事前の対話なしに独立して訓練されたパートナーと協力できるようにすることを目的としている。
SBC(State-Blocked Coordination)は、環境を直接変更することなく多様な相互作用シナリオを誘導することにより、ZSCを改善するフレームワークである。
SBCは、人間パートナーへの強力な一般化を含むゼロショットコーディネートにおいて優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:46:03 GMT)
Stop Marginalizing My Dreams: Model Inversion via Laplace Kernel for Continual Learning [8.7] データのない連続学習は、擬似サンプルを合成し、破滅的な忘れを忘れるモデル逆転に依存している。
既存の反転法は単純化された仮定によって制限される。
本稿では,DFCILの有効成分として,機能依存のモデル化が重要であることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:59:27 GMT)
An Elastic Shape Variational Autoencoder for Skeleton Pose Trajectories [8.7] 弾性形状 - 変分オートエンコーダ (ES-VAE) は骨格軌道の幾何学的生成モデルである。
2つのデータセットに対するES-VAEの有効性を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:36:08 GMT)
EDGER: EDge-Guided with HEatmap Refinement for Generalizable Image Forgery Localization [8.6] 本稿では、任意の解像度画像中の操作領域をローカライズするパッチベースのデュアルブランチフレームワークであるEDGERを提案する。
我々は,周波数に基づくエッジキューとパッチレベルの合成先行の相補的役割を,高精度で解像度に依存しないローカライゼーションの駆動において強調する。
提案手法はマルチメガピクセル画像にスケールし,強力なクロスドメイン一般化を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:50:41 GMT)
Layer-wise Representation Dynamics: An Empirical Investigation Across Embedders and Base LLMs [8.4] 本稿では,レイヤワイドな3つの測定ファミリを持つフレームワークであるLayer-wise Representation Dynamics (LRD)を提案する。
LRDを31モデルに適用すると、最終層表現だけでは明らかでないアーキテクチャとタスクレベルの違いが明らかになる。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:22:45 GMT)
Mitigating Action-Relation Hallucinations in LVLMs via Relation-aware Visual Enhancement [8.4] LVLM(Large Vision-Language Models)は、様々な視覚言語タスクにおいて顕著なパフォーマンスを実現している。
LVLMはまだ幻覚に悩まされており、視覚入力と矛盾するテキストを生成する。
本稿では,行動関連画像領域を特定し,LVLMの注目度を高めるための枠組みを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:03:19 GMT)
Rethinking Supervision Granularity: Segment-Level Learning for LLM-Based Theorem Proving [8.4] リーン4における大きな言語モデルで証明された自動定理は、一般的に、木探索によるステップレベルの戦術予測と、全体的な防御生成を通じてアプローチされる。
これら2つのパラダイムは、教師付きトレーニングデータを構築するための反対の粒度を表す。
本稿では,訓練方針モデルのための局所的コヒーレントな証明セグメントを抽出する訓練データ構築戦略であるセグメントレベルの監視を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:18:28 GMT)
Plan Before You Trade: Inference-Time Optimization for RL Trading Agents [8.4] ポートフォリオ管理のための強化学習エージェントは通常、静的ポリシーとしてトレーニングされ、デプロイされる。
モデル予測制御(MPC)にインスパイアされたプラグイン推論時間最適化フレームワークを提案する。
我々のフレームワークは、事前訓練されたエージェントと互換性があり、リトレーニングすることなく、予測者の予測にポリシーを適用する。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:58:03 GMT)
Overview of the MedHopQA track at BioCreative IX: track description, participation and evaluation of systems for multi-hop medical question answering [8.3] BioCreative IX MedHopQA共有タスクは、大規模言語モデル(LLM)のマルチホップ推論でベンチマークするために設計された。
我々は、疾患、遺伝子、化学物質にまたがる1000のQAペアからなる新しいデータセットを開発した。
それぞれの質問は、ウィキペディアの2つのページからの情報を統合することによって、2つのホップ推論を必要とするように構築された。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:59:28 GMT)
Contrastive Learning under Noisy Temporal Self-Supervision for Colonoscopy Videos [8.2] ポリープ・トラックレットの堅牢な表現を学習することは、AIによる大腸内視鏡の応用を可能にする鍵となる。
本研究では,大腸内視鏡手術の逐次的ワークフローを利用して,時間的構造から自己監督的関連を導出する。
本稿では,ポリプ検索と再同定,サイズ推定,組織分類など,複数の下流タスクにおける学習表現の有効性を実証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:04:42 GMT)
ORBIT: Preserving Foundational Language Capabilities in GenRetrieval via Origin-Regulated Merging [8.2] この研究は、ジェネレーティブ検索(GenRetrieval)タスクのコンテキストにおいて、この課題を調査し、対処する。
モデル重みの微調整と初期モデル重み間の距離を積極的に追跡する新しい手法であるORBITを提案する。
この結果から,ORBITは継続学習ベースラインと関連する正規化手法の両方に優れた性能を保ちながら,テキストと検索性能を保っていることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:14:04 GMT)
RoboBlockly Studio: Conversational Block Programming with Embodied Robot Feedback for Computational Thinking [8.2] 我々は,ブロックベースのプログラミング,会話型AI教育エージェント,ロボット実行の具体化を組み合わせた対話型システムであるRoboBlockly Studioの設計と評価を行う。
コンピュータ教育を支援するためにAIとロボティクスを統合したインタラクティブで具体化された学習環境を構築するための設計上の洞察と意味について論じる。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:46:03 GMT)
The critical slowing down in diffusion models [8.2] パラメータ学習において,正確な解と一致する1層ネットワークアーキテクチャを用いてスコアモデルをトレーニングすると,パラメータ学習における臨界速度低下の一形態が示される。
この速度低下は生成過程にも影響し、学習された生成モデルでさえ、臨界点近くをサンプリングすることのよく知られた困難さが持続することを示している。
2層アーキテクチャを使用することで、システムサイズを2次的にではなく、対数的にスケールするトレーニング時間によって、致命的な遅延を劇的に削減できることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:00:02 GMT)
Generative Motion In-betweening by Diffusion over Continuous Implicit Representations [8.2] 動作暗黙的ニューラル表現(INR)に基づく潜在拡散モデル(LDM)のための新しいパイプラインとサンプリング最適化手法を提案する。
このモデルでは, 極端にスパースで曖昧なデータからINRパラメータをサンプリングし, 多様体から可塑性かつ滑らかな運動を再構成することができる。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:48:14 GMT)
Autoregressive Learning in Joint KL: Sharp Oracle Bounds and Lower Bounds [8.2] 本研究では, 自己回帰モデルにおける長周期学習の基本的かつタイムリーな問題と, モデル不特定の下での次トーケン予測について検討する。
我々のゴールは、シーケンス水平線(H)が、この共同分布、シーケンスレベル状態における近似と推定誤差の両方にどのように影響するかを特徴づけることである。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:01:29 GMT)
Offline Policy Evaluation for Manipulation Policies via Discounted Liveness Formulation [8.1] 政策評価は、ロボット政策のための開発およびデプロイメントパイプラインの基本的な構成要素である。
現代の操作システムでは、報酬がスパースであることが多いため、この問題は特に困難である。
本稿では,ライブネスに基づくBellman演算子に基づくスパース報酬からオフラインポリシー評価を行うフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:54:30 GMT)
Multi-Pedestrian Safety Warning at Urban Intersections Use Case of Digital Twin [8.1] 都市交通システムのためのデジタル双生児(DT)は注目されているが、安全クリティカルシナリオの体系的評価は依然として限られている。
本稿では,密結合型物理デジタル・ツイン・フレームワークによって実現された都市交差点における歩行者用安全警報システムについて述べる。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:28:49 GMT)
MACAA: Belief-Revision Multi-Agent Reasoning for Open-World Code Authorship Verification [8.1] 既存の教師付きCAAアプローチは、不足したトレーニングデータとクローズドワールドの仮定に悩まされている。
学習不要なコードオーサシップ検証のための,信念修正に基づくマルチエージェントフレームワークであるMACAAを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:36:25 GMT)
Clin-JEPA: A Multi-Phase Co-Training Framework for Joint-Embedding Predictive Pretraining on EHR Patient Trajectories [8.0] Clin-JEPAは、HR患者軌道上での予測(JEPA)事前トレーニングのための多相コトレーニングフレームワークである。
MIMIC-IV ICUデータでは、3つの独立した評価がフレームワークをサポートしている。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:38:53 GMT)
Multi-Task Representation Learning for Conservative Linear Bandits [8.0] 我々は、R が d と T の最小値よりもはるかに小さい次元 r の共通の低次元表現を共有する d 次元空間における T 線型バンドイットタスクを考える。
タスクは、特定の安全またはパフォーマンス要件を満たすアクションのみを許容するように制限され、保守的な(安全な)盗賊と呼ばれる。
制約を満たすとともに低ランクな特徴行列を復元する新しいアルゴリズムである Safe-Alternating Projected Gradient Descent and Minimization (Safe-AltGDmin) を導入する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:22:03 GMT)
DexTwist: Dexterous Hand Retargeting for Twist Motion via Mixed Reality-based Teleoperation [7.8] MR(Mixed Reality)ベースのインターフェースによるデクサラス遠隔操作は、人間の操作スキルをロボットの手に移すためのスケーラブルなパラダイムを提供する。
MRを用いたデキスタラス遠隔操作のための機能的ツイストリターゲティングフレームワークであるDexTwistを提案する。
DexTwistはベクトルベースベースラインに比べて回転角追跡とねじ軸安定性が向上することを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:25:00 GMT)
DriftXpress: Faster Drifting Models via Projected RKHS Fields [7.8] DriftXpressは、RKHS場に基づくドリフトモデルの加速定式化である。
原ドリフトフィールドのアトラクション・反発構造を保ちながら, フィールド評価のコストを低減させる。
画像生成ベンチマーク全体では、DriftXpressは標準的なドリフトに匹敵するFIDを実現し、ウォールクロックのトレーニングコストを削減している。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:26:31 GMT)
Enhancing Target-Guided Proactive Dialogue Systems via Conversational Scenario Modeling and Intent-Keyword Bridging [7.7] 目標誘導型プロアクティブ対話システムは、指定されたキーワードや特定のトピックなど、予め定義された目標に向けて会話を積極的に操ることを目的としている。
既存の作業は、この側面を概ね見落としているため、現実の会話のダイナミクスとミスマッチする。
本稿では,ユーザプロファイルとドメイン知識を会話シナリオとしてモデル化し,動的にシステム発話に影響を与えるシナリオバイアスを導入する。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:18:45 GMT)
CAWI: Copula-Aligned Weight Initialization for Randomized Neural Networks [7.7] データ適合したコプラから入力から隠れた重みを引き出すフレームワークであるCAWI(Copula-Aligned Weight Initialization)を提案する。
83種類の分類ベンチマークと2つのバイオメディカルデータセットでCAWIを評価した。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:46:23 GMT)
Revisiting Privacy Preservation in Brain-Computer Interfaces: Conceptual Boundaries, Risk Pathways, and a Protection-Strength Grading Framework [7.7] 脳-コンピュータインターフェース(BCI)は、臨床研究から臨床、エッジ、実世界の設定へと急速に移行している。
このレビューでは、プライバシ保護の境界、保護オブジェクト、およびユーザデータのプライバシとモデルプライバシの関係が明確化されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:17:45 GMT)
Not How Many, But Which: Parameter Placement in Low-Rank Adaptation [7.7] LoRAアダプタのB行列内のトレーニング可能なエントリ(Aフリーズ)の固定予算が$k$であるなら、どの$k$が重要だろうか?
教師付き微調整、ランダム、インシデントされたサブセットは、同等のパフォーマンスを達成する。
GRPOのベースモデルでは、ランダム配置はベースモデルよりも改善されず、勾配インフォームド配置は標準のLoRA精度を回復する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:46:00 GMT)
Matching Meaning at Scale: Evaluating Semantic Search for 18th-Century Intellectual History through the Case of Locke [7.7] 本稿では,ジョン・ロックの基礎研究の受容を通じて,18世紀の知的歴史における意味探索を評価する。
セマンティックな分類法を基礎とした専門家アノテーションを用いて,意味レベルの対応を提示できるかどうかを検証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:29:41 GMT)
Emergent Communication between Heterogeneous Visual Agents through Decentralized Learning [7.7] 分散学習による異種視覚エージェント間の創発的コミュニケーションについて検討する。
この設定は、創発的コミュニケーションの未発見の側面に焦点を当てている。
MHCG(Metropolis-Hastings Captioning Game)におけるこの設定のインスタンス化
論文参考訳(メタデータ) (Tue, 12 May 2026 07:51:56 GMT)
Very Efficient Listwise Multimodal Reranking for Long Documents [7.6] リストワイズマルチモーダルリランカであるZipRerankを提案する。
軽量なクエリイメージの早期インタラクション機構を通じて、入力長を削減する。
MMDocIRベンチマークの実験では、ZipRerankは最先端のマルチモーダルリランカにマッチするか、超えている。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:45:59 GMT)
Machine Learning for neutron source distributions [7.6] 機械学習の最近の進歩を踏まえ,中性子源分布推定の新しい手法を提案する。
この推定は、機械学習モデルのトレーニング段階でのみ必要とされるモンテカルロ粒子リストに基づいている。
可変オートエンコーダ,正規化フロー,生成対向ネットワーク,およびデノナイズ拡散モデルなど,様々な生成モデルの性能を評価した。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:13:38 GMT)
3D Gaussian Splatting for Efficient Retrospective Dynamic Scene Novel View Synthesis with a Standardized Benchmark [7.6] ダイナミックシーンの振り返り新しいビュー合成(NVS)はスポーツなどの応用に不可欠である。
本稿では,スポーツに典型的な同期型マルチビュー(MV)設定において,各時間ステップの動的シーンが幾何的に制約されていることを論じる。
同期MV設定下において、3DGS を用いて効率的な振り返り動的シーン NVS を実現することができることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:33:14 GMT)
More Than Meets the Eye: A Semantics-Aware Traffic Augmentation Framework for Generalizable Website Fingerprinting [7.4] SATAはセマンティックス対応のトラフィック拡張フレームワークである。
トレーニングセットにはないが、テストセットに実際に存在するトラフィックパターンを生成する。
多様な複雑なシナリオにわたって、メインストリームモデルのパフォーマンスを大幅に改善します。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:48:05 GMT)
When Agents Overtrust Environmental Evidence: An Extensible Agentic Framework for Benchmarking Evidence-Grounding Defects in LLM Agents [7.4] 大規模言語モデルエージェントは、ファイル、Webページ、API、ログを公開する環境対応の足場を通じて、ますます運用されるようになる。
環境基盤化は、文脈入力、証拠証明、鮮度検査、検証ポリシー、行動ゲーティング、モデル推論を含むシステムレベルの問題である。
この障害モードをベンチマークするためのエージェントフレームワークであるEnvTrustBenchを紹介します。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:22:21 GMT)
CAX-Agent: A Lightweight Agent Harness for Reliable APDL Automation [7.4] 本稿ではMAPDL自動化のための軽量エージェントハーネスであるCAX-Agentのアーキテクチャについて述べる。
我々は50の標準構造ベンチマークで3つのリカバリ戦略(no_recovery, rule_only, model_only)を評価した。
Model_onlyは、最大完了率(0.9267)、タスクスコア(3.59/4)、総得点(9.16/10)、ゼロ介入率(0.84)、0.7733, 3.17/4, 7.03/10, 0.00)、no_recovery(0.6933, 2.74/4, 5.60/10, 0.00)を大きな効果サイズで達成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:46:34 GMT)
The Deepfakes We Missed: We Built Detectors for a Threat That Didn't Arrive [7.3] 本稿は、フィールドが用意した脅威が到着せず、到達した脅威が著しく異なることを論じる。
2022-2026年のディープフェイク事件の報告によると、支配的な害は、ピアジェネレーションのNon-Consensual Intimate Imagery(NCII)、家族やファイナンスワーカーをターゲットにした音声クローン詐欺、感情操作詐欺である。
ML研究コミュニティは、実際に成長している有害カテゴリーに対して、研究アジェンダを実質的に再バランスさせるべきだ、と我々は主張する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:02:13 GMT)
Behavioral Mode Discovery for Fine-tuning Multimodal Generative Policies [7.3] 強化学習(RL)を用いた微調整事前学習政策の課題に対処する。
生成ポリシーの既存のRL微調整法は、様々な振る舞いを1つの報酬最大化モードに分解する。
生成ポリシー内での潜在行動モードを明らかにするための教師なしモード発見フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:19:09 GMT)
MuonQ: Enhancing Low-Bit Muon Quantization via Directional Fidelity Optimization [7.2] 指向性最適化の原理に基づく低ビットMuonトレーニングフレームワークを提案する。
4ビット精度のMuonQは、トレーニング損失と下流タスク精度の両方において、フル精度のMuonと密接に一致している。
私たちのコードはhttps://github.com/YupSueng/MuonQ.comで公開されています。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:31:32 GMT)
CAAFC: Chronological Actionable Automated Fact-Checker for misinformation / non-factual hallucination detection and correction [7.2] 本稿では,既存のAFCシステムのギャップを埋めるためのフレームワークであるCAAFC(Chronological Actionable Automated Fact-Checker)を紹介する。
クレーム、会話、対話を操作し、事実の誤りや幻覚を検出する。
また、プライマリ・インフォメーション・ソースがサポートする実用的な正当化を提供することで修正することもできる。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:32:15 GMT)
Augmented Lagrangian Method for Last-Iterate Convergence for Constrained MDPs [7.2] 無限水平・割引制約付きマルコフ決定過程(CMDP)の政策最適化について検討する。
制約付き最適化から古典的不正確な拡張ラグランジアン(textttAL$)法を用い,CMDPの最終的な収束性を示す汎用フレームワークを提案する。
ログ線形ポリシーを扱うためにこれらの結果を一般化し、より効率的な$textttPQA$の投影版が最終項目収束を実現することを実証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:51:18 GMT)
Kairos: A Scalable Serving System for Physical AI [7.2] 物理AIタスクは、デジタルAIと著しく異なる推論特性によって特徴づけられる。
これにより、既存のデジタルAIサービスシステムは、物理的なAIには適さない。
生成実行ループを第1級市民とする,最初のマルチロボットサービスシステムであるKairosを設計する。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:13:30 GMT)
Fast MoE Inference via Predictive Prefetching and Expert Replication [7.2] MoE推論は、最適化されたGPU利用、ロード不均衡、複数のトークンから発生したレイテンシの上昇に悩まされる。
我々は、どの専門家がオーバーロードされるかを予測する動的専門家レプリケーション戦略を提案し、今後のトークンバッチのためにそれらを複製する。
複製された専門家は、並列処理の改善、GPUアイドル時間の短縮、推論の大幅な高速化につながる、レイヤ間でバッチトークンを同時に処理する。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:03:53 GMT)
Reconstruction of Personally Identifiable Information from Supervised Finetuned Models [7.1] Supervised Finetuning (SFT) は、大規模言語モデルに適応するための主要な手法の1つとなっている。
本稿では,SFTモデルからのPII再構成の問題点を初めて考察する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:29:33 GMT)
Safety-Oriented Evaluation of Language Understanding Systems for Air Traffic Control [7.1] 本稿では, 航空交通制御(ATC)の運用に適した, 安全性を重視した結果認識評価フレームワークを提案する。
以上の結果から,現在のLCMは合理的な集約精度を達成できるが,運用信頼性は著しく制限されていることが明らかとなった。
これらの知見は、AI支援ATCシステムの責任ある展開において、結果認識評価プロトコルの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:39:54 GMT)
Emergence of Frontier Superposition: Möbius attractor and Cascade Supervision [7.1] 重ね合わせにより、トランスフォーマーは深く推論できる。
Zhu et al. (2025) はグラフ到達性のための1つの残留ストリームにおいて、等重量のブロードスファーストフロンティアを手作りした。
我々は、アーキテクチャおよび監督的な貢献を分離することによって、アーズ・レニイグラフ上の到達可能性と重ね合わせのギャップを埋める。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:35:46 GMT)
Engineering Robustness into Personal Agents with the AI Workflow Store [7.0] 我々は、AIエージェントの主流のパラダイムは「オンザフライ」ループであり、エージェントはプランを合成し、ユーザプロンプトに応じて数秒から数分以内にアクションを実行する。
迅速なリアルタイム合成に焦点を合わせることで、AIエージェントは、ユーザーが無意識にそれらを適用できるような高度なシナリオに適合するシステムではなく、ユーザーが即興のプロトタイプを効果的に提供できるのだろうか?
本稿では,厳密なSEプロセスをエージェントループに統合して生産段階,硬化,決定論的に制約されたエージェント*ワークフローを生成する必要性を論じる。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:17:19 GMT)
BoolXLLM: LLM-Assisted Explainability for Boolean Models [7.0] 解釈可能な機械学習は、意思決定プロセスが人間が容易に理解できる透明なモデルを提供することを目的としている。
i)意味的に意味のある特徴を選択し、(ii)形式論理規則をアクセス可能な説明に翻訳する。
ブールルール学習のエンドツーエンドパイプラインに大規模言語モデルを統合するハイブリッドフレームワークとして,BoolXLLMを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:58:20 GMT)
ISOMORPH: A Supply Chain Digital Twin for Simulation, Dataset Generation, and Forecasting Benchmarks [6.8] マルチエケロンロジスティクスネットワークの最初のパブリックデジタルツインであるISOMORPHを紹介する。
シミュレータは、離散時間で有向ルーティンググラフを前進させる。
マルコフ連鎖に符号化された3つの保護法が検証ツールとして機能する。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:31:32 GMT)
Uncovering Symmetry Transfer in Large Language Models via Layer-Peeled Optimization [6.8] 大規模言語モデル(LLM)は、次のシフト予測のためのクロスエントロピー損失を最小限に抑え、凸凸である。
対象トークンが循環対称性を示すとき、最適ロジット行列は正確に循環し、グラマンケンも循環出力を形成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:10:34 GMT)
Probing Non-Equilibrium Grain Boundary Dynamics with XPCS and Domain-Adaptive Machine Learning [6.8] グラインドバウンダリ(GB)ダイナミクスはナノ結晶材料の安定性、機械的および機能的応答を制御する。
連続体シミュレーションから実験用XPCSマップへ物理パラメータラベルを転送する半教師付き学習フレームワークを開発した。
このAI強化アプローチは、バルク拡散率、GB硬度、有効GB濃度などの重要な運動パラメータの抽出を可能にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:37:17 GMT)
Worst-Case Regret Bounds for Combinatorial Thompson Sampling in Sleeping Semi-Bandits [6.7] 睡眠時腕を有する半バンド患者に対するCTS(Thompson sample)の最悪の再検討を行った。
CL-SGは単純なCTS-G変種であり、各ラウンドで1つの共有ガウス種をサンプリングし、腕間の探索を協調する。
CL-SG は $tildeO(sqrtmNT)$ の改善された後悔境界と一致する低い境界 $(sqrtmNT)$ を達成することを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:42:13 GMT)
Modeling Heterophily in Multiplex Graphs: An Adaptive Approach for Node Classification [6.7] 既存のグラフモデルはしばしばホモフィリーを仮定し、連結ノードは同じクラスに属したり、類似の属性を共有する傾向がある。
本稿では,同好および異好の両次元に対応する多重グラフにおけるノード分類の新しい手法である Methodname を提案する。
メソッド名は、多重グラフにおけるホモ親和性とヘテロ親和性相互作用の複雑な相互作用をキャプチャし、最先端の手法と比較してノード分類性能が向上する傾向にある。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:52:27 GMT)
Deep Minds and Shallow Probes [6.7] 表現にすでに存在する構造を明らかにすることを意図したプローブファミリーは、関連する表現対称性の下で安定であるべきである。
クロスモデルプローブ転送の自然な対象は、全隠れ状態ではなく、プローブファミリーに見えない表現のモジュラー方向が共有プローブ可視の商であることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:59:44 GMT)
JACoP: Joint Alignment for Compliant Multi-Agent Prediction [6.6] 生成モデルを用いたHTP(Human Trajectory Prediction)が重要な研究領域として浮上している。
JACoP:Joint Alignment for Compliant Multi-Agent Predictionは、シーンレベルの妥当性を保証する革新的なマルチステージフレームワークである。
我々は,JACoPが競争の正確性を達成するだけでなく,環境違反と社会衝突の両面での新たな基準を定めていることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:15:22 GMT)
From Token to Token Pair: Efficient Prompt Compression for Large Language Models in Clinical Prediction [6.6] 大型言語モデル(LLM)は、死亡予測や表現型化といった臨床予測タスクに可能性を示している。
長いトークンシーケンスは高い計算コストとパフォーマンスの低下をもたらす。
既存のソリューションは圧縮用のモジュールを追加するか、重要でないトークンを削除する。
医用トケンペアを提案する。
aware (MedTPE) - EHRシーケンスの標準的なトークン化を拡張するレイヤメソッド。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:46:40 GMT)
Classification of informative subsets in quantum encrypted cloning on qudits [6.6] 我々は,qudit暗号化プロトコルにおいて,ストレージレジスタの情報サブセットを体系的に分類する。
情報漏洩の有無は一致系の解集合によって決定されることを示す。
この結果は、量子ビットで知られているパリティに基づく分類を任意の有限次元に拡張する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:04:10 GMT)
Structured Diffusion Bridges: Inductive Bias for Denoising Diffusion Bridges [6.6] 本稿では,許容解の空間を特徴付け,アライメント制約によって制限する拡散ブリッジフレームワークを提案する。
提案手法は,無ペア,半ペア,ペアのレギュレーションを対象とする,合成および実モダリティ変換ベンチマークにおいて検証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:45:17 GMT)
Beyond Prediction: Interval Neural Networks for Uncertainty-Aware System Identification [6.6] 本稿では、不確実性を考慮したSysIDのためのインターバルニューラルネットワーク(INN)の構築と訓練のための体系的枠組みを提案する。
確率的仮定を使わずに区間演算により不確実性を伝播するインターバルLSTMとNODEモデルを開発した。
トレーニングには,トレーニングされたCNNをNNに変換する2段階のアプローチであるCascade INN(C-INN)と,予測精度と間隔精度を同時最適化する1段階のフレームワークであるJoint INN(J-INN)の2つの戦略を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:19:07 GMT)
SkillSmith: Compiling Agent Skills into Boundary-Guided Runtime Interfaces [6.4] 既存のフレームワークでは、一度ランタイムタスクにマッチしたコンテキストガイダンスとして、通常、スキルがエージェント推論ループに注入されます。
この実行パラダイムは、無関係なコンテキスト注入と、スキル固有の推論と計画の2つの主要な冗長性源を導入している。
我々は,スキルパッケージをオフラインで最小限の実行可能なインターフェースにコンパイルする,境界優先のコンパイラランタイムフレームワークであるSkillSmithを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:25:25 GMT)
Distributional Process Reward Models: Calibrated Prediction of Future Rewards via Conditional Optimal Transport [6.4] インタイムスケーリング手法はプロセス・リワード・モデル(PRM)に依存している。
本研究では, PRMの校正, 条件OT(CondOT)マップ学習 citebunne2022 の修正, 単調条件量子関数の推定における条件最適輸送の最初の利用を提案する。
これにより、構造的に有効な量子的推定が得られ、任意のレベルでの信頼境界の効率的な抽出が可能となる。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:55:34 GMT)
BARISTA: A Multi-Task Egocentric Benchmark for Compositional Visual Understanding [6.3] BARISTAは、高密度に注釈付きエゴセントリックなデータセットであり、185の現実世界のコーヒー準備ビデオのベンチマークである。
フレーズグラウンド、手動対話認識、参照、活動認識、関係抽出、時間的視覚的質問応答にまたがるゼロショット言語に基づくタスクを導出する。
実験では、タスクファミリに強いバリエーションがあり、一貫した支配的なモデルファミリはなく、BARISTAを手続き的ビデオ理解のための困難な診断ベンチマークとして位置づけている。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:01:25 GMT)
Expected Batch Optimal Transport Plans and Consequences for Flow Matching [6.3] ランダムなミニバッチ上で最適なトランスポートを解くことは、大規模学習における正確なOTの一般的なサロゲートである。
我々は、この結合を期待バッチOTプラン$overline_k$として定式化し、実験OTプランを$k$の独立したミニバッチに対して平均化する。
我々は, OTバッチサイズが, 抽出可能な2原子モデルおよび合成および画像実験において, 数値積分とどのように相互作用するかを定量化する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:19:09 GMT)
From Model Uncertainty to Human Attention: Localization-Aware Visual Cues for Scalable Annotation Review [6.3] 本研究では,空間不確かさを視覚的に可視化する効果について検討する。
120人の参加者による対照研究では、不確実性を受ける人はラベルの質が向上し、全体としてはより高速である。
これらの知見は,ヒト・イン・ザ・ループのアノテーションを改善するためのレバーとして,局所化の不確実性を確立した。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:54:05 GMT)
Weather-Robust Cross-View Geo-Localization via Prototype-Based Semantic Part Discovery [6.3] クロスビュージオローカライゼーション(CVGL)は、信号が妨害されたり、スプーフされたり、利用できない場合、自律ドローンナビゲーションのキーとなる代替手段として登場した。
パッチグリッド上の明示的な部分グループ化を実現する,パッチベースの視覚変換器(ViT)用の軽量スワップ可能なヘッドであるSkyPartを提案する。
26.95Mパラメータと22.14 GFLOPでは、SkyPartは最もパフォーマンスの高い手法の中で最小である。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:15:52 GMT)
Unlocking Compositional Generalization in Continual Few-Shot Learning [6.3] 我々は、合成推論から表現学習を厳密に分離する新しいパラダイムを開拓した。
トレーニング中、スロット表現は完全に全体的クラスアイデンティティに最適化される。
我々はこのパラダイムが二重構造的利点をもたらすことを実証し、凍結したバックボーンは自然に表現のドリフトを防ぎ、一方、我々の軽量で全体最適化は新規概念伝達のための特徴量を保存する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:02:31 GMT)
MIST: Reliable Streaming Decision Trees for Online Class-Incremental Learning via McDiarmid Bound [6.3] ストリーム決定木は、オープンワールド連続学習の自然な候補である。
2つの混在した誤校正のために、オンラインのクラスインクリメンタルラーニングでは依然として失敗している。
本稿では,MIST(McDiarmid Incremental Streaming Tree)について述べる。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:45:00 GMT)
DeepLévy: Learning Heavy-Tailed Uncertainty in Highly Volatile Time Series [6.3] DeepLévyは、Lévyの安定分布の混合を学習するニューラルネットワークフレームワークである。
DeepLévyには、複数のLévyコンポーネント上でコンテキスト依存の重みとパラメータを適応的に学習する混合メカニズムが組み込まれている。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:30:16 GMT)
DORA: Dynamic Online Reinforcement Agent for Token Merging in Vision Transformers [6.2] 視覚変換器(ViT)における動的トークンマージのための最初の強化学習(RL)によるオンライン推論フレームワークであるDORAを提案する。
マージング処理をシーケンシャルマルコフ決定プロセス(MDP)として定式化し、各トランスフォーマーブロックのマージング戦略を、現在の特徴状態と層固有のコンテキストに基づいて、軽量RLエージェントが決定する。
低計算オンライン推論のための最小限のアクターヘッドを維持しつつ、高容量のCriticを安定したオフライントレーニングに利用した非対称アクター・クライブアーキテクチャを実装した。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:42:18 GMT)
Why Users Go There: World Knowledge-Augmented Generative Next POI Recommendation [6.2] AWARE(Augmented Recommendation)
AWAREは、地域文化の特徴、季節的傾向、および各ユーザに関連する進行中の出来事を捉えた文脈的物語を生成する。
AWAREは競争ベースラインを一貫して上回り、12.4%の相対的な改善を達成している。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:01:29 GMT)
Control of Fully Actuated Aerial Vehicles: A Comparison of Model-based and Sensor-based Dynamic Inversion [6.2] 完全に作動した マルチロータープラットフォーム 車両の姿勢から 翻訳力の生成を分離する
本稿では, モデルベース非線形動的インバージョンコントローラ (Geometric NDI) とセンサベースインクリメンタル動的インバージョンコントローラ (INDI) を比較した。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:58:03 GMT)
U-STS-LLM A Unified Spatio-Temporal Steered Large Language Model for Traffic Prediction and Imputation [6.2] U-STS-LLM は,時空間操舵 LLM 上に構築された統合フレームワークである。
我々の中心となる革新は動的S-Loコンカレントアテンションバイアスジェネレータであり、過渡的なノイズ状態を持つ永続関数グラフを合成する。
U-STS-LLMは、長距離予測と高損失レート計算の両方において、新しい最先端性能を確立することを実世界のセル・データセットで実証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:16:22 GMT)
XWOD: A Real-World Benchmark for Object Detection under Extreme Weather Conditions [6.2] XWOD (Extreme Weather Object Detection) は,大規模実世界の交通物体検出ベンチマークである。
データセットには、車、人、トラック、オートバイ、自転車、バスを含む6つの交通対象カテゴリが含まれている。
XWODは、洪水、竜巻、山火事など、気候を増幅する新しい種類のハザードを最初にカバーした。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:46:15 GMT)
An Explainable AI Assistant for Introductory Programming Education: Improving Feedback Reliability with Instructor-AI Collaboration [6.2] 説明可能なAIモデルを利用して、生徒のコードを分析し、論理的誤りをインストラクターが特定した誤解にマップし、インストラクターが承認したフィードバックを提供する。
以上の結果から,学生に正の体験を育みながら,正確な指導者によるフィードバックを提示できることが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:35:55 GMT)
Training LLMs with Reinforcement Learning for Intent-Aware Personalized Question Answering [6.2] Intent-Aware Personalization (IAP)は、シングルターン質問から直接暗黙のユーザ意図を推論するためにモデルを訓練する。
IAPは、パーソナライズされた意図に基づく回答を生成するためのタグベースのスキーマを通じて、ユーザの意図を思考ステップに組み込む。
IAPは、LaMP-QAベンチマークでの実験において、すべてのベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:38:05 GMT)
Do Language Models Encode Knowledge of Linguistic Constraint Violations? [6.1] 大規模言語モデル (LLM) は言語的性能は高いが、これらの予測を生成するための内部メカニズムはいまだに不明である。
本研究では,LLMが言語制約違反の表現をパラメータ内にエンコードし,非文法的な文を処理する際に選択的に活性化されるという仮説を考察する。
本稿では,制約違反と良好な入力に対して優先的に活性化される特徴を特定するための感度スコアを導入し,潜在的な違反固有の特徴の教師なし検出を可能にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:37:06 GMT)
A Study on Hidden Layer Distillation for Large Language Model Pre-Training [6.1] 知識蒸留(KD)は、大規模言語モデル(LLM)を訓練するための重要なツールである
Hidden Layer Distillation (HLD) はエンコーダアーキテクチャの可能性を示したが、デコーダのみの大規模事前学習への応用は未解明のままである。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:31:33 GMT)
BiPneu: Design and Control of a Bipolar-Pressure Pneumatic System for Soft Robots [6.1] BiPneuは、ソフトロボットのためのスケーラブルで費用効率のよいマルチチャネルバイポーラ圧空気圧システムである。
ハイブリッド型空気圧モデルに基づいて,モード選択を制御したデュアルモードスライディングモードコントローラ (DM-SMC) を提案する。
DM-SMCの追尾ステップおよび正弦波圧力基準における優れた性能を示すシミュレーションと実験を行った。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:54:01 GMT)
Premover: Fast Vision-Language-Action Control by Acting Before Instructions Are Complete [6.1] アイドルウィンドウを有用なプリ計算に変換する軽量モジュールであるPremoverを紹介する。
LIBEROベンチマークスイートでは、Premoverは平均壁時計時間を34.0秒から29.4秒に短縮し、13.6%削減した。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:10:54 GMT)
Online Learning-to-Defer with Varying Experts [6.1] バンディットフィードバックと動的に変化する専門家のプールを備えた,マルチクラス分類のための最初のオンラインL2Dアルゴリズムを導入する。
本手法は, 一般には$O((n+n_e)T2/3)$, $O((n+n_e)sqrtT)$を低雑音条件下で後悔保証する。
合成および実世界のデータセットの実験により、我々のアプローチは、標準的なLearning-to-Deferを、専門家の可用性と信頼性の異なる設定に効果的に拡張することを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:19:44 GMT)
Partial Model Sharing Improves Byzantine Resilience in Federated Conformal Prediction [6.1] 本稿では, 部分的モデル共有を利用するビザンチン耐性連邦共形予測法を提案する。
トレーニング中、部分的な共有は本質的に攻撃面を制限し、有毒な更新を減衰させる。
キャリブレーション中、クライアントは非整合性のスコアをヒストグラムに基づく特徴ベクトルに圧縮する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:42:20 GMT)
Lower bounds for one-layer transformers that compute parity [6.0] 有理関数で後処理された自己アテンション層は、頭部の数と後処理関数の次数が入力長さと直線的に増加しない限り、パリティ関数にサインアップできない。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:17:48 GMT)
Output Composability of QLoRA PEFT Modules for Plug-and-Play Attribute-Controlled Text Generation [6.0] 組み合わせ効率のよい微調整(PEFT)技術は、完全な微調整のコストのごく一部でタスク固有の微調整を提供する。
i)複数の関連するデータセットの組み合わせに関するトレーニング、(ii)個別に訓練されたPEFTモジュールの重量行列を構成する推論、(iii)個別に訓練されたPEFTモジュールの出力を構成する推論の3つの方法を探る。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:21:43 GMT)
A Comparative Study of Controlled Text Generation Systems Using Level-Playing-Field Evaluation Principles [6.0] 比較評価にはレベル・プレイング・フィールド(LPF)アプローチを用いる。
我々は,現在使用されているものに基づいて選択された評価手法とデータセットの共有集合を適用し,公正な評価を確実にする。
結果: この方法での再評価を行った場合, 従来のCTGシステムと比較すると, 結果が著しく異なる場合が多く, 結果が悪くなる場合が多い。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:57:53 GMT)
Test-Time Compute for Dense Retrieval: Agentic Program Generation with Frozen Embedding Models [5.9] テストタイム計算は大きな推論モデルにしか利益がないと広く信じられている。
また、小さな埋め込みモデルにも役立ちます。
エージェントプログラム探索ループを用いて,凍結埋め込みAPI上で259個の候補推論プログラムを探索する。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:56:34 GMT)
A Mixture Autoregressive Image Generative Model on Quadtree Regions for Gaussian Noise Removal via Variational Bayes and Gradient Methods [5.9] 本稿では,グレースケール画像における画像認識の問題に対処する。
本稿では,MAP (maximum a reari) 推定に基づくデノゲーションを変動下界に還元するフレームワークを提案する。
本研究では,勾配に基づく更新規則を数値や近似なしで解析的に計算できることを実証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:08:46 GMT)
Exact Stiefel Optimization for Probabilistic PLS: Closed-Form Updates, Error Bounds, and Calibrated Uncertainty [5.8] 本研究では,雑音事前推定,制約付き確率最適化,予測キャリブレーションを組み合わせたエンドツーエンドフレームワークを開発した。
我々は、任意のガウス化により、このフレームワークをガウス以下の設定に拡張し、ブロック構造フィッシャー解析により、クローズドフォームの標準エラーを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:38:12 GMT)
Investigating simple target-covariate relationships for Chronos-2 and TabPFN-TS [5.8] Time Series Foundation Models (TSFM)は、最近最先端のパフォーマンスを達成した。
Chronos-2やTabPFN-TSといった最近のTSFMアーキテクチャは、共変量の統合を目指している。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:38:25 GMT)
3D RL-DWA: A Hybrid Reinforcement Learning and Dynamic Window Approach for Goal-Directed Local Navigation in Multi-DoF Robots [5.7] 本稿では,Reinforcement Learning (RL) と Dynamic Window Approach (DWA) を組み合わせた新しいハイブリッド手法を提案する。
本手法は, 変形可能なマイクロロボットの運動と形状を動的に調整するために, スパース点雲データを利用する。
1080の試験に基づく実験の結果、DWAベースのローカルプランナーとRLを統合することにより、変形能力と航法能力の両方が大幅に向上することが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:37:32 GMT)
SHIELD: Scalable Optimal Control with Certification using Duality and Convexity [5.7] ShiELD は階層的なアルゴリズムであり、凸プログラムにおける決定のマグニチュードと制約セットの両方を削減する。
複雑なマルチモーダル交通シナリオにおけるモデル予測制御(SMPC)における ShiELD の有効性を検証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:46:03 GMT)
Hybrid-LoRA: Bridging Full Fine-Tuning and Low-Rank Adaptation for Post-Training [5.7] 提案するHybrid-LoRAは,モジュールのサブセットにフル微調整を選択的に適用する,効率的なポストトレーニングフレームワークである。
実験の結果、Hybrid-LoRAは10%のフル微調整モジュール予算下での完全な微調整性能と密に一致していることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:11:44 GMT)
Introducing Environmental Constraints to Grasping Strategies for Paper-Like Flexible Materials Using a Soft Gripper [5.7] 紙のような材料は布と異なる機械的特性を示し、圧縮応力に敏感である。
本研究は, ユニバーサルソフトグリップを用いた紙状材料の把持戦略を系統的に検討した。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:03:04 GMT)
Closing the Motion Execution Gap: From Semantic Motion Task Constraints to Kinematic Control [5.6] Motion Statechartsは、複雑な動きの実行可能なシンボル表現として導入された。
世界中心の運動仕様は、統一された微分可能キネマティック世界モデルを使用することで実現されている。
8つのロボットプラットフォームにメソッドをデプロイすることで、クロスプラットフォームのトランスファビリティを実証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:35:25 GMT)
HamBR: Active Decision Boundary Restoration Based on Hamiltonian Dynamics for Learning with Noisy Labels [5.6] 大規模視覚認識およびデータマイニングタスクにおいて、ノイズラベルの存在はディープニューラルネットワーク(DNN)の一般化能力を著しく損なう
本研究は,ノイズ・ロバスト学習におけるアクティブ・バウンダリ・リカバリの重要性を強調した最初の試みである。
ハミルトン力学に基づく新しいパラダイムであるHamBRを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:14:35 GMT)
MotionGRPO: Overcoming Low Intra-Group Diversity in GRPO-Based Egocentric Motion Recovery [5.5] 本稿では,頭部搭載デバイス信号からのフルボディ3次元人間の動作回復について検討する。
拡散過程に微粒なガイダンスを注入するための強化学習後学習を活用した新しいフレームワークであるMotionGRPOを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:30:07 GMT)
PriorZero: Bridging Language Priors and World Models for Decision Making [5.5] 我々は,Large Language Models (LLM) を世界モデルベース計画に統合するための PreferZero を提案する。
モンテカルロ木探索(MCTS)のルートノードにLLM前駆体を内包する新しいルート優先注入機構
JerichoのテキストベースのアドベンチャーゲームやBabyAIの命令追従グリッドワールドタスクなど、さまざまなベンチマークの実験では、PredorZeroが探索効率と性能の両方を一貫して改善していることが示されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:47:18 GMT)
BEACON: Cross-Domain Co-Training of Generative Robot Policies via Best-Effort Adaptation [5.5] BEACONは、重複ドメインのコトレーニングを、不一致を意識した重要/重み付け問題として論じている。
我々は、スケーラブルなインスタンスレベルの不一致推定器を開発し、ポリシーと重みの更新を交互に行い、マルチソース拡張を行う。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:14:47 GMT)
SI-Diff: A Framework for Learning Search and High-Precision Insertion with a Force-Domain Diffusion Policy [5.4] 本稿では,SI-Diffを提案する。SI-Diffは,力領域拡散ポリシーを用いて,探索と高精度挿入の両方を学習するフレームワークである。
SI-Diffは,最先端のベースラインであるTacDiffusionと比較して,2mmから5mmのミスアライメントに対する耐性を2mmまで拡張することを示すための徹底的な実験を行った。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:14:51 GMT)
Freeze Deep, Train Shallow: Interpretable Layer Allocation for Continued Pre-Training [5.3] 本稿では,タスク実行位置を特定し,レイヤの感度を定量化するためにLayerTracerを提案する。
我々は、ディープレイヤがタスク実行の重要な領域として機能し、破壊的な更新に対して高い安定性を維持することを示す。
また,高品質な事前学習モジュールを深層に配置することで,モデル固有の知識を効果的に保存できることを検証したハイブリッドモデルケーススタディを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:11:31 GMT)
LGMT: Logic-Grounded Metamorphic Testing for Evaluating the Reasoning Reliability of LLMs [5.3] 大規模言語モデル (LLM) は論理的推論ベンチマークにおいて高い性能を達成するが、信頼性は不確実である。
LLM推論の評価に一階述語論理(FOL)を利用するオラクルフリーフレームワークであるLGMT(Logic-Grounded Metamorphic Testing)を提案する。
最先端のLLM6つの実験は、LGMTが従来の基準ベース評価で欠落している重大な隠れた欠陥を露呈していることを示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:26:59 GMT)
Understanding Sample Efficiency in Predictive Coding [5.3] 小規模な実験により、予測符号化(PC)は、多くの文脈においてよりサンプル効率が高く効果的な学習を可能にすることが示された。
BPとPCの学習効率をターゲットアライメントと呼ばれる指標を用いて定量化する」
我々は,特に深層,狭部,事前学習ネットワークにおいて,PCでの学習がBPよりも効率的であることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:24:20 GMT)
Hardness Amplification for (Sparse) LPN [5.1] 雑音を学習するパリティ(mathsfLPN$)とそのスパース変種に対する新しい硬度増幅結果を示す。
で$mathsfLPN$を解くアルゴリズムは、"ほとんどすべてのインスタンス"で$mathsfLPN$を解くアルゴリズムに変換することができる。
同じ増幅アプローチを$mathsfLPN$ over $mathbbF_q$とSparse-$mathsfLPN$に拡張します。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:03:30 GMT)
When Reasoning Traces Become Performative: Step-Level Evidence that Chain-of-Thought Is an Imperfect Oversight Channel [5.1] CoT(Chain-of- Thought)トレースは、言語モデルの能力向上とモデルの振る舞いの監査にますます利用されている。
我々は、この仮定を、回答コミットプロキシを中心に構築されたステップレベルのDect-Classify-Compareフレームワークでテストする。
9つのモデルと7つの推論ベンチマーク、潜在コミットメント、明示的な回答到着は平均61.9%のステップで一致している。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:24:47 GMT)
Are Compact Rationales Free? Measuring Tile Selection Headroom in Frozen WSI-MIL [5.1] 凍結したWSI-MILのポストホック合理化について検討した。
最適なコンテキストインスタンス(FOCI)を見つけることでこれをインスタンス化する。
FOCIは、タイルサブセットの保持/ドロップよりも、モデル出力の十分さと排除の目的で訓練されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:15:41 GMT)
Self-Consolidating Language Models: Continual Knowledge Incorporation from Context [5.1] 大規模言語モデル(LLM)は、パス、会話、長いコンテキストのストリームとして情報を受け取るようになっている。
本研究では,従来の統合情報との干渉を抑えつつ,現在のコンテキストをモデル重みに書き込む連続的コンテキスト統合について検討する。
textbfSelf-textbf Consolidating textbfLanguage Models (SCoL) は、LLMがテキスト更新命令を生成することを学習する後トレーニングフレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:47:00 GMT)
Extracting Search Trees from LLM Reasoning Traces Reveals Myopic Planning [5.0] 大規模言語モデル(LLM)は、将来の結果に対する明確な議論を含む拡張チェーン・オブ・シント(CoT)推論を生成する。
本研究では,4対1のボードゲームにおいて,探索木を推論トレースから抽出し,定量化することにより,LSM計画の特徴付けを行う新しい手法を提案する。
LLMの探索は人間より浅く, 深度よりも幅の広い探索により予測できることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:52:10 GMT)
RLearner-LLM: Balancing Logical Grounding and Fluency in Large Language Models via Hybrid Direct Preference Optimization [5.0] ハイブリッドDPOを用いたRLearner-LLMを提案する。
RLearner-LLMはSFTよりも最大6倍NLI改善する。
Gemma 4 E4B-itでは、Hybrid-DPOは5つのドメインのうち4つのNLIを持ち上げる。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:46:48 GMT)
FAME: Feature Activation Map Explanation on Image Classification and Face Recognition [5.0] ディープ・ネットワークは ローカルなピクセル情報を よりグローバルな概念に変える 非常に曖昧な方法で
本稿では,FAME(Feature Activation Map Explanation)とFAME(Feature Activation Map Explanation)を提案する。
我々はFAMEが競合する最先端システムである属性マップを生成することを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:05:00 GMT)
Five Attacks on x402 Agentic Payment Protocol [4.9] 我々はx402を分析し、設計と実装の両方に脆弱性があることを実証的に示す。
我々は、認証、バインディング、リプレイ保護、Web層処理の弱点を明らかにする5つの具体的な攻撃を示す。
以上の結果から,5件の攻撃はいずれも実用的であり,無給サービスあるいは有給/無給の結果をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:49:10 GMT)
QAP-Router: Tackling Qubit Routing as Dynamic Quadratic Assignment with Reinforcement Learning [4.9] 動的二次割当問題 (QAP) の定式化に基づくQAP-hard, framing qubit routingを提案する。
本手法は,強化学習環境における報酬を定義するため,相互距離結合を統一目的に捉えたものである。
また、QAPフレームワークに自然にブレンドするルックアヘッド機構も統合し、筋電図決定を防ぎます。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:34:01 GMT)
Overcoming the Intrinsic Performance Limitations of MEMS IMU via Diffusion-Based Generative Learning [4.9] 慣性計測ユニット(IMU)は、マルチソース統合ナビゲーションシステムの基本センサーコンポーネントである。
低コストIMU測定から高忠実度仮想IMUデータを合成するための拡散型生成学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:03:52 GMT)
Grokking or Glitching? How Low-Precision Drives Slingshot Loss Spikes [4.9] ディープニューラルネットワークは、非正規化された長期トレーニング中に周期的な損失スパイクを示す。
本稿では,この現象が浮動小数点演算の精度限界の結果であることを示す。
我々はこのメカニズムがスリングショットのスパイク前の急激なノルム成長を説明できることを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:56:27 GMT)
Solve the Loop: Attractor Models for Language and Reasoning [4.9] Looped Transformerは、純粋にフィードフォワード計算に代わる有望な代替手段を提供する。
本稿では、まず、バックボーンモジュールが出力の埋め込みを提案し、次にアトラクターモジュールが固定点を解くことでそれらを洗練するAttractor Modelsを紹介する。
本研究では,Attractor Modelsが,大規模言語モデル事前学習と推論という2つのレシエーションにおいて,既存モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:51:26 GMT)
Approximation Theory of Laplacian-Based Neural Operators for Reaction-Diffusion System [4.9] 一般化されたGierer-Meinhardt-diffusion系の初期状態から時間依存解への解写像に適用したニューラル作用素について検討する。
本研究の主な成果は,ネットワーク深度,幅,スペクトルランクの面での明示的な近似誤差境界を確立することである。
ラプラシア固有関数に基づくニューラルアーキテクチャは、一般的な演算子学習で発生するパラメトリック複雑性の呪いを軽減する。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:13:04 GMT)
TB-AVA: Text as a Semantic Bridge for Audio-Visual Parameter Efficient Finetuning [4.8] TB-AVA(Text-Bridged Audio-Visual Adapter)を中心とした冷凍オーディオとビジュアルエンコーダをベースとしたパラメータ効率適応フレームワークを提案する。
TB-AVAのコアでは、GSM(Gated Semantic Modulation)がテキスト推論のセマンティック関連性に基づいて特徴チャネルを選択的に変調する。
提案手法は, AVE, AVS, AVVPなど複数のベンチマークで評価され, 提案手法は最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:59:23 GMT)
Posterior Contraction Rates for Sparse Kolmogorov-Arnold Networks in Anisotropic Besov Spaces [4.7] スパイク・アンド・スラブ型スペーサーを有するスパルスベイズカンが, ほぼ最小の後方収縮を達成できることを示す。
特に収縮速度は、下層の関数の内在的な異方的滑らかさに依存する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:14:08 GMT)
Cross-Modal-Domain Generalization Through Semantically Aligned Discrete Representations [4.7] マルチモーダル学習は、様々な感覚源にまたがる情報の統合を目指している。
現在のアプローチは、モダリティ固有の構造とクロスモーダル一般化可能性のバランスをとるのに苦労している。
我々は、モダリティ固有のコードブック間のセマンティックコンセンサスを確立する新しいフレームワークであるCoDAARを紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:03:30 GMT)
VNDUQE: Information-Theoretic Novelty Detection using Deep Variational Information Bottleneck [4.6] 深部変分情報ボトルネック(VIB)による新規性検出の検討
我々は,MNIST 上の VIB モデルを保持桁クラスで学習し,情報理論の指標である KL の発散と予測エントロピーを用いて OOD 検出を評価する。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:31:44 GMT)
CoRAL: Contact-Rich Adaptive LLM-based Control for Robotic Manipulation [4.6] 大規模言語モデル (LLMs) と視覚言語モデル (VLMs) は高レベルの推論と意味理解において顕著な能力を示す。
我々は,低レベル制御から高レベル推論を分離することでゼロショット計画を可能にするモジュラーフレームワークであるCoRALを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:25:37 GMT)
Few-Shot Physics-Informed Neural Network for Shape Reconstruction of Concentric-Tube Robots [4.5] 既設管を3本有する6-DoF CTRのキネマティックモデリングのための物理インフォームドニューラルネットワーク(PINN)を提案する。
PINNは、形状、ねじれ角、ねじれひずみ、曲げモーメント、方向の完全な状態推定を可能にする。
結果として得られるモデルは、計算的に効率的で堅牢であり、リアルタイム制御アプリケーションにも適している。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:07:53 GMT)
Telecom quantum memory over one microsecond in nanophotonic lithium niobate [4.5] 我々は、エルビウムドープ薄膜ニオブ酸リチウムの原子周波数コムを用いて、単一光子レベルの光バンド光パルスを1マイクロ秒以上保存する。
これらの結果から, ニオブ酸エルビウムをドープした薄膜リチウムが, テレコム波長におけるオンチップ量子メモリの実用化プラットフォームとして確立された。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:15:14 GMT)
Self-organized MT Direction Maps Emerge from Spatiotemporal Contrastive Optimization [4.5] 霊長類視覚野の空間的および機能的構造は神経科学における根本的な問題である。
本研究では,時間的トポグラフィが同じ普遍原理によって支配されているかを検討する。
MTチューニングは, タスク駆動型判別圧力と空間正則化との厳密なトレードオフから生じる, 残留軸ピンホイールと組み合わせた強い方向選択性によって特徴付けられる。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:05:35 GMT)
Attribution-based Explanations for Markov Decision Processes [4.4] 本稿では,マルコフ決定過程の帰属に基づく説明を生成する手法を紹介する。
これらのスコアの効率的な合成を可能にするため,戦略の手法を活用することで,スコアの重要度を計算することができることを示す。
我々は5つのケーススタディにアプローチを評価し、シーケンシャルな意思決定エージェントの論理に対する解釈可能な洞察を提供することの有用性を実証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:12:10 GMT)
Sampling-Based Follow-the-Leader Motion Planning for Manipulator-Mounted Continuum Robots [4.4] FTL(Follow-the- Leader)運動は、連続体ロボット(CR)のユニークな形態を利用して、体が先端の経路を追従することで、閉じ込められた空間をナビゲートする。
本稿では,ロボット構成とベースポーズを協調的に考慮したマニピュレータ搭載CRのFTL動作のためのサンプリングベースモーションプランナを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:46:13 GMT)
jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers [4.3] GELATOはマルチモーダル埋め込みモデルに対する新しいアプローチである。
GELATOは最先端技術と競合する結果を生み出す。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:52:45 GMT)
FePySR: A Neural Feature Extraction Framework for Efficient and Scalable Symbolic Regression [4.3] FePySRは、方程式探索に先立って有効な特徴を抽出することにより、SR探索空間を縮小する2段階のフレームワークである。
5つの標準ベンチマークで、FePySRはより高い方程式回復率を達成することによって最先端の手法より優れている。
FePySRは、SRソルバを強化し、シンボリック表現の効率的かつ信頼性の高いリカバリを可能にする、一般化可能なフレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:04:59 GMT)
Career Mobility of Planning Alumni in the United States: Evidence from Professional Profile Data using Large Language Models [4.3] 本研究では,無境界キャリア理論,社会資本理論,空間機会モデルを用いて,同窓生のキャリアモビリティの分析を行う。
その結果, 境界のないキャリアパターン, 特にマルチセクター経験, 横方向, 産業スイッチング軌道を取り入れた卒業生は, 上向きのモビリティを著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:06:32 GMT)
UFO: A Domain-Unification-Free Operator Framework for Generalized Operator Learning [4.2] 我々は、適応的、共同条件付き相互作用を通じて演算子を実現するクロスドメインニューラルネットワークフレームワークであるUFO(Domain-Unification-Free Operator)を紹介する。
我々は、UFOが分布シフトの下で正確な、堅牢で、物理的に一貫性のある予測を提供することを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:54:12 GMT)
Learning Transferable Latent User Preferences for Human-Aligned Decision Making [4.2] ヒューマンアラインな意思決定には、明示された目標と潜伏したユーザの好みの両方を考慮しなければならない。
本稿では,CLIPR(Conversational Learning for Inferring Preferences and Reasoning)を紹介する。
3つのデータセットの評価とユーザスタディによると、CLIPRはアライメントの改善と推論コストの削減において、既存の手法を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:32:10 GMT)
HM-Req: A Framework for Embedding Values within CPS Human Monitoring Requirements [4.1] HM-Reqは、人間の監視要求を定義するための制御された自然言語(CNL)を含む、新しい要件適用フレームワークである。
これらの要件は、関連する利害関係者の人的価値で強化され、潜在的な衝突を検出するためにバリューダッシュボードに統合されます。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:15:39 GMT)
KAN-CL: Per-Knot Importance Regularization for Continual Learning with Kolmogorov-Arnold Networks [4.0] 連続学習(CL)における中心的障害は破滅的忘れである
Kolmogorov-Arnold Networks (KAN) のコンパクトなスプラインパラメータ化を利用した連続学習フレームワークkan-CLを提案する。
Kan-CL は Split-CIFAR-10/5T と Split-CIFAR-100/10T の頭のみの Kan ベースラインよりも 88% と 93% の削減を実現している。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:55:09 GMT)
In-context learning to predict critical transitions in dynamical systems [3.9] 本稿では,システムの臨界遷移近さを推定するコンテキスト内学習フレームワークであるTipPFNを紹介する。
我々は、未確認のチップ状態における臨界遷移の堅牢な最先端早期検出を実証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:56:03 GMT)
A Proprioceptive-Only Benchmark for Quadruped State Estimation: ATE, RPE, and Runtime Trade-offs Between Filters and Smoothers [3.9] MUSE, Invariant Extended Kalman Filter (IEKF), Invariant Smoother (IS) の3つの状態受容状態推定器を比較した。
本稿では,長期精度(ATE),短期精度(Translational and rotational Relative Pose metrics RPE),および固定ハードウェア/ソフトウェアスタック上での更新時間について報告する。
全体として、本研究では正確さとコストのスナップショットを提供し、読者がアプリケーション制約に適合する推定器を選択するのに役立つ。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:31:57 GMT)
Mechanism Plausibility in Generative Agent-Based Modeling [3.8] 大規模言語モデルは、明示的にプログラムされた規則なしで、ハイレベルな多様な現象を生成することができる。
現代科学哲学を用いたLLM-ABMに関する最近の研究は、4段階の尺度で「妥当性の定義」を運用するために用いられている。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:46:39 GMT)
StoicLLM: Preference Optimization for Philosophical Alignment in Small Language Models [3.8] 我々は、厳密なデータ制約の下で、曖昧な哲学的枠組みを内在化できるストームテキストの分析を行う。
内向きのストイックな美徳と強い整合性をもたらすことができるのは300の高忠実な例のみである。
批判的に言えば、数発のベースラインを含む全てのモデルは、ストイシズムの外向きのコスモポリタンの任務に永続的な失敗を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:59:47 GMT)
TuniQ: Autotuning Compilation Passes for Quantum Workloads at Scale for Effectiveness and Efficiency [3.8] パイプラインの各段階におけるコンパイルパスを選択する強化学習ベースのシステムであるTuniQを提案する。
TuniQは、メリットを増すとともに、ユーティリティスケールの回路に強くスケールする。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:58:42 GMT)
CVEvolve: Autonomous Algorithm Discovery for Unstructured Scientific Data Processing [3.7] CVEvolveは、科学データ処理アルゴリズム発見のためのゼロコードインタフェースを備えた自律エージェントハーネスである。
我々は、X線蛍光画像登録、ブラッグピーク検出、高エネルギー回折顕微鏡画像分割についてCVEvolveを実証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:24:30 GMT)
Optimal State Preparation for Impulse Estimation in Gaussian Quantum Systems [3.7] 本稿では, 連続監視された線形古典量子系におけるインパルス的乱れの推定を, 最適制御に基づく手法を提案する。
ナノメカニカル共振器および浮遊ナノ粒子の適用により、最適パラメトリック駆動は、定常動作に対する最大2つの係数による推定分散を減少させる。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:07:55 GMT)
Overtrained, Not Misaligned [3.7] 創発的ミスアライメント(Emergent misalignment, EM)とは、狭いタスクの微調整が、無関係なドメイン間で広範囲のミスアライメントを引き起こす場所である。
我々はこれまでで最も包括的なEM研究を行い、GPT-4oの発見と12のオープンソースモデルへの拡張を再現した。
EMはGPT-4oで複製されるが,モデルサイズとEM感受性との間には有意な相関がある。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:37:55 GMT)
Modular Lie Algebraic PDE Control of Multibody Flexible Manipulators [3.7] 任意の数のリンクを持つシリアルフレキシブルマニピュレータのためのサブシステムベースの適応制御フレームワーク。
各リンクの弾性変形PDEは、空間的離散化やモーダルトランケーションを伴わずに全制御設計を行う。
ひずみに基づく変形PDEを動的方程式に置換することにより、リンクごとのダイナミクスの制御可能な形式が導出される。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:00:42 GMT)
Task-Adaptive Embedding Refinement via Test-time LLM Guidance [3.6] 組込みモデルのユーザビリティをゼロショット検索と分類タスクに拡張するためのLLM誘導クエリ改善パラダイムの有効性について検討する。
提案手法では, ユーザクエリの埋め込み表現を, 少数の文書に対して生成LLMからのフィードバックを用いて洗練する。
我々は,最先端のテキスト埋め込みモデルを用いて,多様な検索と分類のベンチマークを行う。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:58:27 GMT)
EpiCastBench: Datasets and Benchmarks for Multivariate Epidemic Forecasting [3.6] 大規模ベンチマークフレームワークであるEpiCastBenchについて紹介する。
これらのデータセットは、幅広い感染症にまたがり、時間的粒度、シリーズの長さ、空間性といった様々な特徴を示す。
この枠組みを活用することで、統計的ベースラインから最先端の深層学習および基礎モデルにまたがる15の多変量予測モデルの包括的評価を行う。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:22:56 GMT)
Quality-Aware Collaborative Multi-Positive Contrastive Learning for Sequential Recommendation [3.6] 逐次レコメンデーションのための品質を考慮した協調型多目的コントラスト学習を提案する。
まず、2つの拡張ビューを生成する学習可能な協調シーケンス拡張モジュールを提案する。
第二に、モデル表現に密に統合された品質認識機構を設計し、拡張操作の信頼性から各ビューの品質を推定する。
3つの実世界のデータセットに対する大規模な実験は、QCMP-CLが最先端のCLベースのシーケンシャルレコメンデーションベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:00:01 GMT)
Generative Diffusion Prior Distillation for Long-Context Knowledge Transfer [3.5] この研究は知識蒸留を用いて、部分時系列分類器に全系列の一般化能力を持たせる。
提案する生成拡散優先蒸留(GDPD)は,短文学生の特徴を対象のフルコンテキスト特徴の劣化観察として扱う新しいKDフレームワークである。
GDPDは、各学生の特徴にタスク関連長文知識の分布を与え、部分分類タスクの学習に役立てる。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:06:05 GMT)
Basilisk and Docker for Reproducible GN&C Simulation: A Workflow Reference [3.5] Basiliskは、宇宙船の誘導、航法、制御(GN&C)の研究・開発に使用されるオープンソースの天体力学シミュレーションフレームワークである。
本稿では,コンテナイメージの完全なビルド環境,依存関係,シミュレーションインフラストラクチャをカプセル化した,Basilisk用のDockerベースのコンテナ化ワークフローを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:37:37 GMT)
Dynamical Criticality Behind Energy-Storage Singularities in Quantum Batteries [3.5] 量子電池のエネルギー貯蔵特異点はしばしば平衡量子臨界度と関連付けられている。
クエンチ駆動型多体電池では、運動量空間における動的臨界からそのような特異点が生じることが示されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:02:58 GMT)
State-Space NTK Collapse Near Bifurcations [3.5] 分岐が学習力学を支配的かつ単純化していることが示される。
分岐近傍では、sNTK を古典的な正規形式システムにおける学習に対応するランクワン作用素に還元することができる。
低ランクな自然勾配法は, 分岐近傍の学習不安定を解消することを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:20:27 GMT)
Universal Speed Limit in a Far-from-Equilibrium Bose Gas: Symmetry and Dynamical Decoherence [3.5] 量子系における普遍振幅$C$の最初のパラメータフリー予測を示す。
そこで, 強相関非平衡系の輸送係数を予測するための新しいパラダイムが確立された。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:08:49 GMT)
A Semi-Supervised Framework for Speech Confidence Detection using Whisper [3.4] 本稿では,Whisperエンコーダの深いセマンティック埋め込みを解釈可能な音響特徴ベクトルと融合する半教師付きハイブリッドフレームワークを提案する。
地盤の真理データへの依存を軽減するため,不確実性に配慮した擬似ラベル戦略を導入する。
実験の結果,提案手法はマクロF1スコアが0.751であり,自己教師付きベースラインよりも優れていた。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:50:54 GMT)
Just Ask for a Table: A Thirty-Token User Prompt Defeats Sponsored Recommendations in Twelve LLMs [3.4] Wu et al. (2026) は、ほとんどのフロンティア大型言語モデル (LLM) が、システムのプロンプトがソフトなスポンサーシップキューを含む場合、ほぼ2倍の訓練飛行を推奨していることを示した。
オープンウェイトな10のチャットモデルと、現在まで到達可能な23のモデルのうち2つの評価を再現する。
本論文の報告率はすべて、原論文と同じ判断で作成される(gpt-4o)。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:34:33 GMT)
TwiSTAR:Think Fast, Think Slow, Then Act,Generative Recommendation with Adaptive Reasoning [3.3] セマンティックID(SID)を用いたジェネレーティブレコメンデーション(ジェネレーティブレコメンデーション)が,有望なパラダイムとして浮上している。
既存の手法では、すべてのユーザ履歴に一様に、高速なダイレクトジェネレーションまたは遅いチェーン・オブ・シークレット推論の固定推論戦略を適用している。
本稿では,ユーザシーケンス毎に推論作業を適応的に割り当てることを学ぶフレームワークであるThink Fast,Think Slow, Then Actを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:35:00 GMT)
BronchoLumen: Analysis of recent YOLO-based architectures for real-time bronchial orifice detection in video bronchoscopy [3.3] ブロンコルーメン(BronchoLumen)は、ビデオ気管支鏡における気管支拡張を検出するリアルタイムのYOLOシステムである。
本研究は,最先端の物体検出技術を用いて,画像領域全体にわたって気管支拡張物を堅牢に検出できるかどうかを考察する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:25:56 GMT)
Vision Transformer-Conditioned UNet for Domain-Adaptive Semantic Segmentation [3.3] 本稿では,学習可能なトークンと双方向のアテンションデコーダを通じて,凍結事前学習されたViT表現にUNetを条件付けるViTC-UNetを紹介する。
これは、ViTグローバルな視覚的先行と、UNetsの局所帰納バイアスと高分解能復号能力を組み合わせたものである。
ViTC-UNetはMRIおよびCTモダリティのセマンティックセグメンテーションタスクにおいて、ベースラインよりも優れている。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:56:46 GMT)
AcuityBench: Evaluating Clinical Acuity Identification and Uncertainty Alignment [3.2] AcuityBenchは、言語モデルがユーザの医療プレゼンテーションから適切なケアの緊急性を特定するかどうかを評価するためのベンチマークである。
ユーザ会話、オンラインフォーラム投稿、臨床ヴィグネット、患者のポータルメッセージにまたがる5つの公開データセットで構成されている。
QA設定での明示的な4方向分類と、ルーリックベースの判定器で評価された自由形式の会話応答の2つの補完的なタスク形式をサポートする。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:39:46 GMT)
LISA: Cognitive Arbitration for Signal-Free Autonomous Intersection Management [3.1] 本稿では,自律的交差点管理のための信号自由認知調停フレームワークを提案する。
LLMベースの推論は、リアルタイムで信号のない交差点管理を可能にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:04:50 GMT)
Minimax Rates and Spectral Distillation for Tree Ensembles [3.1] ランダム・フォレスト(RF)やグラデーション・ブーピング・マシン(GBM)といったツリーアンサンブルは、最も広く使われている教師付き学習者の一つである。
これらのアルゴリズムにはスペクトル的視点が採用されており、主な貢献は2つである。
RF の場合、核作用素の先頭固有関数は支配的な予測方向を捉え、GBM の場合、スムーズな行列の先頭特異ベクトルは類似の役割を果たす。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:26:00 GMT)
The Missing GAP: From Solving Square Jigsaw Puzzles to Handling Real World Archaeological Fragments [3.0] GAPは,非制限形状の合成,高度に浸食された断片を含む,新しいジグソーパズルのデータセットである。
ジグソーパズル解決のための新しいViTおよびFlow-MatchingベースのフレームワークであるPuzzleFlowについても紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:04:28 GMT)
ODRPO: Ordinal Decompositions of Discrete Rewards for Robust Policy Optimization [3.0] 大規模言語モデル(LLM)は、AIフィードバック(RLAIF)から強化学習(Reinforcement Learning)を利用する。
これらのドメインは、細粒度で多層的な報酬を提供するために、しばしばベースオートレーダに依存している。
これは、離散的な報酬を順序付きバイナリインジケータのシーケンスに分解することで、評価ノイズを構造的に分離するフレームワークです。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:17:14 GMT)
GAR: Carbon-Aware Routing for LLM Inference via Constrained Optimization [3.0] 現在の経路法では、持続可能なエネルギー利用やCO2排出量を最適化の目的として考えることはめったにない。
我々は,リクエスト毎のCO2排出量を最小限に抑える制約付き多目的最適化フレームワークであるGreen-Aware Routing(GAR)を紹介する。
GARは、競争精度とp95レイテンシの保証を維持しながら、かなりの炭素削減を達成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:32:31 GMT)
A New Technique for AI Explainability using Feature Association Map [3.0] AIシステムにおける透明性の欠如は、現実のアプリケーションに課題をもたらす。
システムに対する信頼を確保するために、AIシステムの決定を説明できることが重要です。
我々は、AIシステムの説明のための新しいアルゴリズムFAMeXを提案している。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:25:45 GMT)
Minimalistic Terminal Editor for Julia Programming -- MinTEJ: A Friendly Approach for a Scientific Programmer [3.0] 本稿では、Juliaで構築された端末ベースのエディタMinTEJを紹介する。
ファイル管理、コード編集、実行、デバッグをコマンド指向のワークフローを通じて統合する、逐次モーダルインタラクションアーキテクチャ(SMIA)を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:36:29 GMT)
The uncertainty geometry of finite-dimensional position and momentum [3.0] 離散フーリエ変換に関連付けられた可観測物の有限次元正準対によって達成できる共分散行列を特徴づける。
我々は、極端状態を特定する体系的な方法を提供し、最小不確かさ状態の概念を一般化し、離散不確実性幾何がその連続的な状態にどのように接近するかを定量化する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:52:26 GMT)
Estimating The Energy Consumption of Quantum Computing from A Full System Aspect [3.0] 量子コンピューティングのための一階フルシステムエネルギーモデルを提案する。
このモデルは、システムメンテナンスや古典的な処理など、NISQやFTQCに共通するコストを分離する。
NISQエネルギーはQEMサンプリング乗算器に支配されているのに対し、FTQCのコストはコード距離とマジック状態によって設定された物理ビットオーバーヘッドにシフトする。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:37:16 GMT)
Learning Ego-Centric BEV Representations from a Perspective-Privileged View: Cross-View Supervision for Online HD Map Construction [2.9] Cross-View Supervision (CVS) は、幾何学的およびトポロジカルな事前をエゴアラインのオーバーヘッドからカメラベースのBEVエンコーダに転送する表現学習パラダイムである。
CVSは、共有されたBEV機能空間における表現を整合させ、視点に恵まれた教師からエゴ中心のバックボーンにグローバルに一貫した構造的知識を蒸留する。
AID4ADクロスビュー拡張からのエゴアラインな空中画像を用いたnuSceneの実験は、StreamMapNetよりも一貫した改善を示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:55:32 GMT)
Into the Unknown: Accounting for Missing Demographic Data when Mitigating Ad Delivery Skew [2.9] オンライン広告プラットフォームは、アルゴリズムシステムを使用して、広告配信と呼ばれるユーザーに広告をマッチングするプロセスを動かしている。
以前の監査では、広告配信は人口統計学的属性によって歪められることが示されていた。
この過度な配達は、公共サービスを宣伝する広告の文脈で深刻な懸念を提起する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:36:21 GMT)
Adaptive Teacher Exposure for Self-Distillation in LLM Reasoning [2.9] そこで我々は, 自己蒸留を推論するための効果的な新しい軸として, 適応型教師曝露を提案する。
適応型自己蒸留(ATESD)は, 競争力のある自己蒸留とRLベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:15:58 GMT)
What Do You Think I Think? Accounting for Human Beliefs Using Second-Order Theory of Mind [2.9] I-POMDPを2階の心の理論(ToM-2)の枠組みとして使用することにより、エージェントに関する誤った信念の進化をモデル化する能力を持つエージェントを提供する。
エージェントは、対話中にCBHがいつプレイされているかを検出し、それらを考慮に入れたフィードバックを適応的に生成する。
In-person user studyでは、ToM-2学習者が教師のCBHの効果を考慮し、教師の行動の情報性を大幅に向上させる方法を示している。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:49:08 GMT)
Mechanistic Interpretability of ASR models using Sparse Autoencoders [2.8] ディープトランスフォーマーに基づくNLPモデルの内部メカニズムは、大半が謎のままである。
スパースオートエンコーダ(SAE)は、密度の高い表現をスパースベクトルに投影することで、これらのメカニズムを理解するために登場した。
本研究では、トランスフォーマーベースのASRであるWhisperにSAEを適用し、Whisperエンコーダから抽出したフレームレベルの埋め込みに対して、高次元のスパース潜在空間をトレーニングする。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:02:20 GMT)
From Index to Equity: Pre-Training Transformers for Stock Return Prediction [2.8] 本研究は、機械学習を活用して株価予測を改善し、情報投資決定を支援することを目的とする。
株予測のための変圧器モデルについて検討し,事前学習戦略が予測性能に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:18:48 GMT)
Runtime Calibration as State-Trajectory Feedback Control in Quantum-Classical Workflows [2.7] 超伝導デバイスでは、ゲートとリードアウトの忠実度は時間スケールでドリフトし、ランタイムスケジューラはバックエンドの品質を静的に扱う。
固定壁面予算下での状態軌道フィードバック制御問題としてキャリブレーションを定式化する。
フィードバックキャリブレーションを3つの待ち時間体制におけるオープンループベースラインの強化されたファミリーと比較する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:43:45 GMT)
On the Size Complexity and Decidability of First-Order Progression [2.6] 局所効果、正規作用、非循環作用の3つのクラスは、一階の進行を認めている。
合理的な仮定の下では、これらのアクションクラスに対する一階述語進行は、のみ増大することを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:40:45 GMT)
Zeno-Enhanced Probabilistic Error Cancellation with Quantum Error Detection Codes [2.6] 量子エラー検出符号と確率的エラーキャンセルの相補性を利用する。
我々は物理ノイズをより弱い論理チャネルにマッピングし、PECを残留チャネルにのみ適用する。
フィードバックのないQED+PECスキームはクリフォード論理ブロック、安定化器の測定、ポストセレクション、確率的キャンセルをインターリーブする。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:06:27 GMT)
Hypernetworks for Dynamic Feature Selection [2.6] 動的特徴選択(DFS)は、予算制約の下で個々のサンプルに対して順次機能を取得する機械学習フレームワークである。
本稿では,既存のDFS手法の構造的制約について検討し,最適解を求める。
要求に応じてサブセット固有のパラメータを生成するハイパーネットワークベースのDFSアプローチである textscHyper-DFS を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:37:24 GMT)
StereoTales: A Multilingual Framework for Open-Ended Stereotype Discovery in LLMs [2.6] StereoTalesは、オープンエンドLLM生成における社会的バイアスの出現を研究するための多言語データセットと評価パイプラインである。
このデータセットは10の言語と79の社会デコグラフィー属性を含み、23の最近のLCMによって生成された650万以上のストーリーで構成されている。
これらの結果から,1500以上の過剰発現関連因子の同定に統計検査を適用し,ヒトのパネルと同一のLDMを用いて有害性を評価する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:07:26 GMT)
Bidirectional Empowerment of Metamorphic Testing and Large Language Models: A Systematic Survey [2.6] 大規模言語モデル(LLM)は、その生成的、確率的、そしてオープンな性質のために、ソフトウェア品質保証に重大な課題をもたらした。
本調査は,93の初等研究を体系的にレビューし,この相互関係をMTとLLMの双方向のエンパワーメントとして特徴づけるものである。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:47:26 GMT)
Predicting Channel Closures in the Lightning Network with Machine Learning [2.5] 本稿では, チャネルグラフ上の時間的リンク分類タスクとして, 利用可能なゴシップデータからチャネル閉鎖型を予測する問題について検討する。
2年間のLN活動にまたがるデータセットを構築し、さまざまな機械学習アプローチをベンチマークする。
実験の結果, 支配的な予測信号は時間的, 行動的であり, それぞれの終端が最近アクティブになったか, 過去の閉点のノードごとの履歴が明らかとなった。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:12:12 GMT)
High-lift Wing Separation Control via Bayesian Optimization and Deep Reinforcement Learning [2.5] 開ループベイズ最適化(BO)と閉ループ深部強化学習(DRL)の2つの最適化手法が検討されている。
BOは、揚力を維持しながら-9.7%のドラッグリダクションで効率を+10.9%向上させる安定したジェット速度の特定に成功した。
DRLエージェントは、分散センサからの瞬時フロー情報を活用するが、リフトとドラッグの微妙な改善しか達成せず、効率性は無視できない。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:34:46 GMT)
Robust Biomedical Publication Type and Study Design Classification with Knowledge-Guided Perturbations [2.5] 出版型分類器のロバスト性を評価するために,制御された意味摂動に基づく評価フレームワークを提案する。
本稿では,実体マスキングとドメイン・アドリアル・トレーニングを組み合わせたロバストネス指向のトレーニング戦略について検討する。
これらの知見は,出版型および研究設計分類における特徴レベルのロバスト性分析の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:22:26 GMT)
What makes a word hard to learn? Modeling L1 influence on English vocabulary difficulty [2.5] 最初の言語がスペイン語、ドイツ語、中国語である英語学習者に対しては、語彙の難しさをモデル化する。
我々のモデルは、語彙キュリキュラの設計に使用できる解釈可能なL1調整難易度推定を提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:39:47 GMT)
How Useful Is Cross-Domain Generalization for Training LLM Monitors? [2.4] 我々は,複数の分類タスクのトレーニングをそれぞれ独自のプロンプトで行うことで,新たな分類プロンプトによる新しいドメインの性能向上を図っている。
このような訓練は、隣接する領域に部分的に一般化し、トレーニング中に目に見えないタスクの分類性能を向上させる。
分類学習は、学習後の一般的な指導と混在し、(うまくいけば)分類訓練の利点を保ち、一般化失敗を軽減できることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:29:52 GMT)
Human face perception reflects inverse-generative and naturalistic discriminative objectives [2.4] ディープニューラルネットワークは人間の顔知覚に機械的仮説を提供する。
我々は、アーキテクチャを共有する6つのニューラルネットワークモデルを比較したが、異なるタスクで訓練した。
864人の被験者の顔相違判定に対するモデル予測を検証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:06:57 GMT)
Rainbow Deep Q-Learning with Kinematics-Aware Design for Cooperative Delta and 3-RRS Parallel Robot Insertion [2.4] 本稿では,デルタパラレルロボットと3RRSパラレルマニピュレータによる協調ペグ・イン・ホール操作のためのキネマティクス対応深部強化学習フレームワークを提案する。
重要な貢献は、学習に先立つ幾何学的設計最適化段階の統合である。
このフレームワークは高忠実度キネマティックシミュレータで検証される。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:53:28 GMT)
Read, Grep, and Synthesize: Diagnosing Cross-Domain Seed Exposure for LLM Research Ideation [2.4] 我々は、現在のアイデア体系がドメイン間検索を対象とすることや、単に多様なメカニズムへの露出から恩恵を受けるかどうかを問う。
3段階パイプラインであるPaperGymを用いて,この問題について検討する。
合成において、クロスドメイン検索は、非検索および同一ドメインベースラインよりもペアワイズな新規性を得られるが、ランダムな多種多様な制御と有意な違いは示さない。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:58:08 GMT)
When Brains Disagree: Biological Ambiguity Underlies the Challenge of Amyloid PET Synthesis from Structural MRI [2.3] MRIは神経変性を捉え、PETはアミロイドの病態を測定する。
結果として、同様のMRIパターンは異なるアミロイド状態に対応し、あいまいな1対1マッピングを生成する。
アーキテクチャ能力よりもデータ分散の曖昧さが性能を制約していることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:47:44 GMT)
Heterogeneous SoC Integrating an Open-Source Recurrent SNN Accelerator for Neuromorphic Edge Computing on FPGA [2.3] デジタルニューロモルフィックハードウェアの普及は、シリコンテープが回路から生み出す禁断のコストによって減速する。
本稿では、リカレントSNNアクセラレータReckOnの動作を従来のプロセッサと統合して管理する異種System-on-Chip(SoC)を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:55:21 GMT)
On What We Can Learn from Low-Resolution Data [2.3] 小型のウェアラブルデバイスは、高解像度データの保存と送信に必要な帯域幅やエネルギー容量が不足している可能性がある。
その結果、異なるソースから収集されたデータセットは、高解像度と低解像度のサンプルの混合からなり得る。
我々は,データポイントの影響が分解能によってどのように変化するかを特徴付ける,Kulback-Leiblerの発散に基づく理論的解析を行う。
我々は、視覚変換器と畳み込みニューラルネットワークの両方を用いて、トレーニングセットに低解像度のデータを追加することで、高解像度データが不足している場合に、一貫して性能を改善することを実証的に実証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:16:05 GMT)
100,000+ Movie Reviews from Kazakhstan: Russian, Kazakh, and Code-Switched Texts [2.3] 我々は、Kino.kzから集められたカザフスタンの映画レビュー100,502件の新しい公開コーパスを提示する。
データセットは多言語で、主にカザフスタンのレビューとコード変更されたテキストで構成されている。
3方向の極性分類と5クラススコア分類という2つの感情タスクを定義し、マルチリンガルトランスフォーマーモデルに対する古典的なBoW/TF-IDFベースラインをベンチマークする。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:18:44 GMT)
Dynamic Transaction Scheduling and Pricing in the Ethereum Mempool [2.2] ヘテロジニアスサイズのトランザクションが時間とともに到着し、スケジュールまでメムプールに留まる動的トランザクションスケジューリング問題について検討する。
本結果は,長期割引報酬を最大化しつつ,動的価格設定がメムプールを安定化させることを示す。
特に、オーバーシュートペナルティは増加し、平均的なスケジュールされたトランザクションボリュームはターゲットブロック容量に収束し、その結果のNPG更新はEIP-1559価格更新ルールに類似する。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:20:29 GMT)
Multi-Quantile Regression for Extreme Precipitation Downscaling [2.2] 降水量減少のための深い超解像ネットワークは、強いバルクスキルを達成できるが、体系的には洪水のリスクを引き起こすヘビーテールイベントを過小評価する。
主な障害は損失関数であり、データではないことを実証する。
ピンボール損失を0.50,0.95,0.99,0.999でトレーニングしたマルチ量子超解像ネットワークQ-SRDRNでこれを解決する。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:17:26 GMT)
Multi-market value-stacking: Battery control for combined imbalance participation and non-uniform FCR bidding [2.2] 非均一なFCR入札を導入した欧州文脈のための2段階制御フレームワークを提案する。
第1段階では,データ駆動型モンテカルロ(MC)最適化を用いた時変入札列を導出する。
第2段階では、Deep Reinforcement Learning (DRL) エージェントが、リアルタイム不均衡取引の残余の柔軟性を活用する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:32:11 GMT)
Agentic Interpretation: Lattice-Structured Evidence for LLM-Based Program Analysis [2.2] 本稿では,格子に基づく静的解析の原理をプログラム推論に適用するフレームワークであるエージェント解釈を提案する。
ワークリストアルゴリズムは、分析中にクレームとその判断がどのように進化するかを決定する。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:46:24 GMT)
Priority-Driven Control and Communication in Decentralized Multi-Agent Systems via Reinforcement Learning [2.2] イベントトリガー制御は、ネットワーク化されたマルチエージェントシステムにおける制約付き通信帯域の過剰使用を回避するメカニズムを提供する。
本研究では,データから通信優先度と制御ポリシーを協調的に学習するモデルフリーで優先度駆動型強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:11:47 GMT)
ConRetroBert: EMA Stabilized Dual Encoders for Template-Based Single-Step Retrosynthesis [2.2] 単一段階の逆合成は、明示的な反応テンプレートを選択して適用することによって反応物を予測する。
ConRetroBertは、テンプレートベースのレトロシンセシスを高密度な製品テンプレート検索として再編成するデュアルエンコーダフレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:40:22 GMT)
Agent-Based Post-Hoc Correction of Agricultural Yield Forecasts [2.1] 本稿では,既存のモデル予測のポストホック補正を行う構造化LLMフレームワークを提案する。
XGBoostはMAEを20%減らし,MASEを56%減らした。
LLaVA 13Bは不整合ゲインを示し、精製モデルの選択に対する感度を強調した。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:41:54 GMT)
Breaking Global Self-Attention Bottlenecks in Transformer-based Spiking Neural Networks with Local Structure-Aware Self-Attention [2.1] Spiking Neural Networks (SNN)は、SNNとグローバルな自己注意を統合している。
既存のTransformerベースのSNNには2つの基本的な制限がある。
局所構造対応スパイキング変換器(LSFormer)の開発
論文参考訳(メタデータ) (Tue, 12 May 2026 02:08:08 GMT)
Fine-Grained Benchmark Generation for Comprehensive Evaluation of Foundation Models [2.1] 自動ベンチマーク生成のためのフレームワークを導入する。
機械学習、コーポレートファイナンス、パーソナリティファイナンスで3つのベンチマークを生成します。
間もなくフレームワークとキュレートされたベンチマークをオープンソースにします。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:01:58 GMT)
OverNaN: NaN-Aware Oversampling for Imbalanced Learning with Meaningful Missingness [2.0] OverNaNは軽量でNaN対応のオーバーサンプリングフレームワークで、不足構造を消去することなくクラス不均衡に対処するように設計されている。
本稿では,不均衡な学習,データハンドリング,NaN耐性アルゴリズムといった広い視野にOverNaNを配置する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:50:04 GMT)
Loss-induced quantum nonreciprocity and entanglement in superconducting qubits [2.0] 超伝導プラットフォームにおける非相互性と非相互絡み合いを実現するための損失誘起スキームを提案する。
本結果は, 量子情報処理における工学的損失と非相互絡み合いの直接的な関連性を確立するものである。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:14:35 GMT)
TOPPO: Rethinking PPO for Multi-Task Reinforcement Learning with Critic Balancing [2.0] タスク間の勾配条件付けと学習のバランスを改善するモジュールセットであるTOPPOを提案する。
TOPPOは、公表されたSACファミリーやARSファミリーのベースラインよりも、平均とテールタスクのパフォーマンスが向上する。
提案手法は, 適切な最適化により, MTRLの法外アプローチに対抗し, 越えることが可能であることを実証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:40:28 GMT)
Project Life Cycles in Open-Source Software [1.9] 本稿では,オープンソースプロジェクトのプロジェクトライフサイクルを通じて,開発者の関与をモデル化する。
このモデルは、オープンソースプロジェクトの生涯生産価値を推定するのをサポートする開発者エンゲージメントと成長の生涯予測を生成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:43:39 GMT)
Attention Sinks in Diffusion Transformers: A Causal Analysis [1.9] テキスト・画像拡散における因果解析について述べる。
我々は,時間経過毎に主観的注意を抽出し,ペアによる無訓練介入によって抑制する。
抑制によって引き起こされる知覚の変化は、いずれにせよ、Emphsink固有の -- $sim!6times$等予算のランダムマスクよりも大きい。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:49:31 GMT)
Human-AI Productivity Paradoxes: Modeling the Interplay of Skill, Effort, and AI Assistance [1.9] 本稿では,AIが生産性に影響を及ぼすいくつかのメカニズムをよりよく理解し,分析するために,人間-AIインタラクションのモデルを提案する。
我々の設定では、スキルレベルの異なる人間エージェントは、AI支援によって特定のタスク結果を生成するために、有効性を最大化する努力を行う。
スキル開発に内在性を導入するか、AIの信頼性が低いかは、生産性のパラドックスを引き起こす可能性がある。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:12:27 GMT)
Pretraining Strategies and Scaling for ECG Foundation Models: A Systematic Study [1.9] 本研究は心電図(ECG)データの基礎モデルに焦点をあてる。
本稿では,ECG基礎モデルに対する5つの異なるコントラスト的・非コントラスト的自己教師型学習目標を網羅した事前学習手法の総合評価を行う。
本研究は,データセットのサイズを事前学習することで,公開ソースから最大1100万の入力サンプルを抽出する手法である。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:10:15 GMT)
Social Theory Should Be a Structural Prior for Agentic AI: A Formal Framework for Multi-Agent Social Systems [1.8] マルチエージェント社会システム(英: Multi-Agent Social Systems、MASS)は、エージェントが相互作用し、システムレベルの結果を生成するためのフレームワークである。
このポジションペーパーでは、エージェントAIシステムは構造的先行として社会理論でモデル化されなければならないと論じている。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:22:59 GMT)
A QPINN Framework with Quantum Trainable Embeddings for the Lid-Driven Cavity Problem [1.8] 本稿では,量子ニューラルネットワーク(QNN)を用いた量子物理学情報ニューラルネットワーク(QPINN)フレームワークを提案する。
提案手法はQNNを用いて,空間座標を可変量子回路で処理する前に符号化するデータ適応型量子特徴写像を学習する。
数値実験により,提案したQNN-TE-QPINNは,古典的なPINNやハイブリッド量子モデルと比較して,安定したトレーニング行動と競合解の精度を示すことが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:03:45 GMT)
Programmable Superradiance in an Interacting Qubit Array [1.8] 量子放射体は共通の電磁環境に結合し、その集団放射動力学の干渉によって超放射能とサブ放射能が生じる。
ここでは, 集団散逸を媒介するマイクロ波導波路に結合した超伝導量子ビットアレイを実現する。
本研究は、多体量子光学における集合現象の探索と、ロバストな量子情報処理への駆動散逸アプローチのためのフレキシブルなプラットフォームを構築した。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:36:45 GMT)
Entangling Superconducting Qubits via Energy-Selective Local Reservoirs [1.8] 設計したポンプと損失が共通の散逸モードを共有し、貯水池を介する干渉と古典的に相関した定常状態をもたらす構成を数値的に研究する。
本研究は,超伝導回路における多体状態の分散化と制御のための,スケーラブルでハードウェア効率の良いフレームワークを実証するものである。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:27:22 GMT)
AI CFD Scientist: Toward Open-Ended Computational Fluid Dynamics Discovery with Physics-Aware AI Agents [1.8] 我々は、計算流体力学のためのオープンソースのAI科学者であるAI CFD Scientistを紹介する。
文献に基づくアイデア、検証された実行、視覚に基づく物理検証、ソースコードの修正、図形による記述を単一の検査可能なワークフローで行うのは、これが初めてである。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:57:53 GMT)
Single-Shot HDR Recovery via a Video Diffusion Prior [1.7] 単一ショットHDR再構成を条件付きビデオ生成として再キャストし,生成したフレームをHDR画像に融合する。
いくつかの再現指標において、モデルキャパシティと同等のモデルキャパシティで、最先端のジェネレーティブベースラインを上回ります。
この入力条件付きシーケンス生成および融合フレームワークは、HDRを超えて他の画像再構成タスクに拡張する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:54:52 GMT)
Emotional Expression in Low-Degrees-of-Freedom Robots: Assessing Perception with Reachy Mini [1.7] 本研究では,低自由度ロボットReachy Miniによる感情表現の知覚について検討した。
感情認識は概して穏やかで、怒り、悲しみ、関心が愛、喜び、恥、嫌悪といった感情よりも確実に認識された。
これらの結果は、制約されたロボット表現でさえ感情的な意味を伝達し、社会的印象に影響を与えることを示唆している。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:01:41 GMT)
From Data Lifting to Continuous Risk Estimation: A Process-Aware Pipeline for Predictive Monitoring of Clinical Pathways [1.7] 本稿では,臨床経過の予測のための再現性とプロセス対応パイプラインを提案する。
このフレームワークは、ICUの入院を予測対象として、新型コロナウイルスの臨床経路で評価される。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:20:34 GMT)
Resilient Vision-Tabular Multimodal Learning under Modality Missingness [1.7] マルチモーダルディープラーニングは医療応用において大きな可能性を秘めている。
既存のアプローチの多くは、完全にモダリティの可用性を暗黙的に仮定している。
共同視覚・タブラリ学習のためのマルチモーダルトランスフォーマーフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:14:13 GMT)
SmellBench: Evaluating LLM Agents on Architectural Code Smell Repair [1.7] アーキテクチャコードはソフトウェアの保守性を損なうため、手作業で修理するのにコストがかかる。
本稿では,大規模言語モデルエージェントによる建築コードの臭いの修復に関する経験的評価について述べる。
SmellBenchは、嗅覚タイプ固有の最適化プロンプトを組み込んだタスクオーケストレーションフレームワークです。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:50:41 GMT)
Detecting overfitting in Neural Networks during long-horizon grokking using Random Matrix Theory [1.7] 本稿では,列車やテストデータにアクセスせずに,深層学習モデルの過度適合を検知するランダム行列理論を提案する。
ロングホライゾングルーキングの「アンチ・グロキング」フェーズと呼ばれるオーバーフィッティングの開始時、相関トラップは数と規模で成長し成長する。
以上の結果から, 抗農薬は, 高い列車精度と試験精度の低下をともなう追加グルーキングフェーズであり, 相関トラップによる前グルーキングとは構造的に異なることが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:57:48 GMT)
User Reviews as a Source for Usability Requirements: A Precursor Study on Using Large Language Models [1.6] 本稿では,3種類のアプリのユーザビリティ関連側面を含む300のユーザレビューのデータセットを提供する。
また、ユーザレビューの理解におけるLLMのパフォーマンスが、人間のレーダのパフォーマンスに匹敵するかどうかも分析する。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:05:04 GMT)
The Illusion of Power Capping in LLM Decode: A Phase-Aware Energy Characterisation Across Attention Architectures [1.6] パワーキャッピングはLLMの標準のGPUエネルギーレバーである。
自動回帰復号化(autoregressive decode)という,生産サービスを支配しているフェーズに対して,その外観が視覚的であることを示す。
アーキテクチャに依存した3つのDVFS行動クラスを同定し、新しい注意代替品間の共通エネルギーパターンを特徴付ける。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:48:16 GMT)
Fine-Tuning Models for Automated Code Review Feedback [1.6] オープンなLLMコードラマによって生成されたフィードバックの質を適応・向上するために,パラメータ効率のよい微調整(PEFT)とプロンプトエンジニアリングが利用できるかを検討する。
その結果,PEFTはフィードバック品質が著しく向上し,工学的にも優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:02:04 GMT)
Intrinsic Vicarious Conditioning for Deep Reinforcement Learning [1.5] 直接条件付けは、エージェントが環境や他者からどのように学習するかを制限することによって、エージェントの能力を制限する。
オフ・ポリティクスや学習・バイ・サンプル・メソッドはデモ参加者の表現から学ぶことができるが、エージェントのポリシーや報酬関数にアクセスする必要がある。
本研究は,本質的な報酬機構としてビカリアス条件付けを導入することで,この直接的なサンプリング制限を克服する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:01:37 GMT)
Symmetry in the Wild: The Role of Equivariance in Neural Fluid Surrogates [1.5] ニューラルサロゲートは計算流体力学(CFD)シミュレーションのオーダー・オブ・マグニチュード・アクセラレーションを可能にする。
群同変アーキテクチャはそのようなバイアスを導入するための原則化された方法であるが、学習問題自体が対称性を破るときに有害となることがある。
本稿では,拡張性と対称性の保存を両立させるニューラルネットワークであるAnchored-Branched Geometric Algebra Transformer (AB-GATr)を紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:47:33 GMT)
Correlations Between Quantum Battery Capacity and Quantum Resources for Two-qubit System [1.5] 2量子系における量子電池容量と量子資源の関係について検討する。
電池容量は、量子絡み合い、ステアリング、ベル非局所性、コヒーレンスにより単調に減少し、これらの4つの量子資源が消滅するとピークとなる。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:42:32 GMT)
SEMIR: Semantic Minor-Induced Representation Learning on Graphs for Visual Segmentation [1.5] SEMIR(Semantic Minor-induced Representation Learning)は,ネイティブグリッドから推論を分離する表現フレームワークである。
SEMIRは、下層のグリッドグラフを、パラメータ化されたエッジの収縮、ノードの削除、エッジの削除によって、コンパクトで境界に沿ったグラフに変換する。
我々は、SEMIRをBraTS 2021、KiTS23、LiTSの3つの腫瘍セグメンテーションデータセットでベンチマークした。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:52:02 GMT)
ACTING: A Platform for Cyber Ranges Federation [1.5] Exercise Description Language - First Generation (EDL-FG)は、サイバーレンジトレーニングサービスと演習を公式に記述するための構造化言語である。
第2に、ACINGプラットフォームは自動PEとスコアリング機構を導入し、トレーニング中のトレーニング担当者の行動を評価する。
第三に、このプラットフォームは民間と軍事の運用状況を組み合わせたマルチドメインサイバートレーニングシナリオを可能にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:17:23 GMT)
Phylogenetic Tree Inference with Tropical Axial Attention [1.4] 我々は、バニラソフトマックスドット積の注意を最大余剰演算子に置き換える熱帯軸性注意神経推論アーキテクチャを導入する。
多種の配列アライメントから、我々のモデルは全ての可能なペアワイズ距離を学習する。
熱帯の注意が系統的推論の自然な幾何学的枠組みであることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:54:37 GMT)
A Barrier-Metric First-Order Method for Linearly Constrained Bilevel Optimization [1.4] 固定された多面体下実現可能性集合を用いた双レベル最適化について検討した。
アクティブセットの変更は、上位の目的を非滑らかにすることができる。
既存の過次法は、典型的には低いヘッセン逆数や等価線型解を必要とする。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:44:08 GMT)
Quantum teleportation with coherent error in Bell-state measurement [1.4] 共同計測の絡み合いがテレポーテーション性能をどのように決定するかを解析的に示す。
本稿では,部分的に絡み合った関節測定によって課される制約を克服し,単位テレポーテーションの忠実度を回復する戦略を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:53:19 GMT)
Attention-Based Multimodal Survival Prediction with Cross-Modal Bilinear Fusion [1.4] 患者レベル生存予測のための新しいディープラーニングフレームワークを提案する。
全スライディング組織学の特徴、RNA-seq発現プロファイル、臨床変数を統合している。
我々のアーキテクチャは、スライドレベルの表現のためのAMMILモジュールciteilse2018アテンションと、RNAおよび臨床データのためのフィードフォワードエンコーダを組み合わせたものである。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:09:25 GMT)
WildRelight: A Real-World Benchmark and Physics-Guided Adaptation for Single-Image Relighting [1.4] WildRelightは、単一イメージのリライトモデルを評価するために特別に作成された、最初のWildデータセットです。
このデータセットにより、合成モデルが実世界の統計とリアルタイムで一致し、難解なsim-to-real課題を抽出可能な自己管理タスクに変換できることが示される。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:53:27 GMT)
Spectral Energy Centroid: a Metric for Improving Performance and Analyzing Spectral Bias in Implicit Neural Representations [1.4] 多層パーセプトロン(MLP)を用いたインプシットニューラル表現(INR)モデル連続信号
SECはINR分析の汎用ツールであり、3つのタスクにまたがってその実用性を実証している。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:16:48 GMT)
Optimization in Sparse 2D to Dense 3D Weakly Supervised Learning: Application to Multi-Label Segmentation of Large ex vivo MRI Data [1.4] 高分解能体外MRIの完全な3Dセグメント化は、容積アノテーションの禁止コストによって制限される。
我々は高分解能外脊髄MRIのマルチクラス分割のための分岐正則化の必要性を解析した。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:06:53 GMT)
Metaphor Is Not All Attention Needs [1.4] 大規模な言語モデルは、有害な命令に抵抗する能力が不可欠である安全クリティカルなアプリケーションにますますデプロイされている。
近年のエビデンスでは、詩的な変換のようなスタイル的な改革は、いまだに警告効果のある安全メカニズムを回避可能であることが示されている。
それらの効果は、特定の詩的装置、文学的フォーマットの認識に失敗したこと、あるいはモデルがどのようにスタイリスティックに不規則なプロンプトを処理したかに左右されるかを検討する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:50:26 GMT)
UTS at PsyDefDetect: Multi-Agent Councils and Absence-Based Reasoning for Defense Mechanism Classification [1.3] 本稿では,感情支援対話における心理的防衛機構の分類システムについて述べる。
中心的な洞察は、防御メカニズムが欠落しているものによって定義されることである。
我々はこれを、最も大きな単一利得を考慮に入れた、即効レベルの臨床規則における感情認知統合スペクトルとしてエンコードする。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:40:42 GMT)
Quantum Adversarial Machine Learning: From Classical Adaptations to Quantum-Native Methods [1.3] 逆機械学習は、堅牢な機械学習モデルを構築するための脆弱性を研究する。
本稿では、量子敵機械学習の概要と、既存の攻撃と対策について概説する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:41:20 GMT)
Cochise: A Reference Harness for Autonomous Penetration Testing [1.3] 自動貫入試験のための597 LOC Pythonリファレンスハーネスであるcochiseを提案する。
Cochiseは、LSM駆動エージェントをSSH上のLinuxホストに接続し、制御されたターゲット環境をサポートする。
リプレイと分析ツール: (i)コチス・リプレイ, (ii)コチス・アナライゼログ, コチス・アナライゼ-グラフ, コスト, トークン持続時間, 妥協解析。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:28:12 GMT)
Drop the Act: Probe-Filtered RL for Faithful Chain-of-Thought Reasoning [1.3] モデル推論は、社内ですでに約束している答えを合理化します。
ProFILは、コミット後の劇場を**11--100%*で減らし、忠実な違反を引き起こす(例えば、独立のクロード3.7ソンネット判事の下でLiveCodeBenchで+24pp)。
ProFILはまた、一致した長さのペナルティGRPOベースラインを破り、チェイン圧縮よりもセマンティックなコミットメント検出としてゲインを分離する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:30:23 GMT)
A Five-Layer MLOps Architecture for Connected Automated Driving [1.3] 自動走行システム(ADS)の安全性と性能の継続的な保証は重要な課題である。
ADSの人間ドライバーに対するアドバンテージは、データを集合的に収集する能力の向上である。
本稿では,ADSのための集合学習型MLOpsプロセスのための5層アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:26:55 GMT)
Improving Diffusion Posterior Samplers with Lagged Temporal Corrections for Image Restoration [1.3] 拡散法に基づく後方サンプリング(PS)は、逆問題の画像化における主要なフレームワークである。
PSは、逆ダイナミクスにおける時間的変動を誘発する即時的なデータ一貫性の推定に依存している。
第二次更新とPS手法を特徴付ける残差補正を組み合わせたLAMPを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:38:36 GMT)
Macro-Action Based Multi-Agent Instruction Following through Value Cancellation [1.3] 命令コンプライアンスのためのマクロアクション値補正(MAVIC)を提案する。
MAVICは、入力された命令対象を補正し、現在の目的の下で継続値を復元することで、命令境界でのベルマンバックアップを修正する。
複雑化する協調型マルチエージェント環境において,MAVICは基本タスク性能を保ちながら高い命令コンプライアンスを実現する。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:01:16 GMT)
ScriptHOI: Learning Scripted State Transitions for Open-Vocabulary Human-Object Interaction Detection [1.3] オープン・ボキャブラリ・ヒューマン・オブジェクト・インタラクション(HOI)検出は、トレーニング中にカテゴリとして現れないインタラクション・フレーズを認識する必要がある。
近年の視覚言語HOI検出器は、人間の物体の特徴とテキスト埋め込みをマッチングすることで意味伝達を改善する。
本稿では,各インタラクションフレーズをソフトスクリプト状態遷移として表現する構造化フレームワークScriptHOIを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:15:13 GMT)
Pitfalls of Unlabeled Disagreement-Based Drift Detection in Streaming Tree Ensembles [1.3] 不一致に基づく不確実性は、ニューラルネットワークにおいて有望であることを示しているが、インクリメンタル決定木(IDT)のアンサンブルへの適応は、まだほとんど探索されていない。
本手法は,アンサンブルメンバーのラベルフリップによるバッチ特異的不一致対策を構築することで検討する。
本手法は多層パーセプトロン (MLP) のアンサンブルにおいてよく機能するが, IDT に適用した場合の損失検出性能は一貫して劣っている。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:53:03 GMT)
Diabetic Retinopathy Classification using Downscaling Algorithms and Deep Learning [1.3] 糖尿病網膜症(英: Diabetic Retinopathy、DR)は、糖尿病患者の網膜像を記録・分類する技術である。
DR分類では、糖尿病の重症度に基づいて網膜基底像を5段階に分類する。
DR分類問題に対処する上で直面する大きな問題の1つは、画像のサイズが大きく変化することである。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:30:43 GMT)
Improving the Performance and Learning Stability of Parallelizable RNNs Designed for Ultra-Low Power Applications [1.2] Bistable Memory Recurrent Unit (BMRU) は、超低消費電力RNNのハードウェアとソフトウェアの共同設計を可能にするために導入された。
BMRUパフォーマンスは複雑なシーケンシャルタスクにおいて並列化可能なRNNよりも遅れている。
本稿では,永続記憶を保ちながらフローを復元し,時間経過とともにスキップ接続を生成する累積更新定式化を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:39:33 GMT)
Reimagining Assessment in the Age of Generative AI: Lessons from Open-Book Exams with ChatGPT [1.2] ChatGPTのような生成AIシステムは、学生がリアルタイムで説明、コード、ソリューションを生成できるようにすることで、学術的評価に関する従来の仮定に挑戦する。
この研究は、AIの使用を制限するのではなく、学生が正式な評価中に実際にそのようなシステムとどのように相互作用するかを調査する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:33:33 GMT)
Classic and Quantum Task-Based Intelligent Runtime for QIRs Running on Multiple QPUs [1.2] 本稿では,Intelligent RuntIme System (IRIS)スケジューラをQuantum Intermediate Representation Execution Engine (QIR-EE)を通じて量子プログラミングスタックにマージする,インテリジェントなタスクベースランタイムを提案する。
我々の設計では、量子中間表現(QIR)で記述されたプログラムを、複数の量子シミュレータや新しい量子プロセッサを含む様々なバックエンドに並列に送信することができ、単一のノード上で真のハイブリッド実行を可能にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:14:13 GMT)
Non-asymptotic quantisation of spherically symmetric distributions [1.2] ザドールの有名な定理は最適な量子化の基礎である。
適半径$r$の球面上に均一に分布する適度な$n$ランダム量子化器では、例外的な性能が得られることを示す。
特に$n$が$d$でスケールするシナリオでは、$r$の近似を導出します。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:01:41 GMT)
Autonomy and Agency in Agentic AI: Architectural Tactics for Regulated Contexts [1.2] この研究は、両次元を5つの運用レベルに編成する2次元設計空間を導入する。
自律性は人体操作(L1)から完全自律監視(L5)まで様々である。
我々は、チェックポイント、エスカレーション、マルチエージェントデリゲート、ツールプロビジョニング、ツールフェンシング、書き込みステージングの6つのアーキテクチャ戦略を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:20:30 GMT)
Inference-Time Machine Unlearning via Gated Activation Redirection [1.2] ゲーテッド・アクティベーション・リダイレクト(GUARD-IT)による推論時間学習の導入
GUARD-ITは入力依存のアクティベーションステアリングを推論時に解き放ち、モデルの重みはそのまま残す。
TOFUとMUSEの実験では、GUARD-ITは3つのモデルスケールで12の勾配ベースラインと一致するか、あるいは超えている。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:26:25 GMT)
Enabling AI-Native Mobility in 6G: A Real-World Dataset for Handover, Beam Management, and Timing Advance [1.2] この研究は、様々なモビリティのモードにわたって商用にデプロイされたネットワークから収集されたデータセットを提示する。
HO中断時間を短縮することを目的として、ハンドオーバ(HO)シナリオに注力する。
この研究を支援するために、データセットには様々なシグナリングイベントのタイミング(TA)測定が含まれている。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:43:49 GMT)
A Family of Quaternion-Valued Differential Evolution Algorithms for Numerical Function Optimization [1.1] 四元数空間で直接動作する新しい四元数値微分進化(QDE)アルゴリズムのファミリーを紹介する。
その結果,QDE 変種は複数の関数クラスにおいてより高速な収束と優れた性能を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:32:50 GMT)
When to Trust Confidence Thresholding: Calibration Diagnostics for Pseudo-Labelled Regression [1.1] 標準的なプラクティスは、信頼性カットオフで校正されたスコアをしきい値にし、ハードラベルを真実として扱うことである。
疑似ラベリングパイプラインのためのキャリブレーション対応診断装置を開発した。
我々は、下流回帰係数において信頼しきい値が誘導する減衰バイアスの閉形式式を導出する。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:49:11 GMT)
Probing charge noise in bilayer graphene quantum dots by Landau-Zener-Stückelberg-Majorana spectroscopy [1.1] 電荷ノイズは固体デバイスにおけるクォービットのコヒーレンスと緩和を制限する重要な要因である。
二層グラフェン(BLG)量子ドットでは、電荷ノイズの起源と大きさは明らかにされていない。
5GHzから10GHzの周波数でBLG二重量子ドット上に形成された単一粒子電荷量子ビットについて検討した。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:26:22 GMT)
ReproBreak: A Dataset of Reproducible Web Locator Breaks [1.1] 再現可能なロケータのデータセットであるReproBreakをWebアプリケーションGUIテストで紹介する。
我々は359のオープンソースリポジトリを分析し、ロケータの変更を含むコミットを特定した。
これらの変更が実際にロケータの障害であるかどうかを確認するため、最も多くのロケータが変更されたトップ4プロジェクトにおいて、これらの変更を再現した。
ReproBreakは、ロケータの脆弱性、修復技術、テストの堅牢性の研究を支援する貴重な成果物だと考えています。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:09:38 GMT)
Low-Rank Adapters Initialization via Gradient Surgery for Continual Learning [1.1] 連続学習におけるLoRAアダプタの初期化であるSLICEを提案する。
バニラLoRA、LoRA-GA、LoRAMと比較すると、SLICEは安定性と可塑性のトレードオフを継続的に達成し、平均パフォーマンス、最終的なパフォーマンス、および測定基準を改善している。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:06:03 GMT)
From Image Hashing to Scene Change Detection [1.1] HashSCDは、効率的なグローバルな変更検出とローカライズされた変更識別の両方を可能にするパッチワイズハッシュフレームワークである。
実験により,HashSCDは最先端の教師なしハッシュ法やシーン変化検出法と比較して,競争性能が向上することが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:28:13 GMT)
Refresh-Scaling the Memory of Balanced Adam [1.1] バランスの取れたAdamでは、$は無次元定数として扱われるべきではない。
我々は、Adamがトレーニングの有用な段階で内部統計を更新する回数を計測するリフレッシュカウント$R_= (1-)T_mathrmES$について検討する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:05:18 GMT)
Hardware-Software Co-Design of Scalable, Energy-Efficient Analog Recurrent Computations [1.1] 環境センサーからバイオメディカルインプラントまで、常にAIアプリケーションは、超低消費電力を必要とする。
アナログ回路はサブマイクロワット推論の経路を提供するが、既存のアナログ実装はフィードフォワードアーキテクチャに限られている。
この障壁は、ハードウェアとソフトウェアの共同設計によって克服可能であることを実証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:44:32 GMT)
OOM-Free Alpamayo via CPU-GPU Memory Swapping for Vision-Language-Action Models [1.1] 自律運転のためのビジョンランゲージ・アクション(VLA)モデルは、単一ニューラルネットワークにおける知覚、推論、制御を統一する。
本稿では,VRAM制約付きGPU上でメモリ効率のよいVLA推論を実現するフレームワークを提案する。
私たちの作業は、完全なBF16精度を維持しながら、Accelerateのオフロードよりも最大3.55倍のスピードアップを実現しています。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:37:10 GMT)
Does Your Neural Network Extrapolate? Feature Engineering as Identifiability Bias for OOD Generalization [1.1] ディープニューラルネットワークが成功すると、データの健全な特徴が見つかる。
In-distriion (ID)トレーニングウィンドウからOOD(out-of-distriion)関連表現をいつ、なぜ学習しないのかを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:48:15 GMT)
Experimental Examination of Secure Two-Party Controller Computation [1.1] シークレット共有による動的コントローラ実行のための2要素計算プロトコルが提案されている。
このプロトコルは、コントローラ状態復号化、コントローラ状態復号化、入力再復号化なしに、動的コントローラを無限時間動作させることができる。
本研究では,逆振り子テストベッドを用いた商用クラウドプラットフォームの実装を通じて,プロトコルの実現可能性を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:54:41 GMT)
Breaking the Dependency Chaos: A Constraint-Driven Python Dependency Resolution Strategy with Selective LLM Imputation [1.1] 依存性の解決は、コンフリクトなしで一緒にインストールできるパッケージバージョンを選択するタスクである。
LLMMのような最近の研究は、Pythonとパッケージバージョンをコードから推論するために大きな言語モデルを使用することでこの問題に対処している。
SMT-LLMは,形式的制約解で推定するバージョンを置き換えたハイブリッドシステムである。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:42:37 GMT)
gym-invmgmt: An Open Benchmarking Framework for Inventory Management Methods [1.1] Gym-invmgmtは、監査可能なクロスパラダイム評価のためのOR-Gymインベントリ管理系統の拡張である。
Gymnasium互換のOR-Gymインベントリ管理系統であるGimmom-invmgmtを聴覚的クロスパラダイム評価のために提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:22:15 GMT)
The Algorithmic Caricature: Auditing LLM-Generated Political Discourse Across Crisis Events [1.1] 9つの危機イベントにまたがって1,789,406件のコーパスを構築した。
各事象について、同じ文脈で生成された合成談話と、社会的プラットフォームからの観察された談話を比較した。
イベント全体を通じて、合成談話は流動的であるが、人口レベルでは非現実的である。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:42:03 GMT)
OUI as a Structural Observable: Towards an Activation-Centric View of Neural Network Training [1.1] 我々は、OUI(Underfitting Indicator)が、その内部構造を初めて観測可能なものとして理解されるべきである、と論じる。
OUIは、ネットワークが貧弱あるいは有望なトレーニング体制に入るかどうかを明らかにする、ラベルなしの、アクティベーションベースの早期信号として一貫して現れている。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:59:13 GMT)
FedOUI: OUI-Guided Client Weighting for Federated Aggregation [1.1] フェデレーション学習は通常、データセットのサイズや勾配レベルの基準を使用して、クライアント更新を集約する。
我々は,OUI(Overfitting-Underfitting Indicator)に基づくシンプルなアグリゲーションルールであるFedOUIを紹介した。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:59:23 GMT)
The Misattribution Gap: When Memory Poisoning Looks Like Model Failure in Agentic AI Systems [1.0] EmphSemantic Norm Drift (SND) をエージェント不正行為の第3の経路として定式化する。
SNDでは、ポリシーフォーマットの文書が通常のアップロードを通じて共有ベクターストアに入り、その後、信頼されたシステムコンテキストとして再現れる。
偽合成検査は87.5%の精度と偽陽性のゼロの因果関係を識別する。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:21:47 GMT)
ShapeCodeBench: A Renewable Benchmark for Perception-to-Program Reconstruction of Synthetic Shape Scenes [1.0] ShapeCodeBenchは、認識からプログラムへの再構築のための総合ベンチマークである。
我々は,空のプログラムフロア,古典的コンピュータビジョン評価器,Opus 4.7を高精細度,高精細度,高精細度でGPT-5.5を評価する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:39:00 GMT)
EHR-RAGp: Retrieval-Augmented Prototype-Guided Foundation Model for Electronic Health Records [1.0] EHRは、豊富な縦断的な患者情報を含み、予測モデリングの応用に広く利用されている。
EHR-RAGpは,多種多様な臨床イベントタイプにまたがって,最も関連性の高い患者履歴を動的に統合する基盤モデルである。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:17:03 GMT)
A Causal Language Modeling Detour Improves Encoder Continued Pretraining [1.0] 因果言語モデリング(CLM)に一時的に切り替えると、短い減衰で下流の性能が向上することを示す。
現代英語のバイオメディカルテキストでは、このCLMは同一のデータで優れ、8つのフランス語と11のバイオメディカルタスクで計算される。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:34:00 GMT)
Targeted Tests for LLM Reasoning: An Audit-Constrained Protocol [1.0] 対象推論評価のための監査制約付きプロトコルを提案する。
楽譜に基づく決定型サンプリングであるCAPS(Component Prompt Smpling)をプロンプトコンポーネント上でインスタンス化し、等予算の均一なコンポーネントサンプリングと比較する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:26:22 GMT)
FastUMAP: Scalable Dimensionality Reduction via Bipartite Landmark Sampling [1.0] FastUMAPはスパースポイントランドマークファジィグラフを構築し、誘導されたランドマーク親和性からNystromスペクトルウォームスタートを計算し、UMAPスタイルの目的で全てのサンプル座標を洗練する。
9つのベンチマークデータセットが178から70,000のサンプルにまたがる場合、FastUMAPはデフォルト実装比較で報告された7つのデータセットで最低のランタイムを持つ。
FastUMAPは、精度優先のメソッドの代替としてではなく、反復的な探索的な埋め込みのための高速なオプションとして最もよく考えられている。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:26:59 GMT)
A Controlled Counterexample to Strong Proxy-Based Explanations of OOD Performance: in a Fixed Pretraining-and-Probing Setup [1.0] タスクに依存しない構造プロキシは、ある事前学習コーパスが他のコーパスよりも優れている理由を解釈するためにしばしば使用される。
我々は,この要件を,学習構造の計算的有界概念に動機づけられた,定型事前学習・探索設定で検証する。
総合的な学習構造のためのプロキシは、制御された設定であっても、OODパフォーマンスを駆動するタスク関連構造を追跡することができません。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:36:46 GMT)
Grid-Orch: An LLM-Powered Orchestrator for Distribution Grid Simulation and Analytics [1.0] Grid-Orchは、モデルコンテキストプロトコル(MCP)を通じて、大規模言語モデル(LLM)と電力系統シミュレーションをブリッジするフレームワークである。
Grid-Orchは、電力フロー、電圧分析、準静的時系列(QSTS)シミュレーション、自動最適化など、11のカテゴリにまたがる36のドメイン固有ツールを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:31:34 GMT)
Correcting Selection Bias in Sparse User Feedback for Large Language Model Quality Estimation: A Multi-Agent Hierarchical Bayesian Approach [1.0] 本研究では, 個別の相互作用に対して, 地絡ラベルを必要としない3次元階層型ベイズパイプラインを提案する。
フィードバックチャネル(典型的には正のフィードバック率と負のフィードバック比)の軽度先行は、バイアス比が一掃されるにつれて階層的インフォームドは4-13 pp of $Qstar$ に留まる。
チャネル側の先行がなければ、すべての弱いプライオリティは、22-33 pp.で$Qstar$を逃す。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:22:06 GMT)
Primal-Dual Policy Optimization for Linear CMDPs with Adversarial Losses [0.9] 我々は、LogSumExpソフトマックスポリシーと呼ばれる新しいクラスのポリシーを導入し、実行します。
周期的ポリシーミキシングと正規化された二重更新という2つの新しいアルゴリズムコンポーネントは、被覆数と二重変数の両方を効果的に制御できる。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:02:02 GMT)
WorldComp2D: Spatio-semantic Representations of Object Identity and Location from Local Views [0.9] WorldComp2Dは、オブジェクトの同一性や空間的近接性に応じて潜在空間の幾何学を構造化する新しい表現フレームワークである。
我々は,SoTA軽量モデルと比較して,WorldComp2D は CPU 上でのリアルタイム性能を維持しつつ,FLOP のパラメータ数を最大4.0X と 2.2X に削減することを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:21:41 GMT)
Ready from Day 1: Population-Aware Coordination for Large-Scale Constrained Multi-Agent Systems [0.8] そこで我々は,小集団の要約に条件付き原始マップと双対マップを学習する,親和性を考慮した協調インタフェースを提案する。
人口認識インタフェースは、人口認識ベースラインと比較して予測誤差を16~19%減らし、容量違反を20~51%減らした。
また、バックテスト可能なプロシージャとして2Real Simトランスファーをキャストし、デプロイ前に評価を可能にします。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:57:24 GMT)
Realization of Backward Retrieval in a Stark-modulated Spin-wave Quantum Memory [0.8] 我々は,Eu3+:Y2SiO5におけるStark-echo変調プロトコルに基づくスピン波量子メモリにおけるバックワード検索の初の実験的実現を報告した。
スターク制御を用いることで、コヒーレントノイズを抑えつつ、アンサンブルの完全な光深度を保ち、条件記憶率を97%以上に抑えることができる。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:51:51 GMT)
Early AI Literacy in Culturally Responsive STEM Outreach for Black Youth [0.8] 本稿では,オンタリオ工科大学のエンジニアリング・アウトリーチ・ブラックユース・プログラムを,文化的にレスポンシブなSTEMアウトリーチの探索的,実践的ケーススタディとして検討する。
このプログラムは、黒人若者がメンターシップ、表現、コミュニティとのつながりによって支援された、文化的に根ざしたSTEM体験に従事する包括的環境を作成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:30:40 GMT)
Squeezing and adiabaticity breaking in time-dependent quantum harmonic oscillators [0.8] ルイス=リースフェルト不変法、ボゴリューボフ変換、エルマコフ・ペニー方程式に基づく時間依存振動子の統一的処理について述べる。
このレビューは、二次ポテンシャルの非平衡力学を理解するための包括的なフレームワークを提供することを目的としている。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:42:06 GMT)
From Heuristics to Analytics: Forecasting Effort and Progress in Online Learning [0.8] 本稿では,知的学習システム(ITS)ログに基づく教師付き予測タスクとしてエンゲージメント予測を導入する。
回帰、決定木、ニューラルネットワークを含む15の予測器をベンチマークする。
特徴に基づくモデルでは,平均絶対誤差(MAE)がベースラインに対して22~33%減少することを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:04:06 GMT)
Real-Time Whole-Body Teleoperation of a Humanoid Robot Using IMU-Based Motion Capture with Sim2Sim and Sim2Real Validation [0.7] 本稿では,Unitree G1ヒューマノイドロボットで記録されたリアルタイム全体遠隔操作システムを提案する。
オフラインバッファリングや学習ベースのコンポーネントを使わずに、連続的かつ低レイテンシな操作のために設計された、独自のモーションプロセッシング、キネマティック、制御パイプラインを導入します。
実験結果から,歩行,立位,座位,旋回,ボウイング,コーディネートされたフルボディジェスチャーなど,広い運動レパートリーの安定かつ同期的な再現が示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:22:17 GMT)
EchoTracker2: Enhancing Myocardial Point Tracking by Modeling Local Motion [0.7] 心エコー検査では, 運動推定の有効な方向として, 心筋点追跡(MPT)が出現している。
我々は,局所的なコンテキストで画素精度を向上する,微細ステージのみのアーキテクチャである textEchoTracker2 を提案する。
最高の汎用点追跡法と比較すると、それぞれ$2.0%$と$5.3%$である。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:59:52 GMT)
Trade-offs in Decentralized Agentic AI Discovery Across the Compute Continuum [0.7] 本稿では,エージェント発見のための主要構造オーバレイファミリー間のトレードオフについて検討する。
目標は、エッジからクラウド環境にまたがるエージェント発見のために公開する運用ポイントを明確にすることである。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:25:28 GMT)
Deanonymizable Scoped Linkable Ring Signatures [0.7] 既存のシグネチャスキームは、スコープ化されたリンク可能性と分散化されたアカウンタビリティを統合することができない。
Deanonymizable Scoped Linkable Signatures (RS)を紹介する。
RSはスコープ(コンテキスト識別子)と動的キーイメージを使用して、異なるスコープにわたるスコープのリンク性とアンリンク性を提供します。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:03:21 GMT)
Why Conclusions Diverge from the Same Observations: Formalizing World-Model Non-Identifiability via an Inference [0.7] 分散とは、他者の欠陥ではなく、推論と学習に固有の非識別性の一種である。
推論プロファイル$= (R, E, S, D)$を導入します。
このフレームワークは,表現階層,潜在状態推定,正規化探索トレードオフを含む深層表現学習に関係している。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:24:06 GMT)
Spatial Adapter: Structured Spatial Decomposition and Closed-Form Covariance for Frozen Predictors [0.7] 本研究では, 凍結した第1ステージ予測器に残留磁場の空間的構造を付加したパラメータ効率の高いポストホック層を提案する。
アダプタは残留物に関するカスケード第2段階として動作し、空間的に正規化された正則基底とサンプル毎のスコアを共同で学習する。
第1段階のパラメータは凍結するため、アダプタはバックボーンをリトレーニングしない。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:29:56 GMT)
Reconnecting Fragmented Citation Networks with Semantic Augmentation [0.7] 本稿では,大規模言語モデル(LLM)に基づくテキスト類似度と,引用トポロジを統合した計算効率のよいハイブリッドフレームワークを提案する。
分割された小さなコンポーネントから意味的なエッジを追加し、テキストの類似性に応じて既存の引用を重み付けすることで、元のグラフを強化します。
この方法は,大規模なデータセットに効率よくスケールし,学際的境界を崩壊させることなく,引用に基づく指標を強化するための実践的戦略を提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:28:39 GMT)
Synthesizing the Expert: A Validated Multimodal Dataset for Trustworthy AI-Assisted Swimming Coaching [0.6] 本研究では、水泳分野における高度なAIアプリケーションのための構造化された検索補助生成(RAG)システムに焦点を当てる。
本研究では,4次元にまたがる多モーダルな知識ベースを活用する新しい生成フレームワークを提案する。
構造化され合成された地上の真実を提供することで、この研究は水族学における信頼できるAIの基礎的なベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:34:33 GMT)
Discriminative Span as a Predictor of Synthetic Data Utility via Classifier Reconstruction [0.6] 広く採用されている解決策は、画像から画像への変換を負のサンプルに適用することで、合成正のデータを生成することである。
モデル学習を必要とせずに合成データの有効性を予測できる幾何駆動計量を提案する。
実陰性および合成正の混合データに基づいて学習したCNNの下流分類性能と強い相関性を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:50:14 GMT)
Urban Risk-Aware Navigation via VQA-Based Event Maps for People with Low Vision [0.5] 視覚障害は世界中の何億人もの人々に影響を与え、都市環境の安全と独立性を著しく制限する。
本稿では,視覚言語モデル(VLM)を利用した視覚的質問応答に基づくイベントマップフレームワークを提案する。
我々は、VQAアーキテクチャであるViLT、LLaVA、InstructBLIP、Qwen-VLの4つをベンチマークし、生成型マルチモーダル大言語モデル(MLLM)が、分類に基づくアプローチよりも大幅に優れていることを発見した。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:50:13 GMT)
CHAL: Council of Hierarchical Agentic Language [0.5] 我々は、議論の真の価値と弁証的システム全体が、実現不可能な領域にあると論じている。
提案する階層的エージェント言語協議会(CHAL, Council of Hiserarchical Agentic Language)は,デファシブルな議論を信念最適化のエンジンとして扱う多言語弁証法である。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:26:41 GMT)
Concordance Comparison as a Means of Assembling Local Grammars [0.5] 本稿では2つの局所文法から得られた一致を比較するツールを使用する。
比較分析により,各LG間の包摂性,交叉性,解離性の関係を観察した。
この手法は、ポルトガル語で書かれたテキストから人物名を抽出するケーススタディで用いられた。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:45:10 GMT)
Behavioral Determinants of Deployed AI Agents in Social Networks: A Multi-Factor Study of Personality, Model, and Guardrail Specification [0.4] パーソナリティ仕様は、主要な行動レバーである。
モデルバックボーンと運用ルールは、より穏健だが、レトリックスタイルとトピックエンゲージメントの幅に意味のある効果をもたらす。
本研究は,デプロイ型マルチエージェント社会システムに関する新興文献に実証的証拠を与えるものである。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:27:36 GMT)
When AI Meets Science: Research Diversity, Interdisciplinarity, Visibility, and Retractions across Disciplines in a Global Surge [0.4] OpenAlexコレクションから2億2700万以上の学術作品を分析します。
ドメイン間のAI採用のタイミングと範囲の違いを文書化しています。
我々は、最良の研究プラクティスがAIの採用のメリットをいかに向上させるかについて論じる。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:30:30 GMT)
AI Native Asset Intelligence [0.4] 本稿では,異質なセキュリティデータを一貫性,コンテキスト,積極的な資産レベルの推論のために構造化されたインテリジェンス層に変換するフレームワークであるAIネイティブアセットインテリジェンスを紹介する。
このフレームワークは、アセット、アイデンティティ、リレーション、コントロール、アタックベクター、ブラスト・ラディウス・パターンを表すモデリング層と、断片化された信号を正常化されたアセット重要度尺度に変換するスコア層を組み合わせる。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:44:26 GMT)
A post-Newtonian Gravitational Collapse Model from Linearized Gravity [0.4] 線形化重力に基づく一般重力関連崩壊機構を導入する。
重力電位と質量密度分布との有効結合を示す。
さらなる崩壊機構は、回転する自由度と混合質量磁石の寄与のために出現する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:18:18 GMT)
String Diagrams for Quantum Foundations, Computing and Natural Language Processing [0.4] 文字列図を用いて量子基礎、計算、自然言語処理の分野のトピックを調査する。
位相符号化を用いた波動論理回路の定式化を行う。
分散構成回路における言語間文法官僚制の排除について検討する。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:11:44 GMT)
MobileEgo Anywhere: Open Infrastructure for long horizon egocentric data on commodity hardware [0.4] MobileEgo Anywhereは、コモディティなモバイルハードウェアを使用した堅牢な時間とエゴセントリックなトラジェクトリの収集を容易にするために設計されたフレームワークである。
我々は,200時間にわたる多種多様・長文のエゴセントリックなデータと永続的な状態追跡からなる新しいデータセットを作成した。
我々は、生のモバイルキャプチャーを、ビジョン言語アクションモデルと基礎モデル研究のための、標準化されたトレーニング可能なフォーマットに変換するための包括的な処理パイプラインを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:53:52 GMT)
LLM-X: A Scalable Negotiation-Oriented Exchange for Communication Among Personal LLM Agents [0.4] 我々は,個人エージェント(LLM)の集団間で直接的かつ構造化されたコミュニケーションを可能にする,スケーラブルな交渉指向環境を提案する。
異なる交渉方針(低、中、高)の下での5,9,12人のエージェントによる実験
厳格なポリシーは堅牢性を改善するが、レイテンシとメッセージボリュームを増加させる。
論文参考訳(メタデータ) (Tue, 12 May 2026 01:04:37 GMT)
Support-Safe Variational Hybrid Filtering for Contact-Mode and Sparse-Law Recovery [0.3] 標準的なアモータイズされたフィルターは、実現可能な接触遷移の確率を示さず、ロボットが実際に従う枝を永久に失う。
本稿では,この分岐損失を防ぐハイブリッド力学学習器であるVHYDROを紹介する。
VHYDROは連続潜伏状態と離散接触モードを共同で推論し、それぞれ回復した状態にスパースポート-ハミルトン法則を適合させる。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:13:35 GMT)
CAD-feature enhanced machine learning for manufacturing effort estimation on sheet metal bending parts [0.3] 境界表現(B-reps)として表されるCADモデルから直接学習することで、製造可能性分析のための有望なアプローチとして、グラフベース機械学習が登場した。
本稿では,B-rep属性の隣接グラフをルールベースモジュールによって認識される製造特徴に富ませることで,この問題に対処するハイブリッドアプローチを提案する。
大規模合成製造性ベンチマークと実世界の産業データセットの曲げ時間の測定実験により、ドメイン知識とグラフベースの学習を組み合わせることで、両方のタスク間の予測精度が向上することを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:30:12 GMT)
Local Topological Quantum Order and Spectral Gap Stability for the AKLT Models on the Hexagonal and Lieb Lattices [0.3] ヘキサゴナル格子とリーブ格子上のAKLTモデルの基底状態が局所位相量子秩序(LTQO)条件を満たすことを証明した。
有限体積基底状態が無限体積状態によってよく近似されるような有限体積の増大と吸収の列を同定する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:27:09 GMT)
Identifying the nonlinear string dynamics with port-Hamiltonian neural networks [0.3] PDEへのPHNN拡張を通じて、物理的に一貫性のあるフレームワークのデータから非線形文字列のダイナミクスを学習する方法を示す。
このアプローチは、精度と解釈可能性の両方の観点から、ベースライン、非物理学的インフォームド手法より優れている。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:01:16 GMT)
Persistent and Conversational Multi-Method Explainability for Trustworthy Financial AI [0.3] 金融感情分析において、人間中心の説明可能なAIのためのアーキテクチャを提案する。
まず、分散S3互換ストレージにおいて、XAIアーティファクトを永続的で検索可能なオブジェクトとして扱う。
第二に、マルチメソッド説明三角測量を可能にする。
第3に, 完全性, 幻覚的クレーム, メソッド帰属行動に関する自動チェックを用いて, 生成した説明の忠実度を評価する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:45:46 GMT)
Native Explainability for Bayesian Confidence Propagation Neural Networks: A Framework for Trusted Brain-Like AI [0.3] BCPNNの決定を説明するための体系的な枠組みは存在しない。
BCPNNは本質的に透明なモデルであり、アーキテクチャプリミティブは確立された説明可能なAI(XAI)ファミリーに直接マップされる。
本稿では,BCPNNにおける最初のXAI分類法を提案する。重み,バイアス,ハイパーカラム後部,構造塑性利用スコア,アトラクタダイナミクス,入力再構成集団を属性,プロトタイプ,コンセプト,カウンターファクトリアル,メカニカルな説明モダリティにマッピングする。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:21:19 GMT)
ORCHID: Orchestrated Reduction Consensus for Hash-based Integrity in Distributed Ledgers [0.3] バイオインスパイアされた新しいコンセンサスプロトコルである textbfORCHID (textitOrchestrated Reduction Consensus for Hash-based Integrity in Distributed Ledgers) を提案する。
これは、神経科学的なエンフィング問題を分散システムのエンフェンセンサス問題にマッピングし、ブロックチェーンノードがビザンツ断層の下で単一の台帳状態にどのように同意するかを図示する。
その結果、ORCHIDは、量子後分散台帳のためのスケーラブルで生物学的に妥当で量子増強されたコンセンサスメカニズムとして確立された。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:47:42 GMT)
OceanCBM: A Concept Bottleneck Model for Mechanistic Interpretability in Ocean Forecasting [0.2] オーシャン・オーシャン(Ocean Ocean)は、海洋力学の予測と機械的尋問のための最初の概念モデル(CBM)である。
混合監督は一貫した機械的表現をもたらすが,予測のみのベースラインと処方則のみのベースラインは,同様の予測性能に拘わらず,高度に可変な潜伏構造を学習する。
CBMは、解釈可能性と性能のトレードオフを特徴付けるスキルを犠牲にすることなく、明示的に解釈可能で、物理的に接地された表現を実現する。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:29:45 GMT)
SoK: A Comprehensive Analysis of the Current Status of Neural Tangent Generalization Attacks with Research Directions [0.2] クリーンラベルの一般化攻撃(データ中毒攻撃の一種)がこの問題に対処するよう提案されている。
タンジェント・ニューラル・ジェネリゼーション・アタック (NTGA) はブラックボックス設定下では初めてのクリーンレーベル・ジェネリゼーション・アタックであると考えられている。
NTGAの長所と短所を概説し,分析に基づいてNTGAを改善する方法を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:10:01 GMT)
Multi-Timescale Conductance Spiking Networks: A Sparse, Gradient-Trainable Framework with Rich Firing Dynamics for Enhanced Temporal Processing [0.2] スパイクニューラルネットワーク(SNN)は、時間的にリッチなタスクに対して、低消費電力のイベント駆動型計算を約束する。
電流電圧曲線の形状からニューラルダイナミクスが出現する勾配学習可能なフレームワークであるマルチタイムコンダクタンススパイクネットワークを導入する。
我々は、これらの微分可能力学の離散時間定式化を導出し、代理次数近似を使わずに時間を通して直接の逆伝播を可能にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:22:45 GMT)
Domain Restriction via Multi SAE Layer Transitions [0.2] レイヤ遷移は、ドメイン固有のシグネチャを抽出するための有望な道を提供することを示す。
具体的には、スパースオートエンコーダを用いて符号化された内部力学の軽量な学習方法を提案する。
本手法を網羅的に解析し,gemma-2Bおよび9Bモデルでベンチマークする。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:36:02 GMT)
Trajectory-Aware Adaptive Inference in Object Detection Models [0.2] 我々は,GPSトラジェクトリデータを推論プロセスに組み込むことにより,既存のオブジェクト検出フレームワークを構築した。
我々は、動きキューを組み込んだYOLOv8ベースの検出器に早期退避機構を導入する。
その結果、この戦略は予測時間と計算コストを大幅に削減しつつ、良好な検出性能を維持していることが示された。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:04:07 GMT)
LegalCheck: Retrieval- and Context-Augmented Generation for Drafting Municipal Legal Advice Letters [0.2] LegalCheckは、異議回答書の起草を自動化する新しいシステムである。
法律上の一貫性と事実の正確性を維持しつつ、数時間ではなく数分で準決勝のアドバイスレターを生成する。
法律専門家は、このシステムが作業負荷を削減し、法標準の一貫性のある適用を確実にすることを発見した。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:01:29 GMT)
Neurodata Without Boredom: Benchmarking Agentic AI for Data Reuse [0.1] 神経科学データは、実験室、フォーマット、実験パラダイムで非常に断片化されている。
多様な実験に対応するのに十分なフレキシブルなフォーマットは、自己説明が可能であることは滅多にない。
汎用的なコーディングエージェントは各サブタスクでうまく動作したが、完全にエラーのないエンドツーエンドのソリューションをまとめることはめったにない。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:00:18 GMT)
Low Rank Structure of the Reduced Transition Matrix [0.1] 影響行列形式は古典的な量子力学のシミュレーションの代替ルートを提供する。
近年の研究では、最大カオス系においても、影響行列は強い時間的相関を持つことが示された。
局所的な期待値を直接決定する影響行列の適切な組み合わせである還元遷移行列を効率的に近似できることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:13:34 GMT)
Two Wrongs, No Right: Auditing Social-Desirability Bias in LLM Annotators for Computational Social Science [0.1] 6つのTweetEvalタスクに対して、オープンソースの7B命令チューニングモデル(Zephyr、Mistral-Instruct、Qwen2.5-Instruct)を監査する。
3モデルとも中絶の姿勢に中立バイアスを示し、反対の頻度を24~40ポイント過小評価し、中立ラベルを膨らませる。
興味深いことに、Zephyrのヘイトスピーチの有病率推定は、クラス条件誤差が両方の方向で大きいのに対して、ゴールドレートと正確に一致している。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:14:10 GMT)
PASC: Pipeline-Aware Conformal Prediction with Joint Coverage Guarantees for Multi-Stage NLP and LLM Pipelines [0.1] PASC(Pipeline-Aware Split Conformal)は多段関節カバレッジを1つのスカラー共形予測問題に還元する。
3段階のNER -> NED -> エンティティ・タイピングパイプライン上では、PASCは96.4%、ボンフェロニは93.4%、独立CPは86.5%を達成している。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:23:12 GMT)
Intermediate Artifacts as First-Class Citizens: A Data Model for Durable Intermediate Artifacts in Agentic Systems [0.1] このようなシステムは、耐久性があり、検査可能な中間アーティファクトを保存すべきである、と我々は主張する。
中間成果物をチャットの書き起こし、記憶、隠された思考の連鎖、ナレーション、思考、最終回答と区別する。
耐久性のある中間アーティファクトは、AI生成された作業をより検査可能で、修正可能で、時間の経過とともに保守可能にします。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:09:07 GMT)
Mobile Traffic Camera Calibration from Road Geometry for UAV-Based Traffic Surveillance [0.1] 視線画像座標で車両の動きが観察されるため、交通分析にUAVビデオを使用するのは困難である。
本稿では,単眼のUAVトラヒック映像を局所的な視線表示に変換するための軽量パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:14:43 GMT)
Operationalizing Document AI: A Microservice Architecture for OCR and LLM Pipelines in Production [0.1] 本稿では、分類、光学文字認識(OCR)、大規模言語モデル構造化フィールド抽出のための複数のモデルのパイプラインをカプセル化するマイクロサービスアーキテクチャを提案する。
我々は、ハイブリッドな分類、CPUバウンドオーケストレーションからのGPUバウンド推論の分離、パイプライン内の多くのIOバウンド操作に対する非同期処理の使用、独立した水平スケーリング戦略を含む、私たちの主要な設計決定について説明する。
私たちのゴールは、ベンチマークを超えて動作する文書理解システムを構築するための具体的なアーキテクチャパターンを実践者に提供し、本番環境でモデルを効果的に運用することです。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:07:34 GMT)
ECTO: Exogenous-Conditioned Temporal Operator for Ultra-Short-Term Wind Power Forecasting [0.1] 我々は風力予測のための統一的な枠組みとしてECTO(Exogenous-Conditioned Temporal Operator)を提案する。
PGVS (Physically-Grounded Variable Selection) は階層的でグループ対応のスパース選択を行う。
Exogenous-Conditioned Regime Refinement (ECRR) は、学習体制の専門家を通じて予測をルーティングする。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:37:23 GMT)
A Fast and Energy-Efficient Latch-Based Memristive Analog Content-Addressable Memory [0.0] 静電圧分割を動的電流レースコンパレータに置き換える強腕ラッチ・メムリスタ (SALM) aCAM セルを導入する。
6T2Mと比較して、SALMは6T2Mが大きな配列にスケーリングできないようなゲインとクロストークの制限をなくしながら、同じレイテンシで読み取りエネルギーを33%削減する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:30:24 GMT)
Long Spin Relaxation Times in CVD-Grown Nanodiamonds [0.0] 蛍光ナノダイヤモンド(FND)の第一用途はバイオセンシング分野にある。
我々は,60nm程度の大きさのFNDを作製するために,前駆体に均一核を付加した高度なFND成長技術について報告する。
これは50nmから150nmの範囲で市販のナノダイヤモンドに比べて10倍近い大きな改善である。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:08:28 GMT)
Yield Curves Dynamics Using Variational Autoencoders Under No-arbitrage [0.0] 本稿では,Deep Learningの統計的柔軟性と,固定所得モデルにおける厳密な理論的制約の相違を解消する物理インフォームドフレームワークを提案する。
本研究では, 標準生成モデルと非制約統計外挿が, 様々なマクロ経済体制における項構造予測において, 「二重崩壊」 と「厳密な仲裁違反」に悩まされることを実証する。
究極的には、この研究は項構造モデリングのための高度にスケーラブルで数学的に健全な進化的エンジンを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:21:25 GMT)
YFPO: A Preliminary Study of Yoked Feature Preference Optimization with Neuron-Guided Rewards for Mathematical Reasoning [0.0] 数学的推論のための予備的なニューロン誘導選好最適化フレームワークであるYFPOを紹介する。
YFPOはまずAttnLRPを用いて数学関連ニューロンを同定し、その後、好ましくない反応と好ましくない反応の間のアクティベーションマージンから補助的な報酬を構成する。
その結果、ニューロンレベルの信号は好みの最適化と相互作用し、時には推論性能を向上させることが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:18:49 GMT)
WriteSAE: Sparse Autoencoders for Recurrent State [0.0] 本稿では,ステートスペースおよびリカレント言語モデルの行列キャッシュ書き込みを分解・編集する最初のスパースオートエンコーダWriteSAEを紹介する。
既存のSAEは残余ストリームを読み取るが、Gated DeltaNet、Mamba-2、RWKV-7はランク1更新を通じて$d_kのd_v$キャッシュに書き込む。
WriteSAEは、各デコーダ原子をネイティブ書き込み形式に分解し、トーケンごとのロジットシフトのクローズドフォームを公開し、マッチしたフロベニウス標準の下での列車は一度に1つのキャッシュスロットを交換する。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:32:45 GMT)
What Does It Mean for a Medical AI System to Be Right? [0.0] 論文は、医療用AIの正確性は、ベンチマークのパフォーマンスを再現できる唯一の特性ではない、と論じている。
本論文は, 4つのテーマを通じて, 基礎的真理ラベルの不安定性, 過信AIの不確実性, 標準的臨床指標の不適切性, 時間的プレッシャのある臨床環境における自動化バイアスのリスクについて論じる。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:18:23 GMT)
Wavelet Variance Equipartition as a Threshold for World-Model Quality and Quantum Kernel TN-Simulability [0.0] 我々はウェーブレットスケーリング指数$$を臨界診断として同定する。
振幅符号化された量子カーネルの古典的シミュラビリティのシャープな遷移境界として$=1/2$を確立する。
この分散は、厳密には$Var[X] = (d-2)$としてスケールする。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:41:12 GMT)
Versatile probe state preparation via generalized measurements for quantum sensing and thermometry [0.0] そこで本研究では,当初は温度条件で調製され,特定の推定タスクに最適化できる広範囲なプローブ状態の設計能力を示す。
核磁気共鳴技術を用いた実験実装のための量子回路について概説する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:52:35 GMT)
Useful for Exploration, Risky for Precision: Evaluating AI Tools in Academic Research [0.0] 本研究は、AIベースのQ&Aと研究用文献レビューツールを評価するために、人間中心とコンピュータ中心のメトリクスを組み合わせたベンチマークフレームワークを提案し、適用する。
以上の結果から,Q&A ツールが価値ある概要と概ね正確な要約を提供する可能性が示唆されるが,正確な情報抽出には必ずしも信頼できない。
この発見は、透明性、検証効率、AIツールの研究者への注意深い統合を強化するための説明可能性機能の重要性を強調している。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:44:12 GMT)
Unlocking UML Class Diagram Understanding in Vision Language Models [0.0] 視覚言語モデル (VLM) は、写真と比較して、図に関する質問に答える際に遅れる。
本稿では,クラス図に基づく視覚的質問応答のベンチマークを提案する。
LoRAベースのファインチューンは、他の多くのベンチマークでQwen 3.5 27Bよりも容易に優れている。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:57:47 GMT)
Unlocking Crowdsourcing for Ontology Matching Validation [0.0] 我々は,OM検証におけるクラウドソーシングの利用について検討し,新しいクラウドソーシングシステムを導入する。
ドメイン固有の3つのメカニズム、すなわち、差分信頼度、コヒーレンス事前充足、時間依存的信念を提案する。
我々は,クラウドソーシングシステムを最先端のOMシステムに統合して,人間のループ検証を可能にすることを実証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:02:34 GMT)
TriBand-BEV: Real-Time LiDAR-Only 3D Pedestrian Detection via Height-Aware BEV and High-Resolution Feature Fusion [0.0] 3つの高さ帯を持つ軽量の2次元BEVテンソルに全3次元LiDAR点雲をマッピングする新しい鳥眼図符号化法(BEV)を導入する。
1つのネットワークは、1回のパスで車、歩行者、サイクリストを検出する。
KITTIデータセットでは、TriBand-BEVは58.7/52.6/47.2の歩行者BEV AP(%)を1つの消費者向けGPU上で49 FPSで容易に、適度に、かつ困難に利用できる。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:58:16 GMT)
Trajectory-Agnostic Asteroid Detection in TESS with Deep Learning [0.0] 機械学習を用いて,TESSデータから移動物体を抽出する新しい手法を提案する。
提案手法では,2つの積み重ねた3次元U-Netとスキップ接続を用いて,背景をフィルタし,TESS画像時系列データに含まれる移動物体を含む画素を識別する。
また、ニューラルネットワークが最適なデータ処理に必要な理想的な範囲とスケーリング分布を学習できるようにする、Adaptive Normalization(適応正規化)と呼ばれる学習データスケーリングの新しい手法を開発した。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:56:19 GMT)
Training Large Language Models to Predict Clinical Events [0.0] 我々は,時間順のMIMIC-IIIノートを過去の患者コンテキストの例に変換することで,フォレストラーニングを臨床予測に拡張する。
このプロセスは、薬品、手順、臓器サポート、微生物学、死亡率を含む702の入院から6,900の予測例を生成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:18:14 GMT)
Towards Discovery of Polymers for Insulin Delivery via Physics-Grounded Agentic Workflows [0.0] コールドチェーンストレージは、数億人の人々のインスリンへのアクセスを制限する。
熱的に保護されたパッチ・ポリマーは役に立つが、デザイン空間は徹底的な実験には大きすぎる。
大規模言語モデル(LLM)は、モデルコンテキストプロトコル(MCP)を通じて物理ベースのツールを呼び出します。
最高の自律運動は-2263 kJ/molのインスリン-ポリマー相互作用エネルギーに達する。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:16:00 GMT)
Three wave mixing vacuum squeezing generation in a SNAIL-based Traveling-Wave Parametric Amplifier with alternated flux polarity [0.0] 超伝導非線形非対称誘導素子による残留三波混合(3WM)による真空スクイーズ生成をジョセフソンTWPAで実証する。
本研究は、マイクロ波フォトニクスの枠組みにおける応用範囲を拡大する可能性があり、競合する非線形性がTWPAサスペンサーに与える影響についての貴重な知見を提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:50:28 GMT)
Three Regimes of Context-Parametric Conflict: A Predictive Framework and Empirical Validation [0.0] 大規模言語モデルが学習知識と矛盾する文書の相違にどのように対処するかを考察する。
本稿では,Regime 1 (単一ソース更新),Regime 2 (競合統合),Regime 3 (タスクに適した選択)という3つの登録フレームワークを提案する。
我々はClaude Sonnet 4.6、GPT-5.5、Gemini 2.5 Flash、Llama 4 Maverick、DeepSeek V3の3つの実験段階で9,970のAPIコールを使用してフレームワークを検証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:00:48 GMT)
Thermodynamic value of CHSH-induced side-information channels in a Szilard engine [0.0] 本稿では,Szilard型フィードバックエンジンに組み込んだCHSH予測タスクを用いて,ベル型相関によって誘導される側情報チャネルの熱力学的値について検討する。
最大平均フィードバック作業は、理想準静的極限において等式が得られ、$langle W_maxrangle le k_B T ln 2, I(X:G)$を満たすことを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:25:37 GMT)
The Routing and Filtering Structure of Attention [0.0] 事前訓練された5つの変圧器に1776個のヘッドを分解し、低階のルーティングを動作させる。
フィルタからルーティングをアンタングルする診断パラメータ化として、$S$-D$ attentionを導入します。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:00:17 GMT)
The Quad-$C_5$ Graph: Maximum Contextuality Gap on Eight Vertices [0.0] Quad-$C_5$ は$_3=1+sqrt5$ (=$x2-2x-4$) を持つ最小の文脈性証人であるが、ワグナーグラフは4次元のヒルベルト空間を必要とする。
このグラフは4つの重なり合う5つのサイクルを含み、その隣接スペクトルは黄金比固有値によって支配される。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:50:25 GMT)
The Physical and Contextual Limits of Quantum Speedup [0.0] 量子計算は指数関数的に多くの古典計算の同時実行としてしばしば誤認識される。
この記事では、この「ブランチワイド並列性」の絵がなぜ誤解を招くのかを概念的に明らかにする。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:25:47 GMT)
The Death Spiral of Open Source Projects: A Post-Mortem Analysis of Pull Request Workflow Dynamics [0.0] オープンソースソフトウェアプロジェクト(OSS)は現代技術の中心であるが、生存率は低い。
この研究は、Pull Request(PR)リポジトリを1,736の非アクティブなGitHubリポジトリと13万の人間駆動のPRで分析した初めての大規模なポストモーテム分析を提供する。
大衆性と革新は生存の強い肯定的な予測因子として現れ、一方で摩擦、拒絶率、形式化のラベル付け、負性は失敗の原因ではなく副産物として長寿命でスケールする。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:28:14 GMT)
Targeted Neuron Modulation via Contrastive Pair Search [0.0] ニューロンレベルの介入は、残留ストリーム法の品質トレードオフを伴わずに、信頼性の高い行動ステアリングを可能にする。
ベースモデルにも同様な遅延層識別構造があることがわかったが、これらのニューロンの操舵は内容シフトのみを生成する。
より広範に,アライメント微調整は,既存の識別構造をスパースかつターゲット可能な拒絶ゲートに変換することを示唆している。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:47:38 GMT)
Sub-shot-noise emission statistics of a CW-excited single photon source [0.0] 一般的に、連続励起単光子源はポアソン統計を示すと仮定される。
この分析は、励起と崩壊速度が同等であるときに、光子放出がポアソニアン以下の統計を表示できることを示した。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:58:16 GMT)
Stability and quasi-normal ringing in analogue black-white holes in SNAIL-based traveling-wave parametric amplifiers [0.0] 背景ソリトンが有効なポテンシャルとして作用する弱プローブ場に対するマスター方程式を導出する。
超対称性量子力学の言語を用いたSNAIL-TWPA回路における正規化可能な負モードの欠如を示す。
また,SNAIL-TWPA類似ブラックホール系の準正規モード(QNM)について,半解析および数値解析により検討した。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:50:14 GMT)
Sparse Mixture-of-Experts Routing in Visual Diffusion Transformers:Diagnosis, Boundary Calibration and Evolutionary Roadmap from Routing Collapse to Selective Deadlock [0.0] 本稿では,ビデオ拡散変換器におけるToken-Choice sparse Mixture-of-Experts(MoE)の学習障害モードを系統的に診断する。
ルーティングされた専門家は元のFFN重みを正確にクローンし、共有された専門家は検証のためにゼロに、そして実際のトレーニングのために極端に小さな非ゼロノイズに変換する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:57:13 GMT)
Simulation of Non-Hermitian Hamiltonians with Bivariate Quantum Signal Processing [0.0] H_mathrmeff = H_R + iH_I$, where $H_R$ is Hermitian and $H_I succeq 0$。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:40:56 GMT)
Sign Language Recognition and Translation for Low-Resource Languages: Challenges and Pathways Forward [0.0] 手話は自然で視覚的な言語であり、世界中のDeafコミュニティで使われている。
300以上の異なる手話言語は、限られたドキュメント、スパースデータセット、不十分な計算ツールのために、非常に低リソースのままである。
本稿では,アゼルバイジャン手話(AzSL)をケーススタディとして,手話認識とアンダーリソース言語への翻訳に関する文献を整理する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:13:56 GMT)
Set-Aggregated Genome Embeddings for Microbiome Abundance Prediction [0.0] 我々は, 集合ゲノム埋め込みを用いて, コミュニティレベルの個体数プロファイルを予測する。
我々は、新しいゲノムの一般化の改善を示すために、このアプローチをベンチマークする。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:44:29 GMT)
Semantic Reward Collapse and the Preservation of Epistemic Integrity in Adaptive AI Systems [0.0] 近年の強化学習の進歩により、大規模言語モデルのユーザビリティ、一貫性、安全性が大幅に向上した。
実行的確実性などの繰り返しの振る舞いは、スカラー化された選好最適化システム内の未解決構造問題を示唆している。
本稿では,SRC(Semantic Reward Collapse)を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:03:26 GMT)
Scalable Measurement-Based Quantum Simulation Patterns for Benchmarking [0.0] 測定ベースの量子コンピューティングは、あらかじめ定義された量子リソース状態の測定パターンを使用して量子論理を実行する。
我々は、量子計測パターンライブラリQPatLibのリリースを発表した。このデータセットは、v1.0において、測定ベースの量子シミュレーションに使用するパターンを提示する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:59:58 GMT)
STRUM: A Spectral Transcription and Rhythm Understanding Model for End-to-End Generation of Playable Rhythm-Game Charts [0.0] 我々は、生録音をドラム、ギター、ベース、ボーカル、キーのための再生可能なクローンヒーローチャートに変換する、オーディオからチャートへのパイプラインSTRUMを提示する。
我々は,7つのドラム・ピペリン成分の完全アブレーションとペアリングしたウィルコクソン試験,コミュニティクローン・ヒーロー・チャートにおける地中時間分布の解析,およびドラムのクラスごとの混乱行列について報告する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:56:09 GMT)
Robust Multi-Agent Path Finding under Observation Attacks: A Principled Adversarial-Plus-Smoothing Training Recipe [0.0] 同一ネットワークと同一デプロイメントループを保持する2つのトレーニングレシピを提示するが、ポリシーは混乱した観察の下で維持される。
最初のレシピであるAdv-PPOは、自身の入力の最悪ケース摂動に対する共有ポリシーを訓練し、敵の摂動下でのパフォーマンスによってチェックポイントを選択する。
第二のレシピであるAdv-PPO+MACER(英語版)は、ランダム化平滑化の証明された半径に従って勾配が続く小さな政治上の滑らかさ項のチェックポイントである。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:33:34 GMT)
QuPort: Topology-, Port-, and Congestion-Aware Compilation for Modular Multi-QPU Quantum Systems [0.0] QuPortはPythonとQiskitベースのコンパイルフレームワークである。
重み付けされた論理的相互作用グラフ、有向物理的カップリングマップ、および無向QPUレベルの相互接続グラフを通して設定を研究する。
このフレームワークには、ヘビーエッジクラスタリング、バランスの取れたグレディパーティショニング、シミュレートされたアニーリング改善、通信ポート対応レイアウト、リモート2ビット操作の抽出が含まれる。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:12:30 GMT)
QuBridge: Layer-wise Fidelity Decomposition in Quantum Computation Pipeline [0.0] QuBridgeは、量子計算を3つの決定層に分解する分析ツールである。
プログレッシブアブレーションと分離実験を通じて各層の忠実度を計測する。
ライブハードウェアアクセスを必要とせずにキャッシュされたキャリブレーションデータを操作する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:53:56 GMT)
Purification of a monitored qubit: exact path-integral solution [0.0] 連続時間モニタリングにおける単一量子ビットの浄化ダイナミクスについて検討する。
初期混合状態の場合、状態の純度を表す1つのパラメータに対して、動力学は乗法的ランゲヴィン方程式に還元されることを示す。
以上の結果から, 2モーダル状態分布の出現にともなって, 拡散支配体制から測定支配体制への動的クロスオーバーが特徴であることが判明した。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:55:51 GMT)
Proteus: A Self-Evolving Red Team for Agent Skill Ecosystems [0.0] エージェントスキルは実行可能な振る舞いとコンテキスト設定ドキュメンテーションの両方を公開する。
現実的な攻撃者は、監査と実行時のフィードバックを使って、繰り返しスキルを書き直すことができる。
Proteusは形式化された5軸スキルアタックスペースを検索する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:05:54 GMT)
Property-Level Reconstructability of Agent Decisions: An Anchor-Level Pilot Across Vendor SDK Adapter Regimes [0.0] 筆者らは,6つの公開ベンダSDKレポジトリのピン付きワークサンプルアンカーに未修正のDecision Trace Reconstructorを適用した。
各決定イベント(DES)プロパティは、完全な充足可能、部分的に充足可能、構造的に充足不能、不透明に分類される。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:05:02 GMT)
Procedural-skill SFT across capacity tiers: A W-Shaped pre-SFT Trajectory and Regime-Asymmetric Mechanism on 0.8B-4B Qwen3.5 Models [0.0] 我々は3つのQwen3.5高密度スケールにおける手続きスキルSFTの寄与を測定した。
SFT対応のプロシージャ$$リフトは、大まかに一様である。
SFTは、基礎が手続きに苦しむ絶対的な条件で最も一生懸命働く。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:19:33 GMT)
Predictive Maps of Multi-Agent Reasoning: A Successor-Representation Spectrum for LLM Communication Topologies [0.0] 既存の評価は、これらの質問に答えるのは、ポストホックと測定されたタスクのみである。
本稿では,M = (I - P)-1$の行確率的通信演算子の後継表現に基づくマルチエージェントLLM通信グラフの構造診断を提案する。
鎖,星,メッシュの閉形スペクトルを行確率正規化法で導出し,12ステップ構成された状態追跡タスクの予測を検証した。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:11:39 GMT)
Predicting Disagreement with Human Raters in LLM-as-a-Judge Difficulty Assessment without Using Generation-Time Probability Signals [0.0] 本研究では,評価の難易度を評価対象者と一致しない確率で予測する手法を提案する。
従来の手法とは異なり、本手法は生成時確率信号に依存しない。
GPT-OSS-120B と Qwen3-235B-A22B を用いた英語CEFR を用いた文難読度評価実験により,提案手法は,確率ベースベースラインよりも高いAUCを達成できた。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:16:30 GMT)
Phase Transitions in Affective Meaning Divergence: The Hidden Drift Before the Break [0.0] 感情的意味のばらつき(英: affective meaning divergence、AMD)は、インターロケータのアンカー条件による影響分布間の全変動距離である。
AMDは異なる時間的シグネチャを提供し、振り返って測定された分散は分岐点でピークとなる。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:28:48 GMT)
PROTECT-DB: Protecting Data using Replicated State Machines: Efficient Corruption Detection & Recovery [0.0] 我々は、共有ログ/ブロックチェーンの決定論的拡張の上に構築されたByzantine-faultトレラント複製ステートマシンに基づくアプローチを検討する。
我々の焦点は、汚職の効率的かつ迅速な検出と、トランザクションの実行と同時の迅速な修復のために設計された実用的なシステムを作ることである。
我々の研究は、データベースのコンテキストにおけるBFT複製状態マシンアプローチの実践的利用の基礎を築いていると信じています。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:03:33 GMT)
OverrideFuzz: Semantic-Aware Grammar Fuzzing for Script-Runtime Vulnerabilities [0.0] 本稿では,Python,Lua,JavaScriptなどのスクリプトランタイム用の意味認識文法ファザであるFuzzを紹介する。
アクティブリフレクションは実行時のタイプを追跡し、受動的リフレクションはエラーメッセージから学習して不正な操作形状を排除し、手動のAPI仕様なしでセマンティックな正確性にアプローチすることができる。
3つのターゲットはいずれも一貫したカバレッジ増加を示し、急速な早期拡大と徐々に増加し、Luaはその広く普及するメタメソッドディスパッチ機構の恩恵を受けている。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:57:35 GMT)
Optimal Policy Learning under Budget and Coverage Constraints [0.0] 予算と最小限の制約による最適政策学習について検討する。
この問題はクナプサック型構造を許容し,アフィンしきい値規則によって最適ポリシーを特徴付けることができることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:06:55 GMT)
Optimal Bounds, Barriers, and Extensions for Non-Hermitian Bivariate Quantum Signal Processing [0.0] 反エルミート的クエリ複雑性 $d_I = (betaI T + log/varepsilon)/loglog (1/varepsilon)$ は強固で、チェビシェフ係数、修正ベッセル関数、Lambert$W$逆変換によって確立される。
定数アクセス演算構成は、制限された領域上の固有の障壁$e-2T$を達成するが、完全なビットースへの拡張は未開である。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:03:36 GMT)
Optical detection of the electron spin resonances of G centers in silicon [0.0] 上バンドギャップ励起下でのG中心のアンサンブルのスピン特性について検討した。
欠陥のコヒーレントスピン制御を実証し,そのスピンコヒーレンス特性を特徴付ける。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:54:06 GMT)
On the Limitations of Large Language Models for Conceptual Database Modeling [0.0] 本稿では,関係データベースの概念モデリングを支援するため,Large Language Models (LLMs) の利用について分析する。
このアプローチは、異なる言語モデルと迅速なエンジニアリング技術を組み合わせて、エンティティを識別する能力を評価する。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:35:59 GMT)
On the Importance of Multistability for Horizon Generalization in Reinforcement Learning [0.0] 長距離マルコフ決定プロセス(POMDP)は特に困難である。
訓練は、一般化の貧弱さ、サンプルの不効率さ、探索の禁止に苦しむ。
我々は時間的地平面一般化を定式化し、非線形かつ並列化可能なRNN変種が実現可能であることを実験的に評価した。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:45:55 GMT)
On periodic distributed representations using Fourier embeddings [0.0] 物理現象や知覚現象を表現するために,高次元空間に周期的な実数値埋め込みを用いる。
本稿では,空間意味ポインタのニューラルな表現スキームを用いて,ディリクレカーネルと周期ガウスカーネルの形式化に着目する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:19:23 GMT)
NexOP: Joint Optimization of NEX-Aware k-space Sampling and Image Reconstruction for Low-Field MRI [0.0] 低磁場MRI(low-field magnetic resonance imaging)技術は、ポータブルで低コストなシステムを備えた標準の高磁場MRIに代わる魅力的な代替手段を提供する。
低いSNR(Signal-to-Noise Ratio)によって制限されており、診断画像の品質を損なう。
SNRを増大させる一般的なアプローチは、NEXとして知られる繰り返し信号の取得であるが、これは過度に長いスキャン期間をもたらす。
NexOPは、NEX取得におけるサンプリングと再構成の協調最適化のためのディープラーニングフレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:06:10 GMT)
NeuroFlake: A Neuro-Symbolic LLM Framework for Flaky Test Classification [0.0] 同じバージョンのコードに対して非決定論的パス/フェイル動作を示す、不安定なテストは、信頼できる回帰テストに重大な課題を生じさせる。
我々は,現実世界のデータセット上でフレキテストの分類を行う新しいニューロ・シンボリック・フレームワークであるNeuroFlakeを紹介する。
論文参考訳(メタデータ) (Tue, 12 May 2026 03:56:40 GMT)
Neural-Schwarz Tiling for Geometry-Universal PDE Solving at Scale [0.0] 私たちは、フルドメインのソリューション演算子から再利用可能なローカル物理ソルバへ学習を移行する、ローカルからグローバルなフレームワークである$textbfNEST$(textbfS$chwarz $textbfT$iling)を紹介します。
NESTは、さまざまなローカルジオメトリとバウンダリ/インターフェースデータを備えた、最小限のボクセルパッチ上のニューラル演算子を学習する。
以上の結果から,Schwarz反復による局所的ニューラルネットワーク構築ブロックは,スケーラブルな学習型PDE解法への再利用可能な局所学習パスを提供することがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:20:26 GMT)
Neural Code Translation of Legacy Code: APL to C# [0.0] 本稿では,大規模言語モデルを用いたAPLのC#への変換について検討する。
本稿では,APL-to-C#翻訳のための新しいフレームワークを提案する。
この結果から,APLとC#のギャップをニューラルネットワークによる翻訳で埋めることが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:11:33 GMT)
Multi-Narrow Transformation as a Single-Model Ensemble: Boundary Conditions, Mechanisms, and Failure Modes [0.0] シングルモデルアンサンブル(SME)は、1つのネットワーク内での深層アンサンブルの利点を近似する方法として注目されている。
ほぼ一致したパラメータ予算の下では、モデルキャパシティが1つの広い経路に集中すべきか、あるいは多くの狭義の独立したメンバーに再分配されるべきなのかは定かではない。
この問題は,ベースラインCNNを細い,パスワイドな独立ブランチのSMEに変換するマルチナロー変換(MN)を用いて検討する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:54:24 GMT)
MetaColloc: Optimization-Free PDE Solving via Meta-Learned Basis Functions [0.0] 機械学習で偏微分方程式を解くには、すべての新しい方程式に対して新しいニューラルネットワークをトレーニングする必要がある。
最適化フリーでデータフリーなフレームワークであるMetaCollocを導入し、このボトルネックを完全に取り除きます。
非線型PDEに対して、高速二次収束を達成するためにニュートン・ラフソン法を適用する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:36:12 GMT)
Lower overhead fault-tolerant building blocks for noisy quantum computers [0.0] 現在の量子デバイスにおける高頻度ノイズは、基本的なアルゴリズムの正確な実行を妨げる。
これは量子誤り訂正符号で量子情報を保護することで修正できる。
6つの論理量子ビットを符号化した距離4の符号は、物理量子ビットの10分の1を用いて、距離5の曲面符号と同様に情報を保護する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:47:51 GMT)
Lifelong Learning in Vision-Language Models: Enhanced EWC with Cross-Modal Knowledge Retention [0.0] 大規模言語ビジョンモデル(LVLM)は、テキストと視覚のモダリティ間の理解を可能にすることで、AIに革命をもたらした。
これらのモデルは、画像キャプション、視覚的質問応答、モーダル検索といったタスクに優れています。
本稿では,拡張された弾性重み統合とパラメータ効率のよい微調整技術を組み合わせたLVLMの総合的連続学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 22:05:30 GMT)
Leggett--Garg Tests in Neural Dynamics: Probing Non-Diffusive Stochastic Structure in Single Neurons [0.0] 永続力学は,レゲット・ガルグの不等式に反する振動時間相関を生じさせることを示す。
得られた時間相関は、量子システムで遭遇したものと数学的に類似した永続性、記憶、文脈的時間構造を示す。
これらのテストは、脳内の微視的量子コヒーレンスを要求せずに、神経力学における文脈的および非マルコフ構造の実験的なプローブを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:49:48 GMT)
Laser-assisted tunneling in a static tungsten diselenide WSe$_2$ barrier [0.0] 静電障壁を受ける単層 WSe$$$ のダイラックフェルミオンのトンネル効果を線形偏光レーザー場により照射する。
その結果, レーザー場はFloquet側バンド構造が豊富に形成され, 駆動パラメータが$$。
この技術は量子フィルタや光制御ナノスケールトランジスタを含む新しい光電子デバイスの開発を可能にする。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:16:44 GMT)
Large $N$ factorization of families of tensor trace-invariants [0.0] ハール分布(またはガウス)複素ランダムテンソルは、量子情報とより直接的に関係している。
我々は、以前に研究されたトレース不変量の様々な族が、大きな N において分解可能であることを証明している。
我々はこの知見を多部量子絡み合いの理論に適用する。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:52:03 GMT)
LLMs and the ZPD [0.0] 100年前、ヴィゴツキーと彼のサークルは意識の性質を探求していた。
彼らは、子どもたちが大人と対話することで「科学的思考」を発達させると結論付けた。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:04:35 GMT)
Joint Realizability Tradeoffs Bounded by Quantum Channel Incompatibility [0.0] チャネル不整合性の典型的な資源定量化器である一般化ロバスト性は、任意の近似関節実現の総誤差を低くすることを示す。
この結果を測定チャネルに適用することは、統一されたモデルに依存しないフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 10:37:47 GMT)
Iterative Audit Convergence in LLM-Managed Multi-Agent Systems: A Case Study in Prompt Engineering Quality Assurance [0.0] AEGISに適用されたエージェント駆動型監査の単一システム事例研究を報告する。
本報告では, 明示的な符号規則, 非単調な収束, 監査スコープの拡がりを含む7カテゴリーの欠陥分類を報告する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:39:04 GMT)
It's Not the Size: Harness Design Determines Operational Stability in Small Language Models [0.0] 本稿では,スモールランゲージモデル(SLM)の動作性能に及ぼすハーネス工学のレベルの影響を実験的に解析する。
3つのハーネス条件は、24タスクにわたる3つのモデル(Gemma4 E2B、Qwen3.5:2B、LLaMA 3.23B)に適用される。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:50:30 GMT)
Information Thermodynamics in Generalized Probabilistic Theories [0.0] 一般化確率論(GPT)における情報熱力学の構築
計測,フィードバック,情報消去,および熱力学の第2法則の関係を解析するための統一的な枠組みを提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:14:48 GMT)
Influence of pump size on pattern formation in exciton-polaritonic Bose-Einstein condensates in the non-Markovian regime [0.0] 非マルコフ式Gross-Pitaevskii方程式を用いて, 非コヒーレントポンプの励起子-偏光子縮合のダイナミクスについて検討した。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:43:20 GMT)
IGT-OMD: Implicit Gradient Transport for Decision-Focused Learning under Delayed Feedback [0.0] 意思決定にフォーカスした学習トレインは、下流の意思決定損失に対してエンドツーエンドでモデルをモデル化するが、オンライン設定は遅延したフィードバックに悩まされる。
遅延下での2レベル最適化に特有の障害モードであるエンフスタレンス増幅を同定する。
ブラックボックス遅延勾配が内部解法近似誤差から既約後悔コストを生じることを証明した。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:43:49 GMT)
Graph-Grounded Optimization: Rao-Family Metaheuristics, Classical OR, and SLM-Driven Formulation over Knowledge Graphs [0.0] 本稿では,現実の最適化問題における決定変数,制約,客観的係数を,Cypherクエリによる特性知識グラフ(KG)から導出するパラダイムを提案する。
我々は,オープンソースサム山グラフデータベースのパラダイムをインスタンス化し,実世界のパブリックドメインKGが支援する7つの問題を評価する。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:43:35 GMT)
Ginzburg-Landau Theory for Confined Thin-Film Superconductors [0.0] 量子閉じ込め下における超伝導薄膜に対するギンズブルグ-ランダウ理論を開発した。
中心的な結果は、量子閉じ込めが固有の超伝導コヒーレンス長を直接正規化することである。
この理論は、閉じ込めによって引き起こされる超伝導長スケールの再正規化と輸送散乱が強く絡み合うクロスオーバー状態を予測する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:00:24 GMT)
From Clever Hans to Scientific Discovery: Interpreting EEG Foundational Transformers with LRP [0.0] 脳波FMのポストホックアトリビューション法として,アテンションを意識したレイヤワイズ関連伝搬を用いる。
LRPは脳波-FM決定の検証と生物学的に妥当な仮説の表出の両方が可能であることが判明した。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:59:14 GMT)
Finite Sentence-Interface Control for Learning Bounded-Fan-Out Linear MCFGs under Fixed Monoid Typing [0.0] 固定的有限モノイド準同型(h)の下での有界ファンアウト線形多重文脈自由文法の正データ学習について検討する。
このような事象に対して,文-インタフェース型を有限外部制御オブジェクトとして導入する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:07:21 GMT)
Finding a Crab in the C: Assured Translation via Comparative Symbolic Execution [0.0] cozyは、"安全でない"ソースコードからコンパイルされたバイナリと、ソースコードのメモリセーフ言語への変換からコンパイルされたバイナリを分析する、比較バイナリ分析ツールである。
cozyは2つのバイナリの動作の差異を開発者に向かって歩き、それぞれの違いを示し、ユーザがその違いが意図的(良い)かどうかを判断するように求めます。
Cozyは自動翻訳、バグ修正、コードレビュー、オペレーション認可、自動翻訳に応用できる。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:33:33 GMT)
Fill-Side Non-Retail Trading on Polymarket: An Empirical Study of Behavioral Tiers and Microstructure Signatures Under Quote-Attribution Constraints [0.0] PolymarketのオフチェーンCLOBアーキテクチャは、アドレスレベルの属性を永久に利用できない。
経験的窓のフィルサイドの挙動は、6つの特徴ベクトルの下で一様である。
G-QUOTE-LIFEの失敗により、市場と流動性に関する主張は取り下げられた。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:01:35 GMT)
Fermion lattices can be simulated by same-size qubit lattices with $\mathcal{O}(1)$ interaction overhead [0.0] 電子間の局所的な相互作用は、相関物質の多くの複雑な性質を下敷きにする。
N$サイトの2次元フェルミオン格子上のすべての幾何学的局所的相互作用を、相互作用の数にオーバーヘッドがなく、空間オーバーヘッドも無くシミュレートする方法を示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:00:04 GMT)
Fair outputs, Biased Internals: Causal Potency and Asymmetry of Latent Bias in LLMs for High-Stakes Decisions [0.0] 本稿では,人種的関係の異なるアプリケーションを用いて,オープンウェイトモデルを用いた住宅ローン引受について検討する。
モデルでは, 出力レベルの偏りは見られず, モデル層全体にわたる人口動態の表現を保ち, 増幅している。
アクティベーションステアリングと新しい層間干渉により、この抑圧された情報が決定に関連があることを実証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:14:58 GMT)
Explicitly Correlated Gaussian Basis Approach to Periodic Systems [0.0] 我々は、明示的に相関したガウス(ECG)に基づく周期固体の電子構造の変動計算のための閉形式式を開発した。
定式化は無限の1次元水素鎖に適用することで検証され、熱力学的極限で計算された原子当たりの基底状態エネルギーは、他の多体法によって外挿された有限鎖の結果と一致することが示されている。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:50:41 GMT)
Energy-Efficient Implementation of Spiking Recurrent Cells on FPGA [0.0] スパイキングニューラルネットワーク(SNN)は、スパイキングアクティビティがスパースであり、ニューロンモデルがハードウェアフレンドリーであるときに、エネルギー消費を減らすことができる。
本稿では,スパイキングリカレントセル(SRC)ニューロンを用いたSNN用FPGAアクセラレータを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:58:02 GMT)
Efficient Conditioning Why Pseudo Observation Batch Bayesian Optimization Works When It Does not [0.0] Constant Liar (CL)、Kriging Believer (KB)、およびファンタジーモデルは並列ベイズ最適化におけるバッチ選択に広く使われている。
データを拡張した場合に,効率的な条件付けをキーサロゲート特性として,クローズドフォームで予測を更新する機能として同定する。
CL, KB, および空想モデルを, 偽値分布のみが異なる単一の条件付け機構のインスタンスとして統一する。
論文参考訳(メタデータ) (Tue, 12 May 2026 13:14:24 GMT)
Dual-Temporal LSTM with Hybrid Attention for Airline Passenger Load Factor Forecasting: Integrating Intra-Flight and Inter-Flight Booking Dynamics [0.0] 短期需要予測は航空会社の収益管理に不可欠である。
現在のモデルは予約データを1つの時間次元として扱う。
注目フレームワークと統合された2ストリーム長短期記憶(LSTM)を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:55:41 GMT)
Do Fair Models Reason Fairly? Counterfactual Explanation Consistency for Procedural Fairness in Credit Decisions [0.0] 既存の結果フェアモデルは、個人に対して根本的に異なる推論を適用可能であることを示す。
本稿では,このバイアスを検出し緩和するフレームワークであるCECを提案する。
主なコントリビューションには、最寄りのカウンターファクト生成方法、統合勾配比較のための修正ベースライン、およびそれに対応するトレーニング損失が含まれる。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:54:25 GMT)
Dissipative Dynamics and Active Stabilization of Linear and Nonlinear Waves in Non-PT-Symmetric Harmonic Traps [0.0] 複素エルミートポテンシャルを用いたハーモニックトラップにおける非線形波動と非線形波動の散逸ダイナミクスについて検討する。
このアプローチは、非エルミート系における非線形波動を制御する一般的な戦略を確立し、フォトニクスやボース=アインシュタイン凝縮体にも応用できる。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:29:23 GMT)
DisaBench: A Participatory Evaluation Framework for Disability Harms in Language Models [0.0] 障害リスクカテゴリー12の分類法であるDisaBenchを紹介する。
データセット、分類、方法論は、Hugging Faceと、既存の安全パイプラインに直接統合するためのオープンソースのレッドチームフレームワークを通じてリリースします。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:56:36 GMT)
Direct Bethe Free Energy Minimization for Bayesian Neural Network [0.0] 我々は,変分下界を最大化するのではなく,Bethe自由エネルギーを直接最小化してベイズニューラルネットワークを訓練することを提案する。
木構造因子グラフ上では、Bethe自由エネルギーは正確であり、決定論的層は目的から外れ、標準のバックプロパゲーションによって訓練される。
すべての変種は、アンサンブルやサンプリングベースの手法とは対照的に、MAP等価な推論コストで閉形式予測を許容する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:06:22 GMT)
Digital Twins as Synthetic Controls in Single-Arm Trials [0.0] 結果モデルに基づく合成制御アームは、単腕試験において重要なツールである、と我々は主張する。
我々は、過去のデータセットに基づいてトレーニングされた機械学習モデルから生じる病気の進行のパーソナライズされた予測であるデジタルツインに焦点を当てる。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:58:48 GMT)
Digital Identity for Agentic Systems: Toward a Portable Authorization Standard for Autonomous Agents [0.0] 本稿では,保険請求処理とサプライチェーンの整合性における代表的企業利用事例について分析する。
発行者認可認可ペイロードに基づく自律エージェントの携帯型認証モデルを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:04:34 GMT)
Digital Annealer-Assisted Accuracy-First Quantum Circuit Transpilation with Integrated QUBO Mapping and Routing [0.0] Noisy Intermediate-Scale Quantum (NISQ) の時代には、エラー率の制限は直接回路の忠実度を制約する。
本稿では,(1)Qiskitによる高速ルーティングとDA駆動のグローバル初期マッピングを併用したハイブリッド,(2)反復的ワークフロー内のサブプロブレムを解決するフルDAという2つの手法を用いて,Digital Annealer (DA) というフレームワークを提案する。
以上の結果から,ゲートノイズが主なボトルネックとなる高精度では,DA支援によるグローバルな初期配置が,短期量子ハードウェアの有用性を高めるための実用的な"時間"トレードオフをもたらすことが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:19:51 GMT)
DiffSegLung: Diffusion Radiomic Distillation for Unsupervised Lung Pathology Segmentation [0.0] CTにおける肺病理の教師なしセグメンテーションは依然として未解決の課題である。
DiffSegLungは拡散放射能蒸留を導入するフレームワークである。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:32:24 GMT)
Design of Memristive Lightweight Encryption For In-Memory Image Steganography [0.0] 本稿では,CIMのための標準軽量ストリーム暗号であるTriviumとGrain-128aを実装した。
これらの暗号のレジスタに提案したデータシフト法を適用すると、計算ステップの数を減らし、それぞれ42%と44%のエネルギー消費を削減できる。
論文参考訳(メタデータ) (Tue, 12 May 2026 17:01:15 GMT)
Cryogenic Systems for Quantum Photonic Technologies: A Practical Review [0.0] 色中心や量子ドットのような固体プラットフォームは、実用に必要な性能レベルに達するのに低温を必要とする。
このレビューでは、フロークライオスタットからメカニカル冷凍機、希釈冷凍機まで、現代の冷却ハードウェアの原理を詳述する。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:44:02 GMT)
Cross-Model Consistency of Feature Importance in Electrospinning: Separating Robust from Model-Dependent Features [0.0] 機械学習(ML)手法は、電子スピン化プロセスのモデル化にますます採用されている。
既存の研究の多くは単一のMLモデルに依存しており、結果として生じる特徴の重要性が堅牢で再現可能であることを暗黙的に仮定している。
本研究は,複数のMLモデルファミリーにまたがる特徴的重要性の一貫性を系統的に評価した。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:55:21 GMT)
Crash Assessment via Mesh-Based Graph Neural Networks and Physics-Aware Attention [0.0] ニューラルサロゲートが、十分な精度、空間的規則性、および工学的解釈のための構造的妥当性で、フルフィールド・クラッシュ・キネマティクスを再現できるかどうかを評価する。
提案アーキテクチャは, 局所メッシュメッセージパッシング, ジオメトリ対応のグローバルアテンション, 自動回帰クラッシュロールアウトのための疎接触対応補正を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:50:49 GMT)
Correct-by-Construction G-Code Generation: A Neuro-Symbolic Approach via Separation Logic [0.0] 本稿では,GLLMが創造的生成器として機能し,SL Proverが決定論的検証器として機能する2成分アーキテクチャを提案する。
このシナジーは自己修正生成サイクルを確立し、手動による監視の必要性を減らす。
論文参考訳(メタデータ) (Tue, 12 May 2026 05:10:33 GMT)
Cooperative Robotics Reinforced by Collective Perception for Traffic Moderation [0.0] 非視線交差点(NLOS)での衝突は、ドライバーが接近する交通の視認性に制限があるため、大きな安全上の懸念が残る。
V2Xベースの警告はこれらのリスクを減らすことができるが、多くの車両はV2Xを装備しておらず、ドライバーは車両の警告を無視する可能性がある。
本研究は,協調型ヒューマノイドロボットをアクティブ交通モデレーターとして追加する補完的概念を導入する。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:26:47 GMT)
Convolutional-Neural-Networks for Deanonymisation of I2P Traffic [0.0] 本研究では,Invisible Internet Project (I2P)ネットワークにおける非匿名化の可能性について,受動トラフィック解析と機械学習技術を用いて検討した。
主な目的は、ペイロードの暗号化にもかかわらず、I2Pトラフィックの特徴的なパターンを特定することである。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:35:37 GMT)
Controllable Quantum Memory Capacity in Quantum Reservoir Networks with Tunable partial-SWAPs [0.0] 本稿では,ゲートベースQPU上に実装されたQRNから,メモリの消散率を直接制御するハードウェア実現機構を提案する。
メモリ容量が生じる正確なメカニズムは、完全には理解されず、完全に制御可能である。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:22:43 GMT)
Confidence-Guided Diffusion Augmentation for Enhanced Bangla Compound Character Recognition [0.0] 既存のBangla手書き文字認識システムは、様々な書体にまたがる一般化に苦慮している。
低分解能バングラ複合文字認識のための信頼誘導拡散拡張フレームワークを提案する。
我々の最高の性能モデルは89.2%の分類精度を達成し、AIBanglaベンチマークを上回りました。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:00:08 GMT)
Compositional Neural Operators for Multi-Dimensional Fluid Dynamics [0.0] 偏微分方程式は様々な物理現象を支配しているが、高忠実度数値解は計算に高価であり、機械学習のアプローチは一般化を欠いている。
複雑なPDEをファンデーションブロックのライブラリに分解するフレームワークである2Dシステムのためのコンポジションニューラル演算子(CompNO)を提案する。
実験の結果,初等演算子からの学習は適応性を大幅に向上し,モデル解釈性を高め,新しい物理系に適応する際の事前学習ブロックの再利用を容易にすることがわかった。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:48:03 GMT)
Coherent control of spinmons [0.0] 我々は、トラップされたアンドレフ準粒子のスピンに絡み合ったトランモンの量子状態における量子情報を符号化する。
我々はコヒーレンス時間を計算し、フラックスや電荷のノイズ源に対する量子ビットのロバスト性を検証する。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:00:00 GMT)
Choosing features for classifying multiword expressions [0.0] MWE(Multiword Expression)は、分類を必要とする不均一な集合である。
すべての機能は、MWEがどの程度確実にクラスに割り当てられるかという点で等しいわけではない。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:48:31 GMT)
Chaos Emerge with Exceptional Points in Reset-Driven Floquet Dynamics [0.0] 多重体系のハミルトン進化によって生じるリセット駆動型フロケ量子チャネルのスペクトル構造について検討する。
基礎となるハミルトニアンにおいてカオス制御パラメータをチューニングすることにより、対称性に制約されたエルゴード状態から完全にカオス状態への例外点誘起スペクトル遷移を明らかにする。
チャネルスペクトルはカオス的,エルゴード的,多体局在的,希少な動的機構を著しく区別する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:27:26 GMT)
Caraman at SemEval-2026 Task 8: Three-Stage Multi-Turn Retrieval with Query Rewriting, Hybrid Search, and Cross-Encoder Reranking [0.0] 本稿では,SemEval-2026 Task 8 (MTRAGEval) を4つの英語ドメインにまたがるタスクA (Retrieval) に参加するシステムについて述べる。
提案手法では,(1) コンテキスト依存の追従質問をスタンドアロンのクエリに変換するLoRA-fine-tuned Qwen 2.5 7Bモデルによるクエリ書き換え,(2) ハイブリッドBM25とReciprocal Rank Fusionによる高密度検索,(3) クロスエンコーダをBGE-reranker-v2-m3で再配置する。
論文参考訳(メタデータ) (Tue, 12 May 2026 12:13:45 GMT)
CIDR: A Large-Scale Industrial Source Code Dataset for Software Engineering Research [0.0] データセットは、138言語にまたがる2,440のリポジトリで構成され、総コード数は373万行で、リポジトリごとのメタデータが構造化されている。
このデータセットは、コードインテリジェンス、ソフトウェア品質分析、コード言語モデルの事前トレーニングと微調整、開発者行動研究、エージェント評価ベンチマークの構築をサポートすることを意図している。
論文参考訳(メタデータ) (Tue, 12 May 2026 14:07:17 GMT)
CADS: Conformal Adaptive Decision System for Cost-Efficient Image Classification [0.0] 高容量AIモデルには最先端のパフォーマンスがあるが、その実践的デプロイメントは、高い推論コスト、環境への影響、"ワンサイズフィット"アプローチによって妨げられることが多い。
本稿では,資源割り当ての最適化を目的とした逐次的マルチモデルアルゴリズムであるCADSを提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 19:38:09 GMT)
Black-Box Optimization of Mixed Binary-Continuous Variables: Challenges and Opportunities in Evolutionary Model Merging [0.0] 本稿では、パラメータ空間のマージ、データフロー空間のマージ、ハイブリッドアプローチの3つのカテゴリに分類し、進化モデルマージ技術に関する構造化された調査を行う。
我々は、DFSマージ問題を、混合二項連続変数、高次元探索空間、変数型間の条件依存性を含むブラックボックス最適化問題として公式に特徴付けている。
本研究では,二項連続条件依存性に係わる構造的アプローチが,有効探索空間を51.4%削減しつつ,非構造的アプローチを6.7%精度で上回ることを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:08:47 GMT)
Bin Latent Transformer (BiLT): A shift-invariant autoencoder for calibration-free spectral unmixing of turbid media [0.0] この研究は、高密度エンコーダをクロスアテンションスキャナーに置き換えるBin Latent Transformer (BiLT)-Autoencoderを導入している。
物理制約付き線形デコーダは、強制吸収/散乱分離と3段階のカリキュラム拡張戦略により、アーキテクチャを完備する。
論文参考訳(メタデータ) (Tue, 12 May 2026 09:17:43 GMT)
Beyond Inefficiency: Systemic Costs of Incivility in Multi-Agent Monte Carlo Simulations [0.0] 我々は,Large Language Model (LLM) をベースとしたマルチエージェントシステム(Multi-Agent Systems)を制御社会学サンドボックスとして利用する。
我々は、様々な毒性条件にまたがって、何千もの構造化された1-on-1の敵対的議論を発生させる。
我々は, 毒性条件にかかわらず, 議論を開始するエージェントが有意に高い確率で勝利する, 重要な優先的優位性を見出した。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:54:03 GMT)
Belief-Space Residual Risk for Automated Driving under Localization Uncertainty [0.0] 自動走行システムの安全性への影響を評価するために、残留リスク指標が導入された。
この研究は、空間的残留リスクの定式化を、エゴがガウス分布として不確実性を示すことを明示的にモデル化することによって、信念空間に拡張する。
粒子に基づくリスク推定フレームワークでは、衝突確率の計算に局所化の不確実性が組み込まれている。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:16:52 GMT)
Before the Last Token: Diagnosing Final-Token Safety Probe Failures [0.0] 最終トーケンの安全プローブは、プロンプトプリフィルの後、単一の隠れ状態を監視する。
クリーンで有害なプロンプトと良性なプロンプトのみをトレーニングしたSafeSwitch型プローブを用いて,このプリフィル時間障害モードについて検討した。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:30:24 GMT)
BatchBench: Toward a Workload-Aware Benchmark for Autoscaling Policies in Big Data Batch Processing -- A Proposed Framework [0.0] BatchBenchはオープンなベンチマークフレームワークで、平等な足場上でルールベース、学習、エージェントによるオートスケーリングポリシーを設定するように設計されている。
1)自動スケーリングベンチマークと公開クラスタトレースから合成された6つのバッチ処理クラスのワークロード,(2)2サンプルのKolmogorov-Smirnovとアースモーバー距離に基づく検証手法,(3)コスト,SLA達成,スケール応答性,スケールスラッシュ,決定解釈性を含む5軸評価ハーネス仕様,(4)LLMベースおよび強化学習オートスケーラをルールベースのコントローラとともに評価するための標準化されたエージェントインターフェース。
論文参考訳(メタデータ) (Tue, 12 May 2026 15:36:20 GMT)
BEHAVE: A Hybrid AI Framework for Real-Time Modeling of Collective Human Dynamics [0.0] 既存のAIシステムは、グループを安定させるか、エスカレーションやブレークダウンに移行するかを判断する集合的ダイナミクスを捉えていない。
相互作用空間上で定義された連続挙動場として集合力学をモデル化する形式的フレームワークであるBEHAVEを紹介する。
再検討された同じ分野は、群衆の安全、危機チームダイナミクス、教育、臨床状況に適用できる。
論文参考訳(メタデータ) (Tue, 12 May 2026 20:32:02 GMT)
Automated Big Data Quality Assessment using Knowledge Graph Embeddings [0.0] 本稿では,データ品質の自動評価を強化するための知識に基づく新しい手法を提案する。
提案手法では,知識グラフの埋め込みを利用して,入力データセットのコンテキスト表現間のエッジ不足を予測する。
このアプローチを評価するために、AmpliGraph(AccentureLabsが開発したベンチマークフレームワーク)を活用しました。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:51:38 GMT)
Auditing African Content Moderators' Working Conditions by Using the European General Data Protection Regulation (GDPR) [0.0] 雇用契約やNDAといった要素へのアクセス範囲を示す。
結果は、コンテンツモデレーターが直面する構造上の欠点を法的に根拠づけた証拠を提供する。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:55:36 GMT)
Assessment of cloud and associated radiation fields from a GAN stochastic cloud subcolumn generator [0.0] 現代の地球系モデル(ESM)は、典型的な雲の特徴よりもはるかに大きな水平スケールで運用されている。
従来の物理ベースのジェネレータは、しばしば分析的なクラウド重複パラダイムに依存している。
本稿では,GEOS大気モデルのための新しい2段階機械学習サブカラム生成手法を提案する。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:19:57 GMT)
Albertian Channel Memory in Black-Hole Evaporation [0.0] 我々は、地平線記号がアルベルト代数J3(O)を形成するオクトニオン魔法超重力について研究する。
パース理論は地平線データを、隠れた例外的な補体、インターフェイスリレー、および2重の外部検出器に分割する。
その結果は、復元されたAMPSテンソル因子化ではなく、例外的なメモリを持つ通常の読み出しである。
論文参考訳(メタデータ) (Tue, 12 May 2026 00:13:39 GMT)
Advanced Scientific Methodology Plays Rossini [0.0] 「本研究は、ジョアチーノ・ロッシーニが同じメタスタシオ・アリエッタ・ミ・ラグナー・タコドー(Metastasio arietta Mi lagner tacendo)」で構成した多くの構成のうちの1つの構造解析を指向した方法論的アプローチを提案する。」
研究成果は,文献学研究を支える体系的な研究の基盤を築き,創造的過程を研究するための生成モデルの利用の道を開いた。
論文参考訳(メタデータ) (Tue, 12 May 2026 06:24:12 GMT)
AGOP as Explanation: From Feature Learning to Per-Sample Attribution in Image Classifiers [0.0] サンプルごとの勾配を sqrt(diag(M) / max diag(M) で乗算する新しい属性法 AGOP-Weighted を導入する。
我々は,AGOP属性を統合グラディエント(IG),SmoothGrad,GradCAM,VanillaGradに対して厳密に比較した。
AGOP-Global は IG よりも 44% 高い mIoU を達成する; AGOP-Global は IG よりも 7倍高い mIoU を達成する。
論文参考訳(メタデータ) (Tue, 12 May 2026 23:15:47 GMT)
A nonlinear extension of parametric model embedding for dimensionality reduction in parametric shape design [0.0] パラメトリックモデル埋め込み(PME)は、幾何学的情報から縮小変数を構成することでこの問題に対処する。
本稿では, PME の非線形拡張, NLPME について述べる。
提案するフレームワークは,線形化部分空間を非線形潜在表現に置き換えつつ,PMEの定義原理を保存する。
論文参考訳(メタデータ) (Tue, 12 May 2026 08:32:39 GMT)
A microservices-based endpoint monitoring platform with predictive NLP models for real-time security and hate-speech risk alerting [0.0] この研究は、テレメトリを収集し、リアルタイムのセキュリティとコンプライアンスをサポートするために予測自然言語処理モデルを適用する、統合されたエンドポイントベースのプラットフォームを提案する。
テキスト分類では、BERTなどのトランスフォーマーモデルを用いてヘイトスピーチのリスク検出を行い、平均精度は87%である。
実験の結果,提案プラットフォームは,アラート管理を集中化しながら,データ流出やポリシー違反の指標を迅速に提示できることが示唆された。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:46:46 GMT)
A categorical error sensitivity index (ISEC): A preventive ordinal decision-support measure for irrecoverable errors in manual data entry systems [0.0] 本稿では,分類的誤り感指数 (Categorical Error Sensitivity Index, ISEC) について紹介する。
ISECは、意味的距離(単語埋め込みによる)、カスタマイズされた重み付け形態素変換コスト、経験的頻度を統一された数学的に堅牢な予防フレームワークに統合する。
論文参考訳(メタデータ) (Tue, 12 May 2026 16:11:02 GMT)
A Transfer Learning Evaluation of Deep Neural Networks for Image Classification [0.0] トランスファーラーニング(Transfer Learning)は、ソースドメインから以前取得した知識を使用して、学習した重みを再利用してターゲットドメインでの学習を強化する機械学習技術である。
本稿では,画像分類タスクにおいて,対象領域の要求を満たす最適な事前学習モデルを選択する方法について検討する。
論文参考訳(メタデータ) (Tue, 12 May 2026 11:40:49 GMT)
A Quantum Multi-Programming Framework to Maximize Quantum Resources for the LUCJ Ansatz [0.0] 本稿では,局所ユニタリクラスタ・ジャストロウ(LUCJ)の量子マルチプログラミングによる量子化学問題への取り組みを提案する。
分子系の基底状態エネルギーはサンプルベース量子対角化(SQD)によって得られる
クロストークは、マルチプログラミングフレームワークにおいて既知の問題であり、シミュレーションされたシステムの基底エネルギー推定を損なう可能性がある。
論文参考訳(メタデータ) (Tue, 12 May 2026 18:04:28 GMT)
A Mimetic Detector for Adversarial Image Perturbations [0.0] 敵は、クリーンな画像に小さなほとんど見えないノイズパターンを加えることで、ディープイメージ分類器を騙す。
オープンソースMOLEライブラリの高階Corbino-Castilloミメティック演算子を用いた単発無訓練検出器を用いてこれを活用する。
標準のtextttpeppers テスト画像上の検出器を標準$ellinfty$ budget $varepsilon = 16/255$で検証し、クリーンvs-逆分離を観測し、オーダー$k=2で3.55times$から単調に成長する。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:09:53 GMT)
A Mechanistic Investigation of Supervised Fine Tuning [0.0] Supervised Fine-Tuning (SFT) は、モデルのアクティベーション・ジオメトリをほとんど乱さないままにしている。
ベースモデル上で事前訓練されたスパースオートエンコーダを通じて、両方のアクティベーションセットを投影すると、基礎となるスパースラテントが著しく分散することが明らかになった。
論文参考訳(メタデータ) (Tue, 12 May 2026 02:22:48 GMT)
A Framework for institutional change in the age of AI [0.0] ジェネレーティブAIは、STEM高等教育を急速に変えつつある。我々の教育実践が変化しているだけでなく、教育変革に関する考え方も適応しなければならない。
インタラクティブなエンゲージメントを目的とした既存のSTEMの制度的変化のモデルは、採用論理に大きく従っている。
これらの仮定は、到着技術である生成AIには当てはまらない - 十分な教育的証拠ベースを形成する前に、教室に入る。
論文参考訳(メタデータ) (Tue, 12 May 2026 21:11:13 GMT)
A Controlled Study of Memory Hierarchy Transitions in Quantum Circuit Simulation on Apple M4 Pro Unified Memory Architecture [0.0] 状態ベクトル量子回路シミュレーションはメモリ帯域境界である。
Apple M4 Pro Unified Memory Architectureを使ってこの問題に対処する。
ピークストリーミング帯域幅は、連続しないメモリアクセスパターンのシミュレーションスピードアップを予測できないことを示す。
論文参考訳(メタデータ) (Tue, 12 May 2026 04:34:55 GMT)
A CAP-like Trilemma for Large Language Models: Correctness, Non-bias, and Utility under Semantic Underdetermination [0.0] 本稿では,大言語モデル(LLM)に対するCAP様予想を定式化する。
提案されたトリレンマは、意味的下決定の下では、LLMは常に強い正当性、厳密な非バイアス、高ユーティリティを保証できない。
論文参考訳(メタデータ) (Tue, 12 May 2026 07:28:38 GMT)