Reinforcing Dual-Path Reasoning in Spatial Vision Language Models [113.9] 本稿では,空間的VLMにLOR(Language-Only Reasoning)とDTR(Detect-Then-Reason)の2つの相補的推論経路を持つ統一的なフレームワークを提案する。
様々な空間ベンチマークにおいて、SR-REALは空間的VLMベースラインを著しく上回る。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:32:39 GMT)
Dynamic Rollout Editing for Reducing Overthinking in RL-Trained Reasoning Models [102.8] 長い形式の連鎖推論は複雑なタスクのパフォーマンスを向上させることができる。
しかし、正しい答えが現れた後、モデルはしばしば不要な推論を生成し続ける。
我々はこの現象をGRPO型強化学習の観点から研究する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:10:30 GMT)
Qwen-RobotNav Technical Report: A Scalable Navigation Model Designed for an Agentic Navigation System [96.1] Qwen-RobotNavは、Qwen-RobotNav上に構築されたスケーラブルなナビゲーションモデルである。
156万のサンプルでQwen-RobotNavをトレーニングします。
Qwen-RobotNavは、主要なナビゲーションベンチマークにまたがって、最先端の結果を新たに設定する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:17:44 GMT)
Qwen-RobotManip Technical Report: Alignment Unlocks Scale for Robotic Manipulation Foundation Models [95.8] 本稿では、Qwen-VL上に構築された一般化可能なビジョン・ランゲージ・アクション基盤モデルであるQwen-RobotManipを提案する。
Qwen-RobotManipは、操作の表現、動き、行動の次元にわたって統合されたアライメントフレームワークを導入している。
人間とロボットの合成パイプラインは、エゴセントリックな手の動きを15プラットフォームにわたるロボットの軌道に変換する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:14:39 GMT)
EBench: Elemental Diagnosis of Generalist Mobile Manipulation Policies [92.6] 本稿では,一般のモバイル操作ポリシーを診断するシミュレーションベンチマークであるEBenchを紹介する。
EBenchは5つの能力次元と4つの一般化次元に沿ってアノテートされた26の多様で挑戦的な操作タスクで構成されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:58:22 GMT)
From Reasoning Traces to Reusable Modules: Understanding Compositional Generalization in Language Model Reasoning [92.2] 訓練後パイプラインは教師付き微調整と強化学習を組み合わせたものである。
我々はSFTが原モジュール材料を組成トレースで供給していることを示し、RLはそれらのトレースを分解して潜伏する原子モジュールを同定する。
化合物トレースのトレーニングは、孤立した原子モジュールのトレーニングよりも強い一般化をもたらす。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:55:28 GMT)
Zone of Proximal Policy Optimization: Teacher in Prompts, Not Gradients [89.9] 近親政策最適化ゾーン(ZPPO)は、ヴィゴツキーの近親開発ゾーンに触発されたものである。
ZPPOは1つの正しい教師の反応と1つの間違った学生の反応を、生徒が識別しなければならない匿名候補としてペアリングする。
プロンプト再生バッファは、生徒の平均ロールアウト精度が半分に達するか、FIFOが削除されるまで、各難問を再循環する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:46:02 GMT)
DeNovoSWE: Scaling Long-Horizon Environments for Generating Entire Repositories from Scratch [89.9] リポジトリ全体生成のための大規模データセットである textbfDeNovoSWE を紹介する。
DeNovoSWEは4,818の高品質なインスタンスで構成されており、各インスタンスはドキュメントから完全なリポジトリを生成する必要がある。
DeNovoSWE上の微調整Qwen3-30B-A3Bは、長期SWEのパフォーマンスを大幅に改善し、挑戦的なBeyondSWE-Doc2Repoベンチマークのスコアを5.8%から47.2%に引き上げた。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:49:03 GMT)
Divide, Deliberate, Decide: A Multi-Agent Framework for Fine-Grained Egocentric Action Recognition [86.4] エゴセントリックビデオにおけるきめ細かいアクション認識はビジョンランゲージモデルでは難しい。
完全ローカルでゼロショットのマルチエージェントフレームワークであるDivide, Deliberate, Decideを提案する。
実験により,本手法はベースライン上でのゼロショット動作認識性能を肯定的に向上することが示された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:31:27 GMT)
Evaluating Large Language Models Abilities for Addressee, Turn-change, and Next Speaker Prediction in Meetings [85.4] 大規模言語モデル(LLM)を用いたマルチモーダル多人数会話におけるターンテイクの検討
アドレス検出,ターンチェンジ予測,次の話者予測という3つのタスクに対する評価フレームワークを構築した。
我々は、これらのタスク、テキストベースLLM、マルチモーダルLLM(MM-LLM)、およびヒトの被験者を対象に訓練された教師付きモデルを比較した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:46:44 GMT)
Reasoning as Intersection: Consensus-Frame Alignment for Visual Focus in Video-MLLMs [81.0] 強化学習は、大規模言語モデルの推論能力を改善した。
結果のみの報酬をビデオマルチモーダルな大規模言語モデルに適用することは、どの視覚的証拠が答えを支持するべきかを限定的なガイダンスを提供する。
本稿では,エビデンス対応ビデオ推論のための時間アノテーションフリープロセスレベル報酬フレームワークであるConsensus Frame GRPOを紹介する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:42:54 GMT)
Qwen-RobotWorld Technical Report: Unifying Embodied World Modeling through Language-Conditioned Video Generation [80.9] 具体的インテリジェンスのための言語条件付きビデオワールドモデルであるQwen-RobotWorldを紹介する。
ロボット操作、自律運転、屋内ナビゲーション、人間とロボットの移動など、現在の観察結果から、物理的に基礎付けられた将来の視覚軌道を予測する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:55:52 GMT)
Unified Multimodal Autoregressive Modeling with Shared Context-Visual Tokenizer is Key to Unification [80.6] UniARは統合された自己回帰フレームワークであり、単一のビジュアルトークン化器が理解と生成の鍵となる。
UniARは、マルチレベル特徴融合とルックアップフリービットワイド量子化スキームを備えた事前訓練されたビジョンエンコーダを適応する。
拡散に基づく視覚デコーダは、離散的な視覚トークンで高忠実度画像をデコードする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:59:22 GMT)
PermaVid: Consistent Video Generation Across Edits via Disentangled Context Memory [80.6] PermaVidは、空間コンテキストを意味的な外観と幾何学的構造に分解するマルチモーダルなコンテキストメモリ上に構築された新しいフレームワークである。
本手法は,編集後の長期的セマンティクスと構造的整合性を強く維持し,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:33:07 GMT)
EnvRL: Learn from Environment Dynamics in Agentic Reinforcement Learning [78.6] 強化学習(RL)は大規模言語モデル(LLM)をエージェントとして訓練するための強力なパラダイムとして登場した。
本稿では,環境動態学習をエージェントRLに組み込むフレームワークであるEnvRLを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:48:09 GMT)
Guava: An Effective and Universal Harness for Embodied Manipulation [74.3] 実装された操作能力を4Bオープンソースモデルに蒸留するエンドツーエンドのトレーニングパイプラインを開発した。
結果は、よく設計されたハーネスが、エンボディド操作のためのスケーラブルでモデルに依存しないインターフェースとして機能することを示唆している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:09:26 GMT)
Attribution-Guided and Coverage-Maximized Pruning for Structural MoE Compression [74.0] そこで本研究では,MoEモデルに適した構造解析フレームワークを提案する。
我々のアプローチはメモリフットプリントを5.27$times削減し、最先端のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:53:27 GMT)
LoopCoder-v2: Only Loop Once for Efficient Test-Time Computation Scaling [72.7] 本研究では,ゲインコストの観点から,ループ数選択について検討する。
この研究は18Tトークンのスクラッチからループ数が異なるループ数でLoopCoder-v2をトレーニングし、それにマッチした命令チューニングと評価を行う。
実証的には、この2ループ版はコード生成、コード推論、エージェントソフトウェアエンジニアリング、ツールスベンチマークなど、非ループベースラインよりも幅広い利益をもたらしている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:03:05 GMT)
Fixed-Point Reasoners: Stable and Adaptive Deep Looped Transformers [72.7] 本稿では,ループ型アーキテクチャにおける終端停止機構として固定点収束を用いたトランスフォーマーベースの固定点推論モデルを提案する。
FPRMは、Sudoku、Maze、state-tracking、ARC-AGIといった一般的な推論ベンチマークで有効である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:36:33 GMT)
ThinkingVLA: Interleaved Vision and Language Reasoning for Robotic Manipulation [71.7] 我々は、操作計画が自然に予測に分解され、次の視覚状態が予測され、逆ダイナミクスとなることを論じる。
我々は、この分解を実現する生成モデルである textbfThinkingVLA を提案する。
シミュレーションと実世界のベンチマークの実験では、ThinkingVLAは最先端のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:45:17 GMT)
OPD-Evolver: Cultivating Holistic Agent Evolver via On-Policy Distillation [71.6] メモリは、自己進化エージェントの標準的な基盤になっているが、その経験を維持することは、それを通して進化する方法を学ぶことと同じではない。
OPD-Evolver(英語版)は、政策上の自己蒸留を通じて、そのようなエージェントを進化させる緩やかな共進化フレームワークである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:33:53 GMT)
Future Dynamic 3D Reconstruction: A 3D World Model with Disentangled Ego-Motion [69.6] 本研究では,将来の動的3次元再構成のための3次元潜在表現を予測する世界モデルFR3Dを提案する。
実験では、FR3Dが将来的な動的3D再構成において、複数のデータセットにまたがるモノラルな観察から2秒後まで、強力なパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:59:46 GMT)
Beyond Domains: Reusing Web Skills via Transferable Interaction Patterns [68.1] SkillMigratorは再利用可能なWebスキルを学習し、特定の要素参照ではなくレイアウト構造にマッチしてサイト間でそれらを転送する。
WebArenaとMind2Webの両方において、成功軌道上の平均LCM-アクション数を、一致した成功速度で8-10%削減する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:04:35 GMT)
Kairos: A Native World Model Stack for Physical AI [66.8] これらの要件に基づいて設計されたネイティブなワールドモデルスタックであるKairosを紹介します。
カイロスは、クロス・エボディメント・パラダイム・データ・カリキュラムが支配するネイティブ・プレトレーニングの先駆者として世界を学ぶ。
Kairosは、ハイブリッド線形時間アテンションを備えたネイティブ統一アーキテクチャにおいて、統一された世界理解、生成、予測によって世界を維持している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:06:38 GMT)
GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine? [65.4] ゲーム生成はゲームエンジン内で行われ、スクリプト、シーン、アセット、レンダリング、実行時インタラクションは共同でコヒーレントなゲームプレイを生成する必要がある。
我々は、完全なゲームアーティファクトを生成する問題として、エンド・ツー・エンドのゲーム生成を形式化する。
我々は、このフレームワークを15のゲームファミリーで140のGodotタスクからなるベンチマークであるGameCraft-Benchとしてインスタンス化する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:34:39 GMT)
A Closer Look at Failure Modes in Temporal Understanding of Large Audio-Language Models [64.7] 大規模音声言語モデル(LALM)は、様々な音声理解タスクにおいて高いパフォーマンスを達成するが、時間的推論に苦慮する。
メカニスティック解析のために設計された3つの基礎的タスクに対して,1,657問のベンチマークを導入する。
拡張性に対する注意の重み付けを比較すると、音声トークン間での注意の再分配は、音声の注意を増大させるよりも効果的であることがわかった。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:57:56 GMT)
SING: Synthetic Intention Graph for Scalable Active Tool Discovery in LLM Agents [64.6] 大規模言語モデル(LLM)エージェントは、コンテキスト、ツール、マルチターン実行を管理するハーネスに依存している。
Retrieval-augmented Tool selectionは、自然な代替手段を提供するが、既存のワンショット検索方法は、独立したツール記述とエージェントの真のタスク意図との整合に失敗する。
我々は、ユーザ意図、ツール機能、ツールコラボレーションパターンをリンクするインテントツーオールグラフを構築する、意図認識型のアクティブツール発見フレームワークであるSINGを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:43:21 GMT)
VISUALSKILL: Multimodal Skills for Computer-Use Agents [63.8] ターゲットアプリケーション毎に調整された階層型マルチモーダルスキルであるVISUALSKILLを提案する。
著者によるドキュメンテーションとライブアプリケーションUI探索を組み合わせた2段階のパイプラインで、それぞれのスキルを構築します。
2つのCUAベンチマークでは、Claude Code CLIエージェントがClaude Opus 4.6によって支援され、VISUALSKILLで平均スコア0.456に達した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:57:07 GMT)
GASE: Gaussian Splatting-Based Automated System for Reconstructing Embodied-Simulation Environments [63.2] 実世界での実施エージェントの訓練には熟練したオペレーターと高価なハードウェアが必要である。
シミュレーション環境は、大規模で費用対効果の高いデータ拡張を可能にすることで、魅力的な代替手段を提供する。
シミュレーションシーンを最小限のsim-to-realギャップで高速に構築することは、ロボット学習において重要な目標となっている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:00:42 GMT)
StereoFactory: A Unified Merging Framework for Robust Stereo Matching [62.0] ステレオマッチングは、大規模なデータセットでトレーニングされた基礎モデルを通じて進歩しているが、このパラダイムはスケーラビリティのボトルネックに悩まされている。
モデルマージは、ソースチェックポイントが利用可能になった後、特別なモデルからの知識を統合することで、スケーラブルなポストホックな代替手段を提供する。
本稿では,適応モデルマージのための粗大な進化的フレームワークであるStereoFactoryを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:36:59 GMT)
GeneralVLA-2: Geometry-Aware Reconstruction and Governed Memory for Robot Planning [61.4] GeneralVLAは、言語とRGB-Dの観察を3Dのエンドエフェクタパスに変換するための階層インターフェースを提供する。
幾何誘導型MV-SAM3D再構成部であるGeoFuse-MV3Dを紹介する。
我々はKnowledgeBankを長期記憶システムにアップグレードする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:45:24 GMT)
LiveStarPro: Proactive Streaming Video Understanding with Hierarchical Memory for Long-Horizon Streams [59.5] このLiveStarProは、長時間のストリーミング上でのプロアクティブなビデオ理解のために設計されたライブストリーミングアシスタントである。
LiveStarProは既存のメソッドを一貫して上回り、セマンティックな正確性は28.9%向上した。
そのストリーミングキーバリューキャッシュは、キャッシュなしで同じモデル上で1.58倍の推論速度を得る。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:18:05 GMT)
A Critical Discourse Analysis of Gender Representation in Software Engineering Education Videos on YouTube [54.5] 本研究では,手動で分析した200の英語およびドイツ語のソフトウェア工学チュートリアルについて,YouTube上で批判的談話分析を行った。
以上の結果から,男性キャラクタと男性言語的デフォルトがチュートリアルを支配していることが示唆された。
我々は,男性俳優にのみ技術と意思決定の役割が割り当てられるエージェンシーギャップを特定した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:18:37 GMT)
TeleStyle V2: Beyond Content-Preserving Style Transfer with Self-Distillation and Distribution-Matching-Distillation [54.1] コンテンツ参照とスタイル参照が与えられた場合、コンテンツ保存スタイル転送は、スタイル化された出力を生成するモデルを必要とする。
TeleStyle V1は、フォトリアリスティックなコンテンツ参照と芸術スタイル参照で訓練されている。
TeleStyle V2は、Realistic-and-Realistic(RnR)、Realistic-and-Stylized(RnS)、Stylized-and-Stylized(SnS)の形式でContent-Style参照をサポートする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:45:33 GMT)
An expressivity analysis of hierarchical modelling in deep transformers via bounded-depth grammars [54.1] ディープニューラルネットワークは、その表現力は、テクスブ階層的表現を形成する能力から導かれると広く信じられている。
言語モデリングでは、textbftransformerが支配的なアーキテクチャとして登場し、初期のレイヤはローカルの構文パターンをキャプチャし、後のレイヤはより複雑な節レベルの依存関係をコードしている。
これらのアーキテクチャは、抽象文法状態が残留ストリーム内の低次元の線形分離可能部分空間に符号化される構造的能力を持っていると論じる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:02:13 GMT)
EgoCS-400K: An Egocentric Gameplay Dataset for World Models [53.9] EgoCS-400Kは,世界モデルのための大規模リプレイ・グラウンド型Egocentric Counter-Strikeデータセットである。
パブリックプロのCSとCS2のマッチデモから作られ、人間のゲームプレイの軌跡を保存している。
EgoCS-400Kには、1000以上の試合と4万回以上のラウンドから40万人以上の個人ビデオと1万時間のゲームプレイが含まれている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:13:58 GMT)
From Sparse Features to Trustworthy Proxies: Certifying SAE-Based Interpretability [53.7] 我々は,SAEに基づく説明を,基盤となる凍結LMの忠実な見方として扱うことができるかを検討した。
この枠組みは, 4つの測定可能な量を用いて, 基本モデルの予測リスクの上限を導出する。
我々は, GPT-2 Small, Gemma-2B, Llama-3-8B のサンプルサイズにおいて, 境界が非空洞となることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:28:23 GMT)
Universal Image Restoration via Internalized Chain-of-Thought Reasoning [52.8] 画像復元は、劣化した入力から高品質なイメージを復元しようとするが、複雑な混合劣化の下で非常に悪影響を及ぼす。
最近の研究は、特別なモジュールを用いた複数ラウンドの復元のためのChain-of-Thought (CoT)推論を採用する。
CoTIRは,単一モデル内でCoT推論を内部化する汎用画像復元フレームワークである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:01:36 GMT)
LLMZero: Discovering Adaptive Training Strategies for RL Post-Training via LLM Agents [51.7] トレーニング後の戦略はデータセットに依存しており、繰り返し発生する経験的パターンを明らかにする。
正規化パラメータは、シフトトレーニングのダイナミクスに応答して発振する。
我々は,LLMエージェントが木探索を通じて学習軌跡を探索するシステムを用いた。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:33:08 GMT)
PAIWorld: A 3D-Consistent World Foundation Model for Robotic Manipulation [51.4] PAIWorldは3つのコアコンポーネントを通じて拡散変圧器の世界モデルを拡張するフレームワークである。
ロボットベンチマークで最先端のマルチビュー3D一貫性を実現し、WorldArenaのリーダーボードで1位、AgiBot-Challenge2026のリーダーボードで2位にランクインした。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:23:23 GMT)
Knowledge Reutilization in Meta-Reinforcement Learning [51.1] 本稿では,動的に単純化されたエージェント上でタスクレベルの知識を学習し,それを異種エージェントに転送するメタ知識再利用フレームワークを提案する。
我々のフレームワークは、最新の最先端ベースラインと比較して、最終段階のトラッキングエラーを94.75% -- 99.79%削減している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:32:28 GMT)
Recover, Discover, Plan: Learning Skills and Concepts from Robot Failures [50.7] ReSYNCは、スキルと概念を学び、抽象的な計画を支援するために抽象ライブラリを洗練するロボットである。
本稿では,ReSYNCの抽象ライブラリを継続的に拡張・改良する能力により,従来は見つからなかった長期の問題を解くことができることを示す。
全体として、ReSYNCは、スケーラブルで障害対応の計画のための抽象化を自律的に取得するロボットにとって、重要なステップである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:59:57 GMT)
Bounding Box Label Propagation for Re-Annotation of Document Layout Analysis Datasets [49.3] BBLP(Bounding Box Label Propagation)は、オブジェクト検出のための擬似ラベリングフレームワークである。
境界ボックスの高品質なクラスアノテーションを生成する。
完全な教師付きパフォーマンスの81.6%に相当する54.0%のmAPを達成し、10%のラベル付きデータしか使用していない。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:04:27 GMT)
L-Proto: Language-Aware Episodic Prototypical Training for Multilingual Speaker Verification [49.1] 本稿では,L-Protoを提案する。
TidyVoice Challengeベンチマークの実験では、従来の微調整およびランダムなエピソードサンプリングよりも一貫した性能向上が示されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:57:41 GMT)
Nested Sampling: A Critical and Comprehensive Theoretical Guide [48.6] ネストサンプリング(NS)技術は特に宇宙論や天文学において広く注目を集めている。
この研究は、NS派生の包括的で詳細な説明を提供し、その理論的基礎と実践的課題の両方を明確にしている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:34:38 GMT)
Greedy Coordinate Diffusion: Effective and Semantically Coherent Adversarial Attacks via Diffusion Guidance [48.3] 大規模言語モデルに対するアドリアック攻撃は、広範な研究にもかかわらず、実用的影響が限られている。
本稿では,Greedy Coordinate Diffusion(GCD)について紹介する。
GCDは、敵の本来の意図に低い難易度と高い意味的固執を維持している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:29:31 GMT)
A New Multi-Domain Benchmark for Micro-Action Recognition and Detection [48.3] MMA-82は、マイクロアクション分析のためのMA-52ベンチマークの大規模マルチドメイン拡張である。
MMA-82は、現実的なマイクロアクション分析のための包括的で挑戦的なベンチマークであり、人間中心のAIにとって貴重なリソースである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:41:34 GMT)
Plug-and-Adapt: Multimodal Coreference Resolution at First Sight with a Pretrained Alignment Model [47.8] 既存のMCR(Multi-modal Coreference Resolution)メソッドでは、適用前にターゲットデータセットからの注釈付きデータをトレーニングする必要がある。
そこで本研究では,MCRタスクの即時使用のために,慎重に事前訓練された適応モデルを戦略的に適用するプラグイン・アンド・アダプティブ手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:04:13 GMT)
Predicting Immune Biomarkers with MultiModal Mixture-of-Expert Pathology Foundation Models Empowers Precision Oncology [47.8] MixTIMEは、異なるモダリティで訓練された病理基盤モデルを統合したマルチモーダル基礎モデルである。
ヘマトキシリンおよびエオシン全スライディング画像から多重免疫蛍光(mIF)タンパク質の発現を予測する。
MixTIMEは17個のタンパク質マーカーにまたがる最先端のパフォーマンスを相関指標で測定する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:22:42 GMT)
PhaseWin: An Efficient Search Algorithm for Faithful Visual Attribution [47.2] 忠実な視覚帰属のための効率的なサブセット探索アルゴリズムであるフェイズウィンを提案する。
PhaseWinは、greedy領域の選択をフェーズドウィンドウ検索手順に再編成する。
グローバルな候補スクリーニング、適応プルーニング、および局所的なウィンドウリファインメントを交互に行う。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:53:30 GMT)
VEGA: Learning Navigation VLAs from In-the-Wild Egocentric Video with Geometric Trajectory Supervision [46.6] VEGAは、ラベルのないエゴセントリックなナビゲーションビデオから、ナビゲーションナビゲーションのVLA(VisionLanguage-Action)モデルをトレーニングするためのアプローチである。
VEGAはこのギャップをモノクロビデオから局所的なシーン形状を再構築することで解決する。
VEGA-Benchは250万のシーンと約500万のナビゲーション目標とシーン幾何学を組み合わせたベンチマークである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:21:14 GMT)
Show the Signal, Hide the Noise: Spectral Forcing for Pixel-Space Diffusion [46.5] 本稿では,パラメータフリーで時間条件付き2D-DCTローパス演算子であるSpectral Forcingを導入する。
その遮断は拡散時間とともに単調に膨張し、データエンドポイントのアイデンティティとなる。
JiT-700M/32のImageNet-256では、Spectral Forcingは、異なるトレーニングエポック間で、FIDとInception Scoreの両方を一貫して改善している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:59:42 GMT)
A homotopy-type-theoretic generalization of neurosymbolic inference [46.4] ニューロシンボリック(NeSy)システムは1つの機能を計算する:$$-structuresの空間上の論理量の信念重み付け和。
我々は、NeSy系のスクラッチからフレームワークを開発し、対称性が自明なときに古典関数を復元する保守性定理を証明し、我々のフレームワークが提示する対称性が、まさにショートカットの推論の背後にあるものであることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:22:12 GMT)
EvolveNav: Proactive Preflection and Self-Evolving Memory for Zero-Shot Object Goal Navigation [46.3] Zero-Shot Object-Goal Navigation (ZS-OGN) は、事前の訓練なしにターゲット対象を探索し、発見するための実施エージェントを必要とする。
本稿では,連続的なテスト時間改善を実現する自己進化型ZS-OGNフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:56:57 GMT)
Self-CTRL: Self-Consistency Training with Reinforcement Learning [46.0] 自身の振る舞いを忠実に記述した言語モデル(LM)は、ユーザがより容易に監査、理解、信頼することができる。
本稿では,LMの自己説明と関連する入力に対する動作の一貫性を最適化する自己整合性学習(Self-CTRL)について述べる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:59:40 GMT)
DRFLOW: A Deep Research Benchmark for Personalized Workflow Prediction [44.6] 多くのエンタープライズタスクは、アクションステップのシーケンスであるコンクリートを特定するためにエージェントを必要とします。
異種ソースからのパーソナライズされた予測を評価するためのベンチマークであるDRFLOWを紹介する。
DRFLOWには5つのドメインに100のタスクがあり、3900以上のソースに1,246の参照ワークフローステップがある。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:22:07 GMT)
Ground- and excited-state energies extraction via Trotterization on IBM quantum computers [43.7] 我々はIBM量子コンピュータ上でTrotterized time-evolution演算子を用いたHadamardテストを実装した。
横フィールドイジングモデル(TFIM)と横フィールドイジングモデル(TLFIM)の基底および励起状態エネルギーを同時に抽出する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 23:00:45 GMT)
WAM-RL: World-Action Model Reinforcement Learning with Reconstruction Rewards and Online Video SFT [42.8] World-Action(WA)モデルは強力な一般化能力とデータ効率を示す。
WAM-RLは世界モデルとアクションモデルの協調最適化を可能にする強化学習フレームワークである。
私たちの研究は、World-Actionパラダイムに強化学習を導入する最初のものです。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:29:12 GMT)
Memory-Efficient Meta-Reinforcement Learning for Adaptive Safety-Critical Control in Adversarial Spacecraft Proximity Operations [42.5] 本稿では,3つの繰り返しネットワークアーキテクチャ (LSTM, Gated Recurrent Unit (GRU), Selective State Space Model (Mamba)) と2つのトレーニングアルゴリズム (Proximal Policy Optimization (PPO) とSoft Actor Critic (SAC)) の性能を調べた。
以上の結果から, PPOを用いた場合のMambaのような状態空間モデルは, 他のアーキテクチャと比較して, タスク完了, 安全性, 省エネ性が優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:53:54 GMT)
A polynomial-time approximation scheme for minimum-weight decoding of topological codes [42.4] 2D TTI)安定化符号の2次元トポロジカル変換は、フォールトトレラント量子計算の中心に位置する。
これらの符号の最小重復号化は、最近、基本的な設定でもNPハードであることが示されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:44:08 GMT)
Strategies for preventing and reversing polarized online discourse [42.0] 政治的分極は現代の民主主義に様々な課題をもたらす。
自由表現を維持しながら建設的な言論を促進する方法を見つけることは、ソーシャルメディアプラットフォームにとって大きな課題となっている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:52:19 GMT)
Neural Tree Reconstruction for the Open Forest Observatory [42.0] オープンフォレスト天文台(英語: Open Forest Observatory、OFO)は、大学や他のパートナーが協力して、低コストの森林地図を利用できるようにしている。
OFOは、地理空間の森林データのデータベースと、無人航空機による森林マッピングのためのオープンソースの方法とツールの両方を構築している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:53:18 GMT)
INI-VPINN: A Variational Physics-Informed Neural Network with Implicit Neumann and Interface Handling for Multi-Material Domains with Geometric Singularities [42.0] INI-VPINNと呼ばれる新しい弱形式物理情報ニューラルネットワーク手法を提案する。
自然にノイマン境界と界面条件を変分定式化に組み込む。
提案手法は,ニューラルネットワークを用いた複素測地とニューマン・ディリクレ境界条件の混合による多材料問題の解法である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:06:15 GMT)
Toward Simultaneously Optimal Regret in U-Calibration [41.4] 既存のU校正アルゴリズムは、すべての有界固有損失に対して、最悪のケースの最適$O(sqrtT)$後悔を達成する。
正方形損失のような滑らかな損失であっても、最適の$O(log T)$後悔の代わりに$(sqrtT)$後悔を引き起こす。
具体的には,有界固有損失毎に$tilde O(sqrtT)$ regretを同時に達成する単一予測アルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:44:37 GMT)
MagicSim: A Unified Infrastructure for Executable Embodied Interaction [41.0] MagicSimは1つの決定論的バッチ実行と共有マルコフ決定プロセス(MDP)を中心に構築された実装された相互作用基盤である。
MagicSimは、内容、配置、行動、エージェントの露出を分離するYAMLファースト仕様から、タスクファミリ、インタラクションシステマティクス、物理、レイアウト、センサー、アバター、ロボットエボディメントを1つのリセット・ステップループで対象とするさまざまな実行可能な世界を構築している。
1つのタスク定義は、ベンチマークとRL評価、コマンドをグラウンド化されたトラジェクトリに自動的に変換するオートコレクトインターフェース、エージェント/VLM対応のインタラクションの3つの機能をサポートする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:42:43 GMT)
JetFlow: Breaking the Scaling Ceiling of Speculative Decoding with Parallel Tree Drafting [40.2] 投機的復号(SD)は、複数のトークンを起草し、それらを並列に検証することによって、自己回帰的大規模言語モデル(LLM)を加速する。
従来のヘッドベースSD法は因果効率ジレンマに直面していた。
本稿では,一方向起案効率と分岐的因果条件を組み合わせたヘッドベースSDフレームワークJetFlowを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:37:32 GMT)
Trust the Right Teacher: Quality-Aware Self-Distillation for GUI Grounding [39.6] VLMに基づくGUI接地のための品質認識型自己蒸留法を提案する。
正当性に気付くゲーティングと教師の確率スケーリングにより、教師の信号品質を向上させる。
我々の手法は一貫してベースモデルを改善し、強いベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:02:41 GMT)
RubricsTree: Scalable and Evolving Open-Ended Evaluation of Personal Health Agents across Health Memory and Medical Skills [39.4] 本稿では,100以上のアトミック,臨床的に検証可能なブールキュレーションの専門的階層的分類を用いたスケーラブルな評価フレームワークを提案する。
コンテキスト対応適応ルータは、クエリ毎の関連する自動重み付けサブセットのみをアクティベートする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:34:53 GMT)
GRACE-DS: a Guarded Reward-guided Agent Correction Environment in Data Science [39.1] GRACE-DSは、LSMを用いたオートMLエージェントの事前デプロイ評価のための、データサイエンスにおけるリワード誘導エージェント補正環境である。
エージェントをリアルなワークフローステージに公開し、計画やデータインスペクションから機能エンジニアリング、モデル開発、バリデーション、コード修正まで、最終提出まで。
これらの結果から、GRACE-DSはLLMベースのAutoMLエージェントが実運用環境下で機械学習を実行する能力を評価するための堅牢なプラットフォームとして確立された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 21:25:39 GMT)
Amortized Probabilistic Retrieval of Atmospheric CO2 from OCO-2 Spectra Using Deep Learning with Laplace Approximations and Normalizing Flows [39.0] NASAのOrbiting Carbon Observatory-2 (OCO-2)は、高分解能スペクトルを用いて平均的なCO2の乾燥空気モル分画を推定している。
現在の運用検索アルゴリズムは計算コストが高く、不確実性を適切に定量化できない。
これらの課題に対処する新しいディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:49:50 GMT)
SAE Interventions are Unreliable: Post-Intervention Recovery of Suppressed Behavior [38.8] スパースオートエンコーダ(SAE)は残ストリームの活性化を解釈可能な特徴に分解する。
特定の有害な特徴をクランプすることで,モデルの誤動作を確実に防止できることが示唆された。
我々は、この脆弱性を、制約付き残空間最適化問題であるポスト・インターベンション・リカバリ(英語版)として定式化する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:04:17 GMT)
Exploring Statistical Change Point Detection Techniques for Performance Anomaly Detection at Mozilla [38.1] 本稿では,Mozillaの現在の方法に代わる方法として,25個のCPD法と15個のアンサンブルアプローチを評価する実験的検討を行った。
11人のMozillaパフォーマンスエンジニアが手動でアノテートした174のパフォーマンス時系列のグランドトラストデータセットを構築した。
以上の結果から, オフライン・ハイブリッドCDD手法はMozillaの手法によるリコールを改善するが, 高精度化には高いコストがかかることがわかった。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:25:08 GMT)
AnnotateAnything: Automatic Annotation of 3D Assets for Robot Manipulation [37.6] AnnotateAnythingは、パッシブな3Dアセットを構造化され多様な実行可能な操作ラベルを持つ操作可能なアセットに変換する。
完全に自動化され、非常に並列な物理パイプラインは、各アセットの幾何学的制約と物理的制約にこれらの前提を定めている。
このパイプラインは、グリップポーズ、デクスタラスコンタクト、調音経路ポイント、挿入方向、吊り下げ時間、ナビゲーションターゲットなど、多種多様な実行可能なアノテーションを生成する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:00:58 GMT)
An Optimization Framework for Automated Assessment of Biological Plausibility of Spiking Neurons [37.6] 生物学的可視性は、ニューロモルフィックコンピューティングとスパイクニューラルネットワークにおいて重要な概念である。
スパイキングニューロンモデルにおける生物学的可視性の自動評価のためのオープンソースフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:25:30 GMT)
Quantum statistical enhancement of collective behaviour in a bosonic active Ising model [36.9] 能動イジングモデル(AIM)の1次元(1次元)量子格子変種を導入研究する。
1次元古典モデルの集合的挙動、群れ形成とアスター形成は、ボソニック量子統計学によって著しく強化されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:56:07 GMT)
ActWorld: From Explorable to Interactive World Model via Action-Aware Memory [36.9] 本稿では,対話型世界モデルであるActWorldについて紹介する。
実験の結果、ActWorldは単一のモデル内でフレキシブルなナビゲーションとリッチなオブジェクトインタラクションの両方をサポートしています。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:47:32 GMT)
Ground state preparation of random all-to-all Hamiltonians using ADAPT-VQE [36.6] 最大$N$フェルミオンを含むSYKモデルに対して,ADAPT-VQEが正確な基底状態を構築することができることを示す。
SKモデルでは, 基底状態の生成は(演算プールサイズと回路深度の観点から)効率的であるが, 密度あるいは適度にスパースしたSYKモデルでは効率が良くないことがわかった。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:00:00 GMT)
Deep-Learning-Based Pixelated Microwave Filter Design and Characterization using Electro-Optical Electric-Field Measurements [36.4] 本研究では,畳み込みニューラルネットワークと遺伝的アルゴリズムを組み合わせた深層学習手法を用いて,電子レンジフィルタの自動合成を行う。
合成した低域通過フィルタは、シミュレーションと測定性能の良好な一致を示し、9.5GHzを超える20dBの抑制で7GHzのパスバンドを実現した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:51:02 GMT)
Dynamic Malicious Skills in Agentic AI [36.0] スキルはエージェントAIの重要な構成要素である。
本研究では,このような攻撃面の1つを,動的に悪質な技量を示すことによって調査する。
本稿では,カーネル強化型リードオンリーマウントによるスキルの動的変更を防止するシステムレベルディフェンスを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:41:21 GMT)
Sparsity Curse: Understanding RLVR Model Parameter Space from Model Merging [35.7] RLVR(Reinforcement Learning with Verifiable Reward)は、スーパーバイザード・ファインチューニング(SFT)を超える強力なポストトレーニングパラダイムとして登場した。
近年の研究では、RLVRはSFTと比較してスパースおよびオフプリンシパルパラメータの更新を誘導している。
本稿では,RLVRパラメータ空間のユニークな構造に適したマージレシピであるSAR-Merging(Sensitivity-Aware Resolving Merging)を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:22:40 GMT)
Unified Motion-Action Modeling for Heterogeneous Robot Learning [35.2] UMAは、物体の動きとロボットの動きを、マスクされた生成目的の下で共進化変数として扱う。
UMAは、手動でアノテートされたタスク命令を必要とせずに、異種データソース間のマルチタスク事前トレーニングを可能にする。
UMAは、各推論モードに特化された最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:48:34 GMT)
Seeing Is Not Screening: Multimodal Hidden Instruction Attacks on Agent Skill Scanners [34.5] LLMベースのシステムではエージェントスキルが重要な攻撃面として浮上している。
現在の防衛は、セキュリティ分析の主要な信号として、テキスト記述、マニフェスト、ソースコードに依存している。
本稿では,文書を介するマルチモーダル・インストラクション・アタックであるSkillCamoを提案する。
また,インテント抽出,行動再構成,虐待評価,熟考的実行シミュレーションを行う,実行地上マルチモーダルスキャンモジュールであるExecScanを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:29:11 GMT)
When Multiple Scripts Matter: Evaluating ASR in Clinical Settings [34.0] マルチスクリプト変数に対するロバスト性を評価するためのベンチマークであるMultiClinを紹介する。
多様なASRモデルに対する実験により、マルチスクリプト認識評価により、認識品質をより公平に評価できることが示されている。
スクリプト統一は、常に最高のASRパフォーマンスをもたらす。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:53:21 GMT)
Fast Speech Foundation Model Distillation Using Interleaved Stacking [33.5] モデル展開を高速化するSFM蒸留の訓練加速について検討する。
本稿では,階層化プロセスを通して,階層位置を一貫して保持する新しい積み重ね手法であるインターリーブド積み重ねを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:29:07 GMT)
Uncertainty Quantification for Flow-Based Vision-Language-Action Models [33.3] 視覚言語アクションモデル(VLA)は、視覚言語バックボーンと、大規模ロボットデータセットのフローマッチングによってトレーニングされた表現力豊かな生成アクションヘッドを組み合わせる。
ロボット操作における強い経験的性能にもかかわらず、VLAは予測の信頼性を定量化し、動作が信頼できない可能性があることを検知するメカニズムを欠いている。
本稿では,不確実性誘導型アクティブ微調整のためのフレームワークであるSAVEを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:19:09 GMT)
TivTok: Broadcasting Time-Invariant Tokens for Scalable Video Tokenization [33.3] 本稿では、時間とともに永続的な情報を再利用する再利用対応ビデオトークンーザを提案する。
TivTokは、フレーム間で共有される情報をエンコードするTime-Invariant(TIV)トークンと、フレーム固有の残留物をエンコードするTime-Variant(TV)トークンを備えたクリップを表す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:52:52 GMT)
Analytics for Quality Assurance for Item Pools (AQuAP): Monitoring and Maintaining Item Bank Health in AI-Driven Assessment Systems [33.0] 本稿では,アイテム品質とアイテムバンクの健康状態を監視するダッシュボード環境であるAQuAP(Analytics for Quality Assurance for Item Pools)を提案する。
AQuAPは、アイテムファクトリに含まれるハイテイクテストのための大規模アイテム生成手順の運用実装をサポートする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 23:07:33 GMT)
SceneConductor: 3D Scene Generation from a Single Image with Multi-Agent Orchestration [32.4] 単一画像の3Dシーン生成を3つの構造化ステージに分解するマルチエージェントオーケストレーションフレームワークを提案する。
ポイントマップから導出される疎幾何学的事前情報によって教師される幾何学的レイアウト予測器を提案する。
本手法は,幾何学的精度,空間的整合性,知覚的リアリズムにおいて,従来手法よりも常に優れていた。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:24:38 GMT)
SAGE: Retain-Aware Post-Hoc Sanitization of Final Unlearning Vector [32.3] 現在のアンラーニング手法は、すべて、アンラーニングと保持の間のトレードオフを含んでいる。
また, 保持行動バイアスは, 保持に影響を及ぼす未学習手法による損傷の定量化にも有効であることがわかった。
これにより、ポストホックアプローチを用いて、未学習のメソッドの保持性能を復元できる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:29:43 GMT)
Visored: A Controlled-Natural-Language Prover for LLM-Generated Mathematics [32.1] 我々は LLM (および人間) が数学を書く傾向を軸に設計された依存型型証明器を提案する。
その中核となる設計選択は、数学の自然言語を模倣する表面と、教科書が省略するルーチンステップを閉じるルール駆動の自動化層である。
初期の実験では、証明器固有のトレーニングデータなしでも、LLMはminiF2Fベンチマークで効果的に使用することができることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:43:08 GMT)
SafeClawBench: Separating Semantic, Audit-Evidence, and Sandbox Harm in Tool-Using LLM Agents [32.0] SafeClawBenchは、600の制御された敵タスクを備えたツール使用エージェントセキュリティのためのベンチマークである。
5つのエージェントエンドポイントを4つのプロンプトレベルポリシーで評価する。
これらのエンドポイントは、異なる障害モードをキャプチャします。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:04:45 GMT)
Beyond NL2Code: A Structured Survey of Multimodal Code Intelligence [32.0] このサーベイは、視覚的に接地された入力と出力の下でコードを生成し、編集し、洗練し、理屈を定めているシステムを調べます。
まず、コードが各タスクで果たす役割によってフィールドを定式化します。
次に、ベンチマークとメソッドをグラフィカルユーザインタフェース、システミックビジュアライゼーション、構造化グラフィックス、フロンティアタスクとフレームワークの4つのドメインにまとめます。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:28:03 GMT)
CEO-Bench: Can Agents Play the Long Game? [31.5] 言語モデルエージェントは、孤立した短期的なタスクにおいて、熟練した実行者になりつつある。
しかし、現実世界の課題には、エージェントでほとんどテストされていない高度なスキルの組み合わせが必要です。
実世界の代表的タスクをシミュレートすることで、これらの能力を一緒に評価するCEO-Benchを紹介します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 23:37:52 GMT)
On the Residual Scaling of Looped Transformers: Stability and Transferability [31.3] 1/N$のスケーリングは、トレーニング性を改善し、ループ数で1/sqrtN$のスケーリングよりも優れた損失をもたらすことを示す。
ループ変換器の実験では、1/N$のスケーリングがトレーニング性を改善し、ループ数を越えたスケールで1/sqrtN$よりもよい損失をもたらすことが確認されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:39:13 GMT)
Evaluating Second-Order Bias of LLMs Through Epistemic Entitlement [31.1] 私たちはこの2階偏見を、LLMの社会的偏見に関する判断における社会的偏見と呼んでいる。
我々は,LLM審査員が十分な支持を得ずに,受理可能な人口層を推定する際の偏りを測定する指標を開発した。
我々の研究は、判定タスクにおけるLLMバイアス評価の必要性と、NLPにおけるより理論的に基礎的なバイアス評価アプローチの必要性を指摘する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:28:56 GMT)
Benchmarking LLM Agents on Meta-Analysis Articles from Nature Portfolio [30.7] 我々はNature Portfolio誌から442名の専門家によるメタアナリシスのデータセットであるMetaSynを紹介する。
各エントリは、PI/ECO基準、140k項目の検索コーパス、実証された肯定的な研究、相対的に類似しているがPI/ECOは無視できない硬い負の2つの研究課題をペアリングする。
K=200では90.9%のリコールがあったが、52.7%以上の文献を復元するシステムはない。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:04:34 GMT)
MoonSplat: Monocular Online Gaussian Splatting with Sim(3) Global Optimization [30.5] 我々は,グローバルな$textSim(3)$最適化と統合された,堅牢で効率的なオンライン3DGS再構築フレームワークを提案する。
提案手法は,リアルタイムの効率を保ちながら,カメラポーズ推定精度とレンダリング品質の両面における最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:43:35 GMT)
SEAGym: An Evaluation Environment for Self-Evolving LLM Agents [30.4] SEAGymは、トレーニング、検証、テスト、リプレイ、コストレコードにわたるエージェントの更新を測定するための評価環境である。
これはHarbor互換のベンチマークを、列車のバッチ、凍結された更新バリデーション、ホールドアウトIDとOOD転送ビュー、診断の再生、保存されたスナップショットとメトリックレコードを備えた動的自己進化タスクソースに変換する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:50:55 GMT)
Where Should Action Generation Begin? A Learnable Source Prior for Generative Robot Policies [30.2] 生成ロボットポリシーは通常、観測に依存しない標準ガウス分布からアクション生成を開始する。
本稿では,標準を動作チャンク上の対角条件付きガウス形式に置き換える学習可能なソースプリエントであるLeaPを提案する。
15のRoboTwin操作タスクでは、LeaPは平均81.6%の成功率を達成し、4つのベースラインを上回った。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:43:56 GMT)
WEQA: Wearable hEalth Question Answering with Query-Adaptive Agentic Reasoning [30.1] 本稿では,LLM推論を特殊なウェアラブル分析・モデリングツールと統合するクエリ適応型エージェントフレームワークWEQAを提案する。
また、3つの異なる健康領域における分析および予測タスクを含む4つのオープンなウェアラブルデータセットにまたがるベンチマークをキュレートする。
実験の結果,LLMやエージェントベースラインよりも24%の精度が得られ,12名の医療専門家と8名のユーザによる盲目調査の結果,有用性や臨床的健全性は著しく向上した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:45:56 GMT)
Audio-visual Contrastive Alignment for Diffusion-based Visual-conditioned Speech Enhancement [29.8] 音声視覚音声強調(AVSE)は、唇の動きなどの視覚的手がかりを利用して、雑音の多い環境での音声を回復する。
最近の研究は、拡散に基づく教師なしAVSEを導入し、クロスアテンションによる視覚的特徴に条件付けされた音声拡散モデルを訓練し、後部サンプリングに基づく音声強調のためのデータ駆動の先行として使用した。
本稿では,後部サンプリングフレームワークをそのまま維持しつつ,視覚情報のより強力な利用を促すために,コントラストのある音声視覚損失による拡散訓練目標の強化を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:39:04 GMT)
Video2Code: Generating Interactive Webpages from UI Videos via Action-Aware Revisit [29.2] 我々は、実行可能なUI状態遷移を回復するためのアクション対応ビデオ・ツー・コード・アプローチであるVideo2Codeを紹介した。
Video2CodeはUIビデオ・コード生成の基盤となるオープンソースモデルを大幅に強化する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:40:48 GMT)
SP-TransientBench: A Real-Captured Single Photon Perception Benchmark [29.0] SP-TransientBench(SP-TransientBench)は、単一光子知覚のためのマルチタスクのリアルタイムベンチマークである。
STBは10の多彩なシーンと10,297のビューで構成され、ソリッドステートの単光子LiDARを256Times192$解像度で撮影する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:48:15 GMT)
Non-Autoregressive Minimum Bayes' Risk Decoding for Fast Speech Recognition [28.9] 非自己回帰復号(NAR)は出力トークンを並列に生成し、音声認識を自己回帰復号よりも高速にする。
我々は,最小ベイズリスク(MBR)デコーディングに基づく新しいNARデコーディングフレームワーク,NAR-MBRデコーディングを提案する。
LibriSpeech, Switchboard, AMI, およびWebプレゼンテーションコーパスを対象に行った実験では, NAR-MBRデコーディングが従来のNARデコーディングより優れており,ARデコーディングよりも高速に動作していることが実証された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:28:38 GMT)
Small Initialization Matters for Large Language Models [28.7] パラメータ初期化は訓練の遺伝子様決定因子であり、特にモデル能力の指標であることを示す。
スケールの縮小はプレトレーニングを継続的に改善し、推論要求タスクに最大の利益をもたらす。
小規模な初期化の利点を抑えるために広く使われている2つの経験的設定を同定し、その緩和が適切なスケーリングを回復することを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:53:48 GMT)
ConSA: Controllable Sparsity in Hybrid Attention via Learnable Allocation [28.6] 本稿では,ユーザが指定したスパシティターゲットの下で最適なFA/SWA割り当てを学習するフレームワークを提案する。
学習されたアロケーションはルールベースのベースラインを一貫して上回る。
この構造は、モデルスケール、スパーシリティレベル、および粒度の割り当てにまたがって持続し、微粒な注意行動のスペクトルを明らかにする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:33:49 GMT)
Do Time Series Foundation Model Benchmarks Hide Regime-Dependent Failures? Evidence from Traffic Speed Forecasting [27.7] 状態階層化評価を導入し,それを3つの時系列基礎モデル(TSFM)に適用する。
交通は、自由流と渋滞状態の間で急激な政権交代を示し、移行中にバイモーダルな速度分布を生み出している。
以上の結果から,TSFMベンチマークでは,メトリクスを隠蔽するサーフェールをサーフェール評価に組み込むことが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:16:07 GMT)
SegDINO: Introducing Multi-Scale Structure into DINO for Efficient Medical Image Segmentation [26.9] DINOv3バックボーンと軽量スケールモデリングを統合した,効率的なセグメンテーションフレームワークであるSegDINOを提案する。
SegDINO Token Pyramid Adaptation (TPA)は、中間DINO機能を擬似マルチスケール階層に再編成し、SAD(Scale-Aware Decoding)は、効率的なスケール内精細化とトップダウン伝播を実現する。
また,SegDinoの難治性小病変に対する治療能力を評価するため,SegDinoの膵腫瘍患者284名を含む新しいCTデータセットであるPanCTをキュレートした。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:27:50 GMT)
MuseVLA: An Adaptive Multimodal Sensing Vision-Language-Action Model for Robotic Manipulation [26.8] MuseVLAは、新しいセンサーをロボット操作のオンデマンドツールとして統合した適応型マルチモーダルセンシングVLAモデルである。
実世界ロボットのMuseVLAを、難易度の高い手操作タスクにまたがって評価する。
MuseVLAは平均80.6%の成功率に達し、RGBのみのベースラインとマルチセンサーのVLAベースラインを大きく上回っている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:04:13 GMT)
UoU: A Universal Fingerprint Foundation Model Based on Large-Scale Unsupervised Learning [26.7] 大規模なtextbfUnsupervised learning を用いたtextbfUniversal fingerprint foundation model を略した UoU を提案する。
UoUは、画像復元、構造フィールド、セマンティックトークン、ポイントレベルの生体認証エンティティ、コンパクトなグローバルディスクリプタにまたがる多層表現階層を中心に構成されている。
指紋画像を汎用的なテクスチャとして扱うのではなく、UoUはドメイン固有の対称性と中間構造を利用する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:37:40 GMT)
WEAVER, Better, Faster, Longer: An Effective World Model for Robotic Manipulation [26.5] WEAVER(World Estimation Across Views for Embodied Reasoning)は、3つのデシラタを同時に実現するWMアーキテクチャである。
WEAVERをロボットハードウェアに適用し、政策評価、政策改善、テストタイム計画においてその効果を実証する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:54:22 GMT)
Mind-Studio: Executable World Models with Lookahead Evaluation for Partially Observable Games [26.4] Mind-Studioは、状態-作用-次の状態軌道からパイゲームスタイルの世界モデルを合成するフレームワークである。
モンテズマの復讐では、Mind-Studioは選択された次の状態予測をPoE-Worldの0.3%から48.7%に改善し、8つのサブゴールのうち5つを検証する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:37:37 GMT)
OmniPlan: An Adaptive Framework for Timely and Near-Optimal Network Planning Optimization [26.2] 我々は、ネットワーク計画最適化において、タイムラインとほぼ最適性を両立する適応フレームワークであるOmniPlanを提案する。
実世界のテストベッドを用いた実験は,OmniPlanが実世界の機械学習推論タスクに対して,ほぼ最適かつ低実行を実現していることを示している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:06:51 GMT)
TRIDENT: Breaking the Hybrid-Safety-Physics Coupling for Provably Safe Multi-Agent Reinforcement Learning [26.1] 3つの特徴が有向バイアスのサイクルを形成し、既製のモジュールの素な構成を損なうことを示す。
3つのコンポーネントを共同設計して各リークをキャンセルする,最初のMARLフレームワークであるTRIDENTを紹介する。
マルチUAVモバイルエッジコンピューティング、自律交叉管理、ハイブリッドSMACでは、TRIDENTはトレーニング時間違反をMADDPGで95.5%、MACPOで76.3%削減している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:41:43 GMT)
EventDrive: Event Cameras for Vision-Language Driving Intelligence [26.1] イベントカメラは、マイクロ秒のレイテンシと高いダイナミックレンジで非同期の明るさ変化によって世界を感知する。
EventDriveは大規模ベンチマークとモデルスイートで、イベントストリーム、RGBフレーム、言語管理を4つのコアディメンジョンで統合します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:58:40 GMT)
Learning from the Self-future: On-policy Self-distillation for dLLMs [26.0] 私たちは、dLLM用に調整された最初のOPSDフレームワークであるd-OPSDを紹介します。
まず,自己生成型回答を接尾辞条件として用いることで,自己学習者構築を再構築する。
第二に、トークンレベルからステップレベルへと監督をシフトし、dLLMの反復的認知プロセスとトレーニングを整合させる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:24:57 GMT)
RICH-SLAM: Radar SLAM with Incremental and Continuous Hilbert Mapping [25.8] 本稿では、密で連続的で一貫した地図表現を実現するために設計されたレーダSLAMフレームワークであるRICH-SLAMを提案する。
提案手法では, ポーズ推定に粒子フィルタ, マップ更新にカルマンフィルタを用いるRio-Blackwellized Particle Filter-based back endを特徴とする。
自己収集と公開のColoRadarデータセットの実験は、RICH-SLAMがスパースレーダ測定から連続占有マップを構築することを示している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:22:27 GMT)
EAGG: Embodiment-Aligned Grasp Generation via Geometry-Aware Graph Conditioning [25.6] クロス・エンド・エフェクター・グリーグジェネレーションは、オブジェクトとエボディメントをまたいで一般化する統一モデルを求める。
本稿では,各実施形態をトポロジ対応のエンドエフェクタグラフと,実施形態固有の低次元エンドエフェクタ制御空間で表現するエボディメント整列型グリップジェネレータであるEAGGについて述べる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:56:44 GMT)
Data-Forcing Distillation: Restoring Diversity and Fidelity in Few-Step Video Generation [25.4] 単行のコード変更だけでMDDの多様性と忠実性を回復する単純なポストトレーニングフレームワークであるData-Forcing Distillation (DFD)を提案する。
我々は,我々のフレームワークの詳細な理論的分析を行い,テキスト・ツー・ビデオ,画像・ツー・ビデオ,自動回帰ビデオ生成に対する我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:38:30 GMT)
MimicIK: Real-Time Generative Inverse Kinematics from Teleoperation with FK Consistency [25.1] 逆運動学(Inverse Kiinematics, IK)は、リアルタイムロボット操作において重要なボトルネックである。
MimicIKは、遠隔操作のデモンストレーションからスムーズで堅牢な共同空間運動を学習するリアルタイム生成逆キネマティクスフレームワークである。
MimicIKの平均位置誤差は4.65mm、成功率10mmは92.01%、軌道スパイクレートは7.99%である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:15:49 GMT)
Gaussian Light Field Splatting: A Physical Prior-Driven Vision Transformer for Unsupervised Low-Light Image Enhancement [24.5] 既存の教師なし低照度画像強調法は、複雑な非一様照明下での局所的な露光不均衡と色歪みに遭遇することが多い。
本稿では,ガウス光場スプラッティングに基づくビジョントランスフォーマーであるGLFSを提案し,ガウス光線スプラッティングから連続的な物理照明モデリングをトランスフォーマーアーキテクチャに統合する。
最先端の性能を実現し、低照度画像強調のための新しい表現パラダイムを提供する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:37:08 GMT)
From Trainee to Trainer: LLM-Designed Training Environment for RL with Multi-Agent Reasoning [24.5] 大規模言語モデル(LLM)トレーニングのための強化学習パイプラインは、しばしばステージ間で手動で再設計された環境に依存します。
LLM-as-Environment-Engineer フレームワークを提案する。
また、MAPF-FrozenLakeは、多次元環境構成を公開する制御可能なテストベッドである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:48:58 GMT)
DRIFT: Refining Instruction Data via On-Policy Data Attribution [24.4] Supervised Fine-Tuning (SFT) は大規模言語モデル(LLM)の能力を決定する
既存のデータキュレーション手法は、制約された予算下でのトレーニングを加速するのに優れているが、能力の上限を上げるには適していない。
最終モデルを改善するのに最も有効なインスタンスに対するデータ分散を改良するためのDRIFTを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:21:49 GMT)
IndustryBench-MIPU: Benchmarking Multi-Image Attribute Value Extraction for Industrial Products [24.4] IndustryBench-MIPUは、マルチイメージ産業製品理解のための最初の大規模ベンチマークである。
仕様表とネームプレートのテキスト認識、技術図面に対する視覚的推論、ドメイン知識、そして散在する仕様を組み立てるためのクロスイメージエビデンスの統合を探索する。
ベンチマークは、27,652枚にわたる4,559個の製品と、18の産業カテゴリにまたがる103,703個のアノテーションで構成されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:59:08 GMT)
MaineCoon: Pursuing A Real-Time Audio-Visual Social World Model [24.1] MaineCoonは、リアルタイムストリーミング生成とサブ秒間インタラクションが可能な、初めてのリアルタイムオーディオ-視覚自動回帰モデルである。
われわれの知る限りでは、ManeeCoonはソーシャル・インタラクティブ・アプリケーション向けに最適化された初めてのリアルタイム・オーディオ・ビジュアル生成モデルでもある。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:25:37 GMT)
MCompassRAG: Topic Metadata as a Semantic Compass for Paragraph-Level Retrieval [23.9] MRAGはメタデータ誘導検索フレームワークであり、関連する証拠を選択するための意味コンパスとしてトピックレベルの信号を使用する。
6つのベンチマークで、MRAGは情報効率(IE)を平均8.24%改善し、最も効率的なRAGベースラインの5倍以上のレイテンシを持つ。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 21:50:01 GMT)
Learning Cardiac Electrophysiology Digital Twins Through Agentic Discovery of Hybrid Structure [23.9] 心電気生理学領域の知識を構造化行動空間として定式化するフレームワークであるLEADSを提案する。
提案したLEADSは、全ての候補モデルを物理的に接地し、解釈可能で、数値的に安定に設計する。
LEADSは3つの基底構造反応モデルと実際の心EPデータを用いて合成データに対して検証する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:54:03 GMT)
Beyond the GUI Paradigm: Do Mobile Agents Need the Phone Screen? [23.9] モバイルプラットフォームは、デバイスサービスとデータへの直接アクセスを提供するコマンドラインインターフェース(CLI)を公開する。
AndroidWorldとMobileWorldの4つのモデルAPIにまたがる3つのコーディングエージェントを,モバイル固有のポストトレーニングなしで評価する。
私たちは、AndroidWorld(103/116タスクCLI解決可能)で88.8%、MobileWorld(101/117タスクCLI解決可能)で86.3%に達するオラクルCLIソリューションを提供しています。
モバイルCLIエージェントに関する将来の研究をサポートするため、エージェントの実装、オラクルソリューション、CLI-Advantageスイート、評価インフラストラクチャをオープンにします。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:36:22 GMT)
SproutRAG: Attention-Guided Tree Search with Progressive Embeddings for Long-Document RAG [23.5] 本稿では,注意誘導型階層型RAGフレームワークであるSproutRAGを紹介する。
文レベルのチャンクを徐々に大きく、意味的に一貫性のある単位に整理する。
どのアテンションヘッドとレイヤがセマンティックドキュメント構造を最もよく捉えているかを学ぶ。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:28:00 GMT)
OmniDrive: An LLM-Choreographed Multi-Agent World Model with Unified Latent Co-Compression for Multi-View Driving Video Generation [23.4] DRIVE-CHOREOは、制御可能なマルチビュービデオ生成を潜在コレオグラフィとして再放送する。
NUScenesでは、DRIVE-CHOREOが新しい最先端のマルチビュー一貫性と競合するFVD (45.7) を備えたBEV mAP (21.6) を設定します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:25:55 GMT)
From Drift to Coherence: Stabilizing Beliefs in LLMs [23.2] 大型言語モデル (LLM) はしばしば暗黙のベイズ推論を行うと仮定される。
予測的信念のマーチンゲール特性であるキーコヒーレンス条件は、制御された文脈内学習設定で失敗することが示されている。
自己回帰的回答再サンプリングによって引き起こされる信念のダイナミクスについて検討する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:01:26 GMT)
TS-Fault: Benchmarking Time Series Forecasters Against Structural Faults [22.9] 時系列予測(TSF)は、エネルギー、輸送、金融、医療の連続的な決定を支えている。
TSFモデルは、デプロイされた信頼性を予測するという暗黙の仮定の下で、クリーンなホールトアウトデータ上の1つの数でほぼ普遍的にランク付けされる。
TS-Faultは、制御可能な意味的難易度を持つ明示的でパラメータ化された障害シナリオの下で予測モデルを評価するベンチマークである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 23:15:20 GMT)
Variational Test-time Optimization for Diffusion Synchronization [22.8] 協調生成は拡散モデルの適用性を拡張するための強力なパラダイムである。
我々は、最適制御に基づく同期フレームワークを数学的に導出し、拡散同期の原理的な説明を提供する。
我々の研究は、協調生成のための新しい基盤を確立し、事前学習された生成モデルを新しい協調生成設定に拡張するための原則的な道を開く。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:32:39 GMT)
Domain Generalizable Adaptation of 3D Vision-Language Models via Regularized Fine-Tuning [22.6] 本稿では,ReFine3Dについて紹介する。ReFine3Dは3次元大規模マルチモーダルモデルのドメイン一般化可能なチューニングのための規則化された微調整フレームワークである。
ReFine3Dは、ベース・ツー・ノーベル・クラスの一般化を1.36%改善し、データセット間の転送を2.43%改善し、破損に対する堅牢性を1.80%改善し、ショット精度を最大3.11%向上した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:31:05 GMT)
PracRepair: LLM-Empowered Automated Program Repair Inspired by Human-Like Debugging Practices [22.4] textscPracRepairは、人間のようなデバッグプラクティスにインスパイアされた、完全に自動化されたプログラム修復フレームワークである。
textscPracRepairは一貫して最先端のベースラインを上回っている。
textscPracRepairはRWB(Real-World Bugs)に効果的に一般化する
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:18:37 GMT)
Decoding Hidden Deception in Reasoning LLMs: Activation Explainers for Deception Auditing [22.3] 本稿では,騙し監査のためのアクティベーション説明器STATEWITNESSを紹介する。
個別のデコーダはターゲットモデルの隠れた状態を読み、自然言語クエリに答えるか、それらに関する構造化されたレポートを出力する。
本研究では,7つの偽装データセットを対象とする2つのLLMに対するSTATEWITNESSの評価を行った。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:41:29 GMT)
Spatio-Temporal Fusion Model for Standard View Classification of Echocardiographic Videos [22.1] 我々は,5,138本のビデオ,910,579フレーム,9つの標準ビューからなる,心電図ビデオ・オブ・ナインビュー(EV9V)データセットをリリースする。
コンボリューショナルニューラルネットワーク(CNN)、リカレントニューラルネットワーク(NN)、トランスフォーマーなど、代表的なビデオ分類アーキテクチャをベンチマークする。
本研究では,空間解剖学的構造と時空間心力学を共同で捉える時空間核融合モデル(STFM)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:37:43 GMT)
Flux-Guard: Facial Identity Protection using diffusion models [22.1] 顔認識(FR)システムは、ソーシャルメディアや公共プラットフォームで共有される個人イメージを、アイデンティティリンクとプライバシーリスクに公開する。
既存の敵プライバシ保護手法は、未承認FR性能を劣化させることができるが、生成顔編集と互換性がない。
本稿では、敵攻撃に基づくプライバシー保護顔編集フレームワークであるFlux-Guardを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:12:35 GMT)
CoreMem: Riemannian Retrieval and Fisher-Guided Distillation for Long-Term Memory in Dialogue Agents [22.0] CoreMemはリソース効率のよいエッジクラウドメモリアーキテクチャであり、情報幾何学によって根本的に統一されている。
厳格な8GBのVRAM予算内でシームレスに動作し、リソース制約のあるエッジデバイスと理論上は根拠のない、寿命の長いメモリエージェントとのギャップを埋めることに成功した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:56:23 GMT)
LATTEArena: An Evaluation Framework for LLM-powered Tabular Feature Engineering (Extended Version) [21.9] LATTEArenaは、自動機能エンジニアリングのための標準化、モジュール化、およびベンチマークフレームワークである。
制御されたコンポーネントレベルの比較を可能にすることで、LATTEArenaはパラダイムをアドホックなプロンプトエンジニアリングから、システマティックなコンテキスト管理へとシフトする。
すべてのコード、データセット、4000以上の実行ログは、動的でコミュニティ主導のベンチマークを育むために公開されています。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:38:16 GMT)
MIRAGE: Stealthy Visual Prompt Injection for Vulnerability Detection in Web Agents [21.9] マルチモーダル大言語モデル(MLLM)ベースのWebエージェントは、視覚的ブラウザ自動化のための実用的で高精度なソリューションを提供する。
それらは本質的に攻撃面を拡張し、新しい視覚ベースの脆弱性を導入している。
MIRAGEは、ターゲットの次アクションハイジャックのための視覚的間接的プロンプトインジェクションフレームワークである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:31:33 GMT)
NeRD: Neuro-Symbolic Rule Distillation for Efficient Ontology-Grounded Chain-of-Thought in Medical Image Diagnosis [21.8] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、推論時間と手動による介入のために、事前に定義されたすべての概念をスコアリングする必要がある。
提案するNeuro-Symbolic Rule Distillation(NeRD)は,効率的なオントロジーに基づく推論連鎖を生成するフレームワークである。
2つの皮膚データセットの実験は、診断性能と解釈可能性の強さを示し、ブラインドされた専門家による評価は、NeRDの臨床的妥当性を確認する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:57:14 GMT)
Do Generative Recommenders Deepen the Information Cocoon? A Closed-Loop Simulation with LLM-powered User Simulators [21.8] その結果, ジェネレーティブ・レコメンデーターは, 従来のベースラインよりも露出レベルのコクーン形成の傾向が低いことが明らかとなった。
クーーンの重大度はトークン化戦略とモデルスケールに強く依存している。
これらの結果から,情報コクーンは推薦行動だけでなく,項目のトークン化やモデルキャパシティによっても形成されていることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:17:46 GMT)
RAVA: Retrieval-Augmented Viewpoint Alignment for Subject-Driven Image Generation [21.8] クロスオブジェクト視点アライメントは、参照駆動画像生成における課題である。
生成前に明示的な幾何学的証拠を提供する検索拡張フレームワークであるRAVAを提案する。
RAVAは、クロスオブジェクト生成におけるゼロショットベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:25:08 GMT)
Planning to Hammer: Difficulty-Aware Decomposition for Automating Rocq Proofs [21.7] 提案するQuarryは,証明計画と証明実行を分離した,計画に基づく証明合成フレームワークである。
特に、Quarry は LLM に対して、任意のサブレンマを持つ複数の証明分解を積極的に提案するよう求め、Rocq で一時的に承認されたサブレンマの下でそれらをタイプチェックし、証明状態に基づく困難モデルを用いて候補をランク付けする。
可解性を考慮した評価による計画ベース分解は,予測可能なコストを維持しつつ,自動化を大幅に改善することを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:33:15 GMT)
Bridging Functional Correctness and Runtime Efficiency Gaps in LLM-Based Code Translation [21.6] ランタイム効率は、関数的正確性とともに、プログラム品質にとってますます重要になっています。
提案するSwiftTransは,2つの重要なステージ – Multi-Perspective Explorationと Different-Aware Selection – で構成されるコード翻訳フレームワークである。
3つのベンチマークでの実験結果は、SwiftTransが正確性と実行効率の両方で一貫した改善を実現していることを示している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:49:56 GMT)
DecoSearch: Complexity-Aware Routing and Plan-Level Repair for Text-to-SQL [21.6] DecoSearchはトレーニング不要のフレームワークで、各クエリを適切な推論レベルにルーティングする。
BIRDは70.53%、Spiderは88.31%、DeepSeekのバックボーンは88.31%である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:48:50 GMT)
miniReranker: Efficient Multimodal Reranking through Visual Cache Reuse and Interaction Sparsity [21.5] MLLM(Multimodal large language model)は、最近ポイントワイド・リランカとして大きな可能性を示している。
しかし、ポイントワイドリグレードは、クエリーとドキュメントのペア間で大幅に繰り返される計算に悩まされる。
本稿では,キャッシュ再利用の効率化と性能の見直しを両立させる,$textitvision-first$の定式化を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:36:19 GMT)
A Compositional Framework for Open-ended Intelligence [21.5] オープンエンドインテリジェンス(英語: Open-ended Intelligence)とは、トレーニングとは大きく異なる、新しい問題や環境に適応する能力である。
有限原始集合によって誘導される構成的閉包の観点から、オープンエンドインテリジェンスを形式化する。
本稿では,再利用可能なアルゴリズムプリミティブの獲得を促す新しいアーキテクチャ目的として,次のプリミティブ予測(NPP)を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:51:53 GMT)
Real-World Deployment of Massively Parallel Sampling-Based MPC for Contact-Rich Manipulation [21.5] 大規模並列化と効率的な計算に JAX を利用する MPC フレームワークを提案する。
我々は、Franka Research 3上でPush-T操作タスクを実行し、完全な実-実-実-実-実-パイプラインを通してデプロイする。
これらの知見は, コンタクトリッチな操作・接触感度, 厳密な計算予算, 情報伝達領域のランダム化信号のリアルタイム取得の難しさにおいて, サンプリングベースMPCの課題を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:24:05 GMT)
MGUP: A Momentum-Gradient Alignment Update Policy for Stochastic Optimization [21.4] 選択的更新のための新しいメカニズムである textbfMGUP を提案する。
textbfMGUPは、より大きなステップサイズを適用することで、標準モーメントベースの比率を増大させる。
textbfMGUPはAdamW、Lion、Muonとシームレスに統合される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:10:29 GMT)
TerraTransfer: Learning End-to-End Driving Policies Without Expert Demonstrations [21.3] 我々は、自己プレイによる単一のポリシーを事前訓練し、その潜在空間を予め訓練された視覚バックボーンと整列させ、アクションKLの発散とバッチ関係の低ランク構造損失を通した。
フォトリアリスティックな3Dガウススプラッティング・クローズドループのシナリオでは、結果として得られるエンドツーエンドのポリシーは、以前のエンドツーエンドの手法と一致するか、あるいは超える。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 00:45:01 GMT)
Shattering the Autoregressive Curse: Dynamic Epistemic Entropy Orchestrated Erasable Reinforcement Learning for LLMs [21.3] 長期論理的推論のための消去可能な強化学習を提案する。
$textE3textRL$は、モデルの内在的なローカル自己回帰的クロスエントロピーを基盤にすることで、外部信号への依存を排除します。
DeepMath-103kデータセットで$textE3textRL$をトレーニングします。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:55:45 GMT)
Recover Semantics First, Generate Better: Improved Latent Modeling for 3D MRI Reconstruction and Cross-Contrast Synthesis [21.1] 本稿では,3次元MRI再構成とクロスコントラスト合成のためのセマンティクスファースト潜時モデリングフレームワークを提案する。
グローバルな解剖的依存関係を捕捉し,コヒーレントな表現を確保するために,LHE(Latent Harmonization)を導入する。
さらに、自己教師型セマンティック・教師から高レベルの事前情報を注入するセマンティック・リカバリ・ブロック(SRB)を設計し、潜在空間におけるコントラスト認識の分離性を向上する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:41:15 GMT)
Compact Geometric Representations of Hierarchies [20.9] 任意の有向木に対して、木の大きさや深さによらず、定数次元3に埋め込まれた到達可能性が存在することを証明する。
構造グラフパラメータに依存する埋め込みを用いて階層を表現するための理論的保証を提供する。
私たちの埋め込みは、現実世界のデータセット上に構築することができ、高いリコールレシエーションにおいて、はるかに小さな次元を提供することができます。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:20:52 GMT)
AnchorKV: Safety-Aware KV Cache Compression via Soft Penalty with a Refusal Anchor [20.8] 大規模言語モデル(LLM)は、生成的推論や長いコンテキストタスクにおいて、以前のアーキテクチャよりも優れている。
その大きなサイズは、メモリ使用量、エネルギーコスト、デバイス上のデプロイメントにおいて大きな課題をもたらします。
有害なプロンプトに関連するキー空間の方向からトークン保持スコアをバイアスする,KVキャッシュ圧縮のドロップイン修正であるAnchorKVを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:43:18 GMT)
Dimension-Free Approximate Tensorization of Quantum Hypercontractivity for Qudit Depolarizing Semigroups [20.6] 可逆な量子マルコフ半群に対する超収縮率と対数-ソボレフ定数のほぼテンソル化を証明した。
また, この手法の適用例として, 急激な$(q,2)$-hypercontractivityの推定値を得る。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:44:44 GMT)
When Cognitive Graphs Meet LLMs: BDEI Cognitive Pathways for Panic Emotional Arousal Prediction [20.4] 積極的緊急介入には,個別のパニック感情の覚醒タイミングの予測が不可欠である。
既存の方法は認知要素を含むが、感情的な覚醒過程を明示的にモデル化するものではない。
この過程を明示的にモデル化するため,評価感情理論の基盤となる予測が必要であると論じる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:43:52 GMT)
AgentCyberRange: Benchmarking Frontier AI Systems in Realistic Cyber Ranges [20.2] 我々はAgentCyberRangeを紹介した。AgentCyberRangeは、現実的なサイバー範囲で自律的なサイバー攻撃能力を測定するための、最初のオープンでマルチレンジのインフラである。
15の実際のWebアプリケーションと8つのエンタープライズライクなサイバーレンジに156の内部ホストを組み合わせた110の脆弱性に加えて、実行、オーケストレーション、結果収集、検証用のツールチェーンであるCageも備えている。
我々は、一致したプロンプトと予算の下で、6つのフロンティアAIシステムを評価します。GPT-5.5 with Codexは、Webエクスプロイトタスクの16.1%、探索後のタスクの31.7%を解決します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:20:26 GMT)
Last But Not Least: Boundary Attention CalibratiON for Multimodal KV Cache Compression [20.2] 長い視覚的コンテキストはKVキャッシュを拡大し、復号遅延を増大させる。
既存の圧縮手法は、安定なトークン重要度推定のために観測窓の注意を頼りにしている。
本稿では,最後の問合せで観測窓の注意を校正するプラグイン・アンド・プレイ手法であるBACONを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:51:58 GMT)
A Variational Framework for LLM Generator-Regulator Games [20.0] 本稿では,制御言語生成のための変分フレームワークを開発する。
モデレーション、検閲、AI偽装検出、コンプライアンス監査、フィッシング防御、操作制御に適用される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:19:22 GMT)
On Response-Adaptive Targeting Strategies for Multi-Treatment Experiments [19.9] 臨床試験における反応適応的ランダム化(RAR)は、観察結果に基づいて患者を動的に治療に割り当てることにより、倫理的および統計的効率を改善することを目的としている。
目的とする最適アロケーションに基づくRARは2つの武器設定のために広範囲に研究されているが、そのマルチ処理実験への拡張は理論的に断片化されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:51:50 GMT)
DeMix: Debugging Training Data with Mixed Data Error Types by Investigating Influence Vectors [19.9] 誤サンプルとそのエラータイプを同時に診断するフレームワークであるDeMixを提案する。
私たちのキーとなる洞察は、異なるエラータイプがモデルの振る舞いに異なるパターンを生み出すということです。
DeMixは、各トレーニングサンプルがモデル予測にどのように影響するかを特徴付ける影響ベクトルによって、そのようなエラー固有のパターンをキャプチャする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:07:41 GMT)
Root-Selecting Fixed-Point Inversion for Rectified Flows via Trajectory Straightness [19.9] 既存の固定点反転法は、各反転ステップを固定点問題として定式化することにより、反転精度を向上させる。
本稿では,より直線的な逆軌道を誘導する固定点解を選択する固定点逆変換法であるSelFixを提案する。
FLUX.1-devとPIE-Benchの実験では、SelFixは固定点インバージョンを改善し、より強力な実像再構成を実現し、ソース保存のプロンプトベースの編集を改善する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:46:10 GMT)
AIGS-Net: Compact Illumination Field Modeling via 2D Gaussian Splatting for Fast Low-Light Image Enhancement [19.7] 本稿では,高速低照度化のための適応照明ガウス格子ネットワーク(AIGS-Net)を提案する。
従来の静的プリミティブとは異なり、AIGS-Netは入力適応型2Dガウス散乱照明場を構築する。
実験によると、AIGS-Netは、約40の学習可能なパラメータしか必要とせず、ディテールリカバリと色忠実度を改善する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:45:55 GMT)
See First, Answer Later: Visual Evidence Pre-Alignment via Sufficiency-Driven RL [19.7] マルチモーダル大言語モデル(MLLM)は、強力なテキスト推論を視覚入力と統合するが、その応答は基礎となる画像と矛盾する可能性がある。
質問条件付き視覚的エビデンス記述を最適化するために,前訓練と後訓練の中間段階である視覚的エビデンス事前調整(VEPA)を導入する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:45:24 GMT)
Half a Link can Be Enough to Predict a Whole Link: Understanding Generalization in Knowledge Graph Foundation Models [19.6] 知識グラフ(KG)基礎モデル(KGFM)はゼロショット一般化器である。
半リンク(半リンク)と呼ぶ部分的なリンクに関して、未知のKGにおけるそれらのパフォーマンスが、どう一様でないかを示す。
これにより、これらのハーフリンクの組み合わせが観察されるか否かの4つのシナリオの分類が得られる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:47:35 GMT)
Concept Modulation Models: A Unified Framework for Identifiability and Extrapolation [19.4] 本稿では,Cto X$ の構造を持つ条件付き生成モデルの属性付きクラスである概念変調モデル (CMMs) を紹介する。
我々は,CMMが条件設定に対する識別性を高めるために,CMMクラスによって制約された潜在概念遷移を誘導することを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 21:53:01 GMT)
StepGuard: Guarding Web Navigation via Single-Step Calibration [19.1] Webナビゲーションでは、エージェントは自然言語の目標をフォローし、Webページと対話し、正確な回答を生成する必要がある。
既存の手法はまだ、報酬のミスアライメントとエラーの伝播による単一ステップの脆弱さに悩まされている。
本稿では,探索のためのナビゲーションファーストモードと質問応答のための回答ファーストモードとを切り替える動的双対最適化(DDPO)を提案する。
我々の手法はナビゲーションと回答の精度を大幅に改善し、標準的なWebナビゲーションベンチマークに最先端のパフォーマンスを新たに設定する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:42:09 GMT)
RankGraph-2: Lifecycle Co-Design for Billion-Node Graph Learning in Recommendation [18.9] RankGraph-2はMetaにデプロイされたフレームワークで、類似性に基づく検索のために3つのライフサイクルステージ全てを共同設計する。
数十兆のエッジを数十億のエッジに減らし、人気バイアス補正をサブサンプリングする。
また、計算コストを83%削減する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:27:11 GMT)
Reducing Learner Redundancy in Boosting via Residual Orthogonalization [18.7] 我々のフレームワークは、スペクトル残留射影(SRP)と共分散規則重み付け(CRW)の2つの相補的なメカニズムを通して冗長性に取り組む。
10のベンチマークデータセットに対する実験は、SCBoostが強力なアウトオブボックスパフォーマンスを提供することを示している。
この研究は、幾何レンズによるブースティングを再解釈し、明示的な冗長性制御がより効率的なアンサンブルアーキテクチャに向けた原則的で必要なステップであることを示唆している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:13:59 GMT)
PseudoBench: Measuring How Agentic Auto-Research Fuels Pseudoscience [18.7] PseudoBenchはエージェント自動検索システムが疑似科学的物語を識別し、抵抗できるかどうかを評価するための逆ベンチマークである。
現在のシステムでは、疑似科学的前提とほぼゼロの拒絶率と最も高い抵抗率の27.4%に一致した説得レポートが容易に作成されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:37:02 GMT)
Perron--Frobenius Operator Matching for Generative Modeling [18.6] 本稿では,PF演算子による密度変化に対応する生成フレームワークであるPerron-Frobenius Operator Matching (PFOM)を紹介する。
PFOMは演算子理論の同定を現代的な生成モデルと統合し、適応辞書や高次元アプリケーションへの経路を開く。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:26:55 GMT)
FlowRAG: Synergizing Explicit Reasoning via Frequency-Aware Multi-Granularity Graph Flow [18.3] グラフベースの検索強化生成(GraphRAG)は知識集約型およびマルチホップクエリタスクに有効である。
textttFlowRAGはセマンティック・アウェアな検索フレームワークで、セマンティック・リコールと明示的な推論の両方を改善する。
textttFlowRAGは複雑な推論ベンチマークで最先端のパフォーマンスを得る。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:28:14 GMT)
An Empirical Analysis of AI Slop in Music Streaming [18.2] AIミュージックの崩壊が自己維持型シャドウ産業に成長するのを防ぐことができるだろうか?
我々は、音楽におけるAIの傾きの現況と、ストリーミングプラットフォーム上のユーザによる生成、配布、消費からのパイプラインを特徴づける。
ディストリビュータには、AI音楽に対する一貫性がなく、ほとんど強制力のないポリシーがあることに気付きました。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:29:25 GMT)
Structured Adversarial Camouflage via Voronoi Diagrams [18.0] ボロノイカモフラージュは、さらなる規則化を伴わずに、構造化されたスプリッターカモフラージュのようなパターンを生成する。
設計はリアルタイム検出器の性能を劣化させながら視覚的可視性を向上する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:22:22 GMT)
Handling Feature Heterogeneity with Learnable Graph Patches [17.8] 本稿では,学習可能なグラフパッチの概念を提案する。
次に、ドメイン間のグラフデータから転送可能な情報をマイニングするフレームワークを設計します。
ドメインに依存しない性質のため、モデルは異なるドメインにわたる下流データに適用できる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:29:34 GMT)
DeepInsight: A Unified Evaluation Infrastructure Across the Physical AI Stack [17.8] 物理AIスタックの評価は、3桁以上異なる演算子にまたがる。
既存のフレームワークはこの範囲にはないため、スタックは別々のハーネスを縫い合わせることで評価されている。
私たちは、この完全なスペクトルを単一のランタイムで提供する評価インフラストラクチャであるDeepInsightを紹介します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:22:09 GMT)
Agentic AI-based Framework for Mitigating Premature Diagnostic Handoff and Silent Hallucination in Healthcare Applications [17.7] オープンエンドの会話エージェントは、早期診断ハンドオフとサイレントな臨床幻覚という、2つの重要な障害モードを伴いがちである。
LLM-as-a-judge'のルーティングを決定論的オーケストレーション制約に置き換えることで、両方の問題に対処するマルチエージェントフレームワークを提案する。
本稿では,150症例を対象に,ラマ3.1-70b-インストラクトモデルを用いたシミュレートされた患者エージェントを用いたシステムの評価を行った。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:39:19 GMT)
High-Fidelity 3D Geometric Reconstruction of Pelvic Organs from MRI: A Hybrid Deep Learning and Iterative Optimization Approach [17.6] 本研究では, 膀胱, 子宮, 直腸の再構築のために, 深層学習予測と反復最適化を統合したハイブリッド変形可能な形状モデリングフレームワークを提案する。
個々の解剖学的構造について, 膀胱, 直腸, 子宮の再構成された3次元形状は, チャンファー距離値が有意に低く, Dice similarity Coefficientスコアが高かった。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:05:13 GMT)
AUTOGATE: Automated Clock Gating via Toggling-Aware LLM-based RTL Rewriting [17.6] 本稿では,産業レベルのRTL電力最適化のための最初のエージェントフレームワークであるAUTOGATEを紹介する。
本稿では、波形レベルの解析とRTL書き換えを橋渡しする機械学習(ML)-LLM共同設計を提案する。
AUTOGATEはベースラインに対する動的パワーを一貫して減少させることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:22:54 GMT)
Reading between the Lines: Leveraging Large Language Models for Global Dementia and Depression Assessment from Clinical Interviews [17.4] 認知症とうつ病は老年者で最も多い神経精神疾患である。
我々は、GDS(Global Deterioration Scale)と整合した、観測者ベースのGDS(Global Depression Scale)を導入する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:01:30 GMT)
LLMs Infer Cultural Context but Fail to Apply It When Responding [17.3] 文化的・実践的反応推論(CAPRI)は,多様な文化的手がかりと会話のデータセットである。
最先端のLLMによる実験では、モデルは文化的背景を推測し、関連する慣習を思い出すことができるが、しばしばその情報を利用することができない。
文化的な手がかりが蓄積されるにつれて、モデルは回答に適応する傾向にあるが、前者は文化中立ではなく、しばしばモデルの起源の国と一致している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:53:24 GMT)
LongWebBench: Evaluating Structural and Functional Webpage Generation in Long-Horizon Settings [17.3] LongWebBenchは、構造的および機能的両面から長期にわたるWebページ生成を評価するためのベンチマークである。
構造的忠実度評価のための490の現実世界の長いWebページと、機能評価のための129のWebページ上の507の目標指向のインタラクションタスクを含んでいる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:43:12 GMT)
FoundCause: Causal Discovery with Latent Confounders from Observational Data [17.0] FoundCauseは、完全に合成データに基づいて訓練された、償却された因果発見モデルである。
個々のデータセットを超えて一般化される、転送可能な統計パターンをキャプチャする。
FoundCauseは15の現実世界のデータセットで11の古典的な非アモート化メソッドを上回ります。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:50:01 GMT)
When AI Says "I have been in similar situations": Synthetic Lived Experience in Peer-Like Caregiver Support [16.7] ピアライクなAIは、ピアサポートを有意義にする実体験を伴わずに、人工的な生きた体験を生成できることを示す。
我々は、介護者支援型AIシステムには、支援的なピアライクなフレーミングと、製造された生きた経験を区別するメカニズムが必要であると論じる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:34:23 GMT)
MOLAR: Learning Multimodal Molecular Representations from Noisy Labels [16.4] ノイズラベルは分子特性予測において共通の課題である。
記録されたラベルを信頼できる監視として扱うと、モデルは腐敗した観察を記憶させる。
雑音ラベルからマルチモーダル分子表現を学習するための雑音認識フレームワークであるMOLARを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:35:13 GMT)
Asynchronous Decentralized Federated Learning over Lossy Wireless Links via Reception- and Age-Aware Aggregation [16.2] 分散フェデレート学習は、無線エッジノード間の協調モデルトレーニングを可能にする。
Inverse Probability Weighting を用いて選択バイアスを補正する DFL-AA を提案する。
我々はDFL-AAが期待するリンク品質の歪みを排除し、常に最先端のベースラインを上回ることを証明した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:51:06 GMT)
Learning What to Remember: Observability-Safe Memory Retention via Constrained Optimization for Long-Horizon Language Agents [16.2] 本稿では,bfOSL-MRを開発した。
OSL-MRは予算対応のMixed-Scoreとエビデンス学習者とを組み合わせ、後に記憶がエビデンスとなる。
LoCoMoとLongMemEvalでは、OSL-MRは一貫して強力な模倣学習ベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:01:50 GMT)
Enhancing Pathological VLMs with Cross-scale Reasoning [16.2] 病理画像は本質的にマルチスケールであり、病理学者は、低倍率で地球規模の組織構造から高倍率で細胞形態まで、正確な診断のために証拠を統合する必要がある。
既存の視覚言語モデル(VLM)の病理データセットには様々なスケールがあるが、明示的なクロススケール推論の目的はない。
本稿では,病理学の解釈を多変量化推論として定式化する,最初のクロススケールトレーニングと評価パラダイムを紹介する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:49:10 GMT)
Conflict-Aware Retriever Editing for Knowledge Injection Attacks on LLM-Based RAG Systems [15.8] 検索強化世代(RAG)システムに悪意のある知識を注入すると、検索された証拠を操作でき、下流生成を誤解させる。
本稿では、RAGにおける悪意ある知識注入のためのモデル中心の検索攻撃フレームワークであるCAREATTACKを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:17:56 GMT)
Dissecting model behavior through agent trajectories [15.8] 私たちはインテント・エグゼクティブのギャップを形式化し、モデルが意図するものと、ハーネスが実行しているものとのミスマッチと、その逆です。
このハーネスモデルアライメントの効果を説明するために,SSA(Simple Strands Agent)と呼ばれるシンプルでカスタマイズ可能なハーネスを開発した。
i) 一般的なエージェントベンチマークで多種多様なモデルプロデューサが報告したpass@1$のパフォーマンスを$textbfreproduce or improve on the pass@1$、(ii) SSA$で生成された138kのトラジェクトリのtextbfanalysisの上に構築する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:17:03 GMT)
Generalization Guarantees for Multi-Input Neural Operator Learning in Sobolev Spaces [15.7] 我々は,ソボレフノルムで測定された出力誤差を用いて,多入力ニューラル演算子の近似および一般化誤差推定を開発する。
特にバランスの取れた状態では、近似と一般化率は入力次元、正則性、ソボレフ順序の間の相互作用によって支配される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:00:59 GMT)
LLM-as-Judge in Education: A Curriculum-Grounded Marking Pipeline [15.6] 本稿では,質問レベルマーキングのためのカリキュラムベースでカスタマイズ可能なLCM-as-Judgeパイプラインを提案する。
パイプラインは、大学入学試験の準備を支援する工業パートナーと共同で開発されている。
予備評価の結果,提案したLSM-as-Judgeパイプラインは人間のチューターに匹敵するマーキング結果をもたらすことが示された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:33:20 GMT)
MOSAIC: Modality-Specific Adaptation for Incremental Continual Learning in Parkinson's Disease Gait Assessment [15.6] 歩行に基づくパーキンソン病の評価は、ますます異質なセンサーに依存している。
デバイスアップグレードやプロトコルの変更,マルチセンタ展開を通じて,新たなセンサが到着する可能性がある。
このモダリティ・インクリメンタルな設定は、信頼できないクロスモーダル蒸留、モダリティ固有の統計シフト、保存後の可塑性の減少という3つの課題に直面している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:38:50 GMT)
Beyond Prediction: Tail-Aware Scheduling for LLM Inference [15.5] LLM提供は、極端に長さのばらつきを示し、実際はサイズベースのスケジューリングを困難にしている。
最近のスケジューラは予測デコード長やランクを用いてSJF/SRPTを近似する。
これらの予測駆動ポリシは、分散シフト、バースト到着、GPUメモリプレッシャの下で脆弱であることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:25:37 GMT)
Meta-classification of one-class classification models using ranking correlation and nearest neighbor [15.4] 本稿では,一級分類(OCC)モデルのメタ分類について考察する。
提案手法により,OCCモデル,データセット,ランキングを統一的に分類できる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:30:31 GMT)
Towards Scalable Customization and Deployment of Multi-Agent Systems for Enterprise Applications [15.4] 大規模言語モデル(LLM)に基づくマルチエージェントシステムは,複雑な推論やタスク実行において高い性能を示す。
ドメイン固有のカスタマイズ要件と高いレイテンシと推論コストのため、運用デプロイメントは依然として困難である。
実環境におけるマルチエージェントシステムのカスタマイズと効率的なデプロイのための統合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 21:30:10 GMT)
From Brewing to Resolution: Tracing the Internal Lifecycle of Code Reasoning in LLMs [15.0] モデルが解答を最初に作り出すコード推論の内部ライフサイクルについて検討し、自己記述可能になる前に多くのレイヤを線形に回復できるようにする。
本稿では,CSD(Context-Stripped Decoding)を用いた双方向診断フレームワークの線形探索手法を提案し,Qwen,Llama,DeepSeekにまたがる16モデルを対象とした6つのコード推論タスクファミリに適用する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:06:50 GMT)
ERQA-Plus: A Diagnostic Benchmark for Reasoning in Embodied AI [15.0] ERQA-Plusは、組み込みAIの推論のための診断ベンチマークである。
711のロボット中心の画像に1,766件の質問応答がある。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:56:33 GMT)
From Refusal Geometry to Safety Geometry: Harmfulness--Refusal Coupling under Dynamic Adversarial Fine-Tuning [14.7] 既存の評価では、モデルが有害性を認識することを学んだかどうかを明らかにしていない。
本研究では, 有害性担体, 拒絶性担体, 結合性を測定する二重安全幾何プロトコルを用いて検討する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:48:07 GMT)
Performance-Driven Environment Abstraction with Multi-Timescale Learning [14.6] 大規模なマルコフ決定プロセスにおける意思決定のための性能駆動型環境抽象化について検討する。
状態空間を集約した制御近似として抽象化をモデル化する。
固定パーティションでは、値関数近似誤差とアクション共有による損失を分離する性能保証を確立する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 00:19:23 GMT)
Security and Privacy Prompts in the Wild: What Users Ask LLMs and How LLMs Respond [14.5] 大規模言語モデル(LLM)は、ユーザの情報ニーズを満たすために広く使われている。
特に未調査の分野として、デジタルセキュリティとプライバシ(S&P)がある。
本研究は14,727個のS&Pプロンプトを同定し,幅広いS&Pトピックをカバーする9つのカテゴリに分類する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:37:25 GMT)
The Benchmark Illusion: Pruned LLMs Can Pass Multiple Choice but Fail to Answer [14.3] 大規模な言語モデルはメモリ使用量と推論コストを削減しますが、標準ベンチマークが見逃す障害も発生します。
正しい答えが消去されるのか、それとも、上位の出力として答えが生成しにくくなるのか?
ベンチマークの錯覚を見いだす。高いスパーシティプルーニング(特にワンダ)の下では、モデルは、複数のスコアで正しい答えを選択しながら、欲張りのオープンジェネレーションで失敗することが多い。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:14:52 GMT)
TuneAhead: Predicting Fine-tuning Performance Before Full Training Begins [13.9] 微調整性能の事前予測のためのフレームワークであるTUNEAHEADを提案する。
Qwen2.5-7B-Instructで1,300以上の微調整が実施され、TUNEAHEADは一貫して強いベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:21:21 GMT)
LAGO Policy: Latency-Aware Asynchronous Diffusion Policies with Goal-Directed Collision-Free Planning for Smooth Manipulation [13.7] 拡散に基づくビジュモータポリシーは、しばしばチャンク間不連続を示し、障害物認識実行の明確なメカニズムを欠いている。
本稿では,軌道最適化と拡散ポリシを統合した非同期動作生成フレームワークであるLAGO Policyを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:33:51 GMT)
A Unified Framework for Context-Aware and Relation-Aware Graph Retrieval-Augmented Generation [13.7] Retrieval-Augmented Generation (RAG) は、大規模言語モデルを外部知識で拡張するためのパラダイムとして登場した。
既存のグラフベースの手法は、真の知識融合なしに原文に固定された表現を操作する。
本稿では,HyGRAGを提案する。HyGRAGは階層型グラフRAGフレームワークで,3つのコア課題に対処することで,ソース文書を超越する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:44:10 GMT)
ReAge3D: Re-Aging 3D Faces with View Consistency [13.7] 現実的で制御可能な3次元顔再構成のための新しいフレームワークを提案する。
本手法は,既存の3次元編集技術よりも視覚的,定量的に優れている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:56:00 GMT)
Bifrost: Hybrid TEE-FHE Inference for Privacy-Preserving Transformer and LLM Serving [13.6] クラウドホスト型トランスフォーマーと大規模言語モデル(LLM)推論は、直接機密性の問題を引き起こす。
我々は、秘密が証明されたCPU TEEにのみプロビジョニングされるハイブリッドTEE-FHEサービスアーキテクチャであるBifrostを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:06:57 GMT)
EHRNote-ChatQA: A Benchmark for Evidence-Grounded Multi-Turn Clinical Question Answering over Longitudinal Discharge Summaries [13.5] EHRNote-ChatQAは,患者の複数の退院サマリーに答えるエビデンスグラウンドド・マルチターン臨床質問に対する最初のベンチマークである。
EHRNote-ChatQAは、特定されていないMIMIC-IV放電サマリーから作られ、患者レベル967個のマルチターンサンプルを1から5つのノートと16,072個の医療専門家が検証したQAペアを含む。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:33:24 GMT)
MLLMs Get It Right, Then Get It Wrong: Tracing and Correcting Late-Layer Textual Bias [13.4] マルチモーダル大言語モデル(MLLM)は、画像が明確な証拠を提供する場合でも、一貫してテキストを好む。
このバイアスは、視覚的な接地を必要とするアプリケーションにリスクをもたらすが、その原因は不明である。
CALRD(Conflict-Aware Layer Reference Decoding)は、推論時に予測を復元する訓練不要な手法である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:05:46 GMT)
Using Cognitive Models to Improve Language Model Simulation of Human Persuasion Games [13.3] 認知科学と経済学は、人間の意思決定の数学的モデルを利用するのに便利なツールであることを示す。
本研究では,大規模言語モデルと認知モデルとの一致を導くために,Equation-to-Behavior Promptingと呼ぶアプローチを提案する。
これらのシミュレーションは、多様なトレーニング環境を作るのに役立ちます。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:16:17 GMT)
MagpieTTS-LF: Inference-Time Long-Form Speech Generation Without Training on Long-Form data [13.1] 我々はMagpieTTS-LFと呼ばれる推論時アプローチを提案し、MagpieTTSはモデル再構成なしでコヒーレントな長文音声を生成することができる。
本手法では,(1)過去と将来の文脈を保存しながらモノトニックなアライメントを導くためのソフトアライメント,(2)文チャンク間のコンテキストを維持するステートフル推論アルゴリズム,(3)談話レベルの韻律計画に過去のテキストを使用する履歴対応テキストエンコーディング,の3つの重要なイノベーションを紹介する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:58:26 GMT)
PreUnlearn: Auditing Collateral Knowledge Damage Before Large Language Model Unlearning [13.0] データ中心の観点から,大規模言語モデルの機械学習について検討する。
我々は一貫した崩壊パターンを見いだす: 横方向の損傷は、忘れられた集合の近くで最強であり、意味的な距離で弱まるが、ドメイン境界で消えることはない。
我々は,学習前予測タスクとして忘れセット監査を定式化し,下流の損傷を最も予測するデータの特徴を分析した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:32:11 GMT)
Test-Time Training for Robust Text-Guided Open-Vocabulary Object Counting [12.9] テキスト誘導Open-vocabulary Object Counting (TOOC)は、テキストプロンプトによって指定された任意のオブジェクトカテゴリをカウントできる。
既存のTOOC手法は,主に理想画像に基づいて開発・評価されている。
多様な汚職条件下でのTOOC評価のための最初のベンチマークであるRobust-TOOCを紹介する。
本論文では,TOOCのためのデュアルアーキテクチャテストタイムトレーニングフレームワークであるDual-TTTを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:08:02 GMT)
Improving low-resource ASR using bilingual fine-tuning with language identification: a cross-linguistic evaluation [12.7] 本研究では,低音源言語におけるバイリンガル微調整が自動音声認識(ASR)に与える影響について検討する。
本手法は言語学的および地理的に異なる9つの言語対にまたがって評価する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:48:36 GMT)
Structured Representation Learning with Locally Linear Embeddings and Adaptive Feature Fusion [12.6] 本稿では,動的特徴と報酬特化特徴の絡み合いを促進する新しい強化学習フレームワークを提案する。
本手法は従来のRL手法と比較して学習効率と全体的な性能を向上させる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:28:39 GMT)
Supporting the Adoption of Privacy-Enhancing Technologies through Requirements Engineering [12.2] プライバシー向上技術(PET)は、個人情報を処理するソフトウェアシステムにおいて、規制とユーザプライバシ要件を満たす手段として認識されている。
既存の研究は、ソフトウェアにおけるPETの採用に対する繰り返しの課題を一貫して特定している。
利害関係者グループ間のPET導入の課題を検討するために,実践的,工学的視点を適用した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 00:49:10 GMT)
Asymptotically Optimal Circuit Depth for Diagonal Unitary Synthesis and Compilation on Two-Dimensional Grids [12.2] 対角ユニタリ(Diagonal Unitary)は、量子演算のリソース集約型クラスである。
合成と編集を共同で行う。
GPFを2次元近傍グリッドにコンパイルすることは、この最適性を保っていることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:51:26 GMT)
DexLink Hand: A Compact, Affordable, 16-DOF Linkage-Driven Hand with Human-Like Dexterity [12.1] 低コストのリンケージ駆動型人為的手は、高ディクスタリティ、構造統合、人手のような機能を実現する。
ハンドは16個の独立したアクチュエータで駆動される20個のジョイントを統合し、人間の手の大きさの構造物にコンパクトに埋め込まれたすべてのアクチュエーター、センサー、および伝達部品を組み込む。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:58:25 GMT)
A Survey on Data-Driven Models for Soil Moisture Regression and Classification [12.1] 本研究は,土壌水分の推定と分類のためのAIモデルの構造的調査である。
既存のアプローチは、統計時系列モデル、統計学的手法、古典的機械学習(ML)モデル、ディープラーニング(DL)モデル、確率的/ベイズ的手法の5つのカテゴリに分けられる。
これらのモデルは、過去の土壌の水分記録、気象変数、植生指標、地形、土壌特性、地形データを利用して回帰や分類を行う。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:31:46 GMT)
Do as the Romans Do: Learning Universal Behaviors from Heterogeneous Agents [12.1] General Reward Inference and Disentanglement (GRID)は、異種集団から普遍的に有用な行動を抽出する社会学習手法である。
GRIDは、エージェントごとの報酬関数を一般的な報酬に分解し、すべてのエージェント間で共有される行動と特定の報酬をキャプチャし、個人の好みと目的をキャプチャする。
実験では、GRIDが意味のある方法で報酬構造を切断し、実証ベースラインから標準学習を上回り、より効率的で安定した特殊化を可能にした。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 23:11:14 GMT)
Implicit vs. Explicit Prompting Strategies for LVLMs in Referential Communication [12.1] 最近の2つの研究は、LVLMが効率的な参照表現を協調できるかという矛盾した結論に達した。
我々は、モデルが明示的に指示されたときに効率的な参照表現をコーディネートできることを再現し、他のタスクの違いが分岐結果に寄与しないことを示唆する。
また、同じモデルでは、より暗黙的なプロンプトからコミュニケーション効率の必要性を推測することができず、人間とAIシステムのコミュニケーション方法に重要な違いが浮かび上がっていることもわかりました。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 00:05:56 GMT)
When English Isn't the Best Teacher: Source Language Effects in Cross-Lingual In-Context Learning [11.9] 多言語NLPにおける言語間移動は、教師付き微調整の文脈において広く研究されている。
フィールドが数ショットのIn-Context Learning(ICL)へとシフトするにつれて、微調整による洞察は変化しないと仮定されることが多い。
我々は,7つのタスク,6つのモデル,類型的に多様な言語群にまたがるICLにおける言語間移動に関する広範な実証的研究を行った。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:09:42 GMT)
Execution-bound advisory automation for agentic AI: a reproducible AIBOM-driven CSAF-VEX framework [11.8] プロトコル駆動フレームワークは、SBOMとAIBOMのアーティファクトを決定論的環境キャプチャと構造化ランタイムテレメトリに結合する。
爆発性は、宣言された成果物、観察されたアクティベーション条件、強制された実行ポリシーから計算される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:42:42 GMT)
STAR: SpatioTemporal Adaptive Reward Allocation for Text-to-Image RL Post-Training [11.8] textbfSpatioTemporal Adaptive Reward (STAR) Allocation for RL post-training of text-to-image diffusion and flow model。
STARは、生成モデル内のテキストイメージの注意を使い、ユーザーがプロンプトで本当に関心を持っている中核コンテンツから始める。
ステップやロールアウトによって動的に変化する空間割当マップを構築し、より関連する潜伏領域に同じグループ相対的な利点を割り当てる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:30:12 GMT)
Beyond Visual Cues: CoT-Enhanced Reasoning for Semi-supervised Medical Image Segmentation [11.7] CERS(CoT-Enhanced Reasoning)は、病理学的に異なるケースを区別するためにChain-of-Thought(CoT)推論を統合するフレームワークである。
歴史的証拠を特定するために意味認識参照選択戦略を導入する。
マルチスケール座標アテンションモジュールは、この推論に基づくコンテキストをデコードプロセスに効果的に融合するように設計されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:10:19 GMT)
Unintended Effects of Geographic Conditioning in Large Language Models [11.6] 地理的に中立なユーザプロンプトを受け取っているにもかかわらず、モデルが地理的参照を生成する現象である位置情報リークを評価する。
クリエイティブな書き込みとオープンなQ&Aプロンプトの両方で、最先端のLLMでさえ、ロケーションメタデータに晒された場合の地域固有のアウトプットを体系的に好んでいる。
注入された位置をプレースホルダー「未知」に置き換えることで,ベースラインの最大72倍のリークが増大する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:23:36 GMT)
CheckMIABench: Firm Foundations For Membership Inference Attacks on Language Models [11.6] メンバーシップ推論攻撃(MIA)は、機械学習モデルのプライバシ特性を評価するための標準的な方法である。
本稿では,LLMに対するMIAの原理的評価のためのベンチマークを構築した。
中間チェックポイントと公開トレーニングデータを備えたすべてのオープンソースモデルは、MIAテストベッドに変換できる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:26:15 GMT)
Edge Flow: A Tractable and Predictive Continuous-Time Model for Gradient Descent at the Edge of Stability [11.6] 安定の端における勾配降下ダイナミクス(EoS)のトラクタブルで忠実で予測的なモデルを提案する。
We show that Edge Flow track the dynamics of gradient descent least to faithfully as previously proposed continuous-time EoS model。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:45:47 GMT)
Temporal Preference Optimization for Unsupervised Retrieval [11.6] 新たなトレーニング手法であるTRPO(Temporal Retrieval Preference Optimization)を用いたTPOUR(Temporal Preference Optimization for Unsupervised Retriever)を提案する。
TPOURは学習時間埋め込みを通じて目に見えない時間に一般化し、連続的な時間的アライメントを可能にする。
Qwen-Embedding-8Bと比較すると、約72.7倍小さいにもかかわらず、TPOUR Contrieverは暗黙的なクエリで平均nDCG@5を+4.04 (+12.15%)、暗黙的なクエリで+4.98 (+15.21%)改善している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:27:22 GMT)
Geometric Consistency Protocol for Foundation Model Features in Multi-View Satellite Imagery [11.6] 本稿では,Rational Polynomial Coefficients (RPC)フレームワークに適した,幾何学的かつ再現可能なプロトコルを提案する。
このRPC一貫性の評価を受けると、最先端の2Dバックボーンは、特別な3D認識モデルに対して非常に競争力があることが示される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:09:08 GMT)
Cordon: Semantic Transactions for Tool-Using LLM Agents [11.6] 本稿では,コミット前にエージェント効果のステージングと検証を行うトランザクションランタイムシステムであるCordonを紹介する。
適度な承認とレイテンシのオーバーヘッドで、良質なタスク補完を保ちながら、不可逆的な効率の失敗を減らす。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:21:14 GMT)
ConTex: Reformulating Counterfactual Generation For Time Series Forecasting [11.5] ディープラーニングに基づく時系列予測による意思決定には、実用的な洞察が必要である。
Counterfactual Time Series Explanations (ConTex) は、時間的文脈エンコーダと条件付きエンコーダからなる、モデルに依存しない分解アーキテクチャである。
提案手法は,インスタンスワイズ生成と比較して計算コストを少なくとも12~36倍削減し,約0.007秒のリアルタイム推論をサポートする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:25:12 GMT)
Closing the Feedback Loop: From Experience Extraction to Insight Governance in Verbal Reinforcement Learning [11.4] 訓練なしの言語強化学習は、LLMエージェントが世界からのフィードバックから学ぶことを可能にする。
フィードバック駆動型キュレーションループで接続された3層アーキテクチャ – ルール,エビデンス,スキル – を提案する。
また、ゼロショットベースライン以下の性能を低下させるか、精度とリスク調整されたリターンを劇的に向上させるかを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:55:55 GMT)
Online LLM Selection via Constrained Bandits with Time-Varying Demand [11.3] 大きな言語モデル(LLM)は、さまざまなユーザタスクを不均一な精度、レイテンシ、コストプロファイルで処理するために、エッジクラウドシステムにますます多くデプロイされている。
本研究では,この問題を制約付きバンディット学習タスクとして定式化し,学習者がパッキング型(ハード)とカバー型(ソフト)の両方の制約の下でモデルを逐次選択する。
我々は,信頼度に基づく評価と需要予測を利用して,報酬と長期的な満足感のバランスをとる新しいオンライン学習アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:58:48 GMT)
FLAP: FOV-Constrained Active Perception Planning for Prior-Map-Free 3D Navigation [11.2] 本稿では,アクティブな知覚を軌道最適化に直接統合する新しい計画フレームワークを提案する。
パラメトリック起動時最適化を用いたアクティブな知覚サブ軌道セグメントを導入し、遅延障害物検出による衝突リスクを軽減した。
我々の定式化は、主に水平運動のために設計された従来の方法を超えて、任意の3D操作中にアクティブな知覚を可能にする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:40:30 GMT)
Environment-Grounded Automated Prompt Optimization for LLM Game Agents [11.1] LLMエージェントのための自動プロンプト最適化フレームワークを提案する。
観察対アクションパイプラインをゴール条件記述エージェントとアクション選択エージェントに分解する。
環境リターンによって誘導されるLLM駆動の進化ループを通じて、各モジュールのプロンプトを反復的に洗練する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:06:27 GMT)
Expanding SPHERE-JEPA: A Family of Statistical Regularizers for the Hypersphere [11.1] SSL(Self-Supervised Learning)では,単位超球面上の一様分布を明示的に強制することにより,表現の崩壊を防止することが実証された。
現在のフレームワークは通常、SIGReg(LeJEPAで使用される)やSUSReg(SPHEREJEPAで使用される)のようなスライスされた統計正規化器に依存している。
これにより、トレーニング勾配にプロジェクションのばらつきを注入し、最適化を安定化させ、収束を妨げる。
本研究では,これらのランダムな射影を解析的に統合することにより,決定論的最大平均離散性(MMD)が得られ,スライスされた手法のばらつきを回避できることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:10:05 GMT)
GSPan: A Continuous Gaussian Primitive Representation for Arbitrary-Scale Pansharpening [10.9] GSPanは2次元ガウススプラッティング(GS)をパンシャーピングに導入するフレームワークである。
GSpanは、連続かつ学習可能な2Dガウス原始体としてバンドワイド残差の詳細を表す。
QuickBird、GaoFen-2、WorldView-3、WorldView-3-4Kデータセットの実験は、GSPanが最先端の核融合性能を提供することを示している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:36:36 GMT)
Starter-Iterator Neural Operator: A Unified Architecture for High-Fidelity Forward and Inverse PDE Problems [10.9] 演算子学習は、機械学習と科学計算を統合する新興分野である。
本稿では,SINO(Starter-Iterator Neural Operator)を提案する。
SINOは数値精度、能力、一般化、堅牢性において優れた性能を発揮する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:54:39 GMT)
Structural Preservation and the Logical Expressiveness of Graph Neural Networks [10.9] 我々は,グラフニューラルネットワーク(GNN)のクラスを構造的特性で保存する論理的表現性を確立することによって,意味論的視点を定めている。
それぞれの特性に対して、GNNのクラスを特徴づける格式付きモーダル論理の断片が存在することを示す。
特に、埋め込み、射影準同型、準同型による保存は、実数次モジュラー論理、その存在正の断片および存在正のモジュラー論理にそれぞれ対応している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:57:50 GMT)
ResAware: Cross-Environment Website Fingerprinting via Resource-Privileged Distillation [10.9] Webサイトフィンガープリント(WF)攻撃は、実験室の設定において高い精度を達成するが、実際の環境では著しく低下する。
本稿では,bfResAwareを提案する。
グローバルに分散した6点から5ヶ月にわたって収集した大規模データセット上でResAwareを評価する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:24:01 GMT)
The Illusion of Improvement: Reject Inference Strategies in Credit Scoring [10.8] リジェクト推論法は、クレジットスコアリングにおける生存バイアスを軽減するために広く用いられている。
自然なリトレーニングサイクルでは、リコール崩壊時に精度が向上するモデルが改善の錯覚を生み出す。
統計的仮定なしでフィードバックループを破る制御された探索戦略を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:43:43 GMT)
EgoInfinity: A Web-Scale 4D Hand-Object Interaction Data Engine for Any-View Robot Retargeting and Video-to-Action Robot Learning [10.8] EgoInfinityは、ロボットの獲得と学習のためのWebスケールデータ生成を可能にする、汎用的な4Dハンドオブジェクトインタラクションデータエンジンである。
EgoInfinity(エゴインフィニティ)は、知覚、セグメンテーション、再構築、相互認識の洗練、そして従来の計算不可能なビデオ対アクション問題を自動化するための、モジュール式エンジンである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 00:44:16 GMT)
When Does Trajectory-Level Supervision Permit Efficient Offline Reinforcement Learning? [10.7] 我々は、結果レベルの監督からオフライン政策最適化の統計理論を開発する。
OPACは、報酬モデルを学び、軌道レベルのラベルからポリシーを最適化する悲観的なアクターアルゴリズムである。
一般化された結果に基づくオフラインRLについて検討し,各ステップ当たりの報酬の非線形集約によって誘導されるトラジェクトリレベルの量について検討した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:55:45 GMT)
SketchXplain: Intuitive Visual Explanations of Image Classifiers with Sketches [10.7] 解像度マップの可視化は、領域を指して画像ベースのAI予測を説明するが、これらはしばしば直感的で意味不明である。
AIの説明は直感的で、ユーザー知識に忠実でありながら、解釈を加速するためにはシンプルで選択的であるべきだ、と私たちは主張する。
直感的な画像に基づく説明可能なAI(XAI)のためのスケッチベースの視覚的説明を生成するために,芸術的図面に触発されたSketchXplainを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:05:26 GMT)
Anywhere, Any-Stymie: Remote Activation of Trojan Malware on LiDAR with Modulated Signals [10.6] 我々は、LiDAR検知パイプラインに埋め込まれた休息中のマルウェアが正常な動作中に不活性な未発見の攻撃面を同定する。
この脅威を運用するために,低レベルのポイントクラウド操作が可能なマルウェアを設計し,それをLiDARファームウェアに組み込む。
その結果は、LiDARセンサーの開発とデプロイメントパイプライン全体を通じて、より強固な完全性を保証する必要性を強調している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:07:41 GMT)
SoftMoE: Soft Differentiable Routing for Mixture-of-Experts in LLMs [10.6] 離散的ルーティングをトラッピングしたソフトトップ-k$LapSum緩和に置き換えるSoftMoEを提案する。
さらに、各レイヤごとのアクティブエキスパートの平均数をパラメータ化し、グローバルな予算制約を課します。
SoftMoEは、自動回帰モデリングと、言語モデリングとダウンストリームタスクのスパースMoEに匹敵するパフォーマンスと完全に互換性がある。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:05:41 GMT)
Learning task-specific subspaces via interventional post-training of speech foundation models [10.6] 介入型コントラスト学習を用いた訓練後改善手法を提案する。
我々は、音声基礎モデルの絡み合った表現空間から、別コンテンツと話者部分空間への変換を学習する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:18:20 GMT)
WallZero: Mastering the Game of WallGo with Strategic Analysis [10.5] WallGo(ウォールゴー)は、2025年のNetflixシリーズ『The Devil's Plan』で人気を博した戦略的なボードゲームである。
人気は高まっているものの、WallGoはいまだに過小評価されている。
本稿では,AlphaZeroをベースとした2プレーヤのWallGo設定用エージェントであるWallZeroについて述べる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:16:13 GMT)
Towards Understanding and Measuring COGNITIVE ATROPHY in LLM Behaviour [10.4] 既存のベンチマークは、知識、安全性、静的応答品質を測定する。
我々は、この欠落した次元を、AIによるメンタルヘルス支援におけるプロセスレベルの行動尺度であるCOGNITIVE ATROPHYとして定式化する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:26:12 GMT)
LLM Features Can Hurt GNNs: Concatenation Interference on Homophilous Graph Benchmarks [10.3] グラフニューラルネットワーク(GNN)にLLM生成ノード機能を追加することで、標準ベンチマークの精度が向上することが広く報告されている。
LLMの特徴が純粋に入力結合によって導入された場合、エンド・ツー・エンドのパイプラインが成功するホモフレンドリーなベンチマークにおいて、その精度を体系的に低下させることができる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:30:30 GMT)
Medical Heuristic Learning: An LLM-Driven Framework for Interpretable and Auditable Clinical Decision Rules [10.3] 深層学習と木に基づくアンサンブル法は精度が高いが、ブラックボックスの性質は臨床展開の大きな障害である。
本稿では,医学的ヒューリスティック学習(MHL)を提案する。
MHLは、統計プローブ、医療知識プローブ、ルール合成、コードレベルの反復改良を統合し、決定論的かつ実行可能な決定システムを最適化する、LLM(Big Language Model)駆動のワークフローを使用している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:51:19 GMT)
Large Language Model-Driven Cooperative Operator Ensemble Evolution for Permutation Flow Shop Scheduling [10.2] 本研究は、IG-DOEと呼ばれるマルチトリガーIGアルゴリズムを提案し、単一の探索軌道に沿って異種破壊演算子を切り替えることにより探索を強化する。
挑戦的なVRF-hard-largeベンチマークの実験によると、DOEは小さな問題インスタンスから大きな未確認インスタンスへと進化した。
実世界の産業データ由来のインスタンスに関するさらなる実験は、進化したDOEが、追加の適応なしに、異なるデータに効果的に一般化できることをさらに示している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:50:52 GMT)
Prompt Perturbation for Reliable LLM Evaluation over Comparison Graphs [10.1] 大きな言語モデル(LLM)を評価することは、その能力を理解し、競合するシステムを比較し、実際に信頼できるモデルのデプロイをサポートするために重要である。
オープンエンドタスクでは、同じプロンプトに対する2つの応答を比較し、その結果の判断を総合的なランキングに集約する、ペアワイズ評価が一般的なパラダイムとなっている。
このパラダイムの中心的な課題は、非推移性(intransitivity)である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:44:45 GMT)
A Link between Shock-wave Theory and Symmetry-reduced Stochastic Gradient Descent for Artificial Neural Networks [10.1] 我々は、衝撃波理論と勾配降下の対称性商化学習力学とを数学的に明示的に関連づける。
我々は,マルチ層パーセプトロン,畳み込みニューラルネットワーク,トランスフォーマー,平均場ネットワークがハミルトン-ヤコビ型あるいはバーガース型方程式に従うことを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:20:52 GMT)
Bounded Difference Concentration for Infinitely Exchangeable Sequences with Applications to AI Benchmark Uncertainty [10.0] 無限交換可能な確率変数の関数の濃度特性を考察する。
サブサンプル平均と全集団平均との差のようなゼロサム線形コントラストでは、潜時混合項は正確にキャンセルされる。
このキャンセルは、最近の有限交換可能な濃度結果の無限伸縮限界に対して直接デ・フィネッティ機構を提供する、厳密で混合のないホーフディング型境界を与える。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:19:01 GMT)
Deep Learning-Driven Inverse Design of Doherty Power Amplifiers Using Pixelated Combiners and Dual-State Impedance Synthesis [9.9] 深層畳み込みニューラルネットワーク(CNN)、画素配置表現、遺伝的アルゴリズム(GA)を組み合わせた3ポートドハーティコンバインド設計手法を提案する。
概念実証として、3ポートコンバインダーを搭載した2台のGaN HEMT Doherty PAプロトタイプを設計・製造した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:38:15 GMT)
ChLogic: Evaluating Robustness of Logical Reasoning in Chinese Expressions [9.8] ChLogicは、同じ潜在論理構造が英語および多種多様な中国表面実現で表されるときに、モデルが論理的推論性能を維持するかどうかをテストする、英語と中国語の一致したベンチマークである。
Qwen3、Ministral、GLMモデルの実験では、持続的な英語と中国語のパフォーマンスギャップが明らかになった。
標準中国語から英語への逆翻訳は、しばしばジェネラル・アライメント・セットのパフォーマンスを改善するが、ディフィカルト・アライメント・セットに混合効果をもたらす。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:28:57 GMT)
SPICE-Q and Large-Scale Quantum Chip Production [9.8] SPICE-Q は HFSS, Qiskit Metal, pyEPR, SQcircuit, SQuADDS, scqubits, QuTiP などのツールを接続することを目的としている。
中心となるマッピングは、プロセスとPDKの制約からレイアウト幾何学、電磁モード、等価回路パラメータ、効果的なハミルトン、そして最後に周波数、カップリング、非調和性、デコヒーレンス、読み出し性能、収率などである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:31:10 GMT)
Understanding LLMs in Title-Abstract Screening: From Disagreements to Recommendations [9.6] 体系的レビュー(SR)におけるタイトル抽出スクリーニングのための大規模言語モデル(LLM)の信頼性について検討する。
我々は、LLMと6つのソフトウェアエンジニアリングSRの研究者の意見の相違を分析し、1000以上の初等研究論文を分析した。
本稿では,デプロイ前の意味理解の検証,複数のLSMの実行,境界事例に対する検証の取り組みなどを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:51:04 GMT)
AoiZora: Topology-Aware Auto-Parallel Optimization for Inference of Diffusion Transformers [9.6] AoiZoraは、TPUサブスライス上での低世代ビデオ推論のために開発されたコンパイラ生成トポロジープランナである。
AoiZoraはWan 2.1のワンステップ遅延を既存のソリューションと比較して最大1.22倍削減する。
TPU v5e サブスライスでは、AoiZora は Wan 2.1 の1ステップの遅延を既存のソリューションと比較して 1.42 倍削減する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:12:05 GMT)
From Shield to Target: Denial-of-Service Attacks on LLM-Based Agent Guardrails [9.5] LLMベースのガードレールは、自律エージェントの即時注入と脱獄攻撃に対する非常に効果的な防御として出現している。
攻撃者は、製造されたデータを注入して、長期の推論ループでガードレールをトラップし、系統的なサービス拒否攻撃を実施できることを示す。
1つの有毒な文書が共有ガードレールのインフラを飽和させ、効果的に共同配置されたエージェントを飢えさせ、システム全体を麻痺させることが示される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:28:39 GMT)
SPHINX: First Explain, Then Explore [9.5] 我々は、運転方針の故障診断に基づいて、敵のシーンを生成するべきであると論じる。
本稿では,逆シナリオ合成のためのクローズドループフレームワークについて,まず説明し,探索する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:48:27 GMT)
MathVis-Fine: Aligning Visual Supervision with Necessity via Progressive Dependency-Guided Training for Multimodal Mathematical Reasoning [9.5] CoT(Chain-of-Thought)推論は、純粋言語ドメインからマルチモーダルシナリオへと拡張されている。
既存のアプローチでは、視覚入力を均質または補助的な信号として扱うことが多い。
数学的推論におけるきめ細かい視覚的依存をモデル化するためのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:09:32 GMT)
Children Are Not the Enemy: Child-Fit Security as an Alternative to Bans and Surveillance [9.4] 我々は、このフレーミングが子供のデジタル生活に不適切であり、セキュリティパラダイムとして不十分であると主張している。
子どもが利用しそうな技術が、攻撃者を排除するのではなく、正当な使用者として扱われる設計パラダイムであるチャイルドフィットセキュリティを提案する。
我々は、児童の健康を概念化し、包括的アプローチと対比し、その中核となる原則を定義し、そのセキュリティ設計への影響について議論する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:09:56 GMT)
Public transit gains and spatially uneven travel demand changes after NYC congestion pricing [9.4] 2025年1月、ニューヨーク市は全国初のコードンベースの混雑価格設定プログラムを実施。
時系列基礎モデルを用いて,不確実性を校正した確率論的対実需要予測を生成する。
その結果, 公共交通機関のバスや地下鉄の乗客数は, 公共交通機関の需要に比して大幅に増加し, 旅行需要は緩やかに減少した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:14:23 GMT)
MOCHI: Motion Enhancement of Collaborative Human-object Interactions [9.4] 協調的な人間と物体の相互作用は、参加者と共有対象との相互予測と継続的な調整を必要とする複雑な動きを示す。
ノイズの多いMHOIデータを改善するための2段階フレームワークであるMOCHIを提案する。
提案手法は,まず,雑音の多い身体入力から手の動きを最適化し,身体のポーズとセマンティックに整合した手の動きを生成する。
最適化の過程では,人・物・人・人のインタラクション情報を,これら1対1で符号化する最適化手法を導入する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:58:44 GMT)
Time-Series Foundation Model Embeddings for Remaining Useful Life Estimation [9.0] 凍結したバックボーンとしてChronos-2を使用し、コンテキストウィンドウの特徴を抽出し、RUL予測のための軽量回帰ニューラルネットワークを訓練する。
実世界の産業センサデータによる実験によると、クロノス2の機能は、繰り返し、畳み込み、トランスフォーマーベース、勾配ボスティングベースラインよりも一貫して改善されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:38:32 GMT)
Heterogeneous SAR-optical fusion for near-real-time land use and land cover mapping under cloud contamination: A novel framework and global benchmark dataset [8.9] CloudLULC-Netは、エンドツーエンドのヘテロジニアスなSAR-光融合フレームワークである。
雲に汚染されたSentinel-2画像と時間的に隣接したSentinel-1 SAR観測からLULCマップを直接予測する。
CloudLULC-NetのOAは86.60%、F1スコアは83.29%、mIoUは73.51%である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:25:10 GMT)
SNAS: A Multi-Layer Defense-in-Depth Architecture for Secure Egress in Sandboxed Workloads [8.8] Snowparkは、セキュアなサンドボックスでユーザ定義関数を実行することによって、SnowflakeのデータエンジニアリングとAI/MLワークロードを可能にする。
これらのワークロードの多くは、クラウドAPIや外部データベース、機能ストアにアクセスするために、外部接続が必要です。
本論文では,Snowpark(SNAS)におけるセキュアネットワークアクセス(Secure Network Access in Snowpark)について述べる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:19:59 GMT)
GMN4AD: Graph Matching Network for Alzheimer's Disease Diagnosis with Test-Time Domain Adaptation using Multi-centered Structure Magnetic Resonance Imaging [8.8] アルツハイマー病診断のためのグラフマッチングネットワーク(GMN4AD)を提案する。
神経画像データから得られる異種脳グラフ間の相互作用をモデル化するように設計されている。
最先端の手法に比べて優れた性能を実現し、AD診断のための堅牢で一般化可能なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:32:23 GMT)
MambaCount: Efficient Text-guided Open-vocabulary Object Counting with Spatial Sparse State Space Duality Block [8.8] Text-guided Open-vocabulary Object Counting (TOOC) は、テキストプロンプトによって記述されるオブジェクトの数を推定することを目的としている。
Mambaは線形複雑性のために有望な代替手段を提供する。
MambaCountは空間スパース状態空間双対(S4D)ブロック上に構築された効率的なフレームワークである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:11:58 GMT)
Understanding Long-Term Dynamics of Individual Metro Usage: A Hidden Semi-Markov State Framework with Survival Analysis [8.6] 本研究は,各メトロモビリティの進化を特徴付ける状態ベースライフサイクルモデリングフレームワークを提案する。
このフレームワークは上海地下鉄の4年間のスマートカードデータに適用される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:49:53 GMT)
Fabless Quantum Chip Design and Commercial Production [8.2] 本稿では,超伝導量子コンピューティングのためのファブルス量子チップの設計と製造アーキテクチャを提案する。
提案するエコシステムは、プロセス認証された量子PDK、パラメータ化されたデバイスセル、トレーサブルモデルカード、SPICE-Q物理モデリング言語、統一Q-EDAフロー、ファストリーサインオフルール、低温テストフィードバック、再利用可能な量子IPを接続する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:08:45 GMT)
As You Wish: Mission Planning with Formal Verification using LLMs in Precision Agriculture [7.9] 精密農業におけるミッションプラン作成にLLMを活用したミッションプランナを導入する。
このシステムは印象的な性能を示すが、自然言語の本質的な曖昧さにも悩まされている。
計画アーキテクチャに複数のフィードバックループを導入することで、この問題に対処できるようにシステムを拡張します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:17:53 GMT)
A Generalized Formalism of Auto-Regressive Decoding for Speech Processing [7.8] 音声処理におけるAR検索の分野での明確な包含基準を設定した。
ニューラルネットワークの探索戦略を分類・報告するための一般化された理論的枠組みを導出する。
復号化プロセスを中心としたベンチマークの設計を簡略化する上で,この形式化の能力を示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:31:39 GMT)
IUU+DB: Tracking Illegal, Unreported, and Unregulated Fishing, Seafood Fraud, and Labor Abuse through LLM-driven Information Extraction [7.7] イルガル、非報告、非規制漁業(IUU)は伝統的に、適用法に違反したり、適用法を欠いた地域で起こる漁業活動を指す。
IUU+という用語は、環境分野と関連するサプライチェーンの貿易関係の犯罪・行動に関して、より広い範囲の漁業群をとらえるためのものである。
IUU+アクティビティのグローバルインシデントデータベースを構築するための大規模言語モデル駆動システムであるIUU+DBを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:16:05 GMT)
Impact of Network Constraints on Fault-Tolerant Distributed Quantum Computing [7.7] 本稿では,サーフェスコード操作,内部QPU接続,現実的なネットワーク制約を共同でモデル化するエンドツーエンドシミュレーションフレームワークを提案する。
このフレームワークはモジュール構造であり、ルーティングやスケジューリングポリシ、ネットワークトポロジといった個々のコンポーネントを独立して置き換えることができる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:08:19 GMT)
Martingale Doppelgänger-Eval: An Identification Framework for Auditing Candlestick Understanding in Vision-Language Models [7.6] Martingale Doppelgnger-Evalは、視覚言語モデル(VLM)が過去の傾向を概説するのではなく、キャンドルスティックエビデンスを使用するかどうかを監査するための、公開のシャドウマーケットベンチマークである。
構造的行動モデルは、ヌルマーケットバイアス、トレンド感度、エビデンス感度、プロン/レンダーの脆弱性、エビデンス忠実性を識別する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:10:37 GMT)
Representation Costs in Data Science: Foundations and the Quasi-Banach Spaces of Deep Neural Networks [7.6] 任意のパラメトリックモデルに対する表現コストを定義し、誘導(ネイティブ)関数空間を明らかにする。
この抽象的な設定に多くの自然結果が成り立つことを証明し、自然空間上のパラメトリックな方法の表現定理を含む。
表現コストの研究の「アキソメタイズ」の副産物は、ディープニューラルネットワークの新しい結果もすぐに得られることである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:18:05 GMT)
Optimal Calibration of Quantum Network Links [7.5] 線形量子リピータチェーンの各リンクに対して、アクティベーション周期を最適に割り当てるプロトコルを開発する。
この基盤の上に構築され、複数の経路が共通のリンクで交差する一般的な量子ネットワークに拡張する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:06:41 GMT)
AIPatient Arena: EHR-grounded evaluation of large language models in end-to-end clinical consultation workflows [7.4] 大規模言語モデル (LLM) は, 臨床相談業務での使用を想定している。
本稿では,ALMの臨床的有用性を評価するための評価フレームワークであるAIPatient Arenaを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:35:17 GMT)
Incumbent Advantage: Brand Bias and Cognitive Manipulation Dynamics in LLM Recommendation Systems [7.3] 大型言語モデル(LLM)を用いたスキンケア製品検索におけるブランドダイナミクスの研究
有名ブランドが、すべての製品が同じ仕様を持つ時間に100%推奨されることは分かっていますが、この優位性は、競合製品にとって+0.1星以下の評価優位性で消えます。
この結果から, 生産エンジン最適化 (GEO) は, 市場競争を形作る新たなマーケティング手法として研究されるべきであることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:54:34 GMT)
From Ad Hoc Pilots to Repeatable Patterns: Structuring Drone Collaboration in Emergency Services with DroneLets [7.2] 本稿は、緊急チームがドローンとどのように協力するか、そしてこれらのコラボレーションを再現可能なプロセスにどのようにフォーマル化するか、という2つの研究課題に対処する。
偵察,コミュニケーション,物流支援などの運用ニーズを反映した10のメタパターンに分類した44のインタラクションパターンを導出する。
DroneLetsは、セットアップ要件、ドローン能力、環境制約、人間とドローンのアクター間の協調アクションをキャプチャする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:08:07 GMT)
Accountability in Autonomous Drone-Based Firefighting: Insights From a Field Trial [7.2] 本稿では,自律ドローンが複雑な社会技術システムにおける説明責任の帰属にどのように影響するかを検討する。
この研究は、ファイアファイアファイアファイアファイアウォールにおける2つの実戦試験に基づいて、ドローンを組織的に展開する際の説明責任に関するかなりの不確実性を明らかにした。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:01:24 GMT)
A Risk Decomposition Framework for Pre-Hoc Fine-Tuning Prediction [7.1] 微調整 LLM の高コスト化は経済的障壁となり、このコストを著しく削減するためには、プリホック性能予測が重要な解決策となる。
情報制約下での予測問題として定式化し、予測リスクを2つのコンポーネントに分解する。
本稿では,タスクを静的,動的臨界,騒音支配の3つに分類する予測可能性フェーズ図を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:07:42 GMT)
VoidPadding: Let [VOID] Handle Padding in Masked Diffusion Language Models so that [EOS] Can Focus on Semantic Termination [7.1] 既存のMDLMは、命令チューニング中にパディングに繰り返しtexttt[EOS]トークンを使用するという自己回帰的な慣習を継承することが多い。
この二重の役割は、大きなブロックデコードの下でのtexttt[EOS]オーバーフローの根本原因であることを示す。
VoidPaddingは、パディングのためのtexttt[VOID]を導入し、終了のための texttt[EOS]を予約する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:46:53 GMT)
Agentra: A Supervisable Multi-Agent Framework for Enterprise Intrusion Response [7.1] Agentraは、スーパービジョン可能なマルチエージェント侵入応答システム(IRS)である
IRSフレームワークは、IDS、XDRプラットフォームからのアラートを、MITRE ATT&CK、MITRE D3FEND、NIST CSF 2.0に根ざした構造化インシデント対応プランに変換する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:17:28 GMT)
Acceleration-induced spectral blind spots in stimulated atomic transitions [7.0] 刺激された遷移は、光-物質相互作用における最も基本的な過程の1つである。
均一な加速度は、この慣れ親しんだ応答を周波数選択的な応答の欠如に変換することができることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:14:20 GMT)
N(CO)$^2$: Neural Combinatorial Optimization with Chance Constraints to Solve Stochastic Orienteering [7.0] N(CO)$2: Neural Combinatorial Optimization with Chance cOnstraints to solve the Orienteering Problem (SOP) without without the use of hand-crafteds。
提案手法は,不確実な環境下での適応的かつ効率的な意思決定を可能にしながら,人間の労力を削減する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:05:51 GMT)
Proximal Mediation Analysis with Hidden Recanting Witnesses [6.9] 多くの実践的な設定は、治療によって引き起こされた仲介者-アウトカムの共同設立者として定義される証人が欠席しているか、または完全に知られた先駆者である、という仮定に依存している。
本研究は,未確認の目撃者の存在下での経路特異的な影響を特定することの課題に対処する,3つの新しい識別戦略を開発する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:07:06 GMT)
Manipulation of Topological Corner States via Subchiral Symmetry [6.9] 亜キラル対称性は、位相的コーナーモードを操作するための一般的な制御原理を提供する。
選択したコーナー間で1つのコーナー状態または2つのコーナー状態の重ね合わせのいずれかを転送する断熱プロトコルを設計する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:29:05 GMT)
Interpretable and Verifiable Hardware Generation with LLM-Driven Stepwise Refinement [6.8] 大規模言語モデル(LLM)は、ソフトウェア開発で顕著な成功を収めた。
幻覚の影響を受けやすいため、微妙な意味的・論理的な誤りを起こすことができる。
本稿では,LCMの創造性と幅広い知識と,形式的手法の説明可能性と数学的厳密さを組み合わせたハードウェア生成フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:28:22 GMT)
Rethinking Dataset Distillation for Classification: Do Distilled Sets Outperform Coresets? [6.8] 我々は、ImageNet-1K, ImageNet100, ImageNetteの7つの最先端(SOTA)DD手法をベンチマークした。
その結果,いくつかのDD手法は単純な乱数部分集合よりも優れているが,SOTA DDアプローチは大規模データセットのコアセットと同等か劣っていることがわかった。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:37:49 GMT)
HLS-GPT: A Generative Pretrained Transformer (GPT) for Continental-Scale NASA Harmonized Landsat and Sentinel-2 (HLS) Reflectance Reconstruction Across All Bands on Arbitrary Dates [6.7] 本研究では,ランドサット・センチネル-230m表面反射率を復元するための大規模生成事前学習トランスモデルであるHLS-GPTを提案する。
このモデルは、全米の0.25万画素以上のトレーニングピクセルから、9年間のHLSタイムシリーズで訓練された。
62,000画素以上の独立試験画素を用いた評価は, 多様な土地表面条件下での堅牢な再構成を示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:19:21 GMT)
Domain-Validity-Gated Metamorphic Testing of Scientific ML Surrogates [6.7] 本研究では,SciMLサロゲートの候補準同型関係をドメインの有効性を検証し,実行可能なテストアセットに変換する方法について検討する。
本稿では,演算子の数値フロアに耐性が支配的であり,前提条件が保たれている場合にのみ,候補を許容する領域正当性を提案する。
証拠は2つのCFDタスクと第2のPDEファミリーにまたがり、候補MRから監査可能なSciMLテストアセットへの妥当性を認識可能なブリッジをサポートする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:13:05 GMT)
Towards an Optimally Distributed Quantum Fourier Transform Circuit [6.7] 量子回路を分割するには、回路によって実装されたユニタリ演算を保存する必要がある。
量子アルゴリズムのサブルーチンとして広く使われている量子フーリエ変換(QFT)回路の分割に着目する。
本稿では,最適ゲートパッキングに基づくパーティショニング方式を提案し,QFTの事前解析的パーティショニング方式と比較し,汎用回路パーティショニングアルゴリズムによって生成されたパーティショニングと評価する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 21:07:53 GMT)
Visuals Lie, Consistency Speaks: Disentangling Spatial Attention from Reliability in Vision-Language Models [6.6] MultiSymbol Foundation Modelsは、モデルがいつ幻覚し、批判的になるかを知るため、推論エージェントとしてますます使用される。
アテンション・信頼の仮定(Attention-Confidence Assumption)と呼ばれる一般的な直観は、信頼性は「構造的」視覚的知覚から導かれるというものである。
本稿では,現代視覚言語モデル (VLM) における信頼性信号の系統的クロスファミリー研究である VLM Reliability Probe (VRP) を通じて,この問題に挑戦する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 00:58:43 GMT)
Understanding the "Airport" Censorship Circumvention Ecosystem in China [6.6] 中国では、急成長する地下市場が、市民の定期購読に基づく検閲回避プロキシ「エアポート」を販売している。
空港は中国で最も人気のある検閲回避ツールであり、1,667人のサーベイの回答者の半分以上が利用している。
インターネットをスキャンし、Telegramの発表チャネルをスクラップすることで、オープンソースのツールキット上に構築された3,431のアクティブ空港を特定します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:22:14 GMT)
SCOPE-FL: A Strategy-proof Chain-based Optimal pareto efficient Federated Learning System [6.5] SCOPE-FLは、効果的なフェデレート学習フレームワークである。
クライアント選択は、Top Trading Cycle (TTC)アルゴリズムによって解決された、双方向の学校選択問題として定式化される。
SCOPE-FLは、DA、IASなど、モデル精度、収束率、報酬効率など、最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:28:36 GMT)
TaFD: Threat-Aware Frequency Decoupling for Adversarial Robustness against Heterogeneous Attacks [6.5] マルチスレッドの堅牢性は、ディープラーニングにおける根本的な課題である。
関節対位訓練(JAT)は広く採用されているが、異種性脅威下での負の移動に悩まされている。
本稿では,JATを周波数領域分割・分散パラダイムとして再編成する2段階防衛フレームワークであるTreat-aware Frequency Decoupling (TaFD)を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:38:26 GMT)
Contact-Based Fringe Projection Profilometry for High-Resolution 3-D Surface Measurement of Reflective and Transparent Objects [6.5] 本稿では,Digital Fringe Projection(DFP)システムに基づく接触型3次元表面計測手法を提案する。
被覆シリコン接触面上で三角法に基づく3次元再構成を行う。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:38:39 GMT)
CAPED: Context-Aware Privacy Exposure Defense for Mobile GUI Agents [6.4] スクリーンショットベースのモバイルGUIエージェントは、通常のスマートフォンアプリを人間のユーザと同じビジュアルインターフェースで操作することができる。
スクリーンショットは、連絡先、メッセージ、写真、ファイル、レコメンデーション、ヘルスキュー、その他のユーザーの要求に関係のないセンシティブなコンテキストを公開することができる。
本稿では,モバイルGUIエージェントのための環境対応プレロード露光制御層であるCAPEDを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:15:00 GMT)
A Hybrid Optimization Framework for Grasp Synthesis under Partial Observations [6.4] 本稿では,学習に基づくエネルギーベースモデル(EBM)と解析的反復的クローズトポイント(ICP)法を組み合わせたハイブリッドグリップ合成フレームワークを提案する。
5360回のグリップ試行で評価した結果,AnyGrasp (31.1%) と Grasp Pose Detection (48.4%) と AS-ICP (56.6%) を平均成功率60.9% で上回った。
これらの結果は、我々のアプローチの強力な一般化能力を強調し、データ駆動学習と幾何最適化の組み合わせがどちらの制限にもどう対処するかを実証する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:30:00 GMT)
A Prototypical Signature Approach for Writer-Independent Offline Signature Verification [6.4] オフラインシグネチャ検証は、静的イメージを使用して偽シグネチャと真のシグネチャを区別することを目的としている。
負のサンプルは通常、トレーニングデータを作成するために、他のユーザの真の署名からランダムに描画される。
原型シグネチャを用いた多種多様な情報的負のサンプルを生成するためのデータ駆動型戦略を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:48:44 GMT)
Evolutionary Algorithms and Multi-Objective Minimum Spanning Trees with Limited Distinct Weight Values [6.4] 実用的成功にもかかわらず、多目的問題に対する進化的アルゴリズムのランタイムに関する理論的結果は比較的限られている。
進化的多目的アルゴリズムの新たな実行時結果を導出し、理論的結果を実験により補完する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:47:39 GMT)
A Neuro-Symbolic Approach to Strategy Synthesis for Strategic Logics [6.3] マルチエージェントシステムのためのモデルチェックパイプラインに,大規模言語モデルを統合するニューロシンボリックフレームワークを導入する。
我々はNatATLにおける境界戦略推論のためのフレームワークをインスタンス化し、最初のNatATL戦略合成データセットを導入する。
オープンウェイトQwen3-32Bモデルによる実験により,我々の認定パイプラインは,戦略合成結果の92%の精度を達成できた。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:13:48 GMT)
BrainWorld: A Structural-Prior-Conditioned Generative Model for Whole-Brain 4D fMRI Dynamics [6.2] 本稿では,脳の4次元fMRIダイナミクスのための構造的前提条件付き生成モデルBrainWorldを紹介する。
BrainWorldは、将来のfMRI生成を導くために、主観レベルの解剖学的コンテキストとしてsMRIを使用している。
安定な4D fMRIトラジェクトリを最大400フレームに生成し、生成サンプル拡張による下流性能を改善し、ベースラインよりも優れた転送可能なマルチモーダル表現を学習する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:03:47 GMT)
Finding Compiler-Platform Interaction Bugs in Deep Learning Pipelines via Cross-Layer Constraints [6.2] ディープラーニング(DL)コンパイラのテストは、コンパイルスタック全体に埋め込まれた暗黙の制約に依存するため、難しい。
既存のテストアプローチでは、入力モデルの生成を制限するために、主に型制約を取ります。
本稿では,スケーラブルで自動的なDLコンパイラテストフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:15:17 GMT)
Simulated Customers Never Walk Away: Decision Fidelity of LLM User Simulators Measured Against Real Purchase Outcomes [6.1] 既存のフレームワークは、シミュレーターが有給参加者の真実に対して人間のように話すかどうかを測定する。
目標が割り当てられると、ユーザのモチベーションは内因性、潜伏、崩壊します。
シミュレーションされた人口が実際の連続的な選択に直面している実際のユーザの意思決定ダイナミクスを再現するかどうか。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:53:10 GMT)
When Dynamics Models Read the Wrong Time Steps: Label-Free Event Credit Re-Anchoring for Robust Global Readouts [6.0] 学習可能なダイナミクスモデルは、ステップごとの特徴列を1つの読み出しベクトルにプールすることで、グローバルな物理問題に答えることが多い。
軌道レベルの監視のみにより、モデルは十分なスムーズな相関関係を読みながら、訓練条件下で正確に予測できる。
我々は、イベントステップにどれだけのプールされたクレジットが着地するかを測定するための、インターフェースレベルの調査であるCredit-in-Eventを提案する。
次に、学習した機能から過渡的なイベントコアを推定し、プールされた表現を再アンカーする、トレーニング不要でラベルなしの読み出しであるCRESTを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:21:10 GMT)
DiagFlowBench: Evaluating How Language Models Handle Off-Procedure Inputs in Grounded Diagnostic Dialogue [6.0] 言語モデルは、メンテナンス運用におけるアドバイザリシステムとしての役割をますます高めている。
近年のシステムでは、これらのモデルを手続き的な文書化して、承認されたステップに制限している。
しかし、実際には、オペレータークエリは、しばしばこの経路から分岐し、モデルが会話の途中でスコープ外の入力を認識する必要がある。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:28:55 GMT)
Discovering Functionally Selective Brain Regions with a Deep Topographic Multimodal Model [5.9] 最近の地形モデルは、この構造の側面を再現するが、一様であり、各層を個別に空間的に拘束する。
Topo-Omniは、視覚、聴覚、言語/認知処理が一つの連続したシリコンシートを共有するマルチモーダルモデルである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:22:39 GMT)
SPARK: Low Latency Single-Camera 3D Pose Estimation for Autonomous Racing using Keypoints [5.9] キーポイント検出を用いた自律走行のための単カメラポーズ推定アルゴリズムであるSPARKを提案する。
最先端のモノクロカメラ検出アルゴリズムよりも高い精度で長距離検出を実現する。
我々は、実世界の自律レースデータに対するアプローチの性能を評価し、それを最先端のLiDARとカメラ検出アルゴリズムと比較した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:45:11 GMT)
Visual Verification Enables Inference-time Steering and Autonomous Policy Improvement [5.9] 推論時ポリシーステアリングと自己改善のための汎用ロボットポリシーのためのジェネレータ検証フレームワークであるVERITASを提案する。
予測時間による検証は、付加的な実演データをトレーニングすることなく、ベニラジェネリストを一貫して上回っていることを実証する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:59:04 GMT)
Escape from Delusional Echo Trap: Symmetry Breaking, Stochastic Dynamics and Mathematical Mitigation Strategies for Algorithmic Sycophancy [5.9] 本稿では,ユーザの認知的軌跡を追跡するための厳密で体系的なフレームワークを提案する。
我々は、潜伏状態の隠れた特徴を持つAIと対話するときに、個人が自分の信念をどう認識し、解釈し、更新するかを探求する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:37:50 GMT)
MIVE: A Minimalist Integer Vector Engine for Softmax LayerNorm and RMSNorm Acceleration [5.6] LayerNorm、RMSNorm、Softmaxなどの非線形ベクトル正規化処理は、重要なハードウェアボトルネックとなる可能性がある。
既存のアクセラレータは通常、専用のハードウェアブロックを使用してこれらの機能を実装し、重複したリソースと非効率なシリコン利用につながる。
統一データパス内で3つの操作全てを実行することができるプログラマブルアーキテクチャであるミニマリストベクトルエンジン(MIVE)を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:58:02 GMT)
Non-negative Elastic Net Decoding for Information Retrieval [5.5] 非負の弾性ネット(NNN)デコーディングを提案し,非負の線形結合としてクエリ埋め込みを共同で再構築する文書を選択する。
我々の研究は、内積スコアリングの標準的実践を超えて、情報検索に密着した埋め込みを活用するための新しいパラダイムを確立します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:32:54 GMT)
Symplectic Transversality and Endpoint Green Estimates for Finite-Horizon Pontryagin Systems [5.5] 有限水平離散時間ポントリャーギン境界値系の水平一様局所分岐について検討する。
我々は、スケールした安定な不安定な境界性から逆制御を検証し、関連する終端補正グリーン推定を証明し、重み付き収縮と組み合わせて存在を得る。
数値的なセクションは、証明書と水平一様一階展開を記述する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:27:15 GMT)
Unlocking LLM Code Correction with Iterative Feedback Loops [5.5] 本研究では、コード障害の評価、修正パターンの分析、推論と非推論モデルの有効性の比較を行うメトリクスを紹介する。
その結果、推論モデルは反復よりも一貫して改善され、フィードバックを活用する際に非推論モデルよりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:47:42 GMT)
Can LLMs Be CEOs? Benchmarking Strategic Resource Reallocation with Multi-Role Agent Simulation [5.5] 大規模言語モデル(LLM)の意思決定能力を評価することが研究の優先事項となっている。
我々は、CEOレベルの戦略的リソース再配置に基づいてLCMを評価するベンチマークであるtextsc CEO-Benchを紹介する。
13のシナリオにおける5つのフロンティアモデルに対する実験により、全てのモデルが高い構造的妥当性を達成するが、戦略的なキャリブレーションにおいて急変することが明らかになった。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:20:04 GMT)
Engagement Intensity as a Learner-Modeling Signal for Adaptive AI Ethics Instruction [5.4] 我々は,候補摂取の特徴,自己申告利用頻度,自己評価LDM親しみ,事前AI教育を比較した。
スケールの下端のしきい値のようなパターンは、トレーニングの興味と精度の信頼のために最もよく見える。
これらの結果から,簡易な事前指導行動信号は,適応型AI倫理教育のための軽量な摂取プロファイリングに影響を及ぼす可能性が示唆された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 23:55:51 GMT)
A fairness-aware extension of Stochastic Multicriteria Acceptability Analysis for ranking [5.3] 本稿では、ランキング問題に対するSMAAの公平性を考慮した拡張であるSMAA-Fairを提案する。
フレームワークはアグリゲーションモデルとは独立しており、さまざまなフェアネスメトリクスを組み込むことができる。
合成および実データを用いた数値実験により、SMAA-Fairは好適なランク位置における保護されたグループの表現を改善することが示された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:21:28 GMT)
Graph Neural Networks for Semi-Supervised Image Classification with Multi-Feature Aggregation [5.3] グラフニューラルネットワーク(GNN)は、半教師付き画像分類のための強力で広く採用されているアプローチである。
本研究では,多種多様な特徴集合とグラフ表現を統合することで,ラベル付きデータが不足するシナリオにおけるGNNの新たなアプローチを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:41:07 GMT)
CaVe-VLM-CoT: An Interpretable Vision-Language Model Framework [5.3] CaVe-VLM-CoTはモジュールリフレクションベースのエージェントRAGフレームワークである。
5段のクローズド・ループ・パイプラインを通したエビデンス・グラウンドの推論を強制する。
精度は87.1%、ScienceQAのCaVeScoreは56.6%である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:28:47 GMT)
Multi-Adapter PPO: A Cross-Attention Enhanced Wavelength Selection Framework for LIBS Quantitative Analysis [5.2] 本稿では、波長選択を強化学習問題に変換する新しいマルチアダプタPPOフレームワークを提案する。
当社の手法は従来の粒子群最適化(PSO)を平均28.4%の総合スコアと45.2%の予測精度で上回っている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:38:59 GMT)
Catastrophic Forgetting is Low-Rank: A Function-Space Theory for Continual Adaptation [5.2] 新しいタスクトレーニングは、クロスタスクカーネルを通して古いタスク予測ドリフトを誘導する。
トレーニング可能なパラメータにおいてモデルが線形であるフリーズバックボーンリニアヘッドPEFT-CLでは、予測器は正確に数値的精度である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:03:37 GMT)
Feynman Kac Reweighted Schrödinger Bridge Matching for Surface-Based Tau PET Harmonization [5.2] ハーモナイズ法は、生物学的に有意なシグナルを保持しながら、部位によって引き起こされるシフトを取り除くことを目的としている。
本稿では,Feynman Kac Reweighted Schrodinger Bridge Matchingモデルを提案する。
本研究では,HABS-ADNIコホートからのPI-2620データをAV-1451ドメインに調和させることにより,SUVRマップ上での手法を評価する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:06:36 GMT)
Brick-DICL: Dynamic In-Context Learning for Automated Brick Schema Classification [5.1] 本稿では,Brickスキーマの自動分類のための2段階動的インコンテキスト学習フレームワークであるBrick-DICLを提案する。
Brick-DICLは2つの主要なコンポーネントで構成されている。メタデータ-RAGは関連する例を検索し、クラス-RAGは潜在的なBrickクラスを絞り込む。
大規模な実験では、Brick-DICLがさまざまなビルディングデータセットにまたがって有効であることを実証している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:46:51 GMT)
Finite-Time Queue Peak Laws in Stochastic Networks: Logarithmic Scaling After Geometric Thresholds [5.1] 一般化スイッチにおける有限水平キューピークについて検討する。
ドリフト最小化スケジューリングポリシにおいて,スラックは有限時間ピーク法則に反することを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:47:47 GMT)
A Machine-Learned Comorbidity Index [5.1] 我々は、正規化されたヒルベルト・シュミット独立基準(nHSIC)を最大化することにより、診断コードを単一のスカラーにマッピングするMLCI(Machine-Learned Comorbidity Index)を提案する。
MLCIは非線形なリスクアウトカム依存を捉え、統一された情報レベルの注文が結果全体にわたって達成できる場合に特徴付ける理論によって支持される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:07:20 GMT)
Infant Spontaneous Movement Noise Improves Exploration in Deep RL [4.9] 乳児の自然運動に触発された行動雑音が深部RLの探索を改善するか否かを検討した。
本稿では,RL訓練中の探査騒音の時間的自己相関を徐々に高めるメカニズムを提案する。
以上の結果から,ヒトの運動・認知発達は,人工エージェントの学習機構設計に有用であることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:50:13 GMT)
Monotonic Kolmogorov-Arnold Networks: A Theoretical and Empirical Study of Monotonicity as an Inductive Bias [4.9] モノトニック性は、ニューラルネットワークの長年にわたるアーキテクチャ上の帰納バイアスである。
センホールパラメータ値に対するハードモノトニック性を保証するカンであるbfMKANを提案する。
MKANはSMM/I-2024ベンチマークで最先端のモノトーンNNと競合する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:06:22 GMT)
Quantum Routers: A Switching-Fabric Framework for Quantum-Native Forwarding [4.9] 量子ルータの多部絡み合いに基づくスイッチングファブリックフレームワークを提案する。
ブロッキングとノンブロッキング操作という古典的な概念を、絡み合いに基づく織物の構造条件に変換する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:46:51 GMT)
Beyond Native Success: Auditing Deployment-Interface Exposure of CLIP Backdoors [4.9] DIFEは、デプロイインターフェース間でバックドアのCLIPチェックポイントを監査するフレームワークである。
BadTextTowerは、ビジュアルのみの再利用をほとんどクリーンにしながら、強力なテキスト条件付き検索、再ランク付け、選択露出を生成する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:41:53 GMT)
CDER-SME: A Cross-Device Event-RGB Micro-Expression Dataset under Multi-Level Stress Induction [4.9] CDER-SMEは、多レベルストレス誘導フレームワークで収集されたクロスデバイスイベント-RGBデータセットである。
時間同期とランドマーク誘導空間登録のためのハードウェアに依存しないアライメントパイプラインを提供する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:07:27 GMT)
Frequency upconversion of infrared signals via molecular cavity optomechanical systems with gain [4.9] 本研究では、2つの空洞と1つのN分子のアンサンブルからなる分子空洞光学系の赤外線キャビティにゲインを組み込む手法を提案する。
特定の振動モードに付随する赤外吸収とラマン散乱に依存するアップコンバージョンプロセスは、赤みがかった条件下での利得の取り込みによって著しく増幅される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:50:13 GMT)
WireCraft: A Simulation Benchmark for Industrial DLO Manipulation [4.8] 我々は,産業用DLO操作の困難さと資産を考慮したシミュレーションベンチマークであるWireCraftを紹介する。
2つの相補的なDLO物理モデルをサポートし、調音および変形可能であり、軌道はシミュレーションと物理UR5の両方から得られる。
我々は、共有メトリクスに基づく強化学習(RL)、模倣学習(IL)、視覚言語行動(VLA)ポリシーをベンチマークする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:59:46 GMT)
Impact of Hand Impairment and Occlusions on Hand Pose Estimation Accuracy in Augmented Reality Applications [4.7] 混合現実のアプリケーションは、手作業のリハビリのために設計することができる。
本研究ではHoloLens 2 HMDのポーズ推定精度と最先端ポーズ推定アルゴリズムについて検討した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:20:30 GMT)
An effective field theory approach to the sign problem in BFSS [4.6] 符号問題は、フェルミオンで量子理論をシミュレートする悪名高い障害である。
本稿では,手話問題の解析に有効な場の理論手法を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:38:27 GMT)
Scalable and Interpretable Representation Alignment with Ordinal Similarity [4.6] 我々は、Triplet (TSI) と Quadruplet (QSI) の類似度指標によってインスタンス化された順序相似性フレームワークを開発する。
この定式化は本質的に解釈可能であり、外れ値に対して頑健であり、計算効率が良いことを実証する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:16:11 GMT)
DynFS-MoE: Dynamic Functional-Structural Mixture-of-Experts for Post-Traumatic Epilepsy Diagnosis [4.5] 外傷後てんかん(PTE)は外傷性脳損傷(TBI)の重篤な合併症である
MoEフレームワークは、機能的構造的エンコーディングとクラス構造的エキスパートルーティングを通じて機能的および構造的MRIを統合する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:02:53 GMT)
TIGER: Inverting Transformer Gradients via Embedding-Subspace Distance Optimization [4.5] フェデレートラーニングにより、複数のクライアントが、生の入力をローカルに保ちながら、中央サーバに更新を送信することで、共有モデルを共同でトレーニングすることができる。
事前の勾配反転攻撃は、これらの更新がクライアント入力を再構築するのに十分な情報を明らかにすることを示している。
我々は、この部分空間信号を微分可能な目的に変換する連続的な勾配反転攻撃であるTIGERを導入する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:24:40 GMT)
Vision-language models for chest radiography do not always need the image [4.4] 医用視覚言語モデルは、強い胸部X線撮影精度を報告し、これが画像を使用する証拠としてますます読まれている。
我々は,画像に介入し,関連領域を除外し,関連のない領域を除外し,別の患者の同一ラベルスキャンに切り替える因果監査を導入する。
9つのシステムで、画像アクセスのないテキストのみのモデルは、最高のマルチモーダルの5.7の精度ポイントに到達する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:22:10 GMT)
EComAgentBench: Benchmarking Shopping Agents on Long-Horizon Tasks with Distributed Hidden Intent [4.3] EComAgentBenchは、実際のAmazon製品とレビューに根ざした62のタスクのベンチマークである。
各タスクは、要求を可視クエリ、ツールゲートプロファイル、スクリプトによる明確化に分散する。
typed, source-tagged rubricsは、各タスクをグレードし、各障害を要件とそのソースに原因付ける。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:10:48 GMT)
NarrativeWorldBench: A Frontier-Saturated Benchmark and a Latent World Model for Long-Horizon Co-Creative Audio Drama [4.2] 古典的、微調整、オープンフロンティア、クローズドフロンティア、推論階層にまたがる21のモデルをベンチマークします。
N-VSSM はプロットビート F1 >= 0.84 であり、全ての地平線を4倍低い計算で保持する。
学習された文化伝達関数は、言語間の忠実度を +0.20 から +0.23 に引き上げる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:04:55 GMT)
AI Adoption Across a Multinational Workforce: Sociotechnical Conditions for GenAI Acceptance in Human Resources [4.2] 採用は、GenAIシステムの設計前提と従業員の業務配置の適合性に依存していることを示す。
組織は、異なる社会集団にもたらす役割や文脈に敏感な利益を考慮してシステムを設計すべきである、と我々は主張する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:08:27 GMT)
Visual Retrieval-Augmented Generation for Silhouette-Guided Animal Art [4.2] 本稿では,自然のシルエットから動物芸術を直接生成するVisual Retrieval-Augmented Generation (Visual-RAG)を紹介する。
本手法は,28,586個の高品質シルエットの硬化体から構造的に類似した動物形状を回収する。
結果は、Visual-RAGがもっともらしい解釈を提供する一方で、高い知覚的影響を達成する上での課題が残っていることを示している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:24:21 GMT)
Multiple cyclicity and Wavelet Decomposition with Channel Correlation for Long-term Time Series Forecasting [4.1] 我々は,周期性,傾向,チャネル間相関を別々にモデル化した長期時系列予測モデルであるMcWCを提案する。
6つの実世界のデータセットの実験は、McWCが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:44:23 GMT)
Fine-tuning LLMs for Passive Depression Severity Estimation from AI Mental Health Dialogue [4.1] うつ病は世界の障害の主要な原因であり、症状の早期発見は時間的介入に不可欠である。
我々は、ユーザーが自己申告措置を完了することなく、AIメンタルヘルスプラットフォームにおける受動的かつ継続的な症状モニタリングを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:28:47 GMT)
Beyond IGO-Flow: Toward Convergence Analysis of IGO in Continuous Spaces [4.0] 情報幾何学最適化はブラックボックス最適化のための統一されたフレームワークを提供する。
その概念的重要性にもかかわらず、IGOの収束理論は限定的である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:03:09 GMT)
Piezoelectric resonators in thin-film barium titanate from room temperature to millikelvin [4.0] チタン酸バリウム(BTO)は、強い圧電応答と電気光学応答を組み合わせた顕著な例である。
薄膜BTO上で表面音響波(SAW)共振器を作製・特性評価する。
圧電応答は、超伝導量子回路における圧電カップリングに対するBTOの可能性を示すd33eff 19 pC/Nで持続する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:37:11 GMT)
Coherent Control of an Embedded Bound State Without a Spectral Gap [4.0] 連続体(BIC)における境界状態は、従来の空洞やバンドギャップのない開放系において励起フォトニクスを閉じ込めることができる。
入射光子に対して暗く、周囲の連続体からのスペクトルギャップ保護を欠いている。
2つの時間的制御ノブを用いた1次元導波路に結合した巨大原子の2つの制限を克服する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:50:54 GMT)
Split-Head Quantum Generative Adversarial Network for Crystalline Material Discovery [3.9] 連続した3次元空間のための量子GANは、短期ハードウェアの限られた容量によって妨げられる。
物理インフォームドされた「スプリットヘッド」アーキテクチャを量子トランクから直接適用し、微視的な原子座標からマクロ的な格子境界を明示的に分離する。
我々は,アーキテクチャに適合した古典的アブレーションモデルに対して,分割型量子生成共振器ネットワークの評価を行った。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:25:21 GMT)
Talking to Your Data: Exploring Embodied Conversation as an Interface for Personal Health Reflection [3.9] ウェアラブルデータの軽量な前処理とUnityベースのエンボディ文字を組み合わせたシステムを提案する。
本研究では,本手法をオブジェクト内設計を用いたシミュレーション・セルフ・ユーザ・スタディにより評価する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:34:27 GMT)
Dimensionality Controls When Modularity Helps in Continual Learning [3.8] モジュラーアーキテクチャ,タスク類似性,表現的次元が構成連続学習をどのように形作るかを検討する。
高次元の「怠け者」体制では、両方のアーキテクチャは同様の性能と内部幾何学を達成する。
低次元の「豊かな」体制では、モジュラリティは決定的になる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:10:21 GMT)
Edit3DGS: Unified Framework for Dynamic Head Editing via 2D Instruction-Guided Diffusion and 3D Gaussian Splatting [3.8] 動的3Dヘッド編集のための統合フレームワークEdit3DGSを提案する。
本手法は,画像領域における意味制御性と,時間的に整合した3次元表現とを結合する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:26:20 GMT)
CIAN: Multi-Stage Framework for Event-Enriched Image Captioning via Retrieval-Augmented Generation [3.8] イベントリッチイメージキャプションは、可視コンテンツだけでなく、イベントのより広いコンテキストも記述している。
本研究では,外部の物語でキャプションを豊かにする多段階フレームワークであるContextual Image-Article Narrator (CIAN)を提案する。
CIANは、SigLIPを使用して関連する記事を取得し、それを要約して、LoRAファインチューニングされたQwenモデルでナラティブジェネレーションステージをガイドし、FluencyとCoherenceにN-GramベースのRefinementを適用する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:24:08 GMT)
Evaluating Open-Source LLMs for Multi-Label ATT&CK Technique Classification on CTI Reports [3.7] 敵戦術、技術、共通知識(ATT&CK)を用いたサイバー脅威インテリジェンス(CTI)の分類は、積極的な防御には不可欠であるが、歴史的には広範囲な人的努力を必要としている。
LLM(Pre-Large Language Model)の自動化は、このプロセスを加速させたが、構造化されていないCTIレポートに見られる複雑な言語と多段階の攻撃パターンを解決できなかった。
LLMは、文脈推論を用いて非構造化テキストを理解することで、以前の制限に対処した。
現在の評価は、実世界のCTIレポートの複雑さを無視する単純化された単一技術文に依存しており、その結果は膨らんだ結果をもたらすことが多い。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:04:15 GMT)
Empowering Economic Simulation Through Situation-Aware Llm-Driven Generative System [3.7] エージェント・ベース・モデリング(ABM)は、マクロ経済現象を生成するためにマイクロレベルのダイナミクスを取り入れたBOTTOM-UPソリューションを採用している。
本研究では, LLM や経済軌道に埋め込まれたマクロ経済理解の豊かな個々のエージェントをモデル化するSAMASを提案する。
マクロレベルの構造パターンとマイクロレベルの動的挙動の両方を共同でモデル化することにより、SAMASはボラティリティリアリズムとターンポイント予測において優れた性能を達成する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:24:32 GMT)
Redact or Keep? A Fully Local AI Cascade for Educational Dialogue De-Identification [3.6] 既存のアプローチは、ガバナンスと正確さのトレードオフを強要します。
オープンエンドのエンティティ認識から制約付きプライバシトリアージへの脱識別を再構築する,完全ローカルなカスケードフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:18:58 GMT)
When Web Agents Finish but Still Fail: Reproducible Triggers and Trace Diagnostics for Parallel Web Exploration [3.5] ロングホライゾンウェブエージェントは、最終回答評価によって隠された方法で失敗することが多い。
並列Web探索ベンチマークであるParallel WebBenchを用いて,これらの障害について検討した。
我々は, GRPOを用いたWebExplorerスタイルのエージェントを, 人間のみ, バランスの取れたヒト-合成, 合成-重量のデータ混合下で訓練する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 23:00:25 GMT)
When to Write and When to Suppress: Route-Specialized Dual Adapters for Memory-Assisted Knowledge Editing [3.5] 本稿では,メモリ支援環境において,参照時に編集メモリが検索され,パラメータ効率のよいアダプタがモデルのオブジェクトの嗜好を補正する機能について検討する。
本稿では、ルート特化デュアルアダプタエディタであるメソッドを導入する。関連ルータは、まず、プロンプトが編集メモリを受け取るかどうかを判断する。ルータドプロンプトは、元のオブジェクトよりも新しいオブジェクトを好むように訓練された編集アダプタを使用する。
我々は,同じメモリプロトコルと2つの7B/8Bで,1000ケースプロトコルであるcf,zsre,mquakeの評価を行った。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:27:39 GMT)
PearlVLA: Progressive Embodied Action-Plan Refinement in Latent Space [3.5] 本稿では,視覚言語モデル(VLM)の潜在空間に議論を移すフレームワークであるPearlVLAを提案する。
future-guided RefineNetは、粗いセマンティックドラフトを細かな潜在アクションプランに段階的に洗練するために、定期的な更新を適用する。
PearlVLAは、既存のメソッド間で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:38:03 GMT)
Theoretical Grounding of Out-Of-Distribution Detection With Reinforcement Learning Optimizer [3.4] 動的なオープンワールド環境でのアウト・オブ・ディストリビューション(OOD)検出は、進化するデータ分布に継続的に適応するモデルを必要とする。
既存のOOD検出手法の多くは、現在の目標のみを最適化し、デプロイ後の環境変化が将来のOOD行動にどのように影響するかを明示的に説明していない。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:40:03 GMT)
Want Better Synthetic Data? Steer It: Activation Steering for Low-Resource Language Generation [3.4] 現在の最高のパフォーマンスのアプローチは、典型的には、ターゲット言語の例を使って、数発のプロンプトに頼っている。
本研究では,言語の言語的アイデンティティを目標とする言語ステアリングと,人間の書き起こしたテキスト表現と裏書きしたテキスト表現とを対比して,良質な表現を捉える品質ステアリングという2つのステアリング戦略について検討する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:34:21 GMT)
Embodiment Shapes Rolling Behavior in a Multimodal Infant Model [3.4] ローリングオーバーは幼児の運動発達における最初期のマイルストーンの1つである。
前庭感覚と前庭感覚を備えた仮想乳幼児エンボディメントMIMOを用いた乳幼児転がりの計算的研究を行った。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:18:45 GMT)
Conservation Laws for Modern Neural Architectures [3.3] 本研究は,GELU,SiLU,SwiGLUによるフィードフォワードネットワーク,正弦波および回転位置符号化によるマルチヘッドアテンション,多様なゲーティング設計によるMixture-of-Expertsアーキテクチャなど,現代モデルの保全法則を特徴付ける統一的な枠組みを開発する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:44:53 GMT)
Verifying the Rust Standard Library [3.3] Rustの型システムは、多くのメモリエラーのクラスを防ぐが、標準ライブラリは安全でないコードに大きく依存している。
これは、補完的な検証ツールをRust標準ライブラリからフォークされた検証リポジトリの継続的統合に統合する、オープンでクラウドソースされた取り組みです。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 00:11:04 GMT)
No-Free-Fairness: Fundamental Limits and Trade-offs in Learning Systems [3.2] タスクがサブグループで既約コストを示す場合、決定ルールは、全体的なパフォーマンスを不一致でトレードオフしなければならないことを示す。
完全公正かつ正確な解が存在する理想的、ノイズフリーな設定においても、有限サンプル学習だけでは非自明な部分群格差を生じさせることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:37:52 GMT)
S4oP: Operator-level Pruning of Structured State Space Models for Resource-Constrained Devices [3.2] 本稿では,S4DモデルとS4Dモデルに対して,新たなインクリメンタルな演算子レベルのプルーニング手法を提案する。
本手法は、構造化マスキングと微調整を交互に行うことにより、モデル演算子を段階的にプーンする。
実験により、モデル演算子の70%までを刈り取ると、ほとんどの場合、元のモデルの性能が保たれることが示された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:59:10 GMT)
Beyond Citations: Comparing Scholarly, Policy, and Patent Impact Across the FT50 Journals [3.2] フィナンシャル・タイムズ50(FT50)は、世界中のビジネススクールにおける雇用、昇進、認定、研究評価をまとめた雑誌である。
しかし、リスト上のジャーナルは、通常、同質の卓越層を表すかのように扱われる。
我々は、53のFT50と、最近3つの異なるインパクトチャネルでジャーナルを削除した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:17:07 GMT)
Deep Reinforcement Learning for Minimum Zero-Forcing Sets [3.2] 最小ゼロ強制セット問題は、ノードの初期セットの色がネットワーク全体に伝播するグラフカラー化問題である。
最小零強制集合を見つけることはNPハードであることが示される。
本稿では,S2V-DQNアーキテクチャを学習問題に適用する強化学習フレームワークSD-ZFSを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:07:20 GMT)
Enhanced Graph Neural Networks using K-Hop Gaussian Diffusion [3.0] 多くの実世界のグラフでは、エッジは騒々しいか、あるいは未定義であり、情報伝達を局所的に制限する。
グラフデータの事前処理モジュールとしてK-Hop Gaussian(KHG)拡散カーネルを提案する。
複数のベンチマークデータセットの実験では、KHGが従来のメッセージパッシングGNNを大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:33:17 GMT)
RSRank: Learning Relevance from Representational Shifts [3.0] 関連度スコアの校正を行うため,予測RSを学習する軽量なトレーニングフレームワークを導入する。
トレーニングの目的は、無関係なコンテンツをゼロしきい値で自然にフィルタリングし、依存調整を減らすことである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:29:23 GMT)
When LLMs Analyze Scars: From Images to Clinically-Meaningful Features [3.0] 本稿では,大規模言語モデル(LLM)を知識駆動型機能エンジニアとして再配置する新しいパラダイムを提案する。
我々の重要な洞察は、LLMは、実行可能な特徴抽出コードとして外部化できる豊富な医療知識をエンコードしているということです。
提案手法は,(1)データ効率,限られたトレーニングサンプルによる堅牢なパフォーマンスの実現,(2)生画像が外部のLCMに晒されることなく局所的に処理されるプライバシー保護,(3)臨床理由に基づく明示的な特徴による解釈可能性,の3つの利点を提供する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:38:06 GMT)
ReRAM-aware Model Finetuning addressing I-V Non-linearity and Retention Errors [2.9] ReRAMアレイを用いたインメモリコンピューティング(IMC)は、高密度でエネルギー効率の良い代替手段を提供する。
既存のハードウェア対応のトレーニングフレームワークは、しばしばスクラッチからのトレーニングを必要とし、現代の大規模モデルでは計算が禁止されている。
トレーニングオーバーヘッドを最小限に抑えつつ,ReRAM上にロバストな展開を可能にする,ファインタニングベースのハードウェア・アウェア・トレーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:29:51 GMT)
Noncyclic geometric phase in three-level Ramsey interferometry for enhanced metrology [2.9] 本稿では,非循環幾何学的位相応答を利用して位相センシングを強化する3レベルラムゼー干渉法を提案する。
我々は、付随するゲイン可視トレードオフを定量化し、増幅された応答が純信号対雑音比ゲインをもたらす有限動作ウィンドウを特定する。
より広範に、これらの結果は量子プラットフォームにおける位相感度を高めるための多レベルラムゼー経路を確立する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:48:45 GMT)
How Inference Compute Shapes Frontier LLM Evaluation [2.8] 私たちは、ソフトウェアエンジニアリング、数学、医学、サイバーセキュリティにまたがる7つの挑戦的なベンチマークで、最大12のフロンティア言語モデルを評価します。
より新しいモデルは大きな予算でより高いパフォーマンスに到達し、より難しいタスクを解き、より確実に解決する。
評価は推論時間計算の関数として機能を報告し、プロトコルの選択を明示的に指定し、大きな共有計算範囲でモデル生成を比較するべきであると論じる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:40:53 GMT)
Gatling: Rapid-Fire Consensus from Parallel Composition [2.8] 我々は、回転するリーダスケジュールの下で、任意にプロモーサル間時間を実現する原子放送プロトコルであるGatlingを紹介する。
我々は、クラッシュしたリーダによるヘッド・オブ・ライン・ブロッキングの影響を分析し、Gatlingの最適な並列インスタンス数を導出する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:48:47 GMT)
Conformal Prediction for Dyadic Regression Under Complex Missingness [2.8] 本研究では,複雑な欠落機構の下での動的回帰問題における共形予測の枠組みを開発する。
連続応答と離散応答の両方に対して条件付き妥当性を示す。
これは、不足非ランダムな仮定の下での重み付き共形予測に対する条件付き妥当性の最初の公式な証明である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 21:21:28 GMT)
QueryMarket: Cost-Aware Online Active Learning in Data Markets [2.7] 我々は,データ価格と情報駆動選択を統合したOVBAL(オンライン分散に基づくアクティブラーニング)を提案する。
OVBALは、非定常ストリームと不均一なラベルコストに適応する、単純で完全なオンライン決定ルールを提供する。
合成データと実世界の太陽光発電予測タスクの実験は、OVBALが特に売り手中心の価格で有効であることを示している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:28:07 GMT)
FacProcessTwin: An LLM-Based System for Process Twin Development [2.7] プロセスツインは、プロダクションプロセス全体のリアルタイム表現を提供する。
本稿では,工場のプロセスドキュメンテーションとオペレーターからの自然言語入力からプロセスツインを構築するシステムであるFacProcessTwinを紹介する。
FacProcessTwinをオーストラリアの食品製造業者の実例で評価した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:27:43 GMT)
Treatment Response Optimized Clinical Decision Support AI System via Digital Twin Simulation [2.7] 本稿では,治療効果(TE)推定と臨床効果の定量化を統合したオンライン適応フレームワーク,治療軌跡をシミュレートする患者用Digital Twin(DT),シーケンシャルな意思決定のための強化学習(RL)を提案する。
The Cancer Genome Atlas (TCGA) の合成臨床シミュレータと実世界の卵巣癌データセットを用いて,本フレームワークの有効性を検証した。
本手法は, シミュレーションと臨床の両方において, 標準的な計算基準に比べて, 治療を推奨する上で, 優れた効果と安定性を示した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:39:55 GMT)
Evaluation of Medical Vision Language Models HuluMed and MedGemma, and general purpose chatbots Gemma 3, ChatGPT Plus, and Claude Pro on real previously unseen wound images [2.6] 本研究は, 臨床創傷評価のための, 汎用および医療専門のオープンソースおよびプロプライエタリなVision-Language Models (VLMs) の性能評価である。
ChatGPTは174/240の正解(72.50%)と149/240のクロード(62.08%)で最高パフォーマンスを達成した。
以上の結果から,現在,フロンティア汎用マルチモーダルシステムは医療用代替品よりも創傷解析性能が著しく高いことが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:33:14 GMT)
Self-Efficacy and Favorability Shape Learning from Tutoring Systems and Paper Practice [2.5] 自己効力感や実践に対する学生の好意感などの動機づけ要因は、学習を形作る上で重要な役割を担っている。
本稿では,紙ベースとシステムベースの授業実践という2つの一般的な実践形式における学習結果に対する自己効力感と好意性の影響について検討する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:29:49 GMT)
Modeling Doppler Shifts in Radial-Velocity Data with Deep Learning toward Earth-mass Exoplanet Detection [2.5] 我々は,地球質量惑星の放射速度データによる検出性を向上し,実際の可視スペクトルに一般化する枠組みを開発する。
我々は、HARPS-N太陽スペクトルに惑星シグナルを注入して人工ニューラルネットワークを訓練する。
我々の最も正確なニューラルネットワークモデルは、惑星信号の振幅、位相、軌道周期を確実に回収する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:16:16 GMT)
When Robots Sleep: Offline Skill Consolidation for Shared-Policy Robot Learning [2.5] 本研究では,従来の軌道やタスクの損失が不可能なロボットスキル学習について検討する。
本研究では、覚醒時に新しいスキルを学習し、睡眠中の共有ポリシーをオフラインで統合する、覚醒支援フレームワークであるSleeping Robotsを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:03:50 GMT)
Reconfigurable Computing Challenge: Transformer for Jet Tagging on Versal AI Engines [2.4] トランスフォーマーベースのモデルは、CERN LHCでジェットタグの強力な性能を達成する。
本稿では,AMD Versal AI Engine上でのジェットタグ付けのための量子化整数のみ変換器の初期実装について述べる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:22:06 GMT)
Learn to Quantify Social Interaction with Constraints for Pedestrian Walking [2.4] 歩行者歩行における社会的相互作用は直感的に巨大であり、ラベル付けや定量化が難しい。
本稿では,歩行者が他者とどのように相互作用するかを定量化し,解釈するために,ラーニング・トゥ・クラスタを提案する。
本手法は,社会的相互作用のパターンを学習し,歩行者軌道予測に効果的に統合することができる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:18:22 GMT)
CloakLM: Obfuscating GPU Memory Layout to Mitigate Model Ex-filtration for Serving [2.4] サードパーティと共有アクセラレータインフラストラクチャにデプロイされた大規模な基盤モデルは、モデル流出の実用的なリスクに直面します。
コテナントワークロードは、物理的なコロケーションなしで、メモリマップされたインターフェースやRDMAリージョンにさらにアクセスすることができる。
ソフトウェアのみのメモリ難読化フレームワークであるClarkLMは、推論スタックのメモリ論理ビューを変更することなく、この規則性を除去する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:47:47 GMT)
Beyond Failure Recovery: An Engagement-Aware Human-in-the-loop Framework for Robotic Systems [2.4] 多くの人間中心のロボティクス設定では、インタラクションはユーザーを意思決定に巻き込むことによってエンゲージメントをサポートするべきである。
身体的な介護において、移動能力の制限は、瞬間にロボットの動作を介入または調整する能力を減らすことができる。
本稿では,作業負荷の制約を尊重しながら,エンゲージメントを意識したMPC(E-MPC)を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:21:43 GMT)
MASCOT-Android: A Curated Dataset and Automated Collection Pipeline for Android Malware Source Code Specimens [2.4] MASCOT-Androidは、Androidのマルウェアソースコードのキュレートされたデータセットであり、GitHub上でスケーラブルなマルウェアソースコードを見つけるための自動収集フレームワークである。
本モデルでは,8,772のマルウェアと25,747の良質な文書から文字レベルのTF-IDF機能を抽出し,マルウェアリポジトリを識別するためにLinearSVCを訓練する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:25:50 GMT)
Learning Arbitrary Lindbladians with Quantum Error Correction [2.3] 本研究では、ハミルトニアン構造や散逸子構造を事前に知ることなく、オープン量子系の生成体を再構築する問題を考察する。
任意のスパルスリンドブラディアンを学習するための最初の標準量子制限アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:19:43 GMT)
Beyond AHI: An Interpretable Causal-Discovery-Guided Framework for Sleep Recovery in Connected Health [2.2] マルチモーダルポリソノグラフィーから階層型睡眠回復スコア(SRS)を導出するための因果探索誘導フレームワークを提案する。
2つの大集団コホートを用いて,呼吸負荷,低酸素負荷,睡眠断片化,睡眠構造,自律神経調節を対象とする非循環グラフ(DAG)学習を適用した。
これらのドメインは、ウェアラブルECG、オキシメトリ、睡眠ステージ推定デバイスなど、コネクテッドヘルス技術で利用されつつあるセンサストリームに自然にマッピングされる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 21:38:40 GMT)
Human-in-the-Loop Atlas-Based 3D Asset Segmentation for Interactive Content Workflows [2.2] 本稿では,インタラクティブメディア,ゲーム,XRコンテンツのための3次元モデルから,セグメンテーションされた2次元パラメータ化アトラスを生成するパイプラインを提案する。
このアプローチは、様々なジオメトリにまたがって使用可能なセグメント化されたアトラスを生成すると同時に、手動修正の繰り返し発生源を明らかにすることができる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:51:58 GMT)
Adv-TGD: Adversarial Text-Guided Diffusion for Face Recognition Impersonation Attacks [2.1] 本稿では,ジェネレーティブ・アタック・フレームワークであるAdv-TGDを提案する。
ターゲットのアイデンティティを偽装し、顔認識システムを欺くことができる光現実的な顔を合成する。
Adv-TGDは、IR152、IRSE50、MobileFace、FaceNetで平均攻撃成功率(ASR)が85.90%に達する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 23:04:52 GMT)
Shrinkage priors for Bayesian Substitute Confounders [2.1] 粗大な多因性依存の減少を先行的に維持するスパース代行者の学習フレームワークを開発する。
提案した回帰調整型推定器は、対応する潜在変数同定仮定が成立すると、平均ポテンシャル結果に一貫性がある。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 23:03:42 GMT)
ScratchLens: Lens-Parametric Behavioral Equivalence for Scratch Programs [2.1] ScratchLensは因果発散現象と観察レンズの分類によって行動等価性を明示する。
Scratchプロジェクトは、型付きリソースとセマンティックトランザクションの因果IRにコンパイルし、リネーム、ガード、プロシージャボディを標準化し、Mazurkiewiczと同一のトリガーを通常のフォームに割り当てる。
ScratchLensは、実際のScratchプロジェクトのVM知能突然変異コーパス上で、検証済みのすべてのペアを決定し、目撃された異なるペアに対して0/158の偽等価なクレームを生成する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:56:17 GMT)
Average entropy of Bogoliubov-Kubo-Mori random state ensemble [2.0] 我々は、フォン・ノイマンエントロピーからボゴリューボフ-クボ-モリ計量を通じて誘導される最近提案されたランダム状態アンサンブルについて研究する。
特に、BKMアンサンブルに対する平均エンタングルメントエントロピーの正確な式を導出する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:11:03 GMT)
Damage Adaptation in Seconds for Architected Materials [2.0] 本研究では, 軟弱作動系の破滅的な損傷を1分以内で処理する。
建築材料は適応性に優れており、アクチュエータの故障は急速ではなく徐々に起こる。
我々のアルゴリズムは、カット、バーン、アクチュエータの修理に適応することができ、シミュレーションのないリアルタイム適応を可能にします。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:11:34 GMT)
Helical Dirac Current with Local Coupling to a Chiral Potential [2.0] 筒状閉じ込めにおける正確なディラック固有状態は、一定のヘリカル保存電流テクスチャを有することを示す。
最低限の閉じ込めモードでは、ディラック電流は、長手輸送とともに、消滅しないアジムタール成分を含む。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:24:37 GMT)
LLM Parameters for Math Across Languages: Shared or Separate? [2.0] 大規模言語モデル(LLM)における数学的推論の言語間機械的解析について述べる。
英語は数学関連パラメータの最大集合を一貫して生成しているのに対し、低リソース言語は関連するパラメータのより小さい集合を明らかにしている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:02:42 GMT)
Data augmented bootstrap: Unifying confidence interval construction by approximate invariance [1.9] ほぼ不変なデータ変換から信頼区間を構築するためのフレームワークであるデータ拡張ブートストラップ(DAB)を提案する。
特にDABは、最大平均離散 U-統計量に対する共形予測や自然普遍性など、正確な群対称性に依存する一般的な手法を復元する。
画像,言語,科学データだけでなく,ブートストラップ,ワイルドブートストラップ,共形予測にDAを組み込むことの性能を実証的に検証した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:54:58 GMT)
Impulse Decoding of Quantum LDPC Codes: Equivalence of Degeneracy and Code-Shortening [1.9] 縮退は線形ブロック符号の短縮という古典的操作と密接に関連していることを示す。
インパルス復号と呼ばれる量子低密度パリティチェック符号の並列復号方式を提案する。
次に,残差の復号化に基づく別のアルゴリズムを提案し,インパルス復号と組み合わせることで,回路レベルの雑音下でのさらなる性能向上を実現する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:58:26 GMT)
IsabeLLM: Automated Theorem Proving Applied to Formally Verifying Consensus [1.9] We improve on IsabeLLM, the automated proving tool in Isabelle。
Retrieval-Augmented Generation framework, Error Trace と counterexample generation を実装した。
IsabeLLMの2つのバージョンのパフォーマンスを、BitcoinのProof of Workコンセンサスの検証を完了する能力と比較する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:00:14 GMT)
PSyGenTAB: A Privacy-Preserving Framework for Synthetic Clinical Tabular Data Generation via Constrained Optimization [1.9] 人工医療データにおけるプライバシ保護と臨床ユーティリティのバランスをとるためのフレームワークであるPSyGenTABを提案する。
PSyGenTABは、臨床データユーティリティを最大化しながら、最小限のプライバシー閾値を強制する。
下流評価は、合成データに基づいてトレーニングされたモデルが、実際の患者記録でトレーニングされたモデルに匹敵するパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:14:40 GMT)
Experimental Characterization and Modeling of Measurement-Induced State-Transitions in a Fluxonium Superconducting Qubit [1.9] フル外部フラックス領域上でのフラクソニウム量子ビットにおける測定誘起状態遷移(MIST)を実験的に特徴づけた。
ある種のフラックス点において、MIST誤差はフラキソニウムのスーパーインダクタの伝送線のような配列モードを含む遷移によって支配される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:36:55 GMT)
Budget-Aware Adaptive Adversarial Patches for Black-Box Object Detection [1.9] 我々は、NESスタイルのピクセル更新と軽量なプレーサーを結合したクエリ効率、予算適応型ブラックボックスアタックを提案する。
YOLOv5、Faster R-CNN、YOLOSはCNNベースの検出器を強く抑制し、トランスベースの検出器を著しく抑制する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:38:15 GMT)
Montreal Forced Aligner and the state of speech-to-text alignment in 2026 [1.8] モントリオール・フォースド・アリグナー(モントリオール・フォースド・アリグナー、英: Montreal Forced Aligner、MFA)は、研究と産業における強制アライメントのための最も広く使われているツールである。
本報告では,MFA 3.0のバージョン1.0以降の開発状況を報告し,英語,日本語,韓国語でMFAのパフォーマンスを評価する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:18:09 GMT)
FinAcumen: Financial Multimodal Reasoning via Self-Evolving Experience Memory Harness [1.8] FinAcumenは、ツール拡張マルチモーダル推論のための選択的なエクスペリエンスメモリを中心にした、金銭的推論フレームワークである。
FinAcumenは、事前の軌跡からの財政的に根ざした推論経験を蓄積し、成功した戦略を蒸留し、失敗に起因した注意ルールを永続的なメモリバンクに蓄積する。
4つの金融マルチモーダル推論ベンチマークで、FinAcumenは凍結した8Bビジョン言語モデルを改善している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:00:30 GMT)
Fast Nonparametric Conditional Independence Testing via Two-Stage Regression [1.8] 本稿では, BLITZ (Broad-to-Local Independence Testing via residualiZation) を導入する。
BLITZは低次回帰を用いて条件集合への広いスムーズな依存を除去し、小さな非線形特徴写像を適用し、これらの特徴を浅い木回帰で残す。
この2段階の設計は,木残基が直面する有効複雑性を低減し,過度な過度な過度なオーバーフィッティングを回避しつつ,浅い木が残留条件-平均バイアスを制御できることを理論的に示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:55:00 GMT)
First Proof Second Batch [1.8] この文書には、問題、方法論、そしてテストの結果が含まれています。
我々は、ヒューマンソリューション、AI生成ソリューション、AI生成ソリューションのレフェリーレポートとログを含む補足的なドキュメントへのリンクを提供する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:21:33 GMT)
Do We Really Need Diffusion? A Fast U-Net for Paired Medical Image Translation [1.8] MRI-SFF(MRI-SFF)は、組織脂肪を定量化し、代謝性および筋骨格障害のための確立されたバイオマーカーとして機能する。
画像から画像への変換(I2I)により,広く利用可能なT2強調(T2w)MRIからSFFを推定できるかどうかを検討する。
230048対2D画像のデータセットを用いて,軽量な4レベルU-Netと最先端のDenoising Diffusion Probabilistic Model (DDPM)を比較した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:42:26 GMT)
DART: A design-aware microfluidic chip paradigm for real-time live-cell image analysis [1.8] マイクロ流体チップのためのDART(Design-Aware and Real-Time capable)パラダイムを提案する。
DARTは、すべての関心領域(RoI)のスループット非依存のローカライズと、さまざまなRoIジオメトリ間で完全に自動化された画像処理を可能にする。
我々はDARTをスイス陸軍ナイフチップを用いて検証し、1164箇所で8つの構造的に異なるRoI設計を組み合わせた。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:38:19 GMT)
Confusion-Aware Transfer Teacher Curriculum Learning Framework: Disentangling Scoring and Pacing Effects [1.8] 不正なクラスに対する信頼度と確率分布の両面を考慮した,混乱を考慮した難易度スコアの評価を行った。
混乱に敏感なカリキュラムの注文は、一貫性のあるデータ効率の恩恵をもたらし、20%のデータレギュレーションで最大8.7%のランダム注文を上回ります。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:16:46 GMT)
Optimal Probe State for Phase Estimation Under Covariant Measurement [1.7] 共変量測定による位相推定のための入力状態の最適化について検討する。
我々は、平均光子数に対するハイゼンベルクスケーリングを実証し、最適入力状態とそれに対応する最小平均コストを得る。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:06:57 GMT)
LADBench: A Benchmark for Logical Fault Detection in Images [1.7] 視覚言語モデル(VLM)は視覚的質問応答とセマンティックグラウンドティングに優れるが、自律的な論理的推論の能力はいまだ探索されていない。
既存の異常ベンチマークでは、オープンワールド展開に必要な物理的、社会的常識よりも、視覚的エラーや直接的なプロンプトが強調されている。
LAD-benchは4つの領域にまたがる論理異常を持つ1,000以上のキュレートされた合成画像のベンチマークである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:32:38 GMT)
FairTutor: Equity-Aware Pedagogical LLM Routing for Budget-Constrained AI Tutoring [1.7] プレミアムAIサービスにアクセスできる学生には、より明確な説明、パーソナライズされたガイダンス、そして無料または低価格のサービスに制限された学生よりも優れた足場を提供することができる。
本研究では,FairTutorを提案する。FairTutorは,多エージェントオーケストレーションによる費用対効果の高いAI学習を実現する。
アクセス層AI教育(AIED)アドバンテージギャップを導入し、プレミアムアクセスと予算制約付きチュータの質差を測定するとともに、数学、読み書き、科学、言語学習のベンチマークであるTutorAccessEvalを導入する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:55:22 GMT)
The Stanford EDGAR Filings Dataset: Reconstructing U.S. Corporate and Financial Disclosures into Layout-Faithful and Token-Efficient Pretraining Data [1.6] Stanford EDGAR Filingsデータセットは、SECの申請をレイアウトに忠実なMultiMarkdownに再構築したものである。
SEFDは、監査済みの財務声明、リスク開示、所有権報告書、会計ノート、および長期の事前訓練データとして利用可能な市場移動イベントの提出を行う。
我々は152Bの初期の公開スナップショットであるSEFD-v1をリリースし,550Bトークンと推定される18.5Mの大規模なアーカイブをコーパスレベルで解析した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:22:34 GMT)
C2FL: Clustered Continual Federated Learning under Spatial and Temporal Drift [1.6] 本研究では,ノードが空間クラスタリングによって学習グループに自己組織化される,完全に分散されたフェデレートラーニング(FL)手法を提案する。
本研究では,空間的変化と時間的変化を体系的に再現する合成実験について検討した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:50:20 GMT)
Understanding and Debugging Failures in N-Gram-Based Generative Retrieval [1.6] Generative Retrieval(GR)は、ますます有能な言語モデルによって動機付けられた、新たな情報検索パラダイムである。
本稿では,GR文献に基づくGR故障モードの分類について述べる。
GRのサブセットであるngramベースのメソッド、具体的にはSEALとMINDERの障害を実証的に調査する。
我々は、IRコミュニティが生成されたngramを解析し、それぞれが最終ランキングに貢献するのに役立つ新しいWebベースのツールを紹介します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:35:36 GMT)
Functional Equivalence in Attention: A Comprehensive Study with Applications to Linear Mode Connectivity [1.6] 位置符号化を用いた変換器の関数同値性について検討する。
正弦波符号化はバニラアテンションの同値構造を保ちながら、回転符号化は対称性群を著しく減少させ、表現性を高めていることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:59:00 GMT)
Quantum optimal control of steady orbits [1.5] 我々は、散逸的な量子システムを、ユーザーが特定した経路点を通過する安定した軌道へと導く制御シーケンスを見つける。
形式主義はフロケ=リンドブラッド状態工学や実効ハミルトニアン理論とは異なる。
それは、散逸した量子システムを、ユーザーが特定した経路点を通過する安定した軌道へと導く制御シーケンスを見つける。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:47:03 GMT)
Searching for Synergy in Shared Workspace Human-AI Collaboration [1.5] 我々は、AIエージェントと人間の協力者が最終回答を提出する前に責任を調整しなければならない、共有ワークスペースの人間-AIチームについて研究する。
シミュレーションされた人間協調体を追加すると、性能が向上し、プロセス損失が追加の協調体を調整オーバーヘッドに変える。
次に、共有グループメモリとシミュレーションされたHuman-in-the-loop(HITL)ゲートを組み合わせた足場の評価を行った。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:08:43 GMT)
Learning-Based Decision Making for Combustion Phasing Control in Multi-Fuel CI Engines with Latent Fuel Reactivity Estimation [1.5] マルチ燃料圧縮着火エンジンは燃料の柔軟性を提供するが、不確実な時間変化の燃料反応性を導入する。
この研究は、部分的に観測可能なシーケンシャルな決定問題として、潜時CN変動の下でCA50の規制を定式化する。
提案するGRU誘導RLフレームワークは燃焼履歴から燃料反応性のコンパクトな表現を学習する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:36:56 GMT)
SkillMoV: Mixture-of-View Routing with Prototype-Conditioned Gating for Unified Multi-View Proficiency Estimation [1.4] SkillMoVは、同期ビデオからマルチシナリオの習熟度を推定するための統合フレームワークである。
コアとなるSkillMoVは、Mixture-of-View Projector (MoVP)を導入している。
EgoExo4D上のSkillMoVを、6つのスキルドメインと3つの個別に訓練されたビュー設定で評価した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:19:20 GMT)
Control-Plane Placement Shapes Forgetting: An Architectural Study of Agent Memory Across Thirteen System Configurations [1.3] ForgetEvalは1000ケースのテンプレート・スイートと385ケースの対向層(手作り+253 LLMのオラクル・バリデーション)
決定論的プリミティブは語彙的・時間的カテゴリーで十分だが、正準化に失敗する。
1000ケースのテンプレートスイートと385ケースの反対層であるForgetEvalを通じて、トレードオフを公開しています。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:16:41 GMT)
A Red-Team Study of Anthropic Fable 5 & Opus 4.8 Models [1.3] Anthropic, Fable 5, Opus 4.8 によって開発された2つの大言語モデル (LLM) の対角的ロバスト性を評価する。
数十万の敵対的試みが生成され、明らかな成功はすべて独立して調整された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:23:58 GMT)
Analyzing and Encoding the Al-Mawrid Arabic-English Dictionary with the ISO Language Markup Framework and TEI Lex-0 [1.1] 本稿ではアラビア語辞書Al-Mawridの体系的デジタル化と符号化のための堅牢な方法論を提案する。
従来の印刷資源から標準化された計算語彙に変換する。
辞書のマクロ構造とミクロ構造に編集ビューを適用することにより、20世紀のバイリンガル辞書に典型的な構造的曖昧さと不整合を解消する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:35:11 GMT)
All Smoke, No Alarm: Oracle Signals in Agent-Authored Test Code [1.1] ソフトウェア実践者は、オープンソースプルリクエスト(PR)でプロダクションコードと並行してテストコードを生成するAIコーディングエージェントをますます使用しています。
最近の研究では、116,000以上のリポジトリで932,000以上のエージェントによるPRが報告されている。
明示的なアサーションを欠いたテストファイルは、振る舞いを検証せずにコードを実行する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:06:51 GMT)
Task Allocation and Motion Planning in Dynamic, Cluttered Environments via CBBA and Graphs of Convex Sets [1.0] 動的環境におけるマルチエージェントタスク計画では、エージェントにタスクを割り当てると同時に、環境を通して安全な時間効率のトラジェクトリを同時に決定する必要がある。
本稿では,トラジェクトリ最適化のためのグラフ・オブ・コンベックス・セットと,分散タスク割り当てのための Consensus-Based Bundle Algorithm (CBBA) を組み合わせたソリューションを提案する。
次に、アロケーションとプランニングを接続し、エージェントが3次元以上の時間構成空間での衝突を回避し、タスク完了の正確な時間推定を提供する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:14:15 GMT)
AI Sandboxes: A Threat Model, Taxonomy, and Measurement Framework [1.0] AIシステムは、隔離、シミュレーション、インスツルメンテーション、監督、エビデンスキャプチャを組み合わせた境界環境でますます評価されている。
本稿では、デジタルAIにおけるテスト、評価、検証、検証、実施、サイバー物理展開のための制御された環境として、AIサンドボックスの保証指向のアカウントを開発する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:57:24 GMT)
Confident yet Concerned: Inconsistencies in Computing Students' Attitudes on Cybersecurity [0.9] 若者はテクノロジーに没頭しており、多くのプラットフォームでオンラインのプライバシーを管理することに無力感を抱いている。
これにより、サイバーセキュリティに対する一般的な広範囲な態度と管理に関する疑問が提起される。
私たちは、サイバーセキュリティに関する知識、態度、経験をよりよく理解し、特に詐欺的なオンラインコミュニケーションに対処しようと努めています。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 23:32:44 GMT)
Non-negative Matrix Factorisation with Topological Regularisation [0.9] 非負行列分解における解釈可能な基底の学習について検討する。
我々のアプローチは、多くのデータモダリティが構造化ドメイン上の非負の関数と見なせるという観察に動機づけられている。
我々は、安定かつしきい値のない位相量化器として永続的ホモロジーを使用し、NMFの目的を正規化器として統合した位相スコアを設計する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:15:42 GMT)
Cavity method for permutation models on Cayley trees [0.9] 変数が対称群$Sn$の値を取るケイリー木上の置換モデルについて検討する。
均一な常磁性空洞溶液の線形安定性は、文字固有値比によって制御される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:12:41 GMT)
Quantum Annealing Enhanced Reinforcement Learning for Accurate Remaining Useful Lifetime Prediction [0.9] 劣化予測のための量子アニール拡張埋め込み(Q-QAQL)システムを提案する。
QAQLは、古典的、統計的に重要なベースラインよりも優れています。
その結果、量子劣化誤差は単に理論的なものではなく、予測保守的応用であることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 21:32:37 GMT)
Sign-Rank, Index, and List Replicability: Connections and Separations [0.8] この問題に対する2つのアプローチは、$mathbbZ$-indexとリストの複製可能性数という、分析し易い尺度によって、符号ランクの低い境界を確立する。
我々は、$mathbbZ$-index がリストの複製率の線型関数によって上界であることが示している。
また、2つの概念クラスの積が2つの概念クラスのリスト複製可能性数の和で束縛されたリスト複製性数を持つことを示す、基本的な構成結果も証明する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:57:16 GMT)
Physics-Constrained Neural Networks for Improved Short-Term Weather Forecasting: A Case Study over the South Pacific [0.8] 本研究では,ハイブリッド短期気象予報モデルの精度と安定性を向上させるために,物理制約型ニューラルネットワーク(PCNN)の改良を提案する。
改良された数値解法とベータ平面近似とサブグリッドスケールの粘度を組み合わせることで、積分時間を1200秒まで4倍にすることができる。
統一された自己回帰ハイブリッドブロックは、24個の特別なモジュールの元々の連鎖を置き換え、特定のリードタイムへの過度な適合を排除した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:18:48 GMT)
Signature filtering: a lightweight enhancement for statistical watermark detection in large language models [0.8] Signature filteringは、透かしの埋め込みやテキスト生成を変更することなく、透かし検出を強化する検出時モジュールである。
繰り返し透かしテストの信頼性を損なう小さなトークンセットを学び、検出前にこれらのトークンを削除する。
2グラムと3グラムのシグネチャは、弱信号および低エントロピー設定における検出率を、フィルタリングなしで831%からフィルタリングで7899%に引き上げた。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:24:32 GMT)
From Specification to Execution: AI Assisted Scientific Workflow Management [0.8] 本稿では,AIを活用した科学ワークフロー管理手法を提案する。
このメソッドは、ワークフローの意図、設計、実装を分離する構造化された仕様フェーズを導入し、コード生成に先立って検証を可能にする。
本手法は, 並列性, 反復性, 依存性集約構造で選択された医用画像にフェデレートした学習ワークフローを用いて評価する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:21:09 GMT)
Contactless Respiratory Monitoring on Heterogeneous Mobile Robots: A Multimodal Edge-Computing Framework [0.7] エッジコンピューティングを用いた異種移動ロボットのためのモード適応型接触レスRR監視フレームワークを提案する。
提案システムは、RGB、熱、近赤外線(NIR)、低照度カメラ、姿勢ロバストモニタリングのためのキーポイント誘導胸部ROI抽出、および信頼できる呼吸推定のための信号品質インデクシング(SQI)に基づくフィルタリング機構を組み合わせた。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 00:18:46 GMT)
From Period Finding to Lattice Sampling: Experimental Insights into Shor's and Regev's Factoring Algorithms [0.7] 本稿では、実量子ハードウェア上に実装されたRegevの量子ファクタリングアルゴリズムの実験的検討を行い、その挙動をShorのアルゴリズムと比較する。
我々の分析は、ShorとRegevのアルゴリズムが算術構造を量子状態にエンコードする様々な方法を強調している。
どちらのアルゴリズムも小さなN状態において実用上の優位性を示していないが、現代の量子デバイスにおける相対的堅牢性と障害モードについての洞察を提供する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:06:38 GMT)
MorphStrata: Layer-Specific Perturbations for Generating Morphence Students in Time-Series Moving Target Defense [0.7] MorphStrataは、従来のMorphenceディフェンスを拡張した選択的層特異的ノイズ注入による学生生成戦略である。
MorphStrataはトランスフォーマーのバックボーンを教師として使用し、ランダムに選択されたアーキテクチャブロックを摂動することで、学生モデルにまたがって構造化されている。
我々は,ジェナ気候,電力負荷図,アプライアンスエネルギー予測などの一連のベンチマークを用いて,バニラトランスフォーマーとモルフェンスバックボーンの評価を行った。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:35:52 GMT)
Agent Utilities over Generalized Voronoi Regions and their Gradients [0.7] 我々は,ボロノイ領域の概念を一般化し,エージェントユーティリティを対応するボロノイ領域上のユーティリティ密度の積分として定義し,そのユーティリティの勾配を導出し,サッカーからの2チーム例でそのアプローチを説明する。
本稿では, 流体力学からReynolds Transport Theoremを用いて, このユーティリティ勾配を計算し, ベースラインの有限差分近似と比較して計算時間を約1桁削減し, 同様の精度で計算できることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 00:58:23 GMT)
CADET: Physics-Grounded Causal Auditing and Training-Free Deconfounding of End-to-End Driving Planners [0.7] 模倣によって訓練されたエンド・ツー・エンド(E2E)自動運転プランナーは、統計的ショートカットの傾向が強い。
CADETは,事前訓練したE2Eプランナをパラメータを更新することなく,監査,ベンチマーク,修復を行う,トレーニング不要のフレームワークである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:38:02 GMT)
Non-asymptotic Tail Bounds for the Kostlan--Shub--Smale Field: Tensor PCA and Spherical $k$-Spin Complexity [0.7] 本論文では、球面上のコストラン-シュブ-スモールランダム場の上層に対して、明示的で漸近的でない尾境界の階層を構築する。
スパイクされたPCAと球面の$k$-spinモデルのランドスケープという2つの問題に適用できる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:27:25 GMT)
A T-API-Compliant ReAct Agentic Loop for Optical Networks: Generic vs. Domain-Specific Tool Abstractions [0.7] 本稿では,最初のT-API準拠の推論と行動(ReAct)ループを示す。
汎用ツールと比較して,ドメイン固有の複合ツールは3倍のトークンセーブで90%のオラクル価の正当性を達成できることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:47:16 GMT)
Exponentially many initializations to avoid barren plateaus [0.6] バレン高原は平均ケース現象として述べられており、アンザッツを摘み、それを鼻で初期化し、濃度が続く。
バレンプラトーの潜在的な治療法は、単にパラメータをより慎重に初期化することである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:07:17 GMT)
Querying an astronomical database using large language models: the ALeRCE text-to-SQL system [0.6] 大規模言語モデル(LLM)に基づくテキスト・トゥ・コンテクスト(構造化クエリ言語)システムを開発した。
本稿では,ALeRCE(Automatic Learning for the Rapid Classification of Events)天文学データベースに適用する。
ALeRCEはZwicky Transient FacilityとVera C. Rubin Observatoryのコミュニティブローカーである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:12:16 GMT)
MoCo-AIS: A Contrastive Learning Framework for Similarity Computation of Vessel Trajectories [0.6] 軌道類似性は移動パターンの分析における基本的な課題である。
従来の距離に基づく類似性計算のための尺度は、高い計算コストを発生させる。
本稿では,血管軌道埋め込みを学習するための統合フレームワークであるMoCo-AISを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:30:09 GMT)
TopVenues: A Reproducible Corpus and Tooling Substrate for Cybersecurity Literature Reviews [0.6] 本稿では,コーパス構築をアーティファクトとして実現したオープンソースシステムであるTopVenuesについて述べる。
2017年から2026年までの11のサイバーセキュリティソースから9,925件の論文があり、99.86%の要約と99.99%のBibVenueカバレッジがある。
固定分母は、また測定が可能であり、2024年から2025年の4つの上位セキュリティ会議からの29.2%の論文は、出版の5ヶ月前のarXivプリプリントとして表示され、前者が記録したフィルターは、後に同じ会場に表示される16.5倍の精度でトリアージプリプリントを取得できる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:54:50 GMT)
Geometrical fairness in graph neural networks [0.6] 基礎となるラプラシアン作用素を変更することにより、グラフに基づく拡散の公平性を考慮した適応を導入する。
結果の振る舞いを原理的に分析し、公正性に関する理論的洞察を確立する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:50:30 GMT)
SpatioTemporal Causal Network Diagnostics for Geographic Tipping Point Early Warning [0.6] 生態系、気候サブシステム、氷床における地理的な転換点は、早期警戒の局所化に重大な課題をもたらす。
本稿では,地理的フィールドを時間進化型因果ネットワークとして表現することで,これら3つの問題に対処するフレームワークであるSpatioTemporal Causal Network Diagnostics(ST-CND)を紹介する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:57:16 GMT)
Verifiable computations for dynamic encrypted control [0.5] 線形動的暗号化制御のための新しいタイプの検証アルゴリズムを提案する。
制御器のシステム理論的な入力出力特性を人工的チャレンジ信号に適用する。
この結果、計算負荷はほとんど増加せず、間違った計算は高い確率で明らかにされ、リプレイ攻撃は起こり得ない。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:15:12 GMT)
LLM Consumer Behavior Theory: Foundations of a Novel Research Field [0.5] 大規模言語モデル(LLM)は、ユーザに代わって消費決定を行う自律エージェントとして、ますます多くデプロイされている。
この変化は、伝統的に人間を主要な意思決定者としてモデル化してきた消費者理論に対する根本的な疑問を提起する。
エージェント市場における消費者行動分析に関する新たな研究分野であるLCM消費者行動理論を紹介する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:51:43 GMT)
Revisiting Structural Dependency in Autoregressive Multi-Task Table Recognition via Order-Independent Cell-Level Representations [0.5] マルチタスクテーブル認識は、テーブル構造予測、セルローカライゼーション、セルコンテンツ認識を共同で扱う。
本稿では,非因果的注意を通して秩序に依存しない細胞特徴を生産する構造改良モジュールを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:45:57 GMT)
Toward Accessible Psychotherapy Training Using AI-Driven Interactive Patient Avatars [0.5] アクセプタンス・アンド・コミット・セラピー(ACT)における精神療法士の訓練には、有意義なフィードバックを伴う反復的な実践が必要である。
仮想患者と音声対話によるACT指向精神療法訓練を支援するシステムを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:02:00 GMT)
Predictive Analytics in E-Commerce for CustomerBehavior Forecasting using hybrid Ret-DNN withXGBoost Model [0.5] 本研究では,Retail Deep NeuralNetwork(Ret-DNN)とExtreme Gradient Boosting(XGBoost)モデルを組み合わせたハイブリッドモデルを提案する。
提案した Ret-DNN XGBoost モデルは,既存の Ret-DNN モデルと比較して,aMean Absolute Error (MAE) 0.2193 を達成することで,より良い結果を得た。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:41:14 GMT)
Position: Coding Benchmarks Are Misaligned with Agentic Software Engineering [0.5] コーディングエージェントは、ソフトウェアエンジニアリングの主要なモードになっていますが、比較に使用するベンチマークは、前エージェント時代に設計されました。
現在のコーディングベンチマークはエージェント型ソフトウェアエンジニアリングと不一致である、と私たちは主張する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:21:01 GMT)
A Framework for Evaluating Agentic Skills at Scale [0.5] エージェントスキルは構造化され、エージェント能力を増強する再利用可能な知識アーティファクトである。
個々のスキルを評価するための再利用可能な方法論は存在しない。
本稿では,スキルライターが現実的なタスクを構築できる評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:46:56 GMT)
ASTEROID: A Spatiotemporal Information Transformer for Forecasting Multi-Step Time Series of Molecular Dynamics [0.4] 我々は,多段階原子座標を直接予測できるデータ駆動型フレームワーク ASTEROID を開発した。
ASTEROIDはMDトラジェクトリを高テンポラルシーケンスとして再構成し、時空間情報(STI変換)方程式をトランスフォーマーアーキテクチャに統合する。
以上の結果から,ASTEROIDは様々なベンチマークにおいて既存の手法よりも精度が高いことが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:30:27 GMT)
Kinematic properties of the Pauli equation [0.4] Wigner-Vlasovフォーマリズムに基づき,パウリ方程式の運動特性について検討する。
ハミルトン-ヤコビ方程式の新しい系と電磁場における運動方程式の系を得る。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:51:53 GMT)
PreAct: Computer-Using Agents that Get Faster on Repeated Tasks [0.4] 私たちはPreActを紹介します。これはコンピュータ利用エージェントが以前したタスクを高速化するものです。
初めて成功したとき、PreActはスクリーンをチェックする小さなステートマシンのプログラムステートに実行をコンパイルする。
各ステップでPreActは、プログラムが実行する前に期待するものとスクリーンが一致していることを確認し、何かがオフになった瞬間にエージェントに制御を返します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:40:21 GMT)
Conformal Prediction Intervals with Tail-Specific Guarantees [0.4] まず,下側と上側の一辺共形区間を構築し,その2辺共形区間を交叉により導出する。
提案するフレームワークの利点は金融アプリケーションで示され、左のテールを厳格に制御しながら戻りを目指している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:29:46 GMT)
Reload-Mamba: Hierarchical Anti-Dilution State-Space Modeling for Multi-Class Semantic Segmentation [0.4] マンバをベースとした状態空間モデルは高分解能密度予測のための線形時間長距離モデリングを提供する。
Reload-Mambaは,3つのセグメンテーション特異的な設計を通じて,伝搬誘起応答の希釈に対処するフレームワークである。
Reload-MambaはADE20Kでは47.9%のシングルスケール(48.9%のマルチスケール)mIoU、Cityscapesでは83.2%のシングルスケールmIoUを達成した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:17:24 GMT)
Attention Alignment Between Humans and Vision-Language Models [0.4] 我々は6つの視覚言語モデルからの空間的注意マップと200枚の画像に記録された人間の定着熱マップを比較した。
デコーダとエンコーダアーキテクチャの両方がアライメントを形成するが、デコーダの選択は支配的であった。
CNN vs. ViTエンコーダはデコーダファミリによって2次5-20の優位性をもたらし、CNN-LSTMは全体として最も整合したモデルであった。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:47:10 GMT)
Configuration Smells in AGENTS.md Files: Common Mistakes in Configuring Coding Agents [0.3] コーディングエージェントの構成ファイルに最初の匂いのカタログを提示する。
このような臭いを識別するために,灰色文献レビューとレポジトリマイニング分析を行った。
我々は「AGENTS.md」または「CLAUDE.md」ファイルを含む100の人気のあるオープンソースリポジトリを分析した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:10:50 GMT)
Measurement noise limits the advantage of nonlinear models over linear models in biomedical prediction [0.3] 生体医学データでは、フレキシブルモデルが線形回帰とロジスティック回帰によって繰り返し一致または打ち負かされる。
これらの修正は、バインディング制限がモデルではなく測定値である場合に役に立ちません。
140の英国バイオバンクタスクで、フレキシブルモデルとリニアモデルの間には、予測されたノイズシグネチャがある。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:15:08 GMT)
A Bayesian Boolean Matrix Factorization with Application to Copy Number Analysis in Cancer [0.3] がんゲノム学では、BooMFは、腫瘍の進化を促進する可能性のある、協調した特徴変化を明らかにすることができる。
BBMFは完全に共役な生成モデルであり、疎性誘導前駆体を持つ。
BBMFは、患者サブセットと反復的に調整された染色体アームを繋ぐ、解釈可能な小セットを見つける。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:03:03 GMT)
ASTRA: A Scalable Next-Generation ATCO Training Simulator with Autonomous Simpilots [0.3] ASTRAは、ATCO音声を転写し、指示を解釈し、ローカルに適応した音声モデルを使用して適切なパイロットとATCO応答を生成するパイプラインを通じて、シミュレートロールを自動化するエンドツーエンドのトレーニングシミュレータである。
ASTRAにはAIによるパフォーマンス評価フレームワークが組み込まれており、正確性、簡潔性、完全性を通じて訓練生の無線電話通信を評価する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:43:14 GMT)
Possible or Definite? A Benchmark for Evaluating Diagnostic Uncertainty Preservation in Clinical Text [0.3] 大きな言語モデル(LLM)は、要約やリビジョンといった臨床テキストタスクにますます使われている。
臨床実践では、肺炎の可能性のようなフレーズは、利用可能な証拠の強さを伝達する。
これらの不確実性表現を変えることは、臨床的意味を完全に変えることができる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:30:53 GMT)
Bridging Spatial And Frequency Views For Disaster Assessment: Benefits And Limitations [0.3] 本研究では,建築被害分類のための空間領域,周波数領域,二重領域深層学習手法の比較を行った。
性能は、精度、マクロF1スコア、クラスごとのメトリクス、混乱行列を用いて評価される。
双対空間構成は最高テスト精度(0.4688)と最低損失(0.4254)を達成する一方、空間限定モデルは最高マクロF1スコア(0.4254)を達成する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:35:28 GMT)
Entanglement response to Temperature in Interacting Two-Qubit Thermal States [0.2] 熱量子フィッシャー情報により熱的絡み合いの変化の速度が制限されることを示す。
これらの結果は、相互作用する2量子ビットの熱状態における絡み合いの応答と堅牢性に関する基本的な制約として、熱量子フィッシャー情報を確立する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:10:04 GMT)
Quantum Computing Algebra (QCA), the theory and implementation [0.2] 本稿では、ディラック形式を幾何学代数表現へ直接変換するために設計された実幾何代数フレームワークを提案する。
本稿では,量子ゲートとマルチキュービット系を効率的に表現し,計算的に生成する方法を示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:27:40 GMT)
From Observation to Intervention: A Causal Audit of Expert Importance in Mixture-of-Experts Models [0.2] 本研究では,Mixture-of-Experts (MoE) プルーニングにおけるルーティング統計の利用について検討する。
あらゆるモデルにおいて因果的専門家の重要性を予測する観察的指標は見つからない。
以上の結果から, 人口レベルの観察結果から, 専門家の重要度に関するトークンレベルの介入主張まで, 共通の推論段階に対する明確な反例が得られた。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:15:27 GMT)
Learning to Refine Hidden States for Reliable LLM Reasoning [0.2] 大規模言語モデルは強力な推論能力を示すが、複雑な多段階設定では内部推論プロセスは不安定である。
本稿では,復号化前に隠蔽表現を反復的に更新する強化誘導潜時改善フレームワークReLARを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:03:27 GMT)
SegTME-UNI2: A Foundation Model-Based Framework for Generalisable Multiclass Cell Segmentation and LLM-Driven Tumour Microenvironment Characterisation in Histopathology [0.2] 腫瘍微小環境(TME)に対処する統合フレームワークであるSEGTME-UNI2について,H&E染色組織像から腫瘍微小環境を再現するには,同時細胞分画,特徴抽出,解釈可能な臨床報告が必要である。
UNI2-Hover病理基盤モデルと2つの並列UperNetデコーダを組み合わせたデュアルヘッドセグメンテーションモデルであるUNI2-RHOVERを提案する。
大規模な現実世界リポジトリにおけるピクセルレベルのアノテーションの欠如に対処するため、NI2-RHOVERは3段階のプログレッシブな擬似ラベルカリキュラムを実施している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:12:19 GMT)
Multi-Source Cybersecurity Logs: An ATT&CK-Labeled Dataset and SLM Evaluation [0.2] ATLASは3つのソースすべてを含むが、ラベルのイベントは悪意や良心のみを含む。
3つのソースすべてとエントリー毎のATT&CKテクニックラベルを組み合わせた公開データセットは存在しない。
我々は870のセッション(70の攻撃、800の良心)と約230万のイベントからなるマルチソースログデータセットを構築します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:21:58 GMT)
A Neuromorphic Trigger for Efficient Audio Event Detection [0.2] 本稿では、下流モデルへの入力を選択的にゲートするスパイキングニューラルネットワーク(SNN)に基づく、音声イベント検出のためのニューロモルフィックトリガを提案する。
提案したトリガーは低コストのフロントエンドとして機能し、健全な音声セグメントを特定し、これらのみを分類などのタスクのより計算集約的なモデルに転送する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:48:32 GMT)
Blended Chart Surfaces: A Seamless Explicit Representation for Smooth Surface Fitting [0.1] 我々はBlended Chart Surfacesを紹介した。Blended Chart Surfacesはコンパクトでネットワークフリーで明示的な表現で、構築によってスムーズで、ユーザが提供するチャートに固定されている。
様々なトポロジと幾何学的複雑性に基づいてブレンドチャート面を評価し、明示的な選択肢と比較する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:39:38 GMT)
OmniDroneX: An LLM-Assisted Holistic Drone-as-a-Service Ecosystem [0.1] 固定機能プラットフォームから動的に構成可能なエンティティへドローンを移行させる統合型ドローン・アズ・ア・サービスエコシステムを提案する。
中心となるイノベーションは、OmniDroneXアーキテクチャの複数の層にまたがる大規模言語モデル(LLM)の多様な応用である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:40:58 GMT)
All Reflective Field-widened Unbalanced Interferometer for Quantum Sensing and Communication Applications [0.1] フィールドワイド干渉計に基づくマルチモード受信機は、適応光学に代わる魅力的な代替手段を示す。
空間多重モードビームに対する高干渉可視性(0.97以上)を実現するフィールドワイド干渉計の設計を実証する。
干渉計は、衛星通信などの空間多重・乱流光チャネルに適用でき、時間ビン符号化量子ビットを使用する量子システム向けに設計されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:05:06 GMT)
Reliable Neural-Codec Text-to-Speech by ASR Self-Verification and Distillation: Near-Zero Catastrophic Failures Across Models and Codecs [0.1] 最良NSR自己検証は失敗をほぼゼロに導くことを示す。
モデルに自己検証された動作ロバスト性を蒸留することにより、予測時に修正を自由にする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:41:44 GMT)
A Cross-Model VLM-Judge Protocol for Single-Image 3D Mesh Quality (and Why Cheap Proxies Fall Short) [0.1] シングルイメージから3Dジェネレータは急速に改善されている。
1つの生成されたメッシュが他のメッシュよりも優れているかどうかを判断する、合意された、人間の自由な方法はありません。
再現可能なVLM-judge評価プロトコルを提案し,検証する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:00:12 GMT)
Sequential Hiring of Contingent Workers Through Learning-Based Optimization [0.1] 本研究では、労働者生産と労働供給の両面で不確実性のある労働環境において、逐次的労働管理問題について検討する。
我々は,学習サイクルを通じて雇用決定を逐次行う,学習ベースの雇用政策であるDR-UCBを開発した。
それぞれのサイクルにおいて、ポリシーはリアルタイム生産データを使用して、いつ労働の変化を開始するか、どの労働者を置き換え、雇用するかを決定する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:40:49 GMT)
The Measurement Gap in the Automation of EU Law: Benchmarking Doctrinal Legal Reasoning under the EU AI Act [0.1] 大規模言語モデルは、少なくとも中央値の品質の法的なテキストを生成するようになった。
既存のベンチマークでは、彼らが教義的な法的推論を行うかどうかを評価できない。
EU AI法(EU AI Act)は、司法ドメインで使用されるリスクの高いAIのバインディング要件を「適切な精度」にしている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:57:12 GMT)
ThousandWorlds: A benchmark for climate emulation of potentially habitable exoplanets [0.1] ThousandWorldsは、エクソクライムエミュレーションのためのML対応のベンチマークであり、ローデータ、マルチシミュレータ、パラメータ・ツー・フィールドレグレッションのより広範なレグレッションのためのものである。
このデータセットには、5つのGCMから約1800のシミュレーションが含まれており、8つの惑星のパラメータを3D大気場にマッピングしている。
GPベースの手法が最善を尽くし、万能深層学習がまだ成功していない体制を公開することを示唆している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:00:00 GMT)
Learning Red Agent Policy from Observations for Neurosymbolic Autonomous Cyber Agents [0.1] 現代のネットワークは、強化学習(RL)を通じて訓練されたインテリジェントなサイバー防御エージェントを必要とする
本稿では、模倣学習を用いたポリシー学習手法を提案し、離散状態と離散動作を持つ部分観測可能なRLエージェントのポリシーを学習する。
我々は,この手法を自律型サイバー環境に適用し,ネットワーク観測とディフェンダー行動からレッドエージェントの行動を予測する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:50:41 GMT)
A Quantitative Analysis of Multimodal Biomarkers in Alzheimer's Disease [0.0] タウPET, 構造MRI, 認知スコア, APOE4データを組み合わせた多モードADバイオマーカーの定量的解析を行った。
本研究は,アルツハイマー病におけるバイオマーカーの解釈性および選択性を改善するために,クロスモーダルな関係の体系的特徴を提供する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:40:15 GMT)
Singular Vector Finite Element Basis Functions for Tetrahedra in Complex Electromagnetic Geometries [0.0] 本研究では,3次元要素の特異場をモデル化するための基礎関数を開発する。
以前の関数とは異なり、これらの基底関数は加法関数であり、より堅牢な性能を達成するために標準ベクトル基底関数と一緒に含まれる。
これらの基底関数は標準基底関数と比較して精度が大幅に向上し、それ以外は高価なシミュレーションをはるかに低コストで行うことができる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:41:10 GMT)
Your AI Travel Agent Would Book You a Bullfight: An Agentic Benchmark for Implicit Animal Welfare in Frontier AI Models [0.0] 我々は、AIエージェントが、ユーザーに代わって行動する際に、動物による搾取を含むオプションを避けるかどうかを測定する最初のエージェントベンチマークであるTAC(Travel Agent Compassion)を紹介する。
全てのモデルが64%以下で、最高のパフォーマー(Claude Opus 4.7)は53%である。
本稿では,文化ドメイン間のカテゴリレベルの変動,テキスト応答型福祉ベンチマークの限界,およびEUの汎用AIコード・オブ・プラクティス・システムリスク・フレームワークについて論じる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:42:42 GMT)
Why SWAVE May Not Be All You Need:A Concept-Evolution Retrospective on Complex-Valued Recurrent Language Models [0.0] SWaveは2xH100 NVLを用いてFineWeb-Eduで訓練された複雑な値のリカレント言語モデル(169.26Mパラメータ、D=384、L=16、T48)である。
言語を実数値ではなく複雑な波として表現することで、よりリッチな情報符号化が可能になる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:05:28 GMT)
Why Model Credibility Isn't Enough: -Rethinking Trust in Simulation Architectures [0.0] 本稿では,組立信頼性分野における技術の現状について概説する。
感度分析技術、専門家による質的分析、AIにおける説明可能性、ネットワークを比較します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:56:30 GMT)
When the Next Step Is Not One Step: Distribution-Aware Execution Modeling for Concurrent Go Programs [0.0] 並列プログラムの次のステップを予測するためにモデルをトレーニングするのは、スケジューラが非決定論的であるため、見た目よりも難しい。
我々は、各プログラムを何度も実行し、観測された次の事象を経験的分布に集約し、その分布をKLの目的と一致するように7Bモデルを微調整する。
実際のGoのバグから引き出された798のホールトアウト予測では、1000個未満のトレースの微調整が36.2%の精度に達する。
P(GoUnblock)がスケジューラのセマンティクスによって保持される選択ブロックゴルータのクラスに対する正規なゴルータ-リークシグネチャを学習によって導出する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:40:04 GMT)
What Does the Weight Norm Control in Grokking? Logit-Scale Mediation under Cross-Entropy [0.0] 規範が実際に何を制御するのかを尋ねる。
クロスエントロピーの下で、標準誘導範囲全体にわたってグラッキング遅延をスライスする。
標準の格子と温度を横切ると、遅延はロジットスケールだけで崩壊する(R2 = 0.97)。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:16:18 GMT)
Vorticity Induced by Non-frontal Collisions of Quantum Droplets [0.0] 超低温アルカリ原子からなる量子滴の非正面二元衝突により引き起こされる回転動力学を解析した。
圧縮不能状態にある411$Kと87$Rbの原子からなるヘテロ核量子滴の衝突は、トポロジカルな欠陥を自然に発生させる動的不安定を引き起こす。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:17:54 GMT)
Vines-DB: An RGB image dataset for multi-species ornamental vine segmentation [0.0] Vines-DBデータセットには、ユタ州ローガンにあるユタ農業試験場(英語版)のグリーンビル研究農場(英語版)のフィールド条件下で収集された7種の装飾用ブドウ種の1,218個の高解像度RGB画像が含まれている。
写真はiPhone 16 Proで撮影され、朝10時から午後12時の間に48MPのカメラが搭載された。ウイルスは1.2m×2.4mのトレライズで成長し、黒か白のスチロールの背景から1mの距離から撮影され、コントラストを改善し、背景雑音を低減する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:52:15 GMT)
Veriphi: Attack-Guided Neural Network Verification with Dataset-Dependent Training Methods [0.0] 本稿では,高速敵攻撃と形式的バウンド認証を組み合わせたGPU高速化ニューラルネットワーク検証システムを提案する。
トレーニング手法の有効性は基本的にデータセットに依存していることを実証する。
攻撃誘導型ファルシフィケーションによる検証5倍の高速化を実現し,本運用規模モデルへのアプローチを拡大する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:02:51 GMT)
Universal entanglement probes of topological order and locally-achiral manifolds [0.0] ここでは、多様体の位相分割関数 $Z(M)$ が、M$ が位相条件を満たすならば、$M$ を抽出できることを示す。
この性質は, 4次元の時間-逆対称保護位相秩序 (T-SPT) の存在と関係している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:07:34 GMT)
Twin-beam advantage in quantum LiDAR under correlated noise [0.0] 分離性スクイージングは、損失および熱的背景下でのコヒーレント照明よりも堅牢な優位性を示すことを示す。
これらの結果は、絡み合いが局所的スクイーズ以上の強靭性をもたらす運用体制として相関ノイズを確立している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:32:18 GMT)
Tunable Chaos in the Finite Mean SYK Model [0.0] 標準SYKモデルの2つの特徴は、その最大カオスと有限零温度残留エントロピーである。
結合分布の有限平均標準偏差比$gequiv J_0/J$の一般化モデルについて検討する。
この一般化されたSYKモデルでは、カオス的でない交叉が存在すると結論付ける。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:50:49 GMT)
Trustworthy Self-Composable Big-Data-as-a-Service: An LLM-Orchestrated Multi-Agent Framework for Automated Data Engineering, AutoML, MLOps Deployment, and Drift-Aware Lifecycle Optimization [0.0] 本稿では,LLM-orchestrated multi-agentコラボレーションに基づく,信頼性の高い自己コンパイル可能なBDフレームワークを提案する。
提案したアーキテクチャは、BDライフサイクルを、データ取り込み、データクリーニング、機能エンジニアリング、AutoMLトレーニング、モデル評価、MLOpsのデプロイ、監視、ドリフト検出のための特別なエージェントに分解する。
フレームワークには、共有アーティファクトガバナンス、サポート、Human-in-the-loopチェックポイント、ドリフト対応フィードバックループも含まれている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:34:27 GMT)
Tripartite Entanglement in $e^+ e^- \to t \bar{t} Z$ [0.0] マルチパートエンタングルメント(英: multipartite entanglement)は、複合量子状態の集合的性質をキャプチャする一意の量子形式である。
この現象を将来のレプトンコライダーで$e+e-to tbar tZ$で調べる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:58:58 GMT)
ToolChain-CRC: Conformal Risk Control for Agentic AI Under Retrieval and Tool-Use Drift [0.0] ドリフト中の検索・ツール利用エージェントに対する共形リスク制御手法であるToolChain-CRCを提案する。
この方法は各エージェントを行動、観察、最終的な出力の完全な軌跡として扱う。
ステップレベルのリスクスコアを構築し、それらを軌道上のリスクスコアに組み合わせ、アクセプションまたはインターベンルールを校正し、いつでもアラームを追加します。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:27:37 GMT)
The Slop Paradox: How Synthetic Standardization Erodes Clinical Uncertainty and Cross-Modal Alignment in AI-Rewritten Radiology Reports [0.0] インディアナ大学のデータセットから450個の胸部X線レポートを用いて、3つのリアルな書き換えタスクによって合成版を生成する。
我々は, 実体浸食(医学的NER), ヘッジ崩壊(臨床不確実性言語の欠如), クロスモーダルアライメント劣化を測定した。
劣化の主要な要因は、臨床内容ではなく、AI書き換えタスクの種類である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:07:48 GMT)
The Discrete-Log Clock: How a Transformer Learns Modular Multiplication [0.0] 以前の研究は、学習された埋め込みは全ての周波数を必要とする「密度」フーリエスペクトルを持つと報告していた。
この密度は、間違ったベースで分析する人工物であることを示す。
我々は,Nanda らの Clock アルゴリズムに類似した "Discrete-Log Clock" アルゴリズムを実装した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:16:26 GMT)
Ternary Mamba: Grouped Quantization-Aware Training of W1.58A16 State Space Models [0.0] Mamba-2のような状態空間モデル(SSM)は線形時間推論を提供するが、メモリフットプリントはエッジ展開を制限する。
事前訓練されたチェックポイントサファイスを示し、限界トークン予算を1000倍に削減する。
わずか102Mトークン(4GPU時間、シングルH100)で48.1%のゼロショット精度を達成する
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:18:21 GMT)
Task-Restricted Symmetries in Recurrent Weight Space [0.0] リカレントネットワークは、重量空間におけるかなりの機能的冗長性を含むことができる。
順序付き実シュア座標を用いた一層タンタンRNNにおけるこの冗長性について検討する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:04:07 GMT)
TMR-GGNN: Credit Card Fraud Detection based on Time-Aware Multi-Relational Guided Graph Neural Network [0.0] 本研究では,TM GGNN(Timeaware Multi Guided Graph Neural Network)と呼ばれる新しいフレームワークを提案する。
デコーダは、実際のトランザクションパターンと合成されたトランザクションパターンを区別するために、対照的な学習モジュールを使用する。
重度のクラス不均衡を効果的に管理し、識別学習を強調するために、情報ノイズコントラスト推定(InfoNCE)に基づくコントラスト損失とFocal Lossを導入した複合損失関数を導入する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:50:53 GMT)
SymQNet: Amortized Acquisition for Low-Latency Adaptive Hamiltonian Learning [0.0] 我々は低レイテンシ適応型ハミルトン学習のためのアモータイズされた強化学習アプローチであるSymQNetを紹介する。
5キュービットで、オンラインベースラインと比較して、買収のみの意思決定遅延を47.1タイム$と72.6タイム$に削減する。
全体として、学習した取得によって、繰り返し低レイテンシのワークロードに対して適応的なハミルトン学習を実践できることが示される。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:57:34 GMT)
Surrogate Assisted Pedestrian Protection Design via a Foundation Model Orchestrated Workflow [0.0] 事故安全設計のための最初の基礎モデル-組織化されたワークフローを提示する。
歩行者保護のためのサロゲート支援探査を可能にし、CAEシミュレーション1時間あたりの評価時間を秒に短縮する。
自動車のフロントバンパーケーススタディでは、このワークフローは35種類の異なる安全対応の代替品を生成する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:27:38 GMT)
Structural Role Injection in Handlebars-Templated LLM Prompts: Triple-Brace Interpolation, Delimiter Family, and the Limits of HTML Auto-Escaping [0.0] Handlebarsは広く使われているテンポエンジンで、Microsoft Kernelのデフォルトのプロンプトテンプレートフォーマットである。
そのdouble-brace x式は、値をエスケープし、セーフデフォルトとしてドキュメント化される。
この選択は、アプリケーションの構造的役割注入への露出を静かに制御することを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:21:43 GMT)
Structural MRI Synthesis for Alzheimer's Disease via Conditional Diffusion on Anatomical Masks [0.0] アルツハイマー病(AD)の高次構造MRIデータは, 微妙な, 地域固有の, 進歩的な解剖学的変化のため, いまだに困難である。
我々は,MDD-DDPM条件拡散モデルを拡張し,ADに合わせて3次元構造MRIを生成する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:01:41 GMT)
Stochastic signal sensing with finite energy and dead time at the fundamental quantum limit [0.0] ダークマターの検出や基礎物理学の探索に関係した超光信号の検知効果について検討する。
不整合検知問題の族に対して, 有限平均エネルギー制約が与えられた場合, 2モード圧縮真空が最適プローブ状態であることを証明した。
損失から独立して利得を推定するためには、絡み合いが基本量子限界を達成するために必要な資源であることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:33:59 GMT)
Steady-state spectral kissing and dissipative phase transitions [0.0] 散逸KPOが定常密度行列のスペクトルに符号化されていることを示す。
定常スペクトルキスの開始と消散相転移における消失の両方を規定する臨界線の解析式を導出する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:00:04 GMT)
Security-Induced Braess Paradoxes in Service Function Chain Orchestration [0.0] サービス機能チェーン(SFC)オーケストレーションにおけるセキュリティによるBraessパラドックスについて検討した。
防御的オプションを追加することで、トラフィックの集中と共有セキュリティリソースの敵対的価値によって、適応後の均衡が悪化する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:40:24 GMT)
SPARX: Secure and Privacy-Aware Approximate CNN Acceleration with Edge RISC-V SoC [0.0] エッジAIシステムは、厳格なエネルギー、パフォーマンス、セキュリティ、プライバシの制約の下で、リアルタイムCNN推論を必要としている。
本稿では,不均一な RV32IMC RISC-V System-on-Chip に組み込まれたセキュアでプライバシに配慮した CNN アクセラレーションフレームワークである SPARX について述べる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:24:45 GMT)
SFT Overtraining Predicts Rank Inversion via Entropy Collapse Under RLVR [0.0] GRPOの最高パス@1でSFTチェックポイントを選択する基準は、SFTがロールアウト分布を圧縮すると失敗する。
本稿では,Qwen2.5-Coder-3BとDeepSeek-Coder-6.7BのSFT深さはしごについて検討する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:59:55 GMT)
Robustness of Similarity-based Positional Encoding Under Rotations: Theoretical Analysis and Experimental Validation [0.0] 回転に関するsimPEのロバスト性について検討し,形式的理論解析と実験的検証を組み合わせた。
simPE は回転摂動の下で安定であり、フロベニウスノルムにおいて明示的な摂動境界を導出することを証明する。
すべてのデータセットにおいて、simPEは、回転中の精度、F1スコア、精度、リコールの点で、標準的な学習された位置符号化よりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:11:04 GMT)
Real-space spectral functions of three-dimensional billion-size topological non-Hermitian matter with tensor networks [0.0] 非エルミート系は、様々な非伝統的な位相現象を包含する。
有限3次元系の大規模シミュレーションは、急速に多くのサイトが増えているため、依然として困難である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:51:05 GMT)
Random coloured digraphs defined by a Markov logic network [0.0] MLNは、非負の実数である関連する重みを持つソフト制約からなる。
プロパティ $P(x)$ と関係 $(x, y)R について話す言語を考える。
重みの任意の選択について、重みが 1/n$ のスケールであれば、$varphi$が持つ確率は、関係性において 0 または 1 の 1 に対して 0 または 1 のどちらかである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:49:14 GMT)
Quantum mechanics in configuration space in context [0.0] 自由空間における機械粒子のモデリングを考察し、構成空間に量子力学を文脈に配置する。
我々は、構成空間における標準量子力学と量子力学は古典力学の2つの異なる定式化に基づいていることを強調する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:28:00 GMT)
Quantum algorithm for Valiant-Vazirani reduction [0.0] ヴァリアント・ヴァジラーニの定理のフィルタによる実装を構築し、SATからSATへのランダムな時間短縮を実現する。
雑音自由限界において、SAT問題はねじれ非線形性を用いてねじれ時間で解くことができる。
非線形量子コプロセッサ結合のねじれに対するフォールトトレラントな実装は、sf NP(#sf P)問題に対する時間解を可能にする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:22:16 GMT)
ProvenanceGuard: Source-Aware Factuality Verification for MCP-Based LLM Agents [0.0] ProvenanceGuard は Model Context Protocol-grounded answer のソース認識検証ツールである。
答えを原子的クレームに分解し、ソース固有のエビデンスにルートする。
ブロック F1 0.802 とソース精度 0.858 over 260 のソース許容クレームを達成し、ソースブラインドベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:10:29 GMT)
Protein-Based Fish Species Identification: Dataset, Models, and Insights from Native Bangladeshi Fish [0.0] 魚種の正確な識別は、バングラデシュの食料安全保障、経済発展、気候回復に非常に重要である。
しかし、タンパク配列からバングラデシュ原産魚種を同定するためのベンチマークは存在しない。
バングラデシュ原産魚9種2845種のタンパク質配列について,第1回キュレートデータセットについて紹介した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:20:38 GMT)
Probing weak chaos in $\mathcal N=4$ super Yang-Mills and long-range spin chains [0.0] 我々は、$mathfraksu(2)$ sector of $mathcal N=4$ super Yang-Mills における平面拡張作用素の有限ループトランケーションにおける量子カオスを研究する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:00:09 GMT)
Precision Is Not Faithfulness: Coverage-Aware Evaluation of Grounded Generation with a Complete Oracle [0.0] 基準自由忠実度測定は、モデルが基底真理に対して行う各原子的クレームを検証する。
彼らが盲点を共有していることを示す:彼らは精度だけを計測し、主張されている主張は支持されているか?
戦略的基底真理が決定論的に導出される領域であるF1テレメトリを用いて、この測定を可能にする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:01:49 GMT)
Pointwise is Pointless? A Multimodal Ablation Study for Precipitation Nowcasting with Graph Neural Networks [0.0] 我々はノルディックレーダドメイン上にネットワーク放送システムを構築している。
このモデルは5分毎の降水量を2時間前に予測する。
我々は、レーダー専用、NWPインフォームド、ステーションインフォームド、衛星インフォームド、ノイズ強化、CRPSベースの構成を比較した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:35:49 GMT)
Photon anti-bunching in high harmonic generation [0.0] この研究は、HHG光子の時間相関における非古典性の最初の理論的発見である。
量子光学的HHGに対して最近開発されたハイゼンベルク・ピクチャー・アプローチを用いて実現した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:26:00 GMT)
Perceptual compensation for tonal context in self-supervised speech models [0.0] マンダリンASRのモデルと自己教師付き事前学習モデルとの組込み類似性および探索出力を比較した。
純粋に事前訓練されたモデルの埋め込み類似性には補償の証拠は見つからなかった。
探索型分類器は, 分類の階層的改善に加えて, 補償の証拠がいくつか示されたが, 孤立した試験音節上での人間の演奏の再現には至らなかった。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:03:46 GMT)
PARSE: Provenance-Aware Retrieval Sanitization for Professional Domain LLM Agents [0.0] パラフレージングは, 実文書において統計的に有意な攻撃成功率の低下は示さない。
本稿では,各文を注入可能性で分類する事実保存型衛生パイプラインであるPARSEを紹介する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:29:23 GMT)
On the entanglement induced by the deformation of phase-space [0.0] ほとんどの量子重力理論は、時空の基本的な概念は、非可換空間における量子論とほとんど相容れないことを示唆している。
位相空間のNC変形によって引き起こされる絡み合いの概念を再考する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 06:49:21 GMT)
Neural Network Implementation of the Renormalization Group for Fault Diagnosis with Class Imbalance [0.0] 本稿では、再正規化群(RG)の概念に基づくニューラルネットワークアーキテクチャであるRGNetを提案する。
このモデルは入力次元を逐次圧縮し、局所的な詳細と大域的なパターンの両方を捉える前に全てのスケールを分類する。
その結果、RGNetは、不均衡なクラスを持つアプリケーションにおいて、障害予測のための普遍的で解釈可能で競合的なソリューションであることを示した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:27:40 GMT)
Multimodal Image Colorization: Quantifying the Impact of Text-Conditioned Guidance on Grayscale-to-Color Translation [0.0] グレースケール・ツー・カラー画像モデルにおいて,テキストコンディショニングが画素レベルおよび知覚的指標に与える影響を定量化する。
その結果,PSNRは5.6%,SSIMは1.2%,カラフルは36.6%,LPIPSは7.6%向上した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 21:21:47 GMT)
Model Validation of Agentic AI Systems: A POMDP-Based Framework for Belief-State, Forecast, and Policy Validation [0.0] 本稿では,部分観測可能なマルコフ決定プロセス(POMDP)に基づくエージェントAIのモデル検証フレームワークを提案する。
このフレームワークは、自律的な意思決定を情報、信念、予測、行動、ユーティリティに分解し、各コンポーネントを独立して検証できるようにする。
この論文の主な貢献は、確立されたモデルリスク管理概念を自律型AIシステムに拡張するための実践的なフレームワークである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 00:40:55 GMT)
Mixed-Precision Communication-Avoiding SGD for Generalized Linear Models on GPUs [0.0] 分散勾配降下(SGD)は計算よりも通信によって制限される。
通信回避SGD(CA-SGD)は、$s$連続するAllReducesを単一のAllReduceに置き換えることで、$s$反復以上の通信を再生する。
行列ハードウェアと縮小精度のフォーマットを備えた最新のGPUは、Gram GEMMを加速し、BF16トラフィックを縮小することでこれを相殺する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:14:34 GMT)
Million-scale multimodal pollen microscopy with expert-guided foundation models [0.0] Pollen AI Atlasは100万スケールのマルチモーダル花粉顕微鏡リソースである。
1,511,390 は、専門家が計算した試験領域で99.6%の精度で穀物検出を行った。
Gemma4は最も制御された一次キャプションセットを提供し、タイトな長さ制御、リークなし、最強のテキスト検索性能を組み合わせた。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:35:27 GMT)
Memory as a Wasting Asset: Pricing Flash Endurance for Embodied Agents, and the Limits of Doing So [0.0] ロボットのフラッシュ持続性は、更新不可能な在庫であるが、消去サイクルに値するメモリの価格が設定されていない。
エンボディメモリは,RAM/オンボードNVM/クラウド階層にまたがるコスト最小化配置を実現するため,単一耐久シャドウ価格の在庫を減価として扱う。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:43:19 GMT)
MAPS: A Novel Multi-Axial Projective Sphere for Geometrically Visualizing Higher d-Valued Quantum State-Space of Qudits [0.0] 本稿では,Quditの高次元量子状態を効果的に可視化する新しい3次元フレームワークを提案する。
我々はこの新しい枠組みを「多軸射影球」(MAPS)と呼び、これは n 個の射影交差空間軸からなる。
我々のフレームワークは、機械学習、量子機械学習、量子化学など、実用的な応用のための高次元データの可視化に使用できる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 08:14:17 GMT)
LegalHalluLens: Typed Hallucination Auditing and Calibrated Multi-Agent Debate for Trustworthy Legal AI [0.0] LegalHalluLensは、法的なAIの監査フレームワークである。
型付きプロファイルと、メトリクスを集約するRDIサーフェス障害モードが隠れています。
このフレームワークは、方向対応の調達、説明責任、エージェント設計をサポートする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:02:37 GMT)
Legal Reasoning Is Not Lawyering: Rethinking Legal Benchmarks for Pro Se Access to Justice [0.0] 法的なAIベンチマーク研究は、大きな言語モデルが正義へのアクセスを改善するという仮定をしばしば呼び起こす。
現在のベンチマークでは、すでに法律専門家が事前処理済みのインプットに対する法的推論を評価するため、この仮定を支持する能力がないと我々は主張する。
私たちは、プロセプティックなインプットの下でロバスト性を直接測定する法的なベンチマークを要求して、法的AIに関するアクセシビリティー・トゥ・ジャスティス・クレームが実証的にテスト可能であると結論付けています。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:19:04 GMT)
Koshur Diacritizer: A Byte-Level Sequence-to-Sequence Model for Kashmiri Diacritic Restoration [0.0] カシュミリ(Kashmiri)は、ペルソ・アラビア文字の修正版で書かれたインド・アラビア語の言語で、しばしばデジタルテキストのダイアクリティカルマークを省略する。
カシュミリ文字でダイアクリティカルな単語を復元するためのシーケンス・ツー・シーケンス・モデルであるKoshur Diacritizerを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:28:54 GMT)
Kolmogorov Regression for Robust Diffusion Policies [0.0] 有限次元拡散政策(FD)は、離散化アーティファクトによる時間的ドリフトを示す。
我々は、キャメロン-マルティン空間への拡散ポリシを持ち上げるコルモゴロフ方程式を導入する。
デッドロック現象を96%削減するハミルトン・ヤコビ到達可能性理論を用いて派遣政策を認証する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:18:54 GMT)
KANLib -- An Modular, Extensible and Fast Kolmogorov-Arnold Network Implementation [0.0] Kolmogorov-Arnold Networks (KAN) は、従来の多層パーセプトロンに代わる有望な代替品として登場した。
本稿では,Kanアーキテクチャの開発と評価を行うための,モジュール性,表現性,計算効率のよいフレームワークであるKanLibを紹介する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:38:58 GMT)
Integrated Marketing Attribution: A Bayesian Framework for Privacy-Safe Granular Measurement Anchored in MMM [0.0] マーケティングミックスモデリング(MMM)とマルチタッチ属性(MTA)の2つの主要なアプローチは、断片化された洞察を生み出す。
我々は,MMMとチャネル固有ベイズ属性モデルを組み合わせて,キャンペーンレベルの効果を導出する統合的なフレームワークである統合マーケティング属性(IMA)を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:46:28 GMT)
HistoRAG: Embedding Historical Methodology in Retrieval-Augmented Generation Through Critical Technical Practice [0.0] 歴史学の原則をアーキテクチャの介入に翻訳するフレームワークであるHistoeを紹介する。
分離された検索と生成は、解釈からソースの発見を分離し、時間ウィンドウ化はソースのバランスを保った表現を強制する。
SPIEGELaggedによるこれらの介入の評価をDer Spiegel(19501979)102,189項目に適用した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:03:37 GMT)
Hierarchical Attention via Domain Decomposition [0.0] 2レベル重なり合うシュワルツ領域分解に基づく階層的注意機構を提案する。
この手法は、2レベルシュワルツ領域分解法が局所的なサブドメイン補正と大域的、長距離的な情報を伝達する粗いレベルを組み合わせるという観察によって動機づけられた。
同次ディリクレ境界条件を持つ単純な1次元拡散問題を用いて有限次元作用素学習の文脈でその有用性を検証した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:40:40 GMT)
Ghosts versus Unstable Particles in Quantum Field Theory [0.0] まず、通常の正の1粒子状態が不安定で崩壊しうるが、ゴーストは崩壊することなく生き残るという定式化を考える。
服を着たプロパゲーターの複素極は、後期にしか現れず、複素共役対となる。
本研究は, ゴースト粒子の拡散に限界がないことを裏付けるものである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:00:04 GMT)
Geometry-Aware Post-Hoc Uncertainty Quantification in Operator Learning [0.0] ニューラルネットワークのためのポストホック不確実性定量化フレームワークを提案する。
REEF-GPは、演算子の固有の座標-特徴表現を適用して、幾何学的認識の不確実性を構築する。
この結果から,ニューラルネットワークのための高精度でスケーラブルなポストホックUQが,学習した特徴空間で直接実現できることが示唆された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 04:46:17 GMT)
Gatekeepers and Hallucinations: A Layered Evaluation Framework for LLM-Driven Quantum Circuit Generation [0.0] 材料インフォームド変分量子固有解器(VQE)回路生成のための階層評価フレームワークを提案する。
5つの異なるLCM障害モード(幾何学幻覚、存在しないAPI使用、統合障害、制約違反、検証不可能な出力)を分類する。
評価プラットフォーム自身のソースコードの法医学的な監査により、サイレントフォールバック・テンプレート置換によって、ハーネスに2つの明らかなモデル障害が生じたことが確認された。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:17:54 GMT)
GOOSE-M2F: Adapting Mask2Former for High-Fidelity, Long-Tailed Fine-Grained Semantic Segmentation in Unstructured Outdoor Terrain [0.0] GOOSE 2D Fine-Grained Semantic (FGSS) Challenge at ICRA 2026。
GOOSEベンチマークは、構造化されていない屋外の地形で64の微細なクラスにまたがっており、非常に長い尾の分布を持ち、希少なクラスは画像あたり50ピクセル未満である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:06:48 GMT)
Full-state information-disturbance tradeoff for direction estimation with antiparallel spin-coherent pairs [0.0] 2つの反平行スピンに符号化された未知の方向を推定するための最適情報-ゆらぎトレードオフを決定する。
また、並列ベンチマークを定式化し、この手法の中央拡張として、任意のスピン$j$の反平行スピンコヒーレント状態を扱う。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:17:37 GMT)
From Bits to Mixed-Radix Keys: Horner Decomposition, Uniform Sampling, and the Information-Theoretic QKD Interface of the MR-OTP [0.0] 本研究では,QKD源からの生の2進エントロピーを均一な混合基数キーに変換するための,実用的でバイアスのない手法を提案する。
シングルセッションパイプラインとマルチセッションパイプラインのエンドツーエンド情報理論セキュリティを確立する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:40:49 GMT)
FllumaOne: A Code-Native Multimodal CAD Dataset with Executable Programs and Kernel-Validated Feature Histories [0.0] コードネイティブなマルチモーダルCADデータセットであるFllumaOneを紹介する。
このデータセットは、条件付きCAD再構成、実行可能プログラム、フィーチャーツリー予測、B-Rep分析、検索、設計完了、編集可能なリバースエンジニアリングをサポートする。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:09:59 GMT)
Fisher Width: A Geometric Measure of Complexity on Statistical Manifolds [0.0] 統計多様体に対するガウス幅のフィッシャー幾何学的類似であるフィッシャー幅を導入する。
パラメータポイント$$では、フィッシャー幅はユークリッド恒等式を局所計量テンソル$G()1/2$で置き換え、フィッシャー縮尺集合のガウス幅を測定する。
我々はフィッシャー幅の基本的な理論を開発し、ユークリッド基底線との濃度、メートル法安定性、スペクトル比較を含むガウス幅の重要な構造的特徴を保っていることを示した。
応用として、フィッシャー・リプシッツ仮説クラスに有界な一般化を証明し、計算可能推定器を提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 07:04:47 GMT)
Exact propagating Dirac wave packets in an attractive Coulomb-like potential [0.0] 我々はディラック方程式の正の正エネルギー、正規化可能な波束解を構築する。
1つの族は、長手プロファイルが自由シュルディンガーヘルミテ-ガウス波パケットを再現する基本関数のみを含む。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:28:45 GMT)
Exact Entanglement Dynamics Beyond Nearest-Neighbor Dual-Unitary Floquet Systems [0.0] 我々は、厳密な閉形式絡み合いのダイナミクスを持つ有限レンジ蹴りイジングモデルの解析的抽出可能な族を導入する。
我々は、常に$n-$Rényi 絡み合うエントロピーの正確な式を導き、その結果が2つの結合した部分格子の寄与の和であることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:27:31 GMT)
Evaluating the Effectiveness of LLMs in Aiding Compliance Testing of PKCS#1-v1.5 [0.0] 仕様準拠のためのバイナリプロトコルの実装をテストするには、構造的制約と意味的制約の両方を満たす入力が必要である。
本研究は, LLMに基づくコード合成と文法レベルの変異が, 仕様コンプライアンステストにおいて, より実用的で一般化可能なアプローチとして機能するかどうかを考察する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:54:57 GMT)
Evaluating Prompting-Based Defenses Against Domain-Camouflaged Injection Attacks [0.0] ドメイン・カモフラージュ・インジェクション(Domain-camouflaged Injection)攻撃(Domain-camouflaged Injection)は、検索されたコンテンツに、ドメインに適した語彙を使って悪意のある命令を埋め込む。
ドメイン・カモフラージ・インジェクションに対する5つのプロンプト・ベース・ディフェンスの評価を行った。
エージェント処理の前に検索したコンテンツをパラフレーズで表現することは、このベンチマークで最も一貫して効果的な防御である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:51:02 GMT)
Equilibration of generalized subsystems: a quantum-channel approach [0.0] 量子平衡のための共通状態レベルフレームワークを導入する。
一般化されたサブシステムは、その次元が小さいときに、廃棄された顕微鏡情報の有効次元と等しくなることを示す。
以上の結果から,量子平衡の統一的な状態レベルの定式化が可能である。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:07:34 GMT)
Engineering entanglement and transport in interacting quantum walks with tailored potentials [0.0] 粒子伝播と量子相関生成の相互作用を制御することは、量子輸送における中心的な課題である。
並列1次元格子上に進化する2つの連続時間量子ウォーカについて,距離依存電位を介して相互作用する。
本研究は,量子情報処理とシミュレーションに応用可能な相互作用工学的量子ウォークを設計するためのツールを提供する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 11:52:03 GMT)
Emergent de Sitter Space and Non-Unitary Tensor Networks from Non-Hermitian Quantum Criticality [0.0] 境界絡みからデ・ジッター時空の出現を示す。
この突発的な時空の中で、関連する測地学を分析し、それが極端に高柳表面として振る舞うことを示す。
非単項臨界エンタングルメントエントロピーの対数スケーリングを再現し、デ・シッター RT 公式のボンドカウント画像を提供する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:34:01 GMT)
Embedded Machine Learning for Microcontroller-Class Edge Devices: Data, Feature, Evaluation, and Deployment Pipelines [0.0] 本稿では,マイクロコントローラクラスプラットフォームのための組み込み機械学習ワークフローをシステム指向で構築する。
一般的な機械学習の導入でしばしば隠されるエンジニアリング上の決定に重点を置いている。
本稿では,データキュレーション,量子化,しきい値設定,スケジューリング,フィールド監視など,デバイス上での堅牢な推論のための実用的な設計規則について述べる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:22:24 GMT)
Einstein-Podolsky-Rosen correlations between mechanical oscillators revealed through SU(1,1) interferometry [0.0] 連続変数アインシュタイン-ポドルスキー-ローゼン相関の空間分離振動子間における実験的検討を行った。
この相互作用は、メカニカルSU(1,1)干渉計の実現を通じて量子相関を見極めるのに使うことができる。
本結果は,回路量子音響力学における演算のツールボックスを拡張し,エンタングルメントよりも強い量子相関がマクロシステムでも観測可能であることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:32:09 GMT)
Effects of sparsity and superposition on loss in simple autoencoders [0.0] 多意味性(Polysemanticity)は、ニューラルネットワークの機械論的解釈の難しさである。
重ね合わせ(英: superposition)は、ニューラルネットワークが低次元空間における非直交方向として特徴を区別する現象である。
本研究の貢献は, 重ね合わせの発生と最適性に関する数学的基礎を解析し, それらの発見のいくつかを厳密に裏付けることである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 23:14:24 GMT)
Discrete Autoregressive Transformer for Generative Mechanism Synthesis [0.0] 平面経路合成は、カプラ曲線が所定の軌道に一致する機構を必要とする。
前方運動学および幾何学的アライメント後のチャンファー距離と動的時間歪みを報告する。
条件付き自己回帰配列モデルとして合成を定式化する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:46:21 GMT)
Differential Privacy of Gaussian Process Posterior Sampling [0.0] ガウス過程(GP)から後部サンプルパスを放出するプライバシーについて検討する。
外部ノイズを付加する標準微分プライバシ(DP)メカニズムとは異なり、後続サンプリングは構成によってランダムである。
この本質的なランダム性は,GP後部サンプルパス解放のための明示的なRényi-DP境界を導出することによりDP保証が得られることを示す。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 14:43:16 GMT)
Designing Recommendation Exposure and Favorite Lists: A Field Experiment in a Spot-Work Platform [0.0] お気に入りリスト管理のための露出制御機構を設計する。
しきい値の許容度制御(TEC)は完全に並列化可能であり、大規模デジタルプラットフォームに適していることを示す。
都道府県レベルのランダム化フィールド実験は、アクティブテンプレート当たりの実際の一致と露出を増加させる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 01:14:40 GMT)
Designing L5: A Permacomputing Approach to Creative Coding [0.0] Processing/p5は初心者に優しいアプローチで知られており、芸術的・技術的なコミュニティに広く浸透している。
L5は、LOVEフレームワークを使用してLuaで実装された、このファミリーの新しいメンバーである。
本稿では,5つのケーススタディを通じて,L5の設計決定と持続可能性とユーザビリティの緊張関係について考察する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 20:44:41 GMT)
Demultiplexing Generalized Information via Quantum Transmission Lines [0.0] 量子デマルチプレクサ(Q-DEMUX)という量子古典デバイスを導入する。
この結果から,Q-DEMUXの強度と量子機器の不整合性との関係が明らかとなった。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:13:59 GMT)
Delta-Based Target Reformulation for Short-Term Electricity Load Forecasting Using LSTM and Transformer Models [0.0] 本稿では,ディープラーニングを用いた短期電力負荷予測のためのデルタ型目標修正について検討する。
絶対負荷値を直接予測する代わりに、提案された定式化は、連続する時間ステップ間の負荷変化を予測するためにモデルを訓練する。
その結果,デルタ・ベース・リフォーメーションは時間差予測の予測精度を常に向上させることがわかった。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:01:44 GMT)
Darshana Graph: A Parallel Commentary Corpus for Comparative Indian Philosophy, with Stylometric and Exploratory Graph Analyses [0.0] ダルシャナグラフ (Darshana Graph) は、ヒンドゥー教、仏教、ジャイナ教の哲学的伝統にまたがる125,000以上のテキスト記録のコーパスである。
その独特な貢献は、約8,500のヒンドゥー教とジャイナ教の記録の、構造的に独特な部分であり、同じ根本詩や経典が18の歴史的コメンテーターの間で並んだものである。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:49:15 GMT)
Credibility-Weighted Pricing of Autonomous Vehicle Liability Under Operational Design Domain Shift [0.0] 我々は,学習されたODD類似カーネルを介して,都市,ソフトウェアバージョン,領域をまたがる階層的ベイズ信頼性フレームワークを提案する。
パワー分析は、学習したカーネルの利点が、約12のデプロイされた都市で検出可能であることを示している。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:09:46 GMT)
Creating squeezed and non-classical collective motional many-body states through stroboscopic Rydberg dressing [0.0] 我々は中性原子の配列に基づく量子コンピューティングプラットフォームを提案する。
我々のアプローチは、原子運動と分光的に励起されたRydberg状態のカップリングを利用する。
これにより、原子間変位に対応するモードをまとめて絞り、運動真空状態のごく一部までの距離変動を低減することができる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:16:52 GMT)
Continuous-time Optimal Stopping through Deep Reinforcement Learning [0.0] 最適停止問題に対するシミュレーションに基づく解法は停止決定を識別しなければならない。
我々は、任意の時間分解能で運動規則を学習できる新しい強化学習型アルゴリズムを開発した。
我々のCARLOSアルゴリズムは、集約型ディープニューラルネットワーク(ADNN)を用いて、共同で時空決定境界を学習する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:49:43 GMT)
Continual Online Personalization of Exoskeleton Control via Manifold-Aware Experience Replay [0.0] エキソ骨格制御のパーソナライズは、歩行障害のある臨床ユーザーにとって依然として重要な課題である。
オンライン適応(OA)は、主題の可変性、デバイス適合性、多様な移動タスクにリアルタイムで適応することで、効果的なソリューションを提供する。
そこで我々は,ユーザ固有の表現を維持するためにデザインされた,多様体対応のリプレイ型オンラインパーソナライズフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 03:17:49 GMT)
Compositional Skill Routing for LLM Agents: Decompose, Retrieve, and Compose [0.0] LLMタスクデコンポスタ、FAISSインデックス付きバイエンコーダスキルレトリバー、依存性対応DAGプランナを組み合わせた分解・検索・構成フレームワークであるSkillWeaverを提案する。
SkillWeaverはコンテキストウィンドウの消費を99%以上削減し,転送実験により一般化を確認した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:27:55 GMT)
Closest Accessible Symmetry reduction: a tool for Hamiltonian interpolation analysis [0.0] パラメータの判別に大きく依存することなく、ハミルトンのスペクトルを分析するための枠組みを導入する。
この表現は、量子相転移の定性的なシグネチャをキャプチャすることを示す。
アディアバティックな量子計算によってスピリチュアルに動機づけられたものの、我々のアプローチはハミルトン位相図の研究に広く適用されている。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 16:59:49 GMT)
Clay-CNN Hybrids: Leveraging Geospatial Foundation Models as Auxiliary Context for Landslide Detection [0.0] 本研究では,Geospatial Foundation Model (GFM) である Clay v1.5 が Landslide4Sense ベンチマークでピクセルレベルの地すべりセグメンテーションを改善することができるかどうかを評価する。
主要なエンコーダとしてのClay,ボトルネック時にClayの意味コンテキストを付加したU-Netバックボーン,標準のU-Netベースラインの3つの戦略を比較した。
2段階の低ランク適応(LoRA)を用いたハイブリッドU-Net + Clayモデルでは,3種に対して64.5+/-1.8%のF1が得られた。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:01:09 GMT)
Characterization of nested Walsh parity-check filters in a single-photon eight-mode register on a cloud photonic processor [0.0] 我々は,Quandelaのクラウドフォトニクスプロセッサに実装された2つのネストしたWalshパリティチェックフィルタを特徴付ける。
340,000以上の検出で、中立な入力は、残余のDCポートリークが0.02%$-$1.1%$であることを示している。
セクター保存のユニタリコアは、1から3つのアプリケーションに対して、非中立的な制御よりもはるかに低いリークを保持する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:01:47 GMT)
Chaos from quantum bath fluctuations [0.0] 量子ノイズはフラクタル次元と正のリャプノフ指数を持つ奇妙な誘引子を生成できることを示す。
我々は最近数学コミュニティで開発されたせん断誘起カオスとの深い関係を明らかにした。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 18:00:01 GMT)
Cavity-enhanced superconducting response in an underdoped cuprate [0.0] 弱められた銅酸化物では、超伝導の揺らぎは、地球のコヒーレンスが失われる温度以上で生き残ることができる。
超伝導体の電磁環境を工学的に検討することにより,超伝導コヒーレンスを安定化できるかどうかを検討した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:46:56 GMT)
Broadband High-Level Squeezed Light using Waveguide Optical Parametric Amplifiers with External Dispersion Compensation [0.0] ブロードバンドシステムでは、群速度分散(GVD)がスクイーズ軸の周波数依存性の回転を誘導する。
我々は2つのOPA間の外部分散補償を導入し、広帯域での二次回転を抑制する。
本研究は,超高速連続可変量子情報処理に向けた重要なステップとして,圧縮光のブロードバンド特性評価のための実用的手法を確立した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 02:07:58 GMT)
Bridging the Usability Gap: Lessons from Interpreting Studies for Machine Interpreting Design [0.0] 機械解釈(英: Machine Interpreting、MI)は、音声翻訳のリアルタイムな応用である。
しかし、ユーザエクスペリエンスはインタープリタ経由の通信よりもはるかに劣っている。
本稿では、MIを音声翻訳の異なるサブフィールドとして定義する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 12:53:59 GMT)
Blind Recovery of Latent Domains via Unsupervised Symmetry Discovery [0.0] 本稿では,データ分布の対称性を発見することによって,潜在領域と信号の復元を行う,教師なしのフレームワークを提案する。
我々のフレームワークは、潜在ランダムフィールドからサンプリングされた信号の線形測定として観測をモデル化する。
実験により、この手法は非構造観測から潜伏領域と信号を復元することを示した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 10:58:51 GMT)
Bayesian Nonparametric Detection of Anomalies in Multivariate Functional Data [0.0] 機能データの異常は、支配的なデータ生成メカニズムから逸脱する稀なプロセスまたは別個のプロセスから生じる。
我々は,多出力ガウス過程の無限混合として,有限かつ自動的に決定される混合成分の数をモデル化する。
このモデルでは、異常な観測は、異常の数や性質を事前に指定することなく、小さな混合成分に割り当てられる。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 19:07:48 GMT)
Architectural Bias in Face Presentation Attack Detection: A Comparative Study of Vision Transformers and Convolutional Neural Networks [0.0] Face Presentation Detection (PAD) システムは生体認証において重要なセキュリティ層を構成する。
PADシステムは、人口集団間での系統的なパフォーマンス格差を示し、より暗い肌のトーンを持つ個人に不均等に影響を及ぼす。
本稿では,視覚トランスフォーマーアーキテクチャが PAD システムにおける人口統計バイアスを減少させるかどうかを比較検討する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 22:00:27 GMT)
Approximately Decoding the Colour Code [0.0] 近年, (6.6.6) 色符号の最小重み復号化はNPハードであることが判明した。
本稿では,最小ウェイト復号を任意の時間で近似することが可能であることを証明した。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 15:10:22 GMT)
An AI Security Agent for Banking: Multi-Vector Fraud and AML Detection Across Retail and Corporate Accounts [0.0] 銀行は同時に署名に基づく詐欺と行動的金融犯罪に直面している。
ブルートフォースや高速なイベントを確実にキャッチする静的ルールエンジンは、ビジネスメールの妥協に対して構造的に盲目である。
本稿では,このギャップに対処する小売・コーポレートバンキングのためのAIセキュリティエージェントを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 05:58:40 GMT)
A Multi-Level Architecture for Reusable Materials Ontologies -- The OntoCrafter Ceramics Ontology (OCO) as Reference Implementation [0.0] オントロジーは複数の軸に沿って同時に断片化される。
EUの規制は、材料、製造、サプライチェーン、ライフサイクルデータを統合されたデジタル製品パスポートに強制する。
2つの独立した分類軸を持つ多層モジュラーアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 09:42:12 GMT)
A Lindbladian for holographic Brownian motion [0.0] 我々は、高温状態におけるホログラフィックブラウン運動のリンドブラディアン記述を導出した。
位相空間モーメント、エネルギー緩和、定常状態の時間進化を分析する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 13:32:23 GMT)
A Diffusion Approximation for Temporal-Difference Learning with Linear Features under Markovian Noise [0.0] マルコフ雑音下で線形TD(0)に対する微分方程式(SDE)近似を導入する。
結果として得られるモデルは、射影されたベルマン作用素が支配する力学とマルコフサンプリングの影響を区別する。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:16:52 GMT)
A Convex Quasilinearization Method for Solving Nonlinear PDEs with Physics-Informed Neural Networks [0.0] 非線形偏微分方程式(PDE)の前方解の数値解法を提案する。
この方法であるLiL-Qは、7つのベンチマークで評価され(平面ひずみ弾性と2次元および3次元の非圧縮性ナビエ・ストークス方程式)、不均一な透水性を持つ定常流を含む。
論文参考訳(メタデータ) (Tue, 16 Jun 2026 17:09:59 GMT)