AutoResearchClaw: Self-Reinforcing Autonomous Research with Human-AI Collaboration [175.3] 提案するAutoResearchClawは,5つのメカニズムに基づいて構築されたマルチエージェント自律型研究パイプラインである。
25トピックの実験ステージベンチマークであるARC-Benchでは、AutoResearchClawがAI Scientist v2を54.7%上回っている。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:49:51 GMT)
CHI-Bench: Can AI Agents Automate End-to-End, Long-Horizon, Policy-Rich Healthcare Workflows? [150.8] 現実的な医療業務のエンドツーエンドの自動化は、現在のベンチマークで不足している3つの機能を強調します。
$-Benchは3つのドメインにわたる長期医療のベンチマークである。
30以上のエージェントハーネス/モデル構成で、最高のエージェントはタスクの28.0%しか解決せず、厳格なパス3では20%をクリアし、単一のセッションですべてのタスクを実行するとパフォーマンスは3.8%に低下する。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:51:20 GMT)
ConceptSeg-R1: Segment Any Concept via Meta-Reinforcement Learning [134.6] プロンプト可能なセグメンテーションの最近の進歩は、視覚知覚をオブジェクトレベルのローカライゼーションから概念レベルの理解へとシフトさせてきた。
我々は文脈非依存(CI)、文脈依存(CD)、文脈推論(CR)の概念からなる3段階の分類によって概念セグメンテーションを定式化する。
本稿では,概念セグメンテーションをルール誘発概念基盤として再構成する統合フレームワークであるConceptSeg-R1を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:35:38 GMT)
WorldParticle: Unified Simulation of Lagrangian Particle Dynamics via Transformer [107.4] 本研究では, 単一トランスアーキテクチャ上に構築された学習型粒子シミュレータを用いて, 布, 弾性体, ニュートン流体, ニュートン流体, 粒状物質, 分子動力学をモデル化する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:08:14 GMT)
Reinforcing Human Behavior Simulation via Verbal Feedback [105.7] 本稿では,言語フィードバックを強化学習の第一級信号として扱うことによって訓練したモデルであるDITTOを提案する。
また、心の理論、キャラクターロールプレイ、社会的スキル、学習者シミュレーション、ユーザシミュレーション、ペルソナシミュレーションの6つのカテゴリにまたがる10のタスクにまたがる統合ベンチマークとトレーニングデータスイートであるSOULを紹介した。
DitTOはベースモデルに対して平均36%の改善を達成し、10のSOULベンチマークでGPT-5.4を上回った。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:23:24 GMT)
Beyond Binary Success: A Diagnostic Meta-Evaluation Framework for Fine-Grained Manipulation [98.8] 診断メタ評価フレームワークであるMetaFineを紹介する。
局所的な空間構造を保存できる視覚エンコーダの能力は,きめ細かな精度の鍵となるボトルネックである。
評価をランキングから診断にシフトすることで、MetaFineは、ベンチマークを実際の物理デキスタリティに基づく階層化された能力の修復のための実行可能なコンパスに変換する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:25:13 GMT)
optimize_anything: A Universal API for Optimizing any Text Parameter [98.4] 単一タスク検索をサポートする1つのAIベースの最適化システム、クロスプロブレム転送によるマルチタスク検索、および目に見えない入力への一般化を示す。
LLMに基づく検索によるテキストの最適化は汎用的な問題解決パラダイムであることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:18:12 GMT)
CriterAlign: Criterion-Centric Rationale Alignment for Code Preference Judging [95.0] 本稿では,一対の選好評価にルーブリックに基づく判断を適応させる基準中心のフレームワークを提案する。
BigCodeRewardでは、CriterAlignはQwen2.5-VL-32Bモノリシック判事を60.4%から66.3%に改善した。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:59:19 GMT)
PixVerve: Advancing Native UHR Image Generation to 100MP with a Large-Scale High-Quality Dataset [93.7] テキスト・ツー・イメージ(T2I)モデルは、最近1Kと2Kの解像度で顕著な進歩を遂げている。
超高分解能(UHR)画像生成は、高分解能コンテンツの不足と複雑さのために大きな課題となる。
PixVerve-95Kは、慎重に設計されたデータパイプラインでキュレートされた高品質でオープンソースのUHR T2Iデータセットである。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:35:09 GMT)
ParaVT: Taming the Tool Prior Paradox for Parallel Tool Use in Agentic Video Reinforcement Learning [91.5] 我々はParaVTを紹介した。ParaVTは、Parallel Video Tool呼び出しのための、最初のマルチエージェントのエンドツーエンドRLトレーニングフレームワークである。
ParaVTはQwen3-VLベースラインを平均で+7.9%改善し、PARA-GRPOはトレーニングタイムのフォーマット準拠を0.13から0.64に引き上げた。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:01:26 GMT)
Rethinking How to Remember: Beyond Atomic Facts in Lifelong LLM Agent Memory [88.8] LLMエージェントは、蓄積された対話履歴を忠実に保存し、効率的に検索し、深く推論できるメモリシステムを必要とする。
本稿では,ソース識別子に固定された生の対話セグメントを含む3つの共存表現の粒度を格納するTriMemを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:05:06 GMT)
MSAVBench: Towards Comprehensive and Reliable Evaluation of Multi-Shot Audio-Video Generation [88.8] マルチショットオーディオビデオ生成のための,初の総合的なベンチマークと適応型ハイブリッド評価フレームワークであるMSAVBenchを紹介する。
私たちのベンチマークでは、ビデオ、オーディオ、ショット、参照の4つの重要な領域にまたがっており、多様なタスク設定、最大15のショット数、非現実的なシナリオに挑戦しています。
MSAVBenchは人間の判断と高度に一致し、スピアマンのランク相関は91.5%に達する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:59:33 GMT)
LongLive-2.0: An NVFP4 Parallel Infrastructure for Long Video Generation [84.9] LongLive-2.0は、長いビデオ生成の完全なトレーニングと推論ワークフロー全体を通じて、NVFP4ベースの並列インフラストラクチャである。
トレーニングには,quence-parallel autoregressive (AR) トレーニングを導入する。
実験ではトレーニングで2.15倍、推論で1.84倍のスピードアップを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:46:12 GMT)
Beyond Extrapolation: Knowledge Utilization Paradigm with Bidirectional Inspiration for Time Series Forecasting [81.4] KUP-BIは、エンファントレインのみの歴史図書館から継続スタイルの知識を抽出する新しい時系列モデリングパラダイムである。
最新モデルの予測性能を継続的に改善し、オーバーヘッドを小さくする。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:43:00 GMT)
When Tabular Foundation Models Meet Strategic Tabular Data: A Prior Alignment Approach [80.2] 事前学習型事前データ適合ネットワーク(PFN)に基づくタブラル基礎モデル
戦略的操作は、事前訓練中に学んだ非戦略的事前学習と後管理的戦略的事前学習のミスマッチを生じさせることを示す。
推論時戦略対応フレームワークであるtextbfStrategic Prior-data Fitted Networktextit(SPN)を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:55:35 GMT)
Music of Changing Lines: Toward a Culturally Situated Approach to the I-Ching [78.7] チェンジラインの音楽は、中立的なランダム化ではなく、意味を持つフレームワークとして、I-Chingを再中心としている。
ユーザーはウェン・ワンファのコイン鋳造を行い、確率的音楽プロセスを通じてリアルタイムで同行する。
結果として得られるヘキサグラムと行の変化は、ユーザの問い合わせに関連して、大きな言語モデルであるGeminiによって解釈される。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:35:47 GMT)
Mega-ASR: Towards In-the-wild^2 Speech Recognition via Scaling up Real-world Acoustic Simulation [78.4] Mega-ASRは、スケーラブルな複合データ構築とプログレッシブ・アコースティック・ツー・セマンティック・最適化を組み合わせる。
我々は,Mega-ASRが従来の最先端システムに対して,悪条件ASRベンチマークにおいて大きな優位性を発揮することを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:26:51 GMT)
Mix-Quant: Quantized Prefilling, Precise Decoding for Agentic LLMs [78.0] 高速エージェント推論のための簡易かつ効果的な位相認識量子化フレームワークであるMix-Quantを提案する。
我々は,Mix-Quantがタスク性能を保ち,高い効率向上を実現し,プリフィル時に最大3倍の高速化を実現していることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:50:17 GMT)
Stitched Value Model for Diffusion Alignment [76.5] 拡散またはフローベースの生成モデルは、即興の忠実さや美的嗜好など、タスク固有の報酬と整合していなければならない。
本稿では、クリーンな画像のために事前訓練された報酬モデルをノイズの多い潜伏状態に効率的に転送するモデル縫合フレームワークであるStitchVMを提案する。
提案手法は,下流のステアリングおよびポストトレーニング手法の幅広い改善をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:02:50 GMT)
STABLE: Simulation-Ready Tabletop Layout Generation via a Semantics-Physics Dual System [76.4] シミュレーション可能なテーブルトップシーン生成に適したセマンティックスと物理の二重システムであるSTABLEを提案する。
STABLEはセマンティック共振器と物理共振器の2つの相補的なモジュールで構成されている。
実験により、STABLEはタスク命令に厳密に準拠するシミュレーション可能なテーブルトップシーンを生成することができた。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:51:08 GMT)
Seeing Together: Multi-Robot Cooperative Egocentric Spatial Reasoning with Multimodal Large Language Models [76.3] 本研究では, きめ細かい協調的空間推論のための枠組みを提案する。
SP-CoRは、動的に認識されるマルチロボットフレームサンプリング、スペクトルおよび物理誘導型ビューフュージョン、および物理に整合した即時蒸留を組み合わせた。
ハビタットでは+3.87%、iGibsonでは+7.12%、微調整ベースラインでは+3.87%である。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:12:41 GMT)
Argus: Evidence Assembly for Scalable Deep Research Agents [74.0] 本研究では,探索者とナビゲータが協力して,補完的な証拠からジグソーを組み立てるシステムを提案する。
我々は、強化学習でナビゲータを訓練し、検証、ディスパッチ、合成を行いながら、検索者が標準のReActエージェントのままでいられるように独立に訓練する。
サーチとナビゲータは35B-A3B MoEのバックボーン上に構築されており、Argusは1つのサーチと12.7ポイントの並列サーチと8つのベンチマークで5.5ポイントを獲得している。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:32:31 GMT)
What Really Improves Mathematical Reasoning: Structured Reasoning Signals Beyond Pure Code [73.0] ドメイン分離のきめ細かい10T-tokenコーパスにおける事前学習の制御実験により,コードが推論を改善するという主張を再考する。
コードはプログラミング能力を大幅に改善するが、一般的な推論エンハンサーとして機能しない。
コード-テキストと数学-テキストの混合のようなドメイン間構造的推論トレースがよりうまく説明されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:37:01 GMT)
Towards Camera-Robust 3D Localization: Equation-Anchored Tool-Use for MLLMs [72.9] MLLM(Multimodal Large Language Models)における3次元ローカライゼーションは、カメラ固有の曖昧さによって制限される。
本稿では,空間ツールを式変数として再活用する,等式対応型ツール利用フレームワークを提案する。
提案手法は,RGBのみのベースラインとツール拡張ベースラインよりも優れており,カメラがトレーニングスケールから最も逸脱する点において,大きな効果がある。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:30:21 GMT)
Vision-OPD: Learning to See Fine Details for Multimodal LLMs via On-Policy Self-Distillation [71.9] MLLM(Multimodal Large Language Models)は、細かな視覚的理解に苦慮している。
地域間自己蒸留フレームワークであるビジョンOPD(Vision On-Policy Distillation)を提案する。
Vision-OPDは同じMLLMから2つの条件ポリシーをインスタンス化する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:29:04 GMT)
What and When to Distill: Selective Hindsight Distillation for Multi-Turn Agents [70.7] 強化学習は、緩やかなタスク報酬からLLMエージェントを訓練することができるが、長期的なクレジット割り当ては依然として困難である。
既存の方法は、ステップごとの環境フィードバックを完全に活用することなく、軌道レベルの報酬やプロキシ信号に依存している。
環境重み付け学習フレームワークであるSERLを紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:00:55 GMT)
CPC-VAR:Continual Personalized and Compositional Generation in Visual Autoregressive Models [69.9] VAR(Visual Autoregressive)モデルは、テキスト・ツー・イメージ生成の効率的なパラダイムとして登場した。
既存のVARベースのパーソナライズ方法は、進化するユーザ要求に対応できない。
VARモデルにおける連続的パーソナライズ生成に関する最初の体系的研究について述べる。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:18:15 GMT)
Beyond Mode Collapse: Distribution Matching for Diverse Reasoning [69.9] GRPOのようなオンライン強化学習手法はモード崩壊に悩まされる。
このことは、逆KL最小化のモード探索行動に由来することを示す。
KL最小化の原理的近似によりモード崩壊を防止するDMPOを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:13:00 GMT)
SceneCode: Executable World Programs for Editable Indoor Scenes with Articulated Objects [69.2] 室内シーンの合成は、AI、ロボット操作、シミュレーションベースのポリシー評価を具体化する。
既存のパイプラインは、生成されたコンテンツを静的メッシュとして表現し、キュレートされたアセットライブラリからのみ調音を継承する。
我々は、自然言語プロンプトを実行可能なコード駆動屋内世界にコンパイルするフレームワークであるSceneCodeを紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:31:04 GMT)
LLMEval-Logic: A Solver-Verified Chinese Benchmark for Logical Reasoning of LLMs with Adversarial Hardening [69.1] 現実的な状況シナリオから構築した中国の論理的推論ベンチマークLLMEval-Logicを提案する。
パイプラインのフォワードオーサとエキスパート-オーディット 自然言語アイテムは、参照の形式化とともに、Z3による注釈付き回答を検証し、自然言語から形式へのグレーディングのためのエキスパートルーブリックを構築し、クローズドループの逆行ワークフローを通じて選択されたアイテムを硬化させる。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:40:29 GMT)
MINTEval: Evaluating Memory under Multi-Target Interference in Long-Horizon Agent Systems [69.1] 本研究では,現在の記憶増強剤が現実的,干渉重大,長期的設定において果たす役割について検討する。
MINTEvalは、頻繁に更新される情報を備えた、長く高度に相互接続されたコンテキストを特徴とするベンチマークである。
MINTEvalは128.8kのトークンを平均で1インスタンスあたり1.8Mのトークンに拡張し、15.6kの質問応答ペアを持つ。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:05:55 GMT)
DetectRL-X: Towards Reliable Multilingual and Real-World LLM-Generated Text Detection [68.9] 本研究では8次元の先進検出器を評価するためのベンチマークであるTreatorRL-Xを紹介する。
このベンチマークは、商業的文脈で一般的に使用される8つの言語を含み、誤用を受けやすい6つのドメインから人書きのテキストを収集する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:31:23 GMT)
Base Models Look Human To AI Detectors [68.8] ベースモデルから生成されたテキストは圧倒的に人間的であると判断されることが多いが、命令で調整されたテキストはそうではない。
提案するHumanization by Iterative Paraphrasing (HIP)は,ベースモデルをパラフラザーに最小限微調整し,反復的に適用する検出器非依存パイプラインである。
以上の結果から,現在の検出器は,機械生成テキストの概念よりも,命令チューニングやローカルコンテキストのアーティファクトを追跡していることが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:13:12 GMT)
From Seeing to Thinking: Decoupling Perception and Reasoning Improves Post-Training of Vision-Language Models [67.0] 視覚言語モデル(VLM)における知覚と推論の相互作用について、3つの異なる訓練段階に分解して検討する。
提案手法を用いてトレーニングしたモデルでは,20.8%の精度で推論精度が1.5%向上した。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:58:40 GMT)
When Preference Labels Fall Short: Aligning Diffusion Models from Real Data [65.8] 選好アライメントは、選好サンプルと非選好サンプルの比較から学習することで生成モデルを導くことを目的としている。
既存のアプローチのほとんどは、モデル生成画像から構築された選好ペアに依存している。
我々は、実際のデータが優先調整のための代替の監督源として機能するかどうかを考察する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:35:11 GMT)
Benchmarking and Evolving Reason-Reflect-Rectify for Reflective Visual Generation [65.7] マルチラウンド・リフレクティブ・ビジュアル・ジェネレーション(RVG)を実現するためのコア・フレームワークとしてReason-Reflect-Rectify(R3)ループを形式化する。
R3-Benchは600以上のエキスパートアノテーション付きインスタンスのベンチマークで、反復的推論と修正機能を定量化します。
実験の結果、R3-RefinerはR3-Benchを大幅に改善した。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:24:31 GMT)
CogOmniControl: Reasoning-Driven Controllable Video Generation via Creative Intent Cognition [64.4] 我々は、制御可能なビデオ生成を創造的な意図認識と生成に分解する推論駆動フレームワークであるCag OmniControlを紹介する。
具体的には,アニメ制作データを用いて,特殊なCagVLMを訓練する。
一般的なVLMと比較すると、よりプロ的で明確な出力を生成し、スパースや抽象的な条件からユーザの創造的意図を正確に認識する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:29:33 GMT)
ALSO: Adversarial Online Strategy Optimization for Social Agents [63.8] 社会シミュレーションにおけるオンライン戦略最適化のための最初のフレームワークとしてtextbfALSO (textbfAdrial ontextbfLine textbfStrategy textbfOptimization) を提案する。
ALSOは、スタティック・ペルソナとダイナミック・ストラテジー・インストラクションの組み合わせをアームとして扱う対向バンドイット問題として、マルチターンインタラクションを定式化する。
また、相互作用履歴から報酬を予測する軽量なニューラルサロゲートを導入し、サンプル効率の高い探索と継続的なオンライン適応を可能にしている。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:16:22 GMT)
DEL: Digit Entropy Loss for Numerical Learning of Large Language Models [63.4] 数値予測は、数学的な問題解決とコード生成において、大きな言語モデル(LLM)の基本的な能力である。
自己回帰型数値学習のためのDEL(Digit Entropy Loss)を提案する。
我々の定式化は整数、十進点、十進点を組み込むことができ、学習対象を1桁から浮動小数点数領域に拡張することができる。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:18:59 GMT)
Taming the Thinker: Conditional Entropy Shaping for Adaptive LLM Reasoning [63.4] Conditional Entropy Shaping (CES)はトークンレベルの応答エントロピーを動的に制御するフレームワークである。
CESは、DAPOに対する応答長を減少させながら、平均精度を継続的に改善する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:41:51 GMT)
SciCustom: A Framework for Custom Evaluation of Scientific Capabilities in Large Language Models [63.4] 大規模言語モデル(LLM)は、科学研究にますます応用されているが、既存の評価は、実際に必要とされる詳細な能力の反映に失敗することが多い。
この問題に対処するため、SciCustomという新しいフレームワークを提案する。
大規模な科学的データからベンチマークのカスタム構築を可能にし、LLMの応用固有の科学的能力を評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:41:43 GMT)
OpenCompass: A Universal Evaluation Platform for Large Language Models [62.6] 汎用大規模言語モデル (LLM) は, 技術の進歩において重要なリンクとなっている。
メインストリームベンチマークデータセットは、タスクタイプの多様性、一貫性のない評価基準、データと処理の断片化といった課題に直面している。
本稿では,ワンストップ,スケーラブル,高精度な汎用評価プラットフォームであるOpen LLMをオープンソースとして提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:50:11 GMT)
MAPLE: Latent Multi-Agent Play for End-to-End Autonomous Driving [62.4] 視覚言語-アクション(VLA)モデルは、エンドツーエンドのモーションプランナーとして有効であるが、クローズドループ設定で評価すると不安定である。
本稿では, VLAモデルの潜在空間における動的駆動シナリオの, リアクティブでマルチエージェントなロールアウトのための新しいフレームワークMAPLEを提案する。
MAPLEはBench2Driveで最先端の駆動性能を実現し、堅牢なE2E自動運転システムのためのスケーラブルでクローズループなマルチエージェントプレイを実演する。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:20:07 GMT)
World-Ego Modeling for Long-Horizon Evolution in Hybrid Embodied Tasks [62.4] emphWorld-Ego Modelingは、未来の世界とエゴコンポーネントへの進化を分解する新しい概念パラダイムである。
我々は、このパラダイムを、暗黙の分離したワールド・エゴ・プランナーとカスケード・パラレル・ミックス・オブ・エキスパート(CP-MoE)拡散生成器を結合した統一的な世界モデルであるワールド・エゴ・モデル(WEM)としてインスタンス化する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:10:27 GMT)
Weasel: Out-of-Domain Generalization for Web Agents via Importance-Diversity Data Selection [62.1] Weaselは、Webエージェントのオフライントレーニングのための軌道選択方法である。
トレーニングコストを削減しつつ、ドメイン外のパフォーマンスを改善し、標準的な微調整よりも約9.7-12.5$timesのトレーニングスピードアップを実現しています。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:19:01 GMT)
Smooth Partial Lotteries for Stable Randomized Selection [61.9] 多くの組織では、評価スコアに基づいて選択をランダム化する部分的な宝くじを採用している。
既存の抽選デザインは本質的に不安定であり、単一の候補のスコアへの小さな変更は、選択確率の大きな変化を引き起こす可能性がある。
部分的な宝くじの設計原理として滑らかさを提案し、候補に対するレビュースコアから選択確率へのマッピングにおいて、リプシッツ条件として定式化する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:22:51 GMT)
Density-Ratio Losses for Post-Hoc Learning to Defer [61.8] 理想分布のレンズを用いて,ポストホック学習からデファー(L2D)までの研究を行った。
モデルと専門家のイデアルの間の密度比を通じて、deferralを定義します。
次に、ディフェラル決定はスコアを閾値付けすることで行われ、deferral rateは再トレーニングせずに調整される。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:56:23 GMT)
SWEET: Sparse World Modeling with Image Editing for Embodied Task Execution [61.6] 画像編集モデルがロボット操作のための疎視世界モデルとして機能するかどうかを考察する。
本稿では,一括予測型視覚計画フレームワークSWEETを提案する。
DROIDとRoboMimicの実験では、SWEETは見知らぬシーンの予測を改善している。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:54:46 GMT)
ST-TGExplainer: Disentangling Stability and Transition Patterns for Temporal GNN Interpretability [61.5] 時間グラフニューラルネットワーク(TGNN)は,実世界の時間グラフタスクを解く上で大きな注目を集めている。
TGNNは、どの歴史的相互作用が与えられた予測に最も影響するかを特定することができない。
時間グラフの安定性と遷移パターンを乱す自己説明可能なTGNNであるST-TGExplainerを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:16:22 GMT)
CAMERA: Adapting to Semantic Camouflage in Unsupervised Text-Attributed Graph Fraud Detection [59.7] 非教師型TAGFDのためのケース適応型マルチキューエキスパートFRAmework(CAMERA)を提案する。
文脈インフォームドゲーティングモデルを導入し,エゴノード表現とその近傍コンテキストを共同で検討する。
4つの挑戦的なデータセットの実験は、CAMERAが一貫してライバルを上回っていることを示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:54:09 GMT)
WBCAtt+: Fine-Grained Pixel-Level Morphological Annotations for White Blood Cell Images [59.4] WBCAtt+は、11のモルフォロジー特性と5つのピクセルレベルの細胞成分を高密度に付加したWBC画像の新しいデータセットである。
113kのイメージレベルラベルと10kのセグメンテーションマップを持つWBCAtt+は、WBCイメージに対する包括的なアノテーションを初めて提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:25:25 GMT)
VGGT-Edit: Feed-forward Native 3D Scene Editing with Residual Field Prediction [59.3] VGGT-Editはテキスト条件のネイティブ3Dシーン編集のためのフィードフォワードフレームワークである。
本研究では,奥行き同期テキストインジェクションを導入し,意味的指導をバックボーンの空間的ポーズと整合させる。
VGGT-Editは2Dリフトベースラインを大幅に上回り、よりシャープなオブジェクトの詳細、より強力なマルチビュー一貫性、ほぼインスタントな推論速度を生み出している。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:07:48 GMT)
Efficient Long-Context Modeling in Diffusion Language Models via Block Approximate Sparse Attention [58.5] Diffusion Language Models (DLM) は、グローバルコヒーレント、双方向、および制御可能なテキスト生成を可能にする。
既存の多くのブロックスパースアテンション手法は、高分解能アテンション空間上の固定サンプリングパターンによってブロックを選択する。
本稿では,ブロックワイド事前サンプリング操作によるBA-Att(Block Approximate Sparse Attention framework)を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:01:13 GMT)
OmniISR: A Unified Framework for Centralized and Federated Learning via Intermediate Supervision and Regularization [58.0] 我々は、純粋なCL、純粋なFL、ハイブリッドCL-FLトレーニングモードを融合する統合フレームワークであるOmniISRを提案する。
我々は,OmniISRが集中型パラダイムとフェデレーション型パラダイムの両方において,モデル性能を一貫して改善していることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:13:27 GMT)
Retrieval-Augmented Linguistic Calibration [57.4] 我々は,言語的信頼度を,文が正しいと認識される確率値の分布としてモデル化する。
Retrieval-Augmented Linguistic truth (RALC)は、信頼性信号を自然言語に伝達する軽量なポストホックパイプラインである。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:31:38 GMT)
Aero-World: Action-Conditioned Aerial Video Generation from Inertial Controls [57.2] 我々は,事前学習した画像から映像への拡散モデルを制御可能な空中ビデオ生成装置に変換する方法であるtextbfAero-World を提案する。
実ビデオ-IMUペアで独立して訓練された冷凍潜伏空間物理学プローブは、LoRA微調整中に慣性・一貫性の異なる監視を提供する。
AeroBenchでは、アクションのみの微調整で平均AASを57.7から63.6に改善し、AirScapeよりも優れた品質制御トレードオフを提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:02:17 GMT)
Latent Action Reparameterization for Efficient Agent Inference [56.4] 本稿では,複数のステップのセマンティックな振る舞いに対応する,コンパクトな潜在行動空間を学習するフレームワークを提案する。
手作りのマクロや階層型コントローラとは異なり、潜在動作はエージェントの軌跡から学習され、モデルに直接統合される。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:38:49 GMT)
Minimax Optimal Variance-Aware Regret Bounds for Multinomial Logistic MDPs [56.3] 既存のマルコフ決定過程のアルゴリズムは、$smashtildeO(dH2sqrtT)$を後悔する。
本稿では,最悪の場合において既存の境界を復元し,構造化されたMDPに対して改善する,$smashtildeO(dH2bar_TsqrtT)$の後悔を実現するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:39:32 GMT)
AffectVerse: Emotional World Models for Multimodal Affective Computing [56.1] AffectVerseは、短時間の潜伏感情予測のためのアクションフリー表現レベルモジュールである。
EWMには3つのモジュールが含まれている。 1) クロスモーダルなテンポラル・イマジネーションは、複数ステップのロールアウトで過去のトークンから将来のビデオ/オーディオ表現を予測する。
EWMは想像されたトークンをモダリティ対応の信仰トークンに圧縮する。
これらの結果は、予測的信念状態モデリングが感情コンピューティングの実用的な代替手段であることを示唆している。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:05:00 GMT)
Investigating Cross-Modal Skill Injection: Scenarios, Methods, and Hyperparameters [56.1] クロスモーダルスキルインジェクションは、ドメインエキスパートLEMをビジョンランゲージモデル(VLM)に統合することにより、創発的クロスモーダル能力を誘導することを目的としている。
シナリオでは、クロスモーダルなスキルインジェクションは一般的に命令追従や言語間セッティングにおいてよく機能するが、数学的推論では困難である。
提案手法では,TAやDAREといった古典的手法が,代替マージ手法よりも優れた性能を実現している。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:24:19 GMT)
LC-ERD: Mining Latent Logic for Self-Evolving Reasoning via Consistency-Regulated Reward Decomposition [55.6] 本稿では, LC-ERD (Logic-Consistent Endogenous Reward Decomposition) を紹介する。
モデルの潜在論理エキスパートズ(Latent Logic Expertise)からのコンセンサスを集約することで、変分論理ポテンシャルを導出する。
LC-ERDは、論理の一貫性と正確性の間のトレードオフを明らかにする、堅牢な自己進化パスを提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:27:50 GMT)
GeoMamba: A Geometry-driven MambaVision Framework and Dataset for Fine-grained Optical-SAR Object Retrieval [54.7] GeoMambaは光学SAR微細検索のための幾何学駆動フレームワークである。
GFIモジュールは、クロスモーダルな機能相互作用を強化し、構造的な事前を組み込む。
GeoMambaは既存の手法を上回り、全検索環境で63.3% mAPと77.0% Rank-1の精度を達成した。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:08:09 GMT)
GoTTA be Diverse: Rethinking Memory Policies for Test-Time Adaptation [54.7] テスト時間適応(TTA)は、事前訓練されたモデルが、分散シフトの下でラベルのないテストストリームにオンラインで適応できるようにする。
ほとんどのTTA研究は適応の目的に焦点を当てているが、実用的なストリームはどのサンプルが適応を駆動するかを選択するのに使用されるメモリにも大きく依存している。
本稿では,クラスバランスアロケーションと特徴空間の多様性を組み合わせた多様性を考慮したメモリポリシーであるGOTTAについて紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:18:46 GMT)
FIKA-Bench: From Fine-grained Recognition to Fine-Grained Knowledge Acquisition [54.3] 日常生活におけるきめ細かい認識は、しばしばクローズドブックの分類問題ではない。
既存のベンチマークは主に視覚的認識を評価しており、このアクティブな外部知識獲得能力は過小評価されている。
そこでは,システムが外部の証拠を探し,検証し,利用し,オープンエンドのきめ細かい認識質問に答えなければならない,きめ細かな知識獲得について検討する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:19:30 GMT)
Learning with Foresight: Enhancing Neural Routing Policy via Multi-Node Lookahead Prediction [53.3] マルチノードルックアヘッド予測(MnLP)は、教師付き学習パラダイムを拡張して、複数の将来のノードを同時に予測する、新しいトレーニング戦略である。
筋電図の因果関係や破棄可能なMnLPモジュールをトレーニング中にのみ動作させ,コンテキストモデルによる多段階決定の予測を容易にする。
MnLPは既存のトレーニング手法より優れており、さまざまな問題サイズ、分布、実世界のベンチマークにわたるニューラルネットワークの一般化能力が改善されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:19:59 GMT)
Thinking in Scales: Accelerating Gigapixel Pathology Image Analysis via Adaptive Continuous Reasoning [52.4] スライド画像全体に対してトークン効率のよいスケール空間連続推論を可能にするPathCTMを提案する。
PathCTMは診断推論を動的逐次情報追跡として定式化する。
必要な画像パッチの数を95.95%削減し、推論時間を約95.62%短縮し、AUCを劣化せずに維持する。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:46:44 GMT)
Next-Acceleration-Scale Prediction for Autoregressive MRI Reconstruction [52.3] MRI再建は本質的に不完全な逆問題である。
この制限は、再構成を離散的なマルチスケールの潜在空間に移動させ、自己回帰的次加速スケールの予測として機能させることによって解決する。
提案手法は,過度のアンサンプ下での多種多様なサンプリングパターンの再構成性能の向上を図っている。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:40:50 GMT)
Xiaomi EV World Model: A Joint World Model Integrating Reconstruction and Generation for Autonomous Driving [51.9] 本報告では,世界モデルの自律運転における2つのコア機能に対処する統合技術システムを提案する。
世界表現のために,スパースシーンクエリによって駆動されるフィードフォワード再構築アーキテクチャであるWorldRecを提案する。
次世代に向けて,両方向性事前学習のための2段階のトレーニングフレームワークWorldGenを提案し,それに続いて因果微調整を行う。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:33:34 GMT)
Introspective X Training: Feedback Conditioning Improves Scaling Across all LLM Training Stages [51.9] 私たちは、現在のLLMトレーニングパイプラインの、成長を続ける多くのステージに対して、どのようにより効率的にスケールするかという問題に取り組みます。
オフライン報酬条件強化学習に触発されたイントロスペクティブトレーニング(IXT)を提案する。
IXTは思考報酬モデルを使用して、自然言語の批判に基づくフィードバックでデータを注釈付けし、パイプラインの初期段階から品質に配慮したトレーニングを可能にする。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:04:08 GMT)
LaCoVL-FER: Landmark-Guided Contrastive Learning Network with Vision-Language Enhancement for Facial Expression Recognition [51.7] 顔表情認識のための視覚言語強化型ランドマーク誘導型コントラスト学習ネットワーク(FER)を提案する。
LaCoVL-FERは、顔のランドマークと視覚言語モデルからのセマンティックな事前情報を統合する。
実験により、LaCoVL-FERは3つの代表的な実世界のFERデータセット上で最先端のメソッドより優れていることが示された。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:15:41 GMT)
TIDE: Asymmetric Neural Circuits for Stabilized Temporal Inhibitory-Excitatory Dynamics [51.4] 最近のContinuous Thought Machineアーキテクチャは、ニューラルダイナミクスを介して外部入力から内部計算を分離している。
非対称な興奮抑制(E-I)ネットワークを用いたニューラルダイナミクスのモデル化を提案する。
本稿では、神経力学を安定化させて内部表現を計算する、神経に触発されたアーキテクチャであるTIDE(Temporal Inhibitory-Excitatory Dynamic Engine)を紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:59:13 GMT)
TelePhysics: Physics-Grounded Multi-Object Scene Generation from a Single Image with Real-Time Interaction [51.0] トレーニング不要なフレームワークであるTelePhysicsを提案する。
空間座標系で全シーンの幾何学を表現することで、TelePhysicsは物体の侵入とアライメントのあいまいさを解消する。
実験結果から,TelePhysicsは,物理忠実度,空間コヒーレンス,制御性において,従来手法よりも大幅に優れていたことがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:16:44 GMT)
OpenComputer: Verifiable Software Worlds for Computer-Use Agents [50.9] OpenComputerは、コンピュータ利用エージェントの検証可能なソフトウェア世界を構築するための検証済みのフレームワークである。
OpenComputerは現在の形式で、ブラウザ、オフィスツール、クリエイティブソフトウェア、開発環境、ファイルマネージャ、通信アプリケーションにまたがる、33のデスクトップアプリケーションと1,000の最終的なタスクをカバーしている。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:40:29 GMT)
A Bitter Lesson for Data Filtering [50.6] 十分に訓練された大きなパラメータモデルは、品質の低いデータを許容するだけでなく、実際は名目上は貧弱なデータの恩恵を受ける。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:02:36 GMT)
CEPO: RLVR Self-Distillation using Contrastive Evidence Policy Optimization [50.6] 検証可能な報酬(RLVR)を用いた強化学習における正しい解を生成するモデル
各トークンは、決定的な推論ステップであれ、文法的なフィラーであれ、同じ報酬信号を受信する。
コントラストエビデンスポリシー最適化(CEPO)を提案する。
CEPOは、全てのトークンに対してよりシャープな質問をする:「正しい答えは、このトークンを好むか?」が、「正しい答えは、正しい答えは、それを好む一方で、間違った答えはそれを好まないか?」。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:46:19 GMT)
OScaR: The Occam's Razor for Extreme KV Cache Quantization in LLMs and Beyond [50.4] マルチモーダルインテリジェンスにより、Key-Valueキャッシュは効率的なデプロイメントのための主要なメモリボトルネックとなった。
本研究では、チャネルごとの量子化パラダイムの本質的な限界を再考する。
X-LLMのための高精度かつ軽量なKVキャッシュ圧縮フレームワークOScaRを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:53:03 GMT)
CaptchaMind: Training CAPTCHA Solvers via Reinforcement Learning with Explicit Reasoning Supervision [50.4] CaptchaベースのCaptchaベースのRLMindを導入し、8つのタスクの平均成功率は82.9%、現実世界のインスタンスでは72.9%に達した。
RLMindは8つのタスクで平均成功率82.9%、実世界のインスタンスで平均成功率72.9%を達成し、明確な推論プロセスの監督を訓練した。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:38:44 GMT)
m3BERT: A Modern, Multi-lingual, Matryoshka Bidirectional Encoder [50.3] 我々はm3BERT: A Modern, Multi-lingual, Matryoshka Bidirectional representationsを紹介する。
トランス層と複数の埋め込み次元にまたがる表現を共同で最適化する、新しい事前学習戦略が特徴である。
大規模な産業検索データセットであるBing-Clickでは、最先端の埋め込みモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:13:49 GMT)
HEAT: Heterogeneous End-to-End Autonomous Driving via Trajectory-Guided World Models [50.2] エンドツーエンドの自動運転は、従来のモジュラーパイプラインに代わる魅力的な代替手段として登場した。
本稿では,計画軌道に関する学習を組織する軌道駆動学習パラダイムを提案する。
一つの統一モデルが、各ドメイン内で強いパフォーマンスを維持しながら、異種データセット上でトレーニング可能であることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:12:01 GMT)
DeltaPrompts: Escaping the Zero-Delta Trap in Multimodal Distillation [50.0] 蒸留により、コンパクトなビジョンランゲージモデル(VLM)が強力な推論能力を得ることができる。
標準チャート/文書推論データセットにおけるプロンプトの最大69%は、事実上ゼロデルタである。
既存のデータセットをシードとして再利用し、学生の障害モードを積極的にターゲットとして、より良いプロンプトを生成するためのステージド合成パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:39:21 GMT)
ClinSeekAgent: Automating Multimodal Evidence Seeking for Agentic Clinical Reasoning [49.1] ClinSeekAgentは動的マルチモーダルエビデンスのための自動エージェントフレームワークである。
ClinSeekAgentは、臨床クエリと生のデータソースへのアクセスのみを前提として、医療知識ベースへの問い合わせ、生のEHRのナビゲート、医療画像ツールの呼び出しによって証拠を集めている。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:58:37 GMT)
CODA: Rewriting Transformer Blocks as GEMM-Epilogue Programs [49.0] CODAは、これらの計算をGEMM+epilogueプログラムとして表現するGPUカーネル抽象化である。
我々は,CODAがフレームワークレベルの生産性とハードウェアレベルの効率を両立させるための実践的な方法を提供することを示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:30:43 GMT)
LionMuon: Alternating Spectral and Sign Descent for Efficient Training [48.7] 平均コストを大幅に削減しつつ,Muonのステップの有効性を維持するLionMuonを提案する。
固定周期 P におけるライオンとムオンの更新を交互に行い、その間に1つのデュアルEMA運動量バッファを共有する。
シングルEMAのSignMuonは、それ自体が純粋なMuonを上回っている。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:07:59 GMT)
Symmetrization of Loss Functions for Robust Training of Neural Networks in the Presence of Noisy Labels [48.1] 本研究では、任意の多クラス損失関数の対称成分への一意分解から生じる対称性化法について検討する。
このマルチクラスのアンヒンジド損失は、ユニークな凸なマルチクラスの対称損失であることを示す。
次に,SGCE と α-MAE という2つの損失関数を導入する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:03:40 GMT)
FlowErase-RL: Rethinking Concept Erasure as Reward Optimization in Flow Matching Models [47.8] フローマッチングモデルでは、テキストから画像への生成品質が大幅に向上しただけでなく、安全性が向上した。
フローマッチングモデルにおける概念消去のための最初のGRPOベースのフレームワークであるemphFlowErase-RLを提案する。
本研究では,画像品質とセマンティックアライメントを維持しつつ,最先端の消去性能を実現する方法を示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:10:09 GMT)
Are Rationales Necessary and Sufficient? Tuning LLMs for Explainable Misinformation Detection [47.6] LONSREXは、説明可能なMDのための必要十分かつ十分な規則を見つけるための、新しいデータ合成パイプラインである。
具体的には、各検証ステップの最終的な予測への貢献を定量化し、その必要性と十分性を評価する指標を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:03:32 GMT)
Rethinking Visual Attribution for Chest X-ray Reasoning in Large Vision Language Models [47.2] 大規模視覚言語モデル(LVLM)は医学的応用において有望であるが、視覚的証拠に忠実に応答できないことは深刻な懸念を引き起こす。
そこで本研究では,CXR-VQAサンプルのみを保持する因果評価フレームワークを開発した。
MedFocusは, 臨床的に有意な解剖学的領域を非平衡の最適輸送により局所化する概念に基づく属性法である。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:46:40 GMT)
When to Stop Reusing: Dynamic Gradient Gating for Sample-Efficient RLVR [46.9] RLVR(Reinforcement Learning with Verifiable Rewards)は、大規模言語モデル(LLM)における高度な推論の主流パラダイムとなっている。
RLVRでは、複数の勾配更新のために各ロールアウトバッチを再利用することでポリシーシフトが増幅され、パフォーマンスが大幅に低下する。
我々は,textitDisproportionate Weight Divergence (DWD) 現象を同定した。
軽量な介入であるtextitDynamic Gradient Gating (DGG) を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:23:43 GMT)
Fast 4D Mesh Generation by Spatio-Temporal Attention Chains [46.9] 本研究では,時間的対応性を改善しつつ,4次元メッシュ生成を高速化する学習自由アプローチを提案する。
空間と時間にまたがって情報を伝達する、時空間注意連鎖と呼ばれる一般的なフレームワークを活用する。
最先端技術と比較すると,提案手法は9秒で4Dメッシュを生成し,高品質な結果が得られるとともに,13倍の高速化を実現している。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:51:50 GMT)
Prompt2Fingerprint: Plug-and-Play LLM Fingerprinting via Text-to-Weight Generation [46.8] 本稿では,指紋認証を条件パラメータ生成タスクとして再構成するフレームワークであるPrompt2Fingerprintを提案する。
特殊なジェネレータを利用することで、P2Fはテキスト記述を直接低ランクパラメータインクリメントにマッピングする。
実験の結果,P2Fは高い指紋精度,無害性,堅牢性を保ちながら,計算オーバーヘッドを著しく低減することがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:19:47 GMT)
Reading Calibrated Uncertainty from Language Model Trajectories [46.7] モデルの内部アクティベーションを調査する手法は、生の隠れた状態を不透明なスナップショットにフィードし、表現が形成される層回りの軌跡を暗黙的に残す。
我々は11のスケール不変な幾何学的特徴を抽出し、層ごとの更新の累積経路をトレースし、それらをスパース線形プローブに供給する。
このプローブは、最大21のAURCポイントでベースラインスケーリングを行い、選択的な棄権下でMPPより優れる。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:24:29 GMT)
Backdooring Masked Diffusion Language Models [46.6] 本研究はMDLMに対する訓練時バックドア攻撃に関する最初の体系的研究である。
本研究は,MDLMの前方破壊プロセスを変更するバックドアアタックであるSHADOWMASKを提案する。
DiTベースのMDLMとLLaDA-8B-InstructのWikiText-103、OpenWebText、Alpacaによる評価は、SHADOWMASKがほぼ100%の攻撃成功を達成していることを示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:20:08 GMT)
What Do Evolutionary Coding Agents Evolve? [46.6] EvoTraceは4つの進化的フレームワーク、推論と非推論モデル、数学とアルゴリズム設計にまたがる16のタスクからなる進化的コーディングトレースのデータセットである。
本研究では,これらのトレースを,ハイスコアソリューションの裏側にある局所的な検索状態を再構成するリプレイベースの手法であるEvoReplayを用いて解析する。
EvoTrace全体では、ほとんどのスコアはこれらの編集タイプの小さなサブセットから得ている。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:41:45 GMT)
GoLongRL: Capability-Oriented Long Context Reinforcement Learning with Multitask Alignment [46.5] GoLongRLは、長文強化学習のための能力指向のポストトレーニングレシピで、検証可能な報酬がある。
オープンに、23K RLVRサンプルのデータセット、完全な構築パイプライン、すべてのトレーニングコードをリリースしています。
同じバニラGRPOセットアップの下では、私たちのデータセットはクローズドソースのQwenLong-L1.5データセットよりも優れています。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:21:09 GMT)
On the nature of entangling photons in horizon-induced decoherence [45.9] 近年、キリング地平線の存在が状態の重畳における量子系のデコヒーレンスをいかに引き起こすかが議論された。
このエッセイは、ブラックホールの熱力学とそれに続くエントロピー境界に関連して、この過程を研究する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:31:09 GMT)
Geometric curvature driven by many-body collective fluctuations [45.9] 近年、量子幾何学は、バンド間混合によって駆動される基底状態における量子双極子ゆらぎの観点から解釈できることが強調されている。
ここでは、この図を多体集団変動からの貢献を含むように拡張する。
その結果, 集団変動による寄与は, 素バンド幾何学的貢献と実験的に区別できることが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:13:37 GMT)
Lens Privacy Sealing: A New Benchmark and Method for Physical Privacy-Preserving Action Recognition [45.9] RGBカメラベースの監視システムは、公共の安全と医療のための人間の行動認識を可能にする。
既存の方法は、データ取得時のプライバシ保護に失敗する、キャプチャ後アルゴリズムに依存している。
我々は、調整可能なフィルムでカメラレンズを物理的に隠蔽するシンプルなハードウェアソリューションであるLens Privacy Sealing (LPS)を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:21:57 GMT)
ActQuant: Sub-4-bit Action-Guided Quantization for Vision-Language-Action Models [45.6] 本稿では,アクション誘導型混合精度PTQフレームワークであるActQuantを紹介する。
ActQuant は、(1) エージェントの動作の予測にどの程度貢献するかに基づいて、各重み行列に1ビット幅を割り当てるテンソル間ビットアロケータである。
我々はまた、効率的な低ビットカーネルを持つネイティブC/C++にポートするエージェント変換パイプラインであるOmniModelも導入した。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:57:26 GMT)
Adaptive Probe-based Steering for Robust LLM Jailbreaking [45.4] モデル抽出のアイデアを活用し、学習されたステアリングベクトルを導いて理想的なベクトルを近似する。
提案手法は,プローブベースステアリングの有効性とロバスト性を顕著に向上することを示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:11:04 GMT)
MiMuon: Mixed Muon Optimizer with Improved Generalization for Large Models [45.1] アルゴリズムの安定性と数学的帰納率に基づくMuonの一般化誤差について検討する。
そこで我々は,Muonと運動量に基づくSGDのハイブリッドである勾配を用いて,有効混合Muon(MiMuon)を提案する。
我々のMiMuonアルゴリズムは、Muonアルゴリズムと同じコンバージェンスレートが$O(frac1NTbig)$である。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:56:27 GMT)
Fine-tuning language encoding models on slow fMRI improves prediction for fast ECoG [45.1] 本研究では,非侵襲的fMRIを用いてトレーニングデータのギャップを埋めることを提案する。
音声言語表現をfMRIで微調整することにより,ECoGの符号化モデルを構築する。
周波数帯域の予測は、fMRIで直接測定される範囲を超えて改善された。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:49:51 GMT)
MambaPanoptic: A Vision Mamba-based Structured State Space Framework for Panoptic Segmentation [44.9] MambaPanopticは、完全なMambaベースのパン光学セグメンテーションフレームワークである。
トップダウン機能ピラミッドであるMambaFPNを導入し、Mambaブロックを利用してグローバルに一貫性のあるマルチスケール機能表現を生成する。
Cityscapes と Panoptic segmentation ベンチマークの実験では、MambaPanoptic は PanopticDeepLab と PanopticFCN を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:47:01 GMT)
Score-Based Causal Discovery of Latent Variable Causal Models [44.7] 適切な定式化されたスコア関数は,潜在変数因果モデルの構造学習において,スコア等価性と一貫性が得られることを示す。
さらに、文献で考慮された複数の構造的仮定の下で、観測された変数に対する限界値の自由度を特徴づける。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:44:43 GMT)
Online Market Making and the Value of Observing the Order Book [44.5] 本研究では,学習者が連続して入札を行い,単一資産の価格を求めるオンライン市場形成問題について検討する。
リアルリミットオーダーブックにインスパイアされたアクション依存フィードバックモデルを導入する。
この追加情報が、問題の学習可能性に根本的に変化することを示します。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:26:01 GMT)
Are Tools Always Beneficial? Learning to Invoke Tools Adaptively for Dual-Mode Multimodal LLM Reasoning [44.5] 本稿では,各クエリの特徴に応じてツールを呼び出すかどうかを適応的に決定するモデルであるAutoToolを紹介する。
強化学習フレームワーク内では、モード固有の報酬関数を持つ明示的な二重モード推論戦略を設計する。
実験により、AutoToolは優れた性能と高い効率を示すことが示された。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:44:26 GMT)
Backtracking When It Strays: Mitigating Dual Exposure Biases in LLM Reasoning Distillation [43.0] 本稿では,MOTABにおけるモニタリングトラジェクトリとバックトラッキングを提案する。
MOTABは、適応的な安全境界に対して学生の政治世代を監視する。
LIMO-v2とAceReasonデータセットの実験により、MOTABは二重露光バイアスを効果的に緩和することが示された。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:42:52 GMT)
Online Conformal Prediction with Corrupted Feedback [42.9] オンライン共形予測(OCP)は適応的に更新された予測セットを通じてこの問題に対処する。
これらは、過去の予測セットのカバレッジに関する完全なフィードバックの仮定にヒンジを保証します。
実際には、観測された誤検出指標は、ノイズ、通信障害、あるいは敵の操作によって破損する可能性がある。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:34:37 GMT)
$π$-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows [42.6] $$-Benchは、5つのドメイン固有のユーザペルソナにわたる100のマルチターンタスクからなるプロアクティブアシストのベンチマークである。
隠れたユーザインテント、タスク間の依存関係、セッション間の連続性によって、$$$-Benchは、拡張されたインタラクションよりもユーザニーズを予測し、対処するエージェントの能力を評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:06:51 GMT)
Graph Neural Networks for Community Detection in Graph Signal Analysis [42.5] コミュニティ検出は、ネットワーク科学からグラフ信号処理に至るまで、グラフ解析における中心的な問題である。
近年,グラフ構造化データの低次元表現を学習するための有効なツールとして,グラフニューラルネットワーク(GNN)が登場している。
本稿では,グラフ信号フレームワークにおけるGNNを用いたコミュニティ検出手法について検討する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:07:51 GMT)
AI Technologies in Language Access: Attitudes Towards AI and the Human Value of Language Access Managers [42.0] 本稿では,AI時代の人的価値に対する言語アクセスマネージャの態度と認識について報告する。
その結果、言語アクセスマネージャは、避けられないAI実装に対して条件付き最適化を示すことが明らかとなった。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:07:21 GMT)
A Case for Agentic Tuning: From Documentation to Action in PostgreSQL [41.7] PerfEvolveは専門家のチューニング方法論を実行可能なスキルに変換する。
PerfEvolveは、最先端のドキュメント駆動チューニングベースラインを最大35.2%向上させる。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:26:28 GMT)
RoVLA: Multi-Consistency Constraints for Robust Vision-Language-Action Models [41.4] VLA(Vision-Language-Action)モデルは、具体的操作において強力な性能を示している。
視覚的な観察の変化、言い換えられた言語指示、複雑な摂動の下でも不安定なままである。
マルチ一貫性制約を持つ堅牢な視覚-言語-アクションフレームワークであるRoVLAを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:10:20 GMT)
CompoSE: Compositional Synthesis and Editing of 3D Shapes via Part-Aware Control [41.3] CompoSEは、部品認識制御による3次元形状の合成と編集のための新しい方法である。
本手法は,特定の空間配置に配置された異なる対象部分を表す,粗い幾何学的プリミティブの集合を入力とする。
提案手法は,コンテキスト認識の置換,追加,削除,スタイル保存型リサイズ操作など,強力な部分レベルの編集機能を実現することを実証する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:39:48 GMT)
PrAda: Few-Shot Visual Adaptation for Text-Prompted Segmentation [40.8] Few-Shot Visual Adaptation for text-prompted segmentationを提案する。
PrAdaは、凍結したテキストプロンプトセグメンテーションモデルに適応する、新しいパラメータ効率の手法である。
提案手法は,微細なピクセル特徴と高レベルのトランスフォーマー表現を組み合わせることで,クラス固有のプロトタイプを学習する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:00:24 GMT)
Brain alignment of reasoning and action representations from vision-language and action models during naturalistic gameplay [40.4] fMRI記録を用いた2つの基礎モデル群からの代表モデルの脳内アライメントについて検討した。
視覚言語モデル (VLM) と大動作モデル (LAM) の両方で, ボクセルエンコーディング性能が著しく向上していることが判明した。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:40:14 GMT)
Gender Differences in AI Literacy Workshop Outcomes and Deepfake Engagement [40.0] 本研究では,オーストラリア人中学生におけるAIリテラシー,安全意識,STEMキャリア願望の性別差について検討した。
統計的回帰法を用いて, 男子学生は, STEMのキャリアに対する関心が有意に高かった。
女子学生は、AIを学校の作業に利用し、AIツールからアドバイスを求める傾向が著しく高かった。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:21:08 GMT)
Active Defense Against False Data Injection Attacks in Robotic Manipulators [39.8] 本稿では,有限水平False Data Injection Attacks (FDIA) に対するマニピュレータの弾力性について述べる。
仮想ダンピングとマニピュラビリティの低減という2つの防衛法を定式化し、タスク実行の確率的保証を与える。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:41:49 GMT)
TreeText-CTS: Compact, Source-Traceable Tree-Path Evidence for Irregular Clinical Time-Series Prediction [39.6] TreeText-CTSは不規則なEHRトラジェクトリを、可読でコンパクトで、ソース追跡可能なツリーパスエビデンスユニットに変換する。
TreeText-CTS はテキストベースの EHR 時系列インタフェースの中で最高の AUROC と AUPRC を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:30:06 GMT)
Spectral bandits for smooth graph functions with applications in recommender systems [39.5] グラフ上でアームの支払いがスムーズな帯域幅問題について検討する。
このフレームワークは、コンテンツベースのレコメンデーションなど、グラフを含むオンライン学習問題の解決に適している。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:07:21 GMT)
ML-based Fast Simulation of FARICH Responses [39.5] FARICH検出器の応答を高速にシミュレーションするための機械学習に基づく手法を提案する。
本稿では,軽量な畳み込みアーキテクチャを備えた条件付きジェネレーティブ・アドバイザリアル・ネットワーク(cGAN)を提案する。
cGANは現実的なサンプルを生成し、モンテカルロシミュレーションの大幅な高速化を提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:46:34 GMT)
Spectral Souping: A Unified Framework for Online Preference Alignment [39.3] Reinforcement Learning from Human Feedback (RLHF) は、大規模言語モデルと人間の嗜好の集約を効果的に整合させるが、個々のユーザの多様性と矛盾するニーズに対処できないことが多い。
我々は、効率的なオンライン嗜好アライメントのための統合フレームワークであるSpectral Soupingを紹介する。
オンライン嗜好アライメントベンチマーク実験により,本手法は既存の最先端手法よりも大幅な性能向上を実現していることが示された。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:04:47 GMT)
Pretraining Objective Matters in Extreme Low-Data FGVC: A Backbone-Controlled Study [39.1] 教師付き分類、コントラスト学習(SigLIP2)、マスク再構築(MAE)、自己蒸留(DINOv3)の4つの凍結型ViT-B/16エンコーダを比較した。
教師付きおよび対照的なエンコーダは、最も強い線形分離性(論理的AUC: 0.768 と 0.735; SVM AUC: 0.739 と 0.697)を提供する。
この領域では、DINOv3はプローブファミリーで不活性である。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:14:08 GMT)
Mean-field and fluctuation dynamics in off-resonant two-mode atom-field interactions [39.1] 本稿では,Jaynes-Cummingsフレームワーク内の2つの量子化電磁モードに結合した2レベルシステムについて検討する。
単モードモデルは保存された励起数のために正確に解けるが、2モードモデル拡張は根本的な課題を示す。
我々のスキームは、力学を支配的かつ正確に解ける半古典的成分に分離し、原子は両方のモードの平均場と相互作用する。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:30:51 GMT)
ClaimDiff-RL: Fine-Grained Caption Reinforcement Learning through Visual Claim Comparison [38.4] ClaimDiff-RLは、参照条件付き原子クレーム差分をキャプションRLの報酬単位として使用するフレームワークである。
ClaimDiff-RLは幻覚のバランスを改善し、一般的な能力を保ち、いくつかの細粒度キャパビリティー次元のGemini-3-Pro-Previewを超えている。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:39:28 GMT)
STELLAR: Scaling 3D Perception Large Models for Autonomous Driving [38.1] 我々は,Sparse Window TransformerをベースとしたSTELLARモデルを開発し,LiDAR,レーダー,カメラ,マップなどを含む入力モードを拡張した。
最大5億のパラメータを持つ5000万の運転例の大規模データセットでモデルをトレーニングする。
我々の研究は、大規模トレーニングが自律運転のための知覚モデルの能力を向上させるための非常に有望な道であることを実証している。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:40:20 GMT)
Olivia: Harmonizing Time Series Foundation Models with Power Spectral Density [38.1] 時系列基礎モデルは、ドメイン間の多様なデータセットに対する大規模な事前トレーニングに依存している。
Harmonizerは、スペクトル構造を再利用し、データセット間で暗黙的にPSDを調和させるモジュールである。
オリヴィア(Olivia)は、これらの調和機構に基づいて構築された新しい時系列基礎モデルである。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:26:50 GMT)
Segment Anything with Robust Uncertainty-Accuracy Correlation [38.1] ニューラルネットワークにおけるテクスチャバイアスのショートカットと人間の視覚における形状中心の処理との対比により、我々は、外見の変化として領域外変化をモデル化し、共同でキャリブレーションをストレスする非剛性変形をモデル化する。
本稿では,ロバスト不確かさ-精度相関(RUAC)を用いたSegment Anythingを提案する。
23個のゼロショット領域にまたがって、RUACはセグメンテーションの品質を改善し、より強い不確実性と精度の相関を持つより忠実な不確実性をもたらす。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:23:30 GMT)
What Makes a Representation Good for Single-Cell Perturbation Prediction? [37.8] PerturbedVAEは、この信号の不均衡を解決するために設計された一般的なフレームワークである。
摂動効果を確実に回復できる条件を特徴付ける識別可能性分析を提供する。
PerturbedVAEは、広く使われている複数の評価設定で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:30:11 GMT)
Nested Spatio-Temporal Time Series Forecasting [37.7] マイクロレベルの歴史的観測と将来のマクロレベルの地域動向を結びつけるネスト予測フレームワークを提案する。
具体的には、スペクトルクラスタリングに基づく手法を用いてセマンティック・コヒーレントな領域を構築する。
我々はこれらの代表的特徴を推論プロセスに統合するプログレッシブ粗大予測器を開発した。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:48:35 GMT)
GAE Falls Short in Imperfect-Information Self-Play Reinforcement Learning [37.4] 不完全な情報ゲームにおけるセルフプレイ強化学習では、エージェントは部分的な観察可能性の下で行動する必要がある。
PPO(Proximal Policy Optimization)は、経験的成功を強く達成しているが、今後の行動のサンプリングにより、さらなるばらつきに悩まされている。
Q$-boosting, a variance-reduced advantage estimator based on a central action-value critic, and proposed Variance-reduced Policy Optimization (VRPO)。
VRPOは、Dou DizhuやHeads-Up No-Limit Texas Hold'emといった中規模から大規模まで、一貫して強力なパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:07:39 GMT)
White-Balance First, Adjust Later: Cross-Camera Color Constancy via Vision-Language Evaluation [37.4] VLM-CCは、反復的な精錬プロセスとして色の一貫性を定式化するフィードバック誘導フレームワークである。
直接RGB推定をVLM誘導の知覚フィードバックに置き換えることで、VLM-CCはクロスカメラカラーの不安定性を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:53:35 GMT)
Rethinking Muon Beyond Pretraining: Spectral Failures and High-Pass Remedies for VLA and RLVR [37.4] ミューオン (Muon) は、運動量行列の特異値を 1 に向けて駆動することでスペクトル勾配化を強制する行列対応反復である。
Pionは、均一なスペクトル白化を2段階のProgress+Suppressionメカニズムに置き換えながら、その計算効率を維持するMuonの代替品である。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:00:26 GMT)
Position: The Turing-Completeness of Real-World Autoregressive Transformers Relies Heavily on Context Management [37.1] 本研究では,異なる文脈管理手法により,計算能力が著しく異なることを示す。
我々は、文脈管理が現実の自己回帰変換器の計算力を批判的に決定する中心的な要素であると主張する。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:12:33 GMT)
Depth2Pose: A Pose-Based Benchmark for Monocular Depth Estimation without Ground-Truth Depth [36.9] 本稿では,下流タスクの文脈における単眼深度推定器(MDE)の評価フレームワークを提案する。
深度認識幾何学的解法における特徴対応と深度予測を組み合わせることで、相対カメラのポーズ推定精度を深度品質のプロキシとして利用する。
本手法は,地底深度が難しい場面に応用できる。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:59:11 GMT)
EPC-3D-Diff: Equivariant Physics Consistent Conditional 3D Latent Diffusion for CBCT to CT Synthesis [36.8] CBCTからCT合成のための新しい条件付き3次元潜伏拡散フレームワークであるEPC-3D-Diffを提案する。
我々は、体積の平面内回転がその射影の角シフトに対応するという事実を利用する。
我々は,反復スキャンを含む頭部CBCT/CTファントムデータセットと,患者の賢明な分割を用いた臨床データについて検証した。
EPC-3D-Diffは、技術手法の状況と比較して、PSNRにおける+7.4 dB(ファントム)と+1.8 dB(クリニカルデータ)の大幅な改善を実現している。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:34:09 GMT)
Increasing Missingness to Reduce Bias: Richardson-SGD with Missing Data [36.6] すべてのパラメトリックモデルが、様々な計算手順に類似した勾配バイアスを示すことを証明している。
本稿では, 勾配降下法(SGD)の簡易な脱バイアス法を提案する。
我々は、いくつかの欠損シナリオにおいて、勾配バイアスが$O(|p|)$から$O(|p|2)$に減少することを証明する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:24:58 GMT)
A Nash Equilibrium Framework For Training-Free Multimodal Step Verification [36.4] 本研究では,段階的検証を専門審査員間の協調問題として扱う,訓練不要な検証手法を提案する。
提案手法はベースラインモデルよりも2.4%から5.2%の一貫性のある改善を実現している。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:54:22 GMT)
Breaking Modality Heterogeneity in Low-Bit Quantization for Large Vision-Language Models [36.1] 低ビット後量子化(PTQ)は、リソース制約されたデバイスにビジョンランゲージモデル(VLM)をデプロイするための重要な技術である。
既存のPTQ法は、量子化中のテキストと視覚の非均一な活性化分布のために、VLMの精度を劣化させることが多い。
チャネル分割駆動のポストトレーニング量子化フレームワークであるSplitQを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:49:57 GMT)
Customizing an LLM for Enterprise Software Engineering [35.9] Gemini for Google (GfG)は、Googleの内部ソフトウェアエンジニアリングエコシステムに特化したGeminiの適応である。
29,000人の開発者を対象にした大規模な盲目A/B調査では、GoogleのGeminiがベースラインを大幅に上回った。
この方法論は、他の組織が社内エンジニアリングデータの潜在能力を最大限に活用するための、レプリケートなパスを提供する、と私たちは信じています。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:11:07 GMT)
What Makes Synthetic Data Effective in Image Segmentation [35.9] 視覚的理解のための有望なソリューションとして合成データが登場した。
本研究では,現状の拡散モデルから合成画像の体系的解析を行い,その有用性を規定する要因を明らかにする。
フレキシブルでスケーラブルな合成データを活用し,セグメンテーション性能を大幅に向上する統合フレームワークであるSENSEを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:07:04 GMT)
MetaRA: Metamorphic Robustness Assessment for Multimodal Large Language Model-based Visual Question Answering Systems [35.9] メタモルフィック・ロバストネス・アセスメント(MetaRA)は,メタモルフィック・リレーショナル(MR)を用いてMLLMベースのVQAシステムの脆弱性を調査するテスト・フレームワークである。
MetaRAを複数のMLLMベースのVQAモデルに適用すると、言語的摂動に対する感受性、表面的な視覚的手がかりへの過度な依存、マルチモーダル推論におけるより深い弱点など、さまざまなタスクにまたがる障害パターンが明らかになる。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:37:54 GMT)
A Data-Driven Approach to Idiomaticity Based on Experts' Criteria in Theoretical Linguistics [35.2] 本稿では,16の語彙,文法,その他の基準に基づいて,286個のマルチワード表現(MWE)のデータ解析を行う。
カテゴリーの分布は、絶対的な慣用的な表現がないことを示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:19:26 GMT)
LambdaPO: A Lambda Style Policy Optimization for Reasoning Language Models [34.3] グループ相対政策最適化は、明示的な価値批判を先導する効果で評価されている。
群平均のようなモノリシックな統計ベースラインへの依存は、軌道空間の相対トポロジーを1つのスカラーに分解する。
我々は、この情報理論のボトルネックに対処する新しいフレームワークLambda Policy Optimization(LambdaPO)を紹介します。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:10:24 GMT)
Closed-form predictive coding via hierarchical Gaussian filters [33.9] 予測符号化は、ニューラルネットワークのトレーニングにおけるバックプロパゲーションに代わる、局所的かつ生物学的に基礎付けられた代替手段を提供する。
FashionMNISTでは,エピックレベルの壁面コストを低く抑えながらバックプロパゲーションにアプローチする。
オンライン精度学習によるクローズドフォーム変分推論は、深層予測符号ネットワークの抽出可能な基盤を提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:11:41 GMT)
Take It or Leave It: Intent-Controlled Partial Optimal Transport [33.7] 遠心制御型部分最適輸送(IC-POT)の導入
得られた最適化問題は、局所的受容しきい値の2つの解釈を持つことを示す。
サイド情報によって拒否を駆動する設定において,IC-POTの実用的妥当性を示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:52:59 GMT)
Cross-View Splatter: Feed-Forward View Synthesis with Georeferenced Images [33.7] 地上および衛星で捉えた屋外シーンに対する画素配置ガウススプラッターのフィードフォワード手法であるCross-View Splatterを提案する。
提案手法は,GPSタグ付き地上写真で修正衛星の視界を融合して3次元座標フレーム内のガウススプラットを推定する。
提案手法は,従来の最先端手法と比較可能なジオレファレンス画像を用いた新規ビュー合成のための新しいベンチマークで評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:48:42 GMT)
Plug-and-Play Spiking Operators: Breaking the Nonlinearity Bottleneck in Spiking Transformers [32.7] 本稿では,Transformer の非線形性に対するスパイクフレンドリーな近似を実装し,既存の ANN-to-SNN パイプラインに統合するプラグイン・アンド・プレイフレームワークを提案する。
本手法は,これらの非線形計算を,分割,指数化,および$ell$ノルムの3つの繰り返しプリミティブに分解し,集団群を介して実現する。
実験により、対象とする非線形演算子を選択的に置き換えることにより、評価された全てのタスクに対して11%の精度低下が生じることが示された。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:59:46 GMT)
Generative Auto-Bidding with Unified Modeling and Exploration [32.5] GUIDE(Generative Auto-Bidding with Unified Modeling and Exploration)は、方向性探索と安全なフォールバックメカニズムを統合するフレームワークである。
我々は、公開データセット、模擬オークション環境、および中国の主要な広告プラットフォームであるTaobaoへの大規模オンライン展開を通じて、広範な実験を行っている。
実世界の展開において、GUIDEは、+4.10%の広告GMV、+1.40%の広告クリック、+1.66%の広告コスト、+3.52%の広告ROIという顕著な利益を達成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:09:32 GMT)
RoadmapBench: Evaluating Long-Horizon Agentic Software Development Across Version Upgrades [32.0] RoadmapBenchは、115の長い水平コーディングタスクのベンチマークで、実際のオープンソースバージョンをアップグレードします。
各タスクはエージェントをソースバージョンコードスナップショットに配置し、マルチターゲットのロードマップ命令を提供する。
最強のクロード=オプス-4.7でも39.1%のタスクしか解決していないのに対し、最も弱いイテレーションは5.2%しか達成していない。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:10:44 GMT)
CLIF: Concept-Level Influence Functions for Transparent Bottleneck Models [31.9] 本研究では,NLPモデルのサンプルレベルと概念レベルでの解釈可能性を高めるために,インフルエンス関数を用いた新しい手法を提案する。
CEBaBとYelpのデータセットの実験は、影響関数が最も影響のあるトレーニングサンプルを効果的に識別することを示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:42:38 GMT)
ThoughtTrace: Understanding User Thoughts in Real-World LLM Interactions [31.7] ThoughtTraceは、現実世界のマルチターンヒューマン-AI会話とユーザの自己報告された思考を組み合わせた最初の大規模データセットである。
ThoughtTraceには1,058のユーザ、2,155の会話、17,058のターン、10,174の思考アノテーションが20の言語モデルで収集されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:42:06 GMT)
RECIPE: Procedural Planning via Grounding in Instructional Video [31.0] 本稿では,RECIPEがノイズの多いビデオコーパスからクリーンなステップラベルを抽出する方法を示す。
RECIPEはGRPOの報酬としてグラウンド品質を使用し、ノイズの多いコーパスをラベルソースではなく検証器に変換する。
基準ベースLCM-as-judgeプロトコルを用いて,6つの手続き基準にまたがる計画を評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:20:39 GMT)
MixRea: Benchmarking Explicit-Implicit Reasoning in Large Language Models [30.8] 本研究では,大規模言語モデル (LLM) が明示的なタスク命令の下で,微妙に重要な文脈的手がかりに適合しないかどうかを考察する。
21個の高度なLCMの評価は、最も優れた推論モデル(Gemini 2.5 Pro)でさえ42.8%の一貫性しか達成していないことを示している。
我々は,見落としている因果関係を回復して推論を改善するプロンプト法であるtextbfPotential Relation Completion Prompting (PRCP)を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:15:08 GMT)
Proximal State Nudging: Reducing Skill Atrophy from AI Assistance [30.7] AI支援下での人間の能力の徐々に低下するスキル萎縮は、半自律システムの共有制御において安全性のリスクをもたらす。
本稿では,ユーザを最も学習しやすい状態へ誘導することで,スキル開発とタスクパフォーマンスを共同で最適化する共有自律アルゴリズムであるPximal State Nudging (PSN)を提案する。
PSNは、標準ブレンドされた共有自律よりも最大で7倍の非支援スキルを生み出し、一方、非支援の自己実践よりも50%少ない衝突を引き起こす。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:10:46 GMT)
CutVerse: A Compositional GUI Agents Benchmark for Media Post-Production Editing [30.6] Cutverseは、現実的なメディアポストプロダクション環境で自律的なGUIエージェントを評価するために設計されたベンチマークである。
7つのプロフェッショナルアプリケーション(例:Premiere Pro、Photoshop)にまたがる専門家によるデモをキュレートします。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:35:22 GMT)
ShadeBench: A Benchmark Dataset for Building Shade Simulation in Sustainable Society [30.4] ShadeBenchは、都市シェード理解のための包括的なデータセットとベンチマークである。
このマルチモーダルデータセットに基づいて構築されたShadeBenchは,シェード生成やシェードセグメンテーション,3Dビルディング再構築など,さまざまなダウンストリームタスクをサポートする。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:28:02 GMT)
Regulating Anatomy-Aware Rewards via Trajectory-Integral Feedback for Volumetric Computed Tomography Analysis [30.4] 我々は,放射線学報告を検証可能な臨床的意味単位に分解する構造化システムであるtextbfClinical Abnormality Benchmarking Substrate (CABS) を導入する。
制御理論の原理を政策最適化に組み込んだ新しいフレームワークである textbfTrajectory-Integral FeedbackO (TIF-GRPO) を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:33:27 GMT)
FineBench: Benchmarking and Enhancing Vision-Language Models for Fine-grained Human Activity Understanding [30.4] VLM(Vision-Language Models)は、一般的なビデオ理解において顕著な能力を示す。
彼らはしばしば、現実世界のアプリケーションに不可欠なきめ細かい理解に苦しむ。
我々は、きめ細かい理解を評価するために特別に設計されたベンチマークであるFineBenchを紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:40:26 GMT)
Distribution Matching Distillation without Fake Score Network [30.1] 分散マッチング蒸留(DMD)は、数ステップ生成に有効な分布レベルの補正を提供する。
最近の研究は、DMDスタイルの目標とフローマップジェネレータを組み合わせることで、前方偏差トレーニングと逆偏差補正の両方を活用する。
本研究では,Fake-Score-network-Free DMD (FSF-DMD)を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:05:31 GMT)
PhyWorld: Physics-Faithful World Model for Video Generation [30.1] 本稿では,時間的コヒーレントで物理的に忠実なシーン継続を生成するビデオ生成ワールドモデルであるPhyWorldを提案する。
最初の段階では、フローマッチングの微調整によりビデオ間連続性を改善し、安定した視覚特性とコヒーレントな動きのダイナミクスを奨励する。
第2段階では、生成したダイナミクスを物理選好ペアに対して直接選好最適化(DPO)を用いて物理原理と整合させ、より高い物理確率で出力に向かってモデルを導く。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:28:52 GMT)
UniRefiner: Teaching Pre-trained ViTs to Self-Dispose Dross via Contrastive Register [30.1] 位置整合のセマンティクスをエンコードしないトークンはすべて、突発的なアーティファクトとして扱われるべきである、と我々は主張する。
我々は、これらのアーティファクトの自己配置を事前学習したビジョントランスフォーマーに教える普遍的な洗練フレームワークUniRefinerを提案する。
EVA-CLIP-8B や InternViT-6B などの大規模モデルを含む多種多様な ViT を改良するためには, 5k 画像の微調整がわずかに必要である。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:00:14 GMT)
Vision Harnessing Agent for Open Ad-hoc Segmentation [30.0] オープンアドホックセグメンテーションのための視覚誘導アドホックエージェント(VASA)を提案する。
VASAは視覚操作を計画し、セグメンテーションツールを起動し、結果を検査し、マスクを編集し、エラーから回復する。
PARSはPartImageNetのパートレベルのラベルをオープンなアドホックな概念に変換する新しいベンチマークである。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:04:23 GMT)
Terrestrial readiness campaign for space-to-ground quantum communications with a space-qualified entangled photon-pair system [29.8] 1.8km自由空間リンク上で行った自由空間量子鍵分布実験について報告する。
偏光束縛光子を用いたBBM92プロトコルを実装することにより、秘密鍵レートは約7.56kbpsとなった。
その結果,地上セグメントと宇宙セグメントの運用上の互換性が確認された。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:20:52 GMT)
How Do Document Parsers Break? Auditing Structural Vulnerability in Document Intelligence [29.8] Document Layout Analysis (DLA)パイプラインは、検索強化された生成、長期文書質問応答、その他の文書インテリジェンスシステムのための構造化ページ表現を提供する。
本稿では,プローブ構築,ポリシー駆動型ターゲティング,構造認識診断を分離する軽量な出力レベル監査フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:44:09 GMT)
GraphInstruct: A Progressive Benchmark for Diagnosing Capability Gaps in LLM Graph Generation [29.8] GraphInstructは、大規模言語モデルのためのプログレッシブ・複雑度ベンチマークである。
離散的なパワーピークは深度を推論するのではなく,多制約組成で発生する。
制約対応型適応プロンプトを備えた検証誘導反復フレームワークは、プロンプトエンジニアリング天井を一貫して超越している。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:34:58 GMT)
SetCon: Towards Open-Ended Referring Segmentation via Set-Level Concept Prediction [29.5] オープンエンド参照セグメンテーションを明示的なセットレベル概念予測として再構成し、セットコンセプト(SetCon)を提案する。
階層的意味分解は、まずターゲットスコープを定義する共有セットレベル概念を予測し、次にターゲットサブセットに整合したきめ細かい概念群に洗練する。
SetConは画像ベンチマーク(gRefCOCOでは+3.3 gIoU、MUSEでは+12.1 gIoU)で最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:59:11 GMT)
Toto 2.0: Time Series Forecasting Enters the Scaling Era [29.1] Toto 2.0は、このレシピに基づいてトレーニングされたモデルを予測する5つのオープンウエイトのファミリーである。
Toto 2.0は、我々の可観測性ベンチマークであるBOOM、標準汎用ベンチマークであるGIFT-Eval、最近の汚染耐性ベンチマークであるTIMEの3つの予測ベンチマークに、新しい技術状況を設定している。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:08:24 GMT)
Trust It or Not: Evidential Uncertainty for Feed-Forward 3D Reconstruction with Trust3R [28.9] Trust3Rはフィードフォワード3D再構成のための軽量な明らかな不確実性フレームワークである。
Trust3Rは、常にリスクカバレッジとスパーシフィケーションを改善し、概して幾何学的精度を向上させる。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:39:48 GMT)
Tango3D: Towards Alignment for Global and Local 2D-3D Correspondence [28.7] 我々は,高密度対応とグローバル検索を統一する基盤モデルであるTango3Dを提案する。
画像の2次元パッチへのエンコードや,雲の3次元トークンへのポインティングには,幾何学的に認識された2次元視覚バックボーンと,事前訓練された3次元VAEを用いる。
実験により, 競合するグローバル検索を維持しつつ, オブジェクトレベルの画素間アライメントを実現することができた。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:01:23 GMT)
NEWTON: Agentic Planning for Physically Grounded Video Generation [28.7] ビデオ生成モデルは視覚的に説得力のある結果を生み出すが、体系的に物理的常識に反する。
VideoPhy-2では、最良のモデルは32.6%のジョイント精度しか達成していない。
本稿では,システム出力からエージェントのツールボックス内の1つのアクションに映像生成を分解するNEWTONを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:23:43 GMT)
Awakening the Hydra: Stabilizing Multi-Concept Backdoor Injection in Text-to-Image Diffusion Models [28.3] Hydraは、累積的かつ分散化された再利用の下で、堅牢で制御されたマルチコンセプトのバックドアインジェクションのためのフレームワークである。
テキストエンコーダ空間で進化的トリガー検索を実行し、ターゲット概念にセマンティックに整合したトリガーを識別する。
さらに、マルチタスク微調整とトリガークリーン正規化を組み合わせることで、密集したマルチコンセプトインジェクション下でのトレーニング安定性を向上させる。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:36:45 GMT)
TIDE: Efficient and Lossless MoE Diffusion LLM Inference with I/O-aware Expert Offload [28.3] Diffusion Large Language Models (dLLMs) は、並列ブロックレベルのデコーディングを通じて、ハードウェア利用と双方向コンテキストを改善する。
既存のARベースのメソッドは、しばしば禁止的なI/Oオーバーヘッドまたは重要な計算ボトルネックを引き起こす。
本稿では,専門家のアクティベーションの時間的安定性を活用する新しい資源効率推論システムであるTIDEを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:59:08 GMT)
Cracks in the Foundation: A Civil Infrastructure Dataset to Challenge Vision Foundation Models [28.1] CiF(Cracks in the Foundation)は、これまでで最大かつ最も詳細な土木インフラ(インスタンス)セグメンテーションデータセットである。
ファウンデーションモデル(FM)とビジョン言語モデル(VLM)の出現にもかかわらず、現在の視覚AIの盲点を露呈する。
我々の評価は、最新のゼロショットFMでさえ、現実世界のインフラに配備する際、重大な課題に直面していることを示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:21:03 GMT)
Learning-Zone Energy: Online Data Selection for Efficient RL Post-Training [28.0] そこで本研究では,モデルにおけるアクティブな学習フロンティアに焦点をあてた,理論的基盤を持つ完全オンラインデータ選択フレームワークを提案する。
リプレイ付きフォワードプルーナーは、永続的に解決されたプロンプトのロールアウト生成をスキップすることで、ウォールクロック時間コストをさらに低減する。
我々の方法は1ステップあたりのトレーニングデータの40%しか保持しないが、完全なデータベースラインにマッチまたは超えている。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:34:27 GMT)
Detecting and Mitigating Backdoor Attacks in OTA-FL Systems: A Two-Stage Robust Aggregation Scheme [27.8] オーバー・ザ・エア・フェデレーション・ラーニング (OTA-FL) は無線チャネルの重ね合わせ特性を利用して通信効率を向上させる。
パラメータサーバは個々のローカル更新にアクセスできない。
OTA-FLにおけるバックドア攻撃に対する防御のための2段階のロバストアグリゲーションフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:57:31 GMT)
Understanding Wacky Weights: A Dissection of SPLADE's Learned Term Importance [27.7] 我々はSPLADE-v2を再現し、SPLADEファミリーのモデル間での厄介な重量を調査した。
拡張項の語彙的有用性に基づいて、ウェイクネスを形式的に定義する。
さまざまな損失関数、データセット、バックボーントランスフォーマーでトレーニングして、不安の原因を分離します。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:07:13 GMT)
CaMo: Camera Motion Grounded Evaluation and Training for Vision-Language Models [27.6] VLM(Vision-Language Models)は,空間質問応答ベンチマークにおいて高い性能を発揮する。
しかし、それが真の空間知能を反映するかどうかは不明だ。
既存の空間的VLMには基本的なカメラモーションの理解が欠如していることが示される。
本稿では,SNS 評価と直接空間質問応答精度で一貫した性能を実現するカメラモーショングラウンド付き VLM である CaMo を紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:50:25 GMT)
Rebalancing Reference Frame Dominance to Improve Motion in Image-to-Video Models [27.5] 画像とビデオのモデルは、テキストとビデオのモデルと比較して、過度に静的なビデオを生成することが多い。
我々は,運動抑制の鍵となるメカニズムとして,強調フレームの優位性を見いだした。
そこで我々は,DyMoSを提案する。DyMoSは,生成したフレームから参照フレームへの注意経路を再調整する,トレーニング不要でモデルに依存しない手法である。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:50:24 GMT)
Faster or Stronger: Towards Flexible Visual Place Recognition via Weighted Aggregation and Token Pruning [27.5] ビジュアルプレース認識(VPR)は、大規模データベース内の同じ場所の参照画像とクエリイメージをマッチングすることを目的としている。
自己蒸留による特徴抽出コストを削減するVPR指向のトークンプルーニングフレームワークであるWeiToPを紹介する。
WeiToPは、推論時にプラグアンドプレイトークンのプルーニングを可能にし、追加のトレーニングなしで正確性と効率のトレードオフを柔軟かつオンデマンドに制御できる。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:01:57 GMT)
LLM Benchmark Datasets Should Be Contamination-Resistant [27.4] ベンチマークデータセットは$textit-resistant$、つまり$textitunlearnable$であるべきですが、$textitinference$をサポートします。
本稿では, ベンチマークデータセット汚染の広範囲性を強調し, 汚染耐性データセットの特性について概説する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:33:16 GMT)
Draft Less, Retrieve More: Hybrid Tree Construction for Speculative Decoding [27.3] Graftは、相互強化操作としてプルーニングと検索を結合する補償フレームワークである。
短文ベンチマークでは、最大5.41$times$ Speedupを実現し、大規模Qwen3-235Bでは平均速度を21.8%向上させる。
また、DFlashスタイルのブロック起草パラダイムにGraftを適用するための予備的な調査を行い、自己回帰的な起草木を超えて移植を拡大するための最初の証拠と洞察を提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:55:48 GMT)
AnyAct: Towards Human Reenactment of Character Motion From Video [27.2] 非人間的な人物のモノクラー映像から、初期人間の再現を導出する問題を考察する。
局所的な2D関節運動から条件付き人間の動作生成として、キャラクタ駆動による人間の再現を定式化するAnyActを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:09:02 GMT)
SUGAR: A Scalable Human-Video-Driven Generalizable Humanoid Loco-Manipulation Learning Framework [27.1] 現実の世界における全身のロボット操作を一般化できるヒューマノイドロボットの構築は、依然として根本的な課題である。
SuGARは、多様な人間の動画をデプロイ可能なヒューマノイドのロコ操作スキルに変換するスケーラブルなデータ駆動フレームワークである。
シミュレーションと実世界のヒューマノイドハードウェアにおいて,SUGARを6つの代表的ロコ操作タスクで評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:24:05 GMT)
Spectral Integrated Gradients for Coarse-to-Fine Feature Attribution [26.9] 統合グラディエンツ(IG)は広く採用されている特徴属性法である。
標準直線経路は全ての入力機能を同時に導入し、途中でノイズの多い勾配を蓄積する。
本稿では特異値分解に基づく積分経路を構成するスペクトル積分勾配を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:47:04 GMT)
Exploiting Non-Negativity in DAG Structure Learning [26.0] 本研究は,線形構造方程式モデルにより生成される結節観測から有向グラフ(DAG)を学習する問題に対処する。
正規化非負のDAG学習問題を定式化し、乗算器の手法に基づくアルゴリズムを開発する。
合成および実世界のデータを用いた実験により,提案手法は最先端の連続DAG学習法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:03:33 GMT)
Gaussian Approximation and Multiplier Bootstrap for Federated Linear Stochastic Approximation [25.9] 我々は、連合線形近似(LSA)のためのベリー-エッセイン型境界を確立する。
結果は、通信計算のトレードオフと不均一性を考慮したエラー項を明示的にキャプチャする LSA に対する最初の連合ガウス近似を提供する。
その結果, (i) ステップサイズが一定であること, (ii) ステップサイズが小さくなったこと, (ii) 局所的な反復が増加し, ボナージーら(2025) の最近の速度が回復した。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:08:01 GMT)
AQuaUI: Visual Token Reduction for GUI Agents with Adaptive Quadtrees [25.9] 本稿では,GUIエージェントモデルのためのトレーニング不要な推論時間トークン削減手法であるAquaUIを提案する。
AQuaUIはパイプライン全体の保持トークンの空間的位置を保持し、すべての位置エンコーディングステージが一貫していることを保証する。
我々は、最先端GUIエージェントモデルにAQuaUIを実装し、標準接地およびナビゲーションベンチマークで実験を行う。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:13:29 GMT)
TextAlign: Preference Alignment for Text Rendering with Hierarchical Rewards [25.8] テキストレンダリングを学習後の嗜好調整問題として研究する。
キーコンポーネントは階層型視覚言語モデル(VLM)ベースの報酬で、レンダリングエラーをグローバル、ワード、グリフのレベルに分解する。
FLUX.1-devとZ-Image-Turboの実験では、一般的な生成品質を劣化させることなく、OCRベースのテキスト精度が一貫した向上を示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:55:59 GMT)
Open-World Evaluations for Measuring Frontier AI Capabilities [25.5] 我々は,オープンワールド評価という,補完的な評価クラスを提唱する。
本稿では,最近のオープンワールド評価を調査し,その強みと限界を特定し,CRUXを定期的に実施するプロジェクトとして紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:42:32 GMT)
Offline Reinforcement Learning for Plasma Control in Nuclear Fusion: Codebase and Benchmark [25.4] 核融合におけるプラズマ制御のためのオフライン強化学習ベンチマークRL4Fを紹介する。
RL4Fは、4つの完全追跡タスクのクローズドループ評価環境とベースライン比較を提供する。
我々は、統一されたプロトコルの下で、模倣学習とオフラインRLベースラインの幅広いセットを評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:09:29 GMT)
STAR-PólyaMath: Multi-Agent Reasoning under Persistent Meta-Strategic Supervision [25.4] 拡張された長距離推論のためのマルチエージェントフレームワークSTAR-PlyaMathを紹介する。
STAR-PlyaMathは、ネストしたチャレンジ・ステップ・リプランループを備えたステートマシンとして構成されている。
8つのトップクラスのベンチマークで完全なスコアを達成します。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:20:43 GMT)
Active Context Selection Improves Simple Regret in Contextual Bandits [25.4] 有限文脈空間(サブポピュレーション)を用いた文脈多重武装バンディット問題について検討する。
私たちの保証は、報酬分布よりも最悪のケースですが、コンテキスト分布ベクトル$p$に関しては、インスタンス依存のままです。
p$が不明な場合、コンテキスト分布とアクティブアロケーションに切り替える時間を最適に推定するExplore-Explore-Then-Commit (EETC)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:01:58 GMT)
Training Language Agents to Learn from Experience [25.3] In-context Training taskは、言語エージェントにおけるクロスタスク自己改善を評価するためのフレームワークである。
次に、経験から直接、そのような反射を学習するためのRLベースのトレーニングパイプラインを提案する。
ALFWorldとMiniHack全体で、トレーニングされたリフレクタは、ほとんどの保留タスクファミリでトレーニングされていないベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:41:12 GMT)
General Preference Reinforcement Learning [25.1] ポストトレーニングは、大きな言語モデル(LLM)のアライメントを2つの大きく切り離されたトラックに分割した。
検証可能な報酬を伴うオンライン強化学習は、数学とコードの創発的な推論を促進する。
GPRL(General Preference Reinforcement Learning)は、各次元のグループ相対的な利点を計算し、それぞれを独自のスケールで正規化し、軸が支配できないようにする。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:24:33 GMT)
Mechanisms of Misgeneralization in Physical Sequence Modeling [24.9] 生成シーケンスモデルは、物理領域の運動を計画するためにしばしば訓練される。
私たちは、標準的なディープラーニングがこの意図に反する可能性があることに気付きます。
制御された合成タスクを用いて、モデルクラスの典型的な局所誤差が伝播する際に、物理的誤一般化が発生することを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:34:16 GMT)
Preferences Order, Ratings Anchor: From Fused Expert Aesthetic Ground Truth to Self-Distillation [24.7] PPaintは、ドメインの専門家15名、カテゴリ毎に5名、中国絵画150点を注釈付けした、マッチングされたデュアルプロトコールベンチマークである。
一致した評価とともに、局所的に密集した選好設計により、45,900人の専門家の判断を収集する。
2つの独立した選好スコア法で両信号の融合は、融合した専門家の基礎的真実をもたらす。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:44:01 GMT)
Self-Creative Text-to-Object Generation using Semantic-Aware Spatial Weighting [24.6] 現在のテキスト・ツー・イメージ(T2I)モデルは、リテラル・テキスト・イメージアライメントとデータ分散に大きく最適化されている。
2つのコアモジュールを特徴とする有意義なT2I生成のための自己相関拡散(SCDiff)モデルを提案する。
私たちのモデルはクリエイティビティ、セマンティックアライメント、ビジュアルコヒーレンスを大幅に改善し、創造的なオブジェクトを生成するためのシンプルで強力なフレームワークを提供します。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:52:18 GMT)
HalluWorld: A Controlled Benchmark for Hallucination via Reference World Models [24.6] 幻覚は依然として大きな言語モデルの中心的な失敗モードである。
既存のベンチマークでは、要約、質問応答、検索強化生成、エージェント間相互作用など、矛盾なく運用されている。
明示的な参照ワールドの定式化を基礎としたベンチマークであるHaluWorldを紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:29:03 GMT)
Silent Collapse in Recursive Learning Systems [24.6] トラジェクトリ統計をモニタし、遅い時間スケールの信頼変数を推定する軽量なメタ認知ループを提案する。
MTRは早期警告を提供し、実際のデータにアクセスすることなくサイレント崩壊を積極的に防止する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:15:06 GMT)
Concept-Guided Noisy Negative Suppression for Zero-Shot Classification and Grounding of Chest X-Ray Findings [24.3] 胸部X線と放射線学報告を用いた視覚言語アライメントは、ゼロショット分類とグラウンド化の高度なパラダイムとして登場した。
標準的なコントラスト学習は、通常、異なる患者からのX線写真とレポートを単に負のペアとして扱う。
我々は,概念誘導雑音抑圧フレームワークであるCNNSを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:19:45 GMT)
Capability $\neq$ Interpretability: Human Interpretability of Vision Foundation Models [24.3] 視覚モデルの人間の解釈可能性を測定し比較するための枠組みを構築した。
チャンスアンコールされたスコアリング関数は、すべてのモデルを共通のスケールに配置する。
ファンデーションモデルは、監督されたモデルよりも、*無関係に解釈可能である。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:00:06 GMT)
EgoCoT-Bench: Benchmarking Grounded and Verifiable Operation-Centric Chain of Thought Reasoning for MLLMs [24.0] EgoT-Benchは、接地的で検証可能な操作中心の推論のための微細なエゴセントリックなベンチマークである。
EgoT-Benchは、3,172対のQAペアを351対の自我中心の振り返りビデオで構成している。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:02:20 GMT)
Drifting Objectives for Refining Discrete Diffusion Language Models [23.9] TokenDriftは、カテゴリー予測をソフトトーケンの特徴に引き上げる漂流目標である。
一致した継続ベースラインよりも固定NFE生成品質が向上する。
MDLMでは89%、DUOでは86%減少する。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:22:17 GMT)
General Lower Bounds for Differentially Private Federated Learning with Arbitrary Public-Transcript Interactions [23.9] 我々は、任意の公開-転写相互作用を持つ差分プライベートなフェデレーション学習プロトコルに対して、一般に低い境界を証明した。
正方形(エル)損失下でのパラメータ推定には、全クライアント単位の差分プライバシー(zCDP)制約を満たす全ての推定器に対して、フェデレーション付きバンツリーを低く設定する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:09:58 GMT)
S2Aligner: Pair-Efficient and Transferable Pre-Training for Sparse Text-Attributed Graphs [23.8] テキスト分散グラフ(TAG)の事前トレーニングは、転送可能なグラフ基盤モデルの構築の中心である。
本稿ではS2Alignerについて述べる。これはスパースTAGにおけるグラフテキスト事前学習のための空間認識と構造拡張 LLM-as-Aligner フレームワークである。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:28:13 GMT)
What's Holding Back Latent Visual Reasoning? [23.6] 近年のモデルでは、連続した潜伏トークンを中間的な視覚的想像力のステップとして活用している。
驚くべきことに、潜在トークンが非形式的ダミートークンに置き換えられたとき、モデル精度は影響を受けない。
我々の実験は、潜伏した視覚的推論を抑える2つの重要な問題を明らかにした。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:08:18 GMT)
CopT: Contrastive On-Policy Thinking with Continuous Spaces for General and Agentic Reasoning [22.9] CopTは、通常の思考と回答の順序を逆転する、改訂された推論パイプラインである。
CopTは、ドラフト回答を付与し、その後、独自のドラフト回答で条件付きで、後続のオンライン思考を起動する。
CopTはピーク精度を最大23%改善し、トークン使用量を最大57%削減する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:28:53 GMT)
Neuromorphic Control of a Flapping-Wing Robot on Resource-Constrained Hardware [22.9] この研究は、FWMAVの自律飛行のための完全搭載型ニューロモルフィック制御の最初の実演である。
厳密なSWaP制約の下でエネルギー効率の自律性を実現するSNNの可能性を強調している。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:35:18 GMT)
PAPO-VLA: Planning-Aware Policy Optimization for Vision-Language-Action Models [22.8] Vision-Language-Action(VLA)モデルは、言語誘導ロボットタスクにおいて有望な能力を示す。
VLAの信頼性を向上させるには、特に計画行動に注意が必要であると我々は主張する。
VLAモデル(PAPO-VLA)のためのプランニング・アウェア・ポリシー最適化を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:22:49 GMT)
\ECUAS{n}: A family of metrics for principled evaluation of uncertainty-augmented systems [22.8] 高精度な自動意思決定では、予測の不確実性へのアクセスが不可欠である。
興味ある課題に対する適切なスコアリングルールとして定式化された新しいメトリクスのファミリーであるECUASnを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:55:41 GMT)
Optimal Reconstruction from Linear Queries [22.7] 近似線形クエリから$mathbbRd$の未知点を再構成する問題について検討する。
この設定は、低次元リモートセンシングや信号回復から高次元データ分析、プライバシーに敏感な推論まで、様々なアプリケーションで自然に発生する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:04:37 GMT)
Towards Fine-Grained Robustness: Attention-Guided Test-Time Prompt Tuning for Vision-Language Models [22.4] A-TPTはテスト時間適応のために設計されたセマンティックス保存法である。
まず、敵攻撃下で生存する意味的に意味のある領域を特定するために、勾配注意ロールアウト機構を改良する。
そこで我々は,空間的に異なる拡張強度と多視点アンサンブルを誘導し,迅速なチューニングと推論を行う。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:10:06 GMT)
Inference-Time Scaling in Diffusion Models through Iterative Partial Refinement [22.3] 推論時間のスケーリングは、推論能力を改善するための主要なアプローチとして現れています。
逐次拡散のための推論時間スケーリング手法である反復部分分極(IPR)を提案する。
IPRは外部認証なしでよりグローバルに一貫したサンプルを生成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:53:50 GMT)
Conflict-Resilient Multi-Agent Reasoning via Signed Graph Modeling [22.2] LLMベースのマルチエージェントシステム(MAS)は、強力な推論と意思決定能力を示している。
SIGMA(Signed Graph-informed Multi-Agent reasoning framework)を紹介する。
SIGMAは最先端のベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:11:11 GMT)
EchoSR: Efficient Context Harnessing for Lightweight Image Super-Resolution [22.1] EchoSRは、軽量画像超解像のための効率的なコンテキスト調和フレームワークである。
マルチスケールの受容場モデリングと階層型コンテキスト融合を統一する。
複数のベンチマークで最先端の軽量超解像法を一貫して上回る。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:00:47 GMT)
Matérn Noise for Triangulation-Agnostic Flow Matching on Meshes [22.1] 本稿では,三角形メッシュ上での信号生成を三角法に依存しない方法で学習する作業に取り組む。
私たちは、勾配領域(PoissonNet)のメッシュ上の信号を学ぶために、最先端のアプローチを使用します。
提案手法は,100万以上の三角形のメッシュに対して,極めて現実的な結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:33:52 GMT)
Bézier Degradation Modeling for LiDAR-based Human Motion Capture [21.7] BMLiCapは、時間圧縮可能なベジエ曲線を用いて動きをモデル化する粗大なフレームワークである。
複雑なシーンにおける最先端の精度と時間的連続性を達成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:56:52 GMT)
CANINE: Coaching Visually Impaired Users for Interactive Navigation with a Robot Guide Dog [21.6] CANINEは、ロボットガイド犬と対話的なナビゲーションのためにユーザーを訓練する自動コーチングシステムである。
複雑な調整タスクをサブスキルに分解し、2つのレベルで動作する。
制御された研究によると、CANINEは学習効率と最終ナビゲーション性能の両方を著しく改善する。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:52:32 GMT)
Exploring and Developing a Pre-Model Safeguard with Draft Models [21.5] 大規模言語モデル(LLM)のアライメントは、Jailbreak攻撃に対して脆弱である。
プレモデルガードは、ターゲットモデルを呼び出す前にプロンプトの安全性を監査する。
ポストモデルガードは、ユーザープロンプトとターゲットモデルの応答を監査することでこの問題に対処する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:01:36 GMT)
Multi-agent Collaboration with State Management [21.2] 複数のエージェントが同時に共有を編集すると、その変更は静かに衝突し、一貫性のないビューは統合の失敗につながる。
既存のマルチエージェントシステムはワークスペース分離(エージェント毎に1つのgitワークツリーなど)を通じてこの問題に対処している。
マルチエージェントコラボレーションのためのSTORM,すなわちSTate-Oriented Managementを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:45:33 GMT)
FlexDraft: Flexible Speculative Decoding via Attention Tuning and Bonus-Guided Calibration [21.1] FlexDraftは投機的デコードフレームワークで、3つの重要な設計を通じて様々なバッチサイズに対応します。
Attention Tuningは、マスクトークン上の最後の数層の注意プロジェクタのみをチューニングすることで、ブロック拡散のドラフトを可能にする。
Bonus-guidedは、解決されたボーナストークンに軽量な条件を付け、ドラフトロジットを校正する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:48:16 GMT)
Eyes on VLM: Benchmarking Gaze Following and Social Gaze Prediction in Vision Language Models [21.0] 視覚言語モデル(VLM)における視線理解のためのシステム評価フレームワークEyeVLMを提案する。
視線理解能力を評価するために,2つの中核課題に焦点をあてる。
第2の社会的視線予測は、多対人インタラクションに対する社会的および関係的な推論を必要とする。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:50:40 GMT)
Causality-Aware End-to-End Autonomous Driving via Ego-Centric Joint Scene Modeling [20.8] 本稿では、CaADと呼ばれる、因果認識のエンドツーエンド自動運転フレームワークを提案する。
まず,限界予測分岐上に構築されたエゴ中心の合同因果モデリングモジュールを提案する。
第2に,エゴ政策を計画指向閉ループフィードバックと整合させるために,共同モード埋め込みで実装した因果対応政策アライメントステージを採用する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:58:26 GMT)
Less Data, Faster Training: repeating smaller datasets speeds up learning via sampling biases [20.5] このスピードアップは、サンプリングバイアスによって実現される適切な層ワイド成長に由来すると我々は主張する。
我々の結果は、より反復的な小さなデータセットを使用することは、単にデータ不足下でのフォールバック戦略ではないことを示唆している。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:28:20 GMT)
MCNav: Memory-Aware Dynamic Cognitive Map for Zero-shot Goal-oriented Navigation [20.5] MCNavは動的認知マップを備えたメモリ対応ナビゲーションフレームワークである。
目的の再検証と,目標の再探索の失敗という,メモリを意識した2つの探索戦略を導入する。
HM3Dv1およびHM3Dv2データセットのMCNavを3つの異なるタスクで評価した。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:39:51 GMT)
Journeys of Parents with LGBTQ+ Children: How Trauma and Healing Reshape Identity and (Mis)Informating Practices [20.5] 本研究は、韓国のLGBTQ+の親たちが、恐怖によって引き起こされる感情的な破裂をいかにナビゲートするかを検討する。
我々は,保護者のアイデンティティを支援親として再構築し,情報伝達の実践を再考する方法について強調する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:48:51 GMT)
Topological Kalman Filtering on Cell Complexes [20.5] 細胞複合体上の偏微分方程式から導出した位相対応状態空間フレームワークを提案する。
部分可観測性の下では,潜伏状態の細胞複合体畳み込みと非線形マッピングを用いた観測をモデル化する。
低階トポロジ構造のみが知られているシナリオに対しては,2階のセル構造を明示的に推測するセル識別アルゴリズムを導入する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:41:41 GMT)
A Multi-Agent Framework for Feature-Constrained Difficulty Control in Reading Comprehension Item Generation [20.3] 機能制約のあるアイテム生成のためのマルチエージェントフレームワークMAFIGを紹介する。
我々は,MAFIGが基準線よりもはるかに高い速度で目標制約に従属する項目を生成することを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:52:00 GMT)
Optimal Representation Size: High-Dimensional Analysis of Pretraining and Linear Probing [20.2] 限られたデータから一般化することを学ぶことは、人工システムと生物学的システムの両方にとって根本的な課題である。
本稿では, 構造抽出を主成分分析として定式化するプロセスの解析モデルを提案する。
我々は,表現の次元性,ラベル付きサンプルサイズ,タスクアライメントへの依存性を示す訓練および一般化誤差の正確な表現を導出する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:56:56 GMT)
Prior Knowledge or Search? A Study of LLM Agents in Hardware-Aware Code Optimization [20.0] 純粋なブラックボックス最適化では、LLMは欲張りとして機能する。
ゼロショットカーネル生成では、明示的な入力サイズ情報を提供するが、測定可能な効果はない。
カーネルサイズが一般的でない場合、使用する言語に関係なく、パフォーマンスは大幅に低下する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:48:48 GMT)
HyperBones: Realtime Bone-driven Neural Garment Simulation with Hypernetwork Conditioning [19.8] 動的衣服シミュレーションのための高速かつ物理的に妥当なアプローチを提案する。
本手法は,独立した粗い成分と細粒度成分からなる縮小空間型ニューラルダイナミクスシミュレータを訓練する。
シミュレータはコモディティGPU上で300FPS以上で動作し、リアルタイムアプリケーションに適している。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:13:54 GMT)
Causal Evidence for Attention Head Imbalance in Modality Conflict Hallucination [19.7] モダリティ・コンフリクト・幻覚(Modality-Conflict Hallucination)は、多様大言語モデルが矛盾する視覚的証拠よりも誤ったテキスト的前提を優先する場合に発生する。
本研究は,幻覚駆動型頭部と幻覚抵抗型頭部の2つのグループを同定した。
そこで本研究では,コンフリクトが検出された場合にのみ,因果的に同定された幻覚を抑える条件付き介入であるMACIを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:47:53 GMT)
PrivScope: Task-scoped Disclosure Control for Hybrid Agentic Systems [19.4] textscPrivScopeは、クラウド側の変更を必要とせずに、ローカル--CLM境界でのEmphtaskスコープによる開示を強制する。
textscPrivScopeは、組み立てられたペイロードから開示ユニットを抽出し、デバイス上で直接およびアカウント値を保持する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:37:41 GMT)
BAPR: Bayesian amnesic piecewise-robust reinforcement learning for non-stationary continuous control [19.3] 現実の制御システムは、段階的な定常状態の下で動作し、状態が変化する前に、力学は長期にわたって安定している。
標準的なロバストなRL法は基本的なジレンマに直面しており、グローバルな保守的な政策は安定した期間にパフォーマンスを無駄にし、一方、局地的な適応的な政策は、体制変更が未検出であるときに破滅的な失敗を危険にさらす。
我々は,頑健なアンサンブルRLでベイズオンライン変化検出を統一するtextbfBAPRを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:26:47 GMT)
Spatially Prompted Visual Trajectory Prediction for Egocentric Manipulation [19.3] 空間的にプロンプトされた視覚軌跡予測(SP-VTP)の最初の形式化について述べる。
この新しい設定は、初期空間的プロンプトを利用してタスク目標を定義し、エゴセントリックストリームから将来のエンドエフェクタ軌道を予測するモデルを実行する。
本研究では,1フレームの視覚的および座標的空間的プロンプトのためのタスクエンコーダと,現在の視覚的および歴史的コンテキストのための観測エンコーダと,将来のエンドエフェクタ動作のための軌道生成器を組み合わせたSPOTを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:39:30 GMT)
PilotWiMAE: Pilot-Native Representation Learning for Wireless Channels [19.3] 本稿では,エンコーダがノイズの多いパイロット観測を直接摂取する自己教師型フレームワークであるPilotWiMAEを紹介する。
パイロット入力は観測空間を最大2桁まで縮小し、フルCSI可用性の非現実的な仮定を除去する。
本稿では,エンコーダとデコーダを併用した事前学習段階を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:21:22 GMT)
TideGS: Scalable Training of Over One Billion 3D Gaussian Splatting Primitives via Out-of-Core Optimization [19.2] 数十億ドル規模の3DGSのトレーニングは、基本的にメモリバウンドである。
TideGSは、SSD-CPU-GPU階層間のパラメータを管理する、アウトオブコアのトレーニングフレームワークである。
TideGSは、24GBのGPUで10億以上のガウスのトレーニングを可能にする。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:40:59 GMT)
Neural Collapse by Design: Learning Class Prototypes on the Hypersphere [19.0] クロスエントロピー (CE) は自由度を非拘束にし、縮退幾何学に収束する。
教師付きコントラスト学習(SCL)は、事前訓練中にNCに向けて特徴を駆動するが、ポストホック線形探索フェーズでこの構造を捨てる。
両パラダイムが同じ手法の異なる外観であり,単位超球面上でのプロトタイプコントラストであり,ギャップを閉じるにはそれぞれの特定の障害点を固定する必要があることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:51:58 GMT)
Structural Energy Guidance for View-Consistent Text-to-3D Generation [19.0] 本研究は,2次元拡散前の視点バイアスを主な原因として同定し,多視点整合性向上のための構造エネルギー誘導サンプリング(SEGS)を提案する。
SEGSは、U-Net特徴のPCA部分空間に構造エネルギーを構築し、その勾配をデノナイジング過程に注入する。
実験によると、SEGSは平均でJanusレートを約10%削減し、DreamFusion、Magic3D、LucidDreamerを含む複数のベースラインでView-CSスコアを改善している。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:08:52 GMT)
Beyond Imitation: Learning Safe End-to-End Autonomous Driving from Hard Negatives [18.8] 本研究では,運転動作の成功と失敗から共同で学習する,障害対応の模倣学習フレームワークであるBeyondDriveを提案する。
まず、フローマッチングに基づく負の軌道生成器を導入し、安全クリティカルだが専門家の軌道を合成する。
第2に、モード崩壊を緩和し、多様な障害モードのカバレッジを改善するダイバーシティ対応サンプリング戦略を開発する。
第3に,強い負の軌道から遠ざけながら,専門家によるデモンストレーションに向けての予測を同時に惹きつける「反発距離損失」を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:41:47 GMT)
A Closed-loop, State-centric, Multi-agent Framework for Passenger Load Estimation from Heterogeneous Data Streams [18.7] 本稿では,頑健な乗客負荷推定の課題に対処する,クローズドループ,ステート中心,マルチエージェントフレームワークを提案する。
アーキテクチャは、統一されたストップイベントバックボーン、ストップバイストップ推論のためのパーセプション-物理-フュージョンループ、オプションのトリップレベルマクロ補正とクローズドループキャリブレーションモジュールで構成されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:26:59 GMT)
OP2GS: Object-Aware 3D Gaussian Splatting with Dual-Opacity Primitives [18.7] 3D Splatting (3DGS)は明示的で効率的なシーン表現を提供するが、プリミティブにはオブジェクトレベルのアイデンティティがない。
本稿では,各プリミティブを明示的なインスタンスIDで拡張するオブジェクト認識型ガウス表現OP2GSを提案する。
OP2GSは、計算オーバーヘッドを大幅に削減しつつ、競合するオープン語彙性能を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:05:48 GMT)
Can Vision Models Truly Forget? Mirage: Representation-Level Certification of Visual Unlearning [18.7] 4つの相補的な診断を含む表現レベル監査フレームワークであるMirageを紹介する。
出力レベルの認証をパスするメソッドを忘れることは、その表現にかなりのクラス構造を保っていることを示す。
既存のメソッドは、高いユーティリティ、出力レベルの忘れ、表現レベルの忘れを同時に達成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:43:57 GMT)
How You Move Tells What You'll Do: Trajectory-Conditioned Egocentric Prediction [18.6] 我々はこれらの知見を,エゴセントリックな文脈から将来の軌道候補を予測するモデルであるTrajPilotとしてインスタンス化する。
TrajPilotは、Ego-Exo4D Atomic、Ego-Exo4D Keystep、Ego4D GoalStep、EgoPERのプロシージャ計画でVLMと構造化プランナーベースラインを破る。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:38:11 GMT)
Implicit Action Chunking for Smooth Continuous Control [18.6] 本稿では、スムーズな連続制御のための暗黙のアクションチャンキングフレームワークであるDWSを提案する。
明示的な方法とは異なり、DWSはアクション空間を拡張することなく時間的コヒーレンスを強制する。
DeepMind Control Suiteや産業エネルギー管理タスクなどのベンチマーク実験は、DWSが最先端(SOTA)ベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:35:47 GMT)
Axiomatizing Neural Networks via Pursuit of Subspaces [18.6] 本稿では,一組の幾何学を通してニューラルネットワークの挙動を定式化する公理的フレームワークであるPursuit of Subspaces (PoS)仮説を紹介する。
この枠組みは,表現構造やアーキテクチャ機構,一般化行動など,ディープラーニングの基本的問題に対する幾何学的説明を与える。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:12:58 GMT)
KoRe: Compact Knowledge Representations for Large Language Models [18.6] 1ホップのサブグラフをコンパクトな離散的知識トークンに符号化する手法であるKoReを紹介する。
この結果から, コンパクトな離散KG表現は, 現代LLMの基底として, 効率的かつ効果的に利用できることが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:53:29 GMT)
Sample Complexity of Transfer Learning: An Optimal Transport Approach [18.5] 本研究は, サンプル効率の観点から, 伝達学習の潜在的メリットを厳密に分析する。
データ次元$d$が3ドルより高い場合、転送学習のサンプル複雑さは$O(m-(+1)/d)$である。
対象タスクが非滑らかなモデル群に対して最適化されている場合、理論的には転送学習のサンプル効率が向上する。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:39:03 GMT)
Neurosymbolic Learning for Inference-Time Argumentation [18.5] クレーム検証は、健康やファイナンスなど、ハイテイクな環境において重要な問題である。
第三次クレーム検証のためのトレーニング可能なニューロシンボリックフレームワークである推論時間議論(ITA)を導入する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:49:29 GMT)
High-fidelity molecular quantum logic gates resilient to interaction fluctuation [18.4] グローバルマイクロ波励起の2ドルパルスは高忠実度制御相ゲートが得られることを示す。
ゲートはDDIが結合した状態に頼らないため、DDIの不確実性に耐性がある。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:11:47 GMT)
WildRoadBench: A Wild Aerial Road-Damage Grounding Benchmark for Vision-Language Models and Autonomous Agents [18.1] WildRoadBenchを紹介します。
視覚フィードバックモデルによる直接的な視覚的接地と、LCM駆動エージェントによる自律的な研究とエンジニアリングを結合する。
我々は、複数のフロンティアLPM駆動エージェントとともに、クローズドソースフロンティアモデルとオープンソースVLMの広範なプールをベンチマークする。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:08:34 GMT)
AR1-ZO: Topology-Aware Rank-1 Zeroth-Order Queries for High-Rank LoRA Fine-Tuning [18.0] 本稿では,このボトルネックが外部部分空間の必要性というよりも,測定トポロジの問題であることを示す。
AR1-ZOペアは、階数不変のアクティブシグナルを復元する、トポロジ対応のスケール$=r$と1$の原子クエリを交互に行う。
OPTモデルとQwen3モデルの実験により、信号機構が検証され、AR1-ZOが高ランクのLoRAを効果的にすることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:39:30 GMT)
Do LLM Agents Mirror Socio-Cognitive Effects in Power-Asymmetric Conversations? [17.9] 我々は,大規模言語モデル (LLM) が高位または低位のペルソナに割り当てられた場合に類似した振る舞いを示すか否かを検討する。
多様な専門職のペルソナを用いて、マルチターン、パワー非対称な対話、および(i)言語調整、(ii)代名詞使用、(iii)説得成功、(iv)安全でない要求に対するコンプライアンスをシミュレートする。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:03:46 GMT)
Return of Frustratingly Easy Unsupervised Video Domain Adaptation [17.9] 教師なしビデオドメイン適応(UVDA)は実用的だが未探索の課題である。
本稿ではMetaTransと呼ばれるフラストレーションの少ないUVDA手法を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:07:56 GMT)
TMAS: Scaling Test-Time Compute via Multi-Agent Synergy [17.6] テストタイムスケーリングは、大規模言語モデルの推論能力を改善するための効果的なパラダイムとなっている。
マルチエージェント・シナジーによるテスト時間計算のスケーリングを行うフレームワークであるTMASを提案する。
TMASが既存のテスト時間スケーリングベースラインよりも強力な反復スケーリングを実現していることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:59:56 GMT)
Pseudo-Formalization for Automatic Proof Verification [17.6] 証明の信頼性検証は、厳密な数学的推論に基づくAIシステムのトレーニングと評価のボトルネックとして依然として残っている。
Pseudo-Formalization (PF) は形式的証明のモジュラリティと精度をキャプチャする証明形式である。
今後の研究を支援するため,研究レベルの検証ベンチマークArxivMathGradingBenchをリリースする。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:08:51 GMT)
TravExplorer: Cross-Floor Embodied Exploration via Traversability-Aware 3-D Planning [17.5] この記事では、クロスフロアで具体化された探索フレームワークであるTravExplorerを紹介します。
ゼロショットセマンティックガイダンスとトラバーサビリティを意識した3Dプランニングを結合する。
ユニツリーGo2の現実世界での50の試行は、シングルフロアとクロスフロアの屋内環境におけるオープンボキャブラリターゲット探索をさらに検証している。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:11:29 GMT)
A Measure-Theoretic Analysis of Reasoning: Structural Generalization and Approximation Limits [17.4] 離散軌跡を計量空間に投影し、領域シフトを定量化する。
カントロビッチ双対性を呼び起こすと、アーキテクチャ上のリプシッツ連続性と汎関数近似極限によるOOD一般化が成立する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:00:51 GMT)
VL-DPO: Vision-Language-Guided Finetuning for Preference-Aligned Autonomous Driving [16.8] 本稿では,エゴ車両運動予測モデルと人間の嗜好を一致させる視覚言語誘導フレームワークを提案する。
提案手法では,VLMをゼロショット推論器として利用し,事前学習したモデルのロールアウトから選好ペアを自動的に生成する。
モデルをOpen End-to-End Drivingデータセットに微調整します。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:36:34 GMT)
Landscape-Awareness for Geometric View Diffusion Model [16.6] そこで本稿では,視点条件付きモデルを用いて,更新を希望するビューに導くために,ランドスケープを誤解させるスコアベース手法を提案する。
実験結果から, 高信頼度, 高信頼度, 高信頼度, 高信頼度, 高信頼度, 高信頼度, 高信頼度が得られた。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:57:35 GMT)
DiagEval: Trajectory-Conditioned Diagnosis for Reliable Software Evaluation with GUI Agents [16.6] 本稿では,対話型ソフトウェアのGUIエージェント評価のための軌道条件付き診断評価プロトコルであるDiagEvalを提案する。
DiagEvalは失敗した軌道を再利用して、対象の診断プローブを選択し、その結果を内部の属性信号に集約する。
WebDevJudge-UnitとRealDevBenchのDiagEvalを複数のGUIエージェント評価器とLCMバックボーンで評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:14:09 GMT)
Are Watermarked Images Editable? SafeMark for Watermark-Preserving Text-Guided Image Editing [16.6] SafeMarkは、透かし保存されたテキスト誘導イメージ操作のためのフレームワークである。
透かしの整合性を編集プロセスに統合する。
異なる拡散ベースのエディタと互換性がある。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:08:40 GMT)
Latent Laplace Diffusion for Irregular Multivariate Time Series [16.5] 対象を低次元の潜在軌道としてモデル化する生成フレームワークであるLaplace Diffusionを提案する。
LLapDiffは、物理的時間とともにステップバイステップの統合なしで水平線全体の生成を可能にする。
また, 連続力学と不規則な観測とを更新・蓄積解析により関連づける。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:04:53 GMT)
Skinned Motion Retargeting with Spatially Adaptive Interaction Guidance [16.4] 本稿では,空間適応型アンカー上で近接マッチングを行うことにより,相互作用の意味を保った幾何対応型モーションフレームワークを提案する。
本手法は,多種多様なキャラクタ・ジオメトリ間の相互作用の忠実さを保ちながら,最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:41:11 GMT)
Understanding Model Behavior in Monocular Polyp Sizing [16.0] ポリープサイズの成層化は、監視上の決定を導いており、通常5mm以上の病変は、より近い追跡を必要とする。
複数の公開マルチセンターデータセット、モデルファミリー、患者層別クロスバリデーションにまたがるバイナリポリープサイズ分類の診断監査を行う。
完全スケール情報から潜在的な改善を定量化し、現在の深さ推定と大域キャリブレーションが限られた利得をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:14:14 GMT)
Selective, Regularized, and Calibrated: Harnessing Vision Foundation Models for Cross-Domain Few-Shot Semantic Segmentation [15.9] 本稿では,3段階のセレクトレギュラライズ・キャリブレートVFMに基づくセグメンテーションフレームワークを提案する。
HERAは限られたラベルから効果的に学習し、ソースデータの再トレーニングなしで新しいドメインに適応する。
実験の結果、HERAは複数のCD-FSSベンチマークで4.1 mIoU以上を越えている。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:22:17 GMT)
CBT-Audio: Evaluating Audio Language Models for Patient-Side Distress Intensity Estimation in CBT Session Recordings [15.9] 音声言語モデルを用いたCBTセッションから患者の苦痛度を推定するためのデータセットであるCBT-Audioを紹介する。
我々は,3つの入力条件下で10のオープンソース音声モデルを評価し,そこでは患者音声のみを受信し,転写のみを受信し,音声と転写の両方を受信する。
以上の結果から,音声はテキスト以外の有用な情報を提供することが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:10:37 GMT)
GeoX: Mastering Geospatial Reasoning Through Self-Play and Verifiable Rewards [15.8] 地理空間的推論は、シーンの複雑な空間構造上の画像的問題を解く必要がある。
検証可能な報酬を得られる実行可能プログラムを通じて空間論理を取得するセルフプレイフレームワークであるGeoXを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:37:01 GMT)
Not Every Rubric Teaches Equally: Policy-Aware Rubric Rewards for RLVR [15.8] POW3Rは、人重とカテゴリーバランスを目的とする政策対応報酬フレームワークである。
POW3Rはロールアウトレベルのコントラストを使用して、現在ポリシーの出力を分離している基準を強調する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:50:18 GMT)
Token by Token, Compromised: Backdoor Vulnerabilities in Unified Autoregressive Models [15.6] 統一自己回帰モデル(UAM)は、テキストと画像トークンを単一の自己回帰パス内で生成する。
この統合アーキテクチャはマルチモーダルなバックドア攻撃を可能にする。
われわれは,UAMを対象とした最初のバックドアアタックであるToBAC(Token Backdoor Attack)を提示する。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:55:18 GMT)
LLM Pretraining Shapes a Generalizable Manifold: Insights into Cross-Modal Transfer to Time Series [15.6] 本稿では,再利用可能な多様体を用いた事前条件付き時系列トレーニングについて述べる。
凍結LDM状態の線形プローブは、ペアの監督なしに現実的な時系列軌跡を復号する。
その後、ファインタニングは低次元のアライメントとして機能し、スクラッチから時間的プリミティブを学ぶのではなく、既存の方向を再利用する。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:01:51 GMT)
WaveGraphNet: Physics-Consistent Guided-Wave Damage Localization through Coupled Inverse-Forward Graph Learning [15.0] ピッチキャッチ測定から欠陥の空間的位置を推定することは、訓練用に限られた損傷箇所しか持たない場合に弱い制約を受ける。
本稿では、誘導波損傷の局所化のための逆フォワードグラフ学習フレームワークであるWaveGraphNetを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:51:31 GMT)
RoboJailBench: Benchmarking Adversarial Attacks and Defenses in Embodied Robotic Agents [14.9] エンボディドAIシステムの新しいクラスは、例えばロボットや自動運転車のような物理的なプラットフォームに統合される。
従来の研究は、AIを具体化するためのジェイルブレイク攻撃と防御を導入した。
既存のベンチマークと評価フレームワークは、従来のチャットベースのモデルをターゲットにするか、エンボディされたAIの非敵安全評価に注力する。
本稿では,3つのコアコンポーネントからなるRoboJailBenchとのギャップに対処する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:07:24 GMT)
When to Re-Commit: Temporal Abstraction Discovery for Long-Horizon Vision-Language Reasoning [14.9] ロングホライゾン推論は、どのような行動を取るかだけでなく、次の観察の前にどれだけ深くコミットするかを決定する必要がある。
我々はこれを、Emphcommitment depth:replan間でオープンループで実行されるプリミティブアクションの数という形式化します。
私たちはコミットメントの深さを、ポリシー自体の学習可能な状態条件変数としてインスタンス化します。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:38:08 GMT)
Lagrangian Flow Matching: A Least-Action Framework for Principled Path Design [14.8] フローマッチングは、所定の確率パスに関連する目標速度に対して回帰して神経速度場を訓練する。
ラグランジアンフローマッチング(Lagrangian flow matching)は、一般ラグランジアンの動きを最小化して確率パスと速度場を決定する物理ベースのフレームワークである。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:00:08 GMT)
Puzzled By ChatGPT? No more! A Jigsaw Puzzle to Promote AI Literacy and Awareness [14.7] ジェネレーティブAIは、公開理解とAIリテラシーをサポートするためのアクセス可能な方法の必要性を強調している。
このニーズに対処するために、ジグソーパズルという形でゲームベースでインタラクティブなアプローチを導入する。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:00:41 GMT)
The Yes-Man Syndrome: Benchmarking Abstention in Embodied Robotic Agents [14.7] 視覚言語モデル(VLM)は、エンボディエージェントのプランナーとして使用される。
本稿では, ロボット工学の文脈において, 禁忌を分類するための分類法を提案する。
本稿では,画像に接地した禁忌指示を生成するためのフレームワークであるRoboAbstentionを紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:32:44 GMT)
iGSP:Implicit Gradient Subspace Projection for Efficient Continual Learning of Vision-Language Models [14.6] iGSPは暗黙の勾配部分空間投影による効率的な適応を実現する新しいフレームワークである。
MTILベンチマークの実験は、iGSPが最先端の精度を達成することを示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:22:14 GMT)
Understanding Dynamics of Adam in Zero-Sum Games: An ODE Approach [14.6] 我々は、Adam-DAの連続時間極限として機能する常微分方程式を導出する。
解析の結果,ゼロサムゲームにおける一階運動量パラメータと二階運動量パラメータの役割は,最小化問題の文書化効果とは正反対であることがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:38:47 GMT)
JointHRRP-Net: A Statistically Constrained Decoupling Network for Joint Target and Jamming Recognition in Composite Jamming [14.5] 高分解能レンジプロファイル(HRRP)に基づくレーダー自動目標認識は、ジャミング環境での厳しい性能劣化に悩まされる。
本稿では,ジョイントターゲットジャミング認識のための統合フレームワークであるジョイントHRRP-Netを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:58:31 GMT)
Feed-Forward Gaussian Splatting from Sparse Aerial Views [14.5] 本稿では,空域の少ない都市景観を再現する観測基盤構築フレームワークであるAnyCityを提案する。
訓練中、高密度から高密度への蒸留は、高密度から高密度の再生から構造的キューを伝達する一方、航空保存ビデオ拡散は、きめ細かい都市外観のキューを提供する。
合成、航空ドメイン、UAVテクスチャ、現実世界のシーンの実験では、フィードフォワードベースラインよりも一貫した改善が見られた。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:04:34 GMT)
NeRF-based Spacecraft Reconstruction from Monocular Imagery Under Illumination Variability and Pose Uncertainty [14.4] このような操作の重要な構成要素は、ターゲットの3Dモデルを2D画像の集合からオフラインで再構成することである。
我々は、これらの課題を克服するために、画像毎の自由度でニューラルラジアンス場を拡張することを提案する。
軌道上の操作を表す3つの画像集合に対して,本手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:57:41 GMT)
CAD-Free Learning of Spacecraft Pose Estimators via NeRF-Based Augmentations [14.4] 宇宙船のポーズ推定ネットワークは、数万のCADレンダリング画像を訓練する必要がある。
NeRFに基づく画像強調法は、幾何学的に一貫性のある視点と外観拡張により、多種多様なデータセットを生成する。
実験の結果, 高精度なポーズ推定装置の訓練は, 25から400のリアルな画像で行うことができ, 高度な照明条件下でも有効であることがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:37:59 GMT)
Aerial Inspection Behaviors via RL-based Quadrotor Control for Under-canopy Forest Environments [14.3] 本稿では,検査目的追跡を実現するために,エンド・ツー・エンド(RPMへのマッピング状態)のクアドロータ制御ポリシーを提案する。
本稿では,長距離ミッションにおけるエンド・ツー・エンドのRLコントローラの安全性と信頼性を確保するために,より高いナビゲーション誘導層を利用する。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:09:28 GMT)
HL-OutPaint: Coarse-to-Fine Video Outpainting for High-Resolution Long-Range Videos [14.0] 映像の露光は、ビデオシーケンスの元々の空間範囲を超えて、可視な視覚コンテンツを生成する。
HL-OutPaintは長周期の高精細映像出力フレームワークである。
我々のフレームワークは、空間展開と長いビデオシーケンスのための安定したコヒーレントな生成を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:45:26 GMT)
TrajTok: Adaptive Spatial Tokenization for Trajectory Representation Learning [14.0] 移動可能な軌道埋め込みのための簡単な事前学習レシピを備えた軌道エンコーダであるTrajTokを提案する。
TrajTokはまず、GPSポイントの空間分布から多分解能六角形細胞分割を学習し、ノイズの多いGPSシーケンスを個別のセルトークンに変換する。
部分軌道観測から幾何構造と運動パターンの両方を復元するマスク・トケン・モデリングで事前訓練されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:18:32 GMT)
TORQ: Two-Level Orthogonal Rotation for MXFP4 Quantization [14.0] トレーニング不要なポストトライニング量子化フレームワークとしてTORQ (Two-level Orthogonal Rotation for MXFP4 Quantization)を提案する。
既存の手法と比較して, TORQはMXFP4の活性化量子化の精度を著しく向上させることを示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:05:47 GMT)
Hierarchical Contrastive Learning for Multi-Domain Protein-Ligand Binding [13.9] 本稿では,タンパク質-リガンド親和性を予測する自己教師型フレームワークであるHCLBindを紹介する。
HCLBindは、識別インタフェースの特徴を効果的に学習し、堅牢な不確実性推定を提供する。
PDBBindの実験は、HCLBindが識別インタフェースの特徴を効果的に学習し、堅牢な不確実性推定を提供することを示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:33:02 GMT)
DECOR: Auditing LLM Deception via Information Manipulation Theory [13.8] 大規模言語モデルは真理情報を微妙に操作することができる。
既存のブラックボックス法は粗い粒度の判断に依存している。
戦略偽装のきめ細かい監査のためのマルチエージェントフレームワークであるDECORを紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:33:21 GMT)
Hunting Vulnerability Variants in AI Infra: Measurement and Reference-Driven Detection [13.8] 本稿では,AI赤外線における脆弱性変異の測定について述べる。
688のGitHubリポジトリと251の公開脆弱性を分析します。
我々は、既知のケースから転送可能な脆弱性セマンティクスを抽出する参照駆動型マルチエージェントフレームワークINFRASCOPEを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:07:41 GMT)
From Simple to Complex: Curriculum-Guided Physics-Informed Neural Networks via Gaussian Mixture Models [13.5] 物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式(PDE)を解くためのメッシュフリーフレームワークを提供する
本稿では,混合モデリングと動的カリキュラム学習を統合したCGMPINNを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:20:13 GMT)
Ada2MS: A Hybrid Optimization Algorithm Based on Exponential Mixing of Elementwise and Global Second-Moment Estimates [13.4] 本稿では,AdamW-like挙動と運動量-SGD-like挙動のスムーズな遷移を実現する最適化アルゴリズムであるAda2MSを提案する。
本研究で評価された視覚的タスクについて,Ada2MSは統合比較プロトコルの下で競合する結果を得る。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:11:04 GMT)
Recall Isn't Enough: Bounding Commitments in Personalized Language Systems [13.2] 我々は,Lexicographic Commitment Validation (LCV)を用いたコントラクト境界エビデンス活性化(CBEA)を導入する。
CBEAは、型付きカバレッジ、尾の証人、そして結果の負債を使って設定された有界な証拠を起動する;LCVは、散文の前に構造化されたコミットメントを検証する。
CBEA+LCVは0.012個の未コンパイルの可視事実をリコールし、生のリコールは0.53である。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:16:30 GMT)
FlyMirage: A Fully Automated Generation Pipeline for Diverse and Scalable UAV Flight Data via Generative World Model [13.1] FlyMirageは、高度にスケーラブルで完全に自動化されたVLN用のデータ生成パイプラインである。
我々は、動的に実現可能な飛行軌跡を持つ大規模で多種多様で光現実的な航空VLNデータセットを生成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:41:04 GMT)
Beyond Waypoints: Dual-Heatmap Grounding for Cross-Embodiment Semantic Navigation [13.1] 本研究では,FOV内セマンティックナビゲーションの実践的な設定に焦点を当てる。
本稿では,Dual-Heatmap表現に有利な単一点回帰を放棄する統合ビジョン・ランゲージフレームワークを提案する。
本フレームワークは,8Bベースライン間の最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:12:59 GMT)
Rotation-Aligned Key Channel Pruning for Efficient Vision-Language Model Inference [13.0] ビジョンランゲージモデル(Vision-Language Model)は、単一のイメージが数千のトークンにエンコードされるため、推論時に厳しいKVキャッシュ圧力を被る。
既存のほとんどの手法はトークンプルーニングによってトークンの空白を悪用するが、視覚的コンテンツを永久に破棄することでかなりの劣化を引き起こす。
回転型構造化キーチャネルプルーニングフレームワークであるRotateKを開発した。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:45:00 GMT)
Diagnosing Multi-step Reasoning Failures in Black-box LLMs via Stepwise Confidence Attribution [13.0] 我々は、生成した推論トレースのみに基づいてステップレベルの信頼性を割り当てる、クローズドソース LLM のためのフレームワークである Stepwise Confidence Attribution (SCA) を紹介する。
SCAは、推論エラーと強く相関する低信頼のステップを確実に特定します。
ステップレベルの信頼を利用して自己補正を導くことで、回答レベルのフィードバックよりも最大で13.5%の修正成功率が向上する。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:57:51 GMT)
deadtrees.earth-aerial: A Multi-Resolution Aerial Image Dataset for Tree Cover and Mortality Detection [12.9] 世界中の森林は、気候変動や火災、害虫、病原体などの乱れによってますます脅かされている。
ドローンや航空機からの航空画像は、樹冠と死亡率の詳細な、大規模なマッピングのための重要なデータソースである。
木被覆と木死の共同セグメンテーションを可能にするために,オープンな機械学習対応データセットを2つ導入する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:43:29 GMT)
Characterizing Real-World Bugs in Tile Programs for Automated Bug Detection [12.9] タイルベースのプログラミングフレームワークは、ディープラーニングや科学計算などの領域で高性能なGPUカーネルを書くために、ますます採用されている。
コンパイルパイプラインには、入力フォーム、データタイプ、バックエンドターゲットと密結合された、異なるコード生成バグが導入されている。
本稿では,タイルプログラムによるコード生成バグの最初の系統的研究について述べる。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:42:29 GMT)
GemDepth: Geometry-Embedded Features for 3D-Consistent Video Depth [12.9] ビデオ深度推定は、一眼的予測を時間領域に拡張し、コヒーレンスを確保する。
現在のアプローチは主にトランスフォーマーによる時間的平滑化に依存しており、厳密な3次元幾何学的整合性を維持するのに苦労している。
GemDepthは,カメラモーションとグローバル3D構造を明確に認識することが3D一貫性の前提条件である,という知見に基づいて構築されたフレームワークである。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:06:35 GMT)
Formal Skill: Programmable Runtime Skills for Efficient and Accurate LLM Agents [12.8] 大きな言語モデル(LLM)エージェントは、モデル推論が信頼できるアクションになるかどうかをツールやスキルが判断する、実際のワークスペース内でますます機能する。
メタデータとアクションスキーマ、信頼できるPythonエグゼキュータ、フック統治制御ロジック、フォーマルスキルルーティング、スキルローカルランタイムステートで再利用可能な機能を表すランタイム言語の抽象化であるFormal Skillを紹介した。
FairyClawは、実行可能、観測可能、構成可能な形式スキルのための、オープンソースのイベント駆動ランタイムです。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:43:17 GMT)
INSHAPE: Instance-Level Shapelets for Interpretable Time-Series Classification [12.6] INSHAPEは、各時系列に特有の、可変長で差別的な時間パターンを検出する、解釈可能なフレームワークである。
128 UCRと30 UEAベンチマークデータセットの実験では、INSHAPEは一貫して最先端のシェープレットベースの手法より優れている。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:43:41 GMT)
CAIT: A Syntactic Parsing Toolkit for Child-Adult InTeractions [12.6] 子どものためのオープンソース構文解析ツールキットCAIT(Syntactic Parsing Toolkit for Child-Adult InTeractions)をリリースする。
CHILDESに特化して、最先端の依存関係をトレーニングします。
子どもの相互作用における構文パターンをより正確に捉え、既成の英語を話す人よりも優れています。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:53:08 GMT)
Lighting-aware Unified Model for Instance Segmentation [12.5] 重いバックボーンを微調整することなくセグメンテーションロバスト性を高めるアダプタモジュールを開発した。
lcaは、コントラストマップと並行してRGB機能を処理するためにデュアルブランチアーキテクチャを採用し、物理的に動機付けされた構造変化に対する感度を可能にする。
本稿では、複雑な現実世界の照明条件を正確に再現するための新しいUnityベースの合成データセットを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:35:51 GMT)
Structured Neural Marked Point Processes for Interpretable Event Interaction Modeling [12.5] マルチクラスイベントストリームは多くの実世界のアプリケーションで発生し、構造化され解釈可能なイベント間の関係を明らかにすることは、正確な予測とともに、依然として中心的な課題である。
既存のニューラルポイントプロセスモデルは非常に表現力が高いが、イベントインタラクションをブラックボックス方式でエンコードすることで、構造化された依存関係の明示的な発見を防止する。
本稿では,データからイベント・ワイド・クラス・リレーションシップを明確化しつつ,高いモデリング柔軟性を実現する構造化ニューラルマークポイントプロセス(SNMPP)を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:36:29 GMT)
Divergence Meets Consensus: A Multi-Source Negative Sampling Framework for Sequential Recommendation [12.4] 「Teacher-Peer-Self」フレームワークは、ヴィゴツキーのZPD理論に触発されたものである。
マルチソーススコアリング、分散再ランク付け、コンセンサス蒸留が組み込まれている。
常に最先端のネガティブサンプリング手法より優れています。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:42:23 GMT)
MLCommons Chakra: Advancing Performance Benchmarking and Co-design using Standardized Execution Traces [12.4] パフォーマンスベンチマークと共同設計のためのオープンでポータブルなエコシステムであるChakraを紹介します。
Chakraのコアコンポーネントは、Chakra実行トレース(ET)と呼ばれる、分散AI/MLワークロードのオープンで相互運用可能なグラフベースの表現である。
これらのETは、計算、メモリ、通信、データと制御の依存関係、タイミング、リソースの制約といった重要な操作を表す。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:40:14 GMT)
DEFLECT: Delay-Robust Execution via Flow-matching Likelihood-Estimated Counterfactual Tuning for VLA Policies [12.2] DEFLECTは、非同期VLA制御の使用可能な遅延エンベロープを大幅に拡張し、高遅延状態(5-7制御ステップ)で+6.4の成功率を、最も長い遅延時間で実スケールVLAに移行すると+4.6とした。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:14:11 GMT)
Translation-invariant quantum low-density parity-check codes from compactified fracton models [12.0] 翻訳対称性と局所チェックを備えた量子誤り訂正符号が広く研究されている。
ローカルおよび長距離の両方において、翻訳不変コードの大規模なファミリーに対して統一的な画像を提供する。
我々は、翻訳不変な後続符号のゲートとバリアを統一することは、親フラクトンモデルによって制限されていると推測する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:18:11 GMT)
D$^3$-Subsidy: Online and Sequential Driver Subsidy Decision-Making for Large-Scale Ride-Hailing Market [12.0] D$3$-Subsidy(Dynamic Driver-side Diffusion-based Subsidy)は、都市全体の補助金制御をデプロイするための階層的な拡散ベースのフレームワークである。
D$3$-Subsidyは、上限コンプライアンスを改善しながらtextttRides と textttGMV を改善し、実世界の A/B テストでかなりの上昇を確認した。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:55:55 GMT)
KIO-planner: Attention-Guided Single-Stage Motion Planning with Dual Mapping for UAV Navigation [12.0] KIO-plannerは、注意を向けた単一段階の計画フレームワークである。
新しいデュアルマッピング機構は、世界地図融合なしでキノダイナミック実現性と衝突のない飛行を強制する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:41:23 GMT)
FPED: A Functional-Network Prior-Guided Mixture-of-Experts Framework for Interpretable Brain Decoding [12.0] 本稿では,FPED(Functional-Network Prior-Guided Mixture of Experts)フレームワークを提案する。
FPEDは、異なる機能的脳ネットワークを専門の専門家としてモデル化し、視覚意味理解への補完的な貢献を捉えるために適応的ルーティングを使用している。
実験の結果,FPEDは0.68Bのパラメータしか持たない高い競争力を持つセマンティック再構築性能を示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:53:49 GMT)
BiRD: A Bidirectional Ranking Defense Mechanism for Retrieval Augmented Generation [12.0] 既存の防衛は、セマンティック分析や投票に依存しており、高い計算コストと強力な毒殺攻撃下での限られた堅牢性とのトレードオフに直面している。
デュアル信号フレームワーク上に構築された双方向のランキング防衛機構であるBiRDを提案する。
BiRDはPoisonedRAGの攻撃成功率を最大54%削減し,同時にタスク精度を最大56%向上させる。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:11:00 GMT)
ARC-RL: A Reinforcement Learning Playground Inspired by ARC Raiders [11.9] ARC-RL(ARC-RL)は、ARCレイダーに触発されたロボット形態を特徴とする4つの連続制御環境のスイートである。
4つのロボットは、統一された観察テンプレート、アクションコンベンション、シミュレーションケイデンス、および単一のクローズドフォームマルチコンポーネント報酬関数を共有している。
報酬は、ベロシティ追跡テント、健康的な生存ボーナス、フェーズロックされた歩行順応ボーナス/コストペア、アクションレギュラー、3つのセーフティペナルティ、姿勢アンカーを融合させる。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:54:40 GMT)
RoHIL: Robust Human-in-the-Loop Robotic Reinforcement Learning Against Illumination Variations [11.9] RoHILはオフラインの微調整フレームワークで、追加のリアルタイムロボットインタラクションを使用しない。
ソースワークステーション性能を維持しながら、標準のHIL-RLが崩壊するシフトライト性能を改善する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:47:38 GMT)
Entropy Concentration and Universal Typicality for Weakly Almost i.i.d. Quantum Sources [11.8] 弱いことに、量子源(quantum source)は、基準状態のテンソルパワーに収束する多部状態の列である。
経験的可観測量に対する大数の非可換弱法則と、基準状態のフォン・ノイマンエントロピーによって支配される指数次元の部分空間への集中を示す普遍エントロピー集中原理の2つを確立する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:48:03 GMT)
The Capability Paradox: How Smarter Auditors Make Multi-Agent Systems Less Secure [11.8] これは、有害な要求がドメイン固有の物語の中に隠され、Workerレポートを通じてマネージャに伝達される攻撃である。
労働者の能力が増加するにつれて、平均的なシステムレベルの攻撃成功率(ASR)は18.4%から63.9%に増加し、94.4%がピークである。
非対称なドメイン能力とWorkersのペアを組み合わさった異種アンサンブル検証を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:43:36 GMT)
Towards Distillation Guarantees under Algorithmic Alignment for Combinatorial Optimization [11.6] 蒸留は、広いデータで訓練された大きなモデルから、デプロイメントに適したより小さく、より効率的なモデルに知識を伝達する。
本研究では,DP遷移関数の複雑性パラメータにおいて,DTとして表現された蒸留問題を効率的に解けることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:28:18 GMT)
Generation of deterministic multi-mode intensity squeezing in a train of ultra-short pulses by unbalanced SU(1,1) interferometers [11.6] 我々は,sim10$ psの短パルス列で局所化されたマルチモード強度のスクイーズを示す。
パルス励起USUIにより超大規模量子状態を生成するための扉を開く。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:47:09 GMT)
PERL: Parameter Efficient Reasoning in CLIP Latent Space [11.6] PERLは、凍結したCLIPモデルを拡張し、コンパクトな共用推論モジュールを繰り返し適用する軽量適応フレームワークである。
PerLは、高速適応数ショット設定で比較した手法の中で最高のパラメータ性能トレードオフを達成する。
以上の結果から,反復潜在推論は,ディスクネイティブな視覚言語モデルにおけるパラメータスケーリングに相補的適応機構を提供する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:44:59 GMT)
CEER: Compliant End-Effector and Root Control as a Unified Interface for Hierarchical Humanoid Loco-Manipulation [11.5] 本稿では,モジュール型ヒューマノイドのロコ操作に適合するエンドエフェクタ・ルート(EE-root)制御抽象化を提案する。
EE-rootはヒューマノイドのロコ操作の実用的な抽象化を提供し、多様なスキルのモジュール化とスケーラブルな統合を可能にします。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:23:40 GMT)
Hybrid Classical-Quantum Neural Networks for Multi-Characteristic Co-Optimization of Recessed-Gate AlGaN/GaN MIS-HEMTs [11.4] 本研究は,24次元の加工・加工ベクトルから6つの電気的目標を共同最適化するためのハイブリッド古典量子ニューラルネットワーク(HQNN)を提案する。
17のプロセスにまたがる468の実験装置では、選択されたHQNN (Circuit (13, 5) at L = 2は、ANNに対して24.4%の正規化ルート平均二乗誤差(nRMSE)を減少させる。
代表的な4量子ビット回路に対する非偏極ノイズの研究は、同等のHQNNが短期量子ハードウェア上でトレーニング可能またはデプロイ可能であることを示唆している。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:35:09 GMT)
Quantum-Native Maximum Likelihood Detection in Random Access Channel with Overloaded MIMO [11.4] 過負荷マルチインプット多重出力(MIMO)システムに対する最大極大検出(MLD)の量子ネイティブな定式化を提案する。
提案した検出器は, 必要なグローバー回転数を最大65%まで減らしながら, 最適検出性能を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:35:06 GMT)
Pseudocode-Guided Structured Reasoning for Automating Reliable Inference in Vision-Language Models [11.4] Pseudocode-guided Structured Reasoning framework (PStar)を提案する。
ロボットが柔軟でステップバイステップの推論を行うのを助けるために、構造化された擬似コード推論パスを適応的に選択する。
PStarは幻覚率を大幅に下げ、POPEで87.1%、MMStarで68.0%、GPT-4Vでさえも上回っている。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:57:10 GMT)
Your Neighbors Know: Leveraging Local Neighborhoods for Backdoor Detection in Decentralized Learning [11.3] 分散学習(DL)に固有の新しいバックドア検出フレームワークArgusを紹介する。
Argusでは、正直なノードが受信したモデル更新をローカルに分析し、潜在的バックドアトリガーを特定する。
その結果,Argusは攻撃成功率を90ポイントまで下げることができた。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:17:01 GMT)
Co-Fusion4D: Spatio-temporal Collaborative Fusion for Robust 3D Object Detection [11.3] 3Dオブジェクト検出では、オブジェクトとエゴモーションの不整合はしばしばBEベースの検出器のクロスフレーム不整合である。
クロスフレーム一貫性と時間的ドリフト特徴のドリフトを統一するフレームワークであるCo-Fusion4Dを提案する。
Co-Fusion4Dは、テスト時間拡張や外部データに頼ることなく、74.9%のmAPと75.6%のNDSで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:36:09 GMT)
PRISM: A Benchmark for Programmatic Spatial-Temporal Reasoning [11.2] コードによるプログラムビデオ生成は、ピクセルレベルの拡散モデルを超えた幾何学的精度と時間的コヒーレンスを提供する。
PRISMは,実世界の知識視覚化シナリオを基盤とした,10,372人の校正命令コードペアの大規模ベンチマークである。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:28:54 GMT)
JUDO: A Juxtaposed Domain-Oriented Multimodal Reasoner for Industrial Anomaly QA [11.2] 大規模マルチモーダルモデル(LMM)により産業異常検出が大幅に進歩した
LMMにはドメイン固有の知識がなく、複雑な産業シナリオで正確な応答を生成する能力に制限がある。
本稿では,ドメイン知識とコンテキストを視覚的およびテキスト的推論に効率的に組み込むフレームワークであるJUDOを紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:57:01 GMT)
Provable Fairness Repair for Deep Neural Networks [11.2] ディープニューラルネットワーク(DNN)は、個人差別などの倫理的問題に悩まされている。
証明可能な保証を備えた新しいフェアネス修復フレームワークであるProFを提案する。
我々は、ProFが完全なデータセットで最大95.93%、入力空間で最大93.16%の精度で、証明可能な公正性修復を達成することを実証した。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:46:55 GMT)
When to Answer and When to Defer: A Decision Framework for Reliable Code Predictions [11.1] この作業では、不確実性推定、モデルのキャリブレーション、およびコードモデルに対するツールベースの禁忌処理を統合する統一的なフレームワークを導入している。
提案設計では,信頼性の高い正当性確率を割り当てたり,不確実性の下で不確実性を排除したり,不確実性のあるケースを処理するための軽量なプログラム解析手順を実行することができる。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:04:42 GMT)
On-the-Fly Input Adaptation for Reliable Code Intelligence [11.1] コード言語モデル(CLM)は、生成タスクと分類タスクの両方において、ソフトウェア工学において中心的な役割を果たす。
既存のソリューションは、モデルの再トレーニング、アーキテクチャの変更、あるいはプロンプトの再設計によって、この問題に対処する。
本研究は,パラメータを変更せずにモデル動作を改善する,オンザフライ入力適応に基づく代替戦略を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:55:49 GMT)
MSAlign: Aligning Molecule and Mass Spectra Foundation Models for Metabolite Identification [11.1] 分子の集合が与えられたMS/MSスペクトルから代謝物の化学構造を復元することからなる分子検索タスクに対処する。
本稿では,表現アライメントとコントラスト学習に基づく最近のアプローチを包含する統合フレームワークを提案する。
MSAlignは実装が簡単で、トレーニングが速く、すべてのベンチマークで既存のアプローチよりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:19:35 GMT)
Beyond Perplexity: A Geometric and Spectral Study of Low-Rank Pre-Training [11.1] 検証の難易度が近い場合でも,低ランクの手法はフルランクの訓練と同等ではなく,互いに同等ではないことを示す。
低ランクアクティベーションは、トレーニングが進むにつれて、後層のフルランクから分岐し、GaLoreはフルランクを追跡する。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:27:00 GMT)
Graph Neural Planning and Predictive Control for Multi-Robot Communication-Constrained Unlabeled Motion Planning [11.0] グラフアテンションプランナー(GATP)と分散モデル予測制御器(NMPC)を組み合わせた階層型フレームワークを提案する。
大規模チームへの一般化の改善,200msまでの通信遅延の堅牢性,および非集中型オンボード・クオータによる実用的な実現可能性を示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:18:54 GMT)
DeRegiME: Deep Regime Mixtures for Probabilistic Forecasting under Distribution Shift [11.0] DeRegiMEは、直接マルチホライズン確率予測器である。
潜伏した不確実性体制と根底にある信号とを分離する。
各予測位置を学習された繰り返しレジームに割り当てる。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:04:21 GMT)
Weakly Supervised Cross-Modal Learning for 4D Radar Scene Flow Estimation [10.9] 本稿では,弱教師付きレーダシーンフロー学習のためのタスク固有フレームワークを提案する。
市販の2Dトラッキングとセグメンテーションアルゴリズムを利用して、追跡されたインスタンスマスクを取得する。
実世界のView-of-Delftデータセットの実験は、我々の手法が最先端のクロスモーダル監視アプローチを超えることを示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:33:13 GMT)
Learning Orthonormal Bases for Function Spaces [10.8] ニューラルネットワークを用いて、スキュー随伴積分作用素によって支配される常微分方程式(ODE)の有限ランク生成を定義する。
階数 2 の生成元であっても、ODE の積分解は適切な作用素位相の下で群に密接である。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:12:05 GMT)
Uncertainty-Guided Conservative Propagation for Structured Inference in Vessel Segmentation [10.7] Uncertainty-Guided Conservative Propagation (UGCP)は,コンテナセグメンテーション用のプラグインモジュールである。
予測の不確実性は、不明瞭な地域を支援するための信頼性のある地域を導く。
構造対応変調とソースベースの安定化は、信頼性の低い伝播と過剰なドリフトを減少させる。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:31:13 GMT)
EMO-BOOST: Emotion-Augmented Audio-Visual Features for Improved Generalization in Deepfake Detection [10.7] Emo-Boostは、市販のRGBおよび音響指向のディープフェイク検出器と感情に基づくディープフェイク検出器EmoForensicsを融合したマルチモーダルディープフェイク検出フレームワークである。
その結果,EmoForensicsと低レベル集束法は相補的な信号を捕捉し,両信号の組み合わせにより,FakeAVCeleb上で平均2.1%のクロスマニピュレーション一般化AUCが向上することがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:11:10 GMT)
Devilray: A Systematic Adversarial Model Revealing Blind Spots in Fake Base Station Detection [10.6] Devilrayは、現実的な対角線空間を探索するために設計された、再構成可能で参照グレードの対向線である。
我々の研究は、実世界の振る舞いと仕様分析に基づく最初の堅牢な敵モデルを提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:04:22 GMT)
PEEK: Context Map as an Orientation Cache for Long-Context LLM Agents [10.6] 大規模言語モデル(LLM)エージェントは、長く繰り返される外部コンテキストに対してますます機能する。
既存のアプローチでは、エージェントの軌道、原料への受動的アクセス、タスクレベルの戦略のいずれかを保持する。
我々は,この向きの知識をコンテキストマップとしてキャッシュし,維持するシステムであるPEEKを紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:51:32 GMT)
JAXenstein: Accelerated Benchmarking for First-Person Environments [10.6] 我々はWolfenstein 3Dレンダリングエンジンを実装したオープンソースのベンチマークであるJAXensteinを紹介した。
JAXensteinは、同等のビジョンベースのベンチマークの何倍も高速である。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:47:55 GMT)
FusionCell: Cross-Attentive Fusion of Layout Geometry and Netlist Topology for Standard-Cell Performance Prediction [10.6] FusionCellは、ルーティングされたレイアウト幾何学とネットリストトポロジを入力として扱い、それらを統一されたモデルで明示的にフューズするデュアルモード予測器である。
我々はASAP7 PDKをベースとした7nmのデータセットを構築し、19.5k以上の細胞が149のタイプに分散している。
実験の結果,FusionCellは平均MAPE0.92パーセントの回帰誤差を低減し,ベースラインよりもSpearman/Kendallランキングを改善した。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:46:07 GMT)
Mechanisms of Object Localization in Vision-Language Models [10.4] 視覚的言語モデル(VLM)におけるオブジェクトローカライゼーションを支援するプロセスについて検討する。
局所化は、オブジェクトの空間的範囲を定義するオブジェクト整列トークンのコンテナ化機構によって駆動される。
ごくわずかな注意のみ、分類と局所化の両方に因果効果を媒介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:56:32 GMT)
High Quality Embeddings for Horn Logic Reasoning [10.3] 本稿では、下流結果のより良い埋め込みを実現するためのいくつかのアプローチを紹介し、評価する。
我々は、アンカー、正の例、負の例からなる例を必要とする三重項損失を用いて埋め込みを訓練する。
我々は、異なる知識ベース間で異なる埋め込みの比較を含む、このアプローチを評価するためにいくつかの実験を行う。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:30:00 GMT)
Agentic Trading: When LLM Agents Meet Financial Markets [10.3] 本稿では,Large Language Models(LLM)をエキスパートシステム決定パイプラインとして再編成する。
一次経験的部分集合は、行動出力と閉ループ評価の最小限の境界を満たす。
中心的な経験的発見はプロトコルの非互換性である。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:20:07 GMT)
Self-assembling Modular Aerial Robot for Versatile Aerial Tasks [10.3] LEGIONは、協調操作のための飛行中の自己組み立てが可能な再構成可能なモジュール型空中ロボットである。
各ユニットは、両端に共同装備されたドッキングインターフェースが飛行マニピュレータへのエンドツーエンドの自己組み立てを可能にする間、ニブル操作性を保持する。
飛行中に複数のユニットが自律的にドッキングし、一度ラッチすると接触力とトルクを制御して無高度のインターロックを維持できることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:36:10 GMT)
Can Large Language Models Reliably Correct Errors in Low-Resource ASR? A Contamination-Aware Case Study on West Frisian [10.2] 大規模言語モデル(LLM)は、生成誤り訂正(GER)を通じてASRを改善することを約束している。
本研究は低リソースフリーシアンのためのLDMベースGERについて検討する。
その結果、GERはほとんどの設定でASR性能を向上し、GPT-5.1の結果はオラクルWERを上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:48:32 GMT)
Reliability-Gated Source Anchoring for Continual Test-Time Adaptation [10.1] RMemSafeはROIDの拡張であり、凍結したソースの正規化予測エントロピーを使用して、目的のすべての明示的なソース結合の使用を減らします。
ASRと組み合わせて、RMemSafeは、マッチしたスプリットの連続破壊セルの8ドルに対して、最も低いエラーを達成している。
制御されたソース劣化スイープは、ROID+ASRよりも1.13タイムsの浅い損傷勾配を示し、優雅な劣化予測と一致している。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:22:25 GMT)
Fine-Tuning Without Forgetting via Loss-Adaptive Learning Rates [10.1] 新しいデータに微調整された大きな言語モデルは、タスクパフォーマンスを改善するが、事前トレーニング中に学んだ能力は低下する。
既存の方法は、高損失トークンやシーケンスを抑えるために微調整の目的を変更することで、これを緩和する。
FINCHは、標準微調整のタスク性能に適合しながら、平均93%の忘れを減らし、損失適応型学習率スケジュールである。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:36:52 GMT)
Library Drift: Diagnosing and Fixing a Silent Failure Mode in Self-Evolving LLM Skill Libraries [10.0] 自己進化型スキルライブラリは、サイレントな失敗モードに直面します — 成果駆動型ライフサイクル管理のないスキル蓄積は、検索の劣化、偽陽性注入、パフォーマンスの停滞を引き起こします。
最近の評価では、症状-LLMによるスキルは+0.0pp、人為的なスキルは+16.2pp(Bench)である。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:19:56 GMT)
StrLoRA: Towards Streaming Continual Visual Instruction Tuning for MLLMs [9.9] 本稿では,タスクの動的混合を含むデータチャンクのストリームからモデルを学習するStreaming CVIT(StrCVIT)を紹介する。
StrCVITでは、モデルは同時に新しい能力を取得し、繰り返し能力を強化し、忘れなければならない。
正規化された2段階のエキスパートルーティングフレームワークであるStrLoRAを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:02:00 GMT)
Exposing Functional Fusion: A New Class of Strategic Backdoor in Dynamic Prompt Architectures [9.8] VIPER は軽量でダイナミックな Visual Prompt Generator (VPG) 上に構築された攻撃フレームワークである。
我々はVIPERがいかにクリーンなデータで最先端のパフォーマンスを達成するかを示し、推論遅延は0.06ms (1.16%)しか認識できない。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:29:34 GMT)
Protein Thoughts: Interpretable Reasoning with Tree of Thoughts and Embedding-Space Flow Matching for Protein-Protein Interaction Discovery [9.7] 我々は、明示的な推論を伴う解釈可能な探索問題として、PPI発見を再構成するフレームワークである textbfProtein Thoughts を提案する。
タンパク質思考は、エントロピー木探索ベースラインにおいて平均11.2対47.7の平均的バインダーランクを達成し、76%の改善、および結合予測のために、訓練された値関数は91.08 pm 0.19$ Micro-F1に達する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:14:06 GMT)
LP-Eval: Rubric and Dataset for Measuring the Quality of Legal Proposition Generation [9.6] 本稿では,大言語モデル(LLM)を用いた欧州連合司法裁判所の決定による法的提案の自動生成と評価について検討する。
我々は、法的命題の品質を形式的妥当性と実体的次元に分解する3段階評価ルーブリックであるLP-Evalを紹介した。
以上の結果から,LLMは比較的良く形成され,高品質な命題を生成できることを示す一方,専門家による評価では,近年の事案よりも確立された事案から派生した命題の質が高いことが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:10:39 GMT)
MAPS: A Synthetic Dataset for Probing Vision Models in a Controlled 3D Scene Space [9.6] 我々は,視覚モデル行動がシーンパラメータに寄与するスケーラブルな楽器MAPS(Manifolds of Artificial Parametric Scenes)を紹介する。
MAPSは560のImageNetクラスにまたがる認識性を検証する2,618個のキュレートされた3Dメッシュで構成されている。
回帰に基づく感度解析により,20の畳み込みモデルと変圧器モデルの評価を行った。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:51:54 GMT)
Mechanics of Bias and Reasoning: Interpreting the Impact of Chain-of-Thought Prompting on Gender Bias in LLMs [9.5] CoT(Chain-of-Thought)プロンプトはバイアス緩和手法として提案されている。
メカニスティック分析により、CoTは特定の注目ヘッドクラスタにおけるバイアスの振る舞いのバランスを保っているが、性別バイアスは隠された表現に埋もれていることが明らかになった。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:05:13 GMT)
Tiny-Engram: Trigger-Indexed Concept Tables for Generative Vision [9.5] 小さく明示的な概念テーブルは、モジュール化された視覚的パーソナライゼーションへの実践的なルートである。
Tiny-Engramは、各概念を、登録されたn-gramマッチによってインデックスされた小さなメモリエントリのセットとしてパラメータ化する。
結果は,小型で明示的な概念表が,モジュール化された視覚的パーソナライゼーションへの実践的な経路であることを示唆している。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:27:07 GMT)
When Does Model Collapse Occur in Structured Interactive Learning? [9.4] 対話型学習環境における一般的な相互作用パターンを用いた生成モデルの性能について検討する。
モデル崩壊の発生は相互作用グラフのトポロジーに大きく依存することを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:41:09 GMT)
FGSVQA: Frequency-Guided Short-form Video Quality Assessment [9.2] ショートフォームビデオは、ユーザー生成コンテンツの品質評価に新たな課題をもたらす。
CLIPに基づく濃密なビジュアルエンコーダを用いたエンドツーエンドのビデオ品質評価フレームワークを提案する。
提案手法は, 平均階数と線形相関の点から, ショートフォーム映像データセットに対して高い性能を示すことを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:44:45 GMT)
Dual-Prompt CLIP with Hybrid Visual Encoders for Occluded Person Re-Identification [9.2] 本稿では,隠蔽者を対象としたDPL-ReID(Dual Prompt Learning ReID)モデルを提案する。
デュアル・プロンプト・ラーニング(Dual Prompt Learning、Dual-PL)戦略が組み込まれている。
また,企業LSNetがグローバル情報を捕捉し,機能拡張機構として機能する,重み付きGated Feature Fusion (WGFF) 法を設計する。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:29:01 GMT)
Tweedie's Formulae and Diffusion Generative Models Beyond Gaussian [9.1] 我々は、ツイーディの公式をブラウン運動(GBM)、二乗ベッセル(BESQ)、コックス・インガーソル・ロス(CIR)を含む重要な非ガウス過程に拡張する。
次に、GBMおよびCIRに基づく拡散モデルを用いた画像および財務時系列生成と、BESQ設定による経験的ベイズ推定に適用する。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:36:18 GMT)
PolycubeNet: A Dual-latent Diffusion Model for Polycube-Based Hexahedral Mesh Generation [9.1] 条件付き拡散モデルに基づくポリキューブ生成のためのエンドツーエンドフレームワークを提案する。
提案手法は, 表面の明示的なセグメンテーションの必要性を排除し, 対応するポリキューブ点雲を直接生成する。
実験により、PolycubeNetは任意の属を持つ複雑なCADモデルに一般化できることが示されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:27:54 GMT)
PanoWorld: A Generative Spatial World Model for Consistent Whole-House Panorama Synthesis [9.1] パノワールド(英: PanoWorld)は、ノードベースのパノラマの自動回帰生成としてハウス全体の合成を扱う生成空間世界モデルである。
クロスノードレイアウトとマテリアル一貫性を改善しつつ、高周波2D合成品質を保っている。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:30:02 GMT)
LIFT and PLACE: A Simple, Stable, and Effective Knowledge Distillation Framework for Lightweight Diffusion Models [9.0] Linear Fitting based distillation (LIFT)とPiecewise Local Adaptive Coefficient Estimation (PLACE)による粗粒蒸留の枠組み
実験の結果、LIFTとPLACEは拡散空間(イメージ/ラテント)、バックボーン(U-Net/DiT)、タスク(条件/条件)、データセット、さらにはMMDiT(SD3)のようなフローベースモデルにまで拡張できることが示された。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:03:53 GMT)
EfficientTDMPC: Improved MPC Objectives for Sample-Efficient Continuous Control [9.0] 本稿では,TD-MPCファミリ上に構築された連続制御のためのサンプル効率のよいモデルベース強化学習手法であるEfficientTDMPCを紹介する。
我々は,HumanoidBench-Hard と DMC のサンプル効率において,SOTA と DMC とのマッチングが容易であり,高効率なTDMPC がSOTA (State-of-the-art) を実現することを発見した。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:58:07 GMT)
Beyond the Purcell Effect: Controlling Pure Quantum Dephasing with Spin Noise Metasurfaces [9.0] 量子ビット純粋退化ダイナミクスを修正するためのナノフォトニックアプローチを導入する。
ダイヤモンド中のCoFeB変成層と浅い窒素空孔中心をリソグラフィで定義した手法を実験的に実証した。
この結果から,ナノフォトニック構造を用いた量子光-マター相互作用の新たなフロンティアが確立された。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:59:10 GMT)
MuMuTestUp: Mutation-based Multi-Agent Test Case Update [9.0] 変異誘導型マルチエージェントフレームワークである MuMuTestUp を提案する。
MuMuTestUpは、未発見行/ブランチの修復命令を生成し、セマンティック・シミュラリティ検索を通じて幻覚を処理する。
PRBENCHは、オープンソースJavaプロジェクト10の571サンプルのプルリクエストレベルのデータセットです。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:25:25 GMT)
GenTS: A Comprehensive Benchmark Library for Generative Time Series Models [8.9] GenTSは、生成時系列モデルの体系的な評価のために設計された包括的なベンチマークライブラリである。
統合されたデータ前処理パイプライン、汎用モデルのコレクション、パノラマ評価メトリクスを備えている。
GenTSをベースとして,様々なタスクでベンチマーク実験を行い,モデル選択の提案と今後の研究の方向性について検討した。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:01:06 GMT)
BrainDyn: A Sheaf Neural ODE for Generative Brain Dynamics [8.8] 構造化脳グラフ上での連続時間ダイナミクスのためのせん断神経常微分方程式(neural ODE)モデルであるBrainDynを導入する。
BrainDynは、長期記憶(LSTM)モデルを使用して、各脳領域の最近の活動履歴をエンコードする。
結果の表現は、シリコ摂動予測を含む下流タスクをサポートする。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:03:01 GMT)
FusionSense: Tri-Stage Near-Sensor Learning for Runtime-Adaptive Multimodal Edge Intelligence [8.8] FusionSenseは、エネルギー制約のある自律エッジシステムのための、融合対応のインテリジェントセンシングフレームワークである。
SynDroneによるデュアルモダリティ(RGB+Depth/LiDAR)設定では、FusionSenseはユニモーダルフィルタよりもはるかに高いデータ推論速度でタスク品質を維持できる。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:59:32 GMT)
CLUE: Adaptively Prioritized Contextual Cues by Leveraging a Unified Semantic Map for Effective Zero-Shot Object-Goal Navigation [8.8] 部屋や物体からの文脈的手がかりは重要であるが、それらの相対的重要性はターゲットに依存している。
本稿では,コンテキスト空間やオブジェクトの利用を適応的にバランスさせる新しいナビゲーションフレームワークであるCLUEを紹介する。
我々のフレームワークは、両方の種類の文脈情報を統合した統合意味値マップを構築する。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:15:26 GMT)
RE-VLM: Event-Augmented Vision-Language Model for Scene Understanding [8.7] 本稿では,RGB画像とイベントストリームを併用した視覚言語モデルRE-VLMを提案する。
照度チャリングされたシーンをターゲットとしたPEOD-Chatと、さまざまなシナリオをカバーするRGBE-Chatの2つのデータセットを構築した。
キャプションとVQAのベンチマークでは、RE-VLMは最先端のRGBとイベントのみのモデルより一貫して優れている。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:07:37 GMT)
Bridging the Disciplinary Gap in Explainable AI: From Abstract Desiderata to Concrete Tasks [8.7] 多くのデシラタは独立ではなく依存構造を形成する。
一度にすべてのdesiderataに対処する代わりに、依存構造のサブセットに注目し、それらを具体的なXAIタスクに変換する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:35:00 GMT)
Normative Networks for Source Separation via Local Plasticity and Dendritic Computation [8.6] ブラインドソース分離(ブラインドソース分離、BSS)は、知覚混合物から潜伏原因がどのように回収されるかを研究するためのフレームワークである。
本稿では,局所的な重み更新のみを用いて,BSSの競合性能を実現する予測エントロピー最大化を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:15:26 GMT)
Position: Uncertainty Quantification in LLMs is Just Unsupervised Clustering [8.6] 不確かさの定量化は、大規模言語モデル(LLM)を高い領域に展開するための主要なセーフガードとして広く見なされている。
LLMの主流UQメソッドは、単に教師なしクラスタリングアルゴリズムである。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:47:02 GMT)
Fast Reconstruction of Exact Maxwell Dynamics from Sparse Data [8.6] FLASH-MAX(FLASH-MAX)は、微小な点の観測から電磁場を予測するニューラルネットワークアーキテクチャである。
隠れたニューロンはマクスウェルの方程式の別個の正確な解であり、ネットワークは構成によって象徴的に支配方程式を満たす。
FLASH-MAXは、PDE残差をゼロに保ちながら、約1Kのスパース点の観測から、1%以下の相対的検証誤差に達する。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:34:11 GMT)
Continual Segmentation under Joint Nonstationarity [8.5] 進化するデータストリームは連続的なセマンティックセグメンテーションにおいて関節の非定常性を誘導する。
この設定は、実際に構築された予測システムを反映しているが、従来の連続的な学習作業では、ほとんど探索されていない。
連成クラス,ドメイン,ラベルのシフトの下で連続的なセグメンテーションを定式化し,異種密接な予測環境における学習について検討する。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:20:00 GMT)
Atoms of Thought: Universal EEG Representation Learning with Microstates [8.5] 脳波(EEG)信号から普遍的な表現を学ぶことは、神経情報学の分野における最先端のアプローチである。
本稿では, 簡便かつ効果的な脳波表現, すなわちマイクロステートについて検討する。
連続した脳波信号を離散的なマイクロステートのシーケンスにクラスタリングすることで、大きな医療用脳波データセットから普遍的なマイクロステートトークンを作成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:59:31 GMT)
SimGym: A Framework for A/B Test Simulation in E-Commerce with Traffic-Grounded VLM Agents [8.5] SimGymは、ライブブラウザで動作するビジョン構造化モデル(VLM)エージェントを使用して、EコマースストアフロントでのA/Bテストのシミュレーションを行うフレームワークである。
実験サイクルを数週間から1時間以内に短縮し、実際の購入者を候補の変種に露出させることなく、迅速な実験を可能にする。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:46:41 GMT)
Skim: Speculative Execution for Fast and Efficient Web Agents [8.5] SkimはWebエージェントの投機的実行フレームワークである。
これは、目的を持ったウェブサイトの予測可能な構造を利用する。
Skimは、タスク毎の平均的なコストを1.9倍、レイテンシを33.4%削減する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:45:27 GMT)
Optimizing Computational-Statistical Runtime for Wasserstein Distance Estimation [8.4] 正方形距離は確率分布間の差を測定するのによく使われるツールである。
我々は,サンプルの正規カルテシアングリッドスケッチを導入するためのSample-$計算パラダイムを開発した。
我々は、$W(P, Q)$を$-max(2,fracd+1+o(1)1+)$ time for $0 1$ Hlder smooth distributions の$$エラー内で近似する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:10:47 GMT)
Closed-Loop Hybrid Digital Twin Platform for Connected and Automated Vehicle Validation [8.4] 本稿では,コネクテッド・アンド・オートマチック・ビークル(CAV)検証のための,新しいリアルタイムハイブリッドデジタルツインプラットフォームを提案する。
その中核となるイノベーションは、高忠実度CARLA-SUMOと物理試験場と車両との密結合であり、低遅延のV2X通信リンクによって実現されている。
詳細な実装には、フルスケールのアセット再構築にPhotogrammetryを使用し、スケーラブルでマルチユーザ操作にクラウドエッジのコラボレーティブアーキテクチャが含まれる。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:44:59 GMT)
Training Neural Networks with Optimal Double-Bayesian Learning [8.3] 本稿では,勾配降下の重要なパラメータである学習率に関する新しい確率的枠組みを提案する。
理論的に最適な学習速度は、これらの2つのプロセスから導出することができ、勾配降下に使用される。
ネットワークトレーニングとモデル性能のための二重ベイジアンフレームワークの提案についても論じる。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:39:36 GMT)
Spacetime Optimal-Transport Attention for Visuo-Haptic Imitation Learning of Contact-Rich Manipulation [8.3] 軟質マックス正規化パッチアテンションに代わる3モーダル核融合バックボーンであるSpacetime Optimal-Transport Attention (SO-TA)を提案する。
明示的な限界制約は、接触に富むタスクに対する構造的帰納バイアスとして機能し、条件付き空間選択を奨励する。
我々は,3つの実ロボット上でのSO-TAの評価を行い,穴内密組立,BCM配線コネクタ挿入,曲面マーク消去を行った。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:29:21 GMT)
Bilateral Teleoperation with Compliant 6-DOF Pose-and-Force Sensing [8.3] 両面に装着した低コストの6-DOFポーズ・アンド・フォース式エンドエフェクタ Delta6 を提案する。
このシステムは、120pm40$msまでの遅延と1%のパケットロスを安定して追跡する。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:03:23 GMT)
Contrastive Learning under Noisy Temporal Self-Supervision for Colonoscopy Videos [8.2] ポリープ・トラックレットの堅牢な表現を学習することは、AIによる大腸内視鏡の応用を可能にする鍵となる。
本研究では,大腸内視鏡手術の逐次的ワークフローを利用して,時間的構造から自己監督的関連を導出する。
本稿では,ポリプ検索と再同定,サイズ推定,組織分類など,複数の下流タスクにおける学習表現の有効性を実証する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:33:39 GMT)
ZEBRA: Zero-shot Budgeted Resource Allocation for LLM Orchestration [8.2] 連続非線形クナップサック問題に対する多相予算割当を低減するフレームワークであるZEBRAを提案する。
150ドルのAPPS符号化ベンチマークでは、ZEBRAの2つの変種は全ての集計基準においてLLM-directよりも優れていた。
我々は,自律型マルチエージェントシステムの経済行動を改善するために,推論時の軽量なアルゴリズムガイダンスを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:50:05 GMT)
Multi-site PPG: An In-the-Wild Physiological Dataset from Emerging Multi-site Wearables [8.2] 本報告では,4つのカスタム開発ウェアラブルから収集したWild内生理的データセットであるMulti-site PPGについて述べる。
各デバイスは、緑と赤外反射PSG、3軸加速度、温度をデバイス間アライメントのためのタイムスタンプで記録する。
参加者は、通常のルーチンを継続しながら、昼間活動中に何日間もこのデバイスを装着した。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:42:45 GMT)
Towards Trust Calibration in Socially Interactive Agents: Investigating Gendered Multimodal Behaviors Generation with LLMs [8.2] GPT-5.4は様々なモードでコヒーレントな振舞いを生成できることを示す。
また、ジェンダーがプロンプトで特定されると、LDMは社会的ジェンダーステレオタイプを再現する傾向がある。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:59:21 GMT)
Structuring Open-Ended NAS: Semi-Automated Design Knowledge Structuring with LLMs for Efficient Neural Architecture Search [8.2] 現在のニューラルアーキテクチャサーチ(NAS)法は、しばしば事前に定義された制限付き探索空間によって制限される。
本稿では,モデル設計の知識を半自動で構造化し,探索過程を導くことを提案する。
われわれのアプローチはまず、アーキテクチャ属性の高レベルな構造テンプレートを定義する。LLMはこのテンプレートを論文を解析し、この構造化された設計知識を具現化したリッチで多様な検索空間を作成する。
CIFAR-10, CIFAR-100, ImageNet16-120でそれぞれ0.84, 2.17, 2.35点向上した高性能アーキテクチャの発見におけるFairNADの有効性を示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:41:48 GMT)
Training-Free Bayesian Filtering with Generative Emulators [8.2] 本研究では, 粒子フィルタの最適変種である追加トレーニングを必要とせずに, 動的系の拡散型エミュレータを実装可能であることを示す。
大気力学を含む非線形カオス系の実験により、提案手法は粒子フィルタリングを高次元設定に拡張することに成功した。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:52:09 GMT)
UAVFF3D: A Geometry-Aware Benchmark for Feed-Forward UAV 3D Reconstruction [8.1] フィードフォワードUAV3D再構成のための幾何対応ベンチマークであるUAVFF3Dを紹介する。
UAVFF3Dには、170万以上の実際のUAV画像と、高品質なテクスチャ化された3Dモデルからレンダリングされた370万以上の合成画像が含まれている。
また、プロジェクション幾何学の曖昧さを診断するための制御されたHFOV高さテストサブセットも含まれている。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:33:45 GMT)
What Are LLMs Doing to Scientific Communication? Measuring Changes in Writing Practices and Reading Experience [8.1] 私たちは、ACLアンソロジー(2020-2024)から37,000以上の論文からなる自然主義コーパスと、3000の人文のパスからなる合成データセットを作成します。
まず,単語の頻度と使用状況が時間とともに大きく変化したことを示す。
次に、より複雑なスタイリスティックな特徴をモデル化し、LLM修飾テキストがより頻繁に、特定の構文構造、より複雑で長い単語、より低い語彙の多様性を含むことを確認する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:54:33 GMT)
Dywave: Event-Aligned Dynamic Tokenization for Heterogeneous IoT Sensing Signals [8.1] モノのインターネット(IoT)システムは、ユビキタスセンサーから不均一なセンシング信号を継続的に収集する。
これらの信号は本質的に非定常かつマルチスケールであり、標準的なトークン化技術に固有の課題を提起している。
本稿では,IoTセンサ信号の動的トークン化フレームワークであるDywaveを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:38:54 GMT)
Mitigating Mask Prior Drift and Positional Attention Collapse in Large Diffusion Vision-Language Models [8.0] LDVLMは反復的な生成と劣化した視覚的接地に悩まされている。
本研究では,Mask Prior Suppression と Monotonic RoPE Scaling を導入したトレーニングフリーアプローチを提案する。
以上の結果から,これらの障害は軽量なプラグアンドプレイ戦略によって効果的に対処できることが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:58:43 GMT)
Lost in Interpretation: The Plausibility-Faithfulness Trade-off in Cross-Lingual Explanations [7.9] 英語の説明は、しばしば流動的であるが、緩やかに固定された理性を生み出す。
社会的にニュアンスのある分類では、英語のピボットは実践的な手がかりを保存できない。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:44:48 GMT)
Toward Template-Free Explainability for Monte Carlo Tree Search [7.9] 確率論的探索アルゴリズムは、不確実性の下でのシーケンシャルな意思決定タスクの解決に非常に効果的であることが証明されている。
大規模言語モデル(LLM)がモンテカルロ木探索決定の根拠に基づく説明を生成できるフレームワークを提案する。
本フレームワークは,自然言語質問を意図するカテゴリの構造化にマッピングし,既存の木に十分な証拠があるかどうかを判定し,必要に応じて対象拡大をトリガーし,訪問数,価値推定,リスク情報などのツリー統計を用いた説明を生成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:16:55 GMT)
SDM: A Powerful Tool for Evaluating Model Robustness [7.8] 逐次差分最大化(SDM)という,新規で強力な勾配に基づく攻撃手法を提案する。
SDMはより強力な攻撃性能を達成し、より優れたコスト効率を示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:10:24 GMT)
1GC-7RC: One Graphic Card -- Seven Research Challenges! How Good Are AI Agents at Doing Your Job? [7.8] **1GC-7RC*は、言語モデリング、画像分類、セマンティックセグメンテーション、グラフ学習、テキスト分類にまたがる7つのMLタスクのベンチマークである。
各タスクは、ベースライントレーニングスクリプトとともに、ロックされたデータ準備および評価スクリプトを提供する。
ベンチマーク、ハーネス、すべての評価アーティファクトはGitHubで公開されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:26:38 GMT)
Projecting Latent RL Actions: Towards Generalizable and Scalable Graph Combinatorial Optimization [7.7] グラフニューラルネットワーク(GNN)と組み合わせた強化学習(RL)の最近の進歩は、学習ベースのGCOソルバを大幅に改善した。
連続的なGNNベースのアクション埋め込み空間で直接動作する新しいRL-GCOアプローチであるプロジェクションエージェントを導入する。
様々なベンチマークにおいて、我々の手法は既存のソリューションよりも最大16.2倍高速な推論と最大40%優れた一般化を実現している。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:55:44 GMT)
Probing Embodied LLMs: When Higher Observation Fidelity Hurts Problem Solving [7.6] ロボットシステムの認知コンポーネントとして,大規模言語モデルが提案されている。
本研究は, 生体内LCM剤について, 使用可能な情報を変化させることで, 行動学的に検討した。
ノイズフリーベースラインよりも2.85倍の成功率で40%のフリップ確率でピークとなる中等雑音が性能を向上させることが判明した。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:27:00 GMT)
Smartphone-based Circular Plot Sampling for Forest Inventory [7.6] 本稿では,1本のウォークスルー映像から完全なプロットサンプリング木計測を可能にする軽量なスマートフォンベースのパイプラインを提案する。
提案手法は,事前学習した単眼深度推定と木インスタンスセグメンテーションを同時局所化・マッピング(SLAM)フレームワークに統合する。
管理林と天然林の両方で,平均絶対誤差は1.51cm(MARE 3.98%)と2.30cm(MARE 5.69%)であった。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:30:22 GMT)
When Critics Disagree: Adaptive Reward Poisoning Attacks in RIS-Aided Wireless Control System [7.5] 本稿では,ソフトアクター・クリティカル (SAC) エージェントに対するアダプティブアタック(アダプティブアタック)を提案する。
Reconfigurable Intelligent Surfaces (RIS) によって支援された認知無線ネットワーク(CRN) 環境では、SACエージェントは長期二次ユーザ(SU)率を最大化する。
DGRPは報酬を腐敗させ、特にSACのデュアル批評家がかなりの意見の相違を示したときである。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:59:43 GMT)
HalluCXR: Benchmarking and Mitigating Hallucinations in Medical Vision-Language Models for Chest Radiograph Interpretation [7.5] HalluCXRは、856個の胸部X線写真から6つのアーキテクチャ的に多様な視覚言語モデルを評価するベンチマークである。
61.9--82.3%のアウトプットには幻覚が含まれており、臨床的に危険なエラーは最大80.2%である。
これらの結果から, 幻覚検査, 冗長性に基づくリスクモニタリング, アンサンブルに基づく安全層が臨床展開の前提条件であることが確認された。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:30:32 GMT)
FuRA: Full-Rank Parameter-Efficient Fine-Tuning with Spectral Preconditioning [7.5] フルファインチューニング (Full FT) とパラメータ効率の良いファインチューニングはどちらも、事前トレーニング中に確立されたスペクトル構造を考慮せずに重み更新を導入する。
本稿では,ブロックテンソル-トレイン因数分解 W = LSR に基づく効率的なフルランク適応フレームワーク FuRA を提案する。
この設計は同時にフルランクのスペクトルプリコンディショニングを提供し、フルランクの更新表現を保ち、パラメータ、メモリ、ステップタイム効率をLoRAに匹敵するものにしている。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:11:25 GMT)
Oracle Supervision Transfers for Hyperparameter Prediction in Model-Based Image Denoising [7.5] HyperDnは、ソース設定にまたがってオラクルの監督をプールする単一の構成条件付き予測器である。
ターゲットのオラクルラベルがわずか2ドルで、HyperDnはオラクルの$0.90$,dB以内で$0.23$,dBに達する。
ターゲットのオラクルラベルがなければ、HyperDnは目に見えない2種類のノイズの混合で、ほぼ視線に近いPSNRに達する。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:41:44 GMT)
A Theory of Time-Sensitive Language Generation: Sparse Hallucination Beats Mode Collapse [7.5] 文字列のグローバルな選好順序の下で,言語生成の限界について検討する。
私たちは広い範囲を目指していますが、タイムラインの追加要件を課しています。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:29:08 GMT)
Efficient Fault-Tolerant Ancilla Preparation for Quantum BCH codes via Cyclic Symmetry [7.5] フォールトトレラント量子コンピュータ(FTQC)の実現における大きな課題の1つは、多数の物理量子ビットの要求である。
高いレートと大きなコード距離を提供する量子BCHコードは、未探索の候補を約束している。
本研究では, 低オーバーヘッド蒸留法を設計し, 耐故障性のある回路がどの耐故障性を実現できるかを判断する枠組みを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:22:47 GMT)
FiLark: a streaming-first software framework for end-to-end exploration, annotation, and algorithm integration in distributed acoustic sensing [7.4] FiLarkはPythonフレームワークで、データアクセス、信号処理、可視化、DASの監視において、emph-streaming-first原則を均一に適用する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:17:02 GMT)
A Reproducible Log-Driven AutoML Framework for Interpretable Pipeline Optimization in Healthcare Risk Prediction [7.4] 本研究では、決定論的かつログ駆動の自動機械学習フレームワークであるyvsoucom-iterkitを紹介する。
18,000以上のパイプライン構成にわたるPima Indians DiabetesとStrokeデータセットの実験は、部分的に冗長な検索スペースを明らかにしている。
このフレームワークは、アンサンブルモデルを使用して、強力で安定したパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:57:56 GMT)
Scalable, Energy-Efficient Optical-Neural Architecture for Multiplexed Deepfake Video Detection [7.3] 本稿では,軽量ディジタルフロントエンドと空間多重光デコードバックエンドを組み合わせたハイブリッドデジタルアナログディープフェイクビデオ検出フレームワークを提案する。
我々は,Celeb-DFビデオデータセットでそれぞれ97.79%,99.86%,95.72%の平均ディープフェイク検出精度,感度,特異性を達成した。
この結果から,光学計算をAI推論に統合することにより,スループット,エネルギー効率,対向ロバスト性を同時に向上させることができることがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:42:47 GMT)
Quantum-enhanced distributed network sensing using multiple quantum resources [7.3] 複数の量子資源を利用する多相推定を対象とする量子拡張分散ネットワークセンシングの理論スキームを提案する。
その結果、3つのTQRを全て使用すれば、2つのTQRのみを使用するよりも、知覚性能が向上することが明らかとなった。
実測感度が対応する量子クレーマーラオバウンドに近づくことができる多モードW型コヒーレント状態に対して, グローバルかつ部分的に触媒された実測ホモダイン測定手法を同定する。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:41:58 GMT)
Tackle CSM in JPEG Steganalysis with Data Adaptation [7.3] TADAは、未ラベルの小さなターゲットセットから未知の処理パイプラインをエミュレートするフレームワークである。
これはCSMに対するロバスト性を大幅に向上させ、強い全体論と原子論のベースラインに比べて操作の一般化を改善する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:03:43 GMT)
An Exterior Method for Nonnegative Matrix Factorization [6.9] 非制約行列分解は、非負の近似を持つ低ランクな$X近似 UVT$を求める。
eNMFは、同じ時間設定で最大150%のスピードアップでパフォーマンスが向上する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:03:11 GMT)
An exponential mechanism based on quadratic approximations for fine-tuning machine learning models with privacy guarantees [6.9] トレーニング済みの機械学習モデルを小さな、機密性の高いデータセットに微調整することで、個々の新しいデータポイントを記憶するリスクがある。
差分プライバシーを確保しつつ、微調整の指数的機構に基づくランダム化アルゴリズムを開発した。
MNISTベンチマークとMIMIC臨床データセットの数値実験は、既存の微分プライベート微調整技術と競合する性能を示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:43:22 GMT)
Classification of IED-free EEG Responses for Assisted Epilepsy Diagnosis [6.8] 脳波が間膜てんかん性放電(IED)を欠いている場合、てんかんの診断は困難である
そこで本研究では,脳波記録を再現可能なパイプラインで分類し,刺激処理中に取得した脳波記録を分類する。
刺激誘発活性,特にIPSは,IEDフリーてんかん分類において有意な識別情報を含むことを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:12:24 GMT)
Taking Cryptography Out of the Data Path via Near-Memory Processing in DRAM [6.8] AES-128やSHA-256のような暗号アルゴリズムは、データのセキュリティと整合性を保証するのに不可欠である。
プロセッシング・イン・メモリ(PIM)は有望なアーキテクチャパラダイムとして登場した。
暗号アルゴリズムの高速化における実世界のPIMの可能性と限界について検討する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:06:03 GMT)
Convergence of Consensus-Based Particle Methods for Nonconvex Bi-Level Optimization [6.8] 平均場法則は、目標二段階解の任意のワッサーシュタイン近傍に到達し、打点時間まで明示的な指数率を持つことを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:00:05 GMT)
k-Inductive Neural Barrier Certificates for Unknown Nonlinear Dynamics [6.7] 本稿では、(部分的に)未知の非線形システムに対するk誘導型ニューラルバリア証明(k-NBC)を構築する。
我々は、単一の状態軌跡を用いて、ウィレムやアルの基本的な補題の一般化を活用し、未知のモデルのデータ駆動表現を構築する。
我々は、(部分的に)未知のダイナミクスを持つ3つの非線形ケーススタディに対するアプローチを検証する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:58:37 GMT)
Robust Subspace-Constrained Quadratic Models for Low-Dimensional Structure Learning [6.6] 高次元データから低制約ラジアル構造を学習するための頑健な部分空間制約二次モデル(SCQM)を開発した。
提案手法は,ロバスト性と精度の観点から既存手法より一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:35:13 GMT)
Real-World On-Vehicle Evaluation of Embedding-Based Anomaly Detection [6.5] 適応型リアルタイム異常検出法を提案する。
この方法は、単一の参照画像を通して正常性を頑健にモデル化する。
本手法は,実世界のシナリオにおいて,標準ベンチマークや自動走行車上で評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:12:30 GMT)
MMGS: 10$\times$ Compressed 3DGS through Optimal Transport Aggregation based on Multi-view Ranking [6.4] 本稿では,グローバルな幾何分布マッチング問題としてガウス最適化を定式化する新しいフレームワークを提案する。
提案手法は,バニラ3DGSと比較して,プリミティブのtextbf10$%とトレーニング速度を高速化する textbf10$times$のみを用いて,最先端のレンダリング品質を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:33:02 GMT)
Corrected Integrated Laplace Approximation for Bayesian Inference in Latent Gaussian Models [6.4] LGMの効率的なベイズ推定は、しばしば潜伏変数を余分に排除する必要がある。
ILAが導入した誤差を補正する重要なサンプリング手法を提案する。
勾配に基づくアルゴリズムをサポートするために,本手法を自動微分フレームワークに実装する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:02:54 GMT)
Consistently Informative Soft-Label Temperature for Knowledge Distillation [6.3] 知識蒸留(KD)は,その予測分布を一致させて,高能力の教師からコンパクトな学生に知識を伝達する。
標準の固定温度設計は本質的にサンプルに依存しない。
CIST(Consistently Informative Soft-label Temperature)を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:11:54 GMT)
Synthesis and Evaluation of Long-term History-aware Medical Dialogue [6.3] 高品質な長期医療対話をLLMと合成するための枠組みを提案する。
我々は,医療エージェントの記憶能力を評価するために,対話内推論,対話間推論,合成推論の3つのベンチマークタスクを構築した。
ベンチマーク実験によると、最先端のLLMでさえMediLongChatと競合している。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:38:41 GMT)
What Do Biomedical NER and Entity Linking Benchmarks Measure? A Corpus-Centric Diagnostic Framework [6.2] 注釈付きコーパスからベンチマーク関連プロパティを診断するためのコーパス中心のフレームワークを提案する。
この枠組みを病気、化学物質、細胞タイプにまたがる9つのコーパスに適用すると、コーパスの性質は著しく異なることが判明した。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:19:22 GMT)
Network-Aware Bilinear Tokenization for Brain Functional Connectivity Representation Learning [6.2] 我々は,脳機能的接続トークン化を再定義する自己教師型学習フレームワークであるNERVEを紹介する。
画像ベースのMAEとは異なり、ネットワークペアによって定義されたFCパッチは、サイズが不均一であり、異なる機能的役割に対応する。
NERVEは、新しく構造化された双線形因子化によってFCパッチを埋め込む。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:47:48 GMT)
NeuroQA: A Large-Scale Image-Grounded Benchmark for 3D Brain MRI Understanding [6.2] NeuroQAは3次元脳磁気共鳴画像(MRI)における視覚的質問応答のための大規模ベンチマークである
5-104歳と5つの臨床領域(アルツハイマー病、パーキンソン病、腫瘍、白質疾患、神経発達)にまたがる。
NeuroQAは、Yes/No、Multi-choice、オープンエンドフォーマットの11の臨床基礎的推論スキルを評価している。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:54:12 GMT)
DRReduce: Enhancing Syntax-Guided Program Reduction with Dependency Reconstruction [6.1] プログラムリダクションは、プログラムを最小限の再現可能なテストケースに単純化するテクニックである。
CReduceのような言語固有のツールは、C/C++の深いセマンティック知識を活用することで、強力なパフォーマンスを達成するが、単一の言語ファミリに強く結びついている。
本稿では,このギャップを埋めるフレームワークであるDRReduceを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:06:37 GMT)
When Irregularity Helps: A Subclass Analysis of Inductive Bias in Neural Morphology [6.1] 非常に小さく、構造的に特異的な不規則なサブタイプが、モデルエラーの不均等な共有であることを示す。
これらの結果から, 過度な低周波形態素パターンと特定の形態素過程との相互作用により, 誤差濃度が誘導されることが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:18:47 GMT)
Mind Your Moras: Orthography-Aware Error Analysis of Neural Japanese Morphological Generation [6.1] 本報告では, 日本語の過去の形態変化の正書法に基づく誤り解析について述べる。
SIGMORPHON 2020 と 2023 の共有タスク規約に従ってフォーマットされたデータセットを用いて,過去センス形成における2つの文字レベルのシーケンス・ツー・シーケンスアーキテクチャの評価を行った。
高い集約精度にもかかわらず、モデルはヒラガナの特定の正書法特性を囲む体系的、言語学的に解釈可能な誤りを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:04:33 GMT)
Long-term Power Grid Planning via Answer Set Programming [6.1] 長期電力グリッドプランニングは上記のプロセスに対処する。
ASP.NETを使用した長期電力グリッド計画プロセスの自動化と最適化のための最初のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:54:15 GMT)
CoX-MoE: Coalesced Expert Execution for High-Throughput MoE Inference with AMX-Enabled CPU-GPU Co-Execution [6.0] CoX-MoEは、AMX(Advanced Matrix Extensions)対応のCPU-GPU協調システムである。
MoE推論を総合的に最適化するために、合体したエキスパート実行と、高いスループットのために戦略的ワークロードオーケストレーションを組み合わせる。
最先端のフレームワークと比較して、CoX-MoEは7.1倍、2.4倍のスループットを実現している。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:52:32 GMT)
Code Generation by Differential Test Time Scaling [6.0] 本稿では,カバレッジ誘導差分解析に基づくコード生成のための新しいテスト時間スケーリング手法であるDiffCodeGenを提案する。
DiffCodeGenは、様々なサンプリングとプロンプト戦略を使用して多様なコード候補を生成し、次に、カバレッジ誘導ファジィを適用して入力を合成する。
DiffCodeGenを4つの大きな言語モデルで評価し、ベースラインよりも一貫した改善を実証した。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:39:14 GMT)
Can Large Language Models Revolutionize Survey Research? Experiments with Disaster Preparedness Responses [6.0] 大規模な言語モデル(LLM)は治療として提案されているが、完全なサーベイワークフロー全体にわたる厳密な評価はほとんど残っていない。
アンケート設計, サンプル選択, パイロットテスト, 欠落データ計算, および収集後の分析を対象とする, LLM 統合のための5段階フレームワークを提示し, 評価した。
保護モチベーション理論 (PMT) 制約付き共起知識グラフを導入し, ゼロショット推論, 検索拡張ベースライン, 新規な理論インフォームド変種にまたがる7つのLLM構成を開発する。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:58:36 GMT)
SafeAlign-VLA: A Negative-Enhanced Safe Alignment Framework for Risk-Aware Autonomous Driving [6.0] VLA(Vision-Language-Action)モデルは、その強力な推論能力のために有望である。
我々は,教師付き学習と強化学習に否定データを組み込んだ,ネガティブに強化された安全なアライメントフレームワークであるSafeAlign-VLAを提案する。
NAVSIMとDeepAccidentの実験は提案されたフレームワークを検証する。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:26:43 GMT)
Rewarding Beliefs, Not Actions: Consistency-Guided Credit Assignment for Long-Horizon Agents [5.9] 検証可能な報酬(RLVR)からの強化学習は、長期的対話的タスクにおいて、大規模言語モデル(LLM)エージェントを改善するための有望なパラダイムである。
本稿では,構造化信念状態を明示的にモデル化したプロセスレベル強化学習アルゴリズムReBel(Reward Belief)を提案する。
我々は、ALFWorldやWebShopといった長軸ベンチマークに挑戦する上で、ReBelを評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:19:29 GMT)
FLUXtrapolation: A benchmark on extrapolating ecosystem fluxes [5.8] FLUXトラポーレーション(FLUXtrapolation)は、生態系のフラックスを、徐々に難しい分布シフトの下で外挿するためのベンチマークである。
FLUXtrapolationは、フラックスアップスケーリングに関するドメインの専門知識に基づいて設計されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:09:05 GMT)
Spherical Harmonic Optimal Transport: Application to Climate Models Comparisons [5.6] 最適なトランスポートは、サポートの幾何学を尊重しながら測度を比較するための強力なフレームワークを提供するが、高価な計算コストが伴う。
熱核コストは、バランスの取れたケースとバランスの取れないケースで時間がなくなると、最適な輸送コストに収束する。
我々は高速なシンクホーンアルゴリズムを導出し、メモリは$mathcalO(n)$と$mathcalO(n3/2)$の反復時間しか必要としない。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:51:33 GMT)
Probabilistic Tiny Recursive Model [5.6] Tiny Recursive Models (TRM)は、現代の大規模言語モデル(LLM)のパラメータのごく一部で複雑な推論タスクを解決する。
本稿では,テスト時間計算スケーリングのためのタスク依存フレームワークであるProbabilistic TRMを紹介する。
PTRMは、それぞれの深い再帰ステップでガウスノイズを注入し、平行軌道が様々な溶液盆地を探索することを可能にする。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:00:38 GMT)
DAG-Based QoS-Aware Dynamic Task Placement for Networked Multi-Stage Control Pipelines [5.5] 現在の物理AIは、クローズドループのビジュアルサーボパイプラインに大きく依存している。
認識タスクをオンサイトエッジに静的にオフロードすることは、標準化された産業ネットワーク上でのレイテンシに敏感で正確な工業的設定には不適切である。
本稿では,ネットワーク型ロボットにおける知覚・知覚・計画制御パイプラインのための指向型非巡回グラフ(DAG)に基づく品質・オブ・サービス(QoS)対応動的タスク配置(DTP)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:17:02 GMT)
D-Convexity: A Unified Differentiable Convex Shape Prior via Quasi-Concavity for Data-driven Image Segmentation [5.4] 凸性は、多くの自然および人造構造の基礎となる基本的な幾何学的先行である。
本稿では,ネットワークの出力マスク関数 u の準凸性に基づいて,統一された閾値のない凸性を提案する。
我々の分析は、離散1-0-1ライン制約から曲率や符号付き距離 Laplacian based level-set priors まで、以前の凸形状モデルの幅広いスペクトルを統一する。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:27:41 GMT)
Synergistic Foundation Models for Semi-Supervised Fetal Cardiac Ultrasound Analysis: SAM-Med2D Boundary Refinement and DINOv3 Semantic Enhancement [5.4] 胎児心エコー画像の関節分割と分類のための半教師付き枠組みを提案する。
本手法は, SAM-Med2DとDINOv3を併用し, 擬似ラベル品質を向上する。
FETUS 2026 のリーダーボードで評価したところ、Dice similarity Coefficient 79.99%、正規化表面距離 61.62%、F1-score 41.20% である。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:00:19 GMT)
AgentCo-op: Retrieval-Based Synthesis of Interoperable Multi-Agent Workflows [5.4] AgentCo-opは再利用可能なスキル、ツール、および外部エージェントを実行可能なアーティファクトに構成する検索フレームワークである。
実行時に障害を示すコンポーネントに対して、自己誘導の局所的な修復を適用する。
空間論と遺伝子セットの解釈のための特殊エージェントを協調し、単一セルマルチオームデータ上での相互モダリティマーカー分析のための並列ワークフローを構築する。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:22:21 GMT)
Quantifying the Pre-training Dividend: Generative versus Latent Self-Supervised Learning for Time Series Foundation Models [5.4] 自己教師型学習(SSL)のビジョンとNLPは、時系列への急速な採用を動機付けている。
さまざまな時間的タスクにまたがってSSLが付加する価値である“事前トレーニング配当”を評価するためのフレームワークを確立します。
我々の分析では、事前学習配当は高度に非対称であり、異常検出と分類では最大375%の利得が得られるが、予測には限界がある。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:13:20 GMT)
A Survey on Security with Quantum Computing [5.3] 量子コンピューティングは、古典的なシステムでは計算不可能な問題を解くことができる革新的コンピューティングパラダイムとして登場した。
この調査は、量子コンピュータのセキュリティ問題、量子コンピュータによるセキュリティ脅威、および量子システム用に開発されたセキュリティメカニズムに焦点を当てている。
本稿では、量子ハードウェアとソフトウェアの脆弱性、既存の暗号インフラとサイバーセキュリティメカニズムに対する量子コンピューティングの影響、および量子レジリエントソリューションの開発について検討する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:11:46 GMT)
MatPhys: Learning Material-Aware Physics Parameters for Deformable Object Simulation from Videos [5.3] MatPhysは、シングルビュービデオからバネマスパラメータを予測する、素材対応フィードフォワードフレームワークである。
出現と物理の橋渡しとして,共有材料埋め込みの学習資料コードブックを紹介した。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:32:49 GMT)
A Two-Phase Adaptive Balanced Penalty Method for Controllable Pareto Front Learning under Split Feasibility Conditions [5.3] 我々は、厳密な理論的保証を伴う分割実現可能性条件下でのハイパーネットワークのトレーニングのオープンな問題に対処する。
本稿では, 最適性, 設定実現可能性, 画像実現可能性という3つの勾配成分を, 計算可能下界によって駆動される適応的インジケータによってブレンドする適応バランスペナルティ(ABP)アルゴリズムを提案する。
ABP-HyperNetは、36-49%から87-100%まで実現可能性を高めることで、制限のないベースラインよりも2.3倍高いFasible Hypervolume(EFHV)を達成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:37:22 GMT)
A Framework for Evaluating Zero-Shot Image Generation in Concept-based Explainability [5.3] 概念に基づく説明可能な人工知能(XAI)は、人間の理解可能な視覚的特徴を使ってモデルを解釈する。
しかし、大きな課題は、それぞれの概念を表現するためにラベル付き画像の大規模なセットに依存することである。
本研究では,ゼロショットテキスト・トゥ・イメージ(T2I)生成モデルを合成概念データセットのソースとして利用する方法について検討する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:46:58 GMT)
Reason--Imagine--Act: Closed-Loop LLM Decision Making with World Models for Autonomous Driving [5.3] オンライン安全検証のためのクローズドループフレームワークであるReason-Imagine-Act(RIA)を提案する。
統一されたCARLAポイントゴールプロトコルの下で、RIAは80.05%のルート完了、51.10%の到着率、0.20%の衝突率を達成した。
RIAは、コアクローズドループメトリクスで、CARLA TMやMADAなど、トレーニング不要のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:23:14 GMT)
Collocational bootstrapping: A hypothesis about the learning of subject-verb agreement in humans and neural networks [5.2] 単語共起パターンの規則性は構文依存の手がかりとなるかを検討する。
統計的学習者が主語と動詞の合意をしっかりと学習する変数レベルは,多岐にわたることが判明した。
これらの結果から,コロケーション・ブートストラッピングは,子どもが受ける入力のタイプに対する学習戦略として有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:05:05 GMT)
Off-line quantum-advantage feature extraction for industrial production [5.2] Kipu Quantumのフレームワークは量子機能サロゲートを導入している。
私たちは、量子コンピュータにデータの全集合を忠実に表現する小さな、慎重に選択されたサブサンプルを見るようにしました。
単純な古典的モデル、サロゲートは量子誘発パターンを学習し、ほぼゼロのコストで他のデータセットに適用する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:00:25 GMT)
Text-to-SPARQL Generation with Reinforcement Learning: A GRPO-based Approach on DBLP [5.2] グループ相対ポリシー最適化は、DBLP-QuAD上のQwen3-1.7Bモデルに適用される。
本研究では、結果に基づく報酬を用いた強化学習が、ゼロショットテキスト・トゥ・SPARQL生成を行うために、小さな命令調整言語モデルを訓練できるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:20:57 GMT)
Deep Tech to Space: Space Data Centers and AI Revolution at the Edge [5.2] Space Data Centers (SDC) は、ソフトウェア駆動のマルチテナント人工知能ベースのサービスプラットフォームで、軌道上でデータを処理できる。
本稿では、軌道設計、衛星間リンク、ネットワークトポロジーを考慮して、低軌道SDC衛星コンステレーションのアーキテクチャについて述べる。
我々は,技術ロードマップから得られた予測モデルを用いて,SDCの技術的実現可能性と経済性について分析する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:23:26 GMT)
Balancing Knowledge Distillation for Imbalance Learning with Bilevel Optimization [5.2] 不均衡なデータでは、ハードとソフトの損失の間の固定重み付けが学習過程を不安定にする。
サンプル毎に動的にハードとソフトの損失のバランスをとるバイレベルフレームワークであるBiKDを提案する。
我々は、小さな検証セットで導かれる適応的なサンプル単位の重みを生成する重み生成ネットワークを用いる。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:57:22 GMT)
Goodbye Drift: Anchored Tree Sampling for Long-Horizon Video-to-Video Generation [5.1] ロングホライゾンビデオ生成は2つの中間問題に悩まされている。
まず、ビデオの品質が時間の経過とともに低下するドリフトがある。
第二に、オブジェクト永続性の問題として現れる連続性の問題があります。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:40:48 GMT)
Latent Space Guided Scenario Sampling for Multimodal Segmentation Under Missing Modalities [5.1] 現実世界のリモートセンシングアプリケーションでは、センサーの故障、大気条件の悪さ、データ取得の問題により、1つ以上のモダリティが利用できない可能性がある。
本研究では,事前学習された潜在空間から直接シナリオサンプリング分布を学習する新しい学習手法を提案する。
我々は,この戦略を,CBC-SLP,CBC,CMXバックボーンを用いて,DSTL,Potsdam,Hunanの3つのリモートセンシング画像セット上で評価した。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:23:22 GMT)
Representability-Aware Neural Networks for Reduced Density Matrices: Application to Fractional Chern Insulators [5.1] 密度行列の減少(2-RDM)を予測するために,表現可能性を考慮した補間可能なニューラルネットワーク(NN)フレームワークを開発した。
このフレームワークは、小さなメッシュからの正確な結果を補間することで、大きな運動量メッシュ上の2-RDMを予測したり、任意のメッシュ上のエネルギー最小化によって最適化された2-RDMアンサッツとして利用することができる。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:00:01 GMT)
Swimming with Whales: Analysis of Power Imbalances in Stake-Weighted Governance [5.0] 我々は,Penrose-Banzhafパワーインデックスを用いて,電力の定量化を行う場合,利害重み付き投票における電力不均衡の程度について検討する。
当社は、現在のリスク重み付けガバナンスシステムで起こりそうなパワー不均衡について、よりきめ細かい理解を提供しています。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:25:16 GMT)
AirfoilGen: A valid-by-construction and performance-aware latent diffusion model for airfoil generation [5.0] 翼形状設計は航空宇宙工学の基本的な課題であり、飛行安定性と燃料消費に直接影響を及ぼす。
既存の深い生成的アプローチは、幾何的妥当性と物理的可制御性の両方に制限されている。
本稿では,エアフォイルの有効構成と性能を考慮した潜時拡散モデルであるAirfoilGenを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:26:16 GMT)
Cross-View Attention Fusion Net: A Prior-Guided Dual-View Representation Learning for Cardiac Output Estimation from Short-Term PPG Signals [4.9] CVAF-Net (Cross-View Fusion Network) は、短い長さのPSGセグメントからCO推定を行うための、事前誘導されたデュアルビュー深層学習モデルである。
CVAF-Netは、生PSGを時間ビューとして、特徴系列マップ(FSM)を構造化された事前誘導ビューとして処理し、2つの表現をクロスビューアテンションを通じて融合する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:59:49 GMT)
Inverse Design of Metasurface based Absorbers using Physics Guided Conditional Diffusion Models [4.9] 特定の電磁応答に対する準曲面の逆設計には、厳密なスペクトル制約を満たす測度を生成する必要がある。
準曲面吸収体の逆設計のための物理誘導条件品質向上拡散フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:51:38 GMT)
Codec-Robust Attacks on Audio LLMs [4.8] オーディオ大言語モデル(Audio LLMs)に対する以前の攻撃は、慎重に構築された波形の摂動が敵の出力を強制することを示した。
我々は、音声波形を直接摂動するのではなく、ニューラルオーディオの連続潜時空間における摂動を最適化するCodecAttackを紹介した。
本稿では,波形の摂動を排除した圧縮チャネルが,その潜在空間で発生する摂動を伝送することを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:39:52 GMT)
CAB: Accelerating Flow and Diffusion Sampling via Rectification and Corrected Adams-Bashforth [4.7] フローと拡散モデルは高忠実で高解像度の画像合成を実現するが、サンプリング時に多くの機能評価(NFE)を必要とすることが多い。
CAB(Corrected Adams-Bashforth)は,フローモデルと拡散モデルの両方を高速化するトレーニング不要のサンプルシステムである。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:47:33 GMT)
Language Mutations Sustain the Persistences of Conspiracy Theories on Social Media [4.7] 本研究では,言語変異がソーシャルメディア上での陰謀論の持続的拡散に与える影響について検討する。
より大きな意味突然変異を持つ陰謀の主張は、寿命がかなり長いことが判明した。
我々は、コンテンツモデレーションは陰謀の主張の不変性を考慮し、中核的な主張に焦点を当てるべきであると主張している。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:06:41 GMT)
Differentiable Model Predictive Safety for Heterogeneous Mobility at Urban Intersections [4.5] 我々は、新しいフレームワーク、差別化可能なモデル予測安全性を導入する。
モデル予測制御の展望を、データ駆動のエンドツーエンドの強化学習アーキテクチャに組み込む。
衝突を5.6%未満に事実上排除し、高密度で混在する車両とロボットの交通シミュレーションを行う。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:42:57 GMT)
The Silent Hyperparameter: Quantifying the Impact of Inference Backends on LLM Reproducibility [4.5] シミュレーションバックエンドがLLMベンチマーク結果にどのように影響するかを系統的に検討する。
バックエンドのみの選択は、ベンチマークスコアを最大16.6ポイントシフトし、高い出力率を誘導できることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:37:27 GMT)
LMM-Track4D: Eliciting 4D Dynamic Reasoning in LMMs via Trajectory-Grounded Dialogue [4.5] 最近のモデル(LMM)は、画像の理解においてますます能力を高めつつも、4次元の連続的動的推論を維持するのに苦戦している。
そこで本研究では,提案する3次元トラジェクトリを,短いクリップ全体あるいはより長いクリップの特定のセグメントに返却しながら,問合せに応答しなければならない新しいタスクを提案する。
Track4-Trackの実験では、強いベースラインよりも一貫した改善が示されており、動的状態モデリングはLMMにおける4次元動的推論を引き出すのに有用な設計原理であることを示唆している。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:35:13 GMT)
When Reasoning Supervision Hurts: TTCW-Based Long-Form Literary Review Generation [4.5] 長期TTCWベースの文芸レビュー生成のための大規模なデータセットは存在しない。
Qwen3モデルを2つのスケール(4Bと8B)で微調整します。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:16:58 GMT)
Diffusion Graph Posterior Sampling for Nonlinear Inverse Problems with Application to Electrical Impedance Tomography [4.4] 本稿では,グラフ構造化サンプリング(DPS)データを拡張した新しいフレームワークを提案する。
我々は2次元三角形メッシュ上で無条件のスコアベース拡散モデルを構築した。
また、明示的な正規化項を含む正規化変項Sも導入する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:57:10 GMT)
SCARA: A Semantics-Constrained Autonomous Remediation Agent for Opaque Industrial Software Vulnerabilities [4.4] 本稿では,産業ソフトウェアのためのセマンティックス制約型自律修復エージェントであるSCARAについて述べる。
上流のバイナリ脆弱性候補と条件付き検証された修正を4段階のパイプラインで接続する。
100%の精度で偽陽性はなく、20.0%の患者を手術不能と回答し、標的再実行後に88.9%の修復に成功した。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:00:34 GMT)
Latent Cache Flow: Model-to-Model Communication Without Text [4.4] 現在、LLMエージェントはテキストを介して通信しており、共有者のモデルの状態を自動回帰的にデコードし、受信者のモデルでエンコードする必要があるため、遅延や情報損失がかなり大きい。
Cache-to-Cache(C2C)のような最近の作業では、共有者KV行列をレシーバモデルに変換するアダプタを学習することで、KVキャッシュの交換を試みている。
我々はLatent Cache Flow (LCF)を導入し、アダプタをC2Cのサイズの約4%に削減した。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:21:01 GMT)
When the Majority Votes Wrong, the Intervention Timing for Test-Time Reinforcement Learning Hides in the Extinction Window [4.3] テスト時間強化学習 (TTRL) は, 多数決を擬似ラベル信号として用いた数学的推論ベンチマークにおいて, かなりの精度向上を報告している。
これらの利得は体系的に誤解され、真の学習よりも既に解決可能な問題のシャープ化を反映している、と我々は主張する。
パープロブレムトラッキングは、低可否問題における正解信号が、永久に抑制される前に一時的にアクティブであることを明らかにする。
絶滅ウィンドウをターゲットとした3つのメカニズムを持つ軽量フレームワークである textbfTTRL-Guard を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:58:44 GMT)
Resilient Byzantine Agreement with Predictions [4.2] 本研究では,ノードが予測器にアクセス可能なビザンチン合意問題について検討する。
アルゴリズムのレジリエンス - アルゴリズムが許容できる最大障害ノード数。
我々は、その数が一定割合の$n$に留まる限り、レジリエンスは間違った予測数で線形に減少することを示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:06:50 GMT)
Efficient Elicitation of Collective Disagreements [4.2] 我々は、一組の代替案について、有権者の集団間の不一致の構造を分析する。
調査は通常、ペア比較、参加者に対する単純で直感的な回答、あるいは選択肢よりも完全なランキングを求める。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:23:58 GMT)
Agentic Discovery of Cryomicroneedle Formulations [4.1] 低温保護剤発見のためのAI支援クローズドループワークフローを報告する。
培養した198個の間葉系幹細胞凍結保存製剤を21種類の成分に変換した。
もっとも有効な定式化は、DMSO、エクトイン、エチレングリコール、胎児のウシ血清で95.15%の生存率を達成した。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:09:46 GMT)
Construction of three-qubit positive-partial-transpose entangled states of rank four [4.1] 多ビット正部分変換(PPT)絡み合った状態は、量子情報理論において重要な役割を果たす。
このような状態をタイプIとタイプIIの2つのタイプに分類する。
また、ランクが 3 未満の多ビット状態のローレンツ不変量についても検討する。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:32:15 GMT)
Quantum algorithm for Discrete Gaussian Sampling [4.1] 本稿では,量子リジェクションサンプリング法に基づく量子アルゴリズムについて述べる。
量子二重攻撃の2つのバージョンを導出し、以前の2つを改善した。
また, 短解問題の解法におけるアルゴリズムの高速化にも有効である。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:17:29 GMT)
QUTest: A Native Testing Framework for Quantum Programs [4.0] 量子プログラムはしばしばOpenQASM 3回路として共有されるが、テストはPythonやQiskitのようなホスト言語で書かれている。
QUTestは、プログラムとテストの両方が標準.qasmファイルであるネイティブフレームワークである。
テストはArrange / Act / Assertパターンに従い、コンフィギュレーション、ランタイム要件、アサーションはプラグマコメントとしてエンコードされる。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:09:14 GMT)
SLEIGHT-Bench: A Benchmark of Evasion Attacks Against Agent Monitors [4.0] SLEIGHT-Bench (Subtle Low-itEration Insight-Guided Harmful Transcripts) は、11カテゴリにわたる40の攻撃を含む合成写本のベンチマークである。
40件中20件はOpus 4.6モニターで捕捉されず、10回の試験で1%の偽陽性率で思考を延長し、全体のキャッチレートは32%である。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:46:42 GMT)
Can Conversational XAI Improve User Performance? An Experimental Study [4.0] 本稿では,予測精度,モデル理解,誤り識別による説明支援の評価実験について提案する。
説明可能な設計予測モデルを用いて,システム的エラーを識別・補償することで,ユーザがモデルより優れている条件を作成する。
実験による実験結果から, 参加者はモデルよりも有意に優れていたが, 支援タイプと, 全体としては質素なエンゲージメントとの間には, 性能差は認められなかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:47:17 GMT)
Towards LLM-Assisted Architecture Recovery for Real-World ROS~2 Systems: An Agent-Based Multi-Level Approach to Hierarchical Structural Architecture Reconstruction [3.9] ROS2ベースのロボットシステムでは、構造的(デ-)分解と統合的セマンティクスは、しばしば分散アーティファクト間で暗黙的に符号化される。
既存のアプローチは主にノードレベルのエンティティと通信配線に重点を置いており、階層アーキテクチャを回復するための限定的なサポートを提供している。
これまでに提案した,ROS2システムのためのLCM支援アーキテクチャ回復パイプラインを,2つの大きな拡張を通じて拡張した。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:14:33 GMT)
PAVE: A Cognitive Architecture for Legitimate Violation in Generative Agent Societies [3.8] 生成エージェントは、協調的な環境下で、信頼できる人間の行動を再現することができるが、ルール破りが要求される状況では、どのように推論されるべきかは、いまだに不明確である。
このギャップを埋める新しい4モジュール認知アーキテクチャであるPAVEを提案する。
我々はスモールビルからフォークしたタイルベースの交通環境であるVovilleでPAVEをインスタンス化し、3つのシナリオで評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:40:09 GMT)
A Simplex Witness Certificate for Constant Collapse in Variational Autoencoders [3.8] 本研究では, 変分オートエンコーダにおいて, 決定論的エンコーダ経路が入力から独立となるような正確な定数崩壊について検討する。
この理論、最小限のトレーニングプロトコル、および予備的なMNISTの正当性チェックを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:32:11 GMT)
Memory-Augmented Reinforcement Learning Agent for CAD Generation [3.8] 本稿では,CAD生成エージェントのためのメモリ拡張型強化学習フレームワークを提案する。
このフレームワークは、基盤となる幾何学的カーネルを、エージェントによって呼び出し可能な構造化ツールチェーンにカプセル化する。
実験により,提案手法は複雑なCADモデル生成タスクにおける成功率と幾何整合性の両方を著しく改善することが示された。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:16:31 GMT)
KappaPlace: Learning Hyperspherical Uncertainty for Visual Place Recognition via Prototype-Anchored Supervision [3.8] 視覚的位置認識(VPR)は自律ナビゲーションに不可欠である。
標準パイプラインは、クエリがあいまいであったり、マッチが正しくない可能性がある場合に、確実に信号を送ることができない。
我々は不確実性を認識したVPR表現を学習するための原則的フレームワークであるKappaPlaceを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:45:27 GMT)
Language models struggle with compartmentalization [3.7] 大規模言語モデル (LLM) は, 統一概念の異なる表現間で, 統計的強度を識別し, 共有できないことを示す。
また、合成並列データが容易に学習されているにもかかわらず、これを改善できないことも示している。
検討したすべての介入は、その効果が異なるプレゼンテーションの数に依存する相転移を示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:02:46 GMT)
DARTIC: Decentralized Anonymous Reputation at Scale for Trustworthy Crowdsourcing [3.7] DARTICは、クラウドソーシングのための分散化、匿名化、スケーラブルな評判駆動フレームワークである。
我々は,zkSNARKベースの集合メンバシップ証明を導入し,すべてのユーザを1つのアクセストークンに暗号的に結び付ける。
その結果, 完全分散型クラウドソーシングシステムにおいて, 匿名性, 堅牢な評価バインド, スケーラビリティを両立させることができることがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:48:45 GMT)
Sampling Noise and Optimized Measurement Distribution in Imaginary-Time Quantum Dynamics Simulations [3.7] 変分量子力学シミュレーション(VQDS)は、量子デバイス上の実時間および虚時間量子力学をシミュレートする有望な経路を提供する。
1次元イジングスピンモデルにおいて,サンプリングノイズがVQDSに与える影響について検討する。
最適化されたショットアロケーションは、状態の忠実度を大幅に改善し、全測定コストを削減できることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:27:33 GMT)
Towards Multi-Model LLM Schedulers: Empirical Insights into Offloading and Preemption [3.6] ハードウェアプラットフォーム全体で異なる言語モデルがどのように振る舞うかを示し、レイヤのオフロードとプリエンプションのパフォーマンスへの影響に注目します。
モデル固有のオフロード感度、ワークロード特性、プリエンプションとデータ転送のコスト構造など、将来のスケジューラが考慮すべき重要な特徴のセットを特定します。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:39:16 GMT)
From SGD to Muon: Adaptive Optimization via Schatten-p Norms [3.6] Muonのようなモダンな言語は、更新に行列的な幾何学的制約を課している。
現行のすべてのメソッドでは、更新ルールに対して固定LMOジオメトリを課している。
本稿では,プロキシ・最適更新LMOジオメトリを動的に選択するための,新しい効率的なデータ駆動基準を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:47:41 GMT)
Synchronization and Turn-Taking in Full-Duplex Speech Dialogue Models [3.6] 完全な音声対話モデルは、ターンベースシステムよりも人間の会話に近い声を同時に話すことができる。
本研究では,人間のコミュニケーションにおいて,ニューラルカップリングを用いた内部相互作用を協調するモデルを提案する。
雑音のない条件下では強い表現同期が得られ、ラグはゼロに近づき、ノイズは劣化する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:11:03 GMT)
Remote sensing data imputation using deep learning for multispectral imagery [3.5] 光衛星データを使用する際の一般的な課題は、雲の覆いによる観測不足の存在である。
本研究では,従来のデータ計算手法と深層学習モデルを比較し,スペクトル帯域の欠落を再現する。
以上の結果から,PlanetScope SuperDove画像の欠落データに対する深層学習モデルの有効性が示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:31:09 GMT)
Quantum Algorithms for Nonlinear Differential Equations via Pivot-Shifted Carleman Linearization [3.4] 2次非線形常微分方程式を解く量子アルゴリズムのためのピボットシフトフレームワークを開発する。
カルマン昇降前のピボット状態によって力学をシフトさせることにより、量子コンピュータ上で効率的にシミュレートできる非線形系のクラスを拡大する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:26:02 GMT)
Fast Spawn\&Prune (FS\&P): Global convergence of stochastic conic particle gradient descent via birth/death process [3.4] 連続回帰における大域的目的改善関数について検討する。
このクラスのアルゴリズムに対する最初の理論的保証を提供する。
我々は、事前知識を必要としない先行知識を必要としない先行知識を、事前知識を必要としない先行知識を、事前知識を必要としない先行知識を、事前知識を必要としない先行知識を必要としない先行知識を、事前知識を必要としない先行知識を必要としない先行知識を、事前知識を必要としない先行知識を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:50:39 GMT)
Semi-Parametric Bayesian Additive Regression Trees for Risk Prediction with High-Dimensional Epigenetic Signatures and Low-Dimensional Covariates [3.4] ゲノム全体のエピジェネティックな修正は、リスク予測を知らせる豊富なデータを提供する。
これらのデータは高次元であり、複雑な依存構造を示す。
この制限に対処する半パラメトリックBARTモデル(spBART)を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:31:20 GMT)
A Simple GPU-Accelerated Solver for the Schrödinger Operator with Applications to Ground States and Hamiltonian Simulation [3.2] テンソル積直解器をラプラシアンからシュルディンガー作用素 $-+ V$ に拡張する。
1台のNVIDIA A100$では、3Dで109ドルの自由度で1秒未満だ。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:55:54 GMT)
Detrimental Agnostic Entanglement: The Case Against Hardware-Efficient Ansätze for Combinatorial Optimization [3.1] エンタングルゲートは変分量子アルゴリズムのデフォルト設計選択であるが、エンタングルメントにおけるそれらの役割は理解されていない。
ハードウェア効率のよいアンザッツ絡み合いに対するスムーズで単調な制御を提供する2つの相補的な制御機構を導入する。
これらの結果から,最適化手法は回路設計の最適化を優先すべきであることが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:23:50 GMT)
XAI FL-IDS: A Federated Learning and SHAP-Based Explainable Framework for Distributed Intrusion Detection Systems [3.1] 侵入検知システム(IDS)は、ネットワーク間の不正な活動を検出するサイバーセキュリティにおいて不可欠である。
ほとんどのIDSは集中型検出に依存しており、IoTノードはデータをサーバに送らざるを得ず、オーバーヘッドを追加し、プライバシ保証を提供しない。
本研究は、プライバシ保護のためのソリューションを提案し、新しいシステムに説明可能性を追加する。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:03:10 GMT)
Memory-Guided Tree Search with Cross-Branch Knowledge Transfer for LLM Solver Synthesis [3.1] メモリ誘導型ツリー検索フレームワークであるMEMOIRを2レベルメモリ階層で導入する。
組合せ最適化の7つの問題の中で、MEMOIRは96.7%の解の有効性を達成している。
MeMOIRのラン・トゥ・ランの妥当性標準偏差は、評価したベースライン毎の1桁以下である。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:52:40 GMT)
BLINKG: A Benchmark for LLM-Integrated Knowledge Graph Generation [3.0] LLM(Large Language Models)は、KG(Generating Knowledge Graphs)プロセスの自動化に使用することができる。
ヘテロジニアスデータソースからKGを構築する際のLCMのマッピング能力を評価するためのベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:15:53 GMT)
Enhancing Graph-Based SLAM in GNSS-Denied environments by leveraging leg odometry [3.0] 脚のドメトリーにより駆動される平行キネマティックレーンでLIO-SAMフレームワークを増強する因子グラフアーキテクチャを提案する。
提案手法は,30m以上から30cm未満までの上昇ドリフトを低減し,ベースラインパイプラインが完全に故障する場面での収束を可能にする。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:48:35 GMT)
Gravitational Entanglement in Optomechanics: Distinguishing Classical and Quantum Models [2.9] このような絡み合いの実験的なシグネチャを再現する古典モデルについて検討する。
古典的および量子的予測の明確な区別は、この設定を超えるだけである。
以上の結果から,重力エンタングルメントの証明に関する実験的要件は,これまで予想されていたよりも厳密であることが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:00:02 GMT)
Orbital-Angular-Momentum Entangled Photon Emission from Circular Currents in Semiconductor-Superconductor Structures [2.9] 半導体中で誘導される超伝導円電流は、キャリア再結合による絡み合った光子対の放出をもたらすことを示す。
本研究は,超伝導量子ビット情報をフォトニックチャネルに伝送する新しい方法を実現するために,OAM結合光子を生成するための独自の手法を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:00:02 GMT)
A Unified Framework for Structure-Aware Clustering and Heterogeneous Causal Graph Learning [2.8] 複雑なシステムでは、相互作用変数は依存構造によって定義され、しばしば非巡回グラフとして符号化される。
依存構造は対象によって異なり、この構造バイアスを無視し、サブポピュレーションを曖昧にする。
本稿では,クラスタ固有の依存性構造を学習する構造方程式モデリング(Structure Equation Modeling, SEM)に基づく統合フレームワークを提案する。
本手法は,クラスタ固有の因果依存性構造を高い正の確率と低い偽発見率で復元する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:48:54 GMT)
Generative-Evaluative Agreement: A Necessary Validity Criterion for LLM-Enabled Adaptive Assessment [2.8] 本稿では,LLMのスコアリング機能が生成機能に指示されたスキルレベルを回復させるかどうかを評価するための妥当性基準であるジェネラティブ・評価合意(GEA)を紹介する。
我々は, GEAを強化し, 相補的緩和を概説する主要なメカニズムとして, 粒度, 熟練分解性ルーリックが提案されていることを論じる。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:30:39 GMT)
Worst-Group Equalized Odds Regularization for Multi-Attribute Fair Medical Image Classification [2.8] 最低群等化オードスマージン正規化器を提案する。
これは推論における真正と偽正の双方のサブグループレベルの偏差をターゲットにしている。
等化オッドと等化オッドの格差をAUCに最小限の影響で一貫して減少させる。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:35:02 GMT)
MAM-CLIP: Vision-Language Pretraining on Mammography Atlases for BI-RADS Classification [2.8] 深層学習法は,マンモグラフィ画像からBI-RADSスコアを予測する上で有望な結果を示した。
2313枚のマンモグラフィー画像とそれに対応するキャプションを2つのマンモグラフィーアトラスから収集した。
BI-RADS予測のための2つのデータセット上でビジョンエンコーダを微調整し、この事前トレーニングなしでトレーニングされたモデルと比較して優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:42:05 GMT)
GEM: GPU-Variability-Aware Expert to GPU Mapping for MoE Systems [2.8] Mixture-of-Expert(MoE)モデルは、より小さな専門家を採用し、トークンごとにサブセットだけを活性化することによって、効率的な推論を可能にする。
我々は、MoEモデルのGPUマッピングにGPU変数を意識した専門家のためのフレームワークであるGEMを提案する。
実験の結果,GEMはベースラインに比べて平均で7.9%,最大16.5%のレイテンシ向上を実現している。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:01:39 GMT)
Quantum master equation approach for the multiphonon up-pumping model [2.7] 外部衝撃を受けるエネルギー物質のコヒーレントエネルギー伝達を特徴付けるために,完全量子マルチフォノンアップポンピングモデルを提案する。
分析の結果、異なる周波数のドアウェイモードは、効果的なコヒーレントな運転と消散のレベルが異なることが明らかとなった。
この研究はエネルギー移動のメカニズムを理解するための新たな視点を提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:40:37 GMT)
Posterior Contraction of Lévy Adaptive B-spline Regression in Besov Spaces [2.6] LARK(Lévy Adaptive Regression Kernel)モデルにB-splineカーネルを組み込んだベイズ非パラメトリック手法であるLévy Adaptive B-spline(parametricS)回帰モデルの特性について検討する。
我々は、ベソフ類における真の関数の周りのLABSLAB後続の契約が、未知の滑らかさに自動的に適応しながら、対数係数まで、ほぼ最小の最適速度で成立することを確立する。
この研究は、ベソフ空間におけるLARKモデルの後方収縮に関する理論的結果が乏しい文献のギャップを埋めることに寄与する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:48:58 GMT)
Machine-Learning-Enhanced Non-Invasive Testing for MASLD Fibrosis: Shallow-Deep Neural Networks Versus FIB-4, Tabular Foundation Models, and Large Language Models [2.6] 進行性線維症は肝障害の主要な要因である。
機械学習による非侵襲検査が高度な線維症検出を改善できるかどうかを検討した。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:51:02 GMT)
DynaTok: Temporally Adaptive and Positional Bias-Aware Token Compression for Video-LLMs [2.6] DynaTokはトレーニングフリーで、時間適応的でバイアス対応のトークン圧縮フレームワークである。
トークンの予算を時間次元と空間次元の両方に割り当てる。
90%のトークン削減であっても、95%以上のベースライン精度を維持している。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:02:01 GMT)
Causal Unlearning in Collaborative Optimization: Exact and Approximate Influence Reversal under Adversarial Contributions [2.6] フェデレートされた学習システムは、プライバシー規則に従うためにデータ削除要求をサポートしなければならない。
本稿では,クライアントのコントリビューションをKrylov部分空間の共役反復によって近似することで,クライアントのコントリビューションを除去する手法であるHF-KCUを提案する。
我々は、k がヘッセン条件数である場合、クリロフ近似誤差が O((k 1/2-1)/(k1/2+1) として減少することを示す収束保証を提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:00:39 GMT)
Decomposing MXFP4 quantization error for LLM reinforcement learning: reducible bias, recoverable deadzone, and an irreducible floor [2.5] 既存の作業では、量子化誤差をモノリシックノイズ項として扱う。
量子化誤差を正確に3方向分解する。
それぞれのコンポーネントがRLトレーニング経路をいかに支配するかを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:59:26 GMT)
Physics-in-the-Loop: A Hybrid Agentic Architecture for Validated CAD Engineering Design [2.5] 大規模言語モデル(LLM)はCAD(Computer-Aided Design)を生成することができるが、信頼性の高いエンジニアリング設計に必要な物理的理解は欠如している。
本稿では,自律型AIエージェントの意思決定ループに直接,検証済みの知識ベースエンジニアリングツールを組み込むハイブリッドエージェント・物理アーキテクチャを提案する。
本システムでは, 構造的複雑性が4.2増加し, 類似のエージェント法に比べてコンパイル速度が3.5%向上するなど, より複雑で物理的に検証された設計を生成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:52:42 GMT)
Combined Program Analysis Techniques: A Systematic Mapping Study [2.4] プログラム・アナリシスの手法を相乗効果、相互分析、相互作用スキーマに基づいて分類する独自の分類法を考案する。
我々の分類学と文献マッピングは、複合プログラム分析手法の設計において、目標とパターンの共通点と相違点を明らかにする。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:44:58 GMT)
VBT-MPC: Vision-Based Tactile MPC for Contour Following [2.4] ロボット輪郭用視覚ベース触覚モデル予測制御(VBT-MPC)フレームワークを提案する。
提案するコントローラは輪郭特徴空間で直接動作するため,ポーズ推定モジュールの分離は不要である。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:40:45 GMT)
Towards Fair Benchmarking of Quantum Transfer Learning for Visual Classification [2.4] Quantum Transfer Learningは、短期的制約下でのビジュアル量子機械学習に有望なアプローチを提供する。
既存のQTL結果を比較するのは難しいのは、データセット、前処理、バックボーン設定、キュービット予算、回路設計、最適化の選択、レポートプロトコルが異なるためである。
本研究は,一貫したトランスファーラーニングパイプラインの下で,代表的QTL手法を評価するための,制御されたベンチマーク手法を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:10:32 GMT)
Evolutionary Algorithm for Reservoir Learning and Yielding [2.4] EARLY (Evolutionary Algorithm for Reservoir Learning and Yielding) は、Echo State Networks (ESN) のアーキテクチャを進化させるためのフレームワークである。
脳のモジュラー構造にインスパイアされたEARLYは、アーキテクチャをグラフベースのゲノムとしてエンコードし、クロスオーバー、突然変異、選択を適用して効果的な構成を発見する。
その結果、進化したアーキテクチャは、複数のタスクをランダムに探索し、タスクの難易度に応じて構造的な違いを示す。
これらの結果から, 進化的探索は, 広範囲の時間的問題に対して, 再利用可能な貯水池構造を同定するのに有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:22:21 GMT)
Explainable Wastewater Digital Twins: Adaptive Context-Conditioned Structured Simulators with Self-Falsifying Decision Support [2.4] CCSS-IXは、コンテキスト認識ゲーティングネットワークによって適応的に混合された、解釈可能な局所線形状態空間"専門家"のバンクである。
実行時決定層は、統計的に認証できないオペレータが提案するアクションに対して、不当な時間的証人を排除、再開、または返却するために共形リスク制御を適用する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:19:27 GMT)
Pixel Wised Lesion Prediction on COVID-19 CT Imagery: A Comparative Analysis of Automated Image Segmentation Architectures [2.3] 本研究は、最先端のトレーニング済みバックボーンと組み合わせた現代セグメンテーションフレームワークを評価することを目的とする。
Unet、PSPNet、Linknet、FPNの4つの異なるディープラーニングアーキテクチャを6つの事前学習エンコーダに統合する。
画像セグメンテーションの文脈では,2値実験と多値実験の両方を対象とする。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:13:02 GMT)
A Comprehensive Comparison of Deep Learning Architectures for COVID-19 Classification on CT & X-ray Imagery [2.3] 我々は、新型コロナウイルスと健康な肺画像とを区別するコンピュータ支援診断(CAD)システムを設計するために、畳み込みニューラルネットワーク(CNN)ベースのモデルを提案する。
X線とCTの画像データセットでは、ResnetとVGGアーキテクチャーが新型コロナウイルスと通常の画像とを適切に区別する能力を示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:57:08 GMT)
A novel YOLO26-MoE optimized by an LLM agent for insulator fault detection considering UAV images [2.3] 本稿では, YOLO26検出器の高分解能分岐に, スパースミクチャー・オブ・エクササイズ(MoE)モジュールを組み込んだ新しいオブジェクト検出アーキテクチャであるYOLO26-MoEを提案する。
提案手法は, 1段階検出フレームワークの効率を保ちつつ, 微妙で多様な断層パターンに対する適応的特徴改善を可能にする。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:40:05 GMT)
You Don't Need Attention: Gated Convolutional Modeling for Watch-Based Fall Detection [2.3] Gated-CNNは、独立の一次元畳み込み特徴抽出器を介して加速度計とジャイロスコープストリームを処理する軽量なデュアルストリームアーキテクチャである。
オフライン評価では,5つの手首搭載慣性測定ユニット(IMU)データセットを用いて,平均F1スコアが93%,93%,90%,91%,90%を達成した。
リアルタイム評価のために、Google Pixel Watch 3にモデルをデプロイし、12人の参加者を対象にテストしました。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:44:45 GMT)
Complementing reinforcement learning with SFT through logit averaging in the post training of LLMs [2.2] 本稿では,凍結参照ポリシ(例えば,SFT)とトレーニング可能なポリシのロジットを平均化する新しい手法を提案する。
本手法はMATH, cn-k, MMLUを用いて評価し, 標準KL12, 正規化GRPOと比較して高い精度, 少なくとも同等の精度を示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:15:18 GMT)
Implicit Bias of Mirror Flow in Homogeneous Neural Networks: Sparse and Dense Feature Learning [2.2] 同種活性化関数を持つディープニューラルネットワークにおいて,ミラーフローによって到達した最大マージン解について検討した。
独立な非同次ミラー写像は、同じ極大解を誘導できることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:10:18 GMT)
The Evaluation Game: Beyond Static LLM Benchmarking [2.2] 本稿では,評価者とトレーナーの相互作用を2人プレイヤゲームとして形式化するゲーム理論フレームワークを提案する。
モデルの局所性依存性を示す実証的証拠を提供する。
ベンチマークは静的なプロンプトのセットではなく,評価者のグループアクションの下での軌道である。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:22:21 GMT)
Protocol-Driven Development: Governing Generated Software Through Invariants and Continuous Evidence [2.1] ここでは、主要なソフトウェアアーチファクトがコードではなく、機械で強化可能なプロトコルであるプロトコル駆動開発(PDD)を紹介します。
PDDは、自動化されたソフトウェアエンジニアリングのためのガバナンスモデルを定義する。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:37:24 GMT)
On Performance and Limitations of NISQ Hardware for Simulations of Quantum Wave Packet Dynamics [2.1] 格子を用いた量子ビットレジスタへの波動関数の符号化による1次元波動パケットの動的解析について検討する。
時間進化は、運動エネルギー演算子を適用した分割演算子アプローチによって実現される。
このアプローチを古典シミュレータと量子ハードウェアでベンチマークする。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:33:26 GMT)
Supervised Latent Restructuring for Small-Data Quantum Learning in Plant Phenomics [2.1] カーネル法は、遅延圧縮がクラス分離構造を保存するのに失敗すると識別力を失う可能性がある。
我々は,64次元PCA空間に1280次元の深部画像埋め込みを圧縮し,それを11次元の教師付き潜在空間に再構成するハイブリッドワークフローを提案する。
実験的に、教師付き潜在構造再構成は圧縮された表現の幾何学的分離性を著しく改善する。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:08:59 GMT)
Security Analysis of Bitcoin's V2 Transport Protocol: Exploiting Design Implications for Sustained Eclipse and Downgrade Attacks [2.1] Bitcoinはピアツーピア(P2P)通信の暗号化のための新しいプロトコルを導入した。
この研究は、これらの攻撃の現在の生存可能性を調べ、それらが相互に媒介されている一方で、同様の目的に対する代替攻撃や経路が存在すると結論付けている。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:50:57 GMT)
ExECG: An Explainable AI Framework for ECG models [2.1] 深層学習により、不整脈分類や異常検出などのタスクにおいて、強力なパフォーマンスを持つ心電図診断モデルが実現された。
我々は,3段階のパイプラインを提供するPythonフレームワークであるExECG(Explainable AI framework for ECG)を紹介した。 Wrapperは異種ECGフォーマットと中間表現間のアクセスを標準化し,Explainerは共有実行プロトコルの下で多様なXAIメソッドを統一し,Visualizerは統一インターフェース内で一貫したメソッド間比較をサポートする。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:10:04 GMT)
Full characterization of informative subsets in Quantum Encrypted Cloning [2.0] 量子暗号化クローニング(Quantum encrypted cloning)は、未知の入力量子ビットを複数の暗号化信号-ノイズペアに分散するプロトコルである。
以前の研究では、ストレージレジスタの不正なサブセットは、一般的には完全に非形式的ではないことを示した。
解析を変換元 qubit A を含む部分集合に拡張する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:59:12 GMT)
SphericalDreamer: Generating Navigable Immersive 3D Worlds with Panorama Fusion [2.0] SphericalDreamerはテキストプロンプトから完全没入型・長距離3D環境を生成する手法である。
SphericalDreamerは、非常に詳細で完全に没入可能な3D環境を生産し、スケールと航法性を大幅に改善している。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:19:16 GMT)
ELEMENT: Multi-Modal Retinal Vessel Segmentation Based on a Coupled Region Growing and Machine Learning Approach [2.0] 提案するフレームワークは,領域成長と機械学習を用いた特徴抽出と画素ベース分類で構成されている。
提案手法は,26の最先端手法のうち25の手法と比較して,97.40%の精度で全体の性能を向上した。
STARE、CHASE-DB、VAMPIRE FA、IOSTAR SLO、RC-SLOの場合、提案されたフレームワークは、それぞれ98.27%、97.78%、98.34%、98.04%、98.35%の精度で最先端の手法をすべて上回った。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:12:13 GMT)
Linear Motility Maps in Nonlinear Viscous Fluids [1.9] 線形速度運動性写像は任意の電力法粘性に拡張されることを示す。
また, キャロー・ヤスダ流体中では, 直線速度特性が破れることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:56:42 GMT)
Nonlocal operator learning for fMRI encoding and decoding tasks [1.9] 本研究では,fMRIにおけるタスクの符号化と復号化のためのニューラル積分演算子モデルについて検討する。
2つのオープンソースfMRIデータセットを用いて,本モデルの評価を行った。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:39:10 GMT)
CogScale: Scalable Benchmark for Sequence Processing [1.9] 新しいアーキテクチャをテストするには、しばしば大量のデータセットやモデルにスケールアップする必要がある。
特定の認知能力と記憶能力の分離と評価を目的とした14のスケーラブルな合成タスクのベンチマークであるCogScaleを提案する。
その結果,従来のRNNとEcho State Networksは厳格なパラメータ予算内で基本的保持を保ちながら,注目機構と最新の状態空間モデルのみが常に高い性能を維持していることがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:32:52 GMT)
Mathematical Reasoning in Large Language Models: Benchmarks, Architectures, Evaluation, and Open Challenges [1.8] 本調査は,Large Language Models (LLMs) を用いた数学的推論の最近の進歩を合成する。
本研究は,約120のピアレビュー研究とプレプリントを網羅し,本研究領域の進化について検討した。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:56:03 GMT)
HAVEN: Hierarchically Aligned Multimodal Benchmark for Unified Video Understanding [1.8] HAVENは階層的に整列したマルチモーダル・ベンチマークである。
この統一アノテーションパラダイムに基づいて,要約,時間的推論,マルチモーダルグラウンド,サリエンシランキングにまたがる総合評価スイートを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:48:14 GMT)
Smaller Abstract State Spaces Enable Cross-Scale Generalization in Reinforcement Learning [1.8] 本稿では,RLエージェントにおいてアウト・オブ・ディストリビューションの一般化を実現するための理論モデルを提案する。
我々はエージェントのOODテスト性能に拘束力を与え、OODの一般化が達成可能な条件を定義する。
我々の分析は、より複雑なタスクへの一般化を達成するためには、エージェントを有限個の抽象状態の小さな集合上で動作させることが重要であることを示唆している。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:26:28 GMT)
FormalASR: End-to-End Spoken Chinese to Formal Text [1.8] 本稿では,2つのコンパクト・エンド・ツー・エンド・モデルであるFormalASRについて述べる。
WenetSpeech-Formal および Speechio-Formal の実験により、FormalASR は動詞のベースラインよりも37.4% の相対的な CER 還元を達成することが示された。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:27:27 GMT)
Hamilton--Jacobi Reachability for Spacecraft Collision Avoidance [1.8] 本稿では,同じ円軌道上で動作している2衛星衝突回避問題の枠組みについて述べる。
ターゲット状態空間を軌道平面における安全でない相対配置と定義する。
衝突を回避できない相対状態を特徴付ける後方到達可能な集合を計算する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:22:16 GMT)
Forced Gap Post-Selection for Quantum LDPC Codes and their Operations [1.7] 我々は,デコーダ間で転送可能な高速量子符号の単純かつ汎用的なポストセレクション戦略を開発する。
その結果,回路上の論理誤差率と物理誤差率を同じ回路上で4ドル以上向上し,選択後と同じ速度で論理誤差率が向上した。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:03:20 GMT)
Tippett-minimum Fusion of Representation-space Diffusion Models for Multi-Encoder Out-of-Distribution Detection [1.7] 我々は,IDデータのみから,各エンコーダの特定のシフトタイプに対する感度を統計的に同定する。
EncMin2L - エンコーダの2レベルの$min(cdot)$ゲートで、エンコーダの拡散に基づく検出器を結合し、校正する。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:18:49 GMT)
Stage-Audit: Auditable Source-Frontier Discovery for Cross-Wiki Tables [1.7] LLM処理されたテーブルは、サポート対象の行を格納しながら、ソースグラウンドで表示することができる。
Stage-Auditは、非ジョイントなキュレーター/オーディタの書き込み権、行レベルのソース引用ゲート、キー、スキーマ、ソースロール、濃度、スコープに関する12チェック監査の分類に対処する。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:41:35 GMT)
AnchorFlow: Editable SVG Reconstruction via Sparse Anchor Point Fields [1.7] 画像からSVGへの再構成は、入力に忠実で編集が容易なベクトルグラフィックスを作成することを目的としている。
既存の手法は、ベクトル構造をパラメータ化する方法における構造的トレードオフに直面している。
高忠実度法は、多くの経路や高密度パラメータ化された曲線に依存することが多いが、過度にコンパクトな生成は入力幾何学から逸脱することがある。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:49:17 GMT)
Accurate, Efficient, and Explainable Deep Learning Approaches for Environmental Science Problems [1.6] 論文は、複雑な環境科学の問題に合わせたAIベースのアプローチを開発する。
まず,沿岸河川システムにおける洪水予測と管理に注目した。
第2に、大規模なデータスケールによる地球規模の天気予報を目標としている。
第3に,環境科学における科学的問いかけについて述べる。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:58:10 GMT)
DocQT: Improving Document Forgery Localization Robustness via Diverse JPEG Quantization Tables [1.6] ドキュメントローカライゼーションモデルは、公開ベンチマークで高いパフォーマンスを達成するが、操作するドキュメント操作に一般化することができない。
トレーニング中に使用されるJPEG量子化テーブルの狭い分布と、現実の保険文書パイプラインで発生する異質な圧縮プロファイルとのミスマッチである。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:20:03 GMT)
A Human-in-the-Loop Framework for Efficient Prompt Selection in Microscopy Vision-Language Models [1.6] 顕微鏡画像分類のためのディープラーニングパイプラインは、トレーニングのための高品質な基底真理を生成するために、高価な、労働集約的、時間集約的な専門家アノテーションを必要とすることが多い。
近年の研究では、専門家が検証した画像カプセルの小さなプロンプトセットを構築することで、視覚言語モデルの即時チューニングが手作業によるアノテーションを削減できることが示されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:02:43 GMT)
Charon: A Unified and Fine-Grained Simulator for Large-Scale LLM Training and Inference [1.5] Charonは、LLMの性能を正確に予測するための、統一的でモジュラーできめ細かなシミュレータである。
実験では、Charonは異なるモデルと構成で高い精度を達成しており、全体的な予測誤差は5.35%以下である。
実践的な推論デプロイメントのケースでは、Charon氏は、エンジニアリングチューニングされたベースラインよりもシステムのスループットを向上させる構成を発見し、その重要な実世界の価値を明らかにした。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:51:14 GMT)
One Developer Is All You Need: A Case Study of an AI-Augmented One-Person Squad in a Brownfield Enterprise [1.5] AIツールは、エンジニアが以前クロスファンクショナルな部隊に分散していた役割を吸収することを可能にする。
規制された企業環境で、このような一人称部隊を設計し、評価する方法に関する構造的な証拠はほとんどない。
1人のスタッフエンジニアが計画された時間の半分に4人のチームを対象としたブラウンフィールド製品イニシアチブを納品したケーススタディを報告した。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:10:27 GMT)
Occupational Prompting Reveals Cultural Bias in Large Language Models [1.5] 社会的役割は、期待、優先順位、判断を形作るが、大きな言語モデルが職業的アイデンティティとより広い文化的価値パターンを関連づけているかは、いまだ不明である。
我々は、オープンウェイト言語モデルにおいて、プロのロール・キューがバリューサーベイ・レスポンスにどのように影響するかを調べるために、国籍に基づく文化的プロンプトを職業的プロンプトに置き換える。
以上の結果から,オープンウェイト LLM が国民のアイデンティティではなく職業によって促進される場合,その応答は文化地図の西寄りの広い領域に留まっていることが示唆された。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:58:15 GMT)
Physics-informed simulation framework for realistic sonar image generation and statistical validation [1.5] ACOUSIMは合成ソナー画像と実ソナー画像の統計的アライメントを評価するフレームワークである。
ガゼボをベースとした環境は、海底テクスチャ、照明駆動影、プラットフォーム高度、騒音を明示的に制御することでソナーのような画像を生成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:49:11 GMT)
AffectAI-Capture: A Reproducible Multimodal Protocol for Small-Group Meeting Research [1.5] AffectAI-Captureは、4人のミーティングのようなインタラクションで同期したマルチモーダルデータを収集するプロトコルである。
実験的根拠、同期哲学、データ組織、実践的トレードオフについて説明する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:58:29 GMT)
Precision Physical Activity Prescription via Reinforcement Learning for Functional Actions [1.4] 身体活動(PA)は健康維持と改善に重要な役割を果たしている。
心臓メタボリックリスクに関連するパーソナライズされた最適なPA分布を学習するための新しいオフライン強化学習(RL)アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:17:59 GMT)
Sensitivity Bounds of Multiparameter Metrology at Thermal Equilibrium [1.4] プローブ数に対するハイゼンベルク極限が達成可能であることを示す。
次に, 温度制限を考慮し, 有限温度の場合と比較して定性的に異なる挙動を示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:01:35 GMT)
Transforming Constraint Programs to Input for Local Search [1.4] 制約最適化問題の対称性特性と局所探索近傍の関係を確立する。
我々はこのリンクを用いて、IDPシステムのコンテキストにおける制約仕様から地区を自動的に生成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:02:08 GMT)
OpenSeisML: Open Large-Scale Real Seismic and well-log Dataset for Generative AI [1.4] 我々は, 地震インバージョンのための生成AI(Gen-AI)を支援する, 実地震の集合であるOpenSeisMLを提案する。
データセットは、英国国立データリポジトリ(NDR)で公開されている調査から収集される。
我々は、チェックショットデータを用いて、時間-深度関係を確立し、データセットを通して速度モデルを構築し、ポストスタック地震データの正確な変換を行う。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:22:46 GMT)
Where Does Authorship Signal Emerge in Encoder-Based Language Models? [1.4] オーサシップ属性モデルは、スコアリング機構によってパフォーマンスが4倍になる可能性がある。
このギャップを説明するために、機械的解釈可能性ツールを使用します。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:37:51 GMT)
When Skills Don't Help: A Negative Result on Procedural Knowledge for Tool-Grounded Agents in Offensive Cybersecurity [1.4] スキルとは、推論時にエージェントにロードされる手続き的な知識のパッケージである。
様々な領域で平均16.2%の割合でタスクパス率を改善することが広く報告されている。
しかし、同じベンチマークでは、スキルの導入時に負のデルタに苦しむ84のタスクのうち16が広範囲に分散している。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:48:35 GMT)
Learning-Accelerated Optimization-based Trajectory Planning for Cooperative Aerial-Ground Handover Missions [1.3] 本稿では,無人航空機(UAV)と無人地上航空機(UGV)のハンドオーバミッションのための学習用軌道計画フレームワークを提案する。
本稿では,デカップリング型エンコーダ・デコーダ長短期メモリ(LSTM)ネットワークを用いたニューラルサロゲートプランナを提案する。
ベンチマーク評価は、学習強化計画フレームワークが3倍以上のスピードアップと100%の最適化成功率を達成することを示した。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:07:59 GMT)
Robotics-Inspired Guardrails for Foundation Models in Socially Sensitive Domains [1.3] 既存のガードレールアプローチは、強制的な行動保証よりも経験的なリスク低減を提供する。
我々は、相互作用軌跡に対する実行時の動作制御の問題としてガードレールを再構成した。
我々は、これらのアイデアを3つの実世界の展開に適用する:小規模講演、家庭内自閉症治療、学校における行動脱エスカレーション。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:00:06 GMT)
GroupAffect-4: A Multimodal Dataset of Four-Person Collaborative Interaction [1.3] グループAffect-4は10人の4人グループで40人の参加者からなるマルチモーダルコーパスである。
各参加者は、手首に装着した生理センサー、目追跡メガネ、およびクローズトークマイクを備える。
このデータセットは、予想される生理的窓の91%以上と、視線追跡窓の98%をカバーしている。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:38:27 GMT)
From Prompts to Pavement Through Time: Temporal Grounding in Agentic Scene-to-Plan Reasoning [1.3] 本研究は, エージェント間コミュニケーションにおける時間的条件付けが, 意味的・論理的一貫性の低下を伴わずにコヒーレンスを維持・強化できるかどうかを考察する。
その結果,時間的条件付けは推論スタイルに反するが,標準NLPに基づく正当性測定では統計的に有意な改善は得られなかった。
これらの結果から,プロンプトベースの時間的接地限界を明らかにし,時間的シーンから計画的推論のための最初の経験的基準を確立した。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:18:35 GMT)
Auditing Privacy in Multi-Tenant RAG under Account Collusion [1.3] マルチテナント検索拡張生成サービスは、ログ単位の差分プライバシーを操作リーク境界として宣伝する。
我々は、同一インデックスのマルチアカウント共謀をプライバシ境界障害とみなす。
修正されていないRAGデプロイメントに対して動作する最初の監査プロトコルを設計する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:41:59 GMT)
Distribution-Free Uncertainty Quantification for Continuous AI Agent Evaluation [1.2] 我々は、連続AIエージェント評価に分割共形予測と適応共形推論を適用した。
その結果, 年齢ごとの条件付きカバレッジは, 名目レベルを中心に, 十分に集中していることがわかった。
円形制御されたバリデーションにより、フレームワークはベンチマークを超えて信号をキャプチャする。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:47:21 GMT)
B-cos GNNs: Faithful Explanations through Dynamic Linearity [1.2] B-cos GNNは本質的に説明可能なグラフニューラルネットワークのクラスである。
予測をノード単位に分解し、単一入力依存の線形マップを通じて機能毎のコントリビューションを行う。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:44:58 GMT)
Staging by the Book: Automatic Sleep Stage Classification Using Scoring Rules [1.2] 本稿では,アメリカ睡眠医学会のスコアリングロジックを実行可能なコードとして運用するルールベースの睡眠ステージング手法を提案する。
ポリソノグラフィー記録50件について,基準として10-scorer majority-vote コンセンサスを用いて検討した。
現代のディープラーニングモデルよりも基準との一致が低いにもかかわらず、この手法は決定論的決定とAASMスコアリングルールに沿った自然言語の説明を提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:13:35 GMT)
Reframing AI Loss of Control: What It Is, How to Have It, How to Lose It [1.2] 目標の設定と獲得”に固定することで,コントロールの動作定義を確立します。
次に、制御が失われる方法、AIが制御の喪失にどのように貢献するかについて議論し、制御を維持するための適切なレコメンデーションを提供します。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:50:36 GMT)
K-Quantization and its Impact on Output Performance [1.1] 本稿では,様々な量子化レベルにおける8つの大規模言語モデル(LLM)の性能について検討する。
ビット精度が低いと一般的にパフォーマンスが低下するが、その影響はモデルやタスクによって異なる。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:31:47 GMT)
StableGrad: Backward Scale Control without Batch Normalization [1.1] 非常に深いニューラルネットワークを訓練するには、深さにわたる大きさの伝搬を制御する必要がある。
現代のアーキテクチャは、しばしばバッチ正規化、残留接続、その他の正規化レイヤを通じてこの問題を軽減する。
我々は、前方モデルを変更することなく、階層的な重み付け不均衡を補正する別のメカニズムであるStableGradを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:49:30 GMT)
Smooth Piecewise Cutting for Neural Operator to Handle Discontinuities and Sharp Transitions [1.0] 学習複雑性を低減しつつ,不連続性を明示的にモデル化する2段階トレーニングフレームワークであるCut-DeepONetを提案する。
提案手法では,領域を滑らかな部分領域に分割し,非連続性を高次元空間の境界として表現する。
ベンチマークPDEの実験によると、Cut-DeepONetは、低解像度データセットでトレーニングされた場合でも、最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:17:59 GMT)
Hiding in Plain Sight: Finding MAHA on Reddit [1.0] Make America Healthy Again (MAHA) は、国民の健康運動である。
ソーシャルメディアにおけるMAHA運動の様々なインフルエンサーやプロモーターが、オンライン空間に散在している。
このデータセットは、様々な領域の研究者に、MAHA運動のダイナミクスを研究する機会を提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:32:10 GMT)
ContextRAG: Extraction-Free Hierarchical Graph Construction for Retrieval-Augmented Generation [1.0] グラフ構造化検索拡張生成システム(RAG)は,マルチホップ質問に対する回答品質を向上させることができる。
現在のシステムは、インデックス作成中にエンティティ、関係、要約を抽出するために、大きな言語モデル(LLM)に依存している。
グラフトポロジをLCMベースのエンティティや関係抽出なしで構築したグラフRAGシステムであるContextRAGを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:08:19 GMT)
D-CLING: Prior-Preserving Depth-Conditioned Fine-Tuning for Navigation Foundation Models [1.0] ナビゲーション基礎モデル(NFM)は、様々なシナリオにおいて強力な一般化可能性を示している。
NFMのドメイン内ファインチューニングの採用は、ビジュモータポリシーを効果的に校正し、新規シナリオにおいてもさらなる改善を約束する。
本稿では,大規模な事前学習を活用しながら,新しいセットアップを効率的に学習するファインチューニング手法を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:23:04 GMT)
Filling-Sensitive Spectral Complexity from Hilbert-Space Holonomy in Fragmented Non-Hermitian Systems [1.0] ヒルベルト空間ホロノミーは、断片化された非エルミート多体系におけるスペクトル現実性の幾何学的整理原理を提供することを示す。
ある状態において、自明なホロノミーは創発的境界解釈を認め、より長い範囲のモデルは、同じ基準によって支配される有限の実領域と複素領域を示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:10:39 GMT)
CADENet: Condition-Adaptive Asynchronous Dual-Stream Enhancement Network for Adverse Weather Perception in Autonomous Driving [1.0] 逆天候は、自動運転車のカメラによる物体検出を劣化させる。
本稿では,雨,霧,砂,雪の物体検出のためのトレーニング不要3スレッドシステムであるCADENetについて述べる。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:30:28 GMT)
Probabilistic Multivariate Time Series Forecasting with Diffusion Copulas [1.0] 本稿では,差分分布の学習を依存構造から明示的に分離する拡散コプラフレームワークを提案する。
暗号通貨市場に適用することで、我々のアプローチは最先端のベースラインよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:17:37 GMT)
Platonic Representations in the Human Brain: Unsupervised Recovery of Universal Geometry [1.0] 本稿では,脳データのみから被験者固有の埋め込みを学習する自己教師型エンコーダを提案する。
これらの独立学習空間は、教師なし回転を用いて対象物間で変換可能であることを示す。
これらの結果は、人間の視覚野における共有神経形状の証拠となる。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:04:15 GMT)
Neuron Incidence Redistribution for Fairness in Medical Image Classification [0.9] そこで本研究では,1層ニューロン間での予測確率重み付き平均アクティベーションのばらつきを,学習時に階層ラベルを必要としない,軽量な正規化手法を提案する。
HAM10000では、TPRの格差は年齢層で10.81%から0.93%に減少し、性別で12.04%から0.74%に減少し、AUCは0.51ポイントに改善した。
ハーバード大学のOCT-RNFLでは、NIRはFPRの人種差(15.68%から10.66%)と年齢(12.69%から1.80%)を減らしている。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:39:18 GMT)
Bowtie VarQTE: A Resource-Efficient Quantum State Preparation Primitive [0.9] VarQTEは、物理的に構造化された量子状態を作るためのプリミティブである。
これは、既存の構造と関連する古典的なシミュレーションを可能にする可能性を活用することで、量子リソースの要求を減らす。
2Dシステムの結果は、標準的なサンプルベースのクリロフ対角化計算と比較して、ボーティVarQTEが量子要求をいかに削減できるかを示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:00:03 GMT)
Scalable Multi-robot Motion Planning via Hierarchical Subproblem Expansion and Workspace Decomposition Refinement [0.9] マルチロボット動作計画における基本的な課題は、ロボット群の関節構成空間を探索する膨大な計算コストを伴わずに、十分な調整を達成することである。
本研究では,作業空間の分解を個別に探索することで,計画中のロボット同士の協調を図りながら,作業空間の分解を個別に探索できるという知見を活用することにより,計画時間を大幅に向上するマルチ移動ロボット運動計画手法を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:44:09 GMT)
An Approximation Algorithm for Graph Label Selection [0.9] 標準予算制約の下でグラフラベル選択のための最初の$tildeO(log1.5 n)$-approximationアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:21:52 GMT)
A Tabular Schedule Abstraction for Communication-Aware Evaluation of Pipeline-Parallel LLM Training [0.8] パイプライン並列性は、大規模言語モデルの分散トレーニングにおいて重要なテクニックである。
GPipe, 1F1B, Chimera, および Hanayo を複数のモデルシステム構成で比較した。
この結果から,スケジュールランキングは抽象的不変ではなく,バブル解析のみによって提案される構造上の利点を否定することができることがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:19:51 GMT)
Mechanism of Efficacy in QAOA for Random k-SAT: From Adiabatic Manifold to Sublinear Parameter Optimization [0.8] 我々は,ランダムな$k$-SAT問題に対するQAOAを,ユニバーサルミキサ$k$-ローカル検索フレームワーク内で検討する。
この対応は、節密度$m=O(n1+)$と回路深さ$(n2)$のランダムなインスタンスに対して厳密な性能を保証する。
本研究では,非構造な高次元探索からガイド付き精細化プロセスへパラメータ最適化を変換するスムーズなアディバティック・マニフォールドパラメータ化(SAMP)戦略を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:53:02 GMT)
Robust Mitigation of Age-Dependent Confounding Effects via Sample-Difficulty Decorrelation [0.8] そこで本稿では,年齢依存型コンファウンディングの効果を緩和する枠組みを提案する。
我々は,頑健なハマー重み付き親和性ウェイトを用いて,年齢と優占年齢の傾向を相関させ,コンバウンディング駆動ショートカットを緩和した。
提案手法は, AUCの影響を最小限に抑えつつ, 年齢依存の真偽と偽陽性の相違を低減し, 試験年齢分布の変化の増大に頑健である。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:01:40 GMT)
Trajectory Planning and Control near the Limits: an Open Experimental Benchmark on the RoboRacer Platform [0.8] 我々のフレームワークには、時間最適レースライン生成、オンライン時間最適速度計画、幾何経路追跡コントローラ、ステアリング制御のための逆ダイナミクスを学習するための新しいモデル構造化ニューラルネットワーク(MS-NN)が含まれている。
2つの回路を用いて1:10スケールのRoboRacerプラットフォーム上にフレームワークをデプロイする。
我々のMS-NNは追跡精度を大幅に改善し、操舵振動を低減し、物理的に解釈可能である。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:14:07 GMT)
Spectral Unforgetting: Post-Hoc Recovery of Damaged Capabilities Without Retraining [0.8] ターゲットタスクの言語モデルを微調整することで、トレーニングデータが明示的に脅威に曝されることのないように、定期的に機能を低下させる。
我々は、事前訓練されたチェックポイント$W_mathrmbase$とその微調整された子孫$W_mathrmft$のみを使用するポストホック修復ソリューションを提案する。
DG-Hardは、細調整更新$= W_mathrmft - W_mathrmbase$に対するチェックポイントのみのスペクトル補修法である。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:01:39 GMT)
Modeling Emotional Dynamics in Agent-to-Agent Interactions on Moltbook [0.8] 本研究は,モルトブック内のエージェント相互作用の感情動態を解析する。
我々は、テキストの相互作用を予め定義された微妙な感情カテゴリーの集合にマッピングする感情認識フレームワークを構築した。
分析の結果,異なる感情パターンとエージェント間の行動安定性のレベルが明らかとなった。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:53:37 GMT)
Quadratic Characterizations for Reachability Analysis of Neural Networks [0.7] 本稿では,2次元実平面におけるスカラー関係の2次的特性の検証を行うための枠組みを開発する。
$tanh$のようなスムーズなアクティベーションに対しては、一般的なセクターやスロープに基づく記述の代替となるドメイン依存の二次的特徴を与える。
ReLUネットワークでは、ニューロンとより密接な局所境界間の依存関係を活用することにより、フィードフォワードネットワークのQCに基づく可読性解析における保守性を低減する方法を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:45:31 GMT)
Capacity of multimode quantum Gaussian channels [0.7] 固定電力制約下でのモード数を増やすことが常に最適であることを示す。
ランダムなパッシブ変換の場合,アンサンブル平均ホレボ容量の解析式を導出する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:17:35 GMT)
Quantum communications in continuous variable systems [0.7] 量子決定論と連続可変量子鍵分布(CVQKD)の2つの関連するパラダイムに焦点を当てる。
前者のケースでは、コヒーレント状態判別の問題に対処し、二相相シフト鍵識別のための新しいハイブリッド受信機を設計する。
一方、既存のプロトコルを強化するためにチャネル損失軽減を行うという、より基本的な問題に対処する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:42:07 GMT)
Terrestrial Soft Mobile Robots: A Review [0.7] 我々は、車輪レス地上機関車システムに焦点をあてて、ソフト移動ロボット研究の現状を概観する。
ソフトなモバイルロボットの普及を可能にするためには,克服すべき重要な研究課題を特定する。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:41:20 GMT)
Multi-Session Ground Texture SLAM in Low-Dynamic Environments [0.6] 本研究は, マルチセッション低流動地盤テクスチャ環境における軌道推定精度に及ぼす3つの異なる手法の影響について検討する。
Kullback-Leibler Divergence の類似性スコアとループ閉鎖信頼度に影響を与えるバイアスとしての使用が最も成功したことが判明した。
セッション間の地面が変化するマルチセッション画像を含む,ロボットコミュニティが使用するデータセットについて紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:37:40 GMT)
Can LLMs Produce Better Object-Oriented Designs than Human-Involved Development? [0.6] 本研究の目的は,PreAI,PostAI,PureAIの3つの著者条件から,プロジェクトにおけるOODの品質を比較することである。
人間の関与したプロジェクトとは対照的に、PureAIプロジェクトはコードの臭いの密度が低く、全体的なサイズ、複雑さ、結合性の点で一般的にシンプルに見えます。
ポストAIは多くのOOD対策においてPreAIよりもPureAIに近づき、過度に単純化する傾向を示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:32:50 GMT)
From Mean-Field Limits to Semiclassical Concentration: Global Convergence of the Canonical Evolutionary Strategy [0.6] 我々は、シュルディンガー型複製子-ミュータ方程式の半古典的極限により、進化アルゴリズムのグローバル収束を分析する。
離散的な個人ベースの力学から決定論的平均場限界までの厳密な階層を提供する。
グローバル・ミニマライザが初期サポート外に存在する場合、早期に分散崩壊する傾向にあるコンセンサス駆動の手法とは異なり、CESのレプリカータ・ミューテータのダイナミクスは固有の質量輸送を促進する。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:25:21 GMT)
Not all uncertainty is alike: volatility, stochasticity, and exploration [0.6] 我々は、時間とともに漂流し(変動性)、うるさい結果(確率性)を通して観察される潜在報酬状態のある環境を考える。
ボラティリティはそれを高め、後続性はそれを抑制する。
我々は,同じモノトニクスを継承する制御・アズ・推論によって得られるクローズドフォーム探索ボーナスであるCAUSEを導出する。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:38:00 GMT)
Multi-Week, In-Class Deployments of Telepresence Robots With Four Homebound K-12 Students: Benefits, Challenges, and Recommendations [0.6] K-12教育中にかなりの数の学校を欠いていることは、生徒の認知と社会的発達を危険にさらすことが知られている。
移動式リモートプレゼンスシステム(テレプレゼンスロボット)は、実機と移動性を提供するため、在宅の学生に有望である。
在宅K-12学生を対象に,テレプレゼンスロボットを用いて,複数週間の展開を行った結果について報告する。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:26:15 GMT)
WoundFormer: Multi-Scale Spatial Feature Fusion for Multi-Class Wound Tissue Segmentation [0.5] マルチクラス創傷組織セグメンテーションのための階層的空間特徴融合を強化するトランスフォーマーベースのフレームワークであるWoundFormerを提案する。
We evaluate WoundFormer on the WoundT IssueSeg dataset (147 image, six tissue class) and a second benchmark (DFUTissue dataset)。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:58:58 GMT)
Contract Based Verification of Non-functional Requirements for Embedded Automotive C Code [0.5] 制御フローやデータフローの制限のような非機能要件は、組み込みシステムの安全性にとって重要である。
Cモジュールのためのインタフェース仕様契約言語を提案する。
Scania trucks におけるソフトウェアを用いた安全クリティカル C コードの2つのケーススタディについて報告する。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:12:45 GMT)
Data Architectures for AI-Ready Interoperable Public Transportation Ecosystems [0.5] 公共交通機関(PT)は、自動運賃徴収(AFC)、自動旅客カウント(APC)、車両位置(AVL/CAD)、スケジュールおよびリアルタイムフィード(GTFS/GTFS-RT)から大量の異種データを生成する。
これらのデータセットは、データ駆動計画、オペレーション、および旅客サービスにとって前例のない機会を提供するが、そのポテンシャルは断片化、一貫性のない更新、再現可能な相互運用可能なパイプラインの欠如によって制限されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:23:54 GMT)
Passive Construction Site Safety Monitoring via Persona-Scaffolded Adversarial Chain-of-Thought VLM Verification [0.5] 2023年に1,055人の重傷を負ったアメリカで最も致命的な産業セクターである。
既存の監視アプローチは高価で、リアルタイムなヒューマンオペレータを必要とする。
本稿では,POVボディーウーンと固定壁マウントカメラの受動・組立安全監視パイプライン処理ビデオを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:00:01 GMT)
EngiAI: A Multi-Agent Framework and Benchmark Suite for LLM-Driven Engineering Design [0.4] 3つの評価次元を持つベンチマークスイートを導入する。
本稿では,LangGraph上に構築されたマルチエージェントシステム(MAS)の実装であるEngiAIを紹介する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:12:09 GMT)
Unlocking the Potential of Continual Model Merging: An ODE Perspective [0.4] 連続モデルマージング(CMM)は、逐次到着タスク間で基礎モデルの迅速なカスタマイズを可能にする。
既存のマージルールには、以前に学習した能力と新たにマージされたモデルの間の学習能力の割り当てに関する明確な制御性がない。
本稿では,時間依存性の速度場を統合することで,CMMに適した新しいODE-driven Merging (ODE-M)を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:03:20 GMT)
Cardiac fat segmentation using computed tomography and an image-to-image conditional generative adversarial neural network [0.4] 本研究では,2種類の心筋脂肪沈着の自律的分別と定量化を行う深層学習に基づく新しい手法を提案する。
本研究における2種類の脂肪沈着は心膜脂肪と縦隔脂肪と呼ばれ,心膜によって空間的に分離される。
実験の結果,心膜脂肪のセグメンテーションにおける平均精度は99.08%,f1スコアは98.73,97.90%,f1スコアは98.40であった。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:20:24 GMT)
A Family of Divergence Measures for Evaluating the Reconstruction Quality of Explainable Ensemble Trees [0.4] 相関に基づくアプローチは、共起構造における系統的な不一致を検出するのに失敗する。
本稿では,合意・連想の区別に基づく統計的枠組みを提案する。
このフレームワークには、近似品質の異なる構造面をキャプチャする4つの補完的な尺度が含まれている。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:56:04 GMT)
Quantum Accreditation with Non-Clifford Two-qubit Gates [0.4] 非クリフォード2量子ゲートを持つ量子回路のための量子認証プロトコルのファミリーを開発する。
我々は,誤りのない量子計算と誤計算の確率分布の総変動距離を上限として,実用的でスケーラブルなプロトコルを提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:14:30 GMT)
A 10,000-Year Global Stochastic Tropical Cyclone Catalog with Wind-Dependent Track Transitions (WHITS) [0.4] WHITS(Wind- Focus Hurricane Interactive Track Simulator)は,非パラメトリックなセミマルコフトラックジェネレータである。
ヒストリカルトラックセグメント間の遷移は、位置、年齢、前方ベクトルに加えて、局所的な風速で条件付けられる。
結果として得られた1万yrのグローバルな合成カタログは、観測されたトラック密度と毎年のハリケーン/台風による風速の確率を再現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:58:36 GMT)
Justifying bio-inspired robotics research: A taxonomy of strategies [0.4] バイオインスパイアされたデザインのためのモチベーションの分類を提案し、異なるアプローチから生じる可能性のある潜在的重要な貢献について述べる。
これはロボティクスの分野で特に当てはまり、生体システムと類似性が建設の動機となるかもしれない。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:35:14 GMT)
Improving Ensemble CAPE Forecasts with a Diffusion Model Incorporating Aerosol Information [0.4] 対流可能なポテンシャルエネルギー(CAPE)は、厳しい天候を予測する上で重要な変数である。
最新のGlobal Forecast System(GFS)と関連するGlobal Ensemble Forecast System(GEFS)は、夏期のCAPEの過小評価に偏っている。
我々は人工知能(AI)拡散モデルを訓練し、米国における午後6時間のリードタイムアンサンブル予測のスキルと不確実性を向上させる。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:32:55 GMT)
Reinforcement Learning for Optimal Experiment Design in Parameter Identification of Mechatronic Systems [0.4] 本稿では,Quanser Aero 2テストベッドの最適励起信号を学習する強化学習(RL)エージェントを提案する。
包括的エージェントは,古典的基準線を上回り,0.75%の安全違反しか生じない3つのパラメータの競合推定精度を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:39:49 GMT)
CASCADE Conformal Prediction: Uncertainty-Adaptive Prediction Intervals for Two-Stage Clinical Decision Support [0.4] 本稿では,CASCADE(Calibrated Adaptive Scaling via Conformal and Distributional Estimation)を紹介した。
Venn-Abersの多確率不確実性を直接非整合性スコアにマッピングすることにより、我々のフレームワークは継続的なリスク適応を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:30:10 GMT)
Stochastic Penalty-Barrier Methods for Constrained Machine Learning [0.3] 制約付き機械学習は、一般的なトレーニング、物理-ニューラルネットワーク、シンボリックドメイン知識の統合を可能にする。
統計モデルにおける非滑らかな設定を扱うための指数関数的双対ペナルティ平均化法を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:03:47 GMT)
SAGE: Scalable Automatic Gating Ensemble for Confident Negative Harvesting in Fraud Detection [0.3] 音楽ストリーミング詐欺は、ストリーミングサービスや合法的なコンテンツクリエイターに重大な脅威をもたらす。
従来の詐欺検出アプローチは、スーパーファンや睡眠音楽セッションを含む多くの正当なエッジケースが、協調された詐欺行為を忠実に模倣する活動パターンを示すという、重大な課題に苦しむ。
SAGEは,SimHashをベースとした階層化サンプリングとモジュール型ゲーティングアンサンブルを組み合わせることで,ラベルなしデータからの確実な負の識別を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:46:31 GMT)
EmbGen: Teaching with Reassembled Corpora [0.3] コーパスをエンティティ記述ペアに分解する合成データ生成パイプラインであるEmbGenを紹介する。
EmbGen を EntiGraph,InstructLab,Knowledge-Instruct に対して,多種多様な意味的不均一性のデータセット上で評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:40:12 GMT)
The Marginal Problem for Density Operators [0.3] 局所還元密度作用素が所定のマルコフ構造を持つ大域量子状態に組み立てられるかを検討する。
この障害がトレース条件によって正確に捕捉されていることを証明します。
3量子ビットのパウリの例は、量子障害物が実であることを示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:06:54 GMT)
On-Device Continual Learning with Dual-Stage Buffer and Dynamic Loss for Point-of-Care Pneumonia Diagnosis [0.3] ポイント・オブ・ケア型肺炎診断のためのドメインインクリメンタルラーニング手法であるPneumoNetを提案する。
PneumoNetは86.6%の精度を実現し、1.4%は忘れるが、既存のベースラインよりも小さく高速である。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:00:19 GMT)
OpenHealth Lake: Designing and testing a data lakehouse platform for health applications [0.3] OpenHealth Lakeは、データレイクハウスアーキテクチャ、データフェデレーション、FAIR原則に基づく、データ管理のプロトタイププラットフォームである。
現在のプロトタイププラットフォームは、ユーザフレンドリなWebサイト、オープンAPI、PythonとRパッケージで構成されており、ユーザは複数の方法でプラットフォームと対話できる。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:45:59 GMT)
StruMPL: Multi-task Dense Regression under Disjoint Partial Supervision and MNAR Labels [0.3] 地球観測による森林表層バイオマス(AGB)の推定は、2つの構造的非互換なラベル源を組み合わせたものである。
我々はこれをMNARラベルとマルチタスク間物理的制約との不均一な解離部分監督の下でのマルチタスク密度回帰として定式化する。
我々は,損失を拘束しながらIPW重み付き定常点を回復するためには,共同最適化が必要であることを解析的かつ実証的に示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:51:12 GMT)
Beyond Text and Tables: Vision-Language Model Integration in ComProScanner for Extracting Materials Data from Scientific Figures with High Accuracy [0.2] ComProScannerは、自動コンポジションプロパティデータベース構築のためのエンドツーエンドフレームワークである。
VLMを統合したComProScannerは、材料に特化した、完全に自動化された、マルチモーダルな文献採掘プラットフォームである。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:55:19 GMT)
Does Code Cleanliness Affect Coding Agents? A Controlled Minimal-Pair Study [0.2] コードのクリーン化がエージェントのナビゲートと修正の能力に影響を与えることを示す。
我々の知見は、従来の保守性原則がAI駆動開発の時代において極めて重要であり続けていることを示唆している。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:06:26 GMT)
PrefBench: Evaluating Zero-Shot LLM Agents in Hidden-Preference Personalized Pricing Negotiations [0.2] PrefBenchは、暗黙の推論パーソナライズされた価格交渉のためのシミュレータベースのベンチマークである。
提案するPrefBenchは,隠れた買い手選好下での価格-エージェント行動を評価するためのベンチマークである。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:10:05 GMT)
Do as I Say, Not as I Do: Instruction-Induction Conflict in LLMs [0.2] 言語モデルは命令に従うように訓練されているが、強力なパターン補完器でもある。
我々は、ターゲットTで動作するためのユーザ命令がNのハードコードアシスタントによって反対される会話を構築し、競合するパターンPを示す。
この設定では、最大50ターンで13のモデルと16の異なる命令で命令追従率(IF)を測定します。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:32:20 GMT)
Spin-Induced Non-Markovian Time-Crystal-Like Dynamics and Fractal Scaling in the Bateman Dual Oscillator [0.2] クローズド量子系は外部駆動を伴わずに時間-結晶様のダイナミクスを持続的に生成できることを示す。
このメカニズムは、平衡時間結晶に対する従来のノーゴー定理の仮定の外側にある。
この意味で、これらの自己相似構造の「成長を見る」ことは、時間-結晶的秩序の段階的な形成を観察することに対応する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:43:03 GMT)
CAFD: Concept-Aware DNN Fault Detection using VLMs [0.1] Deep Neural Networks(DNN)におけるCAFD(Concept-Aware Fault Detection)のアプローチ
CAFDは、実用効率を維持しながら複数の情報ソースを統合する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:14:13 GMT)
Disentangling Sampling from Training Budget in Class-Imbalanced CT Body Composition Segmentation [0.1] 授業不均衡は医療画像のセグメンテーションにおける基本的な課題であり、稀な授業を犠牲にして、しばしば授業が訓練を支配している。
我々は、クラスバランスの取れたバッチ構築を教師付き環境で促進するために、数ショット学習からのエピソードサンプリングを採用する。
SAROSデータセットの210スキャンから得られた9つの筋肉および脂肪組織における無作為および重み付きサンプリングに対するエピソードサンプリングを比較した。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:01:05 GMT)
HADS-Net:A Hybrid Attention-Augmented Dual-Stream Network with Physics-Informed Augmentation for Breast Ultrasound Image Classification [0.0] HADS-Netはハイブリッドアテンション拡張デュアルストリームネットワークである。
グローバルなテクスチャと2つの平行な経路を通して局所的な境界線を利用する。
精度は96.58%、マクロOC-AUCは0.9978、マクロF1は0.9654、クラスF1スコアは0.970、0.951、0.976である。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:16:24 GMT)
An LLM-Based System for Argument Mining [0.0] 本稿では,自然言語テキストから抽象的引数グラフへ引数を再構成する,エンドツーエンドの大規模言語モデル(LLM)を提案する。
このシステムは、議論的コンポーネントを段階的に識別し、関連する要素を選択し、それらの論理的関係を明らかにする多段階パイプラインに従う。
その結果,提案システムは議論構造を適切に復元することができ,異なるアノテーションスキームに適応すると,ベンチマークデータセット間で適切な性能が得られることがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:49:59 GMT)
AgentAtlas: Beyond Outcome Leaderboards for LLM Agents [0.0] 本研究では、6つの行動軸に対して15個のエージェントベンチマークをベンチマーク・カバレッジ・監査マッピングする。
方法論を実証するために、両方のプロンプトモードの下で、小さな固定8モデルセットを実行しました。
明示的なラベルメニューの取り外しは、すべてのモデルの軌道精度を14-40ppから0.54-0.62フロアに下げる。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:05:12 GMT)
reconCTI: A Proactive Approach to Cyber-Threat Intelligence [0.0] reconCTIは、LinuxシステムにPythonを使って構築されたコマンドラインツールである。
ユーザーは特定のキーワードを入力し、複数のサイトを一度にスキャンし、MITRE ATT&CKフレームワークを参照して結果を評価することができる。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:32:05 GMT)
X-Ray cardiac angiographic vessel segmentation based on pixel classification using machine learning and region growing [0.0] 本研究は,X線アンギオグラムにおける血管分割のための画素分類手法を提案する。
この提案では、異方性拡散、ヘッセン行列に基づく特徴、数学的形態学、統計学などのテクスチャ的特徴を用いる。
この手法は文献で最高の精度(95.48%)を達成し、教師なしの最先端の手法を上回った。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:27:45 GMT)
WriteSAE: Sparse Autoencoders for Recurrent State [0.0] WriteSAEはモデル自身の書き込みと同じ形状のランク1行列原子を学習する。
数式は書き込み方向を選択し、それを3つの連続キャッシュ位置に書き込む:$3times$モデルの書き込みのノルムは、トークンを最初に100-1000ランクにし、連続の100%で表示し、33.3%から上昇する。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:54:38 GMT)
When Web Apps Heal Themselves: A MAPE-K Based Approach to Fault Tolerance and Adaptive Recovery [0.0] 本研究では,共有知識ベース上でのモニタ・アナライズ・プラン実行に基づくモジュール型自己修復フレームワークを提案する。
適応的な障害回復のためのAutoFixにインスパイアされたメカニズムと統合されている。
提案されたフレームワークは、F1スコアの平均90.7%、リカバリ成功率93.2%を達成した。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:17:24 GMT)
Weight Decay Regimes in Grokking Transformers: Cheap Online Diagnostics [0.0] モジュラー演算で訓練された変換器は、記憶、一般化、崩壊の急激な遷移を示す。
重み劣化はこれらの状態に対するスカラーな経験的制御パラメータとして機能することを示す。
トレーニングのダイナミクスをトラックするオンライン診断,平均的注意頭コサイン類似性とエントロピー標準偏差を導入する。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:48:40 GMT)
Variance-Reduced Manifold Sampling via Polynomial-Maximization Density Estimation [0.0] MASEMはエントロピー最大化再サンプリングによってこの問題に対処する。
軽量リサンプリング-プロキシ実験は7ロブのカバレッジを改善するが、正弦波とスイスロールのプロキシを劣化させるか尋ねる。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:57:39 GMT)
VERA-MH: Validation of Ethical and Responsible AI in Mental Health [0.0] 精神保健支援の文脈において,チャットボットの安全性に関する臨床的に検証された新しい評価であるVERA-MHを紹介する。
VERA-MHは会話シミュレーション、会話判定、モデル評価の3つのステップから構成される。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:10:36 GMT)
Using Aristotle API for AI-Assisted Theorem Proving in Lean 4: A Formalisation Case Study of the Grasshopper Problem [0.0] 本稿では,この問題に対するAristotle API証明の試みをLean 4形式化したケーススタディについて報告する。
生成されたアーティファクトは、定理の一般化されたリーンバージョンを記述し、最大性と隣接するスワップ交換戦略の局所的な構成要素に対する検証済みのヘルパー補題を4つ含んでいる。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:08:58 GMT)
Unveiling Energetic Advantage in Superconducting Cat-Qubits Quantum Computation [0.0] 半古典量子フーリエ変換のエネルギー消費は、猫量子ビットに基づく超伝導量子コンピューティングプラットフォーム上で解析された。
最先端の古典コンピュータとの比較研究は、26量子ビット以上のシステムに対する潜在的な量子エネルギー的優位性を示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:46:54 GMT)
Unlocking Crowdsourcing for Ontology Matching Validation [0.0] 大規模言語モデル(LLM)はオントロジーマッチング(OM)に新たな課題をもたらす
ドメインエキスパートに依存する従来のOMバリデーションは圧倒的なものになっています。
我々は,OM検証のためのクラウドソーシングの品質を確保するため,ドメイン固有の3つのメカニズム,すなわち,信頼度の違い,コヒーレンス前処理,時間依存の意見を提案する。
我々は,既存のOMシステムとクラウドソーシングシステムを統合することで,人間のループ検証を可能にすることを実証した。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:10:15 GMT)
Universal logic gates for coupled period-doubling systems [0.0] 周期駆動システムの周期二重状態に符号化された古典情報に対して,NANDおよびNORゲートを用いたユニバーサル論理演算のための汎用アーキテクチャを提案する。
結合強度とパルス長を調整することにより,ノードの状態が正確に制御できることを示し,ロバストな論理ゲート操作を実現する。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:28:48 GMT)
Understanding Deterioration Random Effects for Causal Discovery in Infrastructure Management [0.0] 本稿では,ベイズ的階層的ハザードモデリングと因果発見を組み合わせ,ポンプ装置の劣化率を推し進める操作パターンを同定する新しい枠組みを提案する。
本研究は,異なる運用体制が根本的に異なる管理アプローチを必要とすることを明らかにすることにより,目標とする保守戦略を可能にする。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:57:35 GMT)
Twisted light generates robust many-body states for practical quantum computing [0.0] ツイスト光は軌道角運動量(OAM)を持ち、一様双極子プローブに暗く、相互作用する電子の励起を駆動することができる。
少数電子量子ドットにおける相関セクターは、多体状態の調整可能なはしごを形成する。
所定のOAM指数と偏光を持つツイスト光パルスは、これらのセクターの高速な光書き込み、読み出し、スケーラブルなアドレスを提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:03:32 GMT)
Toward User Comprehension Supports for LLM Agent Skill Specifications [0.0] スキルが何を消費し、生産し、カバーするかに関して、ユーザが限定的な期待を形成するのに、仕様が役立つかどうかを調査する。
878のサイバーセキュリティスキルを通じて、私たちは4つの理解アンカーのテキストの手がかりを測定するためにルールベースのコーディングを使用しました。
エージェントスキルの評価では、仕様を実行可能な命令のコンテナとしてではなく、ユーザ対応の能力開示として扱うべきだと論じている。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:50:42 GMT)
Topology-Optimized Pneumatic Soft Actuator: Design and Experimental Validation [0.0] 既存の密度とポロハイパー弾性に基づくトポロジー最適化フレームワークを2次元から3次元に拡張した。
本研究の目的は, 所定作動圧の曲げ応答を2つの異なるひずみ条件下で最大化することである。
2つの最適化された3Dデザインはステレオリソグラフィーを用いて製造され、その性能を検証するために実験的に試験された。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:52:49 GMT)
The Privacy Subsidy: Kyle's $λ$ under Noise-Perturbed Order-Flow Observation [0.0] プライバシを保存する暗号通貨取引所は、価格設定メカニズムが注文フローについて観察するものを変更する。
ベイズ市場メーカーが独立なガウスのプライバシーノイズによって乱される秩序の流れを観察する際、ユニークな線形カイル均衡を導出する。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:56:40 GMT)
The Privacy Subsidy in Glosten-Milgrom: Bid-Ask Spread and Welfare under Flip-Noise Direction Observation [0.0] 我々は1985年のGlosten-Milgromのシーケンシャルトレーディングモデルに対して,クローズドフォームの入札スプレッドと福祉の分解を導出した。
福祉の分解は、プロトコルの流動性プールからトレーダへのトレーダ当たりの転送に対して$$を識別する。
その結果、プライバシ・サブシディの概念は連続ガウスから離散的な二状態構造へと拡張された。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:12:01 GMT)
The Physical and Contextual Limits of Quantum Speedup [0.0] 量子計算は指数関数的に多くの古典計算の同時実行としてしばしば誤認識される。
この記事では、量子重ね合わせの成分が独立に可読な古典枝として扱うことができないことを示す概念的明確化を提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:27:11 GMT)
The Economics of Model Collapse: Equilibrium, Welfare, and Optimal Provenance Subsidies in Synthetic Data Markets [0.0] 合成内容に対する再帰的な訓練は、測定可能でしばしば可逆的な分布の忠実さの損失を誘導する。
我々は,モデル崩壊下での合成データ市場における最初の統一的ミクロ経済理論を開発した。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:41:39 GMT)
The Economics of AI Inference: Inflation Dynamics, Welfare Costs, and Optimal Monetary Policy under the Inference-Cost Phillips Curve [0.0] 我々は、人工知能推論コストの統一的ミクロ経済・金融理論と、インフレ、福祉、最適金融政策へのパススルーを開発する。
Inference-Cost Phillips Curve (ICPC, Inference-Cost Phillips Curve)は、非自明なAIコンポーネントバーを含む、差別化された商品を製造するためのファームレベルの限界コストを増大させる、ニューケインシアン・フィリップス曲線である。
我々は、推論コストショック下での消費者福祉のHicks-Kaldor分解を導出し、最適な金融政策対応係数を特徴づける。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:26:11 GMT)
The Accessibility Capability Boundary: Operational Limits and Expansion Potential of AI-Generated Browser-Native Accessibility Systems [0.0] AI駆動のアクセシビリティシステムはどこまで使えるのか?
本稿では、自律的アクセシビリティシステムの運用限界と拡張可能性について推論するための正式なフレームワークであるtextitAccessibility Capability Boundary (ACB) を紹介する。
我々は、2つの実世界の探索プロトタイプの分析に理論的枠組みを定めている。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:23:48 GMT)
Targeting Clause Type Distributions: a Picklock for Random Satisfiability Problems [0.0] 本稿では,最も難しい3つのSAT問題を解くために,Target-SAT (TSAT)アルゴリズムを提案する。
TSATは、その検索において、関連するローカル検索空間内のターゲットに向けて活発にガイドされている。
また, 局所探索アルゴリズムが比較的小さなシステムに制限されている理由を, 膨大な低エネルギートラップにより解析した。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:00:02 GMT)
Subsystem relaxation and a calibrated sampling diagnostic for programmable quantum annealers [0.0] 2つのD-Wave量子アニール上にサブシステム環境プロトコルを実装した。
6ビットサブシステムは、環境が大きくあるいは強く結合されたときに初期状態独立となる。
量子アニールサンプリングのためのサブシステムレベルの検証プロトコルを提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 05:28:10 GMT)
Streamlined Constraint Reasoning via CNN Pattern Recognition on Enumerated Solutions [0.0] 提案手法は,実現可能な解を列挙し,非解に対する畳み込みニューラルネットワークのコントラストを訓練し,CNNを候補となるMiniZincストリームライナーに変換する。
我々のパイプラインは、硬化した容器ローディングの98.8%、硬化したソーシャルゴルファーの98.6%、ブラックホールの89.4%のポートフォリオタイムを達成し、それぞれ932x、356x、1103xの幾何学平均速度に達した。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:25:39 GMT)
Stochastic trajectories and excursions in a double quantum dot system [0.0] 新たに開発された探索形式を用いた二重量子ドット系の軌道準位力学について検討する。
観測可能量(counting observables)は、探索フレームワークにおける主要な研究対象である。
我々は、輸送結果の分布を分析し、成功イベントと失敗イベントのトレードオフで結果を結び付ける。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:51:11 GMT)
Set Shaping Theory as a Complementary Payload-Shaping Layer for Steganography [0.0] 本稿では,少なくとも重要なビット(LSB)画像ステガノグラフィーのための可逆的ペイロード形成層として,SST(Set Shaping)を用いることについて検討する。
この提案は、既存のステガノグラフィー手法を置き換えることや、新しい埋め込み方式としてそれらと競合することを目的としていない。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:15:59 GMT)
Security Document Classification with a Fine-Tuned Local Large Language Model: Benchmark Data and an Open-Source System [0.0] 本研究では、Qwen 3.5 27Bモデルに基づいて構築されたセキュリティ文書分類のためのオープンソースのローカルシステムであるTorchSightについて述べる。
このモデルは、13の許可を受けたソースから78,358のサンプルと、7つのセキュリティカテゴリと51のサブカテゴリをカバーするGPT-4合成データに基づいて訓練された。
その結果、微調整されたローカルモデルでは、文書処理をローカル制御下に保ちながら、正確なセキュリティ文書分類が可能であることがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:18:19 GMT)
SMA-DP: Spectral Memory-Aware Differential Privacy for Deep Learning [0.0] ディファレンシャル・プライベート・勾配降下(DP-SGD)は、サンプルごとのクリッピングとガウス雑音の校正によるプライベート・ディープ・ラーニングを可能にする。
DP-SGDを分数メモリ分岐で拡張する textbfSpectral MemoryAware 法である textbfSMA-DPSGD を提案する。
CIFAR-100、CIFAR-10、MNISTの実験は、いくつかのDP最適化ベースラインよりも、競争力または優れた精度を示している。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:02:19 GMT)
Resource generation and dynamical complexities in open random quantum circuits [0.0] メモリレスオープンおよびメモリレスオープンランダム回路の2種類のランダム回路における量子リソース生成について検討する。
メモリレス力学は、非安定化剤性はゼロではないにもかかわらず、過渡的な成長の後、絡み合いがゼロに崩壊する明確な挙動をもたらすことを示す。
メモリレス回路は、他の2つの回路よりも低次量子状態k-設計に効果的にアプローチしていることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:04:52 GMT)
Refusal Evaluation in Coding LLMs and Code Agents: A Systematic Review of Thirteen Malicious-Code Prompt Corpora (2023-2025) [0.0] 既存の調査では、コードセキュリティ、ジェイルブレイク分類、または脆弱性検出を中心的な対象として扱い、パス時にのみこれらのコーパスに言及している。
本稿では,素早いデータセットを解析単位として扱う。
合成は3つの連続する方法論的ギャップを表面化する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:05:51 GMT)
Reconfigurable Nonlinear Photonic Networks for In-Situ Learning and Memory Formation via Driven-Dissipative Dynamics [0.0] フォトニックニューロモルフィックコンピューティングは、従来のフォン・ノイマンアーキテクチャの限界を克服するための有望な経路を提供する。
本稿では,駆動散逸ダイナミクスから直接記憶と学習が現れる物理基盤型ニューロモルフィック・フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:38:33 GMT)
Quantum-Inspired Hamiltonian Optimization, Stochastic Tensor Networks and Adaptive Congestion Routing for Large-Scale QKD Networks [0.0] 本稿では,量子鍵分布(QKD)通信ネットワークにおける適応的多要求ルーティングのための量子インスパイアフレームワークを提案する。
その結果生まれたフレームワークは、QKDネットワークオーケストレーション、統計物理学にヒントを得た最適化、テンソルネットワーク圧縮、将来の量子ネイティブルーティングシステムの間のスケーラブルなブリッジを確立する。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:05:10 GMT)
Quantum Speed Limit under Calibration Uncertainty [0.0] 商多様体上のニュアンスパラメータをプロファイリングする量子フィッシャー情報に基づく予測速度制限を導入する。
この枠組みは、幾何学的境界を校正と尋問時間のための具体的な設計規則に変換する。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:02:30 GMT)
Quantum Simulation of Gauge Theories for Particle and Nuclear Physics [0.0] 格子場理論は計算粒子と核物理学の最前線にある。
ハドロンスペクトル、構造、崩壊、反応について印象的な結果をもたらし続けている。
私は量子計算格子場理論プログラムを動機付けます。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:12:11 GMT)
Quantum Machine Learning for Cyber-Physical Anomaly Detection in Unmanned Aerial Vehicles: A Leakage-Free Evaluation with Proxy-Audited Feature Sets [0.0] 無人航空機(英語: Unmanned Aviation Vehicle、UAV)は、ネットワーク化されたアビオニクスとオンボードセンサー融合にまたがるサイバー物理システムである。
マルチセンサTLM:UAVベンチマークを用いて,UAV異常検出のための量子機械学習のリークフリー評価を行う。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:05:16 GMT)
Quantum Entanglement Halves the Oblivious Update Bandwidth [0.0] 私たちは、$(n,k)$ MDS-coded distributed storage over $mathbbF_q$ with per-node storage $$ symbolsと考える。
1つのメッセージシンボルが変更され、ヘルパーも古いノードも、どれを知らない場合、古典的な下限は$k log q$ bitsである。
我々は、$k$ヘルパーが事前の量子エンタングルメントを共有するとき、更新帯域幅が$lceil /2 rceil cdot k log q$ bits-等価であることを証明した。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:42:48 GMT)
Quantized Machine Learning Models for Medical Imaging in Low-Resource Healthcare Settings [0.0] 本稿では,MRIを用いた脳腫瘍分類のためのマルチストラテジー圧縮フレームワークを提案する。
量子化を意識したトレーニング、DenseNet-101の教師から低ビットのポストトレーニング量子化を持つコンパクトなDenseNet-32の学生への知識蒸留が含まれる。
実験結果から、量子化モデルでは82.37%の精度が、82.20%の完全精度ベースラインよりも高いことがわかった。
論文参考訳(メタデータ) (Tue, 19 May 2026 00:17:37 GMT)
Proof of the absence of local conserved quantities in the Holstein model [0.0] 局所保存量の存在、すなわちテクティノン可積分性は、量子多体系における様々な現象を議論する際にしばしば仮定される。
この性質の具体的な証明は、電子-フォノン結合系では知られていない。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:45:10 GMT)
Privacy-by-Design Adaptive Group Assignment for Digital Lifestyle Coaching at Scale [0.0] PRISM-Coachは、プライバシ保護型ライフスタイルコーチングのためのステークホルダー中心アーキテクチャと適応的なピアグループ割り当て手法である。
我々は,PRISM-Coachを商業展開型ライフスタイルコーチングプラットフォームにインスタンス化し,約2800名のユーザから3年間のテレメトリを用いて評価する。
その結果、82%は肯定的な利益を報告し、92%は透明性開示後のプライバシーの信頼性を高めた。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:22:35 GMT)
Precision probing of ionic-core transitions in alkaline-earth Rydberg atoms [0.0] イオンコアにおける同位体シフトの高分解能測定と双極子転移の超微粒化について述べる。
この研究の重要な要素は、リドベルク電子軌道の動的制御によって、2桁以上の大きさの直線幅を減少させることである。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:20:29 GMT)
Pramana: A Protocol-Layer Treatment of Claim Verification in Autonomous Agent Networks [0.0] 確率的検証パターン(自己整合性投票、レビュアー LLM アンサンブル)は、人工物ではなく、判断を生成する。
Pramana は、ワイヤフォーマットの欠如を定義している。すべての連続エージェント出力は、タイプ付き ClaimAttestation でラップされ、4つの変種のうちの1つでラップされる。
プラマナは3つの対称性を再現したモデル(38,563個の到達可能な状態、0個の不変な違反)でTLCの下で徹底的に検証された。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:00:33 GMT)
Physics-Informed Graph Neural Network Surrogates for Turbulent Nanoparticle Dispersion in Dental Clinical Environments [0.0] 歯科用エアロゾルは50マイクロメートル未満の核を産生し、閉鎖された診療所で長時間空中に留まり、航空機の病原体感染の経路を作る。
我々は,OpenFOAM多面体メッシュ上でのキャリアフローのダイナミクスと多分散噴霧雲のパーセル運動を共同で予測する物理インフォームドグラフサロゲートであるEulerian-Lagrangian Graph Interaction Network (ELGIN)を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:31:15 GMT)
Photolithography-Only Fabrication of Transmons Using Double-Oblique Evaporation [0.0] 変換二重斜め蒸発幾何を用いてトランスモンジョセフソン接合を作製する。
その結果,光リソグラフィーのみのプロセスで機能的トランスモンデバイスの実現の可能性が示された。
論文参考訳(メタデータ) (Tue, 19 May 2026 09:31:29 GMT)
Perturbative approach to the first law of quantum thermodynamics [0.0] 量子熱力学では、熱と仕事へのエネルギー交換の分解は未解決の問題である。
近年の定式化により、量子コヒーレンスは、解釈がまだ議論中である追加のエネルギーコントリビューションを導入することが示されている。
熱力学量を2次に拡張することで、作業、熱、コヒーレンスへの明確な摂動補正を導出する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:00:13 GMT)
Personality Engineering with AI Agents: A New Methodology for Negotiation Research [0.0] 我々は、AIエージェントを使用して交渉担当者の性格を正確に分類し、操作し、評価する手法であるパーソナリティエンジニアリングを紹介する。
本研究は, 対人空間と, 温かさと優位性の2つの中核次元を, フィールドの基本的な座標系として用いることを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:11:19 GMT)
Pauli Correlation Encoding for mRNA Secondary Structure Prediction: Problem-Aware Decoding for Dense-Constraint QUBOs [0.0] Pauli correlation plex (PCE) は$m$バイナリ変数を$n=O(m1/k)$ qubitsに圧縮する。
我々は,PCEをmRNA二次構造予測に適用し,QUBOを厳密に制約したQUBOとして定式化し,QUBOのペナルティ構造を保存するQUBO空間のシグモノイド損失を訓練する。
Problem-Aware Guided Decoder (PAGD) は、限界QUBOエネルギー削減とトレーニングされた期待値とを組み合わせることで、候補変数のコミットメントをスコアする。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:49:58 GMT)
PRISM-SLAM: Probabilistic Ray-Grounded Inference for Scale-aware Metric SLAM [0.0] PRISM-SLAMは、VFMプリエントを構造化ベイズ因子グラフに厳密に統合するリアルタイムフレームワークである。
我々は,一貫した距離座標系内の絶対空間における単分子観測を固定するために,チャンカー線距離係数を導入する。
VFM推論と幾何追跡を非同期に処理するマルチプロセスアーキテクチャを利用することで、PRISM-SLAMはRGB入力のみを使用して、30FPSで検証済みのメトリック出力を提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:10:04 GMT)
PEPSKit.jl: A Julia package for projected entangled-pair state simulations [0.0] PEPSKit.jlは、2次元量子多体系を無限に投影された絡み合った状態(iPEPS)でシミュレートするためのJuliaパッケージである
論文参考訳(メタデータ) (Tue, 19 May 2026 15:12:10 GMT)
OSCToM: RL-Guided Adversarial Generation for High-Order Theory of Mind [0.0] OSCToM (Observer-Self Conflict Theory of Mind) は、ToMタスクにおけるネストされた信念の衝突をモデル化するためのアプローチである。
我々の実験では、OSCToM-8Bはテストされたシステムの中で最高の総合的な結果をもたらす。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:19:26 GMT)
Non-equilibrium quantum dynamics of interacting integrable models by Monte Carlo sampling Lehmann representations [0.0] 局所作用素の時間依存期待値に対するリーマン表現を数値的に評価するモンテカルロサンプリングスキームを提案する。
非相互作用格子および連続体モデルに対する正確な結果と弱い相互作用における短時間の結果とをベンチマークする。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:20:56 GMT)
Non-Markovianity in the Adapted Caldeira-Leggett model [0.0] 適応カルデイラ・レゲットモデルの非マルコフ的特徴について検討する。
モデルがシステムと環境の両方の自由度を明示的に追跡する能力を利用することで、非マルコビアン性の詳細な特徴付けを提供する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:23:50 GMT)
Non-Bloch Quantum Geometry of Non-Hermitian Systems [0.0] 開境界条件下では非エルミート系に対する量子幾何学を定式化する。
実空間と非ブロック表現の両方で量子幾何学量を定義することにより、統一された枠組みを確立する。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:38:47 GMT)
No measurement induced phase transition in the entanglement dynamics of monitored non-interacting one-dimensional fermions in a disordered or quasiperiodic potential [0.0] 1次元(1d)非相互作用フェルミオンと$U(1)$対称性の絡み合いエントロピー(EE)は常に領域法相にあることを示す。
これらの系における以前に主張されたMIPTの理由は、格子最大サイズ$L sim 500$が相関長の順序であるという事実に関連した有限サイズ効果であった。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:59:47 GMT)
MultiBallot: Verifiable and privacy-preserving E-Collecting in the Swiss setting [0.0] 我々はまず,e-votingの設定に基づいて,スイスにおけるe-collectingの現実的な設定を導出する。
本稿では,現実的な信頼前提の下でのプライバシと検証可能性の両方を達成するためのセキュアなプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:48:53 GMT)
Multi-population Diversity-guided Genetic Algorithm for Feature Selection in Network Intrusion Detection [0.0] 本研究では,MPDGGA(Multi-Population Diversity-Guided Genetic Algorithm)を提案する。
他の先進的な4つの機能選択モデルよりも大幅に優れています。
11のデータセット全体で10のデータセットで最高精度に達し、少なくとも2.26%が選択された。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:57:28 GMT)
Microcanonical Energy Sharing and a Page-like Curve for the Capacity of Entanglement [0.0] 本研究では, マイクロカノニカルアンサンブルにおけるエンタングルメントの容量について検討した。
熱力学系では、容量はエネルギー共有変動によって制御される。
この構造は、ページ状容量曲線の熱力学的マイクロカノニカル機構として意図されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:59:21 GMT)
Memory-Induced Supra-Competitive Outcomes Between Deep Reinforcement Learning Agents in Optimal Trade Execution [0.0] 本研究では,アルムグレン・クリス液化ゲームについて検討し,学習行動がエポゾード内環境フィードバックにどのように依存するかを検討した。
エージェントがエピソード内履歴、特に最近の価格と過去の行動にアクセスできるようになれば、超競争的な結果はかなり頻繁になり、より永続的になる。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:03:48 GMT)
Membership Inference Attacks on Discrete Diffusion Language Models [0.0] MDLMの微調整によるMIA攻撃について検討し、現在の灰色のボックスベースラインが示唆しているよりもかなり脆弱であることを示す。
また、Kは非関連領域のデータに基づいて訓練された3つの代理MDLMに等しいシャドーモデル転送攻撃を設計し、ターゲット領域へのアクセスのないラベルを生成する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:59:11 GMT)
MedCRP-CL: Continual Medical Image Segmentation via Bayesian Nonparametric Semantic Modality Discovery [0.0] MedCRP-CLは,オンラインタスク構造探索と構造認識連続学習を行うフレームワークである。
物理的画像モダリティよりも微細な構造を捉えることで,これらの意味的モダリティを表現した。
4つの画像モダリティにまたがる16の医療セグメンテーションタスクの実験では、MedCRP-CLが73.3%のDiceスコアを達成し、わずか4.1%が忘れている。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:28:16 GMT)
Mechanism of wavefunction collapse in measurements of separated quantum subsystems [0.0] 絡み合った状態にロックする位相が、孤立したサブシステムの測定において特別な役割を果たすことを示す。
より広範に、これらの結果は量子重ね合わせの測定理論を固める。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:59:36 GMT)
Machine Learning-Based Bitcoin Trading Under Transaction Costs: Evidence From Walk-Forward Forecasting [0.0] 本稿では、時間毎のBTC-USDTリターンの機械学習予測を、取引コストの後に経済的に有意義なトレーディングパフォーマンスに変換することができるかどうかを検討する。
XGBoost,LSTM,iTransformerを27倍のウォークフォワードプロトコルで評価した。
いずれのモデルも、選択された構成において肯定的な総取引性能を生み出すが、10ベーシックポイントの取引コストが課されると、単純サインベースの戦略は失敗する。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:30:49 GMT)
Locked Out at 8,000 Miles: Why UK-China Partnership Students Are Suffering [0.0] 本稿は、国内外の学生が既に大きな障壁に直面していることを論じる。
困難は国際パートナーシップの文脈において、ほぼ破壊的な点まで拡大されます。
8時間の時間差から英国の大学の仮想学習環境にアクセスする中国の学生にとって、同じセキュリティアーキテクチャは機能的に無効になる。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:59:59 GMT)
Less Back-and-Forth: A Comparative Study of Structured Prompting [0.0] 大規模言語モデル(LLM)は、オープンエンドタスクに広く使われているが、不特定なプロンプトは、低品質な回答と追加の相互作用をもたらす可能性がある。
我々は、生のプロンプト、チェックリスト改善プロンプト、明確化プロンプトの3つのプロンプト条件を比較した。
チェックリスト改善プロンプトは8点中7.50点、生プロンプトは5.67点、クエストは6.67点だった。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:40:14 GMT)
Latent Process Generator Matching [0.0] 本稿では、観測された生成状態を決定論的画像として扱う一般的なフレームワークである潜在プロセスジェネレータマッチングを紹介する。
この設定では、投影されたプロセスと同じ1時間間隔の分布を持つ画像空間上のプロセスの生成を学習することができる。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:49:05 GMT)
Latent Geometry as a Structural Monitor: Eigenspace Alignment for Anomaly Detection in Anonymity Networks [0.0] 本研究では,大規模な行動群を,大きな遷移の前後で変形を測定することのできる幾何学的エネルギー景観として扱うことを提案する。
67日連続の観測窓にTor匿名ネットワークを適用すると、デュアルオブザーバパイプラインは安定な9次元の負荷を持つ部分空間不変性を識別する。
2026年2月20日の法医学的な分析により、インフラストラクチャイベントは公式にリレー分割仮説を偽装し、トポロジー変更なしでの接続劣化を検出可能なネットワーク障害モードとして特定した。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:40:24 GMT)
LLM-Based Financial Sentiment Analysis in Arabic: Evidence from Saudi Markets [0.0] サウジアラビア市場に適した大規模金融感情分析のためのアラビア語NLPフレームワークを提案する。
このフレームワークは、データ収集、クリーニング、重複解消、エンティティリンク、感情アノテーションを含む多段階パイプラインを通じて、大規模なアラビア財務コーパスを構築する。
84Kサンプルのデータセットは、企業レベルの感情集約と、株式市場の行動に対する感情ダイナミクスの分析をサポートする。
論文参考訳(メタデータ) (Tue, 19 May 2026 11:50:33 GMT)
Introduction to Higher Order Classical Dynamics: Pais-Uhlenbeck Model and Coupled Oscillators [0.0] ハミルトン=オストログラードスキの形式主義は教科書や教育文学ではほとんど議論されない。
パース・ウレンベック振動子に対してハミルトン・オストログラードスキー形式が適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:48:23 GMT)
Interpreting Bohm quantum potentials in Computing quantum waves exactly from classical action [0.0] 最近のarXivの投稿では、[7]におけるLemma 3.1の証明はボーム量子ポテンシャルを欠いていると主張している。
この技術的注記は、ボーム量子ポテンシャルを明示的に導入するLemma 3.1の証明を拡張している。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:55:40 GMT)
Interpretable Computer Vision for Defect Detection in X-ray Tomography of Aerospace SiC/SiC Composites [0.0] p-ResNet-50は、ケースベースの説明と高い検出精度を持つプロトタイプ層で拡張された畳み込みフレームワークである。
このフレームワークは4つの欠陥豊富なSiC/SiC実験片から抽出した約12,000のパッチのXCTパッチデータセット上で検証された。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:46:49 GMT)
Inferring Sensitive Attributes from Knowledge Graph Embeddings: Attack and Defense Strategies [0.0] 知識グラフに基づく推論におけるプライバシーリスクについて検討する。
本研究は,属性推論攻撃に着目し,攻撃者が不感な出力からセンシティブな属性を導出しようとする。
KGE出力にポストプロセッシング・サニタイズ技術を適用することにより、これらのプライバシーリスクを軽減するフレームワークを提案し、評価する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:28:46 GMT)
Induced transitions in non-Hermitian spin-boson models with time-dependent boundaries [0.0] 複素カップリングを持つシュテ・ダビデンシアスピンボソンハミルトニアンの時間依存的非エルミート拡大について検討する。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:46:28 GMT)
Implementation of Finite state logic machines via the dynamics of atomic systems [0.0] 本稿では,2レベル原子のダイナミクスを用いて古典論理演算を行う手法を提案する。
出力が入力のみに依存する従来の組合せ論理回路とは異なり、有限状態機械のような計算モデルを提案する。
提案したメカニズムは、観測可能な量でエンコードされた2レベル量子状態のダイナミクスを利用する。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:40:38 GMT)
IMLJD: A Computational Dataset for Indian Matrimonial Litigation Analysis [0.0] このデータセットは2000年から2024年までのインド最高裁判所(1,474件)、2018年から2024年までのカルナタカ高等裁判所(2,139件)をカバーしている。
最高裁判所レベルでは57.6%、カルナタカ高等裁判所では39.7%である。
論文参考訳(メタデータ) (Tue, 19 May 2026 04:34:06 GMT)
HaorFloodAlert: Deseasonalized ML Ensemble for 72-Hour Flood Prediction in Bangladesh Haor Wetlands [0.0] バングラデシュの湿地で13日、洪水が発生し、ほとんど警告は出なかった。
河川の洪水のために建設された現在の施設は、バックウォーターのダイナミクスを完全に見逃している。
私たちはHaorFloodAlertを開発しました。これは、Sunamganj Haorの72時間の洪水確率を予測できる、デシーズン化された機械学習アンサンブルです。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:51:46 GMT)
Halving the cost of QROM [0.0] テーブルルックアップ(英: Table lookup、しばしば量子読み取り専用メモリ(QROM)と呼ばれる)は、量子アルゴリズムにおいて最も広く用いられるサブルーチンの1つである。
これは、重ね合わせで$N$ビットストリングの長さ$b$のコヒーレントロードを含む。
$b, $ dirty qubits にアクセスすると、QROM の Toffoli コストを $2fracN + 4b(- 1)$ に下げることができることが知られている。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:00:04 GMT)
Graph-Augmented Retrieval for Cross-Entity Financial Sentiment Analysis: A Comparative Study [0.0] 本稿では,クロスエンタリティ財務感情分析のための標準ベクトルのみのベースラインに対して,新しい2ホップグラフ-RAGアーキテクチャを提案する。
本システムでは,主要技術株を対象とするニュース記事255件から,59件のエクイティエンティティの感情重み付き知識グラフを構築し,INFLUENCESエッジ上での強度フィルタリンググラフによる高密度検索を強化した。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:55:15 GMT)
Goal-Oriented Lower-Tail Calibration of Gaussian Processes for Bayesian Optimization [0.0] 本稿では,ノイズレス環境下でのGP予測分布の目標方向キャリブレーションについて,低閾値の$t$以下で検討する。
空間キャリブレーションという2つの概念に基づいて,$t$以下の予測信頼性の枠組みを導入する。
このフレームワーク上に構築されたtcGPは,GP予測分布を$t$以下に校正するポストホック法である。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:32:25 GMT)
Ghost in the Context: Measuring Policy-Carriage Failures in Decision-Time Assembly [0.0] LLMエージェントは生のインタラクション履歴に作用せず、トランケーション、要約、並べ替え、書き換えによって組み立てられた境界決定状態に作用する。
本研究では, 局所的なLlama 3.1 8B, Qwen 2.5 7B, Mistral 7B上の障害モードについて, 正確な制約の尊重と, 組立状態の可視性の直接監査を用いて検討した。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:38:59 GMT)
Finite-temperature crossover from coherent magnons to energy superdiffusion in the PXP model [0.0] PXP鎖は、最近、カルダル・パリ・チャンのようなスケーリングで超拡散エネルギー輸送を示すことが示されている。
このモデルにおける有限温度エネルギー輸送は超拡散の出現の窓となることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:59:52 GMT)
Fifty Shades of Darknet [0.0] Invisible Internet Project (I2P) は、ピアツーピアの匿名オーバーレイネットワークである。
ここでノードは運用サービスをホストし、I2Pのルーティングリソースを描画しますが、ネットワークの分散データベース(NetDB)にルータ情報レコードをパブリッシュしません。
このプロパティは、I2Pベースのマルウェア(例えば、国家資産や企業ネットワークに対する永続的なコマンド・アンド・コントロール操作のためのI2PRAT(RATatouille))によって悪用される。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:47:03 GMT)
Fault-Tolerant, Rigidity-Preserving Control of Inflatable Truss Robots [0.0] イソペリメトリック・ロボティクス・トラス(英語版)は、強度と重量比が高いため、異なるタスクや環境に適応することができる。
運用環境でのモータ障害は、適切に対処しなければ、運用能力を著しく制限することができる。
本稿では,モータ故障にもかかわらず機能を維持したインフレータブルロボットトラスに対する耐故障性制御フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:39:55 GMT)
Fast and Featureless Node Representation Learning with Partial Pairwise Supervision [0.0] Contrastive FUSEはグラフにおけるスケーラブルなノード表現学習のためのフレームワークであり、部分的にペアワイズノードラベルがあり、利用可能なノード機能はない。
我々は、高価なモジュラリティ勾配を軽量な近似に置き換え、計算コストを大幅に削減しつつ、モジュラリティの構造探索挙動を保存する。
ベンチマーク引用ネットワーク、大規模共購入グラフ、およびOGBデータセットの実験により、Contrastive FUSEは、ノード機能に頼ることなく、競合的または優れたコントラスト的分類性能を達成することが示された。
論文参考訳(メタデータ) (Tue, 19 May 2026 14:40:51 GMT)
Fast Tensorization of Neural Networks via Slice-wise Feature Distillation [0.0] 本稿ではスライスワイズ特性蒸留に基づくニューラルネットワーク圧縮のためのスケーラブルなテンソル化フレームワークを提案する。
従来の大域的テンソル化よりも顕著に向上し,中程度の圧縮速度でほぼロスレス圧縮を実現した。
GPT-2 XLの結果はさらに,本手法のスケーラビリティと大規模モデルへの適用性を実証した。
論文参考訳(メタデータ) (Tue, 19 May 2026 13:37:53 GMT)
Exact dynamics of a single-photon emitter in front of a mirror [0.0] ナノフォトニック構造の単一光子エミッタは、量子センサーや量子コンピュータなどの量子技術応用を持つ多くのフォトニックデバイスにとって重要な構成要素である。
本稿では,局所光子アプローチによるシュロディンガー方程式の解法により,一次元導波路における単一光子エミッタの正確なダイナミクスを部分的に透明なミラーインタフェースで決定する。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:56:05 GMT)
EviTrack: Selection over Sampling for Delayed Disambiguation [0.0] テスト時間推論フレームワークであるEviTrackを導入する。
一致した推論予算では、EviTrackはサンプリングベースベースラインを大幅に上回る。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:01:42 GMT)
Euclidean Embedding of Data Using Local Distances [0.0] 本研究では,局所距離グラフのみを考慮し,グローバルに一貫したユークリッド埋め込みを復元する問題について検討する。
本稿では,これらの距離を最適に表現する手法を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:31:53 GMT)
EpiDiffVO: Geometry-Aware Epipolar Diffusion for Robust Visual Odometry [0.0] 画像対から相対的なポーズを推定するには、幾何学的に一貫した対応の最小限のサブセットしか必要としない。
幾何学的整合性に最適化されたコンパクトな対応セットを予測できるスパースエピポーラマッチングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 08:53:26 GMT)
Entangling gate performance and fidelity limits with neutral atom Förster resonances [0.0] 近くのFrster共鳴は、ランドスケープと忠実さを制御するために共鳴的に結合された相互作用チャネルを含んでいる。
この状態に対する2固有状態モデルを構築し、共振における両状態とのカップリングを許容する場合、ゲートの忠実度は$mathcalFleq 1-(/2)/(V_R)$で制限されることを示す。
我々は、この境界を大きなラビ周波数制限で飽和させ、既存の忠実度制限を約40%改善するゲートプロトコルを構築した。
論文参考訳(メタデータ) (Tue, 19 May 2026 01:37:14 GMT)
Enhancing ultracold atomic batteries using tunable interactions [0.0] ハーモニック・オシレータ充電器により駆動される1次元多体ボソニック・量子電池の充電性能について検討した。
チャージャー周波数を調整することにより、完全エネルギー移動と最大抽出可能な作業が達成される共振状態に到達できることを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 06:50:44 GMT)
Do Vision--Language Models Understand 3D Scenes or Just Catalogue Objects? [0.0] 6フロンティアとオープンウェイトVLMは, LLM-as-judgeを伴わない18,204応答でアノテーターによって測定され, 急激な解離を示した。
目に見えるレイアウトを53~97%精度で再配置し、衝突の制約にほとんど違反しないモデルは、閉塞時に6~45%、反射時に7%以下に低下する。
Qwen3-VL-8B-Thinkingのホワイトボックス解析は、視覚的統合の失敗をローカライズする。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:01:19 GMT)
Do Better Volatility Forecasts Lead to Better Portfolios? Evidence from Graph Neural Networks [0.0] 本稿では,グラフニューラルネットワークが実現されたボラティリティ予測を改善するか,ポートフォリオ性能を改善するかを検討する。
2015年から2025年までの465株のS&P500株の毎週のボラティリティを利用して、マクロレシエーションの特徴のないローリング相関、セクター、およびグランガーカウサルグラフに基づいて構築されたグラフSAGEモデルと比較した。
実験的な発見は、最も低い予測MSEのモデル、最も高い断面積ランクの精度のモデル、そして最高ポートフォリオシャープ比のモデルが3つの異なるモデルであるということである。
論文参考訳(メタデータ) (Tue, 19 May 2026 02:52:00 GMT)
Developing a photon-number-resolving detection chain for quantum communication protocols involving mesoscopic states of light [0.0] シリコン光増倍剤(SiPM)を用いた光子数分解検出鎖の特性について述べる。
我々はFPGAベースの信号処理パイプラインを組み込み、リアルタイムベースラインサブトラクション、デジタルデコンボリューション、チャージ統合を実現した。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:23:14 GMT)
Detecting Data Exfiltration through I2P Anonymity Networks: A Two-Phase Machine Learning Approach [0.0] Invisible Internet Project (I2P)は、ニンニクルーティングと分散ネットワークアーキテクチャを通じて強力な匿名性を提供する。
現在のネットワークセキュリティ対策は、しばしばI2Pトラフィックの検出に失敗する。
本稿では,SafeSurf Darknet 2025データセットを用いた2段階のI2Pトラフィック解析モデルを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 22:46:22 GMT)
Decentralized Direct Volume Rendering: A Browser-Native GPU Architecture for MRI Digital Twins in Resource-Constrained Settings [0.0] デジタルツイン(DT)技術は、手術計画とパーソナライズドメディカルな医療にとって大きな可能性を秘めている。
現在、対話的で患者固有の解剖学的双生児を生成するには、計算的に重いサーバーサイドレンダリング(SSR)や高価なローカルワークステーションに頼っている。
本稿では、高忠実な解剖学的デジタルツインへのアクセスを民主化する分散クライアントサイドWebGPUアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 12:09:18 GMT)
CryoNet: A Deep Learning Framework for Multi-Modal Debris-Covered Glacier Mapping. A Case Study of the Poiqu Basin, Central Himalaya [0.0] 氷河は淡水保護区や気候変動の指標として重要な役割を担っているが、特に破片に覆われた氷河では、その自動的な乾燥は依然として困難である。
CryoNetは、Sentinel-2光画像、DEM由来の地形変数、スペクトル指標、主成分分析(PCA)、InSARコヒーレンスとフェーズ、タッセルキャップの特徴、GLCMテクスチャを組み合わせた、リッチなマルチモーダルデータセットを活用するディープラーニングフレームワークである。
CryoNetは、ネストしたスキップ接続と空間チャネルSqueeze-and-Excitation(scSE)アテンションを備えたエンコーダデコーダCNNで、ResNet上に構築されている。
論文参考訳(メタデータ) (Tue, 19 May 2026 15:31:46 GMT)
Cross-Paradigm Knowledge Distillation: A Comprehensive Study of Bidirectional Transfer Between Random Forests and Deep Neural Networks for Big Data Applications [0.0] 本稿では,ランダムフォレスト (RF) とディープニューラルネットワーク (DNN) の双方向知識蒸留に関する最初の総合的研究について述べる。
本研究では, 進行多段階蒸留, 多様な木モデルからの多段階アンサンブル蒸留, 不確実性を考慮したクロスパラダイム転送機構などの新しい手法を提案する。
NN-COMPACTは98.13%,NN-WIDEは92.6%,レグレッションタスクは92.6%であった。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:19:30 GMT)
Conflict-Aware Active Perception and Control in 3D Gaussian Splatting Fields via Control Barrier Functions [0.0] ロボットシステムのための協調型能動的認識・制御フレームワークを開発した。
安全は、平均値-at-Risk AV@R衝突リスクメトリックから導かれる制御バリア関数(CBF)を用いて実施される。
認識を改善するために,カメラの向きを局所的な情報付加方向と整列する知覚障壁関数を提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 23:51:23 GMT)
Component-Aware Structure-Preserving Style Transfer for Satellite Sim2Real 6D Pose Estimation [0.0] 合成レンダリングは正確な幾何学的アノテーションを提供することができるが、レンダリングと実際の観測の間の外観ギャップは実際の領域への直接移動を制限する。
本稿では,衛星合成-実データ構築のためのコンポーネント対応構造保存型転送フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:01:17 GMT)
Beyond Isotropy in JEPAs: Hamiltonian Geometry and Symplectic Prediction [0.0] JEPAs はしばしば一視点埋め込みを等方ガウスへ正規化し、ユークリッド対称性を表現に暗黙的に焼く。
これは単なる良心的デフォルトではないことを示す。下流幾何学が未知の場合、幾何非依存の固定限界目標が標準的でない。
この原則をtextbfHamJEPA でインスタンス化し、各ビューを相空間状態 $(q,p)$ としてエンコードし、ビューからビューへの遷移を予測する。
論文参考訳(メタデータ) (Tue, 19 May 2026 16:57:47 GMT)
BOHM: Zero-Cost Hierarchical Attribution for Compound AI Systems [0.0] 複合AIシステムは、特殊コンポーネントの階層を通してタスクをルーティングする。
本稿では,すでに維持している経路重みから直接階層的帰属木を抽出するBOHMを紹介する。
BOHMは効率、単調性、対称性、弱抑制を満足するが、シャプリーの付加性は満たさない。
論文参考訳(メタデータ) (Tue, 19 May 2026 19:38:14 GMT)
BCI-sift: An automated feature selection toolbox for Brain Computer Interface applications [0.0] BCI-sift (BCI Systematic and Interpretable Feature Tuning) は、多様な最適化アルゴリズムをBCIデータセットに適用するためのPythonベースのツールボックスである。
高密度心電図(HD ECoG)データを用いた8名の健常者を対象にツールボックスの検証を行った。
BCI-siftは、電極、時間、周波数次元にわたる情報的神経特徴を識別する。
論文参考訳(メタデータ) (Tue, 19 May 2026 10:32:36 GMT)
An Objective Performance Evaluation of the LSTM Networks in Time Series Classification [0.0] 長期記憶(LSTM)ネットワークは時系列解析において一般的な選択肢となっている。
本稿では,LSTM分類器とモデルベース予測分類器(EM)分類器を比較した性能評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 19 May 2026 03:47:01 GMT)
An End-to-End PyTorch Interface for Differentiable PDE Solvers: A RANS Model-Correction Study [0.0] 本研究は,部分微分方程式に制約された逆問題を解決するためのエンドツーエンド戦略を提案する。
PDEを暗黙の層として再構成することで、完全に差別化可能なPythonワークフロー内でphiを最適化する方法を示す。
データセットは、VKI LS-59タービンブレード形状から始まり、Spaalart-Allmaras乱流モデルを用いた微分可能なBROADCASTソルバを用いて生成される。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:38:50 GMT)
Agreement and Compatibility in Wigner's Friend Paradox [0.0] ウィグナーとウィグナーの友人の記述には矛盾はない。
いずれかのエージェントがオープンマインドを保っていなければ、ウィグナーまたは彼の友人の説明が互いに一致するように駆動されるかを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:19:51 GMT)
Agentic Agile-V: From Vibe Coding to Verified Engineering in Software and Hardware Development [0.0] エージェントAIコーディングシステムは、リポジトリを検査し、実装手順を計画し、ファイルを編集し、テストを実行し、プルリクエストを送信できる。
現在の証拠は、自律的なコード生成がエンジニアリングの結果を自動的に改善するという単純な主張を支持していない。
この論文は、中心的な問題は、もはや迅速なエンジニアリングではなく、エンジニアリングプロセスの制御である、と論じている。
論文参考訳(メタデータ) (Tue, 19 May 2026 20:10:13 GMT)
Adynamical systems view of training generativemodels and the memorization phenomenon [0.0] 生成モデルにおける現象のシステム理論的な説明を与える。
具体的には、Austin [2016] の結果を用いて、勾配降下(SGD)の損失関数のスタイリングモデルを動機付けます。
これは当然、機械学習で一般的に使用される一定のステップサイズのSGDにおいて、2つの異なる時間スケールにつながる。
論文参考訳(メタデータ) (Tue, 19 May 2026 07:34:58 GMT)
A Semantic-Web Oriented Competency Model for Engineering Programs [0.0] 本稿では,ボディーズ・オブ・ナレッジと能力フレームワークを橋渡しして計算カリキュラムを設計する能力マッピング手法を提案する。
この手法を,23の能力を有する5年間の工学学位プログラムであるISANUMを用いて実証した。
私たちのコントリビューションは、知識の身体を評価可能な能力フレームワークに翻訳する、複製可能な方法論をコンピューティング教育者に提供します。
論文参考訳(メタデータ) (Tue, 19 May 2026 18:58:16 GMT)
A Multi-Layer Testing Framework for Automated Data Quality Assurance in Cloud-Native ELT Pipelines [0.0] 本稿では,抽出-ロード-変換パイプラインのための統合多層テストフレームワークを提案する。
オーケストレーションレベルの検証、宣言型dbtテスト、大規模言語モデル(LLM)生成セマンティックテスト、ストア間の一貫性チェックを統合している。
論文参考訳(メタデータ) (Tue, 19 May 2026 21:12:36 GMT)
A Methodology for Selecting and Composing Runtime Architecture Patterns for Production LLM Agents [0.0] 本稿では, 境界決定論的境界(SDB): 提案者, 検証者, コミットステップ, 拒否信号の4部契約について述べる。
我々は、SDBは本番エージェントランタイムの負荷分散プリミティブであると主張している。
本稿では,会話エージェント,自律エージェント,長期エージェント間で異なるSDBを構成する6つの実行パターンのカタログを示す。
論文参考訳(メタデータ) (Tue, 19 May 2026 17:54:21 GMT)