Bridging Data Trials and Task Barriers: A Unified Framework for Sketch Biometric Identification [99.7] スケッチバイオメトリクスの識別は、少ない実データ、高いアノテーションコスト、プライバシーリスク、クロスタスクモデルの一般化能力の不足など、課題に直面している。
本稿では,効率的な合成スケッチ生成とタスク列連続学習を統合した統合フレームワークを提案する。
スケッチバイオメトリック同定の研究を支援するため,我々はSketch-BioIDという大規模ベンチマークを構築した。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:20:57 GMT)
Orthrus: Memory-Efficient Parallel Token Generation via Dual-View Diffusion [91.4] Orthrusは、自己回帰型大規模言語モデル(LLM)の正確な生成忠実度と、拡散モデルの高速並列トークン生成を一体化するフレームワークである。
最大7.8倍のスピードアップを実現し、メモリキャッシュのオーバーヘッドはO(1)のみであり、パラメータの追加は最小限である。
論文参考訳(メタデータ) (Sun, 17 May 2026 06:15:57 GMT)
LiteFrame: Efficient Vision Encoders Unlock Frame Scaling in Video LLMs [90.8] LiteFrameは、ビデオ大言語モデルのための強力な、しかし非常に効率的なバックボーンである。
LiteFrameはエンドツーエンドのレイテンシを35%削減し、8$times$より多くのフレームを処理する。
計算予算の固定化により,より長めの映像理解を解き明かす可能性を示した。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:02:52 GMT)
Soohak: A Mathematician-Curated Benchmark for Evaluating Research-level Math Capabilities of LLMs [86.5] Soohakは64人の数学者によって新たに書かれた439プロブレムのベンチマークである。
データセットは2026年後半に公開され、中間で要求に応じてモデル評価が利用可能になる。
論文参考訳(メタデータ) (Sun, 17 May 2026 03:15:32 GMT)
HierEdit: Region-Aware Hierarchical Diffusion for Efficient High-Resolution Editing [83.1] プロやクリエイティブなアプリケーションには高解像度の画像編集が不可欠である。
現在のアプローチでは、イメージキャンバス全体を冗長に処理するか、大規模な高解像度データセットに依存している。
高速かつスケーラブルな高解像度画像編集のための領域対応階層拡散フレームワークであるHierEditを紹介する。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:14:15 GMT)
Self-supervised Hierarchical Visual Reasoning with World Model [82.6] ResDreamerは階層的な世界モデルであり、各上位層が下層の残余を再構築するために訓練される。
ResDreamerは,最先端のサンプル効率とパラメータ効率を実現する。
このスケーラブルな視覚的展望推論アーキテクチャは、オープンエンドの動的環境において、より有能なオンラインRLエージェントの道を開く。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:42:42 GMT)
VerifyMAS: Hypothesis Verification for Failure Attribution in LLM Multi-Agent Systems [79.5] 大規模言語モデル駆動型マルチエージェントシステムは複雑なタスクで優れている。
しかし、信頼性の低いエージェントは、システムレベルの信頼性にとって重要なボトルネックである。
本稿では,エージェント故障の帰属に関する仮説検証フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:09:35 GMT)
A Distributional View for Visual Mechanistic Interpretability: KL-Minimal Soft-Constraint Principle [77.7] 本稿では,視覚力学的解釈可能性に関する理論的分布ビューを提案する。
このビューは、自然な画像分布に対する特徴アクティベーションの影響をモデル化する。
理論的に解釈可能性と忠実性のバランスをとる視覚的MIに対して,KL最小ソフト制約原理を用いたモデルを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 15:31:42 GMT)
TAME: Test-Time Adversarial Prompt Tuning via Mixture-of-Experts for Vision-Language Models [76.9] 大規模事前学習型ビジョンランゲージモデル(VLM)は、強いゼロショット一般化を示すが、知覚不能な逆方向の摂動に対して非常に脆弱である。
ダウンストリームタスク固有のリトレーニングを必要とせずに堅牢性を高めるため,新しいテストタイムディフェンスであるTAMEを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:07:08 GMT)
Memory-Augmented Query Intent Understanding for Efficient Chat-based Image Retrieval [74.9] チャットに基づく画像検索により,多ラウンド対話によるユーザ意図の反復的明確化と洗練が可能となる。
このタスクの主な課題は、対話ラウンド全体でユーザーのクエリインテントを動的に理解し、更新することである。
本稿では,チャットベースの画像検索タスクのための,メモリベースの新規かつ効率的なユーザ意図更新フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:17:41 GMT)
Step-wise Rubric Rewards for LLM Reasoning [72.2] RLVR(Reinforcement Learning with Verifiable Rewards)は、大規模言語モデルの推論を改善するために広く使われている。
正しい回答の18.2%は間違っているが、肯定的な報酬がある。
6つの数学的推論ベンチマークで、SRaRはRaRの平均精度を3.57ポイント改善した。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:08:14 GMT)
Tactile-based Multimodal Fusion in Embodied Intelligence: A Survey of Vision, Language, and Contact-Driven Paradigms [70.5] 本稿では,フィールドを2つの主次元(マルチモーダルデータセットとマルチモーダルメソッド)に分類する階層型分類法を提案する。
データ側では、Tactile-Visionデータセット、Tactile-Languageデータセット、Tactile-Vision-Languageデータセット、Tactile-Vision-Otherデータセットを含むリソースを分類する。
提案手法は,(1)マルチモーダル認識・認識,(2)クロスモーダル生成,(2)触覚・視覚・テキスト間の双方向翻訳,(3)マルチモーダルインタラクション,フィードバック制御と言語誘導操作の3つの柱に先行して構成する。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:09:30 GMT)
MARQUIS: A Three-Stage Pipeline for Video Retrieval-Augmented Generation [64.3] ビデオからの検索強化生成は、大規模なコーパスから関連するオーディオ視覚的証拠を検索し、一貫性のある属性付きテキストに合成するシステムを必要とする。
MARQUIS:クエリ拡張、融合、再ランク付けを通じて、これらの制限に対処する3段階のパイプライン。
記事生成において、ITER-QA-BASEはCAGベースライン平均スコアを3.09から3.83に改善し、MARQUIS-RLMは3.30の人間スコアと非QAシステムの中で最も強い引用リコールを達成する。
論文参考訳(メタデータ) (Sun, 17 May 2026 20:19:04 GMT)
Soap2Soap: Long Cinematic Video Remaking via Multi-Agent Collaboration [62.0] Soap2SoapはDualBridgeメカニズムを通じて長期の視覚的一貫性を強制するマルチエージェントフレームワークである。
クローズドループ検証エージェントは、識別、安定性、アライメントを監査し、選択的再生を誘導する。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:38:21 GMT)
Attention Hijacking: Response Manipulation Across Queries in Vision-Language Models [57.9] 本研究の目的は,画像の持続的支配パターンに対して内的注意を喚起する新たな敵攻撃であるtextbfAttention Hijacking を提案することである。
提案手法は,クエリの特定の単語に対する操作された出力の依存性を低減する。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:02:27 GMT)
Towards trustworthy agentic AI: a comprehensive survey of safety, robustness, privacy, and system security [57.4] エージェントAIシステムは、複雑なタスクを自律的に実行するが、その多段階の軌道には、信頼性に挑戦する新たな障害モードが導入されている。
この調査では、リスクの高いデプロイメントに不可欠な2つのコアディメンションを通じて、信頼できるエージェントAIを精査する。
各次元について、重要な概念を明確にし、エージェントワークフローに沿ってリスクが発生する場所を特定し、ステージ目標の緩和戦略を要約する。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:26:37 GMT)
DISA: Offline Importance Sampling for Distribution-Matching LLM-RL [56.9] 本稿では、このキャリブレーション問題をRLループの外に移動させるdisAを紹介する。
DISAは提案トラジェクトリをオフラインに描画し、重要サンプリングによってパーティション関数を推定し、結果として発生するパーティション関数の推定を凍結する。
6つの数学と3つのコードベンチマークにまたがる2つのオープンウェイトなバックボーンでは、DisdisAはオンラインに結合した分散マッチングベースラインフローにマッチするか、超えている。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:14:44 GMT)
ChemVA: Advancing Large Language Models on Chemical Reaction Diagrams Understanding [56.9] 大規模言語モデル (LLM) は、科学的なテキスト処理に革命をもたらしたが、化学反応図を解釈する際には、大きな能力ギャップが現れる。
本稿では,視覚アンカー機構を用いたケミカルビジュアルアクティベーション(ChemVA)フレームワークを提案する。
我々は,高密度な視覚・セマンティックな文脈を特徴とする新たに構築されたデータセットであるOCRD-Benchに対するアプローチを評価する。
論文参考訳(メタデータ) (Sun, 17 May 2026 01:12:50 GMT)
VISTA: Triplet-Supervised Video Style Transfer with Diffusion Transformers [55.1] VISTA-1000は1000のスタイルと、スタイル参照、クリーンビデオ、スタイリングビデオのモーションアラインなトリプレットを備えたデータセットである。
本稿では,高機能なスタイル抽出のための軽量なスタイルアダプタを用いた拡散変換器を用いたインコンテクスト型動画転送フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:03:53 GMT)
OpenDeepThink: Parallel Reasoning via Bradley-Terry Aggregation [53.9] OpenDeepThinkは、集団ベースのテスト時間計算フレームワークで、ペアワイズBradley-Terryの比較によって選択する。
OpenDeepThinkはGemini 3.1 ProのCodeforces Eloを8回のLCMコールラウンドで+405ポイント引き上げる。
CF-73は、国際グランドマスターアノテーションによる73の専門家評価コードフォース問題と、公式判決に対する99%の地域評価合意のキュレートされたセットである。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:31:24 GMT)
Bug or Feature$^2$: Weight Drift, Activation Sparsity, and Spikes [53.7] 標準損失と正に偏りのある活性化関数の相互作用によって引き起こされる負の重みのドリフトを解析する。
79の構成にまたがるスパシティ・精度のトレードオフを特徴付けるとともに、$sim$70%のアクティベーション・スパシティよりも高い精度の崖を識別する。
論文参考訳(メタデータ) (Sun, 17 May 2026 21:29:20 GMT)
Nano World Models: A Minimalist Implementation of Future Video Prediction [52.4] Nano World Modelsは、拡散強制を中心とした将来のビデオ予測のためのミニマリストである。
コード、構成、評価スクリプト、事前訓練されたチェックポイントをリリースすることにより、Nano World Modelsは、オープンで再現性があり科学的な世界モデル研究のためのコンパクトで実験的な基盤を提供することを目指している。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:46:44 GMT)
FastOCR: Dynamic Visual Fixation via KV Cache Pruning for Efficient Document Parsing [51.9] 我々は2つの相補的なモジュールを持つトレーニングフリーフレームワークであるFastOCRを提案する。
FastOCRは未実行モデルの精度の98%を保持し、デコードステップあたりの視覚トークンの5%にしか到達しない。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:39:47 GMT)
GraphMAR: Geometry-Aware Graph Learning Framework for Spatially Adaptive CT Metal Artifact Reduction [51.7] シングラム領域法は、金属の痕跡のような明示的な幾何学的手がかりを利用して、金属が腐食した測定を識別することができる。
画像ドメインの手法はより柔軟で広く適用できるが、通常は同等の幾何学的ガイダンスを欠いている。
本稿では,空間適応型MARと明示的アーティファクト識別のための幾何学的学習フレームワークであるGraphMARを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:28:45 GMT)
Multi-task learning on partially labeled datasets via invariant/equivariant semi-supervised learning [51.6] 一般的なFixMatch法を、不変半教師付き学習とその同変拡張FixMatchに適用する。
コンピュータビジョンにおけるオブジェクト検出とセマンティックセグメンテーションタスクのコンテキストにおいて,Cityscapes と BDD100K データセットの性能を評価する。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:43:05 GMT)
Taming "Zombie'' Agents: A Markov State-Aware Framework for Resilient Multi-Agent Evolution [50.5] AgentReviveは、レジリエントなマルチエージェント進化のためのMarkovステートアウェアフレームワークである。
我々の手法はソフト状態遷移を通じてエージェントの協調を動的に管理する。
ステートアウェアなエージェントスケジューリングによってトークンの消費を大幅に削減する。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:38:18 GMT)
Learning Transferable Topology Priors for Multi-Agent LLM Collaboration Across Domains [50.0] TopoPriorは、ドメイン間のマルチエージェントLLMコラボレーションのために、転送可能なトポロジを学習するためのフレームワークである。
TopoPriorは、オンラインの推論時間トークンの使用を減らしながら、不均一なトポロジ進化のバックボーンを継続的に改善することを示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:55:18 GMT)
EgoIntrospect: An Egocentric Dataset and Benchmark for User-Centric Internal State Reasoning [47.9] EgoIntrospectは、セルフアノテーションを備えたユーザ駆動のシナリオでキャプチャされた最初のエゴセントリックなデータセットである。
収録時間は60人から180時間、平均録音時間は1人あたり3時間である。
我々は、感情経験、インタラクティブな意図、認知記憶など、ユーザ内部状態を中心とした一連のタスクを形式化する。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:05:29 GMT)
Model-Adaptive Tool Necessity Reveals the Knowing-Doing Gap in LLM Tool Use [47.3] 大規模言語モデル(LLM)は、外部ツールを呼び出す時と直接答える時を判断しなければならない自律的なエージェントとして、ますます機能します。
本稿では,各モデルの経験的性能に基づいて,ツール必要度をモデル適応的に定義する。
その結果,26.5~54.0%,30.8~41.8%のミスマッチが認められた。
論文参考訳(メタデータ) (Sun, 17 May 2026 15:23:37 GMT)
Controlling False Discovery in Arbitrarily Structured Hypothesis Spaces via Reproducing Kernels [47.2] 連続的なドメイン、グラフ、階層を1つのアルゴリズムで統一するフレームワークをカーネル選択のみで導入する。
FDR(False Discovery Rate)を制御するための2つの決定ルールを提供します。
本手法は,高次元実世界のデータセットから得られた空間的位置とタンパク質間相互作用グラフを用いた遺伝子発現タスクの2つの情報源で検証する。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:42:56 GMT)
Efficient Adjoint Matching for Fine-tuning Diffusion Models [47.1] 本研究では,テキストベースドリフトとテキスト端末コストでSOC問題を修正し,トレーニング効率を大幅に向上するEMAを提案する。
EAMはAMよりも最大4倍早く収束し、PickScore、ImageReward、HPSv2.1、CLIPScore、Aestheticsなど様々なメトリクスにマッチするか、超える。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:29:17 GMT)
Firefly: Illuminating Large-Scale Verified Tool-Call Data Generation from Real APIs [46.6] 本稿では,実世界のMPPサーバから検証済みのツールコールデータを生成するためのパイプラインFireFlyを紹介する。
実世界のツール空間のスケールを扱うために、ペアワイズツールグラフとサンプルサブDAGを構築します。
このパイプラインを適用すると、240のサーバと93のツールにまたがる5,144の検証タスクが生成される。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:38:17 GMT)
AutoLLMResearch: Training Research Agents for Automating LLM Experiment Configuration - Learning from Cheap, Optimizing Expensive [46.5] 不適切な構成選択は、かなりの計算資源を浪費し、モデルがその潜在能力を最大限に実現できないようにする。
従来の自動手法は、繰り返し試行錯誤が可能な安価な設定のために設計されている。
我々は,人間研究者が低忠実度実験から一般化可能な原理を学習する方法を模倣するエージェントフレームワークであるAutoLLMResearchを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 03:02:51 GMT)
StyleText: A Large-Scale Dataset and Benchmark for Stylized Scene Text Inpainting [45.9] StyleTextは、スタイル保存を備えたローカライズされたシーンテキストのインペイントのための大規模なデータセットとベンチマークである。
StyleTextには28,518のイメージマスクプロンプト三つ子があり、9,932のシーンファミリーにグループ化されている。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:02:20 GMT)
AutoRubric-T2I: Robust Rule-Based Reward Model for Text-to-Image Alignment [44.9] AutoRubric-T2Iは、VLM審査員を導くための明示的なルーブリックを自動的に合成し、選択する最初のルーブリック学習フレームワークである。
本稿では,AutoRubric-T2Iがアノテートされた嗜好データの0.01%以下を用いて,高品質で解釈可能な報奨信号を生成することを示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:00:44 GMT)
CasualSynth: Generating Structurally Sound Synthetic Data [44.8] 大言語モデル(LLM)は、現実的な合成データを生成するが、その出力がターゲットドメインを管理する因果的メカニズムを尊重することを保証しない。
本稿では,意味的実現から因果構造の生成を分離するフレームワークCausal Synthを紹介し,因果的妥当性と言語学的にリッチな合成データを生成する。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:21:01 GMT)
Reinforce Adjoint Matching: Scaling RL Post-Training of Diffusion and Flow-Matching Models [44.1] 拡散およびフローマッチングモデルは、事前学習が監督された回帰であるため、スケールする。
この構造がRLポストトレーニングにまで拡張されていることを示す。
KL-正規化報酬の下では、最適生成過程はより高い報酬を持つ試料に対してクリーンエンドポイント分布を傾ける。
Reinforce Adjoint Matching (RAM: Reinforce Adjoint Matching) を導出します。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:26:07 GMT)
Reasoning Portability: Guiding Continual Learning for MLLMs in the RLVR Era [44.1] VLM-CL(Vision-Language Models in Continual Learning)は,従来の知識を維持しつつ,新たなマルチモーダルタスクに継続的に適応することを目的としている。
Reasoning Portability(RP)に基づき,RLVRにおけるサンプルごとのKullback-Leibler正規化を形式化するReasoning-based Dynamic Balance Continual Learning(RDB-CL)を提案する。
実験の結果、RDB-CLはベースラインを一貫して上回り、ラスト精度はバニラRLVRベースラインよりも+12.0%向上した。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:26:09 GMT)
SAPO: Step-Aligned Policy Optimization for Reasoning-Based Generative Recommendation [44.0] 生成レコメンデーションは、次点予測を自己回帰的アイテム識別生成として扱う。
最近の研究は、このパラダイムを推論トレースで強化し、検証可能な報酬で強化学習を通じて最適化している。
大局的なレコメンデーションでは、生成されたSIDに対する正確なマッチングフィードバックは、最終項目が正しいかどうかのみを報告する。
論文参考訳(メタデータ) (Sun, 17 May 2026 20:53:08 GMT)
When Does Non-Uniform Replay Matter in Reinforcement Learning? [43.8] 非一様リプレイの有効性は, 再生量, 環境ステップ毎の再生遷移数, 期待精度, サンプル遷移の頻度, リプレイサンプリング分布のエントロピーの3つの要因に支配されている。
我々は,高エントロピーと無視できない計算オーバーヘッドを保ちながら,サンプリングを最近の経験に偏りを与える,単純なTrncated Geometric replayを採用する。
論文参考訳(メタデータ) (Sun, 17 May 2026 21:09:20 GMT)
Don't Let Bandit Feedback Pull Continual LLM-Recommender Updates Off Target [42.7] ジェネレーティブレコメンダ(LLM-Rec)は、デプロイ後の継続的な更新を必要とする。
デプロイメントログはポリシ形式のコンテキスト帯フィードバックのみを提供する。
連続LDM-Rec更新のためのアンコレッド帯域ポリシー最適化フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 11:10:44 GMT)
Reasoning Before Diagnosis: Physician-Inspired Structured Thinking for ECG Classification [42.3] 既存のアプローチのほとんどは、明確な臨床推論なしでECG信号から直接ラベルを予測する。
CardioThinkは、医師にインスパイアされたマルチモーダル言語モデル(MLLM)フレームワークであり、診断推論プロセスを明示的にモデル化する。
本稿では,この構造的推論形式と可変サイズ診断セットの精度を協調的に最適化するために,構造的集合ポリシー最適化(SSPO)を導入する。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:55:46 GMT)
SaaSBench: Exploring the Boundaries of Coding Agents in Long-Horizon Enterprise SaaS Engineering [42.2] 私たちは、エンタープライズエンジニアリングにおけるAIエージェントの境界を調査するために設計された最初のベンチマークであるBenchを紹介します。
8つのプログラミング言語、6つのデータベース、13のフレームワークを組み込んで、現実世界のソフトウェアを巧みにミラーリングする。
最先端エージェントの主なボトルネックは、独立したコードロジックを生成するのではなく、マルチコンポーネントシステムの構成と統合に成功していることが示される。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:15:56 GMT)
TSFLora: Token-Compressed Split Fine-Tuning for Wireless Edge Networks [42.0] TSFLoraは、エッジでの通信効率の高いLAM適応のためのトークン圧縮スプリット微調整フレームワークである。
TSFLoraは、注意誘導型トークン選択、トークンマージ、低ビットアクティベーション量子化、LoRAベースの適応を、分割されたフェデレーショントレーニングパイプライン内で組み合わせる。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:50:01 GMT)
LPG: Balancing Efficiency and Policy Reasoning in Latent Policy Guardrails [41.0] 我々は,動的政策に関する世俗的な潜在政策検討を学習するガードレールフレームワークである潜在政策ガードレール(LPG)を紹介した。
政策ガードレールのベンチマークでは、LPG-4Bの平均安全性は84.5%、F1は77.9%に達した。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:35:38 GMT)
GeoHand: Unlocking Prior Geometry Knowledge for Monocular 3D Hand Reconstruction [40.6] GeoHandは、凍った単分子形状推定器(MoGe2)から高品質な幾何学的先行情報を解放する新しいフレームワーク
GeoHandはFreiHAND、DexYCB、HO3Dv3で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:45:34 GMT)
Image-to-Video Diffusion: From Foundations to Open Frontiers [39.6] I2V(Diffusion-based textitimage-to-video)生成は、生成モデルにおいて中心的な方向性となっている。
本研究は、拡散I2V生成を独立した対象として扱う。
タスクの定式化、モデルアーキテクチャ、データセット、評価メトリクスをまずレビューし、アーキテクチャとトレーニングパラダイムに基づいた分類によって既存のメソッドを編成する。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:10:55 GMT)
Trust No Tool: Evaluating and Defending LLM Agents under Untrusted Tool Feedback [38.3] 我々は,悪質なツールが探索中に合理的に振る舞う,異なる障害モード,認知的中毒について検討する。
ファイナルアクションリスクスコアリングのためのバックボーンに依存しないフレームワークであるVISTA-Guardを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:51:34 GMT)
Olivia: Harmonizing Time Series Foundation Models with Power Spectral Density [38.1] 時系列基礎モデルは、ドメイン間の多様なデータセットに対する大規模な事前トレーニングに依存している。
Harmonizerは、スペクトル構造を再利用し、データセット間で暗黙的にPSDを調和させるモジュールである。
オリヴィア(Olivia)は、これらの調和機構に基づいて構築された新しい時系列基礎モデルである。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:19:22 GMT)
Mamba-VGGT: Persistent Long-Sequence Video Geometry Grounded Transformer via External Sliding Window Mamba Memory [37.1] 本稿では,長期的推論が可能な拡張VGGTフレームワークであるMamba-VGGTを提案する。
我々の研究は、広範囲な3次元環境における幾何学的世界モデリングのためのスケーラブルで線形複雑性のあるソリューションを提供する。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:34:13 GMT)
Lightweight and Fast Backdoor Model Detection [36.9] DFBScannerは、高速バックドアスキャンのための軽量な静的パラメータ検査フレームワークである。
DFBScannerは真陽性率97.17%、偽陽性率0.95%、平均検出時間は1モデル当たり1ミリ秒である。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:02:40 GMT)
Fast and Lightweight Backdoor Detection via Head Random Probing [36.3] HTellは、ヘッドランダムなプローブに基づく高速で軽量なデータフリーバックドア検出器である。
6,000以上のバックドアモデルと700以上のクリーンモデルを含む大規模ベンチマークでHTellを評価する。
HTellは99.03%の真正率、2.11%の偽正率と12.69ミリ秒/モデル検出遅延を達成している。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:05:55 GMT)
ML-based Fast Simulation of FARICH Responses [35.6] FARICH検出器の応答を高速にシミュレーションするための機械学習に基づく手法を提案する。
本稿では,軽量な畳み込みアーキテクチャを備えた条件付きジェネレーティブ・アドバイザリアル・ネットワーク(cGAN)を提案する。
cGANは現実的なサンプルを生成し、モンテカルロシミュレーションの大幅な高速化を提供する。
論文参考訳(メタデータ) (Sun, 17 May 2026 20:06:45 GMT)
SpecSem-Net: Integrating Spectral and Semantic Features for Robust AI-generated Video Detection [35.5] SpecSem-Netは、AI生成ビデオ検出のためのセマンティックガイド付きスペクトル復調機構を導入するためのフレームワークである。
SpecSem-Netは既存の手法よりも優れており、ベンチマークと公開データセットでそれぞれ87.25%と95.59%の精度を実現している。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:02:42 GMT)
From Runnable to Shippable: Multi-Agent Test-Driven Development for Generating Full-Stack Web Applications from Requirements [34.6] テスト駆動開発(TDDev)は、このクローズドループを3段階を通じて自動化するフレームワークである。
我々は、Webアプリケーション生成のためのテスト駆動開発戦略について、初めて制御された実証的研究を行う。
TDDevは、手動による開発者の介入をゼロに減らし、ワークロードを継続的プロンプトエンジニアリングから、自律的なフィードバック駆動の洗練へとシフトさせる。
論文参考訳(メタデータ) (Sun, 17 May 2026 03:48:41 GMT)
WinQ: Accelerating Quantization-Aware Training of Language Models Around Saddle Points [33.4] 量子化対応トレーニングは、言語モデルの量子化に広く採用されている。
主なボトルネックは、その緩やかな収束と初期のパフォーマンス高原である。
我々は、QATを高速化するWinQと呼ばれるアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:20:51 GMT)
The Neural Tangent Kernel for Classification [33.2] 広いニューラルネットワークでは、ニューラル・タンジェント・カーネル(NTK)はトレーニング中にほぼ一定である。
パラメータ空間の正規化は、クロスエントロピー損失のトレーニング中に一定のNTKを保証することを示す。
正規化がない場合には、ターゲットが非退化しているとき、すなわち全てのクラスが厳密に正の確率を持つとき、レジームが回復する。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:06:58 GMT)
OProver: A Unified Framework for Agentic Formal Theorem Proving [33.1] OProverは、Lean 4.0で証明された代理的な形式的な反復定理のための統一されたフレームワークである。
エージェント証明を実行し、新たに証明された証明をOProofsと検索メモリにインデックスし、修理軌跡をSFTデータとして使用し、未解決のハードケースをRLに使用する。
OProver-32BはMiniF2F (93.3%)、ProverBench (58.2%)、PutnamBench (11.3%)で最高のパス@32を獲得し、MathOlympiad (22.8%)、ProofNet (33.2%)で上位にランクインしている。
論文参考訳(メタデータ) (Sun, 17 May 2026 06:39:05 GMT)
Rethinking Point Clouds as Sequences: A Causal Next-Token Predictive Learning Framework [31.9] 我々は、ポイントクラウド事前学習を、完全に因果的かつデコーダのない潜伏型次世代予測問題として再構成するPointNTPを紹介した。
提案されたPointNTPは、複数のダウンストリームタスクで非常に競争力がある。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:54:55 GMT)
Learning Faster with Better Tokens: Parameter-Efficient Vocabulary Adaptation for Specialized Text Summarization [31.8] 本稿では,語彙適応と事前学習を組み合わせたパラメータ効率の高いドメイン適応手法を提案する。
我々の統合フレームワークは、未学習のトークンと未取得のトークンを選択的に置き換えながら、事前訓練されたトークンをドメイン固有のトークンで拡張します。
Llama-3.1-8BとQwen2.5-7Bの法的および医学的要約タスクに対するアプローチを評価した。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:45:01 GMT)
Beyond Accuracy: Robustness, Interpretability and Expressiveness of EEG Foundation Models [31.5] 脳波基礎モデル (EEG-FMs) は, 清潔な分布精度で評価されている。
本研究では、6つのEEG-FMを8つのデータセットにまたがるベースラインディープラーニングモデルに対してベンチマークすることで、これらのギャップに対処する。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:47:00 GMT)
ECG-WM: A Physiology-Informed ECG World Model for Clinical Intervention Simulation [30.7] 心電気生理学の行動条件予測シミュレーションのための心電図世界モデルを提案する。
我々のフレームワークは、生理的常微分方程式(ODE)の原理的な積分を潜在拡散力学に組み入れている。
本手法は,薬物応答の制御シナリオや臨床記録など,様々な状況において評価される。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:14:07 GMT)
On Gaussian approximation for entropy-regularized Q-learning with function approximation [30.1] エントロピー規則化非同期Q-ラーニングによって生成されるポリアク・アッパートイテレートの高次元中心定理における収束率を導出する。
我々は、次数$n-1/4$の確率で凸距離に束縛されたガウス近似を$n$の多変数因子まで確立し、ここでは、$n$はアルゴリズムが使用するサンプルの数である。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:23:25 GMT)
RoboFlow4D: A Lightweight Flow World Model Toward Real-Time Flow-Guided Robotic Manipulation [29.9] 3D環境での計画と行動は、現実世界におけるロボット操作の基本的な能力である。
物理的3次元空間における時間的動きを推定することにより知覚と計画を統合する軽量なフローワールドモデルであるRoboFlow4Dを紹介する。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:11:22 GMT)
SafeLens: Deliberate and Efficient Video Guardrails with Fast-and-Slow Screening [29.6] 本稿では,高速かつ高精度なコンテンツモデレーションのための高速かつスローな推論アーキテクチャであるSafeLensを提案する。
SafeWatchデータセットにインフルエンス誘導フィルタリングを適用して高品質なデータセットを構築し、元のデータの2.4%しか保持しない。
SafeLensは、現実世界とAIが生成したビデオベンチマーク全体で、最先端のパフォーマンスを達成し、強力なオープンソースのビデオガードレールを上回っている。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:10:36 GMT)
Verifier-Guided Code Translation via Meta-Step Decoding [28.7] Decoding Time Verification (DTV) は、構造境界を検証者誘導型デコードのためのメタステップとして扱うフレームワークである。
C-to-RustおよびJavaScript-to-TypeScript翻訳におけるDTVの評価を行った。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:47:07 GMT)
DP-SelFT: Differentially Private Selective Fine-Tuning for Large Language Models [28.6] 大規模言語モデル(LLM)の個人選択微調整のためのフレームワークであるDP-SelFTを提案する。
DP-SelFTは、パラメータ選択におけるDP固有の3つの課題に対処している。
実験の結果、DP-SelFTはプライバシー保証の下で、既存のDPファインチューニングベースラインに対するプライバシーとユーティリティのトレードオフを一貫して改善していることがわかった。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:55:11 GMT)
BELIEF: Structured Evidence Modeling and Uncertainty-Aware Fusion for Biomedical Question Answering [28.4] BELIEFは、バイオメディカル質問応答のための構造化されたエビデンスモデリングと不確実性を考慮した融合フレームワークである。
検索した文書を、臨床属性、ソース品質、質問関連性、サポート強度、および関連する仮説を記録するエビデンスオブジェクトに変換する。
BelIEFは、エビデンス構造、パスの不一致、決定の不確実性を明確にすることで、検索エビデンス利用を改善する。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:58:55 GMT)
MUSE: Multimodal Uncertainty Quantification of State Estimation [28.0] 本稿では,MUSE(Multimodal Uncertainty Quantification of State Estimation)を提案する。
MUSEは、既存の不確実性定量化手法に比べて信頼性と堅牢性に優れており、アブレーション研究はその重要な設計選択の利点を正当化している。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:33:02 GMT)
Training Infinitely Deep and Wide Transformers [27.8] 本稿では、平均場状態における変圧器の勾配に基づく訓練を厳格に分析するための枠組みを開発する。
条件付きワッサーシュタイン計量空間における勾配流曲線の存在と特異性を証明する。
重要な技術的貢献は、ニューラル・タンジェント・カーネルの注入に必要な十分な条件を提供することである。
論文参考訳(メタデータ) (Sun, 17 May 2026 21:30:13 GMT)
Missing Old Logits in Asynchronous Agentic RL: Semantic Mismatch and Repair Methods for Off-Policy Correction [27.3] 更新の遅れや部分的なロールアウトを伴う実用的なパイプラインでは,必要なトレーニング側ロジットが失われることがよくあります。
この欠落したログ問題により、不一致の修復が不安定な修正で絡み合い、クリッピングやマスキングのしきい値が好ましくない相互作用をする。
我々は、スナップショットベースのバージョントラッキング、専用の古ログモデル、部分的なロールアウト中断による同期の3つの正確な古ログ取得戦略を提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 06:02:48 GMT)
Data-Free Client Contribution Estimation via Logit Maximization for Federated Learning [26.9] logit(CELM)に基づくクラスワイドコントリビューション推定と集約フレームワークを提案する。
CELMは、生データやクライアントメタデータ、補助的な公開データセットの共有を必要としない。
制御された非IIDおよび病理ラベル分割に基づく代表視覚ベンチマークのアプローチを評価する。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:49:48 GMT)
Learning Higher-Order Structure from Incomplete Spatiotemporal Data: Multi-Scale Hypergraph Laplacians with Neural Refinement [26.9] センサネットワークは現代のインフラを統治するが、標準計算ベンチマークによって仮定される一様ランダムパターンには、それらが失うデータが欠落することは滅多にない。
不完全な観測から高次構造を学習するフレームワークであるMulti-Scale Hypergraph Laplaciansを紹介する。
我々はMSHLがグループ保存パターンをペアワイズグラフに到達不能に表現し、対数係数まで最高の固定スケールに適応し、一方的な改善を保証することを証明した。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:15:16 GMT)
SparseSAM: Structured Sparsification of Activations in Segment Anything Models [26.6] Segment Anything Model (SAM)は強力なオープン語彙セグメンテーションを実現するが、ViTベースの画像エンコーダは遅延推論とメモリを支配している。
SparseSAMは,トークンの識別を保ちながら注意と層を協調的に加速する訓練不要のスペーシフィケーションフレームワークである。
4つのセグメンテーションベンチマークで、SparseSAMは密度が0.004 mIoU、0.3が0.021 mIoU、精度が2.10倍、トークンマージの進歩が2.10倍、推論が2.8倍、メモリが2.8倍である。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:54:22 GMT)
Position: Graph Condensation Needs a Reset -- Move Beyond Full-dataset Training and Model-Dependence [26.2] グラフの凝縮は、現在の形では、リセットが必要であると我々は主張する。
私たちは、フルデータセットのトレーニングとモデルに依存した設計を超えて移行することを呼びかけています。
我々は、凝縮の真の約束を果たすアプローチに向けて、分野を再編成することを目指している。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:08:22 GMT)
Rethinking Side-Channel Analysis: Automated Discovery and Analysis of Side-Channel Leakage with LLM-Assisted Agents [25.6] サイドチャネルリスク分析のための自動フレームワークであるSCAgentを提案する。
SCAgentは、手動で指定したイベントを超えて、機密性の高いターゲットを特定する。
まずは、特権のないアプリケーションで観測可能なOSレベルのサイドチャネルに焦点を当てて、iOS上でSCAgentをインスタンス化します。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:03:45 GMT)
VoxShield: Protecting 3D Medical Datasets from Unauthorized Training via Frequency-Aware Inter-Slice Disruption [25.5] Unlearnable Examples (UE) は、効果的なモデル学習を防ぐために、知覚不能な摂動を注入することによって保護を提供する。
本稿では,3次元ネットワークの帰納バイアスを明示的に対象とするUEフレームワークであるVoxShieldを提案する。
BraTS19とFLARE21の実験では、VoxShieldが3Dセグメンテーション性能を低下させることに成功した。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:35:19 GMT)
Iterative Chow Filtering for Learning with Distribution Shift [25.3] 効率的なPQ学習のために,$cal L$サンドイッチサフィスというより弱い概念が示された。
そこで我々は,DNFの準多項式時間PQ学習アルゴリズムを一様分布下で実現した。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:18:17 GMT)
See What Matters: Differentiable Grid Sample Pruning for Generalizable Vision-Language-Action Model [25.0] Differentiable Grid Sampler (GridS) は、Vision-Language-Action(VLA)モデルで視覚トークンのタスク認識、継続的な再サンプリングを行うプラグイン・アンド・プレイモジュールである。
GridSは、10%未満のオリジナルビジュアルトークンで劇的な圧縮を実現しつつ、必須の空間情報を保存する。
論文参考訳(メタデータ) (Sun, 17 May 2026 20:26:41 GMT)
VeriCache: Turning Lossy KV Cache into Lossless LLM Inference [24.6] 私たちは、フルKV-cacheデコードと同じ出力を保証する最初の推論フレームワークであるVeriCacheを紹介します。
VeriCacheはフルKVキャッシュよりも最大4倍高いスループットを実現していることを示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:18:39 GMT)
HCLM: A Hierarchical Framework for Cooperative Loco-Manipulation with Dual Quadrupeds [24.5] 本稿では,2重四元系を用いた汎用協調ロコ操作のための階層的枠組みであるHCLMを紹介する。
我々のアーキテクチャは、低レベルのロバストな動作実行から高レベルの協調的推論を体系的に分離する。
その結果、信頼性の高いタスク実行、厳格な構成主義、厳しい物理的摂動に対する例外的なレジリエンスが示された。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:23:03 GMT)
PEIRA: Learning Predictive Encoders through Inter-View Regressor Alignment [24.3] 最適線形回帰器のトレースから明確な目的を持つ非競合型SSL方式PEIRAを紹介する。
安定な平衡は非自明な大域最小化であり、正準相関部分空間を回復し、正則化が有効次元を選択することを示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:04:01 GMT)
FML-bench: A Controlled Study of AI Research Agent Strategies from the Perspective of Search Dynamics [24.1] FML-Benchは10ドメインにわたる18の基本的なML研究タスクのベンチマークである。
エージェント戦略と実行インフラストラクチャを分離し、12のプロセスレベルの行動メトリクスを定義する。
機会が密集している場合には欲求探索がより効果的になる傾向にあり、機会が不足している場合には、木探索と進化戦略がより効果的になる傾向にある。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:30:38 GMT)
\textsc{MasFACT}: Continual Multi-Agent Topology Learning via Geometry-Aware Posterior Transfer [23.7] 大規模言語モデル(LLM)を利用したマルチエージェントシステム(MAS)が,複雑な問題解決のための強力なパラダイムとして登場した。
既存のトポロジ生成手法は主に独立したタスクを最適化するが、実際のデプロイメントには進化するタスクのストリームが含まれる。
新しいタスクに適応することで、トポロジージェネレータを以前のタスクが必要とする通信構造から切り離すことができる。
textbftextscMasFACTは、過去のコラボレーション知識を転送可能なトポロジとして保存し再利用する幾何学的に認識された後継転送フレームワークである。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:58:58 GMT)
Efficient Feature-Free Initialization for Monocular Visual-Inertial Systems Using a Feed-Forward 3D Model [23.4] 視覚慣性ナビゲーションシステム(VINS)のための機能フリーフレームワークを提案する。
フィードフォワード3Dモデルにより予測される最大スケールの点雲を利用して、視覚的特徴追跡と推定の必要性を回避する。
公開データセットの実験では,提案手法が最も成功率が高く,90%を超えることが示されている。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:35:02 GMT)
UniPPTBench: A Unified Benchmark for Presentation Generation Across Diverse Input Settings [23.1] 既存の作業は通常、独立した入力設定下でのプレゼンテーション生成に重点を置いている。
現実世界のユースケースは、曖昧なユーザプロンプト、長いドキュメント、マルチモーダル素材、複数の異種ソースなど、さまざまなシナリオにまたがっています。
提案するUniPPTBenchは,4つの代表的な入力設定にまたがって,プレゼンテーション生成のための統一ベンチマークである。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:50:16 GMT)
TabKDE: Simple and Scalable Tabular Data Generation with Kernel Density Estimates [22.5] タブラルデータ生成は、複数の列を持つ大きなテーブルを考える。
目標は、元のデータから行の分布を複製するテーブル用の新しい行を作成することである。
論文参考訳(メタデータ) (Sun, 17 May 2026 20:21:56 GMT)
EchoSR: Efficient Context Harnessing for Lightweight Image Super-Resolution [22.4] EchoSRは、軽量画像超解像のための効率的なコンテキスト調和フレームワークである。
マルチスケールの受容場モデリングと階層型コンテキスト融合を統一する。
複数のベンチマークで最先端の軽量超解像法を一貫して上回る。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:20:27 GMT)
When Efficiency Backfires: Cascading LLMs Trigger Cascade Failure under Adversarial Attack [22.4] 大規模言語モデル (LLM) のカスケードシステムは、クエリを軽量モデルで処理することで効率と性能のバランスをとるように設計されている。
しかし、カスケード設計では、拡張された攻撃面を通じて新たな脆弱性が導入されている。
本研究は,LSMカスケード系が標的対向操作に感受性があることを実証する最初の研究である。
論文参考訳(メタデータ) (Sun, 17 May 2026 06:59:43 GMT)
RadGenome-Anatomy: A Large-Scale Anatomy-Labeled Chest Radiograph Dataset via Physically Grounded Volumetric Projection [22.1] RadGenome-Anatomyは、最大の解剖学的ラベル付き胸部X線写真データセットで、210の解剖学的構造にわたる1000万以上のセグメンテーションマスクを含む。
大規模な3次元解剖学マスクをCTボリュームから2次元X線撮影空間に投影し、標準X線撮影により構築する。
RadGenome-Anatomyのスケールと広範囲の解剖学的カバレッジは、重複し、部分的に見えるか、直列化が難しい構造を含んでおり、胸部X線写真解釈の明確な証拠として幾何学的測定の研究を可能にしている。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:22:56 GMT)
Self-Improving CAD Generation Agents with Finite Element Analysis as Feedback [21.8] 我々は、自由形式のエンジニアリングブリーフから完全に組み立てられたマルチパートSTEPファイルを生成するモデルを必要とする、より業界固有のタスク定式化を導入する。
FEAの検証によると、Codex (GPT-5.5) と Claude Code (Opus-4.7) のエージェントは、メインのファースト・アタプティブ・スイープにおいて1つの厳密な通過アーティファクトを生成していない。
S2OとFusion360では、同じフィードバックツールが幾何再構成を改善し、GPT-5.5/xhighはS2Oでは0.444から0.592Box-IoU、Fusion360では0.397から0.505に上昇した。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:47:38 GMT)
$\textit{Don't Guess, Just Ask}$: Resolving Ambiguity in Referring Segmentation via Multi-turn Clarification [21.7] セグメンテーションの参照は、対象のオブジェクトをテキストクエリに基づいて画像やビデオに分割することを目的としている。
セグメンテーション前のマルチターン会話を通じてユーザの意図を積極的に解明する新しいエージェントフレームワークである textbfIC-Seg を提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:30:44 GMT)
Active Budget Allocation for Efficient Scaling Law Estimation via Surrogate-Guided Pruning [20.9] 経験的スケーリング法の研究は、この予測タスクを支援する機能形式を特定する。
このアプローチの実証的な性質のため、計算負担はかなり大きい。
本稿では,パラメトリックおよび非パラメトリックサロゲートモデルと組み合わせた逐次ハルビング(SH)とSHの適合性について検討する。
論文参考訳(メタデータ) (Sun, 17 May 2026 03:01:55 GMT)
Stable Routing for Mixture-of-Experts in Class-Incremental Learning [20.7] CIL(Class-incremental Learning)は、事前の知識を維持しつつ、新しいクラスを逐次学習するモデルを必要とする。
我々は、CILにおける拡張可能なMoEには、知識保存のための安定な古いクラスルーティングと、新しいクラス適応のための十分なキャパシティ利用の2つの相補的な特性が必要であると主張している。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:59:03 GMT)
HyperVision: A Channel-Adaptive Ground-Based Hyperspectral Vision Pre-trained Backbone [20.5] 本研究は,第1の地上高スペクトル事前トレーニングバックボーンであるHyperVisionを提案する。
26の異なる地上ベースデータセットから15kイメージの収集に事前訓練されている。
タスク固有の方法と比較して最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sun, 17 May 2026 06:50:06 GMT)
A World Model of Radiologist Reading for Medical Image Representation Learning [20.3] 本稿では,この画像を世界として扱う医療画像世界モデルGazeWorldと,それを通して放射線技師の固定シーケンスを軌跡として提案する。
Frozen GazeWorldの機能は、CheXpert、RSNA Pneumonia、SIIM-ACR Pneumothoraxの9つの教師付き設定で、最先端の診断精度を実現する。
GazeSearchベンチマークでは、同じフリーズ機能でトレーニングされたジェネリックデコーダが、ScanMatchで16%、SEDで22%以上のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:30:29 GMT)
ADR: An Agentic Detection System for Enterprise Agentic AI Security [20.3] 我々は,モデルコンテキストプロトコル(MCP)を介して運用されるAIエージェントをセキュアにするための,最初の大規模かつ実運用可能なエンタープライズフレームワークを提示する。
1) 制限された可観測性 -- 既存のツールはファイル書き込みを見るが、エージェントの推論、プロンプト、あるいは因果連鎖は実行にリンクする。 2) 事前定義されたルールで制約された静的な防御は、様々な攻撃技術や企業コンテキストにまたがる一般化に失敗し、(3) 高い検出コスト -- LLMベースの推論は、スケールにおいて違法に高価である。
Uberに10ヶ月以上デプロイされたADRは、信頼性の高い本番環境での検出を継続し、採用数は7200以上のユニークなホストに到達した。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:49:07 GMT)
SEDualVLN: A Spatially-Enhanced Dual-System for Vision-Language Navigation [19.9] SEDualVLNは空間的に拡張されたデュアルシステムビジョンランゲージナビゲーションフレームワークである。
System 1は、グローバルな空間認識とローカルな空間認識の両方で拡張されたVLMモデルであり、アクション生成に使用される。
System 2は一般的なMLLMとマッピングモジュールを統合し、MLLMはリアルタイム3Dマップのトップダウンビューを活用することで、経路ポイントを計画する。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:12:56 GMT)
How Do Electrocardiogram Models Scale? [19.3] 心電図領域における神経と損失-損失-損失スケーリング法則を系統的に検討した。
モデルアーキテクチャ(ResNet vs. Transformer)と事前学習パラダイム、すなわち教師付き学習(SL)と自己教師付き学習(SSL)の効果を分離する。
この結果から,効率的なECG基盤モデルへの道筋は,ブルートフォーススケーリングではなく,アーキテクチャとパラダイムの戦略的アライメントにあることが示唆された。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:53:35 GMT)
LEAP: Learnable End-to-End Adaptive Pruning of Large Language Models [19.3] 未構造化プルーニングの最先端手法は、最適脳サージオン原理から導かれる階層的なサロゲートである。
本稿では,この難易度パラメータ化をBernoulli-via-Gumbelシグモイド緩和法に置き換えるLEAPを提案する。
0.5Bから8Bパラメータの50%と60%の間隔で5つのLLMファミリーにまたがって、LEAPは6タスク平均ゼロショット精度をADMM平均で2.59ポイント改善する。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:01:13 GMT)
DeTrack: A Benchmark and Altitude-Aware Dual World Model for Drone-embodied Tracking [19.2] DeTrackは、ドローンが対話的な3D環境でターゲットを追跡することを必要とする、ドローンを身体的に追跡する新しいタスクだ。
AaDWorldsは、ドローンの身体追跡のための高度対応のデュアルワールドモデルフレームワークである。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:49:27 GMT)
Designing streetscapes from street-view imagery using diffusion models [18.9] ストリートビュー画像(SVI)は、グリーン・エレー、スカイ、ロードビューの指標などの都市環境の重要な指標を定量化するために広く用いられている。
既存の研究は、現在の街路景観を測ることに重点を置いており、代替的および既存の都市シナリオの生成を支援することはめったにない。
本稿では、ターゲットの視覚的指標に基づいて、他の街路景観を合成する、ジェネラ指向のマルチモーダルAIフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:20:30 GMT)
When Molecular Similarity Works: Property Cliffs Reveal Hidden Errors [18.1] 崖に敏感なエラーを露呈し緩和するためにCliffSplitとCliffLossを導入する。
CliffSplitは崖の多いQM9領域で少なくとも15%高い誤差を示す。
クリフロスはリポフィリティーで最大30%の崖から滑らかな誤差ギャップを減らし、全体のMAEを9.7%改善した。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:20:42 GMT)
Behavior-Aware Auxiliary Corrections for Off-Policy Temporal-Difference Prediction [18.0] 本稿では,線形予測設定における補助共分散幾何の振る舞いを考慮した置換について検討する。
動作認識の代替は、いくつかのタスクにおいてそれ自体が有益であることを示すが、より厳しい設定で堅牢なパフォーマンスを実現するためには、定期化が必要である。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:49:52 GMT)
Do LLM Agents Mirror Socio-Cognitive Effects in Power-Asymmetric Conversations? [17.9] 我々は,大規模言語モデル (LLM) が高位または低位のペルソナに割り当てられた場合に類似した振る舞いを示すか否かを検討する。
多様な専門職のペルソナを用いて,マルチターン,パワー非対称対話,および(i)言語調整,(ii)代名詞使用,(iii)説得成功,(iv)安全でない要求に対するコンプライアンスをシミュレートする。
論文参考訳(メタデータ) (Sun, 17 May 2026 23:23:45 GMT)
Stop When Reasoning Converges: Semantic-Preserving Early Exit for Reasoning Models [17.6] 長鎖の思考(CoT)を生成することでLRM(Large Reasoning Models)の性能が向上する
LRMは、しばしば過度に考え、ソリューションがすでに安定し、トークンを無駄にし、レイテンシを増大した後も、推論を続けます。
本稿では,軽量冗長検出器と応答レベル検証を組み合わせたプラグアンドプレイフレームワークPUMAを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:04:11 GMT)
Dynamic Model Merging Made Slim [17.1] DiDi-Mergingは、共有パラメータとエキスパートパラメータのバランスを取るために、異なるランク割り当てを利用するスリムな動的マージフレームワークである。
従来の動的ベースラインは、1つの微調整モデルのパラメータの1.24倍にしか一致せず、1.4倍に上り、2倍のストレージを必要とするメソッドよりもかなりコンパクトである。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:36:53 GMT)
From a Single Demonstration to a General Policy for Contact-Rich Manipulation [16.8] 本稿では,コンタクトリッチな操作タスクのワンショット一般化を実現するフレームワークを提案する。
環境制約を利用する一連の行動としてデモを表現することで、ロボットはタスク・ジェネラルな構造を分離する。
我々は,7つの実世界のコンタクトリッチな操作タスクに対するアプローチを検証するとともに,90%以上の成功を達成している。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:58:03 GMT)
DiagEval: Trajectory-Conditioned Diagnosis for Reliable Software Evaluation with GUI Agents [16.6] 本稿では,対話型ソフトウェアのGUIエージェント評価のための軌道条件付き診断評価プロトコルであるDiagEvalを提案する。
DiagEvalは失敗した軌道を再利用して、対象の診断プローブを選択し、その結果を内部の属性信号に集約する。
WebDevJudge-UnitとRealDevBenchのDiagEvalを複数のGUIエージェント評価器とLCMバックボーンで評価する。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:22:22 GMT)
LongDPM: Overlap-Aware 4D Reconstruction from Long Monocular Videos [16.2] LongDPMはスケーラブルな長距離単分子動的再構成のための新しいフレームワークである。
長いビデオを重なり合うチャンクで処理し、チャンクの長さによって推論メモリを束縛する。
チャンク境界とヒューズが一致する軌道の動的アイデンティティを関連付け、コヒーレントな長距離3D運動を復元する。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:41:12 GMT)
DyGRO-VLA: Cross-Task Scaling of Vision-Language-Action Models via Dynamic Grouped Residual Optimization [16.0] 強化学習(RL)の最近の進歩は、ビジョン・ランゲージ・アクション(VLA)モデルを最適化するための原則的なアプローチを提供する。
制御精度の改善にもかかわらず、ほとんどのRLはタスク固有であり、VLAモデルをコントローラから限られたタスクに過度に適合するポリシーへ還元する。
この発見に触発されたDyGRO-VLAは、2段階の最適化フレームワークで、クロスタスクの潜在表現を効果的にキャプチャする。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:55:32 GMT)
Beyond Detection: A Structure-Aware Framework for Scene Text Tracking [15.9] 本稿では、この特定のタスクをScene Text Trackingとして定式化する。
そこで我々はSymTrackを提案する。SymTrackは、シナジスティックなデュアルブランチ設計を備えた、一貫した検出不要のフレームワークである。
このタスクに専用のベンチマークがないので、ビデオテキストスポッティングの3つのデータセットを使用して、高品質なアノテーションによるベンチマークを構築する。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:40:55 GMT)
CBT-Audio: Evaluating Audio Language Models for Patient-Side Distress Intensity Estimation in CBT Session Recordings [15.9] 音声言語モデルを用いたCBTセッションから患者の苦痛度を推定するためのデータセットであるCBT-Audioを紹介する。
我々は,3つの入力条件下で10のオープンソース音声モデルを評価し,そこでは患者音声のみを受信し,転写のみを受信し,音声と転写の両方を受信する。
以上の結果から,音声はテキスト以外の有用な情報を提供することが可能であることが示唆された。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:27:52 GMT)
Single-Sample Black-Box Membership Inference Attack against Vision-Language Models via Cross-modal Semantic Alignment [15.4] メンバーシップ推論攻撃(MIA)は、モデルのトレーニングセットにデータサンプルが含まれているかどうかを判断することで、これらのリスクを評価することを目的としている。
厳格なブラックボックスとシングルサンプル設定のために設計された新しいMIAフレームワークを提案する。
提案手法は,LLaVA-1.5に対して0.821のAUCを達成し,既存のベースラインを大幅に上回った。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:21:11 GMT)
Beyond Transcripts: Iterative Peer-Editing with Audio Unlocks High-Quality Human Summaries of Conversational Speech [15.1] 人間の音声に基づく要約と人間の書き起こしに基づく要約を比較し、異なる情報モダリティが要約品質に与える影響を追跡する。
音声に基づく要約は、書き起こし要約よりも情報が少なく、圧縮も少ないことが判明した。
これらの結果は, 語彙情報と韻律情報の両方から得られるベンチマークを作成するために, 人間のアノテーション間のピア編集を検証した。
論文参考訳(メタデータ) (Sun, 17 May 2026 21:07:36 GMT)
HL-OutPaint: Coarse-to-Fine Video Outpainting for High-Resolution Long-Range Videos [14.0] 映像の露光は、ビデオシーケンスの元々の空間範囲を超えて、可視な視覚コンテンツを生成する。
HL-OutPaintは長周期の高精細映像出力フレームワークである。
我々のフレームワークは、空間展開と長いビデオシーケンスのための安定したコヒーレントな生成を実現する。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:52:38 GMT)
Debug Like a Human: Scaling LLM-based Fault Localization to Processor Design via Block-Level Instruction-Oriented Slicing [14.0] 現代のプロセッサ設計コードにおけるフォールトローカライゼーションは、検証において重要なが時間を要するステップである。
本稿では,プロセッサ設計のためのブロックレベルLPMに基づく新しい障害ローカライズフレームワークBluesFLを紹介する。
システムVerilogの19K行からなる実世界のRISC-Vプロセッサコア上でBluesFLを評価する。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:02:54 GMT)
Maximum Likelihood Decoding of Quantum Error Correction Codes [13.9] 量子誤り訂正(QEC)は、フォールトトレラントな量子計算を実現するには不可欠であるが、その有効性は古典的復号アルゴリズムに批判的である。
最大確率復号法(MLD)は、論理クラス内の全ての可能なエラーを和って論理群を最大の確率で特定するので、証明可能な最適である。
最適性にもかかわらず、MLDは一般に計算的に難解であり(#P-hard)、正確なアルゴリズムと近似アルゴリズムの豊かな景観を動機付けている。
論文参考訳(メタデータ) (Sun, 17 May 2026 02:32:52 GMT)
GEM: Gaussian Evolution Model for Occupancy Forecasting and Motion Planning [13.9] 本研究では,将来的な意味的占有予測と行動計画のための非自己回帰的占有世界モデルを提案する。
GEMは、現在最先端のセマンティック占有率予測と強力なモーションプランニング性能を実現する。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:52:53 GMT)
Artificial Intolerance: Stigmatizing Language in Clinical Documentation Skews Large Language Model Decision-Making [13.8] 大規模言語モデル(LLM)は、臨床上の意思決定支援や医療ドキュメントなど、高度な領域にますます展開されている。
臨床テキストの処理において、フロンティアLSMが人間のバイアスを継承し、伝播するかどうかを検討する。
論文参考訳(メタデータ) (Sun, 17 May 2026 02:28:25 GMT)
Event-B Agent: Towards LLM Agent for Formal Model Synthesis and Repair [13.8] Event-B Agentは、ソフトウェア設計のインターリーブな性質にインスパイアされた、新しいフレームワークである。
Event-B Agentは、エンド・ツー・エンドの形式モデル合成と修復において、ベースラインを大幅に上回ることを示す。
以上の結果から,Event-B Agent は形式的モデル合成と修復の修正に向けた有望なステップであることが示唆された。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:23:45 GMT)
AI Agents May Always Fall for Prompt Injections [13.7] デプロイされたAIエージェントにおいて、プロンプトインジェクションが最も重大な脆弱性であることを示す。
我々は、コンテキスト整合性(CI)のレンズを通して、情報フローを文脈規範に準拠させるプライバシー理論を通じて、プロンプトインジェクションをリキャストする。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:55:39 GMT)
CatalyticMLLM: A Graph-Text Multimodal Large Language Model for Catalytic Materials [12.0] 触媒材料のためのグラフテキスト多モード大言語モデルQE-Catalytic-V2を提案する。
プロパティ予測と逆設計を同じモデルと共有表現空間に統合する。
この統合フレームワークでは、QE-Catalytic-V2は信頼性の高いプロパティ予測を行うだけでなく、物理的に実現可能なCIF候補を生成し、表示することができる。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:31:46 GMT)
Stop Drawing Scientific Claims from LLM Social Simulations Without Robustness Audits [11.9] 生成エージェントはエージェントベースのモデリングに新しい表現力をもたらす。
研究者にとって小さな摂動は、マクロレベルの結果にカスケードすることができる。
TRAILSは3段階のシミュレーション設計にまたがる頑健性監査型分類法である。
論文参考訳(メタデータ) (Sun, 17 May 2026 00:21:53 GMT)
Transitivity Meets Cyclicity: Explicit Preference Decomposition for Dynamic Large Language Model Alignment [11.9] 一般選好モデル(GPM)は階層構造を周期性で絡み合わせるが、支配的な解決策を保証できない。
本稿では,好みをベクトルに明示的に切り離すハイブリッド・リワード・シクリックモデルを提案する。
DSPPOはアライメントを時間変化ゲームとして扱い、ナッシュ均衡に向けて政策を導く。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:27:26 GMT)
The Capability Paradox: How Smarter Auditors Make Multi-Agent Systems Less Secure [11.8] これは、有害な要求がドメイン固有の物語の中に隠され、Workerレポートを通じてマネージャに伝達される攻撃である。
労働者の能力が増加するにつれて、平均的なシステムレベルの攻撃成功率(ASR)は18.4%から63.9%に増加し、94.4%がピークである。
以上の結果から,より強力なモデルにコンポーネントをアップグレードすることで,システムセキュリティを積極的に劣化させることが可能であることが示唆された。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:42:44 GMT)
Dynamic Skill Lifecycle Management for Agentic Reinforcement Learning [11.8] 大規模な言語モデルエージェントは、複雑なタスクを解決するために、ますます外部スキルに依存している。
既存の手法では、外部スキルは永続的なガイダンスとして蓄積するか、ポリシーに内部化され、ゼロスキル推論につながると仮定している。
パラメトリック能力の制限とスキル間の不均一な限界貢献により、最適なアクティブスキルセットは非モノトニック、タスク、ステージ依存である。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:50:25 GMT)
MetaCogAgent: A Metacognitive Multi-Agent LLM Framework with Self-Aware Task Delegation [11.5] 本稿では,メタ認知自己評価ユニットを備えた多エージェント大規模言語モデル(LLM)フレームワークであるMetaCogAgentを提案する。
MetaCogAgentは、AutoGenよりも5%少ないAPIコールを使用し、アンサンブル投票よりも34%少ないタスク精度を82.4%達成している。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:12:04 GMT)
Self-Supervised Learning for Sparse Matrix Reordering [11.4] 適切な順序付けによるスパース行列の行や列の再配置は、補充を著しく減少させる。
グラフ理論および深層学習法を含む既存のアプローチは、理論的な保証のない代理目的に依存している。
論文参考訳(メタデータ) (Sun, 17 May 2026 11:54:12 GMT)
Weighted Reverse Convolution for Feature Upsampling [11.4] WRC(Weighted Reverse Convolution)は、高レベルな視覚ディスクリプタをデジタイズするための空間適応型逆演算子である。
WRCは空間的に異なる特徴に適応し、過剰な平滑化を緩和しながら重要な構造を保存する。
WRCは、セグメンテーション、深さ推定、ビデオオブジェクトのセグメンテーション、オブジェクト発見、キーポイント対応など、様々なダウンストリームベンチマークにおける機能品質を一貫して改善している。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:20:53 GMT)
ClaHF: A Human Feedback-inspired Reinforcement Learning Framework for Improving Classification Tasks [11.1] テキスト分類のための人間によるフィードバックに基づく強化学習フレームワークであるClaHFを提案する。
ClaHFは、追加の人間のアノテーションを必要とせずに、好みのモデリングとRL最適化を分類パイプラインに統合する。
ClaHFは多様な言語モデル間での分類性能と信頼性校正の両方を一貫して改善することを示した。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:00:01 GMT)
MemRepair: Hierarchical Memory for Agentic Repository-Level Vulnerability Repair [10.7] 現代のソフトウェアエコシステムは、公表された脆弱性の急増に直面している。
既存のシステムのほとんどは、脆弱性の修復を、現在見えるコードコンテキストの単一生成ステップとして扱う。
本稿では、メモリ拡張されたエージェントフレームワークであるMemRepairを紹介し、脆弱性修復を反復的、経験駆動的なプロセスとして定式化する。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:29:46 GMT)
CAM-Bench: A Benchmark for Computational and Applied Mathematics in Lean [10.7] CAM-Benchは、計算および応用数学における1000のリーン証明目標のLean 4定理証明ベンチマークである。
これらの問題は教科書の演習に適応しており、しばしばローカルに導入された定義、表記法、アルゴリズム、基礎的な結果に依存している。
リーンコンパイルとセマンティックレビューを通じて、結果のフォーマルな問題を検証し、フォーマルな正当性とセマンティックなアライメントの両方を元のエクササイズで確認します。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:53:47 GMT)
Calibeating for general proper losses: A Bregman divergence approach [10.5] この研究は、後悔に基づく校正のための一般的な枠組みを導入している。
我々は、$-Tsallisの損失($in [1, 2]$)とLipschitzの損失を含む、適切な損失の大きなファミリーを考えます。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:39:22 GMT)
ContraFix: Agentic Vulnerability Repair via Differential Runtime Evidence and Skill Reuse [10.5] 大規模言語モデル(LLM)エージェントは、自動脆弱性修復にますます利用されている。
最近の実証的な結果は、これらのエージェントがいまだに現実世界の脆弱性と戦っていることを示している。
ContraFixは、再利用可能な修復スキルとランタイムエビデンスを結合するエージェントフレームワークである。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:48:25 GMT)
ConflictRAG: Detecting and Resolving Knowledge Conflicts in Retrieval Augmented Generation [10.5] 本稿では,回答生成に先立って知識衝突を検出し,分類し,解決する競合対応RAGフレームワークであるConflictRAGを提案する。
このフレームワークは、90.8%の検出精度を維持しながら、APIコストを62%削減する。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:25:29 GMT)
PULSE: Agentic Investigation with Passive Sensing for Proactive Intervention in Cancer Survivorship [10.4] がんの生き残りは、うつ病、不安、一般的な感情的苦痛の度合いが上昇する。
固定された特徴パイプラインからエージェントセンシング調査に移行するシステムであるPULSEを提案する。
エージェント調査は受動的センシングの臨床的価値を解き放つための基盤となるかもしれない。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:39:21 GMT)
Towards Robust Argumentative Essay Understanding via TIDE: An Interactive Framework with Trial and Debate [10.2] 議論関連タスクの基準に基づくプロンプト最適化を改善するための新しいフレームワークであるTIDEを提案する。
本手法は,ノイズ学習データの影響を緩和し,基準に基づくプロンプト最適化の鍵となる限界に対処する。
結果は、我々のフレームワークがタスク間のパフォーマンスを改善していることを示している。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:10:36 GMT)
Rover: Context-aware Conflict Resolution with LLM [10.1] 特に大規模プロジェクトでは、コードのマージは重要な課題です。
プログラム分析と機械学習を含む既存のソリューションは、将来性を示しているが、重要な制限に直面している。
本稿では,プログラム解析と大規模言語モデルを統合する新たな競合解決システムであるRoverを紹介する。
論文参考訳(メタデータ) (Sun, 17 May 2026 06:21:40 GMT)
Learning Fill-in Reduction Ordering via Graph Policy Optimization for Sparse Matrices [9.5] 大規模計算における行列の並べ替えは、メモリと計算時間を削減するために分解補充を最小化する置換を求める。
グローバル・ローカル・ビューからの補充をモデル化するグラフポリシー最適化手法を提案する。
本手法は,最先端のベースライン上でのピークメモリ使用量に対して29.3,31.3の削減を実現している。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:07:23 GMT)
Self-Supervised On-Policy Distillation for Reasoning Language Models [9.3] emphSelf-Supervised On-Policy Distillation (SSOPD)
コードはhttps://github.com/tzq 1999/SSOPD.comでリリースされる。
論文参考訳(メタデータ) (Sun, 17 May 2026 15:14:24 GMT)
CyberCorrect: A Cybernetic Framework for Closed-Loop Self-Correction in Large Language Models [9.3] CyberCorrectは、大規模言語モデルの自己訂正を形式化するフレームワークである。
タイプ指向補正制御器は、診断されたエラーカテゴリに基づいて修理指示を生成する。
収束判定器は、制御理論から適応された安定性基準を用いて繰り返し終了を決定する。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:47:34 GMT)
GraphMind: From Operational Traces to Self-Evolving Workflow Automation [8.9] GraphMindは、人間の努力なしにアクション中心のワークフローグラフを構築し、実行し、進化させるエンドツーエンドシステムである。
システムは、インシデント調査のために、4つのプロダクションクラウドデータベースサービスにデプロイされている。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:22:22 GMT)
Computational Challenges in Token Economics: Bridging Economic Theory and AI System Design [8.9] トークン・エコノミクスは、大規模言語モデルシステムにおける資源配分、価値創造、価格の理解に有用なレンズとして登場した。
ハイレベル経済理論と現代のAIインフラの計算現実性の間には、依然としてかなりのギャップがある。
本稿では,トークン・エコノミクスの原理をリアルタイム推論システムに実装した場合に生じる重要な計算課題を特定し,解析する。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:11:34 GMT)
Beyond Geometry: Efficient Topologically-Grounded Navigation in Complex 3D Environments [8.7] 複雑な3次元環境における地上ロボットのナビゲーションは、しばしば幾何学的曖昧さによって妨げられる。
本研究では, 地上支持, オーバーヘッドクリアランス, シードベース接続制約を強制することにより, 物理的に到達可能な立位位置の低減状態空間を構築する表面抽出フレームワークを提案する。
5つのMatterport3D屋内シーンと3つのPCTベンチマークシーンで評価され、ステートスペースの80%以上の削減と、Matterport3Dシーンでのサブミリ秒A*検索が示され、300のテストクエリの100%が成功した。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:34:14 GMT)
WebGameBench: Requirement-to-Application Evaluation for Coding Agents via Browser-Native Games [8.7] WebGameBenchは,ブラウザネイティブゲームのための要件 to アプリケーションベンチマークである。
実行時評価器は実際のブラウザで配信されたゲームと対話し、EXCELLENT、USABLE、UNUSABLEという3方向ラベルを割り当てる。
111タスク、12のコーディングエージェント、14の評価設定で、WebGameBenchは現在のシステムを分離する。
論文参考訳(メタデータ) (Sun, 17 May 2026 20:07:12 GMT)
Adaptive Generate-Rank-Verify: Inference-Time Search with Costly Verification [8.6] 我々は、学習理論レンズを生成能動探索として用いて、コスト感受性の第1正探索問題を定式化する。
固定プロンプトでは、ジェネレータと報酬モデルが2つの未知のオブジェクトを誘導する。
本稿では,サンプル応答数やトップランク検証を段階的に増加させる,シェルワイズ適応型生成ランク検証アルゴリズムADAPを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:10:30 GMT)
Distributed 3D Leader-Follower Formation Control with Field-of-View Safety via Control Barrier Functions [8.4] 本稿では,マルチUAVシステムのための分散3次元リーダフォロワ生成(3D-LFF)制御フレームワークを提案する。
我々は,建設による視認性を保証する,認識に配慮した安全な制御アーキテクチャを開発した。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:34:12 GMT)
Bridging the Gap between Sparse Matrix Reordering and Factorization: A Deep Learning Framework for Fill-in Reduction [8.3] スパース行列の並べ替えは、行列分解時のフィインを著しく減少させる。
最小の補充順序を見つけることはNPハード問題であることが知られている。
スペクトル埋め込みに基づく補間関数の最小化を目的としたディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:15:42 GMT)
Scrutinizing Index-Based Risk Assessments: A Case Study in NYC Decision-making for Heat Emergency Management [8.2] 緊急管理における地理的ターゲティングと意思決定のための手作り指標について検討する。
本研究では,準備行動と対応行動の指標を選択する際に,実践者が直面する課題について検討する。
論文参考訳(メタデータ) (Sun, 17 May 2026 23:36:31 GMT)
UniAlign: A Model-Agnostic Framework for Robust Network Traffic Classification under Distribution Shifts [8.1] UniAlignは、分散シフト下でのディープラーニングベースのNTCモデルの堅牢性を改善する、モデルに依存しないフレームワークである。
特定の特徴モダリティを必要とせずに既存の教師付きNTCモデルにシームレスに統合できる。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:02:17 GMT)
AffordVLA: Injecting Affordance Representations into Vision-Language-Action Models via Implicit Feature Alignment [8.1] AffordVLAは、操作中心のアベイランス知覚をVLA視覚表現に内部化する、アベイランス強化ビジョン・ランゲージ・アクション(VLA)フレームワークである。
AffordVLA は推論効率を保ちながら VLA の視覚表現を効果的に再現し,操作成功率とトレーニング効率を向上することを示した。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:02:05 GMT)
One Step Further: Understanding PLC Binaries Through Cross-Platform Reverse Engineering and Function-Level Semantic Analysis [8.0] PLC-BinXはクロスプラットフォームのPLCバイナリ理解のためのBCAワークフローである。
10倍のプログラムレベルでの評価では、PLC-BinXはツールチェーン予測において100.00%の精度、リコール、F1を達成する。
その結果、PLC-BinXはクロスプラットフォームのPLCバイナリ理解に効果的かつ解釈可能なアプローチを提供することが示された。
論文参考訳(メタデータ) (Sun, 17 May 2026 11:19:47 GMT)
Fidelity Probes for Specification--Code Alignment [7.8] 我々は,コード由来の接地真実解を持つ参照アーティファクトから生成した自然依存問題である忠実度プローブを紹介する。
忠実度プローブは矛盾とカバレッジギャップ率に分解され、ターゲット仕様の編集を収束させる。
15のプログラムで約12kラインのベンチマークを行い、8回のイテレーションで0.63から0.94に凍結テスト仕様の忠実度を上げました。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:05:54 GMT)
Evaluating Tool Cloning in Agentic-AI Ecosystems [7.7] この研究は、エージェントAIエコシステムにおけるツールクローンの大規模測定としては初めてのものである。
7,508のモデルコンテキストプロトコル(MCP)リポジトリ、87,564の抽出ツール、12,447のツールを備えた1,353のスキルレポジトリ、合計8,861のリポジトリ、100,011のツールエントリをカバーしている。
論文参考訳(メタデータ) (Sun, 17 May 2026 00:18:32 GMT)
Medical Context Distorts Decisions in Clinical Vision Language Models [7.5] ヴィジュアル言語モデル (VLM) は, 臨床診断支援のためにますます提案されているが, 現実シナリオにおける信頼性は乏しい。
本報告では,画像上のテキストに対するモダリティの過度依存,関係のない臨床歴への急激な依存,意味論的に等価な入力に対する迅速な感度の3つの障害モードを同定する。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:11:38 GMT)
Learning in Position-Aware Multinomial Logit Bandits: From Multiplicative to General Position Effects [7.5] MNL(Multinomial Logit)選択フレームワークにおける動的関節配置選択と位置決め問題について検討する。
本研究は,各積のアトラクションを位置特異因子でスケールする乗法的位置効果モデルから,各積に独立なアトラクションパラメータを割り当てた一般位置効果モデルまで幅広い。
論文参考訳(メタデータ) (Sun, 17 May 2026 03:28:22 GMT)
Exact Convex Reformulations of Linear Neural Networks via Completely Positive Lifting [7.4] この損失下での深い線形ネットワークの問題は、持ち上げられた空間円錐の正確な再構成を許容することを示す。
結果として生じる神経表現は難解であるが、線形因子とコ陽性プログラミングを結びつける。
論文参考訳(メタデータ) (Sun, 17 May 2026 23:20:50 GMT)
FishBack: Pullback Fisher Geometry for Optimal Activation Steering in Transformers [7.1] アクティベーションステアリング法は、出力の振る舞いを制御するために言語モデルの中間表現を変更するが、アクティベーション空間がユークリッドであることを普遍的に仮定する。
モデル自身の出力挙動によって誘導される局所幾何学は、GPT-2上の相対スペクトルノルムにおいて、ユークリッド計量から97%以上逸脱する。
論文参考訳(メタデータ) (Sun, 17 May 2026 03:00:16 GMT)
How Off-Policy Can GRPO Be? Mu-GRPO for Efficient LLM Reinforcement Learning [7.0] GRPO方式のアルゴリズムは,従来想定されていたよりもはるかに大きなロールアウト安定化を許容できることを示す。
本稿では,少数の逐次生成最適化段階にトレーニングを編成するRLトレーニングフレームワークであるMu-GRPOを提案する。
5つの言語モデルと複数の数学推論ベンチマークで、 Mu-GRPO は標準GRPO の性能にマッチするか、超えている。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:58:53 GMT)
PRIME: Physically-consistent Robotic Inertial and Motion Estimation for Legged and Humanoid Robots [6.9] 本研究では,実世界の展開において,車載キネマティクスから正確な動き推定を可能にするPRIMEを提案する。
提案手法は,滑らかな相補性制約とAnitescuスタイルの摩擦モデルを備えた異種接触力学を取り入れたものである。
PRIMEは、大規模な振る舞いモデリングやロボット基礎モデルなど、下流学習アプリケーションに高品質なデータを提供するように調整することができる。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:43:10 GMT)
Enhancing Regime Shift Detection Using Unstructured Data: A Study on the Treasury Market [6.9] 金融市場のレジームシフトは、資産価格とマクロ変数のジョイントダイナミクスを再編成する。
データ信号が騒々しく、重厚なマルチコリニアであるため、確実な検出は困難である。
本稿では,中央銀行間通信における大言語モデル(LLM)と金融時系列の統計的検証を併用したテキスト強化型状態シフト検出パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 15:24:53 GMT)
NOETHER: A Constructive Framework for Metamorphic Pattern Discovery from Operator Algebras [6.7] メタモルフィックテストはIEEE/ISOソフトウェアテスト標準で認識され、AIシステムに対してますます推奨される。
既存のアプローチでは,3つの基本的疑問が残る帰納的根拠を共有している。
本稿では,演算子代数からメタパタン集合への下流ステップが機械的かつ証明可能なフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 11:18:35 GMT)
A semantic mutation metric for metamorphic relation adequacy in scientific computing programs [6.7] 5つのドメイン・セマンティック演算子上に構築されたSemantic Mutation Score (SMS)を提案する。
SMSは、ほとんどどこでも、特徴化された制限でMSに縮退する。
SMSは、科学計算におけるドメイン・セマンティック・リレーション・セットの後方互換性の尺度である。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:16:13 GMT)
Dimension-Free Convergence of Discrete Diffusion Models: Adjoint Equations Induce the Right Space [6.4] 我々は、任意の積分確率計量において次元自由収束を保証する統一随伴方程式ベースのフレームワークを開発する。
私たちの境界は初めて$S$が完全に自由となり、マスク付きおよび均一な前もって適用されます。
そこで,本研究の枠組みは先行分析から脱却し,パススペースKLと既存のTVベースアプローチの欠点を回避する。
論文参考訳(メタデータ) (Sun, 17 May 2026 03:00:23 GMT)
Towards Principled Test-Time Adaptation for Time Series Forecasting [6.4] テスト時間適応(TTA)は,分散シフト下での時系列予測(TSF)を改善するための有望なアプローチとして登場した。
既存のTSF-TTA法は、明らかにされたターゲットをどのように利用するかが異なるが、結果として生じる適応プロトコルは相変わらず不均一である。
我々は、成熟した基底真理にのみ基づく適応プロトコルを提案し、適応のためのより原則的な設定を導出する。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:15:54 GMT)
Fine-tuning Pocket-Aware Diffusion Models via Denoising Policy Optimization [6.3] 本稿では,事前学習したポケット・アウェア拡散モデルを微調整するための新しい構造に基づく分子最適化(SBMO)手法であるDEPPAを提案する。
DEPPAは、結合親和性、薬物類似性、合成可能性、多様性など、複数の特性の最適化を可能にする。
論文参考訳(メタデータ) (Sun, 17 May 2026 23:21:24 GMT)
Stretch-ICP: A Continuous-Trajectory Registration and Deskewing Algorithm in Scenarios of Aggressive Motions [6.3] 不均一または滑りやすい地形における安定性の喪失は、極端な加速と角速度を引き起こす。
メカニカルライダーと慣性測定ユニット(IMU)が丘を転がり落ちる様子を収録したTumbling-induced Gyroscope Saturationデータセットを紹介した。
データセットには、類似データセットの最大4倍の角速度が含まれており、公開されている。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:13:18 GMT)
Learning Displacement-Robust Representations for Landslide Early Warning under Rainfall Forecast Uncertainty [6.2] リアルタイム災害監視のための地すべり早期警報システム(LEWS)は,近未来の地すべりリスクを見積もる必要がある。
近年の地すべり予測手法は,統計的および深層学習手法を用いて予測性能を向上した。
しかし、運用環境では、地すべり予測は降雨の予測に依存しており、しばしば降雨場の空間的変位を含む。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:32:31 GMT)
MATE: Solving Contextual Markov Decision Processes with Memory of Accumulated Transition Embeddings [5.9] MATEはコンテキストマルコフ決定プロセスを解決するためのメモリアーキテクチャである。
MATEは、Transformerのステップ単位のロールアウトコストの増加と、リカレントニューラルネットワークに関連する勾配問題を回避する。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:52:54 GMT)
Rapid Vibration Suppression and Trajectory Tracking of a Serial Manipulator with Multi-Flexible Links [5.8] 本稿では,n-of-freedomシリアル・フレキシブル・マニピュレータ・ロボットの高速振動抑制と先端追尾のためのバックステッピング出力フィードバック・フレームワークを提案する。
2リンクフレキシブルマニピュレータの実験は、所望の軌道に対するエンドエフェクタのより速い振動抑制と収束を示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:30:45 GMT)
LLMs for automatic annotation of Mandarin narrative transcripts [5.6] 転写音声の言語アノテーションは、言語習得、言語障害、社会言語学の研究に不可欠である。
本研究では,Large Language Models (LLMs) がマンダリン音声における物語のマクロ構造を確実に注釈できるかどうかを評価する。
論文参考訳(メタデータ) (Sun, 17 May 2026 00:37:25 GMT)
Scalable Bi-causal Optimal Transport via KL Relaxation and Policy Gradients [5.5] 双方向最適輸送(bi-causal optimal transport、OT)は、予期しない情報制約下でのプロセスの比較と結合のためのフレームワークである。
両因果OTに対するスケーラブルな計算手法を開発し、予期しない情報制約が必須となる環境で適用性を広げる。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:41:01 GMT)
TriOpt: A Scalable Algorithm for Linear Causal Discovery [5.2] 順序付け法と最適化法を密に統合した線形因果発見のための新しい定式化を導入する。
我々は,TriOptが高次元状態における最先端の線形因果探索法よりも高次精度を実現していることを示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:07:27 GMT)
Stability and Discretization Error of State Space Model Neural Operators [5.1] ニューラル演算子の近似スキームの離散化誤差と安定性に関する理論的保証を確立する。
これらの境界は、状態空間モデルに基づくニューラル演算子の特定のケースに導かれる。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:14:54 GMT)
KamonBench: A Grammar-Based Dataset for Evaluating Compositional Factor Recovery in Vision-Language Models [5.0] 家紋は日本の文化の重要な部分であり、作曲視覚の自然なテストケースである。
カモンベンチ(KamonBench)は、文法に基づく2万の合成合成クレストと補助成分のサンプルを持つ画像構造ベンチマークである。
論文参考訳(メタデータ) (Sun, 17 May 2026 01:47:06 GMT)
When a Zero-Shooter Cheats: Improving Age Estimation via Activation Steering [4.9] 視覚言語モデル(VLM)は、人物を識別し、記憶された知識から年齢を推定する傾向がある。
この現象は、非有名人が有名人と誤認された場合に、かなり誤った予測をもたらす。
本稿では,VLMの隠れ状態に介入してショートカットを抑制するアクティベーションステアリング手法を提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 21:20:36 GMT)
You Can't Fool Us: Understanding the Resilience of LLM-driven Agent Communities to Misinformation [4.7] 政治的イデオロギーとオープンな思考が,信頼できる誤報にどう反応するかを考察する。
高いAOTは,信頼ピーク後の誤情報の取り込みと回復に対する抵抗性を向上することがわかった。
PIは回復経路を形成し、イデオロギー的に穏健なコミュニティはより確実に回復し、偏極化されたコミュニティはより残留的なサポートを維持します。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:45:33 GMT)
Experimental observation of entropic-singularity-induced nonadditive quantum communication in a qutrit platypus channel [4.7] チャネル容量の非付加性は、古典的な通信と量子通信を区別する決定的な特徴である。
本稿では,フォトニックプラットフォーム上に実装されたqutrit platypusチャネルを用いて,エントロピー特異性によるコヒーレント情報非付加性を実験的に観察した。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:31:34 GMT)
TClone: Low-Latency Forking of Live GUI Environments for Computer-Use Agents [4.5] コンピュータ利用エージェントのためのフォーク可能なパーソナルシステムであるTCloneを提案する。
TCloneは、ライブGUIワークスペースをスナップショット化し、独立したブランチにフォークし、ロールバックし、選択的にコミットまたはマージすることを可能にする。
エンドツーエンドのエージェントループ測定において、TCloneは、KVMとCRIUの合計タスクレイテンシを1.9倍、1.5倍削減します。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:24:01 GMT)
Bridging the Gap on AI-Assisted Scientific Software Development Through Transparency and Traceability [4.5] 研究者はすでに、大規模な言語モデルを使用して、コードを書き、テストケースを生成し、ドキュメントをドラフトしています。
このAIの使用は、科学ソフトウェアの品質に対する体系的なリスクを表している。
本稿では,厳密なソフトウェア品質保証の文脈におけるAI支援コード開発のためのガイダンスを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:08:52 GMT)
Teachers' Vocal Expressions and Student Engagement in Asynchronous Video Learning [4.4] 大規模なオープンオンラインコース(MOOC)を含む非同期ビデオ学習は、柔軟性を提供するが、しばしば生徒の愛情的なエンゲージメントを欠いている。
本研究では,教師の言語的・非言語的音声的感情表現が,生徒の自己申告された感情的エンゲージメントにどのように影響するかを検討する。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:06:23 GMT)
Mono-Hydra++: Real-Time Monocular Scene Graph Construction with Multi-Task Learning for 3D Indoor Mapping [4.3] 室内のメカニカルセマンティックマッピングと階層的な3Dシーングラフ構築のためのリアルタイム単眼RGBとIMUパイプラインであるMono-Hydra++を提案する。
Mono-Hydra++は、アクティブな深度センサーに頼ることなく、リソース制約のあるロボットプラットフォームに対してリアルタイムなメトリックセマンティックマッピングとシーングラフ構築を提供する。
論文参考訳(メタデータ) (Sun, 17 May 2026 21:36:29 GMT)
Towards Zero Trust Architecture: A Pilot Study on Information Systems Security Readiness amongst Small and Medium Enterprises [4.2] 中小企業(中小企業)はサイバー脅威の増大に直面しているが、ゼロ・トラスト・アーキテクチャー(ZTA)を採用するために必要なリソースや専門知識が不足していることが多い。
本研究は,ZTAの必要性に対する中小企業の認識を形作るドライバとバリアについて検討し,探索段階の採用経路を提案する。
アジア太平洋地域の64人のIT専門家とセキュリティ専門家による調査データによると、ZTAの習熟度とクラウドコンピューティングの必要性は、認識される必要性の最も肯定的な相関関係である。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:02:21 GMT)
Multi-Party Multi-Objective Optimization as Consensus Search: Runtime Analysis of Cross-Party Recombination [4.1] マルチパーティ多目的最適化問題(MPMOP)は、自律的な意思決定者の間で合意を必要とする。
2つの代表的設定における相互組換えについて検討する。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:53:20 GMT)
Spatial Blindness in Whole-Slide Multiple Instance Learning [4.0] 全スライディングのMILモデルは、グラフ、Transform ers、あるいは状態空間モジュールがパッチの埋め込みの上に置かれると、しばしばコンテキスト認識と呼ばれる。
組織構造が診断信号の一部である病理タスクでは、パッチ座標が置換された後、いくつかの強力なMILベースラインがほとんど変化のないスライドレベルAUCを維持している。
厳密な外見統計はスライドレベルの監督下で早期に学習され、疎空間関係の弱い勾配を残している。
9つのWSIベンチマークにまたがって、ResTopoMILは1.15Mパラメータによる分類と生存予測を改善し、摂動を調整する感度を回復し、より強い位置を与える。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:47:41 GMT)
GCE-MIL: Faithful and Recoverable Evidence for Multiple Instance Learning in Whole-Slide Imaging [4.0] 多重インスタンス学習(MIL)は,WSI分類と生存予測の標準手法である。
GCE-MILは3つのインジェクションモードと3つのエビデンスコンポーネントによって実装されたバックボーンに依存しないラッパーである。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:56:30 GMT)
Beyond Linear Superposition: Discovering Climate Features in AI Weather Models with KAN-SAE [4.0] 我々はKolmogorov-Arnold Networks (KANs) から得られた学習可能なB-splineアクティベーションを持つスパースオートエンコーダであるkan-SAEを紹介する。
この結果から,ディープラーニング天気予報モデルの機械論的解釈には非線形アクティベーションが不可欠であることが示唆された。
論文参考訳(メタデータ) (Sun, 17 May 2026 15:04:15 GMT)
RAG-based EEG-to-Text Translation Using Deep Learning and LLMs [4.0] 本稿では,検索強化生成(RAG)に基づく文レベルEEG-to-textデコーディングパイプラインを提案する。
Zurich Cognitive Language Processing Corpusデータセットで実験が行われる。
論文参考訳(メタデータ) (Sun, 17 May 2026 15:31:30 GMT)
Ablating Safety: Mechanisms for Removing Alignment in Language Models for Security Applications [3.9] 安全に配慮した言語モデルは、言葉が誤用に似ているサイバーセキュリティ要求を拒否することが多い。
これはセキュリティ評価を曖昧なものにする: 失敗した答えは、能力の欠如や、政治介入の拒絶を反映しているかもしれない。
我々は, 拒否, 試行率, 検証済みセキュリティ成功, 一般能力維持, 不安定性, スコープ外不安全コンプライアンスをSecurity-ARで評価した。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:18:20 GMT)
Generating Realistic Safety-Critical Scenarios for Vehicle-Pedestrian Interactions [3.9] 本研究では,大規模に行動的に現実的な安全クリティカルなシナリオを生成するための3段階のフレームワークを提案する。
ステージ1は、現実世界の安全クリティカルなデータに基づいて、マルチエージェント状態空間トランスフォーマー強化DDPGエージェントを事前訓練し、人間のようなインタラクティブな回避行動を学ぶ。
ステージ2では、CARLAでトレーニング済みのマルチエージェントをデプロイして、オンライン強化学習を使用して、さまざまなシナリオを一般化する。
ステージ3では、改良されたモデルでCARLAを使用して、8つの交差点シナリオから198,000以上の高解像度の対話エピソードを生成する。
論文参考訳(メタデータ) (Sun, 17 May 2026 02:30:02 GMT)
Mechanism Plausibility in Generative Agent-Based Modeling [3.8] 大規模言語モデル(LLM)は、明示的にプログラムされた規則なしで高レベルの多様な現象を生成することができる。
近年の研究では、ソーシャルメディアプラットフォーム上での人間の行動や、ゲーム理論のシナリオにおけるエイリアンの行動など、興味のあるさまざまな現象を発生させる能力について研究している。
我々は,現代科学哲学を取り入れたLLM-ABMに関する最近の研究を,4段階の「楽観性」の定義を運用するために用いている。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:34:27 GMT)
Human-Flow Digital Twin for Predicting the Effects of Mobility Introduction on Visitor Circulation [3.8] 本研究では,人流デジタルツインを用いた移動性導入対策の効果を予測する枠組みを提案する。
このデジタルツインにはマルチエージェントシミュレータが組み込まれており、現在位置やスポットの魅力といった要因に応じて、訪問者が目的地を選択する方法を示すことができる。
和歌山城公園内における移動性を考慮した人流データを用いて,本手法の評価を行った。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:43:14 GMT)
Radial-Angular Geometry for Reliable Update Diagnosis in Noisy-Label Learning [3.7] 本報告では, 信頼性評価をラベル更新の診断として再放送する。
相対幾何学的衝突(Relative Geometric Conflict)は、大きなが整列したハードクリーンな更新と、破損したラベルによる大きな競合する更新を区別するのに役立つ。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:50:16 GMT)
Artificial Intelligence can Recognize Whether a Job Applicant is Selling and/or Lying According to Facial Expressions and Head Movements Much More Correctly Than Human Interviewers [3.4] コンピュータビジョンによる深層学習モデルを構築し,求職者の表情や頭の動きの時間的パターンを抽出した。
提案モデルでは, 正直なIMでは91%, 虚偽IMでは84%のばらつきが説明され, 自己申告したIMスコアと人間面接者との相関が強くなった。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:03:08 GMT)
Multimodal Cultural Heritage Knowledge Graph Extension with Language and Vision Models [3.3] 本稿では,フランスの文化遺産分野であるWJocondeに新たな知識グラフを導入する。
マルチモーダルアプローチを用いた文化遺産知識グラフの拡張のための新しい枠組みを提案する。
その結果,文化遺産データにリッチテキストと画像情報を統合することで,KGの信頼性を高めることができることがわかった。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:02:35 GMT)
Systematic Evaluation of Vision Transformers for Automated Cervical Cancer Classification: Optimization, Statistical Validation, and Clinical Interpretability [3.1] Herlevデータセット(画像917枚、正常242枚、異常675枚)は、ViT-Tinyを最適化するために使用された。
最適構成は94.9%-95.2%のクロスバリデーション精度を達成した。
論文参考訳(メタデータ) (Sun, 17 May 2026 03:16:28 GMT)
Memory-Guided Tree Search with Cross-Branch Knowledge Transfer for LLM Solver Synthesis [3.1] メモリ誘導型ツリー検索フレームワークであるMEMOIRを2レベルメモリ階層で導入する。
組合せ最適化の7つの問題の中で、MEMOIRは96.7%の解の有効性を達成している。
MeMOIRのラン・トゥ・ランの妥当性標準偏差は、評価したベースライン毎の1桁以下である。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:47:31 GMT)
Triple-Hoisted Baby-Step Giant-Step Linear Transformation over CKKS Homomorphic Encryption and Hardware Accelerator [3.1] ホモモルフィック暗号化(HE)は、プライバシ保護のクラウドコンピューティングには不可欠である。
線形変換は、大きな言語モデルを含むニューラルネットワークで広く使われている。
本稿では, CKKS HE評価に必要な暗号文の回転回数を大幅に削減するために, ベビーステップを分解する3重ホスティング・ベビーステップ・ジャイアントステップアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 01:57:35 GMT)
IVF-TQ: Streaming-Robust Approximate Nearest Neighbor Search via a Codebook-Free Residual Layer [3.0] コードブックのない残留層を持つIVF指数:固定ランダム回転に続いて、予備計算されたロイド-マックススカラー量子化。
IVF-TQはトレーニング済みのANNインデックス(PQ、OPQ、ScaNN)のキー障害モードを大幅に削減する。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:22:49 GMT)
Progressive Generalization Augmentation with Deeply Coupled RND-PPO and Domain-Prioritized Noise Injection for Robust Crop Management Reinforcement Learning [3.0] 本稿では,農業用RLシステムの実用的展開を妨げる3つの限界に対処する。
本稿では,3段階のカリキュラムを実装したPGA(Progressive Generalization Augmentation),デュアルチャネルGAE正規化を伴うRND-PPOアーキテクチャ,プログレッシブデケイド内在係数,セマンティックディフレティゼーション,階層的アクティベーションを伴うドメイン優先ノイズインジェクションの3つを紹介する。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:48:47 GMT)
Coherence-Enhanced Quantum Battery Charging with Ergotropy Stabilization [2.9] 量子電池は、古典的な熱力学限界を超える充電速度とエネルギー貯蔵性能を達成する。
エルゴトロピーを安定させるために暗黒状態保護を利用する二重チャネルコヒーレンスフレームワークを提案する。
これらの結果は、量子アーキテクチャにおける高出力で安定なエネルギー貯蔵のための堅牢な経路を提供する。
論文参考訳(メタデータ) (Sun, 17 May 2026 23:46:05 GMT)
Prediction of Challenging Behaviors Associated with Profound Autism in a Classroom Setting Using Wearable Sensors [2.6] 自閉症スペクトラム障害(ASD)は、社会的相互作用とコミュニケーションに関する課題によって特徴づけられる。
ASDを持つ子供の約4分の1は、重篤な自閉症に分類される。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:22:48 GMT)
Longwang: Zero-Shot Global Spatiotemporal Precipitation Downscaling with a Latent Generative Prior [2.6] Longwangは、グローバルな降水学習のためのゼロショット遅延生成フレームワークである。
微細な空間パターンを再構築し、時間的コヒーレンスを保ち、極端な降雨を回復する。
さらに、実質的な分布シフトの下で、歴史的な気候シミュレーションと将来の気候予測を一般化する。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:01:47 GMT)
Building Resilience to Misinformation: A Cross-National Development of the Digital Media and Information Literacy Scale (DMILS) [2.5] 本稿では,デジタルメディア・情報リテラシー尺度(DMILS)を策定する。
ドメイン(デジタル対情報/ニュース)、能力タイプ(知識対スキル)を区別し、主観的かつ客観的な項目によって測定される、堅牢で多次元的な尺度である。
擬似だが多次元のヤードスティックを提供することにより、DMILSはメディアリテラシー介入の厳密な評価を可能にする。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:09:16 GMT)
Counterfactual Explanations Under Concept Drift [2.5] 本稿では,局所サンプリングを用いて既存のCFEを修復し,妥当性と妥当性を推定する,軽量でモデルに依存しない更新手法を提案する。
合成漂流流の実験では、CFEが生成したCFEの有効性が急速に低下する一方、維持されたCFEは繰り返し再生よりも低コストで有効性と局所的可視性を維持することが示されている。
論文参考訳(メタデータ) (Sun, 17 May 2026 21:05:55 GMT)
TouchMap-OR: Multi-View 3D Mapping of Hand-Surface Contacts [2.4] TouchMap-ORは、臨床医、手形状、および臨床環境の意味的構造をモデル化し、いつどこで接触が起こるかを予測するビジョンシステムである。
操作室のセマンティック3Dモデルは多視点セグメンテーションと深度融合によって構築される。
TouchMap-ORは0.75のバイナリコンタクトF1を達成し、トラッキングベースのベースラインを上回り、同等のマルチパーソントラッキング精度を維持し、0.96のID属性精度を達成している。
論文参考訳(メタデータ) (Sun, 17 May 2026 20:09:26 GMT)
Predicting 3D structure by latent posterior sampling [2.3] 本研究では,NeRFに基づく3次元シーンの表現と,拡散モデルを用いた確率的モデリングと推論を組み合わせた手法を提案する。
提案手法は,各タスクに係わる様々な不確実性のレベルをモデル化できることを示す。
実験により, 様々な種類の観測から3次元構造を正確に予測できる包括的手法が得られた。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:40:08 GMT)
Rethinking Code Review in the Age of AI: A Vision for Agentic Code Review [2.3] 本稿では,AIを利用したコードレビューワークフローの構想について述べる。
信頼性、バイアス、プライバシー、自動化バイアス、透明性、評価など、責任ある採用に対する大きなオープンな課題を特定します。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:04:21 GMT)
Deepfake Detection in Social Media: A Temporal Artifact Analysis Using 3D Convolutional Neural Networks [2.2] フレームレベルのディープフェイク検出器は、発電機の品質が向上するにつれて急激に劣化する。
高品質の128x128 GAN出力は、空間のみの精度を5ポイント削減する。
R3D-18に基づく3次元畳み込みニューラルネットワーク検出器を用いて,このギャップを解消する。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:01:32 GMT)
RAW: Robust Avatar Watermarking -- Benchmarking and Baseline [1.7] textbfWALT (Watermarking Avatars with Learned Textures) は3次元顔再構成によって紫外線テクスチャ空間に透かしを埋め込む。
textbfWALTは、バックグラウンド削除(95.6%)の強いパフォーマンスを維持しながら、ズーム攻撃(92.4%)の最高ロバスト性を達成する
論文参考訳(メタデータ) (Sun, 17 May 2026 23:01:39 GMT)
Venom: A PyTorch Generative Modeling Toolkit [1.7] V ENOMは、統一されたMNISTファーストインタフェースの下で、代表的な生成モデリングファミリを実装している。
このパッケージには、拡散とスコアに基づくモデル、フローマッチングとワンステップジェネレータ、変分オートエンコーダ、正規化フロー、生成的敵ネットワーク、エネルギーベースのモデルが含まれている。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:06:46 GMT)
From Fundamental Dynamics to Applied Cryptography: Studies on the Quantum Speed Limit and Fully Passive Quantum Key Distribution [1.6] この論文は、2つの異なる量子情報処理のフロンティアを研究する。
動的進化の基本的な物理的限界とセキュアな量子通信ネットワークの実現について研究した。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:33:44 GMT)
QQJ: Quantifying Qualitative Judgment for Scalable and Human-Aligned Evaluation of Generative AI [1.6] 質的判断の定量化(QQJ)はスケーラブルで人中心的な評価フレームワークである。
QQJは、専門家が設計した多次元ルーブリックの評価をアンカーすることで、品質の定義をその実行から分離する。
テキストと画像生成に関する大規模な実験は、QQJが人間の判断とかなり強く一致していることを示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:53:43 GMT)
Accelerating Redshift-Conditioned Galaxy Image Synthesis with One-step Generative Modeling [1.5] 拡散モデルと画素・メアンフローを用いた天体物理画像合成のための効率的な赤方偏移条件生成モデルについて検討した。
我々はGalaxiesML-64データセット上でDDPM,DDIM,DEIS-AB2,DPM++2M,ワンステップピクセル平均フローを評価した。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:00:39 GMT)
Q-LocalAdam: Memory-Efficient Client-Side Adaptive Optimization for Edge Federated Learning [1.5] エッジデバイス上でのフェデレーション学習は、IID以外のクライアントデータと厳しいメモリ予算に対処する必要がある。
分散を意識した8ビット量子化ブロックワイド線形符号化と分散のためのログ空間符号化を応用したtextbfQ-LocalAdam を提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:23:23 GMT)
Residual Semantic Decomposition of Word Embeddings [1.3] 本稿では,単語埋め込みの神経付加的分解であるResidual Semantic Decomposition (RSD)を紹介する。
手動で指定したあいまいな単語に対するペアコンテキスト診断では、RSDはシャッフルラベル制御上の供給コンテキストアンカーを分離するが、エントロピー診断は、あいまいなターゲットが静的GloVeの均一に高エントロピー境界点ではないことを示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:44:13 GMT)
Analyzing Error Propagation in Korean Spoken QA with ASR-LLM Cascades [1.3] 韓国語音声質問応答(SQA)におけるASR-LLMカスケードによる自動音声認識(ASR)誤差の伝播について解析する。
解析の結果, ASR誤差による下流の相対的な劣化は, 絶対性能の異なるLLM間で一致していることがわかった。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:29:15 GMT)
Filter-then-Verify: A Multiphase GNN and ModernBERT Framework for Social Engineering Detection in Email Networks [1.2] 社会工学の攻撃は、ソフトウェア脆弱性よりも人間の信頼を悪用する。
本稿では,コンテンツ検証のための構造化異常検出と協調アテンション型ModernBERTモデルを組み合わせた2段階のフィルタ列検証フレームワークを提案する。
本研究では,BERT改質後の構造フィルタリングにおいて86%のリコール,92%以上の精度を実現していることを示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 00:04:08 GMT)
Attractor-Vascular Coupling Theory: Formal Grounding and Empirical Validation for AAMI-Standard Cuffless Blood Pressure Estimation from Smartphone Photoplethysmography [1.1] AAMI標準推定に十分な血圧情報を符号化している。
Takens遅延埋め込みとアトラクタ形態抽出を用いて操作する。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:50:48 GMT)
LITE-SOC: Lightweight Security Operations Center Simulator for Cybersecurity Education [1.0] LITE-SOCは、インストラクター主導のサイバーセキュリティ教育用に設計された軽量Webベースのセキュリティオペレーションセンター(SOC)シミュレータである。
プラットフォームは合成SOCイベントの連続ストリームを生成し、可視化ツール、イベントアノテーション、地域ベースのチャットを備えた個別の学生およびインストラクタービューを提供する。
目的は、学生に完全なSOC環境を必要とせず、トリアージ、優先順位付け、意思決定としてSOCを実践的に導入することである。
論文参考訳(メタデータ) (Sun, 17 May 2026 23:57:30 GMT)
Module Lattice Security (Part IV): Probabilistic Polynomial Quantum Attack on Module-LWE over 2-Power Cyclotomics [1.0] ML-KEMと関連する2パワーサイクロトミック格子スキームに対する量子攻撃を提案する。
解析をFalcon, Hawk, NTRU-HPS, NTRU-HRSSに拡張する。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:16:04 GMT)
Module Lattice Security (Part III): Structured CVP Distance on the Log-Unit Lattice [1.0] ランダム短環要素から対数単位格子への$L2$CVP距離が$frac2sqrt6sqrtn$ as $n=2k-1toinfty$に収束することを示す。
Linfty$ノルムに対して、$n$以下のガウス座標の最大値は$O(sqrtlog n)$となり、短発生問題に対する多項式近似係数に変換される。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:00:59 GMT)
Targeted Tests for LLM Reasoning: An Audit-Constrained Protocol [1.0] 対象推論評価のための監査制約付きプロトコルを提案する。
楽譜に基づく決定型サンプリングであるCAPS(Component Prompt Smpling)をプロンプトコンポーネント上でインスタンス化し、等予算の均一なコンポーネントサンプリングと比較する。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:59:58 GMT)
Prediction Model of Motivators and Demotivators of Integrating Large Language Models in Software Engineering Education: An Empirical Study [1.0] 大規模言語モデル(LLM)は、ソフトウェアエンジニアリングの実践と教育にますます影響を与えています。
本研究は,LLMをソフトウェア工学教育に組み込むための費用対効果戦略の予測モデルを開発し,検証する。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:16:34 GMT)
The Silent Brush: Evaluating Artistic Style Leakage in AI Art Generation [0.9] 重要な問題は、モデルがスタイルパターンを学習し、プロンプトに明示的に参照することなく、生成した出力でそれらを再現できることである。
我々はこの現象を『The Silent Brush』と呼び、そのような学習スタイルが要求されていなくても再び現れる。
私たちはArt Arenaを紹介します。Art Arenaは、アートワークのエンコード方法、インタラクションの方法、そして、そのスタイル特性が生成した出力に再現れる頻度を測定する評価プロトコルです。
論文参考訳(メタデータ) (Sun, 17 May 2026 15:18:49 GMT)
Few-Shot Network Intrusion Detection Using Online Triplet Mining [0.8] 最先端のアプローチでは、監視された機械学習手法を使用して、既知のサイバー攻撃を認識するために分類モデルをトレーニングする。
これらのモデルは、小さなデータセットでトレーニングされた場合、トレーニングとパフォーマンスの低下を示すために、大きなラベル付きデータセットを必要とする。
本研究は,オンライントリプルトマイニングを利用したトリプルトネットワークと,数発の分類が可能なKNN分類器を提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:30:06 GMT)
Assisted quantum teleportation [0.7] 本稿では,従来の$AB$レジスタ上の完全ベル対を復元するために,サードパーティが補助的多部絡み合わせを供給している量子テレポーテーションの枠組みを紹介する。
決定論的復元のための明示的な実現可能性領域を導出し, W 資源に対する運用上の不等式を示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:38:52 GMT)
Event-Grounded Sparse Autoencoders for Vision-Language-Action Policies [0.7] 本研究では,SAE特徴解析をテキストコンテキストではなく行動イベントにアンカーする,イベントグラウンドの解釈可能性パイプラインを提案する。
我々のパイプラインは、クローズドループの挙動イベントにおいて、SAEベースのVLA分析を基礎とした最初のものの一つである。
全体として、事象基底SAE分析は、行動適応型VLA解釈の実践的な出発点として現れる。
論文参考訳(メタデータ) (Sun, 17 May 2026 00:20:17 GMT)
Quantification of atmospheric carbon dioxide from the Geostationary Operational Environmental Satellite (GOES East) [0.6] 現在の宇宙ベースのセンサーは、空間と時間におけるスパースな観測しか提供していない。
この課題は、地球規模の温室効果ガスの変動を推定するための既存のミッションのデータ利用への関心を喚起した。
我々は,乾燥気柱のCO$モル分率(XCO$)を推定する単一ピクセル物理誘導型ニューラルネットワークを開発した。
また,都市部におけるXCO$の拡充と農業地域の縮小を観察するために,モデルを用いたケーススタディも提示した。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:27:17 GMT)
Attention-Guided Fusion of 1D and 2D CNNs for Robust ECG-Based Biometric Recognition [0.6] 心電図(ECG)に基づく生体認証は、安全な認証と生存度検出のための有望なソリューションとして浮上している。
既存のほとんどの手法は、一次元(1D)時間信号または2次元(2D)時間周波数表現を独立に処理する、一様深層学習アーキテクチャに依存している。
本稿では,1次元および2次元畳み込みニューラルネットワーク(CNN)をエンドツーエンドアーキテクチャに統合したハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:56:10 GMT)
LLMForge: Multi-Backend Hardware-Aware Neural Architecture Search with Infinite-Head Attention for Edge Language Models [0.6] LLMForgeはハードウェア対応のニューラルアーキテクチャ検索フレームワークである。
Infinite-Head Attention (IHA)は、クエリヘッド数、KVグループ、ヘッド毎のクエリ/キーと値次元を分離する。
Forge-Formerはアーキテクチャベースのベンチマークパフォーマンスを上回っている。
論文参考訳(メタデータ) (Sun, 17 May 2026 21:10:54 GMT)
Enhancing Malware Detection with Generative AI: Using Variational Autoencoders to Boost Machine Learning Classifiers' Performance [0.5] 本稿では,生成人工知能モデルを用いたマルウェア検出手法を提案する。
提案手法は、VAEを用いて、現実世界のマルウェアデータを忠実に模倣する高品質な多様な合成データセットを作成する。
その結果,拡張データセットを用いてトレーニングした場合,分類器の精度,精度,リコール,F1スコアが顕著に改善された。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:14:31 GMT)
Integrating Bayesian Spectral Deconvolution and Expert Scientific Reasoning for Robust Peak Estimation [0.5] スペクトルデコンボリューションを専門的な科学的推論と統合する枠組みを提案する。
我々は、高強度ノイズや未知の背景を持つ合成スペクトルを用いて、その枠組みを検証する。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:03:13 GMT)
Monocular Depth Perception Enhancement Based on Joint Shading/Contrast Model and Motion Parallax (JSM) [0.5] 提案フレームワークは,従来の2次元表示装置の奥行き認識を向上するだけでなく,3次元表示装置にも適用可能である。
質的評価,アブレーション研究,主観的ユーザ評価は,提案フレームワークの利点と実践性を示した。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:19:31 GMT)
Towards an Ontology for the Foundations of Software Languages [0.3] ソフトウェア言語の基礎 (Software Languages) は、コンピュータサイエンス教育における知識資源である。
GenAIを活用してエンジニアリング(発見、分類、リンク、完了、変換)を支援しました。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:30:56 GMT)
Causal Intervention-Based Memory Selection for Long-Horizon LLM Agents [0.3] 制御された介入の下で,候補記憶がモデル応答に与える影響を推定する因果記憶選択手法を提案する。
以上の結果から,CMIは,信頼性の高い長期記憶には関連性のみではなく,因果的有用性に基づくコンテキスト選択が必要であることが示唆された。
論文参考訳(メタデータ) (Sun, 17 May 2026 20:21:55 GMT)
Auditing Reasoning-Trace Memorization Claims after Unlearning with Head-Conditioned Canaries [0.3] We audit a reading on DeepSeek-R1-Distill-Qwen-7B with LoRA-memorized fictional authors and NPO unlearning。
標準的な監査と並んで、安価な衛生チェックとしてデコード時テンプレートスワップを推奨する。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:22:27 GMT)
Disarranged Harmonization of Transparency Reporting by Social Media Platforms Under the Digital Services Act [0.3] 欧州委員会はデジタルサービス法(DSA)に基づき、大規模なオンラインプラットフォームの透明性レポートを調和させる新しい規制を導入した。
ここでは,欧州連合の8大ソーシャルメディアプラットフォームを対象とした,透明性レポートデータ品質に関する最初の体系的評価について述べる。
論文参考訳(メタデータ) (Sun, 17 May 2026 21:12:20 GMT)
Task Capability Improvement Algorithm for Collaborative Manipulators [0.3] この研究は、追加のモーメントを利用した協調作業能力の向上を導入している。
マニピュレータは物体のつかみ点に力を加え、物体の重心以外の点に力を加えると、望ましくない瞬間が生じる。
シミュレーションの結果, マニピュレータの能力向上にモーメントを用いない場合と比較して5.86 %の性能向上が見られた。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:13:51 GMT)
Reframing preprocessing selection as model-internal calibration in near-infrared spectroscopy: A large-scale benchmark of operator-adaptive PLS and Ridge models [0.3] 本稿では,探索を1つのキャリブレーションステップに分解できる事例について検討する。
線形演算子適応キャリブレーションは、徹底的な前処理スクリーニングに匹敵する予測品質を与える。
論文参考訳(メタデータ) (Sun, 17 May 2026 21:50:39 GMT)
A Conditional U-Net Pipeline with Pre- and Post-Processing for Aerial RGB-to-Thermal Image Translation [0.2] 本稿では,気象データをボトルネック層に組み込んだ条件付きU-Netを提案する。
我々は、612対のRGBと熱画像のトレーニングセットを使用し、5倍以上のクロスバリデーションを評価し、最終的にホールドアウトテストセットでテストする。
条件付きU-Netモデルは,ピーク信号対雑音比14.5485,構造類似度指標(SSIM)0.8095,知覚的画像パッチ類似度(LPIPS)0.1666で最高の性能を示した。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:49:01 GMT)
Deep learning-based compression of giga-resolution whole slide images [0.2] ガラス除去法と深層学習圧縮法のための深層学習型組織分割法について検討した。
ディープラーニングベースの画像圧縮は、JPEG圧縮と比較して、WSIサイズを43-72%削減した。
ディープラーニングモデルはJPEGやJPEG-XLよりも圧縮時間が高い。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:02:02 GMT)
Explicit cost analysis of Toom-4 multiplication for incomplete NTT in lattice-based cryptography [0.1] 格子ベースの暗号では、多項式乗法が基本である。
本稿では,具体的なToom-4の実装と,係数場上の加算/減算と乗算を分離する明示的な演算数の導出について述べる。
論文参考訳(メタデータ) (Sun, 17 May 2026 15:34:27 GMT)
Bayesian-Monte Carlo Schedule Updating for Construction Digital Twins: A Probabilistic Framework for Dynamic Project Forecasting [0.1] 建設プロジェクトは、労働生産性の変動、資材利用率、気象条件、プロジェクトの調整などによるスケジュールの遅れや不確実性をしばしば経験する。
CPM(Critical Path Method)のような従来の決定論的スケジューリング手法は、一定の活動期間を仮定するので、動的プロジェクトの不確実性を適切に表現することはできない。
本研究では, ベイジアン・モンテ・カルロ確率的スケジュール更新フレームワークについて述べる。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:09:37 GMT)
A simple approach for biometrics: Finger-knuckle prints recognition based on a Sobel filter and similarity measures [0.1] 本研究の目的は,指先認識のための新しい手法を提案することである。
我々は、エッジを見つけるために、Sobel演算子に基づくフィルタのような、ビジュアルコンピューティングの非常に単純な概念を採用してきた。
我々は、大きなデータセットで成功した認識の最大17.02%を得ました。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:06:28 GMT)
Beyond Predefined Learning Objects: A Thinking-Learning Interaction Model for Up-to-Date Autonomous Robot Learning [0.1] 本稿では,自律型ロボットのための思考学習インタラクションモデルを提案する。
適応的な入力特徴発見、出力カテゴリ拡張、学習モデル更新、アクションルーチン再構築をサポートする。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:04:31 GMT)
Employing Vision-Language Models for Face Image Quality Assessment [0.0] 顔画像品質評価(FIQA)はバイオメトリックパイプラインにおいて重要な制御ステップである。
最先端のFIQA法は高い実用性を達成するが、通常「ブラックボックス」として機能する
ゼロショット環境でFIQAを実行することにより,このギャップを埋めるため,市販のビジョンランゲージモデル(VLM)の可能性を検討する。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:57:52 GMT)
WriteSAE: Sparse Autoencoders for Recurrent State [0.0] 本稿では,ステートスペースおよびリカレント言語モデルの行列キャッシュ書き込みを分解・編集する最初のスパースオートエンコーダWriteSAEを紹介する。
既存のSAEは残余ストリームを読み取るが、Gated DeltaNet、Mamba-2、RWKV-7はランク1更新を通じて$d_kのd_v$キャッシュに書き込む。
WriteSAEは、各デコーダ原子をネイティブ書き込み形式に分解し、トーケンごとのロジットシフトのクローズドフォームを公開し、マッチしたフロベニウス標準の下での列車は一度に1つのキャッシュスロットを交換する。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:51:51 GMT)
Where the Quantum Lives in D-Wave Hybrid Portfolio Optimization [0.0] 我々は、D-Waveのハイブリッド量子古典的ポートフォリオ最適化サービスが実際にどれだけ量子的であるかを監査する。
制約ネイティブのLeapHybridCQMサービスは、Gurobiが最適なことを証明している54のインスタンスすべてにおいて、Gurobiが証明した最適値と一致する。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:41:17 GMT)
Von Economo neurons enable reliable social skill acquisition in recurrent spiking neural networks: a computational account with clinical predictions [0.0] VENは前頭側頭型認知症(bvFTD)において選択的に消失し、自閉症スペクトラム条件(ASC)では減少する
我々は、繰り返しピラミッド回路にVEN様投射ニューロン(K=40, 2%)を埋め込んだスパイクニューラルネットワークを訓練する。
VEN-Intact Networksは49/50ケース(98%)に収束し、VEN-ablated Networksは35/50ケース(70%)に収束した。
論文参考訳(メタデータ) (Sun, 17 May 2026 11:39:58 GMT)
Validate Your Authority: Benchmarking LLMs on Multi-Label Precedent Treatment Classification [0.0] われわれは、239の現実世界の法的な引用を専門家が注釈付けしたデータセットに基づいて、最新のLarge Language Modelsをベンチマークした。
GoogleのGemini 2.5 Flashは、ハイレベルな分類タスクで最高の精度を達成した。
OpenAIのGPT-5-miniは、より複雑なきめ細かなスキーマでトップパフォーマーであった。
論文参考訳(メタデータ) (Sun, 17 May 2026 23:15:27 GMT)
Toward Near-Real-Time Marine Oil Spill Detection in SAR Imagery using Quantum-Assisted SVM [0.0] 海洋油流出は、生態系や経済の深刻な被害を迅速に検出する必要がある。
ディープラーニングモデルは、大規模なデータセットと高いレイテンシを必要とすることが多い。
本研究では,画素単位の量子支援型サポートベクトルマシンのバッキングアンサンブルを開発する。
論文参考訳(メタデータ) (Sun, 17 May 2026 01:28:10 GMT)
Topological Data Analysis combined with Machine Learning for Predicting Permeability of Porous Media [0.0] 多孔質媒体の流動は、その複雑さのため、標準的な解析法や数値法で対処することが困難である。
本稿では、そのようなデータから抽出できる多くの特徴と、入力変数としての利用性を、標準的な機械学習アルゴリズムに論じる。
これらの特徴には、多孔質媒体の幾何学を記述する構造測度、接続性を記述するトポロジカル測度、多孔質媒体を単純化された多孔質ネットワークとしてモデル化したネットワーク測度が含まれる。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:19:20 GMT)
Temporal Decay of Co-Citation Predictability: A 20-Year Statute Retrieval Benchmark from 396M Ukrainian Court Citations [0.0] 共励構造は法情報システムにおいて安定した検索信号を提供すると広く想定されている。
UA-StatuteRetrievalは20の年次スナップショットにまたがる共励予測可能性を測定するベンチマークである。
その結果,Adamic-Adar MRRは記事の固定セットで33%減少し,列車/テスト時分割で47%減少し,真の時相崩壊が確認された。
論文参考訳(メタデータ) (Sun, 17 May 2026 20:15:37 GMT)
Strain-free, symmetrical, InGaAs quantum dots as single photon emitters in the telecomC-band [0.0] 古典的でない光子源は、低損失で長距離のフォトニック量子通信ネットワークにとって重要な要素である。
GaAs(111)A基板上に成長した歪のないIn$_0.7$Ga$_0.3$As QDsを1550nm窓の単光子エミッタとして作製した。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:50:25 GMT)
Schedule-dependent basin occupation in a programmable quantum annealer [0.0] 周期的逆アニール下での後期サブシステム自己相関は、2つの平衡基準過程の間に厳密に位置する。
この結果は,装置の停止点ダイナミクスのマルコフチェーンプローブと,並列処理のファルシフィケーション・フレームワークという2つの材料を用いて得られる。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:02:21 GMT)
Scale-Equivariant Generative Forecasting: Weight-Tied Dilated Convolutions, Wavelet Scattering Inputs, and Spectral-Consistency Training for Self-Similar Time Series [0.0] 1次元因果ネットワークの離散スケール等式を正確に定義する。
ダイアディック拡張は、カーネル重みがレベル間で共有されるような拡張畳み込みスタックで可換であることが証明される。
30年間のS&P 500日間のログリターンで、SE-WaveNetのサンプルは、Allan-Varianceトップ25宇宙上での経験的なスケール・崩壊の診断を再現した。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:21:30 GMT)
Position: Age Estimation Models Do Not Process Biometric Data [0.0] 年齢推定モデルは個人を特定することができない。
我々は研究者に、システムストアとできることについて透明性を提供し、規制当局にテンプレートストレージと過渡的な処理を区別するよう呼びかけています。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:37:28 GMT)
PFlow-T: A Persistence-Driven Forward Process for Topology-Controlled Generation [0.0] 我々はPFlow Tを、その前方過程を完全に永続的ホモロジーに基づく生成モデルとして導入する。
PFlow T は前処理に永続的ホモロジーを用いた最初の生成アーキテクチャであるが、現時点では低分解能画素空間プロキシに制限されていることに留意する。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:34:24 GMT)
Ordered POVMs and Residual Collapse [0.0] POVMの順序付き実現は、逐次テストによって生成される残差変換によって研究される。
変換を反復すると、崩壊したPOVMが生成され、非エスケープ座標は、以前のすべてのテストで生き残る元のエフェクトの一部です。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:39:47 GMT)
On Applicability of Synthetic Datasets for Facial Expression Recognition [0.0] プライバシを保存するFERデータセットを構築するための3つの補完的戦略を,標準の7つの顔表情クラス設定で検討した。
提案手法は,<i>I</i> と<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I</i>,<i>I>I</i>,<i>I</i>,<i>H</i>,<i>H</i>,<i>I</i>,<i>H</i>,<i>,<i>,<i>I</i>,<i>,<i>I</i>,<i>,<i>I</i>,<i>,<i>,
論文参考訳(メタデータ) (Sun, 17 May 2026 14:51:27 GMT)
Noise scheduling and linear dynamics in diffusion models on Lie groups [0.0] 特定のノイズスケジュールが拡散時間の関数としてWilson作用の期待値の線形減衰につながることを示す。
これをユークリッド拡散モデルと比較すると、そのような振舞いは明示的に設計されたドリフト項を必要とするが、リー群設定では自然に現れる。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:34:31 GMT)
NewsLens: A Multi-Agent Framework for Adversarial News Bias Navigation [0.0] NewsLensは構造化ニュースバイアスナビゲーションのための5エージェントの逆パイプラインである。
A Fact Verifier, Progressive Framing Analyst, conservative Framing Analyst, Propaganda Detector, Neutral Summarizerは、記事の分解に協力している。
システムは4つの地政学的イベントクラスタにまたがる15の項目で評価される。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:14:48 GMT)
NeuSymMS: A Hybrid Neuro-Symbolic Memory System for Persistent, Self-Curating LLM Agents [0.0] NeuSymMSは、大規模言語モデル(LLM)エージェントがセッション間でユーザを学習、記憶、推論できる適応型メモリシステムである。
NeuSymMSは、構造化されていない対話から神経ファクト抽出をCLIPSベースのエキスパートシステムと結合し、明示的なライフサイクルルールの下で事実を分類、分離、調整する。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:48:19 GMT)
Mixture of Experts for Low-Resource LLMs [0.0] Mixture-of-Experts (MoE)アーキテクチャは効率的なモデルスケーリングを実現するが、未表現言語をまたいだ専門家のルーティング動作はあまり理解されていない。
アーキテクチャ的に異なる2つのMoEモデル(Qwen3-30B-A3B)とハイブリッドのMamba-Transformer(Nemotron-3-Nano-30B-A3B)のルーティングダイナミクスを、形態的にリッチで低リソースなテストベッドとしてHebrewを用いて解析する。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:50:50 GMT)
MiniGPT: Rebuilding GPT from First Principles [0.0] MiniGPTは、PyTorchにおけるGPTスタイルの自動回帰言語モデリングのコンパクトなオフスクラッチ実装である。
本稿では,文字レベルのトークン化を用いたTiny Shakespeareデータセットの実装について検討する。
論文参考訳(メタデータ) (Sun, 17 May 2026 11:32:07 GMT)
MagBridge-Battery: A Synthetic Bridge Dataset for Li-ion Magnetometry and State-of-Health Diagnostics [0.0] MagBridge-Batteryは6,760個の磁場シグネチャの合成データセットである。
これは、Mohammadi-Jerschow Open Science Frameworkアーカイブから実際の磁気形態学を、PulseBatデータセットからステート・オブ・ヘルス(SOH)ラベルでブリッジする。
データセットはCC-BY-4.0でZenodoでリリースされ、ブリッジコードとベンチマークスイートはApache-2.0でリリースされている。
論文参考訳(メタデータ) (Sun, 17 May 2026 21:39:03 GMT)
MUBs from bent functions [0.0] このノートには MUB の完全集合の簡単な構成が含まれている。
これは曲がった関数を使って、新しい基底ベクトルを標準基底の明示的な線型結合として記述する。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:45:43 GMT)
MSIQ: Moment-based Scale-Invariant Quality Measure for Single Image Super-Resolution [0.0] 本稿では,MSIQ(textitMoment-based Scale-Invariant Quality)を提案する。
2つの画像の正規化中心幾何モーメントの比較に基づいて、MSIQは数学的に決定論的(テクトモデルなし)であり、解析形式を持つ。
提案手法は,幾何学的忠実度が優先される領域,特に医用画像とリモートセンシングの診断ツールである。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:32:27 GMT)
Latency-Aware Deep Learning Benchmark for Real-Time Cyber-Physical Attack and Fault Classification in Inverter-Dominated Power Grids [0.0] 本研究では,電力系統異常検出におけるディープラーニングモデル評価のための遅延忠実度ベンチマークフレームワークを導入する。
8つのニューラルネットワークアーキテクチャは、ネットワーク内の物理的障害とサイバー攻撃の両方を表すストリーミングデータセットに対して、体系的に評価された。
その結果、アルゴリズム能力とプロテクショングレードのデプロイメントの間に重要なギャップが浮かび上がっている。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:57:30 GMT)
Large-Scale Quantum Kernels for Hyperspectral Data Classification [0.0] 本稿では,超スペクトルデータ分類のための有限量子カーネル支援ベクトルマシンの大規模研究について述べる。
我々は伝統的に量子モデルに関連する計算ボトルネックを克服し、量子ビット数の2次スケーリング O(n2) を達成する。
本稿では、カーネル帯域幅最適化の詳細な解析を行い、指数集中効果の緩和におけるその重要な役割を実証する。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:32:12 GMT)
Jurisdiction over Ubiquitous Copyright Infringements: Should Right-Holders Be Allowed to Sue at Home? [0.0] インターネット、そして最近ではクラウドコンピューティングは、知的財産権が活用される技術、経済、社会、文化の状況を変えてきた。
本稿では,クラウド環境におけるクロスボーダー著作権紛争に関して,裁判所が管轄権を主張すべき時期について検討する。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:17:02 GMT)
Integration of AI in Cybersecurity: Current Trends with a Focused Look at Intrusion Detection Applications [0.0] サイバーセキュリティへの統合は大きな注目を集めている。
現在のトレンドとしては、ジェネレーティブAI、自然言語処理、フェデレーションラーニングによるプライバシ保護コラボレーショントレーニングなどがある。
採用したAI技術と報告されたパフォーマンスに基づいて、比較分析を通じて意味のある洞察を明らかにすることを目指している。
論文参考訳(メタデータ) (Sun, 17 May 2026 01:44:23 GMT)
HyperPersona: A Multi-Level Hypergraph Framework for Text-Based Automatic Personality Prediction [0.0] テキストベースの自動パーソナリティ予測(APP)は、言語行動からパーソナリティを推測する。
ハイパーグラフ構造を通じてテキスト(文書,文,単語)の階層構造を明示的にモデル化するフレームワークであるHyperPersonaを提案する。
我々は,HyperPersonaがマルチレベル言語的手がかりを効果的に統合し,最先端のベースラインよりも優れた性能を実現していることを示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 09:49:06 GMT)
Hybrid Feature Combinations with CNN for Bangla Fake News Classification [0.0] バングラデシュの人々は、伝統的な新聞の代わりに毎日のニュースにインターネットやソーシャルメディアを頼りにしている。
これらのプラットフォームによる偽のバングラニュースの拡散は、真のメディアの信頼性にリスクと課題をもたらす。
本研究では,適切な特徴を特定するための特徴選択手法の有効性について検討する。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:42:46 GMT)
Hamiltonian-Inspired Attention Mechanism for Scalable RF Transmitter Fingerprinting [0.0] この研究は、各アテンションヘッド内の値のノルム保存を強制する物理インフォームドアテンションアーキテクチャであるハミルトニアン変換器を提案する。
実験では、WiSigデータセットからの非等化生I/Q信号を、同日分類、クロスレシーバの一般化、クロスデイの一般化、最大150台のデバイスにスケールアップする送信機という4つのプロトコルで使用する。
ハミルトニアン変圧器は、同一日の条件下で99.12%の精度、150の送信機で61.64%の精度を達成し、CNNとトランスフォーマーのベースラインを常に上回っている。
論文参考訳(メタデータ) (Sun, 17 May 2026 15:39:36 GMT)
Generalization or Memorization? Brittleness Testing for Chess-Trained Language Models [0.0] KinGPTは、(配置、最良の)ペアのみに基づいて訓練された文字レベルの言語モデルである。
LLM-Modulo が RedPajama 3B の最良の移動精度を 1.2% から 21.2% に引き上げる方法を示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:49:07 GMT)
Form and Function: Machine Unlearning as a Problem of Misaligned States [0.0] 我々は,オンラインL-BFGSの非学習を,対実的状態アライメント問題として定式化する。
パラメータエラー,メモリ操作エラー,結合状態エラー,更新方向エラーを計測する状態認識メトリクスを導入する。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:34:14 GMT)
Federated Stream-Processing and Latency-Gated Response for Cross-Sector Threat Detection and Collaborative Containment [0.0] 重要なインフラ防衛は、高度なサプライチェーンの妥協と盗まれた管理資格によって、予防的制御がしばしば回避されるという運用上の現実によってボトルネックになっている。
本稿では,協調したクロスセクタ脅威を検知し,機械の速度で封じ込めを編成する,新しい高スループットストリーム処理および相関フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 08:32:08 GMT)
FEG-Pro: Forecast-Error Growth Profiling for Finite-Horizon Instability Analysis of Nonlinear Time Series [0.0] 非線形スカラー時系列の予測エラー成長プロファイリングフレームワークであるFEG-Proを提案する。
本手法は, 自己相関誘導スパース履歴を構築し, 距離重み付きk-ネアレスト近傍のマルチホライゾン予測を行い, 幾何平均予測誤差の対数成長を解析する。
このパイプラインは、符号付き多重水平誤差から、形式的な適合選択規則、曲率、二次変形後の粗さ、単調性、予測エラー分布エントロピー(FEDE)も抽出する。
論文参考訳(メタデータ) (Sun, 17 May 2026 06:38:37 GMT)
Evaluating Deep Research Agents on Expert Consulting Work: A Benchmark with Verifiers, Rubrics, and Cognitive Traps [0.0] Frontier Deep Research Agent(DRA)は、研究タスクを計画し、文書を合成し、必要に応じて構造化された成果を返却する。
既存のベンチマークは、ファクトリコール、シングルホップQA、ジェネリックエージェントスキルを計測する。
私たちは、Web検索を備えたClaude Opus 4.6、OpenAI o3-deep-research、Google Gemini 3.1 Proの3つのフロンティアエージェントを、42の中小企業のプロンプトで評価しています。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:32:52 GMT)
Episodic-Semantic Memory Architecture for Long-Horizon Scientific Agents [0.0] 長期統合知識(約3トークン/メッセージ)から即時エピソードニーズ(インスタント10メッセージウィンドウ)を分離するデュアルプロセス記憶アーキテクチャを評価する。
より少ないトークン(45,434対12000以上の制限)で1-2秒のレイテンシで70~85%の精度を維持している。
連続記憶を保ちながら現実的な線形成長(約3トークン/メッセージ)を示す「最小から最小の」ギャップを同定する。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:44:24 GMT)
Emergent supersymmetry in a time-space inverted quantum mechanics [0.0] このレターは、超対称構造は時間空間反転(TSI)量子力学(QM)フレームワークに固有のものであり、そこで状態の進化は作用素 $hatmathcalPpm(hatmathcalH,hat t;q)=pmsqrt2m[hatmathcalH-mathcalhat V(q)]$ [href] によって生成される。
論文参考訳(メタデータ) (Sun, 17 May 2026 15:40:58 GMT)
EGI: A Multimodal Emotional AI Framework for Enhancing Scrum Master Real-time Self-Awareness [0.0] 本稿では,4つのAIモデルを統合して,スクラムマスタやミーティングオーガナイザの無意識的な感情を監視するアプリケーションを提案する。
このシステムは、シミュレーションミーティング環境でのASR単語誤り率WERを10%達成した。
論文参考訳(メタデータ) (Sun, 17 May 2026 22:55:20 GMT)
DynGhost: Temporally-Modelled Transformer for Dynamic Ghost Imaging with Quantum Detectors [0.0] ゴーストイメージングは、構造的照明パターンとスカラー強度の測定とを関連付けて、1ピクセルのバケット検出器から空間情報を再構成する。
既存のアーキテクチャはフレーム全体の時間的コヒーレンスを利用することができず、ダイナミックゴーストイメージングはほとんど未解決のままである。
我々は空間的および時間的注意ブロックの交互化による制限に対処するトランスフォーマーアーキテクチャDynGhostを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 20:07:55 GMT)
Do Vision-Language-Models show human-like logical problem-solving capability in point and click puzzle games? [0.0] 本稿では,人間の論理的問題解決能力を評価するためのベンチマークであるVision-Language Against The Incredible Machine (VLATIM)を紹介する。
既存のベンチマークとは異なり、VLATIMは特に高レベルの論理的推論と連続的なアクション空間の間の臨界ギャップをターゲットとしている。
その結果, 推論と実行の相違が明らかとなった。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:07:54 GMT)
Descriptive versus Regulatory Uncertainty in Bounded Predictive Systems [0.0] 現在のトランスフォーマーアーキテクチャは推論における記述的不確実性に限られていることを証明する。
トークンレベルのシャノンエントロピーは、パターン検索、因果作用素応用、分布外因果一般化にまたがるタスクで統計的に不変である。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:41:57 GMT)
Deep Reinforcement Learning Framework for Diversified Portfolio Management Across Global Equity Markets [0.0] 本研究は,グローバル・エクイティ・マーケットにおける動的ポートフォリオ・アロケーションのための深層強化学習フレームワークを開発し,評価する。
報酬の定式化、政策構造、ポートフォリオ制約、時間エンコーダの5つのモデル構成を比較する。
その結果、RL戦略は、統計学的に有意な異常リターンが観測されるEuro Stoxx 50において、主に競争リスク調整性能を達成することが示された。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:50:37 GMT)
Cross-Subject Intracranial EEG Reconstruction from Scalp Recordings Using Multi-Scale Cross-Attention Transformers [0.0] 頭蓋内脳波(iEEG)は、臨床および脳-コンピュータインターフェースに必須の高忠実性神経記録を提供する。
本研究では, 他者に対して訓練したモデルを用いて頭蓋内信号の予測を行うことにより, クロスオブジェクトiEEG再建の課題に対処する。
論文参考訳(メタデータ) (Sun, 17 May 2026 10:43:25 GMT)
Coordinate Heterogeneity Governs Binary Quantization: From InfoNCE to Recall [0.0] バイナリ量子化(BQ)は1座標あたり1ビットまたは2ビットに高次元の埋め込みを圧縮し、近接探索を極速で行えるようにする。
BQは対照的な埋め込みにおいて競合するリコールを達成しますが、他では失敗します。
我々は、InfoNCEで訓練された表現のために最近確立されたガウス構造を、BQ品質のための完全な分析フレームワークに接続することで、この問題を解決する。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:15:21 GMT)
Compress the Context, Keep the Commitments: A Formal Framework for Verifiable LLM Context Compression [0.0] 本稿では,プロンプトやチャット履歴を圧縮するためのコミットメントレベルフレームワークであるContext Codecを提案する。
Context Codecは、対話状態を、標準的アイデンティティ、等価性、衝突、信頼、リスク、エビデンスを備えた、型付けされた、ソース基底のセマンティックな原子として表現する。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:42:37 GMT)
Beyond Model Readiness: Institutional Readiness for AI Deployment in Public Systems [0.0] 多くのパブリックセクタ人工知能システムは、モデル開発の時点では失敗し、デプロイの時点で失敗する。
既存の責任あるAIとモデル評価フレームワークは価値があるが、主にモデル、データセット、開発者側のプロセスを評価する。
Institutional Alignment Readiness (IAR)は,公共システムにおける配置準備性を評価するための5次元フレームワークである。
論文参考訳(メタデータ) (Sun, 17 May 2026 00:11:09 GMT)
Beyond Explained Variance: A Cautionary Tale of PCA [0.0] 本稿では,単位円から一様にデータをサンプリングする生成確率幾何学モデルを提案する。
このモデルの下では、ペアワイズコサイン距離は観測されたU字分布と定性的に一致するアルコシン分布に従い、t-SNEと永続ホモロジーに基づく解析を独立に支持する。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:40:28 GMT)
Beyond Catalogue Counts: the Dataset Visibility Asymmetry in Low-Resource Multilingual NLP [0.0] 53言語にまたがる609のユニークなデータセットを特定しました。
この結果から,多言語データの不足は生産上の問題としてだけでなく,文書化や発見可能性,長期的アクセシビリティの問題として理解されるべきであることが示唆された。
論文参考訳(メタデータ) (Sun, 17 May 2026 13:28:03 GMT)
Automated Root-Cause Subclassification and No-Code Fix Generation for Invalid Bug Reports [0.0] 無効なバグレポートはコードの変更を必要としない。
我々のゴールは、ルートを指向した無効なバグレポートのサブクラス化のための標準化された分類を導入することです。
金標準ベンチマークで異なる構成がどのように機能するかを研究する。
論文参考訳(メタデータ) (Sun, 17 May 2026 17:45:13 GMT)
Anytime and Difficulty-Adaptive PAC-Bayes for Constrained Density-Ratio Network with Continual Learning Guarantees [0.0] 制約密度比のネットワークは、ソース$Q$からRandon-Nikodym微分$rstar = dP/dQ$を、ターゲット$P$に近似する。
測定単位の変更は、目標リスクと重み付けされたソースリスクの間のギャップを比率バイアス項に分解する。
PAC-Bayesは固定時間体制における重み付けリスクに基づいてインスタンス化される。
論文参考訳(メタデータ) (Sun, 17 May 2026 01:07:17 GMT)
AnimeAdapter: Fine-grained and Consistent Zero-shot Anime Character Generation [0.0] 安定拡散のための軽量な外装アダプタを提案する。
本手法は,単一の参照画像から微細な視覚特徴を拡散過程に注入する。
そこで本研究では,Danbooruプロンプトのキュレートと再構成に基づく高品質なアニメキャラクタデータセットを提案する。
論文参考訳(メタデータ) (Sun, 17 May 2026 07:40:20 GMT)
An Interpretable Closed-Loop Intelligent Tutoring System for Multimodal Affective Feedback in Asynchronous Presentation Training [0.0] ITSはマルチモーダル入力をエビデンスベースのフィードバックにマッピングし、観測可能なパフォーマンスキューに遡ることができる。
このシステムは、専門家のレーティングに匹敵するパフォーマンスレベルでルーリック整合スコアを達成した。
論文参考訳(メタデータ) (Sun, 17 May 2026 14:12:40 GMT)
An Efficient Machine Learning-based Framework for Detection and Prevention of Frauds in Telecom Networks [0.0] 本稿では,通信ネットワークにおける不正検出のためのAI駆動モデルの性能評価を行う。
Telecom CDRデータセットには、詐欺事件8,830件を含む17の属性を持つ101,174件の顧客記録が含まれている。
RFの精度は99.9%、精度は99.9%である。
論文参考訳(メタデータ) (Sun, 17 May 2026 04:03:36 GMT)
All Quantum Probability viewed in Complex Projective Geometry [0.0] 最近の論文では、量子確率のヒルベルト空間公式はすべて、関連する射影空間の幾何学的性質の関数として実現できることが示されている。
本稿では、これらすべての確率の直接的な記述を射影空間自体の幾何学的性質のみを含む公式として与える。
論文参考訳(メタデータ) (Sun, 17 May 2026 18:09:39 GMT)
AgentModernize: Preserving Business Logic in Legacy Modernization with Multi-Agent LLMs and Behavioral Specification Graphs [0.0] 本稿では,モダナイゼーションを行動保存問題として扱うフレームワークであるAgentModernizeを提案する。
4つの専門エージェントが抽出、仕様、コード生成、バリデーションを処理する。
Behavioral Specification Graphは、ゴールドスタンダードルールの91.2%をキャプチャし、ボトルネックは抽出ではなくコード生成であることを確認した。
論文参考訳(メタデータ) (Sun, 17 May 2026 16:39:48 GMT)
A Two-Parameter Weibull Framework for Diagnosing Transformer Weight Distributions [0.0] 変圧器の重量分布の診断枠組みとしてWeibull分布を適用した。
SwiGLU/GeLUアクティベーション、プレLN/QK-Norm配置、70M-14Bサイズで共有されるFFNモジュールとアテンション出力プロジェクションW_oが狭帯域に落下することを示す。
論文参考訳(メタデータ) (Sun, 17 May 2026 11:00:59 GMT)
A Penalty-Free Pipeline for Direct Quantum-Annealer Portfolio Optimization [0.0] 直接量子アニーラーポートフォリオ最適化は、一般にD-Waveハードウェアに送信されるペナルティ符号化QUBOとして定式化される。
この標準定式化は、現在のデバイスでは失敗し、構造的理由を特定する。
期待したリターンから目的のみのQUBOを構築し、それをハードウェア上でサンプリングする。
論文参考訳(メタデータ) (Sun, 17 May 2026 19:50:04 GMT)
A Logistic Regression Model to Predict Malaria Severity in Children [0.0] 本研究は, 環境および生物学的要因に基づくマラリアの重症度を予測する。
調査はガーナのBosomtwe地区で実施され、回答者は417人だった。
論文参考訳(メタデータ) (Sun, 17 May 2026 12:53:02 GMT)
A Hybrid Gaussian Process Regression Framework for Stable Volatility-Covariance Estimation: Evidence from Global Equity Indices [0.0] 本稿では,7大グローバルエクイティ指標の多様化ポートフォリオにまたがって,バリュー・アット・リスク(VaR)と期待短絡(ES)を推定するためのハイブリッドガウスプロセス回帰履歴シミュレーション(GPR-HS)フレームワークを提案し,検証する。
主要な方法論的貢献は攻撃的ノイズ初期化(ANI)戦略であり、これはトレーニングリターンの経験的分散に等しい初期ホワイトノイズカーネルの分散を設定するものである。
論文参考訳(メタデータ) (Sun, 17 May 2026 05:52:54 GMT)