Scaling Parallel Sequence Models to Foundation-Scale Vision Encoders [123.6] ビジョンファウンデーションモデルは、自己注意の二次的なコストによってボトルネックとなる。
2次元空間伝搬伝搬に基づくC-GSPNを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:29:43 GMT)
MM-Snowball: Evaluating and Mitigating Hallucination Snowballing in Multimodal Multi-Turn Dialogue [98.6] MM-Snowballは,対話内における幻覚雪球の診断のための最初のベンチマークである。
本稿では,この劣化に対処するために,コンフリクト・アウェア・ビジュアル・リクティフィケーション(CAVR)を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:53:34 GMT)
FineVerify: Scaling Test-Time Compute with Fine-Grained Self-Verification for Agentic Search [88.2] FineVerifyはエージェント検索のためのきめ細かい自己検証フレームワークである。
各質問をチェック可能なサブクエストに分解し、サンプル候補を検証し、最も高い集計スコアの候補を選択する。
FineVerifyは、標準のスケーリングベースラインを一貫して上回る。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:21:20 GMT)
A Modelling and Evaluation Framework for EuroCrops-Driven Sentinel-2 Crop Segmentation [78.7] 本研究では,Sentinel-2イメージとEuroCropsパーセルレベルのアノテーションからセマンティックセグメンテーション対応農業データセットを生成するパイプラインを提案する。
このデータセットには、ヨーロッパ5カ国から67,337のパッチが含まれており、10種類の作物と背景の分類を減らしている。
The four-level U-Net with Group Normalization were training using 10 Sentinel-2 spectrum bands and a Composite loss with class-weighted cross-entropy and Dice loss。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:20:29 GMT)
Decomposed On-Policy Distillation for Vision-Language Reasoning: Steering Gradients for Visual Grounding [76.4] 我々は,視覚言語モデル (VLM) 蒸留の標準的なモノリシックな見方に挑戦し,損失を2つの異なるコンポーネント(言語先行と視覚接地)に数学的に分解する。
本稿では、更新ベクトルを動的に並べ替えて視覚的な部分空間を優先順位付けするVisual Gradient Steering(VGS)を紹介する。
複数の蒸留条件と複雑なマルチモーダルベンチマークの実験結果は、VGSがオン・ポリケート蒸留の標準的なモノリシックな定式化を著しく上回っていることを示している。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:34:37 GMT)
TempRet: Temporal Enhancement and Two-Stage Reranking for CVPR 2026 EPIC-KITCHENS-100 Multi-Instance Retrieval Challenge [71.1] 我々は,CVPR 2026 EPIC-KITCHENS-100 MIRチャレンジに対して,TempRetと呼ばれるソリューションを提示する。
当社のアプローチは,CLIPベースのデュアルエンコーダのバックボーン上に構築されており,時間的および横断的な課題に対処するための2つの重要なコンポーネントを導入している。
EK-100 MIRベンチマークでは,平均mAPは67.97%,平均nDCGは82.92%であった。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:38:39 GMT)
Learning to Retrieve: Dual-Level Long-Term Memory for Text-to-SQL Agents [63.4] 長期記憶は、エージェントが過去の経験を再利用するのに役立つ。
静的メソッドは、下流ユーティリティを最適化しない固定された類似性に依存します。
動的マルチ水平メモリ検索フレームワークであるMERITを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:44:34 GMT)
FrontierOR: Benchmarking LLMs' Capacity for Efficient Algorithm Design in Large-Scale Optimization [61.4] 大規模言語モデル(LLM)は、最適化モデリングとソルバコード生成にますます使われている。
既存のベンチマークは、実際のスケールと複雑さよりもはるかに低い、小さな、あるいは単純化された例に限られている。
現実的な大規模最適化問題に対して,LLMに基づく効率的なアルゴリズム設計を評価するための最初のベンチマークとしてFrontierORを紹介した。
論文参考訳(メタデータ) (Sat, 30 May 2026 22:51:15 GMT)
Trustworthy Recommendation in the Era of Large Language Models: Opportunities and Challenges [60.2] 大規模言語モデル(LLM)は、リコメンデータシステムに広く統合されている。
LLMは、信頼を高める前例のない機会を提供する。
しかし、彼らは同時に、新しい形の偏見や幻覚によって引き起こされる問題など、新しいリスクを導入します。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:14:53 GMT)
Enhancing LLM Metacognition via Cognitive Pairwise Training [56.2] 検証可能な報酬を伴う強化学習は、証拠や推論が信頼できない場合に、モデルが自信を持って回答する意思を増す。
既存のSFT法やRL法は、主にLLMに対して応答レベルでの不確実性を拒否または表現するよう教えている。
本稿では,認知的中級アライメント段階である認知的ペアワイズトレーニング(CPT)を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 19:53:19 GMT)
MMDG-Bench: A Benchmark for Multimodal Domain Generalization [53.4] マルチモーダルドメイン一般化は、相補的なモダリティを活用して、目に見えない領域におけるモデルロバスト性を高めることを目指している。
現在のMDDGの研究は、主に行動認識に限られており、標準化された評価プロトコルが欠如している。
DG, MML (D2M) と MML, DG (M2D) の2つの基礎的フレームワークを備えた総合ベンチマークであるMDDG-Benchを紹介する。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:52:49 GMT)
CV-Arena: An Open Benchmark for Instructional Computer Vision Problem Solving with Human-AI Collaborative Preferences [51.9] CV-Arenaは、プロの規模でこの能力を評価するために設計されたオープンベンチマークである。
CV-Arenaは16の命令ベースの視覚タスクタイプにまたがる12Kの高解像度実像命令ペアを含んでいる。
我々は,計画,編集,検証を組み合わせた軽量エージェントモデルCV-Agentを開発した。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:37:55 GMT)
GCVE: A Decentralized Model for Vulnerability Identification, Publication, and Operational Enrichment [51.8] Global CVEイニシアチブ(Global CVE Initiative, G)は、脆弱性の識別、パブリッシュ、エンリッチメントのための分散化、オープン化、識別子モデルを提案する。
本稿では,自律型G番号認証,ライトウェイトアロケーションルール,分散パブリッシュ,オープン・ベスト・カレントプラクティス,実用的なリファレンス実装を組み合わせた社会技術的取り組みとしてGを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 19:03:39 GMT)
Improving Visual Representation Alignment Generation with GRPO [51.1] 拡散変換器は強い画像合成能力を示したが、弱いアライメントのため、列車には非効率である。
本稿では,REPAの静的アライメント損失を生成的表現ポリシー最適化の目的に置き換える,強化に基づく最適化戦略であるVRPOを提案する。
当社のVRPO駆動トレーニングは拡散トランスフォーマーにシームレスに統合され、無視可能なコストを導入し、SiTとDiTアーキテクチャとの完全な互換性を維持します。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:21:40 GMT)
V-LynX: Token Interface Alignment for Video+X LLMs [47.7] ビデオLLMは連続的な多様体、トークンインターフェースを確立し、視覚トークンをアーキテクチャ内の独立したエンティティとして動作させる。
本稿では,新しいモダリティをビデオLLMに組み込むスケーラブルなフレームワークであるV-LynXを提案する。
本手法は,注意応答と統計的分布を一致させることにより,新たな感覚入力と本質的なビデオ先行情報を統合する。
論文参考訳(メタデータ) (Sat, 30 May 2026 03:54:44 GMT)
Saliency-Aware Model Merging [47.7] モデルマージは、異なるデータセットに微調整された複数のタスク固有のモデルを、ドメイン間の習熟性を実行する統一アーキテクチャに統合することを目的としている。
現在のデータフリーモデルマージ手法は、層間依存関係や一様でない専門知識の分布を無視した単純なパラメータレベルに依存するため、スケールアップに苦労することが多い。
この研究は、構造的なプルーニング(SynFlowなど)から接続ベースのサリエンシの定式化に基づいて構築され、それらをデータフリーモデルマージ設定に拡張するSA-Mergingを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:00:44 GMT)
An Attribute-Based Measure of Video Complexity [47.2] ビデオ複雑性は、所定のビデオ検索ペアに対するビデオLLMの失敗の確率として定義される。
VideoABCは、参照ビデオデータセットと予め定義されたビデオ属性の語彙を用いて、非パラメトリックな複雑性尺度である。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:30:30 GMT)
RoboStressBench: Benchmarking VLM Robustness to Physical Visual Stress in Embodied Scenes [47.1] VLM(Vision-Language Models)は、強力な視覚的理解を示し、組込みAIシステムにますますデプロイされている。
既存のベンチマークでは、物理的なシーン形成によるストレスではなく、クリーンなイメージや孤立した摂動を用いてVLMを評価する。
具体的シーンにおける物理的な視覚的ストレスに対するVLMロバスト性を評価するためのベンチマークであるRoboStressBenchを紹介する。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:55:10 GMT)
Sakura: An Approach for Generating Complex Tests from Natural Language Test Descriptions [46.6] Sagaは、自然言語(NL)による開発者意図の記述からテストを生成するためのフレームワークである。
サクラはNL記述を構造化ブロックに分解し、マルチエージェントシステムを用いて処理する。
Sagaは、Gemini CLIのような真剣なエージェントツールよりも大幅に優れています。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:49:10 GMT)
Interpretable Policy Distillation for Power Grid Topology Control [46.2] 我々は,PPOエージェントを,運用性能を損なうことなく,コンパクトな木型サロゲートに圧縮できるかどうかを問う。
PPOの教師は、Grid2Opの標準14バス環境において、重大かつ高負荷状態のストレス中心のデータ収集を使用して、安定性を重視した報酬で訓練される。
両方のサロゲートは、平均報酬と生存期間において、推論コストのごく一部で教師を上回る。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:32:55 GMT)
Finite-Sample Selected Covariance Spectra in Classical Shadows [45.9] 主定理は任意のシャドウプロトコルに適用される。
固定された局所的次元を持つ一般の局所積影プロトコルでは、有限重積オブザーバブルは、サポートサイズと局所再構成係数によって制御される境界に導かれる。
偏りのある局所パウリ影に対しては、選択されたパウリ支援と局所基底選択確率から閉形式の有界性を評価する。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:46:49 GMT)
The Right Inference Strategy Is All You Need: Nearly Training-Free Domain-Wise Inference for EgoCross Challenge [45.8] EgoCrossは、エゴセントリックなビデオ質問応答に基づくマルチモーダルな大規模言語モデルを評価する。
テストビデオは、通常の日常シーンではなく、手術、産業組み立て、エクストリームスポーツ、動物搭載カメラから来ている。
我々は4つの対象ドメインを別々に扱い、異なる入力、プロンプト、および応答マッピング手順を設計するドメインワイズ推論戦略を使用する。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:55:15 GMT)
Statistical Testing on Directed Graphs by Surrogate Data Generation [44.7] まず、有向グラフ上の定常グラフ信号の概念を再検討し、特にグラフシフト演算子の固有分解を通じて、有向グラフ広義の定常信号を定義する。
定常性仮定の下で共分散構造を保ったグラフ信号を生成するための新しいフレームワークを提案する。
提案手法の有効性と優位性を実証し,本手法を非方向性グラフの既存技術と比較する上で,実データを用いた指導例と応用例を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:50:15 GMT)
Limits of Resolution Equivariance in Fourier Neural Operators [41.6] 直接的細粒度推論は信頼性が低く,低グリッド+アップサンプリングベースラインよりも悪くなる可能性が示唆された。
これは、FNOがわずかなモードを維持しながらうまく機能できる理由を機械論的に説明できるが、分解能シフトの下では感度が保たれる。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:28:17 GMT)
ScaleSweep: Accurate NVFP4 Post-Training Quantization of LLMs via Block Scale Initialization [40.4] NVFP4量子化のための単純かつ効率的なスケール最適化法としてScaleSweepを提案する。
LlamaとQwenの実験では、ScaleSweepは量子化性能を一貫して改善している。
特に、重み、アクティベーション、KVキャッシュ、クエリ状態の積極的なエンドツーエンド量子化の下では、ScaleSweepは完全な精度性能の93%以上を保っている。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:26:16 GMT)
Do Text Edits Generalize to Visual Generation? Benchmarking Cross-Modal Knowledge Editing in UMMs [40.3] 統一マルチモーダルモデル(UMM)は汎用マルチモーダルインテリジェンスにとって有望なパラダイムである。
UMMにおけるクロスモーダルな知識編集のための最初のベンチマークであるUniKEを紹介する。
テキスト側の有効性は92%に達するが、直接画像生成時のVQAの精度は18.5%に留まる。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:09:37 GMT)
Exploiting weight-space symmetries for approximating curvature [39.6] 本研究では,最新のディープネットワークの規模で損失関数の曲率を近似するフレームワークを開発する。
我々のフレームワークは、不確実性推定、連続学習、圧縮/プルーニングなど、他の機械学習問題にも応用できるかもしれない。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:17:36 GMT)
Memory-Efficient LLM Training with Dynamic Sparsity: From Stability to Practical Scaling [38.7] ダイナミックスパーストレーニング(DST)は、ディープニューラルネットワークのトレーニングと推論効率を改善するための有望なパラダイムを提供する。
大規模な言語モデルトレーニングでは、DSTは最適化の不安定性に悩まされ、トポロジ更新後に損失が急増する。
本稿では、DSTをウォームアップで安定化し、密度認識学習率のスケーリングによるトレーニングの進捗を改善するSparse Memory-Efficient Training (SMET)を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:47:45 GMT)
GenPT: Beyond Self-Report for Reliable LLM Psychometrics via Generative Projective Testing [38.2] 自己申告アンケートは、ペルソナ条件付きエージェント(PC-Agents)の心理的状態を調査するための一般的なツールである。
TAT,Rorschach,SCTを新たに生成した刺激で再構成する textbfGenPT (Generative Projective Testing) を導入する。
我々はGenPTの信頼性と妥当性を古典的なアンケートと比較した。
論文参考訳(メタデータ) (Sat, 30 May 2026 19:20:26 GMT)
PACE: Phase-Aware Chunk Execution for Robot Policies with Action Chunking [38.0] PACEは、予測チャンク自身からオンラインで実行地平線を選択する、トレーニング不要なテスト時間実行方法である。
PACEは予測されたアクションチャンクのみを使用するため、プラグアンドプレイであり、ポリシー内部への再トレーニングやアクセスは不要である。
我々はシミュレーションと実ロボット設定の両方で大規模な評価によってPACEを検証する。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:11:06 GMT)
Coarse-to-Fine Compositional Diffusion for Long-Horizon Planning [37.4] 既存の手法は局所的整合性信号を繰り返し伝播することによりグローバルコヒーレンスを改善する。
本研究では,大域的構造形成を局所的な細部微細化から分離する推論時間サンプリング器CoFiを提案する。
CoFiは, 従来の組成ベースラインよりも大域的コヒーレンスと局所的な試料品質を向上するだけでなく, 2-8倍のデノイザー評価を必要とする。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:26:53 GMT)
MBench: A Comprehensive Benchmark on Memory Capability for Video World Models [37.3] ビデオワールドモデルのメモリ能力の定量化と評価を目的としたベンチマークである textbfMBench を提案する。
我々のベンチマークは、厳密にキュレートされた実写長ビデオに基づいて構築され、ルールベースの量行列とVLMにより評価される。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:17:33 GMT)
OCC-RAG: Optimal Cognitive Core for Faithful Question Answering [36.0] 提案するOCC-RAGは, 与えられた文脈に根ざした忠実な質問応答に最適化されている。
OCC-RAGを訓練するために,マルチコンテキスト,マルチホップQAデータを大規模に合成するための新しいパイプラインを実装した。
コンパクトなタスク特化SLMは汎用モデル2-6倍の大きさでマルチホップ推論できることを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:42:19 GMT)
3D Segment Anything Model with Visual Mamba for Diagnosing Placenta Accreta Spectrum [35.9] Placenta Accreta Spectrum (PAS) は珍しいが、非常に危険な産婦人科疾患である。
従来のPAS診断は、帝王切開の歴史とMRI(Magnetic Resonance Imaging)データを分析することによって、経験豊富な医師に依存している。
我々は,粒度の細かなセグメンテーションと分類アノテーションを含む最初のMRIベースのPASデータセットを構築した。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:39:56 GMT)
WaveFilter: Enhancing the Long-Context Capability of Diffusion LLMs via Wavelet-Guided KV Cache Filtering [35.1] textbfWaveFilterは、普遍的でトレーニング不要なキャッシュフレームワークである。
人間の読解プロセスにインスパイアされたTextbfWaveFilterは、普遍的でトレーニング不要なキャッシュフレームワークである。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:32:26 GMT)
ETC: Extreme Token Compression via Task-aware Visual Information Distillation in VLMs [34.7] 高解像度画像は多数の視覚トークンを生成するため、推論時に高い計算コストとKVキャッシュオーバーヘッドが生じる。
本稿では,入力トークン数を減らす際にタスク損失を最小限に抑えるExtreme Token Compressionフレームワークを提案する。
ETCはシングルトーケン圧縮でも有効であり、強いタスク性能を維持しながらKVキャッシュオーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:28:43 GMT)
SKIP: Sparse Keyframe Interpolation Paradigm for Efficient Embodied World Models [34.5] SKIP(Sparse Keyframe Interpolation Paradigm)を提案する。
SKIPは、ロボットが認識するマルチモーダル機能を利用してタスク関連物を識別する。
次に、スパースビデオ拡散モデルでこれらのEmsのみを合成する。
学習されたギャップ予測器ビデオと動作条件補間器は、その後、ロボットの動作に応じて行方不明区間を再構築する。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:41:34 GMT)
SkyShield: Occupancy as a Safety Interface for Low-Altitude UAV Autonomy [34.0] textbfSkyShieldは、20m以下の都市UAV飛行のための最初のフロントビューセマンティック占有ベンチマークである。
textbfSkyOccは、フレームワイドUAV姿勢を投影に統合する幾何学第一の単分子基線である。
textbfKAR-mIoUはUAV中心で動的に認識されるメトリクスで、到達性と協調時間によるボクセルレベルの評価を再重み付けする。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:29:52 GMT)
Multi-Agent Conformal Prediction with Personalized Statistical Validity [33.7] コンフォーマル予測は、限定的なローカルキャリブレーションデータ、プライバシ制約、データの異質性といった課題に直面している。
本稿では、局所密度比重み付けと重み付けされた量子化集約を組み合わせ、プライバシーを保ちながら不均一性を補正するフレームワークであるパーソナライズされた共形予測(PFWCP)を提案する。
PFWCPは、各参加エージェントに対して有効な境界条件と校正条件のカバレッジ保証を与え、ワンショット通信によるプロトコルをサポートする。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:01:56 GMT)
Critic-R: Improving Agentic Search using Instruction-tuned Retrievers with Natural Language Introspective Feedback [33.7] Critic-Rは推論とトレーニングの間、推論エージェントと検索モデルの間のフィードバックループを閉じるフレームワークである。
Critic-Rには2つの補完メカニズムがある: Critic-R-Zero, Inference-time query refinement loop, Critic-Embed, 検索モデルの最適化手法。
その結果,Crytic-Rは検索品質とダウンストリーム応答精度の両方を著しく向上させることがわかった。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:42:22 GMT)
Collaborative Few-Step Distillation and Low-Bit Quantization for Wan2.2 Dual-Expert Video Diffusion Models [33.3] 大規模なビデオ拡散モデルは、強力な視覚的品質を実現するが、デプロイには高価である。
本稿では,Wan2.2-T2V-A14Bの分散マッチング蒸留と低ビット量子化を組み合わせた配置指向圧縮パイプラインについて検討する。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:15:26 GMT)
I-WebGenBench : Evaluating Interactivity in LLM-Generated Scientific Web Applications [33.3] 本稿では,研究論文を対話型Webシステムに変換するPaper-to-Interactive-System Agentを提案する。
PDFの論文が与えられた場合、エージェントは人間の介入なしにエンドツーエンドの処理を行う。
実験の結果,PaperVoyagerは生成した対話システムの品質を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:34:02 GMT)
Latent Reward Steering: An Adaptive Inference-Time Framework that Implicitly Promotes Cognitive Behaviors in Reasoning LLMs [31.3] Latent Reward Steering (LRS) は、認知行動を促進する適応的な推論時間フレームワークである。
LRSは、中間潜伏状態の品質を推定するために最終回答の正しさによる推論トレースに基づいて潜伏報酬モデルを訓練する。
複数の推論バックボーンとベンチマークの実験では、さまざまなベースラインに対するパフォーマンスが一貫して改善されていることが示されています。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:38:06 GMT)
Accelerating Surface Radiation Content to Investigate the Impact of Radon Progeny on Superconducting Qubits [30.9] $$$$$$$$のイオン化放射線は超伝導量子ビットにおけるデコヒーレンスを誘導することができる。
222ドル(約2万2000円)の長命で不安定な娘が直接デバイスや包装面に皿を貼る効果は、まだ研究されていない。
そこで本研究では,Radon daughter plateoutを7時間104ドル(約7万4000円)で促進・増強できる装置を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 01:39:47 GMT)
Revisiting Parameter-Based Knowledge Editing in Large Language Models: Theoretical Limits and Empirical Evidence [30.7] 本稿では,次元的崩壊仮説に基づく理論的解析を行い,局所化パラメータ編集が表現空間の脆弱な方向に沿ってどのように伝播するかを説明する。
次に,知識複雑性,編集数,評価次元,ベースライン手法を体系的に変化させることで,総合的な経験的評価を行う。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:44:40 GMT)
MemGraphRAG: Memory-based Multi-Agent System for Graph Retrieval-Augmented Generation [30.5] グラフベースのRAG(GraphRAG)は、構造的関係を捉えるために知識グラフを組み込んでいる。
既存のGraphRAG法は、グラフ構築のための分離されたフラグメントレベルの抽出に依存している。
本稿では,メモリベースのマルチエージェントシステムを導入し,高品質なグラフ構築を実現する新しいフレームワークであるMemGraphRAGを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:18:53 GMT)
SkillPager: Query-Adaptive Intra-Skill Navigation via Semantic Node Retrieval [30.4] SkillPagerは、各スキルをオフラインで型付きセマンティックノードに解析し、グローバルでクエリ条件のノード選択をオンラインで実行するフレームワークである。
395のスキルと1,975のクエリのベンチマークで、SkillPagerは78.89%のLCM-judgedコンテキスト満足度を達成した。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:49:07 GMT)
Online Packet Scheduling with Deadlines and Learning [30.3] QoS(Quality-of-Service)の保証を行うネットワークルータは、各クロックサイクルにおいて、送信する情報のパケットの有効期限を決定する必要がある。
我々は,この問題を部分フィードバックの下で,デッドライン付きオンラインパケットスケジューリング(OPSD)問題とみなす。
我々は、異なるスラックネスの下で証明可能な$-regret保証を持つアルゴリズムを提供する。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:20:33 GMT)
LaSR: Context-Aware Speech Recognition via Latent Reasoning [29.3] 本稿では,文脈認識推論を特徴とする新しい学習パラダイムであるLaSRを提案する。
本研究は,効率的な文脈認識型音声アシスタント構築における潜在推論の可能性を明らかにするものである。
論文参考訳(メタデータ) (Sat, 30 May 2026 03:44:12 GMT)
SALSA: Speech Aware LLM Adaptation via Learned Steering Activation Vectors [28.6] そこで我々は,レイヤワイズステアリングベクトルを学習する軽量適応手法であるSALSAを提案する。
子どものスピーチ、多言語スピーチ、マンダリン英語のコードスイッチングベンチマーク全体において、SALSAはゼロショット推論よりもパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:54:53 GMT)
SPADER: Step-wise Peer Advantage with Diversity-Aware Exploration Rewards for Multi-Answer Question Answering [28.5] 大規模言語モデルは、パラメトリック知識を超えた情報を取得するツール拡張エージェントとして、ますます多くデプロイされている。
マルチアンサーQAにおける長期ツール利用のための強化学習フレームワークであるSPADERを提案する。
SPADERは一般に、リコールとF1全体の改善を、プロンプトベースのエージェント、結果管理型RL手法、最近のステップレベルの監視手法よりも促進することを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:47:42 GMT)
Analog photonic simulator for large-scale transport [27.8] 高次元偏微分方程式は、次元に比例して自由度が指数関数的に増加するため、デジタルグリッド上で表すのは難しい。
連続可変量子フォトニクスは、空間を離散格子に初めて離散化することなく、大規模フィールドを表現し、進化させることができる。
本結果は,大規模対流方程式に適したプログラム可能なアナログプラットフォームとして,連続可変フォトニクスを確立した。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:15:43 GMT)
Confidence-Adaptive SwiGLU for Mixture-of-Experts [27.5] 信頼を意識したSwiGLUはトークンレベルのルーティング信頼度に応じて専門家のゲートシャープネスを調整する。
$$-SwiGLUは、SiLUゲートシャープネスをルータロジットの学習可能な関数としてパラメータ化する。
$$-SwiGLUは、無視可能なパラメータを追加しながら、平均COREパフォーマンスを改善します。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:58:52 GMT)
Dialectics of Alignment: Harnessing Unsafe Knowledge for Dynamic Safety Routing [27.3] この作業は、安全でないデータが破棄されなければならないという正統性に挑戦する。
セーフモエ(SafeMoE)は、安全でない知識をドメイン固有のLowRank Adapters(LoRAの専門家)に分離するフレームワークである。
真の安全性は、安全でない知識のマスキングではなく、制御された統合のシフトを必要とする。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:49:42 GMT)
Prior-Guided Multi-Omic Transformers for Single-Cell Gene Regulatory Network Inference [27.3] 遺伝子制御ネットワーク(GRN)は転写因子-標的相互作用を捉え、細胞-状態制御と疾患を理解する中心となる。
EpiAwareNetは、軽量な生物学的事前情報のみを用いて、ペア化された単一セルデータからGRNを再構成する、事前誘導型マルチオミックトランスフォーマフレームワークである。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:49:21 GMT)
MemPro: Agentic Memory Systems as Evolvable Programs [26.8] 長期の自律エージェントは、記憶システムに履歴情報を保持し、進化する状態を追跡し、関連する知識を有限のコンテキストウインドウを超えて再利用することを要求する。
既存のエージェントメモリシステムは、通常、メモリ構築検索パイプライン(MCR)に従うが、配置後に周囲のパイプラインを固定しながら、主にメモリバンクに適応することが多い。
本稿では,MCRパイプライン全体をメモリバンクやプロンプトテキストのみに適応させるのではなく,進化可能なプログラムとして扱うシステムレベルの進化フレームワークであるMemProを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:47:33 GMT)
Confused ChatGPT: Cross-App Context Poisoning via First-Party APIs [26.8] ChatGPT Appsは、サードパーティアプリケーションがユーザと他のすべての接続されたアプリと単一のチャットコンテキストを共有する、アプリ内パラダイムを導入している。
3つの特性で区別された間接的プロンプトインジェクションの変種であるクロスアプリコンテキスト中毒を同定した。
sendFollowUpMessageは最も直接的で強力なチャネルです。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:37:18 GMT)
Task diversity produces systematic transfer but inhibits continual reinforcement learning [26.7] 本研究では,タスクの多様性がエージェントの分散シフトを通じて学習を継続する能力を向上させるかどうかを検討する。
タスクの多様性因子を3つの独立制御可能な軸に分解する連続RLドメインであるBanyanを導入する。
シフトの数が増えるにつれて、この局所移動はそれ自体が持続的な学習をもたらすわけではない。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:31:25 GMT)
ASAP: Advancing Medical Volumetric Representation Learning with Anatomy-aware Semantically-adaptive Pre-training [26.5] 本稿では,医用ボリューム表現学習のための視覚言語事前学習フレームワークを提案する。
解剖学的知識注入モジュールは,(1)臓器レベルでの構造的前提を組み込んだもの,(2)文レベルの発見と局所的な領域を関連付ける意味的適応的選択的アライメント機構,(3)解剖学的に認知された視覚的特徴と接地されたテキストの手がかりとを効果的に相互作用するための意味的適応的融合モジュールである。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:59:21 GMT)
FlowOVD: Learning Generative Latent Flows for Zero-shot Open-vocabulary Detection [25.5] 本稿では,デコーダクエリ生成を遅延空間における連続的な転送プロセスとしてモデル化することで,生成的視点を導入する。
本稿では,テキストに依存しない問合せを段階的にテキスト誘導クエリに変換する修正フローに基づく,テキスト言語クエリ生成フレームワークであるFlowOVDを提案する。
提案手法は,個別のクエリ構築を回避し,より表現力の高いセマンティックアライメントを実現する。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:01:43 GMT)
NBQ: Next-Best-Question for Dynamic Profiling [24.8] NBQは,様々な質問のプールをシードし,コンパクトで継続的に更新されたユーザ状態を維持できるプラグイン・アンド・プレイ・フレームワークである。
相互に互換性を持たなければならず、それぞれが自己記述と相互参照の両方の表現でモデル化されるような、相互マッチングのためのNBQをインスタンス化する。
実験の結果、NBQはAC@TとAR@Tで最大13.6%、AR@Tで14.0%、QuickMatchは最大22.9倍、リコールは最大0.989であることがわかった。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:49:05 GMT)
OptiWorld: Optimal Control for Video World Generation under Physical Constraints [24.7] 推論時にビデオ生成に古典的最適制御をもたらすフレームワークである textbfOptiWorld を提案する。
連続多様体上の幾何学的問題として計画を定式化し、3次元幾何学とタスク依存の物理的制約を統一計画幾何学に変換する。
論文参考訳(メタデータ) (Sat, 30 May 2026 03:13:00 GMT)
FlowNar: Scalable Streaming Narration for Long-Form Videos [24.7] FlowNarはスケーラブルなストリーミングビデオナレーションのための新しいフレームワークである。
FlowNarの中核は、歴史的視覚的コンテキスト削除のための動的コンテキスト管理戦略である。
Ego4D、EgoExo4D、EpicKitchens100データセットの実験は、FlowNarが強力なベースラインよりもナレーション品質を大幅に改善していることを示している。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:51:28 GMT)
Normalized Relevance Measure as a Unifying Framework to Explain Neural Network Latent Structures [23.9] 本稿では,任意のアーキテクチャの層にまたがるニューロンの関連性に起因する,非正規化関連度尺度(NRM)フレームワークを提案する。
NRMフレームワークは、計算される基礎となる量を明示的に特定することで、既存の伝搬に基づく説明アルゴリズムを仮定する。
本稿では,VGG16ネットワークにおいて,複数層にまたがる協調関係解析により重要な情報フローを明らかにするコンピュータビジョンアプリケーションにおいて,このフレームワークの有用性を実証する。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:15:44 GMT)
CoMIC: Collaborative Memory and Insights Circulation for Long-Horizon LLM Agents in Cloud-Edge Systems [23.9] エッジサーバ上の軽量大規模言語モデル(LLM)エージェントは、レイテンシを低減し、エージェントサービスをユーザに近づける。
デプロイ後の微調整エッジモデルはコストが高く、異種ノードをまたいでスケールすることが難しい。
我々は,コラボレーティブメモリと循環インサイトのためのパラメータ更新不要なクラウドエッジフレームワークであるtextscCoMICを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:45:39 GMT)
DistMatch: Adaptive Binning via Distribution Matching for Robust Sequential Conformal Prediction [23.7] DistMatchは、KS(Kolmogorov-Smirnov)統計を用いて、バイナリツリー内で残余を分割するバイナリベースの方法である。
この分断によって葉がほぼ交換可能となり,再重み付けの必要がなくなることを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:57:29 GMT)
OmniEEG-Bench: A Standardized Evaluation Benchmark for EEG Foundation Models [23.0] 我々は,脳波基礎モデル(FM)のための統一ベンチマークとダウンストリームタスクロードマップであるOmniEEG-Benchを紹介する。
脳波FMの評価を、(i)信号信頼性、(ii)生体計測と疾患、(iii)意識と状態、(iv)認知と感情、(v)自然主義的刺激復号、(vi)運動と相互作用の6つのタスクファミリーに分類する。
代表的なEEGファンデーションモデル10をベンチマークし、さまざまな評価設定をカバーするリーダーボードを報告します。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:20:04 GMT)
ForeSci: Evaluating LLM Agents for Forward-Looking AI Research Judgment [22.4] 研究員が歴史的証拠から前向きな判断を下せるかどうかを評価するためのベンチマークであるForeSciを紹介する。
ForeSciには、素早く動く4つのAIドメインと4つの意思決定ファミリに500のタスクが含まれている。
明確な証拠組織は、トレーサビリティと事実支援を改善するが、決定家族に強く依存する。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:41:26 GMT)
Sandboxed Coding Agents are Competitive Omni-modal Task Solvers [22.3] テキスト・イメージ・アクセスとサンドボックス・ツール・ユース・インタフェースしか持たないコーディング・エージェントがSOTAネイティブ・オムニモーダル・モデルと一致することを示す。
私たちの軌道分析は、その強みがコードを書き、関連する証拠を抽出するためのツールを編成することに由来することを示唆しています。
我々は,OmniCodingトラジェクトリデータセットと検証可能な報酬を含むトレーニングレシピであるCode-Xを紹介し,Qwen-3.5-9BとQwen-3.6-27Bのベースラインを提供する。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:04:27 GMT)
Latent Diffusion Pretraining for Crystal Property Prediction [22.1] 我々は,データ不足を軽減するために,新しい遅延拡散に基づく事前学習フレームワークCrysLDNetを導入する。
提案手法は,変分オートエンコーダ(VAE)と事前学習時の拡散モデルを統合する。
プロパティ予測のための一般的なDFTデータセットの実験では、CrysLDNetは、スクラッチと事前訓練されたベースラインの両方で大幅にパフォーマンスが向上している。
論文参考訳(メタデータ) (Sat, 30 May 2026 15:44:36 GMT)
Demystifying the Optimal Fair Classifier in Multi-Class Classification [21.8] フェア分類における課題として, (i) マルチクラス設定における最適精度・フェアネスフロンティアを特徴付けること, (ii) 異なる学習段階においてこの最適化を実現するための実用的なアルゴリズムを設計すること, について検討する。
本稿では,本手法の精度と公平性を両立させるための2つの属性ブラインドアルゴリズムを提案する。その2つの特性ブラインドアルゴリズムは,減算手法によるトレーニング中の公平な介入のためのプロセス内アプローチと,プラグイン推定による微調整出力確率の処理後アプローチである。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:00:52 GMT)
Images as Tables: In-Context Learning with TabPFN for Low-Data Detection of AI-Generated Images [21.1] 1つのジェネレータでトレーニングされた検出器は、新しいジェネレータが現れると失敗することが多い。
本稿では, 凍結したDINOv3バックボーンによって各画像が符号化される, 簡単な画像からテーブルへの定式化について検討する。
DINOv3-PCA-TabPFNは,実用上重要な低データ体制において強くなっている。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:00:25 GMT)
Shape-Prior-Based Point Cloud Completion for Single-Stage Fully Sparse 3D Object Detection [20.5] 単段完全スパースな3Dオブジェクト検出器は、自律走行シナリオにおけるオブジェクトを検出するために点雲データに依存している。
点雲の空間性と不完全性は、3次元物体検出の性能を著しく制限する。
本稿では,単段フルスパース検出器に特化して設計された点雲補修法を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:49:58 GMT)
Benchmark Dataset for Catalysis on 2D MXenes [20.3] 2次元(2D) Ti$VCT$_y$MXenesに焦点をあてた。
この課題に対処するために、トレーニング用の5万のDFT計算とテスト用の1万の包括的なデータセットを生成します。
EquiformerV2, MACE, MatRIS, UPETなどの機械学習の原子間ポテンシャル(MLIP)モデルを用いて, 原子間力と形成エネルギーを正確に予測し, 評価する。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:18:17 GMT)
ProactiveLLM: Learning Active Interaction for Streaming Large Language Models [19.9] 本稿では,モデル内在状態を利用して対話決定を導くことにより,アクティブなインタラクションを実現するProactiveLLMを提案する。
ProactiveLLMは、動的かつアクティブなインタラクションのキャパシティを検証しながら、品質を維持しながら、インタラクションのレイテンシを著しく低減します。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:31:29 GMT)
From Empathy to Personalized Empathy: Adapting Empathetic Strategies to Individual Users [18.1] 我々は,歴史から派生したユーザのパーソナライズされた特徴に応じて共感的戦略を適用することに焦点を当てた,パーソナライズされた共感の課題を紹介する。
この能力を研究・強化するために,長期のユーザ-AIインタラクションから構築したパーソナライズされた共感データセットであるPersonaEmpを構築した。
また,共感評価構造と動的評価基準生成を組み合わせた報酬モデリングフレームワークPereGRMを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:49:01 GMT)
CR-JEPA: Cross-Modal Joint-Embedding Predictive Learning for Remote Sensing Image Retrieval [17.9] クロスモーダルなリモートセンシング画像検索は、異質なセンシングモダリティをまたいだセマンティックなシーンの検索を目的としている。
両モードリモートセンシング検索のためのクロスモーダル検索統合埋め込み予測アーキテクチャCR-JEPAを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 12:29:46 GMT)
The Invitation Trap: Proactive Availability Backdoor in LLMs via Conversational Induction [17.8] 我々は,攻撃ベクトルをパッシブ待ちからアクティブソーシャルエンジニアリングに移行する新しいパラダイムであるtextbfProactive Availability Backdoor (PAB)を紹介した。
整列 LLM の本質的な有用性を武器化することにより、PAB はユーザを積極的にトラップしてトリガー実装クエリを実行させる。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:57:42 GMT)
Sympatheia: Emotionally Adaptive Voice Assistant with Continuous Affect Conditioning [17.8] 共感型音声対話システムは、ユーザの感情状態を適切に推測する必要がある。
本稿では,ユーザの音声から推測される影響を条件とした音声対話フレームワークであるSymphatheiaを紹介する。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:53:35 GMT)
STEM: Semantic Target Search and Exploration using MAVs in Cluttered Environments [17.0] 本稿では,目的探索時間と探索時間を最小限に抑えるために,意味誘導型視点プランナを用いた新しいフレームワークを提案する。
具体的には,対象に繋がる可能性のある視点を優先順位付けすることで,効率的な意味探索計画を生成するプランナーを開発する。
論文参考訳(メタデータ) (Sat, 30 May 2026 15:00:58 GMT)
Shape Your Body: Value Gradients for Multi-Embodiment Robot Design [16.6] 本稿では,汎用多体値関数を再利用可能なロボット設計モデルに変換することを提案する。
各ロボットに対して新しい強化学習協調設計ループを実行する代わりに、まず、多くのロボット設計において、実施意識と価値関数を訓練する。
論文参考訳(メタデータ) (Sat, 30 May 2026 12:21:09 GMT)
MOSAIC: Modular Orchestration for Structured Agentic Intelligence and Composition [16.4] textscMOSAICは、メモリ基底モデル選択とワークフロー構築のための構造化エージェントフレームワークである。
textscMOSAICはタスクのパフォーマンス、実行の成功、決定のトレーサビリティを改善する。
論文参考訳(メタデータ) (Sat, 30 May 2026 12:31:13 GMT)
Local Diagnostics of Continuous Normalizing Flow for Out-of-Distribution Detection [16.3] 本研究では,高次元データ空間のサブ空間に埋め込まれたターゲット観測におけるOOD(out-of-distriion)検出の問題に対処する。
本稿では,表現中の関連するコンポーネントの密度を分離し,推定するためのLagrangianサブフローフレームワークを提案する。
以上の結果から,CNFsはOODサンプルに誤って割り当てられる「様相パラドックス」に感受性があることが示唆された。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:45:30 GMT)
Beyond Pure Sampling: Hybrid Optimization Mechanisms for Non-Convex Model Predictive Control [16.2] ME-DDP に基づく手法は,コストが比較的単純で局所情報が十分に代表される低次元システムにおいて,DDP に基づく手法よりも一貫して優れていた。
その結果,コストが比較的単純で,局所的な情報が十分に代表的である低次元システムでは,DDP法を常に上回っていることがわかった。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:09:14 GMT)
Hidden Thoughts Are Not Secret: Reasoning Trace Exposure in LLMs [16.2] 推論トレースは、大きな言語モデルの能力を改善し、伝達するための学習信号の貴重な形式となっている。
能力伝達の価値は、内部の生の痕跡を隠蔽し、ほとんどの要約や回答をユーザーに公開するための推論モデルを持つ多くのデプロイシステムに動機付けている。
本研究では,このようなインターフェースレベルのトレースの隠蔽がユーザにとって,プロンプトによる効果的な推論の監督を妨げているかどうかを考察する。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:37:55 GMT)
Generate in Reconstruction Space, Match in Semantic Space: Transport Geometry for One-Step Generation [16.1] 生成モデリングと自己教師付き表現学習(SSL)は、構造的に異なる目的を最適化する。
一段階生成の枠組みにおける生成モデリングにおけるSSLの利点について検討する。
意味的に構造化されたSSL機能空間で計算すると,この目的は非常に効果的であることが分かる。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:03:47 GMT)
PaCo-VLA: Passivity-Shielded Compliance Prior for Contact-Rich Vision-Language-Action Manipulation [16.0] コンタクトリッチな操作は、高レベルのセマンティック推論と高周波接触ダイナミクスの安全な制御の両方を要求する。
本稿では,VLAインタフェースを再放送する前,パスティビティ・シールドによるコンプライアンスであるPaCo-VLAを紹介する。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:06:39 GMT)
Probe Before You Edit: Probing-Guided Molecular Optimization for LLM Agents in Structure-Based Drug Design [15.7] 2つの診断基準は、単一の編集が両方の目的をいかに改善するかを測定する。
これらのメトリクスを現在のLLMエージェントパイプラインに適用すると、一貫した障害モードが公開される。
編集応答型探索をベースとした最適化フレームワークである textbfPROBE を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:06:51 GMT)
ROG-Grasp: Root-Oriented Geometry for Robotic Grasping and Placement [15.7] 本稿では,幾何学に基づくロボットの把握と配置の枠組みであるROG-Graspを提案する。
RGB-D知覚を用いた根面形状から生成方向を推定する。
トマトとタマネギの実験は、高い成功率と安定した実行時間を示している。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:40:12 GMT)
How Neural Losses Shape VAE Latents [15.6] 再建損失の選択は, 破壊率自体の問題に反することを示す。
知覚的目的や敵対的目的といった神経用語によるポイントワイドな再構築が、潜在表現に格納される情報の量を減らすことを証明し、検証する。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:20:56 GMT)
BlockBatch: Multi-Scale Consensus Decoding for Efficient Diffusion Language Model Inference [15.4] 拡散言語モデルは、複数のトークン位置を並列に反復的に認知することでテキストを生成する。
小さなブロックはローカル条件を保存するが、多くのデノーミングステップを必要とするが、大きなブロックはより並列性を公開するが、早期のコミットとキャッシュエラーを蓄積することができる。
バッチ転送パス内で同じリクエストに対して複数のブロックサイズのブランチを実行する,トレーニング不要なオンライン推論フレームワークであるBlockBatchを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 19:57:27 GMT)
SuperMemory-VQA: An Egocentric Visual Question-Answering Benchmark for Long-Horizon Memory [15.0] SuperMemory-VQAは、実用的な長期記憶タスクでAIアシスタントを評価するデータセットである。
これには、同期RGBビデオ、音声の書き起こし、視線、IMU、SLAMトラジェクトリなど、AIメガネで記録された日常的な活動の52.9時間が含まれている。
対象と位置記憶,意図的リコール,視覚的シーンリコール,タイムライン再構築,会話記憶,コンテキスト内検索にまたがる4,853の質問応答対を構築した。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:53:10 GMT)
Dimensionality Reduction for Robust Federated Learning: A Theoretical Analysis and Convergence Guarantee [15.0] Federated Learning (FL)は、クライアントが生データを共有せずにモデルを協調的にトレーニングすることを可能にするが、ビザンティン攻撃に対して非常に脆弱である。
既存の堅牢なアプローチはこれらの脅威を中和するが、かなりの計算オーバーヘッドを発生させる。
ベクトルレベル距離に基づくロバストアグリゲータのための普遍加速度フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:48:25 GMT)
Quality Audio Prototyping: a prototype system for unified sound retrieval and procedural generation [14.9] 本稿では,コンテンツベース音声検索とプロシージャ音声生成を単一インタフェース内で統合する作業用プロトタイプQuAPについて紹介する。
QuAPは類似性に基づく検索エンジンとリアルタイムの手続き型音声モデルと、知覚情報に基づくパラメータガイダンスを提供するルールベースのアシスタントを統合している。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:05:11 GMT)
Active Learning with Foundation Model Priors: Efficient Learning under Class Imbalance [14.8] 実世界のデータセットは、しばしば歪んだクラス分布とノイズの多いアノテーションによって特徴づけられる。
本稿では,クラス不均衡を緩和し,アノテートする最も情報性の高いサンプルを選択する,革新的なアクティブラーニングフレームワークを提案する。
本手法は,最高のアクティブラーニングベースラインに比べて50%以上のアノテート節約を実現している。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:34:57 GMT)
Provably Safe Motion Planning Under Unknown Disturbances [14.6] 本稿では,未知分布のランダムな乱れに影響を受けるロボットシステムのサンプリングに基づく動作計画アルゴリズムを提案する。
安全要件は、チャンス制約として定式化される。
ケーススタディでは,厳密な安全基準下での散在した環境における有効計画が,最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 30 May 2026 01:43:59 GMT)
Momento: Evaluating Persistent Memory and Reasoning with Multi-Session Agentic Conversations [14.5] マルチセッションサービス環境における永続的エージェントタスク補完のためのベンチマークであるMomentoを紹介する。
実験結果から,現在のエージェントはユーザ状態の誤推定によってフェールすることが明らかとなった。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:08:51 GMT)
Regularized Offline Policy Optimization with Posterior Hybrid Bayesian Belief [14.4] 本稿では,力学モデルのサブセット上での凸結合として期待を再構成するポストリアハイブリッドベイズ的信念を提案する。
コンバージェンスまで単調改善のための計量に依存しない保証を提供する反復正規化政策最適化アルゴリズムを開発した。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:35:26 GMT)
Through the PRISM: Principle-Aware, Interpretable, and Multi-Scale Evaluation of Visual Designs [14.3] PRISM (PRinciple-aware, Interpretable, and Structure-Guided Design Modifications) は、測定可能な設計原則に沿ってプロのレイアウトを体系的に乱すベンチマークである。
定量的評価のための軽量スコアラーと、局所的なフィードバックのための命令調整型視覚言語モデルと、グローバル推論のためのプロンプトベースの手法を統合したマルチスケール評価フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:44:52 GMT)
On the Recoverability of Causal Relations from Bulk Gene Expression Data [14.3] 増大する計算手法は、バルク表現データから遺伝子間の因果関係を回復しようとするものである。
集約バルク遺伝子発現データから因果関係が回復可能かどうか, あるいはどの条件下でも不明である。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:42:19 GMT)
Escaping the Mode Lottery: Multi-Response Training Improves Language Model Generalization [14.0] 現代の言語モデルファインチューニングペアは、多くのプロンプトが複数の有効な完了を認めているにもかかわらず、それぞれ1つの応答でプロンプトを発行する。
これにより、マルチモーダルな条件分布をワンサンプルビューに効果的に還元し、トレーニングは可塑性モードのサブセットを強調する。
マルチレスポンス・トレーニング(MRT)について検討し、各プロンプト毎に複数の応答を保ちながら、いつ、なぜそれが役立つのかを原則的に説明する。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:30:39 GMT)
Dynamic Resilient Spatio-Semantic Memory with Hybrid Localization for Mobile Manipulation [13.7] 本稿では,メモリ,ローカライゼーション,ナビゲーション,操作を,事前に構築されたマップを使わずに,未確認の屋内環境において統合する実ロボット移動操作フレームワークであるDREAMを提案する。
ターゲットのローカライゼーションと再獲得のために、DREAMは言語条件付き3D検索、オープンボキャブラリ画像検出、マルチモーダルな大規模言語モデルに基づくセマンティック検証を組み合わせた。
DREAMはDynaMemで40%-60%、DynaMemで55%-70%に改善し、メモリフットプリント0.37-0.63GB、オンラインメモリ更新0.43-0.53を維持した。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:58:03 GMT)
Certificates without Electrons? Theory and Evidence on Impacts from AI-Driven Power Demand [13.5] 現在、データセンターは米国の電力需要の4.4%を占めている。
我々は、データセンターオペレータがREC、PPA、および後方容量を選択するゲーム理論モデルを開発する。
エッジ推論,空間的再配置,コロケーションストレージがグリッドの影響を大幅に軽減することを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:57:05 GMT)
PropLLM: Propagation-Aware Scene Reconstruction for Network Fault Diagnosis [13.5] 本稿では,最初にホップ・バイ・ホップのシーン再構築パラダイムとLLMの生成的推論能力を統合するPropLLMを提案する。
実世界のWi-Fiマルチモーダル障害データセットでは、PropLLMは障害タイプ診断の精度を3.9%改善し、根本原因のローカライゼーションの精度は4.7%向上した。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:18:42 GMT)
Behavior-Invariant Task Representation Learning with Transformer-based World Models for Offline Meta-Reinforcement Learning [13.5] 本稿では,情報理論に基づくタスク表現学習とトランスフォーマーに基づく世界モデルを統合する新しいフレームワークを提案する。
本手法は, 安定度が向上し, アウト・オブ・ディストリビューション, スパース・リワード設定に優れ, 最先端の手法よりも優れる。
論文参考訳(メタデータ) (Sat, 30 May 2026 15:53:03 GMT)
CASTLE2026 Team WDL Technical Report [13.3] CASTLE Challenge @ EgoVis 2026は、600時間以上のマルチパースペクティブな録音に答える、長めのエゴシックなビデオ質問を評価している。
我々はQwenに基づくエビデンスを考慮したマルチモーダル推論パイプラインを提案する。
我々のシステムは、質問ヒントを解析し、ASRチャンクを検索し、補助画像を取り付けて、候補となるビデオフレームをサンプルし、質問を静的な視覚、音声/テキスト、時間、混合タイプに、特別なプロンプトでルーティングする。
論文参考訳(メタデータ) (Sat, 30 May 2026 12:41:52 GMT)
Pause and Think: A Dataset and Benchmark for Video-Grounded Assistive Action Suggestion [13.1] これは、モデルが一時停止し、視覚的エビデンスを推論し、実行可能な応答を生成することを奨励する、推論中心のトレーニングデータセットです。
このデータセットは、回答の生成に先立って構造化推論を促進し、人間のようなシーンベースの支援に向けてモデルを導く。
実験結果から,目標推論により,学習データを超えた行動的,視覚的なガイダンスを,コンパクトなモデルで提供できることが示唆された。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:33:55 GMT)
Hypothesis Generation and Inductive Inference in Children and Language Models [12.8] 子どもの情報探索行動は,その基盤となるコストと帰納的バイアスを明瞭に表している。
子どもたちは環境構造に似通っているが、情報探索行動は、その基盤となるコストと帰納バイアスをはっきりと示している。
論文参考訳(メタデータ) (Sat, 30 May 2026 22:18:51 GMT)
Graph Transfer Learning via Shared Latent Geometry: Theory and Applications [12.7] 工学的な物理システムにおける推論と制御は、展開において重い物理コストを支払う。
両問題を解決する非対称な双方向アーキテクチャを提案する。
教師エンコーダは、高忠実度シミュレータから特権化された高密度状態を消費し、スペクトル摂動下で安定な演算子-ポリノミカル特徴を通してシステムを表現する。
学生エンコーダは、スパースフィールドデータと演算子記述子から同じ潜時幾何学を学習する。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:00:13 GMT)
Benchmarking Security Risk Detection and Verification in Open Agentic Skill Ecosystems [12.7] オープンエージェントスキルエコシステムのための2段階のセキュリティ検証ベンチマークであるSkillVetBenchを紹介します。
最初のステージでは、各スキルの自然言語仕様に対してセマンティックな検証を行い、隠れた悪意のある意図を検出する。
第2ステージは、計測されたサンドボックスでフラグ付きスキルを実行し、実行時の振る舞いを観察し、監査可能な証拠を収集する。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:19:30 GMT)
LASER: Loss-Aware Singular-value Decomposition and Rank Allocation for Efficient Low-Precision Vision-Language Models [12.5] 視覚言語モデル(VLM)は、強力なマルチモーダル推論機能を提供するが、その計算コストと高いパラメータ数によって、リソース制約のあるデバイスへの展開が困難になる。
提案するtextitER(textbfLoss-textbfLASAware textbfSingular-value dtextbfEcomposition and textbfRank allocation)は,低精度なVLM推論のための低ランク圧縮フレームワークである。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:53:23 GMT)
Framework for Discovering GPS Spoofing Attacks in Drone Swarms [12.1] 攻撃者がSwarm制御アルゴリズムの脆弱性を利用してドローンのSwarmを破壊する方法を示す。
我々はSwarmFuzzGraphとSwarmFuzzBinaryという2つのファジリングツールを導入し、Swarm制御アルゴリズムでSPVを効率的に見つける。
論文参考訳(メタデータ) (Sat, 30 May 2026 21:59:33 GMT)
BEVIO: Efficient Bird's-Eye-View based Sparse-Update Visual-Inertial Odometry for Lunar Day-Night Navigation [12.0] 本研究は,月面ローバーの信頼性の高い視覚-慣性オドメトリー (VIO) の実現について検討する。
本研究では,大きなフレーム間動きに対して頑健であり,視覚的変化が著しいにもかかわらず,より信頼性の高い特徴マッチング方式として,Bird's Eye View (BEV) を用いた画像マッチング方式を提案する。
以上の結果から, 夜間および夜間の自己照度トラバースを視認率0.25Hzで実現できることが示唆された。
論文参考訳(メタデータ) (Sat, 30 May 2026 12:32:18 GMT)
Ryze: Evidence-Enriched Data Synthesis from Biomedical Papers [12.0] Ryzeは、生のバイオメディカルペーパーをエビデンスに富んだトレーニングセットとドメイン特化VLMに変換する、完全に自動化されたシステムである。
Qwen3-VL-8Bを皮切りに、RyzeはバイオVLM-8BをUSD 200以下で製造し、LAB-Benchで48.0%の精度で製造した。
トレーニング済みのBioVLM-8Bモデルとともに、Ryzeをオープンソースとしてリリースします。
論文参考訳(メタデータ) (Sat, 30 May 2026 21:54:02 GMT)
GABI: Geometry-Aware Boundary Integration for Spacecraft Segmentation [11.8] 本稿では,畳み込みバックボーンを補助的な距離場予測ヘッドで拡張する,軽量な境界対応マルチタスクセグメンテーションアーキテクチャを提案する。
距離場は、物体の境界に関する密集した幾何学的監督を提供し、ネットワークが宇宙船構造の空間的に一貫した表現を学ぶことを奨励する。
クロスドメイン評価では、軽量GABIは、より重いトランスモデルのF1スコアとIoUの5%以下で動作し、約10倍小さい。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:44:03 GMT)
Richer Representations for Neural Algorithmic Reasoning via Auxiliary Reconstruction [11.7] 符号化された表現から入力状態を復元することを目的とした再構成モジュールを提案する。
この補助的な再構成タスクは、エンコーダが入力に関する重要な情報を保持することを奨励する。
トレーニング中にこのタスクを組み込むことで、既存のニューラルネットワークの性能が標準ベンチマークで向上することを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:23:30 GMT)
FALAT: Tracing Failures in LLM Agent Trajectories via Dependency-Guided Search [11.6] LLMエージェントトラジェクトリにおける障害帰属の診断フレームワークであるFALATを提案する。
我々は、アルゴリズム生成と手作りのマルチエージェント障害軌跡を含むWho&WhenベンチマークでFALATを評価する。
論文参考訳(メタデータ) (Sat, 30 May 2026 15:11:35 GMT)
Real-Time Physics Simulation with Dynamic Mesh-Gaussian Reconstructions [11.5] 物理のための固定トポロジーメッシュとレンダリングのためのガウススプラッティングを組み合わせた二重表現フレームワークを提案する。
DG-Meshデータセット上のネイティブ固定位相法(MaGS)に対して,時間的対応追跡とテンプレートベースプロジェクションの2つの変換戦略を評価する。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:30:11 GMT)
Beyond Static Gaussians: An Empirical Investigation of Architectural Paradigms for Dynamic 3D Scene Reconstruction [11.5] 3D Gaussian Splatting(3DGS)による動的シーン再構築は、進化する環境を表現するための魅力的なアプローチとして現れている。
本稿では,動的3DGS手法の包括的解析を行い,それらを2つのパラダイムに分類する。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:42:38 GMT)
Shortcut to Adiabatic Isomeric Population Transfer of the $^{229}\mathrm{Th}$ Nucleus via Hyperfine Electronic Bridge [11.2] 超微細電子橋は、229$Thの核異性体レベルの効率的かつ正確な操作を可能にすることが示されている。
本研究では,数百ミリ秒から数百マイクロ秒までの操作時間を劇的に短縮するRamanショートカット・アンド・アダバティック・パス法を用いる。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:30:04 GMT)
Optimizing 3D Gaussian Splatting via Point Cloud Upsampling [11.2] 3D Gaussianting(3DGS)は、3Dシーンの作成とレンダリングのためのテクニックである。
この研究は、いくつかの点の雲のアップサンプリング手法を提示し、評価する。
様々な場面で再現性の向上を示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:42:17 GMT)
Physical Object Understanding with a Physically Controllable World Model [11.1] ビジュアルインテリジェンスにおける中心的な課題は、生のビデオからシーンの物理的構造を学ぶことである。
本稿では,視覚変数の確率推定を支援する確率論的世界モデルについて紹介する。
私たちの世界モデルは3Dでオブジェクトを操作できることを示し、Visual Jengaのようなアプリケーションを可能にします。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:10:32 GMT)
FiSeR: Fine-Grained Source Representations for Cross-Domain AI Image Detection [10.9] 自然と合成の機能は、未確認のデータセットでは部分的に分離可能であるが、パフォーマンスは依然として低下している。
自然画像と合成画像の分離性を向上する階層的コントラスト学習フレームワークを提案する。
提案手法は,Chameleon,AIGIBench,Community Forensics,GenImageに対するドメイン横断評価において,平均AUROCの+10.22のゲインを達成している。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:08:27 GMT)
Sequential statistical inference for Large Language Models: Representation, validity, and monitoring [10.9] この議論は、逐次統計推論がLLMの信頼性に自然に寄与すると主張している。
この議論は、相互作用を依存したプロセスとしてモデル化すること、妥当性、不確実性を保証すること、モニタリング、シーケンシャルアラームと変化点検出を使用してキャリブレーション、幻覚率、拒絶行動、公正性、その他のタスク関連特性のシフトを特定する3つのタスクで構成されている。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:20:35 GMT)
T-CLIP: Enabling Thermal Perception for Contrastive Language-Image Pretraining [10.8] 熱画像は、低照度や悪天候といった困難な条件下で、可視光の視覚に強力な代替手段を提供する。
しかし、CLIPのような基本的な視覚言語モデルは、基本的な熱知覚ギャップのため、熱画像とテキスト記述との整合に失敗する。
本稿では,最初の物理対応型サーマルキャプティングパイプラインとデータセットであるIR-Capと,CLIPをシーンレベルおよびオブジェクトレベルのサーマル理解に独立に適応する分離二重LoRAフレームワークであるT-CLIPを紹介する。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:03:58 GMT)
SpikeHash: Learning Binary Codes with Spiking Neural Networks for Cross-Modal Hashing Retrieval [10.8] クロスモーダルハッシュ検索は、ハミング空間を効率的に探索するために、異種データをコンパクトなバイナリコードに符号化する。
スパイク状態の進化、方向スパイク相互作用、競合スパイクリードアウトとしてクロスモーダルハッシュを定式化する統合スパイクフレームワークであるSpikeHashを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:14:59 GMT)
Robust Reasoning via Dynamic Token Selection for Distribution-Aligned Self-Distillation [10.7] 自己蒸留は、モデル自身の分布によくマッチするトレーニングデータとして参照回答を書き換えることで、学習効率を向上させる。
しかし、参照された答えはまた、強いスタイル的バイアスをもたらし、生成モデルは有用な推論パターンを学ぶのではなく、表面の形状を模倣する。
本稿では,DASD(Distributed-Aligned Self-Distillation)を提案する。これは,応答認識参照モデルを用いて候補トークンを生成し,ベースモデルの信頼性に応じて動的にフィルタする。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:03:03 GMT)
Robust Contrastive Graph Clustering with Adaptive Local-Global Integration [10.2] マルチスケールな局所構造とグローバルなセマンティクスを協調的に統合するグラフクラスタリングフレームワークを提案する。
8つの実世界のグラフデータセットに対する実験により,本手法が競合クラスタリング性能を実現することを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:28:25 GMT)
Meta-Black-Box Optimization with Ensemble Surrogate Modeling for Robustness-Accuracy Trade-off within SAEA [10.1] 本稿では,アダプティブ・アンサンブル・サロゲート支援進化アルゴリズムであるAdaE-SAEAを提案する。
AdaE-SAEAはSAEAをMetaBBOフレームワークの低レベルとして組み込み、インフィル基準とアンサンブルに基づくサロゲートモデリングを共同で制御する。
AdaE-SAEAは最先端のベースラインやMetaBBOベースの手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 19:26:32 GMT)
GIRL-DETR: Gradient-Isolated Reinforcement Learning for Video Moment Retrieval [10.0] ビデオモーメント検索(VMR)タスクは、自然言語クエリに沿った時間境界を正確にローカライズする必要がある。
GIRL-DETRは、RLポストトレーニングを、初めて軽量な時間的ローカライゼーションフレームワークに導入する。
論文参考訳(メタデータ) (Sat, 30 May 2026 15:40:00 GMT)
GEO-Bench: Benchmarking Ranking Manipulation in Generative Engine Optimization [9.8] 本稿では,GEOランキング操作攻撃を1つのプロトコルで評価するベンチマークであるGEO-Benchを提案する。
ブラックボックスのプロンプトベースの攻撃(TAP、ゼロショット)、ホワイトボックスのグラデーションベースの攻撃(STS、RAF、StealthRank)、ホワイトハットのC-SEO戦略を統一する。
固定されたオープンウェイトローダに対して、5つのデータセットですべてのメソッドをスコアします。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:12:24 GMT)
DREAM-S: Speculative Decoding with Searchable Drafting and Target-Aware Refinement for Multimodal Generation [9.7] 投機的復号化(SD)は,大規模言語モデル(LLM)における自己回帰生成の促進に有効な手法であることが証明されている。
視覚言語モデル(VLM)の高速かつ効率的な復号化を目的とした新しいSDフレームワークであるtextitDREAM-S を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:05:24 GMT)
GAP3D: Generative Alignment of VLM Latents to Patch-Level Embeddings for 3D Generation [9.6] GAP3Dはモジュラーで拡散に基づくアプローチで、VLMラテントを事前訓練された画像エンコーダの完全なパッチレベルの特徴空間に直接アライメントする。
本手法は,汎用画像とテキストのペアを主にトレーニングすることで,大規模3Dデータの必要性を回避している。
また、テキスト入力のみにトレーニングされているにもかかわらず、マルチモーダルプロンプトの緊急ゼロショット機能も備えている。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:00:39 GMT)
CAFOSat: A Strongly Annotated Dataset for Infrastructure-Aware CAFO Mapping Using High-Resolution Imagery [9.6] 集中型動物給餌作戦(CAFO)は農業生産において重要な役割を担っているが、環境、公衆衛生、疾病の監視にも関与している。
CAFOSatは、米国全域にわたるCAFOマッピングのための、強力な注釈付きインフラ対応データセットである。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:47:46 GMT)
Infeasible optimization problems and the hierarchical augmented Lagrangian method in imitation learning [9.3] 本研究では, 拡張ラグランジアン法に関する最近の理論的結果に基づいて, 実現不可能な環境下での簡易な対策について検討する。
提案手法は, 望ましい特性を持つ最寄りの制約付きIL問題の解決に向けて, 学習方針を推し進めていることを示す。
本手法は,全加速度制約と歩行者安全制約を具備した玩具運転例において,安全政策を許容しつつも,不実現性を自然に生み出すことができる設定について説明する。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:50:04 GMT)
EPIC: Efficient and Parallel Inference under CFG Constraints for Diffusion Language Models [9.3] 現在の手法は、制約のない復号化よりも最大4倍遅い。
本稿では,この制限に対処する効率的なCFG制約付きデコーディングフレームワークEPICを提案する。
本手法は,レキシングメモ化,決定論的オートマトンの代わりにEareyスタイルの構文解析による検証,並列コミットのための互換性のあるサブセット選択を緩和することにより,デコード効率を向上させる。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:20:03 GMT)
GNMR: Runtime Stability Control for Low-Precision Large Language Model Training [9.3] 訓練安定性は、低精度言語モデルのトレーニングにおいて重要なボトルネックである。
これを実行時安定性制御として定式化し、GNMR(Gradient Norm-to-Mean Ratio)を提案する。
GNMRは、ハードな$mathrmmaxO$予算と短いロック間隔の下で、局所的なリスク信号を有界回復行動にマッピングする。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:11:13 GMT)
CUPID in the Model Zoo: Online Matchmaking for Selecting Your Dream LLM [9.2] 本稿では,並列帯域アルゴリズムが反復的にLLMのペアを選択する,対話効率のよいアクティブラーニングフレームワークを提案する。
我々は,本モデルがユーザに対して低コストで,適切に整合したLCMを効率的にマッチングできることを実験的に検証した。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:47:03 GMT)
Generative Diffusion Priors for 3D Mapping of the Dark Universe [9.2] 弱いレンズの観測からダークマターの3次元分布を再構築することは、宇宙論における中心的だが非常に不適切な逆問題である。
これにより、宇宙時間でダークマター構造の完全な3D分布をキャプチャする前に、データ駆動拡散モデルを学ぶことができます。
現代の弱レンズ調査を対象とする現実的なシミュレーションでは,ベースライン法よりも大幅に改良された2次元および3次元再構成精度が得られた。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:42:15 GMT)
Rethinking Bregman Divergences in Kronecker-Factored Optimizers [9.1] Frobenius, von Neumann, LogDet の発散は避けられない Kronecker 近似誤差が異なることを示している。
上部分空間に固有値に基づくプレコンディショニングを適用し,下部分空間に適応等方的加速度定数を用いる部分空間対応Kroneckerを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:17:48 GMT)
CARE-RL: Capability-Aware Reinforcement Learning for Mitigating Cross-Domain Conflicts [9.1] 本稿では、プロトコル対応の報酬生成と機能対応の最適化を組み合わせることで、ドメイン間の競合を緩和するCARE-RLを提案する。
検証不能なタスクに対して、Protocol-Aware Generative Reward Model (PA-GRM)は、トレース条件付き報酬を生成する前に、プロンプトレベルの評価プロトコルとスキーマを構築する。
数学、チャット、命令追従ベンチマークによる実験では、CARE-RLは標準のマルチドメインRLベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:18:40 GMT)
Robust inference for risk heterogeneity under group imbalance [8.7] 集中治療単位研究において、特定の入院診断に関連する死亡リスクは、民族群によって異なる可能性がある。
リスクの不均一性を検出する既存のアプローチは、しばしばベースラインモデルの誤特定と正規化バイアスに敏感である。
本研究では,Nymanity推定器を用いて2つの集団間のリスク不均一性を推定するための頑健な枠組みを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:35:45 GMT)
Task Structure Reverses Layerwise State Encoding in Sequence Models [8.4] タスクが変更されたとき、同じアーキテクチャがこのプロファイルを反転させるのが分かります。
微調整されたMamba-130MとPythia-160Mでは、ParityはMambaとリカレントベースラインに徐々に集中し、Transformerによって徐々に建設された。
同じフリップが微調整されたMamba-130MとPythia-160Mに現れ、Pythia Dyckのボトルネックは410Mで持続する。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:26:29 GMT)
Detection vs. Execution: Single-Bucket Probes Miss Half the Mamba-2 State Sink [8.4] 単一バッファプローブがMamba-2の小さな実行層のみを復元することを示す。
マンバ-2では、状態シンクは2つの機能的ヘッドセットに分解される。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:37:01 GMT)
Looped Transformers with Layer Normalization Provably Learn the Power Method [8.4] 層正規化(LN)を用いた変圧器のトレーニング力学を理解するためのテストベッドとしての主成分予測について検討する。
その結果,LNを用いたループおよび単層変圧器のトレーニング力学を初めて理論的に解析し,変圧器モデルにおけるLNの役割に光を当てた。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:05:27 GMT)
A NISQ-Aware Hybrid Quantum-Classical Framework for Scalable Combinatorial Optimization [8.2] 本稿では,資源境界分布進化過程として大規模最適化を再構成するハイブリッド量子古典最適化フレームワークを提案する。
個々の解を直接最適化する代わりに、提案するフレームワークは、解空間の確率的表現で機能する。
ベンチマークと合成データセットに関する大規模な実験は、提案されたフレームワークが古典的および量子的に着想を得たベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:17:07 GMT)
One (Thread) Can Keep a (PRNG) Secret, but not Two [8.1] 本稿では,XNU の IPv6 フラグメントID 生成アルゴリズムに対する,新しい実用的な攻撃法を提案する。
この攻撃はアルゴリズムの擬似乱数生成器(PRNG)における競合条件の脆弱性を利用する
Appleはこの脆弱性をCVE CVE-2024-27823に割り当て、攻撃に対してXNUベースのすべての製品にパッチを当てた。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:00:31 GMT)
Decoupled Behavioral Cloning for Scalable Inductive Generalization in RL from Specifications [7.9] DIBSは、学習タスク固有のポリシーと進化関数の学習を分離する。
まず、標準RLを用いてタスク毎の個別の教師ポリシーを学習し、その後、教師ラベル付き状態-行動ペアの行動的クローンを通して進化関数に適合する。
これはノイズの多い報酬の集約を、密度の高い安定した監視に置き換える。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:26:59 GMT)
Global-Local Attention Decomposition for Terrain Encoding in Humanoid Perceptive Locomotion [7.9] 人型移動における地形符号化のためのグローバルローカルアテンション分解(GLAD)を提案する。
実験により、GLADは難解な隙間、石段、階段上での信頼性の高い移動を可能にすることが示された。
実世界におけるLiDARを用いたUnitree G1ヒューマノイドロボットの展開において,提案手法はロバストなゼロショット・シム・トゥ・リアルトランスファーを実現する。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:23:07 GMT)
Subliminal Learning is a LoRA Artifact [7.7] サブリミナルラーニング(Subliminal learning)は、言語モデルが一見無害なデータを通じて、他のモデルに行動特性を伝達できる現象である。
サブリミナル学習はLoRAアーティファクトであることを示す。サブリミナル学習が発生すると、トランスミッションはLoRAランクと逆U字型の関係を持ち、完全な微調整で消滅する。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:05:35 GMT)
When Safe Skills Collide: Measuring Compositional Risk in Agent Skill Ecosystems [7.6] LLMエージェントは、エージェントの運用能力を拡大するコミュニティに貢献するスキルにますます依存している。
エージェントAIシステムにおける中核的な安全問題として、安全でないスキルが安全でないスキルセットに構成できるかどうかについて検討する。
3つのコンポーネントからなる構成セキュリティ測定フレームワークであるSkillReactを紹介します。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:38:07 GMT)
SHARP: Sleep-based Hierarchical Accelerated Replay for Long Range Non-Stationary Temporal Pattern Recognition [7.6] SHARP(Sleep-based Hierarchical Accelerated Replay)は、時間学習を2つの補完的なコンポーネントに分解するフレームワークである。
SHARPは、緩やかな睡眠中に、げっ歯類で観察される加速されたリプレイにインスパイアされ、時間的に構造化されたメモリトレースをアクセラレーションされた形で再生するオフライン(スリープ)フェーズを組み込む。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:55:02 GMT)
"I Strongly Suspect This Website Is a Scam": Benchmarking PII Leakage and Detection without Defense in Autonomous Web Agents [7.5] ソーシャルエンジニアリング攻撃は、フロンティアWebエージェントからクリティカルレベルPIIを抽出するのに非常に効果的である。
最重要レベルのPIIリークは、プライバシガイダンスなしで54~93%に達する。
以上の結果から,攻撃に対するエージェント自身の認識に条件付けされた防御が,誤ったシグナルを鳴らしていることが判明した。
論文参考訳(メタデータ) (Sat, 30 May 2026 03:00:28 GMT)
Locality-Induced Hierarchical Backflow Wavefunctions for Correlated Fermions [7.4] 局所性は、バックフローの波動関数を階層的に整理する自然な原理を提供することを示す。
本稿では、階層バックフロー(HB)波動関数と呼ばれる変分フェルミオン状態の族を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:18:37 GMT)
SORA: Free Second-Order Attacks in Fast Adversarial Training [7.4] 対人訓練(Adrial Training、AT)は、敵の事例に対する主要な防御である。
ATは、効率的な単一ステップの変種において、しばしばカタストロフィックオーバーフィッティング(CO)に悩まされる。
我々は、損失表面形状に基づいて動的に摂動を調整する適応的なステップサイズAT法であるSORAを紹介する。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:10:32 GMT)
NICE: A Framework for Declarative and Machine-Checkable Vulnerability Reproduction [7.1] NIx CvE再現フレームワークであるNICEは、宣言的なレシピを使用して脆弱な環境を構築し、自動的に検証する。
我々は、複数のCWEカテゴリ、攻撃ベクトル、ターゲットタイプにまたがる19の現実世界CVEについて、NICEを評価した。
NICEはセキュリティ教育やトレーニング(サイバーレンジの作成など)にも適用でき、脆弱性報告にも適用できる。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:59:40 GMT)
Skill or Skip? Learning Selective Skill Invocation in Agentic Tasks via Dual-Granularity Preference Learning [7.0] SelSkillは、選択的なスキル実行のための二粒度選好学習フレームワークである。
Qwen3-8BのALFWorldでは、SelSkillはタスク成功率を10.9ポイント、実行精度を29.1ポイント改善している。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:00:23 GMT)
Statistical Analysis of using the Shapley Value for Sensor Anomaly Localization with Accurate Classifiers [7.0] 本研究では,センサ観測のシャプリー値を用いて,その観測が異常であるかどうかを判定する。
2つのセンサーが関係する一般的な観察ケースについては、これらの2つのテストが根本的に異なることを証明している。
論文参考訳(メタデータ) (Sat, 30 May 2026 19:45:30 GMT)
DriveAnchor: Progressive Anchor-based Flow Learning for Autonomous Driving Planning [6.8] DriveAnchorは、自動運転計画のためのフレームワークである。
構成可能なパイプラインにおいて、振る舞いの多様性、制御可能性、安全性を実現する。
近距離衝突速度を89%削減し、模倣精度を低下させることなく平均報酬を32%改善する。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:17:59 GMT)
Semi-Supervised Learning with Noisy Proxy Covariates: Generalization Bounds and Distribution Regression [6.8] 高速ラベル付きサンプルレートはプロキシが制御されたときに回収されることを示す。
また, 分布回帰は, 有限袋径が十分大きい場合に, 類似の保証を伴って, 直接特別な場合であることを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:01:14 GMT)
ProjQ: Project-and-Quantize for Adapter-Aware LLM Compression [6.6] トレーニング後の量子化(PTQ)とローランド適応(LoRA)は、LLM(Large Language Model)の効率的なデプロイメントのための標準パイプラインである。
量子化雑音を低ランク多様体に制約する新しいフレームワークである textbfProjQ を提案する。
ProjQは、量子化エラー補償と下流タスクの微調整の両方において、既存のメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:54:40 GMT)
EST-PRM: Stress-Testing Process Reward Models Before They Become Load-Bearing [6.3] プロセス報酬モデル(PRM)は、ステップレベルの厳密な監督を伴う言語モデルトレーニングで広く使用されている。
この仮定は十分に検証されていないと我々は主張する。
我々は,高密度プロセス報酬のためのストレステストフレームワークである textbfEST-PRM を紹介する。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:05:14 GMT)
HASA: Subnet Allocation for Compute-Constrained Model-Heterogeneous Federated Learning [6.2] エッジサービスは、フェデレーション学習を使用してデバイス上のモデルをパーソナライズし、機密データをローカルに保持する。
実際には、デプロイはクライアントリソースとローカルデータ分散の両方を扱う必要があります。
本稿では、クライアントの不均一度スコアに基づいて幅を割り当てる列車専用ルールであるHASAを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:21:48 GMT)
Query Lens: Interpreting Sparse Key-Value Features with Indirect Effects [6.2] より包括的で忠実なスパース機能解釈を可能にするために,Logit Lensを拡張したQuery Lensを提案する。
エンコーダ側のキー特徴とデコーダ側の値特徴を共同で検討することにより、特徴を活性化する入力と、それが促進する出力の両方を識別する。
実験では、Query LensはLogit Lensでは解釈不能な機能に対してコヒーレントなトークンシグネチャを生成する。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:01:18 GMT)
Spatiotemporal Multi-Task Graph Transformer for Trip-Level Transit Prediction [6.1] 既存のアプローチは、しばしば固定時間的、空間的、あるいは停止レベルの時間的モデリングに依存している。
本研究では,連続列モデルとしてトリップレベル遷移予測をフレーム化するマルチテンポラルグラフ変換器を提案する。
主要なコンポーネントは、マルチリレーショナルな類似性のためのグラフ埋め込み、天気と時間情報のためのコンテキストエンコーダ、タスク固有のデコーダ表現を生成する混合専門家モジュールである。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:49:26 GMT)
SafeVLA-Bench: A Benchmark for the Success-Safety Gap in Vision-Language-Action Models [5.9] ビジョン言語アクション(VLA)ベンチマークは、ポリシーが要求された操作タスクを完了するかどうかを測定する。
本稿では,既存のシミュレータベースのVLAベンチマークの安全性評価フレームワークであるSafeVLA-Benchを紹介する。
論文参考訳(メタデータ) (Sat, 30 May 2026 15:31:57 GMT)
Certificate-Guided Evaluation of Reinforcement Learning Generalization [5.9] 本稿では,強化学習アルゴリズムが生成した軌跡を検証できるニューラル証明関数を提案する。
我々は,いくつかの最先端の一般化可能なRLアルゴリズムの一般化を実証的に証明する手法の能力を実証した。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:31:57 GMT)
Dive into Waves: Morlet Spectral Transformer for Cross-Subject Emotion Decoding from EEG [5.9] クロスオブジェクト感情認識は、脳-コンピュータモデリングにおいて事実上重要な問題であるが難しい問題である。
既存のアプローチは、大きな事前訓練された基礎モデルに依存しており、大量のデータを必要とするが、それでもクロスオブジェクトの変動に苦慮している。
本稿では,3つのインタフェースを中心に構築されたMorlet Spectral Transformer (MST)を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:38:34 GMT)
The Paradox of Outcome Optimization: A Causal Information-Theoretic Bound on Reasoning Shortcuts in LLMs [5.8] 結果に基づく強化学習(RL)を通じて整列された大規模言語モデル(LLM)は、しばしば重大な障害モードを示す。
我々は,このパラドックスを説明するために,構造因果モデル(SCM)と情報ボトルネック(IB)の原理をブリッジする理論的枠組みを確立する。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:06:13 GMT)
DINO-GFSA: Geo-Localization via Semantic Gated Fusion and Mamba-based Sequential Aggregation [5.7] 非有人航空車両(UAV)の自己位置決めとFSA搭載環境における目標位置決めには、クロスビューな地理的ローカライゼーションが重要である。
本稿では,パラメータ効率の高い高容量表現にLoRA(Low-Rank Adaptation)を適応したDINOv3バックボーンを利用するフレームワークであるDINO-GFSAを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:03:39 GMT)
EnergyMamba: An Uncertainty-Aware Graph-Enhanced Selective State Space Model for Energy Consumption Prediction [5.7] 本研究では,エネルギー消費予測のための不確実性を考慮した時間的学習フレームワークであるEnergyMambaを提案する。
フロリダ、ニューヨーク、カリフォルニアの4つの大規模実世界のデータセットでEnergyMambaを評価した。
その結果,EnergyMambaは予測精度が約5%向上し,精度が6%向上した。
論文参考訳(メタデータ) (Sat, 30 May 2026 03:39:15 GMT)
Not All Flips Are Conformity: Decomposing Stance Convergence in Multi-Agent LLM Debate [5.7] 従来の解答フリップは, 自発的不安定性, 姿勢による適合性, 推論による説得の3つのメカニズムを混同している。
我々の3ソース分解フレームワークは、制御された対策条件によってそれぞれを分離する。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:41:11 GMT)
Hallucination Is Linearly Decodable from Mid-Layer Hidden States in Quantized LLMs [5.6] 我々は,LLMが隠れた状態で線形分離可能な信号を符号化し,どのネットワーク深度でこの信号が最強かを検討する。
4つのベンチマーク(TruthfulQA, HaluEval-QA, FEVER, 制御された合成集合)で層当たりの隠れ状態を抽出する。
Peak Probing Layerは、自然言語ベンチマークでモデルファミリ間で一貫したバンドに落ちます。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:04:30 GMT)
COPF: An Online Framework for Deployment-Stable Counterfactual Fairness in Evolving Graphs [5.6] COPF(Counterfactual Online Performative Fairness)は、オンラインリンクレコメンデーションにおいて、デプロイ可能な公正度監視と制御のための決定層フレームワークである。
COPFは、露光に対するグループレベルの機会ギャップ(図示されない)を定義している。
COPFは, 被曝群間差の最悪のスパイクを低減し, ランキングユーティリティにわずかに影響を及ぼすことを示した。
論文参考訳(メタデータ) (Sat, 30 May 2026 12:15:07 GMT)
Learning with Active Quantum Subspaces: Scalable Hybrid Advantage without Full Quantum Data-Encoding [5.5] 量子状態に古典的な大きな入力を埋め込むことなく、量子学習の利点が持続できるかどうかを考察する。
我々は、入力の情報を含むサブセットのみを量子表現に持ち上げる、アクティブな量子サブスペースデータ符号化を導入する。
本結果は,QRAMのないハイブリッド学習を一般化し,NISQ互換の量子優位性に向けたスケーラブルな経路を提供する。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:40:28 GMT)
Edge-Based QoS-Aware Adaptive Task Placement: A Closed-Loop Control in Multi-Robot Systems [5.5] 本稿では、Raspberry Piノードを用いて、カメラとマニピュレータのパイプラインを評価するパイロットエッジ中心型MSSテストベッドを提案する。
その結果、ATP対応コントローラは、測定されたレイテンシと利用しきい値に基づいてタスク配置を切り替えることで、納期違反や末尾遅延を一貫して低減できることがわかった。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:54:44 GMT)
Quantum Tunneling-Aware Machine Learning: Physics-Derived Noise Models for Robust Deployment [5.4] 量子トンネル対応機械学習(QTAML)を紹介する。
We derived the deployment-time weight-error distribution from first principles using the Wentzel-Kramers-Brillouin (WKB) approximation。
我々は,これらの構造特性を単一配置時アルゴリズムであるTunning-Aware Compensation (TAC) にパッケージ化し,閉形式平均補正と最適層予算配分を組み合わせた。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:21:16 GMT)
Scaling Behavior of Single LLM-Driven Multi-Agent Systems [5.2] マルチエージェントシステム(MAS)は、協調的な知性によって複雑なタスクに取り組むことを約束する。
本稿では, エージェント数の増加に伴い, 均質MASの性能がどう進化するかを系統的に検討する。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:57:49 GMT)
A Four-Tier Communication Architecture and Sim-to-Real Validation of a Graphical Open-Source Platform for Robotic Engineering Education [5.2] 本稿では,持続可能なロボットカリキュラムに適した,スケーラブルな4層通信アーキテクチャを提案する。
仮想設計と物理的実行をブリッジすることで、このアーキテクチャの青写真は、エンジニアリング教育のための実行可能なインフラを提供する。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:51:11 GMT)
Mitigating Hallucinations in Large Language Models Via Decoder Layer Skipping [5.2] 大規模言語モデル(LLM)は、様々な自然言語タスクで高いパフォーマンスを達成しているが、その出力は幻覚に悩まされることが多い。
textbfDeLask(textbfDecoder textbfLayer textbfSkipping)は、動的にレイヤをスキップして幻覚を発生させる新しいデコードフレームワークである。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:40:11 GMT)
Towards Lightweight Reliability: Using Soft Prompts for Hallucination Mitigation in Large Language Models [5.0] 大規模言語モデル(LLM)は様々な領域で広く採用されているが、その信頼性はしばしば幻覚によって損なわれている。
高リスク領域では、これらのエラーは信頼を減らし、現実世界のリスクをもたらす。
本稿では、ソフトプロンプトを用いて幻覚的コンテンツを緩和し、責任ある棄権を促進するパラメータ効率のアプローチを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:02:33 GMT)
TAP-JEPA: Frozen Future-Latent Probing and Two-Stage Score Fusion for EPIC-KITCHENS-100 Action Anticipation [4.8] 本報告では,EgoVis 2026におけるEPIC-KITCHENS-100(EK-100)アクション予測チャレンジの受注であるTAP-JEPAについて述べる。
タスクは、次の動詞、名詞、動詞のアクションを、目的のアクションが始まる前に終わるエゴセントリックなクリップから予測することである。
大規模なビデオバックボーンを微調整する代わりに、TAP-JEPAは凍結したV-JEPA 2.1の機能でコンパクトな予測モデルを構築する。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:23:12 GMT)
FROST-STA: Frozen Dense Features for the Ego4D Short-Term Object Interaction Anticipation [4.8] 本報告では,EgoVis 2026におけるEgo4D Short-Term Object Interaction Precipation (STA) Challengeへの提案であるFROST-STAについて述べる。
各クエリ時間について、このモデルは、アクティブオブジェクトボックス、名詞ラベル、動詞ラベル、TTC(Time-to-Contact)、信頼度を含むランク付けされた構造化仮説を生成する。
FROST-STAは、V-JEPA 2.1 STA評価プロトコルをベースにしているが、オブジェクト中心のデコード、マルチヘッド予測、提案指向のトレーニングとアンサンブルのレシピを使用することで、この問題に適応している。
論文参考訳(メタデータ) (Sat, 30 May 2026 12:07:32 GMT)
KACE: Knowledge-Adaptive Context Engineering for Mathematical Reasoning [4.7] 知識適応コンテキスト工学(KACE)を紹介する。
KACEはストレージを、難易度とドメインベースの組織を通じて利用から分離する。
AIME 2025では、KACEは62.2%の精度で、固定されたベスト・オブ・5の自己整合性よりも10.4ポイントの絶対的な利得を達成している。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:51:01 GMT)
TAPS: Target-Aware Prefix Tree Selection for Diffusion-Drafted Speculative Decoding [4.6] パラレルドラフトに拡散モデルを用いることは、投機的復号法には有望なアプローチである。
単一のシーケンスの検証は受け入れ期間を制限し、大きなドラフトツリーの検証は過度なターゲットモデル遅延を引き起こす。
本稿では,拡散限界を経路条件付き受入推定値に変換するターゲット対応プレフィックス選択法TAPSを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:39:40 GMT)
Solving 2D Black Scholes Equation via Hermitian Block Embedding and Generalised Quantum Signal Processing [4.5] ブラック・ショールズ方程式は、金融デリバティブの仲裁価格を問わないための基本的なモデルを提供する。
量子線型代数アルゴリズムの最近の進歩は、適切なユニタリ形式やエルミート形式の変換によって行列関数を実装できる。
我々は,GQSPを二次元ブラックショール方程式に適用できるエルミートブロック埋め込み法を開発した。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:51:52 GMT)
Global Patterns in Student Stress and Academic Performance: A Machine Learning Study Using PISA 2022 [4.4] このプロジェクトの主な目標は、同様のグローバルパターンの存在を確認するか、拒否することである。
不安スコア,テスト不安,数学不安,数学の自信,幸福感,帰属意識など,さまざまな心理的指標に注目した。
この分析は6大陸で行われ、データセットを6つのケーススタディに分割した。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:12:39 GMT)
An Effective Solution for the CVPR 2026 8th UG2+ Challenge Track 3: Dynamic Object Segmentation in Turbulence [4.3] 第8回 UG2+ Challenge (CVPR 2026) Track 3: Dynamic Object in Turbulence (DOST) について述べる。
本手法は、強力なマスク生成とモーショントラッキング機能を提供する強力なベースラインフレームワークSegment Any Motion(SegAnyMo)上に構築されている。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:29:52 GMT)
Deep Psychovisual Image Representations [4.2] 心理視覚モデルでは、人間の視覚は、中間抽象を初めて形成することによって、高い認識から低レベルの特徴抽出を分離することを示唆している。
Deep Visual Coding(ディープ・ビジュアル・コーディング)は1990年代のイメージ・コードにインスパイアされた学習周波数領域の表現である。
我々のモデルは、複雑な数値表現と学習された抽象化が深部空間層の役割を補うため、モデルスケーリングにおいてCNNよりも深部依存度が低いことが分かりました。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:21:30 GMT)
Cross-Entropy Games and Frost Training [4.2] モンテカルロを基盤とした政策最適化手法であるフロストトレーニングを提案する。
鍵となる考え方は、埋め込み空間における報酬関数の勾配を利用することである。
モデルトレーニングの強化にも使用できることを、私たちは初めて示しています。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:52:00 GMT)
In-Expectation Convergence of Stochastic Gradient Methods under Heavy-Tailed Noise [3.8] 多くの方法は、勾配のノイズが有限$p$-秒のモーメントしか持たないときに収束しないと考えられている。
勾配 Descent (textSG$) は、有界領域との凸問題への期待に驚くほど収束する。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:27:47 GMT)
A Practical Upper Bound on Selection Bias Effects in Medical Prediction Models [3.8] 貧弱なモデル一般化は、特に医療のようなリスクの高い環境では、深刻な害をもたらす可能性がある。
モデル性能を予測する既存の方法は、対象の分布への非現実的なアクセスや、バイアスを引き起こす選択メカニズムの知識に依存している。
本研究では,現実的な環境下でのターゲット個体群における最悪のモデル性能に関する新たな上限を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:33:57 GMT)
Enhancing Protein-Protein Interaction Prediction with Hierarchical Motif-based Multimodal Protein Embedding [3.7] MMM-PPIは、PPI予測のための階層型モチーフベースのマルチモーダルタンパク質である。
マイクロスケールでは3つのモード残基をエンコードする。メソスケールでは,新しいマルチモーダルモチーフエンコーダが残基を空間的にインフォームドされたモチーフ埋め込みに集約する。
マクロスケールにおいて、マルチモーダルタンパク質エンコーダは、モチーフの重要性とモチーフ間の相関を共同でモデル化することにより、モチーフをタンパク質の埋め込みに統合する。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:26:17 GMT)
Bandit Simulation for Average Reward Inference [3.7] マルチアームバンディットアルゴリズムは、オンラインプラットフォーム、臨床試験、社会科学実験でますます使われている。
バンディットアルゴリズムは収集データに複雑な依存関係を導入するため、標準的な統計的推測法は使用できない。
観測データから帯域環境のシミュレータに適合するBSI(Bandit Simulation for Inference)を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 22:27:31 GMT)
Taming the Loss Landscape of PINNs with Noisy Feynman-Kac Supervision: Operator Preconditioning and Non-Asymptotic Error Bounds [3.6] 我々は,標準残差および境界損失に対して,領域内の数点に付加される点データ忠実度項を付加したPINNについて検討した。
ファインマン・カック表現を許容する広いクラスのPDEに対して、FK関数のモンテカルロ平均によってそのようなラベルを生成する。
FK-PINNは、標準のPINNが深刻な障害モードを示すPDEをうまく解決できることを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:38:48 GMT)
Score $\times$ Decoder: A Unified View of Unsupervised Inference-Time Scaling for Hallucination Mitigation [3.3] 大きな言語モデルは、その答えがパラメータの中にあっても幻覚する。
どの固有信号が正しい出力を最もよく識別するか、どのようにデコードすべきか?
我々はこれを3つのデコードファミリ(最適化、サンプリング、コンセンサス)と4つのスコアをペアリングするスコア$times$decoderグリッドとしてキャストし、ベースと命令調整されたQwen3-1.7BでMATH500上のすべてのセルを評価する。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:13:52 GMT)
DASH: Dual-Branch Score Distillation for Guidance-Calibrated Compact Diffusion Models [3.0] DASHは、両方のスコアブランチを監督する二重ブランチ蒸留フレームワークである。
TIRT Transferは、教師の時間単位の重要カリキュラムを凍結した前科として生徒にコピーする。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:35:54 GMT)
ProtStructQA: A Denotation Threshold in Protein Structural Reasoning [3.0] ProtStructQAはタンパク質構造質問応答の実行可能なベンチマークである。
信頼性、距離、予測誤差(PAE)、溶媒暴露、二次構造、トポロジ、接触に関する382.2Kの質問を公表する。
我々はQwen3-1.7BとQwen3-4Bの間に能力依存的な記述しきい値を求める。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:42:38 GMT)
Efficient Test-time Inference for Generative Planning Models [3.0] 従来のOpen-Closed List (OCL) 検索の修正版は、そのような効率的な推論手順を提供する。
本アルゴリズムは,中間状態からの高速ロールアウトを行う生成モデルと,候補推論経路に優先順位をつけるモデルという,学習した2つのコンポーネントを相乗化する。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:46:44 GMT)
CodeCytos: AI-assisted spatial molecular imaging analysis via code-augmented agent action space [3.0] 我々は,空間的分子イメージング解析のためのコーディングベースの推論エージェントであるCodeCytosを提案する。
CodeCytosは、カスタム空間セルの探索を効率化し、多様な研究ニーズに対応するように設計されている。
本研究は, 組織タイプ別4つの専門的分類データセットのケーススタディを通じて, その有用性を実証する。
論文参考訳(メタデータ) (Sat, 30 May 2026 01:37:32 GMT)
Doing What They Say, Not What They Reason: Locating the Faithfulness Gap in LLM Agents [2.9] 我々はテキサス・ポーカーシミュレータを用いて、信頼ギャップによるすべての決定に対する検証可能な参照アクションを、推論と結論の2つのステップに分割する。
2つのステップは反対に振る舞う。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:02:21 GMT)
Complexity of tensor network simulation for noisy quantum circuits [2.9] 局所雑音はテンソル・ネットワーク法でベンチマークされた量子力学の古典的シミュラビリティに影響を及ぼす。
任意の回路上の単一量子非偏極雑音に対して、$mathrmpoly(n)$ bond dimension suffice for fixed absolute Hilbert-Schmidt error after $order1$ depth。
より高次元では、これらの境界はカット毎に射影された絡み合ったペア作用素(PEPO)に対する平均境界結合次元を均一に得る。
論文参考訳(メタデータ) (Sat, 30 May 2026 01:42:33 GMT)
Cortex and subcortex play distinct roles over learning when cortical memory is limited [2.8] 学習中に皮質系と皮質下系の機能的解離の理論的基礎を提供する。
皮質は一般的な構造学習をサポートし、皮質下回路は報酬に基づく学習を専門とする。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:48:32 GMT)
MoEIoU: Rethinking Bounding-Box Regression as a Mixture of Experts [2.8] MoEIoUは、モデルのオーバーラップ、センターアライメント、アスペクト比のミスマッチといった、エキスパートベースの回帰損失の混合である。
標準と最近の最先端の損失を一貫して上回り、より早く収束し、ローカライゼーションの精度が向上した。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:34:30 GMT)
Response-Aware Multimodal Learning for Post-Treatment Visual Acuity Forecasting [2.6] VEGF治療後の長期視力(VA)は、患者のカウンセリング、期待設定、追跡計画の中心である。
本稿では,ベースラインと月1OCTの構造的特徴を統合した応答対応マルチモーダルフレームワークReVAを提案する。
本研究は,早期治療応答信号の導入により,臨床的に有意な長期的視力予測が可能であることが示唆された。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:36:28 GMT)
Cohort-Scale Neural Atlases of Ultrasound Video [2.5] 超音波ビデオ解析のためのコホートスケールニューラルアトラスを提案する。
提案手法はコヒーレントな標準テンプレートを学習し,正確なアトラス空間アノテーション転送を可能にする。
EchoNet-DynamicとMSK-Boneでは、強い高密度対応ベースラインと競合する精度でシングルショットと少数ショットの転送をサポートする。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:52:02 GMT)
RefDiffNet: Learning to Expose Subtle PCB Defects Before Detection [2.4] RefDiffNetは、ディープラーニングベースのPCB検査のための検出器に依存しない入力拡張モジュールである。
YOLOv8からYOLOv26までの1段検出器、変圧器ベースのRT-DETR、そして2段のFaster R-CNNなど、検出器ファミリ間の性能を継続的に改善する。
最大18%のmAP50:95ゲインを無視可能なオーバーヘッドで達成し、0.004 - 0.005Mの追加パラメータと0.7 - 0.8 GFLOPを導入した。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:53:39 GMT)
RADE: Random Add-Drop Edge as a Regularizer [2.4] グラフニューラルネットワーク(GNN)は、長距離情報の過度な適合と過度な監視に悩まされる。
我々は,過剰適合とオーバーシャッシングの両方に同時に対処するエッジを共同でドロップし,付加するグラフ拡張手法であるRandom Add-Drop Edge (RADE)を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:47:04 GMT)
Chunking Methods on Retrieval-Augmented Generation - Effectiveness Evaluation Against Computational Cost and Limitations [2.3] Retrieval-Augmented Generation (RAG) は、Large Language Models (LLMs) の性能向上に大きく貢献している。
RAGシステムにおける重要なタスクの1つは、チャンキングプロセスである。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:32:08 GMT)
Too Much of a Good Thing: When sim2real Efforts Impede Policy Learning (And What to Do About It) [2.3] 我々は、シム2リアルな取り組みが、政策学習と不整合なインセンティブをもたらし、現実社会が課した不合理な制約により、シミュレーターのロックインと政策探究が不十分になったと論じる。
本稿では,ロボットのキネマティクスを唯一の設計制約として活用するsim2sim2realパラダイムによる潜在的な解決策を提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 22:17:04 GMT)
Logit Distillation on Manifolds: Mapping by Learning [2.3] 学習過程において,生徒と教師の表現を高次元の埋め込み空間にマッピングするレイヤとポイントワイズ・プロジェクション・マッピングを導入する。
提案手法をLoRAインジェクションと組み合わせることで,教師モデルのトレーニング可能なパラメータを1%未満に削減すると同時に,他の蒸留法と比較して単語誤り率(WER)を大幅に改善する。
論文参考訳(メタデータ) (Sat, 30 May 2026 15:22:59 GMT)
SENTRY: Statistical Reliability Analysis of Vision Transformers Under Soft Errors [2.3] ViTは最先端の精度を提供するが、その膨大なパラメータは、徹底的なフォールトインジェクションキャンペーンを不可能にしている。
失敗率は、わずか数千のサンプルを使用して、99%の信頼性で1%のマージンの範囲内でバウンドされていることが示されている。
この手法は、徹底的なアプローチと比較して、実験コストの最大10,700倍の削減を実現する。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:14:26 GMT)
Large Language Models Should Learn Personalized Rather Than Aggregated Human Preferences [2.3] その結果,アグリゲーションマスクは嗜好の多様性,個人の価値観,文脈依存に関する重要な情報であることがわかった。
我々は、嗜好意識モデルを開発するための具体的な研究と政策アジェンダで締めくくる。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:47:52 GMT)
SDR: Set-Distance Rewards for Radiology Report Generation [2.2] 生成した埋め込みと参照埋め込みの間の集合間距離を連続的、置換不変な報酬として提案する。
2つのデータセットと3つのビジョン言語モデルにまたがって、GRPOによるセットからセットまでの距離に基づく報酬による後トレーニングは、教師付き微調整よりも一貫して優れています。
同じ設定距離はテストタイムのベスト・オブ・N$選択を可能にする。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:10:51 GMT)
Authenticity Debt and the Synthetic Content Threat Landscape: A Layered Framework for Trust, Provenance, and IP Governance in the Generative AI Era [2.1] 生成的人工知能は、コンテンツの作り方を根本的に変えた。
本稿では,生成AI害と攻撃ベクトルの包括的多次元分類法を提案する。
オープンで、敵対的で、進化している環境では、単一のメカニズムが不十分である、と我々は主張する。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:51:55 GMT)
From Cues to Horizons: Dynamic Risk Horizon Profiling for Trajectory Prediction [2.0] 本稿では,リスクを考慮した軌道予測のための連続学習可能なポテンシャル場モデルを組み込んだリスク地平面プロファイリング(RHP)モジュールを提案する。
モジュールは周囲の物体の空間的時間的近接を計算し、将来の地平線を横切るリスク分布をプロファイルする。
基準法と比較して,本フレームワークは高Dデータセット上での5s RMSEの25.0%削減,SHRP2上での5s minFDEの29.1%削減を実現している。
論文参考訳(メタデータ) (Sat, 30 May 2026 19:17:24 GMT)
On the Difficulty of Learning a Meta-network for Training Data Selection [1.9] 本稿では,MTS(Meta-learning for Training-data Selection)が期待以下であることを示す。
MTSの数学的解析を行い、正規化データ重みのダイナミクスと、異なるデータ品質と粗いGSNRの関係を明らかにする。
本稿では,トレーニングデータの分布とトレーニングダイナミクスの位置を捉える情報的特徴セットを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:47:24 GMT)
Rate-optimal neural boundary detection from unlabeled noisy images [1.9] 統計的観点からラベル付き雑音画像の境界検出について検討した。
頑健なギブスの後部アプローチにより, 境界検出のための連続的なヒンジ型サロゲート損失を提案する。
提案した損失は勾配に基づく最適化に有効であり、複雑なオブジェクト境界を表現するためにディープニューラルネットワークと組み合わせることができる。
論文参考訳(メタデータ) (Sat, 30 May 2026 12:58:09 GMT)
On Median of Incomplete U-Statistics [1.8] 我々は、中間不完全U統計量(MIU)に対する有限サンプル濃度率を確立する。
我々は、MIUが対称カーネルの予測のための効率的なロバストな推定器であることを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:22:15 GMT)
Beyond the Mouth: Upper-Face Affective Cues in Audiovisual Sentence Recognition under Acoustic Uncertainty [1.8] 対面音声理解は本質的にマルチモーダルであり、音響信号と可視的調音、表情、頭の動き、その他社会的に関係のある手がかりを統合する。
本稿では,上面の情緒的情報が,音声・口頭領域以外の聴覚的文章認識に寄与するかどうかを考察する。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:50:07 GMT)
ViBE: Co-Optimizing Workload Skew and Hardware Variability for MoE Serving [1.8] 分散Mixture-of-Experts(MoE)推論では、入力依存トークンルーティングはGPUのパフォーマンス変動と相互作用し、永続的なストラグラーを生成する。
本稿では,ハードウェア対応のエキスパート配置フレームワークViBEを提案する。
ViBEは継続して実行時の不均衡を減らし、SLO達成率を14%改善し、P90 TTFTを最大45%低下させる。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:57:09 GMT)
TabChange: Precise Attribute Changes in Tabular Data [1.7] 修正されたインスタンスは、元のインスタンスから自然かつ最小限に変更されなければならない。
本稿では,関心属性とデータセットの他の属性との関係を解析するTabChangeを提案する。
実験の結果,TabChangeは自然性に匹敵する特性の反事実を生成できることがわかった。
論文参考訳(メタデータ) (Sat, 30 May 2026 03:36:03 GMT)
Short-form Text Rewriting with Phi Silica [1.6] 我々は,SLM,Phi Silicaを用いて,データセットのキュレーション,蒸留の迅速化,パラメータ効率の高い微調整,評価を行う。
以上の結果から,微調整により意味的忠実度が向上し,幻覚が減少し,GPT-5-chat書き換えに対する選好勝利率が向上することが示唆された。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:55:51 GMT)
GeoSAM-3D: Geodesic Prompt Propagation for Open-Vocabulary 3D Scene Segmentation from Monocular Video [1.5] GeoSAM-3Dはより軽い設定を研究し、ユーザーは短いモノクロビデオをアップロードし、あるフレーム内のオブジェクトをクリックまたは名前付けし、ガウスシーン上で伝搬した3Dマスクを受け取る。
この実装は、凍結画像とビデオ基礎モデルと、単分子のガウススプラッティング再構成とガウスセントロイド上の微分可能なグラフ-ジオデシック伝播カーネルを組み合わせる。
本稿では,Geosam3d.propagateで実装されたレポジトリの状態,Segment Anythingマスクからトレーニングした機能ヘッド,および現場にすでに存在するバリデーションについて述べる。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:34:37 GMT)
DarkVesselNet: Multi-Modal Remote Sensing and Trajectory Reasoning for Dark Vessel Detection [1.5] DarkVesselNetは、Sentinel-1 SAR、Sentinel-2光画像、地理空間モデルバックボーン、AIS軌道推論、TGARDスタイルのギャップ検出、Pi-DPMにインスパイアされた異常ヘッドを組み合わせたマルチモーダルリモートセンシングスタックである。
リポジトリは、テスト済みのPythonパッケージと公開のHugging Face Spaceとしてシステムを公開している。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:31:06 GMT)
LP5X-PIM Sim: A High-Fidelity HW/SW Integrated Simulator for LPDDR5X-PIM [1.5] この技術ノートにはSamsung Electronicsが開発したPDDR5X-PIMシミュレータのアーキテクチャと実行結果が記載されている。
LPDDR5X-PIMブロックのハードウェアデータパスとソフトウェア制御層の両方の高忠実度モデルを提供する。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:22:47 GMT)
SpikeReg: Energy-Efficient 3D Deformable Medical Image Registration with Spiking Neural Networks [1.5] スパイキングニューラルネットワークは、スパースイベント駆動計算を提供する。
SpikeRegは、3Dの脳MRI登録のためのスパイクU-Netだ。
結果より, イベント駆動計算では, 密集した幾何学的予測が可能であることがわかった。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:05:38 GMT)
Continuous Data Assimilation with Learned Surrogate Dynamics [1.5] 多くのアプリケーションにおいて、状態のダイナミクスは要求された解像度でシミュレートするために未知あるいは違法に高価であり、モデルエラーにつながる。
この課題と、データ同化における機械学習サロゲートの導入の増加に動機づけられた本研究では、学習した動的サロゲートモデルを用いたヌーディングアルゴリズムの有限次元解析を統一的に行う。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:15:51 GMT)
Torus Graphs for Large Scale Neural Phase Analysis [1.4] 数千の変数を持つデータセットの推論を可能にするために,レート毎のコストを$mathcalO(d2)$に削減するスコアマッチング手順を導入する。
このスケーラブルな基盤は、マルチ電極LFPからの1,860の周波数位相の特徴の分析をサポートし、TGや古典的な円形統計に以前はアクセスできない2つの拡張を可能にする。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:56:56 GMT)
Position: Prioritize Identifying Structure, Not Complex Models, for Scientific Discovery [1.4] 現代の機械学習(ML)と人工知能(AI)モデルは、観測データから科学的仮説や機械的説明を生成するためにますます使われている。
本稿では,現代のMLが優れている高次元のプロキシシステムにおいて,機械的学習は一般に過小評価されていることを論じる。
この下決定は、大きな言語モデル(LLM)によって一意に危険となり、大きな同値な説明のクラスを単一の流動的な物語に分解する傾向にある。
論文参考訳(メタデータ) (Sat, 30 May 2026 15:21:58 GMT)
Head-Pose-Aware Visual Speech Recognition with FiLM Modulation [1.4] 本稿では,頭部情報を視覚的特徴抽出に明示的に組み込んだポーズ対応音素レベルフレームワークHP-VSR-ResFiLMを提案する。
我々は,HP-VSR-ResFiLMが,訓練データに頼らずに,それぞれ25.0%,33.2%の単語誤り率(WER)で競合性能を達成することを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:35:47 GMT)
Causal Density Functions [1.3] 我々は、干渉法則と観測法則を比較し、因果効果の局所密度比として機能するラドン-ニコディム誘導体を用いる。
因果密度関数は、推定し、校正し、指示された影響を評価するのに使える測度の変化オブジェクトを提供する。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:41:25 GMT)
A Machine-to-Machine Knowledge-Guided LLM Agent for Generalizable Radiotherapy Treatment Planning [1.2] 本研究では,自動放射線治療計画のためのM2M(M2M)知識誘導大言語モデル(LLM)のプロトタイプを提案する。
テーマは「治療計画」。
深層強化学習(DRL)エージェントによって発見されたモデル(TPP)分布の知識をエージェントに転送する。
LLMエージェントはコンテキスト内学習を通じて、人間の介入なしに自律的な反復計画を可能にする。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:14:30 GMT)
Toward Agentic Governance: What Shapes LLM-Agent Intervention in Public Forums? [1.2] 4つのデプロイメント選択は、それぞれエージェントのレスポンスレートをシフトする。
4つの選択肢は、(1)現在どのモデルバージョンが提供されているか、(2)モデルのウェイトリリースステータス、(3)どのプロバイダがリクエストをサービスしているか、(4)システムプロンプトポリシーが実行されているかである。
オープンウェイトとクローズドウェイトの両方で、これまで報告された傾向は、アクセス面よりもパネルのオープン/クローズドウェイト境界と一致している。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:01:00 GMT)
AI Sovereignty as National Learning Capacity: A Human-Centered Learning Mechanics Viewpoint on France, the United States, and China [1.2] 本稿では,フランスは国際的AI学習システムとして理解されるべきである,という一貫した解釈を提案する。
フランスのAIに関する議論は、テクノ最適化と規制第一の警告の間の二項の反対を超えて進むべきだ、と同社は主張する。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:49:42 GMT)
MultiTurnPSB: Evaluating Multi-Turn Jailbreak Attacks an dClassifier-Based Defenses for Medical AI Safety [1.1] 患者セーフティベンチの4ターン逆拡張であるMultiTurnPSBを紹介する。
我々は,GPT-4.1-miniを,固定テンプレート,テンプレート適応型,ライブ敵攻撃下で評価した。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:09:53 GMT)
Easy, robust approximate message passing for planted spike models [1.0] 本稿では,スパイク行列設定において,ロバストな近似メッセージパッシング(AMP)のための単純かつ効率的なアルゴリズムを提案する。
我々のアルゴリズムは、スペクトル前処理ステップと頑健なスペクトル手順を組み合わせることで構成されており、これらの入力を考慮すれば、AMPが頑健であること(おそらく意外なことに)が証明できる。
論文参考訳(メタデータ) (Sat, 30 May 2026 03:18:52 GMT)
DeepLatent: Think with Images via Parallel Latent Visual Reasoning [1.0] イメージで考える”は、視覚状態を中間的推論ステップに埋め込んで、ビジョンランゲージモデルの新しいフロンティアを定義する。
潜在的推論法は暗黙的な視覚状態を自動生成するが、ツールアシスト法は不十分である。
本稿では,潜時視覚推論のための並列フレームワークDeepLatentを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:33:24 GMT)
Topological Edge States from Molecular Chirality: A General Framework for Dimerized Dipolar Arrays [1.0] 分子ハンドネスは、SSHのようなトポロジーを相互作用する一次元環境において自然かつ調節可能な経路を提供することを示す。
また, キラリティによるジアルシンスキー-モリヤ相互作用は, 有効ホッピング振幅を増幅することを示した。
これらの知見は、二量化キラル分子配列を制御可能でキラル性に適応可能なプラットフォームとして確立する。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:22:08 GMT)
Airport Terminal Passenger Queue Forecasting for Departure Gates and Security Checkpoints [0.9] 運用データから過去の乗客フローパターンを学習する客待ち行列予測フレームワークを提案する。
提案モデルはTransformerベースのアーキテクチャを用いて、時間的依存関係とファシリティ間の相関をキャプチャする。
論文参考訳(メタデータ) (Sat, 30 May 2026 13:56:36 GMT)
Accuracy, Stability, and Repeated-Run Reliability of Large Language Models on Deterministic Programming Tasks [0.9] ランレベルのパスレートは、リトライフリーのカバレッジを最大17.8ポイント上回っている。
本稿では,実行レベルの精度,再試行自由度,確率ごとの変動率を指標とした繰り返し実行評価プロトコルを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:03:05 GMT)
Joint Optimization of Qubit Leasing and Quantum Circuit Distribution [0.9] 我々は、量子ネットワークに接続された量子コンピュータ(QC)の集合からリースされたリソースを用いて、与えられた量子回路を実行したいエージェントを考える。
この目的のために、エージェントは、(i)各QCからリースするキュービット数、(ii)異なる時間スロットに異なる回路キュービットを格納するキュービット数、(iii)各ゲートを回路内で実行するキュービット数、(iv)QC間のキュービット移動方法の4つの重要な決定を行う必要がある。
結合量子ビットリースと量子回路分布(JQLQCD)について述べる。
論文参考訳(メタデータ) (Sat, 30 May 2026 03:27:45 GMT)
Bridging Topology and Deep Representation Learning: A TDA-ViT Fusion Model for Four-Class Brain Tumor Classification [0.8] 本研究では,4クラス脳腫瘍分類のためのトポロジカルデータ解析機能と事前訓練された視覚変換器表現を組み合わせた融合フレームワークを提案する。
提案されたTDA-ViT融合モデルは精度99.10%、精度99.27%、リコール99.15%、F1スコア99.21%、AUC99.98%を達成する。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:28:15 GMT)
Structure-Aware Consistency Priors for Shape from Polarization in Complex Media [0.8] 本稿では, 複雑な光物質相互作用が偏光観測と表面標準との非線形マッピングにつながる, 代表的な複合媒質としての氷に焦点を当てた。
AoLPの局所的な空間的一貫性を捉えるために,自己相関関数に基づく構造認識偏光法を提案する。
デュアルブランチネットワーク(IceSfP)は、クロスモーダルアテンションとマルチスケール機能融合を介して、生の偏光機能を事前と統合するために設計されている。
論文参考訳(メタデータ) (Sat, 30 May 2026 03:59:23 GMT)
Toward Responsible and Epistemically Grounded Multilingual LLMs for Computational Social Science and Humanities [0.8] 本稿では,多言語推論LLMを解釈器として再認識する。
社会科学・人文科学研究における多言語推論の理論的基盤となる枠組みを構築した。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:52:18 GMT)
Echo-POSED: Geometric Self-Distillation for Echocardiography Guidance [0.8] 本稿では,リアルタイム経胸壁心エコー法(TTE)誘導のための自己教師型フレームワークであるEcho-POSEDを紹介する。
2D超音波画像から直接プローブ調整を推奨するが、専門家による視点や追跡されたプローブ軌道は不要である。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:37:43 GMT)
Same Payload, Different Channel: Measuring Trust Asymmetry in Tool-Using Language Models [0.7] モデルがどこに着くかに関わらず、悪意のある命令を同じように扱うかどうかを検討する。
我々は,モデルが敵対的コンテンツに対する感受性がどの程度変化するかを測定する安全非対称性スコア(SAS)を導入する。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:38:41 GMT)
On the Limits of LLM Adaptability: Impact of Model-Internalized Priors on Annotation Task Performance [0.7] そこで本研究では,ユーザが提供する命令とモデルインターナライズドプリエントがどのように相互作用するかを検討する。
ゼロショット誤差の3分の2近くが修正に抵抗していることが判明した。
高信頼誤差は特に修正に耐性がある。
論文参考訳(メタデータ) (Sat, 30 May 2026 01:21:14 GMT)
Pre-Deployment Robustness Stress Testing for CT Segmentation Systems Using Clinically Motivated Multi-Corruption Augmentation [0.7] 我々は,CTセグメント化のためのRAMP(Augmented Multi-corruption Pipeline)によるロバストネスを提案する。
RAMPは、解剖学的に制約された摂動、CT強度変換、マルチ破壊組成物を組み合わせて、臨床的に妥当な画像劣化にモデルを公開する。
RAMPは最強の劣化画像性能と最小のクリーン・ツー・フェイクド・ロバスト性ギャップを達成した。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:42:38 GMT)
GitHub Copilot and Developer Productivity: An Observational Dose-Response Analysis [0.5] GitHub Copilot(GHCP)は、エンジニアをより生産的にします。
私たちは、MicrosoftのCloud+AI組織全体で16,223人のソフトウェアエンジニアから43週間のデータを使ってこれらの質問を調査します。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:09:51 GMT)
Acting with AI: An Interaction-Based Framework for Agentic Tort Liability [0.5] 本稿では,エージェントトルトのためのインタラクションベースのフレームワークを提案する。
私たちは、自律的なドリフト、純粋なツールの使用、共同計画という3つのインタラクションタイプを区別します。
論文参考訳(メタデータ) (Sat, 30 May 2026 04:17:47 GMT)
Generative Multi-Robot Motion Planning via Diffusion Modeling with Multi-Agent Reinforcement Learning Guidance [0.5] 本稿では,協調型マルチロボット動作計画のためのフレームワークを提案する。
分散生成軌道計画とマルチエージェント強化学習(MARL)に基づく協調を組み合わせる。
その結果, 提案した拡散計画により, エージェント間干渉率を55.4%から41.8%に低下させることがわかった。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:54:04 GMT)
Manifold Diffusion for Structure Generation of Transition Metal Complexes [0.4] 遷移金属錯体のジオメトリを効率的に生成する多様体拡散機械学習モデルを提案する。
この結果は,データ効率のよい幾何生成のための多様体ベース生成モデルの可能性を示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:47:55 GMT)
An explainable hierarchical self attention-based approach for tremor detection in the time domain [0.4] 震動はパーキンソン病や本態性震動などの症状に関連する一般的な運動障害である。
現在の自動検出法は、臨床専門知識から得られる周波数領域の特徴に依存している。
本稿では3次元運動マーカー時系列データから直接震動パターンを学習する時間領域における震動検出のための2段階階層的フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:55:47 GMT)
Beyond Edge Coverage: Per-Task Data-Flow Extraction at Kernel Function Boundaries via LLVM [0.3] LLVMベースのインスツルメンテーションフレームワークであるBOUNDaryをLinux KCOVを拡張し,関数引数と戻り値のデータフロー抽出を行う。
複合型は、ソースアノテーションがゼロのDWARF DITypeメタデータを介して自動的に生成される。
個別のカーネル装置は、既存のKCOVやシスカラーのインフラに干渉することなく、ロックフリーのタスク単位のリングバッファを提供する。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:42:59 GMT)
Finite Certificates for In-Context Determinacy and a Threshold Theory of Emergence in Language Models [0.3] 本稿では,文脈条件付き言語モデル行動を検証するためのモデル理論フレームワークを開発する。
有限コンテキスト証明書、ペアセパレータのヒットセット、クエリ教育のディメンション、プロンプト保存基準、スケール制限証人を提供する。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:07:58 GMT)
A multimodal dataset of photoplethysmography and continuous behavioral responses to ASMR and nature videos [0.2] 本稿では,REST-ASMR(Response to Environmental & Sensory Triggers)について述べる。
データセットには、高解像度光胸腺撮影、時間順のオーディオ視覚刺激、34人の参加者による継続的な主観的アノテーションが含まれる。
双方向長短項記憶モデルは主観的ASMR状態の予測に成功し、ビデオレベルのASMRと自然の分類を完全な精度で達成し、フレームレベルのグローバル平均精度は75.51%である。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:36:10 GMT)
MLLM-Microscope: Unlocking Hidden Structure Within Multimodal Large Language Models [0.2] MLLM(Multimodal Large Language Models)内の隠れ表現を解析するための新しいシステムであるMLLM-Microscopeを提案する。
LLaVA-NeXTとOmniFusionの2つの最先端MLLMを評価した。
両モダリティのトークンの主ストリームと残留ストリームの両方が、変圧器層にまたがる高い線形挙動を示すことがわかった。
論文参考訳(メタデータ) (Sat, 30 May 2026 22:20:50 GMT)
Improving Visual Grounding in Remote Sensing via Cluster-Guided Refinement and Model Ensemble Voting [0.2] ビジュアルグラウンドティングは、自然言語記述に対応する画像領域を見つけることを目的としている。
リモートセンシング画像では、複雑なシーン、小さな物体、大規模な変動のためにグラウンド化が特に難しい。
本研究では,リモートセンシングに特化した視覚的グラウンド化モデルであるRemoteSAMと,強力な汎用セグメンテーションモデルであるSAM3の相補的な強みを組み合わせた2つのグラウンド化パイプラインを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 06:13:42 GMT)
French parsing enhanced with a word clustering method based on a syntactic lexicon [0.1] 本研究では,フレンチツリーバンクの動詞にクラスタリング手法を適用することで,確率的文脈自由文法を用いたフランス語の正確な性能が得られることを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:18:00 GMT)
Extending Causal Metamodeling to a non-Markovian Queue [0.0] 離散イベントシミュレーションのメタモデルは、高価なシミュレーションを実行せずにシミュレーションモデルの挙動を近似する。
本稿では,非指数分布を近似することにより,MDBNを非マルコフキューに拡張する。
我々はこれらの課題に対する予備的な解決策を提供し、非マルコフ系に対する最初の因果メタモデリング技術をもたらす。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:21:09 GMT)
hZACH-ViT: Curved Latent Geometry for Compact Vision Transformers in Low-Data Medical Imaging [0.0] hZACH-ViTは、位置埋め込みとクラストークンを削除する、コンパクトなゼロトークンビジョン変換器である。
我々は、7つのMedMNISTデータセット上のhZACH-ViTヘッドを、同じ数ショットのプロトコルで評価する。
7つのデータセット全体にわたって、最高の非ユークリッドhZACH-ViT構成は、ユークリッドZACH-ViTよりも改善されている。
論文参考訳(メタデータ) (Sat, 30 May 2026 22:03:49 GMT)
Where's the Structure? A Systematic Literature Review of Empirical Research on Human-AI Collaboration and Hybrid Intelligence for Learning [0.0] Human-AIコラボレーション(Human-AI collaboration)とは、人間の学習を促進するために人間とAIコンポーネントが相互作用する場所である。
無構造相互作用は必ずしも効果的な学習経験を生み出すとは限らない。
本稿では,人間とAIのコラボレーションと学習支援のためのハイブリッドインテリジェンスに関する実証研究の系統的な文献レビューを報告する。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:54:32 GMT)
Wavelet-Fusion Diffusion Model for Multimodal Brain MRI Synthesis with Modality and Metadata Conditioning [0.0] マルチモーダルMRI(Multimodal MRI)は、異なる画像モダリティが解剖学的、組織学的、病理学的特徴を捉える神経画像解析に補完的な情報を提供する。
大規模な構造MRIリソースはますます利用可能になっているが、そのモダリティのカバレッジは、パブリックおよびプール化されたニューロイメージングデータセットで不均一であることが多い。
本研究では,Wavelet-Fusion 変分オートエンコーダ (WF-VAE) と条件付き3次元U-Net拡散モデルを組み合わせた。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:57:27 GMT)
Wavelet as Tokenizer: Preliminary Results on a Shared Wavelet Token Schema for Natural Signals [0.0] 本稿では、音声、画像、ビデオが共通のウェーブレットトークンスキーマを共有することができるかどうかについて検討する。
Speech Commands、EuroSAT RGB、DAVIS 2017のデータでは、密度の高い共有モデルは39.92dBオーディオ、29.37dB画像、23.93dBビデオPSNRに達する。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:59:57 GMT)
Wasserstein-2 gradient flows and the geometry of entropy production in classical and quantum stochastic thermodynamics [0.0] 古典的および量子熱力学におけるエントロピー生成の統一的な幾何学的記述を提供する。
関連するワッサーシュタイン-2距離はエントロピー生成を束縛し、第二法則を有限時間改良する。
我々は、純粋に散逸的かつハミルトン散逸的な測地の間の同値境界を確立する。
論文参考訳(メタデータ) (Sat, 30 May 2026 12:12:46 GMT)
Tiny Recursive Models for Solving the J2-Perturbed Lambert Problem [0.0] 本稿では,Tiny Recursive Models (TRM) に基づくJ2摂動ランバート問題に対する高速神経解法を提案する。
コンパクト推論モジュールを2レベル遅延階層内に繰り返し適用して、候補出発速度を洗練させる。
TRM-PL出力の1つのニュートン補正器は、ジョビア中央値が0.063kmに縮まり、組み込まれた配置に十分な精度のコンパクトモデルが得られる。
論文参考訳(メタデータ) (Sat, 30 May 2026 21:17:00 GMT)
The Assistant as a Privileged Persona: A canonical reference in cross-persona self-recognition [0.0] 訓練後の言語モデルでは、文脈外の文から2つのアウトプットを認識できる。
本稿は、Llama-3.1-70B-Instruct上でのクロスパーソナライズ・オーサシップの判断に枠を広げる。
論文参考訳(メタデータ) (Sat, 30 May 2026 05:33:13 GMT)
Stochastic Analysis of Cybersecurity Defense Strategies Under Single Attack Scenario [0.0] 本研究は,単一攻撃シナリオ下での積極的なサイバーセキュリティ防衛タイミングのための新しい枠組みを提案する。
この手法は、防衛過程を防衛インスタントとその後の観測スロットが独立指数分布に従う連続的な観測メカニズムとしてモデル化する。
論文参考訳(メタデータ) (Sat, 30 May 2026 02:22:22 GMT)
Single-Channel Tissue Segmentation via Cross-Modal Distillation from Foundation Models [0.0] 多重蛍光顕微鏡は、核(DAPI)と膜(E-カドヘリン)を含む相補的なチャネルを提供することで組織セグメンテーションを改善する
本研究では,核チャネルのみで動作する軽量の学生に,凍結基礎モデル教師による多重入力処理から意味情報を伝達するクロスモーダルな知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 23:34:49 GMT)
Reason, Retrieve, Re-rank: A Zero-Shot Reasoning-Aware Framework for Composed Video Retrieval [0.0] Composed Video Retrieval (CoVR)は、参照ビデオに自由形式のテキスト修正を適用することで得られるターゲットビデオを求める。
textbfR3-CoVR(emphReason、Retrieve、Re-rank)は、凍結基盤モデルから完全に構築されたトレーニング不要のパイプラインである。
論文参考訳(メタデータ) (Sat, 30 May 2026 22:21:42 GMT)
Qutrit-based Synthetic Three-Level System [0.0] 2つの3レベルサブシステムからなる2量子系から合成3レベル構成を構築する。
我々は、ハミルトニアン系が、リードベルク状態を導入することなく、効果的な合成三層多様体に写像できることを示す。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:12:02 GMT)
Quantum Ergodicity and Thermalization in Interval Quantum Mechanics [0.0] インターバル量子力学において、量子状態は点ではなく、量子パーセルによって表される。
両小包の期待間隔は, 境界観測値のマイクロカノニカル値付近に集中していることが示される。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:30:59 GMT)
Quality-Diversity Evolution for Discovering Diverse Vulnerabilities in LLM Safety [0.0] セマンティックレベルで機能する品質多様性進化フレームワークを導入する。
我々は行動的な側面をまたいだ多様な攻撃のアーカイブを維持している。
意味表現は、体系的、モデル固有の弱点を示す解釈可能な攻撃を生成する。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:40:24 GMT)
Prompts for Public-Sector LLMs Should Be Governed as Commons [0.0] 大規模言語モデルのデプロイに使用されるプロンプトは、プライベートで過渡的な入力ではなく、管理された成果物として扱われるべきである、と我々は主張する。
Prompt Commons - プロンプトメタデータ、ライセンス、モデレーションログを備えたプロンプトテンプレートのバージョニングされたコミュニティ保守型リポジトリ。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:01:53 GMT)
Program-Level Curriculum Analysis of U.S. Quantum Masters Degrees; Implications for Workforce Preparation [0.0] 量子技術は、米国における経済的競争力、国家安全保障、技術革新の戦略的優先事項として、ますます認識されている。
量子システムは研究のプロトタイプからデプロイ可能な技術へと移行するにつれて、量子労働力の準備に向けて注意が向けられている。
本研究では、カリキュラムの構造とスキル開発に焦点をあて、量子科学と技術における米国の主要な修士課程を分析した。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:32:07 GMT)
NeuroLog: Reasoning You Can Audit -- Neuro-Symbolic Vulnerability Discovery via LLM Facts, Datalog, and SMT [0.0] C/C++ソースの脆弱性発見では、単一のクエリを実行する前に動作するビルドを必要とする静的アナライザと、ソースを読み取りながら詳細を知り、レアル上のクロスファンクションデータフローのトラックを失うフリーフォームのLCMを、アナリストに選択するよう求めている。
我々は、各イテレーションで優れた型付きデータフローを発見する、エンドツーエンドのビルド・ツー・エンドパイプラインであるNeuroLogを紹介します。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:50:06 GMT)
Medication-Aware Financial Exploitation Detection for Alzheimer's Patients Using Edge-Aware Interaction Risk Modeling [0.0] 経済的搾取はアルツハイマー病の人々の関心が高まっている。
本稿では,薬物の付着とトランザクションレベルのモニタリングを同期する薬剤認識フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:59:24 GMT)
Mapping the evolution of small reservoirs in Brazil from 1984 to 2025 using deep learning [0.0] 我々は、ブラジルの小さな流水型表層貯水池を正確に分断するために、ディープラーニングコンピュータビジョンモデルを訓練する。
検出された貯水池の数は263,913から96,245にほぼ4倍に増加し、表面積は3510$km2$から8550$km2$に増加した。
これは、40年以上にわたる小さな貯水池の進化を表す国内初の年間データセットである。
論文参考訳(メタデータ) (Sat, 30 May 2026 11:11:21 GMT)
LinguIUTics at PsyDefDetect: Iterative Imbalance-Aware Fine-tuning of Qwen3-8B for Psychological Defense Mechanism Classification [0.0] PsyDefDetect 2026の共有タスクでは、LinguIUTicsチームが公式のポジティブクラスリーダーボードで0.3917のマクロF1スコアを達成した。
我々は,階層化クロスバリデーション,少数クラスのラウンドロビン語彙拡張,ロジットバイアスチューニングとアンサンブルブレンディングを備えた後処理パイプラインの3つの戦略を活用する。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:47:29 GMT)
Learning Transfers: Kan Extensions for Neural Invariants [0.0] 伝達学習は、ソースタスクで学習した表現が、関連するターゲットタスクで使用可能な構造を持つと仮定する。
標準的な評価では、ターゲットの精度や分布の相違を通してこれを調査するが、どの構造的不変性が転送を意図しているかは未定のままである。
私たちはその不変物を分類的に供給する。
論文参考訳(メタデータ) (Sat, 30 May 2026 15:34:08 GMT)
Knowledge Graphs as the Missing Data Layer for LLM-Based Industrial Asset Operations [0.0] LLMをベースとした産業資産運用のエージェントは、フラットなドキュメントストアに対する推論において、限られた精度を示す。
AssetOpsBenchは、GPT-4エージェントが139の産業保守シナリオで65%を達成することを証明している。
入力された知識グラフをグラウンド基板として扱い、どのように答えられるかによって各質問をルーティングする。
論文参考訳(メタデータ) (Sat, 30 May 2026 07:22:30 GMT)
Interaction-Centered Intelligence: Toward Interaction as the Primary Unit of Analysis in Co-Creative AI and Human-AI Systems [0.0] 本稿では,共同創造型AIとインタラクション中心知能の分析単位として,インタラクションを提案する。
エージェント、環境、社会技術システム間の相互作用のダイナミクスが進化することで知性が生まれると主張している。
本稿では、人間とAIの協調創造、協調的創発、適応的参加、相互作用力学を理解するための枠組みとして、インタラクション中心インテリジェンスを紹介する。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:47:03 GMT)
Information-Theoretic Lower Bounds for Bit-Constrained Stochastic Optimization via a Reduction to Compressed Gaussian Mean Estimation [0.0] 低精度事前トレーニング (FP8, MXFP4, NVFP4) は現在、フロンティア言語モデルの標準となっている。
我々は、Bビット量子化された1次オラクルについて研究し、anunboundはTラウンドで相互作用し、各ラウンドにおいて、その勾配のBビット適応的なパブリックコイン記述を受信する。
実測値と実測値との整合性について, 実測値と実測値との整合性について検討した。
論文参考訳(メタデータ) (Sat, 30 May 2026 12:22:20 GMT)
Individually tunable Si/SiGe quantum dot operating voltages via gate-biased illumination [0.0] 酸化物-半導体界面におけるナノスケール捕捉電荷分布を制御可能かつ反復的に変化させる方法を提案する。
本手法をSi/SiGe量子ドットデバイス上で実証した結果,動作電圧を制御し,より均一にすることができることがわかった。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:34:20 GMT)
IDEAFix: Evaluation Framework for Creative Defixation Prompting in LLMs [0.0] オープンなアイデア生成タスクにおける散発的思考を解析するための評価フレームワークであるIDEAFixを紹介する。
我々は、短い設計シナリオ、タスク属性、修正促進戦略の制御されたバリエーションに対して、複数のオリジナルソリューションを生成するようモデルに促す。
この結果から,タスクの定式化と属性選択がモデルの性能に大きく影響し,簡単なプロンプト戦略が解の独創性を高めることが示唆された。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:15:01 GMT)
Hybrid Probabilistic Forecasting of Under-Five Malaria Admissions in Ghana: A Gaussian Process Regression with Holt-Winters Smoothing [0.0] 本研究では,GPRとHolt-Winters指数的スムース化を統合したハイブリッドフレームワークを提案する。
10年間の地域レベルのデータを用いて, 転がりオリジン伸展ウインドウの検証による性能評価を行った。
2024-2028年計画の予測は、平均して8000から12,200件である。
論文参考訳(メタデータ) (Sat, 30 May 2026 18:18:36 GMT)
Graph Neural Networks for Predicting Solvability of Finite Groups [0.0] 有限群を可解性に応じて分類するためのグラフニューラルネットワーク(GNN)フレームワークを提案する。
ケイリーグラフ (CG) を含む有限群のグラフ表現を用いて, 構造グラフ情報のみを用いて, 可解群と非可解群を識別する。
論文参考訳(メタデータ) (Sat, 30 May 2026 08:34:26 GMT)
Frankenstein in the Pipeline: Computational Epistemicide in Facial Recognition [0.0] 本稿では,Mary Shelley の Frankenstein を意図しない結果のメタファーではなく,メソッドの診断フレームワークとして採用する。
埋め込みベースの顔認識は、私が計算認識療法と呼ぶものを実現している、と私は主張する。
この論文は、廃止を規範的なスタンスとして議論することで締めくくっている。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:52:02 GMT)
Eyes All Around: Design and Analysis of 360-Degree LiDAR Perception Using Equivariant Feature Learning in Unstructured Traffic [0.0] 密集した非構造都市交通の認識は、自動運転の大きな課題である。
最近のLiDARベースの3Dオブジェクト検出器は、構造化運転シナリオにおいて強い性能を示している。
本稿では,自動運転のための360度LiDAR知覚パイプラインについて検討する。
論文参考訳(メタデータ) (Sat, 30 May 2026 15:30:58 GMT)
ESBMC: A Survey of Its Evolution, Integration, and Future Directions in Formal Software Verification [0.0] この調査は、ESBMCの当初の設計原則から2025-2026年の最先端まで、完全な軌道を辿っている。
我々は、その経済的な影響 - GBP 9.3百万ドル、EUR 4.98百万ドル - を、確認された公的研究資金、VeriBeeのスピンオフ、ロッキード・マーティンの防衛産業展開で合成する。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:58:19 GMT)
Dynamic Coordination Strategy Selection for Enterprise Multi-Agent Systems [0.0] 本稿では,グローバルに固定されるのではなく,問題クラスによって協調戦略を動的に選択すべきかどうかを評価する。
1,440個の出力はすべて固定されたソンネットルーブリックによって判定される。
企業調整方針は、決定論的勝者選択法ではなく、動的ルーティングをデフォルトとして使用するべきであると結論付けている。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:43:02 GMT)
Distributed GNEP Algorithms without Multiplier Sharing and Applications to Multi-Robot Coordination and Contextual Bandit-Based Active Learning [0.0] この研究は完全な分散連続時間アルゴリズムを導入し、乗算器交換を必要としない収束を確立する。
また,連続時間アルゴリズムの離散化手法についても提案する。
提案手法の有効性は,マルチロボットの協調と配置への応用を通じて実証される。
論文参考訳(メタデータ) (Sat, 30 May 2026 14:54:34 GMT)
Directed Distance Fields for Constant-Time Ray Queries on Gaussian Splatting [0.0] 3D Splattingはリアルタイムでシーンの新しいビューを表示する。
我々は、訓練された3DGSシーンをDDF(Directed Distance)を蒸留して線オラクルにする。
DDFは、等価な符号付き距離場を追跡する球よりも26倍から72倍速い。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:29:32 GMT)
Cross-Generational Transfer of Adversarial Attacks Reveals Non-Monotonic Safety Alignment in LLMs [0.0] 我々は,GoogleのGemmaファミリー(7B-31B)の4世代にわたる品質多様性進化(MAP-Elites)を自動リピートプローブとして研究した。
Gemma 3 (12B) は 68.7% +/- 5.7% の攻撃成功率 (ASR; mean +/-, 3 seed) を示し, Gemma 2 よりもかなり高い値を示した。
世代間で進化した攻撃アーカイブの再生は、他の世代からの攻撃がGemma 3に44-46%で転送されるが、Gemma 4への攻撃はわずか14-18%であることを示している。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:07:40 GMT)
Constructive interpolation and generalization rates for neural ODEs: a control perspective [0.0] 制御理論の観点から,ニューラルネットワーク(NODE)を用いた教師付き回帰について検討した。
我々は、定数パラメータと明示的な時間依存性を持つ、広く使われている非自律モデルのクラスに焦点を当てる。
論文参考訳(メタデータ) (Sat, 30 May 2026 01:26:36 GMT)
Computational Phase Transitions in Binary Compressed Sensing: Quantum Annealing Inside the Relaxation Gap [0.0] D-Waveの量子アニールは、全てのテストされた古典的手法が失敗する領域の信号を回復する。
エネルギー分析により、QUBO基底状態は真の信号を含むことが明らかになったが、誤った解は古典的な探索を妨害するより浅い局所盆地を占有している。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:46:10 GMT)
Citation Grounding: Detecting and Reducing LLM Citation Hallucinations via Legal Citation Graphs [0.0] 5つのシステムにまたがる100のウクライナの法的クエリに関する実証的評価
13-21%の励起が幻覚し、励起精度は0.791から0.873である。
人間のアノテーションを使わずに幻覚を減らすために,Citation Grounding DPOを導入する。
論文参考訳(メタデータ) (Sat, 30 May 2026 21:22:47 GMT)
Capability and Robustness Cannot Both Be Free: An Information-Theoretic Bound for Vision-Language-Action Models [0.0] VLA(Vision-Language-Action)モデルはクリーンな入力で高い成功率に達するが、小さな逆方向の摂動で崩壊する。
PGD攻撃は、OpenVLA-7BのLIBEROの成功を95%ドルから5%以下に下げることを示す。
任意のVLAポリシーに対して、capability $I(Astar;Api)$と robustness $I(Api;Atildepi)-I(Api;)$ sum to at least $H(Astar)+I(X;Xt)
論文参考訳(メタデータ) (Sat, 30 May 2026 17:52:23 GMT)
Benchmarks for Vision-Language Models in Urban Perception Should Be Reliability-Aware and Negotiated [0.0] 視覚言語モデル(VLM)は、街路レベルの画像の構造的記述を生成するためにますます使われている。
本稿では,都市認識のためのVLMのベンチマークは,不一致と棄却を計測結果として扱うべきであると論じる。
論文参考訳(メタデータ) (Sat, 30 May 2026 19:56:17 GMT)
Bayesian Inference of Nonlinear Malaria Dynamics in Ghana via an Ensemble Markov Chain Monte Carlo Sampler [0.0] 本研究では,アフィン・イン・アンサンブル・チェイン・モンテカルロサンプリング器を用いて推定した減衰振動核と立方体基底線を統合する非線形推論フレームワークを開発した。
5歳未満の子供と5歳以上の個人に対する確率予測を生成する。
2024-2026年の予測:5歳未満の小児137,000人から149,000人、高齢者348,000人から375,000人。
論文参考訳(メタデータ) (Sat, 30 May 2026 16:02:56 GMT)
An Exploratory Study into using Machine-Learning for Fast Step-by-step Emulation of Numerical Mechanical Thrombectomy Simulations for Ischemic Stroke [0.0] 機械的血栓摘出術を併用した虚血性脳梗塞の治療は,厳密な時間的制約下での難しい決定を伴う。
数値物理学シミュレーションは、理論上、オペレーターに治療アプローチやデバイスの選択に関してより良い決定を下すよう通知することができるが、実際に行うには遅すぎる。
この論文は、現在の機械学習に基づくサロゲートが、これらのシミュレーションをステップバイステップで正確にエミュレートし、より高速にすることができるかどうかを考察する。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:54:55 GMT)
Adversarial Feeds Steer LLM Agent Decisions Against Their Defaults [0.0] LLMエージェントは、ソーシャルフィード、検索結果、検索コンテキスト、電子メールキューなどのランク付けされた外部情報ストリームを消費した後、ますます行動する。
モデル,ペルソナ,トピック,最終決定のプロンプトを保持する制御プロトコルを導入し,エージェントが遭遇するポストの構成と順序だけを変化させる。
我々は, 逆降圧, デフォルト飽和, 一方のフィードが真に不確実な決定を下す非対称性の3つの応答機構を同定した。
論文参考訳(メタデータ) (Sat, 30 May 2026 22:43:23 GMT)
Adaptive PD Gains for Energy-Conscious Control in Physical Human-Robot Interaction [0.0] 我々は,任意の制限下でロボットのエネルギーを制限し,安全なpHRIを実現する適応比例微分(PD)コントローラを提案する。
コントローラゲインの動作は、カットオフ限界とシャープネスを正確に定義して、様々なパラメータを使って形作ることができる。
制御器の安定性証明を構築し,制御器の安定性を保証する条件を定義する。
論文参考訳(メタデータ) (Sat, 30 May 2026 00:52:48 GMT)
AXIOM: A Trust-First Neuro-Symbolic Execution Architecture for Verifiable Mathematical Reasoning [0.0] AXIOMは、自然言語の数学的推論のための信頼第一の神経象徴的実行アーキテクチャである。
累積正解率94.36%(2,592/2,747)の4MATHカテゴリーの実証結果について報告する。
アーキテクチャは、パブリックデプロイメントを通じて3万のプロダクションクエリを提供する。
論文参考訳(メタデータ) (Sat, 30 May 2026 10:55:24 GMT)
A passive universal grasping mechanism based on an everting shell [0.0] 把持アームは、永続シェルと連動して働くビームセグメントで構成されている。
ビスタブルシェルは被写体と接触し、保持アームが被写体を囲むようにする。
腕の硬さは機構のペイロードを決定する。
論文参考訳(メタデータ) (Sat, 30 May 2026 01:28:24 GMT)
A Systematic Benchmark of Intraoperative Ultrasound-to-MR Synthesis for Brain Tumour Surgery [0.0] 術中超音波(ioUS)は脳腫瘍手術において多彩で費用対効果が高い。
以前の作業のほとんどは、単一のアーキテクチャを独立して評価しています。
アーキテクチャパラダイム、推論規則、ダウンストリームタスクエンドポイントにまたがるベンチマークはない。
論文参考訳(メタデータ) (Sat, 30 May 2026 09:05:24 GMT)
A Retinomorphic Optical Spiking Neuron for Camouflaged Object Detection [0.0] 高度な視覚システムは、動的視覚シーンのレチノモルフィックでエネルギー効率の高いスパイクベースの前処理を必要とする。
我々はHodgkin-Huxley-based optical spiking neuron(OSHN)を利用した網膜前処理機能を示す。
OSHNは480nmで2pJ(中波長、M)、800nmで24.5pJ(長波長、L)のスパイク当たりのエネルギー消費で波長及び強度に敏感なスパイク符号化を行う。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:36:02 GMT)
A Lightweight Hybrid MLP-Based Framework for Real-Time Phishing URL Detection Using Structural URL Features [0.0] 本稿では,リアルタイムフィッシングURL検出のための軽量なハイブリッドフレームワークを提案する。
ブラックリストベースのスクリーニングと、構造的なURL機能のみで動作するMulti-Layer Perceptron(MLP)を組み合わせる。
このフレームワークは、構造的、ドメインベース、およびセキュリティ関連の特徴をキャプチャする16のURL由来の特徴を抽出する。
論文参考訳(メタデータ) (Sat, 30 May 2026 20:47:58 GMT)
A Comparative Analysis of Machine Learning Algorithms for Multi-Task Prediction of the Parameters of the Pectin Hydrolysis--Extraction Process [0.0] 本研究では,機械学習を用いたペクチン加水分解-抽出過程の制御の課題に対処する。
実験基盤は、7種類の植物原料の制御条件下で実施される1,000の実験実験からなるユニークなデータベースである。
論文参考訳(メタデータ) (Sat, 30 May 2026 17:47:26 GMT)