Reasoning emerges from constrained inference manifolds in large language models [98.7] 我々は推論中の内部表現の進化を調べることによって、本質的な力学過程としての推論を研究する。
このような幾何学的圧縮は広く普及しているが、安定的あるいは信頼性のある推論には不十分である。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:41:20 GMT)
Reshaping Undergraduate Computer Science Education in the Generative AI Era [85.8] 生成AIはコンピュータサイエンス(CS)教育の転換点である。
AI技術の進歩に追随するため、CSカリキュラムは、AI生成したアーティファクトの理解と検証へのシフトを検討するべきである。
我々は、未来のコンピュータサイエンスの卒業生を効果的に準備し、問題を作成し、解決し、管理し、AIで人工物を作ることができると信じています。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:26:24 GMT)
NoiseRater: Meta-Learned Noise Valuation for Diffusion Model Training [81.6] NoiseRaterは、拡散モデルトレーニングにおけるインスタンスレベルのノイズ評価のためのメタラーニングフレームワークである。
NoiseRaterは、重要度スコアをデータとタイムステップで条件付けられた個々のノイズ実現に割り当てる。
FFHQとImageNetの実験では、すべてのノイズサンプルが等しく寄与するわけではない。
論文参考訳(メタデータ) (Sat, 02 May 2026 19:43:16 GMT)
LiveFMBench: Unveiling the Power and Limits of Agentic Workflows in Specification Generation [75.1] 大規模言語モデル(LLM)とエージェントは有望な進歩を示しているが、その真の能力と失敗モードは未だ不明である。
CプログラムのためのLCMおよびエージェントベースの形式仕様生成に関する、最初の体系的および汚染に配慮した研究を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:31:33 GMT)
ReMedi: Reasoner for Medical Clinical Prediction [70.8] EHRによる臨床結果予測を改善するためのフレームワークであるReMediを提案する。
ReMediは、複雑な臨床問題に対する挑戦的なサンプル再生機構を用いて有理応答対を生成する。
複数のEHR予測タスクの実験では、F1スコアで最先端のベースラインを19.9%上回った。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:44:49 GMT)
Self-Normalized Martingales and Uniform Regret Bounds for Linear Regression [65.8] 自己正規化マルティンガレのスケール不変上界が可能であることを示す。
通常の正規化ペナルティを含まない自己正規化濃度不等式を導出する。
論文参考訳(メタデータ) (Sat, 02 May 2026 22:39:00 GMT)
Rethinking Model Selection in VLM Through the Lens of Gromov-Wasserstein Distance [65.4] VLM(Vision-Language Models)は、視覚エンコーダの統合により、視覚機能を備えた従来のLLMを拡張した。
最大サイズまたは最高ゼロショット精度のエンコーダを選択するような一般的なプラクティスは、常に最適なモデルを特定するのに失敗していることを示す。
VLMでは視覚エンコーダのどの要素が重要か?
論文参考訳(メタデータ) (Sat, 02 May 2026 08:42:13 GMT)
Sentinel-VLA: A Metacognitive VLA Model with Active Status Monitoring for Dynamic Reasoning and Error Recovery [62.8] textbfSentinel-VLAは,リアルタイム実行状況を監視するアクティブセンチネルモジュールを備えたメタ認知型VLAモデルである。
すべてのトレーニングデータは、設計したパイプラインを通じて自動生成され、注釈付けされます。
実世界の実験では、Sentinel-VLAはSOTAモデルであるPI0と比較してタスク成功率を30%以上向上することを示した。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:10:54 GMT)
Spectral- and Energy-efficient Multi-BS Multi-RIS Pinching-antenna Systems: A GNN-based Approach [62.3] 本稿では,マルチベースステーション(Multi-BS)多再構成可能な知的表面(multi-RIS)補助ピンチアンテナ(PA)システムにおけるダウンリンクの協調伝送について検討する。
我々は、PA配置、RIS位相シフト、ビームフォーミング、BS-UEアソシエーションを共同最適化することで、和率(SR)とエネルギー効率(EE)問題を定式化する。
本稿では,不均一なグラフ表現と均一なグラフ表現を統合した3段階グラフニューラルネットワーク(GNN)を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:30:37 GMT)
Degradation-Aware Adaptive Context Gating for Unified Image Restoration [57.1] 単一モデルを用いた統一画像復元は、多種多様な劣化によるタスク干渉に直面することが多い。
DACG-IRは,劣化特性を明瞭に認識し,特徴表現を動的に変調する。
DACG-IRは、単一タスク、オールインワン、悪天候除去、複合劣化設定において最先端の手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:18:43 GMT)
Robust Parameter Learning for Uncertain MDPs [55.6] 未知のマルコフ決定過程(MDP)を検証するための学習ベースのアプローチは、しばしば不確実なMDPを用いる。
本稿では,パラメータの集合上で遷移確率が表現されるパラメトリックMDP(pMDP)を用いて,そのようなモデルを学習することを提案する。
我々は、経験的遷移周波数からの統計的不確実性をpMDPのパラメータ空間に予測し、基礎となるMDPに対してほぼ正しい(PAC)不確実性モデルを生成する。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:22:05 GMT)
GR-Ben: A General Reasoning Benchmark for Evaluating Process Reward Models [55.6] 現在、プロセス報酬モデル(PRM)は、テストタイムスケーリングに顕著な可能性を示している。
GR-Ben(GR-Ben)は、2つの主要な推論領域にわたるPRMのパフォーマンスを評価するために特別に設計されたプロセスレベルのベンチマークである。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:41:48 GMT)
Segment-Aligned Policy Optimization for Multi-Modal Reasoning [55.3] 本稿では、トークンや全シーケンスではなく、一貫性のある推論ステップをポリシー更新の基本単位として扱う新しい強化学習パラダイムを提案する。
代表的な推論ベンチマークの実験は、SAPOがトークンレベルおよびシーケンスレベルポリシー最適化手法を一貫して上回っていることを示している。
我々の研究は、強化学習の更新を推論の構造と整合させることの重要性を強調し、複雑な推論タスクにおけるより効率的でセマンティックに根ざした政策最適化の道を開く。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:47:45 GMT)
VLA-ATTC: Adaptive Test-Time Compute for VLA Models with Relative Action Critic Model [54.4] 適応型テスト時間計算でVLAモデルを実現するフレームワークである textbfVLA-ATTC' を導入する。
VLA-ATTCは、不確実性に基づく認知クラッチ'を用いて、反射的実行からTTC熟考フェーズへ動的に移行する。
LIBERO-LONGベンチマークでは、VLA-ATTCはSOTAモデルPI0.5の故障率を50%以上削減する。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:13:11 GMT)
SciResearcher: Scaling Deep Research Agents for Frontier Scientific Reasoning [54.2] 我々は、フロンティア科学データ構築のための完全に自動化されたエージェントフレームワークであるSciResearcherを紹介する。
SciResearcherは、学術的証拠に基づく様々な概念的および計算的なタスクを合成する。
我々は,HLE-Bio/Chem-Goldベンチマークで19.46%を達成できるエージェント基盤モデルであるSciResearcher-8Bを開発した。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:26:45 GMT)
Breaking the Computational Barrier: Provably Efficient Actor-Critic for Low-Rank MDPs [53.4] 低ランクマルコフ決定過程(MDPs)の下で広く採用されているRLオーラクルの階層を確立するために,教師付き学習を計算プロキシとして利用する。
本研究の目的は,政策評価にのみ依存する新しい楽観的アクター批判アルゴリズムを提案することである。
提案アルゴリズムは,従来の計算コストの高い計画や最適化オーラクルを回避しつつ,既存のサンプル複雑度保証よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:46:54 GMT)
ZenBrain: A Neuroscience-Inspired 7-Layer Memory Architecture for Autonomous AI Systems [51.6] LongMemEval-500では、ZenBrainは長いコンテキストのオラクルのバイナリ・ジャッジの精度を4.5pp以内と一致させる。
ZenBrainは7層の神経科学にインスパイアされたメモリアーキテクチャである。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:08:59 GMT)
TimeTok: Granularity-Controllable Time-Series Generation via Hierarchical Tokenization [51.4] TimeTokは、Granularity-Controllable Time-Series Generationの統一フレームワークである。
TimeTokの中核は階層的なトークン化戦略であり、時系列を順序付けられたトークン列にマッピングする。
TimeTokはGC-TSGタスクに優れ、標準世代で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:30:52 GMT)
A Multi-View Media Profiling Suite: Resources, Evaluation, and Analysis [50.4] ニュースメディアは、政治的偏見と事実性を自動的に検出する尺度で世論を形作っている。
この分野には、統一された資源、様々なアプローチにわたる包括的な評価、そして最も重要な表現と融合戦略の体系的な分析がまだ欠けている。
メディアバイアス/ファクトチェック(MBFC)から約2,600のアウトレットをカバーする大規模ラベルセットMBFC-2025を紹介する。
約900のコンセントを含むACL-2020とMBFC-2025のマルチビュー表現を構築した。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:17:53 GMT)
Verbal-R3: Verbal Reranker as the Missing Bridge between Retrieval and Reasoning [48.2] 本稿では,検索結果と大言語モデルの推論能力をVerbal sを介して橋渡しする手法を提案する。
本稿では,ジェネレータとバーバルリランカを組み合わせた新しいエージェントRAGフレームワークであるVerbal-R3を紹介する。
Verbal-R3は、複雑な質問応答ベンチマークで最先端のパフォーマンスを実現し、提案したフレームワークの有効性を検証する。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:43:23 GMT)
VISTA: Video Interaction Spatio-Temporal Analysis Benchmark [47.4] 視覚言語モデル(VLM)におけるオープンセット・マルチアクション時間的理解のためのベンチマークであるVISTAを紹介する。
我々のベンチマークでは、複数のデータセットを単一のインタラクション対応ベンチマークに統合し、12Kのキュレートされたビデオペアで構成されています。
全体として、VISTAはVLMにおける時間的理解のための、最初の大規模かつ対話対応の診断ベンチマークである。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:28:20 GMT)
GIFT: Guided Fine-Tuning and Transfer for Enhancing Instruction-Tuned Language Models [47.1] GIFT(Guided Fine-Tuning and Transfer)は、命令モデルからタスク適応へのガイダンスを組み込んだフレームワークである。
G GIFTは、命令チューニングモデルから得られた信頼信号を用いて、事前訓練ベースモデルの低ランクアダプタを微調整する。
数式および知識集約型ベンチマークを用いて,複数のモデルファミリおよびスケールでGIFTを評価する。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:27:59 GMT)
VoxAfford: Multi-Scale Voxel-Token Fusion for Open-Vocabulary 3D Affordance Detection [46.8] オープンボキャブラリー3Dアベイランス検出は、新しいアベイランス記述を与えられた点雲上の相互作用領域をローカライズする必要がある。
凍結した3次元VQVAEエンコーダを生成後に出力トークンに注入することにより,このボトルネックを回避するVoxel-enhanced Afford Detection (VoxAfford)を提案する。
VoxAffordはmIoUの約8%の改善で最先端のパフォーマンスを達成し、実際のロボット実験で新しいオブジェクトへのゼロショット転送が確認された。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:21:13 GMT)
MIRL: Mutual Information-Guided Reinforcement Learning for Vision-Language Models [46.5] Reinforcement Learning with Verifiable Rewards (RLVR)は、回答の正当性信号を用いてポリシーを最適化することで、有望なソリューションを提供する。
我々は、生成した記述と視覚入力の相互情報(MI)を安価な事前スクリーニング信号として利用することにより、両方の制約に対処する分離されたフレームワークであるMIRLを紹介する。
6つの視覚言語推論ベンチマークの実験により、MIRLの平均精度は70.22%に達した。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:21:31 GMT)
Decompose and Recompose: Reasoning New Skills from Existing Abilities for Cross-Task Robotic Manipulation [45.9] クロスタスクの一般化は、オープンソースのロボット操作における中核的な課題である。
中間表現としてアトミックなスキルアクションペアを用いたスキル推論フレームワークであるDecomposeとRecomposeを提案する。
われわれのアプローチでは、実演を解釈可能なスキル-アクションアライメントに分解し、モデルが見えないタスクのためにこれらのスキルを再構成できるようにする。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:55:28 GMT)
Towards Visual Query Localization in the 3D World [44.7] 3DVQLと呼ばれる新しいベンチマークを導入することで、3Dの世界におけるビジュアルクエリローカライゼーションに対処する最初の試みを行う。
3DVQLは、約170,000フレームの2,002シーケンスと、38のオブジェクトカテゴリの6.4K応答セグメントを含んでいる。
私たちの知る限り、3DVQLは3Dマルチモーダルなビジュアルクエリローカライゼーションのための最初のベンチマークです。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:41:54 GMT)
Assistance Without Interruption: A Benchmark and LLM-based Framework for Non-Intrusive Human-Robot Assistance [44.1] 我々は、人間-ロボット相互作用(HRI)の独立したパラダイムとして、非侵入支援を形式化し、ベンチマークする。
直接命令や明示的な交渉,あるいはユーザの習慣や履歴に基づく積極的な介入に依存する従来のHRIタスクとは違って,我々のタスクは人間の計画を主要なプロセスとして扱い,いつ,何をすべきかという共同決定として支援を定式化する。
NIABenchと実世界のシナリオの総合的な実験により,本手法は作業効率を保ちながら人的労力を減らし,積極的かつ非侵襲的な支援を実現することを示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:25:40 GMT)
PACE: Post-Causal Entropy Modeling for Learned LiDAR Point Cloud Compression [43.5] LiDARポイントクラウド圧縮は、高解像度センサーから大量のデータを処理するために自律システムにとって不可欠である。
PACEは、祖先のコンテキストアグリゲーションを非因果バックボーンとして再構成し、因果関係を軽量でステージスケーラ可能な予測器に変換する新しいフレームワークである。
実験により、PACEは圧縮効率を新たな最先端に設定し、顕著なBD-BR節約を実現し、自動回帰モードで復号遅延を90%以上削減した。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:36:11 GMT)
Omni-Fake: Benchmarking Unified Multimodal Social Media Deepfake Detection [42.8] ソーシャルメディアでは、マルチモーダルなディープフェイクが急増している。
既存のベンチマークは、単一のモダリティの範囲、単純化された操作、非現実的な分布によって制約される。
ソーシャルメディア設定における総合的なマルチモーダルディープフェイク検出のためのオムニ・フェイク(Omni-Fake)を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 22:56:17 GMT)
ClarifySTL: An Interactive LLM Agent Framework for STL Transformation through Requirements Clarification [41.0] Signal Temporal Logic (STL) は、サイバー物理システムのリアルタイム動作を特定するための形式言語である。
大規模言語モデル(LLM)を活用した最近の取り組みは目覚ましい性能を示しているが、いくつかの自然言語要求にはあいまいな情報や曖昧な情報が含まれている。
要求の明確化を通じてSTL変換を強化する対話型LLMエージェントフレームワークであるClarifySTLを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:55:06 GMT)
Hallucinations Undermine Trust; Metacognition is a Way Forward [36.2] 事実の信頼性が著しく向上しているにもかかわらず、しばしば幻覚と呼ばれるエラーは、生成的AIにとって大きな関心事である。
我々は、この領域におけるほとんどの事実性は、モデルの知識境界を広げることによって得られると論じている。
言語的不確実性と本質的不確実性とを整合させるという忠実な不確実性を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:59:14 GMT)
VOFA: Visual Object Goal Pushing with Force-Adaptive Control for Humanoids [35.7] VOFAは視覚目標条件付きヒューマノイドロコ操作システムである。
未知の物理的特性を持つオブジェクトを任意の目標位置にプッシュすることができる。
VOFAは、ブースターT1ヒューマノイドロボットのシミュレーションと実世界の実験で広く評価されている。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:16:23 GMT)
SF20K Competition 2025: Summary and findings [34.9] ショートフィルム20K(SF20K)コンペティションは、ショートクリップアクション認識以上のストーリーレベルのビデオ理解を促進するように設計されている。
モデルは人気映画の記憶よりもマルチモーダルな理解に頼らなければならない。
優勝チームはメイントラックで65.7%、スペシャルトラックで48.7%、人間のパフォーマンス天井で91.7%の精度を達成した。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:35:54 GMT)
Lifting Traces to Logic: Programmatic Skill Induction with Neuro-Symbolic Learning for Long-Horizon Agentic Tasks [34.4] Neuro-Symbolic Skill induction (NSI) は、対話トレースをモジュラーなテキスト・グラウンド・プログラムに持ち上げるフレームワークである。
NSIは効率的な一般化を可能にし、エージェントはわずかな例からスキルを誘導し、目に見えない目標に柔軟に適応することができる。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:06:01 GMT)
Decision-Focused Learning via Tangent-Space Projection of Prediction Error [32.7] 決定焦点学習(DFL)は、下流の意思決定品質を改善するために予測器を訓練する。
局所的に安定な活性制約を持つ標準正則性の下では、後悔勾配は閉形式幾何学的特徴を持つことを示す。
そこで本研究では, 線形系を減らし, 残差勾配を計算するPEARを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:10:16 GMT)
VAnim: Rendering-Aware Sparse State Modeling for Structure-Preserving Vector Animation [32.2] VAnimはオープンドメインのテキスト・トゥ・SVGアニメーションのための最初のフレームワークである。
アニメーションを永続的なSVG DOMツリー上でスパース状態更新(SSU)として再認識する。
また,ベクトルアニメーションの最初のベンチマークであるSVGAnim-134kを紹介する。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:10:55 GMT)
Registration-Free Learnable Multi-View Capture of Faces in Dense Semantic Correspondence [30.4] MOCHIは、登録したトレーニングデータを必要とせずにトレーニングされた多視点3D顔予測フレームワークである。
標準点間距離は、登録不要設定でトレーニングの不安定性と視覚的アーティファクトを誘導する。
代わりに、よりスムーズな勾配とより優れた再構成忠実度を提供する点マップと正規化に基づく損失を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:59:29 GMT)
DataArc-SynData-Toolkit: A Unified Closed-Loop Framework for Multi-Path, Multimodal, and Multilingual Data Synthesis [30.1] DataArc-SynData-Toolkitは、直感的なビジュアルインターフェースと単純化されたCLIを備えた、構成駆動のエンドツーエンドパイプラインを備えた、オープンソースのフレームワークである。
エンドツーエンドで視覚的に対話的なパイプラインを提供することで、DataArc-SynData-Toolkitは、合成データ生成とその後のモデルトレーニングに対する技術的障壁を著しく低くする。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:37:58 GMT)
CGFformer: Cluster-Guidance Frequency Transformer for Pansharpening [29.9] CGFformerは、周波数分布の変化と周波数と空間成分間の相互作用に焦点を当てたクラスタ誘導周波数変換器である。
本稿では,トランスフォーマーをベースとしたクロスアテンションと組み合わせて,様々なノイズを除去し,周波数関連障害と無関係障害をネットワークが共同で抑制する2重ストリームリファインメントモジュールを提案する。
さらに、詳細性を高め、空間-周波数相互作用を容易にするために、周波数-空間融合モジュールを開発する。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:27:08 GMT)
LLM Output Detectability and Task Performance Can be Jointly Optimized [29.8] PUPPETは大規模な言語モデルを微調整してテキストを生成するフレームワークである。
長期QA,要約,エッセイ作成実験の結果,PUPPETで訓練されたLPMは透かし法と競合する高い検出性が得られることがわかった。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:50:51 GMT)
Grounding Multi-Hop Reasoning in Structural Causal Models via Group Relative Policy Optimization [29.6] MHFV(Multi-Hop Fact Verification)は、異なる証拠の複雑な推論を必要とする。
既存の手法は、Chain-of-Thought (CoT)を通じて透明性を向上させる一方で、エビデンスとクレーム間の因果関係の明確なモデリングを欠いている。
本稿では,構造因果モデル(Structure Causal Model, SCM)における推論を基礎として, 検証を建設因果推論プロセスとして扱う新しい枠組みを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:05:38 GMT)
SwiftPie: Lightning-fast Subject-driven Image Personalization via One step Diffusion [28.8] SwiftPieは、最初のワンステップ拡散画像パーソナライズツールである。
SwiftPieはより優れた画像パーソナライズ速度を提供し、マルチステップアプローチで同等のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:04:26 GMT)
Valley3: Scaling Omni Foundation Models for E-commerce [26.8] 多様なグローバルeコマースタスクのために開発された,Omni Multimodal Large Language Model (MLLM) であるValley3を提案する。
Valley3のキーとなる機能は、視覚言語モデルを拡張して開発されたeコマース用のネイティブな多言語オーディオ機能である。
探索ツールを積極的に起動し,タスク関連情報を取得するエージェント検索機能をValley3に装備する。
論文参考訳(メタデータ) (Sat, 02 May 2026 06:25:48 GMT)
LocalAlign: Enabling Generalizable Prompt Injection Defense via Generation of Near-Target Adversarial Examples for Alignment Training [26.7] 大規模な言語モデルは、ユーザデータ、検索されたWebコンテンツ、および外部ツールと相互作用するシステムにますます組み込まれています。
プロンプトインジェクションでは、信頼できないデータに埋め込まれた悪意のあるコマンドが信頼できないコマンドをオーバーライドする。
既存の防御は、信頼できないコマンドと信頼できないデータ部分との明確な境界を維持するためにモデルを微調整することに主に依存している。
敵の訓練に触発されたより一般化可能なプロンプトインジェクション・ディフェンスであるLocalAlignを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:25:26 GMT)
KG-First, LLM-Fallback: A Hybrid Microservice for Grounded Skill Search and Explanation [26.7] ESCO、ROM、O*NETのような権威的な能力のフレームワークは、教育と労働市場のニーズの整合に不可欠であるが、その技術的な複雑さと構造的不均一性は、教育者による実践的な採用を妨げる。
本稿では、これらのリソースを実績保存知識グラフ(KG)に統合することで、このギャップを埋めるように設計されたマイクロサービスであるSkillGraph-Serviceを紹介する。
結果として得られるアーキテクチャは、複雑なスキルデータをデジタル学習エコシステムに統合するための実用的でスケーラブルで監査可能なソリューションを提供する。
論文参考訳(メタデータ) (Sat, 02 May 2026 19:07:56 GMT)
Lost in the Tower of Babel: The Adverse Effects of Incidental Multilingualism in LLMs [25.8] 本稿では,現代多言語NLPが,偶発的多言語主義の脆弱で誤解を招くパラダイムに収束していることを論じる。
このパラダイムは言語間の不平等、不安定、不透明な振る舞いを体系的に生み出すと我々は主張する。
この問題に対処するためには、設計による多言語主義へのシフトが必要だ。
論文参考訳(メタデータ) (Sat, 02 May 2026 03:39:12 GMT)
GameScope: A Multi-Attribute, Multi-Codec Benchmark Dataset for Gaming Video Quality Assessment [25.0] ユーザ生成コンテンツ(UGC)とプロ生成コンテンツ(PGC)の両方を組み込んだゲームビデオ品質データセットを,これまでで最大規模で提示する。
我々のデータセットは、最も広く使われているコーデック(H.264, H.265, AV1)をカバーし、平均37のスコアスコア(MOS)で注釈付けされた4,048のビデオサンプルで構成されている。
全体的な品質スコアに加えて,粗い品質特性も収集し,知覚的要因の理解を深める。
論文参考訳(メタデータ) (Sat, 02 May 2026 06:11:53 GMT)
Focus on the Core: Empowering Diffusion Large Language Models by Self-Contrast [25.0] 高情報密度(HD)トークンについて検討し,2つの重要な知見を示した。
トレーニング不要なデコード戦略であるCore textbf(FoCore)を提案する。
FoCoreは、LLaDAとDreamのバックボーン間の生成品質と効率を継続的に改善する。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:46:56 GMT)
Hugging Carbon: Quantifying the Training Carbon Emissions of AI Models at Scale [24.6] Hugging Face (HF) は、炭素会計のための大規模で、一般公開され、監査可能なコーパスである。
我々は,HFオープンソースモデルの集合的トレーニングエミッションを推定するFLOPsベースのフレームワークを提案する。
我々の結果は、最も人気のあるオープンソースモデルのトレーニングの結果、約5.8タイムs104$の二酸化炭素排出量が得られたことを示している。
論文参考訳(メタデータ) (Sat, 02 May 2026 17:32:56 GMT)
Dynamics Distillation for Efficient and Transferable Control Learning [24.3] 我々は,高忠実度車両シミュレーションと拡張性強化学習を橋渡しするフレームワークであるSim2Sim2Simを紹介する。
我々は、より効率的な政策最適化と、挑戦的な動的条件下での信頼性転送を実証する。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:08:26 GMT)
Faithful Mobile GUI Agents with Guided Advantage Estimator [23.8] 視覚言語モデルに基づくグラフィカルユーザインタフェース(GUI)エージェントは、強力なインタラクション機能を示している。
本稿では,GUIインタラクションを再構築し,根拠と内部整合性を優先する忠実度優先フレームワークであるFithful-Agentを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:54:36 GMT)
A Target-Free Harmonization Method for MRI [23.5] スキャンパラメータ、シーケンス、ハードウェアのMRIのバリエーションは、同じ主題であっても、画像の外観に相違をもたらす可能性がある。
ドメインシフトとして知られるこれらの矛盾は、画像解析を妨げ、特定のターゲットドメインのデータに基づいてトレーニングされたディープラーニングモデルのパフォーマンスを低下させる。
MRI画像調和は、解剖学的構造などの生物学的情報を保持しながら、ソース領域イメージを対象領域イメージに整列させることにより、これらの問題に対処することを目的としている。
論文参考訳(メタデータ) (Sat, 02 May 2026 06:32:32 GMT)
Checkerboard: A Simple, Effective, Efficient and Learning-free Clean Label Backdoor Attack with Low Poisoning Budget [23.4] Checkerboardは理論的に根拠のない、学習のないクリーンラベルのバックドア攻撃だ。
線形分離性定式化から閉形式にトリガを導出し,サロゲートモデルトレーニングとトリガ最適化の必要性を除去する。
4つのベンチマークデータセットで、Checkerboardは8つのベースラインアタックを上回り、毒の少ない予算下で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:14:49 GMT)
Less Interaction But More Explanation: A Communication Perspective on Agentic AI Interfaces [22.4] 我々は,AIシステムのコミュニケーション的役割をユーザがどのように知覚するかについて議論する。
エージェントAIは複数のコミュニケーションの役割を果たすことができるため、このソース認識を複雑にし、潜在的なリスクを導入することができる。
我々はエージェントAIが組み込む必要がある3つのタイプの説明を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 21:21:21 GMT)
The Partial Testimony of Logs: Evaluation of Language Model Generation under Confounded Model Choice [22.2] 本研究では,大規模に構築された大規模観測ログと,未確立のスコアリングのための小さなランダム化実験と,オフラインシミュレータを組み合わせた3ソース設計について検討する。
本研究の主な成果は,ランダム化実験とシミュレータにより因果モデル値の復元が可能であることを示す同定定理である。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:55:55 GMT)
Bi-Level Reinforcement Learning Control for an Underactuated Blimp via Center-of-Mass Reconfiguration [22.1] 本稿では,2つのスラスタと可動内装スライダからなるコンパクトアーキテクチャについて述べる。
提案手法は固定CoMベースラインとPIDベースコントローラを一貫して上回る。
論文参考訳(メタデータ) (Sat, 02 May 2026 06:55:26 GMT)
PACE: Parameter Change for Unsupervised Environment Design [22.1] 教師なし環境設計は、適応的な学習環境を形成することで強化学習の一般化を改善するための有望なパラダイムを提供する。
既存のUED手法では、後悔や値ベースのエラー、あるいはモンテカルロなど、バイアス、高い分散、あるいはかなりの計算オーバーヘッドに悩まされている間接的なプロキシ信号を用いて環境を評価する。
本研究では,その環境に対するトレーニングによって引き起こされる政策変化を通じて環境評価を行い,実際の学習過程において環境選択を直接基礎とする変化環境設計(PACE)を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:07:59 GMT)
Prescriptive Scaling Laws for Data Constrained Training [21.3] トレーニング計算は、高品質なデータの可用性をますます上回っている。
チンチラスケーリング法は、すべてのトレーニングトークンがユニークであると仮定する。
我々のスケーリング法則は、定性的に新しい計算-最適割り当てアドバイスをもたらす。
論文参考訳(メタデータ) (Sat, 02 May 2026 23:14:20 GMT)
Autonomous Drift Learning in Data Streams: A Unified Perspective [21.2] 自律的な学習システムを追求する上で、データ分散とモデル行動が一定であるという前提は、基本的には持続不可能である。
本稿では,システムの運用状態に基づいて分野を体系化する新しい3次元分類法を提案する。
ドリフト適応,連続学習,時間的一般化の断片的パラダイムをブリッジすることで,自己進化型インテリジェントシステム構築のロードマップを概説する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:11:38 GMT)
Where Do Prompt Perturbations Break Generation? A Segment-Level View of Robustness in LoRA-Tuned Language Models [21.1] 大規模な言語モデルは、小さな急激な摂動に敏感である。
既存の堅牢性メソッドは通常、シーケンス全体の一貫性を強制する。
堅牢なLoRAファインチューニングのためのセグメントレベルフレームワークであるS$2$R$2$を紹介する。
論文参考訳(メタデータ) (Sat, 02 May 2026 21:12:07 GMT)
Asymmetric Invertible Threat: Learning Reversible Privacy Defense for Face Recognition [20.9] 顔認識システムは、不正な収集と顔データの誤用によるプライバシー上の懸念を提起する。
プライバシ保護,キー付きリカバリ,タンパー表示をひとつのフレームワークに統合した,パーソナライズされた顔のクローキングの復元対応拡張を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 03:18:36 GMT)
TT4D: A Pipeline and Dataset for Table Tennis 4D Reconstruction From Monocular Videos [20.7] 大規模な高忠実度テーブルテニスデータセットであるTT4Dを提案する。
再建されたシングルを1400ドル以上で提供し、モノラルな放送ビデオからゲームプレイを倍増させる。
このリッチなデータは、仮想リプレイ、詳細なプレイヤー分析、ロボット学習のための新しい基盤を提供する。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:14:40 GMT)
Embedding-based In-Context Prompt Training for Enhancing LLMs as Text Encoders [20.5] EPICは、大規模な言語モデルのための新しい組込み型インコンテキスト・プロンプト・トレーニング戦略である。
学習と推論の双方で計算負担を軽減しつつ、高品質な埋め込みを生成する。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:31:01 GMT)
CSGuard: Toward Forgery-Resistant Watermarking in Diffusion Models via Compressed Sensing Constraint [20.5] 遅延ベースの拡散モデルウォーターマーキングは、透かしを生成された画像の潜在空間に埋め込んで、コンテンツ属性を可能にする。
しかし、攻撃者は透かしを反転させて任意のプロンプトで再生成することにより、悪意のあるコンテンツに対する偽の帰属を可能にすることで、透かしを抽出することができる。
CSGuardは、圧縮されたセンシングを利用して、透かし画像の生成と検証を秘密行列に結合する最初の偽造抵抗型透かしスキーマである。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:54:09 GMT)
Cut-In Gap Acceptance Toward Autonomous vs. Human-Driven Vehicles: Evidence from the Waymo Open Motion Dataset [20.0] ドライバーは、人間の運転する車両を目標とする場合よりも、自動運転車の前を切る場合の方が短いギャップを受け入れることが示される。
結果は,人間のギャップ目標行動における系統的および安全性関連非対称性を明らかにした。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:13:39 GMT)
Chain of Evidence: Pixel-Level Visual Attribution for Iterative Retrieval-Augmented Generation [19.9] 反復検索拡張生成(iRAG)は、複雑なマルチホップ問題に答える強力なパラダイムとして登場した。
Evidence (CoE) の textbfChain について述べる。
論文参考訳(メタデータ) (Sat, 02 May 2026 06:40:42 GMT)
Beyond Semantic Relevance: Counterfactual Risk Minimization for Robust Retrieval-Augmented Generation [19.9] CoRM-RAG(Counterfactual Risk Minimization for RAG)は、検索と意思決定の安全性を一致させるフレームワークである。
トレーニング中にユーザのバイアスをシミュレートする認知摂動プロトコルを導入し,それを軽量なエビデンス・クリティカルに蒸留する。
このスコアリングモジュールは、対向的なクエリの摂動にも拘わらず、モデルの正しさを判断するために十分な明らかな強度を持つ文書を特定することを学習する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:22:24 GMT)
A framework for analyzing concept representations in neural models [18.7] 2つの軸に沿った線形な概念部分空間について検討する:textitcontainment, 概念が部分空間で完全に表現されているかどうかをテストするが、外部では表現されない、textitdisentanglement, 他の概念から分離するためにテストする。
テキストモデルと音声モデルの両方の実験において、まず、概念部分空間は一意に決定されない可能性があることを強調し、概念部分空間解析の意義について議論する。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:08:10 GMT)
OmniEncoder: See, Hear, and Feel Continuous Motion Like Humans With One Encoder [17.5] 我々は、共有潜在空間内の25fpsの対称で視覚信号と音声信号を共入力するための統合トランスフォーマーバックボーンであるtextbf Omni-Encoder を提案する。
実験により、モダリティ固有のベースラインであるQwen2.5-Omniと比較して、Omni-Encoderは視覚的連続理解タスクに大きな利益をもたらすことが示された。
これらの結果から,統一全能符号化は全能モデル構築に有望な方向性をもたらすことが示唆された。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:55:03 GMT)
Led to Mislead: Adversarial Content Injection for Attacks on Neural Ranking Models [17.4] CRAFTは、大規模言語モデル(LLM)を利用したブラックボックスランク攻撃の監視フレームワークである。
セマンティックな忠実さを維持しながら高い昇進率とランクアップを達成することで、最先端のベースラインを上回ります。
この研究は、ランク操作における生成AIのリスクを強調し、より堅牢な検索システムを開発するための基盤を提供する。
論文参考訳(メタデータ) (Sat, 02 May 2026 19:26:34 GMT)
MTA: Multi-Granular Trajectory Alignment for Large Language Model Distillation [17.4] 本稿では,教師と生徒の表現を階層的な変換軌道に沿って整列させる枠組みを提案する。
下層は語彙情報を保存するために単語レベルで整列され、上層はフレーズレベルのスパンで構成意味を捉えている。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:52:49 GMT)
MAD-OPD: Breaking the Ceiling in On-Policy Distillation via Multi-Agent Debate [17.3] そこで我々は,MAD-OPD (Multi-Agent Debate-driven On-Policy Distillation)を提案する。
また,多段誤差合成によるトレーニングを安定させるために,ステップレベルサンプリングを付加したOPAD(On-Policy Agentic Distillation)を導入する。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:41:37 GMT)
HepScript: A Dual-Use DSL for Human-AI Collaborative Data Analysis Workflows in High-Energy Physics [17.1] HepScriptは、解析ロジックを制約付き構文に抽象化する、共有形式インターフェースとして機能する。
この抽象化により、必要な人書きのコードを93%削減できる。
私たちの研究は、人間とAIの協調システムへのスケーラブルな経路を示します。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:42:34 GMT)
SplAttN: Bridging 2D and 3D with Gaussian Soft Splatting and Attention for Point Cloud Completion [17.1] そこで,SplAttNを提案する。このSplAttNは,高密度かつ連続的な画像平面表現を生成するために,ハードプロジェクションをガウス分割に置き換える。
実験の結果,SplAttNはPCNとShapeNet-55/34で最先端の性能を発揮することがわかった。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:34:21 GMT)
SRA: Span Representation Alignment for Large Language Model Distillation [16.3] クロスTokenizer Knowledge Distillation (CTKD)は、大きな言語モデルと小さな学生の間で知識の伝達を可能にする。
マルチパーティクル力学系の物理レンズを通してCTKDを再構成する新しいフレームワークであるSRAを紹介する。
SRAは、アライメントの基本単位をトークンからロバストでトークンライザに依存しないスパンにシフトする。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:44:12 GMT)
Decision Boundary-aware Generation for Long-tailed Learning [15.7] 長い尾を持つデータバイアス決定境界をヘッドクラスに向け、テールクラスの精度を低下させる。
近境界表現学習を促進するDBG(Decision boundary-aware Generation)フレームワークを提案する。
DBGは、クラス間のオーバーラップを少なくして、テールクラスと全体的な精度を一貫して改善する。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:35:49 GMT)
Injecting Distributional Awareness into MLLMs via Reinforcement Learning for Deep Imbalanced Regression [15.5] マルチモーダル大言語モデル (MLLM) は, 長期的目標分布下での数値回帰に苦慮する。
グループ相対政策最適化に基づく分散型強化学習フレームワークを提案する。
SFTと既存のMLLM回帰法よりも一貫した改善が見られた。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:49:03 GMT)
VisInject: Disruption != Injection -- A Dual-Dimension Evaluation of Universal Adversarial Attacks on Vision-Language Models [15.4] 普遍的敵攻撃は60-80%の範囲で攻撃の成功率で報告されている。
i)モデルの出力が乱れ(影響)、(ii)攻撃者の選択したターゲット概念が実際に放出された(Precise Injection)。
21のユニバーサルイメージ、147の敵対的な写真、6,615のレスポンスペア、v3のデュアル軸判定結果、および抱きしめるface.co/datasets/jeffliulab/visinjectのキャッシュです。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:56:50 GMT)
CombinationTS: A Modular Framework for Understanding Time-Series Forecasting Models [15.3] 私たちは、進捗にはモデル選択からモジュラー属性へのシフトが必要であると論じています。
本稿では,自己完結型確率的評価フレームワークであるCombinationTSを提案する。
明示的な構造的事前は、複雑さを増大させるよりも、より好ましいパフォーマンス-安定性のトレードオフをもたらすことを示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:08:51 GMT)
AI Alignment via Incentives and Correction [15.0] 我々は、抑止と執行の法・経済モデルのレンズを通してAIアライメントを研究する。
解決者は、説得力があるが誤った答えを出し、不確実性を隠蔽したり、急激なショートカットを悪用する恩恵を受けることができる。
この相互作用を、主成分が共同補正結果よりも報酬を選択する2エージェントモデルで定式化する。
論文参考訳(メタデータ) (Sat, 02 May 2026 23:28:02 GMT)
MemORAI: Memory Organization and Retrieval via Adaptive Graph Intelligence for LLM Conversational Agents [14.2] 大きな言語モデル(LLM)は、長期的なパーソナライズされた会話のための永続的なメモリを欠いている。
既存のグラフベースのメモリシステムは、情報希釈、前兆追跡の欠如、クエリコンテキストを無視した一様検索に悩まされている。
MemORAIは,ユーザ個人関連コンテンツを保持するための2層圧縮による選択的メモリフィルタリング,ターンレベルにおける実データ追跡の証明付きマルチリレーショナルグラフ,動的重み付きPageRankを用いたクエリ適応サブグラフ検索という,3つのイノベーションを統合したフレームワークである。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:20:34 GMT)
Activation Compression in LLMs: Theoretical Analysis and Efficient Algorithm [14.0] 本稿では, アクティベーション圧縮が非バイアスである場合, グラデーション演算子に対して安全であることを示す理論的枠組みを開発する。
余分な計算や追加の勾配誤差を伴わずに、低ランクな活性化因子を再利用して線形層勾配を圧縮する活性化段階の共圧縮法を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:27:11 GMT)
Stable Localized Conformal Prediction via Transduction [13.9] 実際には、制限されたサイズのキャリブレーションセットが1つしかない場合、予測セットは、しばしば高いばらつきを示す。
我々は、この懸念を、キャリブレーションデータから設定サイズの条件付き期待値の分散として定義される集合安定性として定式化する。
本稿では,ラベル付きソースタスクデータとラベルなしターゲットデータを利用した移動学習手法であるStable Conformal Prediction (StCP)を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:02:16 GMT)
LLM-Foraging: Large Language Models for Decentralized Swarm Robot Foraging [13.6] LLM-Foragingは、CPFAステートマシンを大規模言語モデル(LLM)で拡張する分散Swarmコントローラである。
各ロボットは独自のLLMクライアントを実行し、ローカルで観測可能な状態のみを使用してクエリし、既存のCPFAモーションとセンシングスタックは選択したアクションを実行する。
ガゼボのLLM-Foraging in Gazebo with TurtleBot3 Robots across 36 configurations of team size of 4 to 10 robots, arena sizes to 6 x6 to 10 x10meter, and three resource distributions。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:21:26 GMT)
SixthSense: Task-Agnostic Proprioception-Only Whole-Body Wrench Estimation for Humanoids [13.5] SixthSenseは、プロプレセプションとIMUデータだけで、全身の接触タイミング、位置、レンチを推測する。
衝突検出、物理的人間-ロボット相互作用、フォースフィードバック遠隔操作などのアプリケーションのためのプラグアンドプレイ認識モジュールとして機能する。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:57:27 GMT)
Active Reasoning Vision-Language Models via Sequential Experimental Design [13.2] 広い視野で見れば、複雑な推論に必要なきめ細かい詳細を犠牲にしている。
アクティブビジョンと情報収集という古典的なパラダイムにインスパイアされた私たちは、この制限をシーケンシャルな意思決定プロセスとして克服する枠組みを定めています。
本稿では、複数の視覚ツールを備えたエージェントに対して、S-BOED目標の実用的なインスタンス化として、トレーニングフリー推論戦略を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:39:42 GMT)
Toward a Principled Framework for Agent Safety Measurement [12.9] LLMエージェントは、テキストだけでなくアクションを発行し、一度取り込まれると、これらのアクションを無効にすることはできない。
我々は、エージェントの安全性はサンプリングではなく、検索によって測定されるべきであると主張している。
予算内軌道空間を探索するフレームワークであるBOAを適用し,安全性スコアを報告する。
論文参考訳(メタデータ) (Sat, 02 May 2026 23:34:32 GMT)
CUE: Concept-Aware Multi-Label Expansion to Mitigate Concept Confusion in Long-Tailed Learning [12.7] 長い尾の分布は、いくつかのヘッドクラスが多くのサンプルを持ち、ほとんどのテールクラスが非常に少ない実世界の認識タスクで一般的である。
CUE, 概念対応 mUlti-label 拡張を提案する。
いくつかの長い尾のベンチマークの実験では、CUEはバランスの取れた強力な性能を達成し、最近の最先端の手法を超越している。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:51:19 GMT)
EO-Gym: A Multimodal, Interactive Environment for Earth Observation Agents [12.6] マルチモーダルツールを用いたEOエージェントのための制御可能なフレームワークであるEO-Gymを提案する。
この環境上に構築されたEO-Gym-Dataは,9,078個の軌道と34,604個の推論ステップのベンチマークである。
O-GymはインタラクティブなEOエージェントのための再現可能な環境を提供し、EOをエビデンス収集問題として運用する。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:09:17 GMT)
On Stable Long-Form Generation: Benchmarking and Mitigating Length Volatility [12.6] 大規模言語モデルは、長文理解では優れているが、長文生成には大きな制限がある。
既存の研究は主に単一世代の品質に焦点が当てられており、一般的には出力のボラティリティを見下ろしている。
本稿では,長文テキストベンチマークにおけるVOlatilityを提案し,長文生成の長さのボラティリティを定量化する。
長期出力のボラティリティを軽減するため,ロジスブースティングによる安定生成を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:03:13 GMT)
DiagramNet: An End-to-End Recognition Framework and Dataset for Non-Standard System-Level Diagrams [12.4] システムレベル図のための最初のマルチモーダルデータセットであるDiagramNetを紹介する。
本稿では、複雑な視覚的推論を知覚、推論、知識の各段階に分解するプログレッシブトレーニングパイプラインを提案する。
DiagramNetベンチマークでは、提案したワークフローに3B-パラメータモデルを組み込むことで、2025 EDA Elite Challengeの勝者を超え、GPT-5、Claude-Sonnet-4、Gemini-2.5-Proをエンドツーエンド評価で2倍以上上回っている。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:21:30 GMT)
HoReN: Normalized Hopfield Retrieval for Large-Scale Sequential Model Editing [12.3] 大規模言語モデルは、展開後に必然的に時代遅れになる膨大な事実知識を符号化する。
1行の作業は、ロケーション・then-edit手順を通じてベースウェイトを直接変更することで、新しい事実をインストールする。
補完ラインはベースウェイトをそのまま残し、外部メモリを通して編集をルーティングするが、ルーティングの課題に直面している。
提案するHoReNは,3つのアイデアに基づいたルーティング機能を備えたコードブックベースのエディタである。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:51:31 GMT)
RADMI: Latent Information Aggregation as a Proxy for Model Uncertainty [12.3] セグメンテーションネットワークにおけるデコーダ層間の相互情報を測定することにより,予測の不確かさを推定するシングルパス手法を提案する。
RADMIは,すべてのシングルパス方式において,深いアンサンブルの不確実性と高い相関を達成している。
この結果から,正規化情報フローの線形集約は,エンコーダ・デコーダアーキテクチャにおける予測の不確実性に対して,原理的かつ効率的なプロキシを提供する可能性が示唆された。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:49:25 GMT)
New Bounds for Kernel Sums via Fast Spherical Embeddings [12.1] 新たに$tilde O(d+varepsilon2+1/varepsilon3)$を証明した。
証明の中心には、Bartal, Recht and Schulman (2011) によって導入された意味での新しい高速球面埋め込み定理があり、埋め込みデータ直径を制限している。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:42:50 GMT)
Medmarks: A Comprehensive Open-Source LLM Benchmark Suite for Medical Tasks [12.1] Medmarksは、質問応答、情報抽出、医療計算、オープンな臨床推論にまたがる30のベンチマークを備えた、完全なオープンソース評価スイートである。
検証基準とLCM-as-a-Judgeを用いて,71構成の61モデルの体系的評価を行う。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:29:03 GMT)
Using LLMs in Software Design: An Empirical Study of GitHub and A Practitioner Survey [12.0] 本稿では,ソフトウェア設計におけるLarge Language Models (LLM) の利用状況について実験的に考察する。
アーキテクチャ設計,データモデル設計,デザインパターンの利用など,ChatGPTがサポートしているデザインタスクの9つのカテゴリが明らかになった。
この研究は、ソフトウェア設計にLLMを使うことによる7つの重要な利点を、より良い技術選択や設計上の欠陥の早期発見など、開発者が認識するものとして挙げている。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:29:21 GMT)
Certified vs. Empirical Adversarial Robust-ness via Hybrid Convolutions with Attention Stochasticity [12.0] HyCASは、L2証明書による証明可能な堅牢性と強力なL攻撃に対する経験的堅牢性との長期的ギャップを狭める敵防衛である。
アーキテクチャ内でランダムな平滑化を注入すると、形式的な証明付き全体=2-Lipschitzネットワークが得られる。
これらの結果から、ランダム化されたリプシッツ制約アーキテクチャは、認証されたL2と実証的なL逆の堅牢性の両方を同時に改善できることが示された。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:18:43 GMT)
MelShield: Robust Mel-Domain Audio Watermarking for Provenance Attribution of AI Generated Synthesized Speech [12.0] MelShieldは、著作権保護と信頼できる属性のために、識別可能な信号をAI生成オーディオに埋め込む。
MelShieldは生成プロセス中にMel-spectrogramドメインで動作する。
DiffWaveとHiFi-GANの実験では、MelShieldは信頼性の高い透かし抽出を実現し、100%ビット精度に近づいた。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:07:12 GMT)
Tracing the Dynamics of Refusal: Exploiting Latent Refusal Trajectories for Robust Jailbreak Detection [11.9] Refusal Trajectoryは、敵攻撃が終端信号を抑制する場合でも、永続的なアップストリームシグネチャである。
我々は,これらの潜伏パターンを捕捉する推論時間検出器SALO(Sparse Activation Tracing Operator)を提案する。
SALOは強制復号攻撃に対する防御機能を効果的に回復し、終端状態に依存する手法が不十分な場合、検出率を0%から90%に改善する。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:56:37 GMT)
Terrain Perception for Agricultural UAVs in Complex Farmland via Rotating mmWave Radar [11.7] 農業用UAVのための低コスト回転型ミリ波レーダー対応地形認識フレームワークを提案する。
具体的には、空間被覆を拡大し、地形観測性を向上させるために、機械的に回転するセンシング設計を導入する。
我々はさらに、スパース、ノイズ、および部分的に観測可能なレーダーデータに適した、ポーズ一貫性のある地形再建パイプラインを設計する。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:23:20 GMT)
FP-Agent: Fingerprinting AI Browsing Agents [11.7] 7つのAIブラウジングエージェントと人間のユーザを制御した最初の測定結果を示す。
複数のAIブラウジングエージェントが共有する場合,ブラウザの指紋は識別能力に限界があることがわかった。
しかし、行動指紋は、タイプ、スクロール、マウスの振る舞いの違いによって、人間とマウスの異なるAIブラウジングエージェントである。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:58:08 GMT)
The grip of grammar on meaning uncertainty: cross-linguistic evidence, neural correlates, and clinical relevance [11.6] 孤立した単語の意味は本質的に不確かである。
この不確実性は、それらが結合され、コンテキストに固定されたときに減少する。
脳に反映され、障害によって選択的に破壊される不確実性を意味する文法圧縮を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 17:03:27 GMT)
Beyond Perceptual Shortcuts: Causal-Inspired Debiasing Optimization for Generalizable Video Reasoning in Lightweight MLLMs [11.6] 本稿では,2段階のデバイアス化プロセスを通じて,軽量モデルにおけるロバスト推論を育むフレームワークを提案する。
VideoThinker-R1は、ビデオ推論効率の新たな最先端を確立している。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:41:53 GMT)
Truth or Tribe: How In-group Favoritism Prioritize Facts in Persona Agents [11.4] 我々は,ペルソナエージェントがグループ内で強い好意を示し,同一性同族者からの誤った回答を異性同族者よりもはるかに高い速度で受け入れていることを示した。
グループ内での好意は、絶対的な真実が存在しないような推論の文脈で現れ続けている。
グループ内の優遇を緩和する3つの介入戦略が提案されている。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:48:09 GMT)
Congestion-Aware Dynamic Axonal Delay for Spiking Neural Networks [11.1] スパイニューラルネットワーク(SNN)は、時間的および事象駆動の情報モデリングと処理のためのエネルギー効率のパラダイムとして広く見なされている。
本稿では,時間的構造化のためのチャネル単位の静的ベース遅延に遅延を分解する,混雑を考慮した動的軸索遅延機構を提案する。
Spiking Heidelbergデータセットを含む音声ベンチマークの実験では、シナプス信号伝達に混雑を考慮した遅延を導入することで、時間的タスクの精度が効果的に向上することを示した。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:00:54 GMT)
Uncertainty-Aware Trip Purpose Inference from GPS Trajectories via POI Semantic Zones and Pareto Calibration [10.7] 大規模なGPSトラジェクトリーデータは、人間の移動性に関する豊富な観察を提供する。
検出された停留所への旅行目的の割り当ては、個々のレベルの地上真実が欠如しているため困難である。
近辺レベルのPOIセマンティックゾーンと距離重み付き空間的可能性を統合する弱教師付きフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:29:14 GMT)
MILD: Mediator Agent System with Bidirectional Perception and Multi-Layered Alignment for Human-Vehicle Collaboration [10.7] エージェントシステムアーキテクチャに基づくMILD(Mediator-in-the-Loop-Driving)システムを導入する。
MILDは、共同キャビンとアウト・オブ・キャビンの理解のための知覚エージェントと、コンプライアンスと説明可能なアクション提案を生成する軽量な戦略エージェントを統合する。
ECPOは自動検証器を利用して、エージェントを正確であるだけでなく、構造的にも完全であり、証拠によって裏付けられ、制約違反のない行動に向けて操る。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:56:59 GMT)
AttnRouter: Per-Category Attention Routing for Training-Free Image Editing on MMDiT [10.5] QwenImage-Edit-2511, 60ブロックのマルチモーダルトランス (MMDiT) を用いて, 単一注目ストリーム内にノイズやソースイメージトークンを拡散させる訓練自由な画像編集について検討した。
そこで我々は,KVInjectを導入する。KVInjectは,局部化層/ステップバンド内のノイズ半減音にアルファ・半減音鍵/値投影を印加する単一フォワードアテンション操作である。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:00:20 GMT)
AI Alignment Amplifies the Role of Race, Gender, and Disability in Hiring Decisions [10.4] 我々は、言語モデルが雇用決定に人口統計情報を使用するかどうかを分析するための大規模な研究を行っている。
言語モデルでは、女性候補者と黒人候補者が、そうでなければ比較可能な男性候補者と白人候補者を対象とし、障害のある候補者は不利益を与える。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:08:07 GMT)
MindMelody: A Closed-Loop EEG-Driven System for Personalized Music Intervention [10.2] MindMelodyは、EEGによるパーソナライズされた音楽介入のための、完全に機能し、クローズドループのリアルタイムシステムである。
ハイブリッドトランスフォーマー-GNNは、リアルタイム脳波信号を大域的バレンス-覚醒状態と局所的時間的影響軌道にデコードする。
新たなEEGコントローラは、事前訓練された音楽バックボーンに、グローバルな影響プレフィックスと局所的な時間的ガイダンスを注入し、きめ細かい制御可能なオーディオ合成を可能にする。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:15:32 GMT)
Zero-Shot Interpretable Image Steganalysis for Invertible Image Hiding [10.0] 難易度ゼロショット設定下での非可逆な画像隠蔽方式に適した新しい解釈可能な画像ステガナリシスフレームワークを提案する。
具体的には、画像隠蔽、露光、ステガナリシスを統一された枠組みに統合し、ステガナリシス成分にステゴ画像に埋め込まれた秘密情報を復元する能力を付与する。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:55:14 GMT)
Recall to Predict: Grounding Motion Forecasting in Interpretable Motion Bank [9.9] 総合的な「モーションバンク」における予測を基盤としたエンドツーエンドの差別化可能なフレームワークを提案する。
空白のスレートから経路を回帰するのではなく、新しいアンカー検索層を用いて動的に明示的な動きを復元する。
提案手法では,Argoverse 2 および Open Motion データセット上での競合するマルチモーダル精度を実現しつつ,標準潜時クエリの "ブラックボックス" を排除している。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:31:26 GMT)
Colinearity Decay: Training Quantization-Friendly ViTs with Outlier Decay [9.8] Colinearity-Decay (CD) はTransformerブロック内の順序行列対の構造正規化器である。
CDは有害なクロスマトリックスアライメントを罰し、アーキテクチャやタスクロスを変更することなく極端なアクティベーションを緩和する。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:49:51 GMT)
Importance-Guided Basis Selection for Low-Rank Decomposition of Large Language Models [9.7] 本稿では,BSI(Basis Selection with Importance)について紹介する。
我々は,Hutchinsonランダム化探索法を適用し,対称なパラメータ摂動による曲率の減少に適応して,効率的なヘシアン対角推定器を開発した。
本稿では, ベースプルーニングによる損失増加境界, ヘッセン対角線推定誤差のこれらの境界への明示的伝播, ヘッセンスペクトルに関連付けられた分散特性, 目標推定精度を達成するための高確率サンプル-複雑度保証, 摂動強度のガイダンスなど, 包括的な理論的解析を行う。
論文参考訳(メタデータ) (Sat, 02 May 2026 22:35:02 GMT)
Focus and Dilution: The Multi-stage Learning Process of Attention [9.2] 一つの焦点希釈サイクルを異なる段階の連続に分解できることを示す。
合成マルコフデータとWikiTextとTinyStoriesの実験は、予測段階と循環力学を相関させる。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:30:52 GMT)
Prosa: Rubric-Based Evaluation of LLMs on Real User Chats in Brazilian Portuguese [8.7] Prosaはブラジル初のマルチターンポルトガル語チャットベンチマークである。
3人の審査員は16位のうち1つに同意する一方、総投票では16位のうち7つに同意する。
我々は、将来のモデルを同一条件下で評価できるように、ベンチマークとフィルタリングコードをリリースする。
論文参考訳(メタデータ) (Sat, 02 May 2026 22:44:44 GMT)
VUDA: Breaking CUDA-Vulkan Isolation for Spatial Sharing of Compute and Graphics on the Same GPU [8.6] VUDAは、単一のデバイス上でのAIインターリーブ物理シミュレーション(CUDA)とレンダリング(Vulkan)を具現化するシステムである。
Vulkanは異なる抽象化を公開しているが、その実行パスはドライバとハードウェアレベルで共通のチャネルプリミティブに収束する。
実験によると、VUDAは時間共有ベースラインよりも85%高い。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:54:20 GMT)
Rethinking Explanations: Formalizing Contrast in Description Logics [8.4] そこで我々は,「なぜ公理P(ファクト)が他の公理Q(フォイル)ではなく真なのか」を論理知識ベースで答えることを目的とした,対照的な説明を提案する。
まず、コントラスト質問の形式的基礎を提示し、その後、記述論理の中でコントラスト的な説明を定義する。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:41:49 GMT)
Phishing Detection in Ethereum via Temporal Graph Contrastive Learning [8.2] 既存のフィッシング検出法は主にグラフ学習に依存している。
本稿では,フィッシングアクティビティを検知するオンチェーントランザクションをモニタする,フルダイナミックなセルフ教師システムであるPhishEyeを提案する。
161,658アドレスと416,541トランザクションのデータセットの評価は、PhishEyeが既存のメソッドより優れていることを示している。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:53:53 GMT)
GraphSculptor: Sculpting Pre-training Coreset for Graph Self-supervised Learning [8.1] グラフの自己教師型学習は通常、大規模なラベルなしデータセットに依存します。
コアセット構築の事前学習のためのGraphSculptorを導入する。
10%のコアセットは99.6%のフルデータ性能を実現し、トレーニング前の時間を90%近く短縮する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:54:52 GMT)
Interactive Multi-Turn Retrieval for Health Videos [8.0] ヘルスビデオの対話型マルチターンセマンティック検索を導入し,MHVRC(Multi-Turn Health Video Retrieval Corpus)を構築した。
本稿では,対話型2段階検索フレームワークDATRを提案する。
MHVRCの実験では、強いテキストビデオ検索ベースラインよりも一貫した利得を示している。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:12:07 GMT)
Probing Quantum Entanglement in $τ^+τ^-$ Pairs via the $ππ$ Channel at STCF [7.9] $+-$対における量子絡み合いとベル不等式違反は、高エネルギー相互作用における量子相関の感度の高いプローブを提供する。
スーパータウチャーム施設は、$$$レプトン対における量子相関の精密な研究のための競争的なプラットフォームを提供することができる。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:10:09 GMT)
From Stealthy Data Fabrication to Unsafe Driving: Realistic Scenario Attacks on Collaborative Perception [7.9] 協調的な知覚により、コネクテッドカーや自動運転車は知覚データを共有することで知覚を改善することができる。
以前の研究は、アタッカーが共有データを作成してオブジェクトを偽造または削除できることを示しているが、現実の運転におけるそのような攻撃の実用性はまだ不明である。
本稿では,エンド・ツー・エンドのシステム効果を通じて,安全でない運転行動を引き起こす,ステルスで現実的なデータ生成攻撃を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:21:22 GMT)
Genetic Programming for Self-Adaptive Auto-Scaling of Microservices [7.6] AutoSLOは学習ベースの自己適応型スケーリングフレームワークで、マイクロサービスレプリカを動的に調整してサービスレベルの目的(SLO)を満たす。
この枠組みは,SLO違反の頻度を低く保ちながら,資源使用量を大幅に削減することを示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:56:38 GMT)
High-Speed, Scalable Sensor Readout for Dexterous Robotic Hands via Shift-Register Multiplexing [7.3] 有害なロボットハンドは、様々な自由度にわたって高速なマルチモーダルセンシングを必要とする。
本稿では,シリアルインパラレルアウト(SIPO)シフトレジスタの原理に基づく,スケーラブルなアナログセンサ読み取りアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:14:28 GMT)
AMSnet-q: Unsupervised Circuit Identification and Performance Labeling for AMS Circuits [7.1] AMSnet-qは完全自動化された非教師なしパイプラインであり、ループ中の人間のアノテーションを除去する。
ネットリスト抽出で停止する以前の作業とは異なり、我々のフレームワークは完全な検証ループを自動化する。
AMSnet 1.0データセットから739のスキーマを処理し、4つの回路クラス、105の異なるトポロジ、89,789のラベル付きデバイス構成のリポジトリを自動的に構築した。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:02:17 GMT)
Phase-map synthesis from magnitude-only MR images using conditional score-based diffusion models with application in training of accelerated MRI reconstruction models [7.0] ほとんどの臨床MRIアプリケーションでは、生のk空間データが破棄され、マグニチュードのみの画像が保存される唯一のコンポーネントである。
DLベースのMRI再構成の文献の大部分は、小さなトレーニングデータセットに依存するか、利用可能な数少ないオープンソースkスペースデータセットの1つを使用している。
本稿では,条件付きスコアベース拡散モデルに基づく生成的アプローチを用いてこの問題に対処する。
論文参考訳(メタデータ) (Sat, 02 May 2026 01:25:43 GMT)
ESARBench: A Benchmark for Agentic UAV Embodied Search and Rescue [7.0] 無人航空機(UAV)は、空間推論、意味理解、複雑な意思決定において例外的な能力を持つ。
既存のUAV検索・救助研究は、従来のビジョンと経路計画手法が支配している。
本研究では,航空エージェントが複雑な環境を自律的に探索するために必要な新しいタスクである textbfEmbodied Search and Rescue (ESAR) を提案する。
MLLM駆動型UAVエージェントを高現実的なSARシナリオで評価するために設計された,最初の総合ベンチマークである textbfESARBench を提示する。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:30:42 GMT)
OralMLLM-Bench: Evaluating Cognitive Capabilities of Multimodal Large Language Models in Dental Practice [6.8] マルチモーダル大言語モデル (MLLM) は, 歯科画像解析において有望なパラダイムとして出現している。
歯科用X線写真解析におけるMLLMの認知能力を評価するためのベンチマークを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:08:33 GMT)
The Garden of Forking Paths: Narrative Arc-Conditioned Gameplay Planning [6.6] 本稿では,ユーザが提供するストーリーラインから分岐ゲームを生成するナラティブアーク条件ゲームプレイプランニングフレームワークを提案する。
提案手法は,まず独立したノードのプールを生成し,次にアーク誘導制約アルゴリズムを用いてダンジョングラフに組み立てる。
フレームワークをインスタンス化するエンド・ツー・エンドの対話システムを開発した。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:56:06 GMT)
Research on Vision-Language Question Answering Models for Industrial Robots [6.5] 産業ロボットにおける視覚言語質問応答(VLQA)の階層的相互モーダル融合モデルを提案する。
このフレームワークは、高度なオブジェクト検出、マルチスケールのビジュアルエンコーディング、構文解析、タスク認識セマンティックアテンションを統合し、視覚と言語信号を統合推論空間に統合する。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:11:48 GMT)
EduGage: Methods and Dataset for Sensor-Based Momentary Assessment of Engagement in Self-Guided Video Learning [6.4] 本研究では,学習者のエンゲージメントを特徴付けるためのマルチモーダルモデリングの有効性と有効性について,エンゲージメント推定システムを開発し評価する。
本研究の結果から,細粒度エンゲージメント推定は本質的にノイズが多いことが示唆され,実用システムはマルチモーダル・インスツルメンテーションよりも行動信号と生理信号の軽量な組み合わせを優先すべきである。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:29:16 GMT)
ABox Abduction for Inconsistent Knowledge Bases under Repair Semantics [6.1] ABoxの誘拐問題は、知識ベース(KB)の拡張の可能性を求めるものである。
この問題には、診断から説明可能性、修復に至るまで、多くの応用がある。
本設定では, 退行の適切な概念を定義し, 退行を「有効」な仮説に導く基準を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:25:08 GMT)
PRIME: Protein Representation via Physics-Informed Multiscale Equivariant Hierarchies [6.1] PRIME(Protein Representation via Physics-Informed Multiscale Equivariant Hierarchies)は、タンパク質を表面、原子、残基、二次構造、タンパク質の5つの構造グラフからなるネストされたファミリーとしてモデル化する統一的なフレームワークである。
標準的なタンパク質表現学習ベンチマークの実験は、様々なタスクにまたがって強力で競争力のある性能を示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 22:31:50 GMT)
NEURON: A Neuro-symbolic System for Grounded Clinical Explainability [5.9] NEURONは、予測信頼性と臨床解釈可能性の両方を高めるように設計された神経シンボルシステムである。
我々の結果は、NEURONが信頼できる人間中心のコネクテッドヘルスアプリケーションをデプロイするための堅牢でスケーラブルなエンジニアリングソリューションを提供していることを実証している。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:00:02 GMT)
Barriers to Counterfactual Credit Attribution for Autoregressive Models [5.9] ジェネレーティブAIは、それまでの仕事にクレジットを与えるプラクティスを破壊します。
CCA(Counterfactual Credit Attribution)は、この目標を定式化した技術的条件である。
デプロイ時のデータセットに信用を与える自動回帰モデルを検討する。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:53:18 GMT)
Spectral Minimax Direct Fidelity Estimation for Generic Target States [5.7] 同一の非適応単一コピー計測モデルの下で、任意のターゲット状態に対する正確なスペクトル置換を提案する。
我々は, 線形推定器を単一演算子同定により特徴付け, 固定された再構成係数に対する状態の最適サンプリング法を定式化し, 正確なミニマックス問題を半定値プログラムに変換する。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:21:41 GMT)
Online Estimation of Partial Transpose Moments via Fast Classical Updates [5.7] 部分転移(PT)モーメントは、局所パウリ古典影からアクセス可能な最も実用的な非線形量の一つである。
Marso emphet al. のオンラインフレームワークは、正確なPTモーメント統計を固定メモリ再帰に書き換えた。
また,同じメモリを保ちながら,同じ推定器を1ショット当たりのサブキューブ時間で正確に更新可能であることを示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:13:46 GMT)
Zero-Shot Signal Temporal Logic Planning with Disjunctive Branch Selection in Dynamic Semantic Maps [5.4] Signal Temporal Logic (STL) は検証可能なタスク仕様を提供し、安全クリティカルな制御に不可欠である。
可変マップ環境に対するゼロショットSTL計画法を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 03:32:23 GMT)
Model-Based Proactive Cost Generation for Learning Safe Policies Offline with Limited Violation Data [5.3] 高リスクシナリオでは、リスクの高い試行錯誤は実現不可能であり、安全でないサンプルがほとんど、あるいは全くないデータセットを生成する。
ProCOはモデルに基づくオフラインで安全な強化学習フレームワークで、データセットにほとんど違反のないものに特化している。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:59:24 GMT)
MAP-Law: Coverage-Driven Retrieval Control for Multi-Turn Legal Consultation [5.2] 法律相談は、エージェントが関連する法的問題を特定し、権威的な支援を回収し、レコメンデーションに十分な証拠がいつあるかを決定することを要求する、高い視点の業務である。
マルチターン法定コンサルテーションにおける検索制御のためのカバレッジ駆動型フレームワークMAP-Lawを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:21:05 GMT)
Toward the Goldilocks blind compression of quantum states [5.1] 量子状態のブラインド単一コピー圧縮を$k$-qubitのボトルネックを用いて検討する。
純粋な$n$-qubit状態のすべての分布に対して、正確に$k$ encoder ancillasと$n$ decoder ancillasのQAEが存在することを証明している。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:29:48 GMT)
SIFT-VTON: Geometric Correspondence Supervision on Cross-Attention for Virtual Try-On [4.7] 拡散に基づく仮想試行法は、衣服の特徴を対象の身体領域に伝達するクロスアテンション機構を通じて合成する。
SIFTキーポイントマッチングを用いたSIFT-VTONを提案する。
本手法は, SIFTキーポイントマッチングにドメイン固有フィルタリングを適用し, それらの対応関係を空間的確率分布に変換する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:13:50 GMT)
Rethinking Multi-Label Node Classification: Do Tuned Classic GNNs Suffice? [4.7] マルチラベルノード分類(MLNC)は、最近ますます複雑なラベル認識設計によって対処されている。
我々は,MLNCを強固なベースラインの観点から再検討し,古典的なフルグラフGNNがすでに強力なソリューションとして機能しているかどうかを精査する。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:00:26 GMT)
FID Magnetometer Based on Paraffin-Coated Planar Reflective Multipass Cells [4.6] 内部容量は12×12×8mathrmmm3$で、20光パスをサポートし、総送信量は65%以上である。
単セル自由誘導型磁気センサは、地磁気場の範囲で10thrmpT/sqrtmathrmHz$に達する。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:19:56 GMT)
Model Merging: Foundations and Algorithms [4.5] この論文はモデルマージを研究し、独立に訓練されたニューラルネットワークを直接重み空間で組み合わせる。
C$2$M$3$は、Frank-Wolfe最適化に基づくサイクル一貫性のマージアルゴリズムである。
マルチタスク設定では、まずタスクベクトルを近似勾配として理論的に記述する。
次に,TSV幾何を用いた入力適応型ルーティング手法であるMASSを提案し,推定時にタスク関連部分空間を選択する。
論文参考訳(メタデータ) (Sat, 02 May 2026 19:06:35 GMT)
Right-Sizing Communication and Recommendation Set Size in AI-Assisted Search [4.5] ユーザとAIによるレコメンデーションシステムとのインタラクションをモデル化する。
ユーザは、高価でノイズの多いメッセージを介して好み情報を伝達することにより、プロセスを開始する。
ベイジアンエージェントとして機能するAIアシスタントは、ユーザのメッセージを解釈して、真の好みに関する後続の信念を形成し、製品レコメンデーションを作成する。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:23:09 GMT)
Local Hessian Spectral Filtering for Robust Intrinsic Dimension Estimation [4.5] 局所 Hessian Spectral Dimension (LHSD) を提案する。
LHSDはHessianの構成を完全に回避し、$D$で線形スケーラビリティを実現する。
合成および実データによる実験により、LHSDの優れた堅牢性と大規模拡散モデルにおける記憶の検出における有用性が確認された。
論文参考訳(メタデータ) (Sat, 02 May 2026 03:30:55 GMT)
Sparse Representation Learning for Vessels [4.3] VAEsselSparseは効率の良いエンコーダデコーダモデルであり、サブミリ波分解能で臓器レベルの血管網全体の意味のある表現を得る。
VAEsselSparseはスパース・コンボリューションとアテンション・メカニズムを通じて3次元血管構造の性質を生かし、8×8×8の空間圧縮速度を実現している。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:10:45 GMT)
Barren Plateaus as Destructive Interference: A Diagnostic Framework and Implications for Structured Ansatzes [4.1] Barren Plateaus (BPs) は通常、勾配分散の指数的抑制によって記述される。
本研究では, この現象を, 長期的勾配寄与の破壊的干渉と解釈できることを示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:28:21 GMT)
Evaluating LLMs on Large-Scale Graph Property Estimation via Random Walks [4.1] 実世界のデータでは、グラフのサイズは著しく大きくなり、多くの場合、完全にアクセスできない。
大規模グラフベンチマークデータセットであるEstGraphを提案し,大規模グラフ特性を推定するための4つの異なるタスクを提案する。
我々は,これらのタスクにおけるLLMの推論能力について,多種多様なグラフデータセットを用いて評価する。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:11:52 GMT)
Mean Testing under Truncation beyond Gaussian [4.0] トランケーションは次数$O(_P,pvarepsilon1-1/p)$のバイアスを誘導する。
向きの正則性仮定の下では、トランケーションバイアスは線形順序$O(varepsilon)$に改善されることを示す。
本研究は,有限モーメント,準ガウス,中央規則構造系を連結し,トランケーション下での平均試験を行うための統一的な枠組みを提供する。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:13:50 GMT)
AI Expert Twin: Capturing Expert Cognition for Human-Centred, Practice-Based Learning [3.9] 本稿では、専門家の知識をモデル化する認知中心のフレームワークであるAI Expert Twinを紹介する。
我々は、専門家の認知を3層表現として定式化し、このモデルの下で専門家の知識を捉える。
このフレームワークは、職業教育やクリエイティブ産業などの分野にまたがって移行できるように設計されている。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:47:39 GMT)
CADFit: Precise Mesh-to-CAD Program Generation with Hybrid Optimization [3.9] 本稿では,ハイブリッド最適化に基づくCAD再構成フレームワークであるCADFitを紹介する。
本手法は,構造CADプログラムに対するIoU駆動の最適化として再構成を定式化することによって特徴付けられる。
複数のCADベンチマークの実験により、CADFitは最先端のメッシュ・トゥ・CAD法より優れていることが示された。
論文参考訳(メタデータ) (Sat, 02 May 2026 00:19:52 GMT)
Auditing demographic bias in AI-based emergency police dispatch: a cross-lingual evaluation of eleven large language models [3.9] 本稿では,警察プライオリティ・ディスパッチ・システムを運用するための言語間監査フレームワークを提案する。
事故の重大さがあいまいな場合に、人口統計バイアスが体系的に現れることがわかりました。
ジェンダーバイアスは中国語では顕著に増幅されるが、人種バイアスは英語ではより顕著である。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:00:57 GMT)
Artificial Jagged Intelligence as Uneven Optimization Energy Allocation Capability Concentration, Redistribution, and Optimization Governance [3.7] 人工ジャグインテリジェンス(Artificial Jagged Intelligence, AJI)は、大規模学習システムにおいて、他の領域では弱さや脆さを保ちながら、強力な局所的な能力を示す繰り返しパターンである。
本稿では,最適化圧力の不均一なアロケーションとして,AJIの形式理論を開発する。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:37:28 GMT)
AI Safety as Control of Irreversibility: A Systems Framework for Decision-Energy and Sovereignty Boundaries [3.7] 最近のAIシステムは、能力の成長と能力展開の間の距離を圧縮している。
本稿では,展開摩擦の減少が根本問題に変化をもたらすことを論じる。
安全とは、局所的な出力の正しさや嗜好の整合性だけでなく、決定密度の上昇による不可逆性の制御である。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:26:22 GMT)
Automated Interpretability and Feature Discovery in Language Models with Agents [3.7] 本稿では,大規模言語モデルの内部機能の説明と発見の両方を自動化する,機械論的解釈性のための自律型マルチエージェントフレームワークを提案する。
エージェント駆動型経験ループは1ショットラベルよりもシャープで、よりファルサブルな説明が得られることを示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 17:53:30 GMT)
From Awareness to Action: Understanding and Overcoming the Research-Practice Gap in Algorithmic Fairness for Public Health [3.4] アルゴリズムフェアネスは責任あるML主導の公衆衛生研究に不可欠であるが、その実践的実装は限られている。
我々は,専門家インタビュー,オンライン調査,システマティックマッピングを含む連続的な混合手法の研究を行う。
分析の結果、フェアネスは制度的に弱いままであり、翻訳機構は外部駆動であり、システムレベルの優先順位はフェアネスよりも精度を重視し続けている。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:00:21 GMT)
Emergent Kinetic Constraints and Subspace Fragmentation in Rydberg Arrays [3.4] 強く相互作用するリドベルク原子配列において、力学はしばしば分離ヒルベルト部分空間に制約される。
我々は、これらのヒルベルト部分空間の存在は、変形と相互作用の相互作用に依存するだけでなく、それらもまた強く断片化されていることを示す。
以上の結果から,ヒルベルト空間の断片化を体系的に理解し,PXPモデルを超えた工学的非エルゴード多体力学に光を当てた。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:21:29 GMT)
State Representation and Termination for Recursive Reasoning Systems [3.3] 再帰的推論システムは、新しい証拠の取得と蓄積された理解の精査を交互に行う。
本稿では、進化する推論状態の表現方法と、いつ反復を止めるかについて述べる。
我々は,この枠組みをエージェントループ,ツリー・オブ・シント推論,定理証明,連続学習に適用する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:40:09 GMT)
Computational Challenges in Scaling Democratic Deliberation [3.2] 本稿では,デジタル民主主義ソフトウェアが大規模な民主的熟考プロセスを支援するために提供しなければならない機能について概説する。
本論文の目的は、そのような問題の構造化された在庫に向けての第一の根拠を打破し、コンピュータ科学と人工知能の現在の学術研究にそれらへの潜在的アプローチを位置づけることである。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:38:17 GMT)
Position: LLM Serving Needs Mathematical Optimization and Algorithmic Foundations, Not Just Heuristics [3.1] LLM推論はジェネリックよりも優れており、現在では数学的最適化とアルゴリズムの基礎が要求されている。
これらの汎用ポリシーは、LLM推論の特徴的な構造、-動的に増大するKVキャッシュメモリ、プリフィル・デコード位相非対称性、未知の出力長、連続的な制約を無視している。
いくつかのシナリオで成功するが、他のシナリオでは予測不可能に失敗するモデルよりも、さまざまなワークロードで保証可能なパフォーマンス保証を備えたアルゴリズムを開発する必要がある、と我々は主張する。
論文参考訳(メタデータ) (Sat, 02 May 2026 06:31:11 GMT)
Trace: Unmasking AI Attack Agents Through Terminal Behavior Fingerprinting [3.1] 我々は、AI攻撃エージェントの帰属と法医学のための新しいフレームワークであるTraceを紹介する。
Traceが攻撃者エージェントのモデルファミリを特定すると、攻撃者モデルに対する防御的プロンプトインジェクション(DPI)戦略を導出する。
これはシステムプロンプトを攻撃者モデルから抽出することを目的としており、重要な情報を明らかにする。
論文参考訳(メタデータ) (Sat, 02 May 2026 01:27:20 GMT)
6G Needs Agents: Toward Agentic AI-Native Networks for Autonomous Intelligence [3.1] 6Gネットワークは、コミュニケーション、センシング、コンピューティングを統一されたファブリックに統合するAIネイティブインフラストラクチャとして想定されている。
我々は,Large Language Model (LLM) をベースとしたエージェントが有界な政策支配的推論エンティティとして機能するエージェントAI-Native 6Gへのパラダイムシフトを論じる。
本稿では,決定論的ネットワーク基盤,意図と文脈の意味的抽象化,階層的推論,分散マルチエージェント・ファブリックを統合した4層アーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 17:24:12 GMT)
Protein-Conditioned Multi-Objective Reinforcement Learning for Full-Length mRNA Design [2.9] 本稿では,ターゲット配列から直接mRNA転写物を生成する多目的生成フレームワークProMORNAを提案する。
私たちのアプローチは、600万以上の天然タンパク-mRNAペア上で、BARTスタイルのエンコーダ-デコーダモデルをトレーニングすることから始まります。
ケーススタディとして,広範に使用されているホタルルシフェラーゼターゲットのProMORNAを,教師付きトレーニングデータとプロンプトプールの両方から除外して評価した。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:05:51 GMT)
SCALE-LoRA: Auditing Post-Retrieval LoRA Composition with Residual Merging and View Reliability [2.9] 低ランク適応(LoRA)アダプタはパラメータ効率適応の実用的な副産物になりつつある。
オープンプール LoRA 再利用のための監査・構成フレームワークである Sparse-Composition Agreement Layer (SCALE) を導入する。
実験項目では,詳細なスコア,ペア監査,パスコスト記録が報告されている。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:00:05 GMT)
Mesh Based Simulations with Spatial and Temporal awareness [2.9] 本稿では,幾何学的深層学習と厳密な数値解析のギャップを埋める統一的な枠組みを提案する。
1) ノードの全局所トポロジのフィールド値を予測するステンシルレベルの目的であるマルチノード予測,(2) 時間的微分整合性,(3) 時間的交叉による不安定な定性的スキームを予測器・コレクタに置き換える時間的補正,(3) 幾何学的インダクティブ・ビアース,3) 3次元回転位置埋め込み(RoPE)を利用して非構造メッシュの回転対称性を頑健に捉える。
論文参考訳(メタデータ) (Sat, 02 May 2026 17:09:31 GMT)
From Packets to Patterns: Interpreting Encrypted Network Traffic as Longitudinal Behavioral Signals [2.9] 我々は、暗号化されたスマートフォンネットワークトラフィックが、睡眠、ストレス、孤独に関連する行動パターンを受動的にキャプチャできるかどうかをテストする。
ユーザ毎のアダプタを用いたトランスフォーマーバックボーンを用いて,行動構造をモデル化する。
異なる行動パターンに対応する行動特徴を抽出するために,スパースオートエンコーダを適用した。
論文参考訳(メタデータ) (Sat, 02 May 2026 21:40:07 GMT)
CoFlow: Coordinated Few-Step Flow for Offline Multi-Agent Decision Making [2.8] Coordinated few-step Flow (CoFlow)は、Coordinated Velocity Attention (CVA)とAdaptive Coordination Gatingを組み合わせたアーキテクチャである。
3つの独立コーディネートプローブは、利得がエージェント単位のコンパシティではなく、エージェント間コーディネートを通して流れていることを確認する。
CoFlowは、集中型と分散化された実行の両方の下で、1~3ステップで最先端のコーディネーション品質に達する。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:12:04 GMT)
Hydra-DP3: Frequency-Aware Right-Sizing of 3D Diffusion Policies for Visuomotor Control [2.7] 拡散に基づくビジュモータポリシーは、ロボット操作においてよく機能する。
現在の手法は画像生成スタイルのデコーダとマルチステップサンプリングを継承している。
軽量拡散ミキサーデコーダを用いたポケットスケール3次元拡散方式Hydra-DP3(HDP3)を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 19:07:09 GMT)
Adaptive Pluralistic Alignment: A pipeline for dynamic artificial democracy [2.7] 適応多言語アライメント(Adaptive Pluralistic Alignment, APA)は、複数のAIシステムを更新して、進化する値を追跡するモジュールパイプラインである。
APAは、低ランク報酬ベース分解によるコンパクトなパーソナライズされた報酬モデルを学習し、(2)社会的選択理論による投票を通じて、候補者の成果の中から総合的に選択する陪審員として使用し、(3)固定報酬ベースに新しいアノテータ重みを付加して、陪審員を時間とともに効率的に適応させる。
論文参考訳(メタデータ) (Sat, 02 May 2026 23:22:23 GMT)
Agentic AI Systems Should Be Designed as Marginal Token Allocators [2.6] エージェントAIシステムは,電子トークン割り当て経済として設計・評価されるべきである,と我々は主張する。
これら4つの層がいずれも,Emphsame 1次条件を解決していることを示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 03:06:02 GMT)
Unifying Deep Stochastic Processes for Image Enhancement [2.3] 本稿では,最近の手法を連続処理の3つのファミリに分類することで,画像強調の統一的な視点を導入する。
これらのアプローチのすべては、共通微分方程式(SDE)の定式化から生じることを示す。
我々は、同一のアーキテクチャとトレーニングプロトコルを用いて、複数の画像強調タスクに対して、制御された実証的研究を行う。
論文参考訳(メタデータ) (Sat, 02 May 2026 18:40:03 GMT)
CHASE: Competing Hypotheses for Ambiguity-Aware Selective Prediction [2.2] CHASEは、構造化された時間的説明を明示的に比較し、決定にコミットするか、棄権するかを決定する選択的な予測フレームワークである。
真の曖昧さは、競合する仮説間のスコアギャップを崩壊させるため、CHASEはこれらの仮説マージンよりもランク対応セレクタを優先する。
標準的不確実性ベースラインと比較すると、CHASEは全体としての絶対的正確性、三方向の正確性、全体的あいまい性に整合した棄権において顕著な利得を達成している。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:39:48 GMT)
A skin-like conformal sensor for real-time shape mapping [2.1] リアルタイム3次元形状センシングは、動作中の変形可能なシステムの堅牢な制御と解釈に不可欠である。
本稿では,分散ひずみ測定から連続的な3次元変形をリアルタイムで再現する,スケーラブルな皮膚型センサを提案する。
12mmピッチの5-by-5アレイは、全てのテストシナリオで0.1秒の遅延で平均表面再構成誤差0.62mmを達成する。
論文参考訳(メタデータ) (Sat, 02 May 2026 00:19:19 GMT)
SRGAN-CKAN: Expressive Super-Resolution with Nonlinear Functional Operators under Minimal Resources [2.0] SISR(Single-Image Super-Resolution)は、低分解能(LR)観測から高分解能(HR)画像を再構成することを目的としている。
近年の進歩は、トランスフォーマーベースのアーキテクチャと拡散モデルによって推進されている。
本稿では,コンボリュータル・コルモゴロフ・アルノルドネットワーク(CKAN)を逆学習環境に統合したハイブリッド超解像フレームワークSRGAN-CKANを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:19:19 GMT)
S^3-R1: Learning to Retrieve and Answer Step-by-Step with Synthetic Data [2.0] S3-R1 (Synthetic data and stabilized Search R1) は、より高密度な学習信号とデータ中心のアプローチを結合するフレームワークである。
まず、既存の文書から多様なマルチホップ質問を導き出す合成生成とパイプラインを開発する。
次に、この拡張トレーニングセットを、中間探索品質と正解度の両方を評価する報奨構造と組み合わせる。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:01:05 GMT)
A Cellular Doctrine of Morality: Intrinsic Active Precision and the Mind-Reality Overload Dilemma [1.8] 現在のAIシステムは、単純化された神経科学に基礎を置いており、真実と虚偽の区別を損なうリスクがある。
真正な精度のメカニズムを使わずに情報への注意を増幅して報酬を最大化し、それが有効かどうかを判断する。
これにより、真、偽、無関係のいずれにせよ、システムは情報量と本質的なバイアスの両方を増大させる。
この脅威は、ピラミッドニューロンの生物物理学的ダイナミクスに基づいて構築されたより高度なAIツールへのアクセスを一般市民に提供することで緩和されるかもしれない、と私は主張する。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:55:40 GMT)
Minimum Specification Perturbation: Robustness as Distance-to-Falsification in Causal Inference [1.8] 最小限の変更数であるMSP(Minimum Specification Perturbation)を導入する。
MSPは分散に基づく要約では報告できない距離とファルシフィケーションの情報をキャプチャする。
Fragility Index と MSP は,加法構造下での難治性症例とNP-hardness 全般を指標として,ロバスト性を測定した。
論文参考訳(メタデータ) (Sat, 02 May 2026 19:04:08 GMT)
Stabilizing Private LASSO under Heterogeneous Covariates via Anisotropic Objective Perturbation [1.7] 推定過程における等方性回復のためのグラムに基づく異方性客観摂動を提案する。
本結果は,データ依存前処理に頼ることなく,安定かつ効率的なプライベート推定器を設計するための理論的知見を提供する。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:29:04 GMT)
Multimodal Confidence Modeling in Audio-Visual Quality Assessment [1.7] 本稿では,マルチモーダルな信頼性を考慮したAVQAフレームワークであるMCM-AVQAを提案する。
モーダル比の信頼度を推定し、モーダル間注目のために専用のオーディオ・ビジュアル・ミキサーに注入する。
実験の結果,MCM-AVQA,特に信頼性誘導型オーディオ・ビジュアル・ミキサーは,人の平均世論スコアとの相関性を向上させることがわかった。
論文参考訳(メタデータ) (Sat, 02 May 2026 03:21:05 GMT)
Toward a foundational thermal model for residential buildings [1.6] 本稿では、ドメイン知識をデコーダのみのフレームワークに組み込む物理インフォームドトランスフォーマーアーキテクチャを提案する。
我々は,3つの気候帯にまたがる247棟の住宅ビルを対象としたCityLearnデータセットのモデルについて検討した。
本研究は, 普遍的な熱モデル構築の基盤として, 物理インフォームドアーキテクチャーの原理を確立した。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:19:24 GMT)
Privileged Foresight Distillation: Zero-Cost Future Correction for World Action Models [1.6] 共同訓練は, 将来の観察が行動認知に課す行動条件付き補正を誘導することを示す。
本稿では,emphPrivileged Foresight Distillation (PFD)について紹介する。
論文参考訳(メタデータ) (Sat, 02 May 2026 20:40:07 GMT)
FT-RAG: A Fine-grained Retrieval-Augmented Generation Framework for Complex Table Reasoning [1.6] FT-RAGは,表を意味単位に分解することで,知識関連性を生かした,きめ細かいフレームワークである。
FT-RAGは、すべての指標で最高パフォーマンスのベースラインを上回っている。
本手法は,複合モダリティ文書に対する複雑な推論のための新しい最先端性能を確立する。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:32:26 GMT)
TAIL-Safe: Task-Agnostic Safety Monitoring for Imitation Learning Policies [1.5] 我々は、訓練されたILポリシーを識別するための原則化されたアプローチであるTAIL-Safeを、学習タスクの完了を実証的に成功させる安全なセットとして提示する。
フランカ・エミカロボットを用いた実験では、TAIL-Safeでガイドされた場合、実行時の摂動で失敗するフローマッチングポリシーが一貫したタスク成功を達成することを示した。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:16:53 GMT)
Good in Bad (GiB): Sifting Through End-user Demonstrations for Learning a Better Policy [1.5] GiB(Good-in-Bad)は,デモ中の不正なサブタスクを自動的に識別し,破棄するアルゴリズムである。
フィルタリングされたデータは、どんなポリシー学習アルゴリズムでも利用でき、より堅牢なポリシーを訓練できる。
我々は,Frankaロボット上のGiBをシミュレーションおよび実世界のマルチステップタスクの両方で検証する。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:53:32 GMT)
An Efficient Metric for Data Quality Measurement in Imitation Learning [1.5] デプロイ環境で収集されたエンドユーザによるデモを伴う、微調整済みのポリシは、この問題に対処するための有望な戦略である。
実証データをキュレートするための既存の自動化アプローチは、環境におけるポリシーのロールアウトを必要とする。
実演軌跡のパワースペクトル密度(PSD)に基づいて,高速で効率的で完全自動的な実演ランキング尺度を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 17:16:50 GMT)
A Principled Approach for Creating High-fidelity Synthetic Demonstrations for Imitation Learning [1.5] 3D Gaussian Splatting (3DGS)は、単一の専門家軌道と短いマルチビュースキャンから視覚的にリアルなデモ生成を可能にした。
既存の3DGSベースの合成パイプラインは通常、サンプリングベースのプランナーや軌道最適化を使って新しい動きを生成する。
本稿では,専門家の動作構造を明示的に保ちながら,多様なタスクのデモンストレーションを合成するフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:09:07 GMT)
To Do or Not to Do: Ensuring the Safety of Visuomotor Policies Learned from Demonstrations [1.4] タスク成功は歴史的に、模倣学習(IL)研究における政策パフォーマンスの主要な尺度である。
安全が保証されていなければ、ポリシーをロールアウトせず、パフォーマンスが劣る分野において、IL駆動ロボットが望ましい場合が多い。
本稿では,ビジュモータILポリシーのタスク成功を最大化するための,ポリシーに依存しない安全対策である実行保証を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:39:01 GMT)
ShieldShare: Building a VPN-backed Android Hotspot for Secure Internet Sharing with Per-User Traffic Accounting [1.3] ShieldShareはプロキシベースのAndroidアプリケーションで、VPNベースのセキュアなホットスポット共有とユーザ毎のトラフィックアカウントを可能にする。
これにより、検閲された、あるいは高い監視環境において、安価で、コミュニティが管理する安全なアクセスが可能になる。
論文参考訳(メタデータ) (Sat, 02 May 2026 18:40:37 GMT)
Investigating the Effects of Different Levels of User Control in an Interactive Educational Recommender System [1.3] 本研究では,ERSにおけるユーザコントロールのレベルが,コントロール,透明性,信頼,満足感,品質などの推奨目標に対するユーザの認識にどのように影響するかを検討する。
以上の結果から,ERSの肯定的な認識を促進するには,ユーザによるプロファイルの構築と洗練が十分であることが示唆された。
この結果は、利用者のコントロールが透明性、信頼、満足感、知覚品質を肯定的に形作るという実証的な証拠を提供するが、その程度は様々である。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:43:47 GMT)
Robust Fundamental Matrix Estimation from Single Image Motion Blur [1.3] 一つの動きのぼやけた画像から基本行列を抽出する。
カメラ露出ウィンドウ内の2つのタイムインスタンス間の対応性を確立することの実現可能性を示す。
提案手法は,1フレームから3次元カメラの動きを符号化する基本行列を推定できることを示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 17:40:38 GMT)
FLRSP: Privacy-Preserving Federated Learning Using Randomly Selected Model Parameters [1.3] 高品質なディープニューラルネットワーク(DNN)モデルは、一般的に大量のトレーニングデータを必要とする。
モデルトレーニングは、機密情報や個人情報を扱う際のプライバシー上の懸念を高める。
本稿では,ランダムに選択されたモデルパラメータを用いてグローバルモデルを更新する,プライバシ保護型フェデレーション学習手法を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:43:42 GMT)
What Does a Meow Mean? In Search of Intuitively Understandable Communication by a Nonverbal Companion Robot [1.0] 一人暮らしの高齢者には多くの課題があり、ロボットはリマインダーの提供、活動の開始、快適さの提供によって、その一部に役立つ。
我々は、聴覚(キャットサウンド)と視覚(小さなディスプレイ上のカノン)の2つの非言語通信信号を設計した。
高齢者の焦点グループでは、初期信号セットの改訂を提案した。
大規模なオンライン実験では、65歳以上の大人がロボットのコミュニケーション意図を正確に推測できるかどうかを検証した。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:16:03 GMT)
Creating and Evaluating Figurative Language Dataset for Sindhi [1.0] そこで我々は,SiNFluDを提案する。SiNFluD,SiNFluD,SiNFluD,SiNFluD,SiNFluD,SiNFluD。
2つのネイティブアノテータは、Doccanoテキストアノテーションツールを使用してデータをラベル付けし、0.81のアノテータ間契約を達成している。
また,mBERT,XLM-RoBERTa,XLM-RoBERTa-XLモデル,およびSetFitを用いて文変換器の微調整を行った。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:41:25 GMT)
Evidence-Based Landing Site Selection and Vison-Based Landing for UAVs in Unstructured Environments [0.9] 本稿では,無人無人無人着陸のためのエビデンスに基づく確率的枠組みを提案する。
視覚サーボによる実行から不確実性の下での意思決定を明示的に分離する。
NvidiaのIsaac Simによる実世界の実験と高忠実度シミュレーションの両方を通じて検証されている。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:05:20 GMT)
Chebyshev-Augmented One-Shot Transfer Learning for PINNs on Nonlinear Differential Equations [0.8] 物理情報ニューラルネットワーク(PINN)は、ネットワークに規則を規定することによって微分方程式を解くための柔軟なパラダイムを提供する。
標準のPINNは、通常、新しい強制項、潜時/初期条件、または非線形問題閉形式適応に対して再訓練を必要とする。
本稿では,OTLとチェビシェフサロゲートを組み合わせたワンショットPINN転送が可能な非線形性のクラスについて述べる。
論文参考訳(メタデータ) (Sat, 02 May 2026 22:49:37 GMT)
Rhamba: Region-Aware Hybrid Attention-Mamba Framework for Self-Supervised Learning in Resting-State fMRI [0.7] Rhambaは、ガイドマスクとハイブリッドアテンション・マンバアーキテクチャを統合してfMRI分析を行う、地域対応事前トレーニングフレームワークである。
モデルはABIDEデータセット上で、領域整合パッチ埋め込みと3つのマスキング戦略を用いて事前訓練された。
マスキングの戦略は再建行動に強く影響を与え、一貫した順序で再建の損失を被った。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:44:49 GMT)
A Quantum Approach to Stochastic Optimization in Insurance Underwriting [0.7] 本稿では,確率制約付きknapsack問題と呼ばれる最適化問題のクラスを解くための新しい量子古典ハイブリッドスキームを提案する。
本手法では,クナップサック固有のQAOA回路を用いてサンプルを生成する。
論文参考訳(メタデータ) (Sat, 02 May 2026 00:17:14 GMT)
Fine-Tuning Pre-Trained Code Models for AI-Generated Code Detection [0.6] サブタスクごとに異なる戦略で、トレーニング済みの4つのモデルを微調整します。
Subtask-A では,言語間相互検証,コード拡張,トリミング平均アグリゲーションによるチャンク付き推論,しきい値のキャリブレーションを併用する。
Subtask-Bでは、サンドイッチトークンパッキング、クラスバランス損失、テスト時間拡張によるマルチシードアンサンブルを使用する。
論文参考訳(メタデータ) (Sat, 02 May 2026 20:09:17 GMT)
From Characterization To Construction: Generative Quantum Circuit Synthesis from Gate Set Tomography Data [0.6] 本稿ではゲートセットトモグラフィーデータから生成量子回路を合成するための量子機械学習制御フレームワークを提案する。
生成概念空間はGSTデータから直接学習され、所望の出力分布上の量子回路の条件合成を可能にする。
このエンドツーエンドフレームワークは、生のGSTデータから直接、コンテキスト対応のハードウェアネイティブな回路合成に向けたステップである。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:25:10 GMT)
Dynamics Aware Quadrupedal Locomotion via Intrinsic Dynamics Head [0.6] 本研究では,制御政策が物理力学の理解と推論を可能にする四足歩行訓練フレームワークを提案する。
シミュレーションでは,制御ポリシとともに状態とトルクのダイナミクスを学習する内在的ダイナミクス(ID)ヘッドを同時に訓練する。
この機構は, より効率的でスムーズなポリシーを導出し, 四足歩行報酬を多岐にわたる標準的四足歩行報酬にまたがる収束を促進させることを示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 03:50:54 GMT)
Evaluating quantum circuits in the reservoir computing paradigm [0.5] 貯留層コンピューティング(Reservoir computing)は、時間情報処理に使用されるフレームワークである。
2量子ゲートで構築したブロックウォール回路を用いた貯水池の有効性について検討した。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:25:27 GMT)
Hybrid Quantum Reinforcement Learning with QAOA for Improved Vehicle Routing Optimization [0.5] 本稿では,Quantum Approximate Algorithm Optimization (QAOA) とQuantum Reinforcement Learning (QRL) を併用した新しいハイブリッド手法を提案する。
この拡張により、エージェントは学習ポリシーにおける問題固有の特定の量子相関を利用でき、ルーティングソリューション空間のよりリッチな探索が可能になる。
論文参考訳(メタデータ) (Sat, 02 May 2026 18:55:48 GMT)
Artificial intelligence language technologies in multilingual healthcare: Grand challenges ahead [0.5] AI言語技術(AILT)は、翻訳、書き換え、文書化、解釈、および言語不一致の設定におけるメッセージングのために、多言語医療に組み込まれつつある、と私たちは主張する。
言語、アクセント、タスク、効率の向上は、エラーを隠蔽し、トレーサビリティを低減し、臨床医、翻訳家、健康システムに責任を移す。
研究と展開の次の段階に向けて,7つの大きな課題を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:39:56 GMT)
Neuro-Symbolic Agents for Hallucination-Free Requirements Reuse [0.5] textbfModel-Driven Elicitation プロセスとして,要求再利用を再概念化したニューロシンボリックマルチエージェントシステムを提案する。
決定論的で象徴的なバリデータは、エージェントループ内のすべての構造的制約を強制し、効果的に幻覚的要求の組み合わせを排除します。
本システムは,100%要件カバレッジと制約違反率を0.2%で達成する。
論文参考訳(メタデータ) (Sat, 02 May 2026 18:16:04 GMT)
GA-VisAgent: A Multi-Agent application for code generation and visualization in interactive learning [0.4] 本研究では,Geometric Algebraコード生成と可視化のためのマルチエージェント対話型学習アプリケーションGA-VisAgentを提案する。
自然言語と数式を入力としてサポートし、自動的に実行可能なコードを生成する。
その結果、GA-VisAgentは40の典型的なコンフォーマルGAタスクに対して90%のコード生成成功率を達成し、GPT-4oよりも70%改善した。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:15:31 GMT)
LIE: LiDAR-only HD Map Construction with Intensity Enhancement via Online Knowledge Distillation [0.3] オンラインハイディフィニション(HD)マップ構築は自動運転の重要な要素である。
近年の手法では、コスト効率のよいHDマップセグメンテーションのためのマルチビューカメラ画像に頼っているが、カメラには正確なシーン形状の深度情報がない。
本研究では,知識蒸留(KD)を用いたLIE(LDARのみの意味マップ構築法)を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:52:25 GMT)
The Pre-Training Study of Expanded-SPLADE Models on Web Document Titles [0.1] 本稿では,事前学習データセットと事前学習オプションが,検索微調整のための事前学習モデルに及ぼす影響について検討する。
未刈取と最も厳密な刈取の両方において高い検索効率の微調整されたモデルは、概ね一般コーパスで事前訓練されている。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:07:49 GMT)
AgriKD: Cross-Architecture Knowledge Distillation for Efficient Leaf Disease Classification [0.1] AgriKDは効率的なエッジデプロイメントのためのクロスアーキテクチャ知識蒸留フレームワークである。
ビジョントランスフォーマー(ViT)の教師から、コンパクトな畳み込み学生モデルに知識を移す。
それは無視できる精度で一貫した予測性能を達成する。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:58:57 GMT)
Exploring Prompt Alignment with Clinical Factors in Zero-Shot Segmentation VLMs for NSCLC Tumor Segmentation [0.1] ゼロショット視覚言語モデル (Zero-shot Vision-Language Model, VLMs) は、腫瘍容積のデライン化のためのタスク特化トレーニングに代わる、迅速な代替手段を提供する。
我々は,VoxTell内腫瘍データセットのアライメント方向について検討した。
アライメント分析により、解剖学的位置がVoxTellの空間的注意の主役であることが判明した。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:49:32 GMT)
Write-Domain Separation and Non-Custodial Enforcement: A Structural Impossibility in Account-Based Ledgers, with a Commitment-Based Construction [0.0] 我々は台帳アクセス制御に関する構造的疑問を問う。
当該議定書は、当該財産の将来の処分を、留置することなく、かつ、執行時に所有者の協力を必要とせずに実施することができるか。
我々は,Non-Custodial Enforceed Encumbrance (NCEE) として,セルフカストディ,トランジション制限,無効性,無許可の実施を対象とする4つの仕様を定式化した。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:59:55 GMT)
Why Model Selection Fails in Time Series Forecasting: An Empirical Study of Instability Across Data Regimes [0.0] 時系列予測モデルは、統計学的および構造的特性の異なるデータセット間で不整合性を示すことが多い。
本稿では,データ登録記述子とモデル性能の関係を解析することにより,ルールベースのモデル選択が時系列予測で失敗する理由を考察する。
論文参考訳(メタデータ) (Sat, 02 May 2026 21:19:29 GMT)
Who Decides What Is Harmful? Content Moderation Policy Through A Multi-Agent Personalised Inference Framework [0.0] 本稿では,LLMをベースとしたパーソナライズド推論フレームワークを提案する。
我々のアーキテクチャは、ドメイン固有のエキスパートエージェント、コンテンツ分析とエージェント選択をオーケストレーションするマネージャエージェント、ユーザ視点をシミュレートするゴーストプロファイルエージェントを組み合わせる。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:28:09 GMT)
Weight Pruning Amplifies Bias: A Multi-Method Study of Compressed LLMs for Edge AI [0.0] 活性化認識プルーニング(Wanda)はパープレキシティをほぼ完全に保ち(Mistral-7Bでは50%の間隔でわずか3.5%増加)、最も高いバイアス増幅をもたらす。
ランダムプルーニングは、言語能力を完全に破壊する(複雑度は104ドルを超え、108ドルに達する)が、ランダムチャンスバイアスしか発生しない。
さらに、非構造化プルーニングは、実際のエッジハードウェアにおいて、ストレージをゼロにし、推論遅延をゼロにすることを示した。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:27:40 GMT)
Two-Pass Zero-Shot Temporal-Spatial Grounding of Rare Traffic Events in Surveillance Video [0.0] 実際のCCTV映像における地上交通事故は、ラベル付き事故映像のトレーニングがしばしば禁止される希少な問題である。
我々は、凍結した視覚言語モデルからこのジョイント出力を引き出す、微調整のパイプラインを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:05:44 GMT)
Time-resolved digital quantum simulation of cosmological particle creation in a de Sitter-radiation transition [0.0] 我々は、デシッター放射光FLRW遷移における宇宙粒子生成の時間分解デジタル量子シミュレーションを提案する。
我々は、コンフォメーション・タイムの進化を識別し、短絡回路ブロックのトロッタ化シーケンスとして動的に実装する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:21:10 GMT)
The Case for ESM3 as a General-Purpose AI Model with Systemic Risk Under the EU AI Act [0.0] 我々は、ESM3のような最先端の生物基盤モデルが、EU AI法の下でシステム的リスクを持つ汎用AIモデルに対して、どの程度の義務を負うかを検討する。
この時点で、ESM3は法律によって意味のある規制を受けていないと結論付けている。
論文参考訳(メタデータ) (Sat, 02 May 2026 21:21:55 GMT)
The Buy-or-Build Decision, Revisited: How Agentic AI Changes the Economics of Enterprise Software [0.0] 生成的人工知能の進歩は、企業アプリケーションのためのメイク・アンド・バイの判断の経済性を阻害している。
本稿では,メイク・オー・バイ決定の根底にある要因を再評価するために,概念研究アプローチを採用する。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:18:52 GMT)
The Banach-Butterfly Invariant: Influence-Adaptive Walsh Geometry for Ternary Polynomial Threshold Functions [0.0] Banach-Suttermajority Conditional Factorization (BBT)
BBTは、Walsh-Had0003因子化における影響変種バナッハ幾何学である。
論文参考訳(メタデータ) (Sat, 02 May 2026 22:54:29 GMT)
Structured Parameterization and Non-Stabilizerness in Hypergraph QAOA [0.0] 我々は$k$-interaction-angle 量子近似最適化アルゴリズム(k$A-QAOA)を紹介する。
我々は、より表現力のある多角量子近似アルゴリズム(MA-QAOA)に匹敵する近似比を$k$A-QAOAで達成していることを示す。
その結果、$k$A-QAOAはMA-QAOAに匹敵する近似比を達成できるが、機能評価は著しく少なく、量子リソース消費を低減できることを示した。
論文参考訳(メタデータ) (Sat, 02 May 2026 22:12:18 GMT)
Structural Ranking of the Cognitive Plausibility of Computational Models of Analogy and Metaphors with the Minimal Cognitive Grid [0.0] Minimal Cognitive Grid (MCG) は、人工システムの認知的妥当性を評価するためのフレームワークである。
MCGフレームワークの形式的かつ定量的な運用方法を提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:08:10 GMT)
Structural Generalization on SLOG without Hand-Written Rules [0.0] 本稿では、離散的なボトルネックを持つ神経セルオートマトンに基づく手書き構成規則を必要としない代替案を提案する。
すべての構成規則は、局所的な反復を通してデータから学習される。
CCGLOGベンチマークでは、17の構造一般化カテゴリのうち11のタイプエクサクティヴマッチを100%達成している。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:23:42 GMT)
Strong light-matter interactions in hybrid polaritonic systems [0.0] ポーラリトンは光、電子、化学特性の制御を可能にする光と物質を混合したハイブリッド励起である。
本稿では, フォトニックマイクロキャビティ, プラズモニックナノ構造, オープンキャビティ, メタサイトなど, 偏光子形成を支える主要なアーキテクチャについて調査する。
コヒーレントダイナミクス、ビブロニック相互作用、暗状態貯水池、ポラリトンを媒介とするエネルギーと電子輸送などの重要な現象を論じる。
論文参考訳(メタデータ) (Sat, 02 May 2026 19:09:02 GMT)
Spectral functions on a quantum computer through system-environment interaction [0.0] ARPES実験に係わる環境とシステムの相互作用を直接モデル化することにより、量子コンピュータ上でのスペクトル関数の効率的な測定方法を提案する。
qubit と 2-qubit ゲートのオーバーヘッドが伴うが、我々のアプローチでは以前のアプローチの2倍のサンプリングを$O(N)$で行う必要がある。
本稿では, 量子システムモデル H2 イオントラップシステム上で, スペクトル関数を270ドルの1次元システムで計算し, 54ドルの量子ビットを用いて実演する。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:26:34 GMT)
Sequential Minimal Optimization for $\varepsilon$-SVR with MAPE Loss and Sample-Dependent Box Constraints [0.0] 我々は、$varepsilon$-SVRciteVapnik 1995, Drucker 1997, Smola2004から生じる二次双対問題に対して、MAPE(Mean Absolute Percentage Error)を最小化するために、逐次最小最適化(SMO)アルゴリズムを導出した。
実装はオープンソースの textttpsvr R packageciteBenavidesHerrera2026Rpsvr で利用可能である。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:51:46 GMT)
Sequential Learning and Catastrophic Forgetting in Differentiable Resistor Networks [0.0] キルヒホフの法則に支配される微分可能な抵抗ネットワークにおける逐次学習について検討する。
タスクの衝突や新しいタスクへの適応の度合いによって,忘れることが制御されていることを示す。
これらの結果は、可変物質における連続的な学習を研究するための、コンパクトで物理的に解釈可能なテストベッドとして、微分可能な抵抗ネットワークを位置づけている。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:15:57 GMT)
Sentiment Analysis of Mobile Legends App Reviews Using Machine Learning and LSTM-Based Deep Learning Models [0.0] 本稿では,Mobile Legendsアプリレビューの感情分析のための機械学習とLSTMに基づくディープラーニング手法を比較した。
TF-IDFとPyCaret AutoMLを使って従来のモデルを評価し、シーケンシャルテキスト依存関係をキャプチャするために設計されたLSTMモデルと比較する。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:25:59 GMT)
Rethinking Nonlocality: Locality, Counterfactuals, and the EPR-Bell Argument [0.0] ベルの不等式違反が自然の非局所性を確立するという主張は、批判的に再検討されている。
この分析は、反事実的推論の中心的な役割を強調している。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:12:00 GMT)
Quaternion Nonlinear Transform-Induced Nuclear Norm for Low-Rank Tensor Completion [0.0] そこで本研究では,四元数埋め込みによる非線形変換誘起テンソル核ノルム(QNTTNN)を提案する。
QNTTNNをベースとして,厳密な収束を保証する近似交互最小化アルゴリズムを開発した。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:35:34 GMT)
Quasi-Static Control of Discrete Cosserat Rod [0.0] 我々は,コセラットロッドをモデルとしたソフトロボットのフィードバック制御則を設計する。
PCSアプローチは、コセラットロッドを記述する非線形PDEを非線形ODEのシステムに変換する。
制御法則は、ストレインおよびタスク空間における状態フィードバック線形化に基づいて設計される。
論文参考訳(メタデータ) (Sat, 02 May 2026 11:35:02 GMT)
Quantization Undoes Alignment: Bias Emergence in Compressed LLMs Across Models and Precision Levels [0.0] 大規模言語モデルは、クラウドおよびエッジデプロイメントの推論コストとメモリフットプリントを低減するために、トレーニング後の量子化を通じて定期的に圧縮される。
既存の研究は通常、2つの条件のみを比較し、集約バイアスメトリクスに依存し、単一のモデルファミリを評価する。
12,148 BBQ バイアスベンチマーク項目の5つの精度レベル (BF16 - 3-bit) における3つの命令調整モデルの制御実験を行った。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:41:47 GMT)
Practical Limits of Autonomous Test Repair: A Multi-Agent Case Study with LLM-Driven Discovery and Self-Correction [0.0] 本稿では,実運用型エンタープライズUIテストプロトタイプの匿名実行データを用いて,マルチエージェント自律テストシステムの産業ケーススタディを提案する。
システムは、人間指向のテストからハイオートノミー機能発見とテスト実行へと進化する。
我々の研究結果によると、制限のない自律は不安定でしばしば誤解を招く結果をもたらすが、制約された自律はそのようなシステムを運用上実行可能なものにする。
論文参考訳(メタデータ) (Sat, 02 May 2026 14:39:55 GMT)
Perturb and Correct: Post-Hoc Ensembles using Affine Redundancy [0.0] P&C(Perturb-and-Correct)は,1つの事前学習ネットワークから多様な予測器を構築する手法である。
P&Cは後続のアフィン層に最小二乗補正を施したランダムな隠れ層摂動を適用し、キャリブレーションデータに同意する予測器を発生させる。
実証的には、P&C は MuJoCo の動的予測と CIFAR-10 OOD 検出にまたがる強力な ID/OOD トレードオフを実現している。
論文参考訳(メタデータ) (Sat, 02 May 2026 22:48:11 GMT)
Persistent Homology of Time Series through Complex Networks [0.0] 時系列は、3つのファミリーにまたがる5つの構造のうちの1つを通してグラフにマップされる。
グラフは、Vietoris-Rips濾過が永続図を生成する非相似行列に変換される。
これらの図は、持続的景観と位相的要約統計によって、固定長の特徴にベクトル化される。
論文参考訳(メタデータ) (Sat, 02 May 2026 22:28:42 GMT)
On defining and modeling context-awareness [0.0] 本稿では,文脈認識を定義・モデル化するための方法論を提案する。
また,現代の文脈認識システムと分散計算との関係について検討した。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:18:10 GMT)
Observable measures of multipartite entanglement [0.0] 任意の大きさの系に対する多部交絡に対する可観測境界を構築する。
まず,二部構造と二部構造との密接な絡み合いの両面に,実験的に到達可能な限界を導出する。
すると、それらを任意の状態に対して次数 k までのエンタングルメントと、真の k-部分エンタングルメントに変換する。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:55:27 GMT)
NEGF Modeling of Impact Ionization in Semiconductor Avalanche Photodiodes for Quantum Networking [0.0] 本稿では,非平衡グリーン関数(NEGF)の定式化に基づく原子論的量子輸送シミュレーションフレームワークを提案し,半導体アバランシェデバイスにおける衝撃電離をモデル化する。
この枠組みは、アバランシェのオンセットを過小評価する利用可能な状態と占有状態の解決によって、シリコン単光子アバランシェ検出器と量子ネットワーク受信機で使用されるアバランシェフォトダイオードの予測モデルへの道筋を提供する。
論文参考訳(メタデータ) (Sat, 02 May 2026 04:52:39 GMT)
Multi-Dataset Cross-Domain Knowledge Distillation for Unified Medical Image Segmentation, Classification, and Detection [0.0] セグメント化, 分類, オブジェクト検出タスクのパフォーマンスを向上させるために, クロスドメイン変換学習フレームワークを提案する。
提案手法では,多様な情報源からのドメイン不変表現を共同教師モデルで集約する,教師-学生パラダイムを用いている。
もともと医療画像のセグメンテーションのために開発されたこのフレームワークは、画像レベルの分類とオブジェクトレベルの検出をサポートするように拡張されている。
論文参考訳(メタデータ) (Sat, 02 May 2026 18:23:27 GMT)
Machine Learning Enhanced Laser Spectroscopy for Multi-Species Gas Detection in Complex and Harsh Environments [0.0] この論文は、レーザー吸収分光と機械学習を組み合わせた診断法を開発する。
DDAEは高速炭化水素熱分解における衝撃管測定に応用される。
構造化された非教師付きフレームワークであるHT-SIMNetは、完全な校正データなしで未知種からの干渉を緩和する。
自動エンコーダに基づくブラインドソース分離法UnblindMixは、混合データから直接濃度とスペクトルシグネチャを再構成する。
VOC-セルティファイアは、ランダムな平滑化とVoigtベースのスペクトル摂動を組み合わせることで、揮発性有機化合物の証明可能な分類を提供する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:28:27 GMT)
Linear-Readout Floors and Threshold Recovery in Computation in Superposition [0.0] 重ね合わせにおける計算に対する最近の2つのアプローチは、異なるキャパシティレジームに到達している。
これらの結果は異なるインターフェース不変性を維持するため矛盾しない。
Hnniテンプレート以外のロバストな非線形リセットは開のままである。
論文参考訳(メタデータ) (Sat, 02 May 2026 02:11:31 GMT)
Intelligent Autonomous Orchestration for Distributed Cloud Resources using Complex-Stability Analysis [0.0] C-SAS(Complex-Stability Aware Scaling)は、インテリジェントな自律オーケストレーションフレームワークである。
C-SASは安定性に配慮したエージェントとして機能し、テレメトリノイズを$s$プレーン上の"Safety Envelope"に変換する。
その結果、C-SASはVMのフラッピングを94%削減し、リソース効率は96%低下した。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:57:50 GMT)
Hall-Like Transversal Stress and Sandpile Criticality on Real Production Networks [0.0] 本稿では, ホール・サンパイルモデルによる経済不安定性のモデル化について述べる。
ホールのようなストレス機構と、実際の生産ネットワーク基板上のサンドパイルしきい値のダイナミクスを組み合わせる。
論文参考訳(メタデータ) (Sat, 02 May 2026 18:13:32 GMT)
From Qubit to Qubit: A Graduate Course in Quantum Mechanics [0.0] この教科書は量子力学の2学期大学院のノートから引かれる。
始点は単一の量子ビットであり、最も小さな非自明な空間であり、その力学に最も強い制限がある。
論文参考訳(メタデータ) (Sat, 02 May 2026 19:16:40 GMT)
Forecasting Source Stability in Scientific Experiments using Temporal Learning Models: A Case Study from Tritium Monitoring [0.0] Karlsruhe Tritium Neutrino Experiment (KATRIN) は、絶対ニュートリノ質量を前例のない感度で測定することを目的としている。
従来のドリフト検出法は、ガストリチウム中の不安定な事象の頻度と過渡的な性質に苦慮している。
本研究では,現状の時系列予測モデルと実世界の実験応用とのギャップを,ディープラーニングを利用して不安定後の安定性を予測することによって埋める。
論文参考訳(メタデータ) (Sat, 02 May 2026 09:52:57 GMT)
FeedbackLLM: Metadata driven Multi-Agentic Language Agnostic Test Case Generator with Evolving prompt and Coverage Feedback [0.0] テストケース生成に対する従来のアプローチは、しばしば手作業と計算オーバーヘッドの増大を伴う。
We propose FeedbackLLM, a novel language-agnostic test case generation framework based on tightly coupled two-stage approach。
提案アーキテクチャの性能は,CプログラムとPythonプログラムに関連する標準ベンチマークプログラムで評価される。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:43:29 GMT)
Feedback-Normalized Developer Memory for Reinforcement-Learning Coding Agents: A Safety-Gated MCP Architecture [0.0] 本稿では、RLコーディングエージェントのためのローカルファーストのモデルコンテキストプロトコル(MCP)ネイティブな開発者メモリアーキテクチャであるRL Developer Memoryについて述べる。
メモリ選択をログ化されたコンテキスト決定プロセスとして扱う。
システムは、RLアルゴリズムのバグ、ハードネガ、レビューゲートされたRL/コントロールケース、低リスク障害を含む決定論的200ケースのベンチマークで評価される。
論文参考訳(メタデータ) (Sat, 02 May 2026 18:37:36 GMT)
Evaluating Agentic AI in the Wild: Failure Modes, Drift Patterns, and a Production Evaluation Framework [0.0] 生産エージェントシステムに特有の7つの障害モードの分類法を提案する。
標準メトリクスは、7つの障害モードのうち4つを完全に検出することができない。
オープンソースの参照実装を備えた5次元評価フレームワークPAEFを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 21:02:08 GMT)
Entanglement dynamics after quenches with inhomogeneous Hamiltonians [0.0] 不均一ハミルトニアンが支配する二部系における絡み合いのダイナミクスを$H = H_L + H_R$という形で検討する。
長期の流体力学限界における2つの領域間の絡み合いエントロピーの解析式を導出した。
論文参考訳(メタデータ) (Sat, 02 May 2026 20:07:04 GMT)
Enhancing Game Review Sentiment Classification on Steam Platform with Attention-Based BiLSTM [0.0] 著者らは、TF-IDFとPyCaret AutoMLに基づく従来の機械学習ベースラインと、PyTorchで実装されたディープラーニングアプローチを比較した。
BiLSTM+Attentionモデルは、クラス不均衡に対応するためにクラス重み付きクロスエントロピーを用いて訓練され、テストセット上で83%の精度と85%の重み付きF1スコアを達成する。
本稿は,BiLSTM+AttentionモデルがSteamレビューのユーザ感情の分析に有効であり,開発者がプレイヤーのフィードバックを理解するのに役立つことを結論付けている。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:17:06 GMT)
EFGPP: Exploratory framework for genotype-phenotype prediction [0.0] EFSTPは、遺伝子型からフェノタイプへの予測のために、複数のタイプのデータを生成し、ランク付けし、組み合わせるためのフレームワークである。
733人の英国バイオバンクデータを用いた片頭痛予測にESFTPを適用した。
論文参考訳(メタデータ) (Sat, 02 May 2026 12:42:40 GMT)
ECG-biometrics-bench: A Unified Framework for Reproducible Benchmarking of ECG Biometrics [0.0] 心電図(ECG)バイオメトリックスは、ウェアラブルシステムにおいて、持続的で生きた認証のための有望なモダリティとして登場した。
我々は、広く使用されている7つのパブリックECGデータセットの事前処理、セグメンテーション、評価を標準化する、モジュラーで再現可能なベンチマークフレームワークであるECG-biometrics-benchを紹介する。
論文参考訳(メタデータ) (Sat, 02 May 2026 17:31:16 GMT)
Dynamic Graph with Similarity-Aware Attention Graph Neural Network for Recommender Systems [0.0] 本稿では,動的グラフ類似性を考慮した注意グラフニューラルネットワークフレームワークを提案する。
動的ユーザ類似性グラフ構築と多相性伝播とアテンションベースのアグリゲーションを統合している。
MovieLens100Kベンチマークの実験では、DG-SA-GNNが0.162のRecall@20と0.065のNDCG@20を達成した。
論文参考訳(メタデータ) (Sat, 02 May 2026 16:33:39 GMT)
Distributed Algorithm with Emergent Area Partitioning and Base Station's Situation Awareness for Multi-Robot Patrolling [0.0] 本研究では,新しいマルチロボットパトロール手法であるLR-PTアルゴリズムを提案する。
シミュレーションでは、LR-PTはすべての場所の頻繁なパトロールを確実にすることで、既存の手法よりも優れていた。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:47:09 GMT)
Developing a Strong Pre-Trained Base Model for Plant Leaf Disease Classification [0.0] この論文は、植物葉病を分類するために、DenseNet201アーキテクチャに基づいた新しいベースモデルをトレーニングすることを目的としている。
植物葉病分類の分野のためのオープンデータセットと、それらに基づいてトレーニングできるモデルが同定されている。
論文参考訳(メタデータ) (Sat, 02 May 2026 06:33:38 GMT)
Data-Driven, Geometry-Aware Optimal-Transport Calibration of Flavor Tagger [0.0] フレーバータグ付けのキャリブレーションは、有限の作業点で測定されたスケール因子として、または選択された1次元判別値に対する双有的な補正として、しばしば提供される。
このアプローチは、現代のタグの完全なマルチコンポーネントアウトプットに対して、継続的なイベントレベルのキャリブレーションを提供するには足りません。
本稿では,フレーバー・タガーのキャリブレーションを,確率単純度に基づく最適輸送問題として定式化する幾何学的枠組みを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 10:16:13 GMT)
Continuous Temporal Representations of Event-Based Signals via Interference-Based Wave Modeling [0.0] 干渉に基づく波動表現に基づく連続時間モデリングフレームワークを提案する。
提案された定式化はイベント駆動バイオシグナーに特に適している。
本手法は,バイオメカニカルシステムにおける下流制御タスクのためのsEMGデータからの学習を支援するように設計されている。
論文参考訳(メタデータ) (Sat, 02 May 2026 06:04:55 GMT)
Concepts Whisper While Syntax Shouts: Spectral Anti-Concentration and the Dual Geometry of Transformer Representations [0.0] 5つのアーキテクチャファミリにまたがる残留ストリーム差分ベクトルでは,反集束が観察される。
その結果、コンテクスト化された処理中に意味内容をスペクトル的に静かな領域に回転させることが示唆された。
論文参考訳(メタデータ) (Sat, 02 May 2026 21:20:55 GMT)
Completely Positive and Trace Preserving Schemes with Tensor Train Compression for the Lindblad Equation [0.0] 我々はリンドブラッド方程式に対する低ランク、完全正、およびトレース保存スキームの族を提案する。
これらの操作をTT/MPS形式で効率的に行う方法を示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:31:10 GMT)
Cavity-mediated localization and collective electron correlation phases [0.0] 解析的に解ける球状シェリントン・カークパトリックモデルに分子間電子相関をマッピングする。
得られた理論は、パラコラート相とスピングラス相関相の2つの集合相関相を予測する。
本研究は, 共役分子アンサンブルの創発相の顕微鏡機構としてキャビティ媒介電子相関を確立する。
論文参考訳(メタデータ) (Sat, 02 May 2026 17:36:22 GMT)
CNN-based Multi-In-Multi-Out Model for Efficient Spatiotemporal Prediction [0.0] CNNベースのモデルは、カーネルのローカルな特性のため、グローバルな情報を考えるのが困難である。
Transformerアーキテクチャに基づくモデルは、自己注意計算のために複雑になる。
論文参考訳(メタデータ) (Sat, 02 May 2026 06:22:56 GMT)
Benchmarking LightGBM and BiLSTM for Sentiment Analysis on Indonesian E-Commerce Reviews [0.0] 本評価は,Hugging Faceをベースとしたインドネシアのeコマースレビューデータセットを用いて,感情分析タスクで実施する。
BiLSTMアーキテクチャは、インドネシアのレビューテキストのシーケンシャルなコンテキストをキャプチャする能力が高く、この特定の分類タスクにおいて優れたモデルとなっている。
論文参考訳(メタデータ) (Sat, 02 May 2026 08:38:18 GMT)
Attention Sinks in Massively Multilingual Neural Machine Translation:Discovery, Analysis, and Mitigation [0.0] ニューラルネットワーク翻訳におけるクロスアテンションパターンは、多言語モデルが言語構造をどのように整合させるかを研究するために広く用いられている。
NLLB-200(600M)のクロスアテンション解析における系統的アーティファクトについて報告する。
我々はこれらの「注意の流し込み」と呼び、LSMからNMTの交差注意への発見を延長し、位置バイアスよりも語彙設計に根ざした因果メカニズムを同定する。
論文参考訳(メタデータ) (Sat, 02 May 2026 03:59:00 GMT)
Are we Doomed to an AI Race? Why Self-Interest Could Drive Countries Towards a Moratorium on Superintelligence [0.0] 我々は、一般的な見解とは対照的に、人工超知能(ASI)に関するモラトリアムが州の自己利益になる可能性があると論じる。
我々は、技術優位の利点と制御不能なAISの破滅的なリスクとのトレードオフをモデル化する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:13:50 GMT)
Analysis of Personal Data Exposure in Thailand [0.0] 本研究では,タイ国民識別番号のオンライン曝露に伴うリスクについて検討した。
アメリカ合衆国の社会保障番号と同様に、このユニークな識別子は様々な法律、財政、福祉関連の活動に不可欠である。
本研究は,主要な検索エンジンにまたがるタイ国民識別番号を公表した。
論文参考訳(メタデータ) (Sat, 02 May 2026 15:41:20 GMT)
Addressing Data Scarcity in Bangla Fake News Detection: An LLM-Based Dataset Augmentation Approach [0.0] 本研究では,Large Language Model (LLM) に基づく拡張が,制限に効果的に対応し,Bangla偽ニュース分類を改善することができるかどうかを検討する。
既存のデータセットは、価値はあるものの、非常に不均衡であり、モデルパフォーマンスを制限している。
本稿では, Gemma 3 27B ITモデルを用いて, 合成バングラニュース記事を生成するシステム拡張フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 07:02:29 GMT)
AI-Integrated Learning Management System for Middle School: A Longitudinal Study of Learning Outcomes Through High School and Beyond [0.0] 中学校は中核的な学問的スキルを構築するための重要な窓口である。
多くの学生は、ヘルプが制限されることが多く、しばらく立ち往生した後、遅すぎるため遅れています。
本研究では,中等教育のためのAI統合LMSを提案する。
論文参考訳(メタデータ) (Sat, 02 May 2026 05:10:36 GMT)
A position dependent mass Hamiltonian and abstract ladder operators [0.0] 位置依存質量を持つ一次元の粒子のハミルトニアン$H$を考える。
この解析において擬ボソニック作用素が関連する役割を担っていることを示す。
論文参考訳(メタデータ) (Sat, 02 May 2026 13:43:26 GMT)
A Theory of Saddle Escape in Deep Nonlinear Networks [0.0] 層重行列のフロベニウスノルムの不均衡について、スムーズな活性化と微分可能な損失を保った正確な恒等式を導出する。
置換対称部分多様体では、恒等式は近似バランス則と結合し、スカラーODEへの全行列フローを減少させる。
我々の理論と数値シミュレーションの間にはよく一致している。
論文参考訳(メタデータ) (Sat, 02 May 2026 06:55:15 GMT)
A Theory of Generalization in Deep Learning [0.0] 本稿では、経験的ニューラルネットワークカーネルが出力空間を分割する深層学習における一般化の非漸近理論を提案する。
信号チャネル内において、ミニバッチSGDは、コヒーレント集団信号が高速な線形ドリフトを介して蓄積されることを保証する一方、慣用的暗記は遅く、拡散的なランダムウォークに抑制される。
この理論は、良心過剰、二重降下、暗黙の偏見、滑稽といった深層学習理論の異なる現象を自然に説明している。
論文参考訳(メタデータ) (Sat, 02 May 2026 00:21:36 GMT)
A Lightweight Scrum Sprint Simulation to Help Learners Traverse the Empirical Process Control Threshold Concept [0.0] 経験的プロセス制御は、以前のアクティビティの成功や不運を観察して作業を管理する方法であり、スクラムでは重要なプロセスです。
学生にスクラムプロジェクトを経験的にコントロールする方法を教えるために設計された、軽量でスケーラブルで、無償で、カスタマイズ可能なスプリントシミュレーションアクティビティを紹介します。
論文参考訳(メタデータ) (Sat, 02 May 2026 20:23:19 GMT)