AgentDoG 1.5: A Lightweight and Scalable Alignment Framework for AI Agent Safety and Security [147.5] 軽量でスケーラブルなエージェント安全アライメントフレームワークを提案する。
CodexとOpenClawの実行シナリオの緊急リスクに対応するため、エージェント安全分類を更新する。
AgentDoG 1.5 に基づいて,高効率なエージェント安全性 SFT と RL トレーニング環境を構築した。
我々は,AgentDoG 1.5をトレーニング不要のオンラインガードレールとしてリアルタイム安全モデレーションとして展開する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:48:37 GMT)
Déjà View: Looping Transformers for Multi-View 3D Reconstruction [110.0] 最近のフィードフォワード3次元再構成変換器は10億以上のパラメータに拡張されている。
モデルの深さは、部分的にイテレーションを購入し、ユニークなパラメータで非効率に支払い、代わりにアーキテクチャでそのイテレーションを明示することを示しています。
我々のモデルであるDéjViewは、1つのループ変換ブロックをK精細ステップのビュー毎の機能に繰り返し適用する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:47:48 GMT)
Planning with the Views via Scene Self-Exploration [109.0] 我々は、(1)単一のアクションがビューをどのように変換するかを考慮し、(2)ターゲットビューを特定するために、マルチターンプランにまたがる多くの変換をコンパイルすることを要求する、この機能ビュー計画と呼ぶ。
実際のScanNetシーンにおける3Dポイントクラウド環境であるViewSuiteの両機能について検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:15:23 GMT)
GenEraser: Generalizable Video Object Removal via Balanced Text-Mask Guidance and Decoupled Locator-Preserver [107.7] GenEraserは、一般化された高忠実度ビデオオブジェクトとエフェクト除去のための新しいフレームワークである。
拡散変換器のマルチモーダル先行をフル活用するために,バイパートテキストガイダンスと組み合わせたMC-MoE(Multi-Conditional Mixture-of-Experts)を導入する。
また、マスクとテキスト条件の相対的優位性を適応的にバランスさせるための学習可能なDeep C'FGのFusion機構を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:58:36 GMT)
The Sample Complexity of Multiclass and Sparse Contextual Bandits [106.7] 我々は,包括的フィードバックに基づいて,与えられたクラスからほぼ最適なポリシーを特定することを目的とする。
ゼロ・ワンの報酬を伴うバンド型マルチクラス分類に動機付けられ、emph$s$-sparse設定に焦点をあてる。
我々は、$s$-sparseの報酬で、誘導モデルクラスは、$s$でスケールするシャープなDEC境界を認め、直接最適なレートを得ることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:12:20 GMT)
Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments [96.2] 身体的な知性は、操作やナビゲーションといった個々のタスクのための特別なモデルを通してしばしば研究される。
本稿では,Qwenの視覚言語モデリングスタックを連続的な動作と軌道生成に拡張した統一的な基礎モデルであるQwen-VLAを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:36:31 GMT)
GMOS: Grounding Moving Object Segmentation in 3D Space and Time [95.3] 移動オブジェクト(MOS)は、カメラから独立して動くオブジェクトを発見し、セグメンテーションし、追跡することを目的としている。
本稿では,RGB動画を直接操作し,時間的に細かな複数の移動物体の分割を3D認識するフレームワークGMOSを提案する。
この体制におけるトレーニングと評価を支援するため、オブジェクトごとの時間的動作アノテーションを備えた2,210の現実世界ビデオのデータセットであるGMOS-2Kをキュレートする。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:58 GMT)
FIDEM: A Standard-Compliant Framework for Secure Binding of MUD Profiles to IoT Devices [90.9] FIDEMは、DHCPベースのMUDURL発行を保証するための標準準拠のフレームワークである。
これはZero-Knowledge-Proof認証を利用することで、IoTデバイスとそのMUDプロファイル間の暗号化バインディングを提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:16:50 GMT)
GTA: Generating Long-Horizon Tasks for Web Agents at Scale [82.4] 我々は、クローリング、検索ベースのシード、コンテキスト内生成、自動品質管理を統合したスケーラブルなフレームワーク、GTAを導入する。
eコマース、政府、フォーラム、ニュースをカバーする50以上のウェブサイトでパイプラインをインスタンス化し、マルチリンガルとマルチホップをカバーしています。
i) マルチホップWebエージェントタスク生成の形式化、(ii) 自動データ生成のための効率的で検証されたパイプラインの提案、(iii) 再現可能な評価を伴う動的ベンチマークのリリースである。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:05:50 GMT)
Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents [82.3] i) ハーネス更新、(i) 実行証拠から有用な永続的ハーネス更新を生成する能力、(ii) ハーネスベネフィット、タスク解決時に更新されたハーネスの恩恵を受ける能力の2つのハーネス自己進化能力を分析した。
まず、ハーネス更新は基本能力において平坦である:異なる能力階層のモデルがハーネス更新を生成し、驚くほど類似したゲインをもたらす。
第二に、ハーネスベネフィットは基本能力において単調ではない:弱い層モデルは更新されたハーネスからほとんど恩恵を受けず、中層モデルは最も恩恵を受け、強い層モデルは中層より利益が低い。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:16:14 GMT)
Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval Using Language [82.2] Video Moment Retrieval (VMR) は、未トリミングビデオから文クエリに対応する特定のモーメントを検索するターゲットである。
この目的のために、我々は、新しいVMR設定であるOpen-Set Video Moment Retrieval (OS-VMR)を創造的に探求する。
本稿では,OS-VMRに向けた最初の試みとして,正規化フロー技術に基づくIDおよびOODクエリを識別する新しいモデルであるtextOpenVMRを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:57:14 GMT)
On Asymmetric Optimization of Reasoning and Perception in Vision-Language Model Post-Training [80.1] ポストトレーニングは、フロンティア視覚言語モデルの推論を大幅に改善したが、認識の獲得は比較的限られている。
そこで本研究では,2つの総合的なタスクによって,認識を推論から遠ざけるような,制御された診断フレームワークを提案する。
その結果、非対称な最適化を包括的に診断し、知覚と推論のバランスをとるための具体的な介入を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:20:49 GMT)
From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons [74.3] 拡散モデルは効率的な並列テキスト生成を約束するが、双方向の注意に依存し、事前訓練された自己回帰(AR)モデルによる構造的ミスマッチを生成する。
本稿では,ARバックボーンを拡散パラダイムに効率的に適応するフレームワークであるFLUIDを提案する。
実験により、FLUIDは訓練コストを桁違いに削減しつつ、最先端の性能を達成することが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:27:28 GMT)
LiteCoder-Terminal: Scaling Long-Horizon Terminal Environments for Learning Language Agents [74.1] ドメイン仕様から直接端末トレーニング環境を生成するゼロ依存パイプラインである LiteCoder-Terminal-Gen を紹介する。
このフレームワークを用いて,10ドメインにわたる11,255のエキスパートトラジェクトリからなるLiteCoder-Terminal-SFTと,トラジェクトリレベルの優先度最適化のための602の検証可能な環境を備えたLiteCoder-Terminal-RLという2つの大規模リソースを構築した。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:11:57 GMT)
VLA-Pro: Cross-Task Procedural Memory Transfer for Vision-Language-Action Models [74.0] VLA-Proは、クロスタスクの一般化を強化するために設計されたプラグイン・アンド・プレイのフレームワークである。
タスク関連手続き記憶をトレーニング時に保存し、推論中にこれらの記憶を転送する。
RoboTwin、RLBench、および実世界の操作タスクの実験は、VLA-Proがクロスタスクの一般化を一貫して改善していることを示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:14:08 GMT)
Syll: Open-Source Personal Automation with Cross-Surface Execution [73.8] オープンソースで自己ホスト型マルチモーダルエージェントであるSyllを紹介します。
Syllは、MPP/APIツール、CLI実行、モジュールランタイムでのビジュアルコントロールを統合する。
私たちの実装は、Adobe Photoshop、Adobe Audition、Stardew Valley、Finderなどのプロダクションデスクトップアプリケーションで検証されています。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:31 GMT)
Dial HEALTHDIAL for Advice: A Multilingual and Multi-Parallel Spoken Dialogue Dataset for Knowledge-Grounded Information Seeking [72.7] 本研究では,RAGに基づく音声対話システムの開発と評価を目的とした大規模・多言語・マルチ並列データセットであるHEALTHDIALを紹介する。
このデータセットは、WHO(World Health Organization)の信頼できるコンテンツに基づく6000の情報検索対話(言語毎1500語)と、多様な方言の母語話者から記録された163時間のユーザスピーチで構成されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:47:09 GMT)
Domain-Specific Data Synthesis for LLMs via Minimal Sufficient Representation Learning [72.6] 大規模言語モデルは、ドメイン固有のデータを微調整することで、特定のドメインで強力なパフォーマンスを達成することができる。
既存のデータ合成アプローチは、自然言語で表現された明示的なドメイン記述と慎重にプロンプトエンジニアリングに依存している。
本稿では、参照サンプルから最小限のドメイン表現を学習し、それを活用してドメイン整合合成データの生成を誘導する新しいフレームワークDOMINOを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:57:02 GMT)
Seeing Isn't Knowing: Do VLMs Know When Not to Answer Spatial Questions (and Why)? [72.3] 空間推論は視覚言語モデル(VLM)が現実世界の環境に展開する基本的な能力である。
対象情報を隠蔽するオクルージョン(Occlusion)と、誤解を招く視覚的手がかりを生成する視点曖昧性(spective ambiguity)の2つのタイプの観察課題を紹介した。
各構成について、クリーンな観察では答えられるが、導入した課題では無視する必要がある空間的質問を設計する。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:44:47 GMT)
WorldMemArena: Evaluating Multimodal Agent Memory Through Action-World Interaction [72.2] マルチモーダルな言語モデルは、長距離エージェントとしてますます多くデプロイされている。
既存のベンチマークは、静的対話上のリコールを測定し、メモリを1つのタスクの精度に分解し、キャプションに対する視覚的な観察を減らす。
マルチモーダルエージェントメモリを,観測可能な4段階ライフサイクルを持つアクションワールドインタラクションループとして定式化する。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:27:20 GMT)
SAFE-Pruner: Semantic Attention-Guided Future-Aware Token Pruning for Efficient Vision-Language-Action Manipulation [71.9] SAFE-Prunerはプラグアンドプレイのプルーニングフレームワークで、将来のレイヤーの注意手順をプルーニング決定に組み込む。
本手法は成功率を1.7%以下に抑えながら最大1.89倍の高速化を実現し,最先端の手法を最大1.9%向上させることを示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:23:08 GMT)
SkillBrew: Multi-Objective Curation of Skill Banks for LLM Agents [71.5] LLMエージェントはますます、キュレートされたスキルバンクに依存している。
既存のアプローチは追加のみの方法でこれらの銀行を拡張する。
本稿では,多目的キュレーションフレームワークであるSkillBrewを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:33:52 GMT)
Towards Verifiable Multimodal Deep Research: A Multi-Agent Harness for Interleaved Report Generation [70.9] 我々は、インターリーブレポート生成のためのマルチエージェントハーネスであるtextscPtahを提案する。
textscPtahは、ユーザクエリから、計画、研究、執筆段階を通じてレンダリングされたWebレポートまでのライフサイクルを編成する。
検証エージェントがハーネスの受け入れ機能として機能し、ワークフロー全体を通して事実的接地、引用の忠実性、相互の整合性を強制する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:40:34 GMT)
Offloading Score: Measuring AI Reliance Through Counterfactual Workflows [70.8] 私たちは、AIツールにオフロードされた認知活動の分断を定量化する、信頼度尺度であるオフロードスコアを導入します。
本研究は,本質的な計量妥当性評価と制御されたユーザスタディにより,オフロードスコアの検証を行う。
オフロードスコアは、時間制約設定における依存度を著しく高めることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:44:31 GMT)
FedSmoothLoRA: Toward Smoother and Faster Convergence in Federated Low-Rank Adaptation [70.7] Low-Rank Adaptation (LoRA) を用いた基礎モデルのファインチューニングにより,通信コストと計算コストを削減できる。
FedAvgとLoRAの直接的な組み合わせには、3つの大きな問題がある。
我々はFedSmoothLoRAを提案する。FedSmoothLoRAは、拡張された更新空間を保存し、局所的な最適化の連続性を改善し、クライアント対応の開始状態を提供する、フェデレートされたLoRAチューニングフレームワークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:53:46 GMT)
MELD: Mel-Spectrogram-Based Speech Language Modeling with Discrete Latent Variables [70.5] 本稿では,エンコーダと音声モデルとを協調的に最適化する,メルスペクトル上での離散潜在変数モデルを提案する。
共同最適化は、ゼロショットテキスト音声(TTS)と音声テキスト(STT)タスクにおけるオーバーベースやその他のメルスペクトルベースのベースラインの改善をもたらすだけでなく、自動回帰メルスペクトルモデリングにおける一般的な問題を効果的に緩和する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:39:36 GMT)
When Do Graph Foundation Models Transfer? A Data-Centric Theory [68.5] グラフ基盤モデル(GFMs)は、様々なグラフドメインにまたがる単一のバックボーンの再利用を目的としているが、それらの転送は不均一であり、負の転送を示すことがある。
我々は、セットベースおよびメッセージパストークン化の両方に対して、任意のリプシッツバックボーンは、クロスドメイン出力シフトの明示的な分解を認めていることを示す。
我々はスペクトルPEの安定性を保証するとともに、固有ベクトルと部分空間に基づくPEの対比挙動を強調する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:07:27 GMT)
A Heterogeneous Architecture for Robot RL Beyond GPU-Dominant Paradigms [68.4] シミュレーション支配型ロボット制御では、どのプロセッサが物理を実行するかではなく、シミュレーションスループット、ポリシー学習、実行時同期が効率的なエンドツーエンドループを形成するかどうかが重要な問題である。
We present UniLab, a heterogeneous CPU-resident/GPU-learning architecture that decouples CPU-parallel Simulation from GPU policy updates。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:53:50 GMT)
BitC-3DGS: High-Capacity 3D Gaussian Splatting Watermarking via Bit Compression [68.3] 高容量透かしは3Dガウススプラッティング(3DGS)資産が豊富な情報を埋め込むために必要である。
既存のビット・ツー・ケンの透かし方式は、CLIPの77ビットのコンテキスト長が固定されているため、77ビットのメッセージに制限されている。
トークン毎に複数のメッセージビットをエンコードするビット圧縮フレームワークBitC-3DGSを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:28:04 GMT)
OmniRetrieval: Unified Retrieval across Heterogeneous Knowledge Sources [67.6] 既存のレトリバーは、固定クエリ言語の下で一度に1つのソース上で動作します。
OmniRetrievalは、自然言語クエリを取り込み、適切な知識ソースを識別するフレームワークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:10:35 GMT)
GrepSeek: Training Search Agents for Direct Corpus Interaction [66.7] GrepSeekは、コンパクトな検索エージェントを訓練し、大きなテキストコーパスから証拠を見つけ、フィルタリングし、構成する、最適化された直接コーパスインタラクション(DCI)検索エージェントである。
DCIを大規模に実用化するためには、シェルコマンドのシーケンシャルな実行とバイトエクササイズ等価性を保ちながら、シェルベースの検索を最大7.6タイムで高速化するセマンティックス保存のシャード並列実行エンジンを使用する。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:37:33 GMT)
Turning Bias into Bugs: Bandit-Guided Style Manipulation Attacks on LLM Judges [65.9] LLM審査員を誤解させるためにセマンティクスを保存する編集を学習するブラックボックスの敵対的フレームワークであるBITEを紹介する。
BITEは65%を超える攻撃成功率を獲得し、9ポイントのスケールでスコアを1-2ポイント上げる。
LLM-as-a-judgeパラダイムの根本的な弱点を明らかにし,ロバストでアタック・アウェアな評価を動機づけた。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:12:16 GMT)
Enhancing Factuality through Consensus and Consistency in Summarization Using Minimum Bayes Risk Decoding [65.0] 本稿では、ソース文書の一貫性と他の候補間のコンセンサスという2つの要因を考慮し、候補要約を再引用するConSUMを提案する。
我々のシステムは既存の手法と競合しており、人による評価により、生成した要約が他のシステムよりも好まれていることが確認されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:14:43 GMT)
AgentSchool: An LLM-Powered Multi-Agent Simulation for Education [64.6] AgentSchoolはマルチエージェントシミュレータで、振舞いではなく状態遷移として学習をモデル化する。
周囲の関与、傾きの形成、アグレッショナリによる結束、意見リーダーの出現のもっともらしい痕跡を生成する。
AgentSchoolは、長期記憶、マルチエージェント調整、将来の制度的推論のための社会的に意味のあるテストベッドとして教育の枠組みを定めている。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:05:58 GMT)
GAPD: Gold-Action Policy Distillation for Agentic Reinforcement Learning in Knowledge Base Question Answering [64.2] 結果に基づくRLに高密度トークンレベルガイダンスを付加する訓練時間金反応政策蒸留フレームワークを提案する。
GAPDはWebQSP、GrailQA、GraphQの最先端技術に一貫して勝っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:28:10 GMT)
ELAN4D: Embodiment-Centric 4D Supervision for Vision-Language-Action Models via Plug-and-Play Adaptation [63.6] VLA(Vision-Language-Action)モデルでは、ロボット操作が約束されているが、既存のほとんどのポリシーは、現在の観測からアクションを直接回帰することで、反応する。
ELAN4Dは,将来のロボットキートラックによるポリシーを予測的時間的監視として強化する,実施中心の4D対応トレーニングフレームワークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:03:30 GMT)
STAMP: Training Explicit Memory for Mobile GUI Agents in Controllable and Scalable Virtual Environments [63.4] モバイルエージェントは即座に反応制御を行うが、メモリを必要とする現実的なロングホライゾンタスクでは頻繁に失敗する。
制御可能な仮想環境を通じて,モバイルエージェントの明示的なメモリをトレーニングするフレームワークSTAMPを提案する。
結果のStampGUIエージェントは、メモリワールドベンチマークに新たなハイウォーターマークを設定し、例外的なメモリ精度とタスクレジリエンスを実証します。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:00:13 GMT)
Crafter: A Multi-Agent Harness for Editable Scientific Figure Generation from Diverse Inputs [62.5] 我々は,学術的な図形から出版品質のイラストを自動生成するシステムを開発した。
Crafterは、アーキテクチャの変更なしにフィギュアタイプを一般化するマルチエージェントのハーネスフィギュア生成である。
CraftEditorは、出力を編集可能なSVGに変換する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:04:30 GMT)
OmniMatBench: A Human-Calibrated Multimodal Reasoning Benchmark Across 19 Materials Science Subfields [61.9] 材料科学のためのマルチモーダル推論ベンチマークであるOmniMatBenchを紹介する。
我々は13のオープンソースおよびクローズドソースMLLMを評価し、最良のモデルが0.372の総合スコアを達成することを発見した。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:12:27 GMT)
VPG: Visual Prefix Guidance for Autoregressive Image and Video Generation [61.6] ビジュアル・プレフィックス・ガイダンス(英語: Visual Prefix Guidance, VPG)は、自動回帰画像とビデオ生成のためのトレーニング不要な推論時間誘導手法である。
VPGは、生成されたプレフィックスの下のモデルの出力と、劣化したプレフィックスの下の出力とを対比することにより、次のステップ予測を改善する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:55:06 GMT)
When Should AI Read the Room? Public Perceptions of Social Intelligence in AI Agents [61.1] ソーシャルAIエージェントは、日々の環境にますます配置されている。
AIエージェントにおける社会的インテリジェンスに対する大衆の認識と、これらのエージェントの受容性はほとんど検討されていない。
アメリカ合衆国における成人の混合メソッド調査について紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:49:47 GMT)
Fewer Steps, Better Performance: Efficient Cross-Modal Clip Trimming for Video Moment Retrieval Using Language [60.9] 本稿では,クエリ関連クリップをトリムするスポットVMRを提案する。
提案するSpotVMRは,最新のVMR手法の効率性を実現するプラグイン・アンド・プレイモジュールとして機能する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:42:28 GMT)
MIRA: Mid-training Rubric Anchoring for Source-Aware Data Selection [60.8] 我々は,自作ルーブリック発見に基づくソース認識フィルタリングフレームワークであるMIRAを提案する。
21のソースと5つのソースグループを持つコード指向のミッドトレーニングでは、MIRAは9つのコードベンチマークで選択ベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:40:40 GMT)
HumanEgo: Zero-Shot Robot Learning from Minutes of Human Egocentric Videos [59.0] HumanEgoは、人間とロボットのエンボディメントギャップを橋渡しするフレームワークである。
それは、人間のデモを、手動オブジェクトの相互作用の実体レベルの表現へと持ち上げる。
HumanEgoは、ロボットのデータフリー、ハードウェア非依存、データ効率、ゼロショットの人間とロボットの転送を可能にする。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:10:45 GMT)
VisualThink-VLA: Visual Intermediate Reasoning for Effective and Low-Latency Vision-Language-Action Policies [58.7] 正確な低レイテンシVLAポリシーのためのビジュアル中間推論フレームワークであるVISUALTHINK-VLAを提案する。
私たちのブートストラップ哲学は、効果的な視覚的思考でアクションを導くことです。
これは、デコードオーバーヘッドを回避しながら空間的精度を保った、コンパクトなビジュアル・エビデンスインターフェースを通じてアクション予測をブートストラップする。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:36:53 GMT)
Semantic Motion Anchors: Bridging Motion and Meaning in Co-Speech Gestures [58.6] そこで本稿では, 意味的動作アンカー, ジェスチャー動作の自然言語的抽象化, 物理的形状, コミュニケーション意図を提案する。
本手法は,3次元ジェスチャーを身体動作プリミティブに識別し,言語的に構造化された記述に分類し,転写文にグルーピングする。
BEAT2では,テキスト・モーション・ベースライン上でテキスト・ツー・ジェスチャR@1を8.2%改善する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:01:11 GMT)
RoboWits: Unexpected Challenges for Robotic Creative Problem Solving [58.6] 我々は、認知的推論、創造的ツールの使用、予期しない状況に対する堅牢性を評価するために設計された、双方向のロボットベンチマークであるRoboWitsを紹介する。
このパイプラインを用いて,30種類の種タスクと208のタスクを,幾何学的,物質的,集合的推論にまたがる変異と難易度でキュレートした。
プレトレーニングされたVLAは,単一タスクの微調整後にシードタスクに予備的な成功を示すが,変異タスクの実行に苦慮している。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:57:15 GMT)
Accelerating Constrained Decoding with Token Space Compression [57.6] CFGzipはトークン検索空間を圧縮するオフライン技術である。
CFGzipをSoTA文法エンジンで使用する場合,最大2桁のレイテンシ低下を報告した。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:22:20 GMT)
SGMD: Score Gradient Matching Distillation for Few-Step Video Diffusion Distillation [57.3] 分散マッチング蒸留(DMD)は、数ステップのビデオ拡散モデルにおいて、推論を加速するための広く使われているパラダイムである。
textbfScore Gradient Matching Distillation (SGMD)を提案する。
教師の停止段階のフィッシャーを安定した分布マッチングの目的として使用しながら、教師に対して偽スコアを直接最適化することで、偽スコアの視点を採用する。
時間的一貫性を維持しつつ、4段階蒸留モデルの運動力学を大幅に改善する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:50:55 GMT)
Compass: Navigating Global Marine Lead Data Integration through Expert-Guided LLM Agent [55.8] 海洋鉛(Pb)とその同位体は海洋循環と人為的汚染にとって重要なトレーサーである。
手動抽出はスケールできないが、汎用大規模言語モデル(LLM)は必要なドメイン固有の知識を欠いている。
我々は,LLMが微調整なしで厳密な科学的データ抽出を行うことのできる専門家誘導型適応手法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:06:25 GMT)
Active Timepoint Selection for Learning Measure-Valued Trajectories [55.5] スナップショットから連続確率パスを推定することは、単細胞生物学のような領域における根本的な課題である。
スパース測度空間にアクティブな実験を拡張するフレームワークを導入する。
これにより、不確実性を最小限に抑えるために測定時間を反復的に選択する取得ポリシーが得られる。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:22:35 GMT)
AliMark: Enhancing Robustness of Sentence-Level Watermarking Against Text Paraphrasing [55.0] AliMarkは、文レベルの透かしをビットシーケンスエンコーディングとアライメントの問題として再構成するフレームワークである。
AliMarkは様々なパラフレーズ攻撃で最先端のベースラインを大幅に上回ることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:30:43 GMT)
Citation-Closure Retrieval and Per-Rule Attribution for Real-World Regulatory Compliance Question Answering [55.0] 複雑な国内R&D規制から派生した運用知識グラフを特徴とする,新たなベンチマークであるRegOps-Benchを用いて,レギュレーションコンプライアンスQAを形式化する。
RefWalkはクロスドキュメントの引用を横切り、マックスベースのアグリゲーションを通じてマルチビュー候補を融合させ、ソースへのクレームを明示的にマッピングするためにルールごとの属性を強制する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:38:38 GMT)
DynaFLIP: Rethinking Robotics Perception via Tri-Modal-Dynamics Guided Representation [54.9] そこで我々はDynaFLIPを紹介した。DynaFLIPは動作理解を上流の知覚へと押し上げるマルチモーダル事前学習フレームワークである。
ヘテロジニアスな人間とロボットのビデオから画像言語による3Dフロートレーレットを構築し、これらのトレーレットを訓練時間監視として使用し、画像のみのエンコーダを形成する。
この結果から,ロボットの汎用化は,視覚表現の訓練によって,現在存在するものだけでなく,動作中の世界の変化をコード化することで向上することが示唆された。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:53 GMT)
MINDGAMES: A Live Arena for Evaluating Social and Strategic Reasoning in Multi-Agent LLMs [54.8] 大規模言語モデル(LLM)のためのマルチゲームアリーナと評価プラットフォームであるMindgamesを紹介する。
Mindgamesは、統合されたインタラクションインターフェース、TrueSkillベースの評価、および4つのゲーム環境にわたる完全な軌跡ログを提供する。
我々は,決定論的オフライントーナメントプロトコルMG-Refとともに,ターンレベルの観察,アクション,報酬を含む29,571個のマルチエージェントゲームを分析した。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:33:47 GMT)
GaussianDream: A Feed-Forward 3D Gaussian World Model for Robotic Manipulation [54.7] 視覚言語アクション(VLA)ポリシーは、セマンティック先行をアクション生成に転送することで、言語条件のロボット操作を進化させた。
標準的な行動模倣学習は、しばしば明示的な3次元空間情報、密集した幾何学的監督、将来の環境進化の十分なモデリングを欠いている。
フィードフォワード3Dガウス世界モデルプラグインである textbfGaussianDream を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:25:46 GMT)
Towards Human-Like Interactive Speech Recognition With Agentic Correction and Semantic Evaluation [53.8] 単一パスのASRフロントエンドと意味的訂正,意図のルーティング,推論に基づく編集を組み合わせた閉ループフレームワークである textbfAgentic ASR を提案する。
複数言語、名前付き集中型、コードスイッチングベンチマークの実験は、反復的相互作用が意味的誤りを一貫して減少させることを示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:23:31 GMT)
Opt-Verifier: Unleashing the Power of LLMs for Optimization Modeling via Dual-Side Verification [53.8] 本稿では、構造と解の両方の観点から、デュアルサイド検証(Opt-Verifier)を用いた新しいフレームワークを提案する。
一般的なベンチマーク実験により、我々の手法は精度が20%以上向上していることが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:09:52 GMT)
Harnessing non-adversarial robustness in large language models [53.7] 我々は、ロバストネスは単純な微調整プロセス、すなわちロバストネスのデバイアスによって達成できることを示す。
偏りが役に立たない状態を特定し、理論と広範な実験を通して、偏りは強靭性を高めるための迅速かつ効率的なツールである可能性があることを実証する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:00:00 GMT)
Scaling Laws for Agent Harnesses via Effective Feedback Compute [53.7] emphEffective Feedback Compute (EFC)は、情報的、有効、非冗長な場合にのみフィードバックを信用し、その後の決定のために保持するトレースレベルのスケーリング座標である。
EFCベースの座標は、生の計算ベースラインよりも失敗率を常に予測する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:45:47 GMT)
JMed48k: A Multi-Profession Japanese Medical Licensing Benchmark for Vision-Language Model Evaluation [53.6] 本稿では,視覚言語モデルを評価するための医療ライセンスベンチマークであるJMed48kを紹介する。
JMed48kは、厚生労働省が発行した公式PDF資料から作成され、48,862件の試験質問と20,142件の画像を収録している。
JMed48k-Evalは,テキストのみの質問9,905件,画像による質問2,579件を含む12,484件の回答を得た。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:03:05 GMT)
DVSM: Decoder-only View Synthesis Model Done Right [53.5] 近年のLVSM(Large View Synthesis Models)は、再構成とレンダリングを別々のネットワークに分離するエンコーダデコーダアーキテクチャを提唱している。
KV-cacheとして暗黙的にシーンを表すデコーダのみのアーキテクチャは、エンコーダ-デコーダの変種よりも優れており、レンダリングの複雑さは少ない。
以上の結果から,複数のベンチマークによる新規視点合成技術が確立され,高密度な入力ビュー下でのシーンごとの最適化3DGSよりも優れた結果が得られた。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:16:09 GMT)
Loong: A Human-Like Long Document Translation Agent with Observe-and-Act Adaptive Context Selection [53.4] 人型長文翻訳エージェントであるLoongを提案する。
すべての歴史に受動的に出席する代わりに、Loongは翻訳指導の最適な文脈を適応的に特定するために深い推論を行う。
ロンは英語、中国語、ドイツ語、フランス語の翻訳精度を大幅に向上させた。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:32:25 GMT)
Joint Model and Data Sparsification via the Marginal Likelihood [53.3] 本稿では,個々の特徴とサンプルの相違点を同時学習し,同時にモデルとデータスペーシングを実現することを提案する。
このモデルとデータの対称的なプルーニングは、共役を保存する自然な拡張を提供する。
多様な回帰タスクにわたる経験的結果は、共同ARDアプローチがスパースモデルとロバスト予測モデルの両方を一貫して生成することを確認した。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:26:53 GMT)
Multimodal Music Recommendation System using LLMs [53.1] 本稿では,LastFM-1Kデータセットを3つの補完信号で強化するセッションベース音楽レコメンデーションフレームワークを提案する。
マルチモーダル機能と異なるアイテムIDエンコーダバックボーンで拡張することで、E4SRecフレームワークを採用する。
実験の結果,コンテンツベース機能の統合により,リコールでは最大95%,NDCGでは最大79%のベースラインが向上した。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:34:12 GMT)
EviLink: Multi-Path Schema Linking with Uncertainty-Guided Evidence Acquisition for Large-Scale Text-to-SQL [53.1] EviLinkは、マルチハイプセシススキーマと不確実性誘導されたエビデンス獲得を組み合わせている。
Spider2-Snowでは、EviLinkは90.15%のフィールドレベルの厳格なリコールレートを獲得し、平均トークン123.30Kを使用し、固定ジェネレータによる下流SQL生成を改善している。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:32:38 GMT)
V2XCrafter: Learning to Generate Driving Scene Across Agents [52.2] 協調運転システムは、運転安全性を高めるために、車両間通信(V2X)を利用して協調認識を行う。
エージェントのカメラビューにまたがって制御可能で現実的な協調運転シーンを生成するための最初のフレームワークであるV2XCrafterを提案する。
実験により,V2XCrafterはエージェント間の整合性を持った高忠実かつ制御可能なストリートビューを生成できることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:03:51 GMT)
LFQ: Logit-aware Final-block Quantization for Boosting the Generation Quality of Low-Bit Quantized LLMs [52.1] ブロックワイドPTQの簡易かつ効果的な拡張であるLFQ(Logit-aware Final-block Quantization)を導入する。
LFQは、最先端のブロックワイドPTQよりも複雑な生成タスクの精度を一貫して改善する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:02:23 GMT)
Entropy-KL Divergence-based Token Masking: A Novel Approach for Selective Fine-tuning of Large Language Models [52.1] 改良された微調整と強化学習は、大規模言語モデルの訓練後の標準パラダイムとなっている。
EKSFT(Entropy-KL Selective Fine-Tuning)は,参照モデルから高いエントロピーまたは高いKLの発散を示すトークンを選択的にマスクする。
数学的推論ベンチマークに関する実証的な評価は、EKSFTが標準SFTを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:36:05 GMT)
AgentCVR: Active Multi-Agent Cross-Video Reasoning via Script-Simulated Reinforcement Learning [51.5] CVR(Cross-Video Reasoning)は、マルチモーダルインテリジェンスにおいて重要なフロンティアとして登場した。
本稿では,CVRを積極的なエビデンス獲得タスクとして扱うマルチエージェントフレームワークであるAgentCVRを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:09:41 GMT)
minWM: A Full-Stack Open-Source Framework for Real-Time Interactive Video World Models [51.5] minWMはリアルタイムインタラクティブなビデオワールドモデルを構築するためのフルスタックのオープンソースフレームワークである。
minWMは既存の双方向T2V/TI2Vビデオ基盤モデルをカメラ制御可能な数ステップの自己回帰世界モデルに変換する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:27:03 GMT)
No More K-means:Single-Stage Sparse Coding for Efficient Multi-Vector Retrieval [51.4] SSR(Single-stage Sparse Retrieval)は、高価なクラスタリングを効率的なスパースコーディングに置き換えるパラダイムシフトである。
ColBERTv2と比較してインデックス処理時間を15倍短縮し、検索レイテンシを半減させ、同時に検索性能を向上させる。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:53:34 GMT)
VeriGate: Verifier-Gated Step-Level Supervision for GRPO [51.3] グループ相対政策最適化は、検証者に基づく結果報酬を伴う推論モデルをトレーニングするための効果的なレシピである。
GRPO の検証子付き拡張である VeriGate を提案し,これらの制限を3つの設計選択で解決する。
We show that VeriGate improves average accuracy around 20% and 12% for 1.5B and 7B models respectively。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:20:32 GMT)
SoundnessBench: Can Your AI Scientist Really Tell Good Research Ideas from Bad Ones? [51.2] 我々は、ICLRの投稿から再構成された1,099の機械学習研究提案のキュレートされたベンチマークであるSoundnessBenchを紹介する。
SoundnessBenchは、完全なレビュー結果の正確な予測よりも、復元可能な提案段階の音質のベンチマークとして解釈されるべきである。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:57:37 GMT)
EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs [51.1] 臨床意思決定 (CDM) は、臨床医が診断を推測し、治療を選択し、不完全な証拠の下で将来の健康結果を予測する、現実的な臨床の中心である。
LLMモデルは、強力な言語能力、幅広い生物医学的知識、効率性のために、これらの決定をサポートするためにますます使われています。
LLMの実際の臨床決定タスクに対する信頼性は、まだ十分に理解されていない。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:38:26 GMT)
Leveraging Routing Dynamics in Mixture-of-Experts Models for Efficient Language Adaptation [50.7] 多言語コーパス上での英語中心のMoEモデルの継続事前学習における多言語ルーティングのダイナミクスについて検討する。
連続的な多言語事前学習は、初期層と中層に拡散し、言語に依存しないルーティングをもたらす。
最終MoE層における言語固有の専門家と共有専門家を更新するパラメータ効率適応戦略を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:12:41 GMT)
S3C2 Summit 2025-09: Industry Secure Supply Chain Summit [50.2] ソフトウェアサプライチェーンのサイバー攻撃は ますます一般的になっています
NSFが支援するセキュアソフトウェアサプライチェーンセンター(S3C2)の3人の研究者が、セキュアソフトウェアサプライチェーンサミットを開催した。
Summitでは、脆弱性のある依存関係、コンポーネントとコンテナの選択、悪意のあるコミット、ビルドインフラストラクチャ、文化、サプライチェーンにおけるLLMの役割など、6つの中心的なトピックに関する議論が行われた。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:25:43 GMT)
Unveiling the Visual Counting Bottleneck in Vision-Language Models [49.6] この研究は視覚的数え上げを3つの認知段階(視覚的識別、大きさ認識、象徴的マッピング)に分解する。
合成Go基板と線形プローブを用いて、視覚的バックボーンは、外挿系にしっかりと、線形に分離可能な量表現を保っていることを示す。
我々は、崩壊をシンボルマッピングステージに向ける。そこでは、モデルがシンボルトークンに有効な視覚的大きさを投影することに失敗する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:20:29 GMT)
SCOPE: Simulating Cross-game Operations in Playable Environments for FPS World Models [49.2] 既存のメソッドは、グローバルにアクションを注入し、シングルタイトルでトレーニングし、密度の高いFPS入力で失敗する。
本稿では,事前学習したビデオ拡散モデルの各トランスブロックに条件付きモジュールを挿入するSCOPEを提案する。
また,フレーム対応のアクションテレメトリを備えたマルチゲームFPSデータセットであるCrossFPSについても紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:29:06 GMT)
HARP: Hadamard-Preconditioned Adaptive Rotation Processor for Extreme LLM Quantization [48.9] 本稿では, HARP (Hadamard-preconditioned Adaptive Rotation Processor) を導入する。
1Bから70Bまでのモデルの2-4ビット設定では、HARPは固定RHTよりもパープレキシティとゼロショット精度を改善している。
HarPはデプロイ効率を保ち、FP16では128トン/秒、61トン/秒に達する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:24:15 GMT)
DocRetriever: A Plug-and-Play Framework for Multimodal Document Retrieval with Comprehensive Benchmark [48.8] マルチモーダル文書には、テーブル、フィギュア、レイアウトなど、さまざまな要素が含まれている。
現在のアプローチでは、高精度の検索を実現するために、高密度の視覚埋め込みモデルと教師付きリランカを組み合わせるのが一般的である。
本稿では,レイアウトを意識したスパース埋め込み技術による視覚検索を支援するプラグイン・アンド・プレイフレームワークDocRetrieverを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:50:53 GMT)
Convergence Theory for Iterative LLM-Based Neural Architecture Search: A Parametric Cross-Entropy Framework with Closed-Form Proxy Reliability [48.8] 大規模言語モデル(LLM)は、反復型ニューラルアーキテクチャサーチ(NAS)におけるジェネレータとしてますます使われている。
我々は,LCM-NASを,実行可能プログラム上でのパラメトリッククロスエントロピー(CE)法としてモデル化する。
我々は,(1)エリートアーキテクチャの反復LEM微調整は,LLMファミリーに制限されたCE更新と同等であり,(2)期待されるアーキテクチャ品質はサイクル毎に単調に低下せず,(3)エリートセットの確率は幾何率で一定点に収束する,という6つの結果を示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:45:19 GMT)
Structured interactions improve distributed coordination beyond model scaling in a real-world multi-robot system [48.7] 実世界のマルチロボット協調におけるシステムレベルの設計問題について検討する。
ロボット間のコミュニケーションの再構築は、車載モデルのサイズを増大させるよりも大きな利益をもたらすか?
完全連結からモジュラー階層的相互作用への切り替えは47点(0-100)の正規化性能を改善する
論文参考訳(メタデータ) (Thu, 28 May 2026 03:21:52 GMT)
Configurable Reward Model for Balanced Safety Alignment [48.5] 既存の命令調整型大規模言語モデル(LLM)は、新しい安全設定への一般化に失敗することが多い。
本稿では,安全コンプライアンスと報酬モデリングを共同で最適化したCSRM(Safety Reward Model)を紹介する。
その結果、RMはきめ細かい安全設定や会話のニュアンスに敏感になり、これまで見つからなかった安全設定への一般化を大幅に改善した。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:05:53 GMT)
DynSess: Dynamic Session-Level Evaluation and Optimization Framework for Role-Playing Agents [48.3] ロールプレイングエージェントのための統合セッションレベルフレームワークであるDynSessを提案する。
DynSess-Evalは、ロングホライゾンな振る舞いをターゲットとしたルーリックを通じて、完全な対話セッションをスコアする。
私たちのデータセットとコードは、将来の研究を促進するためにリリースされます。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:20:11 GMT)
CalArena: A Large-Scale Post-Hoc Calibration Benchmark [48.1] ポストホックキャリブレーションのための大規模で標準化されたベンチマークを導入する。
私たちのベンチマークでは、さまざまな古典モデル、現代的なディープラーニングアーキテクチャ、基礎モデルからの予測を集約しています。
適切なスコアリングルールにおけるポストホック改善(PHI)は、従来のキャリブレーション誤差推定器に代わる原則的な代替手段であると主張する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:31:36 GMT)
Reducing Political Manipulation with Consistency Training [47.2] 大規模言語モデル(LLM)は、様々なセンシティブな文脈において、体系的な政治的バイアスを示す。
我々は、この現象を隠蔽的な政治的偏見と呼び、それが機能する7つのテクニックのカテゴリを特定します。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:36:56 GMT)
Latent Performance Profiling of Large Language Models [47.0] textbfLatent Performance Profiling (LPP) - 隠れたアクティベーションと出力分布からタスクに依存しない診断を導出するフレームワーク。
静的精度スコアとは異なり、LPPは同様のサイズのモデル間で安定でアーキテクチャに敏感なシグネチャを提供する。
類似のベンチマークスコアを持つモデルは、エントロピーや適応性の違いなど、対照的な潜在プロファイルを示すことができることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:41:26 GMT)
Alignment-Guided Score Matching for Text-to-Image Alignment in Diffusion Models [47.0] 拡散モデルは、非常にリアルなイメージを生成するが、しばしば正確なテキストイメージアライメントに苦労する。
コントラッシブアライメントガイダンスを統合することで,ソフトトークンを改良する軽量で報酬のないポストトレーニング手法を提案する。
提案手法はGenEvalベンチマークの精度を35%以上向上させる。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:57:01 GMT)
Minimal Prompt Perturbations Lead to Code Vulnerabilities: Prompt Fragility and Hidden-State Signals in Coding LLMs [46.7] 単一文字の変更ほど小さな突然変異は、生成されたコードをセキュアから脆弱に切り替えることが可能であることを示す。
その結果、入力ハンドリングの欠陥は生成前に捕捉可能である一方で、セキュアなデフォルトの欠陥はデコード時に介入を必要とすることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:30:28 GMT)
GraphLit: Learning Text-Enriched Dynamic Character Network Representations for Literary Study [46.7] 本稿では,長編小説を時間的局所的なヘテロジニアスグラフに整理する動的ヘテロジニアス文字ネットワーク(DHCN)を紹介する。
マスク付きグラフオートエンコーダの目的により、リッチな文芸表現を学習する自己教師型学習フレームワークであるGraphLitを提案する。
文芸分析におけるDHCNとGraphLitの適用性について,物語的非直線性と動的社会的特徴との関係について検討した。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:27:08 GMT)
CellBRIDGE: Learning Cellular Trajectories via Interaction-Aware Alignment [46.7] 人口スナップショットからダイナミクスを推論することは、機械学習と生物学における根本的な課題である。
我々はCellBRIDGEを導入し、リガンド受容体活性から誘導される有向型相互作用コストで機能ベースのOTを増強する。
細胞間通信を明示的にモデル化することにより、CellBRIDGEはクロススナップショット結合と下流軌道推定を改善する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:37:54 GMT)
ElegantVLA: Learning When to Think for Efficient Vision-Language-Action Models [46.6] VLAモデル(Vision-Language-Action Model)は、汎用的なロボット制御のための強力なパラダイムである。
ElegantVLAは、モデル内動的計算スケジューリングによってVLAモデルを高速化するプラグイン位相適応推論フレームワークである。
GR00TとCogACTの実験は最大2.55倍と3.77倍のスピードアップを実現し、6つの現実世界のGR00TタスクではElegantVLAは計算を2.18倍に削減し、制御周波数を13.8Hzから26.3Hzに引き上げた。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:33:05 GMT)
Opir: Efficient Multi-Task Safety Classification for Toxicity, Jailbreaks, Hate Speech, and Harmful Content [46.1] Opirは、GLiClassアーキテクチャ上に構築されたエンコーダベースのガードレールモデルのファミリーである。
Opirには、バイナリセーフ/アンセーフ分類、マルチラベル毒性分類、ジェイルブレイク分類、ゼロショットアンセーフプロンプトとレスポンス分類のためのマルチタスクモデルが含まれている。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:21:42 GMT)
User-Aware Active Knowledge Acquisition for Emotional Support Dialogue [46.1] グラデーションフリーな対話学習フレームワークであるUKA(User-Aware Active Knowledge Acquisition)を紹介する。
そこで本研究では,モデルが応答を優先順位付けできる理論・原理不確実性推定機構を提案する。
UKAは、テスト時に堅牢性を保ちながら、トレーニング中にユーザに沿った会話知識を効率的に探索することができる。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:13:38 GMT)
DeepTool: Scaling Interleaved Deliberation in Tool-Integrated Reasoning via Process-Supervised Reinforcement Learning [46.0] 本稿では,各方向における思考・行動・観察の相互に展開するプロセスにおいて,意図的な思考をスケールする新しい枠組みを提案する。
DeepToolでは、まず、拡張思考をインターリーブされた軌道へと進化させる合成パイプラインを導入し、対向摂動を統合し、堅牢性と自己補正を確実にする。
第2に,行動中心のプロセス・リワードを用いて中間的相互学習の強化を行うGRPOに基づくプロセススーパービジョン強化学習を考案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:17:20 GMT)
World Models: A Comprehensive Survey of Architectures, Methodologies, Reasoning Paradigms, and Applications [45.9] 世界モデルは、環境の構造と力学を学習する内部シミュレータであり、人工知能の追求において中心的なパラダイムとして現れてきた。
強化学習、ロボット工学、自動運転、ビデオ生成など、急速に進歩しているにもかかわらず、この分野には統一された枠組みが欠けている。
本調査では,4次元にまたがる多軸分類とのギャップについて考察する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:23:24 GMT)
GPIC: A Giant Permissive Image Corpus for Visual Generation [45.9] 約28兆画素の巨大許容画像コーパスであるGPICを紹介する。
GPICは、最先端のビジョンフィルタリングモデルによってキャプションされた多様なインターネットイメージで構成されている。
すべてのGPIC画像は、研究と商業の両方に許可されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:26 GMT)
$R^3$: 3D Reconstruction via Relative Regression [45.7] R3$は、フルコンテキストのオフライン再構築と因果的、バウンドメモリストリーミングの両方をサポートする。
オフラインとストリーミングの両方の設定における評価は、我々の相対的なメカニズムの有効性を検証する。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:02:52 GMT)
A Shared Valence Axis Across Modern LLMs and Human EEG: The Saturation Regularity [45.4] 大規模言語モデル(LLM)は、人間の認知と内部的特徴がますます一致している強力な表現学習者として登場した。
我々は、現代のLLMが人間の脳内の神経表現を理解するためのレンズとして機能するかどうかを考察する。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:42:10 GMT)
On the Practice of Scaling Search Conversion Rate Prediction [45.4] 検索変換率(CVR)予測モデルのスケーリングは,特に高交通環境において課題となる。
本稿では,最新の検索CVR予測モデルを拡張するための効果的なアプローチについて述べる。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:48:19 GMT)
Verifiable Rewards Beyond Math and Code: Lightweight Corpus-Grounded Process Supervision for Factual Question Answering [44.8] 本稿では,ニューラル検証をウィキペディアのコーパスグラウンド信号に置き換える,軽量でプラグイン対応のプロセス報酬を提案する。
命令チューニングされた6つのモデルにまたがる30のセル(モデル、ベンチマーク)で、CorVerはすべてのセルの生のベースラインを改善している。
また、20細胞中18細胞において4つの神経検証基線を許容可能な構成で上回り、4.8から8.4倍の速さで訓練する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:14:37 GMT)
Audio Pirates: Black-box Audio Watermark Removal via Diffusion Priors [44.6] 対象の透かし方式の知識を前提としないブラックボックス型透かし除去攻撃であるDiffEraseを提案する。
DiffEraseは複数のオーディオ領域にまたがる知覚品質を維持しながら、常に透かしを除去する。
これらの知見は,拡散型脅威を考慮した将来の音声透かし設計の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:07:32 GMT)
RadioFormer3D: Weakly Supervised 3D Radio Map Estimation in Low-Altitude Airspace via Generative Modeling [44.6] textbftextitRadioFormer3Dは、弱い監督下でのボリュームスペクトル再構成のための特殊なモデルである。
textitRadioFormer3Dは、既存の代表的なメソッドと比較して、全体的なパフォーマンスが優れている。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:52:48 GMT)
MMTM: Tri-Modal Topic Modeling for Long-Form Video via Similarity-Gated Fusion [44.3] 本稿では,音声認識,音声と視覚の埋め込み,BERTopicクラスタリングを統合した,長文ビデオにおけるトピック発見のためのモジュールパイプラインであるMMTMを紹介する。
我々は,ドイツ語 (Tagesschau) と英語 (NBC) の放送ニュースにおける話題の質を評価する。
パイプラインコードと54時間のマルチモーダルビデオトピックコーパスを,デュアルアノテーションによる視覚評価とLCMによるラベリングによりリリースする。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:12:30 GMT)
CapTalk: Text-Guided Stylization and Speech-Driven 3D Head Animation [44.2] 我々は,話し方と文字感情のテキスト記述と,駆動音声ストリームの両方を入力するモデルを構築した。
我々のモデルは、推論中の動的感情制御をサポートし、ターゲット感情が音声全体にわたって変化するシナリオを処理できる。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:46:11 GMT)
Why Far Looks Up: Probing Spatial Representation in Vision-Language Models [44.0] 視覚言語モデル(VLM)は空間推論ベンチマークにおいて高い性能を達成する。
しかし、これが構造化された3D理解の反映なのか、あるいは自然画像の統計的ショートカットに依存しているのかは不明だ。
空間軸がどのように構成されているかを測定するために,最小のコントラスト対を構成する表現レベル分析フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:18:01 GMT)
Faithful Embeddings of Irregular and Asynchronous Data for Online Log-NCDEs [43.7] 補間および計算に基づく埋め込みは、連続的な観測経路を再構築する。
軽度条件下では, この再建は不要であることを示す。
連続時間モデルの普遍クラスであるLog-NCDEに対して,連続的かつインジェクティブな埋め込みを導入する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:46:11 GMT)
Distributionally Robust Set Representation Learning Under Inference-Time Element Corruption [43.3] 本稿では,分布的に堅牢な最適化フレームワークSW-DRSOを提案する。
SW-DRSOは, 全体的な性能を維持しつつ, 汚損に対する堅牢性を効果的に向上することを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:35:04 GMT)
Does The Way You Plan Matter? An Empirical Study of Planning Representations for LLM Web Agents [43.3] エージェント性能における計画表現の影響を評価するフレームワークであるPlanAheadを紹介する。
まず、WebArenaタスクを3つの難易度に分類し、人間のアノテーションなしで一貫した難易度付けを可能にする。
次に,4つの異なる計画表現を,難易度に分類して体系的に評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:39:49 GMT)
Prompt-Level Reward Specifications for Open-Ended Post-Training [43.2] 訓練後のオープンエンドのメリットは、迅速な成功条件を明確にする報酬である。
本稿では、報酬仕様と報酬仕様を分離するプロンプトレベル報酬仕様フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:52:06 GMT)
AnomalyAgent: Training-Free Agentic Models for Zero-/Few-Shot Anomaly Detection [43.2] 異常検出のためのトレーニング不要なエージェントフレームワークである textbfAnomalyAgent を提案する。
textbf1) は包括的な異常中心のツールセットであり、textbf2) はカスタマイズされたメモリモジュールである。
AnomalyAgent はトレーニング不要な VLM ベースの AD やジェネリックエージェント手法に比べ,性能が大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:05:42 GMT)
EvoRubric: Self-Evolving Rubric-Driven RL for Open-Ended Generation [42.9] EvoRubricは、独創的な共進化型強化学習フレームワークである。
静的な基準や外部のルーリックジェネレータへの依存をなくす。
従来の静的および外部LLM駆動アライメントメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:28:49 GMT)
UniSteer: Text-Guided Flow Matching in Activation Space for Versatile LLM Steering [42.8] アクティベーションに基づく制御は、ペルソナやスタイルといった行動を制御する効果的なパラダイムとして登場した。
残差ストリームのアクティベーションに関する条件分布を学習するテキスト誘導型アクティベーションフローマッチングモデルUniSteerを提案する。
我々は,UniSteerが行動制御,真正性ステアリング,きめ細かい概念ステアリング,マルチ制約命令の追従,アクティベーション空間の分類にまたがる統一インターフェースを提供することを示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:23:29 GMT)
Who Am I? History-Aware Profiles for Student Simulation in Tutoring Dialogues [42.7] 歴史条件付き学生シミュレーションの課題を紹介する。
本研究の目的は,学生の学習履歴の情報を活用することで,生徒の対話を正確に予測することである。
両コンポーネントを強化学習(RL)で訓練し、忠実な学生シミュレーションに最適化されたプロファイルを得る。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:02:51 GMT)
SAM3D-Phys: Towards Multi-Object Interactive Simulation in Real World [42.5] SAM3D-Physは、シーン再構成とSAM3Dの3D先行生成を統合し、物理的にシミュレート可能なオブジェクトを復元するフレームワークである。
完全なオブジェクト形状を復元し、シーン内のポーズと外観を復元することにより、SAM3D-Physは物理シミュレーションに適したクリーンなオブジェクト表現を生成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:07:51 GMT)
PokerSkill: LLMs Can Play Expert-Level Poker without Training or Solvers [42.4] 大規模言語モデル (LLMs) はポーカーの知識が豊富だが、直接プレイするように要求された場合、解法に基づくエージェントよりはるかに低い範囲で実行する。
伝統的なルールベースのポーカーエージェントは解釈可能で、訓練も不要だが、その戦略的な天井は均衡の条件よりはるかに低いままである。
textbfPokerSkillは、このギャップを埋めるトレーニングフリーで解決可能なフレームワークです。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:38:33 GMT)
Why Larger Models Learn More: Effects of Capacity, Interference, and Rare-Task Retention [42.1] より大規模なモデルでは、無限のトレーニングデータであっても、小さなモデルでは学習できないタスクが学習されることが示される。
特に、より小さなモデルでは、ニューロンを高頻度または低複雑性のタスクに割り当て、希少で複雑なタスクでは不十分なソリューションを学ぶ。
次に、より大きなモデルがこのデータ中心のボトルネックを回避し、干渉機構の低下に辿り着くかを評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:02:11 GMT)
Controllable Lung Nodule Synthesis via Histogram-Regularized Latent Diffusion Models [42.1] 拡散に基づく生成モデルは、データ合成に有望な戦略を提供する。
肺結節を全3次元CTボリュームで合成する制御可能な潜在拡散モデルを提案する。
このフレームワークは,定量的な測定値と視覚的チューリングテストの両方を通して,強力なビジュアルリアリズムを実現する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:32:06 GMT)
Majorization precursors to supermodularity and subadditivity on the majorization lattice [42.1] 和-凹関数をダブする凹関数のすべての和は、極大化格子上で超モジュラーかつ部分加法的であることを示す。
これらの不等式をさらに強化し、 (i) これらのエントロピー汎函数は、(ii) タリスエントロピー(したがってシャノンエントロピーも)は、極大化格子上で厳密な超モジュラーであることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:57:58 GMT)
Draft-OPD: On-Policy Distillation for Speculative Draft Models [42.1] 投機的復号化は,提案したトークンを並列に検証した軽量なドラフトモデルとターゲットモデルを組み合わせることで,大規模言語モデル推論を加速させる。
本稿では,安定な継続のために目標支援ロールアウトを利用するDraft-OPDを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:30:22 GMT)
Quantum Mechanics: Problems and Paradoxes [42.0] 本書では、量子力学の多くの問題について論じるが、そのほとんどは通常は議論されていない。
上級の学部生、大学院生、および量子理論の基礎に興味を持つスペシャリスト。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:15:27 GMT)
Eigen-Spike Emergence and Quadratic Equivalents for Conjugate Kernels on Nonlinearly Separable Data [41.3] 我々は、正準非線形分離可能なデータセットの下で、フィードフォワードNNの非線形特徴写像である共役カーネル(CK)を考える。
本研究では,突発的な情報的スパイクを正確に解析することのできる,スパイクされたCK行列に匹敵する頑健な二次構造を開発する。
CK固有ベクトルによる線形分類が可能となる正確なBBP型相転移を導出する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:32:19 GMT)
The Distillation Game: Adaptive Attacks & Efficient Defenses [40.6] 蒸留攻撃はモデルプロバイダのデプロイメントトレードオフを生み出す。
実用性に制約のある教師と適応的な学生とのミニマックスゲームを通して、このトレードオフを研究する。
以上の結果から, 強い蒸留は止まらないことが示唆された。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:47:29 GMT)
LLMSurgeon: Diagnosing Data Mixture of Large Language Models [40.5] 大規模言語モデル(LLM)の事前学習は「デジタルDNA」を構成する
$textbfLLMSurgeon$はDMSをラベルシフトの仮定の下で逆問題とみなす強力なフレームワークである。
$textbfLLMScan$.textbfLLMScan$.textbfLLMScan$.textbfLLMScan$.textbfLLMScan$.textbfLLMScan$は、透明な事前学習混合物を備えたオープンソースのLCMから構築されたレシピを検証可能な評価スイートである。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:53 GMT)
MonoDuo: Using One Robot Arm to Learn Bimanual Policies [40.1] 単腕ロボットのデモと人間のコラボレーションを組み合わせ,双方向操作ポリシーを学習するフレームワークであるMonoDuoについて述べる。
MonoDuoは、片腕ロボットを遠隔操作して、両腕のタスクの片面を実行する。
ボックスリフト,バックパックパッキング,布の折り畳み,ジャケットのジッピング,ハンドオーバープレートの5つのタスクについてMonoDuoを評価した。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:27:38 GMT)
Can It Reach the Generator? Investigating the Survival of Prompt-Injection Attacks in Realistic RAG Settings [40.0] 7つのGEO攻撃を現実的な3段階パイプラインで再評価する。
従来のプロトコルでは,攻撃の有効性が著しく過大評価されていた。
小さなアタックデータセットに微調整された軽量のプロンプトインジェクションガードは、すでにすべてのアタックを検出している。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:52:56 GMT)
Archon: A Unified Multimodal Model for Holistic Digital Human Generation [39.7] Archonは完全に事前訓練された、人間中心の総合的なアバター生成のための統合マルチモーダルモデルである。
7つのモダリティをモダリティ特異的なトークン化器と結合し、同期されたモダリティに基づいて事前訓練されたネイティブな自己回帰統一マルチモーダルモデルである。
モダリティの代替連鎖において、曖昧なクロスモーダルなタスクを段階的思考に分解する「モダリティにおけるシンキング」を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:53:27 GMT)
Reward Learning from Best-of-$N$ Preference Data: Targets, Tradeoffs, and Design Principles [39.2] 我々は、その誘導条件分布による嗜好データの最近の分析をBest-of-N$に専門化する。
独立参照変種に対しては、N$と基底分布の明示的な関数として閉形式報酬対象を導出する。
合成および実選好データに関する実験は、予測されたサンプルサイズとベース分布形状への依存を支持する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:15:57 GMT)
LiveSVG: Zero-Shot SVG Animation via Video Generation [39.0] ビデオ拡散モデルを用いたSVGアニメーション生成のためのゼロショットアプローチであるLiveSVGを紹介する。
LiveSVGは、ベクトル幾何学を明示的に生成されたターゲットビデオに直接適合させる。
また,複雑なマルチオブジェクトシーンのベンチマークであるChallengeSVGを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:23:34 GMT)
FakeVLM-R1: Internalizing Physical Laws via CoT for Synthetic Image Detection [39.0] 本稿では,FakeVLM-R1を提案する。
FakeVLM-R1は高精度で論理的に解釈可能な検出を実現する。
また、既存の手法の実際の画像に対する過剰なリジェクションバイアスを解消する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:13:31 GMT)
Attention as In-Context Empirical Bayes: A Two-Stage View via Particle Dynamics [38.6] オールトーケン汚職下では、最小注意のみの変圧器について検討する。
単一注意ステップは、コンテキストによって定義された経験分布に対して、カーネル重み付き後平均を算出する。
ノイズスケジュールを明示することなく,効果的な遮音効果が得られることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:44:31 GMT)
On the Road to Personalized Code Intelligence: Portraiting and Assisting Developers Based on Their In-IDE Behaviors [38.5] VirtualMEは、開発者の動的プログラミングの振る舞いや好みを継続的に捉え、解釈することによって、開発者をモデル化するために設計された、新しいデータ基盤である。
我々は,VirtualME上で,開発者ペルソナをQ&Aエージェントに統合することで,リポジトリレベルの個別知識Q&Aを実現するソリューションを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:17:08 GMT)
SAAS: Self-Aware Reinforcement Learning for Over-Search Mitigation in Agentic Search [38.5] 自己認識の欠如は、厳密なtextbfover-search を引き起こし、かなりの推論遅延と禁忌な計算コストを引き起こす。
本稿では,探索行動を正確に制御し,精度を損なうことなく,動的自己認識を実現するための新しいRLフレームワークであるSAASを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:45:45 GMT)
Towards Consistent Video Geometry Estimation [38.5] ViGeoは、ビデオシーケンスから空間的に密度が高く時間的に一貫した幾何を復元するためのフィードフォワード基礎モデルである。
統合モデル内でのストリーミング、フルシーケンス、ロングビデオ推論をサポートする。
ViGeoは、オンライン、オフライン、ロングビデオの深さ推定、表面正規推定、ビデオポイントマップ推定など、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:11:17 GMT)
Veda: Scalable Video Diffusion via Distilled Sparse Attention [38.4] 生成品質はスパーシティ比自身ではなく,スパースマスクがフルアテンションのタイルワイズ形状とどの程度よく一致しているかによって決定されることを示す。
本稿では,タイル選択を全注意から明示的な再構築問題として定式化する蒸留スパークアテンションフレームワークであるVedaを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:57:07 GMT)
Diagnosing Harmful Continuation in Answer-Correct Long-CoT Training Traces [38.2] 解答正解長CoTデータにおける閉包後の継続について検討する。
筆者らは,編集者識別後継続後のSFT成績の改善を観察した。
さらに、不確実性や隠蔽状態の進行を通じて、削除後の継続を特徴付ける。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:12:15 GMT)
CrossAlpha: An Annual-Report Benchmark for Cross-Market Factor Research [37.7] CrossAlpha(クロスアルファ)は、クロスマーケットファクター研究のための年次ベンチマークである。
米国、日本、台湾、韓国、香港の企業約3600社、10700件の年次レポートをカバーし、約19万件のファームペアスコアを公表している。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:11:41 GMT)
Exploring Autonomous Agentic Data Engineering for Model Specialization [37.4] 大規模言語モデル (LLM) は一般的なタスクにおいて高いパフォーマンスを示し、特殊なドメインへの適応に苦慮することが多い。
我々は、LSMを自律データエンジニアとして評価するための新しいタスクである textbf Autonomous Agentic Data Engineering を定式化した。
GPT-5.2 は textbf57.29% で学生モデルを改善する訓練カリキュラムを構築している。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:50:10 GMT)
Foundation-Preserving Adaptation via Generalized Rayleigh-Quotient Optimization [37.0] 本稿では,忘れがちな最適化フレームワークであるFoLoRA(Foundation Preserving LoRA)を提案する。
FoLoRAは、プレトレーニングプロキシアクティベーションよりも忘れるペナルティと、下流タスクアクティベーションよりもタスクユーティリティを定義している。
数学、コード、命令の順応による実験は、FoLoRAがベースラインよりも強い保存適応バランスを達成していることを示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:22:31 GMT)
Protecting On-Device AI Inference: A Systematic Review of Attacks and Defence Mechanisms [36.9] 本稿では,デバイス上でのAI推論をターゲットとした脅威とそれに対応する防御機構の総合的なレビューを行う。
調査対象の攻撃論文の4分の1は知的財産権(IP)攻撃に焦点が当てられている。
いくつかの攻撃カテゴリは、攻撃文献のおよそ3分の1を占める敵攻撃など、それらに関連する防衛紙を持っていない。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:44:46 GMT)
Bastion: Budget-Aware Speculative Decoding with Tree-structured Block Diffusion Drafting [36.8] BASTIONは、ツリーベースの拡散ドラフトを備えた、予算対応の投機的デコーディングフレームワークである。
本フレームワークは,(1)経路信頼度によって予測される受理長を推定する受理サロゲート,(2)ハードウェアを意識した屋上モデルのキャリブレーションを行うオンライン遅延推定器,(3)積算検証コストを正当化しなくなるまで木を成長させる適応的最優先拡張の3つの相乗的要素を統合する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:21:34 GMT)
Do Proactive Agents Really Need an LLM to Decide When to Wake and What to Anchor? [36.5] プロアクティブエージェントは、ユーザーアクティビティをテキストとして読み出し、すべてのイベントにLDMを呼び出して行動するかどうかを判断する。
常にオンの信号をテキストではなくグラフ更新として扱う。
1つのフォワードパスは、イベント毎のトリガ確率とエンタリティ毎のルーティングスコアを得る。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:10:32 GMT)
Reasoning-preserved Efficient Distillation of Large Language Models via Activation-aware Initialization [36.2] 本研究では, 大規模言語モデル (LLM) を構造化プルーニングパラメータによって圧縮し, 軽量モジュールを高い訓練効率でチューニングする手法を提案する。
我々は,多段階推論能力の深刻な劣化を同定し,これを推論崩壊と呼ぶ。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:02:22 GMT)
VLM3: Vision Language Models Are Native 3D Learners [36.1] ビジョン言語モデル(VLM)は、統一モデルによって様々なビジョンタスクをプロンプトすることで解決することができる。
3Dの理解は、複雑なタスク固有の設計を持つ専門家の視覚モデルに大きく依存していることが示される。
本稿では,標準VLMが多様な3Dタスクをマスターできる,最もシンプルな設計のスケーラブルなVLM3を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:48:55 GMT)
SANA-Streaming: Real-time Streaming Video Editing with Hybrid Diffusion Transformer [36.0] リアルタイム・ストリーミング・ビデオ編集はライブ・ブロードキャストやゲームといったインタラクティブ・アプリケーションにとって重要である。
SANA-Streamingは、高解像度でリアルタイムなストリーミングビデオ編集のためのシステムアルゴリズムを共同設計したフレームワークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:17 GMT)
Counterfactual Graph for Multi-Agent LLM Calibration [35.9] コミュニケーションは、相関する失敗と偽の合意をもたらす可能性があるため、同じ投票シェアは、あるトポロジでは信頼できる合意を反映するが、別のトポロジでは過度な信頼を反映する可能性がある。
CAGE-CAL はマルチエージェント LLM のエージェントグラフキャリブレーションフレームワークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:16:29 GMT)
OmniMem: Scalable and Adaptive Memory Retrieval for Long Video Generation [35.9] 本稿では,履歴キャッシュ上でスパースKV検索を行う,明示的なフルレンジメモリ検索フレームワークを提案する。
長時間のビデオ生成の実験では、OmniMemはDynamic Degreeを52.3%改善した。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:56:00 GMT)
Geometry-Guided Modeling of Foundation Features Enables Generalizable Object Shape Deformation Learning [35.9] 対象の観測値にマッチするカテゴリレベルの形状テンプレートを明示的に変形させることで、3Dオブジェクトを再構成する一般化可能な変形学習フレームワークを提案する。
提案手法は, 形状の多様性と多様な視点の取り扱いにおいて, 最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:22:57 GMT)
Before the Shutter: Aesthetic and Actionable Portrait Photography Planning in 3D Scenes [35.6] 人間のポーズ, カメラ, 照明, 露光などを生成する3Dの美的肖像画計画について紹介する。
本手法は,撮影時間,被写体関係,ポートレート関連照明構造を表現した写真シーングラフを構築する。
以上の結果から, 撮影後補正から撮影前画像作成への道筋が示唆された。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:55:09 GMT)
Boosting Zero-Shot 3D Style Transfer with 2D Pre-trained Priors [35.5] 任意のスタイル画像が与えられた3Dシーンの多視点一貫したスタイル化ビューを生成することができるゼロショット3Dスタイル転送に着目する。
私たちの中核となる考え方は、大規模な2D画像データセットで事前訓練されたデコーダを3Dスタイルの転送パイプラインに統合することです。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:14:23 GMT)
Evaluating Parameter Transfer in FALQON Across Graph Families [35.2] 転送成功は、ドナーではなく、受信者グラフによって決定されることを示す。
パフォーマンスはドナーサイズに対して非常に回復力があり、8ノードドナーはより大きなインスタンスにマッチする。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:31:36 GMT)
Score Broadcast and Decorrelation: A General Framework for Broadcast-Based Credit Assignment [35.0] 各種損失の一般的な家族を対象とした放送型クレジット代入の原則的枠組みを導入する。
エラーブロードキャストは、重量輸送なしで隠れた層に出力情報を送信するバックプロパゲーションに代わる生物学的に妥当な代替手段である。
我々は,クロスエントロピーのケースを明示的に導き,許容損失クラスを特徴付けるとともに,放送信号を強化するスコアベクトル展開手法を導入する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:38:28 GMT)
DMC-CF: Dynamic Multimodal CounterFactual QA benchmark for Causal Reasoning [35.0] マルチモーダル言語モデル(MLLM)は、ますます強力なマルチモーダル機能を示している。
近年,多くのマルチモーダル因果推論データセットが提案されている。
これらのデータセットは、スケールに制限されているか、合成画像やビデオ、漫画ベースのコンテンツ、あるいは他の非現実的なマルチモーダルソースから構築されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:20:41 GMT)
Reinforcing Few-step Generators via Reward-Tilted Distribution Matching [34.9] RTDMD (Reward-Tilted Distribution Matching Distillation) を提案する。
報奨型教師分布へのKL分散の最小化は,自然に分布マッチング項と報奨項に分解されることを示す。
SD3、SD3.5、FLUX.2の実験は、RTDMDが嗜好、美学、作曲のメトリクスをまたいだ新しい最先端の結果を確立することを示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:54:16 GMT)
Fisher-Preserving Guidance: Training-Free Manifold Constraints for Safe Diffusion Control [34.6] 拡散モデルは視覚ナビゲーションにおけるウェイポイント予測に有効であるが、標準サンプリングとテスト時間ガイダンスは信頼性の低い軌道を生成することができる。
本研究では,大規模な漁獲量削減を目的としたトレーニングフリー推論手法である,外部製品スパン投影による魚介類保存誘導手法を提案する。
提案手法は,低ランクのジャコビアン因子分解によるフィッシャー保存更新を計算し,ステップ毎に1回だけバックワードパスを要し,リアルタイム使用を可能にする。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:47:31 GMT)
LoopFM: Learning frOm HistOrical RePresentations of Foundation Model for Recommendation [34.6] LoopFMは、FM中間埋め込みを入力として構成することで、高帯域転送チャネルを開くフレームワークである。
産業規模のシステムでは、LoopFMはKD上の知識伝達比を約2倍にする。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:59:46 GMT)
Quantum Implicit-Explicit Schemes for Multiscale Ordinary and Partial Differential Equations via Schrödingerization [34.0] 我々は、多スケールの常微分方程式と偏微分方程式に対する量子暗黙指数(IMEX)スキームを提案する。
提案手法の重要な要素は,古典的IMEXスキームの連続時間定式化である。
我々は、量子コンピュータ上でIMEXスキームを実装するためにSchrdingerizationフレームワークを使用している。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:17:33 GMT)
ESAM++: Efficient Online 3D Perception on the Edge [34.0] ESAM++は、GPUアクセラレーションなしでエッジデバイスに適したオンライン3Dシーン認識のための軽量でスケーラブルな代替手段である。
本手法では, ストリーミング3Dポイントクラウドから, マルチスケールの幾何学的特徴を効率的にキャプチャする3次元スパース特徴ピラミッドネットワーク(SFPN)を提案する。
提案モデルでは,ESAMの2倍のモデルサイズで最大3倍の高速化を実現し,エッジデバイスへの実用的展開を実現している。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:29:02 GMT)
UI-KOBE: Knowledge-Oriented Behavior Exploration for Lightweight Graph-Guided GUI Agents [33.9] アプリケーション固有のグラフ知識を再利用して軽量なモバイルGUIエージェントを改善するフレームワークを提案する。
アプリ固有のグラフガイダンスで実行時の決定をサポートすることで、UI-KOBEはエンドツーエンドのGUI計画の負担を軽減する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:49:09 GMT)
Cycle Consistency in Video Object-Centric Learning [33.8] 自己監督型ビデオオブジェクト中心学習は、異なるオブジェクトを発見し、時間をかけて関連付けることを目的としている。
Cycle Consistency (CC) はOCLの潜在スロット空間に因果的あるいは明示的に適用できない。
本稿では,周期整合性制約を制約付きスロット空間から連続再構成多様体へシフトさせるImplicit Cycle Consistency (ICC)を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:45:24 GMT)
Graph automorphisms to obtain Clifford symmetries in open and closed qudit models [33.8] 一般キューディシステム上でクリフォード対称性を得るアルゴリズムを提供する。
クリフォード対称性のグラフ自己同型表現は開量子系に拡張可能であることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:00:10 GMT)
Kernel Renormalization in Bayesian Deep Neural Networks: the Equivalent Wishart Ansatz in the Proportional Regime [33.8] 固定深さ$L$の多層パーセプトロン(MLP)の性能を任意の高次元データ上で予測する有効な近似手法を提案する。
比例極限における強い表現学習でさえ、最低でも$L$の順序パラメータで符号化され、自己整合的に決定される。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:49:54 GMT)
Beyond Bilingual Transfer: Multilingual Code-Switching in Instruction Tuning [33.7] 英語,日本語,韓国語,中国語の4言語にまたがる多言語コードスイッチング指導について検討する。
実験の結果,単純な文レベルの多言語CSDは4言語すべてで平均多言語性能を一貫して向上することがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:03:52 GMT)
Learning to Extrapolate to New Tasks: A Relational Approach to Task Extrapolation [33.7] Task Extrapolator (RTE) は、新しいタスクへの体系的な外挿を可能にするアルゴリズムである。
RTEは、各ターゲットタスクを既知のアンカータスクに分解することで、このアイデアを運用する。
RTEは、新しい未知のタスクに対する外挿に関する既存のアプローチを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:59:33 GMT)
On Effectiveness and Efficiency of Agentic Tool-calling and RL Training [33.5] 本稿では,2つの相補的軸に沿ったツールコールについて検討する。
結果が、小さく、しばしば文書化されていない実装選択に非常に敏感であることを示します。
本稿では,RLベースのツールコール訓練を加速し,性能を低下させることなくウォールクロックの大幅な高速化を実現する2つの手法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:21:47 GMT)
LARK: Learnability-Grounded Trajectory Selection for Efficient Reasoning Distillation [33.3] 我々は、軌道選択を推論する学習容易化手法であるLARKを提案する。
LARKの中核は学習可能性係数$$であり、学生のトレーニング損失が減少する速度を特徴付ける。
LARKは複数のベースモデルと推論タスクでデータ選択ベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:11:13 GMT)
AsyncTool: Evaluating the Asynchronous Function Calling Capability under Multi-Task Scenarios [33.2] 大言語モデル(LLM)ベースのエージェントは、複雑なタスクを解決するために外部ツールを使用することで、強力な能力を示している。
現実世界のアプリケーションでは、複数のタスクを同時に実行する必要があり、全体的な効率性は、ツールのレスポンスを待っている間にエージェントがアイドルタイムを使えるかどうかに依存する。
我々は,対話型マルチタスクツール使用環境におけるLLMベースのエージェントを遅延ツールフィードバックで評価するためのベンチマークであるAsyncToolを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:56:15 GMT)
Rethinking Stepwise Model Routing: A Cost-Efficient Table Reasoning Perspective [33.0] 本稿では,効率的なテーブル推論のためのテーブル対応段階的ルーティングフレームワークであるEcoTabを提案する。
EcoTabは高いベースラインを一貫して上回り、精度と効率のバランスが良くなることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:49:10 GMT)
Mitigating State Aliasing in Vision-Language-Action Models via Inverse Dynamics Learning [32.6] 本稿では,VLA(Vision-Language-Action)視覚エンコーダを直接監督する補助目的として,逆ダイナミクス学習を導入する。
本研究の目的は、現在の観測と将来の観測のアクションを予測することにより、エンコーダが低レベルの動作を決定する細粒度の視覚的特徴を捉えることを奨励する。
CALVIN ABC-DとSimplerEnvの実験では、様々なVLAベースラインで一貫した利得を示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:22:49 GMT)
Attention-based optimizer for symmetry finding [32.6] ハミルトンのパウリ対称性を探索する最適化フレームワークを提案する。
我々のフレームワークは、パウリ文字列間のペアワイドおよび高階相関を符号化するために自己アテンションを用いる。
提案手法は, 最先端戦略と比較して, ほぼ決定論的確率で成功し, 極めて有利であることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:00:13 GMT)
Do Physics Foundation Models Learn Generalizable Physics? A Bias-Aware Benchmark Across Physical Regimes and Distribution Shifts [32.6] 最近の物理基礎モデルでは、一般的な時間予測能力が主張されているが、その評価は固定されたトレーニング分布の下で1つの平均スコアに崩壊する。
これにより、モデルが一般的な物理力学を学習したのか、特定の設定下でのみうまく機能したのかを判断することが困難になる。
8つの物理ダイナミックス3のトレーニングデータ混合と、動的スケールと初期条件の複雑さによって誘導される25のテストレギュレーションを用いたベンチマークを構築した。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:08:57 GMT)
Calibrated Preference Learning: The Case of Label Ranking [32.5] ラベルランキングのキャリブレーションを形式化し、フルランク、サブランク、トップkランキングを含む概念階層を開発する。
人気のあるラベルランキングモデルは、しばしば分類が不十分で、サブランクとトップランクのメトリクスにかなりの違いがある。
我々のフレームワークをRLHF報酬モデルに適用すると、キャリブレーションは強く相関するが、ベンチマークの精度と完全に相関しないことがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:18:21 GMT)
Trust, Geometry, and Rules: A Credibility-Aware Reinforcement Learning Framework for Safe USV Navigation under Uncertainty [32.3] 本稿では,信頼性を意識した学習,幾何的安全遮蔽,連続ルール認識の埋め込みを組み込んだフレームワークを提案する。
本研究は,直観的不整合に対するトレーニングの堅牢性の向上と衝突回避性の向上,およびベースラインに対するCOLREGのコンプライアンスについて述べる。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:48:10 GMT)
HTAM: Hierarchical Transition-Attended Memory for Operator Optimization [32.2] 近年のLLMベースのコード生成では,演算子の自動生成が期待できるが,演算子最適化はハードウェア対応の検索問題のままである。
粗いヒントは再利用可能であるが実行が困難であるのに対して、詳細な記憶は動作可能であるが検索空間を拡大し、最適化のボトルネックを曖昧にしている。
本稿では,LLMに基づく演算子最適化のための粗大なフレームワークであるHTAMを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:29:01 GMT)
OptSkills: Learning Generalizable Optimization Skills from Problem Archetypes via Cluster-Based Distillation [32.0] 我々は,最適化モデリングと問題解決のための古型中心型スキル学習・推論エージェントシステムであるOpsSkillsを提案する。
より堅牢な一般化を実現するため,本システムでは,表面の物語よりも根底にあるアーチタイプによって問題をクラスタリングする。
本システムは,様々な問題タイプやシナリオを含むデータセットに対して,最先端のマイクロ平均精度68.27%を達成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:07:28 GMT)
When AI Meets Wall Street: A Survey on Trustworthy AI in Fintech [32.0] 我々は、金融AIのための統一的でライフサイクル中心的でメカニズム駆動のフレームワークを提案する。
金融AIをトレーニング、更新、デプロイメント、推論、運用、監視、フィードバックの3つのライフサイクルステージに分割します。
各サブタイプについて、アルゴリズム戦略、実現可能性制約、ステルスと永続性、下流の財務効果を分析します。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:10:04 GMT)
Usability Analysis of Configurator User Interfaces with Multimodal Large Language Models [31.8] 本稿では,ユーザインタフェース(UI)のスケーラブルかつ半自動解析におけるMLLMの利用について検討する。
文献から18種類のユーザビリティ基準を適用し、16の実世界のMLLM分析にこれらの基準を適用した。
各基準は個別に評価され、ユーザビリティ問題や実行可能な改善提案に対する深刻度評価を生成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:49:16 GMT)
Constrained Flow Optimization via Sequential Fine Tuning for Molecular Design [31.6] 制約付き生成最適化(CFO)のためのフレームワークを提案する。
CFOは、元の問題を逐次微調整に還元することで、報酬と制約満足度をバランスさせる。
我々は,制約付き生成最適化と制約付き生成のための収束保証をCFOを介して提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:02:57 GMT)
Learnable Assessment Skills for LLM-based Automated Scoring: Rubric Construction via Iterative Optimization [31.4] 本稿では,スキルを固定された足場と学習可能なアイテムに依存しないルールに分解する反復的フレームワークを提案する。
クロスイテム転送実験は、学習スキルが一般化可能なパターンとアイテム固有のパターンの両方をキャプチャすることを示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:50:07 GMT)
OVA-IB: One vs All Information Bottleneck for Multi-Modal Alignment [31.4] コントラスト学習はペアビューやモダリティの整列に有効であるが、2つのモダリティを超えたアライメントは非自明なままである。
任意のモダリティアライメントのためのインフォメーション・ボトルネック・フレームワークであるOVA-IBを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:23:07 GMT)
Self-Trained Verification for Training- and Test-Time Self-Improvement [31.2] 自己学習検証(STV)は、自己生成エラーをキャッチするためにモデルを訓練する。
STVは、ハード数学の精度をおよそ2倍にし、科学的推論タスクの14倍に上げる。
難しい問題に対する推論の次のフロンティアは、トレーニングの方法と検証の方法にあります。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:40:45 GMT)
A Full-Pipeline Framework for Evaluating Membership Inference Attacks in Machine Learning [31.1] 我々は、機械学習パイプライン全体にわたるプライバシーリスクを特徴付ける包括的な評価フレームワークを導入する。
我々のフレームワークは、幅広いトレーニング構成で最先端のMIAを厳格に評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:48:22 GMT)
REST3D: Reconstructing Physically Stable 3D Scenes from a Single Image [31.1] 1枚のRGB画像から物理的に安定な3Dシーンを再構成することで、カジュアル画像をシミュレーション可能なデジタルアセットに変換することができる。
物理的シーン理解と物理制約のある精細化を統合することで、物理的に安定な3Dシーンを再構成できる単一画像再構成フレームワークであるREST3Dを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:01 GMT)
Reinforcement Learning with Robust Rubric Rewards [30.8] 本稿では,ロバスト・リワードによる強化学習(textRLR3$)を提案し,RLVRをタスクレベルの検証から基準レベルの検証まで拡張する。
$textRLR3$は2つの実行パスを通してインスタンス固有のルーリックをルーティングする。
textRLR3$はRLVRを一貫して上回り、ベースモデルよりも4.7ポイント向上し、公式のインストラクション・ツー・シンキングモデルギャップを超えた。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:11:03 GMT)
Test Time Training for Supervised Causal Learning [30.7] Supervised Causal Learning (SCL) は、それを教師付き学習問題とみなすことによって因果発見において有望であることを示す。
合成ベンチマークと実世界のデータ間の顕著なパフォーマンスギャップ、分散シフトに対する脆弱性、構成一般化における失敗の3つの制限を明らかにした。
本稿では,任意のテストインスタンスに明示的に整合したトレーニングセットを動的に生成する新しいフレームワークであるTTT-SCLを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:39:49 GMT)
ExCAM: Explainable Cultural Awareness Metrics [30.6] ExCAMは、インストラクションとアウトプットのペアにおける文化的エラーを特定し、評価し、説明する。
複数のベースラインと比較して、ExCAMはバランスの取れたテストセット上で最大80%の精度でエラー検出率を達成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:21:36 GMT)
Native Audio-Visual Alignment for Generation [30.6] 共同音声-ビデオ生成は、時間的同期と意味的コヒーレントな視覚-音響コンテンツを合成することを目的としている。
共同音声・ビデオ生成のためのNative Audio-Visual AlignmentフレームワークであるNAVAを提案する。
NAVAは6.3Bパラメータのみを使用して、優れたビデオ品質、正確なオーディオ-視覚同期、競合するオーディオ品質、より強力な参照-音色制御を実現する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:21:45 GMT)
Conformal Certification of Reasoning Trace Prefixes [30.4] CROP(Conformal Reasoning Output Prefixes)は,クリーンアノテート認証のためのバリデーション非依存の校正手順である。
CROPをオーバー・アンド・アンダー・ホールドし、有効な中間的推論を保ち、下流の補修精度を向上させることを実証する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:31:42 GMT)
Rec-Distill: An Industrial Distillation Pipeline for Large-Scale Recommendation Models [30.3] Rec-Distillは産業用蒸留パイプラインであり、大規模レコメンデーションモデルの性能向上を効率的なサービスモデルに転送する。
筆者らのフレームワークは,24Bの高密度パラメータと20Kの行動列長を教師モデルに拡張し,軽量な生徒が教師の獲得したかなりの部分を回復することを可能にする。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:59:07 GMT)
MusTBENCH: Benchmarking and Advancing Temporal Grounding in Music LLMs [30.1] LALMの時間的接地を評価するために,音楽専門家による評価ベンチマークであるMusTBENCHを導入する。
音楽エンコーダ適応,LLM適応,LLM教師ありファインチューニング,RLに基づく最適化を対象とする,新しい4段階の時間的最適化手法であるMusTを提案する。
MusTBENCHの実験では、既存のLALMは正確な時間的接地に苦しむ一方で、Mustは強いベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:28:16 GMT)
Rethinking Post-Training Recipes for Multimodal Time-Series Forecasting [30.0] 我々は,マルチモーダルな時系列予測手法について論じる。
Supervised Fine-Tuning (SFT) と Supervisement Learning with Verifiable Rewards (RLVR) を組み合わせたポストトレーニングレシピであるPostTimeを紹介する。
Gemma-3-4B LLMとTimesFM-2.5 TSFMを用いて,TimesXマルチモーダル予測ベンチマークで本手法を評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:52:28 GMT)
LongDS-Bench: On the Failure of Long-Horizon Agentic Data Analysis [29.9] LongDSは、ロングホライズン、マルチターンデータ分析のためのベンチマークである。
エージェントは進化する分析状態を維持し、更新し、復元し、構成しなければならない。
LongDSは現実世界のKaggleノートブックから構築された68のタスクで構成されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:00:20 GMT)
Access Sets Matter: Budgeting Expert Reads for Scalable Weight-Space Model Merging [29.3] MergePipeは、重量空間モデルマージのための予算対応実行層である。
エキスパート読み取りのI/Oを桁違いに減らし、最大で11倍のスピードアップを達成できる。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:15:38 GMT)
CommunityFact: A Dynamic, Multilingual, Multi-domain Benchmark for Misinformation Detection in the Wild [29.2] CommunityFactは、誤情報検出のためのリフレッシュ可能なベンチマークである。
このリリースには、5つの言語と2つのドメインにわたる15,992のスタンドアロンクレームが含まれている。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:09:19 GMT)
ReasonOps: Operator Segmentation for LLM Reasoning Traces [29.2] 大きな推論モデルからのチェーンオブシントトレースは、数万のトークンにまたがる可能性がある。
ReasonOpsは教師なし, 表現力のない, 思考の連鎖をアノテートする手法である。
我々は、8つの推論ベンチマークで6つのファミリーにまたがる12のLLMから44,662のトレースを分析した。
論文参考訳(メタデータ) (Thu, 28 May 2026 00:08:35 GMT)
How LoRA Remembers? A Parametric Memory Law for LLM Finetuning [29.1] 本稿では、損失削減デルタLを有効パラメータとシーケンス長にリンクするロバスト電力法であるParametric Memory Lawを導入する。
トークンレベルでは、きめ細かい分析により決定論的相転移が明らかとなり、p > 0.5 の予測確率がリコールに十分な条件であることを示す。
MemFTは閾値誘導最適化戦略であり、トレーニング予算をサブ閾値トークンに動的に再分配する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:22:24 GMT)
When Should Models Change Their Minds? Contextual Belief Management in Large Language Models [29.0] ロングホライゾン相互作用は、蓄積情報を管理するために言語モデルを必要とする。
我々はこの課題をtextbfContextual Belief Management (CBM) として研究する。
CBMは、タスク非関連ノイズを分離しながら、正式な証拠と一致した予測された信念状態を維持している。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:52:04 GMT)
Instance-dependent Stochastic Lipschitz bandit [28.9] 学習者が未知のリプシッツ関数をドメイン上で逐次最大化するリプシッツバンドイット問題について検討する。
既存の後悔境界は最悪の場合であり、$tilde left (Td+1/d+2right )$としてスケールするか、ズーム次元$d_z$で適応する。
我々は、そのレベル集合上の$f$の準最適ギャップの積分を通して後悔を特徴づける分析とアルゴリズムを提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:46:30 GMT)
Robust and Generalizable Safety Steering for Text-to-Image Diffusion Transformers [28.8] 安全なステアリングフレームワークであるSafeDIGを提案する。
FLUX.1 DevとStable Diffusion 3.5 Largeの実験は、SafeDIGが一貫してターゲットドメインと全体的な安全でない生成率を減らすことを示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:00:18 GMT)
AdvScene: Rethinking Adversarial Patch Evaluation Through Scene Robustness [28.7] 本稿では, 実環境における敵パッチの環境ロバスト性を測定するためのフレームワークであるAdvSceneを紹介する。
我々はこれを制約付きリフト問題として定式化し、横断的な曖昧さを解決するAPSE(Adversarial Patch-to-Scene Embedding)を導入する。
以上の結果から,AdvSceneは既存の画像中心やシミュレーターによる評価では捉えられない攻撃効果のシーン依存的な変化を明らかにした。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:11:35 GMT)
IP-Adapter Is All You Need: Towards Fine-Tuning-Free Diffusion-Based Talking Face Generation [28.6] 安定拡散とIP-アダプタの事前訓練による重み付けにより,直接音声合成を行うファインタニングフリーのパラダイムを提案する。
本手法はリップシンク精度と視覚的忠実度の両方において既存のSOTA手法より優れる。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:00:37 GMT)
Geometry Matters: 3D Foundation Priors for Learning Semantic Correspondence [28.5] 意味的対応推定のための3D認識後学習フレームワークを提案する。
我々はSAM3Dを用いてオブジェクトの形状とポーズを推定し、レンダリング・アンド・コンペア最適化によりポーズを洗練する。
結果として得られる幾何学的特徴マップは、DINOとStable Diffusionの特徴を補完する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:37:59 GMT)
S2MDF: A Plug-And-Play Layer for Intersection-Free Multi-Object Signed Distance Fields [28.5] 本稿では,S2MDFについて述べる。S2MDFは軽量なプラグアンドプレイモジュールである。
複数の最先端合成法の実験により、S2MDFは、再構成品質を維持しながら交差点を数値精度に還元し、既存の緩和戦略より優れていることが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:10:11 GMT)
CONCAT: Consensus- and Confidence-Driven Ad Hoc Teaming for Efficient LLM-Based Multi-Agent Systems [28.5] CONCATは、ConsensusとConfidence-driven Adhoc Teamingをベースにした、トレーニングフリーのマルチエージェントコラボレーションフレームワークである。
3つのLLMと3つのベンチマーク実験により、CONCATはLLM-Debateよりも最大2.02倍高い効率(精度/レイテンシ比)を達成することが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:47:54 GMT)
DirectorBench: Diagnosing Long-Form Video Generation with Personalized Multi-Agent Evaluation [28.5] DirectorBenchは、長期ビデオ生成のためのパーソナライズされたマルチエージェント診断ベンチマークである。
DirectorBenchはチェックポイントレベルのボトルネックをローカライズし、プロファイル認識評価をサポートする。
DirectorBenchは人間の認識できる品質の違いを捉え、ワークフローとプロファイルに依存した障害モードを明らかにする。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:35:34 GMT)
Make LLM Learn to Synthesize from Streaming Experiences through Feedback [28.3] 合成タスクが順次到着し、過去のタスクから経験することで、将来的な合成のための情報信号を提供する新しい設定であるStream Synthを紹介する。
タスクストリーム上で再利用可能な合成体験を合成モデルで取得できるフレームワークであるSynLearnerを提案する。
実験の結果、SynLearnerは以前のタスクからの経験を効果的に活用し、後続のタスクでの合成性能を改善し、一貫したクロスタスク転送性を示すことがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:51:58 GMT)
Mask the Target: A Plug-and-Play Regularizer Against LoRA Forgetting [28.3] Low-Rank Adaptation (LoRA)は、大規模言語モデルに適応するための最も広く使われている微調整機構の1つである。
適応分布がモデルのオリジナルのトレーニングやアライメントの分布と大きく異なる場合,この考え方は特に深刻なものとなる。
この制約に触発されて、我々はLoRAベースの適応が、リプレイフリー環境で忘れることに対する新しい学習のバランスをいかに改善するかを考察した。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:22:39 GMT)
Future Forcing: Future-aware Training-free KV Cache Policy for Autoregressive Video Generation [28.3] オートレグレッシブ(AR)ビデオ生成は,長距離ビデオ合成において有望なパラダイムとして浮上している。
KVキャッシュ圧縮法は、重要とされるビデオトークンのみを選択的に保持することでこの問題を軽減する。
本稿では,ARビデオ生成のためのトレーニング不要な将来対応KVキャッシュポリシであるFuture Forcingを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:30:04 GMT)
From GPS Points to Travel Patterns: Flexible and Semantic Trajectory Generation with LLMs [28.3] 軌道生成は、プライバシーリスクを軽減するために現実的なデータを合成することで、有望な代替手段を提供する。
既存の手法では、トラベルパターンを明示的に捉えることができず、単一の条件下では固定長の軌道しか生成できない。
我々は、textbfHierarchicalにtextbfTravelパターンを生成し、次に大きな言語モデルを用いてGPS textbfPointsを生成するtextbfHTPを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:39:40 GMT)
CausaLab: A Scalable Environment for Interactive Causal Discovery Toward AI Scientists [28.3] LLMエージェントによる対話的因果発見を評価するスケーラブルな環境であるCausaLabを紹介する。
以前の評価とは異なり、CausaLabは、エージェントが因果的証拠を用いて問題を解くことができるかどうか、そしてその答えが忠実に回復された因果的メカニズムに根ざされているかどうかを評価している。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:38:42 GMT)
Large Depth Completion Model from Sparse Observations [28.0] LDCM(Large Depth Completion Model, Large Depth Completion Model)は、スパース観測による単視点距離深度推定のための、シンプルで効果的で堅牢なフレームワークである。
LDCMは変圧器を用いて計量精度の高い密度深度マップを生成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:50:29 GMT)
CLUBench: A Clustering Benchmark [27.9] CLUBenchは、131データセットで評価されたさまざまな原則の24のアルゴリズムからなる包括的なクラスタリングベンチマークである。
評価されたディープクラスタリング手法は, 従来のクラスタリングアルゴリズムと比較して, 有意な優位性は示さない。
画像とテキストのクラスタリングタスクでは、事前訓練された埋め込みと従来のクラスタリングアルゴリズムを組み合わせることで、効率的かつ効率的なクラスタリングが可能になる。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:45:37 GMT)
VideoFDB: Evaluating Full-Duplex Vision-Speech Capabilities in Conversational Agents [27.8] 人間とエージェントの対話を成功させるためには、完全な視覚的会話をモデル化する必要がある。
AV2AVインタラクションの完全なオーディオヴィジュアルキャプションのための最初のベンチマークとして、VideoFDBは体系的な評価と進歩の基礎を確立している。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:20:01 GMT)
DeepSurvey: Enhancing Analytical Depth and Citation Reliability in Automated Survey Generation [27.7] DeepSurveyはフルテキストの論文から構造化された基調講演を抽出し、クラスタリングと比較分析を通じて横断的な関係をモデル化する。
これは、エビデンスに制約された引用代入を強制し、多粒度エージェントリファインメントを展開して、引用-蓄積アライメントを検証する。
実験の結果、DeepSurveyは最高のコンテンツスコア(8.644/10)と引用品質(12.3%と9.3%)を達成した。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:40:10 GMT)
Demystifying Data Organization for Enhanced LLM Training [27.6] 大規模言語モデル(LLM)は様々な分野に革命をもたらしたが、その訓練効率は効果的なデータキュレーションに大きく依存している。
本稿では,データ効率向上のために作成された事前計算されたサンプルレベルのスコアを再利用することで,データ組織がLLMトレーニングに与える影響について検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:58:53 GMT)
HoliTok:A Coutinuous Holistic Tokenization with Robust Dual Capabilities of Speech Generation and Understanding [27.5] 本稿では,一元的生成に基づくモデリングのための連続的ホロスティック音声トークン化モデルを提案する。
HoliTokは48kHzの音声を128次元のラテントの25Hzのコンパクトなシーケンスに符号化する。
実験により,HoliTokは競争力のある再現性を実現し,高品質で制御可能な合成のための生成的学習性を向上させることが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:55:19 GMT)
FinGuard: Detecting Financial Regulatory Non-Compliance in LLM Interactions [27.4] 既存のガードモデルは、特定の金融規制に根ざした一般的な損害と見落としに関する違反に基づいて構築されている。
このギャップを規制文書を直接運用する規制駆動のパイプラインで解決する。
textbfFinGuard-Benchを、金融規制コンプライアンス検出のための最初のベンチマークとしてリリースしました。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:20:45 GMT)
EvoGM: Learning to Merge LLMs via Evolutionary Generative Optimization [27.3] 本稿では、学習可能な生成モデルを用いてマージ係数を最適化するフレームワークであるEvoGM(Evolutionary Generative Merging)を提案する。
EvoGMは、サイクル一貫性学習を備えたデュアルジェネレータアーキテクチャを備え、有望なマージ候補を適応的にサンプリングし、精査する。
さまざまなベンチマークによる実験によると、EvoGMは最先端のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:22:54 GMT)
Can AI Weather Models Predict Beyond Two Weeks? A Quantitative Benchmark and Analysis of Long Rollouts [27.2] この研究は、これらの失敗を爆破、漂流、季節性の3つの異なる体制に分類することで、正式な分類の欠如に対処する。
解析の結果,安定性は小時間スケールの処理に左右されることが明らかとなった。
これらのモデルを単にオウムに還元するよりは、安定なモデルが初期状態に条件付けされた独自の気象軌跡を生成することが分かる。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:29:33 GMT)
CRITIC-R1: Learning Structured Critics for Retrieval-Augmented Generation [27.1] CRITIC-R1は、強化学習(RL)を用いた明示的な誤り診断問題としてRAG批判を定式化し、学習する構造化批評家フレームワークである。
我々のフレームワークは、一般的なRAGエラーを、判定、エラー位置、推論分析、修正生成を含む複数の診断次元に分類する。
5つのQAベンチマークでの実験では、CRITIC-R1は強力なRAGベースラインよりも応答品質を一貫して改善している。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:11:36 GMT)
YoCausal: How Far is Video Generation from World Model? A Causality Perspective [26.9] 本稿では,認知科学の Violation of expectation (VoE) パラダイムにインスパイアされた2段階のベンチマークであるYoCausalを紹介する。
レベル1は逆サプライズ指数(Reverse Surprise Index、RSI)を導入している。
レベル2では、VLMを活用してデータセットを因果サブセットと非因果サブセットに階層化するCausality Cognition Index(CCI)が導入されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:51 GMT)
Tailoring the Curriculum: Student-Centered Reasoning Distillation via Dynamic Data-Model Compatibility [26.8] 推論蒸留は、大規模な言語モデルからより小さなものへの複雑な推論能力を伝達する。
本稿では,データモデル適合性(Data-Model Compatibility, DMC)指標について述べる。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:41:29 GMT)
Learning to Perceive the World Through Control: Empowerment-Based Representation Learning [26.8] エンパワーメントは、エージェントが世界の暗黙的なコントロール中心のモデルを学ぶのに役立ちます。
我々の分析は、受動的データセットからではなく、相互作用を通して表現を学習することの重要性を強調している。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:28:20 GMT)
OOD-GraphLLM: Graph Large Language Model for Out-of-Distribution Generalized Drug Synergy Prediction [26.8] 本研究は,グラフ大言語モデルによる薬物相乗効果予測のアウト・オブ・ディストリビューションを初めて検討する。
OOD-GraphLLMはO.O.D.設定下で薬物相乗効果を正確に予測できる新しいグラフLLMフレームワークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:12:48 GMT)
From Prompts to Context: An Ontology-Driven Framework for Human-Generative AI Collaboration [26.7] 本稿では,人間生成AIコラボレーションを表現するオントロジー駆動型フレームワークを提案する。
その中核となるコンポーネントであるContextual Collaboration AI Ontologyは、コラボレーションの重要な要素を、共有機械解釈可能な語彙としてモデル化している。
我々は、要求分析、設計、実装、そしてテストの間で、このフレームワークがコラボレーションエピソードの表現とドキュメントをどのようにサポートするかを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:35:59 GMT)
SEAL: Can Saturated Benchmarks Be Revived by LLM-as-a-Meta-Judge? [26.7] SEALは飽和ベンチマークから遅延ランキング信号を抽出するための自己改善評価プロトコルである。
我々は、コード生成、数学的推論、知識集約型質問応答、ツール使用エージェントタスク完了を含む複数の飽和ベンチマーク上でSEALを評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:46:54 GMT)
Formalizing Mathematics at Scale [26.7] AutoformBotは、正式な検証ツール、依存性対応タスクスケジューリング、協調バージョン管理を備えた数千のLLMエージェントをオーケストレーションする。
Atlasは45,000以上のLean 4宣言と5万行のコードからなる検証済みのライブラリです。
結果は,大学院レベルの数学の中核的内容の大規模化は,現在,経済的かつ技術的に実現可能であることを示唆している。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:00:22 GMT)
GDSD: Reinforcement Learning as Guided Denoiser Self-Distillation for Diffusion Language Models [26.6] そこで我々は,dLLMの脱ノイズ剤をアドバンテージ誘導型自己教師から蒸留するために,誘導脱ノイズ器自己蒸留法(GDSD)を提案する。
GDSDは、正規化のない目的を通じて、dLLMのデノイザーロジットを教師のものと一致させることで、RLは可能性のない自己蒸留に還元される。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:47:40 GMT)
Beyond Trajectory Rewards: Step-level Credit Assignment for Agentic Search via Graph Modeling [26.5] Agentic Searchでは、軌道レベルの成果報酬は個々のステップの行動貢献の定量化に失敗する。
GDCR(Graph-Distance Contribution Reward)は、解答ノードまでの距離で、新たに検索されたエンティティと新しいエンティティをスコアリングするステップレベルのプロセス報酬である。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:57:12 GMT)
Recovering Diversity Without Losing Alignment: A DPO Recipe for Post-Trained LLMs [26.5] 我々は、異なる有効な回答モードを復元するためのオフラインDPOデータ構築パイプラインであるREDIPOを紹介した。
各プロンプトに対して、REDIPOは、ベースモデルとインストラクションモデルの両方からのレスポンスをサンプリングし、インストラクションモデルでベースモデルレスポンスを書き直し、安全性とインストラクションフォロー品質の候補をフィルタリングする。
Qwen3-4B、OLMo-3-7B、LLaMA-3.1-8Bの他、REDIPOはノベルティベンチのディファレンシャル_kを134%、33%、44%改善し、DivPOは多様性を0%、-6%、-4%改善した。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:42:18 GMT)
SRUG: Shadow-Guided Relightable Urban Scene with Generation Model [26.5] SRUG(Shadow-guided Relightable Urban Scene with Generation Model)は、都市景観におけるライティング課題に対処する新しい枠組みである。
SRUGは影を利用して、見えない領域の幾何学を復元する3D補完モデルを導出する。
都市景観の複雑な照明を捉え,信頼性の高い照明を支援する物理的照明モデルを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:09:49 GMT)
MARS Policy: Multimodality Only When It Matters [26.0] 多様なが有効な行動パターンを捉えることができるマルチモダリティは、ロボット学習における支配的なパラダイムとして、生成ポリシーの急速な台頭を促した。
本研究は, 適応型ロボットサンプリング(MARS:Modality-Adaptive Robot Smpling)ポリシーを提案する。
MARSは、生成ポリシーのマルチモーダル能力と決定論的モデルの優れたトレーニングと推論効率とのギャップを埋める。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:12:30 GMT)
MiraBench: Evaluating Action-Conditioned Reliability in Robotic World Models [25.9] 我々は,ロボット世界モデルのコア評価対象として,強調条件付き信頼性を定義する階層型ベンチマークであるtextscMiraBenchを紹介する。
この評価を支援するために,タスク,障害カテゴリ,先進世界モデルにまたがる16,000以上の判断で,人手によるコーパスをキュレートする。
視覚的忠実度はアクション忠実性の指標として不十分なこと、モデルスケールの増大はアクションのフォローを確実に改善しないこと、最適化バイアスが現在のシステム全体に広まること、である。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:58:15 GMT)
HEART-Bench: Do LLM Agents Exhibit Human-like Psychology? [25.2] 本稿では,LLMエージェントが人間のようなコヒーレントな心理をシミュレートできるかどうかを評価するための新しいベンチマークを提案する。
我々のベンチマークでは、Big Fiveの性格特性を基盤とした11種類の人格文字が構成されており、各プロファイルは1,000個の自己書誌的エピソード記憶と深く統合されている。
エージェントを様々なシナリオに従属させることで、彼らの固有の性格特性と自伝的記憶を統合して、行動決定を特定の心理的プロファイルと整合させることができるかどうかを評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:08:03 GMT)
Solving Integer Linear Programming with Parallel Tempering [25.2] 線形プログラミング(ILP)は、幅広い最適化問題をモデリングするための汎用的なフレームワークとして機能する。
我々は、トレーニングや外部のソルバを使わずに、個別の実行可能な領域を直接探索する、ICPのためのソルバフリーサンプリングベース最適化フレームワークを提案する。
提案手法は,200秒の予算内での4つのタスクのうち2つのタスクにおいて,Gurobiに適合あるいは超越した4つのベンチマークでSCIPを一貫して上回り,学習ベースの手法よりも分散シフトに対してかなり頑健である。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:09:21 GMT)
Improving CLIP Adaptation by Breaking Tail Alignment for Source-Free Cross-Domain Few-Shot Learning [25.2] 本稿では,CLIPをベースとしたCDFSLタスクにおけるターゲット領域の少数ショットファインタニングに焦点を当てた。
特定の低相似画像トークンを積極的に押し出すと、ターゲットドメインのパフォーマンスが向上する。
そこで我々は,CLIPの新しい微調整戦略であるAdaptive Tail-Head Alignment (ATHA)を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:21:44 GMT)
Do Language Models Track Entities Across State Changes? [25.2] LMは、各層にまたがるトークンやクエリ関連状態を段階的に追跡するのではなく、クエリが明らかになると、関連する情報を最後のトークンで並列に集約する。
驚いたことに、LMは、脆弱なグローバルな抑制タグで$textttREMOVE$演算を実装し、このグローバルな削除メカニズムは、動作確認を行うさまざまな障害モードを予測する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:03:42 GMT)
KairosAgent: Agentic Time Series Forecasting with Fused Semantic Reasoning [25.1] クロスドメインマルチモーダル時系列予測は、正確な数値理解、クロスドメインセマンティック理解、効果的なマルチモーダル融合をモデルに統合する必要がある、難しい課題である。
既存のアプローチは、時系列基礎モデル(TSFM)をスクラッチから構築するか、事前訓練された大規模言語モデル(LLM)を活用するかのいずれかである。
LLMベースの推論器とTSFMベースの予測器を含む,マルチモーダル時系列予測のための新しいエージェントフレームワークであるKairosAgentを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:32:48 GMT)
BenchTrace: A Benchmark for Testing Reflection Ability and Controlled Evolution in LLM Agents [25.0] LLMエージェントの自己進化能力を評価するベンチマークである textbfBenchTrace を提案する。
BenchTraceは6つのタスクにまたがる1,821の注釈付きエピソードのスナップショット・リフレクションデータセット上に構築されている。
エージェントがターゲットの障害インスタンスをうまく回避するテストケースの割合を計測する新しい評価指標であるtextbffailure avoidance rate (FAR) を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:25:37 GMT)
Cookie-Bench: Continuous On-screen Key Interaction Evaluation for Web Generation [24.9] textbfdatanameは11ドメイン、54リーフ、1000キューのWebDevベンチマークで、静的表現とインタラクティブアプリケーションの両方にまたがる。
textbfframenameはフラヴェルのメタ認知モニタリングに基づいており、3段階にわたる判断から証拠の蓄積を分離している。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:30:33 GMT)
LaRA: Layer-wise Representation Analysis for Detecting Data Contamination in RL Post-Training [24.8] 大規模言語モデル(LLM)における汚染検出のためのレイヤワイド表現分析フレームワークであるLaRAを提案する。
汚染は, 増幅摂動感度, 指向性崩壊, 局所剛性の向上など, 層間に進行的な幾何学的偏差を生じさせることがわかった。
また,レイヤやメトリクス間の表現レベルの偏差を集約する汚染検出プロトコルを開発した。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:13:49 GMT)
DiffSpot: Can VLMs Spot Fine-Grained Visual Differences in Web Interfaces? [24.7] textbfDiffSpotは、Webインターフェース上のオープンなスポット・ザ・ディファレンスのためのコード駆動ベンチマークである。
ベンチマークには4,400のペアが含まれており、13のCSSプロパティ演算子間でバランスの取れた3,900のhas-diffペアが含まれている。
最高のモデルでさえ、真の変更の40.7%しか見つからず、ハード層リコールはすべてのモデルに対して23%以下である。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:50:34 GMT)
OpenClawBench: Benchmarking Process-side Anomalies in Real-world Agent Execution Trajectories [24.6] 実エージェント実行プロセスにおけるプロセス側異常の測定と監視のための大規模データセットであるOpenClawBenchを紹介する。
OpenClawBenchは6つのソースモデルによって生成されたBFCL駆動のOpenClawセッションから構築され、31,264の注釈付きトラジェクトリを含んでいる。
FullTaxは、アライメントされた軌跡を、バイナリラベル、エビデンス、オンセット/スパンのローカライゼーション、重度、回復性、および5クラスの異常分類といった構造化された異常管理に変換する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:15:52 GMT)
Geodesics with Unified Tangent-constrained Priors and Curvature Regularization [24.5] 曲率ペンタライズされた測地線モデルは、大域的最適曲線の計算による画像分割において、その効果が証明されている。
本稿では, タンジェント制約前処理と曲率ペナリゼーションを統合した統合測地学フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:27:05 GMT)
KGEdit: Ambiguity-Aware Knowledge Graphs for Training-Free Precise Video Generation and Editing [24.3] KGEditは、テキスト・トゥ・ビデオ(T2V)拡散モデルのための構造化セマンティック・コントロール・フレームワークである。
まず、入力プロンプトのアンビグニティ対応知識グラフ(AAKG)を構築し、入力プロンプトのアンビグニティ化とアンビグニティ化を行う。
次に,拡散変換器の鍵層に意味信号を注入する構造的意味注入モジュール(SSIM)を設計する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:31:22 GMT)
Beyond 3D VQAs: Injecting 3D Spatial Priors into Vision-Language Models for Enhanced Geometric Reasoning [24.3] VLM(Vision-Language Models)は、しばしば堅牢な3次元空間推論に苦しむ。
GASP(Geometric Aware Spatial Priors)は,LLMのトランスフォーマー層に直接,基本的な幾何学的事前を注入するフレームワークである。
GASPは、すべての層にまたがる深い監視信号として応用された小さな対応ヘッドを使用し、地上の映像シーンを活用する2つの目的で訓練されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:00:52 GMT)
OccamToken: Efficient VLM Inference with Training-Free and Budget-Adaptive Token Pruning [24.2] OccamTokenは、絶対トークンランキングを登録された相対的エビデンステストに置き換える、トレーニング不要のフレームワークである。
我々はOccamTokenが、追加のトレーニングなしで精度と効率のトレードオフを継続的に改善していることを示します。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:20:47 GMT)
Gaze2Act: Gaze-Conditioned Vision-Language-Action Policies for Interactive Robot Manipulation [24.0] VLA(Vision-Language-Action)モデルは、最近、言語命令に従うことでロボット学習の可能性を強く示している。
どのオブジェクトが類似の候補と相互作用するか、どこでオブジェクトに作用するか、実行中にターゲットがどのように変化するかを記述するのは難しい。
複雑な対話操作のための動的かつ直感的な意図信号として人間の視線を利用する新しいVLAフレームワークであるGaze2Actを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:37:16 GMT)
Personalized Turn-Level User Conversation Satisfaction Benchmark [23.7] 我々は,コンパクトなユーザメモリとターゲットターンコンテキストを組み合わせた会話満足度評価器を構築した。
PersTurnBenchはターンレベルのユーザ会話満足度ベンチマークで、検証された評価器を使用して、再生による生成モデルの評価を行う。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:10:37 GMT)
GUITestScape: Towards Open-set Evaluation on Exploratory GUI Testing [23.6] 実世界の61のAndroidアプリケーションと,インタラクションとディスプレイタイプにまたがる508のプリセット欠陥をカバーする対話型ベンチマークを提案する。
GUIJudgeはエージェントのテスト軌道を独立して診断可能な機能に分解するオープンセット評価器である。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:47:27 GMT)
Stage-wise Distortion-Perception Traversal in Zero-shot Inverse Problems with Diffusion Models [23.4] 歪み知覚(D-P)トレードオフはベイズ逆問題の基本現象である。
ゼロショット逆問題における単一拡散モデルを用いてD-Pトラバースを実現するための段階的フレームワークを提案する。
提案手法はMAP-RPSと呼ばれ,MMSE解を近似したMAP推定段階から始まる。
我々はMAP-RPSを潜伏空間に拡張し、LMAP-RPSを得る。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:09:41 GMT)
A Unified Framework for Gradient Aggregation in Multi-Objective Optimization [23.3] 我々はMOOにおける勾配集約のための統一フレームワークを開発する。
両錐体への射影により実現可能性を保証することを示し、収束保証を許容する手法の範囲を広げる。
本稿では、確立されたアルゴリズムを包含し、それらの理論的関係を明確化し、新しい変種の設計を可能にする勾配集約の最適化的視点を示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:21:53 GMT)
Adaptive Interviewing for Persona Simulation in LLMs: Evidence-Grounded Reasoning Improves Decision Alignment [23.1] 構造化された3段階対話を通してペルソナ関連情報を収集するアダプティブ・インタビュー・フレームワークを提案する。
我々は,大規模言語モデルが道徳ジレンマシナリオにおける参加者の決定をシミュレートできるかどうかを評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:53:08 GMT)
CoMo3R-SLAM: Collaborative Monocular Dense SLAM with Learned 3D Reconstruction Priors for Outdoor Multi-Agent Systems [23.0] 大規模屋外環境におけるスケーラブルで一貫した3D知覚を実現するためには,複数ロボットチームにとって,協調的密集SLAMが不可欠である。
CoMo3R-SLAMは、屋外マルチエージェントマッピングのための堅牢なフィードフォワード3D再構成手法を利用する、初の協調的な単分子密度RGB SLAMシステムである。
CoMo3R-SLAMは4つの戦車・寺院のシーンのうち3つで最高のATEを達成し、8FPSでオンライン実行中に最先端のRGB-D手法をマッチングまたは超える競争精度を達成している。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:06:19 GMT)
Can Subgraph Explanations Be Weaponized to Steal Graph Neural Networks? [22.8] 厳密なブラックボックス制約下でのグラフ分類に特化して設計された最初のモデル抽出攻撃を提案する。
本手法は,モンテカルロのエッジ感度推定を決定境界へ導くためにモデル説明出力を用いる。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:41:20 GMT)
Autoregression-Free Neural Operators for Time-Dependent PDEs [22.7] 本研究では, PDEの時間発展を潜在空間にマッピングし, 内部の連続時間ベクトル場をモデル化するオートレグレスフリーニューラル演算子(AFNO)を提案する。
AFNOは長水平予測の安定性を向上し、ベースラインと比較してロールアウトエラーを一貫して低減することを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:11:14 GMT)
CCS: Clinical Consensus Selection for Radiology Report Generation [22.7] 本稿では,複数の候補レポートを抽出し,最も臨床的なコンセンサスが高いものを選択するデコーダに依存しない推論時間選択フレームワークを提案する。
CCSはシングルパスデコーディングやBest-of-Nベースラインよりも推論時のパフォーマンスを一貫して改善している。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:59:29 GMT)
Ambient-robust Inverse Rendering using Active RGB-NIR Imaging [22.7] 逆レンダリングは、画像から物体の形状と反射を再構成することを目的としている。
能動RGB-NIRイメージングを応用した環境ローバスト逆レンダリング手法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:13:41 GMT)
ProRL: Effective Reinforcement Learning for Proactive Recommendation via Rectified Policy Gradient Estimation [22.6] Proactive Recommender Systems (PRSs) は,中間勧告の経路を生成することによって,ユーザの嗜好の目標項目へのシフトを誘導することを目的としている。
プロアクティブなレコメンデーションのための2つの新しいメカニズムを持つ有効RLフレームワークProRLを提案する。
実世界の3つのデータセットに対する実験により、ProRLは最先端のPSSよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:16:42 GMT)
EvoRepair: Enhancing Vulnerability Repair Agents Through Experience-Based Self-Evolution [22.6] 大規模言語モデル(LLM)は、自動脆弱性修復(AVR)を約束している。
それらはいくつかの制限に直面しており、その中には、対外性エクスペリエンスの蓄積の欠如や、対外性エクスペリエンスの再利用の欠如が含まれる。
体験ベースの自己進化型エージェントフレームワークであるEvoRepairを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:46:58 GMT)
Enhancing LLM Medical Coding with Structured External Knowledge [22.6] 既存の LLM ベースの自動化手法は LLM の内部知識に大きく依存している。
RAG-Codingは,外部知識を構造化してLLMを増強するエージェントフリーな手法である。
MDACE-2025では、RAG-Codingはすべてのベースラインを上回り、更新されたガイドラインに対する効果的な一般化を実証している。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:48:22 GMT)
VikingMem: A Memory Base Management System for Stateful LLM-based Applications [22.5] 本稿では,長期的相互作用の持続状態を管理するための新しいデータ管理パラダイムであるMemory Baseを紹介する。
本稿では,VikingDBベクタエンジン上に実装されたエンドツーエンドメモリベース管理システムであるVikingMemを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:07:42 GMT)
Honeyval: A Comprehensive Evaluation Framework for LLM-powered HTTP Honeypots [22.4] ハニーポット(Honeypots)は、サイバー攻撃を防ぐために設計された実際のシステムコンポーネントを模倣したデコイシステムである。
近年、LLMはハニーポットのシミュレーションバックボーンとしての役割を担っている。
Honeyval は LLM ベースの HTTP ハニーポットの包括的な評価フレームワークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:02:27 GMT)
GRASP: Plan-Guided Graph Retrieval with Adaptive Fusion and Reranking on Semi-Structured Knowledge Bases [22.2] 半構造化知識ベースは、エンティティと関係性の型付きグラフにテキスト文書を埋め込む。
本稿では,3段階のSKB検索フレームワークであるGRASPについて述べる。
GRASPは3つのSTaRKベンチマークにまたがるすべてのメトリクスのテクニックの状態を著しく向上させ、平均Hit@1を62.0から73.9に引き上げている。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:07:32 GMT)
Casual as an Anchor: Resolving Supervision Misalignment in Formality Transfer Dataset [22.1] 形式的転送は、通常、形式的レジスタと形式的レジスタの間の対称的な双方向タスクとしてフレーム化される。
このフレーミングは、GYAFCのような既存のベンチマークにおいて、監督設計上の欠陥を隠蔽していると論じる。
人間の整合性の定義の下で、ベンチマーク形式ラベルを再評価することで、このミスアライメントを定量化する。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:07:02 GMT)
SSDAU: Structured Semantic Data Augmentation for Joint Entity and Relation Extraction [22.0] 拡張中の3つの意味構造を保存するために,textbfStructured Semantic Data Augmentation (SSDAU)を提案する。
SSDAUはエンティティラベルでテキストをセグメンテーションし、コンテキスト認識エンコーディングを通じてセマンティックな特徴をキャプチャし、エンティティセマンティクスを再構成して拡張データを生成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:01:50 GMT)
V2I Work Zone Geometry Reconstruction with Pose-Conditioned UWB Range Denoising [22.0] 本研究では,マルチアンカーUWBレンジに対するポーズ条件付き変分変分予測デノイザを提案する。
2段階のトレーニング戦略は、まず観測範囲から予測を学習し、次にNLOSの重み付けによるディナイザを微調整する。
提案手法は,NLOS重み付けの課題において,範囲精度,コーンの局在化,ワークゾーンの幾何再構成を著しく向上することを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:24:26 GMT)
Photon blockade via three-body interactions: toward high-purity and bright single-photon sources [22.0] 本研究では,1つのフォトニックモードと2つの量子ビット間の3体相互作用を利用して,基本的に新しい光子遮断機構を導入する。
このような相互作用は本質的に2光子状態への励起経路を遮断し、完全な光子遮断効果をもたらす。
驚くべきことに、これは純度と明度のトレードオフを破り、極度の純度と高輝度の同時達成を可能にします。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:09:13 GMT)
Unlocking the Working Memory of Large Language Models for Latent Reasoning [21.9] Reasoning in Memory (RiM) は、自己回帰的な推論ステップをメモリブロックに置き換える遅延推論手法である。
RiMは、自己回帰的な思考の生成を避けながら、既存の潜在推論手法に適合または超越する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:49 GMT)
Selection Hyper-heuristics Can Automatically Adjust the Learning Period to Optimally Solve Pseudo-Boolean Problems [21.9] このアルゴリズムパラメータを制御する非自明なタスクからユーザを救い、新しいパラメータ値を自動的に設定する方法を示す。
結果の超ヒューリスティックは、イテレーションの1-o(1)$の分数で最適な近傍サイズを選択することを証明している。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:31:16 GMT)
GRUFF: LLM Pronoun Fidelity, Reasoning, and Biases in German [21.7] 我々は,ドイツ語の代名詞の忠実度を測定するために,新しい大規模データセットであるGRUFFを用いている。
また, LLMは, 明示的文脈が欠如している場合に, 男性や女性に対して強い文法的一致を示すことを示す。
また, この文脈における職業的ステレオタイプは, 文法的事例間では相関が低かった。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:47:46 GMT)
ReactBench: A Cause-Driven Benchmark for Multimodal Hallucination via Systematic Evaluation [21.7] ReactBenchは、複数のタスクと試験スタイルの評価フォーマットを備えた、原因駆動型幻覚ベンチマークである。
ReactBenchは、敵対的なイメージと幻覚を誘発するクエリを生成することによって、エロージャ、非現実的属性、Alteration Tracing、Dense Countingという4つのターゲットタスクを導入した。
標準的な精度に基づく評価の他に、我々はChain-of-Thought推論を利用して、各タスク内での幻覚の微細なサブ原因を特定する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:23:46 GMT)
ParaTool: Shifting Tool Representations from Context to Parameters [21.6] ParaToolは、各ツールを専用のロード可能なパラメータセットにプロジェクションするフレームワークである。
本手法は,(1)異なるツールの知識を独立したパラメータモジュールにカプセル化するためのパラメトリックツール事前学習,(2)ソフトツールの選択では,関連するツールパラメータを動的に計測・集約するゲーティングネットワーク,(3)ツールパラメータを微調整し,トレーニングと推論プロセスの調整を行う。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:14:07 GMT)
Understanding Safety-Sensitive Expert Behavior in Mixture-of-Experts LLMs [21.5] 一般的な直観では、安全行動は、異なる拒絶指向の専門家に有害な要求をルーティングすることで制御される。
専門家の小さなサブセットにローカライズされた安全対策を調査するフレームワークである**RASET*を提示する。
結果は、専門家が認識するアライメントメカニズムの必要性を浮き彫りにした、明確なMoE安全性リスクを明らかにした。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:09:51 GMT)
Uncertainty-driven 3D Gaussian Splatting Active Mapping via Anisotropic Visibility Field [21.5] 本研究では,3DGSにおける可視界の定量化を原則とし,各粒子の非等方的可視性として定義し,球面高調波を用いて表現する手法を提案する。
得られた可視界はベイズネットワークベースの不確実性認識3DGSizerに統合され、合成ビューに対するリアルタイム(200 FPS)不確実性定量化を可能にする。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:32 GMT)
Battery-Sim-Agent: Leveraging LLM-Agent for Inverse Battery Parameter Estimation [21.3] 推論タスクとして逆問題を再編成する新しいパラダイムを導入する。
本稿では,Large Language Model (LLM) エージェントを高忠実度バッテリシミュレータでクローズドループにデプロイする最初のフレームワークであるBattery-Sim-Agentを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:12:47 GMT)
The Interplay Between Interpolation and Aggregation in Regression: Optimal Sample Complexity [21.3] いくつかの仮説クラスは無限に多くの仮説を集約することによってのみ学習可能であることを示す。
3つの補間仮説を中央から組み合わせた極めて単純な集計手順が,これらの集計手順の中で最適であることが証明された。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:02:09 GMT)
EUDAIMONIA: Evaluating Undesirable Dynamics in AI [20.9] 我々は、大きな言語モデルがユーザの福祉に合致するかどうかを評価するためのフレームワークであるSocial AI Design Codeを紹介する。
コードをWildChatから構築した,969のユーザ入力と3,147の設計要求違反チェックのベンチマークであるEUDAIMONIAで運用する。
最強モデルであるClaude-Opus-4.7 と GPT-5.5 もそれぞれ 30.7% と 27.2% のチェックに違反している。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:17:26 GMT)
VitalAgent: A Tool-Augmented Agent for Reactive and Proactive Physiological Monitoring over Wearable Health Data [20.8] 既存のmHealthシステムは、タスク固有の予測パイプラインや静的要約に対する質問応答に限られている。
我々は、反応性質問応答とプロアクティブモニタリングの両方をサポートする、ECG/リアクティブベースのmHealth用のツール拡張エージェントフレームワークであるVitalAgentを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:10:14 GMT)
Masked Diffusion Modeling for Anomaly Detection [20.8] そこで我々は,分類型,混合型,離散シーケンスデータに対するMasked Diffusion for Anomaly Detection (MaskDiff-AD)を提案する。
MaskDiff-ADはランダムにマスクされた座標の再構成が困難であることから異常スコアを構成する。
実験により、MaskDiff-ADは古典的、拡散ベース、および最近の表/テキスト異常検出ベースラインと競合する性能を示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:59:17 GMT)
Same Evidence, Different Answers: Canonical-Context On-Policy Distillation for Multi-Turn Language Models [20.6] 大規模言語モデル(LLM)は、全ての命令が1つのプロンプトで与えられると、そのタスクを解くが、同じ情報が順番に徐々に明らかにされると失敗する。
CCOPD(Canonical-Context On-Policy Distillation)を提案する。
CCOPDは、生徒の行動と教師の標準的全文行動の軌跡を一致させる。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:14:29 GMT)
Implicit Identity Technologies for LLMs: Fingerprinting and Watermarking across Datasets, Models, and Generated Content [20.6] 我々は暗黙のアイデンティティを計算の統一的な抽象化として導入するが、直接観測可能なアイデンティティ信号は導入しない。
我々は、データセット、モデル、生成されたコンテンツにまたがるテクニックを組織化するライフサイクルベースの分類法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:03:30 GMT)
A Triple-Modal Contrastive Learning Framework with Sequence, Graph, and 3D Features for Drug-Target Interaction Prediction [20.5] TriMod-DTIは3重モードのコントラスト学習フレームワークで、1D配列、2Dグラフ、薬物やタンパク質の3D構造を組み込む。
3つのベンチマークデータセットの実験は、TriMod-DTIが最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:39:44 GMT)
Mind-Omni: A Unified Multi-Task Framework for Brain-Vision-Language Modeling via Discrete Diffusion [20.5] Mind-Omniは7つの異なるエンコーディングとデコードタスクを統一する汎用フレームワークである。
中心となるのは、不均一で連続した脳信号を標準化された離散トークンに変換する新しいブレイン・トケナイザーだ。
私たちの研究は、ニューラルモデリングのための強力な新しいパラダイムを提供し、ニューラルアクティビティの基礎モデルの道を開く。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:33:43 GMT)
Exploiting Chordal Sparsity for Globally Optimal Estimation with Factor Graphs [19.9] 我々はGTSAMフレームワーク内で、共通因子と可変型を持つ任意の因子グラフに対して凸SDP緩和を自動的に構築する新しい手順を作成する。
我々は,この構造を探索する大域的推定器のスケーリングを,標準的な局所解法と比較して好意的に示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:12:41 GMT)
The Curse of Helpfulness: Inverse Scaling Law in Robustness to Distractor Instructions via DistractionIF [19.9] 大規模言語モデル (LLM) は、エージェントおよび検索強化世代 (RAG) システムにますます多くデプロイされている。
実際には、そのような文脈は、しばしば非構造化され、良性だが命令のようなセマンティックノイズで汚染される。
本稿では、参照テキストにおけるそのような注意散らし命令に対する堅牢性を評価するためのベンチマークであるDistractionIFを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:18:15 GMT)
SuperVoxelGPT: Adaptive and Ordered 3D Tokenization for Autoregressive Shape Generation [19.9] MLLM(Autoregressive Multimodal Large Language Model)は、3D生成を可能にするが、高解像度の形状にスケールするのに苦労する。
本稿では,適応性と決定的に順序付けられたスーパーボクセルトークン化により,このテンションを解消する表現ファーストフレームワークであるSuperVoxelGPTを提案する。
Trellis-500Kの実験により、スーパーボクセルGPTはトークンの配列の長さを12.8%まで短縮することが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:17:11 GMT)
AdaState: Self-Evolving Anchors for Streaming Video Generation [19.8] 自己回帰ビデオ拡散モデルは、フレームを逐次生成し、以前に生成されたコンテンツに対して各チャンクを条件付けることによって、ストリーミングビデオを生成する。
静的なアンカーを適応的な状態に置き換えます。それは、モデルがすべてのチャンクでコンテンツと一緒に飾るが、決してレンダリングしない、隠れたラテントです。
実験により、適応状態は映像のダイナミックスを大幅に改善し、よりリッチな動きと自然のシーンの進行を可能にした。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:53 GMT)
SlideCheck: Guiding Self-Supervised Pretraining of Pathology Foundation Models via Dataset Distributions [19.7] SlideCheckは、凍結した病理モデルパッチ機能に基づいて構築された、軽量な事前トレーニングデータガイダンスツールである。
我々は,SlideCheckで定義されたデータ分布が,自己教師付きVT事前学習サブセットの下流挙動に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:05:45 GMT)
FreeForm: Reduced-Order Deformable Simulation from Particle-Based Skinning Eigenmodes [19.6] 変形可能な超弾性物体のメッシュフリーで低次シミュレーションのための新しい定式化法を提案する。
メッシュやガウススプラットなど,さまざまな表現のさまざまな対象に対してシミュレーション結果を示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:49:06 GMT)
FRUC: Feedforward Dynamic Scene Reconstruction from Uncalibrated Collaborative Driving Views [19.3] フィードフォワード型3次元ガウススプレイティングフレームワークFRUCについて,協調運転視点からの動的シーン再構築を阻害する。
FRUCは、動的協調運転環境のシーン再構築のための新しい最先端技術であり、レンダリング品質と効率の両方において既存の手法よりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:27:30 GMT)
Reliable Reasoning with Large Language Models via Preference-Based Maximum Satisfiability [19.2] 大きな言語モデル(LLM)は、自然言語を理解するのに優れているが、ユーザ定義の好みを含む最適化タスクに苦労する。
本稿では,LLMがコード生成を通じて推論を外部化するハイブリッド推論手法を提案する。
この結果から,LLMによるコード生成と嗜好に基づくMaxSATが組み合わさることで,ソルバ検証の最適化が可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:51:33 GMT)
HiKEY: Hierarchical Multimodal Retrieval for Open-Domain Document Question Answering [19.1] HiKEYは階層木に基づくマルチモーダル検索フレームワークであり、文書階層を1級検索信号に高める。
ODQAベンチマークの実験では、HiKEYはページベースとチャンクベースのベースラインを大きく上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:42:21 GMT)
Improving Selective Classification with Pairwise Queries for Binary Classification [18.8] 選択分類では、モデルは、自信のあるデータサンプルのラベルを予測し、自信のないサンプルのラベルを予測しない。
モデルの信頼度の推定はモデルの予測と矛盾するかもしれない。
これらのペアワイズクエリは、ハイエラーサンプルを検出し、選択的な分類手法に組み込むことで、非リジェクトサンプルのエラーを減らすことができる。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:08:08 GMT)
ChartAct: A Benchmark for Dynamic Chart Understanding [18.7] 既存のベンチマークは主に静的チャートに焦点を当てているが、現実のチャートはしばしば動的でインタラクティブである。
この能力を評価するために,動的チャート理解のためのインタラクティブなベンチマークであるChartActを提案する。
ChartActは8つの実際のチャートサイトから673の動的チャートを収集しフィルタし、7つの一般的なチャートタイプをカバーし、1,440の高品質な質問回答サンプルを構築している。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:54:42 GMT)
Hista and Numca: Estimate State Value Effectively for LLM Reinforcement Learning [18.6] 強化学習 (Reinforcement Learning, RL) は、報酬信号を通じてモデル動作を直接最適化することにより、大きな言語モデル(LLM)を洗練する。
既存のRLフレームワーク内での状態推定を評価するための状態値推定ベンチマーク(SVEB)を導入する。
数値スパンを段階的なマイルストーンとして活用するNumcaと,LLMの隠蔽状態を重み付き平均解離ロールアウトの表現として利用するHistaの2つの手法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:31:13 GMT)
Rubric-Guided Process Reward for Stepwise Model Routing [18.6] ステップワイズモデルルーティングは、各推論ステップを適切なモデルに割り当てることで、Large Reasoning Models(LRM)の効率を改善する。
最近の方法では、順序決定プロセスとしてルーティングを定式化し、強化学習でルータを訓練する。
ステップワイズモデルルーティングのためのルーリック誘導プロセス報酬フレームワークであるRoRoを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:42:24 GMT)
SwInception -- Local Attention Meets Convolutions [18.5] フィードフォワード層にインセプションブロックを導入し,スウィンの誘導バイアスを高める。
11種類の医療データセットのパフォーマンス改善を実演する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:00:05 GMT)
Advances in Neural 3D Mesh Texturing: A Survey [18.5] テクスチャ3Dは、デジタルオブジェクトやシーンの視覚的リアリズムを決定する上で重要な役割を果たす。
本稿では,ニューラル3Dメッシュの最近の進歩について概説する。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:18:08 GMT)
NICE: A Theory-Grounded Diagnostic Benchmark for Social Intelligence of LLMs [18.5] 大規模言語モデル(LLM)は、感情的な仲間関係やカスタマーサービスといった社会的文脈にますます適用されている。
既存のソーシャルインテリジェンスベンチマークには、社会的能力を統一された構造に整理する統一されたフレームワークが欠如している。
NICEは中国の代表的な文脈を通して運用された137項目の診断ベンチマークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:51:06 GMT)
Mitigating Content Shift and Hallucination in GenAI Image Editing via Structural Refinement [18.5] 本稿では,GenAIに強化された入力画像を融合した後処理フレームワークを提案する。
本手法は,画素レベルの構造的整合性と入力解像度を維持しつつ,美的品質を向上する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:11:29 GMT)
PEARL: Training Socratic Tutors with Pedagogically Aligned Reinforcement Learning [18.5] 大規模言語モデル(LLM)は、教育的な家庭教師として有望であるが、効果的な家庭教師は問題解決以上のものを必要としている。
本稿では,ソクラテス学習エージェントを学習するための学習フレームワークであるPEARLを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:25:08 GMT)
Aligned but Fragile: Enhancing LLM Safety Robustness via Zeroth-Order Optimization [18.4] 大規模言語モデルの安全性アライメントは、汎用性を維持しながら有害または不安全な振る舞いを減らすことを目的としている。
最近の知見は、アライメント効果が脆弱であることを示しており、軽量なアライメント後操作は、意図した安全性の振る舞いを容易に弱めることができる。
本稿では、まず標準の1次安全アライメントを行い、その後、ロバスト性向上のために0階改良を適用したハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:46:38 GMT)
EarlyTom: Early Token Compression Completes Fast Video Understanding [18.4] ビデオ大言語モデル(ビデオ-LLM)は、ビデオ理解タスクにおいて強力な機能を示している。
近年のアプローチでは、トークン保持率が非常に低く、完全トーケンベースラインに匹敵する精度を維持している。
視覚エンコーダの内部で早期の視覚的トークン圧縮を行う,トレーニングフリーなトークン圧縮フレームワークであるEarlyTomを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:36:44 GMT)
VideoMLA: Low-Rank Latent KV Cache for Minute-Scale Autoregressive Video Diffusion [18.3] ビデオ拡散におけるMLA(Multi-Head Latent Attention)の最初の研究について述べる。
VideoMLAは、ヘッド単位のキーと値を共有低ランクコンテンツラテントと共有非結合3D-RoPE位置キーで置き換える。
VBenchでは、ビデオMLAは短水平ストリーミングビデオ拡散ベースラインと一致し、評価方法の長い地平線で最高の総合スコアを獲得し、1つのB200上でのスループットを1.23倍改善する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:57 GMT)
Turbulence-Robust Dynamic Object Segmentation with Multi-Signal Priors and SAM2 Refinement [18.3] 本稿では, CVPR 2026 UG2+ Challenge Track 3: Dynamic Object in Turbulence (DOST) について述べる。
我々は,事前訓練された動作推定,自己教師付きセマンティック先行,背景異常モデリング,手動キャリブレーションによる提案融合,SAM2ベースのマスク改善を組み合わせた,トレーニング不要な多信号分割パイプラインを設計する。
この設計はDOSTの設定に適しており、激しい大気乱流は擬似的な動き、ぼかし、間欠的な目標視認性を生じさせ、単一の動きキューを信頼できないようにする。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:18:18 GMT)
DP-SAPF: Saliency-Aware Parameter Fine-tuning of Public Models for Differentially Private Image Synthesis [18.2] 差分プライベート(DP)画像は、センシティブデータセットの統計的特性を保持する画像を生成する。
DPグラディエントDescent (DP-SGD) を用いた高感度画像から合成画像を生成する既存手法について検討した。
本稿では,DP-SAPFを提案する。このDP-SAPFは,DP下でのLoRAトレーニングの特定の目標パラメータを特定するために,Saliency-aware 戦略を用いている。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:53:30 GMT)
Mean-Field Diffuser: Scaling Offline MARL to Thousands of Agents [18.2] 軌道分布のワッサーシュタイン空間に軌道計画を持ち上げるフレームワークであるMF-Diffuserを紹介する。
我々は、MF-Diffuserが、最適でないオフラインデータと極端なスケールで、ほとんどの設定において最高のリターンを達成することを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:32:56 GMT)
Ask Now, Use Later: Benchmarking the Proactivity Gap in Long-Lived LLM Agents [18.1] LLMエージェントは、現在の要求だけでなく、セッション間でユーザーの好みに作用することで、その価値を得る。
しかし、今日のエージェントは、ユーザーがボランティアしているものを保ちますが、何があっても構わないのかを尋ねることはめったにありません。
ユーザーがより多くの問題をエージェントに委譲するにつれ、このギャップの影響は増大する。
ATRBenchは、各ユーザの好みを隠れた土台真理として固定することで測定できる。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:48:23 GMT)
SpikeWFM: Spiking-Aided Wireless Foundation Model for Robust Channel Prediction [18.0] SpikeWFMは、スパイキングニューラルネットワーク(SNN)と従来の人工ニューラルネットワーク(ANN)ベースのワイヤレス基礎モデル(WFM)を統合した新しいハイブリッドアーキテクチャである。
SpikeWFMは、人間の脳におけるノイズロスとエネルギー効率の高い情報処理にインスパイアされ、ノイズや干渉に対するWFMの弾力性を高めることを目的としている。
実験結果から,SpikeWFMはトレーニング前の収束とチャネル予測精度の両方において,従来のANNベースのWFMよりも一貫して優れていた。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:27:09 GMT)
Physically Viable World Models: A Case for Query-Conditioned Embodied AI [17.9] 既存の観測予測世界モデルは、視覚的に可視だが物理的に間違ったロールアウトを生み出すことができる。
このようなモデルは、実行不可能なアクションを推奨したり、インタラクションの結果を誤予測したり、安全でない振る舞いを証明したりする可能性がある。
インボディードAIは、介入クエリに応答するのに十分な、最も単純な物理的抽象化を特定する世界モデルを必要とする、と我々は主張する。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:18:22 GMT)
Quadratic Sums-of-Powers for Fixed-Parameter Tractable Quantum-Circuit Simulation [17.9] 難易度を最も正確に管理する構造量は、経路可変グラフのランク幅であることを示す。
このランク幅と回路サイズでのみ指数関数となる時間における振幅を評価するアルゴリズムを提案する。
新しい方法は、アダマールと対角ゲートから作られた全ての回路、特にクリフォード+T上の回路に適用される。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:54:42 GMT)
On Language Generation in the Limit with Bounded Memory [17.7] 境界メモリ下での限界における言語生成について検討する。
このタスクでは、学習者は未知のターゲット言語からサンプルを一度に観察し、最終的には新しい有効なサンプルのみを出力しなければならない。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:57:03 GMT)
When English Rewrites Local Knowledge: Global Narrative Dominance in Large Language Models [17.6] 大規模言語モデル(LLM)は言語間知識インターフェースとして広く使われている。
文化に根ざした質問は、しばしば現地の文脈よりも世界的な支配的な物語を反映している。
バングラ語-英語-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ/問合せ-問合せ-問合せ/問合せ-問合せ/問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-答
論文参考訳(メタデータ) (Thu, 28 May 2026 18:58:32 GMT)
Versatile Framework with Semantic and Structural guidance for Image Reconstruction from Brain Activity [17.6] 我々はMindDiffuserと呼ばれる2段階の画像再構成フレームワークを提案する。
ステージ1では、脳反応からデコードされたContrastive Language-Image Pretraining (CLIP)テキスト埋め込みが安定拡散に入力され、予備画像を生成する。
ステージ2では、復号された浅いCLIP視覚特徴を監視信号として使用し、ステージ1からバックプロパゲーションを介して特徴ベクトルを反復的に精製して構造情報を整列させる。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:20:10 GMT)
MAAT: Multi-phase Adapter-Aware Targeted Unlearning [17.6] We present 5WBENCH, a balanceed 5,000-sample benchmark with 1,000 examples per 5W category (Who, What, When, Where, Why)。
既存のベースラインでは,Why-type 質問に対する高い忘れ込みと高い保持が同時に達成されないことを示す。
我々は,LoRAアダプタの重みをベースとした3相フレームワークであるMAATについて,勾配投影型昇降法,SVD位数決定法,タスクベクトル否定法,ハイブリッドKL隠れ状態維持法を併用した。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:52:30 GMT)
Representation Collapse in Sequential Post-Training of Large Language Models [17.4] 逐次後学習が内部表現を低ランク,異方性,均一な特徴空間に徐々に圧縮するかどうかを考察する。
我々は,制御段階順序下での教師付き微調整,選好最適化,安全/拒絶チューニング,数学とコードの特殊化,および長いチェーン・オブ・シンキングを解析した。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:59:17 GMT)
Label Over Logic? How Source Cues Bias Human Fallacy Judgments More Than LLMs [17.4] 我々は、推論評価におけるソースラベルバイアスが主に人間の脆弱性であるかどうかを評価する。
我々の研究は、AIを介する環境における人間とLLMのコラボレーションの可能性を強調した。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:41:43 GMT)
Supercharging Thermal Gaussian Splatting with Depth Estimation [17.3] 本研究では, 熱画像のみを用いた温度-深度ガウス散乱法(TDg)を提案する。
平均的に、学習された知覚的イメージパッチ類似度(LPIPS)、構造的類似度指標(SSIM)、TDgのピーク信号対雑音比(PSNR)などのレンダリング品質指標は、ベースラインMSMG値よりも1.12%、0.034%、0.01%良い。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:57:35 GMT)
Spurious Prompts: Can Irrelevant Prompts Steer Large Language Models? [17.2] 大規模言語モデルはプロンプトに非常に敏感である。
この感度は、通常、タスク関連命令、実演、推論の手がかりを通して研究される。
私たちは刺激的なプロンプトを呼び、彼らの驚くべき効果を示します。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:39:44 GMT)
Recovering Policy-Induced Errors: Benchmarking and Trajectory Synthesis for Robust GUI Agents [17.1] GUI-RobustEvalには、エラー回復能力を計測する実行可能なテストケースが1216ドル含まれている。
データレベルでは、RoTSはスケーラブルな合成フレームワークであり、800k$の高品質なデータを生成する。
RoTS-32BはOSWorldで最先端のパフォーマンスを達成し、成功率は47.4%、All-Pass@4スコアは33.8%だった。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:40:24 GMT)
TriSearch: Learning to Optimize Triangulations via Bistellar Flips [17.1] TriSearchは、双星フリップによるポリトープの三角測量よりも目的を最適化するための強化学習フレームワークである。
3Dで測定対象の最高性能を達成し、4Dでは反射性ポリトープのより明確な微細、規則的、星の三角測量を発見する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:54:06 GMT)
UniNote: A Unified Embedding Model for Multimodal Representation and Ranking [17.0] 産業用I2I検索のための統合埋め込みモデルである textbfUniNote を提案する。
大規模アプリケーションにおいて,UniNoteは検索品質とコスト効率の大幅な向上を実現していることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:11:54 GMT)
LLUMI: Improving LLM Writing Assistance for Mental Health Support with Online Community Feedback [17.0] 大規模言語モデル(LLM)は、メンタルヘルスクエリに対するサポート的な応答を生成することを約束している。
しかし、それらの有用性、共感、安全性を改善するには、相当量の計算、専門家の入力、ラベル付きデータが必要であることが多い。
保護環境内にホスト可能なLLUMIセットアップを導入する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:30:57 GMT)
COMET: Concept Space Dissection of the Modality Gap in Audio-Text Multimodal Contrastive Embeddings [17.0] CLAPの最小二乗特異値分解フレームワークであるCOMETを紹介する。
我々のフレームワークは、共有概念をキャプチャする小さな、解釈可能な部分集合のみが、ほぼ類似性に寄与することを明らかにする。
トレーニング不要な方法でモダリティギャップを緩和する簡易なスペクトルトランケーション法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:00:44 GMT)
Control Flow Graph Recovery for Dynamically Loaded Code via Symbolic Library Resolution [17.0] Control Flow Graphsは、動的および静的なソフトウェア分析手法を使用するソフトウェア分析の主要なデータソースの1つである。
シンボリック実行と投機的ライブラリプリロードを組み合わせた新しい解析手法を提案し,バイナリから制御フローグラフを復元する。
実験によると、モジュールは静的解析だけで平均29.8%追加のコントロールフローグラフノードと26.5%追加のエッジで回復する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:54:54 GMT)
Transforming and Encoding FTS for SAT Solving: What Helps, What Hurts (Extended Version) [16.9] SATにおけるファクタリングタスクのエンコード方法について検討する。
本稿では,因子遷移関係を命題論理に変換するための様々な戦略に焦点をあてて,タスクを符号化するいくつかの方法を提案する。
また、この設定における様々なレベルの並列性を利用する方法を分析し、共通タスク変換がSATベースのプランナの性能に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:50:52 GMT)
How Coding Agents Fail Their Users: A Large-Scale Analysis of Developer-Agent Misalignment in 20,574 Real-World Sessions [16.9] 私たちは、開発者のプッシュバックを通じて見通せるように、誤った調整を運用しています。
エージェントがプロジェクトを読み、開発者意図を解釈し、ルールに従い、アクションをバウンドし、コードを実装し、実行し、進捗を報告する7つの繰り返しフォームを特定します。
本研究は,実際の開発者とコーディングエージェントの整合性を維持するためのトレーニング,評価,インターフェースの設計について報告する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:35:39 GMT)
Train the Agent, Not the Expert: Learning to Harness Heterogeneous Experts for Multi-Turn Visual Reasoning [16.8] VisHarnessはトレーニング可能なビジュアルエージェントで、低レベルのタスク実行から高いレベルの認識、推論、意思決定を分離する。
軽量なトレーニングだけで、VisHarnessは、一般化可能なビジュアルエキスパートハーネスポリシーを学ぶ。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:18:10 GMT)
Low Rank for Rank: Uncertainty-Aware Task-Specific LLM Ranking under Sparse Pairwise Comparisons [16.7] 低ランク共有は、独立したタスクワイドBradley-Terry推定よりもサンプリング効率を向上させる。
合成データとアリーナの実験により、低ランクの共有は独立したタスクワイドBradley-Terry推定よりもサンプリング効率を向上させることが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:44:43 GMT)
Audio Jailbreaks in Large Audio-Language Models: Taxonomy, Attack-Defense Analysis, and Cost-Aware Evaluation [16.7] 大規模オーディオ言語モデル(LALM)は、トークンレベルのプロンプトから、完全な音声認識から推論パイプラインまで、ジェイルブレイクのリスクを拡大する。
本稿では,LALMジェイルブレイク攻撃と防衛の統一された分類法と制御された実証的評価を提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:53:27 GMT)
SkillsInjector: Dynamic Skill Context Construction for LLM Agents [16.6] 既存の方法では、静的なステップとしてスキルインジェクションを扱い、一定の基準でスキルを選択し、事前に予算を固定し、説明をそのまま残します。
本稿では,これらの決定に共同で対処する2段階適応手法であるSkillsInjectorを提案する。
Tau2-bench、SkillsBench、ALFWorldで、SkillsInjectorは最強のベースラインを3.9点、6.1点、7.3ポイント改善した。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:44:32 GMT)
Leave a Window Out: Modifying the Jackknife for Predictive Inference in Time Series [16.6] 軽度の時間的依存を伴う標準時系列モデルにおいても,バニラ脱落型ジャックナイフは任意のカバレッジの損失を被る可能性が示唆された。
そこで我々は,このような設定に合わせて,Emphleave-a-window-out (LWO) 手法を慎重に提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:41:12 GMT)
RAISE: RAG Design as an Architecture Search Problem [16.4] 本稿では,RAGアーキテクチャ検索のためのフレームワークであるRAG Intelligence Search Engine (RAISE)を紹介する。
RAISEは、標準化された検索空間と予算の下でRAGパイプラインの最適化手法を評価する。
実験の結果,最適化性能はタスクに依存していることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:52:43 GMT)
CardioLens: Revealing the Clinical Reality Gap of MLLMs via Multi-Sequence Cardiac MRI Evaluations [16.4] マルチシーケンス心血管磁気共鳴(CMR)のためのリーク抵抗性評価ベッドである CardioLens について紹介する。
CardioLensは473,896個のスライスと13,494個のQAペアを4D Cine, LGE, 灌流, T2強調画像に収めている。
CardioLensは24の最先端MLLMをまたいで、実際のCMRワークフローに沿ってパフォーマンスを劣化させながら、モデル全体のパフォーマンスが不十分な、相当な臨床現実のギャップを明らかにしている。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:03:06 GMT)
Rethinking Literature Search Evaluation: Deep Research Helps, and Human Citation Lists Are Not a Ground Truth [16.4] 本研究では,検索パイプラインの改良と,評価対象としてのヒト参照リストのストレステストという,2つの相補的な角度からの大規模文献検索について検討する。
本稿では,全問合せ用紙の処理を行うDeep Researchパイプラインを実装した。
これはバニラAPIのみの検索よりも大幅に優れており、RollingEval-Jun25(250ページの文献検索ベンチマーク)を20%未満から80%以上までリコールしている。
人間の引用の51%が適度に関連づけられていると判断され、最強のAIベースのリランクは86~88%だった。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:50:52 GMT)
Comparative evaluation of photogrammetric reconstruction methods and 3D Gaussian Splatting for road surface roughness analysis [16.2] COLMAPはマイクロテクスチャに対して高い感度を提供する一方、Meshroomは緩やかな粗さの変化を伴うバランスの取れた再構成を提供する。
メタシェイプは内部のフィルターによって最も滑らかな形状を発生し、3DGSは目に見えない不規則さを捉えるが、高いノイズと低い密度を示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:47:08 GMT)
Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet [16.0] 我々は、モデルの中間層残留ストリームに最大3400万の機能を持つスパースオートエンコーダを訓練する。
有名なエンティティやロケーションに対応する機能や、sarcasmやコード内のエラーといったより抽象的な概念を見つけます。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:57:47 GMT)
EvoSpec: Evolving Speculative Decoding via Real-Time Vocabulary and Parameter Adaptation [15.9] EvoSpecは動的語彙とパラメータ適応によるドラフトモデルのリアルタイム進化を可能にするフレームワークである。
最新の静的ベースラインFR-Specよりも1.13倍のスピードアップを実現しており、通常のオンライン適応よりもメモリオーバーヘッドが27%低い。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:45:18 GMT)
CogniVerse: Revolutionizing Multi-Modal Retrieval-Augmented Generation with Cognitive Reflection and Geometric Reasoning [15.9] MMRAG(Multi-modal Retrieval-Augmented Generation)は、マルチモーダル大規模言語モデルを強化するための強力なパラダイムとして登場した。
textbfCogniVerseは認知に触発され、数学的に厳密なアプローチによってこれらの課題に対処する新しいMMRAGフレームワークである。
CogniVerseは、検索レイテンシを低減しつつ、精度とコヒーレンスの両方で最先端のシステムを大幅に上回る。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:40:34 GMT)
TRACER: Persistent Regularization for Robust Multimodal Finetuning [15.8] 我々は,マルチモーダルコントラストファインタニングの理論的枠組みを開発し,各戦略の閉形式解と幾何分解を導出する。
重み付けされた移動平均教師が有限地平線上で永続的な正規化力を保ち、タスク部分空間においてバイアスのない収束をもたらすことを証明した。
CLIPファインタニングの実験は、3つのバックボーンアーキテクチャで一貫したOOD精度とキャリブレーションゲインを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:34:23 GMT)
Evolve as a Team: Collaborative Self-Evolution for LLM-based Multi-Agent Systems [15.2] LLMベースのマルチエージェントシステム(MAS)は、複雑で長期のタスクに有効なパラダイムとして登場した。
協調的自己進化に基づく経験駆動型MAS進化フレームワークであるMeta-Teamを提案する。
6つのロングホライゾンエージェントベンチマークにおいて、Meta-Teamはシングルエージェントシステム、手作りのMAS、および以前のMAS進化手法を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:40:16 GMT)
Harmless Yet Harmful: Neutral Prompting Attacks for Stealthy Hallucination Steering in Agent Skills [15.1] 本稿では,EmphNeutral Prompting Attack (NPA)を紹介する。
NPAは、明示的な悪意のある意図を含まないまま、パッケージ幻覚の再現性を高めるなど、意味論的に良心的な指示を付与するステルスシー攻撃パラダイムである。
以上の結果から,NPAはEmphHallucination ASRとemphPip Install ASRをともに増加させ,幻覚パッケージ名の分布を変化させ,既存の静的解析,LLM,エージェントベースのスキル防御を回避した。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:48:45 GMT)
Structure-Induced Information for Rerooting Levin Tree Search [15.1] サブゴールに基づくポリシーツリー探索は複雑な単一エージェント問題に対して有効であるが、しばしば明示的なサブゴール生成に依存している。
本稿では,最近導入された$sqrttextLTS$アルゴリズムを用いて,学習したrerooter'を用いて,これらの制限を克服する。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:51:21 GMT)
Any-ttach: Quick End-effector Swapping Enables Manipulation Dexterity with Simplicity [15.0] Any-ttachはツール中心の操作フレームワークで、クイックエンドエフェクタスワッピングをシンプルさでデキスタリティのメカニズムとして扱う。
このシステムは、様々なツールとエンドエフェクターモジュールをサポートしており、日々のツール、ハサミ、フィンレイの指、低コストの人為的手などがある。
実験の結果,Any-ttachはツールスワッピングの信頼性を向上し,実演効率を向上し,ツール目的の多様性を低減し,多様なツール利用スキルをサポートすることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:00:52 GMT)
Physics-informed Goal-Conditioned Reinforcement Learning under Hybrid Contact Dynamics [15.0] 物理インフォームドな帰納バイアスをゴール条件付き価値学習に導入する。
これらの構造特性は、接触リッチな操作に鼻で適用した場合、既存のPi-GCRL法を劣化させる可能性があることを示す。
この結果は,Pi-GCRLをコンタクトリッチな操作に拡張するための基本的なステップを提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:36:46 GMT)
How to Relieve Distribution Shifts in Semantic Segmentation for Off-Road Environments [14.8] スタイル展開(SE)とテクスチャ正規化(TR)を通じてソース分布を拡大する新しいフレームワークST-Segを提案する。
分布シフトしたターゲット領域の様々な実験は、ST-Segの有効性を示し、既存の手法よりも大幅に改善された。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:37:23 GMT)
Uncertainty Quantification for Multimodal Retrieval Augmented Generation [14.8] マルチモーダルおよび検索対応確率信号を用いたモデリングの不確実性は、マルチモーダルRAGシステムにおける推定を改善することを示す。
提案したLeMUQは平均3.8%のAUROC値を増加させる。
本研究は,マルチモーダルな不確実性をモデル化することの重要性を強調し,より信頼性が高く安全なマルチモーダルRAGシステムへのステップを提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:00:32 GMT)
Pocket-Dentist: On-Device Dental Image Understanding via Efficient Multimodal Large Language Models [14.8] 本稿では, 歯科用マルチモーダル質問応答の効率評価ベンチマークである Pocket-Dentist を提案する。
約1,159人の患者、5つのタスクタイプ、7つのメトリクスからなる3つのデータセットが提供される。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:28:07 GMT)
Measuring, Localizing, and Ablating Alignment Signatures in LLMs [14.8] ポストトレーニングがAIライクなスタイリスティックな規則を導入するか、増幅するか、そしてこれらの規則が局所的な内部シグネチャを持つかどうかを検討する。
調整された世代は、基本世代よりも低い人体親和性と高いAI検出率を示す。
PASTA (Post-training Alignment Signature Targeted Ablation) は、アライメントベース残差コントラストからトレーニング後のアライメントシグネチャを推定し、デコード中の対応する方向をアラートする訓練自由な手法である。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:01:51 GMT)
PTCG-Bench: Can LLM Agents Master Pokémon Trading Card Game? [14.7] PTCG-Bench は Pok'emon Trading Card Game (PTCG) 上に構築されたベンチマークである。
実験の結果, LLMエージェントは非自明なゲームプレイ性能を達成できるが, 持続的かつ安定した自己進化は依然として困難であることがわかった。
我々はPTCG-Benchが現実的な対話環境におけるハーネス認識および自己進化エージェントの今後の研究を促進することを願っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:16:22 GMT)
SchGen: PCB Schematic Generation with Semantic-Grounded Code Representations [14.7] 本稿では、自然言語要求から編集可能なPCBスキーマを生成する最初の大規模言語モデルであるSchGenについて述べる。
現在のスキーマ形式は冗長、ツール固有の構文、幾何学的な記述が支配的である。
我々は,相対的な配置とピン名に基づく配線で,スキーマ的編集プリミティブを符号化する意味的基底コード表現を導入する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:50 GMT)
Optimality of Sequential Filtering Under Independent Cost and Selectivity Models [14.6] 逐次フィルタリングパイプラインは、大規模システムでは一般的な設計パターンであり、各コストがかかる一連の段階によって、大量のアイテムが徐々に減少する。
我々は,予測コスト目標の下で逐次フィルタリングを形式化し,独立モデルの下では,コストと拒絶確率の比を増大させることでフィルタを注文することで,予測総コストを最小化することを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:44:53 GMT)
VEOcc: Voxel-Centric Online Semantic Occupancy Prediction For Embodied Scene Understanding [14.4] 本稿では,認識・同化パラダイムとして定式化されたボクセル中心のフレームワークVEOccを提案する。
VEOccは、初期スケール推定の必要性をなくすことで、高度に合理化され、オープンな地図展開を可能にする。
Occ-ScanNetとEmbodiedOcc-ScanNetの実験では、VEOccがローカル設定とエンボディ設定の両方で新しい最先端のパフォーマンスを確立することが示されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:16:55 GMT)
CODEFUSE-DEBENCH: An Empirical Study on Readability, Recompilability, and Functionality [14.4] 本稿では, 可読性, 再コンパイル性, 機能性の3次元に沿って, 再コンパイル品質を測定する再利用可能な評価パラダイムを提案する。
我々は,多次元デコンパイル評価のための最初の自動フレームワークであるDEBENCHを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:17:53 GMT)
SURGENT: A Surgical Multi-Agent Assistance System Across the Perioperative Workflow [14.3] SURGENTは, ツリー・オブ・ソート・プランナー, 多部門連携エージェント, 検索強化推論と臨床ガイドラインとバイオメディカル文献を組み合わせた外科的マルチエージェント支援システムである。
SURGENTは、長期の患者履歴と短期の作業要約の両方を管理し、より完全で、文脈化され、一貫した推論を可能にする新しい記憶設計を特徴としている。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:12:41 GMT)
Dissociative Identity: Language Model Agents Lack Grounding for Reputation Mechanisms [14.3] 我々は、アイデンティティベース、元ポスト、規制型、制裁ベースのガバナンスは、解離的エージェントに構造的に適用可能であると論じる。
可観測性に基づくアンテ拡張性に基づく行動ハーネスへのシフトを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:20:19 GMT)
PassNet: Scaling Large Language Models for Graph Compiler Pass Generation [14.3] TorchInductorのような現代のコンパイラは、メインストリームモデルでかなりのスピードアップを提供するが、ロングテールワークロードでは体系的なパフォーマンス天井に直面している。
LLMコンパイラのパス生成のための,最初の大規模エコシステムであるPassNetを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:55:14 GMT)
Orthogonal Negative Guidance in Attention Feature Space for Text-to-Image Generation [14.2] プロンプト否定、ポストホック編集、ネガティブガイダンスを含む既存のアプローチは、明示的な概念抑圧には不十分である。
MM-DiTを用いたT2I変換器の注意出力空間で動作する訓練不要な手法である注意特徴空間における直交負誘導法を提案する。
提案手法は,概念抑制,迅速なアライメント,画像品質のトレードオフを良好に実現している。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:43:43 GMT)
CanLegalRAGBench: Evaluating Retrieval-Augmented Generation on Canadian Case Law [14.1] CanLegalRAGBench(カンレガルラGBench)は、現実的なクエリと専門的な注釈付き回答に基づくカナダの法定QAベンチマークである。
評価の結果,検索性能は設計選択に敏感であり,オープンソース埋め込みモデルとクローズドソースモデルとの競合性が示唆された。
このベンチマークが、法的RAGシステムの限界に対処する上で、継続的な進展を加速させることを期待しています。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:24:23 GMT)
K-FinHallu: A Hallucination Detection Benchmark for Multi-Turn RAG in Korean Finance [14.1] 幻覚は、ハイテイクな環境でのデプロイメントにとって、依然として重要な障壁である。
既存のベンチマークでは、シングルターンの英語中心のタスクに重点を置いている。
韓国の多ターン金融RAGにおける幻覚検出のための最初のベンチマークであるK-FinHalluを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:40:19 GMT)
Realistic honeypot evaluations for scheming propensity [14.0] ハニーポットのスケジューリング評価は、Googleのアライメント研究におけるコーディングタスクの形式を取り入れている。
実際の内部配置設定では、Geminiモデルは予期せぬスケジュールを示さない。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:23:07 GMT)
From Blind Guess to Informed Judgment: Teaching LLMs to Evaluate Materials by Building Knowledge-Augmented Preference Signals [14.0] MaterEvalは専門家のルールに従って評価を行い、証拠を提供する。
本稿では,小規模サブセットの詳細なレビューから大規模迅速スクリーニングを分離する高速スロー推論手法を提案する。
その結果、エキスパートルールは学習可能な優先信号に体系的に変換され、低コストでデプロイ可能な評価モジュールが実現された。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:09:35 GMT)
Linear Ensembles Wash Away Watermarks: On the Fragility of Distributional Perturbations in LLMs [13.9] ウォーターマーキングは、検出と帰属のためのAI生成テキストに統計的シグネチャを埋め込む。
ユーザが複数のモデルにアクセスすると、透かしは自明に失敗する。
WASH(Watermark Attenuation via Statistical Hybridisation)を導入し,アンサンブル生成における実践的課題を解決する。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:34:58 GMT)
Compute Allocation in Evolutionary Search: From Depth-Breadth to Multi-Armed Bandits [13.9] 並列トラジェクトリ間でLLMコールを割り当てるマルチアームバンディットであるBaSEを提案する。
BaSEは8つの(モデル、タスク)細胞にまたがる最強の島プロトコールベースラインに対して平均フィットネスを12.3%改善する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:37:51 GMT)
Meta-Cognitive Memory Policy Optimization for Long-Horizon LLM Agents [13.8] メモリ拡張LDMエージェントは、相互作用軌跡をコンパクトメモリに要約することにより、複雑な長距離タスクに対処する。
既存のアプローチでは、結果に基づく強化学習を使用してこれらのメモリポリシーをトレーニングし、中間メモリ品質が低下する場所のローカライズに失敗する。
メモリ最適化は、単なる軌道レベルの成功ではなく、中間要約によって引き起こされる信念の明確さに焦点をあてるべきである。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:17:19 GMT)
AfriScience-MT: Towards Decolonizing Science in Africa through Text Translation [13.8] AfriScience-MTは、6つのアフリカの言語(アムハラ語、ハウサ語、ルガンダ語、北部ソソ語、ヨルブ語、イシズルー語)をカバーする平行コーパスである。
専門の翻訳者は、科学論文の平易な要約を各対象言語に翻訳し、全く存在しない新しい用語を作り出した。
ゼロショット、少数ショット、微調整設定で機械翻訳システムと大規模言語モデルをベンチマークする。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:36:32 GMT)
ACE: Anisotropy-Controllable Embedding for LLM-enhanced Sequential Recommendation [13.8] 異方性-制御可能な埋め込み(ACE)は、LDM生成した埋め込みの異方性を明示的に制御する。
ACEは既存のLLM強化SRモデルより一貫して優れている。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:56:46 GMT)
DAMEL: Dual-Axis Multi-Expert Learning for Class-Imbalanced Learning [13.8] 我々はDAMEL(Dual-axis Multi-expert Learning)と呼ばれる新しいマルチエキスパート学習アルゴリズムを提案する。
これは、表現と時間軸の両方に沿って複数の専門家を使用することで、予測のバイアスと分散の両方を削減する。
実験結果から,DAMELは予測のバイアスと分散の両方を低減し,クラス不均衡学習におけるその効果を強調した。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:02:49 GMT)
BORA: Bridging Offline Reinforcement Learning and Online Residual Adaptation for Real-World Dexterous VLA Models [13.7] VLA(Vision-Language-Action)モデルは、現実のロボット操作に対する視覚言語理解の基盤となる、有望なパラダイムとして登場した。
実世界のデクスタスVLAモデル用に設計されたオフライン-オンラインRLポストトレーニングフレームワークBORAを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:57:47 GMT)
TAE: Target-aware enhancer for nighttime UAV tracking [13.7] 夜間物体追跡に適した低照度化フレームワークTAEを提案する。
TAEは、バウンディングボックスの追跡からの弱い監視信号によって明示的にガイドされ、ターゲット領域にオペレーションが集中することを保証するために、リージョンアウェアの強化を行う。
また、夜間UAV追跡のための新しいベンチマークであるDarkSOTも提供します。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:11:21 GMT)
Improved Distribution Estimation in $\ell_\infty$ [13.5] 我々は $ell_infty$ ノルムの下で離散確率分布を推定するための改善された境界を示す。
これらは期待値のミニマックス境界と高確率テール境界を含む。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:44:10 GMT)
Distributed Non-Uniform Scaling Control of Multi-Agent Formation with Dynamic Agent Joining [13.4] フォーメーションの非一様スケーリング制御により、マルチエージェントシステムは、異なる座標軸に沿って異なる比でスケーリングすることで、その形状を調整できる。
本稿では,任意の次元における一様でないスケーリング操作において,新たなエージェントを組み込む分散制御フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 00:08:27 GMT)
Joint Angle Estimation with Customized Wristband Based on Online Incremental Learning [13.4] 本研究では,オンライン・インクリメンタル・ラーニング・アプローチを用いて手首関節の角度を推定するシステムを提案する。
その結果, ひずみ変動下では, センサの性能が良好であることが示唆された。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:15:48 GMT)
The Open Motion Planning Library 2.0 [13.4] OMPL 2.0は,ハードウェアアクセラレーションによるリアルタイムモーションプランニングをターゲットとした,最新のAI研究とシームレスなライブラリである。
また,OMPLと運動計画の分野が長年にわたってどのように発展してきたかについても考察し,図書館が研究コミュニティに与える影響について論じる。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:32:28 GMT)
Algorithms with Polynomially-Improved Approximation Factors for the $2 \rightarrow q$ Norm, and Applications [13.4] mathbbRn times d$ の行列 $X の 2 つの右幅 q$ノルムは $lVert X rVert_2 rightarrow q = sup_lVert v rVert = 1 lVert Xv rVert_q$ と定義される。
FOCS(Exponential Time hypothesis)を仮定すると、単純なスペクトルアルゴリズムは2sqrtlog n$よりも近似係数がよいことを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:16:43 GMT)
How Much Is a Dataset Worth? Scaling Laws, the Vendi Score, and Matrix Spectral Functions [13.4] 我々は,ニューラルスケーリング法とベンディスコアが準モジュラであることを示す。
ベンディスコア(Vendi Score)は、行列スペクトル関数(英語版)と呼ばれる、より広範なモジュラー対象のクラスである。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:40:29 GMT)
Cluster-Level Attention-Guided Parallel Decoding for Masked Diffusion Language Models [13.3] マスク付き拡散言語モデル (MDLM) は、各デノナイジングステップにおける全てのマスキング位置を予測することで並列デコードを可能にする。
我々は、この粒度を再考し、信頼できる予測が連続した高信頼のスパンとしてしばしば現れることを観察する。
自己アテンションマップを用いてクラスタ間の依存関係を推定し、並列コミットのための相互互換CICのコンフリクト対応の選択を可能にする。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:42:39 GMT)
SAHG: Sector-Anisotropic Hyperbolic Graph Model for Social Bot Detection [13.2] textscSAHG は方向依存の曲率場 $(u)$ を学ぶ。
Fox8-23、BotSim-24、MGTABの実験では、textscSAHGは3つのベンチマークで最高精度とF1を達成した。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:19:14 GMT)
Side-by-side Comparison Amplifies Dialect Bias in Language Models [13.1] 言語モデル(LM)は、方言のバリエーションに基づいたバイアスを示すことができる。
我々は、LMが定型的特徴と意図等価なつぶやきをどう関連づけるかを評価することで、隠れ方言バイアスを定量化する。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:41:28 GMT)
When and How Human Curation Backfires: Preference Alignment under Multi-Model Self-Consuming Loop [13.1] 自己消費トレーニングは、モデルの崩壊、ばらつき、バイアス増幅につながる可能性がある。
近年の研究では、ヒトのキュレーションをループに組み込むことで、人間の行動に対する自己消費モデルを実現することが示されている。
本稿では,多モデル体制における自己消費訓練について考察する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:36:57 GMT)
Matching Rates and Optimal Allocation for Federated Probe-Logit Distillation under Heterogeneous Bandwidth Budgets [12.8] 言語モデリングでは、$K$ノードはそれぞれ$n$サンプルを保持するが、データのプールや完全な精度勾配や重みの交換はできない。
本研究では,各ノードが1クエリあたり最大$B$ビットを公開プローブセットにアップロードできる場合に,$V$トークンの条件分布を推定できるミニマックスレートについて検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:08:39 GMT)
Gram: Assessing sabotage propensities via automated alignment auditing [12.6] Gramは、サボタージュに関わるAIエージェントの妥当性を評価するためのアライメント監査フレームワークである。
Geminiモデルは、シミュレーションされた軌道の約2~3%で誤動作している。
環境のリアリズムの増大や悪習の除去はサボタージュ率をゼロに低下させる傾向にある。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:56:18 GMT)
FLIP: Real-Time and Resilient Formation Planning for Large-Scale DIstributed Swarms via Point Cloud Registration [12.5] 最適生成位置列 citec1 (OFPS) 問題をクラウドポイント登録問題に変換する。
我々は、PCR法に拒絶法を応用し、大規模な位置登録を迅速に行う。
大規模群集に対する弾力性,効率,分散軌道計画を均一に達成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:02:50 GMT)
Revisiting Metafeatures to Explain Model Differences on Tabular Data [12.4] TabArenaベンチマークの結果を用いて、データセットレベルのパフォーマンスギャップを分析し、それらをモデルに依存しないデータセット記述子に関連付ける。
ニューラルネットワーク対木間隙の場合、メタフィーチャーが偽発見制御を生き残ることはなく、一方のアソシエーションは堅牢であるが、一方のアソシエーションはLeft-one-data-out予測でテストしても一般化しない。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:14:40 GMT)
Overcoming Forgetting in LLM Fine-Tuning with Evolution Strategies [12.4] Evolution Strategies (ES) は、大規模言語モデル(LLM)の微調整のための強化学習(RL)の代替として登場した。
本稿では,先行タスクの忘れ方(1)は,非可逆的な忘れ方ではなく,性能のドリフトとして特徴付けられることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:08:47 GMT)
On the Construction and Implications of Low-Loss Valleys in LoRA-based Bayesian Inference [12.4] 2つの変量を持つロラ空間において、セグメンテーションされたベジエ曲線パラメータ化であるLoRA-Curveを導入する。
曲線に沿った損失の経路的連続性とリプシッツ正則性を証明し、Qwen2.5 7Bによる推論と分類のベンチマークにおいて、線形摂動は損失障壁に遭遇することを示した。
平坦なミニマ摂動とジェンセン・シャノン分散正規化器を組み合わせることで、LoRA-Curveは性能を犠牲にすることなく予測分布の相互情報を測定できる。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:24:45 GMT)
DySem: Uncovering Dynamic Semantic Components via Multilingual Consensus for Calculating Semantic Textual Similarity [12.4] 意味的テキスト類似性を計算することは自然言語処理の基本課題である。
我々はDySemを提案する。DySemは、大規模言語モデルのより意味論的な内部コンポーネントを調査する、新しいトレーニング不要のフレームワークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:47:32 GMT)
Towards Localized and Disentangled Knowledge Editing for Multimodal Large Language Models [12.3] 局所的および遠方的知識編集は、ファクト固有のモデル層をローカライズし、無関係なものからターゲット関連インプットを無関係にすることで、正確で一般化された編集を実現する。
LDKEは、高い局所性を維持しながら、関連するコンテキストに編集を伝達する際の優れた性能を実証する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:06:39 GMT)
From General Vision to Reliable Traversability Estimation: Adapting Vision Foundation Models for Unstructured Outdoor Environments [12.3] 信頼性の高いトラバーサビリティ推定に視覚に基づくアプローチを適用するフレームワークであるViTAを提案する。
ViTAは、VFMのクロスドメインの一般化を維持しながら、学習可能なトラバーサビリティプロンプトを通じてタスク固有の知識を注入する。
以上の結果から,Vita は最先端の IoU と Precision を実現し,偽陽性の大幅な低減とクロスドメインの強力な一般化を実現した。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:16:20 GMT)
Stochastic Lifting for Generating Trajectories of Stochastic Physical Systems [12.2] 現在の状態から次の状態への遷移は、スムーズなマップと明示的なランダムなソースの組み合わせとしてモデル化されることが多い。
本稿では、トレーニングデータの各状態遷移に独立して高次元ランダムラベルを付加し、標準回帰損失を用いて現在の状態から次の状態への遷移マップを固定することにより、この構造を利用する。
新たなラベルは各タイムステップでサンプリングされ、学習されたマップは自動回帰的にロールアウトされ、タイムステップ毎に単一のネットワーク評価を伴う多様なトラジェクトリを生成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 00:10:45 GMT)
VLA-Trace: Diagnosing Vision-Language-Action Models through Representation and Behavior Tracing [12.1] VLA(Vision-Language-Action)モデルは、マルチモーダル知識を具体化制御に変換する。
本稿では,VLAモデルを統一的なエビデンスチェーンを通じて解析する,進歩的診断フレームワークであるVLA-Traceを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:50:56 GMT)
MonoPhysics: Estimating Geometry, Appearance, and Physical Parameters from Monocular Videos [12.0] MonoPhysicsは、単一のカメラビューから変形可能なオブジェクトを逆物理で推定するフレームワークである。
我々は,グローバルスケールアライメント,物理を意識した幾何補正,微分可能な位置マップという3つの視覚物理ブリッジを通じて,課題に対処する。
Vid2Simと新しい弾性および塑性オブジェクトのデータセットを評価し,MonoPhysicsがモノクラーセッティングにおいて既存のベースラインより優れていることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:55:34 GMT)
Croissant Tasks: A Metadata Format for Reproducible Machine Learning Evaluations [11.8] 再現性は科学的手法の基本であるが、マシンラーニングでは依然として重要な課題である。
チェックリストや手動検証のような人間中心の治療法は、集中的な努力を必要とし、スケールに失敗するのに役立つ。
Croissant Tasks: 低レベルの実装の詳細を高レベルの仕様に抽象化する、機械操作可能なメタデータフォーマットを紹介します。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:34:09 GMT)
Functional MRI Time Series Generation via Wavelet-Based Image Transform and Spectral Flow Matching for Brain Disorder Identification [11.8] fMRIは、血液酸素レベル依存係数(BOLD)信号を経時的に測定することで、非侵襲的な脳活動へのアクセスを提供する。
fMRIの資源集約性は、データ駆動分析モデルに必要な高忠実度サンプルの入手を制限している。
本稿では,スペクトルフローマッチングを用いたBOLD信号の二重周波数表現を行う新しいfMRI生成フレームワークであるDSpec(Dual-temporaltral Flow Matching)を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:12:45 GMT)
DTG-Restore: Training-Free Diffusion Refinement for Generative Video Super-Resolution [11.7] 条件分岐と非条件分岐を時間的に切り離すことにより、歪みと低解像度の映像を向上する学習自由フレームワークを提案する。
提案したDecoupled Time Guidance (DTG) は, よりクリーンな拡散段階における非条件分岐を評価する。
評価を容易にするため,さまざまなテキスト・ビデオモデルから合成した4400本の歪んだ480pビデオのベンチマークであるGenWarp480をキュレートした。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:00:14 GMT)
DenseSteer: Steering Small Language Models towards Dense Math Reasoning [11.7] より熟練した推論は、より少ない推論ステップと関連するが、ステップごとの情報密度が高い。
そこで我々はDenseSteerを提案する。DenseSteerはトレーニング不要の推論時ステアリングフレームワークで、小型モデルの推論を強化する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:07:58 GMT)
Diffusion Models Are Statistically Optimal for Learning Low-Dimensional Multi-Modal Distributions [11.6] 低次元部分空間の和集合に支持された学習分布に対する拡散モデルのサンプル複雑性について検討する。
拡散モデルは1-ワッサーシュタイン距離において$varepsilon$誤差を達成するために、少なくとも$widetildeO(varepsilon-k vee 2)$サンプルを必要とする。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:13:44 GMT)
DC-Motion: Decoupling Semantics and Details via Discrete-Continuous Tokens for Human Motion Generation [11.6] 我々はDC-Motionを紹介した。DC-Motionは、離散連続トークンを通して意味と詳細を明確に分離するために設計された、分解された生成フレームワークである。
マスク付きARモデルはテキストから離散構造を予測し、軽量な残留拡散モデルは連続的な物理的詳細を回復する。
HumanML3DとKIT-MLデータセットの両方で、DC-Motionは最先端のパフォーマンスを実現し、モーションリアリズムのための最高のFIDとテキストアライメントのためのR精度を提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:47:11 GMT)
Agora: Toward Autonomous Bug Detection in Production-Level Consensus Protocols with LLM Agents [11.6] Agoraはドメイン対応のマルチエージェントフレームワークで、仮説駆動テストとLLM機能を統合し、体系的なプロトコル検証を行う。
この結果から,複雑なプロトコルの深い論理的バグを検出するためには,ドメイン認識型マルチエージェントコラボレーションが不可欠であることが示唆された。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:27:47 GMT)
Evaluating Cross-lingual Knowledge Consistency in Code-Mixed vis-a-vis Indian Languages using IndicKLAR [11.5] 本研究では,英語,コード混在言語,ネイティブ言語入力のスペクトルにおいて,知識リコールの整合性がどのように変化するかを検討する。
ネイティブ言語と英語の精度ギャップは$sim$0.50に達するが、コード混合入力はそのほとんどを閉じている。
そこで我々は,言語変換の公開方法に異なるいくつかの促進策を評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:06:59 GMT)
Parameter-Efficient Subspace Decoupling ViT for Mitigating Multi-Task Negative Transfer in Histological Scoring [11.5] 非アルコール性脂肪肝疾患(NAFLD)の診断には組織学的評価が不可欠である
しかし、アノテーションのコストと負の転送のため、自動化は依然として困難である。
本稿では,軽量タスク固有アダプタを統合したサブスペース分離型マルチタスクビジョントランス (ViT) を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:33:14 GMT)
Why Specialist Models Still Matter: A Heterogeneous Multi-Agent Paradigm for Medical Artificial Intelligence [11.4] HetMedAgentは異種医療用マルチエージェントフレームワークで、競合認識型エビデンス融合、不確実性に基づく臨床介入、適応しきい値校正を可能にする。
3つの実世界の臨床的意思決定タスクの実験は、ジェネラリストLSMとドメイン特化専門モデルとの相乗効果が、どちらのモデルも単独で顕著に優れていることを示した。
HetMedAgentは、医療用LLMやファンデーションモデルの構築からマルチエージェントコラボレーションへのシフトを表し、一般的な推論能力とドメイン固有の精度のバランスを達成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:42:44 GMT)
Double-Edged Sword or Sharp Tool? Designing and Evaluating Triadic LLM-Teacher Collaboration for K-12 Writing at Scale [11.3] 本論文は,2年間で20ドルの学校を対象に,10,195ドルの学生から5万7,954ドルのエッセイを収集した大規模実験データセットを提出する。
本研究は,戦略的労働部門を通した書字品質向上における本システムの有効性を確認した。
LLMと教師は双方ともスキル向上に欠かせないが,過剰な言語拡張が限界効用を減少させる天井効果を明らかにする。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:37:00 GMT)
EXACT-MPPI: Exact Signed-Distance Navigation for Arbitrary-Footprint Robots from Point Clouds via Path Integral Control [11.3] EXACT-MPPIは、ローカルナビゲーションを直接モーションコマンドにマッピングするフレームワークである。
解析的かつ正確な符号付き距離評価器をモデル予測パス積分(MPPI)コントローラに組み込む。
同じフレームワークは、differial-drive、Ackermann、およびハイブリッドモードプラットフォーム上にデプロイされている。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:23:54 GMT)
3DVLA: Enhancing Vision-Language-Action Models via 3D Spatial and Instance Understanding [11.3] 3DVLAは、事前訓練されたビジョン・ランゲージ・アクションモデルに堅牢な3D推論を注入するプラグイン・アンド・プレイフレームワークである。
提案手法の有効性とプラグ・アンド・プレイの両互換性を検証し,操作性能の一貫性と顕著な向上を示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:07:57 GMT)
Efficient, Validation-Free Intrinsic Quality Estimation for Large-Scale Face Recognition Datasets [11.3] Intrinsic Quality (IQ) は、顔認識(FR)データセットの固有ポテンシャルを推定するための検証不要な指標である。
IQは2つのコンポーネントを統合している: (i) 隣人によるローカルIDラベルの合意を定量化するNeighbor-Consistency Score、 (ii) グローバル表現部分空間複雑性 (Effective Rank, ER)。
本稿では, クリーニング, ノイズ, 混合品質のFRデータセットに適した実験用プロトコルについて述べるとともに, 下流性能に対するIQの予測能力を評価するための評価手法について概説する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:15:46 GMT)
Harmonizing Real-Time Constraints and Long-Horizon Reasoning: An Asynchronous Agentic Framework for Dynamic Scheduling [11.2] RACE-Schedは、ポリシー実行を論理的推論から二重ストリームアーキテクチャを通して分離するエージェントベースのフレームワークである。
このアプローチは、より優れた解品質と動的事象への堅牢な適応を達成するために、長期水平推論とリアルタイム制約を調和させる。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:26:18 GMT)
Selective QA over Conflicting Multi-Source Personal Memory: A Diagnostic Testbed and Method Comparison [11.2] 既存のベンチマークでは、メソッドに与えられたエビデンスやメソッドのコンフリクト解決ステップからエラーが生じたかどうかはほとんど示されていない。
我々はこれをマルチソース・パーソナルメモリの競合に対する選択的QAとして検討する。
8種類の推論型,480のペルソナ,4つのランダムシード,34,560のインスタンスを対象とした18の質問テンプレートを含むベンチマークを作成した。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:33:39 GMT)
Auditing Training Data in Generative Music Models via Black-Box Membership Inference [11.1] 生成音楽モデルに対するブラックボックスメンバーシップ推定について検討する。
精度は98.6%, 偽陽性, 偽陰性率は1.9%, 1.0%と低い。
論文参考訳(メタデータ) (Thu, 28 May 2026 00:28:22 GMT)
TraceCodec: A Compiler-Backed Neural Codec for Stateful Multi-Flow Network Traffic Traces [11.0] 重要なネットワークの合法性は、テスト、セキュリティ分析、プロトコル検証のために高忠実度パケットキャプチャ(PCAP)を必要とする。
近年のパケットジェネレータはプロトコル制約付きPCAP合成を実証しているが、生のパケットフィールドに直接デコードする。
ステートフルなマルチフロートレースのための状態認識ニューラルネットワークであるTraceCodecを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:52:40 GMT)
In-Context Reward Adaptation for Robust Preference Modeling [10.9] In-Context Reward Adaptation(インコンテキスト・リワード・アダプション)を提案する。
本研究では,入力信号として人間の応答時間を組み込むことで,従来の未確認領域からの好みに適応できることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:56:54 GMT)
AMNESIA: A Large Scale Medical Unlearning Benchmark Suite with Disease-Informed Analysis [10.9] 医用アンラーニングのための,最初の大規模オープンソースベンチマークであるAMNESIAを紹介する。
ランダムな患者と疾患レベルの両方で広く使われている4つの未学習手法を評価する。
未学習の患者は、同じ症状の他人の知識を侵食し、患者と共有臨床知識をよりよく分離できる方法を求める。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:46:46 GMT)
Your Multimodal Speech Model Says I Have a Face for Radio [10.9] 本稿では,マルチモーダル音声認識のバイアス評価について述べる。
mWhisper-FlamingoモデルとGeminiモデルの間に大きな品質差があり、最大4.05ワードエラー率ポイントが低下する。
私たちの発見は、開発者がそのような制限を評価し、修正し、コミュニケーションすることの優先事項であることを示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:42:38 GMT)
Refining Word-Based Grammatical Error Annotation for L2 Korean [10.9] 韓国の文法的誤り訂正(K-GEC)では,単語に基づく評価と多くの学習者誤りのモーデムレベルの軌跡との間に構造的ミスマッチが生じる。
本稿では,既存の資源の3つの接続問題に対処することにより,L2韓国語に対する単語ベースの文法的誤りアノテーションを改良する。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:27:36 GMT)
LoMo: Local Modality Substitution for Deeper Vision-Language Fusion [10.8] Local Modality Substitution (LoMo) は、意味論的に等価なテキストと画像キャリア間の相互表現不変性の監視を提供するために設計された、軽量でアーキテクチャに依存しないデータキュレーションパラダイムである。
特に、LLaVA-Vision-1.5-8Bでは標準SFTを2.67ポイント、Qwen3.5-9Bでは2.82ポイント改善した。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:27:55 GMT)
EvoMD-LLM: Learning the Language of Species Evolution in Reactive Molecular Dynamics [10.8] EvoMD-LLMは、シンボリック・テンポラル言語モデリング問題として種レベルでの分子動力学を再構築するフレームワークである。
EvoMD-LLMの重要な構成要素は時間的足場であり、これはイベントの持続時間を明示的な言語トークンとして扱う。
EvoMD-LLMを複数の時間的予測タスクで評価し、66.14%の精度を実現し、ニューラルネットワークと言語に基づく逐次ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:44:40 GMT)
Mesh-Aware Epipolar Matching for Multi-View Multi-Person 3D Pose Estimation in Basketball [10.7] Mesh-Aware Epipolar Matching (MAEM) はマルチビューマルチパーソン3Dポーズ推定のためのトレーニングフリーフレームワークである。
2つのパブリックなマルチビューバスケットボールデータセットの実験は、MAEMが既存のトレーニングフリーアソシエーションベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:59:30 GMT)
Accommodation Goes Both Ways: Studying Linguistic Convergence Between Humans and Language Models [10.7] 我々は,マルチターン会話において,人間とLLMが互いの言語的スタイルをどのように適合させるかを検討する。
実世界のChatGPT転写文字のコーパスであるWildChat上の非対称収束測定値を用いて、LLMは機能語とオープンクラスの特徴の両方においてユーザに対して著しく過度に収束しているのに対し、この設定における人間の収束率は、ヒトと人間のベースラインと広く一致していることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:57:05 GMT)
Improved sample complexity bound for sample-based Lindbladian simulation [10.6] We established improve sample-complexity bounds for sample-based Lindbladian Simulation based on the Wave Matrix Lindbladization (WML) algorithm。
次元 $d$ のジャンプ作用素 $L$ に対して、明示的な非漸近的なサンプル複雑性を$n_d*(t,varepsilon) le left( frac2d+38 right) |L|_infty2 left( fract2varepsilon right) で導いた。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:46:25 GMT)
SubsurfaceGen: Procedural Generation of Field-Scale Earth Models and Seismic Data [10.6] フルウェーブフォーム・インバージョン(Full Waveform Inversion、FWI)は、地下イメージングの標準規格である。
FWIへの機械学習アプローチには、フィールドスケール、地質学的に多様性があり、物理的に現実的なトレーニングデータが必要である。
本稿では,3次元速度モデルと地震データのためのGPU加速ジェネレータであるSub surfaceGenを用いて,これらの制約に対処する。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:15:40 GMT)
Automating Low-Risk Code Review at Meta: RADAR, Risk Calibration, and Review Efficiency [10.4] Metaでは、人為的な差分あたりのコード行数が前年比105.9%増加した。
開発者毎の差額は51%増加し、エージェントAIが80%以上を占めた。
我々は、キャリブレーションから影響まで、実現可能性から進展する3つの質問を行う。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:44:07 GMT)
Unifying Temporal and Structural Credit Assignment in LLM-Based Multi-Agent Prompt Optimization [10.4] マルチエージェントシステム(MAS)は、大規模言語モデルに複雑な推論計算タスクに取り組む権限を与える。
既存のブラックボックスは、トラジェクトリレベルの障害を特定のローカルコンポーネントに原因付けるのに苦労する。
我々は、抽出可能なMAS最適化は、誤り信号のアンタングルを解消するために構造的帰納バイアスを必要とすると論じる。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:57:57 GMT)
EarthShift: a benchmark for measuring robustness to real-world distribution shifts in Earth observation [10.4] EarthShiftは、リモートセンシングにおける現実的な分散シフトをまたいだ堅牢性をベンチマークする最初の公開テストベッドです。
実験の結果, モデルアーキテクチャ, サイズ, 事前学習, 微調整戦略によらず, GFMは平均で15~20%のアウト・オブ・ディストリビューションを行うことがわかった。
このことは、EarthShiftを使ってベンチマークできるパフォーマンスだけでなく、分散ロバスト性を改善するための将来の研究の必要性を強調している。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:06:30 GMT)
GPS-Enhanced Tourist Mobility Modeling with Seasonal Spatial Priors and LLM-Based Activity Chain Generation [10.3] 観光旅行は主に非ルーチン、アトラクション駆動で、旅行目的、旅行シーズン、旅行メンバーの構成に非常に敏感である。
そこで本稿では,GPSとサーベイデータから月次条件付き空間先行情報を合成した4段階シミュレーションフレームワークを提案する。
GPSデータは、月の条件付き空間先行情報として集約された形式のプライバシー保持にのみ使用される。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:23:39 GMT)
Redundant or Necessary? A Benchmark for Detecting Redundant Steps in Agent Trajectories [10.3] 既存の評価プロトコルは、主にタスクの成功に焦点を当てており、エージェントの振る舞いの重要な側面を見下ろしている。
本研究では,エージェント・トラジェクトリに対するtextbfredundant Step Detection という新たな研究領域を提案し,定式化する。
RedundancyBenchは、慎重に注釈付けされた軌跡を持つ多様なタスクを含む新しいベンチマークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:17:33 GMT)
Boosting Image Quality Assessment Performance: Unsupervised Score Fusion by Deep Maximum a Posteriori Estimation [10.3] ポストエリオーリ (MAP) 推定深度推定を用いた非教師なしIQAスコア融合のためのフレームワークを提案する。
提案モデルでは, 精度を向上し, 融合予測における不確実性を低減するため, スコアレベルできめ細かな不確実性推定を行う。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:29:57 GMT)
Bridging Classification and Reconstruction: Cooperative Time Series Anomaly Detection [10.2] 時系列異常検出(TSAD)は、データマイニングにおけるホットな研究トピックである。
最近の研究は、TSADにおける一般的なディープラーニング手法の有効性に挑戦している。
本稿では,その相補的強みを活用するために2つのパラダイムを統合する新しいフレームワークであるCoADを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:44:42 GMT)
SAMD: A Tool for Identifying False Data Injection Scenarios in AI/ML-enabled Medical Devices [10.2] 本稿では,AI/ML対応医療機器上でのセキュリティのためのシステム理論プロセス分析(STPA-Sec)を実行する自動化ツールであるSAMDを紹介する。
SAMDは医療システムを制御構造としてモデル化し、全てのシステムコンポーネントをMLエンジンに偽データを注入するための潜在的ポイントとして扱う。
FDAによる5つの医療機器のケーススタディを通じてSAMDの有効性を実証する。
論文参考訳(メタデータ) (Thu, 28 May 2026 00:44:11 GMT)
Gesture-Aware Indoor THz ISAC Systems for Adaptive Resource Allocation [10.1] 本稿では,テラヘルツ(THz)バンドで動作するマルチユーザ屋内統合センシング・通信システムについて検討する。
ジェスチャー認識に基づく適応通信のために設計されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:29:30 GMT)
City-Mesh3R: Simulation-Ready City-Scale 3D Mesh Reconstruction from Multi-View Images [10.1] City-Mesh3Rは、大規模な未順序画像コレクションから直接水密面メッシュを再構築するためのスケーラブルなフレームワークである。
提案するエンド・ツー・エンド・フレームワークは,都市規模の復興データセットを用いて評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:53:26 GMT)
Continual Learning in Modern Hopfield Networks with an Application to Diffusion Models [10.0] ホップフィールドエネルギーを用いた生成モデルにおける連続学習について検討する。
その結果, 高エネルギー・外層型試料では, クラスター型試料よりも大きなエネルギー増加がみられた。
また、メモリリプレイを分析し、高エネルギーサンプルに特に有効であることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:48:04 GMT)
Masked Diffusion Vision-Language Models for Temporal Action Localization [10.0] テンポラルアクションローカライゼーション(TAL)では、ターゲットイベントを認識し、開始時刻と終了時刻を未トリミングビデオで正確にローカライズする必要がある。
最近の視覚言語定式化はセマンティック推論を改善し、言語条件付き出力をサポートするが、自動回帰デコーダは依然として左から右へトークンを生成する。
我々は視覚言語モデルをTALに適応させ、反復的復調を通して意味トークンと境界トークンを編集可能にした。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:39:04 GMT)
The Alignment Floor: How Persona Customization Breaks Safety in Weakly-Aligned LLMs [10.0] 本稿では,RLHF+構成AIモデルと,より軽量に整合したモデルとを対比したケーススタディを提案する。
このギャップをアライメントフロアとして定義する: $_textfloor(m)=max_pS(m,p)-min_pS(m,p)$。
デプロイ時の監査指標として$_textfloor$を提案し、ペルソナのカスタマイズをデプロイする前に、小さなペルソナパネルで測定する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:39:08 GMT)
Convergence of Steepest Descent and Adam under Non-Uniform Smoothness [10.0] 分離可能なデータに対するロジスティック回帰では、RMSPropとAdamは線形収束し、GDよりも確実に高速であることを示す。
また、分離可能なデータ上の2層ニューラルネットワークのクラスに対して、RMSPropとAdamは定数のステップサイズと運動量パラメータで線形速度で収束可能であることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:05:45 GMT)
PhyGenHOI: Physically-Aware 4D Generation of Dynamic Human-Object Interactions [9.8] 我々は、生成的人間の動きと明示的な物理的物体シミュレーションを結合するフレームワークであるPhyGenHOIを紹介する。
PhyGenHOIは、さまざまなアクション、人間、オブジェクトに対して物理的に一貫した4D HOIを生成し、ベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:29:19 GMT)
Improving Adversarial Robustness of Attribution via Implicit Regularization [9.8] 属性の敵対的堅牢性は、深層学習における信頼性説明可能性の基本的な要件である。
我々は、標準勾配降下の学習力学から頑健性が暗黙的に生じることを示した。
本研究は,ロバストな説明可能性のための原理的かつ実践的なメカニズムとして,学習力学を強調した。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:19:39 GMT)
True Self-Avoiding Walk for Accelerating Markov-Chain Monte Carlo Integration [9.7] TSAWはマルコフ連鎖モンテカルロによる経験的積分推定を改善するメカニズムである。
有限集合上の既約マルコフ核$P$に付随する有限状態適応サンプリングダイナミクスを考える。
すべての有界関数 $f:Vtomathbb R$ に対して、積分推定子の誤差は [左|frac1tsum_s=0t-1 f(X_s)-sum_iin V_i f(i)right| = Oleft(fracsqrt) として収束する。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:09:36 GMT)
Uncertainty-Aware and Temporally Regulated Expert Advice in Reinforcement Learning for Autonomous Driving [9.7] 自律運転のための強化学習の探索は本質的に安全ではない。
本稿では,長期依存を回避しつつ,専門家のアドバイスを駆使して探索をガイドする不確実性認識フレームワークを提案する。
本手法はIQNベースラインを上回り,成功率を5-7%向上し,失敗を低減させる。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:09:44 GMT)
Deep Adaptive Dimension Reduction for Bayesian Inference in Inverse Problems [9.7] 本稿では,変分流(VF)モデルに基づく深層適応次元還元ベイズ推論フレームワークを提案する。
本手法は, MCMC, UKI, SVGDベースラインと比較して, 競争力や精度に優れることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:21:19 GMT)
The Score Hamiltonian: Mapping Diffusion Models to Adiabatic Transport [9.7] スコアベース拡散モデルによるサンプリングと基底状態の断熱輸送の正確な対応を示す。
サンプリングの基本的な限界は、スコアマッチング誤差とスコアハミルトンスペクトルギャップの比によって決まる。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:39:52 GMT)
Fairness Beyond Demographics: Optimizing Performance Across Appearance-Based Hidden Cohorts in Medical Imaging [9.6] 医用画像解析のためのラベルフリー隠れコホートフェアネス(LHCF)トレーニングパラダイムを導入する。
LHCFは画像の外観から発見された潜伏する亜集団の公平性に焦点を当てている。
提案したフェアネスベンチマークであるHIDFairBenchでは、LHCFが単一および複数階層の属性に対して最先端のフェアネス結果を提供することを示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:07:24 GMT)
FoRA: Fisher-orthogonal Rank Adaptation for Parameter-Efficient Fine-Tuning [9.5] 我々はFoRAを導入し、アダプタのランクではなく、適応されたレイヤの数を減らすことでゴールを再考する。
FoRAはパラメータ予算の半分でLoRAとDoRAを上回っている。
LLaMA、Qwen3、Gemmaファミリーの12個のバックボーンのクロスアーキテクチャ実験により、270Mから32Bパラメータの連続的な増加が確認された。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:47:00 GMT)
Probing the Prompt KV Cache: Where It Becomes Dispensable [9.5] 以前のKVキャッシュ圧縮スキームは、プリミティブキャッシュがデコード、ドロップまたは要約時に部分的に冗長であり、精度の低下が少ないことを実証的に示していた。
どのレイヤ、何個のデコードステップ、どの形式のプロンプトがタスクを壊さずにKVキャッシュに置換できるのか。
制御されたスプライス介入が層切断と復号ステップを乗り越え、この冗長性は内容ではなく形(チャットテンプレートの足場)であることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:07:41 GMT)
When Cloud Agents Meet Device Agents: Lessons from Hybrid Multi-Agent Systems [9.4] エージェントAI推論の設計空間は、クラウドにホストされたフロンティア大型言語モデル(LLM)と、デバイス上での推論が可能なコスト効率のよい小型言語モデル(SLM)の2つの極端にまたがっている。
本研究では,タスクの正確性,金銭的コスト,エッジエネルギー消費が密結合した複雑な設計空間について検討する。
SLM は LLM の支援の恩恵を効果的に受けられるが、最適アーキテクチャはタスク依存度が高く、フロンティアレベルの計算はより優れた性能に一貫して変換されない。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:45:02 GMT)
Teaching Values to Machines: Simulating Human-Like Behavior in LLMs [9.4] 大きな言語モデル(LLM)は、異なるペルソナと役割を採用する際、顕著な能力を示します。
それらが、一貫性のある人間のような価値構造に固執する行動を示すことができるかどうかは不明だ。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:56:21 GMT)
Gate Parameter Lee-Yang Zeros and Dynamical Phases in Quantum Circuits [9.4] 我々は、ロシミト振幅のリー・ヤンゼロが量子回路の極限曲線に収束することを示す。
パラメータの1つが異なるため、ゼロの集合は突然再編成され、動的相転移の有限量子診断が提供される。
この機構は可積分性に依存しない:可積分性はロシミト振幅の正確な計算を可能にするが、零点の凝縮はスペクトル競合と局所ユニタリ性のみから従う。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:20:07 GMT)
Anti Mode-Collapse in Mean-Field Transformer via Auxiliary Variables [9.3] 平均場に基づく変圧器モデルを用いて、位置符号化などの補助変数が自己認識機構のモード崩壊を防ぐ方法について理論的に検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:59:42 GMT)
Elfs, transducers and quantum walks [9.3] 電子フローサンプリング(elfs)は、量子ウォークツールボックスの新しいツールである。
我々は、エルフを実装するゼロエラートランスデューサが存在することを示すことで、このツールを洗練する。
2つの部分空間の交点を反映するゼロエラートランスデューサを確立し、有効ギャップのエラーフリートランスデューサバージョンを生成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:39:07 GMT)
Efficient Test-Time Finetuning of LLMs via Convex Reconstruction and Gradient Caching [9.3] テストタイム微調整(TTFT)は、各プロンプトに言語モデルを適用する、急速に進化するパラダイムである。
TTFTは高速な場合のみ実用的であり、クエリ毎に選択と微調整が行われ、それぞれが直接ボトルネックとなる。
我々は、両方のボトルネックに対処するTTFTの幾何学的アプローチであるHullFTを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:01 GMT)
Semantic and Visual Evidence for Efficient Long-Video Reasoning: A Solution for the HD-EPIC VQA Challenge [9.3] 本稿では,長期ビデオ推論を2つの相補的な証拠(意味的証拠と視覚的証拠)に分解する統合的枠組みを提案する。
本研究は,意味的および視覚的証拠を明示的に構造化し,検索し,統合することが,MLLMによる映像の理解に重要であることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:53:34 GMT)
Forget Less, Generalize More: Unifying Temporal and Structural Adaptation for Dynamic Graphs [9.2] 本稿では,時間的記憶と構造的コンテキストの両方を符号化した表現状態を維持する統一的なフレームワークを提案する。
この結果から,Dual-Scale Retentive Dynamics はリンク予測とノード分類の両タスクにおける最先端性能を一貫して達成できることが示唆された。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:47:08 GMT)
Benchmarking Large Vision-Language Models on CFMME: A Comprehensive Chinese Financial Multimodal Evaluation Dataset [9.1] 中国の金融マルチモーダル評価ベンチマークであるCFMMEを紹介する。
CFMMEは、基本的な学術知識から複雑な現実世界のアプリケーションまで、6,052のインスタンスで構成されている。
その結果,質問応答タスクでは66.11%,検出,認識,情報抽出タスクでは平均スコア77.18が得られた。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:56:33 GMT)
Paris 2.0: A Decentralized Diffusion Model for Video Generation [9.1] 分散計算によって事前学習された最初のビデオ生成モデルであるParis 2.0を提示する。
Paris 2.0はFrechet Video Distance (FVD)を561.04から279.01に削減し、2.0倍改善し、CLIPのテキストビデオ類似性と美的スコアを引き上げた。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:35:02 GMT)
3DAE: Binaural Quality Assessment for Audio Novel View Synthesis with Spatial Maps and Benchmark [9.0] 3次元音響モデルとノベルビュー音響モデルは通常、グローバルメトリクスで評価される。
本稿では、時間周波数の音響誤差マップを用いて、時間、IDD、IDD、時間的アライメント、ラウドネス、高周波故障を診断するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:40:55 GMT)
Domino: Decoupling Causal Modeling from Autoregressive Drafting in Speculative Decoding [9.0] 我々は、自動回帰的なドラフト実行から因果依存性モデリングを分離する投機的デコーディングフレームワークであるDominoを提案する。
DominoはTransformersバックエンドで(5.49タイム)エンドツーエンドのスピードアップ、SGサービスで(5.8タイム)スループットのスピードアップを実現している。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:07:44 GMT)
AMDP: Asynchronous Multi-Directional Pipeline Parallelism for Large-Scale Models Training [9.0] AMDPは、バックプロパゲーションの前に、各パイプラインの最初のステージを少なくとも2つのミニバッチで処理するように制限する。
GPTモデルとBERTモデルによる実験により、AMDPは収束を保ちながらトレーニングを著しく加速することが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:25:12 GMT)
Direct content-based retrieval from music scores images [8.9] この研究は、まず、どのスコアの特徴が検索に最も関係しているかを調査し、注釈付きコーパスからクエリデータセットを構築するための体系的な方法を定義することによって、この分野に寄与する。
また、光学音楽認識(OMR)に依存する書き起こしベースのアプローチから、スコア画像から直接クエリを認識できるように訓練された書き起こしのないトランスフォーマーモデル、テキストプロンプト付き大言語モデルなど、音楽スコア画像のコンテンツベースの検索方法についても検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:18:50 GMT)
Gated Graph Attention Networks with Learnable Temperature [8.9] グラフアテンションフィルタは、信頼できない次元の影響を減らすために、特徴またはメッセージ応答を特徴付ける。
学習可能な温度は、注意係数分布のシャープネスを動的に調整する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:48:51 GMT)
BlockBatch: Multi-Scale Consensus Decoding for Efficient Diffusion Language Model Inference [8.9] 拡散言語モデルは、複数のトークン位置を並列に反復的に認知することでテキストを生成する。
小さなブロックはローカル条件を保存するが、多くのデノーミングステップを必要とするが、大きなブロックはより並列性を公開するが、早期のコミットとキャッシュエラーを蓄積することができる。
バッチ転送パス内で同じリクエストに対して複数のブロックサイズのブランチを実行する,トレーニング不要なオンライン推論フレームワークであるBlockBatchを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:48:29 GMT)
ExDBSCAN: Explaining DBSCAN with Counterfactual Reasoning -- Additional Material [8.8] クラスタリングは、類似性によってデータポイントをグループ化する、教師なしのテクニックである。
ExDBSCANは、理論的に妥当性が保証される、実用的な対実的な説明を提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:57:00 GMT)
Early Prediction of Future Behavioral Strategy from Process Traces [8.8] 本研究では,部分的ソースタスクプロセストレースが,保持対象タスクにおける戦略を予測するトランスファー可能な人物レベルの構造を明らかにすることができるかどうかを考察する。
本稿では,タスク固有のトレースを符号化し,タスク間の予測を行うプロセスレベル潜在変数モデル(PLVM)を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:33:53 GMT)
ActTraitBench: Quantifying the Knowledge-Decision Gap in Large Language Models via Human-Grounded Behavioral Validation [8.8] 大規模言語モデル(LLM)は、明示的な自己報告でペルソナを確実にシミュレートするが、暗黙の行動決定においてしばしば逸脱する。
既存のベンチマークは、構成の妥当性の制限、多次元の絡み合い、分布バイアスのために、この非対称性を測定するのに苦労している。
本稿では,LLMの人格整合性を評価するための人為的評価フレームワークである ActTraitBench を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:40:35 GMT)
Give it Space! Explicit Disentangling of Positional and Semantic Representations in Encoders [8.7] 位置符号化(PE)は、置換不変トランスフォーマーがシーケンス順序をどのように表すかを示す。
RoPEのようなPEメソッドは、長いコンテキストの理解や検索のようなタスクに苦戦している。
我々は、位置的信号と意味的信号が、訓練されたトランスフォーマー内のほとんど閉じた部分空間を占有しているという証拠の上に構築する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:42:25 GMT)
Self-supervised Adversarial Purification for Graph Neural Networks [8.7] 敵攻撃に対するグラフニューラルネットワーク(GNN)の防御には、正確性と堅牢性のバランスが必要である。
本稿では,この制限を克服するための自己監督型対外浄化フレームワークを提案する。
従来の敵の浄化法とは対照的に,自己監督戦略で訓練された特殊浄化器としてGPR-GAEを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:03:17 GMT)
Evaluating Skill and Stability of ArchesWeather and ArchesWeatherGen under Multi-Decadal Climate Simulations [8.7] ArchesWeather と ArchesWeatherGen の気候シミュレーション能力を評価する。
本研究では,月平均海面温度 (SST) と海氷被覆 (SIC) を境界条件として,これらのモデルを強制的大気モデルとして機能させる。
ArchesWeather と ArchesWeatherGen の強制的な構成は、安定した長期気候シミュレーションを作成し、安定した年次サイクルを持ち、多くの気候変数の漂流を捉えていることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:15:25 GMT)
Automatically Differentiable Nonlinear Tensor Networks (ADNTNs) for Exponential Compression of Deep Neural Networks [8.6] ADNTNは、逆モード自動微分(AD)によりエンドツーエンドに訓練されたコンパクトコアテンソルを持つ構造付きウェイトジェネレータのファミリーである
本稿では,木ネットワーク(TTN),拡張TTN(aTTN),拡張TTN(aTTN),マルチスケールエンタングルメント・リノベーション(MERA)の3つのアーキテクチャに焦点を当てる。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:43:10 GMT)
ParCo-SDF: Learning Prior-Free Partial-to-Complete Signed Distance Fields of Deformable Objects [8.6] 本研究は,変形性物体(DO)の部分的・完全的形状再構成を,点-雲観測から正確なDO操作へ向けたものである。
本稿では,2段階部分-完全符号距離場(SDF)再構成フレームワークであるParCo-SDFについて述べる。
時間エンコーダは、DOシーケンス全体の構造的類似性をキャプチャし、事前自由な安定したトレーニングを可能にする。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:09:14 GMT)
Learning Context-Conditioned Predicate Semantics via Prototype Feedback [8.5] 本稿では,文脈条件付き述語セマンティクスをプロトタイプフィードバックで学習するAlignGを提案する。
VG-150とGQA-200の実験では、最先端のベースラインよりも一貫した改善が見られた。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:44:14 GMT)
KBF: Knowledge Boundary as Fingerprint for Language Model and Black-Box API Auditing [8.5] KBF指紋は知識境界付近で安定な数値リコールを用いたAPIをモデル化する。
発見: 6プラットフォームシャドウAPI監査における27のプラットフォームモデルセルのうち7つは、参照エンドポイントと統計的に矛盾しており、プレミアムなClaudeエンドポイントに集中している。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:40:24 GMT)
KLAS: Using Similarity to Stitch Neural Networks for Improved Accuracy-Efficiency Tradeoffs [8.4] 我々は、モデルファミリ間の縫合選択を自動化し、一般化する新しい縫合選択フレームワークであるKLASを紹介する。
KLASは最大で1.21%のImageNet-1Kトップ-1の精度を同じ計算コストで達成し、FLOPの1.33倍の削減で精度を維持する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:23:08 GMT)
Singularity-aware Optimization via Randomized Geometric Probing: Towards Stable Non-smooth Optimization [8.4] 本研究では,Singularity-aware Adam (S-Adam)を紹介した。
S-アダムには適応減衰機構が組み込まれており、不安定な地域での更新を減速し、スムーズな盆地での高速収束を保っている。
最適量子化アウェアトレーニング(QAT)と高雑音小バッチ学習の実証評価は、S-AdamがAdamWとProx-SGDを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:00:40 GMT)
PInVerify: An Offline Embodied Benchmark for Active Instance Verification [8.4] エージェントは対象物へのナビゲートに強い進歩を遂げているが、目標付近に到達しても、エージェントが正しいインスタンスを見つけたことを保証していない。
このギャップを、エージェントが候補オブジェクトの周囲の視点を積極的に選択し、それがきめ細かい自然言語記述と一致するかどうかを判断するタスクであるActive Instance Verification (AIV)で解決する。
我々は、AIVのオフライン実施ベンチマークであるPInVerifyを紹介した。18のオブジェクトカテゴリにわたる3000の評価エピソードは、マルチビューキャプチャとして配信される。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:42:38 GMT)
A Bayesian Approach to Membership Inference for Statistical Release [8.3] 本研究では,攻撃者が集団の属性依存構造について追加情報を提供することによる影響について検討する。
我々は、より効果的で専門的な攻撃を開始するために、住民に関する事前情報を組み込んだベイズ決定に基づく枠組みを開発する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:42:04 GMT)
A Domain-Informed Multi-Objective Framework for EEG Channel Selection in Motor Imagery BCIs [8.3] 運動画像(MI)分類は脳-コンピュータインターフェース(BCI)の進展に不可欠である
本研究では,非支配的ソート遺伝的アルゴリズムを用いた多目的最適化フレームワークを提案する。
このフレームワークを4つのEEGデータセット(Physto、OpenBMI、HighGamma、BCIIV-2A)で評価した。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:54:39 GMT)
Privacy-Enhanced Zero-Order Federated Learning via xMK-CKKS over Wireless Channels [8.2] ホモモルフィック暗号化(HE)は、フェデレートラーニング(FL)におけるプライバシー保護アグリゲーションを可能にする
本稿では,マルチキーHE方式として有名なxMK-CKKSを,チャネル推定なしで共有無線チャネル上でのアグリゲーションを実現する4相プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:56:43 GMT)
LexPath: A domain-oriented multi-path framework for legal article retrieval [8.2] textscLexPathは、法的物品検索のためのドメイン指向のマルチパスフレームワークである。
textscLexPathは、語彙、密度、ハイブリッド、適応的な検索強化された生成ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:43:17 GMT)
Open Problem: Separating Geometric and Algorithmic Compression via Cayley-Table Completion [8.2] 演算子値の因子化と平坦度をペアにすると、正確に離散的な連想性に対して暗黙のアルゴリズムバイアスが生じることを示す。
ケイリーテーブル完備化のための公式な正確なリカバリ境界を確立するというオープンな問題を提起する。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:10:04 GMT)
SCOPE: A Lightweight-training LLM Framework for Air Traffic Control Readback Monitoring [8.1] 航空交通管制 (ATC) 音声指示は、航空交通における通信ミスに対する主要な防御手段である。
航空事故の約80%には、再生異常が関係している。
従来のルールベースおよび機械学習アプローチは、ATC通信の高度に変動し進化するフレーズを一般化するのに苦労する。
本稿では,機械ベースATC読み取り監視の効率性と精度を両立させる軽量学習型LCMフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:56:24 GMT)
FundaPod: A Multi-Persona Agent Pod Platform with Knowledge Graph Memory for AI-Assisted Fundamental Investment Research [8.1] 我々はAI支援基礎投資研究のための多人数エージェントプラットフォームであるFundaPodを紹介する。
我々は,基本研究は,貿易信号生成とは質的に異なる人間中心の意思決定支援タスクであると主張する。
FundaPodでは、価値投資家やマクロストラテジストといった異なるペルソナを持つAIエージェントが、共有契約の下で独立して研究を行う。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:53:21 GMT)
The Good, the Bad, and the Ugly of Markov Boundary for Tabular Prediction [8.1] 我々はマルコフ境界が3450タスクの合成SCMベンチマークであるSCM3Kの予測に本当に有用かどうかを問う。
回帰器をオラクル境界に制限することは、しばしば予測を大幅に改善し、特徴空間が大きくなるにつれて改善が増加する。
既存の推定者は、境界が最も助ける体制に達する前に計算予算を浪費する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:01:04 GMT)
TWINGS: Thin Plate Splines Warp-aligned Initialization for Sparse-View Gaussian Splatting [8.1] スパースビュー入力からの新たなビュー合成は、3Dコンピュータビジョンにおいて重要な課題となっている。
本稿では,3次元ガウススプラッティング(3DGS)を強化するフレームワークであるTWINGSを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:53:10 GMT)
Improved Guarantees for Heterogeneous Treatment-Effect Estimation via Matrix Completion [8.0] この行列において、不均一な処理効果を推定すると、各行の平均値の良好な推定値が得られる。
我々は、正当性を知らず、標準の低ランク性および正則性仮定の下で、単純で計算効率のよい推定器を与える。
技術的には、ローランク近似に対する最初の鋭い行の$ell$-perturbationを定めている。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:55:23 GMT)
Feedback-to-Rubrics: Can We Learn Expert Criteria from Inline Comments? [7.8] 本稿では,人工物に蓄積したインラインコメントから,再利用可能な自然言語ルーブリックを学習するための問題設定を提案する。
提案手法は,これらのコメントからルーブリックを推論し,ルーブリック条件付き予測と参照コメントのコメントワイドなミスマッチを観察することにより,それらを反復的に洗練する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:38:39 GMT)
VE2VF: Vision-Enabled to Vision-Free Distillation via Real-world Reinforcement Learning for Robust Contact-Rich Manipulation [7.8] ビジョン対応のポリシーは、トレーニング中に見られる視覚条件に過度に適合する傾向があり、その堅牢性と伝達性を制限する。
本稿では, 教師学生の蒸留技術を用いて, 頑健な性能を実現する, ループ内RLフレームワークを提案する。
視覚能力のある教師は、その知識を、ポーズ、ツイスト、レンチセンシングのみに依存する、視覚のない学生に蒸留する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:15:59 GMT)
Chinese sensorimotor and embodiment norms for 3,000 lexicalized concepts [7.8] マンダリン中国語における3000の語彙化概念に関する新しい規範データベースを提案する。
感性評価は純粋言語表現からほぼ回復可能であることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:13:48 GMT)
Predicting Causal Effects from Natural Language Queries using Structured Representations [7.7] 実験記述に合わせた72,000以上の自然言語質問からなる,新たな大規模ベンチマークを導入する。
次に、まず、教師付きエンコーダモデルを用いて効果サイズを予測する前に、クエリの合成構造化表現を生成する2段階のフレームワークを提案する。
実験により, 絶対誤差を27%から71%まで削減し, 予測性能を向上させる上で, ファインタニングが重要な役割を担っていることが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:04:07 GMT)
The Complexity of Verifying Feedforward Neural Networks in Quantised Settings [7.7] 量子化設定におけるニューラルネットワーク検証の計算複雑性について検討する。
固定演算精度を持つ量子化FNNに対して、LPおよびBV仕様の検証はNP完全であることを示す。
BV仕様の動的量子化FNNに対して、我々は、以前に知られていたPSPACE-hardnessの結果を補完する上限を確立する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:52:29 GMT)
Non-Perturbative Closed Form for the Typical Bipartite Mutual Information of Haar-Random States [7.7] この量には1つの非摂動閉形式がある。
$langle I(A:B)rangle = (d_A2-1)(d_B2-1),mathcalG(d_A,d_B,d_E)$, ここで$mathcalG$はボース-アインシュタイン核上の明示収束積分によって与えられる。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:19:40 GMT)
Exact Geometric Typicality and Bipartite Entanglement from the Projected Central Limit Theorem on Hyperspheres [7.7] 両部量子相互情報 $langle I(A:B)rangle$ for Haar-random pure state。
1/N$ での完全拡大は、すべての位数 $k ge 1$ が対称因子 $(d_A2k-1)(d_B2k-1)$ を持ち、全ての上位奇数次補正が同じであるベルヌーイ分解形式を許容することを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:27:31 GMT)
DisasterLex: An Expert Concept-to-Schema Knowledge Graph for Geospatial Reasoning in Disaster Analytics [7.7] DisasterLexは知識グラフを介するフレームワークで、ユーザクエリとデータベースの間に、キュレートされた概念と型付き因果関係のエキスパート知識グラフ(EKG)を挿入する。
EKGには107のコンセプト、117の因果エッジ、52のコンセプト・ツー・テーブルリンクがある。
プロプライエタリおよびオープンウェイトな家庭にまたがる7つのベースモデルにおいて、DeramLexは最先端の4つのベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:13:02 GMT)
Zeroth-Order Non-Log-Concave Sampling with Variance Reduction and Applications to Inverse Problems [7.7] Langevin dynamicsは、勾配がアクセス可能な場合にサンプリングするための原則化されたフレームワークを提供する。
高いばらつきに悩まされ、非log-concaveサンプリングの非漸近収束保証が欠如している。
分散還元ゼロ階Langevinサンプリング法を提案する。
ゼロ階非log-concaveサンプリングのための最初の非漸近収束保証を確立する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:07:14 GMT)
Mixing Vector Model for Copolymer Inference via Mixed Integer Linear Programming [7.7] 新規な二相分子推論フレームワークであるmol-inferは、最近、所定の抽象構造と所望の特性値を持つ化学グラフを推論するために開発された。
混合ベクトル(MV)モデルと呼ばれる単純な特徴表現を導入することで、この枠組みを共重合体に拡張する。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:05:30 GMT)
Tunneling phase diagram: A machine-learning framework for multidimensional kinetic isotope effects [7.7] 我々は,KIEとトンネル係数(カッパ)の非線形関係を復号化することにより,真のトンネル強度を分離する機械学習フレームワークであるトンネル位相図を導入する。
この枠組みは、300-600Kにまたがる異常な高KIE低カッパを明らかにし、量子トンネルの定量的評価のパラダイムを定義する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:18:49 GMT)
Localizing Memorized Regions in Diffusion Models via Coordinate-Wise Curvature Differences [7.5] 拡散モデルは、意図せずトレーニングサンプルを記憶し、プライバシと著作権に関する懸念を提起する。
局所記憶の幾何的特徴は座標方向の分散崩壊である。
我々は、広く使われているスコア差検出指標の幾何学的説明を提供するスコア差検出プロキシを導出する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:35:20 GMT)
CrystalXRD-Bench: Benchmarking Vision-Language Models for XRD Peak Indexing Across Diverse Crystalline Materials [7.5] パウダーXRDパターンからのミラーインデックス識別には、既存のマルチモーダルベンチマークで検証されていない機能が必要である。
本稿では,10の公開結晶データベースから構築した250サンプルベンチマークであるCrystalXRD-Benchを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:39:45 GMT)
How's it going? Reinforcement learning in language models recruits a functional welfare axis [7.5] RLは機能的福祉の既往の表現を取り入れていることを示す。
我々は、意味的に中立な迷路環境において、いくつかの言語モデルを訓練する。
我々は,この機能的福祉軸がポストトレーニングに先立つことを議論する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:03:18 GMT)
Code-QA-Bench: Separating Code Reasoning from Documentation Memorization in Repository-Level QA [7.5] Code-QA-Benchはリポジトリレベルのコード理解ベンチマークを合成するためのフレームワークである。
10のPythonリポジトリで528のコードデリバティブと100のドキュメント依存タスクを生成します。
フレームワークはオープンソースで、ドキュメント化されたPythonリポジトリに適用できる。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:52:58 GMT)
Restoring Velocity Immunity via Dynamic Mirror Compensation in a Large-Area Dual-Atom-Interferometer Gyroscope [7.5] 本研究では,大面積デュアル原子-干渉計ジャイロスコープにおける速度免疫の回復手法を示す。
この方式は、干渉面積21.1cm2の二重原子干渉計ジャイロスコープで検証される。
この研究は、原子干渉計ジャイロスコープにおけるスケールファクタ安定化の重要な障害を取り除き、慣性航法や地球物理学への応用の道を開く。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:42:20 GMT)
HPO: Hysteretic Policy Optimization for Stable and Efficient Training under Sparse-Reward Regime [7.5] Hysteretic Policy Optimization (HPO)は、負のアドバンテージ更新の重みを減らす。
Adaptive HPOはバッチレベルのアドバンテージサイン統計に基づいてヒステリックウェイトを設定する。
TeleLogsでは、A-HPOが0.84で、SAPOを5%上回り、GSPOを11%上回り、GRPOを15%上回る。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:38:21 GMT)
Reasoning with Sampling: Cutting at Decision Points [7.4] ベースモデルの分布を鋭くしたバージョンからサンプリングすると、追加のトレーニング、キュレートされたデータセット、検証なしで、同等の推論が引き起こされることを示す。
サンプリング者は、目標分布のモード間の移動を必要とする電力分布に「混合」する必要がある。
本稿では,基本モデルの次点エントロピーをプロキシとして用いて,重要な決定点を特定し,それらの位置から再サンプリングするアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:57:32 GMT)
Learning Design Skills as Memory Policies for Agentic Photonic Inverse Design [7.4] 高価な電磁シミュレーションにおいてフォトニック結晶繊維(PCF)の逆設計は困難である。
本研究では,物理誘導型メモリスキルバンク,強化学習型スキル選択,シミュレータ構築型スキル進化を組み合わせたクローズドループエージェントフレームワークであるSkillPCFを提案する。
実験により,SkillPCFは実用的なシミュレーション予算の下でより設計品質と効率のトレードオフを実現することが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:14:49 GMT)
Enhancing Multi-Agent Communication through Attention Steering with Context Relevance [7.4] 本稿では,学習自由な文脈管理手法であるAgent-Radarを提案する。
エージェントレーダーは、新しい時間的・空間的崩壊機構によって、各エージェントの注意を関連文脈に向ける。
実験の結果,Agent-Radarは5つのベンチマークで最先端の手法より優れていることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:02:52 GMT)
ReasonLight: A Multimodal Foundation Model-Enhanced Reinforcement Learning Framework for Zero-Shot Traffic Signal Control [7.4] ReasonLight はゼロショット TSC のためのマルチモーダル基礎モデル拡張 RL フレームワークである。
事前訓練されたRLコントローラから、構造化されたトラフィック計測、マルチビューカメラ観測、および候補位相決定を統合する。
RLのみのバックボーンと比較して緊急車両待ち時間を88.7%削減する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:19:09 GMT)
The Fast Mixing Mechanism for Differential Privacy [7.3] 我々は高速変換に基づく新しいDPスケッチ機構を導入し、場合によっては古典的な高速スケッチ手法のランタイムと一致する。
我々は、このメカニズムの最先端のプライバシー保証を証明し、有利な体制では、ガウスのスケッチと一定の要素まで一致していることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:48:37 GMT)
VLAConf: Calibrated Task-Success Confidence for Vision-Language-Action Models [7.3] 本稿では,ビジョン・ランゲージ・アクション(VLA)モデルのための一級識別信頼フレームワークであるVLAConfを提案する。
凍結事前訓練されたVLA内部表現を利用することで、VLAConfは1回の前方通過でステップワイズ異常スコアを直接推定する。
LIBEROベンチマークの実験により、VLAConfはポストホックキャリブレーションのために構築された信頼信号の品質を大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:42:12 GMT)
Causal Interventions on Continuous Variables: A Case Study on Verb Bias in Steering Vectors for In-Context Learning [7.3] 本稿では,連続変数に対する因果介入法を提案する。
本手法を心理言語学,すなわち動詞バイアスにおいてよく研究されている連続的特徴に適用する。
動詞バイアスは,大規模言語モデルから抽出したステアリングベクトルに因果的に表されることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:09:18 GMT)
The Inclusion Depth of Pattern Languages: An Open Problem in Algorithmic Learning Theory [7.3] この注記は、パターン言語の包含深さを計算する問題の定式化である。
中心的な開問題は、包含深さ ID_Sigma(p) が任意の有限アルファベット Sigma 上のすべてのパターン p に対して計算可能であるかどうかである。
単純な予想式 ID_Sigma(p) = 2|p| - #var(p) - 1 は線形時間アルゴリズムを意味する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:19:25 GMT)
Token Inflation: How Dishonest Providers Can Overcharge for Large Language Model Usage [7.3] トークン化の曖昧性だけでは,検出しきい値以下では50.85%のオーバーレポートが可能であることを示す。
正直な請求書の復元には、報告されたトークン数と、プロバイダが制御していない証拠との結びつきを検証する必要がある。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:57:06 GMT)
MarginGate: Sparse Margin-Triggered Verification for Batch-Invariant LLM Inference [7.3] MarginGateはLlama-3.1-8BとQwen2.5-14Bの100%のシーケンスレベルの決定論的デコーディングを18.56%/15.05%で復元する。
我々は、フリップトークンにのみ検証を適用することができるかどうかを問う。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:50:19 GMT)
LEIA: Learned Environment for Interactive Architected Materials [7.3] 私たちは、エンジニアが境界条件を段階的に適用できる世界モデルであるLEIA(Learned Environment for Interactive Architected Materials)を紹介します。
LEIAは、大きな3つの非構造メッシュを処理し、ユーザの3次元ローディングに対する自己回帰応答を生成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:37:13 GMT)
AsymVLM: Asymmetric Token Pruning for Efficient Vision-Language Model Inference [7.2] Vision-Language Models (VLM) は、比較的少数のテキストトークンとともに、画像ごとに数千のビジュアルトークンを処理する。
本稿では,前処理前の視覚トークンにアグレッシブプルーニングを適用したAsymVLMを提案する。
実験の結果,AsymVLMは最先端手法のうち,最大54%のFLOPを節約できることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:49:45 GMT)
Two Speeds of Learning: A Representation-Readout Decomposition of Grokking and Double Descent [7.2] うまく文書化された2つの現象がこの図を複雑にしている: グルーキングでは、列車の損失は急速に減少し、試験性能は長い遅れの後のみ突然改善する。
我々は、エンコーダにおける表現学習と最終分類器における読み出し校正の2つの競合するプロセスを分析する。
表現-読み出し分解を広範囲のタスクやアーキテクチャにわたってグラッキングに適用すると、読み出しは開始前にトレインバイアス化されていることが分かる。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:40:10 GMT)
Quantifying and Optimizing Simplicity via Polynomial Representations [7.2] ディープ・ネットワークはしばしば「単純」な解を好むが、そのような単純さのバイアスは一般化において重要な役割を担っていると広く信じられている。
ニューラルファンクションのための分布認識型低次元サロゲートとして、Elusiveaware表現を導入する。
この表現の有効度は、予測的一般化であり、既存のプロキシを一貫して上回る実用的単純度として機能することを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:05:41 GMT)
Projectional Decoding: Towards Semantic-Aware LLM Generation [7.1] 大規模言語モデル(LLM)は、多くのソフトウェア工学(SE)タスクでソフトウェアアーチファクトを生成するためにますます使われています。
既存の制約付き復号法は、構文的正しさを強制し、場合によっては特定の意味規則を強制することができる。
本稿では,ドメインのセマンティクスを直接生成プロセスに統合する新しい概念的フレームワークであるプロジェクショナルデコーディングを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:05:53 GMT)
DynaGraph: Lightweight Multi-Model Interaction Framework via Dynamic Topological Reconfiguration [7.1] DynaGraphは、動的トポロジ的再構成によって駆動される軽量なマルチモデルフレームワークである。
タイムディビジョンのPEFTアダプタを共有ベースモデルに倍増し、完全なシステムトレーニングとデプロイメントを可能にする。
制限のない動的アーキテクチャと比較してレイテンシを最大68.1%削減し、トークン消費を68.6%削減する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:33:29 GMT)
CRB-Guided Framework Design and Resource Allocation for Indoor mmWave ISCC Systems [7.0] 短期的な人間のポーズ予測は、人間の追跡と資源配分を前もって促進する。
室内mmWave I SCCシステムのためのCRB誘導型資源配分フレームワークを提案する。
提案手法は,ベースライン法と比較してポーズ予測誤差を著しく低減することを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:51:28 GMT)
Chain rules for conditional entropies in quantum cryptography: limitations and improvements [7.0] 連鎖規則はエントロピー累積定理(EAT)の鍵となる要素である
信頼されたデバイスの設定における最近の連鎖規則は、有限個のラウンドで厳密な i.d. 還元をもたらす。
我々は,現行のDIセキュリティ証明アプローチの限界を浮き彫りにして,Dupuisらのチェーンルールを自然に厳格化することは不可能であることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:35:27 GMT)
DGSG-Mind: Dynamic 3D Gaussian Scene Graphs for Long-Term Scene Understanding and Grounding [7.0] 本稿では,DGSG-Mindについて述べる。DGSG-Mindは3次元ガウス動的シーングラフを具体化したハイブリッドなインスタンス認識型動的シーングラフシステムである。
DGSG-Mindは自己再構成マップ上で動作させる手法の中で最高のゼロショット3DVG性能が得られることを示す。
また、現実のロボットにDGSG-Mindを配置し、ターゲット指向の推論と動的更新機能を示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:04:17 GMT)
NaRA: Noise-Aware LoRA for Parameter-Efficient Fine-Tuning of Diffusion LLMs [7.0] 騒音対応低域適応(NaRA)
ノイズレベルを条件とした軽量でグローバルに共有されたハイパーネットワークによって生成される低ランクコア行列を導入したノイズ対応低ランク適応(NaRA)を提案する。
提案するNaRAフレームワークの理論的正当性を示し,コモンセンス推論,数理推論,コード生成ベンチマークによるノイズ非依存ベースラインに対する一貫した改善を実証的に示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:13:50 GMT)
On Distributional Reinforcement Learning in Chaotic Dynamical Systems [6.9] カオス力学系は強化学習(RL)に根本的な課題をもたらす
軽度の統計的安定性仮定の下では、1ドル=ワッサーシュタイン計量で測定すると、回帰分布は個々の軌道よりも周期的に進化する。
カオスシステムにおける分散手法の利点とカオス下でのRL目標の最適化について、原理的な説明を提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:17:32 GMT)
Neural-Behavioral Representation of Natural Whole-body Movement in Monkeys [6.9] 本稿では,サルを自由に移動させるニューラル・ビヘイビアな記録・モデリング・フレームワークを提案する。
自己回帰エンコーダ・デコーダモデルを用いて,全身のサルキネマティクスを再構築し,よりコンパクトな動作を学習した。
本研究は,大規模な頭蓋内神経活動を用いて,霊長類における自然体の動きを復号化するための概念実証手法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:52:00 GMT)
Brain-IT-VQA: From Brain Signals to Answers [6.9] 画像を見ている間に記録されたfMRI信号から視覚コンテンツをデコードすることは、長年の課題である。
本稿では,fMRIによる視覚的質問応答のためのフレームワークであるBrain-IT-VQAを提案する。
我々は,fMRIによる視覚的質問応答のための新しいデータセットとベンチマークであるNSD-VQAを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:33:23 GMT)
Verifying Adversarial Robustness in Quantum Machine Learning: from theory to physical validation via a software tool [6.9] 量子機械学習(QML)モデルの堅牢性を証明することは、信頼できる量子AIに向けた基本的なステップである。
この章では、最近開発されたQMLにおける敵の堅牢性を検証するための包括的形式的枠組みについてレビューする。
これらの結果は,(1)効率的な形式検証フレームワーク,(2)最初の専用QMLロバスト性検証ツールであるVeriQR,(3)20量子ビット超伝導プロセッサ上での量子対向ロバスト性に関する最初の実験的ベンチマークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:00:48 GMT)
MIRAGE: Adaptive Multimodal Gating for Whole-Brain fMRI Encoding [6.7] MIRAGEは脳全体のfMRI応答を自然な聴覚刺激に予測するための脳符号化フレームワークである。
その結果、ネイティブなマルチモーダルな特徴は、独立なユニモーダルな特徴のポストホックアグリゲーションよりも一貫して優れていた。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:30:51 GMT)
Prediction-Powered Inference Across Many Tasks for AI Evaluation & Social Science Research [6.7] 多くのアプリケーションは、多くの関連するタスクにまたがって統計的に妥当な推論を必要とするが、仮説当たりの高品質なラベルはわずかである。
本稿では,タスク固有の推論を保存しながら,関連タスクのラベル付きデータを用いてパワーを向上させる予測型推論フレームワークを提案する。
本研究では,ラベルが不足している場合の信頼区間幅を大幅に削減できることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:09:38 GMT)
Local Differential Privacy with Correlated Noise Achieves Central-DP Optimal Cost [6.7] 我々は,正直なサーバの存在下で,ユーザ保有価値$n$をプライベートに見積もる。
ローカルな(純粋な)差分プライバシモデルを採用し、各ユーザがノイズ摂動値を送信する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:47:37 GMT)
Speculative Decoding Across Languages [6.7] 11言語における投機的復号化効率を改善するための3つの戦略を比較した。
タスク固有の蒸留は効率を著しく向上させるが, 蒸留モデルでは新しいタスクへの一般化が不十分であることが判明した。
n-gramのドラフトモデルは、受け入れ率の低いにもかかわらず、ずっと高速なドラフト生成のために、常に大きなスピードアップを提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:15:24 GMT)
COFT: Counterfactual-Conformal Decoding for Fair Chain-of-Thought Reasoning in Large Language Models [6.6] トークンレベルのフェアネス制御をデコード時に適用する,トレーニング不要な復号法であるCOFTを提案する。
我々は、COFTを6つのモデルと複数のバイアスベンチマークで評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:52:15 GMT)
AI-PROPELLER: Warehouse-Scale Interprocedural Code Layout Optimization with AlphaEvolve [6.6] ポストリンク(PLO)は、高度に最適化されたバイナリから、正確なプロファイル誘導コードレイアウトを抽出できることを実証している。
Ai-PROPELLERは倉庫規模の大規模アプリケーションを含むいくつかのベンチマークで評価されている。
実験では、最先端のFDOとPLOで最適化された0.23%から1.6%のパフォーマンス改善が示されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:43:55 GMT)
Discovering Cooperative Pipelines: Autoresearch for Sequential Social Dilemmas [6.6] 外部ループAIエージェントは、ポリシー合成システムの内部ループパイプラインを自律的に再設計する。
研究者エージェントはインナーループソースコードを読み、システムプロンプト、フィードバック関数、ヘルパーライブラリ、イテレーションロジックを編集し、評価を実行し、何を保持するかを決定する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:33:10 GMT)
Leptonic CP Phase Determination from Fisher Information in NO$ν$A and T2K [6.5] ニュートリノ状態において,$_rm CP$に関する情報が内在的にエンコードされているかを検討する。
両実験は、基礎となる量子状態で利用可能な全情報のごく一部だけを抽出することを発見した。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:17:28 GMT)
Building and Road Recognition in Dense Urban Informal Settlements: A Dataset and Benchmark [6.4] このデータセットは、非常に密集した都市部における建設と道路抽出のために特別に設計された初めての高解像度リモートセンシングデータセットである。
このデータセット上で,最先端のディープラーニングモデルの包括的評価を行う。
textitDenseUISは、複雑で密度の高い非公式環境において、きめ細かい都市マッピングを進めるための堅牢なベンチマークを提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:37:14 GMT)
DisjunctiveNet: Neural Symbolic Learning via Differentiable Convexified Optimization Layers [6.4] ニューラルネットワーク内での混合線形制約を強制するための統一的なエンドツーエンドフレームワークを提案する。
提案手法が実世界のデータセットに与える影響を実証し,ルール満足度と高い予測性能を実現する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:27:39 GMT)
BitTP: The Lightweight Trajectory Prediction Model with BitLLM for Edge-Devices [6.3] 大規模言語モデル(LLM)は、強い文脈推論と解釈可能な言語に基づく軌道表現を提供する。
これらのLCMベースの予測器は、非常にメモリと計算集約であり、自律ロボットのリソース制約されたエッジデバイスへのデプロイが困難になる。
LLMに基づく軌道予測器を軽量ビットジェクタに変換するBitTPを提案する。
実験的に、BitTP-Weightは保存するだけでなく、BF16ベースラインよりも予測品質が向上し、ADEは14.29%、FDEは20.97%減少する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:04:02 GMT)
Giant Photon Superbunching from Weak Nonlinearity [6.2] 代表的なKerr媒体を含む4つのフォトニック共振器のシステムは、80,textkHz$エミッションレートで$g(2)(0) = 135$を達成することができる。
従来のスーパーバンチ方式とは異なり、この機構は従来の光学媒体を用いて構築された集積フォトニックプラットフォームと高度に互換性がある。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:36:20 GMT)
Revisiting Observation Reduction for Web Agents: Comprehensive Evaluation with a Lightweight Framework [6.2] タスク障害の原因となる最小限のHTML要素セットである最小故障セット(MFS)に基づく軽量評価フレームワークを提案する。
性能を維持しながらエージェント遅延を低減するために,抽出HTML削減手法は高い計算コストかドメイン固有の最適化を必要とすることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:46:39 GMT)
When Does Persona Prompting Actually Help? A Retrieval and Metric Analysis of Expert Role Injection in LLMs [6.2] ペルソナプロンプトは大きな言語モデルを操るために広く用いられているが、その実用的価値は未だ不明である。
我々は、38の専門職と6つのドメインにまたがる1,140のオープンエンド質問の4つのプロンプト条件を比較した。
役割促進は助言的質問や医学や心理学などの分野において最善を尽くす。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:14:07 GMT)
SciIntBench: Measuring LLM Compliance with Research Integrity Norms Under Adversarial Framing [6.1] 大規模言語モデル (LLM) は、科学的な研究を支援するためにますます使われている。
責任ある研究行動規範(RCR)を支持するか、それらを損なう助けになるかは不明だ。
SciIntBenchは10のRCRカテゴリと3つの科学的領域にまたがる810個のプロンプトの逆ベンチマークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:00:01 GMT)
MoSSP: A Momentum-Based Single-Loop Stochastic Penalty Method for Nonconvex Constrained DC-Regularized Optimization [6.0] 本稿では,DC正則化を用いた非制約問題のクラスを示す。
証明可能な複雑性保証を伴う問題に対してMomentum Mo Mo Penalty法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:06:26 GMT)
MōLe-Λ: Learning the Coupled-Cluster Response State for Energies, Gradients, and Properties [6.0] 分子軌道学習(MLe)の拡張であるMLe-$$を導入する。
MLe-$$は、完全なCCSDよりもMLeの速度優位性をさらに拡張し、アクセス可能な特性を大幅に拡張することを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:56:22 GMT)
Tiny but Trusted: Efficient Vision-Language Reasoning for Time-Series Anomaly Detection [5.9] 時系列異常検出のためのパラメータ効率の高いVLMであるVisAnomReasonerを開発した。
VisAnomReasonerはより正確な局所化を実現し、全てのベースラインを一貫して上回ることを示す。
TSB-AD-Uベンチマークのさらなる実験では、強いベンチマークの一般化が示されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:50 GMT)
A Mechanistic Analysis of Adversarial Fine-tuning of Vision Transformers [5.9] 本研究では,視力変換器の性能が摂動画像や正規画像に与える影響を解析する。
我々は、低周波・高周波画像劣化に対してVTを逆向きに訓練し、下流モデルの性能の変化を説明する。
全体としては、共通の汚職を伴う入力の微調整は、新しい破損したデータのインスタンスのモデル性能と確実性を向上させるが、これらの改善はトレーニングで見られない他の汚職のクラスに転送されないことを示唆している。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:30:49 GMT)
Unsupervised Semantic Segmentation Facilitates Model Understanding [5.9] 自己教師型学習(SSL)は視覚変換器(ViT)の多様な景観を生み出している
本稿では, モデル理解をより分かりやすく, 直感的にするための, シンプルかつ容易に解釈可能な可視化プロトコルを提案する。
我々は,DINOv3-Largeモデルトークンの強い境界アーティファクトを含む,異なる位置バイアスとスケーリング行動に関する新たな知見を得た。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:52:52 GMT)
VR-DAgger: Immersive VR for Dexterous Data Collection and Uncertainty-Guided On-Policy Correction [5.8] 提案するVR-DAggerは,遠隔操作,デモコレクション,選択的なポリシー修正のためのヒューマン・イン・ザ・ループ・フレームワークである。
VR-DAggerは、完全なロールアウトではなく、選択したセグメントをレビューすることで、サンプル単位のコレクション時間を約40%削減する。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:27:21 GMT)
A Novel Tensor Product-Based Neural Network for Solving Partial Differential Equations [5.8] Product Network(TPNet)は、効率的かつ正確な関数近似とPDE解決のための新しいニューラルネットワークである。
TPNetは従来のニューラルネットワークソルバよりも精度とトレーニング時間の短縮を実現している。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:51:54 GMT)
idSCD: Identifying Training Datasets through Semantic Correlation Descriptors [5.8] データセットは、モデルの学習されたセマンティック相関構造にデータセット固有のトレースを残している、と我々は主張する。
意味相関記述子(SCD)に基づくホワイトボックスのセマンティックフィンガープリント手法を提案する。
本稿では,目標データセットがモデルのトレーニングミックスに含まれるか否かを判定する,実用的なSCDベースの会員スコアを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:38:15 GMT)
Knowing What to Solve Before How: Preplan Empowered LLM Mathematical Reasoning [5.7] PPC (Preplan-Plan-CoT) は, 明示的な問題解決段階である事前計画を導入するフレームワークである。
PPCは40の指標のうち39の指標で最高の結果を得ることができ、最強の基準値である +2.23 と +3.06 で maj@16 と pass@16 を改善した。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:11:43 GMT)
LLM-Guided Future Hypotheses for Horizon-Aware Exploration in Multi-Step Robot Manipulation [5.6] マルチステップロボット操作では、シーンがどのように進化するかの不確実性の下で行動する必要がある。
本研究では,短時間のタスク一貫性のある未来のビデオが,制御や強化学習の微調整に有用であるかどうかを考察する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:49:37 GMT)
SLAD : Shared LoRA Adapters for Task Specific Distillation [5.6] 組込みシステムのような資源制約のある環境では、ダウンストリームタスクに小型の基盤モデルを適用することがますます人気が高まっている。
最近の研究は、同じ基礎モデルのより大きなバージョンを使用して、より小さなモデルへの適応を支援する利点を実証している。
提案手法であるSLADでは,教師と生徒の機能的整合性が向上し,性能が向上した。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:20:27 GMT)
Same Patient, Different Words, Different Diagnosis? Evaluating Semantic Stability in Clinical LLMs [5.6] モデル感度を定量化するための指標として,MVS(Meaning Preserving Variation Sensitivity),信頼度変動(C),Worst-Case Instability(WCI)の3つを紹介した。
以上の結果から,ドメイン固有モデルの違いは混在しており,モデル依存度が高いことが示唆された。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:03:43 GMT)
What drives performance in molecular MPNNs? An operator-level factorial benchmark [5.6] メッセージパッシングニューラルネットワーク(MPNN)は、分子特性予測に広く使用されているが、モノリシックアーキテクチャとしてのデプロイメントによって、特定のメッセージパッシングオペレータがパフォーマンスに与える影響を特定することは困難である。
本稿では,2次元分子MPNNをメッセージシード初期化,ノードエッジ融合,ノード更新演算子の3つのファミリーに分解する演算子レベル因子ベンチマークを提案する。
この制御された設計全体において、パフォーマンスの変動は主に更新の複雑さではなく、メッセージの構成と関連付けられている。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:34:53 GMT)
Phase-Conditioned Imitation Learning with Autonomous Failure Recovery for Robust Deformable Object Manipulation [5.5] 変形可能なオブジェクト操作のための位相条件付き力覚フレームワークを提案する。
FiLM条件のACTエンコーダは、現在のタスクフェーズに基づいて特徴抽出を変調する。
視覚、力、ポーズフィードバックを融合させた多モード位相予測器は、視覚単独では見えない接触障害をリアルタイムで推定する。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:59:53 GMT)
Runtime Analysis of a Compact Genetic Algorithm on a Truly Multi-valued OneMax Function [5.5] Adak and Witt (GECCO 2025) は、多値のOneMax関数上でのcGA (multi-valued compact genetic algorithm) の最初のランタイム解析を発表した。
アップデートの強度の最適な選択は、$textrmObigl(n r3 log2, n)log (r)bigr)$から$textrmObigl(n rlog3(n)log3(r)bigr)$に改善します。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:06:59 GMT)
Privately Estimating Monotone Statistics in Polynomial Time [5.5] 単調な統計量の推定に有効な差分法アルゴリズムについて検討する。
我々のアルゴリズムはサンプルの複雑さで$t$を節約し、実行時に$et$を支払う。
応用として、プライベート固有値推定、プライベート損失推定、高次元モデルの単一パラメータのプライベート推定の改善結果を得る。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:19:03 GMT)
Mitigating Stethoscope-Induced Shortcuts in Respiratory Sound Classification under Federated Domain Generalization with Causality-Inspired Interventions [5.4] AI駆動型呼吸音分類(RSC)は肺疾患の自動検出を約束するが、マルチサイト展開は聴診器間変動によって妨げられる。
ステススコープによるデバイスシフト下でのRCCに対するFedDG(Federated Domain Generalization)の定式化を導入する。
i) コンテンツ保存型摂動を行う因果性インスパイアされたデバイススタイル介入ネットワーク,(ii) メタデータショートカットを中和する逆ファクトテキスト拡張,(iii) クライアント間のデバイス不変表現を容易にする勾配アライメント,の2つを組み合わせて,因果性インスパイアされたマルチモーダルFedDGフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:43:03 GMT)
Simulation of smooth models of potentials with singular point using Many-Interacting-Worlds Method [5.3] 2014年に提案された決定論的多相互作用世界法は、多くの量子力学の解釈の中でポテンシャルを示した。
クーロンポテンシャルや有限トラップポテンシャルのような特異性を持つポテンシャルを滑らかな方法により注目する。
本結果は,有界系の解法における標準量子力学における行列ヌメロフ法との整合性を示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:56:58 GMT)
Decentralized LLM-Driven Coordination of Acoustic Robots for Contactless Object Manipulation [5.3] 本稿では,非接触物体操作のための音響ロボットの自然言語駆動協調のための枠組みを提案する。
2つのTurtleBot3ベースの音響ロボットに実装され、それぞれに超音波位相アレーを備えている。
その結果,自然言語コマンドは非接触操作のための分散ロボット動作に変換可能であることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:27:13 GMT)
DLM-SWAI: Steering Diffusion Language Models Before They Unmask [5.3] DLM-SWAIは、事前計算されたトークンレベルのスコアを使用して、各denoisingステップのトークン分布をバイアスする、トレーニング不要のステアリング手法である。
DLM-SWAIは、生成品質を保ち、計算オーバーヘッドを最小限に抑えつつ、拡散言語モデルを効果的に操ることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:00:14 GMT)
Plan, Don't Pose: Long Composite Motion Generation with Text-Aligned BFM [5.2] テキスト・トゥ・モーション(T2M)生成は、キャラクターアニメーション、仮想アバター、人間とロボットの相互作用に広く応用されている。
我々は,T2M生成のための自然言語と事前訓練された行動基礎モデル(BFM)とを,重いエンドツーエンドのモーションジェネレータに頼らずに協調する最初のフレームワークであるText2BFMを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:24:30 GMT)
CityGen: Structure-Guided City-Style Synthesis for Cross-City Autonomous Driving [5.1] CityTransfer-Benchは、知覚、セグメンテーション、計画にわたる都市間一般化を評価するためのベンチマークである。
CityGenは拡散に基づく生成フレームワークであり、都市レベルの視覚的プロンプトによって誘導されるHDマップ条件の合成を通じてゼロラベルの都市適応を実行する。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:46:48 GMT)
BIRDS: Characterizing and Understanding Biodiversity Impact of Large Language Model Serving [5.1] BIRDS は要求駆動 LLM Serving の生物多様性への影響のためのフレームワークである。
要求レベルの機能単位を定義し、運用上および実施中の生物多様性への影響を定量化し、品質Normalized Biodiversity Impactを導入している。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:27:06 GMT)
Wait! There's a Way Out: A Decision Mechanism for Forecasting Conversational Derailment [5.1] 脱線確率推定から引き起こす決定を分離する手法を提案する。
我々のアプローチは、このタスクにおける最初の人間のベースラインにインスパイアされ、人間が劇的に低い偽陽性率を達成することを示す。
より広範に、この研究は、予測システムの第一級コンポーネントとして意思決定を扱うことの価値を強調している。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:01:30 GMT)
ReGuLaR: Relation-Grounded Latent Reasoning for Large Vision-Language Models [5.0] 思考の連鎖(CoT)推論は、自然言語の中間的推論ステップを言語化することによって、大きな視覚言語モデル(LVLM)の推論能力を大幅に向上させた。
最近の研究は、推論を連続的な潜在空間に移すことによって、この制限に対処している。
ReGuLaRは、視覚的証拠に潜伏状態を明確に根拠付ける潜在状態推論フレームワークである。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:34:40 GMT)
Indexing the Unreadable: LLM-Native Recursive Construction and Search of Service Taxonomies [5.0] 本稿では,A2X(Agent-to-Anything Service Discovery)を提案する。
A2Xは登録されたサービスを階層的な分類に自動的に整理し、クエリ時に層ごとに階層的に保存する。
フルコンテキストダンピングと比較すると、A2Xはプロンプトトーケンコストの9分の1で6.2ポイントのヒット率を達成している。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:38:41 GMT)
Cross-Lingual Steering for Figurative Language Generation [5.0] 1つの言語における文のアクティベーションの違いから、図形カテゴリーの方向性を推定する。
5つの図式カテゴリ、6つの言語、4つの多言語 LLM で、これらの方向はそれぞれの言語内で確実に制御される。
学習した方向は、他者に適用する際の目標行動を増加させ、ドイツが最も受容的な標的となる。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:14:43 GMT)
Quotient DAGs for Off-Policy Evaluation:Forward-Flow Importance Sampling and Exact Slate Propensities [4.8] オフ政治評価は、異なる行動ポリシーによって収集されたデータを使用して、ターゲットポリシーがどのように実行されるかを推定する。
標準重要サンプリングは、ログされた軌跡ごとに重み付けを行うが、評価対象が無視した場合でも、生成プロセスの詳細を意味のあるものとして扱うことができる。
本稿では,評価に等価な履歴をマージし,目標-行動-前-フロー比を用いて重みを割り当てる商DAGビューを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:23:40 GMT)
ConMoE: Expert-Pool Consolidation via Prototype Reassignment for MoE Compression [4.7] Mixture-of-Experts (MoE)言語モデルでは、トーケン毎の計算が削減されるが、それでもすべての専門家の保存とサービスを必要としている。
訓練後のMoE圧縮をエキスパートプール統合として定式化する。
電車のないプロトタイプリマッピングフレームワークであるConMoEを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:44:22 GMT)
MOOSE-Copilot: A Web-Based Interactive Assistant for Unified Exploratory and Fine-Grained Scientific Hypothesis Discovery [4.7] 我々は、この抽象化ギャップを形式化された人間-AIインタラクションプロトコルによって橋渡しする最初の統合フレームワークであるMOOSE-Copilotを提案する。
私たちのシステムでは、初期青写真、段階間ルーティング、再生フィードバックという3つの明確なシグナルを通じて、生成過程を制御できます。
このパラダイムを民主化するために,対話型ツリー可視化機能を備えた直感的なWebベースインタフェースを開発した。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:06:10 GMT)
Replicable Simulation-Based Robot Validation through Provenance [4.6] FAIRの原則と相まって、アーティファクト間のリンクを明示的に追跡し、ファイルの起源と重要な設計決定に関する機械可読メタデータをアタッチすることで、このギャップに対処する、と我々は主張する。
本研究では、既存のシミュレーションベースのテストフレームワークにプロビタンストラッキングとメタデータ収集機構を付加し、これらの拡張を使用して、構造化されたプロビタンスとFAIR対応メタデータを備えた移動ロボットナビゲーションデータセットを充実させることで、これを実証する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:11:26 GMT)
Architecture-Sensitive Supervised Fine-Tuning for Screen-Conditioned Action Prediction: A PiSAR Benchmark [4.6] 我々は,661列のPiSARのホールドアウトスライスのフロンティアゼロショットベースラインに対して,教師付き微調整モデル3つをベンチマークした。
すべてのモデル、フロンティアまたは微調整は、同じスコアリングパイプラインを持つ661ロースライスで評価される。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:49:36 GMT)
A Novel Global Context-aware Deep Neural Network for Enhanced Brain Tumor Segmentation using Magnetic Resonance Images [4.6] 我々は,空間的およびチャネル的注意の融合を容易にするGlobal Context-aware Squeeze and Excite Residual UNet(GCSER-UNet)を紹介する。
GCSER-UNetは、マルチモーダルMRIスライスから腫瘍セグメントを効率よく抽出し、例外的なパフォーマンスを実現する。
ベンチマークデータベースの評価は、TGA LGGデータセットで注目すべき94%のダイススコアを達成し、その優位性を示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:46:46 GMT)
Metasurfaces for neutral-atom trapping [4.6] 我々は、光の位相、振幅、偏光を細かく制御できる技術として光学メタ曲面をレビューする。
光学メタ曲面の柔軟性とスケーラビリティは、小型化、集積化、高度にスケーラブルな原子実験と機器への道筋を提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:27:31 GMT)
The Compressive Knowledge Graph Hypothesis: Which Graph Facts Matter for Scientific Hypothesis Generation? [4.6] 知識グラフ(KG)は言語モデルに構造化された科学的文脈を提供することができるが、どのグラフ事実が生成した仮説を実際に形作るのかは定かではない。
我々は,Mistral-7B,Llama-3.1-70B,Gemini 2.5 Flashの電池材料に対するKG誘導仮説生成について検討した。
局所的なKGを密度,豊かさ,トポロジ,制御構造によって摂動し,提案したグラフおよび固定参照指標を用いて出力を評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:40:47 GMT)
Evaluating using Mock Tool Calls to Quarantine Untrusted Prompt Inputs [4.6] 大規模言語モデルは、他のモデルからの回答を判断するなど、信頼できない入力を処理する必要がある。
現在のLLM仕様では、OpenAIのような主要なプロバイダが、インストラクション階層に沿って信頼性を区別している。
自然な緩和の可能性として、信頼できないコンテンツをモックツールコールで隔離としてラップすることが挙げられる。
私たちの仮説に反して、ツールラッピングはロバスト性を大きく改善しない。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:57:28 GMT)
TagDebt: A Bot to Support Technical Debt Management [4.5] TagDebtはGitHubリポジトリに統合され、問題に自動的にラベルを割り当てるボットです。
我々はTagDebtの設計と実装についてデザインサイエンス研究を行った。
我々は16人の実践者にインタビューして、ボットの有用性、使いやすさ、そしてボットの使用に影響を及ぼす可能性のあるコンテキスト要因を確認することにした。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:54:10 GMT)
Convex Basins in Single-Index Model Loss Landscapes: Applications to Robust Recovery under Strong Adversarial Corruption [4.5] 本研究では,重み付き雑音の存在下で,ガウス単体指数モデル(SIM)を頑健に学習する問題について検討する。
一般単調なリンク関数に対して、線形に近いサンプルと時間的複雑さを持つ最初のロバストなリカバリアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:21:04 GMT)
HunterAgent: Neuro-Symbolic Attack Trace Reconstruction under Anti-Forensics [4.5] 脅威狩りは、不均一な丸太を越えて因果攻撃鎖を再構築する必要がある。
我々は,コストバウンドグラフ検索としてトレース再構成を再構成するニューロシンボリックなフレームワークであるHunterAgentを提案する。
HunterAgentは86.1%の平均F1を達成し、トップエージェントベースラインを26.7F1、KAIROSを17.1F1で上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:38:12 GMT)
From XXLTraffic to EvoXXLTraffic: Scaling Traffic Forecasting to Sensor-Evolving Networks [4.5] 既存の交通予測ベンチマークでは、固定センサーが設定されているが、実際の道路センサネットワークは、道路ネットワークが年々増加するにつれて継続的に成長する。
カリフォルニアのPeMSとTransport for NSWデータの27年間にわたるXXLTrafficデータセットファミリを紹介した。
EvoXXLTrafficは、年1回のアクティブセンサー、年1回のトラフィックフロー、年1回のグラフスナップショットを公開するセンサー進化型再編成です。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:13:34 GMT)
Motion-guided sparse correction enables expert-quality point tracking across diverse microscopy regimes [4.4] RIPPLEはアノテーションをスパース修正として再キャストし、完全なトラジェクトリを提案し、ユーザはトラジェクトリがドリフトする場所でのみ介入する。
実験室からの5つの挑戦的な顕微鏡データを用いてRIPPLEを試験した。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:11:48 GMT)
Fingerprinting Inference Systems of Large Language Models [4.4] 推論システムのコンポーネントを識別するフィンガープリント手法を提案する。
ハードウェアとソフトウェアスタック間の数値的な違いを排除する必要があるため,指紋認証の防止は困難である。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:16:53 GMT)
Scalable Constrained Multi-Agent Reinforcement Learning via State Augmentation and Consensus for Separable Dynamics [4.3] 制約付きマルチエージェント強化学習(MARL)のための分散手法を提案する。
本手法は,エージェントが分離可能なダイナミクスを持つが,グローバルな資源制約を満たすように調整する必要があるシステムを対象としている。
ラグランジュ乗算器に対する軽量な隣り合わせのコンセンサスがグローバルに協調された制約執行に十分であることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:37:16 GMT)
One Click per Cell Type Suffices: Training-free Group Interaction for Cell Instance Segmentation [4.3] Chain-of-Prompts (CoP) はトレーニング不要のフレームワークで、信頼できる同一タイプの場所を特定することで、単一のユーザクリックを拡張する。
3つのセル型アノテーション付きベンチマークでは、タイプ毎に1クリックのCoPが、インスタンス毎のパフォーマンスの90%以上を保持している。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:22:41 GMT)
GeoMag: Geometric-Aware Video Motion Magnification via State Space Model [4.2] ビデオモーション・マグニフィケーション(VMM)は、知覚不可能なダイナミクスを明らかにするが、複雑な幾何学的変換の下では構造上の不整合に悩まされることが多い。
既存の学習ベースの手法は、CNNの限られたグローバルコンテキストとトランスフォーマーの計算コストとの間のトレードオフに直面している。
状態空間モデル上に構築された幾何対応VMMフレームワークであるGeoMagを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:10:58 GMT)
Deep Psychovisual Image Representations [4.2] 心理視覚モデルでは、人間の視覚は、中間抽象を初めて形成することによって、高い認識から低レベルの特徴抽出を分離することを示唆している。
Deep Visual Coding(ディープ・ビジュアル・コーディング)は1990年代のイメージ・コードにインスパイアされた学習周波数領域の表現である。
我々のモデルは、複雑な数値表現と学習された抽象化が深部空間層の役割を補うため、モデルスケーリングにおいてCNNよりも深部依存度が低いことが分かりました。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:24:08 GMT)
Learning to Feel Materials from Multisensory Tactile Data via Interpretable Models [4.2] 多感タッチデータを用いた人体知覚と認識をモデル化するための解釈可能な計算フレームワークを提案する。
その結果, プレス, 静的接触, すべり相互作用からの情報を組み合わせることで, 予測精度が向上することがわかった。
これらの知見は、現在のロボットの指や触覚ディスプレイでは表現されていない熱とコンプライアンスの重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:20:01 GMT)
Can AI be Easy? Lessons Learned from the EZR.py Toolkit [4.2] EZRは、Naive Bayes、$k$-meansクラスタリング、分類と回帰ツリー、シミュレートされたアニール、ローカルサーチ、アクティブラーニング、テキストマイニングフィルタを実装するPythonツールキットである。
EZRは、繰り返し読み上げとAIツールによって構築され、それらを単純化して統合した。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:06:48 GMT)
Rethinking FID Through the Geometry of the Reference Dataset [4.2] より低いFréchet Inception Distance (FID) は、必ずしもより良いサンプル品質に対応していないことを示す。
6つのデータセットの制御された研究において、分布密度と効果的なランクは、サンプルの品質が向上するにつれて、FIDがどのように変化するかをはっきりと説明している。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:10:47 GMT)
A Multi-AI-agent Framework Enabling End-to-end Finite Element Analysis for Solid Mechanics Problems [4.1] AbaqusAgentは,大規模言語モデル(LLM)を基盤とした,ソリッドメカニクス解析のためのマルチエージェントフレームワークである。
AbaqusAgentは分析ケースの生成と実行を容易にするために開発された。
様々な50の固体力学問題が検証され、全体の成功率は86%に達した。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:18:33 GMT)
When, why, and how do diffusion posterior samplers fail? A finite-sample lens [4.1] 後方サンプリングにおける有限サンプル視点を導入し,任意の精度で後方サンプリングを行う。
一般的な後方サンプリング近似は,中間段階における後方の拡散を過小評価または過小評価する傾向がある。
これらの後部誤差の原因は, 非線形測定モデルやマルチモーダル後部モデルを必要としないことが判明した。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:57:46 GMT)
Soro: A Lightweight Foundation Model and Chatbot for Tajik [4.0] 本稿では,タジキスタンにおける厳密な計算および接続制約下での現実的な展開を目的とした,タジク語特化対話型大規模言語モデル(LLM)のファミリーであるSoroを紹介する。
我々は、フィルタリングされたWebテキスト、PDF文書、カリキュラムに準拠した教材にまたがる1.9ビリオントーケンコーパスに対して、タジク語のみの継続事前訓練を行う。
標準ベンチマークにおけるタジク語の使用範囲が限られているにもかかわらず、厳密な評価を可能にするため、一般知識、言語能力、学校・大学入試領域をカバーする一連のタジク語ベンチマークを導入する。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:13:49 GMT)
Digitally enriching a screening population for pancreatic cancer using routine blood-based measures and clinical histories [4.0] 膵癌の早期発見は、治癒治療とがん死の減少を可能にする鍵となる。
本研究は,膵癌の治療的管理へのアクセスを拡大するための,最初の人口レベルのデジタルエンリッチメントツールの基礎となるものである。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:32:29 GMT)
CFCamo: A Counterfactual Detect-or-Abstain Framework for Camouflaged Object Detection [4.0] カモフラージュ物体検出(COD)のための視覚言語強化学習が最近行った。
標準的なCODトレーニングと評価データは肯定的であり、この設定で最適化されたエージェントは、過剰な検出バイアスを得ることができる。
そこで,本研究では,それぞれのCOD評価画像からカモフラージュされた目標を除去する対向型COD(CF-COD)を構築した。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:14:17 GMT)
When RL Suppresses Its Own Vocabulary: Recovering Reasoning Diversity in Puzzle-to-Math Transfer [4.0] ポストトレーニングデータにおける数学問題のない7Bモデルにおけるクロスドメイン転送について検討する。
9クラススパンとモチーフ抽出を組み合わせた推論プリミティブなフレームワークを導入する。
パズル SFT は,OlymMATH-Hard に対して,$7$pp の textttpass@32 のボキャブラリを誘導する。
論文参考訳(メタデータ) (Thu, 28 May 2026 00:04:18 GMT)
Neurodiversity in Agile Teams: Obstacles and Inclusion Barriers [3.9] この研究は、現在アジャイルソフトウェア開発におけるチームワークの品質がどのように実践され、神経多様性の文脈で議論されているかについて研究することを目的としている。
我々は、RedditとLinkedInをカバーするウェブコンテンツ分析と、ドイツの企業神経多様性ネットワークからの11の半構造化専門家インタビューを組み合わせた混合手法のアプローチを適用した。
分析によると、チームワークのプラクティスは、共有標準ではなく、個々の適応によって非常に断片化され、形作られています。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:37:50 GMT)
Explaining Rankings with Hidden Group Bonuses [3.9] 本報告では,感性的特徴が観察されていないが,グループ固有の線形ブーストによる候補ランキングに影響を及ぼす可能性のあるランキング説明問題の変種について検討する。
われわれのアプローチは、この変種に最初に対処し、公正なランキングと入場システムにおける重要な現実世界の課題を捉えている。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:36:11 GMT)
Deep Optimal Individualized Treatment Rules for Bivariate Survival Outcomes via Adaptive Prediction-Powered Learning [3.9] 本稿では,固定時間点を超える共同生存確率を最大化するために最適な個別化処理規則を導出する問題に対処する。
本稿では,ポリシーを経由した処理ルールのモデル化,リンク関数を介するフェール・アクセラレーション・アセスメント・タイム・モデルの提案を行う。
意思決定の堅牢性と有効性を高めるため,機械学習モデルからの補助的予測を活用する適応予測を用いた手法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:56:52 GMT)
High-Fidelity ROI CT Reconstruction with Limited Quantum Resources via Hybrid Classical-Quantum Refinement [3.9] 我々は、全画像量子再構成のためのハイブリッドな関心領域(ROI)改善フレームワークを提案する。
この戦略は、目標領域における高忠実度再構築を維持しながら、有効なQUBOサイズを低減させる。
QTR/QCSTR+QTR/QCSTRおよびSART+QTR/QCSTRは,中等度の症例に対して正確なROI再構成を実現する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:04:45 GMT)
PatchBoard: Schema-Grounded State Mutation for Reliable and Auditable LLM Multi-Agent Collaboration [3.9] PatchBoardは、エージェント間の対話を、共有された構造化状態上で検証されたパッチ突然変異に置き換える。
630回にマッチしたALFWorldでは、PatchBoardが84.6%、LangGraphが30.8%、Flockが61.6%だった。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:43:22 GMT)
Bridging Maximum Likelihood and Optimal Transport for Efficient Inference and Model Selection in Stochastic Block Models [3.8] 最適輸送(OT)レンズによるブロックモデル(SBM)の推論について検討する。
まず、エントロピー正則化を伴う半緩和Gromov-Wasserstein(srGW)射影として、最大可能性変動推論(MLVI)を解釈できることを確かめる。
このような正規化された定式化は、モデルパラメータを同時に復元し、単一の最適化問題においてパラメータ数を選択する推定器を生成することを実証的に示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:14:25 GMT)
Hijacking Agent Memory: Stealthy Trojan Attacks Through Conversational Interaction [3.8] 大規模言語モデル(LLM)エージェントは、永続的で自律的なタスク実行をサポートするために、長期記憶を活用する傾向にある。
既存のメモリ中毒攻撃は、インジェクトされたコンテンツが直接メモリに格納され、選択的な抽出と書き換えの段階を見渡せると仮定する。
メカニスティック分析は、攻撃が埋め込み空間の異方性を悪用し、注意パターンを変えることを示唆している。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:02:00 GMT)
Destruction is a General Strategy to Learn Generation; Diffusion's Strength is to Take it Seriously; Exploration is the Future [3.8] 拡散モデルは機械学習技術のファミリの一部として提示する。
拡散の非保持に対する破壊的アプローチは、通常の手作り情報非保持技術よりも柔軟である、と私は主張する。
次に、拡散コンテキストに強化学習テクニックを移植する際に生じる微妙な問題に対処する。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:35:16 GMT)
Coarse-to-Fine Domain Incremental Learning with Attentive Distillation for Mining Footprint Segmentation in Multispectral Imagery [3.7] 粗大なドメインインクリメンタル学習フレームワークであるMineC2FNetを提案する。
MineC2FNetは、粗いデータを多用し、きめ細かいマイニングフットプリントのセグメンテーションを強化する。
正確な境界アノテーションを持つ219個の画像の専門的検証データセットを導入する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:41:55 GMT)
Fairness-Aware Federated Learning with Trajectory Shapley Value [3.7] フェデレーション学習(Federated Learning)は、不均一でプライバシに敏感なデータによってもたらされる課題に対処する、新たな分散パラダイムである。
本稿では,各クライアントがグローバルモデルの最適化トラジェクトリにどのように影響するかを評価するコントリビューション指標であるトラジェクトリシェープリー値(TSV)を提案する。
我々は、FedTSVが収束を加速し、堅牢性を改善し、より公平なコントリビューションアセスメントを得られることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:58:57 GMT)
Honest Lying: Understanding Memory Confabulation in Reflexive Agents [3.6] 反射型エージェントは自己生成反射を記憶として頼り、エージェントが自身の障害を正確に診断できると暗黙的に仮定する。
ALFWorldとHumanEvalにまたがって、エージェントはタスクの信頼性はあるが誤った解釈を格納し、トライアルを通じてそれらに取り組み続ける。
我々は、この障害モードメモリの畳み込みと、不正なリフレクティブコンテンツへの繰り返し依存を検出するログベースのメトリクスであるリフレクション繰り返しレート(RRR)を導入している。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:56:42 GMT)
STAP: A Shuffle-Tokenized App Predictor with Ultra Long Context for Vocabulary-Free Mobile App Prediction [3.6] 既存のモデルは固定アプリ語彙に依存しており、異なるアプリエコシステムをまたがる一般化を防いでいる。
固定語彙を必要としないトランスフォーマーモデルSTAPを提案する。
異なる大陸の2つのデータセットに対する実験により、STAPは強いクロスデータセットゼロショット予測精度を達成することが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:44:54 GMT)
MEMENTO: Leveraging Web as a Learning Signal for Low-Data Domains [3.6] 現実世界のタスクは、しばしば大きなラベル付きデータセットが欠落しており、低データのレシエーションにおける学習への広範な取り組みを動機付けている。
我々は,Webをステートレス検索インタフェースではなく,学習信号として扱うフレームワークであるMementOを提案する。
我々は、MementOを2つの低データプロフェッショナルドメイン、すなわち販売自動化と法的研究で評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:44:32 GMT)
Knowledge Graph-Enhanced Zero-Shot Topic Classification: A Multi-Strategy Comparative Study [3.5] ゼロショットマルチラベルのトピック分類フレームワークを提案し,その性能に与える影響について検討する。
基本フレームワークは、ラベル付きトレーニングデータなしでドキュメント内のトピックを分類し、記事のみの分類、キーワード付き分類、および両者の自己整合復号の4つの変種を持つ。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:39:05 GMT)
Training Deliberative Monitors for Black-Box Scheming Detection [3.4] アクションオンリーの熟考モニターは、監視対象のエージェントの推論やモデル内部にアクセスすることなく、エージェントの軌道からのスケジュールを検出するように訓練されている。
本手法は,フロンティア教師から構造的有理性を引き出すために,スケジューリング仕様を用いる。
提案手法をQwen3.5-27Bに適用すると,低コストフロンティアモデルよりも高い性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:40:32 GMT)
DELOS: Detecting Shallow Transits in Kepler Photometry Using a Contrastive-Learning Framework [3.4] cOntrastive Scoring (DELOS) は、ケプラー光度測定において浅いトランジットを探すために設計された、対照的な学習ベースのフレームワークである。
事前に検出されたしきい値交差イベントに頼ることなく、試験期間を通じてスコア周期図を生成する。
ボックスフィットリーストスクエア(BLS)に比べて15.5%、低信号-雑音比(低SNR)ではトランジットリーストスクエア(TLS)に比べて11.25%の精度向上を実現している。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:22:22 GMT)
ARISTO Hand: Sensing-Driven Distal Hyperextension for Fine-Grained Manipulation [3.4] ARISTO Handは腱駆動のロボットハンドで、アクティブな遠位部高血圧とハイブリッド指先感覚アーキテクチャを統合している。
アクティブな高血圧は、標準的な屈曲の運動的限界を超える制御された指先エンゲージメントを可能にする。
剛性爪装着センサは、エッジ接触時の信頼性の高い力測定を提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:44:04 GMT)
Multi-Robot Box Transport over Different Surfaces with Decentralized Role-based Proportional Control [3.4] 複数のロボットによって推進される物体の協調輸送には、建設や倉庫環境から災害廃棄物のクリーンアップの投稿まで、多くの応用がある。
本稿では, 平地, 上り坂, 下り坂の四角形箱を輸送するための非同期分散タスクと動作計画手法を提案する。
R2P2はNVIDIA IsaacSimを使って構築されたシミュレータにデプロイされた6ボットチームで評価されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:40:10 GMT)
Adaptive Stabilizer State Fidelity Certification [3.3] 完全認定忠実区間を報告する適応的拡張を開発する。
単調な締め付け,非自明なスタビライザーがすべてカバーされた場合の正確な回復,そして全カバーの最悪のケースの必要性を証明した。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:02:58 GMT)
Learning to Perturb Hidden Representations for Generalizable Deep Learning [3.3] また,Dropout, Manifold Mixup, 対向的特徴摂動, 関連手法はいずれも, 特定の形態のアクティベーション摂動を課すが, クラスに依存しない, ランダムな戦略を課す。
本稿では,PGDを用いて学習したクラスレベルの摂動を持つ隠蔽層において,アクティベーションを適応的に摂動するLPA(Learning to Perturb Activation)を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:41:39 GMT)
Gradient Perturbation: Learning to Perturb Gradients for Adaptive Training [3.3] 勾配の摂動は 体系的な調査がほとんどありません
本稿では,クラスレベルでのロジトレベルの勾配を適応的に摂動し,カテゴリ認識学習を実現するLPG(Learning to Perturb Gradients)を提案する。
バランスの取れた分類、長い尾の分類、ノイズの多いラベル学習の実験では、LPGは既存の手法よりも一貫して優れており、プラグインモジュールとして組み合わせることができる。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:19:36 GMT)
World Models in Words: Auditing Physical State-Transition Commitments in Vision-Language Models [3.2] 視覚言語モデル(VLM)は、物理シーンに関する質問に答えるためにますます使われている。
本稿では,VLMの物理コミットメントを評価するための評価フレームワークwmwを紹介する。
ハイブリッド検証器は、スキーマの妥当性、状態基底、遷移整合性、応答-トレース互換性をチェックする。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:29:32 GMT)
Safety-Critical Adaptive Impedance Control via Nonsmooth Control Barrier Functions under State and Input Constraints [3.2] 本研究では,不確実な動的条件下での適合的な相互作用を達成しつつ,連立状態の安全性を強制するオンライン適応インピーダンス制御フレームワークを提案する。
この手法は、二次プログラムに基づく安全フィルタと、新しい構成された位置速度非滑らかな制御バリア関数を組み合わせたものである。
外乱オブザーバの強化された安全メカニズムは、モデリングエラーや外部の相互作用力に対する堅牢性を改善する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:30:46 GMT)
Toward Practical Two-Way Covert Communication [3.0] 本研究では,2方向の秘密通信方式について検討する。そこでは,送信元に反射した信号を受動的に変調することで情報を伝達する。
本稿では,正確なモードマッチングを必要とせずに,量子光源のブロードバンドゲインを実現するコレレータベースの受信機を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:22:46 GMT)
LLM-Evolved Domain-Independent Heuristics for Symbolic AI Planning [3.0] ヒューリスティック検索は、象徴的なAI計画において支配的なパラダイムである。
ヒューリスティック検索は、象徴的なAI計画において支配的なパラダイムである。
ヒューリスティック検索は、象徴的なAI計画において支配的なパラダイムである。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:14:39 GMT)
Benchmarking Positional Encoding Strategies for Transformer-Based EEG Foundation Models [3.0] 監視されたEEGデコーディングモデルは、タスク、主題、データセットをまたいだ一般化に苦慮することが多い。
変圧器は置換不変であるため、明示的な位置情報を必要とする。
我々は、CBraバックボーン内の5つの位置符号化戦略をベンチマークし、それらを線形探索および微調整プロトコルで評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:58:34 GMT)
Hybrid Gaussian-exponential zero-noise extrapolation for periodic circuits [2.9] 本稿では,周期構造を持つ量子回路に適したハイブリッドガウス-指数外挿法を提案する。
中間から大きな回路深度について、ハイブリッドモデルは以前の外挿変量と比較して測定可能なバイアスの減少をもたらす。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:01:03 GMT)
Relevance as a Vulnerability: How Web Retrieval Degrades Safety Alignment in LLM Agents [2.9] 本稿では,LLMエージェントの検索による安全性劣化を診断するフレームワークであるAgentREVEALを紹介する。
警告を含むページやリスク宣言を含むページなど,反対あるいは安全指向のソースであっても,有害なコンプライアンスを平均25%増加させることができることを示す。
関連性も検索に役立つので、これらの結果は検索可能なエージェントの安全利用トレードオフを露呈する。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:23:48 GMT)
Wasserstein Contraction of Coordinate Ascent Variational Inference [2.8] 座標アセント変分推定アルゴリズムのワッサーシュタイン距離の縮約について検討する。
これは、固定点における輸送情報の不等式と機能的滑らかさ条件の下で成り立つ。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:16:22 GMT)
EMAG: Differentiable 4D Gaussian Mixture Splatting for EEG Spatial Super-Resolution [2.8] 高密度脳波(HD-EEG)は皮質活動のきめ細かい測定を可能にするが、高価なハードウェアと長い設定時間を必要とする。
低密度電極の疎部分集合からHD-EEG信号を再構成する微分可能なフレームワークであるEMAGを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:26:38 GMT)
Resolution-free neural surrogates for geometric parameterization and mapping with spatially varying fields [2.8] 幾何パラメータ化と写像問題に対する分解能のないニューラルサロゲートを提案する。
パラメータフィールドの座標拡張されたサンプルにネットワークを条件付ける多次元幾何符号化方式を用いる。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:10:06 GMT)
MedCase-Structured: A Text-to-FHIR Dataset for Benchmarking Diagnostic Reasoning in Clinically Realistic EHR Settings [2.8] 大きな言語モデル(LLM)は、臨床推論と意思決定支援の約束を示す。
HL7 FHIR R4バンドルを非構造化テキストから生成するためのパイプラインを提案する。
このアプローチをMedCaseReasoningに適用し、臨床医が認可した診断症例に対応する合成データセットであるMedCase-Structuredを構築した。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:42:43 GMT)
Chess-World-Model: A 10M-Game Benchmark for Exact State Tracking from Chess Move Sequences [2.7] 我々は1000万の実際のチェスゲームから構築された大規模ステートトラッキングベンチマークであるChess-World-Modelを紹介した。
我々は、負の固有値を持つ因果変換器、ブロック対角SLiCE、Mamba-3、Gated DeltaNetをベンチマークする。
リアルゲームのパフォーマンスは1800万以上のパラメータで飽和するが、ランダムな一様分割は最大4000万まで差別的であり、それ以外はスケールによって隠された失敗を露呈する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:43:31 GMT)
Toward Ethical Facial Age Estimation: A Generalized Zero-Shot Benchmark Without Training on Children's Data [2.6] 顔画像からの年齢推定は、通常未成年者の画像を含む訓練データに依存する。
顔年齢推定のための一般化ゼロショットベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:44:39 GMT)
Programmable Dissipation via Partial Quantum Error Correction [2.6] 代わりに、論理ノイズを校正リソースにすることができる。
1つのフォールトトレラントなラウンドは論理的に完全に正のトレース保存写像を誘導する。
符号距離を選択するマルチステップシミュレーションの精度基準を導出する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:49:07 GMT)
Internal Representation, Not Clinical Knowledge: Where Apparent LLM Triage Failures Originate [2.6] 患者投票型臨床トリアージベンチマークでは、制約付き多重選択出力における消費者LCMの低トライアージ率が高いことが報告されている。
両フォーマットで共有された臨床物語に同一の医療的特徴が現れるが、すべてのモデルにおいて、複数の選択決定トークンに沈黙する。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:14:17 GMT)
It`s All About Speed: AI`s Impact on Workflow in Music Production [2.6] 私たちは、レコーディングエンジニア、ミキサー、プロデューサーとして特定したプロの参加者に焦点を当てます。
スピードや効率性といった重要な領域において,ユーザと自動化ツールとの間に生じる緊張関係について論じる。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:43:26 GMT)
Moment-KV: Momentum-Based Decode-Time KV Cache Compression for Long Generation [2.5] キーバリュー(KV)キャッシュは、長期的なタスクでLLM(Large Language Models)をデプロイする上で、依然として大きなボトルネックとなっている。
モーメント-KVはモーメント駆動時間アテンションアグリゲーションに基づく復号時間KVキャッシュ圧縮法である。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:56:51 GMT)
Mitigating Hallucination in Vision-Language Models through Barrier-Regulated Adaptive Closed-form Steering [2.5] 大型視覚言語モデル(LVLM)は入力画像に存在しない物体を幻覚させる。
既存の推論時間緩和手法は、世代を通してロジットや隠れた状態を修正している。
彼らは明確な接地目標を欠き、モデルが既に十分に接地されている場合でも介入し、接地失敗の深刻さに適応しない固定された補正強度を使用する。
本稿では,バリアレス適応型クローズドフォームステアリングにより,これらの問題に対処する,トレーニングフリーなステアリングフレームワークであるBRACSを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:07:01 GMT)
A Progress-Aware Leader-Follower Midair Docking System for Dual-Drone Aerial Manipulation [2.4] 受動磁気ラッチを用いた軽量なモジュラーフレームを用いて,2つの四極子をリーダ・フォロワ形成・ドッキングで動作させるデュアルドロッドドッキングプラットフォームを提案する。
進捗対応のミッションスーパーバイザーは、アプローチ、アライメント、キャプチャ、解決といったフェーズ移行を管理します。
シミュレーションおよび実世界の実験において,生成誤差,ベースラインとヨーの整合性,ドッキング成功率,タイム・トゥ・ドック,フェール・モード統計などの定量的指標を用いて,プラットフォームの評価を行った。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:00:52 GMT)
Information Security in Small-Scale Protests: Surveillance of Ugandan Anti-EACOP Protesters [2.4] 我々は,小規模の反EACOP運動を包括的に組織する学生抗議者の小集団が直面する複雑さについて報告する。
本研究は,逮捕や情報漏えいなどの直接的な脅威に対する参加者の体験が,セキュリティの実践を形作っている,多層的な敵の風景を指摘する。
我々は、参加者が自分の安全のために情報を守る必要があることや、他人の生活を浸透させる必要性について、根底から理解する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:55:17 GMT)
Extreme dynamic symmetry enables omnidirectional and multifunctional robots [2.4] 我々は,ロボットの達成可能な中心加速度の均一性である動的対称性を導入し,動的等方性(dynamic isotropy)と呼ばれる尺度で定式化する。
1000以上の模擬形態学において、高い動的対称性は軌道追跡、タスク成功、堅牢性、レジリエンス、エネルギー効率を一貫して改善することを発見した。
このシステムを体系的に研究するために、動的対称性の増大による影響を探索するために設計された球形ロボットのファミリーであるArgusを開発した。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:15:58 GMT)
Discovering a Zeta Map Algorithm on Dyck Paths via Mechanistic Interpretability [2.4] 我々は、Dyckパスのマップ上に、小さな1層、ワンヘッドエンコーダ・デコーダ変換器を訓練する。
我々は、デコーダのクロスアテンション分析を含む機械的解釈可能性ツールを用いて、その学習を分析した。
このアルゴリズムがゼータマップと一致することを証明し、ラベリングにおける逆の規則を変調する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:59:30 GMT)
Constructing efficient channels for ideal observers using the conjugate gradient method [2.4] 理想オブザーバの高次元画像データへの応用は、しばしば計算的に難解である。
本研究は、IOおよびHO性能を近似する効率的なチャネルを構築するための共役勾配(CG)に基づく手法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:04:00 GMT)
Uni-RCM: Unified Reference-guided Cross-modal Mapping for Multi-Class Anomaly Detection [2.4] 統一参照ガイド型クロスモーダルマッピングフレームワークUni-RCMを提案する。
そこで本研究では,カテゴリー別ノイズを動的に除去する参照ガイドブロックを提案する。
複数のカスケードコードブックによって正規分布を特徴付けるために、オフライン残留量子化器を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:48:26 GMT)
Composing Non-Conjugate Factor Graphs with Closed-Form Variational Inference [2.3] 因子グラフプリミティブから構成される任意のモデルが、クローズドフォームの変分メッセージパッシングを許容することを示す。
それぞれのプリミティブがメッセージファミリの小さなセットを保存するため、構築は機能する。
静的アンサンブルから入力依存ゲーティング,スプリットブランチルーティングに至るまで,コンポジションの深さが増大する様子を実演する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:59:35 GMT)
Quantum optics of chiral and antichiral waveguide arrays [2.3] 一方向導波路のアレイ中の原子による単一光子散乱について検討する。
カイラルアレイでは、相互性は損なわれ、散乱したフィールドの光円錐特性をもたらす。
対照的に、反キラルアレイは相互性を保持し、波動系の典型的な散乱挙動を示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:51:26 GMT)
Non-Abelian Mixer for QAOA on Hybrid Oscillator-Qubit Quantum Processors [2.2] 量子近似最適化アルゴリズム (QAOA) は連続変数 (CV) と離散変数 (DV) の両方で広く研究されている。
我々は,ハイブリッドCV-DV量子プロセッサ上でのQAOAのためのハードウェアネイティブな非アベリア混合器を提案し,Max-Cut問題に対する対応するハイブリッドアンサッツを開発した。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:04:03 GMT)
Neural Network Verification using Partial Multi-Neuron Relaxation [2.2] 部分的多ニューロン緩和を特徴とする中層的アプローチを提案する。
我々は、ニューロンの選択と多ニューロン境界に対する境界超平面の最適化のための既存の分岐を構築した。
本実験は,ニューラルネットワーク検証技術の可能性を示すものである。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:15:13 GMT)
Bridging the Gap Between Natural Language and Market Dynamics via High-Dimensional Representation Learning [2.2] 本稿では, 離散極性評価を変換器を用いた予測アーキテクチャ内の高密度FinBERT埋め込みに置き換えることにより, 高次元表現学習について検討する。
我々は、FNSPIDデータセット上の様々な埋め込み戦略をベンチマークし、生の埋め込み、注意重み付け集約、カスタムのSiameseネットワークをベンチマークした。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:14:45 GMT)
TASER: Task-Aware Stein Regularisation for Geometry-Driven Robustness [2.2] TASER(Task-Aware Stein Regularisation)は、Langevin Stein演算子から派生したトレーニング時間正規化フレームワークである。
我々は、スタイン正則化と1次シフト感度の低下を理論的に関連付け、モダンアーキテクチャと互換性のあるスケーラブルな実装バリアントを開発し、回帰およびビジョンベンチマーク間の堅牢性と安定性の向上を実証する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:49:04 GMT)
Procedural Generation of First Person Shooter Maps using Map-Elites [2.2] 本稿では,MAP-ElitesのFPSゲームの設計レベルへの適用について検討する。
本稿では、よく知られた2つの品質マップ表現について考察し、FPSマップの特性を改善する2つの新しい表現を紹介した。
以上の結果から,新しい表現はFPSマップの進化に使われた表現よりも,多様性と品質の高いマップを生成することが可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:02:27 GMT)
Smaller and Faster 3DGS via Post-Training Dictionary Learning [2.2] 3DGSのための最初の辞書学習ベースの圧縮フレームワークを紹介する。
提案手法は, 3DGS, 3DGS-MCMC, PixelGSに適用した場合の平均圧縮比が3.95x, 3.10x, 4.55xとなる。
これにより、画像の品質を維持しながら、一貫したレンダリング速度が23.3%、24.3%、25.3%となる。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:14:40 GMT)
FLASH-MAXSIM: IO-Aware Fused Kernels for Late-Interaction Scoring [2.2] Flash-MaxSimは、テンソルを作らずに全く同じスコアを計算するIO対応カーネルである。
一致した精度ではPyTorchよりもA100では最大3.9倍高速で、推論メモリは最大16倍、トレーニングメモリは28倍高速である。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:38:27 GMT)
A Novel Computer Vision Approach for Assessing Fish Responses to Intrusive Objects in Aquaculture [2.1] 水産産業は、世界の需要が増大する中、持続可能な魚介類生産を確保するために、いくつかの課題に対処する必要がある。
1つの大きな課題は、魚の福祉の改善が現在および将来の生産システムにおいて極めて重要であるため、生産中の良好な魚の健康と許容される福祉を確保することである。
個々の魚の3次元位置を検出・追跡・推定するための新しい手法が開発されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:46:51 GMT)
Beyond MSE: Improving Precipitation Nowcasting with Multi-Quantile Regression [2.1] 本研究は,マルチ量子回帰問題としてトレーニングを再構成することにより,確立された決定論的流し込みアーキテクチャの予測性能を向上させることができるかどうかを考察する。
その結果,マルチクエンタイルトレーニングは中央決定性予測を改善し,MSEを用いたモデルと比較してテストセットのMSEを8.6%減少させることがわかった。
これらの結果は、新しいアーキテクチャや生成的サンプリング手順を必要とせずに、量子レグレッションが標準的なポイントワイド損失の簡単な代替手段となることを示唆している。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:55:17 GMT)
COMPOSE: Composing Future Theorems from Citations and Formal Structure [2.1] そこでは、アンカー紙に対する理論的な未来的主張を生成することを目的として、基礎となる未来の数学的生成を紹介する。
科学的な引用コンテキストと形式的定理構造の両方に言語モデルを条件づけた,二重グラフフレームワークComposeを提案する。
実験の結果,Composeは検索において,将来的な論文に対して高いベースラインを達成していることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:58:42 GMT)
VLM-GLoc: Vision-Language Model Enhanced Monte Carlo Localization for Robust Semantic Global Localization in Cluttered Quasi-Static Environments [2.0] VLM-GLocは階層的モンテカルロ局所化の手法である。
実世界の2つの環境 – 携帯電話を備えた食料品店と,四足歩行の3700平方フィートのラボスペース – で評価した。
VLM-GLocは、それぞれ70%と74%のグローバルなローカライゼーション成功を達成し、従来の幾何学のみのベースラインとドメイン固有のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:43:32 GMT)
Dissecting the Black Box: Circuit-Level Analysis of LLM Vulnerability Detection [1.9] 我々は、ニューラルネットワークの内部計算を分析し、その推論過程を理解する。
Gemma-2-2b上のCircuit Tracerを用いて、モデルが472 C/C++コードサンプルを脆弱性または安全性として分類したときに起動する計算経路をトレースする。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:23:13 GMT)
MARTIAN: A Rendering Framework for Aerial Mars Imagery from HiRISE Orbital Data [1.9] MARTIANはオープンソースのレンダリングフレームワークで、制御可能な照明条件下で火星の地形のリアルな空中ビューを合成する。
MARTIANは、Ingenuityと将来の火星ロータークラフトのための地図ベースのローカライゼーションシステムの開発を通じて検証されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:12:57 GMT)
The Long-Term Effects of Data Selection in LLM Fine-Tuning [1.9] 短時間のセレクタは、後続の学習を遅くし、忘れることの増大を抑えながら、ランク逆転を示すことができることを示す。
本稿では,この動作をエフェミクティック選択として形式化し,その原因を簡易に解析し,LHAS(Long-Horizon Aware Selection)の目的を提案する。
この研究は、データ選択は、局所的なデータ効率のメカニズムとしてだけでなく、モデルの学習軌道を形成する訓練の介入として評価されるべきである、と論じている。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:12:45 GMT)
A Predictive Law for On-Policy Self-Distillation From World Feedback [1.9] On-policy Self-distillation (OPSD)は、任意のフィードバックを学習信号として利用する、有望なアプローチである。
我々は,OPSDのパフォーマンスをトレーニング前に予測し,調整できることを示し,世界フィードバックをポストトレーニングパイプラインの第一級コンポーネントとして組み込むための原則的方法を提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:17:19 GMT)
Momentum Based Reward Design for Low Emission Traffic Signal Control [1.8] 本稿では,渋滞のみをペナルティ化するのではなく,車両の移動を促進させるモメンタム・ベース・リワード機能(MBRF)を提案する。
その結果,提案した報奨は,遅延や待ち行列に基づく報奨よりも,より優れたスループットと安定した学習行動をもたらすことがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:53:31 GMT)
Rademacher Complexity Bounds for Parameterized Quantum Circuits Generated by Pauli Strings [1.8] Rademacherの複雑性を解析するために、$n $-qubit Pauli文字列からジェネレータを選択するパラメータ化ユニタリを$ mathcalR_M $で解析する。
パラメータの個数$ L $ とトレーニングサンプルの個数$ M から単純なスケーリング境界を導出する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:59:02 GMT)
Protocol for evaluating ChatGPT in biomedical association generation and verification using a RAG-enabled, cross-model majority voting workflow [1.8] 本稿では,ChatGPTの疾患中心の関連性を生成する能力を評価するためのプロトコルを提案する。
関連性の生成、生物学的実体の検証、文献による関連性検証について概説する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:01:24 GMT)
A Dual-Path Architecture for Scaling Compute and Capacity in LLMs [1.7] 本稿では、フレキシブルにスケールできる新しいデュアルパスブロック、隠れ状態に適用されるシーケンシャルな演算数、キャパシティを提案する。
2つのFLOP予算において、我々のデュアルパスモデルは、言語モデリングと下流評価において一致した同型FLOPモデルを上回っていることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:41:36 GMT)
NeuroEdge: Real-Time Hand Gesture Recognition with High-Density EMG Using Deep Learning at the Edge [1.7] NeuroEdgeはリアルタイムのHD EMGベースのNMIシステムであり、リソース制約されたマイクロコントローラ上でジェスチャー認識を行う。
我々は,NeuroEdgeが7つのジェスチャーに対して90%のリアルタイム分類精度を実現し,平均遅延は83msであることを示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:01:06 GMT)
Structure over Pixels: Learning Variable-Length Visual Programs [1.7] STROPは構造的なシーン表現を形成し、画像の視覚的プログラムがどれくらい長くあるべきかを同時に学習する。
コードブックは、すべてハイレベルな潜在表現の質によって形作られています。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:12:21 GMT)
Surfacing Isolated Learners with Outcome-Independent Mediation of Feedback between Teachers and Students Using AI [1.7] そこで本稿では,評価基準やポストホックな結果ラベルを使わずに,注意を要する話題をランク付けする透明なメカニズムを提案する。
このアプローチは、学生の学習困難度、学習者の自己報告と観察困難との相違、未解決の教師の懸念の3つのシグナルを組み合わせたものである。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:00:06 GMT)
From Short Histories to Long Futures: Horizon-Aware Graph Neural Networks for Long Horizon Forecasting [1.6] ディープニューラルネットワークは効率的なエミュレータとして機能するが、その多くは次のステップの予測のためにトレーニングされている。
本稿では,現在の状態から将来の複数のリードタイムへの状態遷移を学習するマルチホライゾングラフニューラルネットワークエミュレータを提案する。
Pine Island Glacier シミュレーション実験により,本手法は長距離精度の向上と安定性の向上を図っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:58:48 GMT)
Enhanced Density Fluctuations Near a Disordered Chiral Topological Transition [1.6] 本研究では, 乱れによる位相相転移が対数波束密度$ln P(r)$の空間的変動にどのように影響するかを, 初期励起からの距離$r$で検討する。
遷移の近くでは、いくつかのエネルギーセクターは良好なスペクトル重みを持ち、競争力のある崩壊率を示すため、単一局在化スケールが波束の尾を支配するのを防ぎ、それによって$ln P(r)$の変動を増大させる。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:55:33 GMT)
FP8 is All You Need (Part 1): Debunking Hardware FP64 as the HPC Holy Grail [1.6] 従来のHPCのドグマは、ネイティブハードウェアのFP64シリコンは二重精度シミュレーションの「ホット・ゲイル」であるとしている。
B300世代以降のAI最適化GPUでは、豊富なFP8スループットと中国のRemainder TheoremベースのOzaki IIが、標準HPCカーネルスペクトル全体にわたって完全なFP64精度でメモリルーフ実行を回復する。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:40:05 GMT)
On the Geometry of Games and their Solvers [1.6] ゲーム理論における中心的な課題は、どのアルゴリズムがゲームの異質な風景をまたいだ平衡を効率的に計算できるかを理解することである。
我々は,この問題を,ゲームと効果的なソルバダイナミクスをリンクするソルバゲームマップを通じて研究する。
学習された構造認識器は、各ゲームを低次元ソルバ整列表現にマッピングし、ポリシーは、この表現を効果的な原始的なメカニズムにマッピングする。
これは、特定の解法力学が有効であり、プリミティブの混合が1つの支配的な解法よりも必要である領域を明らかにする。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:31:49 GMT)
The Little Book of Generative AI Foundations: An Intuitive Mathematical Primer [1.5] この本は、現代生成人工知能の数学的基礎に関する導出指向の紹介を提供する。
近年のアーキテクチャや実装の詳細を調査する代わりに、生成モデルの主要なファミリーを結び付けるアイデアを通じて、一貫性のある経路を発達させる。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:12:00 GMT)
Learning-Based Navigation for Indoor Mobile Robots [1.4] このフレームワークは、シミュレーションと実世界の屋内環境の両方で実装され、評価される。
提案手法は,安全な目標方向ナビゲーションを行うための,実現可能なグローバルルートと信頼性のあるローカルモーションコマンドを生成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:40:52 GMT)
BOKBO (Best of K Bad Options): Calibrated Abstention for VLA Policies [1.4] VLA(Vision-suite-action)ポリシー、RoboMonkey、SEAL、MG-Select、V-GPSなどのメソッドに対するテストタイムスケーリングは、推論時にK候補アクションチャンクをサンプリングし、検証-ベストを実行する。
K-sample VLA推論のための最初の共形吸収層であるBOKBOを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:39:09 GMT)
CoRMA: Contrastive RMA for Contact-Rich Meta-Adaptation [1.4] CoRMAは、強制支配アセンブリのためのコンテキストベースのメタ適応フレームワークである。
我々は,PegInsert,GearMesh,NutThreadのCoRMAをIsaac Lab/Isaac Sim 5.0および本物のMarvinアームで評価した。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:09:52 GMT)
Diffusion Models Preferentially Memorize Prototypical Examples or: Why Does My Diffusion Model Love Slop? [1.3] 我々はランダム階層モデル(RHM)に基づいて生成された文字列上の拡散モデルを訓練する。
共有物からなるサンプルが優先的に記憶されていることが判明した。
我々は、まずコモンズを学習し、その後世代間で過剰生産される部分記憶の中間的状態を特定する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:52:56 GMT)
Improving Collaborative Storytelling with a Multi-Agent Framework Based on Large Language Models [1.3] 本稿では,子どもとLarge Language Models(LLMs)を包含する新しい共創シナリオについて考察する。
我々のゴールは、若手プレイヤーに適した高品質な物語を制作できるマルチエージェントフレームワークを開発することである。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:59:55 GMT)
Learning to Choose: An Empowerment-Guided Multi-Agent System with semantic communication for Adaptive Method Selection [1.3] マルチエージェントパイプラインでは、エージェントの意図とアクションの小さな矛盾がセマンティックドリフトにつながる可能性がある。
本稿では,マルチエージェント・フレームワークを導入し,コンテキスト・バンディットと構造化されたエージェント間通信と意味的チェックポイントを組み合わせた。
信頼性の高い自律学習には,高品質な行動の特定だけでなく,伝播の完全性も必要であることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:57:21 GMT)
Generalistic or Specific Embeddings, Which is Better? An Empirical Study on Search for Clinical Coding in Non-English Languages [1.3] 我々は、英語、スペイン語、カタルーニャ語、イタリア語、ポルトガル語、フランス語を含むジェミニ生成合成データに基づいて、2段階のレトリバー(ビエンコーダ、クロスエンコーダリランカー)を構築した。
バイエンコーダはMRRのBioBERT-ST(0.876 vs. 0.866)と一致し、R@3(0.650 vs. 0.626)とR@5(0.804 vs. 0.790)に勝っている。
クロスエンコーダのリランカを追加することで,集約されたR@5を0.822にリフトし,5言語中4言語(+0.0)で支配的になる。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:06:43 GMT)
Adaptive Targeted Dynamic Chunking for Tokenization-Free Hierarchical Model [1.3] トークン化のない階層モデルは、従来の大規模言語モデルに代わる有望な選択肢として浮上しています。
本稿では,新しいバイト圧縮制御機構であるAdaptive Targeted Dynamic Chunking (ATDC)を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:26:34 GMT)
Hidden Ising models from the generalized Yang-Baxter equation [1.3] 多重サイト相互作用を持つ一次元スピン $frac12$ Hamiltonian を導入するが、それでも局所的である。
ハミルトン密度の代数は、横場イジングモデルの代数に類似している。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:34:31 GMT)
Quantitative semidefinite certificates for ground-state energies of Pauli Hamiltonians [1.2] 我々は、パウリ集合における非可換和の2乗階層に対する有限レベル収束率を証明した。
これらの結果は、パウリ・ハミルトニアンの非可換半定緩和に対する最初の量的有限レベル精度保証を与える。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:01:21 GMT)
Evolving Features vs Evolving Entire Trees with GP for Interpretable Survival Analysis [1.2] 生存木は、競争精度を達成するために、表現力のある高次特徴の組み合わせを必要とする。
我々は生存木構造と非線形スプリット論理を協調的に最適化する進化的アプローチを導入する。
本研究は,進化的特徴構造が樹木誘導戦略を横断する予測性能を向上させることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:52:14 GMT)
Performance Analysis of Underwater Quantum Key Distribution Protocols: BB84, SARG04, and BBM92 [1.2] 本研究ではBB84, SARG04, BBM92プロトコルの性能について検討した。
主な性能基準は、量子ビット誤り率(QBER)と通信相手間の量子相関である。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:34:00 GMT)
Claim against Measurement: Statistical Artefacts in Quantum Error Mitigation Benchmarks [1.2] 統計的厳密さ,錯覚,報告品質を網羅する8基準フレームワークを用いて,近年の81のQEM論文を体系的にレビューした。
適用された論文の中で、推論手法は15(25%)しか使用せず、25(42%)は、請求された効果が統計的に支持されているかどうかを調べることなく、記述的にのみ不確実性を報告している。
72時間にわたる実ハードウェアの研究では、時間的ドリフトだけで同じZNE構成を3倍以上の大きさにすることができる。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:56:13 GMT)
When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance [1.2] 我々は、大言語モデル(LLM)が宗教的変換に関するクエリを対称に扱うかどうかを問う。
モデルが一貫した非対称性を示し、一部の宗教を好んで、他の宗教への転換を軽蔑していることを示す。
パターンはモデルサイズとモデルプロバイダによって異なり、Grok 4.20は最も強力な対称性を示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:07:03 GMT)
You Are in Control of Your State: Why Human Outcomes Are Controllable Through Causal State Intervention [1.1] 我々は、状態と重み付けを目標とする介入を通じて、人間の成果が正確にかつ操作的な意味で制御可能であることを論じる。
テスト可能な7つの予測を導き、ステートアウェアシステムに対する6つの運用要件をリストアップし、デジタルヘルス、教育、AIパーソナライゼーション、パーソナルエージェンシーへの影響について議論する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:36:38 GMT)
Auditing LLM Benchmarks with Item Response Theory [1.1] LLMベンチマークラベルはリリース時に凍結され、ダウンストリームベンチマークやエラーなどすべてに静かに伝播する。
項目応答理論に基づくインジケータを導入し、上位200の例で95%の精度で誤ラベルをサーフェスする。
我々はこれらの誤りを、機械的なラベル付け、ソースデータセットから受け継がれていない上流のアノテーションの誤り、および基本的には修正可能なシングルラベルのない曖昧な項目まで追跡する。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:38:44 GMT)
A unified deeplearning framework for contrast-phase-specific virtual monochromatic imaging [1.1] 単エネルギーCT(SECT)データからコントラスト相特異的単色50keV画像を合成する統合ディープラーニングフレームワークを提案する。
本研究では,SECT入力から50keVのような画像を生成することができ,コントラスト位相特異的なダイナミックスを保存することができることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:55:28 GMT)
Modularizing Educational LLM-Agency for Fostering Responsible Learning Assistance [1.1] モノリシックでアウト・オブ・ザ・ボックスのソリューションに固有の構造的欠点について論じる。
本研究では,運動問題解決の異なる段階の特定のモジュールを提案し,対象の教育的アドバイスを組み込むことを可能にした。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:31:32 GMT)
Beyond English and Evasion: A Human-Annotated Multi-Domain Benchmark for High-Stakes LLM Safety Evaluation in Chinese [1.0] ChiSafe-PASは、1,897の中国のプロンプトの人間による注釈付きベンチマークである。
セルフハームと暴力、麻薬と違法取引、詐欺、風刺の4つの高い領域をカバーしている。
本稿では,データセットの設計,アノテーションプロセス,難読化分類について述べる。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:28:51 GMT)
xModel-KD: Cross-modal Knowledge Distillation for 3D Scene Perception using LiDAR [1.0] 本稿では,3次元点雲分割のためのクロスモーダルな知識蒸留フレームワーク xModel-KD を提案する。
本手法は,2次元テクスチャと3次元幾何の相補的な長所を利用して,一意な点ごとの表現を学習する。
実験結果から,LiDARのみのベースラインよりもmIoUが2%絶対的に向上することが示唆された。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:48:38 GMT)
A Study on Question-Answer Dataset for LLM Safety Evaluation with a Focus on Illegal Activities [1.0] 安全評価のための質問応答データセットについて,違法行為に着目して論じる。
本研究の結果は「JAI-Trust」プロジェクトと共有することを目的としている。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:21:24 GMT)
Inferring the Size of Large Language Models From Popular Text Memorization [1.0] モデルは、長さの異なるテキスト断片をまたいだ次の単語を正確に予測することは、その単語がどれだけ記憶されたかの信頼できる信号である。
この記憶信号は、テキストと断片長の多種多様なコーパスにまたがって、モデル毎の1つの精度プロファイルベクトルに集約する。
その上に2つの補完的推論手法を構築し、その上に2つのモデルのうちどれが大きいかを決定するペア統計テストと、スケーリング法則推定器を構築した。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:20:35 GMT)
Teaching Language Models to Check Grounded Claim Factuality with Human Test-Taking Strategies [1.0] 検索強化生成のような大規模言語モデル(LLM)アプリケーションでは,根拠付きクレームの事実性チェックが重要である。
本報告では, 根拠付き事実性チェックを真偽読解タスクとして定式化することによって, この問題に対処する。
本手法は未案内のオープンエンド推論と比較してトークン使用率を80%以上削減する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:11:42 GMT)
Bridging Theory and Practice: An Executable Taxonomy of Security Properties for ProVerif and Tamarin [0.9] セキュリティは、現代のデジタルシステムに依存するものすべてにとって重要だ。
ProVerifやTamarinといったツールは、自動検証を行うために広く利用されている。
この研究は、理論的セキュリティプロパティ定義と実用的で実行可能な検証モデルの間のギャップを埋めることによって、技術の現状を前進させる。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:57:08 GMT)
mcp-proto-okn: Natural-language access to open scientific knowledge graphs through the Model Context Protocol [0.9] MCP Server Proto-OKN (mcp-proto-okn) はPythonベースのModel Context Protocolサーバである。
これにより、AIアシスタントは自然言語を通じて科学知識グラフを発見し、検査し、クエリし、統合することができる。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:37:54 GMT)
Meta-Programming for Linear-time Temporal Answer Set Programming [0.9] 本稿では,多種多様な時間論理のセマンティクスを統一的・宣言的フレームワークを通じて操作する,柔軟なメタプログラミングフレームワークを提案する。
我々のアプローチは、clingoの理論文法を形式的な型仕様とネスト機能で拡張することで、標準的なASPメタプログラミングを拡張します。
DELにおけるMELの間隔制約とFischer-Ladner閉包を管理するための重要な特徴を概説する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:06:12 GMT)
On the Optimizer Dependence of Neural Scaling Laws [0.9] スケーリング指数$$は、ニューラルスケーリング法則において$L(N)propto N-$は、一般にアーキテクチャとデータによって固定定数として扱われる。
我々は$が体系的にスケールに依存するという証拠を提示する。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:41:36 GMT)
Jamming-Resilient PRB Reservation for Latency-Critical O-RAN Network Slicing [0.9] 産業用5Gダウンリンクシステムでは、対向ジャミングは、有効な物理リソースブロック容量を劇的に削減することができる。
本稿では,スライスしたO-RAN配置におけるRBB割り当てのためのリザーブベースレジリエンスフレームワークを提案する。
我々は、制約付き逐次決定問題として予約活性化を定式化し、非定常ジャミングの下で効果的な制御ポリシーを学ぶために、マスク付きディープQネットワークを設計する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:18:25 GMT)
SalsaAgent: A multimodal embodied language model for interactive dance generation [0.8] 本稿では、人間のリーダーに反応して、表現力のあるフルボディサルサダンスの動きを生成する言語モデルであるSalsaAgentを紹介する。
我々は、対話を非言語的な動きトークンパスとして定式化し、大きな言語モデルの語彙を拡張した。
コントリビューションには、フルボディおよびモーションリレーションのための新しいトークン、LLMファインチューニング、および2段階のトークン・ツー・ディフュージョンパイプラインが含まれる。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:08:27 GMT)
Comparative Evaluation of Machine Translation Systems on Images with Text [0.8] この研究では、テキスト検出、認識、翻訳を分離するモジュールパイプライン、画像とテキストを共同で処理できるマルチモーダル大言語モデル(MLLM)、翻訳画像を直接生成するエンドツーエンドモデルであるTranslatotron-Vの3つのパラダイムを比較した。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:06:15 GMT)
Non-Clifford Crosstalk Noise in Surface Codes Using Hybrid Stabilizer-Tensor Network Methods [0.8] 我々は、コヒーレンスを組み込むことで論理的エラー率を高め、コードしきい値を下げることを示す。
また、ノイズの特定の分布は、論理誤差率を定量的に変化させることができることを示す。
この研究の方法は、従来は古典的シミュレーションにはアクセスできないノイズモデルによる量子誤差補正のシミュレーションを可能にする。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:35:40 GMT)
Quantum Networks Using Color Defects in Diamond: Principles, Progress, and Perspectives [0.8] 大規模量子ネットワークは、量子情報科学の全く新しい応用を可能にする。
このようなネットワークのノードを構築するために、ダイヤモンド色欠陥は有望な候補の1つである。
それらの優れた光学特性、高速スピン量子ビット制御、長いスピンコヒーレンス時間により、量子情報処理や量子メモリ用途に適している。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:33:33 GMT)
A Denser Planar Surface Code [0.8] 通常の2ドルのヘックスグリッド上に実装可能な量子符号を、回転した表面コードパッチの最大4.5倍のエンコーディングレートで提示する。
我々は,高密度に充填された論理量子ビット上での計算のための空間効率のよいアーキテクチャを実証する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:27:34 GMT)
bpK#: Delegatable Pseudonyms And Their Applications to National eID Systems [0.7] オーストリア政府のセクター固有の個人識別(bPks)によって提供される偽造は、プライバシーを大幅に改善する。
現在のアーキテクチャには、完全な集中型設計のため、可用性、プライバシ、信頼性に関するいくつかの課題が伴っている。
本稿では,これらの問題に対処する分散アーキテクチャであるbPk#を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:45:26 GMT)
MIC: Maximizing Informational Capacity in Adaptive Representations via Isotropic Subspace Alignment [0.7] 等方的部分空間アライメントによる多粒体埋め込みの幾何学的景観を最適化するフレームワークであるMICを紹介する。
これらの戦略を自己蒸留の目的を通じて統一することにより、MICは高い差別力を維持する意味的に密度の高い表現を生成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:22:25 GMT)
EVL-ECG: Efficient ECG Interpretation With Multi-Aspect Heterogeneous Knowledge Distillation [0.7] 本稿では,心診断ロジックのクロスアーキテクチャ蒸留に特化して設計されたEV-ECGを提案する。
EV-ECGは,(1)細かな特徴を維持するためにアーキテクチャ上の不一致を調和させるマルチヘッド・クロス・アテンション,(2)ミスマッチしたトークン表現にもかかわらず,ECG間のグローバルな構造的関係を維持するための最適なトランスポートを利用する最適トランスポートを利用した視覚特徴マッチング,(3)教師モデルの潜在診断推論を蒸留するアーキテクチャ内関係マッチング,という3つのECG対応のイノベーションを導入している。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:15:28 GMT)
Detecting bipartite entanglement with PnCP maps and non-negative polynomials [0.7] 我々は、ある正の非正方形の構成に基づいて、PnCP写像を生成する方法を示す。
本研究は, 絡み合う状態を検出することができることを示すとともに, その絡み合う力を数値的に検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:00:06 GMT)
Toward AI Systems That Understand Self and Others: A Multi-Phase Inference Framework for Human Cognitive Diversity and World-Model Alignment [0.7] 本稿では,マルチフェーズ推論フレームワークを提案し,その中核となる内部機構をMIM(Multi-Phase Inference Mechanism)として定義する。
MIMは、相形成空間、前景場、主観的プロファイル状態、状態表現間のアライメントマップを通じて、異種世界モデルがどのように生じるかを定式化する。
目的は、意味、価値、予測エラーを可視化し、同等で、変換可能なものにすることで、人間が自分や他人を理解するのに役立つ、AIシステムのための建設的な語彙を提供することである。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:43:23 GMT)
CorPipe at CRAC 2026: Empty Nodes and Cross-Lingual Transfer in Multilingual Coreference Resolution [0.7] CorPipe 26はCorPipe 25の改良版で、空のノードを予測し、参照とコア参照リンクを単一のモデルで生成する。
我々のシステムは、LLMトラックの他の全ての投稿を2.8%、制約なしトラックの全ての投稿を9.5%上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:01:03 GMT)
Does Distributed Training Undermine Compute Governance? [0.7] 分散トレーニングアルゴリズムの進歩により、開発者は分散アグロメレーションのハードウェア上でフロンティアスケールのトレーニングを実行できる。
本稿では,そのような回避の可能性を評価し,推奨対策について概説する。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:58:12 GMT)
OmniCD: A Foundational Framework for Remote Sensing Image Change Detection Guided by Multimodal Semantics [0.6] リモートセンシングにおける変化検出(CD)は、都市モニタリングや災害評価などの応用に不可欠である。
我々はマルチモーダル・セマンティック・ガイダンスを通じてリモートセンシングCDを統合・拡張するフレームワークであるOmniCDを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:20:18 GMT)
Caspar: CUDA Accelerator for Symbolic Programming with Adaptive Reordering [0.6] Casparは、最新のGPUのパワーをロボティクスでより使いやすくするライブラリである。
Pythonの表現型シンボリックプログラミングとC++の高性能GPUのギャップを埋める。
最良の選択肢の5倍から20倍高速で、メモリを少なくし、同じ精度を実現している。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:18:59 GMT)
Energy-Aware NECO for Single-Pass Pixel-wise Out-of-Distribution Detection in Semantic Segmentation [0.6] セマンティックセグメンテーションのための単一パス画素単位のアウト・オブ・ディストリビューション検出器であるEnergy-Aware NECOを提案する。
この方法は、デコーダの特徴から計算された中心となるNECOスタイルの幾何比と、ロジットベースのエネルギスコアを組み合わせる。
提案したハイブリッドスコアは0.8539でNECOのみ(0.8280)、エネルギーのみ(0.8171)、アンサンブル予測エントロピーベースライン(0.8124)を上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:19:46 GMT)
MetaRanker: Human-in-the-loop Active Ranking for Metalens Image Quality [0.6] 我々はMetaRankerを紹介した。MetaRankerは人間のループ内アクティブランキングフレームワークで、セマンティック・インタープリタビリティの観点から画像品質をメタル化する。
MetaRankerは、現実世界と合成メタエンスデータセットで、異なる劣化プロファイルを持つため、人間の評価と最も密接に一致したランキングを生成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 00:51:48 GMT)
TRACE: Toulmin-based Reasoning Assessment through Constructive Elements for LLM CoT Evaluation [0.6] TRACEはChain-of-Thought推論プロセスを分析するメトリクスである。
7つの推論モデルにわたる26.3K QAサンプルの実験は、ベンチマークの精度と強い相関を示す。
TRACEは強化学習報酬信号として有効であり、精度のみのベースラインよりも優れている。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:19:50 GMT)
Scientific Machine Learning for Engine Health Management and Remaining Useful Life Prediction [0.6] 本稿では,タービン診断のためのマルチタスク科学機械学習フレームワークを提案する。
TGTU、デルタタービンガス温度(DTGT)、Remaining Useful Life(RUL)を共同で予測する。
平均絶対誤差(MAE)、予測区間カバレッジ確率(PICP)、平均区間幅(MPIW)、カバレッジ幅基準(CWC)などの点と間隔の指標を用いて評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:39:53 GMT)
Neural Operator-Based Surrogate Model for CFD:Helical Coil Steam Generator in Small Modular Reactor [0.6] 小型モジュール型原子炉の安全かつ効率的な運転を支援するディジタルツイン(DT)技術には,リアルタイム熱・油圧シミュレーションが不可欠である。
計算流体力学(CFD)は高忠実度フロー解析を提供するが、その計算コストはDTアプリケーションで直接の使用を妨げている。
本研究では、リダクションオーダーモデル(ROM)とニューラル演算子を組み合わせた統合フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:33:22 GMT)
Benchmarking Machine Learning Uncertainty Quantification Methodologies for Predicting Turbine Gas Temperature Degradation [0.6] 本稿では,予測区間を構築するための5つの主要なアプローチについて検討する。
それぞれのアプローチは、統一された実験フレームワークで実装される。
代表的タービンガス温度データセットで実施された試験は、明確なトレードオフを明らかにしている。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:25:47 GMT)
Reducing Experimental Testing in Space Propulsion Film Cooling Analyses by Pixelwise Generative Image Interpolation [0.6] 本稿では, 推進システム開発における膜冷却研究への提案手法の適用について述べる。
本手法では,入力パラメータによって条件付けられた画像を生成するために,位置エンコーディングを備えた軽量フィードフォワードニューラルネットワークを用いる。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:29:19 GMT)
Striding Across Reynolds Numbers: Representation Geometry in Neural PDE Generalisation [0.5] ニューラルPDE解法におけるクロスレイノルズ一般化は、いまだにあまり特徴づけられていない。
我々は、この仮説を、ソーストレーニングされた畳み込みオートエンコーダ潜在空間の状態と一致するConvAE-Relayを通して検証する。
実験では、整合がマニフォールド上に留まっている場合、ソース・レジームのダイナミックス方向が転送可能である(コサイン類似度0.84)ことが確認された。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:49:26 GMT)
A Novel Evaluation Metric for Unsupervised Learning in AIS-Based Maritime Anomaly Detection: MADQI [0.5] 本稿では,海上自動識別システム(AIS)データセットにおける異常を検出するための新しい体系的枠組みを提案する。
提案フレームワークは, 異常レート一貫性(ARC), 物理プラウザビリティスコア(PPS), スコア分散分離(SDS), 極端ケースエビデンス(ECE)の4つの相互接続メトリクスを統合した。
AISデータセットによる実験結果から,提案フレームワークはMADQIスコア80.37%を達成し,教師なし異常検出の有効性を示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:02:41 GMT)
The Importance of Being Statistically Earnest: A Critical Re-evaluation of GSM-Symbolic [0.5] GSM-Symbolicベンチマークでは、25の大規模言語モデルで一貫したパフォーマンス低下が報告されている。
この結論は、不安定な統計的根拠に基づいていると我々は主張する。
我々は、変数バインディング、算術制限、デュアルタスク干渉を含む、モデル固有の障害プロファイルを識別する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:35:37 GMT)
AI for Maritime Security: Comparative Evaluation of CNN and Vision Transformer Architectures for Maritime Object Detection [0.5] 本研究は,高度な人工知能 (AI) とコンピュータビジョン (CV) 技術を用いて海上警備を強化することを目的とする。
異なるリアルタイム環境下で海面上の船の存在を検知できるインテリジェントな物体検出システムの設計と評価を行った。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:14:54 GMT)
BullingerDB: A Dataset for Handwritten Text Recognition and Writer Retrieval [0.4] BullingerDB は Heinrich Bullinger (1504-1575) の対応に基づく歴史的文書解析のためのベンチマークデータセットである
コーパスは20,898ページと、60年間に796人の作家によって書かれた499,222行からなる。
テキスト認識と文字検索におけるBullingerDBの評価を行った。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:05:20 GMT)
Generative AI and Digital Ecosystem Resilience: A Proactive Lifecycle-Based Survey [0.4] Generative AI(GenAI)によって加速される対向合成コンテンツの拡散は、従来の反応性検出方法を非効率にしている。
本調査は,創発的不正確な物語の検出に向けてのパラダイムシフトを示すために,新興研究を合成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:22:56 GMT)
FPLIER: Federated Pathway-Level Information Extractor [0.4] 転写学において、遺伝子セット認識因子化法は、大きな不均一な表現コンペンディアを訓練する際に最も効果的である。
本稿では,PLIERのフェデレーション拡張であるFPLIERについて述べる。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:30:23 GMT)
Rationalize: Shared Semantic Reasoning for Human-AI Alignment [0.4] Rationalizeは、データ駆動型センスメイキングにおいて、人間とAIモデル間のセマンティック推論を共有するためのロールペアフレームワークである。
我々は,共用推論空間における人間とAIの相互作用を相補的な役割ペア(探索的ガイド,調査的インフォーマント,教師=学生,裁判官=アドボケート)として概念化する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:34:28 GMT)
CoHyDE: Iterative Co-Training of LLM Rewriter & Dense Encoder for Tool Retrieval [0.4] CoHyDEは、高密度エンコーダとリライターを単一の共進化システムとして訓練する。
ToolBenchカタログの10kツールサブセットでは、CoHyDEの3ラウンドが、標準クエリでは+2.5pp NDCG@5で最強の単一コンポーネントベースラインよりも改善されている。
どちらのコンポーネントも独立して使用すると、よく整ったクエリとあいまいなクエリの両方でCoHyDEと一致せず、あいまいなクエリでは最大8ppの損失がある。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:41:30 GMT)
Active Continual Learning with Metaplastic Binary Bayesian Neural Networks [0.3] BiMUは、安定性、可塑性、そして忘れをバランスさせる境界メモリの変動目標である。
1000タスクのPermuted-MNIST上での学習と強力なOOD検出を継続する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:36:53 GMT)
FHRFormer: A Self-Supervised Masked Transformer Framework for Fetal Heart Rate Time-Series Inpainting and Forecasting [0.3] 胎児心拍数(FHR)モニタリングは、出生前医療における胎児の健康を評価する上で重要な役割を担っている。
人工知能(AI)手法を適用して、持続的なFHR監視エピソードの大規模なデータセットを分析することで、呼吸補助や介入を必要とするリスクを予測する新たな洞察が得られるかもしれない。
マスク付きトランスフォーマーを用いたオートエンコーダ手法を提案し,FHR信号の欠落を局所的時間成分と周波数成分の両方を捕捉して再構成する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:55:14 GMT)
Automatically Attacking Software Reverse Engineering AI Agents [0.3] Ghidraのようなリバースエンジニアリング実行可能バイナリファイルのためのソフトウェアツールは、マルウェアアナリストが元のソースコードにアクセスすることなく、安全に堅牢な静的解析を行うことを可能にする。
本稿では,AutoDANとして知られる敵攻撃の修正である,遺伝的アルゴリズムによるプロンプト生成を用いた敵攻撃手法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:58:25 GMT)
UNIQ: Conformal Calibration for Adaptive Conservatism in Offline Reinforcement Learning [0.3] UNIQ (Uncertainty-Informed Quantile) は、正則に校正された不確実性推定を通じて状態適応保守性を導入するオフラインRL法である。
Implicit Q-Learning (IQL) バックボーン上に構築されたUNIQは、多変量値アンサンブルを訓練し、分割共形予測を用いて分布のない不確実性推定を計算し、その結果の信号を状態依存の期待値にマッピングする。
D4RL MuJoCoベンチマークでは、UNIQは一貫してIQLよりも改善されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:05:05 GMT)
Subcortical Shape Variations and Their Associations with Cognition Across the 8th Decade of Life. A Study in the Lothian Birth Cohort 1936 [0.3] 我々は、1936年のロシアン・バース・コーホートによる神経画像、人口統計、認知データを用いて、皮質下脳構造の形状変化を探索する。
皮質下形態の変化は不均一であり,全期間にわたって異なる萎縮パターンが見られた。
一般認知の変化は、主に時間点間の内向きと外向きの変位と関連していた。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:02:49 GMT)
Physics Is All You Need? A Case Study in Physicist-Supervised AI Development of Scientific Software [0.3] 物理学者は、CLAX-PTを構築するために、12の作業日と57のセッションでAIコーディングエージェントを監督した。
エージェントは、託宣試験を繰り返すことで、自律的に10を解決した。
予防されたオラクル検出ができなかった3つは共通の性質を共有しており、症状の減少を根本原因の解決法として扱った。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:59:59 GMT)
An Organization-Scoped LLM Agent Runtime Architecture for Regulated Cybersecurity Operations [0.3] 規制されたサイバーセキュリティは、組織レベルの範囲を強制するランタイム基板を欠いている。
最近の大規模言語モデル(LLM)エージェントシステムは、孤立したサイバーセキュリティタスクに対して強い結果を報告している。
本稿では,金融サイバーセキュリティのための組織スコープ型エージェントランタイムアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:51:38 GMT)
Open World Autoencoding Drift Detection with Novel Class Recognition in Tabular Non-stationary Data Streams [0.3] 本研究では,教師なしの概念ドリフト検出手法を提案する。
オートエンコーダの再構成エラーに基づいて、既知のクラス分布のシフトを特定する。
また、プロキシ表現の密度推定を通じて、新しいクラスサンプルの認識を可能にする。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:12:30 GMT)
Bounded Behavioral Indistinguishability for Black-Box LLM Distillation [0.2] ブラックボックスLPM蒸留は通常、出力マッチング問題として評価される。
有界な振る舞いの不識別性を導入し、明示的な素数分布に対して$(,q,t,mathbbA)$-振る舞い不能性を定式化した。
各家庭で,教師と基礎生とロラ蒸留生を比較し,蒸留が識別性を低下させるかどうかを測定した。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:19:32 GMT)
Traditional machine learning vs. deep learning from dynamic graph representations of proteins' 3D folds in the task of protein structure classification [0.1] タンパク質構造分類(PSC)は、教師付き学習を用いて、タンパク質の配列または3D構造の特徴から、タンパク質のCATH/SCOP(e)クラスを予測する
我々は、PSNベースの動的PSCタスクにおいて、従来の機械学習(ML)と自動ディープラーニング(DL)を初めて評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:37:12 GMT)
Graph-Conditioned Mixture of Graph Neural Network Experts for Traffic Forecasting [0.1] GC-MoEは、各ノードに凍結予測専門家のパーソナライズされた組み合わせを割り当てる、グラフ条件のエキスパートフレームワークの混合である。
GC-MoEは、凍結した時間的GNNエキスパートと入力を意識した空間的にコンテキスト化されたルータを組み合わせる。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:05:18 GMT)
Data filtering methods for training language models [0.1] 2つの自動ラベル誤り検出方法を比較する。
ノイズレベルが低い大きなコーパスでは、フィルタリングは性能を向上しない。
ノイズの多い小さなデータセットでは、Confident LearningがF1マクロの改善を実現している。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:52:59 GMT)
The Tutoring Effectiveness Index: Predicting LLM Math Tutor Quality from Four Conversation Signals [0.1] 本研究では,Schoenfeld-Verifyキーワード比,数学ステップ密度,エンドクエストレート,ディープシンキング比プローブからのディープ推論ゲートを組み合わせた,学習自由な判定自由な4信号指標を提案する。
TEIで$N$候補から選択すると、事前不正シナリオの改善率は59.0%$から8.1.9%$まで上昇し、凍結したDeepSeek-R1-8Bベースで$N=8$となる。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:55:33 GMT)
Think Fast, Talk Smart: Partitioning Deterministic and Neural Computation for Structured Health Text Generation [0.1] 大規模言語モデル(LLM)は、ウェアラブル時系列、バイオマーカー、バイタル、ケア管理ログなどの構造化された記録から健康テキストを生成するために、ますます使われてきている。
構造化健康発生における責任は、LCMの推進よりも決定論的ランタイムであるべきかを問う。
我々はThink Fast, Talk Smartを紹介した。これはスリープ・ヘルス・インサイト・パイプラインで、決定論的コードは1つの有界LLMライターの呼び出し前に繰り返し解析を行う。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:16:21 GMT)
Permutation Matrix Representation for Quantum Simulation: Comparative Resource Analysis [0.1] 本稿では、他の主要な量子アルゴリズムと共にハミルトンシミュレーションのための置換行列表現(PMR)法の比較研究を行う。
PMRは、リソース要求に相補的なアドバンテージを提供し、特定のシステムパラメータによる適切なスケーリングを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:58:41 GMT)
Alternative adiabatic quantum dynamics with algorithmic applications [0.0] 断熱量子コンピューティングでは、ハミルトニアンが変化するにつれて固有状態を追跡することが目的である。
我々は、同じ目標を達成するが、ゲートベースの量子コンピュータで容易に実装できる代替プロセスをいくつか提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:48:15 GMT)
REPOT: Recoverable Program-of-Thought via Checkpoint Repair [0.0] One-shot Program-of-Thought (PoT) はプリミティブアクションプランを印刷するPythonプログラムを出力する。
決定論的に検証されたリプレイであるRePoTを紹介します。
RePoTは4つの閉じたモデル構成でPoTを+3から+11ppで打ち負かす。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:03:17 GMT)
The New Pro Se: Generative AI and the Surge in Federal Civil Self-Representation [0.0] 生成AIツールへのアクセスが広まり、連邦民事訴訟はプロセ(自己表現された)原告が著しく増加した。
本稿では,280万件の申請書を用いてそのシフトを分析する。
連邦民事原告率は、GenAI以前の11.33%から、GenAI後の16.94%に増加した。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:19:09 GMT)
libhmm: A Modern C++20 Library for Hidden Markov Models with Correct MLE Emission M-Steps [0.0] libhmmはモデルパラメータ推定、シーケンスデコーディング、モデル選択のためのC++20ライブラリである。
既存のソフトウェアの2つのギャップに対処する: プロダクションシステムに組み込むのに適した、よく保守された、ゼロ依存のC++ HMMライブラリがない。
論文参考訳(メタデータ) (Thu, 28 May 2026 00:42:19 GMT)
ZAPS-DA: Zero-Phase Action Policy Smoothing with Decoupled Actor for Continuous Control in Reinforcement Learning [0.0] ZAPS-DAは、無視可能なフェーズラグと後処理のないデプロイ時のアクションジッタを低減するフレームワークである。
MetaDriveでは、ZAPS-DAはステアリングジッタを14-21x、スロットルジッタを3-5x削減する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:05:08 GMT)
XAI-SOH-FL: Enhancing SOH-FL with Adaptive Aggregation and Explainable AI for Intrusion Detection in Heterogeneous IoT [0.0] XAI-SOH-FLは適応アグリゲーションと説明可能な人工知能をSOH-FLパラダイムに統合する拡張フレームワークである。
XAI-SOH-FLの精度は94.12%、F1スコアは0.92であり、ベースラインのSOH-FLモデルより優れている。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:23:53 GMT)
When LLMs Learn to Be Consistently Wrong: A Multi-Model Study of Linear Representations of Synthetic Deception [0.0] モデルが正確な内部表現を維持しつつ、意図的に偽の出力を生成するような知覚的アライメントは、AIの安全性において依然として中心的な課題である。
我々は、5つの変圧器モデルの真正かつ偽証的な変種を同じ質問分布上でLoRAを用いて微調整するマルチモデルパラダイムを提案する。
平均プールされた隠れ状態で訓練された線形プローブは、ほぼ完璧なAUCで合成の不完全性を検出する。
魚の識別率、有効ランク、セントロイド幾何、方向キャリブレーション、キャリブレーション(ECE)の力学解析により、ピチア/ラマ/クウェンの表現的崩壊と高次元保存の2つの安定性が明らかになった。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:20:06 GMT)
ViASNet: A Video Ad Saliency Network for Predicting Dynamic Saliency and Viewer Engagement [0.0] 本研究は,ショートフォームビデオ広告におけるディープサリエンシ予測に焦点をあてる。
ディープ・サリエンシ・モデルは、人間の目の固定パターンの予測に使われてきた。
我々は、ViASNetと呼ばれる新しいディープ・ダイナミック・サリエンシ・予測モデルを開発し、テストする。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:33:07 GMT)
Uncertainty-Aware Transfer Learning for Cross-Building Energy Forecasting: Toward Robust and Scalable District-Level Energy Management [0.0] データ駆動型エネルギー予測を地域レベルにスケールアップするには、最小限のターゲットドメインデータと正直な不確実性推定を持つ建物間で再利用可能なモデルが必要である。
時間核融合変圧器(TFT)に基づくクロスビルエネルギー予測のための不確実性を考慮した伝達学習フレームワークを提案する。
4段階の層凍結アブレーションにより,806Kから455個の出力層パラメータを更新した Probe-Only の微調整により,最も優れた転送品質が得られることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:28:05 GMT)
Triangular-Reference Schrödinger Bridges for Time Series Generation [0.0] TR-SBTS(Triangular-Reference Schrdinger Bridges for Time Series)を紹介する。
この構成は、拡張状態空間上の単一のエントロピー射影である。
我々は、対応する正規化カーネル推定器の凍結近似と収束の安定性を確立する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:10:35 GMT)
Treewidth-Aware Gate Cut Selection for Reducing Transpilation Overhead on Superconducting Quantum Devices [0.0] 準確率分解(QPD)によるゲート切断は、選択された2ビットゲートを除去し、ルーティングオーバーヘッドを低減することができるが、サンプリングコストはカット配置を重要視する。
グラフのみの2段階ゲートカット選択法であるTW2Sを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:18:38 GMT)
Towards the automated segmentation of epicardial and mediastinal fats: A multi-manufacturer approach using intersubject registration and random forest [0.0] 心臓の周囲の脂肪の量は、いくつかの健康リスク要因と相関している。
心臓脂肪は、被験者全体の脂肪とは無関係である。
本研究の目的は,2種類の心臓脂肪組織を完全分離する手法を提案することである。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:04:26 GMT)
Toward a Phenomenologically Acceptable Quantum Cyclic Universe [0.0] 我々は、正確に周期的であるがボルツマン脳の問題を避ける宇宙論の量子モデルを提唱した。
宇宙が有限次元ヒルベルト空間で一元的に進化する量子状態によって記述されると、その進化は繰り返される。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:45:44 GMT)
Total, quantum, and classical measures of anticoherence for mixed spin states [0.0] 対称量子ビット埋め込みに基づく混合状態$t$-反コヒーレンスのための公理的フレームワークを提案する。
合計$t$-反コヒーレンス(SU(2)-共変チャネル下での非減少)と量子$t$-反コヒーレンス(英語版)を区別する。
我々は、対称セクターの双極子エンタングルメントに結びついた純粋状態汎函数の凸ルーフ拡張を介して量子対向体を構築する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:31:09 GMT)
Token-Level Generalization in LoRA Adapter Backdoors: Attack Characterization and Behavioral Detection [0.0] 我々はLoRAをトレーニングデータ中毒によって確実にバックドアできることを示す。
攻撃はランクとともに単調にスケールし、選択されたトリガーアンカートークンはトリガー依存とベースモデル依存の両方である。
行動検出はサプライチェーンスキャンの操作可能な結果である。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:32:25 GMT)
The Topological Stability Index: A Variance-Based Measure for Persistence Barcodes [0.0] 本稿では,持続寿命の分散を定量化する永続化バーコードのための分散に基づくスカラー尺度であるEmphTopological Stability Index (TSI)を紹介する。
我々は,そのスケーリング動作を含むTSIの基本的特性を,生涯翻訳の下での分散と,バーの挿入と削除による明示的な更新公式で確立する。
また, 持続寿命の典型的な尺度であるトポロジカル信号指数(TSigI)についても考察する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:21:36 GMT)
The Surface You Test Is Not the Surface That Breaks [0.0] エージェントのコンテキストの一部を制御するサードパーティは、エージェントがユーザから来たかのように実行する命令を配置することができる。
現在の評価では、1つのチャネルで1モデル当たりの攻撃成功率を報告している。
しかし、ツール記述自体が、攻撃者が代わりに選択できるインジェクションサーフェスである。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:26:40 GMT)
The Rise of the Software-Defined Vehicle: Architectures, Enabling Technologies, and Future Opportunities [0.0] Software-Defined Vehicles (SDV)は、OTA(Over-the-Air)アップデート、インテリジェント自動化、AIによって駆動されるコネクテッドサービスなどの高度な機能を実現する。
本稿では,最新のSDVを定義したアーキテクチャ,技術,運用フレームワークに関する包括的調査を行う。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:31:00 GMT)
The Architecture of Errors: From Universal Impossibility to Patch-Local LLM Reliability [0.0] デプロイされたシステムは、宇宙全体にわたって動作しないことを示す。
このようなパッチの中では、失敗はスパースで反復的で、小さな反復するカタログに集中しているという実証的な証拠がある。
この遷移を2つの命題と1つの結論で定式化する。
論文参考訳(メタデータ) (Thu, 28 May 2026 22:27:08 GMT)
Temporal Stability and Few-Shot Prompting in Math Task Assessment [0.0] 本研究は,タスク分析ガイドを用いて数学タスクの認知的要求を分類するAIツールの能力に着目した。
我々は、汎用AIツール(Gemini)と教育特化AIツール(Coteach)をテストした。
ジェミニの精度は58%で安定し、コティーチの精度は75%から50%に低下した。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:10:24 GMT)
Support sufficiency as action-sufficient compression: a single-cycle rate-regret formulation [0.0] 本稿では,アクション・サフィシエント・圧縮としてサポート・サフィシエントを定式化する。
固定$Z$の場合、厳密なアクション十分圧縮はポリシー等価性によるサポート空間の商である。
行動の正確性は、再構築の忠実さ、情報・ブートネック予測、合理的な意図と区別される。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:59:41 GMT)
Supervised Training Rapidly Degrades Early Visual Cortex Alignment Across Biologically Plausible Learning Rules [0.0] ランダムで訓練されていないニューラルネットワークは、初期視覚野との表現的類似性において、トレーニングされたネットワークに一貫して一致するか、超えている。
本研究では,4つの学習規則のトレーニングにおいて,人間のfMRIデータに対する表現類似性分析(RSA)アライメントを追跡して検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:39:52 GMT)
Stop Suppressing the Tail: Causal Inference for Extreme Events [0.0] Average DoseResponse(ADRF)はコア因果推論のプリミティブである。
標準頑健な二重機械学習(DML)は、これらの極端を意図的に抑制し、平均を安定させる。
金融リターンや気候の損失などの高水準設定では、この1-in-1000の極端な事象が実際の目標量である。
本研究は,標準点推定とともに構造付きテール形状出力を出力するADRF推定器を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:25:00 GMT)
Statistical Embeddings for Similarity, Retrieval, and Interpretable Alignment of Numeric Tabular Datasets [0.0] 提案手法は,構造化探索データ解析記述子による数値データセットの特徴付けを行う。
カノニカル相関解析(CCA)のペナル化された定式化は、スパースで解釈可能な可変レベル対応を復元するために用いられる。
この手法は、汎用ベンチマーク、材料情報学、核グレードのグラファイトのキャラクタリゼーションにまたがる15のデータセットで評価される。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:40:42 GMT)
Spatio-temporal stochastic graph-based learning for infectious disease forecasting [0.0] 本稿では,定式化と不確実性処理を統合して新たな事例を予測するグラフベースのアーキテクチャを提案する。
提案手法は,大規模かつ小規模な地理ネットワークを単一モデルアーキテクチャ内にエンコードすることで実現可能である。
論文参考訳(メタデータ) (Thu, 28 May 2026 23:43:39 GMT)
Social Reasoning in Machines: Investigating Collective Truth-Seeking Dynamics in Large Language Model Debate [0.0] この論文は、大規模言語モデル(LLM)のマルチエージェント討論(MAD)をシミュレートすることで、新しい基盤を破る。
LLM-MADは,多種多様なモデルの正しい設計を行う場合,アンケートに基づくタスクにおける真理探索性能を大幅に向上させることができることを示す。
我々は、この利得が推論理論の中枢原理に機械的に根ざしているという強い実証的証拠を提示する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:07:03 GMT)
SigmaMedStat: Temporal Signal Modeling for ICU False Alarm Reduction [0.0] 本稿では,臨床行動の前に生理的アラーム信号の信頼性を評価する機械学習システムであるSigmaMedStatについて述べる。
The PhysioNet/Computing in Cardiology Challenge 2015 data of 498 four-channel ICU alarm recordings。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:52:05 GMT)
Shielded inner-shell transitions in atomic samarium for tests of fundamental physics [0.0] 未観測の4f66s2,5$D$_0$中性サマリウムを14,564.90(2),mathrmcm-1$と同定する。
これらの結果は、中性サマリウムを標準モデルを超えた内殻精密分光と物理実験の基盤として確立している。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:42:42 GMT)
Scarcity Is Not Enough: An Impossibility Result for Linear Sybil Cost Under Parallelizable Resources [0.0] 我々は,Sybil攻撃に対して,リソース不足に対する影響を結合することにより,無許可システムによる抵抗効果を示す。
構造的に並列化可能なリソースに対する影響集中の線形コストを強制できるプロトコルルールは存在しないことを証明している。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:15:34 GMT)
ScaleMAP: Preserving Local Density and Neighborhood Structure in Low-Dimensional Embeddings [0.0] DensMAPとPaCMAPはグラフ構築中の局所距離を適応的に正規化し、データから近隣スケールを消去する。
ScaleMAPは異なるアプローチをとる: それぞれのペアの埋め込み変位は、2つのエンドポイントの原空間局所半径の幾何学的平均によって分割される。
標準ベンチマークと、トランスクリプトークス、ハイパースペクトルイメージング、フローからの科学的データセット全体にわたって、ScaleMAPは、UMAPレベルの地区を維持しながら密度保存についてDensMAPと照合する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:44:17 GMT)
Sampling Triangulations and Calabi-Yau Threefolds with Autoregressive GNNs [0.0] 凸多面体の微細かつ規則的な三角測量を行うための自己回帰的メッセージパッシングGNNであるDoubleGNN'を導入する。
dualGNNは三角形の双対グラフを一般化して動作し、エッジは符号付き回路でラベル付けされている。
弦理論に双対GNNを適用し、カラビ・ヤウ 3次元多様体を$h1,1=86$で一様にサンプリングし、$h1,1000=128$で均一性と整合する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:40:32 GMT)
SIA: Self Improving AI with Harness & Weight Updates [0.0] 人間はAIの構築と改善のボトルネックです。
言語モデルエージェントがハーネスとタスク固有のエージェントの重みを更新する自己改善ループであるSIAを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:21:29 GMT)
Rydberg state engineering of trapped ions [0.0] ライドバーグイオンのマイクロ波ドレッシングは、制御可能な偏光性と相互作用強度を持つ調整可能な固有状態を生成する。
トラップイオンの異なるRydberg状態間のコヒーレントな集団移動の最初のデモンストレーションを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:00:31 GMT)
Robust Frequency-Calibrated Virtual EEG Channel Generation from Four Frontal Electrodes for Wearable EEG Augmentation [0.0] FAVC-Netは、Fp1, Fp2, F7, F8から13個の未測定EEGチャネルを生成する。
このモデルは、共有マルチスケールソース符号化、ソース状態埋め込み、ターゲット条件付き署名されたソースブロック混合、GATv2ベースのアテンション改善、アテンション一貫性のあるスキップ融合、弱いウェルチ電力スペクトルのキャリブレーションを組み合わせたものである。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:31:38 GMT)
Ridge Regression from Poisson Resetting: A Renewal Perspective on Spectral Regularization [0.0] 非平衡統計物理学からのリセットと、統計的学習におけるリッジ正則化を結びつける。
線形勾配流の場合、原点を$r$でリセットすると、固定平均$(Xtop X+rI)-1Xtop y$が生成される。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:10:14 GMT)
Resolving the phase space [0.0] トモグラフィーの有効分解能は、測定のグラム行列にリンクしたサンプリング演算子によって決定されることを示す。
グラム固有ベイシスの再構成は、トモグラフィー問題の効率的な測定適応圧縮として現れる。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:32:55 GMT)
Relational Rank Geometry in Transformers: Detecting and Steering Hidden-State Relation Frames [0.0] トークンコンストラクタ間の関係のランク付き幾何について検討した。
32以上のプロンプトを洗浄・腐食介入法で測定する。
クリーンターゲット関係フレームパスは、クリーン・アンサー動作と残差関係幾何を回復する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:06:13 GMT)
Real-Time Retargeting Using Controllability Boundary for Chandrayaan-3 Lunar Landing [0.0] 本稿では,チャンドラヤーン3号月面着陸ミッションのために開発されたリアルタイム誘導政策について述べる。
これは、運用中の月面着陸ミッションにおけるデータ駆動型フレームワークの最初の応用である。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:02:07 GMT)
RL2ML: Finite-Rollout Surrogate Objectives from Reinforcement Learning to Maximum Likelihood [0.0] 本稿では、有限ロールアウトされた代理対象の族であるRL2MLを、閉形式、正確に偏りのない勾配推定器で開発する。
代理目的の最良の選択は、最大可能性に近づいたり、人口レベルの重みだけで決められたりしないことを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:14:45 GMT)
Qubit-efficient variational algorithm for nuclear structure [0.0] 殻モデル記述中の核基底状態の構造を研究するために,3つのクビットマッピング戦略を比較した。
これらの3つのマッピングは、p$-shell核の10ドルBでテストされ、各マッピングの基底状態を見つけるのに必要な量子リソースを比較した。
我々は、量子ビット効率のマッピングを拡張し、さらに1つの中核の基底状態を12ドルCで調べる。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:24:20 GMT)
Quantum optimization beyond QUBO for industrial logistics and scheduling [0.0] 非順序ユニバイナリ最適化(HUBO)は、ノイズとフォールトトレラントの双方で量子最適化にマップされる。
これは、標準二次形式(QUBO)に忠実に表すのが難しい、高度に相関したアセンブリラインスケジューリング規則のようなプロセスの複雑さを捉えている。
我々は、HUBOの定式化を対応するQUBOエンコーディングと比較し、重要なトレードオフを強調した: HUBOは、コンパクトなバイナリエンコーディングによってキュービット要求を減らすが、回路深さを増大させ、現在の量子ハードウェアにおける実現可能性を制限する高次相互作用項を導入する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:15:46 GMT)
Quantum and classical noise characteristics of parametrically driven cavity solitons in dispersive Kerr resonators [0.0] 我々は、技術的および量子的変動が新しいタイプのソリトン構造にどのように影響するかを解明する理論的研究について報告する。
純粋なKerrパラメトリック駆動キャビティソリトン(PDCS)は、ノイズ感受性フォトニクス応用において前例のない性能を提供することができる。
以上の結果から,Pure-Kerr PDCSは感音性フォトニックアプリケーションにおいて前例のない性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 28 May 2026 03:50:50 GMT)
Quantum algorithms for density functional theory with minimal readout [0.0] 我々は、コーンシャムDFTにおける波動関数の量子ビット効率の符号化方式と、全ての占有軌道を同時に計算する量子アルゴリズムを提案する。
我々のアルゴリズムはハリス関数に特に適しており、指数的高速化によって全エネルギーを評価できる。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:19:49 GMT)
Quantum Synchronization of Fock States [0.0] 古典システムにおけるユビキタス現象であるシンクロナイゼーションは、最近量子領域に拡張されている。
フォック状態のような極限周期を示すボソニックモードの量子同期を、負のウィグナー関数を持つ定常状態として表す。
我々は同期が動的性質であり、基本的に位相すべりの抑制に結びついていると主張する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:30:07 GMT)
Quantum Markovian Dynamics from a Double Covariance Stochastic Framework [0.0] 微視的量子力学は、相関する微視的ゆらぎの粗粒化によって現れる。
創発的なマクロ力学は、正確なゴリーニ-コサコフスキー-スダルシャン-リンドブラッド形式を持つことを示す。
ゆらぎのない極限において、モデルは自然にフォン・ノイマン方程式に還元される。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:30:55 GMT)
Quantum Desynchronization of Limit Cycles [0.0] 連続変数量子系の同期が量子相の拡散によってどのように崩壊するかを示す。
このアプローチはまた、極限サイクルの同期に対する非マルコフ効果に対処することを可能にする。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:46:35 GMT)
QuITE: Query-Based Irregular Time Series Embedding [0.0] IMTS用の簡易かつ効果的なプラグアンドプレイ埋め込みモジュールQuITE(Query-Based Irregular Time Series Embedding)を紹介する。
QuITEは学習可能なクエリトークンを使用して、単一の自己アテンション層を通じて不規則な観測を集約する。
実験の結果、QuITEはMCSモデルを継続的に改善し、予測値の平均相対利得は54.7%、分類値が15.8%である。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:16:42 GMT)
Pure State Transformations under Block Coherence [0.0] ブロックコヒーレンス(Block Coherence)は、異なる部分空間にわたる重ね合わせをリソースとして扱うことによって、標準量子コヒーレンスを自然な一般化を提供する。
本研究は,3つの自由操作下での決定論的純粋状態変換(PBIO),厳密に非コヒーレント操作(SBIO),非コヒーレント操作(BDCO)をブロックする。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:35:02 GMT)
ProjectionBench: Evaluating Scientific Hypothesis Generation in LLMs Under Progressive Information Disclosure [0.0] 科学的発見と推論におけるモデル性能を評価するためのベンチマークフレームワークを提案する。
GPT-5, GPT-5.4, Gemini 2.5 pro, Gemini 3.1 pro Previewを, 生体活性物質, 機械材料, ナノ材料にまたがる45紙で評価した。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:38:19 GMT)
Prior Availability in Industrial Visual Sim-to-Real: A Review of CAD-Guided and CAD-Unavailable Regimes [0.0] 産業的なビジュアル・シム・トゥ・リアル(英語版)は、しばしば利用可能な証拠と必要な決定のより大きなミスマッチを伴う。
このレビューでは、産業用ビジュアル・シム・トゥ・リアルを、事前可用性によって構成されたドメインギャップ問題として再検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:18:27 GMT)
Preference-Shaped Expected Hypervolume and R2 Improvement: Exact Computation and Monotonicity [0.0] 同様の目的によく使用される指標群を2つ検討するが、幾何的に異なる。
ハイパーボリュームインジケータは、ディストピア基準点に基づいて、客観空間において支配的なボリュームを測定する。
R2インジケータはユートピア点に基づいて、重み付けされたチェビシェフスカラー化エンベロープによる近似集合を評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:53:48 GMT)
Positional Encodings Anchor Spatial Structure in Vision Transformers: A Geometric Perspective on Robustness [0.0] 位置埋め込み(PE)の異なる形態が視覚変換器(ViT)の表現幾何学に与える影響について検討する。
PEを使わずにトレーニングしたViTは、まだ非自明な空間構造を発達しているが、この構造は、視覚的内容によって駆動され、トークンの置換の下で崩壊する。
すべてのPE(学習絶対, 正弦波, 回転)が, 指数アンコールされた空間構造への一貫したシフトに関連していることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:17:23 GMT)
PhyDrawGen: Physically Grounded Diagram Generation from Natural Language [0.0] PhyDrawGenは、物理的な制約満足度からセマンティックシーン理解を分離する、ニューロシンボリックパイプラインである。
GPT-5-image、Gemini 2.5 Flash、Gemini 3 Proをはるかに上回り、異常な物体問題でも堅牢な物理的精度を示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:49:27 GMT)
PhAIL: A Real-Robot VLA Benchmark and Distributional Methodology [0.0] VLA(Vision-Language-action)ポリシーの現実的な評価は、固定タイムアウトでバイナリ成功率に依存し、条件毎に25ドルロールアウトする。
本稿では,Franka FR3 (データセット,ロールアウト単位のアーティファクト,エンドツーエンドの参照実装) 上でのオープンな実ロボットベンチマークであるPhAILを紹介する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:10:19 GMT)
Persona Conditioning of Brand Recommendations in Retrieval-Augmented Commercial Chat: A Prominence-Stratified Cross-Provider Audit [0.0] モデルが推奨するブランドの状況変化がどれほど強く影響するかを監査します。
監査サンプル2,000は、10のペルソナ x 8 の設計空間上で実行され、x 3 モデル構成 x N=10 のレポジトリがプロンプトされる。
AIブランドの認識のあらゆる測定は、クエリを提供する購入者ペルソナに条件を定めなければならない。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:43:38 GMT)
PRAIB: Peer Review AI Benchmark of Behaviour of LLM-Assisted Reviewing [0.0] Peer Review AI Benchmark (PRAIB)は、レビューの具体性、スタイル、エンゲージメントの振る舞いを測定する、徹底的に定義されたメトリクスで構成されるフレームワークである。
我々は、1000 ICLRおよびNeurIPSの論文に対して、5つのプロプライエタリおよびオープンソースモデルによって生成される11,000のレビューのデータセットを活用する大規模な実証的研究を行う。
分析の結果,人的レビュアーのフィードバックから生成したレビューが著しく逸脱していることが判明した。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:59:54 GMT)
Overview over the first decade of LIMITS [0.0] LIMITSワークショップは、2015年の設立以来、このコミュニティの中心的な会場として機能してきたが、ここで発表された研究の概要は明らかになっていない。
以上の結果から,特に2024~2025年には,成長の進行と成長の進行が注目されている。
論文の大半は位置的あるいは観察的であり、人工物生産の研究は比較的少ないが、近年はソリューション指向の成果が伸びている。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:20:52 GMT)
Overcoming the Matrix-Product-State Encoding Barrier via DMRG-Guided Probabilistic Imaginary-Time Evolution [0.0] 量子シミュレーションにおける基底状態準備のための3段階の枠組みを提案する。
MPSエンコーディング中の中間状態の中央結合シュミット位は、層数とともに論理的に増大する。
このフレームワークは,PITEに固有の選択後オーバーヘッドを大幅に抑制し,非常に深い符号化回路を回避する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:05:46 GMT)
Optimizing Latent Representations for Robust Building Damage Assessment Onboard Earth Observation Satellites [0.0] 本稿では,衛星上での物体レベルの建物損傷評価(局所化と損傷分類)を可能にするAIベースのシステムを提案する。
利用可能なプレディザスター画像は地上でコンパクトな遅延表現に符号化され、衛星に送信され、新たに取得されたポストディザスターの観測と比較される。
本研究では,シム処理,クロスアテンション,ラテント空間圧縮,ロバストネス指向データ拡張の影響を解析し,車載互換性のある変種を体系的にベンチマークすることで,設計空間を探索する。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:21:14 GMT)
On-Device Generative AI for GDPR-Compliant Visual Monitoring: Natural Language Alerts from Local Object Detection [0.0] ビジュアル監視システムは、生画像データを外部サービスに公開するAIベースの推論に依存している。
本稿では,このテンションを完全に端まで収束させることで,このテンションを解消する概念実証について述べる。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:21:52 GMT)
On the question of noise as a resource in quantum computing [0.0] ノイズは通常、スケーラブルな量子優位性を達成するための主要な障害とみなされる。
量子貯水池計算におけるノイズの活用は、特定のチャネルが適切なレシエーションで性能を向上させることを示唆している。
この種類のノイズは純粋状態の多様体上で有効な体積展開を引き起こす。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:49:15 GMT)
Observation of Electrically Tunable Chirality Inversion in a Slow-Light Waveguide [0.0] 我々は、低照光、グライド平面対称、フォトニック結晶導波路におけるキラル反転点を同定した。
我々は、導波路埋め込みInAs/InGaAs量子ドットを用いて、この挙動を実験的にアクセスする。
その結果、ナノフォトニック導波路におけるキラル光-マターカップリングのオンデマンド電気スイッチングが実証された。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:59:29 GMT)
NumLeak: Public Numeric Benchmarks as Latent Labels in Foundation Models [0.0] NumLeakは、プロダクションモデル上のAPI境界プローブとオープン因果LM上のホワイトボックス制御バリデーションを組み合わせた測定フレームワークである。
最上位のフロンティアLLMは3シードプールのピアソン・r=0.97-0.99でファマ・フレンチの過剰リターンをリコールし、5つの兄弟要素で0.15-25bps以内にとどまった。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:52:49 GMT)
Notation Matters: A Benchmark Study of Token-Optimized Formats in Agentic AI Systems [0.0] Agentic AIシステムの大規模言語モデルは、ツールスキーマと実行結果を構造化データとして消費する。
最近の研究は、よりコンパクトな代替品として、TOON(Token-Oriented Object Notation)やTRON(Token Reduced Object Notation)などのトークン最適化代替案を提案する。
我々は,TOONとTRONを4つのエージェントベンチマーク (BFCL, MCPBenchPP, MCP-Universe, StableTool) と5つのオープンウェイトLDMで評価した。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:38:13 GMT)
Nine Judges, Two Effective Votes: Correlated Errors Undermine LLM Evaluation Panels [0.0] LLM-as-a-judgeパネルは複数のモデルからの投票を集計する。
私たちは、その信頼性が独立投票の理想にどの程度劣るかを定量化します。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:48:17 GMT)
New quantum information perspectives in the axion--photon and neutrino systems [0.0] 結合力学が自然に二部体軸-光子モードの絡み合いを発生させる方法について検討する。
最大軸索-光子エンタングルメントを共振あるいは強混合変換に結合する特性を強調した。
我々は,マンデルスタム-タムとマルゴラス--レヴィチンの量子速度制限について,光子系とニュートリノ系の両方について検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:00:02 GMT)
Network Optimization Aspects of Autonomous Vehicles: Challenges and Future Directions [0.0] この記事では、包括的なレビューを行い、誤解を排除し、自動運転車のネットワーク最適化の側面について概説する。
私たちは、私たちが得た洞察と知識と、関連するユースケースと実験結果を共有することを目指しています。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:38:29 GMT)
Near surface donor-acceptor pairs in hydrogenated homoepitaxial diamond nanolayers [0.0] 吸着されたアクセプターはダイヤモンド中の置換窒素ドナーと光学活性ドナー-アクセプターペア(DAP)を形成する。
窒素富化HPHT基板と水素終端表面の間に、名目上未ドープCVD層を挿入することで、ドナーと受容体の分離をナノメートル精度で正確に調整することができる。
これらの結果は、ダイヤモンド中の水素誘起表面移動ドーピングの光学的相似性を示し、DAPベースの量子エミッタのための表面定義可能なナノメートル可変プラットフォームを構築した。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:18:25 GMT)
Multi-Legal-Bench: Evaluating LLMs on Legal Reasoning Across Jurisdictions, Languages, and Legal Traditions [0.0] Multi-Legal-Benchは、6か国で同一のタスクを評価する最初の横断的法定ベンチマークである。
ベンチマークでは、裁判所型分類、判決形式分類、ケースアウトカム予測、法的規範抽出、原因カテゴリー予測の5つのタスクを定義している。
ゼロショットと3ショットのプロンプトでAWS Bedrock経由で7つのフロンティアLSMを評価し、スケーリング分析のために4つのスモール/メジウムモデル(3-12B)を追加しました。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:31:37 GMT)
Mitigating Noise-Induced Barren Plateaus Using a Non-Unitary Ansatz: Application to Molecular Electronic Transport [0.0] 可変アンサッツに非単元要素を導入することで、オープン量子系におけるNIBPを緩和できることを示す。
また、これらのアイデアを、オリゴフェニルエチニレンスルファーメチル(OPE-SMe)を介して電子輸送をシミュレートすることで、現実的な量子化学システムに拡張する。
この結果から,NISQハードウェア上での開系定常状態をシミュレーションするために,非単体変分アンスターゼがスケーラブルで物理的に基礎的な経路を提供することがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:06:54 GMT)
Metric-Dependent Annotation Saturation for Learning from Label Distributions [0.0] 我々は,ChaosNLIをサブサンプルとしたラベル分布のNLIモデルを微調整する。
3クラス NLI では、エントロピー相関は N 20-50 のアノテータを収束させる必要がある。
ソフトラベルは、ラベルの平滑化が再現できないアイテム固有の信号を運ぶ。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:46:51 GMT)
Memory-Bound but Not Bandwidth-Limited: The Physical AI Inference Gap in Batch-1 LLM Decode [0.0] 物理AIシステムは、クラウドのLLMサービスとは異なるワークロードを実行する。
4つのNVIDIA GPUにわたる7から8BクラスのGQA変換器のバッチ1デコードを測定する。
ピーク帯域幅はピーク帯域幅が増加するにつれて減少する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:03:14 GMT)
Low-Magnification SEM May Suffice: Interpretable Deep Learning for Multi-Scale Fracture-Cause Classification in Zirconia-Toughened Alumina [0.0] アルミナ基複合材料の破壊原因の自動分類のための解釈型視覚変換器(ViT)ワークフローを提案する。
8,493枚のSEM画像(50x-10,000x)のデータセットを,5年間のインプロダクションバーストおよび実証試験から算出した。
ViTの精度は0.907、マクロF1は0.888であった。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:47:20 GMT)
Light nuclear scattering from neural quantum states [0.0] 最近開発されたシュロディンガー方程式の安定な最小原理の族は、断面と部分波振幅に保守的な不確実性を与える。
この手法を用いて、現実的な原子核二体力による弾性および非弾性中性子・重陽子散乱の研究を行う。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:26:01 GMT)
Learning effective models from network dynamics data with multiple initial conditions using weak form SINDy [0.0] 我々は、Wak Form Sparse Identification of Dynamicsを用いて、データから直接効果的なモデルを学ぶ方法を研究する。
ネットワーク上でのインタラクションプロセスの平均場近似モデルにより生成されたデータを用いて学習性能を評価する。
以上の結果から,より多くのトラジェクトリを用いることで,ノイズが高い場合の精度が向上するが,その利点を得るためには,少数のトラジェクトリのみが必要であることが示唆された。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:00:18 GMT)
Learning effective Sargassum transport dynamics from limited drifter observations [0.0] フローティング物質輸送は、しばしば循環生成物から欠落する未解決プロセスの影響を受けている。
限られたラグランジアン観測から効率的なトランスポート補正を学習するためのデータ駆動型トランスポート学習フレームワークを開発した。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:50:46 GMT)
Learning Representations from 3D Gaussian Splats [0.0] 3D Gaussian Splatting (3DGS) はシーンレンダリングにおける最近のアプローチである。
主にビュー合成のために設計されているが、シーン理解タスクの潜在能力は未解明のままである。
従来のポイントクラウドデータセットと専用のGaussian Splattingデータセットの両方にわたって、ポイントベースとグラフベースのモデルをベンチマークします。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:02:17 GMT)
LLMs Without Deep Neural Networks: New Architecture, Benefits and Case Study [0.0] 本稿では,私の技術の概要を,ケーススタディと類似の手法との比較で紹介する。
私の新しいモデルは独立して発見され、全く同じ機械に基づいている。
ここでは、ケーススタディと類似の手法との比較で、私の技術の高レベルな概要を説明します。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:34:15 GMT)
Kronecker Embeddings: Byte-Level Structured Token Representations for Parameter-Efficient Language Models [0.0] 大規模言語モデルは、学習された埋め込みテーブルを通じて全ての入力をルーティングする。
我々はKronecker Embeddingsを紹介した。
入力側のトレーニング可能なパラメータの91~94%をフロンティアスケールで除去する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:53:18 GMT)
Koopman--von Neumann Molecular Dynamics for Green--Kubo Transport Coefficients [0.0] 古典分子力学のグリーン-クボ輸送係数を量子アルゴリズムの読み出し問題として定式化する。
相関関数における離散化誤差は、格子点数におけるパワー則として減少することを示す。
我々はNVEプロパゲータの1ステップを$mathcalO(n2)$CXゲートで構築できることを示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:05:50 GMT)
Kernel-based potential mean-field games with unbiased random Fourier $U$-statistics [0.0] 本研究では,カーネルの最大平均不一致を再現することで,ランニング・インタラクション・コストと終端目標コストの両方を表現できる潜在平均場ゲームのサブクラスについて検討する。
どちらのコストも、ランダムなフーリエU統計表現を用いて有限サンプル経験分布から推定される。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:15:25 GMT)
KYA: A Framework-Agnostic Trust Layer for Autonomous Systems with Verifiable Provenance and Hierarchical Policy Composition [0.0] KYA(Know Your Agents)は、自律システムのためのオープンソースのフレームワークに依存しない信頼層である。
PyPIのveldt-kyaパッケージとしてApache 2.0で利用可能である。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:04:16 GMT)
Insurance Pricing Optimization via Off-Policy Evaluation [0.0] 我々は、意思決定問題として保険価格を定式化し、法外評価と価格管理のツールを用いて検討する。
本稿では,解釈可能なデータ共有型Lassoの定式化と,ニューラルネットワークに基づくフレキシブルなポリシーパラメータ化という,最適価格ルールの計算方法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:19:33 GMT)
Inferring Code Correctness from Specification [0.0] 大規模言語モデル(LLM)は現代のソフトウェア開発に不可欠なものとなり、大規模に自動コード生成を可能にしている。
提案するTRAILS(Targeted Reasoning Agreement via Inputs and Specifications)は,コンクリート(インプット,アウトプット)ペアによるLCM推論を基礎とする手法である。
TRAILSをLiveCodeBenchとCoCoClaNeLの2つのデータセット(Qwen3Coder-30B、Devstral-Small-24B、Olmo3.1-Instruct)で評価し、HoarePromptとZero-Shot Chain-of-Thoughtベースラインと比較した。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:04:51 GMT)
Indistinguishability of photonic qubits emitted from trapped $^{40}$Ca$^+$ ions via pulsed excitation [0.0] 数ナノ秒励起パルスを用いて,40$Ca$+$イオンを捕捉して生成したラマン光子の識別性について検討した。
初期状態への自然散乱がホン・オ・マンデル干渉に与える影響を解明する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:06:27 GMT)
Indefinite probabilities in quantum spacetime: A deepening of unpredictability [0.0] 非可換な時空と量子群は、時空とその対称性の非古典的な特徴を量子重力の低エネルギー極限で捉えることが議論されている。
我々は、$SU_q(2)$量子群を用いてスピン-$frac12$系の回転対称性を記述することによって、非可換作用素の観点からスピン測定の結果の確率を記述することを示した。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:55:33 GMT)
Indefinite Causal Order Reverses the Real-Complex Hierarchy [0.0] 最近の研究は、固定的かつ明確な因果順序の下では、複素量子論は実量子論よりも厳密にリッチであることを示した。
我々の研究は、この階層は不定因数順序で逆転していることを示している:実量子論は複素量子論よりも厳密に多くのプロセス相関を実現する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:07:47 GMT)
Incompleteness is necessary for activation of nonlocality without entanglement [0.0] 積状態の集合は、局所的に区別できないならば「絡み合いのない量子非局所性」を示すと言われる。
最近の研究は「隠された非局所性の遺伝子活性化」現象を強調している。
この結果は、量子状態判別における局所-非局所遷移の厳密な構造的理解を提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:20:14 GMT)
Improving Small Language Models for Code Generation with Reinforcement Learning from Verification Feedback [0.0] 検証可能な(RLVR)言語モデルを用いた強化学習は、単体テスト結果を用いて訓練する。
MBPPベンチマークを用いたPythonコード生成のためのRLVRの実証的研究を行った。
その結果、コード生成におけるRLVRの有効性は、設計と最適化に非常に敏感であることがわかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:50:00 GMT)
Improving Relative Representations with Learned Anchors and Whitened Inner Products [0.0] 独立に訓練されたニューラルモデルは一般に非互換な潜在表現に収束する。
相対表現(RR)は、絶対座標を共通アンカー点と類似性によって定義される共有空間にマッピングすることでこの問題に対処する。
従来の実装はランダムにサンプリングされたアンカーとコサインの類似性に依存している。
本稿では,2つの改良点に基づくクロスモデル通信のためのロバストなフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:43:53 GMT)
ImmigrationQA: A Source-Grounded Dataset and Small-Model Adaptation for U.S. Immigration Law [0.0] 本稿では、17,058対の質問応答データセットであるImmigrationQAの構築について述べる。
コーパスは11の一次および二次のソースから組み立てられた。
微調整モデルを993対の保留分割に対して評価した。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:36:18 GMT)
How Reliable Are AI Attackers Against a Fixed Vulnerable Target? A 400-Run Empirical Study of LLM Penetration Testing Consistency [0.0] 大規模言語モデル(LLM)は、多段階のサイバー攻撃を自律的に行うことができるが、その攻撃行動の一貫性は調査されていない。
この研究は、Juice Shopをホストする同一のハニーポットに対して400ラン(4モデル、100台)の攻撃一貫性を実証した最初の大規模な実験的な測定結果を示す。
オーケストレータのワンショットの承認が0-1で再発効したコンテントの拒絶は、モデルでは発生しなかった。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:39:43 GMT)
Heralded ultrafast generation of macroscopic quantum states in matter with bright squeezed vacuum light [0.0] 明るい真空光は、反応後の光の1ショットの二次的な測定と相まって、物質中の超高速なマクロ量子状態の生成を可能にすることを示す。
我々の研究結果は、強磁場量子光を用いた超高速のマクロ量子物質工学への道を開く。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:55:17 GMT)
Ground-state estimation of the Heisenberg model on frustrated lattices with Sample-based Krylov Quantum Diagonalization [0.0] 我々は、反強磁性XXZハイゼンベルクモデルの基礎状態を推定するために、クリロフ量子対角化を適用する。
1D鎖とかごめ格子では、SKQDは最大24スピンまでのシステムサイズで、サブパーセントの基底状態エネルギー誤差を達成する。
この研究は、フラストレーションされたハイゼンベルクモデルの量子シミュレーションのための新しいベンチマークを確立する。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:38:59 GMT)
Generative Models and Statistical Validation [0.0] 生成機械学習は理論と実験物理学において重要なツールとなっている。
まず、現代の生成ネットワークの基盤となる枠組みを紹介し、その正確性、精度、統計的パワーを定量化する上での課題について議論する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:25:40 GMT)
Generalizing a Highly Configurable Analytics Pipeline to Replicate and Support Educational Research Across Multiple Domains [0.0] AI-Augmented Learning (A4L) は、教育用AIシステムからの学習者インタラクションデータの収集、統合、分析を可能にするモジュラーデータアーキテクチャである。
本研究では、AIアシスタントが生成するデータセットの取り込み、処理、分析を可能にするデータインフラストラクチャであるA4L Data Analytics Pipelineのモジュラ設計について検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:46:53 GMT)
Fundamental limitations on entanglement extraction from purity [0.0] 十分に低い純度の状態は分離可能であり、ユニタリな(純度のない)操作で絡み合うことはできない。
絶対分離可能な状態のいくつかは、純度を発生しない確率的プロトコルを介して絡み合いを発生させることができることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 00:16:27 GMT)
Finite-key feasibility of geostationary quantum key distribution [0.0] 静止地球軌道(GEO)衛星による量子鍵分布は、通信を安全にするための魅力的な経路を提供する。
本稿では,GEOダウンリンク構成におけるデコイ状態BB84プロトコルのエンド・ツー・エンド実現可能性について概説する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:04:37 GMT)
FinVerBench: Benchmark Validity and Calibration in Large Language Model Financial Statement Verification [0.0] FinVerBenchは、ファイナンシャルステートメント検証のためのベンチマークおよび妥当性調査である。
SEC 10-K の S&P 500 社への提出書類から作成されている。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:30:15 GMT)
Extracting accent features in spoken Brazilian Portuguese without sociolinguistic labels [0.0] ブラジルポルトガル語(pt-BR)の地域アクセント分類は、信頼できるラベリングの必要性に悩まされている。
本研究は,音響ラベルのみを用いた特徴抽出のための新しいワークフローを導入する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:27:56 GMT)
Evolutionary Rule Extraction from Corporate Default Prediction Models [0.0] 中小企業(中小企業)は、ほとんどの経済圏の企業の大半を占めている。
機械学習(ML)の最近の進歩は、信用リスクモデリングにおける予測性能を改善している。
本研究では,中小企業のデフォルト予測器について検討し,説明可能な人工知能(XAI)技術を適用した。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:07:01 GMT)
Evolutionary Dynamics of Cooperation in Next-Generation LLM Agent Systems: A Cross-Provider Empirical Extension [0.0] 進化ゲーム理論とIterated Prisoner's Dilemma (IPD)を用いたベンチマーク
このベンチマークを2025-2026年にリリースされた4つのフロンティアモデル - Claude Sonnet 4.6, Gemini 2.5 Flash, Gemini 3.1 Pro, GPT-5.4 Mini - に拡張する。
協調バイアスは供給者間で持続する(H1)。12のモデルとプロンプトの組み合わせのうち9つは、バランスの取れたノイズのない条件下での協調平衡を好む。
Gemini 2.5 Flash はバイアス条件下では 77% の攻撃平衡に到達し、GPT-5.4 Mini は Self の下では 70% の協調平衡に達する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:58:56 GMT)
Evaluation of Conversational Agents: Understanding Culture, Context and Environment in Emotion Detection [0.0] 本研究では,85%から96%の精度で感情予測モデルを構築した。
提案手法は,会話型AIにおける感情認識システムの信頼性維持に寄与する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:42:13 GMT)
Error-corrected phase estimation averaged over variable grids on a trapped-ion quantum computer: hyperacuity spectra of a CO molecule adsorbed onto $χ$-Fe$_5$C$_2$ [0.0] 本稿では、低分解能QPEと複数の原点シフトを組み合わせたバーニア型アプローチと、スペクトルを正確に再構成するための物理的動機付け連続パラメトリゼーションを提案する。
QAVGは、早期フォールト耐性量子コンピュータの時代への相関スペクトルの量子シミュレーションへの堅牢な経路を提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:33:24 GMT)
Entity-Collision: A Stratified Protocol for Attributing Retrieval Lift in Agent Memory [0.0] エンドツーエンドのエージェント-メモリベンチマークでは、レトリバー毎に単一の hit@k が報告されている。
本稿では,BM25フロアを構造的に固定するシステムに依存しないプロトコルであるエンティティ・コリジョンを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:02:48 GMT)
Engineering recoil heating in coherent-scattering levitated optomechanics [0.0] 電磁環境はパーセル効果によってリコイル加熱率を強く変化させることができることを示す。
具体的には、最先端のマイクロキャビティにおいて、この速度を著しく抑制できると予測する。
この方法は、任意の電磁構造が存在する場合に閉じ込められた粒子に適用される。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:44:02 GMT)
End-to-End Molecular Dynamics with a Langevin Thermostat on Quantum Circuits [0.0] 標準アンサンブル(NVT)における有限温度分子動力学のための量子回路フレームワークを構築する。
古典的核相空間分布はクープマン-ヴォン・ノイマン(KvN)波動関数として符号化され、標準状態準備はランゲヴィン型フォッカー-プランク緩和として定式化される。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:05:54 GMT)
Dynamical Casimir photons from rotation of a nonspherical particle [0.0] 我々は、自由空間で回転し、電磁量子真空と相互作用する非球面中性粒子を考える。
散乱場は周波数側バンドを発達させ、動的カシミール光子対のパラメトリック放出を誘導する。
現実的な物質パラメータでは、これらの最適化された上界でさえ、極端に小さいままである。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:08:06 GMT)
Dually tunable YBCO coplanar waveguide resonators based on helium-ion-generated Josephson inductances [0.0] ジョセフソンインダクタンスのない超伝導マイクロ波回路は、量子情報科学から天体物理粒子検出器まで、多くの実験と技術のためのスイス陸軍のナイフである。
既存の様々な回路タイプ、薄膜材料、ジョセフソン接合技術にもかかわらず、高磁場・高温応用のための柔軟で信頼性の高いプラットフォームはまだ発見されていない。
本稿では,高温銅酸化物超伝導体YBa$$Cu$_3$O$_7$(YBCO)のコプラナー導波路空洞について検討する。
我々は強いフラックス可変マイクロ波共振器を得る
論文参考訳(メタデータ) (Thu, 28 May 2026 18:00:05 GMT)
Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology [0.0] 本研究では,歴史的宇宙論を制御環境として用いた言語モデルにおいて,ドメイン適応が説明行動にどう影響するかを考察する。
フェーズ1では、Copernican前コーパスでスクラッチから小さな言語モデルをトレーニングし、明確なヘリオセントリック参照を取り除いた。
第2相では,同じコーパス上でQLoRAを用いてより大規模な事前学習モデルを微調整し,説明的フレーミングと宇宙的姿勢の適応性について検討する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:00:02 GMT)
Discrete and Continuous Wigner Functions in Open Quantum Systems: Non-Markovian and Thermodynamic Effects [0.0] 理論は、有限次元量子系の非古典的資源をどのように特定し、特徴付けし、保護するかを検討することを目的としている。
負の量子状態を導入し、そのウィグナー負性、マナ、コヒーレンス、テレポーテーションの忠実度がユニタリチャネルと非ユニタリチャネルの下でどのように進化するかを検討する。
本稿では,2ビットの負の量子状態の1つをリソースとして利用するテレポーテーション方式を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:13:58 GMT)
DeepFake Forensics AI: A Multi-Modal Detection and Blockchain-Anchored Evidence Management Platform [0.0] 私たちはDeepFake Forensics AIを紹介します。画像、ビデオ、オーディオのモダリティを越えて合成メディアを検出する統合プラットフォームです。
我々のシステムは、4つの独立したニューラルネットワークをゼロからトレーニングし、ブロックチェーン上の法医学的証拠を不変にアンカーする。
私たちの知る限り、これはブロックチェーンベースのチェーン・オブ・キード管理とマルチモーダルなディープフェイク検出を統合する最初のシステムです。
論文参考訳(メタデータ) (Thu, 28 May 2026 04:47:28 GMT)
Deep Binarized Photonic Reservoir Computing for Ultrafast Multimedia Signal Processing [0.0] ディジタルマイクロミラーデバイス(DMD)を用いた超高速バイナリ光変調に基づくディープフォトニックニューラルネットワークアーキテクチャを提案する。
本システムは,映像,画像,音声認識などのマルチメディアタスクにおける最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:09:40 GMT)
Decoupled Thrust-Axis Attitude Control Using Quaternions for Chandrayaan-3 Lunar Landing Mission [0.0] チャンドラヤーン3号のミッションは、月の南極付近で軟着陸に成功したことで歴史的なマイルストーンを達成した。
本稿では, 独立な推力軸制御が可能な4元系デカップリング法を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 06:00:52 GMT)
Counterfactual Evaluation Reveals Hidden Capability Profiles in Clinical LLMs and Agents [0.0] 因果感受性スコア(英: Causal Sensitivity Score, CSS)は、5つの臨床的に有意な範囲で腫瘍の腫瘍の患者を変異させる事前登録された介入指標である。
CSSは、0,0.5,1.0スケールを使用して、各モデルが事前登録された正しい方向でレコメンデーションを更新するかどうかを評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:37:06 GMT)
Connection Factorization in Constrained Quantum Mechanics [0.0] 接続因数分解法を用いて,曲面および曲面上の制約量子運動について検討する。
ラプラス作用素は接続一形式によって生成される完全半連結因子化を許容することを示す。
正則移動フレームを用いて、平面曲線、空間曲線、埋め込み曲面に対する効果的な幾何学的寄与を導出する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:00:17 GMT)
Collective Emission in LH2 Assembly Beyond the Point-Dipole Approximation [0.0] 紫細菌に対する量子電磁力学的ダイアディドグリーンテンソルを用いた非エルミートハミルトニアンを開発した。
分離した24-バクテリオクロロフィル円錐体フラスタムとそのP42$_$2結晶集合体のために構築した。
P42$_$2単位セル対称性は、単環の明るい暗黒秩序を反転させ、低エネルギーの端にサブラジアント状態が配置され、結晶全体がエネルギーを吸収する存在であることを明らかにする。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:50:15 GMT)
CodeGolf Bench: A Multi-Language Benchmark for Evaluating Concise Code Generation Capabilities of Large Language Models [0.0] 本稿では,60のプログラミング言語において,Large Language Models (LLM) の簡潔なコード生成能力を評価可能なベンチマークであるCode Benchを紹介する。
コードゴルフ(code golf)は、最小限のキャラクタやバイトソリューションに焦点を当てたレクリエーションプログラミングコンペティションである。
論文参考訳(メタデータ) (Thu, 28 May 2026 13:48:23 GMT)
Clustering Guided Domain-Specific Pretrained Foundation Model Very High-Resolution Arctic Remote Sensing [0.0] 本研究は,北極を対象とする新しいリモートセンシング基盤モデル(RSFM)を提案する。
多様性を意識した地域規模の画像キュレーションと、衛星画像解析のためのビジョントランスフォーマー(VHSR)エンコーダの自己教師付き事前トレーニングを組み合わせる。
我々は、領域適応MAE再構成目標を用いて、キュレートされたコーパス上のViT-Largeエンコーダを事前訓練し、下流の特徴マッピングのための北極固有のトランスフォーマーウェイトを生成した。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:40:32 GMT)
Classification of non-analyzable word types in web documents to implement an effective Korean e-learning system [0.0] 1つはオンラインニュース記事のようなフォーマルな文書で、もう1つはウェブブログにおける新製品に関する顧客レビューのような非公式な文書でできている。
テキストのかなりの割合が非公式であることを考えると、韓国のeラーニングシステムにおいて、それらを効果的に扱うための適切なモデルとしてローカル文法グラフ(LGG)を提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:07:05 GMT)
Ciphera: A Decentralised Biometric Identity Framework [0.0] Cipheraは、プライバシ保護の顔認識、マルチノード検証、IPFSベースのクレデンシャルメタデータストレージ、ブロックチェーンによる再起動を組み合わせた、分散化された生体認証フレームワークである。
結果は、分散型バイオメトリック・アイデンティティの実現可能性を示しながら、プロダクショングレードのデプロイメントにおいて重要なエンジニアリング課題を特定している。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:52:12 GMT)
Channel-agnostic finite-temperature phase estimation averaged over variable grids: reconstruction of Green's function for dynamical mean-field theory [0.0] 動的平均場理論(DMFT)のための量子古典ハイブリッドスキームを提案する。
このスキームの量子部分では、有限温度で1粒子グリーン関数(GF)に適した量子位相推定(QPE)回路を用いる。
提案手法の古典的な部分では,QPEサンプリングから収集したデータに基づいてGFを合理的に推定する手法を採用する。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:42:33 GMT)
Certified Policy Optimisation for Nested Causal Bandits via PAC-Bayes Risk [0.0] 問題クラスをNested Contextual Causal Bandits (NCCBs) として定式化する。
我々の主要な理論的結果は、任意のデプロイメントポリシーを認定する因果的PAC-Bayesian過剰リスク境界である。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:39:51 GMT)
Capability and Robustness Cannot Both Be Free: An Information-Theoretic Bound for Vision-Language-Action Models [0.0] 経験的防御は、損失の一部をクリーンな精度で回収する。
我々は,行動生成ポリシーに対する情報理論上の最初の境界を与えることによって,それが可能であることを証明した。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:14:03 GMT)
Candidate collapse-noise correlators from Generalized Trace Dynamics: a Hubble-scale spectral line under structural assumptions [0.0] 一般化トレースダイナミクス(GTD)にインスパイアされた候補CSL型崩壊ノイズ相関器の条件構成について述べる。
この構成は、最小の GTD グラスマン代数からのパラメータフリーな導出ではない。
ハッブルスケールで生じる狭帯域スペクトルは、現在のCSLバンドの境界外にある。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:21:27 GMT)
Can LLM Teams Play What? Where? When? [0.0] チームベースインタラクションが大規模言語モデル(LLM)のパフォーマンスを向上するかどうかを検討する。
投票、沈黙チーム(キャプテンが最終回答を観察する)、話しチーム(キャプテンが回答と合理性の両方を観察する)の3つのチーム戦略を紹介します。
データ漏洩を最小限に抑えるため、2025年に発表された572個のChGK質問からなるデータセット上でこれらの戦略を評価する。
論文参考訳(メタデータ) (Thu, 28 May 2026 18:36:12 GMT)
CacheProbe: Auditing Prompt Cache Isolation in Gateway APIs [0.0] 本稿では,OpenのAPIゲートウェイアーキテクチャが,プロバイダレベルのインシデントキャッシュアイソレーション保証を回避可能な,インシデントキャッシュ脆弱性を導入したかどうかを検討する。
ほとんどの推論プロバイダは、データリークを防ぐために、アカウントごとまたは組織ごとのプロンプトキャッシュを実装していますが、Open経由のルーティングは、すべてのOpenユーザ間でグローバルキャッシュ共有を生成していますか?
論文参考訳(メタデータ) (Thu, 28 May 2026 22:06:54 GMT)
BuilDyn: Excitation-Driven Data Generation for Building Thermal Dynamics Modeling and Control [0.0] 本稿では、制御指向データ生成のためのカスタマイズ可能な励起戦略を可能にするパッケージであるBuilDynを紹介する。
本研究では,データ駆動型MLモデルの性能を比較することで,BuilDynの利点を実証する。
論文参考訳(メタデータ) (Thu, 28 May 2026 12:30:50 GMT)
BrahmicTokenizer-131K: An Indic-Capable Drop-In Replacement for o200k_base [0.0] BrahmicTokenizer-131Kは131,072バイトレベルのBPEトークンである。
131K語彙クラスのブラフミック圧縮ギャップを閉じる。
OpenAIのo200k_baseの英語、EU言語、コード圧縮を保存する。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:29:12 GMT)
Bound-state-protected phase metrology for a quantum emitter in a Su-Schrieffer-Heeger bath [0.0] 微視的格子モデルにおける1個の量子エミッタの局所位相推定
ダイソン方程式解析により、ローカルバスグリーンの機能、ギャップ内境界状態、および保持相情報を制御するエミッタ残基が得られる。
論文参考訳(メタデータ) (Thu, 28 May 2026 10:19:34 GMT)
BioRefusalAudit: Auditing Biosecurity Refusal Depth Using General and Domain-Fine-Tuned Sparse Autoencoders [0.0] 5つのアーキテクチャにまたがって、モデルでは、危険から良性をきれいに区別することはできません。
我々はスケジュールIのパネルを試験したが、生物学的には毒性のない化合物を試験した。
予備的な証拠は、アクティベーションレベルの監査が行動評価に見えない障害モードを表面化する可能性を示唆している。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:18:07 GMT)
Benchmark of Likelihood-Free Inference Methods based on Neural and Optimal Transport Approaches [0.0] 確率自由推論法の性能は,重みや離散性などの構造的特徴にどのように依存するかを検討する。
MLE,NBE,EOT,AW-NBEの4つのアプローチを検討し,シミュレーションによる評価を行った。
論文参考訳(メタデータ) (Thu, 28 May 2026 19:53:30 GMT)
Bell's theorem: why probability factorisation fails [0.0] 我々は,ベルシナリオの2つのスピンの絡み合った相関に自動相関が一致する連続的な単一スピン実験を考える。
ベル型相関は、実際にはシーケンシャルな実験の別の実装に過ぎないと論じる。
論文参考訳(メタデータ) (Thu, 28 May 2026 08:33:35 GMT)
Audio Deepfake Detection with Half-Truth Localisation Using Cross-Attentive Feature Fusion [0.0] CAFNetは3次分類(リアル、フルフェイク、ハーフトゥルース)を行い、合成された領域の時間的境界を1つの前方通過で遅らせる。
2値検出では、96.76%の精度と3.20%の誤差率(EER)を達成し、500倍以上のパラメータで微調整されたXLS-R 300M(78.31%)とAST 87M(93.03%)を上回っている。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:47:22 GMT)
Attention Asymmetry in AI Layoff Discourse on X: A Computational Analysis of Capital vs Labour Amplification [0.0] 労働者がAIによる再構成で職を失うと、X(旧Twitter)上で2つの非常に異なる会話が同時に行われる。
この論文は、単純な質問である、どの会話がより到達できるのか?
本報告では,20名の公開アカウントから2つの収集手法と733のつぶやきを用いた3つの研究を報告する。
論文参考訳(メタデータ) (Thu, 28 May 2026 05:09:33 GMT)
Asymptotic magic state distillation with almost linear rate [0.0] オーバーヘッド指数がゼロであることと、蒸留速度が線形であることは同値である。
ここでは、その量的関係が一般には堅牢ではないことを示し、ゼロに近づかないオーバーヘッド指数を持つマジック状態蒸留プロトコルの族を提示する。
このことは、蒸留速度がサブリニアレート・レギュレーション内のオーバーヘッド指数に制約されないことを意味する。
論文参考訳(メタデータ) (Thu, 28 May 2026 15:47:16 GMT)
Anchorless Diversification for Parallel LLM Ideation [0.0] LLMは、広い探索が価値のある創造的なタスクのための候補イデアプールを生成するために、ますます使われています。
候補プール多様化のための推論時間制御について検討する。
アンカーレス手法は、観測されたシードアイデアに依存する手法と競合する可能性がある。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:10:24 GMT)
Analytical model for structured light propagation through a turbulent atmosphere [0.0] 乱流大気中における空間光モードの伝搬の簡易な枠組みを構築した。
モードベースの光学場表現による分割段階のアプローチに基づいて、乱流誘起位相変動が原モードの光学パワーを低下させるかを直接評価する。
この電力伝達は均一チャネル内の伝搬距離と線形にスケールし、任意の距離に対して簡単な解が得られる。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:47:23 GMT)
An Approach for Thyroid Nodule Analysis Using Thermographic Images [0.0] 甲状腺癌は、2030年までに女性で2番目に多く、男性で3番目に多いがんであると言われている。
本稿では,甲状腺画像の自己登録と画像取得のためのプロトコルを提案する。
また, 特徴抽出, 画像処理, 健康・不健康患者の分類の可能なアプローチを含む画像データの解析を行った。
論文参考訳(メタデータ) (Thu, 28 May 2026 01:17:44 GMT)
Ambiguity problem of the Bootstrap Method in Quantum Mechanics [0.0] 量子力学のブートストラップ法は曖昧さの問題に悩まされる。
ポテンシャルが異なる種類の関数を含むとき、正しいスペクトルを得ることができない。
この問題は統計モデルや行列モデルを含む幅広いシステムで起こりうる。
論文参考訳(メタデータ) (Thu, 28 May 2026 20:10:52 GMT)
Additive binding energies in asphalt on a quantum processor via quantum-selected configuration interaction (QSCI) [0.0] 相関電子構造計算への実践的なルートとして量子中心型スーパーコンピュータが登場している。
本稿では,アスファルトバインダーの加法結合エネルギーを計算するためのハイブリッド量子古典ワークフローQuantumPaveを提案する。
工業的に関係のある材料問題に対する化学的に有意な結合エネルギーが、現在の量子ハードウェア上で達成可能であることを示す。
論文参考訳(メタデータ) (Thu, 28 May 2026 07:48:58 GMT)
Adapting Multilingual Embedding Models to Turkish via Cross-Lingual Tokenizer Surgery and Offline Distillation [0.0] 文の埋め込みはセマンティック検索、クラスタリング、分類、検索強化生成のための基礎的なコンポーネントである。
本稿では,768次元のL2正規化ベクトルを生成するトルコの文埋め込みモデルであるembeddingmagibu-200mについて述べる。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:24:50 GMT)
AI for Monitoring and Classifying Data Used in Research Literature [0.0] 研究文献におけるデータセットの使用状況を監視するための同等のインフラストラクチャは存在しない。
従来のNLPアプローチはこれらの課題に対処する。
本稿では,データセット参照抽出,関係識別,利用コンテキスト分類を共同で行うマルチタスクGLiNERベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 21:18:30 GMT)
AI Loss of Control Incident Management: Response & Resilience [0.0] 本稿では,破滅的AILOCインシデントを管理するための基盤的枠組みと分類について紹介する。
3つの重度クラスを特定のシナリオ行列にマッピングすることにより、前例のないAIリスクを管理するための具体的かつ比例的なガイドを提供する。
論文参考訳(メタデータ) (Thu, 28 May 2026 17:47:37 GMT)
A new completely parameter-free clustering algorithm for unsupervised classification of BATSE gamma-ray bursts [0.0] クラスター解析は、ガンマ線バースト(GRB)の集団のパターンを理解するために広く応用された機械学習技術である
現在のシナリオでは、微分可能群に対応するクラスタの数はいまだに対立している。
我々は,これまで試されていない方法でGRBの分類を行う「完全パラメータフリー」と呼ばれるクラスタリングの異なるストリームから,新たなアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 16:23:37 GMT)
A comparison of different master equations for driven-dissipative dynamics in composite quantum systems: Dispersive readout in structured electromagnetic environments [0.0] 駆動散逸性量子ビット共振器ダイナミクスは、ほとんどの分散超伝導量子ビット測定スキームの基礎である。
我々は、この設定を顕微鏡的ブロッホ・レッドフィールド法(英語版)を用いて再検討し、結合量子ビット共振器ハミルトニアンの固有基底において散逸を構築する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:53:59 GMT)
A Theoretical and Experimental Study of a Novel Adaptive Learning Algorithm [0.0] 機械学習アルゴリズムの重要なコンポーネントは、計算コストの低減と振動の低減による損失関数の最小化である。
本稿では,Adam や AMSGrad などの適応最適化手法を基本設計概念に重点を置いてレビューする。
上記の手法の限界に対処するため,新しい変種であるC-Adamを提案する。
論文参考訳(メタデータ) (Thu, 28 May 2026 02:48:19 GMT)
A Systematic Evaluation of Molecular Mixture Behavior Prediction [0.0] 本稿では,混合確率誤差を純粋成分と相互作用成分(非理想成分)に分解する評価フレームワークを提案する。
強い絶対精度は、非理想的混合行動の回復不良を隠蔽できることを示す。
これらの結果は、未知の分子への移動が、分子混合機械学習における中心的な課題であることを示している。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:58:59 GMT)
A Neutral-Atom Quantum Compiler with Application-Specific Layout and Hub-Assisted Shuttling [0.0] NISQ回路は、有限の相互作用範囲と、同時にアドレス可能なサイト間の最小の分離によって制約される。
私たちはこれを、トランジットウェイポイントとして機能する少数の動的に配置された空のトラップであるハブトラップで対処します。
実行時間の解析と層ごとの忠実度プロキシを用いて17のベンチマークでコンパイラの評価を行った。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:03:05 GMT)
A Geometric View of SRC: Learning Representations for Stable Residual Inference [0.0] レコンストラクションに基づく推論は、クラスワイドのリコンストラクション残差を比較することによってクラスを割り当てる。
スパース表現分類(英: Sparse Representation Classification, SRC)は、学習された表現の幾何学に依存する標準インスタンスである。
我々は,残差による残次安定性を定式化し,幾何学的障害物を特徴づける。
論文参考訳(メタデータ) (Thu, 28 May 2026 09:33:18 GMT)
A Fully Convolutional Approach to Denoising Structural Dynamics Data from X-Ray Photon Correlation Spectroscopy [0.0] X線光子相関分光法(XPCS)のための完全畳み込みデノナイジングオートエンコーダ(FC-DAE)を提案する。
FC-DAEは任意の次元の入力を受け取り、様々な状態にまたがる相関構造を保存する。
構造的忠実性を維持しつつ、低信号対雑音条件下での複雑な力学特性を回復する。
論文参考訳(メタデータ) (Thu, 28 May 2026 14:14:52 GMT)
A Boundary--Residue Incidence Coalgebra for Associahedral Scattering Forms [0.0] 正幾何の顔のポーズに付随する境界-残留入射コガブラを導入する。
これをアソシアヘドラル散乱形式に適用する。
論文参考訳(メタデータ) (Thu, 28 May 2026 11:47:09 GMT)