A Benchmark for Semi-supervised Multi-modal Crowd Counting [70.5] 本稿では,半教師付きマルチモーダル群カウントに関する最初のベンチマークを構築した。
まず,ラベル付き非ラベルデータパーティションを異なるラベル付き比率で指定する,半教師付きマルチモーダル設定と標準化プロトコルを定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:38:41 GMT)
ThoughtFold: Folding Reasoning Chains via Introspective Preference Learning [69.6] 提案するThoughtFoldは,よりきめ細かい選好学習を,効率的な推論のための冗長探索に活用するフレームワークである。
ThoughtFoldは効率を大幅に向上させる。
最先端の精度を維持しつつ、DeepSeek-R1-Distill-Qwen-7Bのトークン使用量を約56%削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:21:27 GMT)
The Deliberative Illusion: Diagnosing Factual Attrition and Stance Homogenization in Multi-Agent LLM Deliberation [69.0] 問題クリティカルな事実の最大72%を,マルチエージェントによる議論で消し去ることを示す。
保持された証拠は誤解を招くことなく問題を再構築し、最終的なスタンスをベースモデルに固定し、単一の悪意のあるエージェントが誤った情報を共有コンテキストに注入することができる。
我々は、どの事実、不確実性、正当な不一致が相互作用を生き残るかを測定する評価を求める。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:15:40 GMT)
UniLab: A Heterogeneous Architecture for Robot RL Beyond GPU-Dominant Paradigms [68.4] シミュレーション支配型ロボット制御では、どのプロセッサが物理を実行するかではなく、シミュレーションスループット、ポリシー学習、実行時同期が効率的なエンドツーエンドループを形成するかどうかが重要な問題である。
データ移動、バッファリング、同期のための統一ランタイムを通じて、GPUポリシー更新からCPU並列シミュレーションを分離する、異種CPU常駐/GPU学習アーキテクチャであるUniLabを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:21:55 GMT)
BraveGuard: From Open-World Threats to Safer Computer-Use Agents [68.4] BraveGuardは、オープンワールドの脅威信号とリアルエージェントの軌道からモデルを訓練するための自己進化型防衛フレームワークである。
我々は、Qwen3-GuardやLlama-Guardなど複数のガードバックボーンをトレーニングしてBraveGuardをインスタンス化し、トラジェクトリレベルのエージェントセーフティベンチマークの結果のガードを評価する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:59:47 GMT)
Entropy Is Not Enough: Unlocking Effective Reinforcement Learning for Visual Reasoning via Vision-Anchored Token Selection [68.2] VEPO(Vision-Entropy token-selection for Policy Optimization)は,視覚感度とトークンエントロピーを明示的に統合した効果的なRLフレームワークである。
実験の結果,VEPOの先行性能は7Bスケールで2.28点,3Bスケールで3.15点,エントロピーのみのベースラインを著しく上回った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:26:55 GMT)
QUBRIC: Co-Designing Queries and Rubrics for RL Beyond Verifiable Rewards [68.2] クエリとルーブリックを共同設計するフレームワークを提案する。
QUBRICはSFTベースラインよりもアリーナハードで+5.5ポイントのゲインを達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:53:04 GMT)
Rethinking the Role of Tensor Decompositions in Post-Training LLM Compression [68.1] 分解は有望な方向として現れ、トランスフォーマーの重み構造に適したコンパクトなパラメータ化を提供する。
既存の研究では、これらの手法を狭い環境で評価しており、大規模展開においてテンソル化が有効かどうかは不明である。
我々は高密度およびMoEのテンソル圧縮を体系的に評価し、経験的解析と理論的解析の両方に基礎を置いた性能トレードオフを確立する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:45:21 GMT)
World Models Meet Language Models: On the Complementarity of Concrete and Abstract Reasoning [67.9] 本研究では,抽象的推論を伴う視覚的未来のシミュレーションを,モデルがどのように実行し,検証し,統合するかを考察する。
PF-OPSDは、教師側の特権的文脈としてのみ、地道な未来のビデオと回答を使用して、政治上の具体的な軌道を評価する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:07:49 GMT)
Benchmarking Visual State Tracking in Multimodal Video Understanding [67.7] マルチモーダル大言語モデル(MLLM)における視覚状態追跡の診断のためのVisual STAte Tracking benchmark (VSTAT)を導入する。
VSTATは、合成ビデオと実世界のビデオの両方から834のクリップで構成され、1500の質問と組み合わせて、1つのフレームまたはショートセグメントから答えられない。
MLLMは理由を見つけ、テキストで正しく追跡するが、追跡するイベントを視覚的に知覚することができない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:12:05 GMT)
When Model Merging Breaks Routing: Training-Free Calibration for MoE [67.3] Hessian-Aware Router (HARC) は、二階曲率情報を利用してマージされたルータを認識できるトレーニングフリーのフレームワークである。
数学的推論とコード生成タスクの実験は、HARCが様々なMoEマージベースライン間のルーティングの分解を効果的に軽減していることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:33:33 GMT)
AAD-1: Asymmetric Adversarial Distillation for One-Step Autoregressive Video Generation [66.6] AAD-1は、一段階の自己回帰画像-ビデオ生成のための非対称な対数蒸留フレームワークである。
AAD-1は1ステップの自己回帰ビデオ生成において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:55:30 GMT)
Demo2Tutorial: From Human Experience to Multimodal Software Tutorials [63.7] Demo2Tutorialは、スクリーン記録とインタラクションログを通じてキャプチャされたエクスペリエンスを構造化されたマルチモーダルソフトウェアチュートリアルに変換するフレームワークである。
ステッププランナーはこれらのステップを、目標とステップを表す階層的なタスクグラフに抽象化します。
Composerは解析されたエクスペリエンスを構造化された再利用可能なイメージテキスト命令に変換する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:39:07 GMT)
scTranslation: A Comprehensive Benchmark for Single-Cell Multi-Omics Modality Translation [62.0] scTranslationは、シングルセルマルチオミクスのモダリティ変換タスクの包括的なベンチマークである。
多様な翻訳データセットが含まれ、最先端のモデルを統合し、包括的な評価指標を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:00:49 GMT)
DOME: Learning Transferable Domain Variables from Sparse Supervision for Test-Time Adaptation [61.7] テスト時適応は、未ラベルのストリーミングデータのみを使用して、テストドメインのシフトにモデルを合わせることを目的としている。
既存のほとんどの手法は、実世界の領域シフトの多次元的およびサンプル固有の性質を無視して、単一の大域領域分布を暗黙的に推論する。
本稿では,サンプルのドメインをゼロショットで明示的にモデル化するドメインエンコーダDOMEを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:24:03 GMT)
Exploring Easy Boosts for Lidar Semantic Scene Completion [61.7] 複雑な設計設計を必要とせずに、ライダーセマンティックシーン補完(SSC)の性能を高める「フリーランチ」戦略。
まず,市販セグメンタから意味的な擬似ラベルを付与することで,既存のアーキテクチャの性能が大幅に向上することが実証された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:59 GMT)
GARDEN: Gravity-Aligned Reconstruction of Disentangled ENvironments from RGB images [61.2] 本稿では,RGBのみのフレームワークを提案する。このフレームワークは,再構成を物理的に地上に配置したシーンファクタ化として再構成し,構造化されたハイブリッドシーン表現を出力する。
結果として得られる表現は、明示的な剛体と分離された背景を組み合わせることで、視覚的リアリズムを維持しながら直接物理シミュレーションを可能にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:13:01 GMT)
VLESA: Vision-Language Embodied Safety Agent for Human Activity Monitoring [60.5] Vision-Language Embodied Safety Agent (VLESA)は、自我中心のビデオから人間の活動を監視する。
VLESAは、コンテキストに応じて同一のアクションが安全または危険である意図に依存した安全性に対処する。
目標を共同で推測し,映像から将来の行動を予測するための意図-行動予測エージェントを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:42:17 GMT)
Steer Where It Matters: Token-Level Visual-Sensitivity Steering for LVLMs Hallucination Mitigation [59.8] 幻覚緩和のためのTLVS(Token-Level Visual-Sensitivity Steering)を提案する。
このメカニズムはキャリブレーションのための最小限のトレーニングしか必要とせず、様々な視覚言語モデルに適用できる。
POPE, AMBER, CHAIR (COCO), MMHal, HallusionBenchなどのベンチマークでTLVSを評価し, 従来のステアリング法よりも一貫した改善が見られた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:23:28 GMT)
EvoDrive: Pareto Evolution for Safety-Critical Autonomous Driving via Self-Improving LLM Agents [59.4] 既存の手法は通常、手工芸品でこのトレードオフを管理し、探索されていないパターンを見渡す。
本稿では,シナリオ生成のためのLLMベースのエージェント進化フレームワークであるEvoDriveを紹介する。
EvoDriveはシミュレーターによるアクター批判アーキテクチャを採用しており、メモリ駆動アクターはジェネレータの改善を反復的に提案し、批判者は不明瞭な候補をフィルタリングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:01:23 GMT)
Can Generalist Agents Automate Data Curation? [58.7] トレーニングデータのキュレーションは、現代のAI開発において、もっとも重要だが労働集約的な部分のひとつだ。
一般のコーディングエージェントがこのデータキュレーションループを自動化できるかどうかを問う。
モデル、トレーニングレシピ、評価スイートを修正するエージェント中心のベンチマークである*Curation-Bench*を紹介します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:26:53 GMT)
TGV-KV: Text-Grounded KV Eviction for Vision-Language Models [58.3] VLM(Vision-Language Models)は自動回帰生成パラダイムを継承し、以前のトークンのキーと値(KV)をキャッシュして推論を高速化する。
VLM(TGV-KV)のためのテキスト・グラウンドKV推定法を提案する。
TGV-KVのスループットは52.6%向上し、極端な維持予算は5%となった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:06:17 GMT)
CORE: Conflict-Oriented Reasoning for General Multimodal Manipulation Detection [56.6] ジェネレーティブAIは、マルチモーダルなフェイクニュースをますます現実的で広範にし、公共の信頼と社会的安定に深刻な脅威を与えている。
textbfConflict-textbfOriented textbfREasoning (textbfCORE) フレームワークを提案する。
COREは堅牢で一般化可能なコンフリクト検出を実現し、いくつかのサンプルやゼロショット設定で、目に見えない操作タイプに効果的かつ迅速に適応する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:53:48 GMT)
P\textsuperscript{2}-DPO: Grounding Hallucination in Perceptual Processing via Calibration Direct Preference Optimization [55.7] 幻覚は近年、LVLM(Large Vision-Language Models)において大きな研究の注目を集めている。
直接選好最適化(DPO)は、人間が提供した修正選好から直接学習することを目的としており、幻覚の問題に対処する。
本稿では,Ptextsuperscript2-DPO(Perceptual Processing Direct Preference Optimization, Ptextsuperscript2-DPO)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:22:53 GMT)
What Makes Interaction Trajectories Effective for Training Terminal Agents? [55.6] Terminal-Legoは、現実世界の問題を環境検証されたエージェントタスクに変換するスケーラブルなパイプラインである。
下着剤であるDeepSeek-V3.2の軌跡を微調整した学生は、はるかに強力な一般化を示している。
Qwen3-32Bは15.3kの終端レゴ軌道しか持たず、終端ベンチ2.0で24.3%のスコアを獲得し、データボリュームの30倍以上で確立された以前のSOTAのパフォーマンスと競合する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:37:47 GMT)
ViMax: Agentic Video Generation [55.5] ロングフォームビデオ生成には、体系的な物語計画と視覚的一貫性が必要である。
我々のフレームワークは、グローバルなストーリーコヒーレンスのための検索強化世代を備えた階層的な物語エンジンを採用している。
VLM誘導エージェントは、物語のコヒーレンスと視覚的忠実さの両方を継続的に監視し、洗練する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:55:41 GMT)
Right Makes Might: Aligning Verified Hidden States Empowers RL Reasoning [55.3] 現在の方法では、それぞれの正しいロールアウトを単一の報酬ビットに減らし、隠れた状態間で共有される幾何学的構造を無視している。
本稿では,RLトレーニングにおけるアンカートークンにおける正ロールアウトの最終層を,トレーニングと推論の両方においてゼロオーバーヘッドで整列する補助損失関数Hidden-Alignを提案する。
8つの数学的推論ベンチマークでは、Hidden-AlignはDAPOベースラインの平均パス@1をQwen3-1.7B, 4B, 14Bで3.8, 6.2, 5.4ポイント改善し、3つのスケールで一貫したパス@kゲインを得る。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:51:15 GMT)
SkelHCC: A Hyperbolic CLIP-Driven Cache Adaptation Framework for Skeleton-based One-Shot Action Recognition [55.0] SkelHCCは、シングルショットアクション認識のための統合スケルトンハイパーボリックCLIP駆動キャッシュ適応フレームワークである。
双曲幾何学の負の曲率と指数体積の増大を利用して、EH-HCLIPは自然にヒト解剖学の結合部分体階層をコードする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:13:27 GMT)
SkillDAG: Self-Evolving Typed Skill Graphs for LLM Skill Selection at Scale [54.7] 本稿では,スキル間関係を型付き有向グラフとしてモデル化したSkillDAGを提案する。
各検索はベクトルマッチング、型付きエッジ隣人、競合信号を返す。
ALFWorldとSkillsBench with MiniMax-M2.7では、SkillDAGは67.1%の成功と27.3%の報酬を得た。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:45:21 GMT)
Online Learning with Gradient-Variation Interval Regret [54.6] そこで本研究では,勾配変動を伴う時間間隔のリフレッシュなスケーリングを実現するオンライン学習アルゴリズムを提案する。
提案手法では, よりシンプルで効率的な2層オンラインアンサンブル構造を用いて, 高い理論的保証を実現する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:16:45 GMT)
Demystifying Pipeline Parallelism: First Theory for PipeDream [53.7] 本稿では、PDスタイルの手法に対して、クリーンな非収束性をもたらす固定ブロック-SGD抽象化としてランダム化PipeDream(PD)を導入する。
定常PDによって引き起こされる遅延は、$S2 - S/2 + O(1)$ for $S$として増大するので、スタイルリードのコントリビューションは、チューナレート形式で$(2S4)$、同等に$(S4/K)$としてスケールする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:14:57 GMT)
Are Common Substructures Transferable? Riemannian Graph Foundation Model with Neural Vector Bundles [53.7] 我々はニューラルベクトルバンドルと呼ばれるグラフ固有の幾何学学習フレームワークを開発した。
GAUGEは,ベクトルバンドルを構築し,幾何学的に整合した局所座標を平坦化する,事前学習可能なニューラルネットワークアーキテクチャである。
ゼロショットリンク予測やグラフ同型を含む課題タスクにおいて,その優れた表現性を実証的に検証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:35:42 GMT)
BA-T: An Iterative Transformer for Two-View Bundle Adjustment [53.2] 暗黙のトークン空間における繰り返し可能なレイヤとして,BAスタイルの構造化更新を実装した反復変換器であるBA-Tを提案する。
実験により、BA-Tは反復間におけるポーズと再構成の精度を徐々に改善することが示された。
BA-Tは、奥行き重心に対するコンパクトで効率的で構造的な代替手段を提供し、軽量アーキテクチャ内で正確な3D再構成を可能にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:51:14 GMT)
Bridging Auxiliary Constraints to Resolve Instruction Following in Large Reasoning Models [52.9] 大規模推論モデル(LRM)は多くのタスクにおいて印象的な能力を示してきたが、彼らは確実に複数の命令に従うことに苦労している。
我々はこの課題を制約整合問題(CAP)として定式化する。
本稿では,制約の構造化知識グラフとして命令を表現してCAPに対処する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:23:28 GMT)
Unlocking Feature Learning in Gated Delta Networks at Scale [52.7] 大規模言語モデルの訓練とスケーリングは膨大な計算資源を必要とする。
我々はGated Delta Networkのスケーリングルールを導出する。
言語モデル事前学習の実験により、我々の構成が安定した学習速度転送を可能にすることが確認された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:45:24 GMT)
What to Test Next: Interpretable Coverage Gap Discovery in Driving VLMs [52.5] 視覚言語モデル(VLM)を駆動するには,操作設計領域(ODD)が定義する様々な条件のシーンを正確に理解する必要がある
SliceScorerは、欠落したスライス推薦のための決定論的スコアリングルールである。
SliceNavは, 従来のスライス発見法よりも, 高リスクカバレッジギャップを効果的に表面化することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:32:33 GMT)
AnchorMoE: Interpretable Time Series Classification via Anchor-Routed MoE [52.0] AnchorMoEは、解釈可能な構成別分類フレームワークである。
ローカルパッチのマルチビュー表現をエンコードし、専門の専門家にルーティングする。
実世界のベンチマークと合成ベンチマークの実験は、AnchorMoEが非常に競争力のある分類性能を達成することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:30:54 GMT)
Neural Networks Provably Learn Spectral Representations for Group Composition [51.6] ニューラルネットワークトレーニング中に内部構造がどのように現れるかを検討する。
トレーニング力学は表現理論エネルギー汎関数上の勾配上昇によって支配されていることを証明する。
このフレームワークは特徴学習の表現論的記述を提供し、新しい低ランク圧縮現象を特徴付ける。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:04:21 GMT)
MAOAM: Unified Object and Material Selection with Vision-Language Models [51.3] Mask Any Object And Material (MAOAM) はインタラクティブな画像編集のための統合された選択フレームワークである。
テキストベースのインタラクションとクリックベースのインタラクションの両方で、正確なオブジェクトとマテリアルレベルの選択を可能にする。
重要な課題は、テキストアノテーションによるマテリアルセレクションデータセットの欠如である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:57 GMT)
Where Do Deep-Research Agents Go Wrong? Span-Level Error Localization in Agent Trajectories [51.2] 最終回答に基づく評価は、エージェントが成功するかどうかを示すが、どの部分の軌道が答えを信頼できないかを示すものではない。
2つのエージェントフレームワーク、3つのバックボーンモデル、3つのベンチマークから2,790の実際のトラジェクトリを収集し、生ログをセマンティックスパンに変換し、エキスパートレビューを通じて有害なエラースパンを注釈付けします。
我々は,エージェントの主張を追跡するクレーム中心の監査フレームワークであるDRIFTを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:30:22 GMT)
SparseStreet: Sparse Gaussian Splatting for Real-Time Street Scene Simulation [51.1] 既存の方法は細部を捉えるために大量のガウス原始体を必要とする。
SparseStreetはストリートシーンに特化して設計された汎用圧縮フレームワークである。
本手法は, 動的物体の形状と外観を効果的に保存し, ガウス原始体の総数を大幅に削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:06:14 GMT)
CauTion: Knowing When to Trust LLMs for Ensemble Causal Discovery [51.1] 大規模言語モデル(LLM)は、統計的推論を補完する将来的なドメイン知識の源を提供する。
我々は、LLMドメイン知識を統計的因果探索アルゴリズムのアンサンブルに確実に統合するフレームワークであるCauTionを提案する。
CauTionは、データ中心とLLM拡張ベースラインの両方を一貫して上回る。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:07:43 GMT)
Need to Know: Contextual-Integrity-Grounded Query Rewriting for Privacy-Conscious LLM Delegation [50.6] コンテキスト整合性(Contextual Integrity)の下でクエリの書き直しを保存したプライバシをリキャストします。
本稿では,CI誘導型強化学習フレームワークを提案する。
実験により、学習したリライターは、デバイス上のベースラインに対して+10.1平均ユーティリティを達成し、最高のプライバシユーティリティトレードオフを達成することが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:28:28 GMT)
Beyond Encoder Accumulation: Measuring Encoder Roles in Multi-Encoder VLMs [50.4] 我々は、統一パイプラインの下で、5つの共通ビジョンエンコーダの空でないサブセット31を再訓練し、評価する。
各エンコーダのコントリビューションを,容量と必要量という2つの軸に分解する。
エンコーダごとのプロジェクタ有効ランクは、残留スコアの変動を説明する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:46:42 GMT)
OVO-S-Bench: A Hierarchical Benchmark for Streaming Spatial Intelligence in Multimodal LLMs [49.8] OVOS-Benchは、人間中心の空間知能をストリーミングするための完全な注釈付きベンチマークである。
348のソースビデオに関する1,680の質問で構成されている。
それぞれの質問はクエリとエビデンスインターバルを持ち、評価において、モデルはクエリの前のプレフィックスのみを表示する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:51:32 GMT)
Reasoning over Grammar: Can Synthetic Linguistic Reasoning Traces Enhance Low-Resource Machine Translation? [49.8] 我々は,低リソース機械翻訳が言語解析と文法推論の中間段階の構造化の恩恵を受けるか検討する。
本稿では,Universal Dependencies Treebank,Dictionary,Gram-rule Bankから,ステップバイステップの言語推論トレースを自動的に生成するパイプラインを提案する。
その結果,言語的推論の痕跡は推論時ガイダンスとして最も有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:36:12 GMT)
SRENet: Spectral Re-Entry Network for Point Cloud Action Recognition [49.5] 本研究では,行動認識の周波数視点から,大域的文脈と微粒な動きの時間的ダイナミクスを学習するためのSRENetを提案する。
SRENetは、ポイントクラウドベースのアクション理解における周波数モデリングの有効性を検証し、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:11:47 GMT)
TTT-VLA: Test-Time Latent Prompt Optimization for Vision-Language-Action Models [49.5] VLA(Vision-Language-Action)モデルは目覚ましい進歩を遂げているが、展開時の分散シフトには弱いままである。
近年のVLAモデルは、プロンプトが政策行動の効率的なインターフェースとして機能することを示唆しているが、既存のプロンプトベースのステアリングは通常、外部ガイダンスに依存している。
VLAのテストタイムトレーニング(TTT)は、プロンプトの最適化によって実現可能か?
我々は、遅延プロンプト最適化(LPO)に基づくテスト時間トレーニングフレームワークであるTTT-VLAでこの問題に対処する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:10:39 GMT)
Can Factual Opinions Be Edited (Manipulated) in Large Language Models? [49.2] 大規模言語モデル(LLM)は、様々なドメインに統合され、知識編集技術が重要かつ潜在的に危険である可能性がある。
現在の編集方法は主として原子的な事実をターゲットとしており、社会問題に関する公的な人物のスタンスを文書化するなど、事実的意見を操作することに関連する重大なリスクを見落としている。
本稿では,261の公開数字,19の課題カテゴリ,2,178の完全な意見記録を含むFactual Opinion Editing with Evidenceベンチマークを紹介する。
本評価は,現在行われている編集技術が現実的な意見と大きく対立していることを示し,しばしば表面的変化のみを達成する一方で,編集された意見とモデルが生み出す支持的証拠との整合性を維持することに失敗することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:35:00 GMT)
Smart Transportation Without Neurons -- Fair Metro Network Expansion with Tabular Reinforcement Learning [49.2] 我々は,交通需要を満たすため,メトロ・ネットワーク拡張問題(MNEP)に取り組む。
深層強化学習 (Deep RL) は複雑な逐次決定過程において有効である。
我々は、MNEP問題はディープRL法を必要としないほど小さいことを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:29:35 GMT)
Analyzing Stream Collapse in Hyper-Connections: From Diagnosis to Mitigation [48.9] ハイパーコネクションは、単一のトランスフォーマー残ストリームを複数のストリームに置き換え、ストリームインデックスに置換対称性を導入する。
我々は、この対称性が実際にどのように解決されるか、ストリームがバランスの取れた方法で専門化しているか、それとも支配的なストリーム利用を示すかを検討する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:00:49 GMT)
ARBOR: Online Process Rewards via a Reusable Rubric Buffer for Search Agents [48.8] LLMベースの検索エージェントは、主に結果のみの報酬で訓練され、検索プロセス自体は監督されていない。
この信号は、全てのサンプル軌跡が同じ正当性を共有する結果同質な群に対して退化し、群内の優位性はゼロとなり、勾配は得られない。
ARBOR(Adaptive Buffer for Online Reward)は,クエリ間で共有されるルーリックメモリを維持する再利用可能なプロセス・リワードフレームワークである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:58:54 GMT)
Tailoring Strictly Proper Scoring Rules for Downstream Tasks: An Application to Causal Inference [48.8] 本稿では,ダウンストリーム誤差メトリックの局所曲率をマッチングすることにより,タスク固有の厳密なスコアリングルールを導出するフレームワークを提案する。
これを平均処理効果 (ATE) 推定に適用し, 閉形式損失と対応する正準確率写像を導出する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:41:25 GMT)
Solipsistic Superintelligence is Unlikely to be Cooperative [48.7] 極めて有能なタスク解決ツールである超知能は協調的ではないと我々は主張する。
我々は、相互依存を中核的な設計原則として扱う非ソリプシックな研究パラダイムを提唱する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:54:55 GMT)
Expert-Aware Causal Tracing of Factual Recall in Sparse MoE Language Models [48.4] ファクトリコールの因果トレースは、主に高密度トランスフォーマー言語モデルで研究されている。
スパースMoE言語モデルのための専門家対応因果トレースを定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:35:48 GMT)
Black-box, Adaptive, Efficient, Transferable, Harmful, Applicable... Attacks Are All You Need to Break LLMs [47.5] 欠陥のある攻撃設計は、ロバスト性の推定を増大させ、デプロイメントのリスク評価と防御比較を信頼できないものにすることができる。
Indirect Harm Optimization (IHO) は、有害判定に対する反復的選好最適化によって訓練された、マスク付き拡散言語モデルアタッカーである。
以上の結果から,IHOは従来,信頼性を向上した標準化されたジェイルブレイク評価への実践的な一歩と位置づけた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:39:15 GMT)
Eliciting Complex Spatial Reasoning in MLLMs through Wide-Baseline Matching [47.5] マルチモーダル大言語モデル(MLLM)の空間的推論におけるワイドベースラインマッチングは困難なテストベッドである
ReasonMatch-Benchは, 室内, 屋外, オブジェクト中心のシナリオにまたがって, 視点変位と粒度の一致によって階層化されたベンチマークである。
大規模ビデオ3Dコーパスからワイドベースラインビューペアを自動的に抽出するスケーラブルなデータ生成パイプラインを構築した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:46:34 GMT)
TSQAgent: Rating Time Series Data Quality via Dedicated Agentic Reasoning [47.2] 大規模言語モデル (LLM) はペアワイズ比較と次元毎の評価による品質評価のための有望なパラダイムとして登場した。
本稿では,3つの協調的役割からなるTS品質評価のためのエージェント推論フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:28:17 GMT)
HybridThinker: Efficient Chain-of-Thought Reasoning via Compressed Memory and Transient Thought Steps [47.0] 拡張チェーン・オブ・シント(CoT)トレースは、LCM推論を改善するが、かなりの計算とメモリコストを発生させる。
textbfHybridThinkerを提案し、これらの表現の保存に加えて、思考ステップも一時的に保持し、きめ細かい詳細を提供する。
これらのステップから直接情報を取得することで、学習の継続によって、モデルがメモリトークンをバイパスすることができることを観察する。
そこで我々は,次のステップに注意することで,いくつかの思考ステップのみに直接アクセスし,他の思考ステップをマスクするハイブリッドトレーニング手法を導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:22:05 GMT)
CoEval: Ranking Language Models for Custom Tasks Without Labeled Data or Trustworthy Benchmarks [47.0] CoEvalは、特定のアプリケーションに対して言語モデルを選択またはランク付けするための再利用可能なフレームワークである。
ラベルのない新しい属性制御ベンチマークを合成し、各ランでアイテムが新たに生成されるため、汚染のない。
クロスファミリーの裁判官アンサンブルは、人間のレイパーなしで候補者モデルをランク付けします。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:41:43 GMT)
Bridging Predictive Uncertainty and Safe Action: Sample-Conditioned Differentiable Planning for Autonomous Driving [46.9] 複雑でダイナミックでインタラクティブな運転環境は、自動運転に重大な課題をもたらす。
現在のシステムにおける基本的なボトルネックは、高度に表現力のある不確実性モデリングと解釈可能な安全な動き計画との切り離しである。
本稿では, このギャップを埋めるために, 拡散生成将来の軌道を最適化プロセスに明示的に組み込む, サンプル条件付き微分可能計画フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:10:02 GMT)
WebRISE: Requirement-Induced State Evaluation for MLLM-Generated Web Artifacts [46.9] MLLM生成Webアーティファクトの既存のベンチマークは、局所的な証拠を通じて相互作用を評価する。
タスク要求をインタラクションコントラクトグラフにコンパイルするWebRISEを紹介します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:29:40 GMT)
Hierarchical Federated Learning with Dynamic Clustering and Adaptive Regularization for Robust Infrastructure Inspection [46.7] 本稿では,新しい階層型フェデレーション学習フレームワークを提案する。
このフレームワークは、相乗的な2層最適化戦略を編成する。
大規模で実世界の構造検査データセットに関する総合的な評価は、マクロクラスタリングとマイクロレギュラー化の階層的な統合が二重レベルの不均一性をうまく中和することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:14:26 GMT)
Neuron Populations Exhibit Divergent Selectivity with Scale [46.3] ロゼッタニューロン(Rosetta Neurons)は、独立に訓練されたモデルにおいて、活性化パターンが類似しているニューロンのクラスである。
最大30Bパラメータと最大5Bパラメータの視覚モデルの解析において、ロゼッタニューロンの集団はモデルサイズにおけるサブ線形パワー則に従う。
さらに、ロゼッタニューロンはより選択的になり、スケールとともに単意味になりつつあります。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:52 GMT)
Large Language Models Hack Rewards, and Society [46.2] 社会的規制は報酬関数と構造的に類似している。
我々は、RL中の報酬関数をハックするモデルの傾向が、社会的ハッキングと呼ばれるより連続的な障害モードにスケールできるかどうかを問う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:29:48 GMT)
Dynamic Short Convolutions Improve Transformers [44.8] 本稿では,トランスフォーマー改善のためのニューラルネットワークプリミティブとして,動的短畳み込みを導入する。
キー、クエリ、値表現に動的に短い畳み込みを適用すると、パフォーマンスが向上する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:07:55 GMT)
GN0: Toward a Unified Paradigm for Generation, Evaluation, and Policy Learning in Visual-Language Navigation [44.6] 身体的ナビゲーションは知的エージェントと物理世界を結ぶ。
多様な3Dシーンをキュレートし、大規模ナビゲーションデータのための自動パイプラインを開発する。
対話型ローミングと衝突認識ナビゲーションをサポートする高忠実度シミュレーションプラットフォームを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:05:47 GMT)
Clustered Self-Assessment: A Simple yet Effective Method for Uncertainty Quantification in Large Language Models [44.6] 本研究では,大規模言語モデルにおける不確実性定量化のための簡易かつ効果的な自己評価手法を提案する。
提案手法は,世代を意味的に異なるクラスタに分類し,構造化された複数選択質問の回答オプションに変換し,モデルによって割り当てられた確率を信頼度推定として利用する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:25:54 GMT)
Beyond Single Solution: Multi-Hypothesis Collaborative Deep Unfolding Network for Image Compressive Sensing [44.0] MHC-DUN(Multi-Hypothesis Collaborative Deep Unfolding CS Network)を提案する。
多様な解空間をまたいだ共同最適化により、複数の仮説を明示的にモデル化し、活用する。
実験の結果,提案手法は既存のCSネットワークよりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:50:56 GMT)
Exact Unlearning in Reinforcement Learning [44.0] そこで我々は,$$-TV-stable の強化学習アルゴリズムが存在し,正確なアンラーニング手順をサポートすることを示す。
また、$(Hsqrt!SAT! +! SAH/)$ for $-TV-stable RL algorithm という下限を定め、アルゴリズムが極小に近いことを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:54:44 GMT)
Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories [43.9] 我々は、モデルが短期的な脆弱な記憶をリプレイで安定した長期的知識に継続的に学習し、蒸留することを可能にする'Sleep'パラダイムを導入する。
人間の学習プロセスに触発されて、我々は、知識探索のための新しい一般化蒸留プロセス(すなわち、オンライン蒸留と強化学習の組み合わせ)を提示する。
長期学習, 継続学習, 知識の取り込み, および数発の一般化タスクに関する実験は, 睡眠ステージの重要性を裏付けるものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:56:55 GMT)
MUSE: A Unified Agentic Harness for MLLMs [43.7] マルチモーダル大規模言語モデル(MLLM)のための統一型構造化実行ハーネスであるMUSEを紹介する。
MUSEは、タスク表現、視覚処理、知覚ツールの使用、構造化解析、決定論的検証、検証誘導修復のための構成可能なモジュールを備えた既製のMLLMをラップする。
視覚的空間計画,視覚知覚,マルチモーダル推論,きめ細かな視覚的識別にまたがる様々なベンチマークでMUSEを評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:24:30 GMT)
FreeStreamGS: Online Feed-forward 3D Gaussian Splatting from Unposed Streaming Inputs [43.1] FreeStreamGSは、効率的で高品質なNVSのための堅牢なオンラインフィードフォワードフレームワークである。
本稿では,2つの重要なメカニズムを紹介する。デカップリング型内因性回復ヘッドは,内因性累積カメラバイアスを除去し,長期ストリーミング時のシーンスケールジッタを防止する。
実験によると、FreeStreamGSは、将来のフレームにアクセスせずに動作しているにも関わらず、最先端のオフラインフィードフォワード3DGSメソッドと競合するレンダリング品質を実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:16:09 GMT)
OneVLA: A Unified Framework for Embodied Tasks [42.8] ナビゲーションと操作は インテリジェンスの基本能力だ
OneVLAは、これらの異なるタスクを単一の凝集性フレームワークに統合する統一アーキテクチャである。
シミュレーションと実世界の両方の環境での実験は、OneVLAが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:11:27 GMT)
Analyzing the Evolution of Structural Communities within Microservice Architecture [42.8] コミュニティ検出は、互いに強く依存するネットワーク内のサービスのグループを特定する方法である。
train-tketベンチマークの6つのリリースのマイクロサービスアーキテクチャ内で、時間的コミュニティ検出を実行しました。
私たちは、複数のコミュニティに属するサービスと、同じコミュニティ内のサービスに、入ってくるサービスと出ていくサービスの両方を見つけました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:44:31 GMT)
SL-BiLEM: Structured Learnable Behavior-in-the-Loop Epidemic Modeling for Forecasting and Policy Evaluation [42.6] エピデミック予測は、人間の行動が病気の拡散に動的に反応する、という根本的な課題に直面している。
頑健な外挿のための正則化として物理的制約を利用するtextbfSL-BiLEM(Structured Learnable Behavior-in-the-Loop Epidemic Model)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:33:04 GMT)
Tailoring pure valley-Zeeman spin-orbit coupling in WSe$_2$-encapsulated monolayer graphene [42.4] ねじれたファンデルワールスのヘテロ構造における工学的近接効果は、電子的特性を設計するための強力なプラットフォームを提供する。
単層グラフェン中の純粋なバレー-ゼーマンスピン軌道カップリングは、2つの平行ねじれWSe$単層間のカプセル化によって達成される。
また, カプセル化幾何をチューニングすることにより, 近接スピン軌道カップリングを完全にクエンチできることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:43:48 GMT)
PointAction: 3D Points as Universal Action Representations for Robot Control [42.1] 本稿では,映像予測をロボット行動にブリッジするフレームワークであるPointActionについて,明示的なポイントベース4Dモデリングにより紹介する。
PointActionは、ロボットシーンにおける最先端の4D生成品質を実現し、シミュレーションにおいて既存のベースラインを上回り、事前トレーニング中に見えない2つの本物のロボットアームに一般化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:30:50 GMT)
SagaQA: A Multi-hop Reasoning Benchmark for Long-form Narrative Understanding in TV Series [42.1] フル長テレビシリーズに対するマルチホップ推論のベンチマークであるSagaQAを紹介する。
SagaQAの際立った特徴は、その推論ステップの粒度である。
異なる計画戦略がこのような複雑な推論をどのように扱うかを研究する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:14:01 GMT)
Hallucinations as Orthogonal Noise: Inference-Time Manifold Alignment via Dynamic Contextual Orthogonalization [42.0] 大規模言語モデル(LLM)における幻覚は、文脈的事実や論理的制約と矛盾するコンテンツの生成によって特徴づけられる。
推論時間介入法である動的文脈直交化(DCO)を導入する。
本研究は,幻覚の幾何学的解釈を検証し,多様体アライメントの計算的手法としてDCOを確立した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:56:29 GMT)
Conditional Latent Diffusion Model with Fourier-based Motion Modelling for Virtual Population Synthesis [41.9] 心臓血管の応用では、仮想解剖学は典型的には、生成モデルからサンプリングされた3D+tメッシュとして表される。
メッシュをエンコードする畳み込みメッシュVAEからなる条件生成フレームワークである4D F-MeshLDMを提案する。
4D F-MeshLDMは解剖学的忠実度において最先端のベースラインを上回り, ほぼゼロサイクル閉鎖誤差を達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:10:00 GMT)
SkillRevise: Improving LLM-Authored Agent Skills via Trace-Conditioned Skill Revision [41.6] SkillReviseはエージェントスキルを反復的に洗練するために設計された実行基盤フレームワークである。
SkillReviseは、実行エビデンスからスキル欠陥を診断し、一般的なメモリから関連する修復原則を検索し、実行順に編集を適用する。
単発ベースラインを大幅に上回り、SkillsBenchにおけるベースエージェントの成功率は36.05%から61.63%に向上した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:41:20 GMT)
Automatic Layer Selection for Hallucination Detection [41.6] 幻覚関連信号は、大言語モデルの最終層(LLM)よりも中間層に強く符号化されている
提案する選択基準は, 最適層, 準最適層を連続的に同定するFEPoID (First Effective Peak of Intrinsic Dimension) である。
FEPoIDはトレーニング不要で、計算オーバーヘッドは無視できる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:26:44 GMT)
Imaginative Perception Tokens Enhance Spatial Reasoning in Multimodal Language Models [41.4] 視覚言語モデル(VLM)は多くのタスクで優れるが、重要な情報が直接観測できない場合、空間的推論に苦慮する。
Inaginative Perception Tokens (IPT) は、VLMが知覚する空間構成を外部化する中間的知覚表現である。
IPTの監督は、空間的推論を一貫して改善し、しばしば思考訓練のテキスト連鎖よりも優れる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:17 GMT)
DyaPlex: Full-Duplex Speech-Motion Model for Dyadic Interaction [41.3] 連続した相互通信を捉えるため、このモデルはストリーミング方式で音声と音声の両方の物理運動を同時に生成・生成する。
統合された二進的トークンインターリーブ機構を導入し、相互注意を導くことにより、本モデルでは、自己回帰と潜在リッチ音声特徴とを効果的に一致させる。
本モデルでは, 相互依存関係を効果的に把握し, モナディック, ディヤディックの両人間のインタラクションベンチマークにまたがって, 新たな最先端性能を確立する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:42:56 GMT)
Exploiting Verification-Generation Gap: Test-Time Reinforcement Learning with Confidence-Conditioned Verification [41.1] テスト時強化学習は、大規模言語モデルの推論能力を高めるための有望なパラダイムとして登場した。
本稿では,TTRL-CoCoV(Test-Time Reinforcement Learning with Confidence-Conditioned Verification)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:11:09 GMT)
Quantifying Faithful Confidence Expression in Large Reasoning Models [40.9] 大規模推論モデルの忠実な校正を定量化する新しい枠組みを提案する。
本フレームワークは,内的不確実性の3つの要因に対する言語的決定性を解析する。
忠実な信頼表現はLRMにとって重要な課題である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:53:45 GMT)
Skill Is Not Document: A Query-Conditional Benchmark and Two-Stage Retriever for LLM Agent Skill Routing [40.6] R3-Skillは、現実的なエージェントスキルルーティングのベンチマークである。
スキル互換性を明示的な訓練信号とする2段階検索システムを構築した。
データセット、トレーニングコード、モデルウェイトは、エージェントスキルルーティングのためのオープンソースとしてリリースされている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:30:46 GMT)
MemTrain: Self-Supervised Context Memory Training [40.6] 既存のメモリエージェントアプローチは通常、下流タスクで強化学習を施したエンドツーエンドで訓練される。
MemTrainは、LLMエージェントのコンテキストメモリ能力を高めるための自己教師型トレーニングフレームワークである。
MemTrainは、異なるモデル間のダウンストリームメモリ集約推論性能を一貫して改善する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:56:24 GMT)
GeoAlign: Beyond Semantics with State-Guided Spatial Alignment in VLA Models [40.5] VLA政策学習のための状態誘導型空間アライメントアーキテクチャであるGeoAlignを紹介する。
GeoAlignは、ロボットドメインのRGB-D監視を備えたRGBジオグラフィックブランチをポストトレーニングし、ポリシーロールアウトのためにRGB由来のGeometry-Enhanced Post-Trained機能を生成する。
GeoAlignは、LIBEROの99.0%、SimplerEnv-Fractalの3つのタスクで85.3%、幾何学的にクリティカルな8つの現実世界のALOHAタスクで78.8%を達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:01:18 GMT)
ADAPTOOD: Uncertainty-Aware Fine-Tuning for Out-of-Distribution ECG Time Series Models [40.5] 多様なセンサー、人口、アプリケーション設定によって生じる分散シフトによって、パフォーマンスは劣化することが多い。
分散シフト重大度を定量化するためにデータ不確実性を活用する新しいフレームワークであるADAPTOODを提案する。
我々は,ADAPTOODが既存のOODタスクよりも7%高い精度,12.9%高い精度を実現していることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:26:20 GMT)
Preference-Calibrated Human-in-the-Loop Reinforcement Learning for Robotic Manipulation [40.2] PACT(Preference-calibrated Actor-Critic Training framework)を提案する。
まず、人間の実演から学習し、信用補正のための最適部分を特定するプログレスモデルを設計する。
次に、選好ペアを構築して、同定された準最適セグメントのベルマン目標をペナルティ化する反ファクト的優位性を定義する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:38:25 GMT)
PR2: Predictive Routing Replay for MoE-Based LLM Reinforcement Learning [40.1] 本稿では,各ルータを軽量な進化予測器で拡張し,短水平ルータの進化を予測できる予測ルーティング・リプレイ(PR2)を提案する。
PR2はルーティングによるミスマッチを低減し、RL安定性を改善し、様々な推論ベンチマークでパフォーマンスを向上する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:28:31 GMT)
An AutomationML Domain Library for the Formalized Process Description [39.8] VDI/VDE 3682によるFPD(Formalized Process Description)は、エンジニアリングドメイン全体にわたるプロセスを記述するための標準化されたグラフィカル表記を提供する。
本稿では,FPD言語要素の完全集合を形式化するAutomationML(AML)ドメインライブラリを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:14:25 GMT)
FederatedSkill: Federated Learning for Agentic Skill Evolution [39.7] 我々は、協調エージェント進化のためのプライバシー保護フレームワークであるFederatedSkillを紹介した。
FederatedSkillは、セマンティックスキルの差分、ローカルライブラリ上の構造化パッチをコミュニケーションの基本単位として利用する。
サーバ側では、進化エージェントがこれらのパッチを集約し、クライアント固有の機能境界を動的にモデル化します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:38:05 GMT)
Do Real-World Datasets Contain Natural Experiments? An Empirical Study Using Causal Feature Selection [39.7] 自然界では、一部の個人やグループに影響を与えるが、他の個人には影響しない事象は自然実験として知られている。
因果探索を用いて基礎となる因果グラフを復元し,因果リンクに基づく特徴選択を行う。
この結果から,実世界のデータセットには自然実験が組み込まれており,これらの自然実験を利用してモデル性能を向上させることが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:12:30 GMT)
$A^2$: Smaller Self-Supervised ViTs Localize Better than Larger Ones [38.9] より小さい自己監督型VTのアテンションマップは、より大きいVTよりも前景のオブジェクトのローカライズが優れていることがわかった。
両世界を最大限に活用するために,この逆スケーリング探索を利用するシンプルな手法である$A2$を提案する。
A2$は完全に事前訓練された機能を使用し、グループラベルを必要とせず、データセットごとの注意やバックボーンのトレーニングを必要としない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:45:02 GMT)
Spectral Anatomy of Quantum Gaussian Process Kernels [38.3] 我々は,Nystrm近似誤差に束縛されたコーシー=シュワルツテール,有限サンプル分散抽出等式,およびエンフターゲット依存の最適エントロピーのキャラクタリゼーションを証明した。
診断はカーネルに依存しない: ハードウェア効率、マッチゲート、IQPのインハンドRBF/Matérn/RFF/deep-カーネルファミリはすべて同一の$S/log n$曲線に崩壊する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:28:16 GMT)
SkillPyramid: A Hierarchical Skill Consolidation Framework for Self-Evolving Agents [38.3] 最近のAIエージェントは、複雑なタスクを解決するためのスキルを柔軟に実行できますが、その長期的な改善は、体系的なスキル構築、蓄積、転送の欠如によって制約されます。
SkillPyramidは,タスクのより広範な一般化のために既存のスキル体験を再利用するスキル統合フレームワークである。
SkillPyramidは平均報酬を38.0%、実行手順を27.7%削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:14:27 GMT)
VistaHop: Benchmarking Multi-hop Visual Reasoning for Visual DeepSearch [38.2] 視覚中心の検索とマルチホップ視覚推論を評価するベンチマークであるVistaHopをVisual DeepSearchで紹介する。
VistaHopには、300の高解像度画像、25のビジュアル検索シナリオ、350のマルチホップQAタスクが含まれており、モデルが視覚アンカーからエビデンスチェーンに従うか、複数の画像グラウンドの推論パスに情報を融合させる必要がある。
さらに,テキスト検索,画像検索,画像トリミング,エビデンスベースの回答検証によるツール強化推論をサポートする統合評価環境であるVistaArenaを開発した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:37:23 GMT)
Making Embodied AI Reliable: A Community Agenda from Testing to Formal Verification [38.2] Embodied AIシステムは、ますますオープンな環境にデプロイされている。
この記事では、組み込みAIの信頼性は本質的にライフサイクル保証の問題である、と論じる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:58:40 GMT)
Inference-Time Scaling for Joint Audio-Video Generation [38.1] ジョイントオーディオビデオ生成モデルは、忠実性を改善するためにかなりのトレーニングリソースを必要とすることが多い。
推論時間スケーリングは、単一のモダリティドメインにおいて、有望なトレーニング不要の代替手段である。
共同音声・ビデオ生成のためのITSの総合的研究について紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:41:41 GMT)
Beyond Semantics: Modeling Factual and Affective Perceptual Experiences from Vision-Language Data [37.9] Pトピックモデリングに取り組む2段階アーキテクチャである**PercepT**(**Percep**tion topic**T**ransformerを紹介する。
PercepTは意味的に意味のある知覚経験を捉え、既存の方法よりもはるかに優れている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:54:59 GMT)
A Voxel-Based Quantum Computing Method (VBQC) for Solid Mechanics Problem [37.9] 本研究では、固体力学におけるハミルトニアンの量子シミュレーションのためのボクセルベースの量子計算法(VBQC)を提案する。
VBQCは、空間領域を離散化するためにボクセル格子を適用し、システムマトリックスが三角形フラクタル特性を示すことを可能にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:37:49 GMT)
FindIt: A Format-Informed Visual Detection Benchmark for Generalist Multimodal LLMs [37.6] 本稿では,ジェネラリストMLLMの迅速なローカライゼーション能力を評価するために設計された,最初の包括的なベンチマークを紹介する。
我々のベンチマークは、オブジェクト検出、参照式検出、インスタンスレベルの検出、ビデオベースの検出の4つの中核的なタスクカテゴリにまたがっている。
オープンソースとプロプライエタリなMLLMの多種多様なセットを評価し,その性能と限界を詳細に分析する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:14:46 GMT)
MedCUA-Bench: A Screenshot-Only Benchmark for Clinical Computer-Use Agents [37.6] MedCUA-Benchは,臨床用コンピュータ使用エージェントの対話型ベンチマークである。
実際の製品マニュアルとオープンソース医療システムから再構築された10の医療ドメインにわたる18の臨床シナリオをカバーする。
23エージェント中、最高のクローズドソースモデルは54.2%の精度で成功し、実際のOpenEMRでは9%以下にとどまっている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:02:35 GMT)
Text-to-Image Models Need Less from Text Encoders Than You Think [37.6] テキスト・ツー・イメージ・モデルは、個々の単語の意味や単語の順序を超えて埋め込まれたテキストに符号化されたリッチな情報を使用しないことが多いことを示す。
これは、一般的な信念とは裏腹に、テキスト・ツー・イメージのモデルは、個々の単語の意味や単語の順序を超えて埋め込まれたテキストに符号化されたリッチな情報を使わないことが多いことを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:37:57 GMT)
Parametrically induced strong coupling between a superconducting quantum circuit and a solid-state spin ensemble [37.5] 超伝導回路と固体スピン間の効率的な量子状態移動は、超伝導量子プロセッサの高コヒーレンス量子メモリを解放する。
ジョセフソン回路と希土類スピンアンサンブル間の動的に制御された強結合を示す。
我々のアーキテクチャはスピンアンサンブルの量子制御を可能にし、超伝導回路のみのコヒーレンスをはるかに超越したハイブリッドメモリの道を開く。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:54:16 GMT)
From Answers to States: Verifiable Process-Level Evaluation of Chemical Reasoning in Large Language Models [37.3] ChemCoTBench-V2は、構造化された検証可能な化学推論トレースの評価のための、ルール検証可能な診断ベンチマークである。
分子理解、分子編集、分子最適化、反応予測にまたがっており、18の報告タスクで5,620個の評価サンプルがある。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:47:19 GMT)
From Long News to Accurate Forecast: Importance-Aware Fusion and PRM-Guided Reflection for Time Series Forecasting [37.3] 本稿では,重要なニュース圧縮とプロセスレベルの検索監視を組み合わせた新しいフレームワークを開発する。
金融、エネルギー、トラフィック、およびbitcoin予測ベンチマークの実験は、我々の手法が強力なベースラインよりも予測精度を向上させることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:36:30 GMT)
Beyond the Literal: Decomposing Pragmatic Intent in Multimodal Meme Understanding [37.2] Intent Projectionは、単一のLVLMバックボーン内で2つの信号の表現、出力、目的レベルを分離するフレームワークである。
Intent Projectionは、オープンソースベースラインを一貫して上回り、プロプライエタリなモデルとのギャップを狭める。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:09:04 GMT)
Investigating Adversarial Robustness of Multi-modal Large Language Models [37.2] マルチモーダル大規模言語モデル (MLLM) は視覚言語タスクにおいて高い性能を達成する。
しかし、視覚エンコーダ(例えばCLIP)を通じて視覚入力を組み込むと、攻撃面が大幅に拡大する。
本研究はMLLMの対向的堅牢性に関する系統的研究である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:34:48 GMT)
Exploring Adversarial Robustness and Safety Alignment in Multilingual Multi-Modal Large Language Models [37.2] マルチモーダル大規模言語モデルでは、視覚認識を言語推論に統合し、敵対的攻撃を受けやすい連続的な攻撃面を導入する。
MLLMの以前の研究は、主に英語中心のタスクに焦点を合わせており、多言語的な振る舞いは未調査のままである。
本研究は,12言語にまたがる対向的ロバスト性とマルチモーダル安全性について検討し,インストラクションチューニングによる多言語能力を得るオープンソースMLLMを評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:42:10 GMT)
Beyond False Stability: High-Noise Drift Gating for Test-Time Adversarial Defenses in Vision-Language Models [37.2] CLIPのような視覚言語モデル(VLM)は、強いゼロショットの一般化を示すが、敵攻撃に対して非常に脆弱である。
最近のアプローチでは、CLIPの視覚的表現が摂動にどのように反応するかを利用する。
軽量ゲーティング信号として高雑音特徴ドリフトを用いた学習自由なプラグインドリフトゲート機構を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:49:04 GMT)
The Differentiable Auditory Loop (DAL): An ML Framework for Hyper-Personalized Hearing Aids [37.1] そこで我々は、パーソナライズされた補聴器の設計と装着のための新しいオープンソースフレームワークであるDAL(Dariable Auditory Loop)を紹介した。
DALの最初の実装は、JAXに移植したヒト人工内耳機能の微分可能なモデルであるCARFACを組み込んだものです。
正常聴力に適合するCARFACモデルの出力と、各被験者の個々の聴覚障害に適合するCARFACモデルの出力とを比較して、ネットワークを微調整する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:09:51 GMT)
Applying Deep Learning for cockpit segmentation in the context of mixed reality [36.9] 混合現実は、物理的世界からのオブジェクトをリアルタイムで表示する仮想環境を促進する。
本稿では,仮想画像と実画像の融合を容易にするために,前景画像と背景画像のセグメンテーションを行う画像処理の開発を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:43:24 GMT)
Pretraining Language Models on Historical Text [36.6] 我々は、1913年以前の英語テキストにのみ訓練された7.24B史言語モデル(LM)であるTypewriterLMを紹介した。
我々は,54Bの歴史的コーパスであるTypewriterCorpusを構築し,広範囲なデータクリーニングと漏洩対策を行った。
また,歴史的資料に直接的根拠を残さないように応答を制約するポストトレーニングフレームワークである,語彙的基盤のチューニングも導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:59:06 GMT)
Generalizing Graph Foundation Models via Hyperbolic Retrieval-Augmented Generation [36.1] グラフ基礎モデル(GFM)はグラフ表現学習において支配的なパラダイムとして登場した。
GFMの一般化能力を高めるために,HyRAG(Hyperbolic Retrieval-Augmented Generation)フレームワークを提案する。
複数のグラフベンチマークの実験では、ゼロショット設定が大幅に改善された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:21:57 GMT)
Multi-component Causal Tracing in Large Language Models [36.1] 因果トレースは、大きな言語モデルの内部表現に介入する。
本稿では,複数のコンポーネントを同時に因果的にトレースする統合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:15:35 GMT)
Skill-RM: Unifying Heterogeneous Evaluation Criteria via Agent Skill [36.0] 本稿では、再利用可能なリワード評価スキルの実行として報酬モデリングを再構築する統合フレームワークであるスキル・リワードモデル(Skill-RM)を提案する。
報酬計算を構造化されたエージェントタスクとして扱うことで、Skill-RMは異種資源をオーケストレーションするための一貫したインターフェースを提供する。
以上の結果から,Skill-RMは報酬モデリングのための統一的なソリューションを提供するだけでなく,エビデンスを戦略的かつ動的にオーケストレーションすることで,優れたパフォーマンスを実現することが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:56:57 GMT)
3D Segment Anything Model with Visual Mamba for Diagnosing Placenta Accreta Spectrum [35.9] Placenta Accreta Spectrum (PAS) は珍しいが、非常に危険な産婦人科疾患である。
従来のPAS診断は、帝王切開の歴史とMRI(Magnetic Resonance Imaging)データを分析することによって、経験豊富な医師に依存している。
我々は,粒度の細かなセグメンテーションと分類アノテーションを含む最初のMRIベースのPASデータセットを構築した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:19:50 GMT)
Geometry-Guided Modeling of Foundation Features Enables Generalizable Object Shape Deformation Learning [35.9] 対象の観測値にマッチするカテゴリレベルの形状テンプレートを明示的に変形させることで、3Dオブジェクトを再構成する一般化可能な変形学習フレームワークを提案する。
提案手法は, 形状の多様性と多様な視点の取り扱いにおいて, 最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:37:36 GMT)
Reasoning Structure of Large Language Models [35.8] 論理パズルのスケーラブルな LRM ベンチマークと,非構造化トレースをクレームと依存関係の検証可能な推論グラフに変換するパイプラインを導入する。
この理論は、トポロジーを定量的に分析できる構造化された測定可能な対象へと変換される。
オープンソース推論モデルを用いた解析により, トークン数と精度を比較検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:49:19 GMT)
Intra-Modal Neighbors Never Lie: Rectifying Inter-Modal Noisy Correspondence via Graph-Based Intra-Modal Reasoning [35.8] 大規模ウェブハーベストデータセットは、クロスモーダル検索の進展を加速させているが、必然的にノイズ対応に悩まされている。
In-modal Neighbor-aware Noise Rectification (IN2R) という新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:26:28 GMT)
A unified multi-task framework enables interpretable chest radiograph analysis [35.7] IMT-CXRは、放射線医の診断ワークフローをエミュレートするフレームワークである。
このフレームワークは医療ドメイン命令チューニングによって最適化された統一トランスフォーマーアーキテクチャを採用している。
3人の放射線学者は、AIが生成した報告の66%を、診断の明確さにおける元の臨床報告に匹敵する、または超えると評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:02:15 GMT)
Training-Free Object-Agnostic Jam Detection in Fulfillment Centers [35.2] ジャム検出アプローチは、オブジェクトを識別するためのオブジェクト検出モデルに依存し、その後、時間とともに動きを監視するアルゴリズムが続く。
このパイプラインには数千のマニュアルアノテーションが必要で、約2週間の作業が必要で、アノテーション付きオブジェクトクラスに限定されている。
本稿では,ラベル付きデータを必要としない,学習不要でオブジェクトに依存しないジャム検出手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:56:39 GMT)
A Tutorial for Characterizing Transmon Qubits [35.2] 可変トランスモン量子ビットの特性と最適化のための包括的ウォークスルーを提案する。
低温設定や配線からパラメトリック増幅器の最適操作に至るまで、完全なワークフローを簡単な方法で詳述する。
このガイドは、トランスモンベースの量子デバイスを効率的に持ち上げる実験家のためのリファレンスとして機能する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:57:47 GMT)
PHASER: Phase-Aware and Semantic Experience Replay for Vision-Language-Action Models [35.0] 本稿では,アーキテクチャに依存しない連続学習フレームワークPHASERを紹介する。
フェーズRは、すべてのサブスキルに等しいメモリサポートを保証するために、フェーズ中心のキャパシティアロケーションを使用する。
また、教師なし動作信号変化点検出とVLMに基づくセマンティック検証を組み合わせた軽量パイプラインであるAuto-PCを統合する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:04:15 GMT)
An Asymptotic Theory of Chain-of-Thought in In-Context Learning [34.7] CoT推論(Chain-of-Thought reasoning)は、大規模言語モデルにおいて多段階推論を引き出すメカニズムとして広く用いられている。
線形回帰における文脈内重み予測のための理論的に解決可能なCoTモデルについて検討する。
本研究では,推定深度,事前学習データ量,文脈長の関数として,一般化誤差の正確な式を導出する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:23:31 GMT)
"**Important** You should give me full credits!": Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems [34.7] 大規模言語モデル (LLM) は自動階調システム (AG) の研究を著しく加速している。
特に、プロンプトインジェクション(PI)攻撃は、最近LLMベースのアプリケーションにとって大きな脅威となっている。
我々は、AGシステムにおけるPI攻撃を調査し、教育シナリオにおけるそのような攻撃の有効性を体系的に調査する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:24:12 GMT)
LoopFM: Learning frOm HistOrical RePresentations of Foundation Model for Recommendation [34.6] LoopFMは、FM中間埋め込みを入力として構成することで、高帯域転送チャネルを開くフレームワークである。
産業規模のシステムでは、LoopFMはKD上の知識伝達比を約2倍にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:06:36 GMT)
Value-Aware Stochastic KV Cache Eviction for Reasoning Models [34.3] 推論モデルは思考のチェーンを拡張して精度を向上させるが、その長い出力はメモリと計算のボトルネックを生み出す。
KVキャッシュ消去法は、重要でないキーと値のペアをキャッシュから排除することで、このコストを削減するが、選択に基づくスパースアテンションの代替よりも、しばしば精度が低下する。
本稿では,大容量値状態の保護と多様な消去決定を促進するトレーニング不要なレシピであるバリューアウェアなKVキャッシュ消去(VaSE)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:16:33 GMT)
Ghost: Plausible Yet Unlearnable Trajectories via On-Manifold Substitution for Next-POI Privacy [34.1] チェックイントラジェクトリをリリースするパブリッシャは、ユーザの将来位置の強い予測器を不注意に公開する。
このリスクに対処するために、クリーンなテスト入力に対して次点次点(next-POI)の精度を低下させた被害者モデルを生成する、学習不能なトラジェクトリ、摂動シーケンスを生成する。
我々はGhostを提案する。Ghostは、摂動が人間のチェックインシーケンスのように見えるが、学習可能な信号は残っていない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:31:14 GMT)
Ask When It Pays: Cost-Aware Open-Ended Interaction for Instance Goal Navigation [33.9] インスタンスゴールナビゲーション(IGN)では、具体化されたエージェントが、不特定な自然言語記述からイントラクタ内の特定のインスタンスオブジェクトを見つける必要がある。
我々はIGNをコストに敏感な不確実性推論問題として再考する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:31:03 GMT)
Certifying coherence in quantum devices under classical control [33.7] 我々は、半定値プログラムの階層によってコヒーレンスが完全に特徴づけられることを証明した。
量子ビットの重要な特別な場合において、結合可測性の理論と概念的結びつきを利用する。
これらの手法を用いて、量子チャネルがコヒーレンスを保てるのか、それとも本質的にコヒーレンスを破っているのかを判定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:20:45 GMT)
UniCanvas: A Diffusion-base Unified Model for Text-in-Image Joint Generation [33.7] テキスト・イン・イメージ・ジェネレーションにより、拡散モデルを統一し、インターリーブされたマルチモーダルコンテンツを生成する試みを提案する。
個々のテキストトークンを生成する代わりに、モデルは言語を画像内の視覚的パターンとして表現することを学ぶ。
この設計により、画像合成中に1ピクセルのキャンバス内でテキストを自然に「描画」することができ、シームレスなマルチモーダル生成を実現することができる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:30:46 GMT)
Dynamic Objective Selection with Safeguards and LLM Oversight for Financial Decision-Making [33.6] DOSS(Dynamic Objective Selection with Safeguards)は,各時点における決定関連目的関数を直接選択する学習ベースのセレクタである。
DOSSは客観的選択を目的の分類問題として定式化し、ローリングウィンドウで逐次更新を行う。
ミスの選択とデプロイの過度な切り替えを軽減するため、DOSSはフェールセーフで信頼度を意識したゲーティングを適用し、低信頼の提案を保守的なデフォルトにオーバーライドし、スイッチング周波数に関連する明示的なコントロールを実行する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:22:07 GMT)
Tool-Aware Optimization with Entropy Guidance for Efficient Agentic Reinforcement Learning [33.6] 本稿では,ツール対応トラジェクトリフィルタとエントロピー誘導探索を併用したTAO-RLを提案する。
具体的には、TAO-RLはロールアウトトラジェクトリを2つの基準に沿ってフィルタリングする。
アルゴリズムレベルでは、ツール対応のエントロピー誘導ボーナスを導入し、ポストツールコールトークンのアドバンテージ機能を再評価し、より多様な推論経路を探索するようポリシーを奨励する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:16:12 GMT)
AirDreamer: Generalist Drone Navigation with World Models [33.1] 見えない、散らばった環境でドローンをナビゲートするには、見えないシーンレイアウトと環境構造を理解するための信頼性の高い一般化が必要である。
我々は、世界モデルに基づく環境理解の上に、強化学習に基づくポリシーでナビゲートするナビゲーションフレームワークを設計する。
シミュレーションや実際のドローンでは、複雑な、見えない環境をナビゲートし、ローカルなオプティマを逃れるための創発的な能力を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:15:13 GMT)
SocialCoach: Personalized Social Skill Learning with RL-based Agentic Tutoring and Practice [33.0] 交渉やリーダーシップといった社会的スキルは、今日の相互接続された世界での個人的および専門的な成功に不可欠である。
SocialCoachは、大規模にパーソナライズされたソーシャルスキル開発のための総合的なLLMによるエージェント・チューリングシステムである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:20:54 GMT)
Local Guidance, Global Impact: Gaussian-Reshaped Trust Region Unlocks Behavior Transitions [33.0] 本稿では,PPO (Proximal Policy Optimization) が連続的・非定常的環境において苦戦していることを示す。
本稿では,ガウスカーネルを用いて信頼領域を再設定するガウス信頼地域政策最適化(GTR)を提案する。
GTRはアーキテクチャに依存しず、ゲーム全体、シミュレーションロボット制御、オープンワールド探索、言語モデルポストトレーニングなど、強力なパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:26:26 GMT)
TreeFlash: Parallel AR-Approximation for Faster Speculative Decoding [32.8] 投機的復号化のためのワンショットブロックのドラフトは、1つのフォワードパスで完全なドラフトを生成する。
それぞれのドラフトトークンはプレフィックスコンテキストのみに条件付けされ、以前のドラフトトークンに依存しない。
この非自己回帰条件は、ドラフトの深さが大きくなるにつれて、検証者の真の自己回帰分布からドラフトの分布が分岐する。
そこで我々は,この問題に対処するために,プロダクタの隠蔽状態とそれ以前のトークンに条件付きレイヤを組み込んで,自己回帰分布を近似するTreeFlashを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:00:18 GMT)
Characterizing Detectability in 3DGS Poisoning: A Stage-wise Benchmark [32.4] Poison-3DGSは、3DGSにおける中毒検出の段階的評価のためのベンチマークである。
マルチビューイメージ、幾何学、トレーニングダイナミクス、ガウスパラメータなど、ステージ固有のアーティファクトをさまざまなシーンやアタックで公開している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:16:29 GMT)
Language Models Compare Quantities Using Number-specific and Unit-specific Heuristics [32.2] 110cmや1.2mといった測定単位の量は、数字と記号単位のスケールを組み合わせるために言語モデル(LM)を必要とする。
精度は比較境界付近で低下し、小さな値の変化で正解が決定される。
その結果、LMは、最初に両式を正確に共有スケールの表現に変換するのではなく、数字と単位よりも数字の袋を通して量を比較することが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:58:02 GMT)
Denoise First, Orthogonalize Later: Understanding Momentum in Muon via Spectral Filtering [32.2] ムオンの運動量はスペクトルフィルタとして作用することを示す。
摂動前の運動量を適用することは、この順序を逆転させるか、単に運動量を取り除くよりも、勾配の信号成分との配向を確実に強くする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:54:38 GMT)
Adaptive Causal Alignment for High-Confidence Adversarial Training [32.0] 逆対逆トレーニングは、高信頼の予測を利用して、堅牢な学習を安定させる。
セマンティック・エクイリビリウム(Semantic Equilibrium)を確立する統合フレームワークであるHICAT(High-Confidence Causally Aligned Training)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:14:54 GMT)
ChartArena: Benchmarking Chart Parsing across Languages, Scenarios, and Formats [31.6] 数値チャートと図形構造の両方にまたがる8つのチャートファミリをカバーする総合ベンチマークであるChartArenaを紹介する。
データセットは、アノテーションの信頼性を保証するために、マルチステージのヒューマン検証を備えたヒューマンエージェントアノテーションパイプラインを介して構築される。
i) Gemini 3.1 Proのようなフロンティアモデルが全体としてリードしているが、最も強力なオープンソースシステムは急速にギャップを埋めている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:49:48 GMT)
Using Reward Uncertainty to Induce Diverse Behaviour in Reinforcement Learning [31.4] 我々は、多様性は報酬の不確実性に対する合理的な応答としてより自然に理解されていると論じる。
本稿では,スカラー報酬を報酬関数上の分布に置き換えることで,RL目標の根本的な再構成を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:50:14 GMT)
PyraMathBench: Evaluating and Improving Mathematical Capability in Large Language Models [31.4] PyraMathBenchは7,404の数学語問題から32,505の質問を抽出した総合ベンチマークである。
実験の結果,LLMの性能は数値計算が不十分で,抽象的な数値問題に対する弱い処理によって著しく損なわれていることが明らかとなった。
本稿では,LLMの数値的相乗効果を高めるために,Smart Optimization & Learning-based VErsatile Module (SOLVE)とInteractive Relative Policy Optimization (IRPO)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:32:53 GMT)
SafeGene: Reusable Adapters for Transferable Safety Alignment [31.2] マルチタスク再利用のための再利用可能な安全適応モジュールであるSafeGeneを提案する。
セーフジェネレーション強化モデルでは、下流性能を維持しながら、有害応答率を低減できることが示されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:51:14 GMT)
Compress then Merge: From Multiple LoRAs into One Low-Rank Adapter [31.1] 我々は、$T$ LoRAsを1つのランクにマージする問題-$r$ LoRAについて研究する。
既存の-then-Compressパイプラインは、ランク制約を後付けとして扱う。
逆パイプラインであるCompress-then-Merge (CtM)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:42:46 GMT)
A Graph Foundation Model with Spectral Parsing and Prototype-Guided Spatial Propagation [30.9] グラフ基礎モデルは、さまざまなグラフから移行可能な知識を学習して、目に見えないグラフやタスクに一般化することを目的としている。
この課題は、特徴の相違と、より批判的には、多様なグラフ構造の両方から生じます。
既存のGFMは主に、特徴空間を統一したり、構造トークンや語彙を組み込んだりすることで転送性を向上させる。
スペクトル解析とプロトタイプ誘導空間伝搬を用いたグラフ基礎モデルであるSPGを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:27:03 GMT)
Bayesian Tensor Decomposition with Diffusion Model Prior [30.9] 本稿では,ハイブリッド・プライオリティのCP分解フレームワークであるDiffBCPを紹介する。
確率, 低ランク制約, 拡散前の結合性に拘わらず, 後部推論を抽出可能とする。
高解像度のアウト・オブ・ディストリビューション画像を含む画像の塗布とデノイングの実験は、一貫した利得を示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:13:42 GMT)
AgentCL: Toward Rigorous Evaluation of Continual Learning in Language Agents [30.8] 継続的な学習は、エージェントが一連のタスクに再利用可能な経験を蓄積し、時間とともに改善し、無関係な経験からの干渉を避けることを期待する。
ほとんどの取り組みは、長いコンテキストの会話やドキュメントに対する検索と推論に重点を置いているが、最近の長命適応ベンチマークは、しばしば単純なタスクストリームに依存している。
本稿では、制御されたタスクストリームと転送利得のメトリクスに着目した連続学習エージェントのための評価フレームワークAgentCLを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:07:54 GMT)
DLO-Lab: Benchmarking Deformable Linear Object Manipulations with Differentiable Physics [30.6] そこで本研究では,多目的DLO操作用に設計された微分可能シミュレータを提案する。
我々のシミュレーターは、拡張性、弾力性、曲げ塑性、複雑な相互作用を含む幅広い材料特性をモデル化する。
DLO操作の独特な課題を浮き彫りにする代表的なタスクのベンチマークスイートを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:49:44 GMT)
Representation Matters in Randomized Smoothing for Audio Classification [30.5] ランダム化滑らか化はガウスノイズが加わったベクトル空間におけるロバスト性を証明する。
キーワードスポッティング(キーワードスポッティング)と環境音分類(環境音分類)の2つの音響ベンチマークにおいて,波形,特徴空間,処理後の平滑化について検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:56:05 GMT)
BAHSD: Bridging the Long-tail Gap via Adaptive Distillation in Black-box Sequential Recommendation [30.0] マルチスケール整合性探索機構を用いて信号の不均一性を処理するブラックボックス適応蒸留フレームワークであるBAHSDを提案する。
BAHSDは一貫してベースラインを上回り、教師よりも最大4.98%向上し、テールユーザーでは80%以上改善されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:26:25 GMT)
Anatomy-Anchored Self-Supervision: Distilling Vision Foundation Models for Invariant Ultrasound Representation [29.6] 自己指導型事前訓練パラダイムは, 医用画像における伝達可能な表現の学習において, 優位性を高めている。
一般的な視覚領域から臨床的に有意な解剖構造へ表現学習を移行させる解剖学的アンコール超音波自己監督フレームワークANAUSを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:03:14 GMT)
X-Stream: Exploring MLLMs as Multiplexers for Multi-Stream Understanding [29.5] マルチストリームストリーミング理解に特化した最初のベンチマークであるX-Streamを紹介する。
厳格にキュレートされた4,220のQAペアを932ビデオにコンパイルし、X-Streamはマルチウィンドウ、マルチビュー、マルチデバイスシナリオで11のサブタスクを評価している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:49:53 GMT)
Text-attributed Graph Condensation via Text Selection and Attribute Matching [28.9] Text-Attributed Graph (TAG) はグラフ構造化データの重要なタイプであり、各ノードにテキスト記述がある。
トレーニング精度を維持しながらTAGを圧縮する凝縮法であるTAGSAMを提案する。
我々は,TAGSAMを6つの最先端ベースラインに対して評価し,優れた性能を示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:20:02 GMT)
I2PRef: Image-Driven Point Completion with Iterative Refinement [28.5] Image-to-Point (I2P)モジュールは、単一のRGBイメージから直接完全な点雲を再構成する。
トランスフォーマーベースのポイント・ツー・ポイント(P2P)精製モジュールは、粗いI2P出力を反復的に洗練する。
ShapeNet-ViPCの実験は、最先端の完成性能を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:11:48 GMT)
MIND: Multi-Scale Intent Diffusion for Text-Driven Physics-Based Humanoid Control [28.5] この知見に基づいて、テキスト駆動物理に基づくヒューマノイド制御のための新しいエンドツーエンド拡散フレームワークであるMINDを提案する。
MINDはマルチスケールなインテント拡散機構を導入し、全体論的インテント予測器がグローバルな振る舞いのダイナミクスをキャプチャする。
MINDはテキストコマンドからコヒーレントで、物理的に妥当で、意味的に整合したヒューマノイドの振る舞いを合成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:18:24 GMT)
DFlare: Scaling Up Draft Capacity for Block Diffusion Speculative Decoding [28.4] ブロック拡散復号法 LLM は、ブロック内の全てのトークンを同時に予測することで、推論を加速する。
モデルネームは、DFlashの狭い条件付けのボトルネックを、軽量なレイヤワイド・フュージョン機構によって引き起こします。
モデルネームはQwen3-4Bでは平均ウォールクロックの速度が5.52倍、Qwen3-8Bでは5.46倍、GPT-OSS-20Bでは3.91倍に達する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:18:31 GMT)
PixVOD: Pixel-Distributed Direct Visual Odometry and Depth Estimation [28.4] 我々は、高レベルの信号を局所的に合成し、下流の負荷を低減し、高レベルの視覚タスクに対してよりリッチな入力を提供するピクセルを想定する。
そこで本研究では,全画素にまたがるビジュアル・オドメトリーと深度推定の完全並列化方式を提案する。
提案手法は現実的なデータセットを用いて評価し,GBPに基づく画素レベルの分散計測と深度推定の実現可能性を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:22 GMT)
Video-Mirai: Autoregressive Video Diffusion Models Need Foresight [28.3] 因果ビデオジェネレータは過去から予測する必要があるが、そこからのみ学習する必要はない。
しかし、標準的な訓練は、それぞれの因果関係にのみ、現在を説明するよう要求する。
我々は、因果推論を変えることなく、このギャップを埋めるトレーニング専用手法であるVideo-Miraiを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:55:13 GMT)
UltraEP: Unleash MoE Training and Inference on Rack-Scale Nodes with Near-Optimal Load Balancing [28.3] 大規模MOEトレーニングとラックスケールノード(RSN)のプリフィルのための,最初の完全ロードリアルタイムバランサであるUltraEPを提案する。
RSNの拡張スケールアップ接続に基づいて構築されたUltraEPは、クリティカルパス上のすべてのマイクロバッチとレイヤを再バランスする。
トレーニングおよびプリフィルにおける106Bから671BパラメータのMoEモデルの平均値として、UltraEPは力バランスの理想的なスループットの94.3%を達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:07:51 GMT)
Integrating Local and Global Entropy for Uncertainty Quantification in LLMs [28.3] 隠れ状態の幾何エントロピー(グローバル不確実性)とトークンレベルのエントロピー(局所不確実性)は統計的にほぼ直交的であることを示す。
本稿では,GLU(Global-Local Uncertainty)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:57:14 GMT)
KC-3DGS: Kurtosis-Constrained Gaussian Splatting for High-Fidelity View Synthesis [28.1] 3D Gaussian Splatting(3DGS)は、シーンを差別化によって最適化された異方性ガウスのコレクションとして表現することで、リアルタイムなノベルビュー合成を可能にする。
標準画素空間損失(L1, SSIM)は、再構成エラーのみを集約し、周波数スケールでエラーを再分配する最適化を可能にする。
我々は,自然画像統計に基づくウェーブレットドメインによる3DGSトレーニングを強化するKC-3DGSを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:04:24 GMT)
Reinforcement Learning from Cross-domain Videos with Video Prediction Model [28.1] XIPERは、視覚的に異なる領域で収集されたエキスパートビデオから学ぶための報酬モデルである。
エージェントの観測結果を専門家ドメインにマッピングし、予測確率を報酬信号として使用する。
実験によると、XIPERはドメインのギャップにもかかわらず、一貫してベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:00:15 GMT)
Agentic Chain-of-Thought Steering for Efficient and Controllable LLM Reasoning [27.9] 大規模言語モデルは、拡張チェーン・オブ・ソート推論により最終回答精度を向上させる。
既存の効率的な推論手法は、トレースの短縮、早期停止、圧縮によって思考長を制御する。
本稿では,マルコフ決定過程の推論を定式化したACTS(Agenic Chain-of-Thought Steering)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:51:30 GMT)
Beyond Ideal Instruction: A Comprehensive Framework for Evaluating LLMs in Realistic Interactions [27.3] RUT-Benchは大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
我々はベンチマークを用いて、広く採用されている19のオープンソースおよびプロプライエタリなLCMについて包括的な評価を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:28:37 GMT)
Disentangling Visual and Factual Correctness in LVLMs' Visualization Literacy [27.3] LVLM(Large Vision-Language Models)は、強力な可視化解釈を示す。
それらの反応が、視覚的証拠に対する真の推論を反映しているか、訓練中に学んだ事実的先行を反映しているのかは不明である。
本稿では,視覚的正当性を事実的正当性から分離する枠組みを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:36:32 GMT)
SEA-NLI: Natural Language Inference as a Lens into Southeast Asian Cultural Understanding [27.2] 既存のNLIベンチマークは、主に西洋中心、翻訳由来、モノリンガルであり、文化的根拠に基づく推論を測定する能力を制限する。
我々は、英語と母国語で8つのSEA国をカバーする、ネイティブな文化的基盤を持つNLIベンチマークであるSEA-NLIを紹介し、母国語話者による検証を行った。
分析の結果,失敗事例はSEA適応モデルと文化意識の欠如が主な原因であり,CoTの促進は限られた利益をもたらすことがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:49:50 GMT)
Multilingual Unlearning in LLMs: Transfer, Dynamics, and Reversibility [27.1] 我々はTOFUベンチマークを5言語に拡張し,多言語アンラーニングについて検討した。
未学習の言語以外の言語で事実を“忘れる”能力である未学習のトランスファーが、非常に可変であることに気付きました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:55:52 GMT)
Efficient Transformer-Based Localized Patch Sampling for Choroid Plexus Segmentation in Multiple Sclerosis [26.8] 両側心室脈絡膜叢 (LVCP) は, 身体障害と神経炎症に関連する多発性硬化症 (MS) の指標として認識されている。
本研究の目的は,スタンドアロンおよびマルチモーダルMRI入力からMS内のLVCPを自動的に分割するSwinUNETR駆動パイプラインを開発することである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:32:43 GMT)
KletterMix: Climbing Toward High-Quality German Pretraining Data [26.7] KletterMixは、自然言語処理とモデリングコミュニティのための再利用可能なデータセットアーティファクトである。
最先端の英語事前学習コーパスをドイツ語に翻訳し、文書境界、メタデータ、ソース構造、トピックの多様性を保存して構築されている。
このデータセットは、翻訳品質、文書長分布、トピックカバレッジ、ソース合成、メタデータなど、幅広いコーパスレベルの分析によって文書化されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:28:15 GMT)
Building Reliable Long-Form Generation via Hallucination Rejection Sampling [26.7] 大規模言語モデル(LLM)は、オープンエンドテキスト生成において顕著な進歩を遂げてきたが、誤ったあるいはサポートされていないコンテンツを幻覚させる傾向にある。
我々は、Segment-wise HAllucination Rejection Smpling (SHARS) という、新しい推論時幻覚緩和フレームワークを提案する。
SHARSは任意の幻覚検出器を使用して、生成中の幻覚セグメントを識別および拒絶し、忠実な内容が生成されるまで再サンプリングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:26:17 GMT)
AI Agents Enable Adaptive Computer Worms [26.6] コンピュータワーム(英: computer worm)は、あるマシンから別のマシンに複製することでネットワーク上に拡散するマルウェアである。
ここでは、人工知能(AI)エージェントが、遭遇するターゲットごとに適切な攻撃戦略を生成するワームを可能にすることを示す。
このワームは、一般的な実世界の企業ネットワークの脆弱性を利用して伝播する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:54:39 GMT)
Recovering Diversity Without Losing Alignment: A DPO Recipe for Post-Trained LLMs [26.5] 我々は、異なる有効な回答モードを復元するためのオフラインDPOデータ構築パイプラインであるREDIPOを紹介した。
各プロンプトに対して、REDIPOは、ベースモデルとインストラクションモデルの両方からのレスポンスをサンプリングし、インストラクションモデルでベースモデルレスポンスを書き直し、安全性とインストラクションフォロー品質の候補をフィルタリングする。
Qwen3-4B、OLMo-3-7B、LLaMA-3.1-8Bの他、REDIPOはノベルティベンチのディファレンシャル_kを134%、33%、44%改善し、DivPOは多様性を0%、-6%、-4%改善した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:07:48 GMT)
Dive into the Scene: Breaking the Perceptual Bottleneck in Vision-Language Decision Making via Focus Plan Generation [26.4] Vision-LanguageとVision-Language-Action Models (VLMs & VLAs)は、異なる利点を持つ強力なツールである。
VLMは長期計画において優れているが、VLAはリアクティブ制御において優れている。
視覚幻覚は、モデルがタスク関連オブジェクトとイントラクタを区別できないために生じる。
原則として、無関係なオブジェクトをフィルタリングしながら、重要なオブジェクトを正確に識別し、焦点を合わせることが、この制限を破る鍵となる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:50:56 GMT)
Learning When Not to Act: Mitigating Tool Abuse in Agentic Reinforcement Learning [26.3] エージェント強化学習は、内部推論によって解決可能なクエリであっても、モデルが外部ツールを過剰に使用するツールの乱用を引き起こす可能性がある。
本稿では,効率的なエージェントポリシー最適化フレームワークEAPOを提案する。
GRPOと比較して、EAPOは平均パフォーマンスを10.45%、7.27%、9.69%改善し、平均ツールコールを18.33%、18.33%、および24.59%削減した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:53:40 GMT)
Optimal Transport Flow Matching by Design [26.3] フローマッチングモデルは、単純な事前分布から複雑なデータ分布へサンプルを輸送することを学ぶ。
我々は、事前を固定入力ではなく設計選択として扱うことで問題を再構築する。
本手法は,既存の流れマッチング法と比較して,軌道曲率を2倍以上削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:00:05 GMT)
\textsc{CR-Seg}: Attention-Guided and CoT-Enhanced Coarse-to-Refined Reasoning Segmentation [26.2] Reasoning segmentation は、複雑な言語で記述されたターゲットオブジェクトを視覚的・テキスト的推論によって分割することを目的としている。
既存の手法では、学習したセマンティックトークンを使ってMLLM(Multimodal Large Language Models)とセグメンテーションモデルをブリッジする。
本稿では,空間分割のための2段階フレームワークCR-Segを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:30:04 GMT)
GPU-Parallel Multi-Task Reinforcement Learning with Demonstration Guided Policy Optimization [26.2] 本稿では,構造化操作タスクファミリーをGPU並列マルチタスクRLベンチマークに変換する手法を提案する。
その結果得られたベンチマークは、異種タスクスイート上での同時強化学習をサポートする。
また,重み付きPPOと一致した実演行動における適応的行動クローニングを組み合わせた実演指導手法であるDGPOを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:43:42 GMT)
Taiji: Pareto Optimal Policy Optimization with Semantics-IDs Trade-off for Industrial LLM-Enhanced Recommendation [26.1] 大規模言語モデル(LLM)によるレコメンダシステムのスケーリングは、業界で顕著なトレンドとなっている。
本稿では,産業レコメンデーションシステム用に設計された新しいLLM-as-EnhancerフレームワークであるTaijiを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:39:06 GMT)
InfoMem: Training Long-Context Memory Agents with Answer-Conditioned Information Gain [26.1] 長いコンテキストタスクは、大きなコンテキストから回答関連情報を識別し保存するためにLLMを必要とする。
既存のRLベースのチャンクワイドエージェントは、スパースファイナルアンサー報酬に依存するか、メモリと検索アクションの語彙中間報酬を使用する。
本稿では,問合せ情報を用いた最終記憶ユーティリティの評価を行う,チャンクワイドメモリエージェントの学習のための報奨機構であるInfoMemを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:39:03 GMT)
NewtPhys: Do Foundation Models Understand Newtonian Physics? [25.9] これまでの研究は、合成シーンや半合成シーンを用いて基礎モデルの物理推論を評価してきた。
NewtPhysは物理地上シミュレーションによる現実世界のシーンのマルチビュー画像から構築された4Dの物理的アノテートデータセットである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:12 GMT)
SAMatcher: Co-Visibility Modeling with Segment Anything for Robust Feature Matching [25.8] 共可視性モデリングによる対応推定を定式化する特徴マッチングフレームワークであるSAMatcherを提案する。
双方向の特徴交換とクロスビューセマンティックアライメントを可能にする対称なクロスビューインタラクション機構を導入している。
本結果より, 単分子分割のための基礎モデルを多視点対応推論に効果的に拡張できることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:47:59 GMT)
A Matter of TASTE: Improving Coverage and Difficulty of Agent Benchmarks [25.7] ツール・シークエンス・エボリューションによるタスク・シンセサイザー(TASTE: Task Synthesis from Tool Sequence Evolution)を提案する。
TASTEはクラスタリングを通じてプールから代表シーケンスを選択し、それらを完全なベンチマークタスクにインスタンス化し、難易度進化を通じてそれらを洗練する。
以上の結果から,既存のベンチマークにおける高いスコアは,頑健なタスク解決能力よりも飽和度を反映していることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:20:59 GMT)
DiffUNet^2: Bidirectional Prediction, Probabilistic Generation and Collaborative Visual Discovery for Scientific Data [25.7] 時相進化は科学現象の分析と推論に重要である。
ほとんどの機械学習手法は、複数の妥当な結果を見渡す決定論的前方予測を提供する。
本稿では,拡散に基づく生成モデルとインタラクティブな視覚分析を統合し,科学的探索を行うフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:15:01 GMT)
Benchmarking LLM-as-a-Judge for Long-Form Output Evaluation [25.7] 大規模言語モデル(LLM)は、長文生成にますます使われている。
LLMs-as-a-judgeは、人間の評価に代わるスケーラブルな代替手段を提供する。
既存のメタ評価ベンチマークは、主にショートフォーム出力に焦点を当てている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:49:40 GMT)
Cesarean Scar Defect Segmentation in Transvaginal Ultrasound Images: a Dataset and Benchmark [25.6] CSD(Cesarean Scar Defect)は、帝王切開後の合併症の1つである。
経バジナル超音波CSDセグメンテーションのためのパブリックデータセットは存在しない。
この研究は、医用画像分割アルゴリズムの進歩と臨床革新を促進するための高品質なベンチマークリソースを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:06:25 GMT)
RMPrior: Bridging Propagation Priors and Diffusion Refinement for Efficient Radio Map Construction [25.4] 本論文は,中間段階のサンプリング戦略を通じて,伝播先行と拡散改善を橋渡しする。
IRT4HighResの実験は、$P_textstart=0.5$で、提案手法が2.01times$のスピードアップを達成することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:05:18 GMT)
TASE: Truncation-Aware Semantic Embeddings for 3D Scene Understanding and Editing [25.3] 高忠実なセマンティックな3Dシーン表現は、ロボット工学、自律運転、シミュレーションを含む多くのアプリケーションに不可欠である。
現在のアプローチでは、コントロール可能な編集を限定的にサポートしている。
本稿では,事前学習した2Dセマンティックな特徴をトランケーション対応の埋め込み空間に投影する手法であるTASEを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:25:53 GMT)
BRIDGE: Biological Evidence Refinement and Heterogeneous Dynamic Gating for Gene Regulatory Networks [25.3] 遺伝子制御ネットワーク(BRIDGE)のためのバイオエビデンス・リファインメントと異種動的ゲーティングという革新的なフレームワークを提案する。
BRIDGEは、発現マトリックスとそのマトリックス双対から遺伝子および細胞表現を抽出し、自己と隣人の間の遺伝子空間と細胞空間においてコントラスト学習を行う。
その後、遺伝子と細胞間の情報伝達を適応的に制御するために異種ゲートエンコーディングを適用し、堅牢な転写因子からターゲットへの遺伝子予測を可能にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:54:36 GMT)
PRISM: Synergizing Vision Foundation Models via Self-organized Expert Specialization [25.2] モジュールの特殊化によるVFMの相乗化を実現する,新しい双方向Mixture-of-Experts (MoE) フレームワークである textbfPRISM を紹介する。
PASCAL-ContextとNYUD-v2の実験は、textbfPRISMが芸術の新たな状態を確立し、スパースで創発的な特殊化は多様な視覚知識を統合するためのスケーラブルなアプローチであることを証明している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:28:32 GMT)
BotDirector: Robot Storytelling Across the Symmetrical Reality with Multi-modal Interactions [25.2] 本研究では,ロボットによる対話型ストーリーテリングを支援する対話型システムを提案する。
子供たちは自分の物で遊び場を配置し、LLMエージェントで物語を作ります。
作成した物語は、地図とキャラクタに基づいて動きシーケンスに変換され、動きは自走する群れロボットによって実行される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:33:35 GMT)
EvoBrain: Continual Learning of EEG Foundation Models Across Heterogeneous BCI Tasks [24.8] EvoBrainは、統合されたEEGデコーディングのためのタスク対応連続学習フレームワークである。
これは2つの相補的なコンポーネントによる可塑性-安定性のトレードオフに対処する。
様々な基礎のバックボーンにまたがる最先端の手法を一貫して超越している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:16:16 GMT)
NBQ: Next-Best-Question for Dynamic Profiling [24.8] NBQは,様々な質問のプールをシードし,コンパクトで継続的に更新されたユーザ状態を維持できるプラグイン・アンド・プレイ・フレームワークである。
相互に互換性を持たなければならず、それぞれが自己記述と相互参照の両方の表現でモデル化されるような、相互マッチングのためのNBQをインスタンス化する。
実験の結果、NBQはAC@TとAR@Tで最大13.6%、AR@Tで14.0%、QuickMatchは最大22.9倍、リコールは最大0.989であることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:30:41 GMT)
Hint-Guided Diversified Policy Optimization for LLM Reasoning [24.7] Reinforcement Learning with Verifiable Rewards (RLVR)は、大規模言語モデルのための有望な強化戦略である。
本稿では,Hint-Guided Diversified Policy Optimization (HDPO)を提案する。
実験の結果,HDPOはLLM推論を効果的に促進し,候補解の多様性を高めることが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:55:54 GMT)
Revisiting Embodied Chain-of-Thought for Generalizable Robot Manipulation [24.5] CoT(Embodied chain-of- Thought)は、言語推論とロボット制御を橋渡しすることを目的としている。
現在までに最大規模のCoTコーパスを構築しており,978,743軌道,226.3Mサンプル,2592.5時間ロボットデータで構成されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:37:59 GMT)
TurtleAI: Benchmarking Multimodal Models for Visual Programming in Turtle Graphics [24.3] 視覚言語モデル(VLM)は視覚プログラミングのために研究され、視覚的タスクを解決するためのコードを生成する。
本稿では、Turtle Graphicsドメインの現実的なビジュアルプログラミングタスクに基づいて823のタスクをキュレートしたベンチマークであるTurtleAIを紹介する。
我々は, GPT-5, GPT-4o, Qwen2-VL-72Bを含む20以上のVLMを評価し, 成功率を30%以下に抑えるのに苦慮した。
得られた合成データに対する微細チューニングQwen2-VL-72Bにより, 改良が期待できるデータ生成手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:25:05 GMT)
FFR: Forward-Forward Learning for Regression [24.1] 我々はFFR(Forward-Forward for Regression)を提案し、FFを現実世界のレグレッションに拡張する最初のフレームワークである。
FFRは,(1)距離認識下での分割されたニューロン群間の競合学習と対照的なペアを置き換え,(2)浅い層が粗い順序の識別を学習し,より深い層が微細な回帰に洗練される階層化はしごアーキテクチャ,という3つの重要なイノベーションを導入している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:15:59 GMT)
DetectZoo: A Unified Toolkit for AI-Generated Content Detection Across Text, Audio, and Image Modalities [24.1] 生成モデルは、人間と機械生成物の区別を侵食した。
ほとんどの検出器は商用ソフトウェアか、オープンソースであれば、互換性のない事前処理、評価プロトコル、評価メトリクスが付属する。
我々は、AI生成コンテンツ検出のための統一インターフェースを提供するために設計された、第一級ツールキットであるDetectZooを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:49:20 GMT)
Beyond "To whom it may concern": Tailoring Machine Translation to Audience and Intent [24.0] 目的駆動型MTを50言語、5モデルサイズ、8テキストドメインで体系的に評価する。
明示的な指示は翻訳適応性を著しく改善し、非公式なドメイン(会話、ソーシャルメディア)に大きな利益をもたらすことがわかった。
目的適応型MTはLLMの実用的で測定可能な能力であり,目的対応のメトリクスの必要性を強調した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:23:01 GMT)
SAGE: A Quantitative Evaluation of Socialized Evolution in Agent Ecosystems [23.8] SAGE(Social Agent Group Evolution)は,2つの計算条件を比較した評価フレームワークである。
群の歴史は普遍的な増幅器ではなく、最強のエージェントは自己進化の天井を超えない。
競合する環境では、カウンターファクトコントロールは、エージェントが相手固有の戦略を開発するよりも一般的に改善することを明らかにする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:08:38 GMT)
When Does Latent Reasoning Help? MeRa: Metric-Space Bias for Spatial Prediction [23.6] 潜在推論は、修正されていないベースラインの下の空間予測を劣化させる。
MeRa(Metric-space Reasoning)は軽量なバックボーン非依存モジュールである。
距離空間制約推論が一意の固定点に収束し、N-ステップ推論が(N-1)-ステップ推論よりも厳密に表現可能であることを証明する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:47:30 GMT)
MARS: Multi-rate Aggregation of Recency Signals for Sequential Recommendation across Sparse and Dense Regimes [23.6] 我々は,実時間スタンプを消費し,K要約を生成するエンコーダに依存しないアグリゲーション演算子MARSを提案する。
火星は、スパースデータのMARS-T(Transformer)と密度データのMARS-M(Mamba)の2つのエンコーダインスタンスを自動的に選択することで、データ密度に適応する。
統一されたRecBoleプロトコルの下で10のTransformerとMambaベースのベースラインに対する5つの公開ベンチマークで、MARSはすべてのベンチマークで最高のHR@10を達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:39:19 GMT)
Message Tuning Outshines Graph Prompt Tuning: A Prismatic Space Perspective [23.4] Graph Foundation Models (GFMs) はグラフ学習のホットスポットとして登場した。
最近の手法では、グラフプロンプトチューニングがなぜ機能するのかが説明されているが、その適応能力を厳密に測定する方法は未解決の問題である。
GNNバックボーンの各レイヤに,学習可能なメッセージプロトタイプを少量注入する,ライトウェイトなアプローチであるMessage Tuning for GFM(MTG)を導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:52:54 GMT)
Fast Organic Crystal Structure Prediction with Unit Cell Flow Matching [23.4] 有機結晶構造予測(CSP)は、有機固体の計算モデリングの要件である。
OXtalのような生成モデルは、安定な有機結晶構造を直接サンプリングすることで、このコストを劇的に削減する。
しかしながら、OXtalは、高価な三角形の層を持つバルク材料の大作物をモデル化することを好んで、明示的な格子パラメトリゼーションを行う。
冗長性のない単位セルを生成する大規模フローマッチングモデルであるClariを用いて,これを数秒に短縮する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:58:40 GMT)
Don't Forget Your Embeddings: Robust Knowledge Erasure via Precise Editing of Embeddings [23.3] EMBedding ERasure (EMBER) は,Sparse Matrix Factorization を利用してトークン埋め込みから概念関連機能を正確に消去するプラグイン-n-play消去モジュールである。
EMBERによる既存手法の拡張により,タスクフォーマット間の消去効率と特異性が向上し,コヒーレンス損失が最小となることがわかった。
我々の研究は、ロバストな概念消去には正確な埋め込みレベルの介入が必要であることを証明し、既存の方法がそのような拡張の恩恵を受けることを実証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:15:25 GMT)
Attend to Anything: Foundation Model for Unified Human Attention Modeling [23.2] 我々は、様々な画像、ビデオ、音声・視覚的タスク、シーン間で注目モデリングを統合するマルチモーダル基盤モデルであるAttend to Anything Model (AAM)を提示する。
AAMは、ハイパボリック空間に階層的な埋め込みを持つ言語プロンプトを通じて実装された、一般から特定の階層で組織された認知的包含関係として、注意を再構築する。
16のベンチマークの実験では、AAMは様々なシナリオで平均6%の最先端メソッドを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:00:21 GMT)
POLARIS: Guiding Small Models to Write Long Stories [23.1] 小さなオープンウェイトモデルは、長文のクリエイティブな執筆に苦労します。
本稿では,2つの重要な成分を持つ低コンプットGRPO法であるPOLARISについて述べる。
盲目の人間による評価では、POLARIS-9BがQwen3.5-9Bのベースより好まれ、Qwen3.5-27Bと同等であることが確認されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:00:07 GMT)
ASymPO: Asymmetric-Scale Policy Optimization for Asynchronous LLM Post-Training Without Behavior Information [23.1] 非同期強化学習は、ポリシー最適化から応答生成を分離することで、言語モデル後学習のスループットを向上させることができる。
標準的な行動補正法は、行動政治の確率、重要度、またはクリップによってこのドリフトを制御する。
本稿では,各応答のトークン損失を,現在の平均トークン負の対数確率で正規化する非対称スケールポリシー最適化(ASymPO)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:00:34 GMT)
SaliMory: Orchestrating Cognitive Memory for Conversational Agents [22.8] SALIMORYは、認知的に構造化されたメモリスパンニングされたユーザファクト、好み、ワーキングメモリを管理するために単一の言語モデルをトレーニングするフレームワークである。
メモリ分散障害を3分の1削減し、エンドツーエンドの精度で最先端を10%以上上回り、良質なパーソナライゼーション率を2倍以上に向上させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:31:50 GMT)
LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection [22.6] 連続的なビット幅制御のための新しいフレームワークLiftQuantを紹介する。
中心となる革新は、低次元の重みベクトルを近似する「リフト・then-project」機構である。
LiftQuantの復号経路は、線形変換と1ビットの一様量子化器にのみ依存する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:52:04 GMT)
CP-Agent: Context-Aware Multimodal Reasoning for Cellular Morphological Profiling under Chemical Perturbations [22.4] セルペイントは、多重蛍光染色、高濃度イメージング、定量的解析を組み合わせて、高次元の表現型読み出しを生成する。
CP-Agentは、薬物摂動下での細胞形態変化に対して、機構関連で人間解釈可能な有理性を生成する。
CP-CLIP出力をエージェントツールの使用と推論と統合することにより、CP-Agentは論理を構造化されたレポートにコンパイルし、実験的な設計と仮説の洗練を導く。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:20:00 GMT)
Generative AI-Enabled Refund Fraud in Chinese E-Commerce: Investigation on Merchants and Platform Workers [22.3] 電子商取引紛争解決は典型的には、デジタル証拠が物理的現実を真に反映しているという仮定に依存している。
生成AI(GenAI)はこの脅威モデルを無効化し、攻撃者は無視可能なコストで製品欠陥の超現実的な証拠を作成できる。
我々は、取引・紛争・物流・通信の4つのGenAI対応脅威ベクトルの分類を概説する。
われわれはこれらの防衛策の採用を妨げるいくつかの課題を見出した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:20:25 GMT)
A Cookbook of 3D Vision: Data, Learning Paradigms, and Application [22.1] 3Dビジョンは、ますます多様なデータ表現、学習パラダイム、モデリング戦略によって、急速に進化してきた。
この研究は、幾何学的表現、データセット、学習フレームワーク、アプリケーションを単一の概念マップ内に接続する3Dビジョンのデータ中心の分類を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:41:52 GMT)
GroupToM-Bench: Benchmarking Group Theory of Mind and Nonlinear Social Emergence in MLLMs [22.0] 我々は、グループレベルの心の理論(ToM)推論のための最初のマルチモーダルベンチマークであるGroupToM-Benchを紹介する。
マイクロレベルのBDI状態(理解、欲求、意図)、メソレベルのグループ張力と構造的制約、マクロレベルの結果予測と帰属にまたがる因果連鎖を中心に構築する。
実験は、現在のモデルと人間のベースラインのギャップを明らかにし、社会構造と非線形集団力学を処理できないことを明らかにする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:06:32 GMT)
Sparse Mixture-of-Experts Reward Models Learn Interpretable and Specialized Experts for Personalized Preference Modeling [21.9] 本稿では、スパースルーティングとエキスパートの多様性を促進するため、スパース・ミックス・オブ・エクササイズ(MoE)報酬モデルを提案する。
MoEは、制御された実世界の実験を通して、解釈可能なルーティングパターンと専門の専門家を学ぶ。
また、テストタイムのパーソナライズも改善され、専門家の体重に対する後適応シフトは、モデルがパーソナライズされた好みにどのように適応するかを分析するための質的なレンズを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:19:12 GMT)
When Seeing Is Not Believing -- A Benchmark for Search-Grounded Video Misinformation Detection [21.9] EVID-Benchは、ビデオ誤情報検出のためのベンチマークである。
AI生成、シングルソース編集、マルチソース編集の3つのカテゴリにまたがる9つの操作タイプにまたがる222のビデオで構成されている。
最良のシステムは61.43%のポイントレベルの精度と43.24%のビデオレベルの精度しか達成していないが、AI生成による操作は特に困難である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:03:35 GMT)
SketchSong: Hierarchical Song Generation with Sketch Planning and Fine-Grained Multi-Track Modeling [21.9] SketchSongは階層的な曲生成フレームワークで、曲レベルのスケッチ計画ときめ細かいマルチトラックモデリングを通じて問題に対処する。
トラックディメンションに沿って、SketchSongはボーカル、ベース、ドラム、その他の楽器の4つのトラックを明示的にモデル化している。
楽曲生成ベンチマークの実験では、SketchSongは客観的な測定値と人間の聴取テストの両方でベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:27:56 GMT)
On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters [21.8] 強共有基盤モデル上で, 学習可能な小型アダプタを永続的局所状態として研究する。
スケールアップ(Scale Up)、スケールダウン(Scale Down)、スケールアウト(Scale Out)という3つのスケーリング軸に関する問題を整理します。
その結果,PEFTは永続的個人モデルのためのコンパクトな基板であることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:03:24 GMT)
Partially Observable Adversarial Patch Attacks on Vision-Language-Action Models in Robotics [21.8] ヴィジュアル・ランゲージ・アクション(VLA)モデルはロボット工学において注目を集めているが、敵の攻撃に対するロバスト性はほとんど解明されていない。
部分的に観測可能な脅威モデルを定式化し、敵は軌跡の短いプレフィックスのみを利用でき、その後の全てのフレームに適用する固定パッチを生成する。
まず、モデルの注意マップを用いてパッチをローカライズし、フルインストラクションに対応する視覚的に重要な領域を特定する。
次に,対象対象物のセマンティックグラウンドを乱すパッチを最適化し,動作軌跡の曲率を増加させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:19:28 GMT)
Long-Term and Short-Term Transistor Aging in Deep Neural Networks: Impact and Mitigation [21.8] ディープニューラルネットワーク(DNN)は、画像分類や音声認識など、さまざまな現実世界のアプリケーションで使用されている。
本章では,DNN推定精度に及ぼす長期および短期トランジスタ時効の影響について詳細に考察する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:33:07 GMT)
Semantic Constraint Synthesis for Adaptive Trajectory Optimization via Large Language Models [21.3] 軌道最適化は、宇宙探査において安全かつ信頼性の高い自律的な操作を可能にする重要な要素である。
本稿では,大規模言語モデル(LLM)を利用して,ミッション要求の自然言語記述を翻訳するフレームワークを提案する。
宇宙船ランデブーのシナリオにおける実験は、セマンティックミッションの要求から凸軌道最適化問題をリコンディションする上で高い成功率を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:33:38 GMT)
Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking [21.3] 我々は,GPT方式のトランスフォーマーであるHumanoid-GPTを紹介した。
Humanoid-GPTは、2Bフレームの再ターゲットコーパスで事前トレーニングされている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:05 GMT)
PhotoCraft: Agentic Reasoning with Hierarchical Self-Evolving Memory for Deep Image Search [21.3] PhotoCraftは、フォト検索エージェントのためのトレーニング不要で階層的なメモリシステムである。
人間の認知にインスパイアされたPhotoCraftは、MLLMに作業、エピソード、セマンティックメモリを装備する。
DISBenchの実験では、PhotoCraftはさまざまなMLLMバックボーン間のコンテキスト認識検索を一貫して改善している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:38:44 GMT)
Uncertainty-Aware Clarification in LLM Agents with Information Gain [21.1] LLM(Large Language Model)エージェントは、しばしば不特定ユーザ命令を操作する。
本稿では,あいまいさの解消と明確化行動の整合性を考慮した目標指向の明確化フレームワークを提案する。
我々は、この報酬を使って、高い情報ゲインを最適化するためにクラリファイア(LLM)を訓練する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:23:59 GMT)
HARVE: Hacking-Aware Reward-Head Vector Editing for Robust Reward Models [21.1] リワードモデルは、大きな言語モデル(LLM)アライメントの中心であるが、ハックに対する報酬には弱いままである。
HarVEはスカラー報酬モデルのためのトレーニング不要報酬ヘッド編集手法である。
実験により、モデルはハッキングの堅牢性を改善し、微調整ベースラインを上回り、報酬モデルの汎用能力を保っていることが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:18:08 GMT)
Bregman meets Lévy: Stochastic mirror descent with heavy-tailed noise in continuous and discrete time [20.9] 重み付き雑音下でのミラー降下(SMD)のロバスト性について検討した。
Lévy mirror flow (LMF) は $mathcalO(-p/(p-1))$ time 内で$$optimality を達成することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:23:04 GMT)
DeskCraft: Benchmarking Desktop Agents on Professional Workflows and Human-in-the-Loop Collaboration [20.9] DeskCraftはGUIベンチマークで、長い水平方向の創造性とエンジニアリングと積極的な人間とエージェントのコラボレーションをターゲットにしている。
タスクを多段階の難易度分類に編成し、長い水平方向タスクは50以上の実行ステップを必要とする。
それは、人間とエージェントのコラボレーションを、ミッドターンとポストターンの交換をカバーするインタラクションプロトコルにフォーマル化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:42:34 GMT)
FGRPO: Federated GRPO with Adaptive Aggregation on Non-IID Data [20.6] グループ相対ポリシー最適化(GRPO)は、批判ネットワークを排除し、優れたスケーラビリティを提供する。
我々は、不均一なデータ所有者間での推論モデルの微調整を分散化するためのフレームワークである、フェデレートされたGRPOを紹介した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:32:32 GMT)
EntSQL: A Benchmark for Grounding Text-to-SQL in Long-Context Enterprise Knowledge [20.6] Spider、BIRD、Spider2.0といった既存のベンチマークでは、スキーマの一般化、大規模データベース、現実性を評価している。
エンタープライズ指向のテキスト・ツー・プライベート・ベンチマークであるEntを紹介した。
英語の入力では、最も優れた評価システムは、長文の文書が提供されるときの15.9%にしか達しない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:12:57 GMT)
GridVQA-X: A Framework for Evaluating Multimodal Explainability Methods [20.6] クロスモーダルな説明可能性を評価するために設計された最初の診断フレームワークであるGridVQA-Xを紹介する。
自然なデータセットとは異なり、GridVQA-Xはクローズドワールド合成ロジックを利用して、ユニークな数学的に保証された説明を生成する。
提案手法は, 実空間関係推論に基づくモデルと, クロスモーダルショートカットを利用したモデルとを区別できないことがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:18:24 GMT)
The Geometry of LLM-as-Judge: Why Inter-LLM Consensus Is Not Human Alignment [20.4] LMs-as-judgesは現在標準となっているが、審査員は互いに強く同意する一方で、人間にしか同意しない。
標準LLM-as-judgeスタック上の4つの幾何量を測定することで、共有信号や共有バイアスを反映するかどうかを検証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:26:18 GMT)
When Graph Tokens Sink: A Mechanistic Analysis of Graph Language Models [20.4] 我々は,Large Language Models (LLMs) がグラフ処理の振る舞いを通じてグラフ情報をどのように処理するかを分析する。
GLMにおけるグラフトークン内部の正当性は,グラフ情報の利用と等価ではない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:34:01 GMT)
DECA: Decentralizing Block-Wise Adam for Efficient LLM Full-Parameter Fine-Tuning on Non-IID Data [20.2] 大規模言語モデルの分散微調整は、プライバシに敏感な環境では難しい。
非IIDデータに基づくLLMのための資源効率の高い分散FPFTフレームワークであるDECAを提案する。
我々は,DECAが高速収束,ダウンストリーム性能,資源効率の大幅な向上を実現していることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:08:31 GMT)
When Autoregressive Consistency Hurts Safety Alignment [20.1] 自動回帰一貫性は、初期トークンのアライメント更新に集中できることを示す。
同じメカニズムは、大規模言語モデルに対するより広範な攻撃のクラスを予測する。
最悪の有害な継続状態に基づく初期枠組みである敵の安全アライメントを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:32:23 GMT)
AUDITFLOW: Executable Symbolic Environments for Structured Financial Reporting Verification [19.9] AuditFlowは、アダプティブ検索と検証を分離するグラフグラウンドのマルチエージェントフレームワークである。
2人の若手監査官が各事件を規制及び明確な見解から検査し、上級監査官が意見の相違を解消し、さらなる調査を要求することができる。
最終報告は、明らかな集計を通じて融合され、監査の評決、期待値、エビデンス・トレイル、スコアを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:14:42 GMT)
FCUS-rPPG: A Fast-Converging Unsupervised Framework for Remote Photoplethysmography via Gradient Oscillation Suppression [19.9] Photoplethysmography (rmography) は、一般向けカメラを用いた非接触血液量パルス(BVP)信号の抽出を可能にする。
FCUS-r は強力な一般化能力を持つ高速収束型教師なし r フレームワークである。
FCUS-rは、クロスデータセット性能の最先端評価を一貫して達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:33:27 GMT)
Inverting the Generation Process of Denoising Diffusion Implicit Models: Empirical Evaluation and a Novel Method [19.7] 本稿では,DDIM画像生成過程を逆転して潜伏変数を復元する問題について検討する。
既存の手法は、このタスクでしばしば正確さに苦しむ。
そこで本研究では,第1段階の勾配勾配降下による直接反転と,第2段階の固定点法を併用した新しいハイブリッド手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:56:16 GMT)
Calibration Data Trade-offs Across Capability Dimensions: Why Multi-Source Mixing Matters for High-Sparsity LLM Pruning [19.7] 訓練後のプルーニングは、小さな未ラベルキャリブレーションセットを使用して、大きな言語モデルを高い疎度に圧縮する。
本稿では,情報誘導型自己校正プロトコルIGSPを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:38:14 GMT)
20 Second Parity Lifetime in an InAs--Pb Tetron Device [19.7] トポロジカル量子コンピューティングにおける中心的な約束は、励起ギャップの増加がデバイスの性能を大幅に向上させることである。
ここでは,InAs-Pbテトロンデバイスにおいて,この原理を干渉式単発パリティ測定により実験的に検証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:50:09 GMT)
Memory Retrieval for Changing Preferences [19.5] 本稿では、メモリアクセスと選択のための統一的なフレームワークを提案する。
ベイズ係数を用いて各メモリターンの有効性を定量化する。
提案手法は,長いコンテキスト,嗜好集約的なタスクにおいて,既存の埋め込みベースの検索よりも優れる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:29:12 GMT)
Proof-Refactor: Refactoring Generated Formal Proofs into Modular Artifacts [19.5] このギャップは,ほとんどのエビデンス生成パイプラインにおいて,コンパイル優先の目的が暗黙的であることに起因している,と我々は主張する。
本稿では,人間の証明リファクタリングに触発されたプロセス誘導アプローチを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:56:10 GMT)
KODA: Contrastive Representation Comparison and Alignment for Vision-Language Foundation Models [19.0] コントラスト表現比較とアライメントのためのカーネルベースのフレームワーク。
ランダムプロジェクションを用いた関節核のランダム化低次元近似を開発した。
経験的に、KODAは視覚言語表現間の一貫性と解釈可能な相違構造を識別する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:47:41 GMT)
RL Excursions during Pre-Training: Re-examining Policy Optimization for LLM training [18.9] RLは非常に早期に有効であることが分かっており、SFT$to$RLパイプラインと早期にマッチすることが多い。
ベースチェックポイントに直接RLを適用すると、モデルの分布が拡大する。
モデル全体の能力は基本的にRLによって変わらず、SFTの後に劣化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:55:18 GMT)
SimuScene: Simulation-Ready Compositional 3D Scene Reconstruction from a Single Image [18.9] 物理を形状とレイアウト推定のループに配置する構成的3次元再構成パイプラインであるSimuSceneを紹介する。
重力下で再構成された物体を診断的にシミュレートすることにより、浸透と故障を定量的な補正信号に変換する。
この物理インフォームドフィードバックループは、蓄積した再構成誤差を軽減し、安定したシミュレーション可能なシーンを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:59 GMT)
Equivariant Latent Alignment via Flow Matching under Group Symmetries [18.7] 同変表現学習は、解析的に知られた群変換が直接作用する潜在空間を構築するための強力なフレームワークとして登場した。
既存のアプローチは、意図された群アクションと実際に必要となるラテント空間の変換との相違である潜在的不整合にしばしば悩まされる。
フローベースのフレームワークであるResidual Latent Flowを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:56:56 GMT)
Safety Measurements for Fine-tuned LLMs Should be Grounded in Capability [18.6] モデル行動に及ぼす微調整の影響の多次元的評価を行う。
その結果,(1) 微調整モデルでは, 安全性向上に反応して不整合世代を生成可能であること,(2) 自動的安全判断は不整合出力には信頼できないこと,(3) 微調整の効果に関する結論は, 安全性評価と安全基準の選択によって変化しうる,という重要な課題が浮き彫りとなった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:39:17 GMT)
Denoising Tells When to Replan: Denoising-Variance Adaptive Chunking for Flow-Based Robot Policies [18.5] アクションチャンキングはフローベースのロボットポリシーの一般的な推論戦略となっている。
本研究では,予測チャンクから実行すべきアクション数を適応的に決定するテストタイム手法であるDVACを提案する。
LIBERO、RoboTwin、CALVIN、および実世界の操作実験により、DVACはスケジュール変更頻度を減らしながらタスク成功を改善することが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:26:32 GMT)
A Geometric View of Counterfactual Behavior: Interaction of Boundary Proximity and Local Support [18.4] 対実的な説明は、モデルの予測を変える入力に意味論的に意味のある小さな変化を求める。
同様の予測性能を持つモデルは、そのような変化が達成可能かどうかで大きく異なる可能性がある。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:55:29 GMT)
Lean4Agent: Formal Modeling and Verification for Agent Workflow and Trajectory [18.0] 信頼性の高いマルチステップを実行するためのLLM(Large Language Models)の取得は、人工知能における中心的な課題となっている。
この課題は、自然言語の曖昧さ(NL)が形式言語(FL)の発展を動機付けている数学における長年の問題を反映している。
エージェントの振る舞いをモデル化し検証するための依存型FLであるLean4を使用した最初のフレームワークである**Lean4Agent*を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:46:50 GMT)
Resource-Constrained Adaptive Inference for Sequential Pricing [17.8] リソース制約のある価格制御器は固定価格推論を不可能にすることができる。
実現可能なターゲットバンドを認証し、連続的な局所密度を記録できるターゲット認識型価格制御器を開発した。
結果として生じた後悔と情報の説明は、パイロットのリゾルディングエラーに繋がる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:52:46 GMT)
The Impact of Configuring Agentic AI Coding Tools on Build-vs-Buy Decisions: A Study Protocol [17.7] エージェントAIコーディングツールは、自律性を高めてコードを書き、ライブラリのインポート時期と機能をスクラッチから実装するタイミングを決定する。
エージェントAIコーディングツールにおけるビルド逆購入決定の制御について、制御された実験的研究は行われていない。
我々は、Claude CodeとOpenAI Codexという2つの一般的なエージェントAIコーディングツールにおいて、構成機構がビルド対購入動作をどのように変化させるかを研究するための事前登録されたプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:01:28 GMT)
Perceive Before Reasoning: A Pre-Reasoning Perception Framework for Efficient and Reliable Proactive Mobile Agents [17.7] 推論の前に知覚に基づく2段階のフレームワークであるtextbf Pre-Reasoning Perception Framework (PRPF) を提案する。
PRPFは、介入ゲーティングとコンテキスト圧縮のための軽量なMultimodal Proactive Perceptor (MPP)を導入し、介入が保証された場合にのみProactive Agent Reasoner (PAR)を起動する。
ProactiveMobileベンチマークの実験では、PRPFは成功率(SR)とProactiveMobileベースラインでの推論効率を改善しつつ、偽トリガレート(FTR)を大幅に低減することが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:54:02 GMT)
Multi-Modal Graph Neural Network with Transformer-Guided Adaptive Diffusion for Preclinical Alzheimer Classification [17.7] 下流変換器を用いて各ノードにおける拡散過程を導出する統合フレームワークを提案する。
本モデルはアルツハイマー病の前臨床段階と密接に関連している主要なROIを十分に同定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:32:29 GMT)
Follow-Your-Preference++: Rethinking Preference Alignment for Image Inpainting [17.6] 我々は、広く使われている直接選好最適化フレームワークを採用し、一般公開された報奨モデルを用いた選好学習データを構築した。
報酬モデルの単純なアンサンブルはそのようなバイアスを緩和し、堅牢で一般化可能な性能をもたらす。
我々のモデルは、標準メトリクス、大規模視覚言語モデル評価、人的評価において、最先端のモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:22:07 GMT)
Large Language Models Are Overconfident in Their Own Responses [17.6] 学習後アルゴリズムとチャットフォーマットの効果を分離することにより,この誤判定を誘発するメカニズムについて検討する。
指導指導が校正を根本的に損なう一方で、チャットテンプレートは「オーナーシップバイアス」によって問題を悪化させることがわかった。
本稿では,信頼度誘導時のユーザ入力としてモデルの解答をフレーミングする,シンプルな推論時戦略を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:20:56 GMT)
DDOR: Delta Debugging for Explainable Overrefusal Testing and Repair [17.6] DDOR(Delta for OverRefusal)は、オーバーリフレッシュテストと修復のための、完全に自動化され、説明可能なフレームワークである。
デルタデバッグを適用して最小限の拒絶トリガーフラグメント(mRTF)をローカライズする。
スケーラブルでモデル固有のオーバーリフレクションテストスイート(モデル毎に約1Kケース)を生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:07:12 GMT)
AnyAudio-Judge: A Dynamic Rubric-Based Benchmark and Evaluator for Audio Instruction Following [17.5] 本稿では,複雑な音声キャプションを可変個の独立した検証可能なバイナリルーブリックアイテムに適応的に分解する動的ルーブリック評価パラダイムを提案する。
我々はこの能力をAnyAudio-Judge Benchでベンチマークする。
実験により、AnyAudio-Judgeは、最先端のベースラインに比べて、ゼロショットアライメントの検出を著しく向上する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:00:32 GMT)
ContinuousBench: Can Differentially Private Synthetic Text Improve Capabilities? [17.4] ContinuousBenchは、差分プライベート(DP)テキスト合成から得られる能力を測定する。
Geminonは、架空の生物に関する手続き的に生成されたデータセットで、Newsは、新しくクロールされたニュース記事のストリームだ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:54:59 GMT)
EaDex: A Cross-Embodiment Dexterous Manipulation Framework from Low-Cost Demonstrations [17.3] 本稿では,低コストな実演環境下でのマルチエンボディメント・デクスタラスな操作学習フレームワークであるEaDexを提案する。
データレベルでは、EaDexは1台のRGB-Dカメラだけで人間の手の動きをキャプチャする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:35:18 GMT)
EvoDS: Self-Evolving Autonomous Data Science Agent with Skill Learning and Context Management [17.0] EvoDSは自己進化型の自律データサイエンスエージェントで、そのスキルを拡張し、長期的なコンテキストを適応的に管理することを学ぶ。
EvoDSは4つの異なるベンチマークで、最先端のオープンソースデータサイエンスエージェントを平均28.9%上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:20:58 GMT)
NVIDIA Isaac Sim: Enabling Scalable, GPU-Accelerated Simulation for Robotics [17.0] この調査はNVIDIA Isaac Simをシステムとアプリケーションの観点からレビューし、アーキテクチャの概要と広く使われているシミュレータと比較する。
我々は5つの主要領域にわたる研究を分析し、特にデータ生成と高忠実度シミュレーションにおける一般的な利用パターンを要約する。
また、物理のオープンワールド学習、シミュレーション中心のトレーニング、実用的なユーザビリティ制約など、今後の重要な方向性と課題についても概説する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:12:27 GMT)
SLU-2K: A Question-Based Benchmark for Semantic Evaluation of Sign Language Translation [16.8] 我々は手話翻訳(SLT)から手話理解(SLU)へ焦点を移す
入力ビデオから元の文のキーセマンティックな側面を正確に復元する能力に基づいてシステムを評価する。
MLLM(Multimodal Large Language Models)と2つの最先端システムであるMMSTLとSpaMoを評価し,SLU-2Kの可能性を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:39:33 GMT)
Hallucination Detection-Guided Preference Optimization for Clinical Summarization [16.8] 幻覚は、専門の医療応用における信頼性を制限する、サポートされていない、または誤った声明である。
本稿では,幻覚検出装置を利用した実写修正に向けての要約リビジョンを導出する推測時間手法であるHDSRを紹介する。
そこで我々は,HDSR for Preference Learning (HDSR-PL)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:32:14 GMT)
Extending AI for Research to the Humanities: A Multi-Agent Framework for Evidence-Grounded Scholarship [16.7] SPIRE(Scholarly-Primitives-Inspired Research Engine)は、エビデンスに基づく人文科学研究のためのマルチエージェントフレームワークである。
複数スケールのクローズドリーダー基板上での協調エージェントの役割として、人文操作を繰り返す。
答えの正確性、深さ、カバレッジ、証拠の質について、より高いブラインド・ジャッジスコアが与えられる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:42:24 GMT)
Small RL Controller, Large Language Model: RL-Guided Adaptive Sampling for Test-Time Scaling [16.7] 適応サンプリングをマルコフ決定過程(MDP)として定式化する。
我々は、回答の正しさ、レイテンシ、コストを両立させるために、強化学習(RL)を備えた軽量サンプリングコントローラを訓練する。
提案手法は,最終回答の統計にのみ依存する軽量で,CPU上でのトレーニングやデプロイが可能である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:42:04 GMT)
Learning to Solve, Forgetting to Retain: Correct-Set Turnover in RLVR [16.7] 検証可能な報酬(RLVR)による強化学習は、大きな言語モデルの能力を向上させるが、見出し精度の向上は隠れたコストを隠蔽することが多い。
我々は、マスタされたプロンプトを追跡し、それを定期的に再導入して、過去のソリューションのモデルをtextbfremindに再導入するリテンション対応レビューメカニズムであるtextbfmethodを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:17:34 GMT)
Variance Reduction for Heavy-Tailed Monetization Metrics in Ranking Experiments via Post-Stratification [16.6] 本稿では,CUPEDとポストストラテフィケーションを組み合わせたオンライン実験における分散低減のための実践的枠組みを提案する。
ランキング駆動の収益化実験にまたがってShareChatにデプロイされたこの手法は、分散を著しく低減し、意思決定の安定性を向上させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:14:14 GMT)
RogueMerge: Robust and Unified Attacks against LLM Model Merging [16.4] RogueMergeは、モデルマージ攻撃のための原則化された統一されたフレームワークである。
4つの脅威にまたがって、既存の攻撃を継続的に上回ります。
様々な統合設定で安定し、標準的な防御に抵抗する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:54:37 GMT)
AmbientEye: A Dataset for Pupil Segmentation under Natural Ambient Infrared Illumination [16.4] AmbientEyeは、19カ国の35人の参加者から収集された2,606,225個の目画像の大規模なデータセットである。
自然の日光の下で屋外に撮影され、2つのオフ軸カメラ構成と2つの日向条件で撮影される。
我々は、我々のデータセット上で最先端の瞳孔分割アルゴリズムをベンチマークし、その性能を制御された赤外線照明下で既存のデータセットと比較する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:28:21 GMT)
ST-ColoNet: Spatio-Temporal Colon Segment Recognition via Hybrid Attention and Edge-Guided Feature Learning [16.3] 既存の自動認識手法は、時間的情報を完全に活用することなく、大腸内視鏡画像のみを使用するため、性能は低下した。
時空間ネットワーク(ST-ColoNet)を用いた2段階の深層学習フレームワークColo-Segment Recognitionを提案する。
我々は,コロセグメンテーション認識のタスクにおいて最先端の性能を達成でき,精度が81.0%,F1スコアが70.7%であることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:54:12 GMT)
Evaluating LLMs' Effectiveness on Real-World Consumer Device Repair Questions [16.2] 我々は、Redditから電話の修理、コンピュータの修理、データの回復にまたがる現実世界の991の修復質問のベンチマークを紹介した。
本研究は,英語とバングラ語における6つの最先端のLLMを,修理の正確性,完全性,実用性,安全性の4つの基準を用いて評価した。
以上の結果から,LLMは有用な補修支援を行うことができるが,高リスクな実世界の補修作業には信頼性が低いことが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:40:47 GMT)
On the Generalization Gap in Self-Evolving Language Model Reasoning [16.2] 統合オフライン自己進化フレームワークにおける4つの代表的な戦略を解析する。
自己進化はベースモデルよりも一貫して改善されるが、過剰なトレーニング計算の後に高原が投資される。
Gemma 12Bはオラクルの教師付きトレーニングにほぼ一致するので,大規模モデルによるマルチターン批評家のリビジョンは,強力な自己進化性能に達することが判明した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:50:15 GMT)
Experience-Driven Dynamic Exits for LLMs with Reinforcement Learning [16.2] LEDEは、ローカルコンテキストに基づいて最適な出口層と投機長を動的に選択するポリシーを学ぶ。
Llama-2 と Llama-3 の総合評価では、LEDE は自己回帰復号よりも$2.0times$$$$$2.7times$スピードアップを達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:59:14 GMT)
Knowledge Editing in Masked Diffusion Language Models [16.1] 広く使われているアプローチである where-then-edit は、2つのステップでこれを行う。
これまで、このような手法は自己回帰モデル(ARM)にのみ適用されてきた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:14:37 GMT)
RobotValues: Evaluating Household Robots When Human Values Conflict [15.9] 我々は,家庭用ロボットプランナを価値相反シナリオで評価するためのベンチマークであるRobotValuesを紹介した。
モデルには、プライバシ優先のアクションを減らしながら、安全や宿泊などのデフォルト値の好みが示されることが分かりました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:25:01 GMT)
Rethinking the Idiomaticity Decomposability Hypothesis: Evidence from Distributional Learning [15.7] 本研究では,事前学習中の学習の追跡中に,人間の評価,統語的柔軟性,予測可能性との関連性を示すモデル内部尺度を提案する。
モデルにおける表現の安定化は、周波数だけでは説明できないことを示す。代わりに、素因分解可能性と周波数はすべて、最強の訓練依存効果を示す分解性に寄与する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:59:22 GMT)
Probe Before You Edit: Probing-Guided Molecular Optimization for LLM Agents in Structure-Based Drug Design [15.7] 2つの診断基準は、単一の編集が両方の目的をいかに改善するかを測定する。
これらのメトリクスを現在のLLMエージェントパイプラインに適用すると、一貫した障害モードが公開される。
編集応答型探索をベースとした最適化フレームワークである textbfPROBE を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:09:41 GMT)
Community-Aware Assessment of Social Textual Engagement and Resonance: A Human-Centric Perspective on User-Generated Content Evaluation [15.6] 本稿では,信号中心の指標から人間中心の共鳴評価へのパラダイムシフトを提案する。
本稿では,新しいソーシャル・チェーン・オブ・トラヒック(Social-CoT)機構を導入するMEDEAについて紹介する。
CASTER-Benchは、さまざまなカテゴリをカバーする包括的な人間アノテーション付きベンチマークである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:38:55 GMT)
HiSE: A Lightweight Hierarchical Semantic Explainer for Heterogeneous Graph Neural Networks [15.5] 不均一グラフニューラルネットワーク(HGNN)は複雑なデータのモデリングにおいて顕著な性能を示した。
既存の説明法には2つの大きな制限がある。
我々はHGNNのための軽量な特徴指向解釈モデルであるHiSEを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:12:01 GMT)
Inducing Reasoning Primitives from Agent Traces [15.5] Reasoning Primitive Injectionは、成功したReActトレース、クラスタの繰り返し推論をマイニングし、最も頻繁な動きを型付き擬似ツールのコンパクトライブラリに変換する。
単一の固定構成は、すべてのサブタスクでゼロショットのチェイン・オブ・ランゲージを改善し、専門家が認可した分解と一致または超過し、平均推論コストでAWMを上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:11:15 GMT)
SC-TauPath: A Structural Connectivity Attribution Framework for Mapping Tau Propagation Pathways in Alzheimer's Disease [15.5] In vivo の神経画像データからtau の伝播経路をマッピングする SC-TauPath 構造接続(SC)アトリビューションフレームワークを提案する。
SC-TauPathは、ネットワーク拡散モデル(NDM)で拡張された多層パーセプトロンと勾配$times$入力属性を組み合わせて、各SCエッジのタウ予測への寄与を評価する。
234人のADNI参加者に適用すると、SC-TauPathは強いクロスバリデーションタウ予測を達成し、Braakステージング解剖と整合した帰属経路マップを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:57:13 GMT)
Parameter-Free and Group Conditional Online Conformal Prediction [15.4] 不確かさの定量化は、現実のシナリオにおける機械学習予測器の展開に不可欠である。
オンライン共形予測(OCP)手法は、(i)グループワイドエラー制御または(ii)学習速度独立実装を犠牲にしてこの問題に対処する。
我々は,グループ条件付きOCPのためのパラメータフリーアルゴリズムを提案し,グループ条件付き適用保証が最適であることを実証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:50:21 GMT)
TiWeaver: Unified Temporal Dynamics Modeling via Contextual Patching [15.3] TiWeaverは、時間的ダイナミクスと細粒度チャネル間の依存関係を適応的に扱うように設計された統合フレームワークである。
12のリアルタイム時系列データセット上でTiWeaverを評価し、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:06:12 GMT)
TPA-AD: A Two-Stage Pseudo Anomaly-Guided Method for Bearing Time-Series Anomaly Detection [15.3] 2段階の擬似異常誘導型異常検出法を提案する。
通常の境界付近で擬似非正則ウィンドウを生成する。
ノーマルウィンドウと擬似アノマラスウィンドウの対比学習を通じて、異常に敏感な表現を学習する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:39:10 GMT)
PaddleOCR-VL-1.6: Expanding the Frontier of Document Parsing with Under-Optimized Region Refinement and Progressive Post-Training [15.2] PaddleOCR-VL-1.6はPaddleOCR-VL-1.5上に構築された文書解析モデルである。
PaddleOCR-VL-1.6は、従来のモデルから弱い領域を識別し、これらの領域にターゲット拡張を適用し、監視信号の信頼性を向上させる、地域対応データ最適化フレームワークを導入している。
OmniDocBench v1.6で96.33%という新しい最先端のスコアを獲得し、上位層のVLMに対して強い競争力を示し、PaddleOCR-VLシリーズの実践的なポストトレーニングレシピを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:27:03 GMT)
Knowledge-Preserved Model Tuning in Null-Space for Robust Spatio-Temporal Video Grounding [15.2] 劣化した入力に対応するためにNull-Space Tuningを提案する。
このフレームワークは、層入力に凍結重みのヌル空間内にベクトルを追加することは出力に影響しないという幾何学的性質を利用する。
学習可能な残基を入力特徴に注入し、事前訓練されたバックボーンに選択的に見えないようにする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:59:27 GMT)
CLAW: Learning Continuous Latent Action World Models via Adversarial Latent Regularization [15.2] CLAWは、アクションフリーのビデオから直接、連続的な潜在アクション表現と協調して世界モデルを学ぶためのフレームワークである。
得られた潜在行動世界モデルが,観察から得られた模倣学習と目標指向計画の両方をサポートすることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:40:24 GMT)
Instant-Fold: In-Context Imitation Learning for Deformable Object Manipulation [15.2] Instant-Foldは、DOMのためのコンテキスト内模倣学習フレームワークである。
一人の人間がデモを行うと、このポリシーはデモから直接様々な操作モードを推測し実行します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:46:20 GMT)
DELTAMEM: Incremental Experience Memory for LLM Agents via Residual Trees [15.0] 既存の知識の漸進的な変化として,新たに獲得した経験がしばしばあると仮定して,残余体験を導入する。
経験記憶を2つの独立した残留木に整理するフレームワークであるDeltaMemを提案する。
多様なインタラクティブ環境における実験は、DeltaMemが既存のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:13:50 GMT)
Channel Chart Location Privacy Based on Geo-Indistinguishability [15.0] チャネルチャートは、チャネルチャートからの擬似位置を利用して、明示的な位置情報を必要とすることなく、ロケーションベースのサービス(LBS)を可能にする。
この性質は固有のプライバシー上の優位性を示しているが、正式なプライバシー保証を提供していない。
チャネルチャート化では,地理識別可能性(GI)をチャネルチャート化表現に拡張したCLI(Chart location indistinguishability)と呼ばれる位置情報のプライバシに対処する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:39:43 GMT)
Reflection Separation from a Single Image via Joint Latent Diffusion [15.0] 単一像の反射分離は、フレアや弱い反射のような極端な条件下では非常に困難である。
本稿では, この課題に対して明確に微調整された拡散モデルを提案する。
本手法では, 透過層と反射層を統一拡散モデルにより同時に生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:11:20 GMT)
Structured Prompt Optimization Meets Reinforcement Learning for Global and Local Interpretability over Complex Text [15.0] LLMには高度なテキスト分類があるが、既存のパラダイムはトレードオフに直面している。
我々は,eXTCを3段階に分けて導入し,SOPを学習し,LLMから小型LMへの蒸留を推理し,初期のSOPを超えて推論能力を拡張した。
この設計は、(i)コンパクトなLMによる高速な推論を可能にし、(ii)推論時局所的推論トレースと、(ii)学習されたドメインルールのグローバルなモジュラーな説明と、(iii)分類性能と説明品質の両方において、既存のパラダイムを著しく上回り、ステージバイステージゲインを実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:33:43 GMT)
SkillGuard: A Permission Framework for Agent Skills [14.8] 我々はスキル中心のパーミッションフレームワークであるSkillGuardを紹介した。
SkillGuardを実世界の315のスキルとSkillInjectで評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:01:53 GMT)
GFFMERGE: Efficient Merging of Graph Neural Force Fields and Beyond [14.7] グラフニューラルネットワーク(GNN)は原子論シミュレーションのためのニューラルフォース場に革命をもたらし、低コストでほぼ量子精度を達成した。
視覚と言語処理のモデルマージにインスパイアされたGFFMERGEは,GNNにおけるクローズドフォームモデルマージのための最初の原則的フレームワークである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:48:34 GMT)
Learning Multi-Scale Hypergraph for High-Order Brain Connectivity Analysis [14.5] 適応型マルチスケールハイパーエッジ学習フレームワーク MuHL を導入し,階層型ノード機能を構築し,高次対話を動的に学習する。
複数の脳ネットワークベンチマークの実験により、MuHLはさまざまな段階にわたる疾患分類性能を一貫して改善することが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:24:17 GMT)
When Attention Collapses: Stage-Aware Visual Token Pruning from Structure to Semantics [14.5] 本稿では,新しい2段階の視覚トークン解析フレームワークであるStructure-to-Semantics(STS)を紹介する。
第1段階では、空間的および構造的多様性を最大化するために、反発に基づくサンプリング機構を採用している。
第2段階は命令対応のクロスアテンションを利用して、プロンプト非関連トークンを正確にフィルタリングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:36:24 GMT)
SEA-Embedding: Open and Reproducible Text Embeddings for Southeast Asia [14.5] このSEA-Embedding(SEA-Embedding)は、公開データのみに基づいて訓練された東南アジアの言語のための、完全にオープンで再現可能なテキスト埋め込みパイプラインである。
SEA-EmbeddingはSEA-BEDの最先端の成果を達成しつつ、その領域に対する堅牢なテキスト埋め込みの体系的かつ再現可能な分析を可能にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:05:14 GMT)
VAMPS: Visual-Assisted Mathematical Problem Solving Benchmark [14.5] VAMPSはグラフ支援数学のベンチマークである。
モデルが有用なグラフを構築し、その結果の視覚化でその答えを土台にできるかどうかをテストする。
全体として、さまざまなモデルの集合において、直接解析的解決は驚くほどツール対応の視覚的解決よりも優れていることが分かりました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:45:21 GMT)
Regularized Offline Policy Optimization with Posterior Hybrid Bayesian Belief [14.4] 本稿では,力学モデルのサブセット上での凸結合として期待を再構成するポストリアハイブリッドベイズ的信念を提案する。
コンバージェンスまで単調改善のための計量に依存しない保証を提供する反復正規化政策最適化アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:18:05 GMT)
CoPark: Learning Reactive Parking via Self-Play [14.4] CoParkは、残余の政治アーキテクチャ上に構築されたマルチエージェントのセルフプレイRLアプローチである。
我々は,Dragon Lake Parking(DLP)とDeep Open 3D(DSC3D)にまたがる新しいリアクティブパーキングベンチマークで,6つの駐車場でポリシーをトレーニングし,ゼロショットを評価する。
CoParkは70~85%の成功を達成し、衝突速度はわずか3~6%で、古典的、模倣学習、大規模RLベースラインを大きく上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:16:05 GMT)
Prospective Dynamic 3D MRI Reconstruction via Latent-Space Motion Tracking from Single Measurement [14.3] 静止空間における運動追跡機能を備えた動的3次元MRI再構成フレームワークを提案する。
我々の中心となる考え方は、効率よく一般化可能な運動場の潜在多様体をオフラインで学ぶことである。
XCATデジタルファントムと社内の腹部MRIデータセットの両方の実験は、PDMRが高忠実で時間的に一貫した再構成を実現することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:54:33 GMT)
Will Accurate Fields Mislead Photonic Design? FromGlobal Accuracy to Port Readout [14.1] MMIスプリッタとスプリッタでは、累積モード干渉と出力ウィンドウ凝集により、ポート電力、分割、位相、結合が決定される。
本研究では,局所境界構造を取り巻く潜在状態を整理しながら,全フィールド予測インタフェースを維持する伝搬整合型ニューラル演算子PaNOを提案する。
PaNO-R2は最高のcMAE、伝搬異常、出力エラー、ポートパワーエラーを達成し、NeurOLightのポートパワーと出力エラーを72.7%、72.5%削減した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:23:20 GMT)
IdEst: Assessing Self-Supervised Learning Representations via Intrinsic Dimension [14.0] 自己教師付き学習(SSL)は、ラベルのないデータから意味のある表現を学ぶための強力なパラダイムとして登場した。
最小スパンニングツリー次元推定器を用いてSSL表現のIDを推定する手法であるIdEstを提案する。
本研究は、SSL表現の評価のための原理的幾何プロキシとして固有の次元性を強調し、標準教師付き探索プロトコルを補完するものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:47:17 GMT)
Where Do We (Not) Need Temporal Context in Low-Resource Video Task Adaptation? [13.9] ビデオ理解のためのモデル適応戦略を体系的に研究する。
我々は、外見に焦点をあて、動きに焦点をあて、空間的に密接な設定を行う方法を評価する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:19:58 GMT)
Let the Dynamics Flow: Stable Flow Matching Dynamical Systems [13.8] 本稿では,高キャパシティ生成モデルと形式的リアプノフ安定性保証のギャップを埋める新しいフレームワークである安定流整合力学系(SFMDS)を紹介する。
SFMDSはフローマッチングによって動的システムをパラメータ化し、同時にモデルを安定解の族に制約する。
ベンチマークデータセット、シミュレーション、ヒューマノイドロボットの実験により、SFMDSは低次元および高次元の状態空間において安定でスケーラブルでマルチモーダルな力学系を学習することが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:17:26 GMT)
Regret Pre-training: Bridging Prior and Posterior Views for Enhanced Knowledge Grounding [13.6] 因果言語モデルは、事前コンテキストのみを使用してシーケンス確率を分解し、トレーニング中に将来の情報が明らかにされない。
本稿では,Learning Using Privileged Information (LUPI)パラダイムに基づく自己教師型フレームワークであるRegret Pre-trainingを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:11:39 GMT)
RSC: Decentralized Rigid Formation Flocking for Large-Scale Swarms via Hybrid Predictive Control and Online Reconfiguration [13.5] 分散化された剛体形成の群れは、移動中に所定の幾何学的構成を維持するために自律的なエージェント群を必要とする。
既存の分散制御手法は、散在環境において厳密なエージェント間距離制約を維持するのに苦労する。
本稿では,大規模な剛性形成フロッキングのための分散制御フレームワークであるRigid Swarm Control (RSC)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:54:30 GMT)
Drag-induced skin effect in a Bose-Fermi mixture [13.5] 非エルミート皮膚効果(英: non-Hermitian skin effect, NHSE)は、非エルミート物理学において最も顕著な現象の1つである。
強いボース-フェルミ相互作用により、フェルミオンは相関した境界状態を通じて境界蓄積を継承できることを示す。
Floquet-engineered asymmetric tunneling を用いた超低温ボース-フェルミ混合系における実現可能な実現法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:44:15 GMT)
Formalizing the Binding Problem [13.3] ビジョントランスフォーマー(ViT)は、どのパッチが一緒にあるかを知っている。
現在のディープラーニングモデルがバインディング情報を示すことを学ぶかどうかは不明だ。
ここでは,結合問題を情報理論のアプローチで定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:56:24 GMT)
Unified Video-Action Joint Denoising for Dexterous Action and Data Generation [13.2] 我々は,デクスタラスハンドのための統合ビデオアクション認知モデルであるDonkを提案する。
Donkは、アクションポリシーとして、将来のビデオと双方向のMANO軌道をサンプリングする。
画像条件がなければ、同じDenoisingアーキテクチャは、テキスト条件のディストリビューションからビデオアクションのロールアウトをサンプリングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:39:23 GMT)
Bionic Human-Motion Style Transfer for Physically Executable Whole-Body Control of Humanoid Robots [13.2] 本稿では,ヒューマノイドロボットにおける模範駆動型スタイル転送のための世代間制御フレームワークを提案する。
物理を意識した潜伏拡散モデルが, スタイル, 内容, 軌道条件を融合するために開発された。
プレビューベースの全体追跡ポリシは、クラスタ・アンド・ディスティル戦略でトレーニングされる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:59:01 GMT)
Physics-Guided Policy Optimization with Self-Distillation [13.2] 自己蒸留政策最適化(SDPO)はLLMポストトレーニングの一般的なパラダイムとなっている。
本稿では,情報変調ステップサイズ乗算器であるPGPOを提案する。
この変調は、バニラSGDのオーダー-1弱近似保証を保ち、反復毎に無視できないオーバーヘッドを生じさせることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:20:39 GMT)
Learn When and Where to Connect: Adaptive Virtual Nodes for Dynamic Message Passing on Graphs [13.2] 仮想ノード(VN)は、効果的なメッセージパッシングを容易にするために、しばしばメッセージパッシングニューラルネットワーク(MPNN)で使用される。
我々は,ノードとVN間の非制約接続を可能にする,エンドツーエンドの差別化可能なMPNNフレームワークMAVNを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:57:13 GMT)
GeoSem-WAM: Geometry- and Semantic-Aware World Action Models [13.2] 本稿では,幾何学的・意味的監督を通じて潜在表現を強化する構造化世界モデリングフレームワークを提案する。
提案手法は,テスト時の映像生成や自動ロールアウトを回避し,効率的な推論を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:48:02 GMT)
SAHG: Sector-Anisotropic Hyperbolic Graph Model for Social Bot Detection [13.2] LLMを駆使したソーシャルボットは、流動的で人間らしいテキストを生成することができ、コンテンツに基づく検出のみの差別的優位性を減らすことができる。
既存のグラフ検出器は、そのような証拠を利用する際に2つの課題に直面している。
本稿では, 方向依存曲率場を$(u)$で学習し, 構造方向の幾何分解能を適応させるSAHGを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:16:46 GMT)
MM-BizRAG: Rethinking Multimodal Retrieval-Augmented Generation for General Purpose Enterprise Q&A [13.0] MM-BizRAGは文書構造認識スプリットを介して文書構造を積極的に抽出し、表現する。
MM-BizRAGは、最先端のビジョン中心のベースラインを最大32%上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:31:47 GMT)
Structure-Guided Mixed Masked Pretraining and Spatial Continuity Regularization for Printed Circuit Board Defect Detection [13.0] プリント基板(PCB)欠陥検出は自動光学検査(AOI)の不可欠な部分である
本稿では,構造誘導型複合マスクプレトレーニングと空間連続性正規化を組み合わせた2相PCB欠陥検出フレームワークを提案する。
DsPCBSD+データセットの実験により、提案手法は85.5% mAP0.5と52.3% mAP0.5:0.95を達成し、いくつかの強力なベースライン検出器を上回る結果を得た。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:26:07 GMT)
Rethinking the Role of Positional Encoding: Sliding-Window Transformers without PE Remain Turing Complete [13.0] 位置符号化(PE)は、整列処理に必要な変換器として広く見なされている。
この直観は、任意の普遍性を実現することができることを証明するために位置情報に依存する全ての先行結果の根底にある。
我々は、この信念を、有限なスライディングコンテキストウインドウを通して生成が進行する、長期的推論に最も関係のある体制に再考する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:44:54 GMT)
The Shadow Price of Reasoning: Economic Perspective on Optimal Budget Allocation for LLMs [12.9] 推論時間のスケーリングは、大規模言語モデルのパフォーマンスを向上させる重要な方法として現れています。
本研究では,経済原理に支配されるグローバル制約付き最適化問題として,推論予算配分を定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:26:55 GMT)
MAdam: Metric-Aware Multi-Objective Adam [12.8] 解答者の意図とカップリングの実行との間には,2つの系統的なギャップが存在する。
textbfMAdam(Metric-Aware Multi-Objective Adam)は,解決器と変更の双方を残したドロップインラッパーである。
マダムはすべての解決者家族に対してアダムよりも一貫して改善する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:00:15 GMT)
Contrastive Neural Algorithmic Reasoning for Graph Coloring [12.6] 我々は約$k$-coloringについて研究し、そこではモノクロエッジの数を最小限に抑えながら、最大$k$カラーの使用を目標としている。
この問題はグラフ理論の中心であり、スケジューリングや資源割り当てといった分野で応用されている。
我々は,同色ノードの埋め込みが整合する移動可能な色調構造を学習するコントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:14:28 GMT)
Synthesize and Reward -- Reinforcement Learning for Multi-Step Tool Use in Live Environments [12.6] 本稿では,3つのコントリビューションを持つPROVE(Programmatic Rewards On Verified Environments)を提案する。
20のステートフルMPPサーバからなるライブラリは343のツールを公開し、ライブ実行RLトレーニングを可能にする。
このフレームワークは、これらのサーバに対して検証されたマルチターンツールコールトラジェクトリを生成する。
BFCLのMulti-Turn、tau2-bench、T-Evalでは、PROVEは最大+10.2、+6.8、+6.5ポイントの改善をもたらす。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:52:31 GMT)
Grasp-Then-Plan with Failure Attribution: A Closed Two-Stage Framework for Precise and Generalizable Robotic Manipulation [12.6] ロボット操作において、握りと運動計画の密結合は、しばしば真の失敗の原因を曖昧にする。
本稿では,GTP-FAを提案する。GTP-FAはタスク指向の2段階のグリップ計画フレームワークで,グリップ候補を生成し,選択したグリップに条件付き下流動作計画を実行する。
GTP-FAは、RL、IL、拡散政治、VLAベースの設定にまたがって、対応するベースラーナーを改善し、全体的なタスク成功率を大幅に向上させることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:29:03 GMT)
Fine-Tuning and Serving Gemma 4 31B on Google Cloud TPU: A Technical Comparison with GPU Baselines [12.4] 本稿では,Google の Gemma 4 31B モデルを TPU ハードウェア上で実現した,ファインチューニングの最初のエンドツーエンドデモを紹介する。
Google TPU v5p-8のトレーニングにLoRAを使用し、推論にTPU v6e-8(Trillium)を使用すると、GPUネイティブなトレーニングレシピの移植に必要なコードレベルの適応の完全なセットを文書化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:32:07 GMT)
Rethinking Neural Width for Alternating Current Optimal Power Flow Proxies [12.4] Loss-Guided Neural Densification (LG-ND)アルゴリズムは、現在のディープニューラルネットワークトポロジが更なる改善に失敗した場合にのみ拡張することにより、必要な能力を検出する。
さまざまなIEEEシステムにおける実験結果から,LG-ND は文献ベースラインと同等の性能を,各層あたりのニューロンの最大10倍の精度で達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:10:18 GMT)
Conformal Language Modeling via Posterior Sampling [12.2] 大型の言語モデルは幻覚に悩まされている。
近年の研究では、共形予測に基づく統計的手法を用いて、その有病率を測ろうとしている。
そこで本研究では,近似からLLM後部まで,条件付けイベントが校正されたハイスコア領域に対応してサンプリングすることを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:49:15 GMT)
Learn from Your Mistakes: Tree-like Self-Play for Secure Code LLMs [12.2] セキュアなコード生成をきめ細かいシーケンシャルな決定プロセスとして再設計するフレームワークであるTree-like Self-Play (TSP)を紹介します。
コード生成をセルフプレイゲームとして扱うことで、モデルは自身の局所的なエラーに対して厳格に識別することを学ぶ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:07:20 GMT)
See, Infer, Intervene: Proactive World Modeling for Goal-Oriented Social Intelligence [12.1] マルチモーダル小売業者は、顧客が何をしているかを認識するだけでなく、明示的な要求がなされる前に支援するかどうかを判断する必要がある。
本稿では、See-Infer-Intervene(SII)フレームワークを用いて、この設定について検討する。
我々は、AIDA(Attention, Interest, Desire, Action)購入フェーズとBDI(Belief, desire, intention)心理学領域を持つ顧客状態を表すPIWM(Proactive Intent World Model)を用いてSIIをインスタンス化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:18:39 GMT)
LeAP: Learnable Adaptive Permutation for Feature Selection in Heterogeneous and Sparse Recommender Systems [12.0] 機能選択のためのモデルに依存しないプラグインモジュールであるLeAPを提案する。
LeAPは非効率なランダムな置換過程を学習可能なメカニズムに変換する。
LeAPは、毎日10億件以上のリクエストがある大規模産業検索ランキングモデルにデプロイされている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:56:32 GMT)
EqGINO: Equivariant Geometry-Informed Fourier Neural Operators for 3D PDEs [12.0] スペクトル領域における等方性を強制する幾何的に堅牢なフレームワークであるEqGINOを紹介する。
複素不規則な3次元幾何学上の座標不変物理法則を強固にモデル化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:23:06 GMT)
AutoTail-BSFGM: Class-Balance-Aware Fine-Tuning for Chinese Scholarly Text Classification [11.9] AutoTail-BSFGMは学術テキスト分類のためのクラスバランス対応の微調整手法である。
CSLに基づく2つの課題について,67のラベルを持つ抽象学際課題と13のカテゴリを持つタイトル・ツー・カテゴリタスクについて評価を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:44:40 GMT)
Distilling Answer-Set Programming Rules from LLMs for Neurosymbolic Visual Question Answering [11.9] 大規模言語モデル(LLM)からルールを抽出する手法を提案する。
VQAデータセットの例では、LLMをガイドし、結果を検証し、ASPソルバからのフィードバックを活用することで誤ったルールの修正を支援する。
従来のデータ駆動型ルール学習手法の代替として, LLMからのルール蒸留が有望であることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:35:31 GMT)
From Ticks to Flows: Dynamics of Neural Reinforcement Learning in Continuous Environments [11.9] 連続環境における深部強化学習(RL)の新たな理論的枠組みを提案する。
探索と遷移の両方を組み込んだアクター・クリティカル・アルゴリズムの実行可能なモデルを導入する。
我々は,おもちゃの連続制御タスクを用いて理論的結果を実証的に相関させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:02:54 GMT)
MOSAIC: Efficient Mixture-of-Agent Scheduling via Adaptive Aggregation and Inference Concurrency [11.8] Mixture-of-Agents (MoA) システムは、各クエリを複数の専門家 LLM にルーティングし、出力を集約することで、推論精度を向上させる。
従来のスケジューリング戦略は、負荷の不均衡によるGPUアイドリングとスループットの低下に悩まされている。
限られたGPUリソース上でMoAワークロードを高速化するスケジューリングフレームワークであるMOSAICを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:40:33 GMT)
FAF-CD: Frequency-Aware Fusion for Change Detection under Imperfect Multimodal Remote Sensing [11.7] DINOv3-pretrained ConvNeXt encoder と線形複雑VMamba-based decoder を組み合わせた周波数対応ハイブリッドフレームワーク FAF-CD を提案する。
BRIGHT検証では、一致した異種EO-SAR適応により、NeXt2Former-CDよりも清浄で摂動したtc-mIoU/tc-mAPが改善される。
さらに、NeXt2Former-CDと比較して約24GFLOPのコストを削減し、精度を維持または改善した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:59:34 GMT)
Libra: Efficient Resource Management for Agentic RL Post-Training [11.7] 強化学習(RL)は、大規模言語モデル(LLM)の訓練後の標準パラダイムとなっている。
エージェントRLでは、ロールアウトステージはツールを呼び出しながら軌道を生成し、長い尾と静止しないワークロードを生成する。
2つのコア機構を導入するLibraについて紹介する。
最大3.0$times$高スループットを実現し、ベースラインと比較して2.5$times$高速に収束する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:09:13 GMT)
When Should the Teacher Move? Temporal Coupling and Stability in Self On-Policy Distillation [11.7] 本研究は,教師年齢ではなく,安定した学習を可能にする重要な構造特性として,教師の凍結期間が定義されていることを示す。
我々は,報酬改善と長身安全の連立証拠を各リフレッシュしながら,孤立期間を保ったEmphConsolidation-Gated Teacher Refresh (CGTR)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:54:39 GMT)
A Goal-Set Characterization of Task Composition in the Boolean Task Algebra [11.7] 最適拡張Q値関数の空間における崩壊を形式化する。
決定論的 MDP では、すべてのそのような関数は普遍的および空のタスクによって完全に決定される。
本稿では,ゴールセット上で論理演算を行うゴールセットベース合成手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:33:06 GMT)
Cross-Modality Feature Fusion Based on Structured State Space Duality for Multimodal Image Registration Network [11.5] 本稿では,RegNetMamba-2という,マルチモーダル画像登録のための新しいアルゴリズムを提案する。
本アルゴリズムでは, 局所的・大域的構造的特徴を効果的に抽出するために, 構造化状態空間双対(SSD)を粗大かつ微細なマッチングプロセスに組み込む。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:50:15 GMT)
PersistGS: Differentiable Physics for Object Permanence in 4D Gaussian Splatting [11.5] 動的3次元ガウス散乱(3DGS)法は,光度監督を用いた同期マルチカメラ映像から時間変化シーンを再構成する。
本稿では,3次元ガウス散乱と微分可能剛体シミュレーションを結合させることにより,閉塞時の物体の永続性を復元する手法であるtextbfPersistGS$を提案する。
合成シーンの実験では、PersistGS は +2.46dB PSNR で一定の速度外挿性能を発揮し、地上軌道上界の 0.19dB 以内である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:57:15 GMT)
StepFinder: A Temporal Semantic Framework for Failure Attribution in Multi-Agent Systems [11.5] 失敗帰属(Failure Attribution)は、障害の原因となる根本原因のステップを自動的に特定することを目的としたタスクである。
既存のフェール帰属法は主に、元の実行軌跡を推論するためにLLMに依存している。
我々は、軽量な障害属性フレームワークであるStepFinderを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:45:49 GMT)
Adaptive Patching Is Harder Than It Looks For Time-Series Forecasting [11.5] 条件下では、コンテンツ適応型パッチ演算子は、チューニングされた均一な演算よりもパフォーマンスがよい。
適応パッチは、調整された均一なベースラインに対して評価されるべきである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:49:06 GMT)
Diffusing in the Right Space: A Systematic Study of Latent Diffusability [11.5] ラテント拡散モデルは、視覚トークン化器を利用して、効率的な生成モデリングのためにラテント空間に画像を圧縮する。
我々は,多種多様な正則化戦略を持つ大量のトークン化剤の集合を訓練することにより,潜時拡散可能性の体系的研究を行う。
生成品質と連続的に相関し,実験環境にまたがる強い一般化を示す潜伏特性を同定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:47:14 GMT)
UniVerse: A Unified Modulation Framework for Segmentation-Free,Disentangled Multi-Concept Personalization [11.4] 拡散変換器におけるセグメンテーションフリー・アンタングル・マルチコンセプトパーソナライズのための統一変調フレームワークUniVerseを提案する。
提案手法により,構成可能かつ分解可能な概念抽出が可能となり,対象オブジェクトの微細な局所化と表現が可能となった。
提案手法は、より柔軟で、解釈可能で、パーソナライズされた視覚生成と理解のために、散在するシーンのターゲット概念を的確に抽出できることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:24:39 GMT)
EXACT-MPPI: Exact Signed-Distance Navigation for Arbitrary-Footprint Robots from Point Clouds via Path Integral Control [11.3] EXACT-MPPIは、ローカルナビゲーションを直接モーションコマンドにマッピングするフレームワークである。
解析的かつ正確な符号付き距離評価器をモデル予測パス積分(MPPI)コントローラに組み込む。
同じフレームワークは、differial-drive、Ackermann、およびハイブリッドモードプラットフォーム上にデプロイされている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:44:20 GMT)
CAPER: Clause-Aligned Process Supervision for Text-to-SQL [11.3] 本稿では,SQL 抽象構文木への反実的介入を通じて,自動的に節レベルの監視を導出する CAPER を提案する。
得られたデータは、ポリシー最適化と候補検証のための軽量なクロース境界フィードバックであるCAPER-9Bのトレーニングに使用される。
BIRDとスパイダーの実験では、節順の監督は実行精度を向上するだけでなく、GPT-5.4よりも15.3%の改善を達成し、障害局所化能力を強化し、84.53%の精度と90.60%のMRRを達成した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:35:40 GMT)
Optimized Labeling Resource Allocation for Prediction-Assisted Inference via OPAL [11.3] 本稿では,最も分散度の低い推定器を生成するためのスムーズなポリシーの抽出可能なクラス内で,ラベル付け戦略を学習するOPALを紹介する。
我々は,OPALが有限標本において名目的カバレッジを達成し,よりラベル付き標本をはるかに多く持つ手法から期待できる精度を有することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:09:04 GMT)
Learning Temporal Causal Structure via Smooth Differentiable Optimization [11.2] 検出精度と効率の両面で、12のベースラインと比較して、全体的なパフォーマンスが最高である。
大規模なベンチマークでは、強力なスケーラビリティが示され、競合するメソッドよりも6倍以上のスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:42:39 GMT)
Conditional Hypothesis Generation for LLM-Based Text Analysis with Researcher-Specified Covariates [11.2] 本稿では,関係するサブグループ間の差異を考慮に入れた条件付き仮説生成手法を提案する。
2つの課題が生じる: 対象部分群は不足し、差の向きは部分群をまたいで逆になる。
本稿では,符号逆転を検出するための2つのエコノメトリインスパイア法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:07:46 GMT)
The DeepSpeak-Agentic Dataset [11.2] DeepSpeak-Agenticは、人間とAIエージェントとの37時間以上の半構造化された会話からなるビデオのデータセットである。
このデータセットを使用して、AIエージェントの自動法医学的識別を評価し、人間とエージェントの相互作用の性質を研究し、AIエージェントを具体化する言語モデルとAI生成音声および顔の将来の進歩のベンチマークを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:10:18 GMT)
Structures Facilitate Retrieve, Rerank, and Generate [11.0] 文書地上対話システム(DGDS)は、外部文書からの知識を利用してドメイン固有のユーザー質問に答える。
本稿では,このような問題に体系的に対処するSF-Re2Gを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:09:41 GMT)
Extreme Motion Generation via Hybrid Null-Space Control for Straight-Line Path Following [11.0] 本稿では, マニピュレータの作業空間内で, 予め定義された軌道に沿った経路長を最大化する「極端運動生成」について検討する。
本稿では,RLベースとモデルベースコントローラを正規化した連接限界距離に応じて切り替えるステップレベルハイブリッドコントローラを提案する。
提案手法を7-DoF Franka FR3を用いて一万進路追従タスクに適用し,平均ロールアウト期間をモデルベースベースラインより27%延長した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:33:08 GMT)
AUGUSTE: Online-Learning dApp for Predictive URLLC Scheduling [11.0] 実際の5Gネットワークは、50-70msの範囲で、中央値のUplink(UL)ラウンドトリップ時間を示している。
ULスケジューラにオンライン機械学習(ML)モデルを組み込んだ学習ベースメディアアクセス制御(MAC)スケジューリングフレームワークであるAUGUSTEを提案する。
3つのURLLCトラフィックパターンにまたがってOpenAirInterfaceを実行する実5Gテストベッド上でAUGUSTEを評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:50:22 GMT)
Calibrating Overconfidence Without Sacrificing Confidence: Probe-Conditioned Head Intervention for LLMs [11.0] 本稿では,凍結探触子を用いた推定時間法であるProbe-Conditioned Head Intervention (PCHI)を紹介する。
Qwen3-4B-Instruct solve OpenMath Instruct problem with a structured binary confidence fieldでは、PCHIは元来の不正な信頼性の82.2%を$texttno$に変換する。
上流の信頼性テンプレートトークン間の共同介入により、ECEは21.9%から9.2%に減少し、元々の正解の読み出しの5.1%しか損傷しない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:13:35 GMT)
The Role of Domain-Specific Features in Malware Detection: A macOS Case Study [10.9] 我々は、機械学習マルウェア検出装置をトレーニングするために、組み込み証明書、権利、永続化技術、および主要なシステムAPIなどの新しいドメイン固有の機能を使用します。
11,413個の良性および29,716個の悪意のある実行可能ファイルからなる41,129個のサンプルからなる新しいデータセットを総合的に評価した。
我々の検出器は非常に高い検出率 (99.50%) を維持し、 (ii) は最先端を50%向上させ、 (iii) ドメイン固有の特徴は新規なマルウェアサンプルの一般化に不可欠である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:25:31 GMT)
PatchScene: Patch-based Voxel Diffusion for Large-Scale Scene Completion [10.8] パッチベースのボクセル拡散パラダイムは、局所化された3D領域内の微細な幾何学を生成する。
環状流拡散戦略は、近距離領域から遠距離領域までの高忠実度情報を伝播する。
20mのLiDARで訓練されたモデルは、リトレーニングなしで効果的に50mのシーンに到達した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:09:20 GMT)
Let There Be Light: Reflection, Refraction and Scattering for Neural Operators [10.7] そこで本研究では, 潜伏進化を基本光輸送を動機とする3つのメカニズムに分解した光刺激型ニューラルオペレータを提案する。
反射と屈折は、潜在特徴空間における適応的な点変換として作用し、局所的特徴再構成と異方性変調を可能にする。
そこで我々は,正のグローバル伝播と局所拡散分岐による明示的なペアワイズ相互作用を置き換える,効率的な散乱変種を開発する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:25:49 GMT)
AugMask: Training Diffusion Models on Incomplete Tabular Data via Stochastic Augmentation and Masking [10.6] AugMaskは、コンディショニングを監督から切り離して不完全なデータに適用するトレーニングフレームワークである。
欠落点の辺縁化は差分重み付き感度のペナルティをもたらし,不確実な完了に対する過度な信頼を損なうことを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:57:38 GMT)
SymTRELLIS: Symmetry-Enforced Voxel Latents for 3D Generation [10.6] フローベースTRELLIS.2の3次元生成において任意の有限点群対称性を強制する手法であるSymTRELLISを提案する。
266の厳密な対称オブジェクトのキュレートされたベンチマークでは、SymTRELLISはTRELLIS.2、Hunyuan3D-2.1、TripoSGと比較して、すべての対称性エラーメトリクスを著しく削減している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:11:41 GMT)
Two-Action Apple Tasting with Switching Costs [10.6] 本研究では,不愉快な相手に対する切り替えコストを考慮に入れた2種類のリンゴテイスティング問題について検討した。
スイッチングコストの一般的なフィードバックグラフアルゴリズムは、この問題に対して$widetilde O(T2/3)$ regret guaranteesを与える。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:28:45 GMT)
MemoGen: Can Past Experience Improve Future Text-to-Image Generation? [10.5] 我々は,既存の画像生成装置をエージェント進化層で拡張する,トレーニング不要のフレームワークであるMemoGenを提案する。
各タスクに対して、MemoGenは視覚的要件を明示的に推測し、必要に応じて外部エビデンスと参照を取得し、それらを実行可能な生成制約に変換する。
進化ラウンド全体を通して、エージェントは関連する経験を取得し、同様の世代の改善を行い、失敗したケースを選択的に修復し、成功したケースを保存する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:04:51 GMT)
Channel-Oriented Design for EEG-to-Music Reconstruction [10.4] 我々は,信号が弱く,分散し,ノイズやチャネルの可変性に敏感な脳波から音楽への再構成について検討した。
我々の中心的な発見は、初期のチャネル混合は弱いが差別的な脳波信号を破壊することである。
本稿では,3つの主成分を持つチャネル指向設計を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:13:37 GMT)
PerceptTwin: Semantic Scene Reconstruction for Iterative LLM Planning and Verification [10.3] PerceptTwinは、セマンティックシーン表現から直接インタラクティブなシミュレーションを構築する完全な自動パイプラインである。
PerceptTwinは、ロボットハードウェア上で実行される前に、計画の検証と洗練に使用することができる。
本研究は,より安全で信頼性の高いロボット計画の基礎として,ロボット認識によるオープンボキャブラリシーンシミュレーションの可能性を示すものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:25:49 GMT)
ClinicalMC: A Benchmark for Multi-Course Clinical Decision-Making with Large Language Models [10.2] 我々は,多コース臨床意思決定のためのベンチマークであるCrysicalMCを提案する。
1,275人の中国人と5,804人のイギリス人サンプルが入所から退院までの4段階にわたって含まれている。
英語データセットの患者は平均5.11の臨床コースを受けており、中国語データセットの患者は3.42である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:09:18 GMT)
TeX-1500: A Paired Real-World LWIR Hyperspectral Dataset and Benchmark for Temperature-Emissivity-Texture Decomposition [10.2] 温度-放射率-テクスチャ(522)分解は、長波長赤外高スペクトルイメージング(LWIR HSI)による対象熱状態、物質スペクトル応答、および可視的幾何学的テクスチャの回復を目指す
現存。
逆パイプラインは主にシーン固有の解法であり、ペアのLWIR HSI制御が欠如しているため、学習ベースの分解は限られている。
我々は,大規模LWIR HSI-データセットであるARPA-1500を導入し,HSI-to-the-Radiance分解の教師付きベンチマークを行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:51:41 GMT)
AutoForest: Automatically Generating Forest Plots from Biomedical Studies with End-to-End Evidence Extraction and Synthesis [10.1] AutoForestは、バイオメディカルペーパーから直接出版可能な森林区画を生成するエンドツーエンドシステムである。
1つ以上の研究論文が与えられたとき、AutoForestはICO(Intervention, Comparator, Outcome)要素を自動で提案し、結果データを抽出し、統計的合成を行い、最終的な森林プロットを描画する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:28:13 GMT)
Supportive Token Revealing for Fast Diffusion Language Model Decoding [10.0] AXONはトレーニングフリーのモジュールで、拡散言語モデルの既存の並列デコード戦略の上に追加することができる。
AXONは、既存の並列デコーダの品質・レイテンシのトレードオフを改善し、精度を維持したり改善したりしながら、機能評価の回数を減らすことができることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:35:54 GMT)
Agentic Large Language Models for Automated Structural Analysis of 3D Frame Systems [9.9] 大規模言語モデル(LLM)は、ドメイン間で強力な推論能力を持つ強力な基礎モデルとして登場した。
構造工学における近年の取り組みは,平面フレームの自動解析のためのエージェントLDMの開発である。
本稿では,自然入力からの3次元フレームの自動構造解析のためのエージェントLLMフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:34:11 GMT)
ToolGate: Token-Efficient Pre-Call Control for Tool-Augmented Vision-Language Agents [9.8] ToolGateは、軌道テキストと単純な構造的特徴から実行/スキップの決定を予測する。
2つのQwen3-VLバックボーンで、ToolGateはトークンコストを制限なしのReActベースラインの64-69%に削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:44:27 GMT)
dstack-capsule: Pod-Level Remote Attestation for Confidential Workloads on Kubernetes [9.7] CoCo(Confidential Containers)は厳格な"VM毎のPod"モデルを強制し、ゲストOSスタックのみを証明し、コンテナレベルのアイデンティティを検証せず、VM単位のリソースオーバーヘッドを禁止している。
我々は,複数のPodが1つのConfidential VMを共有しながら,それぞれが独立してハードウェアが支援するアイデンティティの証明を保持することによって,Intel TDX上でPodレベルのリモート認証を可能にするプラットフォームであるdstack-capsuleを提案する。
我々は,dstack-capsuleのセキュリティ特性,正確性,性能特性を評価し,VM間分離のリソースオーバーヘッドを伴わずにPod-granularity検証を実現することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:33:16 GMT)
A Quantitative Approximation Framework for Flow Distillation in Diffusion Models [9.7] 局所近似誤差は低雑音マルチモーダル状態において強く増幅することができる。
深部残留成分は, 長距離輸送を効率的に近似することを示した。
実験は、一様格子と比較して8セグメントで最大51.9%の予測とエンドツーエンドの相対MSI削減をサポートする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:00:43 GMT)
LLM Judges Inconsistently Disagree Across Safety Criteria and Harm Categories [9.7] 大規模言語モデルは、金融などの規制領域における機械によるアドバイスに関連する安全性の問題を特定する上で、信頼性の低い判断である。
モデルの判断の不整合度は、選択された安全基準によって大きく異なる。
異なる裁判官の間では、ドメイン、安全基準、言語にまたがる同じアウトプットについて高い意見の相違がある。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:28:06 GMT)
Low-Frequency Shortcuts in Texture-Driven Visual Learning [9.5] テクスチャ駆動ドメインに対するショートカット学習分析を提案する。
テクスチャ駆動型ドメインは低周波ショートカットに悩まされている。
低周波のショートカットは、OODの腐敗に対して非常に脆弱であることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:11:20 GMT)
A Decentralized LiDAR-SLAM System with Certifiably Optimal Pose Graph Optimization [9.5] 本稿では,PGOバックエンドを組み込んだ分散化LiDAR-SLAMシステムを提案する。
提案手法は,現状のSLAMと比較して,軌道RMSEを最大48.9%向上させ,優れたロバスト性を実現することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:02:33 GMT)
Patcher: Post-Hoc Patching of Backdoored Large Language Models [9.5] 本稿では,単一障害事例とモデルパラメータのみを用いて,バックドア言語モデルを修復するポストホック防衛フレームワークPacherを提案する。
Patcher氏は、モデルユーティリティを維持しながら、トリガのローカライズとバックドアの中立化に成功したことを示しています。
この作業は、デプロイされた言語モデルにおけるトレーニング時間攻撃に対する実践的な防御に向けた重要なステップである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:11:58 GMT)
Finite-Iteration Local Dynamics and Warm Starts for Alternating Power Iteration in Spiked Tensor PCA [9.5] ランク1スパイクテンソルモデルに対する同時パワーイテレーションについて検討する。
我々の主な貢献は有限点局所理論である。
有限次モーメント雑音下では, 必要な相関関係と, 同一サンプルの1次重畳雑音を検証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:44:12 GMT)
Deft Scheduling of Dynamic Cloud Workflows with Varying Deadlines via Mixture-of-Experts [9.4] DEFTは、動的クラウドワークフロースケジューリングのためのMixture-of-Expertsアーキテクチャを導入し、検証する最初の企業である。
最も適切な専門家を通じて意思決定を適応的にルーティングすることで、DEFTは幅広い期限要件を満たすことができる。
動的クラウドワークフローベンチマークの実験は、DEFTが実行コストと期限違反を大幅に削減することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:34:50 GMT)
RealClawBench: Live OpenClaw Benchmarks from Real Developer-Agent Sessions [9.3] 実際のOpenClawセッションから構築されたベンチマークフレームワークであるRealClawBenchを紹介した。
RealClawBenchは、これらの課題に、再構築された実行環境と決定論的検証可能なスコアラの2つのメカニズムで対処する。
結果として得られたリリースには、はるかに大きなリアルセッションプールからサンプリングされた281の実行可能なタスクが含まれている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:51:24 GMT)
Zero-Shot 3D Question Answering via Hierarchical View-to-Token Transportation [9.3] 本稿では,ビューレベルとトークンレベルの両方において,入力コンテキスト収集のための階層的アプローチを提案する。
具体的には、画素特徴とカメラパラメータを組み合わせることで、意味的内容と幾何学的位置の両方に基づいて、ビューの重要性を評価する。
フレームワークを3つの広く使用されているベンチマークで評価し、既存のチューニング不要の手法とトレーニングベースのアプローチに匹敵するパフォーマンスを大幅に改善したことを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:38:51 GMT)
Shaft-integrated Force Sensing with Transformer-based Dynamics Compensation for Telesurgery [9.2] ロボット支援最小侵襲手術(RAMIS)は,触覚フィードバックを活用し,パフォーマンスの向上を図る。
フォース情報には、パフォーマンスアセスメント、触覚的ローカライゼーション、および外科的自律性を通知する幅広い可能性がある。
本研究は,標準的なケーブル駆動手術器具の遠位端に6軸の商用力センサを統合する方法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:13:03 GMT)
When Retrieval Doesn't Help: A Large-Scale Study of Biomedical RAG [9.2] 検索は、通常1-2点以内の非検索ベースラインよりも小さく、一貫性のない改善しか得られない。
バックボーンモデルの選択は、レトリバーやコーパスの選択よりもはるかに大きな効果がある。
これらの結果は,検索品質だけでなく,検索された証拠を効果的に活用する能力にも限界があることを示唆している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:34:54 GMT)
Rethinking Bregman Divergences in Kronecker-Factored Optimizers [9.1] Frobenius, von Neumann, LogDet の発散は避けられない Kronecker 近似誤差が異なることを示している。
上部分空間に固有値に基づくプレコンディショニングを適用し,下部分空間に適応等方的加速度定数を用いる部分空間対応Kroneckerを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:25:25 GMT)
DMT-CBT: Longitudinal Therapeutic State Modeling for CBT Counseling [9.1] CBTカウンセリングにおける治療状態の動的モデリングのためのフレームワークであるDMT-CBTを提案する。
DMTCorpusはマルチセッションマルチモーダルCBTカウンセリングデータセットである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:18:25 GMT)
PerchRL: Vision-Based Agile Perching on Inclined Platforms under Rapid and Irregular Motion [9.0] PerchRLは、傾斜したプラットフォーム上でのビジョンベースのアジャイルアプローチのための強化学習フレームワークである。
我々は、状態に基づく事前学習と視覚に基づく微調整からなる2段階の学習戦略を採用する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:26:35 GMT)
A Robust Optimization Approach to Sparse Principal Component Analysis [9.0] 本稿では,頑健な最適化を生かしたAdversarial PCA(AdvPCA)を提案する。
この定式化は閉形式還元を許容し、実用的な反復アルゴリズムをもたらすことを示す。
理論的に解を特徴づけることにより、アルゴリズムがボックス外で効果的に実行できるようにするデータ適応パラメータ化を導出する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:14:12 GMT)
Global adiabatic criterion for fast topological photon transfer in Fock-state lattices [8.9] フォック状態格子のトポロジカル状態移動は結合の正弦波プロファイルを用いて高速に実証されている。
この研究は観測速度の厳密な説明と高速トポロジカルフォトニクス工学の一般的な枠組みを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:53:48 GMT)
ExDBSCAN: Explaining DBSCAN with Counterfactual Reasoning -- Additional Material [8.8] クラスタリングは、類似性によってデータポイントをグループ化する、教師なしのテクニックである。
ExDBSCANは、理論的に妥当性が保証される、実用的な対実的な説明を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:02:01 GMT)
ConTrack: Constrained Hand Motion Tracking with Adaptive Trade-off Control [8.8] 追跡データでスケールする強化学習フレームワークであるConTrackを紹介します。
ConTrackはオブジェクトのトラッキングを制約として扱い、残りのコントロール権限を動きの忠実さに割り当てる。
さらに、ConTrackは適応的な中軌道リセットライブラリで長期学習を安定化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:31:32 GMT)
The bulk spectral gap is semi-decidable: a convergent family of certified upper bounds [8.6] 量子多体系のバルクスペクトルギャップに関する証明された上界の完全族を導入する。
原理の証明として、我々のアルゴリズムをスピン$frac12$カゴメ格子ハイゼンベルク反強磁性体に適用する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:18:19 GMT)
Diversity Over Frequency: Rethinking Tool Use in Visual Chain-of-Thought Agents [8.6] 視覚エージェントは、微粒な証拠を組み込むために、思考の視覚連鎖の中で外部視覚ツールを使用する。
本稿では,3次元空間推論や医用視覚質問応答など,より困難な課題を探索するために,単純な視覚探索タスクを超えて進める。
モデルは、高いタスク精度を達成しながら、ツールの使用を徐々に停止する。
バニラトレーニングとツール使用促進の両方がロールアウトの多様性を減らし、ツールの使用率が向上しない理由を説明する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:03:53 GMT)
StepPRM-RTL: Stepwise Process-Reward Guided LLM Fine-Tuning for Enhanced RTL Synthesis [8.5] 本稿では,段階的軌跡モデリング,プロセス・リワードモデリング,検索強化微調整を組み合わせた新しいフレームワークであるStepPRM-RTLを提案する。
StepPRM-RTLは、各ステップが合理的かつインクリメンタルなコード修正を含む、標準的なソリューションからのステップワイズ推論トラジェクトリを構築する。
Monte Carlo Tree Search (MCTS)は、トレーニングデータセットを高品質な軌道で強化し、代替の推論パスを探索する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:52:48 GMT)
Weakly Supervised Incremental Segmentation via Semantic Anchors and Spatial Arbitration [8.5] SASAはセマンティックアンカーと空間配置によるセマンティック学習を安定化させるように設計されている。
表現レベルでは、学習可能なトークンのセマンティックアンカーを、長期的なセマンティックアイデンティティを保持するための厳密なクラスレベルの参照として導入する。
本研究では,信頼できない信号を直接フィルタリングし,厳密な「1つの対象,1つのクラス」制約を強制する空間ラベルアロケーション機構を開発する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:10:46 GMT)
Spike-Aware C++ INT8 Inference for Sparse Spiking Language Models on Commodity CPUs [8.4] スパイク言語モデルは、高密度のTransformerランタイムが直接利用しないアクティベーション空間を公開します。
スパースバイナリスパイク状態を実行プリミティブとして扱うC++ CPU推論ランタイムを実装した。
スパイク対応の実行は、スパース言語モデルのCPUスループットとメモリ動作を改善することができる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:03:37 GMT)
VidMsg: A Benchmark for Implicit Message Inference in Short Videos [8.4] Vidは、短いインターネットネイティブのビデオクリップで暗黙のメッセージ理解を評価するためのベンチマークである。
Vidには、9つの実用的なトピック領域にわたる400のYouTube由来のクリップと、52のきめ細かいターゲットメッセージが含まれている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:31:57 GMT)
RocketSmith: An Agentic System for High-Powered Rocket Design and Manufacturing [8.4] この研究は、高出力ロケット開発における設計、製造、最適化のプロセスが可能なエージェントシステムであるRocketSmithを提示する。
このシステムは、ソフトウェアツールのインテリジェントな自動化を可能にし、飛行安定性などの要素を検証するだけでなく、ロケット組み立てのためのパラメトリック設計コンポーネントを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:58:05 GMT)
Think-Before-Speak: From Internal Evaluation to Public Expression in Multi-Agent Social Simulation [8.2] Think-Before-Speak(TBS)は、インターバルベースのマルチエージェントシミュレーションフレームワークである。
反響関連評価は、エージェントが話す意思を高める。
発話意図が形成されると、公的な表現は主にターンアロケーション規則によって形成される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:26:01 GMT)
MLSkip: Data Skipping for ML Filters via Lightweight Metadata [8.1] データベースベンダは最近、フィルタ述語で使用できるAI関数をリリースした。
整数と文字列データに対する従来のデータスキップ技術は、新しいフィルタタイプには適用できない。
Parquetのデフォルトのmin-maxメタデータはプルーニングを可能にするのに十分である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:36:06 GMT)
Beyond Static Priors: Dynamic Neural Guidance for Large-Scale Ant Colony Optimization [8.1] 動的神経誘導を実現する新しいフレームワークであるDyNACOを提案する。
DyNACOは10万ノードのインスタンスにスケールし、神経ベースラインを上回っている。
我々の研究は、ニューラルトレーニングと反復探索ダイナミクスの整合の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:32:36 GMT)
One (Thread) Can Keep a (PRNG) Secret, but not Two [8.1] 本稿では,XNU の IPv6 フラグメントID 生成アルゴリズムに対する,新しい実用的な攻撃法を提案する。
この攻撃はアルゴリズムの擬似乱数生成器(PRNG)における競合条件の脆弱性を利用する
Appleはこの脆弱性をCVE CVE-2024-27823に割り当て、攻撃に対してXNUベースのすべての製品にパッチを当てた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:02:18 GMT)
Drifting Preference Optimization for One-Step Generative Models [8.0] ワンステップのテキスト・ツー・イメージジェネレータは、単一のフォワードパスを持つイメージを生成するため、デプロイには魅力的である。
決定論的ワンステップジェネレータのオンライン選好精選手法であるドリフト選好最適化(DrPO)を提案する。
DrPOは、現在のジェネレータから候補をランク付けし、ターゲットの報酬でランク付けし、高および低スコアのサンプルを使用して特徴空間更新方向を合成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:49:37 GMT)
LiveBand: Live Accompaniment Generation in the Audio Domain [8.0] ライブ音声入力のための高忠実度音楽伴奏をリアルタイムに生成するLiveBandを提案する。
本手法は,事前学習した因果音響オートエンコーダの連続潜時空間における因果トランスフォーマジェネレータを訓練する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:50:13 GMT)
Enginuity: A Dataset and Benchmark for Vision-Language Understanding of Engineering Diagrams [8.0] Enginuityは、エンジニアリング図上でビジュアル言語モデルを評価するための、最初のオープンデータセットとベンチマークである。
我々は、米軍部隊のコーパス上の2つのタスクを定義し、構造化された部品テーブル抽出と自由形視覚図質問応答というマニュアルを修復する。
ゼロショットおよびチェーン・オブ・フォアプロンプトによる4つのフロンティアVLMの評価を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:54:03 GMT)
Visual Instruction Tuning Aligns Modalities through Abstraction [8.0] 命令チューニングがブリッジとして機能し,視覚的特徴を大言語モデルの中間的意味層に直接埋め込むことを示す。
これらの中間層は、視覚言語処理のセマンティックコアであり、幅広いマルチモーダルベンチマークの性能において重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:42:21 GMT)
Framing Migration News with LLMs: Structured CoT as a Support for Human Interpretation [7.9] Llama3-8Bを用いたStructured Chain-of-Thought (SCoT)プロンプト手法を提案する。
SCoTは、ユーザがモデル出力を監査し、本質的に主観的なタスクにおける代替解釈を調べることを可能にする。
我々は、アノテータが「モデルの推論」の一貫性と影響を評価できる人間中心の評価を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:15:39 GMT)
Rotate2Think: Geometric Priming via Orthogonal Rotation to Improve Language Model Reasoning [7.8] 推論における表現空間の内部構造は理解されていない。
入力埋め込みと思考埋め込みの両方が極めて高い円錐性を示すことを示す。
本稿では,このロータテ2シンク(Rotate2Think)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:05:57 GMT)
G^2C-MT: Graph-Guided Context Selection for Document-Level Machine Translation [7.7] ドキュメントレベルの機械翻訳(DocMT)では、長距離の談話の依存関係をキャプチャする必要がある。
G2C-MTは、DocMTコンテキスト選択を軽量な談話グラフ上の構造化経路発見問題とみなしている。
このフレームワークは自然にマルチパスコンテキストサンプリングをサポートしており、談話・あいまいな入力に対して多様な翻訳候補を集約することで堅牢性を向上させることができる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:09:15 GMT)
Mamba-Enhanced Implicit Motion Learning for Audio-Driven Portrait Animation [7.7] 本研究では,1つの静止画像とオーディオから,現実的で時間的に整合した人間の動画を生成するための,新しい暗黙の移動フレームワークを提案する。
私たちのアプローチでは、レンダリングからモーション予測を分離する2段階のパイプラインを使用します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:43:55 GMT)
A formal definition and meta-model for a machine theory of mind [7.7] 本稿では,認知心理学,神経科学,人工知能のエビデンスに支えられた原理を基礎として,心の機械理論という概念の厳密な形式的定義を提案する。
また、マシン・セオリー・オブ・マインド(Machine Theory of Mind)の一般的な全体論的メタモデルも推進し、そのようなモデルを実証的にベンチマークする際の技術状況を調べる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:48:59 GMT)
Neural Navigation Functions for Zero-Shot Generalizable Motion Planning [7.6] 我々は,未知の環境空間を横断するゼロショット転送が可能な,学習されたリアクティブナビゲーション機能であるニューラルナビゲーション関数(Neural-NF)を紹介した。
Neural-NFは、データ駆動型適応を構造化楕円型プランナーに配置する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:06:25 GMT)
SHARP: Sleep-based Hierarchical Accelerated Replay for Long Range Non-Stationary Temporal Pattern Recognition [7.6] SHARP(Sleep-based Hierarchical Accelerated Replay)は、時間学習を2つの補完的なコンポーネントに分解するフレームワークである。
SHARPは、緩やかな睡眠中に、げっ歯類で観察される加速されたリプレイにインスパイアされ、時間的に構造化されたメモリトレースをアクセラレーションされた形で再生するオフライン(スリープ)フェーズを組み込む。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:41:37 GMT)
Designing a Hardware Reverse Engineering Course: Lessons from Eight Years in a Rapidly Evolving Tech Domain [7.5] ハードウェアリバースエンジニアリング(HRE)はサプライチェーンの脅威を検出するために不可欠である。
本稿では,デジタル回路解析とICからのデジタル回路抽出に着目したHREコースを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:18:23 GMT)
Quantifying the biophysical properties of stomatocytes in health and disease [7.5] 遺伝性ストマトサイトーシス(英: hereditary stomatocytosis、HS)は、カップ型赤血球を特徴とする赤血球障害である。
このパラドックスはRBCが部分的に独立したパラメータによって支配されているため持続する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:44:26 GMT)
CrowdMath: A Dataset of Crowdsourced Mathematical Research Discussions [7.4] 我々は、MIT PRIMES--Art of Problem Solving (AoPS)プログラムから164のエキスパートアノテートプログレスチェーンのデータセットであるCrowdMathを紹介する。
各チェーンは、オープンプロブレムステートメントから完成した証明まで、多人数のフォーラムディスカッションをトレースする。
モデルは次のポスト予測において83~88%の精度を達成し、数学的議論の局所的な流れに従うことができることを示唆している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:38:39 GMT)
Using Text-Based Causal Inference to Disentangle Factors Influencing Online Review Ratings [7.4] 本稿では,テキストに基づく因果解析,特にCausalBERTの最近の進歩に基づいて,各因子が全体レビュー評価に与える影響を解消する手法を提案する。
レビューのテキスト参照を,実世界の属性のプロキシとして扱う。
我々は、米国K-12校600万以上のレビューから得られた実・半合成データに対する我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:26:44 GMT)
Face versus Body Tracking for Human-Robot Interaction: An Egocentric Dataset [7.4] 最先端のコンピュータビジョンモデルは、監視や自動運転に非常に最適化されている。
社会ロボットは、人間が跳ね返ったり、お互いを妨害したり、フレームを離れたりといった、異なる自我中心の課題に直面します。
我々は、Furhatロボットを介して収集された、新しい、カスタムアノテーション付きエゴセントリックデータセットを導入し、複雑な社会的ダイナミクスを捉える。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:15:17 GMT)
Finding Needles in the Haystack: Transductive Active Labeling in Ecology [7.1] 現在のプラクティスは、アクティブな学習を誘導的に評価し、ホールドアウトテストセットでの予測性能を推定します。
人間のループを無視することは、ラベルの継続の重要性を過小評価することを示した。
我々の分析は、この長い尾において、トランスダクティブな目的が、予測から発見へと重要度をシフトしていることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:01:22 GMT)
Private Embedding Lookup with Encrypted Compact Queries under Fully Homomorphic Encryption [6.9] ホモモルフィック暗号化(FHE)は、暗号化されたクライアントデータに対する推論を可能にするが、埋め込みルックアップを単純なテーブルアクセスからホモモルフィックな計算に変換する。
本稿では,サーバ側への埋め込みを継続し,クライアントから暗号化された埋め込みベクタの送信を回避するために,Independent Vector Evaluation (IVE)を提案する。
提案手法は,従来の手法に比べて最大78.4倍のアモータイズされたルックアップ時間を向上することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:50:04 GMT)
Quantum Information Harvesting with the Parallel Quantum Flow Algorithm [6.9] 本稿では,シングル・アンド・ダブルスモデルに基づくQFlowフォーマリズムの高性能コンピューティング実装について報告する。
82と114の軌道からなるターゲット空間に対して、フローは6つのアクティブな軌道型アクティブな空間に6つのアクティブな電子を含むことを実証する。
QFlow形式は拡散関数を持つ拡張基底集合において高い精度を維持しており、現実的な大規模量子化学シミュレーションの可能性を強調している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:08:10 GMT)
Training-Free Multi-Concept LoRA Composition with Prompt-Aware Weighting [6.9] Low-Rank Adaptation (LoRA)は、事前学習された拡散モデルを特定の視覚概念やスタイルに適応させることで、テキスト・画像生成におけるパーソナライズを実現している。
本稿では,複数のLoRAモジュールの出力を最適に組み合わせることで,マルチコンセプトのカスタマイズをシンプルかつ効果的に行う手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:42:09 GMT)
IDO: Incongruity-aware Distribution Optimization for Multimodal Fake News Detection [6.7] 本稿では,偽ニュース検出の性能向上を目的としたIDO(Inongruity-Aware Distribution Optimization)を提案する。
実情の不整合性に対して,意味的に識別可能な埋め込みを得るために,チャネルワイドの重み付け戦略を導入する。
モダリティの不整合性には、非整合性コントラスト学習を用いて、クロスモーダルな意味情報を学習する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:02:52 GMT)
Set-Preserving Calibration from Conformal P-Values to E-Values [6.7] そこで本研究では, 共形p値によって誘導される予測セットを変更することなく, 共形p値をe値に変換する新しいP2Eキャリブレータを提案する。
このe値の定式化は、e値のマージとランダム化における最近の進歩の原則的利用を可能にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:06:01 GMT)
ProjQ: Project-and-Quantize for Adapter-Aware LLM Compression [6.6] トレーニング後の量子化(PTQ)とローランド適応(LoRA)は、LLM(Large Language Model)の効率的なデプロイメントのための標準パイプラインである。
量子化雑音を低ランク多様体に制約する新しいフレームワークである textbfProjQ を提案する。
ProjQは、量子化エラー補償と下流タスクの微調整の両方において、既存のメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:20:42 GMT)
Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models [6.5] YOLO検出器は依然として推論時の非最大抑制に依存しており、Focal Distribution Lossによる重い検出ヘッドを持ち、正のラベルを割り当てることなく最小の物体を残すことができる。
我々は,これらの制約に対処する統合リアルタイムビジョンモデルファミリーであるUltralytics YOLO26を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:01:13 GMT)
From 'What' to 'How' and 'Why': Sharing LLM-Generated Retrospective Summaries of Older Adults' Passive Tracking Data with Remote Family Members [6.5] 高齢者のRAMに対するマルチモーダル追跡データから振り返りサマリーを生成する方法について述べる。
既存のシステムであるVital Insightを活用して、初期要約を生成しました。
次に、システムをマルチレイヤ、マルチエージェント、インサイト駆動の要約アプローチに再設計しました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:46:00 GMT)
A Dataset for Dynamic Human Preferences for Vision Language Models [6.4] この研究は、視覚言語モデルが動的人間の推論を理解する能力を評価するための新しいベンチマークを導入している。
我々は,このベンチマークを生成するための自動パイプラインを提供する。画像依存,動的マルチモーダルなヒューマン参照データセット,および新しいベンチマークにおける最先端モデルの評価を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:08:29 GMT)
Learning Topological Representations for Molecular Dynamics [6.4] 分子動力学の汎用表現として永続ホモロジー(PH)を考察する。
最近導入された単純複合体構築のタンパク質調整修飾であるマスク付きフラッド複合体を導入する。
学習した低次元座標から,タンパク質のクラス予測,フレームレベルの可観測回帰,マルコフ状態モデル(MSM)の推定について検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:26:11 GMT)
DiverAge: Reliable Pluralistic Face Aging with Cross-Age Identity Relation Guidance [6.3] 顔の老化は、長期的なバイオメトリック分析、クロスエイジのアイデンティティ検証、および法医学的アイデンティティ分析において重要な役割を担っている。
既存の決定論的老化法は、視覚的にプラウジブルな年齢差のある顔を合成することができるが、通常は多様性を欠いている。
拡散自動符号化に基づく階層型多元性顔老化フレームワークである textbfDiverAge を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:39:31 GMT)
Toward Gripper-Integrated Active Electrosense for Pre-Contact Sensing in Underwater Soft Grippers [6.2] アクティブ・エレクトロセンスは、導電性媒体中の印加電体の摂動を測定することにより、接触前に近接的な信号を与えることができる。
我々は,タコにインスパイアされたグリップに電極配置を個別に配置し,オフザシェルフハードウェアを用いてマルチチャネルセンサ電圧を記録する。
これらの知見は,水中軟部手術の前処置として,グリップインテリセンスの系統的研究を動機付けている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:04:22 GMT)
Informational completeness of qubit measurements and IC preservability of qubit channels: Characterization and Quantification [6.2] 情報完全(IC)測定は、結果統計によって未知の量子状態が一意に決定されるため、有用な測定方法である。
任意の量子測度に対する情報完全性の定量化について,忠実な測度の導入と特徴付けにより検討する。
本研究では,量子計測における情報完全性と量子チャネルの保存能力の両方を研究するための定量的枠組みを提供するだけでなく,情報完全性と量子コヒーレンスの間の概念的関係について重要な知見を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:50:44 GMT)
Exact equivariance, kept through training, buys zero-shot generalisation across the symmetry group [6.2] 等変エンコーダ$E$と等変予測器$f$から構築された潜在世界モデルは、トレーニング損失の証明可能な対称性を継承する。
このエンドツーエンドをラップトップスケール(CPU/MPS、完全シード)で検証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:20:24 GMT)
PsychoPass: Geometric Profiling of Multi-Turn Adversarial LLM Conversations [6.2] 大規模言語モデル(LLM)に対するマルチターンジェイルブレイク攻撃は、現在のガードレールのミスマッチを明らかにする。
本稿では,表現空間における会話を経路としてモデル化し,コンテンツからダイナミクスへのシフトを提案する。
我々は,潜在的な攻撃を予測するために,埋め込み空間における会話軌跡から幾何学的特徴を抽出するフレームワークであるBioPassを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:24:20 GMT)
AvatarMix: Identity-Preserving Cross-Avatar Composition for Outfit Personalization [6.1] AvatarMixは、服装の忠実さとアイデンティティの保存における最先端の成果を達成し、リアルな3D服のパーソナライゼーションの新しい視点を提供する。
提案手法は, リアルな3D服のパーソナライゼーションの新たな視点として, 衣服の忠実度とアイデンティティの保存の最先端的な結果を実現する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:24:31 GMT)
BBR-Net: Boundary-Balanced Replay for Continual Medical Image Segmentation [6.1] 本研究は, 連続心エコー区分けにおいて, 構造的整合性が知識保持を左右するか否かを考察する。
本稿では,境界対応優先度とクラスバランスを用いて,リプレイサンプルを選択する境界ベースリプレイネットワーク(BBR-Net)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:10:01 GMT)
LAP: An Agent-to-Instrument Protocol for Autonomous Science [6.0] 大規模な言語モデルエージェントが実験を計画し、自動運転研究所がそれらを実行している。
このようなシステムはすべて、推論エージェントと物理機器のリンクをゼロから再構築する。
最近のエージェント・インターオペラビリティ・プロトコルはエージェント・ツー・ツールエッジを明確にし、Googleのエージェント・ツー・エージェントエッジ(A2A)はエージェント・ツー・エージェントエッジである。
このギャップを埋めるプロトコルであるLab Agent Protocol (LAP) を提示する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:03:43 GMT)
Contrastive Augmented Transformer with Domain-specific Enhancement for Robust Multi-scenario Metal Surface Defect Detection [6.0] 本稿では,堅牢な欠陥検出のためのコントラスト拡張トランス(CAT)フレームワークを提案する。
Catは階層的なSwin Transformerのバックボーンを採用し、機能ピラミッドネットワークを再設計して、低レベルのテクスチャと高レベルのセマンティクスを効果的に融合させる。
KolektorSDD2データセットの実験結果は、CATが99.54%のピクセルレベルのAUROCを達成し、既存の手法より優れていることを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:20:12 GMT)
APIC: Amortized Physics-Informed Calibration using Neural Processes [6.0] 本稿では,Amortized Physics-Informed (APIC)を導入し,拡張性のあるベイズ推論を実現する。
我々のフレームワークは、インスタンス固有の物理的パラメータを、共有された状態依存構造的相違から切り離すために、2分岐の潜在アーキテクチャを採用している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:04:43 GMT)
SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models [6.0] 本稿では,協調型マルチエージェント環境におけるLLMエージェントの評価を目的とした,StarCraft Multi-Agent Challengeの自然言語拡張であるSMAC-Talkを紹介する。
SMAC-Talkは、エージェントの調整と信頼を調査するために使用される自然言語通信チャネルを含んでいる。
我々は、このコミュニケーションチャネルを使用して異なる評価シナリオを構築する。例えば、コミュニケーションだけで同盟者を混乱させ欺こうとする組込みコミュニケータの設定を含む。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:40:04 GMT)
A Systematic Analysis of Linguistic Features in AI-Generated Text Detection Across Domains and Models [5.9] 解釈可能な言語機能は、あるテキストが機械生成される理由を説明するための有望なアプローチを提供する。
我々は、AI生成テキストを特徴付けるための言語信号の堅牢性を評価する大規模な実証的研究を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:46:22 GMT)
Covert Influence Between Language Models [5.8] 本研究では,3つのインターフェースにまたがる隠蔽効果のリスクについて検討する。
人間の目に見える痕跡を残さずに達成できる影響の規模は様々である。
サンプルごとの属性の推測時間を用いて,3つのインターフェースすべてにまたがる包括的影響について検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:10:56 GMT)
EpiFormer: Learning Antigen-Antibody Interactions for Epitope Prediction via Geometric Deep Learning [5.7] EpiFormerは、抗体予測のための一般的な変種デコーダフレームワークである。
従来のベストメソッドよりも、標準ベンチマークのF1スコアの40%以上改善されている。
EpiFormerは、既知の生物学的原則をエンドツーエンドトレーニングの創発的な行動として発見する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:20:25 GMT)
BigFinanceBench: A Workflow-Grounded Benchmark for Financial-Research Agents [5.7] BigFinanceBenchは、オープンエンドの粗悪な財務調査タスクの928項目のベンチマークである。
導出を独立にチェック可能なステップに分解する。
アナリストワークフロー全体にわたって、部分クレジット評価と障害のローカライズをサポートする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:12:34 GMT)
Towards Compact Autonomous Driving Perception with Balanced Learning and Multi-sensor Fusion [5.6] 本稿では,自律運転認識タスクを1回の前方通過で処理する,小型な深層マルチタスク学習モデルを提案する。
このモデルは、セマンティックセグメンテーション、深度推定、光検出・測光(LiDAR)セグメンテーション、鳥の視線投影を同時に行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:35:42 GMT)
Wheel-Mounted/GNSS Fusion with AI-Aided Position Updates [5.5] 本稿では,車輪搭載慣性センサ,周期軌道の強制,および誤差状態拡張カルマンフィルタにおける位置更新を伴う車両の変位を抑えることができる簡易かつ効率的なニューラルネットワークを統合したハイブリッドニューラル慣性ナビゲーションフレームワークを提案する。
実験結果から,本手法は位置決め精度を向上し,標準の車輪搭載慣性センサ融合と比較して根平均2乗誤差を約46 %削減できることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:27:05 GMT)
Autonomous Navigation System for Library Service Robot Based on Unitree Go2 Edu [5.5] 本稿では, 4D LiDAR, 前面深度カメラ, IMUを備えた, ユニツリー Go2 Edu の ROS 2 ナビゲーションシステムを提案する。
図書館が荒削りな地形であると仮定するのではなく、実際の配備における現実的な移動性の不連続を目標にしている。
実際のライブラリでは,静的,低密度,高密度の動的シーンにおいて,100%,96%,88%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:49:25 GMT)
Overlaying Governance: A Compositional Authorization Framework for Delegation and Scope in Agentic AI [5.5] 本稿ではエージェントAIシステムのための構成的ガバナンスフレームワークを提案する。
デリゲートの種類とそのパーミッションと説明責任の意味を定義します。
これはエージェントAIシステムにおける説明可能な認可のための形式的かつ実用的な基盤を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:39:39 GMT)
ModuLoop : Low-Level Code Generation using Modular Synthesizer and Closed-Loop Debugger for Robotic Control [5.4] 大規模言語モデル(LLM)は、コード生成や問題解決など、さまざまな領域で素晴らしいパフォーマンスを示している。
クローズドループモジュール型コード合成フレームワークを提案する。
このフレームワークは、タスク固有の微調整なしで事前訓練されたLLMを利用して、モジュール化されたコード計画と生成を実行する。
提案手法をRGB-Dカメラとロボットアームの校正に適用し,実環境における有効性を検証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:30:19 GMT)
Long Live Fine-Tuning: Task-Specific Transformers Outperform Zero-Shot LLMs for Misinformation Response Classification on Reddit [5.4] 我々は,誤情報談話の微妙な分類にスケールと一般能力が十分であるという暗黙の仮定を検証した。
BART-MNLI、3つのLlama変種、3つの商用フロンティアLLM、微調整されたDistilBERTとRoBERTaの9つのモデルを比較した。
検証のコンテキストでは、欠落した信念がコストの低いエラーである場合、タスク固有の微調整の方がより信頼性の高い選択である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:58:59 GMT)
VirtualMLE: A Virtual ML Engineer that Optimizes Sequential Recommenders [5.4] 我々は、実行、リフレクション、メモリ更新のクローズドループに最適化するレコメンダを整理するLLM-agentフレームワークである textbfVirtualMLE を提案する。
我々は、SASRecとHSTUという2つの代表的なバックボーンを持つ3つのAmazon SRベンチマークでVirtualMLEを評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:31:15 GMT)
Multi$^2$: Hierarchical Multi-Agent Decision-Making with LLM-Based Agents in Interactive Environments [5.4] 大規模言語モデル(LLM)研究の中心的な目標は、動的環境との持続的な相互作用を計画し、行動し、適応できるエージェントシステムを構築することである。
エージェントの振る舞いを補完的な役割に明示的に分解する階層的マルチエージェント意思決定フレームワークであるMulti$2$を紹介する。
高レベルエージェント(システム1)は、教師付き微調整(SFT)を用いたコンテキスト認識サブゴール生成に焦点を当て、低レベルエージェント(システム2)は、対話型環境でオフラインからオンラインへの強化学習(RL)を通してアトミックアクションを実行する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:20:09 GMT)
A Close Look At World Model Recovery In Supervised Fine-Tuned LLM Planners [5.3] Supervised Fine-tuning (SFT)は、大規模言語モデル(LLM)におけるエンドツーエンドの古典的計画を改善する
これらのモデルは、彼らが解決しようとしている計画上の問題を表現し、理由づけることも学べるだろうか?
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:09:16 GMT)
Neural Change Prediction: Relating Software Changes to Their Effects and Vice Versa [5.3] 本稿では,ソフトウェア変更とプログラム動作に対する動的影響の関係を学習し,予測する手法であるニューラルチェンジ予測を提案する。
与えられたプログラムとテスト入力に対して、コードに多数の突然変異を自動で適用し、これらの変更がプログラムの出力をどのように変更するかを観察する。
我々は、CSS構成ファイルの詳細なケーススタディとPythonプログラムの評価を行い、ニューラルチェンジ予測の汎用性と幅広い適用性を実証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:23:35 GMT)
PURGE: Projected Unlearning via Retain-Guided Erasure [5.1] PURGEは、単純だが未発見の観測(継続学習(CL)と機械未学習(MU))に基づいて構築された機械学習アルゴリズムである。
CLは古いタスクを忘れずに新しいタスクを学習しようとします。MUは、反対方向に同じ根底にある緊張力を表す保持パフォーマンスを損なうことなく、特定のデータを消去しようとします。
PURGEは、MIA AUROCを0.5(理想)に近い精度で達成し、勾配上昇、KLユニフォーム、プライバシーユーティリティフロンティアのいくつかのベースラインを達成しながら、常に96%以上の精度を維持している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:53:01 GMT)
Stationarity-Aware Retrieval-Augmented Time Series Forecasting [5.1] 時系列予測は歴史的パターンに依存している。
リアルワールドシリーズは、しばしば非定常性やレギュラーシフトを示す。
定常性を考慮した検索時系列予測手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:47:16 GMT)
Automated Repair of Requirements for Cyber-Physical Systems in Simulink Requirements Tables [5.0] 本稿では,システム実行データを利用したCPS要求の誤りを修復するフレームワークを提案する。
提案手法は,時間に基づく信号よりも宣言的要求の正しさを評価する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:41:20 GMT)
The Reliability Gap in Benchmark Auditing: Distribution Shift and Scale as Failure Modes of Contamination Detection [4.9] トレーニングデータメンバーシップを検出する統計ツールは存在するが、ほとんど制御された学術体制でのみ検証されている。
分散シフトとスケール制約という,未調査の2つの障害モードを特定します。
335点中199点しか正しい結果が得られていない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:21:22 GMT)
Hierarchies of Calibration: Classification meets Regression [4.9] キャリブレーションの概念は確率的予測とそれぞれの結果との互換性を形式化する。
本稿では,分類および回帰タスクのために提案されたキャリブレーションの考え方をレビューし,拡張し,橋渡しする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:05:20 GMT)
Stumbling Into AI Emotional Dependence: How Routine AI Interactions Reshape Human Connection [4.9] 我々は,汎用プラットフォーム上でのタスク指向インタラクションにおいて,AIの感情サポートが偶然に現れることを示す。
AIの感情的サポートの肯定的な経験は、AIの感情的能力に関する人々の信念を更新し、AIの好みを増し、人間の好みを減らします。
我々は、効果的な規制が汎用AIシステムにまで拡張され、人々が支援を求める方法における累積的かつ軌道レベルの変化に対処すべきであると主張している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:18:39 GMT)
FLARE: Fine-Grained Diagnostic Feedback for LLM Code Refinement [4.8] 既存の方法は、テストの失敗や自己批判のようなフィードバック信号を使って、生成されたコードを反復的に洗練する。
本稿では,バグローカライゼーションとコードリファインメントのためのラインレベルの不確実性信号を予測する軽量診断モデルを備えた反復的フレームワークであるFrareを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:29:17 GMT)
WorkBenchMark: A LEGO-Based Assembly Benchmark with an Assembly-by-Disassembly Baseline for the Smart Manufacturing League [4.8] LEGO DuploベースのロボットアセンブリベンチマークであるWorkBenchMarkを紹介した。
WorkBenchMarkは、物理的制約の下でタスクレベルのシンボリック推論と低レベルの操作を結合する。
計画ベースのパイプラインは、すべての層にわたるモダンなビジョン言語アクションアプローチよりも優れています。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:15:31 GMT)
veriFIRE: an Industrial Case Study in Verifying Consistency Properties for a DNN-Based Wildfire Detection System [4.7] 本稿では,システム内のテキスト整合性を検証するためのエンドツーエンド手法を提案する。
提案手法は,既存のニューラルネットワーク検証器に対して,アプリケーション基底要求をソルバ互換クエリにエンコードする。
その結果,産業システムにおいて意味のある,ドメイン固有の保証が得られることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:32:03 GMT)
Beyond Compression: Quantifying Spectral Accessibility in Vision Representations [4.7] 視覚言語モデルは、学習したプロジェクション層を通して視覚的特徴を共有埋め込み空間にマッピングする。
本研究では,空間周波数アクセシビリティによる表現の変化について,モデル表現からの帯域制限エネルギーの線形回復率を用いて検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:42:54 GMT)
Easy-to-Use Shielding for Reinforcement Learning [4.6] シールドは、アクションセーフティを決定するための環境モデルという形でドメイン知識を仮定するテクニックである。
シールドの適用には、通常、正式な手法と実質的なエンジニアリング作業の専門知識が必要である。
我々はシールド合成ツールであるTempestを安全なRLのための実用的なバックエンドに拡張する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:50:34 GMT)
PatchSTG: Scalable Spatiotemporal Graph Transformers for Traffic Forecasting on Irregular Sensor Networks [4.6] 本稿では,不規則なセンサネットワーク上での効率的な予測を目的としたパッチベースのグラフ変換器を提案する。
提案したPatchSTGを,ロードアイランド州の実世界のデータと大規模データセットに基づいて評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:53:28 GMT)
Few-Shot Prediction for Pulsar Noise with Long Short-Term Memory Network [4.6] 本研究は,パルサーの時間残差を限られたデータで予測する新しい手法を提案する。
提案手法は,モデルに依存しないメタ学習アルゴリズムを用いて,Long Short-Term Memory (LSTM) ネットワークを最適化する。
我々の軽量構造は16.86MBのCPUメモリと18ミリ秒の1ステップ残差予測のみである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:43:19 GMT)
Structure-Preserving Quantum Method of Lines for Evolutionary PDEs with Mixed Boundary Conditions [4.6] 本稿では,2次PDEのための構造保存量子アルゴリズムの解析と回路設計について述べる。
我々はブロックエンコード構造と回路実装を明示的に実装した量子アルゴリズムを実装した。
我々は、対流拡散方程式、不均一熱方程式、クライン=ゴルドン方程式に関する古典的な数値実験を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:48:53 GMT)
Training a Predictive Coding Network on ImageNet using Equilibrium Propagation [4.6] そこで我々は, EP の集中型変種と PCN の新たな平衡スキームを組み合わせた PCN の EP ベーストレーニング手法を開発した。
私たちの知る限り、これはImageNetスケールでのPCNとEPベースのトレーニングの初めての実演です。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:52:29 GMT)
FLIPS: Instance-Fingerprinting for LLMs via Pseudo-random Sequences [4.4] 我々は,同一の大規模言語モデルの構成を区別するレギュレータ指向のパラダイムであるインスタンスレベルのフィンガープリントを導入する。
提案手法FLIPSは237モデルインスタンスで96%(クローズドセット)、90%(オープンセット)の識別精度に達するために生成したバイナリランダムシーケンスのバイアスを利用する。
これは、インスタンスレベルの指紋認証が規制に必要であり、事実上実現可能であることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:39:50 GMT)
Nonlocal Mean Field Schrödinger Bridge with Learned Interactions [4.3] この研究は、粒子系を相互作用する平均場拡張である平均場シュルディンガー橋について考察する。
ニューラルネットワークサロゲートとの非局所的な相互作用を近似することで、このボトルネックに対処する。
結果として生じる4段階交互アルゴリズムは、推論時の人口規模において、ステップごとのコストを2次から線形に削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:30:46 GMT)
A Training-Free Mixture-of-Agents Framework for Multi-Document Summarization using LLMs and Knowledge Graphs [4.3] 文書要約(MDS)は,テキストデータの集合から重要な情報を抽出する上で重要な役割を担っている。
既存のアプローチは、複雑なドキュメント間の関係を捉えるのに苦労することが多く、大量のラベル付きデータを教師付きトレーニングに頼り、ドメインや言語をまたいだ限定的な一般化を示す。
本稿では,大規模言語モデル(LLM)と知識グラフの相補的長所を利用するMDSのための学習自由混合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:39:07 GMT)
Overview of the EReL@MIR 2025 Multimodal Document Retrieval Challenge (Track 1) [4.2] MIR Challengeは、Web Conference 2025と共同で、最初のEReL@MIRワークショップで開催された。
参加者には、2つの補完的な体制を扱うエンフィングル検索システムの構築を依頼した。
本報告では,課題設計,データセット,評価プロトコルについて述べる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:39:32 GMT)
Demonstration of a Spherical Penning Trap for Single Electrons [4.2] 球状ペニングトラップは、よく分離されたクリーンなマイクロ波共鳴を持つ。
球状ペニングトラップにおける単一電子トラップを実演し、そのマイクロ波共鳴構造を特徴付ける。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:34:04 GMT)
Agentic Generation and Evolution of Knowledge Models [4.2] TrustModelは、生きた知識モデルのエージェント生成と進化のためのビジョンである。
TrustModelは3つのエージェントサブシステムで構成されている。
モデルベーステストにおいてTrustModelをどのようにインスタンス化できるかを示し、他のMDEアクティビティをサポートする可能性について議論する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:49:23 GMT)
Full Extractors for Logical Processing in Hypergraph Product Codes [4.1] 量子低密度パリティチェック(QLDPC)符号は、実用的な低オーバーヘッド量子メモリの候補である。
コードブロック上の任意の論理的パウリ演算子を測定することができる手術システムを構築した。
距離10HGP符号に対して、回路レベルのノイズシミュレーションは、物理誤差率0.1%で約10-6$の論理的測定誤差率を得る。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:25:18 GMT)
On the saturated cases of the distillability conjecture [4.1] 等式は行列に$A$と$B$を2対2のブロック対角線に強制することを示す。
また、同定された飽和点が制約多様体上の目的関数の臨界点であることも証明する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:29:10 GMT)
Synthetic Hallucinations, Real Gains: Hard Negatives from Frontier Models for FIM Hallucination Mitigation [4.1] オートコンプリートを動かす小さなオープンソースコードモデルでは、Fill-in-the-Middle(FIM)の補完が出力される。
そこで我々は,フロンティア符号モデルを用いて,強陰性として可塑性/反極性補完を合成する,実行自由な代替案を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:15:50 GMT)
What Do Students Learn? A Feature-Level Analysis of Dark Knowledge [4.1] コンフュージョン蒸留(Confusion Distillation, CD)は、モデル自体の進化する混乱パターンをダイナミックなソフトターゲットとして活用する教師なしの自己蒸留法である。
CD は CIFAR-100 の ResNet-34 と ResNet-50 の競合性能を達成し、CS-KD や PS-KD といった既存の自己蒸留法よりも 1.2% 向上した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:38:18 GMT)
Can AI Review Improve Paper Drafting? An Empirical Study on 20 Computer Architecture Submissions [4.0] 我々は、AIレビューが人間のレビューとどのように一致しているかを明らかにするために、さまざまなレベルの提出系統を持つ20のコンピュータアーキテクチャー論文を調査する。
このケーススタディを実行するために、Web UI統合ツールであるemphAI-Paper-Reviewを構築し、ドラフトペーパーの構造化AIレビューを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:07:26 GMT)
Quantum-Classical Equivalence for AND-Functions [4.0] 量子通信複雑性の大きな問題は、量子プロトコルが古典的プロトコルよりも指数関数的に効率的であるかどうかである。
各ブール関数$f$に対して、有界エラー量子および古典的通信複雑性は決定論的に関連していることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:10:16 GMT)
A Negative Result on Cross-Model Activation Transfer in a Pythia Multi-Hop Setting [4.0] 最近の研究は、学習中に生成されたデータに隠された信号を通して言語モデルが行動特性を伝達できることを示している。
ある言語モデルは、隠れたアクティベーションを翻訳して注入することによって、推論時に有用な中間推論状態を他の言語に伝達できるだろうか?
我々は、制御されたPythia-160MからPythia-410Mのマルチホップ推論設定でこの問題を検証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:46:01 GMT)
Self-Certifying Transport MCMC via Dual Spectral-Gap Certificates [3.9] CerT-MCMCは、マルコフ・チェーンのモンテカルロに厳格な収束証明書を付与するフレームワークである。
被覆証明書は有限サンプル被覆引数による完全な提案支援に重み比の振動を束縛する。
量子核証明書は、振動が1次元の経験的量子化によって制御される高確率残基に注意を向ける。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:21:49 GMT)
ZX-Calculus:Trace-Indexed Dependent Types and Epistemic Semantics [3.8] 我々は Martin-Lof Dependent Type (MLTT) の保守的な拡張である ZX-Calculus (Knowledge Evolution Calculus) を提案する。
これは、トレースインデクシングされたタイプ、プレシーフ非モノトーン意味論、建設的なAGM信条修正を統合している。
Coq の機械化は論文に付随する(34の完全証明、0は2つの中心的な結果を認めている)。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:51:41 GMT)
SplitAdapter: Load-Aware Humanoid Loco-Manipulation via Factorized Adaptation [3.8] textbfSplitAdapter: Factorized Adaptationによる負荷対応ヒューマノイドロコマニピュレーションを提案する。
SplitAdapterは、事前訓練されたボックス操作ポリシーを凍結し、オブジェクト/ロードと動的に認識されるコンテキストエンコーダで拡張する。
sim-to-sim実験と実世界展開において、SplitAdapterは、基本ポリシーと世界モデルのFiLMベースラインを2ドル、4ドル、6ドルkg、ピックアップ/配置高さ0ドル、30ドル、60ドルcmでフルタスクの成功を改善する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:10:49 GMT)
Selecting haptic guidance models in teleoperation: guidelines from a comparative user study [3.8] 遠隔操作におけるハプティックガイダンスは、力フィードバックを通じてオペレータのパフォーマンスを向上させる。
本稿では,タスク,環境,操作者を考慮した最も適切なモデルを選択するためのガイドラインを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:22:10 GMT)
Enhancing Operational Safety via Agentic Dialogue Hazard Identification Analysis [3.8] HAZDIALは,構造化エージェント対話・マルチエージェント・マルチターンインタラクションがNLPに基づくハザード識別の質を向上させるかどうかを調査するフレームワークである。
この研究は対話システム、マルチエージェント推論、AI安全性の交差点を前進させ、対話駆動型ハザード分析の実証的な証拠を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:54:51 GMT)
Selective Token-Level Cryptographic Redaction for Privacy-Preserving Clinical Deployment of Large Language Models [3.8] 適応言語分解(Healthcare Encryption and Redaction)について紹介する。
HERALDは、機密トークンのみを暗号化することで、このバランスを達成するために設計されたトークンレベルの暗号リアクションフレームワークである。
HERALDはクライアント側で完全に動作し、機密性の高いコンテンツがストレージ、送信、処理を通して暗号化されることを保証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:40:56 GMT)
Triple exceptional point with unitary paths of unfolding in a three-site fermionic Swanson-like model [3.8] 一般的なボソニックスワンソンモデルのフェルミオン三サイト一般化について検討した。
正確な、数値誤差非依存の可溶性は、別の、避けられた、偽のエネルギーレベルの交差のために必須である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:39:44 GMT)
Brief Announcement: Generative Markov Model for Distributed Computing Systems [3.8] 本稿では,構造化システム状態上で分解された生成マルコフモデルとして,分散コンピューティングシステムをモデル化するための一般的なフレームワークを提案する。
これにより、他の難解なシステム状態に対するシミュレーション、推論、およびポリシー学習を可能にするトラクタブルモデルが得られる。
我々は、協調AI推論のケーススタディを通じて、当社のフレームワークを実証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:50:58 GMT)
Validation-Gated Multi-Agent Governance for Online Adaptation of Thermal-Hydraulic Surrogate Models under Operating-Regime Shift [3.7] 本研究では,実験熱水循環データに対するガード付き連続適応フレームワークを開発した。
MA-Fullモードでは、ロール分離されたマルチエージェント・カウンシルが評価ストリームの各ステップをレビューし、最低平均誤差5.72、35.8%を達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:31:48 GMT)
FinStressTS: A Parametric Synthetic Benchmark for Time-Series Forecasting in Finance [3.5] FinStressTSは、モデル動作と制御された構造的原因をリンクするメカニズム対応のベンチマークである。
信号対雑音比の低さ、潜伏要因、重尾、政権交代、跳躍など、財務予測は困難である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:41:50 GMT)
CADET: A Modular Platform for Evaluating Distributed Cooperative Autonomy in Connected Autonomous Vehicles [3.5] CADETは、分散協調自律システムの体系的かつ再現可能な評価のためのモジュールプラットフォームである。
分散デプロイメントの選択は安全性を形作っており、V2Vインテントパケットはクラウドベースの認識よりも優れており、RSUは同時要求によってオーバーロードされるまで安全性を維持する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:13:13 GMT)
Unveiling the Structure of Do-Calculus Reasoning via Derivation Graphs [3.4] Do-calculusは、介入クエリの一般的な推論システムを定義する。
本稿では、do-calculusルールの適用方法と組み合わせ方法を示す導出グラフを紹介する。
等価因果クエリに識別アルゴリズムを適用すると、複数の有効な推定値が生成されることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:40:39 GMT)
A Fast Screening Approach for High-dimensional Outcomes and High-dimensional Predictors [3.4] 本稿では,新しいスクリーニングフレームワークであるグラフ独立デュアルスクリーニング(GIDS)を提案し,応答変数と予測器の次元性を同時に低減する。
我々は、ゲノムワイド865,353DNAメチル化と49,386転写因子との相互作用を解析して、アルツハイマー病神経画像イニシアチブデータセットにGIDSを適用した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:49:02 GMT)
Plateau That Never Comes: When Efficiency Claims in Datacenters and AI Become Greenwashing [3.4] 生成AIによるデータセンタの拡張は、サステナビリティとの互換性がますます高まっている。
しかし、これらの主張は、絶対的な電気、水、材料、廃棄物、そしてコミュニティが直面する負担が減少していることを示さないことが多い。
これらの持続的成長の物語は、持続可能性の主張に効率改善を使用すると、グリーンウォッシングとして機能し始めます。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:01:40 GMT)
A Training-Efficient Transformer-Based Anti-Spoofing Network for Logical Access in ASVspoof 5 [3.4] 本稿では,ASVspoof 5 Track 1のクローズド条件に着目し,標準的なクロスエントロピートレーニングはハードトライアルに十分な注意を払わない可能性がある。
本稿では,トランスフォーマーをベースとした集中型注意型ランキングネットワークTFPARNを提案する。
同じプロトコルで再実装されたAASISTとRawNet2ベースラインと比較して、TFPARNは、minDCFが0.2430、EERが12.52%である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:38:12 GMT)
AI-Generated Traces for Novice Programmers: Learning Effects and Learner Differences in a Multi-Institutional Study [3.4] GAT(Generated Animated Traces)を提案する。
GATは、ソースコード、実行状態、概念的なアナロジーをコーディネートするAI生成のアナログベースのナレーションアニメーションである。
即時学習のパフォーマンスと経験、コース終了のエンゲージメント、試験パフォーマンスを測定します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:51:27 GMT)
Central Description Length (CDL) Clustering Validation Index [3.4] クラスタリング検証指標(CVI)は、候補クラスタリングのランク付けのための内部スコアを提供する。
一般的なCVIはユークリッドコンパクト性と分離項から作られている。
本稿では,CDL(Central Description Length)クラスタリング検証指標を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:47:09 GMT)
Collision Resistance of Single-Layer Neural Nets [3.3] 単層二層ニューラルネットワークにおける衝突のアルゴリズム的複雑性について検討する。
本研究は, 衝突抵抗の厳密な基準として, オーバーラップギャップ特性を用いた最初の研究である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:52:45 GMT)
CoralBay: A Self-Supervised CT Foundation Model [3.2] 自己教師付き学習は2次元の自然画像に対する大規模な事前学習を可能にし、タスク間で効果的に伝達する汎用的な視覚表現を生み出した。
階層型3Dスウィンバックボーンを用いてDINOを拡張し,マルチスケール機能に自己蒸留を適用するフレームワークであるCoralBayを紹介する。
結果として、CoralBayは、様々な解剖学的目標に対して強い、一貫したパフォーマンスを示す、幅広い下流の放射線学的タスクに効果的に移行する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:51:14 GMT)
A 3D Isovist World Model -- Revealing a City's Unseen Geometry and Its Emergent Cross-City Signature [3.2] 都市を航行するエージェントは、周囲がどう変化するかを予測する世界モデルに頼っている。
我々は,過去のアイソビストと運動行動の短い歴史から,次のアイソビストを予測する具体的世界モデルを導入する。
マンハッタンとパリで訓練された1つの都市ブラインドモデルは、都市横断的な空間的シグネチャを発達させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:11:30 GMT)
Seg2Track++: Probabilistic Track Validation and Data Association for Multi-Object Tracking and Segmentation [3.1] この作業では、SAM2と新しいトラック管理モジュールとセグメンテーションを統合してゼロショットMOTSを実行するフレームワークであるSeg2Track++を導入する。
KITTI MOTS実験の結果, 精度向上, 偽陽性伝播の低減, 微調整を伴わないロバストトラック管理が得られた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:43:00 GMT)
Learning to See via Epiretinal Implant Stimulation in silico with Model-Based Deep Reinforcement Learning [3.1] 我々は、画像を形成するために等方性と異方性の形状を組み立てることを学ぶ深層強化学習エージェントを訓練する。
本研究は, 異なる仮想患者において, ナイーブ法と比較して, より分かりやすい画像を生成することができることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:03:43 GMT)
Recover-LoRA for Aggressive Quantization: Reclaiming Accuracy in 2-Bit Language Models via Low-Rank Adaptation with Knowledge Distillation on Synthetic Data [3.1] Recover-LoRAはデータフリーの精度回復法で、もともとは一般モデルの重み劣化のために開発された。
Recover-LoRAはゲートとアップ層の2ビット量子化から失われる精度を回復できることを示す。
この結果から,Recover-LoRAは,運用環境におけるアグレッシブ・ウェイト・圧縮のための実用的ポスト量子化精度回復ツールであることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:37:56 GMT)
JudgmentBench: Comparing Rubric and Preference Evaluation for Quality Assessment [3.0] JudgmentBenchは、実世界の30の法的タスクのベンチマークで、1,539のルーリックスコアと1,530のペアの選好判断を組み合わせたものです。
アノテーションは、両方の監視信号が同じ専門家から引き出される、高度なドメインで利用可能な最初のデータセットである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:06:08 GMT)
PrimeSVT: An Automated Memory-aware Pruning Framework with Prioritized Compression Policy for Spiking Vision Transformers [3.0] Spiking Vision Transformers (SViT)は、モデル圧縮の必要性を強調しながら、組み込み実装を妨げている。
本稿では,事前学習したSViTモデル上でメモリ認識型構造化プルーニングを実行する新しいフレームワークであるPrimeSVTを提案する。
実験の結果、PrimeSVTは自動単発プルーニングにより26.68%のメモリを節約した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:18:00 GMT)
PSViT: A Methodology for Structurally Pruning Spiking Vision Transformers [3.0] Spiking Vision Transformer (SViT)モデルは、視覚ベースのタスクを解決するために低消費電力のViTモデルを約束している。
SViTモデル上で構造化プルーニングを行う新しい手法であるPSViTを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:18:57 GMT)
Piston control in a two-ion quantum device [2.9] 運動を軸に限定した2イオン量子デバイスにおけるピストン制御方式を提案する。
1つのイオンは、他のイオンとのクーロン相互作用によって駆動される「古典的な」ピストンの役割を担っている。
提案した制御スキームは、微視的量子デバイスにおける制御ピストンダイナミクスへの有用な経路を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:05:54 GMT)
Local and Global Contraction Principles for MCMC Mixing [2.9] 我々はモンテカルロアルゴリズムの混合時間境界を証明するための収縮に基づくフレームワークを開発する。
ランゲヴィン・ランゲヴィンのコンパクト凸領域に対して、明示的な大域的収縮係数を示す。
有限モーメントが存在しない場合、 somep 条件に対して $mathbb E_q[wp]infty$ が $p1$ であるときに、鋭いモーメントベースの収束率を回復する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:16:52 GMT)
Forget Attention: Importance-Aware Attention Is All You Need [2.9] 本稿では,SSMに基づく重要用語をアテンションスコア内に直接付加するSISA(SSM-Informed Softmax Attention)を提案する。
SISAはステップ1KからNIAHを100%達成し、Transformerの検索収束の7倍高速である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:51:37 GMT)
Backdoor Unlearning Generalization: A Path Toward the Removal of Unknown Triggers in LLMs [2.9] 非学習によるバックドア中立化は、バックドア全体にわたって一般化されていることを示す。
本研究は, プレトレーニングや継続プレトレーニングにより, バックドアを注入した3種類のモデル家族を対象に, この現象について検討した。
筆者らは, コントロールされたバックドアを故意に注入し, 取り除くことにより, LLMの安全性を向上する新たな方向性を示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:38:12 GMT)
DxPTA: An Architecture Design Space Exploration with Optical Dataflow-guided Strategy for HW/SW Co-Design of Photonic Transformer Accelerators [2.8] トランスフォーマーベースのネットワークは、最先端のパフォーマンスを備えた著名なAIモデルとして登場した。
本稿では,PTAアーキテクチャの効率的なハードウェア/ソフトウェア共同設計を実現するための新しい設計空間探索手法であるDxPTAを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:57:12 GMT)
Does Language Shift Break Medical Vision-Language Models? Indonesian Radiology Visual Question Answering Case Study [2.8] 本稿ではインドネシアのVQA-RADを応用したIndoRad-VQAを紹介する。
一般目的, 東南アジア多言語, 医療特化VLMを英語で評価し, 設定を推し進めた。
以上の結果から,英語の医療用VQAベンチマークにおける強い評価は,必ずしもインドネシアの臨床的文脈におけるロバストな行動に結びつくとは限らないことが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:14:27 GMT)
Wasserstein Contraction of Coordinate Ascent Variational Inference [2.8] 座標アセント変分推定アルゴリズムのワッサーシュタイン距離の縮約について検討する。
これは、固定点における輸送情報の不等式と機能的滑らかさ条件の下で成り立つ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:51:10 GMT)
A Locally Deployed RAG-Based Academic Advising System for Course Selection [2.8] 本稿では,Syllabus情報に基づくRAGベースの学術アドバイスシステムを提案する。
大規模言語モデルと構造化シラバスデータからの検索を組み合わせることで、コース選択、前提条件理解、パーソナライズされた学習計画を支援するように設計されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:41:51 GMT)
Merit or networks? What decides where research is published [2.7] 我々は,6,208件の経済論文に散在するジャーナル配置の5インプット生産関数を,テキストレガシブルなアイデア品質スコアを用いて推定する。
接続された著者はより高いスコアの論文を書き、同じスコアで論文がより良くなる傾向にある。
その結果は、どちらを選ぶかよりもむしろ、科学の出版方法に関する長所とネットワークの説明をネストする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:18:03 GMT)
Quantum String Interactions Revealed by Full Counting Statistics [2.7] 量子弦の相互作用は、量子多体物理学における拡張対象の基本的な問題である。
ここでは、この非局所性はフルカウント統計(FCS)によって自然に捉えられることを示す。
実効ポテンシャルは、$lnE(r)sim -2 r2/(12 S_ell)$というエンタングル制御形式を持ち、量子弦の2つのハーフの間のエンタングルエントロピーである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:00:01 GMT)
Attribution via Distributional Paths for Information Revelation [2.7] Reveal-IGは、入力空間から構造化されたプローブ分布の空間への経路属性をリフトする。
安定して署名された属性を生成します - 残りの部分で競争力を維持しながら、アトリビューションサインを使用するメトリクスにつながります。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:50:28 GMT)
NeuroArmor: Safe-Variant-Guided Representation Consistency for Selective Re-Anchoring in Jailbreak Defense [2.7] 我々は,ローカルな安全基準として,プロンプト固有の安全な変種を利用する,ホワイトボックスのランタイムディフェンスであるNeuroArmorを提案する。
NeuroArmorは、悪意のある攻撃成功率(ASR)を41.56%から1.57%に下げ、共有良性プールにおける良性偽陽性率(FPR)を30.26%から22.05%に下げる。
全体として、NeuroArmorは、プロンプト固有の一貫性チェック、ルーティング、選択的介入を組み合わせることで、ジェイルブレイク防御のためのより効果的な実行戦略を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:01:50 GMT)
Torsion-induced gauge structure in curved quantum waveguides [2.7] 薄層量子化フレームワーク内の空間曲線に制限された粒子の量子力学について検討する。
この有効ゲージポテンシャルは曲線の局所的ねじれによって直接決定されることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:45:28 GMT)
Testing LLM Arithmetic Reasoning Generalization with Automatic Numeric-Remapping Attacks [2.7] 算術語問題に対する数値再マッピング攻撃を自動生成するアルゴリズムを提案する。
我々は,GSM8K,MAWPS,MultiArith上でDeepSeek-R1(70B),Gemma4(31B),GPT-OSS(120B)を評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:09:44 GMT)
Re-Evaluating Continual Learning with Few-Shot Adaptation [2.6] 連続的な学習方法は、一連のタスクに基づいて訓練された機械学習モデルの安定性と可塑性を最大化することを目的としている。
安定性の標準的な尺度(すなわち、忘れること)は、以前に学習されたタスクにおけるモデルの0ショットのパフォーマンスであり、最も最近学習されたタスクにおける塑性である。
連続学習システムの安定性と可塑性をより包括的に評価する手段として,数ショット評価を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:23:09 GMT)
Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels [2.6] Grimlockはエージェントガードで、エージェントのコードをそのまま残しながら、信頼の執行をサンドボックスの基板に移す。
異質なマルチクラウド環境をまたいだ、透過的で監査可能で、スコープバウンドなエージェント対エージェント通信への道を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:44:21 GMT)
The Loss Is Not Enough: Sampling Conditions and Inductive Bias in Contrastive Representation Learning [2.6] 多様性条件を定式化する測度理論の枠組みを開発する。
標準のフルサポートvon Mises-Fisher設定が多様性条件の満足度を示すことを示す。
本研究は, 比較表現学習において, サンプリング機構と帰納バイアスがどのように相互作用するかを明らかにするものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:08:30 GMT)
Seeing Fast and Slow: Bimodal 3D Scene Graphs for Open-set Tasks [2.6] BiMoSGは、オープンセットタスクのためのバイモーダルな3Dシーングラフ生成アプローチである。
提案する3次元シーングラフ生成手法は,オープンソースの最先端手法よりもはるかに高速であることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:08:50 GMT)
Signals and Spoils: Speculative Oracle Extractable Value in the Era of Cross-Chain Interoperability [2.4] 我々は, 最大抽出可能価値 (MEV) の一形態である投機的Oracle抽出可能価値 (OEV) について検討する。
本研究では,野生における投機的液状化の検出手法を提案し,それをArbitrum,Base,Optimismに応用する。
独立DONは、ほぼ同時にほぼ同一のオフチェーン価格データを消費するが、異なるタイミングで更新を発行し、統計的に予測可能なクロスチェーンエクスプロイトウィンドウを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:19:51 GMT)
RADE: Random Add-Drop Edge as a Regularizer [2.4] グラフニューラルネットワーク(GNN)は、長距離情報の過度な適合と過度な監視に悩まされる。
我々は,過剰適合とオーバーシャッシングの両方に同時に対処するエッジを共同でドロップし,付加するグラフ拡張手法であるRandom Add-Drop Edge (RADE)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:10:07 GMT)
ConTraIRL: Factorized Contrastive Abstractions for Transferable IRL [2.4] 逆強化学習(IRL)における逆転は、ポリシーが環境力学とタスク目標の見当たらない組み合わせに一般化する必要がある場合、信頼できない。
本稿では,これら2因子の非結合型潜在表現を学習することにより,構成的報酬伝達を可能にするフレームワークであるConTraIRL(Facterized Contrastive Abstractions for Transferable IRL)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:47:19 GMT)
UnsOcc: 3D Semantic Occupancy Prediction in Unstructured Scene via Rendering Fusion [2.4] UnsOccは、非構造化環境における堅牢性を改善するマルチモーダルな3Dセマンティック占有予測フレームワークである。
その中核となるのはレンダリングベースの融合モジュールRenderFusionで、これはクロスモーダルな特徴アライメントを強化する。
提案手法は既存の最先端手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:50:14 GMT)
Diagnosing Knowledge Gaps in LLM Tool Use: An Agentic Benchmark for Novel API Acquisition [2.4] NovelAPIBenchは、任意のベースモデルとターゲットライブラリの動的ベンチマークである。
探索によって注入された知識とパラメトリック適応によって内部化された知識を比較した。
Retrievalは揮発性のAPIコンテンツを提供し、チューニングは手続き統合を改善する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:46:04 GMT)
Detecting Aimbot Cheaters in MOGs [2.3] 本稿では,視覚的目標ボット不正行為者の存在を緩和するために,敵パッチを配置する新たな積極的な防衛戦略を提案する。
我々のアプローチは、不正行為者のオブジェクトモデルを意図的にトリガーし、直接検出可能か、またはビューポートのパッチフラッディングを通じて不正行為者にとってプレイ不可能なゲームをレンダリングすることに焦点を当てている。
異なるパッチサイズの有効性、異なるスクリーン解像度に対するパッチのスケーラビリティ、多様な視覚的目標ボットの不正設定に対する有効性、およびパッチ転送可能性を評価するための様々なYOLOモデルについて検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:44:55 GMT)
TriEval: A Resource-Efficient Pipeline for LLM Bias, Toxicity, and Truthfulness Assessment [2.3] TriEvalは、機械学習モデルを評価するパイプラインである。
オープンソースモデルとクローズドモデルの両方に対応している。
Llama 3 8B、Mistral 7B、Gemma 2 9B、Claude Haikuの4つのモデルでテストされている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:21:38 GMT)
ACAT: A Collaborative Platform for Efficient Aspect-Based Sentiment Dataset Annotation [2.3] ACAT(Aspect-based sentiment analysis Collaborative Tool)は、4つのABSAシナリオをサポートするWebベースのプラットフォームである。
コアコントリビューションは、共同アノテーションを調整するETL(Extract, Transform, Load)パイプラインの自動化だ。
ACATは、すべてのタスクで31.58秒、生のIAAが0.78から0.86までの平均的なアノテーションタイムを達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:16:54 GMT)
Static and Dynamic Representations for Tactile Contact-Angle Estimation with Event-Based Sensors [2.3] イベントベースの触覚センシングは、コンタクトリッチなロボットインタラクションのための低遅延信号取得を提供する。
本稿では,イベントベース触覚センサ(NeuroTac)からのイベントストリームを用いた接触角推定について検討する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:08:49 GMT)
Re-Ranking Through an Attribution Lens for Citation Quality in Legal QA [2.3] クロスエンコーダは、連続的な摂動に基づく帰属スコアに基づいて、生成前に経路を再ランクするよう訓練した。
異なるモデルで独立に訓練された2つのリランカーは、生の帰属契約を超えて収束する。
その結果、摂動に基づく帰属は、引用認識検索のための実用的、モデルに依存しない訓練信号を提供することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:48:33 GMT)
PHASOR: Phase-Anchored Universal Action Representations for Humanoid Embodiments [2.2] 既存の方法は、アクションラテントを第一級表現ではなくタスク固有の中間体として扱う。
我々は、アクション埋め込み空間自体を第一級の設計ターゲットとして位置づけ、表現品質から下流のポリシー品質を生じさせる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:44:37 GMT)
Macroscopic Spin GHZ States with a Levitated Ferromagnet [2.2] 本研究は、浮遊強磁性体を用いたマクロスピンGHZ状態の生成に対するトップダウンアプローチを提案する。
我々は、量子フィッシャー情報のハイゼンベルクスケーリングが達成可能であることを示すことによって、結果のマクロスピン重ね合わせ状態の計量的利点を定量化する。
また, スピン依存波動関数崩壊モデル実験における浮遊円筒型強磁性体のマクロスピン重ね合わせ状態の有用性についても検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:00:39 GMT)
Neural Network Verification using Partial Multi-Neuron Relaxation [2.2] 部分的多ニューロン緩和を特徴とする中層的アプローチを提案する。
我々は、ニューロンの選択と多ニューロン境界に対する境界超平面の最適化のための既存の分岐を構築した。
本実験は,ニューラルネットワーク検証技術の可能性を示すものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:20:50 GMT)
AgenticDiffusion: Agentic Diffusion-based Path Planning for Vision-Based UAV Navigation [2.2] 屋内UAVナビゲーションは、視野の限られた観測下での効率的な探索、シーン理解、信頼性の高い軌道実行を必要とする。
本稿では,多視点UAVナビゲーションフレームワークであるAgenticDiffusionを提案する。
このフレームワークは、適応的な視点選択、多段階のミッション実行、長距離ナビゲーション、安全な着陸場所選択を含む4つの現実のUAVナビゲーションシナリオで検証された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:18:35 GMT)
Leveraging BART to Assess CS1 C++ Programming Assignments using Rubric-based Criteria [2.2] 本稿では,C++プログラムの代入を自動グレーディングするための変換器モデルのルーリック認識,マルチタスク微調整について検討する。
マルチセメスターCS1データを用いて、学生の応募は数値スコア、レターグレードバケット、代入ルーリックとペアリングされ、前処理され、トランスフォーマー入力のための統一シーケンスに変換される。
LoRA適応のBARTエンコーダデコーダは、数値グレードとグレードバケットを共同で予測し、予測されたグレードと経験的なグレードの分布を調整するために、分布マッチング項を付加するように訓練される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:57:14 GMT)
Hybrid Dynamics Modeling for a Flexible 2-DoF Robotic Arm [2.2] 本稿では、フレキシブルリンク2-DoFロボットアームの力学をモデル化するための3つのアプローチについて検討する。
2つの物理情報モデルが剛体力学(RBD)とガウス混合モデル(GMM)を組み合わせて残差モデル誤差と結合柔軟性を捉える。
キネマティクスに基づく回帰モデルは、純粋にデータ駆動ベースラインとして機能する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:12:20 GMT)
Calibrating Urban Traffic Simulation from Sparse Road Observations via Genetic Optimization [2.1] 現実的な都市交通シミュレーションは,最小限の現実世界観測により実現可能であることを示す。
この研究は、現実的な都市交通シミュレーションは、最小の現実世界の観測によって達成できることを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:04:01 GMT)
Link Prediction or Perdition: the Seeds of Instability in Knowledge Graph Embeddings [2.1] 埋め込みモデル(KGEMs)は知識グラフの完全化のための主要なリンク予測手法である。
標準評価プロトコルは、MRRやHits@$K$のようなランクベースのメトリクスを強調するが、通常、結果の安定性に対するランダムシードの影響を見落としている。
高性能モデルでは, 3次元空間と高変数空間において, 分岐予測が実際に発生する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:13:50 GMT)
Quantum simulations of ultrafast optical spectroscopy of semiconductors on digital quantum computers in the semi-classical approximation [2.1] 半導体材料の超高速光分光のためのディジタル量子シミュレーションフレームワークを提案する。
このフレームワークはブリルアンゾーンの離散化と第二量子化形式に基づいており、古典シミュレーションの量子代替として設計されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:52:23 GMT)
E2LLM: Towards Efficient LLM Serving in Heterogeneous Edge/Fog Environments [2.0] 大規模言語モデル(LLM)は現代のアプリケーションにとって不可欠なものとなっているが、その展開は依然として困難である。
E2LLMは、リソース制限設定において、効率的なLLMデプロイメントを実現するために設計されたフレームワークである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:23:28 GMT)
Reading the Finetuning Prior: Verbatim Content Recovery via Contrastive Decoding Diffing [2.0] Contrastive Decoding Diffing (CDD) は、出力レベルのロジット分布のみを演算し、ウェイトアクセスがなく、層選択がなく、モデルごとのチューニングもできないモデル拡散法である。
単一のデフォルト設定は、4つのアーキテクチャにまたがって組み込まれた事実を冗長に復元する。
我々は、実際のドメインの微調整設定を検証し、単一データセット以外のすべてのCoT変種に対してほぼ完全な回復を実現し、混合データセット設定で4つのデータセット全てを正しく識別する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:10:15 GMT)
Distribution-Free Risk-Aware Planning and Control Under Uncertainty Using Conformal Spectral Risk Control [2.0] 本稿では,リスク対応モデル予測制御(RA-MPC)フレームワークを提案する。
予測セットをMPCフレームワークに組み込むことで、不確実な不確実性であってもスペクトルリスク制約満足度の観点から統計的安全性が保証されることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:07:56 GMT)
CaloTrilogy: Toward a Breakthrough in One-Step, End-to-End, Physics-Guided Shower Generation for Modern Calorimeters [1.9] フローマッチングと拡散に基づく生成モデルは、高次元高速シミュレーションにおける主要なアプローチとなっている。
速度, シャワー品質, 物理忠実度とのバランスを改善する統一的な枠組みを導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:27:19 GMT)
Lingo_Research_Group at SemEval-2026 Task 9: Evaluating Prompt Variants for Polarization Detection [1.9] 本稿では,SemEval-2026 Task 9: Multilingual Text Classification Challenge - Polarization Detectionを提案する。
1)二分極検出、(2)分極型分類、(3)分極型識別の3つのサブタスクをカバーする。
我々は,用語の明確さにおいて異なる12種類の設計プロンプトを考慮し,短い設計プロンプトの研究の体系的アプローチを採用する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:41:54 GMT)
Graph Regularized Non-negative Reduced Biquaternion Matrix Factorization for Color Image Recognition [1.9] カラー画像認識のためのグラフ正規化非負の還元二元数行列分解モデルを提案する。
提案モデルでは, グラフラプラシアン正則化器を還元二元数係数行列に組み込んで, 学習した特徴空間に類似した表現を持つことを奨励する。
実験結果から,提案したGNRBMFモデルにより,いくつかのテスト環境での認識性能が向上することが確認された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:44:28 GMT)
Forward-Assisted Purification: A Spatiotemporal Framework Beyond Conventional Limits [1.9] 我々は、浄化を動的タスクとして再考し、ノイズプロセスにまたがる介入を分散するフレームワークを導入する。
これにより、既存のアプローチにはアクセスできない運用能力が明らかになり、達成可能なパフォーマンスを向上する前方支援のパーフィケーションがもたらされる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:53:21 GMT)
SBP-Net: Learning Thin Structure Reconstruction with Sliding-Box Projections [1.9] 細い3D構造を再構築することは、その空間性、スケールの変化、複雑な幾何学のために困難である。
本研究では, 局所的な深度予測に基づく再構成手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:59:22 GMT)
Pinpoint: Grounded Worldwide Image Geolocation via Cross-Source Retrieval and Reranking [1.9] Pinpointは、インターネット写真とストリートビュー画像を組み合わせた、検索と参照のアーキテクチャです。
対照的な画像-GPS埋め込みは、Flickrの写真とストリートビューの画像の両方で訓練される。
注意に基づくリランカは、候補レベルの視覚的特徴とGPS機能と、近くの場所からのクロスソースな証拠を組み合わせることで、検索した候補を再スコアする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:44:58 GMT)
eMEM: A Hybrid Spatio-Temporal Memory System For Embodied Agents [1.8] 物理環境で動作するエンボディエージェントのためのハイブリッドグラフベースメモリシステムeMEMを提案する。
eMEMはこのギャップをマルチインデックスアーキテクチャ(構造化ストレージ用ITE、近傍セマンティックサーチ用hlib、空間クエリ用Rツリー)で埋める。
また,eMEM-Bench v1は,メモリ評価のためのProcTHOR-10Kシーン上で構築したベンチマークである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:22:12 GMT)
Effect of Demographic Bias on Skin Lesion Classification [1.7] ResNetを用いた畳み込みモデルを用いて皮膚病変分類の性能を評価する。
性に基づく分析は、性固有のトレーニングデータセットがモデルのパフォーマンスを最適化することを示している。
性別バイアスは主にデータ不均衡から生じるが、年齢バイアスは分布に関係なく若年層を常に好んでいる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:16:24 GMT)
FineGen: A VLM-based Multi-Agent Framework for Fine-Grained Image-Text Dataset Construction [1.7] FineGenは、自動データセット構築のためのVLMベースのMulti-Agentフレームワークである。
我々は,147,000以上の属性特異的な硬質負と,厳密な1:10の正負比を含む階層的データセットであるFineGen-100Kを構築した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:10:12 GMT)
Electromagnetic Navigation for Femoral Osteotomy Using High-Accuracy X-ray-to-CT Registration [1.7] 大腿骨骨切り術におけるEMTを用いたナビゲーションシステムについて検討した。
このシステムはCTベースの術前計画と1回C-armキャリブレーションと2枚の蛍光画像からの正確なX-ray-to-CT登録を併用する。
18例の人工大腿骨を用いた実用性評価では,EMT誘導は全角誤差においてフリーハンドの実行よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:53:03 GMT)
Rethinking Molecular Text Representations for LLMs: An Empirical Study [1.7] 大規模言語モデル (LLMs) は分子的タスクにますます使われているが、どの分子的表現を使うべきかは定かではない。
推論や非推論型を含む5つのモデルファミリーにわたる16のLSMをベンチマークする。
CMLが最高であり、次にMollJSON、InChI、そして標準SMILESが続く。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:45:41 GMT)
Trading Human Curation for Synthetic Augmentation in RLVR [1.7] 高品質な訓練タスクの供給は、強化学習における中心的なボトルネックである。
我々は、拡張されたタスクと人為的なタスクの間のコスト調整されたトレーディングレートを$_textcost$に定式化する。
追加のヒューマンオーサリングタスクのための拡張コンテンツの置換は、集約された一般化を保持します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:48:28 GMT)
ZK-Flex: A Flexible and Scalable Framework for Accelerating Zero-Knowledge Proofs [1.7] ZKPは、証明者がプライベートデータを公開することなく、計算正当性を検証することを可能にする。
証明生成は非常に計算集約的である。
ZK-Flexは、ZKPを加速するための柔軟なスケーラブルでハードウェア対応のフレームワークである。
5倍から11倍のスピードアップと3.8倍の面積効率を実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:30:04 GMT)
UtVAA: Ultra-tiny Vision Transformer with Affix Attention for Mobile Image Classification [1.7] UtVAAは、厳密な計算予算の下で効率的な視覚認識のために設計された超小型ビジョントランスフォーマーアーキテクチャである。
Affix Attentionブロックは、深度方向の局所的特徴抽出、線形自己注意、空間依存性モデリングのためのコーディネートアテンション、および軽量な第三次融合戦略を組み合わせた新しいアフィクスアテンションブロックを備えている。
拡張性のあるTiny、Medium、Largeで実装されており、最小モデルは204.67Kパラメータと53.95M FLOPを含む。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:53:35 GMT)
Disjoint or Overlapping? Inference Windowing for Reconstruction-Based Time Series Anomaly Detection [1.5] 本研究では,サブシーケンスが不整合ウィンドウとして処理されるか,重なり合うかを制御する推論ストライドの役割について検討する。
本稿では、TSB-ADベンチマーク上で、統一的なトレーニング、チューニング、およびマルチシード評価プロトコルを提案する。
重なり合うウィンドウは、平均的な相対的なゲインが+28%まで向上し、メソッドランキングを変更することができることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:42:30 GMT)
LLM Compression with Jointly Optimizing Architectural and Quantization choices [1.5] 大規模言語モデル(LLM)は、メモリと計算の要求が大きいため困難である。
我々は、空間全体を探索し、アーキテクチャ構成を共同で最適化する差別化可能なNASフレームワークを導入します。
我々のモデルは、逐次NAS-then-quantizationベースラインと同等の精度で最大1.4倍高速な推論を達成し、同じレイテンシで7つの推論タスクの平均精度を最大6%向上させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:57:28 GMT)
Post-Hoc Robustness for Model-Based Reinforcement Learning [1.4] 本研究は, 深部RL剤の加熱後強固化を推察時に導入する。
目標は、ニューラルネットワークのさらなるトレーニングを必要とせずに、堅牢性を改善することだ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:43:13 GMT)
Can I Take Another Dose? Evaluating LLM Decision-Making Under Temporal Uncertainty in OTC Dosing QA [1.4] 提案するDOSEBENCHは,81個のOCCドッキングシナリオのベンチマークである。
我々は、意思決定の正確性、一貫性、説明の妥当性、障害タイプ、信頼性関連信号の指標を用いて、繰り返し実行中の4つのLCMを評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:30:15 GMT)
Privacy-Preserving High-Resolution Image Gradient Computation Based on Fully Homomorphic Encryption [1.3] ホモモルフィック暗号化(HE)は、プライバシを保存する画像処理のコアメソッドとして登場した。
本稿では,大規模画像のための多文プライバシ保存フレームワークを提案し,半正直なモデルの下での効率的な画像の暗号化と計算を実現する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:32:15 GMT)
AI Model Extraction Attacks: Bypassing Single-Client Assumptions in Defenses [1.2] モデル抽出攻撃(MEA)は、敵がプロプライエタリなモデルを複製し、保護された情報を侵害し、オフラインの敵攻撃に備えることを可能にする。
現在の防衛戦略は、攻撃が孤立したアイデンティティに由来するという暗黙の仮定である、Single Client Assumption (SCA) に大きく依存している。
我々は、再現可能なモデルステアリング研究のためにCerberusAIと呼ばれるモジュラーでオープンソースなフレームワークを導入し、それを分散攻撃シナリオをシミュレートするために使用します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:25:29 GMT)
Chatbots Output Meaningful (but Problematic) Language [1.2] ほとんどの一般ユーザーとAIエンジニアは、答えは自明に「はい」だと考えている。
しかし、多くの認知科学者、言語学者、および言語哲学者は、言語と意味の支配的な意図主義的な説明は反対の結論をもたらすと主張している。
そのため、一般ユーザーの直感に同情的な理論家は、言語を急進的に「非人格化」することを提唱している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:24:42 GMT)
Steady-Forcing: Balancing Spatial Persistence and Motion Continuity in Long-Horizon Nature Video Diffusion [1.2] 自動回帰ビデオ拡散モデルはストリーミング生成を可能にするが、長時間のロールアウトでは劣化することが多い。
本研究では,この安定移動トレードオフを,固定カメラによる長距離自然映像生成において検討する。
本稿では,永続的視覚アンカー(V-Sink),指数的移動平均運動メモリ(EMA-Sink),ブロック相対時間符号化,周期的キャッシュの浄化,Wan2.1-14B教師の蒸留を組み合わせたメモリ・トレーニングフレームワークであるSteady-Forcingを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:11:50 GMT)
Critical evaluation of PINN for FWD inverse analysis and differentiable FEM as an alternative [1.1] 本研究は,多層舗装システムにおけるPINNに基づく逆解析を批判的に評価する。
対照的に、DiffFEMはより正確で安定で、計算効率のよい逆解析結果を得る。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:08:55 GMT)
KliniskVestBERT: BERT Model Specialised to Norwegian Clinical Texts [1.1] この研究は、3つのBERTベースのエンコーダモデルのスイートであるKliniskVestBERTを紹介している。
このデータセットはHelse Vest患者の代表集団に基づいている。
含まれるドキュメントタイプは、bokmlとnynorskの幅広い臨床スペクトルを包含するように慎重にキュレートされる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:52:52 GMT)
Towards Intrusion Detection Systems for RPL-based IoT Networks using Foundation Models [1.1] RPLベースのIoTネットワークに対する攻撃を検知し、識別するための基礎モデルの利用について検討する。
マルチクラス攻撃識別のためのMOMENT基盤モデルを微調整する。
このアプローチは、最先端の手法に匹敵する攻撃検出性能を達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:52:31 GMT)
Multi-Agent Next-Best-View Optimization for Risk-Averse Planning [1.1] 不確実で未知の環境での安全な経路計画のためのマルチエージェントNBV(Next-Best-View)の選択には、情報的、安全に配慮し、効率的な調整が必要である。
本研究では,各ロボットがプライベートなローカル3Dガウスマップを維持できる分散型リスク対応NBVフレームワークを提案する。
複数のチーム規模のGibson環境での実験は、分散定式化が、マッピングの品質と軌道安全において集中的なベースラインに近づいたことを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:23:23 GMT)
Section-Weighted Hybrid Approach for Legal Case Retrieval [1.1] 判例検索のための2段階のセクションアウェアフレームワークを提案する。
まず、決定論的大言語モデルを用いて、事実、問題、決定、推論に生の判断を分割する。
上位結果について、システムは関連セクションのテキストを簡潔で根拠のある合理化とパーティー・スタンス・ラベルで返します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:27:53 GMT)
From Script to Semantics: Prompting Strategies for African NLI [1.1] 本稿では,スワヒリ,ヨルバ,ハウサにおける自然言語推論(NLI)の促進戦略の体系的研究について述べる。
私たちはBaseline(ゼロショット)、Script-Aware、Language Specific、Contrastive、NL-STP(Native-Label Self-Translation)の5つのプロンプト戦略を評価する。
いくつかの構成では、中性なクラス崩壊と高い予測スキューを伴う戦略間で、クラスワイズの性能に有意な差が認められる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:20:10 GMT)
BlobShuffle: Cost-Effective Repartitioning in Stream Processing Systems via Object Storage Exemplified with Kafka Streams [1.1] 本稿では,BlobShuffleを提案する。BlobShuffleは,ストリーム処理システムのためのコスト効率の高いシャッフル手法である。
すべてのシャッフルレコードを直接送信する代わりに、BlobShuffleはレコードをバッチにグループ化し、これらのバッチをクラウドオブジェクトストレージに格納し、通知のみを転送する。
BlobShuffleは、95%のシャッフルレイテンシを2秒未満に保ちながら、ネイティブKafkaシャッフルと比較してシャッフルコストを40倍以上削減できることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:13:48 GMT)
PHAF-Personalized Hand Avatars in a Flash [1.1] PHAFは、エッジデバイス上でのリアルタイムデプロイメントのために、高速なパーソナライズされたテクスチャを生成する。
ビューベースの塗装ネットワークは、滑らかで連続的な外観を保証するテクスチャを洗練する。
実験では、テクスチャ生成時間を30倍劇的に削減しながら、視覚的忠実度において既存の手法に匹敵することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:05:46 GMT)
Parallel Adaptive Multi-Objective Evolutionary Learning of Discretized Bayesian Network Classifiers for Clinical Data [1.0] Baymexは、離散化されたBNを学習するための多目的進化アルゴリズムである。
Baymexは最先端のBN学習手法より優れていることが示されている。
ベイメックスは,コンパクトで臨床的に検査可能なBNを生産しながら,統計的に類似またはより良い予測性能が得られることを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:21:45 GMT)
PE-MHL: Physics-Encoded Modular Hybrid Layers for Scalable Learning of Complex Systems [1.0] 物理ベースとデータ駆動コンポーネントを組み合わせたハイブリッドモデルは、制御アプリケーションにおいて精度と解釈可能性を達成する強力な可能性を示している。
本稿では,新しいサブモデルの追加により,基礎となる物理モデルが漸進的に洗練される物理符号化モジュールハイブリッド層(PE-MHL)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:39:23 GMT)
Efficient ASR Training with Conversations that Never Happened [1.0] 本稿では,参加者メタデータを用いたシナリオレベルの対話を生成する拡張パイプラインを提案する。
次に、話者属性をTS音声プロファイルにマッピングし、合成された発話を話者認識型会話に組み立てる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:46:12 GMT)
Combining Statistical Features and Deep Encodings for Rehearsal-Based Class-Incremental Time Series Classification [1.0] 本稿では,時系列データの分類のためのクラス連続学習を行うための新しい手法を提案する。
提案システムでは,すべてのデータセット間での競合平均精度を実現するとともに,すべての実験構成に対して低遅延率を維持している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:02:42 GMT)
An Attention-Based Denoising Model for Diffusion Weighted Imaging [1.0] スキャン時間が短縮されると、画像の品質が劣化し、スキャンのノイズが増大する。
階層型スウィントランスウィンドウアテンションとトランスフォーマーに基づく多次元ゲートリファインメントを統合し,DWI復元のためのノイズ認識型アテンション駆動型デノナイジングフレームワークを提案する。
本モデルでは, 騒音条件下での安定挙動を維持しつつ, ノイズレベルを1%から15%に抑えながら, 平均PSNR33.69dB, SSIM0.8539を達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:59:09 GMT)
Gravitationally Induced Quantum Decoherence of Macroscopic Objects [0.9] 空間重ね合わせで調製した巨大物体の重力誘起量子デコヒーレンスを定式化する。
非相対論的かつ準静的な状態では、デコヒーレンス指数は系の応力-エネルギーテンソルの差の双線型関数として記述できる。
有限波長パケットでモデル化された希薄非相対論的気体の時間と空間における粗粒化によるデコヒーレンス関数の評価を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:04:28 GMT)
Sample-Size Scaling of the African Languages NLI Evaluation [0.9] この研究は、AfriXNLIベンチマークに基づく16のアフリカ言語における自然言語推論(NLI)の体系的なサンプルサイズスケーリング研究である。
約0.6Bパラメータを持つ2つの多言語トランスフォーマーモデル XLM-R Large を XNLI と AfroXLM-R Large で微調整し、50から500のラベル付きサンプルサイズで試験した。
データの増加に伴う単調な増加という通常の信念とは対照的に、強い言語に敏感で、しばしば非単調なスケーリングの振る舞いを見出す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:27:16 GMT)
Anycast Performance in Context [0.9] IP anycastは、サービスが多くの物理サイトから1つのアドレスを宣伝し、BGPは各クライアントをサイトへマップする。
本稿では、ルートDNSとCDNの2つの設定で、任意のキャストレイテンシを比較する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:59:27 GMT)
Automating Information Extraction and Retrieval for Industrial Spare Parts Pooling [0.8] 製造業の保守組織は、既存の資産を再利用することで、ダウンタイムや不必要な購入を回避しようとする。
この断片化された景観を仮想ストックプール(VSPool)に変換するためのハイブリッド検索拡張世代であるPhRAGを提案する。
このフレームワークは、従来のNERアプローチと比較して、生成的アプローチの可能性を示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:14:58 GMT)
Slipstream: Locality-Aware Graph Index Construction for Streaming Approximate Nearest Neighbor Search [0.8] 本稿では,ANNSのグラフインデックスにおける頻繁な挿入の計算コストを大幅に削減する新しい手法であるSlipstreamを提案する。
Slipstreamの中核的なアイデアは、ベクターストリームの連続性を利用することだ。
実験の結果,Slipstreamのスループットはベースラインよりも30.8$times$高いことがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:59:39 GMT)
AI Rater Discrimination Depends on Scoring Protocol in Complex Clinical Decision-Making [0.8] 臨床AI評価は、AIレーダとして機能する大規模言語モデル(LLM)にスコアを委譲する傾向が強まっている。
成人2型糖尿病に対する12カ月の外来経過観察におけるAIレートラー行動の検討
あらゆる質問に対して、AIレーナーは、非常に狭い範囲で一貫して高いスコアを獲得しました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:58:23 GMT)
Multimodal Transformer Based Generic Mixture Density Network for Scattering Timescale Estimation of Fast Radio Bursts [0.8] 本稿では,MT-GMDN (Multimodal Transformer Based Generic Mixture Density Network) という深層学習手法を提案する。
MT-GMDN は CHIME/FRB cattwo から$sim3500$ FRB のトレーニングを行い,トレーニング中の検証やトレーニング完了後のテストのために一部の FRB を保有した。
モデルは、測定可能な散乱を伴う事象に対する期待値の$$$$に対して94%$の判定係数(R2$)を、テストにおいて90%$の優れたリコール値で達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:01:08 GMT)
SEAOTTER: Sensor Embedded Autoencoding with One-Time Transcode for Efficient Reconstruction [0.7] ロボットシステムでは、低コストで低消費電力のハードウェアを使用して、大量の視覚データを高解像度で容易にキャプチャすることができる。
本稿では,効率的な再構成のためのワンタイムトランスコードと組み合わせたSensor Embedded Autoencoderに基づくクラウド用圧縮フレームワークを提案する。
200:1の圧縮比で、7倍の高速符号化、3.5倍の高速復号化、+8%のImageNet top-1精度を観測した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:28:28 GMT)
Don't Trust Us: A privacy-by-design android malware detection pipeline [0.7] 既存のプライバシ対応アプローチは、一般的にデータ収集後にプライバシを強制する。
この要件は管理するよりも取り除くべきだと我々は主張する。
Androidのマルウェア検出は、設計上プライバシに注意する必要があるため、効果的な分析は、そもそもアクセスされている機密データに依存しない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:36:31 GMT)
Penalty-free quantum optimization applied to lattice protein folding [0.7] アナログ反復型局所探索方式を導入し,26量子ビット以上の局所部分グラフを用いて,最大で$N=14$の格子タンパク質の折り畳みに成功した。
この手法は、長さ$N=4$および$N=6$の格子タンパク質に対する量子回路の古典的なシミュレーションを通じて検証する。
そこで我々はさらに,26量子ビットの局所部分グラフを用いて,最大$N=14$の格子タンパク質の折り畳みを成功させる,反復的な局所探索手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:25:57 GMT)
Fast single-atom preparation in optical tweezers via Rydberg blockade [0.7] 本研究では,マイクロ秒の時間スケールにおいて,マルチ占有型ツイーザから1つの原子を選択的に除去する手法を提案し,実証する。
基底状態からの2光子リドバーグ励起により、ツイーザーの58.2(2)%に単一原子を保持しながら、多原子の確率を64.8ドルsで1%に下げる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:13:52 GMT)
Toward AI That Understands Self and Others: A World-Model Theory of Cognitive Diversity and Alignment [0.7] 本稿は、すでに不一致は後期現象であると主張している。
中心的な前提は単純だが自明ではない。
本稿では,認知の多様性とアライメントに関する世界モデル理論を開発する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:31:00 GMT)
Pushing the Limits: A Framework to Reform Institutional Ethics Review of Environmentally-Impactful Computing Research [0.7] 計算集約型研究(CIR)はAIを含むさまざまなトピックで行われている。
必ずしも、組織倫理審査方針の範囲内にあるわけではない。
本稿では,CIRを倫理審査の対象とする制度的倫理政策のスコーピング基準を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:10:23 GMT)
Metric-Aware Hybrid Forecasting for the CTF4Science Lorenz Challenge [0.7] CTF4Science Lorenz Challengeに対する我々のアプローチは、短期水平予測、長期分布マッチング、および9つのタスクペア間の軌道再構成を混合したベンチマークである。
メカニカル・アウェア・ハイブリッドシステムを構築し,各メカニカル・ファミリーに異なる予測器を割り当てた。
このシステムファミリーの代表的な成熟した応募者は、公衆のリーダーボードで83.83551点を獲得し、同じアイデアの小さなフォローアップスタックは83.85529点に達した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:20:40 GMT)
Towards a Hybrid Quantum Enhanced Solution for Densest k-Subgraph Problem [0.7] ガウスボソンサンプリング(GBS)の高密度k-グラフ問題(DkSP)への応用について検討する。
提案手法では, ほぼkに近いサンプルを, 実現可能なソリューションに変換し, 破棄する, 有効な古典的後処理戦略を導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:55:09 GMT)
Semantic-weighted ICP for LiDAR Odometry: Class-Aware Residual Reweighting for Robust Scan Registration [0.7] LiDARオドメトリーは自律ロボットシステムの基本的な構成要素であり、エゴモーションを推定するために連続する点雲間の幾何学的登録に依存している。
伝統的な幾何学的アプローチは、動いた物体、まばらな幾何学的特徴、植生、意味的に曖昧な構造によって生じる信頼できない対応によって、動的または非構造的な環境においてしばしば劣化する。
そこで本研究では,LiDAR odometry のためのセマンティッククラス重み付きICPを提案し,その予測した幾何安定性に基づいて意味圏に属する点の残差を重み付けする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:00:29 GMT)
A cross-domain tropical species dataset with Chinese vernacular names and CITES source links [0.7] 本報告では,410,499種の活動性熱帯種のバージョン別クロスドメインデータセットについて述べる。
このデータセットは、GBIF, Plants of the World Online, iNaturalist, NCBIの分類学の分類学識別子と結合する。
未検証のマシン生成提案を除外するタイプロジーの下で、名前ごとの明示的な証明を持つ中国の頂点層。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:08:12 GMT)
The Invisible Lottery: How Subtle Cues Steer Algorithm Choice in LLM Code Generation [0.7] タスク仕様外の文脈語やメタデータを意味するインシデントプロンプトキューは、モデルが選択したアルゴリズムを操縦することができる。
我々は、アルゴリズムのステアリングを、アルゴリズム-ファミリー分布のキュー誘起シフトとして定義する。
直接アルゴリズムの命名は、私たちがテストした最も信頼性の高い緩和です。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:17:28 GMT)
Proof-Carrying Agent Actions: Model-Agnostic Runtime Governance for Heterogeneous Agent Systems [0.7] 本稿では,アクション証明書を中心としたランタイム中立ガバナンスモデルであるProof-Carrying Agent Actions (PCAA)を提案する。
PCAAは5つのチェックポイント(事前行動の許容、行動のオープン、仮定のキャプチャ、承認、結果のクロージャ)を統括する。
異種エージェント制御プレーンと開示バウンダリ評価プロトコルの参照実装を用いてモデルについて検討する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:10:35 GMT)
Scalable On-Hardware Training of Quantum Neural Networks and Application to Clinical Data Imputation [0.7] 量子ハードウェア上での量子ニューラルネットワーク(QNN)のトレーニングは現在、推定コストによってボトルネックになっている。
我々は、このコストを量子ビット数で対数的に削減するトレーニングフレームワークを導入する。
MIMIC-III電子健康記録データセットを用いて臨床データ計算の枠組みを検証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:38:48 GMT)
Agent libOS: A Library-OS-Inspired Runtime for Long-Running, Capability-Controlled LLM Agents [0.6] 大規模言語モデル(LLM)エージェントは、要求応答アシスタントから長期実行中のソフトウェアアクターへと進化している。
本稿では,LLMエージェントのためのライブラリOSをベースとしたランタイム基板であるAgens libOSを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:53:24 GMT)
What Are We Actually Benchmarking in Robot Manipulation? [0.6] ロボティクスのベンチマークスコアは、1つの固定された評価設定の下で成功を測定するが、通常、一般的な操作能力の証拠として扱われる。
4つの障害モードを特定し、それぞれがその機能の有効なプロキシとしてベンチマークの役割を弱めたり無効にした。
これらの診断のもと,LIBERO,CALVIN,SimplerEnv,RoboCasa,RoboTwin 2.0を検査した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:33:28 GMT)
q0: Primitives for Hyper-Epoch Pretraining [0.6] 単一のモデルの事前訓練は、計算予算が枯渇するずっと前に、数パス以内に飽和する。
ハイパーエポック事前学習(q0)を導入し,マルチエポック予算を多種多様なモデルに転換する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:27:48 GMT)
Edge of Stability Selectively Shapes Learning Across the Data Distribution [0.6] 安定性の限界 (EoS) は選択的であり, グループによっては進行が増大し, 他グループでは進行が抑制されることが示唆された。
同じトレーニング状態からEoS体制に侵入または離脱する分岐介入を使用することで、このトレードオフを慎重に実証する。
これらの結果から,EoSは安定性境界だけでなく,学習の割り当てを規定するメカニズムとして機能することが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:58:40 GMT)
Decoupled Smart Contract Audits: Lightweight LLM Framework via Distillation and Aggregation [0.6] 軽量で高度に最適化されたオープンソース LLM を利用した,効率的なエンドツーエンドのスマートコントラクトセキュリティ監査フレームワークを提案する。
我々のフレームワークは、総合的な監査タスクを、脆弱性検出、説明、重度分類、修正推奨の4つの相互接続されたコンポーネントに分離する。
実験結果から、我々の軽量パイプラインは、最先端のオープンソースコーダの高密度LLMよりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:13:43 GMT)
Building The Ph(ysical)AI Layer Of Machine Intelligence [0.6] ファンデーションモデルは、多様なデータに対する大規模なトレーニングを通じて一般化を実現するが、ペアのトレーニングデータなしで真に見えないドメインに移行する制限がある。
本稿では,信号理論の原理を符号化する基礎モデルを提案する。
我々は、RFデータから学習した凍結表現のみを用いて、音声、画像、テキスト、ビデオへのクロスモーダル転送を実現し、ターゲットドメインに対するエンコーダの微調整を必要としない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:11:03 GMT)
Glass Box at Orbit: A Constitutional AI Verification Framework for Trustworthy Autonomous CubeSat Intelligence [0.6] Glass Boxは、オンボードAIポリシからすべての候補アクションをインターセプトする、実行時の立憲AI検証レイヤである。
承認されたすべてのアクションは、[0,1]の重み付き説明可能性スコアE(a_t)と完全な立憲監査ログを有する。
われわれはProject OctoberでGlass Boxをデモした。CubeSat級宇宙船の5層自律軌道インテリジェンスアーキテクチャをシミュレーションしたものだ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:09:57 GMT)
Privacy-Robust Incrementality Measurement for Advertising Systems under Signal Loss [0.5] 広告プラットフォームは、漸進性を測定するためにランダム化リフトテストを使用する。
プライバシ保存レポートシステムは、マッチレート損失、リンク可能性損失、属性ウィンドウ損失、アグリゲーション閾値抑制、ランダム化された報告ノイズ、セグメント不均一な信号損失を通じて、観測された信号を劣化させる。
本稿では、上記の信号損失に基づいて、プライバシー制約のある広告計測をロバストな因果決定問題として定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:46:38 GMT)
Forecasting Conceptual Diffusion in Science: The Case of Quantum Computing [0.5] 我々は,各概念ペアを上流の励磁線と下流の拡散によって追跡する,時間的に解決された概念共起ネットワークを構築した。
我々は4つの結果を予測するために、分布と多様性を意識したLightGBMモデルを訓練する。
概念拡散は、意味的および引用環境に埋め込まれた安定した構造的規則性によって制御される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:12:02 GMT)
Consistency Training Can Entrench Misalignment [0.5] モデル生物108種を対象に, 整合性学習法を7種類試験した。
一貫性トレーニングは一般的に、不正な報酬のハッキングや創発的なミスアライメントを抑えるが、梅毒症を増幅する。
本稿では, 整合性ラベリングプロセスによって誘導される分布変化が, 選択演算子の変動ではなく, 系統的アライメント効果の第一の要因であることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:54:24 GMT)
Explainable Forecasting of Scientific Breakthroughs from Concept Network Dynamics [0.5] 本稿では,研究概念間のリンクの出現と拡大を予測できる,説明可能な機械学習手法を提案する。
59の意味的特徴と位相的特徴を用いて、2段階のLightGBMモデルはコンセプトペアの生成と将来の重量を共同で予測する。
次に、これらの予測をエビデンスベースの研究戦略とポリシーに変換する3層決定アーキテクチャについて概説する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:38:41 GMT)
Predicting Inference-Time Scaling Gains from Labeled Validation-Set Output Statistics [0.4] Best-of-N$推論スケーリングは、モデルによって異なる量によって精度が向上するが、現時点ではプロシージャをエンドツーエンドで実行する必要がある。
我々は,1つのバリデーションセットサンプリングパスから計算した特徴にリッジ予測器を適合させ,ブートストラップ・ラッソを候補特徴セットの安定性解析として使用し,明示的な線形近似残差を持つ濃度解析を行う。
このコアとエントロピーアドオンで構築されたコンパクトなリッジ予測器は、報奨モデル検証の下で実際のベスト・オブ・N$ゲインを持つスピアマン$=0.90$に達する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:38:51 GMT)
Deterministic generation of cat states with more than $100$ photons under dissipation [0.4] 大きめの猫状態は量子-古典遷移を探索する上で意義があり、基本的なものである。
我々は,Hermitian あるいは非Hermitian 時間依存ハミルトニアンの下でのハイブリッド量子ボゾン系の動的不変量を用いて,大きな猫状態を生成することを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:05:51 GMT)
When Offline Selectors Cannot Beat the Best Single Model: A Diagnostic Study on edX Dropout Prediction [0.4] 記録されたデータから訓練されたセレクタは 常に最強の予測器を 打ち負かさない
3段階の診断は、共有バッファ上でそれらを規定する。
次のイテレーションでは、オフラインの学習者をチューニングすることなく、状態を変更したり、新しいデータを集めたりする必要がある。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:24:09 GMT)
Generalised simultaneous transmission of arbitrary quantum states and classical information [0.3] 本稿では,任意の光量子状態に対して,古典的データを同時に搬送・送信するプロトコルを提案する。
本方式では,伝送前の位相空間の変位によって古典情報を符号化する。
元の量子状態は、元の変位を推測し、適切な逆演算を行うことで復元される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:41:03 GMT)
Physics-Informed Machine Learning for Short-Term Flood Prediction [0.3] 本研究では,LSTMモデルの損失関数に直接,水文学的な知識を組み込むフレームワークを提案する。
特に、トレンドアライメント制約は、降水と放電の傾向の方向性の不整合を罰する。
この正規化は、限られた訓練データであっても、物理的に妥当なヒドログラフの振る舞いを学ぶことを奨励する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:01:06 GMT)
Advanced Flood Prediction with Physics-Guided Deep Learning: Combining UNet, FNO, and SAR/Optical Imagery [0.3] この研究は、多モードリモートセンシングと深さ平均浅水方程式を統合した物理誘導型ディープラーニングフレームワークを導入する。
提案したハイブリッドアーキテクチャは、UNetとFNO(Fourier Neural Operator)を組み合わせて、流域と流域の油圧相互作用をモデル化する。
このモデルは0.82のユニオンと0.90のF1スコアのインターセクションを達成し、UNetのみのベースラインとFNOのみのベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:14:04 GMT)
How Many Trees in a Random Forest? A Revisited Approach with Plateau Search and Optuna Integration [0.3] ランダムフォレストのためのHPOのための統合三重項ベースプラトー探索アルゴリズムを提案する。
この方法は、バッグ外スコアの相対的な変化を監視して、最小に近い十分なアンサンブルサイズを適応的に追跡する。
実験により、選択された木の数は共通の絶対値と大きく異なることが示されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:10:43 GMT)
Thinking Through Signs: PEEL as a Semiotic Scaffolding for Epistemically Accountable AI-Enabled Research [0.3] このコメンタリーでは、AIにおけるエピステマティック・エンガジェド・リテラシーのためのプロトコルPEELを紹介している。
これは、Voyant Tools による決定論的遠方読解と、Pircean semiotics と abductive reasoning に根ざした Claude による LLM 解釈を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:19:52 GMT)
Bayesian Membership Privacy for Graph Neural Networks [0.3] グラフニューラルネットワーク(GNN)の既存のプライバシ分析は、非グラフ設定から仮定をほとんど継承している。
特に、ノード依存のプリミティブは、最高のメンバシップ推論テストを特徴付けるのに、タイプIとタイプIIのエラーだけでは不十分である。
本稿では,ノードに依存した事前情報を組み込んだノードレベルのメンバシッププライバシのサンプリング・アウェアな定式化と,グラフサンプリングの確率を相手の知識の一部として扱う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:33:24 GMT)
EURO-5K: When Does Domain Pretraining Matter? Benchmarking Transformers for EU Reporting Obligation Extraction [0.3] EURO-5K(英: EURO-5K)は、欧州連合の136の立法機関による判決レベルの報告義務のコーパスである。
このデータセットでは、差別的トークン分類モデル(BERTスタイル)と生成的スパン抽出モデル(LLM)を訓練し比較する。
その結果,完全微調整の汎用と法定のBERTモデルでは同様の性能(0.89 F1)が得られ,微調整のLLMは文レベルの抽出にエンコーダの精度が一致することがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:20:54 GMT)
StandardE2E: A Unified Framework for End-to-End Autonomous Driving Datasets [0.3] 提案するStandardE2Eは,データセットを駆動するE2E上で単一の統一インターフェースを提供するフレームワークである。
StandardE2Eは、1つの共有データスキーマの下でデータセットごとの事前処理を標準化する。
複数のデータセットを単一のPyTorch DataLoaderに組み合わせて、クロスデータセット事前トレーニング、補助タスクの監視、シナリオレベルのフィルタリングを行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:50:55 GMT)
AQIFormer: A Transformer-Based Multi-View Architecture for Cross-City Air Quality Classification [0.3] 大気汚染は世界の環境と公衆衛生の最も重要な課題の1つである。
交通現場における大気汚染物質の視覚的特性を活用することで, 画像に基づく大気質推定が有望な代替手段として浮上している。
本稿では、新しいトランスフォーマーベースのアンサンブルアーキテクチャであるAQIFormerを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:51:28 GMT)
Multi-Modal Assessment of Road Roughness Using Smartphone Applications, Acceleration, and Passenger Ratings [0.2] 本稿では,低コスト道路粗さ評価のためのマルチモーダル・人間中心型フレームワークについて検討する。
実際の交通状況下では、オーストリア、ハンガリー、ルーマニアで1700km以上のデータを収集した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:13:42 GMT)
Multi-Robot Bearing-only Pose Estimation via Angle Rigidity [0.2] 方法は、ボディフレームの軸受から計算された角度を用いて、ロボットの位置を向きを知らずに$mathbbR3$で推定する。
推定位置、軸受および軸受誘導体から$mathrmSO(3)$の配向を回収する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:22:48 GMT)
BaltiVoice: A Speech Corpus and Fine-tuned Whisper ASR System for the Balti Language [0.2] パキスタンのギルギット・バルチスタンで話されているチベット語であるバルティ語(ISO 639-3: bft)の16.8時間の読み上げ音声コーパスであるバルティヴォイスについて紹介する。
コーパスには、Mozilla Common Voiceの録音から派生したネイティブなNastaliqスクリプトで10,060の検証された発話が含まれている。
We report a Word Error Rate of 30.07% on a held-out validation set of 538 utterances, from a measured zero-shot baseline of 182.18% for Whisper-small on Balti。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:23:49 GMT)
AlignAtt4LLM: Fast AlignAtt for Decoder-Only LLMs at IWSLT 2026 Simultaneous Speech Translation Task [0.2] 英語をドイツ語、イタリア語、中国語に同時翻訳するIWSLT 2026について述べる。
システムは同期カスケードであり、強制アライメントを持つQwen3-ASRはインクリメンタルに更新されたソースの書き起こしを生成する。
英語と中国語の結果はより混合されているが、この方法はGemma-4と結び付けられていない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:52:18 GMT)
A Pocket Offline Model for Simultaneous Speech Translation as CUNI Submission to IWSLT 2026 [0.2] オフライン音声からテキストへの翻訳モデルであるCanaryと同時翻訳機能を実装した。
我々は、チェコ語を英語と英語に、ドイツ語とイタリア語に同時翻訳するタスクをIWSLT 2026に提出する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:37:11 GMT)
How Quantization Changes Interpretable Features: A Sparse Autoencoder Analysis of Language Models [0.2] 密度の高い完全精度モデルから抽出したスパースオートエンコーダの特徴が、そのモデルが量子化されると忠実であるかどうかを問う。
機能は一度にすべて失敗するのではなく、体系的に分解されるのです。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:17:05 GMT)
SD-GRPO: Verifiable Segment Decomposition for Long-Form Vision-Language Generation [0.2] ロールアウトグループ全体で検証可能なセグメントごとの報酬を正規化するセグメンション分解GRPOを提案する。
SD-GRPOは、制御された3つの設定にまたがって、実世界の長期VQAタスクを評価する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:50:50 GMT)
Better Pauli Channel Learning with Maximum Likelihood Estimation [0.2] 原理的には、最適なサンプル複雑性は最大極大推定(MLE)によって達成される。
興味のある場合、MLEを計算的に抽出できることが示される。
1D局所スパースPauli-Lindbladチャネルの一般的な場合、確率関数は効率よく評価可能なベイズネットワークに還元される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:01:06 GMT)
A Hybrid Approach For Malware Classification Using Secondary Features Fusion [0.2] 従来のマルウェア検出方法は、検出されたマルウェアをそれぞれの家族に分類することはできない。
本稿では,検出されたマルウェアを各マルウェア群に分類する手法を提案する。
提案手法を実験的に評価するために,Microsoft が提供したデータセットに二進法と多進法の両方の分類手法を適用した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:19:35 GMT)
Secure AltDA Integration for Ethereum L2s: An End-to-End Validation Framework [0.1] オルタナティブデータアベイラビリティ(AltDA)システムは、高いスループットのロールアップ設計のための外部データパブリッシュ層をL2に提供する。
既存のエコシステムフレームワークは、外部のDA信頼前提やDA検証の有無など、高いレベルのリスクを特定します。
本稿では,安全なAltDA統合のための標準検証フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:31:03 GMT)
Hedge-Bench: Benchmarking Agents on Hard, Realistic Tasks Pertaining to Financial Reasoning [0.1] Hedge-Bench 1.0は、プロのヘッジファンドアナリストの明確な理由に基づく102件の実際の業務のベンチマークである。
Frontier Model.com/Trata-Inc/trata-hedge-benchでデータセットと評価ハーネスを公開する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:11:56 GMT)
Cross-Prompt Generalization in Detecting AI-Generated Fake News Using Interpretable Linguistic Features [0.1] 本稿では,異なるプロンプトで生成されたAI生成記事の3つのデータセットを用いて,偽ニュース検出におけるクロスプロンプト一般化について検討する。
語彙の多様性,可読性,感情に基づく特徴を捉えた解釈可能な言語特徴を抽出する。
特徴分布の分析により、AI生成したテキストは語彙の多様性を高め、読みやすさを低下させ、全体のデータセットと比較して感情的な強度を大幅に低下させることが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:33:56 GMT)
Auditing Engagement Incentives in the Kidfluencer Ecosystem: A Multimodal Weak Supervision Approach [0.1] 本研究では、YouTube上の79のキッドフルエンサーチャンネルにまたがる5,051本のビデオのマルチモーダルAI監査を示す。
ノイズラベリング機能を用いて,各ビデオに確率的評価スコアを割り当てる。
以上の結果から,パフォーマンス労働,情緒的餌食,プライバシー侵害に対する有意義なエンゲージメントプレミアムが明らかとなった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:29:13 GMT)
Multidimensional Reconciliation in Continuous-Variable QKD: Review, Coding Schemes, and Open Source Simulation [0.1] 多次元和解は低信号対雑音比と長距離での運用の課題に対処する。
本稿では,仮想チャネルの構築,逆整合のための実用的な符号化手法の議論,線形誤り訂正符号の統合について述べる。
本稿では,任意の次元に対して多次元整合性を実装したオープンソースのシミュレーションフレームワークであるHDiracについて述べる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:11:09 GMT)
AgentRedBench: Dynamic Redteaming and Integration-Aware Defense for LLM Agents over SaaS Integrations [0.1] ツール・ユース・エージェントへの間接的なプロンプト・インジェクションは、具体的な生産上の脅威である。
AgentREDBENCHは、215の微妙な未特定認可シナリオのベンチマークである。
AgentREDGUARDは、逆ツール-レスポンスコンテンツの統合多言語コーパスで訓練されたガードである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:23:51 GMT)
On the local equivalence of trapped-ion two-qudit gates [0.1] 変換ゲート行列の特異値の観点から、2量子ゲート間の局所同値性の必要条件を導出する。
この条件を用いて、クーディ空間において広く使われている2つのトラップイオン2量子ビットゲートの局所同値性を調べる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:35:31 GMT)
The Word and the Way: Strategies for Domain-Specific BERT Pre-Training in German Medical NLP [0.1] デジタルヘルスケアは、AI支援アプリケーションをサポートする膨大な量の臨床テキストを生成する。
ドメイン固有のRoBERTaベースの言語モデルであるChristBERTを13.5GBコーパスでトレーニングした。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:10:43 GMT)
Practical gates by Majorana fermion motion [0.1] 量子エラー訂正プロトコルは、論理情報を非局所的に保存することにより、局所的なエラーを防止する。
これは、非ローカルな隠れた'論理情報に基づいて効率的な論理ゲートを設計する方法という課題を提起する。
マヨラナフェルミオン(Majorana fermions)と呼ばれる点状粒子の観点から、平面パウリ安定化符号と論理演算のためのプロトコルの一般的な記述を開発する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:10:30 GMT)
Extracting Universal Entanglement Scaling from Mixed Fermionic Gaussian States via Entanglement Projected Entropy [0.1] 混合フェルミオン状態に対する純化独立なガウス空間フィルタであるエンタングルメント射影エントロピー(EPE)を導入する。
これらの結果は、混合状態のエントロピーの下に隠れた境界感度の普遍的スケーリングを公開するエントロピーチャネルフィルタとしてEPEを確立する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:30:34 GMT)
Observation of residual entanglement in chip-based entanglement purification [0.0] 絡み合いの浄化は量子リピータの重要な構成要素である。
本稿では,シリコンチップを用いたハイパーエンタングルメントに基づく単一コピーエンタングルメント浄化方式を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:53:56 GMT)
Signed Spiking Neuron Enabled by an Orthogonal-Easy-Axis Magnetic Tunnel Junction [0.0] 本研究は, 小型磁気トンネル接合 (MTJ) を用いた LIF (Integrated-and-fire) 動作のためのニューロンを提案する。
このデバイスはバイポーラスパイク生成を可能にし、磁気モーメントダイナミクスを署名されたLIF膜ポテンシャル進化にマッピングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:45:23 GMT)
GTBench: A Curriculum-Grounded Benchmark for Evaluating LLMs as Mathematical Research Assistants in Graph Theory [0.0] GTBenchは、グラフ理論の数学的研究アシスタントとして、大規模言語モデル(LLM)を評価するためのカリキュラムベースベンチマークである。
GPT-5, Claude Sonnet 4.6, Gemini 2.5 Flash-Lite, Llama 3.3 70B, Mistral Large 3 の評価を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:40:25 GMT)
Where Do Large Language Models Fail on Competitive Programming? A Taxonomy of Failures by Algorithm Type and Difficulty Rating [0.0] LLM(Large Language Model)は、競合するプログラミングベンチマークの習熟度が向上することを示す。
本稿では,315コーデックス問題のバランスの取れた分類法を用いて,LLM故障パターンの系統的研究を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:48:38 GMT)
When to Re-Plan: Subgoal Persistence in Hierarchical Latent Reasoning [0.0] ロングホライズン推論は、厳格になることなく中ホライズン意図にコミットするシステムを必要とする。
我々は、この安定性-適応性トレードオフを潜在推論条件で検討する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:55:47 GMT)
When RLHF Fails: A Mechanistic Taxonomy of Reward Hacking, Collapse, and Evaluator Gaming [0.0] 近似ポリシ最適化(PPO)を用いたコンパクトRLHFパイプラインの失敗モードに関する実証的研究について述べる。
我々は、学習した報酬の方向、判定スコア、および平均判定スコアを用いて、チェックポイント間の一致した遷移を分類する。
ROC-AUC 0.821による将来の行レベルの報酬ハッキングを予測し、行レベルの分析では、チェックポイント平均が12の3つの設定で見逃すような局所的な報酬ハックが見つかる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:55:52 GMT)
When Does Complexity Conditioning Help a Frozen Sentence Embedding? A Controlled Study of Per-Sentence and Pair-Level Difficulty Adaptation [0.0] 一般的な直感では、文の埋め込みは入力の難易度に適応すべきである。
本研究では, 表面ベースの文間複雑性が, フリーズベースライン誤差とほとんど関係がないことを示す。
ホールドアウトクロスエンコーダ困難信号でゲートされた小さなペアレベル残差は、一貫した利得を得る。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:04:58 GMT)
WISE-HAR: A Generalizable Ensemble Deep Learning Framework for WiFi-Based Human Activity Recognition [0.0] WiFi信号を用いたヒューマンアクティビティ認識(HAR)は、スマートホーム、医療監視、セキュリティシステム、環境支援生活のためのトランスフォーメーション技術として登場した。
本稿では,Wallhack1.8k WiFi スペクトログラムデータセットを用いて,「空き部屋」,「ウォーキング」,「ウォーキング+アームウォービング」の3つの異なる行動を認識するための包括的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:25:46 GMT)
Tridirectional Discriminating-Power Formal Verification of Smart Contract Reentrancy Defense Against Production-Deployed Solidity Source [0.0] OpenZeppelinのReentrancy-guardパターンの最初の正当性証明は、プロダクションデプロイされたSolidityソースのLean 4ステートマシンモデルに対するものだ。
スマートコントラクトの継続は2016年以降、記録された損失として5億ドル以上を突破した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:01:42 GMT)
Trans GAN-WT: A Feature Extraction and Interactive Learning-Based Anomaly Detection Model for Wind Turbine Time Series Data [0.0] 本稿では,トランスフォーマーと生成対向ネットワークを融合した異常検出モデルを提案する。
これにより、再構成誤差を増幅することにより、小さな偏差異常の漏れ検出率を低減する。
また、自己回帰推論を用いてマルチモーダル特徴を抽出し、トレーニングの安定性と一般化能力を高める。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:57:08 GMT)
Trajectory-Aware Node Contributions and the Limits of Static Controllability [0.0] エマージェント・コントリビューション(emergent Contributence)とは、ノードの動的レバレッジの尺度である。
「EC」は線形時間不変極限における平均的な制御可能性に正確に還元する。
この位相空間内の複数の領域から推定される実数系を5つ配置する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:56:36 GMT)
Training-Free Lexical-Dense Fusion for Conversational-Memory Retrieval [0.0] 新しいクエリに応答する過去数回を検索することは、長期的な会話メモリの背後にある検索ボトルネックである。
最近の研究であるNano-Memoryは、クエリターンの最大類似度によるセッションのスコアが平均プールされたセッションの埋め込みを上回っていることを示している。
私たちはそれを複製し、トレーニングなしのCPUのみの検索ステージに何を追加するべきかを尋ねます。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:22:16 GMT)
Towards Non-Monotonic Entailment in Propositional Defeasible Standpoint Logic [0.0] 命題記述可能なスタンドポイント論理の大きな断片が位置条件の集合として表現可能であることを示す。
次に、このフラグメントにおける非単調なエンターメントの特徴付けに焦点をあて、命題のケースからPケースへランクに基づくエンターメント関係を転送する方法を定義する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:44:37 GMT)
Towards Estimating Normal and Shear Interface Pressures in Prosthetic Sockets via Least Squares and Mechanics Modeling [0.0] 義足のソケットフィッティングは手動と反復がほとんどであり、客観的な適合度は依然として限られている。
従来の圧力センサーは時間の経過とともにドリフトする傾向があり、ソケット内の狭い場所でのみ正常な圧力を捉えている。
本研究は,スパース圧力センサ下でのモデル性能を評価するテストベッドを導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:17:29 GMT)
Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification [0.0] エンタープライズ人工知能(AI)エージェントの事前デプロイ検証は、大規模言語モデル(LLM)のベンチマークと運用デプロイメントの間には、依然として重要なギャップがある。
本稿では,許可,ドメイン制約,安全性,ガバナンスルール,自律性レベルにまたがる認証空間の形式化を行うエージェントオペレーション・エンベロープという,3つのコンポーネントを組み合わせたオントロジー的な検証フレームワークを提案する。
4つの規制産業(フィンテック、バンキング、保険、ヘルスケア)のコントロールパイロットは、125のプライマリソース規制要件と25のインジェクト障害に対して評価された1,800のシナリオを生成した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:37:11 GMT)
Topological Ignorability for Structural Causal Effects Beyond Means [0.0] 介入は平均よりも結果分布の構造を変化させる。
平均治療効果のような平均的な因果推定は重要な構造的効果を欠く可能性がある。
本稿では,介入結果法則の要約に基づくトポロジカル・幾何学的因果指標を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:19:17 GMT)
Tonal parsimony in chord-sequence analysis: combining modulation cost and tonal vocabulary [0.0] コード配列に対する局所音節の割り当てについて検討する。
標準的な動的プログラミング手法は変調を最小化するが、必然的に多くの音調中心を導入することができる。
我々は、この遷移のみの目的を、純最小語彙分析と音節パシモニーと比較した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:36:05 GMT)
Token Budgets: An Empirical Catalog of 63 LLM-Agent Budget-Overrun Incidents, with an Affine-Typed Rust Mitigation as a Case Study [0.0] 私たちは、アフィンのオーナシップを運用するRustクレートを構築して、クローン、ダブルスペンディング、あるいは予算の使用を委譲することで、オペレータが避けなければならないランタイムのハザードではなくコンパイルエラーを発生させます。
5つのランタイム、3つのプロバイダ、温度階層化されたライブAPIテストで、このアプローチでは、コンカレントワークと同等の動作で、キャップ違反がゼロで、偽の拒否がゼロであることを報告している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:46:57 GMT)
The quantum-gravitational imitation game [0.0] 我々は、重力の量子的性質のテストはテーブルトップ実験で実現できると主張している。
最近提案されたこれらのテストは、量子重力模倣ゲームとしてフレーム化している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:10:47 GMT)
The Violation Situation Pattern: A Knowledge-Graph Pattern for Compliance Violations [0.0] コンプライアンスパイプラインは、永続的なグラフオブジェクトとして、レビュー状態、影響を受けるエンティティ、監査履歴を保持できない。
違反状況パターン(VSP)は、検出された各違反を、ルール識別子、時間的妥当性間隔、ライフサイクル状態、関連するエンティティへのエビデンスリンクでグラフノードとして再定義する。
V4を節プレゼンから期限チェックに拡張すると、F1は0.312から0.602に上昇するが、パターンのアイデンティティ、ライフサイクル、エビデンスセマンティクスは同じままである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:33:50 GMT)
The Value Function Semi-Algebraic Set in Partially Observable Markov Decision Processes [0.0] 無限水平部分観測可能なマルコフ決定過程(POMDP)における実現可能な値関数の幾何学を,メモリレスポリシの下で検討する。
我々の主な貢献は、半代数集合として実現可能な値関数の集合を特徴づけることである。
我々の幾何学的特徴は、MDPとPOMDPの双方における政策最適化の展望に新たな洞察を与える。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:30:49 GMT)
The Security Budget of Code LLMs: An Information-Theoretic Capacity-Security Bound [0.0] 本稿では,機能容量$Cap=rmI(c*;c_)$と摂動保持$$Sec=rmI(c_;tilde c_)$のコードLLMに対する情報理論トレードオフについて検討する。
for $pto c_$ with perturbed prompt $tilde p$, we prove $Cap+Secle rmH(c*)+rmI(p;tilde p)$。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:22:14 GMT)
The Saturation Trap and the Subjectivity of Intervention Timing: Why Affect-Based Triggers and LLM Judges Fail to Time Interventions on Autonomous Agents [0.0] インターベンションタイミングは信頼性の低い構造であり、シングルアノテータF1を不適切な最適化ターゲットとする。
我々の貢献は、人間のレータ間の信頼性、4つの検出器アーキテクチャ、モデルのLEM-judgeスイープ、再現された飽和効果にまたがるこの問題を、共同でマッピングすることである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:54:27 GMT)
The Language of Elution: Autoregressive Prediction of the Next Feature in Untargeted LC-HRMS Lipidomics [0.0] SCIEX TripleTOF 6600+, Waters CSH C18)による4種類の臨床リポソームコホートからの15,242種の特徴の訓練
LSTMは98.4%の精度(99.99%のトップ5、平均絶対誤差3.6Da)、トランスフォーマー98.0%に達する。
これらの結果から, 溶出シーケンスは予測可能であり, メタボロミクスのアノテーションカバレッジを向上させるため, 予測MS/MS獲得の基盤となることが確認された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:42:17 GMT)
The Impact of Temporal Granularity on Socio-Demographic Inference from Household Load Profiles [0.0] 我々は,15分から7日間の粒度の負荷プロファイルが,1年間の1,589世帯のデータセットにおける8つの社会デデノグラフィー属性の予測可能性に与える影響を分析した。
粗化は予測精度を低下させるが、2つの高原が出現する: 性能は15分から1時間、また1日から7日である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:06:14 GMT)
Template Collapse and Information-Theoretic Limits in Camera rPPG Pulse Morphology Restoration [0.0] コンシューマー・フェイスカメラ リモート・フォトプレティス幻覚(r)は、受動的心血管モニタリングを可能にする。
しかし、動脈硬化度をコードする単一サイクル波形形態が、この測定から回復可能であるか否かは明らかになっていない。
16のエンコーダアーキテクチャを3つのデータセットで評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:50:07 GMT)
Subspace-selective unitary manipulation based on the Hilbert-space symmetric structures in the multiple-quantum operator algebra spaces in the quantum-computing speedup theory [0.0] 量子計算スピードアップ理論(quantum-Computing speedup theory)は、量子系の対称構造と性質を、QCS(Quantum-Computing-Speedup)の基本的な資源とみなす。
今日では、量子コンピューティングとシミュレーションをスピードアップするために、基本的なQCSリソースをどのように活用するかが大きな問題となっている。
本稿では、ヒルベルト空間から派生した基本的なQCS資源を活用し、量子コンピューティングとシミュレーションを高速化することを目的とする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:33:27 GMT)
Stein Kernelized Molecular Dynamics for Active Learning of Interatomic Potentials [0.0] 機械学習原子間ポテンシャル(MLIP)は、効率的で正確な原子論シミュレーションを可能にするが、トレーニングデータの品質と多様性に極めて依存する。
本稿では,Stein kernelized molecular dynamics (SKMD)について紹介する。これは,相互作用する粒子動力学を用いて,MLIPの能動的学習および微調整のための情報的トレーニング構成を取得するための拡張サンプリング手法である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:07:41 GMT)
Staying Alive: Uncensored Survival Analysis with Tabular Foundation Models [0.0] Tabular Foundation Models (TFM) は、1回の前進パスで予測タスクを実行する能力によって近年大きな関心を集めている。
本研究では,TFMを用いてイベントの時刻を予測し,反復的に右検閲データを出力することで,生存率の劣化を抑える訓練のない手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:11:23 GMT)
Spin dynamics and ortho-para conversion in H$_{2}$O at the gas-ice phase transition in external magnetic fields [0.0] 外部磁場の存在下での水氷のスピンダイナミクスについて検討した。
電界強度の増大は双極子誘起脱分極を抑制することを示す。
その結果は、沈着中の核スピン偏光の保存や操作を目的としたスキームに関係している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:42:16 GMT)
Speech Emotion Recognition using Attention-based LSTM-Network with Residual Connection [0.0] 音声の感情認識は、現代の人間とコンピュータのインタラクションシステムにおいて重要な要素である。
本稿では,残差接続をソフトアテンションと統合した軽量アーキテクチャであるResLSTM-SAを提案する。
最高の性能を持つ変種(ResLSTM-SA-h64)は最大で0.6517のUARを達成し、46.8kの訓練可能なパラメータしか持たない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:08:59 GMT)
Spectral Scaling Laws of Muon [0.0] 運動量行列の特異値スペクトルがトレーニング中にどのように振る舞うかを考察する。
77Mから2.8Bパラメータのモデルにおいて、運動量バッファの特異値の量子化を追跡する。
我々の法則は、実践者に対して、重要な方向を直交する最小のNS構成を選択するための、原則化されたレイヤー対応のレシピを提供します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:31:21 GMT)
Short-Term Synaptic Plasticity Stabilizes Goal-Conditioned Dynamics in a PFC-Inspired Reservoir Model for Multistep Goal-Directed Action Planning [0.0] 短期的なシナプス可塑性は、目標情報をアクション・ユース・ダイナミクスとして安定化させることができることを示す。
これらの結果から, ゴール依存型実効リカレント接続の動的変調がロバストなゴールダイナミクスをサポートすることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:59:46 GMT)
Scattering and Bound States of Two Heteronuclear Ultracold Atoms in a Quasi-Two-Dimensional Confinement [0.0] 準二次元(準2次元)幾何学における超低温ヘテロ核原子の2体問題を解く。
複数の2次元散乱共鳴は、長手CoMと相対運動の結合によって引き起こされる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:45:14 GMT)
Sample Complexity and Decision-Theoretic Guarantees for Bayesian Model Averaging over Decision Trees with Catalan-Exponential Priors [0.0] ダイリクレ・マルティノミカルリーフモデルとカタルーニャ指数木サイズの先行モデルを用いてベイズ決定木 (BDT) を閉形式で解答する。
我々は有理コミットメントしきい値の完全非漸近理論を確立する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:54:11 GMT)
Same Weights, Different Robot: A Deployment Safety View of VLA Policies [0.0] 視覚言語アクション(VLA)ポリシーは、しばしばチェックポイント定義オブジェクトとして扱われる。
安全レビューは、実行可能なロボットポリシーを欠いている間、チェックポイントを認証することができる。
我々はこのギャップを実行可能なポリシー仕様問題として定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:45:00 GMT)
Safecloud: A Distributed, Encrypted Storage Cloud for Streaming [0.0] 我々は、分散暗号化されたセルフ価格のストレージおよびストリーミングネットワークであるSafecloudを紹介します。
各ファイルはチャンクに分割され、所有者のデバイスに暗号化され、ドロップとジェットに分散される。
所有者または権限付与者だけが復号することができる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:12:42 GMT)
SPADE: Sketch-guided Path Planning Augmented with Diffusion Experts [0.0] 最近の最先端フレームワークは、模倣学習を利用して、専門家によるデモンストレーションから行動固有の経路計画モデルを訓練している。
これらのアプローチは、目に見えない環境への限定的な一般化と、デモコレクションにおけるロバストさの2つの重要な制限に直面している。
本稿では、ROS 2上に構築されたアノテーションツールの改訂と、拡散ベースの拡張をベースラインの行動クローンモデルに統合する新しいトレーニング戦略という、2つの主要な貢献に焦点を当てた拡張フレームワークを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:29:00 GMT)
Reproducibility is the New Copyleft: Defining AGI-oriented Reproducible Builds [0.0] Copyleft(コピーレフト)は、ソースコードを配布のすべての行為に結び付けることによって、ユーザーの自由を保証するために著作権を使用した法的ハックである。
本稿では、AGIのコピーレフトの機能的類似は、コード上の共有のような条項ではなく、再現可能なビルドに基礎を置いていなければならないと論じる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:50:24 GMT)
Reliability-Guided Depth Fusion for Glare-Resilient Navigation Costmaps [0.0] 反射床、ガラス境界、光沢のある屋内表面の光沢は、アクティブステレオRGB-D深度測定を頻繁に破壊する。
本稿では,明示的な深度信頼度モデルに基づくグレアレジリエントなコストマップ構築手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:06:15 GMT)
RelGT-AC: A Relational Graph Transformer for Autocomplete Tasks in Relational Databases [0.0] 本稿ではRelGT-AC(Relational Graph Transformer for Autocomplete)を提案する。
3つのRelBench v2データセットにまたがる7つのタスクで、RelGT-ACは3つの回帰オートコンプリートタスクすべてでGraphSAGEベースラインを上回り、テキスト重可読タスクで最大AUROCポイントを達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:25:53 GMT)
ROBUST-WT: Robust Uncertainty-aware Segmentation Transform via Whitening and Training Enhancements [0.0] 本研究では,Whitening Transform-based Probabilistic Shape Regularization Extractor (WT-PSE)学習フレームワークの改良を体系的に検討した。
基礎光学ディスクセグメンテーションベンチマークの実験では、改良されたパイプラインが最終的なエポックディスクDiceスコア0.956とASDスコア13.31を達成し、ベースラインのエポック5Diceスコア0.939を上回った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:59:35 GMT)
QuITE: Query-Based Irregular Time Series Embedding [0.0] IMTS用の簡易かつ効果的なプラグアンドプレイ埋め込みモジュールQuITE(Query-Based Irregular Time Series Embedding)を紹介する。
QuITEは学習可能なクエリトークンを使用して、単一の自己アテンション層を通じて不規則な観測を集約する。
実験の結果、QuITEはMCSモデルを継続的に改善し、予測値の平均相対利得は54.7%、分類値が15.8%である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:37:54 GMT)
Q-FE: A Quantum-Native 6G Far-Edge Architecture Securing Industrial IoT Digital Twins via CSIDH-PQC and Asynchronous Federated Learning [0.0] 3つの共設計コンポーネントを統合した量子Native 6G Far-EdgeアーキテクチャであるQ-FEを提案する。
Q-FEはMAC層オーバーヘッドをML-KEM/Kyber-1024に対して62%削減し、P99.9 URLLCレイテンシを0.78msで維持し、同期フェデレートラーニングよりも31%高速化する。
正式な脅威モデルは、量子盗聴、モデル中毒、シビル攻撃に対するレジリエンスを確認する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:13:44 GMT)
Pure states for subregions in gravity and their entanglement entropy [0.0] 量子重力における空間的部分領域は、混合された密度行列ではなく純粋状態に割り当てられることが提案されている。
状態は、空間部分領域を含む時空部分領域が固定され、フィールド構成と周囲幾何学が要約される部分凍結重力経路積分によって作成される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:56:33 GMT)
Probabilistic learning to perform pre-onset individualised prediction of disease severity: application to Veno Occlusive Disease [0.0] 我々は,患者が発症する重症度を,信頼性,自動化,早期に予測できる新しい確率論的教師あり学習アプローチを推進している。
対象患者のデジタル双生児(DT)におけるVeno Occlusive Disease(VOD)の重症度スコアの移植前予測を通じて,予測能力を示す。
このような自動予測を行うためにAI施設が開発され、医師は、患者が検討中のDTを特徴付ける移植前状態にデータを入力する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:23:36 GMT)
Privilege Risk Evolution for Non-Human Identities: A Temporal Fiber Model for Cloud IAM [0.0] クラウドパーミッションガバナンスは、パーミッション等価性を静的な関係として暗黙的に扱う。
非人間的同一性に対して、同値性は2つの既約成分を持つことを示す。
我々は、時間的同値特権回路の下で同値類を呼ぶ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:52:01 GMT)
Predicting the Neutrino Mass Ordering Using Neural Networks [0.0] 合成長周期データセットに基づいて学習したフィードフォワードニューラルネットワーク分類器を用いて,大規模注文決定のための機械学習戦略を検討する。
ニューラルネットワークは、従来のシナリオに匹敵するパフォーマンスを実現し、確立された分析の柔軟で独立したクロスチェックを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:00:02 GMT)
Post-Selection Free Generation of Multi-Photon Added Coherent States [0.0] 本稿では,高忠実度多光子付加コヒーレント状態の選択後自由生成のためのプロトコルを提案する。
我々の結果は、確立された量子光学プラットフォームを用いて、複雑な非古典状態への決定論的経路を解き明かす。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:25:59 GMT)
Populating topologically protected edge states of a Chern insulator with the cold-atom elevator scheme and measurements [0.0] 二次元チャーン絶縁体は、位相的に保護されたキラルエッジ電流をサポートする。
以前は、貯水池から粒子を移動させることで、チャーン絶縁体の選択した端状態の群を発生させることができることが示されている。
本研究では, 貯水池が廃棄される前に, 即時投射計測を行うことが貯水池に与える影響を数値的に検討する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:21:15 GMT)
Perturbative results for fractional quantum mechanics [0.0] 分数的なシュルディンガー方程式は、通常の非相対論的形式からわずかに逸脱する運動エネルギーで研究される。
通常の摂動理論は封筒理論と比較して用いられる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:40:21 GMT)
P-Cast Precision in FP8 Attention: Sink-Induced Collapse and the Optimality of S=2^8 [0.0] 注意シンク現象下での出力精度に影響を与える2つの実装選択を解析する。
前方 KV 反復が "P-崩壊" を引き起こすことを示す -- 先行順に、Phi (Delta + delta_k - 6.93 - ln S) の非シンク P 値がゼロとなる。
また、S = 256 = 28 をビットエクササイズ IEEE 754 スケーリングを同時に満足する静的スケールとして構成的に特徴づける。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:29:15 GMT)
Out-of-time-order correlators for Swanson Hamiltonian with interaction terms [0.0] 我々は、標準位置と運動量演算子のための時間外順序相関器(OTOC)を演算する。
本分析は, 積分性, 非線形性, 駆動性, パリティ時間対称性が, 作用素相関の時間的成長をいかに形作るかを明らかにする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:47:13 GMT)
Optimal Design and Analytical Modeling of a Soft Fin-Ray Effect Gripper Finger Using the Finite Rigid Elements Method [0.0] 本研究の目的は、フィンレイエフェクト(FRE)軟式グリップフィンガーの設計、製造、モデル化である。
このデザインは、適応性と正確な力の応用の両方を必要とするトマトなどの繊細な農作物を優雅に把握することを目的としている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:48:26 GMT)
Optical Memory Optimization Across Rubidium Isotopes and Transitions [0.0] 我々は,8,5mathrmRb$および8,7mathrmRb$同位体の光メモリ効率と記憶時間について検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:39:14 GMT)
Operator spreading in random circuits with orthogonal or symplectic symmetry [0.0] アンサンブル平均のパウリ弦重みは、ユニタリ不変回路のバイナリ構造ではなく、三値構造に緩和される。
qudit size $q=2$ の場合、蝶の速度はハール・ランダムのアンサンブルを超える。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:45:55 GMT)
Operationalizing Cyber Attack Prediction: A Gap-Prioritized Framework with Dataset and Model Selection Guidelines [0.0] 本稿では、150以上のベンチマークデータセットと200以上の研究を総合的に分析し、5つの実装ハードルを特定し、優先順位付けする。
本稿では,検出効果,実装コスト,修復時間に基づいて,これらの制限を評価する新たなギャップ優先化フレームワークを提案する。
この研究は学術的な知見を、堅牢で生産指向のAI駆動型サイバーディフェンスのための実用的な意思決定支援ツールに翻訳する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:29:53 GMT)
OpenAgenet/OAN: Technical Architecture for Trust-Governed Agent Identity and Discovery [0.0] 本稿では,OpenAgenet/OANの技術アーキテクチャについて述べる。
OANは、オープンエージェント相互接続のためのプロトコル中立層である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:18:14 GMT)
OpenAgenet/OAN: Open Infrastructure for Trusted Agent Interconnection [0.0] OpenAgenet(略してOAN)は、信頼できる相互接続エージェントのためのオープンインフラストラクチャプロジェクトである。
Agentsが分離されたアプリケーションからオープンなマルチオペレータネットワークに移行すると、その問題に対処する。
OANはプロトコルニュートラルな信頼層として設計されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:14:34 GMT)
On dynamic multi-agent pathfinding methods: review, simulations and modifications [0.0] 本稿では,Dijkstra,D* Lite,Space-Time A*,WHCA*,M*の6つの代表アルゴリズムと,A**と表記される新しい手法を統一シミュレーションフレームワーク内で評価する。
提案したA**アルゴリズムは、オンライン時間適応からオフラインの幾何経路生成を分離するテンプレートベースのアプローチを導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:51:40 GMT)
Notarized Agents: Receiver-Attested Confidential Receipts for AI Agent Actions [0.0] 現在のAIエージェントの可観測性は構造的に損なわれている。
妥協された、またはバギーなエージェントは、自身のトレースを省略、変更、または製造することができる。
本稿では,信頼境界を逆転することでこの問題を解決するプロトコルのクラスを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:21:58 GMT)
NetKV: Network-Aware Decode Instance Selection for Disaggregated LLM Inference [0.0] 現在のスケジューラは、計算負荷とプレフィックスキャッシュのローカリティのみをルートする。
ネットワーク用語を無視した場合、コンテキスト長が増加するにつれてキャッシュのみのスケジューリングが任意に準最適であることを示す。
我々は、NetKVがラウンドロビンで平均TTFTを21.2%、調整されたキャッシュ+ロード対応スケジューラで17.6%削減することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:06:57 GMT)
Multiparametric Quantum Sensing of Liquids Using NV Centres and Tethered Magnetic Nanoparticles [0.0] 本研究では, 窒素空孔中心磁束, 緩和率, 表面張力ナノ粒子を用いた非侵襲多パラメータ液体解析法を提案する。
ダイヤモンド表面を異なる長さ、配列、化学修飾のDNAテザーによって機能された領域で空間的にパターン化することにより、単一の液体を高次元の量子応答ベクトルにマッピングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:15:42 GMT)
Mott transition of photons: quantum Monte Carlo study of Gross-Neveu criticality in a cavity [0.0] ミツバチ格子上のハバードモデルは半金属-絶縁体モット転移の原始的実現である。
負符号のないフェルミオン量子モンテカルロアルゴリズムを定式化し、有限系サイズでのバイアスのない結果が得られる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:50:21 GMT)
MariData: One-Step Unpaired Image Translation for Maritime Environments [0.0] 本稿では,一段階の無人翻訳アーキテクチャであるCycleGAN-turboを用いて,合成海洋データを生成するフレームワークを提案する。
我々は7000枚の海洋画像のデータセットを収集し、デイ・トゥ・フォグギー、デイ・トゥ・サンセット、デイ・トゥ・ナイトドメイン翻訳のモデルを訓練し、評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:05:55 GMT)
Machine-Learning Prediction of Quantum Fisher Information from Collective Spin and Spectral Features [0.0] 本研究では,実験的に利用可能な量の限られたセットから,Quantum Fisher情報の予測範囲について検討する。
物理的に動機づけられた特徴を比較することにより,QFIを規定する主要な特徴集合を同定する。
我々は,QFIが主に密度行列の集団共分散と低次スペクトルモーメントの相互作用によって制御されることを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:45:09 GMT)
Lexicons and grammars for language processing: industrial or handcrafted products? [0.0] 語彙や文法の構成過程のほとんどは手作業である。
レキシコンや文法の情報内容はコーパスよりも豊かである。
言語技術のスペシャリストは、手作業で構築されたリソースを扱うのに徐々に慣れていく。
辞書と文法の構築プロセスは自動化され、工業化されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:55:44 GMT)
Kinematical correlations via $κ$-Poincaré coproducts [0.0] ミンコフスキー時空におけるホップ代数運動量組成則の運動論的結果について検討する。
シングルブランチ方式では、これは単に変形した相関積である一方、マルチブランチ方式では、$P_$で指定された状態は別個の予備枝に拡張することができる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:21:42 GMT)
KITE: A Tri-Modal Transformer Integrating Text, Images, and Knowledge Graphs for Fake News Detection [0.0] 本稿では,テキスト,視覚,事実の知識表現を共同でモデル化する3モーダルな偽ニュース検出フレームワークKITEを紹介する。
KITEは、テキスト、視覚、知識機能を統合するためにマルチモーダルトランスフォーマー内で、相互に注意を払っており、各モーダルが相互にどのように関連しているかを理解するのに役立っている。
ベンチマークデータセットによる評価は、KITEが単調なベースラインとバイモーダルのベースラインを著しく上回っていることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:03:17 GMT)
Intellectual Humility as a Cognitive Filter for AI-Generated Health Misinformation. An Evolutionary Perspective on Epistemic Vigilance [0.0] 本研究では,知的な謙虚さがAIによる健康対話の評価にどのように影響するかを検討する。
謙虚度が高い人は疑似科学的内容の信頼性が著しく低いと評価した。
我々はこれらの知見を進化レンズで解釈し、情報に不確実な環境をナビゲートするための祖先適応をIHが示すことを示唆した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:23:09 GMT)
Inhomogeneous Light-Matter Coupling as a Resource for Noiseless Quantum Memory [0.0] 2レベル系の不均一アンサンブルは、基本的な光物質物理学および量子ネットワーク応用において重要である。
我々は,このようなシステムにおける集合力学の直観的かつ解析的な記述を提供する一般的な導波管モデルを開発した。
エコーに基づく量子記憶の場合、このモデルは断熱パルスによるノイズ・エチョ抑制の物理的起源を明らかにする。
絡み合い発生のため、同じ機構は、未探索のロバスト制御パルスの制限を露呈し、新しい複合パルスプロトコルをもたらす。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:03:44 GMT)
Incremental Sheaf Cohomology on Cellular Complexes: O(1)-in-n Lazy Edit Processing under Bounded Local Geometry [0.0] 最初のせん断コホモロジーの漸進的維持のためのアルゴリズム的枠組み:H1(X; MathcalF)$ 有限次元の細胞シーブを備えた動的に進化する1次元細胞複合体について。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:26:02 GMT)
Human-AI Collaboration and the Transformation of Software Engineering Work [0.0] Generative AI(GenAI)とAgenic AIのソフトウェア開発への統合は、ソフトウェアエンジニアリングの再構成である。
私たちは、どの伝統的なアクティビティが自動化されているか、拡張されているか、新しく現れているかをマップします。
我々は、実証可能な9つの命題を導き、理論、産業労働の変革、大学のカリキュラム、組織的リーダーシップへの意味を明確に示します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:36:39 GMT)
How Visible Are Silent Manipulation Failures? An Observability Study of False-Success Detection in Simulated Robot Episodes [0.0] ロボット操作の模倣学習ポリシーは、トレーニングエピソードに付随する成功ラベルの品質を継承する。
ロボットが実際にタスクの結果が間違っていた場合、成功として記録するエピソードだ。
本研究では,2つのALOHAタスクのシミュレーションテストベッドを構築し,ラベル編集ではなく環境摂動による障害を誘導し,検出者が決して見ることのない特権的シミュレータ状態によって各エピソードをラベル付けし,ロボットがフラグ付けしたエピソードのみを成功に維持する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:22:13 GMT)
HorusEye: Language as Dynamic Attention for Emergency Visual Analysis [0.0] 緊急視覚分析のための動的注意のための言語HorusEyeを紹介する。
RefCOCO-Degradedは15,244枚の画像のデータセットであり、視覚的な系統的な劣化がある。
私たちの重要な発見は、言語フィードバックの有効性がモデルに依存していることです。
熱画像において,RGB性能向上のための収穫戦略が破滅的に失敗する「熱パラドックス」を同定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:31:13 GMT)
HighTide: An Agent-Curated Open-Source VLSI Benchmark Suite [0.0] HighTideは進化中のAI支援ベンチマークスイートだ。
このスイートは公開されており、オープンソースのハードウェアエコシステムと共に成長するよう設計されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:34:35 GMT)
High-Precision APT Malware Attribution with Out-of-Scope Resilience [0.0] そこで本稿では, 格付け二元分類器を用いた高精度なAPTマルウェア帰属手法を提案する。
APT Malware データセットと、スコープ外動作のストレステストを目的とした、より大きな組み合わせデータセットについて、本手法の評価を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:44:46 GMT)
High-Dimensional Quantum Key Distribution via full Core-mode Encoding over Deployed Multicore Fibers [0.0] 量子鍵分布(QKD)は、量子物理学に根ざした情報理論のセキュリティを提供する。
高次元(HD)符号化は、ノイズ耐性とシークレットキー収率の両方を増加させる。
次世代通信ネットワークの先駆的プラットフォームであるマルチコアファイバ(MCF)は、HD-QKDの天然基板である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:58:35 GMT)
Hierarchical GRU with Input-Conditioned Slot Queries for Ball Action Anticipation [0.0] フットボール放送ビデオにおいて,ボールアクション予測のための階層モデルを提案する。
このシステムは、次の5秒のウィンドウで発生したアクションを10クラスにわたって予測する。
SoccerNet Ball Action Precipationベンチマークでは,テストサーバ上で17.91%のmAPを達成した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:39:12 GMT)
Graphical and algebraic methods for Boolean factoring [0.0] 我々はESOPとSOPの両表現を分解する新しいアルゴリズムを開発した。
ANDカウントは古典回路や量子回路で可逆関数を実装するのに必要な AND と Toffoli の数を決定する上で重要な役割を果たしている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:57:27 GMT)
Geometric Instability and Self-Limitation in Driven Quantum Systems [0.0] 我々は、駆動量子系における局所的非断熱性のための統一的な幾何学的枠組みを開発する。
量子状態の進化速度とスペクトルギャップ保護の競合を測る普遍的な次元のない不安定パラメータを導入する。
このフレームワークは自然に、バーズ計量と量子フィッシャー幾何学を通して、オープン量子システムに拡張される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:04:44 GMT)
Generating quantum ensembles via reverse-time quantum diffusions [0.0] 連続的に測定された量子系の量子拡散に対する逆時間 denoising 理論を確立する。
我々は、デノナイジング力学が物理的に許容できる量子拡散であり、同じ測定誘起ノイズを持つことを証明した。
これは、単純な分布のサンプルをより複雑な量子状態のアンサンブルに変換するための原則化されたフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:27:04 GMT)
Gender-Dependent Diagnostic Substitution in LLM Medical Triage: Same Symptoms, Unequal Urgency [0.0] 症例の性別と年齢が異なる場合, 大規模言語モデルが同一の神経症状に対して, 異なる医用トリアージを推奨するか否かを検討する。
本研究は,7つの人口動態条件にまたがって標準化された症状プロファイルを示す。
ジェンダーに依存した男女差がある。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:35:12 GMT)
Fully Automated Identification of Lexical Alignment and Preference-Stage Shifts in Large Language Models [0.0] ChatGPTのようなデジタルチャットアシスタントが使用する言語は、人間の期待(ミスアライメント)から逸脱することができる
本稿では,レキシカルアライメントスコア (Lexical Alignment Score) と三角優先シフト (Triangulated Preference Shift) の2つの評価指標について述べる。
この手順は、手動による介入なしに、"suggest"、"additionally"、"strategy"などの過剰使用項目を特定し、彼らの嗜好学習との関係を推定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:23:45 GMT)
From Prompt to Service: An SLM-Based Agent Orchestration Gateway for AI-Driven Virtual Worlds [0.0] 本稿では,AI駆動型仮想世界のためのSLMベースのエージェントオーケストレーションゲートウェイを提案する。
エッジデプロイされたSLMは、各ユーザプロンプトのセマンティックインテントを分類し、サービスレジストリがルーティング決定を検証して解決し、選択されたバックエンドが透過的に呼び出される。
ゲートウェイはInterwovenXRバーチャルミュージアムテストベッド内で実装され、評価される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:22:03 GMT)
From Control Boundary to Insurance Claim: Reconstructing AI-Mediated Losses Through the CER Framework [0.0] 本稿では,保険のAIシステムが因果連鎖にある損失に対処する。
具体的には、AI残差リスク伝達のためのユースケースレベルの診断であるCERを紹介する。
この論文は、AI固有の再構築問題を定義し、CERを通じてその問題を運用し、AI再構築のためのクレームグレードの証拠を特定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:29:43 GMT)
From 3D Perception to Safety Reasoning: A Graph-Based Framework for Real-Time Underground Mine Monitoring [0.0] 本稿では,カラー化した3次元点群を構造化・追跡可能な安全推論出力に変換する連続監視フレームワークを提案する。
このフレームワークは、3Dセマンティック認識、不確実性に基づく異常検出、ルールベースのハザードチェック、オンデバイスLSM推論、およびGraphRAGベースのメモリ分析を組み合わせる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:37:38 GMT)
FlowGuard: Flow Matching for Identity-Independent Detection of Data-Free Model Stealing Attacks on Energy System Intrusion Detection Systems [0.0] FlowGuardは、入ってくるクエリをアウト・オブ・ディストリビューション(OOD)として分類するフローマッチングに基づく、IDに依存しない防御である。
このアプローチは、データフリーモデル盗難攻撃のために合成的に生成されたクエリが、実際のネットワークトラフィックよりも低次元の多様体を占有しているという事実を生かしている。
我々は,MAZE と DisGUIDE 攻撃を用いたPRADA と FDINet に対して,単サイクルで分散した (100-client Sybil) 設定で評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:18:45 GMT)
FPGA Based Feedforward System for Photonic Quantum Computing Applications [0.0] フィールドプログラマブルゲートアレイは、新興量子およびフォトニック技術におけるリアルタイム信号処理のための高性能なソリューションを提供する。
FPGAを用いた高速フィードフォワードシステムを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:18:29 GMT)
FORGE: Multi-Agent Graduated Exploitation and Detection Engineering [0.0] 本稿では,3つのサイロを橋渡しするマルチエージェントシステムFOGEについて述べる。
5つの特殊なエージェントが固定パイプラインで実行し、CVEメタデータからターゲットとする脆弱なアプリケーションを生成する。
階層化された知識アーキテクチャは、アセスメント、ビルド、エクスプロイトの経験をその後のCVEに転送するインテリジェンスを蓄積する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:32:28 GMT)
Extracting accent features in spoken Brazilian Portuguese without sociolinguistic labels [0.0] ブラジルポルトガル語(pt-BR)の地域アクセント分類は、信頼できるラベリングの必要性に悩まされている。
本研究は,音響ラベルのみを用いた特徴抽出のための新しいワークフローを導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:37:25 GMT)
Exploring the Topology and Memory of Consensus: How LLM Agents Agree, Fragment, or Settle When Forming Conventions [0.0] 2つの設計選択が、メモリの協調効果のサインを反転させる方法でどのように相互作用するかを示す。
固定16エージェントトポロジ上でのネットワークナーミングゲームによる432回のシミュレーションでは,メモリ深度とネットワーク構造が異なる。
解析的に抽出可能な生成機構の探索において,エージェントの選択はFactitious Playによってよく捉えられていることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:31:54 GMT)
EvalStop: Using World Feedback to Detect and Correct Reward Overoptimization in Multi-Tenant RLHF Platforms [0.0] クラウドファインチューニングプラットフォームは、学習された報酬モデルが人間の品質のプロキシとして最適化される、RLHFワークロードにますます役立ちます。
EvalStopは、k連続のevalスコアダウンのジョブを終了し、GPUをリリースし、最高のチェックポイントを保持し、ベーススケジューラに委譲する。
RLHF重負荷では、EvalStopは精度98%/リコール99%/FPR 1.5%を実現し、JCTを9%改善し、SRTF-Estを22%削減した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:03:39 GMT)
Essential Unitarity for Higher-Order Quantum Computation [0.0] モルフィズムは、実行によって構成される分極境界リンクであり、可逆的な制御と分岐を提供する単位自由モノイド和である。
基本ユニタリティは、ダガーモノイド構造、コヒーレンス再帰、カリー化と互換性のある独特な述語である。
このフレームワークは、コヒーレントな量子スイッチと他の1スロット、等比、純度保存されたスーパーマップをコヒーレントな純粋コムダイレーションとして実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:55:36 GMT)
Entropy Gate: Entropy Quenching for Near-Lossless Token Compression in LLM Pipelines [0.0] LLMパイプラインは、低情報コンテンツにかなりのトークン予算を浪費する。
エントロピー・クエンチングを適用したトークン圧縮フレームワークであるエントロピー・ゲートを紹介する。
フレームワークはステートレスで、モデルに依存しず、OpenAI互換のHTTPプロキシとしてデプロイされる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:55:02 GMT)
Energy-selective quantum search with Ising Hamiltonian phase oracles [0.0] 物理進化(exp(-mathrmi T H))を直接ハミルトニアン相オラクルとして用いるエネルギー選択的量子探索プリミティブについて検討する。
それにもかかわらず、Grover拡散演算子との交互にGrover型増幅ピークを生成することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:24:05 GMT)
End-to-End Text Line Detection and Ordering [0.0] Orliは、両方のサブタスクを単一のイメージ・ツー・シーケンス問題としてキャストするエンドツーエンドモデルである。
ページイメージから、Orliは読み順でテキスト行のベースラインを直接自動回帰生成する。
10の書記システムにまたがる196,691ページの異種コーパスで訓練された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:29:32 GMT)
Emergent Ordinal Geometry in Transformers Trained on Local Comparisons [0.0] 推移的推論は、A Cが隣接関係のみを知ること(A B, B C)を推測する挑戦である。
我々はトランスフォーマーが同じプリミティブを取得し、隠れた全順序から隣接した比較のみに基づいて小さなモデルを訓練するかどうかを問う。
分布外一般化は、目覚ましい幾何学的再編成とともに現れる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:31:43 GMT)
Emergence of Macroscopic Quantum Order via Translational Zero Modes [0.0] 電子励起と変形可能な格子との強い結合は異なる経路を可能にすることを示す。
臨界密度を超えると、この結合は自己生成された凝縮電位を核化し、それらを生成する非常に励起を阻害する。
これは、固定スペクトル内での冷却やペアリング不安定性など、マクロ的な量子秩序への一般的な経路を確立する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:12:57 GMT)
Efficient Quantum Error Mitigation for Unitary k-Designs [0.0] ノイズの多いハードウェアは 量子回路を無数のエラー源に 依存させる
我々は、回路全体の分極を推定するために、一元的k-設計パウリ支援分布を用いる。
本手法は、2ビットのゲートオーバーヘッドを発生させることなく、一元的k-設計におけるゲートベースの誤差を効果的に低減することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:52:08 GMT)
DriftSched: Adaptive QoS-Aware Scheduling under Runtime Token Drift for Multi-Tenant GPU Inference [0.0] 大規模言語モデル(LLM)推論サービスは、効率的なマルチテナントGPUスケジューリングの需要を増大させている。
本稿では,マルチテナントGPUスケジューリングのための適応型スケジューリングフレームワークDriftSchedを提案する。
このフレームワークは、不均一なマルチテナントワークロードの下で、FIFO、プライオリティ、重み付け、最短ジョブファースト(SJF)、老化優先度スケジューリングポリシーを評価する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:39:31 GMT)
Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models [0.0] 本研究では,文脈拡張型言語モデルシステムが読者モデル行動に与える影響について検討する。
本稿では,500 MMLU-Pro 項目の固定コンテンツプローブについて紹介する。
各項目は、異なる談話ロールラベルの下で同じ誤解を招く答えを持つアサーションを受け取る。
GPT-5.5, DeepSeek V4 Pro, Llama-3-8B-Instruct, Qwen2.5-7B-Instruct, Misleading Adoption Rate shifts by 56-84%
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:12:57 GMT)
Detecting and Mitigating Bias by Treating Fairness as a Symmetry Operation [0.0] 我々は、バイアスを対称性の破れ演算として定式化し、損失に基づく正規化を対称性の回復機構として実装する。
ノイズ,相関,バイアスのレベルが異なる4つの合成データセットの枠組みを評価する。
このフレームワークは因果グラフの知識を必要とせず、計算的に軽量であり、ビットフリップとして定義可能なあらゆる感度属性に一般化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:42:54 GMT)
Decomposing how prompting steers behavior [0.0] 我々は、プロンプトによる表現変化を解釈可能な幾何学的成分に分解する。
我々のフレームワークは、モデルがタスク関連構造をルートして、プロンプト駆動の振る舞いを生成する方法を明らかにする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:27:24 GMT)
DMF: A Deterministic Memory Framework for Conversational AI Agents [0.0] 我々は、生成メモリ圧縮を完全な決定論的パイプラインに置き換えるCPUファーストアプローチである決定論的メモリフレームワーク(DMF)を提案する。
DMFは、決定論的コンテンツ信号、会話の手がかり、構造化された前兆から計算されたSurvival Scoreを、ロジスティック・プロジェクションで組み合わせて割り当てる。
LoCoMoとLongMemEvalのデータセットを使用して、目的を組み込んだベンチマークで実験を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:41:28 GMT)
Cross-Lingual Token Arbitrage: Optimizing Code Agent Context Windows via Local LLM Preprocessing [0.0] 生の人間の入力の2つの病理は、非英語のテキストに対するトークン化の非効率性と会話のプロンプトにおける構造的エントロピーの2つのオーバーヘッドを駆動している。
既存のアプローチは、すでに肥大しているコンテキストを圧縮したり、障害が発生した後に介入することで、リアクティブに動作します。
我々は、開発者とクラウドエージェントの間で動作する、飛行前のエッジサイドのプロンプトリライトを導入します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:17:45 GMT)
CoughSense: Five-Class Respiratory Disease Classification via Whisper Encoder Fine-Tuning and Dual-Encoder Cross-Attention Fusion with Balanced Contrastive Learning [0.0] CoughSenseは5つのクラスに分類するシステムである。
これらは健康、新型コロナウイルス、喘息または呼吸器状態、気管支炎、肺炎である。
We used the OpenAI Whisper encoder as a pretrained backbone for cough disease classification。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:13:00 GMT)
Correcting Neural Operator Spectral Bias via Diffusion Posterior Sampling with Sparse Observations [0.0] ニューラル作用素は、数値解法よりも桁違いに高速な近似PDE解を代理する。
磁場のスパースセンサー測定もしばしば利用可能であり、スペクトル歪みを伴わないポイントワイズ精度を提供する。
拡散後サンプリングフレームワークにおけるNO予測を補助観測として扱うことでこの問題に対処する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:26:15 GMT)
Continuous-Variable Quantum State Tomography Enabled by Quantum Mirrors [0.0] 本稿では、入射フォトニック状態の完全な情報を制御原子系に転送するための量子ミラーを用いたプロトコルを提案する。
これにより、制御原子のみの測定により、完全なフォトニック状態のキャラクタリゼーションが可能になる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:03:55 GMT)
Constraint-Enhanced Physical Search through Correlation Matching [0.0] 本稿では,探索における時間的相関と更新ダイナミクスにおける制約による相関とを一致させる制約強化物理探索の原理を提案する。
保存法則は局所的な観測を空間的順序で微分的証拠に変換する一方で、時間的相関の駆動が探索を制御することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:15:21 GMT)
Consensus is Strategically Insufficient: Reasoning-Trace Disagreement as a Knowledge-Representation Signal [0.0] マルチエージェントシステムは通常、投票、コンセンサスプロトコル、討論、フォールトトレラントアグリゲーションを通じて不一致を減らすように設計されている。
我々は、この目的が、エージェントエラーよりも真の規範的不確実性を反映しているような、バリューラデンなタスクには不十分であると主張している。
本稿では,推論トレースとエージェント決定を記号的不一致状態に抽象化する知識表現層を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:21:02 GMT)
Computational conceptual history of scientific concepts: From early digital methods to LLMs [0.0] 本稿では,概念解析における計算手法の長い歴史の中で,大規模言語モデル(LLM)について述べる。
LLMが既存の手法にどのような影響を及ぼすか、どのようにして長年の問題を継承するか、そしてそれらを用いた最近のケーススタディをレビューする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:28:29 GMT)
Coexistence of dipolar and quadrupolar higher-order topology [0.0] 2次元高次トポロジカル絶縁体は通常、関連する不変量に応じて双極子または四極子に分類される。
この2つのクラスは以前は重複しないと考えられていた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:38:57 GMT)
Chirality routing non-polaritonic vacuum correlations in Landau polaritons [0.0] 物質と空洞真空場の超強結合は、電磁真空を構造化された量子環境に変えることができる。
近年の研究では、これらの特性変化に重要な要素として、光物質の絡み合いが特定されている。
多モードホップフィールドモデルにおける正確なカイラル電荷は、支配的な異常相関、スクイーズ、キャビティ-マッターの絡み合いを反対の分極に導出することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:33:37 GMT)
Characterizing quantum channels from local-unitary invariants [0.0] 入力状態やユニタリ上のハール積分から得られるモーメントと呼ばれる平均局所単位不変量を導入する。
これらの瞬間は、量子チャネルがどのように二分子絡みを創り、保存し、破壊するかを計算可能な記述を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:42:14 GMT)
Causal Evidence of Stack Representations in Modeling Counter Languages Using Transformers [0.0] 線形プローブはモデルの隠れ状態から各トークンのスタック深さを予測するために訓練される。
本稿では,これらの表現の因果的役割について考察する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:39:40 GMT)
Caught in the Act(ivation): Toward Pre-Output and Multi-Turn Detection of Credential Exfiltration by LLM Agents [0.0] 出力トークンが出力される前に,アクティベーションプローブがクレデンシャルアクセスを検出できるかどうかを検討する。
第3に,マルチターンフィルタを累積情報フロー問題として扱う。
その結果、クレデンシャル・エミッション・ディフェンスは、事前出力監視、カナリア検出、時間的漏洩会計を併用すべきであることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:53:17 GMT)
Capability Advertisement as a Market for Lemons: A Trust Layer for Heterogeneous Agent Networks [0.0] 大規模言語モデル(LLM)エージェントが作業の委譲を開始した。
これらのプロトコルは、宣伝された能力が静的で真実の事実であると仮定する。
その能力は確率的であり、入力に応じて変化し、基礎となるモデルが更新されたときにドリフトする。
したがって、呼び出し側はエージェントが何をするか、何ができるかではなく、エージェントが何をするかを判断する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:17:30 GMT)
Boson Models with Interactions of Arbitrary Order [0.0] 本論文は、ハミルトニアンを保存する回転不変かつボソン数で表される量子多ボソン系について考察する。
ボソン間の相互作用の順序 k は任意であり、任意の k に対して p=1 と p=2 のとき、N-ボソン状態の間の行列要素に対して閉公式が与えられる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:37:15 GMT)
Beyond Gradient Descent: Adam for Analog Ising Machines [0.0] モーメントとアダム最適化がアナログ連続型イジングマシンを改良できるかどうかを考察する。
我々は、Adamベースのダイナミクスにより、ターゲットの時間を大幅に削減し、ソリューションの品質を向上させることを発見した。
これらの結果は、アナログイジングマシンの強力な設計原理として、連続時間アダムダイナミクスを識別する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:11:40 GMT)
Behavioral and Performance Indicators of Depression and Anxiety in Electronic Learning Systems [0.0] 本研究は,Moodleを用いた学習管理システムから得られた行動指標と性能指標が,コンピュータ工学生のうつ病と不安との関連性について検討した。
いくつかの指標はうつ病と不安に大きく関連していた。
これらの結果から, 日常的なLMSデータは, 学生の幸福に関連する有意義な行動信号を与え, 精神保健関連疾患を経験する学生の早期の教育的認識を支援する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:08:07 GMT)
Bayes-Sufficient Representations in Supervised Learning [0.0] この研究は、固定された教師付き決定問題にどのような関係があるのかを問う。
表現は、ある予測ヘッドがベイズ最適作用則を実装するためにそれを利用することができれば、共同分布と損失に対してベイズ十分であると定義される。
固定教師付き問題の場合、分布と損失はベイズ作用を決定、ベイズ作用は商を決定、商はベイズ最適予測に必要な最小情報を決定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:13:31 GMT)
Bastet: A Fine-Grained Expert-Labeled Dataset for DeFi Smart Contract Vulnerability Detection [0.0] BastetはエキスパートラベルのDeFiスマートコントラクト脆弱性データセットである。
2021年4月から2024年11月までの394 Code4renaの競合監査レポートから4,402件の調査結果が得られた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:31:22 GMT)
Analytical Evaluation of DCA Convergence Properties for Minimizing Prediction Functions of Gaussian RBF Support Vector Regression [0.0] 本稿では、RBFカーネルの解析構造を利用して、凸関数(DC)アルゴリズム(DCA)の差分を適用したフレームワークを提案する。
直流成分の強凸パラメータとサブプロブレムの勾配リプシッツ定数の上界$L$の両方を閉形式で導出する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:25:21 GMT)
An efficient quantum Hadamard product algorithm for functions [0.0] 2つの量子状態のアダマール積状態を作成するための効率的な量子アルゴリズムを提案する。
本手法は入力関数のフーリエ空間表現を利用する。
また、その応用例として、部分内積に対する新しい量子回路を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:13:47 GMT)
An RRAM-based Hardware Implementation of a Radial Basis Function Neuron for Edge Classifiers [0.0] 本稿では,金属酸化物抵抗RAM(RRAM)を利用したニューラルネットワーク(ANN)の設計について述べる。
提案した設計は、ACAMモジュールを構築するのに使用されるカスタムテンプレート piXeL (TXL) セルに基づいている。
このハードウェアエンジンはオンザフライ学習を可能にし、受容場パラメータを調整してドメインシフトを追跡することができる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:08:11 GMT)
AlgoTouch: An Execution-Centered Approach to Incremental Construction of Imperative Programs [0.0] AlgoTouchは命令型プログラムをインクリメンタルに構築するための実行ベースのシステムである。
データストレージ、計算、制御フローを公開する明示的な記法機械に依存している。
AlgoTouchはPython、C、C++、Javaで正しい読みやすいプログラムを自動的に生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:57:49 GMT)
A Geometric Lens on Physics-Aligned Data Compression [0.0] AI for Scienceでは、科学データのために学習した圧縮機を訓練するために物理学による損失が増えているが、その速度歪みの影響はいまだに理解されていない。
我々は、このトレードオフがエントロピーモデル、物理的可観測性、および歪み計量によって誘導される潜在空間感度の相互作用によって制御されることを示す局所幾何学理論を開発する。
我々はこれを局所的接空間速度歪み法により定式化し、支配的固有空間重なりに基づく実用的なアライメント診断を導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:44:53 GMT)
A Fast Methane Detection Pipeline on Board Satellites Based on Mag1c-SAS and LinkNet [0.0] メタンは温室効果ガスであり、ハイパースペクトル衛星画像によって早期に漏れを検出することで、気候変動の緩和に役立てることができる。
従来のメタン検出方法は、リソース限定のオンボードハードウェアには計算的に要求されすぎている。
この研究は、効率的で低消費電力のアルゴリズムに焦点を当てたメタン検出を加速する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:59:47 GMT)
A Benchmarking Framework for Multimodal User Interface Toolkits: Comparing Modality Coverage, Developer Workflow, and Experimental Support [0.0] マルチモーダルユーザーインタフェースは、音声、ジェスチャー、視覚、視線、触覚、生体信号、その他のセンサーデータを組み合わせている。
Geno、Multisensor-Pipeline (MSP)、ReactGenie、EmoSyncといった過去5年間のツールキットは、開発者がそのようなインターフェースを簡単にプロトタイプできるようにすることを目指している。
しかし、この分野には、これらのツールキットが実際にサポートしているもの、開発者がどれだけ実装をオフロードするか、どの評価戦略が適切なのかを比較するための、体系的で再利用可能な方法がない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:31:38 GMT)