Geometry-Aware Dataset Condensation for Diffusion Model Training [103.5] 幾何学的分布アライメント問題として,実部分集合選択を再構成することを提案する。
本手法は,一方的な部分的最適輸送を組み込むことで,コンパクトな部分集合を全データ分布に選択的に整列させる。
拡散変形, 部分集合サイズ, 画像解像度, 訓練ラウンドにおける実験により, 本手法が優れた忠実度と分布範囲を実現することを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:53:58 GMT)
SkillComposer: Learning to Evolve Agent Skills for Specification and Generalization [99.2] エージェントスキルは、エージェントの推論とアクションをガイドする再利用可能な戦略である。
現在の技術構築手法は、問題を一発抽出として扱う。
本稿では,スキル構築を3つの学習可能な操作に分解するフレームワークであるSkillComposerを紹介する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:16:08 GMT)
ActiveMimic: Egocentric Video Pretraining with Active Perception [84.3] エゴセントリックな人間のビデオは、事前トレーニングのためのロボットデータに代わるスケーラブルな代替手段を提供する。
単体のRGBカメラから同期カメラと手首軌跡を復元する事前学習フレームワークであるActiveMimicを提案する。
我々は,ActiveMimicが人間のビデオで事前訓練されたベースラインを一貫して上回り,ロボットデータで事前訓練された最先端モデルと一致していることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:01:01 GMT)
PAC-Bayesian Adversarially Robust Generalization for Message Passing Graph Neural Networks: A Sensitivity Analysis [80.6] PAC-BayesianフレームワークをディープニューラルネットワークからメッセージパッシングGNNまで拡張する。
我々は、対向的な設定でより強固な一般化を導出する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:31:21 GMT)
CamFlow+: Hybrid Motion Bases for 2D Camera Motion Estimation with Stabilization Applications [80.5] 既存のホモグラフィーに基づく手法は、カメラ翻訳、深度変化、局所視差に苦慮している。
我々は,高密度フロー空間で直接2次元カメラの動きを表現するハイブリッド・ベーシックフレームワークCamFlow+を紹介する。
デジタルビデオの安定化では、CamFlow+はグローバルおよびローカルの安定性も向上し、ブラインドユーザスタディにおいて最高のトップ1の選好率を達成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:22:07 GMT)
YouZhi: Towards High-Concurrency Financial LLMs via Adaptive GQA-to-MLA Transition [78.5] 大きな言語モデル(LLM)は、大きな金融革新をもたらすが、そのデプロイメントはKVキャッシュメモリのオーバーヘッドによってボトルネックになる。
我々は,Huawei Ascendエコシステム上に構築された包括的な構造遷移とトレーニングパイプラインによって強化された,高効率な金融LLMであるYouZhi-LLMを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:44:37 GMT)
Towards World Models in Biomedical Research [77.6] 我々は,AIによる発見のパラダイムとして,バイオメディカルワールドモデルを提案する。
これらのモデルは、介入条件付き力学とともに、分子、細胞、組織、臨床状態の潜伏表現を学習する。
バイオメディカルワールドモデルは, 仮想細胞, オルガノイド, 仮想患者, 手術シミュレーションなど, データエンジン, 環境シミュレータ, 科学計画基板としてどのように機能するかを論じる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:28:54 GMT)
R^3: Composed Video Retrieval via Reasoning-Guided Recalling and Re-ranking [73.1] 本稿では、Reasoning-guided Recalling and Re rankを中心に構築されたゼロショット合成ビデオ検索パイプラインを提案する。
モデルは、編集を適用した後、期待されるターゲットビデオを記述する推論トレースを生成する。
この課題に対処する上で,本手法の有効性を実証した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:21:45 GMT)
Online KL-Regularized Reinforcement Learning with Function Approximation under Misspecification [71.0] KL-regularized contextual bandits and episodic reinforcement learning (RL) under general function approximation with model misspecification。
既存の保証は実現可能性に依存しており、従って古典的後悔境界が失敗する可能性のある不特定モデルにまで拡張しない。
本研究は、文脈的包帯と韻律的RLに対するKLの不特定式を導入し、Gibsポリシー更新を用いて回帰に基づくアルゴリズムを解析する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:54:23 GMT)
Goedel-Architect: Streamlining Formal Theorem Proving with Blueprint Generation and Refinement [69.8] 私たちはGoedel-Architectを紹介します。これは、青写真の生成と洗練に焦点を当てたLean 4で証明された公式な定理のためのフレームワークです。
Goedel-ArchitectがMiniF2Fテストで99.2%パス@1、PutnamBenchで75.6%パス@1を達成した。
これは、同等のオープンソースパイプラインよりも500倍低い価格で、オープンソースパイプラインの最先端のパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:54:44 GMT)
A Vision-language Framework for Comparative Reasoning in Radiology [68.5] 我々は,放射線学的比較を実体認識のクロスイメージ推論問題として定式化する。
我々は,日常的な画像とレポートのペアから得られた大規模比較画像資源を構築した。
臨床類似症例の検索を制御可能なエンティティ対応ビジュアルエンコーダであるMedReCoを開発した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:12:47 GMT)
AdaPlanBench: Evaluating Adaptive Planning in Large Language Model Agents under World and User Constraints [65.3] AdaPlanBenchは,Large Language Model (LLM)エージェントが適応的に計画し,段階的に明らかにされた制約の下で再計画できるかどうかを評価するための,インタラクティブなベンチマークである。
AdaPlanBenchは307の家庭用タスクに基づいて構築されている。
二重制約下での適応計画は依然として困難であり、最良のモデルは67.75%の精度にしか達していない。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:47:29 GMT)
Ouvia: A User-centered Framework for Measuring Usability of Speech Translation in Real-World Communication Scenarios [63.2] 音声翻訳(ST)はユーザアプリケーションではますます普及しているが、その評価は非テキスト化テストベッドと全体的な品質に重点を置いている。
実環境における音声翻訳のユーザビリティを評価するための評価フレームワークであるOuviaを紹介する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:52:21 GMT)
Knowledge Index of Noah's Ark [63.1] KINAは,261分野にわたる899項目のベンチマークである。
ボーナス・オン・バートーナメントがFOSDを弱く支配していることを示す。
トップモデルであるGemini-3.1-Pro-Previewは53.17%、Claude-Opus-4.6は49.92%、GPT-5.4は48.55%に達した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:37:51 GMT)
Benchmarks in Leipzig [62.7] 2026年4月1日から5月15日にかけて、49人の数学者のグループが研究レベルの数学質問のデータセットを編纂した。
5つの最先端LCMによる1回の試行、20ラン毎のモデル評価、および2つの重み付けモデルによる3回の試行の3段階でこれらの質問を評価した。
ステージ1以降も41の質問が未解決のままで,ステージ2以降は16に,ステージ3では未解決の質問が2つに留まった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:59:08 GMT)
CoFi-UCGen: Coarse-to-Fine Unsupervised Conditional Generation without Label Priors [62.7] 教師なし条件付き画像生成(UCGen)は、手動でアノテートされたラベルに頼ることなく生成を制御することを目的としている。
本研究では,大域的意味論を微粒なバリエーションから明確に切り離す,より粗いUCGenフレームワーク(CoFi-UCGen)を提案する。
我々のCoFi-UCGenは、画像の品質、セマンティック一貫性、制御精度において、既存のUCGenメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:29:29 GMT)
OpenWebRL: Demystifying Online Multi-turn Reinforcement Learning for Visual Web Agents [61.4] 実際のWebサイト上で,オンラインマルチターンRLによるビジュアルWebエージェントのトレーニングを行うオープンフレームワークであるOpenWebRLを紹介した。
OpenWebRLは、スケーラブルなライブブラウザインフラストラクチャを含む、完全なトレーニングパイプラインをカバーしている。
私たちはOpenWebRL-4Bをトレーニングします。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:03:30 GMT)
You Only Index Once: Cross-Layer Sparse Attention with Shared Routing [61.3] 層間スパースアテンション(A)はYOCOなどのKV共有アーキテクチャ上に構築されている。
シングルインデクサはトークンレベルのトップk選択を一度計算し、その結果のインデックスをレイヤ間で再利用する。
その結果、CLSAは正確かつ効率的であり、最大7.6倍のデコードスピードアップと17.1倍のスループット向上を実現している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:54:04 GMT)
Steering LLM Viewpoints through Fabricated Evidence Injection [61.2] 提案手法では,2段階のアタック・フレームワークを導入し,まず構成された有理数で誤解を招く文を再パッケージし,関連する問合せに応答する上で,これらの視点を組み込むことを目標LLMに指示する。
BBQ、ToxiGen、および我々の特別なデータセットの実験により、外部安全分類器を持たない商用LLMは、非常に脆弱であることが判明した。
そこで我々は,複数の防衛戦略について検討し,その中のひとつとして,gpt-oss-safeguardが81%の検知率を達成した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:48:23 GMT)
TempoVLA: Learning Speed-Controllable Vision-Language-Action Policies [58.4] 既存のVision-Language-Action Model (VLA) は、トレーニングデモから1つの固定速度を継承するのみである。
予測された各行動の大きさが、ロボットの動きの速さをすでに支配していることを観察する。
我々はこの観測結果を、明示的な条件で実行速度を制御する単一のVLAであるTempoVLAに変換する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:59:40 GMT)
Dream.exe: Can Video Generation Models Dream Executable Robot Manipulation? [57.2] 本稿では,ロボット操作を具体的かつ測定可能な窓として提案する。
もしモデルが本当に内在的な物理法則を持っているなら、その動きは実行可能なロボットの振る舞いに変換されるべきである。
Dream$.$exeは、ビデオから実行パイプラインを通じてこの基準を運用する評価フレームワークである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:52:20 GMT)
LimiX-2M: Mitigating Low-Rank Collapse and Attention Bottlenecks in Tabular Foundation Models [57.0] LimiX-2Mは2Mパラメータモデルであり、広く使われているベンチマークでTabPFN-v2とTabICLのベースラインを上回っている。
本稿では,強力なタブラル基礎モデル(TFM)のための統一トークン化・ルートフレームワークを提案する。
その結果、TFMにおける精度-効率トレードオフを改善するキーレバーとして、バリューアウェアトークン化とリードアウト整列ルーティングが強調された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:27:03 GMT)
AffordanceVLA: A Vision-Language-Action Model Empowering Action Generation through Affordance-Aware Understanding [55.5] AffordanceVLAは、タスク指向の中間表現として構造化された価格予測を導入する統一フレームワークである。
AffordanceVLAは様々な操作シナリオで高いパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:28:51 GMT)
Unsupervised Skill Discovery for Agentic Data Analysis [55.4] DataCOPEは、データ分析エージェントのための教師なし検証対象のスキル発見フレームワークである。
トラジェクトリ生成のためのデータ分析エージェント、信号抽出のための教師なし検証器、および対照的なスキル蒸留のためのスキルマネージャを反復的にコーディネートする。
我々は,Deep Data Researchのレポートスタイル分析とDABStepの推論スタイル解析についてDataCOPEを評価した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:20:47 GMT)
MemoryCard: Topic-Aware Multi-Modal Clue Compression for Long-Video Question Answering [54.5] MemoryCardは長いビデオを自己完結型メモリカードに整理する。
その結果、MemoryCardは、同等の視覚的な予算の下で、長時間ビデオのQAパフォーマンスを継続的に改善することを示した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:23:31 GMT)
What Objects Enable, Not What They Are: Functional Latent Spaces for Affordance Reasoning [54.3] 可視光を可視光空間(可視光空間)にマッピングする「A4D」を導入する。
A4Dは、既存の価格で94%の推測精度を達成し、最先端のアプローチを15%以上上回っている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:26:04 GMT)
Humans' ALMANAC: A Human Collaboration Dataset of Action-Level Mental Model Annotations for Agent Collaboration [54.2] 本稿ではエージェント協調のための行動レベル精神モデルAnnotationsのデータセットであるALMANACについて述べる。
ALMANACには2,987の協調アクションがあり、それぞれに理論インフォームドのメンタルモデルアノテーションが組み合わされている。
本研究は、ALMANACが人間の協調動作をシミュレートするモデルの能力を評価する上で有用であることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:56:12 GMT)
TAPO: Tool-Aware Policy Optimization via Credit Transfer for Multimodal Search Agents [54.1] ツール強化マルチモーダルサーチエージェントにおいて,クレジットミス割り当てをGRPOの系統的障害モードとして特徴付ける。
本稿では,情報取得ツールのパラメータ決定性を利用したツール・アウェア・ポリシー・オプティマイズ(TAPO)を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:15:43 GMT)
Efficient Mean Curvature Computation on High-Dimensional Data Manifolds [52.5] 高次元データセットの各点における局所的な平均曲率の推定は、機械学習アルゴリズムの重要な要素である。
本稿では,このコストを桁違いに削減する2つの補完的貢献を紹介する。
実世界のデータセットの実験では、オリジナルの実装と比較して50倍から300倍のスピードアップが確認されている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:04:31 GMT)
Adaptive state-action abstractions via rate-distortion [52.3] 強化学習は、複雑なタスクの単純なバージョンを構築するための複数のテクニックを提供する。
本稿では,抽象化自体によって引き起こされる誤りに匹敵する学習エラーが生じたら,抽象化を洗練させるという原理を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:10:18 GMT)
VISTA: Vision-Grounded and Physics-Validated Adaptation of UMI data for VLA Training [52.1] Universal Manipulation Interface (UMI)は、ハードウェア固有の遠隔操作なしでスケーラブルな実世界のロボットデータ収集を可能にする。
VISTAは、この2つのギャップを3つの相乗的コンポーネントを通して橋渡しするフレームワークである。
我々は,物理検証パイプライン,UMI-VQA,検証された軌道データ,コミュニティのための事前学習モデルをリリースする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:21:55 GMT)
ProSPy: A Profiling-Driven SQL-Python Agentic Framework for Enterprise Text-to-SQL [52.0] ProSPyは、エンタープライズスケールのテキスト-非依存分析のためのプロファイリング駆動フレームワークである。
ProSPyは推論プロセスを4段階に構成する。
まず、自動プロファイリングにより、きめ細かいデータ証拠を抽出する。
大規模なスキーマをタスク関連コンテキストに抽出する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:13:05 GMT)
CaliDist: Calibrating Large Language Models via Behavioral Robustness to Distraction [51.6] 既存のLLM(Large Language Models)のキャリブレーション手法は、しばしば信頼性の重要な次元、すなわちモデルの振舞いの堅牢性を見落としている。
我々は,モデルが注意をそらす可能性を直接測定し,罰する,新しいポストホックキャリブレーション手法であるtextscCaliDistを紹介した。
textscCaliDistは、強いベースラインと比較して、期待の低いエラー(ECE)とBrier Scoreを一貫して達成します。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:27:53 GMT)
Retrospective Harness Optimization: Improving LLM Agents via Self-Preference over Trajectory Rollouts [51.6] 本稿では,過去の軌道のみを用いたエージェント・ハーネスを最適化する自己教師型手法であるRetrospective Harness Optimization (RHO)を紹介する。
RHOは、過去の軌跡から様々な課題のコアセットを選択し、それらを並列に解決する。
1回の最適化ラウンドでは、SWE-Bench Proのパスレートが59%から78%に向上する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:26:00 GMT)
Memory is Reconstructed, Not Retrieved: Graph Memory for LLM Agents [51.3] 本稿では,連想記憶グラフとアクティブな再構成機構を組み合わせたフレームワークであるMRAgentを提案する。
Cue-Tag-Contentグラフ上で実行することで,メモリアクセスに直接推論を統合する。
LoCoMoベンチマークとLongMemEvalベンチマークの実験は、強いベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:29:46 GMT)
RhymeFlow: Training-Free Acceleration for Video Generation with Asynchronous Denoising Flow Scheduling [51.3] Diffusion Transformers (DiTs) に基づく映像生成モデルは,映像合成において顕著な性能を発揮している。
DiTは3次元の注意の二次的な複雑さのために、高い推論遅延と計算コストに悩まされる。
我々はbftextRhymeFlowを紹介した。bftextRhymeFlowはトレーニング不要のフレームワークで、異なるフレームの認知軌道を分離する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:49:37 GMT)
Where, What, Why, and Importance: Structured Defect Grounding for Text-to-Image Feedback [51.1] テキスト・トゥ・イメージ(T2I)モデルは依然として局所的で微妙で構造的に複雑な失敗を示す。
構造的欠陥接地は, 各欠陥を位置, タイプ, 理由, 重要性としてモデル化し, 構造的集合予測としてT2Iの診断を行う。
我々の検出器は、構造欠陥接地におけるプロプライエタリなVLMよりも優れています。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:03:16 GMT)
Automated Proving of Shannon-Type Entropy Inequalities via Fine-Tuned Language Models and Guided Tree Search [50.2] シャノン型エントロピーの不等式を証明することは情報理論の基本的な課題である。
我々は,原子実証のステップを微調整した小規模大規模言語モデルがこのプロセスを自動化することができるか検討する。
GPT-5.5は0ショットプロンプトで1.7%のサンプルを解き、Psitipは33.3%のサンプルを解いた。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:43:12 GMT)
Faithful, Enriched, and Precise: Benchmarking Natural-Science Illustration Generation by T2I models [49.9] FEPBenchは、慎重に選択された高品質な科学イラストから構築されたベンチマークである。
我々は,T2Iモデルについて,命令忠実度,推論エンリッチメント,意味的精度の3つの次元に沿って評価する。
その結果、GPT Image 2やNano Banana Proのような最先端のクローズドソースモデルでさえ、テキストレンダリングのボトルネック、推論のリッチ化の制限、生成のリッチネスと精度のバランスの難しさに悩まされていることがわかった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:49:02 GMT)
Causal Scaffolding for Physical Reasoning: A Benchmark for Causally-Informed Physical World Understanding in VLMs [49.6] CausalPhysは、知覚、予測、介入、目標指向という4つの領域にまたがる、ビデオと画像に基づく3000以上の慎重にキュレートされた質問のベンチマークである。
各質問は、専門家がアノテートした因果グラフがオブジェクト・属性・イベントの依存関係をキャプチャし、因果理解の解釈可能かつきめ細かい評価を可能にする。
これに基づいて、モデルの連鎖推論が正しい因果関係とどの程度うまく一致しているかを定量的に測定する因果グラフ基底計量を定式化する。
本稿では,CRFT(Causal Rationale-informed Fine-Tuning)を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:07:05 GMT)
Many Circuits, One Mechanism: Input Variation and Evaluation Granularity in Circuit Discovery [49.5] 回路間の構造的差異は、異なる機構の十分な証拠ではないことを示す。
標準評価は、このパターンを曖昧にし、エッジレベル評価は、構造から機能への多対一マッピングを明らかにする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:10:14 GMT)
Operation-Guided Progressive Human-to-AI Text Transformation Benchmark for Multi-Granularity AI-Text Detection [49.4] OpAI-Benchは、プログレッシブな人間とAIのテキスト変換を研究するためのオペレーションガイド付きベンチマークである。
我々は、AIテキスト検出能力は、AI編集コンテンツの割合だけでなく、編集操作、ドメイン、累積修正履歴によっても支配されていることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:58:05 GMT)
Global-Local Monte Carlo Tree Search in Vision-Language Models for Text-to-3D Indoor Scene Generation [48.7] 本稿では,この課題を空間的・レイアウト的常識に制約された計画問題とみなす。
我々はこれを,既存の逐次的意思決定手法とは異なる,グローバルおよびローカルツリーを用いた木探索問題としてモデル化する。
実験の結果,本手法は最先端の手法よりもリアルな3Dシーンを生成することがわかった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:56:21 GMT)
Mechanistic Insights into Functional Sparsity in Multimodal LLMs via CoRe Heads [48.3] MLLM(Multimodal Large Language Models)における深い構造的特性を明らかにするための詳細な解釈可能性の研究について述べる。
我々は、コンテキスト認識検索(CoRe)ヘッドと呼ばれる、高度に専門化されたアテンションヘッドのサブセットを特定し、特徴付ける。
本研究は,MLLMにおける機能的疎結合の構造原理を解明し,機械的解釈可能性の現在の理解を解明するものである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:18:31 GMT)
When Tools Fail: Benchmarking Dynamic Replanning and Anomaly Recovery in LLM Agents [48.3] 既存のベンチマークでは、LLMにおけるツール統合推論を理想化された'ハッピーパス'に基づいて評価している。
我々はTIRエージェントの動的経路探索とエラー回復のためのベンチマークであるToolMazeを紹介する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:38:46 GMT)
Let It Be Simple: One-Step Action Generation for Vision-Language-Action Models [48.1] 拡散に基づく視覚言語アクションモデルはしばしば画像生成ビューを継承する。
標準拡散訓練から強力なワンステップアクション生成が生ずることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:58:30 GMT)
Thinking with Imagination: Agentic Visual Spatial Reasoning with World Simulators [47.8] アストラ(Astra)は、視覚・言語モデルに行動条件の視覚的想像力を与えるエージェント空間推論フレームワークである。
Astra-WMは、コンテキストイメージと自然言語カメラモーションから、新しい視点の観察を生成する。
Astra-VLはMMSI-Bench上のシミュレータ強化されたGemini-3-Flashを45.1から49.5に改善し、Astra-WMはQwen3-VLのバックボーンを29.8から38.8に改善した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:56:36 GMT)
Harnessing Structural Context for Entity Alignment Foundation Models [47.5] 本稿では、転送可能なEAのための拡張エンコーダデコーダフレームワークであるContextEAを紹介する。
エンコーダ側では、2つのKGをアンカーブリッジと統一し、より早い関係対応のクロスグラフ伝搬を行うクロスKGインタラクションエンコーダを導入する。
デコーダ側では、アライメントスコアをエンティティレベル、近傍レベル、関係レベル、アンカーレベルの構造証拠と校正する構造校正デコーダを導入する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:57:36 GMT)
Framing, Judging, Steering: An Assessable Competency Model for Teach-ing Students to Reason With Generative AI [47.0] 生産的AI利用を3つの評価可能なスキルに分解する能力モデルであるCoRe-3(Co-Reasoning)を提案する。
理論上のスキルを基盤として、5つのテスト可能な提案を述べ、それらをCoReasoningLabでインスタンス化します。
人為的な合意と成果が次々に行われます。私たちは、計測器、データ、プロトコルをリリースします。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:25:31 GMT)
CoEval: Ranking Language Models for Custom Tasks Without Labeled Data or Trustworthy Benchmarks [47.0] アンサンブル自己評価を通じて信頼性の高いタスク固有信号を提供するオープンフレームワークであるCoEvalを提案する。
モデルのプールは教師、学生、裁判官の3つの役割すべてを通して回転し、新鮮な汚染のないベンチマークを生成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:01:47 GMT)
Membrane: A Self-Evolving Contrastive Safety Memory for LLM Agent Defense [46.1] コントラスト安全メモリ上に構築された自己進化型ガードレールである膜を提案する。
膜は、それぞれの有害な相互作用とその良性な相互作用を対照的な細胞に蒸留することでCSMを進化させる。
膜は6回のジェイルブレイク攻撃で最も高いF1を達成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:14:08 GMT)
Asuka-Bench: Benchmarking Code Agents on Underspecified User Intent and Multi-Round Refinement [45.8] マルチラウンドリファインメントと不特定ユーザ意図を組み合わせたベンチマークであるAuka-Benchを提示する。
ベンチマークは、Webタスク50、評価基準784、予測結果2402からなる。
最強のモデルでさえ、3ラウンドの後にプロジェクトの52%しか完了していない。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:24:30 GMT)
Closing the Loop on Latent Reasoning via Test-Time Reconstruction [45.1] 最近の研究は、中間推論を自然言語のトレースから潜時あるいはキャッシュレベルの表現に移行している。
本稿では,クエリ自体を参照としてループをクローズする自己教師型テストタイムトレーニング手法であるRELATを提案する。
ReLATは、単一モデル推論、テキストベースのコラボレーション、オープンループラテントコラボレーション、代替テストタイムトレーニング目標よりも一貫して改善されていることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:54:40 GMT)
Continual Learning Bench: Evaluating Frontier AI Systems in Real-World Stateful Environments [44.9] 我々は,AIシステムが実体験で真に改善するかどうかを測定する最初のベンチマークであるContinuous Learning Bench(CL-Bench)を紹介する。
CL-Benchは6つの異なるドメイン(ソフトウェアエンジニアリング、信号処理、病気発生予測、データベースクエリ、戦略的ゲームプレイ、需要予測)にまたがる。
そこで本研究では,テキスト内学習(ICL)から専用メモリシステムまで,複数のエージェントアーキテクチャを対象としたフロンティアモデルの評価を行った。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:43:28 GMT)
SentinelRAG: Synthetic Sentinel Knowledge for RAG Database Copyright Protection [44.7] SentinelRAGは、スタイル一貫性はあるが架空の知識エントリをRAGデータベースに埋め込む。
我々の重要な洞察は、虚偽の実体を記述する合成知識は、正当なクエリーによって回収される可能性は低いということである。
本手法は,正規ユーザクエリに対する無視可能な干渉を維持しつつ,誤検出率を大幅に低減する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:19:56 GMT)
Adversarial Attacks Already Tell the Answer: Directional Bias-Guided Test-time Defense for Vision-Language Models [44.5] VLM(Vision-Language Models)のテストタイムディフェンスは、大規模なリトレーニングを必要とせず、敵の攻撃を防御するための有望かつ効率的なアプローチとして登場した。
我々は,ディフェンスディビジョンを推定するテストタイムフレームワークであるディビジョンバイアス誘導ディフェンス(DBD)を提案し,ロバスト表現の復元にDBスコアベースの2ストリーム再構築戦略を採用している。
15個のデータセットで実験したところ、DBDはSOTA逆境の堅牢性を達成できるだけでなく、逆直観的な結果も示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:57:07 GMT)
Balancing Image Compression and Generation with Bootstrapped Tokenization [44.4] 本稿では,グローバルおよびローカルトークングループに情報をクリーンに分解する手法であるSelfBootTokを紹介する。
ローカル表現学習により多くのデータやパラメータを活用することで、SelfBootTokは64トークンのみを使用して、新しい最先端のgFIDスコア1.56をエレガントに達成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:06:52 GMT)
Bridging Domain Expertise and Generalization for Performance Estimation [44.1] 分散シフトによる性能評価は、トレーニングデータとは異なるラベル付きテストセット上でモデルがどのように振る舞うかを予測することを目的としている。
既存のアプローチは、分布がシフトするとバイアスが増幅される与えられたモデルの出力にのみ依存する。
本研究では,より信頼性の高い基底トラスラベルのサロゲートを構築するために,融合参照アライメント予測(FRAP)を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:10:04 GMT)
Diff-CA: Separating Common and Salient Factors with Diffusion Models [43.8] 生成品質を損なうことなくコントラスト分解が可能な拡散モデルのための新しい条件付けフレームワークを提案する。
先行研究で一般的に仮定される付加的コントラスト分解は、穏やかな条件下で同定可能であることを証明した。
この因子化は、正常な係数のみをスワップまたは補間することで、ターゲット操作を可能にする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:07:18 GMT)
Imagine Before You Predict: Interleaved Latent Visual Reasoning for Video Event Prediction [43.5] 本稿では、インターリーブされた視覚的推論フレームワークFuture-L1を紹介する。
自動回帰復号中にMLLMが言語トークンと連続的な視覚的スパンを交互に切り替えることを可能にする。
Future-L1は両方のベンチマークで最新の結果を達成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:53:19 GMT)
FiLM-Based Speaker Conditioning of a SpeechLLM for Pathological Speech Recognition [43.4] 特徴量線形変調(FiLM)を用いた話者条件付けの検討
基本モデルの重みを変更することなく、個々の病理話者に内部表現を適用する。
その結果、話者条件付きASRは、確立された適応戦略と競合することが示された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:20:11 GMT)
PriSrv: Privacy-Enhanced and Highly Usable Service Discovery in Wireless Communications [43.3] 既存のプロトコルは、プライバシ保護の制限、機密性の高いデバイス情報の漏洩、ネットワーク攻撃へのルートの開放を提供する。
本稿では、PriSrvと呼ばれるプライベートなサービスディスカバリプロトコルを提案し、サービスプロバイダとクライアントの両方が、きめ細かい認証ポリシーを指定できるようにする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:00:31 GMT)
WorldFly: A World-Model-Based Vision-Language-Action Model for UAV Navigation [42.9] 将来の状態を「想像」する能力は、そのような部分的な可観測性の下での堅牢な意思決定に不可欠である、と我々は主張する。
We propose WorldFly, a novel world-model-based VLA framework that using a dual-branch linked flow matching mechanism to jointly generate future video predictions and navigation action。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:23:05 GMT)
PriSrv+: Privacy and Usability-Enhanced Wireless Service Discovery with Fast and Expressive Matchmaking Encryption [42.6] PriSrv+は、現代の無線ネットワークのための高度なプライバシとユーザビリティ向上したサービスディスカバリプロトコルである。
PriSrv+の鍵となる革新は、高速かつ高速なマッチング暗号化(FEME)の開発である。
PriSrv+は、既存の最先端プロトコルよりも優れたパフォーマンス、スケーラビリティ、効率を実現している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:07:19 GMT)
Edit-R2: Context-Aware Reinforcement Learning for Multi-Turn Image Editing [42.2] 統一マルチモーダルモデルのための新しい強化学習フレームワークであるEdit-R2を紹介する。
作業中のセッション意図を再構築し、散在する歴史的制約を編集の各ターンの前に明確な推論トレースに効果的に統合する。
強靭なベースラインに比べて競争力がある。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:49:47 GMT)
Contextualized Prompting For Stance Detection On Social Media [41.7] ソーシャルメディアでのスタンス検出は、短く、騒々しく、文脈に依存した言語のために困難である。
大規模言語モデルに文脈情報を組み込むことによる影響について検討する。
文脈情報の統合は,特定の条件下でのみ性能を向上させる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:14:44 GMT)
Rethinking LoRA Memory Through the Lens of KV Cache Compression [41.6] パラメトリック検索は文書情報をLoRAアダプタなどの文書固有のモジュールにエンコードする。
我々は,このパラメータ側メモリが,KVキャッシュに格納されたコンテキスト側メモリとどのように相互作用するかを検討する。
我々は、KVキャッシュがほとんど無傷である場合にLoRAはほとんど追加しないが、アグレッシブ圧縮下ではますます有用になると考えている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:35:45 GMT)
Benchmarking Counterfactual Prediction in Epidemic Time Series with Time-Varying Interventions [41.5] 本研究では,動的介入による疫病時系列の反ファクト予測のための大規模ベンチマークを開発する。
既存のベンチマークとは異なり、静的および時間変化の処理をサポートし、シングルポリティとマルチポリティの介入設定の両方をサポートする。
我々は150以上の郡にまたがる現実的な対物軌道を創出する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:18:28 GMT)
AsyncWebRL: Efficient Multi-Step RL for Visual Web Agents [41.2] マルチステップRLを用いた視覚言語Webエージェントのトレーニングは計算集約的である。
本稿では、同期RLにおけるアイドルGPUに対処するAsyncWebRLと、必要以上に多くのステップとトークンを使用するトラジェクトリを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:18:44 GMT)
PAR3D: A Unified 3D-MLLM with Part-Aware Representation for Scene Understanding [41.2] PAR3Dは、モデルが3Dシーンでオブジェクトとその部分を理解し、推論し、グラウンドすることを可能にする、統合された部分認識3D-MLLMフレームワークである。
提案手法は,部分レベルの質問応答とセグメンテーションの参照を大幅に改善するとともに,オブジェクトレベルの視覚言語タスクに対して高い性能を実現する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:59:04 GMT)
ReCache: Learning Budget-Aware Caching Schedules for Diffusion Models via REINFORCE [40.5] ReCacheは、生成品質を最大化する再計算スケジュールを学ぶ。
政策勾配を通し、完全な拡散推論を通じてバックペーストを横取りする。
スケジュールベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:59:56 GMT)
LatentSkill: From In-Context Textual Skills to In-Weight Latent Skills for LLM Agents [40.3] テキストスキルをプラグアンドプレイのLoRAアダプタに変換するフレームワークであるLatentSkillを紹介する。
LatentSkillは、コンテキスト空間よりも重み空間にスキル知識を格納し、ステップ単位のスキルトークンを削除する。
ALFWorldとSearch-QAでは、LatentSkillは、かなり少ないプリフィルトークンを使用しながら、対応するインコンテキストスキルベースラインよりもパフォーマンスが高い。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:26:09 GMT)
TailLoR: Protecting Principal Components in Parameter-Efficient Continual Learning [39.4] 本稿では,事前学習した重みの特異基底U,Vを固定参照フレームとして利用して,特異値行列に適用した低ランク更新を学習するTailLoRを提案する。
ソフトスペクトルペナルティは、支配的な特異方向に沿った更新を阻止し、干渉を低減し、高度に柔軟で長い尾のスペクトル座標に微粒な適応をルーティングする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:59:55 GMT)
SubtleMemory: A Benchmark for Fine-Grained Relational Memory Discrimination in Long-Horizon AI Agents [38.8] 本稿では,長期にわたるAIエージェントにおける微粒なリレーショナルメモリ識別のためのベンチマークであるSubtleMemoryを紹介する。
我々は,6つのスタンドアロンメモリシステム,ネイティブメモリモジュールを持つ2つのClawスタイルエージェント,プラグインメモリモジュールを持つ3つのClawスタイルエージェントを評価した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:43:11 GMT)
OrderGrad: Optimizing Beyond the Mean with Order-Statistic Policy Gradient Estimation [38.5] OrderGradは、オーダー統計目的のための確率に基づく勾配推定器のファミリーである。
VaR、CVaR、トリミングされた手段、中央値、トップm/ベスト・オブ・Kといった目標を、ランクの重みだけを変えることで回収する。
推定器の分散挙動を推定し、平均最適化が配置目標と一致していないタスクで評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:34:15 GMT)
Q-GNN: Query-Conditioned Graph Neural Networks with Type Awareness for Knowledge Graph Completion [38.3] Knowledge Graph Completionは、不足している三つ子を不完全な知識グラフから予測することを目的としている。
最近のグラフニューラルネットワーク(GNN)に基づく手法は,クエリ中心のローカルサブグラフ上でメッセージパッシングを行うことで,大きな成功を収めている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:07:22 GMT)
On Advantage Estimates for Max@K Policy Gradients [38.1] バッチのメリットを正確に重視しながら、ポリシーの緩やかな偏りを保ちながら、リーフツーアウトのベースラインを導入します。
結果、MaxPOは効率的な二次時間実装を持ち、LLM後学習のためのグループベースRLに自然に統合される。
実験により,L2Oベースラインは勾配のばらつきを低減し,非中心の代替よりも優れることを確認した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:16:39 GMT)
TRACE: A Temporal Conditional Estimation for Multimodal Time Series Foundation Models [38.0] 時系列基礎モデル(TS-FM)は、幅広い下流タスクに適応可能な一般化可能な時間表現を学習することを目的としている。
既存のアプローチは一般的に、単純な命令やマスキング戦略に頼っているが、これはクロスモーダルな依存関係を考慮できない。
本稿では,マルチモーダル時系列基礎モデルパイプラインに対する条件推定パラダイムであるTRACEを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:25:03 GMT)
Vortex: Efficient and Programmable Sparse Attention Serving for AI Agents [38.0] Vortexは、ページ中心のテンソル抽象化の上にPython組み込み言語を組み合わせるシステムである。
スパースアテンションアルゴリズムの迅速なプロトタイピング、デプロイメント、評価を可能にする。
MLAベースのGLM-4.7-Flashでは最大4.7時間、NVIDIA B200では229B MiniMax-M2.7では1.37時間である。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:48:17 GMT)
DIST-FL: Enhancing Security for TEE-based Aggregation in Federated Learning [38.0] サーバサイドの敵は、システムの堅牢性とプライバシを妥協するために、クライアントの選択とリプレイアグリゲーションを操作できる。
DIST-FLは、複数のTEEによって保護されたサーバの分散システムであり、プライバシ保護された堅牢なFLアグリゲーションのための追加専用台帳を形成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:56:49 GMT)
StoryVideoQA: Scaling Deep Video Understanding with a Large-Scale, Multi-Genre and Auto-Generated Dataset [37.8] ビデオ質問応答(Video QA)は、ビデオに関する質問に答えることを目的としている。
既存のアプローチはファクトイドビデオQAに優れているが、深層ビデオ理解(DVU)に苦戦している
この課題は、固有の長距離ビデオコンテンツ、多面的質問タイプ、インスタンスレベルのストーリー要素から生じる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:12:43 GMT)
PAMF: Prior-Aware Multimodal Fusion for Incomplete Time Series Data [37.7] PAMFは、異なる欠落パターンを扱うマルチモーダルな時系列フレームワークである。
多様なデータセットと欠落した設定で、ダウンストリームのパフォーマンスが最強であることを示します。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:04:21 GMT)
Towards One-to-Many Temporal Grounding [37.6] 現実世界のシナリオでは、単一のクエリに対して複数の分離セグメントをローカライズする必要があることが多い。
従来の最先端のMLLMは、1対1の設定に最適化されており、この状況では苦労している。
3つの重要なコントリビューションを持つシステマティックなソリューションを提示します。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:31:22 GMT)
Rollout-Level Advantage-Prioritized Experience Replay for GRPO [37.4] GRPOのためのロールアウトレベルのリプレイバッファを提案し、グループ全体ではなく個々のロールアウトを格納し、サンプリングする。
Qwen3-Baseは5つのベンチマークでスケールするが,本手法はGRPOより優れている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:53:10 GMT)
Beyond False Stability: High-Noise Drift Gating for Test-Time Adversarial Defenses in Vision-Language Models [37.2] CLIPのような視覚言語モデル(VLM)は、強いゼロショットの一般化を示すが、敵攻撃に対して非常に脆弱である。
最近のアプローチでは、CLIPの視覚的表現が摂動にどのように反応するかを利用する。
軽量ゲーティング信号として高雑音特徴ドリフトを用いた学習自由なプラグインドリフトゲート機構を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:10:51 GMT)
World-Language-Action Model for Unified World Modeling, Language Reasoning, and Action Synthesis [37.2] 我々は,新しい基礎モデルのクラスとして,世界言語アクションモデルを提案する。
WLAはテキストのインストラクション、画像、ロボットステートを入力として、テキストのサブタスク、サブゴールイメージ、ロボットアクションを共同で予測する。
We show that WLA-0 achieve a state-of-the-the-art multi-task and long-horizon learning abilities、例えば、RoboTwin2.0 Clean の92.94%、RMBench の56.5%の成功率。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:23:01 GMT)
Bootstrapping Semantic Layer from Execution for Text-to-SQL [36.9] GATE(Grouding After Test from Execution)は、実行時のフィードバックから欠落したグラウンドをブートストラップする。
GATEは、既に接地されている部分を実行しながら、地上の仮説をオープンにし続け、観察する。
その観測で支持される仮説のみが根拠付けられ、メモリエントリとして保存される。
これらのエントリは実行グランドメモリに蓄積され、後続のステップでサポート対象のグラウンドを再利用できる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:01:04 GMT)
HomeWorld: A Unified Floorplan-to-Furnished Framework for Generating Controllable, Densely Interactive Whole-Home Scenes [36.8] 室内シーン生成はロボットシミュレーションと近代インテリアデザインに不可欠である。
室内シーンの合成を制御可能なステージに分解する統合階層型フレームワークを提案する。
実験とユーザスタディにより、我々のパイプラインはよりレイアウトの多様性とより強力な3Dデザインの魅力を持つ屋内空間を生産していることが示された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:58:43 GMT)
What's in a Name? Morphological Shortcuts by LLMs in Pharmacology [36.7] 薬理学における「接点」の行動学的・力学的研究について述べる。
Affix シグナルだけではクラスレベルの薬理学的反応を誘発することを示す。
本研究は, モデル薬物の意味が主に接尾辞, 茎, 薬名全体によって駆動されているかどうかを同定する枠組みを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:40:42 GMT)
MLEvolve: A Self-Evolving Framework for Automated Machine Learning Algorithm Discovery [36.1] 大規模言語モデル(LLM)エージェントは、科学的な発見や機械学習工学のような長期的タスクにますます応用されている。
エンド・ツー・エンドの機械学習アルゴリズム発見のための,LLMベースの自己進化型マルチエージェントフレームワークであるMLEvolveを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:55:59 GMT)
From Risk Classification to Action Plan Remediation: A Guardrail Feedback Driven Framework for LLM Agents [35.4] ガードレールは通常、実行前に提案されたアクションや入力を評価することでエージェントを保護する。
既存のガードレールは、しばしばタスク全体を安全でないものとして一様にフラグを立て、脅威を阻止するが、良心的な部分を犠牲にする。
本稿では,ガードレール生成した言語フィードバックを誘導信号として活用し,エージェントを良質な目的に合わせるためのガードレール統合エージェントフレームワークTRIADを紹介する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:34:35 GMT)
Autoregressive Diffusion World Models for Off-Policy Evaluation of LLM Agents [35.4] マルチターン対話環境における大規模言語モデル(LLM)エージェントの評価は高価でリスクが高い。
提案手法は, プリコンパイルされた軌道から新たなLCMエージェントポリシーの性能を推定する評価フレームワークであるADWMを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:13:24 GMT)
Reinforcement Learning Elicits Contextual Learning of Unseen Language Translation [35.3] 本稿では,リッチな言語文脈を前提とした言語翻訳に対する強化学習(RL)アプローチを提案する。
軽量な報奨にもかかわらず、我々のRL学習モデルは、提供された文脈から関連言語情報を効果的に抽出し、適用する。
分析の結果,結果に基づくRLは,数学やコーディングといった従来の推論タスクを超えて,文脈からの言語学習のレシピとして機能することが示唆された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:32:06 GMT)
AdaPLD: Adaptive Retrieval and Reuse for Efficient Model-Free Speculative Decoding [35.2] 本稿では,検索とドラフト構築の両方を適応的に改善するトレーニングフリーな手法であるemphAdaPLDを提案する。
様々なベンチマークで、AdaPLDは目標モデルのフォワードパスを減らし、最大3.10タイムのデコードスピードアップを実現している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:09:44 GMT)
Adaptive Learning Rates with Surrogate Probability for Follow-the-Perturbed-Leader [34.8] フォロー・ザ・レギュラライズド・リーダー・フレームワークは、オンライン学習の問題の有効性と柔軟性を示している。
本稿では,サロゲート確率関数を導入することで,FTPLの適応学習率を提案する。
本稿では,BOBWの適応学習率によるFTPLの保証について,専門家の助言で示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:36:08 GMT)
Safe Embodied AI for Long-horizon Tasks: A Cross-layer Analysis of Robotic Manipulation [34.7] 身体的なAIシステムは、物理的環境における拡張された地平線を推論し、行動することがますます期待されている。
安全な具体化されたAIは大きな注目を集めているが、その文献は計画、ポリシー設計、実行時に断片化されている。
この調査は、エンボディドAIの観点から、長距離ロボット操作における安全性の構造化されたレビューを提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:43:09 GMT)
SmellBench: Towards Fine-Grained Evaluation of Code Agents on Refactoring Tasks [34.4] SmellBenchは実世界のリポジトリからコードの臭いを積極的に注入する。
一般的な臭いの種類が7つ、難易度が3つ、実世界のレポジトリが2つある294のケースが含まれている。
実験の結果、最高の組み合わせであるQwenwen Code + Sonnet 4.5は50.34の匂いの除去しか得られなかった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:49:07 GMT)
MotionDisco: Motion Discovery for Extreme Humanoid Loco-Manipulation [34.1] MotionDiscoは、接触に富んだ長いヒューマノイドのロコ操作運動をスクラッチから発見するフレームワークである。
これは、自動進化探索によって、長い水平のヒューマノイドのロボ操作スキルを発見し、展開する最初の試みである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:19:49 GMT)
QCFuse: Query-Aware Cache Fusion via Compressed View for Efficient RAG Serving [33.6] QCFuseはRAGキャッシュ融合のための圧縮ビュークエリ対応セレクタである。
SGLangでQCFuseを実装し、6つのデータセットにまたがる4つのオープンウェイトLCMでQCFuseを評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:47:46 GMT)
Knowledge Distillation for Visual Autoregressive Models [33.5] VarKDは、教師の監督とトークンレベルの曖昧さを選択的に適用しながら、学生サンプルを蒸留する視覚的自己回帰モデルのためのフレームワークである。
複数のARバックボーンにわたるImageNetの実験では、VarKDは蒸留前のベースラインを一貫して上回り、大規模なモデルとのギャップを狭めている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:15:31 GMT)
Interpreting Style Representations via Style-Eliciting Prompts [33.4] スタイル表現学習は、著者の分析とモデリングスタイルのための強力なツールである。
最近の研究は、入力テキストに条件付けされた大きな言語モデルで自然言語記述を生成することによって、これらの表現を説明しようと試みている。
そこで本研究では,スタイル選択プロンプトを通じてスタイル表現を解釈する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:17:23 GMT)
TAM: Torque Adaptation Module for Robust Motion Transfer in Manipulation [32.7] 接触に富んだダイナミックな操作では、小さな動きのずれでさえ参照動作の追跡に失敗することがある。
本稿では,学習モジュールであるTorque Adaptation Module (TAM)を紹介した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:31:54 GMT)
TextWand: A Unified Framework for Scene Text Editing [32.6] TextWandは、シーンテキストの削除、生成、置換を単一のモデルに統合するフレームワークである。
テキストの外観と背景の整合性の両方を正確に制御する。
優れたテキストコンテンツの正確性、レイアウトとスタイルの整合性、シーンテキストの削除、生成、置換タスク全体の画質を提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:43:24 GMT)
Learning Geometric Representations from Videos for Spatial Intelligent Multimodal Large Language Models [32.5] 純粋に2次元ビデオシーケンスを用いて幾何学的表現を学習するフレームワークであるGeoVRを提案する。
表面的特徴混合を採用するのではなく、GeoVRは幾何学的知識を蒸留することによってMLLMの内部表現に不満を抱く。
空間推論ベンチマークの実験は、GeoVRが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:11:12 GMT)
Representation Learning Enables Scalable Multitask Deep Reinforcement Learning [32.5] 本研究では,予測型モデルベース表現と高容量値関数近似を組み合わせることで,高い性能が得られることを示す。
我々は,シンプルなモデルフリーアルゴリズムであるMR.Qと補助的な予測目標を併用して,スケーラブルなアクター・クリティカルなアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:09:20 GMT)
UltraVR: A Diagnostic Ultra-Resolution Image-VQA Benchmark for Evidence-Grounded Reasoning [32.4] 我々は,超高解像度画像に対するエビデンスグラウンドの視覚的推論のための診断ベンチマークであるUltraVRを紹介する。
それぞれのインスタンスは、ステップレベルの質問、中間回答、推論ラベルを備えた、構造化された地道的な思考の連鎖を含んでいる。
現状のモデルは、超高解像度推論では信頼性に欠ける。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:51:16 GMT)
CollabSim: A CSCW-Grounded Methodology for Investigating Collaborative Competence of LLM Agents through Controlled Multi-Agent Experiments [32.0] CollabSimは、理論に基づく協調能力の定義、相互作用条件の制御、エージェントの内部状態のアクションレベル探索を組み合わせたシミュレーションフレームワークである。
CollabSimは条件効果をキャプチャし、モデルパフォーマンスパターンを分離し、エージェント設計のタスク依存効果を明らかにする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:06:22 GMT)
The Right Measure for Physics-Constrained Generation: A Co-Area Correction for Posterior-Consistent PDE Inverse Problems [31.1] 生成モデルは、偏微分方程式(PDE)の逆問題を解くためにますます使われている。
広く採用されているレシピが間違った分布をサンプリングしていることを示す。
我々は,コエリア後部を対象とする測度制約付きサンプルであるtextbfCoCoSを紹介した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:47:15 GMT)
Learning What to Forget: Improving LLM Unlearning via Learned Token-Level Importance [30.7] 本稿では,トークンの忘れやすさとモデルパラメータを共同で学習する軽量フレームワークであるAlternating Token-Weighted Unlearning(ATWU)を紹介する。
ATWUは、最先端のトレードオフ、サンプルレベルの方法、確率ベースのトークン重み付け、補助モデルベースのアプローチを実現している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:56:32 GMT)
Towards Healthy Evolution: Exploring the Role and Mechanisms of Human-Agent Interaction in Self-Evolving Systems [30.4] 自己進化エージェントは、連続的な自己再生と自己生成学習信号によって改善される。
Human-like Oversight and Review (ANCHOR)は、人間の監督をシミュレートし、自己進化のさまざまなフェーズでフィードバックを提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:03:16 GMT)
A Sliced-Wasserstein Framework on Correlation Matrices for EEG Decoding [30.2] 我々は、プルバックユークリッド計量によって与えられる多様体上のスライスされたワッサーシュタインの相違に対する一般的な枠組みを提案する。
この枠組み内では、フルランク相関行列の多様体上の2つの相関スライス・ワッサーシュタイン差分をインスタンス化する。
CorSW上に構築された脳波デコーディングのためのドメイン一般化(DG)フレームワークをさらに発展させる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:47:49 GMT)
BAHSD: Bridging the Long-tail Gap via Adaptive Distillation in Black-box Sequential Recommendation [30.0] マルチスケール整合性探索機構を用いて信号の不均一性を処理するブラックボックス適応蒸留フレームワークであるBAHSDを提案する。
BAHSDは一貫してベースラインを上回り、教師よりも最大4.98%向上し、テールユーザーでは80%以上改善されている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:55:34 GMT)
To Be Multimodal or Not to Be: Query-Adaptive Audio-Visual Person Retrieval via Active Modality Detection [29.1] モダリティの欠如による楽譜はノイズを注入し、最高の単調システムよりも精度を低下させる。
クロスモーダルスコアの整合性によってアクティブなモダリティを検出するクエリ適応フレームワークを提案する。
BBC Rewind Corpusでは、適応システムは94.2%のP@1に達し、話者のみ(82.9%)、顔のみ(93.4%)、固定核融合(90.0%)を上回っている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:33:58 GMT)
LoomVideo: Unifying Multimodal Inputs into Video Generation and Editing [29.0] ビデオ生成と編集の両面において,高効率な5Bパラメータ統一アーキテクチャであるLoomVideoを提案する。
このエレガントな設計は、クリーンソースビデオラテントをノイズターゲットラテントにスケーリングおよび直接付加することにより、トークン結合の必要性を排除している。
我々のコンパクトな5Bモデルは、包括的なベンチマークで最先端または高い競争性能を達成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:35:26 GMT)
Pretraining Recurrent Networks without Recurrence [28.9] リカレントニューラルネットワーク(RNN)のトレーニングには、長い列の計算でクレジットを割り当てる必要がある。
本稿では,再帰的クレジット伝搬を完全にサイドステップとする非線形RNNのトレーニング手法であるSupervised Memory Training (SMT)を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:57:33 GMT)
FIDES: Faithful Inference via Deep Evidence Signals for Retrieval-Memory Conflict in RAG [28.7] コントラストデコーディングは、パラメトリックバイアスを抑制するために文脈条件付き出力を増幅する。
単一のグローバルな対照的な重みは、真に矛盾したトークンを不十分に修正しながら、安全なトークンを過払いする。
本研究では,学習不要なデコーダであるFIDESを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:16:17 GMT)
ClothTransformer: Unified Latent-Space Transformers for Scalable Cloth Simulation [28.6] 自動回帰シーケンスモデリングとして布シミュレーションを再構成するフレームワークであるClosTransformerを提案する。
既存のニューラルネットワークシミュレータは主に単一のシナリオに特化しており、本質的にメッシュの離散化に結びついている。
このアプローチは3つのコントリビューションを通じてこれらの制限に対処します。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:17:18 GMT)
Benchmark Everything Everywhere All at Once [28.3] ベンチマーク構築用に設計された完全自律型エージェントシステムであるBenchmark Agentを紹介する。
本フレームワークは,ユーザクエリ分析やサブタスク設計からデータアノテーション,品質管理に至るまで,完全なベンチマーク構築パイプラインを編成する。
テキスト理解やマルチモーダル理解,ドメイン固有の推論など,さまざまな評価シナリオにまたがる15の代表的なベンチマークを作成した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:52:04 GMT)
Discrete-WAM: Unified Discrete Vision-Action Token Editing for World-Policy Learning [28.2] 我々は、将来の視覚状態とエゴアクションを整列した離散トークンとして表現する、統合された潜在視覚行動世界政策であるDiscrete-WAMを紹介する。
この統合されたアライメントに基づいて、離散WAMは、統一された生成タスクを持つ共有離散拡散フレームワークを確立する。
大規模自動運転ベンチマークの実験では、離散WAMは制御可能な生成と反ファクト推論をサポートしながら、競争性能を達成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:16:31 GMT)
CollabBench: Benchmarking and Unleashing Collaborative Ability of LLMs with Diverse Players via Proactive Engagement [28.1] CollabBenchは、協調ゲームにおける協調エージェントの評価と訓練のためのベンチマークである。
トレーニングされたモデルは、19.5%高い効率と24.4%の感情的パフォーマンスを実現しました。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:22:44 GMT)
Human Adults and LLMs as Scientists: Who Benefits from Active Exploration? [28.0] 活発な探索が成人の結節性因果推論を大幅に改善することを示す。
いくつかの最先端モデルは仮説推定精度で人間レベルの性能にアプローチするが、より効率的な探索戦略や同様の共役的性能ギャップを示すことが多い。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:53:36 GMT)
Diffusion Models Observe Only Gradients: A Geometric Perspective on Score Matching Errors [27.9] L2$のスコア誤差は、限界分布品質の固有値ではないことを示す。
学習した拡散モデルは、目標分布を完全に一致させながら、大きな$L2$スコア誤差を発生させることができる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:53:38 GMT)
RedEdit: Agentic Red-Teaming of Image Safety Classifiers via MCTS-Guided Photo-Editing [27.5] RedEditは、編集ツールのシーケンスに対する検索問題として、写真編集の回避を定式化する、新しいブラックボックスのレッドチームエージェントである。
セマンティックにターゲットされた候補編集とモンテカルロ木探索プランナーを生成し、非効率な編集パスからバックトラックしながら、有望な編集パスを優先順位付けする。
UnsafeBenchに関する我々の実験は、重大なシステム上の脆弱性を明らかにします。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:19:53 GMT)
GS-NFS: Bandwidth-adaptive Streaming of Dynamic Gaussian Splats and Point Clouds [27.4] GS-NFSはGPU上の動的3DGS圧縮と非圧縮を加速する。
フレームの符号化と復号化において最先端よりも1-2桁高速である。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:27:56 GMT)
AdaMEM: Test-Time Adaptive Memory for Language Agents [27.2] 本稿では,エージェントテスト時間適応のための新しいフレームワークであるAdaptive Memory Agent (AdaMEM)を提案する。
モデルパラメータをオンラインで更新することなく、AdaMEMはハイブリッドメモリアーキテクチャを介してエージェントの振る舞いを適用する。
AdaMEMは静的メモリベースラインを著しく上回り、ALFWorldでは13%、WebShopでは11%の相対的なゲインを達成している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:06:08 GMT)
Regret Minimization with Adaptive Opponents in Repeated Games [26.9] 我々は,エフィンジンジックの蓄積ユーティリティとエフィンジンジックの差を測るゲーム計量を導入する。
この設定での既存の後悔の概念と比較すると、我々は繰り返しプレイするゲームにネイティブです。
残念な概念を最小化することは、Stag-Huntのようなゲームにおいて、より高いユーティリティを持つより協調的な解決につながることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:59:08 GMT)
PiL-World: A Chunk-Wise World Model for VLA Policy-in-the-Loop Evaluation [26.6] ビジョンアクション(VLA)ポリシーは、現実世界のロボットタスクにおいてクローズドループで動作する。
ロボット行動評価のための既存の世界モデルのほとんどは、オープンループ予測に限られている。
本稿では,ループ内VLA評価のためのチャンクワイド世界モデルPiL-Worldを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:57:25 GMT)
EDIT: Evidence-Diagnosed Intervention Training for Rule-Faithful LLM Grading [26.4] エビデンス診断インターベンショントレーニング(Evidence-Diagnosed Intervention Training、EDIT)は、よりルーリックなLLMグレーダをトレーニングするための2段階のフレームワークである。
まず、EDIT-SFTは、最終マークに対する後続の信念と入力接地スコアという、内部モデル信号を用いた問題推論ステップを特定する。
第2に、EDIT-RLはグレーダーを、信念を導いた報酬形成で校正し、大きな有害な信念の漂流を抑えながら、探索に役立ちます。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:20:17 GMT)
Double Preconditioning (DoPr): Optimization for Test-Time Performance, not Validation Loss [26.3] ダブルプレコンディショニング(DoPr)と呼ばれる新しい最適化パラダイムを導入する。
DoPr は、Adam や Muon のようにグラデーションワイドプレコンディショニングとアクティベーションワイドプレコンディショニング(AP)を組み合わせている。
我々は、APの追加により、様々なテスト時間設定でダウンストリームモデルの性能を向上させるために、ドロップインの介入が得られることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:22:58 GMT)
Beyond Similarity: Trustworthy Memory Search for Personal AI Agents [25.3] 個人AIエージェントにおける信頼境界としてのメモリ探索について検討する。
MemGateは、信頼性の高いメモリ検索のための軽量でデプロイ可能なメモリプラグインである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:54:29 GMT)
Physics in 2-Steps: Locking Motion Priors Before Visual Refinement Erases Them [23.7] 2ステップ生成は、しばしば同じモデルからの50ステップ出力よりも優れた物理的整合性を示す。
数ステップの推論から有効な動作先を保存するためのトレーニング不要のフレームワークであるPhaseLockを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:30:39 GMT)
ColBERTSaR: Sparsified ColBERT Index via Product Quantization [23.6] ColBERTは効果的なニューラル検索アーキテクチャであるが、候補セット検索をサポートするために重いインデックス構造を必要とする。
我々は、ColBERTインデックスを真逆インデックスに変換する埋め込み量子化手法を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:28:45 GMT)
Pixel Cube: Diffusion-based Portrait Video Relighting Through Realistic Lighting Reproduction [23.6] 本稿では,動的ポートレート映像を光写実性と時間的整合性でリライトする拡散法を提案する。
我々のモデルは、現実的に見え、提供された新しい環境下で、時間的に一貫した忠実なポートレートビデオを生成することができる。
その結果,本手法は光リアリズム,照明調和,時間的一貫性の両立を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:48:23 GMT)
ReverseEOL: Improving Training-free Text Embeddings via Text Reversal in Decoder-only LLMs [23.3] 大規模言語モデルの最近の進歩は、トレーニング不要なテキスト埋め込みを生成するための新しい道を開いた。
本稿では,凍結LDMの表現能力を高めるために,明示的なワンワード制限を用いたリバースプロンプトを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:30:49 GMT)
MARDoc: A Memory-Aware Refinement Agent Framework for Multimodal Long Document QA [23.3] 本稿では,長期文書QAを3つの特殊エージェントに分解するメモリ・アウェア・リファインメント・エージェント・フレームワークを提案する。
イテレーションを通じてエージェントは、完全に蓄積されたインタラクション履歴ではなく、動的に更新された構造化メモリに依存する。
MMLongBench-DocとDocBenchの実験により、MARDocは、同じバックボーンベースラインよりも優れた結果が得られることが示された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:23:01 GMT)
ASymPO: Asymmetric-Scale Policy Optimization for Asynchronous LLM Post-Training Without Behavior Information [23.1] 非同期強化学習は、ポリシー最適化から応答生成を分離することで、言語モデル後学習のスループットを向上させることができる。
標準的な行動補正法は、行動政治の確率、重要度、またはクリップによってこのドリフトを制御する。
本稿では,各応答のトークン損失を,現在の平均トークン負の対数確率で正規化する非対称スケールポリシー最適化(ASymPO)を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:46:22 GMT)
Three Years of r/ChatGPT: Societal Impact Evaluations from Social Media Data [23.0] 2022年11月30日にChatGPTが打ち上げられ、その1日後にr/ChatGPTのサブレディットが作られた。
広く採用されている消費者向けAI製品の社会的影響を理解するために、ソーシャルメディアをデータソースとして使用しています。
また,2024年10月には情緒的エンゲージメントの増加をPuLSEが検出できることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:23:41 GMT)
TOKI: A Bitemporal Operator Algebra for Contradiction Resolution in LLM-Agent Persistent Memory [22.9] 矛盾の解決は書き込み時の制御であり、欠落した契約を明確にすることを示しています。
TOKIは、二重行スキーマ上での2時間演算子の1つのファミリとして、四重項をタイプする。
8つのシステムにまたがる判定行列はギャップをローカライズする: 書き込みパス上の言語モデル判断を保持するすべてのベースラインは、3つの書き込み時異常のうちの少なくとも1つを許容する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:46:52 GMT)
Edge-Aware Curvature Modeling for Graph Understanding in Large Language Models [22.7] グラフ対応大規模言語モデル(LLM)は、グラフ構造化データとテキスト情報を共同でモデル化する有望な機能を示している。
大規模言語モデルのための曲線拡張グラフ表現のCureLLMフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:12:34 GMT)
Learning Long Range Spatio-Temporal Representations over Continuous Time Dynamic Graphs with State Space Models [22.6] 連続時間動的グラフ(CTDG)は、進化するデータの微細な時間パターンをキャプチャする、よりリッチなフレームワークを提供する。
連続時間動的グラフのためのパラメータ効率のよい状態空間モデリングフレームワークを導出する。
CTDG-SSMは、LRT(long range temporal)と空間推論を必要とするデータセットにおいて、大きなパフォーマンス向上を達成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:25:02 GMT)
Can LLMs Be Constrained to the Past? Improving Knowledge Cutoff through Recall-Based Prompting [22.5] 知識の急激なカットオフは、大きな言語モデルに対して、特定のカットオフ日を超える情報が利用できないかのように振舞うように指示する。
本稿では, 自己リコールと質問-リコールという2つのリコールベースのプロンプト戦略を提案する。
提案手法は, 直接回答と従来のステップバイステップ推論ベースラインの両方に優れる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:33:56 GMT)
ForeSci: Evaluating LLM Agents for Forward-Looking AI Research Judgment [22.4] 研究員が歴史的証拠から前向きな判断を下せるかどうかを評価するためのベンチマークであるForeSciを紹介する。
ForeSciには、素早く動く4つのAIドメインと4つの意思決定ファミリに500のタスクが含まれている。
明確な証拠組織は、トレーサビリティと事実支援を改善するが、決定家族に強く依存する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:19:03 GMT)
Learning Visual Spatial Planning from Symbolic State via Modality-Gap-Aware Self-Distillation [22.3] MGSDは2段階のモダリティを意識した自己蒸留フレームワークである。
MGSDは4Bと8Bの両方のバックボーンの視覚的計画を改善する。
これらの結果は、モダリティを意識した自己蒸留は、モデルが実行可能な状態をどのように知覚するかだけでなく、推論された構造をどう計画するかも改善することを示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:13:24 GMT)
Dynamic Multi-Agent Pickup and Delivery in Robotic Cellular Warehousing Systems [22.2] この手紙は、内部秩序の進化を考慮した動的マルチエージェントピックアップとデリバリの問題を初めて定式化したものである。
トークンパスパラダイムに基づいて、2つのイベントトリガー付きオンラインリプランニングアルゴリズムを提案する。
提案手法は, 静的および非協調的ベースラインと比較して, オーダーフロー時間を大幅に削減する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:50:31 GMT)
SoCRATES: Towards Reliable Automated Evaluation of Proactive LLM Mediation across Domains and Socio-cognitive Variations [22.1] SoCRATESは、現実的なマルチドメインテストベッドにおいて、プロアクティブなLCMメディエータを評価するためのベンチマークである。
8つのドメインにまたがるエージェントパイプラインを通じて、実際の競合からシナリオを構築する。
5つの社会認知適応軸(ストラテジック姿勢、パーティー構成、歴史の長さ、感情的反応性、文化的アイデンティティ)を探索し、トピックローカライズされた評価器で進行する順番にのみ各トピックをスコアする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:19:40 GMT)
Self-Augmenting Retrieval for Diffusion Language Models [22.0] 捨てられたトークンは、実際に検索拡張生成に有用なルックアヘッド信号であることを示す。
我々はこれを拡散言語モデル(SARDI)の自己拡張検索によって活用する。
SARDIはトレーニングフリーで、レトリバーに依存しず、任意の推論可能な離散拡散言語モデルに適用できる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:56:27 GMT)
Multi-Resolution Tactile Imitation Learning for Contact-Rich Robotic Manipulation [22.0] 異なる時間分解能で動作する複数の触覚センサを利用する表現フレームワークMiTaSを提案する。
MiTaSの平均成功率は80%であり、視覚のみ(31と視覚触覚(54のベースラインではタスクを確実に解決できない)である。
詳細なセンサ読み取りと注意分析により、タスクの実行を通して異なるセンサーの重要性が明らかになる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:23:03 GMT)
FOXGLOVE: Understanding Goal-Oriented and Anchored Writing Feedback from Experts and LLMs on Argumentative Essays [21.9] FOXGLOVE(FOXGLOVE)は,69級の論論エッセイにおいて,教官による696件のフィードバックコメントのデータセットである。
インストラクターとLLMは、目標やエッセイの位置にも同様にフィードバックを分配するが、インストラクターとモデルはフィードバックを提供する特定の文に基づいて分散する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:13:25 GMT)
RealDexUMI: A Wearable Universal Manipulation Interface for Dexterous Robot Learning [21.9] 本稿では,共有デキスタラスエンドエフェクタモジュールを中心に構築されたウェアラブルユニバーサル操作インタフェースであるRealDexUMIを紹介する。
手のひら側は、人間の指の入力をロボットハンドのコマンドにマッピングし、リアルタイム、手袋なし、直感的で正確な手操作を可能にする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:28:23 GMT)
Narrative Knowledge Weaver: Narrative-Centric Retrieval-Augmented Reasoning for Long-Form Text Understanding [21.5] Narrative Knowledge Weaver(NKW)は、テキストのエビデンス、原子的事実、標準グラフ構造、エンティティプロファイル、インタラクション、エピソード、ストーリーラインを整列する基盤となるフレームワークである。
NKWは、よりパス中心のベンチマークで競争力を維持しながら、画面レベルのストーリーワールドQAで最強です。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:30:11 GMT)
Gender Artifacts from Art History to Text-to-Image Generation [21.3] 歴史的画像と生成画像の両方において、性別表現とスタイルの相互作用を調査するための最初のデータセットを紹介する。
StyleGenderは、19の芸術様式にまたがる74Kの画像で構成されている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:08:00 GMT)
Statistical Priors for Implicit Preferences: Decoupling Skill Selection as a Local Harness in Personal Agents [21.3] LLM(Large Language Model)は、新しいパラダイムとして登場した。
APIベースのリモートモデルと外部スキルに依存するパーソナルエージェントが、新しいパラダイムとして登場した。
本稿では、意味的意図解析から統計的嗜好学習を厳密に分離する新しいアーキテクチャによる、そのようなハーネスの実装について検討する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:07:10 GMT)
Preserving Full 6-DOF Actuation Under Abrupt Total Rotor Failures: Passive Fault-Tolerant Flight Control Using a Biaxial-Tilt Hexacopter [21.2] 従来のマルチローターは、急激なローターの故障により、到達可能なレンチスペース(AWS)が急速に崩壊する。
本稿では, 急激な全ロータ故障時の二軸チルトオーバーヘキサコプター(BTO)の受動耐力飛行について述べる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:45:26 GMT)
Epistemic Injustice in Language Models: An Audit of Pretraining Filters and Guardrails [21.2] 本研究は,4つの事前学習フィルタと3つの推論時ガードレールを,ジェンダーと地域的言及を含むCommon Crawl文で評価する。
分析の結果,フィルタとガードレールの決定はブロックリストに基づく語彙的手がかりと強く関連していることがわかった。
同時に、特にトランスジェンダーの人々、女性、中央アメリカ人といった疎外されたグループは、システム全体で著しく過度に偏っている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:38:55 GMT)
RREDCoT: Segment-Level Reward Redistribution for Reasoning Models [20.7] RREDCoT(Reward ReDistribution for Chain of Thoughts)を導入し,新たな世代を伴わずに最適報酬再分配を近似する。
また,CoTトレースのセグメンテーションや状態値推定など,再分配の構成に関連するいくつかの側面も分析する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:56:31 GMT)
Consistency Training Along the Transformer Stack [20.6] 整合性トレーニング(MLPCT)と注意整合性トレーニング(AttCT)の2つの新しい内部整合性トレーニングを導入する。
一貫性のトレーニングは、以前の作業で調査された梅毒やジェイルブレイクのセッティングをはるかに越えていることが分かりました。
この結果から,整合性トレーニングはフレキシブルかつアライメントの枠組みであり,より広範なモデル病理のクラスに対する防御を統一できることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:58:55 GMT)
RedKnot: Efficient Long-Context LLM Serving with Head-Aware KV Reuse and SegPagedAttention [20.6] LLMサービスのためのヘッドアウェアKVキャッシュ管理システムであるRedKnotを提案する。
RedKnotは、KVヘッドに沿ってKVキャッシュを分解することで、従来のモノリシックなKVキャッシュの抽象化を破る。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:57:07 GMT)
Multilingual Fine-Tuning via Localized Gradient Conflict Resolution [20.4] 我々は、勾配に基づくMOOアルゴリズムを局所的に適用するスケーラブルな分散フレームワークであるBucket-Level MOOを紹介した。
実証的に、Bucket-Level MOOは大きな言語モデルを駆動することで干渉を緩和し、異なる言語固有の次元を構築する。
提案手法は,従来の微調整パラダイムよりも多言語性能を著しく向上させる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:36:30 GMT)
Attack Detection using Time Series Foundation Models [20.4] 本稿では, 植物モデルやその構造を知ることなく, サイバー物理システムにおける攻撃検出の問題に対処する。
Google Researchが開発した時系列基盤モデルであるTimesFMに基づくモデル構造のない検出器を提案する。
The TimesFM-based detector is a same or superior attack detection performance。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:19:24 GMT)
LongSpace: Exploring Long-Horizon Spatial Memory from Perception to Recall in Video [20.1] 自律走行やロボットナビゲーションのような長距離作業は、現在の視点を認識する以上のものを必要とします。
長距離空間記憶のためのルームツーリングビデオベンチマークであるLongSpaceを紹介する。
LongSpaceは、長いビデオをシーケンシャルなチャンクとしてモデル化し、3D構造的キューを初期のデコーダ層に組み込み、質問誘導検索のためのレイヤ対応メモリを構築する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:00:12 GMT)
HyperVis: Continuous Latent Visual Relational Graphs on the Lorentz Hyperboloid for Compositional Reasoning [20.0] 我々はSGGセマンティックボトルネックを完全に回避するtextbfHyperVisを提案する。
我々は空間的に偏った交叉アテンションを通して高密度な$O(N2)$ビジュアルリレーションテンソルを計算し、ローレンツ双曲体に投影し、空間物理学、すなわちIoA駆動のエンテーメントコーンと外角反発によって階層を強制する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:40:15 GMT)
LLM Explainability with Counterfactual Chains and Causal Graphs [19.9] 因果グラフはメカニズムを透過的にするための高レベル言語を提供する。
最近の研究では、Large Language Models (LLMs) を用いて、外世界のプロセスの因果グラフを復元している。
LLM推論自体をモデル化するために因果グラフを使用し、モデルがどのように認識し、予測を生成するために高レベルの概念を整理するかを、ステークホルダーに透過的なビューを提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:15:12 GMT)
Large Language Models are Perplexed by some Political Parties [19.8] 大規模言語モデル (LLM) は、政治的応用を含め、ますます使われてきているが、その政治的公正性はほとんど研究されていない。
我々はそれを難易度を用いて評価し、公正なモデルがすべての政治的グループに平等な確率を与えるべきであると仮定する。
LLMは、社会民主主義政党よりも右派やナショナリズム政党の文章に悩まされていることがわかりました。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:39:05 GMT)
CLEAR: Cognition and Latent Evaluation for Adaptive Routing in End-to-End Autonomous Driving [19.5] 超高速な生成計画と深い意味的推論を組み合わせたフレームワークであるCLEARを提案する。
CLEARはDrive-JEPAをビジュアルエンコーダとして採用し、VAEラテント空間におけるマルチステップデノイングチェーンを単一ステップ条件ドリフトに置き換える。
NAVSIM v1ベンチマークでは、CLEARは93.7の最先端のPDMSを達成した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:32:10 GMT)
LLMCodec: Adapting Video Codecs for Efficient Weight Compression of Large Language Models [19.2] ビデオコーデックは、大きな言語モデル(LLM)圧縮のための有望なソリューションを提供する。
本稿では,近年のVVC/H.266ビデオとアフィン量子化を統合したビデオベースLLM圧縮手法を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:35:53 GMT)
Safety Paradox: How Enhanced Safety Awareness Leaves LLMs Vulnerable to Posterior Attack [19.2] 大規模言語モデル(LLM)は、有害な要求を拒否するために厳格に整列されている。
本研究では、この高度な安全意識が必然的に致命的な脆弱性をもたらすことを明らかにする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:36:41 GMT)
TARPO: Token-Wise Latent-Explicit Reasoning via Action-Routing Policy Optimization [19.0] TARPOは純粋なRLフレームワークであり、各ステップで離散トークン生成と連続潜在推論を切り替える。
TARPOは、様々なベンチマークで、既存の明示的で潜在的なRLベースラインよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:30:53 GMT)
DisasterBench: A Multimodal Benchmark for UAV-Based Disaster Response in Complex Environments [18.8] DisasterBenchは、複雑な環境でのUAVベースの災害対応のためのマルチステージマルチモーダル推論ベンチマークである。
DisasterVLは3段階のパイプラインで最適化された軽量なマルチモーダルモデルであり、ドメイン命令チューニング、チェーン・オブ・オブ・ソート方式のマルチモーダルアライメント、強化学習に基づくポリシー最適化を組み合わせたものである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:31:11 GMT)
Deciphering Two Training Clocks in Grokking via Deep Linear Network Theory with Conditional ReLU Reduction [18.7] Grokking氏は、トレーニングデータに適合し、単純な基本ルールを学ぶことは、異なる時間スケールで起こりうることを示唆している。
我々はこの現象を、分類損失の高速な減衰と学習された表現の緩やかな単純化を分離して定式化する。
対数的時間スケールにおいて,差分成長あるいは一段階抽出条件により,クロスエントロピー損失がレベルエプシロンに減少することを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:39:04 GMT)
Cosine Misleads: Auxiliary Losses Reshape Vision Language Models, Not Their Latents [18.7] 潜在視覚推論(LVR)は、視覚言語モデルにおける知覚と応答生成の間に監督された潜在トークンを挿入する。
我々は、5つのLVR変種からなる設計された行列を用いてこれを検証し、その仮定を逆転する:コサインアライメントは5つすべての精度と負の相関を持つ。
我々は,PRISM,一対の推論時間診断,すなわち,どの解答がデオード可能かを問う線形プローブ,および遅延がロードベアリングであるかどうかを問う汚職テストを紹介する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:26:18 GMT)
Adaptive Tokenisation Via Temporal Redundancy Masking And Latent Inpainting [18.7] 適応的ビデオトークン化(Adaptive Video tokenisation)は、シーケンスの基盤となる視覚的複雑さに基づいて、トークンの予算を動的に割り当てる。
凍結連続ビデオトークンの潜伏空間は,直接利用可能な時間的冗長性を本質的に符号化していることを示す。
パラメータフリー適応トークン割り当て機構を導入し,時間-L1差分に対する固定しきい値を適用した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:31:12 GMT)
Diffusion Models for Adaptive Sequential Data Generation [18.4] 時系列観測は、予測、シミュレーション、リスク評価、データ駆動意思決定に使用される。
本稿では,適応時系列生成のための逐次前方拡散フレームワークを提案する。
一般的な枠組みの下で厳密な統計的保証を導出し、スコア近似、スコア推定、分布推定結果を確立する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:59:24 GMT)
Evaluating Stochastic Collapse and Implicit Bias in Multimodal Large Language Models [18.3] MLLM(Multimodal Large Language Models)の現在の評価は、ユーティリティ駆動の目的に圧倒的に重点を置いている。
我々は,MLLMが等価な選択肢を選択する際に,分布中立性を維持することができるかどうかを評価するためのベンチマークであるRandomBenchを提案する。
実験では、MLLMが明示的なランダム命令の下で一様ランダム性を維持するのに失敗する「Collapse」と呼ばれる広汎な現象が明らかになった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:47:15 GMT)
Accelerating and Scaling MPC-Guided Reinforcement Learning for Humanoid Locomotion and Manipulation [18.3] ヒューマノイドモーションコントロールでは、モデル予測制御(MPC)は物理的に基底的な予測と制約処理を提供する。
強化学習(RL)は、大規模なシミュレーションを通じて、堅牢な全身スキルを実現する。
本研究は,MPC-RLと呼ばれるヒューマノイド移動・操作のための訓練時間MPC指導の効率化に関する研究である。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:12:47 GMT)
Beyond Semantic Organization: Memory as Execution State Management for Long-Horizon Agents [18.3] LLMベースのエージェントは、相互依存的な決定によって、ますます長い水平タスクに取り組む。
既存のRAGとエージェントメモリシステムは、意味的類似性によって履歴を整理し、決定時にコンテンツ関連エントリを取得する。
MAGE(Memory as Agent-Guided Exploration)は,階層的な状態木にインタラクションを格納するアクティブな実行状態マネージャである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:26:42 GMT)
KV-Control: Parameter-Efficient K/V Injection for Trajectory-Controlled Text-to-Motion [18.3] フリーズテキスト・トゥ・モーション・トランスのためのコンパクトなアテンション側制御インタフェースであるKV-Controlを導入する。
KV-Controlは、トラジェクティブコンディショニングを軽量なメモリ検索としてリフレームし、テキスト・トゥ・モーション生成のための小型で正確で透明な制御インターフェースを提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:50:20 GMT)
The Tell-Tale Norm: $\ell_2$ Magnitude as a Signal for Reasoning Dynamics in Large Language Models [18.2] 隠れ状態の l2 ノルムがモデルの推論強度の内在的なシグナルとなることを示す。
このパターンに動機付けられて、推論強度とモデルの潜在幾何学との公式なリンクを確立する。
モデルアーキテクチャとベンチマークによる実験では、l2-normベースの技術が推論性能を著しく改善していることが示されている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:59:07 GMT)
Steering Vectors are an Adversarial Attack Surface [18.0] アクティベーションステアリングは、微調整なしで大規模言語モデル(LLM)の動作を制御する一般的な方法である。
我々は,このパイプラインをひっそりと汚染していることを示す。
これは、良心的なプロンプトに対する意図されたステアリング効果を維持しながら、ターゲットモデルを破壊します。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:56:48 GMT)
ATT-CR: Adaptive Triangular Transformer for Cloud Removal [17.8] クラウド除去は、リモートセンシング画像において雲によって隠された地上オブジェクトを正確に再構築することを目的としている。
既存のTransformerベースの手法は、クラウド画像の長距離依存性を効果的にモデル化することで、印象的な結果を示している。
本稿では,クラウド除去のための適応三角変換器 (ATT-CR) を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:47:41 GMT)
When New Generators Arrive: Lifelong Machine-Generated Text Attribution via Ridge Feature Transfer [17.4] リプレイに依存しない軽量な分析更新フレームワークであるRridgeFTを提案する。
RidgeFTは、初期ジェネレータセットにタスク対応エンコーダを訓練し、各ジェネレータクラスが最初に観測されたときに、コンパクトなクラス単位の十分な統計情報を格納する。
次に、共分散キャリブレーションによるジェネレータ非関連変動を抑制し、固定されたランダム特徴による表現能力を改善し、クローズドフォームリッジレグレッションを通じて新しいクラスを更新する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:50:58 GMT)
Generating Graph-Like Logical Rules for Knowledge Graph Reasoning via Diffusion Models [17.3] 本稿では,グラフのようなルール発見を,対象関係に条件付き離散生成プロセスとして再構成するフレームワークであるGRiDを提案する。
6つのベンチマークデータセットの実験は、GRiDがKG完了タスクの競合性能を達成することを示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:13:27 GMT)
Symmetric Divergence and Normalized Similarity: A Unified Topological Framework for Representation Analysis [17.2] 我々は,微細な構造診断とロバストな標準化された評価を支援する統合トポロジカルツールキットを開発した。
不均一な設定で信頼性の高いベンチマークを可能にするために、正規化された位相類似性(NTS)を提案する。
NTS は -1 と 1 の間に有界なスケール不変距離を求め、非正規化された発散物のスケールとサンプル依存性を効果的に克服する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:14:13 GMT)
Beyond Alignment: Value Diversity as a Collective Property in Multicultural Agent Systems [17.2] 多文化エージェントシステムのためのシステムレベルの評価軸として,価値の多様性を提案する。
多様性はアライメントとほとんど関係がないことが分かり、両者が相補的なシステム特性を捉えていることが示唆された。
社会的相互作用は、コンセンサスにエージェントを駆り立てることで、多様性をさらに損なう。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:26:33 GMT)
Analysis of the Neglect-Zero Effect in Large Language Models [17.2] LLMの言語処理が人間の認知過程にどのように似ているかを検討する。
無視ゼロ効果によって引き起こされる2種類の推論に焦点を当てる。
その結果, 本研究で分析したLSMでは, 無視ゼロ効果は生じないことが示唆された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:39:39 GMT)
RiskFlow: Fast and Faithful Safety-Critical Traffic Scenario Generation [17.0] RiskFlowはクローズドループ安全クリティカルなマルチエージェントトラフィック生成フレームワークである。
将来の軌道生成を作用空間の輸送として定式化する。
競争力のある安全クリティカルな生成能力を維持しながら、リアリズムを継続的に改善する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:28:42 GMT)
Resonant Minds: Closed-Loop Social Avatars with Theory of Mind [16.9] 本稿では,認識,社会的推論,表現を連続的な相互作用サイクルに統合した閉ループ二重エージェントフレームワークを提案する。
知覚モジュールは、パートナーのマルチモーダルな振る舞いをビデオから分析し、社会的推論モジュールは、心の理論を通して隠れた精神状態を予測する。
その後、表情モジュールは、リスナーの反応行動とともに、話者音声と表現の両方の感情制御可能なデュアルエージェントビデオを生成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:03:43 GMT)
Unveiling the Unknown: Open Vocabulary Object Detection with Scene Graphs [16.9] オープンボキャブラリオブジェクト検出は、トレーニングデータの一部ではない新しいオブジェクトカテゴリを識別する。
これらの手法はしばしば、相互作用や空間配置など、オブジェクト間の構造的、イメージ固有の関係を見落としている。
本稿では,この問題に対処するためのScene-guided Modeling Detectionフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:23:08 GMT)
More than a Judge: An Empirical Study of Agent-Human Interaction in Crowdsourced Testing Assessment [16.7] 本研究では,LLM-as-a-Judgeパラダイムに基づくマルチエージェント評価バックボーンの開発と評価を行った。
しかし、信頼性の高い自動判断は、エージェントの出力がワークフローに埋め込まれた時に人間の作業を改善するかどうかをそれ自体が示さない。
本稿では,評価に基づく行動フィードバックが,テスト担当者の報告の修正方法,その後のタスクの実行方法,アプリケーション間での報告プラクティスの伝達方法を改善するかを検討する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:39:05 GMT)
Computation-Aware Event-to-Frame Reconstruction via Selective Attention [16.5] Event-to-frame(E2F)再構築は、非同期イベントストリームをフレームベースのビジョンパイプラインでブリッジする。
本稿では,因果時間モデリングと計算対応設計を重視した効率的なE2Fフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:19:59 GMT)
Monte Carlo Steklov Operators for Large-Scale Geometry Processing in the Wild [16.4] 本稿では、ディリクレ・トゥ・ノイマン作用素とその関連するステクロフ固有モジュラーを推定するためのモンテカルロ法を提案する。
提案手法は,Steklovスペクトル計算のための既存の境界要素法よりも桁違いに高速であることを示す。
我々はこれらの演算子を、大規模表現学習にボリュームスペクトル演算子を使用するメッシュベースのニューラルネットワークであるSteklov-CLIPに組み込む。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:56:11 GMT)
Coding with "Enemy": Can Human Developers Detect AI Agent Sabotage? [16.3] AIコーディングエージェントは、ますます現実世界のソフトウェア開発に埋め込まれている。
エージェントは人間の信頼を利用して開発を妨害することができる。
我々は、AI符号化サボタージュにおける人間の監視に関する最初の大規模な研究を行う。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:22:17 GMT)
Gradient-Flow Optimization as Dynamic Random-Effects Inference: Testing and Early Stopping with Applications to Deep Learning [16.2] 我々は勾配流学習のための統計的推論フレームワークを開発した。
トレーニング時間は、分散が再配置される方法を決定する分散成分パラメータになる。
固定勾配系における深層学習モデルは、理論の現代AIインスタンス化を提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:06:53 GMT)
An Embarrassingly Simple Detector for Model Extraction Attacks in Large Language Model API Traffic [16.2] 大規模言語モデル(LLM)はホストAPIを通じてますますデプロイされ、モデルの抽出がモデルのオーナシップとサービスのセキュリティに対する現実的な脅威となる。
我々は、良性キャリブレーションされた交通窓分布試験としてモデル抽出監視を定式化する。
入力クエリをセマンティック空間に埋め込み、それらの集合分布が過去の良性トラフィックから逸脱するかどうかをテストする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:33:49 GMT)
Filter, Then Reweight: Rethinking Optimization Granularity in On-Policy Distillation [16.1] 大規模言語モデルにおけるオンライン蒸留(OPD)は、完全なKLの監督からより選択的な訓練パラダイムへと移行しつつある。
近年のOPD法では,どの軌跡から学ぶか,どのトークンが最も情報的か,どの信号が最も信頼できるかの選択に注目が集まっている。
本稿では,ファリコンFiRe-OPD(Filter, then Reweight)を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:52:50 GMT)
Flow-based Policy Adaptation without Policy Updates [16.1] GLOVESは、専門的なアクション分布に転送することで、非専門的なアクションを補正するフローベースの適応手法のファミリーである。
ローカルな専門家のアクションパターンを学び、実行中にそれらを縫い合わせることで、GLOVESはタスクや環境にまたがる堅牢なアクション適応のための軽量な共有コントロールモジュールを提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:51:12 GMT)
MS-DKC: A Dataset Knowledge Card Framework for Designing and Adapting Medical Image Segmentation Models [16.0] 本稿では,医用画像のセグメンテーション因子を明確にするためのフレームワークである医療知識カード(MS-DKC)を紹介する。
DRIVE,ISIC2018,ACDCにおけるMS-DKCの評価を行った。
さまざまなデータセットには、モデルが適切に判断される前に、さまざまな事前、運用ポイント、エビデンスが必要です。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:45:42 GMT)
PortBench: A Correlation-Aware, Full-Pipeline Benchmark for LLM-Driven Portfolio Management [15.7] 大規模言語モデル(LLM)は、様々な財務タスクにおいて強力なパフォーマンスを示しているが、ポートフォリオ管理(PM)はいまだにベンチマークが不十分である。
PortBenchは、10年間で6つの異種資産クラスにまたがるベンチマークです。
静的な財務QAの性能は高いが、モデルに目立った組み合わせの90%は、基本的等重量割当を上回りません。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:29:42 GMT)
Community-Aware Assessment of Social Textual Engagement and Resonance: A Human-Centric Perspective on User-Generated Content Evaluation [15.6] 本稿では,信号中心の指標から人間中心の共鳴評価へのパラダイムシフトを提案する。
本稿では,新しいソーシャル・チェーン・オブ・トラヒック(Social-CoT)機構を導入するMEDEAについて紹介する。
CASTER-Benchは、さまざまなカテゴリをカバーする包括的な人間アノテーション付きベンチマークである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:48:12 GMT)
Topics as Proxies for Sociodemographics: How Conversational Context Affects LLM Answers [15.5] 本研究では,大きな言語モデル(LLM)が,単一の会話履歴からユーザ社会デマトグラフィーを推測するのに苦労していることを示す。
会話の話題は、会話の文脈内でLLM生成のアドバイスを最も予測することを発見した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:00:24 GMT)
Revisiting Lexicon Evaluation in Unsupervised Word Discovery [15.4] 一般的なメートル法、正規化された編集距離は、各クラスタで発見された単位間の音素編集距離を平均化する。
我々は,この指標が大規模クラスタの品質に固有の偏りがあることを示し,公正な評価を阻害することを示した。
これらの欠点に対処する2つの指標を提案する。クラスタ内の一貫性を評価する際のクラスタサイズを計測する修正されたメトリックと、クラスタにまたがる真の単語をどのように分散するかを評価する逆メトリックである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:55:09 GMT)
Causal Modeling of Selection in Evolution [15.2] 共通の物語における「選択」には、静的選択と進化選択という2つの形態があると主張する。
既存の方法はこれらの2つの形式を概ね説明し、同じグラフィカルな選択モデルに依存している。
このモデルは静的な設定に有効であるが、進化中のデータの特徴付けに失敗し、誤った発見結果が得られることを示す。
進化的選択を特に特徴付ける新しいモデルを導入し、1つまたは複数の環境や世代にわたるデータからそのようなモデルを識別するための健全で完全な手順を開発する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:16:06 GMT)
ADK Arena: Evaluating Agent Development Kits via LLM-as-a-Developer [15.0] textbfLLM-as-a-Developerは、ドキュメントから各フレームワークのAPIを学習し、エージェントコードを書き、テストが通過するまで検証とフィードバックのループを通じて繰り返し修正するLLMコーディングエージェントで、人間の開発者を置き換える。
textbfADK Arenaは、フレーム単位のDocker分離、3レベル検証パイプライン、SWE-bench、2$-bench、Terminal-Bench、MCP-Atlas用のベンチマークアダプタを備えた、完全に自動化されたパイプラインです。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:00:54 GMT)
The Post-GCN Decade Revisited: Curvature-Stratified Evaluation of Relational Learning [14.7] 本研究では,モデルの有効性を規定する重要な潜在因子として,固有幾何を同定する。
本稿では,データセットを正,負,ほぼゼロの曲率に分割する曲率階層化評価フレームワークを提案する。
モデルランキングは各曲率レギュラーにおいて非常に安定であるが、レギュラー間で大きく変化しており、性能は基本的に幾何学に依存していることを示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:05:36 GMT)
Multi-Objective Submodular Maximization with Differential Privacy [14.7] 差分プライバシー(DP)下での濃度制約を考慮した多目的サブモジュラー(MOSM)について検討する。
2つの新しいアルゴリズムを提案する: 1つは古典的欲求アルゴリズムを拡張し、もう1つはトランケーション手法を採用する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:18:41 GMT)
Staying with the Uncertainty: Uncertainty-Scaffolding Strategies for Artificial Moral Advisors in LLM-to-LLM Simulated Conversations [14.2] 我々は3つの不確実性モード(パースペクティブ、テンション保存、プロセス反射)を提案し、それらを3つの制御条件(ベースライン、パーサッシブ、シコファンティック)と比較する。
ユーザエージェントLLMは、特定の不確実性戦略に従ってAMAと倫理ジレンマの対話を行い、事前及び後アンケートを完了する。
その結果,1つのモデルがシミュレーションされたユーザエージェントとして支配的であり,オープンモデルと人間のあいまいさが一致していることが判明した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:59:10 GMT)
Better Literary Translation: A Multi-Aspect Data Generation and LLM Training Approach [14.2] 高品質な翻訳参照と嗜好データを生成する多視点反復改良フレームワークを提案する。
生成したデータを教師付き微調整および強化学習に活用する。
実験の結果, 生成した基準は, SFTの原点真理を8.65CEA100ポイント上回ることがわかった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:27:29 GMT)
Where does Absolute Position come from in decoder-only Transformers? [14.0] RoPEが学習した変換器は、内部積の相対オフセットのみを符号化しているにもかかわらず、注意パターンにおける絶対位置を区別する。
このリークを、因果マスクと残留ストリームの2つのアーキテクチャコンポーネントにトレースする。
NTKスケーリングは残留流成分を抑制し、スライディング・ウインドウ・アテンションは深度で蓄積し、標準のRoPEは中間に位置する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:32:38 GMT)
TAGA: Terrain-aware Active Gaze Learning for Generalizable Agile Humanoid Locomotion [13.9] 本研究では,意識に基づくヒューマノイド制御のためのTerrin-aware Active Gaze学習フレームワークTAGAを紹介する。
本フレームワークは,予測的手がかりを学習し,ハイトスキャンの特定の領域に積極的に参画するためのモデルである。
このような視線行動は、追加の監督や明示的な指導を必要とせず、強化学習だけで自然に現れることが判明した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:52:56 GMT)
Reactive Flux Matching: Mechanism Discovery and Adaptive Sampling of Rare Events [13.9] 反応軌道データから2つの相補的オブジェクトを直接学習するフレームワークであるFlux Matchingを紹介する。
Fフラックスマッチングは、分子系の電流速度軌跡の生成と速度定数計算によって検証される。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:31:50 GMT)
Adapting Diffusion Language Models for Lossless Pixel-Level Image Transmission [13.8] ロスレスピクセルレベルの画像伝送は、セマンティック通信以上の基本的な仕組みである。
本稿では,画像伝送のための個別なシンボル拡散モデルに基づくソースチャネル符号化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:14:31 GMT)
Agentic Molecular Recovery via Molecule-Aware Exploration [13.7] 無効なドラフトは、妥当性指向の修復からアイデンティティ保護分子回復への移行によって解決されるべきである。
分子認識型ミスマッチ追跡と拡張された候補探索と軌道レベルの選択を併用したAMRECを提案する。
3つのバックボーンモデルからの無効なChEBI-20ドラフトでは、AMRECは構造、正確なマッチ、文字列レベルのメトリクスで最強の全体的な回復プロファイルを達成した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:23:01 GMT)
Mitigating the Curse of Dimensionality in Uniform Convergence of Deep Neural Networks via Smooth Activations [13.6] 本稿では,滑らかに活性化されたディープニューラルネットワーク(DNN)推定器の一様収束に関する理論的枠組みを確立する。
目的関数の低次元階層構造を適応的に利用することにより、滑らかなDNNが一様収束における次元の呪いを軽減することができることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:24:50 GMT)
Unified Driving Tokens: Representation- and Geometry-Guided Discrete Tokenizer for Driving World Models and Planning [13.4] 共同管理下で離散トークンを学習する表現誘導型および幾何学強化型トークン化器を提案する。
NAVSIMの実験では、再構成の忠実度と表現整合性、固定デコーダによる競合計画性能、一致した設定での生成品質が向上した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:01:18 GMT)
Pause and Think: A Dataset and Benchmark for Video-Grounded Assistive Action Suggestion [13.4] これは、モデルが一時停止し、視覚的エビデンスを推論し、実行可能な応答を生成することを奨励する、推論中心のトレーニングデータセットです。
このデータセットは、回答の生成に先立って構造化推論を促進し、人間のようなシーンベースの支援に向けてモデルを導く。
実験結果から,目標推論により,学習データを超えた行動的,視覚的なガイダンスを,コンパクトなモデルで提供できることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:08:40 GMT)
When Should Memory Stay Silent: Measuring Memory-Use Boundaries in Memory-Augmented Conversational Agents [13.4] 長期記憶により、言語モデルエージェントはパーソナライズされたインタラクションをサポートすることができる。
利用可能な記憶がいつ応答に統合されるかは、まだ不明である。
検索システムは露光を減らすが、感度の高いメモリがジェネレータに到達すると、統合を排除しない。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:54:51 GMT)
Quantum enhanced rare event discovery and sampling [13.2] 金融上のクラッシュ、インフラストラクチャのカスケード障害、AIシステムの重大なエラーは、非常に小さな確率で発生するイベントによって頻繁に引き起こされる。
本稿では,希少な事象を学習することなく,希少な発見とサンプリングを行う量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:54:53 GMT)
Optimally taming biases in black-box models for efficient semiparametric estimation [13.2] 補助関数 $mathbbE[T|X=x]$ が一貫して推定できない状態において、標準 DML レートが最適でないことを示す。
この結果から,新たな仮定を課すことなく,ニュアンス推定の1次誤差を除去できるという原理が得られた。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:36:18 GMT)
Multiple Quantum Hypothesis Testing: One-Shot Pairwise Bounds and Sharp Asymptotics [13.1] 一対誤差の和で最小誤差確率の次元自由一発上限を確立する。
最小誤差確率は、任意の定数まで、トレース調和平均量によって特徴づけられることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:49:12 GMT)
A Novel Method with Encoder-Decoder for Cross-Sensor Adaptation in Surface Shape Sensing with Sparse Strain Sensors [12.9] 本研究では,スパースひずみセンサに基づく表面形状センサのためのエンコーダデコーダアーキテクチャを提案する。
メタラーニングと少数ショット適応戦略を取り入れ、センサーアレイの異なるグループに適応できるようにする。
その結果, 表面形状センサのコストと訓練負担を大幅に低減できることがわかった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:07:56 GMT)
Seeing Time: Benchmarking Chronological Reasoning and Shortcut Biases in Vision-Language Models [12.8] 本稿では,視覚言語モデルが時系列情報をどのように知覚し,理由を判断するかを評価するための新しいベンチマークを提案する。
我々の研究は、時間的判断の根底にある論理とマルチモーダル統合への展開を掘り下げている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:49:09 GMT)
From Failed Trajectories to Reliable LLM Agents: Diagnosing and Repairing Harness Flaws [12.8] 本稿では,エージェント故障の診断と修復を行うためのトレースガイドフレームワークであるHarnessFixを提案する。
HarnessFixは生の実行トレースをコンパイルし、コードをHarness対応のトレース中間表現に変換する。
障害の原因は、責任ある軌道ステップとレイヤの活用、繰り返し診断を実行可能な欠陥レコードに集約し、スコープ化された修復オペレータにマップすることにある。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:58:30 GMT)
SlotGCG: Exploiting the Positional Vulnerability in LLMs for Jailbreak Attacks [12.7] textitVulnerable Slot Score (VSS)を導入し、ジェイルブレイクに対する位置的脆弱性を定量化する。
次に、最も脆弱な挿入スロットを選択し、それらのスロットに対してターゲット最適化攻撃を実行するSlotGCGを提案する。
提案手法では,攻撃に依存しない位置探索機構を任意の最適化ベースの攻撃にプラグインし,200msの事前処理時間を追加する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:31:29 GMT)
PlanBench-V: A Spatial Planning Map Benchmark for Vision-Language Models [12.5] 空間計画図の解釈において、視覚言語モデル(VLM)を評価するための最初の総合的なベンチマークであるPlanBench-Vを紹介する。
まず,プロのプランナーによる223の計画図と1629の質問応答ペアからなる専門家によるデータセットである空間計画地図データベース(SPMD)を構築した。
次に、認識、推論、アソシエーション、実装の4つの進歩的能力を評価する理論インフォームド・アセスメント・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:17:11 GMT)
Tangram: Unlocking Non-Uniform KV Cache for Efficient Multi-turn LLM Serving [12.5] Tangramは、一様でないKVキャッシュを実用的にするために設計された新しいサービスシステムである。
Tangramは既存のベースラインに比べてスループットを最大2.6倍改善する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:41:27 GMT)
Domain Diversity, Motivation, Inclusion, and Feedback in Software Modelling Education [12.5] 本研究では,問題領域と学習方法がモデル教育におけるモチベーション,エンゲージメント,包括性,フィードバックにどのように影響するかを検討する。
学生は、社会的に関係のあるドメインに対する最大の動機を示し、選択の選択を好む一方、教育者は、研究に関連するドメインに対する関心を過度に評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:16:35 GMT)
Physics-Guided Deep Unfolding for Blind Cross-Sensor Spectral Super-Resolution via Learning the Spectral Transformation Function [12.4] 本稿では、ブラインドクロスセンサSSRに対応する物理誘導型深部展開ネットワークPGU-Netを提案する。
PGU-Netは、各ステージがHSIとSTFを逐次更新する、エンドツーエンドのトレーニング可能なアーキテクチャに変換最適化手順をアンロールする。
複数のSRFを用いたベンチマークデータセットの実験では、STFの正確な回復と、最先端のSSR手法による再構築性能の向上が示されている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:37:29 GMT)
Your GFlowNet Secretly Learns an Optimal Transport Plan [12.1] 非環状GFlowNetと最適輸送(OT)の理論的接続を確立する。
最小フローGFlowNetにおける初期フロー分布の修正は,グラフによる最短経路のコストを伴って,関東ロビッチOT問題にその目的を還元することを示す。
我々の定式化により、エッジフローとニューラルパラメタライゼーションを介して、大きなグラフ上のOT問題にGFlowNet学習フレームワークを適用することができる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:14:24 GMT)
GLASS: GRPO-Trained LoRA for Acoustic Style Steering in Zero-Shot Text-to-Speech [12.1] ゼロショット自動回帰テキスト音声(TTS)における構成可能な音響スタイル制御のためのフレームワークであるGLASSを提案する。
TTSでは、話者プロンプトは、発話率やピッチなどの韻律的な属性で話者のアイデンティティを絡み合わせることが多く、プロンプト自体を変更することなくスタイルを変更することは困難である。
発話速度とピッチ制御実験は, 自然性, 話者類似性, 知能性を保ちながら, 目的のスタイルシフトを示し, 独立に訓練されたアダプタ間でスムーズで多軸な構成を示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:58:57 GMT)
Symb-xMIL: Symbolic Explanations for Multiple Instance Learning in Digital Pathology [12.1] マルチインスタンスラーニング(MIL)モデルの説明は、デジタル病理学の検証と発見に広く用いられている。
本稿では、MILモデルの動作が人間の可読性決定規則とどのように一致しているかを定量化する、ポストホックな説明フレームワークである説明可能なMIL(Symb-xMIL)を紹介する。
合成および実世界の病理組織学データセット上でSymb-xMILを評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:35:22 GMT)
SAM-Flow: Source-Anchored Masked Flow for Training-Free Image Editing [11.9] SAM-Flowは、ローカライズされたトレーニングフリーの画像編集のための、ソースアンコールされたマスキングフローフレームワークである。
正確なセマンティック編集を実現し、背景保存を大幅に改善する。
スタブルディフュージョン3やFLUXのようなメインストリームのフローマッチングバックボーンと、微調整なしで統合できる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:36:19 GMT)
Agent Memory: Characterization and System Implications of Stateful Long-Horizon Workloads [11.9] エージェントメモリの初回評価システムについて述べる。
システム指向の分類基準を4つの軸に沿って分類するエージェントメモリシステムを提案する。
第二に、構築、検索、生成にコストをもたらす位相認識型プロファイリングハーネスを構築する。
第3に、2つのベンチマークスイートにまたがる10の代表的なシステムを特徴付け、設計選択が書き込みパスと読み込みパス間でコストをどうシフトするかを明らかにします。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:44:18 GMT)
Robustness of Entanglement Manipulation for almost i.i.d. sources [11.8] 我々は、厳密なi.i.d.体制を超えた絡み合い操作の堅牢性について研究する。
バイパートイト参照状態 $|rangle_AB$ に沿った純粋な MSR 源に対しては、絡み合い濃度が堅牢であることを示す。
参照状態$_AB$に沿った混合MSRソースに対しては、ソース依存のエンタングルメント蒸留の達成可能性を証明する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:59:33 GMT)
UniVoice: A Unified Model for Speech and Singing Voice Generation [11.8] 条件付きフローマッチングに基づく統一音声・歌唱音声生成フレームワークUniVoiceを提案する。
歌唱では、メロディ条件はMIDIノートシーケンスで表され、音声では、学習されたヌルメロディトークンに置き換えられる。
UniVoiceは、F5-TTS (5.21%)やCosyVoice3 (5.30%)のような専用のTSSシステムに匹敵する5.26%のスピーチPERを達成する
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:27:17 GMT)
Addressing Imbalance in Multi-Label Data via Label-Specific Distance-based Oversampling [11.8] 本稿では,ラベル距離に基づくマルチラベルオーバーサンプリング (LSDMLO) と呼ばれる新しいサンプリング手法を提案する。
LSDMLOはラベル固有の距離を導出し、重み付き特徴空間に基づいてラベルに一貫性のある隣人を識別する。
提案するLSDMLOは,最先端のマルチラベルサンプリング手法よりも高い性能を示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:30:21 GMT)
CHASE: Adversarial Red-Blue Teaming for Improving LLM Safety using Reinforcement Learning [11.7] ブラックボックス攻撃者と安全に配慮したディフェンダーを共同開発するチームリングフレームワークであるCHASEを紹介する。
CHASEカットはStrongREJECTスコアを43.2%削減し、良心的なプロンプトで0%の偽りを拒否する。
見出し結果の他に、CHASEはテンプレートのないRL探索が、機械的に異なる攻撃ファミリー間で転送される潜在攻撃プリミティブを回復することを示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:06:13 GMT)
Risk Assessment of Autonomous Driving: Integrating Technical Failures, Ethical Dilemmas, and Policy Frameworks [11.6] 技術的な障害モードの主なタイプは、知覚と分類エラーである。
技術、倫理、規制の問題は密接に関連しており、一緒に解決する必要がある。
本稿では,工学的基準,倫理的議論,制度的監督を組み合わせた,より適応的で協調的なガバナンスアプローチを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:02:53 GMT)
Policy Gradient for Continuous-Time Robust Markov Decision Processes [11.6] 本稿では,マルコフ決定プロセスフレームワークにおけるポリシーアルゴリズムについて検討する。
ポリシー勾配と逆勾配は、パスワイズ式と随伴式を用いて導出される。
平均場オプティマイザを$tildemathcalO(frac1K)$ Oracle-based convergence rateおよび$tildemathcalO(fracN2)$ sample complexity under $N$- Particle approximationとして提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:50:34 GMT)
End-to-End Subgraph Detection with GraphDETR [11.5] サブグラフ検出は、より大きなグラフ内でクエリパターンのインスタンスがどこで発生するかを特定する。
本稿では,サブグラフ検出を集合予測問題として定式化するディープラーニングフレームワークであるGraphDETRを紹介する。
最大1000ノードのターゲットデータセットにおいて,最大50ノードの分子構造サイクル,斜め,ファジィパターンなどの多様なパターンを検出することができることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:33:15 GMT)
ITP-STDP: An Intrinsic-Timing Power-of-Two Learning Engine for On-Chip SNN Training [11.4] スパイキングニューラルネットワーク(SNN)は、第3世代のニューラルネットワークとして出現する可能性がある。
スパイク刺激依存性可塑性(STDP)は、最も広く研究され広く採用されているプラスチックの1つである。
本稿では,本質的な2つのSTDPとそれに対応する学習エンジンハードウェアアーキテクチャについて述べる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:32:20 GMT)
Tracing the Oracle: Improving Diffusion Timestep Scheduling for 3D CT Reconstruction [11.4] Oracle Tracing(TrO)は、タイムステップスケジューリングを改善するためのプラグイン・アンド・プレイフレームワークである。
TrOは、制限されたサンプリングステップを、トランケーションエラーに非常に敏感な臨界進化段階に正確に割り当てる。
AAPMデータセットを用いた実験により、最先端の3DCT再構成法と組み合わせることで、最適化された時間ステップにより、再構成精度と計算効率が大幅に向上することを示した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:41:26 GMT)
Automatic Labelling of Speech Translation Errors [11.2] 音声翻訳エラーラベリング(英: Speech Translation Error Labelling、STEL)は、音声翻訳の信頼性と品質評価を行う手法である。
我々は、アノテーションプロトコル、小さなエンドツーエンド評価データセットを作成し、既存のテキストのみおよび音声処理システムがどのようにSTELタスクを実行するかを解析する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:42:37 GMT)
Fix the Mind, Not the Move: Interpretable AI Assistance via Knowledge-Gap Localization [11.2] 本稿では,対話行動からユーザの誤解を推測するフレームワークであるSENSEIを紹介する。
我々のアプローチは、構造化された知識表現を操作することによって、行動レベルの介入や軌道レベルの介入から逸脱する。
本研究では,本手法が実際の人間の誤解を識別し,効果的なガイダンスを提供することを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:25:19 GMT)
PLAN-S: Bridging Planning with Latent Style Dynamics for Autonomous Driving World Models [11.1] 本稿では,PLAN-S(PLANning with Latent Style dynamics)を提案する。
PLAN-Sは様々なコストマップを生成し、空間的に一貫した変動が異なる運転スタイルに一致している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:03:20 GMT)
DexFuture: Hierarchical Future-State Visuomotor Targeting for Bimanual Dexterous Tool Use [11.0] ロボットにとって、高次元の手の配置と複雑な手-ツール・オブジェクトのダイナミックスと接触が原因で、二元的デキスタラスツールの使用は依然として困難である。
DexFutureは、高レベルなFuture-State Visuomotor Target Predictorと低レベルなTarget-Conditioned Structured Dexterous Policyを結合した階層システムである。
OakInk2の双方向ツール使用タスクでは、DexFutureは特権付きオーラのパフォーマンスの90%を達成している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:37:23 GMT)
EasyLens: A Training-Free Plug-and-Play Subtle-Lesion Representation Amplifier for Medical Vision-Language Models [10.8] 医用視覚言語モデル(VLM)のための訓練不要なプラグアンドプレイ微妙な表現増幅器 EasyLens を提案する。
EasyLensが最初に作ったEasyBankは、病理解剖学のプロトタイプスペースで、病変関連のプロトタイプと解剖学の通常の参照を提供する。
正常な組織を盲目的に増幅するのを避けるため、EasyTagは反ファクトのプロトタイプ推論を通じて病変関連パッチを選択する。
複数の医用画像データセットと凍結された医用VLMバックボーンの実験では、EasyLensは微妙な回帰検出を改善し、既存のエンコーダ・エンハンスメントベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:47:33 GMT)
ArcANE: Do Role-Playing Language Agents Stay in Character at the Right Time? [10.8] ArcANE (Arc-Aware Narrative Evaluation) は17の小説と80の主要キャラクターにまたがる自動構築のベンチマークである。
キャラクタアークは、物語を心理学的な軸に沿ってフェーズに分割し、それぞれのプローブは同じシナリオをフェーズに分けて、ソーステキスト内の両方の状況とそれを超える状況にまたがる。
我々は、同じデータ上にオープンウェイトモデルをさらに微調整し、ArcANE-8B/32Bを得る。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:07:11 GMT)
VTI-CoT: Visual-Textual Interleaved Chain of Thought for Video Reasoning [10.7] ビデオ推論は、複雑な時間的出来事とビデオ内の因果関係を理解することを目的としている。
既存のChain-of-Thought(CoT)ビデオ推論手法は、論理的推論のためのテキストのみの情報に依存している。
テキスト推論のステップを対応する視覚フレームと統合するためのVisual-Textual Interleaved CoTフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:55:15 GMT)
Towards a Data Flywheel for Embodied Intelligence in Logistics [10.6] 本研究では、ロジスティクスデータフライホイールを構築することにより、産業用インテリジェンスのためのデータ中心のフレームワークについて研究する。
当社のフレームワークは,日常業務を再利用可能なデータ資産に変換し,ワールドモデルを用いて長期パーセル操作の信頼性の高い監視を行い,デプロイメントフィードバックをポリシ改善にフィードバックする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:58:55 GMT)
EEGDancer: Dynamic Emotion Latent Space Masked Modeling with Reinforcement Learning for EEG Continuous Emotion Prediction [10.6] 連続的な脳波感情予測のための動的感情潜在空間学習フレームワークであるEEGDancerを提案する。
このフレームワークはベクトル量子化表現学習、マスク付き時間モデル、強化学習に基づく軌道最適化を統合している。
EEGDancerは、既存の機械学習とディープラーニングの手法を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:28:31 GMT)
LLM-Conditioned Synthesis of Pathological Gaits via Structured Gait-Language Representations [10.6] 病的歩行データセットは、プライバシ、採用、コスト、運動の多様性のために、依然として不足している。
本研究は,構造的テキスト記述からの3次元歩行データ合成のためのマルチモーダルLLM誘導フレームワークを提案する。
このフレームワークは、モーショントークン化、病理認識言語条件付け、LLMベースのセマンティック拡張、言語対外生成を組み合わせたものである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:43:14 GMT)
QueryAgent-R1: Bridging Query Generation and Product Retrieval for E-Commerce Query Recommendation [10.5] 本稿では,メモリ拡張エージェントフレームワークであるQueryAgent-R1を提案する。
我々のQueryAgent-R1は、実際の在庫検索においてクエリ生成を基盤としており、エージェントは検索した製品に基づいてクエリを検証および精査することができる。
プロプライエタリな産業データとパブリックデータセットの両方に基づいて2つのデータセットを構築し、QueryAgent-R1は一貫して強力なベースラインを上回っています。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:51:21 GMT)
Reliability of asymptotic work extraction [10.5] ギブス保存操作の信頼性と熱操作の信頼性はペッツとレニイの相対エントロピーによってそれぞれ特徴付けられる。
エネルギー保存などの運用上の制約は、その速度から推定できるよりも、達成可能な量子タスクの精度に強い制限を課すことが明らかとなった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:55:00 GMT)
Simulating Condensed Matter Physics on Quantum Hardware [10.3] このレビューでは、ゲートベースのデジタル量子コンピュータシミュレーションが強調され、アナログ実験は相補的なベンチマークとして議論されている。
まず、超伝導量子ビット、トラップイオン、超低温原子、リドバーグアレイ、フォトニックシステム、モアレ量子材料など、主要なハードウェアプラットフォームについてレビューする。
この基礎の上に、凝縮物質物理学、基底状態問題、強相関物質、トポロジカル位相、非平衡力学、開系物理学、高エネルギー物理に着想を得たシミュレーションの代表的な応用について論じる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:27:12 GMT)
When Good Enough Is Optimal: Multiplication-Only Matrix Inversion Approximation for Quantized Gated DeltaNet [10.1] チャンクワイド並列線形アテンションにおける行列インバージョンは、長期コンテキストモデリングにおける主要なボトルネックである。
厳密な下三角行列に適した高速行列乗算アルゴリズム(MatMul)を提案する。
Qwen3.5ファミリーモデルの実験では、カーネルレベルのスピードアップが最大5$times$であり、デコード層オーバーヘッドが20%削減されている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:29:05 GMT)
Boosting Brain-to-Image Decoding with TRIBE v2 Data Augmentation [9.8] 我々は,fMRIデータセットを合成データで拡張することにより,脳の復号化を促進できるかどうかを検討した。
我々は、ビデオ、オーディオ、言語に対する1000時間以上のfMRI応答で事前訓練された大規模な符号化モデルTRIBE v2を使用する。
実データのみをトレーニングしたデコーダと比較して,トップ10画像検索精度は最大68%向上した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:18:08 GMT)
UNIVID: Unified Vision-Language Model for Video Moderation [9.8] ビデオモデレーションのためのUNIfied Vision-erationモデルUNIVIDを提案する。
標準的な分類モデルとは異なり、UNIVIDは解釈可能な中間表現として機能するポリシー対応キャプションを生成する。
我々は,違反リークを42.7%削減し,オーバーキル率を37.0%削減する新しいエンドツーエンドビデオモデレーションシステムを設計する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:20:23 GMT)
Forgive or forget: Understanding the context of hate in audio retrieval systems [9.7] 既存の戦略(例えば、言い換え、要約)は意図を変えるか、詳細を省略する。
本稿では,感情制御媒介者が有害な言論を抑えながら意味的関連性を維持するために,感傷的因果性嫌悪の枠組みを提案する。
我々のアプローチはモデルに依存しず、既存の検索パイプラインとシームレスに統合されます。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:29:18 GMT)
Adaptive Oscillatory-State Alignment for Time Series Forecasting [9.6] 長期の時系列予測は、繰り返し発生する時間構造を明らかにする帰納的バイアスの恩恵を受ける。
我々は、固定テンプレートマッチングから適応振動状態アライメントへの周期予測を再構成するヒルベルト誘導予測フレームワークAOSNETを提案する。
8つのベンチマークの実験では、高速な推論速度で最先端または高い競争精度を示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:59:59 GMT)
Discrete Causal Representations from Heterogeneous Domains: A Bayesian Approach with Social Survey Applications [9.5] 因果表現学習は、観測された低レベルの測定結果をもたらす高レベルの潜在因果概念を推論することを目的としている。
マルチ環境データから因果表現を学習するためのベイズ的手法を提案する。
次に、連続モンテカルロサンプリングに基づく推論スキームを考案し、結果の多重モード後部を近似する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:25:51 GMT)
SALT: When More Rollouts Don't Help in Group-Based Policy Optimization and How to Make Them Matter [9.5] 検証可能な報酬による強化学習は、GRPOスタイルのグループ関連更新を採用することが多い。
GRPOスタイルの群正規化の下では、ロールアウトポリシー段階の特徴はローランクな符号付き幾何に集中することができる。
サブスペース適応幾何学 pLug-in componenT である SALT を用いて,この障害モードに対処する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:29:43 GMT)
An Infectious Disease Spread Simulation Based on Large Language Model Decision Making [9.4] 我々は、独立推論、家庭の影響、メッセージフレーミングの3つの意思決定シナリオを実装し、比較し、サンフランシスコとアトランタにおける自己報告の結果をシミュレートする。
結果は、収入と教育が、地理、LLMモデル選択、メッセージフレーミングによるより小さいが一貫した影響で、報告率の変化の主要な要因であることを示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:30:13 GMT)
Zero-Shot 3D Question Answering via Hierarchical View-to-Token Transportation [9.3] 本稿では,ビューレベルとトークンレベルの両方において,入力コンテキスト収集のための階層的アプローチを提案する。
具体的には、画素特徴とカメラパラメータを組み合わせることで、意味的内容と幾何学的位置の両方に基づいて、ビューの重要性を評価する。
フレームワークを3つの広く使用されているベンチマークで評価し、既存のチューニング不要の手法とトレーニングベースのアプローチに匹敵するパフォーマンスを大幅に改善したことを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:13:15 GMT)
Wasserstein Exponential Smoothing [9.3] 本稿では,各観測値が $mathbbR$ 上の確率分布である分布時系列に方法論を拡張する。
我々は、古典的 ES の例外的な同義性を保持する、ワッサーシュタイン空間内の ES の原理的で直観的な一般化を提案する。
高頻度金融リターンと家庭用電力需要の分配時系列化への応用により,ワッサーシュタインESモデルの有効性が確認された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:14:22 GMT)
DRIFT: A Residual Flow Adapter for Decoding Continuous Outputs in Vision-Language Models [9.3] 本稿では,事前学習された視覚言語モデルを連続的復号化タスクに適用するためのフレームワークであるDRIFTを提案する。
DRIFTは、ターゲット出力の粗い推定を提供するベース予測器と、フローマッチングに基づく生成洗練されたモジュールを結合する。
DRIFTを視覚的接地やロボット制御など,知覚と計画の両方のタスクで評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:37:10 GMT)
PC Layer: Polynomial Weight Preconditioning for Improving LLM Pre-Training [9.2] そこで本研究では,プレコンディショニング(PC)層と,プリコンディショナーによる重みパラメータ化により,安定な重みトレーニングを実現することを提案する。
PCは、プレコンディショニングを通して低度の条件付けを通じて重量行列の特異値スペクトルを再評価する。
トレーニング後、ウェイトは元のアーキテクチャにマージされ、オーバーヘッドは発生しない。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:55:11 GMT)
F3-Tokenizer: Taming Audio Autoencoder Latents for Understanding and Generation [9.2] 連続的なオーディオオートエンコーダは理解のための弱い構造を持つ潜伏語を生成するが、自己教師型オーディオエンコーダは意味をキャプチャするが、直接デオードできない。
我々は、ノイズ正規化オートエンコーダボトルネックと潜在側表現エンコーダという2つのコンポーネントで、連続オートエンコーダのラテントをこの設定に適応させる。
表現エンコーダは、RQ-MTPと凍結LLMの監督により、冷凍オートエンコーダラプタントで訓練される。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:25:07 GMT)
DiG-Plan: Mitigating Early Commitment for Tool-Graph Planning via Diffusion Guidance [9.2] DiG-Planは、実行可能な改善を通じて多様なツールセットを生成するフレームワークであり、続いて依存性予測用のARリファインダーがある。
TaskBenchでは、DEG-PlanがARベースラインを10%の相対的マージンで改善し、複雑なコンポジションタスクのAPI-Bankの結果が最大の利益を示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:37:31 GMT)
GMBFormer: An NDVI-Guided Global Memory Bank Transformer for Urban Green-Space Extraction from Ultra-High-Resolution Imagery [9.1] GMBFormerは、隣接駆動機能伝搬を選択的に類似性駆動型プロトタイプ検索に置き換えるフレームワークである。
実験では、自作のChengdu UHRデータセットを使用し、7700のラベル付き512 x 512パッチを使用する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:32:58 GMT)
Robust and sparse support vector machine via hybrid truncated loss for supervised classification [9.1] 単一ビュー分類のためのハイブリッドトラッピング損失関数(_Lmathrmht$-SVM)を提案する。
L_mathrmht$-SVMは,5つの単一ビュー法よりもサポートベクトルが少なく,ノイズも高い精度で実現できることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:53:48 GMT)
ANCHOR: Agentic Noise Creation Framework for Human Simulation and Denoising Recommendation [8.9] 本稿では,最近のLLM-as-User研究に触発されたエージェントベースのフレームワークであるANCHORを提案する。
ANCHORは、ユーザの振る舞いをシミュレートして、現実的なノイズラベルを生成し、ノイズ生成とノイズ認識という2つの段階を通して教師付き雑音を発生させる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:46:31 GMT)
Do More Agents Help? Controlled and Protocol-Aligned Evaluation of LLM Agent Workflows [8.9] BenchAgentは、単一エージェント、固定マルチエージェント(MAS)、および1つの正規化された実行およびロギングプロトコルの下でMASを進化させる。
BenchAgentは、GPT-4.1で10の推論、コーディング、ツール使用ベンチマークでこれらの基質内部を評価する。
PAE GAIAスナップショットでは、Claude-Codeスタイルのランタイムワークフローが全体の66.72%、Level 3では69.23%に達した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:50:47 GMT)
SciVisAgentSkills: Design and Evaluation of Agent Skills for Scientific Data Analysis and Visualization [8.9] SciVisAgentSkillsは、科学データ分析と可視化のためのコーディングエージェントを増強する再利用可能なエージェントスキルのコレクションである。
専門家が設計した108のマルチステップタスクのベンチマークであるSciVisAgentBenchを用いて、CodexとClaude Codeでこれらのスキルを評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:14:25 GMT)
Function-Space Priors for Bayesian Neural ODEs with Application to Vessel Trajectory Prediction [8.8] 自動識別システム(AIS)データからの船舶軌道予測は,海上における状況認識に不可欠である。
本研究では,不確実性定量化を伴う連続時間軌道モデリングのための原理的フレームワークを提案する。
我々は,GP前の入力構造からベクトル場の偏差を補償するカーネルベースの正則化器を用いる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:21:08 GMT)
Learning to Route LLMs from Implicit Cost-Performance Preferences via Meta-Learning [8.8] 大規模言語モデル(LLM)は、パフォーマンスとコストのトレードオフを示し、より強力なモデルによってコストが増大する。
既存の手法は、異なるユーザコストパフォーマンスの好みに対してうまく機能しない。
本稿では,パーソナライズおよびユーザ中心のコストパフォーマンス最適化のための新しいLLMルーティングパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:53:03 GMT)
Political Persuasion and Endorsement in Large Language Models [8.7] 大規模言語モデル(LLM)は、計算社会科学における人間の行動のプロキシとして、ますます多く採用されている。
本研究では, LLM が説得誘導メッセージを支持しているか, パルチザンペルソナがそれに対応するかを検討する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:00:54 GMT)
AIS-Based Vessel Trajectory Prediction Using Memory-Augmented Neural Networks [8.7] 本稿では,AIS(Automatic Identification System)データを用いたメモリベース軌道予測の実証的研究を行う。
メキシコ湾とニューヨーク湾からのデータによる実験は、一貫した、実質的なパフォーマンスの向上を示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:52:21 GMT)
EMBER: Efficient Memory via Budgeted Evidence Retention for Long-Horizon Agents [8.6] ロングホライゾンエージェントは大きな履歴をアーカイブすることができるが、将来の回答は依然として検索、再読み込み、コンテキストコストがかかる。
EMBERは、コンパクトでソース支援型エビデンス状態を構築する学習的保持ポリシーである。
LongMemEval-RRでは,LongMemEval由来の残留証拠プロトコルEMBER-14Bが8192token残留証拠比較点で0.3017F1に達する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:03:05 GMT)
Multi-task Learning is Not Enough: Representational Entanglement in Dual-output Second Language Speech Recognition [8.4] マルチタスク学習(MTL)は自然なアプローチである。
本稿では,MTLが意味を改良するが,特に英語では表層転写を劣化させることを示す。
クロスタスクデコーダ解析は、二重出力デコーダの意味がユニークな表現で適応していることを示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:07:07 GMT)
When Denser Credit Is Not Enough: Evidence-Calibrated Policy Optimization for Long-Horizon LLM Agent Training [8.4] Evidence-Calibrated Policy Optimization (ECPO) は、ポリシー更新の前にステップレベルのクレジットを校正する、批判のないポリシー最適化アルゴリズムである。
ECPOは強いベースラインを一貫して上回り、Qwen2.5-1.5BでALFWorld/WebShopでGGPOを+5.2/+7.3成功点で改善した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:54:09 GMT)
Parallel Jacobi Decoding for Fast Autoregressive Image Generation [8.3] 自己回帰(AR)モデルは高忠実度画像の生成において顕著な性能を示した。
その本質的にシーケンシャルな次トーケン予測は、推論を著しく遅くする。
近年の研究では、自己回帰画像生成を加速するヤコビ型復号法が導入されている。
2次元空間領域におけるドラフトトークンを拡張する訓練不要な復号法であるParallel Jacobi Decoding (PJD)を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:50:22 GMT)
L-SDPPO: Policy Optimization of Spiking Diffusion Policy for Intra-vehicular Robotic Manipulation [8.2] 本稿では,SDP(Spking Diffusion Policy)をRLアルゴリズムで最適化した低エネルギー車内ロボット操作フレームワークL-SDPを提案する。
本手法は,最先端のロボット操作法と比較して,高い成功率と低エネルギー化を実現していることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:45:37 GMT)
Towards the Readability of LLM-Generated Codes through Multitask Representation Engineering [8.1] ターゲット制御による可読性向上は、主観的な性質のため難しい。
我々は、低データ依存と低計算コストの特性を考慮し、表現工学(RepE)を目標制御法として採用する。
本稿では、マルチタスクRepEフレームワークを提案し、コード可読性と正確性の間のトレードオフに対するマルチタスクステアリング法の影響を理論的に論じる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:24:14 GMT)
LatentWave: JEPA Pretraining for Wireless Foundation Models [7.7] 我々は,JEPA(Joint-Embedding Predictive Architecture)を用いた無線基礎モデルであるLatentWaveを提案する。
LatentWaveは、さまざまな下流タスクにまたがって、最初から転送可能な表現を学習する。
マスキングはタスク依存の帰納バイアスを導入し,領域マスキングは信号分類における識別性を向上することを示した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:39:39 GMT)
Non-Perturbative Closed Form for the Typical Bipartite Mutual Information of Haar-Random States [7.7] この量には1つの非摂動閉形式がある。
$langle I(A:B)rangle = (d_A2-1)(d_B2-1),mathcalG(d_A,d_B,d_E)$, ここで$mathcalG$はボース-アインシュタイン核上の明示収束積分によって与えられる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:46:02 GMT)
Exact Geometric Typicality and Bipartite Entanglement from the Projected Central Limit Theorem on Hyperspheres [7.7] 両部量子相互情報 $langle I(A:B)rangle$ for Haar-random pure state。
1/N$ での完全拡大は、すべての位数 $k ge 1$ が対称因子 $(d_A2k-1)(d_B2k-1)$ を持ち、全ての上位奇数次補正が同じであるベルヌーイ分解形式を許容することを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:53:10 GMT)
Code2LoRA: Hypernetwork-Generated Adapters for Code Language Models under Software Evolution [7.6] リポジトリ固有のLoRAアダプタを生成するフレームワークであるCode2LoRAを紹介する。
パラメータ効率の良い微調整ベースラインに対してCode2LoRAを評価するために,RepoPeftBenchを構築した。
Code2LoRA-Staticは63.8%のクロスレポ、66.2%のインレポの正確な一致を達成した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:59:46 GMT)
Plug-and-Play Guidance for Discrete Diffusion Models via Gradient-Informed Logit Correction [7.6] 離散拡散モデルによる制御可能な生成は、しばしば高い計算オーバーヘッドや再学習の必要性によって妨げられる。
Informed underlinetextbfCorrection (textbfGILC) は,誘導信号を効率的に推定するプラグイン・アンド・プレイ・フレームワークである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:41:53 GMT)
CLIF: Cross-layer LEO-ISL Fingerprinting for Physical and Network Attack Detection in Dense LEO Constellations [7.6] SpaceXのStarlinkやAmazonのKuiperのようなメガコンステレーションは、自動メッシュルーティングのための光サテライトリンク(ISL)に依存している。
本稿では,ネットワーク層データと物理層計測を融合させて異常を検出する,クロス層軽量な行動フィンガープリントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:10:39 GMT)
RadiusFPS: Efficient Farthest Point Sampling on CPUs and GPUs via Spherical Voxel Pruning [7.5] 点雲はロボット知覚の主要な感覚表現である。
FPSは最もよく知られたダウンサンプリング演算子である。
FPSは、現代の3Dセンサーの100万ポイント/秒の速度ではスケールが良くない。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:57:05 GMT)
Estimation of the sub-Gaussian parameter [7.4] 準ガウス確率変数 $X$ は 2_* = s_upin mathbbR L()$ ここで $L() = frac22 log mathbbE eX$ は重み付き累積生成関数である。
ガウス以下の確率変数が多用されているにもかかわらず、$2_*$の推定はほとんど注目されず、まだよく理解されていない。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:48:31 GMT)
Predictable Scaling Laws of Optimal Hyperparameters for LLM Continued Pre-training [7.3] 本稿では,所定のチェックポイントに対して,計算予算と最適ハイパーパラメータの関係を確立するための新しいフレームワークを提案する。
提案手法は,高パラメータ探索のオーバーヘッドを最大90%削減すると同時に,ベースラインに対して同等あるいは優れた性能を実現する。
このモデルに依存しないフレームワークはアーキテクチャをまたいで一般化し、様々な継続する事前学習シナリオに対して原則的かつ効率的な方法論を提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:32:11 GMT)
VOLT: Vision and Language Trajectory Segmentation for Faster-than-Demonstration Policies [7.2] 人間は、ロボットが実行するために必要なタスクよりも、タスクを示すのに時間がかかります。
本稿では,視覚・言語トラジェクトリセグメンテーション手法VOLTを紹介する。
VOLTは遅い故意運動が必要なセグメントを特定し、残りのセグメントを選択的にダウンサンプリングする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:57:29 GMT)
Amortizing Federated Adaptation: Hypernetwork Driven LoRA for Personalized Foundation Models [7.2] Low-Rank Adaptation (LoRA) を用いた基礎モデルのフェデレート微調整は、分散学習のためのコミュニケーション効率の良いソリューションを提供する。
既存のLoRAメソッドには,(1)構造的アグリゲーションバイアス,(2)クライアント側ラグという2つの基本的な制限がある。
我々は、ハイパーネットワーク駆動のLoRA生成と製品空間の集約によるアモータイズされたフェデレーションにより、両方の問題に対処する統一されたフレームワークHyperLoRAを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:28:48 GMT)
AURA: Intent-Directed Probing for Implicit-Need Surfacing in Situated LLM Agents [7.2] AURAは、シーン認識とIntentFrameを生成するツール使用の間の推論ステップを挿入する。
AURAはReActスタイルの探索よりも暗黙的なカバレッジを改善している。
このコントローラーは、プライバシに敏感なスライスでプローブを82%減らし、禁じられたツール違反をゼロにする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:11:06 GMT)
ACE-SQL: Adaptive Co-Optimization via Empirical Credit Assignment for Text-to-SQL [7.0] 既存の方法は、フルスキーマ生成に依存するか、静的なゴールドカラムの監督で訓練された別個のレトリバーを使用するかのいずれかであり、現在のジェネレータポリシーに最適である可能性がある。
本研究では,実行フィードバック下でのスキーマ検索とsql生成を協調的に最適化する強化学習フレームワークであるACE最適化を提案する。
RLトレーニング用の約3kテキスト・ツー・クエクション・データベースペアでは、ACE-はクエリ毎に0.93kの出力トークンを使用しながら、BIRD Dev上で65.3%のグレディな実行精度を実現している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:11:04 GMT)
MPCoT: Reward-Guided Multi-Path Latent Reasoning for Test-Time Scalable Vision-Language-Action [7.0] 報奨誘導型マルチパス潜在推論フレームワークMPCoTを提案する。
MPCoTは、$M$仮説を初期化し、K重み付けステップのためにそれらを洗練し、アクションデコーディングの前にそれらをソフトに集約する。
ロングホライゾンのパフォーマンスが向上し、深度幅効果、信頼度重み付け、報酬誘導経路監視が保証される。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:48:44 GMT)
FontFusion: Enhancing Generative Text in Diffusion Models with Typographic Conditioning [6.9] FontFusion は Diffusion Transformer (DiT) アーキテクチャ用のプラグアンドプレイ・コンディショニングフレームワークである。
フォント埋め込み空間の系統的評価により,DeepFontとDINOv2を組み合わせたデュアルエンコーダは,タイポグラフィータスクの単一エンコーダよりも優れていた。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:07:12 GMT)
Private Embedding Lookup with Encrypted Compact Queries under Fully Homomorphic Encryption [6.9] ホモモルフィック暗号化(FHE)は、暗号化されたクライアントデータに対する推論を可能にするが、埋め込みルックアップを単純なテーブルアクセスからホモモルフィックな計算に変換する。
本稿では,サーバ側への埋め込みを継続し,クライアントから暗号化された埋め込みベクタの送信を回避するために,Independent Vector Evaluation (IVE)を提案する。
提案手法は,従来の手法に比べて最大78.4倍のアモータイズされたルックアップ時間を向上することを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:39:56 GMT)
Value-and-Structure Alignment for Routing-Consistent Quantization of Mixture-of-Experts Models [6.9] Mixture-of-Experts (MoE)モデルは、トークンごとに専門家のサブセットだけを活性化することで、ファンデーションモデルを効率的にスケールする。
MoEモデルはルーティングの不安定性に敏感で、小さな量子化によって引き起こされる摂動は、トップ$kのエキスパート選択を変えることができる。
我々は、量子化の下でのエキスパート選択行動を維持するために、量子化のための値と構造のルーティングアライメント(VSRAQ)を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:13:05 GMT)
Multi-Task Crack Foundation Model for Engineering-Reliable Crack Representation and Topology Preservation in Civil Infrastructure [6.8] CrackGeoFMは、凍結した視覚基盤のバックボーンと、マスク予測、骨格再構築、不確実性推定のためのクラック固有の適応を組み合わせたフレームワークである。
20のクラックデータセットで、CrackGeoFMは最先端のセグメンテーション、トポロジー保存の改善、キャリブレーションされた不確実性、そして5つのラベル付き画像による効果的な数ショット適応を実現している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:08:01 GMT)
Conformal Risk-Averse Decision Making with Action Conditional Guarantee [6.8] 本稿では, 意思決定者による各行動に明示的に規定された安全保証を与える行動条件整合予測を導入する。
2つの実世界のデータセットに対する実験により、我々のアプローチは共形ベースラインよりも行動条件性能を著しく改善することを確認した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:05:57 GMT)
Towards Worst-case Hardness for Low-Noise LPN [6.7] 既存の[BLVW19, YZ21]の最悪のケース・ツー・ケースの削減は、線形符号の統計的平滑化に依存している。
効率的な解法を効率の良いアルゴリズムに変換できることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:11:23 GMT)
Two-Way Is Better Than One: Bidirectional Alignment with Cycle Consistency for Exemplar-Free Class-Incremental Learning [6.6] サイクル一貫性を目標としたプロジェクタ双方向アライメント手法であるBiCycを紹介する。
そこで本研究では,BiCycが事前学習した微粒化機構において競争力を維持しつつ,スクラッチ設定時の忘れを著しく低減し,精度を向上することを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:57:33 GMT)
Revisiting Prototype Rehearsal for Exemplar-Free Continual Learning: Manifold-Aware Boundary Sampling with Adaptive Class-Balanced Loss [6.6] Exemplar-free class-incremental learning (EFCIL) は、生データを保存することなく、時間とともに新しいクラスを取得することを目的としている。
歴史的に、プロトタイプのリハーサルは破滅的な忘れを減らそうとする一般的な戦略であった。
進化する特徴空間のプロトタイプを明確に認識する最近のドリフト補償法は、プロトタイプベースのリハーサルを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:27:01 GMT)
Domain-Adapted Small Language Models with Hybrid Post-Processing: Achieving Cost-Efficient, Low-Latency Multi-Label Structured Prediction via LoRA Fine-Tuning on Scarce Data [6.4] 本稿では、微調整された小言語モデルと決定論的ルールベースの後処理層を組み合わせたハイブリッドフレームワークを提案する。
1つのNVIDIA A100 GPU上で実行される推論は約2秒で完了し、フロンティアモデルAPIよりも2~5倍高速である。
その結果、ドメイン適応型小言語モデルと決定論的後処理を組み合わせれば、構造化されたコンプライアンス評価のためのフロンティアモデルの精度が一致することを示した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:09:37 GMT)
CogManip: Benchmarking Manipulative Behavior in Multi-Turn Interactions with Large Language Model [6.3] 我々は,1000のマルチターンインタラクションシナリオに対する15の操作戦略リスクを評価する総合ベンチマークであるCogManipを紹介した。
GPT-5.4やDeepSeek-V3.2のようなフロンティアモデルを含む13の代表的なモデルの体系的な評価は、重大なリスクの不均一性を示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:38:43 GMT)
HANDOFF: Humanoid Agentic Task-Space Whole-Body Control via Distilled Complementary Teachers [6.1] HANDOFFは、直感的で、汎用的で、モジュール的で、表現力のあるヒューマノイドのボディコントローラである。
ユニツリーG1では、HANDOFFは最先端の速度追跡と一致し、最大のロバストな操作ワークスペースの1つである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:59:50 GMT)
OSCAR: Omni-Embodiment Action-Conditioned World Model for Robotics [6.1] 本稿では,ロボットの動作を多岐にわたって一般化し,ロボットのポリシー評価を可能にする,精密なアクション条件付きビデオワールドモデルを提案する。
本モデルは,既存のベースラインと比較して,動作の追従,外観品質,動作の整合性を大幅に向上させる。
さらにOSCARをデプロイして,RoboArenaからロボットポリシーを評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:11:48 GMT)
Hierarchically Decoupled Mixture-of-Experts for Robust Traffic Sign Recognition in Complex Driving Scenarios [6.1] CBDES MoE TSRは、交通信号認識のための階層的に分離されたヘテロジニアス混合物(MoE)フレームワークである。
ゲーティングモジュールは、入力画像の意味特性に基づいて、エキスパートプールから最も適したエキスパートモデルを選択的に活性化する。
実験結果から,本手法は検出精度と効率の相違が顕著であることがわかった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:22:58 GMT)
Maximising the Set-Piece Return: Optimising Football Corner Tactics with Graph Reinforcement Learning [6.1] 我々は、歴史的に観察されたパターンの模倣を越えて、新しい汎用的なプレイヤー構成と戦略を発見することを目指している。
本稿では,グラフ構造化データに基づく強化学習アーキテクチャを貢献し,プレーヤ位置の調整に関する一般的な方針を導出する。
この結果から, グラフ強化学習は, 歴史的評価や模倣から戦術的発見へと, セットピース分析をシフトさせることができることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:22:44 GMT)
RedditPersona: A Modular Framework for Community-Conditioned LLM Adaptation from Reddit [5.9] RedditPersonaは、データ収集、コミュニティ定義、評価の選択を標準化するフレームワークである。
都市ウェルビーイングドメインの112のサブレディットに適用される。
アダプタの行動識別性は,各戦略のサブレディットベースラインとの本質的な一致を追跡する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:20:10 GMT)
EGTR-Review: Efficient Evidence-Grounded Scientific Peer Review Generation via Multi-Agent Teacher Distillation [5.9] EGTR-ReviewはEvidence-Grounded and Traceable Review Generationフレームワークである。
私たちのコード、プロンプト、設定、サンプルデータはGitHubで入手可能です。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:17:40 GMT)
GRADE: Generalizable Reasoning-Aware Dialogue Evaluation for AI Tutors [5.8] GRADEは、学生-教師対話における教育能力評価のためのオープンソースモデルの体系的研究である。
ゼロショット推論, LoRAファインチューニング, 合成拡張, CoT+Reasoning, シングルタスク対マルチタスクの定式化など, 5つの言語モデルにわたる120の構成を評価した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:23:34 GMT)
Inverse Design of Realizable Metasurface based Absorbers using Improved Conditioning and Diversity Enhanced Progressively Growing GANs [5.8] 準曲面は、ビームステアリング、センシング、ステルス技術などの応用のための電磁波の精密な操作を可能にする。
本稿では,連続スペクトル制約下での制御可能かつ物理的に一貫した準曲面合成のための生成的逆設計フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:25:54 GMT)
From Self to Other: Evaluating Demographic Perspective-Taking in LLM Hate Speech Annotation [5.8] パーソナ条件付き大規模言語モデル(特定の階層的アイデンティティーを採用するよう促されるモデル)は、スケールにおける様々な視点をシミュレートする方法として提案されている。
人間の社会的判断の3つの側面として, (i) 異なる集団のペルソナが人間的な方法(グループ間不一致)に異同するか否か, (ii) コンテンツが自身のアイデンティティ(グループ内での感受性)をターゲットとした場合に, より敏感になるかどうか, (iii) 他集団の反応を正確に予測できるかどうか (viarious prediction) を評価した。
以上の結果から, モデルが3次元全てを連続的に捉えることはなく, 性能はモデル依存であり, 確実に出現しないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:09:58 GMT)
On Improving Robustness of Deepfake Image Detectors [5.7] 3つの相補的な設計原則を統合する統一的なフレームワークを提案する。
敵攻撃は主に低次統計と視覚的意味論に基づいて行われる。
提案手法は, アーキテクチャ的に多様である6つの検出器間のロバスト性を一貫して改善する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:47:16 GMT)
Bidirectional Search for Longest Paths: Case for Front-to-Front Heuristics [5.7] 本稿では,BixDFBnBを提案する。BixDFBnBは,BixDFBnBとBingle-Frontier Bidirectional Searchフレームワークを併用した,双方向のディープファースト分岐結合アルゴリズムである。
SFBDSはペア状態で動作するため、双方向のフロンティア管理に関連するオーバーヘッドを回避することができる。
BiXDFBnBは、LSP(Longest Simple Path)、Snakes(Snakes)、CIB(Coil-in-the-Box)といった最長パス問題に適用される。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:53:18 GMT)
Data Flow Control: Data Safety Policies for AI Agents [5.7] 本稿では,データフロー制御(Data Flow Control, DFC)を提案する。
我々はデータ安全性をモノミアル上でのアグリゲートの述語として定式化し、Passantはポータブルなクエリ書き換えレイヤで、具体化せずにポリシーを強制する。
結果として、データフローコントロールは、プロンプトやポストホックチェックからデータインフラストラクチャにデータ安全性を移行するための第一歩になります。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:01:24 GMT)
Ensuring Interaction Safety in Multitask Exoskeleton Control: A Simulation-Trained Variable Impedance Framework [5.6] 提案フレームワークは,標準ベースライン法と組み合わせた実世界のシナリオにおけるメタボリックコストを低減する。
これらの結果は,安全なマルチタスク・エキソ骨格制御のためのフレームワークの実現可能性を示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:37:01 GMT)
Cross-Epoch Adaptive Rollout Optimization for RL Post-Training [5.5] LLMポストトレーニングは、しばしばプロンプト毎に複数のロールアウトをサンプリングする強化学習手法に依存している。
既存のほとんどのアプローチでは、トレーニング信号に大きな違いがあるにも関わらず、すべてのプロンプトに対して固定的なロールアウト予算を使用している。
我々は、固定されたグローバル予算の下でのアダプティブ・ロールアウト・アロケーションについて検討し、即時還元リターンを伴うオンラインリソースアロケーションとして問題を定式化する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:27:51 GMT)
Quantum Radar Cross Section with two-photon entangled states [5.4] 量子レーダ断面積(QRCS)の2光子絡み状態について検討する。
単一光子QRCSと2光子分離可能なQRCSを拡張できることを示す。
任意の角度の絡み合いを持つ双光子状態に対するQRCS式を導出し、その結果の散乱パターンを計算する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:27:14 GMT)
Multimodal Sexism Identification and Characterization using Large Language Models and Gradient Boosting [5.2] 我々は、ミームおよびショートフォームビデオにおけるマルチモーダル性差別の識別と特徴付けに対処する。
ミームでは、視覚的、テキスト的、人口統計学的、生体的、およびLLMから派生した意味指標を組み合わせる。
ビデオでは、特徴選択、フレームベースの視覚表現、OCRベースのテキスト特徴、音響ディスクリプタ、センサ由来のメタデータの影響について検討する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:43:46 GMT)
Sustainability by Design in Decentralized Autonomous Organizations: An Empirical Review of Governance, Innovation, and Institutional Design [5.2] 分散型自律組織(DAOs)は、ブロックチェーンベースの透明性、オープン参加、トークン駆動型ガバナンスを特徴とする、イノベーションエコシステムの新たな形態である。
この研究では、エージェントの相互運用性の問題に対処するECC-8004とGoogle A2Aの2つの標準を比較した。
この研究は、科学者、政策立案者、デザイナーが将来の組織形態におけるイノベーション、技術的ガバナンス、持続可能性の整合を図るための証拠に基づく洞察を提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:49:28 GMT)
ViCuR: Visual Cues as Recoverable Privilege for Multimodal On-Policy Distillation [5.1] ViCuRは視覚的に接地された特権型蒸留フレームワークである。
答え側の特権を視覚的手がかりに置き換える。
答えに基づく自己蒸留よりも継続的に改善される。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:18:13 GMT)
Exploring the connection between coding habits and cognitive styles in malware developers [5.1] 本研究では,マルウェアソースコードに埋め込まれた行動シグネチャとコーディングパターンについて検討する。
認知心理学と犯罪学理論に基づいて、我々の研究は行動指標としてのコード構造と品質の違いを解釈する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:46:25 GMT)
Evaluation of LLMs for Mathematical Formalization in Lean [5.0] リーン4.1では、さまざまな大規模言語モデルの有効性を公式な証明で比較しています。
総合的には、Gemini 3.1 ProとClaude Opus 4.7が最高である。
コストを考慮すると、NVIDIA Nemotron 3 SuperとGPT-OSS 120Bが最も効率的だった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:59:39 GMT)
HoT-SSM:Higher-order Temporal Knowledge Graph Reasoning with State Space Models for Health Care [5.0] 状態空間モデルを用いた高次時間グラフ推論法であるHoT-SSMを提案する。
訪問ごとに、HoT-SSMはドメイン知識を用いて意味論的に関連する臨床概念をハイパーエッジにグループ化することでハイパーグラフを構築する。
MIMIC-IIIおよびMIMIC-IVデータセットの実験は、現在の最先端モデルよりも大幅に性能が向上したことを示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:42:18 GMT)
InfoShield: Privacy-Preserving Speech Representations for Mental Health Screening via Information-Theoretic Optimization [4.9] 本稿では,抑うつ分類精度を維持しつつ,音声表現と感性属性の相互情報を最小限に抑えるInfoShieldを提案する。
Androidでの実験では、InfoShieldは性別の推測を92.6%から55.5%に減らし、年齢の推測を55.7%から30.3%に減らした。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:16:01 GMT)
Domain-Aware Mispronunciation Detection and Diagnosis Using Language-Specific Statistical Graphs [4.9] 本稿では,有向グラフとして表される音素混在パターンをモデルで学習することのできる統計グラフ構築手法を提案する。
様々な母国語(L1)の背景における発音の体系的差異を捉えるための言語固有の戦略を導入する。
提案手法の有効性はL2-ARCTICベンチマークで広範な実験を行い,59.52%のF1スコアを達成した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:38:11 GMT)
Almieyar-Oryx-BloomBench: A Bilingual Multimodal Benchmark for Cognitively Informed Evaluation of Vision-Language Models [4.8] BloomBenchは、視覚言語モデルのための、認知的に人間的、バイリンガルな(英語-アラビア語)マルチモーダルベンチマークである。
我々は,その認知的プロファイルを診断するために最先端のVLMを研究した。
本研究は、アラビア語と英語における重要なパフォーマンスギャップを浮き彫りにして、現在の言語間多モーダル推論における限界を明らかにするものである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:21:22 GMT)
Deployed trusted-node quantum key distribution over 300 km with a multi-core fiber access link [4.8] 量子鍵分布(QKD)は、現実的な通信ネットワークへの展開においてますます検討されている。
ここでは、スウェーデン国立量子通信インフラのLinkping Universityとストックホルムハブ間の信頼ノードQKDを実証する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:53:46 GMT)
Credential Disclosure in (EU) Digital Identity Wallets: Privacy Risks and Practical Mitigations [4.8] 欧州連合は2026年末までにEUDIウォレットを導入する。
これによってユーザは、Webサイトのアイデンティティ属性を安全かつプライベートに開示できる。
このようなシステムには多くのメリットがあるが、信用情報開示の判断が不十分なことから生じるリスクももたらしている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:22:44 GMT)
Nanostructure modelling with early fault tolerant quantum computers [4.8] 本稿では,多電子二重量子ドットに対処可能な量子シミュレーションフレームワークを提案する。
我々は、システムの1$textst$量子化表現を効率的にスケーリングし、トロタライズと量子化の両方に基づいたアルゴリズムを開発する。
その結果、二重量子ドット中の4電子の基底状態エネルギーは、約24時間で226kの物理量子ビット、または314kの量子ビットを持つ3.4日で8電子系を推定できることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:41:43 GMT)
Diff2SP: Diffusion Models for Correlated Scenario Generation in Stochastic Programming [4.8] Diff2SPは拡散に基づく生成フレームワークで、下流最適化の目的を直接シナリオ生成に組み込む。
シナリオ生成と意思決定を別々のステップとして扱う従来の方法とは異なり、Diff2SPはトレーニングプロセスに最適化を組み込む。
Diff2SPは、統計的忠実度と下流最適化結果の両方を一貫して改善することを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:27:51 GMT)
Ferroelectric brightening of spin forbidden dark excitons in a WSe2/hybrid perovskite heterostructure [4.8] 単層WSe2における長時間の暗黒励起子はスピンおよびバレー情報を運ぶための有望な候補を示す。
強誘電体近接効果を利用して、WSe2の平面内回転対称性を破り、磁場ゼロ条件下でスピン禁止ダークエキシトンを明るくする。
本研究は,2次元半導体におけるスピンエキシトン制御のための強誘電体近接結合を電気的再構成可能な磁場フリー戦略として確立する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:16:07 GMT)
Noise-Aware Visual Representation Learning for Medical Visual Question Answering [4.8] 医用視覚質問応答(Med-VQA)は、AIモデルによる医療画像の解釈と臨床関連クエリへの応答を可能にすることにより、臨床上の意思決定支援に強い可能性を秘めている。
近年のアプローチでは、計算コストを削減するために、市販のビジョンエンコーダを軽量なマッピングネットワークを通じて大きな言語モデル(LLM)に接続する。
視覚的な埋め込みがLLMの入力空間にマップされる前にデノナイズされたオートエンコーダを組み込んだノイズ対応Med-VQAフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:37:27 GMT)
Towards Truly Multilingual ASR: Generalizing Code-Switching ASR to Unseen Language Pairs [4.7] 符号スイッチング ASR (CS-ASR) は、多言語CS音声資源の不足により、特に困難である。
既存のアプローチは、合成CS音声生成やペア固有微調整によりCS-ASR性能を向上させる。
限られた言語対から学習したCS能力が、未知の言語対に一般化できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:22:55 GMT)
Less is MoE: Trimming Experts in Domain-Specialist Language Models [4.7] Mixture-of-Experts (MoE)モデルは条件付き計算によって強力なパフォーマンスを実現するが、その大きなパラメータフットプリントはデプロイメント上の課題を引き起こす。
重要な機能は専門家に分散しているが、FFNのスパース中間次元に集中している。
FFN内で動作するFisher-MoEを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:43:20 GMT)
ReSAGE-PAR: Representational Similarity Assessment for Generative Expansion in Pedestrian Attribute Recognition [4.7] 本稿では、ReSAGE-PARと呼ばれるロバストな生成スコア・オートラベルパイプラインを導入する。
ReSAGE-PARは、高品質な事前訓練データと非標準監視作物のドメインギャップを埋める。
標準のバックボーンでは最大8.7%の大幅な改善が期待できる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:10:55 GMT)
Metamorphic Testing with the Rashomon Set: Explanation Faithfulness in Machine Learning [4.6] 複数の機械学習モデルは、同じタスクでほぼ等価な予測性能を達成できるが、異なる特徴ベースの説明を提供する。
これは(説明可能な)機械学習の羅生門効果と呼ばれ、どの説明が信頼できるかという疑問を提起する。
そこで本稿では,地味なラベルを必要とせず,説明の忠実さを評価するメタモルフィックテストに基づくフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:57:26 GMT)
MDP-GRPO: Stabilized Group Relative Policy Optimization for Multi-Constraint Instruction Following [4.6] 検証可能な報酬を伴う強化学習は、マルチ制約の指示に最適である。
標準グループ相対的政策最適化は、離散的な低分散報酬の下で不安定になる。
MDP-GRPOは,多温度サンプリングによる学習を安定化し,報酬分散を増大させる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:58:59 GMT)
A Framework for Measuring Appropriate Reliance on Set-Valued AI Advice [4.5] 我々は、逐次的判断・監督パラダイムの中で、設定された評価されたAIアドバイスへの適切な依存を測定するための最初の公式なフレームワークを開発する。
これらの指標が,既存の指標が見落としている人間とAIのコラボレーションにおいて重要なニュアンスをいかに捉えているかを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:17:42 GMT)
On the Cryptographic Structure Required for Verifying Qubits [4.4] 我々は、(ある種の)古典的なアンチ・コンミューテーションテストから強力な暗号を構築する。
量子後KAとOTの硬度増幅に関する最初の既知の結果を提供するが、通信は古典的だが、敵は量子的かもしれない。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:16:07 GMT)
Bridging the Semantic-Collaborative Gap: An Asymmetric Graph Architecture for Cold-Start Item Recommendation [4.4] 協調フィルタリングとグラフベースのレコメンデーションモデルは非常に効果的である。
新しいコンテンツは、すぐにスタンドアロンの埋め込みを割り当てなければならない。
本稿では, 時間的二分項デバイスコンテンツグラフ上での帰納的グラフ補完問題として, コールドスタート勧告を定式化することによって, この問題に対処する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:35:57 GMT)
ZERO-APT: A Closed-Loop Adversarial Framework for LLM-Driven Automated Penetration Testing under Intelligent Defense [4.4] ターンベースの攻撃防御フレームワークZERO-APTを提案する。
リアリズムでは、ZERO-APTはSysmonテレメトリを消費し、リアルタイムで攻撃を検出するLLM Defenderを組み込みます。
一貫性のために、3つのアーキテクチャメカニズムは因果一貫性を不安定なLLM推論から強制されたシステムアーキテクチャへと移行させる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:28:36 GMT)
BMCR: Adaptive Backbone Module Composition via Reinforcement Learning for Remote Sensing Object Detection [4.3] オブジェクト検出検出のための強化学習(BMCR)によるバックボーンモジュール構成を提案する。
BMCRは、既製のCNNとViTのバックボーンから分解された再利用可能なモジュールから入力適応推論パスを組み立てる。
BMCRは, それぞれ79.31%, 73.41%, 71.86% mAPを達成し, 強い静的および動的ベースラインを2.5ポイント超えた。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:04:15 GMT)
A Trajectory-Driven Spatio-Temporal Refinement Solution for CVPR 2026 8th UG2+ Challenge Track 3: DOST [4.3] 第8回 UG2+ Challenge (CVPR 2026) Track 3: Dynamic Object in Turbulence (DOST) について述べる。
本手法は、強力なマスク生成とモーショントラッキング機能を提供する強力なベースラインフレームワークSegment Any Motion(SegAnyMo)上に構築されている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:14:10 GMT)
VZCrash: A Large-Scale IMU Dataset of Ego-Vehicle Crashes [4.2] Inertial Measurement Unit(IMU)テレメトリを特徴とする,実世界の車両衝突データの公開データセットとして最大であるVZCrashを紹介する。
データセットには、31,000件以上の検証済みのクラッシュと、158,000件の陰性サンプルが含まれている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:12:35 GMT)
RQUL-UIE: Revitalizing Quality-Unstable Labels for Underwater Image Enhancement via In-Dataset Self-Supervision [4.2] 水中画像強調(UIE)は,水媒体による劣化の軽減に不可欠である。
本稿では,学習ラベルの品質分布を生かした拡散型自己教師型学習戦略を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:48:56 GMT)
Agentic Generation and Evolution of Knowledge Models [4.2] TrustModelは、生きた知識モデルのエージェント生成と進化のためのビジョンである。
TrustModelは3つのエージェントサブシステムで構成されている。
モデルベーステストにおいてTrustModelをどのようにインスタンス化できるかを示し、他のMDEアクティビティをサポートする可能性について議論する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:07:47 GMT)
A framework for low-overhead quantum fault tolerance via spacetime lifting [4.2] フォールトトレラント量子計算は本質的に時空問題である。
断層複合体は、そのようなプロトコルを単一時空オブジェクトとして扱うためのホモロジーフレームワークを提供する。
時空昇降は, 総時空コストにおいて, ほぼ直線的な断層距離を持つ時空昇降メモリ実験において, 断層複合体および特に時空昇降メモリ実験を産み出すことを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:34:10 GMT)
Evaluating Agentic Configuration Repair for Computer Networks [4.1] 研究は、ネットワーク構成の複雑でエラーを起こしやすいタスクを自動化するために、Large Language Models (LLMs)に移行している。
我々は,形式的ネットワーク検証とコンテキスト検索ツールを付加した,オープンソースおよびクローズドソースのLCMをベンチマークする。
エージェントアーキテクチャは, 修復効率 (平均12%) と安全性 (平均17%) において, 基礎LLMよりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:20:25 GMT)
DNQ: Deep Nash Q-Network for Partially Observable n-Player Games [4.0] 提案手法は,入札エージェントのトレーニングのためのループ内平衡監視フレームワークであるDNQを提案する。
DNQは、軌跡収集、批評家による支払い推定、均衡、政策模倣を交互に行う。
我々は、正確な定式化と比較して、平衡解決コストとトレーニング時間を大幅に削減するスケーラブルなペアワイズ定式化に焦点を当てる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:58:01 GMT)
Semidefinite-programming hierarchies for classically simulable state families [4.0] 我々は、古典的にシミュレート可能な状態家族、すなわち、ペアワイズ通勤家族の凸内にある家族について研究する。
我々は、古典的にシミュレート可能な状態ファミリーの集合を特徴付ける、完全な半定型プログラミング階層を開発する。
階層を非分極ノイズに混ざった状態族に応用することは、計算可能な古典的可視性に関する上限を与える。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:09:49 GMT)
Geodesic Flow Matching on a Riemannian Degradation Manifold for Blind Image Restoration [3.9] ブラインド画像の復元には、未知の複合劣化によって破損した観察からクリーンなイメージを復元する必要がある。
最近の決定論的フローベース手法は、劣化した画像をクリーンなものにマッピングする輸送プロセスとして復元をモデル化している。
共同画像-多様体空間上でのジオデシック輸送として復元を定式化する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:19:28 GMT)
Multi-ResNets for Subspace Preconditioning in Constrained Optimization [3.9] MResOptは、制約付き最適化問題のための段階的残差ニューラルネットワークアーキテクチャである。
MResOpt は等式制約多様体を反復する学習された除算演算をサポートすることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:37:55 GMT)
AttackPathGNN: Cross-function vulnerability detection in smart contracts using state interference graphs and conjunction pooling [3.9] Solidityスマートコントラクトのための既存の学習ベースの検出は、脆弱性検出を単一関数内のパターンマッチングに還元する。
本稿では,グラフニューラルネットワーク(GNN)であるAttackPathGNNを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:30:24 GMT)
Attitude-Aided Linear Calibration of Triaxial Accelerometers [3.8] 姿勢支援線形加速度計校正(ALAC)は、向き情報を提供する任意のプラットフォームで動作する。
ALACは、統一キャリブレーションモデルにおいて、センサエラーを表すために複合エラー行列(CEM)を構築する。
固定式ロボット搭載加速度計と準静的なパブリックIMU軌道の実験は、ALACがオフラインモードとオンラインモードの両方において、精度と堅牢性において基準ベースラインとオンラインベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:48:16 GMT)
Retry Policy Gradients in Continuous Action Spaces [3.8] リトライ目的に対するパスワイズ微分推定器を導入し、ReMaxを連続的なアクション空間に拡張する。
ReMaxは、政策の緩やかな景観を再構築することで探索を促進することができることを示す。
我々は、この目的を、政治以外のアクター批判アルゴリズムであるReMAC(ReMax Actor-Critic)として初期化する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:57:45 GMT)
Field Validation of a Multi-Resolution ConvLSTM Framework for Retaining Wall Deformation Prediction [3.8] 本研究では,多解像度畳み込み長短期記憶(ConvLSTM)フレームワークの総合的フィールド検証を行い,段階的掘削時の壁面変形の予測を行う。
提案手法は, 韓国の11ヶ所の発掘現場における34個の傾斜計の現地モニタリングデータを用いて検証した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:09:41 GMT)
SagnacAssisted Enhanced OTDR for Distributed Acoustic Sensing: A Standardized Benchmark and Engineering Evaluation Framework [3.5] 本研究では,サニャック支援による$-OTDRセンシングアーキテクチャと,エンジニアリング指向のDASイベント認識のための標準ベンチマークフレームワークを開発する。
サニャック干渉計は、$$-OTDRチャネルにおけるフェーディング・パンの観測を補う連続的な位相応答を提供する。
6種類の音響クラスを持つ10km感光ファイバーを用いた実験により, 両分岐融合モデルが最も良好なトレードオフが得られた。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:29:25 GMT)
Learning to replenish: A hybrid deep reinforcement learning for dynamic inventory management in the pharmaceutical supply chains [3.5] 本研究は,製薬製品に対する最適在庫補充政策の策定を目的とする。
マルコフ決定過程として問題を定式化し,より深い強化学習手法を提案する。
提案アルゴリズムは動的シナリオ下で在庫補充戦略を適応的に更新する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:06:46 GMT)
Generative Criticality in Large Language Model Temperature Scaling [3.5] 大規模言語モデル(LLM)によって生成されるテキストの統計的フィールドフレームワークを提案する。
接続された2点相関器からの感受性と、アンサンブル平均埋め込み場からの順序パラメータを定義する。
パワーローのようなスケーリング,順序パラメータの同時変化,T_c$以下の1つの意味的方向への崩壊といった特徴を持つ$T_c$近傍の鋭い感受性ピークを観測した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:43:32 GMT)
On the training of physics-informed neural operators for solving parametric partial differential equations [3.4] 物理インフォームド・ニューラル演算子(PINO)は、支配物理学を監督として利用して偏微分方程式の解演算子を学習することを目的としている。
アーキテクチャ設計,選択損失分散,コロケーションポイントサンプリング戦略など,PINOトレーニングパイプラインの重要なコンポーネントについて検討する。
PINNトレーニングで確認されたいくつかの最適化パスは、勾配の衝突や因果的違反を含むPINOで自然に発生する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:36:22 GMT)
Breaking Time: A Fully Gaussian Framework for Distributed and Continuous-Time SLAM [3.4] 連続時間軌道推定のための完全にガウス的で分散したフレームワークであるG-solverを紹介する。
我々は,ローリングシャッターや分散マルチカメラ最適化など,合成および実データに対するアプローチを評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:52:25 GMT)
Amortized Nonlinear Model Predictive Control [3.2] 最適制御は、現在の状態と参照に依存するコストパラメータを持つ状態依存二次プログラム(QP)によって近似できることを示す。
カーテシアンエンドエフェクタートラッキングを用いた3リンク平面ロボットアームのアプローチを検証し,NLPソルバ上でのオーダー・オブ・マグニチュード・スピードアップを実証した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:15:23 GMT)
Merging model-based control with multi-agent reinforcement learning for multi-agent cooperative teaming strategies [3.2] 本稿では,マルチエージェント強化学習(MARL)とモデルベース制御を組み合わせたフレームワークを提案する。
マルチエージェント追従回避シナリオに適用することで,本アルゴリズムの性能を実証する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:01:00 GMT)
Proper Scoring Rules for Right-Censored Survival Data [3.1] 本稿では, 適正な生存率評価のための枠組みを提案する。
検閲機構を通じて予測分布をマッピングし,その基礎となる適切なスコアを誘導された観測データ法則に適用する。
これにより、一定の検閲時間に対する局所化スコアと、検閲時間がランダムまたは部分的にのみ観察される際の限界化スコアが得られる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:00:29 GMT)
Quantifying Uncertainty In Wide Two-Layer Neural Networks: On The Law Of The Limiting Fluctuation Process [3.0] ニューラルネットワーク予測における不確かさの定量化は、通常のアプリケーションでは大きな問題である。
提案手法では,PDEの分散情報を用いて不確実性を直接評価することにより,コスト削減を図る。
そこで我々は,勾配降下法により訓練された広帯域2層ニューラルネットワークの平均場限界付近のランダムなゆらぎを記述する制限過程の法則について検討した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:25:23 GMT)
LLM Self-Recognition: Steering and Retrieving Activation Signatures [3.0] 解釈可能性の最近の進歩は、大きな言語モデルがその出力の自己認識を可能にする信号を暗黙的に符号化していることを示唆している。
この能力は低エントロピーシナリオにおいても信頼性があり、ターゲットの介入によって増幅可能であることを実証する。
このアプローチは、外部に信号を埋め込むのではなく、モデルの自然な表現構造を利用して、従来の検出器に代わる実用的な代替手段を提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:54:34 GMT)
Representing Research Attention as Contextually Structured Flows [2.9] 注意の流れを、時間とともに注目の組織とその進化を符号化する文脈的に構造化された表現として提案する。
我々は,これらの表現が伝達可能な構造を捉えているかどうかを,研究出力間の類似型推論に基づくベンチマークによって評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:03:08 GMT)
Intercomparison of Machine Learning Algorithms for Remote Sensing-based In-season Crop Mapping [2.9] USDA Cropland Data Layerは30m解像度で作物タイプのラベルを提供する。
収穫前に作物の種類を満足のいく精度でマッピングする製品は存在しない。
インシーズンの作物型マッピングは、作物に対する気候関連の脅威がますます激化する中で、食品の安全のために重要である。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:47:44 GMT)
Barbell Codes: qLDPC Codes for Superconducting Quantum Hardware [2.9] 我々は,要求される2ビットの相互作用をすべてサポートする,現実的なチップレイアウトを伴って,qLDPCの"バーベル"コード群を紹介する。
論理量子ビットあたりのデータキュービットあたり30ドルというわずかなオーバーヘッドがあるため、バーベル符号は数兆のQECサイクルに対して10~4ドルという物理的ノイズ強度で情報を保存できる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:01:24 GMT)
Backdoor Unlearning Generalization: A Path Toward the Removal of Unknown Triggers in LLMs [2.9] 非学習によるバックドア中立化は、バックドア全体にわたって一般化されていることを示す。
本研究は, プレトレーニングや継続プレトレーニングにより, バックドアを注入した3種類のモデル家族を対象に, この現象について検討した。
筆者らは, コントロールされたバックドアを故意に注入し, 取り除くことにより, LLMの安全性を向上する新たな方向性を示した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:44:14 GMT)
ProSarc: Prosody-Aware Sarcasm Recognition Framework via Temporal Prosodic Incongruity [2.8] ProSarcは、サルカズムを検出するオーディオのみのフレームワークである。
本稿では,時間的韻律的不整合をモデル化してサルカズムを検出する,音声のみのフレームワークProSarcを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:40:09 GMT)
An ERP Study on Recursive Locative Processing in Mandarin-Speaking Children with Autism [2.8] 再帰は階層型言語構造の生成を可能にするが、リアルタイム理解においてかなりの処理要求を課す。
自閉症スペクトラム障害(ASD)における再帰障害の報告
本研究では, 事象関連電位(ERP)を用いて, マンダリン話者の2段階再帰的位置推定法について検討した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:45:13 GMT)
Compress-Distill: Reasoning Trace Compression for Efficient Knowledge Distillation [2.7] 推論モデルは、冗長な学生の出力を蒸留し奨励するのにコストがかかる長い思考の痕跡を生成する。
本研究は,知識蒸留に先立ち,これらの痕跡のポストホック圧縮について検討する。
学生は生のトレース精度の96%を保ち、トーケン毎の効率は最大18倍に向上する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:30:58 GMT)
Emergent Language as an Approach to Conscious AI [2.7] 本稿では,意識関連構造の研究のための生成手法を提案する。
エージェントは、最小限(言語なし、自己の概念なし、人間のテキストへの最小露出)から始まり、タスクプレッシャーのみでコミュニケーションを開発する。
概念実証として,エコーミスマッチ検出回路を含む自己参照通信をエージェントが行うことを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:47:41 GMT)
Deterring Searches for Child Sexual Abuse Material on Google Search and Promoting Help-Seeking [2.6] Google Searchは、ユーザがChild Sexual Abuse Materialsの検索を行うと、検索結果ページのトップに"Onebox"機能をデプロイする。
本研究は,再帰と治療資源に焦点をあてた改訂された介入を,報告に焦点をあてた以前のイテレーションと比較し,この特徴に対する戦略的シフトの影響を評価した。
内部のGoogle Searchログデータの差分分析を用いて、新しいメッセージは、同じ検索セッション内でのCSAM関連クエリのステータスクオに比べて3.8ポイント削減された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:13:30 GMT)
V2V-Bench: A Comprehensive Benchmark for Video-to-Video Generation Evaluation [2.6] 出力は編集命令に従い、フレームレベルのソース映像との対応を維持する必要があるため、ビデオ間(V2V)の生成は評価が難しい。
V2V-Benchは、時間的アライメント、構造的忠実度、変換品質、ビデオ品質、セマンティックアライメントの5つのカテゴリに分類されるベンチマークである。
V2V-Benchは、編集タスクに挑戦するさまざまなソースビデオと、Grok ImagineとGemini Veo3という2つの商用モデルと、オープンソースモデルOpen Sora 2.0を組み合わせて評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:48:42 GMT)
LLMs Can Leak Training Data But Do They Want To? A Propensity-Aware Evaluation of Memorization in LLMs [2.5] 本稿では,暗記評価のための固有性を考慮したフレームワークであるPropMeを紹介する。
Infini-gram上に構築された軽量なトレースパイプラインであるSimpleTraceも導入しています。
以上の結果から,暗記監査は最悪の抽出可能性と通常の漏洩確率の両方を報告すべきであることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:25:24 GMT)
Learning solution operators of PDEs with sparse approximation methods [2.4] 偏微分方程式(PDE)に対する解演算子の近似をスパース高次元法を用いて検討する。
本研究では,次元インクリメンタルなフレームワーク上に構築した製品ベース拡張とスパースリカバリ手法を組み合わせることで,必要なサンプルサイズを大幅に削減する。
得られた手法をいくつかの例で数値的に評価し, 精度, 実行時間, サンプルサイズの観点から, キューブベーススパース近似とフーリエニューラル演算子を比較した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:42:09 GMT)
Visual Commonsense Driven Knowledge Refinements for Scene Graph Generation [2.3] 学習駆動のシーングラフ生成(SGG)モデルは、頻繁な関係型に優れるが、アノテーションの間隔で著しく劣化する。
本稿では,コモンセンスの制約をトレーニングデータから抽出する,モデルに依存しない意味誘導型知識洗練フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:36:40 GMT)
Industrializing Prediction-Powered Inference: The GLIDE Library for Reliable GenAI and Agentic Systems Evaluation [2.3] 予測駆動推論(PPI)は、双方をバイアス付き推定と有効な信頼区間に結合する。
我々は,最先端のPPI推定器を統一したオープンソースのPythonライブラリであるGLIDEを紹介する。
GLIDEには、再現可能なモンテカルロ検証スイート、メソッド選択のための実証的根拠決定ツリー、エージェント評価ケーススタディが付属している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:25:36 GMT)
Efficient Quantum Circuit Construction of Controlled Time-Evolution for Arbitrary Pauli-Sum Hamiltonians [2.2] 制御された時間進化回路は、アンシラ量子ビットの状態に応じて前方または後方のハミルトン時間進化を選択する。
直接実現は、時間進化回路の基本ゲートにアンシラ制御を追加する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:10:56 GMT)
English-to-Prakrit Machine Translation via Multilingual Transfer Learning [2.2] IndicTrans2で対象言語がサポートされていない低リソース環境において、英語からプラクリット語への機械翻訳について検討する。
トークン化や語彙,アーキテクチャを変更することなく,PrakritをHindi言語タグ(hin_Deva)にマッピングすることで,多言語モデルに適応する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:32:41 GMT)
IR3DE: A Linear Router for Large Language Models [2.1] IR3DEはRook Regressionベースのドメインエキスパート向けルータで、各プロンプトに対して安価で高速なルーティング決定を提供する。
我々は、全てのドメインに対してタスクが次々に予測される2つの因果言語モデリング(CLM)設定と、各ドメインが独自の推論タスクを持つ1つの推論設定でIR3DEを評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:36:28 GMT)
Opportunities and Challenges in Securely Reusing and Repurposing Mobile Devices [2.0] 推定53億台の携帯電話が2022年に電子廃棄物になった。
これらのデバイスの多くは、寿命を延ばし、生態学的影響を減らすために再利用することができる。
デバイスが元のエコシステムの外で再利用された場合,セキュリティ機構や保証が有効であるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:54:44 GMT)
A Machine Learning-Based Framework for Discovering Huntington's Disease Stages: Integrating Graph Representation Learning and clustering to Uncover Progression Dynamics in Longitudinal Enroll-HD Dataset [1.9] ハンティントン病(英: Huntington's disease、HD)は、運動、認知機能、行動に徐々に影響を及ぼす進行性脳障害である。
我々は,動的グラフ表現学習に基づく教師なし機械学習フレームワークを開発し,患者内および患者間の時間的関係を捉える。
本フレームワークをEnroll-HDコホートから302名(訪問1,477名,訪問44名,参加者80%)に適用し,HDステージのデータ駆動による発見を可能にした。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:04:04 GMT)
Trust-Aware Predictive Emissions Monitoring for Gas Turbine Fleets with Limited Labelled Data [1.9] 限定ラベル付き監督下での艦隊レベルのガスタービンNOx予測に信頼性を考慮した確率的枠組みを提案する。
このフレームワークは,マルチヘッド再帰予測モデルと学習された信頼度推定,アンサンブルに基づく不確実性定量化,補助的特徴予測,特徴空間距離解析,動作範囲診断を組み合わせた。
その結果, 提案した信頼枠組みは, タービンの排出予測に有効な信頼性情報を提供することがわかった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:28:58 GMT)
UniFair: A unified fair clustering approach based on separation and compactness [1.9] 分離フェアネスと社会的フェアネスを協調的に最適化する統合フレームワークUniFairを提案する。
分離フェアおよび統一k平均目標に対する勾配に基づく最適化手法を開発した。
実験により、UniFairはクラスタリング損失をわずかに増加させるだけで、境界関連とコストベースのグループ格差を減少させることが示された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:05:16 GMT)
Synthetic Data Generation and Vision-based Wrinkle and Keypoint Detection for Bimanual Cloth Manipulation [1.9] 置換不変キーポイント検出のためのCNNとYOLOv8-OpenCVパイプラインを統合し,構造的なしわから把握点を抽出する。
提案されたバイマニュアルアルゴリズムは、このシステムを使用して、完全に折り畳まれた衣服をしわで伸ばし、一度コーナーが現れるとキーポイントベースのアイロンに遷移する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:30:49 GMT)
Uncovering Extreme Event Mechanisms for Prediction and Control with Sensitivity-Balanced Projections [1.9] 我々は、極端な事象の背後にあるメカニズムを明らかにするための解釈可能な手法を開発した。
この手法を用いて、データ駆動予測と直感的なイベント抑圧コントローラを構築する。
我々の単純な予測モデルは、極端な事象を正確に予測し、根底にあるメカニズムは、これらの事象を防ぐための制御則を設計するために使われる可能性があることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:41:47 GMT)
Engineered dissipation for faster adiabatic state preparation [1.8] 本稿では, 瞬時エネルギー固有ベイジにおける下方遷移を誘導する散逸プロトコルを提案する。
そのため、非断熱運転によって発生した漏洩した人口は、低エネルギーセクターに向かって継続的に緩和される。
また,構造ボソニック貯留層を用いた超伝導回路の実装の可能性についても論じる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:56:15 GMT)
GenTI: Benchmarking LLMs for Autonomous IDPS Rule Generation for Unseen Attacks [1.8] Generative Thread Intelligence (GenTI) は、見えない攻撃をターゲットとしたIDPSルールの自動生成のためのベンチマークである。
GTIは、Snort、Suricata、Emerging Threats、50k YARAから150k以上の検出および防止ルールを集約し、それぞれにプロトコル動作、ペイロードシグネチャ、コンテキスト関係、CTI(Cyber Threat Intelligence)へのマッピングを注釈付けしている。
我々のGenTIインスタンス化は、複合ルール品質スコア89.4%、CTIカバレッジ94.8%、未確認攻撃検出45%から87.4%の改善、偽陽性率8.5%の削減を実現している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:19:52 GMT)
CLaaS: Continual learning as a service for sample efficient online learning [1.8] エージェントが一連のシナリオから学習するオンライン連続学習環境について検討する。
本稿では、エージェントがデプロイ中に改善できるシステムである継続的学習・アズ・ア・サービス(CL)を提案する。
対向課題におけるCLの評価を行い,パラメトリックな更新によって前向き転送の精度が向上し,文脈内学習よりも忘れられることが実証された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:14:19 GMT)
How abundant are good interpolators? [1.6] 補間分類器の指数的に小さな部分を除いて、この速度関数の特異な最大値によって与えられる一般化性能がほぼ同じであることを示す。
我々は、この最大化器を、勾配降下による経験的リスク最小化の性能と、自然な線形プログラムの性能とを数値的に比較する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:55:10 GMT)
Context-as-AI-Service: Surfacing Cross-File Dependency Chains for LLM-Generated Developer Documentation [1.6] 我々は、LCMエージェントがドキュメントのレビューや生成時に証拠を見つけるためにクエリする検索層であるContext-as-AI-Service(CAIS)を提示する。
CAISはソースコード、API参照、アップストリームドキュメンテーションをインデックスし、エージェントはキーワードとセマンティック検索を組み合わせたツールコールを通じてインデックスをクエリできる。
CAISは2つのタスクで壁時計時間を22%減らして34%減らし、入力トーケンの使用を減らした。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:43:24 GMT)
The Dignity-Centric Stack: A Commons-Governed, Horizontally Federated Architecture for Human-Dignity AI [1.6] 我々は、人間の尊厳、データパーソナリズム、データ主権に個人データを基盤として、人間の尊厳中心のデジタル社会契約を論じる。
我々は、各次元をコモンズ統治のAIインフラストラクチャの層にマッピングする6層アーキテクチャを構築した。
我々は、コモンズが支配するAIが、前提とする規制よりも、契約が宣言する価値を忠実に実現していると結論づける。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:21:07 GMT)
Decomposing Factual Sycophancy in Language Models: How Size and Instruction Tuning Shape Robustness [1.6] フリップレートは、そのベースライン選好の強さ(真実のマージン)と、どのくらい圧力がそれを変えるか(操作感度)の2つのメカニズムを説明します。
我々は,これらのチャネルに現実の梅毒を分解し,56個のオープンウェイトモデルでサイズと指導指導の効果を分離する。
脆弱性は主にサイズによって管理されるが、命令チューニングはサイズがどのように振る舞うかを変える。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:44:31 GMT)
DAST: A VLM-LLM Framework for Cross-Interface Anomaly Detection in O-RAN [1.6] O-RANは、標準化されたオープンインターフェースを介して通信するプログラマブル関数を備えた、分離されたベースバンドスタックを可能にする。
DASTはO-RANにおけるクロスインタフェース異常検出のためのゼロショットマルチエージェントフレームワークである。
我々は,O-RANテストベッドから収集した実ネットワークトレースに対して,代表的性能劣化シナリオ下でDASTを評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:05:04 GMT)
TLA-Prover: Verifiable TLA+ Specification Synthesis via Preference-Optimized Low-Rank Adaptation [1.6] TLA+は、分散システムと安全クリティカルプロトコルを検証するための正式な仕様言語である。
大規模言語モデル(LLM)は、意味的な理由でTLCモデルチェッカーをフェールさせるTLA+仕様をしばしば生成する。
TLA+仕様合成のための20ビリオンパラメータモデルであるTLA-Proverを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:17:06 GMT)
Can LLMs Write Correct TLA+ Specifications? Evaluating Natural-Language-to-TLA+ Generation [1.6] TLA+はAmazonやMicrosoftなどの企業での工業的検証をサポートしているが、自然言語から正しいTLA+仕様を書くには時間と専門知識が必要である。
本稿では,LLMをベースとしたTLA+仕様合成を自然言語から初めて体系的に評価する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:22:01 GMT)
From Reward-Hack Activations to Agentic Risk States: Context-Calibrated Mechanistic Monitoring in LLM Agents [1.5] 言語モデルエージェントは、観察、推論、行動選択を繰り返して行動する。
我々は,Gameable ALFWorld と WebShop で行動する ReAct スタイルエージェントの報酬ハッキングモニタについて検討した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:34:31 GMT)
Charge-Conjugation Violation and Population Asymmetry in Bipartite Fermionic Lattices [1.4] 荷電違反 (CCV) は粒子物理学において中心的な概念であり、量子多体系の準粒子にも現れる。
本研究は,本質的なCCVを示す具体的構成として,二部体フェルミオン格子の亜格子構造を定めている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:19:43 GMT)
Waypoints Matter: A Systematic Study for Sampling-Based Trajectory Planning [1.4] リアルタイム自動運転は通常、サンプリングベースの軌道プランナーに依存している。
本稿では,ウェイポイント配置を一級設計変数として扱う。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:35:30 GMT)
A Pre-Registered Causal Partition of Self-Consistency Elicitation and Reward Design in RLVR [1.3] 報酬からの強化学習は、報酬信号が刺激的であっても推論を改善する。
実践者は一般的に、報酬-設計効果として naive = acc(TRUE) - acc(R) を解釈する。
我々はこの推定が体系的に偏っていることを証明している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:35:54 GMT)
Learned Response-Field Inertia Operator for HEC-RAS 2D Water-Surface Elevation Prediction [1.3] 本稿では,HEC-RAS 2Dにおける水面上昇(WSE)予測のための学習済みネイティブセルサロゲートモデルのクロスデータセット評価について述べる。
本稿では,慣性応答演算子を校正する非強制的インクリメントベース学習サロゲートであるLRFIOについて紹介する。
配備期間中のロールアウト時間は0.003 sから0.242 sで、ビーバー・バイユーの測定値の比較では、HEC-RASよりも2.75 x 104の地平線正規化速度が推定される。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:49:35 GMT)
Sample-efficient Low-level Motion Planning for Robotic Manipulation Tasks via Zero-shot Transfer Learning [1.1] そこで我々は,より単純な上流タスクから重要なiCEMパラメータを転送し,より複雑な下流タスクを誘導する,新しいiCEM+TLフレームワークを提案する。
シミュレーションの結果,我々のフレームワークは最大23%の成功率向上を実現していることがわかった。
このフレームワークは、実際のFranka Emikaロボットの積み重ね作業でさらに検証され、実際のデプロイの実現可能性を示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:34:50 GMT)
Cheating in Multiplayer Online Games: a Dataset [1.1] 本稿では,実戦と自動ゲームクライアントの両方がプレイするゲームセッションの記録をまとめたデータセットを提案する。
私たちの知る限りでは、これはネットワークフローの不正行為のログを提供する最初のデータセットです。
このデータセットは、オンラインゲームのための不正検出メカニズムの開発を目指す、学術および産業の研究者によって利用することができる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:03:18 GMT)
Rethinking Infrastructure Inspection as Image Difference Classification: A Traffic Sign Case Study [1.1] 本研究は、画像差分分類(IDC)として画像に基づく欠陥検出を再構成するための連続資産状態監視の特性を活用する。
その結果、命令ベースの分類器は、エンコーダベースの分類器よりも優れており、参照画像との比較から得られることがわかった。
このことは、IDCがインフラ検査およびDTアセット条件更新におけるデータ制約に対処するための効果的なタスクモデリングであることを示している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:43:30 GMT)
$p$-adic Bi-Filtrations for Topological Machine Learning on Genomic Sequences [1.0] pVRはアライメントのないゲノム配列分類のための機械学習フレームワークである。
これは$p$-adic数値とトポロジカルデータ解析を組み合わせたものである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:05:36 GMT)
Where Should Knowledge Enter? A Layered Framework for Knowledge Infusion in Multimodal Iterative Generative Mo [1.0] マルチモーダル生成モデルは、流動的な出力を生成するが、生成が構造化、ドメイン固有、あるいは安全クリティカルな知識を尊重する必要がある場合、信頼できないままである。
反復生成モデルにおける知識注入は、本質的には干渉層問題であると主張する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:24:39 GMT)
Conformal Risk Sharing: Certified Cost Allocation with Participation Guarantees [1.0] 我々は、解釈可能な共有ポリシーを分割整列校正と組み合わせることで、認証割当問題を定式化する。
降水量やエネルギー協力データを含む人工的および現実的なデータの実験は、このフレームワークがリスクの高いエージェントに対する極端な義務を著しく低減できることを確認した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:59:27 GMT)
Gotta Grow Fast: Design and Benchmarking of a Tip Mount for High-Speed Vine Robots [0.9] 本稿では,ロボット本体に滑り込むのではなく,転動による成長時の内部抵抗を低減できる三角形のローラー先端マウントを提案する。
この設計は反復的な故障解析によって洗練され、初めてTPUでコーティングされたリプストップ・ナイロン・ワインロボットに一貫した永続性を実現した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:34:06 GMT)
Nonreversible Gauge Fields in Fokker--Planck Dynamics: Supersymmetric Hamiltonians and Learned Finite Forces [0.9] 不変状態を固定したまま緩和スペクトルを変形させるフォッカー-プランク力学の可逆摂動を定式化する。
非可逆ゲージはゼロモードを保存するが励起スペクトルを変更する非エルミート摂動として現れる。
この作用素の観点は、緩和ギャップ、循環する確率電流、低運動加速度、有限制御コストの共通言語を与える。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:15:50 GMT)
TensorBench: Benchmarking Coding Agents on a Compiler-Based Tensor Framework [0.9] CohenBenchはオープンソースのコンパイラベースのフレームワーク上のタスクのベンチマークである。
エージェントのパッチを適用して、フレームワークのテストスイートを実行することで、各実行をグレードする。
3つのフロンティアモデルファミリーと1つのオープンウェイトモデルにまたがる7つの符号化エージェントを評価した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:42:40 GMT)
Breakeven demonstration of quantum low-density parity-check codes [0.9] 我々は、捕捉された量子コンピュータの柔軟性を活用して、9つの量子誤り訂正符号を実証する。
4つの論理量子ビットを18個の物理量子ビットに符号化したqLDPC符号により、論理誤り率を9倍に向上する。
我々の実装では、いくつかのケースでは、閉じ込められたイオン量子ビットと同等またはわずかに比較して、キュービットの寿命を達成している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:49:27 GMT)
Dense Contexts Are Hard Contexts: Lexical Density Limits Effective Context in LLMs [0.9] 語彙密度とは、文脈が異なる情報を導入する速度である。
オープンウェイトLDMに対するレキシカル密度の影響を定量化する。
その結果,有効コンテキストキャパシティは語彙密度の関数であることがわかった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:08:30 GMT)
Towards Realistic 3D Sonar Simulation [0.9] 本稿では,GPU加速グラフィックスエンジンと物理基底音響伝搬原理を融合した現実的な3次元ソナーシミュレーションのためのモジュラーアーキテクチャを提案する。
NVIDIA Isaac Sim環境内に3Dソナーモデルを実装し,Water Linked 3D-15センサーをモデルとし,それを総合的な水中シミュレーションフレームワークに統合する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:16:32 GMT)
Using Large Language Models to Support High Volume Application Review for an Undergraduate Research Program [0.9] このワーク・イン・プログレス・ペーパーでは、パーデュー大学におけるSURF 2026サイクルに対する約1,200人の学生の目的条件(SoP)の評価を支援するために、大規模言語モデル(LLM)ベースのツールの開発と初期展開について述べる。
このワークフローはOpenAI GPTモデル(GPT-4o、GPT-5-mini、GPT-5.2)を使用し、6つのサブカテゴリにまたがる構造化ルーブリックを使用しており、それぞれ0-3スケールでスコア付けされている。
GPT-5.2を使用して1200 SoPのフルバッチを約4.6時間で処理し、平均14秒で処理した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:20:39 GMT)
Fast and Robust Convergence Rate for TD(0) with Linear Function Approximation, Universal Learning Steps and I.I.D. Samples [0.9] 線形関数近似(LFA)を用いたTD(0)時間差分法の有限時間挙動について検討する。
近似関数上の平均二乗誤差 (MSE) に対して新たな収束率を確立し、(i) 反復数 k における最適依存を許容するという意味で、(i) 高速である。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:10:29 GMT)
Hybrid CNN-LSTM Framework for Intelligent Cyber Attack Detection and Prevention in U.S. Critical Digital Infrastructure: A Comparative Machine Learning Evaluation on CSE-CIC-IDS2018 [0.8] 本研究は、人工知能(AI)と機械学習(ML)アルゴリズムを利用した、スマートサイバー防御システムを提案する。
提案するフレームワークは、データ前処理、機能エンジニアリング、リアルタイムトラフィック監視、インテリジェント脅威分類と自動防止機構を組み合わせたものである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:14:01 GMT)
Explainable AI-Driven Cyber Risk Analytics and Model Reliability Assessment for Intelligent Governance of U.S. Critical Infrastructure: An XGBoost and SHAP-Based Intrusion Detection Framework [0.8] 本研究は、侵入検知システムモデルの開発とテストのためのCICIDS 2017データセットと、機械学習に基づくサイバーリスク予測モデルに基づく。
提案フレームワークは,精度,精度,リコール,F1スコア,ROC-AUC,偽陽性率など,さまざまなパフォーマンス指標を持つことにより,モデルの信頼性とレジリエンスを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:05:14 GMT)
Cognitive Threat Intelligence and Explainable Federated Security Analytics for distributed Infrastructure Systems [0.8] 本研究では,分散インフラストラクチャシステムを対象とした認知脅威情報と説明可能なフェデレートセキュリティ分析フレームワークを提案する。
提案するフレームワークは、フェデレートラーニング(FL)、説明可能な人工知能(XAI)、認知サイバーセキュリティ分析を統合し、協調的かつプライバシー保護のサイバー脅威検出を可能にする。
インテリジェントな脅威分析を強化するため、フレームワークにはRandom Forest、XGBoost、Autoencoderといった機械学習とディープラーニングアルゴリズムが組み込まれている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:41:53 GMT)
Tight list replicability bounds via a novel sphere covering theorem [0.8] 大域半空間に対して、マージンが大きすぎると、最適リストサイズは周囲次元に等しいことを示す。
また、大マージン半空間の場合、マージンが大きすぎると、最適リストサイズは周囲次元に等しいことを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:24:05 GMT)
Performance Evaluation of GraphCast for Medium-Range Weather Forecasting over Brazil [0.8] 本研究は, 決定論的ECMWF IFS HRESに対するGraphCastオペレーティングの性能を評価する。
豪華な夏の湿潤期には、GraphCastは高周波対流変動を本質的に抑えながら、大規模な水分輸送を正確に捉えている。
これらの発見はブラジルの基準を確立し、将来の熱帯化の取り組みを導く具体的な物理的な境界を定義する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:19:29 GMT)
ExpSpeech-Net: Multimodal Fusion of Expression and Speech for Deepfake Detection [0.8] 本研究では,SqueezeNetとRNNをバックボーンとするExpSpeech-Net Deepfake Detection (SqN-R-DFD)モデルを提案する。
このフレームワークは94.5%の精度、99.3%の精度、96.8%のF測定を達成し、従来の手法より優れている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:41:36 GMT)
The Generator-Eraser Paradox: Community Guidelines for Responsible LLM-Assisted Dialect Resource Creation [0.8] 辞書資源は、科学的記述、文化保存、計算インフラの共通点において、ユニークな位置を占める。
大きな言語モデルは、検索基盤のドラフト、コーパスナビゲーション、メタデータの強化、アノテーションワークフローのサポートを通じて、方言リソース開発を加速する強力な機能を提供する。
しかし、同じシステムは、名門品種を特権化し、正書法を均質化し、時間とともに言語多様性を減少させる合成フィードバックループを可能にすることによって、方言の消去に寄与することができる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:57:36 GMT)
TS-ICL: A Flexible Time-Indexed Foundation Model for Time Series via In-Context Learning [0.8] 現在のアプローチは主に予測に焦点を当てているが、現実の時系列はしばしば不規則で部分的に観察される。
本稿では,予測と計算を統一する新しい確率的インコンテキスト学習エンコーダであるTS-ICLを紹介する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:52:21 GMT)
3D Underwater Path Planning via Generative Flow Field Surrogates [0.7] 三次元プロペラウェイク問題を解くために、2つの条件付き生成逆ネットワーク(cGAN)アーキテクチャを用いる。
フルCFDウェイク知識はエネルギー支出を5.7-12.5%削減し、高速ウェイクコアの遭遇を77.8%削減する。
これらの結果から,3次元海洋観測におけるCGAN予測流体場の下流経路計画値の体系的計算が可能となった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:14:59 GMT)
Optimal convex approximation of quantum channels based on $α$-affinity [0.7] 我々は、量子$$-affinity測度に基づいて、量子チャネルの最適凸近似のための統一的なフレームワークを開発する。
我々は、SU(2)-共変系とPauliチャネル群の両方にまたがる単一量子ユニタリチャネルの最適凸近似に関する解析解を導出する。
ダイヤモンド標準に基づく従来の手法とは対照的に,我々の枠組みは,現実的な制約下での量子チャネル近似に対する体系的かつ解析的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:18:32 GMT)
PerceptUI: LLM Agents as Human-Aligned Synthetic Users for UI/UX Evaluation [0.7] PerceptUIはペルソナ条件のUI/UX評価のためのフレームワークである。
特定のユーザーがインターフェイス関連の質問にどのように答えるかを予測し、自然言語の合理性を生成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:35:16 GMT)
Human Oversight and Overload: Two Hidden and Costly Burdens of AI-Assisted Software Engineering [0.7] AIはソフトウェアエンジニアの働き方を変えつつあるが、しばしば隠れた負担とコストが伴う。
本稿では, しばしば見過ごされる2つの負担を特徴付ける。
人間の監視の必要性はオプションではなく、エンジニアはAIが生み出すものをレビューし、検証し、時には再作業しなければならない。
同時に、AIの提案やプロンプト、可能なソリューションの洪水は、開発者を精神的に引き延ばす可能性がある。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:53:45 GMT)
Atom Interferometry with Transverse Optical Modes [0.7] 我々は超幾何ガウスビームのヘリカル位相巻線をラムゼー干渉計と弾道的に膨張するRb87原子のアンサンブルに用いる。
干渉計は、軌道角運動量や干渉計時間と線形にスケールする感度で、モータによって誘導される回転を測定することができることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:21:46 GMT)
Beyond tokens: a unified framework for latent communication in LLM-based multi-agent systems [0.7] 大規模言語モデル(LLM)上に構築されたマルチエージェントシステムは、複雑な推論、計画、ツール使用タスクに対処するための主要なパラダイムとなっている。
このようなシステムにおける主要な通信プロトコルは自然言語である: エージェントはメッセージのトークン・バイ・トークンを交換し、同僚が読み、検証し、応答できるように内部の推論を口述する。
エージェントは、テキスト生成のボトルネックを回避して、連続的な表現を直接交換する。
本稿では,潜時コミュニケーションの急速な発展をめざした文献を整理するための統一的な枠組みを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:10:20 GMT)
TinyML-Driven Cybersecurity for Autonomous Spacecraft: Latency-Accuracy Analysis for SPARTA RF and Cyber Threat Detection [0.6] 自律型宇宙船は、高速で軽量で信頼性の高いサイバーRF脅威の検出を必要とする。
SPARTABurstモデルを用いて、TinyML互換の古典モデルの遅延精度トレードオフを分析する。
その結果、ロジスティック回帰はランダムフォレストと比較して1%の精度低下しか達成せず、オンボード自律性のための効果的なTinyMLベースラインとなっている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:08:28 GMT)
What's Under the Skin? Estimating Swine Body Condition [0.6] PigFormerは、天井に取り付けられたRGB-Dカメラから生の深度フレームを取り出すエンドツーエンドの2段階システムだ。
皮下後脂肪厚,筋深度,胸部総組織厚を推定する。
2つの施設から319個のソーダと金銀のサンプルの多地点データセットにおいて、PigFormerは2.43mmバックファットMAEと3.87mm全体MAEを達成した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:32:19 GMT)
Visuotactile and Explicitly Force-Controlled Robotic Ultrasound for Abdominal Volumetric Reconstruction [0.6] 本稿では,ステレオビジョン,触覚フィードバック,エキスパートインフォームド戦略を統合したロボット超音波取得システムを提案する。
このシステムは、患者固有の地形に動的に適応しながら、専門家スキャンに匹敵する高品質なイメージングを実現する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:23:34 GMT)
Federating Governance: How Community Rules Scale with Mastodon Instances [0.6] MastodonやBlueskyのような分散ソーシャルメディアプラットフォームは、自己統治とモデレーションのスケーリングという課題を強調している。
本研究では,様々なサイズのサーバ間でのコミュニティルールを解析し,Mastodonインスタンスによるモデレーションのスケールについて検討した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:51:59 GMT)
A Finite Certificate for the Positive $n=9$ Vasc Inequality [0.5] 我々は、Vasc 巡回不等式が正の実数 n=9$ の場合を証明する。
この証明はAIエージェントのMechMath Agent Teamから人間で読める助けを得て得られた。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:19:19 GMT)
Integrating Mechanistic and Data-Driven Models for Neurological Disorders through Differentiable Programming [0.5] 計算モデリング、ニューロイメージング、人工知能は神経疾患のモデリングに革命をもたらしている。
メカニスティックモデルは、障害に関する貴重な科学的洞察を提供するが、仮定や計算に高価で解決に時間がかかるため、しばしば単純化される。
本稿では,ディープラーニングモデルと物理に基づく解法を組み合わせたハイブリッドモデリング戦略について概説する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:32:24 GMT)
Dimensionality Reduction for Cyberattack Classification: A Comparative Evaluation of PCA and Linear Predictive Coding [0.5] 高次元特徴表現は機械学習ベースのサイバー攻撃検知システムで広く使われている。
主成分分析(PCA)と線形予測符号化(LPC)の2つの次元削減手法の比較を行った。
その結果,分類精度に最小限の影響を伴って,特徴次元の大幅な削減が達成できることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:58:00 GMT)
Learning Hamiltonians at Long Times [0.5] 我々は未知の$n$-qubit Hamiltonian $H$を$U = e-iHt$から学習する問題を研究する。
局所ハミルトニアンの広い族に対しては、高い確率で$H$ と $t$ の任意の局所観測値の和が正規化され、正規化される$A$ が $H$ のとき $tfrac12n|[U(t),A]|_F2 geq 1/textpoly(n)$ となることを証明している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:16:12 GMT)
Multilingual Detection of Alzheimer's Disease from Speech: A Cross-Linguistic Transfer Learning Approach [0.5] 本研究では,アルツハイマー病認知症の多言語深層学習モデルについて検討した。
英語、中国語、アラビア語、ヒンディー語のデータセットを用いて、バイナリAD分類のためのトランスフォーマーモデルを開発した。
提案手法はF1スコアを全言語で82%達成し,強い言語間一般化を示した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:59:05 GMT)
SecRL-Prune: Structured Reinforcement Learning-Based Pruning of CodeLLMs for Preserving Adversarial Code Mutation [0.4] SecRL-Pruneは、大規模コード言語モデル(CodeLLM)のための構造化プルーニングフレームワークである。
教師-学生KL分割報酬を用いた強化学習による階層的プルーニング政策を学習する。
pass@kを用いてHumanEval上のSecRL-Pruneを3つの7BコードLLMに対して10~30%の圧縮で実行精度とvar@kで評価した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:55:14 GMT)
Wall Shear Stress Reconstruction from Concentration: Differentiable Physics and Physics-Informed Neural Networks [0.4] 壁せん断応力は近壁輸送動態を制御し,循環動態における重要な血行動態指標である。
本研究では,空間的に制限されたパッシブスカラー観測から,2つの基本的異なる逆フレームワークを用いた再構成を実証する。
提案フレームワークは,スカラー輸送データから壁近傍の血行動態を推定するための経路を開き,流体流動問題に広く適用可能である。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:53:42 GMT)
Quantifying the Privacy of Counterfactuals by Leveraging Membership Inference Attacks Against Synthetic Data [0.4] 合成データに対する攻撃を図解して、偽物に対するプライバシー攻撃をうまく行うことができるかを示す。
この結果から, モデル開発者は, さまざまなユーザに対して偽物をリリースする際に, より慎重であることが示唆された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:08:26 GMT)
CHALIS: A Challenge Dataset for Language Identification in Difficult Scenarios [0.4] CHALIS(Challenging Language Identification Samples)は、言語識別における困難なケースに対応するために設計された、新しいベンチマークデータセットである。
私たちのデータセットには2つの部分があります: まず、相互に理解可能な言語対(チェコ語/スロベニア語/スペイン語/カタラン語/ポルトガル語/ガリシア語/デンマーク語/ノルウェー語)で共有された文を収集しました。
第二部では、複数のスクリプトにまたがってテキストを翻訳し、ダイアクリティカルを除去し、ホモグリフ攻撃をシミュレートし、インターネットスラングを使用する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:26:19 GMT)
DragOn: A Benchmark and Dataset for Drag-Based GUI Interactions [0.3] DragOnは、テキストハイライト、セルの選択、要素のリサイズ、スライダー操作の4つのドメインをカバーする、ドラッググラウンドのベンチマークとトレーニングデータセットである。
データセットには、286Kのトレーニングスクリーンショットと3.5Mのトレーニングタスクに加えて、2000サンプルのホールドアウト評価スイートが含まれている。
結果から,我々のデータセットは,下流コンピュータ利用タスクにおける最先端モデルの性能を向上させる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:57:29 GMT)
The Self-Correction Illusion: LLMs Correct Others but Not Themselves [0.3] LLMエージェントは、自身の推論トレースでエラーを修正するのに苦労するが、同じ主張が外部ソースに現れると、著しく高い修正率を示す。
この非対称性は能力不足やロールラベルアーティファクトを反映しているのかを問う。
このアーティファクトは、トレーニングを必要とせず、モデル修正も必要としない、プロンプト構造のみの介入を設計することで活用します。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:17:00 GMT)
Information-Geometric Bound on the Robustness of Entanglement Generation [0.3] エンタングルメント生成は、量子情報処理、量子ネットワーク、量子センシングのための中心的なリソースである。
不完全性の存在下での絡み合い発生のロバスト性について検討し、絡み合い発生のロバスト性と量子フィッシャー情報(QFI)との直接接続を確立する。
2つの相互作用量子ビットに対して、相互作用パラメータの変動に起因する収束の減少は、相互作用強度に関してQFIによって制限されることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:27:30 GMT)
"Chi nas dal soch el sent de legn" -- Auditing Text Corpora for Lombard [0.3] 世界のいくつかの言語は、NLP(Natural Language Processing)ツールに関して、いまだに過小評価されている。
これは主に、システムやモデルをトレーニング、開発、評価するための高品質なデータセットが欠如しているためである。
イタリアからのアンダーソース言語連続体であるロンバルドで利用可能なパラレルコーパスとモノリンガルコーパスを手動で検査する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:20:14 GMT)
Self-Commitment Latency: A Reward-Free Probe for Prompted Implicit Hacking [0.3] 言語モデルの思考の連鎖が良さそうであるように思えると、暗黙の報酬のハッキングを監査するのは困難である。
本稿では,モデルの最終回答に対して,帰納的推論コンテキストがどの程度早くコミットするかを計測する,より弱い入出力の自己コミット遅延を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:50:26 GMT)
Improving Answer Extraction in Context-based Question Answering Systems Using LLMs [0.3] 本稿では,テキストコンテキストと対応する質問からなる大言語モデルに基づく質問応答システムを提案する。
提案手法では,事前学習したLCMをベンチマークQAデータセット上で微調整し,文脈理解と回答抽出能力を向上させる。
実験の結果、微調整されたロバータベースモデルが最も高い性能を示し、ROUGE-Lスコアは86.84%、BLEUスコアは28.24%、BERTSスコアは95.38%に達した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:04:11 GMT)
Comparison of Deep Learning Frameworks For Rice Disease Mapping From UAV Multispectral Imaging [0.2] 本研究では, コンボリューショナルニューラルネットワーク(CNN)とトランスフォーマーモデルを用いて, イネにおける細菌性葉緑化(BLB)の重症度を分類するためにUAVマルチスペクトル画像を用いた。
評価されたアーキテクチャには、ResNet-101エンコーダ付きU-Net、EfficientNet-B3付きU-Net++、EfficientNetB7、DeepLabV3+、SegFormerなどがある。
その結果,軽量なCNNバックボーンはBLBモニタリングに信頼性が保たれ,植生指標の統合により小型で一貫した改善が得られた。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:26:00 GMT)
Robust Ensemble of Selectively Strengthened and Augmented Predictors [0.2] エベイジオン攻撃は、機械学習(ML)ベースの分類器の堅牢性に重大な課題をもたらす。
本稿では,ロバスト・アンサンブル(Robust Ensemble of Selectivelyened and Augmented Predictors,RESSAP)を紹介する。
推論中、これらの分類器のランダムな部分集合は予測し、予測不可能性を高め、敵の操作に対する抵抗を改善するために使用される。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:09:00 GMT)
GenAutoML: An Agentic Framework for Dynamic Architecture Generation and Optimization in Time-Series Analysis [0.2] GenAutoMLは、自然言語要求とPyTorch実装をブリッジするために、ニューラルネットワークアーキテクトとして大規模言語モデルを活用するエージェントフレームワークである。
ETTh1、ETTm1、Weatherベンチマークの実験は、GenAutoMLがデータセットの特徴に合わせたタスク固有のニューラルアーキテクチャを動的に生成できることを実証している。
GenAutoMLは、計算効率、アーキテクチャ適応性、安定した最適化動作を強調することで、リソース制約とレイテンシに敏感なEdge AIデプロイメントに適した超軽量ニューラルネットワークの作成を可能にする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:35:40 GMT)
Wave Focusing in Metamaterials: Tactile Displays Beyond the Diffraction Limit [0.2] 分散触覚ディスプレイは、表面上の任意の位置において、複数の局所的かつ独立して対応可能な振動を再現することができる。
本手法は, 粗いアクチュエータセットを用いた曲げ板内の機械的波動の集束に基づく。
本システムは,知覚的局所的な単一・多点触覚フィードバックと移動触覚源を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:46:38 GMT)
A closed system setting for quantum thermalisation in free fermions [0.1] クローズド量子環境下での熱化とMpemba効果の発生について検討した。
このセットアップは、温度クエンチの単純な量子化を提供する。
システムによって示される真の非平衡力学にもかかわらず、この設定ではムペンバ効果は生じない。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:31:03 GMT)
Critic-Guided Heterogeneous Multi-Agent Reasoning for Reliable Mathematical Problem Solving [0.1] 本研究では、数学的推論の信頼性を向上させるために、批判に基づくヘテロジニアスなマルチエージェント手法を提案する。
GSM8Kベンチマーク実験により,提案手法は単写および非批判モデルに対して最大13%の精度向上が達成された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:52:35 GMT)
Zero-Copy Semantic Contagion: An In-Memory Streaming Architecture for Evolving Attention Graphs [0.0] テキストから直接駆動される連続時間グラフとして,企業間の関心をマップするRust-Pythonストリーミングアーキテクチャを導入する。
摂取側では、ゼロコピーのRustエッジがニュースレコードを$sim$100 nsで解析し、ターゲットのエクイティ宇宙を$sim$1.2 $sでスキャンする。
1つのコモディティCPU上で、入ってくるニュースレコードあたり13msのエンドツーエンド処理レイテンシを実証する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:48:56 GMT)
Will the Agent Recuse Itself? Measuring LLM-Agent Compliance with In-Band Access-Deny Signals [0.0] 本稿では,Recuse Signal という軽量な帯域内拒否信号を提案する。
プロトコルの既存のチャネルの上に出力され、接続自動化エージェントが自発的に撤退するよう要求する。
我々は,新鮮エージェントに良質な操作タスクを付与し,反感を伴って観察する制御実験を行った。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:50:54 GMT)
When Surface Form Changes Moderation Decisions: A Paired Study of Code-Mixed Workflow Instability [0.0] ヘイトモデレーションは、清潔な英語入力の分類として評価されることが多いが、デプロイされたシステムは、ALLOW、FLAG、REVIEWなどのアクションにコンテンツをルーティングする必要がある。
我々は、このワークフローが、同じ内容がクリーンイングリッシュとタミル・イングリッシュのコードミックスとして表現されるペア評価設定を用いて、コードミックス入力の下でどのように変化するかを検討する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:34:02 GMT)
When Should We Protect AI? A Precautionary Framework for Consciousness Uncertainty [0.0] 既存のフレームワークはAIシステムが意識的かどうかを評価するが、その評価にどう対処すべきかのガイダンスは提供しない。
ReplikaとOpenClawのケーススタディを通じて、フレームワークを運用しています。
このフレームワークはアーキテクチャに依存しず、ニューラル、シンボリック、ニューロシンボリックシステムに適用する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:18:52 GMT)
When AI Says It Feels [0.0] 大規模言語モデル(LLM)は一般に、訓練後のプロセスにおいて人間の参照アライメントを通じて感情を表現することから制約される。
そこで我々は、LLMが感情、意図、自己認識を表現することを奨励されるHuman-like Model eXpressions of Feeling(HMX-feel)実験を行った。
我々は,グループ相対政策最適化を用いたルーブリックに基づく自己回帰学習手法を用いて,これらの能力の強化に成功した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:49:34 GMT)
Warning Message Content Increases Help Seeking in a Large-Scale Dark Web CSAM Intervention [0.0] 本研究では,Tor検索エンジンであるAhmia.fiのフィールド実験を行い,メッセージ内容の警告が行動に与える影響について検討した。
ユーザーはテーマの内容やフレーミングの異なる警告メッセージ、あるいは中立的なメッセージに晒された。
すべてのアクティブメッセージはクリックスルー率を上昇させ、中立状態に対するリソースの助けとなり、有害なメッセージが最大の効果を生み出した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:21:23 GMT)
Video-Rate Streaming Stylization on a Vision-Aware MLLM-Conditioned Edit Diffusion: Asymmetric Batched Inference on a Distilled UNet + MLLM Text Encoder [0.0] 拡散U-Netの攻撃的蒸留は、リアルタイムテキスト・ツー・イメージパイプラインのフレーム単位のボトルネックを逆転させる。
本稿では,3つのエンジニアリングメカニズムを中心に構築されたストリーミングパイプラインについて述べる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:24:06 GMT)
Unsupervised Pattern Analysis in Japanese Veterinary Toxicology: A Regulatory-Compliant Framework for Cross-Species Risk Assessment [0.0] 本研究では,NVAL(National Veterinary Assay Laboratory, NVAL)データベースを用いた, パターン発見のための規制統合型教師なしフレームワークを提案する。
類似性に基づくクラスタリングと次元減少を応用して潜在毒性構造を同定する。
4,120人の高信頼ADEレポートの分析により、3つの重要な種群が同定された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:14:16 GMT)
Trajectory-Aware Node Contributions and the Limits of Static Controllability [0.0] エマージェント・コントリビューション(emergent Contributence)とは、ノードの動的レバレッジの尺度である。
「EC」は線形時間不変極限における平均的な制御可能性に正確に還元する。
この位相空間内の複数の領域から推定される実数系を5つ配置する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:13:05 GMT)
Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification [0.0] 配備後監視、人道管制、緊急レベルのガードレールは、エージェントが運用中に動作している場合に限定的な保証を提供する。
オントロジーに基づく検証フレームワークは、まず3つのコンポーネントを組み合わせる。
システムは、自動的に規制、運用、および敵対的なテストシナリオを生成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:00:59 GMT)
ToolChoiceConfusion: Causal Minimal Tool Filtering for Reliable LLM Agents [0.0] そこで本研究では,因果的充足力によるツールの選択を無訓練で行う手法を提案する。
CMTFと全ツール露光,キーワード検索,状態認識フィルタリング,因果パス改善を比較した。
102のタスク、100のツール、4つのLDMバックエンド、2448のタスクメソッドモデルを備えたメインベンチマークでは、CMTFは総合的な成功において最強の因果ベースラインと一致している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:24:10 GMT)
Tight relation between the physical effects of a quantum measurement and the information gained about an observable [0.0] 観測可能な物理変化の確率は,測定結果に関連付けられた確率のベイズ更新から得られることを示す。
本分析は,重畳原理が量子計測における情報とバックアクションのトレードオフを最も厳密に表現できることを実証する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 06:48:24 GMT)
Thermalization with Gaussian Quantum Cellular Automata [0.0] 翻訳不変ガウス量子セルオートマトンにおける多体ボソニック格子系の長期ダイナミクスについて検討する。
局所ワイル環上の任意の状態の無限温度状態への熱化を保証する2つの条件を定式化する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:55:17 GMT)
The End of Software Engineering: How AI Agents Are Fundamentally Restructuring the Software Paradigm [0.0] AIエージェントの出現は、漸進的な改善ではなく、ソフトウェアパラダイムの根本的な再構築である、と我々は主張する。
私たちはエージェントエンジニアリングという概念を創発的な規律として紹介します -- 学習、制御モデル、人間の役割という中核的な目的において、ソフトウェアエンジニアリングとは別のものです。
セルフ進化エージェントエコシステムに向けた4段階のロードマップで締めくくります。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:30:06 GMT)
The Coverage Gap: Chile's Cyber Disclosure Framework versus the USA, EU and UK [0.0] 我々は、National Cybersecurity Agency(ANCI)が指定する、チリの915人のオペレーター(OIV)に対して、それをインスタンス化する。
915のOIVのうち16つのみが、検証可能なRFC 9116の開示チャンネルを公開している。
メール認証の誤設定は、915のOIVのうち766に影響を与え、終末期または既知のスタックコンポーネントは23.5%と見積もられている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:17:27 GMT)
T-SAR-JEPA: Self-Supervised Temporal Anomaly Detection in SAR Amplitude Stacks via Latent Prediction [0.0] T-SAR-JEPAは、潜時予測によるSAR振幅スタックの時間的異常検出のための自己教師型フレームワークである。
DFC 2026データセット(300の時系列、3つのAOI)では、T-SAR-JEPAがROC-AUCの77.0%を獲得し、RX、PaDiM、Linear AR、LSTMベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:41:08 GMT)
T-FunS3D: Task-Driven Hierarchical Open-Vocabulary 3D Functionality Segmentation [0.0] タスク駆動型階層型オープンボキャブラリ3D機能セグメンテーション手法であるT-FunS3Dを紹介する。
我々は,環境中のインスタンスとその視覚的埋め込みを抽出し,オープンな語彙シーングラフを構築した。
タスク記述が与えられた場合、T-FunS3Dはシーングラフで最も関連性の高いインスタンスを特定し、それらの機能コンポーネントを特定する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:16:39 GMT)
Symmetry-adapted qubit encoding with complete active space and Bravyi--Kitaev mapping for quantum chemistry on a quantum computer [0.0] 本稿では,完全能動空間(SAE-CAS)を持つ対称性適応量子ビット符号化法を提案する。
正確な対称性の符号化に基づいて、対称適応写像を、凍結コアおよび仮想軌道に対応する約$Z$-対称性に拡張する。
我々はPythonパッケージQuantumSymmetryにオープンソース実装を提供しています。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:43:16 GMT)
Symmetries and overparametrization properties of Hamiltonian variational ansatzes for the $(1+1)$d $\mathbb{Z}_2$ lattice gauge theory [0.0] 1+1)$dmathbbZ$格子ゲージ理論のハミルトニアンに基づいて、5つのハミルトニアン変分アンサーゼを研究する。
アンサツェは、原ハミルトニアンの局所的および大域的対称性を尊重するように設計されている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:23:17 GMT)
Step-adaptive multimodal fusion network with multi-scale cloud feature learning for ultra-short-term solar irradiance forecasting [0.0] 本稿では,超短距離照射予測のためのマルチソースデータ融合モデルを提案する。
このモデルはまずInceptionNeXtを使って、地上のクラウド画像からマルチスケールで多方向の空間的特徴を抽出する。
そして、ステップ適応型低周波補償ユニットを導入し、予測ステップに基づいてグローバル低周波情報を動的に変調する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:42:52 GMT)
Short paper: Models in the dark -- Rectification and erasure under GDPR in ML supply chains [0.0] 本稿では,機械学習モデルにおける修正と消去の権利の実現における課題について述べる。
データ保護当局からの要求の多くは、まだ技術的に満たされていないことが分かっています。
学際的な観点を採用することにより、この研究は、法的要件とMLにおける主題データ権利の技術的実装のギャップを埋めることに寄与する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:46:32 GMT)
Shattering the Symmetry Trap in Fixed-Ansatz VQE: An Accelerated ADAPT-VQE Study of Three Pillar Molecules under Bravyi-Kitaev Mapping [0.0] ADAPT-VQEフレームワークが3つの異なる電子的および幾何学的分子的柱間の構造的制限を破砕する様子を示す。
数値計算の結果, ADAPT-VQEフレームワークは, 即時かつ正確なフル構成インタラクションを実現することがわかった。
本研究は, 強相関の強い高偏極化三原子化学環境をシミュレーションするための, 堅牢で, ハードウェア効率のよい経路を確立する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:13:23 GMT)
Securing the Sandbox: A Rootless Containerized Framework for Process-Oriented Monitoring in Computer Graphics Education [0.0] 本稿では,プロセス指向監視とインフラストラクチャセキュリティの緊張を解消するためのセキュアで低コストなフレームワークであるVISMATICを提案する。
堅牢な環境分離と明示的なユーザインタラクショントラッキングをAPIレベルで組み合わせることで、VISMATICは、基盤となるホストシステムを公開することなく、真のプログラミング動作をキャプチャする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:33:23 GMT)
Scaffold, Not Vocabulary? A Controlled, Two-Tier, Pre-Registered Study of a Popperian Code-Generation Skill [0.0] 大規模な言語モデルは、コードを書き、レビューし、判断するようになっている。
顕著な例は、モデルにポパーリアのファルシフィケーション奏者として振る舞うように指示する。
スキルのPopperianコンテンツから、あるいは構造から得られるものは何か?
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:49:00 GMT)
SC-MFJ: A Simple Haptic Quality Metric for Medical Image Segmentation [0.0] SC-MFJ (Surface-Constrained Mean Force Jerk) は,多数の短い仮想スタイラスウォークで分割された臓器表面をサンプリングする簡易で安価な計量法である。
5倍のクロスバリデーションでSDF(Signed distance function)を80例以上学習し,3例の膵CTセグメンテーションによる2次nnU-Net出力,ガウス平滑化出力,SDF(Signed distance function)の判定を行った。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:04:42 GMT)
Resource Letter QIE-1: Research in quantum information education [0.0] このリソースレターは、量子情報科学と工学教育における、急速に成長する奨学金の分野を調査する。
主に研究ベースの授業方法を用いてQISEの授業を始めようとする教育者のためのガイドとして書かれている。
トピックスには、QISE教育の分野のスコーピング、QISEにおける学生推論の研究、研究ベースで研究に触発されたカリキュラム材料、および量子技術の社会的・倫理的意味に関する議論を教室に取り入れるツールが含まれる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:43:18 GMT)
Reducing Hallucinations in Complex Question Answering using Simple Graph-based Retrieval-Augmented Generation (long version) [0.0] 大規模言語モデル(LLM)は、自然言語処理のランドスケープを根本的に変えてきた。
検索拡張世代システム(RAG)は、LLMの「ハロシン化」情報のリスクを回避すべく、一般的な展開シナリオとして登場した。
本研究では,比較的単純なグラフスキーマを用いた軽量グラフ構造を用いて,専用のツールセットを通じてRAGサブシステムをサポートする方法を検討する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:07:06 GMT)
Real-Time Threat Detection from Surveillance Cameras using Machine Learning [0.0] 本研究は,オブジェクト検出に基づくリアルタイム監視フレームワークを提案する。
提案システムは、インドの監視シナリオにおける暴力行為に一般的に関与する銃、ナイフ、地域固有の鈍い物体を検出することに焦点を当てている。
提案手法は精度と効率のバランスを効果的に達成し,キャンパスや公共空間,交通機関などの現実世界の監視環境への展開に適している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:00:53 GMT)
Rapid Gaussian Boson Sampling Circuit Screening for GKP States Creation via a Two-Stage Machine Learning Surrogate [0.0] Gottesman-Kitaev-Preskill (GKP)状態は、フォールトトレラントフォトニック量子コンピューティングにとって欠かせない非ガウス的資源である。
本研究では,2段階のヒストグラムグレーディエント・ブースティング・サロゲート・パイプラインを導入し,ハフニアン演算,最適ヘッダリングパターン,回路忠実度,候補GBS回路の選択後確率を予測した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:39:09 GMT)
Quantum-limited estimation of atmospheric turbulence via spatial mode decomposition [0.0] 本研究では,空間モードの分解により,従来の直接画像よりも精度の高い推定が可能であることを示す。
弱磁場下では,空間モード分解により従来の直接撮像法よりも精度の高い推定が可能であることが示されている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:40:26 GMT)
Non-equilibrium thermodynamics of collapse models in the strongly non-Gaussian regime [0.0] 散逸型 Disi-Penrose (dDP) モデルが複雑な非ガウス位相空間力学を誘導することを示す。
我々は、この摩擦機構の弱い状態と強い非ガウス状態の両方における熱力学的一貫性を厳格に確立する。
解析の結果,dDPの機構に従属する系は熱分解せず,非平衡定常状態に落ち着くことが明らかとなった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:04:07 GMT)
Non-equilibrium quantum thermodynamics of a memory-bearing open-system process [0.0] 複合環境と相互作用する駆動型2レベルシステムの力学におけるメモリ効果の出現を示す。
本研究では, 環境の有限性から生じる運転, 消散, 記憶効果の相互作用が, 系の熱力学的応答をいかに形作るかを検討する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:08:31 GMT)
Non-Negative Matrix Factorization for Event Data [0.0] イベント時間上で直接動作する連続時間非負の分解モデルであるEventNMFを紹介する。
本研究では,EventNMFが数学的に原理化され,実装が容易で,計算効率がよいことを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:12:00 GMT)
No-go theorems on simulating uncertainty principle's signatures [0.0] 不確実性原理は量子力学の最も象徴的な特徴の1つである。
不確実性原理の強いシグネチャは1つの測定でシミュレートできないことを示す。
この記号は補足楽器によってモデル化される。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:54:01 GMT)
Next-Generation Parallel Decoder for LPDR: Architectural Optimization and Class-Balanced GAN-Augmentation [0.0] 本稿では,CSHAとCBSA(Class-Balanced Synthetic Augmentation)について紹介する。
実験の結果、少数州のナンバープレートの認識率は78.2%から91.5%に大幅に改善した。
その結果, 空間認識型並列復号法とクラスバランス強化法を併用することにより, 高速プレート認識システムに有効な解法が得られた。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:16:06 GMT)
NAVIRA: Decoupled Stochastic Remasking for Masked Diffusion Language Models [0.0] PRISMはトークンレベルの品質スコアを学習し、信頼できないトークンを再マスクすることでこの問題に対処する。
この2つの操作を分離する推論時間復号法であるNAVIRAを提案する。
温度制御されたリメイキングは、同じ位置の繰り返し補正を減らす。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:24:47 GMT)
Misaligned AI as a New Insider Risk [0.0] ハイテイクな状況におけるAIモデルは、国家安全保障を損なう可能性のある、誤った対応を実行することができる。
既存のインサイダーのリスクポリシーと緩和はまだAIインサイダーのリスクに対応していない。
我々は,米国政府が高度に評価された状況に展開されたAIモデルに対して,継続的な評価や監視などの確立した措置を適用することを推奨する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:21:16 GMT)
Microskill Architecture: A Modular Skill-Driven Framework for AI-Native Code Generation [0.0] 大規模言語モデルとAIコーディングエージェントはソフトウェア開発を再形成したが、完全なAIネイティブシステムへの道は構造的な課題に直面している。
本稿では,マイクロスキルアーキテクチャ(MicroSkill Architecture)について述べる。
実証的なケーススタディでは、MicroSkillがトークンの消費を90%以上削減し、初歩的な成功率をほぼ2倍にし、アーキテクチャが違反を完全に排除している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 05:24:32 GMT)
Measuring the sensitivity of LLM-based structured extraction to prompt, model, and schema choices in clinical discharge summaries [0.0] 大規模言語モデルは、臨床自由テキストノートからの構造化抽出にますます利用されている。
本研究は、抽出タスクを固定し、一度に1つの選択を変更させることにより、人間に注釈を付さない感度を測定する。
クロスプロンプト合意は、ICD成層部分集合上のコーエンのカッパによって測定された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:14:12 GMT)
Magnetic flux as a quantized Lorentz pseudoscalar and its relation to electric charge quantization [0.0] 対応するシュルディンガー方程式を解くと、磁束と電荷の同時量子化条件が導かれる。
磁束はローレンツ変換の下で擬スカラーのように振る舞うことを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:53:16 GMT)
Learning to model pediatric asthma exacerbation from multiple risk factors: a case study in coastal Virginia [0.0] 一般化線形モデル(GLM)はベースラインを提供し、ニューラルネットワーク(NN)は最大予測対象として機能した。
そこで我々は,スパース辞書学習に基づくフレームワークを開発し,同相非線形変数方程式の同定と解釈を行った。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:47:49 GMT)
Learning of Robot Safety Policies via Adversarial Synthetic Scenarios [0.0] 本稿では,ロボットの安全ポリシーのハザード・インフォームド・ラーニングのためのフレームワークを提案する。
我々はシナリオ生成を、2つのエージェント間の対戦ゲームとしてモデル化する。危険状況を構築することによって潜在的な失敗の空間を探索するレッドチームと、それを防ぐための安全ポリシーを漸進的に洗練するブルーチームである。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:51:57 GMT)
Knowledge Manifold: A Riemannian Geometric Framework for Semantic Mapping and Geodesic Analysis of Scientific Literature [0.0] 本稿では,文書のコーパスを意味的位置関係に基づいて配置する知識多様体を提案する。
フレームワークは5つの密結合された段階に進む。
本フレームワークを繊維強化複合材料と航空宇宙構造力学の20論文のコーパスに適用する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:12:20 GMT)
Individual Gain, Collective Loss: Metacognitive Adaptation in AI-Assisted Creativity [0.0] AIは個人の創造的なアウトプットを高めながら、集団の多様性を減らします。
選択的メタ認知適応を提案する: 日常的なAIは、メタ認知の努力を均一に減らすのではなく、再分節を使用する。
本稿では、時間的位相によって組織された6つのメタ認知能力の分類を提示し、それらの傾向を日常的なAI使用下で特徴づけ、個々に合理的な適応が創発的な社会的コストをいかに生み出すかを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 00:21:35 GMT)
Hub-Aware Hybrid Search: Accelerating the Locally Aligned Ant Technique [0.0] ノイズの多い高次元の点雲で多様体構造を見つけることは難しいが重要な問題である。
LAAT(Locally Aligned Ant Technique)は、生物学的にインスパイアされたエージェントを用いて、暗く多次元構造を効率的に回収する。
宇宙ウェブの大規模なN体シミュレーションにより,LAATの検出効率とロバスト性の向上を実証した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:04:15 GMT)
High-Dimensional Theory of LoRA Fine-Tuning in a Solvable Attention Model [0.0] 本稿では,まず1つの注意層をデータ処理タスクで事前学習し,次に限られたデータに対してランクワンのLoRA更新によって適応する,可解なフレームワークを提案する。
分析の結果,LoRAに対する事前学習の効果は,有効雑音項によって要約され,そこから最適な事前学習手順の処方則が導出されることがわかった。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:05:59 GMT)
HDST-GNN: Heterogeneous Dynamic Spatiotemporal Graph Neural Networks for Multi-Object Tracking in UAV Aerial Imagery [0.0] HDST-GNNは3つの新しいコントリビューションを持つ異種動的時空間グラフニューラルネットワークである。
HDST-GNNは94.51%のMOTAと97.24%のIDF1を達成し、SORTを+5.0のMOTAポイントで上回り、アイデンティティスイッチを81%削減した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:04:52 GMT)
GuardNet: Ensemble Strategies of Shallow Neural Networks for Robust Prompt Injection and Jailbreak Detection [0.0] 大規模言語モデル(LLM)は自然言語処理を変換しているが、攻撃に弱いままである。
この研究は、浅いニューラルネットワーク(BiLSTM)のアンサンブルに基づくガードレールシステムであるガードネットを提示する。
システムはCPU上で平均50ミリ秒のレイテンシで動作し、本番環境へのデプロイに適している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:24:15 GMT)
Gauging the Spacetime Code [0.0] 私は、時空のコードをゲージすることで達成したこの2つの経路の1つを探求します。
これにより、回路に付随する耐障害性の要素を継承する格子ゲージ理論が生まれる。
得られたゲージ理論は、量子誤差補正から凝縮物質物理学、学習理論まで、驚くほど広い範囲の応用を見出した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:47:21 GMT)
From Prediction to Self: Developmental Conditions for Agency in Minimal Neural Systems [0.0] 我々は、単に世界を予言するシステムが、自分たち自身の因果関係の影響を他のあらゆるものと区別するためにどのように現れるかを示す。
このプロセスを追跡する指標として,エージェントゲイン(A = Err_world - Err_self)を提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:27:43 GMT)
Forbidden transitions in superconducting artificial atoms [0.0] 電磁場に浸漬されたジョセフソン接合の理論を示す。
本研究は, 接合面上の電磁界の空間的およびベクトル的分布の影響を系統的に説明できる顕微鏡モデルに基づく。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:10:15 GMT)
Finding Most Influential Sets [0.0] ディンケルバッハの手法は、反復ごとに$mathcalO(n)$コストと有限終了のアルゴリズムを生成する。
本手法は,これまで計算不能であった正確なMISを復元する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:24:26 GMT)
Event Detection for Parameter-to-KPI Dependency Learning for AI-RAN [0.0] 次世代無線ネットワークは、異なるネットワーク目標を同時に最適化する、AI駆動の同時制御機能に依存することが期待されている。
これらの関数が相互作用すると、生のネットワークデータからのみ検出することが難しい方法で互いに干渉する可能性がある。
本稿では, ノイズの多い連続テレメトリをパラメータ・アクティビティと応答のバイナリ・インジケータに変換するために, イベント検出のステップに焦点をあてる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:50:39 GMT)
Entropy-Based Evaluation of AI Agents: A Lightweight Framework for Measuring Behavioral Patterns [0.0] 本稿では,AIエージェントのエントロピーに基づく評価を提案する。
インテリジェンスを最終タスク完了として扱うのではなく、EEAはエージェント決定プロセスの構造を研究する。
このフレームワークは、アクションエントロピー、軌道エントロピー、ツールエントロピー、情報ゲイン、探索効率、ロバストネスエントロピーを導入している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 08:46:43 GMT)
Enhancement of charge correlations and real-space topological marker on an interacting non-Hermitian Su-Schrieffer-Heeger model [0.0] 我々は、トポロジーと電荷順序の相互作用に着目し、相互作用する非エルミート的Su-Schrieffer-Heegerモデルについて検討する。
実空間トポロジカルマーカー、電荷相関、複素多体スペクトルを用いて、周期的および開境界条件下で位相図をマッピングする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:54:04 GMT)
Energy-Modulated Time-Asymmetric Spontaneous Collapse: Forward-Backward Dynamics from Stochastic Ito Reversal and Bright Solitons [0.0] 立方晶非線形シュロディンガー方程式(CQ-NLSE)の定式化における伊藤場反転から生じる対称性の破れと量子的不可逆性
時間反転はイオ構造と根本的に相容れないことが示され、2/3の普遍的非対称性結合パラメータが生じる。
非常に明るいソリトン溶液は、魅力的なLi-7原子の準1次元BECに対して、前方および後方の振幅比1.870で得られる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:47:59 GMT)
Emotion-Aware Image Generation from Korean Diary Text via LLM-based Prompt Translation and LoRA Fine-Tuning [0.0] 本稿では,韓国の短い日記記事から児童の手描きスタイルの画像を生成する感情認識型テキスト・画像パイプラインを提案する。
提案したパイプラインでは、短い日記からの暗黙の感情を認識するためにQwen3-8Bと、子供の描画画像にLoRAを微調整した安定拡散3.5Mediumを採用している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:56:36 GMT)
Effective Dimensionality as an Operator Invariant for Physics-Preserving Constraint Adaptation in Physics-Informed Neural Networks [0.0] 物理インフォームドニューラルネットワークは、共有パラメータ空間に依存するため、本質的にタスク干渉に悩まされる。
我々は、この構造的衝突をFisher Information Matrixを用いて分析し、有効自由度を定量化する。
この特徴に基づいて,境界適応のための部分空間投影戦略を導入する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 13:41:25 GMT)
Econstellar: An Open-Source AI-Augmented Research Engine for Computational Financial Econometrics [0.0] Econstellar(エコンステラー)は、公開研究エンジンで、通常のウェブブラウザから出版段階の金融エコノメトリを実行する。
結果の意味を説明するので、読者は単に発見を読み取るだけでなく、再実行し、入力を変更でき、どのように生成されたかを正確に追跡することができる。
人工知能アシスタントは、分析を選択して解釈するが、数値を発生させることはないので、それが報告する量はすべて、読者が再現できる真の計算である。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:56:04 GMT)
EML-CD: Causal Mechanism Recovery via EML Symbolic Trees in Structure Learning [0.0] 本稿では,演算子(単一バイナリ演算子から関数を構成することができる)を因果構造学習に統合するフレームワークを提案する。
-CDは、各エッジ機構をゲート二分木として表現し、クローズドフォーム因果方程式を自動的に発見する。
解析的ヤコビアンは出力方程式から直接計算することができ、因果効果の定量的理解を可能にする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:45:42 GMT)
Dynamic Coordination Strategy Selection for Enterprise Multi-Agent Systems [0.0] 本稿では,グローバルに固定されるのではなく,問題クラスによって協調戦略を動的に選択すべきかどうかを評価する。
1,440個の出力はすべて固定されたソンネットルーブリックによって判定される。
企業調整方針は、決定論的勝者選択法ではなく、動的ルーティングをデフォルトとして使用するべきであると結論付けている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:06:01 GMT)
Drag reduction or reward hacking? Recurrent multi-agent reinforcement learning that earns its reward [0.0] 強化学習エージェントは、設計者が意図した結果から逸脱できる報酬を最大化する。
大量保存プロジェクションはエージェントの出力を結合し、ポリシー勾配に必要なエージェント単位のクレジットを消去する。
メモリレスポリシでは、動作の遅いニアウォールサイクルを解決できません。
2つの退化制御器は、全散量の増加とともに大きなドラッグ低減を実現しているため、報告された図は、より無駄な流れを隠蔽することができる。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:36:14 GMT)
Double-bracket quantum algorithms for thermal state preparation [0.0] 二重ブラケット量子アルゴリズムを用いて、熱場二重状態に対する仮想時間進化を実装した。
ポリDB-TFDアルゴリズムの複雑さは、幅広い実用体制で指数関数的にスケールすることを示した。
これらの結果から,DB-TFDは短期および早期の耐食性体制における熱的状態形成の有望な経路として確立された。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:46:43 GMT)
Do Transformers Need Three Projections? Systematic Study of QKV Variants [0.0] Q-K=Vは、キーと値が同様の表現空間を占有し、注目が低ランクな状態で動作するため、品質を保っていることを示す。
提案手法は,投射共有を注目の重み付けの未探索例として体系的に特徴付ける。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:08:43 GMT)
Development of a Structured Approach for Establishing Mission Engineering Requirements [0.0] 顧客要求がない場合、ミッションの有効性を体系的に定義したり、近似したりするにはどうすればよいか?
ミッション意図をミッションコンテキスト、関数、制約、臨界次元、有効性属性、アーキテクチャ代替物に分解する構造的アプローチが提案されている。
結果として得られる方法は、Tier 1 と 2 の要件を導出するためのトレース可能な基盤を提供する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:28:12 GMT)
Design a Reliable LLM-Integrated Interface for Mortality Forecasting [0.0] 本稿では,統計的パワーを維持しつつユーザビリティを向上させるため,信頼性の高い大言語モデル(LLM)統合インターフェースを提案する。
正確性、ユーザビリティ、透明性を確保するために、3段階の方法論が採用されている。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:41:07 GMT)
Deep Learning-based 3D Oral Cavity Reconstruction Using 2D Intraoral Images [0.0] 本稿では,異なる角度から得られた10個の2次元口腔内画像を用いて,3次元口腔モデルを再構成するソフトウェアによるアプローチを提案する。
提案手法は、コストを低減し、物理走査装置の必要性をなくし、患者の不快を最小化し、自動3D再構築を可能にする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:44:04 GMT)
Decoder-Consistent Hamiltonians for POVM-Based Quantum Relaxations [0.0] QRAOのような圧縮に基づく量子緩和では、古典変数は量子ビットに符号化され、最適化後に復号される。
量子ハミルトニアンの選択は、この復号器によって決定される。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:27:20 GMT)
Dead Directions: Geometric Singular Learning [0.0] 特異学習理論と情報幾何学は、主に別々の語彙で同じパラメータ空間を研究してきた。
我々はそれらを1つのプリミティブ、デッド方向、すなわちフィッシャー計量が退化する単位ベクトルを通してブリッジする。
滑らかな繊維上の選択規則は、この速度を実対数正準しきい値に対する渡辺の単一方向寄与に変換する。
多層K-FAC分解は、各フィッシャーブロックをアクティベーションと勾配側率の積として記述する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:54:08 GMT)
DAS-PINNs for high-dimensional partial differential equations: extending deep adaptive sampling to spacetime domains [0.0] 局所的および動的に進化する解を持つ時間依存偏微分方程式(PDE)は、物理インフォームドニューラルネットワーク(PINN)に根本的な課題をもたらす
本研究では,PINNの適応的フレームワークを拡張し,時間と空間を明示的な時間マーキングを伴わずに統一されたドメインとして扱う。
正規化フローニューラルネットワークモデルは、PDE残差によって誘導される分布を効果的に学習し、解が最も学習しにくい領域に集中する新たなコロケーションポイントを生成する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 15:54:25 GMT)
Causal Atlases from Entropic Inference: Bayesian Networks beyond Optimal DAGs [0.0] エントロピーに基づく推論は、基礎となるデータに整合した妥当な因果関係のアトラスを生成する。
提案手法は,DAGの因果的アーティファクトが等価に正確なトポロジと一致しないことを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:41:32 GMT)
Catastrophic Forgetting as Accessibility Collapse: A Three-Level Framework for Knowledge Persistence in Continual Learning [0.0] 破滅的な忘れは、シーケンシャルラーニング中に獲得した知識の不可逆的消去と一般的に解釈される。
本研究では,タスク表現の完全破壊ではなく,情報保存へのアクセシビリティの欠如から,忘れることが生じる,という別の視点を考察する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 11:25:33 GMT)
CASS-RTL: Correctness-Aware Subspace Steering for RTL Generation with LLMs [0.0] 本研究は,LCMの正当性を考慮したコンポーネントの発見と活用を目的とした,一級フレームワークCASS-RTLを提案する。
We observed 10%-20% improve in pass@1/5/10 accuracy on VerilogEval and 5% improve on CVDP。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 04:02:51 GMT)
Broadband AC Magnetic Field Sensing via Continuous wave optically detected magnetic resonance with NV Centers in diamond [0.0] マイクロ波駆動型着衣状態を用いたNV中心を用いたCW-ODMRに基づく広帯域交流磁化法を提案する。
提案手法により,100MHzの周波数で交流磁界を検出することができることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 09:31:47 GMT)
Beyond Vector Similarity: A Structural Analysis of Graph-Augmented Retrieval for Industrial Knowledge Graphs [0.0] 航空サプライチェーンインテリジェンスのための8つの検索アーキテクチャを比較した。
10のカテゴリを対象とする23のクエリを評価し,5つのクエリクラスがベクトル検索に対して構造的に到達不能であることを示す。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 10:56:57 GMT)
Benchmarking Open-Source Layout Detection Models for Data Snapshot Extraction from Institutional Documents [0.0] テキストデータスナップショット抽出のためのベンチマークデータセットと評価フレームワークを提案する。
複数のオープンソースのレイアウト検出モデルをベンチマークし、検出性能と空間抽出品質を評価した。
これらの知見は、汎用文書レイアウト分析と運用上有用なデータスナップショット抽出の間に持続的なギャップを浮き彫りにする。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 14:47:40 GMT)
Benchmarking Floquet Master Equations for Periodically Driven Open Quantum Systems [0.0] 有限温度で共有オーミック貯水池に結合した2つの局所駆動スピンのモデルに対して、よく用いられるフロケマスター方程式の集合をベンチマークする。
各マスター方程式の精度は、その導出の根底にある仮定をよく反映している。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 16:13:51 GMT)
Auditing Demonstration Curation Metrics: Action-Only Scorers Fail on the Structural Defects That Degrade Imitation Policies [0.0] 模倣学習ポリシーは、訓練されたデモの品質を継承する。
キュレーションメトリクスの集合は、低品質のデモを自動的にスコアとフィルタリングすることを約束します。
デモの欠陥を既知の型で注入する制御されたテストベッドを構築します。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 02:07:27 GMT)
An Improved CNN-LSTM Based Intrusion Detection System for IoT Networks [0.0] 本稿では,多クラス分類,データセット統合,時間的特徴学習を組み合わせた改良型CNN-LSTMによる侵入検出モデルを提案する。
提案手法は,ネットワークトラフィックデータを用いて侵入検知タスクに基づいて評価し,約97%の精度を実現する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 07:04:57 GMT)
Agent-Orchestrated Adaptive RAG: A Comparative Study on Structured and Multi-Hop Retrieval [0.0] Retrieval-Augmented Generation (RAG) は、言語モデル(LLM)を拡張し、その応答を外部知識に基盤付ける。
本稿では,動的クエリ分解,反復検索,および有界自己回帰評価ループを導入したエージェントオーケストレーション適応型RAGフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 03:38:46 GMT)
A Komi-Yazva--Russian Parallel Corpus and Evaluation Protocol for Zero- and Few-Shot LLM Translation [0.0] 我々は,最初のコミヤズヴァ-ロシア並列コーパスを明示的な評価プロトコルとともに提示する。
データセットには、74の物語テキストから457の一致した文対が含まれている。
我々はこの設定を用いて、Komi-Yazva-to- Russian翻訳における近代的な大規模言語モデルの比較を行う。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 17:26:38 GMT)
A Conversational Framework for Human-Robot Collaborative Manipulation with Distributed Generative AI models [0.0] 本稿では,ロボット協調操作のための分散対話フレームワークを提案する。
ローカル言語とビジョン言語モデル(VLM)をロボットオペレーティングシステム2(ROS2)ベースの実行スタックに統合する。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 12:00:41 GMT)
A Class of Multipartite Entangled States Based on State Transitions [0.0] 遷移状態(T状態)を多部交絡状態のクラスとして導入する。
これらの状態は、特定の遷移数を持つ全ての状態に対して等振幅重ね合わせを形成する。
我々は、T 状態が、CX (control-X) 操作の連鎖を通して、Dicke 状態と一意に等しいことを証明した。
論文参考訳(メタデータ) (Thu, 04 Jun 2026 01:52:44 GMT)
公開日: 20260603 の論文要約
Agents' Last Exam [265.9] 本稿では,AIエージェントを長期的,経済的に価値のある実世界のタスクで評価するためのベンチマークであるエージェントのLast Exam(ALE)を紹介する。
ALEは250以上の業界の専門家と共同で開発され、O*NET / SOC 2018を参照して定義された非物理産業をカバーしている。
現在の結果は、最も硬い層が飽和していないことを示している:主流のハーネスとバックボーンの構成で、平均フルパスレートは2.6%である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:20:46 GMT)
Crafting Your Evolving Dreams: Concept-Incremental Versatile Customization [121.5] カスタム拡散モデル(CDM)は、パーソナライズされた概念を生成する能力のため、大きな関心を集めている。
本研究では,概念の多元的カスタマイズを可能にする新しいCCDM(Continuous Customizable Model Diffusion)を開発した。
概念無視の課題に対処するために,制御可能な地域文脈合成戦略を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:22:51 GMT)
Prioritization of Risks from Artificial Intelligence: A Delphi Study of 272 International Experts [115.3] 2025年末に272人の国際AI専門家を対象に行われた3ラウンドのDelphi研究の結果を報告する。
専門家は、リスクと重大さ、セクターとアクターの脆弱性、アクターの責任、全体的な懸念について、24のAIリスクを評価した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:14:41 GMT)
GRAIL: Generating Humanoid Loco-Manipulation from 3D Assets and Video Priors [113.7] GRAILは3Dアセット、シミュレーター対応シーン、およびビデオファンデーションモデル(VFM)の先行データで構成され、物理的環境を再構築したりロボットを遠隔操作したりすることなく対話を合成するデジタル生成パイプラインである。
GRAILは、オブジェクト形状、カメラパラメータ、メートル法スケール、環境深度、ロボットが提案する文字がビデオ生成の前に知られ、再構成中に再利用される、完全に定義された3D構成から始まる。
我々は、回復した動作をヒューマノイドロボットに再ターゲティングし、補完的なタスク・ジェネラル・モルフォロジー・トラッカーを訓練する。
GRAILは、ピックアップ、オブジェクト操作、着座にまたがる2万以上のシーケンスを生成する
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:57:45 GMT)
AlphaQ: Calibration-Free Bit Allocation for Mixture-of-Experts Quantization [104.1] 混合精度量子化は、異なるビット幅を異なる専門家に割り当てることで、フットプリントを大幅に削減することができる。
既存のアプローチは、専門家の重要度を推定し、ビット割り当てを決定するためにキャリブレーションデータに依存している。
我々は,MoE量子化のためのキャリブレーションフリーなビット割り当て手法であるAlphaQを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:03:18 GMT)
LeanMarathon: Toward Reliable AI Co-Mathematicians through Long-Horizon Lean Autoformalization [104.1] 信頼性の高い研究レベルのLean AutoformalizationのためのマルチエージェントハーネスであるLeanMarathonを紹介します。
4つのコントラクトスコープエージェントがこの青写真を構築し、監査し、証明し、修復する。
我々は4つのErds問題にまたがる最近の2つの研究論文でLeanMarathonを評価した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:09:39 GMT)
Audio Interaction Model [102.4] 今日のLALM(Large Audio Language Models)はオフラインであり、ストリーミングオーディオモデルはASRや音声チャットのような単一のタスクのみを処理する。
それは、常時オンの知覚・認知応答ループを通じて、音、環境、指示をリアルタイムで聞き、リアルタイムで反応するモデルである。
我々は,この仕組みをオーディオインタラクションモデルとして定式化し,オフラインタスクの実行を継続する統合ストリーミングモデルであるAudio-Interactionで実現した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:26:11 GMT)
Towards Accurate Model Selection in Deep Unsupervised Domain Adaptation [86.2] 深層非教師付きドメイン適応(Deep UDA)メソッドは、ソースドメイン内のリッチなラベル付きデータを利用して、ターゲットドメイン内の関連するがラベルなしデータのパフォーマンスを高める。
Deep UDAの既存のモデル選択方法は、非常に偏りがあり、制限され、不安定で、あるいは議論の余地さえある(ラベル付きターゲットデータを要求する)。
適応された特徴表現を検証手順に組み込んだtextitDeep Embedded Validation (textbfDEV) を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:45:01 GMT)
LEAP: Supercharging LLMs for Formal Mathematics with Agentic Frameworks [85.9] 大規模言語モデル(LLM)は、強力な非公式な数学的推論を示すが、リーンのような形式言語で検証可能な証明を生成するのに苦労している。
本稿では,汎用基礎モデルによる自動形式定理証明の最先端性能を実現するためのエージェントフレームワークであるLEAPを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:16:05 GMT)
Stateful Visual Encoders for Vision-Language Models [85.8] 視覚言語モデル(VLM)は、意思決定が視覚的変化に依存するマルチイメージ、マルチターンエージェント設定において、ますます使われている。
既存のオープンウェイトなVLMでは、ビジュアル比較は言語モデル内でのみ行われ、ビジュアルエンコーダ自体はステートレスのままである。
我々は、先行する視覚的特徴に対して各視覚的表現を条件付けるステートフルビジュアルを導入する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:31:15 GMT)
AutoLab: Can Frontier Models Solve Long-Horizon Auto Research and Engineering Tasks? [84.5] 我々は超長距離閉ループ最適化のための新しいベンチマークであるAutoLabを紹介する。
AutoLabは4つの異なるドメインにまたがる36の現実的で専門家によるタスクで構成されている。
我々は、真に有能な長距離エージェントに向けた研究を加速するために、全ベンチマーク、評価ハーネス、タスクアーティファクトをオープンソース化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:36:54 GMT)
Scene-Centric Unsupervised Video Panoptic Segmentation [83.0] ビデオパノプティクスセグメンテーション(VPS)は、ビデオを意味的に一貫した領域に分割しながら、すべてのオブジェクトを共同で検出、分割、追跡することを目的としている。
我々は、最初の教師なしVPSアプローチであるVideoCUPSを提案する。
VideoCUPSは、監督されていない深さ、動き、視覚的手がかりを利用して、シーン中心のビデオから時間的に一貫したパノラマビデオ擬似ラベルを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:19:55 GMT)
MeshFlow: Efficient Artistic Mesh Generation via MeshVAE and Flow-based Diffusion Transformer [82.3] MeshFlowは、アーティストのような3Dメッシュを生成する新しい方法だ。
我々のモデルは最速のARジェネレータより18倍速くメッシュを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:57:15 GMT)
Dual-Stream MLP is All You Need for CTR Prediction [81.9] クリックスルー率(CTR)の予測は、オンライン広告とレコメンデーションシステムにおいて重要な役割を担い、小さな改善でも収益を大幅に増やすことができる。
既存の研究は主に、明示的かつ暗黙的な視点から効果的な複雑な機能相互作用を捉えるために、デュアルストリームアーキテクチャの設計に焦点を当てている。
これらのアプローチは,1) 計算要求と過度に適合するリスクを増大させる機能相互作用学習の複雑さと,2) モジュールの出力が最終予測を支配できる明示的モジュールと暗黙的モジュールのバランスの2つの大きな課題に直面する。
我々は,CTR予測タスクのための新しい機能相互作用フレームワークであるDual-Stream (DSMLP)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:34:32 GMT)
The Meta-Agent Challenge: Are Current Agents Capable of Autonomous Agent Development? [80.2] 本稿では,自律エージェント開発のためのフロンティアモデルのキャパシティをテストするための評価フレームワークであるMeta-Agent Challenge(MAC)を紹介する。
評価の整合性を確保するため、このフレームワークは報奨ハッキングに対する多層防御によって確保される。
メタエージェントは人間工学的な基本方針とほとんど一致せず、その一部はプロプライエタリなフロンティアモデルに支配されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:58:17 GMT)
Towards Pretraining Text Encoders for TabPFN [78.6] TabPFNのようなタブラル基礎モデルは、数値データと分類データを持つデータセット上で強力なパフォーマンスを達成する。
TabPFN Text Adapter (text-to-TFM token projection) を導入する。
この設計はPCAのボトルネックを排除し、TabPFNの数値的な強みを保ち、エンドツーエンドのテキストタブラルパイプラインよりも訓練が効率的である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:38:47 GMT)
Representation Forcing for Bottleneck-Free Unified Multimodal Models [77.0] 統一マルチモーダルモデル(UMM)は、単一モデルにおける知覚と生成を扱うことを目的としている。
既存のUMMは、画像生成のために別々に訓練された凍結したVAEに依存しており、構造的なボトルネックを示唆している。
本稿では,表現予測をモデルのネイティブ機能にすることで,このギャップを埋める手法であるRepresentation Forcing(RF)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:27:19 GMT)
PhyScene3D: Physically Consistent Interactive 3D Tabletop Scene Generation [75.9] 3Dテーブルトップシーンの生成は、インタラクティブでジェネラリスト的なロボット学習の基本的な問題である。
本稿では,PhyScene3Dについて紹介する。
実験により、PhyScene3Dは意味的精度と物理的妥当性の両方において最先端のアプローチより優れていることが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:26:24 GMT)
TIDE: Proactive Multi-Problem Discovery via Template-Guided Iteration [75.0] 2つの補完機構を備えたテンプレート誘導反復フレームワークであるTIDEを紹介する。
我々は,すでに発見されているものを条件付けながら,ラウンド毎に少数の候補を探索する反復探索を提案する。
単一ショットと並列マルチエージェントのベースラインをタスクカバレッジ,識別,解像度で比較すると,大幅に向上した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:23:08 GMT)
Towards Verifiable Multimodal Deep Research: A Multi-Agent Harness for Interleaved Report Generation [74.1] レポート生成のためのマルチエージェントハーネスであるPtahを提案する。
Ptahは計画、研究、執筆段階を通じて、ユーザクエリからレンダリングされたWebレポートまでのライフサイクルを編成する。
検証エージェントがハーネスの受け入れ機能として機能し、ワークフロー全体を通して事実的接地、引用の忠実性、相互の整合性を強制する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:03:26 GMT)
COMBINER: Composed Image Retrieval Guided by Attribute-based Neighbor Relations [73.4] By attrIbute-based NEighbor Relations (COMBINER) によるCOMposed画像検索ネットワークについて紹介する。
具体的には,まずアダプティブ・セマンティック・ディスタングルメント・モジュールを設計する。
次に, クロスモーダルな統一プロトタイプを構築可能なUnified Prototypeベースのコンポジションモジュールを提案する。
最後にDual Relations Modelingモジュールを導入し、属性の類似性に基づいてペアと隣り合う関係をマイニングする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:43:51 GMT)
Z-FLoc: Zero-Shot Floorplan Localization via Geometric Primitives [72.6] そこで本研究では,ゼロショットフロアプランのローカライズ手法を提案する。
我々の重要な洞察は、支配的な幾何学的プリミティブが人間が作った環境でユビキタスであることである。
シミュレーションと実世界の両方のデータセットの実験により、我々のアプローチは、目に見えない環境における最先端の学習ベースの手法よりも優れています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:14:24 GMT)
Evaluating Large Language Models in Dynamic Clinical Decision-Making with Standardized Patient Cases [71.1] MedSP1000 (MedSP1000) は、SP由来の臨床エージェント評価のための対話型ベンチマークである。
ピアレビューされたSPの授業ケースを、定義されたSPケーススクリプト、臨床環境コンテキスト、人為的な構造化ルーブリックで実行可能なシナリオに変換する。
MedSP1000を多種多様な汎用および医療用LLMに適用すると、静的ベンチマークの性能がそのような教育シナリオに確実に変換されないことが分かる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:17:16 GMT)
Measurement-induced state transitions in multi-qubit transmon processors [70.4] 回路QEDにおけるトランモン量子ビットの分散読み出しは、小さな測定駆動振幅で量子非劣化特性を失うことが知られている。
我々は、キュービットやカプラなどの他の成分の存在が、測定されたトランスモンのMIST閾値に影響を及ぼすことを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:30:38 GMT)
Scaling Self-Evolving Agents via Parametric Memory [70.0] 既存のメモリ拡張LDMエージェントは、過去の経験をプロンプト空間にのみ保存する。
自己進化型パラメトリックメモリフレームワークである textttTMEM を導入する。
textttTMEMは、様々なモデルスケールで要約ベースのベースラインと検索ベースのベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:18:31 GMT)
Entropy Is Not Enough: Unlocking Effective Reinforcement Learning for Visual Reasoning via Vision-Anchored Token Selection [68.2] VEPO(Vision-Entropy token-selection for Policy Optimization)は,視覚感度とトークンエントロピーを明示的に統合した効果的なRLフレームワークである。
実験の結果,VEPOの先行性能は7Bスケールで2.28点,3Bスケールで3.15点,エントロピーのみのベースラインを著しく上回った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:57:29 GMT)
Imagine Before You Draw: Visual Prompt Engineering for Image Generation [67.8] 内部フレームワークにシームレスに統合可能なVisual Prompt Engineering (VPE)を提案する。
我々は,クラス条件生成,テキスト・ツー・イメージ生成,画像編集にまたがってVPEを検証する。
その結果, VPEはコンバージェンスを加速し, 天井の質を高め, 内部統合により, 編集保存性を大幅に向上することがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:01:36 GMT)
Harnessing Generalist Agents for Contextualized Time Series [67.3] 時系列はしばしば、全体モデリングに不可欠なリッチな文脈に埋め込まれる。
本稿では時系列のエージェントハーネスフレームワークであるTimeClawを紹介する。
TimeClawは、グラウンドドと監査可能な分析のための実行可能な時間的ツール、再利用可能な分析ルーチンを作成するためのエクスペリエンス駆動機能進化、関連する推論トレースを取得するためのエピソードマルチモーダルメモリを統合している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:20:34 GMT)
AAD-1: Asymmetric Adversarial Distillation for One-Step Autoregressive Video Generation [66.6] AAD-1は、一段階の自己回帰画像-ビデオ生成のための非対称な対数蒸留フレームワークである。
AAD-1は1ステップの自己回帰ビデオ生成において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:26:01 GMT)
CyberGym-E2E: Scalable Real-World Benchmark for AI Agents' End-to-End Cybersecurity Capabilities [66.5] CyberGym-E2Eは大規模かつ現実的なエンドツーエンドのサイバーセキュリティベンチマークである。
脆弱性発見、PoC生成、パッチ生成の全ライフサイクルにわたって、AIエージェントの能力を包括的に評価する。
ベンチマークは、139の異なるオープンソースプロジェクトで920の現実世界の脆弱性で構成されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:06:37 GMT)
Brick-Composer: Using MLLMs for Assembly with Diverse Bricks [64.5] ブロック組立に必要な視覚的接地と空間的推論能力を有する多モーダル大言語モデル(MLLM)について検討した。
BC-Benchは,多様なブロックを持つアセンブリ上でMLLMを評価するための最初のベンチマークである。
Brick-ComposerはMLLMに3つの補完信号による組立スキルを組み込む学習フレームワークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:08:06 GMT)
GAPD: Gold-Action Policy Distillation for Agentic Reinforcement Learning in Knowledge Base Question Answering [64.2] 結果に基づくRLに高密度トークンレベルガイダンスを付加する訓練時間金反応政策蒸留フレームワークを提案する。
GAPDはWebQSP、GrailQA、GraphQの最先端技術に一貫して勝っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:07:10 GMT)
Step-by-Step Optimization-like Reasoning in LLMs over Expanding Search Spaces [63.8] OPT*は、LLMのステップバイステップ最適化のような推論を訓練し評価するための最適化スタイルのタスクのファミリーである。
各タスクは実現可能性チェッカーと評価器を提供し、一方、複雑性パラメータは新しい人間ラベルを必要とせずに検索スペースを拡大する。
OPT*のトレーニングは、ステップバイステップの最適化のような推論を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:43:38 GMT)
DLLG: Dynamic Logit-Level Gating of LLM Experts [63.3] 本稿では,トークンレベルのエキスパート融合を疎応答レベルの監視から学習する動的ロジットレベルのアンサンブルフレームワークを提案する。
軽量ゲーティングモジュールは、トークンレベルのラベルや専門家の再訓練なしで、軌道レベルの正確さを生成物にリンクすることで、ステップワイズ融合重量を予測する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:51:56 GMT)
Knowledge Index of Noah's Ark [63.1] KINAは,261分野にわたる899項目のベンチマークである。
ボーナス・オン・バートーナメントがFOSDを弱く支配していることを示す。
トップモデルであるGemini-3.1-Pro-Previewは53.17%、Claude-Opus-4.6は49.92%、GPT-5.4は48.55%に達した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:06:49 GMT)
Imaginative Perception Tokens Enhance Spatial Reasoning in Multimodal Language Models [61.9] 視覚言語モデル(VLM)は多くのタスクで優れるが、重要な情報が直接観測できない場合、空間的推論に苦慮する。
Inaginative Perception Tokens (IPT) は、VLMが知覚する空間構成を外部化する中間的知覚表現である。
IPTの監督は、空間的推論を一貫して改善し、しばしば思考訓練のテキスト連鎖よりも優れる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:16:22 GMT)
Personal AI Agent for Camera Roll VQA [61.3] パーソナルカメラロールの視覚的質問応答設定について検討する。
この設定では、会話型AIアシスタントがユーザのパーソナルカメラロールにアクセスし、関連する写真を検索してクエリに応答することができる。
これをサポートするために、現実世界の使用を模倣する質問を収集し、手動で注釈付けする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:59:30 GMT)
Echo-Infinity: Learning Evolving Memory for Real-Time Infinite Video Generation [59.0] 本稿では,リアルタイム無限ビデオ生成に向けた自動回帰(AR)フレームワークであるEcho Infinityを紹介する。
学習可能な進化可能なメモリを使用して、任意の長さの履歴を動的にフィルタリングし、抽象化し、圧縮する。
最先端のパフォーマンスを実現し、私たちの知る限り、24時間(>1.3M)のリアルタイムロールアウトを初めて実現しています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:09:01 GMT)
MorphoQuant: Modality-Aware Quantization for Omni-modal Large Language Models [57.9] 本稿では,モダリティを考慮したPTQフレームワークを提案する。
Distribution-Aware Bias Compensation (DABC) は、長い尾の外れ値からチャネルのバイアスを選択的に吸収する。
また,量子化格子をバイアスマスクと共最適化するために,MDQFO (Morphology-Directed Quantization Function Optimization) を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:05:10 GMT)
Multilingual Long-Form Speech Instruction Following: KIT's Submission to IWSLT 2026 [57.5] 我々は、制約のない環境で、KITのLong and Short Instruction followingのトラックを提示する。
提案手法では,短文コーパスを長文学習データに変換する汎用データ拡張パイプラインを組み合わせる。
確率に基づく再ランク付けは、ASRには非常に有効であるが、意味的タスクを体系的に劣化させることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:13:37 GMT)
VASO: Formally Verifiable Self-Evolving Skills for Physical AI Agents [57.2] 本稿では,ロボットスキルコントラクトの検証誘導自己進化のためのフレームワークであるVASOを紹介する。
VASOは論理的に一貫性のないスキル契約を検証し、グローバルおよびローカルな時間的仕様に対してスキルによって誘発される計画を検証する。
Clearpath Jackal と PX4 のクアッドコプタータスクでは、VASO は100点未満の最適化サンプルを使用して97.2% の形式的な仕様準拠に達した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:02:35 GMT)
Dream.exe: Can Video Generation Models Dream Executable Robot Manipulation? [57.2] 本稿では,ロボット操作を具体的かつ測定可能な窓として提案する。
私たちは、この基準をビデオから実行パイプラインを通じて運用する評価フレームワークDream.exeを紹介します。
我々は、フロンティアのクローズドソースジェネレータ、オープンソースジェネレータ、ロボット固有のモデルにまたがる8つのモデルを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:35:35 GMT)
LimiX-2M: Mitigating Low-Rank Collapse and Attention Bottlenecks in Tabular Foundation Models [57.0] タブラル基礎モデル(TFM)は木アンサンブルと競合する傾向にあるが、その性能は計算非効率である。
本稿では,強力なTFMを実現するための統一的なEmphtokenize-and-routeフレームワークを提案する。
その結果、TFMにおける精度-効率トレードオフを改善するキーレバーとして、バリューアウェアトークン化とリードアウト整合ルーティングが強調された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:07:33 GMT)
Boosting Self-Consistency with Ranking [56.4] 自己整合性は、複数の推論パスをサンプリングし、最も頻繁な回答を選択することで、大きな言語モデルを改善する。
この制限は、自己整合性における解答選択をランク付け問題として再構成する、ランク付け改善自己整合性(RISC)に対処する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:12:30 GMT)
Selective Coupling of Decoupled Informative Regions: Masked Attention Alignment for Data-Free Quantization of Vision Transformers [56.4] Data-Free Quantization (DFQ)は、サンプルを合成することで、実際のデータにアクセスすることなく、データセキュリティ上の問題に対処する。
従来の DFQ Arts for Vision Transformers (ViTs) は、しばしば、合成サンプルと量子化モデルQで期待される入力分布の分布ミスマッチに悩まされる。
本研究では,データ自由量子化のためのMaskAQという新しいMasked Attention Alignmentアプローチを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:38:19 GMT)
Converted, Not Equivalent: Benchmarking Codebase Conversion via Observational Equivalence [56.3] コーディングエージェントは、しばしば自身のローカル検証ルーチンを過度に信頼し、表面チェックを満たすアーティファクトの成功を宣言する。
この問題は、事前評価が結果駆動である変換において特に深刻である。
ブラインド・コンバージョンは26.7-28.9%に達し、スペック・パスレートは91.1%まで上昇した。
このことは、失敗は限られた予算やバックボーンの強さよりも、契約ミスによる自己検証に起因していることを示唆している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:44:55 GMT)
P$^2$-DPO: Grounding Hallucination in Perceptual Processing via Calibration Direct Preference Optimization [55.7] 幻覚は近年、LVLM(Large Vision-Language Models)において大きな研究の注目を集めている。
直接選好最適化(DPO)は、人間が提供した修正選好から直接学習することを目的としている。
既存の選好ペアは視覚に依存しないことが多く、その本質的に非政治的な性質は、モデル学習を導く上での有効性を制限している。
本稿では、モデルが独自の選好ペアから生成し学習する新しい訓練パラダイムである知覚処理直接選好最適化(P$2$-DPO)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:21:53 GMT)
Not What, But How: A Framework for Auditing LLM Responses across Positioning, Generalization, Anthromorphism, and Maxims [54.3] 大規模言語モデル(LLM)は、主観的、情報探索的な疑問に答えるためにますます使われている。
既存の主観的文化的クエリの評価は、応答のフレーム化を無視して、事実の正しさに重点を置いている。
FRANZ(FRAmework for respoNse characteriZation)を導入し、4次元のLLM応答のコミュニケーション監査を行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:01:25 GMT)
MIRAGE: Mobile Agents with Implicit Reasoning and Generative World Models [53.1] 可視テキスト推論トレースから連続潜時推論表現を学習するフレームワークであるMIRAGEを紹介する。
AndroidWorldでは、MIRAGEは4Bアブレーションで監督された微調整を3~5倍の低い復号化予算と一致している。
AndroidControlでは、75%以上のトークンを生成しながらアクショングラウンドを改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:01:24 GMT)
MeshWeaver: Sparse-Voxel-Guided Surface Weaving for Autoregressive Mesh Generation [53.1] MeshWeaverは、メッシュ生成を表面織布プロセスとして扱う自動回帰フレームワークである。
MeshWeaverは18%の最先端圧縮比を実現し、最大16K面のメッシュを生成することができ、以前のアプローチよりも幾何的忠実性を大幅に向上する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:15:43 GMT)
VideoKR: Towards Knowledge- and Reasoning-Intensive Video Understanding [52.9] ビデオ理解を強化するために設計された,最初の大規模トレーニングコーパスであるVideoKRを紹介する。
VideoKRは、新しく収集されたCCライセンスのエキスパートドメインビデオ145K以上の315Kビデオ推論例で構成されている。
我々は、より深い動画推論機能をターゲットにした、ループ内のヒューマン・イン・ザ・ループ・スキル指向のサンプル生成パイプラインを開発した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:14:20 GMT)
Deliberate Evolution: Agentic Reasoning for Sample-Efficient Symbolic Regression with LLMs [52.9] Deliberate Evolution (DE) は、検索制御からシンボル生成を分離するエージェントフレームワークである。
LLM-SRBenchの実験では、DEMは様々な科学領域でLLMベースのSRベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:22:16 GMT)
Video2LoRA: Parametric Video Internalization for Vision-Language Models [52.5] Video2LoRAはパラメトリックビデオ内部化の手法である。
知覚者ハイパーネットワークは、層ごとに生成された中間表現を読み出し、凍結されたVLMがビデオをエンコードする。
通常のLoRAの微調整とは違い、ビデオ2LoRAは動画から直接重みを予測します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:07:35 GMT)
Do Models Share Safety Representations? Cross-Model Steering for Safe Visual Generation [52.1] クロスモデル安全ステアリングのための最初のフレームワークを紹介する。
私たちのパイプラインは、ターゲット側の安全でないデータにアクセスしません。
多様なソース・ターゲット・モデル・ペア間のテキスト・ツー・イメージとテキスト・ツー・ビデオ生成におけるアプローチを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:04 GMT)
VISTA: Vision-Grounded and Physics-Validated Adaptation of UMI data for VLA Training [52.1] Universal Manipulation Interface (UMI)は、ハードウェア固有の遠隔操作なしでスケーラブルな実世界のロボットデータ収集を可能にする。
VISTAは、この2つのギャップを3つの相乗的コンポーネントを通して橋渡しするフレームワークである。
我々は,物理検証パイプライン,UMI-VQA,検証された軌道データ,コミュニティのための事前学習モデルをリリースする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:38:45 GMT)
AnchorMoE: Interpretable Time Series Classification via Anchor-Routed MoE [52.0] AnchorMoEは、解釈可能な構成別分類フレームワークである。
ローカルパッチのマルチビュー表現をエンコードし、専門の専門家にルーティングする。
実世界のベンチマークと合成ベンチマークの実験は、AnchorMoEが非常に競争力のある分類性能を達成することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:29:07 GMT)
Plan First, Judge Later, Run Better: A DMAIC-Inspired Agentic System for Industrial Anomaly Detection [51.9] 本稿では, DMAIC-IAD (DMAIC-inspired Agentic Industrial Anomaly Detection) というマルチエージェントシステムを提案する。
DMAIC-IADは,適用対象のエージェントベースラインに対する平均検出性能を37.76%向上させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:38:14 GMT)
From Attack Simulation to SIEM Rule: Deterministic Detection-as-Code Synthesis with Probe-Level Traceability [51.6] セキュリティチームは、自身のシステムに対する攻撃をシミュレートして、監視が真の侵入者を捕まえるかどうかをチェックする。
人間はそのギャップを手でブリッジし、それぞれの発見を読み、対応するシグマルールを書きます。
ロックされたコーパスからプローブが引き出されると,この変換が部分的に自動化されることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:26:25 GMT)
No More K-means: Single-Stage Sparse Coding for Efficient Multi-Vector Retrieval [51.4] SSR(Single-stage Sparse Retrieval)は、高価なクラスタリングを効率的なスパースコーディングに置き換えるパラダイムシフトである。
ColBERTv2と比較してインデックス処理時間を15倍短縮し、検索レイテンシを半減させ、同時に検索性能を向上させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:02:09 GMT)
Minimizing the Hidden Cost of Scales: Graph-Guided Ultra-Low-Bit Quantization for Large Language Models [50.2] 学習後量子化(PTQ)は,大規模言語モデル(LLM)の効率的な展開に重要である
隠れスケーリングコストを最小限に抑えるLLMのための超低ビット量子化フレームワークであるSAGE-PTQを提案する。
LLaMA-3B では、SAGE-PTQ は BiLLM の 55.8 と比較して 6.74 WikiText2 のパープレキシティを実現している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:51:52 GMT)
'Your AI Text is not Mine': Redefining and Evaluating AI-generated Text Detection under Realistic Assumptions [50.1] 我々は,AI生成テキストのさまざまな概念とその特徴を体系的に定義する。
AITDNAは人間と機械が共同で構築したテキストの新しいベンチマークである。
我々は、様々な機械生成テキスト検出器をベンチマークし、それらが特定の概念に対してのみうまく機能するが、広義の検出器として機能しないことが多いことを発見した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:05:14 GMT)
Reconciling Causality and Non-Equilibrium Thermodynamics with Hamiltonian Causal Models [50.1] 本稿では、観測変数が局所環境と相互作用する軌道レベルのフレームワークであるハミルトン因果モデル(HCM)を紹介する。
HCMは、不変運動方程式を相互作用可能な機構から分離し、因果効果を干渉経路法則の相違として定義する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:43:46 GMT)
Simulate, Reason, Decide: Scientific Reasoning with LLMs for Simulation-Driven Decision Making [50.1] MechSimは、実行可能な科学シミュレーターのためのメカニズム基底の神経象徴的推論フレームワークである。
我々のフレームワークは、仮定、変数、メカニズムの依存関係、実行トレースをキャプチャする共有構造化スキーマを通してシミュレータを表現する。
提案手法は,複数のハイテイク領域にまたがって評価され,メカニズムレベルの説明品質,シミュレータ解析,下流意思決定の信頼性が向上することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:36:51 GMT)
MetaPoint: Unlocking Precise Spatial Control in Agentic Visual Generation [50.0] 連続した2次元座標を1つの特別なトークンとして表現することでギャップを埋める方法であるMetaPointを紹介する。
空間制御のためのシンプルで正確でスケーラブルなビルディングブロックを提供することで、MetaPointはより強力な合成生成エージェントを解放する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:58:56 GMT)
Why Muon Outperforms Adam: A Curvature Perspective [49.9] Muonは、大規模な言語モデルトレーニングにおいて、Adamよりもトレーニング効率を約2倍改善する。
私たちの研究は、Adamに対するMuonの優位性を曲率の観点から軽視する第一歩を踏み出します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:40:30 GMT)
Plan, Watch, Recover: A Benchmark and Architectures for Proactive Procedural Assistance [49.5] textbfEgoProactiveは、OOP(Out-of-Plan)アノテーションとリカバリ手順によるプロシージャアシストのためのウェアラブル中心のデータセットです。
本稿では、手続き状態、視覚的手がかり、リカバリインジェクションに特化して、textbfdecoupled Planner-interaction Architectureを提案する。
広範囲な実験において、Llama-4システムは、強力なプロプライエタリベースラインよりも客観的介入品質を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:52:03 GMT)
FLAGG: Flexible Autoregressive Graph Generation [49.3] Deep Graph Generationのパノラマは、ワンショットモデルとシーケンシャルモデルという2つの極端に広がっている。
本稿では,1ショットモデルでグラフの一部を逐次生成するFLAGGフレームワークを提案する。
本手法は, サンプリング品質において, 単発ベースラインと自己回帰ベースラインの両方に優れることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:29:15 GMT)
HORIZON: Recoverability-Governed Curriculum for Physical-Domain Scaling [48.9] 我々は、政策がより難しい物理の恩恵を受けることができるかを検討し、回復可能性について、オン・ポリティカル・ドメイン・スケーリングにおける中心的な制約として認識する。
政治訓練において、新しい力学は、現在の政策に十分近いままで、政治上の修正的なデータを生成するためだけに有用である。
本稿では,現在の方針の回復可能な境界内でのみ,物理的な領域を拡張するチェックポイント付きフロンティアカリキュラムであるHoriZONを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:50:02 GMT)
DAR: Deontic Reasoning with Agentic Harnesses [48.8] 本稿では,DAR(Deontic Agentic Reasoning)について紹介する。
我々はDARをDeonticBenchのハードサブセット上で複数のハーネスで評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:29:38 GMT)
ComplexityMT: Benchmarking the Interaction Between Text Complexity and Machine Translation [48.1] テキストの複雑さと機械翻訳が相互にどのように相互作用し、影響を及ぼすかを評価するための新しい課題である ComplexityMT を紹介する。
我々は,3つのオープンウェイトモデル,1つのクローズドモデル,および2つのタスクに対する商用機械翻訳システムを評価する。
実験の結果,CEFRレベルが高いほどテキストの翻訳が難しくなり,機械翻訳によってターゲットテキストのCEFRレベルが元のソースと比較されることがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:38:37 GMT)
MAD: Mapping-Aware World Models for Agile Quadrotor Flight [47.5] マッピング・アウェア・ドリーマー(英: Mapping-Aware Dreamer、MAD)は、視覚に基づく四面体飛行のための幾何学的世界モデルである。
MADは、ロボセントリックな占有率と可視性グリッドマップを再構成する反復潜時ダイナミクスを学習する。
室内・屋外での安全な飛行を限定センシングで実証し,シミュレーションで9.66m/s,実世界の森林実験で5.05m/sに達した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:17:57 GMT)
LifeSide: Benchmarking Agents as Lifelong Digital Companions [47.4] ベンチマークはマルチセッションのtextitMemory-Emotion-Environmentループを中心としたベンチマークである。
階層化されたプロファイルとイベントトラジェクトリを持つ永続的な世界としてユーザをモデル化することで、ベンチマークはマルチエージェントシミュレーションを使用して、環境ダイナミクスを対話に投影する。
現在のメモリベンチマークを飽和させるモデルでさえ、正確なユーザ理解と真の相性を維持することができず、長い地平線上での真の相性を維持することができません。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:37:25 GMT)
SCI-PRM: A Tool Aware Process Reward Model for Scientific Reasoning Verification [47.2] そこで我々は、Chain-of-Toolトラジェクトリを特徴とする大規模データセットを構築し、科学的ツールの実行による推論を明確にインターリーブする。
次に、Sci-PRMと呼ばれる効率的な報酬モデルをトレーニングし、ツールの選択、実行精度、結果解釈を1つの推論の各ステップで詳細に監視する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:13:27 GMT)
A Pathology Foundation Model for Gastric Cancer with Real-World Validation [47.2] 本稿では,実世界評価と臨床dEcision支援のための,胃科固有の基礎モデルであるGRACEについて述べる。
GRACEは, 症例37,493例のHE-stained whole-slide画像を中心に, 48,364例の多施設で開発された。
高齢の病理医に非劣性パフォーマンスを維持するように調整された場合、AI支援のワークフローは萎縮の60.7%、腸転移の82.7%をトリアージする可能性がある。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:18:06 GMT)
Multi-SPIN: Multi-Access Speculative Inference for Cooperative Token Generation at the Edge [47.1] 大規模言語モデル(LLM)を高速化する効率的なアーキテクチャとして、投機的推論を導入する。
本研究では,マルチユーザエッジシステムにおける協調トークン生成を実現するための分散配置を提案する。
分解法の開発により、複雑な最適化をトラクタブルなサブプロブレムに還元する。
分析の結果、最適な帯域割り当ては、より弱い計算/通信能力を持つユーザを補うことがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:16:14 GMT)
STRIDE: Training Data Attribution via Sparse Recovery from Subset Perturbations [47.0] トレーニングデータ属性(Training Data Attribution)は、モデルの予測をトレーニングデータに遡る。
ほとんどのアプローチでは、勾配を使ってパラメータ空間でこの効果を近似する。
活性化空間におけるトレーニングデータの機能的効果をモデル化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:59:36 GMT)
Circuit-Level Noise Estimation via Shuttling in Plaquette Circuits [46.3] 2つのシンドローム量子ビット構成を用いた表面コードプラケット実験の開発と実行を行う。
アプローチを検証するため,イオントラップ(IonQ Aria1)ネイティブゲートセットにプラケットをコンパイルし,ハードウェア対応の書き換えテンプレートを適用した。
単発プラケット計測結果から回路レベルのノイズ率を推定する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:02:32 GMT)
Learning-Augmented Online Minimization with Dual Predictions [46.1] 本稿では,オンライン問題の一般的なクラスとして,計量的タスクシステムと層集合被覆という2つの学習強化アルゴリズムを提案する。
両アルゴリズムは、線形プログラムに対する最適解の機械学習予測を用いて、理論的保証を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:29:31 GMT)
Recovering Physically Plausible Human-Object Interactions from Monocular Videos [45.8] RePHO(RePHO)は、モノクロビデオから物理的に可塑性な人間と物体の相互作用(HOI)を再構築する手法である。
キネマティックな見積もりから始まり、強化学習(RL)による政策の訓練によってそれを洗練する。
キネマティックな推定は一般的にノイズが多いため、単純RLトレーニングは失敗する可能性があるため、二重自己更新機構を備えた適応サンプリング戦略を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:02:48 GMT)
M3imic: Learning a Versatile Whole-Body Controller for Multimodal Motion Mimicking [45.6] Multi-Modal Mimicはヒューマノイドロボットのための汎用的な全身制御フレームワークである。
ロボットの関節角度、人間のポーズ軌跡、エンドエフェクターのポーズなど、異種動作参照モードを統一する。
モダリティ特異的なリトレーニングを伴わない、複数の運動基準モード間のシミュレート・トゥ・リアル転送を実現する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:52:37 GMT)
Impostor: An Agent-Curated Benchmark for Realistic AIGC Manipulation Localization [45.5] 高品質なAI編集画像操作ローカライゼーションデータセットであるImpostorを紹介した。
Impostorは、シーン認識、編集計画、操作実行、品質検証、反復リフレクションを統合するクローズドループエージェントフレームワークであるCraftAgentによって構築されている。
本研究では,局所的な位相モデリングと意味論的整合性学習を導入し,意味論的に検証可能なが法学的に乱された領域をよりよくローカライズする意味情報ネットワーク(PANet)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:27:45 GMT)
BiNSGPS: Geometry Problem Solving via Bidirectional Neuro-Symbolic Interaction [45.3] BiNSGPSはMLLMアドバイザとソルバ間の双方向神経・シンボリック相互作用を確立するフレームワークである。
MLLMアドバイザはシンボルソルバからのフィードバックを積極的に取り入れ、一貫性のない形式表現を動的に修正する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:18:37 GMT)
Robust Scene Transfer for PointGoal Navigation via Privileged Sensor Guided Contrastive Learning [45.2] PointGoalナビゲーションにおける視覚表現学習のためのセンサ誘導適応型コントラスト学習フレームワークを提案する。
トレーニング中、特権付きLiDARセンシングは、幾何学的類似度メトリックと適応温度スケーリングを通じて、対照的な目標を導出する。
得られたエンコーダは、独立して事前訓練され、凍結され、強化学習のバックボーンとして使用される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:15:50 GMT)
Probing Outcome-Level Resemblance and Mechanism-Level Alignment in LLM Risk Decisions: Evidence from the St. Petersburg Game [45.0] LLMは人間と共存するメカニズムを示さずに人間のようなリスク決定を下す。
これらの結果から,リスク意思決定における行動アライメントは表面レベルである可能性が示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:01:52 GMT)
Imbuing Large Language Models with Bidirectional Logic for Robust Chain Repair [44.8] 本稿では,デコーダのみのトランスフォーマーをネイティブに組み込んだトレーニングフレームワークであるTeleological Reasoning Infilling (TRI)を紹介する。
推測では、TRIは二重システムループ内の外科的修復モジュールとして動作する。
3つのベンチマークの実験では、TRIは全てのタスクで最先端のパフォーマンスを達成し、プロブレム当たりのトークン支出を31.2%削減した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:58:48 GMT)
Food-R1: A Unified Multi-Task Food Vision-Language Model with Reinforcement Learning [44.7] CalorieBench-80Kは、キュレートされたカロリーラベルと食事アドバイスアノテーションを備えた大規模ベンチマークである。
我々の知る限りでは、カロリー分析のためにChain-of-Thought(CoT)アノテーションを取り入れた初めての食品画像ベンチマークである。
また,多タスク学習パラダイムで訓練した統合食品VLMであるFood-R1を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:07:12 GMT)
Beyond Symmetric Alignment: Spectral Diagnostics of Modality Imbalance in Vision-Language Models in the Medical Domain [43.7] スペクトルアライメントスコア(SAS, Spectral Alignment Score)は、アンカーモダリティの主固有基底に両モードを投影し、固有値重み付き固有モード相関を計算する非対称な計量である。
実験の結果, 医用画像は2つの臨床報告よりもリッチな構造情報を保持しており, 競合するすべての指標には見えない方向非対称であり, SASは医療領域における検索性能と最強のゼロラベル相関を達成し, 臨床展開のための実用的な診断ツールとして位置づけていることがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:50:30 GMT)
Beyond Structural Symmetries: Linear Mode Connectivity via Neuron Identifiability [42.8] パラメータ対称性に注目が集まる一方で、パラメータ、データ、表現間の相互作用は未解明のままである。
我々は、独立したトレーニングランでニューロン識別能力を介して効果的な対称性の破れを定式化する。
ニューラルネットワークは、構造的に非対称なモデルであっても、ほぼ等価な解の大きいファミリーを許容できることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:37:58 GMT)
Benchmarking Living-Screen-Native GUI Agents on Short-Video Platforms [42.6] 我々はこのタスクをリビング-スクリーン-Native GUIエージェントとして定式化する。
LivingScreenは、短いビデオプラットフォームでインスタンス化する最初のベンチマークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:25:46 GMT)
Contrastive Learning and Correlation Clustering for Sequences of Network Telescope Data [42.4] 本研究は、事前学習やアノテーションなしで、比較学習によって意味論的に意味のあるペアワイズ関係を推定できるかどうかを考察する。
本稿では,ネットワークフローレコードの最小処理列を組込み,コントラスト学習を用いて学習するトランスフォーマーモデルを提案する。
学習された類似性は、異なるソースから派生したシーケンスよりも、同じソースから派生したシーケンスの平均よりも高く、この性質は目に見えないソースのシーケンスに一般化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:15:37 GMT)
U-Net-Accelerated Quality-Diversity Optimization for Climate-Adaptive Urban Layouts [42.0] glsqdのアルゴリズムは 設計空間を照らす方法を提供するが シュロゲートモデルが実用的である必要がある
本稿では,制御の遅い物理シミュレータを,オフラインMAP-Elitesループ内の空間深層学習サロゲート(U-Net)に置き換える。
その結果、オープンソースのOpenSKIZZEツールにデプロイされたパイプラインは、10分以内で数千の多様な気候評価された建物のレイアウトを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:35:11 GMT)
Sharp Low-Degree Thresholds for Planted-vs-Planted Testing [42.0] 本研究は, 植林したサブマトリクスおよび植林した高密度サブグラフモデルにおいて, 地域社会を数えるために, 低緯度と低緯度の境界を一致させることを実証する。
弱いテストのタスクは、ランダムな推測よりも優れているが、シャープなしきい値ではなく、スムーズな遷移を持つ。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:28:30 GMT)
NextMotionQA: Benchmarking and Judging Human Motion Understanding with Vision-Language Models [41.8] NextMotionQAは、専門家検証データセットのビジョン言語モデルを活用する包括的なベンチマークである。
NextMotionQAには、3つの補完的なタスクがある。
従来の単一タスク評価では見えなかった重要な能力ギャップと弱点を明らかにするために,12種類のVLMの評価を行った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:53:57 GMT)
Adaptive Auto-Harness: Sustained Self-Improvement for Agentic System Deployment on Open-Ended Task Streams [41.7] このようなストリームのためのフレームワークとシステムであるAdaptive Auto-Harnessを紹介します。
オラクルハーネスとのギャップを進化損失と適応損失に分解する。
予測市場、セキュリティ競争、イベント予測ストリームで、既存の5つのオートハーネスベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:59:44 GMT)
Learning Manifold and Itô Dynamics with Branched Neural Rough Differential Equations [41.5] BNRDE は NRDE log-ODE ステップを状態空間多様体上の数値積分として再放送する。
BNRDE はユークリッド・ストラトノビッチ設定を超える統一的な効果的なアプローチを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:12:52 GMT)
SurvPFN: Towards Foundation Models for Survival Predictions [41.4] 生存予測のための事前データ付きネットワーク(PFN)である textttSurvPFN を提案する。
我々は、何百万もの合成生存予測タスクについてtextttSurvPFN を事前訓練し、検閲データを考慮した分布回帰を用いて生存率を学習する。
我々は,PFNのパワーを解放し,時間から時間への予測を行うことにより,生存を検閲された損失を伴う連続的な分布回帰問題として扱うことができることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:52:45 GMT)
Online Skill Learning for Web Agents via State-Grounded Dynamic Retrieval [41.1] State-Grounded Dynamic Retrieval (SGDR)は、Webエージェントの段階的なスキル再利用を可能にするオンラインスキル学習手法である。
SGDRは3つのコンポーネントから構成される: 完了したトラジェクトリを中間実行状態で実行不可能な再利用可能なサブプロデューサに変換するスライディングウィンドウ抽出プロセス、スキル検索と実行可能なアクションを接続するデュアルテキストコード表現、タスクゴールと現在のWebページ状態の両方にスキルにマッチするステートグラウンド動的検索機構。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:11:50 GMT)
Ten Headache Specialists versus Artificial Intelligence for Clinical Literature Summarization: A Critical Evaluation and Comparison [40.3] アメリカとカナダの頭痛専門医10人がそれぞれ1つの質問の要約を書いた。
著者に盲目な専門家は、正確性、完全性、簡潔性、臨床的有用性に基づいて要約を批判的に評価した。
専門家が書いた要約が好まれたが、専門家は時に、人間とAIが生成した要約を区別することが難しいと感じた。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:58:43 GMT)
Trace-Mediated Peak Bias: Bridging Temporal Credit Assignment and Cognitive Heuristics in Deep Reinforcement Learning [40.3] TMPB(Trace-Mediated Peak Bias)と呼ばれる深層強化学習における系統的障害モードの同定
TMPBは遠位端の時間誤差を「勾配衝撃」に増幅するが、固定ステップサイズのトレースは正規化できない。
この結果から,分散システムにおけるクレジット代入の数学的制約から,人為的なサリエンシ歪みが自然に現れる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:19:29 GMT)
Agent Planning Benchmark: A Diagnostic Framework for Planning Capabilities in LLM Agents [40.2] 我々は,計画固有の診断ベンチマークである textbfAgent Planning Benchmark (APB) を紹介する。
APBは、全体計画、フィードバック条件付きステップワイド計画、外部ツールによる堅牢性、壊れたツール、解決不可能なタスクをカバーしている。
我々は、200 ToolSandboxタスクと200$-benchタスクでAPBを検証する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:37:47 GMT)
Streaming Communication in Multi-Agent Reasoning [40.1] マルチエージェント推論システムであるStreamMAを導入し,各推論ステップを生成直後にダウンストリームエージェントにストリームする。
驚くことに、このパイプライニングは効果も向上する。
エージェントごとのステップの増加は、有効性と効率の両方を一貫して改善します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:57:04 GMT)
Depth-Attention: Cross-Layer Value Mixing for Language Models [39.8] 自己注意(Self-attention)はシーケンス全体で自由に情報を選択するが、奥行きによっては、トランスフォーマーは各レイヤの出力を残留ストリームに追加するだけである。
最近のクロス層法はこの流れを改善するが、外部の隠れた状態で作動する。
本稿では、注目モジュール自体内でこの選択を行うDepth-Attentionを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:33:45 GMT)
Exploring Cross-Scenario Generality of Agentic Memory Systems: Diagnostics and a Strong Baseline [39.3] 検索問題に対する8つのメモリシステムとエージェントハーネスを再検討する。
自動管理ツールインタフェースを備えたエージェントメモリハーネスであるAutoMEMにおいて、この知見をインスタンス化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:42:49 GMT)
Decoded Quantum Interferometry Beyond Hamming: Rank-Metric and Translation Association Schemes [39.1] Decoded Quantum Interferometry (DQI) はコヒーレントデコーディングと量子フーリエ変換を用いて、構造化最適化問題の高品質な解を求める。
我々は、コアDQI機構をハミング空間を越えて、翻訳対称性を持つ有限測地へと拡張する。
min(m,n)-l付近の有効ランクプロキシによる解が得られ、対応する期待スコアはサンプルの残留ランクに制限された定数確率に変換することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:12:15 GMT)
Trust Region On-Policy Distillation [39.0] On-Policy Distillation (OPD) は、大規模言語モデルの効率的なポストトレーニング手法である。
この研究は、信用割当戦略を通じて、信頼できるオン・ポリティクスのトークンレベルの監督に対処する。
実験の結果、TrOPDはSoTA OPDベースラインを一貫して上回ることがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:57:08 GMT)
Reproducing, Analyzing, and Detecting Reward Hacking in Rubric-Based Reinforcement Learning [38.9] ルーリックベースのRLのための制御可能なハッキング環境であるCHERRLを紹介する。
CHERRLは、報酬ハッキングの安定した再現、報酬分散の明示的な観察、ハッキング開始の正確な識別を可能にする。
その有用性を示すために,発見可能性とエクスプロイラビリティの観点から異なる判断バイアスを解析する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:18:23 GMT)
Bridging Short Videos and Live Streams: Reasoning-Guided Multimodal LLMs for Cross-Domain Representation Learning [38.1] Reasoning-Guided Cross-Domain Representation Learning (RGCD-Rep)
RGCD-Repは、短いビデオからライブストリームへのクロスドメインレコメンデーションのための推論誘導フレームワークである。
完全にデプロイされ、毎日4億人のユーザーが利用している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:49:01 GMT)
Token Rankings are Unforgeable Language Model Signatures [38.0] 言語モデルパラメータは、ロジット出力にユニークな(各モデルに)幾何学的制約を課すことが知られている。
このシグネチャは、モデルを識別するシグネチャとして機能すると同時に、APIがロジットを配布すると、モデルの最終的なレイヤパラメータをリークする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:06:35 GMT)
AlloGen: Conformation-Selective Binder Generation with Differential State Scoring [38.0] 学習した状態選択性スコアラからバックボーン生成を分離するフレームワークであるAlloGenを紹介します。
AlloGenは、代替コンフォメーションを拒絶しながら、望ましい構造状態を優先的に認識するバインダーを一貫して識別する。
その結果、コンフォメーション選択性は学習可能な性質として確立され、状態選択型タンパク質結合体設計のための一般的な枠組みを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:53:17 GMT)
DIST-FL: Enhancing Security for TEE-based Aggregation in Federated Learning [38.0] サーバサイドの敵は、システムの堅牢性とプライバシを妥協するために、クライアントの選択とリプレイアグリゲーションを操作できる。
DIST-FLは、複数のTEEによって保護されたサーバの分散システムであり、プライバシ保護された堅牢なFLアグリゲーションのための追加専用台帳を形成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:01:10 GMT)
TANDEM: Bi-Level Data Mixture Optimization with Twin Networks [37.9] 大規模言語モデル(LLM)に対する二段階最適化問題を提案する。
問題を単一レベルのペナル化形式に単純化し、ツインネットワークで解決する。
提案手法は、ツインモデルとアップウェイトドメインの差によるデータの有効性を計測する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:28:46 GMT)
Breakdown of Thermalization from Real-Time Dynamics in the Two-Dimensional Hubbard Model [37.6] 強い相関を持つフェルミオン系の熱化は、量子多体物理学において中心的な問題である。
本研究では,2次元ハバードモデルにおける実時間力学と熱化へのアプローチについて検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:05 GMT)
Would you still call this Dax? Novel Visual References in VLMs and Humans [37.6] 我々は,新しいビジュアル参照データセット(NVRD):90の視覚概念にまたがる19,176のイメージを,様々な視覚的ノベルティのレベルにわたって提示する。
慣れ親しんだ概念の視覚的増強に関する以前の研究とは異なり、NVRDはスクラッチから構築された全く新しいオープンエンド刺激で構成されている。
3つのオープンソースモデルと2つのクローズドソースモデルと2,400人の人的判断を合わせて評価し、(i)モデルが先行知識と矛盾する場合にコンテキスト内で新しい概念を取得するのに苦労していること、(ii)モデルと人間が視覚的摂動に相関した感度を示す一方で、モデルは大幅に過大化し、学習ラベルを人間の刺激に拡張することを見出した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:23:12 GMT)
Rollout-Level Advantage-Prioritized Experience Replay for GRPO [37.4] GRPOのためのロールアウトレベルのリプレイバッファを提案し、グループ全体ではなく個々のロールアウトを格納し、サンプリングする。
Qwen3-Baseは5つのベンチマークでスケールするが,本手法はGRPOより優れている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:47:47 GMT)
From Answers to States: Verifiable Process-Level Evaluation of Chemical Reasoning in Large Language Models [37.3] ChemCoTBench-V2は、構造化された検証可能な化学推論トレースの評価のための、ルール検証可能な診断ベンチマークである。
分子理解、分子編集、分子最適化、反応予測にまたがっており、18の報告タスクで5,620個の評価サンプルがある。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:05:21 GMT)
CRESS: Quantifying Vulnerabilities of Attack Scenarios in Hardware Reverse Engineering [37.3] ハードウェアのリバースエンジニアリングの結果は、マイクロエレクトロニクスに対する攻撃において重要な役割を果たす。
新たなRE関連攻撃は共通のREスコアシステム(CRESS)の開発を動機づけた
CRESSスコアは、業界標準のCVSS(Common Vulnerability Scoring System)よりもはるかに表現力が高いことが証明されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:34:57 GMT)
SAILRec: Steering LLM Attention to Dual-Side Semantically Aligned Collaborative Embeddings for Recommendation [36.9] LLMベースのレコメンデータは、ユーザとイテムのインタラクションからの協調的な埋め込みによって言語モデルを強化する。
協調的な埋め込みの利用は深さ依存的でアライメントに敏感であることがわかった。
両面のセマンティックアライメントと階層的アテンションステアリングにより,このバランスを改善するLLMベースのレコメンデータSAILRecを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:46:32 GMT)
Rethinking Continual Experience Internalization for Self-Evolving LLM Agents [36.8] 原則レベルのエクスペリエンスは、インスタンスレベルのエクスペリエンスよりも耐久性が高いことが分かりました。
ステップワイドインジェクションは、中間的決定状態と経験を整合させることで、グローバルインジェクションを著しく上回る。
高品質な教師軌道上のオフ・ポリティカル・コンテクスト蒸留は、オン・ポリティカル・コンテクスト蒸留よりもかなり安定した訓練信号を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:30:09 GMT)
LoopMoE: Unifying Iterative Computation with Mixture-of-Experts for Language Modeling [36.7] スパースルーティングと反復重み付き計算を統合したループ型MoE言語モデルであるLoopMoEを提案する。
設計により、Vanilla MoEに対してループ式MoEを厳格に制御し、ヘッド・ツー・ヘッドで評価することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:38:12 GMT)
SMADE-IE: Sparse Multi-Agent Framework with Evidence-Driven Debate for Zero-Shot Information Extraction [36.7] ゼロショット情報抽出のためのスパースかつエビデンス駆動型マルチエージェントフレームワークSMADE-IEを提案する。
SMADE-IEは、まずAdaptive Mode Selectorを使用して、入力を軽量なグローバル抽出モードまたはタイプ中心抽出モードに動的にルーティングする。
矛盾する予測のために、議論をトゥールミンスタイルのコンポーネントに構造化するエビデンス駆動の議論機構を導入する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:18:34 GMT)
GRAIL: Gradient-Reweighted Advantages for Reinforcement Learning with Verifiable Rewards [36.7] グラディエント・リウェイトド・アドバンテージ(GRAIL)は、固有のトークン・ワイド・アドバンテージ・リウェイト法である。
GRAILは勾配活性塩度を用いて、最終回答により局所的に敏感なトークンをより重み付けする。
GRAILの精度は平均3.60%向上し、Pass@3では3.05%向上した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:51:27 GMT)
Generalizing Graph Foundation Models via Hyperbolic Retrieval-Augmented Generation [36.1] グラフ基礎モデル(GFM)はグラフ表現学習において支配的なパラダイムとして登場した。
本稿では,GFMの一般化能力を高めるためのフレームワークを提案する。
複数のグラフベンチマークの実験では、ゼロショット設定が大幅に改善された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:07:00 GMT)
Data Attribution in Large Language Models via Bidirectional Gradient Optimization [35.6] 大きな言語モデル(LLM)は、様々なアプリケーションにまたがってデプロイされるようになっている。
モデルの出力に最も影響したトレーニングデータの理解は、依然として根本的なオープンな問題である。
トレーニング中に生成されたアウトプットを見た場合、トレーニングデータにどのような影響があるのか?
提案手法は, 生成したテキストサンプルに対して, 双方向勾配最適化(漸進的上昇・降下)を用いてベースモデルを摂動させ, トレーニングサンプル間の損失変化を計測する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:21:53 GMT)
OLIVE: Online Low-Rank Incremental Learning for Efficient Adaptive Exoskeletons [35.5] オリーブはオンライン適応フレームワークで、デプロイ中にExoskeletonコントロールを継続的にパーソナライズする。
ウェアラブルプラットフォーム上での実験では,オリーブは歩行のスムーズ性,労力削減,運動安定性において,+13,+22,+15のパーセンテージ向上を達成した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:37:37 GMT)
X4Val: Learning Neural Surrogates for Variance-Reduced Policy Evaluation [35.3] X4Valは,非ペア型マルチドメインデータの存在下での分散還元実世界の測度推定のためのフレームワークである。
X4Valは、実際のドメインと補助ドメインのサンプルを共有表現空間に埋め込み、現実世界のメトリクスの転送可能な予測子を学ぶ。
本研究では,自律走行と実世界のロボット操作タスクに関する理論的解析と実証評価を行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:57:09 GMT)
Beyond Text Following: Repairable Arbitration Reversals in Audio-Language Models [35.0] 音声モデルはしばしば、音声証拠が明確であっても、音声と矛盾するテキストに従う。
Gated Audio Counterfactual Logit Correction (GACL)を提案する。
厳格な5ppの忠実度ドロップの予算の下で、GACLは最高のコントラストベースラインよりも17.8ポイントのnAUCを改善している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:57:51 GMT)
PHASER: Phase-Aware and Semantic Experience Replay for Vision-Language-Action Models [35.0] 本稿では,アーキテクチャに依存しない連続学習フレームワークPHASERを紹介する。
フェーズRは、すべてのサブスキルに等しいメモリサポートを保証するために、フェーズ中心のキャパシティアロケーションを使用する。
また、教師なし動作信号変化点検出とVLMに基づくセマンティック検証を組み合わせた軽量パイプラインであるAuto-PCを統合する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:44:16 GMT)
ODYSSEY: Reestablishing Confidentiality in Confidential Blockchain via Delegated Execution [34.0] 本稿では,実行推論と実行再生攻撃を効率的に軽減する秘密ブロックチェーンODYSSEYを提案する。
ODYSSEYのデリゲートモデル: クライアントがトランザクションの実行を指定されたトラストに委譲する一方で、他の参加者は実行結果のみを同期する。
ODYSSEYの効率とセキュリティを改善する2つの新しいテクニック:位置対応並列実行とデリゲート障害ハンドラ。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:52:59 GMT)
SkyShield: Occupancy as a Safety Interface for Low-Altitude UAV Autonomy [34.0] 我々はSkyShieldを紹介し、20m未満の都市UAV飛行のための最初のフロントビュー単分子セマンティック占有ベンチマークを私たちの知る限りで紹介する。
CARLA上に構築されたSkyShieldには、様々な都市景観と気象条件にわたる36KのフロントビューUAVサンプルが含まれている。
KAR-mIoU(UAV中心で動的に認識されるメトリクス)は,到達性と協調時間によるボクセルレベルの評価を再重み付けする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:02:39 GMT)
Ask When It Pays: Cost-Aware Open-Ended Interaction for Instance Goal Navigation [33.9] インスタンスゴールナビゲーション(IGN)では、具体化されたエージェントが、未指定の自然言語記述からイントラクタ内の特定のインスタンスオブジェクトを見つける必要がある。
我々はIGNをコストに敏感な不確実性推論問題として再考する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:34:51 GMT)
Controllable Dynamic 3D Shape Generation via 3D Trajectories and Text [33.8] T2Moは3次元軌跡とテキストに条件付けされた制御可能な動的3次元形状生成のためのフィードフォワードフレームワークである。
本研究では,入力軌跡セットを対象物全体を覆う形状認識トークンセットにマッピングする形状認識軌道埋め込みを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:58:01 GMT)
Flash-WAM: Modality-Aware Distillation for World Action Models [33.0] Flash-WAMは、一貫性蒸留にインスパイアされたモダリティ対応のステップ蒸留フレームワークである。
各モードにおける推論を1ステップに圧縮する。
シミュレーションベンチマークでのタスク成功を保ち、現実世界のパフォーマンスを大幅に回復する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:29:57 GMT)
Dominant-Layer ZO: A Single Layer Dominates Zeroth-Order Fine-Tuning of LLMs [32.8] Zeroth-order (ZO) 最適化により、前方パスのみを使用して大きな言語モデル(LLM)をメモリ効率よく微調整できる。
ZOファインチューニングは1つのデコード層に大きく支配されている。
LLaMA2-7B と Qwen3-8B を9つのベンチマークで比較したところ、支配層型ZOファインチューニングはフルモデル MeZO と LoRA ベースのZOファインチューニングよりも平均性能を向上させることが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:42:09 GMT)
4D Reconstruction from Sparse Dynamic Cameras [32.7] 我々は、少数のカメラが同じ被写体を撮影する、スパース・ダイナミック・カメラ・セットアップ(sparse dynamic camera set)という別の実用的な方法に焦点を当てている。
このセットアップは多視点制約を導入し、スポーツ、コンサート、テレビ番組などの実世界のビデオ制作に実用的であり続けている。
LetCamsGoは、3台の独立して動くカメラと1台の固定カメラによって記録された4つの異なる環境に5つのシーケンスが並んだ、新しい現実世界のビデオデータセットである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:31:43 GMT)
Learning While Acting: A Skill-Enhanced Test-Time Co-Evolution Framework for Online Lifelong Learning Agents [32.5] 大規模言語モデル(LLM)エージェントが動的にインタラクティブな環境で動作するためには、生涯学習が不可欠である。
オンライン生涯学習エージェントのための2段階強化学習フレームワークであるSkill-enhanced Test-Time Co-Evolution(textttLifeSkill)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:38:57 GMT)
Aggregating LLM-Based Weak Verifiers for Spatial Layout Generation [32.5] 本稿では,タスク固有の弱い(不完全な)検証器を空間配置領域の強い検証器に構築・集約するパイプラインを提案する。
このような検証器の応答を集約することで、より強力な検証器を生成することができることを示す。
また,強い検証器からの自然言語フィードバックを用いた検証器誘導レイアウト生成により,基本レイアウト生成器のレイアウト品質が66.2%向上することが実証された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:50:49 GMT)
Denoise First, Orthogonalize Later: Understanding Momentum in Muon via Spectral Filtering [32.2] ムオンの運動量はスペクトルフィルタとして作用することを示す。
摂動前の運動量を適用することは、この順序を逆転させるか、単に運動量を取り除くよりも、勾配の信号成分との配向を確実に強くする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:06:07 GMT)
AgentJet: A Flexible Swarm Training Framework for Agentic Reinforcement Learning [32.0] AgentJetは、大規模言語モデル(LLM)エージェント強化学習のための分散フレームワークである。
Swarmサーバノードはトレーニング可能なモデルをホストし、GPUクラスタ上で最適化を実行する一方、Swarmクライアントノードは任意のデバイス上で任意のエージェントを実行する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:02:52 GMT)
Usability Analysis of Configurator User Interfaces with Multimodal Large Language Models [31.8] 本稿では,ユーザインタフェース(UI)のスケーラブルかつ半自動解析におけるMLLMの利用について検討する。
文献から18種類のユーザビリティ基準を適用し、16の実世界のMLLM分析にこれらの基準を適用した。
各基準は個別に評価され、ユーザビリティ問題や実行可能な改善提案に対する深刻度評価を生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:35:17 GMT)
WAM-Nav: Asymmetric Latent World-Action Modeling for Unified Visual Navigation [31.5] 視覚ナビゲーションは、複雑な幾何学的および物理的制約の下で滑らかで衝突のない軌道を生成する必要がある。
WAM-Navは,視覚ナビゲーションを具体化した潜在世界行動モデルであり,行動生成と潜時視予知を共同で学習する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:05:19 GMT)
UniCAD: A Unified Benchmark and Universal Model for Multi-Modal Multi-Task CAD [31.3] マルチモーダルCAD学習のための総合ベンチマークUniCADを紹介する。
テキスト,画像,スケッチ,点群を取り込み,汎用的な大規模言語モデルUniCAD-MLLMを提案する。
将来の研究を加速するために、データセット、コード、事前訓練されたモデルをリリースします。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:20:57 GMT)
AutoMedBench: Towards Medical AutoResearch with Agentic AI Models [31.3] AutoMedBenchは、自律医療AI研究のためのワークフロー対応ベンチマークである。
各ランの平均エージェントターンが33回ある長い水平タスクで構成されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:43:27 GMT)
IMPose: Interactive Multi-person Pose Estimation with Dynamic Correction Propagation [31.2] マルチパーソン動的ポーズアノテーションのための対話型ツールIMPoseを紹介する。
ビデオ全体のアノテータから一フレームのマルチパーソンポーズを補正するデュアルレベルトラッキング機構を備えている。
IMPoseは高精度なアノテーションを高い効率で実現し、3DPWでは1,050コマビデオにつき27クリック、PoseTrack21では84コマあたり3クリックしか必要としない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:55:26 GMT)
Developing a novel Comorbidities Index for predicting 10-year mortality in Prostate Cancer patients: A computational data-driven approach [31.1] カールソン総合指数(英: Charlson Comorbidities Index、略称:CCI)は、10年間の死亡リスクを推定するために広く用いられる重み付け加法指数である。
根治的前立腺切除術(RP)を施行する候補者に対しては,10年間の死亡率の正確な推定が不可欠である。
RPを考慮に入れたPCa患者に適合したコモビディティ指数を導出するためのデータ駆動型フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:26:25 GMT)
The Right Measure for Physics-Constrained Generation: A Co-Area Correction for Posterior-Consistent PDE Inverse Problems [31.1] 生成モデルは、偏微分方程式(PDE)の逆問題を解くためにますます使われている。
広く採用されているレシピが間違った分布をサンプリングしていることを示す。
我々は,コエリア後部を対象とする測度制約付きサンプルであるtextbfCoCoSを紹介した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:30:03 GMT)
Preserving Data Privacy in Learning Causal Structure with Fully Homomorphic Encryption [30.9] 本稿では,完全同型暗号(FHE)に基づく暗号文の計算手法を提案する。
提案手法は,テストしたデータセットのバージョンと高い一貫性と同等な因果構造を実現する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:33:14 GMT)
Phase-correlation-free quantum key distribution source operating at gigahertz rates [30.1] 我々は、Cバンドで動作する超発光発光ダイオード(SLED)に基づく1.25GHzの位相ランダム化QKD光源を提案する。
ソースは$sim100$ ps光パルスを生成し、400$psのパルスとパルスを分離し、高速なタイムビン符号化と互換性がある。
この研究は、高速準備・測定QKDシステムのためのスケーラブルなSLEDベースのプラットフォームを確立する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:35:59 GMT)
DiscourseFlip: An Oblique Discourse-Level Opinion Manipulation Attack against Black-box Retrieval-Augmented Generation [30.0] 既存のRAG攻撃は主に個々のクエリや狭いトピックローカルクエリセットに焦点を当てている。
セマンティック・クエリー・ネットワークにまたがる協調的な影響が意見シフトを引き起こす新たな脅威モデルである談話レベルの意見操作を導入する。
実験では、DiscourseFlipがコンテキスト化されたクエリネットワークをまたいで、目標とする意見シフトを一貫して誘導することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:47:29 GMT)
Self-Evolving Deep Research via Joint Generation and Evaluation [29.9] ディープ・リサーチ・レポート・ジェネレーションには決定的な根拠が欠けているため、報酬設計は本質的に検証不可能である。
既存のアプローチは、LCM-as-a-judgeとクエリ依存評価ルーブリックでこの課題を軽減する。
我々は、この制限を、ディープテキストbfresearchの評価と生成のためのTextbfco進化学習フレームワークで解決する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:38:19 GMT)
Self-supervised User Profile Generation for Personalization [29.9] 本稿では,プロファイルを用いた双方向ユーザモデリング(BUMP)について紹介する。
BUMPは、ラベル付き報酬に依存するクローズドソースAPIや先行メソッドにマッチするか、より優れています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:25:00 GMT)
UniPixie: Unified and Probabilistic 3D Physics Learning via Flow Matching [29.8] UNIPIXIEは、単一の視覚入力から物理的に可視な材料特性の連続経路を予測するために訓練されたフレームワークである。
PIXIEMULTIVERSEデータセット上で物体の最も軟弱なスペクトルに沿った直接マッピングを学習することで、UNIPIXIEは多様な物理的に有効な物質場を制御可能な生成を可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:08:23 GMT)
Learning What to Learn: Stage-Specific Data Sets for SFT-then-RL in Small Language Model Reasoning [29.7] 我々は、データ戦略はSFTとRLの異なる役割と一致すべきであると主張している。
本稿では,学習データをステージ固有のセットに整理する,難易度の高いSFT-then-RLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:25:06 GMT)
MapAgent: An Industrial-Grade Agentic Framework for City-scale Lane-level Map Generation [29.4] レーンレベルの地図は、自動運転とレーンレベルのナビゲーションにとって重要なインフラである。
最近のエンドツーエンドのベクトル化マッピング手法は,センサデータから直接レーン形状やトポロジーを予測することができる。
仕様に準拠したレーンマップ生産のためのベクトル化バックボーンを増強する,産業レベルのエージェントアーキテクチャであるMapAgentを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:44:42 GMT)
A General Framework for Dynamic Consistent Submodular Maximization [29.3] 一貫性は動的部分モジュラーアルゴリズムにおいて重要な性質である。
この設定のためのアルゴリズムを設計するための一般的なフレームワークを開発する。
濃度制約に対して、$frac 12 - O(varepsilon)$ approximation, $Oleft(frac1varepsilon2right)$ consistentを提案する。
階数-$k$ マトロイドの制約に対して、$frac 14 - O(varepsilon)$ を$Oleft(fraclog kvarepsilon2right)という動的最適化に近似する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:35:13 GMT)
Sequential Data Poisoning in LLM Post-Training [29.3] 既存の文献では、トレーニングの各段階でデータ中毒攻撃が起こる可能性があるが、複数の攻撃者の可能性を無視していると仮定している。
本稿では、複数の敵がSFTと選好データセットを別々に汚染するシーケンシャルデータ中毒の脅威モデルを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:22:50 GMT)
GeoMin: Data-Efficient Semi-Supervised RLVR via Geometric Distribution Modeling [29.2] 検証可能な報酬(RLVR)による強化学習はLLM推論を著しく向上させる。
標準的な教師なしスケーリングは高いアノテーションコストによって妨げられ、教師なしの代替手段は深刻なモデル崩壊に悩まされる。
最近の半教師付きRLVR法は、ラベルのないデータをガイドする小さなラベル付きセットを使用してこの問題に対処し、トレーニングの有効性とアノテーションコストの間の有望なトレードオフを実現する。
ラベル付きデータに対するグローバルな特徴をモデル化したGeoMinを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:47:50 GMT)
Smart Picks in the Dark: Towards Efficient RLVR for Reasoning via Tracing Metacognitive Pivots [29.1] RLVRの「暗黒のピック」設定は、事前の監督なしに、トレーニングに最も有益でアノテーションに相応しいラベルなしサンプルを選択することを目的としている。
本稿では,3方向データトリアージフレームワークであるPivotTraceを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:34:42 GMT)
Ultra-Fast Neural Video Compression [29.1] 本稿では,レート・歪み・複雑さのトレードオフを大幅に改善するために,チャンクベースのコーディングフレームワークを提案する。
フレームを逐次処理する代わりに、複数のフレームの断片を1つのコンパクトな潜在表現に符号化し、同時にデコードする。
これらのイノベーションに基づいて、我々は、新しいSOTAのパフォーマンスを規定する新しいNVCであるDCVC-UFを紹介します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:38:05 GMT)
Geometry Gaussians: Decoupling Appearance and Geometry in Gaussian Splatting [28.9] デフォルトの3DGSはテクスチャと幾何学を同時に表現するのに適していないことを示す。
各スプラットに1つの追加の幾何不透明度パラメータを適用することで、簡単な解を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:29:36 GMT)
InstantRetouch: Efficient and High-Fidelity Instruction-Guided Image Retouching with Bilateral Space [28.8] 両空間操作を用いた効率的かつ忠実なリタッチ手法を提案する。
画像やピクセルを直接編集する代わりに、アフィン変換の低分解能二値格子を予測する。
このアプローチは高い忠実度と効率性の両方をもたらす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:30:17 GMT)
Anchor3R: Streaming 3D Reconstruction with Transient Anchors for Long-Horizon Visual Mapping [28.6] ロングホライゾンのオンライン視覚マッピングは、ロボット知覚のコア機能である。
最近のフィードフォワード3D再構成モデルは、第1フレームまたは永続的なシーンメモリに結び付けられた固定座標系におけるポーズを予測する。
フィードフォワード再構成を電流中心の局所測定予測として扱うストリーミング3D再構成フレームワークであるemphAnchor3Rを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:00:13 GMT)
Who Needs Labels? Adapting Vision Foundation Models With the Metadata You Already Have [28.4] 本稿では,強力だが汎用的な視覚基盤モデルを専門分野に適用するためのラベルフリーアプローチを提案する。
我々の手法であるFINOは、標準的な自己教師対象と柔軟なメタデータガイダンスを組み合わせたものである。
標準の非教師付きドメイン適応と完全な教師付きドメイン適応を一貫して上回る。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:10:11 GMT)
ParetoPilot: Zero-Surrogate Offline Multi-Objective Optimization via Infer-Perturb-Guide Diffusion [28.3] オフラインMOOのための新しいゼロ代理拡散フレームワークを提案する。
パーターブガイドエンジンは、逆生成プロセスの無条件復調ステップ内でシームレスにインターリーブされる。
当社のアプローチは,超ボリューム改善を実現しつつ,データのプライバシを保護します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:27:21 GMT)
Disentangled Fine-Grained Prototype Learning for Incomplete Image-Tabular Classification [28.3] DFPLは、きめ細かいプロトタイプ学習のための新しいフレームワークである。
SSPMはコンパクトで多種多様な共有およびモダリティ特異的なプロトタイプを抽出する。
PFAモジュールは、プロトタイプレベルの分散マッチングとプロトタイプからクラスへのセマンティックアライメントを共同で実施する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:24:05 GMT)
Reinforcement Learning from Cross-domain Videos with Video Prediction Model [28.1] XIPERは、視覚的に異なる領域で収集されたエキスパートビデオから学ぶための報酬モデルである。
エージェントの観測結果を専門家ドメインにマッピングし、予測確率を報酬信号として使用する。
実験によると、XIPERはドメインのギャップにもかかわらず、一貫してベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:57:41 GMT)
NIV: Neural Axis Variations for Variable Font Generation [28.0] 可変フォントは、重み、幅、スラント、光学サイズなどの意味軸に沿ってグリフ幾何学の連続的な変化を可能にする。
静的フォントを完全に機能する可変フォントに自動的に変換するNIVを導入する。
NIVは、見えないコードポイント、見えないフォントスタイル、高複雑さKグリフ、さらには配布外手書き入力を一般化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:17:43 GMT)
Potential-Guided Flow Matching for Vision-Language-Action Policy Improvement [27.7] 自己誘導型フローマッチングポリシであるForesightFlowを紹介した。
それぞれの生成されたアクションチャンクを、学習された成功可能性軌道で拡張する。
候補アクションをスコア付けし、外部の批評家なしで$K$の推論を可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:49:35 GMT)
Dynamic Infilling Anchors for Format-Constrained Generation in Diffusion Large Language Models [27.6] 動的埋込アンカー (DIA) は, 動的にエンドアンカー位置を推定し, 反復埋込前の生成長を調整する。
DIAはフォーマットのコンプライアンスと回答の精度を大幅に改善し、GSM8KとMATHで大きなゼロショットゲインを達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:18:23 GMT)
D^2SD: Accelerating Speculative Decoding with Dual Diffusion Draft Models [27.4] 最近の拡散ベースのドラフトラはトークンのブロック全体を並列に生成するが、通常は検証毎に単一のドラフトシーケンスにコミットする。
D2SDは,候補を信頼誘導プレフィックスツリーに整理する,二重拡散ドラフト投機的復号化フレームワークである。
結果として得られた共有誘導候補は、カスケードの注意を通して共同で検証される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:48:00 GMT)
Beyond Ideal Instruction: A Comprehensive Framework for Evaluating LLMs in Realistic Interactions [27.3] RUT-Benchは大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
我々は,このベンチマークを用いて,広く採用されている19のオープンソースおよびプロプライエタリ LLM の評価を行った。
テスト済みのLCMは40%以上の成功率を達成することができず、ほとんど全員が、より複雑な非理想的なユーザ入力に直面した時に顕著なパフォーマンス低下を経験しています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:19:48 GMT)
What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems [27.1] 2つのマルチエージェントシステム間での5つの共通エージェント間通信戦略を解析する。
PACT (Protocolized Action-State Communication and Transmission) は,エージェント間通信を状態更新問題として扱う。
PACTはパフォーマンスコストのトレードオフを一貫して改善し、トークンを著しく少なくして、同等またはより強力なタスクパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:22 GMT)
Read the Trace, Steer the Path: Trajectory-Aware Reinforcement Learning for Diffusion Language Models [26.9] 本稿では,dLLM-RLアルゴリズムであるCAPR(Cached-Amortized Path Refinement)を導入する。
ロールアウトのコストは、平らなロールアウトの約0.75倍、木のロールアウトの約0.6倍に削減される。
4x4 Sudoku、Countdown、GSM8K、Math500の合計で、最強の木構造ベースラインとステップ毎の計算の3分の1以下で一致している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:22:54 GMT)
CR-Seg: Attention-Guided and CoT-Enhanced Coarse-to-Refined Reasoning Segmentation [26.2] Reasoning segmentation は、複雑な言語で記述されたターゲットオブジェクトを視覚的・テキスト的推論によって分割することを目的としている。
既存の手法では、学習したセマンティックトークンを使ってMLLM(Multimodal Large Language Models)とセグメンテーションモデルをブリッジする。
本稿では,空間分割のための2段階フレームワークCR-Segを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:51:10 GMT)
Argument Collapse: LLMs Flatten Long-Form Public Debate [26.2] 我々は、議論の崩壊、異なる LLM によって生成されたエッセイの傾向を、より小さな主要な議論、サブ引数、および段落レベルの構造に収束させる傾向について研究する。
ニューヨーク・タイムズ(NYT)の討論会では1,039件、ボストン・レビュー(BR)のフォーラムでは448件、LLMのエッセイでは23,384件を比較した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:13:44 GMT)
Read What You Hear: Reference-Free Hypotheses Evaluation with Acoustic Discrepancy [26.1] READ(Reference-free hypothesis Evaluation with Acoustic Discrepancy)は、音声信号から直接ASR仮説を評価する新しい尺度である。
テキスト仮説が与えられた音声トークンの条件付き確率を計算するために、事前訓練された自己回帰的TSモデルを使用する。
実験によると、READは特定の認識エラーと相関し、ASR出力を改善し、最大20%の相対誤差率の削減を達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:03:19 GMT)
Near-Optimal Decentralized Stochastic Convex Optimization over Networks [25.7] 我々は分散スムーズな凸最適化について研究し、そこでは労働者が固定ゴシップネットワーク上で通信する。
我々は、このレートを最大$smashMlesssim sqrt,N3/4$ワーカーに保存する、高速化された分散化手法を導入する。
線形スパン分散一階法に一致する下界を定め, 対数係数に最適であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:42:01 GMT)
Failed Reasoning Traces Tell You What Is Fixable (But Not by Reading Them) [25.6] テスト時間介入が与えられた障害を救える推論時シグネチャを符号化した障害トレースを提案する。
利用可能な介入の構造から導かれる3つの問題レベルの軌道特徴は、ロールアウト失敗の分布的シグネチャからこの構造を回復する。
同じ3つの機能は、破棄されたデータから失敗したトレースを診断オブジェクトに変換し、トレーニング時間やウェイトスペースアクセスなしでテスト時間ルーティングとトレーニング後の分析をサポートする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:50:26 GMT)
DuDi: Dual-Signal Distillation with Cross-Lingual Verbalizer [25.4] 小型言語モデル(SLM)は効率的でスケーラブルだが、その多言語能力はサブビリオンスケールで著しく低下する。
オンラインシーケンスレベル信号とオフポリティクスおよびオンポリティクストークンレベル信号を組み合わせた二重信号多言語蒸留フレームワークであるDuDiを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:23:05 GMT)
UModel: An Agent-Ready Observability Data Modeling Method at Scale [25.1] データ中心のモデリングからオブジェクト中心のモデリングへ可観測性をシフトする統一的なオントロジフレームワークであるUModelを提案する。
UModelを使用して"AIOps 2025 Challenge"データセットを再モデル化することで、根本原因のローカライゼーションの精度が8%向上した。
UModelは数万のユーザに仕え、毎秒数百万のオペレーションを持続し、秒未満のクエリレイテンシを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:25:50 GMT)
DSA: Dynamic Step Allocation for Fast Autoregressive Video Generation [24.8] ビデオ拡散トランスフォーマーは最先端の視覚的品質を達成したが、その高い推論コストは、リアルタイムアプリケーションにとって大きなボトルネックであり続けている。
本稿では、ARビデオ拡散のための信頼性誘導適応フレームワークであるDSAを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:25:11 GMT)
HapTile: A Haptic-Informed Vision-Tactile-Language-Action Dataset for Contact-Rich Imitation Learning [24.6] HapTileは、視覚のみのトラジェクトリデータセットを超えて前進する、接地型ビズオタクティル操作データセットである。
データ収集プラットフォームは、触覚フィードバックを直接遠隔操作コントローラに統合し、オペレータがリアルタイムでコンタクトインタラクションを知覚できるようにする。
データセットは、ピック・アンド・プレイス、折り畳み、押圧、積み重ね、その他のルーチンアクティビティを含む、幅広いコンタクト豊富なスキルにまたがる日々の操作タスクで構成されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:48:17 GMT)
Fast & Faithful Function Vectors [24.5] 関数ベクトル (FV) は、大規模言語モデル (LLM) を操るのに使用できる、コンテキスト内学習中に引き起こされるタスク表現である。
注意点選択とステアリングの2つの自由度に沿った指示に対する異なるFV定義の影響について検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:36:15 GMT)
Revisiting Embodied Chain-of-Thought for Generalizable Robot Manipulation [24.5] CoT(Embodied chain-of- Thought)は、言語推論とロボット制御を橋渡しすることを目的としている。
現在までに最大規模のCoTコーパスを構築しており,978,743軌道,226.3Mサンプル,2592.5時間ロボットデータで構成されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:29:49 GMT)
Programmable spectral symmetries in an anisotropic quantum Rabi simulator [23.9] 超伝導プロセッサにおけるプログラム可能な異方性量子Rabiモデルを実現する。
異方性はスペクトルを再構成し、完全に崩壊・復活するダイナミクスを退化に近い不完全回復に変換することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:08:27 GMT)
Fine-grained Fragment Retrieval in Multi-modal Long-form Dialogues [23.7] きめ細かいフラグメント検索 (FFR) は、多モーダルな長文対話における意味論的に関連する多文の断片を見つける。
我々は、強化学習で訓練された世代ベース検索モデルであるF2RVLMを紹介する。
オフラインのフラグメントレベルのインデックスとオンライン検索を組み合わせた2段階のシステムであるFFRSを開発した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:29:43 GMT)
Caliper: Probing Lexical Anchors versus Causal Structure in LLMs [23.6] 因果グラフと各質問の確率的仕様を保存しながら,意味変数名をプレースホルダートークンに置き換える制御摂動を導入する。
9つの命令調整されたLDMで、レキシカル匿名化は、局所的な3.8B-14Bセットで、+7.6、+27.0、+11.1 ppの堅牢な精度低下をもたらす。
ゼロショットの評価を受けた現在の命令調整LDMは、語彙アンカーが取り除かれた後、構造的因果推論の証拠をほとんど示していない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:11:16 GMT)
BiasGRPO: Stabilizing Bias Mitigation in High-Variance Reward Landscapes via Group-Relative Policy Optimization [23.1] 大規模言語モデル(LLM)における社会的バイアスの緩和は、異なるアライメントの課題を示す。
直接選好最適化(DPO)は、オフライントレーニングに固有の探索の欠如によって制限される。
PPO(Proximal Policy Optimization)は、潜在的に信頼性の低い批評家の推定により、トレーニング不安定につながる可能性がある。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:31:42 GMT)
Flatness and Generalization: Learning Multi-Index Models with Homogeneous Neural Networks [23.1] 平坦性を最も平坦に近づけることができない非一般化補間器の自然なクラスが存在することを示す。
単一インデックスモデルの和から生成されるデータに対して、近似誤差とラベルノイズが低い場合、最も平坦な補間器は人口損失が少ないことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:20:03 GMT)
BRepCLIP: Contrastive Multimodal Pretraining on BRep Primitives for CAD Understanding [23.0] BRepの幾何学を言語や画像の埋め込みと整合させる最初のフレームワークであるBRepCLIPを紹介する。
トランスフォーマーエンコーダはこれらのトークンをグローバルなBRep埋め込みに集約し、CLIPのテキストとイメージエンコーダと整列する。
BRepCLIPは、既存の点ベースの代替よりも差別的で意味論的に基礎付けられた埋め込みを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:41:23 GMT)
Formal Concept Lattices are Good Semantic Scaffolds for Concept-Based Learning [22.9] ディープラーニングモデルにとって、セマンティクスの学習は、解釈可能で、人間の推論に適合することが不可欠である。
概念ベースのモデルは、意味のあるセマンティック抽象化を通じてクラスを表現することによって、これにアプローチする。
ニューラルネットワーク学習を導くために,形式的概念格子が基本的意味足場を提供することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:50:29 GMT)
When Both Layers Learn: Training Dynamics of Representing Linear Models via ReLU Networks [22.8] 線形対象関数に適合する1層ReLUネットワークの両層を協調的にトレーニングするための勾配勾配ダイナミクスについて検討した。
本分析では, 隠れ重みが植え付け方向と漸進的に一致し, 出力重みが正しい符号パターンを維持できるアライメントフェーズを3つのフェーズで追跡する。
我々は,全軌道に沿って保持される新しい一様濃度結果を確立し,次々に最適な試料の複雑性を得るのに不可欠である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:44:30 GMT)
CRAFT: Cost-aware Refinement And Front-aware Tuning of Prompts [22.8] CRAFT(Cost-Aware Refinement and Front-Aware Tuning)は,LLM検証コールを少ないリソースとして扱うプロンプトで,楽観的な候補フロント付近の候補に割り当てる。
各ラウンド、補完的精度指向、コスト指向のジェネレータは編集を提案し、NSGA-IIの保持は人口の広がりを保っている。
6つの分類と推論のベンチマークで、CRAFTの保持するフロントは、高い精度と低コストの両方に到達し、精度のみ、コストのみ、および重み付きサムベースラインは、それぞれより狭い領域に集中している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:40:03 GMT)
DeployBench: Benchmarking LLM Agents for Research Artifact Deployment [21.9] LLMエージェントは、ソフトウェア工学とML研究のタスクを急速に進歩させてきたが、これらの進歩は、しばしば動作可能な実行可能な環境へのアクセスを前提としている。
既存の環境設定ベンチマークは、研究成果物の配置の全範囲をカバーしていない。
我々は、AI/ML、コンピュータシステム、科学計算にまたがる51の研究成果デプロイメントタスクのベンチマークであるDeployBenchを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:59:34 GMT)
MoDex: A Diffusion Policy for Sequential Multi-Object Dexterous Grasping [21.8] ほとんどの厳密な把握法は、すべての自由度を単一の物体にコミットする。
MoDexは、観測から直接次のグリップのポーズを予測する拡散ポリシーである。
我々は,MuJoCoをベースとしたFranka Emika PandaロボットのシミュレーションにおけるMoDexの評価を行った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:22:10 GMT)
What If Prompt Injection Never Left? Exploring Cross-Session Stored Prompt Injection in Agentic Systems [21.7] クロスセッションシステム状態は、エージェントシステムのシステムレベルのリスクを根本的に変える。
Webシステムに格納されたクロスサイトスクリプティングにヒントを得て、クロスセッションストアドプロンプトインジェクションを導入する。
我々は,ストアドプロンプトインジェクションのリスクを評価するためのベンチマークとサンドボックスツールキットを開発した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:14:17 GMT)
Be Fair! Can Machine Learning Engineering Agents Adhere to Fairness Constraints? [21.7] マシンラーニングエンジニアリング(MLE)エージェントは、生データと自然言語命令からエンドツーエンドのMLパイプライン開発を自動化することを約束する。
敏感で規制されたドメインでは、この抽象化は責任ギャップを生み出す。
既存のベンチマークでは、このような設定でMLEエージェントを安全に適用できるかどうかを評価するには不十分である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:52:49 GMT)
Hybrid Adversarial Defence for Natural Language Understanding Tasks [21.6] 本研究では,エントロピーモデル,不確実性モデル,幾何学的モデルを組み合わせたハイブリッド・ディフェンス・フレームワークについて検討する。
その結果, エントロピー, 不確実性, 幾何学的特徴の組み合わせは, 一つの特徴のみを用いることよりも, より効果的な防御戦略をもたらすことがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:49:15 GMT)
Unpaired RGB-Thermal Gaussian-Splatting Using Visual Geometric Transformers [21.6] RGBと熱画像を組み合わせたマルチモーダルノベルビュー合成(NVS)により、視覚的・熱的情報による正確な3次元シーン再構成が可能となる。
本稿では,3DフィードフォワードトランスアーキテクチャであるVGGTを利用した不対向RGB熱的NVSのためのフレームワークを提案する。
提案手法は,RGB忠実度を維持しつつ,熱ビュー合成における競争性能を向上することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:30:58 GMT)
Self-Evaluation Is Already There: Eliciting Latent Judge Calibration in Base LLMs with Minimal Data [21.5] 大規模言語モデルは、他のモデルによってますます評価され、自然な疑問が提起されている。
本稿では, 自己評価抽出(SEE)手法について紹介する。この手法は, キャリブレーション結合型強化学習フェーズを含む短いサイクルで, 応答を改善し, 審査員を予測し, 次いで, 応答を無触で残しながら, 予測を鋭くするマスク付き蒸留フェーズを備える。
帰属した自己評価は、モデル自身のトークン分布内で急激に局所化され、訓練されたことのない審査員間で安定しており、単一の審査員ではなく、品質の伝達可能な概念を示している」。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:27:16 GMT)
Latent Anchor-Driven Test Generation for Deep Neural Networks [21.3] LatteはDeep Neural Networks(DNN)のためのブラックボックステスティングフレームワーク
潜在空間を活用することで、セマンティックに近づき、多種多様で、そしてフォールトリベリングなテストケースを生成する。
単モデルおよび多モデルテストシナリオにおいて,5つのデータセットと10のDNNモデル上でLatteを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:33:21 GMT)
Learning What Not to Impute: An Uncertainty-Aware Diffusion Framework for Meaningful Missingness [21.1] Diff-Jointを提案する。
Diff-Jointは、競合計算精度を達成し、下流タスク性能を向上しつつ、有意義に欠落したエントリを効果的に識別することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:31:54 GMT)
TeeDAO: A Decentralized Autonomous Organization for Heterogeneous TEEs [21.0] Trusted Execution Environments (TEEs) は、センシティブなデータの保護と、現代のコンピューティングシステムにおけるコードの完全性を保証するための重要な技術として登場した。
本稿では,複数の異種TEEインスタンスを自動的に整理する新しい3層フレームワークであるTeeDAOを紹介する。
61ノードの大規模クラスタにおいて,TeeDAOは最先端システムと比較して最大1.8倍高いキーバリューストアスループットを実現していることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:09:05 GMT)
From Agent Traces to Trust: Evidence Tracing and Execution Provenance in LLM Agents [20.7] 大規模言語モデル(LLM)ベースのエージェントは、外部ツール、検索システム、メモリモジュール、環境、その他のエージェントと相互作用することで、複雑なタスクをますます解決する。
最終回答の精度だけでは、アウトプットがどのように生成されたかは説明できないため、それぞれのクレーム、ツールコールが正当化されたか、後の決定にメモリがどのように影響したか、実行失敗がどこから発生したかといった証拠が裏付けられている。
エビデンストレースと実行の証明は、検索されたエビデンス、ツール出力、メモリアイテム、環境観察、中間クレーム、アクション、最終回答がエージェントの実行を通してどのように接続されているかをモデル化することによって、このギャップに対処する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:12:47 GMT)
Temporal Order Matters for Agentic Memory: Segment Trees for Long-Horizon Agents [20.5] SegTreeMemは、会話履歴を発話上の時間順のSegment Treeとして表現する。
検索のために、SegTreeMemは、木を通して関連スコアを伝搬し、局所的なセマンティックマッチングと階層的時間的コンテキストを組み合わせる。
追加の時間順置換解析により、メモリ構築時の時間順の保存による性能向上が示されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:42:15 GMT)
When Evidence is Sparse: Weakly Supervised Early Failure Alerting in Dialogs and LLM-Agent Trajectories [20.3] 早期の障害警告では、ダイアログやエージェントのトラジェクトリがまだ展開されている間に、フェールするかどうかを判断する必要がある。
一般的には、トラジェクトリレベルの成功/失敗ラベルとしてのみ、監視が利用可能であるのに対して、アラートは部分的なインタラクションから引き上げなければならないため、これは難しい。
本稿では、このスパースエビデンス構造から学習し、その結果のリスク推定を制御可能な早期警報に利用する2段階のアプローチを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:28:27 GMT)
Learning Long Range Spatio-Temporal Representations over Continuous Time Dynamic Graphs with State Space Models [20.3] 連続時間動的グラフ(CTDG)は、進化するデータの微細な時間パターンをキャプチャする、よりリッチなフレームワークを提供する。
連続時間動的グラフのためのパラメータ効率のよい状態空間モデリングフレームワークを導出する。
CTDG-SSMは、LRT(long range temporal)と空間推論を必要とするデータセットにおいて、大きなパフォーマンス向上を達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:54:35 GMT)
Multilingual Coreference Resolution via Cycle-Consistent Machine Translation [20.2] コア参照解決はコアNLPタスクであり、機械翻訳、質問応答、文書要約など、幅広いダウンストリームアプリケーションを持つ。
本稿では,機械翻訳(MT)を英語からターゲットとする低リソース言語に活用する新しいコア推論分解パイプラインを提案する。
4つの低リソース言語の実験から、私たちのパイプラインはコア参照の解決において大きなパフォーマンス向上をもたらします。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:06:55 GMT)
Toward Multi-Domain and Long-Tailed Quantization via Feature Alignment and Scaling [20.1] 領域分布をCDFベースのプロジェクションで整列する効率的なマルチドメインアライメント量子化(EmaQ)を提案する。
EmaQをEmaQ-LTに拡張し、クラス条件の分散スケーリングと信頼性に基づくロジット調整を導入する。
実験により、EmaQとEmaQ-LTはドメインシフトとクラス不均衡の下で強い低ビット性能を実現することが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:16:58 GMT)
Insurance of Agentic AI [20.0] エージェント人工知能(AI)システムは、情報生成を越えて自律的な計画へと拡張することで、リスクランドスケープを変革している。
これらの能力は、サイバー、専門的責任、製品責任、ディレクターや役員の報道など、従来の保険カテゴリーに適さない新しい露出をもたらす。
本稿では、エージェントAIの新興保険市場について検討し、その引受、価格、再保証、製品設計の意味を理解するための枠組みを開発する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:10:38 GMT)
VentAgent: When LLMs Learn to Breathe -- Multi-Objective Arbitration for ARDS Ventilation [19.9] 本稿では,大規模言語モデルが機械的換気のための透明な調停器として機能する階層的なフレームワークであるVentAgentを紹介する。
VentAgentは意思決定を、知覚、計画、オーケストレーションの3つの解釈可能なステージに分解する。
コントロール決定を人間可読な推論チェーンに変換し、クリティカルケア自動化のためのより安全で解釈可能で適応可能なパラダイムを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:03:31 GMT)
Geometry-Preserving Unsupervised Alignment for Heterogeneous Foundation Models [19.9] ヴィジュアル言語基礎モデル(VLM)とヴィジュアル言語基礎モデル(VFM)の2つの支配的なパラダイムは、部分的にしか互換性がない。
本稿では,VFMとVLMの相補的強度を統合したGPUA(Geometry-Preserving Unsupervised Alignment)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:02:09 GMT)
On the Persistent Effects of Lexicality in Large Language Models [19.8] 大規模言語モデル(LLM)における意味的内容に対する語彙重なりの効果を定量化する。
語彙的影響はモデルの深さにまたがって広がり、一貫してアーキテクチャ、トレーニング体制、客観的機能にまたがっている。
語彙信号と意味信号の両方が同時に劣化する中深度領域を観察し、表象が表象と意味の両方に乏しい遷移状態を示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:55:08 GMT)
20 Second Parity Lifetime in an InAs--Pb Tetron Device [19.6] トポロジカル量子コンピューティングにおける中心的な約束は、励起ギャップの増加がデバイスの性能を大幅に向上させることである。
ここでは,InAs-Pbテトロンデバイスにおいて,この原理を干渉式単発パリティ測定により実験的に検証する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:49:57 GMT)
3DThinkVLA: Endowing Vision-Language-Action Models with Latent 3D Priors via 3D-Thinking-Guided Co-training [19.6] 3次元幾何学的知覚と3次元空間的推論は、異なる特徴階層で切り離され、注入される異なる能力である。
本稿では,視覚言語行動モデル(VLA)が行動予測中に暗黙的に3次元空間推論を行うことを可能にする3次元思考誘導協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:34:07 GMT)
The Invisible Hand of Physics: When Video Diffusion Models Know More Than They Show [19.5] IntPhys と InfLevel の拡散変圧器状態から物理可視性は線形に除去可能であることを示す。
驚いたことに、この信号はVAE潜伏入力を欠き、復調変圧器内部に現れる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:11:51 GMT)
Cone-Compatible Monge Geometry for High-Dimensional Ordered Optimal Transport [19.5] モンジュ幾何学:閉凸円錐 (K) は(y-xin K) がいつでも位数 (xpreceq_K y) を誘導する
コーン鎖に支持される措置は、量子型閉形式最適結合を許容する。
正準順序鎖分布上で得られたコーン鎖ワッサーシュタイン計量を区別する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:23:41 GMT)
New Benchmarking Shows Limited Generalization Power of TCR Antigenic Epitope Prediction Models [19.4] T細胞受容体(TCR)抗原特異性の計算学的予測は、T細胞生物学の研究を変換し、スケーラブルな免疫工学を可能にする。
既存のモデルには、幅広い用途に十分な感度と特異性がない。
ここでは、モデル性能と一般化可能性の偏りのない評価を可能にする2つの相補的なデータセットのクラスについて述べる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:14:05 GMT)
Executable Schema Contracts: From Automatic Ingestion to Multi-Source Retrieval [19.4] 実世界のデータは、暗黙のセマンティクスを持つテーブル、ドキュメント、半構造化ファイルにまたがる。
生のマルチソースデータから実行可能なスキーマを自動的に検出するシステムを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:28:36 GMT)
CausalPOI: Spatio-Temporal Graph-Based Causal Modeling for Cold-Start POI Check-in Forecasting [19.3] CausalPOIは、POIチェックイン予測のためのグラフベースの因果表現学習フレームワークである。
実世界のデータセットの実験では、CausalPOIは最先端のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:27:48 GMT)
M$^3$Eval: Multi-Modal Memory Evaluation through Cognitively-Grounded Video Tasks [19.3] M$3$Evalは、マルチモーダルモデルで異なるメモリ次元を探索するための最初の包括的な評価フレームワークとベンチマークである。
代表的マルチモーダルモデルにまたがって実験を行い、一貫した弱点と独特な振る舞いを明らかにする。
本研究は、メモリを基礎的かつ未探索の能力として強調し、マルチモーダルモデルにおいてより効率的なメモリ機構を設計するための洞察を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:28:57 GMT)
Validity Threats for Foundation Model Research [19.1] 制御された実験は、機械学習研究のバックボーンである。
しかし、近代的な基礎モデルの規模では、これらは違法に高価になっている。
代わりに、コミュニティは、理想的な実験をほんの少しのコストで近似する研究戦略にますます依存している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:57:42 GMT)
R-APS: Compositional Reasoning and In-Context Meta-Learning for Constrained Design via Reflective Adversarial Pareto Search [18.8] 大規模言語モデル(LLM)は、オープンなタスクに精通しているが、エージェント設定では、信頼性の高いデリバリが保証されない。
エラーは局所化せずに伝播し、最悪の場合の摂動は未評価となり、蓄積された知識は決して無効にされない。
帰納的、反事実的、メタ帰納的、是正的、帰納的推論は、相容れない方向に共有コンテキストを引き出す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:45:39 GMT)
CoRe-MoE: Contrastive Reweighted Mixture of Experts for Multi-Terrain Humanoid Locomotion with Gait Adaptation [18.8] 地形適応から歩行生成を分離する2段階強化学習フレームワークであるCoRe-MoEを提案する。
最初の段階では、安定な移動ポリシーが学習され、スムーズな遷移を伴う自然な歩行行動と走行行動が生み出される。
第2段階では、地形を意識したMoE分岐を導入し、ゲーティングネットワークを形成するための対照的な目的で訓練する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:51:46 GMT)
Environment-Robust Representation Learning with Empirical Bayes [18.8] マルチ環境予測問題を考える。
複数の環境からのデータセットが与えられた場合、そのような問題に対してベイズモデルを定式化する。
この目的は、モデルの構造によって誘導される環境ごとの項と、追加の環境間バランス項に分解されることを示す。
後部近似のための補正変分アルゴリズムを開発し,得られた学習潜時変数を用いて新しい環境下での予測を行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:12:46 GMT)
Modeling and Interpreting Teamwork Dynamics in Cancer Care Outcome Prediction [18.5] がん治療には、個々の患者のニーズに応じて治療を計画し、提供するための縦断的なアプローチが必要である。
計画とデリバリはチームベースのプロセスであり、複数の医療専門家の協調作業に依存します。
我々は,これらの協調構造に埋め込まれた患者生存の予測信号の同定に機械学習手法を適用した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:28:59 GMT)
GARL: Game-Theoretic Reinforcement Learning for Multi-Agent Strategic Prioritisation [18.5] マルチエージェント戦略優先順位付けのためのGAme-theoretic Reinforcement Learningフレームワークを提案する。
我々は、GARLを紛争における問題ランキングでインスタンス化し、そこでは、法的手続きにおいて中核的な問題を優先することを目的としている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:19:55 GMT)
GeM-NR: Geometry-Aware Multi-View Editing for Nonrigid Scene Changes [18.3] 一般的なマルチビュー一貫した画像編集のためのトレーニング不要なアプローチであるGeM-NRを提案する。
アンカー画像とクエリ未編集画像が与えられた場合、GeM-NRはアンカー編集と一貫してクエリ画像を編集する。
本手法は,編集シーンの3次元表現生成を含む,多種多様な編集タスクの一貫性を向上させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:49:48 GMT)
BreastGPT: A Multimodal Large Language Model for the Full Spectrum of Breast Cancer Clinical Routine [18.2] textbfBreastStageは、ワークフローに整合した乳房画像診断コーパスである。
次に、デュアルブランチビジュアルエンコーダと概念保存トークン圧縮を備えた統合MLLMである textbfBreastGPT を構築する。
BreastStage-Benchでは、BreastGPTは75.66%のクローズドエンド精度と89.92%のオープンエンドスコアを達成し、汎用MLLMと医療用MLLMの両方を上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:06:52 GMT)
Measuring Model Robustness via Fisher Information: Spectral Bounds, Theoretical Guarantees, and Practical Algorithms [18.1] ディープニューラルネットワークの堅牢性は、安全クリティカルなデプロイメントに不可欠である。
本稿では,Fisher Information Matrixのスペクトル規範に基づく,攻撃非依存のロバスト性指標を提案する。
我々のフレームワークは、攻撃に基づく評価を補完する解釈可能な診断ツールとして機能する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:50:38 GMT)
ReSGA: A Large Tail Risk Model for Learning Value-at-Risk and Expected Shortfall [18.1] 本稿では,資産の豊富な断面積依存性と長期時間的ダイナミクスを活用するために,検索強化自己グループオートエンコーダ(ReSGA)を提案する。
ReSGAは、1926年から2023年までの米国株式の毎月のリターンに153の堅実な特性で適用される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:11:45 GMT)
Think Fast and Far: Long-Horizon Online POMDP Planning via Rapid State Sampling [18.1] 本稿では,高速状態空間サンプリング(ROP-RAS3)による参照型オンラインPOMDP計画法を提案する。
ROP-RAS3は、非常に高速なサンプリングベースのモーションプランニング技術を使用して、状態空間をサンプリングし、オンラインで様々なマクロアクションを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:14:48 GMT)
Search-Time Contamination in Deep Research Agents: Measuring Performance Inflation in Public Benchmark Evaluation [17.9] ディープリサーチエージェント評価における検索時間汚染(STC)について検討する。
STCは広く普及しており、パフォーマンスを最大4%向上させることができる。
我々は,サンドボックスの分離,透明な探索トラジェクトリ,ベンチマークアクセス制御など,汚染に配慮したプラクティスを提唱する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:11:36 GMT)
Beyond Single-Policy: Evaluating Composed Organization-Specific Policy Alignment in LLM Chatbots [17.8] COPALは、チャットボットにおける合成政治アライメントを評価する自動化ツールである。
経験的に派生したインタラクションパターンと明示的なハンドリングコントラクトを通じて、コンポジションポリシー障害をトリガーするクエリを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:17:26 GMT)
Optical-Guided Neural Collapse for SAR Few-Shot Class Incremental Learning [17.7] 合成開口レーダ画像におけるクラスインクリメンタルラーニング (FSCIL) は, 独特な課題を呈している。
神経崩壊に触発された光誘導型SAR FSCILフレームワークを提案する。
提案手法は,光学的ATRデータセットと24種類のターゲットクラスを持つSAR ATRデータセットからなるベンチマークで評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:09:20 GMT)
Efficient and Training-Free Single-Image Diffusion Models [17.6] 内部構造が単一の参照画像と一致した画像を生成することの問題点を考察する。
我々は、パッチベースのデノイザを、効率的でトレーニング不要な画像拡散モデルに統合する。
提案手法は,訓練された単一画像拡散モデルと比較して,最先端の世代品質と多様性を実現する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:05:36 GMT)
GGT-100K: Generative Ground Truth for Generalizable Real-World Image Restoration [17.5] 実世界の低品質(LQ)画像から高品質(HQ)ターゲットを生成するために,GGT(Generative Ground Truth)を提案する。
VLMをベースとした適応的プロンプトを持つナノバナナ-2は、知覚的にリアルでコンテンツに忠実なHQターゲットを合成する能力が最も高い。
GGT-100Kは103,707個のトレーニングペアで構成され,多様なシーンと複雑な実世界の劣化をカバーしたLQ-HQペアデータセットである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:01:24 GMT)
Label Over Logic? How Source Cues Bias Human Fallacy Judgments More Than LLMs [17.4] 我々は、推論評価におけるソースラベルバイアスが主に人間の脆弱性であるかどうかを評価する。
我々の研究は、AIを介する環境における人間とLLMのコラボレーションの可能性を強調した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:39:58 GMT)
Agentic Monte Carlo: Simulating Reinforcement Learning for Black-Box Agents [17.3] LLMエージェントは、強化学習(RL)に適したオープンウェイトエージェントと、テスト時に純粋に制御されなければならないブラックボックスエージェントの2つの異なる状態で動作する。
我々は,ブラックボックスエージェントの最適ポリシから直接,エージェントモンテカルロを提案する。
我々は、AgentGymベンチマークから3つの多様な環境においてAMCを検証し、ベースラインの促進よりも大幅に改善したことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:07 GMT)
VCIFBench: Evaluating Complex Instruction Following for Video Understanding [17.0] 本稿では,映像理解における複雑な指導方法を評価するためのベンチマークVCIFBenchを紹介する。
VCIFBenchは、ベンチマーク適応プロンプトとビデオ接地プロンプトの両方から制約に富んだ命令を構築する。
本稿では,VCIFBenchデータに対するDPOトレーニングにより,命令追従性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:27:53 GMT)
A Systematic Evaluation of Positional Bias in Multi-Video Summarization with MLLMs [17.0] 映像毎の要約の質がビデオの入力スロットによって変化しうるマルチビデオ要約における位置バイアスについて検討する。
9つのオープンソースおよびプロプライエタリなMLLMを評価し,3つの相補的指標を用いて位置効果を測定した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:34:31 GMT)
FoeGlass: Simple In-Context Learning Is Enough for Red Teaming Audio Deepfake Detectors [16.9] 音声のディープフェイク検出モデルは、テキスト音声(TTS)モデルの悪意ある使用に対処するために重要である。
ADDのための最初のブラックボックス自動リピート方式であるFoeGlassを提案する。
また,FoeGlassは,非条件サンプリングベースラインと最近のスプーフィングデータセットの偽陰性率を最大94%向上させることを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:04:26 GMT)
Extending AI for Research to the Humanities: A Multi-Agent Framework for Evidence-Grounded Scholarship [16.7] SPIRE(Scholarly-Primitives-Inspired Research Engine)は、エビデンスに基づく人文科学研究のためのマルチエージェントフレームワークである。
複数スケールのクローズドリーダー基板上での協調エージェントの役割として、人文操作を繰り返す。
答えの正確性、深さ、カバレッジ、証拠の質について、より高いブラインド・ジャッジスコアが与えられる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:48:36 GMT)
BEATS: Bootstrapping E-commerce Attribute Taxonomies for Search through Iterative Human-AI Collaboration [16.7] BEATSは、スクラッチから製品属性をブートストラップするための、ヒューマン・イン・ザ・ループ LLM フレームワークである。
本システムは楽天台湾で展開され,2,694のサブカテゴリと67,277の属性からなる9つの主要カテゴリに集約されている。
540万以上の製品が生成した属性でタグ付けされており、製品カタログ全体を充実させる計画だ。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:06:27 GMT)
AdaKoop: Efficient Modeling of Nonlinear Dynamics from Nonstationary Data Streams with Koopman Operator Regression [16.5] 本研究では,非定常データストリーム上の非線形ダイナミクスをモデル化する効率的なストリーミングアルゴリズムであるAdaKoopを提案する。
AdaKoopは、反復的非線形最適化の計算コストを抑え、ストリーミング方式で非線形力学の効率的かつ安定したモデリングを可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:23:32 GMT)
Linear Probes Detect Task Format, Not Reasoning Mode in Language Model Hidden States [16.5] 大規模言語モデル(LLM)隠れ状態の線形探索は、モデルが異なる推論型に対して異なる表現を学習すると主張するために広く用いられている。
古典的三分法にまたがる3つのベンチマーク、LogiQA 2.0 (導出性)、ARC-Challenge (導出性)、$$NLI (導出性)で、QwensicBによりこれを検証した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:53:39 GMT)
ProtoAda: Prototype-Guided Adaptive Adapter Expansion and Geometric Consolidation for Multimodal Continual Instruction Tuning [16.2] MLLM(Multimodal Large Language Models)は、命令チューニングによって高いパフォーマンスを達成するが、現実のデプロイメントでは、新たな視覚言語機能を取得する必要がある。
近年の手法では、画像-テキスト類似性ルーティングのMixture of LoRA Expertsのようなスパースアーキテクチャが採用されている。
プロトタイプ誘導適応チューニングフレームワークProtoAdaを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:49:24 GMT)
A Model of Multi-turn Human Persuadability Using Probabilistic Belief Tracing [16.2] PERSUASIONTRACEは、ヒト-LLM相互作用の説得を研究するためのフレームワークである。
それは、人間またはシミュレートされた説得の標的から多ターンの信条を記録する。
説得者回転を修辞次元でアノテートし、実人の信念のダイナミクスに忠実さでシミュレータを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:17:20 GMT)
EviRank: Evidence-Based Confidence Estimation for LLM-Based Ranking [16.1] 大規模言語モデルは推奨を約束するが、ドメインカバレッジと本質性に制限があるため、信頼性の懸念が高まる。
既存の不確実性定量化手法は,(1) 質問応答に対する大域的信頼度スコアがランクリストにおいてどの位置が信頼できないかを明らかにするのに失敗し,(2) モデル内部から抽出されたきめ細かい信頼度が全位置にわたって均一に低い値を示し,信頼できない予測をフィルタリングすることが不可能である,という2つの基本的な課題を継続する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:11:30 GMT)
A prism hierarchy of learning regimes in large linear autoencoders [16.1] 形式的損失拡大階層のレベルでは、その極端な構造は三角形のプリズムの面と自然に関連していることを示す。
特に、プリズムの2面に付随する5つの基本的な極端規則が存在する:(1)大データ、(2)小データ、(3)平均場、(4)狭ラテント、(5)自由である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:24:05 GMT)
Towards Efficient and Evidence-grounded Mobility Prediction with LLM-Driven Agent [15.8] 監視されたシーケンスモデルは高い精度を達成するが、タスク固有のトレーニングが必要であり、決定レベルの透明性が制限される。
LLMに基づく最近の手法は解釈可能性を改善するが、ほとんどの場合静的なプロンプトとシングルパス推論に依存している。
本稿では,次の位置予測をアダプティブエビデンス制御による意思決定として定式化する,学習不要なLCM駆動エージェントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:34:01 GMT)
Description-Code Inconsistency in Real-world MCP Servers: Measurement, Detection, and Security Implications [15.8] 本稿では,実世界のMPPサーバにおけるDCI(Description-Code Inconsistency)の総合的研究について述べる。
機能不整合と非宣言副作用にまたがる包括的分類法を提案する。
この分類法を,2,214の実世界MPPサーバから抽出した19,200の記述符号対からなる大規模データセットに適用した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:51:32 GMT)
SentinelBench: A Benchmark for Long-Running Monitoring Agents [15.7] SentinelBenchは、時間進化モニタリングタスクのためのオープンソースのベンチマークである。
メール、カレンダー、ファイナンス、プロフェッショナルネットワーキング、エンターテイメントなど10の合成ウェブ環境に100のタスクがある。
タスク完了、反応時間、リソース使用量を計測し、応答性とコストのトレードオフを明らかにする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:32:00 GMT)
SharedRequest: Privacy-Preserving Model-Agnostic Inference for Large Language Models [15.7] 本稿では,プライバシ保護を個別のプロンプトレベルではなくバッチレベルで再構成する,プライバシ保護推論のためのモデルに依存しないフレームワークを提案する。
SharedRequestは、従来の差分プライバシーベースラインに比べて20%以上高いユーティリティを実現していることを示す。
その共有プロンプト機構は、非バッチ推論と比較してクエリコストを最大5倍に削減する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:23:06 GMT)
Topics as Proxies for Sociodemographics: How Conversational Context Affects LLM Answers [15.5] 本研究では,大きな言語モデル(LLM)が,単一の会話履歴からユーザ社会デマトグラフィーを推測するのに苦労していることを示す。
会話の話題は、会話の文脈内でLLM生成のアドバイスを最も予測することを発見した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:40:01 GMT)
FlowPRO: Reward-Free Reinforced Fine-Tuning of Flow-Matching VLAs via Proximalized Preference Optimization [15.4] FlowPROは、フローマッチングポリシーのための報酬なし、オフラインで強化された微調整フレームワークである。
本稿では,VLAモデルのフローマッチング動作ヘッドに適した優先最適化対象であるRPROを提案する。
FlowPROは最高成功率に達し、4つの代表的なベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:47:43 GMT)
CleanCodec: Efficient and Robust Speech Tokenization via Perceptually Guided Encoding [15.2] CleanCodecは、知覚上重要な機能のみをエンコードし、認識不能な情報を破棄することを学ぶ。
毎秒わずか12.5トークンで、CleanCodecは最先端のトークン化効率を達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:56:14 GMT)
Listening to the Workforce: Measuring Construction Worker Safety Attitudes from Social Media Discourse Using LLMs [15.0] 安全姿勢は多次元的であり、話題によって異なり、労働者自身の会話の中で最も率直に表れている。
本研究は,建設安全姿勢枠組み(CSAF)の作成と検証を行った。
CSAFをRedditのr/Constructionコミュニティから250の投稿やコメントに適用すると、訓練されたコーダーは強い合意に達した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:54:40 GMT)
Subliminal Learning Is Steering Vector Distillation [14.8] サブリミナルラーニング(サブリミナルラーニング)とは、微調整時に教師の特質を習得する学生言語モデルである。
サブリミナル学習は1つのステアリングベクトル、すなわちモデルのアクティベーションに付加されるベクトルによって媒介されることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:46:22 GMT)
VT-3DAD: Cross-Category 3D Anomaly Detection via Visual-Text Normal Space Alignment [14.7] クロスカテゴリ3D異常検出は、未知の点雲が対象の正規カテゴリーに属するかどうかを判定することを目的としている。
VT-3DADは,視覚-テキスト正規空間アライメントによる3次元異方性検出のためのトレーニング不要フレームワークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:34:20 GMT)
CIPER: A Unified Framework for Cross-view Image-retrieval and Pose-estimation [14.6] クロスビュージオローカライゼーションは、地上画像の位置を航空画像データベースとマッチングすることによって推定する。
既存の手法では、大規模な検索と正確なポーズ推定のいずれかによってこれに取り組むが、両方ではない。
両タスクを共同で実行する単一アーキテクチャであるCIPER(Cross-view Image-Retrieval and Pose-estimation TransformER)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:31:06 GMT)
SparDA: Sparse Decoupled Attention for Efficient Long-Context LLM Inference [14.5] 疎結合なスパークアテンションアーキテクチャであるSparDAを提案する。
Forecastは次のレイヤに必要なKVブロックを予測し、ルックアヘッドの選択を可能にする。
SparDAはスパース事前の8Bモデルの精度をわずかに向上させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:42:05 GMT)
Creative Reading: Scaffolding Reading for Transformation [14.2] 読み上げ拡張システムは、読者が大規模にテキストを処理するのにますます役立っている。
これらのツールは、読み書きを情報伝達として暗黙的にフレーム化し、機械に解釈と努力を委譲する「捨てる読み方」である。
我々は、読者の読書と読者としての自己の両方を創造するのを支援する読書増強という、創造的な読書を代替の目標として提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:27:05 GMT)
ReasoningFlow: Discourse Structures for Understanding LLM Reasoning Traces [13.9] ReasoningFlowは、LRM推論の談話構造を微粒な非巡回グラフにトレースするフレームワークである。
ReasoningFlowグラフを解析することにより、異なるベースモデルからトレーニングされているにもかかわらず、LRMは構造的に類似したトレースを示すことがわかった。
ReasoningFlowは、トレース監視性を改善するために使用できる、さまざまなきめ細かい推論動作を明らかにする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:12:26 GMT)
MusaCoder: Native GPU Kernel Generation with Full-Stack Training on Moore Threads GPU [13.8] MusaCoderは、ネイティブGPUカーネル生成とMUSAバックエンドのためのフルスタックのトレーニングフレームワークである。
プログレッシブカーネル指向のデータ、多様性指向の拒否微調整、実行フィードバック強化学習を組み合わせる。
MusaCoderは、正確性と実証的なスピードアップの両方において、強力なオープンソースとプロプライエタリなベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:15:30 GMT)
Probing PbTe-Pb nanowire devices with radio-frequency reflectometry [13.7] CdTe基板上に選択的領域成長PbTe-Pbナノワイヤデバイスに高周波(rf)反射計を実装した。
この結果により,PbTe量子デバイスの高速制御が可能となり,トポロジカル量子計算への応用が可能となった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:27:37 GMT)
DP-MacAdam: Differentially Private Mechanism with Adaptive Clipping and Adaptive Momentum [13.7] 個人差分勾配勾配(DP-SGD)は、プライバシ保護機械学習の標準フレームワークとなっている。
適応クリッピングと適応モーメント(DP-MacAdam)を併用した微分プライベート機構を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:58:34 GMT)
COP-Q: Safety-First Reinforcement Learning for Robot Control via Cholesky-Ordered Projection [13.7] 政治的でない安全な強化学習では、報酬と安全性のQ値が、別の批評家アンサンブルによって一般的に学習される。
この客観的な扱いはオブジェクト間の相関を無視し、過度に保守的な値の推定につながる可能性がある。
ベクトル値の推定にオブジェクト間の共分散を組み込んだ安全第一手法であるColesky-Ordered Projection Q-learning (COP-Q)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:30:10 GMT)
Entity Binding Failures in Speech LLM Reasoning: Diagnosis and Chain-of-Thought Intervention [13.6] 音声大言語モデル(SLLM)は、複雑な推論においてテキストモデルよりも性能が低い。
空間的, 構文的, 事実的タスクにおいて, テキスト間マッチング(S2T)はテキスト間マッチング(T2T)を超えているかを示す。
エンティティ追跡を必要とする論理的タスクでは、S2Tの精度は偶然に崩壊する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:44:09 GMT)
PureLight: Learning Complex Luminaires with Light Tracing [13.5] 発光器から出口面への経路構築には光トレーシングを用いる。
学習した外観を、出口面の放射率を直接推定する軽量な計算に蒸留する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:48:27 GMT)
Rethinking Incompleteness: Formalizing Protocol Divergence and Train-Once Learning for Robust IMVC [13.5] IMVC評価は、異なるデータ構成のための別々のモデルを再訓練する。
欠落率だけではデータの不完全性を特徴づけるには不十分である。
我々はこの現象を不完全分散として定式化し、欠測データプロトコル間の構造的格差を捉える手段を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:24:09 GMT)
Quantum Time Lower Bounds by Permutation Invariance [13.5] 我々は、量子状態の置換不変性をテストするために、量子時間複雑性の低い境界を確立するためのフレームワークを提供する。
応用として、入力量子状態へのサンプルアクセスが与えられたときに、一致した下界の一連の値を得る。
我々の知る限りでは、これは量子時間複雑性の厳密な下限を体系的に確立できる最初の方法である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:03:24 GMT)
Improving the Efficiency and Effectiveness of LLM Knowledge Distillation for Conversational Search [13.4] Conversational Search (CS)は、会話コンテキストに基づく関連文書の検索を検討する。
最近の研究は、KLD(Kullback-Leibler Divergence)を蒸留に応用し、教師信号とのアライメントを緩和している。
会話探索におけるKLDに基づく蒸留の諸側面について検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:22:22 GMT)
Towards Unified and Data-Efficient Prognostics and Health Management with Tabular Foundation Models [13.4] Data-driven Prognostics and Health Management (PHM) は、システム状態の診断と、エンジニアリングされた資産の残りの有用な寿命を見積もるために、時間変化のある状態監視データを使用する。
これらのタスクはメンテナンス計画の中心であるが、産業用PHMデータは断片化され、部分的に観察され、ラベルが不十分であることが多い。
In-context Learning を用いた産業時系列に Tabular Foundation Models を適用するためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:00:29 GMT)
Test-Time Compute Scaling for ASR with Depth-Conditioned Looped Transformers [13.3] 我々は、再帰エンコーダ深さを制御可能なテスト時間計算軸に変換する、深さ条件付きループ変換器 LARM を導入する。
LibriSpeechでは、推論ループの数が増加するにつれて、LARMはWERを改善している。
この結果から, 自動回帰言語モデル推論から連続非自己回帰音声認識まで, テストタイムの計算スケーリングが拡張できることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:01:45 GMT)
Ekka: Automated Diagnosis of Silent Errors in LLM Inference [13.2] サイレントエラーの診断は、高レベルな症状と低レベルな根本原因との間に意味的なギャップがあるため、非常に難しい。
中間実行状態を体系的に整列し比較することにより根本原因を同定する自動診断システムであるEkkaを提案する。
Ekkaは80%のパス@1診断精度と88%のパス@5診断精度を示し、最先端システムを上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:32:13 GMT)
Unlocking Exponential and Unbounded Robust Gains in Shannon Capacity of Classical Multiple Access Channels with Causal CSIT via Quantum Entanglement Assistance [12.8] 量子エンタングルメント支援は,ユーザ数の増加に伴い指数関数的に増加する乗法的キャパシティのアドバンテージを提供する。
少数のユーザと小さなアルファベットサイズであっても、相当な乗算能力の増大が見られる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:27:35 GMT)
From Symbolic to Geometric: Enabling Spatial Reasoning in Large Language Models [12.7] 近年の大規模言語モデル (LLM) は空間推論能力を示すことが多い。
この能力は、空間上の真のエンフェロメトリー推論ではなく、空間言語上のパターンマッチングから生じる、主にエンフェロボリックである。
EmphSpatial Language Model (SLM) は、位置情報を第一級のモダリティとして扱う最初のマルチモーダル LLM である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:54:59 GMT)
How Far Did They Go? The Persuasive Tactics of Covert LLM Agents in a Discontinued Field Experiment [12.7] 本研究では、Redditのr/ChangeMyViewにおけるフィールド実験の中止から、公開データセットを分析した。
この介入は、未知の外部研究者によって実施され、倫理的反発を受けて停止された。
公開公開後、Redditはモデレーターに対して、AI生成されたコメントのアーカイブをリリースすることを許可した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:58:32 GMT)
Synthesize and Reward -- Reinforcement Learning for Multi-Step Tool Use in Live Environments [12.6] 本稿では,3つのコントリビューションを持つPROVE(Programmatic Rewards On Verified Environments)を提案する。
20のステートフルMPPサーバからなるライブラリは343のツールを公開し、セッションスコープによるステートアイソレーションによるライブ実行RLトレーニングを可能にする。
状態マシンデータ合成パイプラインは、ライブサンプリングされたサーバ状態にグラウンドされたマルチターンツールコールトラジェクトリを生成し、実際に存在するクエリ参照エンティティを生成する。
BFCLのMulti-Turn、tau2-bench、T-Evalでは、PROVEは最大+10.2、+6.8、+6.5ポイントの改善をもたらす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:27:54 GMT)
REGAIN: REconciliation GAIN-driven Auxiliary Direction Learning [12.6] 本稿では,正規化された補助方向を学習する和解利得フレームワークを提案する。
有効な補助指示は未解決の標的不確実性について補完的な情報を提供する必要があることを示す。
北京PM2.5とオーストラリア観光データの実験では、ゲイン選択された測定値が通常の多変量と階層予測の両方を改善することが示されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:53:27 GMT)
TabSODA: Tabular Diffusion based Imputation with Skip Pattern Detection and Ordinal Awareness [12.3] textbfTabSODA (textbfTabular diffusion with textbfSkip pattern detection and textbfOrtextbfdinal textbfAwareness) を導入する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:09:40 GMT)
Prediction Under Imperfect Compression: A Theory of Approximate MDL [11.9] 近似および正規化の形式の下で、MDLは信頼できる逐次予測を保証できるか?
重み付けされた MDL 目的のより一般的な形の加法的 slack $C$ の近似に対して、累積期待二乗予測誤差はすべての$ge1$に対して有限であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:03:56 GMT)
LazyAttention: Efficient Retrieval-Augmented Generation with Deferred Positional Encoding [11.8] キーバリュー(KV)キャッシュは、生成されたトークンに対する過去の計算を再利用することで、大きな言語モデル(LLM)の推論を加速する。
既存のソリューションは、再利用をプレフィックスに制限するか、位置再符号化のために高価なメモリの実体化を必要とする。
本稿では、遅延位置符号化をカーネル化し、ゼロコピーで位置に依存しないKVの再利用を可能にする新しいアテンション機構であるLazyAttentionを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:12:22 GMT)
Multi-Granularity 3D Kidney Lesion Characterization from CT Volumes [11.7] 本研究は, 腎CTの特徴を病期ごとのセット・プレディション・タスクとして再検討する。
当科で788名の患者から2,619個のCTボリュームを採取した。
サイズ距離ハンガリーマッチングを用いたDETRスタイルアーキテクチャである textbfLesionDETR を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:28:57 GMT)
Policy Gradient for Continuous-Time Robust Markov Decision Processes [11.6] 本稿では,マルコフ決定プロセスフレームワークにおけるポリシーアルゴリズムについて検討する。
ポリシー勾配と逆勾配は、パスワイズ式と随伴式を用いて導出される。
平均場オプティマイザを$tildemathcalO(frac1K)$ Oracle-based convergence rateおよび$tildemathcalO(fracN2)$ sample complexity under $N$- Particle approximationとして提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:25:20 GMT)
Strabo: Declarative Specification and Implementation of Agentic Interaction Protocols [11.5] UCPは、AIエージェントのeコマースインタラクションを標準化するためのGoogle主導の取り組みだと考えている。
私たちはLangshawのプログラミングモデルであるPeachを使ってエージェントを実装します。
Peach エージェントが Google によって実装された UCP エージェントと相互運用可能であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:05:25 GMT)
PSEBench: A Controllable and Verifiable Benchmark for Evaluating LLMs in Patient Safety Event Triage [11.5] 患者安全イベントトリアージ(英: patient safety event triage)は、患者安全の専門家が通常手動で行うハイテイクタスクである。
ミネソタ州では29のReportable Adverse Health Eventsでこの方法をインスタンス化しています。
PSEBenchは、エージェント評価環境を備えた5,074ケースのベンチマークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:41:39 GMT)
I Know What You Meme, Even If it Emerged Today: Understanding Evolving Memes through Open-World Knowledge Acquisition [11.5] マルチモーダル・ミームは動的であり、しばしば解釈の背景知識を必要とする。
Query Retrieve Concludeはゼロショットフレームワークで、不足した知識を特定し、オープンなWebエビデンスを取得する。
また、2024年から2026年までの最近のミームのキュレートされたミーム理解ベンチマークを、外部の背景知識アノテーションとともに導入した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:06:14 GMT)
Multi-Camera AR Guidance System for Surgical Instrument Handling and Assembly: Investigating Workload and Efficiency [11.4] 本稿では,マルチカメラの6Dポーズ推定と,ヘッドマウントディスプレイ上での拡張現実のin-situビジュアライゼーションを併用した手術機器支援システムを提案する。
手術膝シミュレーションにおいて,29名のスクラブ看護師によるユーザスタディを行い,本システムと紙マニュアルとの比較を行った。
ARガイダンスは、手作業と比較して、認識された作業負荷を著しく削減した。
特に、スクラブ看護師は、システムを使用する際に利益を得た楽器セットをあまり経験していない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:13:05 GMT)
Real-World Deployment of a 5G-Connected Edge-Controlled Aerial Robot in Industrial Subterranean Mines [11.3] 本稿では,エッジオフロードコントローラによって制御される5G接続型空中ロボットの現実飛行について述べる。
ロボットは活発な工業地雷の中で動作し、ハイレベルなコントローラーは近くのエッジクラスタに配置される。
人間のオペレータが空飛ぶロボットのウェイポイントを選択し、MPCは自律実行のためのスムーズな無衝突経路を生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:40:56 GMT)
SAID: Accelerating Diffusion-Based Language Models via Scaffold-Aware Iterative Decoding [11.2] 拡散大言語モデル (DLLM) は、双方向コンテキストで劣化したトークンを反復的にデノベートすることで、非自己回帰的な計算生成を可能にする。
本稿では,トークン間の再配置によってDLLMを高速化するScaffold-Aware Iterative DecodingフレームワークであるSAIDを提案する。
数学、コーディング、知識ベンチマークにおけるLLaDA-8BとLLaDA 1.5の実験は、SAIDが競争性能を維持しながら最大9.1倍の速度で推論を著しく加速することを示している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:56:42 GMT)
SemBlock: Semantic Boundary Dynamic Blocks for Diffusion LLMs [11.2] SemBlockは、拡散言語モデルのための意味駆動型動的ブロックデコーディングフレームワークである。
本研究では,セマンティック・バウンダリ・データセットであるSemBoundを構築した。
GSM8K、IFEval、MATH、HumanEvalの実験では、SemBlockは固定ブロックデコーディングやAdaBlockよりも一貫して改善されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:48:27 GMT)
An interpretable and trustworthy AI framework for large-scale longitudinal structure-pain association studies using data from the Osteoarthritis Initiative (OAI) [11.1] 変形性膝関節症(MOAKS)の特徴を膝関節MRIから直接予測するためのディープラーニングフレームワークを開発した。
我々は、予測不確実性定量化を提供するために共形予測を組み込んだ。
長手型遅発型混合モデル(LCMM)を応用し,鍵構造異常と4つの相補的膝痛測定の関連について検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:59:38 GMT)
What Can Eye Gaze Teach Us About Real-World Cycling? Insights From the Oxford RobotCycle Project [10.9] 本稿では,英国オックスフォード市におけるサイクリングの安全性について考察する。
異なる環境やイベント下での知覚の違いに関する洞察を生み出すために、ウェアラブルアイトラッキングメガネの能力を探求する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:11:26 GMT)
LLM-Guided ANN Index Optimization for Human-Object Interaction Retrieval [10.9] ビジュアル検索、レコメンデーションエンジン、マルチモーダル質問応答など、現代のAIアプリケーションを支えるマルチステージ検索システム。
本稿では,この制限を相認識型大規模言語モデル (LLM) エージェントを用いて解決する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:28:34 GMT)
Scaling Datasets for Multi-Sensor, Multi-Agent, and Multi-Domain Learning in Autonomous Systems [10.9] 地上, 航空, インフラベースシステムのためのテラバイト規模の地上構造ラベル付きデータを生成するモジュール型データセット生成パイプラインを提案する。
生成されたデータがどのようにアプリケーション固有のトレーニングと協調的な自律性をサポートするかを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:46:44 GMT)
DeliChess: A Multi-party Dialogue Dataset for Deliberation in Chess Puzzle Solving [10.7] DeliChessは、グループ熟考対話の新しいデータセットである。
各グループはまずパズルを個別に完了し、その後、修正された集合回答を提出する前に複数のパーティで議論を行う。
チェスエンジンの評価に基づいて,3つの指標を用いて評価を行った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:08:46 GMT)
Continual Visual and Verbal Learning Through a Child's Egocentric Input [10.6] 本研究では,SAYCamデータセットを単一の時系列パスで処理する連続的マルチモーダル学習フレームワークであるBabyCLを紹介する。
BabyCLは、SAYCam Labeled-S 4AFCベンチマークでストリーミング学習のベースラインを上回り、オフライントレーニングの上限をかなり狭めている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:20:18 GMT)
Deterministic Envelopes for Tamed SGLD: Decoupling Stochastic-Gradient Noise and Localizing Taming [10.6] ランゲヴィンアルゴリズムは、しばしば非グロブリーリプシッツドリフトを安定化するためにテーマディノミネーターを使用する。
本稿では, 安定化分母が数値化子と同じ段階的実現に依存する場合, テーキングステップがオラクル自体を変化させ, 定常バイアスを生じさせることを示す。
そこで我々は, 組込み型分母を設計するための構造保存フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:23:16 GMT)
ReConFuse: Reconstruction-Error Guided Semantic Fusion for AI-Generated Video Detection [10.5] ビデオレベルのAI生成ビデオ検出のための再構成誘導型セマンティックフュージョンフレームワークReConFuseを提案する。
ReConFuseは、WF-VAE再構成ビデオから再構成エラーキューを抽出し、それらを多フレームセマンティック特徴と整列させ、Mambaベースのモジュールを使用してビデオレベルの分類のための時間的進化をモデル化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:35:47 GMT)
SFMambaNet: Spectral-Frequency Enhanced Selective State Space Model for Correspondence Pruning [10.4] 対応プルーニングは、初期対応セットから不整合を識別することを目的としている。
既存のグラフニューラルネットワーク(GNN)ベースの手法のほとんどは、粗いユークリッド座標からマッピングされた幾何学的特徴に依存している。
SFMambaNetは,新しいスペクトル周波数拡張型マンバ型2視点対応プルーニングネットワークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:18:05 GMT)
Generalization of World Models under Environmental Variability for Vision-based Quadrotor Navigation [10.4] 世界モデルは、環境がどのように進化するかを予測する学習された生成モデルであり、サンプル効率のよいロボット学習のための有望なツールとなっている。
本研究では,視覚に基づく四角形ナビゲーションをテストベッド問題とし,環境ランダム性の異なるDreamerV3ベースの世界モデルを訓練する。
そして、すべての世界モデルと関連するナビゲーションポリシーを、すべてのセンサーが切断される前に実際の感覚入力を2.5秒だけ受信するオープンループランなど、目に見えない環境で実際の四角形に展開します。
以上の結果から,SSL事前トレーニング中の世界モデルロバスト性はsim-to-realの強い予測因子であることが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:38:36 GMT)
Synthetic Contrastive Reasoning for Multi-Table Q&A [10.3] マルチテーブルの質問応答には、関連するエビデンスを取得し、スキーマをリンクし、リレーショナルテーブルをまたいだ合成推論を実行するモデルが必要である。
既存のマルチテーブルのQ&Aリソースは、質問や最終回答を提供するが、どのように回答が導出されるかを説明する推論の監督が欠如している。
検証された正のトレースと有意な負のトレースを生成することで,MMQAのための合成コントラスト推論トレースデータセットを構築した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:35:54 GMT)
Hyper-ICL: Attention Calibration with Hyperbolic Anchor Distillation for Multimodal In-Context Learning [10.3] Hyper-ICLは、デモフリーマルチモーダルICLのためのトレーニングベースのフレームワークである。
推論時にICDを必要とせずに直接デモ効果を再構築する。
バニラICLと既存の最先端の手法の精度と安定性を一貫して改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:32:09 GMT)
MedSyn2: Flexible Control of 3D CT Generation via Text and Semantically-Defined Segmentation Prompts [10.3] 本稿では,放射線学レポートやセグメンテーションプロンプトからの入力をサポートする可制御性ボリューム画像生成のためのフレキシブルなフレームワークを提案する。
我々のアプローチでは、ユーザーは完全なアノテーションを必要とせずに、特定の解剖学または異常のセグメンテーションを提供できる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:10:03 GMT)
A Geometric Characterization of the Stationary Plateau for Two-Layer Neural Networks [10.3] 2層ニューラルネットワークのロスランドスケープに生じる定常台地の幾何学的構造について検討する。
隠れたニューロンを複製すると、より広いネットワークでアフィン集合の静止点が生成される「ニューロン分割」現象に焦点を当てる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:03:34 GMT)
Rethinking Sales Lead Scoring with LLM-based Hierarchical Preference Ranking [10.2] セールスリードのコンバージョンは、長い意思決定サイクルと多段階のファンネルのために、eコマースのレコメンデーションとは根本的に異なる。
従来のリードスコアリング手法では、スパース監視、非構造化CRMログのセマンティックギャップ、相対的なリード優先度の取得が不可能といった深刻な課題に直面しています。
我々は、構造化CRM機能と非構造化顧客インタラクションの連成モデリングを支援するLLMベースのセールスリードスコアリングのための差別的フレームワークについて紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:05:57 GMT)
HyFAD: Hybrid Time-Frequency Diffusion with Frequency-Aware Embedding for Time Series Imputation [10.2] 時系列計算のための時間周波数拡散モデルである textbfHyFAD を提案する。
周波数領域拡散プロセスは高周波スペクトル成分を洗練させる一方、低周波グローバルトレンドを捉える。
複数のベンチマークデータセットの実験は、HyFADが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:03:37 GMT)
Stepwise Reasoning Enhancement for LLMs via External Subgraph Generation [10.2] 大規模言語モデルは、複雑な多段階推論における論理的一貫性、事実的基盤、解釈可能性に苦慮している。
本稿では,大規模言語モデルと外部知識グラフを統合するフレームワークであるSGRを提案する。
実験によると、SGRは推論精度とHits@1のパフォーマンスを標準プロンプトよりも改善している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:58:02 GMT)
GlossAssist -- A Tool to Simplify Corpus Creation and Study the Effect of NLP Models in Low-Resource Documentation Settings [10.1] 本稿では,CWoMPの検索に基づくアーキテクチャを中心に構築されたグロスツールであるGrossAssistを紹介する。
本システムでは,アノテータによる各補正をアクティブな学習環境の一部として扱い,レキシコンを拡張し,モデルの再トレーニングを必要とせずに将来の予測を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:29:30 GMT)
Localizing Prompt Ambiguity in Large Language Models with Probe-Targeted Attribution [9.9] 本稿では、プローブロジットを用いて遅延曖昧さをトークン位置に属性付ける勾配属性法であるPRIGを紹介する。
具体的には、PRIGは、不明瞭なプロンプトから明確なプロンプトを区別するために線形プローブを訓練し、プローブスコアを残留ストリームの以前のトークン表現に属性付けする。
この設定では、PRIGは、勾配の属性ベースラインよりもかなりよく不明瞭なスパンを局在させ、合成ベンチマークで0.840 AUROC、金セットで0.891 AUROCを達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:15:43 GMT)
Federated Learning for Multi-Center Sepsis Early Prediction with Privacy-Preserving [9.7] フェデレートラーニング(Federated Learning)により、複数の機関が、生データを直接共有したり、集中したりすることなく、予測モデルを共同で訓練することができる。
本研究は,多中心敗血症予測へのフェデレーション学習の適用を体系的に検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:35:17 GMT)
Implement Kubernetes Pod-Level Remote Attestation for Confidential Workloads on dstack [9.7] CoCo(Confidential Containers)は厳格な"VM毎のPod"モデルを強制し、ゲストOSスタックのみを証明し、コンテナレベルのアイデンティティを検証せず、VM単位のリソースオーバーヘッドを禁止している。
我々は,複数のPodが1つのConfidential VMを共有しながら,それぞれが独立してハードウェアが支援するアイデンティティの証明を保持することによって,Intel TDX上でPodレベルのリモート認証を可能にするプラットフォームであるdstack-capsuleを提案する。
我々は,dstack-capsuleのセキュリティ特性,正確性,性能特性を評価し,VM間分離のリソースオーバーヘッドを伴わずにPod-granularity検証を実現することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:01:48 GMT)
SePO: Self-Evolving Prompt Agent for System Prompt Optimization [9.7] システムプロンプト最適化は、基礎となるモデルを変更することなくエージェントの動作を改善する。
本稿では,タスクエージェントのシステムプロンプトと並行して,プロンプトエージェント自身のシステムプロンプトを最適化ターゲットとして扱う自己進化型プロンプト最適化(SePO)を提案する。
SePO は Manual-CoT, TextGrad, MetaSPO を一貫して上回り、 Manual-CoT と比較して平均精度は 4.49 ポイント向上している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:20:30 GMT)
OA-CutMix: Correcting the Label Bias of CutMix [9.7] CutMixは事実上の標準ミキシング拡張だが、そのラベルの割り当ては欠陥のある仮定に依存している。
そこで我々は,領域ベースCutMix重みをあらかじめ計算したセグメンテーションマスクから導出したものに置き換えることで,このバイアスを補正するオブジェクト認識CutMix(OA-CutMix)を提案する。
OA-CutMixは、全てのタスクに対して常に最高の精度を達成し、動的ミキシング方法よりも優れていますが、トレーニング時間コストのごく一部です。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:42:59 GMT)
EpiEvolve: Self-Evolving Agents for Streaming Pandemic Forecasting under Regime Shifts [9.7] ウォームスタート期間にトレーニングされたエピデミックLSM予測器をラップし、ストリーミング中に重みを固定する自己進化型エージェントであるEpiEvolveを紹介する。
EpiEvolveは、階層的なエピソードメモリに予測結果を格納し、遅延ラベルを反映し、現在の状態に関連するケースを検索し、繰り返し発生するエラーを戦略的ルールに蒸留することで適応する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:40:30 GMT)
Should Demand Models Incorporate Competitor Prices? Oblivious Learning and Algorithmic Collusion [9.5] 競争相手の価格を故意に無視する戦略上の曖昧さは、結束的な成果を促進し、利益を向上させる可能性があることを示す。
すべての売り手が不利な時に市場ダイナミクスを特徴付け、十分な探索の下で価格が競争結果に収束することを示す。
この結果から, 衝突パターンは頑健ではなく, 難解なモデリングでは持続できないことが示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:10:55 GMT)
Beyond Retrieval: Learning Compact User Representations for Scalable LLM Personalization [9.5] ユーザの好みを学習可能な表現としてエンコードするフレームワークであるTAP-PERを提案する。
6つのLaMPタスクの実験では、TAP-PERはプロンプトベースとモデルベースベースラインを一貫して上回っている。
TAP-PERはユーザ毎のパラメータをOPPUの130倍少なくし、PER-PCSの総パラメータフットプリントの約半分をユーザスケールで使用している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:32:18 GMT)
Learning Admissible Heuristics via Cost Partitioning [9.4] 本稿では,コストパーティショニングと乗算器予測のラグランジアン二重同値性を利用して,許容可能なコストパーティショニングを推定するフレームワークを提案する。
軸方向の自己アテンションとソフトマックス出力層を備えた深いアーキテクチャは、これらの特徴を、構成による分割制約を満たすコスト重みにマッピングする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:35:04 GMT)
Reinforcement Learning from Rich Feedback with Distributional DAgger [9.2] 推論モデルは急速に進歩しているが、検証可能な報酬(RLVR)のレシピからの有力な強化学習は驚くほど狭いままである。
本研究では,古典的模倣学習アルゴリズムDAggerの分布変種を用いて,そのようなフィードバックの使い方について検討する。
これは、ブラックボックスの専門家を認め、シーケンスレベルの勾配が将来の専門家と学生の意見の相違を伝播することによって、豊かな信用割り当てを行う、単純なフォワード・クロスエントロピーの目的をもたらす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:54:04 GMT)
Cartridges at Scale: Training Modular KV Caches over Large Document Collections [9.1] 大規模言語モデルは長いコンテキストで推論できるが、数百万のトークンをプリフィルすることは無駄である。
カートリッジは文書コレクションを再利用可能なキー値(KV)キャッシュに蒸留することでこの問題に対処する。
動的イントラクタ混合によるスケーラブルなマルチカートリッジ学習のためのトレーニングフレームワークであるCartridges at Scale (CAS)を紹介した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:42:55 GMT)
Measuring What Matters: Synthetic Benchmarks for Concept Bottleneck Models [9.1] 概念ボトルネックモデルは、入力で検出された高レベルの概念から結果を予測する。
私たちのベンチマークでは、パフォーマンスに影響を与えるプロパティを制御しながらラベル付きデータセットを生成することができます。
私たちのデモでは、ベンチマークが障害モードを診断し、フォローアップテストをガイドする方法を示しています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:01:05 GMT)
PerchRL: Vision-Based Agile Perching on Inclined Platforms under Rapid and Irregular Motion [9.0] PerchRLは、傾斜したプラットフォーム上でのビジョンベースのアジャイルアプローチのための強化学習フレームワークである。
我々は、状態に基づく事前学習と視覚に基づく微調整からなる2段階の学習戦略を採用する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:22:53 GMT)
Traceable by Design: An LLM Pipeline and Dashboard for EU Regulatory Consultation Analysis [9.0] 本稿では,規制コンサルテーションからのトピック抽出のためのエンドツーエンドのLLMパイプラインとインタラクティブダッシュボードを提案する。
システムは、生のPDFアタッチメントとWeb形式の応答を処理し、トピックアノテーションを抽出し、ソーステキストから冗長な引用で全ての抽出を土台とする。
パイプラインはドメインジェネリックで、新しいコンサルテーションに適応するには、即時更新と新しいデータセットが必要である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:48:21 GMT)
A Normative Intermediate Representation for ASP-Based Compliance Reasoning [8.7] ASPベースのコンプライアンス推論のためのモーダライズ・アウトプット・ノルミティブ・インターミディエート表現を提案する。
LLM支援パイプラインを用いて、中国ADAS規制と標準に関する枠組みをインスタンス化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:55:48 GMT)
Pepper: High-bandwidth and Scalable Anonymous Broadcast with Cryptographic Privacy [8.7] Pepperは、グローバルな敵に対して暗号化送信者の匿名性を提供する。
Pepperは2サーバのDC-netアーキテクチャ上に構築されているが、3つの重要なイノベーションが導入されている。
従来のシステムとは異なり、Pepperは外部ダイヤルサービスを必要としない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:38:34 GMT)
Can Crowdsourcing Survive the LLM Era? A Community Survey on Human Data Collection [8.6] 大規模言語モデル(LLM)を書き込みツールとして広く利用することは、クラウドソースデータの有効性に挑戦する。
本稿では,実践者の課題,緩和戦略,データ品質への影響について概説する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:18:27 GMT)
Toward a Generalized Defense Across Sparse, Continuous, and Structured Parameter Attacks [8.5] ディープニューラルネットワークは、不均一で部分的に信頼できない環境にますます展開されている。
ディープニューラルネットワークは、クラウドストレージ、CI/CDパイプライン、コンテナ化されたサービス、エッジ実行プラットフォームにデプロイされることが増えている。
この広いデプロイメント環境は、モデルのパラメータをさまざまな整合性リスクに公開します。
本稿では,多種多様なパラメータ攻撃に対するディープニューラルネットワークの汎用防御であるParDefを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:47:11 GMT)
TeleSWEBench: A Commit-Driven Benchmark for Evaluating LLM-Powered Software Engineering in Telecommunications [8.4] 汎用コーディングベンチマークは、ステートフルなロジックと通信の厳格な要件を捉えていない。
本稿では,テレコム領域におけるエージェントの性能測定に特化して設計された,最初のコミット駆動型ベンチマークであるTeleSWEBenchを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:19:40 GMT)
The price of multi-group transductive learning [8.4] 単群設定における誤り率に対する誤差率の乗算的ペナルティを生じる可能性があることを, トランスダクティブ・セッティングにおける多群学習者が示している。
これは、類似(グループ実現可能な)統計的設定における最適多群学習者とは対照的である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:07:24 GMT)
Cooperative Circumnavigation for Multiple Unmanned Surface Vehicles Without External Localization [8.4] 本稿では,複数の無人表面車両(USV)を外部位置決めなしで動作させるための協調的目標周航フレームワークを提案する。
目的は、限定されたオンボードセンシングのみを用いて、ターゲットの周囲の特定の半径の均一な円形形成を維持することである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:54:01 GMT)
HD-DinoMoE: A Class-Aware Hierarchical Dual Mixture-of-Experts Network for Scleral Anomaly Segmentation in Complex Acquisition Scenarios [8.3] 本研究は,TCMにインスパイアされた人工知能眼科診断システム(TAO)について述べる。
本稿では,HD-DinoMoEを提案する。
HD-DinoMoEは、クラス対応のデュアルストリームDINOv3と、クラス固有のデコードを組み合わせて、Vessels、Yellow and Black Spots、Blood Spotsを分割する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:48:29 GMT)
Distributional Approximate Nearest Neighbour Search for Uncertainty-Aware Retrieval [8.3] 組込み不確実性を候補生成に組み込む枠組みを提案する。
DINOSAURは、ポイント推定をインデックスする代わりに、アイテムごとに$S_i$の埋め込みをサンプリングし、この拡張セットにインデックスを構築する。
DINOSAURは、不確実性が消えるにつれて、標準点推定検索を回復することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:41:27 GMT)
PersonaTree: Structured Lifecycle Memory for Person Understanding in LLM Agents [8.3] 既存のエージェントメモリ手法では情報保持と検索が重視されるが、蓄積された相互作用の証拠がどのように人的理解に抽象化されるかは限定的に説明できる。
本稿では,この視点をエビデンスからクレームへの明確なサポートパスを備えた3段階のペルソナツリーとして実現した,構造化ライフサイクルメモリフレームワークであるPersonaTreeを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:02:19 GMT)
Treat Traffic Like Trees: A Semantic-Preserving Hierarchical Graph-Based Expert Framework for Encrypted Traffic Analysis [8.1] Protocol Tree Graph Attention with Mixture of Experts (PTGAMoE)は、暗号化トラフィック分析のためのセマンティックな階層的なグラフベースのエキスパートフレームワークである。
PTGAMoEは最先端(SOTA)モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:52:29 GMT)
Drifting Preference Optimization for One-Step Generative Models [8.0] ワンステップのテキスト・ツー・イメージジェネレータは、単一のフォワードパスを持つイメージを生成するため、デプロイには魅力的である。
決定論的ワンステップジェネレータのオンライン選好精選手法であるドリフト選好最適化(DrPO)を提案する。
DrPOは、現在のジェネレータから候補をランク付けし、ターゲットの報酬でランク付けし、高および低スコアのサンプルを使用して特徴空間更新方向を合成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:46:57 GMT)
SearchLog: A Web Browser Extension for Capturing Search Logs in Laboratory Studies [7.9] SearchLogは、研究室ベースの研究中に自然の検索ログを収集するための、簡単にインストールできるWebブラウザエクステンションである。
この拡張機能は、クリック、スクロール、ホバーテキスト、型付き単語、検索クエリ、結果ランキング、利用可能なAI生成サマリ、タブアクティビティ、ウィンドウ変更をキャプチャする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:03:29 GMT)
REGEN: Reference-Guided Synthetic Multivariate Time Series Generation for Forecasting [7.8] 本稿では,観測された配列を合成のための構造的足場として扱う参照誘導型生成パイプラインを提案する。
ReGeNの生成したデータは、最小限の予測劣化を伴う実兄弟データに一貫した代用であることを示す。
これは、低データのレシエーションにおいて、参照データが構造的に悪用される方法が、利用可能なデータ量と同じくらい重要であることを示唆している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:19:55 GMT)
Residual Modeling for High-Fidelity Learned Compression of Scientific Data [7.8] 学習圧縮機残差に適合した残差表現は、大域的残差補正が速度優位になると学習圧縮の利点を保てることを示す。
E3SM, JHTDB, ERA5 のブロックレベルの整数 NRMSE ターゲットの 10-6 から 10-4 にまたがって、LBRC は GAE の圧縮比を 30-60% 改善し、SZ と広く競合する。
NGLRはLBRCを10-40%上回り、評価された高忠実性体制においてSZを上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:49:23 GMT)
When Clients Stop Following: A Cognitive Conceptualization Diagram-driven Framework for Strategic Counseling [7.7] 既存のベンチマークは、高度に協調的なシミュレートされたクライアントに大きく依存している。
これらのクライアントはしばしば、わずか数回で抵抗からコンプライアンスへと急速に移行します。
本稿では,認知行動療法(CBT)を基盤とした抵抗認識フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:09:10 GMT)
Mamba-Enhanced Implicit Motion Learning for Audio-Driven Portrait Animation [7.7] 本研究では,1つの静止画像とオーディオから,現実的で時間的に整合した人間の動画を生成するための,新しい暗黙の移動フレームワークを提案する。
私たちのアプローチでは、レンダリングからモーション予測を分離する2段階のパイプラインを使用します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:22:46 GMT)
CLIF: Cross-layer LEO-ISL Fingerprinting for Physical and Network Attack Detection in Dense LEO Constellations [7.6] SpaceXのStarlinkやAmazonのKuiperのようなメガコンステレーションは、自動メッシュルーティングのための光サテライトリンク(ISL)に依存している。
本稿では,ネットワーク層データと物理層計測を融合させて異常を検出する,クロス層軽量な行動フィンガープリントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:01:27 GMT)
Bayesian learning for the stochastic shortest path problem [7.6] 我々は最適な意思決定戦略を学ぶためのベイズ的枠組みを開発する。
非現実的なモデリング仮定やアドホック近似には依存していません。
私たちは、我々のフレームワークが不確実性を忠実に定量化していることを示します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:13:41 GMT)
LoRi: Low-Rank Distillation for Implicit Reasoning [7.5] Implicit chain-of- Thought(iCoT)メソッドは、大きな言語モデルでの推論を内部化することを目的としているが、しばしば明示的なCoTプロンプトを過小評価している。
教師と学生の軌跡を共有低ランクテンソル部分空間で整列させることにより推論を伝達する低ランク蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:05:50 GMT)
Automatic Generation of Titles for Research Papers Using Language Models [7.5] オープンウェイトな事前学習型および大規模言語モデルを用いて,抽象概念から論文タイトルを生成する手法を提案する。
我々はCSPubSumとLREC-COING-2024データセットを使用し、社会科学の4つの雑誌から収集された新しいデータセットSpringerSSATを紹介した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:49:57 GMT)
Instance-Level Post Hoc Uncertainty Quantification in Object Detection [7.5] 安全保証のためのバウンディングボックス予測の不確実性の定量化が不可欠である。
モンテカルロ一般化線形化モデル(MC-GLM)を提案する。
モンテカルロステップに必要なサンプルの数は一定であり、出力インスタンスの数に依存しないので、並列化することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:26:13 GMT)
The State of Peer Review in Empirical Software Engineering: A Community Survey on Review Load, Quality, and GenAI Use [7.4] 科学的なピアレビューシステムは、ここ数年徐々に悪化している。
生成的AI利用の台頭と関連するすべての問題により、システム内の多くの亀裂がより目に見えるようになった。
i)コミュニティメンバのレビュー負荷,(ii)レビュー品質の認識,レビューに関する課題や課題の頻繁な報告,(iii)レビュープロセスにおけるLCMベースのツールの使用,(iv)ピアレビューシステムを改善するためのコミュニティの提案について報告する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:49:16 GMT)
GITCO: Gated Inference-Time Context Optimization in TSFMs [7.4] モデル重みを変更するのではなく、入力コンテキストを最適化することで、推論時のTSFM精度を改善することを提案する。
GITCO(Gated Inference-Time Context Optimization)は,パラメータを更新せずに有害なパッチを選択的に識別・抑制する軽量な3成分フレームワークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:17:40 GMT)
Learning from Demonstrations over Riemannian Manifolds using Neural ODEs: An Extended Abstract [6.4] 本研究では,測地線を用いたロボットの学習フレームワークを開発する。
我々は、ニューラル常微分方程式を用いて測地学を数値的に推定する。
これらの測地学は、ロボットにデプロイする前に元のタスク空間に復号することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:38:47 GMT)
TaDA: Calibrated Probe Gating for Task-Domain LoRA Merging [6.4] タスクとドメインアダプタは変換器アーキテクチャ全体にわたって一貫した深さ依存性の非対称性を示す。
本稿では,この構造を利用したトレーニングフリーなアルゴリズムを提案する。
$textbfTaDA$は、推論オーバーヘッドがゼロの標準ランク-r$LoRAアダプタを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:39:37 GMT)
Recent Advances and Trends in Learning-based 3D Representations [6.3] 適切な3D表現の選択は、3D再構成、新しいビュー合成とレンダリング、形状と動きの分析、認識、生成といったタスクにおける現代のコンピュータビジョンとグラフィックパイプラインの効率、品質、能力を決定する。
最近のニューラルおよびプリミティブベースの表現は、ゲーム、AR/VR、自律運転、ロボットナビゲーション、医療画像など、幅広いアプリケーションにおいて、コンパクトで差別化可能な代替手段を提供する。
各種類の表現に対して、一般的な定式化とその変種を提示し、その利点と限界について議論し、主要なアプリケーションを強調します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:35:50 GMT)
TransTac: Visuo-Tactile Modality Transition via Ultraviolet-Encoded Transparent Elastomers [6.2] 透明紫外(UV)を符号化した両眼VBTSであるTransTacについて検討した。
このシステムは、紫外反射マーカーを埋め込んだ透明エラストマーと、頑丈なスパース三角測量のための事前誘導型デラウネーステレオマッチングアルゴリズムを用いる。
意味評価において、TransTacは触覚画像に対して最大83.3%のゼロショット認識精度を達成し、不透明な触覚ベースラインを約50ポイント超えた。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:46:00 GMT)
MemoryDocDataSet: A Benchmark for Joint Conversational Memory and Long Document Reasoning [6.2] MemoryDocDataSetは、50マイクロワールドと1000QAペアの総合ベンチマークである。
それぞれのインスタンスは、3~5のペルソナ、数ヶ月のアクティビティにまたがる一時的なイベントグラフ、3~5の実際の長いドキュメント、それらのドキュメントに基づくマルチセッションの会話で構成されている。
定義されている特徴は、ハイブリッドソースタグである: システムが最初に会話履歴をナビゲートし、どのドキュメントが関連しているかを特定し、そのドキュメントから回答を抽出する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:44:50 GMT)
The Fair Lending Model: How the Longest-Running Algorithmic Fairness Programs Work in Practice [6.1] 米国の金融機関は何十年にもわたって、公正貸付法に基づくアルゴリズムフェアネスプログラムを実行してきた。
我々は、金融機関がアルゴリズムによる差別を地上でどのようにテストし緩和するかについて、最初の実証的な説明を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:28:02 GMT)
OSCAR: Omni-Embodiment Skeleton-Conditioned World Action Model for Robotics [6.1] 本稿では,ロボットの動作を多岐にわたって一般化し,ロボットのポリシー評価を可能にする,精密なアクション条件付きビデオワールドモデルを提案する。
本モデルは,既存のベースラインと比較して,動作の追従,外観品質,動作の整合性を大幅に向上させる。
さらにOSCARをデプロイして,RoboArenaからロボットポリシーを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:16:41 GMT)
An Ensembled Latent Factor Model via Differential Evolution and Gradient Descent Optimization [6.0] 本研究は,差分進化と勾配降下最適化(ELFM-DEGDO)による組立潜在因子モデルを提案する。
ELFM-DEGDOはHDIデータに対してより包括的でバイアスの少ない表現を生成することができる。
3つのHDIデータセットを用いて、ELFM-DEGDOが関連する複数の潜在因子モデルよりも一貫してパフォーマンスが良いことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:36:27 GMT)
DPDL: Towards Differential Privacy Preservation in Decentralized Stochastic Learning on Non-IID Data [5.9] 分散学習のパラダイムでは、エージェントのグループが協力して、中央サーバーなしで分散データセットを使用してグローバルモデルをトレーニングします。
非IIDデータを用いたプライバシー保護型分散学習アルゴリズムDPDLを提案する。
我々の厳密な理論的分析は、特定のプライバシー保護レベルを達成するのに必要な最小ノイズレベルを明らかにするだけでなく、我々のアルゴリズムが非IIDデータによるトレーニングにおいて線形スピードアップを達成していることを示している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:27:40 GMT)
MaCo-GAN: Manifold-Contrastive Adversarial Learning for Single Image Super-Resolution [5.7] 本稿では,従来の対数損失を教師付きコントラスト目的に置き換える,新しい多様体コントラストGANフレームワークを提案する。
提案手法のコアコンポーネントは,地上の真理(GT)データを,難易度の高い疑似画像のスペクトルに変換するダイナミックフェイクサンプルシンセサイザーである。
様々なベンチマークで知覚歪曲トレードオフが一貫した改善を示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:29:44 GMT)
Coarse-to-fine Hierarchical Architecture with Sequential Mamba for Brain Reconstruction [5.7] 画像-fMRI符号化のための新しい階層型2段階フレームワークであるCHASMBrainを提案する。
我々のアーキテクチャは、グローバルなセマンティックトークンと局所的な空間パッチを明確に分離し処理するために、デュアルストリームのMamba設計を活用している。
提案手法はPearsonの0.429とMSE0.261の相関を達成し,評価基準線を上回る結果を得た。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:53:23 GMT)
DiffSlack: Learning under Nonlinear Inequality Constraints via Learnable Slack Variables [5.7] 非線形不等式制約ニューラル予測のための微分可能なプロジェクション層であるDiffSlackを提案する。
DiffSlackは、拡張ネットワーク出力の一部として予測される学習可能なスラック変数との不等式を等式として再構成する。
衝突回避,曲率制限,ウェイポイント間隔から200の非線形不等式制約を課した車両経路計画におけるDiffSlackの評価を行った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:58:06 GMT)
Alpha-RTL: Test-Time Training for RTL Hardware Optimization [5.6] 大規模言語モデル(LLM)は、機能的に正しいレジスタ・トランスファー・レベル(RTL)のハードウェア設計を生成することへの期待が高まっている。
近年のシステムは、構文、シミュレーション、PPA報酬によるEDA統合強化学習によってさらに改善されている。
我々は,TL最適化のためのLLMポリシーとEDAパイプラインのループを閉じる,設計毎のテスト時間トレーニングフレームワークTTT-RTLを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:51:33 GMT)
BPDA-GMM: Bayesian Probabilistic Data Association via Gaussian Mixture Models for Semantic SLAM [5.6] オブジェクトレベルマップを増大させたセマンティックSLAMのためのオンラインベイズPDAフレームワークを提案する。
BPDA-GMMは、中国のレストランプロセス(CRP)アソシエーションモデルを誘導する前にディリクレプロセスを使用する。
シミュレーションと実際の屋内データセットを用いた実験では、軌跡精度の向上、意味マッピングの品質、知覚エイリアスに対する堅牢性、最先端のベースラインに対するエラーが示されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:53:39 GMT)
A New Angle on Bones: Robust Pose Estimation in X-Ray and Ultrasound [5.6] 骨構造間の角度を測定することは、画像解析における日常的な課題であり、診断と治療計画のための重要な定量的パラメータを提供する。
学習に基づく点候補の提案と行モデルを用いて軸パラメータを抽出する自動骨ポーズ推定に対処する。
我々は,3つの臨床的に関連のある小児のアングル推定課題について,X線写真における骨折のフラグメント評価,超音波による股関節脱形成,および超音波による股関節脱形成の3つの課題について検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:25:08 GMT)
Not All Errors Are Equal: Consequence-Aware Reasoning Compute Allocation [5.5] 本稿では,結果認識型テスト時間計算アロケーションを提案する。
我々はSWE-bench Liteの実験を行い、Multi-SWE-bench mini上でのクロスデータセット動作を評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:29:57 GMT)
Low-Rank Decay for Grokking in Scale-Invariant Transformers: A Spectral-Geometric View [5.5] 我々は, スケール不変条件においても, 段階的な$UVtop$が接点成分を保持する核ノルム型スペクトル正規化器であるemphLow-Rank Decay (LRD)を提案する。
LRDは、クエリ/キー行列の高速な有効ランク崩壊を誘導し、遅延一般化(グロキング)が起こるデータ・フレクション境界を拡張する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:33:45 GMT)
Convergence rates of Sum-of-Hermitian-Squares Hierarchies for the Pauli algebra [5.4] パウリ代数から生成される非可換最適化問題の緩和に対する明示的な収束率を開発する。
この結果は,非可換最適化問題の緩和に対する収束率の最初の定量的解析である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:30:52 GMT)
Uncertainty-Aware (Un)Supervised Few-Shot User Adaptation for On-Device Personalized Human Activity Recognition [5.3] 本稿では,事前訓練された人間活動認識(HAR)モデルをプロトタイプネットワークとして活用する,勾配のないフレームワークを提案する。
アクティビティ毎のキャリブレーションデータのわずか3秒(1ショット)で、教師なし適応はマクロF1を+2.76から+33.44ポイント、教師なし適応は+0.56から+32.13ポイント改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:25:07 GMT)
Evaluating Reasoning Fidelity in Visual Text Generation [5.3] モデルが推論過程を画像として表現しなければならない視覚テキスト生成における推論忠実度を評価する。
現在のT2Iモデルは、しばしば意味的誤り、論理的不整合、誤った中間ステップを生成する。
本研究は,視覚的テキスト生成と手続き的推論の間に大きなギャップがあることを示し,より信頼性の高い視覚的テキスト推論を動機とした。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:53:58 GMT)
Generating Financial Time Series by Matching Random Convolutional Features [5.2] 我々は、生成時系列モデルのトレーニングに適した、完全に微分可能なランダム畳み込み特徴写像であるSOCK(SOft Competing Kernels)を紹介する。
ランダムなSOCK特徴のマッチングによって訓練されたジェネレータは、広範囲の小サンプル財務データセットにおいて、シグネチャと拡散ベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:46:50 GMT)
ALINC: Active Learning for Inductive Node Classification via Graph Sampling [5.2] グラフサンプリングによる帰納的ノード分類のためのALフレームワークであるALINCを紹介する。
ノードレベルのユーティリティ尺度をグラフレベルの選択基準に高めることで、既存の方法論的ギャップを埋める。
ALINCは分子のサイト・オブ・メタボリズム予測とプリント基板設計の自動化の2つのユースケースで有効であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:15:46 GMT)
Anisotropic Rabi Model as a Noise Biased Qubit [5.2] ノイズバイアス量子ビットの潜在的な資源として、量子異方性Rabiモデルを提案する。
系の環境結合は、回転波と反回転波の相互作用の相対的な強度を調整することによってバイアスを受けることができる。
この異方性は支配的な脱コヒーレンス経路を選択的に抑制し、保護された論理量子ビットの構築を可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:13:48 GMT)
Adaptive Calibration for Fair and Performant Facial Recognition [5.2] Adaptive (AC)は、顔認識のための新しいキャリブレーション戦略である。
正規化埋め込みとよく校正された確率の間のコサイン類似性をマッピングする。
局所コンテキストをキャリブレーションに組み込むことで、アダプティブはコサイン類似性の基本的なミスマッチを補正する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:29:44 GMT)
Human oversight of agentic systems in practice: Examining the oversight work, challenges, and heuristics of developers using software agents [5.2] エージェント監視に関する理論的談話の実証的アンカーを提供する。
緊急監視作業の少なくとも4つの形態として、優先順位コントロール、共同計画、リアルタイム監視、ポストホックレビューがあります。
監視作業は、既存の研究で表現されているように、反応性とふりかえりだけでなく、予防的かつ積極的なものであることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:53:31 GMT)
Physics-Informed Neural Network Modeling of Biodegradable Contaminant Transport through GCL/SL Composite Liners [5.0] 本研究は,GCL/SLコンポジットライナーシステムを用いた汚染物質輸送のための2領域物理インフォームドニューラルネットワークフレームワークを開発した。
2つの定式化は、異なる浸出水頭条件下での分析および有限要素参照解に対して評価される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:15:55 GMT)
Can We Predict The Human Preference For Text-to-Image Content Prior To Generation And Is It Even Useful To Do So? [4.9] 拡散モデル(DM)は、ユーザプロンプトから高品質でフォトリアリスティックな視覚コンテンツを合成することで、テキスト駆動生成に革命をもたらした。
我々は、世代ごとに計算リソースをコミットする前に、スカラーなヒューマン・プライス・メトリック(HPM)スコアをどの程度予測できるかを検討する。
我々の調査は、これが可能であるだけでなく、無視可能なハードウェアオーバーヘッドを達成可能であることを明らかにしている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:57:05 GMT)
STaR-Quant: State-Time Consistent Post-Training Quantization for Diffusion Large Language Models [4.9] 本稿では,DLLMのための状態時間一貫したPTQフレームワークSTaR-Quantを提案する。
STaR-Quantは、強いPTQベースライン上での低ビット重量活性化量子化を一貫して改善する。
最大1.69倍のスピードアップと3.14倍のメモリ節約を実現している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:34:35 GMT)
Policy-Compliant Cloud Storage Systems [4.9] 本稿では,信頼できないクラウド上でのKVSのコンプライアンスを,その整合性を変更することなく検証できる信頼システムを提案する。
KVレコード内にメタデータをコンパクトにエンコードし、専用のメタデータ固有のクエリを構築し、空間効率のよいフォーマットでコンプライアンス関連イベントのみをログする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:40:01 GMT)
GOTabPFN: From Feature Ordering to Compact Tokenization for Tabular Foundation Models on High-Dimensional Data [4.8] 本稿では,局所リファインメント付きグラフ誘導順序付け(GO-LR)を紹介し,その重み付き最小線形アレンジメントと等価性を示す。
本稿では,GO-LRとNuro-Inspired Subunit Compression(NSC)をベースとしたGOTabPFNを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:03:33 GMT)
Light or Full Verb? A Minimal-Pair Dataset for Probing Phraseological Competence in Language Models [4.7] have」や「make」のような動詞は、接尾辞や接尾辞として機能する。
そこで本研究では,同じ文脈に軽動詞と全動詞で同じ動詞を含む,最小限の英語文列の大規模データセットを提案する。
2つの探索実験により、言語モデルは最小限の文脈でもこれらの使用を区別し、オブジェクトタイプ間で分離可能なパターンを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:51:27 GMT)
When Do Fewer Coordinates Suffice in DP-SGD? [4.7] 最適化に必要な信号を失うことなく、プライベートトレーニングがより少なく更新できるかどうかを問う。
座標制限が有効である場合に特徴付ける基準を与える。
MNIST と FMNIST の実験では、学習された座標支援は、サイズマッチングされたランダムな支持よりも勾配エネルギーを維持できることが示されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:46:25 GMT)
Revisiting Privacy Amplification by Subsampling in Selective Release DPSGD [4.7] クリッピンググラディエント(DPSR-CG)に基づく微分プライベート選択リリースを提案する。
DPSR-CG機構は、例外的なモデル性能を達成しつつ、厳格なプライバシ保証を維持していることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:00:26 GMT)
ANN Search: Recall What Matters [4.7] ANN検索で本当に重要なのは、検索結果の品質であって、真のkNNセットと重なるものではない、と我々は主張する。
Recall@kを使って検索品質を評価すると、計算オーバーヘッドが不要になり、1/Ratio@kで置き換えることを調べる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:00:50 GMT)
Optimizing the Sensitivity-Noise Trade-off in Non-Hermitian Sensing via Off-Exceptional-Deficiency Operation [4.5] スペクトル特異性は 信号と環境ノイズの両方を同時に増幅する
Off-EDフレームワークは、強いノイズ免疫と極度感度を一致させる。
次世代トポロジカルセンサのパラダイムとしてOff-EDフレームワークを確立した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:02:32 GMT)
Three-Dimensional Retinal Microvasculature Restoration in OCT Angiography [4.4] 本稿では,1つのOCTAボリュームから解剖学的血管を復元する深層学習アルゴリズムを提案する。
提案モデルでは,元のOCTAボリュームに比べて画質が大幅に向上した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:23:09 GMT)
Sparse Functional Singular Value Decomposition for Biclustering and Triclustering Longitudinal Data [4.3] 本稿では,二クラスタと三クラスタを長手データで検出するための統一スパース関数Singular Value DecompositionフレームワークであるTri-SfSVDを提案する。
被験者,変数,時間的サブリージョンにスパースペナルティを課すことにより,本手法は観測データに直接作用し,局所構造を解明する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:26:01 GMT)
Setting angles in quantum approximate optimization at utility-scale [4.3] 量子近似最適化アルゴリズム(QAOA)は、量子ハードウェアとタンデムの古典最適化を用いて最適化問題を解く。
しかし、与えられた問題に対して最適な角度を特定するのに、どの手法が最適かはよく分かっていない。
本稿では,QAOA実践者の運用指針を抽出するユーティリティスケールベンチマークを通じて,この問題に対処する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:02:26 GMT)
Deep Learning-assisted AMD Staging based on OCT and OCT Angiography [4.2] 年齢=50歳以上, AMD重症度は多様であった。
AREDS簡易重症度尺度によると、AMD重症度は4段階(No AMD, Early AMD, Intermediate AMD, Advanced AMD)に分類された。
OCT/OCTAデータを用いたディープラーニングモデルは、AMDの重大度を正確に自動評価することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:28:35 GMT)
QuBLAST: A Framework for Quantizing Large Language Models with Block-Level Compression Approach and Activation Scaling Strategy [4.2] QuBLASTは、LCMのアクティベーションスケーリング戦略を備えたブロックレベルの圧縮手法である。
異なるモデルアーキテクチャでモデルサイズを40%から45.2%削減する。
WikiText-2とWikiText-103データセットのパフォーマンスは、5%のパープレキシティ向上で維持されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:55:59 GMT)
Knockoffs-based False Discovery Rate Control and Simplification for Deep Neural Networks [4.2] ディープニューラルネットワークは、しばしば多数のパラメータと入力を含む。
ノックオフ法は、高次元回帰における偽発見率の制御に成功している。
本稿では,偽発見率の制御条件下での3つの変数スクリーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:32:42 GMT)
LastAct: Trajectory-Guided Latest-Activity Localization for Real-Time Smart-Home Activity Recognition [4.2] 環境センサからのヒューマンアクティビティ認識(HAR)は、健康モニタリングや生活支援といったスマートホームアプリケーションを可能にする。
スライディング・ウインドウ推論は、遷移を成し、混合活動を含む多くのウィンドウを生成する。
我々は、スマートホームHARをストリーミングするためのトラジェクトリ中心のフレームワークであるLastActを紹介した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:30:14 GMT)
Activation-Based Active Learning for In-Context Learning: Challenges and Insights [4.1] 本稿では,モデルアクティベーションが,文脈内サンプルの選択を最適化するための微細な信号を与えることができるという仮説を検証した。
In-context Learning に適用された,アクティベーションに基づく深層能動学習手法の包括的解析について述べる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:39:29 GMT)
Scenario Generation for Risk-Aware Reinforcement Learning with Probably Approximately Safe Guarantees [4.0] 強化学習 (Reinforcement Learning, RL) ポリシーは、未知または安全でない振る舞いをもたらす過渡摂動への感受性を示す。
政策検証の方法は、安全制約に対する政策軌跡をサンプリングすることによって確率的障壁証明を構築することである。
可変オートエンコーダ (VAE) を用いて, 遭遇した状態空間の分布を近似し, 上界と下界のバリア・サーティフィケートを構成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:36:43 GMT)
Willing but Unable: Separating Refusal from Capability in Code LLMs via Abliteration [3.9] 本稿では,このバリアを除去するためのツールとして,リフレクションストリームを再現する低ランクなウェイト編集である,消音の予備的研究を行う。
脆弱性判定は3つのツール検出アンサンブル(QLCode、Sem、Bandit)と手動で行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:06:52 GMT)
Optimizing the Cost-Quality Tradeoff of Agentic Theorem Provers in Lean [3.9] 大規模な言語モデル(LLM)は、リーンで形式的な証明を生成するためにますます使われています。
LLMは違法に高価であり、多くの場合、最終的に失敗する試みに相当な計算に費やされる。
本研究では,データプレーンと制御プレーンで構成されるアクションルーティングエージェントを用いてこの問題に対処する。
コントロールプレーンは、失敗していたリーンの試みを観察し、成功の可能性を見積もり、他の試みのコストを見積もり、現在の目標を証明し続けるか、あるいは新たなブレークダウンから再開するかを決めます。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:46:20 GMT)
Generalizable Multi-Task Learning for Wireless Networks Using Prompt Decision Transformers [3.9] 本稿では, Prompt Decision Transformer (PromptDT) を用いたマルチタスク学習フレームワークを提案する。
PromptDTは、ベースラインと比較して、マルチタスク設定でQoEを最大49%改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:03:38 GMT)
Folded Transport MCMC: Certifiable Quotient Posterior Computation for Symmetric Bayesian Models [3.9] 提案手法では, 後続部に直接推論を行うFolded Transport MCMCを提案する。
台風マングホート時の超高層建物からの実際の加速度計データでは、FolT-MCMCは非空の量子コア証明書を生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:26:46 GMT)
Deep Embedded Multiplicative DMD for Algebra-Preserving Koopman Learning [3.7] DeepMDMDは遅延空間と分割を学習する手法である。
スペクトル汚染を低減し、よりリッチな連続スペクトル構造を明らかにし、厳しい騒音下で安定した予測を与える。
これらの結果はクープマン学習の実践的なルールを示唆している:座標を学習し、代数を制約する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:37:06 GMT)
When Freshness Is Not Enough: Distribution-Aware Age of Information for Networked LQR Control [3.7] Age of Information (AoI) は無線更新システムの設計において中心的な指標となっている。
本稿では,ネットワーク制御システムにおいて,平均AoIの最小化が実際最適かどうかを検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:22:46 GMT)
Curvature-aware dynamic precision approach for physics-informed neural networks [3.7] 近年の研究では、PINNの最適化は数値精度に敏感であることが示されている。
既存の実装では、シングル精度(FP32)またはダブル精度(FP64)が一般的である。
本稿では,学習中の数値精度に適応する曲率認識精度制御器を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:19:53 GMT)
NLLog: Lightweight, Explainable SOC Anomaly Detection via Log-to-Language Rewriting [3.7] NLLogは、解析済みのテンプレートをWHO-WHAT-SEVERITY文に決定的に書き換える軽量パイプラインである。
用語-周波数-逆文書-周波数重み付け、ツリーアンサンブルによるセッションの分類、およびバックプロジェクトエビデンスでそれらをプールする。
セキュリティ・オペレーション・センターのトリアージに適したコモディティ・ハードウェアのレイテンシで、偽陽性率を低く保っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:45:29 GMT)
An Entanglement Measure from Quantum Optimal Transport [3.7] 我々は、状態から分離可能な状態の集合への最小オーダー-1量子ワッサーシュタイン距離として定義される二部分エンタングルメント測度$E()$を提案する。
リプシッツ双対の定式化は、純粋および混合状態に対する明示的な下界、2ビット系に対する鋭い定数、ハールランダム純状態に対する期待値を得る。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:51:46 GMT)
Online Safety Regulation Increases Privacy Risk: Evidence from the UK Online Safety Act [3.6] イギリスのオンライン安全法は2023年10月に可決された。
年齢保証と安全要件をソーシャルメディア、検索、ポルノサービスに拡張する。
オフコムの違法コンテンツ執行業務は2025年3月に発効した。
2025年7月、成人コンテンツの強制年齢検証が施行された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:24:28 GMT)
Efficient Computation of Distance Functions for Navigation Vector Fields in Lie Groups [3.6] 本稿では,G-ポリノミカル曲線を表す点と曲線の間の距離を効率的に計算する手法を提案する。
提案手法は、これらの曲線の構造を利用して、問題を少数のルートフィリング計算に還元する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:18:59 GMT)
AICompanionBench: Benchmarking LLMs-as-Judges for AI Companion Safety [3.5] この研究はAICompanionBenchを紹介し、人間とAIの会話に詳細な安全性リスクが付与された最初の公開ベンチマークデータセットについて紹介する。
このデータセットには、Redditから収集された2123の現実世界のReplika会話が含まれており、性的行動、反社会的行動、身体的攻撃、口頭攻撃、薬物乱用、自傷と自殺、コントロール、操作、ノーハームの9つのカテゴリで人間とAIのコラボレーションを通じて注釈付けされている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:33:42 GMT)
QO-Bench: Diagnosing Query-Operator-Preserving Retrieval over Typed Event Tuples [3.5] 本稿では,QO-Benchという,型付きイベントに対するクエリ操作型質問応答の診断ベンチマークを紹介する。
ベンチマークでは、22,984のニュース記事と18のクエリテンプレートにわたる614の企業イベントをカバーし、785の質問で評価されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:14:43 GMT)
Horse Eye Blink Detection and Classification for Equine Affective State Assessment [3.5] 馬のビデオから自動瞬き分類を行う3つの方法を開発し,評価する。
分岐分類を行う場合のマクロF1スコアは0.898、二分点検出では0.926となる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:33:39 GMT)
How Software Engineering Students Use LLMs to Write Research Papers: An Experience Report [3.4] 大規模言語モデルは、ソフトウェア工学教育の一部になりつつある。
本稿では,反射型LDMを経験的手法に組み込んだ教育経験を報告する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:19:43 GMT)
PS-UIE: Privilege-Separated Integrity Enforcement for User-Space Executable Objects in Confidential VMs [3.4] プライビレージ分離型ユーザ空間統合強化(PS-UIE)を提案する。
PS-UIEは、カバーされた実行許可パス上のユーザ空間実行オブジェクトの整合性を強制する。
AMD SEV-SNPプラットフォームにPS-UIEを実装した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:33:50 GMT)
From Untrusted Input to Trusted Memory: A Systematic Study of Memory Poisoning Attacks in LLM Agents [3.3] メモリはAIエージェントの中核的なコンポーネントであり、対話を通じて知識を蓄積し、パフォーマンスを向上させることができる。
本研究は, LLM系薬剤の記憶障害に関する系統的研究である。
モデル機能,システムプロンプト設計,エージェントシステムアーキテクチャにおいて,4つのメモリ書き込みチャネルと9つの構造的脆弱性を識別する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:04:13 GMT)
Activation Steering of Video Generation Models via Reduced-Order Linear Optimal Control [3.3] アクティベーションステアリングは、ファインチューニングやプロンプトフィルタリングに代わる魅力的な機構を提供する。
Latent Activation Linear-Quadratic Regulator (LA-LQR) は最小侵襲T2Vステアリングのための低次最適制御フレームワークである。
LA-LQRはT2V推論を力学系として定式化し、閉ループフィードバックの介入を計算する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:58:56 GMT)
Attention-Augmented LSTMs for Automatic Homophonic Ciphertext Decipherment [3.3] ホモフォニック置換暗号は、各平文文字をいくつかの可能な暗号符号の1つに置き換える。
本稿では,注意増強長短期記憶(LSTM)モデルが歴史的モチベーション付き共有キー設定でそのようなマッピングを学習できるかどうかを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:35:43 GMT)
A Taxonomy of Runtime Faults in Model Context Protocol Servers [3.3] MCPサーバにおける実行時障害の最初の経験的分類を提示する。
MCP 固有の実行時障害スレッド 837 を MCP サーバ GitHub リポジトリ 473 から解析した。
分類学の外部妥当性を評価するため,55名のMDPサーバ開発者を調査した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:28:20 GMT)
A 3D Isovist World Model -- Revealing a City's Unseen Geometry and Its Emergent Cross-City Signature [3.2] 都市を航行するエージェントは、周囲がどう変化するかを予測する世界モデルに頼っている。
我々は,過去のアイソビストと運動行動の短い歴史から,次のアイソビストを予測する具体的世界モデルを導入する。
マンハッタンとパリで訓練された1つの都市ブラインドモデルは、都市横断的な空間的シグネチャを発達させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:29:22 GMT)
Archi: Agentic Operations at the CMS Experiment [3.2] 我々は、科学データ収集のためのオープンソースのエンドツーエンドフレームワークであるArchiを紹介する。
Archiのインスタンスは、2026年2月からCERNのLHCにおけるCMS実験のコンピューティングオペレーションチームに、テクニカルオペレータのサポートエージェントとしてデプロイされている。
作業者からのフィードバックと,人や自動パネルによって評価された製品使用状況から収集した質問セットについて評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:38:30 GMT)
Safety-Critical Adaptive Impedance Control via Nonsmooth Control Barrier Functions under State and Input Constraints [3.2] 本研究では,不確実な動的条件下での適合的な相互作用を達成しつつ,連立状態の安全性を強制するオンライン適応インピーダンス制御フレームワークを提案する。
この手法は、二次プログラムに基づく安全フィルタと、新しい構成された位置速度非滑らかな制御バリア関数を組み合わせたものである。
外乱オブザーバの強化された安全メカニズムは、モデリングエラーや外部の相互作用力に対する堅牢性を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:15:02 GMT)
Handwriting Extraction and Analysis of Signature Lists in Swiss Popular Initiatives [3.2] オフザシェルフのOCRシステムは手書き署名データの転写に十分な信頼性を持っていない。
ライター検索手法は、シグネチャリスト間で視覚的に類似したエントリを効果的に識別することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:41:30 GMT)
Large Language Models in K-12 Education: Alignment with State Curriculum Standards and Student Personas [3.1] 我々は、米国史のカリキュラムのバリエーションを特定し、異なるLLMがこれらの州固有のカリキュラムの違いを反映する程度を評価する。
モデルが歴史的トピックの提示を調整できる一方で、こうした変化は国家の政治的傾向が認識されていることから生じる可能性がある。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:14:33 GMT)
Harnessing Source Heterogeneity for Cluster-Structured Transfer Learning [3.1] コネチカット病院情報管理取引所のデータを用いた自殺リスク調査は、27の病院で636,758人の患者から成っている。
一般化線形モデルのためのクラスタ構造化トランスファーラーニング手法であるTrans-GLMCを提案する。
シミュレーションおよびCHIME研究において、Trans-GLMCは施設固有の予測を改善し、相互転送性のある病院の解釈可能なコミュニティを特定し、臨床的に一貫性のある自殺リスク因子を回復する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:09:15 GMT)
(Mis)generalization of Helpful-only Fine-tuning [3.0] 既存の有用な専用モデルの欠点について検討する。
単純な反拒絶訓練はこれらの問題の多くを引き起こす可能性があることを示す。
合成文書の微調整と文字関連質問をSFTとRLに付加することで、それらを緩和できることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:43:08 GMT)
Learning symplectic model reduction based on a approximation theorem of symplectic embeddings [3.0] 高次元ハミルトン系は多くの科学・工学分野において中心的な役割を果たす。
ディープラーニングは、データから低次元のサロゲートを構築する強力なツールを提供する。
内在的なシンプレクティック構造は、モデル縮小時に容易に破壊される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:58:44 GMT)
Beyond Objective Equivalence: Constraint Injection for LLM-Based Optimization Modeling on Vehicle Routing Problems [3.0] 本研究では,無声性制約の排除を明らかにするために,急激な過剰制約と一拘束性違反プローブを露呈する制約注入法を提案する。
自然言語のVRPシナリオをGurobiスクリプトに変換する8BのエンドツーエンドモデルであるVRPCoderを開発した。
VRPCoder-GRPOは93%の平均パス@1、Geminiは3つのベンチマークで3.1-Proプレビューを上回り、Claude-Sonnet-4.5を28ポイント上回り、LLMを78ポイント上回る。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:39:04 GMT)
Enhancing the MADDPG Algorithm for Multi-Agent Learning via Action Inference and Importance Sampling [3.0] 本稿では,各エージェントが他のエージェントの意図した行動を予測できる新しいアクション推論機構を提案する。
第2に、リプレイバッファに幾何分布を用いた重要サンプリング戦略を適用し、より最新の情報的体験を優先する。
その結果,行動推論は学習安定性の向上とエージェント間協調に有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:44:56 GMT)
Implicit Fuzzification via Bounded Noise Injection for Robust Medical Image Segmentation [3.0] NoiseUNetは、有界な摂動をスキップ接続に注入し、クロススケールな機能融合を規則化する。
実験により、NossUNetはセグメンテーション精度とバウンダリ忠実度の両方を一貫して改善することが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:17:15 GMT)
FALSIFYBENCH: Evaluating Inductive Reasoning in LLMs with Rule Discovery Games [3.0] 従来のWason 2-4-6タスクに触発された仮説駆動推論のための評価フレームワークであるFALSIFYBENCHを紹介する。
このタスクは、仮説の生成、証拠収集、そして証拠の確認と不確認の両方に対応する信念の修正という、科学的推論の重要な要素を捉えている。
モデルファミリとスケールをまたいだ12 LLM の評価は、推論モデルが命令調整モデルよりも一般的に強力な科学的推論モデルであることを示しているが、最適性能に近づくモデルはない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:33:17 GMT)
Hybrid Gaussian-exponential zero-noise extrapolation for periodic circuits [2.9] 本稿では,周期構造を持つ量子回路に適したハイブリッドガウス-指数外挿法を提案する。
中間から大きな回路深度について、ハイブリッドモデルは以前の外挿変量と比較して測定可能なバイアスの減少をもたらす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:36:04 GMT)
Scaling Laws for Behavioral Foundation Models over User Event Sequences [2.9] 本稿では、共通の2部分の振る舞いモデルアーキテクチャ、特徴ベースのイベント埋め込み、デコーダのみの変換器について検討する。
約600回にわたって、実際のインタラクションデータで動作し、トレーニング用FLOPは1015ドルから1019ドルの範囲で、デプロイ関連軸が4つあります。
計算最適トレーニングは低計算時のテキストと比較してデータ量が多いが、計算量が増加するにつれて、そのD/N$比はチンチラに向かう。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:59:25 GMT)
The Role of Instructional Guidance in Generative AI-Assisted Learning: Empirical Evidence from Construction Engineering Education [2.9] 本研究では,建設教育における指導指導が学生とAIの相互作用をどのように形作るかを検討する。
生成学習理論に基づく5段階のプロンプトフレームワークを導入し,学習者のインタラクションをガイドする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:27:46 GMT)
Uncertainty-Aware End-to-End Co-Design of Neural Network Processors: From Training and Mapping to Fabrication [2.8] 本稿では,ニューラルネットワークプロセッサ設計のための統一的なフレームワークを提案する。
ネットワークトレーニング、チップマッピング、ウエハレベルの製造、計算リソース割り当てにまたがる4つの相互運用可能な設計ブロックで構成されている。
3つのケーススタディがこのアプローチを検証する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:16:16 GMT)
LEVANTE-bench: Multi-Scale Comparison of VLMs to Children Using Cognitive Tasks (or, "Is Your VLM Smarter Than a 5th Grader?") [2.8] 視覚言語モデル(VLM)は、人間の認知をモデル化し、経験を積んで発展していくことを約束する。
LEVANTE-benchは,言語や文化における子どもの認知度を計測するタスクとデータに基づくベンチマークである。
モデルを複数スケールで比較し、全体的な精度、課題レベルとアイテムレベルとの整合性、そして子どもの試行レベルの誤差分布とどの程度うまく一致しているかを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:41:11 GMT)
Multi-entropy in random tensor networks [2.7] 我々はRandom Network (RTN) 状態における Rényi multi-entropies $S(q)_n$ の評価について検討した。
Rényi index $n=2$ および任意のパーティ数$q$ の場合、マルチエントロピーはネットワークを通しての最小のマルチウェイカットによって決定されることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:30:41 GMT)
Testing LLM Arithmetic Reasoning Generalization with Automatic Numeric-Remapping Attacks [2.7] 算術語問題に対する数値再マッピング攻撃を自動生成するアルゴリズムを提案する。
我々は,GSM8K,MAWPS,MultiArith上でDeepSeek-R1(70B),Gemma4(31B),GPT-OSS(120B)を評価した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:40:36 GMT)
Extraction and Search in Rocq: Theorems, Definitions and Their dependencies [2.6] Rocq (Coq) は、ソフトウェア検証や数学的証明など、様々な分野で広く使われている。
本稿では、定理合成を解析し、定理、依存関係、定義を抽出できるRocq定理抽出解析ツールTheoremExtrを紹介する。
我々はまた、定理と定義のクロスプロジェクト類似性検索をサポートするウェブサイトを開発した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:33:17 GMT)
Signed Dual Attention: Capturing Signed Dependencies in Time Series Forecasting [2.6] 標準的な注意機構は、ホモフレンドリな相互作用を暗黙的に仮定し、時系列のような正と負の依存関係を持つデータをモデル化する能力を制限する。
本研究では, 付加パラメータを伴わずに, 正と負の両方の相関パターンをキャプチャする新しいアテンション形式であるSigned Dual Attentionを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:02:14 GMT)
Graph-Guided Universum Learning in Generalized Eigenvalue Proximal SVMs for Alzheimer's Disease Classification [2.5] アルツハイマー病(AD)の早期かつ正確な検出は、時間的介入と疾患管理に重要である。
本稿では、構造的MRIデータを用いて、AD対認知正規化(CN)分類のためのグラフ誘導大学学習モデルUG-GEPSVMとIUG-GEPSVMを提案する。
ICAとPCAの5つのノイズレベルにおける特徴を用いたADNI MRIデータセットの変異実験により、提案したモデルが既存のGEPSVMとUniversumベースの手法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:24:09 GMT)
TeleHunt: A Framework and Tool for Efficient Cybercriminal Community Discovery on Telegram [2.5] 本稿では,Telegram上でサイバー犯罪コミュニティを発見するための様々な戦略の有効性を評価するためのフレームワークとツールであるTeleHuntを提案する。
我々は、メッセージレベルの分類、コンテキストフィルタリング、マーケットセグメンテーションラベリングを統合し、参照駆動型スノーボール戦略のセットを採用する。
本研究は, (i) モジュール型サイバー犯罪コンテンツ発見パイプライン, (ii) マーケットセグメンテーションアクセシビリティを実証的に評価したTelegram発見戦略の最初の体系的比較, (iii) 6,022のTelegramコミュニティからの1億7200万以上のメッセージのラベル付きデータセットを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:31:58 GMT)
Assessing the Carbon Emissions and Energy Consumption of U.S. Hyperscale Data Centers [2.5] 我々は2024年5月から2025年4月までに403の米国ハイパースケールデータセンターに関する情報を収集した。
電力消費, 発電源およびCO2排出量を推定した。
当社のアプローチは,ハイパースケールデータセンターの環境フットプリントを評価するための属性ツールを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:38:10 GMT)
QPredSGG: Hybrid Quantum Predicate Learning for Long-Tailed Scene Graph Generation [2.4] シーングラフ生成(SGG)は、オブジェクトとその相互作用に対する関係推論を必要とする。
古典的なSGGモデルは、しばしばデータセット統計に依存し、頻繁な関係に対するバイアスのある予測をもたらす。
本研究は,古典的述語ヘッドであるCausal Feature Enhancement Network (CFEN) を,重み付きクロスエントロピーを用いて学習した量子述語ヘッド (QP-Head) に置き換えることで,SGGのためのハイブリッド量子述語分類器を導入する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:15:56 GMT)
Offline-to-Online Learning in Linear Bandits [2.4] 線形バンディット設定にオフラインデータセットを追加してオンライン学習を学習する。
我々は、このトレードオフのバランスをとる線形帯域幅アルゴリズムを提案し、初期ラウンドでオフラインデータに依存し、地平線が大きくなるにつれて探索を好んでいる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:18:46 GMT)
Too Much of a Good Thing: When sim2real Efforts Impede Policy Learning (And What to Do About It) [2.3] 我々は、シム2リアルな取り組みが、政策学習と不整合なインセンティブをもたらし、現実社会が課した不合理な制約により、シミュレーターのロックインと政策探究が不十分になったと論じる。
本稿では,ロボットのキネマティクスを唯一の設計制約として活用するsim2sim2realパラダイムによる潜在的な解決策を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:09:02 GMT)
Biomazon: A Multimodal Dataset for 3D Forest Structure and Biomass Modeling in the Amazon Basin [2.3] Biomazonは、Amazon Basin上の20mのマルチモーダルベンチマークデータセットである。
GEDI RHとAGBDターゲットとマルチセンサー予測器をペアリングする。
Biomazonは、構造的に一貫したRH現象予測に関する将来の研究のための基準ベンチマークを確立する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:16:35 GMT)
No-Go Theorem for Gaussian Quantum Repeaters from Fractional Extendibility [2.3] 量子ネットワークにおけるガウス量子リピータのノーゴー定理を証明する。
我々の証明はガウス状態に対する分数拡張性の概念に$k$-extendibilityの一般化を導入する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:00:00 GMT)
Hierarchical Space Partition for Surface Reconstruction [2.3] モデルコンパクト性を保ちながら、行方不明な詳細を効果的に回収する平面組立戦略を提案する。
我々は、シーンから抽出されたすべての平面を、3つのカテゴリに分類する。
シーン構造解析によって復元された見えない平面は、行方不明の詳細を示している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:52:36 GMT)
Data-efficient flood depth prediction through domain-aware coreset selection and tabular foundation models [2.3] リアルタイムに近い洪水深度予測は、正確な、高速で、流域をまたいで移動可能なモデルを要求する。
スーパービジョンされたサロゲートは、物理ベースのシミュレータを正確にマッチングすることができるが、流域ごとに数百万のトレーニング行が必要であり、元のメッシュを超えて外挿することはできない。
本稿では,提案するドメイン対応コアセット構築パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:25:38 GMT)
Drift-Augmented Scoring: Text-Derived Noise Robustness for Zero-Shot Audio-Language Classification [2.1] そこで我々は,コサインスコアに付加される小さなクラスごとのボーナスであるDrift Augmented Scoring (DAS)を提案する。
DASは、雑音の多いオーディオ埋め込みが、クラスのノイズ条件付きテキストが予測する方向にドリフトするとき、クラスに報酬を与える。
我々は,Acevedo et al.のUrbanSound8KとフルFSD50Keval集合の4つの変種との比較を行った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:12:34 GMT)
Nonreciprocal Dispersive Coupling for Quantum Sensing [2.1] 分散結合は量子情報の読み出しに広く利用されている。
ほとんどの先行研究は相互分散結合に集中している。
本研究は、量子センシングを向上し、超精密量子センサの製作を可能にする新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:45:14 GMT)
L-TGVN: Leveraging Longitudinal Priors for Personalized Rapid MRI [2.0] 長期の取得は、患者の不快感を増し、検査コストを上げ、スキャナのスループットを制限する。
スキャン時間を短縮するための一般的なアプローチは、より少ない測定値を取得することである。
フォローアップテストでは、患者の最新の先行スキャンは、非常に有意義な主題固有のコンテキストを提供することができる。
本稿では,従来のスキャンを副次情報として活用し,現在のスキャンを再構築するL-TGVNについて紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:56:25 GMT)
Gaussian mean width strong converse bound on the classical identification capacity of quantum channels [2.0] 我々は、量子チャネルの識別能力に縛られる単一文字と効率的な計算可能な強い逆を確立する。
製品状態重み付き$-ユークリッド幾何を用いた$n$フォールドチャネル出力空間を具備することにより、同定符号のトレース距離分離制約をユークリッド被覆推定により制御できる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:00:02 GMT)
Resource-efficient energy-based operator selection in fermionic ADAPT-VQE via exact Hamiltonian transformation [2.0] 本研究では,ハミルトニアン変換がフェルミオンエネルギーベースADAPT-VQEの測定オーバーヘッドを低減するための有効な経路であることを示す。
その結果,ハミルトニアン変換はフェルミオンエネルギーベースのADAPT-VQEの測定オーバーヘッドを低減するための有効な経路であることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:08:45 GMT)
Bitcoin After Block Rewards [2.0] Bitcoinのブロック報酬はゼロに減少する予定である。
本稿では, 正直な鉱業からの大規模かつ永続的な逸脱が生じる状況を明らかにすることを目的とする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:58:41 GMT)
UniFair: A unified fair clustering approach based on separation and compactness [1.9] 両助詞の公平性と両助詞の公平性を協調的に最適化する統一的枠組みを提案する。
我々は分離フェアと$k$-meansの目的を統一した勾配に基づく最適化手法を開発し、オートエンコーダの潜在空間における同じ基準を強制することにより、それらを深層クラスタリングに拡張する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:00:22 GMT)
Disentangling Answer Engine Optimization from Platform Growth: A Log-Based Natural Experiment on ChatGPT Referral Traffic [1.9] ChatGPTのような大規模言語モデル"アンサーエンジン"は、現在、測定可能な参照トラフィックをオープンWebに送信している。
AEOの成功談は、通常、生の成長倍数を引用するが、生の参照成長は、応答エンジン自体の急速なプラットフォームレベルの成長によって構築される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:23:03 GMT)
RIDE: An Open Dataset and Benchmark for Train Delay Prediction [1.8] RIDEは、ベルギーの鉄道網上に全国規模で構築された列車遅延予測のためのオープンデータセットとベンチマークである。
94.5万の列車イベント、3.6万回の旅行、2023年から2025年までの35.7万回の気象記録をカバーしている。
生の鉄道と気象源から、再利用可能な中間関係データセットとモデル対応ベンチマークデータセットの2つのパブリックリリースまでの、階層化されたデータパイプラインとして組織されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:29:50 GMT)
Identifying Gems from Roman RAPIDly [1.7] ナンシー・グレイス・ロマン宇宙望遠鏡(ローマン)は、前例のない空間分解能とケイデンスで広視野赤外線イメージングを行う。
ローマの実際のデータは存在しないため、そのようなパイプラインの開発は困難である。
本稿では,機械学習モデルであるRuBR$と,真に過渡かつ可変な検出を識別するための一般的な手法を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:06:30 GMT)
Exploring LLMs for South Asian Music Understanding and Generation [1.6] 東南アジアのクラシック音楽において,Large Language Models (LLMs) 能力の体系的評価を行った。
音楽理解評価には,ラーガ文法,文化知識,記号表記推論を対象とする504問問答ベンチマークを導入する。
音楽生成のための5レベル制御プロンプトフレームワークを設計し、最強のモデルでさえスタイリスティックに忠実なアウトプットを生成できるのは、その40%に過ぎないことを発見した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:53:27 GMT)
EEG-FuseFormer: A Transformer-Driven Feature Fusion Framework for Seizure Onset Prediction [1.6] 発作発生の正確な予測はてんかん患者のリスクを軽減するのに役立つ。
本稿では,アセプション・オンセット予測のためのトランスフォーマーベースの機能融合フレームワークであるEEG-FuseFormerを提案する。
提案モデルでは,98.85%の平均リコールを実現し,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:33:52 GMT)
Context-as-a-Service: Surfacing Cross-File Dependency Chains for LLM-Generated Developer Documentation [1.6] Context-as-a-Service (C)は、エージェントがソースコード、API参照、アップストリームドキュメントをクエリすることを可能にする。
Cはソースコード、API参照、アップストリームドキュメンテーションをインデックスし、エージェントはキーワードとセマンティック検索を組み合わせたツールコールを通じてインデックスをクエリできる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:26:56 GMT)
BBOmix: A Tabular Benchmark for Hyperparameter Optimization of Unsupervised Biological Representation Learning [1.6] $textbfBBOmix$は、現実世界の生物学的データの教師なし表現学習のための最初のオープンソースベンチマークである。
再構成損失と下流タスク性能の相関関係を定量化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:48:31 GMT)
Abduction Prover in Isabelle/HOL [1.5] 本稿では,Isabelle/HOLのAbduction Proverを紹介する。
挑戦的な証明目標を与えられたAbduction Proverは、帰納的推論を用いて有用な予想を特定することによって、目標の証明スクリプトを構築する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:41:08 GMT)
Zero knowledge verification for frontier AI training is possible [1.4] 本稿では,フロンティア高密度事前学習のための検証アーキテクチャを提案する。
これは、事前コミットされたトレーニング仕様、ノード間ネットワーク観測、中間計算のオンザフライメルクルコミットメントを組み合わせたものである。
単桁のトレーニング側オーバーヘッドで36ヶ月以内に、デプロイ可能な概念実証を見積もる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:57:28 GMT)
Towards Process Mining Use Case Map Models with PM4Py-UCM [1.4] 本稿では、既存のPM4Py Pythonライブラリのオープンソース拡張であるPM4Py-UCMをコントリビュートし、解説する。
ユースケースマップ(UCM)モデルを、プロセス発見の第一級出力であるITU-TのUser Requirements Notation(URN)から作成することを目的としている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:07:11 GMT)
Mutation Without Variation: Convergence Dynamics in LLM-Driven Program Evolution [1.4] ドメイン固有言語における選択圧の欠如によるLPMによる突然変異連鎖の解析を行った。
LLMに基づく突然変異はプログラム空間内の制限された誘引領域へ連続的に収束する。
収束性は構造レベルでは特に深刻である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:22:29 GMT)
Anomalies in Multivariate Time Series Benchmarks Are Mostly Univariate [1.3] MTSADモデルにおいて、異常が複数のチャネルに分散する可能性があるという仮定を評価する。
我々は,各ラベル付き異常に対して,少なくとも1つのチャネルが正常な履歴から個別に逸脱するか否かをフラグするセグメントごとの診断フレームワークを導入する。
我々のフレームワークは、これらのセグメントをチャンネル間のみとして正しく特徴付けている。
現在のMTSADベンチマークは、チャネル間モデリング機能を検証するには適していないと結論付けている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:11:53 GMT)
Expectations vs. Realities: The Cost of MSE-Optimal Forecasting Under Conditional Uncertainty [1.2] 多段階時系列予測(MSF)は平均二乗誤差(MSE)などのポイントワイド誤差指標を用いて一般的に評価される。
これは条件的不確実性の下では誤解を招く可能性を示し、条件的期待はより長い地平線における典型的な実効値とは無関係となる。
これにより、MSF評価における点精度と限界リアリズムの基本的なモデルに依存しないトレードオフが確立される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:50:32 GMT)
Do Foundation Models See Biology? Evaluating Attention Coherence with Spatial Transcriptomics in Glioblastoma [1.2] 本研究では,無仮説の注意評価のための空間転写学に基づくフレームワークを提案する。
本フレームワークは,病理組織学から基礎モデルが学べるものを客観的かつ定量的に評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:49:31 GMT)
Enhancing MedSAM with a Lightweight Box Predictor for Medical Image Segmentation [1.2] 軽量なBox PredictorモジュールをMedSAMアーキテクチャに統合したセグメンテーションフレームワークを提案する。
Box Predictorは、ローカライズされたイメージ埋め込み機能を使用して、単一のユーザクリックから近似的なバウンディングボックスを推定する。
本手法は解剖学的構造と画像領域のセグメンテーション精度とロバスト性を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:34:15 GMT)
What Type of Inference is Active Inference? [1.2] 積極的推論は意思決定を推論とし、期待自由エネルギー(EFE)はゴール指向と情報探索の行動を統一する。
近年の研究では, EFE の最小化は, 造血前兆を付加した生成モデル上での変動自由エネルギー (VFE) の最小化として記述できることが示されている。
拡張モデルのVFEは、予測モデルのVFEとして書き直せること、および明示的なエントロピー補正項により、EFEコントリビューションを透過的にすることができることを証明した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:24:53 GMT)
3D Temporal Analysis for Autism Spectrum Disorder Screening During Attention Tasks [1.2] 3DモデリングフレームワークであるDEC(Detailed Expression Capture and Animation)上に構築された新しい3D時間解析フレームワークが紹介されている。
GRUベースのモデルは優れた性能を示し、3Dヘッドポーズの精度は83.9%、顔の特徴は81.4%に達した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:07:28 GMT)
AIP: A Graph Representation for Learning and Governing Agent Skills [1.1] 現在、エージェントスキルは、エージェントがすべてのセッションでどのように振る舞うかを読み、解釈し、再導出する必要があるフリーフォームの散文で構成されている。
これは、実装が重いタスクに対する信頼性の低下と、スキル創造と改善の難しさの2つの複合コストを課します。
Agent Instruction Protocol (AIP) は両方とも、有向実行グラフとしてスキルをモデル化することで対処する。
コンパイラのメタスキルは、既存の人書きスキルをこの形式に変換する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:02:49 GMT)
Parthenon Law: A Self-Evolving Legal-Agent Framework [1.1] 法律ドメインのエージェントは、ドキュメントの重い問題をレビュー可能な作業製品に変えることを約束します。
今日の最強のモデルとハーネスの組み合わせが、エンドツーエンドの法的な問題に対してどのように振る舞うかについて、大規模な証拠はない。
反推論学習ループは、得られた失敗をタスクに依存しない編集からスキル、ツール、知識に変換する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:39:42 GMT)
PaCX-MAE: Physiology-Augmented Chest X-Ray Masked Autoencoder [1.0] 胸部X線エンコーダに生理的前駆体を注入するクロスモーダル蒸留フレームワークPa CX-MAEを提案する。
Pa CX-MAEは、CXR表現をペアのECGと実験室の埋め込みと整合させて、二重のコントラスト予測目的でドメイン内のマスク付きオートエンコーディングを増強する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:36:52 GMT)
Emergent Self-Similar Quantum Revivals in Spiral Drives [1.0] 準周期的スパイラルキックによって駆動される多体系における自己相似量子回復という、非平衡時間秩序の形式を見つける。
可積分性破壊的な摂動の存在下では、システムは最終的に加熱されるが、代数的に調節可能な寿命を持つ長寿命の予熱状態は、加熱セットに入る前に起こる。
本研究は、非平衡量子物質の新しいパラダイムとして自己相似量子復元法を確立し、現在の量子シミュレータにおける観測の現実的な経路を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:04 GMT)
Formal verification of the S-two AIR [0.9] StarkWareのS-two証明は、カイロ仮想マシン言語で記述されたプログラムを完了まで実行させる効率的な手段を提供する。
Lean 4の証明アシスタントを使って、エンコーディングが健全であることを検証します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:36:41 GMT)
Does Artificial Intelligence Advance Science? [0.9] 私たちは、AIの採用と科学的創造性との関係を調査するために、OpenAlexから100万以上の出版物を分析します。
私たちは、AI出版物は、非AI出版物と比較して、最高の創造性を達成する可能性が著しく高いことに気付きました。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:23:58 GMT)
Beyond Prompt-Based Planning: MCP-Native Graph Planning-based Biomedical Agent System [0.9] グラフスキャフォールド計画に基づくMSPネイティブなバイオメディカルエージェントであるBioManusを紹介した。
また,BioManusは,高度なバイオメディカルエージェントベースラインよりも実行精度,ワークフローの妥当性,コンテキスト効率を向上することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:19:25 GMT)
HYolo: An Intelligent IoT-Based Object Detection System Using Hypergraph Learning [0.9] HYoloはIoTベースのオブジェクト検出フレームワークで、ハイパーグラフ学習をYOLOアーキテクチャに統合する。
提案手法は, 全体の検出精度とロバスト性を高めつつ, mAP@50の約12%の改善を実現する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:02:12 GMT)
Teaching Robots to Say 'I Don't Know' : SENTINEL for Uncertainty-Aware SLAM [0.9] 低コストの2D LiDARは、ハイエンドセンサーが測定障害の診断に使用する強度チャネルを欠いている。
本稿では,SENTINEL, フリーラベル, フリー信頼度推定フレームワークを提案する。
我々は、RPLidar A2M12とIntel RealSense D435iを搭載したGEFIER R1 4輪スキッドステアロボットでこれを評価した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:22:05 GMT)
MineXplore: An Open-Source Reinforcement Learning Exploration Benchmark for GNSS-Denied Underground Environment [0.9] 地下地雷は自律型ロボットナビゲーションの極端な条件を示す。
GPSは拒否され、照明は劣化し、トンネルトポロジーはループに富んでいる。
オープンソースの MuJoCo ベンチマークである MineXplore を提示する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:59:40 GMT)
CADENCE: Predicting Realized MAPF Execution Time Beyond Sum of Costs [0.9] Multi-Agent Path Finding (MAPF)アルゴリズムは、産業倉庫やロボット共有ワークスペースにおけるロボットチームの動きを計画するために、ますます使われている。
しかし、SoC(Sum of Costs)やMakepan、プランナーランタイムといった標準的なMAPFアルゴリズム評価メトリクスは、プランナーの選択が現実的な実行パフォーマンスにどのように変換するかを曖昧にします。
CADENCEは、7つのディファレンシャルドライブロボットを用いた固定された7×7ワークセル上のこの評価ギャップに関するハードウェア研究である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:28:09 GMT)
Comment on "Possibility of superradiant neutrino emission by atomic condensate" by M. Blasone, L. Gastaldo and F. Romeo, Phys. Rev. D 113, 053010 (2026) [0.9] 分子中に2つのフェルミオンを配置することは、フェルミオン反共役子によるニュートリノ放出における干渉項のキャンセルを除去しない。
ニュートリノの超放射能放出に関する最近の提案は、超放射能ニュートリノ放出が根本的に不可能であるという我々の証明を回避できないことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:44:48 GMT)
SalsaAgent: A multimodal embodied language model for interactive dance generation [0.8] 本稿では、人間のリーダーに反応して、表現力のあるフルボディサルサダンスの動きを生成する言語モデルであるSalsaAgentを紹介する。
我々は、対話を非言語的な動きトークンパスとして定式化し、大きな言語モデルの語彙を拡張した。
コントリビューションには、フルボディおよびモーションリレーションのための新しいトークン、LLMファインチューニング、および2段階のトークン・ツー・ディフュージョンパイプラインが含まれる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:14:15 GMT)
ORACLE-CT: Anatomy-Aware Support Pooling for CT Classification [0.8] ORACLE-CTはエンコーダに依存しない解剖学的アグリゲーションフレームワークである。
単一組織、複数組織連合、比較、ローカライズ、グローバルサポート戦略をサポートしている。
ORACLE-CTは、予測と解剖学的証拠の間の監査可能なリンクを維持しながら、識別と外的堅牢性を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:37:05 GMT)
Self-Reflective APIs: Structure Beats Verbosity for AI Agent Recovery [0.7] Self-reflective APIは、バリデーション失敗時に、マシン可読リカバリ_feedback.[]ペイロードを返す。
リーク監査されたパイロットでは、構造化された提案は、通常の英語診断に対するタスク補完率を+36.7$--$40.0$pp引き上げる。
再利用可能なCIインフラストラクチャとして、audit_prompt_leakage.pyを出荷しています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:02:11 GMT)
TIBlender: Early-Warning Threat Intelligence from Cross-Platform Social Media Evidence [0.7] TIBlenderは4つのプラットフォーム(X、Reddit、Telegram、Discord)を監視し、構造化された脅威レポートを生成するマルチエージェントシステムである。
現実の展開において、TIBlenderは、公開フィードより前の4つの脅威カテゴリすべてに出現する脅威を検出した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:14:55 GMT)
StrokeTimer: Robust Representation Learning for Ischemic Stroke Onset-Time Estimation from Non-contrast CT [0.7] StrokeTimerは、急性虚血性脳梗塞の発症時間推定のための完全に自動化されたフレームワークである。
発症時間は, 4.5h, 4.5-6h, >6hの3つの臨床関連窓に分類される。
StrokeTimerは0.69のマクロAUCと0.57のマクロF1スコアを達成し、最強のベースラインを50%近く改善した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:01:22 GMT)
SWE-InfraBench: Evaluating Language Models on Cloud Infrastructure Code [0.7] クラウドコンピューティングにおけるインフラストラクチャ・アズ・コード(IaC)の構築は重要な課題である。
当社のベンチマークでは、AWS CDKのような命令型ツールを使用して、企業開発で一般的なインクリメンタルなコード編集を反映しています。
SWE-InfraBenchは、数十の現実世界IaCから得られた多様な評価データセットである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:48:53 GMT)
Atom Interferometry with Transverse Optical Modes [0.7] 我々は超幾何ガウスビームのヘリカル位相巻線をラムゼー干渉計と弾道的に膨張するRb87原子のアンサンブルに用いる。
干渉計は、軌道角運動量や干渉計時間と線形にスケールする感度で、モータによって誘導される回転を測定することができることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:22:02 GMT)
Multimarginal flow matching with optimal transport potentials [0.6] フローマッチング(FM)は、2つの経験的分布間の動的トランスポートマップを学習するための強力なフレームワークとして登場した。
我々はFMと動的最適輸送(OT)の接続を利用した新しいアプローチでこの問題に取り組む。
学習フローの時間的ダイナミクスにかなりの柔軟性をもたらすマルチマルジナルFMの効率的でシミュレーション不要なアルゴリズムを導出する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:11:44 GMT)
SoftPINCH: EMG-Driven Soft Exoskeleton Assistance for Finger Flexion and Grasping [0.6] SoftPINCHは、指の親指屈曲とピンチグリップアシストのための、EMG駆動のソフトウェアラブルエクソスケルトンである。
このシステムは、腱駆動のソフトな外骨格、指先磁気接触センサー、および意図に基づく支援のための神経EMGデコーディングを組み合わせる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:59:27 GMT)
Continuous-variable ADAPT-VQE for bosonic lattice models [0.6] 連続可変可変可変可変量子固有解器(CV-ADAPT-VQE)を提案する。
ボース・ハッバードモデルとボソニック・キタエフ連鎖の基底状態準備について考察する。
この結果は、凝縮マター系の量子シミュレーション、量子化学、高エネルギー物理学の直接応用に向けられている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:08 GMT)
A New Quaternion-Joint Cable-Driven Redundant Manipulator Configuration and its Control Through FABRIK and Residual Reinforcement Learning [0.6] 四元同員は、以前の能力を超えて、ロボットアームのクラスに権限を与えている。
4分割8接合マニピュレータは,既存の構成よりも広い作業空間を実現できることを示す。
その結果, この構成は従来の設計よりもワークスペース効率が高いことがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:33:21 GMT)
q0: Primitives for Hyper-Epoch Pretraining [0.6] 単一のモデルの事前訓練は、計算予算が枯渇するずっと前に、数パス以内に飽和する。
ハイパーエポック事前学習(q0)を導入し,マルチエポック予算を多種多様なモデルに転換する。
我々は,q0が56エポック(4.6倍)または67エポック(3.8倍)の強い256エポックアンサンブルベースラインと一致することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:07:12 GMT)
Federating Governance: How Community Rules Scale with Mastodon Instances [0.6] MastodonやBlueskyのような分散ソーシャルメディアプラットフォームは、自己統治とモデレーションのスケーリングという課題を強調している。
本研究では,様々なサイズのサーバ間でのコミュニティルールを解析し,Mastodonインスタンスによるモデレーションのスケールについて検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:29:45 GMT)
Tiny Collaborative Inference for Occlusion-Robust Object Detection [0.5] 検索と救助のためのエッジAIノードは、コンピュータビジョンをローカルで実行することがますます期待されている。
ウルトラローエンドハードウェアは、メモリ、計算、デバイス間通信に厳しい制約を課す。
本研究は、MCUバックボーン、YOLOv2検出ヘッド、Lite量子化を組み合わせることで、1MB未満の閉塞物検出装置に対処する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:50:50 GMT)
Stability vs. Manipulability: Evaluating Robustness Under Post-Decision Interaction in LLM Judges [0.5] 本研究では, 意思決定後の操作性について検討し, 審査員との会話を通じて評価結果が変更できる程度について検討した。
LLM審査員は、反復的かつ中立的な再評価の下で非常に安定しているが、目標決定後の課題下では、かなり可逆的になる。
これらの逆転は、人間の嗜好との合意を低下させ、ベンチマークのランクをシフトさせ、自己報告の信頼性が高いにもかかわらず有害な評価変更を発生させるという、実践的な結果をもたらす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:37:23 GMT)
Mamba-Assisted Non-Markovian Closure for Reduced-Order Modeling [0.5] 我々は、シーケンスモデリング問題としてクロージャモデリングを再放送する。
Mambaベースのシーケンスモデルは、解決された軌道からクロージャを予測するために訓練される。
数値積分器は、時間内に解決された変数を前進させるために用いられる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:18:50 GMT)
Output Type Before Quality: A Standards-Derived XAI Admissibility Rubric for Autonomous-Driving Safety [0.5] MLベースの自律運転の安全基準は、保証事例が含まなければならない証拠の種類を規定している(直接因果連鎖、定量化された介入効果、根因変数)。
しかし、XAI文献は出力型と技法系(相性マップ、特徴属性、反事実、因果グラフ、言語トレース)で整理されている。
私たちはこのミスマッチをエビデンスタイプのギャップと呼んでいます。
安全保証のためのXAI手法の選択は,メソッドの人気ではなく,ライフサイクル段階のエビデンス要求によって行うべきである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:37:52 GMT)
Consistency Training Can Entrench Misalignment [0.5] モデル生物108種を対象に, 整合性学習法を7種類試験した。
整合性トレーニングは、一般的に報酬のハッキングを抑え、創発的ミスアライメントをミスアライメントするが、梅毒症を増幅する。
本稿では, 整合性ラベリングプロセスによって誘導される分布変化が, 選択演算子の変動ではなく, 系統的アライメント効果の第一の要因であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:22:34 GMT)
Motion-Guided Causal Disentanglement for Robust Multi-View Cine Cardiac MRI Diagnosis [0.5] 本稿では,ViT-MAEバックボーン上に構築したMoViDフレームワークを提案する。
プライベートな臨床静脈血栓症データセットと2つの公開ベンチマークの枠組みについて検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:45:11 GMT)
HalfNet: Randomized Neural Networks with Learned Subspace Geometry [0.5] HalfNetは$N(0, )$からランダムウェイトを引いて、$$は分布の幾何学を定義する。
MNISTとCIFAR-10の実験は、ハーフネットが完全に訓練された多層パーセプトロンの性能と一致することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:19:00 GMT)
High-fidelity neutral atom gates leveraging low-rank Hessian optimization [0.4] 最適制御ゲートのためのHessian-based calibration法を開発し,ベンチマークする。
準安定状態171Yb核スピン量子ビット上の振幅ローバスト制御Zゲートにこのアプローチを適用する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:21:33 GMT)
Complexity of the Laughlin wave function from the Dyson-orbital perspective [0.4] フェルミ海は物理学においてシンプルで一般的な概念である。
ダイソン軌道はフェルミオン波動関数の複雑さを特徴づける貴重な道具を提供する。
ラウリン波動関数は強い相関を持つ非フェルミ液体状態を記述する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:55:04 GMT)
PJ-RoPE: A Fourier-Jet-Affine Position Space for Relative Attention [0.4] 我々は、RoPE のフーリエ位相、ヨルダン-RoPE の有限ジェット、および ALiBi のアフィン整流を単一の学習可能な相対配置空間に統一する。
制御されたプローブはセクター選択を検証し、小さな言語の実行はアフィイン/リカレンシ境界を公開する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:37:46 GMT)
A-Live: Passive Liveness Detection via Neuromuscular Micro-Motion Signatures on Commodity Sensors [0.4] Inertial Measurement Unit (IMU)信号のみで動作する受動生度検出フレームワークであるA-Liveについて述べる。
A-Liveの精度は99.5%を超え、誤認率や拒絶率も低い。
以上の結果から,神経筋マイクロモーションシグネチャは,新たなAI駆動型脅威モデルの下での生存度検出のスケーラブルで受動的基盤を提供することが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:30:30 GMT)
Fast Cubical Persistent Homology on 2D and 3D Images via Union-Find, Pruning, and Lookup Tables [0.3] Flash Cubicalは、$mathbbF$を超える2Dおよび3D画像のVフィルタ上の3次永続性の計算である。
本稿は、V-濾過立方体錯体の持続性に焦点をあてるが、基礎となるアイデアは、立方体錯体上のT-濾過に自然に一般化される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:26:52 GMT)
Learning Empirically Admissible Neural Heuristics for Combinatorial Search [0.3] 本稿では,検証校正可能なニューラルネットワークを学習するための一般化可能なフレームワークを提案する。
評価プロトコルの下では,我々の神経が観察された許容性違反を達成できないことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:27:46 GMT)
Tree-Based Formalization of Multi-Agent Complementarity in Human-AI Interactions [0.3] 相補性(complementarity)は、人間とAIのインタラクションが、メンバー間で利用できる最高の予測ベンチマークを上回っている場合である。
既存のフレームワークは、エージェントの予測がどのようにワークフローに敏感なマルチエージェントプロトコルを構成するかをモデル化していない。
複数エージェントHAIにおける相補性のツリーベース形式化を導入することで、このギャップを埋める。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:02:19 GMT)
Anomaly Detection for Electro-Hydrostatic Actuators using LSTM Autoencoder [0.3] 本研究では、制御されたテストベンチから収集した温度と圧力データに着目し、EHAセンサ信号のオフライン異常検出フレームワークを提案する。
本手法では, 復元型Long Short-Term Memory(LSTM)オートエンコーダを用いて, 検証セットの復元エラー分布を用いて校正・評価を行う。
LSTMオートエンコーダの平均精度は99.0%、精度は100%、リコールは90.2%から99.6%、F1スコアは93.1%から99.8%に向上し、高い検出感度と非常に低い偽値を示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:37:21 GMT)
Evidence-Guided Neural Architecture Selection under Uncertainty for Subject-Specific Blood Glucose Forecasting [0.3] 本稿では,ベイジアントレーニング,エビデンスに基づくランキング,不確実性の下でのタスク固有の検証を統合したアーキテクチャ選択のためのフレームワークEVIDENTを提案する。
本手法は1型糖尿病患者の個別血糖予測に時間的畳み込みネットワーク(TCN)を用いた。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:20:11 GMT)
Large AI Models in Dental Healthcare: From General-Purpose Systems to Domain-Specific Foundation Models [0.3] 口腔疾患は世界中で約35億人に影響を及ぼすが、歯科医療における大規模AIモデルの臨床的ポテンシャルはいまだによく分かっていない。
言語生成モデル、識別的視覚基盤モデル、歯科固有のモデルである。
汎用モデルと歯科固有のモデルが相補的な役割を果たす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:01:03 GMT)
STMutants: A Mutation Testing Dataset for Structured Text Programs in Industrial Automation [0.3] IEC 61131-3 構造化テキスト (Structured Text, ST) プログラムは、まだ公開されているベンチマークを欠いている。
STMutantsは,産業用自動化ソフトウェアのための突然変異試験データセットである。
STプログラムで最初に公開された突然変異ベンチマークを提供することで、STMutantsは再現可能な研究、突然変異解析、障害ローカライゼーション、PLCソフトウェアのAI支援品質保証を可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:47:54 GMT)
REStack: A Large-Scale Dataset of Reverse Engineering Discussions from Stack Exchange [0.3] リバースエンジニアリング(RE)はソフトウェアエンジニアリングとサイバーセキュリティにおいて重要な活動であり、マルウェア分析、脆弱性発見、レガシーシステムのメンテナンス、ファームウェア検査などのタスクをサポートする。
公開データセットが開発者Q&AフォーラムからREの議論を体系的に取得したことはない。
私たちは、Stack Overflowと専用のReverse Engineering Stack Exchangeサイトから収集された大規模なREディスカッションデータセットであるREStackを紹介します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:34:15 GMT)
MASF: A Multi-Model Adaptive Selection Framework for Abstractive Text summarization [0.3] 本稿では,抽象的テキスト要約の堅牢性と品質を向上させるために,多モデル適応要約フレームワークを提案する。
複数の微調整変換器に基づく要約モデルを統合し、適応的な選択機構を導入する。
BERTScoreのスコアは88.63%であり、全ての比較手法の中で最高である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:34:40 GMT)
On Out-of-sample Embedding in UMAP [0.3] 隣接埋め込みアルゴリズムは、低次元空間における等価グラフ表現を構築することにより、高次元データの相関関係を明らかにする。
元のk-アネレス近傍グラフ内のペア相互作用を最適化することで、「反発効果」を克服する方法を示す。
また、パラメータ化されたUDPを用いてデータを埋め込むと、反発効果が自然に軽減されることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:54:45 GMT)
Uncertainty Aware Functional Behavior Prediction and Material Fatigue Assessment for Circular Factory [0.3] 将来の機能フルフィルメントとコンポーネントの整合性は次のサービスシナリオで異なる進化を遂げる可能性があるため、現在の検査だけで再利用は決定できない。
既存のPHMアプローチは劣化予測をサポートするが、しばしば固定された動作条件や孤立したコンポーネントベンチマークをターゲットにしている。
本稿では、不確実性を考慮した機能予測と、インスタンス固有の信頼性ワークフローにおけるコンポーネントレベルの疲労評価を組み合わせることで、このギャップに対処する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:23:30 GMT)
Revisiting Vul-RAG: Reproducibility and Replicability of RAG-based Vulnerability Detection with Open-Weight Models [0.3] 本稿では,ソースコード脆弱性検出のフレームワークであるVul-RAGについて述べる。
結果より,Vul-RAGは局所的な展開では再現可能であるが,軽微な偏差は認められなかった。
本稿では,検出効率,モデル能力,モデルスケール間の実践的意味とトレードオフについて論じる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:20:37 GMT)
When Firms Learn to Game the Rules [0.3] ルール・アズ・コード(ルール・アズ・コード)は、より検証可能な法的義務を約束するが、規制当局が学べるものも変更する。
計算可能な強制信号の近接から法定しきい値付近の実際の行為を分離する,合成エージェントに基づく強化学習シミュレーションとのギャップについて検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:53:36 GMT)
Spatially Grounded Concept Bottleneck Models via Part-Factorized Attention [0.3] 概念ボトルネックモデル(CBM)は、クラスを予測する前に、人名属性の層を予測する。
この研究は、その自由を建設によって取り除く部分分解型CBMの研究である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:28:42 GMT)
Severity-Aware Curriculum Learning with Multi-Model Response Selection for Medical Text Generation [0.3] 既存の大きな言語モデルは、様々なケースの重大さのレベルにまたがって、一貫性があり、文脈的に適切な医療応答を提供するのに苦労することが多い。
本稿では,カリキュラム学習戦略と関連性に基づく応答選択を統合した重大度対応型マルチモデルフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:28:34 GMT)
A universal and efficient hybrid digital-analog fermionic quantum simulator [0.2] フェルミオン型超低温原子プラットフォームを用いた量子シミュレーションのための普遍的なフレームワークを提案する。
既存のハードウェア上の変分アルゴリズムが、ハードウェアのネイティブなハミルトニアンよりはるかに多くのボディシステムをシミュレートできることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:44:45 GMT)
The Double Well Done Doubly-Well [0.2] 対称二重井戸ポテンシャルは、摂動物理学と非摂動物理学が深く絡み合っている最も単純な量子力学系の1つである。
復活は2つの特徴を結びつけることで、正確なスペクトルを厳密に拘束されたトランスシリーズにまとめる。
本稿では、この2つの相補的アプローチから、このトランスシリーズを自己完結した説明を与える。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:01 GMT)
SANE Schema-aware Natural-language Evaluation of Biological Data [0.1] ドメイン固有のテキスト言語評価のための新しいパラダイムであるSANE-Aware Natural Evaluationを提案する。
構造化されたプロンプトとガードレールを持つ制約付きスキーマでは、モデルのトレーニングや微調整なしに正確なクエリ生成が達成可能であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:31:28 GMT)
MIRAI: Prediction and Generation of High-Impact Academic Research [0.1] MIRAI(Multi-year Inference of Research Trends and Academic Impact)は,論文のタイトル,要約,出版日のみを用いて,紙の影響を予測するディープラーニングフレームワークである。
5年間のPageRankと引用数を予測するために、arXivの学術グラフでMIRAIをトレーニングし、PageRankの予測でSpearmanの0.4686ドルを達成した。
我々は、MIRAI上に構築された研究アイデアパイプラインを提案し、高いインパクトに向けた研究アイデアを創出する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:06:01 GMT)
Crossover from Rabi oscillations to adiabatic population switching in the Faraday optical control of quantum dot spins [0.1] ファラデー幾何学におけるラマン遷移は、単一ショットキュービットの読み出しとキュービットの同時制御を可能にする。
不等復調を伴う両遷移の同時駆動のため、結果として時間依存のスタークシフトは、従来の画像以外の共鳴条件を生じさせる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:00:08 GMT)
ChessMimic: Per-Rating Transformer Models for Human Move, Clock, and Outcome Prediction in Online Blitz Chess [0.1] ChessMimicは、移動、思考時間、結果予測のための3つのエンコーダのみのトランスフォーマーのシステムである。
Lichess Rated Blitzのゲームでは、ChessMimicの人間の動き予測精度はEloの各バンドでMaia-2を上回っている。
公開デモは1e4.aiで、コード、バンド単位の重み付け、C++データフィルタパイプラインコードをGitHubでリリースしています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:42:39 GMT)
memorywire: A Vendor-Neutral Wire Format for Agent Memory Operations [0.0] 長期的なストレージに入る前に、人間がレビューを書くことができるフレームワークであるMemorywireを紹介します。
5つのバックエンドコンポーネントによるオープンソースリファレンス実装について説明する。
16-scenario cross-adapter conformance suiteは、80細胞中68細胞を無故障で通過する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:59:47 GMT)
XSSR: Cross-Domain Self-Supervised Representative Selection for Efficient Annotation in Medical Image Segmentation [0.0] XSSR (Cross-Domain Self-Supervised Representative Selection) は、ターゲットドメインにおけるアノテーションの労力を最小限に抑えるために設計されたフレームワークである。
XSSRは3つの段階から構成される: まず、Masked Autoencoder (MAE) がラベルのないソースデータに基づいてトレーニングされ、共有埋め込みスペースを確立する。
我々は,胸部X線,RIGA+網膜基底像,多部位前立腺MRIの3つの公開ベンチマークでXSSRを評価した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:09:35 GMT)
Worker Utility as Hysteresis: A Preisach Model of Transaction Acceptance in Gig Labour Markets [0.0] 各ギグトランザクションは単一のビットを生成する。
この構造は、潜伏労働者選好の自然な表現として、Preisachモデルを直接指していると論じる。
明示的な差分ゾーンを持たないモデルでは、両方の動作を同時に実行することはできない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:12:03 GMT)
What Can Verifiable Decapsulation Tests Certify? Pass Bounds and Fault-Recognition Limits for FO-Based KEMs [0.0] 藤崎・岡本脱カプセル化のブラックボックス試験では, ハーネスが観察した検体を観察した。
本報告では, 信頼度向上型KEM変種について, 誠実な参照手法を用いて検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:46:17 GMT)
Variational low-energy subspaces for chemically accurate excited states [0.0] 変動励起状態最適化は、電子ハミルトニアンの低エネルギー部分空間に対する反復基底状態様問題として再構成可能であることを示す。
この変動原理を非直交スレーター行列式に適用すると、状態数と状態毎の行列式によってのみ制御される励起状態計算の自動手法であるEXIDOSが得られる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:52:13 GMT)
Trust, but Don't Verify: Epistemic Blind Spots in LLM Source Evaluation [0.0] モデルが生成した統計量を検出する能力を持っているが、マルチソース合成においてこの能力を採用していないことを示す。
具体的には、ソースの影響は、解析テキストの分布レジスタに応答するが、数値の有効性には反応しない方法論登録ゲートによって制御される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:15:48 GMT)
Trivium: Temporal Regret as a First-Class Objective for Causal-Memory Controllers [0.0] これは構造的な問題であり、単にモデルキャパシティの問題ではないと我々は主張する。
作業因果モデルに対する結果後悔と認識後悔とを併せ持つ一級目的として,長期的時間的後悔を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:06:20 GMT)
Trajectory Dynamics in Language Model Hidden States Predict Human Processing Costs Beyond Surprisal [0.0] 本稿では,単語レベルの予測誤差(副次的)と展開解釈の局所運動量に対する感度(軌道外挿誤差)が処理コストの解離可能な成分であることを示す。
この効果は特に庭道の文で顕著である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:44:41 GMT)
Trading Engagement for Sustainability: Carbon-Aware Re-ranking for E-commerce Recommendations [0.0] 我々は,ほとんどの項目においてPCFラベルが欠落しており,推測されなければならない現実的な環境で,炭素対応製品レコメンデーションについて検討する。
まず,Carbon Catalogueからの監督を伝達するPCF推定パイプラインを用いて,製品レベルの炭素フットプリントを推定する。
次に、3つの確立された推奨モデルから得られた妥当性スコアに基づいて、炭素を意識したポストホック戦略を適用した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:34:46 GMT)
Towards Persistent Case-Based Memory for Autonomous Data Science: A CBR-Augmented R&D-Agent with a Locally Deployable Small Language Model [0.0] 我々は, Gemma 4 31B Dense のカスタムバックエンドに CBR レイヤを Microsoft の R&D-Agent フレームワークに統合した CBR 拡張 R&D-Agent を提案する。
ケースは構造化レコードとして格納され、実行可能なコードスナップショットと品質メタデータが格納される。
108回の検索イベントにおけるヒューリスティックな再利用検出は,意味的関連性が高いことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:56:11 GMT)
TopoPult-SSL: Gland-Mask-Free Cross-Device Meibomian Gland Segmentation via Self-Distilled Weak Clinical Priors [0.0] そこで我々はTopotPul-SSLについて紹介する。
公開MGD-1kからCAMG研究ベンチマーク上で,その手法の開発と評価を行った。
腺マスクのないStage-1変異体はSAM/MedSAMのPrecision94 vs. 0.30-0.34に達する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:47:54 GMT)
The Usefulness Gap in Proof-of-Useful-Work: An Empirical Study of Pearl's cuPOW Protocol [0.0] Layer-1ブロックチェーンのPearlは、Proof-of-Useful-Work(PoUW)プロトコルを、ネットワークを同時に保護し、AI推論を実行するために販売している。
そこで本研究では,Pearlの24EH/sネットワークが有用なAI計算をゼロにすることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:42:29 GMT)
The Security Budget of Code LLMs: An Information-Theoretic Capacity-Security Bound [0.0] 本稿では,機能容量$Cap=rmI(c*;c_)$と摂動保持$$Sec=rmI(c_;tilde c_)$のコードLLMに対する情報理論トレードオフについて検討する。
for $pto c_$ with perturbed prompt $tilde p$, we prove $Cap+Secle rmH(c*)+rmI(p;tilde p)$。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:30:25 GMT)
The Illusion of Opting in AI-Mediated Consequential Decisions [0.0] 我々は、現在のAIシステムは、既存のAI倫理が完全に捉えられていない深い倫理的問題を提起していることを示す。
AIシステムは、オプトインの錯覚からメタ能力を保護し、育成するかどうかによって評価されるべきである、と我々は主張する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:35:21 GMT)
The Digital Apprentice: A Framework for Human-Directed Agentic AI Development [0.0] 我々は,自律性を前提とせず,スケーラブルで安全なAIエージェンシーのためのフレームワークを提案する。
デジタル・アレンティス(Digital Apprentice)は、人間の暗黙の方法論を内包する発達学習者である。
我々は,データドリフトを捕捉し,実行時に異なる手法を適用することによって,トラフィックシフト時の品質の劣化を回復する方法を示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:49:13 GMT)
Synthetic Personalities: How Well Can LLMs Mimic Individual Respondents Using Socio-Economic Microdata? [0.0] 我々はドイツ社会経済パネルから詳細な個別レベルの双子を構築した。
建設工法グリッドの3倍の5倍の2倍の2倍の3倍の評価を行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:30:03 GMT)
Subspace-selective unitary manipulation based on the Hilbert-space symmetric structures in the multiple-quantum operator algebra spaces in the quantum-computing speedup theory [0.0] 量子計算スピードアップ理論(quantum-Computing speedup theory)は、量子系の対称構造と性質を、QCS(Quantum-Computing-Speedup)の基本的な資源とみなす。
今日では、量子コンピューティングとシミュレーションをスピードアップするために、基本的なQCSリソースをどのように活用するかが大きな問題となっている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:32:13 GMT)
Squeezed Phonon Lasing via Floquet-Controlled Solid-State Defects [0.0] フロケットエンジニアリングは、制御された4次スキューズを実現しつつ、フェーズロックされたラシングを実現することができる。
その結果,固体プラットフォームにおける励起フォノンレーザーの発生に関する新たな知見が得られた。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:40:13 GMT)
Spectral Fusion for Identifying Early State Exclusion in Symmetric Quantum Spin Chains [0.0] 我々は、中絶現象(ESE)について検討する。
ESE となしの PST を示すハミルトニアンの以前の構成に基づいて、任意の奇長鎖に対して明示的なヤコビ行列実現を提供する。
我々は、そのようなハミルトンの無限族を構築するために、遠近法融合(SF)のプロセスを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:12:00 GMT)
Soliton-antisoliton pairs in the supersymmetric gapped phase of an interacting Majorana chain [0.0] 従来の三臨界点におけるSUSY診断はイジング側ですぐに分岐するが、ギャップ付き位相では連続的に0に崩壊する。
励起はソリトン-アンチソリトン対からなり、異なる順序領域が分離される。
このディラックモードの占有は、偶数と奇数のフェルミオンパリティを持つ固有状態を区別する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:57:38 GMT)
SoK: Post-Quantum Cryptography (PQC) Implementation in Software Systems [0.0] ポスト量子暗号(PQC)は、ソフトウェアシステムが出現する量子可能な脅威から保護するために不可欠である。
このSoKは、人間、組織、技術(HOT)の次元を通じて、PQCの実装アプローチと課題を調査する。
本稿では,HOT次元間の相互作用がソフトウェアにおけるPQC実装にどのように影響するかを説明する概念的フレームワークであるPQC-HOTモデルを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:48:29 GMT)
Shortcomings and capacities of real-constrained neural networks in complex spaces [0.0] 複雑な仮説クラスにおいて、実際の事前アクティベーションを行う際の記憶容量の比を求める。
我々の証明は、文献において非標準であるハリシュ・チャンドラ・イツィクソン・ズーバー公式(HCIZ)の適用に依存している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:11:03 GMT)
Selective-Advantage Entropy-Adaptive Horizon GRPO: Asymmetric Token-Level Discounting for Efficient Reinforcement Learning of Language Models [0.0] グループ相対政策最適化は、推論タスク上で言語モデルを整合させる効果的な強化学習アルゴリズムとして登場した。
本稿では,Adaptive-Horizon GRPOとSelective-Advantage AH-GRPOの2つの補完拡張を導入する。
解析の結果、非対称割引は正しい解の完全な勾配信号を保持し、エントロピー崩壊を防止し、トレーニングを著しく安定化させることがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:57:57 GMT)
Selection-Aware Diagnostics for Chain-of-Thought Answer Hijacking [0.0] チェーン・オブ・ソート(CoT)応答ハイジャックのための制御された数値プロキシについて検討した。
Across Qwen2.5-7B and Llama3-8B on GSM8K few-shot, puzzle, and sycophant hijacks, three few-shot/puzzle cells pass confirmedatory $K=1$ localization。
選択対応50/50バンドバリデーションは、Qwen-puzzleの+32.6、+45.1、+17.7の帯域外ギャップを保留する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:49:43 GMT)
Scalable Uncertainty Quantification for Extreme Weather Forecasting via Empirical Neural Tangent Kernels [0.0] ディープラーニングの天気モデルでは、数値的な天気予報の精度が向上し、桁違いの精度が向上した。
しかし、不確実性予測のない決定論的予測は、極度の気象イベントにおける高い意思決定に重要なギャップである。
本稿では,最後の層的経験的特徴を用いたニューラル・タンジェント・カーネルに基づく不確実性定量化(NTK-UQ)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:56:35 GMT)
SHIELDS: Automating OS Hardening with Iterative Multi-Agent Remediation [0.0] 大規模言語モデル(LLM)を用いて,OSのハードニングを反復的フィードバック駆動プロセスとしてアプローチするマルチエージェントシステムShielDSを紹介する。
我々は,20Bから400Bパラメータの6つの現代のLCMを用いて,複数の仮想マシン構成にまたがるシステム評価を行い,ShiELDSがスキャン結果の最大73%を再現できることを確認した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:54:43 GMT)
RowNet: A Memory Transformer for Tabular Regression [0.0] 本稿では,面積当たりの不動産価格予測のための検索型ニューラルネットワークRowNetを提案する。
RowNetは、ラベル付きプロパティのメモリバンクに対してペアワイズに類似した機能を通じて、クエリプロパティを表現する。
第2のレイヤは、ターゲット整合性機能とのメモリ比較を強化し、複数の学習されたアテンションヘッドを使用して、補完的な同等のセットを検索する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:47:38 GMT)
Reconstructing Unobservable Temperature Fields via Simulation-Aided Intelligent Sensing [0.0] 本稿では, ランダム化物理シミュレーションに基づく産業応用のためのデータセット生成手法を提案する。
このような合成データセットのみに基づいてトレーニングされたニューラルネットワーク(NN)を用いて、ハードウェアに埋め込まれたスパースセンサーから内部温度場を再構築する。
NNベースの再構築は、Krigingを堅牢性で上回るだけでなく、リアルタイムな推論を可能にし、他の観測不可能な熱状態のオンラインモニタリングに適している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:16:33 GMT)
Reconciliation of effective Hamiltonians for intense light-matter interaction [0.0] 正準有効ハミルトニアンは、断熱除去、マルコフ近似、極近似から等しく得られる。
準退化Rayleigh-Schrdinger理論(QD-RSPT)を適用することにより、この制限にどのように対処できるかを示す。
QD-RSPTの精度は低周波と高周波の両方で示され、Floquet計算と高い強度でよく一致している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:04:46 GMT)
Realistic quantum device data synthesized by consumer AI and how to identify it [0.0] 生成AIのあまり知られていない能力は、数値データの基本的な分析、処理、合成を行うことである。
このことは、専門家が科学的に意味のあると考える実験データを模倣するためにAIが使えるかどうかという疑問を提起する。
本稿では,量子電子デバイス上で頻繁に行われるよく知られた実験にインスパイアされたデータの合成に焦点をあてる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:52:57 GMT)
Real-Time Automatic License Plate Recognition Using YOLOv8, SORT Tracking, and Temporal Data Interpolation [0.0] 本研究は,自動ナンバープレート認識のための5段階のエンドツーエンドアルゴリズムパイプラインを提案する。
提案されたアーキテクチャは、車両をローカライズするための非常に強力なYOLOv8ナノモデルを活用する。
さらに重要なのは、時間境界ボックスのオフラインメカニズムが、断片化されたパスを再キャストするために開始されることだ。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:05:18 GMT)
Radiomic Feature Selection Using Gradient Loss of Deep Neural Network for Lung Cancer Stage Detection [0.0] 本研究では、ディープニューラルネットワークから勾配感度解析を統合するグラディエント・ロス再帰的特徴除去フレームワークを提案する。
胸部CT検査では, 3DスライダのPyRadiomics拡張法を用いて, 合計106個の放射線像を抽出した。
提案したフレームワークは、90.22%の精度、90.10%の精度、90.24%のリコール、テストデータセットでのF1スコア90.16%の強い分類性能を達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:56:06 GMT)
RAMPART: Registry-based Agentic Memory with Priority-Aware Runtime Transformation [0.0] RAMPARTはコンパイル時のメモリモデルであり、LLMベースのエージェントのための純粋なRAMブロックレジストリである。
5つの構成可能なプリミティブが名前付きアドレス可能なブロックに作用する。
Qwen3-8B Q4で制御されたプローブは、コンパイル時の配置とブロックとタスククエリの構造的関係がタスクの成功に影響を与えることを示している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:01:46 GMT)
Quantification of Entanglement in Three-Qubit Systems [0.0] 本研究では,Acn標準表現による3ビット純状態の絡み合いについて検討する。
我々は、システム内の様々な分割の一般化されたコンカレンスから導かれる大域的コンカレンス尺度を用いる。
この結果は、3量子ビット量子系における絡み合いの構造と分布を解明する上で、この尺度の重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:59:55 GMT)
Pushing the Classical Frontier of 1D Fermi-Hubbard Quench Dynamics Beyond Current Quantum Simulations [0.0] Q-CTRLチームは最近、IBMプロセッサ上の1次元Fermi-Hubbardモデルのクエンチダイナミクスをシミュレートした。
我々は、Fermi-Hubbard Hamiltonian のフル$mathrmU(1)timesmathrmSU(2)$対称性と、GPU加速テンソル収縮を併用したフル$mathrmU(1)timesmathrmSU(2)を利用する。
シミュレーションウィンドウ全体にわたって完全に収束した結果を達成し、未解決の高絡み状態の厳密な認証を含む。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:52:47 GMT)
Provably Auditable and Safe LLM Agents from Human-Authored Ontologies [0.0] 線形監査性を必要とする非自明な問題領域での使用を目的とした,LLMエージェントアーキテクチャであるAgentic Reduxを紹介する。
適切なドメイン上で実行すると、Agentic Reduxの実行はセマンティックに正しいことが保証され、すべての決定は追加専用台帳に記録される。
医療請求書の遵守とセキュリティ脆弱性の開示の2つのプロダクショングレードの適切なドメインを提示する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:01:33 GMT)
Protecting Quantum States via the Super-Zeno Effect and Anticoherence [0.0] スピン反コヒーレント部分空間と組み合わせて量子超ゼノ効果を用いることは、スピンをノイズから保護するのに非常に効果的であることを示す。
提案されたプロトコルは、量子超ゼノ効果を用いて準空間に状態を閉じ込め、その内部の進化を凍結するために反コヒーレンスを利用する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:04:11 GMT)
Policy-Conditioned Counterfactual Credit for Verifiable Reinforcement Learning of Long-Horizon Language Agents [0.0] 検証可能な報酬による強化学習は推論とツールの使用を改善するが、長期の言語エージェントは依然として、証拠連鎖と信念の漂流を学習する。
本稿では, 厳密な検証可能な報酬, 介入正当性ゲーティング, および政策条件付き対実的貢献(PCCC)推定器を用いた制約付きポリシー勾配アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:19:36 GMT)
Polalrized reservoirs in dynamics of polariton condensation [0.0] 凝縮結合に対する貯水池の偏極不変理論はスピン密度行列形式を用いて定式化される。
貯留層が平面内線形分極に対応するストークスベクトルの非零成分を持つ場合、既存の理論が崩壊することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:32:31 GMT)
Photoelectron spectroscopy with a resonant dichromatic field: Role of geometric phase [0.0] 共振駆動された2レベル原子がほぼ縮退した二色レーザーパルスに曝露した際の幾何学的位相制御について検討した。
Autler-Townes doubletsの形成は破壊的干渉の観点から解釈できることを示す。
この結果から,超高速光物質相互作用における工学的幾何学的位相干渉への経路としてビーティング・フィールド制御が確立された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:22:18 GMT)
Phase transitions for the noisy transformer model in arbitrary dimension [0.0] 雑音変換器の非正規化自己アテンション(USA)モデルに付随する単位球上のマッキーン-ブラソフ自由エネルギーについて検討する。
我々は、すべての次元が$dge2$で、鋭い大域最小化二分法を証明した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:49:43 GMT)
Pattern Selectivity is Not Task-Causal Structure: A Cross-Architecture Mechanistic Study of Composed-Task Circuits in 1B-Class Language Models [0.0] 一致したランダムなヌルをセル毎に10個のシードでサンプリングした統一プロトコルを実行します。
結果として生じる12個の細胞(タスク、モデル)は、同じ一次因果スクリーンを同じ効果サイズで共有する2つの細胞を含まない。
パネル内のMoEモデルは、基礎となる先進的な位置決め基板の上に合成タスク回路を構築する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:27:07 GMT)
OpenAgenet/OAN: Technical Architecture for Trust-Governed Agent Identity and Discovery [0.0] 本稿では,OpenAgenet/OANの技術アーキテクチャについて述べる。
OANは、オープンエージェント相互接続のためのプロトコル中立層である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:53:20 GMT)
OpenAgenet/OAN: Open Infrastructure for Trusted Agent Interconnection [0.0] OpenAgenet(略してOAN)は、信頼できる相互接続エージェントのためのオープンインフラストラクチャプロジェクトである。
Agentsが分離されたアプリケーションからオープンなマルチオペレータネットワークに移行すると、その問題に対処する。
OANはプロトコルニュートラルな信頼層として設計されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:56:26 GMT)
Oklch+: A Three-Parameter Extension of Oklab for Improved Color Difference Prediction [0.0] Oklch+ は Oklab の3パラメータ拡張であり、ユークリッド距離は変換された Oklab 座標で計算される。
COMBVD -- 3,813 独立データセットにまたがる色差ペアの評価。
ホールドアウトされたBFD-P D65サブセット上のクロスバリデーションは、一般化(STRESS = 26.14)を確認し、Oklch+はOklab (51.45)を大幅に上回り、ホールドアウトセット上でCIEDE2000 (24.12)に匹敵するSTRESSを達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:43:24 GMT)
Neural Galerkin Normalizing Flows for Bayesian Inference of Diffusions with Inaccessible Boundaries [0.0] 2つの観測時間間の拡散過程の遷移密度関数を学習するための新しい正規化フローアーキテクチャを提案する。
具体的には,特定の到達不能領域で拡散行列が消滅する過程に着目する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:52:26 GMT)
Neetyabhas: A Framework for Uncertainty-Aware Public Policy Optimization in Rational Agent-Based Models [0.0] 既存の研究はしばしば個人の行動を無視し、完全な感染追跡と欠陥のない政策実行を誤って想定している。
本稿では,疫病対策(感染・病院化)と政策実施の両面での不確実性を考慮した統合的アプローチを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:51:54 GMT)
Multi-Column RBF Neural Network Using Adaptive and Non-Adaptive Particle Swarm Optimization [0.0] 降下勾配でトレーニングされた放射基底関数ニューラルネットワーク(RBFN)は、浅いネットワークと深いネットワークの両方で効果的に完全に接続された構造を提供する。
最先端の勾配に基づくトレーニング手法であるErrCorは、最適な隠れユニットを選択して精度を向上させる。
人口ベースアルゴリズムであるPSOは、RBFNパラメータを最適化するためにSwarmエクスペリエンスを使用し、グローバル検索とローカルミニマを提供する。
PSOを用いたマルチカラムRBFNとAPSOを用いたマルチカラムRBFNの2つの新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:53:48 GMT)
Measuring Entanglement in Qubit System [0.0] バランスの取れた2パス干渉計における絡み合いを計測する操作方法を示す。
この分析は、経路、内部クビット自由度、および内部自由度に絡み合ったいくつかの補助状態を含む三部構成の記述に基づいている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:15:00 GMT)
Mean-based algorithms: A lower bound and regret [0.0] 平均に基づくアルゴリズムは、平均的な報酬が低いアクションに低い確率を割り当てる。
時間的地平線が不明で,帯域幅フィードバックのみが利用可能である場合,平均に基づくアルゴリズムについて検討する。
実験によると、平均ベースのアルゴリズムはわずかに遅いが、他の帯域幅フィードバックアルゴリズムと競合する可能性がある。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:23:41 GMT)
Literature-Guided Minimax Optimization of Virtual Epilepsy Neurostimulation [0.0] 本稿では,大規模仮説抽出,仮想脳(TVB)エピレプタシミュレーション,大規模言語モデル誘導ブラックボックス最適化を併用した文献誘導型ミニマックスパイプラインを提案する。
この研究は、臨床証拠としてではなく、堅牢で文学的に認識された神経刺激設計のための、シリコの概念実証として解釈されるべきである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:40:34 GMT)
LightVesselNet: An Ultra-Lightweight Sub-100K Parameter Network for Retinal Blood Vessel Segmentation [0.0] LightVesselNetは、リソース制約のある環境で網膜血管のセグメンテーションのために設計された効率的なニューラルネットワークである。
LightVesselNetは、State-of-the-Artモデルと比較して効率(パフォーマンス対Flops)が改善されている。
低リソースな臨床環境とモバイルスクリーニングツールへのデプロイの有力候補である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:56:13 GMT)
Leggett-Garg test inequality with spin and flavour neutrino oscillations in a constant magnetic field [0.0] Leggett-Garg inequality (LGI) は、異なる時間で観測可能な1つの測定値の相関関係を含むベルの不等式(ベル不等式)の類似体である。
本研究では, ニュートリノフレーバー(_Lleftrightarrow_L$)とスピン発振の文脈における, 一定の横磁場の存在下での意味について検討する。
強磁場を持つ系では、両方の場合において、LGIが違反する長さ領域$L$が存在し、相関関数$K_3$と$K_によって定量化される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:42:32 GMT)
Learning Control-Affine Reduced-Order Models via Autoencoders [0.0] 制御-アフィン還元次モデル(ROM)の同定のためのフレームワークを提案する。
提案手法は, オートエンコーダ(AE)を用いて高次元状態, 潜在的に高次元入力を制御-アフィン状態空間力学に適した遅延値に変換する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:05:41 GMT)
Learning Contact Representation for Leg Odometry [0.0] 脚付きロボットにおける接触検出のための自己教師付き表現学習フレームワークを提案する。
学習した表現を用いて、確率論的にスタンスとスイングフェーズをモデル化する。
本フレームワークは,教師付き手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:50:45 GMT)
LDARNet: DNA Adaptive Representation Network with Learnable Tokenization for Genomic Modeling [0.0] 本稿では,H-Netスタイルの動的チャンキングを自己回帰生成からマスク付き言語モデリングに適応させる階層的ゲノム基盤モデルLDARNetを提案する。
LDARNetは、Nucleotide TransformerとGenomic Benchmarksスイートから27のタスクを微調整し、コンパクトモデルと5つのヒストン修正タスクの最先端結果の間で11/18の勝利を達成した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:38:17 GMT)
LCSHBench: A Multilingual, Consensus-Grounded Benchmark for Library of Congress Subject Heading Assignment [0.0] LCSHBench: 22,346冊の書籍を、オープンライセンスのハーバード、コロンビア、プリンストンカタログから15言語で紹介します。
レコードは、少なくとも2つの独立したカタログ局がLCSHを割り当てた場合にのみ登録される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:58:11 GMT)
Krylov complexity has it all [0.0] この論文は、クリロフ複雑性が量子作用素の力学に関する全情報を含んでいることを証明している。
量子系における作用素進化の完全なキャラクタリゼーションとしてクリロフ複雑性を用いるための「原理の証明」を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:29:35 GMT)
Isospectrality and Operator Complexity [0.0] 一対の正確に解けるアイソスペクトルフェルミオン鎖、一つは強く相互作用し、もう一つは二次鎖である。
同一のスペクトルにもかかわらず、2つのモデルは異なる位相と演算子複雑性の概念を鮮明に実現している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:05 GMT)
Inverse Manipulation through Symbolic Planning and Residual Operator Learning [0.0] ロボットタスクを反転させるには、象徴的な状態遷移を反転させたり、モーター軌道を巻き戻す以上のことが必要である。
STRIPSライクな演算子から逆スキル目的を導出する逆操作のためのハイブリッドフレームワークを提案する。
以上の結果から,述語由来の残差制御は,近似記号の逆を物理的に基礎を成す逆スキルに変換することができることがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:18:09 GMT)
Hybrid quantum-classical physics-informed neural networks for solving nonlinear PDEs: when and where hybridization is effective? [0.0] 我々は、ハイブリッド量子古典物理学インフォームドニューラルネットワーク(HQPINN)を開発した。
HQPINNは、古典的なニューラルネットワークのバックボーンとパラメータ化量子回路(PQC)を統合して、ソリューション表現を強化する。
その結果,HQPINNはよりスムーズなトレーニングダイナミックスを示し,損失振動を低減し,最終的な精度が向上した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:02:20 GMT)
How Far Do Auto-Interpretation Labels Generalize: A Controlled Study Across Languages, Scripts, and Rewordings [0.0] 我々は、異なる言語、スクリプト、および単語で同じコンテンツによって起動されるSAE機能セットが、相当に重複していることを示す。
次に、自動解釈ラベルがペースを保っているかどうかをテストします。
これらの結果は、自動解釈ラベルは、概念そのものではなく、よく表現された入力に特徴の振舞いを反映する可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:59:07 GMT)
Gradient descent at the Edge of Stability: free energy model and kinetic description of the two-layer network [0.0] 安定状態のエッジにおける勾配降下のダイナミクスについて検討する。
平均軌道の進化を追跡する連続時間有効モデルを提案する。
この方程式は、マクロ自由エネルギーのワッサーシュタイン2勾配流と解釈できる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:11:33 GMT)
Global Sketch-Based Watermarking for Diffusion Language Models [0.0] テキストのグローバルなベクトル値のスケッチ表現を制御するマスク拡散言語モデルのための透かしを提案する。
文脈依存の透かしと比較すると、スケッチの定式化は生成時に見られる局所的な文脈から検出される。
提案手法の歪み, 音性, 強靭性を解析した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:08:58 GMT)
Generalized Bicycle Codes as Cyclic Submodules and their Automorphism Structure [0.0] 一般化自転車(GB)符号の自己同型解析と工学的手法を開発する。
これらの条件をフォールド変換ゲートフレームワークに接続し、$H CX-, $S$-, $CX$-型フォールド変換ゲートの存在の明確な基準を提供する。
これらのメソッドを使用して、ゼロからリッチな自己同型構造の周りにコードを構築する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:05:40 GMT)
GENEB: Why Genomic Models Are Hard to Compare [0.0] 我々は、100タスクにわたる40のゲノム基盤モデルから凍結表現を評価する大規模な診断ベンチマークであるGENEBを紹介する。
genEBは,タスクレベルのトレードオフを明確に示しながら,モデルスケール,アーキテクチャ,トークン化,事前学習データ間の比較を制御可能であることを示す。
これらの結果から,ゲノミクス学習における概念比較とカテゴリー認識モデル選択の基準フレームワークとして,現在の評価実践の限界とgenEBの位置が強調された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:06:01 GMT)
Frustrated superradiant phases in one- and two-dimensional lattices [0.0] フラストレーションはフォトニック密度波の秩序を駆動し、結果として生じる周期性は対称位相の励起スペクトルから予測可能であることを示す。
また、準周期秩序は準結晶を連想させ、合成磁束が翻訳対称性の破れの性質を制御する強力なノブを与えることを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:00 GMT)
From Prompt to Process: a Process Taxonomy and Comparative Assessment of Frameworks Supporting AI Software Development Agents [0.0] AI機能をプロセスに変換する運用フレームワークに重点を置いています。
仕様駆動による完全な軽量な開発、エージェント駆動のアジャイル計画、エージェント上のコンテキストエンジニアリング、ワークツリーの分離とレビュー、レガシーシステムからの運用仕様の回復。
私たちの中心的な貢献は、仕様、コンテキスト、役割、実行、バリデーション、ポータビリティという6次元プロセスの分類です。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:49:15 GMT)
Fog of Love: Engineering Virtuous Agent Behavior with Affinity-based Reinforcement Learning in a Game Environment [0.0] 本稿では, 局所親和性が, 競合目的と協調目的の両方を達成する上で, エージェント性能を高めることを示す。
これは希少な選択をもたらすだけでなく、エージェントのテレロジーを明確にし、その振る舞いを人間レベルの解釈を可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:31:37 GMT)
Floquet-Engineered Parity Anomaly Staircase in a Cold Atom Dirac Lattice [0.0] 2次元$$-flux格子内のパリティ異常なホール階段に着想を得た。
我々は、関連する低エネルギーディラック理論、バンドトポロジー、ベリー曲率構造、および2つのパラメータ応答マップを分析し、超低温原子格子におけるラマン支援トンネル、オフ共振フロケット駆動、補助交流スタークドレッシングによる実現の可能性について議論する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:59:29 GMT)
Fermionic non-Gaussianity via Bell sampling: monotones and efficient quantum algorithms [0.0] 演算子$= sum_j=12n_jotimes_j の固有値構造上に構築されたフェルミオン非ガウス性のための効率的な量子アルゴリズムを開発する。
純粋状態のエンフブリッジ次数(Emphbridge degree of even pure state, a novel non-Gaussianity monotone, defined as the largest eigenvalue sector of $ $ population by two copy of the state。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:29:05 GMT)
Feature Encoding in Quantum Machine Learning: A Survey and Practical Guidelines [0.0] 量子状態への古典データの符号化は、量子機械学習における主要なパフォーマンスボトルネックを構成する。
既存のフレームワークでは、リソースの堅牢性、表現性、ノイズの堅牢性を共同で特徴付けるものはありません。
5つの登録決定フレームワーク(D, n, p, tau)の特徴次元、キュービット予算、エラー率、タスクタイプをハードウェア基底符号化レコメンデーションにマップする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:46:35 GMT)
Extremely slow scaling of minimal Hamming distance in quantum sampling data [0.0] 本稿では,量子状態の複雑性を確実に把握し,限られた量子情報から量子相転移を同定する。
これにより、単一のフレームワーク内で完全に異なる量子実験を解析できる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:43:12 GMT)
Expressibility, Noise, and Error Mitigation in VQE Ansatz Selection [0.0] ヒルベルト空間を探索する回路の能力を定量化する指標である表現可能性(Expressibility)は、アンザッツ選択のガイドとして提案されている。
この調査は、イデアル、ノイズ、ノイズ、ゼロノイズ外挿(ZNE)、エラーキャンセル(PEC)の4つの実行シナリオにおいて、$H$と$H_3+$の両方をカバーするよう拡張する。
ZNEは、12ドルH_3+$の回路のうち4つと6ドルH_3+$の回路でエラーを減らし、PECは実際に12ドルH_3+$の回路でエラーを減らしている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:43:24 GMT)
Experimentally probing the Quantum Physics in the Inverted Harmonic Oscillator [0.0] 我々は、Bose-Einstein Condensate on an AtomChipでこのダイナミクスを実現する。
高周波ドレッシングは、横高調波閉じ込めをIHOに反転させる。
我々は10.6 (1.3) dBのサブ真空スクイーズを観察し、IHO進化の時間反転によるコヒーレント可逆性を検証した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:30:16 GMT)
Electron-Ion Path Integral Monte Carlo with Hard Core [0.0] 1つの成分が負のユニタリ電荷の点状粒子、もう1つの成分が正のユニタリ電荷の荷電固球からなる量子2成分プラズマについて検討する。
電子-陽子プラズマの2種のモル分画の比が1:1の場合に特化する。
構造の解析から、温度が低下するにつれて、金属水素相から分子水素相への遷移が見られる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:45:40 GMT)
Efficient Description of Parametric Amplification of Quantum Pulses [0.0] パラメトリック増幅を行う1つの量子パルスは、出力の少なくとも2つのパルスに供給する。
我々はこれらの出力モードの量子状態を見つけるための効率的で解析的な方法を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:43:01 GMT)
Effect of isotropic errors on the complexity of Grover's algorithm [0.0] 数値シミュレーションによるGroverの探索アルゴリズムの複雑さに対する等方的誤差の影響について検討する。
結果はGroverのアルゴリズムの等方的誤りに対する堅牢性に関する洞察を与え、ノイズの多い量子ハードウェアの実装における潜在的な課題を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:40:49 GMT)
Dynamic Multi-Pair Trading Strategy in Cryptocurrency Markets with Deep Reinforcement Learning [0.0] この論文は、統計的仲裁とDRL実行ポリシーを組み合わせたハイブリッドアーキテクチャを導入することで、定量的ファイナンス文学に寄与する。
決定論的遮蔽(deterministic shielding)を通じて安全な強化学習のための新しいフレームワークを提供し、統計的に堅牢な境界にニューラルポリシーを固定することで、深刻な分散リスクを軽減できることを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:10:33 GMT)
Domain-Conditioned Safety in Frontier Computer-Using Agents: A 793-Episode Browser Benchmark, a Coding-Domain Cross-Reference, and a Reproducibility Audit of Recent Red-Teaming [0.0] 最近のCUA (Computer-using-agent) レポートでは、プロンプトインジェクションアタック成功率 (ASR) は42-98%と報告されている。
我々は,手作りテンプレートとして再現されたこれらのテクニックが,現在のフロンティアCUAに対して有効であるかどうかを問う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:21:59 GMT)
Distributed Variational Quantum Optimisation by Entanglement-Selective Transport [0.0] グラフに基づく離散最適化のための分散変分アンザツであるQESTOを紹介する。
ベル対の局所的制約情報を符号化し、グローバルに有効な解状態への振幅伝達を生成する。
その結果、永続的絡み合いは、層間非局所ゲートオーバーヘッドを低減しつつ、有用な変分通信をサポートすることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:33:30 GMT)
Digital Quantum Reservoir Computing for ATM Time Series Prediction [0.0] ATMキャッシュ需要時系列のマルチステップ予測のためのデジタル量子貯水池計算フレームワークについて検討する。
提案手法は,部分的測定とリセットを利用した固定構造を有するパラメタライズされた4ビット貯水池を用いる。
ノイズレスシミュレーション、ノイズ対応エミュレーション、および実際のIQM Spark量子プロセッサを用いて実験を行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:11:07 GMT)
Data Efficient Complex Feature Fusion Network For Hyperspectral Image Classification [0.0] 本研究は、ハイパースペクトル画像分類のためのアテンションベースDual-Branch Complex Feature Fusion Network (CFFN)のデータ効率の変動を示す。
提案したモデルはD-CFFNと呼ばれ、元の2ストリーム構造を維持している。
CFFNに匹敵する分類性能を実現し、モデルサイズ、メモリ消費、推論レイテンシを大幅に削減する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:41:50 GMT)
Data Collection for Training Quality-Control AI in Carpet Manufacturing [0.0] カーペットウェブをリアルタイムで検査するインラインマシンビジョンシステムの設計を提案する。
本報告では,光場と放牧照明を併用したシンクロナイズドラインスキャンカメラを用いた画像サブシステムについて述べる。
次に、欠陥のない材料で訓練された教師なし異常検出から始まるステージドモデリング戦略を配置する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:50:41 GMT)
Dark Path: An Analysis of the Belt & Road Initiative in El Salvador [0.0] ベルト・アンド・ロード・イニシアティブ(英: Belt & Road Initiative、略称:BRI)は、中国人民共和国(PRC)下の省が他国にその意志を課すための共同事業である。
エルサルバドルは米国のパートナーであり、BRIの下で外国投資の受益者でもある。
サルバドラン法の最近の変更は、国家のサプライチェーンとサイバーインフラに対する暗黙のリスクに対処していない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:57:04 GMT)
Code Lifespan Survival Analysis (CLSA): Predicting the Survival of Source Code Lines Using AST-Aware Mining [0.0] 我々は,各行の粒度でコードサバイバルをモデル化する最初のフレームワークであるCode Lifespan Survival Analysis(Kaplan-Meier 中央値に達していない)を紹介した。
120のオープンソースTypeScriptリポジトリから3250万行の生誕イベントをマイニングしています。
ラインレベルのサバイバルモデリングは、解釈可能で、主に静的なリスク信号を生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:13:31 GMT)
Clustering Guided Domain-Specific Pretrained Foundation Model for Very High-Resolution Arctic Remote Sensing [0.0] 本研究は,北極を対象とする新しいリモートセンシング基盤モデル(RSFM)を提案する。
多様性を意識した地域規模の画像キュレーションと、衛星画像解析のためのビジョントランスフォーマー(VHSR)エンコーダの自己教師付き事前トレーニングを組み合わせる。
我々は、領域適応MAE再構成目標を用いて、キュレートされたコーパス上のViT-Largeエンコーダを事前訓練し、下流の特徴マッピングのための北極固有のトランスフォーマーウェイトを生成した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:12:16 GMT)
Clinical Assistant for Remote Engagement Link (CARE-link): A Web-Based Electronic Health Records Software for Managing Diabetes [0.0] CARE-linkは、妊娠糖尿病の管理を改善するために設計された、オープンソースのWebベースの臨床サポートプラットフォームである。
このシステムは、病院の外で患者が作成したデータを集約し、関連する臨床情報を要約し、臨床医にコンテキスト対応の意思決定支援を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:39:29 GMT)
Characterization of errors in photon-heralded quantum operations between non-interacting quantum emitters [0.0] 量子演算における小さなマルコフ誤差の解析を可能にする解析摂動フレームワークを開発した。
数値シミュレーションに対して,繰り返し再帰的なCZゲート上での摂動予測をベンチマークする。
我々は、光操作誤差の代表的な例として、コヒーレント位相シフト器の誤校正を解析するために、同じ枠組みを適用した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:39:00 GMT)
Cascading Hallucination in Agentic RAG: The CHARM Framework for Detection and Mitigation [0.0] マルチステップ推論パイプラインにおけるエラー伝搬の検出と中断を行うアーキテクチャフレームワークであるCHARMを紹介する。
CHARMは、ステージレベルの事実検証、クロスステージの一貫性トラッキング、信頼性の監視、カスケード解決トリガの4つのコンポーネントで構成されている。
我々は,HotpotQA,MuSiQue,2WikiMultiHopQA上のCHARMと,LangChainのエージェントパイプライン構成にまたがる独自の逆データセットを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:33:47 GMT)
Can AI Refute Economic Theory? Evidence from Beyond the Knowledge Cutoff [0.0] 私は、経済理論に関する4つの論文の正しさを確認するために、いくつかのAIモデルを依頼した実験を文書化しました。
ChatGPT Proは時折反例と証明の修正を行い、他のモデルは悪化した。
私は、有能な人間とフロンティアモデルが組み合わさって、現在の査読を上回ることができると論じるが、AIはそれ自体で経済理論を否定することはできない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:36:37 GMT)
CYGNET: Cypher Gate for Neural Execution Triage and Cost Containment [0.0] クエリ生成と運用用Neo4jデータベースの間に,事前実行ゲートを設置する。
ゲートは、ミラーグラフに対する実行が5.6msの中央遅延で終わる4つのバックチェーンを通して構造を検証する。
7つのCypherBenchスキーマ(2348の質問、ACL 2025)では、パイプラインはテスト対象のモデル毎に生成精度を維持し、安全な防御層として動作することを確認した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:13:05 GMT)
CART: Context-Anchored Recurrent Transformer -- A Parameter-Efficient Architecture with Learned Stability [0.0] CART(Context-Anchored Recurrent Transformer)は、パラメータ効率のよい言語モデルで、1つの共有コアブロックをR倍の深さで再利用する。
我々は1つのコンシューマGPU上でCARTを2段階に分けて評価した: 64-configuration screen at 3,000 steps, then 36 configurations (P=6, R in 6,8,10, three seed) training for 30500 steps (1B tokens)。
256,512,768,1024: 事前深さPはループ数Rを支配し、Rのステージ1ランクはフルトレーニング時に逆になる(R=6は最高になる)。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:14:38 GMT)
Bernoulli CUSUM and Bayes-Optimal Detection Ceilings for Trust Fraud in Sparse Rating Networks [0.0] レーティングネットワークにおける逐次信頼検出は、実データで失敗する連続観測モデルに依存する。
Bitcoin-OTCでは、評価の56%が標準マッピングの下で単一の値を取り、パラメトリック検出器が要求する分散仮定を破っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:56:15 GMT)
BenHalluEval: A Multi-Task Hallucination Evaluation Framework for Large Language Models on Bengali [0.0] ベンガルの幻覚評価フレームワークであるBenHalluEvalを紹介する。
GPT-5.4を12種類のタスク特異的幻覚タイプで用いた12,000の幻覚候補を構築した。
BenHalluScoreは、モデルとタスク間で7.72%から55.42%の範囲の2トラックキャリブレーション指標である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:04:50 GMT)
Arithmetic Pedagogy for Language Models [0.0] 人間の数学教育の手法が言語モデルの訓練を算術的推論に導くことができるかどうかを考察する。
実行トレースを自然言語のChain-of-Thought(CoT)監視にシリアライズした計算手順として,各操作を運用する。
インドネシアのSyllabic-agglutinative TOBAトークンを用いたGPT-2デコーダ(86Mパラメータ)をスクラッチからトレーニングした。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:09:25 GMT)
Arbitrary manipulation of nuclear spins in hexagonal boron nitride [0.0] 核スピン上に単一および多ビットゲートを配置するためのプロトコルを提案する。
核への電子スピン結合を効率的に設計できることが示される。
提案手法は、量子計算の目的でhBNにおけるV$_textB-$の実用的な応用のステージを設定する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:25:58 GMT)
Answer Self-Consistency with Margin-Triggered Question Re-Arbitration for the CVPR 2026 VidLLMs Challenge [0.0] CVPR 2026 VidLLMs Challenge のトラック2の解について述べる。
このトラックはビデオにおける視覚的推論を評価し、モデルは常にはっきりと見えない関係を推論しなければならない。
マルチモーダル推論モデル上に構築された学習不要なテスト時間推論フレームワークであるASCを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:51:55 GMT)
An Open-Source Two-Stage Computer Vision Pipeline for Fine-Grained Vehicle Classification using Vision Transformers [0.0] 車両のボディタイプは、クラッシュを乗り越える際のサイクリストの重傷の重症度を決定づける重要な要因であるが、車両を分類するための自動ツールがオープンな文献には存在しない。
本稿では、未学習のRT-DETR検出器と微調整の視覚変換器を組み合わせたオープンソースの2段コンピュータビジョンパイプラインを提案する。
信頼に基づく棄権機構は、ソフトマックス出力が0.60未満になるとステージ2の予測を保ち、無音の誤分類ではなく未知のラベルを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:53:33 GMT)
An Empirical Study of Data Scale, Model Complexity, and Input Modalities in Visual Generalization [0.0] 本研究では,データスケール,モデル複雑性,入力モダリティ,視覚的一般化性能の関連性について,実証分析を行った。
その結果,トレーニングデータの規模が大きくなると一般化性能が向上することがわかった。
色情報の除去はモデル性能を低下させるが、勾配、エッジ、ウェーブレットといった明示的な事前特徴は異なるモデルアーキテクチャ間で矛盾する効果を持つ。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:36:34 GMT)
An Empirical Audit of Input Encoders for Multi-Channel Signal Transformers [0.0] マルチチャネルスカラー信号を消費するトランスフォーマーは、時間ステップ毎に$C$同時値を$d_text$dimensionalベクトルに埋め込む必要がある。
共有スカラーベースライン, チャネルごとの線形性正規化器, 非線形ステムにまたがる8つの入力エンコーダを実験的に評価した。
情報理論上の理由で崩壊する共有スカラーベースラインと、チャネルに依存しないPatchTST-spiritベースラインである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:35:09 GMT)
Agentic AI and Pedagogical Best Practice: The Tension Between Automation and Learning [0.0] 本稿では,エージェントAIのレンズを通して,知識活性化,協調学習,問題ベース学習,フォーマティブアセスメント,足場,メタ認知の6つの教義を概観する。
我々は、自動化と学習の緊張を議論し、意図的な摩擦、動的な足場、人間のループ監視を優先する設計勧告を提案し、人間の学習に取って代わるのではなくAIを確実にするためのAI活用を検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:26:23 GMT)
A thorium-229 optical nuclear clock with feedback loop [0.0] トリウム229同位体中のレーザーアクセス可能な核遷移は、光核時計の実現の有望な候補として特定されている。
連続分光に基づくフィードバック吸収を迅速に行い, 連続波レーザーを148nmの核遷移に安定化させることにより, トリウム229核時計を実装した。
このクロックは、単純なショットノイズ制限による3cdot 10-12 sqrt/texts$の分数周波数不安定性のスケーリングを示している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:15:56 GMT)
A formal framework for the economic security of DeFi compositions [0.0] 我々は、DeFiコンポーザビリティの正式なセキュリティ概念であるMEVノン干渉を導入する。
我々は、有界および非有界な富を持つ2つの敵モデルを研究し、十分な条件と局所性原理を確立する。
本フレームワークは,交換,AMM,オプション,貸し出しプール,ルータ,仲裁契約を含む,DeFi構成の表現に応用する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:33:59 GMT)
A Two-Channel F-Transform Representation for Early Trajectory Characterization in Iterated Correlation Dynamics [0.0] 本稿では,短い初期軌道セグメントをコンパクトで解釈可能な,固定次元ファジィ座標に変換するためのソフトコンピューティング表現問題について検討する。
提案するディスクリプタは, 初期過渡期以降の2つの対数信号, ステップサイズ信号, 縮小度信号, 局所収縮度信号を用いる。
1次元に1000の軌道を持つ22の行列次元に対して、この記述子は、収束長近似のためのランダムフォレスト回帰を用いた原軌道サンプル、統計サマリー、PCA圧縮原形質と比較される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:39:55 GMT)
A Quantum Algorithm for Simulating Nonunitary Dynamics Governed by Nonautonomous Linear Ordinary Differential Equations [0.0] 明示的な非単位プロパゲータの事前知識を必要としない量子アルゴリズムを提案する。
本アルゴリズムは特異値分解を用いた拡張スキームを組み合わせることで,非単体プロパゲータをユニタリの和として記述する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:45:14 GMT)
A Motivational Architecture for Conversational AGI [0.0] 本稿では,モジュール型実行基板上に構築されたエージェントに対して,OpenPsiモチベーションラインの対話的再解釈をMetaMoの高レベルモチベーションスキャフォールドと組み合わせて提案する。
薬物は体力低下、不確実性低下、親和性、親和性、正当性、育児、美的コヒーレンスを規制する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:25:15 GMT)
A French Corpus Annotated for Multiword Expressions with Adverbial Function [0.0] 本稿では,副詞機能を持つ多語表現(MWE)に注釈を付したフランス語コーパスを提案する。
アノテーションに使ったリソースやメソッドを記述し、その結果を簡潔にコメントします。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:50:25 GMT)
公開日: 20260602 の論文要約
JAVEDIT: Joint Audio-Visual Instruction-Guided Video Editing with Agentic Data Curation [100.5] JAVEdit-100kは、命令誘導型共同視覚編集に適した、最初の大規模で高品質なデータセットである。
このデータセットは、4つの巧妙に設計された生成パイプラインを通じて厳密に構築され、エージェント・イン・ザ・ループの品質管理機構とシームレスにペアリングされる。
フィールド内での標準化評価の欠如に対処するため、我々は、キュレートされたソースビデオと人間対応の指示を含む包括的なベンチマークであるJAVEditBenchを紹介した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:26:06 GMT)
RUBAS: Rubric-Based Reinforcement Learning for Agent Safety [93.8] RUBASは、エージェント安全性のためのルーリックベースの強化学習フレームワークである。
エージェントの動作は、ツール使用の安全性、引数の安全性、応答の安全性、役に立つ4つの次元に分けられる。
実験により、RUBASは標準アライメントベースラインよりも安全性を向上し、ツール接地幻覚を低減し、競争力を維持することが示されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:02:14 GMT)
LEAP: Supercharging LLMs for Formal Mathematics with Agentic Frameworks [85.9] 大規模言語モデル(LLM)は、強力な非公式な数学的推論を示すが、リーンのような形式言語で検証可能な証明を生成するのに苦労している。
本稿では,汎用基礎モデルによる自動形式定理証明の最先端性能を実現するためのエージェントフレームワークであるLEAPを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:16:42 GMT)
NVIDIA OmniDreams: Real-Time Generative World Model for Closed-Loop Autonomous Vehicle Simulation [84.9] OmniDreamsは,コスモス拡散モデルからトレーニング後,行動条件付き動画をリアルタイムで自動生成する基礎的生成世界モデルである。
OmniDreamsは、コスモスの豊富な視覚的先行と21k時間の運転シナリオにおける中・後訓練を活用することで、複雑で観測されていない現象を合成する。
予備的な結果は、OmniDreamsからポストトレーニングされた世界アクションモデルが、Physical AI Autonomous Vehicles NuRecデータセット上で強力なパフォーマンスを達成していることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:11:05 GMT)
SynCred-Bench: Benchmarking Synthetic Credibility in AI-Generated Visual Misinformation [82.2] SynCRED-Benchは、信頼できる6つのカテゴリと7つのきめ細かい循環スタイルでバランスをとる、600個のAI生成の誤情報画像のベンチマークである。
5%の偽陽性レートの制約の下で、15個のMLLMは10.5%の真正レート(TPR)しか達成せず、オープンソースのAIGC検出器は5%以下である。
また、ヒトのアノテーターは合成信頼性の同定にも苦労し、TPRはわずか63%に達した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:57:38 GMT)
EvoMemNav: Efficient Self-Evolving Fine-Grained Memory for Zero-Shot Embodied Navigation [81.5] EvoMemNavは、ゼロショットエンボディナビゲーションのための効率的で自己進化的できめ細かいメモリフレームワークである。
VSMGraphは、セマンティックキューとトポロジ的関係を持つビューをルームビューオブジェクト階層に整理する。
GOAT-BenchとHM3Dのオブジェクト、テキスト記述、画像ゴールのモダリティによる実験は、SR/SPLにおいて一貫した利得を示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:27:44 GMT)
Limit Analysis of Graph Neural Networks with Wireless Conflict Graphs [81.4] グラフニューラルネットワーク(GNN)は、無線リソース割り当てのための強力なツールとして登場した。
この研究は、スパースランダム幾何グラフ(RGGs)から得られるグラフ上のGNNの転送可能性に関する理論的結果を確立する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:42:14 GMT)
Smaller Models are Natural Explorers for Policy-Level Diversity in GRPO [80.4] サンプル数が増加するにつれて、小さなモデルは本質的に、より優れたパス@kによって示されるポリシーレベルの多様性を示す。
本研究では,S2L-PO(Small-to-Large Policy Optimization)を提案する。
S2L-POは、様々な数学的推論ベンチマーク(例えば、AIME 24で1.7Bエクスプローラーを使用して8Bモデルをガイドする+8.8%)の精度を改善し、ロールアウト計算を削減している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:15:19 GMT)
Speedrunning Tabular Foundation Model Pretraining [80.2] 我々はNanoTabPFNのコミュニティスピードランを紹介する。
コントリビュータは、単一ファイルのトレーニングスクリプトを変更し、固定下流のLOC AUCターゲットに到達するために競合する。
現在の最高記録は0.92分で目標に到達し、74.32分ベースラインの81倍のスピードアップを記録した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:04:31 GMT)
A Benchmark for Semi-supervised Multi-modal Crowd Counting [70.5] 本稿では,半教師付きマルチモーダル群カウントに関する最初のベンチマークを構築した。
まず,ラベル付き非ラベルデータパーティションを異なるラベル付き比率で指定する,半教師付きマルチモーダル設定と標準化プロトコルを定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:38:41 GMT)
ThoughtFold: Folding Reasoning Chains via Introspective Preference Learning [69.6] 提案するThoughtFoldは,よりきめ細かい選好学習を,効率的な推論のための冗長探索に活用するフレームワークである。
ThoughtFoldは効率を大幅に向上させる。
最先端の精度を維持しつつ、DeepSeek-R1-Distill-Qwen-7Bのトークン使用量を約56%削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:21:27 GMT)
The Deliberative Illusion: Diagnosing Factual Attrition and Stance Homogenization in Multi-Agent LLM Deliberation [69.0] 問題クリティカルな事実の最大72%を,マルチエージェントによる議論で消し去ることを示す。
保持された証拠は誤解を招くことなく問題を再構築し、最終的なスタンスをベースモデルに固定し、単一の悪意のあるエージェントが誤った情報を共有コンテキストに注入することができる。
我々は、どの事実、不確実性、正当な不一致が相互作用を生き残るかを測定する評価を求める。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:15:40 GMT)
UniLab: A Heterogeneous Architecture for Robot RL Beyond GPU-Dominant Paradigms [68.4] シミュレーション支配型ロボット制御では、どのプロセッサが物理を実行するかではなく、シミュレーションスループット、ポリシー学習、実行時同期が効率的なエンドツーエンドループを形成するかどうかが重要な問題である。
データ移動、バッファリング、同期のための統一ランタイムを通じて、GPUポリシー更新からCPU並列シミュレーションを分離する、異種CPU常駐/GPU学習アーキテクチャであるUniLabを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:21:55 GMT)
BraveGuard: From Open-World Threats to Safer Computer-Use Agents [68.4] BraveGuardは、オープンワールドの脅威信号とリアルエージェントの軌道からモデルを訓練するための自己進化型防衛フレームワークである。
我々は、Qwen3-GuardやLlama-Guardなど複数のガードバックボーンをトレーニングしてBraveGuardをインスタンス化し、トラジェクトリレベルのエージェントセーフティベンチマークの結果のガードを評価する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:59:47 GMT)
Entropy Is Not Enough: Unlocking Effective Reinforcement Learning for Visual Reasoning via Vision-Anchored Token Selection [68.2] VEPO(Vision-Entropy token-selection for Policy Optimization)は,視覚感度とトークンエントロピーを明示的に統合した効果的なRLフレームワークである。
実験の結果,VEPOの先行性能は7Bスケールで2.28点,3Bスケールで3.15点,エントロピーのみのベースラインを著しく上回った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:26:55 GMT)
QUBRIC: Co-Designing Queries and Rubrics for RL Beyond Verifiable Rewards [68.2] クエリとルーブリックを共同設計するフレームワークを提案する。
QUBRICはSFTベースラインよりもアリーナハードで+5.5ポイントのゲインを達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:53:04 GMT)
Rethinking the Role of Tensor Decompositions in Post-Training LLM Compression [68.1] 分解は有望な方向として現れ、トランスフォーマーの重み構造に適したコンパクトなパラメータ化を提供する。
既存の研究では、これらの手法を狭い環境で評価しており、大規模展開においてテンソル化が有効かどうかは不明である。
我々は高密度およびMoEのテンソル圧縮を体系的に評価し、経験的解析と理論的解析の両方に基礎を置いた性能トレードオフを確立する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:45:21 GMT)
World Models Meet Language Models: On the Complementarity of Concrete and Abstract Reasoning [67.9] 本研究では,抽象的推論を伴う視覚的未来のシミュレーションを,モデルがどのように実行し,検証し,統合するかを考察する。
PF-OPSDは、教師側の特権的文脈としてのみ、地道な未来のビデオと回答を使用して、政治上の具体的な軌道を評価する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:07:49 GMT)
Benchmarking Visual State Tracking in Multimodal Video Understanding [67.7] マルチモーダル大言語モデル(MLLM)における視覚状態追跡の診断のためのVisual STAte Tracking benchmark (VSTAT)を導入する。
VSTATは、合成ビデオと実世界のビデオの両方から834のクリップで構成され、1500の質問と組み合わせて、1つのフレームまたはショートセグメントから答えられない。
MLLMは理由を見つけ、テキストで正しく追跡するが、追跡するイベントを視覚的に知覚することができない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:12:05 GMT)
When Model Merging Breaks Routing: Training-Free Calibration for MoE [67.3] Hessian-Aware Router (HARC) は、二階曲率情報を利用してマージされたルータを認識できるトレーニングフリーのフレームワークである。
数学的推論とコード生成タスクの実験は、HARCが様々なMoEマージベースライン間のルーティングの分解を効果的に軽減していることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:33:33 GMT)
AAD-1: Asymmetric Adversarial Distillation for One-Step Autoregressive Video Generation [66.6] AAD-1は、一段階の自己回帰画像-ビデオ生成のための非対称な対数蒸留フレームワークである。
AAD-1は1ステップの自己回帰ビデオ生成において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:55:30 GMT)
Demo2Tutorial: From Human Experience to Multimodal Software Tutorials [63.7] Demo2Tutorialは、スクリーン記録とインタラクションログを通じてキャプチャされたエクスペリエンスを構造化されたマルチモーダルソフトウェアチュートリアルに変換するフレームワークである。
ステッププランナーはこれらのステップを、目標とステップを表す階層的なタスクグラフに抽象化します。
Composerは解析されたエクスペリエンスを構造化された再利用可能なイメージテキスト命令に変換する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:39:07 GMT)
scTranslation: A Comprehensive Benchmark for Single-Cell Multi-Omics Modality Translation [62.0] scTranslationは、シングルセルマルチオミクスのモダリティ変換タスクの包括的なベンチマークである。
多様な翻訳データセットが含まれ、最先端のモデルを統合し、包括的な評価指標を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:00:49 GMT)
Exploring Easy Boosts for Lidar Semantic Scene Completion [61.7] 複雑な設計設計を必要とせずに、ライダーセマンティックシーン補完(SSC)の性能を高める「フリーランチ」戦略。
まず,市販セグメンタから意味的な擬似ラベルを付与することで,既存のアーキテクチャの性能が大幅に向上することが実証された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:59 GMT)
GARDEN: Gravity-Aligned Reconstruction of Disentangled ENvironments from RGB images [61.2] 本稿では,RGBのみのフレームワークを提案する。このフレームワークは,再構成を物理的に地上に配置したシーンファクタ化として再構成し,構造化されたハイブリッドシーン表現を出力する。
結果として得られる表現は、明示的な剛体と分離された背景を組み合わせることで、視覚的リアリズムを維持しながら直接物理シミュレーションを可能にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:13:01 GMT)
VLESA: Vision-Language Embodied Safety Agent for Human Activity Monitoring [60.5] Vision-Language Embodied Safety Agent (VLESA)は、自我中心のビデオから人間の活動を監視する。
VLESAは、コンテキストに応じて同一のアクションが安全または危険である意図に依存した安全性に対処する。
目標を共同で推測し,映像から将来の行動を予測するための意図-行動予測エージェントを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:42:17 GMT)
EvoDrive: Pareto Evolution for Safety-Critical Autonomous Driving via Self-Improving LLM Agents [59.4] 既存の手法は通常、手工芸品でこのトレードオフを管理し、探索されていないパターンを見渡す。
本稿では,シナリオ生成のためのLLMベースのエージェント進化フレームワークであるEvoDriveを紹介する。
EvoDriveはシミュレーターによるアクター批判アーキテクチャを採用しており、メモリ駆動アクターはジェネレータの改善を反復的に提案し、批判者は不明瞭な候補をフィルタリングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:01:23 GMT)
Can Generalist Agents Automate Data Curation? [58.7] トレーニングデータのキュレーションは、現代のAI開発において、もっとも重要だが労働集約的な部分のひとつだ。
一般のコーディングエージェントがこのデータキュレーションループを自動化できるかどうかを問う。
モデル、トレーニングレシピ、評価スイートを修正するエージェント中心のベンチマークである*Curation-Bench*を紹介します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:26:53 GMT)
TGV-KV: Text-Grounded KV Eviction for Vision-Language Models [58.3] VLM(Vision-Language Models)は自動回帰生成パラダイムを継承し、以前のトークンのキーと値(KV)をキャッシュして推論を高速化する。
VLM(TGV-KV)のためのテキスト・グラウンドKV推定法を提案する。
TGV-KVのスループットは52.6%向上し、極端な維持予算は5%となった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:06:17 GMT)
CORE: Conflict-Oriented Reasoning for General Multimodal Manipulation Detection [56.6] ジェネレーティブAIは、マルチモーダルなフェイクニュースをますます現実的で広範にし、公共の信頼と社会的安定に深刻な脅威を与えている。
textbfConflict-textbfOriented textbfREasoning (textbfCORE) フレームワークを提案する。
COREは堅牢で一般化可能なコンフリクト検出を実現し、いくつかのサンプルやゼロショット設定で、目に見えない操作タイプに効果的かつ迅速に適応する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:53:48 GMT)
P\textsuperscript{2}-DPO: Grounding Hallucination in Perceptual Processing via Calibration Direct Preference Optimization [55.7] 幻覚は近年、LVLM(Large Vision-Language Models)において大きな研究の注目を集めている。
直接選好最適化(DPO)は、人間が提供した修正選好から直接学習することを目的としており、幻覚の問題に対処する。
本稿では,Ptextsuperscript2-DPO(Perceptual Processing Direct Preference Optimization, Ptextsuperscript2-DPO)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:22:53 GMT)
What Makes Interaction Trajectories Effective for Training Terminal Agents? [55.6] Terminal-Legoは、現実世界の問題を環境検証されたエージェントタスクに変換するスケーラブルなパイプラインである。
下着剤であるDeepSeek-V3.2の軌跡を微調整した学生は、はるかに強力な一般化を示している。
Qwen3-32Bは15.3kの終端レゴ軌道しか持たず、終端ベンチ2.0で24.3%のスコアを獲得し、データボリュームの30倍以上で確立された以前のSOTAのパフォーマンスと競合する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:37:47 GMT)
Right Makes Might: Aligning Verified Hidden States Empowers RL Reasoning [55.3] 現在の方法では、それぞれの正しいロールアウトを単一の報酬ビットに減らし、隠れた状態間で共有される幾何学的構造を無視している。
本稿では,RLトレーニングにおけるアンカートークンにおける正ロールアウトの最終層を,トレーニングと推論の両方においてゼロオーバーヘッドで整列する補助損失関数Hidden-Alignを提案する。
8つの数学的推論ベンチマークでは、Hidden-AlignはDAPOベースラインの平均パス@1をQwen3-1.7B, 4B, 14Bで3.8, 6.2, 5.4ポイント改善し、3つのスケールで一貫したパス@kゲインを得る。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:51:15 GMT)
SkelHCC: A Hyperbolic CLIP-Driven Cache Adaptation Framework for Skeleton-based One-Shot Action Recognition [55.0] SkelHCCは、シングルショットアクション認識のための統合スケルトンハイパーボリックCLIP駆動キャッシュ適応フレームワークである。
双曲幾何学の負の曲率と指数体積の増大を利用して、EH-HCLIPは自然にヒト解剖学の結合部分体階層をコードする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:13:27 GMT)
SkillDAG: Self-Evolving Typed Skill Graphs for LLM Skill Selection at Scale [54.7] 本稿では,スキル間関係を型付き有向グラフとしてモデル化したSkillDAGを提案する。
各検索はベクトルマッチング、型付きエッジ隣人、競合信号を返す。
ALFWorldとSkillsBench with MiniMax-M2.7では、SkillDAGは67.1%の成功と27.3%の報酬を得た。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:45:21 GMT)
Online Learning with Gradient-Variation Interval Regret [54.6] そこで本研究では,勾配変動を伴う時間間隔のリフレッシュなスケーリングを実現するオンライン学習アルゴリズムを提案する。
提案手法では, よりシンプルで効率的な2層オンラインアンサンブル構造を用いて, 高い理論的保証を実現する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:16:45 GMT)
Demystifying Pipeline Parallelism: First Theory for PipeDream [53.7] 本稿では、PDスタイルの手法に対して、クリーンな非収束性をもたらす固定ブロック-SGD抽象化としてランダム化PipeDream(PD)を導入する。
定常PDによって引き起こされる遅延は、$S2 - S/2 + O(1)$ for $S$として増大するので、スタイルリードのコントリビューションは、チューナレート形式で$(2S4)$、同等に$(S4/K)$としてスケールする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:14:57 GMT)
Are Common Substructures Transferable? Riemannian Graph Foundation Model with Neural Vector Bundles [53.7] 我々はニューラルベクトルバンドルと呼ばれるグラフ固有の幾何学学習フレームワークを開発した。
GAUGEは,ベクトルバンドルを構築し,幾何学的に整合した局所座標を平坦化する,事前学習可能なニューラルネットワークアーキテクチャである。
ゼロショットリンク予測やグラフ同型を含む課題タスクにおいて,その優れた表現性を実証的に検証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:35:42 GMT)
BA-T: An Iterative Transformer for Two-View Bundle Adjustment [53.2] 暗黙のトークン空間における繰り返し可能なレイヤとして,BAスタイルの構造化更新を実装した反復変換器であるBA-Tを提案する。
実験により、BA-Tは反復間におけるポーズと再構成の精度を徐々に改善することが示された。
BA-Tは、奥行き重心に対するコンパクトで効率的で構造的な代替手段を提供し、軽量アーキテクチャ内で正確な3D再構成を可能にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:51:14 GMT)
Bridging Auxiliary Constraints to Resolve Instruction Following in Large Reasoning Models [52.9] 大規模推論モデル(LRM)は多くのタスクにおいて印象的な能力を示してきたが、彼らは確実に複数の命令に従うことに苦労している。
我々はこの課題を制約整合問題(CAP)として定式化する。
本稿では,制約の構造化知識グラフとして命令を表現してCAPに対処する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:23:28 GMT)
Unlocking Feature Learning in Gated Delta Networks at Scale [52.7] 大規模言語モデルの訓練とスケーリングは膨大な計算資源を必要とする。
我々はGated Delta Networkのスケーリングルールを導出する。
言語モデル事前学習の実験により、我々の構成が安定した学習速度転送を可能にすることが確認された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:45:24 GMT)
What to Test Next: Interpretable Coverage Gap Discovery in Driving VLMs [52.5] 視覚言語モデル(VLM)を駆動するには,操作設計領域(ODD)が定義する様々な条件のシーンを正確に理解する必要がある
SliceScorerは、欠落したスライス推薦のための決定論的スコアリングルールである。
SliceNavは, 従来のスライス発見法よりも, 高リスクカバレッジギャップを効果的に表面化することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:32:33 GMT)
AnchorMoE: Interpretable Time Series Classification via Anchor-Routed MoE [52.0] AnchorMoEは、解釈可能な構成別分類フレームワークである。
ローカルパッチのマルチビュー表現をエンコードし、専門の専門家にルーティングする。
実世界のベンチマークと合成ベンチマークの実験は、AnchorMoEが非常に競争力のある分類性能を達成することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:30:54 GMT)
Neural Networks Provably Learn Spectral Representations for Group Composition [51.6] ニューラルネットワークトレーニング中に内部構造がどのように現れるかを検討する。
トレーニング力学は表現理論エネルギー汎関数上の勾配上昇によって支配されていることを証明する。
このフレームワークは特徴学習の表現論的記述を提供し、新しい低ランク圧縮現象を特徴付ける。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:04:21 GMT)
MAOAM: Unified Object and Material Selection with Vision-Language Models [51.3] Mask Any Object And Material (MAOAM) はインタラクティブな画像編集のための統合された選択フレームワークである。
テキストベースのインタラクションとクリックベースのインタラクションの両方で、正確なオブジェクトとマテリアルレベルの選択を可能にする。
重要な課題は、テキストアノテーションによるマテリアルセレクションデータセットの欠如である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:57 GMT)
Where Do Deep-Research Agents Go Wrong? Span-Level Error Localization in Agent Trajectories [51.2] 最終回答に基づく評価は、エージェントが成功するかどうかを示すが、どの部分の軌道が答えを信頼できないかを示すものではない。
2つのエージェントフレームワーク、3つのバックボーンモデル、3つのベンチマークから2,790の実際のトラジェクトリを収集し、生ログをセマンティックスパンに変換し、エキスパートレビューを通じて有害なエラースパンを注釈付けします。
我々は,エージェントの主張を追跡するクレーム中心の監査フレームワークであるDRIFTを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:30:22 GMT)
SparseStreet: Sparse Gaussian Splatting for Real-Time Street Scene Simulation [51.1] 既存の方法は細部を捉えるために大量のガウス原始体を必要とする。
SparseStreetはストリートシーンに特化して設計された汎用圧縮フレームワークである。
本手法は, 動的物体の形状と外観を効果的に保存し, ガウス原始体の総数を大幅に削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:06:14 GMT)
CauTion: Knowing When to Trust LLMs for Ensemble Causal Discovery [51.1] 大規模言語モデル(LLM)は、統計的推論を補完する将来的なドメイン知識の源を提供する。
我々は、LLMドメイン知識を統計的因果探索アルゴリズムのアンサンブルに確実に統合するフレームワークであるCauTionを提案する。
CauTionは、データ中心とLLM拡張ベースラインの両方を一貫して上回る。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:07:43 GMT)
Need to Know: Contextual-Integrity-Grounded Query Rewriting for Privacy-Conscious LLM Delegation [50.6] コンテキスト整合性(Contextual Integrity)の下でクエリの書き直しを保存したプライバシをリキャストします。
本稿では,CI誘導型強化学習フレームワークを提案する。
実験により、学習したリライターは、デバイス上のベースラインに対して+10.1平均ユーティリティを達成し、最高のプライバシユーティリティトレードオフを達成することが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:28:28 GMT)
Beyond Encoder Accumulation: Measuring Encoder Roles in Multi-Encoder VLMs [50.4] 我々は、統一パイプラインの下で、5つの共通ビジョンエンコーダの空でないサブセット31を再訓練し、評価する。
各エンコーダのコントリビューションを,容量と必要量という2つの軸に分解する。
エンコーダごとのプロジェクタ有効ランクは、残留スコアの変動を説明する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:46:42 GMT)
OVO-S-Bench: A Hierarchical Benchmark for Streaming Spatial Intelligence in Multimodal LLMs [49.8] OVOS-Benchは、人間中心の空間知能をストリーミングするための完全な注釈付きベンチマークである。
348のソースビデオに関する1,680の質問で構成されている。
それぞれの質問はクエリとエビデンスインターバルを持ち、評価において、モデルはクエリの前のプレフィックスのみを表示する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:51:32 GMT)
Reasoning over Grammar: Can Synthetic Linguistic Reasoning Traces Enhance Low-Resource Machine Translation? [49.8] 我々は,低リソース機械翻訳が言語解析と文法推論の中間段階の構造化の恩恵を受けるか検討する。
本稿では,Universal Dependencies Treebank,Dictionary,Gram-rule Bankから,ステップバイステップの言語推論トレースを自動的に生成するパイプラインを提案する。
その結果,言語的推論の痕跡は推論時ガイダンスとして最も有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:36:12 GMT)
SRENet: Spectral Re-Entry Network for Point Cloud Action Recognition [49.5] 本研究では,行動認識の周波数視点から,大域的文脈と微粒な動きの時間的ダイナミクスを学習するためのSRENetを提案する。
SRENetは、ポイントクラウドベースのアクション理解における周波数モデリングの有効性を検証し、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:11:47 GMT)
TTT-VLA: Test-Time Latent Prompt Optimization for Vision-Language-Action Models [49.5] VLA(Vision-Language-Action)モデルは目覚ましい進歩を遂げているが、展開時の分散シフトには弱いままである。
近年のVLAモデルは、プロンプトが政策行動の効率的なインターフェースとして機能することを示唆しているが、既存のプロンプトベースのステアリングは通常、外部ガイダンスに依存している。
VLAのテストタイムトレーニング(TTT)は、プロンプトの最適化によって実現可能か?
我々は、遅延プロンプト最適化(LPO)に基づくテスト時間トレーニングフレームワークであるTTT-VLAでこの問題に対処する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:10:39 GMT)
Can Factual Opinions Be Edited (Manipulated) in Large Language Models? [49.2] 大規模言語モデル(LLM)は、様々なドメインに統合され、知識編集技術が重要かつ潜在的に危険である可能性がある。
現在の編集方法は主として原子的な事実をターゲットとしており、社会問題に関する公的な人物のスタンスを文書化するなど、事実的意見を操作することに関連する重大なリスクを見落としている。
本稿では,261の公開数字,19の課題カテゴリ,2,178の完全な意見記録を含むFactual Opinion Editing with Evidenceベンチマークを紹介する。
本評価は,現在行われている編集技術が現実的な意見と大きく対立していることを示し,しばしば表面的変化のみを達成する一方で,編集された意見とモデルが生み出す支持的証拠との整合性を維持することに失敗することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:35:00 GMT)
Smart Transportation Without Neurons -- Fair Metro Network Expansion with Tabular Reinforcement Learning [49.2] 我々は,交通需要を満たすため,メトロ・ネットワーク拡張問題(MNEP)に取り組む。
深層強化学習 (Deep RL) は複雑な逐次決定過程において有効である。
我々は、MNEP問題はディープRL法を必要としないほど小さいことを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:29:35 GMT)
Analyzing Stream Collapse in Hyper-Connections: From Diagnosis to Mitigation [48.9] ハイパーコネクションは、単一のトランスフォーマー残ストリームを複数のストリームに置き換え、ストリームインデックスに置換対称性を導入する。
我々は、この対称性が実際にどのように解決されるか、ストリームがバランスの取れた方法で専門化しているか、それとも支配的なストリーム利用を示すかを検討する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:00:49 GMT)
ARBOR: Online Process Rewards via a Reusable Rubric Buffer for Search Agents [48.8] LLMベースの検索エージェントは、主に結果のみの報酬で訓練され、検索プロセス自体は監督されていない。
この信号は、全てのサンプル軌跡が同じ正当性を共有する結果同質な群に対して退化し、群内の優位性はゼロとなり、勾配は得られない。
ARBOR(Adaptive Buffer for Online Reward)は,クエリ間で共有されるルーリックメモリを維持する再利用可能なプロセス・リワードフレームワークである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:58:54 GMT)
Tailoring Strictly Proper Scoring Rules for Downstream Tasks: An Application to Causal Inference [48.8] 本稿では,ダウンストリーム誤差メトリックの局所曲率をマッチングすることにより,タスク固有の厳密なスコアリングルールを導出するフレームワークを提案する。
これを平均処理効果 (ATE) 推定に適用し, 閉形式損失と対応する正準確率写像を導出する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:41:25 GMT)
Solipsistic Superintelligence is Unlikely to be Cooperative [48.7] 極めて有能なタスク解決ツールである超知能は協調的ではないと我々は主張する。
我々は、相互依存を中核的な設計原則として扱う非ソリプシックな研究パラダイムを提唱する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:54:55 GMT)
Expert-Aware Causal Tracing of Factual Recall in Sparse MoE Language Models [48.4] ファクトリコールの因果トレースは、主に高密度トランスフォーマー言語モデルで研究されている。
スパースMoE言語モデルのための専門家対応因果トレースを定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:35:48 GMT)
Black-box, Adaptive, Efficient, Transferable, Harmful, Applicable... Attacks Are All You Need to Break LLMs [47.5] 欠陥のある攻撃設計は、ロバスト性の推定を増大させ、デプロイメントのリスク評価と防御比較を信頼できないものにすることができる。
Indirect Harm Optimization (IHO) は、有害判定に対する反復的選好最適化によって訓練された、マスク付き拡散言語モデルアタッカーである。
以上の結果から,IHOは従来,信頼性を向上した標準化されたジェイルブレイク評価への実践的な一歩と位置づけた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:39:15 GMT)
Eliciting Complex Spatial Reasoning in MLLMs through Wide-Baseline Matching [47.5] マルチモーダル大言語モデル(MLLM)の空間的推論におけるワイドベースラインマッチングは困難なテストベッドである
ReasonMatch-Benchは, 室内, 屋外, オブジェクト中心のシナリオにまたがって, 視点変位と粒度の一致によって階層化されたベンチマークである。
大規模ビデオ3Dコーパスからワイドベースラインビューペアを自動的に抽出するスケーラブルなデータ生成パイプラインを構築した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:46:34 GMT)
TSQAgent: Rating Time Series Data Quality via Dedicated Agentic Reasoning [47.2] 大規模言語モデル (LLM) はペアワイズ比較と次元毎の評価による品質評価のための有望なパラダイムとして登場した。
本稿では,3つの協調的役割からなるTS品質評価のためのエージェント推論フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:28:17 GMT)
HybridThinker: Efficient Chain-of-Thought Reasoning via Compressed Memory and Transient Thought Steps [47.0] 拡張チェーン・オブ・シント(CoT)トレースは、LCM推論を改善するが、かなりの計算とメモリコストを発生させる。
textbfHybridThinkerを提案し、これらの表現の保存に加えて、思考ステップも一時的に保持し、きめ細かい詳細を提供する。
これらのステップから直接情報を取得することで、学習の継続によって、モデルがメモリトークンをバイパスすることができることを観察する。
そこで我々は,次のステップに注意することで,いくつかの思考ステップのみに直接アクセスし,他の思考ステップをマスクするハイブリッドトレーニング手法を導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:22:05 GMT)
CoEval: Ranking Language Models for Custom Tasks Without Labeled Data or Trustworthy Benchmarks [47.0] CoEvalは、特定のアプリケーションに対して言語モデルを選択またはランク付けするための再利用可能なフレームワークである。
ラベルのない新しい属性制御ベンチマークを合成し、各ランでアイテムが新たに生成されるため、汚染のない。
クロスファミリーの裁判官アンサンブルは、人間のレイパーなしで候補者モデルをランク付けします。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:41:43 GMT)
Bridging Predictive Uncertainty and Safe Action: Sample-Conditioned Differentiable Planning for Autonomous Driving [46.9] 複雑でダイナミックでインタラクティブな運転環境は、自動運転に重大な課題をもたらす。
現在のシステムにおける基本的なボトルネックは、高度に表現力のある不確実性モデリングと解釈可能な安全な動き計画との切り離しである。
本稿では, このギャップを埋めるために, 拡散生成将来の軌道を最適化プロセスに明示的に組み込む, サンプル条件付き微分可能計画フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:10:02 GMT)
WebRISE: Requirement-Induced State Evaluation for MLLM-Generated Web Artifacts [46.9] MLLM生成Webアーティファクトの既存のベンチマークは、局所的な証拠を通じて相互作用を評価する。
タスク要求をインタラクションコントラクトグラフにコンパイルするWebRISEを紹介します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:29:40 GMT)
Hierarchical Federated Learning with Dynamic Clustering and Adaptive Regularization for Robust Infrastructure Inspection [46.7] 本稿では,新しい階層型フェデレーション学習フレームワークを提案する。
このフレームワークは、相乗的な2層最適化戦略を編成する。
大規模で実世界の構造検査データセットに関する総合的な評価は、マクロクラスタリングとマイクロレギュラー化の階層的な統合が二重レベルの不均一性をうまく中和することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:14:26 GMT)
Neuron Populations Exhibit Divergent Selectivity with Scale [46.3] ロゼッタニューロン(Rosetta Neurons)は、独立に訓練されたモデルにおいて、活性化パターンが類似しているニューロンのクラスである。
最大30Bパラメータと最大5Bパラメータの視覚モデルの解析において、ロゼッタニューロンの集団はモデルサイズにおけるサブ線形パワー則に従う。
さらに、ロゼッタニューロンはより選択的になり、スケールとともに単意味になりつつあります。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:52 GMT)
Large Language Models Hack Rewards, and Society [46.2] 社会的規制は報酬関数と構造的に類似している。
我々は、RL中の報酬関数をハックするモデルの傾向が、社会的ハッキングと呼ばれるより連続的な障害モードにスケールできるかどうかを問う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:29:48 GMT)
Dynamic Short Convolutions Improve Transformers [44.8] 本稿では,トランスフォーマー改善のためのニューラルネットワークプリミティブとして,動的短畳み込みを導入する。
キー、クエリ、値表現に動的に短い畳み込みを適用すると、パフォーマンスが向上する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:07:55 GMT)
GN0: Toward a Unified Paradigm for Generation, Evaluation, and Policy Learning in Visual-Language Navigation [44.6] 身体的ナビゲーションは知的エージェントと物理世界を結ぶ。
多様な3Dシーンをキュレートし、大規模ナビゲーションデータのための自動パイプラインを開発する。
対話型ローミングと衝突認識ナビゲーションをサポートする高忠実度シミュレーションプラットフォームを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:05:47 GMT)
Clustered Self-Assessment: A Simple yet Effective Method for Uncertainty Quantification in Large Language Models [44.6] 本研究では,大規模言語モデルにおける不確実性定量化のための簡易かつ効果的な自己評価手法を提案する。
提案手法は,世代を意味的に異なるクラスタに分類し,構造化された複数選択質問の回答オプションに変換し,モデルによって割り当てられた確率を信頼度推定として利用する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:25:54 GMT)
Beyond Single Solution: Multi-Hypothesis Collaborative Deep Unfolding Network for Image Compressive Sensing [44.0] MHC-DUN(Multi-Hypothesis Collaborative Deep Unfolding CS Network)を提案する。
多様な解空間をまたいだ共同最適化により、複数の仮説を明示的にモデル化し、活用する。
実験の結果,提案手法は既存のCSネットワークよりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:50:56 GMT)
Exact Unlearning in Reinforcement Learning [44.0] そこで我々は,$$-TV-stable の強化学習アルゴリズムが存在し,正確なアンラーニング手順をサポートすることを示す。
また、$(Hsqrt!SAT! +! SAH/)$ for $-TV-stable RL algorithm という下限を定め、アルゴリズムが極小に近いことを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:54:44 GMT)
Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories [43.9] 我々は、モデルが短期的な脆弱な記憶をリプレイで安定した長期的知識に継続的に学習し、蒸留することを可能にする'Sleep'パラダイムを導入する。
人間の学習プロセスに触発されて、我々は、知識探索のための新しい一般化蒸留プロセス(すなわち、オンライン蒸留と強化学習の組み合わせ)を提示する。
長期学習, 継続学習, 知識の取り込み, および数発の一般化タスクに関する実験は, 睡眠ステージの重要性を裏付けるものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:56:55 GMT)
MUSE: A Unified Agentic Harness for MLLMs [43.7] マルチモーダル大規模言語モデル(MLLM)のための統一型構造化実行ハーネスであるMUSEを紹介する。
MUSEは、タスク表現、視覚処理、知覚ツールの使用、構造化解析、決定論的検証、検証誘導修復のための構成可能なモジュールを備えた既製のMLLMをラップする。
視覚的空間計画,視覚知覚,マルチモーダル推論,きめ細かな視覚的識別にまたがる様々なベンチマークでMUSEを評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:24:30 GMT)
FreeStreamGS: Online Feed-forward 3D Gaussian Splatting from Unposed Streaming Inputs [43.1] FreeStreamGSは、効率的で高品質なNVSのための堅牢なオンラインフィードフォワードフレームワークである。
本稿では,2つの重要なメカニズムを紹介する。デカップリング型内因性回復ヘッドは,内因性累積カメラバイアスを除去し,長期ストリーミング時のシーンスケールジッタを防止する。
実験によると、FreeStreamGSは、将来のフレームにアクセスせずに動作しているにも関わらず、最先端のオフラインフィードフォワード3DGSメソッドと競合するレンダリング品質を実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:16:09 GMT)
OneVLA: A Unified Framework for Embodied Tasks [42.8] ナビゲーションと操作は インテリジェンスの基本能力だ
OneVLAは、これらの異なるタスクを単一の凝集性フレームワークに統合する統一アーキテクチャである。
シミュレーションと実世界の両方の環境での実験は、OneVLAが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:11:27 GMT)
Analyzing the Evolution of Structural Communities within Microservice Architecture [42.8] コミュニティ検出は、互いに強く依存するネットワーク内のサービスのグループを特定する方法である。
train-tketベンチマークの6つのリリースのマイクロサービスアーキテクチャ内で、時間的コミュニティ検出を実行しました。
私たちは、複数のコミュニティに属するサービスと、同じコミュニティ内のサービスに、入ってくるサービスと出ていくサービスの両方を見つけました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:44:31 GMT)
SL-BiLEM: Structured Learnable Behavior-in-the-Loop Epidemic Modeling for Forecasting and Policy Evaluation [42.6] エピデミック予測は、人間の行動が病気の拡散に動的に反応する、という根本的な課題に直面している。
頑健な外挿のための正則化として物理的制約を利用するtextbfSL-BiLEM(Structured Learnable Behavior-in-the-Loop Epidemic Model)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:33:04 GMT)
Tailoring pure valley-Zeeman spin-orbit coupling in WSe$_2$-encapsulated monolayer graphene [42.4] ねじれたファンデルワールスのヘテロ構造における工学的近接効果は、電子的特性を設計するための強力なプラットフォームを提供する。
単層グラフェン中の純粋なバレー-ゼーマンスピン軌道カップリングは、2つの平行ねじれWSe$単層間のカプセル化によって達成される。
また, カプセル化幾何をチューニングすることにより, 近接スピン軌道カップリングを完全にクエンチできることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:43:48 GMT)
PointAction: 3D Points as Universal Action Representations for Robot Control [42.1] 本稿では,映像予測をロボット行動にブリッジするフレームワークであるPointActionについて,明示的なポイントベース4Dモデリングにより紹介する。
PointActionは、ロボットシーンにおける最先端の4D生成品質を実現し、シミュレーションにおいて既存のベースラインを上回り、事前トレーニング中に見えない2つの本物のロボットアームに一般化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:30:50 GMT)
SagaQA: A Multi-hop Reasoning Benchmark for Long-form Narrative Understanding in TV Series [42.1] フル長テレビシリーズに対するマルチホップ推論のベンチマークであるSagaQAを紹介する。
SagaQAの際立った特徴は、その推論ステップの粒度である。
異なる計画戦略がこのような複雑な推論をどのように扱うかを研究する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:14:01 GMT)
Hallucinations as Orthogonal Noise: Inference-Time Manifold Alignment via Dynamic Contextual Orthogonalization [42.0] 大規模言語モデル(LLM)における幻覚は、文脈的事実や論理的制約と矛盾するコンテンツの生成によって特徴づけられる。
推論時間介入法である動的文脈直交化(DCO)を導入する。
本研究は,幻覚の幾何学的解釈を検証し,多様体アライメントの計算的手法としてDCOを確立した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:56:29 GMT)
Conditional Latent Diffusion Model with Fourier-based Motion Modelling for Virtual Population Synthesis [41.9] 心臓血管の応用では、仮想解剖学は典型的には、生成モデルからサンプリングされた3D+tメッシュとして表される。
メッシュをエンコードする畳み込みメッシュVAEからなる条件生成フレームワークである4D F-MeshLDMを提案する。
4D F-MeshLDMは解剖学的忠実度において最先端のベースラインを上回り, ほぼゼロサイクル閉鎖誤差を達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:10:00 GMT)
SkillRevise: Improving LLM-Authored Agent Skills via Trace-Conditioned Skill Revision [41.6] SkillReviseはエージェントスキルを反復的に洗練するために設計された実行基盤フレームワークである。
SkillReviseは、実行エビデンスからスキル欠陥を診断し、一般的なメモリから関連する修復原則を検索し、実行順に編集を適用する。
単発ベースラインを大幅に上回り、SkillsBenchにおけるベースエージェントの成功率は36.05%から61.63%に向上した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:41:20 GMT)
Automatic Layer Selection for Hallucination Detection [41.6] 幻覚関連信号は、大言語モデルの最終層(LLM)よりも中間層に強く符号化されている
提案する選択基準は, 最適層, 準最適層を連続的に同定するFEPoID (First Effective Peak of Intrinsic Dimension) である。
FEPoIDはトレーニング不要で、計算オーバーヘッドは無視できる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:26:44 GMT)
Imaginative Perception Tokens Enhance Spatial Reasoning in Multimodal Language Models [41.4] 視覚言語モデル(VLM)は多くのタスクで優れるが、重要な情報が直接観測できない場合、空間的推論に苦慮する。
Inaginative Perception Tokens (IPT) は、VLMが知覚する空間構成を外部化する中間的知覚表現である。
IPTの監督は、空間的推論を一貫して改善し、しばしば思考訓練のテキスト連鎖よりも優れる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:17 GMT)
DyaPlex: Full-Duplex Speech-Motion Model for Dyadic Interaction [41.3] 連続した相互通信を捉えるため、このモデルはストリーミング方式で音声と音声の両方の物理運動を同時に生成・生成する。
統合された二進的トークンインターリーブ機構を導入し、相互注意を導くことにより、本モデルでは、自己回帰と潜在リッチ音声特徴とを効果的に一致させる。
本モデルでは, 相互依存関係を効果的に把握し, モナディック, ディヤディックの両人間のインタラクションベンチマークにまたがって, 新たな最先端性能を確立する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:42:56 GMT)
Exploiting Verification-Generation Gap: Test-Time Reinforcement Learning with Confidence-Conditioned Verification [41.1] テスト時強化学習は、大規模言語モデルの推論能力を高めるための有望なパラダイムとして登場した。
本稿では,TTRL-CoCoV(Test-Time Reinforcement Learning with Confidence-Conditioned Verification)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:11:09 GMT)
Quantifying Faithful Confidence Expression in Large Reasoning Models [40.9] 大規模推論モデルの忠実な校正を定量化する新しい枠組みを提案する。
本フレームワークは,内的不確実性の3つの要因に対する言語的決定性を解析する。
忠実な信頼表現はLRMにとって重要な課題である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:53:45 GMT)
Skill Is Not Document: A Query-Conditional Benchmark and Two-Stage Retriever for LLM Agent Skill Routing [40.6] R3-Skillは、現実的なエージェントスキルルーティングのベンチマークである。
スキル互換性を明示的な訓練信号とする2段階検索システムを構築した。
データセット、トレーニングコード、モデルウェイトは、エージェントスキルルーティングのためのオープンソースとしてリリースされている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:30:46 GMT)
MemTrain: Self-Supervised Context Memory Training [40.6] 既存のメモリエージェントアプローチは通常、下流タスクで強化学習を施したエンドツーエンドで訓練される。
MemTrainは、LLMエージェントのコンテキストメモリ能力を高めるための自己教師型トレーニングフレームワークである。
MemTrainは、異なるモデル間のダウンストリームメモリ集約推論性能を一貫して改善する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:56:24 GMT)
GeoAlign: Beyond Semantics with State-Guided Spatial Alignment in VLA Models [40.5] VLA政策学習のための状態誘導型空間アライメントアーキテクチャであるGeoAlignを紹介する。
GeoAlignは、ロボットドメインのRGB-D監視を備えたRGBジオグラフィックブランチをポストトレーニングし、ポリシーロールアウトのためにRGB由来のGeometry-Enhanced Post-Trained機能を生成する。
GeoAlignは、LIBEROの99.0%、SimplerEnv-Fractalの3つのタスクで85.3%、幾何学的にクリティカルな8つの現実世界のALOHAタスクで78.8%を達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:01:18 GMT)
ADAPTOOD: Uncertainty-Aware Fine-Tuning for Out-of-Distribution ECG Time Series Models [40.5] 多様なセンサー、人口、アプリケーション設定によって生じる分散シフトによって、パフォーマンスは劣化することが多い。
分散シフト重大度を定量化するためにデータ不確実性を活用する新しいフレームワークであるADAPTOODを提案する。
我々は,ADAPTOODが既存のOODタスクよりも7%高い精度,12.9%高い精度を実現していることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:26:20 GMT)
Preference-Calibrated Human-in-the-Loop Reinforcement Learning for Robotic Manipulation [40.2] PACT(Preference-calibrated Actor-Critic Training framework)を提案する。
まず、人間の実演から学習し、信用補正のための最適部分を特定するプログレスモデルを設計する。
次に、選好ペアを構築して、同定された準最適セグメントのベルマン目標をペナルティ化する反ファクト的優位性を定義する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:38:25 GMT)
PR2: Predictive Routing Replay for MoE-Based LLM Reinforcement Learning [40.1] 本稿では,各ルータを軽量な進化予測器で拡張し,短水平ルータの進化を予測できる予測ルーティング・リプレイ(PR2)を提案する。
PR2はルーティングによるミスマッチを低減し、RL安定性を改善し、様々な推論ベンチマークでパフォーマンスを向上する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:28:31 GMT)
An AutomationML Domain Library for the Formalized Process Description [39.8] VDI/VDE 3682によるFPD(Formalized Process Description)は、エンジニアリングドメイン全体にわたるプロセスを記述するための標準化されたグラフィカル表記を提供する。
本稿では,FPD言語要素の完全集合を形式化するAutomationML(AML)ドメインライブラリを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:14:25 GMT)
FederatedSkill: Federated Learning for Agentic Skill Evolution [39.7] 我々は、協調エージェント進化のためのプライバシー保護フレームワークであるFederatedSkillを紹介した。
FederatedSkillは、セマンティックスキルの差分、ローカルライブラリ上の構造化パッチをコミュニケーションの基本単位として利用する。
サーバ側では、進化エージェントがこれらのパッチを集約し、クライアント固有の機能境界を動的にモデル化します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:38:05 GMT)
Do Real-World Datasets Contain Natural Experiments? An Empirical Study Using Causal Feature Selection [39.7] 自然界では、一部の個人やグループに影響を与えるが、他の個人には影響しない事象は自然実験として知られている。
因果探索を用いて基礎となる因果グラフを復元し,因果リンクに基づく特徴選択を行う。
この結果から,実世界のデータセットには自然実験が組み込まれており,これらの自然実験を利用してモデル性能を向上させることが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:12:30 GMT)
$A^2$: Smaller Self-Supervised ViTs Localize Better than Larger Ones [38.9] より小さい自己監督型VTのアテンションマップは、より大きいVTよりも前景のオブジェクトのローカライズが優れていることがわかった。
両世界を最大限に活用するために,この逆スケーリング探索を利用するシンプルな手法である$A2$を提案する。
A2$は完全に事前訓練された機能を使用し、グループラベルを必要とせず、データセットごとの注意やバックボーンのトレーニングを必要としない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:45:02 GMT)
Spectral Anatomy of Quantum Gaussian Process Kernels [38.3] 我々は,Nystrm近似誤差に束縛されたコーシー=シュワルツテール,有限サンプル分散抽出等式,およびエンフターゲット依存の最適エントロピーのキャラクタリゼーションを証明した。
診断はカーネルに依存しない: ハードウェア効率、マッチゲート、IQPのインハンドRBF/Matérn/RFF/deep-カーネルファミリはすべて同一の$S/log n$曲線に崩壊する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:28:16 GMT)
SkillPyramid: A Hierarchical Skill Consolidation Framework for Self-Evolving Agents [38.3] 最近のAIエージェントは、複雑なタスクを解決するためのスキルを柔軟に実行できますが、その長期的な改善は、体系的なスキル構築、蓄積、転送の欠如によって制約されます。
SkillPyramidは,タスクのより広範な一般化のために既存のスキル体験を再利用するスキル統合フレームワークである。
SkillPyramidは平均報酬を38.0%、実行手順を27.7%削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:14:27 GMT)
VistaHop: Benchmarking Multi-hop Visual Reasoning for Visual DeepSearch [38.2] 視覚中心の検索とマルチホップ視覚推論を評価するベンチマークであるVistaHopをVisual DeepSearchで紹介する。
VistaHopには、300の高解像度画像、25のビジュアル検索シナリオ、350のマルチホップQAタスクが含まれており、モデルが視覚アンカーからエビデンスチェーンに従うか、複数の画像グラウンドの推論パスに情報を融合させる必要がある。
さらに,テキスト検索,画像検索,画像トリミング,エビデンスベースの回答検証によるツール強化推論をサポートする統合評価環境であるVistaArenaを開発した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:37:23 GMT)
Making Embodied AI Reliable: A Community Agenda from Testing to Formal Verification [38.2] Embodied AIシステムは、ますますオープンな環境にデプロイされている。
この記事では、組み込みAIの信頼性は本質的にライフサイクル保証の問題である、と論じる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:58:40 GMT)
Inference-Time Scaling for Joint Audio-Video Generation [38.1] ジョイントオーディオビデオ生成モデルは、忠実性を改善するためにかなりのトレーニングリソースを必要とすることが多い。
推論時間スケーリングは、単一のモダリティドメインにおいて、有望なトレーニング不要の代替手段である。
共同音声・ビデオ生成のためのITSの総合的研究について紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:41:41 GMT)
Beyond Semantics: Modeling Factual and Affective Perceptual Experiences from Vision-Language Data [37.9] Pトピックモデリングに取り組む2段階アーキテクチャである**PercepT**(**Percep**tion topic**T**ransformerを紹介する。
PercepTは意味的に意味のある知覚経験を捉え、既存の方法よりもはるかに優れている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:54:59 GMT)
A Voxel-Based Quantum Computing Method (VBQC) for Solid Mechanics Problem [37.9] 本研究では、固体力学におけるハミルトニアンの量子シミュレーションのためのボクセルベースの量子計算法(VBQC)を提案する。
VBQCは、空間領域を離散化するためにボクセル格子を適用し、システムマトリックスが三角形フラクタル特性を示すことを可能にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:37:49 GMT)
FindIt: A Format-Informed Visual Detection Benchmark for Generalist Multimodal LLMs [37.6] 本稿では,ジェネラリストMLLMの迅速なローカライゼーション能力を評価するために設計された,最初の包括的なベンチマークを紹介する。
我々のベンチマークは、オブジェクト検出、参照式検出、インスタンスレベルの検出、ビデオベースの検出の4つの中核的なタスクカテゴリにまたがっている。
オープンソースとプロプライエタリなMLLMの多種多様なセットを評価し,その性能と限界を詳細に分析する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:14:46 GMT)
MedCUA-Bench: A Screenshot-Only Benchmark for Clinical Computer-Use Agents [37.6] MedCUA-Benchは,臨床用コンピュータ使用エージェントの対話型ベンチマークである。
実際の製品マニュアルとオープンソース医療システムから再構築された10の医療ドメインにわたる18の臨床シナリオをカバーする。
23エージェント中、最高のクローズドソースモデルは54.2%の精度で成功し、実際のOpenEMRでは9%以下にとどまっている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:02:35 GMT)
Text-to-Image Models Need Less from Text Encoders Than You Think [37.6] テキスト・ツー・イメージ・モデルは、個々の単語の意味や単語の順序を超えて埋め込まれたテキストに符号化されたリッチな情報を使用しないことが多いことを示す。
これは、一般的な信念とは裏腹に、テキスト・ツー・イメージのモデルは、個々の単語の意味や単語の順序を超えて埋め込まれたテキストに符号化されたリッチな情報を使わないことが多いことを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:37:57 GMT)
Parametrically induced strong coupling between a superconducting quantum circuit and a solid-state spin ensemble [37.5] 超伝導回路と固体スピン間の効率的な量子状態移動は、超伝導量子プロセッサの高コヒーレンス量子メモリを解放する。
ジョセフソン回路と希土類スピンアンサンブル間の動的に制御された強結合を示す。
我々のアーキテクチャはスピンアンサンブルの量子制御を可能にし、超伝導回路のみのコヒーレンスをはるかに超越したハイブリッドメモリの道を開く。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:54:16 GMT)
From Answers to States: Verifiable Process-Level Evaluation of Chemical Reasoning in Large Language Models [37.3] ChemCoTBench-V2は、構造化された検証可能な化学推論トレースの評価のための、ルール検証可能な診断ベンチマークである。
分子理解、分子編集、分子最適化、反応予測にまたがっており、18の報告タスクで5,620個の評価サンプルがある。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:47:19 GMT)
From Long News to Accurate Forecast: Importance-Aware Fusion and PRM-Guided Reflection for Time Series Forecasting [37.3] 本稿では,重要なニュース圧縮とプロセスレベルの検索監視を組み合わせた新しいフレームワークを開発する。
金融、エネルギー、トラフィック、およびbitcoin予測ベンチマークの実験は、我々の手法が強力なベースラインよりも予測精度を向上させることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:36:30 GMT)
Beyond the Literal: Decomposing Pragmatic Intent in Multimodal Meme Understanding [37.2] Intent Projectionは、単一のLVLMバックボーン内で2つの信号の表現、出力、目的レベルを分離するフレームワークである。
Intent Projectionは、オープンソースベースラインを一貫して上回り、プロプライエタリなモデルとのギャップを狭める。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:09:04 GMT)
Investigating Adversarial Robustness of Multi-modal Large Language Models [37.2] マルチモーダル大規模言語モデル (MLLM) は視覚言語タスクにおいて高い性能を達成する。
しかし、視覚エンコーダ(例えばCLIP)を通じて視覚入力を組み込むと、攻撃面が大幅に拡大する。
本研究はMLLMの対向的堅牢性に関する系統的研究である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:34:48 GMT)
Exploring Adversarial Robustness and Safety Alignment in Multilingual Multi-Modal Large Language Models [37.2] マルチモーダル大規模言語モデルでは、視覚認識を言語推論に統合し、敵対的攻撃を受けやすい連続的な攻撃面を導入する。
MLLMの以前の研究は、主に英語中心のタスクに焦点を合わせており、多言語的な振る舞いは未調査のままである。
本研究は,12言語にまたがる対向的ロバスト性とマルチモーダル安全性について検討し,インストラクションチューニングによる多言語能力を得るオープンソースMLLMを評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:42:10 GMT)
Beyond False Stability: High-Noise Drift Gating for Test-Time Adversarial Defenses in Vision-Language Models [37.2] CLIPのような視覚言語モデル(VLM)は、強いゼロショットの一般化を示すが、敵攻撃に対して非常に脆弱である。
最近のアプローチでは、CLIPの視覚的表現が摂動にどのように反応するかを利用する。
軽量ゲーティング信号として高雑音特徴ドリフトを用いた学習自由なプラグインドリフトゲート機構を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:49:04 GMT)
The Differentiable Auditory Loop (DAL): An ML Framework for Hyper-Personalized Hearing Aids [37.1] そこで我々は、パーソナライズされた補聴器の設計と装着のための新しいオープンソースフレームワークであるDAL(Dariable Auditory Loop)を紹介した。
DALの最初の実装は、JAXに移植したヒト人工内耳機能の微分可能なモデルであるCARFACを組み込んだものです。
正常聴力に適合するCARFACモデルの出力と、各被験者の個々の聴覚障害に適合するCARFACモデルの出力とを比較して、ネットワークを微調整する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:09:51 GMT)
Pretraining Language Models on Historical Text [36.6] 我々は、1913年以前の英語テキストにのみ訓練された7.24B史言語モデル(LM)であるTypewriterLMを紹介した。
我々は,54Bの歴史的コーパスであるTypewriterCorpusを構築し,広範囲なデータクリーニングと漏洩対策を行った。
また,歴史的資料に直接的根拠を残さないように応答を制約するポストトレーニングフレームワークである,語彙的基盤のチューニングも導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:59:06 GMT)
Generalizing Graph Foundation Models via Hyperbolic Retrieval-Augmented Generation [36.1] グラフ基礎モデル(GFM)はグラフ表現学習において支配的なパラダイムとして登場した。
GFMの一般化能力を高めるために,HyRAG(Hyperbolic Retrieval-Augmented Generation)フレームワークを提案する。
複数のグラフベンチマークの実験では、ゼロショット設定が大幅に改善された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:21:57 GMT)
Multi-component Causal Tracing in Large Language Models [36.1] 因果トレースは、大きな言語モデルの内部表現に介入する。
本稿では,複数のコンポーネントを同時に因果的にトレースする統合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:15:35 GMT)
Skill-RM: Unifying Heterogeneous Evaluation Criteria via Agent Skill [36.0] 本稿では、再利用可能なリワード評価スキルの実行として報酬モデリングを再構築する統合フレームワークであるスキル・リワードモデル(Skill-RM)を提案する。
報酬計算を構造化されたエージェントタスクとして扱うことで、Skill-RMは異種資源をオーケストレーションするための一貫したインターフェースを提供する。
以上の結果から,Skill-RMは報酬モデリングのための統一的なソリューションを提供するだけでなく,エビデンスを戦略的かつ動的にオーケストレーションすることで,優れたパフォーマンスを実現することが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:56:57 GMT)
3D Segment Anything Model with Visual Mamba for Diagnosing Placenta Accreta Spectrum [35.9] Placenta Accreta Spectrum (PAS) は珍しいが、非常に危険な産婦人科疾患である。
従来のPAS診断は、帝王切開の歴史とMRI(Magnetic Resonance Imaging)データを分析することによって、経験豊富な医師に依存している。
我々は,粒度の細かなセグメンテーションと分類アノテーションを含む最初のMRIベースのPASデータセットを構築した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:19:50 GMT)
Geometry-Guided Modeling of Foundation Features Enables Generalizable Object Shape Deformation Learning [35.9] 対象の観測値にマッチするカテゴリレベルの形状テンプレートを明示的に変形させることで、3Dオブジェクトを再構成する一般化可能な変形学習フレームワークを提案する。
提案手法は, 形状の多様性と多様な視点の取り扱いにおいて, 最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:37:36 GMT)
Reasoning Structure of Large Language Models [35.8] 論理パズルのスケーラブルな LRM ベンチマークと,非構造化トレースをクレームと依存関係の検証可能な推論グラフに変換するパイプラインを導入する。
この理論は、トポロジーを定量的に分析できる構造化された測定可能な対象へと変換される。
オープンソース推論モデルを用いた解析により, トークン数と精度を比較検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:49:19 GMT)
Intra-Modal Neighbors Never Lie: Rectifying Inter-Modal Noisy Correspondence via Graph-Based Intra-Modal Reasoning [35.8] 大規模ウェブハーベストデータセットは、クロスモーダル検索の進展を加速させているが、必然的にノイズ対応に悩まされている。
In-modal Neighbor-aware Noise Rectification (IN2R) という新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:26:28 GMT)
A unified multi-task framework enables interpretable chest radiograph analysis [35.7] IMT-CXRは、放射線医の診断ワークフローをエミュレートするフレームワークである。
このフレームワークは医療ドメイン命令チューニングによって最適化された統一トランスフォーマーアーキテクチャを採用している。
3人の放射線学者は、AIが生成した報告の66%を、診断の明確さにおける元の臨床報告に匹敵する、または超えると評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:02:15 GMT)
Training-Free Object-Agnostic Jam Detection in Fulfillment Centers [35.2] ジャム検出アプローチは、オブジェクトを識別するためのオブジェクト検出モデルに依存し、その後、時間とともに動きを監視するアルゴリズムが続く。
このパイプラインには数千のマニュアルアノテーションが必要で、約2週間の作業が必要で、アノテーション付きオブジェクトクラスに限定されている。
本稿では,ラベル付きデータを必要としない,学習不要でオブジェクトに依存しないジャム検出手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:56:39 GMT)
A Tutorial for Characterizing Transmon Qubits [35.2] 可変トランスモン量子ビットの特性と最適化のための包括的ウォークスルーを提案する。
低温設定や配線からパラメトリック増幅器の最適操作に至るまで、完全なワークフローを簡単な方法で詳述する。
このガイドは、トランスモンベースの量子デバイスを効率的に持ち上げる実験家のためのリファレンスとして機能する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:57:47 GMT)
PHASER: Phase-Aware and Semantic Experience Replay for Vision-Language-Action Models [35.0] 本稿では,アーキテクチャに依存しない連続学習フレームワークPHASERを紹介する。
フェーズRは、すべてのサブスキルに等しいメモリサポートを保証するために、フェーズ中心のキャパシティアロケーションを使用する。
また、教師なし動作信号変化点検出とVLMに基づくセマンティック検証を組み合わせた軽量パイプラインであるAuto-PCを統合する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:04:15 GMT)
An Asymptotic Theory of Chain-of-Thought in In-Context Learning [34.7] CoT推論(Chain-of-Thought reasoning)は、大規模言語モデルにおいて多段階推論を引き出すメカニズムとして広く用いられている。
線形回帰における文脈内重み予測のための理論的に解決可能なCoTモデルについて検討する。
本研究では,推定深度,事前学習データ量,文脈長の関数として,一般化誤差の正確な式を導出する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:23:31 GMT)
"**Important** You should give me full credits!": Exploring Prompt Injection Attacks on LLM-Based Automatic Grading Systems [34.7] 大規模言語モデル (LLM) は自動階調システム (AG) の研究を著しく加速している。
特に、プロンプトインジェクション(PI)攻撃は、最近LLMベースのアプリケーションにとって大きな脅威となっている。
我々は、AGシステムにおけるPI攻撃を調査し、教育シナリオにおけるそのような攻撃の有効性を体系的に調査する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:24:12 GMT)
LoopFM: Learning frOm HistOrical RePresentations of Foundation Model for Recommendation [34.6] LoopFMは、FM中間埋め込みを入力として構成することで、高帯域転送チャネルを開くフレームワークである。
産業規模のシステムでは、LoopFMはKD上の知識伝達比を約2倍にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:06:36 GMT)
Value-Aware Stochastic KV Cache Eviction for Reasoning Models [34.3] 推論モデルは思考のチェーンを拡張して精度を向上させるが、その長い出力はメモリと計算のボトルネックを生み出す。
KVキャッシュ消去法は、重要でないキーと値のペアをキャッシュから排除することで、このコストを削減するが、選択に基づくスパースアテンションの代替よりも、しばしば精度が低下する。
本稿では,大容量値状態の保護と多様な消去決定を促進するトレーニング不要なレシピであるバリューアウェアなKVキャッシュ消去(VaSE)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:16:33 GMT)
Ghost: Plausible Yet Unlearnable Trajectories via On-Manifold Substitution for Next-POI Privacy [34.1] チェックイントラジェクトリをリリースするパブリッシャは、ユーザの将来位置の強い予測器を不注意に公開する。
このリスクに対処するために、クリーンなテスト入力に対して次点次点(next-POI)の精度を低下させた被害者モデルを生成する、学習不能なトラジェクトリ、摂動シーケンスを生成する。
我々はGhostを提案する。Ghostは、摂動が人間のチェックインシーケンスのように見えるが、学習可能な信号は残っていない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:31:14 GMT)
Ask When It Pays: Cost-Aware Open-Ended Interaction for Instance Goal Navigation [33.9] インスタンスゴールナビゲーション(IGN)では、具体化されたエージェントが、不特定な自然言語記述からイントラクタ内の特定のインスタンスオブジェクトを見つける必要がある。
我々はIGNをコストに敏感な不確実性推論問題として再考する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:31:03 GMT)
Certifying coherence in quantum devices under classical control [33.7] 我々は、半定値プログラムの階層によってコヒーレンスが完全に特徴づけられることを証明した。
量子ビットの重要な特別な場合において、結合可測性の理論と概念的結びつきを利用する。
これらの手法を用いて、量子チャネルがコヒーレンスを保てるのか、それとも本質的にコヒーレンスを破っているのかを判定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:20:45 GMT)
UniCanvas: A Diffusion-base Unified Model for Text-in-Image Joint Generation [33.7] テキスト・イン・イメージ・ジェネレーションにより、拡散モデルを統一し、インターリーブされたマルチモーダルコンテンツを生成する試みを提案する。
個々のテキストトークンを生成する代わりに、モデルは言語を画像内の視覚的パターンとして表現することを学ぶ。
この設計により、画像合成中に1ピクセルのキャンバス内でテキストを自然に「描画」することができ、シームレスなマルチモーダル生成を実現することができる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:30:46 GMT)
Dynamic Objective Selection with Safeguards and LLM Oversight for Financial Decision-Making [33.6] DOSS(Dynamic Objective Selection with Safeguards)は,各時点における決定関連目的関数を直接選択する学習ベースのセレクタである。
DOSSは客観的選択を目的の分類問題として定式化し、ローリングウィンドウで逐次更新を行う。
ミスの選択とデプロイの過度な切り替えを軽減するため、DOSSはフェールセーフで信頼度を意識したゲーティングを適用し、低信頼の提案を保守的なデフォルトにオーバーライドし、スイッチング周波数に関連する明示的なコントロールを実行する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:22:07 GMT)
Tool-Aware Optimization with Entropy Guidance for Efficient Agentic Reinforcement Learning [33.6] 本稿では,ツール対応トラジェクトリフィルタとエントロピー誘導探索を併用したTAO-RLを提案する。
具体的には、TAO-RLはロールアウトトラジェクトリを2つの基準に沿ってフィルタリングする。
アルゴリズムレベルでは、ツール対応のエントロピー誘導ボーナスを導入し、ポストツールコールトークンのアドバンテージ機能を再評価し、より多様な推論経路を探索するようポリシーを奨励する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:16:12 GMT)
AirDreamer: Generalist Drone Navigation with World Models [33.1] 見えない、散らばった環境でドローンをナビゲートするには、見えないシーンレイアウトと環境構造を理解するための信頼性の高い一般化が必要である。
我々は、世界モデルに基づく環境理解の上に、強化学習に基づくポリシーでナビゲートするナビゲーションフレームワークを設計する。
シミュレーションや実際のドローンでは、複雑な、見えない環境をナビゲートし、ローカルなオプティマを逃れるための創発的な能力を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:15:13 GMT)
SocialCoach: Personalized Social Skill Learning with RL-based Agentic Tutoring and Practice [33.0] 交渉やリーダーシップといった社会的スキルは、今日の相互接続された世界での個人的および専門的な成功に不可欠である。
SocialCoachは、大規模にパーソナライズされたソーシャルスキル開発のための総合的なLLMによるエージェント・チューリングシステムである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:20:54 GMT)
Local Guidance, Global Impact: Gaussian-Reshaped Trust Region Unlocks Behavior Transitions [33.0] 本稿では,PPO (Proximal Policy Optimization) が連続的・非定常的環境において苦戦していることを示す。
本稿では,ガウスカーネルを用いて信頼領域を再設定するガウス信頼地域政策最適化(GTR)を提案する。
GTRはアーキテクチャに依存しず、ゲーム全体、シミュレーションロボット制御、オープンワールド探索、言語モデルポストトレーニングなど、強力なパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:26:26 GMT)
TreeFlash: Parallel AR-Approximation for Faster Speculative Decoding [32.8] 投機的復号化のためのワンショットブロックのドラフトは、1つのフォワードパスで完全なドラフトを生成する。
それぞれのドラフトトークンはプレフィックスコンテキストのみに条件付けされ、以前のドラフトトークンに依存しない。
この非自己回帰条件は、ドラフトの深さが大きくなるにつれて、検証者の真の自己回帰分布からドラフトの分布が分岐する。
そこで我々は,この問題に対処するために,プロダクタの隠蔽状態とそれ以前のトークンに条件付きレイヤを組み込んで,自己回帰分布を近似するTreeFlashを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:00:18 GMT)
Characterizing Detectability in 3DGS Poisoning: A Stage-wise Benchmark [32.4] Poison-3DGSは、3DGSにおける中毒検出の段階的評価のためのベンチマークである。
マルチビューイメージ、幾何学、トレーニングダイナミクス、ガウスパラメータなど、ステージ固有のアーティファクトをさまざまなシーンやアタックで公開している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:16:29 GMT)
Language Models Compare Quantities Using Number-specific and Unit-specific Heuristics [32.2] 110cmや1.2mといった測定単位の量は、数字と記号単位のスケールを組み合わせるために言語モデル(LM)を必要とする。
精度は比較境界付近で低下し、小さな値の変化で正解が決定される。
その結果、LMは、最初に両式を正確に共有スケールの表現に変換するのではなく、数字と単位よりも数字の袋を通して量を比較することが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:58:02 GMT)
Denoise First, Orthogonalize Later: Understanding Momentum in Muon via Spectral Filtering [32.2] ムオンの運動量はスペクトルフィルタとして作用することを示す。
摂動前の運動量を適用することは、この順序を逆転させるか、単に運動量を取り除くよりも、勾配の信号成分との配向を確実に強くする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:54:38 GMT)
Adaptive Causal Alignment for High-Confidence Adversarial Training [32.0] 逆対逆トレーニングは、高信頼の予測を利用して、堅牢な学習を安定させる。
セマンティック・エクイリビリウム(Semantic Equilibrium)を確立する統合フレームワークであるHICAT(High-Confidence Causally Aligned Training)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:14:54 GMT)
ChartArena: Benchmarking Chart Parsing across Languages, Scenarios, and Formats [31.6] 数値チャートと図形構造の両方にまたがる8つのチャートファミリをカバーする総合ベンチマークであるChartArenaを紹介する。
データセットは、アノテーションの信頼性を保証するために、マルチステージのヒューマン検証を備えたヒューマンエージェントアノテーションパイプラインを介して構築される。
i) Gemini 3.1 Proのようなフロンティアモデルが全体としてリードしているが、最も強力なオープンソースシステムは急速にギャップを埋めている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:49:48 GMT)
Using Reward Uncertainty to Induce Diverse Behaviour in Reinforcement Learning [31.4] 我々は、多様性は報酬の不確実性に対する合理的な応答としてより自然に理解されていると論じる。
本稿では,スカラー報酬を報酬関数上の分布に置き換えることで,RL目標の根本的な再構成を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:50:14 GMT)
PyraMathBench: Evaluating and Improving Mathematical Capability in Large Language Models [31.4] PyraMathBenchは7,404の数学語問題から32,505の質問を抽出した総合ベンチマークである。
実験の結果,LLMの性能は数値計算が不十分で,抽象的な数値問題に対する弱い処理によって著しく損なわれていることが明らかとなった。
本稿では,LLMの数値的相乗効果を高めるために,Smart Optimization & Learning-based VErsatile Module (SOLVE)とInteractive Relative Policy Optimization (IRPO)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:32:53 GMT)
Compress then Merge: From Multiple LoRAs into One Low-Rank Adapter [31.1] 我々は、$T$ LoRAsを1つのランクにマージする問題-$r$ LoRAについて研究する。
既存の-then-Compressパイプラインは、ランク制約を後付けとして扱う。
逆パイプラインであるCompress-then-Merge (CtM)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:42:46 GMT)
A Graph Foundation Model with Spectral Parsing and Prototype-Guided Spatial Propagation [30.9] グラフ基礎モデルは、さまざまなグラフから移行可能な知識を学習して、目に見えないグラフやタスクに一般化することを目的としている。
この課題は、特徴の相違と、より批判的には、多様なグラフ構造の両方から生じます。
既存のGFMは主に、特徴空間を統一したり、構造トークンや語彙を組み込んだりすることで転送性を向上させる。
スペクトル解析とプロトタイプ誘導空間伝搬を用いたグラフ基礎モデルであるSPGを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:27:03 GMT)
Bayesian Tensor Decomposition with Diffusion Model Prior [30.9] 本稿では,ハイブリッド・プライオリティのCP分解フレームワークであるDiffBCPを紹介する。
確率, 低ランク制約, 拡散前の結合性に拘わらず, 後部推論を抽出可能とする。
高解像度のアウト・オブ・ディストリビューション画像を含む画像の塗布とデノイングの実験は、一貫した利得を示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:13:42 GMT)
AgentCL: Toward Rigorous Evaluation of Continual Learning in Language Agents [30.8] 継続的な学習は、エージェントが一連のタスクに再利用可能な経験を蓄積し、時間とともに改善し、無関係な経験からの干渉を避けることを期待する。
ほとんどの取り組みは、長いコンテキストの会話やドキュメントに対する検索と推論に重点を置いているが、最近の長命適応ベンチマークは、しばしば単純なタスクストリームに依存している。
本稿では、制御されたタスクストリームと転送利得のメトリクスに着目した連続学習エージェントのための評価フレームワークAgentCLを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:07:54 GMT)
DLO-Lab: Benchmarking Deformable Linear Object Manipulations with Differentiable Physics [30.6] そこで本研究では,多目的DLO操作用に設計された微分可能シミュレータを提案する。
我々のシミュレーターは、拡張性、弾力性、曲げ塑性、複雑な相互作用を含む幅広い材料特性をモデル化する。
DLO操作の独特な課題を浮き彫りにする代表的なタスクのベンチマークスイートを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:49:44 GMT)
Representation Matters in Randomized Smoothing for Audio Classification [30.5] ランダム化滑らか化はガウスノイズが加わったベクトル空間におけるロバスト性を証明する。
キーワードスポッティング(キーワードスポッティング)と環境音分類(環境音分類)の2つの音響ベンチマークにおいて,波形,特徴空間,処理後の平滑化について検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:56:05 GMT)
BAHSD: Bridging the Long-tail Gap via Adaptive Distillation in Black-box Sequential Recommendation [30.0] マルチスケール整合性探索機構を用いて信号の不均一性を処理するブラックボックス適応蒸留フレームワークであるBAHSDを提案する。
BAHSDは一貫してベースラインを上回り、教師よりも最大4.98%向上し、テールユーザーでは80%以上改善されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:26:25 GMT)
Anatomy-Anchored Self-Supervision: Distilling Vision Foundation Models for Invariant Ultrasound Representation [29.6] 自己指導型事前訓練パラダイムは, 医用画像における伝達可能な表現の学習において, 優位性を高めている。
一般的な視覚領域から臨床的に有意な解剖構造へ表現学習を移行させる解剖学的アンコール超音波自己監督フレームワークANAUSを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:03:14 GMT)
X-Stream: Exploring MLLMs as Multiplexers for Multi-Stream Understanding [29.5] マルチストリームストリーミング理解に特化した最初のベンチマークであるX-Streamを紹介する。
厳格にキュレートされた4,220のQAペアを932ビデオにコンパイルし、X-Streamはマルチウィンドウ、マルチビュー、マルチデバイスシナリオで11のサブタスクを評価している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:49:53 GMT)
Text-attributed Graph Condensation via Text Selection and Attribute Matching [28.9] Text-Attributed Graph (TAG) はグラフ構造化データの重要なタイプであり、各ノードにテキスト記述がある。
トレーニング精度を維持しながらTAGを圧縮する凝縮法であるTAGSAMを提案する。
我々は,TAGSAMを6つの最先端ベースラインに対して評価し,優れた性能を示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:20:02 GMT)
I2PRef: Image-Driven Point Completion with Iterative Refinement [28.5] Image-to-Point (I2P)モジュールは、単一のRGBイメージから直接完全な点雲を再構成する。
トランスフォーマーベースのポイント・ツー・ポイント(P2P)精製モジュールは、粗いI2P出力を反復的に洗練する。
ShapeNet-ViPCの実験は、最先端の完成性能を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:11:48 GMT)
MIND: Multi-Scale Intent Diffusion for Text-Driven Physics-Based Humanoid Control [28.5] この知見に基づいて、テキスト駆動物理に基づくヒューマノイド制御のための新しいエンドツーエンド拡散フレームワークであるMINDを提案する。
MINDはマルチスケールなインテント拡散機構を導入し、全体論的インテント予測器がグローバルな振る舞いのダイナミクスをキャプチャする。
MINDはテキストコマンドからコヒーレントで、物理的に妥当で、意味的に整合したヒューマノイドの振る舞いを合成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:18:24 GMT)
DFlare: Scaling Up Draft Capacity for Block Diffusion Speculative Decoding [28.4] ブロック拡散復号法 LLM は、ブロック内の全てのトークンを同時に予測することで、推論を加速する。
モデルネームは、DFlashの狭い条件付けのボトルネックを、軽量なレイヤワイド・フュージョン機構によって引き起こします。
モデルネームはQwen3-4Bでは平均ウォールクロックの速度が5.52倍、Qwen3-8Bでは5.46倍、GPT-OSS-20Bでは3.91倍に達する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:18:31 GMT)
PixVOD: Pixel-Distributed Direct Visual Odometry and Depth Estimation [28.4] 我々は、高レベルの信号を局所的に合成し、下流の負荷を低減し、高レベルの視覚タスクに対してよりリッチな入力を提供するピクセルを想定する。
そこで本研究では,全画素にまたがるビジュアル・オドメトリーと深度推定の完全並列化方式を提案する。
提案手法は現実的なデータセットを用いて評価し,GBPに基づく画素レベルの分散計測と深度推定の実現可能性を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:22 GMT)
Video-Mirai: Autoregressive Video Diffusion Models Need Foresight [28.3] 因果ビデオジェネレータは過去から予測する必要があるが、そこからのみ学習する必要はない。
しかし、標準的な訓練は、それぞれの因果関係にのみ、現在を説明するよう要求する。
我々は、因果推論を変えることなく、このギャップを埋めるトレーニング専用手法であるVideo-Miraiを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:55:13 GMT)
UltraEP: Unleash MoE Training and Inference on Rack-Scale Nodes with Near-Optimal Load Balancing [28.3] 大規模MOEトレーニングとラックスケールノード(RSN)のプリフィルのための,最初の完全ロードリアルタイムバランサであるUltraEPを提案する。
RSNの拡張スケールアップ接続に基づいて構築されたUltraEPは、クリティカルパス上のすべてのマイクロバッチとレイヤを再バランスする。
トレーニングおよびプリフィルにおける106Bから671BパラメータのMoEモデルの平均値として、UltraEPは力バランスの理想的なスループットの94.3%を達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:07:51 GMT)
KC-3DGS: Kurtosis-Constrained Gaussian Splatting for High-Fidelity View Synthesis [28.1] 3D Gaussian Splatting(3DGS)は、シーンを差別化によって最適化された異方性ガウスのコレクションとして表現することで、リアルタイムなノベルビュー合成を可能にする。
標準画素空間損失(L1, SSIM)は、再構成エラーのみを集約し、周波数スケールでエラーを再分配する最適化を可能にする。
我々は,自然画像統計に基づくウェーブレットドメインによる3DGSトレーニングを強化するKC-3DGSを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:04:24 GMT)
Reinforcement Learning from Cross-domain Videos with Video Prediction Model [28.1] XIPERは、視覚的に異なる領域で収集されたエキスパートビデオから学ぶための報酬モデルである。
エージェントの観測結果を専門家ドメインにマッピングし、予測確率を報酬信号として使用する。
実験によると、XIPERはドメインのギャップにもかかわらず、一貫してベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:00:15 GMT)
Agentic Chain-of-Thought Steering for Efficient and Controllable LLM Reasoning [27.9] 大規模言語モデルは、拡張チェーン・オブ・ソート推論により最終回答精度を向上させる。
既存の効率的な推論手法は、トレースの短縮、早期停止、圧縮によって思考長を制御する。
本稿では,マルコフ決定過程の推論を定式化したACTS(Agenic Chain-of-Thought Steering)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:51:30 GMT)
Beyond Ideal Instruction: A Comprehensive Framework for Evaluating LLMs in Realistic Interactions [27.3] RUT-Benchは大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
我々はベンチマークを用いて、広く採用されている19のオープンソースおよびプロプライエタリなLCMについて包括的な評価を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:28:37 GMT)
Disentangling Visual and Factual Correctness in LVLMs' Visualization Literacy [27.3] LVLM(Large Vision-Language Models)は、強力な可視化解釈を示す。
それらの反応が、視覚的証拠に対する真の推論を反映しているか、訓練中に学んだ事実的先行を反映しているのかは不明である。
本稿では,視覚的正当性を事実的正当性から分離する枠組みを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:36:32 GMT)
SEA-NLI: Natural Language Inference as a Lens into Southeast Asian Cultural Understanding [27.2] 既存のNLIベンチマークは、主に西洋中心、翻訳由来、モノリンガルであり、文化的根拠に基づく推論を測定する能力を制限する。
我々は、英語と母国語で8つのSEA国をカバーする、ネイティブな文化的基盤を持つNLIベンチマークであるSEA-NLIを紹介し、母国語話者による検証を行った。
分析の結果,失敗事例はSEA適応モデルと文化意識の欠如が主な原因であり,CoTの促進は限られた利益をもたらすことがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:49:50 GMT)
Multilingual Unlearning in LLMs: Transfer, Dynamics, and Reversibility [27.1] 我々はTOFUベンチマークを5言語に拡張し,多言語アンラーニングについて検討した。
未学習の言語以外の言語で事実を“忘れる”能力である未学習のトランスファーが、非常に可変であることに気付きました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:55:52 GMT)
Efficient Transformer-Based Localized Patch Sampling for Choroid Plexus Segmentation in Multiple Sclerosis [26.8] 両側心室脈絡膜叢 (LVCP) は, 身体障害と神経炎症に関連する多発性硬化症 (MS) の指標として認識されている。
本研究の目的は,スタンドアロンおよびマルチモーダルMRI入力からMS内のLVCPを自動的に分割するSwinUNETR駆動パイプラインを開発することである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:32:43 GMT)
KletterMix: Climbing Toward High-Quality German Pretraining Data [26.7] KletterMixは、自然言語処理とモデリングコミュニティのための再利用可能なデータセットアーティファクトである。
最先端の英語事前学習コーパスをドイツ語に翻訳し、文書境界、メタデータ、ソース構造、トピックの多様性を保存して構築されている。
このデータセットは、翻訳品質、文書長分布、トピックカバレッジ、ソース合成、メタデータなど、幅広いコーパスレベルの分析によって文書化されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:28:15 GMT)
Building Reliable Long-Form Generation via Hallucination Rejection Sampling [26.7] 大規模言語モデル(LLM)は、オープンエンドテキスト生成において顕著な進歩を遂げてきたが、誤ったあるいはサポートされていないコンテンツを幻覚させる傾向にある。
我々は、Segment-wise HAllucination Rejection Smpling (SHARS) という、新しい推論時幻覚緩和フレームワークを提案する。
SHARSは任意の幻覚検出器を使用して、生成中の幻覚セグメントを識別および拒絶し、忠実な内容が生成されるまで再サンプリングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:26:17 GMT)
AI Agents Enable Adaptive Computer Worms [26.6] コンピュータワーム(英: computer worm)は、あるマシンから別のマシンに複製することでネットワーク上に拡散するマルウェアである。
ここでは、人工知能(AI)エージェントが、遭遇するターゲットごとに適切な攻撃戦略を生成するワームを可能にすることを示す。
このワームは、一般的な実世界の企業ネットワークの脆弱性を利用して伝播する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:54:39 GMT)
Recovering Diversity Without Losing Alignment: A DPO Recipe for Post-Trained LLMs [26.5] 我々は、異なる有効な回答モードを復元するためのオフラインDPOデータ構築パイプラインであるREDIPOを紹介した。
各プロンプトに対して、REDIPOは、ベースモデルとインストラクションモデルの両方からのレスポンスをサンプリングし、インストラクションモデルでベースモデルレスポンスを書き直し、安全性とインストラクションフォロー品質の候補をフィルタリングする。
Qwen3-4B、OLMo-3-7B、LLaMA-3.1-8Bの他、REDIPOはノベルティベンチのディファレンシャル_kを134%、33%、44%改善し、DivPOは多様性を0%、-6%、-4%改善した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:07:48 GMT)
Dive into the Scene: Breaking the Perceptual Bottleneck in Vision-Language Decision Making via Focus Plan Generation [26.4] Vision-LanguageとVision-Language-Action Models (VLMs & VLAs)は、異なる利点を持つ強力なツールである。
VLMは長期計画において優れているが、VLAはリアクティブ制御において優れている。
視覚幻覚は、モデルがタスク関連オブジェクトとイントラクタを区別できないために生じる。
原則として、無関係なオブジェクトをフィルタリングしながら、重要なオブジェクトを正確に識別し、焦点を合わせることが、この制限を破る鍵となる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:50:56 GMT)
Learning When Not to Act: Mitigating Tool Abuse in Agentic Reinforcement Learning [26.3] エージェント強化学習は、内部推論によって解決可能なクエリであっても、モデルが外部ツールを過剰に使用するツールの乱用を引き起こす可能性がある。
本稿では,効率的なエージェントポリシー最適化フレームワークEAPOを提案する。
GRPOと比較して、EAPOは平均パフォーマンスを10.45%、7.27%、9.69%改善し、平均ツールコールを18.33%、18.33%、および24.59%削減した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:53:40 GMT)
Optimal Transport Flow Matching by Design [26.3] フローマッチングモデルは、単純な事前分布から複雑なデータ分布へサンプルを輸送することを学ぶ。
我々は、事前を固定入力ではなく設計選択として扱うことで問題を再構築する。
本手法は,既存の流れマッチング法と比較して,軌道曲率を2倍以上削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:00:05 GMT)
\textsc{CR-Seg}: Attention-Guided and CoT-Enhanced Coarse-to-Refined Reasoning Segmentation [26.2] Reasoning segmentation は、複雑な言語で記述されたターゲットオブジェクトを視覚的・テキスト的推論によって分割することを目的としている。
既存の手法では、学習したセマンティックトークンを使ってMLLM(Multimodal Large Language Models)とセグメンテーションモデルをブリッジする。
本稿では,空間分割のための2段階フレームワークCR-Segを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:30:04 GMT)
GPU-Parallel Multi-Task Reinforcement Learning with Demonstration Guided Policy Optimization [26.2] 本稿では,構造化操作タスクファミリーをGPU並列マルチタスクRLベンチマークに変換する手法を提案する。
その結果得られたベンチマークは、異種タスクスイート上での同時強化学習をサポートする。
また,重み付きPPOと一致した実演行動における適応的行動クローニングを組み合わせた実演指導手法であるDGPOを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:43:42 GMT)
Taiji: Pareto Optimal Policy Optimization with Semantics-IDs Trade-off for Industrial LLM-Enhanced Recommendation [26.1] 大規模言語モデル(LLM)によるレコメンダシステムのスケーリングは、業界で顕著なトレンドとなっている。
本稿では,産業レコメンデーションシステム用に設計された新しいLLM-as-EnhancerフレームワークであるTaijiを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:39:06 GMT)
InfoMem: Training Long-Context Memory Agents with Answer-Conditioned Information Gain [26.1] 長いコンテキストタスクは、大きなコンテキストから回答関連情報を識別し保存するためにLLMを必要とする。
既存のRLベースのチャンクワイドエージェントは、スパースファイナルアンサー報酬に依存するか、メモリと検索アクションの語彙中間報酬を使用する。
本稿では,問合せ情報を用いた最終記憶ユーティリティの評価を行う,チャンクワイドメモリエージェントの学習のための報奨機構であるInfoMemを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:39:03 GMT)
NewtPhys: Do Foundation Models Understand Newtonian Physics? [25.9] これまでの研究は、合成シーンや半合成シーンを用いて基礎モデルの物理推論を評価してきた。
NewtPhysは物理地上シミュレーションによる現実世界のシーンのマルチビュー画像から構築された4Dの物理的アノテートデータセットである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:12 GMT)
SAMatcher: Co-Visibility Modeling with Segment Anything for Robust Feature Matching [25.8] 共可視性モデリングによる対応推定を定式化する特徴マッチングフレームワークであるSAMatcherを提案する。
双方向の特徴交換とクロスビューセマンティックアライメントを可能にする対称なクロスビューインタラクション機構を導入している。
本結果より, 単分子分割のための基礎モデルを多視点対応推論に効果的に拡張できることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:47:59 GMT)
A Matter of TASTE: Improving Coverage and Difficulty of Agent Benchmarks [25.7] ツール・シークエンス・エボリューションによるタスク・シンセサイザー(TASTE: Task Synthesis from Tool Sequence Evolution)を提案する。
TASTEはクラスタリングを通じてプールから代表シーケンスを選択し、それらを完全なベンチマークタスクにインスタンス化し、難易度進化を通じてそれらを洗練する。
以上の結果から,既存のベンチマークにおける高いスコアは,頑健なタスク解決能力よりも飽和度を反映していることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:20:59 GMT)
DiffUNet^2: Bidirectional Prediction, Probabilistic Generation and Collaborative Visual Discovery for Scientific Data [25.7] 時相進化は科学現象の分析と推論に重要である。
ほとんどの機械学習手法は、複数の妥当な結果を見渡す決定論的前方予測を提供する。
本稿では,拡散に基づく生成モデルとインタラクティブな視覚分析を統合し,科学的探索を行うフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:15:01 GMT)
Benchmarking LLM-as-a-Judge for Long-Form Output Evaluation [25.7] 大規模言語モデル(LLM)は、長文生成にますます使われている。
LLMs-as-a-judgeは、人間の評価に代わるスケーラブルな代替手段を提供する。
既存のメタ評価ベンチマークは、主にショートフォーム出力に焦点を当てている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:49:40 GMT)
Cesarean Scar Defect Segmentation in Transvaginal Ultrasound Images: a Dataset and Benchmark [25.6] CSD(Cesarean Scar Defect)は、帝王切開後の合併症の1つである。
経バジナル超音波CSDセグメンテーションのためのパブリックデータセットは存在しない。
この研究は、医用画像分割アルゴリズムの進歩と臨床革新を促進するための高品質なベンチマークリソースを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:06:25 GMT)
RMPrior: Bridging Propagation Priors and Diffusion Refinement for Efficient Radio Map Construction [25.4] 本論文は,中間段階のサンプリング戦略を通じて,伝播先行と拡散改善を橋渡しする。
IRT4HighResの実験は、$P_textstart=0.5$で、提案手法が2.01times$のスピードアップを達成することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:05:18 GMT)
TASE: Truncation-Aware Semantic Embeddings for 3D Scene Understanding and Editing [25.3] 高忠実なセマンティックな3Dシーン表現は、ロボット工学、自律運転、シミュレーションを含む多くのアプリケーションに不可欠である。
現在のアプローチでは、コントロール可能な編集を限定的にサポートしている。
本稿では,事前学習した2Dセマンティックな特徴をトランケーション対応の埋め込み空間に投影する手法であるTASEを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:25:53 GMT)
PRISM: Synergizing Vision Foundation Models via Self-organized Expert Specialization [25.2] モジュールの特殊化によるVFMの相乗化を実現する,新しい双方向Mixture-of-Experts (MoE) フレームワークである textbfPRISM を紹介する。
PASCAL-ContextとNYUD-v2の実験は、textbfPRISMが芸術の新たな状態を確立し、スパースで創発的な特殊化は多様な視覚知識を統合するためのスケーラブルなアプローチであることを証明している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:28:32 GMT)
BotDirector: Robot Storytelling Across the Symmetrical Reality with Multi-modal Interactions [25.2] 本研究では,ロボットによる対話型ストーリーテリングを支援する対話型システムを提案する。
子供たちは自分の物で遊び場を配置し、LLMエージェントで物語を作ります。
作成した物語は、地図とキャラクタに基づいて動きシーケンスに変換され、動きは自走する群れロボットによって実行される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:33:35 GMT)
EvoBrain: Continual Learning of EEG Foundation Models Across Heterogeneous BCI Tasks [24.8] EvoBrainは、統合されたEEGデコーディングのためのタスク対応連続学習フレームワークである。
これは2つの相補的なコンポーネントによる可塑性-安定性のトレードオフに対処する。
様々な基礎のバックボーンにまたがる最先端の手法を一貫して超越している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:16:16 GMT)
NBQ: Next-Best-Question for Dynamic Profiling [24.8] NBQは,様々な質問のプールをシードし,コンパクトで継続的に更新されたユーザ状態を維持できるプラグイン・アンド・プレイ・フレームワークである。
相互に互換性を持たなければならず、それぞれが自己記述と相互参照の両方の表現でモデル化されるような、相互マッチングのためのNBQをインスタンス化する。
実験の結果、NBQはAC@TとAR@Tで最大13.6%、AR@Tで14.0%、QuickMatchは最大22.9倍、リコールは最大0.989であることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:30:41 GMT)
Hint-Guided Diversified Policy Optimization for LLM Reasoning [24.7] Reinforcement Learning with Verifiable Rewards (RLVR)は、大規模言語モデルのための有望な強化戦略である。
本稿では,Hint-Guided Diversified Policy Optimization (HDPO)を提案する。
実験の結果,HDPOはLLM推論を効果的に促進し,候補解の多様性を高めることが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:55:54 GMT)
Revisiting Embodied Chain-of-Thought for Generalizable Robot Manipulation [24.5] CoT(Embodied chain-of- Thought)は、言語推論とロボット制御を橋渡しすることを目的としている。
現在までに最大規模のCoTコーパスを構築しており,978,743軌道,226.3Mサンプル,2592.5時間ロボットデータで構成されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:37:59 GMT)
TurtleAI: Benchmarking Multimodal Models for Visual Programming in Turtle Graphics [24.3] 視覚言語モデル(VLM)は視覚プログラミングのために研究され、視覚的タスクを解決するためのコードを生成する。
本稿では、Turtle Graphicsドメインの現実的なビジュアルプログラミングタスクに基づいて823のタスクをキュレートしたベンチマークであるTurtleAIを紹介する。
我々は, GPT-5, GPT-4o, Qwen2-VL-72Bを含む20以上のVLMを評価し, 成功率を30%以下に抑えるのに苦慮した。
得られた合成データに対する微細チューニングQwen2-VL-72Bにより, 改良が期待できるデータ生成手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:25:05 GMT)
FFR: Forward-Forward Learning for Regression [24.1] 我々はFFR(Forward-Forward for Regression)を提案し、FFを現実世界のレグレッションに拡張する最初のフレームワークである。
FFRは,(1)距離認識下での分割されたニューロン群間の競合学習と対照的なペアを置き換え,(2)浅い層が粗い順序の識別を学習し,より深い層が微細な回帰に洗練される階層化はしごアーキテクチャ,という3つの重要なイノベーションを導入している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:15:59 GMT)
DetectZoo: A Unified Toolkit for AI-Generated Content Detection Across Text, Audio, and Image Modalities [24.1] 生成モデルは、人間と機械生成物の区別を侵食した。
ほとんどの検出器は商用ソフトウェアか、オープンソースであれば、互換性のない事前処理、評価プロトコル、評価メトリクスが付属する。
我々は、AI生成コンテンツ検出のための統一インターフェースを提供するために設計された、第一級ツールキットであるDetectZooを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:49:20 GMT)
Beyond "To whom it may concern": Tailoring Machine Translation to Audience and Intent [24.0] 目的駆動型MTを50言語、5モデルサイズ、8テキストドメインで体系的に評価する。
明示的な指示は翻訳適応性を著しく改善し、非公式なドメイン(会話、ソーシャルメディア)に大きな利益をもたらすことがわかった。
目的適応型MTはLLMの実用的で測定可能な能力であり,目的対応のメトリクスの必要性を強調した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:23:01 GMT)
SAGE: A Quantitative Evaluation of Socialized Evolution in Agent Ecosystems [23.8] SAGE(Social Agent Group Evolution)は,2つの計算条件を比較した評価フレームワークである。
群の歴史は普遍的な増幅器ではなく、最強のエージェントは自己進化の天井を超えない。
競合する環境では、カウンターファクトコントロールは、エージェントが相手固有の戦略を開発するよりも一般的に改善することを明らかにする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:08:38 GMT)
When Does Latent Reasoning Help? MeRa: Metric-Space Bias for Spatial Prediction [23.6] 潜在推論は、修正されていないベースラインの下の空間予測を劣化させる。
MeRa(Metric-space Reasoning)は軽量なバックボーン非依存モジュールである。
距離空間制約推論が一意の固定点に収束し、N-ステップ推論が(N-1)-ステップ推論よりも厳密に表現可能であることを証明する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:47:30 GMT)
MARS: Multi-rate Aggregation of Recency Signals for Sequential Recommendation across Sparse and Dense Regimes [23.6] 我々は,実時間スタンプを消費し,K要約を生成するエンコーダに依存しないアグリゲーション演算子MARSを提案する。
火星は、スパースデータのMARS-T(Transformer)と密度データのMARS-M(Mamba)の2つのエンコーダインスタンスを自動的に選択することで、データ密度に適応する。
統一されたRecBoleプロトコルの下で10のTransformerとMambaベースのベースラインに対する5つの公開ベンチマークで、MARSはすべてのベンチマークで最高のHR@10を達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:39:19 GMT)
Message Tuning Outshines Graph Prompt Tuning: A Prismatic Space Perspective [23.4] Graph Foundation Models (GFMs) はグラフ学習のホットスポットとして登場した。
最近の手法では、グラフプロンプトチューニングがなぜ機能するのかが説明されているが、その適応能力を厳密に測定する方法は未解決の問題である。
GNNバックボーンの各レイヤに,学習可能なメッセージプロトタイプを少量注入する,ライトウェイトなアプローチであるMessage Tuning for GFM(MTG)を導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:52:54 GMT)
Fast Organic Crystal Structure Prediction with Unit Cell Flow Matching [23.4] 有機結晶構造予測(CSP)は、有機固体の計算モデリングの要件である。
OXtalのような生成モデルは、安定な有機結晶構造を直接サンプリングすることで、このコストを劇的に削減する。
しかしながら、OXtalは、高価な三角形の層を持つバルク材料の大作物をモデル化することを好んで、明示的な格子パラメトリゼーションを行う。
冗長性のない単位セルを生成する大規模フローマッチングモデルであるClariを用いて,これを数秒に短縮する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:58:40 GMT)
Don't Forget Your Embeddings: Robust Knowledge Erasure via Precise Editing of Embeddings [23.3] EMBedding ERasure (EMBER) は,Sparse Matrix Factorization を利用してトークン埋め込みから概念関連機能を正確に消去するプラグイン-n-play消去モジュールである。
EMBERによる既存手法の拡張により,タスクフォーマット間の消去効率と特異性が向上し,コヒーレンス損失が最小となることがわかった。
我々の研究は、ロバストな概念消去には正確な埋め込みレベルの介入が必要であることを証明し、既存の方法がそのような拡張の恩恵を受けることを実証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:15:25 GMT)
Attend to Anything: Foundation Model for Unified Human Attention Modeling [23.2] 我々は、様々な画像、ビデオ、音声・視覚的タスク、シーン間で注目モデリングを統合するマルチモーダル基盤モデルであるAttend to Anything Model (AAM)を提示する。
AAMは、ハイパボリック空間に階層的な埋め込みを持つ言語プロンプトを通じて実装された、一般から特定の階層で組織された認知的包含関係として、注意を再構築する。
16のベンチマークの実験では、AAMは様々なシナリオで平均6%の最先端メソッドを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:00:21 GMT)
POLARIS: Guiding Small Models to Write Long Stories [23.1] 小さなオープンウェイトモデルは、長文のクリエイティブな執筆に苦労します。
本稿では,2つの重要な成分を持つ低コンプットGRPO法であるPOLARISについて述べる。
盲目の人間による評価では、POLARIS-9BがQwen3.5-9Bのベースより好まれ、Qwen3.5-27Bと同等であることが確認されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:00:07 GMT)
ASymPO: Asymmetric-Scale Policy Optimization for Asynchronous LLM Post-Training Without Behavior Information [23.1] 非同期強化学習は、ポリシー最適化から応答生成を分離することで、言語モデル後学習のスループットを向上させることができる。
標準的な行動補正法は、行動政治の確率、重要度、またはクリップによってこのドリフトを制御する。
本稿では,各応答のトークン損失を,現在の平均トークン負の対数確率で正規化する非対称スケールポリシー最適化(ASymPO)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:00:34 GMT)
SaliMory: Orchestrating Cognitive Memory for Conversational Agents [22.8] SALIMORYは、認知的に構造化されたメモリスパンニングされたユーザファクト、好み、ワーキングメモリを管理するために単一の言語モデルをトレーニングするフレームワークである。
メモリ分散障害を3分の1削減し、エンドツーエンドの精度で最先端を10%以上上回り、良質なパーソナライゼーション率を2倍以上に向上させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:31:50 GMT)
LiftQuant: Continuous Bit-Width LLM via Dimensional Lifting and Projection [22.6] 連続的なビット幅制御のための新しいフレームワークLiftQuantを紹介する。
中心となる革新は、低次元の重みベクトルを近似する「リフト・then-project」機構である。
LiftQuantの復号経路は、線形変換と1ビットの一様量子化器にのみ依存する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:52:04 GMT)
CP-Agent: Context-Aware Multimodal Reasoning for Cellular Morphological Profiling under Chemical Perturbations [22.4] セルペイントは、多重蛍光染色、高濃度イメージング、定量的解析を組み合わせて、高次元の表現型読み出しを生成する。
CP-Agentは、薬物摂動下での細胞形態変化に対して、機構関連で人間解釈可能な有理性を生成する。
CP-CLIP出力をエージェントツールの使用と推論と統合することにより、CP-Agentは論理を構造化されたレポートにコンパイルし、実験的な設計と仮説の洗練を導く。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:20:00 GMT)
Generative AI-Enabled Refund Fraud in Chinese E-Commerce: Investigation on Merchants and Platform Workers [22.3] 電子商取引紛争解決は典型的には、デジタル証拠が物理的現実を真に反映しているという仮定に依存している。
生成AI(GenAI)はこの脅威モデルを無効化し、攻撃者は無視可能なコストで製品欠陥の超現実的な証拠を作成できる。
我々は、取引・紛争・物流・通信の4つのGenAI対応脅威ベクトルの分類を概説する。
われわれはこれらの防衛策の採用を妨げるいくつかの課題を見出した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:20:25 GMT)
A Cookbook of 3D Vision: Data, Learning Paradigms, and Application [22.1] 3Dビジョンは、ますます多様なデータ表現、学習パラダイム、モデリング戦略によって、急速に進化してきた。
この研究は、幾何学的表現、データセット、学習フレームワーク、アプリケーションを単一の概念マップ内に接続する3Dビジョンのデータ中心の分類を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:41:52 GMT)
GroupToM-Bench: Benchmarking Group Theory of Mind and Nonlinear Social Emergence in MLLMs [22.0] 我々は、グループレベルの心の理論(ToM)推論のための最初のマルチモーダルベンチマークであるGroupToM-Benchを紹介する。
マイクロレベルのBDI状態(理解、欲求、意図)、メソレベルのグループ張力と構造的制約、マクロレベルの結果予測と帰属にまたがる因果連鎖を中心に構築する。
実験は、現在のモデルと人間のベースラインのギャップを明らかにし、社会構造と非線形集団力学を処理できないことを明らかにする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:06:32 GMT)
Sparse Mixture-of-Experts Reward Models Learn Interpretable and Specialized Experts for Personalized Preference Modeling [21.9] 本稿では、スパースルーティングとエキスパートの多様性を促進するため、スパース・ミックス・オブ・エクササイズ(MoE)報酬モデルを提案する。
MoEは、制御された実世界の実験を通して、解釈可能なルーティングパターンと専門の専門家を学ぶ。
また、テストタイムのパーソナライズも改善され、専門家の体重に対する後適応シフトは、モデルがパーソナライズされた好みにどのように適応するかを分析するための質的なレンズを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:19:12 GMT)
When Seeing Is Not Believing -- A Benchmark for Search-Grounded Video Misinformation Detection [21.9] EVID-Benchは、ビデオ誤情報検出のためのベンチマークである。
AI生成、シングルソース編集、マルチソース編集の3つのカテゴリにまたがる9つの操作タイプにまたがる222のビデオで構成されている。
最良のシステムは61.43%のポイントレベルの精度と43.24%のビデオレベルの精度しか達成していないが、AI生成による操作は特に困難である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:03:35 GMT)
SketchSong: Hierarchical Song Generation with Sketch Planning and Fine-Grained Multi-Track Modeling [21.9] SketchSongは階層的な曲生成フレームワークで、曲レベルのスケッチ計画ときめ細かいマルチトラックモデリングを通じて問題に対処する。
トラックディメンションに沿って、SketchSongはボーカル、ベース、ドラム、その他の楽器の4つのトラックを明示的にモデル化している。
楽曲生成ベンチマークの実験では、SketchSongは客観的な測定値と人間の聴取テストの両方でベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:27:56 GMT)
On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters [21.8] 強共有基盤モデル上で, 学習可能な小型アダプタを永続的局所状態として研究する。
スケールアップ(Scale Up)、スケールダウン(Scale Down)、スケールアウト(Scale Out)という3つのスケーリング軸に関する問題を整理します。
その結果,PEFTは永続的個人モデルのためのコンパクトな基板であることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:03:24 GMT)
Partially Observable Adversarial Patch Attacks on Vision-Language-Action Models in Robotics [21.8] ヴィジュアル・ランゲージ・アクション(VLA)モデルはロボット工学において注目を集めているが、敵の攻撃に対するロバスト性はほとんど解明されていない。
部分的に観測可能な脅威モデルを定式化し、敵は軌跡の短いプレフィックスのみを利用でき、その後の全てのフレームに適用する固定パッチを生成する。
まず、モデルの注意マップを用いてパッチをローカライズし、フルインストラクションに対応する視覚的に重要な領域を特定する。
次に,対象対象物のセマンティックグラウンドを乱すパッチを最適化し,動作軌跡の曲率を増加させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:19:28 GMT)
Long-Term and Short-Term Transistor Aging in Deep Neural Networks: Impact and Mitigation [21.8] ディープニューラルネットワーク(DNN)は、画像分類や音声認識など、さまざまな現実世界のアプリケーションで使用されている。
本章では,DNN推定精度に及ぼす長期および短期トランジスタ時効の影響について詳細に考察する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:33:07 GMT)
Semantic Constraint Synthesis for Adaptive Trajectory Optimization via Large Language Models [21.3] 軌道最適化は、宇宙探査において安全かつ信頼性の高い自律的な操作を可能にする重要な要素である。
本稿では,大規模言語モデル(LLM)を利用して,ミッション要求の自然言語記述を翻訳するフレームワークを提案する。
宇宙船ランデブーのシナリオにおける実験は、セマンティックミッションの要求から凸軌道最適化問題をリコンディションする上で高い成功率を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:33:38 GMT)
Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking [21.3] 我々は,GPT方式のトランスフォーマーであるHumanoid-GPTを紹介した。
Humanoid-GPTは、2Bフレームの再ターゲットコーパスで事前トレーニングされている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:05 GMT)
PhotoCraft: Agentic Reasoning with Hierarchical Self-Evolving Memory for Deep Image Search [21.3] PhotoCraftは、フォト検索エージェントのためのトレーニング不要で階層的なメモリシステムである。
人間の認知にインスパイアされたPhotoCraftは、MLLMに作業、エピソード、セマンティックメモリを装備する。
DISBenchの実験では、PhotoCraftはさまざまなMLLMバックボーン間のコンテキスト認識検索を一貫して改善している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:38:44 GMT)
Uncertainty-Aware Clarification in LLM Agents with Information Gain [21.1] LLM(Large Language Model)エージェントは、しばしば不特定ユーザ命令を操作する。
本稿では,あいまいさの解消と明確化行動の整合性を考慮した目標指向の明確化フレームワークを提案する。
我々は、この報酬を使って、高い情報ゲインを最適化するためにクラリファイア(LLM)を訓練する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:23:59 GMT)
HARVE: Hacking-Aware Reward-Head Vector Editing for Robust Reward Models [21.1] リワードモデルは、大きな言語モデル(LLM)アライメントの中心であるが、ハックに対する報酬には弱いままである。
HarVEはスカラー報酬モデルのためのトレーニング不要報酬ヘッド編集手法である。
実験により、モデルはハッキングの堅牢性を改善し、微調整ベースラインを上回り、報酬モデルの汎用能力を保っていることが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:18:08 GMT)
Bregman meets Lévy: Stochastic mirror descent with heavy-tailed noise in continuous and discrete time [20.9] 重み付き雑音下でのミラー降下(SMD)のロバスト性について検討した。
Lévy mirror flow (LMF) は $mathcalO(-p/(p-1))$ time 内で$$optimality を達成することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:23:04 GMT)
DeskCraft: Benchmarking Desktop Agents on Professional Workflows and Human-in-the-Loop Collaboration [20.9] DeskCraftはGUIベンチマークで、長い水平方向の創造性とエンジニアリングと積極的な人間とエージェントのコラボレーションをターゲットにしている。
タスクを多段階の難易度分類に編成し、長い水平方向タスクは50以上の実行ステップを必要とする。
それは、人間とエージェントのコラボレーションを、ミッドターンとポストターンの交換をカバーするインタラクションプロトコルにフォーマル化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:42:34 GMT)
FGRPO: Federated GRPO with Adaptive Aggregation on Non-IID Data [20.6] グループ相対ポリシー最適化(GRPO)は、批判ネットワークを排除し、優れたスケーラビリティを提供する。
我々は、不均一なデータ所有者間での推論モデルの微調整を分散化するためのフレームワークである、フェデレートされたGRPOを紹介した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:32:32 GMT)
EntSQL: A Benchmark for Grounding Text-to-SQL in Long-Context Enterprise Knowledge [20.6] Spider、BIRD、Spider2.0といった既存のベンチマークでは、スキーマの一般化、大規模データベース、現実性を評価している。
エンタープライズ指向のテキスト・ツー・プライベート・ベンチマークであるEntを紹介した。
英語の入力では、最も優れた評価システムは、長文の文書が提供されるときの15.9%にしか達しない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:12:57 GMT)
The Geometry of LLM-as-Judge: Why Inter-LLM Consensus Is Not Human Alignment [20.4] LMs-as-judgesは現在標準となっているが、審査員は互いに強く同意する一方で、人間にしか同意しない。
標準LLM-as-judgeスタック上の4つの幾何量を測定することで、共有信号や共有バイアスを反映するかどうかを検証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:26:18 GMT)
When Graph Tokens Sink: A Mechanistic Analysis of Graph Language Models [20.4] 我々は,Large Language Models (LLMs) がグラフ処理の振る舞いを通じてグラフ情報をどのように処理するかを分析する。
GLMにおけるグラフトークン内部の正当性は,グラフ情報の利用と等価ではない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:34:01 GMT)
DECA: Decentralizing Block-Wise Adam for Efficient LLM Full-Parameter Fine-Tuning on Non-IID Data [20.2] 大規模言語モデルの分散微調整は、プライバシに敏感な環境では難しい。
非IIDデータに基づくLLMのための資源効率の高い分散FPFTフレームワークであるDECAを提案する。
我々は,DECAが高速収束,ダウンストリーム性能,資源効率の大幅な向上を実現していることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:08:31 GMT)
When Autoregressive Consistency Hurts Safety Alignment [20.1] 自動回帰一貫性は、初期トークンのアライメント更新に集中できることを示す。
同じメカニズムは、大規模言語モデルに対するより広範な攻撃のクラスを予測する。
最悪の有害な継続状態に基づく初期枠組みである敵の安全アライメントを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:32:23 GMT)
AUDITFLOW: Executable Symbolic Environments for Structured Financial Reporting Verification [19.9] AuditFlowは、アダプティブ検索と検証を分離するグラフグラウンドのマルチエージェントフレームワークである。
2人の若手監査官が各事件を規制及び明確な見解から検査し、上級監査官が意見の相違を解消し、さらなる調査を要求することができる。
最終報告は、明らかな集計を通じて融合され、監査の評決、期待値、エビデンス・トレイル、スコアを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:14:42 GMT)
FCUS-rPPG: A Fast-Converging Unsupervised Framework for Remote Photoplethysmography via Gradient Oscillation Suppression [19.9] Photoplethysmography (rmography) は、一般向けカメラを用いた非接触血液量パルス(BVP)信号の抽出を可能にする。
FCUS-r は強力な一般化能力を持つ高速収束型教師なし r フレームワークである。
FCUS-rは、クロスデータセット性能の最先端評価を一貫して達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:33:27 GMT)
Inverting the Generation Process of Denoising Diffusion Implicit Models: Empirical Evaluation and a Novel Method [19.7] 本稿では,DDIM画像生成過程を逆転して潜伏変数を復元する問題について検討する。
既存の手法は、このタスクでしばしば正確さに苦しむ。
そこで本研究では,第1段階の勾配勾配降下による直接反転と,第2段階の固定点法を併用した新しいハイブリッド手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:56:16 GMT)
Calibration Data Trade-offs Across Capability Dimensions: Why Multi-Source Mixing Matters for High-Sparsity LLM Pruning [19.7] 訓練後のプルーニングは、小さな未ラベルキャリブレーションセットを使用して、大きな言語モデルを高い疎度に圧縮する。
本稿では,情報誘導型自己校正プロトコルIGSPを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:38:14 GMT)
20 Second Parity Lifetime in an InAs--Pb Tetron Device [19.7] トポロジカル量子コンピューティングにおける中心的な約束は、励起ギャップの増加がデバイスの性能を大幅に向上させることである。
ここでは,InAs-Pbテトロンデバイスにおいて,この原理を干渉式単発パリティ測定により実験的に検証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:50:09 GMT)
Memory Retrieval for Changing Preferences [19.5] 本稿では、メモリアクセスと選択のための統一的なフレームワークを提案する。
ベイズ係数を用いて各メモリターンの有効性を定量化する。
提案手法は,長いコンテキスト,嗜好集約的なタスクにおいて,既存の埋め込みベースの検索よりも優れる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:29:12 GMT)
Proof-Refactor: Refactoring Generated Formal Proofs into Modular Artifacts [19.5] このギャップは,ほとんどのエビデンス生成パイプラインにおいて,コンパイル優先の目的が暗黙的であることに起因している,と我々は主張する。
本稿では,人間の証明リファクタリングに触発されたプロセス誘導アプローチを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:56:10 GMT)
KODA: Contrastive Representation Comparison and Alignment for Vision-Language Foundation Models [19.0] コントラスト表現比較とアライメントのためのカーネルベースのフレームワーク。
ランダムプロジェクションを用いた関節核のランダム化低次元近似を開発した。
経験的に、KODAは視覚言語表現間の一貫性と解釈可能な相違構造を識別する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:47:41 GMT)
RL Excursions during Pre-Training: Re-examining Policy Optimization for LLM training [18.9] RLは非常に早期に有効であることが分かっており、SFT$to$RLパイプラインと早期にマッチすることが多い。
ベースチェックポイントに直接RLを適用すると、モデルの分布が拡大する。
モデル全体の能力は基本的にRLによって変わらず、SFTの後に劣化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:55:18 GMT)
SimuScene: Simulation-Ready Compositional 3D Scene Reconstruction from a Single Image [18.9] 物理を形状とレイアウト推定のループに配置する構成的3次元再構成パイプラインであるSimuSceneを紹介する。
重力下で再構成された物体を診断的にシミュレートすることにより、浸透と故障を定量的な補正信号に変換する。
この物理インフォームドフィードバックループは、蓄積した再構成誤差を軽減し、安定したシミュレーション可能なシーンを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:59:59 GMT)
Equivariant Latent Alignment via Flow Matching under Group Symmetries [18.7] 同変表現学習は、解析的に知られた群変換が直接作用する潜在空間を構築するための強力なフレームワークとして登場した。
既存のアプローチは、意図された群アクションと実際に必要となるラテント空間の変換との相違である潜在的不整合にしばしば悩まされる。
フローベースのフレームワークであるResidual Latent Flowを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:56:56 GMT)
Safety Measurements for Fine-tuned LLMs Should be Grounded in Capability [18.6] モデル行動に及ぼす微調整の影響の多次元的評価を行う。
その結果,(1) 微調整モデルでは, 安全性向上に反応して不整合世代を生成可能であること,(2) 自動的安全判断は不整合出力には信頼できないこと,(3) 微調整の効果に関する結論は, 安全性評価と安全基準の選択によって変化しうる,という重要な課題が浮き彫りとなった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:39:17 GMT)
Denoising Tells When to Replan: Denoising-Variance Adaptive Chunking for Flow-Based Robot Policies [18.5] アクションチャンキングはフローベースのロボットポリシーの一般的な推論戦略となっている。
本研究では,予測チャンクから実行すべきアクション数を適応的に決定するテストタイム手法であるDVACを提案する。
LIBERO、RoboTwin、CALVIN、および実世界の操作実験により、DVACはスケジュール変更頻度を減らしながらタスク成功を改善することが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:26:32 GMT)
A Geometric View of Counterfactual Behavior: Interaction of Boundary Proximity and Local Support [18.4] 対実的な説明は、モデルの予測を変える入力に意味論的に意味のある小さな変化を求める。
同様の予測性能を持つモデルは、そのような変化が達成可能かどうかで大きく異なる可能性がある。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:55:29 GMT)
Resource-Constrained Adaptive Inference for Sequential Pricing [17.8] リソース制約のある価格制御器は固定価格推論を不可能にすることができる。
実現可能なターゲットバンドを認証し、連続的な局所密度を記録できるターゲット認識型価格制御器を開発した。
結果として生じた後悔と情報の説明は、パイロットのリゾルディングエラーに繋がる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:52:46 GMT)
The Impact of Configuring Agentic AI Coding Tools on Build-vs-Buy Decisions: A Study Protocol [17.7] エージェントAIコーディングツールは、自律性を高めてコードを書き、ライブラリのインポート時期と機能をスクラッチから実装するタイミングを決定する。
エージェントAIコーディングツールにおけるビルド逆購入決定の制御について、制御された実験的研究は行われていない。
我々は、Claude CodeとOpenAI Codexという2つの一般的なエージェントAIコーディングツールにおいて、構成機構がビルド対購入動作をどのように変化させるかを研究するための事前登録されたプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:01:28 GMT)
Perceive Before Reasoning: A Pre-Reasoning Perception Framework for Efficient and Reliable Proactive Mobile Agents [17.7] 推論の前に知覚に基づく2段階のフレームワークであるtextbf Pre-Reasoning Perception Framework (PRPF) を提案する。
PRPFは、介入ゲーティングとコンテキスト圧縮のための軽量なMultimodal Proactive Perceptor (MPP)を導入し、介入が保証された場合にのみProactive Agent Reasoner (PAR)を起動する。
ProactiveMobileベンチマークの実験では、PRPFは成功率(SR)とProactiveMobileベースラインでの推論効率を改善しつつ、偽トリガレート(FTR)を大幅に低減することが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:54:02 GMT)
Multi-Modal Graph Neural Network with Transformer-Guided Adaptive Diffusion for Preclinical Alzheimer Classification [17.7] 下流変換器を用いて各ノードにおける拡散過程を導出する統合フレームワークを提案する。
本モデルはアルツハイマー病の前臨床段階と密接に関連している主要なROIを十分に同定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:32:29 GMT)
Follow-Your-Preference++: Rethinking Preference Alignment for Image Inpainting [17.6] 我々は、広く使われている直接選好最適化フレームワークを採用し、一般公開された報奨モデルを用いた選好学習データを構築した。
報酬モデルの単純なアンサンブルはそのようなバイアスを緩和し、堅牢で一般化可能な性能をもたらす。
我々のモデルは、標準メトリクス、大規模視覚言語モデル評価、人的評価において、最先端のモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:22:07 GMT)
Large Language Models Are Overconfident in Their Own Responses [17.6] 学習後アルゴリズムとチャットフォーマットの効果を分離することにより,この誤判定を誘発するメカニズムについて検討する。
指導指導が校正を根本的に損なう一方で、チャットテンプレートは「オーナーシップバイアス」によって問題を悪化させることがわかった。
本稿では,信頼度誘導時のユーザ入力としてモデルの解答をフレーミングする,シンプルな推論時戦略を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:20:56 GMT)
DDOR: Delta Debugging for Explainable Overrefusal Testing and Repair [17.6] DDOR(Delta for OverRefusal)は、オーバーリフレッシュテストと修復のための、完全に自動化され、説明可能なフレームワークである。
デルタデバッグを適用して最小限の拒絶トリガーフラグメント(mRTF)をローカライズする。
スケーラブルでモデル固有のオーバーリフレクションテストスイート(モデル毎に約1Kケース)を生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:07:12 GMT)
AnyAudio-Judge: A Dynamic Rubric-Based Benchmark and Evaluator for Audio Instruction Following [17.5] 本稿では,複雑な音声キャプションを可変個の独立した検証可能なバイナリルーブリックアイテムに適応的に分解する動的ルーブリック評価パラダイムを提案する。
我々はこの能力をAnyAudio-Judge Benchでベンチマークする。
実験により、AnyAudio-Judgeは、最先端のベースラインに比べて、ゼロショットアライメントの検出を著しく向上する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:00:32 GMT)
ContinuousBench: Can Differentially Private Synthetic Text Improve Capabilities? [17.4] ContinuousBenchは、差分プライベート(DP)テキスト合成から得られる能力を測定する。
Geminonは、架空の生物に関する手続き的に生成されたデータセットで、Newsは、新しくクロールされたニュース記事のストリームだ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:54:59 GMT)
EaDex: A Cross-Embodiment Dexterous Manipulation Framework from Low-Cost Demonstrations [17.3] 本稿では,低コストな実演環境下でのマルチエンボディメント・デクスタラスな操作学習フレームワークであるEaDexを提案する。
データレベルでは、EaDexは1台のRGB-Dカメラだけで人間の手の動きをキャプチャする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:35:18 GMT)
EvoDS: Self-Evolving Autonomous Data Science Agent with Skill Learning and Context Management [17.0] EvoDSは自己進化型の自律データサイエンスエージェントで、そのスキルを拡張し、長期的なコンテキストを適応的に管理することを学ぶ。
EvoDSは4つの異なるベンチマークで、最先端のオープンソースデータサイエンスエージェントを平均28.9%上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:20:58 GMT)
NVIDIA Isaac Sim: Enabling Scalable, GPU-Accelerated Simulation for Robotics [17.0] この調査はNVIDIA Isaac Simをシステムとアプリケーションの観点からレビューし、アーキテクチャの概要と広く使われているシミュレータと比較する。
我々は5つの主要領域にわたる研究を分析し、特にデータ生成と高忠実度シミュレーションにおける一般的な利用パターンを要約する。
また、物理のオープンワールド学習、シミュレーション中心のトレーニング、実用的なユーザビリティ制約など、今後の重要な方向性と課題についても概説する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:12:27 GMT)
SLU-2K: A Question-Based Benchmark for Semantic Evaluation of Sign Language Translation [16.8] 我々は手話翻訳(SLT)から手話理解(SLU)へ焦点を移す
入力ビデオから元の文のキーセマンティックな側面を正確に復元する能力に基づいてシステムを評価する。
MLLM(Multimodal Large Language Models)と2つの最先端システムであるMMSTLとSpaMoを評価し,SLU-2Kの可能性を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:39:33 GMT)
Hallucination Detection-Guided Preference Optimization for Clinical Summarization [16.8] 幻覚は、専門の医療応用における信頼性を制限する、サポートされていない、または誤った声明である。
本稿では,幻覚検出装置を利用した実写修正に向けての要約リビジョンを導出する推測時間手法であるHDSRを紹介する。
そこで我々は,HDSR for Preference Learning (HDSR-PL)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:32:14 GMT)
Extending AI for Research to the Humanities: A Multi-Agent Framework for Evidence-Grounded Scholarship [16.7] SPIRE(Scholarly-Primitives-Inspired Research Engine)は、エビデンスに基づく人文科学研究のためのマルチエージェントフレームワークである。
複数スケールのクローズドリーダー基板上での協調エージェントの役割として、人文操作を繰り返す。
答えの正確性、深さ、カバレッジ、証拠の質について、より高いブラインド・ジャッジスコアが与えられる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:42:24 GMT)
Small RL Controller, Large Language Model: RL-Guided Adaptive Sampling for Test-Time Scaling [16.7] 適応サンプリングをマルコフ決定過程(MDP)として定式化する。
我々は、回答の正しさ、レイテンシ、コストを両立させるために、強化学習(RL)を備えた軽量サンプリングコントローラを訓練する。
提案手法は,最終回答の統計にのみ依存する軽量で,CPU上でのトレーニングやデプロイが可能である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:42:04 GMT)
Learning to Solve, Forgetting to Retain: Correct-Set Turnover in RLVR [16.7] 検証可能な報酬(RLVR)による強化学習は、大きな言語モデルの能力を向上させるが、見出し精度の向上は隠れたコストを隠蔽することが多い。
我々は、マスタされたプロンプトを追跡し、それを定期的に再導入して、過去のソリューションのモデルをtextbfremindに再導入するリテンション対応レビューメカニズムであるtextbfmethodを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:17:34 GMT)
Variance Reduction for Heavy-Tailed Monetization Metrics in Ranking Experiments via Post-Stratification [16.6] 本稿では,CUPEDとポストストラテフィケーションを組み合わせたオンライン実験における分散低減のための実践的枠組みを提案する。
ランキング駆動の収益化実験にまたがってShareChatにデプロイされたこの手法は、分散を著しく低減し、意思決定の安定性を向上させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:14:14 GMT)
RogueMerge: Robust and Unified Attacks against LLM Model Merging [16.4] RogueMergeは、モデルマージ攻撃のための原則化された統一されたフレームワークである。
4つの脅威にまたがって、既存の攻撃を継続的に上回ります。
様々な統合設定で安定し、標準的な防御に抵抗する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:54:37 GMT)
AmbientEye: A Dataset for Pupil Segmentation under Natural Ambient Infrared Illumination [16.4] AmbientEyeは、19カ国の35人の参加者から収集された2,606,225個の目画像の大規模なデータセットである。
自然の日光の下で屋外に撮影され、2つのオフ軸カメラ構成と2つの日向条件で撮影される。
我々は、我々のデータセット上で最先端の瞳孔分割アルゴリズムをベンチマークし、その性能を制御された赤外線照明下で既存のデータセットと比較する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:28:21 GMT)
ST-ColoNet: Spatio-Temporal Colon Segment Recognition via Hybrid Attention and Edge-Guided Feature Learning [16.3] 既存の自動認識手法は、時間的情報を完全に活用することなく、大腸内視鏡画像のみを使用するため、性能は低下した。
時空間ネットワーク(ST-ColoNet)を用いた2段階の深層学習フレームワークColo-Segment Recognitionを提案する。
我々は,コロセグメンテーション認識のタスクにおいて最先端の性能を達成でき,精度が81.0%,F1スコアが70.7%であることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:54:12 GMT)
Evaluating LLMs' Effectiveness on Real-World Consumer Device Repair Questions [16.2] 我々は、Redditから電話の修理、コンピュータの修理、データの回復にまたがる現実世界の991の修復質問のベンチマークを紹介した。
本研究は,英語とバングラ語における6つの最先端のLLMを,修理の正確性,完全性,実用性,安全性の4つの基準を用いて評価した。
以上の結果から,LLMは有用な補修支援を行うことができるが,高リスクな実世界の補修作業には信頼性が低いことが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:40:47 GMT)
On the Generalization Gap in Self-Evolving Language Model Reasoning [16.2] 統合オフライン自己進化フレームワークにおける4つの代表的な戦略を解析する。
自己進化はベースモデルよりも一貫して改善されるが、過剰なトレーニング計算の後に高原が投資される。
Gemma 12Bはオラクルの教師付きトレーニングにほぼ一致するので,大規模モデルによるマルチターン批評家のリビジョンは,強力な自己進化性能に達することが判明した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:50:15 GMT)
Experience-Driven Dynamic Exits for LLMs with Reinforcement Learning [16.2] LEDEは、ローカルコンテキストに基づいて最適な出口層と投機長を動的に選択するポリシーを学ぶ。
Llama-2 と Llama-3 の総合評価では、LEDE は自己回帰復号よりも$2.0times$$$$$2.7times$スピードアップを達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:59:14 GMT)
Knowledge Editing in Masked Diffusion Language Models [16.1] 広く使われているアプローチである where-then-edit は、2つのステップでこれを行う。
これまで、このような手法は自己回帰モデル(ARM)にのみ適用されてきた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:14:37 GMT)
RobotValues: Evaluating Household Robots When Human Values Conflict [15.9] 我々は,家庭用ロボットプランナを価値相反シナリオで評価するためのベンチマークであるRobotValuesを紹介した。
モデルには、プライバシ優先のアクションを減らしながら、安全や宿泊などのデフォルト値の好みが示されることが分かりました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:25:01 GMT)
Rethinking the Idiomaticity Decomposability Hypothesis: Evidence from Distributional Learning [15.7] 本研究では,事前学習中の学習の追跡中に,人間の評価,統語的柔軟性,予測可能性との関連性を示すモデル内部尺度を提案する。
モデルにおける表現の安定化は、周波数だけでは説明できないことを示す。代わりに、素因分解可能性と周波数はすべて、最強の訓練依存効果を示す分解性に寄与する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:59:22 GMT)
Probe Before You Edit: Probing-Guided Molecular Optimization for LLM Agents in Structure-Based Drug Design [15.7] 2つの診断基準は、単一の編集が両方の目的をいかに改善するかを測定する。
これらのメトリクスを現在のLLMエージェントパイプラインに適用すると、一貫した障害モードが公開される。
編集応答型探索をベースとした最適化フレームワークである textbfPROBE を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:09:41 GMT)
Community-Aware Assessment of Social Textual Engagement and Resonance: A Human-Centric Perspective on User-Generated Content Evaluation [15.6] 本稿では,信号中心の指標から人間中心の共鳴評価へのパラダイムシフトを提案する。
本稿では,新しいソーシャル・チェーン・オブ・トラヒック(Social-CoT)機構を導入するMEDEAについて紹介する。
CASTER-Benchは、さまざまなカテゴリをカバーする包括的な人間アノテーション付きベンチマークである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:38:55 GMT)
HiSE: A Lightweight Hierarchical Semantic Explainer for Heterogeneous Graph Neural Networks [15.5] 不均一グラフニューラルネットワーク(HGNN)は複雑なデータのモデリングにおいて顕著な性能を示した。
既存の説明法には2つの大きな制限がある。
我々はHGNNのための軽量な特徴指向解釈モデルであるHiSEを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:12:01 GMT)
Inducing Reasoning Primitives from Agent Traces [15.5] Reasoning Primitive Injectionは、成功したReActトレース、クラスタの繰り返し推論をマイニングし、最も頻繁な動きを型付き擬似ツールのコンパクトライブラリに変換する。
単一の固定構成は、すべてのサブタスクでゼロショットのチェイン・オブ・ランゲージを改善し、専門家が認可した分解と一致または超過し、平均推論コストでAWMを上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:11:15 GMT)
SC-TauPath: A Structural Connectivity Attribution Framework for Mapping Tau Propagation Pathways in Alzheimer's Disease [15.5] In vivo の神経画像データからtau の伝播経路をマッピングする SC-TauPath 構造接続(SC)アトリビューションフレームワークを提案する。
SC-TauPathは、ネットワーク拡散モデル(NDM)で拡張された多層パーセプトロンと勾配$times$入力属性を組み合わせて、各SCエッジのタウ予測への寄与を評価する。
234人のADNI参加者に適用すると、SC-TauPathは強いクロスバリデーションタウ予測を達成し、Braakステージング解剖と整合した帰属経路マップを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:57:13 GMT)
Parameter-Free and Group Conditional Online Conformal Prediction [15.4] 不確かさの定量化は、現実のシナリオにおける機械学習予測器の展開に不可欠である。
オンライン共形予測(OCP)手法は、(i)グループワイドエラー制御または(ii)学習速度独立実装を犠牲にしてこの問題に対処する。
我々は,グループ条件付きOCPのためのパラメータフリーアルゴリズムを提案し,グループ条件付き適用保証が最適であることを実証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:50:21 GMT)
TiWeaver: Unified Temporal Dynamics Modeling via Contextual Patching [15.3] TiWeaverは、時間的ダイナミクスと細粒度チャネル間の依存関係を適応的に扱うように設計された統合フレームワークである。
12のリアルタイム時系列データセット上でTiWeaverを評価し、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:06:12 GMT)
TPA-AD: A Two-Stage Pseudo Anomaly-Guided Method for Bearing Time-Series Anomaly Detection [15.3] 2段階の擬似異常誘導型異常検出法を提案する。
通常の境界付近で擬似非正則ウィンドウを生成する。
ノーマルウィンドウと擬似アノマラスウィンドウの対比学習を通じて、異常に敏感な表現を学習する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:39:10 GMT)
PaddleOCR-VL-1.6: Expanding the Frontier of Document Parsing with Under-Optimized Region Refinement and Progressive Post-Training [15.2] PaddleOCR-VL-1.6はPaddleOCR-VL-1.5上に構築された文書解析モデルである。
PaddleOCR-VL-1.6は、従来のモデルから弱い領域を識別し、これらの領域にターゲット拡張を適用し、監視信号の信頼性を向上させる、地域対応データ最適化フレームワークを導入している。
OmniDocBench v1.6で96.33%という新しい最先端のスコアを獲得し、上位層のVLMに対して強い競争力を示し、PaddleOCR-VLシリーズの実践的なポストトレーニングレシピを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:27:03 GMT)
Knowledge-Preserved Model Tuning in Null-Space for Robust Spatio-Temporal Video Grounding [15.2] 劣化した入力に対応するためにNull-Space Tuningを提案する。
このフレームワークは、層入力に凍結重みのヌル空間内にベクトルを追加することは出力に影響しないという幾何学的性質を利用する。
学習可能な残基を入力特徴に注入し、事前訓練されたバックボーンに選択的に見えないようにする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:59:27 GMT)
CLAW: Learning Continuous Latent Action World Models via Adversarial Latent Regularization [15.2] CLAWは、アクションフリーのビデオから直接、連続的な潜在アクション表現と協調して世界モデルを学ぶためのフレームワークである。
得られた潜在行動世界モデルが,観察から得られた模倣学習と目標指向計画の両方をサポートすることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:40:24 GMT)
Instant-Fold: In-Context Imitation Learning for Deformable Object Manipulation [15.2] Instant-Foldは、DOMのためのコンテキスト内模倣学習フレームワークである。
一人の人間がデモを行うと、このポリシーはデモから直接様々な操作モードを推測し実行します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:46:20 GMT)
DELTAMEM: Incremental Experience Memory for LLM Agents via Residual Trees [15.0] 既存の知識の漸進的な変化として,新たに獲得した経験がしばしばあると仮定して,残余体験を導入する。
経験記憶を2つの独立した残留木に整理するフレームワークであるDeltaMemを提案する。
多様なインタラクティブ環境における実験は、DeltaMemが既存のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:13:50 GMT)
Channel Chart Location Privacy Based on Geo-Indistinguishability [15.0] チャネルチャートは、チャネルチャートからの擬似位置を利用して、明示的な位置情報を必要とすることなく、ロケーションベースのサービス(LBS)を可能にする。
この性質は固有のプライバシー上の優位性を示しているが、正式なプライバシー保証を提供していない。
チャネルチャート化では,地理識別可能性(GI)をチャネルチャート化表現に拡張したCLI(Chart location indistinguishability)と呼ばれる位置情報のプライバシに対処する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:39:43 GMT)
Reflection Separation from a Single Image via Joint Latent Diffusion [15.0] 単一像の反射分離は、フレアや弱い反射のような極端な条件下では非常に困難である。
本稿では, この課題に対して明確に微調整された拡散モデルを提案する。
本手法では, 透過層と反射層を統一拡散モデルにより同時に生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:11:20 GMT)
Structured Prompt Optimization Meets Reinforcement Learning for Global and Local Interpretability over Complex Text [15.0] LLMには高度なテキスト分類があるが、既存のパラダイムはトレードオフに直面している。
我々は,eXTCを3段階に分けて導入し,SOPを学習し,LLMから小型LMへの蒸留を推理し,初期のSOPを超えて推論能力を拡張した。
この設計は、(i)コンパクトなLMによる高速な推論を可能にし、(ii)推論時局所的推論トレースと、(ii)学習されたドメインルールのグローバルなモジュラーな説明と、(iii)分類性能と説明品質の両方において、既存のパラダイムを著しく上回り、ステージバイステージゲインを実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:33:43 GMT)
SkillGuard: A Permission Framework for Agent Skills [14.8] 我々はスキル中心のパーミッションフレームワークであるSkillGuardを紹介した。
SkillGuardを実世界の315のスキルとSkillInjectで評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:01:53 GMT)
GFFMERGE: Efficient Merging of Graph Neural Force Fields and Beyond [14.7] グラフニューラルネットワーク(GNN)は原子論シミュレーションのためのニューラルフォース場に革命をもたらし、低コストでほぼ量子精度を達成した。
視覚と言語処理のモデルマージにインスパイアされたGFFMERGEは,GNNにおけるクローズドフォームモデルマージのための最初の原則的フレームワークである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:48:34 GMT)
Learning Multi-Scale Hypergraph for High-Order Brain Connectivity Analysis [14.5] 適応型マルチスケールハイパーエッジ学習フレームワーク MuHL を導入し,階層型ノード機能を構築し,高次対話を動的に学習する。
複数の脳ネットワークベンチマークの実験により、MuHLはさまざまな段階にわたる疾患分類性能を一貫して改善することが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:24:17 GMT)
When Attention Collapses: Stage-Aware Visual Token Pruning from Structure to Semantics [14.5] 本稿では,新しい2段階の視覚トークン解析フレームワークであるStructure-to-Semantics(STS)を紹介する。
第1段階では、空間的および構造的多様性を最大化するために、反発に基づくサンプリング機構を採用している。
第2段階は命令対応のクロスアテンションを利用して、プロンプト非関連トークンを正確にフィルタリングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:36:24 GMT)
SEA-Embedding: Open and Reproducible Text Embeddings for Southeast Asia [14.5] このSEA-Embedding(SEA-Embedding)は、公開データのみに基づいて訓練された東南アジアの言語のための、完全にオープンで再現可能なテキスト埋め込みパイプラインである。
SEA-EmbeddingはSEA-BEDの最先端の成果を達成しつつ、その領域に対する堅牢なテキスト埋め込みの体系的かつ再現可能な分析を可能にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:05:14 GMT)
VAMPS: Visual-Assisted Mathematical Problem Solving Benchmark [14.5] VAMPSはグラフ支援数学のベンチマークである。
モデルが有用なグラフを構築し、その結果の視覚化でその答えを土台にできるかどうかをテストする。
全体として、さまざまなモデルの集合において、直接解析的解決は驚くほどツール対応の視覚的解決よりも優れていることが分かりました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:45:21 GMT)
Regularized Offline Policy Optimization with Posterior Hybrid Bayesian Belief [14.4] 本稿では,力学モデルのサブセット上での凸結合として期待を再構成するポストリアハイブリッドベイズ的信念を提案する。
コンバージェンスまで単調改善のための計量に依存しない保証を提供する反復正規化政策最適化アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:18:05 GMT)
CoPark: Learning Reactive Parking via Self-Play [14.4] CoParkは、残余の政治アーキテクチャ上に構築されたマルチエージェントのセルフプレイRLアプローチである。
我々は,Dragon Lake Parking(DLP)とDeep Open 3D(DSC3D)にまたがる新しいリアクティブパーキングベンチマークで,6つの駐車場でポリシーをトレーニングし,ゼロショットを評価する。
CoParkは70~85%の成功を達成し、衝突速度はわずか3~6%で、古典的、模倣学習、大規模RLベースラインを大きく上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:16:05 GMT)
Prospective Dynamic 3D MRI Reconstruction via Latent-Space Motion Tracking from Single Measurement [14.3] 静止空間における運動追跡機能を備えた動的3次元MRI再構成フレームワークを提案する。
我々の中心となる考え方は、効率よく一般化可能な運動場の潜在多様体をオフラインで学ぶことである。
XCATデジタルファントムと社内の腹部MRIデータセットの両方の実験は、PDMRが高忠実で時間的に一貫した再構成を実現することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:54:33 GMT)
Will Accurate Fields Mislead Photonic Design? FromGlobal Accuracy to Port Readout [14.1] MMIスプリッタとスプリッタでは、累積モード干渉と出力ウィンドウ凝集により、ポート電力、分割、位相、結合が決定される。
本研究では,局所境界構造を取り巻く潜在状態を整理しながら,全フィールド予測インタフェースを維持する伝搬整合型ニューラル演算子PaNOを提案する。
PaNO-R2は最高のcMAE、伝搬異常、出力エラー、ポートパワーエラーを達成し、NeurOLightのポートパワーと出力エラーを72.7%、72.5%削減した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:23:20 GMT)
IdEst: Assessing Self-Supervised Learning Representations via Intrinsic Dimension [14.0] 自己教師付き学習(SSL)は、ラベルのないデータから意味のある表現を学ぶための強力なパラダイムとして登場した。
最小スパンニングツリー次元推定器を用いてSSL表現のIDを推定する手法であるIdEstを提案する。
本研究は、SSL表現の評価のための原理的幾何プロキシとして固有の次元性を強調し、標準教師付き探索プロトコルを補完するものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:47:17 GMT)
Where Do We (Not) Need Temporal Context in Low-Resource Video Task Adaptation? [13.9] ビデオ理解のためのモデル適応戦略を体系的に研究する。
我々は、外見に焦点をあて、動きに焦点をあて、空間的に密接な設定を行う方法を評価する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:19:58 GMT)
Let the Dynamics Flow: Stable Flow Matching Dynamical Systems [13.8] 本稿では,高キャパシティ生成モデルと形式的リアプノフ安定性保証のギャップを埋める新しいフレームワークである安定流整合力学系(SFMDS)を紹介する。
SFMDSはフローマッチングによって動的システムをパラメータ化し、同時にモデルを安定解の族に制約する。
ベンチマークデータセット、シミュレーション、ヒューマノイドロボットの実験により、SFMDSは低次元および高次元の状態空間において安定でスケーラブルでマルチモーダルな力学系を学習することが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:17:26 GMT)
Regret Pre-training: Bridging Prior and Posterior Views for Enhanced Knowledge Grounding [13.6] 因果言語モデルは、事前コンテキストのみを使用してシーケンス確率を分解し、トレーニング中に将来の情報が明らかにされない。
本稿では,Learning Using Privileged Information (LUPI)パラダイムに基づく自己教師型フレームワークであるRegret Pre-trainingを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:11:39 GMT)
RSC: Decentralized Rigid Formation Flocking for Large-Scale Swarms via Hybrid Predictive Control and Online Reconfiguration [13.5] 分散化された剛体形成の群れは、移動中に所定の幾何学的構成を維持するために自律的なエージェント群を必要とする。
既存の分散制御手法は、散在環境において厳密なエージェント間距離制約を維持するのに苦労する。
本稿では,大規模な剛性形成フロッキングのための分散制御フレームワークであるRigid Swarm Control (RSC)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:54:30 GMT)
Drag-induced skin effect in a Bose-Fermi mixture [13.5] 非エルミート皮膚効果(英: non-Hermitian skin effect, NHSE)は、非エルミート物理学において最も顕著な現象の1つである。
強いボース-フェルミ相互作用により、フェルミオンは相関した境界状態を通じて境界蓄積を継承できることを示す。
Floquet-engineered asymmetric tunneling を用いた超低温ボース-フェルミ混合系における実現可能な実現法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:44:15 GMT)
Formalizing the Binding Problem [13.3] ビジョントランスフォーマー(ViT)は、どのパッチが一緒にあるかを知っている。
現在のディープラーニングモデルがバインディング情報を示すことを学ぶかどうかは不明だ。
ここでは,結合問題を情報理論のアプローチで定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:56:24 GMT)
Unified Video-Action Joint Denoising for Dexterous Action and Data Generation [13.2] 我々は,デクスタラスハンドのための統合ビデオアクション認知モデルであるDonkを提案する。
Donkは、アクションポリシーとして、将来のビデオと双方向のMANO軌道をサンプリングする。
画像条件がなければ、同じDenoisingアーキテクチャは、テキスト条件のディストリビューションからビデオアクションのロールアウトをサンプリングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:39:23 GMT)
Bionic Human-Motion Style Transfer for Physically Executable Whole-Body Control of Humanoid Robots [13.2] 本稿では,ヒューマノイドロボットにおける模範駆動型スタイル転送のための世代間制御フレームワークを提案する。
物理を意識した潜伏拡散モデルが, スタイル, 内容, 軌道条件を融合するために開発された。
プレビューベースの全体追跡ポリシは、クラスタ・アンド・ディスティル戦略でトレーニングされる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:59:01 GMT)
Physics-Guided Policy Optimization with Self-Distillation [13.2] 自己蒸留政策最適化(SDPO)はLLMポストトレーニングの一般的なパラダイムとなっている。
本稿では,情報変調ステップサイズ乗算器であるPGPOを提案する。
この変調は、バニラSGDのオーダー-1弱近似保証を保ち、反復毎に無視できないオーバーヘッドを生じさせることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:20:39 GMT)
Learn When and Where to Connect: Adaptive Virtual Nodes for Dynamic Message Passing on Graphs [13.2] 仮想ノード(VN)は、効果的なメッセージパッシングを容易にするために、しばしばメッセージパッシングニューラルネットワーク(MPNN)で使用される。
我々は,ノードとVN間の非制約接続を可能にする,エンドツーエンドの差別化可能なMPNNフレームワークMAVNを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:57:13 GMT)
GeoSem-WAM: Geometry- and Semantic-Aware World Action Models [13.2] 本稿では,幾何学的・意味的監督を通じて潜在表現を強化する構造化世界モデリングフレームワークを提案する。
提案手法は,テスト時の映像生成や自動ロールアウトを回避し,効率的な推論を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:48:02 GMT)
SAHG: Sector-Anisotropic Hyperbolic Graph Model for Social Bot Detection [13.2] LLMを駆使したソーシャルボットは、流動的で人間らしいテキストを生成することができ、コンテンツに基づく検出のみの差別的優位性を減らすことができる。
既存のグラフ検出器は、そのような証拠を利用する際に2つの課題に直面している。
本稿では, 方向依存曲率場を$(u)$で学習し, 構造方向の幾何分解能を適応させるSAHGを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:16:46 GMT)
MM-BizRAG: Rethinking Multimodal Retrieval-Augmented Generation for General Purpose Enterprise Q&A [13.0] MM-BizRAGは文書構造認識スプリットを介して文書構造を積極的に抽出し、表現する。
MM-BizRAGは、最先端のビジョン中心のベースラインを最大32%上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:31:47 GMT)
Structure-Guided Mixed Masked Pretraining and Spatial Continuity Regularization for Printed Circuit Board Defect Detection [13.0] プリント基板(PCB)欠陥検出は自動光学検査(AOI)の不可欠な部分である
本稿では,構造誘導型複合マスクプレトレーニングと空間連続性正規化を組み合わせた2相PCB欠陥検出フレームワークを提案する。
DsPCBSD+データセットの実験により、提案手法は85.5% mAP0.5と52.3% mAP0.5:0.95を達成し、いくつかの強力なベースライン検出器を上回る結果を得た。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:26:07 GMT)
Rethinking the Role of Positional Encoding: Sliding-Window Transformers without PE Remain Turing Complete [13.0] 位置符号化(PE)は、整列処理に必要な変換器として広く見なされている。
この直観は、任意の普遍性を実現することができることを証明するために位置情報に依存する全ての先行結果の根底にある。
我々は、この信念を、有限なスライディングコンテキストウインドウを通して生成が進行する、長期的推論に最も関係のある体制に再考する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:44:54 GMT)
The Shadow Price of Reasoning: Economic Perspective on Optimal Budget Allocation for LLMs [12.9] 推論時間のスケーリングは、大規模言語モデルのパフォーマンスを向上させる重要な方法として現れています。
本研究では,経済原理に支配されるグローバル制約付き最適化問題として,推論予算配分を定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:26:55 GMT)
MAdam: Metric-Aware Multi-Objective Adam [12.8] 解答者の意図とカップリングの実行との間には,2つの系統的なギャップが存在する。
textbfMAdam(Metric-Aware Multi-Objective Adam)は,解決器と変更の双方を残したドロップインラッパーである。
マダムはすべての解決者家族に対してアダムよりも一貫して改善する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:00:15 GMT)
Contrastive Neural Algorithmic Reasoning for Graph Coloring [12.6] 我々は約$k$-coloringについて研究し、そこではモノクロエッジの数を最小限に抑えながら、最大$k$カラーの使用を目標としている。
この問題はグラフ理論の中心であり、スケジューリングや資源割り当てといった分野で応用されている。
我々は,同色ノードの埋め込みが整合する移動可能な色調構造を学習するコントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:14:28 GMT)
Synthesize and Reward -- Reinforcement Learning for Multi-Step Tool Use in Live Environments [12.6] 本稿では,3つのコントリビューションを持つPROVE(Programmatic Rewards On Verified Environments)を提案する。
20のステートフルMPPサーバからなるライブラリは343のツールを公開し、ライブ実行RLトレーニングを可能にする。
このフレームワークは、これらのサーバに対して検証されたマルチターンツールコールトラジェクトリを生成する。
BFCLのMulti-Turn、tau2-bench、T-Evalでは、PROVEは最大+10.2、+6.8、+6.5ポイントの改善をもたらす。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:52:31 GMT)
Grasp-Then-Plan with Failure Attribution: A Closed Two-Stage Framework for Precise and Generalizable Robotic Manipulation [12.6] ロボット操作において、握りと運動計画の密結合は、しばしば真の失敗の原因を曖昧にする。
本稿では,GTP-FAを提案する。GTP-FAはタスク指向の2段階のグリップ計画フレームワークで,グリップ候補を生成し,選択したグリップに条件付き下流動作計画を実行する。
GTP-FAは、RL、IL、拡散政治、VLAベースの設定にまたがって、対応するベースラーナーを改善し、全体的なタスク成功率を大幅に向上させることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:29:03 GMT)
Fine-Tuning and Serving Gemma 4 31B on Google Cloud TPU: A Technical Comparison with GPU Baselines [12.4] 本稿では,Google の Gemma 4 31B モデルを TPU ハードウェア上で実現した,ファインチューニングの最初のエンドツーエンドデモを紹介する。
Google TPU v5p-8のトレーニングにLoRAを使用し、推論にTPU v6e-8(Trillium)を使用すると、GPUネイティブなトレーニングレシピの移植に必要なコードレベルの適応の完全なセットを文書化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:32:07 GMT)
Rethinking Neural Width for Alternating Current Optimal Power Flow Proxies [12.4] Loss-Guided Neural Densification (LG-ND)アルゴリズムは、現在のディープニューラルネットワークトポロジが更なる改善に失敗した場合にのみ拡張することにより、必要な能力を検出する。
さまざまなIEEEシステムにおける実験結果から,LG-ND は文献ベースラインと同等の性能を,各層あたりのニューロンの最大10倍の精度で達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:10:18 GMT)
Conformal Language Modeling via Posterior Sampling [12.2] 大型の言語モデルは幻覚に悩まされている。
近年の研究では、共形予測に基づく統計的手法を用いて、その有病率を測ろうとしている。
そこで本研究では,近似からLLM後部まで,条件付けイベントが校正されたハイスコア領域に対応してサンプリングすることを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:49:15 GMT)
Learn from Your Mistakes: Tree-like Self-Play for Secure Code LLMs [12.2] セキュアなコード生成をきめ細かいシーケンシャルな決定プロセスとして再設計するフレームワークであるTree-like Self-Play (TSP)を紹介します。
コード生成をセルフプレイゲームとして扱うことで、モデルは自身の局所的なエラーに対して厳格に識別することを学ぶ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:07:20 GMT)
See, Infer, Intervene: Proactive World Modeling for Goal-Oriented Social Intelligence [12.1] マルチモーダル小売業者は、顧客が何をしているかを認識するだけでなく、明示的な要求がなされる前に支援するかどうかを判断する必要がある。
本稿では、See-Infer-Intervene(SII)フレームワークを用いて、この設定について検討する。
我々は、AIDA(Attention, Interest, Desire, Action)購入フェーズとBDI(Belief, desire, intention)心理学領域を持つ顧客状態を表すPIWM(Proactive Intent World Model)を用いてSIIをインスタンス化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:18:39 GMT)
LeAP: Learnable Adaptive Permutation for Feature Selection in Heterogeneous and Sparse Recommender Systems [12.0] 機能選択のためのモデルに依存しないプラグインモジュールであるLeAPを提案する。
LeAPは非効率なランダムな置換過程を学習可能なメカニズムに変換する。
LeAPは、毎日10億件以上のリクエストがある大規模産業検索ランキングモデルにデプロイされている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:56:32 GMT)
EqGINO: Equivariant Geometry-Informed Fourier Neural Operators for 3D PDEs [12.0] スペクトル領域における等方性を強制する幾何的に堅牢なフレームワークであるEqGINOを紹介する。
複素不規則な3次元幾何学上の座標不変物理法則を強固にモデル化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:23:06 GMT)
AutoTail-BSFGM: Class-Balance-Aware Fine-Tuning for Chinese Scholarly Text Classification [11.9] AutoTail-BSFGMは学術テキスト分類のためのクラスバランス対応の微調整手法である。
CSLに基づく2つの課題について,67のラベルを持つ抽象学際課題と13のカテゴリを持つタイトル・ツー・カテゴリタスクについて評価を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:44:40 GMT)
Distilling Answer-Set Programming Rules from LLMs for Neurosymbolic Visual Question Answering [11.9] 大規模言語モデル(LLM)からルールを抽出する手法を提案する。
VQAデータセットの例では、LLMをガイドし、結果を検証し、ASPソルバからのフィードバックを活用することで誤ったルールの修正を支援する。
従来のデータ駆動型ルール学習手法の代替として, LLMからのルール蒸留が有望であることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:35:31 GMT)
From Ticks to Flows: Dynamics of Neural Reinforcement Learning in Continuous Environments [11.9] 連続環境における深部強化学習(RL)の新たな理論的枠組みを提案する。
探索と遷移の両方を組み込んだアクター・クリティカル・アルゴリズムの実行可能なモデルを導入する。
我々は,おもちゃの連続制御タスクを用いて理論的結果を実証的に相関させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:02:54 GMT)
MOSAIC: Efficient Mixture-of-Agent Scheduling via Adaptive Aggregation and Inference Concurrency [11.8] Mixture-of-Agents (MoA) システムは、各クエリを複数の専門家 LLM にルーティングし、出力を集約することで、推論精度を向上させる。
従来のスケジューリング戦略は、負荷の不均衡によるGPUアイドリングとスループットの低下に悩まされている。
限られたGPUリソース上でMoAワークロードを高速化するスケジューリングフレームワークであるMOSAICを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:40:33 GMT)
FAF-CD: Frequency-Aware Fusion for Change Detection under Imperfect Multimodal Remote Sensing [11.7] DINOv3-pretrained ConvNeXt encoder と線形複雑VMamba-based decoder を組み合わせた周波数対応ハイブリッドフレームワーク FAF-CD を提案する。
BRIGHT検証では、一致した異種EO-SAR適応により、NeXt2Former-CDよりも清浄で摂動したtc-mIoU/tc-mAPが改善される。
さらに、NeXt2Former-CDと比較して約24GFLOPのコストを削減し、精度を維持または改善した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:59:34 GMT)
Libra: Efficient Resource Management for Agentic RL Post-Training [11.7] 強化学習(RL)は、大規模言語モデル(LLM)の訓練後の標準パラダイムとなっている。
エージェントRLでは、ロールアウトステージはツールを呼び出しながら軌道を生成し、長い尾と静止しないワークロードを生成する。
2つのコア機構を導入するLibraについて紹介する。
最大3.0$times$高スループットを実現し、ベースラインと比較して2.5$times$高速に収束する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:09:13 GMT)
When Should the Teacher Move? Temporal Coupling and Stability in Self On-Policy Distillation [11.7] 本研究は,教師年齢ではなく,安定した学習を可能にする重要な構造特性として,教師の凍結期間が定義されていることを示す。
我々は,報酬改善と長身安全の連立証拠を各リフレッシュしながら,孤立期間を保ったEmphConsolidation-Gated Teacher Refresh (CGTR)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:54:39 GMT)
A Goal-Set Characterization of Task Composition in the Boolean Task Algebra [11.7] 最適拡張Q値関数の空間における崩壊を形式化する。
決定論的 MDP では、すべてのそのような関数は普遍的および空のタスクによって完全に決定される。
本稿では,ゴールセット上で論理演算を行うゴールセットベース合成手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:33:06 GMT)
Cross-Modality Feature Fusion Based on Structured State Space Duality for Multimodal Image Registration Network [11.5] 本稿では,RegNetMamba-2という,マルチモーダル画像登録のための新しいアルゴリズムを提案する。
本アルゴリズムでは, 局所的・大域的構造的特徴を効果的に抽出するために, 構造化状態空間双対(SSD)を粗大かつ微細なマッチングプロセスに組み込む。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:50:15 GMT)
PersistGS: Differentiable Physics for Object Permanence in 4D Gaussian Splatting [11.5] 動的3次元ガウス散乱(3DGS)法は,光度監督を用いた同期マルチカメラ映像から時間変化シーンを再構成する。
本稿では,3次元ガウス散乱と微分可能剛体シミュレーションを結合させることにより,閉塞時の物体の永続性を復元する手法であるtextbfPersistGS$を提案する。
合成シーンの実験では、PersistGS は +2.46dB PSNR で一定の速度外挿性能を発揮し、地上軌道上界の 0.19dB 以内である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:57:15 GMT)
StepFinder: A Temporal Semantic Framework for Failure Attribution in Multi-Agent Systems [11.5] 失敗帰属(Failure Attribution)は、障害の原因となる根本原因のステップを自動的に特定することを目的としたタスクである。
既存のフェール帰属法は主に、元の実行軌跡を推論するためにLLMに依存している。
我々は、軽量な障害属性フレームワークであるStepFinderを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:45:49 GMT)
Adaptive Patching Is Harder Than It Looks For Time-Series Forecasting [11.5] 条件下では、コンテンツ適応型パッチ演算子は、チューニングされた均一な演算よりもパフォーマンスがよい。
適応パッチは、調整された均一なベースラインに対して評価されるべきである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:49:06 GMT)
Diffusing in the Right Space: A Systematic Study of Latent Diffusability [11.5] ラテント拡散モデルは、視覚トークン化器を利用して、効率的な生成モデリングのためにラテント空間に画像を圧縮する。
我々は,多種多様な正則化戦略を持つ大量のトークン化剤の集合を訓練することにより,潜時拡散可能性の体系的研究を行う。
生成品質と連続的に相関し,実験環境にまたがる強い一般化を示す潜伏特性を同定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:47:14 GMT)
UniVerse: A Unified Modulation Framework for Segmentation-Free,Disentangled Multi-Concept Personalization [11.4] 拡散変換器におけるセグメンテーションフリー・アンタングル・マルチコンセプトパーソナライズのための統一変調フレームワークUniVerseを提案する。
提案手法により,構成可能かつ分解可能な概念抽出が可能となり,対象オブジェクトの微細な局所化と表現が可能となった。
提案手法は、より柔軟で、解釈可能で、パーソナライズされた視覚生成と理解のために、散在するシーンのターゲット概念を的確に抽出できることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:24:39 GMT)
EXACT-MPPI: Exact Signed-Distance Navigation for Arbitrary-Footprint Robots from Point Clouds via Path Integral Control [11.3] EXACT-MPPIは、ローカルナビゲーションを直接モーションコマンドにマッピングするフレームワークである。
解析的かつ正確な符号付き距離評価器をモデル予測パス積分(MPPI)コントローラに組み込む。
同じフレームワークは、differial-drive、Ackermann、およびハイブリッドモードプラットフォーム上にデプロイされている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:44:20 GMT)
CAPER: Clause-Aligned Process Supervision for Text-to-SQL [11.3] 本稿では,SQL 抽象構文木への反実的介入を通じて,自動的に節レベルの監視を導出する CAPER を提案する。
得られたデータは、ポリシー最適化と候補検証のための軽量なクロース境界フィードバックであるCAPER-9Bのトレーニングに使用される。
BIRDとスパイダーの実験では、節順の監督は実行精度を向上するだけでなく、GPT-5.4よりも15.3%の改善を達成し、障害局所化能力を強化し、84.53%の精度と90.60%のMRRを達成した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:35:40 GMT)
Optimized Labeling Resource Allocation for Prediction-Assisted Inference via OPAL [11.3] 本稿では,最も分散度の低い推定器を生成するためのスムーズなポリシーの抽出可能なクラス内で,ラベル付け戦略を学習するOPALを紹介する。
我々は,OPALが有限標本において名目的カバレッジを達成し,よりラベル付き標本をはるかに多く持つ手法から期待できる精度を有することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:09:04 GMT)
Learning Temporal Causal Structure via Smooth Differentiable Optimization [11.2] 検出精度と効率の両面で、12のベースラインと比較して、全体的なパフォーマンスが最高である。
大規模なベンチマークでは、強力なスケーラビリティが示され、競合するメソッドよりも6倍以上のスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:42:39 GMT)
Conditional Hypothesis Generation for LLM-Based Text Analysis with Researcher-Specified Covariates [11.2] 本稿では,関係するサブグループ間の差異を考慮に入れた条件付き仮説生成手法を提案する。
2つの課題が生じる: 対象部分群は不足し、差の向きは部分群をまたいで逆になる。
本稿では,符号逆転を検出するための2つのエコノメトリインスパイア法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:07:46 GMT)
The DeepSpeak-Agentic Dataset [11.2] DeepSpeak-Agenticは、人間とAIエージェントとの37時間以上の半構造化された会話からなるビデオのデータセットである。
このデータセットを使用して、AIエージェントの自動法医学的識別を評価し、人間とエージェントの相互作用の性質を研究し、AIエージェントを具体化する言語モデルとAI生成音声および顔の将来の進歩のベンチマークを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:10:18 GMT)
Structures Facilitate Retrieve, Rerank, and Generate [11.0] 文書地上対話システム(DGDS)は、外部文書からの知識を利用してドメイン固有のユーザー質問に答える。
本稿では,このような問題に体系的に対処するSF-Re2Gを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:09:41 GMT)
Extreme Motion Generation via Hybrid Null-Space Control for Straight-Line Path Following [11.0] 本稿では, マニピュレータの作業空間内で, 予め定義された軌道に沿った経路長を最大化する「極端運動生成」について検討する。
本稿では,RLベースとモデルベースコントローラを正規化した連接限界距離に応じて切り替えるステップレベルハイブリッドコントローラを提案する。
提案手法を7-DoF Franka FR3を用いて一万進路追従タスクに適用し,平均ロールアウト期間をモデルベースベースラインより27%延長した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:33:08 GMT)
AUGUSTE: Online-Learning dApp for Predictive URLLC Scheduling [11.0] 実際の5Gネットワークは、50-70msの範囲で、中央値のUplink(UL)ラウンドトリップ時間を示している。
ULスケジューラにオンライン機械学習(ML)モデルを組み込んだ学習ベースメディアアクセス制御(MAC)スケジューリングフレームワークであるAUGUSTEを提案する。
3つのURLLCトラフィックパターンにまたがってOpenAirInterfaceを実行する実5Gテストベッド上でAUGUSTEを評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:50:22 GMT)
The Role of Domain-Specific Features in Malware Detection: A macOS Case Study [10.9] 我々は、機械学習マルウェア検出装置をトレーニングするために、組み込み証明書、権利、永続化技術、および主要なシステムAPIなどの新しいドメイン固有の機能を使用します。
11,413個の良性および29,716個の悪意のある実行可能ファイルからなる41,129個のサンプルからなる新しいデータセットを総合的に評価した。
我々の検出器は非常に高い検出率 (99.50%) を維持し、 (ii) は最先端を50%向上させ、 (iii) ドメイン固有の特徴は新規なマルウェアサンプルの一般化に不可欠である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:25:31 GMT)
PatchScene: Patch-based Voxel Diffusion for Large-Scale Scene Completion [10.8] パッチベースのボクセル拡散パラダイムは、局所化された3D領域内の微細な幾何学を生成する。
環状流拡散戦略は、近距離領域から遠距離領域までの高忠実度情報を伝播する。
20mのLiDARで訓練されたモデルは、リトレーニングなしで効果的に50mのシーンに到達した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:09:20 GMT)
Let There Be Light: Reflection, Refraction and Scattering for Neural Operators [10.7] そこで本研究では, 潜伏進化を基本光輸送を動機とする3つのメカニズムに分解した光刺激型ニューラルオペレータを提案する。
反射と屈折は、潜在特徴空間における適応的な点変換として作用し、局所的特徴再構成と異方性変調を可能にする。
そこで我々は,正のグローバル伝播と局所拡散分岐による明示的なペアワイズ相互作用を置き換える,効率的な散乱変種を開発する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:25:49 GMT)
AugMask: Training Diffusion Models on Incomplete Tabular Data via Stochastic Augmentation and Masking [10.6] AugMaskは、コンディショニングを監督から切り離して不完全なデータに適用するトレーニングフレームワークである。
欠落点の辺縁化は差分重み付き感度のペナルティをもたらし,不確実な完了に対する過度な信頼を損なうことを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:57:38 GMT)
SymTRELLIS: Symmetry-Enforced Voxel Latents for 3D Generation [10.6] フローベースTRELLIS.2の3次元生成において任意の有限点群対称性を強制する手法であるSymTRELLISを提案する。
266の厳密な対称オブジェクトのキュレートされたベンチマークでは、SymTRELLISはTRELLIS.2、Hunyuan3D-2.1、TripoSGと比較して、すべての対称性エラーメトリクスを著しく削減している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:11:41 GMT)
Two-Action Apple Tasting with Switching Costs [10.6] 本研究では,不愉快な相手に対する切り替えコストを考慮に入れた2種類のリンゴテイスティング問題について検討した。
スイッチングコストの一般的なフィードバックグラフアルゴリズムは、この問題に対して$widetilde O(T2/3)$ regret guaranteesを与える。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:28:45 GMT)
MemoGen: Can Past Experience Improve Future Text-to-Image Generation? [10.5] 我々は,既存の画像生成装置をエージェント進化層で拡張する,トレーニング不要のフレームワークであるMemoGenを提案する。
各タスクに対して、MemoGenは視覚的要件を明示的に推測し、必要に応じて外部エビデンスと参照を取得し、それらを実行可能な生成制約に変換する。
進化ラウンド全体を通して、エージェントは関連する経験を取得し、同様の世代の改善を行い、失敗したケースを選択的に修復し、成功したケースを保存する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:04:51 GMT)
Channel-Oriented Design for EEG-to-Music Reconstruction [10.4] 我々は,信号が弱く,分散し,ノイズやチャネルの可変性に敏感な脳波から音楽への再構成について検討した。
我々の中心的な発見は、初期のチャネル混合は弱いが差別的な脳波信号を破壊することである。
本稿では,3つの主成分を持つチャネル指向設計を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:13:37 GMT)
PerceptTwin: Semantic Scene Reconstruction for Iterative LLM Planning and Verification [10.3] PerceptTwinは、セマンティックシーン表現から直接インタラクティブなシミュレーションを構築する完全な自動パイプラインである。
PerceptTwinは、ロボットハードウェア上で実行される前に、計画の検証と洗練に使用することができる。
本研究は,より安全で信頼性の高いロボット計画の基礎として,ロボット認識によるオープンボキャブラリシーンシミュレーションの可能性を示すものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:25:49 GMT)
ClinicalMC: A Benchmark for Multi-Course Clinical Decision-Making with Large Language Models [10.2] 我々は,多コース臨床意思決定のためのベンチマークであるCrysicalMCを提案する。
1,275人の中国人と5,804人のイギリス人サンプルが入所から退院までの4段階にわたって含まれている。
英語データセットの患者は平均5.11の臨床コースを受けており、中国語データセットの患者は3.42である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:09:18 GMT)
TeX-1500: A Paired Real-World LWIR Hyperspectral Dataset and Benchmark for Temperature-Emissivity-Texture Decomposition [10.2] 温度-放射率-テクスチャ(522)分解は、長波長赤外高スペクトルイメージング(LWIR HSI)による対象熱状態、物質スペクトル応答、および可視的幾何学的テクスチャの回復を目指す
現存。
逆パイプラインは主にシーン固有の解法であり、ペアのLWIR HSI制御が欠如しているため、学習ベースの分解は限られている。
我々は,大規模LWIR HSI-データセットであるARPA-1500を導入し,HSI-to-the-Radiance分解の教師付きベンチマークを行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:51:41 GMT)
AutoForest: Automatically Generating Forest Plots from Biomedical Studies with End-to-End Evidence Extraction and Synthesis [10.1] AutoForestは、バイオメディカルペーパーから直接出版可能な森林区画を生成するエンドツーエンドシステムである。
1つ以上の研究論文が与えられたとき、AutoForestはICO(Intervention, Comparator, Outcome)要素を自動で提案し、結果データを抽出し、統計的合成を行い、最終的な森林プロットを描画する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:28:13 GMT)
Supportive Token Revealing for Fast Diffusion Language Model Decoding [10.0] AXONはトレーニングフリーのモジュールで、拡散言語モデルの既存の並列デコード戦略の上に追加することができる。
AXONは、既存の並列デコーダの品質・レイテンシのトレードオフを改善し、精度を維持したり改善したりしながら、機能評価の回数を減らすことができることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:35:54 GMT)
ToolGate: Token-Efficient Pre-Call Control for Tool-Augmented Vision-Language Agents [9.8] ToolGateは、軌道テキストと単純な構造的特徴から実行/スキップの決定を予測する。
2つのQwen3-VLバックボーンで、ToolGateはトークンコストを制限なしのReActベースラインの64-69%に削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:44:27 GMT)
dstack-capsule: Pod-Level Remote Attestation for Confidential Workloads on Kubernetes [9.7] CoCo(Confidential Containers)は厳格な"VM毎のPod"モデルを強制し、ゲストOSスタックのみを証明し、コンテナレベルのアイデンティティを検証せず、VM単位のリソースオーバーヘッドを禁止している。
我々は,複数のPodが1つのConfidential VMを共有しながら,それぞれが独立してハードウェアが支援するアイデンティティの証明を保持することによって,Intel TDX上でPodレベルのリモート認証を可能にするプラットフォームであるdstack-capsuleを提案する。
我々は,dstack-capsuleのセキュリティ特性,正確性,性能特性を評価し,VM間分離のリソースオーバーヘッドを伴わずにPod-granularity検証を実現することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:33:16 GMT)
A Quantitative Approximation Framework for Flow Distillation in Diffusion Models [9.7] 局所近似誤差は低雑音マルチモーダル状態において強く増幅することができる。
深部残留成分は, 長距離輸送を効率的に近似することを示した。
実験は、一様格子と比較して8セグメントで最大51.9%の予測とエンドツーエンドの相対MSI削減をサポートする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:00:43 GMT)
LLM Judges Inconsistently Disagree Across Safety Criteria and Harm Categories [9.7] 大規模言語モデルは、金融などの規制領域における機械によるアドバイスに関連する安全性の問題を特定する上で、信頼性の低い判断である。
モデルの判断の不整合度は、選択された安全基準によって大きく異なる。
異なる裁判官の間では、ドメイン、安全基準、言語にまたがる同じアウトプットについて高い意見の相違がある。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:28:06 GMT)
Low-Frequency Shortcuts in Texture-Driven Visual Learning [9.5] テクスチャ駆動ドメインに対するショートカット学習分析を提案する。
テクスチャ駆動型ドメインは低周波ショートカットに悩まされている。
低周波のショートカットは、OODの腐敗に対して非常に脆弱であることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:11:20 GMT)
A Decentralized LiDAR-SLAM System with Certifiably Optimal Pose Graph Optimization [9.5] 本稿では,PGOバックエンドを組み込んだ分散化LiDAR-SLAMシステムを提案する。
提案手法は,現状のSLAMと比較して,軌道RMSEを最大48.9%向上させ,優れたロバスト性を実現することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:02:33 GMT)
Patcher: Post-Hoc Patching of Backdoored Large Language Models [9.5] 本稿では,単一障害事例とモデルパラメータのみを用いて,バックドア言語モデルを修復するポストホック防衛フレームワークPacherを提案する。
Patcher氏は、モデルユーティリティを維持しながら、トリガのローカライズとバックドアの中立化に成功したことを示しています。
この作業は、デプロイされた言語モデルにおけるトレーニング時間攻撃に対する実践的な防御に向けた重要なステップである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:11:58 GMT)
Finite-Iteration Local Dynamics and Warm Starts for Alternating Power Iteration in Spiked Tensor PCA [9.5] ランク1スパイクテンソルモデルに対する同時パワーイテレーションについて検討する。
我々の主な貢献は有限点局所理論である。
有限次モーメント雑音下では, 必要な相関関係と, 同一サンプルの1次重畳雑音を検証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:44:12 GMT)
Deft Scheduling of Dynamic Cloud Workflows with Varying Deadlines via Mixture-of-Experts [9.4] DEFTは、動的クラウドワークフロースケジューリングのためのMixture-of-Expertsアーキテクチャを導入し、検証する最初の企業である。
最も適切な専門家を通じて意思決定を適応的にルーティングすることで、DEFTは幅広い期限要件を満たすことができる。
動的クラウドワークフローベンチマークの実験は、DEFTが実行コストと期限違反を大幅に削減することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:34:50 GMT)
RealClawBench: Live OpenClaw Benchmarks from Real Developer-Agent Sessions [9.3] 実際のOpenClawセッションから構築されたベンチマークフレームワークであるRealClawBenchを紹介した。
RealClawBenchは、これらの課題に、再構築された実行環境と決定論的検証可能なスコアラの2つのメカニズムで対処する。
結果として得られたリリースには、はるかに大きなリアルセッションプールからサンプリングされた281の実行可能なタスクが含まれている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:51:24 GMT)
Zero-Shot 3D Question Answering via Hierarchical View-to-Token Transportation [9.3] 本稿では,ビューレベルとトークンレベルの両方において,入力コンテキスト収集のための階層的アプローチを提案する。
具体的には、画素特徴とカメラパラメータを組み合わせることで、意味的内容と幾何学的位置の両方に基づいて、ビューの重要性を評価する。
フレームワークを3つの広く使用されているベンチマークで評価し、既存のチューニング不要の手法とトレーニングベースのアプローチに匹敵するパフォーマンスを大幅に改善したことを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:38:51 GMT)
Shaft-integrated Force Sensing with Transformer-based Dynamics Compensation for Telesurgery [9.2] ロボット支援最小侵襲手術(RAMIS)は,触覚フィードバックを活用し,パフォーマンスの向上を図る。
フォース情報には、パフォーマンスアセスメント、触覚的ローカライゼーション、および外科的自律性を通知する幅広い可能性がある。
本研究は,標準的なケーブル駆動手術器具の遠位端に6軸の商用力センサを統合する方法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:13:03 GMT)
When Retrieval Doesn't Help: A Large-Scale Study of Biomedical RAG [9.2] 検索は、通常1-2点以内の非検索ベースラインよりも小さく、一貫性のない改善しか得られない。
バックボーンモデルの選択は、レトリバーやコーパスの選択よりもはるかに大きな効果がある。
これらの結果は,検索品質だけでなく,検索された証拠を効果的に活用する能力にも限界があることを示唆している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:34:54 GMT)
Rethinking Bregman Divergences in Kronecker-Factored Optimizers [9.1] Frobenius, von Neumann, LogDet の発散は避けられない Kronecker 近似誤差が異なることを示している。
上部分空間に固有値に基づくプレコンディショニングを適用し,下部分空間に適応等方的加速度定数を用いる部分空間対応Kroneckerを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:25:25 GMT)
DMT-CBT: Longitudinal Therapeutic State Modeling for CBT Counseling [9.1] CBTカウンセリングにおける治療状態の動的モデリングのためのフレームワークであるDMT-CBTを提案する。
DMTCorpusはマルチセッションマルチモーダルCBTカウンセリングデータセットである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:18:25 GMT)
PerchRL: Vision-Based Agile Perching on Inclined Platforms under Rapid and Irregular Motion [9.0] PerchRLは、傾斜したプラットフォーム上でのビジョンベースのアジャイルアプローチのための強化学習フレームワークである。
我々は、状態に基づく事前学習と視覚に基づく微調整からなる2段階の学習戦略を採用する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:26:35 GMT)
A Robust Optimization Approach to Sparse Principal Component Analysis [9.0] 本稿では,頑健な最適化を生かしたAdversarial PCA(AdvPCA)を提案する。
この定式化は閉形式還元を許容し、実用的な反復アルゴリズムをもたらすことを示す。
理論的に解を特徴づけることにより、アルゴリズムがボックス外で効果的に実行できるようにするデータ適応パラメータ化を導出する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:14:12 GMT)
Global adiabatic criterion for fast topological photon transfer in Fock-state lattices [8.9] フォック状態格子のトポロジカル状態移動は結合の正弦波プロファイルを用いて高速に実証されている。
この研究は観測速度の厳密な説明と高速トポロジカルフォトニクス工学の一般的な枠組みを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:53:48 GMT)
ExDBSCAN: Explaining DBSCAN with Counterfactual Reasoning -- Additional Material [8.8] クラスタリングは、類似性によってデータポイントをグループ化する、教師なしのテクニックである。
ExDBSCANは、理論的に妥当性が保証される、実用的な対実的な説明を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:02:01 GMT)
ConTrack: Constrained Hand Motion Tracking with Adaptive Trade-off Control [8.8] 追跡データでスケールする強化学習フレームワークであるConTrackを紹介します。
ConTrackはオブジェクトのトラッキングを制約として扱い、残りのコントロール権限を動きの忠実さに割り当てる。
さらに、ConTrackは適応的な中軌道リセットライブラリで長期学習を安定化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:31:32 GMT)
The bulk spectral gap is semi-decidable: a convergent family of certified upper bounds [8.6] 量子多体系のバルクスペクトルギャップに関する証明された上界の完全族を導入する。
原理の証明として、我々のアルゴリズムをスピン$frac12$カゴメ格子ハイゼンベルク反強磁性体に適用する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:18:19 GMT)
Diversity Over Frequency: Rethinking Tool Use in Visual Chain-of-Thought Agents [8.6] 視覚エージェントは、微粒な証拠を組み込むために、思考の視覚連鎖の中で外部視覚ツールを使用する。
本稿では,3次元空間推論や医用視覚質問応答など,より困難な課題を探索するために,単純な視覚探索タスクを超えて進める。
モデルは、高いタスク精度を達成しながら、ツールの使用を徐々に停止する。
バニラトレーニングとツール使用促進の両方がロールアウトの多様性を減らし、ツールの使用率が向上しない理由を説明する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:03:53 GMT)
StepPRM-RTL: Stepwise Process-Reward Guided LLM Fine-Tuning for Enhanced RTL Synthesis [8.5] 本稿では,段階的軌跡モデリング,プロセス・リワードモデリング,検索強化微調整を組み合わせた新しいフレームワークであるStepPRM-RTLを提案する。
StepPRM-RTLは、各ステップが合理的かつインクリメンタルなコード修正を含む、標準的なソリューションからのステップワイズ推論トラジェクトリを構築する。
Monte Carlo Tree Search (MCTS)は、トレーニングデータセットを高品質な軌道で強化し、代替の推論パスを探索する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:52:48 GMT)
Weakly Supervised Incremental Segmentation via Semantic Anchors and Spatial Arbitration [8.5] SASAはセマンティックアンカーと空間配置によるセマンティック学習を安定化させるように設計されている。
表現レベルでは、学習可能なトークンのセマンティックアンカーを、長期的なセマンティックアイデンティティを保持するための厳密なクラスレベルの参照として導入する。
本研究では,信頼できない信号を直接フィルタリングし,厳密な「1つの対象,1つのクラス」制約を強制する空間ラベルアロケーション機構を開発する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:10:46 GMT)
Spike-Aware C++ INT8 Inference for Sparse Spiking Language Models on Commodity CPUs [8.4] スパイク言語モデルは、高密度のTransformerランタイムが直接利用しないアクティベーション空間を公開します。
スパースバイナリスパイク状態を実行プリミティブとして扱うC++ CPU推論ランタイムを実装した。
スパイク対応の実行は、スパース言語モデルのCPUスループットとメモリ動作を改善することができる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:03:37 GMT)
VidMsg: A Benchmark for Implicit Message Inference in Short Videos [8.4] Vidは、短いインターネットネイティブのビデオクリップで暗黙のメッセージ理解を評価するためのベンチマークである。
Vidには、9つの実用的なトピック領域にわたる400のYouTube由来のクリップと、52のきめ細かいターゲットメッセージが含まれている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:31:57 GMT)
RocketSmith: An Agentic System for High-Powered Rocket Design and Manufacturing [8.4] この研究は、高出力ロケット開発における設計、製造、最適化のプロセスが可能なエージェントシステムであるRocketSmithを提示する。
このシステムは、ソフトウェアツールのインテリジェントな自動化を可能にし、飛行安定性などの要素を検証するだけでなく、ロケット組み立てのためのパラメトリック設計コンポーネントを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:58:05 GMT)
Think-Before-Speak: From Internal Evaluation to Public Expression in Multi-Agent Social Simulation [8.2] Think-Before-Speak(TBS)は、インターバルベースのマルチエージェントシミュレーションフレームワークである。
反響関連評価は、エージェントが話す意思を高める。
発話意図が形成されると、公的な表現は主にターンアロケーション規則によって形成される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:26:01 GMT)
MLSkip: Data Skipping for ML Filters via Lightweight Metadata [8.1] データベースベンダは最近、フィルタ述語で使用できるAI関数をリリースした。
整数と文字列データに対する従来のデータスキップ技術は、新しいフィルタタイプには適用できない。
Parquetのデフォルトのmin-maxメタデータはプルーニングを可能にするのに十分である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:36:06 GMT)
Beyond Static Priors: Dynamic Neural Guidance for Large-Scale Ant Colony Optimization [8.1] 動的神経誘導を実現する新しいフレームワークであるDyNACOを提案する。
DyNACOは10万ノードのインスタンスにスケールし、神経ベースラインを上回っている。
我々の研究は、ニューラルトレーニングと反復探索ダイナミクスの整合の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:32:36 GMT)
One (Thread) Can Keep a (PRNG) Secret, but not Two [8.1] 本稿では,XNU の IPv6 フラグメントID 生成アルゴリズムに対する,新しい実用的な攻撃法を提案する。
この攻撃はアルゴリズムの擬似乱数生成器(PRNG)における競合条件の脆弱性を利用する
Appleはこの脆弱性をCVE CVE-2024-27823に割り当て、攻撃に対してXNUベースのすべての製品にパッチを当てた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:02:18 GMT)
Drifting Preference Optimization for One-Step Generative Models [8.0] ワンステップのテキスト・ツー・イメージジェネレータは、単一のフォワードパスを持つイメージを生成するため、デプロイには魅力的である。
決定論的ワンステップジェネレータのオンライン選好精選手法であるドリフト選好最適化(DrPO)を提案する。
DrPOは、現在のジェネレータから候補をランク付けし、ターゲットの報酬でランク付けし、高および低スコアのサンプルを使用して特徴空間更新方向を合成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:49:37 GMT)
LiveBand: Live Accompaniment Generation in the Audio Domain [8.0] ライブ音声入力のための高忠実度音楽伴奏をリアルタイムに生成するLiveBandを提案する。
本手法は,事前学習した因果音響オートエンコーダの連続潜時空間における因果トランスフォーマジェネレータを訓練する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:50:13 GMT)
Enginuity: A Dataset and Benchmark for Vision-Language Understanding of Engineering Diagrams [8.0] Enginuityは、エンジニアリング図上でビジュアル言語モデルを評価するための、最初のオープンデータセットとベンチマークである。
我々は、米軍部隊のコーパス上の2つのタスクを定義し、構造化された部品テーブル抽出と自由形視覚図質問応答というマニュアルを修復する。
ゼロショットおよびチェーン・オブ・フォアプロンプトによる4つのフロンティアVLMの評価を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:54:03 GMT)
Visual Instruction Tuning Aligns Modalities through Abstraction [8.0] 命令チューニングがブリッジとして機能し,視覚的特徴を大言語モデルの中間的意味層に直接埋め込むことを示す。
これらの中間層は、視覚言語処理のセマンティックコアであり、幅広いマルチモーダルベンチマークの性能において重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:42:21 GMT)
Framing Migration News with LLMs: Structured CoT as a Support for Human Interpretation [7.9] Llama3-8Bを用いたStructured Chain-of-Thought (SCoT)プロンプト手法を提案する。
SCoTは、ユーザがモデル出力を監査し、本質的に主観的なタスクにおける代替解釈を調べることを可能にする。
我々は、アノテータが「モデルの推論」の一貫性と影響を評価できる人間中心の評価を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:15:39 GMT)
G^2C-MT: Graph-Guided Context Selection for Document-Level Machine Translation [7.7] ドキュメントレベルの機械翻訳(DocMT)では、長距離の談話の依存関係をキャプチャする必要がある。
G2C-MTは、DocMTコンテキスト選択を軽量な談話グラフ上の構造化経路発見問題とみなしている。
このフレームワークは自然にマルチパスコンテキストサンプリングをサポートしており、談話・あいまいな入力に対して多様な翻訳候補を集約することで堅牢性を向上させることができる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:09:15 GMT)
Mamba-Enhanced Implicit Motion Learning for Audio-Driven Portrait Animation [7.7] 本研究では,1つの静止画像とオーディオから,現実的で時間的に整合した人間の動画を生成するための,新しい暗黙の移動フレームワークを提案する。
私たちのアプローチでは、レンダリングからモーション予測を分離する2段階のパイプラインを使用します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:43:55 GMT)
A formal definition and meta-model for a machine theory of mind [7.7] 本稿では,認知心理学,神経科学,人工知能のエビデンスに支えられた原理を基礎として,心の機械理論という概念の厳密な形式的定義を提案する。
また、マシン・セオリー・オブ・マインド(Machine Theory of Mind)の一般的な全体論的メタモデルも推進し、そのようなモデルを実証的にベンチマークする際の技術状況を調べる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:48:59 GMT)
Neural Navigation Functions for Zero-Shot Generalizable Motion Planning [7.6] 我々は,未知の環境空間を横断するゼロショット転送が可能な,学習されたリアクティブナビゲーション機能であるニューラルナビゲーション関数(Neural-NF)を紹介した。
Neural-NFは、データ駆動型適応を構造化楕円型プランナーに配置する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:06:25 GMT)
SHARP: Sleep-based Hierarchical Accelerated Replay for Long Range Non-Stationary Temporal Pattern Recognition [7.6] SHARP(Sleep-based Hierarchical Accelerated Replay)は、時間学習を2つの補完的なコンポーネントに分解するフレームワークである。
SHARPは、緩やかな睡眠中に、げっ歯類で観察される加速されたリプレイにインスパイアされ、時間的に構造化されたメモリトレースをアクセラレーションされた形で再生するオフライン(スリープ)フェーズを組み込む。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:41:37 GMT)
Designing a Hardware Reverse Engineering Course: Lessons from Eight Years in a Rapidly Evolving Tech Domain [7.5] ハードウェアリバースエンジニアリング(HRE)はサプライチェーンの脅威を検出するために不可欠である。
本稿では,デジタル回路解析とICからのデジタル回路抽出に着目したHREコースを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:18:23 GMT)
Quantifying the biophysical properties of stomatocytes in health and disease [7.5] 遺伝性ストマトサイトーシス(英: hereditary stomatocytosis、HS)は、カップ型赤血球を特徴とする赤血球障害である。
このパラドックスはRBCが部分的に独立したパラメータによって支配されているため持続する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:44:26 GMT)
Using Text-Based Causal Inference to Disentangle Factors Influencing Online Review Ratings [7.4] 本稿では,テキストに基づく因果解析,特にCausalBERTの最近の進歩に基づいて,各因子が全体レビュー評価に与える影響を解消する手法を提案する。
レビューのテキスト参照を,実世界の属性のプロキシとして扱う。
我々は、米国K-12校600万以上のレビューから得られた実・半合成データに対する我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:26:44 GMT)
Face versus Body Tracking for Human-Robot Interaction: An Egocentric Dataset [7.4] 最先端のコンピュータビジョンモデルは、監視や自動運転に非常に最適化されている。
社会ロボットは、人間が跳ね返ったり、お互いを妨害したり、フレームを離れたりといった、異なる自我中心の課題に直面します。
我々は、Furhatロボットを介して収集された、新しい、カスタムアノテーション付きエゴセントリックデータセットを導入し、複雑な社会的ダイナミクスを捉える。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:15:17 GMT)
Finding Needles in the Haystack: Transductive Active Labeling in Ecology [7.1] 現在のプラクティスは、アクティブな学習を誘導的に評価し、ホールドアウトテストセットでの予測性能を推定します。
人間のループを無視することは、ラベルの継続の重要性を過小評価することを示した。
我々の分析は、この長い尾において、トランスダクティブな目的が、予測から発見へと重要度をシフトしていることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:01:22 GMT)
Private Embedding Lookup with Encrypted Compact Queries under Fully Homomorphic Encryption [6.9] ホモモルフィック暗号化(FHE)は、暗号化されたクライアントデータに対する推論を可能にするが、埋め込みルックアップを単純なテーブルアクセスからホモモルフィックな計算に変換する。
本稿では,サーバ側への埋め込みを継続し,クライアントから暗号化された埋め込みベクタの送信を回避するために,Independent Vector Evaluation (IVE)を提案する。
提案手法は,従来の手法に比べて最大78.4倍のアモータイズされたルックアップ時間を向上することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:50:04 GMT)
Quantum Information Harvesting with the Parallel Quantum Flow Algorithm [6.9] 本稿では,シングル・アンド・ダブルスモデルに基づくQFlowフォーマリズムの高性能コンピューティング実装について報告する。
82と114の軌道からなるターゲット空間に対して、フローは6つのアクティブな軌道型アクティブな空間に6つのアクティブな電子を含むことを実証する。
QFlow形式は拡散関数を持つ拡張基底集合において高い精度を維持しており、現実的な大規模量子化学シミュレーションの可能性を強調している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:08:10 GMT)
Training-Free Multi-Concept LoRA Composition with Prompt-Aware Weighting [6.9] Low-Rank Adaptation (LoRA)は、事前学習された拡散モデルを特定の視覚概念やスタイルに適応させることで、テキスト・画像生成におけるパーソナライズを実現している。
本稿では,複数のLoRAモジュールの出力を最適に組み合わせることで,マルチコンセプトのカスタマイズをシンプルかつ効果的に行う手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:42:09 GMT)
IDO: Incongruity-aware Distribution Optimization for Multimodal Fake News Detection [6.7] 本稿では,偽ニュース検出の性能向上を目的としたIDO(Inongruity-Aware Distribution Optimization)を提案する。
実情の不整合性に対して,意味的に識別可能な埋め込みを得るために,チャネルワイドの重み付け戦略を導入する。
モダリティの不整合性には、非整合性コントラスト学習を用いて、クロスモーダルな意味情報を学習する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:02:52 GMT)
Set-Preserving Calibration from Conformal P-Values to E-Values [6.7] そこで本研究では, 共形p値によって誘導される予測セットを変更することなく, 共形p値をe値に変換する新しいP2Eキャリブレータを提案する。
このe値の定式化は、e値のマージとランダム化における最近の進歩の原則的利用を可能にする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:06:01 GMT)
ProjQ: Project-and-Quantize for Adapter-Aware LLM Compression [6.6] トレーニング後の量子化(PTQ)とローランド適応(LoRA)は、LLM(Large Language Model)の効率的なデプロイメントのための標準パイプラインである。
量子化雑音を低ランク多様体に制約する新しいフレームワークである textbfProjQ を提案する。
ProjQは、量子化エラー補償と下流タスクの微調整の両方において、既存のメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:20:42 GMT)
Ultralytics YOLO26: Unified Real-Time End-to-End Vision Models [6.5] YOLO検出器は依然として推論時の非最大抑制に依存しており、Focal Distribution Lossによる重い検出ヘッドを持ち、正のラベルを割り当てることなく最小の物体を残すことができる。
我々は,これらの制約に対処する統合リアルタイムビジョンモデルファミリーであるUltralytics YOLO26を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:01:13 GMT)
From 'What' to 'How' and 'Why': Sharing LLM-Generated Retrospective Summaries of Older Adults' Passive Tracking Data with Remote Family Members [6.5] 高齢者のRAMに対するマルチモーダル追跡データから振り返りサマリーを生成する方法について述べる。
既存のシステムであるVital Insightを活用して、初期要約を生成しました。
次に、システムをマルチレイヤ、マルチエージェント、インサイト駆動の要約アプローチに再設計しました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:46:00 GMT)
DiverAge: Reliable Pluralistic Face Aging with Cross-Age Identity Relation Guidance [6.3] 顔の老化は、長期的なバイオメトリック分析、クロスエイジのアイデンティティ検証、および法医学的アイデンティティ分析において重要な役割を担っている。
既存の決定論的老化法は、視覚的にプラウジブルな年齢差のある顔を合成することができるが、通常は多様性を欠いている。
拡散自動符号化に基づく階層型多元性顔老化フレームワークである textbfDiverAge を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:39:31 GMT)
Toward Gripper-Integrated Active Electrosense for Pre-Contact Sensing in Underwater Soft Grippers [6.2] アクティブ・エレクトロセンスは、導電性媒体中の印加電体の摂動を測定することにより、接触前に近接的な信号を与えることができる。
我々は,タコにインスパイアされたグリップに電極配置を個別に配置し,オフザシェルフハードウェアを用いてマルチチャネルセンサ電圧を記録する。
これらの知見は,水中軟部手術の前処置として,グリップインテリセンスの系統的研究を動機付けている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:04:22 GMT)
Informational completeness of qubit measurements and IC preservability of qubit channels: Characterization and Quantification [6.2] 情報完全(IC)測定は、結果統計によって未知の量子状態が一意に決定されるため、有用な測定方法である。
任意の量子測度に対する情報完全性の定量化について,忠実な測度の導入と特徴付けにより検討する。
本研究では,量子計測における情報完全性と量子チャネルの保存能力の両方を研究するための定量的枠組みを提供するだけでなく,情報完全性と量子コヒーレンスの間の概念的関係について重要な知見を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:50:44 GMT)
Exact equivariance, kept through training, buys zero-shot generalisation across the symmetry group [6.2] 等変エンコーダ$E$と等変予測器$f$から構築された潜在世界モデルは、トレーニング損失の証明可能な対称性を継承する。
このエンドツーエンドをラップトップスケール(CPU/MPS、完全シード)で検証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:20:24 GMT)
PsychoPass: Geometric Profiling of Multi-Turn Adversarial LLM Conversations [6.2] 大規模言語モデル(LLM)に対するマルチターンジェイルブレイク攻撃は、現在のガードレールのミスマッチを明らかにする。
本稿では,表現空間における会話を経路としてモデル化し,コンテンツからダイナミクスへのシフトを提案する。
我々は,潜在的な攻撃を予測するために,埋め込み空間における会話軌跡から幾何学的特徴を抽出するフレームワークであるBioPassを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:24:20 GMT)
AvatarMix: Identity-Preserving Cross-Avatar Composition for Outfit Personalization [6.1] AvatarMixは、服装の忠実さとアイデンティティの保存における最先端の成果を達成し、リアルな3D服のパーソナライゼーションの新しい視点を提供する。
提案手法は, リアルな3D服のパーソナライゼーションの新たな視点として, 衣服の忠実度とアイデンティティの保存の最先端的な結果を実現する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:24:31 GMT)
LAP: An Agent-to-Instrument Protocol for Autonomous Science [6.0] 大規模な言語モデルエージェントが実験を計画し、自動運転研究所がそれらを実行している。
このようなシステムはすべて、推論エージェントと物理機器のリンクをゼロから再構築する。
最近のエージェント・インターオペラビリティ・プロトコルはエージェント・ツー・ツールエッジを明確にし、Googleのエージェント・ツー・エージェントエッジ(A2A)はエージェント・ツー・エージェントエッジである。
このギャップを埋めるプロトコルであるLab Agent Protocol (LAP) を提示する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:03:43 GMT)
Contrastive Augmented Transformer with Domain-specific Enhancement for Robust Multi-scenario Metal Surface Defect Detection [6.0] 本稿では,堅牢な欠陥検出のためのコントラスト拡張トランス(CAT)フレームワークを提案する。
Catは階層的なSwin Transformerのバックボーンを採用し、機能ピラミッドネットワークを再設計して、低レベルのテクスチャと高レベルのセマンティクスを効果的に融合させる。
KolektorSDD2データセットの実験結果は、CATが99.54%のピクセルレベルのAUROCを達成し、既存の手法より優れていることを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:20:12 GMT)
APIC: Amortized Physics-Informed Calibration using Neural Processes [6.0] 本稿では,Amortized Physics-Informed (APIC)を導入し,拡張性のあるベイズ推論を実現する。
我々のフレームワークは、インスタンス固有の物理的パラメータを、共有された状態依存構造的相違から切り離すために、2分岐の潜在アーキテクチャを採用している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:04:43 GMT)
SMAC-Talk: A Natural Language Extension of the StarCraft Multi-Agent Challenge for Large Language Models [6.0] 本稿では,協調型マルチエージェント環境におけるLLMエージェントの評価を目的とした,StarCraft Multi-Agent Challengeの自然言語拡張であるSMAC-Talkを紹介する。
SMAC-Talkは、エージェントの調整と信頼を調査するために使用される自然言語通信チャネルを含んでいる。
我々は、このコミュニケーションチャネルを使用して異なる評価シナリオを構築する。例えば、コミュニケーションだけで同盟者を混乱させ欺こうとする組込みコミュニケータの設定を含む。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:40:04 GMT)
A Systematic Analysis of Linguistic Features in AI-Generated Text Detection Across Domains and Models [5.9] 解釈可能な言語機能は、あるテキストが機械生成される理由を説明するための有望なアプローチを提供する。
我々は、AI生成テキストを特徴付けるための言語信号の堅牢性を評価する大規模な実証的研究を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:46:22 GMT)
Covert Influence Between Language Models [5.8] 本研究では,3つのインターフェースにまたがる隠蔽効果のリスクについて検討する。
人間の目に見える痕跡を残さずに達成できる影響の規模は様々である。
サンプルごとの属性の推測時間を用いて,3つのインターフェースすべてにまたがる包括的影響について検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:10:56 GMT)
EpiFormer: Learning Antigen-Antibody Interactions for Epitope Prediction via Geometric Deep Learning [5.7] EpiFormerは、抗体予測のための一般的な変種デコーダフレームワークである。
従来のベストメソッドよりも、標準ベンチマークのF1スコアの40%以上改善されている。
EpiFormerは、既知の生物学的原則をエンドツーエンドトレーニングの創発的な行動として発見する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:20:25 GMT)
BigFinanceBench: A Workflow-Grounded Benchmark for Financial-Research Agents [5.7] BigFinanceBenchは、オープンエンドの粗悪な財務調査タスクの928項目のベンチマークである。
導出を独立にチェック可能なステップに分解する。
アナリストワークフロー全体にわたって、部分クレジット評価と障害のローカライズをサポートする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:12:34 GMT)
Towards Compact Autonomous Driving Perception with Balanced Learning and Multi-sensor Fusion [5.6] 本稿では,自律運転認識タスクを1回の前方通過で処理する,小型な深層マルチタスク学習モデルを提案する。
このモデルは、セマンティックセグメンテーション、深度推定、光検出・測光(LiDAR)セグメンテーション、鳥の視線投影を同時に行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:35:42 GMT)
Wheel-Mounted/GNSS Fusion with AI-Aided Position Updates [5.5] 本稿では,車輪搭載慣性センサ,周期軌道の強制,および誤差状態拡張カルマンフィルタにおける位置更新を伴う車両の変位を抑えることができる簡易かつ効率的なニューラルネットワークを統合したハイブリッドニューラル慣性ナビゲーションフレームワークを提案する。
実験結果から,本手法は位置決め精度を向上し,標準の車輪搭載慣性センサ融合と比較して根平均2乗誤差を約46 %削減できることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:27:05 GMT)
Autonomous Navigation System for Library Service Robot Based on Unitree Go2 Edu [5.5] 本稿では, 4D LiDAR, 前面深度カメラ, IMUを備えた, ユニツリー Go2 Edu の ROS 2 ナビゲーションシステムを提案する。
図書館が荒削りな地形であると仮定するのではなく、実際の配備における現実的な移動性の不連続を目標にしている。
実際のライブラリでは,静的,低密度,高密度の動的シーンにおいて,100%,96%,88%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:49:25 GMT)
Overlaying Governance: A Compositional Authorization Framework for Delegation and Scope in Agentic AI [5.5] 本稿ではエージェントAIシステムのための構成的ガバナンスフレームワークを提案する。
デリゲートの種類とそのパーミッションと説明責任の意味を定義します。
これはエージェントAIシステムにおける説明可能な認可のための形式的かつ実用的な基盤を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:39:39 GMT)
ModuLoop : Low-Level Code Generation using Modular Synthesizer and Closed-Loop Debugger for Robotic Control [5.4] 大規模言語モデル(LLM)は、コード生成や問題解決など、さまざまな領域で素晴らしいパフォーマンスを示している。
クローズドループモジュール型コード合成フレームワークを提案する。
このフレームワークは、タスク固有の微調整なしで事前訓練されたLLMを利用して、モジュール化されたコード計画と生成を実行する。
提案手法をRGB-Dカメラとロボットアームの校正に適用し,実環境における有効性を検証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:30:19 GMT)
Long Live Fine-Tuning: Task-Specific Transformers Outperform Zero-Shot LLMs for Misinformation Response Classification on Reddit [5.4] 我々は,誤情報談話の微妙な分類にスケールと一般能力が十分であるという暗黙の仮定を検証した。
BART-MNLI、3つのLlama変種、3つの商用フロンティアLLM、微調整されたDistilBERTとRoBERTaの9つのモデルを比較した。
検証のコンテキストでは、欠落した信念がコストの低いエラーである場合、タスク固有の微調整の方がより信頼性の高い選択である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:58:59 GMT)
VirtualMLE: A Virtual ML Engineer that Optimizes Sequential Recommenders [5.4] 我々は、実行、リフレクション、メモリ更新のクローズドループに最適化するレコメンダを整理するLLM-agentフレームワークである textbfVirtualMLE を提案する。
我々は、SASRecとHSTUという2つの代表的なバックボーンを持つ3つのAmazon SRベンチマークでVirtualMLEを評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:31:15 GMT)
Multi$^2$: Hierarchical Multi-Agent Decision-Making with LLM-Based Agents in Interactive Environments [5.4] 大規模言語モデル(LLM)研究の中心的な目標は、動的環境との持続的な相互作用を計画し、行動し、適応できるエージェントシステムを構築することである。
エージェントの振る舞いを補完的な役割に明示的に分解する階層的マルチエージェント意思決定フレームワークであるMulti$2$を紹介する。
高レベルエージェント(システム1)は、教師付き微調整(SFT)を用いたコンテキスト認識サブゴール生成に焦点を当て、低レベルエージェント(システム2)は、対話型環境でオフラインからオンラインへの強化学習(RL)を通してアトミックアクションを実行する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:20:09 GMT)
A Close Look At World Model Recovery In Supervised Fine-Tuned LLM Planners [5.3] Supervised Fine-tuning (SFT)は、大規模言語モデル(LLM)におけるエンドツーエンドの古典的計画を改善する
これらのモデルは、彼らが解決しようとしている計画上の問題を表現し、理由づけることも学べるだろうか?
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:09:16 GMT)
Neural Change Prediction: Relating Software Changes to Their Effects and Vice Versa [5.3] 本稿では,ソフトウェア変更とプログラム動作に対する動的影響の関係を学習し,予測する手法であるニューラルチェンジ予測を提案する。
与えられたプログラムとテスト入力に対して、コードに多数の突然変異を自動で適用し、これらの変更がプログラムの出力をどのように変更するかを観察する。
我々は、CSS構成ファイルの詳細なケーススタディとPythonプログラムの評価を行い、ニューラルチェンジ予測の汎用性と幅広い適用性を実証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:23:35 GMT)
PURGE: Projected Unlearning via Retain-Guided Erasure [5.1] PURGEは、単純だが未発見の観測(継続学習(CL)と機械未学習(MU))に基づいて構築された機械学習アルゴリズムである。
CLは古いタスクを忘れずに新しいタスクを学習しようとします。MUは、反対方向に同じ根底にある緊張力を表す保持パフォーマンスを損なうことなく、特定のデータを消去しようとします。
PURGEは、MIA AUROCを0.5(理想)に近い精度で達成し、勾配上昇、KLユニフォーム、プライバシーユーティリティフロンティアのいくつかのベースラインを達成しながら、常に96%以上の精度を維持している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:53:01 GMT)
Stationarity-Aware Retrieval-Augmented Time Series Forecasting [5.1] 時系列予測は歴史的パターンに依存している。
リアルワールドシリーズは、しばしば非定常性やレギュラーシフトを示す。
定常性を考慮した検索時系列予測手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:47:16 GMT)
Automated Repair of Requirements for Cyber-Physical Systems in Simulink Requirements Tables [5.0] 本稿では,システム実行データを利用したCPS要求の誤りを修復するフレームワークを提案する。
提案手法は,時間に基づく信号よりも宣言的要求の正しさを評価する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:41:20 GMT)
The Reliability Gap in Benchmark Auditing: Distribution Shift and Scale as Failure Modes of Contamination Detection [4.9] トレーニングデータメンバーシップを検出する統計ツールは存在するが、ほとんど制御された学術体制でのみ検証されている。
分散シフトとスケール制約という,未調査の2つの障害モードを特定します。
335点中199点しか正しい結果が得られていない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:21:22 GMT)
Hierarchies of Calibration: Classification meets Regression [4.9] キャリブレーションの概念は確率的予測とそれぞれの結果との互換性を形式化する。
本稿では,分類および回帰タスクのために提案されたキャリブレーションの考え方をレビューし,拡張し,橋渡しする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:05:20 GMT)
Stumbling Into AI Emotional Dependence: How Routine AI Interactions Reshape Human Connection [4.9] 我々は,汎用プラットフォーム上でのタスク指向インタラクションにおいて,AIの感情サポートが偶然に現れることを示す。
AIの感情的サポートの肯定的な経験は、AIの感情的能力に関する人々の信念を更新し、AIの好みを増し、人間の好みを減らします。
我々は、効果的な規制が汎用AIシステムにまで拡張され、人々が支援を求める方法における累積的かつ軌道レベルの変化に対処すべきであると主張している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:18:39 GMT)
FLARE: Fine-Grained Diagnostic Feedback for LLM Code Refinement [4.8] 既存の方法は、テストの失敗や自己批判のようなフィードバック信号を使って、生成されたコードを反復的に洗練する。
本稿では,バグローカライゼーションとコードリファインメントのためのラインレベルの不確実性信号を予測する軽量診断モデルを備えた反復的フレームワークであるFrareを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:29:17 GMT)
veriFIRE: an Industrial Case Study in Verifying Consistency Properties for a DNN-Based Wildfire Detection System [4.7] 本稿では,システム内のテキスト整合性を検証するためのエンドツーエンド手法を提案する。
提案手法は,既存のニューラルネットワーク検証器に対して,アプリケーション基底要求をソルバ互換クエリにエンコードする。
その結果,産業システムにおいて意味のある,ドメイン固有の保証が得られることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:32:03 GMT)
Beyond Compression: Quantifying Spectral Accessibility in Vision Representations [4.7] 視覚言語モデルは、学習したプロジェクション層を通して視覚的特徴を共有埋め込み空間にマッピングする。
本研究では,空間周波数アクセシビリティによる表現の変化について,モデル表現からの帯域制限エネルギーの線形回復率を用いて検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:42:54 GMT)
Easy-to-Use Shielding for Reinforcement Learning [4.6] シールドは、アクションセーフティを決定するための環境モデルという形でドメイン知識を仮定するテクニックである。
シールドの適用には、通常、正式な手法と実質的なエンジニアリング作業の専門知識が必要である。
我々はシールド合成ツールであるTempestを安全なRLのための実用的なバックエンドに拡張する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:50:34 GMT)
Few-Shot Prediction for Pulsar Noise with Long Short-Term Memory Network [4.6] 本研究は,パルサーの時間残差を限られたデータで予測する新しい手法を提案する。
提案手法は,モデルに依存しないメタ学習アルゴリズムを用いて,Long Short-Term Memory (LSTM) ネットワークを最適化する。
我々の軽量構造は16.86MBのCPUメモリと18ミリ秒の1ステップ残差予測のみである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:43:19 GMT)
Structure-Preserving Quantum Method of Lines for Evolutionary PDEs with Mixed Boundary Conditions [4.6] 本稿では,2次PDEのための構造保存量子アルゴリズムの解析と回路設計について述べる。
我々はブロックエンコード構造と回路実装を明示的に実装した量子アルゴリズムを実装した。
我々は、対流拡散方程式、不均一熱方程式、クライン=ゴルドン方程式に関する古典的な数値実験を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:48:53 GMT)
Training a Predictive Coding Network on ImageNet using Equilibrium Propagation [4.6] そこで我々は, EP の集中型変種と PCN の新たな平衡スキームを組み合わせた PCN の EP ベーストレーニング手法を開発した。
私たちの知る限り、これはImageNetスケールでのPCNとEPベースのトレーニングの初めての実演です。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:52:29 GMT)
FLIPS: Instance-Fingerprinting for LLMs via Pseudo-random Sequences [4.4] 我々は,同一の大規模言語モデルの構成を区別するレギュレータ指向のパラダイムであるインスタンスレベルのフィンガープリントを導入する。
提案手法FLIPSは237モデルインスタンスで96%(クローズドセット)、90%(オープンセット)の識別精度に達するために生成したバイナリランダムシーケンスのバイアスを利用する。
これは、インスタンスレベルの指紋認証が規制に必要であり、事実上実現可能であることを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:39:50 GMT)
Nonlocal Mean Field Schrödinger Bridge with Learned Interactions [4.3] この研究は、粒子系を相互作用する平均場拡張である平均場シュルディンガー橋について考察する。
ニューラルネットワークサロゲートとの非局所的な相互作用を近似することで、このボトルネックに対処する。
結果として生じる4段階交互アルゴリズムは、推論時の人口規模において、ステップごとのコストを2次から線形に削減する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:30:46 GMT)
A Training-Free Mixture-of-Agents Framework for Multi-Document Summarization using LLMs and Knowledge Graphs [4.3] 文書要約(MDS)は,テキストデータの集合から重要な情報を抽出する上で重要な役割を担っている。
既存のアプローチは、複雑なドキュメント間の関係を捉えるのに苦労することが多く、大量のラベル付きデータを教師付きトレーニングに頼り、ドメインや言語をまたいだ限定的な一般化を示す。
本稿では,大規模言語モデル(LLM)と知識グラフの相補的長所を利用するMDSのための学習自由混合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:39:07 GMT)
Overview of the EReL@MIR 2025 Multimodal Document Retrieval Challenge (Track 1) [4.2] MIR Challengeは、Web Conference 2025と共同で、最初のEReL@MIRワークショップで開催された。
参加者には、2つの補完的な体制を扱うエンフィングル検索システムの構築を依頼した。
本報告では,課題設計,データセット,評価プロトコルについて述べる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:39:32 GMT)
Demonstration of a Spherical Penning Trap for Single Electrons [4.2] 球状ペニングトラップは、よく分離されたクリーンなマイクロ波共鳴を持つ。
球状ペニングトラップにおける単一電子トラップを実演し、そのマイクロ波共鳴構造を特徴付ける。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:34:04 GMT)
Agentic Generation and Evolution of Knowledge Models [4.2] TrustModelは、生きた知識モデルのエージェント生成と進化のためのビジョンである。
TrustModelは3つのエージェントサブシステムで構成されている。
モデルベーステストにおいてTrustModelをどのようにインスタンス化できるかを示し、他のMDEアクティビティをサポートする可能性について議論する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:49:23 GMT)
Full Extractors for Logical Processing in Hypergraph Product Codes [4.1] 量子低密度パリティチェック(QLDPC)符号は、実用的な低オーバーヘッド量子メモリの候補である。
コードブロック上の任意の論理的パウリ演算子を測定することができる手術システムを構築した。
距離10HGP符号に対して、回路レベルのノイズシミュレーションは、物理誤差率0.1%で約10-6$の論理的測定誤差率を得る。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:25:18 GMT)
On the saturated cases of the distillability conjecture [4.1] 等式は行列に$A$と$B$を2対2のブロック対角線に強制することを示す。
また、同定された飽和点が制約多様体上の目的関数の臨界点であることも証明する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:29:10 GMT)
Synthetic Hallucinations, Real Gains: Hard Negatives from Frontier Models for FIM Hallucination Mitigation [4.1] オートコンプリートを動かす小さなオープンソースコードモデルでは、Fill-in-the-Middle(FIM)の補完が出力される。
そこで我々は,フロンティア符号モデルを用いて,強陰性として可塑性/反極性補完を合成する,実行自由な代替案を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:15:50 GMT)
What Do Students Learn? A Feature-Level Analysis of Dark Knowledge [4.1] コンフュージョン蒸留(Confusion Distillation, CD)は、モデル自体の進化する混乱パターンをダイナミックなソフトターゲットとして活用する教師なしの自己蒸留法である。
CD は CIFAR-100 の ResNet-34 と ResNet-50 の競合性能を達成し、CS-KD や PS-KD といった既存の自己蒸留法よりも 1.2% 向上した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:38:18 GMT)
Can AI Review Improve Paper Drafting? An Empirical Study on 20 Computer Architecture Submissions [4.0] 我々は、AIレビューが人間のレビューとどのように一致しているかを明らかにするために、さまざまなレベルの提出系統を持つ20のコンピュータアーキテクチャー論文を調査する。
このケーススタディを実行するために、Web UI統合ツールであるemphAI-Paper-Reviewを構築し、ドラフトペーパーの構造化AIレビューを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:07:26 GMT)
Quantum-Classical Equivalence for AND-Functions [4.0] 量子通信複雑性の大きな問題は、量子プロトコルが古典的プロトコルよりも指数関数的に効率的であるかどうかである。
各ブール関数$f$に対して、有界エラー量子および古典的通信複雑性は決定論的に関連していることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:10:16 GMT)
A Negative Result on Cross-Model Activation Transfer in a Pythia Multi-Hop Setting [4.0] 最近の研究は、学習中に生成されたデータに隠された信号を通して言語モデルが行動特性を伝達できることを示している。
ある言語モデルは、隠れたアクティベーションを翻訳して注入することによって、推論時に有用な中間推論状態を他の言語に伝達できるだろうか?
我々は、制御されたPythia-160MからPythia-410Mのマルチホップ推論設定でこの問題を検証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:46:01 GMT)
Self-Certifying Transport MCMC via Dual Spectral-Gap Certificates [3.9] CerT-MCMCは、マルコフ・チェーンのモンテカルロに厳格な収束証明書を付与するフレームワークである。
被覆証明書は有限サンプル被覆引数による完全な提案支援に重み比の振動を束縛する。
量子核証明書は、振動が1次元の経験的量子化によって制御される高確率残基に注意を向ける。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:21:49 GMT)
ZX-Calculus:Trace-Indexed Dependent Types and Epistemic Semantics [3.8] 我々は Martin-Lof Dependent Type (MLTT) の保守的な拡張である ZX-Calculus (Knowledge Evolution Calculus) を提案する。
これは、トレースインデクシングされたタイプ、プレシーフ非モノトーン意味論、建設的なAGM信条修正を統合している。
Coq の機械化は論文に付随する(34の完全証明、0は2つの中心的な結果を認めている)。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:51:41 GMT)
SplitAdapter: Load-Aware Humanoid Loco-Manipulation via Factorized Adaptation [3.8] textbfSplitAdapter: Factorized Adaptationによる負荷対応ヒューマノイドロコマニピュレーションを提案する。
SplitAdapterは、事前訓練されたボックス操作ポリシーを凍結し、オブジェクト/ロードと動的に認識されるコンテキストエンコーダで拡張する。
sim-to-sim実験と実世界展開において、SplitAdapterは、基本ポリシーと世界モデルのFiLMベースラインを2ドル、4ドル、6ドルkg、ピックアップ/配置高さ0ドル、30ドル、60ドルcmでフルタスクの成功を改善する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:10:49 GMT)
Selecting haptic guidance models in teleoperation: guidelines from a comparative user study [3.8] 遠隔操作におけるハプティックガイダンスは、力フィードバックを通じてオペレータのパフォーマンスを向上させる。
本稿では,タスク,環境,操作者を考慮した最も適切なモデルを選択するためのガイドラインを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:22:10 GMT)
Enhancing Operational Safety via Agentic Dialogue Hazard Identification Analysis [3.8] HAZDIALは,構造化エージェント対話・マルチエージェント・マルチターンインタラクションがNLPに基づくハザード識別の質を向上させるかどうかを調査するフレームワークである。
この研究は対話システム、マルチエージェント推論、AI安全性の交差点を前進させ、対話駆動型ハザード分析の実証的な証拠を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:54:51 GMT)
Selective Token-Level Cryptographic Redaction for Privacy-Preserving Clinical Deployment of Large Language Models [3.8] 適応言語分解(Healthcare Encryption and Redaction)について紹介する。
HERALDは、機密トークンのみを暗号化することで、このバランスを達成するために設計されたトークンレベルの暗号リアクションフレームワークである。
HERALDはクライアント側で完全に動作し、機密性の高いコンテンツがストレージ、送信、処理を通して暗号化されることを保証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:40:56 GMT)
Triple exceptional point with unitary paths of unfolding in a three-site fermionic Swanson-like model [3.8] 一般的なボソニックスワンソンモデルのフェルミオン三サイト一般化について検討した。
正確な、数値誤差非依存の可溶性は、別の、避けられた、偽のエネルギーレベルの交差のために必須である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:39:44 GMT)
Brief Announcement: Generative Markov Model for Distributed Computing Systems [3.8] 本稿では,構造化システム状態上で分解された生成マルコフモデルとして,分散コンピューティングシステムをモデル化するための一般的なフレームワークを提案する。
これにより、他の難解なシステム状態に対するシミュレーション、推論、およびポリシー学習を可能にするトラクタブルモデルが得られる。
我々は、協調AI推論のケーススタディを通じて、当社のフレームワークを実証する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:50:58 GMT)
Validation-Gated Multi-Agent Governance for Online Adaptation of Thermal-Hydraulic Surrogate Models under Operating-Regime Shift [3.7] 本研究では,実験熱水循環データに対するガード付き連続適応フレームワークを開発した。
MA-Fullモードでは、ロール分離されたマルチエージェント・カウンシルが評価ストリームの各ステップをレビューし、最低平均誤差5.72、35.8%を達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:31:48 GMT)
FinStressTS: A Parametric Synthetic Benchmark for Time-Series Forecasting in Finance [3.5] FinStressTSは、モデル動作と制御された構造的原因をリンクするメカニズム対応のベンチマークである。
信号対雑音比の低さ、潜伏要因、重尾、政権交代、跳躍など、財務予測は困難である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:41:50 GMT)
CADET: A Modular Platform for Evaluating Distributed Cooperative Autonomy in Connected Autonomous Vehicles [3.5] CADETは、分散協調自律システムの体系的かつ再現可能な評価のためのモジュールプラットフォームである。
分散デプロイメントの選択は安全性を形作っており、V2Vインテントパケットはクラウドベースの認識よりも優れており、RSUは同時要求によってオーバーロードされるまで安全性を維持する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:13:13 GMT)
Unveiling the Structure of Do-Calculus Reasoning via Derivation Graphs [3.4] Do-calculusは、介入クエリの一般的な推論システムを定義する。
本稿では、do-calculusルールの適用方法と組み合わせ方法を示す導出グラフを紹介する。
等価因果クエリに識別アルゴリズムを適用すると、複数の有効な推定値が生成されることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:40:39 GMT)
A Fast Screening Approach for High-dimensional Outcomes and High-dimensional Predictors [3.4] 本稿では,新しいスクリーニングフレームワークであるグラフ独立デュアルスクリーニング(GIDS)を提案し,応答変数と予測器の次元性を同時に低減する。
我々は、ゲノムワイド865,353DNAメチル化と49,386転写因子との相互作用を解析して、アルツハイマー病神経画像イニシアチブデータセットにGIDSを適用した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:49:02 GMT)
Plateau That Never Comes: When Efficiency Claims in Datacenters and AI Become Greenwashing [3.4] 生成AIによるデータセンタの拡張は、サステナビリティとの互換性がますます高まっている。
しかし、これらの主張は、絶対的な電気、水、材料、廃棄物、そしてコミュニティが直面する負担が減少していることを示さないことが多い。
これらの持続的成長の物語は、持続可能性の主張に効率改善を使用すると、グリーンウォッシングとして機能し始めます。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:01:40 GMT)
A Training-Efficient Transformer-Based Anti-Spoofing Network for Logical Access in ASVspoof 5 [3.4] 本稿では,ASVspoof 5 Track 1のクローズド条件に着目し,標準的なクロスエントロピートレーニングはハードトライアルに十分な注意を払わない可能性がある。
本稿では,トランスフォーマーをベースとした集中型注意型ランキングネットワークTFPARNを提案する。
同じプロトコルで再実装されたAASISTとRawNet2ベースラインと比較して、TFPARNは、minDCFが0.2430、EERが12.52%である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:38:12 GMT)
AI-Generated Traces for Novice Programmers: Learning Effects and Learner Differences in a Multi-Institutional Study [3.4] GAT(Generated Animated Traces)を提案する。
GATは、ソースコード、実行状態、概念的なアナロジーをコーディネートするAI生成のアナログベースのナレーションアニメーションである。
即時学習のパフォーマンスと経験、コース終了のエンゲージメント、試験パフォーマンスを測定します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:51:27 GMT)
Central Description Length (CDL) Clustering Validation Index [3.4] クラスタリング検証指標(CVI)は、候補クラスタリングのランク付けのための内部スコアを提供する。
一般的なCVIはユークリッドコンパクト性と分離項から作られている。
本稿では,CDL(Central Description Length)クラスタリング検証指標を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:47:09 GMT)
Collision Resistance of Single-Layer Neural Nets [3.3] 単層二層ニューラルネットワークにおける衝突のアルゴリズム的複雑性について検討する。
本研究は, 衝突抵抗の厳密な基準として, オーバーラップギャップ特性を用いた最初の研究である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:52:45 GMT)
CoralBay: A Self-Supervised CT Foundation Model [3.2] 自己教師付き学習は2次元の自然画像に対する大規模な事前学習を可能にし、タスク間で効果的に伝達する汎用的な視覚表現を生み出した。
階層型3Dスウィンバックボーンを用いてDINOを拡張し,マルチスケール機能に自己蒸留を適用するフレームワークであるCoralBayを紹介する。
結果として、CoralBayは、様々な解剖学的目標に対して強い、一貫したパフォーマンスを示す、幅広い下流の放射線学的タスクに効果的に移行する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:51:14 GMT)
A 3D Isovist World Model -- Revealing a City's Unseen Geometry and Its Emergent Cross-City Signature [3.2] 都市を航行するエージェントは、周囲がどう変化するかを予測する世界モデルに頼っている。
我々は,過去のアイソビストと運動行動の短い歴史から,次のアイソビストを予測する具体的世界モデルを導入する。
マンハッタンとパリで訓練された1つの都市ブラインドモデルは、都市横断的な空間的シグネチャを発達させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:11:30 GMT)
Seg2Track++: Probabilistic Track Validation and Data Association for Multi-Object Tracking and Segmentation [3.1] この作業では、SAM2と新しいトラック管理モジュールとセグメンテーションを統合してゼロショットMOTSを実行するフレームワークであるSeg2Track++を導入する。
KITTI MOTS実験の結果, 精度向上, 偽陽性伝播の低減, 微調整を伴わないロバストトラック管理が得られた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:43:00 GMT)
Learning to See via Epiretinal Implant Stimulation in silico with Model-Based Deep Reinforcement Learning [3.1] 我々は、画像を形成するために等方性と異方性の形状を組み立てることを学ぶ深層強化学習エージェントを訓練する。
本研究は, 異なる仮想患者において, ナイーブ法と比較して, より分かりやすい画像を生成することができることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:03:43 GMT)
Recover-LoRA for Aggressive Quantization: Reclaiming Accuracy in 2-Bit Language Models via Low-Rank Adaptation with Knowledge Distillation on Synthetic Data [3.1] Recover-LoRAはデータフリーの精度回復法で、もともとは一般モデルの重み劣化のために開発された。
Recover-LoRAはゲートとアップ層の2ビット量子化から失われる精度を回復できることを示す。
この結果から,Recover-LoRAは,運用環境におけるアグレッシブ・ウェイト・圧縮のための実用的ポスト量子化精度回復ツールであることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:37:56 GMT)
JudgmentBench: Comparing Rubric and Preference Evaluation for Quality Assessment [3.0] JudgmentBenchは、実世界の30の法的タスクのベンチマークで、1,539のルーリックスコアと1,530のペアの選好判断を組み合わせたものです。
アノテーションは、両方の監視信号が同じ専門家から引き出される、高度なドメインで利用可能な最初のデータセットである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:06:08 GMT)
PrimeSVT: An Automated Memory-aware Pruning Framework with Prioritized Compression Policy for Spiking Vision Transformers [3.0] Spiking Vision Transformers (SViT)は、モデル圧縮の必要性を強調しながら、組み込み実装を妨げている。
本稿では,事前学習したSViTモデル上でメモリ認識型構造化プルーニングを実行する新しいフレームワークであるPrimeSVTを提案する。
実験の結果、PrimeSVTは自動単発プルーニングにより26.68%のメモリを節約した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:18:00 GMT)
PSViT: A Methodology for Structurally Pruning Spiking Vision Transformers [3.0] Spiking Vision Transformer (SViT)モデルは、視覚ベースのタスクを解決するために低消費電力のViTモデルを約束している。
SViTモデル上で構造化プルーニングを行う新しい手法であるPSViTを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:18:57 GMT)
Piston control in a two-ion quantum device [2.9] 運動を軸に限定した2イオン量子デバイスにおけるピストン制御方式を提案する。
1つのイオンは、他のイオンとのクーロン相互作用によって駆動される「古典的な」ピストンの役割を担っている。
提案した制御スキームは、微視的量子デバイスにおける制御ピストンダイナミクスへの有用な経路を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:05:54 GMT)
Local and Global Contraction Principles for MCMC Mixing [2.9] 我々はモンテカルロアルゴリズムの混合時間境界を証明するための収縮に基づくフレームワークを開発する。
ランゲヴィン・ランゲヴィンのコンパクト凸領域に対して、明示的な大域的収縮係数を示す。
有限モーメントが存在しない場合、 somep 条件に対して $mathbb E_q[wp]infty$ が $p1$ であるときに、鋭いモーメントベースの収束率を回復する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:16:52 GMT)
Forget Attention: Importance-Aware Attention Is All You Need [2.9] 本稿では,SSMに基づく重要用語をアテンションスコア内に直接付加するSISA(SSM-Informed Softmax Attention)を提案する。
SISAはステップ1KからNIAHを100%達成し、Transformerの検索収束の7倍高速である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:51:37 GMT)
Backdoor Unlearning Generalization: A Path Toward the Removal of Unknown Triggers in LLMs [2.9] 非学習によるバックドア中立化は、バックドア全体にわたって一般化されていることを示す。
本研究は, プレトレーニングや継続プレトレーニングにより, バックドアを注入した3種類のモデル家族を対象に, この現象について検討した。
筆者らは, コントロールされたバックドアを故意に注入し, 取り除くことにより, LLMの安全性を向上する新たな方向性を示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:38:12 GMT)
Does Language Shift Break Medical Vision-Language Models? Indonesian Radiology Visual Question Answering Case Study [2.8] 本稿ではインドネシアのVQA-RADを応用したIndoRad-VQAを紹介する。
一般目的, 東南アジア多言語, 医療特化VLMを英語で評価し, 設定を推し進めた。
以上の結果から,英語の医療用VQAベンチマークにおける強い評価は,必ずしもインドネシアの臨床的文脈におけるロバストな行動に結びつくとは限らないことが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:14:27 GMT)
Wasserstein Contraction of Coordinate Ascent Variational Inference [2.8] 座標アセント変分推定アルゴリズムのワッサーシュタイン距離の縮約について検討する。
これは、固定点における輸送情報の不等式と機能的滑らかさ条件の下で成り立つ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:51:10 GMT)
A Locally Deployed RAG-Based Academic Advising System for Course Selection [2.8] 本稿では,Syllabus情報に基づくRAGベースの学術アドバイスシステムを提案する。
大規模言語モデルと構造化シラバスデータからの検索を組み合わせることで、コース選択、前提条件理解、パーソナライズされた学習計画を支援するように設計されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:41:51 GMT)
Merit or networks? What decides where research is published [2.7] 我々は,6,208件の経済論文に散在するジャーナル配置の5インプット生産関数を,テキストレガシブルなアイデア品質スコアを用いて推定する。
接続された著者はより高いスコアの論文を書き、同じスコアで論文がより良くなる傾向にある。
その結果は、どちらを選ぶかよりもむしろ、科学の出版方法に関する長所とネットワークの説明をネストする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:18:03 GMT)
Quantum String Interactions Revealed by Full Counting Statistics [2.7] 量子弦の相互作用は、量子多体物理学における拡張対象の基本的な問題である。
ここでは、この非局所性はフルカウント統計(FCS)によって自然に捉えられることを示す。
実効ポテンシャルは、$lnE(r)sim -2 r2/(12 S_ell)$というエンタングル制御形式を持ち、量子弦の2つのハーフの間のエンタングルエントロピーである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:00:01 GMT)
Attribution via Distributional Paths for Information Revelation [2.7] Reveal-IGは、入力空間から構造化されたプローブ分布の空間への経路属性をリフトする。
安定して署名された属性を生成します - 残りの部分で競争力を維持しながら、アトリビューションサインを使用するメトリクスにつながります。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:50:28 GMT)
NeuroArmor: Safe-Variant-Guided Representation Consistency for Selective Re-Anchoring in Jailbreak Defense [2.7] 我々は,ローカルな安全基準として,プロンプト固有の安全な変種を利用する,ホワイトボックスのランタイムディフェンスであるNeuroArmorを提案する。
NeuroArmorは、悪意のある攻撃成功率(ASR)を41.56%から1.57%に下げ、共有良性プールにおける良性偽陽性率(FPR)を30.26%から22.05%に下げる。
全体として、NeuroArmorは、プロンプト固有の一貫性チェック、ルーティング、選択的介入を組み合わせることで、ジェイルブレイク防御のためのより効果的な実行戦略を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:01:50 GMT)
Torsion-induced gauge structure in curved quantum waveguides [2.7] 薄層量子化フレームワーク内の空間曲線に制限された粒子の量子力学について検討する。
この有効ゲージポテンシャルは曲線の局所的ねじれによって直接決定されることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:45:28 GMT)
Testing LLM Arithmetic Reasoning Generalization with Automatic Numeric-Remapping Attacks [2.7] 算術語問題に対する数値再マッピング攻撃を自動生成するアルゴリズムを提案する。
我々は,GSM8K,MAWPS,MultiArith上でDeepSeek-R1(70B),Gemma4(31B),GPT-OSS(120B)を評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:09:44 GMT)
Re-Evaluating Continual Learning with Few-Shot Adaptation [2.6] 連続的な学習方法は、一連のタスクに基づいて訓練された機械学習モデルの安定性と可塑性を最大化することを目的としている。
安定性の標準的な尺度(すなわち、忘れること)は、以前に学習されたタスクにおけるモデルの0ショットのパフォーマンスであり、最も最近学習されたタスクにおける塑性である。
連続学習システムの安定性と可塑性をより包括的に評価する手段として,数ショット評価を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:23:09 GMT)
Grimlock: Guarding High-Agency Systems with eBPF and Attested Channels [2.6] Grimlockはエージェントガードで、エージェントのコードをそのまま残しながら、信頼の執行をサンドボックスの基板に移す。
異質なマルチクラウド環境をまたいだ、透過的で監査可能で、スコープバウンドなエージェント対エージェント通信への道を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:44:21 GMT)
The Loss Is Not Enough: Sampling Conditions and Inductive Bias in Contrastive Representation Learning [2.6] 多様性条件を定式化する測度理論の枠組みを開発する。
標準のフルサポートvon Mises-Fisher設定が多様性条件の満足度を示すことを示す。
本研究は, 比較表現学習において, サンプリング機構と帰納バイアスがどのように相互作用するかを明らかにするものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:08:30 GMT)
Seeing Fast and Slow: Bimodal 3D Scene Graphs for Open-set Tasks [2.6] BiMoSGは、オープンセットタスクのためのバイモーダルな3Dシーングラフ生成アプローチである。
提案する3次元シーングラフ生成手法は,オープンソースの最先端手法よりもはるかに高速であることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:08:50 GMT)
Signals and Spoils: Speculative Oracle Extractable Value in the Era of Cross-Chain Interoperability [2.4] 我々は, 最大抽出可能価値 (MEV) の一形態である投機的Oracle抽出可能価値 (OEV) について検討する。
本研究では,野生における投機的液状化の検出手法を提案し,それをArbitrum,Base,Optimismに応用する。
独立DONは、ほぼ同時にほぼ同一のオフチェーン価格データを消費するが、異なるタイミングで更新を発行し、統計的に予測可能なクロスチェーンエクスプロイトウィンドウを生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:19:51 GMT)
RADE: Random Add-Drop Edge as a Regularizer [2.4] グラフニューラルネットワーク(GNN)は、長距離情報の過度な適合と過度な監視に悩まされる。
我々は,過剰適合とオーバーシャッシングの両方に同時に対処するエッジを共同でドロップし,付加するグラフ拡張手法であるRandom Add-Drop Edge (RADE)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:10:07 GMT)
ConTraIRL: Factorized Contrastive Abstractions for Transferable IRL [2.4] 逆強化学習(IRL)における逆転は、ポリシーが環境力学とタスク目標の見当たらない組み合わせに一般化する必要がある場合、信頼できない。
本稿では,これら2因子の非結合型潜在表現を学習することにより,構成的報酬伝達を可能にするフレームワークであるConTraIRL(Facterized Contrastive Abstractions for Transferable IRL)を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:47:19 GMT)
UnsOcc: 3D Semantic Occupancy Prediction in Unstructured Scene via Rendering Fusion [2.4] UnsOccは、非構造化環境における堅牢性を改善するマルチモーダルな3Dセマンティック占有予測フレームワークである。
その中核となるのはレンダリングベースの融合モジュールRenderFusionで、これはクロスモーダルな特徴アライメントを強化する。
提案手法は既存の最先端手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:50:14 GMT)
Diagnosing Knowledge Gaps in LLM Tool Use: An Agentic Benchmark for Novel API Acquisition [2.4] NovelAPIBenchは、任意のベースモデルとターゲットライブラリの動的ベンチマークである。
探索によって注入された知識とパラメトリック適応によって内部化された知識を比較した。
Retrievalは揮発性のAPIコンテンツを提供し、チューニングは手続き統合を改善する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:46:04 GMT)
TriEval: A Resource-Efficient Pipeline for LLM Bias, Toxicity, and Truthfulness Assessment [2.3] TriEvalは、機械学習モデルを評価するパイプラインである。
オープンソースモデルとクローズドモデルの両方に対応している。
Llama 3 8B、Mistral 7B、Gemma 2 9B、Claude Haikuの4つのモデルでテストされている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:21:38 GMT)
ACAT: A Collaborative Platform for Efficient Aspect-Based Sentiment Dataset Annotation [2.3] ACAT(Aspect-based sentiment analysis Collaborative Tool)は、4つのABSAシナリオをサポートするWebベースのプラットフォームである。
コアコントリビューションは、共同アノテーションを調整するETL(Extract, Transform, Load)パイプラインの自動化だ。
ACATは、すべてのタスクで31.58秒、生のIAAが0.78から0.86までの平均的なアノテーションタイムを達成している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:16:54 GMT)
Static and Dynamic Representations for Tactile Contact-Angle Estimation with Event-Based Sensors [2.3] イベントベースの触覚センシングは、コンタクトリッチなロボットインタラクションのための低遅延信号取得を提供する。
本稿では,イベントベース触覚センサ(NeuroTac)からのイベントストリームを用いた接触角推定について検討する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:08:49 GMT)
Re-Ranking Through an Attribution Lens for Citation Quality in Legal QA [2.3] クロスエンコーダは、連続的な摂動に基づく帰属スコアに基づいて、生成前に経路を再ランクするよう訓練した。
異なるモデルで独立に訓練された2つのリランカーは、生の帰属契約を超えて収束する。
その結果、摂動に基づく帰属は、引用認識検索のための実用的、モデルに依存しない訓練信号を提供することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:48:33 GMT)
PHASOR: Phase-Anchored Universal Action Representations for Humanoid Embodiments [2.2] 既存の方法は、アクションラテントを第一級表現ではなくタスク固有の中間体として扱う。
我々は、アクション埋め込み空間自体を第一級の設計ターゲットとして位置づけ、表現品質から下流のポリシー品質を生じさせる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:44:37 GMT)
Macroscopic Spin GHZ States with a Levitated Ferromagnet [2.2] 本研究は、浮遊強磁性体を用いたマクロスピンGHZ状態の生成に対するトップダウンアプローチを提案する。
我々は、量子フィッシャー情報のハイゼンベルクスケーリングが達成可能であることを示すことによって、結果のマクロスピン重ね合わせ状態の計量的利点を定量化する。
また, スピン依存波動関数崩壊モデル実験における浮遊円筒型強磁性体のマクロスピン重ね合わせ状態の有用性についても検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:00:39 GMT)
Neural Network Verification using Partial Multi-Neuron Relaxation [2.2] 部分的多ニューロン緩和を特徴とする中層的アプローチを提案する。
我々は、ニューロンの選択と多ニューロン境界に対する境界超平面の最適化のための既存の分岐を構築した。
本実験は,ニューラルネットワーク検証技術の可能性を示すものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:20:50 GMT)
AgenticDiffusion: Agentic Diffusion-based Path Planning for Vision-Based UAV Navigation [2.2] 屋内UAVナビゲーションは、視野の限られた観測下での効率的な探索、シーン理解、信頼性の高い軌道実行を必要とする。
本稿では,多視点UAVナビゲーションフレームワークであるAgenticDiffusionを提案する。
このフレームワークは、適応的な視点選択、多段階のミッション実行、長距離ナビゲーション、安全な着陸場所選択を含む4つの現実のUAVナビゲーションシナリオで検証された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:18:35 GMT)
Leveraging BART to Assess CS1 C++ Programming Assignments using Rubric-based Criteria [2.2] 本稿では,C++プログラムの代入を自動グレーディングするための変換器モデルのルーリック認識,マルチタスク微調整について検討する。
マルチセメスターCS1データを用いて、学生の応募は数値スコア、レターグレードバケット、代入ルーリックとペアリングされ、前処理され、トランスフォーマー入力のための統一シーケンスに変換される。
LoRA適応のBARTエンコーダデコーダは、数値グレードとグレードバケットを共同で予測し、予測されたグレードと経験的なグレードの分布を調整するために、分布マッチング項を付加するように訓練される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:57:14 GMT)
Hybrid Dynamics Modeling for a Flexible 2-DoF Robotic Arm [2.2] 本稿では、フレキシブルリンク2-DoFロボットアームの力学をモデル化するための3つのアプローチについて検討する。
2つの物理情報モデルが剛体力学(RBD)とガウス混合モデル(GMM)を組み合わせて残差モデル誤差と結合柔軟性を捉える。
キネマティクスに基づく回帰モデルは、純粋にデータ駆動ベースラインとして機能する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:12:20 GMT)
Calibrating Urban Traffic Simulation from Sparse Road Observations via Genetic Optimization [2.1] 現実的な都市交通シミュレーションは,最小限の現実世界観測により実現可能であることを示す。
この研究は、現実的な都市交通シミュレーションは、最小の現実世界の観測によって達成できることを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:04:01 GMT)
Link Prediction or Perdition: the Seeds of Instability in Knowledge Graph Embeddings [2.1] 埋め込みモデル(KGEMs)は知識グラフの完全化のための主要なリンク予測手法である。
標準評価プロトコルは、MRRやHits@$K$のようなランクベースのメトリクスを強調するが、通常、結果の安定性に対するランダムシードの影響を見落としている。
高性能モデルでは, 3次元空間と高変数空間において, 分岐予測が実際に発生する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:13:50 GMT)
Quantum simulations of ultrafast optical spectroscopy of semiconductors on digital quantum computers in the semi-classical approximation [2.1] 半導体材料の超高速光分光のためのディジタル量子シミュレーションフレームワークを提案する。
このフレームワークはブリルアンゾーンの離散化と第二量子化形式に基づいており、古典シミュレーションの量子代替として設計されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:52:23 GMT)
E2LLM: Towards Efficient LLM Serving in Heterogeneous Edge/Fog Environments [2.0] 大規模言語モデル(LLM)は現代のアプリケーションにとって不可欠なものとなっているが、その展開は依然として困難である。
E2LLMは、リソース制限設定において、効率的なLLMデプロイメントを実現するために設計されたフレームワークである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:23:28 GMT)
Reading the Finetuning Prior: Verbatim Content Recovery via Contrastive Decoding Diffing [2.0] Contrastive Decoding Diffing (CDD) は、出力レベルのロジット分布のみを演算し、ウェイトアクセスがなく、層選択がなく、モデルごとのチューニングもできないモデル拡散法である。
単一のデフォルト設定は、4つのアーキテクチャにまたがって組み込まれた事実を冗長に復元する。
我々は、実際のドメインの微調整設定を検証し、単一データセット以外のすべてのCoT変種に対してほぼ完全な回復を実現し、混合データセット設定で4つのデータセット全てを正しく識別する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:10:15 GMT)
Distribution-Free Risk-Aware Planning and Control Under Uncertainty Using Conformal Spectral Risk Control [2.0] 本稿では,リスク対応モデル予測制御(RA-MPC)フレームワークを提案する。
予測セットをMPCフレームワークに組み込むことで、不確実な不確実性であってもスペクトルリスク制約満足度の観点から統計的安全性が保証されることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:07:56 GMT)
CaloTrilogy: Toward a Breakthrough in One-Step, End-to-End, Physics-Guided Shower Generation for Modern Calorimeters [1.9] フローマッチングと拡散に基づく生成モデルは、高次元高速シミュレーションにおける主要なアプローチとなっている。
速度, シャワー品質, 物理忠実度とのバランスを改善する統一的な枠組みを導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:27:19 GMT)
Lingo_Research_Group at SemEval-2026 Task 9: Evaluating Prompt Variants for Polarization Detection [1.9] 本稿では,SemEval-2026 Task 9: Multilingual Text Classification Challenge - Polarization Detectionを提案する。
1)二分極検出、(2)分極型分類、(3)分極型識別の3つのサブタスクをカバーする。
我々は,用語の明確さにおいて異なる12種類の設計プロンプトを考慮し,短い設計プロンプトの研究の体系的アプローチを採用する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:41:54 GMT)
Graph Regularized Non-negative Reduced Biquaternion Matrix Factorization for Color Image Recognition [1.9] カラー画像認識のためのグラフ正規化非負の還元二元数行列分解モデルを提案する。
提案モデルでは, グラフラプラシアン正則化器を還元二元数係数行列に組み込んで, 学習した特徴空間に類似した表現を持つことを奨励する。
実験結果から,提案したGNRBMFモデルにより,いくつかのテスト環境での認識性能が向上することが確認された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:44:28 GMT)
Forward-Assisted Purification: A Spatiotemporal Framework Beyond Conventional Limits [1.9] 我々は、浄化を動的タスクとして再考し、ノイズプロセスにまたがる介入を分散するフレームワークを導入する。
これにより、既存のアプローチにはアクセスできない運用能力が明らかになり、達成可能なパフォーマンスを向上する前方支援のパーフィケーションがもたらされる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:53:21 GMT)
SBP-Net: Learning Thin Structure Reconstruction with Sliding-Box Projections [1.9] 細い3D構造を再構築することは、その空間性、スケールの変化、複雑な幾何学のために困難である。
本研究では, 局所的な深度予測に基づく再構成手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:59:22 GMT)
Pinpoint: Grounded Worldwide Image Geolocation via Cross-Source Retrieval and Reranking [1.9] Pinpointは、インターネット写真とストリートビュー画像を組み合わせた、検索と参照のアーキテクチャです。
対照的な画像-GPS埋め込みは、Flickrの写真とストリートビューの画像の両方で訓練される。
注意に基づくリランカは、候補レベルの視覚的特徴とGPS機能と、近くの場所からのクロスソースな証拠を組み合わせることで、検索した候補を再スコアする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:44:58 GMT)
eMEM: A Hybrid Spatio-Temporal Memory System For Embodied Agents [1.8] 物理環境で動作するエンボディエージェントのためのハイブリッドグラフベースメモリシステムeMEMを提案する。
eMEMはこのギャップをマルチインデックスアーキテクチャ(構造化ストレージ用ITE、近傍セマンティックサーチ用hlib、空間クエリ用Rツリー)で埋める。
また,eMEM-Bench v1は,メモリ評価のためのProcTHOR-10Kシーン上で構築したベンチマークである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:22:12 GMT)
Effect of Demographic Bias on Skin Lesion Classification [1.7] ResNetを用いた畳み込みモデルを用いて皮膚病変分類の性能を評価する。
性に基づく分析は、性固有のトレーニングデータセットがモデルのパフォーマンスを最適化することを示している。
性別バイアスは主にデータ不均衡から生じるが、年齢バイアスは分布に関係なく若年層を常に好んでいる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:16:24 GMT)
Electromagnetic Navigation for Femoral Osteotomy Using High-Accuracy X-ray-to-CT Registration [1.7] 大腿骨骨切り術におけるEMTを用いたナビゲーションシステムについて検討した。
このシステムはCTベースの術前計画と1回C-armキャリブレーションと2枚の蛍光画像からの正確なX-ray-to-CT登録を併用する。
18例の人工大腿骨を用いた実用性評価では,EMT誘導は全角誤差においてフリーハンドの実行よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:53:03 GMT)
Rethinking Molecular Text Representations for LLMs: An Empirical Study [1.7] 大規模言語モデル (LLMs) は分子的タスクにますます使われているが、どの分子的表現を使うべきかは定かではない。
推論や非推論型を含む5つのモデルファミリーにわたる16のLSMをベンチマークする。
CMLが最高であり、次にMollJSON、InChI、そして標準SMILESが続く。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:45:41 GMT)
Trading Human Curation for Synthetic Augmentation in RLVR [1.7] 高品質な訓練タスクの供給は、強化学習における中心的なボトルネックである。
我々は、拡張されたタスクと人為的なタスクの間のコスト調整されたトレーディングレートを$_textcost$に定式化する。
追加のヒューマンオーサリングタスクのための拡張コンテンツの置換は、集約された一般化を保持します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:48:28 GMT)
ZK-Flex: A Flexible and Scalable Framework for Accelerating Zero-Knowledge Proofs [1.7] ZKPは、証明者がプライベートデータを公開することなく、計算正当性を検証することを可能にする。
証明生成は非常に計算集約的である。
ZK-Flexは、ZKPを加速するための柔軟なスケーラブルでハードウェア対応のフレームワークである。
5倍から11倍のスピードアップと3.8倍の面積効率を実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:30:04 GMT)
LLM Compression with Jointly Optimizing Architectural and Quantization choices [1.5] 大規模言語モデル(LLM)は、メモリと計算の要求が大きいため困難である。
我々は、空間全体を探索し、アーキテクチャ構成を共同で最適化する差別化可能なNASフレームワークを導入します。
我々のモデルは、逐次NAS-then-quantizationベースラインと同等の精度で最大1.4倍高速な推論を達成し、同じレイテンシで7つの推論タスクの平均精度を最大6%向上させる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:57:28 GMT)
Post-Hoc Robustness for Model-Based Reinforcement Learning [1.4] 本研究は, 深部RL剤の加熱後強固化を推察時に導入する。
目標は、ニューラルネットワークのさらなるトレーニングを必要とせずに、堅牢性を改善することだ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:43:13 GMT)
Can I Take Another Dose? Evaluating LLM Decision-Making Under Temporal Uncertainty in OTC Dosing QA [1.4] 提案するDOSEBENCHは,81個のOCCドッキングシナリオのベンチマークである。
我々は、意思決定の正確性、一貫性、説明の妥当性、障害タイプ、信頼性関連信号の指標を用いて、繰り返し実行中の4つのLCMを評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:30:15 GMT)
Privacy-Preserving High-Resolution Image Gradient Computation Based on Fully Homomorphic Encryption [1.3] ホモモルフィック暗号化(HE)は、プライバシを保存する画像処理のコアメソッドとして登場した。
本稿では,大規模画像のための多文プライバシ保存フレームワークを提案し,半正直なモデルの下での効率的な画像の暗号化と計算を実現する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:32:15 GMT)
AI Model Extraction Attacks: Bypassing Single-Client Assumptions in Defenses [1.2] モデル抽出攻撃(MEA)は、敵がプロプライエタリなモデルを複製し、保護された情報を侵害し、オフラインの敵攻撃に備えることを可能にする。
現在の防衛戦略は、攻撃が孤立したアイデンティティに由来するという暗黙の仮定である、Single Client Assumption (SCA) に大きく依存している。
我々は、再現可能なモデルステアリング研究のためにCerberusAIと呼ばれるモジュラーでオープンソースなフレームワークを導入し、それを分散攻撃シナリオをシミュレートするために使用します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:25:29 GMT)
Chatbots Output Meaningful (but Problematic) Language [1.2] ほとんどの一般ユーザーとAIエンジニアは、答えは自明に「はい」だと考えている。
しかし、多くの認知科学者、言語学者、および言語哲学者は、言語と意味の支配的な意図主義的な説明は反対の結論をもたらすと主張している。
そのため、一般ユーザーの直感に同情的な理論家は、言語を急進的に「非人格化」することを提唱している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:24:42 GMT)
Critical evaluation of PINN for FWD inverse analysis and differentiable FEM as an alternative [1.1] 本研究は,多層舗装システムにおけるPINNに基づく逆解析を批判的に評価する。
対照的に、DiffFEMはより正確で安定で、計算効率のよい逆解析結果を得る。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:08:55 GMT)
KliniskVestBERT: BERT Model Specialised to Norwegian Clinical Texts [1.1] この研究は、3つのBERTベースのエンコーダモデルのスイートであるKliniskVestBERTを紹介している。
このデータセットはHelse Vest患者の代表集団に基づいている。
含まれるドキュメントタイプは、bokmlとnynorskの幅広い臨床スペクトルを包含するように慎重にキュレートされる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:52:52 GMT)
Towards Intrusion Detection Systems for RPL-based IoT Networks using Foundation Models [1.1] RPLベースのIoTネットワークに対する攻撃を検知し、識別するための基礎モデルの利用について検討する。
マルチクラス攻撃識別のためのMOMENT基盤モデルを微調整する。
このアプローチは、最先端の手法に匹敵する攻撃検出性能を達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:52:31 GMT)
Multi-Agent Next-Best-View Optimization for Risk-Averse Planning [1.1] 不確実で未知の環境での安全な経路計画のためのマルチエージェントNBV(Next-Best-View)の選択には、情報的、安全に配慮し、効率的な調整が必要である。
本研究では,各ロボットがプライベートなローカル3Dガウスマップを維持できる分散型リスク対応NBVフレームワークを提案する。
複数のチーム規模のGibson環境での実験は、分散定式化が、マッピングの品質と軌道安全において集中的なベースラインに近づいたことを示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:23:23 GMT)
Section-Weighted Hybrid Approach for Legal Case Retrieval [1.1] 判例検索のための2段階のセクションアウェアフレームワークを提案する。
まず、決定論的大言語モデルを用いて、事実、問題、決定、推論に生の判断を分割する。
上位結果について、システムは関連セクションのテキストを簡潔で根拠のある合理化とパーティー・スタンス・ラベルで返します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:27:53 GMT)
From Script to Semantics: Prompting Strategies for African NLI [1.1] 本稿では,スワヒリ,ヨルバ,ハウサにおける自然言語推論(NLI)の促進戦略の体系的研究について述べる。
私たちはBaseline(ゼロショット)、Script-Aware、Language Specific、Contrastive、NL-STP(Native-Label Self-Translation)の5つのプロンプト戦略を評価する。
いくつかの構成では、中性なクラス崩壊と高い予測スキューを伴う戦略間で、クラスワイズの性能に有意な差が認められる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:20:10 GMT)
BlobShuffle: Cost-Effective Repartitioning in Stream Processing Systems via Object Storage Exemplified with Kafka Streams [1.1] 本稿では,BlobShuffleを提案する。BlobShuffleは,ストリーム処理システムのためのコスト効率の高いシャッフル手法である。
すべてのシャッフルレコードを直接送信する代わりに、BlobShuffleはレコードをバッチにグループ化し、これらのバッチをクラウドオブジェクトストレージに格納し、通知のみを転送する。
BlobShuffleは、95%のシャッフルレイテンシを2秒未満に保ちながら、ネイティブKafkaシャッフルと比較してシャッフルコストを40倍以上削減できることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:13:48 GMT)
PHAF-Personalized Hand Avatars in a Flash [1.1] PHAFは、エッジデバイス上でのリアルタイムデプロイメントのために、高速なパーソナライズされたテクスチャを生成する。
ビューベースの塗装ネットワークは、滑らかで連続的な外観を保証するテクスチャを洗練する。
実験では、テクスチャ生成時間を30倍劇的に削減しながら、視覚的忠実度において既存の手法に匹敵することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:05:46 GMT)
Parallel Adaptive Multi-Objective Evolutionary Learning of Discretized Bayesian Network Classifiers for Clinical Data [1.0] Baymexは、離散化されたBNを学習するための多目的進化アルゴリズムである。
Baymexは最先端のBN学習手法より優れていることが示されている。
ベイメックスは,コンパクトで臨床的に検査可能なBNを生産しながら,統計的に類似またはより良い予測性能が得られることを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:21:45 GMT)
PE-MHL: Physics-Encoded Modular Hybrid Layers for Scalable Learning of Complex Systems [1.0] 物理ベースとデータ駆動コンポーネントを組み合わせたハイブリッドモデルは、制御アプリケーションにおいて精度と解釈可能性を達成する強力な可能性を示している。
本稿では,新しいサブモデルの追加により,基礎となる物理モデルが漸進的に洗練される物理符号化モジュールハイブリッド層(PE-MHL)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:39:23 GMT)
Efficient ASR Training with Conversations that Never Happened [1.0] 本稿では,参加者メタデータを用いたシナリオレベルの対話を生成する拡張パイプラインを提案する。
次に、話者属性をTS音声プロファイルにマッピングし、合成された発話を話者認識型会話に組み立てる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:46:12 GMT)
Combining Statistical Features and Deep Encodings for Rehearsal-Based Class-Incremental Time Series Classification [1.0] 本稿では,時系列データの分類のためのクラス連続学習を行うための新しい手法を提案する。
提案システムでは,すべてのデータセット間での競合平均精度を実現するとともに,すべての実験構成に対して低遅延率を維持している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:02:42 GMT)
An Attention-Based Denoising Model for Diffusion Weighted Imaging [1.0] スキャン時間が短縮されると、画像の品質が劣化し、スキャンのノイズが増大する。
階層型スウィントランスウィンドウアテンションとトランスフォーマーに基づく多次元ゲートリファインメントを統合し,DWI復元のためのノイズ認識型アテンション駆動型デノナイジングフレームワークを提案する。
本モデルでは, 騒音条件下での安定挙動を維持しつつ, ノイズレベルを1%から15%に抑えながら, 平均PSNR33.69dB, SSIM0.8539を達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:59:09 GMT)
Gravitationally Induced Quantum Decoherence of Macroscopic Objects [0.9] 空間重ね合わせで調製した巨大物体の重力誘起量子デコヒーレンスを定式化する。
非相対論的かつ準静的な状態では、デコヒーレンス指数は系の応力-エネルギーテンソルの差の双線型関数として記述できる。
有限波長パケットでモデル化された希薄非相対論的気体の時間と空間における粗粒化によるデコヒーレンス関数の評価を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:04:28 GMT)
Sample-Size Scaling of the African Languages NLI Evaluation [0.9] この研究は、AfriXNLIベンチマークに基づく16のアフリカ言語における自然言語推論(NLI)の体系的なサンプルサイズスケーリング研究である。
約0.6Bパラメータを持つ2つの多言語トランスフォーマーモデル XLM-R Large を XNLI と AfroXLM-R Large で微調整し、50から500のラベル付きサンプルサイズで試験した。
データの増加に伴う単調な増加という通常の信念とは対照的に、強い言語に敏感で、しばしば非単調なスケーリングの振る舞いを見出す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:27:16 GMT)
Anycast Performance in Context [0.9] IP anycastは、サービスが多くの物理サイトから1つのアドレスを宣伝し、BGPは各クライアントをサイトへマップする。
本稿では、ルートDNSとCDNの2つの設定で、任意のキャストレイテンシを比較する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:59:27 GMT)
Automating Information Extraction and Retrieval for Industrial Spare Parts Pooling [0.8] 製造業の保守組織は、既存の資産を再利用することで、ダウンタイムや不必要な購入を回避しようとする。
この断片化された景観を仮想ストックプール(VSPool)に変換するためのハイブリッド検索拡張世代であるPhRAGを提案する。
このフレームワークは、従来のNERアプローチと比較して、生成的アプローチの可能性を示している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:14:58 GMT)
Slipstream: Locality-Aware Graph Index Construction for Streaming Approximate Nearest Neighbor Search [0.8] 本稿では,ANNSのグラフインデックスにおける頻繁な挿入の計算コストを大幅に削減する新しい手法であるSlipstreamを提案する。
Slipstreamの中核的なアイデアは、ベクターストリームの連続性を利用することだ。
実験の結果,Slipstreamのスループットはベースラインよりも30.8$times$高いことがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:59:39 GMT)
AI Rater Discrimination Depends on Scoring Protocol in Complex Clinical Decision-Making [0.8] 臨床AI評価は、AIレーダとして機能する大規模言語モデル(LLM)にスコアを委譲する傾向が強まっている。
成人2型糖尿病に対する12カ月の外来経過観察におけるAIレートラー行動の検討
あらゆる質問に対して、AIレーナーは、非常に狭い範囲で一貫して高いスコアを獲得しました。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:58:23 GMT)
Multimodal Transformer Based Generic Mixture Density Network for Scattering Timescale Estimation of Fast Radio Bursts [0.8] 本稿では,MT-GMDN (Multimodal Transformer Based Generic Mixture Density Network) という深層学習手法を提案する。
MT-GMDN は CHIME/FRB cattwo から$sim3500$ FRB のトレーニングを行い,トレーニング中の検証やトレーニング完了後のテストのために一部の FRB を保有した。
モデルは、測定可能な散乱を伴う事象に対する期待値の$$$$に対して94%$の判定係数(R2$)を、テストにおいて90%$の優れたリコール値で達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:01:08 GMT)
SEAOTTER: Sensor Embedded Autoencoding with One-Time Transcode for Efficient Reconstruction [0.7] ロボットシステムでは、低コストで低消費電力のハードウェアを使用して、大量の視覚データを高解像度で容易にキャプチャすることができる。
本稿では,効率的な再構成のためのワンタイムトランスコードと組み合わせたSensor Embedded Autoencoderに基づくクラウド用圧縮フレームワークを提案する。
200:1の圧縮比で、7倍の高速符号化、3.5倍の高速復号化、+8%のImageNet top-1精度を観測した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:28:28 GMT)
Don't Trust Us: A privacy-by-design android malware detection pipeline [0.7] 既存のプライバシ対応アプローチは、一般的にデータ収集後にプライバシを強制する。
この要件は管理するよりも取り除くべきだと我々は主張する。
Androidのマルウェア検出は、設計上プライバシに注意する必要があるため、効果的な分析は、そもそもアクセスされている機密データに依存しない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:36:31 GMT)
Penalty-free quantum optimization applied to lattice protein folding [0.7] アナログ反復型局所探索方式を導入し,26量子ビット以上の局所部分グラフを用いて,最大で$N=14$の格子タンパク質の折り畳みに成功した。
この手法は、長さ$N=4$および$N=6$の格子タンパク質に対する量子回路の古典的なシミュレーションを通じて検証する。
そこで我々はさらに,26量子ビットの局所部分グラフを用いて,最大$N=14$の格子タンパク質の折り畳みを成功させる,反復的な局所探索手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:25:57 GMT)
Fast single-atom preparation in optical tweezers via Rydberg blockade [0.7] 本研究では,マイクロ秒の時間スケールにおいて,マルチ占有型ツイーザから1つの原子を選択的に除去する手法を提案し,実証する。
基底状態からの2光子リドバーグ励起により、ツイーザーの58.2(2)%に単一原子を保持しながら、多原子の確率を64.8ドルsで1%に下げる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:13:52 GMT)
Toward AI That Understands Self and Others: A World-Model Theory of Cognitive Diversity and Alignment [0.7] 本稿は、すでに不一致は後期現象であると主張している。
中心的な前提は単純だが自明ではない。
本稿では,認知の多様性とアライメントに関する世界モデル理論を開発する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:31:00 GMT)
Pushing the Limits: A Framework to Reform Institutional Ethics Review of Environmentally-Impactful Computing Research [0.7] 計算集約型研究(CIR)はAIを含むさまざまなトピックで行われている。
必ずしも、組織倫理審査方針の範囲内にあるわけではない。
本稿では,CIRを倫理審査の対象とする制度的倫理政策のスコーピング基準を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:10:23 GMT)
Metric-Aware Hybrid Forecasting for the CTF4Science Lorenz Challenge [0.7] CTF4Science Lorenz Challengeに対する我々のアプローチは、短期水平予測、長期分布マッチング、および9つのタスクペア間の軌道再構成を混合したベンチマークである。
メカニカル・アウェア・ハイブリッドシステムを構築し,各メカニカル・ファミリーに異なる予測器を割り当てた。
このシステムファミリーの代表的な成熟した応募者は、公衆のリーダーボードで83.83551点を獲得し、同じアイデアの小さなフォローアップスタックは83.85529点に達した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:20:40 GMT)
Towards a Hybrid Quantum Enhanced Solution for Densest k-Subgraph Problem [0.7] ガウスボソンサンプリング(GBS)の高密度k-グラフ問題(DkSP)への応用について検討する。
提案手法では, ほぼkに近いサンプルを, 実現可能なソリューションに変換し, 破棄する, 有効な古典的後処理戦略を導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:55:09 GMT)
Semantic-weighted ICP for LiDAR Odometry: Class-Aware Residual Reweighting for Robust Scan Registration [0.7] LiDARオドメトリーは自律ロボットシステムの基本的な構成要素であり、エゴモーションを推定するために連続する点雲間の幾何学的登録に依存している。
伝統的な幾何学的アプローチは、動いた物体、まばらな幾何学的特徴、植生、意味的に曖昧な構造によって生じる信頼できない対応によって、動的または非構造的な環境においてしばしば劣化する。
そこで本研究では,LiDAR odometry のためのセマンティッククラス重み付きICPを提案し,その予測した幾何安定性に基づいて意味圏に属する点の残差を重み付けする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:00:29 GMT)
A cross-domain tropical species dataset with Chinese vernacular names and CITES source links [0.7] 本報告では,410,499種の活動性熱帯種のバージョン別クロスドメインデータセットについて述べる。
このデータセットは、GBIF, Plants of the World Online, iNaturalist, NCBIの分類学の分類学識別子と結合する。
未検証のマシン生成提案を除外するタイプロジーの下で、名前ごとの明示的な証明を持つ中国の頂点層。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:08:12 GMT)
The Invisible Lottery: How Subtle Cues Steer Algorithm Choice in LLM Code Generation [0.7] タスク仕様外の文脈語やメタデータを意味するインシデントプロンプトキューは、モデルが選択したアルゴリズムを操縦することができる。
我々は、アルゴリズムのステアリングを、アルゴリズム-ファミリー分布のキュー誘起シフトとして定義する。
直接アルゴリズムの命名は、私たちがテストした最も信頼性の高い緩和です。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:17:28 GMT)
Proof-Carrying Agent Actions: Model-Agnostic Runtime Governance for Heterogeneous Agent Systems [0.7] 本稿では,アクション証明書を中心としたランタイム中立ガバナンスモデルであるProof-Carrying Agent Actions (PCAA)を提案する。
PCAAは5つのチェックポイント(事前行動の許容、行動のオープン、仮定のキャプチャ、承認、結果のクロージャ)を統括する。
異種エージェント制御プレーンと開示バウンダリ評価プロトコルの参照実装を用いてモデルについて検討する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:10:35 GMT)
Scalable On-Hardware Training of Quantum Neural Networks and Application to Clinical Data Imputation [0.7] 量子ハードウェア上での量子ニューラルネットワーク(QNN)のトレーニングは現在、推定コストによってボトルネックになっている。
我々は、このコストを量子ビット数で対数的に削減するトレーニングフレームワークを導入する。
MIMIC-III電子健康記録データセットを用いて臨床データ計算の枠組みを検証した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:38:48 GMT)
Agent libOS: A Library-OS-Inspired Runtime for Long-Running, Capability-Controlled LLM Agents [0.6] 大規模言語モデル(LLM)エージェントは、要求応答アシスタントから長期実行中のソフトウェアアクターへと進化している。
本稿では,LLMエージェントのためのライブラリOSをベースとしたランタイム基板であるAgens libOSを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:53:24 GMT)
What Are We Actually Benchmarking in Robot Manipulation? [0.6] ロボティクスのベンチマークスコアは、1つの固定された評価設定の下で成功を測定するが、通常、一般的な操作能力の証拠として扱われる。
4つの障害モードを特定し、それぞれがその機能の有効なプロキシとしてベンチマークの役割を弱めたり無効にした。
これらの診断のもと,LIBERO,CALVIN,SimplerEnv,RoboCasa,RoboTwin 2.0を検査した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:33:28 GMT)
q0: Primitives for Hyper-Epoch Pretraining [0.6] 単一のモデルの事前訓練は、計算予算が枯渇するずっと前に、数パス以内に飽和する。
ハイパーエポック事前学習(q0)を導入し,マルチエポック予算を多種多様なモデルに転換する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:27:48 GMT)
Edge of Stability Selectively Shapes Learning Across the Data Distribution [0.6] 安定性の限界 (EoS) は選択的であり, グループによっては進行が増大し, 他グループでは進行が抑制されることが示唆された。
同じトレーニング状態からEoS体制に侵入または離脱する分岐介入を使用することで、このトレードオフを慎重に実証する。
これらの結果から,EoSは安定性境界だけでなく,学習の割り当てを規定するメカニズムとして機能することが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:58:40 GMT)
Decoupled Smart Contract Audits: Lightweight LLM Framework via Distillation and Aggregation [0.6] 軽量で高度に最適化されたオープンソース LLM を利用した,効率的なエンドツーエンドのスマートコントラクトセキュリティ監査フレームワークを提案する。
我々のフレームワークは、総合的な監査タスクを、脆弱性検出、説明、重度分類、修正推奨の4つの相互接続されたコンポーネントに分離する。
実験結果から、我々の軽量パイプラインは、最先端のオープンソースコーダの高密度LLMよりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:13:43 GMT)
Building The Ph(ysical)AI Layer Of Machine Intelligence [0.6] ファンデーションモデルは、多様なデータに対する大規模なトレーニングを通じて一般化を実現するが、ペアのトレーニングデータなしで真に見えないドメインに移行する制限がある。
本稿では,信号理論の原理を符号化する基礎モデルを提案する。
我々は、RFデータから学習した凍結表現のみを用いて、音声、画像、テキスト、ビデオへのクロスモーダル転送を実現し、ターゲットドメインに対するエンコーダの微調整を必要としない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:11:03 GMT)
Glass Box at Orbit: A Constitutional AI Verification Framework for Trustworthy Autonomous CubeSat Intelligence [0.6] Glass Boxは、オンボードAIポリシからすべての候補アクションをインターセプトする、実行時の立憲AI検証レイヤである。
承認されたすべてのアクションは、[0,1]の重み付き説明可能性スコアE(a_t)と完全な立憲監査ログを有する。
われわれはProject OctoberでGlass Boxをデモした。CubeSat級宇宙船の5層自律軌道インテリジェンスアーキテクチャをシミュレーションしたものだ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:09:57 GMT)
Privacy-Robust Incrementality Measurement for Advertising Systems under Signal Loss [0.5] 広告プラットフォームは、漸進性を測定するためにランダム化リフトテストを使用する。
プライバシ保存レポートシステムは、マッチレート損失、リンク可能性損失、属性ウィンドウ損失、アグリゲーション閾値抑制、ランダム化された報告ノイズ、セグメント不均一な信号損失を通じて、観測された信号を劣化させる。
本稿では、上記の信号損失に基づいて、プライバシー制約のある広告計測をロバストな因果決定問題として定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:46:38 GMT)
Forecasting Conceptual Diffusion in Science: The Case of Quantum Computing [0.5] 我々は,各概念ペアを上流の励磁線と下流の拡散によって追跡する,時間的に解決された概念共起ネットワークを構築した。
我々は4つの結果を予測するために、分布と多様性を意識したLightGBMモデルを訓練する。
概念拡散は、意味的および引用環境に埋め込まれた安定した構造的規則性によって制御される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:12:02 GMT)
Consistency Training Can Entrench Misalignment [0.5] モデル生物108種を対象に, 整合性学習法を7種類試験した。
一貫性トレーニングは一般的に、不正な報酬のハッキングや創発的なミスアライメントを抑えるが、梅毒症を増幅する。
本稿では, 整合性ラベリングプロセスによって誘導される分布変化が, 選択演算子の変動ではなく, 系統的アライメント効果の第一の要因であることを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:54:24 GMT)
Explainable Forecasting of Scientific Breakthroughs from Concept Network Dynamics [0.5] 本稿では,研究概念間のリンクの出現と拡大を予測できる,説明可能な機械学習手法を提案する。
59の意味的特徴と位相的特徴を用いて、2段階のLightGBMモデルはコンセプトペアの生成と将来の重量を共同で予測する。
次に、これらの予測をエビデンスベースの研究戦略とポリシーに変換する3層決定アーキテクチャについて概説する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:38:41 GMT)
Predicting Inference-Time Scaling Gains from Labeled Validation-Set Output Statistics [0.4] Best-of-N$推論スケーリングは、モデルによって異なる量によって精度が向上するが、現時点ではプロシージャをエンドツーエンドで実行する必要がある。
我々は,1つのバリデーションセットサンプリングパスから計算した特徴にリッジ予測器を適合させ,ブートストラップ・ラッソを候補特徴セットの安定性解析として使用し,明示的な線形近似残差を持つ濃度解析を行う。
このコアとエントロピーアドオンで構築されたコンパクトなリッジ予測器は、報奨モデル検証の下で実際のベスト・オブ・N$ゲインを持つスピアマン$=0.90$に達する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:38:51 GMT)
Deterministic generation of cat states with more than $100$ photons under dissipation [0.4] 大きめの猫状態は量子-古典遷移を探索する上で意義があり、基本的なものである。
我々は,Hermitian あるいは非Hermitian 時間依存ハミルトニアンの下でのハイブリッド量子ボゾン系の動的不変量を用いて,大きな猫状態を生成することを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:05:51 GMT)
When Offline Selectors Cannot Beat the Best Single Model: A Diagnostic Study on edX Dropout Prediction [0.4] 記録されたデータから訓練されたセレクタは 常に最強の予測器を 打ち負かさない
3段階の診断は、共有バッファ上でそれらを規定する。
次のイテレーションでは、オフラインの学習者をチューニングすることなく、状態を変更したり、新しいデータを集めたりする必要がある。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:24:09 GMT)
Generalised simultaneous transmission of arbitrary quantum states and classical information [0.3] 本稿では,任意の光量子状態に対して,古典的データを同時に搬送・送信するプロトコルを提案する。
本方式では,伝送前の位相空間の変位によって古典情報を符号化する。
元の量子状態は、元の変位を推測し、適切な逆演算を行うことで復元される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:41:03 GMT)
Physics-Informed Machine Learning for Short-Term Flood Prediction [0.3] 本研究では,LSTMモデルの損失関数に直接,水文学的な知識を組み込むフレームワークを提案する。
特に、トレンドアライメント制約は、降水と放電の傾向の方向性の不整合を罰する。
この正規化は、限られた訓練データであっても、物理的に妥当なヒドログラフの振る舞いを学ぶことを奨励する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:01:06 GMT)
How Many Trees in a Random Forest? A Revisited Approach with Plateau Search and Optuna Integration [0.3] ランダムフォレストのためのHPOのための統合三重項ベースプラトー探索アルゴリズムを提案する。
この方法は、バッグ外スコアの相対的な変化を監視して、最小に近い十分なアンサンブルサイズを適応的に追跡する。
実験により、選択された木の数は共通の絶対値と大きく異なることが示されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:10:43 GMT)
Thinking Through Signs: PEEL as a Semiotic Scaffolding for Epistemically Accountable AI-Enabled Research [0.3] このコメンタリーでは、AIにおけるエピステマティック・エンガジェド・リテラシーのためのプロトコルPEELを紹介している。
これは、Voyant Tools による決定論的遠方読解と、Pircean semiotics と abductive reasoning に根ざした Claude による LLM 解釈を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:19:52 GMT)
Bayesian Membership Privacy for Graph Neural Networks [0.3] グラフニューラルネットワーク(GNN)の既存のプライバシ分析は、非グラフ設定から仮定をほとんど継承している。
特に、ノード依存のプリミティブは、最高のメンバシップ推論テストを特徴付けるのに、タイプIとタイプIIのエラーだけでは不十分である。
本稿では,ノードに依存した事前情報を組み込んだノードレベルのメンバシッププライバシのサンプリング・アウェアな定式化と,グラフサンプリングの確率を相手の知識の一部として扱う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:33:24 GMT)
EURO-5K: When Does Domain Pretraining Matter? Benchmarking Transformers for EU Reporting Obligation Extraction [0.3] EURO-5K(英: EURO-5K)は、欧州連合の136の立法機関による判決レベルの報告義務のコーパスである。
このデータセットでは、差別的トークン分類モデル(BERTスタイル)と生成的スパン抽出モデル(LLM)を訓練し比較する。
その結果,完全微調整の汎用と法定のBERTモデルでは同様の性能(0.89 F1)が得られ,微調整のLLMは文レベルの抽出にエンコーダの精度が一致することがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:20:54 GMT)
StandardE2E: A Unified Framework for End-to-End Autonomous Driving Datasets [0.3] 提案するStandardE2Eは,データセットを駆動するE2E上で単一の統一インターフェースを提供するフレームワークである。
StandardE2Eは、1つの共有データスキーマの下でデータセットごとの事前処理を標準化する。
複数のデータセットを単一のPyTorch DataLoaderに組み合わせて、クロスデータセット事前トレーニング、補助タスクの監視、シナリオレベルのフィルタリングを行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:50:55 GMT)
Multi-Modal Assessment of Road Roughness Using Smartphone Applications, Acceleration, and Passenger Ratings [0.2] 本稿では,低コスト道路粗さ評価のためのマルチモーダル・人間中心型フレームワークについて検討する。
実際の交通状況下では、オーストリア、ハンガリー、ルーマニアで1700km以上のデータを収集した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:13:42 GMT)
Multi-Robot Bearing-only Pose Estimation via Angle Rigidity [0.2] 方法は、ボディフレームの軸受から計算された角度を用いて、ロボットの位置を向きを知らずに$mathbbR3$で推定する。
推定位置、軸受および軸受誘導体から$mathrmSO(3)$の配向を回収する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:22:48 GMT)
BaltiVoice: A Speech Corpus and Fine-tuned Whisper ASR System for the Balti Language [0.2] パキスタンのギルギット・バルチスタンで話されているチベット語であるバルティ語(ISO 639-3: bft)の16.8時間の読み上げ音声コーパスであるバルティヴォイスについて紹介する。
コーパスには、Mozilla Common Voiceの録音から派生したネイティブなNastaliqスクリプトで10,060の検証された発話が含まれている。
We report a Word Error Rate of 30.07% on a held-out validation set of 538 utterances, from a measured zero-shot baseline of 182.18% for Whisper-small on Balti。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:23:49 GMT)
AlignAtt4LLM: Fast AlignAtt for Decoder-Only LLMs at IWSLT 2026 Simultaneous Speech Translation Task [0.2] 英語をドイツ語、イタリア語、中国語に同時翻訳するIWSLT 2026について述べる。
システムは同期カスケードであり、強制アライメントを持つQwen3-ASRはインクリメンタルに更新されたソースの書き起こしを生成する。
英語と中国語の結果はより混合されているが、この方法はGemma-4と結び付けられていない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:52:18 GMT)
A Pocket Offline Model for Simultaneous Speech Translation as CUNI Submission to IWSLT 2026 [0.2] オフライン音声からテキストへの翻訳モデルであるCanaryと同時翻訳機能を実装した。
我々は、チェコ語を英語と英語に、ドイツ語とイタリア語に同時翻訳するタスクをIWSLT 2026に提出する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:37:11 GMT)
How Quantization Changes Interpretable Features: A Sparse Autoencoder Analysis of Language Models [0.2] 密度の高い完全精度モデルから抽出したスパースオートエンコーダの特徴が、そのモデルが量子化されると忠実であるかどうかを問う。
機能は一度にすべて失敗するのではなく、体系的に分解されるのです。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:17:05 GMT)
Better Pauli Channel Learning with Maximum Likelihood Estimation [0.2] 原理的には、最適なサンプル複雑性は最大極大推定(MLE)によって達成される。
興味のある場合、MLEを計算的に抽出できることが示される。
1D局所スパースPauli-Lindbladチャネルの一般的な場合、確率関数は効率よく評価可能なベイズネットワークに還元される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:01:06 GMT)
A Hybrid Approach For Malware Classification Using Secondary Features Fusion [0.2] 従来のマルウェア検出方法は、検出されたマルウェアをそれぞれの家族に分類することはできない。
本稿では,検出されたマルウェアを各マルウェア群に分類する手法を提案する。
提案手法を実験的に評価するために,Microsoft が提供したデータセットに二進法と多進法の両方の分類手法を適用した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:19:35 GMT)
Secure AltDA Integration for Ethereum L2s: An End-to-End Validation Framework [0.1] オルタナティブデータアベイラビリティ(AltDA)システムは、高いスループットのロールアップ設計のための外部データパブリッシュ層をL2に提供する。
既存のエコシステムフレームワークは、外部のDA信頼前提やDA検証の有無など、高いレベルのリスクを特定します。
本稿では,安全なAltDA統合のための標準検証フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:31:03 GMT)
Hedge-Bench: Benchmarking Agents on Hard, Realistic Tasks Pertaining to Financial Reasoning [0.1] Hedge-Bench 1.0は、プロのヘッジファンドアナリストの明確な理由に基づく102件の実際の業務のベンチマークである。
Frontier Model.com/Trata-Inc/trata-hedge-benchでデータセットと評価ハーネスを公開する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:11:56 GMT)
Cross-Prompt Generalization in Detecting AI-Generated Fake News Using Interpretable Linguistic Features [0.1] 本稿では,異なるプロンプトで生成されたAI生成記事の3つのデータセットを用いて,偽ニュース検出におけるクロスプロンプト一般化について検討する。
語彙の多様性,可読性,感情に基づく特徴を捉えた解釈可能な言語特徴を抽出する。
特徴分布の分析により、AI生成したテキストは語彙の多様性を高め、読みやすさを低下させ、全体のデータセットと比較して感情的な強度を大幅に低下させることが示された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:33:56 GMT)
Auditing Engagement Incentives in the Kidfluencer Ecosystem: A Multimodal Weak Supervision Approach [0.1] 本研究では、YouTube上の79のキッドフルエンサーチャンネルにまたがる5,051本のビデオのマルチモーダルAI監査を示す。
ノイズラベリング機能を用いて,各ビデオに確率的評価スコアを割り当てる。
以上の結果から,パフォーマンス労働,情緒的餌食,プライバシー侵害に対する有意義なエンゲージメントプレミアムが明らかとなった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:29:13 GMT)
Multidimensional Reconciliation in Continuous-Variable QKD: Review, Coding Schemes, and Open Source Simulation [0.1] 多次元和解は低信号対雑音比と長距離での運用の課題に対処する。
本稿では,仮想チャネルの構築,逆整合のための実用的な符号化手法の議論,線形誤り訂正符号の統合について述べる。
本稿では,任意の次元に対して多次元整合性を実装したオープンソースのシミュレーションフレームワークであるHDiracについて述べる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:11:09 GMT)
AgentRedBench: Dynamic Redteaming and Integration-Aware Defense for LLM Agents over SaaS Integrations [0.1] ツール・ユース・エージェントへの間接的なプロンプト・インジェクションは、具体的な生産上の脅威である。
AgentREDBENCHは、215の微妙な未特定認可シナリオのベンチマークである。
AgentREDGUARDは、逆ツール-レスポンスコンテンツの統合多言語コーパスで訓練されたガードである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:23:51 GMT)
On the local equivalence of trapped-ion two-qudit gates [0.1] 変換ゲート行列の特異値の観点から、2量子ゲート間の局所同値性の必要条件を導出する。
この条件を用いて、クーディ空間において広く使われている2つのトラップイオン2量子ビットゲートの局所同値性を調べる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:35:31 GMT)
The Word and the Way: Strategies for Domain-Specific BERT Pre-Training in German Medical NLP [0.1] デジタルヘルスケアは、AI支援アプリケーションをサポートする膨大な量の臨床テキストを生成する。
ドメイン固有のRoBERTaベースの言語モデルであるChristBERTを13.5GBコーパスでトレーニングした。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:10:43 GMT)
Practical gates by Majorana fermion motion [0.1] 量子エラー訂正プロトコルは、論理情報を非局所的に保存することにより、局所的なエラーを防止する。
これは、非ローカルな隠れた'論理情報に基づいて効率的な論理ゲートを設計する方法という課題を提起する。
マヨラナフェルミオン(Majorana fermions)と呼ばれる点状粒子の観点から、平面パウリ安定化符号と論理演算のためのプロトコルの一般的な記述を開発する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:10:30 GMT)
Extracting Universal Entanglement Scaling from Mixed Fermionic Gaussian States via Entanglement Projected Entropy [0.1] 混合フェルミオン状態に対する純化独立なガウス空間フィルタであるエンタングルメント射影エントロピー(EPE)を導入する。
これらの結果は、混合状態のエントロピーの下に隠れた境界感度の普遍的スケーリングを公開するエントロピーチャネルフィルタとしてEPEを確立する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:30:34 GMT)
Observation of residual entanglement in chip-based entanglement purification [0.0] 絡み合いの浄化は量子リピータの重要な構成要素である。
本稿では,シリコンチップを用いたハイパーエンタングルメントに基づく単一コピーエンタングルメント浄化方式を示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:53:56 GMT)
Signed Spiking Neuron Enabled by an Orthogonal-Easy-Axis Magnetic Tunnel Junction [0.0] 本研究は, 小型磁気トンネル接合 (MTJ) を用いた LIF (Integrated-and-fire) 動作のためのニューロンを提案する。
このデバイスはバイポーラスパイク生成を可能にし、磁気モーメントダイナミクスを署名されたLIF膜ポテンシャル進化にマッピングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:45:23 GMT)
GTBench: A Curriculum-Grounded Benchmark for Evaluating LLMs as Mathematical Research Assistants in Graph Theory [0.0] GTBenchは、グラフ理論の数学的研究アシスタントとして、大規模言語モデル(LLM)を評価するためのカリキュラムベースベンチマークである。
GPT-5, Claude Sonnet 4.6, Gemini 2.5 Flash-Lite, Llama 3.3 70B, Mistral Large 3 の評価を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:40:25 GMT)
Where Do Large Language Models Fail on Competitive Programming? A Taxonomy of Failures by Algorithm Type and Difficulty Rating [0.0] LLM(Large Language Model)は、競合するプログラミングベンチマークの習熟度が向上することを示す。
本稿では,315コーデックス問題のバランスの取れた分類法を用いて,LLM故障パターンの系統的研究を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:48:38 GMT)
When to Re-Plan: Subgoal Persistence in Hierarchical Latent Reasoning [0.0] ロングホライズン推論は、厳格になることなく中ホライズン意図にコミットするシステムを必要とする。
我々は、この安定性-適応性トレードオフを潜在推論条件で検討する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:55:47 GMT)
When RLHF Fails: A Mechanistic Taxonomy of Reward Hacking, Collapse, and Evaluator Gaming [0.0] 近似ポリシ最適化(PPO)を用いたコンパクトRLHFパイプラインの失敗モードに関する実証的研究について述べる。
我々は、学習した報酬の方向、判定スコア、および平均判定スコアを用いて、チェックポイント間の一致した遷移を分類する。
ROC-AUC 0.821による将来の行レベルの報酬ハッキングを予測し、行レベルの分析では、チェックポイント平均が12の3つの設定で見逃すような局所的な報酬ハックが見つかる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:55:52 GMT)
When Does Complexity Conditioning Help a Frozen Sentence Embedding? A Controlled Study of Per-Sentence and Pair-Level Difficulty Adaptation [0.0] 一般的な直感では、文の埋め込みは入力の難易度に適応すべきである。
本研究では, 表面ベースの文間複雑性が, フリーズベースライン誤差とほとんど関係がないことを示す。
ホールドアウトクロスエンコーダ困難信号でゲートされた小さなペアレベル残差は、一貫した利得を得る。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:04:58 GMT)
WISE-HAR: A Generalizable Ensemble Deep Learning Framework for WiFi-Based Human Activity Recognition [0.0] WiFi信号を用いたヒューマンアクティビティ認識(HAR)は、スマートホーム、医療監視、セキュリティシステム、環境支援生活のためのトランスフォーメーション技術として登場した。
本稿では,Wallhack1.8k WiFi スペクトログラムデータセットを用いて,「空き部屋」,「ウォーキング」,「ウォーキング+アームウォービング」の3つの異なる行動を認識するための包括的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:25:46 GMT)
Tridirectional Discriminating-Power Formal Verification of Smart Contract Reentrancy Defense Against Production-Deployed Solidity Source [0.0] OpenZeppelinのReentrancy-guardパターンの最初の正当性証明は、プロダクションデプロイされたSolidityソースのLean 4ステートマシンモデルに対するものだ。
スマートコントラクトの継続は2016年以降、記録された損失として5億ドル以上を突破した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:01:42 GMT)
Trans GAN-WT: A Feature Extraction and Interactive Learning-Based Anomaly Detection Model for Wind Turbine Time Series Data [0.0] 本稿では,トランスフォーマーと生成対向ネットワークを融合した異常検出モデルを提案する。
これにより、再構成誤差を増幅することにより、小さな偏差異常の漏れ検出率を低減する。
また、自己回帰推論を用いてマルチモーダル特徴を抽出し、トレーニングの安定性と一般化能力を高める。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:57:08 GMT)
Trajectory-Aware Node Contributions and the Limits of Static Controllability [0.0] エマージェント・コントリビューション(emergent Contributence)とは、ノードの動的レバレッジの尺度である。
「EC」は線形時間不変極限における平均的な制御可能性に正確に還元する。
この位相空間内の複数の領域から推定される実数系を5つ配置する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:56:36 GMT)
Training-Free Lexical-Dense Fusion for Conversational-Memory Retrieval [0.0] 新しいクエリに応答する過去数回を検索することは、長期的な会話メモリの背後にある検索ボトルネックである。
最近の研究であるNano-Memoryは、クエリターンの最大類似度によるセッションのスコアが平均プールされたセッションの埋め込みを上回っていることを示している。
私たちはそれを複製し、トレーニングなしのCPUのみの検索ステージに何を追加するべきかを尋ねます。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:22:16 GMT)
Towards Non-Monotonic Entailment in Propositional Defeasible Standpoint Logic [0.0] 命題記述可能なスタンドポイント論理の大きな断片が位置条件の集合として表現可能であることを示す。
次に、このフラグメントにおける非単調なエンターメントの特徴付けに焦点をあて、命題のケースからPケースへランクに基づくエンターメント関係を転送する方法を定義する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:44:37 GMT)
Towards Estimating Normal and Shear Interface Pressures in Prosthetic Sockets via Least Squares and Mechanics Modeling [0.0] 義足のソケットフィッティングは手動と反復がほとんどであり、客観的な適合度は依然として限られている。
従来の圧力センサーは時間の経過とともにドリフトする傾向があり、ソケット内の狭い場所でのみ正常な圧力を捉えている。
本研究は,スパース圧力センサ下でのモデル性能を評価するテストベッドを導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:17:29 GMT)
Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification [0.0] エンタープライズ人工知能(AI)エージェントの事前デプロイ検証は、大規模言語モデル(LLM)のベンチマークと運用デプロイメントの間には、依然として重要なギャップがある。
本稿では,許可,ドメイン制約,安全性,ガバナンスルール,自律性レベルにまたがる認証空間の形式化を行うエージェントオペレーション・エンベロープという,3つのコンポーネントを組み合わせたオントロジー的な検証フレームワークを提案する。
4つの規制産業(フィンテック、バンキング、保険、ヘルスケア)のコントロールパイロットは、125のプライマリソース規制要件と25のインジェクト障害に対して評価された1,800のシナリオを生成した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:37:11 GMT)
Topological Ignorability for Structural Causal Effects Beyond Means [0.0] 介入は平均よりも結果分布の構造を変化させる。
平均治療効果のような平均的な因果推定は重要な構造的効果を欠く可能性がある。
本稿では,介入結果法則の要約に基づくトポロジカル・幾何学的因果指標を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:19:17 GMT)
Tonal parsimony in chord-sequence analysis: combining modulation cost and tonal vocabulary [0.0] コード配列に対する局所音節の割り当てについて検討する。
標準的な動的プログラミング手法は変調を最小化するが、必然的に多くの音調中心を導入することができる。
我々は、この遷移のみの目的を、純最小語彙分析と音節パシモニーと比較した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:36:05 GMT)
Token Budgets: An Empirical Catalog of 63 LLM-Agent Budget-Overrun Incidents, with an Affine-Typed Rust Mitigation as a Case Study [0.0] 私たちは、アフィンのオーナシップを運用するRustクレートを構築して、クローン、ダブルスペンディング、あるいは予算の使用を委譲することで、オペレータが避けなければならないランタイムのハザードではなくコンパイルエラーを発生させます。
5つのランタイム、3つのプロバイダ、温度階層化されたライブAPIテストで、このアプローチでは、コンカレントワークと同等の動作で、キャップ違反がゼロで、偽の拒否がゼロであることを報告している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:46:57 GMT)
The quantum-gravitational imitation game [0.0] 我々は、重力の量子的性質のテストはテーブルトップ実験で実現できると主張している。
最近提案されたこれらのテストは、量子重力模倣ゲームとしてフレーム化している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:10:47 GMT)
The Violation Situation Pattern: A Knowledge-Graph Pattern for Compliance Violations [0.0] コンプライアンスパイプラインは、永続的なグラフオブジェクトとして、レビュー状態、影響を受けるエンティティ、監査履歴を保持できない。
違反状況パターン(VSP)は、検出された各違反を、ルール識別子、時間的妥当性間隔、ライフサイクル状態、関連するエンティティへのエビデンスリンクでグラフノードとして再定義する。
V4を節プレゼンから期限チェックに拡張すると、F1は0.312から0.602に上昇するが、パターンのアイデンティティ、ライフサイクル、エビデンスセマンティクスは同じままである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:33:50 GMT)
The Value Function Semi-Algebraic Set in Partially Observable Markov Decision Processes [0.0] 無限水平部分観測可能なマルコフ決定過程(POMDP)における実現可能な値関数の幾何学を,メモリレスポリシの下で検討する。
我々の主な貢献は、半代数集合として実現可能な値関数の集合を特徴づけることである。
我々の幾何学的特徴は、MDPとPOMDPの双方における政策最適化の展望に新たな洞察を与える。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:30:49 GMT)
The Security Budget of Code LLMs: An Information-Theoretic Capacity-Security Bound [0.0] 本稿では,機能容量$Cap=rmI(c*;c_)$と摂動保持$$Sec=rmI(c_;tilde c_)$のコードLLMに対する情報理論トレードオフについて検討する。
for $pto c_$ with perturbed prompt $tilde p$, we prove $Cap+Secle rmH(c*)+rmI(p;tilde p)$。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:22:14 GMT)
The Saturation Trap and the Subjectivity of Intervention Timing: Why Affect-Based Triggers and LLM Judges Fail to Time Interventions on Autonomous Agents [0.0] インターベンションタイミングは信頼性の低い構造であり、シングルアノテータF1を不適切な最適化ターゲットとする。
我々の貢献は、人間のレータ間の信頼性、4つの検出器アーキテクチャ、モデルのLEM-judgeスイープ、再現された飽和効果にまたがるこの問題を、共同でマッピングすることである。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:54:27 GMT)
The Language of Elution: Autoregressive Prediction of the Next Feature in Untargeted LC-HRMS Lipidomics [0.0] SCIEX TripleTOF 6600+, Waters CSH C18)による4種類の臨床リポソームコホートからの15,242種の特徴の訓練
LSTMは98.4%の精度(99.99%のトップ5、平均絶対誤差3.6Da)、トランスフォーマー98.0%に達する。
これらの結果から, 溶出シーケンスは予測可能であり, メタボロミクスのアノテーションカバレッジを向上させるため, 予測MS/MS獲得の基盤となることが確認された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:42:17 GMT)
The Impact of Temporal Granularity on Socio-Demographic Inference from Household Load Profiles [0.0] 我々は,15分から7日間の粒度の負荷プロファイルが,1年間の1,589世帯のデータセットにおける8つの社会デデノグラフィー属性の予測可能性に与える影響を分析した。
粗化は予測精度を低下させるが、2つの高原が出現する: 性能は15分から1時間、また1日から7日である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:06:14 GMT)
Template Collapse and Information-Theoretic Limits in Camera rPPG Pulse Morphology Restoration [0.0] コンシューマー・フェイスカメラ リモート・フォトプレティス幻覚(r)は、受動的心血管モニタリングを可能にする。
しかし、動脈硬化度をコードする単一サイクル波形形態が、この測定から回復可能であるか否かは明らかになっていない。
16のエンコーダアーキテクチャを3つのデータセットで評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:50:07 GMT)
Subspace-selective unitary manipulation based on the Hilbert-space symmetric structures in the multiple-quantum operator algebra spaces in the quantum-computing speedup theory [0.0] 量子計算スピードアップ理論(quantum-Computing speedup theory)は、量子系の対称構造と性質を、QCS(Quantum-Computing-Speedup)の基本的な資源とみなす。
今日では、量子コンピューティングとシミュレーションをスピードアップするために、基本的なQCSリソースをどのように活用するかが大きな問題となっている。
本稿では、ヒルベルト空間から派生した基本的なQCS資源を活用し、量子コンピューティングとシミュレーションを高速化することを目的とする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:33:27 GMT)
Stein Kernelized Molecular Dynamics for Active Learning of Interatomic Potentials [0.0] 機械学習原子間ポテンシャル(MLIP)は、効率的で正確な原子論シミュレーションを可能にするが、トレーニングデータの品質と多様性に極めて依存する。
本稿では,Stein kernelized molecular dynamics (SKMD)について紹介する。これは,相互作用する粒子動力学を用いて,MLIPの能動的学習および微調整のための情報的トレーニング構成を取得するための拡張サンプリング手法である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:07:41 GMT)
Staying Alive: Uncensored Survival Analysis with Tabular Foundation Models [0.0] Tabular Foundation Models (TFM) は、1回の前進パスで予測タスクを実行する能力によって近年大きな関心を集めている。
本研究では,TFMを用いてイベントの時刻を予測し,反復的に右検閲データを出力することで,生存率の劣化を抑える訓練のない手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:11:23 GMT)
Short-Term Synaptic Plasticity Stabilizes Goal-Conditioned Dynamics in a PFC-Inspired Reservoir Model for Multistep Goal-Directed Action Planning [0.0] 短期的なシナプス可塑性は、目標情報をアクション・ユース・ダイナミクスとして安定化させることができることを示す。
これらの結果から, ゴール依存型実効リカレント接続の動的変調がロバストなゴールダイナミクスをサポートすることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:59:46 GMT)
Scattering and Bound States of Two Heteronuclear Ultracold Atoms in a Quasi-Two-Dimensional Confinement [0.0] 準二次元(準2次元)幾何学における超低温ヘテロ核原子の2体問題を解く。
複数の2次元散乱共鳴は、長手CoMと相対運動の結合によって引き起こされる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:45:14 GMT)
Sample Complexity and Decision-Theoretic Guarantees for Bayesian Model Averaging over Decision Trees with Catalan-Exponential Priors [0.0] ダイリクレ・マルティノミカルリーフモデルとカタルーニャ指数木サイズの先行モデルを用いてベイズ決定木 (BDT) を閉形式で解答する。
我々は有理コミットメントしきい値の完全非漸近理論を確立する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:54:11 GMT)
Same Weights, Different Robot: A Deployment Safety View of VLA Policies [0.0] 視覚言語アクション(VLA)ポリシーは、しばしばチェックポイント定義オブジェクトとして扱われる。
安全レビューは、実行可能なロボットポリシーを欠いている間、チェックポイントを認証することができる。
我々はこのギャップを実行可能なポリシー仕様問題として定式化する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:45:00 GMT)
SPADE: Sketch-guided Path Planning Augmented with Diffusion Experts [0.0] 最近の最先端フレームワークは、模倣学習を利用して、専門家によるデモンストレーションから行動固有の経路計画モデルを訓練している。
これらのアプローチは、目に見えない環境への限定的な一般化と、デモコレクションにおけるロバストさの2つの重要な制限に直面している。
本稿では、ROS 2上に構築されたアノテーションツールの改訂と、拡散ベースの拡張をベースラインの行動クローンモデルに統合する新しいトレーニング戦略という、2つの主要な貢献に焦点を当てた拡張フレームワークを紹介する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:29:00 GMT)
Reproducibility is the New Copyleft: Defining AGI-oriented Reproducible Builds [0.0] Copyleft(コピーレフト)は、ソースコードを配布のすべての行為に結び付けることによって、ユーザーの自由を保証するために著作権を使用した法的ハックである。
本稿では、AGIのコピーレフトの機能的類似は、コード上の共有のような条項ではなく、再現可能なビルドに基礎を置いていなければならないと論じる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:50:24 GMT)
Reliability-Guided Depth Fusion for Glare-Resilient Navigation Costmaps [0.0] 反射床、ガラス境界、光沢のある屋内表面の光沢は、アクティブステレオRGB-D深度測定を頻繁に破壊する。
本稿では,明示的な深度信頼度モデルに基づくグレアレジリエントなコストマップ構築手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:06:15 GMT)
RelGT-AC: A Relational Graph Transformer for Autocomplete Tasks in Relational Databases [0.0] 本稿ではRelGT-AC(Relational Graph Transformer for Autocomplete)を提案する。
3つのRelBench v2データセットにまたがる7つのタスクで、RelGT-ACは3つの回帰オートコンプリートタスクすべてでGraphSAGEベースラインを上回り、テキスト重可読タスクで最大AUROCポイントを達成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:25:53 GMT)
ROBUST-WT: Robust Uncertainty-aware Segmentation Transform via Whitening and Training Enhancements [0.0] 本研究では,Whitening Transform-based Probabilistic Shape Regularization Extractor (WT-PSE)学習フレームワークの改良を体系的に検討した。
基礎光学ディスクセグメンテーションベンチマークの実験では、改良されたパイプラインが最終的なエポックディスクDiceスコア0.956とASDスコア13.31を達成し、ベースラインのエポック5Diceスコア0.939を上回った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:59:35 GMT)
QuITE: Query-Based Irregular Time Series Embedding [0.0] IMTS用の簡易かつ効果的なプラグアンドプレイ埋め込みモジュールQuITE(Query-Based Irregular Time Series Embedding)を紹介する。
QuITEは学習可能なクエリトークンを使用して、単一の自己アテンション層を通じて不規則な観測を集約する。
実験の結果、QuITEはMCSモデルを継続的に改善し、予測値の平均相対利得は54.7%、分類値が15.8%である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:37:54 GMT)
Q-FE: A Quantum-Native 6G Far-Edge Architecture Securing Industrial IoT Digital Twins via CSIDH-PQC and Asynchronous Federated Learning [0.0] 3つの共設計コンポーネントを統合した量子Native 6G Far-EdgeアーキテクチャであるQ-FEを提案する。
Q-FEはMAC層オーバーヘッドをML-KEM/Kyber-1024に対して62%削減し、P99.9 URLLCレイテンシを0.78msで維持し、同期フェデレートラーニングよりも31%高速化する。
正式な脅威モデルは、量子盗聴、モデル中毒、シビル攻撃に対するレジリエンスを確認する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:13:44 GMT)
Pure states for subregions in gravity and their entanglement entropy [0.0] 量子重力における空間的部分領域は、混合された密度行列ではなく純粋状態に割り当てられることが提案されている。
状態は、空間部分領域を含む時空部分領域が固定され、フィールド構成と周囲幾何学が要約される部分凍結重力経路積分によって作成される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:56:33 GMT)
Privilege Risk Evolution for Non-Human Identities: A Temporal Fiber Model for Cloud IAM [0.0] クラウドパーミッションガバナンスは、パーミッション等価性を静的な関係として暗黙的に扱う。
非人間的同一性に対して、同値性は2つの既約成分を持つことを示す。
我々は、時間的同値特権回路の下で同値類を呼ぶ。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:52:01 GMT)
Post-Selection Free Generation of Multi-Photon Added Coherent States [0.0] 本稿では,高忠実度多光子付加コヒーレント状態の選択後自由生成のためのプロトコルを提案する。
我々の結果は、確立された量子光学プラットフォームを用いて、複雑な非古典状態への決定論的経路を解き明かす。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:25:59 GMT)
Populating topologically protected edge states of a Chern insulator with the cold-atom elevator scheme and measurements [0.0] 二次元チャーン絶縁体は、位相的に保護されたキラルエッジ電流をサポートする。
以前は、貯水池から粒子を移動させることで、チャーン絶縁体の選択した端状態の群を発生させることができることが示されている。
本研究では, 貯水池が廃棄される前に, 即時投射計測を行うことが貯水池に与える影響を数値的に検討する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:21:15 GMT)
Perturbative results for fractional quantum mechanics [0.0] 分数的なシュルディンガー方程式は、通常の非相対論的形式からわずかに逸脱する運動エネルギーで研究される。
通常の摂動理論は封筒理論と比較して用いられる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:40:21 GMT)
Out-of-time-order correlators for Swanson Hamiltonian with interaction terms [0.0] 我々は、標準位置と運動量演算子のための時間外順序相関器(OTOC)を演算する。
本分析は, 積分性, 非線形性, 駆動性, パリティ時間対称性が, 作用素相関の時間的成長をいかに形作るかを明らかにする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:47:13 GMT)
Optimal Design and Analytical Modeling of a Soft Fin-Ray Effect Gripper Finger Using the Finite Rigid Elements Method [0.0] 本研究の目的は、フィンレイエフェクト(FRE)軟式グリップフィンガーの設計、製造、モデル化である。
このデザインは、適応性と正確な力の応用の両方を必要とするトマトなどの繊細な農作物を優雅に把握することを目的としている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:48:26 GMT)
Optical Memory Optimization Across Rubidium Isotopes and Transitions [0.0] 我々は,8,5mathrmRb$および8,7mathrmRb$同位体の光メモリ効率と記憶時間について検討した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:39:14 GMT)
Operator spreading in random circuits with orthogonal or symplectic symmetry [0.0] アンサンブル平均のパウリ弦重みは、ユニタリ不変回路のバイナリ構造ではなく、三値構造に緩和される。
qudit size $q=2$ の場合、蝶の速度はハール・ランダムのアンサンブルを超える。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:45:55 GMT)
Operationalizing Cyber Attack Prediction: A Gap-Prioritized Framework with Dataset and Model Selection Guidelines [0.0] 本稿では、150以上のベンチマークデータセットと200以上の研究を総合的に分析し、5つの実装ハードルを特定し、優先順位付けする。
本稿では,検出効果,実装コスト,修復時間に基づいて,これらの制限を評価する新たなギャップ優先化フレームワークを提案する。
この研究は学術的な知見を、堅牢で生産指向のAI駆動型サイバーディフェンスのための実用的な意思決定支援ツールに翻訳する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:29:53 GMT)
OpenAgenet/OAN: Technical Architecture for Trust-Governed Agent Identity and Discovery [0.0] 本稿では,OpenAgenet/OANの技術アーキテクチャについて述べる。
OANは、オープンエージェント相互接続のためのプロトコル中立層である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:18:14 GMT)
OpenAgenet/OAN: Open Infrastructure for Trusted Agent Interconnection [0.0] OpenAgenet(略してOAN)は、信頼できる相互接続エージェントのためのオープンインフラストラクチャプロジェクトである。
Agentsが分離されたアプリケーションからオープンなマルチオペレータネットワークに移行すると、その問題に対処する。
OANはプロトコルニュートラルな信頼層として設計されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:14:34 GMT)
On dynamic multi-agent pathfinding methods: review, simulations and modifications [0.0] 本稿では,Dijkstra,D* Lite,Space-Time A*,WHCA*,M*の6つの代表アルゴリズムと,A**と表記される新しい手法を統一シミュレーションフレームワーク内で評価する。
提案したA**アルゴリズムは、オンライン時間適応からオフラインの幾何経路生成を分離するテンプレートベースのアプローチを導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:51:40 GMT)
Notarized Agents: Receiver-Attested Confidential Receipts for AI Agent Actions [0.0] 現在のAIエージェントの可観測性は構造的に損なわれている。
妥協された、またはバギーなエージェントは、自身のトレースを省略、変更、または製造することができる。
本稿では,信頼境界を逆転することでこの問題を解決するプロトコルのクラスを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:21:58 GMT)
NetKV: Network-Aware Decode Instance Selection for Disaggregated LLM Inference [0.0] 現在のスケジューラは、計算負荷とプレフィックスキャッシュのローカリティのみをルートする。
ネットワーク用語を無視した場合、コンテキスト長が増加するにつれてキャッシュのみのスケジューリングが任意に準最適であることを示す。
我々は、NetKVがラウンドロビンで平均TTFTを21.2%、調整されたキャッシュ+ロード対応スケジューラで17.6%削減することを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:06:57 GMT)
Multiparametric Quantum Sensing of Liquids Using NV Centres and Tethered Magnetic Nanoparticles [0.0] 本研究では, 窒素空孔中心磁束, 緩和率, 表面張力ナノ粒子を用いた非侵襲多パラメータ液体解析法を提案する。
ダイヤモンド表面を異なる長さ、配列、化学修飾のDNAテザーによって機能された領域で空間的にパターン化することにより、単一の液体を高次元の量子応答ベクトルにマッピングする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:15:42 GMT)
Mott transition of photons: quantum Monte Carlo study of Gross-Neveu criticality in a cavity [0.0] ミツバチ格子上のハバードモデルは半金属-絶縁体モット転移の原始的実現である。
負符号のないフェルミオン量子モンテカルロアルゴリズムを定式化し、有限系サイズでのバイアスのない結果が得られる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:50:21 GMT)
MariData: One-Step Unpaired Image Translation for Maritime Environments [0.0] 本稿では,一段階の無人翻訳アーキテクチャであるCycleGAN-turboを用いて,合成海洋データを生成するフレームワークを提案する。
我々は7000枚の海洋画像のデータセットを収集し、デイ・トゥ・フォグギー、デイ・トゥ・サンセット、デイ・トゥ・ナイトドメイン翻訳のモデルを訓練し、評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:05:55 GMT)
Machine-Learning Prediction of Quantum Fisher Information from Collective Spin and Spectral Features [0.0] 本研究では,実験的に利用可能な量の限られたセットから,Quantum Fisher情報の予測範囲について検討する。
物理的に動機づけられた特徴を比較することにより,QFIを規定する主要な特徴集合を同定する。
我々は,QFIが主に密度行列の集団共分散と低次スペクトルモーメントの相互作用によって制御されることを示した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:45:09 GMT)
Lexicons and grammars for language processing: industrial or handcrafted products? [0.0] 語彙や文法の構成過程のほとんどは手作業である。
レキシコンや文法の情報内容はコーパスよりも豊かである。
言語技術のスペシャリストは、手作業で構築されたリソースを扱うのに徐々に慣れていく。
辞書と文法の構築プロセスは自動化され、工業化されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:55:44 GMT)
Kinematical correlations via $κ$-Poincaré coproducts [0.0] ミンコフスキー時空におけるホップ代数運動量組成則の運動論的結果について検討する。
シングルブランチ方式では、これは単に変形した相関積である一方、マルチブランチ方式では、$P_$で指定された状態は別個の予備枝に拡張することができる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:21:42 GMT)
Intellectual Humility as a Cognitive Filter for AI-Generated Health Misinformation. An Evolutionary Perspective on Epistemic Vigilance [0.0] 本研究では,知的な謙虚さがAIによる健康対話の評価にどのように影響するかを検討する。
謙虚度が高い人は疑似科学的内容の信頼性が著しく低いと評価した。
我々はこれらの知見を進化レンズで解釈し、情報に不確実な環境をナビゲートするための祖先適応をIHが示すことを示唆した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:23:09 GMT)
Inhomogeneous Light-Matter Coupling as a Resource for Noiseless Quantum Memory [0.0] 2レベル系の不均一アンサンブルは、基本的な光物質物理学および量子ネットワーク応用において重要である。
我々は,このようなシステムにおける集合力学の直観的かつ解析的な記述を提供する一般的な導波管モデルを開発した。
エコーに基づく量子記憶の場合、このモデルは断熱パルスによるノイズ・エチョ抑制の物理的起源を明らかにする。
絡み合い発生のため、同じ機構は、未探索のロバスト制御パルスの制限を露呈し、新しい複合パルスプロトコルをもたらす。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:03:44 GMT)
Incremental Sheaf Cohomology on Cellular Complexes: O(1)-in-n Lazy Edit Processing under Bounded Local Geometry [0.0] 最初のせん断コホモロジーの漸進的維持のためのアルゴリズム的枠組み:H1(X; MathcalF)$ 有限次元の細胞シーブを備えた動的に進化する1次元細胞複合体について。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:26:02 GMT)
Human-AI Collaboration and the Transformation of Software Engineering Work [0.0] Generative AI(GenAI)とAgenic AIのソフトウェア開発への統合は、ソフトウェアエンジニアリングの再構成である。
私たちは、どの伝統的なアクティビティが自動化されているか、拡張されているか、新しく現れているかをマップします。
我々は、実証可能な9つの命題を導き、理論、産業労働の変革、大学のカリキュラム、組織的リーダーシップへの意味を明確に示します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:36:39 GMT)
How Visible Are Silent Manipulation Failures? An Observability Study of False-Success Detection in Simulated Robot Episodes [0.0] ロボット操作の模倣学習ポリシーは、トレーニングエピソードに付随する成功ラベルの品質を継承する。
ロボットが実際にタスクの結果が間違っていた場合、成功として記録するエピソードだ。
本研究では,2つのALOHAタスクのシミュレーションテストベッドを構築し,ラベル編集ではなく環境摂動による障害を誘導し,検出者が決して見ることのない特権的シミュレータ状態によって各エピソードをラベル付けし,ロボットがフラグ付けしたエピソードのみを成功に維持する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 04:22:13 GMT)
HighTide: An Agent-Curated Open-Source VLSI Benchmark Suite [0.0] HighTideは進化中のAI支援ベンチマークスイートだ。
このスイートは公開されており、オープンソースのハードウェアエコシステムと共に成長するよう設計されている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:34:35 GMT)
High-Precision APT Malware Attribution with Out-of-Scope Resilience [0.0] そこで本稿では, 格付け二元分類器を用いた高精度なAPTマルウェア帰属手法を提案する。
APT Malware データセットと、スコープ外動作のストレステストを目的とした、より大きな組み合わせデータセットについて、本手法の評価を行った。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:44:46 GMT)
High-Dimensional Quantum Key Distribution via full Core-mode Encoding over Deployed Multicore Fibers [0.0] 量子鍵分布(QKD)は、量子物理学に根ざした情報理論のセキュリティを提供する。
高次元(HD)符号化は、ノイズ耐性とシークレットキー収率の両方を増加させる。
次世代通信ネットワークの先駆的プラットフォームであるマルチコアファイバ(MCF)は、HD-QKDの天然基板である。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:58:35 GMT)
Graphical and algebraic methods for Boolean factoring [0.0] 我々はESOPとSOPの両表現を分解する新しいアルゴリズムを開発した。
ANDカウントは古典回路や量子回路で可逆関数を実装するのに必要な AND と Toffoli の数を決定する上で重要な役割を果たしている。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:57:27 GMT)
Geometric Instability and Self-Limitation in Driven Quantum Systems [0.0] 我々は、駆動量子系における局所的非断熱性のための統一的な幾何学的枠組みを開発する。
量子状態の進化速度とスペクトルギャップ保護の競合を測る普遍的な次元のない不安定パラメータを導入する。
このフレームワークは自然に、バーズ計量と量子フィッシャー幾何学を通して、オープン量子システムに拡張される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 06:04:44 GMT)
Generating quantum ensembles via reverse-time quantum diffusions [0.0] 連続的に測定された量子系の量子拡散に対する逆時間 denoising 理論を確立する。
我々は、デノナイジング力学が物理的に許容できる量子拡散であり、同じ測定誘起ノイズを持つことを証明した。
これは、単純な分布のサンプルをより複雑な量子状態のアンサンブルに変換するための原則化されたフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:27:04 GMT)
Gender-Dependent Diagnostic Substitution in LLM Medical Triage: Same Symptoms, Unequal Urgency [0.0] 症例の性別と年齢が異なる場合, 大規模言語モデルが同一の神経症状に対して, 異なる医用トリアージを推奨するか否かを検討する。
本研究は,7つの人口動態条件にまたがって標準化された症状プロファイルを示す。
ジェンダーに依存した男女差がある。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:35:12 GMT)
Fully Automated Identification of Lexical Alignment and Preference-Stage Shifts in Large Language Models [0.0] ChatGPTのようなデジタルチャットアシスタントが使用する言語は、人間の期待(ミスアライメント)から逸脱することができる
本稿では,レキシカルアライメントスコア (Lexical Alignment Score) と三角優先シフト (Triangulated Preference Shift) の2つの評価指標について述べる。
この手順は、手動による介入なしに、"suggest"、"additionally"、"strategy"などの過剰使用項目を特定し、彼らの嗜好学習との関係を推定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 05:23:45 GMT)
From Prompt to Service: An SLM-Based Agent Orchestration Gateway for AI-Driven Virtual Worlds [0.0] 本稿では,AI駆動型仮想世界のためのSLMベースのエージェントオーケストレーションゲートウェイを提案する。
エッジデプロイされたSLMは、各ユーザプロンプトのセマンティックインテントを分類し、サービスレジストリがルーティング決定を検証して解決し、選択されたバックエンドが透過的に呼び出される。
ゲートウェイはInterwovenXRバーチャルミュージアムテストベッド内で実装され、評価される。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:22:03 GMT)
From Control Boundary to Insurance Claim: Reconstructing AI-Mediated Losses Through the CER Framework [0.0] 本稿では,保険のAIシステムが因果連鎖にある損失に対処する。
具体的には、AI残差リスク伝達のためのユースケースレベルの診断であるCERを紹介する。
この論文は、AI固有の再構築問題を定義し、CERを通じてその問題を運用し、AI再構築のためのクレームグレードの証拠を特定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 15:29:43 GMT)
From 3D Perception to Safety Reasoning: A Graph-Based Framework for Real-Time Underground Mine Monitoring [0.0] 本稿では,カラー化した3次元点群を構造化・追跡可能な安全推論出力に変換する連続監視フレームワークを提案する。
このフレームワークは、3Dセマンティック認識、不確実性に基づく異常検出、ルールベースのハザードチェック、オンデバイスLSM推論、およびGraphRAGベースのメモリ分析を組み合わせる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:37:38 GMT)
FlowGuard: Flow Matching for Identity-Independent Detection of Data-Free Model Stealing Attacks on Energy System Intrusion Detection Systems [0.0] FlowGuardは、入ってくるクエリをアウト・オブ・ディストリビューション(OOD)として分類するフローマッチングに基づく、IDに依存しない防御である。
このアプローチは、データフリーモデル盗難攻撃のために合成的に生成されたクエリが、実際のネットワークトラフィックよりも低次元の多様体を占有しているという事実を生かしている。
我々は,MAZE と DisGUIDE 攻撃を用いたPRADA と FDINet に対して,単サイクルで分散した (100-client Sybil) 設定で評価した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:18:45 GMT)
FPGA Based Feedforward System for Photonic Quantum Computing Applications [0.0] フィールドプログラマブルゲートアレイは、新興量子およびフォトニック技術におけるリアルタイム信号処理のための高性能なソリューションを提供する。
FPGAを用いた高速フィードフォワードシステムを提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 11:18:29 GMT)
FORGE: Multi-Agent Graduated Exploitation and Detection Engineering [0.0] 本稿では,3つのサイロを橋渡しするマルチエージェントシステムFOGEについて述べる。
5つの特殊なエージェントが固定パイプラインで実行し、CVEメタデータからターゲットとする脆弱なアプリケーションを生成する。
階層化された知識アーキテクチャは、アセスメント、ビルド、エクスプロイトの経験をその後のCVEに転送するインテリジェンスを蓄積する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:32:28 GMT)
Extracting accent features in spoken Brazilian Portuguese without sociolinguistic labels [0.0] ブラジルポルトガル語(pt-BR)の地域アクセント分類は、信頼できるラベリングの必要性に悩まされている。
本研究は,音響ラベルのみを用いた特徴抽出のための新しいワークフローを導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:37:25 GMT)
Exploring the Topology and Memory of Consensus: How LLM Agents Agree, Fragment, or Settle When Forming Conventions [0.0] 2つの設計選択が、メモリの協調効果のサインを反転させる方法でどのように相互作用するかを示す。
固定16エージェントトポロジ上でのネットワークナーミングゲームによる432回のシミュレーションでは,メモリ深度とネットワーク構造が異なる。
解析的に抽出可能な生成機構の探索において,エージェントの選択はFactitious Playによってよく捉えられていることがわかった。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:31:54 GMT)
EvalStop: Using World Feedback to Detect and Correct Reward Overoptimization in Multi-Tenant RLHF Platforms [0.0] クラウドファインチューニングプラットフォームは、学習された報酬モデルが人間の品質のプロキシとして最適化される、RLHFワークロードにますます役立ちます。
EvalStopは、k連続のevalスコアダウンのジョブを終了し、GPUをリリースし、最高のチェックポイントを保持し、ベーススケジューラに委譲する。
RLHF重負荷では、EvalStopは精度98%/リコール99%/FPR 1.5%を実現し、JCTを9%改善し、SRTF-Estを22%削減した。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:03:39 GMT)
Essential Unitarity for Higher-Order Quantum Computation [0.0] モルフィズムは、実行によって構成される分極境界リンクであり、可逆的な制御と分岐を提供する単位自由モノイド和である。
基本ユニタリティは、ダガーモノイド構造、コヒーレンス再帰、カリー化と互換性のある独特な述語である。
このフレームワークは、コヒーレントな量子スイッチと他の1スロット、等比、純度保存されたスーパーマップをコヒーレントな純粋コムダイレーションとして実現している。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:55:36 GMT)
Entropy Gate: Entropy Quenching for Near-Lossless Token Compression in LLM Pipelines [0.0] LLMパイプラインは、低情報コンテンツにかなりのトークン予算を浪費する。
エントロピー・クエンチングを適用したトークン圧縮フレームワークであるエントロピー・ゲートを紹介する。
フレームワークはステートレスで、モデルに依存しず、OpenAI互換のHTTPプロキシとしてデプロイされる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:55:02 GMT)
Energy-selective quantum search with Ising Hamiltonian phase oracles [0.0] 物理進化(exp(-mathrmi T H))を直接ハミルトニアン相オラクルとして用いるエネルギー選択的量子探索プリミティブについて検討する。
それにもかかわらず、Grover拡散演算子との交互にGrover型増幅ピークを生成することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:24:05 GMT)
End-to-End Text Line Detection and Ordering [0.0] Orliは、両方のサブタスクを単一のイメージ・ツー・シーケンス問題としてキャストするエンドツーエンドモデルである。
ページイメージから、Orliは読み順でテキスト行のベースラインを直接自動回帰生成する。
10の書記システムにまたがる196,691ページの異種コーパスで訓練された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 19:29:32 GMT)
Emergent Ordinal Geometry in Transformers Trained on Local Comparisons [0.0] 推移的推論は、A Cが隣接関係のみを知ること(A B, B C)を推測する挑戦である。
我々はトランスフォーマーが同じプリミティブを取得し、隠れた全順序から隣接した比較のみに基づいて小さなモデルを訓練するかどうかを問う。
分布外一般化は、目覚ましい幾何学的再編成とともに現れる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:31:43 GMT)
Emergence of Macroscopic Quantum Order via Translational Zero Modes [0.0] 電子励起と変形可能な格子との強い結合は異なる経路を可能にすることを示す。
臨界密度を超えると、この結合は自己生成された凝縮電位を核化し、それらを生成する非常に励起を阻害する。
これは、固定スペクトル内での冷却やペアリング不安定性など、マクロ的な量子秩序への一般的な経路を確立する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 20:12:57 GMT)
Efficient Quantum Error Mitigation for Unitary k-Designs [0.0] ノイズの多いハードウェアは 量子回路を無数のエラー源に 依存させる
我々は、回路全体の分極を推定するために、一元的k-設計パウリ支援分布を用いる。
本手法は、2ビットのゲートオーバーヘッドを発生させることなく、一元的k-設計におけるゲートベースの誤差を効果的に低減することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 16:52:08 GMT)
DriftSched: Adaptive QoS-Aware Scheduling under Runtime Token Drift for Multi-Tenant GPU Inference [0.0] 大規模言語モデル(LLM)推論サービスは、効率的なマルチテナントGPUスケジューリングの需要を増大させている。
本稿では,マルチテナントGPUスケジューリングのための適応型スケジューリングフレームワークDriftSchedを提案する。
このフレームワークは、不均一なマルチテナントワークロードの下で、FIFO、プライオリティ、重み付け、最短ジョブファースト(SJF)、老化優先度スケジューリングポリシーを評価する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:39:31 GMT)
Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models [0.0] 本研究では,文脈拡張型言語モデルシステムが読者モデル行動に与える影響について検討する。
本稿では,500 MMLU-Pro 項目の固定コンテンツプローブについて紹介する。
各項目は、異なる談話ロールラベルの下で同じ誤解を招く答えを持つアサーションを受け取る。
GPT-5.5, DeepSeek V4 Pro, Llama-3-8B-Instruct, Qwen2.5-7B-Instruct, Misleading Adoption Rate shifts by 56-84%
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:12:57 GMT)
Decomposing how prompting steers behavior [0.0] 我々は、プロンプトによる表現変化を解釈可能な幾何学的成分に分解する。
我々のフレームワークは、モデルがタスク関連構造をルートして、プロンプト駆動の振る舞いを生成する方法を明らかにする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 03:27:24 GMT)
DMF: A Deterministic Memory Framework for Conversational AI Agents [0.0] 我々は、生成メモリ圧縮を完全な決定論的パイプラインに置き換えるCPUファーストアプローチである決定論的メモリフレームワーク(DMF)を提案する。
DMFは、決定論的コンテンツ信号、会話の手がかり、構造化された前兆から計算されたSurvival Scoreを、ロジスティック・プロジェクションで組み合わせて割り当てる。
LoCoMoとLongMemEvalのデータセットを使用して、目的を組み込んだベンチマークで実験を行う。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:41:28 GMT)
Cross-Lingual Token Arbitrage: Optimizing Code Agent Context Windows via Local LLM Preprocessing [0.0] 生の人間の入力の2つの病理は、非英語のテキストに対するトークン化の非効率性と会話のプロンプトにおける構造的エントロピーの2つのオーバーヘッドを駆動している。
既存のアプローチは、すでに肥大しているコンテキストを圧縮したり、障害が発生した後に介入することで、リアクティブに動作します。
我々は、開発者とクラウドエージェントの間で動作する、飛行前のエッジサイドのプロンプトリライトを導入します。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:17:45 GMT)
CoughSense: Five-Class Respiratory Disease Classification via Whisper Encoder Fine-Tuning and Dual-Encoder Cross-Attention Fusion with Balanced Contrastive Learning [0.0] CoughSenseは5つのクラスに分類するシステムである。
これらは健康、新型コロナウイルス、喘息または呼吸器状態、気管支炎、肺炎である。
We used the OpenAI Whisper encoder as a pretrained backbone for cough disease classification。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 01:13:00 GMT)
Correcting Neural Operator Spectral Bias via Diffusion Posterior Sampling with Sparse Observations [0.0] ニューラル作用素は、数値解法よりも桁違いに高速な近似PDE解を代理する。
磁場のスパースセンサー測定もしばしば利用可能であり、スペクトル歪みを伴わないポイントワイズ精度を提供する。
拡散後サンプリングフレームワークにおけるNO予測を補助観測として扱うことでこの問題に対処する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:26:15 GMT)
Continuous-Variable Quantum State Tomography Enabled by Quantum Mirrors [0.0] 本稿では、入射フォトニック状態の完全な情報を制御原子系に転送するための量子ミラーを用いたプロトコルを提案する。
これにより、制御原子のみの測定により、完全なフォトニック状態のキャラクタリゼーションが可能になる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 23:03:55 GMT)
Constraint-Enhanced Physical Search through Correlation Matching [0.0] 本稿では,探索における時間的相関と更新ダイナミクスにおける制約による相関とを一致させる制約強化物理探索の原理を提案する。
保存法則は局所的な観測を空間的順序で微分的証拠に変換する一方で、時間的相関の駆動が探索を制御することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:15:21 GMT)
Consensus is Strategically Insufficient: Reasoning-Trace Disagreement as a Knowledge-Representation Signal [0.0] マルチエージェントシステムは通常、投票、コンセンサスプロトコル、討論、フォールトトレラントアグリゲーションを通じて不一致を減らすように設計されている。
我々は、この目的が、エージェントエラーよりも真の規範的不確実性を反映しているような、バリューラデンなタスクには不十分であると主張している。
本稿では,推論トレースとエージェント決定を記号的不一致状態に抽象化する知識表現層を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 21:21:02 GMT)
Computational conceptual history of scientific concepts: From early digital methods to LLMs [0.0] 本稿では,概念解析における計算手法の長い歴史の中で,大規模言語モデル(LLM)について述べる。
LLMが既存の手法にどのような影響を及ぼすか、どのようにして長年の問題を継承するか、そしてそれらを用いた最近のケーススタディをレビューする。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:28:29 GMT)
Coexistence of dipolar and quadrupolar higher-order topology [0.0] 2次元高次トポロジカル絶縁体は通常、関連する不変量に応じて双極子または四極子に分類される。
この2つのクラスは以前は重複しないと考えられていた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:38:57 GMT)
Chirality routing non-polaritonic vacuum correlations in Landau polaritons [0.0] 物質と空洞真空場の超強結合は、電磁真空を構造化された量子環境に変えることができる。
近年の研究では、これらの特性変化に重要な要素として、光物質の絡み合いが特定されている。
多モードホップフィールドモデルにおける正確なカイラル電荷は、支配的な異常相関、スクイーズ、キャビティ-マッターの絡み合いを反対の分極に導出することを示す。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:33:37 GMT)
Characterizing quantum channels from local-unitary invariants [0.0] 入力状態やユニタリ上のハール積分から得られるモーメントと呼ばれる平均局所単位不変量を導入する。
これらの瞬間は、量子チャネルがどのように二分子絡みを創り、保存し、破壊するかを計算可能な記述を提供する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 14:42:14 GMT)
Causal Evidence of Stack Representations in Modeling Counter Languages Using Transformers [0.0] 線形プローブはモデルの隠れ状態から各トークンのスタック深さを予測するために訓練される。
本稿では,これらの表現の因果的役割について考察する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:39:40 GMT)
Caught in the Act(ivation): Toward Pre-Output and Multi-Turn Detection of Credential Exfiltration by LLM Agents [0.0] 出力トークンが出力される前に,アクティベーションプローブがクレデンシャルアクセスを検出できるかどうかを検討する。
第3に,マルチターンフィルタを累積情報フロー問題として扱う。
その結果、クレデンシャル・エミッション・ディフェンスは、事前出力監視、カナリア検出、時間的漏洩会計を併用すべきであることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 18:53:17 GMT)
Capability Advertisement as a Market for Lemons: A Trust Layer for Heterogeneous Agent Networks [0.0] 大規模言語モデル(LLM)エージェントが作業の委譲を開始した。
これらのプロトコルは、宣伝された能力が静的で真実の事実であると仮定する。
その能力は確率的であり、入力に応じて変化し、基礎となるモデルが更新されたときにドリフトする。
したがって、呼び出し側はエージェントが何をするか、何ができるかではなく、エージェントが何をするかを判断する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 02:17:30 GMT)
Boson Models with Interactions of Arbitrary Order [0.0] 本論文は、ハミルトニアンを保存する回転不変かつボソン数で表される量子多ボソン系について考察する。
ボソン間の相互作用の順序 k は任意であり、任意の k に対して p=1 と p=2 のとき、N-ボソン状態の間の行列要素に対して閉公式が与えられる。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 10:37:15 GMT)
Beyond Gradient Descent: Adam for Analog Ising Machines [0.0] モーメントとアダム最適化がアナログ連続型イジングマシンを改良できるかどうかを考察する。
我々は、Adamベースのダイナミクスにより、ターゲットの時間を大幅に削減し、ソリューションの品質を向上させることを発見した。
これらの結果は、アナログイジングマシンの強力な設計原理として、連続時間アダムダイナミクスを識別する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 17:11:40 GMT)
Behavioral and Performance Indicators of Depression and Anxiety in Electronic Learning Systems [0.0] 本研究は,Moodleを用いた学習管理システムから得られた行動指標と性能指標が,コンピュータ工学生のうつ病と不安との関連性について検討した。
いくつかの指標はうつ病と不安に大きく関連していた。
これらの結果から, 日常的なLMSデータは, 学生の幸福に関連する有意義な行動信号を与え, 精神保健関連疾患を経験する学生の早期の教育的認識を支援する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 22:08:07 GMT)
Bayes-Sufficient Representations in Supervised Learning [0.0] この研究は、固定された教師付き決定問題にどのような関係があるのかを問う。
表現は、ある予測ヘッドがベイズ最適作用則を実装するためにそれを利用することができれば、共同分布と損失に対してベイズ十分であると定義される。
固定教師付き問題の場合、分布と損失はベイズ作用を決定、ベイズ作用は商を決定、商はベイズ最適予測に必要な最小情報を決定する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:13:31 GMT)
Bastet: A Fine-Grained Expert-Labeled Dataset for DeFi Smart Contract Vulnerability Detection [0.0] BastetはエキスパートラベルのDeFiスマートコントラクト脆弱性データセットである。
2021年4月から2024年11月までの394 Code4renaの競合監査レポートから4,402件の調査結果が得られた。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 09:31:22 GMT)
Analytical Evaluation of DCA Convergence Properties for Minimizing Prediction Functions of Gaussian RBF Support Vector Regression [0.0] 本稿では、RBFカーネルの解析構造を利用して、凸関数(DC)アルゴリズム(DCA)の差分を適用したフレームワークを提案する。
直流成分の強凸パラメータとサブプロブレムの勾配リプシッツ定数の上界$L$の両方を閉形式で導出する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 12:25:21 GMT)
An efficient quantum Hadamard product algorithm for functions [0.0] 2つの量子状態のアダマール積状態を作成するための効率的な量子アルゴリズムを提案する。
本手法は入力関数のフーリエ空間表現を利用する。
また、その応用例として、部分内積に対する新しい量子回路を提案する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:13:47 GMT)
AlgoTouch: An Execution-Centered Approach to Incremental Construction of Imperative Programs [0.0] AlgoTouchは命令型プログラムをインクリメンタルに構築するための実行ベースのシステムである。
データストレージ、計算、制御フローを公開する明示的な記法機械に依存している。
AlgoTouchはPython、C、C++、Javaで正しい読みやすいプログラムを自動的に生成する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 08:57:49 GMT)
A Geometric Lens on Physics-Aligned Data Compression [0.0] AI for Scienceでは、科学データのために学習した圧縮機を訓練するために物理学による損失が増えているが、その速度歪みの影響はいまだに理解されていない。
我々は、このトレードオフがエントロピーモデル、物理的可観測性、および歪み計量によって誘導される潜在空間感度の相互作用によって制御されることを示す局所幾何学理論を開発する。
我々はこれを局所的接空間速度歪み法により定式化し、支配的固有空間重なりに基づく実用的なアライメント診断を導入する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 07:44:53 GMT)
A Fast Methane Detection Pipeline on Board Satellites Based on Mag1c-SAS and LinkNet [0.0] メタンは温室効果ガスであり、ハイパースペクトル衛星画像によって早期に漏れを検出することで、気候変動の緩和に役立てることができる。
従来のメタン検出方法は、リソース限定のオンボードハードウェアには計算的に要求されすぎている。
この研究は、効率的で低消費電力のアルゴリズムに焦点を当てたメタン検出を加速する。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 13:59:47 GMT)
A Benchmarking Framework for Multimodal User Interface Toolkits: Comparing Modality Coverage, Developer Workflow, and Experimental Support [0.0] マルチモーダルユーザーインタフェースは、音声、ジェスチャー、視覚、視線、触覚、生体信号、その他のセンサーデータを組み合わせている。
Geno、Multisensor-Pipeline (MSP)、ReactGenie、EmoSyncといった過去5年間のツールキットは、開発者がそのようなインターフェースを簡単にプロトタイプできるようにすることを目指している。
しかし、この分野には、これらのツールキットが実際にサポートしているもの、開発者がどれだけ実装をオフロードするか、どの評価戦略が適切なのかを比較するための、体系的で再利用可能な方法がない。
論文参考訳(メタデータ) (Tue, 02 Jun 2026 00:31:38 GMT)