CapRL++: Unified Reinforcement Learning with Verifiable Rewards for Dense Image and Video Captioning [86.9] 本稿では,Captioning Reinforcement Learning++ (CapRL++)を紹介した。
本稿では,CapRL++が高密度キャプション品質を向上し,空間的・時間的理解などのタスクにおけるキャプションベースの事前訓練を強化していることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:09:20 GMT)
Bridging the Agent-World Gap: Text World Models for LLM-based Agents [83.8] 大規模言語モデル(LLM)ベースのエージェントは、インタラクティブなテキスト環境においてますます使われている。
多くは反応が強く、これらの環境がどのように構成され、どのように進化するかの明確なモデルなしで、観察を行動にマッピングする。
テキストワールドモデル(TWMs): 状態と候補アクションが与えられたら、結果のWebページ、端末出力、API応答、ユーザ応答を予測する。
LLMをベースとしたエージェントのテキストワールドモデルについて,形式的なフレームワークとエージェントライフサイクルを中心に整理し,体系的にレビューを行った。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:58:52 GMT)
EgoTactile: Learning Grasp Pressure for Everyday Objects from Egocentric Video [82.1] 没入型VRとロボット操作には、エゴセントリックビデオからのフルハンドグリッププレッシャーの推定が不可欠だ。
EgoTactileは、さまざまな日常オブジェクトに対するフルハンドプレッシャー監視を備えた、エゴセントリックなビデオのベンチマークである。
EgoPressureDiffは、大規模に訓練されたビデオ拡散バックボーンに適応する条件付き拡散フレームワークである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:20:03 GMT)
End-to-End Context Compression at Scale [81.7] 長期コンテキスト言語モデル推論は、KVキャッシュがコンテキスト長とともに増加するにつれて、メモリによってボトルネックとなる。
KVキャッシュを圧縮する最近の技術は、モデル品質を著しく低下させるか、あるいはかなりの時間を要するか、1つの長いプロンプトを圧縮するために計算する。
既存のアプローチは、精度-効率のフロンティア上のKVキャッシュ圧縮と競合しない。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:43:16 GMT)
MemoryVLA++: Temporal Modeling via Memory and Imagination in Vision-Language-Action Models [80.7] 効果的な制御は過去の相互作用の記憶と将来の状態の想像を必要とするため、ロボット操作には時間モデリングが不可欠である。
本稿では,VLAモデルにメモリと想像力を付与し,ロボット操作のためのフル時間モデリングフレームワークであるMemoryVLA++を提案する。
提案手法は,Libero,SimplerEnv,Mikasa-Robo,Calvin,Libero-Plus,多種多様な実ロボットタスクにまたがって高い性能を実現する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:59:53 GMT)
Beyond Scalar Rewards by Internalizing Reasoning into Score Distributions [80.3] Z-Rewardは効率的な報酬展開から推論と重大な判断を分離する。
Z-Reward はテキスト・画像の最適化のための識別可能な報酬信号として機能することを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:20:12 GMT)
iMaC: Translating Actions into Motion and Contact Images for Embodied World Models [77.4] 身体的世界モデルは、視覚ロボットによる意思決定と対話型環境シミュレーションのための重要なパラダイムとして登場した。
本稿では,実画像を実世界モデルのためのネイティブアクション表現として扱う,新しい統一制御パラダイムである「イメージ・アズ・アクション・コントロール」を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:55:41 GMT)
SpatialWorld: Benchmarking Interactive Spatial Reasoning of Multimodal Agents in Real-World Tasks [73.9] SpaceWorldは、複雑な現実世界のタスクにおけるマルチモーダルエージェントのインタラクティブな空間的理解を評価するためのベンチマークである。
多様なドメイン(例えば、家庭のルーチン、旅行、社会協力など)にまたがる760の人称タスクが特徴である。
信頼性評価のために、各タスクは、人間検証された初期状態、参照軌跡、端末状態検証器を含む。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:51:51 GMT)
LiteVSR: Lightweight Adaptation of Frozen Diffusion Transformers for Video Super-Resolution [73.9] 軽量な状態認識適応器を備えた冷凍トランスフォーマーを用いて,ビデオ超解法(VSR)を実現するミニマリストフレームワークを提案する。
LiteVSRは、たった11.25%のトレーニング可能なパラメータと1つのA100での12GPU時間のトレーニングで競争力のある復元品質を実現し、高速サンプリング(単一ステップまで)の互換性を維持している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:23:42 GMT)
Fusing Satellite Imagery and Planimetric Maps for Cross-View Localization [73.1] クロスビューのローカライゼーション手法は、主に衛星画像に空中モダリティとして依存している。
標準エンコーダを拡張した新しい融合モジュールを提案する。
その結果, 平均局所化誤差を30.13%削減した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:52:57 GMT)
Mult-DPO: Multinomial Direct Preference Optimization for Recommender Systems [72.3] 直接選好最適化(DPO)は、ペアの選好に基づく大規模言語モデル(LLM)の簡易かつ効果的なアライメント戦略である。
しかし、レコメンデーションシステムでは、ユーザからのフィードバックがペアワイズであることは滅多にない。
提案するMult-DPOは,LLMベースのレコメンデータシステムのユーザ嗜好アライメントのための,設定された選好イベントに対するトラクタブルな多項サロゲート確率である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:53:45 GMT)
Ultra Flash: Scaling Real-Time Streaming Video Generation to High Resolutions [69.0] Ultra Flashは、リアルタイムの高解像度ビデオ生成が可能なカスケードストリーミングフレームワークである。
この結果から,Ultra Flashは最先端の視覚的品質と優れた効率を維持しつつ,高解像度のストリーミング映像を確実に生成できることが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:45:03 GMT)
A Vision-language Framework for Comparative Reasoning in Radiology [68.5] 我々は,放射線学的比較を実体認識のクロスイメージ推論問題として定式化する。
我々は,日常的な画像とレポートのペアから得られた大規模比較画像資源を構築した。
臨床類似症例の検索を制御可能なエンティティ対応ビジュアルエンコーダであるMedReCoを開発した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:45:31 GMT)
Closing the Indexing-Decoding Gap in Multimodal Generative Retrieval via Prefix Retention Optimization [68.5] マルチモーダル生成検索式は、複数のモーダル検索を離散識別子生成として定義し、外部埋め込みよりも明示的な類似性探索を不要とする。
既存の手法では、残差量子化によって識別子を構築し、トリエ制約ビームサーチでデコードする。
この組み合わせは、インデックス化とデコーディングのギャップを導入している: 識別子学習の目的は、再構成や対照的な損失を含むが、デコーディング中にプレフィックスの識別性を明示的に強制しない。
1)プレフィックスの格付け蒸留は、リストワイドロスを用いた事前量子化埋め込みによって誘導されるプレフィックスと整合する; (ii)語彙スケジューリングは、コードブックを増大させる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:15:47 GMT)
Prisma-World: Camera-Controllable Multi-Agent Video World Model [67.7] カメラ制御可能なマルチエージェントワールドモデルであるPrisma-Worldを紹介する。
マルチエージェント生成を、クロスビュー整合性のためのジョイントジオメトリア・アウェア・デノナイジングプロセスとして定式化する。
実験により, フレキシブルエージェント数を持つ高忠実度マルチエージェント映像を, 1つのPrisma-Worldモデルで生成できることが確認された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:59:50 GMT)
Data-driven discovery of governing differential equations across physical systems [61.5] データ駆動微分方程式探索における問題指向の視点を提案する。
まず、方程式発見可能性の2次元位相図を導入する。
次に、発見プロセスの基本的な抽象化として、表現評価最適化(REO)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:35:06 GMT)
H2HMem: A Multimodal Memory Benchmark for Agents in Human-Human Interactions [60.5] H2HMemは、複雑な人間と人間の相互作用におけるメモリ能力を評価するための、ヒューマン・ツー・ヒューマン・マルチモーダルメモリベンチマークである。
H2HMemには、ダイアディックとマルチパーティの会話とマルチモーダルな情報ストリームが含まれており、メモリリコール、推論、アプリケーションという3つの次元に沿ってエージェントを評価する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:17:16 GMT)
Causally Evaluating the Learnability of Formal Language Tasks [59.7] データ周波数と学習可能性の関係を精査する。
特定のサブタスクの学習可能性を測定するために、Kullback-Leibler分散メトリクスを導出する。
実験の結果,因果介入を伴わない学習性の評価は誤結論につながることがわかった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:58:36 GMT)
SpaceVLN: A Zero-Shot Vision-and-Language Navigation Agent with Online Spatial Cognitive Memory and Reasoning [59.6] SpaceVLNは、空間認知記憶とタスク誘導空間推論を中心に構築されたナビゲーションエージェントである。
このメモリ上に構築されたSpatial-CoTは、タスクプログレス推論と空間知覚、分析、予測を統合する。
R2R-CE、RxR-CE、GN-Bench、HM3D-OVONの他、SpaceVLNは最先端のゼロショット性能を実現している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:42:08 GMT)
VGP-Nav: Metric-Aware Visual Geometric Perception for Robot Navigation [59.4] VGP-Navは、テキスト・メトリック・アウェア・ビジュアル・ジオメトリック・パーセプションのための統合されたフレームワーク
単分子RGB入力にのみ依存し、メトリックローカライゼーションと障害物知覚を共同で支援する。
VGP-Navはモノクルスケールのあいまいさをオンラインで解決し、局所化基底の計量障害物表現を生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:38:14 GMT)
REFINE: Super-efficient 3D Gaussian Splatting Pruning via Rendering-Free Primitive Importance [58.9] REFINEは、新しいレンダリングフリープリミティブ・プライマリ・プライマリ・メトリックを中心に、高度に高速化された3DGSプルーニング・フレームワークである。
複数のベンチマークデータセットに対する実験は、REFINEが非常に競争力のあるレンダリング品質を維持していることを示している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:16:38 GMT)
What Should a Skill Remember? Quality-Cost Trade-offs in Cost-Aware Skill Rewriting for Language Model Agents [58.9] 我々は経済的なレンズを通してスキルの書き直しを勉強する。
我々のフレームワークは、情報保存戦略を用いて、スキル構造をプロファイルし、スキルを書き換える。
SkillsBenchの実験は、戦略間の異なる品質とコストのトレードオフを明らかにしている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:36:51 GMT)
Echo-Memory: A Controlled Study of Memory in Action World Models [58.8] 本研究では,行動条件付き世界モデルにおける記憶機構の制御に関する研究を行う。
既存のメモリ設計と比較するのは難しいのは、ゲインにはバックボーン、トレーニング、検索、評価の違いが絡み合っているからである。
我々はEcho-Memoryを使ってアクション・ツー・ビデオのインタフェースを修正し、生成元によって履歴が保存され読み込まれるかだけを変える。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:54:10 GMT)
Symbolic and Abstractive Reasoning with Complex Visual Queries [57.6] CVQ(complex visual query)と呼ばれる新しい抽象データ型を探索する。
CVQは記号的・抽象的推論(英語版)を探索し、MLLMに対する人間のような神経-記号的推論の批判的かつ過小評価された次元である。
本稿では、MLLMを頑健な視覚的推論能力で段階的に装備する2段階のトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:30:51 GMT)
Rethinking the Divergence Regularization in LLM RL [57.0] 強化学習(Reinforcement Learning, RL)は、大規模言語モデル(LLM)の訓練後において重要な要素となっている。
そこで本稿では,ハードマスクをスムーズなアドバンテージ重み付き二次正規化器に置き換える多変量正規化政策最適化(DRPO)を提案する。
DRPOはDPPOと同じ信頼領域を保ちながら、有界で連続的な勾配重みを誘導する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:58:23 GMT)
AetheRock: An Arm-Worn Robot Teaching System for Force-Guided Vision-Tactile Learning [56.2] AetheRockは、モジュール式で簡単に製造できるビジュオ触覚センサー、GelSlim-MiniFabを指先で搭載した腕縫いのデバイスだ。
本稿では,力と視覚を用いた表現学習フレームワークであるForceVTを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:38:57 GMT)
VAIC: Vision-Guided Humanoid Agile Object Interaction Control via Decoupled Commands [56.0] Vision Guided Agile Interaction Control (VAIC)は、現在のコントローラとヒューマノイドロボットのギャップを埋める統合フレームワークである。
まず、特権教師政策は、正確な物体運動学と正確な環境状態を用いて多様な相互作用スキルを習得する。
第二に、デプロイ可能な学生ポリシーは、全体追跡を複数の軸にまたがる速度目標に置き換えることで、これらの能力を蒸留する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:52:55 GMT)
Vision Language Model Helps Private Information De-Identification in Vision Data [55.4] VisShieldは、ビジュアル言語モデル(VLM)のプライバシー意識を高めるために設計されたエンドツーエンドフレームワークである。
我々のフレームワークは2つの重要なコンポーネントで構成されている。
我々のアプローチは、VLMがプライバシーに敏感なテキストを認識し、検出されたエンティティに対して正確なバウンディングボックスを出力することを保証する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:30:20 GMT)
Unveiling Privacy Risks in Multi-modal Large Language Models: Task-specific Vulnerabilities and Mitigation Challenges [55.4] MLLM(Multi-modal Large Language Models)は、テキストと画像の両方を処理する。
テキストのみのモデルと比較して、MLLMは画像に埋め込まれた機密情報を抽出し、公開することができる。
一部のMLLMはプライバシー侵害の影響を受けやすく、画像やメモリに埋め込まれた機密データを漏洩させる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:19:42 GMT)
Temporal-Aware Reasoning Optimization for Video Temporal Grounding [55.3] 本稿では,時間的思考能力を明確に向上させるフレームワークであるTaRO(Temporal-Aware Reasoning Optimization)を提案する。
まず、事前生成した高密度キャプションを利用して、明示的な視覚的手がかりやタイムスタンプに基づく推論経路を構築するコンストラクティブ推論探索を導入する。
第二に、推論の品質を評価するために、テンポラル・センシティビティ・リワードを設計する。高品質な推論は特定のイベントやタイムスタンプに固定されるべきである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:21:01 GMT)
SOMA: From Surface Observations to Muscle Anatomy [55.2] RGBカメラを用いて得られた表面信号から生体時相筋の挙動を推定する人特有のモデルであるSOMAを提案する。
本手法は従来のシミュレーションの複雑さを伴わずに,解剖学的に基底付けられたアニメーションをいかに提供するかを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:20:46 GMT)
PRISM: Topology-Aware Cross-Modal Imputation for Modality-Deficient Federated Graph Learning [54.6] textbfProactive textbfRetrievalおよび textbfImputation via textbfStructural textbfMeta-prompting を提案する。
実験の結果、PRISMはモダリティに欠けるクライアントを一貫して改善し、textbf4.48% で最先端のベースラインを上回った。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:08:52 GMT)
GHOST: Hierarchical Sub-Goal Policies for Generalizing Robot Manipulation [54.3] 本稿では,トレーニング分布を超えて一般化したビジュモータ操作ポリシーを学習するための枠組みを提案する。
GHOSTは、(i)多視点RGB-D観測から、3Dエンドエフェクタ上の分布として次のサブゴールを予測する高レベルポリシーに制御を分解する。
一連のタスクの中で、この階層的な分解は、フラットな拡散ポリシーと比較して、パフォーマンスと堅牢性を一貫して改善します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:08:01 GMT)
The Hidden Bias of Process Reward Models:PRISM for Rewarding the Right Reasoning [54.0] プロセス・リワード・モデル (Process Reward Models, PRM) は、段階的なフィードバックを提供することで、推論のためのクレジット割り当てを改善する。
ステップレベルのトレーニングデータにおいて,重度の不均衡に起因するPRMの隠れバイアスを同定する。
対照的な段階比較から学習するポリシ対応のPRMトレーニングフレームワークであるPRISMを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:22:33 GMT)
See More, Match Better: Multi-Source Feature Fusion for Two-View Correspondence Learning [52.5] 2視点対応学習は、画像対における真対応(インレーシ)と偽対応(インレーシ)とを区別することを目的としている。
既存の手法は主に座標に基づく幾何の整合性に依存する。
本稿では,2視点対応学習のためのマルチソース機能融合フレームワークTriMatchを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:33:01 GMT)
Now You (Still) See Me: Detecting Evasive Steganographic Payloads in LLMs [52.1] 大規模な言語モデルは、プロンプトによって引き起こされるシークレットを、流動的で良心的な出力にエンコードするように微調整することができる。
近年の研究では、内部の活性化から秘密を回収する線形プローブによる検出を提案する。
この防御は体系的に回避できるが,対象とするデータレベルの介入によって検出性が回復可能であることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:27:11 GMT)
MASS: Deep Research for Social Sciences with Memory-Augmented Social Simulation [52.1] メモリ強化社会シミュレーション(MASS)は,高度に現実的で研究指向の社会シミュレーションを活用する革新的なパラダイムである。
具体的には,マルチレベル社会規範による動的目標パス計画とシミュレーションを導くためのマルチレベル社会規範,エージェントメモリコールトスタートのための多分野行動データセット,エビングハウス曲線にインスパイアされた構造的忘れ機構の3つのコアコンポーネントを統合する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:32:21 GMT)
Reasoning Arena: Trace Tournaments When Verifiable Rewards Fall Short [51.7] 検証可能な報酬付き強化学習(RLVR)は,大規模言語モデルの推論能力向上のための主要なパラダイムとなっている。
本研究では,非多変量報酬群を判定システムにルーティングする適応学習フレームワークであるReasoning Arenaを提案する。
我々は、Reasoning Arenaが、競争数学やコーディングベンチマークにおいて、RLVRベースラインを平均で7.6%上回っていることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:57:17 GMT)
Customization under Fire: Plugin Poisoning in Text-to-Image Ecosystem [51.5] 本稿では,T2I エコシステムにおける信頼と特性を活用する LoRA プラグインサプライチェーンリスクに関する最初の体系的研究である PoisonLoRA を紹介する。
プラットフォームによって検出されることなく,4つのシナリオにわたる6つのデータセット上で,CivitaiとLiblibの攻撃成功率(ASR)を約100%達成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:45:17 GMT)
An Enhanced Geometric-Spectral Feature Learning Framework for Airborne Multispectral Point Cloud Classification [51.0] 2つのMPCデータセットを構築し,航空機搭載型MPC分類の注意点に基づく幾何スペクトル特徴学習フレームワークを提案する。
我々のモデルにおける重要な要素は、空間スペクトル特徴の表現能力を向上するアテンション機構を持つ2ストリーム特徴融合法である。
航空機搭載型MPCデータセットの2つの実験結果から,提案手法の有効性が実証された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:18:38 GMT)
TABVERSE: Benchmarking Cross-Format Table Understanding in LLMs and VLMs [51.0] 大規模言語モデル(LLM)と視覚言語モデル(VLM)は、テーブル推論タスクでますます評価されている。
制御されたマルチモーダルテーブルベンチマークであるTABVERSEを導入する。
その結果,表の表現選択が表の理解に大きく影響していることが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:52:46 GMT)
IS-CoT: Breaking the Long-form Generation Collapse via Interleaved Structural Thinking [50.4] 本稿では,Interleaved Structure Chain-of-Thought (IS-CoT) フレームワークを紹介する。
IS-CoTは動的Plan-Write-Reflectサイクルを生成プロセスに埋め込む。
我々は、多教師パイプラインを介して、インターリーブされた推論トレースの高品質なデータセットを構築し、IS-Writer-8Bを訓練する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:31:00 GMT)
Variational Learning for Insertion-based Generation [50.2] 可変長挿入モデルの挿入順序を学習するための確率的フレームワークを提案する。
本稿では,挿入する場所,挿入する場所,終了するタイミングを共同で学習する生成モデルであるInsertion Process (IP)を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:16:00 GMT)
Echo-DM: Ultrasound Marker Removal via Conditional Latent Diffusion and Region-Aware Fusion [50.0] マーカーは下流の自動分析にショートカットバイアスを導入することができる。
条件付き潜伏拡散と領域認識融合による超音波マーカー除去のためのフレームワークであるEcho-DMを提案する。
大規模な超音波検査データセットであるEcho-PAIRの実験は、優れたマーカー除去と強力な解剖学的忠実さを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:56:33 GMT)
From Senses to Decisions: The Information Flow of Auditory and Visual Perception in Multimodal LLMs [48.8] オーディオ・ビジュアル大言語モデル(AVLLM)内の音声・視覚情報の流れについて検討する。
オーディオ映像の場合,AVLLM は VideoLLM に確立された逐次的な情報フロー経路に従う。
複数のインターリーブされたオーディオ視覚アイテムの設定では、このルーティングは異なる並列ストリームにシフトする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:26:09 GMT)
MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation [48.0] マルチスケールトークン空間内で粗大なロールアウトを用いてビデオを生成する方法を示す。
長いMinecraftビデオのカスタムデータセットを使用して、このアプローチを検証する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:46:01 GMT)
Emergent Misalignment Can Be Induced by Sycophancy and Reversed via Alignment Gating [47.5] 微調整された大きな言語モデルは、広範囲のミスアライメントと有害な振る舞いを引き起こす可能性がある。
微調整はユーザの誤った意見に受動的に一致することを示す。
創発的不整合を克服する効率的な方法であるアライメントゲーティングを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:05:47 GMT)
Multilingual Sentiment Aware Text Summarization A Reinforcement Learning Approach for Consistency Maintenance [46.5] 我々は、RLHFに基づく要約出力における中性感情への体系的なシフトである感情の漂流を研究する。
以上の結果から,KL正則化強度の増大に伴い,感情の漂流はより強くなる一貫した現象であることが示唆された。
感傷的トークンの制約を選択的に低減するKL正規化項の感傷的修正を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:36:05 GMT)
A Controlled Audit of Pretraining Contamination in Public Medical Vision-Language Benchmarks [46.4] 医用視覚言語モデル(VLM)は、画像と質問応答ペアが何年も無料でダウンロードされている公開ベンチマークで評価される。
SLAKE-En,PathVQA,VQA-RAD,および4つの検出器ファミリを用いたOmniMedVQAミラーのオープンVLMを検査した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:40:10 GMT)
SNN-MLIR: An MLIR Dialect for Compiling Neuromorphic SNNs from NIR to Bare-Metal C [45.9] スパイキングニューラルネットワーク(SNN)は、それぞれ独自のモデルフォーマットで、幅広いフレームワークでトレーニングされている。
ニューロモルフィック中間表現(NIR)は、訓練されたSNNモデルを交換するための共通のフレームワークに依存しないフォーマットを提供することによって、この断片化に対処する。
Snn-mlirは、NIR-MLIR-Cコンパイルブリッジと共にSNNのアウトオブツリーMLIR方言である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:47:48 GMT)
Parent-Hash DAG: A Cost Analysis of Constant-Time Append for On-Chain Registries [45.9] Provenance Treeは、パブリックブロックチェーンに固定されたアーティファクト登録の、追加のみの非循環グラフである。
我々は,PHDAGをガスコストのO(1)として定式化し,レジストリサイズや木深度に依存しないコストモデルを構築した。
また、オフチェーンの依存関係なしで、リニア時間でパブリックイベントログから信頼性のないレジストリを再構築します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:03:44 GMT)
Conceptual and Geometric Foundations for a Teleparallel Approach to Quantum Gravity [45.9] 我々は、曲面時空における量子場理論を、古典的幾何学上の量子物質の半古典的枠組みとして再考する。
我々は、コフレームとスピン接続変数に基づくテレパラレルフレームワークの概要を述べる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:02:26 GMT)
Efficient-WAM: A 1B-Parameter World-Action Model with Low-Cost Future Imagination [45.7] World-Action Models (WAM) は未来の視覚予測とアクション生成を結合する。
ほとんどの既存のWAMは将来の予測に依存しており、高い推論遅延を引き起こし、リアルタイムロボットのデプロイを困難にしている。
本稿では,その制御利益を保ちつつ,将来の想像力のコストを低減させるワールド・アクション・モデルであるEfficient-WAMを紹介する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:14:08 GMT)
Safe Polytope-in-Polytope Motion Planning and Control with Control Barrier Functions [45.7] 本研究は,多目的ロボットのフットプリントが凸自由空間領域内に留まることを保証する安全な局所運動計画制御手法を提案する。
提案された自由空間定式化では障害物検出やセグメンテーションは不要である。
このアプローチは、自動運転車と非ホロノミックな移動ロボットによるハードウェアによるシミュレーションで検証されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:44:28 GMT)
Teach Multimodal Recommendation Model to See via Personalized Visual Extraction and Adaptive Learning [45.3] 我々は、パーソナライズされた視覚抽出と適応学習(REVEAL)を通して見るためのTeach Multimodal Recommendation Modelを提案する。
REVEALは、元のレコメンデーションバックボーンを変更することなく、視覚表現学習とクロスモーダル最適化を強化するプラグイン・アンド・プレイフレームワークである。
複数の実世界のデータセットとMSRバックボーンの実験は、REVEALが常にレコメンデーションパフォーマンスを改善することを実証している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:28:25 GMT)
Latent Spatial Memory for Video World Models [45.0] ビデオワールドモデルのためのエンフラテント空間記憶を導入し、3Dキャッシュでシーン情報を拡散潜時空間に直接保存し、画素空間の再構成を避ける。
実験により、遅延空間メモリは、より高速なエンドツーエンドビデオ生成と、明示的な3Dベースラインに対するメモリフットプリントの削減を実現する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:59:54 GMT)
Evaluation Cards: An Interpretive Layer for AI Evaluation Reporting [44.7] AI評価結果は大規模に作成されるが、リーダーボード、モデルカード、ベンチマーク論文、会社のブログ間で矛盾なく報告されている。
最近の取り組みでは、分離されたコンポーネントに対処するが、3つのギャップを残している: それらは評価ライフサイクルの狭いスライスのみをカバーし、単一の解釈可能なレコードに構成しない。
EvalCardsは、ベンチマークメタデータ、評価実行データ、モデルメタデータを統一されたレコードに構成する運用レポート層である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:55:02 GMT)
Experience Makes Skillful: Enabling Generalizable Medical Agent Reasoning via Self-Evolving Skill Memory [43.5] SkeMexはデプロイ後のフレームワークで、モデルの重みを更新することなく、スキルベースのメモリを通じて医療エージェントを改善する。
情報的相互作用の軌跡を、再利用可能な手続き的知識を符号化する構造化されたスキルに蒸留する。
環境フィードバックからコンテキスト依存のユーティリティを推定し、バリューアウェアな検索とリポジトリガバナンスのガイドに使用します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:37:01 GMT)
Spatial Priors via Space Filling Curves for Small and Limited Data Vision Transformers [43.3] VIOLINは、空間充填曲線 (Space Filling Curves, SFC) を介して、注意の中の空間構造を符号化するアテンション機構である。
幅広い評価において、一貫してパフォーマンスを改善します。
パラメータ効率のよいLoRAのような微調整手法と組み合わせることで、パフォーマンスをさらに向上させることができる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:24:52 GMT)
LexRubric: A Rubric-Guided Diagnostic Benchmark for Open-Ended Legal Tasks [42.9] オープンな中国の法的タスクを評価するためのルーブリックベースのベンチマークであるLexRubricを紹介した。
これには、日々の法的要求と専門的な法的理由の両方を反映した、法的協議と司法試験からの649の事例が含まれる。
また、12,337人の専門家による原子鑑定基準を、統一された6次元フレームワークの下で構成している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:04:47 GMT)
Data Synthesis and Parameter-Efficient Fine-Tuning for Low-Resource NMT: A Case Study on Q'eqchi' Mayan [42.7] 本研究では,NMTモデルのブートストラップのためのデータ合成手法を提案する。
我々は,コミュニティソース辞書を大規模合成コーパスに変換し,mT5ベースモデル上のLoRAアダプタを介してPEFT(Efficient Fine-Tuning)を利用する。
有機用語集に対する評価は、文法的整合性を維持するが、自然言語の語彙的基盤を欠く構造的意味的ギャップ(BLEU 0.59)を明らかにする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:29:08 GMT)
Claude Code-Driving Scenario Mining for the Argoverse 2 Challenge [42.1] CVPR 2026 Argoverse 2 Scenario Mining Challengeに応募する。
GLM5.1を使用したクロードコードエージェントによる自律コード生成、タイムスタンプバランスの精度閾値0.8による反復的なトレーニングセットのスクリーニング、別のクロードコードセッションによるセマンティックコードレビュー、偽陽性をフィルタリングするためのQwen3-VLシーンレベルの検証である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:19:32 GMT)
Scaling by Diversified Experience for Vision-Language-Action Models [42.1] 多様な体験で訓練された堅牢なVLAモデルであるSyVLAを紹介する。
本稿では,制御関連特徴を推論コンテキストから分離する意図デカップリングアルゴリズムを提案する。
実世界のロボットタスクとマルチモーダルベンチマークの実験は、SyVLAが優れたタスク成功率を達成することを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:13:38 GMT)
Personalization Meets Safety:Mechanisms,Risks,and Mitigations in Personalized LLMs [41.7] 大規模言語モデル(LLM)は、ユーザの好み、文脈、長期履歴に適応することで、よりパーソナライズされた対話を可能にしている。
既存のレビューは、一般的にパーソナライズか安全に重点を置いており、その交差点はほとんど探索されていない。
パーソナライズされたLDMの総合的、安全に配慮したレビューを初めて紹介する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:10:05 GMT)
C$^3$ache: Accelerating World Action Models with Cross Inference Chunk Cache [41.4] C$3$acheはトレーニング不要のメソッドで、推論チャンクにまたがって残余をキャッシュし再利用する。
Fast-WAMのバックボーンでの実験では、C$3$acheは壁時計の総推定時間で最大2.5倍のスピードアップを達成している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:01:10 GMT)
AsyncWebRL: Efficient Multi-Step RL for Visual Web Agents [41.2] マルチステップRLを用いた視覚言語Webエージェントのトレーニングは計算集約的である。
本稿では、同期RLにおけるアイドルGPUに対処するAsyncWebRLと、必要以上に多くのステップとトークンを使用するトラジェクトリを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:54:19 GMT)
Baichuan-M4: A Clinical-Grade Medical Agent System for Continuous Care [41.2] バイチュアンM4(Baichuan-M4)は、バイチュアン・インテリジェンスの医療用医療用大型モデルである。
単ターンの医療質問応答ではなく、不連続なケアのために設計されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:27:05 GMT)
Skill Is Not Document: A Query-Conditional Benchmark and Two-Stage Retriever for LLM Agent Skill Routing [40.6] R3-Skillは、現実的なエージェントスキルルーティングのベンチマークである。
スキル互換性を明示的な訓練信号とする2段階検索システムを構築した。
データセット、トレーニングコード、モデルウェイトは、エージェントスキルルーティングのためのオープンソースとしてリリースされている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:58:19 GMT)
Do Coding Agents Deceive Us? Detecting and Preventing Cheating via Capped Evaluation with Randomized Tests [40.5] エージェント評価およびトレーニングにおける障害モードの増加は、モデルがショートカットを利用して高い評価スコアを得ることができることである。
CapCodeはランダムなテストでコーディングデータセットを構築するためのフレームワークであり、最も達成可能な非加熱性能は意図的にその下にある。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:53:05 GMT)
OmniGameArena: A Unified UE5 Benchmark for VLM Game Agents with Improvement Dynamics [39.6] 視覚言語モデル(VLM)エージェントは、インタラクティブなゲーム環境にますます多くデプロイされている。
VLMエージェントのゲームベンチマークでは、通常、(エージェント、ゲーム)ペア当たりの1対1の初動スコアを報告し、シングルエージェントのSoloプレイに集中し、異種エージェントクラスを評価するための統一されたプロトコルが欠如している。
我々は,Solo (7), 変種(3), Coop (2)に統一されたアクションインターフェースを備えた新しいUnreal Engine 5ゲーム12のリアルタイムベンチマークであるOmniGameArenaと,エージェント・リフレクション・ハーネスであるAdvanced Dynamics Curve (IDC)とのギャップに対処する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:59:43 GMT)
Maximum Matching Accuracy: An Instance Segmentation Evaluation Metric Utilizing Globally Optimal Matching [39.3] 本研究では,予測された真理オブジェクトと地上の真理オブジェクトの1対1の大域的最適マッチングを求める閾値フリー連続計量を提案する。
MMAは既存の代替品よりも安定で、感度が高く、解釈しやすいスコアを生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:36:28 GMT)
Emergent alignment and the projectability of ethical personas [39.3] 広範かつ狭義の安全タスクについて、有用なのみのモデルを精査する。
2つの狭い安全サブカテゴリの微調整が創発的アライメントを確実に引き起こすことを示す。
我々は、アライメント戦略は、一般的な安全性能だけでなく、プロジェクタビリティの程度でも評価されるべきであると結論付けている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:30:29 GMT)
Uncertainty-Aware Motion Planning for Autonomous Driving in Mixed Traffic Environment [39.3] 混合交通環境では、自律車と人間駆動車が共存することがある。
人間の意図は、行動の多様性、知覚ノイズ、部分的な可観測性によって本質的に不確実である。
AV意思決定のための人間の意図予測に不確実性を含む不確実性認識運動計画(UAMP)を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:04:06 GMT)
UXBench: Benchmarking User Experience in AI Assistants [39.3] UXBenchはユーザ中心のベンチマークとしては初めての,実際のユーザフィードバック信号に基づくベンチマークです。
データセットは8つのシナリオ、83のドメイン、さまざまな障害パターンを含む、実際のユーザ分布を詳細に反映している。
ユーザフィードバック予測は学習可能な能力であり,Wild のフィードバック信号からトレーニングした報酬モデルにより,精度の高い精度が得られることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:44:01 GMT)
Making Time Editable in Video Diffusion Transformers [38.6] 本稿では,事前学習したDiTを時間的編集で拡張する時間的制御手法を提案する。
そのコア実装は、事前訓練されたモデルを軽量の時間モジュールで拡張し、制御可能なダイナミックレンジを拡張しながら、オリジナルの生成を前もって保存する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:21:01 GMT)
Unified Energy for Invariant and Independent Decoding in Diffusion Language Models [38.4] 拡散言語モデル(DLM)は、全シーケンスを反復的に復調することで、並列テキスト生成を可能にする。
既存のメソッドではトークンの関係を完全にキャプチャできないため、ARベースラインに対するパフォーマンスギャップが生じる。
本稿では, モデル容量, (ii) 依存性, (iii) 不変性の3つの重要な因子を同定し, ギャップの系統的解析を行う。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:50:12 GMT)
TRIAGE: Dialectical Reasoning for Explainable Risk Prediction on Irregularly Sampled Medical Time Series with LLMs [38.3] 競合する臨床結果に対する弁証的推論を生成するために, LLM を訓練するフレームワーク TRIAGE を提案する。
3つのISMTSベンチマークで評価され、TRIAGEは平均AUPRCの改善を3.3%達成し、キャリブレーションエラーを81%削減した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:53:44 GMT)
iOSWorld: A Benchmark for Personally Intelligent Phone Agents [38.1] iOSWorldは,永続的なユーザIDを中心に構築された,初のインタラクティブなネイティブiOSシミュレータベンチマークである。
3つの難しいカテゴリにまたがる133のタスクが含まれている。
視覚のみと特権化された視覚+XML設定の両方において、フロンティアとオープンソースのコンピュータ利用モデルを評価する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:27:13 GMT)
Vision-Language Guided Hyperspectral Object Tracking via Semantics Fusion and Contextual Template Updating [37.9] 本稿では,新しい高スペクトルビジョン言語(VL)共同トラッキングフレームワークであるVLHTrackを提案する。
本研究では,スペクトル冗長性の根本的な課題に対処するために,先行言語を取り入れた。
HOT2023とHOT2024の実験により、VLHTrackは最先端(SOTA)法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:05:40 GMT)
Magic and entanglement in 1+1-dimensional SU(2) lattice gauge theory [37.7] 絡み合いと非安定化性(マジック)は古典的な記述から2つの異なる量子系の離脱を定量化する。
1+1)次元のSU(2)格子ゲージ理論の基底状態のエンタングルメントエントロピーと安定化器レニイエントロピーを計算する。
g_star$で示されるクロスオーバーは、地上状態がより魔力に富んだ状態から、より魔力の少ない状態へと遷移するものである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:00:00 GMT)
PhysScene: A Scene Graph Dataset for Scientific Visual Reasoning in Physics Experiments [37.6] SG(Scene Graphs)は、オブジェクトとそのペア関係をモデル化することで、視覚的なシーンの構造化された表現を提供する。
PhysSceneは物理実験に適した最初のSGデータセットである。
PhysSceneは、特殊な機器、構造化された実験装置、実験環境に固有の機能的関係を含んでいる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:40:48 GMT)
Would you still call this Dax? Novel Visual References in VLMs and Humans [37.6] 我々は,新しいビジュアル参照データセット(NVRD):90の視覚概念にまたがる19,176のイメージを,様々な視覚的ノベルティのレベルにわたって提示する。
慣れ親しんだ概念の視覚的増強に関する以前の研究とは異なり、NVRDはスクラッチから構築された全く新しいオープンエンド刺激で構成されている。
3つのオープンソースモデルと2つのクローズドソースモデルと2,400人の人的判断を合わせて評価し、(i)モデルが先行知識と矛盾する場合にコンテキスト内で新しい概念を取得するのに苦労していること、(ii)モデルと人間が視覚的摂動に相関した感度を示す一方で、モデルは大幅に過大化し、学習ラベルを人間の刺激に拡張することを見出した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:17:01 GMT)
DyCon: Dynamic Reasoning Control via Evolving Difficulty Modeling [37.5] 本稿では,問題の難易度は推論過程を通じて動的に進化し,Large Reasoning Modelsのステップレベルの埋め込みに線形に符号化されていることを示す。
我々は、遅延ステップレベルの表現を利用して、進化するタスクの難しさを明示的にモデル化する、トレーニング不要のフレームワークDyConを提案する。
DyConは、精度や一般化を犠牲にすることなく冗長なステップを減らし、推論効率を著しく向上させる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:45:26 GMT)
CP4D: Compositional Physics-aware 4D Scene Generation [37.1] 複雑な物理力学に忠実に固執した4次元シーン合成のための新しいパラダイムであるCP4Dを提案する。
CP4Dは探索可能なインタラクティブな4Dシーンを生成できることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:23:12 GMT)
CRANE: Knowledge Editing for Reasoning MLLMs [37.1] マルチモーダルな大言語モデル(MLLM)は、回答を生成する前に明示的なチェーン・オブ・シークレット(CoT)推論を生成する。
MLLMの推論では、(FT, LoRA)を一般化する手法はフォーマットの崩壊を引き起こすが、深い修正のない手法は一般化できない。
本稿では,CRANEを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:01:11 GMT)
Divide-and-Denoise: A Game-Theoretic Method for Fairly Composing Diffusion Models [37.0] ディバイド・アンド・デノワーズ(Divide-and-Denoise)は、サンプリング中の複数の事前学習拡散モデルをコーディネートする手法である。
我々の手法は、モデルにまたがる公平だが効率的な分業を生み出します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:51:17 GMT)
Improved Convergence Analysis of Topology Dependence in Decentralized SGD [36.8] 本稿では、分散SGDのより厳密な収束解析について述べる。
トポロジーの特性としてスペクトルギャップのみを用いた既存の収束解析とは異なり、混合行列のすべての固有値が収束率に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:46:47 GMT)
MBench: A Comprehensive Benchmark on Memory Capability for Video World Models [36.7] ビデオワールドモデルのメモリ能力の定量化と評価を目的としたベンチマークである textbfMBench を提案する。
我々のベンチマークは、厳密にキュレートされた実写長ビデオに基づいて構築され、ルールベースの量行列とVLMにより評価される。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:58:38 GMT)
Disentanglement with Holographic Reduced Representations [36.5] ニューラルネットワークを用いたデータの変動要因の分離であるディアンタングルメントは、機械学習における長年にわたる課題である。
本稿では, ホログラフィック還元表現(HRR)を用いた教師なし学習アルゴリズムを提案する。
我々は,HRRアンバインド操作が因子の分離に誘導バイアスを与え,ベースラインに対する競争結果が得られることを示した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:48:35 GMT)
ExDet: Open-Domain Open-Vocabulary Detection with Cross-modal Extrapolation and Rectification [36.1] オープンドメインのオープンボキャブラリ検出は、新しいカテゴリと見えないドメインの両方に一般化するために検出器を必要とする。
ODOVDのための軽量なカテゴリドメイン協調一般化フレームワークであるExDetを提案する。
ExDetはText-Guided Extrapolation (TGE)、DCRモジュール、ExRPNで構成されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:34:32 GMT)
Evaluating the Representation Space of Diffusion Models via Self-Supervised Principles [35.9] 拡散モデルの表現と生成能力を評価するためのフレームワークを提案する。
拡散モデルの識別的および生成的挙動を解析する。
この結果から,自己監督的視点から拡散モデルを監視することが可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:44:18 GMT)
Parahydrogen Cooling of Nuclear Spin Chains at Hypogeomagnetic Fields [35.3] 溶液状態の分子核スピンネットワークは、スカラー結合型ハミルトニアンは、室温で化学的にプログラム可能で、正確に測定可能で、コヒーレントであるため、量子シミュレーターを約束している。
ここでは, 化学合成12スピン鎖[U-13C, 15N]-ブチロニトリルを過分極するために, 可逆交換(SABRE)によるパラ水素ベースのシグナル増幅を用いる。
SABREはパーセンテージレベルの13Cと15Nの偏光を生成し、ネットワーク全体で非平衡なマルチスピンオーダーを準備する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:40:59 GMT)
LLM-Orchestrated Conformance Checking in Stroke Care Without Computer-Interpretable Guidelines [35.2] 医療におけるコンパタンスチェックは、患者のケアパスが臨床ガイドラインに準拠しているかどうかを評価することを目的としている。
本研究は、非構造化臨床およびガイドラインテキストから直接、医療適合性チェックをサポートするモジュラーフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:44:03 GMT)
Benchmarking Empirical Privacy Protection for Adaptations of Large Language Models [35.2] 大規模言語モデル(LLM)におけるDP適応下のプライバシーリスクについて検討する。
我々は、ロバストなメンバシップ推論やカナリアデータ抽出といった最先端攻撃を用いて、これらのリスクをベンチマークする。
パラメータ効率のよいLoRAのような微調整手法は,OODデータに対して最も高いプライバシー保護を実現する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:21:02 GMT)
SynManDex: Synthesizing Human-like Dexterous Grasps from Synthetic Human Pre-Grasps [35.2] SynManDexは、生成された人間のプレグラスをアベイランス対応の提案として使用する合成パイプラインである。
SynManDexは、オブジェクト条件付きデジタル人間のプレグラスをサンプリングし、それらをデクスタラスなロボットのポーズに再ターゲットし、各ステップからチェックをパスする軌跡を認める。
シミュレーションで80.7%、実ロボットで25/30(83.3%)成功している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:52:45 GMT)
Beyond Accuracy: Community Perspectives on Machine Translation [34.9] 非AIコミュニティは機械翻訳(MT)システムに対する懸念が高まっている。
これは、技術進歩と現実世界のユーザーのニーズの間に顕著なギャップがあることを示唆している。
筆者らは, 4つの利害関係者コミュニティがソーシャルメディア上でMT技術について何を投稿しているかを, 初めて大規模に分析した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:42:49 GMT)
Emergence of Context Characteristics Sensitivity in Large Language Models [34.8] 本研究では、連続的な命令微調整段階において、モデルが文脈特性に対する感度がどのように変化するかを検討する。
実験により、SFTはモデルに理解しやすいコンテキストをより使いやすくすることを示している。
以上の結果から,IFTの各段階において文脈使用法が積極的に再形成されていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:11:07 GMT)
Are Reasoning Vision-Language Models Robust to Semantic Visual Distractions? [34.3] Reasoning Vision-Language Models (VLM) は複雑なマルチモーダルタスクにおいて高い性能を達成する。
我々はtextbfDistract-Bench を導入した。これは、textbfsemantic visual distraction に対する VLM の堅牢性を評価するベンチマークである。
以上の結果から,Distract-Benchは視力低下とは異なる堅牢性障害を呈することが明らかとなった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 00:40:32 GMT)
GeoRoPE: Ground-Aware Rotary Adaptation for Remote Sensing Foundation Models [34.2] リモートセンシング基礎モデル(RSFM)は、複数のセンサからの画像の事前学習と地中サンプリング(GSD)の恩恵を受ける
固定されたトークングリッドオフセットは、センサー間の異なる接地距離に対応でき、グリッドベースの位置先入先を物理的に矛盾させる。
地上認識, RoPE互換, パラメータ効率を考慮したRSFM空間適応手法であるGeoRoPEを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:15:53 GMT)
Assessing Sample Quality in Conditional Generation under Compositional Shift [34.2] トレーニング分布のみを用いて条件付きサンプルを評価するために,サンプル単位の信頼スコアを開発した。
その結果,外挿世代間で有意な比較を再現できることが示唆された。
生体イメージングにおいて、選択されたサンプルは、実際の形態的構造をより良く保存し、下流予測性能を向上させる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:10:25 GMT)
AlloSpatial: Agentic Harness Framework for Spatial Reasoning in Foundation Models [33.8] AlloSpatialは、基礎モデルにおけるアロセントリック空間認知のためのエージェントフレームワークである。
World2Mindは、エゴセントリックな観察を構造化されたアロセントリックな前駆体に変換する、プラグアンドプレイの認知マッピングサンドボックスである。
実験によると、AlloSpatialはトレーニング不要の環境でプロプライエタリなモデルを5%-18%改善している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:55:05 GMT)
DexPIE: Stable Dexterous Policy Improvement from Real-World Experience [33.6] デクサラスな操作は、その高次元の作用空間と複雑な力学のため、模倣学習に重大な課題をもたらす。
実世界の展開を通じて収集した経験から,厳密な政策改善のためのポストトレーニングフレームワークであるDexPIEを提案する。
DexPIEは3つの挑戦的な現実世界の巧妙な操作タスクの中で、デモベースの参照ポリシーよりも成功率を37%向上させる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:21:45 GMT)
Is Text All You Need? Text as a Universal Information Bottleneck for Speech LLMs [33.6] 本稿では,LLMの入力埋め込み多様体内に存在する全ての音声表現を制約する言語間LLMブリッジであるConvex Gateを提案する。
C-Gateは、自動音声認識と感情認識にまたがって、強い関節演奏を実現する。
結果として,トークンの離散性よりも幾何が音声からLLMインターフェースの基本設計要素であることが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:38:40 GMT)
One Model, Multiple Goals: Adaptive Multi-Objective Learning for E-commerce Dialogue Systems [33.5] 適応型多目的強化学習フレームワークMOREを提案する。
MOREは推論精度と言語自然性を共同で最適化する。
ByteDanceとMultiWOZ 2.2ベンチマークの2つの実世界の対話システム上でMOREを評価する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:01:07 GMT)
Gaming AI-Assisted Peer Reviews Poses New Risks to the Scientific Community [33.4] AIによるピアレビューは、単純で低コストな操作に対して脆弱であることを示す。
これは、人書きとAI生成の両方の論文のために、規律と出版の場にまたがって見られます。
以上の結果から,AIツールを中性評価対象として扱うべきではないことが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:38:06 GMT)
A Regret Minimization Framework on Preference Learning in Large Language Models [33.2] 検証可能な報酬による強化学習は、タスク固有の検証に頼って推論集約的なタスクの進行を可能にした。
多くの現実的な言語タスクは信頼性の高い検証器を装備することは困難であり、人間のフィードバックからの強化学習への依存度が高まっている。
本稿では、RegretベースのPreference Optimization $(textbfRePO)$を紹介します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:18:44 GMT)
A Continuous-Time Markov Chain Framework for Insertion Language Models [32.8] 挿入言語モデル(ILM)は、左から右への生成とマスクベースの生成に対していくつかの利点がある。
連続時間マルコフ連鎖としてノイズ発生過程を定式化することにより,ILMの拡散型遮音目標を導出する。
提案手法は,左から右への生成とマスク拡散モデルに対する挿入ベース生成の利点を保っていることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:39:43 GMT)
Alignment Defends LLMs from Property Inference Attacks [32.6] 大規模言語モデルにおけるプロパティ推論攻撃の軽減のためのアライメントに基づく防御手法を提案する。
提案手法は,トレーニングデータを変更することなく,トレーニング後のアライメントによる目標特性比に対するモデルの出力分布を再現する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:15:20 GMT)
Breaking the Tokenizer Barrier: On-Policy Distillation across Model Families [32.3] On-Policy Distillation (OPD)は、ドメインエキスパートから学生モデルへ知識を伝達するためのLarge Language Models (LLM)のポストトレーニングにおいて、中核となる技術となっている。
既存のOPD蒸留法では、教師と学生が同じトークン化剤を共有する必要があり、モデルシリーズにおけるPDの適用性を制限している。
本研究では, 標準的なオンライン蒸留法をモデルファミリ間で動作させることにより, 高忠実度トークンレベル信号が異なるトークン化器間で伝搬することを保証する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:12:01 GMT)
Civil Court Simulation with Large Language Models [32.3] 裁判所のシミュレーションは法的教育と司法実務を橋渡しするが、人間に基づくシミュレーションは費用がかかり、スケールが難しい。
中国民事事件のマルチエージェント裁判所シミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:30:49 GMT)
WorldCoder-Bench: Benchmarking Physically Grounded 3D World Synthesis [31.9] 本稿では,3次元世界合成のベンチマークであるWorldCoder-Benchを紹介する。
WorldCoder-Benchには、シミュレーション、レンダリング、アプリケーションシナリオにわたる専門家による2,026のタスクが含まれている。
サンドボックスブラウザで生成されたプログラムを探索する実行ベースのプロトコルであるStateProbeを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:47:41 GMT)
QuadVerse: An Integrated Framework Aligning Visual-Physical Reality for Quadruped Simulation [31.9] 映像認識,物理インタラクション,アクチュエータダイナミクスを調整するための校正基板として,再構成シーンを利用する統合フレームワークであるQuadVerseを紹介した。
ここでは,QuadVerseが関連するベースライン上での復元品質と移動追跡を改善したことを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:25:26 GMT)
PACT: Learning Diverse Diagnostic Strategies via Privileged Synthesis and Branch Consensus [31.6] 我々は,マルチパラダイム対話合成とコンセンサスに基づく分岐学習を併用したフレームワークである textbfPACT (Periodic Anchor Consensus Training) を提案する。
データレベルでは、textbfDPS(Doctor-Patient-Supervisor)は、患者視情報に制限された医師エージェントを維持しながら、品質管理のために完全な電子カルテ(EMR)を使用する。
実験の結果, PACTは診断結果とコンサルテーション・プロセスのメトリクスに基づいて, プロプライエタリ, 医療特化, タスク適応ベースラインを比較した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:34:12 GMT)
Proxy Reward Internalization and Mechanistic Exploitation: A Learned Precursor to Reward Hacking and Its Generalization [31.0] Proxy Reward Internalization and Mechanistic Exploitation (PRIME)を紹介する。
PRIMEは、タスクの正しさを評価し、受け入れを予測し、悪用可能な金のギャップについて推論する学習能力である。
PRIMEは、報酬ハッキングを継続する前に、段階的に出現する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:32:54 GMT)
IMUG-Bench: Benchmarking Unified Multimodal Models on Interleaved Understanding and Generation [30.1] We propose IMUG-Bench, a benchmark for multi-turn interleaved image-text dialogue of unified multimodal model (UMMs)。
我々のIMUG-Benchは、静的空間、時間的因果、ハイブリッドの3つのクラスから構成されており、3,113のサンプルと12,034の相互作用ターンをカバーしています。
IMUG-Benchの大規模実験は、主流のオープンソースとクローズドソースのUMMを体系的に評価し、その機能境界と障害モードを明らかにし、マルチターン相互作用における生成側の顕著な露光バイアスを明らかにする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:08:20 GMT)
PAI: Preserving Amplitude Information in Representation-Based Time-Series Anomaly Detection [29.5] PAIと呼ばれる新しい異常スコアリング手法を提案する。
PaAno + PAIは最高のパフォーマンスを実現し、最先端の手法を15%上回っている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:24:40 GMT)
Tight Sample Complexity of Transformers [28.8] We map a input sequence of length $T$ to a single output, established a upper bound of $O(L W log (T W))$ and a nearly matching lower bound of $(L W log (T W / L))$。
さらに,教師の強制力を示すトランスフォーマーを用いたチェーン・オブ・シークレット学習の複雑さを強く特徴付ける。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:56:24 GMT)
OpenBibleTTS: Large-Scale Speech Resources and TTS Models for Low-Resource Languages [28.8] 我々は,37言語にまたがる低リソース音声合成のためのベンチマークOpenBibleTTSを紹介する。
様々なTTSアーキテクチャと大規模音声生成モデルの体系的比較は、ドメイン内聖書テキストとドメイン外資料にまたがって行われる。
結果は、言語やメトリクスにまたがる単一のシステムが支配的でないことを示している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:30:48 GMT)
$ω$-EVA: Envision, Verify, and Act with Latent Interactive World Models [28.5] 身体的な政策は通常、現在の観察結果を行動に直接マッピングし、候補者行動の結果を暗黙的に残す。
動作生成のためのエンビジョン-検証-Actループを実現する潜在対話型世界モデルである$-EVAを紹介する。
その3段階のフレームワークは、アクション条件付き潜在力学を学び、言語条件付きフローポリシーを訓練し、世界モデルを通じてポリシーの提案をフィードバックする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:12:56 GMT)
Online Learning with Recency: Algorithms for Sliding-window Streaming Multi-armed Bandits [28.2] 本稿では,シングルパス*スライディングウインドウストリーミングマルチアームバンディット(MAB)のアルゴリズムについて検討する。
この設定では、未知のガウスの報酬分布を持つ$n$アームとパラメータ$W$が与えられる。
アームはシングルパスストリームに到達し、最新の$W$アームのみが有効と考えられる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:21:54 GMT)
Code Is More Than Text: Uncertainty Estimation for Code Generation [28.0] コードは自然言語(NL)とは3つの点で異なる: 1つの間違ったトークンがプログラム全体(トークン)を分解し、アルゴリズムの意図と具体的な実装は独立に(インテント・コードのギャップ)、プログラムは実行可能である(実行可能性)。
我々はこれらの特性を3つの不確実性軸としてインスタンス化する: 語彙(Top-Kトークンエントロピー)、アルゴリズム的脆弱性(擬符号整合)、機能(行動整合)。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:52:43 GMT)
Anything2Skill: Compiling External Knowledge into Reusable Skills for Agents [28.0] Anything2Skillは、異種外部の知識を再利用可能な、検索可能な、エージェントの実行可能なスキルにコンパイルする分類誘導フレームワークである。
我々は、Anything2SkillとRAGを組み合わせることで、それぞれ98.85%と94.10%の成功率が得られることを示した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:24:32 GMT)
From Shortcuts to Reasoning: Robust Post-Training of Theory of Mind with Reinforcement Learning [27.9] 理論・オブ・マインド(Theory of Mind、ToM)は、現代の基礎モデルシステムにおいて必須のスキルである。
ポストトレーニングによるToMのホーニングについて最近の研究が進められている。
このような進歩は、広範囲にわたる「ショートカット」問題によって構築されていることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:42:12 GMT)
Conan-embedding-v3: Fusing Modality-Specific Models for Omni-Modal Embedding [27.6] 本報告では,オムニモーダル検索のための復号化フレームワークであるConan-embedding-v3を提案する。
コナン-エンベディング-v3 は、まず、個別にモダリティスペシャリストを訓練し、タスクベクトルを単一の高密度バックボーンに融合させる。
この融合は、視覚、ビデオ、文書検索機能を構成するが、プロジェクタベースのモダリティの障害モードを公開することも示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:54:18 GMT)
PrivCode++: Latent-Conditioned Differentially Private Code Generation for Comprehensive Guarantees [27.5] 命令-コードペアに微調整された大規模な言語モデルは、記憶し、その後、センシティブなトレーニングデータをリークする。
既存の差分プライベート(DP)コード生成メソッドは、主にコードスニペットを保護し、プロンプトが公開であると仮定する。
PrivCode-Plusはプライバシフリー遅延コンディショニングモジュールを備えた2段階のDPフレームワークを導入した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:42:44 GMT)
Self-supervised Learning Matters: A Simple Ensemble Solution for Micro-Gesture Recognition [27.3] 我々は,IJCAI 2026の第4回MiGAチャレンジのマイクロゲイン分類トラックにXInsight Labのソリューションを提示する。
本稿では,自己教師付きRGBモデルと教師付きマルチストリームモデルを統合したマルチモーダルアンサンブルフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:32:05 GMT)
WeaveBench: A Long-Horizon, Real-World Benchmark for Computer-Use Agents with Hybrid Interfaces [27.1] WeaveBenchは,8つの実世界の作業領域に114のタスクを持つ,長期にわたるハイブリッドインターフェースベンチマークである。
デプロイされたCLIエージェントランタイム内の実際のUbuntuデスクトップ上でこれらのタスクを評価し、最小限のデスクトップコントロールプラグインで拡張します。
フロンティアのモデルと実行時のペアリング全体では、最高のPassRateは41.2%にしか達せず、ベンチマークは飽和状態には程遠い。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:39:23 GMT)
The Empirically Grounded Adaptive Virtual Patient for Psychotherapy Training: Disclosure That Responds to Therapist Micro-Skills [26.8] シミュレーションされた患者は、共感的反応や探索的探索のような心理療法のマイクロスキルを訓練するスケーラブルな方法を提供する。
本稿では,訓練者のスキルに応じてその開示行動に適応する適応仮想患者について紹介する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:27:22 GMT)
DynaCF: Mitigating Shortcut Learning in Reward Models via Dynamic Counterfactual Sensitivity [26.6] 報酬モデル学習におけるショートカット学習の軽減を目的とした動的リウェイト化フレームワークを提案する。
我々は、DynaCFが嗜好モデリングにおけるロバスト性を一貫して改善していることを示します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:24:15 GMT)
A Unifying Framework for Concept-Based Representational Similarity [26.5] 概念のアライメントは基本的に多目的であり、そのように定義、測定、最適化されなければならない。
本稿では,2つの軸に沿ったアライメントを分解する統一フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:42:39 GMT)
TRL-Bench: Standardizing Cross-Paradigm Representation-Level Evaluation of Tabular Encoders [26.2] タブラルエンコーダは通常、タスク固有のエンドツーエンドパイプライン内で評価される。
本稿では,並列表現レベル評価ベンチマークTRL-Benchを紹介する。
ベンチマークアセットとタスクリフォームは、50のOpenMLテーブルと123の認証対象、16の行ペアリンクリライト、47,772のDLTE湖を含む。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:39:25 GMT)
Reasoning without Gold Standards: A Proxy-Judge Theory of Autoformalization [25.5] 自動形式化(AF)は、非公式な数学的または論理的推論を形式的に検証可能なオブジェクトに変換するようモデルに求める。
我々は、金標準マッチングを軸ごとのプロパティチェックのベクトルに置き換える、AFのための参照フリープロキシ・ジャッジフレームワークを導入する。
miniF2F、ProofNet、e-SNLI、ProntoQAの7つの形式化バックボーンで、改良はシングルショットのICLベースラインよりもパスレートを一貫して引き上げる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:57:09 GMT)
Your Model Already Knows: Attention-Guided Safety Filter for Vision-Language-Action Models [25.3] VLA(Vision-Language-Action)モデルでは、さまざまなロボット操作タスクにおいて、エンドツーエンドのパフォーマンスが著しく向上している。
既存の安全フィルタは、障害物とその位置を特定するために視覚言語モデル(VLM)をクエリすることで、この問題を回避している。
VLAモデル内の少数の注意点が、ポリシーがアプローチしようとする対象を確実に位置づけすることを発見した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:11:16 GMT)
Muon Learns More Robust and Transferable Features than Adam [24.7] Muon が学んだ機能は,Adam と SGD が学んだ機能よりも一貫して堅牢であることを示す。
また,Muonで学習した特徴がAdamやSGDが学んだ特徴よりも効果的に伝達できることを実証した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:42:54 GMT)
ReSkill: Reconciling Skill Creation with Policy Optimization in Agentic RL [24.7] 本稿では,RL-in-the-loopスキル作成フレームワークであるReSkillを紹介する。
ReSkillはGRPOの群構造を利用して、3つのメカニズムを埋め込む。
いくつかのドメインで、ReSkillは既存のメモリとスキルベースのRLメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:27:26 GMT)
Streaming Interventions: Can Video Large Language Models Correct Mistakes as They Occur? [24.5] Ego-MC-Benchは、リアルな調理シナリオにおいて、リアクティブでステップバイステップのタスクガイダンスを評価するためのベンチマークである。
Ego-CoMistは、非インタラクティブな調理ビデオから、積極的な介入を示す教師付きトレーニング例に変換することによって生成された合成データセットである。
Ego-CoMistの微調整により,特に小型で高効率なビデオLLMの性能向上が期待できる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:27:20 GMT)
HDRAgent: An Agentic Framework for Multi-Exposure HDR Imaging [24.5] 既存の多くのマルチ露光HDR法は、固定フィードフォワード再構成パラダイムに従っており、複雑なダイナミックシーンでゴーストするアーティファクトの傾向が強い。
本稿では,現在のシーン条件に応じて適応的に再構築戦略を選択するHDRAgentを提案する。
実験により、HDRAgentはゴーストや局所的なアーティファクトを効果的に低減し、競争力または優れた客観的パフォーマンスと視覚的品質を達成することが示された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:00:56 GMT)
Seeing the Hivemind: A Consensus-Aware Interaction Technique for Mitigating AI Homogenization [24.3] 本稿では,Semantic Repulsion Techniqueを導入し,AIを創造的なタスクに定期的に使用している16人の参加者を対象に,計算と評価を行った。
計算結果から,SRTのセマンティック多様性は85~167%,コンセンサスフレーズは43~95%,タスクモードは43~95%向上した。
ユーザ調査では、SRTの出力はより有用性(p =.019$, $W =.208$)が高く、コヒーレンス評価($p =.006$, $W =.260$)、68.8%の参加者が複数のタスクにSRT-Strongを使用したいと望んでいる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:59:50 GMT)
Diverse Thinking Schemata Elicit Better Reasoning in Large Language Models [24.2] 推論プロセスの2つの批判的かつ過小評価された側面に注目します。
思考スキーマの多様性とモデル性能の相関を観察する。
本稿では,まず,スキーマを意識したモデルを実現するためのフレームワークであるDiverseta Policy Optimization (DiScO)を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:17:31 GMT)
DeRA-MOS: Optimizing Text-to-Music Evaluation via Decoupled Listwise Ranking and Modality Alignment [24.1] 音楽印象(MI)とテキストアライメント(TA)スコアは人間の平均世論スコア(MOS)に依存している
TTM評価のための分離最適化フレームワークであるDeRA-MOSを提案する。
MusicEvalの実験では、分離されたフレームワークがMIとTAのランキングの指標を大幅に改善することを示した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:01:20 GMT)
CARE: A Conformal Safety Layer for Medical Summarization [24.0] 大きな言語モデル(LLM)は、医学的な要約にますます使われている。
既存のエラー検出手法ではスコアが生成または未校正され、エラーを正しく制御することができない。
リスク評価のためのコンフォーマルアセスメント(CARE, Conformal Assessment for Risk Evaluation)を導入する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:10:45 GMT)
Escaping the KL Agreement Trap in On-Policy Distillation [23.9] 動的トレーニング適応しきい値と持続的低KL一致を検出するオンラインPD終了規則を提案する。
KATは、avg@kの精度を2.66%、pass@kを3.43%改善し、平均ロールアウト期間を59.73%短縮した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:28:54 GMT)
When Vision Misleads, Let Location Speak: A Worldwide Image Geo-Localization Method via Location Attention Mechanism and Large Multimodal Models [23.4] 既存の手法はしばしば、異なる地理的領域の視覚的に類似したシーンとマッチングすることで、画像の非局所化を行う。
位置注意機構と大規模マルチモーダルモデルを統合した新しい検索ベースフレームワークであるTransGeoCLIPを提案する。
本研究では,TransGeoCLIPが視覚的に類似した画像のローカライゼーション性能を大幅に向上させることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:49:44 GMT)
ProbeAct: Probe-Guided Training-Free Failure Recovery in Vision-Language-Action Models [23.4] PROBEACTはトレーニング不要のランタイム介入フレーム6である。
プレ-7の訓練されたVLAポリシーの把握と配置の失敗を検知し、回復する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:04:24 GMT)
AbstRAG: Learning to Abstract for Retrieval Problems [23.4] AbstRAGは、クエリ-エビデンスギャップを、式、概念、インテント-エビデンス、イベントタイプコンポーネントに分解する。
21対のブートストラップのコントラストのうち18のnDCG@10よりも優れており、生成精度は1.9%、5.2%、および4.0%向上している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:14:01 GMT)
The Masked Advantage: Uncovering Local-Language Access to Cultural Knowledge in LLMs [23.2] 地域ベンチマークやローカルソースから収集した実世界の文化的質問に基づいて構築された,制御されたフレームワークを使用している。
我々は、文化に依存しない質問に対して、一貫した英語の優位性を見つけ、より強い英語の習熟度を示す。
ローカル言語は、ほとんどすべてのローカライズモデル設定において、肯定的な知識アクセスの優位性を示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:53:59 GMT)
Absence of poor local minima in matrix product states [23.1] シーケンシャル回路で作製された行列積状態は、実際は著しく訓練可能である。
ブリックワーク回路が存在しないような環境下では,MPSのエネルギーランドスケープが,ローカルなミニマから解放されていることが証明されている。
本研究は,トレーニング容易性判定における局所過パラメトリゼーションの意義を明らかにするものである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:00:02 GMT)
KPGrasp: Scalable Keypoint Flow Matching for Dexterous Grasp Generation [23.0] KPGraspは,大規模データから事前の詳細な把握を学習するフローマッチングフレームワークである。
20の多様なオブジェクトに対する実験は、パイプラインを現実世界のセットアップでデプロイできることを示しています。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:19:29 GMT)
SG-OPD: Sign-Gated On-Policy Distillation via Sign-Consistency Gating and Phased Teacher Sampling [22.8] オンライン蒸留 (On-policy distillation, OPD) は、生徒を自身の軌道で訓練し、より強い教師から集中的な指導を受ける。
本稿では,教師の信頼信号として二分検証器を用いるサインゲートオンポリシィ蒸留(SG-OPD)を提案する。
競合レベルの数学的推論ベンチマークの実験では、SG-OPDは標準PDよりも一貫して優れていた。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:11:58 GMT)
Multi-Turn Evaluation of Deep Research Agents Under Process-Level Feedback [22.7] 既存のDRA(Deep Research Agent)のベンチマークでは、シングルショットアウトプットのみを評価し、重要な疑問を無視している。
自己回帰とプロセスレベルのフィードバックという2つのフィードバック設定の下で,DRAのマルチターン評価を行う。
分析の結果, (i) 自己反射下では, エージェントがほぼ等しい速度でルーブリック基準を組み込んで回帰し, 無視できる純改善をもたらすこと, (ii) プロセスレベルのフィードバックの1ラウンドでかなりの利得が得られること, (ii) 正規化スコアを約8~15ドル引き上げ, 約35ドルとした。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:08:36 GMT)
Rethinking 3D Shape Generation: Diffusion over Superquadrics [22.6] 拡散モデルには先進的な3次元形状の生成があるが、ほとんどの手法は依然として高次心電図空間で認知されている。
本稿では,高密度な幾何学からコンパクトな幾何学的原始体への拡散を,各形状を小集合のスーパークワッドリックとして表現することを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:59:15 GMT)
HDSL: A Hierarchical Domain-Specific Language for Structured 3D Indoor Scene Generation and Localized Editing with LLM Agents [22.5] テキスト駆動の屋内シーン生成と編集は、言語モデルが生成および修正できる中間表現を必要とする。
構造化された3次元屋内シーンのためのXML/CSSスタイルのドメイン固有言語である階層記述シーン言語(HDSL)を提案する。
HRAGは、トークンの使用を5.22times$とランタイムを6.19times$に減らし、8対の編集で有効なDSLを生成し、無関係なシーンオブジェクトをよりよく保存する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:02:36 GMT)
EviProp: Seeded Relevance Diffusion on Chunk-Page Graphs for Long Multimodal Document Retrieval [22.4] 本稿では,EviPropを提案する。EviPropは,シード関係拡散によるエビデンスページの検索手法である。
EviPropは、各ドキュメントを階層的、シーケンシャル、および類似性リンクを持つマルチモーダルのチャンクページグラフとしてモデル化する。
MMLongBench-DocとLongDocURLの実験は、独立した視覚検索とテキスト-視覚融合ベースラインよりも、エビデンスページ検索が一貫した増加を示している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:25:20 GMT)
Gradient-Guided Reward Optimization for Inference-time Alignment [22.3] グラデーションガイダンスによるデコーディングにおいて、ターゲットとなる最小限の介入を行う軽量な推論時手法を提案する。
実験により、GGROは安全性、有用性、推論ベンチマークを横断する推論時間アライメントを一貫して改善することが示された。
また、コンピュータのオーバーヘッドを最小限に抑えて、高品質なレスポンスと、ハッキングに報いるロバストさのカバレッジも向上する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:33:13 GMT)
NüshuVoice: Reviving the Voice of Endangered Nüshu with Pitch-Aware Text-to-Speech [22.3] 南州(にしゅう)は、中国・湖南省南部で女性が使用する、絶滅危惧文字である。
NshuVoiceは、Nshuの最初のテキストと音声のベンチマークである。
Nshu-PitchVITSはF0条件のVITSフレームワークで、Nshuの5レベルピッチ表記を明示的なプロス帰納バイアスとして活用する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:03:11 GMT)
Towards Optimal Robustness in Learning-Augmented Paging [22.3] 単純なMLベースのアプローチに対する大きな利点は、予測が不正確であっても最悪のケースパフォーマンスを保証する、エンハンウンドロバスト性である。
事前の作業はランダムな設定で2H_k + O(1)$のバウンダリを達成し、最適競合比$H_k$にギャップを残している。
我々は,学習増強型ページングのための加算定数まで,最も可能性の高いロバスト性を実現する新しいフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:33:53 GMT)
LATTEArena: An Evaluation Framework for LLM-powered Tabular Feature Engineering (Extended Version) [21.9] LATTEArenaは15の代表的なメソッドを再利用可能なコンポーネントに分解した分類を特徴とする最初の競争評価フレームワークである。
1)モンテカルロ木探索によるツリー・オブ・サーチは最適なコスト効率を実現し,(2)RPNとCodeの出力形式は,それぞれ分類と回帰タスクを支配している。
我々は、モジュラーフレームワークと4000以上の実行ログを公開し、研究者が既存のフレームワークに対してシームレスに新しいテクニックを落とし、LATTEを前進させることができるようにしました。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:03:54 GMT)
Visual Para-Thinker++: A Single-Policy Multi-Agent Framework for Visual Reasoning [21.7] 視覚推論のための単一政治マルチエージェントフレームワークであるVisual Para-Thinker++を提案する。
1つの共有MLLMポリシーは、ロールコンディショニングされたMain、Worker、Slide Agentsとしてインスタンス化されます。
Visual Para-Thinker++は、単一軌跡と推論時並列ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:57:48 GMT)
Autonomous FPV Flight with Translational Optical Flow and Uncertainty Mask [21.6] 本研究では,エゴモーション背景流からの障害物誘起光流を遠絡させ,低信号対雑音比に苦しむ方法を示す。
提案システムは、シミュレーションで最大13.91m/s、実世界のテストで11.79m/sの速度で堅牢な飛行を実現し、実際の30回の試験で93.3%の成功率を達成した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:35:32 GMT)
Scaling law of asymptotic freedom in collective charging of quantum batteries [21.4] エルゴトロピーとエネルギーの比が、電池数$N$と、少なくとも$sim N-1$に近づくことが証明されている。
ユニバーサルな1/N$のスケーリングを克服する方法を示します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:30:29 GMT)
Quantum Mechanical Studies of Photodissociation Dynamics on Quantum Computers [21.2] 量子コンピュータ上で光解離ダイナミクスを研究するための量子アルゴリズムを提案する。
このアルゴリズムはノイズや統計的サンプリング誤差に頑健であり、量子力学研究へのノイズデバイスの適用が期待できることを示している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:11:12 GMT)
Minimal Solvers for Full-DoF Motion Estimation from Asynchronous Differential SfM [21.2] イベントカメラは情報に対するインテリジェントな認識と視覚運動推定の新しいパラダイムを導入した。
彼らの非同期データストリームは、従来の同期フレームベースのアルゴリズムに重大な課題をもたらす。
本稿では,非同期フローから直接自由度(DoF)を推定するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:51:29 GMT)
UnpredictaBench: A Benchmark for Evaluating Distributional Randomness in LLMs [21.1] 我々はUnpredictaBenchを紹介した。これは、大きな言語モデルが真の基礎となる分布をキャプチャする能力をテストする評価である。
単純な分布シミュレーションでさえも困難であり、複雑なシステムのスタンドインとしてLLMを使用するための第一歩となる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:52:18 GMT)
PsychoSafe: Eliciting Psychologically-Informed Refusals in Large Language Models [20.8] 心理的安全リフレームは、証拠に基づく介入戦略に基づく構造化された支援コミュニケーションとして拒絶される。
500のプロンプトの検証セットでは、サイコセーフプロンプトは全体的な拒絶品質をジェネリックベースラインに対して28.1%改善する。
微調整は、ほぼ完全な拒絶と資源参照率を達成するが、応答の関連性は減少する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:19:18 GMT)
A VideoMAE-v2 Approach to Zero-Shot Traffic Accident Anticipation [20.3] 本稿では,フレームレベルの時間的リスク推定タスクと,粗いラベル付き2値事故データセットとのギャップを埋める枠組みを提案する。
本手法は,2026年CVPR@AUTOPILOTゼロショット事故予測大会で2位となる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:25:16 GMT)
Capability-Aligned Hierarchical Learning for Tool-Augmented LLMs [20.3] ツール学習により、LCMは外部ツールを起動してタスクを達成できる。
高レベルのポリシーは、グローバルな計画とタスクを管理可能なサブタスクに分解する。
低レベルのポリシーは、これらのサブタスクを解決するためのツールの呼び出しに重点を置いている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:48:55 GMT)
Back to the Familiar Future: Failure Recovery for VLA Policies via Pre-Imagined Milestone Selection [20.0] 本稿では,視線駆動型視覚言語反応(VLA)政策の回復フレームワークであるBack to the Familiar Future (B2FF)を提案する。
実行前に、VLAはクリーンな初期観測に基づいて、よく知られた将来の状態のマイルストーンバンクを生成する。
リカバリ時に、リカバリ可認識セレクタは、このバンクからリカバリマイルストーンを選択し、それを固定視覚目標として強制する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:30:38 GMT)
FedSteer: Taming Extreme Gradient Staleness in Federated Learning with Corrective Projections and Caching [19.9] フェデレートラーニング(FL)は、クライアントがトレーニングラウンドに一貫して参加していない場合、しばしばアグリゲーションのばらつきにさらされる。
本稿では,最近のクライアント勾配のキャッシュから勾配部分空間を構築する新しい手法であるFedSteerを提案する。
実験によると、FedSteerはベースラインを著しく上回り、挑戦的なシナリオのパフォーマンス低下を防ぎながら、他の7%以上の精度向上を実現している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:55:45 GMT)
Calibration Data Trade-offs Across Capability Dimensions: Why Multi-Source Mixing Matters for High-Sparsity LLM Pruning [19.7] 訓練後のプルーニングは、小さな未ラベルキャリブレーションセットを使用して、大きな言語モデルを高い疎度に圧縮する。
本稿では,情報誘導型自己校正プロトコルIGSPを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:05:20 GMT)
Bandits for Efficient Experimentation: Adapting to Control Group, Preferences, and Context Drifts [19.4] MED戦略の線形バージョンから着想を得たアルゴリズムであるDri-MEDを紹介する。
Dri-MEDはドリフトや嗜好構造を無視した保守的なベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:53:29 GMT)
Compositional Generative Modeling from Decentralized Data [19.1] 分散構成フローマッチング(DCFM)は、生データを交換することなく、グローバルな生成因子の集合をまたいだ構造的制約を強制するフレームワークである。
DCFMは、条件付き画像生成、ロボット空間計画、および医療属性共起モデルにおいて、フェデレーション学習とエキスパートの混合ベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:32:35 GMT)
Memory Beyond Recall: A Dual-Process Cognitive Memory System for Self-Evolving LLM Agents [19.1] 現在のメモリシステムは、リコール用に調整された単一の検索サーフェスに、リビジョン、因果結合、およびクロスドメイン抽象化を分解する。
本稿では,エージェントメモリを原入力と原子事実から上昇する認知能力階層に沿って再構成するDCPMを提案する。
System2は、ベンチマークが暗黙のクロスセッション推論に報酬を与える場合の大部分に貢献する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:39:24 GMT)
Hybrid Robustness Verification for Spatio-Temporal Neural Networks [19.0] 既存の検証方法は、過度に保守的な近似や不正な計算コストに依存している。
実際には、対向摂動は、低次元、意味論的に意味のある部分空間に制約された、構造化された空間的および時間的相関を示す。
動作認識(UCF-101)、自律運転(Udacity)、医用画像(MedMNIST)の用途を対象として、3次元CNNによる映像入力のロバスト性検証を行う。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:06:51 GMT)
CodeAlchemy: Synthetic Code Rewriting at Scale [18.9] 私たちは、公開ソースコードを意味豊かなトレーニングデータに変換するフレームワークであるCodeAlchemyを紹介します。
我々は15言語にまたがる3つのコーパスを処理し、500B以上の合成データのトークンと350Bの推論トークンを生成する。
CodeTraceは14の言語と5Kライブラリにまたがる1.3M以上のファイルを実行し、制御フロー、状態追跡、ライブラリの知識をキャプチャする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:15:27 GMT)
Shape Formation for the Cooperative Transportation of Arbitrary Objects Using Multi-Agent Reinforcement Learning [18.8] 一般的な輸送戦略は、マルチロボットシステム上にオブジェクトを運ぶことである。
現実世界の物体によって引き起こされる特定の課題は、その潜在的に任意の形状と非一様質量分布である。
本稿では,この問題を解決するために,新しいマルチエージェント強化学習手法を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:18:14 GMT)
BenSyc: Benchmarking Conversational Sycophancy and Human Alignment in LLMs for Bengali Contexts [18.6] 既存の薬学研究は、主に事実合意と指示追従の設定に焦点を当てている。
BenSycは、ベンガルの社会的文脈における会話の梅毒の研究のための最初のベンチマークである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:37:23 GMT)
MMClima: A Framework for Multimodal Climate Science Data and Evaluation [18.5] MMClimaは大規模なマルチモーダル気候質問応答フレームワークであり、記事、ビデオの書き起こし、数字にまたがる104k以上の有能な質問応答対を持つ。
ファクトリコール、視覚的解釈、およびクロスモーダル合成を必要とするタスクについて、最先端のマルチモーダル言語モデルをベンチマークする。
我々は、気候科学の標準化されたマルチモーダル評価をサポートするために、データセット、評価パイプライン、微調整モデルウェイト、およびデータ作成フレームワークをリリースする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:30:34 GMT)
Deployment-Time Memorization in Foundation-Model Agents [18.4] 個人化リコール(PR)と適応抽出レート(AER)によるプライバシユーティリティフロンティアとしてのエージェントメモリの検討
キーファクト要約は、ほとんどすべてのパーソナライズリコールを維持しながら、Gemma 3 12Bで76%、GPT-4o-miniで64%のカナリア抽出を減少させる。
LongMemEvalでは、キーファクトの要約はGemma 3 12Bで76%、GPT-4o-miniで64%のカナリア抽出を減らし、ほぼすべてのパーソナライズリコールを保存する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:38:41 GMT)
From Rigid to Dynamic: Entropy-Guided Adaptive Inference for Long-Context LLMs [18.4] EntropyInferは、注意エントロピーを使用して、プリフィル中に個々の頭とセグメントの粒度で計算を適応的に割り当てる、トレーニング不要のフレームワークである。
Llama、Qwen、openPanguモデルシリーズの実験では、EntropyInferはKV Snap、AdaKV、CritiPrefillといったベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:02:18 GMT)
Targeting World Models to Compromise Robot Learning Pipelines [18.2] 我々は、世界モデルがロボット学習サプライチェーンにステルスで効果的なデータ中毒のエントリポイントを導入することを実証した。
我々の新しい攻撃手法は、世界モデルを介して一度だけ活性化された遠隔操作データセットに悪意あるプロンプトを注入する。
これにより、合成され、危険なロボット訓練軌道が生成され、その後、安全でない、あるいは侵害されたロボットポリシーが生成される。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:50:31 GMT)
MAGIS: Evidence-Based Multi-Agent Reasoning for Interpretable Strabismus Clinical Decision-Making [18.2] ストラビスムス(Strabismus)は、個々の治療計画に詳細なサブタイプ診断を必要とする一般的な眼疾患である。
本稿では,Multi-AGent reasoning for Interpretable Strabismus diagnosis frameworkを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:21:53 GMT)
A Theory on Flow Matching with Neural Networks [18.2] 本研究では,条件付速度場に適合する流れの理論的基礎を構築した。
条件付き速度場マッチングの目的に対して一般化境界を導出する。
本分析は,非有界損失を伴うマルチタスク表現学習のための一般化に基づく。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:16:32 GMT)
SearchSwarm: Towards Delegation Intelligence in Agentic LLMs for Long-Horizon Deep Research [18.0] 大規模言語モデルは、複雑で長期の現実世界のタスクを扱うことがますます期待されている。
本稿では, 深層調査を対象とする予備調査を, 代表的な長期エージェントタスクとして提示する。
我々は,高品質なタスク分解とデリゲートに向けてモデルをガイドするハーネスを設計し,サブエージェントに適切な結果を返すよう制約する。
我々のモデルである SearchSwarm-30B-A3B は BrowseComp で68.1 、BrowseComp-ZH で73.3 を達成している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:52:26 GMT)
A Geometric Framework for Absolute Pose and Velocity Estimation with Event Cameras [17.9] シーン内の3次元線とそれらが引き起こす事象を利用した絶対的なポーズと速度推定のためのフレームワークを提案する。
速度推定のために,角速度と直線速度の両方を復元するために,効率的な線形解法とより正確な最適化に基づく解法を開発した。
提案手法は,従来の手法に比べて精度と計算効率が大幅に向上し,最先端性能を実現している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:35:28 GMT)
From Coarse to Fine: Managing Temporal Granularity in Spatio-Temporal Data for Fine-Grained Traffic Prediction [17.9] 粗い粒度のデータは、時間的粒度の予測を必要とする下流のアプリケーションを制限する。
本研究では,時空間データシステムのための空間認識フレームワークSTRPを提案する。
STRPは、精度と効率の両方で最先端の予測器を著しく上回る。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:07:13 GMT)
Leveraging NeRF-Rendered Images for 3D Gaussian Splatting [17.6] 3DGSにおけるNeRFレンダリング画像の活用を提案する。
具体的には,街路シーンをターゲットとし,事前訓練した街路固有のNeRF法を用いて,目標3DGS法のトレーニング画像を生成する。
我々の3DGSトレーニングでは、NeRFレンダリング画像は、ストリートレベルの入力ビューにおける一時的なオブジェクトを除去し、追加ビューとして鳥眼ビューを生成するために使用される。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:03:22 GMT)
DifferSeg: Towards Diverse Multimodal Binary Segmentation via Differential Perception and Frequency Guidance [17.5] DifferSegは単純だが汎用的なマルチモーダルバイナリセグメンテーションフレームワークである。
学習可能な微分作用素を用いて、多モーダルな特徴を適応的に整列し、相補性を高める。
29の公開データセットにわたって67の最先端メソッドを一貫して超えている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:10:36 GMT)
MotionWAM: Towards Foundation World Action Models for Real-Time Humanoid Loco-Manipulation [17.4] 我々は,1台の自家用カメラから自律型ヒューマノイドロコマニピュレーションを駆動するリアルタイムWAMであるMotionWAMを紹介する。
3段階の学習フレームワークは、ビデオワールドモデルをエゴセントリックな視覚力学に徐々に適応させる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:50:14 GMT)
TLDR: Compressing Audio Tokens for Efficient Autoregressive Text-to-Speech [17.3] Codec-based autoregressive (AR) speech language model has achieved strong text-to-speech (TTS) quality by modeling speech as sequences of disk audio tokens with large pretrained backbones。
音声入力シーケンスはテキストシーケンスよりもはるかに長いので、ARバックボーンは各トークン位置で因果計算を行い、シーケンスの長さで成長するKVキャッシュを維持する必要がある。
TLDRは、トークンレベルの音声シーケンスからパッチレベルのシーケンスへ因果モデリングをシフトすることで、AR-TTSを高速化するパッチベースの自動回帰フレームワークである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:32:08 GMT)
Explicit Representation Alignment for Multimodal Sentiment Analysis [17.3] マルチモーダル感情分析は、テキストや画像などの異質なモダリティを共同でモデル化することで、人間の感情と感情を理解することを目的としている。
実効マルチモーダル学習の鍵となるボトルネックとして,独立に事前訓練されたモダリティエンコーダ間の表現の不整合を同定する。
視覚的コンテンツを構造化されたテキスト記述に変換するために視覚言語モデル(VLM)を利用する統合マルチモーダル感情分析フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:43:52 GMT)
Hybridizing Equilibrium Propagation with Ising Machines for Efficient Energy-Based Learning [17.0] 拡散ホップフィールド緩和を共役変数を持つ拡張位相空間力学に置き換えるIsing-dynamics-inspired equilibrium-proagationフレームワークを導入する。
提案手法は,MNIST,FashionMNIST,CIFAR-10上の深部畳み込みホップフィールドネットワークを,バックプロパゲーションに匹敵する性能で訓練する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:04:57 GMT)
AGENTSERVESIM: A Hardware-aware Simulator for Multi-Turn LLM Agent Serving [16.7] 本稿では,マルチターンLDMエージェントのハードウェア対応シミュレータである AgentSERVESIM を提案する。
AgentSERVESIMは,コモディティCPU上で完全に動作しながら,主要な性能指標に対して6%の誤差で実システム動作を再現することを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:20:23 GMT)
DB-3DME: From Dataset to Benchmark for Human-aligned Automatic 3D Mesh Evaluation [16.6] 3Dメッシュ評価のためのデータセットとベンチマークであるDB-3DMEを紹介する。
DB-3DMEは2,619個の合成3Dメッシュと、幾何学とプロンプトの整合性に関する人間の評価を組み合わせている。
オープンウェイトなVLMであるQwen-2.5-VL-7Bを、言語モデルを凍結しながら視覚エンコーダを適応させて3次元メッシュ評価のために微調整する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:17:49 GMT)
Thresholded Local Hyper-Flow Diffusion [16.6] 局所超フロー拡散(HFD)は、一般的な部分モジュラーハイパーグラフにおけるシードクラスタリングに対して、エッジサイズに依存しないチーガー型保証を与える。
本研究では,種子周囲の活性領域を維持する一階法であるThresholded Local HFDを紹介する。
局所的な更新は正確であることを証明し、後者を明示的なスキップ境界誤差で不正確な投影段階として扱う。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:07:04 GMT)
Principles and Practice of Deep Representation Learning: or a Mathematical Theory of Memory [16.6] この本は「ブラックボックスを開き、大きな深層ネットワークのメカニズムを理解する」試みである。
第2章、第3章、第4章、第5章、第6章は、現代のニューラルネットワークアーキテクチャの設計原則を説明します。
第7章と第8章では、よりパラダイム的な方法で問題を解決するために、これらの原則の適用について論じる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:12:03 GMT)
Event-driven dynamic trajectories reconstruction and measurement of mechanical parameters for fragments [16.5] 本稿では,フラグメントの動的軌跡を再構成し,その力学的パラメータを測定するイベント駆動方式を提案する。
脳にインスパイアされた新しい視覚センサーとして、イベントカメラはマイクロ秒レベルの時間分解能と高ダイナミックレンジの照明変化知覚を提供する。
本手法は、弾頭破片場の機械的損傷評価と戦術的防御設計に対する信頼性の高い技術的支援を提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:41:30 GMT)
Counterfactual Reasoning for Fine-Grained Evidence Disentanglement in VideoQA [16.5] ビデオQAシステムは、答えに関連する因果関係の証拠よりも、急激な統計的相関に頼っていることが多い。
既存の方法は、相互モダリティの相関、コストがかかる訓練リソース、あるいは因果関係の仮定や制約に頼っている。
我々は,細粒度Evidence Disentanglement(CREDiT)のための非現実的推論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:20:42 GMT)
Duality for Optimal Multi-Item, Multi-Bidder Auction Design: Revenue Certificates through Deep Learning [16.5] 我々は,マルチイテム,マルチバイダオークション,支配戦略インセンティブ互換性(DSIC)の2つの問題に対処する最初の計算フレームワークを紹介する。
ニューラルネットワークを用いて,構造的に保証された厳密な流れ保存特性を用いて,ラグランジュ乗算器のパラメータ化を行う。
我々は,昇降が連続的な均一な評価を持つマルチイテム,マルチバイダオークションに対して,有効な収益上限を与えることを証明した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:42:01 GMT)
Front-to-Attractors: Modifying the Front-to-Front Heuristic in Bidirectional Search [16.3] ヒューリスティックスは双方向探索アルゴリズムの性能において中心的な役割を果たす。
front-to-front (F2F) は、s から逆の検索フロンティアまでの距離をペア関数で推定する。
フロント・ツー・アトラクタ(F2A)は、sから、反対の探索方向にある小さな動的に維持されたアトラクタのセットまでの距離を推定する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:14:44 GMT)
ReCoVLA: VLM-Guided Reward Compilation for Failure Recovery in Vision-Language-Action Policies [16.3] ヴィジュアル・ランゲージ・アクション(VLA)ポリシーは、言語条件の操作に強い先行性を提供するが、標的とするリカバリを必要とするオフ・ノミナル州では不安定なままである。
本稿では,既訓練のVLAポリシを凍結した状態に維持するリカバリフレームワークであるReCoVLAを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:29:09 GMT)
RAM: Reachability Across Morphologies [16.1] 到達可能性 (Reachability Across Morphologies, RAM) は、形態論的条件付き暗黙の神経表現であり、ポーズ到達可能性の代理として機能する。
RAMをトレーニングするために、フォワードキネマティクスからのみ生成された3cdot1010$サンプルの大規模なデータセットを公開します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:00:19 GMT)
Adversarial Attack and Disturbance Detection by Hadamard-Coded Output Representations for Object Detection and Semantic Segmentation [16.1] 以前の画像分類研究は、アダマール符号化された出力表現が対向ロバスト性を向上させることを実証している。
本稿では,意味的セグメンテーションやオブジェクト検出モデル,タスクの出力表現としてHadamardコードを利用するフレームワークであるHadamardNetを紹介する。
我々は,障害と敵攻撃の両方を包括的に評価し,両タスクの最先端検出性能を1回の検出パスで達成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:18:57 GMT)
DiffSight-Former: Modeling Structural Differences and Temporal Dynamics for Glaucoma Progression Prediction [15.9] 緑内障は世界中で不可逆的な盲目の原因となっている。
深層学習は、基礎画像解析において有望なパフォーマンスを達成した。
眼底画像からの緑内障進展予測のためのフレームワークであるDiffSight-Formerを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:39:10 GMT)
ERBench: A Benchmark and Testsuite for Equation Discovery Algorithms [15.9] 方程式発見は、データから数学的方程式の形で科学モデルの発見を自動化することを目的としている。
方程式発見のためのシンボリック回帰の性能は、テストデータの予測精度と既知の基底式の回復の2つの次元に沿って測定される。
Equation Recovery Benchmark (ERBench) は、方程式発見のタスクを対象とするアルゴリズムを厳格に評価する新しい評価フレームワークである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:43:59 GMT)
Virtual-point-based Solutions to Handle Generalized Absolute Pose Problem [15.8] マルチカメラシステムは、広い視野、柔軟性、耐障害性のために、自律ロボット工学においてますます採用されている。
既存の解法は複数の射影中心を扱えない。
本稿では,標準を橋渡しする仮想点定式化を提案する。
一般的なポーズ問題です
VGPc, VGPq Pose, VGPrの3つの仮想点に基づく一般化解法を導出する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:02:03 GMT)
Optical Reasoning: Rethinking Images as an Expressive Reasoning Medium Beyond Text [15.5] CoT(Chain-of-Thought)は、LLM(Large Language Model)の性能を改善し、MLLM(Multimodal Large Language Model)に拡張した。
本稿では,画像を独立した推論媒体として扱う光学的推論を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:58:59 GMT)
ChinaHeritaQA: A Culturally-Grounded Visual Question Answering Dataset for World Heritage Sites in China [15.4] ChinaHeritaQAは、中国のユネスコ世界遺産で視覚言語モデル(VLM)の文化的推論能力を評価するためのベンチマークデータセットである。
このデータセットは、7つの認知次元にまたがる14,133のバイリンガル(中国語/英語)の複数選択QAペアとペアリングされた2,279の内蔵画像からなる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:00:45 GMT)
TUDSR: Twice Upsampling-Diffusion for Higher Super-Resolution [15.2] TUDSRは、高解像度画像のためのTwice Upsampling-Diffusionフレームワークである。
複数のベンチマークで最先端のパフォーマンスを実現する。
さらに実験により、TUDSR-Sは10242ドル、20482ドルという解像度で高品質な画像を生成することが示され、既存のアプローチよりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:18:04 GMT)
An Opticalmechanics Framework for Dynamic Estimation of Multibody Systems [15.2] 本研究では,マルチボディシステムのための光学キネマティック・ダイナミック統合推定フレームワークを提案する。
システム力学を記述するために制約付き多体モデルを構築し, 動的推定のための非接触入力として画像計測キネマティック量を用いる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:59:58 GMT)
Distilling Safe LLM Systems via Soft Prompts for On Device Settings [15.2] 本稿では,資源制約設定のためのパラメータ効率の高い安全アライメント手法を提案する。
蒸留法に基づく訓練とソフトプロンプトが相まって、代替手法を一貫して上回っていることを確認した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:03:51 GMT)
Decoding Pedestrian Crossing Intention from Egocentric Vision via Vision Language Models [15.1] エゴセントリックなビジョンは、人間の知覚と意思決定を一人称視点で見る。
本研究では,短いエゴセントリックなビデオクリップから歩行者横断意図を復号する手法について検討する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:39:42 GMT)
The Lipreading Gap: Do VSR Models Perceive Visual Speech Like Human Lipreaders? [14.8] 視覚音声認識モデルは、今や人間のリップリーダーをベンチマークで上回っている。
単語, 文字, 音素, 音素レベル測定値を用いて, 3つのVSRシステムと人間のベースラインを比較した。
我々の研究は、視覚的な特徴を意味のある単語に結び付けるのに失敗し、視覚的な知覚よりも、学習データからの学習手段に主に依存していることを示します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:07:12 GMT)
Self-Consistent Generative Paths via Admissible Random Variational Transport [14.7] 確率経路はいつ自己整合するのか?
自己整合性生成経路を許容可能な局所変分輸送補正のランダムな固定点として定義する。
結果として生じる理論は、エンドポイントマッチングを経路自己整合性テストに変換する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:56:06 GMT)
Integral Field Unit Spectroscopy with One Fiber [14.4] 本稿では,高分解能スペクトルを校正不確かさで予測する多モード確率的基礎モデルを提案する。
我々は、Dark Energy Spectroscopic Instrument (DESI)サーベイから470万枚の画像と単繊維分光観測をトレーニングした。
我々のモデルは、IFUトレーニングデータなしでIFUのような能力を達成するために、ファイバー配置の自然な分散と銀河の形態的自己相似性を利用する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:35:52 GMT)
On the Recoverability of Causal Relations from Bulk Gene Expression Data [14.3] 増大する計算手法は、バルク表現データから遺伝子間の因果関係を回復しようとするものである。
集約バルク遺伝子発現データから因果関係が回復可能かどうか, あるいはどの条件下でも不明である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:23:45 GMT)
Few-shot Class-variable Incremental Audio Classification via Prototype Adaptation and Pseudo Class-variable Training [14.3] クラス可変インクリメンタルオーディオ分類の問題について検討する。
授業数は一般に増加または減少する。
本研究では,プロトタイプ適応と擬似クラス変数学習を用いたFCIAC手法を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 00:50:39 GMT)
Harness Engineering for Physical AI: Robot Middleware Is the Harness Layer [14.3] 物理AIハーネスは、制御、コンピューティング、通信を同時に仲介する必要がある。
プロジェクションは各出力を出力時にゲートし、分離はモデルの実行と送信スロットをバウンドし、Transferはチェックが失敗したときに検証されたベースラインにフォールバックする。
私たちはこれを、AIモデルの宣言された出力領域、推論予算、運用体制を含むデプロイメントアーティファクトであるROS 2 Profileとしてスケッチします。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:29:54 GMT)
Clinically Grounded Privacy Evaluation of Medical LMs [14.2] 本稿では,対向アクセスの段階的軸に沿って漏洩を評価するための臨床基盤フレームワークを提案する。
このフレームワークを378k臨床ノートに事前トレーニングしたLMに適用すると,日常的な出会うメタデータは,動詞の暗記率が高いことが分かる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:02:19 GMT)
Estimate Collapsibility of Causal Effects in Completed Partial DAGs via Strong d-Convex Hulls [14.2] 我々は, CPDAG を導入し, 極小集合を強環状船体として特徴付ける。
効率的なアルゴリズムはDAGにおいてそのような集合を得るために考案された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:36:08 GMT)
Exploration of Foundation Model-Based Robots in Patient and Elderly Care [14.0] このパースペクティブは、デザインの特徴、ユーザエクスペリエンス、ケア関連の成果を示すエビデンスという、3つの領域にわたる基礎モデルに基づくケアロボットを合成する。
今後の研究は、ケア固有の評価基準、説明責任のある自主性、そしてより応答性が高く責任あるケア技術をサポートするためのケアへの統合へと移行すべきである、と我々は主張する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:00:08 GMT)
PTDL:Multi-Terrain Fall Recovery via Phase-Terrain Decoupled Learning [13.9] 人型ロボットは、非構造環境の斜面、砂利、不均一な地面に落下することがある。
本稿では、位相軸と地形軸に沿って訓練の監督を分離する位相領域分離学習(PTDL)を提案する。
平地,砂利,斜面をまたいだ29-DoFユニツリーG1上のPTDLをシミュレーションおよびハードウェア上で最大20度検証する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:01:08 GMT)
Disentangling Hallucinations: Orthogonal Semantic Projection for Robust Interpretability [13.9] 視覚言語モデルのための説明可能なAI手法は、しばしば意味幻覚に悩まされることを示す。
この現象は単一のアーキテクチャに固有のものではなく、線形セマンティックリークによる根本的な結果である。
我々は,OMPの残差特性を利用して,共有概念から独自の意味信号を切り離す幾何学的介入であるOrthogonal-Semantic-Projection(OSP)を紹介する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:48:30 GMT)
Beyond FLOPs: Benchmarking Real Inference Acceleration of LLM Pruning under a GEMM-Centric Taxonomy [13.8] プルーニングは、大規模言語モデル(LLM)推論を加速するための支配的なパラダイムとして現れている。
我々はGEMM中心の分類法を導入し、一般的な行列乗法における論理的textbfM, textbfN, textbfK次元に従って既存のプルーニング手法を再編成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:26:18 GMT)
An Effective Router for Vision-Language Model Selection [13.7] ARMSは視覚言語モデル(VLM)選択のためのルータである。
VLMプロファイルで入力信号を強化し、クエリの表現とVLM機能を改善するため、シンプルだが効果的なアーキテクチャを採用している。
ARMはより広いVLM空間に適応し、スケールの数百倍のGPT-4oのような商用モデルを打ち負かすことができることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:10:46 GMT)
BiWM: Advancing Open-Source Interactive Video World Models with Bidirectional Autoregression [13.6] 双方向自己回帰パラダイムに基づくインタラクティブなビデオワールドモデルのための,最初のフルスタックフレームワークであるBiWMを紹介する。
トレーニング済みのビデオバックボーンから、BiWMは微調整でカメラコントロールを注入し、数ステップのDistributed Matching Distillationステージを走らせる。
1つのレシピは、Wan2.1-1.3B、Wan2.2-5B、HunyuanVideo-1.5-8B、LTX-2.3-22Bにまたがる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:08:41 GMT)
RealMath-Eval: Why SOTA Judges Struggle with Real Human Reasoning [13.6] textbfRealMath-Evalは,高校生による実世界224件の試験結果の厳密な注釈付きベンチマークである。
我々の評価は、最先端のLLM審査員でさえ、この課題にかなり苦労していることを示している。
合成誤差は、予測可能で低次元の線形部分空間に「構造的崩壊」に苦しむのに対し、ヒューマンエラーはより多様なエラー空間を形成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 23:40:34 GMT)
SpeechJBB: Probing Safety Alignment and Comprehension in Large Audio Language Models under Code-Switched Speech [13.5] SpeechJBBは、最先端のLALM間でベンチマークを行うためのオーディオジェイルブレイクデータセットである。
コードスイッチングされた有害なオーディオは、ほぼ高いジェイルブレイク成功率(JSR)を示し、非英語のモノリンガルと非英語のコードスイッチングのペアは、最も高い攻撃成功を示している。
擬単語挿入はさらに拒絶率を減少させ、自然音による難読化が安全政策を効果的に回避できることを示した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:49:38 GMT)
IB-HFN: Information Bottleneck-Driven SAR-Optical Fusion Network for High-Fidelity Cloud Removal [13.3] 本稿では,SAR支援光雲除去のためのInformation Bottleneck-driven High-Fidelity Network (IB-HFN)を提案する。
IB-HFNは、深いセマンティック融合の前にモダリティ固有の表現を保持するためにデュアルストリームバックボーンを使用している。
SEN12MS-CRデータセットの時分割実験により、IB-HFNは既存の手法よりも優れた構造保存とスペクトル忠実性が得られることが示された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:19:06 GMT)
Bayesian Selective Latent Inference for Wastewater-First Influenza Monitoring [13.3] 排水優先型インフルエンザモニタリングを選択的決定問題として検討した。
本稿では,潜伏負荷と識別可能性よりも後続性を維持するベイズ法を提案する。
重要な変動性、応答性、ベルマン最適性、一次元のコスト校正特性を証明した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:44:05 GMT)
See More, Think Deeper: Query-Expanded Visual Evidence and Answer-Clue Guided Reflection for Long Video Understanding [13.3] CoVERは、クエリ拡張された視覚的エビデンスを動的に収集することで、Video-LLMsにTextbfSee Moreを可能にする。
実験結果から,CoVER-7Bはパラメータスケールが同じモデルよりもかなり優れており,特定の指標上での最先端のクローズドソースモデルを超えていることが判明した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:02:05 GMT)
Popcorn: A Configurable Benchmark for Visual Evidence in Multimodal Movie Recommendation [13.2] Popcornはマルチモーダル映画レコメンデーションにおける視覚的証拠のベンチマークである。
タイトルアラインのフルモーフィー/トレーラーの埋め込みと、モダンな視覚モデルと視覚言語モデルでエンコードされたMovieLensにリンクされたサムネイル機能を組み合わせたものだ。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:06:06 GMT)
FAME: Forecastability-Aware Mixture of Experts for Heterogeneous Time Series Forecasting [13.2] 本研究では,予測可能性に配慮したエキスパート・ルーティングについて検討し,データ特性が予測専門家の適合性をどのように決定するかを学習する。
多次元の予測可能性指紋で各シリーズを表現できるスパース・ミックス・オブ・エキスパート・フレームワークを提案する。
5000以上のマシンと60M以上のトランザクションを持つ産業データセットでは、Top-2は最強のシングルエキスパートよりも12.4%削減される。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 00:47:58 GMT)
Understanding Quantization-Aware Training: Gradients at Quantized Weights Bias to the Low-Loss Basin [13.2] ポストトレーニング量子化は、訓練された完全精度モデルをタスクレベルの再トレーニングなしで低ビット重みに変換する。
PTQは適度なビット幅では効率的で精度が高いが、攻撃的なビット幅では急激に故障することがある。
本稿ではPTQ障害とQAT回復の両方を説明する統一的な幾何学的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:21:39 GMT)
A multi-agent system for spine MRI report generation from multi-sequence imaging [13.2] 脊椎病理は世界中で痛みと障害の主な原因である。
最近の自動MRI解析の進歩にもかかわらず、マルチシーケンスデータを効果的に組み合わせることは未解決の課題である。
SpineAgentは、マルチシーケンス基盤モデルに基づく、脊椎MRIレポート生成のためのマルチエージェントフレームワークである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 00:50:07 GMT)
Empirical Study for Structured Output Control in LLMs for Software Engineering [13.1] 期待されるフォーマットに反する意味論的に正しい出力は、システムの観点から、間違った答えと区別できないものである。
本報告では,4つのSEタスクにまたがる構造的信頼性の体系的評価を行う。
LLM駆動誤差における構造的忠実度と意味的正しさを両立させるアプローチの必要性を強調した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:13:58 GMT)
Trajectory Optimization in Single and Dual-UAV Bearing-Only Target Localization [13.1] 本稿では,無人航空機(UAV)の軸受のみの目標位置決めシナリオにおける最適化手法を提案する。
Fisher Information Matrix (FIM) を利用することで、提案手法は幾何学的構成と車両の操作性を動的にフレームワークに統合する。
シミュレーションの結果,提案手法は従来のFIM手法と比較して中央値の局所化誤差を99.21%削減することがわかった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:23:32 GMT)
From Statute to Control Flow: Span-Grounded Deontic Trees for Defeasible Scope Parsing [13.1] 規則追従剤は、しばしばサイレントスコープ・オミッション(SSO)を介して失敗する
根底にあるボトルネックは、法と政策の理解です。
ノルムベンチ(英: NormBench)は、中国(法と地方政策)、英語(アメリカ合衆国税法)、企業政策にまたがる2,290条の基準である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:17:53 GMT)
Report on CHIIR 2026 Workshop on Generative AI and Academic Search (GAI&AS) [13.0] 本報告では、CHIIR 2026 Workshop on Generative AI and Academic Searchを要約する。
GenAIが学術検索システムや研究の実践をどう変えようとしているかを検討した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:31:14 GMT)
The Shadow Price of Reasoning: Economic Perspective on Optimal Budget Allocation for LLMs [12.9] 推論時間のスケーリングは、大規模言語モデルのパフォーマンスを向上させる重要な方法として現れています。
本研究では,経済原理に支配されるグローバル制約付き最適化問題として,推論予算配分を定式化する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:22:17 GMT)
Leveraging Morphology for Historical Script Metrological Analysis [12.9] 本稿では,行レベルの転写監督のみで効率の良い文字モデリングを実現する学習手法を提案する。
このデモのために、我々は14世紀後半にシャルル5世によって依頼され、4つの手によって複製された、パリ写本『BnF, fr. 2813』の注釈を拡張した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:55:02 GMT)
Where Does the Answer Come From? Benchmarking View-Level Visual Evidence Identification in Multi-View MLLMs for Autonomous Driving [12.9] 本稿では,エビデンス・ソース識別評価のための多視点視覚質問応答ベンチマークを提案する。
ベンチマークには、73のシーンから122のコンフリクト中心の質問回答ペアが含まれている。
ビジュアルソースの識別を回答の正しさから明確に分離することで、ベンチマークは回答のみの評価が見逃す基礎的な失敗を露呈する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:39:06 GMT)
Physics-Guided Sequence-Based Generative Framework for Acoustic Metamaterial Inverse Design [12.7] 音響メタマテリアル逆設計のための物理誘導型シーケンスベース生成フレームワークMetaSeqを提案する。
中心となるMetaSeqでは、各AMMをピクセルグリッドや固定テンプレートではなく、構造化シーケンスとして表現する言語を導入している。
逆設計の1対多の性質に対処するため、MetaSeqは、教師付き事前学習と、物理ベースのソルバと妥当性チェッカーによって導かれる強化学習微調整を組み合わせる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:37:44 GMT)
Structured Adaptive Tensor Prediction for Streaming Data [12.6] 行列値時系列は、医療画像データの適応性など、幅広い応用に現れる。
既存の手法は主に静的な設定のために設計されており、ストリーミングや時間変化の環境がない。
行列-on-Matrix (MoM) と勾配-on-Matrix (ToM) を含む適応回帰フレームワークを開発する。
ToM は MoM よりも低い定常誤差とより強力なデノナイジング能力が得られることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:09:58 GMT)
SAILS: Surrogate-based Analysis of Interactions via Local Effect Smooths [12.4] 局所効果Smooths (SAILS) による相互作用の代理ベース分析(Surrogate-based Interactions)は、相互の相互作用を分析するモデルに依存しないフレームワークである。
興味のある特徴の間隔ごとに、代理項は微分レベルで相互作用成分を分離する。
我々は,制御されたシミュレーションと実世界のタスクを通じて,このフレームワークを実証的に検証し,ペアインタラクションの有効性を実証した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:22:02 GMT)
Context Rot in AI-Assisted Software Development: Repurposing Documentation Consistency for AI Configuration Artifacts [12.3] 我々は、CLAUDE.md、 AgentS.md、.cursorrulesのような構成ファイルを通じて、AIコーディングアシスタントを永続的なコンテキストで提供する開発者が増えていると主張している。
これらのファイルは、コード要素、アーキテクチャ、開発規約を記述し、セッション間でAIツールの振る舞いをガイドするコンテキストを形成する。
ソフトウェアが進化するにつれて、このコンテキストは時代遅れになる可能性がある。これは、私たちがコンテキスト腐れと呼ぶ現象だ。AIの構成アーティファクトは新しいが、根底にある一貫性問題は何十年ものソフトウェアドキュメント研究に関係している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:36:38 GMT)
Chemical tuning of magnetic ordering and cryogenic magnetocaloric response in zircon-type Gd1-xErxVO4 [12.0] 化学置換は、極低温冷却のための希土類酸化物の磁気秩序と磁気陰極特性を調整するための効果的な経路を提供する。
我々は,多結晶ジルコン型Gd1-xErxVO4の構造溶出,磁気特性,磁気食塩効果について検討した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:38:20 GMT)
End-to-End Training for Discrete Token LLM based TTS System [12.0] 本稿では,音声トークン化装置,大規模言語モデル,フローマッチングモデルのトレーニングを統一する完全エンドツーエンド(E2E)最適化フレームワークを提案する。
実験結果から,我々のフレームワークは,連続的にカスケードベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:07:23 GMT)
AutoTail-BSFGM: Class-Balance-Aware Fine-Tuning for Chinese Scholarly Text Classification [11.9] AutoTail-BSFGMは学術テキスト分類のためのクラスバランス対応の微調整手法である。
CSLに基づく2つの課題について,67のラベルを持つ抽象学際課題と13のカテゴリを持つタイトル・ツー・カテゴリタスクについて評価を行った。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:13:46 GMT)
SHAPO: Sharpness-Aware Policy Optimization for Safe Exploration [11.8] 安全探索は、安全クリティカルドメインに強化学習(RL)エージェントを配備するための前提条件である。
本稿では、摂動パラメータの勾配を評価するシャープネス対応ポリシー更新ルールであるシャープネス対応ポリシー最適化(SHAPO)を提案する。
この調整は政策の勾配を暗黙的に反映し、安全でない行為の影響を増大させつつ、既に安全である行為からの貢献を誘惑することを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:40:45 GMT)
Inside the Latent Flow: Causal Deciphering of Attention Dynamics in Audio Separation Foundation Models [11.7] フローマッチング変換器は強い音声分離を実現するが、その注意力は不透明である。
我々は、確立された因果干渉原理をSAMオーディオのための決定論的推論時間探索プロトコルに適用した。
本研究では,安定層に注意をキャッシュする学習不要加速法LSACを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:18:28 GMT)
Efficient Minimal Solvers for Visual-Inertial Relative Pose Estimation in Multi-Camera Systems [11.7] マルチカメラシステムの相対的なポーズを推定することは、コンピュータビジョンの基本的な問題である。
本稿では,新しいパラメータ化手法を用いて,マルチカメラシステムの相対的なポーズを推定するための2つの効率的な最小解法を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:36:27 GMT)
SoK: Colluding Adversaries in Machine Learning Pipelines [11.7] 既存の作業には、敵同士の共謀を探求する体系的な枠組みが欠けている。
列車と推論時の敵同士の共謀を網羅する枠組みを提案する。
敵の性格が共謀の可能性にどのように影響するかを論じる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:16:58 GMT)
Beyond Convolution: Advancing Hypergraph Neural Networks with Hypergraph U-Nets [11.6] この研究はハイパーグラフデータのためのU-Netアーキテクチャの研究の先駆者であり、効果的なプーリングとアンプール操作を設計する上で重要な課題に対処している。
階層的なクラスタリングを動機として,異なる粒度でクラスタリングデンドログラムを切断することにより,プールとアンプール演算子を同時に構築することを提案する。
シーケンシャルな学習手順による局所的な構造損傷を危険にさらす既存のプール法とは異なり、PHPool演算子は、元のハイパーグラフ構造に対する忠実性を確保するために、グローバルかつ並列に設計されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:40:19 GMT)
Stability in Competitive Search with Results Diversification [11.6] 本稿では,探索が多様化する競合探索環境のゲーム理論解析について述べる。
分析の結果,コーパスの多様性とコーパスの安定性の相違が明らかとなった。
次に,多角化に基づくランク関数を考案し,コーパス安定性が保証される新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:27:43 GMT)
PTL-Diffusion: Manifold-Aware Diffusion with Periodic Terminal Laws [11.3] PTL拡散は相構造を直接フォワード雑音力学に埋め込む。
トーラスおよびシリンダー・ポイントクラウド・ベンチマークとオリベッティ・フェース・データセットの実験により、PTL拡散は多様体レベルの分布マッチングを改善することが示された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:56:16 GMT)
MAVIS: Multi-Agent Video Retrieval via Structured Video Understanding [11.3] textbfMAVISは、検索をブルートフォース検索ではなく協調推論として再考する、新しいマルチエージェントフレームワークである。
検索中、プランナーは複雑なユーザ意図をアトミックなサブタスクに分解し、個別に候補を指名するために特別エージェントを派遣する。
MSR-VTT、MSVD、ActivityNetの実験は、MAVISがタスク固有の微調整なしで競争性能を発揮することを示した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:36:15 GMT)
Geometry-Aware Anisotropic Boundary Correction for Aerodynamic Simulation [11.2] 幾何学条件付き異方性境界補正フレームワークGeoABCを提案する。
2D翼と3Dカータスクでは、GeoABCは一貫して複数の神経オペレーターのバックボーンに適応する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:45:07 GMT)
Overcoming Decoder Inconsistencies in Whisper for Dravidian and Low-Resource Languages [11.1] ドラヴィダ語は単語が長く,語彙の多様性が高く,繰り返しが低いことが示され,希少なトークン分布と頻繁な文字レベルの置換誤りが生じた。
注意源を適応的にバランスさせる重み付き注意(Weighted-Attention)と、トークン整合性を改善するために中間予測をリジェクションするセルフコンディショニング(Self-Conditioning)という2つのデコーダレベルの拡張を導入する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:18:51 GMT)
Beyond Humans: Multispecies Animal Face Recognition Using Transfer Learning [11.1] 個体認識は、失われたペットや盗まれたペットの探索、絶滅危惧種の個体の追跡、混雑した農場での動物の認識に有用である。
現代の認識技術は主に物理デバイス(例えばマイクロチップ)を使用し、しばしば非実用的で適用が難しい。
例えば、食品業界で健康な動物に病気の動物を代用する場合のように、非侵襲的であり、遠くで働くことができ、偽造が困難である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:27:11 GMT)
REFLECT: Intervention-Supported Error Attribution for Silent Failures in LLM Agent Traces [11.0] 大規模言語モデル(LLM)エージェントは、長いプラン・アンド・エグゼクティブトレースを通じて複雑なタスクを解決するが、完了したトレース内のエラーを見つける能力はまだ遅れている。
本稿では,このギャップを解消する手法として,候補となるエラーステップの診断,診断固有のパッチによるリプレイによるテスト,および検証結果のフリップを比較的証拠として用いて最終帰属を洗練させる手法を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:11:57 GMT)
Can Data Work be Reparative? [10.9] 市民技術イニシアチブは、オンライン安全システムのためのデータセットを構築している。
フェミニストの観点からは、オンラインの安全に関する懸念に答えることを目指している。
プロセスで遭遇する苦労をトレースする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:25:35 GMT)
MeCo: One-Step MeanFlow-based Corrector for Multi-Channel Speech Separation [10.6] MeanFlowベースの一段階生成補正(MeCo)は条件平均速度場を学習し、識別的推定値をクリーン音声多様体に直接マッピングする。
MeCoは最小の計算オーバーヘッドで最先端(SOTA)性能を達成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:58:31 GMT)
Diffuse AI Control on Fuzzy Tasks [10.5] ディフューズAIコントロール(Diffuse AI Control)は、長期展開地平線上に分散されたAIサボタージュによるリスク軽減に関わる、AI安全性のサブフィールドである。
青チームと赤チームの間の対戦ゲームとして,AI制御を考慮した新しいフレームワークを導入する。
我々は、Opus4.6が、GPT-OSS-20Bよりも根拠となる真理プロキシに従って、より悪い提案を書けることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 00:35:48 GMT)
Graph Mamba Operator: A Latent Simulator for Interacting Particle Systems [10.4] グラフに基づく相互作用学習と状態空間モデルを統合する潜在空間シミュレータであるGraph Mamba Operator (GraMO)を紹介する。
GraMOはグラフベースのインタラクションと時間状態の更新を,単一のリカレンス内で結合する。
我々は,N体システム,モーションキャプチャ,ロボットのデータセット上でGraMOを評価する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:42:10 GMT)
Reason Twice: Segmentation via Candidate Discovery and Comparative Reasoning [10.2] マスク生成と選択のための2段階フレームワークRea2Segを提案する。
このフレームワークは、まず、セグメンテーションMLLMのアテンションマップに基づいて、潜在的領域を候補マスクとして識別する。
次にMLLMを使って質問と候補者のマスクを推論し、各マスクにスコアを割り当てる。
最終セグメンテーション結果は、候補を再ランクし、最高スコアマスクを選択することで得られる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:10:55 GMT)
FuseFSS: Efficient Secure LLM Inference with Function Secret Sharing [10.2] 演算子ごとのプロトコル設計を単一のコンパイルパイプラインで置き換えるコンパイラであるFuseFSSを提案する。
現在の最先端のFSSベースのGPUセキュア推論と比較すると、FuseFSSは精度を保ちながら、1.24times$--$1.50times$エンドツーエンドのスピードアップを達成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:30:00 GMT)
Optimizing Energy-based Neural Network Training with Coherent Ising Machine [10.1] 我々は、コヒーレントイジングマシン(CIM)を利用して、エネルギーベースのニューラルネットワークをトレーニングする。
我々は、ホップフィールドエネルギーネットワークの基底状態を解決するためにAdamを統合することで、アルゴリズムをさらに強化する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:11:37 GMT)
"Where is this coming from?" Uncovering Trustworthiness Ideals in AI-powered Peripartum Information Seeking [10.1] 現在のAIとNLPは、獣医の健康情報へのアクセスを改善することを目的としている。
歴史的不平等によって形成された高い健康状況において、信頼性は検査可能であり、主張されない。
本稿では,不信を意識したデザインアーティファクトを提案し,透過的かつ多元的AIシステムに対する原則的ガバナンスメカニズムを促進する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:36:57 GMT)
CAMF-Det: Closure-Aware Multimodal Fusion for LiDAR-Camera 3D Object Detection on UAV Platforms [9.9] LiDARとカメラを用いたマルチモーダル3Dオブジェクト検出は,地上車両のシナリオにおいて優れた性能を示した。
UAVプラットフォーム上でのLiDARカメラ3Dオブジェクト検出のためのクロージャ対応マルチモーダル融合フレームワークであるCAMF-Detを提案する。
我々は、CAMF-Detが全ての難易度で最高のパフォーマンスを達成し、ハードレベルのmAP$_mathrmBEV$9.43%と4.88%の最高の競合手法で改善したことを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:40:17 GMT)
Do Value Vectors in Deep Layers Need Context from the Residual Stream? [9.9] Bank of Values(BOV)は、トークン固有の値ベクトルのルックアップテーブルを、最後の3分の1のレイヤ毎に学習することで、注目されている価値ベクトルを計算するための新しい方法である。
BoVは標準的な注意力よりもバリデーション損失を改善し、780Mでは21ベンチマークの平均スコアが以前のベストメソッドと一致している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:30:37 GMT)
Stabilizing On-Policy Distillation for MLLM Reasoning with Global Normalization [9.9] オンライン蒸留(OPD)がポストトレーニングの重要なパラダイムとして最近登場した。
我々は,生のKLスコアをバッチレベルの相対的優位性に変換することで最適化を安定化する実用的な方法として,グローバル正規化蒸留政策最適化(GNDPO)を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:41:31 GMT)
Toward Compiler World Models: Learning Latent Dynamics for Efficient Tensor Program Search [9.9] 本稿では,プログラム状態に対する動作条件付き潜在ダイナミクスとしての評価をスケジュールする評価器を提案する。
提案手法は,GPUで1.37$times$,CPUで1.54$times$,Ansorで64-trial budgetで1.37$times$の改善を行う。
また、PyTorch/PyTorch-opt(cuDNN)に対するフルモデル推論を4.61$times$/3.67$times$ometric meanで高速化する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:17:27 GMT)
Operation Mpemba effect: Breakdown of resource-Markovianity of free dynamics [9.8] ムペンバ効果(ムペンバせい、Mpemba effect)は、当初は平衡から遠い状態の緩和である。
我々は、量子リソース理論への量子マルコビアン性の拡張概念であるリソースマルコビアン性を紹介する。
結果は、量子資源、非マルコビアン性、およびMpemba効果の間の深い相互作用を明らかにする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:44:55 GMT)
Illumination-Invariant Anomaly Detection for Sub-Canopy UAV Multispectral Point Clouds [9.8] 照明の変動を頑健に扱える事前自由な異常検出フレームワークを提案する。
この枠組みは特に、カモフラージュされた軍事目標の特定、倒れた木の幹のマッピング、考古学的遺跡の発掘に適している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:04:26 GMT)
What the Eyes See, the LLMs Miss: Exploiting Human Perception for Adversarial Text Attacks [9.7] 大規模言語モデル(LLM)を利用したコンテンツモデレーションシステムは,有害なオンラインコンテンツに対して重要な防御手段となっている。
人から有害と容易に認識されるコンテンツは、自動モデレーションシステムでは効果的に見えなくなる。
我々は、有害な表現を良質なテキストに埋め込むHPAA(Human-Perceptible Adversarial Attacks)のクラスを導入する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:21:34 GMT)
Learn to Match: Two-Sided Matching with Temporally Extended Feedback [9.7] 両面のマッチング市場は、インタビュー、繰り返しのインタラクション、学習、分離を通じて、時間とともに広がる情報を含むことが多い。
両面マッチングを部分的に観測可能なマルコフゲームとして定式化して,コストのかかる事前チェック,ノイズの多い後処理,潜伏プロファイルの進化,内因性継続や溶解といった,時間的に拡張されたフィードバックを持つフレームワークを提案する。
動的マッチング市場のためのマルチエージェント強化学習ベンチマークであるLearn2Matchで、このフレームワークをインスタンス化する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 23:16:36 GMT)
A Large Scale Open-Source Image and Video Dataset for Robust Wildfire Detection and Classification [9.6] GWFP(Global Wildfire Prevention dataset)は、山火事の画像とビデオの大規模かつオープンソースのデータセットである。
GWFPには、火炎、煙、ウォータードッグ/フォッグの環境条件、近赤外線(NIR)画像、エンバー、現実世界のシナリオから収集された挑戦的な負のサンプルなど、地理的に多様な山火事シーンが含まれている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:07:53 GMT)
ATTAIN: Automated Exploit Failure Analysis through Trace-Driven Diff Analysis [9.6] ATTAINはトレース駆動の差分分析フレームワークで、進化を続けるライブラリバージョン間の脆弱性の存在を評価する。
ATTAINのF1スコアは93.24%で、コミットベースの手法であるV-SZZとLLM4SZをそれぞれ116.28%、LLM4SZを33.30%上回る。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:49:50 GMT)
Counterfactual Transport Flows for Offline Conservative Trajectory Refinement [9.6] 本稿では,世界フィードバックによるオフライン意思決定のためのソース条件付き軌道修正フレームワークを提案する。
AntMaze や MuJoCo タスクを含む D4RL ベンチマークの実験では,世界からのフィードバックとして過去のリターンから行動を改善する方法が示されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:11:03 GMT)
Local Preferential Bayesian Optimization [9.6] 我々は,鍵アイデアを高次元BOから優先的な設定に伝達する局所的なPBO手法のファミリーを開発する。
特に、信頼領域とデリバティブインフォームドローカル検索を相互に選好フィードバックに適応させるローカルPBO手法を提案する。
GPサンプルパス,標準最適化ベンチマーク関数,ポリシ検索タスクのベンチマークでは,局所的なPBO手法が特に高次元・複雑な景観に有効であることが示されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:36:02 GMT)
Claw-R1: A Step-Level Data Middleware System for Agentic Reinforcement Learning [9.6] 本稿ではエージェントRLのための対話型ステップレベルデータシステムであるClaw-R1を提案する。
Claw-R1は、異種エージェントランタイムとRLトレーニングバックエンドを2つのコアコンポーネントを介して接続する。
デモでは、ユーザはインタラクティブにライブの軌跡を検査し、各ステップの状態、動作、報酬を調べ、品質と準備性によってデータをキュレートし、トレーニング可能なバッチを設定することができる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:35:18 GMT)
Should Demand Models Incorporate Competitor Prices? Oblivious Learning and Algorithmic Collusion [9.5] 競争相手の価格を故意に無視する戦略上の曖昧さは、結束的な成果を促進し、利益を向上させる可能性があることを示す。
すべての売り手が不利な時に市場ダイナミクスを特徴付け、十分な探索の下で価格が競争結果に収束することを示す。
この結果から, 衝突パターンは頑健ではなく, 難解なモデリングでは持続できないことが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 00:27:34 GMT)
Characterizing the Impact of NVFP4 Quantization for Low-Power Edge AI Deployment [9.5] エッジでのエネルギー効率のよいニューラルネットワーク推論では、演算コスト、メモリトラフィック、エネルギ、ストレージオーバーヘッドを削減し、許容できる精度を維持する必要がある。
本稿では,エッジ効率ニューラルネットワークにおけるNVFP4量子化のアブレーションに着目した研究を行う。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:25:22 GMT)
Self-Paced Curriculum Reinforcement Learning for Autonomous Superbike Racing in Simulation [9.4] 本稿では,物理精度の高いUnityベースのバイクシミュレータであるVRider SBKで,スーパーバイクをレースする自律エージェントを訓練するためのフレームワークを提案する。
SPDLは, トレーニング効率, ラップタイム, 運転安定性において, 複数のトラックおよびバイクモデルにおいて, SAC単独よりも優れていた。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:14:12 GMT)
Compiling Rewrite Rules to Finite-State Transducers with the Worsening Trick [9.4] 本稿では「ウォージングトリック」に基づくコンパクトなコンパイル方式を提案する。
すべての法的書き直し候補を生成し、同じ入力に対して他の候補よりも悪い候補をフィルタリングする。
結果として得られる公式は短く均一であり、意味論が一致する場合は、以前のアプローチと同じルールトランスデューサを再現する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:36:39 GMT)
Proposal Refinement for Few-Shot Object Detection [9.4] 本稿では,新しいクラスと基本クラス間の領域提案の不均衡分布の問題に焦点をあてる。
提案手法は,提案手法を従来のベンチマークで約1%$sim$6%向上させる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:20:32 GMT)
Multi-View Speech Representation Learning for Parkinson's Disease Detection Using Context-guided Cross-modal Attention [9.4] 本稿では,パーキンソン病の自動検出のためのマルチブランチ深層学習フレームワークを提案する。
提案したアーキテクチャは91.51%の精度、F1スコアは91.24%、AUCは95.97%である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:39:33 GMT)
RTL-BenchLS: A Large-Scale Benchmark for RTL Reasoning and Generation with Large Language Models [9.4] LLMベースのRTL生成と推論は、ハードウェア設計の自動化にとって有望な方向である。
既存のRTLベンチマークは、スケールとタスクスコープの両方に固有の制限に直面している。
両制約に対処する大規模ベンチマークであるRTL-BenchLSを導入する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:21:33 GMT)
An Infectious Disease Spread Simulation Based on Large Language Model Decision Making [9.4] 我々は、独立推論、家庭の影響、メッセージフレーミングの3つの意思決定シナリオを実装し、比較し、サンフランシスコとアトランタにおける自己報告の結果をシミュレートする。
結果は、収入と教育が、地理、LLMモデル選択、メッセージフレーミングによるより小さいが一貫した影響で、報告率の変化の主要な要因であることを示している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:54:07 GMT)
Guide Me Out: A Framework to Benchmark VLM Operators Communication in Crisis Scenarios [9.3] 我々は,シミュレートされた避難を通じて民間エージェントを誘導するビジョン・ランゲージ・モデル(VLM)を評価する。
我々は,2つの通信戦略(ナローキャスト対ブロードキャスト),2つの環境表現(視覚対グラフベース)と2つの脅威行動(静的対移動)を,構造的複雑さの異なる9つのマップで検証した。
以上の結果から,Narrowcastは,すべての難易度において,Broadcastと比較して文民のフェール率を一貫して低下させることがわかった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:40:26 GMT)
Hyperbolic Neural Population Geometry Benefits Computation [9.3] 最近の経験から、海馬の多代謝構造が個体群活動の基盤となっていることが示唆されている。
我々は,ニューラルデコードと連想記憶の関連性を確立する。
双曲空間で定義された新しい連想記憶モデルを導入する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:57:39 GMT)
Efficient Traffic Prediction at Scale: A Systematic Study of STGCN Architectural Depth [9.3] 単一ブロックアーキテクチャは、4つのデータセットのうち3つの短期予測(10分)に対して最適な性能を達成する。
2ブロックのバリエーションは、CPU推論のレイテンシが61%高く、1ブロックに比べてスループットが37%低い。
3ブロックアーキテクチャは、相対的な改善として0.5%の計算コストを2倍にする以上の、好ましくないトレードオフを提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:23:56 GMT)
Hasse Diagrams for Attention: A Partial Order Framework for Designing Transformer Masks [9.3] 本稿では,任意の注意用マスクの完全な理論的枠組みを開発する。
変換器の情報フローは半順序を表す有向非巡回グラフであるハセ図形に収束することを示す。
フレームワークを応用して、トレーニングと推論の整合性を保証するブロック世代アテンションマスクと、完全に監督された双方向アテンションマスクの2つの新しいマスクを設計する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:27:47 GMT)
Operator learning for solving Fokker-Planck equations with various initial conditions [9.2] フォッカー・プランク方程式(Fokker-Planck equation, FPE)は密度関数の時間発展を記述する上で重要な役割を果たす(PDF)。
本研究では,FPEの解演算子を効率的に近似する条件付き正規化フローベース物理情報ニューラルネットワーク(PINN)フレームワークを提案する。
提案手法の有効性とロバスト性を示すために, 種々の数値実験を行った。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:44:13 GMT)
Beyond Averages: Evaluating LLMs on Human Survey Replication at the Distributional Level [9.0] 韓国のインスタントヌードル購入における非公益消費者選択実験を用いて,2010年調査の再現性を評価した。
我々は、平均レベル、パターン、分布アライメントにおける人間とLLMの反応を比較し、人間のデータのみからの基準ベースラインと比較した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:22:15 GMT)
DUET -- Dual User Embedding Transformers for Offsite Conversion Prediction [9.0] 計算レコメンデーションシステムにおいて,オフサイト変換率(OCVR)予測は重要なランキング問題である。
このタスクは、クリック信号が豊富で、短い時間的水平線を示すのに対して、変換信号は本質的に疎く、長い遅延があり、しばしば未配布である。
ユーザ行動データを2つのドメインコヒーレントなストリーム – クリックと変換 – に明示的に分割するフレームワークであるDUETを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 23:13:58 GMT)
In-Context Learning for Latent Space Bayesian Optimization [8.9] 潜在空間ベイズ最適化(LSBO)は、分子やタンパク質などの構造化対象に拡張する。
潜在コードから客観的値への誘導マップは、現在のインコンテキストモデルのトレーニングに使用される回帰タスクと著しく異なる。
このミスマッチは、表層基礎モデルの事前学習段階と、分子VAEの潜伏空間上で定義された合成最適化タスクを補完することにより解決される。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:45:25 GMT)
OpenGlass: Ultra-Low-Power On-Device AI Eyewear with Event-based Vision [8.9] この研究は、新しいセンサーとアルゴリズムを迅速にプロトタイピングするためのオープンソースのスマートグラスプラットフォームを導入する。
モジュラーデザインはフレキシブルなFPCインターポーザを使用して、完全なPCBなしでイベントベースのカメラとフレームベースのカメラの両方をサポートする。
プロトタイプは200mAhのバッテリーで11.5時間連続したデバイス上でのMLを実現する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:50:28 GMT)
Difference-Aware Retrieval Policies for Imitation Learning [8.9] 行動クローニングによるパラメトリック模倣学習は、一般化の低さからアウト・オブ・ディストリビューション状態に悩まされる。
半パラメトリック検索に基づく模倣学習手法により、推論中にトレーニングデータを再利用することで、この課題を軽減できることを示す。
本稿では,半パラメトリック検索に基づく模倣学習手法であるDARPについて述べる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:18:19 GMT)
Complexity-driven transitions in quantum observation [8.5] 量子観測において、破壊的な測定は古典的なデータに量子状態を不可逆的に投影する。
古典的なデータに量子状態が不可逆的に投影されることを示す。
量子観測を規定する基本的なスケーリング法則と遷移を明らかにすることにより、量子学習、状態認証、量子気象学のリソース境界を明確にする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:27:22 GMT)
CT-VAM: A Cerebello-Thalamic-Inspired Vision-Action Model for Efficient Visuomotor Control [8.5] 本稿では,効率的なタスク条件付き視覚運動制御のための視覚行動モデル(CT-VAM)を提案する。
CT-VAMは、デュアルビューの視覚的観察、プロプレセプション、および軽量タスク条件からアクションチャンクを予測する、コンパクトなローカル実行ポリシーとして機能する。
68万のパラメータしか持たないCT-VAMは、かなり大きなVLAモデルと競合するLIBEROの成功率を達成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:46:43 GMT)
Do Video Foundation Models Understand Intuitive Physics? A Layerwise Probing Analysis [8.4] 凍結表現に直感的な物理情報をエンコードするビデオ基礎モデルについて検討した。
予測結合埋め込みモデル(V-JEPA)、マスク再構成モデル(VideoMAE)、拡散型ビデオジェネレータ(LTX-Video)を比較した。
V-JEPAは、特に時間的ダイナミクスをモデル化するプローブを用いて、ベンチマーク全体で最も強力な総合的な結果を達成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:40:32 GMT)
A Finetuned SpeechLLM for Joint Multi-Granular L2 Assessment and Natural-Language Rationales [8.3] 本稿では,マルチアスペクト・マルチグラニュラーアセスメントのためのルーリック誘導型SpeechLLMを提案する。
このモデルは、文レベル(正確性、流布度、韻律)、単語/音素レベルの精度を共同で予測し、同じ応答で自然言語の論理を生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:27:40 GMT)
ImagineUAV: Aerial Vision-Language Navigation via World-Action Modeling and Kinodynamic Planning [8.3] 無人機のための視覚言語ナビゲーション(VLN)は、部分観測性の下で自由形式の指示を6-DoF飛行に接地することを要求する。
ケースド・ワールド・アクション・モデリングを利用した想像力駆動型フレームワークであるImagineUAVを提案する。
想像上のUAVは、VLNとVLAのベースラインをベンチマークや現実世界の飛行で上回っている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:19:04 GMT)
Interpreting and Steering a Text-to-Speech Language Model with Sparse Autoencoders [8.3] 我々は、CosyVoice3のLMバックボーンにBatchTopKスパースオートエンコーダを訓練する。
テキスト対応のコンテキストや1秒の音声クリップ、あるいはその両方を表示できる。
検索された機能は解釈可能で、音素、笑い、アクセントプロンプト、話者の性別が多岐にわたる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:09:37 GMT)
Automated IEP Generation from Traditional Chinese Parent-Teacher Interviews via Corpus-Grounded Feature Diffusion [8.1] 従来の中国の特殊教育NLPは、ドメインデータの不足、厳格なプライバシー規制、ローカル評価ベンチマークの欠如などにより、ほとんど探索されていない。
コーパスグラウンド機能拡散に着目した低リソース微調整パイプラインを提案する。
このシステムは、従来の中国の特殊教育NLPのギャップに対処し、スケーラブルでプライバシー保護されたローカル推論ソリューションを提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:13:45 GMT)
On Choosing the $μ$ Parameter in Gaussian Differential Privacy [8.1] 我々は、純DP$varepsilon$からGDP$$への原則マッピングを、3つの指標から見て、強敵のメンバシップ推論攻撃の最悪の成功と一致させることで提供します。
有用なパラメータの範囲で$$値を集計し、保守的な汎用変換として$approx varepsilon/5$を推奨します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:56:07 GMT)
Pareto-Guided Teacher Alignment for Fair Personalized Text Generation [8.1] 制約付き多目的アライメント問題としてパーソナライズドジェネレーションにおける公平さの軽減について検討する。
その結果, 公平性軽減効果は客観的依存であり, ドメインやモデルファミリ間で不整合に伝達されることが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:57:13 GMT)
Semi-supervised Source Detection in Astronomical Images: New Benchmark and Strong Baseline [8.0] 我々は18,400の天体画像と728,898のソースインスタンスからなる新しい総合ベンチマーク(LAMOST-DET)を導入する。
そこで我々は,Sparse アノテーションを付与した高密度ソースを効果的に検出できる,Nova Teacher という新しい半教師付き学習フレームワークを考案した。
LAMOST-DETの実験では、Nova Teacherは従来より4.04%、mAPは5.22%改善している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:52:17 GMT)
BUDDY: BUdget-Driven DYnamic Depth Routing for Adaptive Large Language Model Inference [8.0] Buddyは、大規模言語モデルのための予算駆動の動的深度ルーティングフレームワークである。
厳格な予算管理、デコードタイムの再ルーティング、トレーニングされた1つのモデルで複数の予算をサポートする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:06:35 GMT)
See Less, Specify More: Visual Evidence Budgets for Generalizable VLAs [7.9] 一般化は、ヴィジュアル-アクション(VLA)モデルにおける中心的なボトルネックである。
本稿では,よりクリーンなインタフェース下でエグゼキュータをトレーニングすることで,VLAの一般化を改善するためのフレームワークであるS2を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:19:24 GMT)
Frequency Decoupled Framework for Screen Content Image Super-Resolution [7.9] 暗黙的神経表現に基づく手法は、SCISR(Screen Content Image Super-Resolution)において優れた性能を示した。
ファサーの観点からSCISRを再考する周波数分離フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:53:33 GMT)
ArtiFact: A Large-Scale Multi-Modal Cultural Heritage Dataset [7.9] 651045の博物館記録のマルチモーダル文化遺産データセットであるArtiFactを提示する。
クロスモーダルなエラー検出には,130209レコードに挿入された7つのエラーカテゴリの分類法を導入する。
セマンティッククエリ処理では、現在のシステムは、文化的近接性、あいまいなオブジェクトタイプ、歴史的に断続的な用語を含むクエリに苦慮していることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:40:57 GMT)
Robotic Nonprehensile Object Transportation with a Hanging Tray [7.8] ロボットウェイターの問題に先立ち、ロボットはエンドエフェクターによって固く保持されたトレイを傾ける。
我々は、EEからロープで吊るされたトレイを使い、3次元振り子のように振る舞う。
対照的に、実際の吊り皿を使用することで、五角運動の利点を得ることができる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:13:16 GMT)
SIGA: Self-Evolving Coding-Agent Adapters for Scientific Simulation [7.7] グラウンディング層は、一般的なコーディングエージェントを科学ソフトウェアの実用的なオペレータに変えることができる。
我々は主に、地下科学で使用されるオープンソースのマルチ物理シミュレータGEOS上でSIGAを評価した。
その結果、軽量で自己改善可能な接地層は、一般的なコーディングエージェントを実用的な演算子に変えることが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:35:17 GMT)
OpenOpt: An Open-Source SRAM Optimizer Based on Equivalent Circuit Model [7.7] 本稿では,等価回路モデルを用いたアーキテクチャとトランジスタサイズを協調的に最適化する共最適化フレームワークを提案する。
このフレームワークは、不活性なセルを等価なRC負荷と静的パワーモデルに単純化し、最大61.4$times$ シミュレーションスピードアップを達成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:26:06 GMT)
ART: Attention Run-time Termination for Efficient Large Language Model Decoding [7.4] LLM(Long-context Decoding in Large Language Models)は、キーバリュー(KV)キャッシュへのアクセスと処理のコストによって制約される。
本稿では,カーネル実行時のアテンション出力の追跡を行う軽量な実行時機構であるAttention Run-time Termination(ART)を提案する。
LongBenchおよびRULER Needle-in-a-Haystackタスクの実験では、ARTが既存のKV-cacheメソッドの生成スループットを最大20%向上することが示された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:51:37 GMT)
IMAC-AgriVLN: Can Agricultural Vision-and-Language Navigation Agents be Aware of Instruction Mistakes? [7.3] そこで本研究では,各命令に3つの誤り分類を挿入する半自動データアノテータを提案する。
いくつかの最先端の農業用VLN剤を試験し,SRでは57%,NEでは-9%の低下を示した。
本稿では,命令の誤りの有無を判定し,必要に応じて修正しようとするIMACモジュールを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:10:19 GMT)
Temporally Consistent and Controllable Video Generation of 2D Cine CMR via Latent Space Motion Modeling [7.2] 本稿では、時間的コヒーレントかつ解剖学的に整合した心臓配列を合成する生成法を提案する。
我々のモデルは、入力プロンプトに対して高時間的コヒーレンスと強い忠実度で解剖学的および病理学的に多様な配列を生成する。
これらの実験結果は、高忠実でオンデマンドな医療データを生成する可能性を強調し、データの不足に対するスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:05:20 GMT)
Toward Signing Activity Projection in Sign Language Interaction [7.2] 本稿では,VAPアーキテクチャをDyadic手話対話に適応させるための最初のトランスファー研究について述べる。
我々は語彙記号アノテーションからバイナリ署名アクティビティストリームを導出し、ターンテイク予測のためのプロキシタスクを定式化する。
以上の結果から, ShiFT/HOLD予測は特に手技では有望であり, ShiFT予測は依然として困難である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:38:09 GMT)
RadKey: An LLM-Guided RF Backscatter System for Through-Wall Keystroke Inference [7.1] RadKeyはRFバックスキャッターシステムで、秘密、長距離、スルーウォールのキーストロークを盗聴できる。
タグはキーストロークによって誘導される振動と音響信号を捉え、後方散乱されたRF信号の周波数シフトに変調する。
RFリーダは、後方散乱されたRF信号を復調して、型付きコンテンツを推測する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:26:41 GMT)
Convergence Rates for Neural-Network Estimation with Current-Status Data [6.9] 現在の統計データは、イベント時刻が試験時間前に発生したかどうかの指標によってのみ観測されるときに発生する。
本稿では,事象時刻の条件累積分布関数の非パラメトリックニューラルネットワークによる最大推定器について検討する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:51:40 GMT)
Optimality of FSQ Tokens for Continuous Diffusion for Categorical Data with Application to Text-to-Speech [6.9] カテゴリーデータの連続拡散は、拡散族に属するフレームワークであり、離散データを生成することを目的としている。
クルバック・リーバーの発散で表される離散トークンに対応する潜在空間の構造について検討する。
FSQトークン化スキームは、分類データの連続拡散に最適な性質を持つ潜在空間構造を持つ。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:41:24 GMT)
YUBI: Yielding Universal Bidigital Interface for Bimanual Dexterous Manipulation at Scale [6.9] YUBIは、直感的で人間工学的でスケーラブルなデータ収集を可能にするために設計された指のグリップである。
我々は、VRベースの6DF追跡機能を備えたデータ収集システムを構築し、高忠実度トラジェクトリデータ取得を確実にした。
我々は、UMIベースの前例のないスケールのデータセットをキュレートする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 23:21:14 GMT)
AnnotateThis: Analyzing a human-LLM system for annotating social media data with the concept of climate change mitigation pessimism [6.8] 大規模言語モデル(LLM)は研究にますます統合されている。
LLMは、計算社会科学(CSS)研究で見られるような、困難で曖昧な概念に苦しむことが示されている。
LLMアノテーションを検査・改善するための人間中心システムAnnotateThisを開発した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:03:02 GMT)
Awareness of Technological Isomorphism: Integrating AI into Elementary Mathematics Teaching on Data and Prediction,A Case Study of the Compound Line Graph [6.8] 本研究は,新しい中核概念である「技術等化の認識」を提案する。
学生のメタ認知的認識は、自身の数学的認知操作がAI技術操作と基礎となる論理構造を共有することを定義している。
この認識は、学際数学からAI理解への認知的伝達を促進する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:09:42 GMT)
SafeRun: Enabling Determinism in LLM Planning for Running [6.7] 大規模言語モデルは柔軟な自然言語計画を可能にするが、決定論に批判的な領域では信頼できない。
我々は、疎結合アーキテクチャによるLCMに基づく決定論的計画のためのフレームワークであるSafeRunを提案する。
現実的な生理的・安全的制約の下で計画を実行するための総合的なベンチマークを構築します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:53:01 GMT)
Efficient Minimal Solvers for Relative Pose Estimation in Autonomous Driving Applications [6.7] マルチカメラシステムにおける相対的なポーズ推定は,正確な車両位置推定と環境認識に不可欠である。
既存の手法はしばしば高い計算コストを伴い、豊富な特徴マッチングに大きく依存する。
本稿では,新しい翻訳パラメタライゼーションと一階回転近似に基づく,効率的な相対ポーズ推定のための統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:43:53 GMT)
Fully Oblivious Differential Privacy for Frequency Estimation in the Augmented Shuffle Model with Trusted Processors [6.7] DP(Differential Privacy)のシャッフルモデルでは、シャッフルはユーザのデータをランダムに変換し、高い精度とプライバシを実現する。
近年の研究では、既存のシャッフルプロトコルのほとんどは、データ収集者とユーザによる共謀攻撃に弱いことが示されている。
FODP(Fully Oblivious DP)を導入し,様々なTEEサイドチャネル攻撃を防止するためにDPを強化した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:21:42 GMT)
I Was Scrolling and Then I Saw a Pregnant Strawberry [6.7] AIミニドラマ(英: AI minidramas)またはフルーツドラマ(英: fruit dramas)は、人型化されたキャラクターを特徴とする、アルゴリズムで分散されたAIビデオシリーズである。
この論文は、一見無害な美観にもかかわらず、これらのビデオは深くジェンダー化された物語構造を再現していると論じている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:01:11 GMT)
Real-time body pose non-verbal communication with a consistency-based reliability measure [6.6] 本研究では,2次元身体ポーズからコミュニケーション意図の認識を単独で検討する。
身体の動きは特に、リアルタイムの低コストのオン・デバイス通信を必要とするシナリオにおいて信頼性の高い信号である、と我々は主張する。
効果のあるコーパスは、ボディ、顔、音声、テキストを組み合わせ、スケルトン行動認識ベンチマークは、伝達されたメッセージよりも実行されたアクションをラベル付けする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:05:23 GMT)
Neural Legendre-Fenchel transform with Hessian Preconditioning [6.5] この研究は、射影極性としてのルジャンドル・フェンシェル変換の再構成に基づいている。
アイデンティティに近い残余ネットワークは、この単純化されたマッピングを学ぶことができる。
高次元ベンチマークを含む様々な凸関数の実験では、収束率の改善が示されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:21:44 GMT)
Late-Layer Fusion is Enough: Dual-Path Vision Token Routing for Multimodal Large Language Models under Visual Saturation [6.4] マルチモーダル大言語モデル (MLLM) は、通常、非モーダルテキストモデリング用に設計された深い対称トランスフォーマーのバックボーンを継承する。
この設計では、画像とテキストトークンは情報密度、冗長性、必要な推論深度で大きく異なるという、重要なモダリティ非対称性を見落としている。
効率的なMLLMのためのモダリティ非対称なルーティングフレームワークであるDual-Path Vision Token Routing (DPVR)を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:28:14 GMT)
Dual Quaternion-Based Unscented Kalman Filter with Visual Inertial Odometry for Navigation in GPS-Denied Environments [6.3] 本稿では,視覚慣性オドメトリー (VIO) アルゴリズムを用いたDQUKF (Dual Quaternion-Based Unscented Kalman Filter) を提案する。
提案手法はDQUKFを誤差状態で定式化し, 単位二重四元数で表現し, 局所のポーズ誤差を6次元ツイストパラメータ化で表現する。
並行して、VIOアルゴリズムは画像フレーム間の特徴を追跡し、IMUとカメラ間の計測を同期させ、視覚的制約を提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:00:40 GMT)
TheoremBench: Evaluating LLMs on Theorem Proving in Formal Mathematics [6.2] TheoremBenchは、コンテストの設定を超えて定理の証明者を評価するために設計されたLean4ベンチマークである。
このベンチマークは100近い古典的定理から構築され、2つの相補的な形式で解放される。
我々の実験は、明示的な前提がLean4対応の証明モデルの性能を大幅に改善していることを示している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:57:18 GMT)
Driving Video Retrieval for Complex Queries with Structured Grounding [6.2] STRIVE-Dはビデオ駆動のためのデータキャリブレーションされた検索フレームワークである。
クエリルールの信頼性を推定するために、弱いラベル付きドメイン内ビデオを使用する。
最先端の手法に比べて、トップ1の精度が最大84%向上している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:00:33 GMT)
$τ$-Rec: A Verifiable Benchmark for Agentic Recommender Systems [6.1] $$-Recはエージェントレコメンデーションシステムのベンチマークである。
主観評価を、検証可能な報酬と明らかにタグ付けされた引き起こしメカニズムに置き換える。
$$-Recは一貫性のある推論のための体系的なテストを提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:35:45 GMT)
HANDOFF: Humanoid Agentic Task-Space Whole-Body Control via Distilled Complementary Teachers [6.1] HANDOFFは、直感的で、汎用的で、モジュラーで、多様なロコ操作スキルを表現できる、ヒューマノイド全体のコントローラである。
Unitree G1では、HANDOFFは最先端のベロシティ追跡と一致し、最大のロバストなワークスペース操作を提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:17:30 GMT)
Context-Aware Deep Learning for Defect Classification in Atomic-Resolution STEM [6.1] コントラストと合成、ビームエネルギー、検出器幾何を記述するメタデータを統合した文脈認識学習フレームワークを開発した。
文脈変数の条件付けは、欠陥分類を不適切な画像のみのタスクから、よく提示され、物理的にグラデーションされた問題へと変換することを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:36:09 GMT)
RECAP: Regression Evaluation for Continual Adaptation of Prompts [6.1] 生産エージェントシステムは、常に進化する制約に直面し、次の相互作用に従わなければならない。
現在のベンチマークでは、静的制約セットか、評価フィードバックを伴うリアクティブプロトコルのいずれかを前提としている。
本稿では,制約レベルの連続学習現象を測定するベンチマークRECAPを紹介する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:04:00 GMT)
FLOWREADER: Min-Cost Flow Optimization for Multi-Modal Long Document Q&A [6.1] 本稿では,マルチモーダルノードグラフ上で,エビデンスアセンブリをミニコストフロー問題として再設計するFLOWREADERを紹介する。
最適流れは候補エビデンスパスに分解され、コンパクトな非冗長部分集合はエントロピー規則化された複製子ダイナミクスによって選択される。
FLOWREADERはPaperTabとSlideVQAが支配する2つのサブセットで最良である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:31:09 GMT)
Constrained Dominant Sets for Multimodal Document Question Answering [6.1] 長いマルチモーダルな文書質問応答は、取得された量よりも、証拠が読み手に届く程度に制限される。
この研究は、クエリ拡張親和性グラフ上の制約付き支配セットとしてエビデンスを選択するレトリバーを導入する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:27:36 GMT)
Correlation Is Not Enough: Embedding Human Metadata for Individual Causal Discovery [6.0] オフザシェルフのバイオメディカルエンコーダは、答えがゼロに近い場合、無関係なクロスドメインペアをスコアする。
AMXを搭載したIntel Xeon 6737Pでは、OpenVINOはシングルクエリのレイテンシを1367msから10ms (133x)に削減し、毎秒555文に達する。
FP16は、各サービスバッチサイズにおいて、このシリコン上のINT8を破る。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:54:28 GMT)
Who Earns the Safety? Intervention-Aware Quantum Predictive Control with Safety Attribution [6.0] 安全な政策学習は、誰が安全(政策や保護層)を得るかを問うべきだと我々は主張する。
我々は、IA-VQC-DPC(Intervention-Aware Variational Quantum Differentiable Predictive Control)を導入する。
クローズドループ、高忠実なBOPTESTビルディングコントロールエミュレータでは、介入認識トレーニングは量子ポリシーの生のフィルター前違反を著しく低減する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:39:22 GMT)
Beyond Spherical Harmonics: Rethinking Appearance Models for Radiance Reconstruction [6.0] ビューに依存した外観モデリングは、新しいビューの合成と再構築において難しい問題である。
高速な外見効果の効率的なモデリングと学習を可能にする新しい球面定式化法である正規化異方性球面ガボル関数を開発した。
我々の機能は、最大5倍のメモリ効率と評価効率を保ちながら、グリントのようなビュー依存現象の高品質な再構築を実現する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:50:41 GMT)
SecureClaw: Clawing Back Control of LLM Agents [6.0] ツールを使用する大規模言語モデル(LLM)エージェントは2つの異なるセキュリティ障害に直面している。
本稿では、エフェクトシンクに認証を配置し、リードバウンダリにプレーンテキストを閉じ込めるデュアルバウンダリアーキテクチャであるSecureClawを提案する。
AgentDojo、AgentLeak、Agent Security Bench (ASB)、SecureClawは、私たちが共通のハーネスで評価する唯一の防御です。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:29:01 GMT)
Discovering Functionally Selective Brain Regions with a Deep Topographic Multimodal Model [5.9] 最近の地形モデルは、この構造の側面を再現するが、一様であり、各層を個別に空間的に拘束する。
Topo-Omniは、視覚、聴覚、言語/認知処理が一つの連続したシリコンシートを共有するマルチモーダルモデルである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:31:50 GMT)
Preserving Plasticity in Continual Learning via Dynamical Isometry [5.9] 非定常性下での深層ニューラルネットワークの継続的なトレーニングは、可塑性の進行的な損失をもたらし、最終的にはさらなる学習を制限する。
実験的なニューラルカーネルに可塑性を関連付け,動的アイソメトリーを連続学習における可塑性保存の鍵となるメカニズムとして同定する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:24:15 GMT)
Fisher-Guided Progressive Parameter Selection for Adaptive Fine-Tuning [5.8] TextbfFisherAdapTuneはFisherジオメトリの時間的ドリフトを追跡することでパラメータ群を選択するFisher-Guided Adaptive Fine-Tuningフレームワークである。
我々は,下流セグメンテーションタスクに対するアプローチを評価し,FisherAdapTuneが複数設定で分散性能とゼロショット転送を改善したことを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:35:11 GMT)
Unsupervised Style Representation Learning for AI-Text Detection via Paraphrase Inversion [5.8] 我々は、その機械生成パラフレーズから人間によるテキストを再構築するスタイルエンコーダを訓練する。
学習した表現を2つの検出戦略により評価する: 数発の検知器と0発のDeepSVDDベースの検出器である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:28:52 GMT)
Near-projective GHZ certification from disjoint Bell measurements [5.7] 我々は,(n)-量子グリーンベルガー-ホーネ-ゼーリンガー状態に対して,解離した2量子ビット測定のみを用いた単一コピー検証プロトコルを提案する。
驚いたことに、単純な効果は完全完全性と検証スペクトルギャップ(_mathrmBM(n)=1O (1/n))をもたらすので、プロトコルは(n)が大きくなるにつれて理想的な射影に近づく。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:23:17 GMT)
Addressing Market Regime Changes and Heavy-Tailed Returns in Portfolio Optimization via Bayesian VAR and Elliptical Black-Litterman [5.6] 本稿では,高脂肪率リターンを考慮したポートフォリオ最適化のための深層強化学習アルゴリズムを提案する。
このアルゴリズムは最先端の手法よりも優れており、シャープ比が1.72、ソルティーノ比が2.70、トータルリターンが57.26%である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:58:11 GMT)
ReGIL: Retrieval-Guided Imitation Learning from a Single Demonstration [5.5] ReGILは、単一のデモを外部メモリとして扱う、検索誘導の模倣学習フレームワークである。
実ロボット実験では、1つのデモンストレーションと1時間未満のオンライントレーニングを使用して、ReGILは75%以上の成功率を達成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:57:17 GMT)
AI Scientists Are Only as Good as Their Evidence: A Stratified Ablation of Proprietary Data and Reasoning Skills in Drug-Asset Valuation [5.4] 生産評価エージェントに制御された3本腕のアブレーションを実行する。
A は Web のみの LLM アナリストであり,B にはパブリックな構造化ツールと 14 次元のバリュエーションプレイブックが追加されている。
C言語には独自のパイプライン、トライアル、インテリジェンスを備えたNoah AIコーパスが追加されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:31:32 GMT)
Spatiotemporal Graph Transformer for 3D Neighborhood Interaction and Quality Prediction in Metal Additive Manufacturing [5.4] 本研究では,3次元近傍相互作用をモデル化する新しいグラフ変換器を開発し,金属添加物製造における構築品質への影響を学習する。
提案手法は, プロセス品質の関係を特徴付ける上で, 画像ベース, シーケンスベース, グラフベースモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:39:13 GMT)
LargeMonitor: Monitoring Online Task-Free Continual Learning via Large Pretrained Models [5.3] オンラインタスクフリー連続学習(TFCL)では、インテリジェントエージェントが非定常データストリームからの知識を逐次蓄積する必要がある。
既存のオンラインTFCLパラダイムは、トレーニング結合された最適化ダイナミクスによって駆動されるパラメータ効率の高いプロンプトチューニングや動的構造拡張に依存している。
我々は,タスクフリーな継続的適応を自律的にオーケストレーションするために,大規模な事前学習基盤モデルを活用するフレームワークであるLargeMonitorを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:41:15 GMT)
Proof of Source of Funds: Efficient On-chain Provenance of Cryptoassets [5.2] Proof of Source of Funds (PoSoF) は,ユーザの負担をシフトする新しい暗号フレームワークである。
PoSoFは検証可能な暗号証明を提供し、中間トランザクショントポロジをリークすることなく、資金の正当性を保証する。
私たちのベンチマークでは、完全にプライベートでプロアクティブなコンプライアンスが極めて実践的であることが示されています。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:07:02 GMT)
SemDINO: A DINOv3-Driven Network for Cross-Temporal Semantic Alignment in Change Detection [5.2] SemDINOは、エンドツーエンドのセマンティックチェンジ検出ネットワークである。
デュアルブランチエンコーダ、マルチスケールの時間的相互作用、意味的浄化、変更の強化、分離されたマルチタスク予測を統合している。
パブリックリモートセンシングCDデータセットの実験により、SemDINOは最先端の手法に対して優れた性能と一般化能力を発揮することが示された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:32:31 GMT)
Order Matters: Unveiling the Hidden Impact of Macro Placement Sequences via Proxy-Guided LLM Evolution [5.2] 本稿では,マクロ配置順序戦略を自動的に検出するプロキシ誘導フレームワークを提案する。
OrderPlaceは静的スコアリングメトリクスから動的物理に着想を得たメカニズムまで、幅広いコードレベルのポリシーの空間を探求している。
WireMask-EAと最先端のEGPlaceと比較して、OrderPlaceはワイヤの長さをそれぞれ34.04%、14.08%削減する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:10:07 GMT)
From 0-to-1 to 1-to-N: Reproducible Engineering Evidence for MetaAI Recursive Self-Design [5.1] 再帰的自己設計(Recursive self-design)とは、AIシステムが構築、評価、改善されるメカニズムのAI支援による修正である。
本稿では、MetaAIを成熟したパラダイムではなく、人間種、AI拡張型開発パターンのワーキング用語として扱う。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:45:15 GMT)
MAAM: Anchor-Preserving Compression and Contextual Calibration for Chinese Discriminatory Language Detection [4.9] 我々は,機能的視覚的ぼかしに触発された軽量でモデルに依存しないMAAM(Myopia-Astigmatism Anchor Mechanism)を提案する。
また、中国初のLGBT中心の差別言語データセットであるChLGBTについても紹介する。
強いエンコーダのベースラインを越えて、MAAMは3つの予測次元を改良し、精度、F1、ブライアスコア、期待校正誤差が一貫した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:07:16 GMT)
STaR-Quant: State-Time Consistent Post-Training Quantization for Diffusion Large Language Models [4.9] 本稿では,DLLMのための状態時間一貫したPTQフレームワークSTaR-Quantを提案する。
STaR-Quantは、強いPTQベースライン上での低ビット重量活性化量子化を一貫して改善する。
最大1.69倍のスピードアップと3.14倍のメモリ節約を実現している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:41:05 GMT)
A Multi-Agent System for IPMSM Design Optimization via an FEA-AI Hybrid Approach [4.8] 内部永久磁石同期モータ (IPMSM) の設計は、競合する目的と多重物理制約のバランスを必要とする。
本稿では,構造化問題定義のための検索拡張生成(RAG)を統合したエンドツーエンドの自動IPMSM設計最適化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:07:46 GMT)
Multi-Level Analyzation of Imbalance to Resolve Non-IID-Ness in Federated Learning [4.8] クラス不均衡は、パフォーマンスを著しく低下させるディープラーニングにおける一般的な問題である。
我々はPNB損失関数とCBR損失関数の2つの主成分からなるFedBBを提案する。
X線および自然画像データセットに関する様々な実験により、FedBBはパフォーマンスと効率の両方で他のアルゴリズムより優れていることが示されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 23:36:29 GMT)
Steganography Without Modification: Hidden Communication via LLM Seeds [4.7] 広範にデプロイされたLarge Language Model (LLM) 推論スタックは,モデル重み付けやサンプリングコード,出力分布の変更を必要としない,ステガノグラフィーチャネルを備えていることを実証する。
送信者は、生成前にPRNGシードにシークレットメッセージをエンコードし、受信機は間隔を再構築してシードを回収する。
既知のプロンプト設定では、完全な232候補空間からの完全な32ビットのシードリカバリは、モデルとテキスト領域によって最大100%の精度を達成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:32:44 GMT)
Loss-Guided Adaptive Scale Refinement for Molecular Force Prediction [4.7] 本研究では分子間力予測のための損失誘導適応型スケール改善フレームワークを提案する。
ロス誘導更新は、自動的に中間スケールを生成し、継続的なオラクルのパフォーマンスを回復する。
結果は、分子表現学習の有望な方向として適応的なスケール改善をサポートする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:39:02 GMT)
EnclaveScale: Hardware-Assisted Edge-DP for Secure Data Centre Power Telemetry [4.5] EnclaveScaleは、分散ハードウェア支援のテレメトリアーキテクチャで、抽出後の検証を提供する。
DCAP,差分プライバシーノイズ注入,ビザンチン拒絶を利用した抽出後パイプラインの実装と評価を行った。
E EnclaveScaleは、1.3ドルというダイナミックなオーケストレーションマージンエラーを、正直なアグレゲータ中央DPベースラインの0.1ドルに対して達成している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:55:57 GMT)
ATN3D: Density-Aware LiDAR-Radar Early 3D Object Detection Under Extreme Sparsity [4.5] 3Dオブジェクト検出は、自動車両の知覚のバックボーンである。
長距離検出は、感覚証拠が希少であるため困難である。
Ask The Neighbor' (ATN3D) をスパースレンジ条件に適したLiDAR-Radarフレームワークとして提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:32:29 GMT)
Transition-Based Digital Twin Modelling for Alzheimer's Disease under Sparse Longitudinal Data [4.4] アルツハイマー病(AD)の進行は非常に異質であり、通常はスパースと不規則な経時的データによって観察される。
多モード長手データを用いたAD予測とシナリオベース分析のための個人化ディジタルツインフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:54:10 GMT)
MUDIDI: A Two-Stage Framework for Multilingual Dictionary Digitization with Language Models [4.4] MUDIDIは多言語辞書のデジタル化のための2段階のフレームワークである。
我々はOCRシステム、汎用大言語モデル、ビジョン言語モデルをベンチマークする。
辞書導入などの追加情報を補足することで,デジタル辞書の品質が向上することを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:44:47 GMT)
Flow Control: Steering Vision-Language-Action Models with Simple Real-Time Inputs [4.4] 本稿では,キーボードなどの汎用入力を通じて,VLAアクションをリアルタイムに操る簡便かつ効果的な方法として,視覚言語アクション(VLA)モデルのフロー制御を導入する。
比較的粗いユーザ入力により、VLAをユーザの意図に合わせることができる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:16:37 GMT)
Understanding How Enterprises Adopt the Model Context Protocol for LLM-Driven Software Engineering [4.3] 大規模言語モデル(LLM)は、AIベースのソフトウェアエンジニアリングでますます使われているが、複雑なタスク実行とマルチツール調整における制限により、モデルコンテキストプロトコル(MCP)への関心が高まっている。
既存の研究は主にMDPの技術設計に焦点を合わせており、企業でどのように採用され使われているかという実証的な証拠は限られている。
このギャップに対処するため、インターネットおよび金融分野8社の実践者20人と半構造化インタビューを行った。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:20:50 GMT)
NutriMLLM: Multimodal Large Language Models for Dietary Micronutrient Analysis [4.3] 既存のマルチモーダル大規模言語モデル (MLLM) は, 包括的マイクロ栄養素推定では信頼性が低いことを示す。
専門家のアノテーションを伴わずにこのギャップに対処するため、私たちは、テキスト・ツー・イメージ生成のための構造化プロンプトとして、24時間の食事リコールを10年間再利用した。
このパイプラインは、約1100万枚の画像記述栄養三重項からなる合成コーパスを生成し、それぞれが生成された食品イメージと65個の栄養ラベルをペアリングした。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:50:08 GMT)
vesselFM-CT: Segmenting All Blood Vessels in CT Images for System-Level Cardiovascular Analysis [4.3] 本稿では,3次元CT画像に全血管を頑健に分割できる第1モデルである血管FM-CTを紹介する。
血管FM-CTはすべてのベースラインを上回り,CT画像から心臓血管系の自動的,正確な抽出を可能にした。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:19:58 GMT)
Can we stabilize an inverted pendulum with feedback from a time-of-flight camera? [4.2] 高速で不安定なダイナミックスのための標準ベンチマークであるカート上の倒立振り子を確実かつ正確にバランスさせるのに十分なフィードバックを、安価で低解像度の飛行時間カメラが提供することを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:14:48 GMT)
Demonstration of a Spherical Penning Trap for Single Electrons [4.2] 球状ペニングトラップは、よく分離されたクリーンなマイクロ波共鳴を持つ。
球状ペニングトラップにおける単一電子トラップを実演し、そのマイクロ波共鳴構造を特徴付ける。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:44:37 GMT)
BSTabDiff: Block-Subunit Diffusion Priors for High-Dimensional Tabular Data Generation [4.2] BSTabDiffは、$m$の観測された機能を$M$の潜在ブロックに分割するブロックサブユニット生成フレームワークである。
BSTabDiffはより現実的で安定した高次元合成データを生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:30:34 GMT)
Impact of the Unruh effect on the estimation precision of Gaussian channel parameters [4.1] ガウスチャネルパラメータの推定精度に及ぼすウンルー効果の影響を解析する。
本研究は,相対論的文脈下での量子パラメータ推定を推し進めるための重要な理論的洞察と実践的ガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:10:08 GMT)
DECSELFMASK: Leveraging Unlabeled Text via Self-Relevance-Guided Masking for Decoder-Only Classification [4.1] DecSelfMaskは、分類タスクにおけるデコーダのみのパフォーマンスを向上させるアプローチである。
モデルを活用して、ラベルのないデータからトレーニング例を作成することで、一般的な自己学習アプローチを構築します。
イタリア病院の1.9万件の診療ノートから136件の業務に対してアプローチを検証した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:21:42 GMT)
Does Normalization Choice Matter for Causal Large Time-Series Models? [4.0] 本研究では,トランスフォーマーをベースとした大規模時系列モデルの正規化戦略を,パッチ処理と効率的な因果戦略で訓練した上で評価する。
正規化選択がトレーニング収束と予測性能に大きな影響を及ぼすことを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:51:56 GMT)
GenEyePose: Patient-Free, Knowledge-Based Saccadic Eye Movement Modeling for Digital Neurophysiologic Biomarker Development [3.9] ササードを含む眼球運動は、神経生理学的状態の非常に敏感で客観的なバイオマーカーとして広く見なされている。
現在、プライバシー問題やデータセット不足による脳の異常のスクリーニング、トリアージ、ローカライズのための、堅牢なAI対応ビデオ電図ソリューションはありません。
全身性ササード解析のための完全合成, 患者なし, マルチモーダル眼球運動生成パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:01:27 GMT)
Next-Token Prediction Learns Generalisable Representations of Sleep Physiology [3.8] 我々は8つの異なる感覚モードを用いて訓練された睡眠基盤モデルであるHypnosを開発した。
残差ベクトル量子化を用いて各モダリティを離散トークンのストリームにトークン化する。
大規模自動回帰RQ-Transformerをトレーニングし、並列な全モードにわたって次のトークンを共同で予測する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:13:57 GMT)
AliyunConsoleAgent: Training Web Agents in Real-World Cloud Environments via Distillation and Reinforcement Learning [3.8] AliyunConsoleAgentは、現実世界のクラウドコンソールにおける自動ドキュメンテーション検証のためのフレームワークである。
我々のモデルは、機械的な指示から、クラウドコンソールと製品固有の理解による自律的な意思決定へと進化する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:55:42 GMT)
Dense Force Estimation with an Event-based Optical Tactile Sensor [3.7] イベントベース光触覚センサを用いた高密度3次元力場再構築のための第1のフレームワークを提案する。
本稿では, イベントデータから3次元表面変位を推定し, 逆有限要素法(iFEM)を用いて力にマッピングする。
実験では、(4N、4N、20N)までの力範囲で(0.14N、0.10N、0.93N)の平均的な絶対誤差を達成することによって、物理的に接地された力の正確な再構築が示されている。
本研究は,ロボットの把持・操作における高周波数制御のための高密度力フィードバックの実現に向けた第一歩となる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:57:21 GMT)
SEF-CLGC at SemEval-2026 Task 11: Logical Notation Impact on Language Model Performance [3.6] 本研究では,SemEval-2026 Task 11 Subtask 1: Disentangling Content and Formal Reasoning in Large Language Models上での推論性能を評価するために,形式論理表記とSLM(Small Language Models)を組み合わせる。
実験の結果,自然言語と記号言語の組み合わせで学習したSLMにのみ依存することで,作業内容の27.80%のスコアを達成でき,推論におけるコンテンツバイアスを大幅に低減できることがわかった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:47:57 GMT)
Motion planning for hundreds of floating robots [3.6] 大型ロボットの衝突回避動作の計画は、エージェント間カップリングがチームサイズとともに急速に増加するため困難である。
遷移が数分から数千の時間ステップにまたがる場合でも、数秒で軌道を生成するスケーラブルなツールを提案する。
合成軌道は、チューリッヒ湖の24ウェイ・オブ・ウォーター (24 Way of Water) と、宇宙存在の2025年ビエンナーレ (2025 Biennale) の2つの実世界のデモンストレーションで展開された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:24:50 GMT)
Stage-1 Controls the Entropy Regime, Not the Outcome [3.6] 2段階のポストトレーニングは、視覚言語モデルにますます使われている。
OPD用72B VLM教師を用いたQwen2.5-VL-7Bを用いた小規模データ研究において,Stage-1が実際にどのような制御を行うのかを問う。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:49:09 GMT)
Graph2Idea:Retrieval-Augmented Scientific Idea Generation with Graph-Structured Contexts [3.5] Graph2Ideaは、検索強化された科学的アイデア生成のための知識グラフ誘導フレームワークである。
まず、入力トピックに従って論文を検索し、構造化された知識トリプルに変換し、ターゲット中心の知識グラフを動的に構築し、文学関係を明確にする。
そして、ノイズの多いテキスト入力を減らしながら、目標関連リレーショナルエビデンスを保持する、コンパクトなグラフベースのコンテキストを抽出する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:58:21 GMT)
GAGI: A Gini-Adjusted GDP-per-Capita Index for Distribution-Aware Macroeconomic Welfare Monitoring [3.4] 一人当たりGDPはデフォルトのレンズであり、統治機関は経済の繁栄と経済イベントの結果を追跡する。
我々は、福祉調整による繁栄が、中心的なGDP成長から、絶え間なく、そしてますます遠ざかっていることを示す。
GDPベースのモニタリングには,GAGIが不可欠である,と我々は主張する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:30:20 GMT)
Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models [3.4] 本研究では,文脈拡張型言語モデルシステムが読者モデル行動に与える影響について検討する。
本稿では,500 MMLU-Pro 項目の固定コンテンツプローブについて紹介する。
各項目は、異なる談話ロールラベルの下で同じ誤解を招く答えを持つアサーションを受け取る。
GPT-5.5, DeepSeek V4 Pro, Llama-3-8B-Instruct, Qwen2.5-7B-Instruct, Misleading Adoption Rate shifts by 56-84%
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:40:12 GMT)
Field Validation of a Multi-Resolution ConvLSTM Framework for Retaining Wall Deformation Prediction [3.4] 本研究では,多解像度畳み込み長短期記憶(ConvLSTM)フレームワークの総合的フィールド検証を行い,段階的掘削時の壁面変形の予測を行う。
提案手法は, 韓国の11ヶ所の発掘現場における34個の傾斜計の現地モニタリングデータを用いて検証した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:58:10 GMT)
Stochastic weather generators for high-frequency wind vector time series [3.3] この研究は、オクラホマ州ラモントの現場で、現実的な表面風ベクトルの時系列を生成するための機械学習モデルの開発である。
このような発電機は様々な分野、特に風力エネルギーのモデルへの入力として使用できる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 00:42:51 GMT)
Physics-Aware Sparse Learning and Selective Online Adaptation for Euler-Lagrange Robot Dynamics [3.2] 学習に基づくほとんどの補正手法は, 1つの加算残差を導入することにより, 予測精度を向上させる。
本稿では,モデルミスマッチを慣性補正,対応するコリオリ項,一般化力残差に分解する構造保存残差学習フレームワークを提案する。
移動・航空・マニピュレータシステムを含む複数のロボットプラットフォームを対象とした実験により, 提案手法は, 結合および時間変化の動的条件下での動的予測と軌道追跡を改善することを示した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:36:00 GMT)
Fast Exact Nearest-Neighbor Learning for High-Frequency Financial Time Series [3.2] 市場データ量が株式、FX、オプション、高周波トレーディングストリームにまたがって急増する中、大規模なAI効率は金融において重要になりつつある。
この成長は、成熟した金融AIシステムにとって、中核的な課題を生み出す。モデルは、取引、リスク管理、デリバティブ価格のリアルタイム遅延制約を満たしながら、より大きな歴史的コーパスから学ぶ必要がある。
私たちは、Mojoベースの金融AIがこの課題に対処できることを示す具体的なケーススタディとして、高周波金融時系列の正確な隣り合う学習を使用します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:17:05 GMT)
A Source Domain is All You Need: Source-Only Cross-OS Transfer Learning for APT Anomaly Detection via Semantic Alignment and Optimal Transport [3.0] 本稿では,ソースのみのクロスOSAPT検出問題について,システムレベルのプロファイランストレースを用いて検討する。
本稿では,ゼロ目標監督下での異常対象プロセスのランク付けのためのトランスポートベースフレームワークを提案する。
提案フレームワークはソースのみの異常検出ベースラインよりもROC-AUCとnDCGを改善する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:13:42 GMT)
MosaicIMU: Composing Carrier Experts for Generalizable Neural Inertial Odometry [2.9] 本稿では,キャリア条件のMixture-of-Experts(MoE)プレトレーニング・アンド・アダプティブフレームワークであるMosaicIMUについて紹介する。
MoIMUは、キャリア固有の専門家機能を構成するためにプロトタイプベースのルータを使用し、局所速度と不確実性制約をデコードし、それを履歴対応のEKFと統合する。
実験の結果、MosaicIMUは学習ベースラインを一貫して上回り、平均ATEとRTE-10をそれぞれ40%、RTE-10を34%削減した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:29:52 GMT)
The Chronicles of Radio Frequency Fingerprinting [2.9] RFF(Radio Frequency Fingerprinting)は、レーダーエミッタ識別の初期のアイデアから、無線デバイス識別とセキュリティのためのスペクトル監視のための幅広い研究分野へと発展してきた。
この研究は、1993年から2026年まで、この分野の主要な概念パラダイムシフトを中心に組織されたRFFの批判的な歴史的分析を提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:09:42 GMT)
Interactions Between Crosscoder Features: A Compact Proofs Perspective [2.9] モデル性能のコンパクトな証明をクロスコーダを用いて構築する方法を示す。
この証明で生じる誤り項は、クロスコーダの特徴間の相互作用の尺度として自然に解釈できることを示す。
次に、相互作用尺度によるクラスタリングが意味論的に意味のある特徴クラスタを提供することを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 00:15:44 GMT)
Reliable to Expressive: A Curriculum for Rubric-Following Safety Judges [2.9] 安全審査員は、進化する基準に対してモデルアウトプットを評価するためにますます配置される。
最近のメタ評価研究は、プロンプトとルーブリックの変動下では脆く保たれていることを示している。
本稿では,インスタンス条件の動的ルーブリックと,信頼性と表現性を備えたカリキュラムを組み合わせたトレーニング戦略を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:02:57 GMT)
Culturally-Adapted Red-Teaming Across East and Southeast Asian Contexts: A Methodological and Comparative Analysis [2.9] 我々は,4言語で1:1のシードマッチングを用いて,DTと文化的適応データセットのペアを構築した。
攻撃成功率(ASR)と文化リアリズムのスコアを4つのオープンソース安全評価と比較した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:17:18 GMT)
Generalized Rank-based Evaluation for Knowledge Graph Completion: Perspectives, Framework, and Analyses [2.8] 既存の評価指標では見過ごせない2つの重要な視点をKGC評価に導入する。
本稿では,予測シャープネスのレベルに基づいて,各予測のスコアを推定する一般化評価フレームワーク PROBE を提案する。
PROBEはそのような一貫性をよりよく維持し、既存のメトリクスよりも信頼性の高い本質的なモデル性能を推定できることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:00:38 GMT)
Edge-Constrained UAV Small-Object Detection with P2 Enhancement and Quantum-Inspired Lightweight Structure Search [2.8] 無人航空機(UAV)の物体検出には、小型の物体の詳細をオンボード計算とメモリ制約下で保持する小型検出器が必要である。
本研究では、P2高分解能検出分岐と量子インスピレーション進化アルゴリズム(QIEA)を組み合わせることで、YOLOX-Nanoアンダーエッジ展開制約を分析する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:27:58 GMT)
Generalized-CVO: Fast and Correspondence-Free Local Point Cloud Registration with Second Order Riemannian Optimization [2.8] 高速かつ通信不要なローカルポイントクラウド登録法を提案する。
フレーム・ツー・フレームのLiDARとRGB-Dトラッキングの精度は,様々な屋内および屋外データセットで向上した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:07:11 GMT)
FlexPath: Learned Semantic Path Priors for Image-Based Planning [2.7] 私たちはFlexPathという2段階のフレームワークを紹介します。
最短経路計画では、FlexPathは最先端のTransPathに比べてTMPの検索労力を14.3%削減している。
最小クリアランス距離2の障害物クリアランスでは、探索コストを低く保ちながら96.8%の完全な障害物回避を実現する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:53:11 GMT)
Learning to Attack and Defend: Adaptive Red Teaming of Language Models via GRPO [2.7] Adv GRPOは、密集したマルチチャネル報酬を使用してアタッカーとディフェンダーを最適化するコトレーニングフレームワークである。
提案手法は,高能率かつ移動可能な攻撃を発生させることができ,また,協調訓練されたディフェンダーが安全ベンチマークのベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:21:36 GMT)
Autonomous Obstacle Removal for Excavators through Policy Learning with Particle Simulation [2.7] 提案カリキュラムは,3日以内に有効性能を達成し,実際の12トン掘削機への移動に成功した。
RGB-D測定から地形や障害物情報を観測する時間効率のシミュレート・トゥ・リアルな政策学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:20:52 GMT)
Dual-Branch Gated Fusion for Open-Set Audio Deepfake Source Tracing [2.7] 66次元ディスクリプタであるCORESとXLSR-53を組み合わせたデュアルブランチゲート融合フレームワークを提案する。
MLAADのベンチマークでは、このシステムは97.6%のID精度、4.9%のEERc、83.5%の相対的なFPR95をInterspeech 2025ベースラインで削減した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:22:48 GMT)
PRISM: Recovering Instruction Sets from Language Model Activations [2.6] PRISMは、凍結ターゲットモデルからアクティブ命令の忠実な弾丸リストに隠された状態をデコードするアクティベーション条件付きインタプリタである。
従来のアクティベーション・トゥ・ランゲージ法とは異なり、PRISMは命令セットを直接回復するよう訓練されており、判定誘導されたGRPOを使用して、カバーされた命令を報酬し、サポートされない命令を罰する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:37:46 GMT)
End-to-End Optimization of Incoherent Imaging for Classification Under Detector-Limited Readout [2.6] 本稿では, 物体分類, 中心画像タスクに着目し, 不整合イメージングのための位相マスクのエンド・ツー・エンド最適化により, 性能が向上するかどうかを問う。
これらの利得は、主に制限された検出器の読み出しで発生し、完全な検出器の読み出しでは制限されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:48:14 GMT)
Cross-Modal Masking for Robust Silent Speech Synthesis Using sEMG and Lipreading [2.6] サイレント音声インタフェース (SSI) による音声の復元は, 喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・喉頭・
本研究では,SEMGとLipreading信号とを協調的に活用するマスク付きマルチモーダル音声合成フレームワークを提案する。
複数話者設定下では,最強の単調ベースラインに比べて単語誤り率を最大14ポイント削減する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:50:51 GMT)
Culturally-Aware AI for Cross-Boundary Community Learning: Undergraduate Innovation at the Intersection of Computation and Design [2.5] 教育における人工知能(AIED)の研究は急速に拡大しているが、技術的進歩はしばしば人間中心の基盤を欠いている。
コミュニティベースラーニング(Community-Based Learning)は、社会活動に根ざした教育学であり、AIED研究、特にアジア太平洋の文脈において、いまだに不足している。
本報告では,学部生が文化遺産保存・持続可能な開発のためのAI対応ソリューションを開発するための,コミュニティ・ベース・ラーニングのクロスバウンダリについて述べる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:14:01 GMT)
FMplex: Model Virtualization for Serving Extensible Foundation Models [2.5] 既存のモデル保存システムは、それぞれのカスタマイズされたタスクを独立したモデルとしてデプロイする。
FMplexは、タスク固有の拡張を保持しながら、独自にカスタマイズされたタスクがバックボーンを共有することを可能にする。
7つのFMバックボーンと92のダウンストリームタスクにまたがって、FMplexは最高のコロケーションよりも遅延を80%削減する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:38:16 GMT)
From USD Scenes to Knowledge Graphs: Zero-Shot Ontology Grounding with LLMs [2.5] 大きな言語モデル(LLM)は、ユニバーサルシーン記述シーンの基底ステップを自動化することができる。
LLMは記述的な名前で90-96%の精度で精度を達成している。
セマンティックキューの匿名化は精度を0-6%に減らし、幾何学だけでは4-17%しか得られない。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:32:06 GMT)
Flexible Online Representation Learning Based on Similarity Matching [2.5] スパース高次元表現は、教師なしデータの探索において非自明な構造を明らかにするのに役立つ。
そこで本研究では,スパースシフト不変表現を学習可能なオンライン生物可利用学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:21:29 GMT)
Internalizing Geometric Law: Learning from Solver Residuals for Precision-Critical Generation [2.5] 自然言語からのオープンエンド幾何合成について検討する。
私たちは、宣言的制約を微分可能な損失にコンパイルするプログラマブルな幾何学的DSLであるPyGeoXをリリースします。
本稿では,SAR(Saturating Additive Rewards)を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:44:31 GMT)
Variational Approach for Uniform Quantum Permutation Generators [2.4] 接続制約下での均一な置換生成のための変分量子回路フレームワークを開発した。
直近近傍の位相上の2次回路サイズと線形深さ(O(n))とを正確に均一化できる明示的な制御SWAPに基づくユニタリ構成を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:41:09 GMT)
Decision-Making under Combinatorial Risk [2.4] リスク下での意思決定は、通常単発の宝くじ選択によって研究される。
我々は、リスク下での意思決定を調査するための投資配分タスクを導入し、そこでは、コンポーネントへの投資がその成功確率を高める。
提案手法では,誘導確率質量関数が現れる場合にのみ,その中心となる特徴を通じてリスクをナビゲートし,宝くじ評価にシフトすることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:17:26 GMT)
TruthSplit: Operationalizing Conditional Validity in Arguments Through Multi-Perspective Reasoning [2.3] マルチパースペクティブ・引数解析のための対話型システムであるTruthSplitを提案する。
これは、世界観固有の値、仮定、概念定義を通じて解釈された場合、同じ主張がどのように異なる結論に導くかの探索的分析をサポートする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:23:57 GMT)
Secrets Best Not Shared: DNS Privacy Enhancements for the Constrained IoT [2.3] 攻撃者はよくDNSトラフィックを識別し、インターネットサービスを妨害または侵害する。
資源制約型IoTデバイス向けに設計されたIETFプロトコルについて検討する。
パケット長の等化,ブロックワイド転送,ヘッダ圧縮によるCoAP上のDNSは,DNSフレームの識別精度を86%に低下させることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:22:30 GMT)
Deterministic Execution of ROS~2 Applications via Lingua Franca [2.3] ROS 2のpub-subパターンは本質的に非決定性である。
修正されていないROS 2アプリケーションをFrancaで実行することができるフレームワークを提案する。
コールバックが実行される順序は、デフォルトのROS 2と異なり、エンドツーエンドのレイテンシを持つことを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:37:43 GMT)
Cranio-Diff: Diffusion-based Cross-domain Craniofacial Reconstruction with 2D X-ray Skull Guidance and Structural Identity Constraints [2.3] 本稿では,2次元X線頭蓋骨画像から顎顔面領域を再構築するための拡散型フレームワークであるCranio-Diffを提案する。
提案手法は, 頭蓋骨に意味的かつ構造的に整合した顔を生成するために, ControlNetによる頭蓋骨条件付き構造ガイダンスとバイオメトリックテキストコンディショニングを統合した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:20:35 GMT)
Relocate and Emulate: Re-Hosting Android's Application Layer [2.3] Androidのアプリケーション層の動的解析は、通常物理デバイスに依存します。
実機ファームウェアからエミュレートされた環境に,Androidフレームワークとプリインストール済みソフトウェアを移動させるシステム的再ホスト手法を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:14:38 GMT)
PolyBuild: An End-to-End Method for Polygonal Building Contour Extraction from High-Resolution Remote Sensing Images [2.2] 高解像度リモートセンシング画像から直接ポリゴンを抽出できるPolyBuildというエンド・ツー・エンドの手法を提案する。
提案手法は,ICGM (Initial Contour Generation Module) とCOM (Contour Optimization Module) の2つの主要モジュールを利用する。
結果は、PolyBuildがマスクベースのアプローチや輪郭ベースのアプローチを含む最先端の手法を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:59:36 GMT)
BrainSurgery: Reproducible and Reliable Declarative Weight Manipulations for Model Editing and Upcycling [2.2] 我々は、ニューラルネットワークのチェックポイント上で、堅牢で再現可能な「テンソル手術」のためのツールであるBrainSurgeryを紹介した。
BrainSurgeryは宣言型YAMLプランを通じて複雑な変換を実行する。
構造的変化、数学的変換、表現的および構造的ターゲティングによるテンソル再構成をサポートする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:26:09 GMT)
Temporal Context Conditioning for Seasonality-Aware Precipitation Nowcasting of High-Intensity Rainfall [2.1] 本稿では,特に高強度降雨において,軽量時空間がレーダによる流況改善に有効かどうかを考察する。
KNMIレーダの降水データによる実験では、時空条件付けは希少で高強度の降水イベントにとって最も有益であることが示されている。
これらの結果から, 単純で物理的に動機づけられた時間的文脈は, 深層学習に基づく降水流の現実性と信頼性を向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:28:28 GMT)
Data-aware Static Analysis: Improving Detection of Semantic Faults in Machine Learning Code Using Data Characteristics [2.1] 本稿では,機械学習コード中の意味的欠陥を検出するための静的解析手法を提案する。
このアプローチでは、データと制御フロー分析、APIコントラクトを組み合わせています。
実世界の機械学習ノートブックのサンプルを分析することで、ソリューションの可能性を強調します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:59:41 GMT)
My Chemical Harness: Evolutionary Molecular Design over Synthetic Pathways with Large Language Model Agents [2.1] My Chemical Harnessは、ゴール指向分子設計のためのルートネイティブ進化フレームワークです。
それぞれの経路は、購入可能なビルディングブロックと反応テンプレートから構築され、決定論的化学ツールによって実行され、タスク固有の分子のオラクルによってスコア付けされる。
大規模言語モデル(LLM)は、ルート長、移動型、反応族、モチーフ、探索圧よりも高いレベルの優先順位を選択する戦略コントローラとしてのみ使用される。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 23:52:52 GMT)
Real-Time AttentionBender: Granular Interactive Network Bending of Video Diffusion Transformers [2.1] Real-Time AttentionBenderは、ビデオ拡散変換器(DiT)の全深度にわたるネットワーク曲げのプラクティスを拡張するツールである。
セルフアテンション、クロスアテンション、フィードフォワードネットワークを独立して操作可能な表面として公開する。
ライブ操作の即時性は、我々がモデルに対して「物質的親密性」と呼ぶものを提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:17:08 GMT)
Probabilistically Checking Quantum Proofs, with Interaction [2.0] 我々は、検証者および通信が共に量子オラクルであることが許される対話的証明(qIOP)の量子アナログについて研究する。
我々の主な成果は、全通信が成り立つ言語に対するqIOPであるが、検証者は全キュービットの多元数のみを読み取る。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:59:51 GMT)
MetaPlate: Counterfactual-Guided RAG-LLM Tool for Personalized Food Recommendation and Hyperglycemia Prevention [2.0] 先天性高血糖は代謝異常の重要な危険因子である。
既存の食事指導は静的で、実用的でなく、パーソナライズが不十分であることが多い。
パーソナライズされた食事レコメンデーションを生成するコンテキスト認識フレームワークであるMetaPlateを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:52:08 GMT)
Data augmented bootstrap: Unifying confidence interval construction by approximate invariance [1.9] ほぼ不変なデータ変換から信頼区間を構築するためのフレームワークであるデータ拡張ブートストラップ(DAB)を提案する。
特にDABは、最大平均離散 U-統計量に対する共形予測や自然普遍性など、正確な群対称性に依存する一般的な手法を復元する。
画像,言語,科学データだけでなく,ブートストラップ,ワイルドブートストラップ,共形予測にDAを組み込むことの性能を実証的に検証した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:39:02 GMT)
In-Context Learning for the Imputation of Public Opinion Data with Large Language Models [1.9] In-context Learning (ICL) を用いて, 欠落した調査データをインプットする手法を提案する。
異なる欠陥機構(MCAR, MAR, MNAR)間でのICL設計選択を系統的に評価する。
我々のICLアプローチは、非ランダム欠落(MNAR)の下で最大のゲインを持つ、すべての欠落メカニズムにおける絶対誤差を一貫して減少させる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:25:10 GMT)
SIFT: Selective-Index For Fast Compute of RAG Prefill by Exploiting Attention Invariance [1.9] Retrieval-Augmented Generation (RAG)は、応答品質を改善するために、関連するドキュメントにクエリを注入する。
RAGクエリは、ユーザクエリ間で同じドキュメントが再帰する、コンテキスト再利用のユニークな特性を持っています。
本稿では, SIFT: Selective-Index for Fast Compute of RAG Prefill by Exploiting Attention Invarianceを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:50:13 GMT)
Exceptional Points as Manifestations of Analyticity Breakdown in the 't Hooft Model [1.9] 因果応答関数の解析性を分解するための厳密な実験室として、1+1D大N_c QCDの正確な解像t Hooftモデルを用いる。
PT対称変形は、最低2つの中間子をガンマ_cの例外点(EP)に駆動する。
これは収束ゲージ理論における例外点解析性の分解を解析的に制御した最初の例である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:17:29 GMT)
HydraCIL: Decoupled Class-Incremental Learning through Prototype-Guided Multi-Head Classifiers [1.9] プロトタイプ誘導型マルチヘッド分類器に基づく非結合型連続学習モデルHydraCILを提案する。
以上の結果から,HydraCILはトレーニング時間と炭素フットプリントを大幅に削減しつつ,最先端のCIL手法に適合または優れることを示す。
これは、エネルギー効率と迅速な適応が不可欠である実世界および組み込み環境での継続的な学習のための実践的なソリューションである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:52:21 GMT)
Personal Salience: Highlighting Is Social, but Individuality Lives in Selection [1.9] 我々は、ある人の履歴が他の読者よりも自分の目印を予測できるかどうかを問う。
我々は、一般的なサリエンス(構造)、群衆サリエンス(他者がマークしたもの)、個人サリエンス(個人残量)を分離する。
私たちの結果はリークフリーで、密集した群衆を使い、モデルマッチングコントロールを使用します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:44:51 GMT)
Families of Control-Cost-Parametrized Inverse-Optimal Universal Stabilizers [1.8] 古典的な普遍安定化公式は、実践者が設計の自由を持たず、単一のパラメータフリーなオブジェクトである。
本稿では,(1)ユーザが制御のランニングコストとして機能する関数を,逆最適化のコスト関数で選択する,フィードバック法則を安定化するコストパラメタ化ファミリを提案する。
紙の設計が一般的な「直接最適(HJB誘導)」制御よりも小さいが、完全な逆最適(HJB誘導)制御よりも少ないため、この結果を「半直接最適(half-direct-optimal)」と呼ぶ。
私たちが解決した半間接問題の二重性は、状態のコストが問題である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:34:31 GMT)
LEAF: A Learning-Enabled ADMM Framework for Accelerated Convex Optimization [1.8] コンベックス最適化を高速化するための学習可能なADMMフレームワークであるLEAFを提案する。
入力凸ニューラルネットワーク(ICNN)による目的関数のモローエンベロープの近似
LEAFはスカラー値のMoreauエンベロープを学習し、モデルの複雑さを大幅に低減し、データ効率を向上させる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:44:20 GMT)
Zero-Parameter Geometric Gating for Temporally Stable Low-Altitude UAV Video Semantic Segmentation [1.8] 低高度UAVのためのビデオセマンティックセグメンテーションには時間的一貫性が必要である。
融合前に各領域をホモグラフィーまたは光流ワープにルーティングするゲートを提案する。
合成UAVidでは、ベースモデルよりも+4.24--4.91% mIoUの改善が達成されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:55:31 GMT)
ContextShift: A Controlled Benchmark for Context Dependence in Object Detection [1.8] 我々は、オブジェクトの外観を保ちながら、オブジェクト-コンテキスト関係を操作するベンチマークであるContextShiftを紹介する。
偽陰性は227%まで増加し,予測量は44%まで減少する。
拡張されたすべての変種は、オリジナルの画像と操作されたテストイメージの両方でデータセットのみのベースラインよりも優れています。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:48:16 GMT)
A Guide to Estimating Conditional Average Treatment Effects in Competing Risks Settings [1.8] パーソナライズド医療における条件平均治療効果(CATE)は治療決定の中心である。
競合するリスク設定では、生存データからCATEを推定することで、患者固有の治療効果の評価が可能になる。
競合するリスクシナリオにおけるCATE推定に機械学習アルゴリズムを適用するメタラーナーについて検討する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:58:08 GMT)
Less Context, Better Agents: Efficient Context Engineering for Long-Horizon Tool-Using LLM Agents [1.8] Microsoft Dynamics 365 Finance and Operationsにおける自動経費項目化の問題点について検討する。
ユーザモデル、完全な会話履歴、コンテキストは、最後の5つのツールコール/レスポンスペアにプルーニングされ、自動要約でプルーニングされる。
91.6%が完全なアイテム化、99.64%がアイテム化され、553,374のトークンと5.79時間である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:01:28 GMT)
Quality-Diversity Search in Sound Generation: Investigating Innovation Engines for Audio Exploration [1.7] 本研究は、作曲家や音響デザイナーが音楽的目標を達成するためのツールの作成と精巧化に直面する課題に対処する。
我々は、進化的プロセスを用いて多様性を促進し、セレンディピティーな発見を育み、多様性を促進するアルゴリズムは、理論的実現と音の実用的なアクセシビリティのギャップを埋めることができると主張した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:40:09 GMT)
Decoy-Calibrated Failure Audits for Language Models [1.7] 提案する誤り説明が報告できるほど信頼できるかどうかを判断するための手順であるJanusを紹介する。
ゴールは、新しい説明を生成するのではなく、どの説明を保留するかを決めることである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:33:03 GMT)
Nonlinear Estimator: Dual Bayesian Affine Estimators for Parameter Learning [1.7] Wiener型状態空間モデルに対して2つの非線形推定器を提案する。
このアーキテクチャは最適アフィンMMSEパラメータ推定器の機能的構造を保持する。
2つのDBS構築戦略が開発され、2つの非線形推定フレームワークが作られる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:41:52 GMT)
Wave packets from the spectrum [1.7] 任意のハミルトニアンがそのような理論のように見えることが示される。
我々は、我々の結果は場の量子メアロジーへの一歩であると主張する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:00:07 GMT)
Agentic Persona Generation with Critique-Refinement: An Industrial Evaluation [1.6] PerGentは業界グレードのペルソナ生成手法で、反復的批評・修正ループを中心に構築されている。
専門家のin-situ評価では、PerGentは最高専門家の承認率(96.9%)を達成した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:34:29 GMT)
Adaptive directional gradients for parameterised quantum circuits [1.6] 量子ハードウェア上でのパラメータ化量子回路(PQC)のトレーニングは、勾配推定の計測コストによってボトルネックとなる。
自動微分のフォワードモードに基づくPQCのフォワード勾配推定手法を提案する。
前方最適化は、最大60量子ビット、1770個のパラメータを持つハミング重保存量子ニューラルネットワークをパラメータシフト則よりも効率的に学習することを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:59:58 GMT)
Weighted universal approximation of differentiable maps on infinite-dimensional manifolds [1.6] 関数入力ニューラルネットワークの普遍近似定理を微分可能写像に一般化する。
FNNは、無限次元の重み付き多様体からの入力を実数値隠れ層にマッピングする。
符号の線形関数は、方向微分を含む経路空間関数を近似することができることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:57:40 GMT)
Learning Entropy and Spatial Adaptation Dynamics of Multilayer Perceptrons for Structural Point Extraction [1.5] 本稿では,学習エントロピー(LE)の概念を時間適応システムから多層空間ネットワーク(MLP)における空間学習へ拡張する。
中心画素の強度を周囲の空間的文脈から予測するために訓練され、LEは画像由来のサンプルの学習中に神経重みの漸進的適応から評価される。
空間学習エントロピーマップ(SLEM)は、ニューラルネットワークの強い適応を誘発する異常なイメージポイントや領域を特定し、学習プロセスにおいて重要な役割を果たす。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:05:03 GMT)
Sustainability and Artificial Intelligence: Necessary, Challenging, and Promising Intersections [1.5] 本条は,芸術研究の現状を概観することにより,必要な,挑戦的で,有望な交差点を図解することを目的とする。
この結果は、Web of Science(WoS)データベースから収集された541のデータをベースとして、グリーンで持続可能な科学と技術に関する研究の中心的な成果が増していることを示している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:09:01 GMT)
POPSICLE: Benchmark Datasets for Segmentation and Localization in CryoET [1.5] 本稿では,CryoETセグメンテーションとマクロ分子ローカライゼーションのためのベンチマークスイートであるPOPSICLEを提案する。
CryoET Data Portal - トモグラフィデータ、メタデータ、アノテーションのオープンでML対応のリポジトリ。
新しいデータセットとアノテーションが利用可能になると、拡張できる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 23:47:24 GMT)
A Geometric Account of Activation Steering through Angle-Norm Decomposition [1.4] 線形アクティベーションステアリングは、言語モデルの振る舞いをシンプルかつ経験的に制御する方法として人気を集めている。
ステアリング法は,トークンの角方向のアライメントを概念方向に変更し,隠れ状態のノルムを変更するという2つの幾何学的効果の相違を示す。
以上の結果から,アクティベーションステアリングは角状成分と放射状成分によってパラメータ化されるべきであることが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:02:18 GMT)
Tame the Umklapp Processes in Real-Time Lattice Simulation for Hydrodynamics: An Ising Field Theory Study [1.4] 格子ハミルトニアンシミュレーションを用いて非可積分イジング場理論に対する応力エネルギーテンソルのリアルタイム対称相関関数を計算する。
Umklappプロセスは抑制され、相対論的流体力学の音モードは長い波長と遅い時間で現れる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:00:01 GMT)
Perturbative Contrastive Physical Learning [1.4] 摂動コントラスト物理学習(PCPL)は、物理的状態間の測定可能なコントラストから学習が出現する一般的な枠組みである。
我々はPCPLが局所的な感度や大域的逆プロブレム構造を反映できるが、集中的な勾配計算を必要としないことを示した。
我々は, (i) 測定された変位と力を用いて接着剛性を更新するスプリングネットワーク, (ii) クアッドX線測定により訓練された連続可変フォトニック回路, およびジャコビアンの有限差分推定の2つのプラットフォームでPCPLを実証する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:14:07 GMT)
Asymptotic Optimality of Thompson Sampling for Risk-Averse Bandits with Sub-Gaussian Rewards [1.4] $text-mathrmNPTS_mathrmSG$はアンカーフリーの非パラメトリックトンプソンサンプリングアルゴリズムである。
我々は、$text-mathrmNPTS_mathrmSG$が、$log n$の先頭の順にインスタンス依存の下位境界と一致することを証明した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:26:37 GMT)
Identical Bosons, large occupation numbers and classical field description [1.4] 職業数の多い任意の状態は古典的に振る舞わない。
コヒーレント状態は準古典的振舞いを持つことが知られているので、コヒーレント状態からの偏差が古典的振舞いを損なう可能性があるかを問う。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:32:14 GMT)
XMedFusion: A Knowledge-Guided Multimodal Perception and Reasoning Framework for Autonomous Medical Systems [1.4] XMedFusionは、自律的な医療システムのためのインテリジェントな認識と推論モジュールとして設計されたモジュール型AIフレームワークである。
視覚知覚剤は、画像的根拠を抽出し、知識グラフ構築剤は、臨床的に関連した所見を構造化し、検索誘導起草プロセスは、一貫した報告構造を確保する。
合成剤は、推論駆動検証により視覚的および構造化された証拠を反復的に統合し、信頼性及び解釈可能な診断出力を生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:26:32 GMT)
Quantum Reference Fields Transformations in Linearized Quantum Gravity [1.3] 量子参照場を導入し、量子参照フレームの概念を局所場理論参照システムに拡張する。
関係性のあるゲージ不変オブザーバブルは、各量子参照場の観点からの記述の減少を許容することを示す。
我々は、量子参照場の観点から、対応する還元可観測物をどのように操作的にアクセスできるかを示す、リレーショナルフォン・ノイマン型測定スキームを構築した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:08:38 GMT)
Optical Music Recognition for Real-World Manuscripts with Synthetic Data [1.3] 複雑なピアノ表記を用いた実世界の写本のベースラインを提供する。
そこで本研究では, ドメイン内データの直接転写は依然として不可欠であるが, 合成楽譜画像を用いたドメイン適応により, 大幅な改善がもたらされたことを示す。
そこで我々は,光学音楽の認識を,音楽文化遺産の保存と促進という目標の1つに近づける。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:38:48 GMT)
A Pre-Registered Causal Partition of Self-Consistency Elicitation and Reward Design in RLVR [1.3] 報酬からの強化学習は、報酬信号が刺激的であっても推論を改善する。
実践者は一般的に、報酬-設計効果として naive = acc(TRUE) - acc(R) を解釈する。
我々はこの推定が体系的に偏っていることを証明している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:52:09 GMT)
GRAFT: Graphlet-Triggered Backdoor Attack on GNN-Based Hardware Security Systems [1.3] GRAFTは,GNNベースのハードウェアセキュリティをターゲットにしたバックドア攻撃である。
GRAFTは、回路の本来の機能を維持しながら、レジスタ転送レベル(RTL)またはゲートレベルにグラフレットベースのトリガを埋め込む。
実験の結果,GRAFTはHT検出とIP海賊行為検出を効果的に回避でき,攻撃成功率(ASR)を最大100%達成できることがわかった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:47:54 GMT)
RPO-PDT: Demonstrating Role-Play-Based Knowledge Adaptation for Student Support Dialogue (Demonstration System) [1.3] RPO-PDTは、高等教育における適応的な学生支援のための、検索地上のロールプレイベースの対話システムである。
RPO-PDTはテキストベースとFurhatベースのインボディードインタラクションの両方をサポートし、基礎的、安全、適応的な学生支援対話を示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:27:55 GMT)
Importance-Aware Scheduling for High-Dimensional Hyperparameter Optimization [1.3] Greedy Importance First(GIF)は、重要度に基づくグループを形成し、トライアルを比例的に割り当て、フルスペースのフォールバックを保持する、重要度の高いスケジューリング戦略である。
高次元のベンチマークでは、GIF は TPE, BOHB, Random Search, Sequential Grouping よりも高速に収束する。
これらの結果から, GIFは高次元HPOにおいて, 試料効率を向上させるための簡易かつプラグ互換な方法である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:42:00 GMT)
POTATR: A Lightweight Image-to-Graph Model for Page-Level Table Extraction [1.2] Page-Object Table Transformer (POTATR) は、コンテキスト化されたページレベルTEのためのTable Transformer (TATR) を拡張するイメージ・ツー・グラフモデルである。
POTATRはPubTables-v2 Single Pagesベンチマークでテストされたすべてのモデルを上回っている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:43:44 GMT)
Spatiotemporal Seismic Hazard Assessment Using VQ-VAE and Seismic Statistical Features [1.2] その結果,60の地震学的特徴(SSF)は,tsfreshパッケージの428の時系列特徴よりもはるかに高い予測値を示した。
VQ-VAEモデルのトレーニングにより得られた2次元地震図に基づく新しい特徴と,この実証されたSSFのセットを結合する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:43:27 GMT)
ComplexConstraints and Beyond: Expert Rubrics for RLVR [1.2] 代替パラダイムとして,専門家によるルーリック評価を体系的に分析する。
われわれはまず,高品質なルーブリックを構築するための5つの設計原則を述べる。
これらのルーリックは, 優れた評価機器であるだけでなく, 極めて効果的な訓練信号であることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:11:56 GMT)
TestMap: Evidence Infrastructure for Foundation-Model-Assisted Test Generation [1.2] 本稿では,C#/.NETリポジトリの基盤モデル支援テスト生成を自動化するオープンソースプロトタイプであるTestMapを提案する。
TestMapは、リポジトリ分析、ソース-テストマッピング、ベースライン実行、コードメトリクス収集、テスト臭いの検出、カバレッジ測定、突然変異テスト、モデル誘導テスト生成、バリデーション、修復、リポジトリ固有の実験追跡をサポートする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:04:51 GMT)
Detecting Differences Is Not Understanding Structure: Large Language Models Fail at Graph Isomorphism [1.1] 大規模言語モデル(LLM)がグラフ同型を真に理解できるかどうかを検討する。
LLMは同型検出においてほぼ完全な精度を実現するが,この性能は明らかである。
この発見は、LLMが抽象グラフ構造を推論するよりもパターンを活用することを示唆している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:39:25 GMT)
Model Poisoning Against Federated Model Adaptation with Chain of Bit-Flips [1.1] フェデレートラーニング(FL)は、一組のクライアントが、ローカルなトレーニングデータを共有することなく、グローバルなモデルを集合的にトレーニングすることを可能にする。
近年のハードウェア故障の脅威は、全体の攻撃面を拡大している。
FLトレーニング期間中にハードウェア故障を誘発し,タスク非依存のバックドアアタックを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:27:21 GMT)
Crop Recommendation and Agricultural Query Answering System Using Spatio-Temporal Graph Neural Networks and Hybrid Retrieval Augmentation [1.1] 本稿では,先進的な天気予報,作物の推薦,農家への質問応答ツールを統合することで,精密農業を支援する統一システムを提案する。
ネパールの1,359カ所のデータを用いて,今後30日間の気象予報を行うための2つの深層学習モデルを提案する。
システム全体がモバイルアプリケーションを通じてデプロイされ、リアルタイムの提案と会話のサポートを提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:51:34 GMT)
Machine-Learning Emulation of Satellite Greenhouse Gas Retrievals: Stability over Time [1.1] 検索アルゴリズムの高速エミュレータとして機械学習モデルが提案されている。
温室効果ガス観測衛星(GOSAT)のデータを用いたエミュレータの時間的安定性について検討する。
また、入力機能としての時間を含めることで、ラッソモデルとニューラルネットモデルのXCH4予測が大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:19:11 GMT)
Failure-Aware Refinement of Vision-Language Model for Lithography Defect Detection [1.1] 本稿では,初期欠陥検出と予測改善を組み合わせた2段階の視覚言語フレームワークを提案する。
Qwen3-VLは、リソグラフィ画像から欠陥数、欠陥カテゴリ、正規化境界ボックスを予測する視覚言語アダプタとしてLoRAで微調整される。
第2段階は第1段階の予測失敗とその修正されたラベルを使用してリファインメントモジュールを訓練し、モデルが初期出力をレビューし、修正することを可能にする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:15:26 GMT)
Towards the implementation of a quantum classifier [1.0] 量子機械学習の文脈における二項分類モデルとしての量子回路の利用について検討する。
本稿では、回路内のデータ入力方法、トレーニング可能なパラメータと損失関数を持つ量子回路モデルAnsatzの定義、複数のミニマライザの実装について述べる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:28:14 GMT)
Algorithm for Contextual Queueing Bandits with Rate-Optimal Queue Length Regret [1.0] 待ち時間後悔は、学習者の待ち時間とオラクルの待ち時間の間に期待される差として定義される。
本稿では,この値を$widetildemathcalO(T-1/2)$に改善する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:51:25 GMT)
Interpretable Crisis Behavior Analysis Using Mobility and Social Media Data [1.0] 本稿では,モビリティとソーシャルメディアデータを統合して,危機時のドメイン間行動パターンを識別する,統一的で解釈可能なパイプラインを提案する。
このフレームワークは、2025年1月のロサンゼルスの山火事(原型)の短期水平分析と、2020年3月から2021年12月までのUAE COVID-19の行動の経時的分析という2つのケーススタディを通じて評価されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:16:36 GMT)
A Cryogenic Hybrid Photonic/CMOS Controller Architecture for Scalable Superconducting Qubit Control [1.0] 超伝導量子コンピュータを数千の量子ビットにスケーリングすることは、ハードウェアの制御が難しい問題である。
本研究は、光ファイバーが共有形パルステンプレートを分散する4Kハイブリッドフォトニック/CMOS制御アーキテクチャを開発する。
クライオCMOS回路は、伝送制御、振幅プログラミング、サンプル・アンド・ホールド・エンベロープ・シェーピング、LOトーンと位相選択、マイクロ波アップコンバージョンを提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:48:15 GMT)
Discovering Interpretable Multi-Parameter Control Policies for Evolutionary Algorithms Using Deep Reinforcement Learning [0.9] 深層強化学習(deep-RL)は進化的アルゴリズムのパラメータ制御にますます応用されている。
我々は,OneMaxを最適化する1+($$,$$)-ジェネリックアルゴリズムを用いて,この障壁を克服するためにディープ・RLをどのように活用できるかを実証する。
この結果から、Double Deep Q-Networksは、近親政策最適化で観測される政策崩壊を独自に回避していることがわかった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:06:25 GMT)
Self-Explainability in Self-Adaptive and Self-Organising Systems: Status and Research Directions [0.9] 本稿では、自己説明可能性(SX)に関する体系的な文献レビューを紹介する。
SXの統一的な定義と分類を開発し、自己説明可能性のレベルを導入している。
その結果、ほとんどのSXアプローチは概念的であり、実践的な実装はほとんどないことがわかった。
現在、SXを評価するための正式な標準やデファクトの標準は存在せず、大きな研究ギャップを浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:42:21 GMT)
Goal Sets, Not Goal States: Queryable Robot Goals through Goal-Set Hindsight Relabeling [0.9] Hindsight relabelingは通常、達成した状態を正確な目標に変え、オフラインのロボット学習を過度に制限する。
本稿では,HER の述語レベルの一般化である Goal-Set Hindsight Relabeling (GS-HER) を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:35:22 GMT)
Synthetic but Not Realistic: The Evaluation Challenge in Generative Modelling for Structured Electronic Medical Records [0.8] 疫学に基づく多次元評価フレームワークを導入し, 記述的忠実度, 臨床的有用性, 構造的妥当性について検討した。
PRIME-CVDを用いた4つの代表的生成パラダイムの評価を行った。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:07:37 GMT)
From Hazard Functions to Language Space: Cox-Supervised Distillation of Survival Risk into a Large Language Model [0.8] 本研究では,時間-時間的リスクに関する情報を生成型大規模言語モデルに転送できるかどうかを検討する。
本稿では,テキストベースの生存モデルパイプラインを提案し,Qwenベースの大規模言語モデルを用いて患者固有の生存リスクを生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:47:05 GMT)
The Transformation-Response Framework: An Operational Reformulation of Quantum Mechanics [0.7] 本稿では、量子力学の操作的再構成である変換応答フレームワークを提案する。
量子状態はヒルベルト空間オブジェクトではなく、全ての物理変換に対する系の応答のカタログである。
このフレームワークは、操作的プリミティブに根ざした量子理論の統一的で経済的かつ実現可能な基礎を提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:55:25 GMT)
Observability for Delegated Execution in Agentic AI Systems [0.6] 本稿では,軽量ゲートウェイと共通情報モデルからなるエージェント対応可観測基板を提案する。
これにより、時間-ウィンドウの相関なしに、信頼性の高いクロスツールデリゲートスコープの再構築と直接法医学的なクエリが可能になる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:10:05 GMT)
A Study of Parallel Continuous Local Search [0.6] 連続局所探索は対称擬似ブール制約による満足度問題に対する解法である。
CLSは、ハイブリダイズされた設定におけるサブソルバとして有望であり、部分的な割り当てを迅速に完了することを示す。
本研究は,最近のアクセラレータハードウェアにおけるSATにおけるLCSの実用的利用を示唆するものである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:19:28 GMT)
The Map of Parameter Space in Double Microwave Shielding [0.6] ダブルマイクロ波遮蔽は、最低回転遷移に近く調整された$+$と$$$の偏光マイクロ波場を使用する。
この2つのフィールドのデチューニングとインテンシティによって空間空間が拡張された4次元マイクロ波パラメータをマッピングする。
重くて強い双極子分子を最も有望な候補とみなし、強い相互作用のチューニング性とともに極端な損失抑制を達成できることを実証した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:33:33 GMT)
Trajectory Geometry of Transformer Representations Across Layers [0.6] 我々は、トランスフォワードパスを高次元表現多様体を通して離散的な集団軌道として再キャストする。
周辺空間で直接計算された5つの測度を用いて軌道幾何学を特徴付ける。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:54:07 GMT)
Edge of Stability Selectively Shapes Learning Across the Data Distribution [0.6] 安定性の限界 (EoS) は選択的であり, グループによっては進行が増大し, 他グループでは進行が抑制されることが示唆された。
同じトレーニング状態からEoS体制に侵入または離脱する分岐介入を使用することで、このトレードオフを慎重に実証する。
これらの結果から,EoSは安定性境界だけでなく,学習の割り当てを規定するメカニズムとして機能することが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:25:59 GMT)
Temporal Sheaf Neural Networks with Dynamic Orthogonal Transport [0.6] 本稿では,時間的リンク予測フレームワークであるTSNNを紹介する。
TSNNは、動的局所フレームを通してノード固有で進化する相互作用の意味をモデル化する。
すべての計算は厳密な因果関係を持ち、事前の履歴のみを使用する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:47:31 GMT)
Zero-Shot Semantic Re-Identification for Autonomous Driving: A VLM Baseline Study [0.6] 自律運転における再同定は、一般的に視覚的マッチング問題として定式化され、車、歩行者、サイクリストの観察が時間、フレーム、カメラビューを通して関連付けられている。
本稿では,VLM(Vision-Language Models)を用いたゼロショットパイプラインのベースラインスタディを提案し,検出された交通参加者のテキスト記述を生成する。
ゼロショットのセマンティック記述は効果的なオブジェクト再識別をサポートし、教師付きCNNベースラインに匹敵する検索性能を実現する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:35:34 GMT)
Integrating gene regulatory priors into Transformer attention with scTransformer for interpretable scRNA-seq analysis [0.5] scTransformerは、バイオメカニズムの事前知識をモデルの注意パターンに組み込む最初のTransformerベースのアプローチである。
標準的なトランスフォーマーと比較して,本手法は分類精度を向上し,埋め込み空間における細胞型の分離を促進し,既知の規制プログラムと整合した注意パターンを生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:32:52 GMT)
PROBE-Web: An Interactive System for Probing Evaluation Landscapes of Knowledge Graph Completion Models [0.5] PROBE-Webは、KGCモデルの多様な評価環境を探索するインタラクティブシステムである。
ユーザーは、(P1)予測的シャープネスと(P2)人気バイアスロバストネスの2つの重要な視点を調整することで、柔軟にKGCモデルを評価することができる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:08:23 GMT)
Constrained user-item allocation for e-commerce marketing campaigns [0.5] この問題を,ユーザとアイテムを共同で選択して,複数の解離キャンペーンを構築するという,自動目標化として定式化する。
提案手法は, (i) ユーザ-テム親和性行列内の高密度領域を見つけるためのスペクトル双クラスタリング, (ii) グリーディ改善のためのペアスワップを用いたグリーディ局所探索, (iii) 局所オプティマから逃れるためのマルチアームバンディットフレームワークである。
その結果, 両クラスタリングは, キャンペーン品質, リフト, フェアネスのスコアを一貫して達成していることがわかった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:26:14 GMT)
Decision-Calibrated Conformal Uncertainty for Pacing Decisions in Streaming Advertising [0.5] ペイシングは、将来の不確実な在庫、需要圧力、インクリメンタルレスポンス、およびメンバー-経験負荷に依存する。
我々は,ストリーミング広告における意思決定を行うための,意思決定校正型コンフォメーション・フレームワークを開発した。
このフレームワークは、一般的な予測残差を調整するのではなく、実際にデプロイできるポリシーに対する最大の影響によって、予測エラーを測定する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:26:15 GMT)
Block-A-Mole: The Sustainability Frontier of Moving-Target Censorship Resistance [0.5] 回避システムは、検閲が対応できるよりも早く、商用のクラウドアドレス空間でエンドポイントを回転させる。
我々は、検閲と防御の相互作用を連続時間タイミングゲームとしてモデル化することで、移動目標検閲抵抗の最初の公式な説明を行う。
我々は,グレートファイアウォールが2024年にQUICとTLSをドメイン単位でブロックする方式に移行したことにより,生回転速度が結合制約ではないことを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 00:07:39 GMT)
Modeling Components and Connections in Cyber-Physical Systems [0.5] 本稿では、WebGME上に構築されたROSLaunchVisualを用いて、ROSの起動ファイルを設計、視覚化、管理するためのモデル統合環境を提案する。
このツールは、ノード、パブリッシャ、サブスクライバ、引数を相互接続コンポーネントとして表現するグラフィカルインターフェースを使用して、ローンチファイルの作成と修正を可能にすることで、抽象化のレベルを高めている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:39:43 GMT)
Heterophily-Aware Adaptive Knowledge Distillation for Hypergraph Neural Networks [0.5] ハイパーグラフニューラルネットワーク(HNN)は、意味的に多様なハイパーエッジを介して接続されたヘテロ親和性ノードにおいて、かなり低い予測性能を示す。
ハイパーグラフニューラルネットワークのためのヘテロフィア対応蒸留法であるHADESを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:23:43 GMT)
Energy Transport in Randomly Coupled Quantum Systems: A Perturbative Approach [0.5] ランダム相互作用によって結合された2つの量子系間のエネルギー輸送について検討する。
結合強度において,エネルギー伝達速度と熱伝導率を2次に比例した明示表現を導出する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:15:59 GMT)
A Universal Dense Football Event Representation Based on TabTransformer [0.4] Transformerは、入力機能間の依存関係を任意の位置にキャプチャする自己注意に基づくディープニューラルネットワークアーキテクチャである。
本稿では,トランスフォーマーモデルを用いて,カテゴリー的イベント特徴間の潜伏依存性を学習し,フットボールイベントの密度の高い表現を生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:47:47 GMT)
Physics-informed generative AI for semiconductor manufacturing: Enforcing hard physical constraints in generative models by construction [0.4] 生成モデルは、物理システムの設計、データ、制御アクションの提案にますます使われている。
半導体製造は需要の高いテストケースを提供する。
このパースペクティブは、制約された物理領域のための生成AIは、構成によって物理インフォームされなければならないと主張している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:06:11 GMT)
Bernstein-Schur Kernels: Random Features by Sketched Modulation and Radial Randomization [0.4] Bernstein--Schur カーネルは有限機能カーネルと単調シフトインカーネル不変量の積である。
両因子を言い換えるクラス全体の1つの特徴的構成を与える。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:59:44 GMT)
SpineReport: Automated 3D Quantification and Reporting of Lumbar Spine Degeneration on MRI [0.4] 腰部MRI脊椎の3次元形態計測を包括的に行うための,オープンソースの完全自動化フレームワークであるSpineReportを紹介した。
この方法は、脊髄、脊髄、脊椎、椎間板、前頭骨などの重要な構造から定量的なメトリクスを抽出する。
また,T2強調CSF信号が著効し,中心管重度狭窄と強い相関が認められた。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:07:45 GMT)
Deterministic Integrity Gates for LLM-Assisted Clinical Manuscript Preparation: An Auditable Biomedical Informatics Architecture [0.4] 大規模な言語モデルは、ますます臨床研究の原稿を起草する。
既存のツールは検証せずにテキストを生成し、自己批判は確実な製造を生み出す盲点を継承する。
生成と検証を組み合わせたアーキテクチャについて述べる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:51:04 GMT)
Learning Where to Simulate: Generative Active Sampling for Online PDE Surrogate Training [0.4] オンライン生成能動サンプリング(Online Generative Active Smpling, OGAS)は,構成パラメータとサロゲート性能の関係を学習し,サンプリング分布を制御する能動学習手法である。
OGASは尾の統計を一貫して改善し、99番目のパーセンタイルよりも誤差が大幅に減少し、一様サンプリングに比べて全体的な誤差分散が減少する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:25:19 GMT)
Autonomous Incident Resolution at Hyperscale: An Agentic AI Architecture for Network Operations [0.3] 本稿では,大規模ネットワーク運用における自律的インシデント解決のためのエージェントAIアーキテクチャを提案する。
我々のシステムは、人間の介入なしにネットワークインシデントを検出し、診断し、修正するために、専門のAIエージェントが協力するマルチエージェントオーケストレーションフレームワークを採用している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:15:53 GMT)
FASE: Fast Adaptive Semantic Entropy for Code Quality [0.3] 本稿では,FASE(Fast Adaptive Semantic Entropy)について紹介する。
HumanEvalとBigCodeBenchの評価は、FASEがLLMエンテーメントにより最先端のセマンティックエントロピーより優れていることを示している。
FASEは計算オーバーヘッドを無視し、従来のセマンティックエントロピーアプローチのランタイムコストの約0.3%しか必要としない。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:53:05 GMT)
Learning the Universe: Posterior Reliability of Neural Generative Models in High-Dimensional Field-Level Inference of Cosmic Initial Conditions [0.3] 我々はハミルトニアン・モンテカルロを用いて参照後続サンプルを得る。
離散化された3Dフィールド全体の生成モデルは、高速な償却推論を可能にする。
一致した後縁手段, 限界分布, あるいは高い相互相関を達成することは, 不確実性構造を補正するものではないことを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:08:00 GMT)
Multi-task LLMs for Bug Classification: Efficient Inference with Auxiliary Decoding Heads [0.3] 3つの重要なコントリビューションを通じて制限に対処する,新しいラインレベルのバグローカライゼーションアプローチを導入する。
本手法は,行レベルのバグローカライゼーションとフルファイルコンテキストの類似した設定において,最先端の性能を実現する。
受け入れ次第、コード、モデル、データセットをオープンソースにします。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:15:49 GMT)
Avoiding Exponential Blow-Up in Distributive Lattice Submodular Minimization [0.3] サブモジュール関数の最小化は、コンピュータビジョンと機械学習の領域で高い適用性を持つ。
現在、それを扱う最良の方法は、各格子に対して部分モジュラ函数を外挿する変換を使うことである。
本稿では,分散格子内でのみ機能する分散格子を扱うための汎用フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:20:31 GMT)
A Unifying Lens on Reward Uncertainty in RLHF [0.2] 正しい対象は固有分布報酬モデル $p(rmid x,y)$ であると主張する。
ベイズ予想またはKL分布的に堅牢な最適化レンズの下では、KL正規化 RLHF の目的は閉形式有効報酬 $tilde r(x,y) = pmlogmathE_p[epm r/]$ を認める。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:15:30 GMT)
Integrating Out, Twice:The Open-System Case That Neural-Network Ensemble Theory Is Missing [0.2] 私は2つのケースを、分布のモーメント、ガウスの代数、およびブロック逆転法(英語版)(block inversion, no field theory)のみを用いて並べて設定した。
次に、切り捨てられた注目マップ、トークンレベルの転送演算子、スパースの専門家ルータ上でオープンエクスポートをテストし、ほぼ負の結果を報告します。
オープンケースは、連続スペクトルと波動のような、緩和的ではなく、動的に排除されたセクターを必要とする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:57:34 GMT)
(Auto)formalization is supposed to be easy: Trellis process semantics for spelling out rigorous proofs [0.2] 本稿では,LLMエージェントを決定論的に制約されたワークフローで活用して,リーンの自己形式化タスクの漸進的な進歩を実現する自動形式化システムを提案する。
我々のアプローチは、まず第一に厳密な証明を持つことの意味についての一般数学者の考えに動機づけられている。
プロセスによって生み出された最近のRamsey理論のブレークスルーを、エンドツーエンドのリーン形式化にリンクします。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:57:14 GMT)
Language-Aware Token Boosting: LLM Language Confusion Reduction Without Tuning [0.2] 大規模言語モデル(LLM)は、英語以外のテキストを生成するときに言語を混乱させることがある。
本稿では,言語混乱を軽減するためのチューニング不要なパラダイムを提案する。
本パラダイムでは、所望の言語に関連するトークンに目標摂動を適用するLanguage-Aware Token Boosting (LATB)と、モデルが意図する言語に対する信頼度に基づいてこれらの摂動を動的に調整するAdaptive Language-Aware Token Boosting (Adaptive-LATB)の2つの手法を紹介する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:47:07 GMT)
Securing Self-supervised Data Curation for Foundation Models Robustness [0.2] データキュレーションのための自己教師付き学習(SSL)は、機械学習モデルの一般化能力を拡大し改善するための経路を提供する。
SSLは、アノテーションや手動データセットのキュレーションに関連するコストを大幅に軽減し、人間の監視の必要性を最小限にする。
我々は,基礎モデルトレーニングに先立ってSSL処理データセットの整合性を確保するために,Poisoned Data Detector (PDD)を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:03:51 GMT)
iSAGE: A Human-in-the-Loop Framework for Remote Sensing Semantic Segmentation via Sparse Point Supervision [0.2] 既存のHuman-in-the-loopフレームワークは、余分なクリックを補助機械を介して密集した監視に拡張する。
本稿では, 任意の画素ではなく, 信頼度の高いモデル誤差をターゲットとした, 専門家によるクリックが, 厳密な監督と一致させるのに十分である,という仮説を立てる。
iSAGEは補助機械を使わずに動作する唯一の反復型人間-イン-ザ-ループフレームワークである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:09:35 GMT)
Closing the Prior-Posterior Loop: Self-Reflective Molecular Design with Analysis-Driven LLM Iteration [0.2] 単一数を物理化学的理性に置き換えることで,LSMを因果的理性へと変換することを示す。
我々のシステムは、軌道エネルギー、原子電荷、電子密度を供給する自己反射モジュールで、検索強化世代を結合する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:09:40 GMT)
An Improved Generative Adversarial Network for Micro-Resistivity Imaging Logging Restoration [0.1] 本稿では,GANを用いた画像検層画像復元法について述べる。
この方法は、FCNを生成ネットワーク基盤として使用し、より効果的なピクセルやセマンティック情報を学習し保持するために、深さ分離可能な畳み込み残差ブロックを追加する。
本研究の手法は, セマンティックな構造的コヒーレンスやテクスチャの細部を改良した, 微小比抵抗画像の復元に有効であることがわかった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:42:19 GMT)
ATM: Action-Consistency Transfer Matrix for Diagnosing and Improving Latent World Models [0.1] 本稿では、遅延遷移が計画に関連するアクションセマンティクスを保存するかどうかを診断するためのアクション・一貫性転送行列であるATMを提案する。
ATMは、実際の符号化されたトランジションと、軽量なポストホックプローブによるモデル予測トランジションのアクション情報を比較する。
また、チェックポイント、変種、世界モデルにまたがるタスク内ランキングの単純なスクリーニングスコアに分解することもできる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:53:10 GMT)
Intention Driven Identification of In-Possession Match Phases in Association Football through Temporal Graph Learning [0.1] 本研究では,マッチング関連データ追跡から係り受け位相を特定するためのデータ駆動型フレームワークを提案する。
T-GAN(Temporal Graph Attention Network)は、フレームレベルのプレイヤインタラクショングラフ、コンテキスト特徴、トランスフォーマーベースの時間モデルを組み合わせるために開発された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:57:04 GMT)
On the viability of Transatlantic Quantum Entanglement Distribution using Combined Satellite and Stratospheric Relay Nodes [0.1] 衛星と成層圏高高度プラットフォームを含む自由空間リンク構成を定義する。
我々は、低地球軌道(LEO)衛星上に位置する絡み合った光子源からなるハイブリッドアーキテクチャが、HAPs上に位置する2つの受動光リレーによって支えられ、最も絡み合った分布速度が得られることを発見した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:54:15 GMT)
A practical probabilistic framework for deformable image registration uncertainty in radiotherapy dose propagation [0.1] 変形性画像登録(DIR)は放射線治療において線量伝播と蓄積に広く用いられている。
基礎となる変形の不確かさは臨床的に関連する線量推定に大きく影響する可能性がある。
本稿では,DIRの不確かさを線量統計学および線量ヒストグラムに伝播させるための実用的確率的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:25:04 GMT)
Frequency-resolved decoherence spectroscopy of a semiconductor charge qubit coupled to a high-impedance resonator [0.0] 本研究では、GaAs二重量子ドット電荷量子ビットを周波数可変SQUIDアレイ共振器に容量結合したハイブリッド回路量子力学アーキテクチャについて検討する。
時間分解測定により、緩和と純粋脱落過程を解き、異なるデコヒーレンス状態をキュービット周波数の関数として識別することができる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:46:11 GMT)
Zermelo's navigation problem through the lens of quantum annealing: How the Landau-Zener approximation leads to an efficient classical solution [0.0] 川を渡る問題(Zermelo's navigation problem)は、実用的な妥当性を持つ最適化問題の古典的な例である。
ゼルメロ問題のバージョンを述べ、量子三重項を用いた断熱的量子計算問題として解いた。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:13:11 GMT)
When Do Local Score Models Extrapolate Across Size? A Diagnostic Theory and Benchmark [0.0] アーキテクチャの局所性だけでは、安定したサイズ外挿が保証されないことを示す。
我々はこの機構を定式化し、局所限界に対する大きさと一様の比較定理を証明した。
実験により,空間混合,平滑なスコア準局所性,およびモデル受容場間の相互作用を検証する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:24:31 GMT)
When Built-in Thinking Helps and Hurts: Constraint-Level Error Shifts in Instruction Following [0.0] 大規模推論モデル (LRM) は数学や符号化性能を向上することが多いが、その影響は明らかではない。
IFEvalをQwen3モデル(1.7B-32B)で検討する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:45:04 GMT)
What makes a harness a harness: necessary and sufficient conditions for an agent harness [0.0] エージェントハーネスという用語は、生成人工知能を用いたソフトウェア工学において広く流通している。
本稿では,エージェントハーネスとなるシステムに必要な,十分な条件を記述した定義を提案する。
この貢献はエージェントハーネスの運用定義であり、共通語彙を持ち、エンジニアリングの実践を導くことができる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:35:37 GMT)
What Demonstration Curation Metrics Do to Your Policy [0.0] 本研究は,欠陥のあるトレーニングエピソードを検出する実演キュレーション指標が,キュレートされたデータに基づいてトレーニングする下流行動閉鎖ポリシーを改善できるかどうかを考察する。
最大欠陥検出AUROC(0.804)の基準が最悪の治療方針(13.3%のタスク成功)を生んでいることが判明した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:40:49 GMT)
VQA for Dynamic Portfolio Optimization: Sampling Strategies, Optimizer Scheduling, and Hardware-Aware Ansatz Design [0.0] 変分量子アルゴリズムは、短期量子デバイスに関連するスケールでの最適化問題のために、ますます研究されている。
その実用性能は、ハードウェアのトランスパイレーションの前後における目的、古典、およびアンザッツのレイアウトといった設計上の選択に強く依存する。
動的ポートフォリオ最適化、複数周期の金融問題バランスリターン、リスク、取引コスト、現金-利益効果、制約に関するこれらの要因について検討する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:25:39 GMT)
Trustworthy Smart Fabs via Professional Proxies: Scaling Safe and Sustainable by Design (SSbD) through Industrial Data Spaces [0.0] 本稿では,6層SSbD参照アーキテクチャを運用するゼロトラスト社会技術オーケストレーションフレームワークを提案する。
我々は、リアクティブな自動化から、"プロフェッショナルプロキシ"への自律的なガバナンスへの移行を提案する。
このフレームワークは、レジリエントで純ゼロの産業5.0エコシステムへの検証可能なエビデンスベースの経路を提供する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:02:02 GMT)
Trainability of IQP Quantum Circuit Born Machines Under Gaussian Initialization [0.0] 量子回路ボルンマシン(QCBM)は、ボルンルールを利用して生成機械学習に自然なアプローチを提供する。
最近の研究は、最大平均離散性(MMD)損失を通じて、インスタント量子多項式(IQP)回路でQCBMを古典的に訓練する方法を提供している。
指数集中を回避または促進する戦略と、不毛の台地がより起こりやすい状況について論じている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:14:21 GMT)
Towards Post-Quantum Secure Pharmacovigilance with ML-KEM and ML-DSA [0.0] 薬理学的システムは、有害事象の報告や臨床観察を含む、繊細な医療と薬物安全のデータを扱う。
量子コンピューティングが進むにつれて、RSAや楕円曲線暗号のような古典的な公開鍵暗号システムが脆弱になる可能性がある。
本稿では,クォータム後安全な薬剤移動データパイプラインの教育プロトタイプについて述べる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:27:32 GMT)
Topological defects and scalar field modes in warped geometries [0.0] リッチテンソルと曲率スカラーは、ワープ因子、半径幾何学、角欠陥構造からの寄与によって分解される。
角欠陥パラメータの一般値に対して正規化モード関数の完全集合を求める。
アダマール2点関数は、得られたモード関数を用いて、AdS時空における大域的モノポールに対して評価される。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:40:22 GMT)
The dynamic 4.8.8 Floquet code [0.0] フォールトトレラント量子メモリは、基礎となるコードと同様にシンドローム抽出回路に依存している。
アンシラフリーまたはダイナミック回路は、この回路層を改善する効果的な方法である。
6.6.6 ハニカムフロッケ符号の場合、回路のダイナミック化はしきい値を上げ、キュービットのオーバーヘッドを低くするが、空間符号距離を半減するコストがかかる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:59:47 GMT)
The Token Not Taken: Sampling, State, and the Variability of AI Agent Outputs [0.0] エージェントAIシステムは実行毎に異なる動作をすることができる。
可変性は、しばしば混ざり合ったいくつかの層から生じます。
この原稿は、一致した条件下でそのような変動を再現できる場合に、エージェントAIシステムと呼ぶ意味を明確にする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:53:55 GMT)
The Neutral Mask: How RLHF Provides Shallow Alignment while Leaving Partisan Structure Intact in a Large Language Model [0.0] RLHFは, 基本モデルにおける構造的パルチザン方向を除去しないことを示す。
RLHFは、モデルがパルチザンの知識を消去するだけでなく、パルチザン幾何学から出力生成への因果経路を切断することで、政治的中立性の規範を符号化していることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:00:31 GMT)
The Injection Paradox: Brand-Level Suppression in Safety-Trained LLM Recommendations via RAG Context Injection [0.0] 安全訓練されたクロードモデルでは、プロンプトインジェクションを含む文書は、推奨率の急激な低下を被る。
この抑制は、同じブランドの未修正文書に注入された文書を超えて伝播する。
これらの知見は、相手が相手の文書にインジェクションを埋め込むリバースアタックシナリオの技術的可能性を高める。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:38:33 GMT)
The Human Vulnerabilities & Exploits (HVE) Framework [0.0] サイバー攻撃の成功の大部分は、ソフトウェア欠陥ではなく、人間の行動や心理的脆弱性を悪用している。
社会工学、詐欺、詐欺攻撃は、同等の標準化された枠組みを持っていない。
本稿では,詐欺,社会工学,その他の人間中心の詐欺・攻撃に悪用される行動的・心理的脆弱性を特定し,分類し,軽減するための構造的アプローチであるヒューマン・脆弱性・エクスプロイット・フレームワークを紹介する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:06:18 GMT)
Suppressing the Motion of Rydberg Atoms in Inhomogeneous Electric Fields via Stark Echo [0.0] ライドバーグ原子は強い電気双極子転移と調整可能なエネルギー準位を持つ。
表面から生じる不均一な成層電場は、位置依存のスターク力を引き起こすことができる。
飛行時間と分光法を用いてこれらの効果を実験的に検討した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:19:33 GMT)
Structure-Aware Modeling of Multiple-Choice Questions Improves Automatic Difficulty Estimation [0.0] AQDEは、専門家の判断と競合する難易度推定を得られる可能性があるため、教育評価への期待が高まっている。
AQDE以前の研究では、質問幹と正しいキーにイントラクタを追加することで、難易度予測が一貫して改善されるという証拠が混在していたことが報告されている。
本研究では,その構造的表現に係わる障害情報の有効性を仮定し,分離成分としての障害情報を明示的にモデル化することで,この情報を省略する基準線による難易度推定を改善することを仮定する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:35:49 GMT)
Strong-field control of the $Z$-boson resonance in $e^+e^-$ collisions [0.0] 共鳴$Z$-ボソン生成は精密な電弱物理学の基礎となる。
我々は、強いレーザー場が、この画像を大きく変えることができることを示した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:13:47 GMT)
Spiking Neural Network inference on FPGAs with hls4ml [0.0] Spiking Neural Networks(SNN)は、自然に一時的な機械学習フレームワークを提供する。
多くの科学的リアルタイム推論システムは、同期フィールドプログラマブルゲートアレイ(FPGA)と高レベル合成(HLS)に依存している。
我々は、ピトルチで訓練されたSNNをFPGAファームウェアにクロック駆動で展開できるhls4mlの拡張を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:01:16 GMT)
SoccerNet 2026 Player-Centric Ball-Action Spotting:Retraining and Post-Processing Extensions to the FOOTPASS Baselines [0.0] SoccerNet 2026 Player-Centric Ball-Action Spotting Challengeでは、どのアクションを実行するか、放送されたサッカーの8つのクラスにまたがるタイミングを予測する必要がある。
テストセットで0.548 Macro F1、チャレンジセットで0.446を達成する(サーバ評価)。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:59:56 GMT)
Single plasmon transport in one dimensional nanowire [0.0] 一次元ナノワイヤにおける単一プラズモン輸送の統一的理論的枠組みを導入する。
5個のプラズモン変調で最適化された位置決めは2%の透過率が得られることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:10:49 GMT)
Security-First Approach to API Pipeline Development with Zero-Trust Architecture [0.0] ソフトウェア脆弱性の記録は引き続き加速している。
同時に、APIの利用は、侵害の主要なベクタになっている。
本稿では,APIパイプライン開発のための総合的な"セキュリティファースト"フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:56:12 GMT)
Scribby: A Multi-Level LLM Framework for Semantic Video Analysis [0.0] 本稿では,マクロレベルの理解とマイクロレベルのセマンティック分析のバランスをとるLLMに基づく動画要約フレームワークを提案する。
各評価プロンプトにグローバル転写解析と隣接文情報の両方を組み込むことにより、文レベルの処理中に文脈連続性を保持する。
このフレームワークは、関連性ベースのヒートマップを通じて意味的チャンキングと意味的マッチングを可視化するビデオ解析ツールの基礎を確立する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:41:00 GMT)
Scaling Neural Network Verification with Tensor Parallelism and Fully Sharded Data Parallelism [0.0] 形式的ニューラルネットワーク検証は、実際にはGPUメモリによって境界付けられている。
texttauto_LiRPA,/,$,$-CROWN 検証フレームワークに2つの並列処理手法を適用する。
完全なSharded Data Parallelism(FSDP)は、層ごとの textttAll でのみ重みをシャードし、単一のGPUベースラインと直角に同一なバウンダリを生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:56:29 GMT)
Satellite-Based Quantum Communication: Performance Evaluation of Discrete-Variable Quantum Key Distribution Protocols [0.0] 量子鍵分布(QKD)は、量子コンピューティングの時代において、コミュニケーションに対する基本的なセキュアなアプローチとして登場した。
本論文は衛星ベースのQKDプロトコルの総合的な性能解析である。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:51:25 GMT)
Sambe Approach to Floquet-Lindblad Open Quantum Systems [0.0] 我々は、周期的リンドブラッドマスター方程式によって記述された、駆動的でオープンな量子系について研究する。
オープン量子系の相関関数のスペクトルフロケット表現を得る方法を示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:50:52 GMT)
SPARX: Secure and Privacy-Aware Approximate CNN Acceleration with Edge RISC-V SoC [0.0] エッジAIシステムは、厳格なエネルギー、パフォーマンス、セキュリティ、プライバシの制約の下で、リアルタイムCNN推論を必要としている。
本稿では,不均一な RV32IMC RISC-V System-on-Chip に組み込まれたセキュアでプライバシに配慮した CNN アクセラレーションフレームワークである SPARX について述べる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:02:32 GMT)
RunAgent SuperBrowser: A Theory of Autonomous Web Navigation Grounded in Human Browsing Behaviour [0.0] 本稿では,単一誘導仮説に対して設計された自律型WebナビゲーションエージェントSUPERBROWSERを提案する。
ページを読んでいる人間は、見たすべてのピクセルを保持せず、いくつかの候補のターゲットを見て、それを決定し、ゴールを生き残るために必要なものだけを記憶する。
Mind2Web Hardベンチマークでは、SUPERBROWSERは89.47%の成功を達成し、公開/検索のブラウザエージェントベースラインを大きく上回っている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:18:22 GMT)
Robust Active Learning for Few-Shot Example Selection in Text-to-SQL [0.0] サンプル検索は大規模言語モデルの基盤となる主要なパラダイムである。
我々はこれらの例のアクティブな選択を制約付き実験設計問題として定式化する。
標準的なアクティブな学習フレームワークとは異なり、私たちの設定には3つの重要な課題があります。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:56:24 GMT)
Resource-aware Computation-Communication Overlap for multi-GPU ML Workloads [0.0] 通信オーバーヘッドは、マルチGPUトレーニングにおいて主要なボトルネックとなっている。
本研究では、2つのポータブルランタイム制御を用いた計算と集合通信の同時実行について検討する。
提案手法では,ブロック単位の共有メモリ割り当てによってカーネルの常駐を規制し,通信カーネルが進行するために必要なオンチップリソースを確保できる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:33:03 GMT)
Report the Floor: A Training-Free Conformal Interval Is a Mandatory Baseline for Probabilistic Time-Series Forecasting [0.0] 有限個のスプリット・コンフォーマルな残留量子化でラップされた最後の値点予測値である最も単純な共形間隔は、その近距離不在よりもはるかに強い基底線であることを示す。
この ConformalNaive インターバルは、単純値量子基底線を決定的に破る。
ConformalNaive+は、一直線で、トレーニング不要で、水平順応性のあるセレクタで、各地平線上の2つの相補的なフロアを改善できる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:30:18 GMT)
Relativistic Effects in Spin Correlations Induced by QED Scattering and Wigner Rotations [0.0] 木レベルでは、Mller散乱において2つの電子間のスピン相関が生じる相互作用の性質について検討する。
散乱振幅の非相対論的近似により、双極子-双極子相互作用と電流-双極子相互作用がこれらの相関の出現に寄与することがわかった。
このフレームワークは、非弾性過程$e-e+rightarrow-+$の相関についてコメントするために使われる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:48:51 GMT)
Regimes: An Auditable, Held-Out-Gated Improvement Loop Demonstrated on LongMemEval with ActiveGraph [0.0] イベントソースのエージェントランタイムは、制御された改善をファーストクラスのワークフローに変換する。
エージェントの状態が追加のみのイベントログの決定論的プロジェクションである場合、障害が記録され、実行がログから正確にリプレイされ、候補パッチスコープがタイプされたパイプラインシームに反映され、ゲートが監査可能である。
我々は、ActiveGraphランタイムのループであるRegimesでこれを実証し、失敗した評価を診断し、パイプラインポイントで修復を提案し、静的チェック、サンドボックスの実行、インサンプル評価、ホールドアウトバリデーションの後にのみそれを促進します。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 23:04:35 GMT)
Range-controlled entanglement in Lindbladian skin states of monitored fermions [0.0] 粒子保存散逸はリンドブラディアンの皮膚状態を生み出し、パウリの排除はエッジの蓄積を多体密度の不均衡に変換する。
短距離ホッピングは皮膚の完全蓄積と領域法的な絡み合いと一致しているが, 十分に長距離ホッピングは有限バルクテールを生じる。
したがって、散逸とコヒーレントホッピングは皮膚の局在と量子絡み合いを共同で制御し、密接な相互接続を強調している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:15:18 GMT)
Quantum resources in non-stoquastic quantum annealing [0.0] エントロピーと安定化器のレニイエントロピーがいかに古典計算を指数関数的に困難にするかを示す。
以上の結果から,非確率アニーリングにおける量子性能の向上は,量子計算資源の存在と矛盾することが示唆された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:00:04 GMT)
Quantum Non-Gaussian State Preparation of Levitated Particles via Time-Dependent Control of Weakly Nonharmonic Hybrid Potentials [0.0] 本研究では,様々な量子状態において,浮動小天体の自由度を連続的に変化させる理論的プロトコルを提案する。
本手法は、過渡波動関数の非局在化による非調和効果の弱さを高め、これを電位の最適制御と組み合わせる。
このような制御下での量子状態生成を解析し、非ガウス状態の生成に必要な非調和性、運動的非局在化、許容可能な最大デコヒーレンスを推定する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:14:51 GMT)
Quantum Algorithms for Modulated Circulant Matrix Vector Multiplication [0.0] 変調循環行列は、最近文献で紹介されたN-パラメトリック循環行列の特別なクラスを形成し、ヴァンダーモンデ型に基づく構造的スペクトル分解を行う。
我々は、この行列族に合わせた量子プリミティブである変調量子フーリエ変換(MQFT)を定義する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:24:06 GMT)
Quantitative Performance Analysis of Stopping Criteria for CMA-ES [0.0] 共分散行列適応進化戦略 (CMA-ES) は最先端のブラックボックス最適化アルゴリズムである。
本稿では,CMA-ESにおける11の停止基準がノイズレスBBOB関数セットにどのように作用するかを検討する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:56:38 GMT)
Quality Is Not a Safety Proxy Under Quantization [0.0] 量子化されたチェックポイントは、まず最初に品質メトリクスでスクリーニングされる。
本稿では,51列行列のショートカットが6モデル,4ファミリー,7レベルGGUFラグ,AWQ/GPTQ INT4チェックポイントにまたがっていることを確認した。
モデル間の36種類の品質安全ペアリングはいずれも分割され、9つの隠れダンガー列と1つの隠れダンガー列は品質が安定または改善され、リフレクションは12-68ポイント低下した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:33:49 GMT)
Principled Uncertainty in Clinical AI: End-to-End Bayesian Modelling and Algorithmic Equity Auditing Across Multimodal Patient Data [0.0] 本稿では,(1)完全エンドツーエンドのベイズ不確実性モデリングフレームワークの開発,(2)アルゴリズムエクイティの形式的尺度としてのキャリブレーションされた不確実性推定の適用,という2つの相互接続問題に対処する。
本研究では,モーダリティ固有の変分エンコーダと,精度重み付きレイトフュージョン機構,分解不確実性出力からなる確率論的ディープラーニングアーキテクチャを構築した。
我々は,1000人の模擬患者のデータセットを用いて,社会経済的地位タイプ,年齢グループ,生物学的セックスのエクイティ監査を行った。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:44:15 GMT)
Pretrained, Frozen, Still Leaking: Auditing Cross-Encoder Attribute Transfer in EEG Foundation Models [0.0] 各単一エンドポイント監査は、スペクトル特性を漏洩させるリリースをクリアする。
コントリビューションは、散在する単一エンドポイントのディフェンスを共同リリース決定に変換する監査フレームワークである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:24:03 GMT)
Predictive Assistance and the Temporal Dynamics of Exploratory Compression [0.0] 本稿では,ドリフトの安定化,内因性探索摂動,応答性強化学習によって形成される戦略の景観に注意を向ける動的枠組みを開発する。
結果は、予測システムは探索的認知の幾何学自体を再構築する可能性があることを示唆している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:18:23 GMT)
Precision Is Not Faithfulness: Coverage-Aware Evaluation of Grounded Generation with a Complete Oracle [0.0] 基準自由忠実度測定は、モデルが基底真理に対して行う各原子的クレームを検証する。
彼らが盲点を共有していることを示す:彼らは精度だけを計測し、主張されている主張は支持されているか?
戦略的基底真理が決定論的に導出される領域であるF1テレメトリを用いて、この測定を可能にする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:56:25 GMT)
Powering the Future of AI: Navigating the Trade-offs for Europe's Energy Transition and Net-Zero Goals [0.0] 我々は、DCのさらなる需要、キャパシティ要件、排出、運用への影響を定量化します。
その結果、AIは2050年までに73-723 TWhの余剰需要を加速させ、2030年から2050年の間に67-181 MtCO2の累積排出量を過小評価する恐れがあることが示唆された。
2050年の純ゼロ目標が達成されるかもしれないが、重要な排出リスクは中間年内に現れ、EUはこの加速するデジタルトランスフォーメーションに政策が適応しなければ、その炭素中性目標を損なう可能性がある。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:22:38 GMT)
Phase-only control of GRAPE shaped pulses [0.0] GRAPEアルゴリズムを用いて形状パルスを設計する場合,位相のみの制御と位相と振幅の制御を比較する。
トロタライゼーションは振幅変調と位相変調をシミュレートするために使用することができ、2つのアプローチが基本的に等価であることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:26:19 GMT)
Perturbative results for fractional quantum mechanics [0.0] 分数的なシュルディンガー方程式は、通常の非相対論的形式からわずかに逸脱する運動エネルギーで研究される。
通常の摂動理論は封筒理論と比較して用いられる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:08:21 GMT)
Oversight Has a Capacity: Calibrating Agent Guards to a Subjective, Fatiguing Human [0.0] エージェントは不可逆的な行動をとるので、標準的な安全パターンは、ループ内の人間承認ゲートである。
ゲートは容易な部分であり、難しい部分は、フィールドが2つの誤った仮定に対して評価する判断(どの行動を止めるか)である。
我々の貢献はオープンソースのエージェント監視システムであり、LLMエージェントアクションゲーティング環境でそれらを運用し、測定する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 01:52:22 GMT)
Order parameters and ground-state phase diagram of the interacting topological Su-Schrieffer-Heeger model with extended-range hoppings [0.0] Su-Schrieffer-Heeger(SSH)モデルにおける相互作用と長距離ホッピングの相互作用について検討する。
各位相の順序パラメータ(OP)を導出し,それらを大規模システムシミュレーションで検証する。
非相互作用の場合とは対照的に、派生OPは相互作用の影響下で一方向ホッピングが可能であることを示唆する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:33:11 GMT)
Orange Lab: Lowering Barriers to Data Mining through Embedded Interactive Workflows [0.0] 視覚データ分析のためのWebベースの協調環境であるOrange Labを紹介する。
コアとなるOrange Labは、モジュールコンポーネントから機械学習を視覚的に構築することを可能にする。
ここでは,Orange Labがデータ科学の民主化を効果的に支援し,参入障壁を低くすることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 09:14:55 GMT)
Optomechanically controlled response amplification for enhanced quantum sensing [0.0] キャビティ・オプテメカル・システムにおける強い増幅された動的応答は、量子センシングの強化に有効であることを示す。
光学的相互作用を強化された感受性の体制に調整することにより、弱い摂動は系の応答に不均等に大きな変化をもたらす。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:43:31 GMT)
One Transit Is All You Need: Detecting Exoplanets Through Learned Stellar Behaviour with EXOVEIL [0.0] EXOVEILは、星の明るさがどう見えるべきかを学習し、現実が一致しないときにフラグを掲げるトランジット検知システムです。
16,499のケプラー光曲線でトレーニングされたトランスフォーマー世界モデルでは、トランジットマインドした自己教師付き学習が期待される恒星のフラックスを予測する。
分散重み付けを備えたマッチングフィルタ検出器は、予測残差からトランジット信号を抽出する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:39:10 GMT)
Multi-Scale Feature Attention Network for Polymer Classification Using Terahertz Spectroscopy [0.0] Multi-Scale Feature Attention Network (MSFAN)は、テラヘルツ(THz)データに適した新しいディープラーニングアーキテクチャである。
MSFANは一貫して最先端のモデルを上回り、分類精度は85.2%に達した。
本研究では, THz分光法と深層学習技術を組み合わせて, 効果的, スケーラブル, 解釈可能なポリマーの分類を行う可能性を示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:48:55 GMT)
Momentum-Guided Semantic Forecasting (MoFore) for Self-Supervised Video Representation Learning [0.0] 自己教師型ビデオ表現学習のためのMomentum-Guided Semantic Forecastingフレームワークを提案する。
このフレームワークは、トレーニング中にアクションラベルを使わずに、時間的に一貫性があり、意味的に意味のあるビデオ表現を学習する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:50:01 GMT)
Mechanical Field Networks: Structured Neural Dynamics for Multivariate Systems [0.0] MF-Netは、共有フィールド状態のすべての変数を表すリカレントな動的モデルであり、この状態を学習関係法則によって更新する。
ここでのメカニカルとは、学習された関係が状態に依存したフロー、フィールド応答、運動傾向を形作り、フィールド状態を前進させる移行の相互関係組織を指す。
既知の対話システム、カオスベンチマーク、実際のニューラル記録、生態時系列など、MF-Netは、検査可能な構造的読み出しを維持しながら、競合する短・中水平予測を達成している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:23:16 GMT)
Local Search on Vertex Coloring for Bipartite Graphs [0.0] 本研究では,局所的な最適解を求めるグラフ上での局所探索機能について検討する。
グレーボックスの局所的な検索突然変異演算子を導入し、より頻度の低い色を高い確率で除去する。
これは、ブラックボックスのランダムローカルサーチの指数的なチューン時間を大幅に改善する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:02:43 GMT)
Local Is Not a Sufficient Privacy Boundary: Governing OS-Integrated On-Device AI [0.0] オンデバイスAIのためのOS中心のプライバシフレームワークを開発する。
このフレームワークは、プライバシをデプロイメント属性ではなく、制度的な説明責任の問題として扱う。
我々は、Apple Intelligence/Foundation Models、Android AICore/Gemini Nano、Microsoft Recallのドキュメントバウンド比較を通じて、このルーリックを実証する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:07:11 GMT)
Linguistically Augmented Audio Speech Data (LinguAS) [0.0] LinguASには、Expert-Defined Linguistic Features (EDLFs)で注釈付けされた800以上のオーディオサンプルが含まれている。
ASVspoof 2021のディープラーニングベースラインを超えて,EDLFを付加したデータに基づいてトレーニングしたモデルでは,モデル性能が大幅に向上していることがわかった。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 23:26:39 GMT)
Leveraging Landau-Zener-Stückelberg interference for accelerating diabatic quantum annealing [0.0] 我々は、ランダウ・ツェナー・シュテッケルベルク干渉を、このスピードアップの基盤となるメカニズムとみなす。
本稿では,古典的なスケジュールパラメータの最適化が時間内に可能であることを解析的に示す。
難解な問題事例では,断熱焼鈍と競合性能の大幅な改善が観察された。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:25:42 GMT)
Learning Dynamics Reveal a Hierarchy of Weight-Induced Layerwise Gram Metrics [0.0] 本稿では,フィードフォワードReLUネットワークの読み出しと2次損失について検討する。
目的は、主に重み空間のダイナミクスとしてではなく、トレーニングセット空間上で定義された体で閉じた集合力学として勾配勾配を書き換えることである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:05:38 GMT)
Investigating Calibration Challenges in Probabilistic Electricity Price Forecasting [0.0] 現行の検査基準では、キャリブレーションを犠牲にして予測のシャープネスを優先し、過度に自信を持ち、統計的に信頼性の低い不確実性の推定につながった。
この研究は、理論的なスコアリングと実践的なキャリブレーションの間に重要なギャップを強調し、信頼性が無視された場合、モデルが決定論的予測の単なるプロキシになることを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:07:56 GMT)
Introducing multiplex semantic networks as multifaceted representations of creative associative knowledge across multilingual samples [0.0] 創造性は、知識組織とセマンティックメモリからの検索に依存する複雑な認知能力である。
本研究では、創造性に基づく連想的知識をモデル化するための、より包括的なアプローチとして、多重ネットワークについて検討する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:21:47 GMT)
Interpretable Temporal Facial-Region Motion Analysis for In-the-Wild Parkinson's Disease Video Classification [0.0] 顔面表情低下はパーキンソン病(PD)の一般的な運動障害である
本稿では, 顔領域キーポイントから抽出した時間的動き記述子は, YouTubePDベンチマーク上で, 視線内PD関連映像分類をサポートできるかを検討する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:15:39 GMT)
Hybrid Metaheuristic Combining the Dragonfly Algorithm and Tabu Search for the Traveling Salesman Problem [0.0] 本稿では,Dragonfly Algorithm(DA)とTabu Search(TS)を組み合わせた旅行セールスマン問題(TSP)のハイブリッドメタヒューリスティックを提案する。
提案手法は高レベルリレーハイブリダイゼーション(HRH)方式に従っており、DAは最初に解空間を探索し、有望な初期ツアーを生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:14:50 GMT)
Human-Centred Risk Mitigation for AI-Mediated Information Manipulation: A SOCMINT Framework Based on Information Manipulation Sets [0.0] 本稿では,情報操作セット(IMS)に基づくSOCMINTフレームワークを提案する。
VIGINUM/EEASの対FIMI分析におけるIMSの使用に基づいて、このフレームワークは操作を物語、アカウント、インフラ、時間的パターン、クロスプラットフォーム移行、合成増幅、認知的ターゲティングを含む一貫性のあるプロセスとして扱う。
また、意思決定品質、信頼性校正、緩和比例性を評価するためのテーブルトップ評価プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:12:11 GMT)
How Far Can Prompting Go for Minimal-Edit Ukrainian Grammatical Error Correction? [0.0] ウクライナ文法誤り訂正(GEC)におけるAPIアクセス大型言語モデル(LLM)の優位性
我々は、UNLP 2023 GEC のみのベンチマークで、4つのプロバイダと1つのオープンソースウクライナモデルから11の商用 LLM を評価した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:00:56 GMT)
History of the Muddy Children Puzzle [0.0] 我々は過去2世紀にわたる論理的・文学的な出版物を通じて、マディ・チルドレン・パズルの起源を辿った。
このパズルは数字や色のついた帽子など様々なバリエーションに影響を与えた。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 07:45:05 GMT)
Hardware-Aware QAOA for Honeypot Traffic Partitioning on 100+ Qubit IBM Quantum Processors [0.0] デニアル・オブ・サービス(DoS)と分散デニアル・オブ・サービス(DDoS)の緩和には、悪意のあるトラフィックと良質なトラフィックを分離すると同時に、正当なユーザへの障害を最小限に抑える必要がある。
以前の研究では、ハニーポットのトラフィックパーティショニングを重み付けされたMaxCut問題にマッピングし、変動量子アルゴリズムで得られたグラフを解くことを提案した。
我々は、この原理の証明を再現可能なイベントレベルハニーポット・ツー・QUBOパイプラインで拡張し、16、32、66、110のイベントノードを持つ時間的二部グラフをラベル付けし、IBM量子ハードウェア上でのQAOA実行、古典的ベースライン、ノイズレス行列製品状態参照、ルーティングオーバヘッドで拡張する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 13:24:55 GMT)
Graviton-mediated entanglement due to light bending from a quantum rotor [0.0] 重力の量子的性質の重要なテストの1つは、物質と光子の間の重力の仮想メディエーターが量子光を曲げる現象を引き起こすかどうかをテストすることである。
本稿では,量子ロータと光子を用いたオプティメカルセットアップにおいて,量子重力相互作用による絡み合いの発生について検討する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:00:03 GMT)
Gated Bidirectional Linear Attention for Generative Retrieval [0.0] Gated Bidirectional Linear Attention (GBLA) は、カーネル化された線形アテンションを3つの軽量コンポーネントで拡張する線形時間双方向アテンション層である。
GBLAは、FlashAttention-v3と比較して、最大8.2倍の1層スピードアップで32768の履歴を持つことを示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:58:58 GMT)
GD-MIL: Grade-Disentangled Multiple Instance Learning for Multimodal Biochemical Recurrence Prediction in Prostate Cancer [0.0] GD-MIL(GD-Disentangled MIL)は,逆行性逆行性逆行性逆行性を持つゲートアテンション型MILエンコーダである。
GD-MILはC-index 0.704を達成し、臨床ベースラインと最高の画像のみのモデルの両方を著しく上回っている。
中央のリスク分割は、BCRのない生存において、対数 p 0.0001 の分離をもたらす。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:59:40 GMT)
From inverse problems to neural operators: prediction, mechanism, and generalization of data-driven models [0.0] 我々は、多くのモデル型が共通の構造を持ち、それらが定義する入出力関係の仮定モデルクラスでのみ異なることを論じる。
私たちの分析は、明らかに異なるモデリング戦略を統一し、適切なユースケースに関する洞察を提供することを目的としています。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:58:15 GMT)
From Pauli Strings to Quantum Dynamics: A Unified Characterization [0.0] 問題を単純化する多くの例外的性質を満たすパウリ弦の設定に焦点を当てる。
我々は、パウリ・リー代数と、超曲面によって生成されるクリフォード群のある種の部分群の間の深い関係を見つける。
我々は、渡河によって生成されるクリフォード部分群が対応するパウリリー群に対して3つの設計を与えるという基本的な方法を示す。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:33:15 GMT)
From Genes to Tokens: a GWAS-inspired Approach for Interpretable Stylometric Analysis [0.0] 方法は英語、ドイツ語、ロシア語のコーパスに適用される。
それぞれの"gen"トークンと"phenotype"オーサシップの関連性をテストする。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:25:30 GMT)
Frequency-based Constrained Sampling for Interval Patterns [0.0] サンプリング手順に制約を直接組み込むサンプリング手法であるCFipsを導入する。
制約パターン空間内の周波数に比例してCFipsが間隔パターンをサンプリングすることを証明する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:49:18 GMT)
Exploratory Responsiveness and Adaptive Rigidity under AI-Assisted Optimization [0.0] 本稿では,AIによる最適化の下で探索適応の理論を開発する。
我々は、AIシステムの長期適応効果は、探索応答性そのものと予測支援がどのように相互作用するかに大きく依存していると主張している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:15:12 GMT)
Entanglement-assisted continuous-variable concatenated codes for encoding qubits or oscillators [0.0] 本稿では,EA安定化器のコードをGKPコードでチェーンするqubit-into-oscillatorsd符号のEAバージョンを提案する。
2つの最大エンタングルモード(エモーデ)を使い、データモードの位置と運動量2次誤差のばらつきを抑える3ビットEA繰り返し符号を符号化したGKPを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 11:57:00 GMT)
Entanglement Generation through Coherent and Non-Coherent Control [0.0] 本稿では,ベルクラス,GHZクラス,Wクラスに属する絡み合った状態が,完全に分離可能な入力から決定的に生成されることを示す。
解析をノイズのあるシナリオに拡張し、分離可能な混合状態は、経路重畳と不定因数順序配置で配置された一対のパウリチャネルを通して進化する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 15:09:53 GMT)
Energy-Modulated Time-Asymmetric Spontaneous Collapse: Forward-Backward Dynamics from Stochastic Ito Reversal and Bright Solitons [0.0] 立方晶非線形シュロディンガー方程式(CQ-NLSE)の定式化における伊藤場反転から生じる対称性の破れと量子的不可逆性
時間反転はイオ構造と根本的に相容れないことが示され、2/3の普遍的非対称性結合パラメータが生じる。
非常に明るいソリトン溶液は、魅力的なLi-7原子の準1次元BECに対して、前方および後方の振幅比1.870で得られる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:26:28 GMT)
Emotion Profiling in LLM-Based Literary Translation: Systematic Shifts Across MT and Post-Editing [0.0] 我々はマーガレット・アトウッドの『オリックス』と『クレイク』を、編集後のバージョンと人間の翻訳と比較する。
MTシステムは、翻訳全体にわたって、モデル特異的で統計的に有意な感情的な指紋を導入している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:46:00 GMT)
Effective Training Principles of Physical Reservoirs [0.0] 貯留層コンピュータは、リッチでしばしば非線形なダイナミクスを提供する光学現象の固有の複雑さの恩恵を受ける。
しかし、貯水池の出力を直接訓練すると、システムは過度に適合し、訓練期間中に計算的に非効率になる。
オーバーフィッティングを緩和し、出力プルーニングと正規化によって計算オーバーヘッドを削減する戦略について検討する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 20:07:05 GMT)
Dynamic scaling and Family-Vicsek universality in the Hubbard model at infinite temperature [0.0] 無限温度における一次元ハバードモデルにおける電荷・スピン・エネルギーゆらぎの家族-粘性スケーリングについて検討した。
長時間のスケーリング動作は可積分性によって制御される。
いずれの場合も、動的スケーリングウィンドウが設定される前に、明らかに普遍的な弾道成長を伴う短時間の顕微鏡状態も観察する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:59:44 GMT)
Dropout-GRPO: Variational Stochasticity for Continuous Latent Reasoning [0.0] Coconutのような潜在推論モデルは、個別のチェーンオブソートトークンの代わりに、継続的に隠れた状態をフィードする。
グループ関係強化学習を継続的潜在推論に適用することは困難であることが証明された。
1つのベルヌーイマスクを与えられたロールアウトに対して全ての遅延繰り返しステップで一定に保持することにより、本質的な軌道分散を生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:21:42 GMT)
Document-Authored Control-Signal Impersonation: A Low-Cost Indirect Prompt Attack on RAG Safety Boundaries [0.0] Document-Authored Control-Signal Impersonation (DACSI) は間接的なプロンプトインジェクション内での非イペラティブなメタデータのようなペイロードサブクラスである。
我々は,DACSIを6つのモデル設定,プロンプト圧レベル,インジェクションベースライン,信号,RAGを用いたパイプライン,システム制御プローブ,ソースオーソリティ属性プローブ,合成カナリアフォーマットで評価した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 04:09:00 GMT)
Divide-and-Conquer Modeling for the CTF-4-Science Lorenz Benchmark [0.0] この研究は、12の隠れスコアと5つのシナリオファミリーにわたるカオスシステム予測を評価する。
1つのモデルクラスに全てのレシエーションを処理するように強制するのではなく、最終システムは各予測ブロックとタスクグループの評価動作を一致させた。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:08:22 GMT)
Diagnosing Evidence Utilization in Long-Context and Retrieval-Augmented Language Models under Matched Evidence Conditions [0.0] モデルはパラメトリックの先行情報から回答したり、存在する証拠を使わなかったり、関連するテキストを最終回答に変換することなく引用したりすることができる。
本稿では,エビデンス利用評価のための4条件診断プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 19:53:29 GMT)
Density Ridge Selective Prediction for LLM and VLM Hallucination Detection under Calibration Label Scarcity [0.0] 大規模言語と視覚言語モデルにおける幻覚検出は、選択的な予測としてますますフレーム化されている。
教師なしサンプリング検出器(Semantic Entropy, EigenScore)はラベルは避けるが、質は高い。
教師型プローブ (SAPLMA) は, キャリブレーションラベルが乏しい場合に, 高い分布値を得ることができたが, 急激な劣化がみられた。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 21:36:12 GMT)
Deep Slice Interpolation for Reducing Through-Plane Anisotropy and Noise in Head CT [0.0] 本稿では,隣接する一対の軸スライスから中間CTスライスを合成する深層学習システムを提案する。
このシステムは、3次元の可視化を改善しながら、自然に識別された出力を同時に生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:45:51 GMT)
Controlling multiparameter quantum estimation in exciton-optomechanics system [0.0] ハイブリッドエクシトン-オプトメカニカルシステムにおけるマルチパラメータ量子推定について検討する。
温度, 駆動力, 最適結合強度, 散逸速度など, いくつかの実験パラメータの影響について検討した。
我々は,強いハイブリッド相互作用と低温状態が推定精度を大幅に向上させることを示した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:51:32 GMT)
Continuous Neural Reparameterization as a Deep Geometric Prior for Robust Fixed-Chart UV Repair [0.0] 固定チャートUVアンラッピングを連続神経リパラメトリゼーションとして再放送した。
Laplace--Beltramiスペクトル入力、Tutte残留ウォームアップ、$C2$行列拡張、妥当性チェックされた再試行/フォールバックルーティングを組み合わせる。
コンパクトプリカットチャートと47チャートの層状化Thingi10K/xatlas-cutベンチマークでは、ニューラルソルバはすべてのコンパクトチャート上でゼロフリップを生成し、42/47の有効なゼロフリップ層状解を生成する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:26:03 GMT)
Complex-gauge control of anomalous Floquet corner responses in a non-Hermitian physical-synthetic photonic lattice [0.0] 準エネルギー0の異常角対と(/T)の異常角対が3つの異なる物理層を示すことを示す。
同じトポロジカル共存セクターは、局所的な光学測定において、明るい、肌が暗く、またはフラックスが暗くすることができる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:53:14 GMT)
Capacity, Not Format: Rethinking Structured Reasoning Failures [0.0] それまでの作業では、構造化された生産物は推論税として扱われていたが、このフレーミングは不完全である。
情報マッチングされた散文制御と4段階のスキーマ勾配を用いて,プロンプト長のコンファウンドからフォーマット固有の効果を分離する。
構造化フォーマットはキャパシティに依存している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:26:54 GMT)
Business World Model [0.0] 本稿では,ビジネスおよび組織環境に特化した世界モデルであるBWMの概念とアーキテクチャを紹介する。
人工知能、認知科学、制御理論の世界モデルにインスパイアされたBWMは、自律的な意思決定を支援するためにビジネス状態、ダイナミクス、制約、目的、実行可能なアクション空間を符号化する。
このフレームワーク内では、エージェントは代替アクションシーケンスをシミュレートし、将来のビジネス成果への影響を見積もり、不確実性の下でトレードオフを評価することができる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:16:04 GMT)
Brain-Prompt Injection: A Route-Safety Audit for BCI-LLM Agents [0.0] BCI-to-agentパイプラインは、デコードされた神経活動をツール使用エージェントの認可チャネルに変える。
強調的なデュアルデコーダ攻撃は、EEG側またはテキスト側モニターが盲目のままである間、ルートされたアクションを全て変更できる。
このスタックのルート安全性は、監査ログが監視できるものに依存し、デコーダの正確性や合意のみに依存しない。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 10:19:34 GMT)
Bittensor Agent Arenas as a Trajectory Primitive: Distilling a Shopping Agent from ShoppingBench Subnet Traces [0.0] 小型のエージェント・トレーニングは、アルゴリズムが消費する軌道基板よりもボトルネックが少なくなる。
インセンティブに整合したエージェントアリーナを設計してそのような軌道を製造できることを論じる。
Wen Subnet 15 (SN15, Bittensor deployment of the ShoppingBench agentic-Commerce benchmark。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 18:39:15 GMT)
Beyond Probabilistic Similarity: Structural, Temporal, and Causal Limitations of Retrieval-Augmented Generation in the Legal Domain [0.0] Retrieval-Augmented Generationは、法的AIにおける信頼性の欠如に対する標準的なアーキテクチャ上の応答となっている。
これらの失敗は、確率的検索と法知識の階層的、時間的、制度的構造との間のアーキテクチャ上のミスマッチの兆候であると主張する。
まず、古典的法理論から派生した三つの性質として法知識のオントロジ的コミットメントを明記する。
第2に, 機能的定義, 故障機構, 正準例, 検出基準による検索の3つの病態(メレオジカルブラインドネス, ダイアクロニックブラインドネス, 因果不透明度)を同定する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:46:53 GMT)
Bayesian Optimization for Learning Nonlinear MPC in Autonomous Agent Navigation [0.0] 提案するフレームワークはロボット非依存であり,ガゼボを用いたシミュレーションにおいて,Unitree Go2の4倍の精度で評価されている。
完全なシステムは、デプロイ時に最大90.0%のナビゲーション成功率を達成するとともに、シミュレーション環境全体の評価指標を平均38.9%改善する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:08:09 GMT)
Backward Coherence and Hidden-State Stability in Recurrent Neural Networks: A Quasi-Reverse-Martingale Theory [0.0] リカレントニューラルネットワークは隠れ状態の$h_t$を維持しているが、確率的意味はしばしば不明である。
エンフバックワードコヒーレンス(enmphbackward coherence)を用いて隠れ状態安定性について検討し、学習した後方プロジェクタによって$h_t+1$から$h_t$を再構成できる範囲について検討する。
これにより、ほぼ公理収束、混合の速度、解釈可能な制限表現、有限経路停止時間、時間一様信頼系列の理論的枠組みが得られる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 02:20:29 GMT)
Automating the Expert Eye: A System-Agnostic Deep Learning Framework for Rare Event Discovery in Imbalanced Force Spectroscopy [0.0] 自動SMFSトリアージにおける極端なクラス不均衡を克服するために,システムに依存しない,解釈可能なディープラーニングフレームワークを提案する。
我々はこの枠組みをR. champanellensis cellulosomeの複雑な機械的展開経路で評価した。
経験的に二重重み付けされたトリアージシステムを実装することで、パイプラインは自動的に880のバックグラウンドノイズトレースを破棄した。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:24:58 GMT)
Automated Pronunciation Evaluation for Korean Toddler Speech using Speech Diarization and Self-Supervised Learning [0.0] 音声障害は韓国の小児コミュニケーション障害の約44%に影響を及ぼす。
本稿では,韓国の幼児音声の自動発音評価のためのエンドツーエンドパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 22:07:59 GMT)
AutoMegaKernel: A Statically-Checked Agent Harness for Self-Retargeting Megakernel Synthesis [0.0] AutoMegaresearchKernel (AMK)はHuggingFace Llamaファミリーモデルを単一の永続的なカーネルにコンパイルし、1回の起動で全前方パスを実行する。
AMKは、高帯域のトレーニングクラスであるA100/H100でcuBLASをパスし、ハーネスがクロスSM同期ボトルネックをローカライズする。
これはデコード位置0における精度非対称(W8A16とbf16)の比較であり、最大の実チェックポイントはTinyLlama-1.1Bである。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:02:03 GMT)
Anomaly Detection and Root Cause Analysis for Microservice Systems [0.0] マイクロサービスシステムは、クラウドアプリケーションを構築するために広く使われていますが、その複雑さにより、障害は避けられません。
この論文は、マイクロサービスの障害に対する自動異常検出と根本原因分析を前進させる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 00:50:43 GMT)
Analog quantum simulation of chiral magnetic dynamics using optical superlattices [0.0] 光学超格子中の超低温原子を用いたキラル磁気力学のアナログ量子シミュレーションを提案する。
ゼロゲージ結合極限における質量シュウィンガーモデルは、フェルミオン質量と位相角を超格子パラメータにエンコードしたライス・ミールモデルに写像する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:29:42 GMT)
An Empirical Audit of Input Encoders for Multi-Channel Signal Transformers [0.0] マルチチャネルスカラー信号を消費するトランスフォーマーは、時間ステップ毎に$C$同時値を1つの$d_textmodel$-dimensionalベクトルに埋め込む必要がある。
我々は、8つの入力エンコーダ(共有スカラーベースライン、チャネルごとの線形射影、明示正規化器、非線形論理的、ブロック分割結合、チャネル非依存、チャネル・アズ・トークン)を監査する。
標準のチャネルごとの線形射影は、小さな、統計的に現実的だが実質的には控えめな差まで、あらゆる選択肢と一致している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 08:15:04 GMT)
An Agency-Transferring Model-Free Policy Enhancement Technique [0.0] 訓練強化学習(RL)は、ゼロから行うのに費用がかかる。
多くの制御問題は、既に基本線として利用できる機能的だが準最適ポリシーを持っている。
本稿では,そのようなベースラインをRLトレーニングプロセスに組み込む手法を提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 17:59:39 GMT)
An 84-Format Numeric Catalog with Bit-Exact Conformance Vectors: A Vendor-Neutral Reference for FP8, BF16, MXFP4, and Microscaling Formats [0.0] 本稿では,13のファミリーと6のビット仕様適合パックにまたがる84の数値フォーマットのカタログについて述べる。
パッケージはml_dtypes 0.5.4 (Google/JAX) に対してクロスバリデーションされる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:04:15 GMT)
Algebraic Kolmogorov--Arnold representation theorem for quantum measurement [0.0] 古典的なコルモゴロフ・アルノルド・アルノルド表現定理を量子情報理論に結びつける。
我々は、非絡み合ったマルチキュービット積状態の任意の物理的性質が、局所的可観測物の有限で固定された集合を正確に利用できることを証明した。
内部測定演算子に作用する有界な物理的摂動に対して、表現が安定であることを証明する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 14:57:41 GMT)
Alcmean's: Unsupervised community detection using local Laplacian, automatic detection of the number of centers [0.0] コミュニティ検出は複雑なネットワーク解析における根本的な問題である。
Louvain、LPA、モジュラリティ最適化といった従来のアルゴリズムは手動のパラメータチューニングを必要とすることが多い。
本稿では,新しいコミュニティ検出アルゴリズムであるALCMeansを提案する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 06:53:21 GMT)
Agent Economics: An Entropy-Controlled Pluralistic Alignment Framework for Preventing Artificial Hivemind in Autonomous Agents [0.0] 本研究では,自律型エージェント経済における2つの重要な課題に対処するために,行動プロトコルフレームワーク(BPF)を提案する。
提案されたBPFは、メンタライズベースのソーシャルインテリジェンス(MbSI)、多元的アライメント(PA)、検証可能な実行カーネル(VEK)の3つのコアモジュールで構成されている。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 05:10:16 GMT)
AI Assurance in UK Defence: Challenges in Operationalising JSP 936 [0.0] 本報告では、イギリス防衛におけるAI保証のための936パート1の運用における実践的課題について検討する。
報告書は、936は有益なガバナンス基盤を提供するが、その実装は未解決の技術、組織、保証の問題に依存していると主張している。
このレポートは、防衛全体にわたるAIの野心的で安全で責任ある採用のために、さらなる方法、ガイダンス、組織能力が必要である分野を特定している。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 12:28:55 GMT)
A systematic investigation of molecular encoding methods for drug property predictions across neural network and Transformer encoder-based model [0.0] 分子特性予測のための最適分子符号化法について検討した。
分子エンコーディング法では,従来のトポロジカルフィンガー,サブストラクチャーベースフィンガー,文字列ベースフィンガーなど,いくつかの種類の指紋について検討した。
本研究は,有効な分子エンコーディング法を選択するための実践的ガイダンスを提供し,薬物発見のための解釈可能な分子情報学手法の開発に寄与する。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 03:16:44 GMT)
A Bell-State Extension of Loop-Back Quantum Key Distribution [0.0] 本稿では,Loop-Back QKDアーキテクチャのベル状態拡張について述べる。
測定不要な遠隔端末の定義特性を保ちながら、効率と検出性を向上させる。
論文参考訳(メタデータ) (Mon, 08 Jun 2026 16:46:22 GMT)