Agents' Last Exam [265.9] 本稿では,AIエージェントを長期的,経済的に価値のある実世界のタスクで評価するためのベンチマークであるエージェントのLast Exam(ALE)を紹介する。
ALEは250以上の業界の専門家と共同で開発され、O*NET / SOC 2018を参照して定義された非物理産業をカバーしている。
現在の結果は、最も硬い層が飽和していないことを示している:主流のハーネスとバックボーンの構成で、平均フルパスレートは2.6%である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:20:46 GMT)
Crafting Your Evolving Dreams: Concept-Incremental Versatile Customization [121.5] カスタム拡散モデル(CDM)は、パーソナライズされた概念を生成する能力のため、大きな関心を集めている。
本研究では,概念の多元的カスタマイズを可能にする新しいCCDM(Continuous Customizable Model Diffusion)を開発した。
概念無視の課題に対処するために,制御可能な地域文脈合成戦略を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:22:51 GMT)
Prioritization of Risks from Artificial Intelligence: A Delphi Study of 272 International Experts [115.3] 2025年末に272人の国際AI専門家を対象に行われた3ラウンドのDelphi研究の結果を報告する。
専門家は、リスクと重大さ、セクターとアクターの脆弱性、アクターの責任、全体的な懸念について、24のAIリスクを評価した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:14:41 GMT)
GRAIL: Generating Humanoid Loco-Manipulation from 3D Assets and Video Priors [113.7] GRAILは3Dアセット、シミュレーター対応シーン、およびビデオファンデーションモデル(VFM)の先行データで構成され、物理的環境を再構築したりロボットを遠隔操作したりすることなく対話を合成するデジタル生成パイプラインである。
GRAILは、オブジェクト形状、カメラパラメータ、メートル法スケール、環境深度、ロボットが提案する文字がビデオ生成の前に知られ、再構成中に再利用される、完全に定義された3D構成から始まる。
我々は、回復した動作をヒューマノイドロボットに再ターゲティングし、補完的なタスク・ジェネラル・モルフォロジー・トラッカーを訓練する。
GRAILは、ピックアップ、オブジェクト操作、着座にまたがる2万以上のシーケンスを生成する
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:57:45 GMT)
AlphaQ: Calibration-Free Bit Allocation for Mixture-of-Experts Quantization [104.1] 混合精度量子化は、異なるビット幅を異なる専門家に割り当てることで、フットプリントを大幅に削減することができる。
既存のアプローチは、専門家の重要度を推定し、ビット割り当てを決定するためにキャリブレーションデータに依存している。
我々は,MoE量子化のためのキャリブレーションフリーなビット割り当て手法であるAlphaQを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:03:18 GMT)
LeanMarathon: Toward Reliable AI Co-Mathematicians through Long-Horizon Lean Autoformalization [104.1] 信頼性の高い研究レベルのLean AutoformalizationのためのマルチエージェントハーネスであるLeanMarathonを紹介します。
4つのコントラクトスコープエージェントがこの青写真を構築し、監査し、証明し、修復する。
我々は4つのErds問題にまたがる最近の2つの研究論文でLeanMarathonを評価した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:09:39 GMT)
Audio Interaction Model [102.4] 今日のLALM(Large Audio Language Models)はオフラインであり、ストリーミングオーディオモデルはASRや音声チャットのような単一のタスクのみを処理する。
それは、常時オンの知覚・認知応答ループを通じて、音、環境、指示をリアルタイムで聞き、リアルタイムで反応するモデルである。
我々は,この仕組みをオーディオインタラクションモデルとして定式化し,オフラインタスクの実行を継続する統合ストリーミングモデルであるAudio-Interactionで実現した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:26:11 GMT)
Towards Accurate Model Selection in Deep Unsupervised Domain Adaptation [86.2] 深層非教師付きドメイン適応(Deep UDA)メソッドは、ソースドメイン内のリッチなラベル付きデータを利用して、ターゲットドメイン内の関連するがラベルなしデータのパフォーマンスを高める。
Deep UDAの既存のモデル選択方法は、非常に偏りがあり、制限され、不安定で、あるいは議論の余地さえある(ラベル付きターゲットデータを要求する)。
適応された特徴表現を検証手順に組み込んだtextitDeep Embedded Validation (textbfDEV) を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:45:01 GMT)
LEAP: Supercharging LLMs for Formal Mathematics with Agentic Frameworks [85.9] 大規模言語モデル(LLM)は、強力な非公式な数学的推論を示すが、リーンのような形式言語で検証可能な証明を生成するのに苦労している。
本稿では,汎用基礎モデルによる自動形式定理証明の最先端性能を実現するためのエージェントフレームワークであるLEAPを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:16:05 GMT)
Stateful Visual Encoders for Vision-Language Models [85.8] 視覚言語モデル(VLM)は、意思決定が視覚的変化に依存するマルチイメージ、マルチターンエージェント設定において、ますます使われている。
既存のオープンウェイトなVLMでは、ビジュアル比較は言語モデル内でのみ行われ、ビジュアルエンコーダ自体はステートレスのままである。
我々は、先行する視覚的特徴に対して各視覚的表現を条件付けるステートフルビジュアルを導入する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:31:15 GMT)
AutoLab: Can Frontier Models Solve Long-Horizon Auto Research and Engineering Tasks? [84.5] 我々は超長距離閉ループ最適化のための新しいベンチマークであるAutoLabを紹介する。
AutoLabは4つの異なるドメインにまたがる36の現実的で専門家によるタスクで構成されている。
我々は、真に有能な長距離エージェントに向けた研究を加速するために、全ベンチマーク、評価ハーネス、タスクアーティファクトをオープンソース化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:36:54 GMT)
Scene-Centric Unsupervised Video Panoptic Segmentation [83.0] ビデオパノプティクスセグメンテーション(VPS)は、ビデオを意味的に一貫した領域に分割しながら、すべてのオブジェクトを共同で検出、分割、追跡することを目的としている。
我々は、最初の教師なしVPSアプローチであるVideoCUPSを提案する。
VideoCUPSは、監督されていない深さ、動き、視覚的手がかりを利用して、シーン中心のビデオから時間的に一貫したパノラマビデオ擬似ラベルを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:19:55 GMT)
MeshFlow: Efficient Artistic Mesh Generation via MeshVAE and Flow-based Diffusion Transformer [82.3] MeshFlowは、アーティストのような3Dメッシュを生成する新しい方法だ。
我々のモデルは最速のARジェネレータより18倍速くメッシュを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:57:15 GMT)
Dual-Stream MLP is All You Need for CTR Prediction [81.9] クリックスルー率(CTR)の予測は、オンライン広告とレコメンデーションシステムにおいて重要な役割を担い、小さな改善でも収益を大幅に増やすことができる。
既存の研究は主に、明示的かつ暗黙的な視点から効果的な複雑な機能相互作用を捉えるために、デュアルストリームアーキテクチャの設計に焦点を当てている。
これらのアプローチは,1) 計算要求と過度に適合するリスクを増大させる機能相互作用学習の複雑さと,2) モジュールの出力が最終予測を支配できる明示的モジュールと暗黙的モジュールのバランスの2つの大きな課題に直面する。
我々は,CTR予測タスクのための新しい機能相互作用フレームワークであるDual-Stream (DSMLP)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:34:32 GMT)
The Meta-Agent Challenge: Are Current Agents Capable of Autonomous Agent Development? [80.2] 本稿では,自律エージェント開発のためのフロンティアモデルのキャパシティをテストするための評価フレームワークであるMeta-Agent Challenge(MAC)を紹介する。
評価の整合性を確保するため、このフレームワークは報奨ハッキングに対する多層防御によって確保される。
メタエージェントは人間工学的な基本方針とほとんど一致せず、その一部はプロプライエタリなフロンティアモデルに支配されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:58:17 GMT)
Towards Pretraining Text Encoders for TabPFN [78.6] TabPFNのようなタブラル基礎モデルは、数値データと分類データを持つデータセット上で強力なパフォーマンスを達成する。
TabPFN Text Adapter (text-to-TFM token projection) を導入する。
この設計はPCAのボトルネックを排除し、TabPFNの数値的な強みを保ち、エンドツーエンドのテキストタブラルパイプラインよりも訓練が効率的である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:38:47 GMT)
Representation Forcing for Bottleneck-Free Unified Multimodal Models [77.0] 統一マルチモーダルモデル(UMM)は、単一モデルにおける知覚と生成を扱うことを目的としている。
既存のUMMは、画像生成のために別々に訓練された凍結したVAEに依存しており、構造的なボトルネックを示唆している。
本稿では,表現予測をモデルのネイティブ機能にすることで,このギャップを埋める手法であるRepresentation Forcing(RF)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:27:19 GMT)
PhyScene3D: Physically Consistent Interactive 3D Tabletop Scene Generation [75.9] 3Dテーブルトップシーンの生成は、インタラクティブでジェネラリスト的なロボット学習の基本的な問題である。
本稿では,PhyScene3Dについて紹介する。
実験により、PhyScene3Dは意味的精度と物理的妥当性の両方において最先端のアプローチより優れていることが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:26:24 GMT)
TIDE: Proactive Multi-Problem Discovery via Template-Guided Iteration [75.0] 2つの補完機構を備えたテンプレート誘導反復フレームワークであるTIDEを紹介する。
我々は,すでに発見されているものを条件付けながら,ラウンド毎に少数の候補を探索する反復探索を提案する。
単一ショットと並列マルチエージェントのベースラインをタスクカバレッジ,識別,解像度で比較すると,大幅に向上した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:23:08 GMT)
Towards Verifiable Multimodal Deep Research: A Multi-Agent Harness for Interleaved Report Generation [74.1] レポート生成のためのマルチエージェントハーネスであるPtahを提案する。
Ptahは計画、研究、執筆段階を通じて、ユーザクエリからレンダリングされたWebレポートまでのライフサイクルを編成する。
検証エージェントがハーネスの受け入れ機能として機能し、ワークフロー全体を通して事実的接地、引用の忠実性、相互の整合性を強制する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:03:26 GMT)
COMBINER: Composed Image Retrieval Guided by Attribute-based Neighbor Relations [73.4] By attrIbute-based NEighbor Relations (COMBINER) によるCOMposed画像検索ネットワークについて紹介する。
具体的には,まずアダプティブ・セマンティック・ディスタングルメント・モジュールを設計する。
次に, クロスモーダルな統一プロトタイプを構築可能なUnified Prototypeベースのコンポジションモジュールを提案する。
最後にDual Relations Modelingモジュールを導入し、属性の類似性に基づいてペアと隣り合う関係をマイニングする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:43:51 GMT)
Z-FLoc: Zero-Shot Floorplan Localization via Geometric Primitives [72.6] そこで本研究では,ゼロショットフロアプランのローカライズ手法を提案する。
我々の重要な洞察は、支配的な幾何学的プリミティブが人間が作った環境でユビキタスであることである。
シミュレーションと実世界の両方のデータセットの実験により、我々のアプローチは、目に見えない環境における最先端の学習ベースの手法よりも優れています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:14:24 GMT)
Evaluating Large Language Models in Dynamic Clinical Decision-Making with Standardized Patient Cases [71.1] MedSP1000 (MedSP1000) は、SP由来の臨床エージェント評価のための対話型ベンチマークである。
ピアレビューされたSPの授業ケースを、定義されたSPケーススクリプト、臨床環境コンテキスト、人為的な構造化ルーブリックで実行可能なシナリオに変換する。
MedSP1000を多種多様な汎用および医療用LLMに適用すると、静的ベンチマークの性能がそのような教育シナリオに確実に変換されないことが分かる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:17:16 GMT)
Measurement-induced state transitions in multi-qubit transmon processors [70.4] 回路QEDにおけるトランモン量子ビットの分散読み出しは、小さな測定駆動振幅で量子非劣化特性を失うことが知られている。
我々は、キュービットやカプラなどの他の成分の存在が、測定されたトランスモンのMIST閾値に影響を及ぼすことを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:30:38 GMT)
Scaling Self-Evolving Agents via Parametric Memory [70.0] 既存のメモリ拡張LDMエージェントは、過去の経験をプロンプト空間にのみ保存する。
自己進化型パラメトリックメモリフレームワークである textttTMEM を導入する。
textttTMEMは、様々なモデルスケールで要約ベースのベースラインと検索ベースのベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:18:31 GMT)
Entropy Is Not Enough: Unlocking Effective Reinforcement Learning for Visual Reasoning via Vision-Anchored Token Selection [68.2] VEPO(Vision-Entropy token-selection for Policy Optimization)は,視覚感度とトークンエントロピーを明示的に統合した効果的なRLフレームワークである。
実験の結果,VEPOの先行性能は7Bスケールで2.28点,3Bスケールで3.15点,エントロピーのみのベースラインを著しく上回った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:57:29 GMT)
Imagine Before You Draw: Visual Prompt Engineering for Image Generation [67.8] 内部フレームワークにシームレスに統合可能なVisual Prompt Engineering (VPE)を提案する。
我々は,クラス条件生成,テキスト・ツー・イメージ生成,画像編集にまたがってVPEを検証する。
その結果, VPEはコンバージェンスを加速し, 天井の質を高め, 内部統合により, 編集保存性を大幅に向上することがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:01:36 GMT)
Harnessing Generalist Agents for Contextualized Time Series [67.3] 時系列はしばしば、全体モデリングに不可欠なリッチな文脈に埋め込まれる。
本稿では時系列のエージェントハーネスフレームワークであるTimeClawを紹介する。
TimeClawは、グラウンドドと監査可能な分析のための実行可能な時間的ツール、再利用可能な分析ルーチンを作成するためのエクスペリエンス駆動機能進化、関連する推論トレースを取得するためのエピソードマルチモーダルメモリを統合している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:20:34 GMT)
AAD-1: Asymmetric Adversarial Distillation for One-Step Autoregressive Video Generation [66.6] AAD-1は、一段階の自己回帰画像-ビデオ生成のための非対称な対数蒸留フレームワークである。
AAD-1は1ステップの自己回帰ビデオ生成において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:26:01 GMT)
CyberGym-E2E: Scalable Real-World Benchmark for AI Agents' End-to-End Cybersecurity Capabilities [66.5] CyberGym-E2Eは大規模かつ現実的なエンドツーエンドのサイバーセキュリティベンチマークである。
脆弱性発見、PoC生成、パッチ生成の全ライフサイクルにわたって、AIエージェントの能力を包括的に評価する。
ベンチマークは、139の異なるオープンソースプロジェクトで920の現実世界の脆弱性で構成されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:06:37 GMT)
SocraticPO: Policy Optimization via Interactive Guidance [64.8] 大規模言語モデルのための強化学習(RL)は通常、二項正当性のようなスカラー結果の報酬を伴う推論を監督する。
我々は、ソクラティックスタイルの自然言語ガイダンスでRLロールアウトを強化する政策最適化フレームワークであるtextbf SocraticPO(Socratic Policy Optimization)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:08:29 GMT)
Brick-Composer: Using MLLMs for Assembly with Diverse Bricks [64.5] ブロック組立に必要な視覚的接地と空間的推論能力を有する多モーダル大言語モデル(MLLM)について検討した。
BC-Benchは,多様なブロックを持つアセンブリ上でMLLMを評価するための最初のベンチマークである。
Brick-ComposerはMLLMに3つの補完信号による組立スキルを組み込む学習フレームワークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:08:06 GMT)
GAPD: Gold-Action Policy Distillation for Agentic Reinforcement Learning in Knowledge Base Question Answering [64.2] 結果に基づくRLに高密度トークンレベルガイダンスを付加する訓練時間金反応政策蒸留フレームワークを提案する。
GAPDはWebQSP、GrailQA、GraphQの最先端技術に一貫して勝っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:07:10 GMT)
Step-by-Step Optimization-like Reasoning in LLMs over Expanding Search Spaces [63.8] OPT*は、LLMのステップバイステップ最適化のような推論を訓練し評価するための最適化スタイルのタスクのファミリーである。
各タスクは実現可能性チェッカーと評価器を提供し、一方、複雑性パラメータは新しい人間ラベルを必要とせずに検索スペースを拡大する。
OPT*のトレーニングは、ステップバイステップの最適化のような推論を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:43:38 GMT)
DLLG: Dynamic Logit-Level Gating of LLM Experts [63.3] 本稿では,トークンレベルのエキスパート融合を疎応答レベルの監視から学習する動的ロジットレベルのアンサンブルフレームワークを提案する。
軽量ゲーティングモジュールは、トークンレベルのラベルや専門家の再訓練なしで、軌道レベルの正確さを生成物にリンクすることで、ステップワイズ融合重量を予測する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:51:56 GMT)
Knowledge Index of Noah's Ark [63.1] KINAは,261分野にわたる899項目のベンチマークである。
ボーナス・オン・バートーナメントがFOSDを弱く支配していることを示す。
トップモデルであるGemini-3.1-Pro-Previewは53.17%、Claude-Opus-4.6は49.92%、GPT-5.4は48.55%に達した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:06:49 GMT)
Imaginative Perception Tokens Enhance Spatial Reasoning in Multimodal Language Models [61.9] 視覚言語モデル(VLM)は多くのタスクで優れるが、重要な情報が直接観測できない場合、空間的推論に苦慮する。
Inaginative Perception Tokens (IPT) は、VLMが知覚する空間構成を外部化する中間的知覚表現である。
IPTの監督は、空間的推論を一貫して改善し、しばしば思考訓練のテキスト連鎖よりも優れる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:16:22 GMT)
Personal AI Agent for Camera Roll VQA [61.3] パーソナルカメラロールの視覚的質問応答設定について検討する。
この設定では、会話型AIアシスタントがユーザのパーソナルカメラロールにアクセスし、関連する写真を検索してクエリに応答することができる。
これをサポートするために、現実世界の使用を模倣する質問を収集し、手動で注釈付けする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:59:30 GMT)
Echo-Infinity: Learning Evolving Memory for Real-Time Infinite Video Generation [59.0] 本稿では,リアルタイム無限ビデオ生成に向けた自動回帰(AR)フレームワークであるEcho Infinityを紹介する。
学習可能な進化可能なメモリを使用して、任意の長さの履歴を動的にフィルタリングし、抽象化し、圧縮する。
最先端のパフォーマンスを実現し、私たちの知る限り、24時間(>1.3M)のリアルタイムロールアウトを初めて実現しています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:09:01 GMT)
MorphoQuant: Modality-Aware Quantization for Omni-modal Large Language Models [57.9] 本稿では,モダリティを考慮したPTQフレームワークを提案する。
Distribution-Aware Bias Compensation (DABC) は、長い尾の外れ値からチャネルのバイアスを選択的に吸収する。
また,量子化格子をバイアスマスクと共最適化するために,MDQFO (Morphology-Directed Quantization Function Optimization) を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:05:10 GMT)
Multilingual Long-Form Speech Instruction Following: KIT's Submission to IWSLT 2026 [57.5] 我々は、制約のない環境で、KITのLong and Short Instruction followingのトラックを提示する。
提案手法では,短文コーパスを長文学習データに変換する汎用データ拡張パイプラインを組み合わせる。
確率に基づく再ランク付けは、ASRには非常に有効であるが、意味的タスクを体系的に劣化させることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:13:37 GMT)
VASO: Formally Verifiable Self-Evolving Skills for Physical AI Agents [57.2] 本稿では,ロボットスキルコントラクトの検証誘導自己進化のためのフレームワークであるVASOを紹介する。
VASOは論理的に一貫性のないスキル契約を検証し、グローバルおよびローカルな時間的仕様に対してスキルによって誘発される計画を検証する。
Clearpath Jackal と PX4 のクアッドコプタータスクでは、VASO は100点未満の最適化サンプルを使用して97.2% の形式的な仕様準拠に達した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:02:35 GMT)
Dream.exe: Can Video Generation Models Dream Executable Robot Manipulation? [57.2] 本稿では,ロボット操作を具体的かつ測定可能な窓として提案する。
私たちは、この基準をビデオから実行パイプラインを通じて運用する評価フレームワークDream.exeを紹介します。
我々は、フロンティアのクローズドソースジェネレータ、オープンソースジェネレータ、ロボット固有のモデルにまたがる8つのモデルを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:35:35 GMT)
LimiX-2M: Mitigating Low-Rank Collapse and Attention Bottlenecks in Tabular Foundation Models [57.0] タブラル基礎モデル(TFM)は木アンサンブルと競合する傾向にあるが、その性能は計算非効率である。
本稿では,強力なTFMを実現するための統一的なEmphtokenize-and-routeフレームワークを提案する。
その結果、TFMにおける精度-効率トレードオフを改善するキーレバーとして、バリューアウェアトークン化とリードアウト整合ルーティングが強調された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:07:33 GMT)
Boosting Self-Consistency with Ranking [56.4] 自己整合性は、複数の推論パスをサンプリングし、最も頻繁な回答を選択することで、大きな言語モデルを改善する。
この制限は、自己整合性における解答選択をランク付け問題として再構成する、ランク付け改善自己整合性(RISC)に対処する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:12:30 GMT)
Selective Coupling of Decoupled Informative Regions: Masked Attention Alignment for Data-Free Quantization of Vision Transformers [56.4] Data-Free Quantization (DFQ)は、サンプルを合成することで、実際のデータにアクセスすることなく、データセキュリティ上の問題に対処する。
従来の DFQ Arts for Vision Transformers (ViTs) は、しばしば、合成サンプルと量子化モデルQで期待される入力分布の分布ミスマッチに悩まされる。
本研究では,データ自由量子化のためのMaskAQという新しいMasked Attention Alignmentアプローチを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:38:19 GMT)
Converted, Not Equivalent: Benchmarking Codebase Conversion via Observational Equivalence [56.3] コーディングエージェントは、しばしば自身のローカル検証ルーチンを過度に信頼し、表面チェックを満たすアーティファクトの成功を宣言する。
この問題は、事前評価が結果駆動である変換において特に深刻である。
ブラインド・コンバージョンは26.7-28.9%に達し、スペック・パスレートは91.1%まで上昇した。
このことは、失敗は限られた予算やバックボーンの強さよりも、契約ミスによる自己検証に起因していることを示唆している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:44:55 GMT)
P$^2$-DPO: Grounding Hallucination in Perceptual Processing via Calibration Direct Preference Optimization [55.7] 幻覚は近年、LVLM(Large Vision-Language Models)において大きな研究の注目を集めている。
直接選好最適化(DPO)は、人間が提供した修正選好から直接学習することを目的としている。
既存の選好ペアは視覚に依存しないことが多く、その本質的に非政治的な性質は、モデル学習を導く上での有効性を制限している。
本稿では、モデルが独自の選好ペアから生成し学習する新しい訓練パラダイムである知覚処理直接選好最適化(P$2$-DPO)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:21:53 GMT)
Not What, But How: A Framework for Auditing LLM Responses across Positioning, Generalization, Anthromorphism, and Maxims [54.3] 大規模言語モデル(LLM)は、主観的、情報探索的な疑問に答えるためにますます使われている。
既存の主観的文化的クエリの評価は、応答のフレーム化を無視して、事実の正しさに重点を置いている。
FRANZ(FRAmework for respoNse characteriZation)を導入し、4次元のLLM応答のコミュニケーション監査を行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:01:25 GMT)
MIRAGE: Mobile Agents with Implicit Reasoning and Generative World Models [53.1] 可視テキスト推論トレースから連続潜時推論表現を学習するフレームワークであるMIRAGEを紹介する。
AndroidWorldでは、MIRAGEは4Bアブレーションで監督された微調整を3~5倍の低い復号化予算と一致している。
AndroidControlでは、75%以上のトークンを生成しながらアクショングラウンドを改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:01:24 GMT)
MeshWeaver: Sparse-Voxel-Guided Surface Weaving for Autoregressive Mesh Generation [53.1] MeshWeaverは、メッシュ生成を表面織布プロセスとして扱う自動回帰フレームワークである。
MeshWeaverは18%の最先端圧縮比を実現し、最大16K面のメッシュを生成することができ、以前のアプローチよりも幾何的忠実性を大幅に向上する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:15:43 GMT)
GOPAgen: Motion-Aware and Efficient Agentic Long-Video Understanding with Structural Memory and Hierarchical Reasoning [53.0] GOPAgenは、ビデオからグループ・オブ・ピクチャーズ(GOP)で訓練されたモーションエージェントを通じて、ビデオ理解フレームワークにビデオを統合する新しいアプローチである。
GOP木推論アルゴリズムを開発し、ビデオと自然に一致し、ビデオ内の局所的な詳細な動きを理解する能力を高める。
動きベクトルデータベースをフレームワークに組み込んで、異なる粒度の動きを効率的に検索する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:47:49 GMT)
VideoKR: Towards Knowledge- and Reasoning-Intensive Video Understanding [52.9] ビデオ理解を強化するために設計された,最初の大規模トレーニングコーパスであるVideoKRを紹介する。
VideoKRは、新しく収集されたCCライセンスのエキスパートドメインビデオ145K以上の315Kビデオ推論例で構成されている。
我々は、より深い動画推論機能をターゲットにした、ループ内のヒューマン・イン・ザ・ループ・スキル指向のサンプル生成パイプラインを開発した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:14:20 GMT)
Deliberate Evolution: Agentic Reasoning for Sample-Efficient Symbolic Regression with LLMs [52.9] Deliberate Evolution (DE) は、検索制御からシンボル生成を分離するエージェントフレームワークである。
LLM-SRBenchの実験では、DEMは様々な科学領域でLLMベースのSRベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:22:16 GMT)
Video2LoRA: Parametric Video Internalization for Vision-Language Models [52.5] Video2LoRAはパラメトリックビデオ内部化の手法である。
知覚者ハイパーネットワークは、層ごとに生成された中間表現を読み出し、凍結されたVLMがビデオをエンコードする。
通常のLoRAの微調整とは違い、ビデオ2LoRAは動画から直接重みを予測します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:07:35 GMT)
Do Models Share Safety Representations? Cross-Model Steering for Safe Visual Generation [52.1] クロスモデル安全ステアリングのための最初のフレームワークを紹介する。
私たちのパイプラインは、ターゲット側の安全でないデータにアクセスしません。
多様なソース・ターゲット・モデル・ペア間のテキスト・ツー・イメージとテキスト・ツー・ビデオ生成におけるアプローチを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:04 GMT)
VISTA: Vision-Grounded and Physics-Validated Adaptation of UMI data for VLA Training [52.1] Universal Manipulation Interface (UMI)は、ハードウェア固有の遠隔操作なしでスケーラブルな実世界のロボットデータ収集を可能にする。
VISTAは、この2つのギャップを3つの相乗的コンポーネントを通して橋渡しするフレームワークである。
我々は,物理検証パイプライン,UMI-VQA,検証された軌道データ,コミュニティのための事前学習モデルをリリースする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:38:45 GMT)
AnchorMoE: Interpretable Time Series Classification via Anchor-Routed MoE [52.0] AnchorMoEは、解釈可能な構成別分類フレームワークである。
ローカルパッチのマルチビュー表現をエンコードし、専門の専門家にルーティングする。
実世界のベンチマークと合成ベンチマークの実験は、AnchorMoEが非常に競争力のある分類性能を達成することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:29:07 GMT)
Plan First, Judge Later, Run Better: A DMAIC-Inspired Agentic System for Industrial Anomaly Detection [51.9] 本稿では, DMAIC-IAD (DMAIC-inspired Agentic Industrial Anomaly Detection) というマルチエージェントシステムを提案する。
DMAIC-IADは,適用対象のエージェントベースラインに対する平均検出性能を37.76%向上させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:38:14 GMT)
From Attack Simulation to SIEM Rule: Deterministic Detection-as-Code Synthesis with Probe-Level Traceability [51.6] セキュリティチームは、自身のシステムに対する攻撃をシミュレートして、監視が真の侵入者を捕まえるかどうかをチェックする。
人間はそのギャップを手でブリッジし、それぞれの発見を読み、対応するシグマルールを書きます。
ロックされたコーパスからプローブが引き出されると,この変換が部分的に自動化されることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:26:25 GMT)
No More K-means: Single-Stage Sparse Coding for Efficient Multi-Vector Retrieval [51.4] SSR(Single-stage Sparse Retrieval)は、高価なクラスタリングを効率的なスパースコーディングに置き換えるパラダイムシフトである。
ColBERTv2と比較してインデックス処理時間を15倍短縮し、検索レイテンシを半減させ、同時に検索性能を向上させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:02:09 GMT)
Minimizing the Hidden Cost of Scales: Graph-Guided Ultra-Low-Bit Quantization for Large Language Models [50.2] 学習後量子化(PTQ)は,大規模言語モデル(LLM)の効率的な展開に重要である
隠れスケーリングコストを最小限に抑えるLLMのための超低ビット量子化フレームワークであるSAGE-PTQを提案する。
LLaMA-3B では、SAGE-PTQ は BiLLM の 55.8 と比較して 6.74 WikiText2 のパープレキシティを実現している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:51:52 GMT)
'Your AI Text is not Mine': Redefining and Evaluating AI-generated Text Detection under Realistic Assumptions [50.1] 我々は,AI生成テキストのさまざまな概念とその特徴を体系的に定義する。
AITDNAは人間と機械が共同で構築したテキストの新しいベンチマークである。
我々は、様々な機械生成テキスト検出器をベンチマークし、それらが特定の概念に対してのみうまく機能するが、広義の検出器として機能しないことが多いことを発見した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:05:14 GMT)
Reconciling Causality and Non-Equilibrium Thermodynamics with Hamiltonian Causal Models [50.1] 本稿では、観測変数が局所環境と相互作用する軌道レベルのフレームワークであるハミルトン因果モデル(HCM)を紹介する。
HCMは、不変運動方程式を相互作用可能な機構から分離し、因果効果を干渉経路法則の相違として定義する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:43:46 GMT)
Simulate, Reason, Decide: Scientific Reasoning with LLMs for Simulation-Driven Decision Making [50.1] MechSimは、実行可能な科学シミュレーターのためのメカニズム基底の神経象徴的推論フレームワークである。
我々のフレームワークは、仮定、変数、メカニズムの依存関係、実行トレースをキャプチャする共有構造化スキーマを通してシミュレータを表現する。
提案手法は,複数のハイテイク領域にまたがって評価され,メカニズムレベルの説明品質,シミュレータ解析,下流意思決定の信頼性が向上することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:36:51 GMT)
MetaPoint: Unlocking Precise Spatial Control in Agentic Visual Generation [50.0] 連続した2次元座標を1つの特別なトークンとして表現することでギャップを埋める方法であるMetaPointを紹介する。
空間制御のためのシンプルで正確でスケーラブルなビルディングブロックを提供することで、MetaPointはより強力な合成生成エージェントを解放する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:58:56 GMT)
Why Muon Outperforms Adam: A Curvature Perspective [49.9] Muonは、大規模な言語モデルトレーニングにおいて、Adamよりもトレーニング効率を約2倍改善する。
私たちの研究は、Adamに対するMuonの優位性を曲率の観点から軽視する第一歩を踏み出します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:40:30 GMT)
Plan, Watch, Recover: A Benchmark and Architectures for Proactive Procedural Assistance [49.5] textbfEgoProactiveは、OOP(Out-of-Plan)アノテーションとリカバリ手順によるプロシージャアシストのためのウェアラブル中心のデータセットです。
本稿では、手続き状態、視覚的手がかり、リカバリインジェクションに特化して、textbfdecoupled Planner-interaction Architectureを提案する。
広範囲な実験において、Llama-4システムは、強力なプロプライエタリベースラインよりも客観的介入品質を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:52:03 GMT)
FLAGG: Flexible Autoregressive Graph Generation [49.3] Deep Graph Generationのパノラマは、ワンショットモデルとシーケンシャルモデルという2つの極端に広がっている。
本稿では,1ショットモデルでグラフの一部を逐次生成するFLAGGフレームワークを提案する。
本手法は, サンプリング品質において, 単発ベースラインと自己回帰ベースラインの両方に優れることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:29:15 GMT)
HORIZON: Recoverability-Governed Curriculum for Physical-Domain Scaling [48.9] 我々は、政策がより難しい物理の恩恵を受けることができるかを検討し、回復可能性について、オン・ポリティカル・ドメイン・スケーリングにおける中心的な制約として認識する。
政治訓練において、新しい力学は、現在の政策に十分近いままで、政治上の修正的なデータを生成するためだけに有用である。
本稿では,現在の方針の回復可能な境界内でのみ,物理的な領域を拡張するチェックポイント付きフロンティアカリキュラムであるHoriZONを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:50:02 GMT)
DAR: Deontic Reasoning with Agentic Harnesses [48.8] 本稿では,DAR(Deontic Agentic Reasoning)について紹介する。
我々はDARをDeonticBenchのハードサブセット上で複数のハーネスで評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:29:38 GMT)
ComplexityMT: Benchmarking the Interaction Between Text Complexity and Machine Translation [48.1] テキストの複雑さと機械翻訳が相互にどのように相互作用し、影響を及ぼすかを評価するための新しい課題である ComplexityMT を紹介する。
我々は,3つのオープンウェイトモデル,1つのクローズドモデル,および2つのタスクに対する商用機械翻訳システムを評価する。
実験の結果,CEFRレベルが高いほどテキストの翻訳が難しくなり,機械翻訳によってターゲットテキストのCEFRレベルが元のソースと比較されることがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:38:37 GMT)
MAD: Mapping-Aware World Models for Agile Quadrotor Flight [47.5] マッピング・アウェア・ドリーマー(英: Mapping-Aware Dreamer、MAD)は、視覚に基づく四面体飛行のための幾何学的世界モデルである。
MADは、ロボセントリックな占有率と可視性グリッドマップを再構成する反復潜時ダイナミクスを学習する。
室内・屋外での安全な飛行を限定センシングで実証し,シミュレーションで9.66m/s,実世界の森林実験で5.05m/sに達した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:17:57 GMT)
LifeSide: Benchmarking Agents as Lifelong Digital Companions [47.4] ベンチマークはマルチセッションのtextitMemory-Emotion-Environmentループを中心としたベンチマークである。
階層化されたプロファイルとイベントトラジェクトリを持つ永続的な世界としてユーザをモデル化することで、ベンチマークはマルチエージェントシミュレーションを使用して、環境ダイナミクスを対話に投影する。
現在のメモリベンチマークを飽和させるモデルでさえ、正確なユーザ理解と真の相性を維持することができず、長い地平線上での真の相性を維持することができません。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:37:25 GMT)
SCI-PRM: A Tool Aware Process Reward Model for Scientific Reasoning Verification [47.2] そこで我々は、Chain-of-Toolトラジェクトリを特徴とする大規模データセットを構築し、科学的ツールの実行による推論を明確にインターリーブする。
次に、Sci-PRMと呼ばれる効率的な報酬モデルをトレーニングし、ツールの選択、実行精度、結果解釈を1つの推論の各ステップで詳細に監視する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:13:27 GMT)
A Pathology Foundation Model for Gastric Cancer with Real-World Validation [47.2] 本稿では,実世界評価と臨床dEcision支援のための,胃科固有の基礎モデルであるGRACEについて述べる。
GRACEは, 症例37,493例のHE-stained whole-slide画像を中心に, 48,364例の多施設で開発された。
高齢の病理医に非劣性パフォーマンスを維持するように調整された場合、AI支援のワークフローは萎縮の60.7%、腸転移の82.7%をトリアージする可能性がある。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:18:06 GMT)
Multi-SPIN: Multi-Access Speculative Inference for Cooperative Token Generation at the Edge [47.1] 大規模言語モデル(LLM)を高速化する効率的なアーキテクチャとして、投機的推論を導入する。
本研究では,マルチユーザエッジシステムにおける協調トークン生成を実現するための分散配置を提案する。
分解法の開発により、複雑な最適化をトラクタブルなサブプロブレムに還元する。
分析の結果、最適な帯域割り当ては、より弱い計算/通信能力を持つユーザを補うことがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:16:14 GMT)
STRIDE: Training Data Attribution via Sparse Recovery from Subset Perturbations [47.0] トレーニングデータ属性(Training Data Attribution)は、モデルの予測をトレーニングデータに遡る。
ほとんどのアプローチでは、勾配を使ってパラメータ空間でこの効果を近似する。
活性化空間におけるトレーニングデータの機能的効果をモデル化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:59:36 GMT)
Tractogram foundation model [46.4] トラクトFMはトラクトグラムの基礎モデルであり,脳全体から再利用可能な表現を直接学習する。
TractFMは、局所的なストリーラインエンコーダと置換等価なトラクトグラムエンコーダを組み合わせることで、被験者のすべてのストリーラインをコンテキスト化することができる。
凍結した表現は正確なトラクションのパーセレーションを実現し、独立したデータセット間で年齢と性別を予測する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:45:23 GMT)
Circuit-Level Noise Estimation via Shuttling in Plaquette Circuits [46.3] 2つのシンドローム量子ビット構成を用いた表面コードプラケット実験の開発と実行を行う。
アプローチを検証するため,イオントラップ(IonQ Aria1)ネイティブゲートセットにプラケットをコンパイルし,ハードウェア対応の書き換えテンプレートを適用した。
単発プラケット計測結果から回路レベルのノイズ率を推定する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:02:32 GMT)
Learning-Augmented Online Minimization with Dual Predictions [46.1] 本稿では,オンライン問題の一般的なクラスとして,計量的タスクシステムと層集合被覆という2つの学習強化アルゴリズムを提案する。
両アルゴリズムは、線形プログラムに対する最適解の機械学習予測を用いて、理論的保証を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:29:31 GMT)
Recovering Physically Plausible Human-Object Interactions from Monocular Videos [45.8] RePHO(RePHO)は、モノクロビデオから物理的に可塑性な人間と物体の相互作用(HOI)を再構築する手法である。
キネマティックな見積もりから始まり、強化学習(RL)による政策の訓練によってそれを洗練する。
キネマティックな推定は一般的にノイズが多いため、単純RLトレーニングは失敗する可能性があるため、二重自己更新機構を備えた適応サンプリング戦略を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:02:48 GMT)
M3imic: Learning a Versatile Whole-Body Controller for Multimodal Motion Mimicking [45.6] Multi-Modal Mimicはヒューマノイドロボットのための汎用的な全身制御フレームワークである。
ロボットの関節角度、人間のポーズ軌跡、エンドエフェクターのポーズなど、異種動作参照モードを統一する。
モダリティ特異的なリトレーニングを伴わない、複数の運動基準モード間のシミュレート・トゥ・リアル転送を実現する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:52:37 GMT)
Impostor: An Agent-Curated Benchmark for Realistic AIGC Manipulation Localization [45.5] 高品質なAI編集画像操作ローカライゼーションデータセットであるImpostorを紹介した。
Impostorは、シーン認識、編集計画、操作実行、品質検証、反復リフレクションを統合するクローズドループエージェントフレームワークであるCraftAgentによって構築されている。
本研究では,局所的な位相モデリングと意味論的整合性学習を導入し,意味論的に検証可能なが法学的に乱された領域をよりよくローカライズする意味情報ネットワーク(PANet)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:27:45 GMT)
BiNSGPS: Geometry Problem Solving via Bidirectional Neuro-Symbolic Interaction [45.3] BiNSGPSはMLLMアドバイザとソルバ間の双方向神経・シンボリック相互作用を確立するフレームワークである。
MLLMアドバイザはシンボルソルバからのフィードバックを積極的に取り入れ、一貫性のない形式表現を動的に修正する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:18:37 GMT)
Robust Scene Transfer for PointGoal Navigation via Privileged Sensor Guided Contrastive Learning [45.2] PointGoalナビゲーションにおける視覚表現学習のためのセンサ誘導適応型コントラスト学習フレームワークを提案する。
トレーニング中、特権付きLiDARセンシングは、幾何学的類似度メトリックと適応温度スケーリングを通じて、対照的な目標を導出する。
得られたエンコーダは、独立して事前訓練され、凍結され、強化学習のバックボーンとして使用される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:15:50 GMT)
Probing Outcome-Level Resemblance and Mechanism-Level Alignment in LLM Risk Decisions: Evidence from the St. Petersburg Game [45.0] LLMは人間と共存するメカニズムを示さずに人間のようなリスク決定を下す。
これらの結果から,リスク意思決定における行動アライメントは表面レベルである可能性が示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:01:52 GMT)
Imbuing Large Language Models with Bidirectional Logic for Robust Chain Repair [44.8] 本稿では,デコーダのみのトランスフォーマーをネイティブに組み込んだトレーニングフレームワークであるTeleological Reasoning Infilling (TRI)を紹介する。
推測では、TRIは二重システムループ内の外科的修復モジュールとして動作する。
3つのベンチマークの実験では、TRIは全てのタスクで最先端のパフォーマンスを達成し、プロブレム当たりのトークン支出を31.2%削減した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:58:48 GMT)
Food-R1: A Unified Multi-Task Food Vision-Language Model with Reinforcement Learning [44.7] CalorieBench-80Kは、キュレートされたカロリーラベルと食事アドバイスアノテーションを備えた大規模ベンチマークである。
我々の知る限りでは、カロリー分析のためにChain-of-Thought(CoT)アノテーションを取り入れた初めての食品画像ベンチマークである。
また,多タスク学習パラダイムで訓練した統合食品VLMであるFood-R1を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:07:12 GMT)
Beyond Symmetric Alignment: Spectral Diagnostics of Modality Imbalance in Vision-Language Models in the Medical Domain [43.7] スペクトルアライメントスコア(SAS, Spectral Alignment Score)は、アンカーモダリティの主固有基底に両モードを投影し、固有値重み付き固有モード相関を計算する非対称な計量である。
実験の結果, 医用画像は2つの臨床報告よりもリッチな構造情報を保持しており, 競合するすべての指標には見えない方向非対称であり, SASは医療領域における検索性能と最強のゼロラベル相関を達成し, 臨床展開のための実用的な診断ツールとして位置づけていることがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:50:30 GMT)
Beyond Structural Symmetries: Linear Mode Connectivity via Neuron Identifiability [42.8] パラメータ対称性に注目が集まる一方で、パラメータ、データ、表現間の相互作用は未解明のままである。
我々は、独立したトレーニングランでニューロン識別能力を介して効果的な対称性の破れを定式化する。
ニューラルネットワークは、構造的に非対称なモデルであっても、ほぼ等価な解の大きいファミリーを許容できることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:37:58 GMT)
Benchmarking Living-Screen-Native GUI Agents on Short-Video Platforms [42.6] 我々はこのタスクをリビング-スクリーン-Native GUIエージェントとして定式化する。
LivingScreenは、短いビデオプラットフォームでインスタンス化する最初のベンチマークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:25:46 GMT)
Contrastive Learning and Correlation Clustering for Sequences of Network Telescope Data [42.4] 本研究は、事前学習やアノテーションなしで、比較学習によって意味論的に意味のあるペアワイズ関係を推定できるかどうかを考察する。
本稿では,ネットワークフローレコードの最小処理列を組込み,コントラスト学習を用いて学習するトランスフォーマーモデルを提案する。
学習された類似性は、異なるソースから派生したシーケンスよりも、同じソースから派生したシーケンスの平均よりも高く、この性質は目に見えないソースのシーケンスに一般化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:15:37 GMT)
U-Net-Accelerated Quality-Diversity Optimization for Climate-Adaptive Urban Layouts [42.0] glsqdのアルゴリズムは 設計空間を照らす方法を提供するが シュロゲートモデルが実用的である必要がある
本稿では,制御の遅い物理シミュレータを,オフラインMAP-Elitesループ内の空間深層学習サロゲート(U-Net)に置き換える。
その結果、オープンソースのOpenSKIZZEツールにデプロイされたパイプラインは、10分以内で数千の多様な気候評価された建物のレイアウトを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:35:11 GMT)
Sharp Low-Degree Thresholds for Planted-vs-Planted Testing [42.0] 本研究は, 植林したサブマトリクスおよび植林した高密度サブグラフモデルにおいて, 地域社会を数えるために, 低緯度と低緯度の境界を一致させることを実証する。
弱いテストのタスクは、ランダムな推測よりも優れているが、シャープなしきい値ではなく、スムーズな遷移を持つ。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:28:30 GMT)
NextMotionQA: Benchmarking and Judging Human Motion Understanding with Vision-Language Models [41.8] NextMotionQAは、専門家検証データセットのビジョン言語モデルを活用する包括的なベンチマークである。
NextMotionQAには、3つの補完的なタスクがある。
従来の単一タスク評価では見えなかった重要な能力ギャップと弱点を明らかにするために,12種類のVLMの評価を行った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:53:57 GMT)
Adaptive Auto-Harness: Sustained Self-Improvement for Agentic System Deployment on Open-Ended Task Streams [41.7] このようなストリームのためのフレームワークとシステムであるAdaptive Auto-Harnessを紹介します。
オラクルハーネスとのギャップを進化損失と適応損失に分解する。
予測市場、セキュリティ競争、イベント予測ストリームで、既存の5つのオートハーネスベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:59:44 GMT)
Learning Manifold and Itô Dynamics with Branched Neural Rough Differential Equations [41.5] BNRDE は NRDE log-ODE ステップを状態空間多様体上の数値積分として再放送する。
BNRDE はユークリッド・ストラトノビッチ設定を超える統一的な効果的なアプローチを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:12:52 GMT)
SurvPFN: Towards Foundation Models for Survival Predictions [41.4] 生存予測のための事前データ付きネットワーク(PFN)である textttSurvPFN を提案する。
我々は、何百万もの合成生存予測タスクについてtextttSurvPFN を事前訓練し、検閲データを考慮した分布回帰を用いて生存率を学習する。
我々は,PFNのパワーを解放し,時間から時間への予測を行うことにより,生存を検閲された損失を伴う連続的な分布回帰問題として扱うことができることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:52:45 GMT)
Online Skill Learning for Web Agents via State-Grounded Dynamic Retrieval [41.1] State-Grounded Dynamic Retrieval (SGDR)は、Webエージェントの段階的なスキル再利用を可能にするオンラインスキル学習手法である。
SGDRは3つのコンポーネントから構成される: 完了したトラジェクトリを中間実行状態で実行不可能な再利用可能なサブプロデューサに変換するスライディングウィンドウ抽出プロセス、スキル検索と実行可能なアクションを接続するデュアルテキストコード表現、タスクゴールと現在のWebページ状態の両方にスキルにマッチするステートグラウンド動的検索機構。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:11:50 GMT)
Ten Headache Specialists versus Artificial Intelligence for Clinical Literature Summarization: A Critical Evaluation and Comparison [40.3] アメリカとカナダの頭痛専門医10人がそれぞれ1つの質問の要約を書いた。
著者に盲目な専門家は、正確性、完全性、簡潔性、臨床的有用性に基づいて要約を批判的に評価した。
専門家が書いた要約が好まれたが、専門家は時に、人間とAIが生成した要約を区別することが難しいと感じた。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:58:43 GMT)
Trace-Mediated Peak Bias: Bridging Temporal Credit Assignment and Cognitive Heuristics in Deep Reinforcement Learning [40.3] TMPB(Trace-Mediated Peak Bias)と呼ばれる深層強化学習における系統的障害モードの同定
TMPBは遠位端の時間誤差を「勾配衝撃」に増幅するが、固定ステップサイズのトレースは正規化できない。
この結果から,分散システムにおけるクレジット代入の数学的制約から,人為的なサリエンシ歪みが自然に現れる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:19:29 GMT)
Agent Planning Benchmark: A Diagnostic Framework for Planning Capabilities in LLM Agents [40.2] 我々は,計画固有の診断ベンチマークである textbfAgent Planning Benchmark (APB) を紹介する。
APBは、全体計画、フィードバック条件付きステップワイド計画、外部ツールによる堅牢性、壊れたツール、解決不可能なタスクをカバーしている。
我々は、200 ToolSandboxタスクと200$-benchタスクでAPBを検証する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:37:47 GMT)
Streaming Communication in Multi-Agent Reasoning [40.1] マルチエージェント推論システムであるStreamMAを導入し,各推論ステップを生成直後にダウンストリームエージェントにストリームする。
驚くことに、このパイプライニングは効果も向上する。
エージェントごとのステップの増加は、有効性と効率の両方を一貫して改善します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:57:04 GMT)
Depth-Attention: Cross-Layer Value Mixing for Language Models [39.8] 自己注意(Self-attention)はシーケンス全体で自由に情報を選択するが、奥行きによっては、トランスフォーマーは各レイヤの出力を残留ストリームに追加するだけである。
最近のクロス層法はこの流れを改善するが、外部の隠れた状態で作動する。
本稿では、注目モジュール自体内でこの選択を行うDepth-Attentionを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:33:45 GMT)
Exploring Cross-Scenario Generality of Agentic Memory Systems: Diagnostics and a Strong Baseline [39.3] 検索問題に対する8つのメモリシステムとエージェントハーネスを再検討する。
自動管理ツールインタフェースを備えたエージェントメモリハーネスであるAutoMEMにおいて、この知見をインスタンス化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:42:49 GMT)
Decoded Quantum Interferometry Beyond Hamming: Rank-Metric and Translation Association Schemes [39.1] Decoded Quantum Interferometry (DQI) はコヒーレントデコーディングと量子フーリエ変換を用いて、構造化最適化問題の高品質な解を求める。
我々は、コアDQI機構をハミング空間を越えて、翻訳対称性を持つ有限測地へと拡張する。
min(m,n)-l付近の有効ランクプロキシによる解が得られ、対応する期待スコアはサンプルの残留ランクに制限された定数確率に変換することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:12:15 GMT)
Trust Region On-Policy Distillation [39.0] On-Policy Distillation (OPD) は、大規模言語モデルの効率的なポストトレーニング手法である。
この研究は、信用割当戦略を通じて、信頼できるオン・ポリティクスのトークンレベルの監督に対処する。
実験の結果、TrOPDはSoTA OPDベースラインを一貫して上回ることがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:57:08 GMT)
Reproducing, Analyzing, and Detecting Reward Hacking in Rubric-Based Reinforcement Learning [38.9] ルーリックベースのRLのための制御可能なハッキング環境であるCHERRLを紹介する。
CHERRLは、報酬ハッキングの安定した再現、報酬分散の明示的な観察、ハッキング開始の正確な識別を可能にする。
その有用性を示すために,発見可能性とエクスプロイラビリティの観点から異なる判断バイアスを解析する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:18:23 GMT)
Bridging Short Videos and Live Streams: Reasoning-Guided Multimodal LLMs for Cross-Domain Representation Learning [38.1] Reasoning-Guided Cross-Domain Representation Learning (RGCD-Rep)
RGCD-Repは、短いビデオからライブストリームへのクロスドメインレコメンデーションのための推論誘導フレームワークである。
完全にデプロイされ、毎日4億人のユーザーが利用している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:49:01 GMT)
Token Rankings are Unforgeable Language Model Signatures [38.0] 言語モデルパラメータは、ロジット出力にユニークな(各モデルに)幾何学的制約を課すことが知られている。
このシグネチャは、モデルを識別するシグネチャとして機能すると同時に、APIがロジットを配布すると、モデルの最終的なレイヤパラメータをリークする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:06:35 GMT)
AlloGen: Conformation-Selective Binder Generation with Differential State Scoring [38.0] 学習した状態選択性スコアラからバックボーン生成を分離するフレームワークであるAlloGenを紹介します。
AlloGenは、代替コンフォメーションを拒絶しながら、望ましい構造状態を優先的に認識するバインダーを一貫して識別する。
その結果、コンフォメーション選択性は学習可能な性質として確立され、状態選択型タンパク質結合体設計のための一般的な枠組みを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:53:17 GMT)
DIST-FL: Enhancing Security for TEE-based Aggregation in Federated Learning [38.0] サーバサイドの敵は、システムの堅牢性とプライバシを妥協するために、クライアントの選択とリプレイアグリゲーションを操作できる。
DIST-FLは、複数のTEEによって保護されたサーバの分散システムであり、プライバシ保護された堅牢なFLアグリゲーションのための追加専用台帳を形成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:01:10 GMT)
TANDEM: Bi-Level Data Mixture Optimization with Twin Networks [37.9] 大規模言語モデル(LLM)に対する二段階最適化問題を提案する。
問題を単一レベルのペナル化形式に単純化し、ツインネットワークで解決する。
提案手法は、ツインモデルとアップウェイトドメインの差によるデータの有効性を計測する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:28:46 GMT)
Breakdown of Thermalization from Real-Time Dynamics in the Two-Dimensional Hubbard Model [37.6] 強い相関を持つフェルミオン系の熱化は、量子多体物理学において中心的な問題である。
本研究では,2次元ハバードモデルにおける実時間力学と熱化へのアプローチについて検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:05 GMT)
Would you still call this Dax? Novel Visual References in VLMs and Humans [37.6] 我々は,新しいビジュアル参照データセット(NVRD):90の視覚概念にまたがる19,176のイメージを,様々な視覚的ノベルティのレベルにわたって提示する。
慣れ親しんだ概念の視覚的増強に関する以前の研究とは異なり、NVRDはスクラッチから構築された全く新しいオープンエンド刺激で構成されている。
3つのオープンソースモデルと2つのクローズドソースモデルと2,400人の人的判断を合わせて評価し、(i)モデルが先行知識と矛盾する場合にコンテキスト内で新しい概念を取得するのに苦労していること、(ii)モデルと人間が視覚的摂動に相関した感度を示す一方で、モデルは大幅に過大化し、学習ラベルを人間の刺激に拡張することを見出した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:23:12 GMT)
Rollout-Level Advantage-Prioritized Experience Replay for GRPO [37.4] GRPOのためのロールアウトレベルのリプレイバッファを提案し、グループ全体ではなく個々のロールアウトを格納し、サンプリングする。
Qwen3-Baseは5つのベンチマークでスケールするが,本手法はGRPOより優れている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:47:47 GMT)
From Answers to States: Verifiable Process-Level Evaluation of Chemical Reasoning in Large Language Models [37.3] ChemCoTBench-V2は、構造化された検証可能な化学推論トレースの評価のための、ルール検証可能な診断ベンチマークである。
分子理解、分子編集、分子最適化、反応予測にまたがっており、18の報告タスクで5,620個の評価サンプルがある。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:05:21 GMT)
CRESS: Quantifying Vulnerabilities of Attack Scenarios in Hardware Reverse Engineering [37.3] ハードウェアのリバースエンジニアリングの結果は、マイクロエレクトロニクスに対する攻撃において重要な役割を果たす。
新たなRE関連攻撃は共通のREスコアシステム(CRESS)の開発を動機づけた
CRESSスコアは、業界標準のCVSS(Common Vulnerability Scoring System)よりもはるかに表現力が高いことが証明されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:34:57 GMT)
PreAct-Bench: Benchmarking Predictive Monitoring in LLMs [37.0] 我々は,予測モニタリング(Predictive Monitoring)と呼ばれる,重要かつ見落とされがちな安全タスクについて検討する。
モデルは、オーバートアクションが実行される前に非倫理的なアクションで終わるかどうかを推測できますか?
PreActBenchは、5つのドメインにまたがる倫理的および非倫理的行動軌跡の1000のベンチマークである。
結果は、人間が有望なパフォーマンスを達成する一方で、強力なモデルであっても予測的なモニタリングは困難であることを示している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:26:41 GMT)
SAILRec: Steering LLM Attention to Dual-Side Semantically Aligned Collaborative Embeddings for Recommendation [36.9] LLMベースのレコメンデータは、ユーザとイテムのインタラクションからの協調的な埋め込みによって言語モデルを強化する。
協調的な埋め込みの利用は深さ依存的でアライメントに敏感であることがわかった。
両面のセマンティックアライメントと階層的アテンションステアリングにより,このバランスを改善するLLMベースのレコメンデータSAILRecを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:46:32 GMT)
Rethinking Continual Experience Internalization for Self-Evolving LLM Agents [36.8] 原則レベルのエクスペリエンスは、インスタンスレベルのエクスペリエンスよりも耐久性が高いことが分かりました。
ステップワイドインジェクションは、中間的決定状態と経験を整合させることで、グローバルインジェクションを著しく上回る。
高品質な教師軌道上のオフ・ポリティカル・コンテクスト蒸留は、オン・ポリティカル・コンテクスト蒸留よりもかなり安定した訓練信号を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:30:09 GMT)
LoopMoE: Unifying Iterative Computation with Mixture-of-Experts for Language Modeling [36.7] スパースルーティングと反復重み付き計算を統合したループ型MoE言語モデルであるLoopMoEを提案する。
設計により、Vanilla MoEに対してループ式MoEを厳格に制御し、ヘッド・ツー・ヘッドで評価することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:38:12 GMT)
SMADE-IE: Sparse Multi-Agent Framework with Evidence-Driven Debate for Zero-Shot Information Extraction [36.7] ゼロショット情報抽出のためのスパースかつエビデンス駆動型マルチエージェントフレームワークSMADE-IEを提案する。
SMADE-IEは、まずAdaptive Mode Selectorを使用して、入力を軽量なグローバル抽出モードまたはタイプ中心抽出モードに動的にルーティングする。
矛盾する予測のために、議論をトゥールミンスタイルのコンポーネントに構造化するエビデンス駆動の議論機構を導入する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:18:34 GMT)
GRAIL: Gradient-Reweighted Advantages for Reinforcement Learning with Verifiable Rewards [36.7] グラディエント・リウェイトド・アドバンテージ(GRAIL)は、固有のトークン・ワイド・アドバンテージ・リウェイト法である。
GRAILは勾配活性塩度を用いて、最終回答により局所的に敏感なトークンをより重み付けする。
GRAILの精度は平均3.60%向上し、Pass@3では3.05%向上した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:51:27 GMT)
Generalizing Graph Foundation Models via Hyperbolic Retrieval-Augmented Generation [36.1] グラフ基礎モデル(GFM)はグラフ表現学習において支配的なパラダイムとして登場した。
本稿では,GFMの一般化能力を高めるためのフレームワークを提案する。
複数のグラフベンチマークの実験では、ゼロショット設定が大幅に改善された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:07:00 GMT)
Data Attribution in Large Language Models via Bidirectional Gradient Optimization [35.6] 大きな言語モデル(LLM)は、様々なアプリケーションにまたがってデプロイされるようになっている。
モデルの出力に最も影響したトレーニングデータの理解は、依然として根本的なオープンな問題である。
トレーニング中に生成されたアウトプットを見た場合、トレーニングデータにどのような影響があるのか?
提案手法は, 生成したテキストサンプルに対して, 双方向勾配最適化(漸進的上昇・降下)を用いてベースモデルを摂動させ, トレーニングサンプル間の損失変化を計測する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:21:53 GMT)
OLIVE: Online Low-Rank Incremental Learning for Efficient Adaptive Exoskeletons [35.5] オリーブはオンライン適応フレームワークで、デプロイ中にExoskeletonコントロールを継続的にパーソナライズする。
ウェアラブルプラットフォーム上での実験では,オリーブは歩行のスムーズ性,労力削減,運動安定性において,+13,+22,+15のパーセンテージ向上を達成した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:37:37 GMT)
X4Val: Learning Neural Surrogates for Variance-Reduced Policy Evaluation [35.3] X4Valは,非ペア型マルチドメインデータの存在下での分散還元実世界の測度推定のためのフレームワークである。
X4Valは、実際のドメインと補助ドメインのサンプルを共有表現空間に埋め込み、現実世界のメトリクスの転送可能な予測子を学ぶ。
本研究では,自律走行と実世界のロボット操作タスクに関する理論的解析と実証評価を行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:57:09 GMT)
PereStruct: Multimodal Semantic Assembly for Robust Historical Document Parsing [35.2] 我々は、歴史新聞を解析するための自動パイプラインを開発した。
提案手法は,1,426個の人手による全スキャンページでトレーニングされた,レイアウト解析とブロック検出のための細調整されたYOLOアーキテクチャを組み合わせたものである。
このマルチモーダル統合により最先端の性能が得られ、ブロック・トゥ・アーティクルマッピングにおけるF1スコアは0.904となる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:10:47 GMT)
Beyond Text Following: Repairable Arbitration Reversals in Audio-Language Models [35.0] 音声モデルはしばしば、音声証拠が明確であっても、音声と矛盾するテキストに従う。
Gated Audio Counterfactual Logit Correction (GACL)を提案する。
厳格な5ppの忠実度ドロップの予算の下で、GACLは最高のコントラストベースラインよりも17.8ポイントのnAUCを改善している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:57:51 GMT)
PHASER: Phase-Aware and Semantic Experience Replay for Vision-Language-Action Models [35.0] 本稿では,アーキテクチャに依存しない連続学習フレームワークPHASERを紹介する。
フェーズRは、すべてのサブスキルに等しいメモリサポートを保証するために、フェーズ中心のキャパシティアロケーションを使用する。
また、教師なし動作信号変化点検出とVLMに基づくセマンティック検証を組み合わせた軽量パイプラインであるAuto-PCを統合する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:44:16 GMT)
MM-Matryoshka: Towards Budget-Elastic Visual Document Retrieval via a 2D Multimodal Matryoshka Training Framework [34.6] 予算弾性ビジュアル文書検索(VDR)のための2次元マトリリシカ学習フレームワークMM-Matryoshkaを提案する。
推測時、単一のレトリバーは、異なる予算のための別々のモデルを訓練することなく、2D選択可能な予算を選択することができる。
MM-Matryoshkaは直接トラクションベースラインよりもはるかに高い品質を維持することにより、効率的なVDRのための堅牢な予算弾力性を提供できることを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:57:09 GMT)
ODYSSEY: Reestablishing Confidentiality in Confidential Blockchain via Delegated Execution [34.0] 本稿では,実行推論と実行再生攻撃を効率的に軽減する秘密ブロックチェーンODYSSEYを提案する。
ODYSSEYのデリゲートモデル: クライアントがトランザクションの実行を指定されたトラストに委譲する一方で、他の参加者は実行結果のみを同期する。
ODYSSEYの効率とセキュリティを改善する2つの新しいテクニック:位置対応並列実行とデリゲート障害ハンドラ。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:52:59 GMT)
SkyShield: Occupancy as a Safety Interface for Low-Altitude UAV Autonomy [34.0] 我々はSkyShieldを紹介し、20m未満の都市UAV飛行のための最初のフロントビュー単分子セマンティック占有ベンチマークを私たちの知る限りで紹介する。
CARLA上に構築されたSkyShieldには、様々な都市景観と気象条件にわたる36KのフロントビューUAVサンプルが含まれている。
KAR-mIoU(UAV中心で動的に認識されるメトリクス)は,到達性と協調時間によるボクセルレベルの評価を再重み付けする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:02:39 GMT)
Ask When It Pays: Cost-Aware Open-Ended Interaction for Instance Goal Navigation [33.9] インスタンスゴールナビゲーション(IGN)では、具体化されたエージェントが、未指定の自然言語記述からイントラクタ内の特定のインスタンスオブジェクトを見つける必要がある。
我々はIGNをコストに敏感な不確実性推論問題として再考する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:34:51 GMT)
Controllable Dynamic 3D Shape Generation via 3D Trajectories and Text [33.8] T2Moは3次元軌跡とテキストに条件付けされた制御可能な動的3次元形状生成のためのフィードフォワードフレームワークである。
本研究では,入力軌跡セットを対象物全体を覆う形状認識トークンセットにマッピングする形状認識軌道埋め込みを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:58:01 GMT)
Position: Don't Just "Fix it in Post": A Science of AI Must Study Training Dynamics [33.3] AIの科学はポストホックな修正を超えて、モデルの振る舞いを生み出すトレーニングダイナミクスを研究する必要がある、と私たちは主張する。
我々は、科学史と哲学に根ざしたそのような理論の要件を明確に述べる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:58:14 GMT)
Flash-WAM: Modality-Aware Distillation for World Action Models [33.0] Flash-WAMは、一貫性蒸留にインスパイアされたモダリティ対応のステップ蒸留フレームワークである。
各モードにおける推論を1ステップに圧縮する。
シミュレーションベンチマークでのタスク成功を保ち、現実世界のパフォーマンスを大幅に回復する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:29:57 GMT)
Dominant-Layer ZO: A Single Layer Dominates Zeroth-Order Fine-Tuning of LLMs [32.8] Zeroth-order (ZO) 最適化により、前方パスのみを使用して大きな言語モデル(LLM)をメモリ効率よく微調整できる。
ZOファインチューニングは1つのデコード層に大きく支配されている。
LLaMA2-7B と Qwen3-8B を9つのベンチマークで比較したところ、支配層型ZOファインチューニングはフルモデル MeZO と LoRA ベースのZOファインチューニングよりも平均性能を向上させることが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:42:09 GMT)
4D Reconstruction from Sparse Dynamic Cameras [32.7] 我々は、少数のカメラが同じ被写体を撮影する、スパース・ダイナミック・カメラ・セットアップ(sparse dynamic camera set)という別の実用的な方法に焦点を当てている。
このセットアップは多視点制約を導入し、スポーツ、コンサート、テレビ番組などの実世界のビデオ制作に実用的であり続けている。
LetCamsGoは、3台の独立して動くカメラと1台の固定カメラによって記録された4つの異なる環境に5つのシーケンスが並んだ、新しい現実世界のビデオデータセットである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:31:43 GMT)
Learning While Acting: A Skill-Enhanced Test-Time Co-Evolution Framework for Online Lifelong Learning Agents [32.5] 大規模言語モデル(LLM)エージェントが動的にインタラクティブな環境で動作するためには、生涯学習が不可欠である。
オンライン生涯学習エージェントのための2段階強化学習フレームワークであるSkill-enhanced Test-Time Co-Evolution(textttLifeSkill)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:38:57 GMT)
Aggregating LLM-Based Weak Verifiers for Spatial Layout Generation [32.5] 本稿では,タスク固有の弱い(不完全な)検証器を空間配置領域の強い検証器に構築・集約するパイプラインを提案する。
このような検証器の応答を集約することで、より強力な検証器を生成することができることを示す。
また,強い検証器からの自然言語フィードバックを用いた検証器誘導レイアウト生成により,基本レイアウト生成器のレイアウト品質が66.2%向上することが実証された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:50:49 GMT)
Denoise First, Orthogonalize Later: Understanding Momentum in Muon via Spectral Filtering [32.2] ムオンの運動量はスペクトルフィルタとして作用することを示す。
摂動前の運動量を適用することは、この順序を逆転させるか、単に運動量を取り除くよりも、勾配の信号成分との配向を確実に強くする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:06:07 GMT)
AgentJet: A Flexible Swarm Training Framework for Agentic Reinforcement Learning [32.0] AgentJetは、大規模言語モデル(LLM)エージェント強化学習のための分散フレームワークである。
Swarmサーバノードはトレーニング可能なモデルをホストし、GPUクラスタ上で最適化を実行する一方、Swarmクライアントノードは任意のデバイス上で任意のエージェントを実行する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:02:52 GMT)
Usability Analysis of Configurator User Interfaces with Multimodal Large Language Models [31.8] 本稿では,ユーザインタフェース(UI)のスケーラブルかつ半自動解析におけるMLLMの利用について検討する。
文献から18種類のユーザビリティ基準を適用し、16の実世界のMLLM分析にこれらの基準を適用した。
各基準は個別に評価され、ユーザビリティ問題や実行可能な改善提案に対する深刻度評価を生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:35:17 GMT)
WAM-Nav: Asymmetric Latent World-Action Modeling for Unified Visual Navigation [31.5] 視覚ナビゲーションは、複雑な幾何学的および物理的制約の下で滑らかで衝突のない軌道を生成する必要がある。
WAM-Navは,視覚ナビゲーションを具体化した潜在世界行動モデルであり,行動生成と潜時視予知を共同で学習する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:05:19 GMT)
SinkRec: Mitigating Semantic State Sink in Long Sequence Recommendation with Memory-Conditioned Gated Delta Networks [31.4] セマンティックステートシンクを緩和するハイブリッドメモリ-遷移ループアーキテクチャであるSinkRecを提案する。
SinkRecは、繰り返し発生するローカルパターンを学習可能な条件記憶に外部化する。
TDGDは、メモリに隠された更新を抑え、メモリに整合した読み出し応答を除去することで、リカレント書き込みと読み出しをメモリで浄化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:10:06 GMT)
UniCAD: A Unified Benchmark and Universal Model for Multi-Modal Multi-Task CAD [31.3] マルチモーダルCAD学習のための総合ベンチマークUniCADを紹介する。
テキスト,画像,スケッチ,点群を取り込み,汎用的な大規模言語モデルUniCAD-MLLMを提案する。
将来の研究を加速するために、データセット、コード、事前訓練されたモデルをリリースします。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:20:57 GMT)
AutoMedBench: Towards Medical AutoResearch with Agentic AI Models [31.3] AutoMedBenchは、自律医療AI研究のためのワークフロー対応ベンチマークである。
各ランの平均エージェントターンが33回ある長い水平タスクで構成されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:43:27 GMT)
IMPose: Interactive Multi-person Pose Estimation with Dynamic Correction Propagation [31.2] マルチパーソン動的ポーズアノテーションのための対話型ツールIMPoseを紹介する。
ビデオ全体のアノテータから一フレームのマルチパーソンポーズを補正するデュアルレベルトラッキング機構を備えている。
IMPoseは高精度なアノテーションを高い効率で実現し、3DPWでは1,050コマビデオにつき27クリック、PoseTrack21では84コマあたり3クリックしか必要としない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:55:26 GMT)
Developing a novel Comorbidities Index for predicting 10-year mortality in Prostate Cancer patients: A computational data-driven approach [31.1] カールソン総合指数(英: Charlson Comorbidities Index、略称:CCI)は、10年間の死亡リスクを推定するために広く用いられる重み付け加法指数である。
根治的前立腺切除術(RP)を施行する候補者に対しては,10年間の死亡率の正確な推定が不可欠である。
RPを考慮に入れたPCa患者に適合したコモビディティ指数を導出するためのデータ駆動型フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:26:25 GMT)
The Right Measure for Physics-Constrained Generation: A Co-Area Correction for Posterior-Consistent PDE Inverse Problems [31.1] 生成モデルは、偏微分方程式(PDE)の逆問題を解くためにますます使われている。
広く採用されているレシピが間違った分布をサンプリングしていることを示す。
我々は,コエリア後部を対象とする測度制約付きサンプルであるtextbfCoCoSを紹介した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:30:03 GMT)
Preserving Data Privacy in Learning Causal Structure with Fully Homomorphic Encryption [30.9] 本稿では,完全同型暗号(FHE)に基づく暗号文の計算手法を提案する。
提案手法は,テストしたデータセットのバージョンと高い一貫性と同等な因果構造を実現する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:33:14 GMT)
Phase-correlation-free quantum key distribution source operating at gigahertz rates [30.1] 我々は、Cバンドで動作する超発光発光ダイオード(SLED)に基づく1.25GHzの位相ランダム化QKD光源を提案する。
ソースは$sim100$ ps光パルスを生成し、400$psのパルスとパルスを分離し、高速なタイムビン符号化と互換性がある。
この研究は、高速準備・測定QKDシステムのためのスケーラブルなSLEDベースのプラットフォームを確立する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:35:59 GMT)
DiscourseFlip: An Oblique Discourse-Level Opinion Manipulation Attack against Black-box Retrieval-Augmented Generation [30.0] 既存のRAG攻撃は主に個々のクエリや狭いトピックローカルクエリセットに焦点を当てている。
セマンティック・クエリー・ネットワークにまたがる協調的な影響が意見シフトを引き起こす新たな脅威モデルである談話レベルの意見操作を導入する。
実験では、DiscourseFlipがコンテキスト化されたクエリネットワークをまたいで、目標とする意見シフトを一貫して誘導することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:47:29 GMT)
Self-Evolving Deep Research via Joint Generation and Evaluation [29.9] ディープ・リサーチ・レポート・ジェネレーションには決定的な根拠が欠けているため、報酬設計は本質的に検証不可能である。
既存のアプローチは、LCM-as-a-judgeとクエリ依存評価ルーブリックでこの課題を軽減する。
我々は、この制限を、ディープテキストbfresearchの評価と生成のためのTextbfco進化学習フレームワークで解決する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:38:19 GMT)
Self-supervised User Profile Generation for Personalization [29.9] 本稿では,プロファイルを用いた双方向ユーザモデリング(BUMP)について紹介する。
BUMPは、ラベル付き報酬に依存するクローズドソースAPIや先行メソッドにマッチするか、より優れています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:25:00 GMT)
UniPixie: Unified and Probabilistic 3D Physics Learning via Flow Matching [29.8] UNIPIXIEは、単一の視覚入力から物理的に可視な材料特性の連続経路を予測するために訓練されたフレームワークである。
PIXIEMULTIVERSEデータセット上で物体の最も軟弱なスペクトルに沿った直接マッピングを学習することで、UNIPIXIEは多様な物理的に有効な物質場を制御可能な生成を可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:08:23 GMT)
Learning What to Learn: Stage-Specific Data Sets for SFT-then-RL in Small Language Model Reasoning [29.7] 我々は、データ戦略はSFTとRLの異なる役割と一致すべきであると主張している。
本稿では,学習データをステージ固有のセットに整理する,難易度の高いSFT-then-RLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:25:06 GMT)
MapAgent: An Industrial-Grade Agentic Framework for City-scale Lane-level Map Generation [29.4] レーンレベルの地図は、自動運転とレーンレベルのナビゲーションにとって重要なインフラである。
最近のエンドツーエンドのベクトル化マッピング手法は,センサデータから直接レーン形状やトポロジーを予測することができる。
仕様に準拠したレーンマップ生産のためのベクトル化バックボーンを増強する,産業レベルのエージェントアーキテクチャであるMapAgentを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:44:42 GMT)
A General Framework for Dynamic Consistent Submodular Maximization [29.3] 一貫性は動的部分モジュラーアルゴリズムにおいて重要な性質である。
この設定のためのアルゴリズムを設計するための一般的なフレームワークを開発する。
濃度制約に対して、$frac 12 - O(varepsilon)$ approximation, $Oleft(frac1varepsilon2right)$ consistentを提案する。
階数-$k$ マトロイドの制約に対して、$frac 14 - O(varepsilon)$ を$Oleft(fraclog kvarepsilon2right)という動的最適化に近似する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:35:13 GMT)
Sequential Data Poisoning in LLM Post-Training [29.3] 既存の文献では、トレーニングの各段階でデータ中毒攻撃が起こる可能性があるが、複数の攻撃者の可能性を無視していると仮定している。
本稿では、複数の敵がSFTと選好データセットを別々に汚染するシーケンシャルデータ中毒の脅威モデルを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:22:50 GMT)
GeoMin: Data-Efficient Semi-Supervised RLVR via Geometric Distribution Modeling [29.2] 検証可能な報酬(RLVR)による強化学習はLLM推論を著しく向上させる。
標準的な教師なしスケーリングは高いアノテーションコストによって妨げられ、教師なしの代替手段は深刻なモデル崩壊に悩まされる。
最近の半教師付きRLVR法は、ラベルのないデータをガイドする小さなラベル付きセットを使用してこの問題に対処し、トレーニングの有効性とアノテーションコストの間の有望なトレードオフを実現する。
ラベル付きデータに対するグローバルな特徴をモデル化したGeoMinを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:47:50 GMT)
Smart Picks in the Dark: Towards Efficient RLVR for Reasoning via Tracing Metacognitive Pivots [29.1] RLVRの「暗黒のピック」設定は、事前の監督なしに、トレーニングに最も有益でアノテーションに相応しいラベルなしサンプルを選択することを目的としている。
本稿では,3方向データトリアージフレームワークであるPivotTraceを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:34:42 GMT)
Ultra-Fast Neural Video Compression [29.1] 本稿では,レート・歪み・複雑さのトレードオフを大幅に改善するために,チャンクベースのコーディングフレームワークを提案する。
フレームを逐次処理する代わりに、複数のフレームの断片を1つのコンパクトな潜在表現に符号化し、同時にデコードする。
これらのイノベーションに基づいて、我々は、新しいSOTAのパフォーマンスを規定する新しいNVCであるDCVC-UFを紹介します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:38:05 GMT)
Geometry Gaussians: Decoupling Appearance and Geometry in Gaussian Splatting [28.9] デフォルトの3DGSはテクスチャと幾何学を同時に表現するのに適していないことを示す。
各スプラットに1つの追加の幾何不透明度パラメータを適用することで、簡単な解を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:29:36 GMT)
InstantRetouch: Efficient and High-Fidelity Instruction-Guided Image Retouching with Bilateral Space [28.8] 両空間操作を用いた効率的かつ忠実なリタッチ手法を提案する。
画像やピクセルを直接編集する代わりに、アフィン変換の低分解能二値格子を予測する。
このアプローチは高い忠実度と効率性の両方をもたらす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:30:17 GMT)
Anchor3R: Streaming 3D Reconstruction with Transient Anchors for Long-Horizon Visual Mapping [28.6] ロングホライゾンのオンライン視覚マッピングは、ロボット知覚のコア機能である。
最近のフィードフォワード3D再構成モデルは、第1フレームまたは永続的なシーンメモリに結び付けられた固定座標系におけるポーズを予測する。
フィードフォワード再構成を電流中心の局所測定予測として扱うストリーミング3D再構成フレームワークであるemphAnchor3Rを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:00:13 GMT)
Who Needs Labels? Adapting Vision Foundation Models With the Metadata You Already Have [28.4] 本稿では,強力だが汎用的な視覚基盤モデルを専門分野に適用するためのラベルフリーアプローチを提案する。
我々の手法であるFINOは、標準的な自己教師対象と柔軟なメタデータガイダンスを組み合わせたものである。
標準の非教師付きドメイン適応と完全な教師付きドメイン適応を一貫して上回る。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:10:11 GMT)
ParetoPilot: Zero-Surrogate Offline Multi-Objective Optimization via Infer-Perturb-Guide Diffusion [28.3] オフラインMOOのための新しいゼロ代理拡散フレームワークを提案する。
パーターブガイドエンジンは、逆生成プロセスの無条件復調ステップ内でシームレスにインターリーブされる。
当社のアプローチは,超ボリューム改善を実現しつつ,データのプライバシを保護します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:27:21 GMT)
Disentangled Fine-Grained Prototype Learning for Incomplete Image-Tabular Classification [28.3] DFPLは、きめ細かいプロトタイプ学習のための新しいフレームワークである。
SSPMはコンパクトで多種多様な共有およびモダリティ特異的なプロトタイプを抽出する。
PFAモジュールは、プロトタイプレベルの分散マッチングとプロトタイプからクラスへのセマンティックアライメントを共同で実施する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:24:05 GMT)
Reinforcement Learning from Cross-domain Videos with Video Prediction Model [28.1] XIPERは、視覚的に異なる領域で収集されたエキスパートビデオから学ぶための報酬モデルである。
エージェントの観測結果を専門家ドメインにマッピングし、予測確率を報酬信号として使用する。
実験によると、XIPERはドメインのギャップにもかかわらず、一貫してベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:57:41 GMT)
NIV: Neural Axis Variations for Variable Font Generation [28.0] 可変フォントは、重み、幅、スラント、光学サイズなどの意味軸に沿ってグリフ幾何学の連続的な変化を可能にする。
静的フォントを完全に機能する可変フォントに自動的に変換するNIVを導入する。
NIVは、見えないコードポイント、見えないフォントスタイル、高複雑さKグリフ、さらには配布外手書き入力を一般化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:17:43 GMT)
Potential-Guided Flow Matching for Vision-Language-Action Policy Improvement [27.7] 自己誘導型フローマッチングポリシであるForesightFlowを紹介した。
それぞれの生成されたアクションチャンクを、学習された成功可能性軌道で拡張する。
候補アクションをスコア付けし、外部の批評家なしで$K$の推論を可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:49:35 GMT)
Dynamic Infilling Anchors for Format-Constrained Generation in Diffusion Large Language Models [27.6] 動的埋込アンカー (DIA) は, 動的にエンドアンカー位置を推定し, 反復埋込前の生成長を調整する。
DIAはフォーマットのコンプライアンスと回答の精度を大幅に改善し、GSM8KとMATHで大きなゼロショットゲインを達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:18:23 GMT)
D^2SD: Accelerating Speculative Decoding with Dual Diffusion Draft Models [27.4] 最近の拡散ベースのドラフトラはトークンのブロック全体を並列に生成するが、通常は検証毎に単一のドラフトシーケンスにコミットする。
D2SDは,候補を信頼誘導プレフィックスツリーに整理する,二重拡散ドラフト投機的復号化フレームワークである。
結果として得られた共有誘導候補は、カスケードの注意を通して共同で検証される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:48:00 GMT)
Beyond Ideal Instruction: A Comprehensive Framework for Evaluating LLMs in Realistic Interactions [27.3] RUT-Benchは大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
我々は,このベンチマークを用いて,広く採用されている19のオープンソースおよびプロプライエタリ LLM の評価を行った。
テスト済みのLCMは40%以上の成功率を達成することができず、ほとんど全員が、より複雑な非理想的なユーザ入力に直面した時に顕著なパフォーマンス低下を経験しています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:19:48 GMT)
What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems [27.1] 2つのマルチエージェントシステム間での5つの共通エージェント間通信戦略を解析する。
PACT (Protocolized Action-State Communication and Transmission) は,エージェント間通信を状態更新問題として扱う。
PACTはパフォーマンスコストのトレードオフを一貫して改善し、トークンを著しく少なくして、同等またはより強力なタスクパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:22 GMT)
Read the Trace, Steer the Path: Trajectory-Aware Reinforcement Learning for Diffusion Language Models [26.9] 本稿では,dLLM-RLアルゴリズムであるCAPR(Cached-Amortized Path Refinement)を導入する。
ロールアウトのコストは、平らなロールアウトの約0.75倍、木のロールアウトの約0.6倍に削減される。
4x4 Sudoku、Countdown、GSM8K、Math500の合計で、最強の木構造ベースラインとステップ毎の計算の3分の1以下で一致している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:22:54 GMT)
CR-Seg: Attention-Guided and CoT-Enhanced Coarse-to-Refined Reasoning Segmentation [26.2] Reasoning segmentation は、複雑な言語で記述されたターゲットオブジェクトを視覚的・テキスト的推論によって分割することを目的としている。
既存の手法では、学習したセマンティックトークンを使ってMLLM(Multimodal Large Language Models)とセグメンテーションモデルをブリッジする。
本稿では,空間分割のための2段階フレームワークCR-Segを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:51:10 GMT)
Argument Collapse: LLMs Flatten Long-Form Public Debate [26.2] 我々は、議論の崩壊、異なる LLM によって生成されたエッセイの傾向を、より小さな主要な議論、サブ引数、および段落レベルの構造に収束させる傾向について研究する。
ニューヨーク・タイムズ(NYT)の討論会では1,039件、ボストン・レビュー(BR)のフォーラムでは448件、LLMのエッセイでは23,384件を比較した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:13:44 GMT)
Read What You Hear: Reference-Free Hypotheses Evaluation with Acoustic Discrepancy [26.1] READ(Reference-free hypothesis Evaluation with Acoustic Discrepancy)は、音声信号から直接ASR仮説を評価する新しい尺度である。
テキスト仮説が与えられた音声トークンの条件付き確率を計算するために、事前訓練された自己回帰的TSモデルを使用する。
実験によると、READは特定の認識エラーと相関し、ASR出力を改善し、最大20%の相対誤差率の削減を達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:03:19 GMT)
Near-Optimal Decentralized Stochastic Convex Optimization over Networks [25.7] 我々は分散スムーズな凸最適化について研究し、そこでは労働者が固定ゴシップネットワーク上で通信する。
我々は、このレートを最大$smashMlesssim sqrt,N3/4$ワーカーに保存する、高速化された分散化手法を導入する。
線形スパン分散一階法に一致する下界を定め, 対数係数に最適であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:42:01 GMT)
Failed Reasoning Traces Tell You What Is Fixable (But Not by Reading Them) [25.6] テスト時間介入が与えられた障害を救える推論時シグネチャを符号化した障害トレースを提案する。
利用可能な介入の構造から導かれる3つの問題レベルの軌道特徴は、ロールアウト失敗の分布的シグネチャからこの構造を回復する。
同じ3つの機能は、破棄されたデータから失敗したトレースを診断オブジェクトに変換し、トレーニング時間やウェイトスペースアクセスなしでテスト時間ルーティングとトレーニング後の分析をサポートする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:50:26 GMT)
DuDi: Dual-Signal Distillation with Cross-Lingual Verbalizer [25.4] 小型言語モデル(SLM)は効率的でスケーラブルだが、その多言語能力はサブビリオンスケールで著しく低下する。
オンラインシーケンスレベル信号とオフポリティクスおよびオンポリティクストークンレベル信号を組み合わせた二重信号多言語蒸留フレームワークであるDuDiを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:23:05 GMT)
UModel: An Agent-Ready Observability Data Modeling Method at Scale [25.1] データ中心のモデリングからオブジェクト中心のモデリングへ可観測性をシフトする統一的なオントロジフレームワークであるUModelを提案する。
UModelを使用して"AIOps 2025 Challenge"データセットを再モデル化することで、根本原因のローカライゼーションの精度が8%向上した。
UModelは数万のユーザに仕え、毎秒数百万のオペレーションを持続し、秒未満のクエリレイテンシを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:25:50 GMT)
DSA: Dynamic Step Allocation for Fast Autoregressive Video Generation [24.8] ビデオ拡散トランスフォーマーは最先端の視覚的品質を達成したが、その高い推論コストは、リアルタイムアプリケーションにとって大きなボトルネックであり続けている。
本稿では、ARビデオ拡散のための信頼性誘導適応フレームワークであるDSAを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:25:11 GMT)
HapTile: A Haptic-Informed Vision-Tactile-Language-Action Dataset for Contact-Rich Imitation Learning [24.6] HapTileは、視覚のみのトラジェクトリデータセットを超えて前進する、接地型ビズオタクティル操作データセットである。
データ収集プラットフォームは、触覚フィードバックを直接遠隔操作コントローラに統合し、オペレータがリアルタイムでコンタクトインタラクションを知覚できるようにする。
データセットは、ピック・アンド・プレイス、折り畳み、押圧、積み重ね、その他のルーチンアクティビティを含む、幅広いコンタクト豊富なスキルにまたがる日々の操作タスクで構成されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:48:17 GMT)
Fast & Faithful Function Vectors [24.5] 関数ベクトル (FV) は、大規模言語モデル (LLM) を操るのに使用できる、コンテキスト内学習中に引き起こされるタスク表現である。
注意点選択とステアリングの2つの自由度に沿った指示に対する異なるFV定義の影響について検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:36:15 GMT)
Revisiting Embodied Chain-of-Thought for Generalizable Robot Manipulation [24.5] CoT(Embodied chain-of- Thought)は、言語推論とロボット制御を橋渡しすることを目的としている。
現在までに最大規模のCoTコーパスを構築しており,978,743軌道,226.3Mサンプル,2592.5時間ロボットデータで構成されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:29:49 GMT)
Programmable spectral symmetries in an anisotropic quantum Rabi simulator [23.9] 超伝導プロセッサにおけるプログラム可能な異方性量子Rabiモデルを実現する。
異方性はスペクトルを再構成し、完全に崩壊・復活するダイナミクスを退化に近い不完全回復に変換することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:08:27 GMT)
Fine-grained Fragment Retrieval in Multi-modal Long-form Dialogues [23.7] きめ細かいフラグメント検索 (FFR) は、多モーダルな長文対話における意味論的に関連する多文の断片を見つける。
我々は、強化学習で訓練された世代ベース検索モデルであるF2RVLMを紹介する。
オフラインのフラグメントレベルのインデックスとオンライン検索を組み合わせた2段階のシステムであるFFRSを開発した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:29:43 GMT)
Caliper: Probing Lexical Anchors versus Causal Structure in LLMs [23.6] 因果グラフと各質問の確率的仕様を保存しながら,意味変数名をプレースホルダートークンに置き換える制御摂動を導入する。
9つの命令調整されたLDMで、レキシカル匿名化は、局所的な3.8B-14Bセットで、+7.6、+27.0、+11.1 ppの堅牢な精度低下をもたらす。
ゼロショットの評価を受けた現在の命令調整LDMは、語彙アンカーが取り除かれた後、構造的因果推論の証拠をほとんど示していない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:11:16 GMT)
BiasGRPO: Stabilizing Bias Mitigation in High-Variance Reward Landscapes via Group-Relative Policy Optimization [23.1] 大規模言語モデル(LLM)における社会的バイアスの緩和は、異なるアライメントの課題を示す。
直接選好最適化(DPO)は、オフライントレーニングに固有の探索の欠如によって制限される。
PPO(Proximal Policy Optimization)は、潜在的に信頼性の低い批評家の推定により、トレーニング不安定につながる可能性がある。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:31:42 GMT)
Flatness and Generalization: Learning Multi-Index Models with Homogeneous Neural Networks [23.1] 平坦性を最も平坦に近づけることができない非一般化補間器の自然なクラスが存在することを示す。
単一インデックスモデルの和から生成されるデータに対して、近似誤差とラベルノイズが低い場合、最も平坦な補間器は人口損失が少ないことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:20:03 GMT)
BRepCLIP: Contrastive Multimodal Pretraining on BRep Primitives for CAD Understanding [23.0] BRepの幾何学を言語や画像の埋め込みと整合させる最初のフレームワークであるBRepCLIPを紹介する。
トランスフォーマーエンコーダはこれらのトークンをグローバルなBRep埋め込みに集約し、CLIPのテキストとイメージエンコーダと整列する。
BRepCLIPは、既存の点ベースの代替よりも差別的で意味論的に基礎付けられた埋め込みを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:41:23 GMT)
Formal Concept Lattices are Good Semantic Scaffolds for Concept-Based Learning [22.9] ディープラーニングモデルにとって、セマンティクスの学習は、解釈可能で、人間の推論に適合することが不可欠である。
概念ベースのモデルは、意味のあるセマンティック抽象化を通じてクラスを表現することによって、これにアプローチする。
ニューラルネットワーク学習を導くために,形式的概念格子が基本的意味足場を提供することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:50:29 GMT)
When Both Layers Learn: Training Dynamics of Representing Linear Models via ReLU Networks [22.8] 線形対象関数に適合する1層ReLUネットワークの両層を協調的にトレーニングするための勾配勾配ダイナミクスについて検討した。
本分析では, 隠れ重みが植え付け方向と漸進的に一致し, 出力重みが正しい符号パターンを維持できるアライメントフェーズを3つのフェーズで追跡する。
我々は,全軌道に沿って保持される新しい一様濃度結果を確立し,次々に最適な試料の複雑性を得るのに不可欠である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:44:30 GMT)
CRAFT: Cost-aware Refinement And Front-aware Tuning of Prompts [22.8] CRAFT(Cost-Aware Refinement and Front-Aware Tuning)は,LLM検証コールを少ないリソースとして扱うプロンプトで,楽観的な候補フロント付近の候補に割り当てる。
各ラウンド、補完的精度指向、コスト指向のジェネレータは編集を提案し、NSGA-IIの保持は人口の広がりを保っている。
6つの分類と推論のベンチマークで、CRAFTの保持するフロントは、高い精度と低コストの両方に到達し、精度のみ、コストのみ、および重み付きサムベースラインは、それぞれより狭い領域に集中している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:40:03 GMT)
DeployBench: Benchmarking LLM Agents for Research Artifact Deployment [21.9] LLMエージェントは、ソフトウェア工学とML研究のタスクを急速に進歩させてきたが、これらの進歩は、しばしば動作可能な実行可能な環境へのアクセスを前提としている。
既存の環境設定ベンチマークは、研究成果物の配置の全範囲をカバーしていない。
我々は、AI/ML、コンピュータシステム、科学計算にまたがる51の研究成果デプロイメントタスクのベンチマークであるDeployBenchを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:59:34 GMT)
MoDex: A Diffusion Policy for Sequential Multi-Object Dexterous Grasping [21.8] ほとんどの厳密な把握法は、すべての自由度を単一の物体にコミットする。
MoDexは、観測から直接次のグリップのポーズを予測する拡散ポリシーである。
我々は,MuJoCoをベースとしたFranka Emika PandaロボットのシミュレーションにおけるMoDexの評価を行った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:22:10 GMT)
What If Prompt Injection Never Left? Exploring Cross-Session Stored Prompt Injection in Agentic Systems [21.7] クロスセッションシステム状態は、エージェントシステムのシステムレベルのリスクを根本的に変える。
Webシステムに格納されたクロスサイトスクリプティングにヒントを得て、クロスセッションストアドプロンプトインジェクションを導入する。
我々は,ストアドプロンプトインジェクションのリスクを評価するためのベンチマークとサンドボックスツールキットを開発した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:14:17 GMT)
Be Fair! Can Machine Learning Engineering Agents Adhere to Fairness Constraints? [21.7] マシンラーニングエンジニアリング(MLE)エージェントは、生データと自然言語命令からエンドツーエンドのMLパイプライン開発を自動化することを約束する。
敏感で規制されたドメインでは、この抽象化は責任ギャップを生み出す。
既存のベンチマークでは、このような設定でMLEエージェントを安全に適用できるかどうかを評価するには不十分である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:52:49 GMT)
Hybrid Adversarial Defence for Natural Language Understanding Tasks [21.6] 本研究では,エントロピーモデル,不確実性モデル,幾何学的モデルを組み合わせたハイブリッド・ディフェンス・フレームワークについて検討する。
その結果, エントロピー, 不確実性, 幾何学的特徴の組み合わせは, 一つの特徴のみを用いることよりも, より効果的な防御戦略をもたらすことがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:49:15 GMT)
Unpaired RGB-Thermal Gaussian-Splatting Using Visual Geometric Transformers [21.6] RGBと熱画像を組み合わせたマルチモーダルノベルビュー合成(NVS)により、視覚的・熱的情報による正確な3次元シーン再構成が可能となる。
本稿では,3DフィードフォワードトランスアーキテクチャであるVGGTを利用した不対向RGB熱的NVSのためのフレームワークを提案する。
提案手法は,RGB忠実度を維持しつつ,熱ビュー合成における競争性能を向上することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:30:58 GMT)
Self-Evaluation Is Already There: Eliciting Latent Judge Calibration in Base LLMs with Minimal Data [21.5] 大規模言語モデルは、他のモデルによってますます評価され、自然な疑問が提起されている。
本稿では, 自己評価抽出(SEE)手法について紹介する。この手法は, キャリブレーション結合型強化学習フェーズを含む短いサイクルで, 応答を改善し, 審査員を予測し, 次いで, 応答を無触で残しながら, 予測を鋭くするマスク付き蒸留フェーズを備える。
帰属した自己評価は、モデル自身のトークン分布内で急激に局所化され、訓練されたことのない審査員間で安定しており、単一の審査員ではなく、品質の伝達可能な概念を示している」。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:27:16 GMT)
Latent Anchor-Driven Test Generation for Deep Neural Networks [21.3] LatteはDeep Neural Networks(DNN)のためのブラックボックステスティングフレームワーク
潜在空間を活用することで、セマンティックに近づき、多種多様で、そしてフォールトリベリングなテストケースを生成する。
単モデルおよび多モデルテストシナリオにおいて,5つのデータセットと10のDNNモデル上でLatteを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:33:21 GMT)
Learning What Not to Impute: An Uncertainty-Aware Diffusion Framework for Meaningful Missingness [21.1] Diff-Jointを提案する。
Diff-Jointは、競合計算精度を達成し、下流タスク性能を向上しつつ、有意義に欠落したエントリを効果的に識別することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:31:54 GMT)
TeeDAO: A Decentralized Autonomous Organization for Heterogeneous TEEs [21.0] Trusted Execution Environments (TEEs) は、センシティブなデータの保護と、現代のコンピューティングシステムにおけるコードの完全性を保証するための重要な技術として登場した。
本稿では,複数の異種TEEインスタンスを自動的に整理する新しい3層フレームワークであるTeeDAOを紹介する。
61ノードの大規模クラスタにおいて,TeeDAOは最先端システムと比較して最大1.8倍高いキーバリューストアスループットを実現していることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:09:05 GMT)
From Agent Traces to Trust: Evidence Tracing and Execution Provenance in LLM Agents [20.7] 大規模言語モデル(LLM)ベースのエージェントは、外部ツール、検索システム、メモリモジュール、環境、その他のエージェントと相互作用することで、複雑なタスクをますます解決する。
最終回答の精度だけでは、アウトプットがどのように生成されたかは説明できないため、それぞれのクレーム、ツールコールが正当化されたか、後の決定にメモリがどのように影響したか、実行失敗がどこから発生したかといった証拠が裏付けられている。
エビデンストレースと実行の証明は、検索されたエビデンス、ツール出力、メモリアイテム、環境観察、中間クレーム、アクション、最終回答がエージェントの実行を通してどのように接続されているかをモデル化することによって、このギャップに対処する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:12:47 GMT)
Temporal Order Matters for Agentic Memory: Segment Trees for Long-Horizon Agents [20.5] SegTreeMemは、会話履歴を発話上の時間順のSegment Treeとして表現する。
検索のために、SegTreeMemは、木を通して関連スコアを伝搬し、局所的なセマンティックマッチングと階層的時間的コンテキストを組み合わせる。
追加の時間順置換解析により、メモリ構築時の時間順の保存による性能向上が示されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:42:15 GMT)
When Evidence is Sparse: Weakly Supervised Early Failure Alerting in Dialogs and LLM-Agent Trajectories [20.3] 早期の障害警告では、ダイアログやエージェントのトラジェクトリがまだ展開されている間に、フェールするかどうかを判断する必要がある。
一般的には、トラジェクトリレベルの成功/失敗ラベルとしてのみ、監視が利用可能であるのに対して、アラートは部分的なインタラクションから引き上げなければならないため、これは難しい。
本稿では、このスパースエビデンス構造から学習し、その結果のリスク推定を制御可能な早期警報に利用する2段階のアプローチを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:28:27 GMT)
Learning Long Range Spatio-Temporal Representations over Continuous Time Dynamic Graphs with State Space Models [20.3] 連続時間動的グラフ(CTDG)は、進化するデータの微細な時間パターンをキャプチャする、よりリッチなフレームワークを提供する。
連続時間動的グラフのためのパラメータ効率のよい状態空間モデリングフレームワークを導出する。
CTDG-SSMは、LRT(long range temporal)と空間推論を必要とするデータセットにおいて、大きなパフォーマンス向上を達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:54:35 GMT)
Multilingual Coreference Resolution via Cycle-Consistent Machine Translation [20.2] コア参照解決はコアNLPタスクであり、機械翻訳、質問応答、文書要約など、幅広いダウンストリームアプリケーションを持つ。
本稿では,機械翻訳(MT)を英語からターゲットとする低リソース言語に活用する新しいコア推論分解パイプラインを提案する。
4つの低リソース言語の実験から、私たちのパイプラインはコア参照の解決において大きなパフォーマンス向上をもたらします。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:06:55 GMT)
Toward Multi-Domain and Long-Tailed Quantization via Feature Alignment and Scaling [20.1] 領域分布をCDFベースのプロジェクションで整列する効率的なマルチドメインアライメント量子化(EmaQ)を提案する。
EmaQをEmaQ-LTに拡張し、クラス条件の分散スケーリングと信頼性に基づくロジット調整を導入する。
実験により、EmaQとEmaQ-LTはドメインシフトとクラス不均衡の下で強い低ビット性能を実現することが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:16:58 GMT)
Insurance of Agentic AI [20.0] エージェント人工知能(AI)システムは、情報生成を越えて自律的な計画へと拡張することで、リスクランドスケープを変革している。
これらの能力は、サイバー、専門的責任、製品責任、ディレクターや役員の報道など、従来の保険カテゴリーに適さない新しい露出をもたらす。
本稿では、エージェントAIの新興保険市場について検討し、その引受、価格、再保証、製品設計の意味を理解するための枠組みを開発する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:10:38 GMT)
VentAgent: When LLMs Learn to Breathe -- Multi-Objective Arbitration for ARDS Ventilation [19.9] 本稿では,大規模言語モデルが機械的換気のための透明な調停器として機能する階層的なフレームワークであるVentAgentを紹介する。
VentAgentは意思決定を、知覚、計画、オーケストレーションの3つの解釈可能なステージに分解する。
コントロール決定を人間可読な推論チェーンに変換し、クリティカルケア自動化のためのより安全で解釈可能で適応可能なパラダイムを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:03:31 GMT)
Geometry-Preserving Unsupervised Alignment for Heterogeneous Foundation Models [19.9] ヴィジュアル言語基礎モデル(VLM)とヴィジュアル言語基礎モデル(VFM)の2つの支配的なパラダイムは、部分的にしか互換性がない。
本稿では,VFMとVLMの相補的強度を統合したGPUA(Geometry-Preserving Unsupervised Alignment)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:02:09 GMT)
On the Persistent Effects of Lexicality in Large Language Models [19.8] 大規模言語モデル(LLM)における意味的内容に対する語彙重なりの効果を定量化する。
語彙的影響はモデルの深さにまたがって広がり、一貫してアーキテクチャ、トレーニング体制、客観的機能にまたがっている。
語彙信号と意味信号の両方が同時に劣化する中深度領域を観察し、表象が表象と意味の両方に乏しい遷移状態を示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:55:08 GMT)
20 Second Parity Lifetime in an InAs--Pb Tetron Device [19.6] トポロジカル量子コンピューティングにおける中心的な約束は、励起ギャップの増加がデバイスの性能を大幅に向上させることである。
ここでは,InAs-Pbテトロンデバイスにおいて,この原理を干渉式単発パリティ測定により実験的に検証する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:49:57 GMT)
3DThinkVLA: Endowing Vision-Language-Action Models with Latent 3D Priors via 3D-Thinking-Guided Co-training [19.6] 3次元幾何学的知覚と3次元空間的推論は、異なる特徴階層で切り離され、注入される異なる能力である。
本稿では,視覚言語行動モデル(VLA)が行動予測中に暗黙的に3次元空間推論を行うことを可能にする3次元思考誘導協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:34:07 GMT)
The Invisible Hand of Physics: When Video Diffusion Models Know More Than They Show [19.5] IntPhys と InfLevel の拡散変圧器状態から物理可視性は線形に除去可能であることを示す。
驚いたことに、この信号はVAE潜伏入力を欠き、復調変圧器内部に現れる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:11:51 GMT)
Cone-Compatible Monge Geometry for High-Dimensional Ordered Optimal Transport [19.5] モンジュ幾何学:閉凸円錐 (K) は(y-xin K) がいつでも位数 (xpreceq_K y) を誘導する
コーン鎖に支持される措置は、量子型閉形式最適結合を許容する。
正準順序鎖分布上で得られたコーン鎖ワッサーシュタイン計量を区別する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:23:41 GMT)
Towards Multi-Agent-Simulation-Based Community Note Evaluation [19.4] MultiComは、コミュニティノート評価のためのペルソナ誘導型マルチエージェント評価フレームワークである。
行列分解されたレーダ空間のコントリビュータをクラスタリングすることで、多様なレーダ集団をシミュレートする。
信頼、合意の合図、理由など、構造化され説明可能な判断を下す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:29:01 GMT)
New Benchmarking Shows Limited Generalization Power of TCR Antigenic Epitope Prediction Models [19.4] T細胞受容体(TCR)抗原特異性の計算学的予測は、T細胞生物学の研究を変換し、スケーラブルな免疫工学を可能にする。
既存のモデルには、幅広い用途に十分な感度と特異性がない。
ここでは、モデル性能と一般化可能性の偏りのない評価を可能にする2つの相補的なデータセットのクラスについて述べる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:14:05 GMT)
Executable Schema Contracts: From Automatic Ingestion to Multi-Source Retrieval [19.4] 実世界のデータは、暗黙のセマンティクスを持つテーブル、ドキュメント、半構造化ファイルにまたがる。
生のマルチソースデータから実行可能なスキーマを自動的に検出するシステムを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:28:36 GMT)
CausalPOI: Spatio-Temporal Graph-Based Causal Modeling for Cold-Start POI Check-in Forecasting [19.3] CausalPOIは、POIチェックイン予測のためのグラフベースの因果表現学習フレームワークである。
実世界のデータセットの実験では、CausalPOIは最先端のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:27:48 GMT)
M$^3$Eval: Multi-Modal Memory Evaluation through Cognitively-Grounded Video Tasks [19.3] M$3$Evalは、マルチモーダルモデルで異なるメモリ次元を探索するための最初の包括的な評価フレームワークとベンチマークである。
代表的マルチモーダルモデルにまたがって実験を行い、一貫した弱点と独特な振る舞いを明らかにする。
本研究は、メモリを基礎的かつ未探索の能力として強調し、マルチモーダルモデルにおいてより効率的なメモリ機構を設計するための洞察を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:28:57 GMT)
Validity Threats for Foundation Model Research [19.1] 制御された実験は、機械学習研究のバックボーンである。
しかし、近代的な基礎モデルの規模では、これらは違法に高価になっている。
代わりに、コミュニティは、理想的な実験をほんの少しのコストで近似する研究戦略にますます依存している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:57:42 GMT)
R-APS: Compositional Reasoning and In-Context Meta-Learning for Constrained Design via Reflective Adversarial Pareto Search [18.8] 大規模言語モデル(LLM)は、オープンなタスクに精通しているが、エージェント設定では、信頼性の高いデリバリが保証されない。
エラーは局所化せずに伝播し、最悪の場合の摂動は未評価となり、蓄積された知識は決して無効にされない。
帰納的、反事実的、メタ帰納的、是正的、帰納的推論は、相容れない方向に共有コンテキストを引き出す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:45:39 GMT)
CoRe-MoE: Contrastive Reweighted Mixture of Experts for Multi-Terrain Humanoid Locomotion with Gait Adaptation [18.8] 地形適応から歩行生成を分離する2段階強化学習フレームワークであるCoRe-MoEを提案する。
最初の段階では、安定な移動ポリシーが学習され、スムーズな遷移を伴う自然な歩行行動と走行行動が生み出される。
第2段階では、地形を意識したMoE分岐を導入し、ゲーティングネットワークを形成するための対照的な目的で訓練する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:51:46 GMT)
Environment-Robust Representation Learning with Empirical Bayes [18.8] マルチ環境予測問題を考える。
複数の環境からのデータセットが与えられた場合、そのような問題に対してベイズモデルを定式化する。
この目的は、モデルの構造によって誘導される環境ごとの項と、追加の環境間バランス項に分解されることを示す。
後部近似のための補正変分アルゴリズムを開発し,得られた学習潜時変数を用いて新しい環境下での予測を行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:12:46 GMT)
Modeling and Interpreting Teamwork Dynamics in Cancer Care Outcome Prediction [18.5] がん治療には、個々の患者のニーズに応じて治療を計画し、提供するための縦断的なアプローチが必要である。
計画とデリバリはチームベースのプロセスであり、複数の医療専門家の協調作業に依存します。
我々は,これらの協調構造に埋め込まれた患者生存の予測信号の同定に機械学習手法を適用した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:28:59 GMT)
GARL: Game-Theoretic Reinforcement Learning for Multi-Agent Strategic Prioritisation [18.5] マルチエージェント戦略優先順位付けのためのGAme-theoretic Reinforcement Learningフレームワークを提案する。
我々は、GARLを紛争における問題ランキングでインスタンス化し、そこでは、法的手続きにおいて中核的な問題を優先することを目的としている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:19:55 GMT)
GeM-NR: Geometry-Aware Multi-View Editing for Nonrigid Scene Changes [18.3] 一般的なマルチビュー一貫した画像編集のためのトレーニング不要なアプローチであるGeM-NRを提案する。
アンカー画像とクエリ未編集画像が与えられた場合、GeM-NRはアンカー編集と一貫してクエリ画像を編集する。
本手法は,編集シーンの3次元表現生成を含む,多種多様な編集タスクの一貫性を向上させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:49:48 GMT)
BreastGPT: A Multimodal Large Language Model for the Full Spectrum of Breast Cancer Clinical Routine [18.2] textbfBreastStageは、ワークフローに整合した乳房画像診断コーパスである。
次に、デュアルブランチビジュアルエンコーダと概念保存トークン圧縮を備えた統合MLLMである textbfBreastGPT を構築する。
BreastStage-Benchでは、BreastGPTは75.66%のクローズドエンド精度と89.92%のオープンエンドスコアを達成し、汎用MLLMと医療用MLLMの両方を上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:06:52 GMT)
Measuring Model Robustness via Fisher Information: Spectral Bounds, Theoretical Guarantees, and Practical Algorithms [18.1] ディープニューラルネットワークの堅牢性は、安全クリティカルなデプロイメントに不可欠である。
本稿では,Fisher Information Matrixのスペクトル規範に基づく,攻撃非依存のロバスト性指標を提案する。
我々のフレームワークは、攻撃に基づく評価を補完する解釈可能な診断ツールとして機能する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:50:38 GMT)
ReSGA: A Large Tail Risk Model for Learning Value-at-Risk and Expected Shortfall [18.1] 本稿では,資産の豊富な断面積依存性と長期時間的ダイナミクスを活用するために,検索強化自己グループオートエンコーダ(ReSGA)を提案する。
ReSGAは、1926年から2023年までの米国株式の毎月のリターンに153の堅実な特性で適用される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:11:45 GMT)
Think Fast and Far: Long-Horizon Online POMDP Planning via Rapid State Sampling [18.1] 本稿では,高速状態空間サンプリング(ROP-RAS3)による参照型オンラインPOMDP計画法を提案する。
ROP-RAS3は、非常に高速なサンプリングベースのモーションプランニング技術を使用して、状態空間をサンプリングし、オンラインで様々なマクロアクションを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:14:48 GMT)
Search-Time Contamination in Deep Research Agents: Measuring Performance Inflation in Public Benchmark Evaluation [17.9] ディープリサーチエージェント評価における検索時間汚染(STC)について検討する。
STCは広く普及しており、パフォーマンスを最大4%向上させることができる。
我々は,サンドボックスの分離,透明な探索トラジェクトリ,ベンチマークアクセス制御など,汚染に配慮したプラクティスを提唱する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:11:36 GMT)
Beyond Single-Policy: Evaluating Composed Organization-Specific Policy Alignment in LLM Chatbots [17.8] COPALは、チャットボットにおける合成政治アライメントを評価する自動化ツールである。
経験的に派生したインタラクションパターンと明示的なハンドリングコントラクトを通じて、コンポジションポリシー障害をトリガーするクエリを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:17:26 GMT)
Optical-Guided Neural Collapse for SAR Few-Shot Class Incremental Learning [17.7] 合成開口レーダ画像におけるクラスインクリメンタルラーニング (FSCIL) は, 独特な課題を呈している。
神経崩壊に触発された光誘導型SAR FSCILフレームワークを提案する。
提案手法は,光学的ATRデータセットと24種類のターゲットクラスを持つSAR ATRデータセットからなるベンチマークで評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:09:20 GMT)
Efficient and Training-Free Single-Image Diffusion Models [17.6] 内部構造が単一の参照画像と一致した画像を生成することの問題点を考察する。
我々は、パッチベースのデノイザを、効率的でトレーニング不要な画像拡散モデルに統合する。
提案手法は,訓練された単一画像拡散モデルと比較して,最先端の世代品質と多様性を実現する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:05:36 GMT)
GGT-100K: Generative Ground Truth for Generalizable Real-World Image Restoration [17.5] 実世界の低品質(LQ)画像から高品質(HQ)ターゲットを生成するために,GGT(Generative Ground Truth)を提案する。
VLMをベースとした適応的プロンプトを持つナノバナナ-2は、知覚的にリアルでコンテンツに忠実なHQターゲットを合成する能力が最も高い。
GGT-100Kは103,707個のトレーニングペアで構成され,多様なシーンと複雑な実世界の劣化をカバーしたLQ-HQペアデータセットである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:01:24 GMT)
Label Over Logic? How Source Cues Bias Human Fallacy Judgments More Than LLMs [17.4] 我々は、推論評価におけるソースラベルバイアスが主に人間の脆弱性であるかどうかを評価する。
我々の研究は、AIを介する環境における人間とLLMのコラボレーションの可能性を強調した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:39:58 GMT)
Agentic Monte Carlo: Simulating Reinforcement Learning for Black-Box Agents [17.3] LLMエージェントは、強化学習(RL)に適したオープンウェイトエージェントと、テスト時に純粋に制御されなければならないブラックボックスエージェントの2つの異なる状態で動作する。
我々は,ブラックボックスエージェントの最適ポリシから直接,エージェントモンテカルロを提案する。
我々は、AgentGymベンチマークから3つの多様な環境においてAMCを検証し、ベースラインの促進よりも大幅に改善したことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:07 GMT)
A Modular Approach to Succinct Arguments for QMA [17.2] 我々は、QMAの簡潔な議論の暗号的基礎を広げる新しいフレームワークを開発する。
特に、LWEの硬さに依存しないQMAの最初の簡潔で古典的に検証可能な引数システムを得る。
我々のコンパイラはZhang(QCrypt 25)の量子剛性に基づく通信圧縮技術を拡張している
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:38:23 GMT)
VCIFBench: Evaluating Complex Instruction Following for Video Understanding [17.0] 本稿では,映像理解における複雑な指導方法を評価するためのベンチマークVCIFBenchを紹介する。
VCIFBenchは、ベンチマーク適応プロンプトとビデオ接地プロンプトの両方から制約に富んだ命令を構築する。
本稿では,VCIFBenchデータに対するDPOトレーニングにより,命令追従性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:27:53 GMT)
A Systematic Evaluation of Positional Bias in Multi-Video Summarization with MLLMs [17.0] 映像毎の要約の質がビデオの入力スロットによって変化しうるマルチビデオ要約における位置バイアスについて検討する。
9つのオープンソースおよびプロプライエタリなMLLMを評価し,3つの相補的指標を用いて位置効果を測定した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:34:31 GMT)
FoeGlass: Simple In-Context Learning Is Enough for Red Teaming Audio Deepfake Detectors [16.9] 音声のディープフェイク検出モデルは、テキスト音声(TTS)モデルの悪意ある使用に対処するために重要である。
ADDのための最初のブラックボックス自動リピート方式であるFoeGlassを提案する。
また,FoeGlassは,非条件サンプリングベースラインと最近のスプーフィングデータセットの偽陰性率を最大94%向上させることを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:04:26 GMT)
Extending AI for Research to the Humanities: A Multi-Agent Framework for Evidence-Grounded Scholarship [16.7] SPIRE(Scholarly-Primitives-Inspired Research Engine)は、エビデンスに基づく人文科学研究のためのマルチエージェントフレームワークである。
複数スケールのクローズドリーダー基板上での協調エージェントの役割として、人文操作を繰り返す。
答えの正確性、深さ、カバレッジ、証拠の質について、より高いブラインド・ジャッジスコアが与えられる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:48:36 GMT)
BEATS: Bootstrapping E-commerce Attribute Taxonomies for Search through Iterative Human-AI Collaboration [16.7] BEATSは、スクラッチから製品属性をブートストラップするための、ヒューマン・イン・ザ・ループ LLM フレームワークである。
本システムは楽天台湾で展開され,2,694のサブカテゴリと67,277の属性からなる9つの主要カテゴリに集約されている。
540万以上の製品が生成した属性でタグ付けされており、製品カタログ全体を充実させる計画だ。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:06:27 GMT)
AdaKoop: Efficient Modeling of Nonlinear Dynamics from Nonstationary Data Streams with Koopman Operator Regression [16.5] 本研究では,非定常データストリーム上の非線形ダイナミクスをモデル化する効率的なストリーミングアルゴリズムであるAdaKoopを提案する。
AdaKoopは、反復的非線形最適化の計算コストを抑え、ストリーミング方式で非線形力学の効率的かつ安定したモデリングを可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:23:32 GMT)
Linear Probes Detect Task Format, Not Reasoning Mode in Language Model Hidden States [16.5] 大規模言語モデル(LLM)隠れ状態の線形探索は、モデルが異なる推論型に対して異なる表現を学習すると主張するために広く用いられている。
古典的三分法にまたがる3つのベンチマーク、LogiQA 2.0 (導出性)、ARC-Challenge (導出性)、$$NLI (導出性)で、QwensicBによりこれを検証した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:53:39 GMT)
ProtoAda: Prototype-Guided Adaptive Adapter Expansion and Geometric Consolidation for Multimodal Continual Instruction Tuning [16.2] MLLM(Multimodal Large Language Models)は、命令チューニングによって高いパフォーマンスを達成するが、現実のデプロイメントでは、新たな視覚言語機能を取得する必要がある。
近年の手法では、画像-テキスト類似性ルーティングのMixture of LoRA Expertsのようなスパースアーキテクチャが採用されている。
プロトタイプ誘導適応チューニングフレームワークProtoAdaを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:49:24 GMT)
A Model of Multi-turn Human Persuadability Using Probabilistic Belief Tracing [16.2] PERSUASIONTRACEは、ヒト-LLM相互作用の説得を研究するためのフレームワークである。
それは、人間またはシミュレートされた説得の標的から多ターンの信条を記録する。
説得者回転を修辞次元でアノテートし、実人の信念のダイナミクスに忠実さでシミュレータを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:17:20 GMT)
EviRank: Evidence-Based Confidence Estimation for LLM-Based Ranking [16.1] 大規模言語モデルは推奨を約束するが、ドメインカバレッジと本質性に制限があるため、信頼性の懸念が高まる。
既存の不確実性定量化手法は,(1) 質問応答に対する大域的信頼度スコアがランクリストにおいてどの位置が信頼できないかを明らかにするのに失敗し,(2) モデル内部から抽出されたきめ細かい信頼度が全位置にわたって均一に低い値を示し,信頼できない予測をフィルタリングすることが不可能である,という2つの基本的な課題を継続する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:11:30 GMT)
A prism hierarchy of learning regimes in large linear autoencoders [16.1] 形式的損失拡大階層のレベルでは、その極端な構造は三角形のプリズムの面と自然に関連していることを示す。
特に、プリズムの2面に付随する5つの基本的な極端規則が存在する:(1)大データ、(2)小データ、(3)平均場、(4)狭ラテント、(5)自由である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:24:05 GMT)
Towards Efficient and Evidence-grounded Mobility Prediction with LLM-Driven Agent [15.8] 監視されたシーケンスモデルは高い精度を達成するが、タスク固有のトレーニングが必要であり、決定レベルの透明性が制限される。
LLMに基づく最近の手法は解釈可能性を改善するが、ほとんどの場合静的なプロンプトとシングルパス推論に依存している。
本稿では,次の位置予測をアダプティブエビデンス制御による意思決定として定式化する,学習不要なLCM駆動エージェントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:34:01 GMT)
Description-Code Inconsistency in Real-world MCP Servers: Measurement, Detection, and Security Implications [15.8] 本稿では,実世界のMPPサーバにおけるDCI(Description-Code Inconsistency)の総合的研究について述べる。
機能不整合と非宣言副作用にまたがる包括的分類法を提案する。
この分類法を,2,214の実世界MPPサーバから抽出した19,200の記述符号対からなる大規模データセットに適用した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:51:32 GMT)
SentinelBench: A Benchmark for Long-Running Monitoring Agents [15.7] SentinelBenchは、時間進化モニタリングタスクのためのオープンソースのベンチマークである。
メール、カレンダー、ファイナンス、プロフェッショナルネットワーキング、エンターテイメントなど10の合成ウェブ環境に100のタスクがある。
タスク完了、反応時間、リソース使用量を計測し、応答性とコストのトレードオフを明らかにする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:32:00 GMT)
SharedRequest: Privacy-Preserving Model-Agnostic Inference for Large Language Models [15.7] 本稿では,プライバシ保護を個別のプロンプトレベルではなくバッチレベルで再構成する,プライバシ保護推論のためのモデルに依存しないフレームワークを提案する。
SharedRequestは、従来の差分プライバシーベースラインに比べて20%以上高いユーティリティを実現していることを示す。
その共有プロンプト機構は、非バッチ推論と比較してクエリコストを最大5倍に削減する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:23:06 GMT)
Topics as Proxies for Sociodemographics: How Conversational Context Affects LLM Answers [15.5] 本研究では,大きな言語モデル(LLM)が,単一の会話履歴からユーザ社会デマトグラフィーを推測するのに苦労していることを示す。
会話の話題は、会話の文脈内でLLM生成のアドバイスを最も予測することを発見した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:40:01 GMT)
FlowPRO: Reward-Free Reinforced Fine-Tuning of Flow-Matching VLAs via Proximalized Preference Optimization [15.4] FlowPROは、フローマッチングポリシーのための報酬なし、オフラインで強化された微調整フレームワークである。
本稿では,VLAモデルのフローマッチング動作ヘッドに適した優先最適化対象であるRPROを提案する。
FlowPROは最高成功率に達し、4つの代表的なベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:47:43 GMT)
CleanCodec: Efficient and Robust Speech Tokenization via Perceptually Guided Encoding [15.2] CleanCodecは、知覚上重要な機能のみをエンコードし、認識不能な情報を破棄することを学ぶ。
毎秒わずか12.5トークンで、CleanCodecは最先端のトークン化効率を達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:56:14 GMT)
Listening to the Workforce: Measuring Construction Worker Safety Attitudes from Social Media Discourse Using LLMs [15.0] 安全姿勢は多次元的であり、話題によって異なり、労働者自身の会話の中で最も率直に表れている。
本研究は,建設安全姿勢枠組み(CSAF)の作成と検証を行った。
CSAFをRedditのr/Constructionコミュニティから250の投稿やコメントに適用すると、訓練されたコーダーは強い合意に達した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:54:40 GMT)
Subliminal Learning Is Steering Vector Distillation [14.8] サブリミナルラーニング(サブリミナルラーニング)とは、微調整時に教師の特質を習得する学生言語モデルである。
サブリミナル学習は1つのステアリングベクトル、すなわちモデルのアクティベーションに付加されるベクトルによって媒介されることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:46:22 GMT)
VT-3DAD: Cross-Category 3D Anomaly Detection via Visual-Text Normal Space Alignment [14.7] クロスカテゴリ3D異常検出は、未知の点雲が対象の正規カテゴリーに属するかどうかを判定することを目的としている。
VT-3DADは,視覚-テキスト正規空間アライメントによる3次元異方性検出のためのトレーニング不要フレームワークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:34:20 GMT)
CIPER: A Unified Framework for Cross-view Image-retrieval and Pose-estimation [14.6] クロスビュージオローカライゼーションは、地上画像の位置を航空画像データベースとマッチングすることによって推定する。
既存の手法では、大規模な検索と正確なポーズ推定のいずれかによってこれに取り組むが、両方ではない。
両タスクを共同で実行する単一アーキテクチャであるCIPER(Cross-view Image-Retrieval and Pose-estimation TransformER)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:31:06 GMT)
SparDA: Sparse Decoupled Attention for Efficient Long-Context LLM Inference [14.5] 疎結合なスパークアテンションアーキテクチャであるSparDAを提案する。
Forecastは次のレイヤに必要なKVブロックを予測し、ルックアヘッドの選択を可能にする。
SparDAはスパース事前の8Bモデルの精度をわずかに向上させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:42:05 GMT)
Creative Reading: Scaffolding Reading for Transformation [14.2] 読み上げ拡張システムは、読者が大規模にテキストを処理するのにますます役立っている。
これらのツールは、読み書きを情報伝達として暗黙的にフレーム化し、機械に解釈と努力を委譲する「捨てる読み方」である。
我々は、読者の読書と読者としての自己の両方を創造するのを支援する読書増強という、創造的な読書を代替の目標として提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:27:05 GMT)
ReasoningFlow: Discourse Structures for Understanding LLM Reasoning Traces [13.9] ReasoningFlowは、LRM推論の談話構造を微粒な非巡回グラフにトレースするフレームワークである。
ReasoningFlowグラフを解析することにより、異なるベースモデルからトレーニングされているにもかかわらず、LRMは構造的に類似したトレースを示すことがわかった。
ReasoningFlowは、トレース監視性を改善するために使用できる、さまざまなきめ細かい推論動作を明らかにする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:12:26 GMT)
Attention Consistent Longitudinal Medical Visual Question Answering Guided by Vision Foundation Models [13.9] 縦断的視覚的質問応答(VQA)は、現在の時点の画像と参照時点の画像との解剖学的差異について推論する必要がある。
本稿では,胸部X線を用いた注意誘導型エンコーダデコーダを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:12:19 GMT)
MusaCoder: Native GPU Kernel Generation with Full-Stack Training on Moore Threads GPU [13.8] MusaCoderは、ネイティブGPUカーネル生成とMUSAバックエンドのためのフルスタックのトレーニングフレームワークである。
プログレッシブカーネル指向のデータ、多様性指向の拒否微調整、実行フィードバック強化学習を組み合わせる。
MusaCoderは、正確性と実証的なスピードアップの両方において、強力なオープンソースとプロプライエタリなベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:15:30 GMT)
Probing PbTe-Pb nanowire devices with radio-frequency reflectometry [13.7] CdTe基板上に選択的領域成長PbTe-Pbナノワイヤデバイスに高周波(rf)反射計を実装した。
この結果により,PbTe量子デバイスの高速制御が可能となり,トポロジカル量子計算への応用が可能となった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:27:37 GMT)
DP-MacAdam: Differentially Private Mechanism with Adaptive Clipping and Adaptive Momentum [13.7] 個人差分勾配勾配(DP-SGD)は、プライバシ保護機械学習の標準フレームワークとなっている。
適応クリッピングと適応モーメント(DP-MacAdam)を併用した微分プライベート機構を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:58:34 GMT)
COP-Q: Safety-First Reinforcement Learning for Robot Control via Cholesky-Ordered Projection [13.7] 政治的でない安全な強化学習では、報酬と安全性のQ値が、別の批評家アンサンブルによって一般的に学習される。
この客観的な扱いはオブジェクト間の相関を無視し、過度に保守的な値の推定につながる可能性がある。
ベクトル値の推定にオブジェクト間の共分散を組み込んだ安全第一手法であるColesky-Ordered Projection Q-learning (COP-Q)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:30:10 GMT)
Entity Binding Failures in Speech LLM Reasoning: Diagnosis and Chain-of-Thought Intervention [13.6] 音声大言語モデル(SLLM)は、複雑な推論においてテキストモデルよりも性能が低い。
空間的, 構文的, 事実的タスクにおいて, テキスト間マッチング(S2T)はテキスト間マッチング(T2T)を超えているかを示す。
エンティティ追跡を必要とする論理的タスクでは、S2Tの精度は偶然に崩壊する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:44:09 GMT)
PureLight: Learning Complex Luminaires with Light Tracing [13.5] 発光器から出口面への経路構築には光トレーシングを用いる。
学習した外観を、出口面の放射率を直接推定する軽量な計算に蒸留する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:48:27 GMT)
Rethinking Incompleteness: Formalizing Protocol Divergence and Train-Once Learning for Robust IMVC [13.5] IMVC評価は、異なるデータ構成のための別々のモデルを再訓練する。
欠落率だけではデータの不完全性を特徴づけるには不十分である。
我々はこの現象を不完全分散として定式化し、欠測データプロトコル間の構造的格差を捉える手段を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:24:09 GMT)
Quantum Time Lower Bounds by Permutation Invariance [13.5] 我々は、量子状態の置換不変性をテストするために、量子時間複雑性の低い境界を確立するためのフレームワークを提供する。
応用として、入力量子状態へのサンプルアクセスが与えられたときに、一致した下界の一連の値を得る。
我々の知る限りでは、これは量子時間複雑性の厳密な下限を体系的に確立できる最初の方法である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:03:24 GMT)
Improving the Efficiency and Effectiveness of LLM Knowledge Distillation for Conversational Search [13.4] Conversational Search (CS)は、会話コンテキストに基づく関連文書の検索を検討する。
最近の研究は、KLD(Kullback-Leibler Divergence)を蒸留に応用し、教師信号とのアライメントを緩和している。
会話探索におけるKLDに基づく蒸留の諸側面について検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:22:22 GMT)
Towards Unified and Data-Efficient Prognostics and Health Management with Tabular Foundation Models [13.4] Data-driven Prognostics and Health Management (PHM) は、システム状態の診断と、エンジニアリングされた資産の残りの有用な寿命を見積もるために、時間変化のある状態監視データを使用する。
これらのタスクはメンテナンス計画の中心であるが、産業用PHMデータは断片化され、部分的に観察され、ラベルが不十分であることが多い。
In-context Learning を用いた産業時系列に Tabular Foundation Models を適用するためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:00:29 GMT)
Test-Time Compute Scaling for ASR with Depth-Conditioned Looped Transformers [13.3] 我々は、再帰エンコーダ深さを制御可能なテスト時間計算軸に変換する、深さ条件付きループ変換器 LARM を導入する。
LibriSpeechでは、推論ループの数が増加するにつれて、LARMはWERを改善している。
この結果から, 自動回帰言語モデル推論から連続非自己回帰音声認識まで, テストタイムの計算スケーリングが拡張できることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:01:45 GMT)
Ekka: Automated Diagnosis of Silent Errors in LLM Inference [13.2] サイレントエラーの診断は、高レベルな症状と低レベルな根本原因との間に意味的なギャップがあるため、非常に難しい。
中間実行状態を体系的に整列し比較することにより根本原因を同定する自動診断システムであるEkkaを提案する。
Ekkaは80%のパス@1診断精度と88%のパス@5診断精度を示し、最先端システムを上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:32:13 GMT)
Operator Fusion for LLM Inference on the Tensix Architecture [13.2] 本研究では,TenstorrentのTensixアーキテクチャ上でのTransformerモデルのデバイス上での推論について述べる。
RMSNormは、自己アテンションおよびFFNにおける行列乗法と融合し、メモリバウンドおよび計算バウンド演算子のバック・ツー・バック実行を可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:48:34 GMT)
Unlocking Exponential and Unbounded Robust Gains in Shannon Capacity of Classical Multiple Access Channels with Causal CSIT via Quantum Entanglement Assistance [12.8] 量子エンタングルメント支援は,ユーザ数の増加に伴い指数関数的に増加する乗法的キャパシティのアドバンテージを提供する。
少数のユーザと小さなアルファベットサイズであっても、相当な乗算能力の増大が見られる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:27:35 GMT)
From Symbolic to Geometric: Enabling Spatial Reasoning in Large Language Models [12.7] 近年の大規模言語モデル (LLM) は空間推論能力を示すことが多い。
この能力は、空間上の真のエンフェロメトリー推論ではなく、空間言語上のパターンマッチングから生じる、主にエンフェロボリックである。
EmphSpatial Language Model (SLM) は、位置情報を第一級のモダリティとして扱う最初のマルチモーダル LLM である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:54:59 GMT)
How Far Did They Go? The Persuasive Tactics of Covert LLM Agents in a Discontinued Field Experiment [12.7] 本研究では、Redditのr/ChangeMyViewにおけるフィールド実験の中止から、公開データセットを分析した。
この介入は、未知の外部研究者によって実施され、倫理的反発を受けて停止された。
公開公開後、Redditはモデレーターに対して、AI生成されたコメントのアーカイブをリリースすることを許可した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:58:32 GMT)
Synthesize and Reward -- Reinforcement Learning for Multi-Step Tool Use in Live Environments [12.6] 本稿では,3つのコントリビューションを持つPROVE(Programmatic Rewards On Verified Environments)を提案する。
20のステートフルMPPサーバからなるライブラリは343のツールを公開し、セッションスコープによるステートアイソレーションによるライブ実行RLトレーニングを可能にする。
状態マシンデータ合成パイプラインは、ライブサンプリングされたサーバ状態にグラウンドされたマルチターンツールコールトラジェクトリを生成し、実際に存在するクエリ参照エンティティを生成する。
BFCLのMulti-Turn、tau2-bench、T-Evalでは、PROVEは最大+10.2、+6.8、+6.5ポイントの改善をもたらす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:27:54 GMT)
REGAIN: REconciliation GAIN-driven Auxiliary Direction Learning [12.6] 本稿では,正規化された補助方向を学習する和解利得フレームワークを提案する。
有効な補助指示は未解決の標的不確実性について補完的な情報を提供する必要があることを示す。
北京PM2.5とオーストラリア観光データの実験では、ゲイン選択された測定値が通常の多変量と階層予測の両方を改善することが示されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:53:27 GMT)
TabSODA: Tabular Diffusion based Imputation with Skip Pattern Detection and Ordinal Awareness [12.3] textbfTabSODA (textbfTabular diffusion with textbfSkip pattern detection and textbfOrtextbfdinal textbfAwareness) を導入する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:09:40 GMT)
FADRW: A Feature-Aware Modulated and Dynamically Reweighted Loss for Few-Shot Linguistic Steganalysis [12.1] ソーシャルメディアプラットフォームは、悪意のある言語的ステガノグラフィーを促進し、重大なセキュリティリスクを生じさせる。
生成的ステガノグラフィーの可視性は、その特徴が良質なテキストとほとんど区別できないことを意味する。
本稿では, FADRW (Feature-Aware Modulated and Dynamically Reweighted Loss) を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:41:20 GMT)
Prediction Under Imperfect Compression: A Theory of Approximate MDL [11.9] 近似および正規化の形式の下で、MDLは信頼できる逐次予測を保証できるか?
重み付けされた MDL 目的のより一般的な形の加法的 slack $C$ の近似に対して、累積期待二乗予測誤差はすべての$ge1$に対して有限であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:03:56 GMT)
WHU-Infra3D: A Full-stack Multi-modal Dataset and Benchmark for 3D Roadside Infrastructure Inventory [11.8] WHU-Infra3Dは、ロードサイドインフラストラクチャインベントリ専用の大規模マルチモーダルベンチマークデータセットである。
WHU-Infra3Dは3都市で53.8kmをカバーし、パノラマ画像とLiDAR点雲を厳密な2D-3Dアソシエーションインスタンスとクロスフレームトラッキングと一体化している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:14:32 GMT)
LazyAttention: Efficient Retrieval-Augmented Generation with Deferred Positional Encoding [11.8] キーバリュー(KV)キャッシュは、生成されたトークンに対する過去の計算を再利用することで、大きな言語モデル(LLM)の推論を加速する。
既存のソリューションは、再利用をプレフィックスに制限するか、位置再符号化のために高価なメモリの実体化を必要とする。
本稿では、遅延位置符号化をカーネル化し、ゼロコピーで位置に依存しないKVの再利用を可能にする新しいアテンション機構であるLazyAttentionを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:12:22 GMT)
Multi-Granularity 3D Kidney Lesion Characterization from CT Volumes [11.7] 本研究は, 腎CTの特徴を病期ごとのセット・プレディション・タスクとして再検討する。
当科で788名の患者から2,619個のCTボリュームを採取した。
サイズ距離ハンガリーマッチングを用いたDETRスタイルアーキテクチャである textbfLesionDETR を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:28:57 GMT)
RadSEM: A Finding-by-Finding Metric for Clinical Consistency in Radiology Reports [11.7] RadSEMは参照を書き直し、順序付けられた原子探索文にレポートを生成する。
その後、矛盾制約付き多対多マッチングを実行する。
決定論的段階は、部分的および異常な詳細関係でペアを重み付けし、未一致の結果を数え、異常に焦点を絞ったF1スコアを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:59:42 GMT)
Policy Gradient for Continuous-Time Robust Markov Decision Processes [11.6] 本稿では,マルコフ決定プロセスフレームワークにおけるポリシーアルゴリズムについて検討する。
ポリシー勾配と逆勾配は、パスワイズ式と随伴式を用いて導出される。
平均場オプティマイザを$tildemathcalO(frac1K)$ Oracle-based convergence rateおよび$tildemathcalO(fracN2)$ sample complexity under $N$- Particle approximationとして提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:25:20 GMT)
Strabo: Declarative Specification and Implementation of Agentic Interaction Protocols [11.5] UCPは、AIエージェントのeコマースインタラクションを標準化するためのGoogle主導の取り組みだと考えている。
私たちはLangshawのプログラミングモデルであるPeachを使ってエージェントを実装します。
Peach エージェントが Google によって実装された UCP エージェントと相互運用可能であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:05:25 GMT)
PSEBench: A Controllable and Verifiable Benchmark for Evaluating LLMs in Patient Safety Event Triage [11.5] 患者安全イベントトリアージ(英: patient safety event triage)は、患者安全の専門家が通常手動で行うハイテイクタスクである。
ミネソタ州では29のReportable Adverse Health Eventsでこの方法をインスタンス化しています。
PSEBenchは、エージェント評価環境を備えた5,074ケースのベンチマークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:41:39 GMT)
SC3: The Multi-Solvent Solubility Challenge and Benchmark [11.5] このベンチマークはBigSolDB v2.1上に構築され、3つのコントリビューションがある。
私たちは、このギャップがテスト対象のディープな代替案によって隠されているのを観察します。
データスケーリング、量子化学溶解エネルギーからの移動、特徴レベルの帰属の3つの追従解析を行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:57:00 GMT)
I Know What You Meme, Even If it Emerged Today: Understanding Evolving Memes through Open-World Knowledge Acquisition [11.5] マルチモーダル・ミームは動的であり、しばしば解釈の背景知識を必要とする。
Query Retrieve Concludeはゼロショットフレームワークで、不足した知識を特定し、オープンなWebエビデンスを取得する。
また、2024年から2026年までの最近のミームのキュレートされたミーム理解ベンチマークを、外部の背景知識アノテーションとともに導入した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:06:14 GMT)
Multi-Camera AR Guidance System for Surgical Instrument Handling and Assembly: Investigating Workload and Efficiency [11.4] 本稿では,マルチカメラの6Dポーズ推定と,ヘッドマウントディスプレイ上での拡張現実のin-situビジュアライゼーションを併用した手術機器支援システムを提案する。
手術膝シミュレーションにおいて,29名のスクラブ看護師によるユーザスタディを行い,本システムと紙マニュアルとの比較を行った。
ARガイダンスは、手作業と比較して、認識された作業負荷を著しく削減した。
特に、スクラブ看護師は、システムを使用する際に利益を得た楽器セットをあまり経験していない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:13:05 GMT)
Real-World Deployment of a 5G-Connected Edge-Controlled Aerial Robot in Industrial Subterranean Mines [11.3] 本稿では,エッジオフロードコントローラによって制御される5G接続型空中ロボットの現実飛行について述べる。
ロボットは活発な工業地雷の中で動作し、ハイレベルなコントローラーは近くのエッジクラスタに配置される。
人間のオペレータが空飛ぶロボットのウェイポイントを選択し、MPCは自律実行のためのスムーズな無衝突経路を生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:40:56 GMT)
SAID: Accelerating Diffusion-Based Language Models via Scaffold-Aware Iterative Decoding [11.2] 拡散大言語モデル (DLLM) は、双方向コンテキストで劣化したトークンを反復的にデノベートすることで、非自己回帰的な計算生成を可能にする。
本稿では,トークン間の再配置によってDLLMを高速化するScaffold-Aware Iterative DecodingフレームワークであるSAIDを提案する。
数学、コーディング、知識ベンチマークにおけるLLaDA-8BとLLaDA 1.5の実験は、SAIDが競争性能を維持しながら最大9.1倍の速度で推論を著しく加速することを示している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:56:42 GMT)
SemBlock: Semantic Boundary Dynamic Blocks for Diffusion LLMs [11.2] SemBlockは、拡散言語モデルのための意味駆動型動的ブロックデコーディングフレームワークである。
本研究では,セマンティック・バウンダリ・データセットであるSemBoundを構築した。
GSM8K、IFEval、MATH、HumanEvalの実験では、SemBlockは固定ブロックデコーディングやAdaBlockよりも一貫して改善されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:48:27 GMT)
An interpretable and trustworthy AI framework for large-scale longitudinal structure-pain association studies using data from the Osteoarthritis Initiative (OAI) [11.1] 変形性膝関節症(MOAKS)の特徴を膝関節MRIから直接予測するためのディープラーニングフレームワークを開発した。
我々は、予測不確実性定量化を提供するために共形予測を組み込んだ。
長手型遅発型混合モデル(LCMM)を応用し,鍵構造異常と4つの相補的膝痛測定の関連について検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:59:38 GMT)
What Can Eye Gaze Teach Us About Real-World Cycling? Insights From the Oxford RobotCycle Project [10.9] 本稿では,英国オックスフォード市におけるサイクリングの安全性について考察する。
異なる環境やイベント下での知覚の違いに関する洞察を生み出すために、ウェアラブルアイトラッキングメガネの能力を探求する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:11:26 GMT)
LLM-Guided ANN Index Optimization for Human-Object Interaction Retrieval [10.9] ビジュアル検索、レコメンデーションエンジン、マルチモーダル質問応答など、現代のAIアプリケーションを支えるマルチステージ検索システム。
本稿では,この制限を相認識型大規模言語モデル (LLM) エージェントを用いて解決する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:28:34 GMT)
Scaling Datasets for Multi-Sensor, Multi-Agent, and Multi-Domain Learning in Autonomous Systems [10.9] 地上, 航空, インフラベースシステムのためのテラバイト規模の地上構造ラベル付きデータを生成するモジュール型データセット生成パイプラインを提案する。
生成されたデータがどのようにアプリケーション固有のトレーニングと協調的な自律性をサポートするかを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:46:44 GMT)
TD-Grokking: Learning from Zero-Reward Problems by Training-Time Decomposition [10.9] ゼロ逆問題に対する学習時間分解フレームワークTD-Grokkingを提案する。
TD-Grokking はバニラGRPO と全てのベースラインアプローチに優れることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:40:04 GMT)
DeliChess: A Multi-party Dialogue Dataset for Deliberation in Chess Puzzle Solving [10.7] DeliChessは、グループ熟考対話の新しいデータセットである。
各グループはまずパズルを個別に完了し、その後、修正された集合回答を提出する前に複数のパーティで議論を行う。
チェスエンジンの評価に基づいて,3つの指標を用いて評価を行った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:08:46 GMT)
Continual Visual and Verbal Learning Through a Child's Egocentric Input [10.6] 本研究では,SAYCamデータセットを単一の時系列パスで処理する連続的マルチモーダル学習フレームワークであるBabyCLを紹介する。
BabyCLは、SAYCam Labeled-S 4AFCベンチマークでストリーミング学習のベースラインを上回り、オフライントレーニングの上限をかなり狭めている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:20:18 GMT)
Deterministic Envelopes for Tamed SGLD: Decoupling Stochastic-Gradient Noise and Localizing Taming [10.6] ランゲヴィンアルゴリズムは、しばしば非グロブリーリプシッツドリフトを安定化するためにテーマディノミネーターを使用する。
本稿では, 安定化分母が数値化子と同じ段階的実現に依存する場合, テーキングステップがオラクル自体を変化させ, 定常バイアスを生じさせることを示す。
そこで我々は, 組込み型分母を設計するための構造保存フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:23:16 GMT)
ReConFuse: Reconstruction-Error Guided Semantic Fusion for AI-Generated Video Detection [10.5] ビデオレベルのAI生成ビデオ検出のための再構成誘導型セマンティックフュージョンフレームワークReConFuseを提案する。
ReConFuseは、WF-VAE再構成ビデオから再構成エラーキューを抽出し、それらを多フレームセマンティック特徴と整列させ、Mambaベースのモジュールを使用してビデオレベルの分類のための時間的進化をモデル化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:35:47 GMT)
SFMambaNet: Spectral-Frequency Enhanced Selective State Space Model for Correspondence Pruning [10.4] 対応プルーニングは、初期対応セットから不整合を識別することを目的としている。
既存のグラフニューラルネットワーク(GNN)ベースの手法のほとんどは、粗いユークリッド座標からマッピングされた幾何学的特徴に依存している。
SFMambaNetは,新しいスペクトル周波数拡張型マンバ型2視点対応プルーニングネットワークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:18:05 GMT)
Generalization of World Models under Environmental Variability for Vision-based Quadrotor Navigation [10.4] 世界モデルは、環境がどのように進化するかを予測する学習された生成モデルであり、サンプル効率のよいロボット学習のための有望なツールとなっている。
本研究では,視覚に基づく四角形ナビゲーションをテストベッド問題とし,環境ランダム性の異なるDreamerV3ベースの世界モデルを訓練する。
そして、すべての世界モデルと関連するナビゲーションポリシーを、すべてのセンサーが切断される前に実際の感覚入力を2.5秒だけ受信するオープンループランなど、目に見えない環境で実際の四角形に展開します。
以上の結果から,SSL事前トレーニング中の世界モデルロバスト性はsim-to-realの強い予測因子であることが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:38:36 GMT)
Synthetic Contrastive Reasoning for Multi-Table Q&A [10.3] マルチテーブルの質問応答には、関連するエビデンスを取得し、スキーマをリンクし、リレーショナルテーブルをまたいだ合成推論を実行するモデルが必要である。
既存のマルチテーブルのQ&Aリソースは、質問や最終回答を提供するが、どのように回答が導出されるかを説明する推論の監督が欠如している。
検証された正のトレースと有意な負のトレースを生成することで,MMQAのための合成コントラスト推論トレースデータセットを構築した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:35:54 GMT)
Hyper-ICL: Attention Calibration with Hyperbolic Anchor Distillation for Multimodal In-Context Learning [10.3] Hyper-ICLは、デモフリーマルチモーダルICLのためのトレーニングベースのフレームワークである。
推論時にICDを必要とせずに直接デモ効果を再構築する。
バニラICLと既存の最先端の手法の精度と安定性を一貫して改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:32:09 GMT)
MedSyn2: Flexible Control of 3D CT Generation via Text and Semantically-Defined Segmentation Prompts [10.3] 本稿では,放射線学レポートやセグメンテーションプロンプトからの入力をサポートする可制御性ボリューム画像生成のためのフレキシブルなフレームワークを提案する。
我々のアプローチでは、ユーザーは完全なアノテーションを必要とせずに、特定の解剖学または異常のセグメンテーションを提供できる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:10:03 GMT)
A Geometric Characterization of the Stationary Plateau for Two-Layer Neural Networks [10.3] 2層ニューラルネットワークのロスランドスケープに生じる定常台地の幾何学的構造について検討する。
隠れたニューロンを複製すると、より広いネットワークでアフィン集合の静止点が生成される「ニューロン分割」現象に焦点を当てる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:03:34 GMT)
Rethinking Sales Lead Scoring with LLM-based Hierarchical Preference Ranking [10.2] セールスリードのコンバージョンは、長い意思決定サイクルと多段階のファンネルのために、eコマースのレコメンデーションとは根本的に異なる。
従来のリードスコアリング手法では、スパース監視、非構造化CRMログのセマンティックギャップ、相対的なリード優先度の取得が不可能といった深刻な課題に直面しています。
我々は、構造化CRM機能と非構造化顧客インタラクションの連成モデリングを支援するLLMベースのセールスリードスコアリングのための差別的フレームワークについて紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:05:57 GMT)
HyFAD: Hybrid Time-Frequency Diffusion with Frequency-Aware Embedding for Time Series Imputation [10.2] 時系列計算のための時間周波数拡散モデルである textbfHyFAD を提案する。
周波数領域拡散プロセスは高周波スペクトル成分を洗練させる一方、低周波グローバルトレンドを捉える。
複数のベンチマークデータセットの実験は、HyFADが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:03:37 GMT)
Stepwise Reasoning Enhancement for LLMs via External Subgraph Generation [10.2] 大規模言語モデルは、複雑な多段階推論における論理的一貫性、事実的基盤、解釈可能性に苦慮している。
本稿では,大規模言語モデルと外部知識グラフを統合するフレームワークであるSGRを提案する。
実験によると、SGRは推論精度とHits@1のパフォーマンスを標準プロンプトよりも改善している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:58:02 GMT)
GlossAssist -- A Tool to Simplify Corpus Creation and Study the Effect of NLP Models in Low-Resource Documentation Settings [10.1] 本稿では,CWoMPの検索に基づくアーキテクチャを中心に構築されたグロスツールであるGrossAssistを紹介する。
本システムでは,アノテータによる各補正をアクティブな学習環境の一部として扱い,レキシコンを拡張し,モデルの再トレーニングを必要とせずに将来の予測を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:29:30 GMT)
Localizing Prompt Ambiguity in Large Language Models with Probe-Targeted Attribution [9.9] 本稿では、プローブロジットを用いて遅延曖昧さをトークン位置に属性付ける勾配属性法であるPRIGを紹介する。
具体的には、PRIGは、不明瞭なプロンプトから明確なプロンプトを区別するために線形プローブを訓練し、プローブスコアを残留ストリームの以前のトークン表現に属性付けする。
この設定では、PRIGは、勾配の属性ベースラインよりもかなりよく不明瞭なスパンを局在させ、合成ベンチマークで0.840 AUROC、金セットで0.891 AUROCを達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:15:43 GMT)
Federated Learning for Multi-Center Sepsis Early Prediction with Privacy-Preserving [9.7] フェデレートラーニング(Federated Learning)により、複数の機関が、生データを直接共有したり、集中したりすることなく、予測モデルを共同で訓練することができる。
本研究は,多中心敗血症予測へのフェデレーション学習の適用を体系的に検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:35:17 GMT)
Implement Kubernetes Pod-Level Remote Attestation for Confidential Workloads on dstack [9.7] CoCo(Confidential Containers)は厳格な"VM毎のPod"モデルを強制し、ゲストOSスタックのみを証明し、コンテナレベルのアイデンティティを検証せず、VM単位のリソースオーバーヘッドを禁止している。
我々は,複数のPodが1つのConfidential VMを共有しながら,それぞれが独立してハードウェアが支援するアイデンティティの証明を保持することによって,Intel TDX上でPodレベルのリモート認証を可能にするプラットフォームであるdstack-capsuleを提案する。
我々は,dstack-capsuleのセキュリティ特性,正確性,性能特性を評価し,VM間分離のリソースオーバーヘッドを伴わずにPod-granularity検証を実現することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:01:48 GMT)
SePO: Self-Evolving Prompt Agent for System Prompt Optimization [9.7] システムプロンプト最適化は、基礎となるモデルを変更することなくエージェントの動作を改善する。
本稿では,タスクエージェントのシステムプロンプトと並行して,プロンプトエージェント自身のシステムプロンプトを最適化ターゲットとして扱う自己進化型プロンプト最適化(SePO)を提案する。
SePO は Manual-CoT, TextGrad, MetaSPO を一貫して上回り、 Manual-CoT と比較して平均精度は 4.49 ポイント向上している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:20:30 GMT)
OA-CutMix: Correcting the Label Bias of CutMix [9.7] CutMixは事実上の標準ミキシング拡張だが、そのラベルの割り当ては欠陥のある仮定に依存している。
そこで我々は,領域ベースCutMix重みをあらかじめ計算したセグメンテーションマスクから導出したものに置き換えることで,このバイアスを補正するオブジェクト認識CutMix(OA-CutMix)を提案する。
OA-CutMixは、全てのタスクに対して常に最高の精度を達成し、動的ミキシング方法よりも優れていますが、トレーニング時間コストのごく一部です。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:42:59 GMT)
EpiEvolve: Self-Evolving Agents for Streaming Pandemic Forecasting under Regime Shifts [9.7] ウォームスタート期間にトレーニングされたエピデミックLSM予測器をラップし、ストリーミング中に重みを固定する自己進化型エージェントであるEpiEvolveを紹介する。
EpiEvolveは、階層的なエピソードメモリに予測結果を格納し、遅延ラベルを反映し、現在の状態に関連するケースを検索し、繰り返し発生するエラーを戦略的ルールに蒸留することで適応する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:40:30 GMT)
Should Demand Models Incorporate Competitor Prices? Oblivious Learning and Algorithmic Collusion [9.5] 競争相手の価格を故意に無視する戦略上の曖昧さは、結束的な成果を促進し、利益を向上させる可能性があることを示す。
すべての売り手が不利な時に市場ダイナミクスを特徴付け、十分な探索の下で価格が競争結果に収束することを示す。
この結果から, 衝突パターンは頑健ではなく, 難解なモデリングでは持続できないことが示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:10:55 GMT)
Beyond Retrieval: Learning Compact User Representations for Scalable LLM Personalization [9.5] ユーザの好みを学習可能な表現としてエンコードするフレームワークであるTAP-PERを提案する。
6つのLaMPタスクの実験では、TAP-PERはプロンプトベースとモデルベースベースラインを一貫して上回っている。
TAP-PERはユーザ毎のパラメータをOPPUの130倍少なくし、PER-PCSの総パラメータフットプリントの約半分をユーザスケールで使用している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:32:18 GMT)
Ablation Study of Block Size, Weight Precision, and Scale Precision in NVFP4 Inference for Low-Power Edge-Efficient Neural Networks [9.5] エネルギー効率のよいエッジ推論では、演算コスト、メモリトラフィック、ハードウェアオーバーヘッドを削減する必要がある。
本稿では, エッジ効率のニューラルネットワークに対するNVFP4 LUTに基づく推論について, アブレーションに着目した検討を行った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:09:59 GMT)
Learning Admissible Heuristics via Cost Partitioning [9.4] 本稿では,コストパーティショニングと乗算器予測のラグランジアン二重同値性を利用して,許容可能なコストパーティショニングを推定するフレームワークを提案する。
軸方向の自己アテンションとソフトマックス出力層を備えた深いアーキテクチャは、これらの特徴を、構成による分割制約を満たすコスト重みにマッピングする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:35:04 GMT)
Reinforcement Learning from Rich Feedback with Distributional DAgger [9.2] 推論モデルは急速に進歩しているが、検証可能な報酬(RLVR)のレシピからの有力な強化学習は驚くほど狭いままである。
本研究では,古典的模倣学習アルゴリズムDAggerの分布変種を用いて,そのようなフィードバックの使い方について検討する。
これは、ブラックボックスの専門家を認め、シーケンスレベルの勾配が将来の専門家と学生の意見の相違を伝播することによって、豊かな信用割り当てを行う、単純なフォワード・クロスエントロピーの目的をもたらす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:54:04 GMT)
Cartridges at Scale: Training Modular KV Caches over Large Document Collections [9.1] 大規模言語モデルは長いコンテキストで推論できるが、数百万のトークンをプリフィルすることは無駄である。
カートリッジは文書コレクションを再利用可能なキー値(KV)キャッシュに蒸留することでこの問題に対処する。
動的イントラクタ混合によるスケーラブルなマルチカートリッジ学習のためのトレーニングフレームワークであるCartridges at Scale (CAS)を紹介した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:42:55 GMT)
Measuring What Matters: Synthetic Benchmarks for Concept Bottleneck Models [9.1] 概念ボトルネックモデルは、入力で検出された高レベルの概念から結果を予測する。
私たちのベンチマークでは、パフォーマンスに影響を与えるプロパティを制御しながらラベル付きデータセットを生成することができます。
私たちのデモでは、ベンチマークが障害モードを診断し、フォローアップテストをガイドする方法を示しています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:01:05 GMT)
PerchRL: Vision-Based Agile Perching on Inclined Platforms under Rapid and Irregular Motion [9.0] PerchRLは、傾斜したプラットフォーム上でのビジョンベースのアジャイルアプローチのための強化学習フレームワークである。
我々は、状態に基づく事前学習と視覚に基づく微調整からなる2段階の学習戦略を採用する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:22:53 GMT)
Traceable by Design: An LLM Pipeline and Dashboard for EU Regulatory Consultation Analysis [9.0] 本稿では,規制コンサルテーションからのトピック抽出のためのエンドツーエンドのLLMパイプラインとインタラクティブダッシュボードを提案する。
システムは、生のPDFアタッチメントとWeb形式の応答を処理し、トピックアノテーションを抽出し、ソーステキストから冗長な引用で全ての抽出を土台とする。
パイプラインはドメインジェネリックで、新しいコンサルテーションに適応するには、即時更新と新しいデータセットが必要である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:48:21 GMT)
A Normative Intermediate Representation for ASP-Based Compliance Reasoning [8.7] ASPベースのコンプライアンス推論のためのモーダライズ・アウトプット・ノルミティブ・インターミディエート表現を提案する。
LLM支援パイプラインを用いて、中国ADAS規制と標準に関する枠組みをインスタンス化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:55:48 GMT)
Pepper: High-bandwidth and Scalable Anonymous Broadcast with Cryptographic Privacy [8.7] Pepperは、グローバルな敵に対して暗号化送信者の匿名性を提供する。
Pepperは2サーバのDC-netアーキテクチャ上に構築されているが、3つの重要なイノベーションが導入されている。
従来のシステムとは異なり、Pepperは外部ダイヤルサービスを必要としない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:38:34 GMT)
Can Crowdsourcing Survive the LLM Era? A Community Survey on Human Data Collection [8.6] 大規模言語モデル(LLM)を書き込みツールとして広く利用することは、クラウドソースデータの有効性に挑戦する。
本稿では,実践者の課題,緩和戦略,データ品質への影響について概説する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:18:27 GMT)
Toward a Generalized Defense Across Sparse, Continuous, and Structured Parameter Attacks [8.5] ディープニューラルネットワークは、不均一で部分的に信頼できない環境にますます展開されている。
ディープニューラルネットワークは、クラウドストレージ、CI/CDパイプライン、コンテナ化されたサービス、エッジ実行プラットフォームにデプロイされることが増えている。
この広いデプロイメント環境は、モデルのパラメータをさまざまな整合性リスクに公開します。
本稿では,多種多様なパラメータ攻撃に対するディープニューラルネットワークの汎用防御であるParDefを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:47:11 GMT)
TeleSWEBench: A Commit-Driven Benchmark for Evaluating LLM-Powered Software Engineering in Telecommunications [8.4] 汎用コーディングベンチマークは、ステートフルなロジックと通信の厳格な要件を捉えていない。
本稿では,テレコム領域におけるエージェントの性能測定に特化して設計された,最初のコミット駆動型ベンチマークであるTeleSWEBenchを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:19:40 GMT)
The price of multi-group transductive learning [8.4] 単群設定における誤り率に対する誤差率の乗算的ペナルティを生じる可能性があることを, トランスダクティブ・セッティングにおける多群学習者が示している。
これは、類似(グループ実現可能な)統計的設定における最適多群学習者とは対照的である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:07:24 GMT)
Cooperative Circumnavigation for Multiple Unmanned Surface Vehicles Without External Localization [8.4] 本稿では,複数の無人表面車両(USV)を外部位置決めなしで動作させるための協調的目標周航フレームワークを提案する。
目的は、限定されたオンボードセンシングのみを用いて、ターゲットの周囲の特定の半径の均一な円形形成を維持することである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:54:01 GMT)
HD-DinoMoE: A Class-Aware Hierarchical Dual Mixture-of-Experts Network for Scleral Anomaly Segmentation in Complex Acquisition Scenarios [8.3] 本研究は,TCMにインスパイアされた人工知能眼科診断システム(TAO)について述べる。
本稿では,HD-DinoMoEを提案する。
HD-DinoMoEは、クラス対応のデュアルストリームDINOv3と、クラス固有のデコードを組み合わせて、Vessels、Yellow and Black Spots、Blood Spotsを分割する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:48:29 GMT)
Distributional Approximate Nearest Neighbour Search for Uncertainty-Aware Retrieval [8.3] 組込み不確実性を候補生成に組み込む枠組みを提案する。
DINOSAURは、ポイント推定をインデックスする代わりに、アイテムごとに$S_i$の埋め込みをサンプリングし、この拡張セットにインデックスを構築する。
DINOSAURは、不確実性が消えるにつれて、標準点推定検索を回復することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:41:27 GMT)
PersonaTree: Structured Lifecycle Memory for Person Understanding in LLM Agents [8.3] 既存のエージェントメモリ手法では情報保持と検索が重視されるが、蓄積された相互作用の証拠がどのように人的理解に抽象化されるかは限定的に説明できる。
本稿では,この視点をエビデンスからクレームへの明確なサポートパスを備えた3段階のペルソナツリーとして実現した,構造化ライフサイクルメモリフレームワークであるPersonaTreeを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:02:19 GMT)
Treat Traffic Like Trees: A Semantic-Preserving Hierarchical Graph-Based Expert Framework for Encrypted Traffic Analysis [8.1] Protocol Tree Graph Attention with Mixture of Experts (PTGAMoE)は、暗号化トラフィック分析のためのセマンティックな階層的なグラフベースのエキスパートフレームワークである。
PTGAMoEは最先端(SOTA)モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:52:29 GMT)
Drifting Preference Optimization for One-Step Generative Models [8.0] ワンステップのテキスト・ツー・イメージジェネレータは、単一のフォワードパスを持つイメージを生成するため、デプロイには魅力的である。
決定論的ワンステップジェネレータのオンライン選好精選手法であるドリフト選好最適化(DrPO)を提案する。
DrPOは、現在のジェネレータから候補をランク付けし、ターゲットの報酬でランク付けし、高および低スコアのサンプルを使用して特徴空間更新方向を合成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:46:57 GMT)
SearchLog: A Web Browser Extension for Capturing Search Logs in Laboratory Studies [7.9] SearchLogは、研究室ベースの研究中に自然の検索ログを収集するための、簡単にインストールできるWebブラウザエクステンションである。
この拡張機能は、クリック、スクロール、ホバーテキスト、型付き単語、検索クエリ、結果ランキング、利用可能なAI生成サマリ、タブアクティビティ、ウィンドウ変更をキャプチャする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:03:29 GMT)
REGEN: Reference-Guided Synthetic Multivariate Time Series Generation for Forecasting [7.8] 本稿では,観測された配列を合成のための構造的足場として扱う参照誘導型生成パイプラインを提案する。
ReGeNの生成したデータは、最小限の予測劣化を伴う実兄弟データに一貫した代用であることを示す。
これは、低データのレシエーションにおいて、参照データが構造的に悪用される方法が、利用可能なデータ量と同じくらい重要であることを示唆している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:19:55 GMT)
Residual Modeling for High-Fidelity Learned Compression of Scientific Data [7.8] 学習圧縮機残差に適合した残差表現は、大域的残差補正が速度優位になると学習圧縮の利点を保てることを示す。
E3SM, JHTDB, ERA5 のブロックレベルの整数 NRMSE ターゲットの 10-6 から 10-4 にまたがって、LBRC は GAE の圧縮比を 30-60% 改善し、SZ と広く競合する。
NGLRはLBRCを10-40%上回り、評価された高忠実性体制においてSZを上回っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:49:23 GMT)
When Clients Stop Following: A Cognitive Conceptualization Diagram-driven Framework for Strategic Counseling [7.7] 既存のベンチマークは、高度に協調的なシミュレートされたクライアントに大きく依存している。
これらのクライアントはしばしば、わずか数回で抵抗からコンプライアンスへと急速に移行します。
本稿では,認知行動療法(CBT)を基盤とした抵抗認識フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:09:10 GMT)
Mamba-Enhanced Implicit Motion Learning for Audio-Driven Portrait Animation [7.7] 本研究では,1つの静止画像とオーディオから,現実的で時間的に整合した人間の動画を生成するための,新しい暗黙の移動フレームワークを提案する。
私たちのアプローチでは、レンダリングからモーション予測を分離する2段階のパイプラインを使用します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:22:46 GMT)
CLIF: Cross-layer LEO-ISL Fingerprinting for Physical and Network Attack Detection in Dense LEO Constellations [7.6] SpaceXのStarlinkやAmazonのKuiperのようなメガコンステレーションは、自動メッシュルーティングのための光サテライトリンク(ISL)に依存している。
本稿では,ネットワーク層データと物理層計測を融合させて異常を検出する,クロス層軽量な行動フィンガープリントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:01:27 GMT)
Bayesian learning for the stochastic shortest path problem [7.6] 我々は最適な意思決定戦略を学ぶためのベイズ的枠組みを開発する。
非現実的なモデリング仮定やアドホック近似には依存していません。
私たちは、我々のフレームワークが不確実性を忠実に定量化していることを示します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:13:41 GMT)
LoRi: Low-Rank Distillation for Implicit Reasoning [7.5] Implicit chain-of- Thought(iCoT)メソッドは、大きな言語モデルでの推論を内部化することを目的としているが、しばしば明示的なCoTプロンプトを過小評価している。
教師と学生の軌跡を共有低ランクテンソル部分空間で整列させることにより推論を伝達する低ランク蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:05:50 GMT)
Automatic Generation of Titles for Research Papers Using Language Models [7.5] オープンウェイトな事前学習型および大規模言語モデルを用いて,抽象概念から論文タイトルを生成する手法を提案する。
我々はCSPubSumとLREC-COING-2024データセットを使用し、社会科学の4つの雑誌から収集された新しいデータセットSpringerSSATを紹介した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:49:57 GMT)
Instance-Level Post Hoc Uncertainty Quantification in Object Detection [7.5] 安全保証のためのバウンディングボックス予測の不確実性の定量化が不可欠である。
モンテカルロ一般化線形化モデル(MC-GLM)を提案する。
モンテカルロステップに必要なサンプルの数は一定であり、出力インスタンスの数に依存しないので、並列化することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:26:13 GMT)
The State of Peer Review in Empirical Software Engineering: A Community Survey on Review Load, Quality, and GenAI Use [7.4] 科学的なピアレビューシステムは、ここ数年徐々に悪化している。
生成的AI利用の台頭と関連するすべての問題により、システム内の多くの亀裂がより目に見えるようになった。
i)コミュニティメンバのレビュー負荷,(ii)レビュー品質の認識,レビューに関する課題や課題の頻繁な報告,(iii)レビュープロセスにおけるLCMベースのツールの使用,(iv)ピアレビューシステムを改善するためのコミュニティの提案について報告する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:49:16 GMT)
GITCO: Gated Inference-Time Context Optimization in TSFMs [7.4] モデル重みを変更するのではなく、入力コンテキストを最適化することで、推論時のTSFM精度を改善することを提案する。
GITCO(Gated Inference-Time Context Optimization)は,パラメータを更新せずに有害なパッチを選択的に識別・抑制する軽量な3成分フレームワークである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:17:40 GMT)
MeshTok: Efficient Multi-Scale Tokenization for Scalable PDE Transformers [7.1] MeshTokは、アダプティブメッシュリファインメント(AMR)にインスパイアされたトークン化とシーケンスモデリングフレームワークである。
MeshTokは、均一グリッドベースラインと比較して、効率と精度のトレードオフを一貫して改善することを示す。
これは、ニューラルネットワークPDEモデリングのためのスケーラブルで一般化可能な設計原理として、適応的なマルチスケールトークン化を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:29:04 GMT)
X-Band UAV-enabled Integrated Sensing and Communications for Vehicular Networks [7.0] 無人航空機(UAV)は、センシングと通信の両方を提供する航空プラットフォームとして、ますます考えられている。
本稿では、車載ネットワーク用Xバンドで動作するUAV対応統合センシング通信システム(ISaC)の最適時間割当について検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:18:18 GMT)
Off-Distribution Voices: Fanfiction Subgenres as Universal Vernacular Jailbreaks for Aligned LLMs [7.0] 現実のファンフィクションのサブジャンルをユニバーサルアタックキャリアとして利用する最初のジェイルブレイクファミリーを紹介します。
創造的なメタは、12のArchive of Our Own (AO3)サブジャンルの1つのパスで条件付けされる。
ハームベンチとジェイルブレイクベンチの合併による8機のLLMでは、この攻撃によりASRは0.278から0.731に上昇した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:01:47 GMT)
LMT: A Bayesian Framework for Causal Discovery from Textual Alarm Records in Manufacturing Systems [6.8] 我々は,エンジニアリングイベントデータのためのベイズ的因果発見フレームワークである textbfLMT を提案する。
提案するフレームワークは,さまざまな設定で有効であり,特に小型のアラームイベントシナリオでは有利である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:42:17 GMT)
Learning from Demonstrations over Riemannian Manifolds using Neural ODEs: An Extended Abstract [6.4] 本研究では,測地線を用いたロボットの学習フレームワークを開発する。
我々は、ニューラル常微分方程式を用いて測地学を数値的に推定する。
これらの測地学は、ロボットにデプロイする前に元のタスク空間に復号することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:38:47 GMT)
TaDA: Calibrated Probe Gating for Task-Domain LoRA Merging [6.4] タスクとドメインアダプタは変換器アーキテクチャ全体にわたって一貫した深さ依存性の非対称性を示す。
本稿では,この構造を利用したトレーニングフリーなアルゴリズムを提案する。
$textbfTaDA$は、推論オーバーヘッドがゼロの標準ランク-r$LoRAアダプタを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:39:37 GMT)
Recent Advances and Trends in Learning-based 3D Representations [6.3] 適切な3D表現の選択は、3D再構成、新しいビュー合成とレンダリング、形状と動きの分析、認識、生成といったタスクにおける現代のコンピュータビジョンとグラフィックパイプラインの効率、品質、能力を決定する。
最近のニューラルおよびプリミティブベースの表現は、ゲーム、AR/VR、自律運転、ロボットナビゲーション、医療画像など、幅広いアプリケーションにおいて、コンパクトで差別化可能な代替手段を提供する。
各種類の表現に対して、一般的な定式化とその変種を提示し、その利点と限界について議論し、主要なアプリケーションを強調します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:35:50 GMT)
TransTac: Visuo-Tactile Modality Transition via Ultraviolet-Encoded Transparent Elastomers [6.2] 透明紫外(UV)を符号化した両眼VBTSであるTransTacについて検討した。
このシステムは、紫外反射マーカーを埋め込んだ透明エラストマーと、頑丈なスパース三角測量のための事前誘導型デラウネーステレオマッチングアルゴリズムを用いる。
意味評価において、TransTacは触覚画像に対して最大83.3%のゼロショット認識精度を達成し、不透明な触覚ベースラインを約50ポイント超えた。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:46:00 GMT)
MemoryDocDataSet: A Benchmark for Joint Conversational Memory and Long Document Reasoning [6.2] MemoryDocDataSetは、50マイクロワールドと1000QAペアの総合ベンチマークである。
それぞれのインスタンスは、3~5のペルソナ、数ヶ月のアクティビティにまたがる一時的なイベントグラフ、3~5の実際の長いドキュメント、それらのドキュメントに基づくマルチセッションの会話で構成されている。
定義されている特徴は、ハイブリッドソースタグである: システムが最初に会話履歴をナビゲートし、どのドキュメントが関連しているかを特定し、そのドキュメントから回答を抽出する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:44:50 GMT)
The Fair Lending Model: How the Longest-Running Algorithmic Fairness Programs Work in Practice [6.1] 米国の金融機関は何十年にもわたって、公正貸付法に基づくアルゴリズムフェアネスプログラムを実行してきた。
我々は、金融機関がアルゴリズムによる差別を地上でどのようにテストし緩和するかについて、最初の実証的な説明を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:28:02 GMT)
OSCAR: Omni-Embodiment Skeleton-Conditioned World Action Model for Robotics [6.1] 本稿では,ロボットの動作を多岐にわたって一般化し,ロボットのポリシー評価を可能にする,精密なアクション条件付きビデオワールドモデルを提案する。
本モデルは,既存のベースラインと比較して,動作の追従,外観品質,動作の整合性を大幅に向上させる。
さらにOSCARをデプロイして,RoboArenaからロボットポリシーを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:16:41 GMT)
An Ensembled Latent Factor Model via Differential Evolution and Gradient Descent Optimization [6.0] 本研究は,差分進化と勾配降下最適化(ELFM-DEGDO)による組立潜在因子モデルを提案する。
ELFM-DEGDOはHDIデータに対してより包括的でバイアスの少ない表現を生成することができる。
3つのHDIデータセットを用いて、ELFM-DEGDOが関連する複数の潜在因子モデルよりも一貫してパフォーマンスが良いことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:36:27 GMT)
CARVE-Q: Quantum-Proposed, Classically Certified Interactive Driving Repair [6.0] CARVE(Certified Affordable repair of Vetoed maneuvers via Envelopes)は、予測不要な対話型修復のための認証アーキテクチャである。
我々は、このブラックボックス格子のみに量子最小探索を適用する検証器シールド付き量子AI探索層であるCARVE-Qを紹介する。
検証器の遮音性能,優先的非楕円化,ブラックボックスクエリ分離,有限精度オークレ構成性を検証した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:38:23 GMT)
DPDL: Towards Differential Privacy Preservation in Decentralized Stochastic Learning on Non-IID Data [5.9] 分散学習のパラダイムでは、エージェントのグループが協力して、中央サーバーなしで分散データセットを使用してグローバルモデルをトレーニングします。
非IIDデータを用いたプライバシー保護型分散学習アルゴリズムDPDLを提案する。
我々の厳密な理論的分析は、特定のプライバシー保護レベルを達成するのに必要な最小ノイズレベルを明らかにするだけでなく、我々のアルゴリズムが非IIDデータによるトレーニングにおいて線形スピードアップを達成していることを示している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:27:40 GMT)
MaCo-GAN: Manifold-Contrastive Adversarial Learning for Single Image Super-Resolution [5.7] 本稿では,従来の対数損失を教師付きコントラスト目的に置き換える,新しい多様体コントラストGANフレームワークを提案する。
提案手法のコアコンポーネントは,地上の真理(GT)データを,難易度の高い疑似画像のスペクトルに変換するダイナミックフェイクサンプルシンセサイザーである。
様々なベンチマークで知覚歪曲トレードオフが一貫した改善を示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:29:44 GMT)
Coarse-to-fine Hierarchical Architecture with Sequential Mamba for Brain Reconstruction [5.7] 画像-fMRI符号化のための新しい階層型2段階フレームワークであるCHASMBrainを提案する。
我々のアーキテクチャは、グローバルなセマンティックトークンと局所的な空間パッチを明確に分離し処理するために、デュアルストリームのMamba設計を活用している。
提案手法はPearsonの0.429とMSE0.261の相関を達成し,評価基準線を上回る結果を得た。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:53:23 GMT)
DiffSlack: Learning under Nonlinear Inequality Constraints via Learnable Slack Variables [5.7] 非線形不等式制約ニューラル予測のための微分可能なプロジェクション層であるDiffSlackを提案する。
DiffSlackは、拡張ネットワーク出力の一部として予測される学習可能なスラック変数との不等式を等式として再構成する。
衝突回避,曲率制限,ウェイポイント間隔から200の非線形不等式制約を課した車両経路計画におけるDiffSlackの評価を行った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:58:06 GMT)
Alpha-RTL: Test-Time Training for RTL Hardware Optimization [5.6] 大規模言語モデル(LLM)は、機能的に正しいレジスタ・トランスファー・レベル(RTL)のハードウェア設計を生成することへの期待が高まっている。
近年のシステムは、構文、シミュレーション、PPA報酬によるEDA統合強化学習によってさらに改善されている。
我々は,TL最適化のためのLLMポリシーとEDAパイプラインのループを閉じる,設計毎のテスト時間トレーニングフレームワークTTT-RTLを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:51:33 GMT)
BPDA-GMM: Bayesian Probabilistic Data Association via Gaussian Mixture Models for Semantic SLAM [5.6] オブジェクトレベルマップを増大させたセマンティックSLAMのためのオンラインベイズPDAフレームワークを提案する。
BPDA-GMMは、中国のレストランプロセス(CRP)アソシエーションモデルを誘導する前にディリクレプロセスを使用する。
シミュレーションと実際の屋内データセットを用いた実験では、軌跡精度の向上、意味マッピングの品質、知覚エイリアスに対する堅牢性、最先端のベースラインに対するエラーが示されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:53:39 GMT)
A New Angle on Bones: Robust Pose Estimation in X-Ray and Ultrasound [5.6] 骨構造間の角度を測定することは、画像解析における日常的な課題であり、診断と治療計画のための重要な定量的パラメータを提供する。
学習に基づく点候補の提案と行モデルを用いて軸パラメータを抽出する自動骨ポーズ推定に対処する。
我々は,3つの臨床的に関連のある小児のアングル推定課題について,X線写真における骨折のフラグメント評価,超音波による股関節脱形成,および超音波による股関節脱形成の3つの課題について検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:25:08 GMT)
Not All Errors Are Equal: Consequence-Aware Reasoning Compute Allocation [5.5] 本稿では,結果認識型テスト時間計算アロケーションを提案する。
我々はSWE-bench Liteの実験を行い、Multi-SWE-bench mini上でのクロスデータセット動作を評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:29:57 GMT)
Low-Rank Decay for Grokking in Scale-Invariant Transformers: A Spectral-Geometric View [5.5] 我々は, スケール不変条件においても, 段階的な$UVtop$が接点成分を保持する核ノルム型スペクトル正規化器であるemphLow-Rank Decay (LRD)を提案する。
LRDは、クエリ/キー行列の高速な有効ランク崩壊を誘導し、遅延一般化(グロキング)が起こるデータ・フレクション境界を拡張する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:33:45 GMT)
Convergence rates of Sum-of-Hermitian-Squares Hierarchies for the Pauli algebra [5.4] パウリ代数から生成される非可換最適化問題の緩和に対する明示的な収束率を開発する。
この結果は,非可換最適化問題の緩和に対する収束率の最初の定量的解析である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:30:52 GMT)
Uncertainty-Aware (Un)Supervised Few-Shot User Adaptation for On-Device Personalized Human Activity Recognition [5.3] 本稿では,事前訓練された人間活動認識(HAR)モデルをプロトタイプネットワークとして活用する,勾配のないフレームワークを提案する。
アクティビティ毎のキャリブレーションデータのわずか3秒(1ショット)で、教師なし適応はマクロF1を+2.76から+33.44ポイント、教師なし適応は+0.56から+32.13ポイント改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:25:07 GMT)
Evaluating Reasoning Fidelity in Visual Text Generation [5.3] モデルが推論過程を画像として表現しなければならない視覚テキスト生成における推論忠実度を評価する。
現在のT2Iモデルは、しばしば意味的誤り、論理的不整合、誤った中間ステップを生成する。
本研究は,視覚的テキスト生成と手続き的推論の間に大きなギャップがあることを示し,より信頼性の高い視覚的テキスト推論を動機とした。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:53:58 GMT)
Generating Financial Time Series by Matching Random Convolutional Features [5.2] 我々は、生成時系列モデルのトレーニングに適した、完全に微分可能なランダム畳み込み特徴写像であるSOCK(SOft Competing Kernels)を紹介する。
ランダムなSOCK特徴のマッチングによって訓練されたジェネレータは、広範囲の小サンプル財務データセットにおいて、シグネチャと拡散ベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:46:50 GMT)
ALINC: Active Learning for Inductive Node Classification via Graph Sampling [5.2] グラフサンプリングによる帰納的ノード分類のためのALフレームワークであるALINCを紹介する。
ノードレベルのユーティリティ尺度をグラフレベルの選択基準に高めることで、既存の方法論的ギャップを埋める。
ALINCは分子のサイト・オブ・メタボリズム予測とプリント基板設計の自動化の2つのユースケースで有効であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:15:46 GMT)
Anisotropic Rabi Model as a Noise Biased Qubit [5.2] ノイズバイアス量子ビットの潜在的な資源として、量子異方性Rabiモデルを提案する。
系の環境結合は、回転波と反回転波の相互作用の相対的な強度を調整することによってバイアスを受けることができる。
この異方性は支配的な脱コヒーレンス経路を選択的に抑制し、保護された論理量子ビットの構築を可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:13:48 GMT)
Toward Calibrated, Fair, and accurate Deepfake Detection [5.2] ディープフェイク検出器は人口集団間で大きなパフォーマンスギャップを示す。
既存の公正なアプローチは、人口統計ラベル、再訓練、あるいは犠牲の正確さを必要とする。
バイアス軽減のためのプラグアンドプレイフレームワークであるFace-Fairness(FF)を紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:44:29 GMT)
Adaptive Calibration for Fair and Performant Facial Recognition [5.2] Adaptive (AC)は、顔認識のための新しいキャリブレーション戦略である。
正規化埋め込みとよく校正された確率の間のコサイン類似性をマッピングする。
局所コンテキストをキャリブレーションに組み込むことで、アダプティブはコサイン類似性の基本的なミスマッチを補正する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:29:44 GMT)
Human oversight of agentic systems in practice: Examining the oversight work, challenges, and heuristics of developers using software agents [5.2] エージェント監視に関する理論的談話の実証的アンカーを提供する。
緊急監視作業の少なくとも4つの形態として、優先順位コントロール、共同計画、リアルタイム監視、ポストホックレビューがあります。
監視作業は、既存の研究で表現されているように、反応性とふりかえりだけでなく、予防的かつ積極的なものであることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:53:31 GMT)
Physics-Informed Neural Network Modeling of Biodegradable Contaminant Transport through GCL/SL Composite Liners [5.0] 本研究は,GCL/SLコンポジットライナーシステムを用いた汚染物質輸送のための2領域物理インフォームドニューラルネットワークフレームワークを開発した。
2つの定式化は、異なる浸出水頭条件下での分析および有限要素参照解に対して評価される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:15:55 GMT)
Can We Predict The Human Preference For Text-to-Image Content Prior To Generation And Is It Even Useful To Do So? [4.9] 拡散モデル(DM)は、ユーザプロンプトから高品質でフォトリアリスティックな視覚コンテンツを合成することで、テキスト駆動生成に革命をもたらした。
我々は、世代ごとに計算リソースをコミットする前に、スカラーなヒューマン・プライス・メトリック(HPM)スコアをどの程度予測できるかを検討する。
我々の調査は、これが可能であるだけでなく、無視可能なハードウェアオーバーヘッドを達成可能であることを明らかにしている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:57:05 GMT)
STaR-Quant: State-Time Consistent Post-Training Quantization for Diffusion Large Language Models [4.9] 本稿では,DLLMのための状態時間一貫したPTQフレームワークSTaR-Quantを提案する。
STaR-Quantは、強いPTQベースライン上での低ビット重量活性化量子化を一貫して改善する。
最大1.69倍のスピードアップと3.14倍のメモリ節約を実現している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:34:35 GMT)
Policy-Compliant Cloud Storage Systems [4.9] 本稿では,信頼できないクラウド上でのKVSのコンプライアンスを,その整合性を変更することなく検証できる信頼システムを提案する。
KVレコード内にメタデータをコンパクトにエンコードし、専用のメタデータ固有のクエリを構築し、空間効率のよいフォーマットでコンプライアンス関連イベントのみをログする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:40:01 GMT)
GOTabPFN: From Feature Ordering to Compact Tokenization for Tabular Foundation Models on High-Dimensional Data [4.8] 本稿では,局所リファインメント付きグラフ誘導順序付け(GO-LR)を紹介し,その重み付き最小線形アレンジメントと等価性を示す。
本稿では,GO-LRとNuro-Inspired Subunit Compression(NSC)をベースとしたGOTabPFNを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:03:33 GMT)
Light or Full Verb? A Minimal-Pair Dataset for Probing Phraseological Competence in Language Models [4.7] have」や「make」のような動詞は、接尾辞や接尾辞として機能する。
そこで本研究では,同じ文脈に軽動詞と全動詞で同じ動詞を含む,最小限の英語文列の大規模データセットを提案する。
2つの探索実験により、言語モデルは最小限の文脈でもこれらの使用を区別し、オブジェクトタイプ間で分離可能なパターンを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:51:27 GMT)
When Do Fewer Coordinates Suffice in DP-SGD? [4.7] 最適化に必要な信号を失うことなく、プライベートトレーニングがより少なく更新できるかどうかを問う。
座標制限が有効である場合に特徴付ける基準を与える。
MNIST と FMNIST の実験では、学習された座標支援は、サイズマッチングされたランダムな支持よりも勾配エネルギーを維持できることが示されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:46:25 GMT)
Revisiting Privacy Amplification by Subsampling in Selective Release DPSGD [4.7] クリッピンググラディエント(DPSR-CG)に基づく微分プライベート選択リリースを提案する。
DPSR-CG機構は、例外的なモデル性能を達成しつつ、厳格なプライバシ保証を維持していることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:00:26 GMT)
ANN Search: Recall What Matters [4.7] ANN検索で本当に重要なのは、検索結果の品質であって、真のkNNセットと重なるものではない、と我々は主張する。
Recall@kを使って検索品質を評価すると、計算オーバーヘッドが不要になり、1/Ratio@kで置き換えることを調べる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:00:50 GMT)
Architecturally Significant MLOps Guidelines for ML Model Integration and Deployment: a Gray Literature Review [4.5] MLOpsモデルの統合とデプロイに関する現状の知識を分析するため、私たちは103のWebソースに関する灰色の文献レビューを実施しています。
我々はこれらのプラクティスを推奨するガイドラインにテーマ分析を適用した。
我々の結果は、MLOpsシステムにおけるMLモデルの統合とデプロイを研究者や実践者を支援するための、現状のMLOpsガイドラインの概要として役立ちます。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:09:50 GMT)
Optimizing the Sensitivity-Noise Trade-off in Non-Hermitian Sensing via Off-Exceptional-Deficiency Operation [4.5] スペクトル特異性は 信号と環境ノイズの両方を同時に増幅する
Off-EDフレームワークは、強いノイズ免疫と極度感度を一致させる。
次世代トポロジカルセンサのパラダイムとしてOff-EDフレームワークを確立した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:02:32 GMT)
Three-Dimensional Retinal Microvasculature Restoration in OCT Angiography [4.4] 本稿では,1つのOCTAボリュームから解剖学的血管を復元する深層学習アルゴリズムを提案する。
提案モデルでは,元のOCTAボリュームに比べて画質が大幅に向上した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:23:09 GMT)
Sparse Functional Singular Value Decomposition for Biclustering and Triclustering Longitudinal Data [4.3] 本稿では,二クラスタと三クラスタを長手データで検出するための統一スパース関数Singular Value DecompositionフレームワークであるTri-SfSVDを提案する。
被験者,変数,時間的サブリージョンにスパースペナルティを課すことにより,本手法は観測データに直接作用し,局所構造を解明する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:26:01 GMT)
Setting angles in quantum approximate optimization at utility-scale [4.3] 量子近似最適化アルゴリズム(QAOA)は、量子ハードウェアとタンデムの古典最適化を用いて最適化問題を解く。
しかし、与えられた問題に対して最適な角度を特定するのに、どの手法が最適かはよく分かっていない。
本稿では,QAOA実践者の運用指針を抽出するユーティリティスケールベンチマークを通じて,この問題に対処する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:02:26 GMT)
Deep Learning-assisted AMD Staging based on OCT and OCT Angiography [4.2] 年齢=50歳以上, AMD重症度は多様であった。
AREDS簡易重症度尺度によると、AMD重症度は4段階(No AMD, Early AMD, Intermediate AMD, Advanced AMD)に分類された。
OCT/OCTAデータを用いたディープラーニングモデルは、AMDの重大度を正確に自動評価することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:28:35 GMT)
QuBLAST: A Framework for Quantizing Large Language Models with Block-Level Compression Approach and Activation Scaling Strategy [4.2] QuBLASTは、LCMのアクティベーションスケーリング戦略を備えたブロックレベルの圧縮手法である。
異なるモデルアーキテクチャでモデルサイズを40%から45.2%削減する。
WikiText-2とWikiText-103データセットのパフォーマンスは、5%のパープレキシティ向上で維持されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:55:59 GMT)
Knockoffs-based False Discovery Rate Control and Simplification for Deep Neural Networks [4.2] ディープニューラルネットワークは、しばしば多数のパラメータと入力を含む。
ノックオフ法は、高次元回帰における偽発見率の制御に成功している。
本稿では,偽発見率の制御条件下での3つの変数スクリーニング手法を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:32:42 GMT)
LastAct: Trajectory-Guided Latest-Activity Localization for Real-Time Smart-Home Activity Recognition [4.2] 環境センサからのヒューマンアクティビティ認識(HAR)は、健康モニタリングや生活支援といったスマートホームアプリケーションを可能にする。
スライディング・ウインドウ推論は、遷移を成し、混合活動を含む多くのウィンドウを生成する。
我々は、スマートホームHARをストリーミングするためのトラジェクトリ中心のフレームワークであるLastActを紹介した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:30:14 GMT)
Activation-Based Active Learning for In-Context Learning: Challenges and Insights [4.1] 本稿では,モデルアクティベーションが,文脈内サンプルの選択を最適化するための微細な信号を与えることができるという仮説を検証した。
In-context Learning に適用された,アクティベーションに基づく深層能動学習手法の包括的解析について述べる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:39:29 GMT)
Scenario Generation for Risk-Aware Reinforcement Learning with Probably Approximately Safe Guarantees [4.0] 強化学習 (Reinforcement Learning, RL) ポリシーは、未知または安全でない振る舞いをもたらす過渡摂動への感受性を示す。
政策検証の方法は、安全制約に対する政策軌跡をサンプリングすることによって確率的障壁証明を構築することである。
可変オートエンコーダ (VAE) を用いて, 遭遇した状態空間の分布を近似し, 上界と下界のバリア・サーティフィケートを構成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:36:43 GMT)
Willing but Unable: Separating Refusal from Capability in Code LLMs via Abliteration [3.9] 本稿では,このバリアを除去するためのツールとして,リフレクションストリームを再現する低ランクなウェイト編集である,消音の予備的研究を行う。
脆弱性判定は3つのツール検出アンサンブル(QLCode、Sem、Bandit)と手動で行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:06:52 GMT)
Optimizing the Cost-Quality Tradeoff of Agentic Theorem Provers in Lean [3.9] 大規模な言語モデル(LLM)は、リーンで形式的な証明を生成するためにますます使われています。
LLMは違法に高価であり、多くの場合、最終的に失敗する試みに相当な計算に費やされる。
本研究では,データプレーンと制御プレーンで構成されるアクションルーティングエージェントを用いてこの問題に対処する。
コントロールプレーンは、失敗していたリーンの試みを観察し、成功の可能性を見積もり、他の試みのコストを見積もり、現在の目標を証明し続けるか、あるいは新たなブレークダウンから再開するかを決めます。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:46:20 GMT)
Optuna Constrained Tree-Structured Parzen Estimator Is a Joint Density Generalization of c-TPE [3.9] 我々は,オプトゥーナの制約付きTPEがジョイントc-TPEであることを示す。
結合したc-TPEは制約重複に不変であるのに対し、独立なc-TPEは積が重複因子を蓄積するにつれて劣化することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:16:59 GMT)
Need We Teach Foundation Models What is a Generative Image? Gradient-Free Generative Artifact Detection via Analytic Spectral Adaptation [3.9] 勾配ベースの更新による生成成果物の検出に基礎モデルを適用することで、本質的な表現が損なわれる。
本稿では,二分分類から外分布(OOD)異常測定問題への検出を緩和する勾配のない手法を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:04:23 GMT)
Generalizable Multi-Task Learning for Wireless Networks Using Prompt Decision Transformers [3.9] 本稿では, Prompt Decision Transformer (PromptDT) を用いたマルチタスク学習フレームワークを提案する。
PromptDTは、ベースラインと比較して、マルチタスク設定でQoEを最大49%改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:03:38 GMT)
Folded Transport MCMC: Certifiable Quotient Posterior Computation for Symmetric Bayesian Models [3.9] 提案手法では, 後続部に直接推論を行うFolded Transport MCMCを提案する。
台風マングホート時の超高層建物からの実際の加速度計データでは、FolT-MCMCは非空の量子コア証明書を生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:26:46 GMT)
Deep Embedded Multiplicative DMD for Algebra-Preserving Koopman Learning [3.7] DeepMDMDは遅延空間と分割を学習する手法である。
スペクトル汚染を低減し、よりリッチな連続スペクトル構造を明らかにし、厳しい騒音下で安定した予測を与える。
これらの結果はクープマン学習の実践的なルールを示唆している:座標を学習し、代数を制約する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:37:06 GMT)
When Freshness Is Not Enough: Distribution-Aware Age of Information for Networked LQR Control [3.7] Age of Information (AoI) は無線更新システムの設計において中心的な指標となっている。
本稿では,ネットワーク制御システムにおいて,平均AoIの最小化が実際最適かどうかを検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:22:46 GMT)
Curvature-aware dynamic precision approach for physics-informed neural networks [3.7] 近年の研究では、PINNの最適化は数値精度に敏感であることが示されている。
既存の実装では、シングル精度(FP32)またはダブル精度(FP64)が一般的である。
本稿では,学習中の数値精度に適応する曲率認識精度制御器を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:19:53 GMT)
NLLog: Lightweight, Explainable SOC Anomaly Detection via Log-to-Language Rewriting [3.7] NLLogは、解析済みのテンプレートをWHO-WHAT-SEVERITY文に決定的に書き換える軽量パイプラインである。
用語-周波数-逆文書-周波数重み付け、ツリーアンサンブルによるセッションの分類、およびバックプロジェクトエビデンスでそれらをプールする。
セキュリティ・オペレーション・センターのトリアージに適したコモディティ・ハードウェアのレイテンシで、偽陽性率を低く保っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:45:29 GMT)
An Entanglement Measure from Quantum Optimal Transport [3.7] 我々は、状態から分離可能な状態の集合への最小オーダー-1量子ワッサーシュタイン距離として定義される二部分エンタングルメント測度$E()$を提案する。
リプシッツ双対の定式化は、純粋および混合状態に対する明示的な下界、2ビット系に対する鋭い定数、ハールランダム純状態に対する期待値を得る。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:51:46 GMT)
Online Safety Regulation Increases Privacy Risk: Evidence from the UK Online Safety Act [3.6] イギリスのオンライン安全法は2023年10月に可決された。
年齢保証と安全要件をソーシャルメディア、検索、ポルノサービスに拡張する。
オフコムの違法コンテンツ執行業務は2025年3月に発効した。
2025年7月、成人コンテンツの強制年齢検証が施行された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:24:28 GMT)
Efficient Computation of Distance Functions for Navigation Vector Fields in Lie Groups [3.6] 本稿では,G-ポリノミカル曲線を表す点と曲線の間の距離を効率的に計算する手法を提案する。
提案手法は、これらの曲線の構造を利用して、問題を少数のルートフィリング計算に還元する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:18:59 GMT)
AICompanionBench: Benchmarking LLMs-as-Judges for AI Companion Safety [3.5] この研究はAICompanionBenchを紹介し、人間とAIの会話に詳細な安全性リスクが付与された最初の公開ベンチマークデータセットについて紹介する。
このデータセットには、Redditから収集された2123の現実世界のReplika会話が含まれており、性的行動、反社会的行動、身体的攻撃、口頭攻撃、薬物乱用、自傷と自殺、コントロール、操作、ノーハームの9つのカテゴリで人間とAIのコラボレーションを通じて注釈付けされている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:33:42 GMT)
QO-Bench: Diagnosing Query-Operator-Preserving Retrieval over Typed Event Tuples [3.5] 本稿では,QO-Benchという,型付きイベントに対するクエリ操作型質問応答の診断ベンチマークを紹介する。
ベンチマークでは、22,984のニュース記事と18のクエリテンプレートにわたる614の企業イベントをカバーし、785の質問で評価されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:14:43 GMT)
Horse Eye Blink Detection and Classification for Equine Affective State Assessment [3.5] 馬のビデオから自動瞬き分類を行う3つの方法を開発し,評価する。
分岐分類を行う場合のマクロF1スコアは0.898、二分点検出では0.926となる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:33:39 GMT)
How Software Engineering Students Use LLMs to Write Research Papers: An Experience Report [3.4] 大規模言語モデルは、ソフトウェア工学教育の一部になりつつある。
本稿では,反射型LDMを経験的手法に組み込んだ教育経験を報告する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:19:43 GMT)
PS-UIE: Privilege-Separated Integrity Enforcement for User-Space Executable Objects in Confidential VMs [3.4] プライビレージ分離型ユーザ空間統合強化(PS-UIE)を提案する。
PS-UIEは、カバーされた実行許可パス上のユーザ空間実行オブジェクトの整合性を強制する。
AMD SEV-SNPプラットフォームにPS-UIEを実装した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:33:50 GMT)
From Untrusted Input to Trusted Memory: A Systematic Study of Memory Poisoning Attacks in LLM Agents [3.3] メモリはAIエージェントの中核的なコンポーネントであり、対話を通じて知識を蓄積し、パフォーマンスを向上させることができる。
本研究は, LLM系薬剤の記憶障害に関する系統的研究である。
モデル機能,システムプロンプト設計,エージェントシステムアーキテクチャにおいて,4つのメモリ書き込みチャネルと9つの構造的脆弱性を識別する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:04:13 GMT)
Activation Steering of Video Generation Models via Reduced-Order Linear Optimal Control [3.3] アクティベーションステアリングは、ファインチューニングやプロンプトフィルタリングに代わる魅力的な機構を提供する。
Latent Activation Linear-Quadratic Regulator (LA-LQR) は最小侵襲T2Vステアリングのための低次最適制御フレームワークである。
LA-LQRはT2V推論を力学系として定式化し、閉ループフィードバックの介入を計算する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:58:56 GMT)
Attention-Augmented LSTMs for Automatic Homophonic Ciphertext Decipherment [3.3] ホモフォニック置換暗号は、各平文文字をいくつかの可能な暗号符号の1つに置き換える。
本稿では,注意増強長短期記憶(LSTM)モデルが歴史的モチベーション付き共有キー設定でそのようなマッピングを学習できるかどうかを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:35:43 GMT)
Representation Curriculum: Stagewise Training for Robust Ranking and Allocation [3.3] 本稿では、時間的特徴利用を段階的に行う訓練時間介入であるRepresentation Curriculum(RC)を提案する。
RCは最初、コンテンツに基づく有益シグナルを予測し、露光依存的な信条信号を導入する。
RCは、歴史的信念信号からコンテンツに基づく有益信号への信頼度を計測的にシフトさせる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:02:19 GMT)
A Taxonomy of Runtime Faults in Model Context Protocol Servers [3.3] MCPサーバにおける実行時障害の最初の経験的分類を提示する。
MCP 固有の実行時障害スレッド 837 を MCP サーバ GitHub リポジトリ 473 から解析した。
分類学の外部妥当性を評価するため,55名のMDPサーバ開発者を調査した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:28:20 GMT)
A 3D Isovist World Model -- Revealing a City's Unseen Geometry and Its Emergent Cross-City Signature [3.2] 都市を航行するエージェントは、周囲がどう変化するかを予測する世界モデルに頼っている。
我々は,過去のアイソビストと運動行動の短い歴史から,次のアイソビストを予測する具体的世界モデルを導入する。
マンハッタンとパリで訓練された1つの都市ブラインドモデルは、都市横断的な空間的シグネチャを発達させる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:29:22 GMT)
Archi: Agentic Operations at the CMS Experiment [3.2] 我々は、科学データ収集のためのオープンソースのエンドツーエンドフレームワークであるArchiを紹介する。
Archiのインスタンスは、2026年2月からCERNのLHCにおけるCMS実験のコンピューティングオペレーションチームに、テクニカルオペレータのサポートエージェントとしてデプロイされている。
作業者からのフィードバックと,人や自動パネルによって評価された製品使用状況から収集した質問セットについて評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:38:30 GMT)
Safety-Critical Adaptive Impedance Control via Nonsmooth Control Barrier Functions under State and Input Constraints [3.2] 本研究では,不確実な動的条件下での適合的な相互作用を達成しつつ,連立状態の安全性を強制するオンライン適応インピーダンス制御フレームワークを提案する。
この手法は、二次プログラムに基づく安全フィルタと、新しい構成された位置速度非滑らかな制御バリア関数を組み合わせたものである。
外乱オブザーバの強化された安全メカニズムは、モデリングエラーや外部の相互作用力に対する堅牢性を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:15:02 GMT)
Handwriting Extraction and Analysis of Signature Lists in Swiss Popular Initiatives [3.2] オフザシェルフのOCRシステムは手書き署名データの転写に十分な信頼性を持っていない。
ライター検索手法は、シグネチャリスト間で視覚的に類似したエントリを効果的に識別することができる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:41:30 GMT)
Large Language Models in K-12 Education: Alignment with State Curriculum Standards and Student Personas [3.1] 我々は、米国史のカリキュラムのバリエーションを特定し、異なるLLMがこれらの州固有のカリキュラムの違いを反映する程度を評価する。
モデルが歴史的トピックの提示を調整できる一方で、こうした変化は国家の政治的傾向が認識されていることから生じる可能性がある。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:14:33 GMT)
Harnessing Source Heterogeneity for Cluster-Structured Transfer Learning [3.1] コネチカット病院情報管理取引所のデータを用いた自殺リスク調査は、27の病院で636,758人の患者から成っている。
一般化線形モデルのためのクラスタ構造化トランスファーラーニング手法であるTrans-GLMCを提案する。
シミュレーションおよびCHIME研究において、Trans-GLMCは施設固有の予測を改善し、相互転送性のある病院の解釈可能なコミュニティを特定し、臨床的に一貫性のある自殺リスク因子を回復する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:09:15 GMT)
(Mis)generalization of Helpful-only Fine-tuning [3.0] 既存の有用な専用モデルの欠点について検討する。
単純な反拒絶訓練はこれらの問題の多くを引き起こす可能性があることを示す。
合成文書の微調整と文字関連質問をSFTとRLに付加することで、それらを緩和できることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:43:08 GMT)
Learning symplectic model reduction based on a approximation theorem of symplectic embeddings [3.0] 高次元ハミルトン系は多くの科学・工学分野において中心的な役割を果たす。
ディープラーニングは、データから低次元のサロゲートを構築する強力なツールを提供する。
内在的なシンプレクティック構造は、モデル縮小時に容易に破壊される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:58:44 GMT)
Beyond Objective Equivalence: Constraint Injection for LLM-Based Optimization Modeling on Vehicle Routing Problems [3.0] 本研究では,無声性制約の排除を明らかにするために,急激な過剰制約と一拘束性違反プローブを露呈する制約注入法を提案する。
自然言語のVRPシナリオをGurobiスクリプトに変換する8BのエンドツーエンドモデルであるVRPCoderを開発した。
VRPCoder-GRPOは93%の平均パス@1、Geminiは3つのベンチマークで3.1-Proプレビューを上回り、Claude-Sonnet-4.5を28ポイント上回り、LLMを78ポイント上回る。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:39:04 GMT)
Enhancing the MADDPG Algorithm for Multi-Agent Learning via Action Inference and Importance Sampling [3.0] 本稿では,各エージェントが他のエージェントの意図した行動を予測できる新しいアクション推論機構を提案する。
第2に、リプレイバッファに幾何分布を用いた重要サンプリング戦略を適用し、より最新の情報的体験を優先する。
その結果,行動推論は学習安定性の向上とエージェント間協調に有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:44:56 GMT)
Implicit Fuzzification via Bounded Noise Injection for Robust Medical Image Segmentation [3.0] NoiseUNetは、有界な摂動をスキップ接続に注入し、クロススケールな機能融合を規則化する。
実験により、NossUNetはセグメンテーション精度とバウンダリ忠実度の両方を一貫して改善することが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:17:15 GMT)
FALSIFYBENCH: Evaluating Inductive Reasoning in LLMs with Rule Discovery Games [3.0] 従来のWason 2-4-6タスクに触発された仮説駆動推論のための評価フレームワークであるFALSIFYBENCHを紹介する。
このタスクは、仮説の生成、証拠収集、そして証拠の確認と不確認の両方に対応する信念の修正という、科学的推論の重要な要素を捉えている。
モデルファミリとスケールをまたいだ12 LLM の評価は、推論モデルが命令調整モデルよりも一般的に強力な科学的推論モデルであることを示しているが、最適性能に近づくモデルはない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:33:17 GMT)
Hybrid Gaussian-exponential zero-noise extrapolation for periodic circuits [2.9] 本稿では,周期構造を持つ量子回路に適したハイブリッドガウス-指数外挿法を提案する。
中間から大きな回路深度について、ハイブリッドモデルは以前の外挿変量と比較して測定可能なバイアスの減少をもたらす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:36:04 GMT)
Scaling Laws for Behavioral Foundation Models over User Event Sequences [2.9] 本稿では、共通の2部分の振る舞いモデルアーキテクチャ、特徴ベースのイベント埋め込み、デコーダのみの変換器について検討する。
約600回にわたって、実際のインタラクションデータで動作し、トレーニング用FLOPは1015ドルから1019ドルの範囲で、デプロイ関連軸が4つあります。
計算最適トレーニングは低計算時のテキストと比較してデータ量が多いが、計算量が増加するにつれて、そのD/N$比はチンチラに向かう。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:59:25 GMT)
The Role of Instructional Guidance in Generative AI-Assisted Learning: Empirical Evidence from Construction Engineering Education [2.9] 本研究では,建設教育における指導指導が学生とAIの相互作用をどのように形作るかを検討する。
生成学習理論に基づく5段階のプロンプトフレームワークを導入し,学習者のインタラクションをガイドする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:27:46 GMT)
Uncertainty-Aware End-to-End Co-Design of Neural Network Processors: From Training and Mapping to Fabrication [2.8] 本稿では,ニューラルネットワークプロセッサ設計のための統一的なフレームワークを提案する。
ネットワークトレーニング、チップマッピング、ウエハレベルの製造、計算リソース割り当てにまたがる4つの相互運用可能な設計ブロックで構成されている。
3つのケーススタディがこのアプローチを検証する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:16:16 GMT)
LEVANTE-bench: Multi-Scale Comparison of VLMs to Children Using Cognitive Tasks (or, "Is Your VLM Smarter Than a 5th Grader?") [2.8] 視覚言語モデル(VLM)は、人間の認知をモデル化し、経験を積んで発展していくことを約束する。
LEVANTE-benchは,言語や文化における子どもの認知度を計測するタスクとデータに基づくベンチマークである。
モデルを複数スケールで比較し、全体的な精度、課題レベルとアイテムレベルとの整合性、そして子どもの試行レベルの誤差分布とどの程度うまく一致しているかを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:41:11 GMT)
Multi-entropy in random tensor networks [2.7] 我々はRandom Network (RTN) 状態における Rényi multi-entropies $S(q)_n$ の評価について検討した。
Rényi index $n=2$ および任意のパーティ数$q$ の場合、マルチエントロピーはネットワークを通しての最小のマルチウェイカットによって決定されることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:30:41 GMT)
Do Large Language Models Have Emotions? [2.7] 人類学的報告では、クロード・ソネット4.5で感情概念の内部表現が発見され、LLMは「機能的感情」を持っていると結論づけた。
情動は、状況の文脈に敏感な解釈と、複数のシステムにまたがる処理の再構成という、2つのコア機能に役立ちます。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:07:49 GMT)
Testing LLM Arithmetic Reasoning Generalization with Automatic Numeric-Remapping Attacks [2.7] 算術語問題に対する数値再マッピング攻撃を自動生成するアルゴリズムを提案する。
我々は,GSM8K,MAWPS,MultiArith上でDeepSeek-R1(70B),Gemma4(31B),GPT-OSS(120B)を評価した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:40:36 GMT)
Extraction and Search in Rocq: Theorems, Definitions and Their dependencies [2.6] Rocq (Coq) は、ソフトウェア検証や数学的証明など、様々な分野で広く使われている。
本稿では、定理合成を解析し、定理、依存関係、定義を抽出できるRocq定理抽出解析ツールTheoremExtrを紹介する。
我々はまた、定理と定義のクロスプロジェクト類似性検索をサポートするウェブサイトを開発した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:33:17 GMT)
Signed Dual Attention: Capturing Signed Dependencies in Time Series Forecasting [2.6] 標準的な注意機構は、ホモフレンドリな相互作用を暗黙的に仮定し、時系列のような正と負の依存関係を持つデータをモデル化する能力を制限する。
本研究では, 付加パラメータを伴わずに, 正と負の両方の相関パターンをキャプチャする新しいアテンション形式であるSigned Dual Attentionを紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:02:14 GMT)
Graph-Guided Universum Learning in Generalized Eigenvalue Proximal SVMs for Alzheimer's Disease Classification [2.5] アルツハイマー病(AD)の早期かつ正確な検出は、時間的介入と疾患管理に重要である。
本稿では、構造的MRIデータを用いて、AD対認知正規化(CN)分類のためのグラフ誘導大学学習モデルUG-GEPSVMとIUG-GEPSVMを提案する。
ICAとPCAの5つのノイズレベルにおける特徴を用いたADNI MRIデータセットの変異実験により、提案したモデルが既存のGEPSVMとUniversumベースの手法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:24:09 GMT)
TeleHunt: A Framework and Tool for Efficient Cybercriminal Community Discovery on Telegram [2.5] 本稿では,Telegram上でサイバー犯罪コミュニティを発見するための様々な戦略の有効性を評価するためのフレームワークとツールであるTeleHuntを提案する。
我々は、メッセージレベルの分類、コンテキストフィルタリング、マーケットセグメンテーションラベリングを統合し、参照駆動型スノーボール戦略のセットを採用する。
本研究は, (i) モジュール型サイバー犯罪コンテンツ発見パイプライン, (ii) マーケットセグメンテーションアクセシビリティを実証的に評価したTelegram発見戦略の最初の体系的比較, (iii) 6,022のTelegramコミュニティからの1億7200万以上のメッセージのラベル付きデータセットを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:31:58 GMT)
Assessing the Carbon Emissions and Energy Consumption of U.S. Hyperscale Data Centers [2.5] 我々は2024年5月から2025年4月までに403の米国ハイパースケールデータセンターに関する情報を収集した。
電力消費, 発電源およびCO2排出量を推定した。
当社のアプローチは,ハイパースケールデータセンターの環境フットプリントを評価するための属性ツールを提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:38:10 GMT)
QPredSGG: Hybrid Quantum Predicate Learning for Long-Tailed Scene Graph Generation [2.4] シーングラフ生成(SGG)は、オブジェクトとその相互作用に対する関係推論を必要とする。
古典的なSGGモデルは、しばしばデータセット統計に依存し、頻繁な関係に対するバイアスのある予測をもたらす。
本研究は,古典的述語ヘッドであるCausal Feature Enhancement Network (CFEN) を,重み付きクロスエントロピーを用いて学習した量子述語ヘッド (QP-Head) に置き換えることで,SGGのためのハイブリッド量子述語分類器を導入する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:15:56 GMT)
Offline-to-Online Learning in Linear Bandits [2.4] 線形バンディット設定にオフラインデータセットを追加してオンライン学習を学習する。
我々は、このトレードオフのバランスをとる線形帯域幅アルゴリズムを提案し、初期ラウンドでオフラインデータに依存し、地平線が大きくなるにつれて探索を好んでいる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:18:46 GMT)
Seq103: A Unified Neuroevolution Framework for Compact Sequence Architecture Discovery [2.3] 神経進化(Neuroevolution)は、進化的アルゴリズムを通じてネットワークトポロジと重みの両方を進化させる代表的なニューラルネットワーク探索パラダイムである。
本稿では,コンパクトなシーケンスアーキテクチャ発見のためのNEATスタイルのニューロ進化フレームワークであるSeq103を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:01:40 GMT)
Too Much of a Good Thing: When sim2real Efforts Impede Policy Learning (And What to Do About It) [2.3] 我々は、シム2リアルな取り組みが、政策学習と不整合なインセンティブをもたらし、現実社会が課した不合理な制約により、シミュレーターのロックインと政策探究が不十分になったと論じる。
本稿では,ロボットのキネマティクスを唯一の設計制約として活用するsim2sim2realパラダイムによる潜在的な解決策を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:09:02 GMT)
Biomazon: A Multimodal Dataset for 3D Forest Structure and Biomass Modeling in the Amazon Basin [2.3] Biomazonは、Amazon Basin上の20mのマルチモーダルベンチマークデータセットである。
GEDI RHとAGBDターゲットとマルチセンサー予測器をペアリングする。
Biomazonは、構造的に一貫したRH現象予測に関する将来の研究のための基準ベンチマークを確立する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:16:35 GMT)
No-Go Theorem for Gaussian Quantum Repeaters from Fractional Extendibility [2.3] 量子ネットワークにおけるガウス量子リピータのノーゴー定理を証明する。
我々の証明はガウス状態に対する分数拡張性の概念に$k$-extendibilityの一般化を導入する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:00:00 GMT)
Hierarchical Space Partition for Surface Reconstruction [2.3] モデルコンパクト性を保ちながら、行方不明な詳細を効果的に回収する平面組立戦略を提案する。
我々は、シーンから抽出されたすべての平面を、3つのカテゴリに分類する。
シーン構造解析によって復元された見えない平面は、行方不明の詳細を示している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:52:36 GMT)
Data-efficient flood depth prediction through domain-aware coreset selection and tabular foundation models [2.3] リアルタイムに近い洪水深度予測は、正確な、高速で、流域をまたいで移動可能なモデルを要求する。
スーパービジョンされたサロゲートは、物理ベースのシミュレータを正確にマッチングすることができるが、流域ごとに数百万のトレーニング行が必要であり、元のメッシュを超えて外挿することはできない。
本稿では,提案するドメイン対応コアセット構築パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:25:38 GMT)
Drift-Augmented Scoring: Text-Derived Noise Robustness for Zero-Shot Audio-Language Classification [2.1] そこで我々は,コサインスコアに付加される小さなクラスごとのボーナスであるDrift Augmented Scoring (DAS)を提案する。
DASは、雑音の多いオーディオ埋め込みが、クラスのノイズ条件付きテキストが予測する方向にドリフトするとき、クラスに報酬を与える。
我々は,Acevedo et al.のUrbanSound8KとフルFSD50Keval集合の4つの変種との比較を行った。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:12:34 GMT)
Nonreciprocal Dispersive Coupling for Quantum Sensing [2.1] 分散結合は量子情報の読み出しに広く利用されている。
ほとんどの先行研究は相互分散結合に集中している。
本研究は、量子センシングを向上し、超精密量子センサの製作を可能にする新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:45:14 GMT)
L-TGVN: Leveraging Longitudinal Priors for Personalized Rapid MRI [2.0] 長期の取得は、患者の不快感を増し、検査コストを上げ、スキャナのスループットを制限する。
スキャン時間を短縮するための一般的なアプローチは、より少ない測定値を取得することである。
フォローアップテストでは、患者の最新の先行スキャンは、非常に有意義な主題固有のコンテキストを提供することができる。
本稿では,従来のスキャンを副次情報として活用し,現在のスキャンを再構築するL-TGVNについて紹介する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:56:25 GMT)
Gaussian mean width strong converse bound on the classical identification capacity of quantum channels [2.0] 我々は、量子チャネルの識別能力に縛られる単一文字と効率的な計算可能な強い逆を確立する。
製品状態重み付き$-ユークリッド幾何を用いた$n$フォールドチャネル出力空間を具備することにより、同定符号のトレース距離分離制約をユークリッド被覆推定により制御できる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:00:02 GMT)
Resource-efficient energy-based operator selection in fermionic ADAPT-VQE via exact Hamiltonian transformation [2.0] 本研究では,ハミルトニアン変換がフェルミオンエネルギーベースADAPT-VQEの測定オーバーヘッドを低減するための有効な経路であることを示す。
その結果,ハミルトニアン変換はフェルミオンエネルギーベースのADAPT-VQEの測定オーバーヘッドを低減するための有効な経路であることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:08:45 GMT)
Bitcoin After Block Rewards [2.0] Bitcoinのブロック報酬はゼロに減少する予定である。
本稿では, 正直な鉱業からの大規模かつ永続的な逸脱が生じる状況を明らかにすることを目的とする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:58:41 GMT)
UniFair: A unified fair clustering approach based on separation and compactness [1.9] 両助詞の公平性と両助詞の公平性を協調的に最適化する統一的枠組みを提案する。
我々は分離フェアと$k$-meansの目的を統一した勾配に基づく最適化手法を開発し、オートエンコーダの潜在空間における同じ基準を強制することにより、それらを深層クラスタリングに拡張する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:00:22 GMT)
Disentangling Answer Engine Optimization from Platform Growth: A Log-Based Natural Experiment on ChatGPT Referral Traffic [1.9] ChatGPTのような大規模言語モデル"アンサーエンジン"は、現在、測定可能な参照トラフィックをオープンWebに送信している。
AEOの成功談は、通常、生の成長倍数を引用するが、生の参照成長は、応答エンジン自体の急速なプラットフォームレベルの成長によって構築される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:23:03 GMT)
RIDE: An Open Dataset and Benchmark for Train Delay Prediction [1.8] RIDEは、ベルギーの鉄道網上に全国規模で構築された列車遅延予測のためのオープンデータセットとベンチマークである。
94.5万の列車イベント、3.6万回の旅行、2023年から2025年までの35.7万回の気象記録をカバーしている。
生の鉄道と気象源から、再利用可能な中間関係データセットとモデル対応ベンチマークデータセットの2つのパブリックリリースまでの、階層化されたデータパイプラインとして組織されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:29:50 GMT)
Exploring LLMs for South Asian Music Understanding and Generation [1.6] 東南アジアのクラシック音楽において,Large Language Models (LLMs) 能力の体系的評価を行った。
音楽理解評価には,ラーガ文法,文化知識,記号表記推論を対象とする504問問答ベンチマークを導入する。
音楽生成のための5レベル制御プロンプトフレームワークを設計し、最強のモデルでさえスタイリスティックに忠実なアウトプットを生成できるのは、その40%に過ぎないことを発見した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:53:27 GMT)
EEG-FuseFormer: A Transformer-Driven Feature Fusion Framework for Seizure Onset Prediction [1.6] 発作発生の正確な予測はてんかん患者のリスクを軽減するのに役立つ。
本稿では,アセプション・オンセット予測のためのトランスフォーマーベースの機能融合フレームワークであるEEG-FuseFormerを提案する。
提案モデルでは,98.85%の平均リコールを実現し,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:33:52 GMT)
Context-as-a-Service: Surfacing Cross-File Dependency Chains for LLM-Generated Developer Documentation [1.6] Context-as-a-Service (C)は、エージェントがソースコード、API参照、アップストリームドキュメントをクエリすることを可能にする。
Cはソースコード、API参照、アップストリームドキュメンテーションをインデックスし、エージェントはキーワードとセマンティック検索を組み合わせたツールコールを通じてインデックスをクエリできる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:26:56 GMT)
BBOmix: A Tabular Benchmark for Hyperparameter Optimization of Unsupervised Biological Representation Learning [1.6] $textbfBBOmix$は、現実世界の生物学的データの教師なし表現学習のための最初のオープンソースベンチマークである。
再構成損失と下流タスク性能の相関関係を定量化する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:48:31 GMT)
Abduction Prover in Isabelle/HOL [1.5] 本稿では,Isabelle/HOLのAbduction Proverを紹介する。
挑戦的な証明目標を与えられたAbduction Proverは、帰納的推論を用いて有用な予想を特定することによって、目標の証明スクリプトを構築する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:41:08 GMT)
Failure Modes of Deep Multi-Agent RL in Asynchronous Pricing: Reproducible Triggers, Trace Diagnostics, and a Partial Fix [1.5] 同期DDPGエージェントは、コラシオンインデックス$= 0.69 pm 0.11$で確実に障害モード1をトリガーする。
部分的な修正を定量化します。非同期だけでコラシオンを48%削減し、レイテンシを追加することで、最低$0.28$にします。
気道内信号の崩壊と非回復を呈するトラジェクトリレベルのトレース診断を併用したスカラー・コルシオン・インデックスを施行した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:49:15 GMT)
Zero knowledge verification for frontier AI training is possible [1.4] 本稿では,フロンティア高密度事前学習のための検証アーキテクチャを提案する。
これは、事前コミットされたトレーニング仕様、ノード間ネットワーク観測、中間計算のオンザフライメルクルコミットメントを組み合わせたものである。
単桁のトレーニング側オーバーヘッドで36ヶ月以内に、デプロイ可能な概念実証を見積もる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:57:28 GMT)
Towards Process Mining Use Case Map Models with PM4Py-UCM [1.4] 本稿では、既存のPM4Py Pythonライブラリのオープンソース拡張であるPM4Py-UCMをコントリビュートし、解説する。
ユースケースマップ(UCM)モデルを、プロセス発見の第一級出力であるITU-TのUser Requirements Notation(URN)から作成することを目的としている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:07:11 GMT)
Mutation Without Variation: Convergence Dynamics in LLM-Driven Program Evolution [1.4] ドメイン固有言語における選択圧の欠如によるLPMによる突然変異連鎖の解析を行った。
LLMに基づく突然変異はプログラム空間内の制限された誘引領域へ連続的に収束する。
収束性は構造レベルでは特に深刻である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:22:29 GMT)
Anomalies in Multivariate Time Series Benchmarks Are Mostly Univariate [1.3] MTSADモデルにおいて、異常が複数のチャネルに分散する可能性があるという仮定を評価する。
我々は,各ラベル付き異常に対して,少なくとも1つのチャネルが正常な履歴から個別に逸脱するか否かをフラグするセグメントごとの診断フレームワークを導入する。
我々のフレームワークは、これらのセグメントをチャンネル間のみとして正しく特徴付けている。
現在のMTSADベンチマークは、チャネル間モデリング機能を検証するには適していないと結論付けている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:11:53 GMT)
Autonomous heterogeneous catalyst discovery with a self-evolving multi-agent digital twin [1.3] CatDT (Catalysis Digital Twin) は、作動触媒の自律型デジタルツインを構築する自己進化型マルチエージェントシステムである。
8つの専門エージェントと27の科学ツールが安定なファセットを予測し、作業面を再構築し、反応経路を列挙し、ランク付けし、遷移状態を特定し、単一のGPU上で5~30分で運動量を計算する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:10:58 GMT)
Expectations vs. Realities: The Cost of MSE-Optimal Forecasting Under Conditional Uncertainty [1.2] 多段階時系列予測(MSF)は平均二乗誤差(MSE)などのポイントワイド誤差指標を用いて一般的に評価される。
これは条件的不確実性の下では誤解を招く可能性を示し、条件的期待はより長い地平線における典型的な実効値とは無関係となる。
これにより、MSF評価における点精度と限界リアリズムの基本的なモデルに依存しないトレードオフが確立される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:50:32 GMT)
Do Foundation Models See Biology? Evaluating Attention Coherence with Spatial Transcriptomics in Glioblastoma [1.2] 本研究では,無仮説の注意評価のための空間転写学に基づくフレームワークを提案する。
本フレームワークは,病理組織学から基礎モデルが学べるものを客観的かつ定量的に評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:49:31 GMT)
Enhancing MedSAM with a Lightweight Box Predictor for Medical Image Segmentation [1.2] 軽量なBox PredictorモジュールをMedSAMアーキテクチャに統合したセグメンテーションフレームワークを提案する。
Box Predictorは、ローカライズされたイメージ埋め込み機能を使用して、単一のユーザクリックから近似的なバウンディングボックスを推定する。
本手法は解剖学的構造と画像領域のセグメンテーション精度とロバスト性を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:34:15 GMT)
What Type of Inference is Active Inference? [1.2] 積極的推論は意思決定を推論とし、期待自由エネルギー(EFE)はゴール指向と情報探索の行動を統一する。
近年の研究では, EFE の最小化は, 造血前兆を付加した生成モデル上での変動自由エネルギー (VFE) の最小化として記述できることが示されている。
拡張モデルのVFEは、予測モデルのVFEとして書き直せること、および明示的なエントロピー補正項により、EFEコントリビューションを透過的にすることができることを証明した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:24:53 GMT)
3D Temporal Analysis for Autism Spectrum Disorder Screening During Attention Tasks [1.2] 3DモデリングフレームワークであるDEC(Detailed Expression Capture and Animation)上に構築された新しい3D時間解析フレームワークが紹介されている。
GRUベースのモデルは優れた性能を示し、3Dヘッドポーズの精度は83.9%、顔の特徴は81.4%に達した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:07:28 GMT)
AIP: A Graph Representation for Learning and Governing Agent Skills [1.1] 現在、エージェントスキルは、エージェントがすべてのセッションでどのように振る舞うかを読み、解釈し、再導出する必要があるフリーフォームの散文で構成されている。
これは、実装が重いタスクに対する信頼性の低下と、スキル創造と改善の難しさの2つの複合コストを課します。
Agent Instruction Protocol (AIP) は両方とも、有向実行グラフとしてスキルをモデル化することで対処する。
コンパイラのメタスキルは、既存の人書きスキルをこの形式に変換する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:02:49 GMT)
Parthenon Law: A Self-Evolving Legal-Agent Framework [1.1] 法律ドメインのエージェントは、ドキュメントの重い問題をレビュー可能な作業製品に変えることを約束します。
今日の最強のモデルとハーネスの組み合わせが、エンドツーエンドの法的な問題に対してどのように振る舞うかについて、大規模な証拠はない。
反推論学習ループは、得られた失敗をタスクに依存しない編集からスキル、ツール、知識に変換する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:39:42 GMT)
PaCX-MAE: Physiology-Augmented Chest X-Ray Masked Autoencoder [1.0] 胸部X線エンコーダに生理的前駆体を注入するクロスモーダル蒸留フレームワークPa CX-MAEを提案する。
Pa CX-MAEは、CXR表現をペアのECGと実験室の埋め込みと整合させて、二重のコントラスト予測目的でドメイン内のマスク付きオートエンコーディングを増強する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:36:52 GMT)
Emergent Self-Similar Quantum Revivals in Spiral Drives [1.0] 準周期的スパイラルキックによって駆動される多体系における自己相似量子回復という、非平衡時間秩序の形式を見つける。
可積分性破壊的な摂動の存在下では、システムは最終的に加熱されるが、代数的に調節可能な寿命を持つ長寿命の予熱状態は、加熱セットに入る前に起こる。
本研究は、非平衡量子物質の新しいパラダイムとして自己相似量子復元法を確立し、現在の量子シミュレータにおける観測の現実的な経路を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:04 GMT)
Formal verification of the S-two AIR [0.9] StarkWareのS-two証明は、カイロ仮想マシン言語で記述されたプログラムを完了まで実行させる効率的な手段を提供する。
Lean 4の証明アシスタントを使って、エンコーディングが健全であることを検証します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:36:41 GMT)
Does Artificial Intelligence Advance Science? [0.9] 私たちは、AIの採用と科学的創造性との関係を調査するために、OpenAlexから100万以上の出版物を分析します。
私たちは、AI出版物は、非AI出版物と比較して、最高の創造性を達成する可能性が著しく高いことに気付きました。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:23:58 GMT)
Beyond Prompt-Based Planning: MCP-Native Graph Planning-based Biomedical Agent System [0.9] グラフスキャフォールド計画に基づくMSPネイティブなバイオメディカルエージェントであるBioManusを紹介した。
また,BioManusは,高度なバイオメディカルエージェントベースラインよりも実行精度,ワークフローの妥当性,コンテキスト効率を向上することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:19:25 GMT)
HYolo: An Intelligent IoT-Based Object Detection System Using Hypergraph Learning [0.9] HYoloはIoTベースのオブジェクト検出フレームワークで、ハイパーグラフ学習をYOLOアーキテクチャに統合する。
提案手法は, 全体の検出精度とロバスト性を高めつつ, mAP@50の約12%の改善を実現する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:02:12 GMT)
Teaching Robots to Say 'I Don't Know' : SENTINEL for Uncertainty-Aware SLAM [0.9] 低コストの2D LiDARは、ハイエンドセンサーが測定障害の診断に使用する強度チャネルを欠いている。
本稿では,SENTINEL, フリーラベル, フリー信頼度推定フレームワークを提案する。
我々は、RPLidar A2M12とIntel RealSense D435iを搭載したGEFIER R1 4輪スキッドステアロボットでこれを評価した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:22:05 GMT)
ProHiFlo: Hierarchical Flow Matching with Functional Guidance for De Novo Protein Generation [0.9] ProHiFloは階層的なフローマッチングフレームワークで、3つのイノベーションがある。
全原子座標に精製する前にバックボーンの幾何をモデル化する粗大で微細な生成。
事前訓練された予測子を活用して、再訓練せずに所望の特性を操る機能ガイダンス。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:11:28 GMT)
MineXplore: An Open-Source Reinforcement Learning Exploration Benchmark for GNSS-Denied Underground Environment [0.9] 地下地雷は自律型ロボットナビゲーションの極端な条件を示す。
GPSは拒否され、照明は劣化し、トンネルトポロジーはループに富んでいる。
オープンソースの MuJoCo ベンチマークである MineXplore を提示する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:59:40 GMT)
CADENCE: Predicting Realized MAPF Execution Time Beyond Sum of Costs [0.9] Multi-Agent Path Finding (MAPF)アルゴリズムは、産業倉庫やロボット共有ワークスペースにおけるロボットチームの動きを計画するために、ますます使われている。
しかし、SoC(Sum of Costs)やMakepan、プランナーランタイムといった標準的なMAPFアルゴリズム評価メトリクスは、プランナーの選択が現実的な実行パフォーマンスにどのように変換するかを曖昧にします。
CADENCEは、7つのディファレンシャルドライブロボットを用いた固定された7×7ワークセル上のこの評価ギャップに関するハードウェア研究である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:28:09 GMT)
Comment on "Possibility of superradiant neutrino emission by atomic condensate" by M. Blasone, L. Gastaldo and F. Romeo, Phys. Rev. D 113, 053010 (2026) [0.9] 分子中に2つのフェルミオンを配置することは、フェルミオン反共役子によるニュートリノ放出における干渉項のキャンセルを除去しない。
ニュートリノの超放射能放出に関する最近の提案は、超放射能ニュートリノ放出が根本的に不可能であるという我々の証明を回避できないことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:44:48 GMT)
SalsaAgent: A multimodal embodied language model for interactive dance generation [0.8] 本稿では、人間のリーダーに反応して、表現力のあるフルボディサルサダンスの動きを生成する言語モデルであるSalsaAgentを紹介する。
我々は、対話を非言語的な動きトークンパスとして定式化し、大きな言語モデルの語彙を拡張した。
コントリビューションには、フルボディおよびモーションリレーションのための新しいトークン、LLMファインチューニング、および2段階のトークン・ツー・ディフュージョンパイプラインが含まれる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:14:15 GMT)
ORACLE-CT: Anatomy-Aware Support Pooling for CT Classification [0.8] ORACLE-CTはエンコーダに依存しない解剖学的アグリゲーションフレームワークである。
単一組織、複数組織連合、比較、ローカライズ、グローバルサポート戦略をサポートしている。
ORACLE-CTは、予測と解剖学的証拠の間の監査可能なリンクを維持しながら、識別と外的堅牢性を改善する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:37:05 GMT)
Self-Reflective APIs: Structure Beats Verbosity for AI Agent Recovery [0.7] Self-reflective APIは、バリデーション失敗時に、マシン可読リカバリ_feedback.[]ペイロードを返す。
リーク監査されたパイロットでは、構造化された提案は、通常の英語診断に対するタスク補完率を+36.7$--$40.0$pp引き上げる。
再利用可能なCIインフラストラクチャとして、audit_prompt_leakage.pyを出荷しています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:02:11 GMT)
TIBlender: Early-Warning Threat Intelligence from Cross-Platform Social Media Evidence [0.7] TIBlenderは4つのプラットフォーム(X、Reddit、Telegram、Discord)を監視し、構造化された脅威レポートを生成するマルチエージェントシステムである。
現実の展開において、TIBlenderは、公開フィードより前の4つの脅威カテゴリすべてに出現する脅威を検出した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:14:55 GMT)
StrokeTimer: Robust Representation Learning for Ischemic Stroke Onset-Time Estimation from Non-contrast CT [0.7] StrokeTimerは、急性虚血性脳梗塞の発症時間推定のための完全に自動化されたフレームワークである。
発症時間は, 4.5h, 4.5-6h, >6hの3つの臨床関連窓に分類される。
StrokeTimerは0.69のマクロAUCと0.57のマクロF1スコアを達成し、最強のベースラインを50%近く改善した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:01:22 GMT)
SWE-InfraBench: Evaluating Language Models on Cloud Infrastructure Code [0.7] クラウドコンピューティングにおけるインフラストラクチャ・アズ・コード(IaC)の構築は重要な課題である。
当社のベンチマークでは、AWS CDKのような命令型ツールを使用して、企業開発で一般的なインクリメンタルなコード編集を反映しています。
SWE-InfraBenchは、数十の現実世界IaCから得られた多様な評価データセットである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:48:53 GMT)
Atom Interferometry with Transverse Optical Modes [0.7] 我々は超幾何ガウスビームのヘリカル位相巻線をラムゼー干渉計と弾道的に膨張するRb87原子のアンサンブルに用いる。
干渉計は、軌道角運動量や干渉計時間と線形にスケールする感度で、モータによって誘導される回転を測定することができることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:22:02 GMT)
Multimarginal flow matching with optimal transport potentials [0.6] フローマッチング(FM)は、2つの経験的分布間の動的トランスポートマップを学習するための強力なフレームワークとして登場した。
我々はFMと動的最適輸送(OT)の接続を利用した新しいアプローチでこの問題に取り組む。
学習フローの時間的ダイナミクスにかなりの柔軟性をもたらすマルチマルジナルFMの効率的でシミュレーション不要なアルゴリズムを導出する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:11:44 GMT)
SoftPINCH: EMG-Driven Soft Exoskeleton Assistance for Finger Flexion and Grasping [0.6] SoftPINCHは、指の親指屈曲とピンチグリップアシストのための、EMG駆動のソフトウェアラブルエクソスケルトンである。
このシステムは、腱駆動のソフトな外骨格、指先磁気接触センサー、および意図に基づく支援のための神経EMGデコーディングを組み合わせる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:59:27 GMT)
Continuous-variable ADAPT-VQE for bosonic lattice models [0.6] 連続可変可変可変可変量子固有解器(CV-ADAPT-VQE)を提案する。
ボース・ハッバードモデルとボソニック・キタエフ連鎖の基底状態準備について考察する。
この結果は、凝縮マター系の量子シミュレーション、量子化学、高エネルギー物理学の直接応用に向けられている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:08 GMT)
A New Quaternion-Joint Cable-Driven Redundant Manipulator Configuration and its Control Through FABRIK and Residual Reinforcement Learning [0.6] 四元同員は、以前の能力を超えて、ロボットアームのクラスに権限を与えている。
4分割8接合マニピュレータは,既存の構成よりも広い作業空間を実現できることを示す。
その結果, この構成は従来の設計よりもワークスペース効率が高いことがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:33:21 GMT)
q0: Primitives for Hyper-Epoch Pretraining [0.6] 単一のモデルの事前訓練は、計算予算が枯渇するずっと前に、数パス以内に飽和する。
ハイパーエポック事前学習(q0)を導入し,マルチエポック予算を多種多様なモデルに転換する。
我々は,q0が56エポック(4.6倍)または67エポック(3.8倍)の強い256エポックアンサンブルベースラインと一致することを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:07:12 GMT)
Federating Governance: How Community Rules Scale with Mastodon Instances [0.6] MastodonやBlueskyのような分散ソーシャルメディアプラットフォームは、自己統治とモデレーションのスケーリングという課題を強調している。
本研究では,様々なサイズのサーバ間でのコミュニティルールを解析し,Mastodonインスタンスによるモデレーションのスケールについて検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:29:45 GMT)
Tiny Collaborative Inference for Occlusion-Robust Object Detection [0.5] 検索と救助のためのエッジAIノードは、コンピュータビジョンをローカルで実行することがますます期待されている。
ウルトラローエンドハードウェアは、メモリ、計算、デバイス間通信に厳しい制約を課す。
本研究は、MCUバックボーン、YOLOv2検出ヘッド、Lite量子化を組み合わせることで、1MB未満の閉塞物検出装置に対処する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:50:50 GMT)
Stability vs. Manipulability: Evaluating Robustness Under Post-Decision Interaction in LLM Judges [0.5] 本研究では, 意思決定後の操作性について検討し, 審査員との会話を通じて評価結果が変更できる程度について検討した。
LLM審査員は、反復的かつ中立的な再評価の下で非常に安定しているが、目標決定後の課題下では、かなり可逆的になる。
これらの逆転は、人間の嗜好との合意を低下させ、ベンチマークのランクをシフトさせ、自己報告の信頼性が高いにもかかわらず有害な評価変更を発生させるという、実践的な結果をもたらす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:37:23 GMT)
Attention-Guided Autoencoder Fusion for Insulator Defect Detection Using UAV Transmission-Line Imaging [0.5] 本稿では,Attention-Guided AutoEncoder-Enhanced YOLOフレームワークであるAE-YOLOを提案する。
このアーキテクチャは、FPN-PAN(Feature Pyramid Network-Path Aggregation Network)のネックに軽量なボトルネックオートエンコーダを統合する。
Insulator-Defect Detectionデータセットの実験によると、効率的なNetV2バックボーンを持つAE-YOLOは0.5で95.10%のmAP、96.40%の精度、93.80%のリコールを達成した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:56:13 GMT)
Mamba-Assisted Non-Markovian Closure for Reduced-Order Modeling [0.5] 我々は、シーケンスモデリング問題としてクロージャモデリングを再放送する。
Mambaベースのシーケンスモデルは、解決された軌道からクロージャを予測するために訓練される。
数値積分器は、時間内に解決された変数を前進させるために用いられる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:18:50 GMT)
Output Type Before Quality: A Standards-Derived XAI Admissibility Rubric for Autonomous-Driving Safety [0.5] MLベースの自律運転の安全基準は、保証事例が含まなければならない証拠の種類を規定している(直接因果連鎖、定量化された介入効果、根因変数)。
しかし、XAI文献は出力型と技法系(相性マップ、特徴属性、反事実、因果グラフ、言語トレース)で整理されている。
私たちはこのミスマッチをエビデンスタイプのギャップと呼んでいます。
安全保証のためのXAI手法の選択は,メソッドの人気ではなく,ライフサイクル段階のエビデンス要求によって行うべきである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:37:52 GMT)
Consistency Training Can Entrench Misalignment [0.5] モデル生物108種を対象に, 整合性学習法を7種類試験した。
整合性トレーニングは、一般的に報酬のハッキングを抑え、創発的ミスアライメントをミスアライメントするが、梅毒症を増幅する。
本稿では, 整合性ラベリングプロセスによって誘導される分布変化が, 選択演算子の変動ではなく, 系統的アライメント効果の第一の要因であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:22:34 GMT)
Motion-Guided Causal Disentanglement for Robust Multi-View Cine Cardiac MRI Diagnosis [0.5] 本稿では,ViT-MAEバックボーン上に構築したMoViDフレームワークを提案する。
プライベートな臨床静脈血栓症データセットと2つの公開ベンチマークの枠組みについて検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:45:11 GMT)
HalfNet: Randomized Neural Networks with Learned Subspace Geometry [0.5] HalfNetは$N(0, )$からランダムウェイトを引いて、$$は分布の幾何学を定義する。
MNISTとCIFAR-10の実験は、ハーフネットが完全に訓練された多層パーセプトロンの性能と一致することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:19:00 GMT)
High-fidelity neutral atom gates leveraging low-rank Hessian optimization [0.4] 最適制御ゲートのためのHessian-based calibration法を開発し,ベンチマークする。
準安定状態171Yb核スピン量子ビット上の振幅ローバスト制御Zゲートにこのアプローチを適用する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:21:33 GMT)
Complexity of the Laughlin wave function from the Dyson-orbital perspective [0.4] フェルミ海は物理学においてシンプルで一般的な概念である。
ダイソン軌道はフェルミオン波動関数の複雑さを特徴づける貴重な道具を提供する。
ラウリン波動関数は強い相関を持つ非フェルミ液体状態を記述する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:55:04 GMT)
PJ-RoPE: A Fourier-Jet-Affine Position Space for Relative Attention [0.4] 我々は、RoPE のフーリエ位相、ヨルダン-RoPE の有限ジェット、および ALiBi のアフィン整流を単一の学習可能な相対配置空間に統一する。
制御されたプローブはセクター選択を検証し、小さな言語の実行はアフィイン/リカレンシ境界を公開する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:37:46 GMT)
A-Live: Passive Liveness Detection via Neuromuscular Micro-Motion Signatures on Commodity Sensors [0.4] Inertial Measurement Unit (IMU)信号のみで動作する受動生度検出フレームワークであるA-Liveについて述べる。
A-Liveの精度は99.5%を超え、誤認率や拒絶率も低い。
以上の結果から,神経筋マイクロモーションシグネチャは,新たなAI駆動型脅威モデルの下での生存度検出のスケーラブルで受動的基盤を提供することが示された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:30:30 GMT)
Fast Cubical Persistent Homology on 2D and 3D Images via Union-Find, Pruning, and Lookup Tables [0.3] Flash Cubicalは、$mathbbF$を超える2Dおよび3D画像のVフィルタ上の3次永続性の計算である。
本稿は、V-濾過立方体錯体の持続性に焦点をあてるが、基礎となるアイデアは、立方体錯体上のT-濾過に自然に一般化される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:26:52 GMT)
Learning Empirically Admissible Neural Heuristics for Combinatorial Search [0.3] 本稿では,検証校正可能なニューラルネットワークを学習するための一般化可能なフレームワークを提案する。
評価プロトコルの下では,我々の神経が観察された許容性違反を達成できないことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:27:46 GMT)
Tree-Based Formalization of Multi-Agent Complementarity in Human-AI Interactions [0.3] 相補性(complementarity)は、人間とAIのインタラクションが、メンバー間で利用できる最高の予測ベンチマークを上回っている場合である。
既存のフレームワークは、エージェントの予測がどのようにワークフローに敏感なマルチエージェントプロトコルを構成するかをモデル化していない。
複数エージェントHAIにおける相補性のツリーベース形式化を導入することで、このギャップを埋める。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:02:19 GMT)
Anomaly Detection for Electro-Hydrostatic Actuators using LSTM Autoencoder [0.3] 本研究では、制御されたテストベンチから収集した温度と圧力データに着目し、EHAセンサ信号のオフライン異常検出フレームワークを提案する。
本手法では, 復元型Long Short-Term Memory(LSTM)オートエンコーダを用いて, 検証セットの復元エラー分布を用いて校正・評価を行う。
LSTMオートエンコーダの平均精度は99.0%、精度は100%、リコールは90.2%から99.6%、F1スコアは93.1%から99.8%に向上し、高い検出感度と非常に低い偽値を示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:37:21 GMT)
Evidence-Guided Neural Architecture Selection under Uncertainty for Subject-Specific Blood Glucose Forecasting [0.3] 本稿では,ベイジアントレーニング,エビデンスに基づくランキング,不確実性の下でのタスク固有の検証を統合したアーキテクチャ選択のためのフレームワークEVIDENTを提案する。
本手法は1型糖尿病患者の個別血糖予測に時間的畳み込みネットワーク(TCN)を用いた。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:20:11 GMT)
Large AI Models in Dental Healthcare: From General-Purpose Systems to Domain-Specific Foundation Models [0.3] 口腔疾患は世界中で約35億人に影響を及ぼすが、歯科医療における大規模AIモデルの臨床的ポテンシャルはいまだによく分かっていない。
言語生成モデル、識別的視覚基盤モデル、歯科固有のモデルである。
汎用モデルと歯科固有のモデルが相補的な役割を果たす。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:01:03 GMT)
STMutants: A Mutation Testing Dataset for Structured Text Programs in Industrial Automation [0.3] IEC 61131-3 構造化テキスト (Structured Text, ST) プログラムは、まだ公開されているベンチマークを欠いている。
STMutantsは,産業用自動化ソフトウェアのための突然変異試験データセットである。
STプログラムで最初に公開された突然変異ベンチマークを提供することで、STMutantsは再現可能な研究、突然変異解析、障害ローカライゼーション、PLCソフトウェアのAI支援品質保証を可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:47:54 GMT)
REStack: A Large-Scale Dataset of Reverse Engineering Discussions from Stack Exchange [0.3] リバースエンジニアリング(RE)はソフトウェアエンジニアリングとサイバーセキュリティにおいて重要な活動であり、マルウェア分析、脆弱性発見、レガシーシステムのメンテナンス、ファームウェア検査などのタスクをサポートする。
公開データセットが開発者Q&AフォーラムからREの議論を体系的に取得したことはない。
私たちは、Stack Overflowと専用のReverse Engineering Stack Exchangeサイトから収集された大規模なREディスカッションデータセットであるREStackを紹介します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:34:15 GMT)
MASF: A Multi-Model Adaptive Selection Framework for Abstractive Text summarization [0.3] 本稿では,抽象的テキスト要約の堅牢性と品質を向上させるために,多モデル適応要約フレームワークを提案する。
複数の微調整変換器に基づく要約モデルを統合し、適応的な選択機構を導入する。
BERTScoreのスコアは88.63%であり、全ての比較手法の中で最高である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:34:40 GMT)
On Out-of-sample Embedding in UMAP [0.3] 隣接埋め込みアルゴリズムは、低次元空間における等価グラフ表現を構築することにより、高次元データの相関関係を明らかにする。
元のk-アネレス近傍グラフ内のペア相互作用を最適化することで、「反発効果」を克服する方法を示す。
また、パラメータ化されたUDPを用いてデータを埋め込むと、反発効果が自然に軽減されることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:54:45 GMT)
Uncertainty Aware Functional Behavior Prediction and Material Fatigue Assessment for Circular Factory [0.3] 将来の機能フルフィルメントとコンポーネントの整合性は次のサービスシナリオで異なる進化を遂げる可能性があるため、現在の検査だけで再利用は決定できない。
既存のPHMアプローチは劣化予測をサポートするが、しばしば固定された動作条件や孤立したコンポーネントベンチマークをターゲットにしている。
本稿では、不確実性を考慮した機能予測と、インスタンス固有の信頼性ワークフローにおけるコンポーネントレベルの疲労評価を組み合わせることで、このギャップに対処する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:23:30 GMT)
Revisiting Vul-RAG: Reproducibility and Replicability of RAG-based Vulnerability Detection with Open-Weight Models [0.3] 本稿では,ソースコード脆弱性検出のフレームワークであるVul-RAGについて述べる。
結果より,Vul-RAGは局所的な展開では再現可能であるが,軽微な偏差は認められなかった。
本稿では,検出効率,モデル能力,モデルスケール間の実践的意味とトレードオフについて論じる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:20:37 GMT)
When Firms Learn to Game the Rules [0.3] ルール・アズ・コード(ルール・アズ・コード)は、より検証可能な法的義務を約束するが、規制当局が学べるものも変更する。
計算可能な強制信号の近接から法定しきい値付近の実際の行為を分離する,合成エージェントに基づく強化学習シミュレーションとのギャップについて検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:53:36 GMT)
Spatially Grounded Concept Bottleneck Models via Part-Factorized Attention [0.3] 概念ボトルネックモデル(CBM)は、クラスを予測する前に、人名属性の層を予測する。
この研究は、その自由を建設によって取り除く部分分解型CBMの研究である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:28:42 GMT)
Severity-Aware Curriculum Learning with Multi-Model Response Selection for Medical Text Generation [0.3] 既存の大きな言語モデルは、様々なケースの重大さのレベルにまたがって、一貫性があり、文脈的に適切な医療応答を提供するのに苦労することが多い。
本稿では,カリキュラム学習戦略と関連性に基づく応答選択を統合した重大度対応型マルチモデルフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:28:34 GMT)
A universal and efficient hybrid digital-analog fermionic quantum simulator [0.2] フェルミオン型超低温原子プラットフォームを用いた量子シミュレーションのための普遍的なフレームワークを提案する。
既存のハードウェア上の変分アルゴリズムが、ハードウェアのネイティブなハミルトニアンよりはるかに多くのボディシステムをシミュレートできることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:44:45 GMT)
The Double Well Done Doubly-Well [0.2] 対称二重井戸ポテンシャルは、摂動物理学と非摂動物理学が深く絡み合っている最も単純な量子力学系の1つである。
復活は2つの特徴を結びつけることで、正確なスペクトルを厳密に拘束されたトランスシリーズにまとめる。
本稿では、この2つの相補的アプローチから、このトランスシリーズを自己完結した説明を与える。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:01 GMT)
SANE Schema-aware Natural-language Evaluation of Biological Data [0.1] ドメイン固有のテキスト言語評価のための新しいパラダイムであるSANE-Aware Natural Evaluationを提案する。
構造化されたプロンプトとガードレールを持つ制約付きスキーマでは、モデルのトレーニングや微調整なしに正確なクエリ生成が達成可能であることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:31:28 GMT)
MIRAI: Prediction and Generation of High-Impact Academic Research [0.1] MIRAI(Multi-year Inference of Research Trends and Academic Impact)は,論文のタイトル,要約,出版日のみを用いて,紙の影響を予測するディープラーニングフレームワークである。
5年間のPageRankと引用数を予測するために、arXivの学術グラフでMIRAIをトレーニングし、PageRankの予測でSpearmanの0.4686ドルを達成した。
我々は、MIRAI上に構築された研究アイデアパイプラインを提案し、高いインパクトに向けた研究アイデアを創出する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:06:01 GMT)
Crossover from Rabi oscillations to adiabatic population switching in the Faraday optical control of quantum dot spins [0.1] ファラデー幾何学におけるラマン遷移は、単一ショットキュービットの読み出しとキュービットの同時制御を可能にする。
不等復調を伴う両遷移の同時駆動のため、結果として時間依存のスタークシフトは、従来の画像以外の共鳴条件を生じさせる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:00:08 GMT)
ChessMimic: Per-Rating Transformer Models for Human Move, Clock, and Outcome Prediction in Online Blitz Chess [0.1] ChessMimicは、移動、思考時間、結果予測のための3つのエンコーダのみのトランスフォーマーのシステムである。
Lichess Rated Blitzのゲームでは、ChessMimicの人間の動き予測精度はEloの各バンドでMaia-2を上回っている。
公開デモは1e4.aiで、コード、バンド単位の重み付け、C++データフィルタパイプラインコードをGitHubでリリースしています。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:42:39 GMT)
memorywire: A Vendor-Neutral Wire Format for Agent Memory Operations [0.0] 長期的なストレージに入る前に、人間がレビューを書くことができるフレームワークであるMemorywireを紹介します。
5つのバックエンドコンポーネントによるオープンソースリファレンス実装について説明する。
16-scenario cross-adapter conformance suiteは、80細胞中68細胞を無故障で通過する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:59:47 GMT)
XSSR: Cross-Domain Self-Supervised Representative Selection for Efficient Annotation in Medical Image Segmentation [0.0] XSSR (Cross-Domain Self-Supervised Representative Selection) は、ターゲットドメインにおけるアノテーションの労力を最小限に抑えるために設計されたフレームワークである。
XSSRは3つの段階から構成される: まず、Masked Autoencoder (MAE) がラベルのないソースデータに基づいてトレーニングされ、共有埋め込みスペースを確立する。
我々は,胸部X線,RIGA+網膜基底像,多部位前立腺MRIの3つの公開ベンチマークでXSSRを評価した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:09:35 GMT)
Worker Utility as Hysteresis: A Preisach Model of Transaction Acceptance in Gig Labour Markets [0.0] 各ギグトランザクションは単一のビットを生成する。
この構造は、潜伏労働者選好の自然な表現として、Preisachモデルを直接指していると論じる。
明示的な差分ゾーンを持たないモデルでは、両方の動作を同時に実行することはできない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:12:03 GMT)
What neurosurgeons need to see: synthetic intra-operative MRI from ultrasound for brain-shift compensation in brain tumour surgery [0.0] 本稿では,術前画像領域における新しい脳内MRIボリュームを生成するエンド・ツー・エンドパイプラインを提案する。
専門家のランドマークが215名ある14名の被験者において、合成アンコールされた登録は平均目標登録誤差を減らした。
これにより、手術領域のMRIライクな更新が提供され、手術ナビゲーションに統合される可能性がある。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:17:47 GMT)
What Can Verifiable Decapsulation Tests Certify? Pass Bounds and Fault-Recognition Limits for FO-Based KEMs [0.0] 藤崎・岡本脱カプセル化のブラックボックス試験では, ハーネスが観察した検体を観察した。
本報告では, 信頼度向上型KEM変種について, 誠実な参照手法を用いて検討する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:46:17 GMT)
Variational low-energy subspaces for chemically accurate excited states [0.0] 変動励起状態最適化は、電子ハミルトニアンの低エネルギー部分空間に対する反復基底状態様問題として再構成可能であることを示す。
この変動原理を非直交スレーター行列式に適用すると、状態数と状態毎の行列式によってのみ制御される励起状態計算の自動手法であるEXIDOSが得られる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:52:13 GMT)
Trust, but Don't Verify: Epistemic Blind Spots in LLM Source Evaluation [0.0] モデルが生成した統計量を検出する能力を持っているが、マルチソース合成においてこの能力を採用していないことを示す。
具体的には、ソースの影響は、解析テキストの分布レジスタに応答するが、数値の有効性には反応しない方法論登録ゲートによって制御される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:15:48 GMT)
Trivium: Temporal Regret as a First-Class Objective for Causal-Memory Controllers [0.0] これは構造的な問題であり、単にモデルキャパシティの問題ではないと我々は主張する。
作業因果モデルに対する結果後悔と認識後悔とを併せ持つ一級目的として,長期的時間的後悔を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:06:20 GMT)
Trajectory Dynamics in Language Model Hidden States Predict Human Processing Costs Beyond Surprisal [0.0] 本稿では,単語レベルの予測誤差(副次的)と展開解釈の局所運動量に対する感度(軌道外挿誤差)が処理コストの解離可能な成分であることを示す。
この効果は特に庭道の文で顕著である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:44:41 GMT)
Trading Engagement for Sustainability: Carbon-Aware Re-ranking for E-commerce Recommendations [0.0] 我々は,ほとんどの項目においてPCFラベルが欠落しており,推測されなければならない現実的な環境で,炭素対応製品レコメンデーションについて検討する。
まず,Carbon Catalogueからの監督を伝達するPCF推定パイプラインを用いて,製品レベルの炭素フットプリントを推定する。
次に、3つの確立された推奨モデルから得られた妥当性スコアに基づいて、炭素を意識したポストホック戦略を適用した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:34:46 GMT)
Towards Persistent Case-Based Memory for Autonomous Data Science: A CBR-Augmented R&D-Agent with a Locally Deployable Small Language Model [0.0] 我々は, Gemma 4 31B Dense のカスタムバックエンドに CBR レイヤを Microsoft の R&D-Agent フレームワークに統合した CBR 拡張 R&D-Agent を提案する。
ケースは構造化レコードとして格納され、実行可能なコードスナップショットと品質メタデータが格納される。
108回の検索イベントにおけるヒューリスティックな再利用検出は,意味的関連性が高いことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:56:11 GMT)
TopoPult-SSL: Gland-Mask-Free Cross-Device Meibomian Gland Segmentation via Self-Distilled Weak Clinical Priors [0.0] そこで我々はTopotPul-SSLについて紹介する。
公開MGD-1kからCAMG研究ベンチマーク上で,その手法の開発と評価を行った。
腺マスクのないStage-1変異体はSAM/MedSAMのPrecision94 vs. 0.30-0.34に達する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:47:54 GMT)
The Usefulness Gap in Proof-of-Useful-Work: An Empirical Study of Pearl's cuPOW Protocol [0.0] Layer-1ブロックチェーンのPearlは、Proof-of-Useful-Work(PoUW)プロトコルを、ネットワークを同時に保護し、AI推論を実行するために販売している。
そこで本研究では,Pearlの24EH/sネットワークが有用なAI計算をゼロにすることを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:42:29 GMT)
The Security Budget of Code LLMs: An Information-Theoretic Capacity-Security Bound [0.0] 本稿では,機能容量$Cap=rmI(c*;c_)$と摂動保持$$Sec=rmI(c_;tilde c_)$のコードLLMに対する情報理論トレードオフについて検討する。
for $pto c_$ with perturbed prompt $tilde p$, we prove $Cap+Secle rmH(c*)+rmI(p;tilde p)$。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:30:25 GMT)
The Illusion of Opting in AI-Mediated Consequential Decisions [0.0] 我々は、現在のAIシステムは、既存のAI倫理が完全に捉えられていない深い倫理的問題を提起していることを示す。
AIシステムは、オプトインの錯覚からメタ能力を保護し、育成するかどうかによって評価されるべきである、と我々は主張する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:35:21 GMT)
The Digital Apprentice: A Framework for Human-Directed Agentic AI Development [0.0] 我々は,自律性を前提とせず,スケーラブルで安全なAIエージェンシーのためのフレームワークを提案する。
デジタル・アレンティス(Digital Apprentice)は、人間の暗黙の方法論を内包する発達学習者である。
我々は,データドリフトを捕捉し,実行時に異なる手法を適用することによって,トラフィックシフト時の品質の劣化を回復する方法を示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:49:13 GMT)
Synthetic Personalities: How Well Can LLMs Mimic Individual Respondents Using Socio-Economic Microdata? [0.0] 我々はドイツ社会経済パネルから詳細な個別レベルの双子を構築した。
建設工法グリッドの3倍の5倍の2倍の2倍の3倍の評価を行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:30:03 GMT)
Subspace-selective unitary manipulation based on the Hilbert-space symmetric structures in the multiple-quantum operator algebra spaces in the quantum-computing speedup theory [0.0] 量子計算スピードアップ理論(quantum-Computing speedup theory)は、量子系の対称構造と性質を、QCS(Quantum-Computing-Speedup)の基本的な資源とみなす。
今日では、量子コンピューティングとシミュレーションをスピードアップするために、基本的なQCSリソースをどのように活用するかが大きな問題となっている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:32:13 GMT)
Squeezed Phonon Lasing via Floquet-Controlled Solid-State Defects [0.0] フロケットエンジニアリングは、制御された4次スキューズを実現しつつ、フェーズロックされたラシングを実現することができる。
その結果,固体プラットフォームにおける励起フォノンレーザーの発生に関する新たな知見が得られた。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:40:13 GMT)
Spectral Fusion for Identifying Early State Exclusion in Symmetric Quantum Spin Chains [0.0] 我々は、中絶現象(ESE)について検討する。
ESE となしの PST を示すハミルトニアンの以前の構成に基づいて、任意の奇長鎖に対して明示的なヤコビ行列実現を提供する。
我々は、そのようなハミルトンの無限族を構築するために、遠近法融合(SF)のプロセスを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:12:00 GMT)
Soliton-antisoliton pairs in the supersymmetric gapped phase of an interacting Majorana chain [0.0] 従来の三臨界点におけるSUSY診断はイジング側ですぐに分岐するが、ギャップ付き位相では連続的に0に崩壊する。
励起はソリトン-アンチソリトン対からなり、異なる順序領域が分離される。
このディラックモードの占有は、偶数と奇数のフェルミオンパリティを持つ固有状態を区別する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:57:38 GMT)
SoK: Post-Quantum Cryptography (PQC) Implementation in Software Systems [0.0] ポスト量子暗号(PQC)は、ソフトウェアシステムが出現する量子可能な脅威から保護するために不可欠である。
このSoKは、人間、組織、技術(HOT)の次元を通じて、PQCの実装アプローチと課題を調査する。
本稿では,HOT次元間の相互作用がソフトウェアにおけるPQC実装にどのように影響するかを説明する概念的フレームワークであるPQC-HOTモデルを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:48:29 GMT)
Shortcomings and capacities of real-constrained neural networks in complex spaces [0.0] 複雑な仮説クラスにおいて、実際の事前アクティベーションを行う際の記憶容量の比を求める。
我々の証明は、文献において非標準であるハリシュ・チャンドラ・イツィクソン・ズーバー公式(HCIZ)の適用に依存している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:11:03 GMT)
Selective-Advantage Entropy-Adaptive Horizon GRPO: Asymmetric Token-Level Discounting for Efficient Reinforcement Learning of Language Models [0.0] グループ相対政策最適化は、推論タスク上で言語モデルを整合させる効果的な強化学習アルゴリズムとして登場した。
本稿では,Adaptive-Horizon GRPOとSelective-Advantage AH-GRPOの2つの補完拡張を導入する。
解析の結果、非対称割引は正しい解の完全な勾配信号を保持し、エントロピー崩壊を防止し、トレーニングを著しく安定化させることがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:57:57 GMT)
Selection-Aware Diagnostics for Chain-of-Thought Answer Hijacking [0.0] チェーン・オブ・ソート(CoT)応答ハイジャックのための制御された数値プロキシについて検討した。
Across Qwen2.5-7B and Llama3-8B on GSM8K few-shot, puzzle, and sycophant hijacks, three few-shot/puzzle cells pass confirmedatory $K=1$ localization。
選択対応50/50バンドバリデーションは、Qwen-puzzleの+32.6、+45.1、+17.7の帯域外ギャップを保留する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:49:43 GMT)
Scalable Uncertainty Quantification for Extreme Weather Forecasting via Empirical Neural Tangent Kernels [0.0] ディープラーニングの天気モデルでは、数値的な天気予報の精度が向上し、桁違いの精度が向上した。
しかし、不確実性予測のない決定論的予測は、極度の気象イベントにおける高い意思決定に重要なギャップである。
本稿では,最後の層的経験的特徴を用いたニューラル・タンジェント・カーネルに基づく不確実性定量化(NTK-UQ)を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:56:35 GMT)
SHIELDS: Automating OS Hardening with Iterative Multi-Agent Remediation [0.0] 大規模言語モデル(LLM)を用いて,OSのハードニングを反復的フィードバック駆動プロセスとしてアプローチするマルチエージェントシステムShielDSを紹介する。
我々は,20Bから400Bパラメータの6つの現代のLCMを用いて,複数の仮想マシン構成にまたがるシステム評価を行い,ShiELDSがスキャン結果の最大73%を再現できることを確認した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:54:43 GMT)
RowNet: A Memory Transformer for Tabular Regression [0.0] 本稿では,面積当たりの不動産価格予測のための検索型ニューラルネットワークRowNetを提案する。
RowNetは、ラベル付きプロパティのメモリバンクに対してペアワイズに類似した機能を通じて、クエリプロパティを表現する。
第2のレイヤは、ターゲット整合性機能とのメモリ比較を強化し、複数の学習されたアテンションヘッドを使用して、補完的な同等のセットを検索する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:47:38 GMT)
Reconstructing Unobservable Temperature Fields via Simulation-Aided Intelligent Sensing [0.0] 本稿では, ランダム化物理シミュレーションに基づく産業応用のためのデータセット生成手法を提案する。
このような合成データセットのみに基づいてトレーニングされたニューラルネットワーク(NN)を用いて、ハードウェアに埋め込まれたスパースセンサーから内部温度場を再構築する。
NNベースの再構築は、Krigingを堅牢性で上回るだけでなく、リアルタイムな推論を可能にし、他の観測不可能な熱状態のオンラインモニタリングに適している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:16:33 GMT)
Reconciliation of effective Hamiltonians for intense light-matter interaction [0.0] 正準有効ハミルトニアンは、断熱除去、マルコフ近似、極近似から等しく得られる。
準退化Rayleigh-Schrdinger理論(QD-RSPT)を適用することにより、この制限にどのように対処できるかを示す。
QD-RSPTの精度は低周波と高周波の両方で示され、Floquet計算と高い強度でよく一致している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 13:04:46 GMT)
Realistic quantum device data synthesized by consumer AI and how to identify it [0.0] 生成AIのあまり知られていない能力は、数値データの基本的な分析、処理、合成を行うことである。
このことは、専門家が科学的に意味のあると考える実験データを模倣するためにAIが使えるかどうかという疑問を提起する。
本稿では,量子電子デバイス上で頻繁に行われるよく知られた実験にインスパイアされたデータの合成に焦点をあてる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:52:57 GMT)
Real-Time Industrial Defect Detection on Edge Hardware Using Fine-Tuned YOLOv8: A Systematic Benchmark on the NEU Surface Defect Database and MVTec AD with Automotive & Battery Manufacturing Extensions [0.0] 産業用YOLOは、リアルタイムな産業用欠陥検出のための細調整のYOLOv8アーキテクチャ上に構築されたエッジ最適化フレームワークである。
提案するフレームワークは,アクティブな自動車組立ラインに直接配置した場合に,高度に堅牢でゼロ速度性能を示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:39:16 GMT)
Real-Time Automatic License Plate Recognition Using YOLOv8, SORT Tracking, and Temporal Data Interpolation [0.0] 本研究は,自動ナンバープレート認識のための5段階のエンドツーエンドアルゴリズムパイプラインを提案する。
提案されたアーキテクチャは、車両をローカライズするための非常に強力なYOLOv8ナノモデルを活用する。
さらに重要なのは、時間境界ボックスのオフラインメカニズムが、断片化されたパスを再キャストするために開始されることだ。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:05:18 GMT)
Radiomic Feature Selection Using Gradient Loss of Deep Neural Network for Lung Cancer Stage Detection [0.0] 本研究では、ディープニューラルネットワークから勾配感度解析を統合するグラディエント・ロス再帰的特徴除去フレームワークを提案する。
胸部CT検査では, 3DスライダのPyRadiomics拡張法を用いて, 合計106個の放射線像を抽出した。
提案したフレームワークは、90.22%の精度、90.10%の精度、90.24%のリコール、テストデータセットでのF1スコア90.16%の強い分類性能を達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:56:06 GMT)
RAMPART: Registry-based Agentic Memory with Priority-Aware Runtime Transformation [0.0] RAMPARTはコンパイル時のメモリモデルであり、LLMベースのエージェントのための純粋なRAMブロックレジストリである。
5つの構成可能なプリミティブが名前付きアドレス可能なブロックに作用する。
Qwen3-8B Q4で制御されたプローブは、コンパイル時の配置とブロックとタスククエリの構造的関係がタスクの成功に影響を与えることを示している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:01:46 GMT)
Quantification of Entanglement in Three-Qubit Systems [0.0] 本研究では,Acn標準表現による3ビット純状態の絡み合いについて検討する。
我々は、システム内の様々な分割の一般化されたコンカレンスから導かれる大域的コンカレンス尺度を用いる。
この結果は、3量子ビット量子系における絡み合いの構造と分布を解明する上で、この尺度の重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:59:55 GMT)
Pushing the Classical Frontier of 1D Fermi-Hubbard Quench Dynamics Beyond Current Quantum Simulations [0.0] Q-CTRLチームは最近、IBMプロセッサ上の1次元Fermi-Hubbardモデルのクエンチダイナミクスをシミュレートした。
我々は、Fermi-Hubbard Hamiltonian のフル$mathrmU(1)timesmathrmSU(2)$対称性と、GPU加速テンソル収縮を併用したフル$mathrmU(1)timesmathrmSU(2)を利用する。
シミュレーションウィンドウ全体にわたって完全に収束した結果を達成し、未解決の高絡み状態の厳密な認証を含む。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:52:47 GMT)
Provably Auditable and Safe LLM Agents from Human-Authored Ontologies [0.0] 線形監査性を必要とする非自明な問題領域での使用を目的とした,LLMエージェントアーキテクチャであるAgentic Reduxを紹介する。
適切なドメイン上で実行すると、Agentic Reduxの実行はセマンティックに正しいことが保証され、すべての決定は追加専用台帳に記録される。
医療請求書の遵守とセキュリティ脆弱性の開示の2つのプロダクショングレードの適切なドメインを提示する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:01:33 GMT)
Protecting Quantum States via the Super-Zeno Effect and Anticoherence [0.0] スピン反コヒーレント部分空間と組み合わせて量子超ゼノ効果を用いることは、スピンをノイズから保護するのに非常に効果的であることを示す。
提案されたプロトコルは、量子超ゼノ効果を用いて準空間に状態を閉じ込め、その内部の進化を凍結するために反コヒーレンスを利用する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:04:11 GMT)
Policy-Conditioned Counterfactual Credit for Verifiable Reinforcement Learning of Long-Horizon Language Agents [0.0] 検証可能な報酬による強化学習は推論とツールの使用を改善するが、長期の言語エージェントは依然として、証拠連鎖と信念の漂流を学習する。
本稿では, 厳密な検証可能な報酬, 介入正当性ゲーティング, および政策条件付き対実的貢献(PCCC)推定器を用いた制約付きポリシー勾配アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:19:36 GMT)
Polalrized reservoirs in dynamics of polariton condensation [0.0] 凝縮結合に対する貯水池の偏極不変理論はスピン密度行列形式を用いて定式化される。
貯留層が平面内線形分極に対応するストークスベクトルの非零成分を持つ場合、既存の理論が崩壊することを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:32:31 GMT)
Photoelectron spectroscopy with a resonant dichromatic field: Role of geometric phase [0.0] 共振駆動された2レベル原子がほぼ縮退した二色レーザーパルスに曝露した際の幾何学的位相制御について検討した。
Autler-Townes doubletsの形成は破壊的干渉の観点から解釈できることを示す。
この結果から,超高速光物質相互作用における工学的幾何学的位相干渉への経路としてビーティング・フィールド制御が確立された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:22:18 GMT)
Phase transitions for the noisy transformer model in arbitrary dimension [0.0] 雑音変換器の非正規化自己アテンション(USA)モデルに付随する単位球上のマッキーン-ブラソフ自由エネルギーについて検討する。
我々は、すべての次元が$dge2$で、鋭い大域最小化二分法を証明した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:49:43 GMT)
Pattern Selectivity is Not Task-Causal Structure: A Cross-Architecture Mechanistic Study of Composed-Task Circuits in 1B-Class Language Models [0.0] 一致したランダムなヌルをセル毎に10個のシードでサンプリングした統一プロトコルを実行します。
結果として生じる12個の細胞(タスク、モデル)は、同じ一次因果スクリーンを同じ効果サイズで共有する2つの細胞を含まない。
パネル内のMoEモデルは、基礎となる先進的な位置決め基板の上に合成タスク回路を構築する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:27:07 GMT)
OpenAgenet/OAN: Technical Architecture for Trust-Governed Agent Identity and Discovery [0.0] 本稿では,OpenAgenet/OANの技術アーキテクチャについて述べる。
OANは、オープンエージェント相互接続のためのプロトコル中立層である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:53:20 GMT)
OpenAgenet/OAN: Open Infrastructure for Trusted Agent Interconnection [0.0] OpenAgenet(略してOAN)は、信頼できる相互接続エージェントのためのオープンインフラストラクチャプロジェクトである。
Agentsが分離されたアプリケーションからオープンなマルチオペレータネットワークに移行すると、その問題に対処する。
OANはプロトコルニュートラルな信頼層として設計されている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:56:26 GMT)
Oklch+: A Three-Parameter Extension of Oklab for Improved Color Difference Prediction [0.0] Oklch+ は Oklab の3パラメータ拡張であり、ユークリッド距離は変換された Oklab 座標で計算される。
COMBVD -- 3,813 独立データセットにまたがる色差ペアの評価。
ホールドアウトされたBFD-P D65サブセット上のクロスバリデーションは、一般化(STRESS = 26.14)を確認し、Oklch+はOklab (51.45)を大幅に上回り、ホールドアウトセット上でCIEDE2000 (24.12)に匹敵するSTRESSを達成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:43:24 GMT)
Neural Galerkin Normalizing Flows for Bayesian Inference of Diffusions with Inaccessible Boundaries [0.0] 2つの観測時間間の拡散過程の遷移密度関数を学習するための新しい正規化フローアーキテクチャを提案する。
具体的には,特定の到達不能領域で拡散行列が消滅する過程に着目する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:52:26 GMT)
Neetyabhas: A Framework for Uncertainty-Aware Public Policy Optimization in Rational Agent-Based Models [0.0] 既存の研究はしばしば個人の行動を無視し、完全な感染追跡と欠陥のない政策実行を誤って想定している。
本稿では,疫病対策(感染・病院化)と政策実施の両面での不確実性を考慮した統合的アプローチを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:51:54 GMT)
Multi-Column RBF Neural Network Using Adaptive and Non-Adaptive Particle Swarm Optimization [0.0] 降下勾配でトレーニングされた放射基底関数ニューラルネットワーク(RBFN)は、浅いネットワークと深いネットワークの両方で効果的に完全に接続された構造を提供する。
最先端の勾配に基づくトレーニング手法であるErrCorは、最適な隠れユニットを選択して精度を向上させる。
人口ベースアルゴリズムであるPSOは、RBFNパラメータを最適化するためにSwarmエクスペリエンスを使用し、グローバル検索とローカルミニマを提供する。
PSOを用いたマルチカラムRBFNとAPSOを用いたマルチカラムRBFNの2つの新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:53:48 GMT)
Measuring Entanglement in Qubit System [0.0] バランスの取れた2パス干渉計における絡み合いを計測する操作方法を示す。
この分析は、経路、内部クビット自由度、および内部自由度に絡み合ったいくつかの補助状態を含む三部構成の記述に基づいている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:15:00 GMT)
Mean-based algorithms: A lower bound and regret [0.0] 平均に基づくアルゴリズムは、平均的な報酬が低いアクションに低い確率を割り当てる。
時間的地平線が不明で,帯域幅フィードバックのみが利用可能である場合,平均に基づくアルゴリズムについて検討する。
実験によると、平均ベースのアルゴリズムはわずかに遅いが、他の帯域幅フィードバックアルゴリズムと競合する可能性がある。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:23:41 GMT)
Literature-Guided Minimax Optimization of Virtual Epilepsy Neurostimulation [0.0] 本稿では,大規模仮説抽出,仮想脳(TVB)エピレプタシミュレーション,大規模言語モデル誘導ブラックボックス最適化を併用した文献誘導型ミニマックスパイプラインを提案する。
この研究は、臨床証拠としてではなく、堅牢で文学的に認識された神経刺激設計のための、シリコの概念実証として解釈されるべきである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:40:34 GMT)
LightVesselNet: An Ultra-Lightweight Sub-100K Parameter Network for Retinal Blood Vessel Segmentation [0.0] LightVesselNetは、リソース制約のある環境で網膜血管のセグメンテーションのために設計された効率的なニューラルネットワークである。
LightVesselNetは、State-of-the-Artモデルと比較して効率(パフォーマンス対Flops)が改善されている。
低リソースな臨床環境とモバイルスクリーニングツールへのデプロイの有力候補である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:56:13 GMT)
Leggett-Garg test inequality with spin and flavour neutrino oscillations in a constant magnetic field [0.0] Leggett-Garg inequality (LGI) は、異なる時間で観測可能な1つの測定値の相関関係を含むベルの不等式(ベル不等式)の類似体である。
本研究では, ニュートリノフレーバー(_Lleftrightarrow_L$)とスピン発振の文脈における, 一定の横磁場の存在下での意味について検討する。
強磁場を持つ系では、両方の場合において、LGIが違反する長さ領域$L$が存在し、相関関数$K_3$と$K_によって定量化される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:42:32 GMT)
Learning Control-Affine Reduced-Order Models via Autoencoders [0.0] 制御-アフィン還元次モデル(ROM)の同定のためのフレームワークを提案する。
提案手法は, オートエンコーダ(AE)を用いて高次元状態, 潜在的に高次元入力を制御-アフィン状態空間力学に適した遅延値に変換する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:05:41 GMT)
Learning Contact Representation for Leg Odometry [0.0] 脚付きロボットにおける接触検出のための自己教師付き表現学習フレームワークを提案する。
学習した表現を用いて、確率論的にスタンスとスイングフェーズをモデル化する。
本フレームワークは,教師付き手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:50:45 GMT)
LDARNet: DNA Adaptive Representation Network with Learnable Tokenization for Genomic Modeling [0.0] 本稿では,H-Netスタイルの動的チャンキングを自己回帰生成からマスク付き言語モデリングに適応させる階層的ゲノム基盤モデルLDARNetを提案する。
LDARNetは、Nucleotide TransformerとGenomic Benchmarksスイートから27のタスクを微調整し、コンパクトモデルと5つのヒストン修正タスクの最先端結果の間で11/18の勝利を達成した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:38:17 GMT)
LCSHBench: A Multilingual, Consensus-Grounded Benchmark for Library of Congress Subject Heading Assignment [0.0] LCSHBench: 22,346冊の書籍を、オープンライセンスのハーバード、コロンビア、プリンストンカタログから15言語で紹介します。
レコードは、少なくとも2つの独立したカタログ局がLCSHを割り当てた場合にのみ登録される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 02:58:11 GMT)
Krylov complexity has it all [0.0] この論文は、クリロフ複雑性が量子作用素の力学に関する全情報を含んでいることを証明している。
量子系における作用素進化の完全なキャラクタリゼーションとしてクリロフ複雑性を用いるための「原理の証明」を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:29:35 GMT)
Isospectrality and Operator Complexity [0.0] 一対の正確に解けるアイソスペクトルフェルミオン鎖、一つは強く相互作用し、もう一つは二次鎖である。
同一のスペクトルにもかかわらず、2つのモデルは異なる位相と演算子複雑性の概念を鮮明に実現している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:05 GMT)
Inverse Manipulation through Symbolic Planning and Residual Operator Learning [0.0] ロボットタスクを反転させるには、象徴的な状態遷移を反転させたり、モーター軌道を巻き戻す以上のことが必要である。
STRIPSライクな演算子から逆スキル目的を導出する逆操作のためのハイブリッドフレームワークを提案する。
以上の結果から,述語由来の残差制御は,近似記号の逆を物理的に基礎を成す逆スキルに変換することができることがわかった。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:18:09 GMT)
Hyperparameter Learning for Latent Factorization of Tensors for Representation Learning to Large-scale Dynamic Weighted Directed Network [0.0] 大規模動的重み付き指向ネットワーク(DWDN)は、ノード間の時間変化の相互作用をモデル化するために広く利用されている。
テンソルの潜在因子化(LFT)は低ランク埋め込みによりDWDNから目標知識を抽出する。
実際には、これらのパラメータは手動で調整されるか、グリッドサーチによって調整されることが多い。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:17:46 GMT)
Hybrid quantum-classical physics-informed neural networks for solving nonlinear PDEs: when and where hybridization is effective? [0.0] 我々は、ハイブリッド量子古典物理学インフォームドニューラルネットワーク(HQPINN)を開発した。
HQPINNは、古典的なニューラルネットワークのバックボーンとパラメータ化量子回路(PQC)を統合して、ソリューション表現を強化する。
その結果,HQPINNはよりスムーズなトレーニングダイナミックスを示し,損失振動を低減し,最終的な精度が向上した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:02:20 GMT)
How Far Do Auto-Interpretation Labels Generalize: A Controlled Study Across Languages, Scripts, and Rewordings [0.0] 我々は、異なる言語、スクリプト、および単語で同じコンテンツによって起動されるSAE機能セットが、相当に重複していることを示す。
次に、自動解釈ラベルがペースを保っているかどうかをテストします。
これらの結果は、自動解釈ラベルは、概念そのものではなく、よく表現された入力に特徴の振舞いを反映する可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:59:07 GMT)
Gradient descent at the Edge of Stability: free energy model and kinetic description of the two-layer network [0.0] 安定状態のエッジにおける勾配降下のダイナミクスについて検討する。
平均軌道の進化を追跡する連続時間有効モデルを提案する。
この方程式は、マクロ自由エネルギーのワッサーシュタイン2勾配流と解釈できる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:11:33 GMT)
Global Sketch-Based Watermarking for Diffusion Language Models [0.0] テキストのグローバルなベクトル値のスケッチ表現を制御するマスク拡散言語モデルのための透かしを提案する。
文脈依存の透かしと比較すると、スケッチの定式化は生成時に見られる局所的な文脈から検出される。
提案手法の歪み, 音性, 強靭性を解析した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:08:58 GMT)
Generalized Bicycle Codes as Cyclic Submodules and their Automorphism Structure [0.0] 一般化自転車(GB)符号の自己同型解析と工学的手法を開発する。
これらの条件をフォールド変換ゲートフレームワークに接続し、$H CX-, $S$-, $CX$-型フォールド変換ゲートの存在の明確な基準を提供する。
これらのメソッドを使用して、ゼロからリッチな自己同型構造の周りにコードを構築する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:05:40 GMT)
GENEB: Why Genomic Models Are Hard to Compare [0.0] 我々は、100タスクにわたる40のゲノム基盤モデルから凍結表現を評価する大規模な診断ベンチマークであるGENEBを紹介する。
genEBは,タスクレベルのトレードオフを明確に示しながら,モデルスケール,アーキテクチャ,トークン化,事前学習データ間の比較を制御可能であることを示す。
これらの結果から,ゲノミクス学習における概念比較とカテゴリー認識モデル選択の基準フレームワークとして,現在の評価実践の限界とgenEBの位置が強調された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:06:01 GMT)
Frustrated superradiant phases in one- and two-dimensional lattices [0.0] フラストレーションはフォトニック密度波の秩序を駆動し、結果として生じる周期性は対称位相の励起スペクトルから予測可能であることを示す。
また、準周期秩序は準結晶を連想させ、合成磁束が翻訳対称性の破れの性質を制御する強力なノブを与えることを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 18:00:00 GMT)
From Prompt to Process: a Process Taxonomy and Comparative Assessment of Frameworks Supporting AI Software Development Agents [0.0] AI機能をプロセスに変換する運用フレームワークに重点を置いています。
仕様駆動による完全な軽量な開発、エージェント駆動のアジャイル計画、エージェント上のコンテキストエンジニアリング、ワークツリーの分離とレビュー、レガシーシステムからの運用仕様の回復。
私たちの中心的な貢献は、仕様、コンテキスト、役割、実行、バリデーション、ポータビリティという6次元プロセスの分類です。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:49:15 GMT)
Fog of Love: Engineering Virtuous Agent Behavior with Affinity-based Reinforcement Learning in a Game Environment [0.0] 本稿では, 局所親和性が, 競合目的と協調目的の両方を達成する上で, エージェント性能を高めることを示す。
これは希少な選択をもたらすだけでなく、エージェントのテレロジーを明確にし、その振る舞いを人間レベルの解釈を可能にする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:31:37 GMT)
Floquet-Engineered Parity Anomaly Staircase in a Cold Atom Dirac Lattice [0.0] 2次元$$-flux格子内のパリティ異常なホール階段に着想を得た。
我々は、関連する低エネルギーディラック理論、バンドトポロジー、ベリー曲率構造、および2つのパラメータ応答マップを分析し、超低温原子格子におけるラマン支援トンネル、オフ共振フロケット駆動、補助交流スタークドレッシングによる実現の可能性について議論する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:59:29 GMT)
Fermionic non-Gaussianity via Bell sampling: monotones and efficient quantum algorithms [0.0] 演算子$= sum_j=12n_jotimes_j の固有値構造上に構築されたフェルミオン非ガウス性のための効率的な量子アルゴリズムを開発する。
純粋状態のエンフブリッジ次数(Emphbridge degree of even pure state, a novel non-Gaussianity monotone, defined as the largest eigenvalue sector of $ $ population by two copy of the state。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:29:05 GMT)
Feature Encoding in Quantum Machine Learning: A Survey and Practical Guidelines [0.0] 量子状態への古典データの符号化は、量子機械学習における主要なパフォーマンスボトルネックを構成する。
既存のフレームワークでは、リソースの堅牢性、表現性、ノイズの堅牢性を共同で特徴付けるものはありません。
5つの登録決定フレームワーク(D, n, p, tau)の特徴次元、キュービット予算、エラー率、タスクタイプをハードウェア基底符号化レコメンデーションにマップする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:46:35 GMT)
FailureScope: Cross-Regime Behavioral Diagnosis of Language Model Weaknesses [0.0] FailureScopeは、クロスモデルパス/フェイルパターンによる評価プローブをクラスタ化する行動診断手法である。
通常、シングルターン・ベンチマーク、マルチターン・ダイアログ、敵エージェント・アタックの3つのレシスタンスに対して安定かつ解釈可能な障害をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:28:00 GMT)
Extremely slow scaling of minimal Hamming distance in quantum sampling data [0.0] 本稿では,量子状態の複雑性を確実に把握し,限られた量子情報から量子相転移を同定する。
これにより、単一のフレームワーク内で完全に異なる量子実験を解析できる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:43:12 GMT)
Expressibility, Noise, and Error Mitigation in VQE Ansatz Selection [0.0] ヒルベルト空間を探索する回路の能力を定量化する指標である表現可能性(Expressibility)は、アンザッツ選択のガイドとして提案されている。
この調査は、イデアル、ノイズ、ノイズ、ゼロノイズ外挿(ZNE)、エラーキャンセル(PEC)の4つの実行シナリオにおいて、$H$と$H_3+$の両方をカバーするよう拡張する。
ZNEは、12ドルH_3+$の回路のうち4つと6ドルH_3+$の回路でエラーを減らし、PECは実際に12ドルH_3+$の回路でエラーを減らしている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:43:24 GMT)
Experimentally probing the Quantum Physics in the Inverted Harmonic Oscillator [0.0] 我々は、Bose-Einstein Condensate on an AtomChipでこのダイナミクスを実現する。
高周波ドレッシングは、横高調波閉じ込めをIHOに反転させる。
我々は10.6 (1.3) dBのサブ真空スクイーズを観察し、IHO進化の時間反転によるコヒーレント可逆性を検証した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:30:16 GMT)
Electron-Ion Path Integral Monte Carlo with Hard Core [0.0] 1つの成分が負のユニタリ電荷の点状粒子、もう1つの成分が正のユニタリ電荷の荷電固球からなる量子2成分プラズマについて検討する。
電子-陽子プラズマの2種のモル分画の比が1:1の場合に特化する。
構造の解析から、温度が低下するにつれて、金属水素相から分子水素相への遷移が見られる。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:45:40 GMT)
Efficient Description of Parametric Amplification of Quantum Pulses [0.0] パラメトリック増幅を行う1つの量子パルスは、出力の少なくとも2つのパルスに供給する。
我々はこれらの出力モードの量子状態を見つけるための効率的で解析的な方法を提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:43:01 GMT)
Effect of isotropic errors on the complexity of Grover's algorithm [0.0] 数値シミュレーションによるGroverの探索アルゴリズムの複雑さに対する等方的誤差の影響について検討する。
結果はGroverのアルゴリズムの等方的誤りに対する堅牢性に関する洞察を与え、ノイズの多い量子ハードウェアの実装における潜在的な課題を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:40:49 GMT)
Dynamic Multi-Pair Trading Strategy in Cryptocurrency Markets with Deep Reinforcement Learning [0.0] この論文は、統計的仲裁とDRL実行ポリシーを組み合わせたハイブリッドアーキテクチャを導入することで、定量的ファイナンス文学に寄与する。
決定論的遮蔽(deterministic shielding)を通じて安全な強化学習のための新しいフレームワークを提供し、統計的に堅牢な境界にニューラルポリシーを固定することで、深刻な分散リスクを軽減できることを示した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 08:10:33 GMT)
Domain-Conditioned Safety in Frontier Computer-Using Agents: A 793-Episode Browser Benchmark, a Coding-Domain Cross-Reference, and a Reproducibility Audit of Recent Red-Teaming [0.0] 最近のCUA (Computer-using-agent) レポートでは、プロンプトインジェクションアタック成功率 (ASR) は42-98%と報告されている。
我々は,手作りテンプレートとして再現されたこれらのテクニックが,現在のフロンティアCUAに対して有効であるかどうかを問う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:21:59 GMT)
Distributed Variational Quantum Optimisation by Entanglement-Selective Transport [0.0] グラフに基づく離散最適化のための分散変分アンザツであるQESTOを紹介する。
ベル対の局所的制約情報を符号化し、グローバルに有効な解状態への振幅伝達を生成する。
その結果、永続的絡み合いは、層間非局所ゲートオーバーヘッドを低減しつつ、有用な変分通信をサポートすることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:33:30 GMT)
Digital Quantum Reservoir Computing for ATM Time Series Prediction [0.0] ATMキャッシュ需要時系列のマルチステップ予測のためのデジタル量子貯水池計算フレームワークについて検討する。
提案手法は,部分的測定とリセットを利用した固定構造を有するパラメタライズされた4ビット貯水池を用いる。
ノイズレスシミュレーション、ノイズ対応エミュレーション、および実際のIQM Spark量子プロセッサを用いて実験を行う。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:11:07 GMT)
Data Efficient Complex Feature Fusion Network For Hyperspectral Image Classification [0.0] 本研究は、ハイパースペクトル画像分類のためのアテンションベースDual-Branch Complex Feature Fusion Network (CFFN)のデータ効率の変動を示す。
提案したモデルはD-CFFNと呼ばれ、元の2ストリーム構造を維持している。
CFFNに匹敵する分類性能を実現し、モデルサイズ、メモリ消費、推論レイテンシを大幅に削減する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 10:41:50 GMT)
Data Collection for Training Quality-Control AI in Carpet Manufacturing [0.0] カーペットウェブをリアルタイムで検査するインラインマシンビジョンシステムの設計を提案する。
本報告では,光場と放牧照明を併用したシンクロナイズドラインスキャンカメラを用いた画像サブシステムについて述べる。
次に、欠陥のない材料で訓練された教師なし異常検出から始まるステージドモデリング戦略を配置する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:50:41 GMT)
Dark Path: An Analysis of the Belt & Road Initiative in El Salvador [0.0] ベルト・アンド・ロード・イニシアティブ(英: Belt & Road Initiative、略称:BRI)は、中国人民共和国(PRC)下の省が他国にその意志を課すための共同事業である。
エルサルバドルは米国のパートナーであり、BRIの下で外国投資の受益者でもある。
サルバドラン法の最近の変更は、国家のサプライチェーンとサイバーインフラに対する暗黙のリスクに対処していない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:57:04 GMT)
DSU-Net: An Attention-Enhanced Dense Skip U-Net for Breast Lesion Segmentation in Mammographic Images [0.0] 本研究は,マンモグラフィ画像における乳房病変自動分割のための注目度向上型Skip U-NetアーキテクチャであるDSU-Netを提案する。
このフレームワークは、密集したスキップ接続とアテンション機構を統合し、特徴伝播を改善し、空間情報を保存し、病変境界線を延長する。
提案したモデルはDice similarity Coefficientの0.9421、Intersection over Unionの0.8905、精度0.9711、AUC-ROCの0.9878を検証データセット上で達成した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 23:09:03 GMT)
Code Lifespan Survival Analysis (CLSA): Predicting the Survival of Source Code Lines Using AST-Aware Mining [0.0] 我々は,各行の粒度でコードサバイバルをモデル化する最初のフレームワークであるCode Lifespan Survival Analysis(Kaplan-Meier 中央値に達していない)を紹介した。
120のオープンソースTypeScriptリポジトリから3250万行の生誕イベントをマイニングしています。
ラインレベルのサバイバルモデリングは、解釈可能で、主に静的なリスク信号を生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:13:31 GMT)
Clustering Guided Domain-Specific Pretrained Foundation Model for Very High-Resolution Arctic Remote Sensing [0.0] 本研究は,北極を対象とする新しいリモートセンシング基盤モデル(RSFM)を提案する。
多様性を意識した地域規模の画像キュレーションと、衛星画像解析のためのビジョントランスフォーマー(VHSR)エンコーダの自己教師付き事前トレーニングを組み合わせる。
我々は、領域適応MAE再構成目標を用いて、キュレートされたコーパス上のViT-Largeエンコーダを事前訓練し、下流の特徴マッピングのための北極固有のトランスフォーマーウェイトを生成した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 22:12:16 GMT)
Clinical Assistant for Remote Engagement Link (CARE-link): A Web-Based Electronic Health Records Software for Managing Diabetes [0.0] CARE-linkは、妊娠糖尿病の管理を改善するために設計された、オープンソースのWebベースの臨床サポートプラットフォームである。
このシステムは、病院の外で患者が作成したデータを集約し、関連する臨床情報を要約し、臨床医にコンテキスト対応の意思決定支援を提供する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 14:39:29 GMT)
Characterization of errors in photon-heralded quantum operations between non-interacting quantum emitters [0.0] 量子演算における小さなマルコフ誤差の解析を可能にする解析摂動フレームワークを開発した。
数値シミュレーションに対して,繰り返し再帰的なCZゲート上での摂動予測をベンチマークする。
我々は、光操作誤差の代表的な例として、コヒーレント位相シフト器の誤校正を解析するために、同じ枠組みを適用した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:39:00 GMT)
Cascading Hallucination in Agentic RAG: The CHARM Framework for Detection and Mitigation [0.0] マルチステップ推論パイプラインにおけるエラー伝搬の検出と中断を行うアーキテクチャフレームワークであるCHARMを紹介する。
CHARMは、ステージレベルの事実検証、クロスステージの一貫性トラッキング、信頼性の監視、カスケード解決トリガの4つのコンポーネントで構成されている。
我々は,HotpotQA,MuSiQue,2WikiMultiHopQA上のCHARMと,LangChainのエージェントパイプライン構成にまたがる独自の逆データセットを評価する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 04:33:47 GMT)
Can AI Refute Economic Theory? Evidence from Beyond the Knowledge Cutoff [0.0] 私は、経済理論に関する4つの論文の正しさを確認するために、いくつかのAIモデルを依頼した実験を文書化しました。
ChatGPT Proは時折反例と証明の修正を行い、他のモデルは悪化した。
私は、有能な人間とフロンティアモデルが組み合わさって、現在の査読を上回ることができると論じるが、AIはそれ自体で経済理論を否定することはできない。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 19:36:37 GMT)
CYGNET: Cypher Gate for Neural Execution Triage and Cost Containment [0.0] クエリ生成と運用用Neo4jデータベースの間に,事前実行ゲートを設置する。
ゲートは、ミラーグラフに対する実行が5.6msの中央遅延で終わる4つのバックチェーンを通して構造を検証する。
7つのCypherBenchスキーマ(2348の質問、ACL 2025)では、パイプラインはテスト対象のモデル毎に生成精度を維持し、安全な防御層として動作することを確認した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 09:13:05 GMT)
CART: Context-Anchored Recurrent Transformer -- A Parameter-Efficient Architecture with Learned Stability [0.0] CART(Context-Anchored Recurrent Transformer)は、パラメータ効率のよい言語モデルで、1つの共有コアブロックをR倍の深さで再利用する。
我々は1つのコンシューマGPU上でCARTを2段階に分けて評価した: 64-configuration screen at 3,000 steps, then 36 configurations (P=6, R in 6,8,10, three seed) training for 30500 steps (1B tokens)。
256,512,768,1024: 事前深さPはループ数Rを支配し、Rのステージ1ランクはフルトレーニング時に逆になる(R=6は最高になる)。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:14:38 GMT)
Bernoulli CUSUM and Bayes-Optimal Detection Ceilings for Trust Fraud in Sparse Rating Networks [0.0] レーティングネットワークにおける逐次信頼検出は、実データで失敗する連続観測モデルに依存する。
Bitcoin-OTCでは、評価の56%が標準マッピングの下で単一の値を取り、パラメトリック検出器が要求する分散仮定を破っている。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 16:56:15 GMT)
BenHalluEval: A Multi-Task Hallucination Evaluation Framework for Large Language Models on Bengali [0.0] ベンガルの幻覚評価フレームワークであるBenHalluEvalを紹介する。
GPT-5.4を12種類のタスク特異的幻覚タイプで用いた12,000の幻覚候補を構築した。
BenHalluScoreは、モデルとタスク間で7.72%から55.42%の範囲の2トラックキャリブレーション指標である。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 05:04:50 GMT)
Attack Selection in Agentic AI Control Evaluations Meaningfully Decreases Safety [0.0] 攻撃のタイミングを戦略的に選択する攻撃者は、無差別に攻撃する攻撃よりも捕えることがはるかに難しい。
我々は、攻撃決定を開始ポリシーに分解し、攻撃者がいつ攻撃するべきかを決定するとともに、攻撃が進行中の攻撃を中止するタイミングを決定する停止ポリシーに分解することで、この能力を検証する。
1%の監査予算で、BashArenaとLinuxArenaで安全を20pp削減し、BashArenaで20pp、LinuxArenaで28pp削減します。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:04:59 GMT)
Arithmetic Pedagogy for Language Models [0.0] 人間の数学教育の手法が言語モデルの訓練を算術的推論に導くことができるかどうかを考察する。
実行トレースを自然言語のChain-of-Thought(CoT)監視にシリアライズした計算手順として,各操作を運用する。
インドネシアのSyllabic-agglutinative TOBAトークンを用いたGPT-2デコーダ(86Mパラメータ)をスクラッチからトレーニングした。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:09:25 GMT)
Arbitrary manipulation of nuclear spins in hexagonal boron nitride [0.0] 核スピン上に単一および多ビットゲートを配置するためのプロトコルを提案する。
核への電子スピン結合を効率的に設計できることが示される。
提案手法は、量子計算の目的でhBNにおけるV$_textB-$の実用的な応用のステージを設定する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 06:25:58 GMT)
Answer Self-Consistency with Margin-Triggered Question Re-Arbitration for the CVPR 2026 VidLLMs Challenge [0.0] CVPR 2026 VidLLMs Challenge のトラック2の解について述べる。
このトラックはビデオにおける視覚的推論を評価し、モデルは常にはっきりと見えない関係を推論しなければならない。
マルチモーダル推論モデル上に構築された学習不要なテスト時間推論フレームワークであるASCを提案する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 00:51:55 GMT)
An Open-Source Two-Stage Computer Vision Pipeline for Fine-Grained Vehicle Classification using Vision Transformers [0.0] 車両のボディタイプは、クラッシュを乗り越える際のサイクリストの重傷の重症度を決定づける重要な要因であるが、車両を分類するための自動ツールがオープンな文献には存在しない。
本稿では、未学習のRT-DETR検出器と微調整の視覚変換器を組み合わせたオープンソースの2段コンピュータビジョンパイプラインを提案する。
信頼に基づく棄権機構は、ソフトマックス出力が0.60未満になるとステージ2の予測を保ち、無音の誤分類ではなく未知のラベルを生成する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 17:53:33 GMT)
An Empirical Study of Data Scale, Model Complexity, and Input Modalities in Visual Generalization [0.0] 本研究では,データスケール,モデル複雑性,入力モダリティ,視覚的一般化性能の関連性について,実証分析を行った。
その結果,トレーニングデータの規模が大きくなると一般化性能が向上することがわかった。
色情報の除去はモデル性能を低下させるが、勾配、エッジ、ウェーブレットといった明示的な事前特徴は異なるモデルアーキテクチャ間で矛盾する効果を持つ。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 03:36:34 GMT)
An Empirical Audit of Input Encoders for Multi-Channel Signal Transformers [0.0] マルチチャネルスカラー信号を消費するトランスフォーマーは、時間ステップ毎に$C$同時値を$d_text$dimensionalベクトルに埋め込む必要がある。
共有スカラーベースライン, チャネルごとの線形性正規化器, 非線形ステムにまたがる8つの入力エンコーダを実験的に評価した。
情報理論上の理由で崩壊する共有スカラーベースラインと、チャネルに依存しないPatchTST-spiritベースラインである。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 11:35:09 GMT)
Agentic AI and Pedagogical Best Practice: The Tension Between Automation and Learning [0.0] 本稿では,エージェントAIのレンズを通して,知識活性化,協調学習,問題ベース学習,フォーマティブアセスメント,足場,メタ認知の6つの教義を概観する。
我々は、自動化と学習の緊張を議論し、意図的な摩擦、動的な足場、人間のループ監視を優先する設計勧告を提案し、人間の学習に取って代わるのではなくAIを確実にするためのAI活用を検討した。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 07:26:23 GMT)
A thorium-229 optical nuclear clock with feedback loop [0.0] トリウム229同位体中のレーザーアクセス可能な核遷移は、光核時計の実現の有望な候補として特定されている。
連続分光に基づくフィードバック吸収を迅速に行い, 連続波レーザーを148nmの核遷移に安定化させることにより, トリウム229核時計を実装した。
このクロックは、単純なショットノイズ制限による3cdot 10-12 sqrt/texts$の分数周波数不安定性のスケーリングを示している。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 15:15:56 GMT)
A formal framework for the economic security of DeFi compositions [0.0] 我々は、DeFiコンポーザビリティの正式なセキュリティ概念であるMEVノン干渉を導入する。
我々は、有界および非有界な富を持つ2つの敵モデルを研究し、十分な条件と局所性原理を確立する。
本フレームワークは,交換,AMM,オプション,貸し出しプール,ルータ,仲裁契約を含む,DeFi構成の表現に応用する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:33:59 GMT)
A Two-Channel F-Transform Representation for Early Trajectory Characterization in Iterated Correlation Dynamics [0.0] 本稿では,短い初期軌道セグメントをコンパクトで解釈可能な,固定次元ファジィ座標に変換するためのソフトコンピューティング表現問題について検討する。
提案するディスクリプタは, 初期過渡期以降の2つの対数信号, ステップサイズ信号, 縮小度信号, 局所収縮度信号を用いる。
1次元に1000の軌道を持つ22の行列次元に対して、この記述子は、収束長近似のためのランダムフォレスト回帰を用いた原軌道サンプル、統計サマリー、PCA圧縮原形質と比較される。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 21:39:55 GMT)
A Quantum Algorithm for Simulating Nonunitary Dynamics Governed by Nonautonomous Linear Ordinary Differential Equations [0.0] 明示的な非単位プロパゲータの事前知識を必要としない量子アルゴリズムを提案する。
本アルゴリズムは特異値分解を用いた拡張スキームを組み合わせることで,非単体プロパゲータをユニタリの和として記述する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 01:45:14 GMT)
A Motivational Architecture for Conversational AGI [0.0] 本稿では,モジュール型実行基板上に構築されたエージェントに対して,OpenPsiモチベーションラインの対話的再解釈をMetaMoの高レベルモチベーションスキャフォールドと組み合わせて提案する。
薬物は体力低下、不確実性低下、親和性、親和性、正当性、育児、美的コヒーレンスを規制する。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 20:25:15 GMT)
A French Corpus Annotated for Multiword Expressions with Adverbial Function [0.0] 本稿では,副詞機能を持つ多語表現(MWE)に注釈を付したフランス語コーパスを提案する。
アノテーションに使ったリソースやメソッドを記述し、その結果を簡潔にコメントします。
論文参考訳(メタデータ) (Wed, 03 Jun 2026 12:50:25 GMT)