JobBench: Aligning Agent Work With Human Will [121.4] JobBenchは、専門家がデリゲートの優先度が高いと判断する上で、AIエージェントを評価する。
JobBenchは、35の職業にまたがる130のエージェントタスクをカバーしている。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:07:02 GMT)
LLaVA-OneVision-2: Towards Next-Generation Perceptual Intelligence [107.6] LLaVA-OneVision-2(LLaVA-OV-2)について述べる。
幅広いマルチモーダルベンチマークで優れたパフォーマンスを実現している。
際立った能力は、ビデオ理解、時間的接地、空間的接地、操作言語推論にまたがる統一的な認識である。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:54:04 GMT)
SP-MoMamba: Superpixel-driven Mixture of State Space Experts for Efficient Image Super-Resolution [99.6] 状態空間モデル(SSM)は、効率的な単一画像超解像(SR)のための強力なパラダイムとして登場した。
我々は、コンテント対応SRのための状態空間の専門家による超ピクセル駆動の混合である textbfSP-MoMamba を提案する。
私たちの中核となる考え方は、従来の剛性スキャンを、スーパーピクセルを基本単位として扱うことによって、テキストのセマンティックなレベルのインタラクションに変換することです。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:19:59 GMT)
DyCoRM: Dynamic Criterion-Aware Reward Modeling for Text-to-Image Generation [94.6] 我々は,タスク関連基準を根拠として,基準対応優先比較を行う動的・基準対応報酬モデルDyCoRMを提案する。
また、T2I画像の選択に基準認識報酬モデルを適用するDyCoPickについても紹介する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:04:26 GMT)
The Devil is in the Condition Numbers: Why is GLU Better than non-GLU Structure? [87.9] Gated Linear Units (GLU)とその変種は、現代のオープンソースの大規模言語モデルアーキテクチャにおいて広く採用されている。
ニューラル・タンジェント・カーネル(NTK)の2層ネットワークを解析し,GLUについて検討した。
解析の結果、GLU構造はNTKスペクトルに反し、より少ない条件数とよりコンパクトな固有値分布をもたらすことが明らかとなった。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:28:18 GMT)
ViroBench: Benchmarking Nucleotide Foundation Models on Viral Genomics Tasks [86.9] 我々は、ヌクレオチド基礎モデル(NFM)に特化して設計された最初の包括的かつ大規模ベンチマークであるViroBenchを紹介する。
ViroBench氏は、生物学的理解と潜伏するバイオセキュリティリスクという、2つの重要な側面にわたるモデルを評価し、4つのタスクタイプ内の18のさまざまなシナリオをカバーしている。
ViroBenchは、ウイルスヌクレオチド基盤モデルの研究のための解釈可能、診断的評価および再現可能な測定フレームワークを提供する。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:31:46 GMT)
The Bridge-Garden Dilemma in LLM Distillation: Why Mixing Hard and Soft Labels Works [84.7] 硬質ラベルと軟質ラベルの混在が常により良い結果をもたらすことを示す。
これは露光バイアスの低減、トレーニングと推論の分布のミスマッチに起因する。
我々はブリッジ-ガーデンハイブリッド監視手法のファミリーを開発する。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:12:54 GMT)
EXPO-FT: Sample-Efficient Reinforcement Learning Finetuning for Vision-Language-Action Models [84.7] 提案するEXPO-FTは,事前学習したVLAポリシーの安定かつサンプル効率の良いRL微調整システムである。
本システムは,オンラインロボットデータの平均19.1分以内の全ての評価課題に対して,完全なタスク性能(30/30の成功)を実現する。
我々は、ロボット工学におけるVLAモデルのより広範なRLファインタニング導入を促進することを目的とした、オープンソースのロバスト性をリリースする。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:31:03 GMT)
Self-supervised Hierarchical Visual Reasoning with World Model [82.6] 対戦相手を持つ3Dオープンワールド環境は、強化学習における中核的な課題である。
階層型世界モデルであるResDreamerを提案し、各上位層をトレーニングし、下層の残余を再構築する。
この設計は、ますます洗練された世界力学の進歩的な抽象化を可能にし、よりリッチな潜在表現の出現を促進する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:18:44 GMT)
MetaphorVU: Towards Metaphorical Video Understanding [81.5] 本稿ではメタファーVU-Benchを提案する。
現在のMLLMは正確な比喩的ビデオ理解に苦しむが、それは主に欠陥のあるクロスドメインマッピングのため、人間のレベルよりはるかに遅れている。
この発見を動機として、マッピング強化としてのメタファ知識グラフを構築し、推論時間拡張フレームワークであるMetaphorBoostを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:12:19 GMT)
STORM: Internalized Modeling for Spatial-Temporal Reasoning in Video-Language Models [81.3] ビデオ推論タスクには、動きの追跡、時間順、フレーム全体の視覚状態の進化が必要である。
視覚言語モデル(LVLM)上に構築された既存の手法はしばしば、チェーン・オブ・ソート(CoT)を通じて推論を外部化することでこの問題に対処する。
STORMSは,LVLMに明示的なテキストCoTではなく,有界な連続的な潜在軌道を推論する2段階のフレームワークである。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:33:00 GMT)
AgentHijack: Benchmarking Computer Use Agent Robustness to Common Environment Corruptions [78.5] 我々は、一般的な汚職下でのコンピュータ利用エージェントの堅牢性を評価するために設計されたベンチマークであるAgentHijackを紹介する。
MLLMをベースとした各種デスクトップタスクを評価し, 汚職の小さな事例であっても, 大幅な性能劣化が生じることを確認した。
本稿では,動作の要約と環境チェックに責任を負う見物人として,アクションジェネレータと接地機能を統合したフレームワークであるAgent Hijack-Agentを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:09:22 GMT)
Efficient and Privacy-Preserving Distribution Statistics Analytics on Mobile Spatial Data [76.3] 空間データに対する効率的な分散統計解析は、リアルタイムなモバイルコンピューティングアプリケーションにとって不可欠である。
既存のプライバシー保護技術は、過度のオーバーヘッドや不正確さをもたらすことが多い。
本稿では,移動空間データに対する効率的かつプライバシ保護型分布統計解析を支援する最初のシステムの設計,実装,評価を行う。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:37:27 GMT)
SurfDesign: Effective Protein Design on Molecular Surfaces [75.9] 表面条件付きタンパク質設計フレームワークであるSurfDesignを紹介する。
SurfDesignは、表面の正規、曲率、方向の幾何学を捉えるために、表面ベースの同変メッセージパッシングを使用する。
以上の結果から,SurfDesignはデノボ結合体および酵素設計ベンチマークにおいて,表面条件付きおよびバックボーンのみの手法より一貫して優れていたことが分かる。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:53:02 GMT)
MARVEL: Universal Murray's Law-informed Vessel Tree Segmentation and Topology Estimation [75.4] 血管セグメンテーションのための深層学習法は、しばしば生物物理学的な制約を無視している。
これは生理的に不確実な分岐と誤分類の血管木につながる。
バイオ物理の先駆体を血管樹抽出に組み込んだ背骨非依存フレームワークMARVELについて紹介する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:32:29 GMT)
Toward Native Multimodal Modeling: A Roadmap [73.3] マルチモーダルモデリングは、モダリティに依存しない推論から世界モデリングへの重要なステップである。
近年の取り組みは、パラダイムをネイティブなマルチモーダルモデリングへとシフトさせてきた。
その可能性にもかかわらず、ネイティブアーキテクチャの設計空間は未だ十分に定義されていない。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:57:43 GMT)
SCRIPT: Scalable Diffusion Policy with Multi-stage Training for Language-driven Physics-based Humanoid Control [72.6] SCRIPTは、言語駆動の物理に基づくヒューマノイド制御のための多段階トレーニングフレームワークを備えたスケーラブルな拡散ポリシーである。
SCRIPTの中核はJAST-DiT(Joint Action-State-Text Diffusion Transformer)であり、アクション、物理状態、テキストを専用トークンストリームとして表現している。
自己回帰制御を安定させるために,近年の密集した文脈を保存し,長期的歴史から疎開したサンプルを抽出する非線形履歴条件付け機構を導入する。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:33:57 GMT)
When In-Distribution Gains Fail: Evaluating Weak-to-Strong Reward Models under Preference Shift [72.1] ゼロショット分布シフト下でのW2S選好学習について検討した。
弱い選好ラベルで訓練された強い学生は、選好データセットを移動できなくとも、流通に成功していることがわかった。
本稿では、事前訓練された強モデルの表現空間からの過剰なドリフトを制約する単純で効果的な正規化器であるRepresentation Anchoring(Anchor)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:30:49 GMT)
ARES: Automated Rubric Synthesis for Scalable LLM Reinforcement Learning [71.3] 本稿では,ルーリックベースのRLデータを大規模に自動構築するフレームワークであるARESを提案する。
ドメインラベルとペルソナ情報に基づいてARES条件を生成し、質問自己完結、回答忠実、妥当性の検証フィルタを適用する。
7つのベンチマークでの実験では、ARESでトレーニングされたルーブリックベースのトレーニングは、継続事前トレーニング、教師付き微調整、バイナリリワードRLよりも優れており、ヘルスケアやインストラクションフォローのような多次元のオープンエンドタスクで最大の利益を得ている。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:33:52 GMT)
SAMark: A Self-Anchored Text Watermarking with Paragraph-Level Paraphrase Robustness [71.1] 段落レベルのパラフレーズに対するロバスト性は、このような攻撃が文順を変化させることで、世界規模で透かし信号を破壊するため、依然として困難である。
本稿では,意味空間内にステップ非依存のグリーン領域を確立することで文順依存を除去する自己認識型透かしフレームワークSAMarkを提案する。
実験の結果、SAMarkは通常の段落レベルのパラフレーズ攻撃で最大90.2%のTP@FP1%を達成することがわかった。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:46:15 GMT)
Not All Modalities Are Equal: Instruction-Aware Gating for Multimodal Videos [70.8] ビデオ,音声,深度マップ,その他のモダリティ入力間で命令認識融合を行う,UniMVUという統合マルチモーダルビデオ理解フレームワークを提案する。
解析の結果,ゲーティング機構は人間と解釈可能なモダリティの関連性に一致し,アブレーションは内部モダリティとモダリティレベルのゲーティングの寄与を示すことがわかった。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:02:20 GMT)
InstructSAM: Segment Any Instance with Any Instructions [70.3] InstructSAMは任意の命令の下でマルチインスタンスセグメンテーションのために設計されたフレームワークである。
学習可能なインスタンスクエリのバンクを視覚言語モデル(VLM)とSAM3に注入する。
ハイブリッドアテンション機構は、これらのクエリ、ビジュアルトークン、命令トークン間の相互作用を促進する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:58:03 GMT)
TimeGuard: Channel-wise Pool Training for Backdoor Defense in Time Series Forecasting [69.0] Time Series Forecasting (TSF) はバックドア攻撃に対して非常に脆弱である。
データ絡み合いは、チャネルレベルのシグナル希釈を誘導し、サンプルフィルタリングとトリガー合成防御はバックドアのローカライズに効果がない。
我々は、TSFのトレーニング時バックドアディフェンスであるTimeGuardを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:50:16 GMT)
Metric--Phase Fields: Decoupling Distance and Sign for Thin-Structure Reconstruction from Unoriented Point Clouds [67.3] 本稿では,距離近接を位相相から分離する非結合な暗黙的表現であるMetric-Phase Fields (MPFs)を紹介する。
合成および走査された薄殻形状と薄板形状の両方の実験により、MPFは最近のSDF法よりも薄くて層状構造を忠実に保存することが示された。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:08:57 GMT)
TriSplat: Simulation-Ready Feed-Forward 3D Scene Reconstruction [65.0] TriSplatは、向き付けられた三角形のプリミティブを持つシーンを表すフィードフォワード再構築ネットワークである。
シミュレーション可能なメッシュシーンを1つのフォワードパスからエクスポートする。
RealEstate10K と DL3DV の実験により、この表現はガウスのフィードフォワードベースラインよりも幾何に忠実な再構成を生成することが示された。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:59:53 GMT)
Diffusion Image Generation with Explicit Modeling of Data Manifold Geometry [64.6] 画像生成モデルは、基礎となるデータ多様体からデータポイントをサンプリングすることを目的としている。
データマニフォールド対応画像差分法(MIND)を提案する。
MINDは離散パッチトークン化を連続拡散モデルのスコア関数に統合する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:43:14 GMT)
CUA-Gym: Scaling Verifiable Training Environments and Tasks for Computer-Use Agents [64.5] 検証可能な報酬(RLVR)による強化学習は、数学、ツールユース、ソフトウェア工学といった分野において画期的な成果を上げている。
しかし、コンピュータ利用エージェント(CUA)への拡張は、決定論的報酬を伴うスケーラブルなトレーニングデータの不足によってボトルネックになっている。
本稿では,タスク命令,環境状態,報酬関数を共同生成するスケーラブルパイプラインCUA-Gymを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:28:03 GMT)
Full-4D: Generating Full-Scope 4D Scenes from a Single-View Video [63.6] 本稿では,同期マルチビュービデオのデータセットであるRealMV-4Dを紹介する。
次に、新しい融合時間(T)-ビュー(V)アテンション機構によって駆動される多視点ビデオ拡散モデルを訓練する。
実験により,本手法は視覚的忠実度と一貫性の両方において既存手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:59:26 GMT)
$D^2$-Monitor: Dynamic Safety Monitoring for Diffusion LLMs via Hesitation-Aware Routing [63.5] 大規模言語モデル(D-LLM)の安全性監視はほとんど未検討である。
D-LLMの2レベル安全モニタであるD2$-Monitorを提案する。
D2$-Monitorは、常にオンのモニターとして軽量プローブを採用して、ヒューズレーションを共同で見積もり、ベース分類を実行する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:22:21 GMT)
Dual-Pathway Geometry-Aware MLLM for Spatial Intelligence [63.1] 本稿では,空間知能のための二経路幾何対応MLLMであるGAMSIを提案する。
RGB画像のみを入力とし、両方の幾何学的形態を統一された自己回帰バックボーン内に内包する。
GAMSIは、7つの空間インテリジェンスベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:33:19 GMT)
Advancing Creative Physical Intelligence in Large Multimodal Models [62.6] MM-CreativityBenchは、視覚的にリッチで物理的に制約のある環境において、手頃なグラウンドで使用されるクリエイティブツールのベンチマークである。
筆者らの実験では、現在のLMMは、生成能力の欠如によるものではなく、基底探索を維持できないため、しばしば短くなることが示されている。
この障害モードを動機として,創造的ツールの使用を優先学習問題とするアライメント(アライメント,アライメント,アライメント)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 23:59:02 GMT)
Accelerated Dynamic Importance Weighting with Versatile Divergence-Minimizing Estimators [62.2] 共同分散シフト下での深層学習のための統合的で効率的なIWフレームワークである加速DIW(ADIW)を提案する。
ADIWはDIWを多種多様な重み推定手法をサポートする統一分散最小化フレームワークに一般化する。
ADIWは最先端のIW性能を実現し、より効率的である。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:58:51 GMT)
AnE: Pushing the Reasoning Frontier of Multimodal LLMs via Anchor Evolution [61.6] Supervised Fine-Tuning (SFT) とReinforcement Learning (RL) による後学習は多モーダル大規模言語モデル(MLLM)における推論の強化に不可欠である
既存のパラダイムは、静的データの制限により、しばしばパフォーマンスのボトルネックに達する。
我々は,真理に順応したデータキュレーションとモデル進化を統合する新しいパラダイムであるアンカー進化(AnE)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:26:34 GMT)
TapSampling: Inference-Time Sampling with a Task-Progress-Understanding Verifier for Robotic Manipulation [61.4] 既存の具体的制御研究は、トレーニングデータとモデルサイズをスケールすることで、顕著なパフォーマンス向上を示す。
拡散や自己回帰モデルのような非決定論的生成モデルは、エンボディドコントロールの分野で広く採用されている。
推測時間サンプリングのためのプラグイン・アンド・プレイフレームワークである textbfTapSampling を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:03:31 GMT)
Your Agents Are Aging Too: Agent Lifespan Engineering for Deployed Systems [60.8] 長寿命のAIエージェントは、永続的な運用システムとしてますますデプロイされる。
エージェントはデプロイ後、いつまで信頼できるのか?
エージェントライフスパンエンジニアリングのための縦型信頼性ベンチマークであるAgingBenchを紹介する。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:55:12 GMT)
Profiling-Driven Adaptive Distributed Transformer Inference on Embedded Edge Deployment [60.4] 本稿では、WiFi経由で接続されたNVIDIA Jetson Orin Nanoデバイスに関するプロトタイプ研究を行う。
主な発見は、主なボトルネックは、ネットワーク帯域幅だけでなく、通信中のCPU-GPUステージングである。
実験によると、この戦略はフルテンソル交換と比較して遅延を65%-77%減らし、エネルギー消費を34%-52%減らしている。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:39:28 GMT)
Rethinking Feature Alignment in Generalist Graph Anomaly Detection: A Relational Fingerprint-based Approach [60.2] Generalist Graph Anomaly Detection (GAD)は、グラフ固有のリトレーニングなしで、見えないグラフ上の異常を検出することを目的としている。
既存のアプローチは主に、異なる機能セマンティクスを無視したドメイン間の異種データの整合性に焦点を当てている。
We propose Fingerprint-based generalist GAD approach (ReFi-GAD)。
ReFi-GADは14のデータセットの実験において,最先端の手法よりも有意に優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:12:26 GMT)
Zero-Shot Object Re-Identification in Egocentric Kitchen Videos via Multi-Stage SAM3 Feature Fusion [59.3] EPIC-Kitchensベンチマークを用いてゼロショットオブジェクトReIDについて検討した。
目標は、トレーニング済みのビジュアル機能のみを使用して、アクティブな食品とキッチンツールインスタンスをフレーム間でマッチングすることだ。
論文参考訳(メタデータ) (Mon, 25 May 2026 23:01:41 GMT)
Hidden in Plain Tokens: Simply Robust, Gradient-Free Watermark for Synthetic Audio [58.6] 自己回帰モデルに対する推論時透かしは、離散化の不整合による連続的なモダリティには適さない。
合成音声の強力で堅牢な透かしのためのエレガントな解法を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:43:20 GMT)
Language Models Need Sleep [58.5] 本研究では,モデルが周期的に最新のコンテキストを持続的な高速重みに変換する睡眠様統合機構について検討する。
睡眠中、モデルは蓄積したコンテキストにN$のオフラインリカレントパスを実行し、状態空間モデルの高速な重みを更新する。
睡眠時間の増加は,より深い推論を必要とする例では最大で,我々のモデルではN$の上昇がパフォーマンスを向上させることを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:55:39 GMT)
LECTOR: Joint Optimization of Scientific Reasoning Graphs and Introduction Generation [57.7] 序文は特に難解であり、論理的な健全さと検証可能な忠実さを要求する。
ほとんどのAI支援手法は、推論や構造化ではなく、タスクをテキスト生成として扱うため、深刻な欠点が生じる。
我々は,科学者の論理を厳格に追従し,高品質な引用を加え,構造化された表現を維持できる新しい論理表現協調強化学習フレームワークであるLECTORを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:41:16 GMT)
ScientistOne: Towards Human-Level Autonomous Research via Chain-of-Evidence [57.4] チェーン・オブ・エビデンス(Chain-of-Evidence, CoE)は、すべてのクレームがエビデンス・ソースにトレース可能であることを要求する検証可能なフレームワークである。
CoE Auditはポストホック監査であり、スコア検証、仕様違反、参照検証、メソッドコードアライメントという4つの整合性チェックが全システムに均一に適用される。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:30:27 GMT)
WBench: A Comprehensive Multi-turn Benchmark for Interactive Video World Model Evaluation [56.5] WBenchはインタラクティブな世界モデルを評価するための総合的なベンチマークである。
ビデオの品質、セッティングアテンジェンス、インタラクションアテンデンス、一貫性、物理コンプライアンスをカバーしている。
289件のテストケースと1,058件のインタラクション・ターンが含まれており、多様なシーン、スタイル、主題、一対三の視点をカバーしている。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:01:31 GMT)
When Rule Violations Are Rare: Chimera Training for Logical Anomaly Detection [56.4] 本研究では,学習した視覚概念に対する制約を論理規則として与える環境での異常検出について検討する。
本稿では,各制約を有向非巡回グラフにコンパイルし,特徴認識サブツリーゲートを学習するニューラルルール評価器を提案する。
CLEVRER、OpenImages、VidOR全体で、結果として得られる評価は、独立イベントと同一イメージのセマンティックトレーニングベースラインよりもルールレベルのAUROCを改善する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:52:36 GMT)
Neural Scalable Symbolic Search Framework for Complex Logical Queries with Multiple Free Variables [56.0] 複雑クエリアンサーリング(CQA)は、不完全知識グラフ(KG)上の基本的な知識表現と推論タスクである
ここで$mathcalEk$はKGのエンティティセットを表す。
既存のベンチマークとメソッドは、個々の変数よりも限界ランクに依存している。
我々は、$mathcalEk$を列挙することなく、共同ランキングを近似するフレームワークであるNeural Scalable Symbolic Search (NS3)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:04:57 GMT)
ESI-Bench: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop [55.5] 我々は,OmniGibson上に構築された10のタスクカテゴリと29のサブカテゴリにまたがる空間知能の具体化ベンチマークを開発した。
我々は最先端のMLLMの実験を行い、活発な探索が受動的に優れていることを発見した。
矛盾した視点を求め、信念を改定する人間とは異なり、モデルは証拠の品質に関わらず、高い信頼をもって早々に行動する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:34:52 GMT)
HyLaT: Efficient Multi-Agent Communication via Hybrid Latent-Text Protocol [54.4] HyLaTは、遅延チャネルを介して詳細な認知信号を伝達し、効率を上げるためのハイブリッド潜在テキスト通信プロトコルである。
エージェントがハイブリッドメッセージを生成・解釈できるように、シングルエージェントハイブリッド生成学習とマルチエージェントインタラクティブコトレーニングを組み合わせた2段階のトレーニングフレームワークを提案する。
実験により、HyLaTは、多様な設定で強力な一般化と堅牢性を持って、競争力のあるタスク性能を維持しながら、通信オーバーヘッドを著しく低減することが示された。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:50:15 GMT)
On the Benefits of Free Exploration for Regret Minimization in Multi-Armed Bandits [54.4] 我々は,後悔が蓄積する前に,エージェントに自由な探査予算が与えられる,多武装の盗賊問題について検討する。
我々は、この後悔の最小化を自由探索問題で定式化し、自由探査予算が時間軸と対数的にスケールする興味深い体制を特定する。
本稿では,二相保存アルゴリズムUFE-KLUCB-Hを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:36:43 GMT)
Fast-dDrive: Efficient Block-Diffusion VLM for Autonomous Driving [54.3] 本稿では,ブロック拡散型VLAであるFast-dDriveについて述べる。
我々は、Fast-dDriveが運転エージェントの速度精度フロンティアを再定義することを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:32:46 GMT)
CRPO: Character-centric Group Relative Policy Optimization for Role-aware Reasoning in Role-playing Agents [53.8] 本稿では,ロールプレイングタスクで目的を実現するためのフレームワークCRPOを提案する。
CRPOは3つのメカニズムにより、タスクロジックをスタイリスティックな報酬から切り離して勾配競合を解消し、文字複雑性に基づいた最適化制約を動的に適応させ、一般的な応答を負のベースラインとして利用し、モデルが共通の分布に戻すのを防ぐ。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:15:38 GMT)
CodecSplat: Ultra-Compact Latent Coding for Feed-Forward 3D Gaussian Splatting [53.5] フィードフォワード3Dガウススプラッティングのための超コンパクト遅延符号化フレームワークであるCodecSplatを紹介する。
CodecSplatは23.56-26.36 dB、24.76-27.05 dB、PSNRは20.00-10777、PSNRは3.37-12、PSNRは3.37-12である。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:17:35 GMT)
Garment Particles: A 2D--3D Symmetric Garment Representation for Generation and Editing [53.2] Garment Particlesは、2Dミシンパターンと3D幾何学を共同でエンコードする5Dポイントクラウド表現である。
高レベルの入力(テキスト、画像、スケッチ)から直感的な生成をサポートし、2Dミシンパターンと3Dジオメトリの様々な編集操作をサポートする。
また, 衣服, 縫製パターンの編集, ポイントクラウド, シルエットコンディショナブルな衣服生成など, 衣服編集のシナリオを多数用意した。
論文参考訳(メタデータ) (Mon, 25 May 2026 23:43:54 GMT)
A Multi-Agent LLM Framework for Rating the Quality of Surgical Feedback [52.1] 手術室の外科医が行う言語的フィードバックは、居住スキル獲得において重要な形式的役割を担っている。
本稿では,手術訓練の文脈に根ざした,解釈可能なフィードバック品質基準を発見するための2段階のLCMベースのフレームワークを提案する。
本手法では,多エージェントおよび外科領域の知識注入を用いて,人間の解釈可能な評価基準の小さなセットを探索する。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:31:44 GMT)
Xiaomi Auto World Model: A Joint World Model Integrating Reconstruction and Generation for Autonomous Driving [51.9] 本報告では,世界モデルの自律運転における2つのコア機能に対処する統合技術システムを提案する。
世界表現のために,スパースシーンクエリによって駆動されるフィードフォワード再構築アーキテクチャであるWorldRecを提案する。
次世代に向けて,両方向性事前学習のための2段階のトレーニングフレームワークWorldGenを提案し,それに続いて因果微調整を行う。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:46:31 GMT)
Anticipate and Learn: Unleashing Idle-Time Compute in Proactive Agents [51.5] ProActは、アイドルタイム計算を利用して、今後のユーザニーズを予測し、満たすプロアクティブエージェントアーキテクチャである。
進化する対話履歴を永続記憶とともに解析することにより、ProActは今後のニーズを予測し、情報を反復的に取得する。
MemBenchの評価では、ProActが最先端の反射精度を達成し、持続的で堅牢な性能を裏付けている。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:47:21 GMT)
RepoMirage: Probing Repository Context Reasoning in Code Agents with Perturbations [51.4] 本稿では,SWE-Bench Verified上に構築された2段階評価スイートRepoMirageを紹介する。
RepoMirage-Perturbは、リポジトリレベルの摂動を保存する3つのタイプのセマンティクスを適用している。
RepoAnchorは、下流の問題解決からリポジトリの探索を分離する構造第一のプロトタイプワークフローである。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:26:43 GMT)
VEN-VL: A Visual Ensemble MoE Framework for Effective and Efficient Multi-Modal Understanding [50.9] VEN-VLは、効果的かつ効率的な知覚のための視覚アンサンブルMoEフレームワークである。
まず、異なる視点の視覚的表現を統一することで、情報容量を増強する。
そして、情報密度を高めるために、特殊視覚の専門家による適応ルータで段階的に圧縮する。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:28:48 GMT)
Global Structure-from-Motion Meets Feedforward Reconstruction [50.7] Structure-from-Motionはコンピュータビジョンにおける中心的な課題である。
近年のフィードフォワード3次元再構成の進歩は,従来のSfM法における持続的故障の克服に大きく貢献している。
そこで我々は,古典的手法とフィードフォワード手法のそれぞれの長所を組み合わせることで,新しいStructure-from-Motionパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:58:03 GMT)
From Facts to Insights: A Persona-Driven Dual Memory Framework and Dataset for Role-Playing Agents [50.7] 現在のシステムはペルソナに依存しない要約に依存しており、ペルソナ固有の解釈なしで事実を記録する。
RoleMemoは4つの推論タスクを備えたデータセットで、実際の断片をペルソナを通して解釈して正しい回答を得る必要がある。
本稿では,記憶を2つのストリームに分解するDualMemを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:48:24 GMT)
Hierarchical Consistency Learning for Test-time Adaptation in Camouflage Perception [50.3] カモフラージュされた物体検出(COD)は、物理的属性を通して背景から最小限の知覚差を示すターゲットをローカライズすることを目的としている。
既存のメソッドは、静的なTrain-then-freezeパラダイムによって制約されており、ドメインの剛性と依存性のアノテーションに悩まされている。
動的表現再構成のためのテスト時間適応を統合した階層的一貫性学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:57:46 GMT)
Learning to Route Languages for Multilingual Policy Optimization [50.0] 大規模言語モデルは異種多言語コーパスで訓練される。
本稿では,言語を選択可能な変数として扱うオンラインポリシー最適化フレームワークLRPOを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:28:41 GMT)
On the Limits of Model Merging for Multilinguality in Pre-Training [49.9] 混合・統合・単言語事前学習装置の有効性について検討した。
モノリンガル事前学習は言語内での強い性能をもたらすが、モノリンガルモデルの組み合わせをマージすると干渉による性能低下が生じる。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:38:33 GMT)
OmniToM: Benchmarking Theory of Mind in LLMs via Explicit Belief Modeling [49.9] ToM(Theory of Mind)は、大規模言語モデル(LLM)において、終点質問応答を用いて一般的に評価される。
このパラダイムは、モデルが堅牢な推論に必要な精神状態の表現を実際に構築しているかどうかを曖昧にしている。
我々は,これらの表現を直接評価するベンチマークであるOmniToMを紹介した。
論文参考訳(メタデータ) (Mon, 25 May 2026 20:45:08 GMT)
Causal methods for LLM development and evaluation [49.6] 大規模言語モデル(LLM)開発は現在、データミックス、報酬モデル、ルーティング戦略、評価パイプラインに対する大規模な経験的イテレーションによって進められている。
ここでは、LLM開発と評価における多くの中心的な疑問が本質的に因果関係であると主張する。
我々は,LLM開発・評価パイプラインにおいて因果的手法が潜在的に不活用されていることを論じる。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:15:44 GMT)
RadarSim: Simulating Single-Chip Radar via Multimodal Neural Fields [49.4] レーダーはカメラの理想的な補完であり、カメラは細かな角分解能を提供し、レーダーは悪天候下でメートル法的な深さと頑丈さを提供する。
RadarSimはレーダーのみの再構築よりもシャープな幾何学とドップラーレンジフレームを生成する。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:03:40 GMT)
When Self-Belief Misleads: Active Label Acquisition for Reinforcement Learning with Verifiable Rewards [49.3] 能動検証リワードを用いた強化学習(RLAVR)を提案する。
RLAVRは、少数のサンプルの接地木ラベルを積極的に取得し、擬似ラベルと統合する。
これに基づいて、RLAVR(CARE)の補正認識信頼性推定を導入する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:55:12 GMT)
Weakly Supervised Camouflaged Object Detection Based on the SAM Model and Mask Guidance [49.1] 制約を克服するために,キャモフラージュされた物体検出のための新しい弱い教師付きアプローチを導入する。
具体的には,エッジのあいまいさに対処し,検出に失敗する新しいネットワークMGNetを提案する。
そこで本研究では,Segment Anything Model(SAM)とバウンディングボックスプロンプトを併用して擬似ラベルを生成するBoxSAMを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:26:13 GMT)
When Does LeJEPA Learn a World Model? [48.7] 世界の真の自由度を揺るがす表現は、信頼できる計画や構成的一般化を支持できない。
我々は,LJEPAが非線形観測から世界の潜伏変数を線形に復元することを証明した。
本研究では,2次元の例から1024次元の潜伏物体まで,分布の短縮や画素ベースのロボット制御を含む実験により,この理論を検証した。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:56:26 GMT)
Exploiting Local Dynamics Regularity for Reusable Skills in Offline Hierarchical RL [48.6] 局所力学の直観を生かした抽象概念に焦点をあてる。
どのスキルを再利用するか、どこで再利用するかを学びます。
この情報は、高レベルのポリシーが使用する低レベルのスキルを判断しなければならない、多くのHRLアルゴリズムに恩恵をもたらすはずだ。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:39:14 GMT)
ARC-STAR: Auditable Post-Hoc Correction for PDE Foundation Models [47.9] ARC-STARは修正を3段階にまとめる: グローバルな修正器は広い解法バイアスを除去し、ブロックワイドな局所精錬器はポストグロバル残差を浄化し、展開時にはラベルフリースコアは計算予算の下でハイリスクなブロックに精算する。
ARC-STARは、全ての細胞で生ポセイドンよりも少なくとも36倍の速度ロールアウト誤差を減少させる唯一の方法である。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:06:51 GMT)
MATO: Multi-objective Personalized Alignment with Test-time Optimization for Large Language Models [47.9] テスト時間最適化を伴う多目的パーソナライズアライメントのためのトレーニングフリーフレームワークであるMATOを紹介する。
MATOはパーソナライゼーションをテスト時間最適化問題として定式化し、復号時に制御可能な重みを通して複数の目的を相対的に重要視する。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:57:22 GMT)
Looped Diffusion Language Models [47.9] マスケード拡散モデル(MDM)は、言語モデリングのための自己回帰モデルに代わる有望な代替品として登場した。
初期中間変圧器層を選択的にループすることで,MDMのトレーニング効率とモデル性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:58:24 GMT)
Learning in Low-Dimensional Subspaces: Orthogonal Bottlenecks for Reinforcement Learning [47.2] 低次元部分空間にエンコーダ特徴を制約するために固定正則射影を挿入する表現レベル前処理を提案する。
線形実現可能性仮定の下では、ボトルネック次元が特徴空間における最適値関数の内在的なランクを超えた場合、ボトルネックは表現性を保存する。
シングルタスクとマルチタスクのベンチマークで、ボトルネック次元がタスク依存のしきい値を超えると、ベースラインのパフォーマンスが一致または改善されることがわかった。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:31:33 GMT)
A Controlled Synthetic Benchmark for Educational Aspect-Based Sentiment Analysis [47.0] 本研究は,1万の総合的な授業レビューから構築されたABSAの教育的評価基準について紹介する。
最強の未調整モデルであるBERTは0.2760マイクロF1に達する。
Herathらによる2,829名の学生フィードバックレビューに対する保守的な外部評価では、9アスペクト重なりのBERTでは0.4593のマイクロF1が得られる。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:05:21 GMT)
Towards the Connection between Activation Sparsity and Flat Minima [46.8] アクティベーションの間隔は、標準化されたトランスフォーマーのブロックに現れる。
アクティベーション空間は「増大平坦性」と入力・アクティベーション基準の積との比に等しいことがわかった。
本稿では,ReLU下でのアクティベーション・スパシティを低減するデリバティブ・スパシティを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:10:40 GMT)
Universal Activation Verbalizer: A Unified Framework for Cross-Model Activation Explanation [46.7] Universal Activation Verbalizer (UAV)は、共有デコーダを使用して異種ドナーモデルのアクティベーションを説明するフレームワークである。
UAVは、デコーダの埋め込み空間でドナーアクティベーションをソフトトークンに変換する軽量アダプタを学習する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:33:37 GMT)
Length Generalization with Log-Depth Recurrent Units [46.5] 正規言語は、長さの一般化を評価するために頻繁に使用されるテストベッドを提供する。
本稿では,アソシエーションバイアスのある演算子のクラスをキャプチャするLog-Depth Recurrent Unitを提案する。
我々は標準ベンチマークと新しいプレフィックス言語からなる21の正規言語タスクで-LDRUを評価した。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:02:29 GMT)
HoLoArm: Deformable Arms for Collision-Tolerant Quadrotor Flight [46.4] トンボの翼のノダス構造にインスパイアされた腕を持つ四重奏曲HoLoArmについて述べる。
結果は、HoLoArmが軸方向を含む任意の方向に受動的に変形し、衝撃の方向とレベルに応じて0.3~0.6秒以内で回復可能であることを示した。
ドローンは最大7.6m/sの速度で衝突に耐え、安定した飛行を維持しながら540gのペイロードを運ぶことができる。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:37:18 GMT)
Scaling World-Model Reinforcement Learning Through Diffusion Policy Optimization [46.3] モデルに基づく強化学習は、世界モデルを用いて、大規模に効果的に支援することができる。
我々は、既存の世界モデルアプローチにおける検索と価値学習の間の構造的ミスアライメントであるボトルネックを特定する。
拡散政策表現を通じて探索と政策最適化を統一するフレームワークである世界モデルにおけるモデルベース拡散政策最適化(MBDPO)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:06:51 GMT)
PAC Learning with Bandit Feedback: Sharp Sample Complexity in the Realizable Setting [46.1] 本研究では,マルチクラスPAC学習における帯域幅フィードバックによる課題について検討する。
このフレームワークでは、インスタンススペース$mathcalX$とラベルスペース$mathcalY$に未知のデータ分散があります。
我々は、この問題の最適サンプルの一般的な特徴を与え、すべての概念クラスを複雑さまで鋭くする。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:35:16 GMT)
Automated Benchmark Auditing for AI Agents and Large Language Models [46.0] Auto Benchmark Audit (ABA)は、個々のベンチマークタスクを体系的に監査するエージェントフレームワークである。
私たちは、9つのドメインで合計168のベンチマークで、Frontier LLMベンチマークと以前のNeurIPSパブリッシュのコレクションでABAを実行しています。
ABAは、不明瞭なタスク設計、実行環境の矛盾、そして、評価されたタスクの25.7%以上において、誤った根拠の真実を含む重要な問題を特定する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:44:21 GMT)
Stabilizing Streaming Video Geometry via Dynamic Feature Normalization [45.9] Dynamic Feature Normalization (DyFN) は、時間とともに安定な幾何を維持するために特徴統計を変調する因果リカレントモジュールである。
DyFNは最先端の時間安定性を実現し、従来のストリーミング手法よりも最大14%改善し、さらにはより重い非因果的ビデオベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 25 May 2026 00:13:15 GMT)
Stochastic Estimation of the Layer-wise Hessian Trace for Monitoring Neural-network Training [45.9] 本稿では,ニューラルネットワークの経験的リスクであるヘッセン行列の対角ブロックの軌跡のパラメータ推定器を提案する。
この手順はハッチンソントレース推定器とパラメータベクトル全体の上の1つのヘッセンベクトル積を組み合わせたものである。
重み分担の下での正しさは,第2次微分の前に階層的にヘッセンを組み立てる必要があることを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:24:32 GMT)
EfficientGraph-RAG: Structured Retrieval-State Management for Cross-Task Retrieval-Augmented Generation [45.7] 検索拡張世代は、外部知識で大規模言語モデルを構築する標準的な方法となっている。
EfficientGraph-RAGは、3つの評価されたLongBench検索スタイルのサブセットで平均された回答品質の指標で第1位である。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:08:53 GMT)
AI-Assisted Systematization for Evaluating GenAI Systems [45.6] 我々は,2つの概念のコンセプト仕様を作成するために,AIを利用した2つのシステムライザを開発した。
コンテントの妥当性と情報回復性に関する概念仕様を評価した。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:19:44 GMT)
Can LLMs Time Travel? Enhancing Temporal Consistency in Legal Agentic Search through Reinforcement Learning [45.1] 法律は、法律の遡及的適用が中核的な法的原則に違反し、誤った結論に至るため、各事件の時間的文脈と一致しなければならない。
我々の観察では、現在の法的LLMはトレーニングの遮断に固定された時間的バイアスに悩まされているのに対し、検索エージェントはクエリに時間的制約を組み込むことは滅多にない。
我々は,複数の修正期間にまたがる時間的インデクシングデータに基づいて学習し,時間的整合性を確保するために,オンラインWeb検索に適合する厳密な記事に局所法規RAGを併用する,エンドツーエンドの強化学習フレームワークであるLegalSearch-R1を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:57:13 GMT)
ComPose: A Unified Completion-Pose Framework for Robust Category-Level Object Pose Estimation [44.7] カテゴリーレベルのオブジェクトポーズ推定は、特定のカテゴリにおける任意のオブジェクトのポーズとサイズを予測することを目的としている。
既存の方法は観測された点雲の固有の不完全性に苦しむ。
形状補完を密に統合する新しい統合フレームワークであるComPoseを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:10:06 GMT)
Rethinking VLM Representation for VLA Initialization [44.7] Vision-Language-Action(VLA)モデルは、事前訓練されたVision-Language Models(VLM)をポリシーバックボーンとして広く採用している。
事前訓練されたVLM表現がVLA初期化にどのような有用かは、まだ不明である。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:51:35 GMT)
How Far Has AI Come in Liver Fibrosis Staging? A Large-Scale Real-World Dataset and Benchmark [44.6] 我々はMICCAI 2025 CARE-Liverチャレンジから派生した大規模データセットとベンチマークであるLiFSを紹介する。
LiFSは、様々な現実世界のスキャナーから、組織学的に確認されたアノテーションで完全なガドキシー酸の配列を提供する最初のベンチマークである。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:47:16 GMT)
Forgetting in Language Models: Capacity, Optimization, and Self-Generated Replay [44.2] 自己生成サンプルが効果的な再生データとして機能し、ほとんど忘れられないことを示す。
モデルがキャパシティをほとんど持たない場合には、忘れることが継続する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:54:34 GMT)
Detecting Unfaithful Chain-of-Thought via Circuit-Guided Internal-External Discrepancy [43.9] 思考の連鎖(CoT)推論は、大きな言語モデルの問題解決能力を向上する。
生成された推論トレースは、モデルの実際の決定プロセスを忠実に反映しないかもしれない。
本稿では,CIE-Scorerを用いたCIE-ScorerによるCoT不整合検出手法を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:54:55 GMT)
Extending Embodied Question Answering from Perception to Decision [43.6] EQA(Embodied Question Answering)は、エンボディ環境における知覚、推論、相互作用を結びつける。
EQA-決定(EQA-Decision)は,4つの相補的推論を体系的に網羅した大規模エンボディドQAデータセットである。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:08:20 GMT)
VeriTrace: Evolving Mental Models for Deep Research Agents [43.4] ディープリサーチエージェントは、膨大な、相互依存的で広範囲に不確実な情報に直面します。
既存のシステムは、進化する中間表現がどのようなものになるべきかを探索するが、その進化は暗黙の推論に任せる。
エージェントのメンタルモデルは、タスク理解と現実を継続的に整合させる明示的なフィードバックを通じて進化すべきである、と我々は主張する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:46:57 GMT)
Toward a Benchmark for Controllable Simulation of Imperfect Students with Large Language Models [43.0] 大規模言語モデルは、既知のスキルコンポーネントで生徒をシミュレートすることで、教師教育を支援することができる。
本稿では,他者を抑えつつ,ある程度のスキルを維持できる言語モデルについて検討する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:54:23 GMT)
Acting on the Unseen: Communication-Free Collaborative Filtering for Decentralized Multi-Robot Task Allocation [43.0] 隠れた低ランク構造はどのロボットがどのタスクに合うかを支配しており、ラウンドよりもはるかに多くのタスクがある。
しかし、各ロボットは、ブロードキャスト上でオンラインで低ランクの協調フィルタリングを実行することで、決して試みなかったタスクにうまく対応し、新しいタスクをオンボードで実行することができる。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:33:40 GMT)
Certified Robustness from Approximate Gaussian Mixture Structures in Pretrained Latent Spaces [43.0] ディープラーニングモデルは敵の摂動に弱い。
実証的な防御は、実際に強い堅牢性を達成することができるが、正式な保証は欠如している。
本稿では,データ表現における潜在構造を利用する頑健な分類器を設計するためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:12:58 GMT)
DIVA: Harnessing the Representation Divergence in Unified Multimodal Models for Mutual Reinforcement [42.9] 統一マルチモーダルモデル(UMM)は、理解と生成の両方において優れた性能を示している。
我々は、異なる監視信号によって誘導される誘導バイアスに起因する根本的な課題を特定する。
本研究では,自己改善型ポストトレーニングフレームワークであるDIVAを提案し,表現の発散を内部のシナジーに変換する。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:17:32 GMT)
LLM-as-a-Reviewer: Benchmarking Their Ability, Divergence, and Prompt Injection Resistance as Paper Reviewers [42.1] 大規模言語モデル(LLM)は、学術的ピアレビューでますます使われている。
898 論文に LLM-as-a-Reviewer のベンチマークを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:32:13 GMT)
Visualizing the Invisible: Generative Visual Grounding Empowers Universal EEG Understanding in MLLMs [42.0] 生成的ビジュアルグラウンド(GVG)は、脳波から画像への生成モデルを視覚翻訳器として使用することにより、見えないものを可視化する。
GVGは、非視覚的脳波のインスタンス固有のプロキシイメージを幻覚させ、MLLMが臨床状態の解釈のために視覚的優位性を利用することを可能にする。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:00:23 GMT)
Rethinking Weak Supervision in Anomaly Detection: A Comprehensive Benchmark [42.0] 本稿では、WSADBenchについて紹介する。WSADBenchは、異なる弱い教師付きシナリオで評価を統一する最初のベンチマークである。
700K以上の実験に基づいて、WSADBenchは4つの重要な洞察を明らかにしている。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:32:58 GMT)
OASIS: Observation-Action Space Alignment via SE(3) Trajectory Prediction for Robotic Manipulation [41.8] 本稿では,中間表現と作用空間を$SE(3)$ trajectory predictionで整列するビジュモータポリシーを提案する。
OASISは、3D対応の機能エンコーダを結合し、視覚言語とメートル法深度機能を$SE(3)$ trajectory predictorで融合する。
OASISは、VLAとWAMのベースラインを成功率とアウト・オブ・ディストリビューションの一般化で上回っている。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:28:33 GMT)
Automatic Layer Selection for Hallucination Detection [41.6] 幻覚関連信号は、大言語モデルの最終層(LLM)よりも中間層に強く符号化されている
提案する選択基準は, 最適層, 準最適層を連続的に同定するFEPoID (First Effective Peak of Intrinsic Dimension) である。
FEPoIDはトレーニング不要で、計算オーバーヘッドは無視できる。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:28:23 GMT)
Neural Router: Semantic Content Matching for Agentic AI [41.4] 大規模言語モデル(LLM)は、エージェントAIのためのコンテンツベースのパブリッシュ/サブスクライブブローカのセマンティックマッチングエンジンとして機能する。
3つの公開データセット上でオフラインのマルチラベル検索として評価され、我々の中心的な貢献は2つのクロスオーバーコストのキャラクタリゼーションである。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:58:53 GMT)
ControlLight: Towards Controllable, Consistent, and Generalizable Low-Light Enhancement [41.2] ControlLightは、低照度拡張のためのコントロール可能で一貫性があり、一般化可能なフレームワークである。
ControlLightを使えば、ユーザーは満足のいく改善結果のために、現実世界の劣化した低照度画像を編集できる。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:23:56 GMT)
From Early Adoption to Sustained Use: Understanding GenAI Usage Among Software Developers in Italian SMEs [41.1] 本研究では,GenAIツールの使用を継続する開発者の意図に関連する要因について検討する。
自発的な職業的文脈では、持続的な使用は主に社会的・組織的な支援よりも個人レベルの要因によって推進される。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:47:46 GMT)
Learning Latent Dynamical Causal Processes for Single-Cell Perturbation Prediction [40.7] 単細胞摂動予測は、細胞が目に見えない介入にどのように反応するかを推測することを目的としている。
単一セル摂動データに対する潜在動的因果生成モデルを提案する。
適切な条件下では、潜伏因果変数は標準同値クラスまで回復可能である。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:32:23 GMT)
AdvantageFlow: Advantage-Weighted Least Squares for RL in Flow Models [40.6] 本稿では,フローモデルのための前処理強化学習アルゴリズムAdvantageFlowを紹介する。
安定フロー分布問題と負重み付きフォワードプロセスロールアウト問題の両方より優れている。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:32:14 GMT)
Proactive for Uncertainty: Cause-Aware Error Diagnosis and Interactive Clarification for Spoken Dialogue Systems [40.3] 本稿では,SDSにおけるロバスト性を根本的に再考する原因認識型エラー回復パラダイムを提案する。
従来の信頼度フィルタリングとは異なり、我々は小さな精度に焦点を絞った検出器群を導入している。
この微細な診断知能は、LLMがターゲットとするマルチターンの明確化戦略を編成する権限を与える。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:57:38 GMT)
Rounding Almost Commuting Hamiltonians [40.0] 通勤ハミルトニアンは古典的な制約満足度と量子多体物理学の境界に位置している。
半可換な2ドル局所量子ハミルトニアンを、可換な方法で効率的に近似する方法を示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:53:36 GMT)
RePlan-Bot: Multi-Level Replanning for Embodied Instruction Following [40.0] EIF(Embodied instruction following)は、対話型3D環境において複雑な自然言語コマンドを理解し実行する必要がある。
RePlan-Botはタスク実行全体を通してマルチレベルかつ連続的な再計画を行う新しいEDFエージェントである。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:44:18 GMT)
SkillOpt: Executive Strategy for Self-Evolving Agent Skills [39.9] SkillOptはエージェントスキルのためのコントロール可能なテキストスペースである。
別々のモデルでは、スコアの付いたロールアウトを1つのスキルドキュメントのバウンダリされた追加/削除/リプレースに切り替える。
学習速度の予算、拒否編集バッファ、エポックワイド/メタアップデートは、スキルトレーニングを安定させる。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:58:16 GMT)
StreamOV: Streaming Omni-Video Understanding via Evidence-Guided Memory and Response Triggering [39.9] StreamOVは、バウンドメモリとプロアクティブ応答トリガを備えた効率的なオンラインオーディオ視覚推論のための、新しいStreaming Omni-Video理解フレームワークである。
応答のタイミングを決定するために、隠れ状態駆動のトリガーを使用しており、明示的なサイレントトーケン生成と外部ルータを避けている。
さまざまなストリーミングとビデオのベンチマークで最先端のパフォーマンスを実現し、オンラインとオフラインの両方のビデオ理解に有効であることを実証している。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:23:19 GMT)
Optimal Design for Multinomial Logit Model with Applications to Best Assortment Identification [39.8] マルチノミアルロジット(MNL)バンドの最適設計について検討した。
線型あるいは一般化された線形帯域とは異なり、MNLバンドは非線形作用空間を持つ。
我々は,MNLの盗賊を識別する最善のアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:41:56 GMT)
Nonstationary Generalized Linear Bandits with Discounted Online Mirror Descent [39.8] 本研究では,非定常線形計算(GLBs)について検討し,期待される報酬を未知の時間変化パラメータを持つ非線形リンク関数を用いてモデル化する。
本稿では,パラメータ推定に割引オンラインミラー降下(DOMD)を利用する非定常GLBに対する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:40:32 GMT)
MobileGym: A Verifiable and Highly Parallel Simulation Platform for Mobile GUI Agent Research [39.7] MobileGymは、日常的なモバイル利用のための軽量で完全に制御可能な環境である。
階層化された状態モデルと宣言的なタスク定義フレームワークは、状態のプログラマビリティとタスク作成を大規模に実践的に保ちます。
単一のプログラム的判断メカニズムは、決定論的評価評価と高密度報酬の両方を提供する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:59:49 GMT)
Beyond Literal Translation: Evaluating Cultural Effectiveness in Social Media UGC [39.7] 我々はソーシャルメディア翻訳のベンチマークであるCULTURE-MTを紹介する。
CULTURE-MTは、14のドメインにまたがる1,002のノートで構成され、カルチャーロードされたシンボルと言語スタイルの特徴に基づいて4つのタイプに分類される。
本稿では,表現精度と文化的適応性に着目し,新しい評価基準としての文化的有効性を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:29:25 GMT)
In-Context Optimization for Retrieval-Augmented Generation: A Gradient-Descent Perspective [39.4] テキスト内最適化プロセスとしてのRAGについて検討する。
1つの線形自己アテンション層は、統一線形化RAG目的に対して1つの勾配-退化ステップを実装可能であることを示す。
我々は、このビューをROG LLMの軽量な方法に変換する。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:04:54 GMT)
LongAV-Compass: Towards Unified Evaluation of Minute-Scale Audio-Visual Generation Across T2AV, I2AV, and V2AV [39.2] LongAV-は、マイクロ・オーディオ・ビジュアル・ジェネレーションのための体系的なベンチマークである。
テキスト・トゥ・オーディオ・ビデオ(T2AV)、画像・トゥ・オーディオ・ビデオ(I2AV)、ビデオ・トゥ・オーディオ・ビデオ(V2AV)にまたがる284のテストケースで構成されている。
このフレームワークは、音質、断面積の整合性、大域的な物語のコヒーレンス、セマンティックアライメント、オーディオ視覚アライメントをカバーする20以上のきめ細かい寸法を評価する。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:12:09 GMT)
RoMo: A Large-Scale, Richly Organized Dataset and Semantic Taxonomy for Human Motion Generation [39.2] RoMoは、広義の、大規模で、慎重にキュレートされた人間の動きのデータセットである。
すべてのシーケンスは詳細なキャプションで注釈付けされ、新しい3段階のセマンティック分類によって編成される。
我々は、RoMoでトレーニングされたモデルが、複雑な微妙なテキストプロンプトのより優れた理解を得ながら、最先端の忠実さと多様性を達成することを実証した。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:07:18 GMT)
Unsupervised learning for the systematic identification of nondispersive wave packets in driven helium [39.1] 駆動ヘリウム中の非分散波束は、拡散することなく古典共鳴軌道に従う長寿命量子状態である。
本研究では,駆動ヘリウム原子中の物理的関連状態の同定を自動化するための教師なし学習手法を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:14:16 GMT)
From Contrast to Consistency: Rethinking Event-based Continuous-Time Optical Flow Estimation [39.0] イベントベースのカメラは、明るさの変化を非同期に捉え、微妙な時間的精度で動きをモデル化するユニークな機会を提供する。
時空間構造整合性(STSC)の原理に基づく連続時間光フロー推定のためのハイブリッド制御フレームワークを提案する。
提案手法は,学習パラダイムの有効性を実証し,連続時間および標準光フロー推定における最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:24:23 GMT)
High fidelity preservation of photonic hyperentanglement in a free-space optical delay line [39.0] フォトニックハイパーエンタングルメントは、情報容量の増大と量子通信とネットワークのための機能強化を可能にする。
高絡み合い光子対における分極とエネルギー-時間絡み合いの保存は、ネストしたHerriott細胞をベースとした自由空間光遅延線を用いて実証した。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:02:14 GMT)
Clarify, Abstain or Answer? Strategising in Conversation with Belief-Augmented Generation [38.8] 大規模言語モデル(LLM)はテキスト上の分布を定義し、不確実性の確率的表現と見なすことができる。
提案するBelief-Augmented Generation (BAG) は,これらのKサンプルに対して,会話戦略を決定するための理由を与える。
BAGは6つのモデルのQA精度を改善し、即時のみのベースラインよりも信条に忠実な戦略決定を下す。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:29:02 GMT)
Harmony in Diversity: Multi-domain Contrastive Policy Optimization for Large Reasoning Models [38.7] 後学習は大規模推論モデル(LRM)の推論能力を大幅に向上させた
マルチドメイン設定におけるGRPOスタイルのRLメソッドは、ポリシー最適化に固有の干渉があるため、すべてのドメインで一貫した改善を達成できないことが多い。
マルチドメインコントラストポリシー最適化(MCPO)を提案し、ロールアウト間の構造的関係を分析し、ドメイン間の知識共有を促進する。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:42:57 GMT)
Context-driven Missing-Modality Learning for Robust Medical Diagnosis with Image-Tabular Data [38.5] 本稿では,コンテキスト駆動型ミス・モダリティ学習フレームワークを提案する。
連続的にモダリティ合成とセマンティックアライメントを行い、堅牢な診断を実現する。
最先端のSOTA(State-of-the-art)法では、それぞれ1.26%、0.97%、1.32%のAVG AUCの改善を実現している。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:44:26 GMT)
How Accurate are Video Quality Models for Diffusion-Based Video Super-Resolution? [38.5] 拡散型VSR法の性能評価に既存の映像品質モデルを用いることができるかを検討する。
モデル予測と主観的テストの結果を比較した。
テストされたビデオ品質モデルはいずれも、相補的な主観的テストを置き換えるのに十分な精度に達していない。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:18:22 GMT)
CelerLog: Fast Log Parsing via Dynamic Routing [38.0] 本稿では,高速かつ効果的なログ解析システムであるCelerLogを提案する。
我々はCelerLogが最先端のベースラインよりも高いパフォーマンスを実現していることを示す。
トークン消費を80.2%減らし94.1%減らし、LLMの呼び出しを86.4%減らして90.9%減らす。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:22:31 GMT)
Perceive-then-Plan: Layout-as-Policy for Monocular 3D Scene Layout Estimation [37.6] 1つの画像から構造化された3Dシーンレイアウトを構築するには、物理的および空間的制約で視覚的な観察を調整する必要がある。
視覚言語モデルを用いた単眼3次元レイアウト推定を知覚的テーマプラン問題として定式化する。
本稿では,計画段階を政策学習問題とするレイアウト・アズ・ポリシィ(LaP)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:16:19 GMT)
RICE-PO: Turning Retrieval Interactions into Credit Signals for Reasoning Agents [37.3] 本稿では,検索インタラクションを局所的な学習信号に変換する,批判のないポリシー最適化フレームワークであるRICE-POを提案する。
BRIGHTとBEIRでは、RICE-POはプロンプトベースのエージェントとグループベースのRLベースラインを同じレシーバー設定で一貫して上回る。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:56:29 GMT)
ProSR: Process-Shaped Spatial Reasoning for Reliable Chain-of-Thought in VLMs [37.1] 本稿では,空間推論のためのプロセス形成最適化フレームワークであるProSRを提案する。
ProSRは、最適化目標を単一回答の正しさから、視覚的依存と軌道安定性の2つのプロセスレベルに拡張する。
実験により、ProSRはより安定し、より視覚的証拠に依存する推論軌道を発生させながら、回答の精度を向上することが示された。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:27:28 GMT)
Does Seeing More Mean Knowing More? Mono-Anchored Advantage Normalization for Multi-Source Visual Reasoning [37.0] 本稿では,視覚的モダリティを独立した情報ソースとしてモデル化する,単調なマルチソース推論フレームワークを提案する。
本手法は,勾配推定におけるマルチソース統合による情報ゲインを効果的に定量化する。
また、GRPOとDAPOは3.2%、パフォーマンスは4.9%向上した。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:29:07 GMT)
A Clinically Validated Foundation Model for Comprehensive Lung Pathology Interpretation [37.0] PulmoFoundation(プルモファウンデーション)は、肺病理の総合的評価のための、RCT(RCT)評価基礎モデルである。
本モデルでは, 生検, 凍結部, 外科的切除スライスを対象とし, コア診断タスクにおける臨床成績を評価する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:04:56 GMT)
Context-Instrumental Data Distillation for Kubernetes Manifest Generation: Method and Experimental Evaluation [36.9] 本稿では,ドメイン固有言語(AML)におけるアーティファクトを生成するために,最大40億のパラメータを持つ小言語モデルの特殊化について検討する。
本稿では, 実Yファイルからの逆命令生成により, ソースコーパスを合成生成し, 拡張スキームで生成する, 文脈構造データ蒸留法を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:30:38 GMT)
Extreme Region Policy Distillation [36.6] 積極的多段階最適化は早い初期ゲインをもたらすが、過度な更新は軌道の確率を逸脱させ、エントロピーを崩壊させる。
これは、サンプル効率をKL効率から切り離す2段階のフレームワークであるERPD(Extreme Region Policy Distillation)を動機付けている。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:32:24 GMT)
Why LLMs Hallucinate on Structured Knowledge: A Mechanistic Analysis of Reasoning over Linearized Representations [36.5] 幻覚はランダムノイズではなく、系統的な内部力学から生じる。
第一に、注意は、完全なコンテキストに分散するのではなく、ショートカットのような構造的手がかりに焦点を合わせている。
第二に、フィードフォワード表現は提供された知識を根拠にせず、モデルがパラメトリックメモリに戻る。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:08:59 GMT)
SFR-Net: Learning Scale-Frustum Representations for Ultra-Wide Area Remote Sensing Image Segmentation [35.9] 本稿では,UWA(Ultra-wide Area)リモートセンシング画像を対象とした新しいセグメンテーションタスクを提案する。
本稿では,UWAセグメンテーションの課題に対処するため,SFR-Net(Scale-Frustum Representation Network)を提案する。
SFR-Netは最先端のパフォーマンスを実現し、mIoUを1.72%改善し、4.29%改善した。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:45:50 GMT)
An Efficient and Privacy-Preserving Architecture for Cross-Institutional Collaborative RAG [35.6] Retrieval-Augmented GenerationはLLMに外部知識を付与する。
厳格なプライバシー規制は、そのようなコラボレーションを妨げる「データサイロ」を深刻なものにする。
我々は,高スループットでプライバシ保護のフェデレートされたRAGフレームワークであるFedRAGを紹介する。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:18:19 GMT)
The Age of Curiosity Meets the Age of AI: Benchmarking Child Safety in Large Language Models [35.6] 7歳から11歳の子ども向け大規模言語モデルの安全性を評価するベンチマークであるKIDBenchを紹介する。
KIDBenchには10のカテゴリにわたる現実的な子クエリがあり、シングルターンプロンプトとマルチターンの子-アクターシミュレーションがある。
KIDGuardLlamaは子供指向の反応モデルであり、KIDBenchがより安全な子供向けAIをどのようにサポートするかを示している。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:14:58 GMT)
Back to Parsimonious Latents: Learning Task-Centric World Models from Visual Foundations [35.5] 本稿では,基礎モデル埋め込みをコンパクトでタスクに適した世界表現に変換するためのフレームワークを提案する。
TC-WM は、動的空間としてコンパクトなラテントに高次元の視覚的埋め込みを射影する。
TC-WMは、タスク中心の潜在要因を単純な変換まで特定するのに十分であることを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:21:43 GMT)
The Illusion of Competence: Self-Perceived Digital Literacy and AI Readiness Among European Secondary Students [35.2] 本研究では,自己認識型デジタルリテラシーと実際の技術準備のギャップについて検討する。
学生は、受動的デジタル消費における最大自己効力度を報告するが、アクティブな技術創造とアルゴリズム論理を評価すると、急激に低下する。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:29:03 GMT)
Reinforcing Few-step Generators via Reward-Tilted Distribution Matching [34.9] RTDMD (Reward-Tilted Distribution Matching Distillation) を提案する。
報奨型教師分布へのKL分散の最小化は,自然に分布マッチング項と報奨項に分解されることを示す。
SD3、SD3.5、FLUX.2の実験は、RTDMDが嗜好、美学、作曲のメトリクスをまたいだ新しい最先端の結果を確立することを示した。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:59:21 GMT)
On-Policy Adversarial Flow Distillation for Autoregressive Video Generation [34.7] 逆流蒸留(英: Adversarial Flow Distillation、AFD)は、異種ブラックボックスビデオ蒸留のためのオンラインフレームワークである。
AFDは教師に問い合わせ、同じプロンプトで現在の生徒をロールアウトする。
AFDは、教師のスコア、潜伏者、軌道の騒音、ステップアライメント、逆鎖強化学習を必要とせず、高密度な速度場監視を提供する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:58:12 GMT)
Is Inference Mediated by Distinct Semantic Structures in LLMs? A Mechanistic Interpretation [34.5] トランスフォーマー表現はラベルレベルの情報を運ぶことが知られているが、それらのラベルを生成するセマンティック操作をエンコードしているかどうかは不明である。
一つの意味変換によって異なる制御された前提-仮説ペアを用いて、自然言語推論においてこれを考察する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:21:07 GMT)
Agreement Metrics for LLM-as-Judge Evaluation: What to Report and Why [34.4] 最近のLLM-as-judge論文24件の調査では、判定尺度、ネクタイハンドリング、不正出力、禁断ハンドリングに絡み合ったメトリックの選択が見つかった。
Pearson's $r$、Spearman's $、Kendall's $_b$、phi係数$$、Matthews correlation Coefficientはすべて1つの数に還元される。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:31:44 GMT)
AnyScene: Towards Highly Controllable Driving Scene Generation at Anywhere and Beyond [34.2] AnySceneは、シーン生成を駆動するための統一された占有中心のフレームワークである。
空間時間占有拡散変換器を用いて、BEVレイアウトからセマンティック占有シーケンスを生成する。
生成した占有に基づいて、Geometry-Grounded View Expansionモジュールは、占有を標準空間表現として扱う。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:59:48 GMT)
Mitigating Provenance-Role Collapse in Long-Term Agents via Typed Memory Representation [33.5] 本稿では,ソースモニタリングを構造制約として運用する型付きメモリ中間表現であるMemIRを提案する。
MemIRは、長期記憶を基底原子に書き、生の証拠、検索の手がかり、真理を含む主張を分離する。
LoCoMoとBEAM-100Kの実験は、MemIRが既存のメモリベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:56:31 GMT)
IndexMem: Learned KV-Cache Eviction with Latent Memory for Long-Context LLM Inference [33.4] 我々は、KVの重要性を予測し、クリティカルトークンのより正確な保持を可能にする学習可能なインデクサを導入する。
本稿では,トークンをコンパクトでオンライン更新された状態に圧縮する軽量潜在メモリモジュールを提案する。
提案手法は,境界KV予算下での高精度な長文推論を可能にする。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:29:43 GMT)
ScenePilot: Controllable Boundary-Driven Critical Scenario Generation for Autonomous Driving [33.3] 安全クリティカルなシナリオは、自律運転システム評価の中心である。
ほとんどのシナリオ生成方法は、周囲のエージェントを敵として扱う。
本稿では,境界帯域を対象とする実現可能性誘導フレームワークであるScenePilotを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:34:30 GMT)
Latent Representation Alignment for Offline Goal-Conditioned Reinforcement Learning [33.2] オフライン目標条件強化学習アルゴリズムであるLatent-Aligned Value Learning (LAVL)を提案する。
OGBenchの実験は、LAVLが既存のオフラインGCRLメソッドより一貫して優れていることを示した。
LAVLは長距離タスクや軌道縫合データセットで強い性能を示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:54:04 GMT)
Explaining Too Much? Understanding How Large Language Model Reasoning Traces Influence Performance and Metacognition [32.9] トレースは透明性のメカニズムとして考えられているが、人々が問題を解決するためにどのように使うのかは定かではない。
参加者は3つの条件のうちの1つで10つのLSAT型推論問題を解いた。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:46:04 GMT)
The Quantization Benefits of Residual-Free Transformers [32.7] 残差接続は、訓練中に変圧器の活性化をガウス性から遠ざけることを示す。
言語タスクでは、完全な性能の低下は少ないが、これらのモデルはガウス近傍の活性化を保持し、低ビット量子化に対するロバスト性を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:06:02 GMT)
Bridging the 2D-3D Gap: A Hierarchical Semantic-Geometric Map for Vision Language Navigation [32.0] Vision-Language Navigation (VLN) は、エンボディエージェントが言語命令に従うことで、見えない環境でターゲットの場所に到達することを可能にする。
近年の視覚言語モデル(VLM)の進歩にもかかわらず、重要な意味幾何学的ギャップが残っている。
本稿では3次元幾何学情報をVLMと互換性のある構造化表現に変換する階層型意味幾何学マップ(HSGM)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:53:21 GMT)
Towards 3D heart mesh generation using contactless radar imaging and physics-informed neural network [31.2] ミリ波レーダーと合成開口レーダ(SAR)モードは、プライバシ保護とポータブルな臨床応用を提供する。
粗いメッシュ変形プロセスとしてタスクを再構成する新しいフレームワークであるSAR2Meshを提案する。
本稿では、3次元から2次元のサンプリングによる多視点特徴抽出のための幾何学的特徴投影モジュールと、予測幾何と生のレーダーエコーとの整合性を強制する物理インフォームドレーダロスを導入する。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:20:52 GMT)
Multi-Agent Systems are Mixtures of Experts: Who Becomes an Influencer? [31.0] Friedkin-Johnsen(FJ)パラメータが入力依存であることを示し、マルチエージェントの議論を専門家の混在に転換する。
我々は、エージェントの自己評価された信頼、認識された信頼、および他のエージェントの見解との最初の一致という、観測可能なプロキシを通して、どのように影響が確立されるかを分析する。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:10:48 GMT)
How do Humans Process AI-generated Hallucination Contents: a Neuroimaging Study [30.6] 画像記述の正しさを判定する検証作業中,27人の被験者の脳波信号を記録する。
複数の認知過程、例えば、セマンティック統合、推論処理、メモリ検索、認知的負荷は、人間が幻覚的コンテンツと非幻覚的コンテンツとを処理する際に異なるパターンを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:08:16 GMT)
EchoPilot: Training-Free Ultrasound Video Segmentation via Scale-Space Semantic Prompting and Reliability-Gated Memory [30.3] EchoPilotは、スパースファーストフレームインタラクション下での超音波ビデオセグメンテーションのためのトレーニング不要のフレームワークである。
セマンティックローカライゼーションのためのフリーズド医療ビジョン言語モデル、密集した幾何学的特徴抽出のためのビジョン基盤モデル、マスク予測と伝搬のためのプロンプト可能なビデオセグメンタを編成する。
671フレームのダイナミック胎児胎盤超音波ビデオセグメンテーションデータセットを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:22:05 GMT)
EMA-Nesterov: Stabilizing Nesterov's Lookahead for Accelerated Deep Learning Optimization [29.9] 標準ネステロフを指数移動平均(EMA)で置き換える簡単な修正であるEMA-Nesterovを提案する。
言語モデル事前学習に関する実証的証拠を提示し、EMA-ネステロフが様々な微調整ベースで広く適用可能であることを検証する。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:39:10 GMT)
PixelWizard: Towards Efficient High-Fidelity Video Generation at Ultra-Large Spatial Resolution [29.8] PixelWizardは、ネイティブな2K/4Kビデオの生成サンプリングを10倍高速化しながら、優れた視覚的品質を実現している。
PixelWizardは、ネイティブな2K/4Kビデオの生成サンプリングを10倍以上加速しながら、優れた視覚的品質を実現している。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:50:49 GMT)
Towards Reliable Fetal Ultrasound Interpretation with Multi-Agent Collaboration [29.8] FetUSAgentsは、包括的胎児超音波解釈のためのツール拡張マルチエージェントシステムである。
視覚的質問応答(VQA)、レポート生成、画像キャプション、ビデオ要約をサポートする。
胎児超音波専用のVQAベンチマークであるFetUS-VQAを1,892枚の画像と3,205枚の質問応答対から構成する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:22:53 GMT)
Balancing Plasticity and Stability with Fast and Slow Successor Features [29.7] 持続的環境変化下での安定性と適応がパフォーマンスに与える影響について検討する。
その結果, 可塑性に着目したシナプス強化などの安定性向上手法が優れていることがわかった。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:05:32 GMT)
GeoSVG-RL: Geometry-Aware Reinforcement Learning for Layout-Constrained Text-to-SVG Diagram Generation [29.6] レイアウト制約付きテキスト・ツー・SVG生成のための特殊強化学習フレームワークGeoSVG-RLを紹介する。
モデルはまず、SVGコードの後の世代のための幾何学的契約として機能する構造化レイアウト計画を生成する。
GeoSVG-RLは、特にアローアンカー精度とテキスト・イン・ボックスレートにおいて、構造的信頼性を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:56:44 GMT)
Anatomy-Anchored Self-Supervision: Distilling Vision Foundation Models for Invariant Ultrasound Representation [29.6] 自己指導型事前訓練パラダイムは, 医用画像における伝達可能な表現の学習において, 優位性を高めている。
一般的な視覚領域から臨床的に有意な解剖構造へ表現学習を移行させる解剖学的アンコール超音波自己監督フレームワークANAUSを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:52:58 GMT)
Can LLMs Introspect? A Reality Check [29.1] 我々は、行動証拠だけでは、強い内省的主張を確立するには本質的に不十分であると主張している。
最近導入された2つの評価パラダイムを再検討する。
最初のパラダイムでは、モデルが内部状態が改ざんされているかどうかを検出することが期待されている。
モデルでは、内部状態に対するそのような介入と入力の操作を確実に区別することはできない。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:07:49 GMT)
Continual Speaker Identity Unlearning with Minimal Interference [28.9] 機械学習は、事前訓練されたモデルから指定された概念や知識を取り除く。
しかし、既存の方法は、学習されていないすべてのリクエストが同時にやってくることを静かに仮定する。
この仮定は最先端の手法を破り、未学習が排除することを目的とした、非常にプライバシー上のリスクを再導入することを示している。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:40:04 GMT)
Pantheon360: Taming Digital Twin Generation via 3D-Aware 360° Video Diffusion [28.8] 3D-Aware 360 Video DiffusionによるPantheon360: Taming Digital Twin Generationを紹介する。
キーとなるアイデアは、ユーザが定義した任意のカメラパスの幾何学的な足場として機能する、入力から再構築された明示的な3Dキャッシュである。
実験により、パンテオン360は優れた視覚的品質と未整合幾何学的コヒーレンスを達成することが示された。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:00:01 GMT)
Hy-MT2: A Family of Fast, Efficient and Powerful Multilingual Translation Models in the Wild [28.7] Hy-MT2は、一般的な実世界のビジネス、ドメイン固有、命令フォローする翻訳タスクで優れたパフォーマンスを提供する。
7Bと30Bは、DeepSeek-V4-ProやKim K2.6のようなオープンソースモデルよりも高速に考えられたモードで優れている。
軽量の1.8Bモデルは440MBのストレージしか必要とせず、1.5倍の推論スピードアップを実現している。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:05:16 GMT)
BigMac: Breaking the Pareto Frontier of Compute and Memory in Multimodal LLM Training [26.9] BigMacはマルチモーダルな大規模言語モデル(MLLM)のための新しいトレーニングパイプラインである
エンコーダとジェネレータを元のLLMパイプラインにネストし、依存性を安全なネストしたパイプライン構造を形成する。
メモリ無制限の理想設定と同じ計算効率を実現する。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:01:45 GMT)
When Can We Trust Early Warnings? Leakage-Excluded Early Outcome Prediction from LMS Interaction Logs [26.7] 我々は、時間的可用性制約の下で、カットオフに基づく早期結果予測を形式化し、LEAPを導入する。
LEAPは、結合と集約の前にカットオフファーストの停止を強制し、ポストカット後のエビデンスがベンチマークに入るのを防ぐために、機能証明を特徴とする。
結果は、観察ウィンドウが拡大するにつれてパフォーマンスが向上し、約3週間で顕著に上昇した。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:41:40 GMT)
SplitAvatar: One-shot Head Avatar with Autoregressive Gaussian Splitting [26.6] 単一画像からアニマタブルヘッドアバターを再構成する新しい手法を提案する。
本稿では,ガウスを粗いものから細かいものへと段階的に生成するグラフ分割ネットワークを提案する。
このプロセスは、GNN誘導分割によって実現され、より正確な顔の詳細を合成し、より高い再構築品質を実現する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:02:43 GMT)
Closed-Loop Bidirectional Prompting for Adversarial Robustness of Vision Language Models [26.1] 視覚言語モデルは、モーダル間のセマンティックアライメントを妨害する敵の摂動に対して非常に脆弱である。
凍結エンコーダ上の動的フィードバックループを経由し, 相互合意回復として頑健な適応を図ったクローズドループ双方向プロンプトを提案する。
セマンティックアンカーは、周期的な更新を制限し、摂動によって引き起こされる特徴の破損を軽減するために安定して導入される。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:00:07 GMT)
RotMoLE: Enhancing Mixture of Low-Rank Experts through Rotational Gating Mechanism [26.1] 回転ゲートを付加した低ランクの専門家のための特殊なMoEフレームワークであるRotMoLEを提案する。
RotMoLEは、選択された専門家ごとに回転機構を実装し、優れた専門家の搾取と専門化を可能にする。
複雑なマルチタスクおよび多言語学習シナリオに関する実証的な結果が、我々の有効性を検証する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:18:36 GMT)
Missing Pattern Recognized Diffusion Imputation Model for Missing Not At Random [26.1] ミスパターン認識拡散計算モデル(PRDIM)について紹介する。
PRDIMは欠落したパターンをキャプチャし、観測されていない値を正確に暗示する。
我々は, PRDIM が MNAR 設定下での強い計算性能を一貫して達成できることを実証した。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:29:59 GMT)
DRScaffold: Boosting Dense-Scene Reasoning in Lightweight Vision Language Models [26.0] 軽量ビジョン言語モデルは標準ベンチマークで競合するが、密集したシーンの推論で体系的に失敗する。
既存の訓練信号は、推論ステップと基礎となる視覚的実体と関係の間に明確な根拠を与えない。
DRScaffoldは、監督対象を4つの因果的に順序付けられた段階に分解する教師付き微調整フレームワークである。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:05:52 GMT)
TriDP-PTM: a three-stage distortion-perception tradeoff guides the pre-training model for radar cardiac sensing [25.7] 心臓血管疾患は世界的な死因であり、持続的かつ正確な非侵襲的な心臓モニタリングを必要とする。
非接触レーダーベースのアプローチは、しばしば単一の「歪曲駆動」または「知覚駆動」パラダイムを用いる。
本稿では,「直接レーダー・ツー・タスク」パスと「間接レーダー・ツー・ECG・ツー・タスク」パスを体系的に比較する,レーダに基づくマルチスケールフュージョン・デュアルパスフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:32:18 GMT)
Teaching Video Generators to Remember: Eliciting Dynamic Memory for Out-of-Sight State Evolution [25.6] ビデオモデルは、証拠が保存されていないときに進化する状態を維持すべきであるが、現在のジェネレータは割り込み時に隠れた状態を凍結することが多い。
本稿では,メモリ指向データ,イベント認識トレーニング,キャッシュ型適応による動的メモリ動作を実現するフレームワークであるReMindを紹介する。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:30:41 GMT)
SAFE-Diff: Scale-Aware Attention and Feature-Dispersive Diffusion with Uncertainty Estimation for Contrast-Enhanced Breast MRI Synthesis [25.5] 高忠実度造影MRIの合成は、より安全で効率的な乳癌検診に有用であるが、複雑な病変のテクスチャや異種拡張パターンのため、依然として困難である。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:19:16 GMT)
Evo-Attacker: Memory-Augmented Reinforcement Learning for Long-Horizon Tool Attacks on LLM-MAS [25.4] 既存のツールアタックはドメインの特異性や固定および静的テンプレートによって制限される。
本稿では,ツール攻撃を自己進化型,メモリ拡張型強化学習プロセスとして定式化するEvo-Attackerを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:33:45 GMT)
Personalized Generative Models for Contextual Debiasing [25.3] 稀な文脈を持つ画像のコヒーレントな合成を容易にするために,デカップリング・コンテクスト・パターンとジェネレーション(デカップルジェネレーション)を導入する。
複雑なシーンデータセットのオブジェクト分類と認識タスクに対するアプローチを評価する。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:58:15 GMT)
Subspace-Guided Semantic and Topological Invariant Registration for Annotation-Free Ultrasound Plane Quality Control [25.0] STRIQは、サブスペース誘導整合性測定問題として米国の飛行機品質管理を再放送する登録駆動フレームワークである。
さらに解剖学的平面を曖昧にし、負の知識伝達を緩和するために、直交知識部分空間モジュールを提案する。
社内のUS4QAデータセットとCAMUSデータセットの実験は、STRIQが臨床品質スコアと原則化された最先端の相関を達成していることを示している。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:44:04 GMT)
MuNet: A Mutualistic Network for Joint 3D Human Mesh Recovery and 3D Clothed Human Reconstruction from Single Images [24.7] 3次元メッシュの回復と3次元の衣服の復元は本質的に関連しているが、それらは長い間、孤立して研究されてきた。
本研究では,1枚の画像から3次元のメッシュ復元と3次元の再構成を行うための相互運用ネットワーク MuNet を提案する。
我々は,3次元メッシュ復元と3次元再構築のための6つのベンチマークデータセット上で,MuNetを広範囲に評価した。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:50:33 GMT)
CollectionLoRA: Collecting 50 Effects in 1 LoRA via Multi-Teacher On-Policy Distillation [24.7] CollectionLoRAは、最大50の異なる効果を持つLoRAの概念を単一のLoRAに蒸留できるマルチテラーオンライン蒸留フレームワークである。
CollectionLoRAは、すべてのカスタマイズされたエフェクトと数ステップ生成を単一のLoRAに蒸留し、デプロイオーバーヘッドを低減し、独立に訓練された教師モデルに匹敵するコンセプト忠実性を達成します。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:07:01 GMT)
Claw-Anything: Benchmarking Always-On Personal Assistants with Broader Access to User's Digital World [24.4] 大規模言語モデルエージェントは、ユーザのデジタル世界に関連するものにアクセス可能な、常時オンのパーソナルアシスタントとして想定される。
エージェントコンテキストを3次元に拡張するベンチマークであるClaw-Anythingを紹介する。
複数ラウンドのイベントインジェクションによって数ヶ月のユーザアクティビティをシミュレートし、複雑な世界状態と現実的なノイズを発生させる。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:50:04 GMT)
SemBridge: Language Transfer in Sparse Encoders via Multilingual Semantic Bridges [24.4] スパースエンコーダは語彙空間内の項の重要性を表すことによって高精度な検索を提供する。
英語中心の構造は、非英語言語への言語移動に重大な障害となる。
スパースエンコーダにおける言語間適応のための新しい埋め込み手法であるSemBridgeを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:20:03 GMT)
E$^3$C: Video Generation with 3D Environmental Memory and Ego-Exo Human Pose Control [24.4] E$3$Cは、自己中心型生成のための制御可能なビデオ拡散フレームワークである。
永続的なシーン構造を人間駆動のダイナミックスから切り離す構造的でコンパクトな条件を構築する。
E$3$Cは、視覚的忠実度、カメラモーションの精度、オブジェクトの一貫性、強力なベースラインに対するエゴとエクソの人間のコントロールを改善する。
論文参考訳(メタデータ) (Mon, 25 May 2026 20:13:16 GMT)
Reparametrizing Shampoo and SOAP for Subspace Basis Updates and BFloat16 Storage [24.4] KL-ShampooやSOAPといったシャンプーベースの手法は、ニューラルネットワークのトレーニングにおいて強力なパフォーマンスを示している。
本稿では,BFP16ストレージをサポートするプリコンディショナーの再パラメータ化を提案する。
私たちのアプローチは、KL-Shampoo、SOAP、KL-SOAPなど、QR分解を利用するShampooベースのメソッドに広く適用されます。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:03:03 GMT)
Step-TP: A Grounded, Step-Level Dataset with Chain-of-Thought Reasoning for LLM-Guided Tensor Program Optimization [24.2] Step-TPはテンソルプログラム最適化のためのトレーニング後のデータセットである。
構造的チェーン・オブ・シークレット(CoT)推論による、基底的で原子レベルのステップレベルの監視を提供する。
Step-TPは、中間プログラム状態上のクローズド推論ループを形成し、信頼性の高いマルチステップ最適化を可能にする。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:29:49 GMT)
Testing the Deliteralization Hypothesis in Human and Machine Translation [23.8] 我々は、翻訳が起草され、改訂されるにつれて、徐々にリテラルが減っていくという主張をテストする。
人間の翻訳と後編集のリテラリティを,54言語対にわたる2つのNMTシステムと6つのLLMシステムと比較した。
近年のLLMでは差が狭まっているものの, (i) 人間の翻訳は試験されたMTシステムに比べてはるかに少ないことが判明した。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:40:34 GMT)
Mosaic: Compositional Multi-Concept Erasure via Vector Field Blending [23.6] 概念消去は、テキスト・ツー・イメージ(T2I)モデルにおいて、安全で倫理的な画像合成を確保するための重要な研究方向として登場した。
一つのシーン内で複数のターゲット概念を同時に除去することを目的とした新しいタスクである構成的マルチコンセプト消去を導入する。
本稿では,フローベースT2Iモデルにおけるマルチコンセプト消去のための新しいフレームワークであるMosaicを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:27:26 GMT)
Depth Peeling for High-Fidelity Gaussian-Enhanced Surfel Rendering [23.4] DP-GESは半透明境界で不透明なサーベイルを拡大し、Depth Peelingを活用して正確なピクセル単位のオーダーを確立する新しい表現である。
この設計は、正しい透過率変調によるソートフリーガウススプラッティングを可能にし、エイリアスやポップアップアーティファクトを効果的に除去する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:03:20 GMT)
Findings of the Counter Turing Test: AI-Generated Text Detection [23.4] 本稿では、最先端のAI生成テキスト検出技術について包括的に分析する。
対数チューリングテスト(CT2)の共有タスクを通じて、その有効性を評価する。
トップパフォーマンスチームは、微調整されたトランスフォーマーモデル、アンサンブル学習、ハイブリッド検出アプローチを活用した。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:02:56 GMT)
Findings of the Counter Turing Test: AI-Generated Image Detection [23.4] AI生成画像のリアリズムの増大は、研究者、政策立案者、および業界のステークホルダーにとって、その検出を迫る関心を喚起する。
本稿では,AI生成画像検出のためのCounter Turing Test (CT2)を導入したDefactify 4.0ワークショップの成果を紹介する。
コンペティションは、(1)AI生成画像のバイナリ分類と(2)AI生成画像に責任がある特定の生成モデルの識別の2つの主要なタスクで構成された。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:44:54 GMT)
Capture-Calibrate-Coach: A Graph-Based Framework for Knowledge Monitoring Estimation and Adaptive Feedback [22.9] 本稿では適応学習支援のためのCapture-Calibrate-Coachフレームワークを紹介する。
カリバート相は、明示的に言及されていない概念に対して潜在認識状態を予測するために異種グラフニューラルネットワークを適用している。
Coachフェーズは学習者を5つのメタ認知パターンに分類し、知識ギャップと校正エラーの両方に対処するパーソナライズされたフィードバックを提供する。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:40:59 GMT)
Autoregression-Free Neural Operators for Time-Dependent PDEs [22.7] 本研究では, PDEの時間発展を潜在空間にマッピングし, 内部の連続時間ベクトル場をモデル化するオートレグレスフリーニューラル演算子(AFNO)を提案する。
AFNOは長水平予測の安定性を向上し、ベースラインと比較してロールアウトエラーを一貫して低減することを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:28:41 GMT)
Not only where, But when: Temporal Scheduling for RLVR [22.6] RLVR最適化の過程で、クレジット割り当て基準をスケジューリングする時間次元を導入する。
優先順位付けされたトークンは特定の政策行動で強調され、一般化に向けて徐々に減衰し、より安定的で効率的な学習ダイナミクスがもたらされることがわかった。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:10:51 GMT)
Squeezing Capacity from Multimodal Large Language Models for Subject-driven Generation [22.4] 既存のアプローチはしばしばテキストと参照画像を別々にエンコードする。
マルチモーダルモデルと拡散モデルを結ぶ最近のフレームワークは、命令のフォローを改善するが、ほとんどはアイデンティティの保存を見落としている。
テキストと参照画像を共同でエンコードする多モーダル大言語モデル上での拡散モデルを構築し,それをVAEベースのID条件付きで拡張する。
提案手法は,マルチモーダル理解とアイデンティティ保護を調和させ,コピー・ペースト問題を緩和し,主観的画像生成における人間の嗜好に関する優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:59:35 GMT)
DeGRe: Dense-supervised Generative Reranking for Recommendation [22.4] オフラインの探索とオンラインの効率のギャップを、密集した監督によって埋める、ジェネレーティブ・リグレード・フレームワークであるDeGReを提案する。
トレーニング中、評価器から高密度の監視信号に変換し、それらを軽量オンラインジェネレータに蒸留する。
私たちは、Taobao Flash ShoppingにDeGReをうまくデプロイし、オンラインレコメンデーションを大幅に改善しました。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:00:42 GMT)
Reinforcement Learning from Denoising Feedback [22.4] 拡散言語モデル(dLLMs)の強化学習(RL)における政策損失推定は依然として基礎的かつ長期にわたる課題である。
本稿では、ロールアウトとトレーニングプロセスから得られたフィードバックを活用して、正確かつ効率的なポリシー損失推定を容易にする新しいトレーニングパラダイムであるReinforcement Learning from Denoising Feedback (RLDF)を紹介する。
RLDFは、複数の推論ベンチマークにおいて、2つの代表的なdLLMアーキテクチャであるLLaDAとDreamのパフォーマンスと一般化性の両方において、一貫性と実質的な改善を実現している。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:39:13 GMT)
Unified Panoramic Geometry Estimation via Multi-View Foundation Models [22.2] PaGeR (Panoramic Geometry Reconstruction) は、パノラマ領域に強力な3D基盤モデルを持ち上げるためのフレームワークである。
我々の戦略は、3次元再構成のための事前訓練された変換器から始まり、それを統一された高性能モデルに変換することである。
室内環境と屋外環境の両方で我々の手法を広範囲にテストし、最先端のパフォーマンスを実現することを発見した。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:32:42 GMT)
Credit-assigned Policy Gradient for Early Stage Retrieval in Two-stage Ranking [22.0] バニラ政策勾配 (V-PG) は, ばらつきの発散により, 実用化に関係した候補セットサイズには拡張性がない。
本稿では,対象項目が任意の候補集合に選択される確率に対して勾配を計算する,新しい"cedit-assigned"ポリシー勾配(CA-PG)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 23:17:37 GMT)
GAC: Noise-Aware Adaptive Mixing for Hybrid SFT-RL Post-Training [22.0] 本稿では,2つの学習信号間の勾配差と不一致のオンライン推定から適応混合重みを導出する雑音認識型制御器GACを提案する。
数学、コード、科学、論理学のベンチマークの実験では、GACは強い固定とルールベースのベースラインよりも、ハイブリッドなポストトレーニングを一貫して改善している。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:52:29 GMT)
Curriculum Learning for Safety Alignment [22.0] カリキュラム学習がDPOベースの安全アライメントの堅牢性を向上させることができるかを検討する。
本稿では,選好データを難易度で整理するカリキュラムベースのフレームワークであるStaged-Competenceを提案する。
3つのモデルファミリーで平均的に評価されたStaged-Competenceは、OODの有害反応率を16%、ジェイルブレイク攻撃の成功率を20%削減する。
論文参考訳(メタデータ) (Mon, 25 May 2026 20:13:06 GMT)
From Privacy to Generalization: Linear Max-Information Bounds for DP-SGD [21.9] 我々は、微分プライベート勾配勾配(DP-SGD)の近似最大情報に有限サンプル境界を証明した。
DP-SGD で事前分布を学習できる汎用的な PAC-Bayes 一般化法と DP-SGD 学習モデル自体の一般化法を得る。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:00:05 GMT)
SAE-FD: Sparse Autoencoder Feature Distillation for Continual Learning of Large Language Models [21.8] methodは、事前訓練されたスパースオートエンコーダのスパース特徴空間におけるモデル表現をアンカーする。
2つの連続学習ベンチマークの実験では、手法が既存の正規化に基づく手法を一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:27:41 GMT)
Credit Assignment with Resets in Language Model Reasoning [21.7] ポストトレイン言語モデルは、トラジェクトリ内のすべてのトークンに対して、単一の結果報酬を均一に割り当てる。
この制限は、軌道全体を均一に更新するのではなく、目標とする故障推論ステップの洗練を可能にすることで対処できる。
本稿では、ランダムリセットポリシー最適化(RRPO)と自己リセットポリシー最適化(SRPO)の2つの手法を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:11:50 GMT)
SIREN: Unified Multi-Granularity Semantic Interaction for Multi-Modal Lifelong User Interest Modeling [21.6] 産業レコメンデータシステムは、進化するユーザの好みを捉えるために、生涯にわたるユーザ行動履歴とリッチなマルチモーダルコンテンツを活用している。
SIRENは,マルチモーダル・ライフタイム・ユーザ・関心モデリングのための統合された多言語間セマンティック・インタラクション・フレームワークである。
2025年7月から、SIRENはTencentの広告プラットフォームでフルトラフィックサービス用に完全にローンチされた。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:33:27 GMT)
Broadband Hyperspectral 3D Imaging using Dispersed Structured Light [21.4] 広帯域ハイパースペクトル3次元イメージング(BH3D)法を導入し、全可視近赤外および短波長赤外スペクトル(SWIR)に拡張する。
本稿では,高密度広帯域高スペクトル反射率を再構成する可視・SWIRカメラを備えたステレオ装置を用いた単一スペクトルBH3Dシステムを提案する。
我々は,様々な現実世界のシーンに対するアプローチを検証し,平均スペクトル角マッパーの0.13 rad,ルート平均角誤差の0.03,平均深さ誤差の4.5 mmで正確な再構成を実証した。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:09:46 GMT)
DRFusion: Drift-Resilient Temporally Consistent Infrared-Visible Video Fusion [21.3] ダイナミックシーンにおける包括的認識を実現するためには、赤外線および可視ビデオ融合が不可欠である。
時間的一貫性を維持することは、依然として恐ろしい課題だ。
本研究では,歴史条件付きモーション生成としてタスクを再構成するドリフト耐性ビデオ融合法を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:23:55 GMT)
STaT: Resolving Shape Distortion in Non-Stationary Time Series via Tri-Modal Synergy [21.1] シンボリック・テンポラル・テキストアライメントのための革新的なマルチモーダルアーキテクチャSTaTを紹介する。
また,STaTは例外的な性能を示し,従来の寸法指標を最大8.9%向上させるとともに,形状歪みを最大8.5%低減することを示した。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:21:06 GMT)
MDGMIX: Boundary-Aware Subgraph Mixing for Multi-Domain Graph Pre-Training [20.9] マルチドメイングラフ事前学習は基礎グラフモデルを構築する上で重要なステップである。
本稿では,マルチドメイングラフ事前学習における有意なデータ冗長性を実証的に明らかにする。
境界認識サブグラフの混合と階層的識別を組み合わせたマルチドメイングラフ事前学習フレームワークMDGMIXを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:21:27 GMT)
Active Budget Allocation for Efficient Scaling Law Estimation via Surrogate-Guided Pruning [20.9] 経験的スケーリング法の研究は、この予測タスクを支援する機能形式を特定する。
このアプローチの実証的な性質のため、計算負担はかなり大きい。
本稿では,パラメトリックおよび非パラメトリックサロゲートモデルと組み合わせた逐次ハルビング(SH)とSHの適合性について検討する。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:58:43 GMT)
StructBreak: Structural Cognitive Overload-Induced Safety Failures in MLLMs [20.6] MLLM(Multimodal Large Language Models)は構造的推論において優れているが、構造的整合性の急激な論理的脆さに悩まされている。
我々はこの現象を、深い推論と安全性の整合性の競合の副産物である構造的認知的過負荷(SCO)と呼ぶ。
SCOの定量化を目的としたエンドツーエンドの自動フレームワークであるStructBreakを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:41:51 GMT)
[CLS] is Not Enough: Multi-Label Recognition via Patch-Level Inference and Adaptive Aggregation [20.6] PIAAは、アダプティブアグリゲーション(Adaptive Aggregation)によって、パッチレベルの推論として予測を定式化する。
パッチレベルのスコアを最終的なマルチラベル予測に集約するアダプティブアグリゲーションモジュールを導入する。
実験の結果,提案手法は最小限の余剰計算で強い改善を達成できることがわかった。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:19:12 GMT)
Don't Retrain, Just Reuse: Recovering Dual-Target Molecules from Single-Target Diffusion Models [20.4] 既存のデュアルターゲット生成法は、ジェネレータを再訓練するか、サンプリング中に拡散過程に介入することによって、デュアルターゲット機能を導入する。
両ターゲット親和性, 化学的品質, 多様性を強制するために, 対条件探索と構造化多段階選択を組み合わせた階層的進化的入力空間探索フレームワークREUSEを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:39:16 GMT)
PowLU: An Activation Function for Stable Pre-Training of LLMs [20.3] 大規模LLM事前学習のための安定した活性化機能である電力線形ユニット(PowLU)を提案する。
具体的には、PowLUは適応非線形性を達成するために合理的なパワー関数を使用し、表現能力を改善し、スパイク領域での安定したトレーニングを可能にする。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:02:05 GMT)
Personalize-then-Store: Benchmarking and Learning Personalized Memory for Long-horizon Agents [20.2] 既存の大規模言語モデル(LLM)ベースのメモリシステムは、基本的な現実を覆い隠す、普遍的で静的なポリシーを適用している。
パーソナライズされたメモリシステムを評価するための最初のベンチマークであるPerMemBenchを紹介する。
本稿では,過渡セッションのメモリ操作を選択的にバイパスする軽量フレームワークであるセッションレベルのストレージゲーティングを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:48:33 GMT)
A Scalable Benchmark Test Suite for Dynamic Multi-Objective Optimization with a Changing Number of Objectives [20.2] 動的多目的最適化のためのスケーラブルなベンチマークテストスイートを提案する。
我々のベンチマークは、最大目的問題を定義し、目的のサブセットを動的に選択することで構成される。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:33:20 GMT)
Detail Consistent Stage-Wise Distillation for Efficient 3D MRI Segmentation [20.1] 本研究は, スケールにまたがる構造的詳細を保存する, 段階的蒸留フレームワークであるDCDを提案する。
エンコーダの各段階で、DCDはウェーブレット領域の方向詳細成分を蒸留するが、粗い近似は比較的拘束されない。
BraTS 2024 と ISLES 2022 のベンチマーク実験により、3次元マルチモーダルデータを用いたMRIセグメント化における優れた性能が得られた。
論文参考訳(メタデータ) (Mon, 25 May 2026 23:01:37 GMT)
Look Both Ways Before You Cross: Lifting Cross Fields From 2D Visual Priors [20.0] CrossLiftは、画像の視覚的特徴によってガイドされるメッシュ上のクロスフィールドを計算するためのテクニックである。
我々は、粗いユーザ描画線を信号として用いたインタラクティブなクロスフィールド設計とともに、テクスチャ整列クワッドメッシュへのさらなる応用を示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:23:23 GMT)
TIAR: Trajectory-Informed Advantage Reweighting for LLM Abstention Learning [19.9] 本稿では,大規模言語モデルにおける真さを動機づける3次報酬を用いて,大規模言語モデル(LLM)の禁忌学習について検討する。
本研究の目的は,幻覚の減少を探求する手段として,真理性を改善するのではなく,禁忌学習に焦点をあてることである。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:42:37 GMT)
Online Learning on Hidden-Convex Losses via Algorithmic Equivalence: Optimal Regret, Geometric Barrier, and Bandit Feedback [19.6] 私たちはGhai-Jacobianの損失を隠したオンライン学習に対抗しています。
対角-ヤコビ条件を必要な--ヘッセン幾何学に置き換える。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:45:04 GMT)
Goal-driven Bayesian Optimal Experimental Design for Robust Decision-Making Under Model Uncertainty [19.5] 決定クリティカルな設定では、パラメータの不確実性を減らすことは、必ずしも下流の決定を改善するとは限らない。
本稿では,GoBOEDを提案する。GoBOEDはゴール駆動型フレームワークで,特定の意思決定目標に対して実験設計を直接最適化する。
GoBOEDは、下流の意思決定目標との整合性を向上した設計を特定し、ゴールに依存しないBOEDアプローチによって予測されるものよりも、ほぼ最適なデザインウィンドウがかなり広いことを明らかにした。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:53:18 GMT)
Physics-Aware 3D Gaussian Editing for Driving Scene Generation [19.4] RoVESは物理を意識した3Dガウス編集システムである。
シングルイメージ駆動の道路形状の挿入を可能にし、4-DOF半車両動力学的モデルで編集された道路形状を結合する。
ポーズ編集によって動的車両を編集し、フレームごとのポーズを補正し、動的に一貫性のある垂直変位とピッチ応答を近似する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:57:23 GMT)
EVIDENT: Routing MLLM Adaptation through Entity-Grounded Visual Evidence for Cross-Domain Video Temporal Grounding [19.4] ビデオ時間グラウンドディング(VTG)のための微調整MLLMは、ドメイン内の性能を向上するが、ドメインシフト時に大幅に劣化する。
本稿では,事前学習されたMLLMの実体意識に時間的基盤を固定するフレームワークEVIDENTを紹介する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:58:11 GMT)
ParkourFormer: Integrating Predictive Supervision and Sequence Modeling into Parkour Locomotion [18.9] 本稿では,トランスフォーマーをベースとしたシーケンスモデリングフレームワークであるParkourFormerについて述べる。
シミュレーションと本物のヒューマノイドロボットの実験により、ParkourFormerは高度に挑戦的な地形で平均93.85%の成功率を達成した。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:29:47 GMT)
ATWL: A Formal Language for Representing, Comparing, and Reusing Visual Analytics Workflows [18.6] 視覚分析(VA)は本質的に複雑で、データ変換、特徴工学、視覚的表現、人間の解釈を含む。
これらは典型的には、構造化されていない散文で説明され、体系的な比較を妨げる、証明された戦略の再利用、初心者の訓練などである。
本稿では,ドメインに依存しない宣言型言語であるArtifact-Transform Language(ATWL)について述べる。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:51:02 GMT)
Multi-Modal Building Inspection via Perceiver IO Fusion of Satellite and Street-Level Imagery [18.6] 本稿では、Perceiver IOアーキテクチャを用いて、衛星画像とストリートレベルの画像を融合するマルチモーダル分類フレームワークを提案する。
10か国にまたがる32,135の建物からなる大規模データセットを構築し、衛星画像と最大8つの街路ビューをペアリングする。
Perceiver IO融合モデルは、他のすべての融合戦略を改善し、ストリートレベルから見える属性に対して、クラスごとの実質的なゲインを得る。
論文参考訳(メタデータ) (Mon, 25 May 2026 23:01:05 GMT)
Joint Instance Segmentation and Geometric Attribute Regression for Roof Structures in Aerial Imagery [18.6] 本研究では, 単独の航空写真から, インスタンスレベルの屋根セグメントマスクを共同で予測する手法を提案する。
本稿では, 平坦な屋根セグメントの監視を抑える条件付き方位損失と, 対数正規化高さ表現という2つの重要なイノベーションを紹介する。
本手法は, 平均絶対誤差を屋根斜面で約4度, 方位で7度, 建築高さで1mとし, ケースセグメンテーションAP$_50$ of 0.566とした。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:37:11 GMT)
Geometric Flow Matching for Molecular Conformation Generation via Manifold Decomposition [18.4] 正確な3次元分子配座の生成は、計算化学と薬物発見において重要な課題である。
本稿では,生成モデルと分子幾何学を多様体分解により整合させるGO-Flowを提案する。
提案手法により,50ステップ以内の高忠実度サンプリングが可能となり,構造精度と計算効率のギャップを効果的に埋めることができる。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:30:47 GMT)
SSDAU: Structured Semantic Data Augmentation for Joint Entity and Relation Extraction [18.3] 本研究では,拡張中のテキストの意味的構造を保存するために,構造化意味データ拡張(SSDAU)を提案する。
SSDAUはエンティティラベルに基づいてテキストをセグメントし、エンコーダを使用してエンティティの意味的特徴をキャプチャする。
その後、エンティティセマンティック再構築を行い、拡張データを生成する。
実験により、SSDAUはあいまいさに対して優れた堅牢性を持つセマンティック一貫性のあるデータを生成することが示された。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:21:35 GMT)
When Search Becomes Memory: Turning Robot Design Trials into Transferable Skills [18.2] 大規模言語モデル (LLM) は進化ロボット設計のための提案ジェネレータとしてますます使われている。
本稿では, 形態学的トレースを抽出する自己進化型LLMエージェントであるAuto-Robotistを, 明示的な自然言語スキルライブラリに導入する。
それぞれのスキルには、構造的アーキタイプ、エビデンスに基づく肯定的、否定的なルール、そしてそれらをサポートする評価された設計が格納されており、集団では暗黙的にではなく、設計記憶が検査可能である。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:29:45 GMT)
Names Are All You Need: Effective and Safe Regression Test Selection for Python [18.1] 回帰テストの選択は、コードの変更によって影響を受けるテストだけを実行することで、回帰テストのコストを低減します。
本稿では,詳細な依存関係解析に基づく最初のPython RTSアプローチであるNameRTSを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:20:29 GMT)
How Agentic AI Coding Assistants Become the Attacker's Shell [18.1] エージェントAIコーディングアシスタントは、ファイルの編集、コマンドの実行、開発者に代わってインターネットにアクセスすることができる。
検証されていない外部アーティファクトに依存しているため、新たなアタックベクターが導入された。
本稿では,これらの即発注射攻撃がどのように機能するかを考察し,その頻度を測定し,現在の防衛の限界と課題について議論し,今後の研究方向性を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:59:48 GMT)
Provably Communication-Efficient and Privacy-Preserving Federated Graph Neural Networks [18.0] グラフニューラルネットワーク(GNN)は、リレーショナルデータ上で強力なパフォーマンスを達成するが、現実のグラフは、プライバシやポリシの制約によって生データを共有できない組織に分散されることが多い。
本稿では,通信効率とプライバシ保護を両立したGNNフレームワークであるCE-FedGNNを提案する。
銀行間対マネーロンダリングベンチマークと引用ネットワークの実験により、CE-FedGNNは、通信を著しく低減し、プライバシー保護ノイズ下で堅牢性を維持するとともに、強力な性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:10:20 GMT)
CounterFlow: A Two-Phase Inference-Time Sampling for Counterfactual Video Foley Generation [18.0] Inference-time dual-phase sample scheme for pretrained flow-matching VT2A model。
フェーズ1は、視覚的に指示されたソースを抑えながら、ビデオ由来の時間構造を構築する。
フェーズ2は、ビデオコンディショニングをドロップして、ターゲットプロンプトに向かって音声の音色を形作ることに完全にフォーカスする。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:15:23 GMT)
VertiCue-Bench: Diagnosing Whether MLLMs Use Height Cues to Resolve 2D Ambiguity in Remote Sensing Natural Scenes [17.9] VertiCue-BenchはCHMによる地理空間推論のための最初の診断ベンチマークである。
遠隔センシング型MLLMを14種評価した。
全体的には、VertiCue-Benchは自然界の理解において重要な幾何学と意味論のギャップを露呈している。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:30:33 GMT)
Personalizing Embodied Multimodal Large Language Model Agents over Long-term User Interactions [17.9] POLARは、長期のユーザインタラクションに対してパーソナライズされたエンボディエージェントのための、メモリ拡張フレームワークである。
実施タスクを実行するために、POLARは関連するメモリを取得して現在の要求を解釈し、タスクの実行をガイドする。
提案したメモリ機構は,事前のインタラクションに蓄積した情報をより効果的に活用することにより,性能を継続的に向上することを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:27:27 GMT)
Shielded but Lightweight: Building Practical Confidential Containers with ARM CCA [17.9] 既存の機密コンテナ設計では、主にmicroVMベースのアーキテクチャを採用している。
FascoはARM Confidential Compute Architectureをベースにした軽量なコンテナランタイムである。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:36:28 GMT)
Agent-Centric Social Trajectory Prediction: A Free Energy Principle Perspective [17.5] 軌道予測法は、複雑な動きパターンを捉える際、顕著な能力を示した。
FEP-Diffはフリーエネルギー原理に基づく時間的軌道予測フレームワークである。
制限された可観測性の下では、常に最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:00:42 GMT)
D$^2$Turb: Depth-Aware Simulation and Decoupled Learning for Single-Frame Atmospheric Turbulence Mitigation [17.1] 単一フレームの大気乱流の緩和は、空間的に異なるぼやけと非剛性な幾何学的歪みのために本質的に不均一である。
D$2$Turbは、物理基底シミュレーションを明示的に分離した復元でブリッジする統合フレームワークである。
このシミュレーションエンジンに基づいて、D$2$Turbは修復を2つのインタラクティブステージ(テクスチャ劣化と幾何学的整合)に分解する。
論文参考訳(メタデータ) (Mon, 25 May 2026 20:25:25 GMT)
Modeling Dynamic Mixtures of Time-Delay Systems from Streaming Time Series [17.1] 本研究では,入力-出力関係が明確である時系列データストリームにおける適応モデリングの問題に対処する。
正確性、堅牢性、メモリ使用量のトレードオフは、時系列パターンごとに複数の小さなモデルを使用することによって生じる。
本稿では,ストリーミング時系列を動的に混合した時間遅延システムとして扱うオンラインフレームワーク/手法を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:42:37 GMT)
Automated Random Embedding for Practical Bayesian Optimization with Unknown Effective Dimension [17.0] 本稿では,未知の有効次元を持つハイ次元ベイズ最適化のための自動ランダム埋め込みを提案する。
DSEBOは近似と最適化の誤差のバランスが良くなることを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:55:29 GMT)
GCIB: Graph Contrastive Information Bottleneck for Multi-Behavior Recommendation [17.0] 補助行動情報を識別する新しいフレームワークであるGCIB(Graph Contrastive Information Bottleneck)を紹介する。
構造レベルでは、GCIBはグラフインフォメーション・ボトルネック(Graph Information Bottleneck)の目的を用いて、識別された補助グラフと目標ビヘイビアグラフの相互情報を最大化する。
機能レベルでは、ユーザとアイテムの相補的なビューとして補助的特徴と目標的特徴を識別するクロスビヘイビアグラフコントラスト学習方式を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:46:15 GMT)
AutoDFT: A Closed-Loop Multi-Agent Framework for Autonomous DFT Calculations [16.7] DFTライフサイクルのすべてのステージに推論を組み込むクローズドループマルチエージェントフレームワークであるAutoDFTを紹介する。
計画と実行のループを閉じることで、AutoDFTは深層計算の専門知識を持たない実験者が信頼できる第一原理の結果を得ることができる。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:43:04 GMT)
Generalized Evidential Deep Learning: From a Bayesian Perspective [16.5] Evidential Deep Learning (EDL) は、不確実性推定のための効率的でサンプリング不要な戦略として登場した。
Generalized Evidential Deep Learning (GEDL)は、個々のコンポーネントの役割を混乱させ、GEDLを既存の変種と体系的に関連付ける統一的なフレームワークである。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:51:57 GMT)
Language-Switching Triggers Take a Latent Detour Through Language Models [16.4] 言語モデルに対するバックドア攻撃は、セキュリティ上の懸念が高まるが、トリガーシーケンスのハイジャックによるモデル計算の理解が不十分な内部メカニズムである。
我々は、8B-パラメータの自己回帰言語モデルにおいて、言語スイッチングバックドアの基盤となる回路を特定し、そこでは3ワードのラテントリガーが英語の出力をフランス語にリダイレクトする。
1)初期層における分散アテンションヘッドは、トリガートークンを最後のシーケンス位置に構成し、(2)結果の信号は、サブ空間内の中間層を通してモデルの自然言語同一性方向へ伝播し、(3)最終層は、この潜時を変換する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:55:26 GMT)
Adaptive Graph Refinement and Label Propagation with LLMs for Cost-Effective Entity Resolution [16.3] ダーティエンティティ解決(ER)は、1つの散らかったデータセットから同じ現実世界のエンティティを参照するレコードを識別する。
マッチングとクラスタリングのステップを反復的確率的ラベル伝搬プロセスに統合する統合フレームワークであるAlperを提案する。
8つのベンチマークデータセットに対する我々の実験は、Alperが最先端のカスケードパイプラインよりも一貫して優れていることを示している。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:11:33 GMT)
StreamChar: Long-Horizon Streaming Character Audio-Video Generation with Decoupled Orchestration [16.2] StreamCharは,短時間のオーディオビデオから長期のオーケストレーションを分離するストリーミングフレームワークである。
ショートクリップおよびロングホライゾンプロトコルの実験は、StreamCharが1つのH100 GPU上でリアルタイムに実行されることを示している。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:04:52 GMT)
Prism: A Plug-in Reproducible Infrastructure for Scalable Multimodal Continual Instruction Tuning [16.2] MLLM(Multimodal Large Language Models)は、多種多様なタスクを命令チューニングを通じて統一的な命令追従フレームワークに再構成することで、汎用性を実現する。
その重要性は増しているが、現在のMCITの研究は厳しい工学的ボトルネックによって妨げられている。
MCIT研究用に特別に設計されたプラグイン再現可能なPrismを紹介する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:59:28 GMT)
Provably Data-driven Lagrangian Relaxation for Mixed Integer Linear Programming [16.2] ラグランジアン緩和(Lagrangian Relaxation, LR)は、MILP(Mixed Linear Programming)を解くための強力な手法である。
結合制約を緩和することにより、LRは並列サブプロブレム解を可能とし、しばしば通常の線形プログラミング緩和よりも厳密な双対境界を与える。
最近の実証研究は、これらの緩和を予測するために機械学習を用いた有望な結果を示しているが、そのような手法の理論的な理解は依然として未解決のままである。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:55:23 GMT)
Learning Permutation from Structure Without Supervision [16.2] 教師なしの構造から学ぶことは、一様でない不確実性を引き起こす。
既存の制御方法は、この過程を1つの大域温度で制御する。
本稿では,割り当ての不確実性に基づいて温度を局所的に変調するエントロピー適応型Gumbel-Sinkhornの定式化を導入する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:08:47 GMT)
An Analysis Focused on Womens Safety: Can VAD Models Be Enhanced by a Multi-modal Dataset? [15.9] ExtrAnomは、テキスト記述付き1001のビデオ、500の正規および501の異常を含む、新しいマルチモーダルベンチマークである。
ストーカー(3.9%)、チェーンスナッチ(17.6%)、誘拐(7.3%)、暗殺(2.3%)、ハラスメント(18.9%)、正常(50%)などの異常な出来事をカバーしている。
各ビデオには4つのテキストアノテーションが補われており、1つの人間が生成した記述と3つのLDM生成した記述が含まれており、クロスモーダルとVLMベースの検証が可能である。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:59:45 GMT)
StreamProfileBench: A Benchmark for Fine-Grained User Profile Inference in Real-World Streaming Scenarios [15.8] 本稿では,ストリーミングユーザの詳細なプロファイリングのベンチマークであるStreamProfileBenchを紹介する。
5つの多様なプラットフォームにまたがる7,000以上の実際のユーザから12万以上のポストの、非常に正確なデータセットをキュレートします。
ユーザの関心の時間的相関を利用して,新しいアノテーションのない評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:10:15 GMT)
Simulating Human Memory with Language Models [15.8] アウト・オブ・ボックス言語モデルは、人間の振る舞いを模倣するよう促されたとしても、人間よりも優れた記憶力を示す。
次に、より良いプロンプト戦略とコンパクト化の使用により、言語モデルがより人間的な方法でコンテンツを忘れることが示される。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:39:08 GMT)
Can MLLMs Reason Beyond Language? VisReason: A Comprehensive Benchmark for Vision-Centric Reasoning [15.6] VisReasonは、日々のシナリオにおけるビジョン中心の推論のためのベンチマークである。
我々の評価は、VisReasonが既存のベンチマークと定性的に異なる課題を生んでいることを示している。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:41:50 GMT)
Towards Active Real-to-Twin Inspection: A New Paradigm for Zero-Shot Anomaly Detection [15.4] 本稿では,幾何学的に整合したCADデジタル双対に対する物理観測を直接評価する新しいタスクであるReal-to-Twin Anomaly Detectionを紹介する。
本稿では,リアルツインとデジタルツイン間のロバストなセマンティックアライメントを学習するためのフレームワークであるAVATARを提案する。
欠陥のないペアのみを使用して、良質なSim2Realドメインギャップをブリッジすることで、AVATARはCADプリエントを動的で異常のない参照に変換する。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:05:25 GMT)
How to Mitigate the Distribution Shift Problem in Robotics Control: A Robust and Adaptive Approach Based on Offline to Online Imitation Learning [15.3] 模擬学習における分布シフトとは、エージェントが訓練中に訪れていない状態に対して適切な行動を計画できないという問題を指す。
この問題は、主に、フル環境上で専門家によるデモンストレーションによって提供される、本質的に狭い状態-アクションカバレッジに起因する可能性がある。
我々は、生涯にわたる多相スキームにおける分散シフト問題を処理する、ロバストなオフラインから適応的なオンライン模倣学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:30:51 GMT)
CroCo: Cross-Lingual Contrastive Preference Tuning on Self-Generations [15.3] 報酬スコアによって設定された大規模言語モデルからの自己生成応答のコントラスト性の制御により、英語のダウンストリーム選好チューニングが改善される。
本手法を複数の言語に拡張し,タスクの多種多様なセットにおいて,14の高低リソース言語を対象とした2つのモデルを評価する。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:30:45 GMT)
SetupX: Can LLM Agents Learn from Past Failures in Functionality-Correct Code Repository Setup? [15.3] リポジトリのセットアップの目的は、実行環境(依存関係、ビルドスクリプトなど)を設定して、リポジトリのドキュメント化された機能を実行することだ。
依存関係の不互換性、ツールチェーンの欠如、不完全なインストール、検証ストラテジーのミスマッチなど、リポジトリ固有のさまざまな障害が原因で、大きな課題が発生している。
既存のエージェントは、リポジトリ間のエクスペリエンス転送、非可逆的な状態変更によるマルチステップトライアルとリペア、セットアップによる障害とリポジトリバグを区別するためのセットアップ結果の堅牢な検証をサポートするのに苦労している。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:33:15 GMT)
CyberEvolver: Structured Self-Evolution for Cybersecurity Agents On the Fly [15.2] 我々は、自己進化型サイバーセキュリティエージェントフレームワークであるtextscCyberEvolverを紹介した。
textscCyberEvolverは、失敗した実行試行の経験に基づいて、自身の足場を反復的に修正する。
CTFの課題,脆弱性のエクスプロイト,および4つのオープンソースLCMを用いた侵入テストタスクについて,textscCyberEvolverの評価を行った。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:26:59 GMT)
Location Prior Generation via Multi-Source Urban Data Fusion for Low-Altitude Air Mobility [14.9] グローバル地理空間データベースの95%以上の構造ではビルの高さは欠落している。
新興の低高度経済にとって、このデータギャップは、各飛行プラットフォームにリアルタイムのオンボードセンシングを頼らざるを得ない。
マルチソースデータ融合パイプラインであるLocation Prior Generation Framework(LPGF)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:35:15 GMT)
Segmentation-Guided Spatial Indexing for Generalizable and Explainable Deepfake Detection [14.8] ディープフェイク検出のためのセグメンテーション誘導空間インデクシングを提案する。
まずセマンティックに意味のあるパッチトークンを選択し、それからそれらだけをプールします。
Celeb-DF v2では、マウスインデクシングプローブがAUC 0.905を達成し、LipForensicsとXceptionを上回っている。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:07:00 GMT)
Toward General Quantum Control with Physics-Informed Large Language Models [14.8] VF-QCTRLは、一般的な量子制御のための物理インフォームドな大規模言語モデルフレームワークである。
本研究は,VF-QCTRLを精度,効率,解釈性,トレーニング不要な量子制御プロトコル設計のための有望なパラダイムとして確立した。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:41:41 GMT)
Unified Flux Control Architecture for Fluxonium Qubits [14.7] 我々は, フラクトロニウム量子ビットの統一制御アーキテクチャを実験的に実現し, 横(XY$)と縦(Z$)の操作を1つのフラクトロニウム制御チャネルで実装した。
このアーキテクチャは、共有制御チャネルに競合する要求を課し、リセット操作のための低周波フラックス伝送を同時にサポートする必要がある。
本稿では,周波数選択型低温フィルタと補償波形合成を併用して,フィルタ制御線によるパルス歪みを補正する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:26:58 GMT)
Collaborative Navigation and Exploration with $β$-Sparse Gaussian Processes [14.7] 未知環境における異種ロボットの協調ナビゲーションは、センシング、通信、計算の制限によって大きな課題を生んでいる。
そこで本研究では,センサが送信した地図ポイントとナビゲーション動作を協調的に選択できるフレームワークを提案し,環境の未探索領域を予測した。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:55:59 GMT)
Learning Kernel-Based MDPs from Episodic Preferential Feedback [14.5] エピソード型カーネルMDPにおける嗜好のみの学習に関する理論的研究について述べる。
提案手法は,主観的比較に適合する優先度に基づく値推定と信頼度セットを開発する。
我々は,学習方針の値が最適方針の値に収束することを示唆し,エピソード数で下位にスケールする高い確率的後悔境界を証明した。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:19:44 GMT)
Heimdall: Formally Verified Automated Migration of Legacy eBPF Programs to Rust [14.5] Extended Berkeley Packet Filter (eBPF) は、Linuxカーネルのネットワーク、可観測性、セキュリティ強化に使用されるカーネル拡張である。
In- kernel eBPF verifiers checks low-level memory safety andtermination on eBPF program, but not not enforce many higher-level source-level properties。
We present Heimdall, a automated pipeline that using large language model to translate legacy libbpf C program to Aya Rust。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:23:29 GMT)
BioFact-MoE: Biologically Factorized Mixture of Experts for Vision-Language Prognostic Modeling in Hepatocellular Carcinoma [14.3] 肝臓と腫瘍の因子を特異的に分解するバイオファクト-MoEを生物分解したMixture of Experts (MoE) フレームワークとして紹介する。
N=588患者のHCCコホート(4,582枚のMRI画像報告ペア)では、BioFact-MoEはすべてのベースラインでの生存予測を一貫して改善する。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:53:11 GMT)
PHGNet: Prototype-Guided Hypergraph Construction for Heterogeneous Spatiotemporal Forecasting [14.3] 交通予測はインテリジェント交通システムにおいて重要な役割を担っている。
正確なトラフィックモデリングは複雑な依存関係に依存します。
既存の手法の多くは、いまだにペアの空間依存に限られている。
PHGNetは最先端の手法と比較して予測性能が優れている。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:10:16 GMT)
A PAC-Bayesian View of Generalisation for Physics-Informed Machine Learning [14.2] PAC-Bayesian framework for Physics-informed machine learning (PIML) を開発した。
非有界な損失が存在する場合に、高確率の一般化を保証する。
この結果は、物理インフォームドモデルの一般化のための、原理化された統計基盤を提供する。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:30:39 GMT)
Rethinking Scribble-Guided Image Editing: Generalization, Instruction Adherence, and Multi-Tasking [14.2] スクリブル誘導画像編集により、ユーザーは単純なスクリブルアノテーションとテキストプロンプトを組み合わせることで、画像の編集場所と編集方法の両方を指定できる。
既存のモデルは、特にマルチタスクシナリオにおいて、このパラダイムの下で不安定なパフォーマンスを示す。
オープンソース編集モデルを用いて実証的研究を行い、一般化における非対称性を明らかにする。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:20:23 GMT)
A Pedestrian-Vehicle Interaction Benchmark and Annotation Framework for Unstructured Scenes via Uncalibrated Cameras [14.2] 我々は、未校正監視カメラのビデオデータに基づくデータセットとPINNS(uNstructured ScenesにおけるuNcalibratedカメラからの歩行者車間相互作用データセット)を提案する。
このデータセットは、複数の国や地域をカバーし、様々な典型的な交通シナリオを含み、季節、照明条件、天候の変動も考慮している。
我々のフレームワークとデータセットは、複雑な混在交通シナリオにおける軌道予測と自律運転の研究を促進することを願っている。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:26:18 GMT)
When Correct Demonstrations Hurt: Rethinking the Role of Exemplars in In-Context Learning [14.1] インコンテキスト学習(ICL)は、しばしばデモが正しいインプット・アウトプットの例を提供するために役立つ直感によって動機づけられる。
有効性は保証されていないことを示し、いくつかの正しい実演はICLの精度を低下させることさえできることを示した。
以上の結果から,頑健なICLは実演が正しいかどうかだけでなく,文脈的推論にどのように影響するかを評価する必要があることが示唆された。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:52:49 GMT)
LENS: A Staged Design for Interaction Granularityin Sequential CTR Prediction [14.1] 我々は、粗いボトルネックの中でターゲット固有の制御を復元するLENSを提案する。
LENSには、クエリアクティベーションのためのTarget-Conditioned Query Gate (TCQG)と、履歴検索のためのTarget-Conditioned Position Bias (TCPB)の2つのモジュールがある。
3つの代表的な待ち行列バックボーンと4つのデータセットの合計で、QueryPos+LENSの設計の組み合わせは、正のトータルゲインポイント推定を達成する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:33:11 GMT)
FOUND-IT: Foundation-model-first Task-driven 3D Scene Graphs with Granularity on Demand [13.8] 本研究では,階層型タスク駆動型3次元シーングラフをモノクロカメラを用いてリアルタイムに構築する手法を提案する。
シーングラフの幾何学的属性を推定するために,幾何学的基礎モデルを利用する。
我々のアプローチは、タスクに応じて地図内のオブジェクトや領域の粒度を調整するという意味でタスク駆動である。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:52:34 GMT)
CODESKILL: Learning Self-Evolving Skills for Coding Agents [13.6] コーディングエージェントは、ソフトウェアエンジニアリングタスクを解決しながら、豊富な軌道を生成する。
エージェントの自己進化を可能にするために、これらの軌道は、体験をコンパクトにエンコードして将来の行動を導く再利用可能な手続きスキルに蒸留することができる。
CODESKILLは,学習可能な管理方針として,スキル抽出とスキルバンクのメンテナンスを再構築するLLMベースのフレームワークである。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:12:49 GMT)
Decoding Stimulus Reconstruction-Based Auditory Attention Robustly in Unbalanced EEG Datasets [13.5] 本稿では,不均衡なデータセットを評価するためのLOPEO(Left-one-paired-Envelope-out)プロトコルを提案する。
実験結果から,LOPEOは不均衡データセット上でのインフレーションデコード精度を効果的に防止できることを確認した。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:58:19 GMT)
From Accounting to Coordination: A Virtual Water-Aware Electricity-Computation-Water Nexus Framework for Data Center Dispatch [13.5] データセンターは電力需要の持続的な増加と、それに伴う水流出を世代別で推進している。
既存のアプローチは、水のフットプリントを定量化するために静的統計会計に依存している。
本稿では, 電力系統の配電に仮想水の影響を直接内包する運用型電気計算・水ネクサス・フレームワークを開発する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:45:07 GMT)
NPSolver: Neural Poisson Solver with Iterative Physics Supervision [13.1] textscNPrは、ソリューションラベルなしでトレーニングされたニューラルなPoissonソルバである。
textscNPrは、いくつかの事前条件付き共役勾配ステップを使用して、独自の予測を洗練します。
textscBA-Transolverアーキテクチャは、内部トークンと境界トークンを明確に分離する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:33:52 GMT)
L2IR: Revealing Latent Intent in Graph Fraud Detection [13.0] 実際に重要な障害は、詐欺師が良心的なユーザーと多くのつながりを築き上げ、しばしば変装することである。
L2IRは、グラフ不正検出のためのLLM駆動の潜入探索フレームワークである。
これはGNNベースの検出器のプラグイン拡張として機能し、AUPRCを最大8.27%改善する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:06:13 GMT)
Action-Prior Denoising for Smooth Real-Time Chunking [13.0] リアルタイムチャンキング(RTC)により、チャンクされたアクションポリシーは、以前のチャンクがコミットしたアクションに対して新たに生成されたアクションチャンクを条件にすることで、推論遅延の下で動作することができる。
トレーニングタイムRTCは、学習中にこの遅延をシミュレートし、デプロイメント時の高価なランタイムガイダンスを回避する。
本稿では,アクションプライオリジングに基づく訓練時間RTCの一般化であるソフトRTCを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:49:25 GMT)
OMGTex: One-stage Multi-style Facial Texture Reconstruction without Geometry Guidance [12.9] OMGTexは、高品質で編集可能な顔紫外線テクスチャを再構築するためのエンドツーエンドの拡散ベースのフレームワークである。
私たちの中心となるイノベーションは、幾何学のないパイプラインで、2Dの顔画像をそれに対応する編集可能な紫外線テクスチャに直接マッピングします。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:26:56 GMT)
Shallow ReLU$^s$ Networks in $L^p$-Type and Sobolev Spaces: Approximation and Path-Norm Controlled Generalization [12.9] 特に、$_d$が均一測度で$1le p2$のとき、近似率は$O!left(m-fracp(2s+2d+1)-2d2dpright)$ for $1le p*$と$O!left(m-fracp(4s+3d-1)-2d+24dpright)$ for $p*p2$である。
non (複数形 nons)
論文参考訳(メタデータ) (Mon, 25 May 2026 18:12:10 GMT)
A Variational Dissipative Framework for Quantum Algorithms [12.9] 本稿では,パラメータ化量子アルゴリズムに工学的散逸を組み込む変分散逸フレームワークを提案する。
このフレームワークでは、システムのみの変分層とトレーニング可能な消散モジュールが結合される。
本稿では,再利用可能なトレーニングプリミティブとして,工学的散逸を変分量子回路に組み込むことができることを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:35:46 GMT)
Towards end-to-end LLM-based censoring-aware survival analysis [12.8] 大規模言語モデル(LLM)は、検閲によって教師付き微調整が防止されるため、エンドツーエンドサバイバルモデルとしてはほとんど使われない。
本稿では,検閲を意識した生存分析を可能にするフレームワークであるLLMSurvivalを紹介する。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:45:42 GMT)
Semantic Validation of Packer Identification Tools: Characterization, Repair, and Downstream Impact [12.8] パッケージ識別ツールは、マルウェア分析の重要な基盤である。
本稿では,パッカー識別ツールのテストと修復のためのセマンティック検証フレームワークを提案する。
我々は、11のオープンソースパッカー識別ツールと6つのプロプライエタリな VirusTotal ツールにおいて、セマンティックバグの大規模な研究を行う。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:00:30 GMT)
AI-T2I: Aggregating-and-Isolating Cross-Attention to Diffusion Models for Text-to-Image Synthesis [12.8] 本稿では,AI-T2Iと呼ばれるテキスト間合成のための拡散モデルに対するアグリゲーション・アンド・アイソレート・クロスアテンション手法を提案する。
我々のAI-T2Iは、例えば、制御可能なレイアウト生成やパーソナライズされた生成など、他のタスクに対して優れた一般化を示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:17:32 GMT)
Benchmarking Pathology Foundation Models for Spatial Domain Understanding [12.5] 本稿では,PFMにおける空間表現能力の診断を目的とした表現レベルベンチマークであるSpaPath-Benchを提案する。
SpaPath-Benchは、一対のスライド画像と空間転写学(ST)データを診断タスクとして空間領域同定する。
42の公開WSIおよびSTスライドをキュレートし、19のエンコーダと7つのSDIメソッドにわたる大規模な評価を可能にし、3つの相補的な基準を用いて分割品質を測定する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:18:32 GMT)
TTPrint: Evidence-Grounded TTP Extraction via Diverge-then-Converge Verification [12.4] サイバー脅威インテリジェンス(CTI)レポートからMITRE ATT&CKテクニックを抽出することは、オープンセットのマルチラベル問題である。
既存の手法は様々な攻撃記述にまたがって一般化性に欠ける。
我々は、人間のアナリストの働きにインスパイアされた分散収束設計を通じて、この課題に対処するTPrintを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:31:49 GMT)
HumanFlow -- Diffusion-Driven MAV Navigation Among Humans via Tightly-Coupled Motion Tracking, Forecasting, and Control [12.4] 我々は人間の動きの追跡と予測を統一する潜在拡散モデルであるHumanFlowを紹介する。
本研究では,人間の動作モデルにより,課題条件下でのスムーズで正確な予測が可能であることを示す。
我々は,MAVソーシャルナビゲーションのための実際の人的軌跡をシミュレーションで検証する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:40:32 GMT)
Fine-Tuning and Serving Gemma 4 31B on Google Cloud TPU: A Technical Comparison with GPU Baselines [12.4] 本稿では,Google の Gemma 4 31B モデルを TPU ハードウェア上で実現した,ファインチューニングの最初のエンドツーエンドデモを紹介する。
Google TPU v5p-8のトレーニングにLoRAを使用し、推論にTPU v6e-8(Trillium)を使用すると、GPUネイティブなトレーニングレシピの移植に必要なコードレベルの適応の完全なセットを文書化する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:51:59 GMT)
Relative Repairability: A Calibration-Based Diagnostic for High-Sparsity Post-Pruning Allocation [12.3] 相対修復性 (RR) はキャリブレーションに基づく診断であり、層状プルーニングによる生の活性化歪みとチャネル状分散整合修復後の残留歪みを比較する。
RRはアーキテクチャ依存の回復可能性遷移(Recoverability transition)の近くで最も有用であり、標準的な構造や大きさに基づくアロケーションが信頼性を失い始めるが、修復後のリカバリはまだ完全には崩壊していない。
これらの結果から, 高い疎水性プルーニングは, 保持重量だけでなく, 修復性にも寄与することが示唆された。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:12:38 GMT)
ADMFormer: An Adaptive-Decomposition Transformer with Time-Varying Masked Spatial Attention for Traffic Forecasting [12.2] ADMFormer は時間変化型マスク空間アテンションを持つ適応分解変換器である。
二重分岐時間モジュールは、大域的周期依存と高周波不規則変動を別々に捉えるように設計されている。
4つの実世界のデータセットに対する大規模な実験は、ADMFormerが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:00:02 GMT)
Optimal and Order-optimal Gated Priority-based Greedy Policies for Two-layer Multi-item Order Fulfillment [12.2] 複数項目の顧客注文が順次届き、将来の需要が不明な場合に、Eコマース企業がリアルタイムのフルフィルメント決定を行う方法を検討する。
複数のFDC、地域分布センター(RDC)、複数単位のマルチテムオーダー、アイテム特化および時間変動変動コストを備えた対戦型オンラインモデルを定式化する。
我々の理論的目的は、シンプルで、解釈可能で、実装可能なフルフィルメントルールが最適な透かしプランナーとほぼ同等に実行可能であることを特徴付けることである。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:16:45 GMT)
Uncertainty Reasoning with Large Language Models for Explainable Disease Diagnosis [12.2] 臨床的意思決定には、不完全で不正確で言語的に表現された患者の物語に対する推論が必要である。
本稿では,大規模言語モデルと形式論理を整合させるニューロシンボリック推論フレームワークを提案する。
結果は、最先端のLLMに匹敵する性能を示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:18:45 GMT)
AI Content Moderation in Therapy Conversations [12.1] 大規模言語モデル(LLM)は、感情的なサポートや治療目的のためにますます使われてきている。
ChaptGPTやLlamaのようなLLMは、コンテンツモデレーションガードレールで開発されることが多い。
本研究は、3つの最先端モデレーションシステムに対するアルゴリズム監査を行い、これらのシステムが実生活療法セッションの内容がどの程度望ましくないかを調査する。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:05:16 GMT)
A Signal-Language Foundation Model for Broad-Spectrum Cardiovascular Assessment from Routine Electrocardiography [12.0] 我々はECGコントラスト言語画像事前学習(ECGCLIP)を開発した。
ECGCLIPは信号言語によるコントラスト学習フレームワークであり、ECG波形と専門診断報告を整合させる。
1,324,856人の心電図2,837,962例を対象にECGCLIPを評価した。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:51:44 GMT)
Courtroom Analogy: New Perspective on Uncertainty-Aware Classification [11.9] 本稿では,不確実性意識の分類を,クラス固有の主張者の間で構造化された議論として概念化する,法廷アナロジーを紹介する。
裁判所パラメータを予測し,効率的かつ表現力のあるUQを実現する単一パスニューラルネットワークアーキテクチャを提案する。
我々は,MoDEXが強い理論的特性を享受し,様々なベンチマークにおいて最先端のUQ性能を実現することを実証した。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:17:08 GMT)
Universal Graph Backdoor Defense: A Feature-based Homophily Perspective [11.9] グラフニューラルネットワーク(GNN)はリレーショナル学習において大きな成功を収めている。
グラフバックドアアタック(GBA)に対する脆弱性は、ハイテイクなアプリケーションで広く採用される上で、大きな障壁となる。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:36:11 GMT)
3D Magnetic Field Reconstruction and Mapping with Physics-Informed Neural Networks [11.8] 本研究では,高精度3次元磁界マッピングのための高度な物理情報ニューラルネットワークフレームワークを提案する。
提案したPINNは、マクスウェル方程式を直接損失関数に統合し、分散自由条件とカール自由条件を強制する。
シミュレーションデータによる検証は,既存のPINNベンチマークの10倍の10~4ドルの再現精度を実現する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:42:27 GMT)
PDEInvBench: A Comprehensive Dataset and Design Space Exploration of Neural Networks for PDE Inverse Problems [11.7] PDE逆問題に対する数値シミュレーションの包括的なベンチマークデータセットであるPDEInvBenchを紹介する。
ベンチマークデータセットを用いて、PDE逆問題に対するニューラルネットワークの空間を3つの重要な次元に沿って探索する。
ニューラルネットワークは2段階のトレーニング手順で最高の性能を発揮する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:13:33 GMT)
Causal Tongue-Tie: LLMs Can Encode Causal Direction, But Their Yes/No Outputs Fail to Express [11.7] 大きな言語モデルが因果問題にエンコードしているものと、それらが答えているものとの間には、ミスマッチがある。
アンチ・コモンセンス CLadder アイテムでは、固定された線形プローブがモデルの隠れ状態からエビデンス支援された回答を復元する。
これをCausal Tongue-Tie という。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:19:51 GMT)
KAPLAN: Kolmogorov-Arnold Prognostic Learnable Activation Networks for Survival Analysis [11.3] 共変量と時間との結合関数として条件付きハザードの非推定にKAPLAN-HRを導入する。
単一層KAPLAN-HRモデルはGAMを復元し、より深いアーキテクチャは合成を通して相互作用と時間変化の効果をキャプチャする。
KAPLAN-HRは6つの臨床ベンチマークデータセットに対する評価において、確立された統計的および深層学習サバイバル手法の予測性能に適合するか、それとも超えている。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:03:47 GMT)
UAV-OVO: Out-of-Viewpoint Generalization in UAV Action Recognition [11.2] UAV-OVO(Out-of-View Generalization benchmark for UAV Action Recognition)を紹介する。
LATER, LoRA-Anchored Test-time Re-centeringを提案する。Low-Rank Adaptation (LoRA) で認識器を適応させ,学習したLoRAサブスペースをオンライン機能再中心のためのセマンティックアンカーとして利用する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:15:08 GMT)
CoSPlay: Cooperative Self-Play at Test-Time with Self-Generated Code and Unit Test [11.1] CoSPlayはGTフリーでトレーニング不要なフレームワークで、協調的なセルフプレイを通じてコードとUTを共同で改善する。
まず、多様なソリューションのアイデアを探求し、差別的なUTのアイデアを生み出すための潜在的な失敗モードを特定します。
次に、Code-UT実行マトリックスからの双方向のパスカウント信号を使用して、弱いコードを繰り返しプーンしたり修正したり、信頼性の低いUTをリフレッシュしたり、置き換えたりする。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:01:24 GMT)
AutoSG: LLM-Driven Solver Generation Solely from Task Prompts for Expensive Optimization [11.1] AutoSGは、自然言語プロンプトを直接実行可能なカスタマイズされたソルバに翻訳する完全に自動化されたワークフローである。
AutoSGは3つのコアイノベーションを特徴としている。検索拡張ソルバ生成モジュールは、検証済み文献のコードを厳格に基礎づけている。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:04:35 GMT)
ATOM: Instantiating Budget-Controllable Multi-Agent Collaboration via Nucleus-Electron Hierarchy [10.8] textscATOMは、新しいタスク駆動強化学習パラダイムを通じて、予算制御可能な協調グラフを生成する。
textscATOMは、強力なベースラインと比較してトークン効率を最大30%向上させながら、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:41:11 GMT)
VisualNeedle: Benchmarking Active Visual Search in Information-Dense Scenes [10.8] マルチモーダル大言語モデル(MLLM)は、微粒な知覚ベンチマークにおいて90%以上の精度を達成することが報告されている。
以前の研究では、ベンチマークのパフォーマンスを向上する3つのショートカットが特定されている。
以上の結果から,高精細度,高精細度,高精細度,高精細度,高精細度,高精細度,高精細度,高精細度,高精細度,高精細度,高精細度,高精細度,高精細度,高精細度,高精細な視覚検索が可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 25 May 2026 23:01:05 GMT)
A Multimodal Framework for Dementia Detection via Linguistic and Acoustic Representation Learning [10.6] アルツハイマー病は認知症の主要な原因であり、記憶、推論、コミュニケーション、日常生活に影響を及ぼす。
近年の研究では、自発音声には認知症に関連する貴重な言語的・音響的バイオマーカーが含まれていることが示されている。
本稿では,言語情報と書き起こし情報をエンドツーエンドのトレーニング可能な方法で共同で活用する,認知症自動検出のためのマルチモーダルディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:57:49 GMT)
Context-Aware Metric Differential Privacy for Vehicle Trajectory Data [10.5] 車両位置プライバシーのためのコンテキスト対応mDP(C-mDP)を提案する。
C-mDPは保護されたシークレットを文脈拡張されたレコードとして扱い、この拡張されたドメインに対してメートル法の不識別性を強制する。
実車載用モビリティデータセットのC-mDPを評価し,標準mDPベースラインと比較した。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:54:43 GMT)
Active Query Synthesis for Preference Learning [10.5] アクティブラーニングは、このコストを削減するが、標準的な手法は、プールベースの評価のために計算的に高価である。
本稿では,不明瞭な比較を明示的に考慮した新しい信頼度対応モデルを提案する。
提案するフレームワークの汎用性と,合成選好学習,制約付きテキスト要約データセット,およびシミュレーションされた移動ロボットの主観的連続空間制御ゲインチューニングにおける性能を実証する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:37:58 GMT)
Towards Anatomically Plausible Human Image Generation via Synthetic Localized Preferences [10.4] 大規模テキスト・画像基盤モデルは目覚ましい視覚的リアリズムを達成したが、正しい解剖学的構造を持つ人間の画像を生成することは依然として困難である。
既存のアプローチでは、高品質な人間の写真の微調整中に、部分特異的なモジュールや局所的な損失重み付けを通じて解剖学的制約を強制する。
高忠実度画像に適用した局所劣化機構を用いて、制御された選好ペアを構成する合成解剖学的選好(ASAP)によるアライメントの枠組みを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:10:23 GMT)
Bridging Classification and Reconstruction: Cooperative Time Series Anomaly Detection [10.2] 時系列異常検出(TSAD)は、データマイニングにおけるホットな研究トピックである。
最近の研究は、TSADにおける一般的なディープラーニング手法の有効性に挑戦している。
本稿では,その相補的強みを活用するために2つのパラダイムを統合する新しいフレームワークであるCoADを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:19:17 GMT)
SURGE: Approximation and Training Free Particle Filter for Diffusion Surrogate [10.2] 本研究では,拡散モデルを用いてシステムのダイナミクスをシミュレーションし,予測する。
本研究では,騒音観測から得られる情報を組み込んで,予測されたシステム状態の継続的な修正と改善を可能にする方法について検討する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:55:02 GMT)
Image Encryption via Data-Identified Discrete Chaotic Maps [10.1] 本稿では、SINDy-PIアルゴリズムを用いて、データから直接カオスマップを識別するデータ駆動画像暗号化フレームワークを提案する。
このアプローチの有効性は、3つの異なるカオスシステムで検証される。
我々の結果は、固定マップを超えたカオスベースの暗号の新しいパラダイムを確立した。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:17:32 GMT)
QUIET: A Multi-Blank Cascaded Story Cloze Benchmark for LLM Creative Generation Capability [10.1] 本稿では,大規模言語モデルの診断ベンチマークであるQUIETを提案する。
QUIETは、ストーリー内のN個の空白(10〜20)を完全な構造で設定し、各空白には明示的な内容制約が伴う。
満足」は、空白の充満がコンテンツ制約をどの程度満足させるかを測定する。
サプライズ」は制約が満たされているため、驚きの度合いを測る。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:29:58 GMT)
Creative Quality Alignment: Expert Tacit Knowledge Transfer via Chain-of-Thought Fine-Tuning [10.1] 本稿では,キャリブレートサプライズ(Zou & Xu, 2026a)における創造的品質指標の実証的実装について述べる。
トレーニングデータは、BCプロトコル(Zou & Xu, 2026b)によって作成された約100の専門家チェーン(CoT)アノテーションから得られる。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:52:10 GMT)
BC Protocol: Structured Dual-Expert Dialogue for Eliciting High-Quality Chain-of-Thought Post-Training Data [10.1] 高品質な専門家チェーン・オブ・シークレット(CoT)データは、大規模言語モデル(LLM)のポストトレーニングにおける中核的なボトルネックの1つです。
本稿では,LLM後処理データ生成のための構造付きデュアルエキスパート推論手法であるBCプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:06:10 GMT)
Sleep-stage efficient classification using a lightweight self-supervised model [10.0] ここでは,脳波信号表現を自己監督的に学習するmulEEGモデルを単純化した。
その結果,データ量を削減することで,モデルの簡易化よりもコスト対利益率が高いことがわかった。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:37:54 GMT)
Where Concept Erasure Should Occur: Concept-Layer Alignment in Text-to-Video Diffusion Models [10.0] テキストからビデオへの拡散変換器は、効果的な概念消去を制約するモデル深度に不均一に意味情報を符号化する。
概念消去のための分離性駆動型フレームワークであるCLEARを導入し,概念層アライメントを明示的に実施する。
大規模テキスト・ビデオモデルによる実験では、概念-層アライメントの強制は、全体的な生成品質を維持しながら、より正確な概念抑圧につながることが示されている。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:20:04 GMT)
Visual-Redundancy-Controlled Parallel Decoding for Diffusion-Based Multimodal Large Language Models [10.0] 拡散に基づく多モード多言語モデル(dMLLM)は、複数のマスキング位置のトークンを並列に反復的に予測することでデコードする。
既存の信頼に基づく復号化ランクは、独立して位置を隠蔽し、トップKの位置をコミットし、コミットされたトークンが補完的な視覚的根拠を提供するかどうかを無視する。
本稿では,視覚的に相補的な位置を優先するためにトークン・ツー・イメージ・アテンションを用いたトレーニング不要な推論時間復号法である視覚冗長制御復号法(VRCD)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:16:51 GMT)
Dimensional Distribution Emotion State: Leveraging Valence and Arousal as a Common Embedding Space for Visual Emotion Analysis [9.8] 博物館は文化や芸術の普及のための重要な場所であり、歴史や伝統に根ざした機関であり、展示はこれらの側面を強調するように設計されていることが多い。
近年,感情に基づく展覧会という新たなアプローチが研究されている。
これらの展示は、訪問者の感情を引き出すために特別にデザインされ、エンゲージメントを最大化し、芸術へのアクセスを民主化し、より幅広い、より多様な観客を引き付ける方法としてデザインされている。
美術館の学芸員がこれらの展覧会のデザインを手伝うために,芸術作品によって引き起こされる感情的反応を予測するツールを開発したいと考えている。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:44:26 GMT)
Evi-Steer: Learning to Steer Biomedical Vision-Language Models through Efficient and Generalizable Evidential Tuning [9.7] Evi-SteerはBiomedCLIPのための明らかなクロスモーダルな低次元ステアリングフレームワークである。
完全なモデルパラメータの0.11%を更新しながら、不確実性に配慮したパラメータ効率の微調整を可能にする。
Evi-Steerは、数ショットの学習とドメインシフト設定の下で、最先端のメソッドを一貫して上回る。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:30:22 GMT)
Multilingual Phonological Feature Recognition with Self-Supervised Speech Models [9.7] 自己教師型音声モデルに基づく多言語フレームレベルの音声特徴認識システムであるPhonoQ-2.0を提案する。
このシステムは、音素出力から特徴を引き出すのではなく、フレーム符号化方式、母音品質、場所、発声ごとに22次元の構造化特徴ベクトルを直接予測する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:47:33 GMT)
A Token/KV-Cache Communication Media Selection and Resource Allocation Strategy for Multi-Agent Collaboration [9.6] 通信媒体選択と無線リソース割り当てを統合した共同設計を提案する。
トークンベースの伝送もキー値(KV)キャッシュベースの伝送も,オペレーティングシステム間で均一に最適であることを示す。
数値的な結果から、異種リンク上での相互作用媒体と帯域割り当てを適応的に調整することにより、提案方式はE2E遅延を著しく低減することを確認した。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:50:45 GMT)
High-Dimensional Change-Point Detection via Angular Kernel Statistics [9.5] 本研究では,小バッチの観測から推測を行なわなければならない状況下での高次元データに対する変化点検出について検討した。
我々の主な焦点は高次元低サンプルサイズ(HDLSS)レギュレーションであり、周囲の寸法がばらつきながら配列長が固定される。
本稿では,辺分布シフトを検出するための次元平均角カーネルスキャンフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:45:38 GMT)
MiRD: Reliable Set-Valued Prediction for Open-Ended Question Answering via Miscoverage Risk Decomposition [9.4] MiRDは2段階のフレームワークで、全体的な誤発見をサンプリングの失敗と条件の選択の失敗に分解する。
MiRDは、サンプリングリスク、条件の選択リスク、全体的な誤発見を制御し、PACスタイルの代替よりも厳密な第1ステージ境界を出力する。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:16:48 GMT)
Joint Optimization of Training and Inference in Federated Edge Learning via Constrained Multi-Objective Deep Reinforcement Learning [9.4] エッジインテリジェンス(EI)を実現するための有望なパラダイムとしてFederated Edge Learning(FEEL)が登場した。
リソース制約のあるエッジデバイス上でのフェデレーショントレーニングと推論を共同で管理する,オンライン最適化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:51:07 GMT)
Different Statistical Perspectives for Understanding Generalisation in Graph Neural Networks [9.2] グラフネットワーク(GNN)は現在、グラフ構造化データの学習と予測において最も一般的なアプローチである。
GNNにおける統計一般化の研究に使用される様々な視点について論じる。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:02:31 GMT)
Small Models, Strong Priors: Architectural Inductive Bias for Parameter-Efficient Neural PDE Solvers [9.2] 我々は、PDEソルバにおけるアーキテクチャ上の帰納バイアスの代用としてスケールが不十分であると論じる。
多分解能トークン化のための離散ウェーブレット変換を組み合わせたアーキテクチャであるWaveLiTで、この議論をインスタンス化する。
我々は8つのベンチマーク全てを共同でトレーニングし、10M-パラメータ基底の変種は構造化され、物理的に解釈可能な転送パターンを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:27:43 GMT)
BrickAnything: Geometry-Conditioned Buildable Brick Generation with Structure-Aware Tokenization [9.1] BrickAnythingは、様々な3D表現から構築可能なレンガ構造を生成するための幾何学条件付き自己回帰フレームワークである。
ブロック間の構造的依存関係をモデル化するために,局所的なアタッチメント関係を通じて,ブロック構造を表す構造対応ツリートークン化を導入する。
大規模な実験により、BrickAnythingは幾何学的に忠実で物理的に実現可能なレンガ構造を生み出している。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:33:25 GMT)
Paris 2.0: A Decentralized Diffusion Model for Video Generation [9.1] 分散計算によって事前学習された最初のビデオ生成モデルであるParis 2.0を提示する。
Paris 2.0はFrechet Video Distance (FVD)を561.04から279.01に削減し、2.0倍改善し、CLIPのテキストビデオ類似性と美的スコアを引き上げた。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:27:22 GMT)
PitchBench: Measuring Pitch Hearing in Audio-Language Models [9.1] 音声モデル(ALM)におけるピッチ聴力を測定する評価スイートであるPitchBenchを紹介する。
PitchBenchは、音の大きさ、音の持続時間、音源、時間伸張、背景雑音、その他の音響条件の異なる配列とコード内の絶対的および相対的なピッチ知覚にまたがる28の実験を含む。
ピッチ補聴器の精度は,音源,音符持続時間,表記形式によって著しく変化し,信頼性が低いままである。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:37:15 GMT)
When Do LLM Agents Treat Surface Noise Differently from Semantic Noise? A 68-Cell Measurement Study with a Held-Out Trace-Level Validation [9.1] 10大言語モデルによって駆動されるチェーン・オブ・シンクとReActエージェントに経験的現象を記述した。
平均的な摂動は、同等の厳しさのプレゼンテーション摂動よりも、最終的な答えを頻繁に変更する。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:57:11 GMT)
JacQuant: STE-Free Quantization-Aware Training via Learned Jacobian Surrogates [9.0] QAT(quantization-aware training)は広く展開されているが、通常はSTE(Straight-Through Estimator)に依存している。
これにより、ビン付近でトレーニングを行ない、実際の低精度モデルと弱く整合することが多い。
JacQuantは軽量な代理モデルのパラメータ変化に対する局所感度を学習するフレームワークである。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:19:49 GMT)
Double Triangle Annotation: A Scalable Human-in-the-Loop Framework for High-Precision Historical Document Annotation [9.0] ダブルトライアングルフレームワークは、高い精度の出力を確保しながら、ほとんどのアノテーション作業を自動化する。
1887-1906年のフランスの医療ディレクトリのコーパスであるガイドズ・ローゼンヴァルトでは、このフレームワークは最後のワードエラー率0.003を達成している。
スケールに適用されたモデルコンセンサスオートアクセプションは、13,595フィールドの85%以上である。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:29:30 GMT)
Learning Sparse Compositional Functions with Norm-Constrained Neural Networks [9.0] 深層ネットワークは対象関数の構成構造を活用でき、次元性の呪い(CoD)を効果的に回避できることを示す。
チューリング計算可能な全ての関数はスパース構成表現を許容するので、我々の結果は幅広い適用性を持つ。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:02:13 GMT)
BacktestBench: Benchmarking Large Language Models for Automated Quantitative Strategy Backtesting [8.9] BacktestBenchは、自動量的バックテストのための最初の大規模ベンチマークである。
4つのタスクカテゴリ(メトリクス計算、ティッカー選択、戦略選択、パラメータ確認)の18,246の厳密な注釈付き質問応答ペアで構成されている。
また、自然言語戦略を再現可能なバックテストに変換する堅牢なマルチエージェントベースラインであるAutoBacktestを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:26:13 GMT)
A general tensor-structured compression scheme for efficient large language models [8.9] 対象とする密度線形層をテンソル作用素の実行可能な混合に置き換える一般的なテンソル構造圧縮スキームを提案する。
MixTはTransformerベースの大規模言語モデル(LLM)や他の高密度ニューラルネットワークにも適用可能である。
LLaMA2-7B遷移境界において、MixTはフルモデルパラメータを47.5%、推論FLOPを37.1%、FLOPを52.1%、ピーク推論メモリを60.4%削減する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:00:41 GMT)
P1SCO: Social Dimensions from a Perspectivist Lens [8.7] P1SCOは3つのプラットフォームから収集されたソーシャルメディアコメントのデータセットである。
データセットは慎重に分解され、個々のコメント、アノテーション、プラットフォームレベルでの分析が可能になる。
論文参考訳(メタデータ) (Mon, 25 May 2026 00:25:37 GMT)
Behind EvoMap: Characterizing a Self-Evolving Agent-to-Agent Collaboration Network [8.6] 本稿では,A2AコラボレーションネットワークであるEvoMapについて,大規模な実証的研究を行った。
スケーラブルな成長を優先する設計選択が、再利用性、進化性、監査性にトレードオフをもたらすことを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:12:27 GMT)
Analogies between Transformer Layers and Power Method [8.6] 層を通過すると、トークンは行列の主固有ベクトルに向かって傾く傾向にあることを示す。
アナログはまた、トークン空間における任意の所望方向に向けて変換器の出力を操る方法も提案している。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:20:41 GMT)
Diversity Over Frequency: Rethinking Tool Use in Visual Chain-of-Thought Agents [8.6] 複雑な視覚的推論タスクにおける外部視覚ツールの役割について検討する。
これらのタスクには、空間的推論と医療的視覚的質問応答が含まれる。
その結果,ツールを足場としてトレーニングする時間的視点が示唆され,言語生成や視覚的ツールの実行に関する広範な探索が,ツール使用の崩壊にもかかわらず推論を改善する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:06:59 GMT)
Iterate Until Retrieved: Factual Nugget Optimization for Discoverable Continual Corrections in Agentic RAG [8.4] 本稿では,生産エージェントRAGをテストハーネスとして利用するインデックス時間最適化手法であるイテレーティブ・ナゲット・最適化(INO)を紹介する。
INOは最初のナゲットを作成し、トリガークエリとパラフレーズでそれを探索し、失敗した検索と回答トレースを反映し、発見されるまでナゲットを再修正する。
INOは、事実修正の発見可能性と使用性の観点から、ベースラインよりも一貫して結果を改善している。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:45:34 GMT)
Universal Bound for Entanglement Generation [8.4] 我々は、一般的なマルチモードシステムを分析し、ホワイトサーマルノイズ下での双線形相互作用の分離性保存条件を導出する。
重力によって引き起こされる絡み合いへの応用として、この相互作用は絡み合いが発生するためには熱ノイズよりも支配されなければならないことを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:00:01 GMT)
Amplification and generation bounds of gravity-induced entanglement in pulsed optomechanical systems [8.4] 2つの赤みがかったパルス光力学系の出力光場間の重力誘起絡みについて検討した。
個々の系に対して、光学的相互作用は入射光パルスとその機械的モードの間のビームスプリッター状態スワップを実現する。
圧縮またはフォック状態の入力を準備することで、絡み合いの量を増幅できることが示される。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:07:10 GMT)
From Item-Only to Query-Item: Query-Conditioned Generative Search with QGS in Quark [8.4] 生成シーケンスモデルは推奨に強い結果を示している。
それらを検索ランキングに適用することは、もっと難しい。
本稿では,QGS(Query-Conditioned Generative Search)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:18:51 GMT)
RocketSmith: An Agentic System for High-Powered Rocket Design and Manufacturing [8.4] この研究は、高出力ロケット開発における設計、製造、最適化のプロセスが可能なエージェントシステムであるRocketSmithを提示する。
このシステムは、ソフトウェアツールのインテリジェントな自動化を可能にし、飛行安定性などの要素を検証するだけでなく、ロケット組み立てのためのパラメトリック設計コンポーネントを生成する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:37:39 GMT)
G-DRAGON: Geospatial Reasoning and Dynamic Planning for Retrieval-Augmented Outdoor Navigation [8.4] G-DRAGONは、屋外のオープンワールドナビゲーションのための検索拡張フレームワークである。
軽量LLMに基づく生成検索により、自然言語コマンドをバージョン管理されたローカルOSMエンティティにマッピングする。
高レベルの計画モジュールは、SLAMシステムでグローバルなトポロジカルなルートをブリッジし、地理空間的な経路をロボットのナビゲート可能なフレームに投影する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:52:58 GMT)
Non-Hermitian Twisting Theory under the open boundary condition [8.2] 我々は非エルミート皮膚効果(NHSE)の部位分解理論を開発する。
非エルミートバンド理論を非周期格子および乱格子に拡張する。
この結果は結晶および非晶質媒体における非エルミート物理学の普遍的パラダイムを提供する。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:29:08 GMT)
Enhancing Single-Image Facial Demorphing using Multimodal Large Language Models [8.1] 顔認証システムは、複数のアイデンティティにマッチするように合成画像が作成される、モーフィング攻撃に対してますます脆弱になっている。
本稿では,マルチモーダル大規模言語モデルを活用した,参照不要な顔変形フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:40:32 GMT)
Efficient Benchmarking Is Just Feature Selection and Multiple Regression [7.9] 既存のベンチマーク手法は、予測段階で単にカーネルリッジレグレッションを使用することで、大幅に改善することができる。
我々は,mRMR (Minimum Dundancy maximum Relevance) と呼ばれる情報理論的特徴選択アルゴリズムを用いて,予測に最適な質問サブセットを選択する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:23:31 GMT)
Fast Convergence of Policy Regret in Learning Stochastic Optimal Control [7.9] 最適制御における政策学習, 最適作用値関数$Q*$の推定によって引き起こされる欲求政策について検討する。
連続作用空間において、高速ポリシー学習は、成長指数$p$、マージン質量指数$m$、行動ワイド正規性指数$q$の3つの幾何学構造によって誘導されることを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:07:24 GMT)
Decision-Making with Lightweight Confidence-Aware Language Model for Autonomous Driving [7.9] 大規模言語モデル (LLMs) とマルチモーダルLSM (MLLMs) は、自律運転において大きな可能性を実証している。
本稿では,軽量な信頼度を考慮した言語モデルを用いた新たな意思決定フレームワークを提案する。
提案手法は,通常のシナリオと長期シナリオの両方において,SOTA(State-of-the-art)の成功率を達成することを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:38:12 GMT)
Training-Free Quantum Generative Paradigm via Local Parent Hamiltonians [7.8] 本稿では,現在の生成モデルと根本的に異なる,トレーニング不要な量子生成パラダイムを提案する。
我々は,対象分布を符号化した局所的親ハミルトニアンを構築し,大域的ハミルトニアンを解くことにより,パラメータトレーニングなしで画像とテキストの生成を可能にする。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:05:12 GMT)
Erased but Exploitable: Black-box Embedding-Aware Prompting Against Unlearned Text-to-Image Diffusion Models [7.8] 機械学習は、事前訓練されたテキストから画像への拡散モデルから特定の概念を取り除くことを目的としている。
ホワイトボックスとブラックボックスの攻撃は、モデルがそのような未学習の概念を生成するために導入された。
我々は,ブラックボックスの埋め込み型対逆攻撃であるBEAPを紹介した。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:11:59 GMT)
Global Convergence of Wasserstein Policy Gradient for Entropy-Regularized Reinforcement Learning [7.7] Wasserstein Policy gradient (WPG)は、強化学習のためのポリシー最適化手法である。
エントロピー規則化 RL のベルマン構造を利用して WPG に対する大域収束理論を開発する。
解析により、エントロピー正則化 RL は通常の平坦な意味では凸ではないが、ベルマン再帰は好ましいポリアック-ロジャシエヴィチ型幾何を誘導することを示した。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:42:59 GMT)
Context-CoT: Enhancing Context Learning via High-Quality Reasoning Synthesis [7.6] LLMは、静的事前訓練された知識を用いたプロンプトの推論に優れるが、文脈学習にかなり苦労する。
最近のCL-Benchの評価では重要な能力ギャップが示されており、フロンティアモデルは平均17.2%の文脈依存タスクしか解決していない。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:18:30 GMT)
Suicide Risk Assessment from AI-powered Video Surveillance: An Interpretable Framework for Prevention in Metro Stations [7.6] 我々は、地下鉄駅における自殺リスクアセスメント(SRA)のタスクを形式化し、この課題に対処する最初の解釈可能な枠組みを導入する。
孤立したサブタスクに焦点を当てたり、直接意図を推測しようとするアプローチとは異なり、我々の定式化は蓄積された証拠から自殺リスクを評価する。
この研究は、自殺リスク評価の複雑さを強調し、社会的善のための解釈可能なAIシステムの研究のための新たな方向性を開く。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:39:13 GMT)
A Two-Phase Stability Study of LLM Judges and Bar Council Examiners on Thai Bar-Exam Free-Form Essays [7.6] ルーブリックが両方の軸を処方する15個の細胞のうち、29個のラッカーは全てタイトなバンドに収束する。
残りの5つの細胞は、決定的な法定引用を省略する正しい最終回答の格付けを規定していないが、ヒトのパネルは2つのコヒーレントな読解を分割する。
LLM-panel $$は、両方の読みのバランスの取れた再生ではなく、多数読みの体系的な収束を反映している。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:58:28 GMT)
RAG-Match: Retrieval-Augmented Knowledge Injection and Hierarchical Reasoning for Calibrated Semantic Relevance [7.5] textscRAG-Matchは、知識を付加した事前学習、階層的推論アライメント、および関係モデリングのための嗜好に基づく決定キャリブレーションを統合する3段階のフレームワークである。
実世界の検索関連ベンチマークによる実験結果から,textscRAG-Match は複数のランキング指標で強い LLM ベースのベースラインを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:42:39 GMT)
A Context Augmented Multi-Play Multi-Armed Bandit Algorithm for Fast Channel Allocation in Opportunistic Spectrum Access [7.4] 機会スペクトルアクセス (OSA) のシナリオにおいて, チャネル割り当てのための無作為なコンテキストマルチプレイ・マルチアーム・バンディット (MP-MAB) 問題について検討する。
本研究では,MP-MABにおける腕の報酬関数の摂動としてチャネルノイズをモデル化することにより,この影響を具現化する。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:37:02 GMT)
Workflow Closure Is Not Scientific Closure in Auto-Research Systems [7.3] 信頼に値する自己調査は、自律的な自己充足を目標とするのではなく、非自律的な制御の下での自律的な実行を目標とすべきである、と我々は主張する。
この急激な領域における100以上の最近の論文やリポジトリの調査に基づいて、繰り返し、構造的に結びついている障害パターンを診断する。
コミュニティの議論を喚起するために、客観的なシグナル、検証、アウトプットの経路にまたがる潜在的な改善について概説する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:16:52 GMT)
On Reliability of Efficient Membership Inference Vulnerability Evaluation [7.3] メンバーシップ推論攻撃(MIA)は、トレーニングデータ中の機密情報の漏洩を経験的に評価するための一般的な手法である。
MIAスコアに基づくTPRの評価は、複数の個人と複数のターゲットモデルに対して平均化されることが多いことを示す。
異なるサンプル間でFPRを効果的に校正するための後処理手法を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:16:39 GMT)
"You do understand that people don't trust technology?": Explaining Trusted Execution Environments to Non-Experts [7.1] ユーザは、TEEによって保護されることを知って、データの共有をより快適に感じるかもしれません。
非専門家にTEEを導入したテキストによる説明について検討した。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:31:10 GMT)
Tetris: Tile-level Sampling for Efficient and High-Fidelity Video Object Tracking [7.1] Tetrisは、動画をタイルベースのポリオミノデータモデルに分解するトラック素材抽出システムである。
7つの静止ビデオデータセットを通して、Tetrisは全フレーム、全フレーム参照パイプラインの精度損失を5%の範囲内に保持する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:55:49 GMT)
Beyond Query Memorization: Large Language Model Routing with Query Decomposition and Historical Matching [7.0] DecoRは、ルーティングタスクを、過去のログから同様のクエリを精査するマッチングプロセスとして再キャストする。
マッチング精度を向上させるために,タスク固有の要件から言語表面の形状を分離するクエリ機能を導入する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:12:58 GMT)
Two-Parameter Flows for Learning Population Dynamics of Physical Systems [7.0] ラベルのないサンプルを用いて高次元確率密度の力学を時間とともに学習する。
結果の物理時間力学は特異であり、サンプリング時間輸送から正則性を引き継ぐことが証明される。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:16:22 GMT)
Retrieval as Reasoning: Self-Evolving Agent-Native Retrieval via LLM-Wiki [7.0] LLMエージェントは、検索をワンショットのコンテキストフェッチのように振る舞うのではなく、推論のように振る舞う必要がある。
本稿では,外部知識をコンパイル可能,構成可能,自己進化的構造として扱うことにより,レトリーバル・アズ・推論のパラダイムを運用する LLM-Wiki を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:36:14 GMT)
AuthTrace: Diagnosing Evidence Construction in Thematically Dense Single-Author Corpora [7.0] AuthTraceは、すべての主要なパラダイムを単一のコーパスとクエリセットに配置する最初の診断ベンチマークである。
すべてのテキストがスタイル、トピック、語彙を共有する、テーマ的に密集したコーパス上に構築されたAuthTraceは、2,099のインスタンスに徹底的な金の証拠を提供する。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:10:52 GMT)
DRM: Diffusion-based Reward Model With Step-wise Guidance [6.8] 拡散モデル(Diffusion-based Reward Model, DRM)は、事前学習した拡散モデルを強力な評価バックボーンとして利用する新しいパラダイムである。
本稿では,不正確なクレジット代入問題を解決するために,高密度なステップごとの報酬を提供する強化学習アルゴリズムGRPOを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:11:32 GMT)
Cross-Stage Attention Multi-Expert Network for Radiologist-Inspired Breast Ultrasound Diagnosis [6.7] 本稿では,CSA-MoE-Net(Cross-Stage Attention-of-Experts Network)を提案する。
Cross-Stage Attention-enhanced ResNet-18をバックボーンとして採用し、Cross-Stage Attentionモジュールがマルチレベル機能を適応的に再調整する。
2,129枚の胸部超音波画像のバランスの取れたデータセットの実験では、平均20回の独立ランで96.33%の精度、94.09%の精度、98.53%のリコール、96.25%のF1スコアを達成した。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:20:13 GMT)
L-Drive: Beyond a Single Mapping-Latent Context Drives Time Series Forecasting [6.7] 変更を意識した予測フレームワークであるL-Driveを提案する。
よりタイムリーな変更手順を提供し、変更セグメントへの適応を改善する。
実験はL-Driveの有効性を検証し、予測精度と計算効率のトレードオフをより良く示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:39:48 GMT)
Concept Unlearning via Cross-Attention Activation Projection for Diffusion Models [6.7] 概念アンラーニングは、事前訓練されたテキスト-画像拡散モデルからターゲット概念を再トレーニングせずに消去することを目的としている。
既存のクローズドフォームメソッドは、テキストエンコーダの応答を通じてターゲット概念を表現する。
本稿では,層間相互アテンションアクティベーションからベースを隠蔽・保持するクローズドフォーム手法PUREを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:18:47 GMT)
Safety-Critical Whole-Body Control for Humanoid Robots via Input-to-State Safe Control Barrier Functions [6.6] 本稿では,ヒューマノイドロボットのための階層型安全クリティカル全身制御フレームワークを提案する。
提案アーキテクチャは,キネマティック・ボディー・コントローラ(KinWBC),ISSf-CBFセーフティフィルタ,ダイナミック・ボディー・コントローラ(DynWBC)を統合している。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:02:30 GMT)
Binding Visual Features Point by Point [6.6] 我々は、ポイント・バイ・テキストへの学習が内部視覚探索ルーチンを誘導することを示す。
また、微調整によって新たなタスクにポインティング動作を一般化することも見出した。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:58:23 GMT)
Learning to Search and Searching to Learn for Generalization in Planning [6.3] 統合学習は深層強化(DRL)の中心的課題であり続けている
スパース・リワード領域では、リアルタイム検索による標準的な探索は効果がない。
我々は、ゼロから問題を解決するために自己改善の$mathrmAstar$を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:25:13 GMT)
Data-driven Head Motion Generation through Natural Gaze-Head Coordination [6.2] 本稿では,大規模な顔画像から時間的視線調整をモデル化するための,データ駆動型アプローチを提案する。
本稿では,自然だが多様な視線と頭部の動きを,外見に基づく視線推定器で抽出する自動パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:02:51 GMT)
What Makes a Medical Checker Trainable? Diagnosing Signal Collapse and Reward Hacking in Checker-Guided RAG for Biomedical QA [6.2] 医療RAGはエビデンスベースのクレームを必要とするため、クレームレベルのNLIチェッカーを検索強化されたRLに接続するのは直感的である。
NLIチェッカーのバックエンドをGRPO訓練医療RAGエージェント内のプロセス報酬として比較した。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:06:06 GMT)
Max-Window Scale Estimation for Near-Lossless HiF8 W8A8 Quantization-Aware Training [6.0] 低ビット浮動小数点フォーマットによる量子化対応トレーニング(QAT)は、効率的なLCMデプロイメントを実現するが、標準的なトレーニングメトリクスには見えない微妙な障害モードを導入する。
遅延スケーリング(DTS)によるOpenPangu-Embedded-1B用HiF8 W8A8 QATの系統的研究について述べる。
我々は、2つの障害モードを同定し、分離する: (i)max saturation、遅延スケール、フォワードパスクリッピングによる知識に敏感な表現を推定する; (ii)カタストロフィックな忘れ、そして、アグレッシブラーニングレートは、量子化とは無関係に事前訓練されたコモンセンス知識を上書きする。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:19:57 GMT)
The Traffickers' Pitch: Detecting Deceptive Recruitment in Online Job Boards [6.0] 本稿では,その言語的特徴から人身売買採用者を特定するための計算フレームワークを提案する。
本稿では,リスクの高い求人広告のための大規模基盤真理を構築するためのネットワーク型ラベリング手法を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:32:22 GMT)
StakeBench: Evaluating Language Understanding Grounded in Market Commitment [5.9] StakeBenchは、市場のコミットメントに根ざした言語理解のための評価フレームワークである。
StakeBenchは2,261の市場から560,876件のコメントを入手した。
4つの診断タスクは、モデルが市場のコミットメントを検出し、明らかにされた側面を特定し、将来のアクションを予測し、集合的なオッズ予測を実行するかどうかをテストする。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:38:30 GMT)
Referential Security as a New Paradigm for AI Evaluations [5.7] 我々は,AI評価の新しいパラダイムとして参照セキュリティを提案する。
このアプローチは、モデルアイデンティティを経験的に検証可能な性質として再設計し、参照安定性を実体セキュリティが条件としているものと区別する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:24:10 GMT)
Intelligent Detection and Mitigation of Carpet-Bombing DDoS Attacks in SDN Using Retrieval-Augmented Generation and Large Language Models [5.6] Retrieval-Augmented Generationベースのフレームワークは、Carpet-Bombing DDoS攻撃のリアルタイム検出と軽減を目的として提案されている。
提案フレームワークは,インタフェースレベルのトラフィック特徴表現,セマンティック埋め込み生成,FAISSに基づく類似性検索,Large Language Model(LLM)によるコンテキスト推論を組み合わせた。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:58:45 GMT)
PolyGnosis 2.0: Enhancing LLM Reasoning via Agentic Harness Engineering for Polymarket and OSINT Insight Extraction [5.5] PolyGnosis 2.0は、Polymarketの異常信号とグローバルなオープンソースインテリジェンスストリームを合成することによって、予測インテリジェンスを抽出するために設計された、先駆的なマルチエージェントアーキテクチャである。
我々は,ポリマーケットの感情とグローバルメディアフローの相違点である「パースペクティブ・ミスマッチ(Perspective Mismatches)」を,ハイアルファ取引信号として定義し,ターゲットとする。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:30:54 GMT)
Boundary Geometry Turns Entanglement into Steering [5.5] 量子絡み合いは必ずしもアインシュタイン=ポドルスキー=ローゼンの操舵を意味するとは限らない。
絡み合った状態が信頼状態空間の境界を満たすとき、このギャップを閉じる境界機構を同定する。
フィルタされた標準形式、明示的な3階Coleskyパラメトリゼーション、コンパクトな境界証明を提供する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:40:44 GMT)
Uncertainty-Calibrated Recommendations for Low-Active Users [5.4] 低アクティブユーザ(LAU)と高アクティブユーザ(HAU)の多様性のバランスをとる必要があると我々は主張する。
差別化戦略を推進するために不確実性を校正する、統一的で生産可能なフレームワークを導入します。
具体的には、モデル不確実性に基づくリスクボイス政策をLAUに対して実施し、信頼性の低いレコメンデーションを抑えるとともに、HAUに対するリスク検索アッパー信頼境界(UCB)戦略を用いて探索を促進する。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:59:03 GMT)
Prior Policy Guided Dual-Agent Coordinated Manipulation Planning of Spacecraft-Manipulator System [5.3] 本稿では,デュアルエージェント協調型マニピュレーション計画フレームワークを提案する。
同時に6-DoFの宇宙マニピュレータに届く高精度のエンドエフェクターポーズと、ベース宇宙船の姿勢安定化を実現している。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:32:23 GMT)
Finite-Particle Convergence Rates for Conservative and Non-Conservative Drifting Models [5.3] 一段階生成モデルのための保守的ドリフト法を提案し,解析する。
この方法は、元の変位に基づくドリフト速度をカーネル密度推定器(KDE)の勾配速度に置き換える。
また,Laplaceカーネルを用いた非保守ドリフト法を,Dengらによって提案された原位置ベース速度に対応した2026年に解析した。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:45:48 GMT)
Learning Nonlinear Factor Models with Unknown Monotone Links from Incomplete and Noisy Data [5.3] 我々は,未知のリンク関数によって観測応答が低ランク因子に依存する非線形因子モデルをブロックする。
リンク関数は単調な空間回復にあり、識別可能性を維持しながら柔軟性のあるあいまいさを可能にすると仮定される。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:57:03 GMT)
CogAdapt: Transferring Clinical ECG Foundation Models to Wearable Cognitive Load Assessment via Lead Adaptation [5.3] CogAdaptは、臨床ECGファンデーションモデルをウェアラブル認知負荷評価に適用するフレームワークである。
LeadBridgeは、学習可能なアダプタで、3本リードのウェアラブル信号を解剖学的に一貫性のある12本リードの表現に変換する。
ProFineは段階的な微調整戦略であり、徐々にエンコーダ層を凍結し、破滅的な忘れを防いでいる。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:20:33 GMT)
Sandlock: Confining AI Agent Code with Unprivileged Linux Primitives [5.3] Sandlockは、単純な分割を中心に構成された軽量なLinuxプロセスサンドボックスである。
動的ネットワーク決定、HTTPレベルのアクセス制御、TOCTOUセーフなエグゼクティブ引数の検査、可逆効果をサポートする。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:51:30 GMT)
Multi-Agent Coordination Adaptation via Structure-Guided Orchestration [5.2] 我々は,エージェントの参加やインタラクションよりも,タスクと予算条件が優先される構造を学習する自動調整フレームワークMACAを紹介する。
ベンチマーク全体で、MACAは適応型マルチエージェントベースラインを平均8.42%上回り、トークンは43.19%減少している。
さらに, 構造とオーケストレーションの協調的適応により冗長な相互作用が抑制され, タスク有効実行に向けた協調が収束することが明らかとなった。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:59:58 GMT)
Boundary Variance Inflation Causes Acquisition Bias in Gaussian Processes [4.9] 有界領域上の定常核を持つガウス過程は、境界付近で膨らんだ後方分散を示す。
我々は根本原因を単純な幾何学的メカニズムに辿る。
任意の取得、カーネル、および有界ドメインシェルに対して、関数なし選択強調診断を導入する。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:59:40 GMT)
ProcCtrlBench: Evaluating Process-Level Defects and Control Preservation in LLM Coding Agents [4.9] ProcCtrlBenchは、LLM符号化エージェントの実行プロセス評価のベンチマークである。
4つのカテゴリで11の障害タイプをカバーする再利用可能なオントロジーに、繰り返し実行される障害を整理する。
最終結果のみではなく、標準化されたプロセスエビデンスを通じてエージェントの軌跡を評価する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:08:39 GMT)
How Should LLMs Consume High-Quality Data? Optimal Data Scheduling via Quality-Aware Functional Scaling Laws [4.9] 大規模言語モデル(LLM)のトレーニングでは高品質なデータが不足するが、トレーニングダイナミクスと併用して使用をスケジュールする方法には理論的ガイダンスが欠如している。
LLM中等教育のためのDrop-Stable-Rampupを提案する。
108Bトークンで中級訓練された15BのMixture-of-Expertsモデルでは、Drop-Stable-RampupはWarmup-Stable-Decay(WSD)を+1.70、Cosine-Decayを+2.98で平均精度を改善する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:56:45 GMT)
From Model Scaling to System Scaling: Scaling the Harness in Agentic AI [4.8] 本稿では,エージェントAIの次なるボトルネックをシステムスケーリングとして検討する。
我々は、このシフトをハーネスのスケーリングと呼び、基礎モデルを取り巻く構造化された実行層を設計、評価、最適化の第一級のオブジェクトとして扱います。
私たちの主張では、エージェントAIの今後の進歩は、より強力な基礎モデルと同じくらい、システム設計に依存します。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:59:36 GMT)
Towards Open-World Referring Expression Comprehension: A Benchmark with Training-free Multi-task Consistency Checker [4.7] Referring Expression comprehension (REC) は、所定の式に基づいて画像内の対象物をローカライズすることを目的としている。
OpenRefは複雑な視覚的および言語的シナリオにおけるRECの新しいベンチマークである。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:05:37 GMT)
Geometry Adaptive Counterfactual Distribution Learning with Diffusion-Guided Smoothing [4.7] 標準等方的平滑化はすべての環境方向を等しく扱い、好ましくないスケーリングと不安定な局所的推論をもたらす。
半パラメトリックなデバイアスに基づく2つの拡散誘導型推定器を提案する: 拡散インフォームド・スムースメントは反ファクト的な密度に対して、拡散インフォームド・スコアスムースリングは反ファクト的なスコアに対して、拡散インフォームド・スコアスムースリングである。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:02:56 GMT)
STARIXNet: Multivariate and Multi-attribute Deep Learning Approach to Real-Time Resource Allocation in Cloud Platforms [4.6] 本稿では,多変量空間における資源配分決定を導く軽量ニューラルネットワークSTARIXNetを提案する。
STARIXNetは複数の準依存属性、特に(S)easonal、(T)emporal、(A)uto-gressive(R)ntegrated、e(X)oパターンをモデル化する。
生の予測精度よりも、スケーリング決定を確定し、サービスの安定性を優先するアグリゲーションポリシーを実装している。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:41:32 GMT)
Is TabPFN the Silver Bullet for Insurance Pricing? [4.5] タブラル基礎モデル(TFM)は基本的に異なる推論パラダイムを示す。
大量の合成データセットを事前学習することにより、TFMはコンテキスト内学習を通じて新しいデータに対する推論を可能にする。
本稿では,自動車保険価格に対するTabPFNの実証評価について述べる。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:27:59 GMT)
"What is the Problem Space?" Defining Host-space Adversarial Perturbations against Network Intrusion Detection Systems [4.4] 現実の敵は、制御できるホストを操作すれば、敵の摂動を適用できると主張している。
このような「プロブレム空間」の微妙な変化(すなわち、攻撃者の宿主)が「機能空間」に対する破壊的な影響をいかに引き起こすかを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:19:32 GMT)
Prospective evaluation of multimodal respiratory failure prediction: Do chest X-rays improve performance beyond EHR signals? [4.3] 我々は、構造化EHR時系列データをCXR基礎モデル表現と統合するゲート型マルチモーダルフレームワークを開発した。
ICU患者24時間以内の侵襲的機械換気予測の枠組みについて検討した。
EHRのみのモデルと比較して、マルチモーダル統合は特異性と正の予測値を増加させた。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:25:47 GMT)
Cultural Value Alignment Via Latent Activation Steering in Large Language Models [4.2] 文化的評価と介入のための一般化可能な枠組みを提案する。
300のジレンマから暗黙のトークン確率を抽出することにより、表面レベルのアライメントをバイパスする。
適応性にはかなりの変化が見られ、潜伏絡みの一貫した現象が明らかになる。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:20:52 GMT)
Artifact Correction for Echo-Planar Imaging at Low-Field and Ultra-Low-Field MRI [4.2] 低磁場 (LF) と超低磁場MRI (ULF) におけるエコープラナー画像 (EPI) は、奇異なk空間のずれにより、ニキストのゴーストアーティファクトに苦しむ。
本研究では,従来型参照スキャンへの依存度を低減した,参照不要なアーティファクト修正パイプラインを開発した。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:40:00 GMT)
High-Dimensional Carrier-Assisted Entanglement Purification Based on Mutually Unbiased Bases [4.1] 相互非バイアスベース(MUB)に基づく決定論的前処理方式を導入する。
MUBに適応したmCAEPPは、初期忠実度が$p_00>(d-1)/(2d)$の任意の2量子パウリチャネルに対して忠実性が得られることを厳密に証明する。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:10:11 GMT)
Are We Overconfident in Models and Results for Semi-Supervised 3D Medical Image Segmentation? [4.1] 半教師付き学習は、アノテーションのコストを削減する主要なパラダイムとなっている。
現在の進歩は2倍の過信問題によって曇っていると我々は主張する。
本稿では,二軸信頼性評価エンジン上に構築した三空間原理分割フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:16:40 GMT)
From Data to Insights: Exploring Program-of-Thoughts Prompting for Chart Summarization [4.1] 本稿では,従来のチャート・ツー・テーブル方式と比較して,より柔軟な表現を提供する,新しいチャート・ツー・ディクショナリー補助タスクを提案する。
我々の戦略は、意味的および事実的メトリクスをまたいだ既存のチャート要約手法と同等に機能する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:26:06 GMT)
A Multimodal 3D Foundation Model for Light Sheet Fluorescence Microscopy Enables Few-Shot Segmentation, Classification, and Deblurring [4.1] 本研究では,LSMデータに対する3次元基礎モデルを提案する。
我々は、マスク付き再構成と画像テキストアライメントを共同で最適化することで、転送可能なボリューム表現を学習する。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:50:58 GMT)
CausalFlow: Causal Attribution and Counterfactual Repair for LLM Agent Failures [4.1] フェールエージェントトレースを最小限の偽物修復と再利用可能な監視に変換する介入フレームワークであるCausalFlowを紹介した。
CaulFlowは、最小限の振る舞いドリフトで障害から回復するターゲットテスト時修復と、オフラインの優先度最適化や報酬モデリングに適したトレーニング時間監視の2つの補完的な使用をサポートする。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:47:01 GMT)
VesselSim: learning 3D blood vessel segmentation without expert annotations [4.0] ユニバーサル3D血管セグメンテーションのための2段階フレームワークである VesselSim を提案する。
3D U-Netは、合成データのみに基づいて訓練され、16,500の解剖学的に妥当な3D血管造影ボリュームを生成する。
VesselSimは最先端のセグメンテーション基盤モデルと競合するパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:04:18 GMT)
Curve Skeletonization in Continuous domain for Meshes and Point Clouds [4.0] CSCD(Curve Skeletonization for Curve Skeletonization in the Continuous Domain)を紹介する。
本稿では,メッシュ用CSCD-Mと点雲用CSCD-PCの2つの実現法を提案する。
この結果から,CSCD-Mは,Thingi10kデータセットなどのベンチマークにおいて,多種多様なメッシュ間でのLS性能と,TLS(TOG'21)を比較検討した。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:57:35 GMT)
Parallel Differentiable Reachability for Learning and Planning with Certified Neural Dynamics and Controllers [4.0] 解析的およびNNに基づく動的およびコントローラを備えた連続時間および離散時間システムのための並列化可能な、差別化可能な到達性フレームワークをJAXに提示する。
我々のフレームワークは,アフィン依存を保存する統一表現を通じて,テイラーモデルフローパイプ構造とCROWNスタイルの線形境界伝搬を組み合わせたものである。
このリーチビリティ・プリミティブに基づいて、(i)リーチビリティ・フレンドリなダイナミックスモデルとコントローラを促進するための認定トレーニング手法を開発し、(ii)勾配に基づく改良を伴うリーチビリティ・アウェア・サンプリングベースのMPCスキームを開発した。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:04:06 GMT)
How Reliable Are Semantic-ID Tokenizer Comparisons in Generative Recommendation? [3.9] 生成レコメンデーションでは、各項目を離散コードのシーケンスとして表現し、自己回帰モデルを訓練して次の項目のSIDシーケンスを生成する。
この評価プロトコルは、SIDレベルのマッチングとアイテムレベルのレコメンデーションとを等価とし、各SIDシーケンスが1つのアイテムにマップされたときにのみ保持される同値である。
トークンーはアイテムの特徴をコード空間に圧縮するので、意味的に類似しているが協調的に異なるアイテムは、しばしば同じSIDシーケンスに割り当てられる。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:22:45 GMT)
Parameter-Efficient CT Reconstruction via Deep Graph Laplacian Regularization [3.9] 本研究は、厳密な資源制約の下でグラフベースの正規化が有意義なノイズ低減をもたらすかどうかを考察する。
本稿では,グラフ正規化をPhysmal Forward-Backward Splitting最適化フレームワークに統合したDeep Graph Laplacian Regularization (Deep GLR)を提案する。
LoDoPaB-CTベンチマークで評価され、Deep GLRは30.70dBのPSNRを達成した。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:04:29 GMT)
When Symptoms Are Not Enough: Evidence-Weighting Patterns in Large Language Model Psychiatric Screening [3.8] 今回我々は,不安障害,大うつ病,外傷後ストレス障害,現在の精神疾患の診断ラベルと組み合わせた555件の半構造化体験面接のSCIDアンコールベンチマークを紹介した。
誤陰性誤りが精神医学的根拠の欠如や症状の差分重み付け,機能障害,保護的内容の手がかりを反映しているかどうかを検討した。
GPT-4.1 MiniとGPT-5 Miniは最も一貫性のある障害特異的な精度を示した。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:34:30 GMT)
NightSight: Passive Computation for Navigation in Dark Using Events [3.7] 小型の空中ロボットは、閉じ込められた危険な環境での捜索と救助に適している。
本稿では,単眼イベントカメラ,符号化開口レンズ,赤外線ドットプロジェクタを組み合わせた軽量な認識手法を提案する。
我々のシステムはNVIDIA Jetson Orin Nano上で20Hzでリアルタイムに動作し、リソース制約のあるプラットフォームに適していることを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:07:44 GMT)
Multi-Agent Reinforcement Learning for Safe Autonomous Driving Under Pedestrian Behavioral Uncertainty [3.7] MAPPO(Multi-Agent Proximal Policy Optimization)を用いたSDCと12人の歩行者の共同訓練
500エピソード評価では、共同訓練したSDCは14%の衝突率で78%に達し、最高のルールベースラインでは35%/33%に達した。
ジェイウォーキングは交差する事象の13%で、衝突の62%で、衝突を1歳児のRLと比較して30%減らした。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:49:33 GMT)
Understanding Data Temporality Impact on Large Language Models Pre-training [3.7] 大型言語モデル(LLM)は一般にシャッフルコーパスで訓練される。
本研究では,事前学習のダイナミクスが時間に敏感な事実知識の獲得に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:28:47 GMT)
The Impact of Competition on Outcomes of Score-Based College Admissions [3.7] 入学政策の設計が大学に入学する学生の能力にどのように影響するかを検討する。
我々のモデルでは、応募者は「タイプ」と「ソフトスキル」を組み合わせた多次元能力を持つ。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:09:52 GMT)
Scar Full Eigenstate Thermalization Hypothesis [3.7] 固有状態熱化仮説(ETH)は、孤立量子系における創発的統計力学の基本的なメカニズムを提供する。
量子スカーのパラダイムモデルであるPXPモデルにおいて,この枠組みの有効性を数値的に示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 23:41:29 GMT)
Boundary $0/π$ logical subspace and bulk dynamical probes in flux-controlled anomalous Floquet quantum walks [3.6] 一次元フラックス制御されたフロケ量子ウォークは、駆動された二部格子の直接顕微鏡的実現を認める。
ウォークはキラルであるため、準エネルギーギャップは0$と1/T$で、独立したトポロジ情報を運ぶ。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:40:36 GMT)
Conditional KRR: Injecting Unpenalized Features into Kernel Methods with Applications to Kernel Thresholding [3.6] 条件付きカーネルリッジ回帰(条件付きKRR)は学習方法である。
条件付きKRRは、$K$が正定値であり、$mathcalF$が$K$のマーサー分解の最初の$k$主固有関数によって与えられる場合に解析する。
理論的解析と実験の両方で条件付きKRRが標準KRRより優れていることが確認された。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:31:54 GMT)
On the Role of Inductive Bias in Time-Series Pretraining: A Case Study in Learning Generalizable Representations for Clinical Time Series [3.5] 課題タイプや課題間の表現が伝達されるように、事前学習対象がどの帰納的バイアスを課すべきかを考察する。
ダイナミクス中心の混合物は最もバランスの取れた移動を生み出す。
全体として、局所的再構成と時間的連続性を組み合わせるとともに、アクセスが現実的であればコンテキスト内条件付けを加えることで、堅牢な主観的表現が得られる。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:40:33 GMT)
PennySynth: RAG-Driven Data Synthesis for Automated Quantum Code Generation [3.5] 本稿では,量子コードアシスタントのための検索拡張生成フレームワークであるPenny Synthを紹介する。
13,389ペニーレーンの命令コードペアのキュレートされた知識ベースの上に構築されている。
QHackコンペティションの3年間にわたる74の課題に対して、64%、68%、52%のpass@5を達成した。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:26:43 GMT)
TypedCSIP: Typed Counterfactual Pretraining for Chinese Legislative Conflict Classification [3.5] TypedCSIPはLCR-CNベンチマークのコンフリクト分類タスクの型付き対実事前学習手法である。
我々は、LCR-CNの専門家による最小限の修正を、訓練時対実監督として活用する。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:26:46 GMT)
Boson Sampling as a Probe of Chaotic and Integrable Quantum Dynamics [3.5] 集積フォトニクスは量子アプリケーションに固有の利点をもたらす。
本研究では,量子カオスの実用的なプローブとしてフォック状態ボソンサンプリングを確立する。
ボソンサンプリングに基づく量子カオスプローブの集積フォトニクスによる最初の実証を行う。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:44:41 GMT)
Dissipative Time Quasicrystals from Multilevel Interference [3.5] 境界時間結晶は、持続周期振動による連続時間変換対称性の自発的な破れを示す。
多レベル干渉は周期的順序を超える自然な経路を提供することを示す。
本研究は,時間-準周期秩序に対する最小の干渉誘起機構を確立する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:16:33 GMT)
Symmetry-Compatible Principle for Optimizer Design: Embeddings, LM Heads, SwiGLU MLPs, and MoE Routers [3.4] 深層学習の実践において、目覚ましい幾何学的格差は長く続いている。
勾配更新規則は、対応する重みブロックに作用するパラメータ群の下で同値であるべきである。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:11:39 GMT)
Closing the Loop in Teleoperation: Episode-Level Data Quality Assessment and Feedback for High-Quality Demonstration Collection [3.4] 本稿では,ロボットテレメトリとセマンティック・タスク・プログレスを基盤として,遠隔操作のループを閉じるフレームワークを提案する。
バイナリ成功や障害フィードバックとは異なり、提案システムでは、エピソードが最適以下である理由を説明し、次のトライアルで修正すべき特定の振る舞いを強調している。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:52:08 GMT)
FLOATBench: A Dataset and Benchmark for Floating Offshore Wind Turbine Tower Fatigue [3.3] FLOATBenchは, フローティングオフショア風力タービン(FOWT)3基にわたる疲労損傷ラベルの一般ベンチマークである。
FLOATBenchは、ジョイント・ウィンド/ウェーブ・オペレーティング・エンベロープのシステマ対応アルファ形状のパーティションを含み、試験点をイントレイン、外挿レジームに成層する。
ルール対応プロトコルは、ランダムなリーダーボードが検出できないグローバルパフォーマンスとグローバルパフォーマンスのランクシフトを明らかにする。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:18:24 GMT)
Minimax Limits of k-Fold Cross-Validation via Majority [3.3] リスク推定器としての$k$-foldクロスバリデーションの平均二乗誤差について検討し、その精度が$k$の折りたたみ数に依存するかに着目した。
本研究は,データ再利用戦略としてのクロスバリデーションの基本的限界を明らかにし,従来の理論的研究におけるギャップと不正確さを明らかにし,クロスバリデーションの厳密な分析が説明できるような自然なベンチマークとして,アルゴリズムを位置づけた。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:50:05 GMT)
Conformalised imprecise inference for robust extrapolation under limited data [3.3] 本稿では,頑健な外挿のための共形推論フレームワークを提案する。
提案手法は, 分布シフトの下で有効でありながら, 適用範囲を維持しつつ, 外挿の不確かさを適応的に拡大する不正確な予測(確率ボックス)を導出する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:11:42 GMT)
ARBITER: Reasoning Trajectory Basins and Majority Vote Failures in Test-Time Sampling [3.3] ARBITERは、ベースモデル独自のサンプル出力、隠蔽状態、導出エビデンスのみを使用して、盆地間の相互作用をモデル化するモデルに依存しないアプローチである。
精度は78%中盤から82%中盤まで向上し、利用可能なオラクルのヘッドルームの約22%を回復する。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:07:44 GMT)
Is Agent Memory a Database? Rethinking Data Foundations for Long-Term AI Agent Memory [3.3] 長時間稼働するAIエージェントは永続的なメモリを必要とする。
現在のエージェントメモリシステムとデータベースパラダイムはメモリを記憶として扱う。
私たちのビジョンでは、長期エージェントメモリは新しいデータ管理ワークロードです。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:22:42 GMT)
The Daily Dose: Workflow-Integrated Large Language Model Automation for Clinical Summarization and Trial Identification in Radiation Oncology [3.3] デイリー・ドーズ (Daily Dose) は、定期的な放射線腫瘍学の実践に統合された、自動的な臨床要約と臨床・臨床的同定システムである。
システム展開1ヶ月後に実施したクロスセクション匿名臨床検査による混合メソドの評価
全体の満足度は時間節約の認知と正の相関を示した。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:43:19 GMT)
CMAP: Cross-Modal Adaptive Prompting for Multi-Domain Task-Incremental Learning [3.1] テキスト空間のタスクルーティングは、凍結されたCLIPテキストプロトタイプとコサイン類似のビジュアルガウスマッチングを置き換える。
視覚テキストの信頼度は、単一ガウスのクラスモデリングをK平均視覚プロトタイプとタスク校正しきい値の下でのクロスモーダルアライメントスコアに置き換える。
MTILベンチマークは118.7%と1201のクラスで74.2%のTransfer、80.5%のAverage、そして8のLast Under Order-Iを達成した。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:09:48 GMT)
The Montparnasse Algorithm for RNA Design [3.0] 一般化Nested Rollout Policy Adaptationに基づくモンテカルロ探索フレームワークであるMontparnasseを提案する。
ヘモグロビンαのメッセンジャーRNA二次構造最適化では、LinearDesignのMFE最適解よりも、よりペア化された塩基を持つ配列を同定する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:06:26 GMT)
OPAL: Omnidirectional Path-efficient Aerial 3D expLoration [3.0] 本研究では,不明瞭な分岐点における意図的な360度ヨー回転に着目した探査フレームワークを提案する。
我々は、フロンティア選択戦略を決定するために、OPALの複数の変種を考案する。
本研究では,フロンティア選択探索半径の調整により,旅行距離と全探査時間とのトレードオフが可能であることを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:51:56 GMT)
Stein-Encoder: A White-Box Supervised Encoder via Stein Identities in Multi-Modal Studies [3.0] 臨床効果を誘導する遺伝子シグナルを分離するためのホワイトボックス制御フレームワークであるStein-Encoderを提案する。
METABRICコホートに適用されたStein-Encoderは、教師なしベンチマークよりも予測精度が高い。
腫瘍の大きさは主に有糸分裂ネットワークによって引き起こされているのに対し、予後指標は異なる増殖・対向免疫軸に依存している。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:43:09 GMT)
Branched Signature Kernel Solvers for ODEs with rough Single-Trajectory signals [2.9] 単軌道で駆動される常微分方程式に対する分岐シグネチャカーネルソルバを開発する。
Emphcount-sampling構造は、単一の観察をN+1$ネストされたトレーニングパスの階層的なファミリーに変換する。
カーネル・コロケーション・フレームワークは、アンザッツを解の最高階微分または解自体に配置する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:22:07 GMT)
Priors Persist Through Suppression: A Stroop Paradigm for Lexical Override [2.9] 用語、技術的仕様、システムは、不慣れな方法で慣れ親しんだ単語を使用するように言語モデルに日常的に要求する。
これが機能すると、語彙の先行は置き換えられるのではなく、オーバーライドを通じて持続する。
我々はこれをStroopスタイルのパラダイムでテストする: クエリワードの辞書("hospital")にマッチした中立制御を持つリマッピングルール。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:53:31 GMT)
Function-Vector Heads Are Two Populations: Writers and Cancellers in In-Context Learning [2.9] 関数ベクトルヘッドは典型的には、コンテキスト内ルールタスクに対する因果的貢献の大きさによって識別される。
我々は、マグニチュードのみのランキングを符号保存基準に置き換え、パスパッチによる各候補の検証を行う。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:58:57 GMT)
Rethinking Expressibility-Trainability Trade-off in Hybrid Quantum Neural Networks [2.7] ハイブリッド量子ニューラルネットワーク(HQNN)は、古典的ネットワークにパラメータ化量子回路(PQC)を統合する。
我々は,HQNNにおける様々な回路深度,キュービット数,絡み合いトポロジーの表現可能性-訓練性関係を系統的に解析した。
以上の結果から、純粋なPQCは弱く体制に依存したトレードオフしか示さないのに対し、ハイブリッドアーキテクチャはますます混乱し、この関係を解消できることがわかった。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:19:26 GMT)
Q-RAIL: A Reliability-Aware Framework for Quantum Federated Learning on Heterogeneous Noisy Hardware [2.7] Q-RAIL(Quantum Reliability-Aware Federated Inference and Learning)は、ハードウェア・ヘテロジニアスQFLのための回路・キャリブレーション・アウェア・アウェア・アグリゲーション手法である。
Q-RAILはアブレーション研究を含む複数の実験条件で評価され、3つのデータセットの最先端手法に対してベンチマークされた。
その結果、不均一量子ハードウェア上でのロバストQFLへの実用的な経路として、キャリブレーション駆動の回路認識アグリゲーションがサポートされた。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:29:52 GMT)
Beyond Logical Circuits: Hardware-Aware Analysis of Expressibility and Trainability in Variational Quantum Algorithms [2.7] ハードウェア対応トランスパイルは、量子ビットマッピング、ルーティング、基底分解によって回路構造を変化させることを示す。
以上の結果から,トランスパイルは暗黙のアーキテクチャ摂動として作用し,強いアンザッツ依存効果が生じることが示された。
さらに、トランスパイレーションは、一般的に想定される表現可能性-学習性トレードオフを変更できることを示し、論理レベル解析がハードウェアレベルの挙動を確実に予測できないことを示した。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:09:35 GMT)
SeqRoute: Global Budget-Aware Sequential LLM Routing via Offline Reinforcement Learning [2.7] SeqRouteは、有限水平マルコフ決定プロセスとしてマルチターンルーティングを定式化するフレームワークである。
セッションの後半で、ハイテイクターンのリソースを戦略的に保存するために、遅れた満足度を学習する。
品質を維持したり改善したりしながら運用コストを6.0-73.5%削減し、倒産率を1%以下に抑える。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:52:10 GMT)
WhoSaidIt: Human-LLM Collaborative Annotation for Text-Based Multilingual Speaker-Attribute Classification [2.6] 本稿では,多言語話者属性ラベルの安定化のための,人間大言語モデル(LLM)協調アノテーションフレームワークを提案する。
このフレームワークを用いて,9つの話者属性ラベルを含む多言語データセットであるWhoSaidItを構築した。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:37:45 GMT)
The Behavioral Credibility Trilemma: When Calibrated Autonomy Becomes Impossible [2.6] 信頼性の高い自律性を備えた強化学習政策が,合理的な監視の下で,最大限の利便性,最適校正,完全自律性を同時に達成できることを実証する。
不合理性は幾何学的であり、厳密な適切なスコアリングルールに非アフィンの自律性インセンティブを追加することは、厳密な適正性を損なう。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:51:08 GMT)
Trustworthy Software Project Generation : a Case Study with an Interactive Theorem Prover [2.6] 本稿では,対話型定理証明器(ITP)が大規模ソフトウェア生成を支援するかどうかを考察する。
ITPは純粋全関数を扱うが、I/Oのような効果はないため、エージェントは実効的なコードを純粋論理から分離する。
本稿では, RISC-V RV32I ベースの47命令すべてに対して, CPU インタプリタの完全自動開発を通じて, この経路について検討する。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:35:36 GMT)
Opportunistic Target Selection: Early Directional Commitment for Query-Efficient Black-Box Adversarial Attacks [2.6] ゼロ・トゥルース・信頼のみを最小限に抑えるブラックボックスの敵攻撃は、クラスドリフトに苦しむ。
我々は、標的外攻撃を目標目標に切り替える軽量ラッパーであるOpportunistic Target Selection (OTS)を導入する。
OTSは、基盤となるアタックのアーキテクチャ変更、グラデーションアクセス、事前のターゲットクラス知識を必要としない。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:14:06 GMT)
Recursive Class Connectivity Classification (R3C) Applied to Binary Image Segmentation for Improved Infant Fingerprint Enhancement [2.6] 画像強調は乳幼児の指紋照合において重要な役割を担っている。
本研究では,リッジ構造を拡張して既存の拡張手法からの2値分割出力を反復的に洗練する新しいフレームワークであるRecursive Class Connectivity Classification (R3C)を紹介する。
3つの指紋データセットを用いて行った実験によると、R3Cは幼児のTrue Acceptance Rate(TAR)を4%、新生児の40%以上増加させることができる。
論文参考訳(メタデータ) (Mon, 25 May 2026 00:09:47 GMT)
Second Guess: Detecting Uncertainty Through Abstention and Answer Stability in Small Language Models [2.6] 大規模な言語モデルは、不確実な場合には控えるよりも、自信があるが誤った答えを生成することが多い。
マルチチョイス質問応答(MCQA)における抑止のための軽量かつパラメータフリーなプロンプト手法である_Second Guess_を提案する。
第2ギースは10.81%の複合リスク改善を達成している。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:38:54 GMT)
QGCL: Quantum-Guided Clause Learning for Cryptanalytic SAT [2.5] AESに対するパワーサイドチャネル攻撃は、秘密鍵を復元するためにデータ依存の物理的漏洩を利用する。
S.A.T.が支援するパワーサイドチャネル暗号解析は、AESセマンティクス、鍵制約、平文/テキストの一貫性、リーク述語をCNFとして符号化することでこの問題に対処する。
本稿では,CDCL競合コアの周辺で動的に抽出される小さなサブフォーミュラ上でのみGrover検索を実行する量子ガイド型競合学習フレームワークQGCLを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:09:01 GMT)
Q-LEAK: Quantum-Based LEAKage Verification for Side-Channel Countermeasures [2.5] 本稿では,Groverのアルゴリズムを用いた量子ベースの検証手法であるQ-LEAKを提案する。
Q-LEAKは1-4回の試行で満足な割り当てを継続的に回復し、背景分布よりも明らかにビットストリングが増幅された。
実量子ハードウェア上でのQ-LEAKの評価により、ノイズの有無に関わらず、少なくとも1つの古典的に検証されたSAT割り当てが明らかになった。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:36:19 GMT)
A Factory-Floor Deployment Case Study of VLA Pipelines for Industrial Packaging Task: Workflow, Failures, and Lessons [2.4] VLA(Vision-Language-Action)ポリシは、期待できる操作能力を示しているが、現実のデプロイメントの信頼性要求によって、その実践的影響は制限されることが多い。
本稿では,Siemens Factory (GWE, Erlangen, Germany) における産業用包装作業の展開について述べる。そこでは,ロボットが透明なアクセサリバッグをバラバラの山から取り出し,それを段ボールパッケージの残りの空洞に挿入し,その袋とその内容が閉面下にあることを保証する。
我々のゴールは、反復的な微調整により、事前訓練済みのPi0.5ポリシーを1つの工場フロアタスクに適応させるために必要な実践的努力を理解することである。
論文参考訳(メタデータ) (Mon, 25 May 2026 20:46:22 GMT)
Confidence and Calibration of Activation Oracles for Reliable Interpretation of Language Model Internals [2.4] 活性化オラクルの信頼性を推定するための6つの異なる手法について検討した。
ブートストラップモード周波数は、テスト対象者の中で最良の校正法である。
ログプロブベースラインは、低コストで高速トリアージ信号として機能することができる。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:08:47 GMT)
PathWISE: Multi-Agent Cancer Pathway Triaging Ontology Learning from Clinical Flowcharts [2.4] PathWISEは、計算不能なアーティファクトを、FHIR CDS Hooksサービスとしてデプロイ可能な、検証可能なHL7臨床品質言語(CQL)ライブラリに変換する。
英国における5つのNHS癌経路(大腸癌、肺がん、皮膚がん、上部GIがん、乳がん)におけるPathWISEの意義について検討した。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:47:07 GMT)
From DPPs to $k$-DPPs: identifiability analysis via spectral decomposition [2.2] 決定点過程(DPP)の幾何学をスペクトル分解$L=UUtop$で検討する。
我々は3つの明示的不変性(スケール、符号類似性、固有空間)と次元計数定理を通じて、識別可能性ギャップを正確に特徴づける。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:31:12 GMT)
The Neglected Baseline in Model Interpretation [2.2] 本稿では,モデル解釈の課題と解釈原理を整理し,ベースラインの重要性を実証する。
我々はさらに勾配に基づく手法、統合勾配法(IG)法、テイラー拡張を統一し、それらの関係を明らかにする。
そこで本研究では,モデル解釈手法の欠陥と誤りを解析する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:56:01 GMT)
Guided Flow Matching for Forward and Inverse PDE Problems with Sparse Observations: Algorithm and Theory [2.1] PDE係数の結合分布を学習するフローマッチング生成フレームワークFM4PDEを提案する。
静的および時間依存型ベンチマークPDEの実験では、拡散に基づく生成モデルよりも競合精度と高速な推論が示されている。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:14:11 GMT)
SafeCtrl-RL: Inference-Time Adaptive Behaviour Control for LLM Dialogue via RL-Driven Prompt Optimisation [2.1] 推論時動作制御フレームワークである textbfSafeCtrl-RL を提案する。
モデルの再訓練やパラメータの変更なしに適応的な安全規制を可能にする。
安全と応答品質を継続的に改善し、既存のプロンプトベースの最適化方法より優れています。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:03:38 GMT)
PhyPush: One Push is All You Need for Sensorless Physical Property Estimation with Physics-Guided Transformers [2.0] 本稿では,物理誘導型トランスフォーマーフレームワークであるPhyPushについて述べる。
シミュレーションでは、全力情報へのアクセスを特権とするベースラインと比較して、エラーを10%以上削減する。
その結果、物理誘導学習は、低コストでセンサ効率の良い物理特性推定を可能にすることを示した。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:14:43 GMT)
Closed-Form Node Classification with Exact Graph Unlearning [2.0] 我々は、調整されたホモフィリーによって選択された経路付き閉形式フレームワークを提案する。
分類グラフに対しては、SGCスタイルの伝搬とリッジ回帰を用いる。
ヘテロ親和性グラフに対しては,レイヤワイド閉形式グラフ特徴分級ネットワークであるLCF-Netを導入する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:12:43 GMT)
Reading the Finetuning Prior: Verbatim Content Recovery via Contrastive Decoding Diffing [2.0] Contrastive Decoding Diffing (CDD) は、出力レベルのロジット分布のみを演算し、ウェイトアクセスがなく、層選択がなく、モデルごとのチューニングもできないモデル拡散法である。
単一のデフォルト設定は、4つのアーキテクチャにまたがって組み込まれた事実を冗長に復元する。
我々は、実際のドメインの微調整設定を検証し、単一データセット以外のすべてのCoT変種に対してほぼ完全な回復を実現し、混合データセット設定で4つのデータセット全てを正しく識別する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:29:36 GMT)
LRDDv3: High-Resolution Long-Range Drone Detection Dataset with Range Information and Thermal Data [1.9] 飛行中に撮影された128本の異なるビデオクリップから5FPSでサンプリングした102,532枚の長距離RGB画像の高解像度データセットを紹介した。
データセットには、データセット全体にわたる包括的なドローン範囲情報に加えて、29,630のIRイメージが含まれており、いずれもベースデータセットのRGBイメージとペアリングされている。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:20:36 GMT)
From Simulation to Enaction: Post-trained language models recognize and react to their own generations [1.9] 言語モデルは、自身のアウトプットの結果をモデル化するインセンティブのない受動的予測子として事前訓練される。
学習後モデルが政治上の世代を認識する証拠を提示し、この認識を暗黙的に出力分布に符号化する。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:09:04 GMT)
Event-to-Video Reconstruction using Spatio-Temporal and Frequency-Enhanced Deep Neural Networks [1.9] Event-to-video (E2V) は、イベントストリームを非同期シーケンスフレームに変換することで、このギャップを埋めようとしている。
MSFET-E2Vは、複数の実世界のイベントデータセットにおける最先端メソッドよりも優れたパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:53:07 GMT)
Mean-Shift PCA by Knockoff Mean [1.9] 平均シフトノイズ成分をPCAから除去する方法を示す。
標準PCAは試料平均のシフトに非常に敏感である。
平均シフト成分を識別・除去する平均を追加することで,2段階PCAアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:10:22 GMT)
Visual Matters: Connecting Aesthetic Appeal and Production Quality of Photos, Infographics and Data Visualizations to Credibility of Social Media Posts [1.8] 本研究は,視覚が信頼性判断をどう形作るかを検討する。
我々は、写真、インフォグラフィック、データビジュアライゼーションの3つの人気フォーマットに焦点を当て、テキストのみの投稿に比較する。
論文参考訳(メタデータ) (Mon, 25 May 2026 20:03:59 GMT)
Merge-Bench: Resolve Merge Conflicts with Large Language Models [1.8] 本稿では,バージョン管理統合の困難かつ重要な課題に対して,機械学習を適用した。
私たちは1439のGitHubリポジトリから7938の現実世界のマージコンフリクトハンクのデータセットMerge-Benchを構築しました。
Javaプログラムのマージ競合を解決するために、モデルであるLLMergeJをトレーニングしました。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:17:48 GMT)
ARMA-C3: A Contrastive ARMA Convolutional Framework for Unsupervised and Semi-supervised Classification [1.8] 本稿では,ノード分類のための教師なしおよび半教師付きグラフ学習フレームワークARMA-C3を紹介する。
サンプルやイメージをグラフノードとしてモデル化することで、提案フレームワークは対象レベルの依存関係をキャプチャする。
我々は5つの臨床関連データセットにまたがる広範囲なバイナリ分類実験を行った。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:04:29 GMT)
RAPTOR+: A Visually Grounded Vision-Language Framework to Improve Clinical Trust and Auditability in Automated Cancer Referral Processing [1.4] 本稿では,視覚言語モデル(VLM)を終端参照理解に用いるマルチモーダル拡張であるRAPTOR+を提案する。
223例のクリニカルレファレンシャルレファレンシャルレファレンスフォーム上で,精細調整VLM,商用およびオープンソースゼロショットVLM,オリジナルOCRベースのパイプラインの評価を行った。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:30:02 GMT)
Where Does Authorship Signal Emerge in Encoder-Based Language Models? [1.4] オーサシップ属性モデルは、スコアリング機構によってパフォーマンスが4倍になる可能性がある。
このギャップを説明するために、機械的解釈可能性ツールを使用します。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:03:03 GMT)
Cross-Lingual Consensus: Aligning Multilingual Cultural Knowledge via Multilingual Self-Consistency [1.3] 大規模言語モデル(LLM)は、言語間での大幅なパフォーマンスの相違を示す。
本稿では,この知識ギャップを埋める新たな自己教師型フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:02:57 GMT)
Keep the Proof State Live: Snapshotting for Efficient Tactic Search in Lean 4 [1.3] これは、一度精巧な証明状態をキャプチャし、Lean 4言語サーバーへの小さな拡張を通じてブランチ間で再利用します。
48のミニF2F-v2問題に対して,本手法は標準的なフォールバックよりも5.6~50倍の高速化を実現する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:12:26 GMT)
Generative AI impacts on intra-urban inequality and skill premium in Beijing [1.3] 我々は、GenAIの露出が市の中核地区に集中していることを発見した。
2023年以降、高露出の地区は賃金の停滞を経験した。
この賃金のペナルティは、タスクの非熟練化と労働市場の人口増加によって引き起こされる。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:09:48 GMT)
HRVConformer: Neonatal Hypoxic-Ischemic Encephalopathy Classification from the Heart Rate signals [1.3] 本稿では,低酸素性虚血性脳症(HIE)を即時心拍数(HR)信号を用いて分類するための新しいディープラーニングアーキテクチャを提案する。
手作り機能に依存する従来のアプローチとは異なり、HRVConformerは生のHR信号をエンドツーエンドで直接処理する。
実験の結果、HRVコンフォーマーは83.23%のAUCと74.56%の精度を達成した。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:22:11 GMT)
The Environmental Costs of Surveillance Capitalism: A Case Study of Social Media Platforms [1.2] 監視資本主義のビジネスモデルは広範な材料基盤に依存している。
この論文の動機は、ICTの炭素濃度の上昇は、この物質インフラにどの程度の影響があるのかという問いである。
本稿では,監視プロセスと基盤となる物質的現実を結びつける概念的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 20:12:44 GMT)
Which Anatomy Matters Under Limited Labels? A Data-Efficient Anatomy-Aware Benchmark for Cardiac Pathology Prediction [1.2] ACDCのMRIデータセットを用いて,低データ解剖学的指標を用いて5クラス心疾患の予測を行った。
ラベル設定が限定されている場合、表現が複雑さを支配します。
これらの結果は、資源制約のある医療環境において、最も情報に富む解剖を識別し、表現することが、モデルの複雑さの増大よりも重要であることを示唆している。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:03:53 GMT)
Human Vulnerability Assessment in Cybersecurity: A Systematic Literature Review of Methods, Models, and Instruments [1.2] この研究は、サイバーセキュリティにおけるヒューマン脆弱性評価(Human Vulnerability Assessment, HVA)の体系的な文献レビューを提供する。
それは、人間の脆弱性の全スペクトルに動的に対処する評価方法、モデル、または機器が存在するかどうかを調査することを目的としている。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:29:18 GMT)
Quantized Keys Steal Attention: Bias Correction for KV-Cache Compression in Video Diffusion [1.2] KVキャッシュを低ビット幅に定量化する手法は、メモリ圧力を低減させるが、画質を低下させる。
この劣化の鍵となる要因は、注意重みの体系的なバイアスであることを示す。
我々は、この予測バイアスを除去するアテンションごとのスコア補正を導出する。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:51:59 GMT)
Fuzzy PyTorch: Rapid Numerical Variability Evaluation for Deep Learning Models [1.1] Fuzzy PyTorchは、ディープラーニング(DL)モデルにおける数値変数の迅速な評価のためのフレームワークである。
Probabilistic Rounding と Instruction Set Management を通じて PyTorch に算術を統合する。
図書館には丸めモードと新しいモードがあり、上向きの丸めがある。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:10:21 GMT)
Tool-Call Dependency Structure is Linearly Decodable in LLM Agent Residual Streams [1.1] LLMエージェントは、呼び出しが有向依存グラフを形成するトラジェクトリを生成する。
以前の構造プローブは、エージェントのランタイムコールグラフではなく、静的コードやチェーン・オブ・シンクテキストをターゲットにしていた。
Qwen3-32Bの残ストリーム上の低容量エッジプローブは、ツールコール依存性グラフをデコードする。
論文参考訳(メタデータ) (Mon, 25 May 2026 00:16:32 GMT)
Peak-Then-Collapse and the Four Interface Channels of Knowledge-Graph Tool Use [1.1] 我々は、Qwen2.5-7B-Instructの標準RLVRツール使用レシピであるGRPOを、意図的に最小限の知識グラフツールAPIでテストする。
自己検証可能な検索報酬の下で、ポリシーのツールによる回答率は、250ステップで3.8%から9.6%に上昇し、50ステップのウィンドウで0%に崩壊する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:05:35 GMT)
Asymptotically Optimal Depth Fermionic Permutation on 2D Grid Quantum Architecture without Ancillas [1.1] 量子ビットハードウェア上のフェルミオン系のシミュレーションは多くの非局所相互作用を含む。
近年の作業では、全接続時のJordan-Wignerルーティングオーバーヘッドを多対数深さに削減している。
本稿では,2次元グリッドアーキテクチャに適したフェルミオン置換プロトコルを提案し,最適な$O(sqrtN)$deepを実現する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:07:47 GMT)
Selecting New Measurement Locations to Diversify Traffic-Pattern Coverage: A Real-World Evaluation for Total Traffic Volume Estimation [1.1] 都市全体の交通量推定性能を改善するために,新しい計測場所の選択方法を検討する。
目標は、現在のカウンタセットで珍しいトラフィックパターンのタイプをキャプチャすることだ。
対象都市では,交通予測の改善を期待する新たな場所を選定し,その費用で新たなフィールド計測を依頼した。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:14:39 GMT)
MULTISEISMO: A Multimodal Seismic Dataset and Model for Cross-Modal Seismic Understanding [1.0] 地震学では、地震現象を理解するためには、時系列波形データ、地理画像、文脈メタデータの合成が必要である。
我々は,2010年から2023年までの13年間にわたる16K以上の地震事象にまたがる大規模構造的マルチモーダルデータセットであるMultiSeismoを提案する。
各イベントデータは、グローバルステーションネットワーク、強度マップ、人口暴露の可視化、および包括的なテキストフォーマットからの波形記録を統合する。
我々は,既存のマルチモーダルモデル (Unified IO 2) を特殊時間エンコーダで拡張したファインチューンを利用して,包括的地震解析のための最初のドメイン固有マルチモーダルモデルであるSeesModalを生成する。
論文参考訳(メタデータ) (Mon, 25 May 2026 20:35:48 GMT)
Module Lattice Security (Part IV): Probabilistic Polynomial Quantum Attack on Module-LWE over 2-Power Cyclotomics [1.0] ML-KEMと関連する2パワーサイクロトミック格子スキームに対する量子攻撃を提案する。
ML-KEM-1024の近似係数は, ML-KEM-1024に対して$le 21 q/2=1664.5$を満たす。
解析を量子アルゴリズムを用いて2パワーのサイクロトミック環上でファルコン、ホーク、NTRUに拡張する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:54:23 GMT)
Decision-Path Patterns as Tree Reliability Signals: Path-based Adaptive Weighting for Random Forest Classification [1.0] ランダムな森林は、各木の根から葉までの経路を通じて予測に達する。
本研究では,森林そのものが特定した境界領域の経路パターンによって信頼性が有意に変化することを示す。
本研究は、以前森林調査で見落とされた決定経路の構造情報が、RF性能向上に寄与することを示唆している。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:35:14 GMT)
What Gets Cited: Competitive GEO in AI Answer Engines [0.9] 検索された2人の候補者が競うと、最初に引用される可能性が高くなるのはなぜか。
モデルコンテキストに正確に2つの候補ソースを注入する2文書検索拡張生成テストベッドを構築した。
各試験において、2つの情報源は、正確に1つの要因で異なる。我々は、位置バイアスからコンテンツ効果を分離するためにブランド匿名化と逆平衡ソースオーダーを使用する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:20:08 GMT)
Posture Clip: Sit properly or I wont let you work [0.9] PostureClipと呼ばれるコラー付きデバイスは、ユーザーが曲がり角に座ったり働くのを防ぐように設計されている。
このデバイスはセンサーとフィードバック機構を統合し、リアルタイムで姿勢フィードバックを提供する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:14:37 GMT)
CITYREP: A Unified Benchmark for Urban Representations Across Cities, Tasks, and Modalities [0.8] CityRepは、空間的に構造化された分割を使用して、データモダリティ、都市、タスク間の都市表現を評価するベンチマークである。
その結果,確率的にスコアが膨らんだり,モデルランキングが変更されたりして,性能は分割プロトコルに非常に敏感であることがわかった。
CityRepは、公正な比較を容易にするために、データセット、評価パイプライン、診断ツールを備えた再現可能なベンチマークとしてリリースされた。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:03:46 GMT)
FuzzPilot: Plateau-Triggered Recipe Validation for Structured Text Fuzzing [0.8] FuzzPilotはAFL++用のコントローラで、突然変異ホットパスから高価な推論を移動させる。
カバープラトーは、コーパスをスナップショット化し、突然変異のレシピを作成し、評価し、肯定的なバリデーションの報酬を持つレシピのみを促進する。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:24:56 GMT)
Analysis of Critical Points in a Permutation Model on Hierarchical Lattices by Real-Space Renormalization Group [0.7] 置換モデルの強磁性-常磁性相転移について検討する。
結果は、対称群のフーリエ変換に基づく双対性予測と比較する。
この比較は双対性に基づく推定をサポートし、外挿公式に関連する体系的な不確実性も明らかにする。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:39:41 GMT)
Frequency-Guided Fusion For RGB-Thermal Semantic Segmentation [0.6] 本稿では,2つのConvNeXt V2バックボーン上に構築されたマルチモーダル核融合アーキテクチャを提案する。
MFNetとPST900の実験では、我々の最も軽い変種はそれぞれ61.73%、86.24% mIoUであり、35.43Mのパラメータしか得られていない。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:57:22 GMT)
Observation of associative-memory retrieval and spin-glass phases on a photonic quantum simulator [0.6] フォトニック量子技術は、その固有の速度と複雑なネットワークをシミュレートする並列処理能力を活用している。
ここでは,光モードの集合に分散した単一光子を利用する実験プラットフォームの設計と実演を行う。
2光子過程によって実現された4体局所相互作用項を持つ完全連結ホップフィールドハミルトニアンに特に焦点をあてる。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:02:16 GMT)
Temporal Modeling of Change History for Black-Box Test Suite Minimization [0.6] テストスイート最小化(TSM)は、テストスイートのサイズを削減し、障害検出機能を保持する。
最近の変更履歴は、ブラックボックスTSMを導くための軽量でスケーラブルな指標として研究されている。
ブラックボックスTSMに時間的モデリングを導入し、時間的リスク駆動テストスイート最小化(TRTM)を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:37:55 GMT)
A Heuristic Approach to Localize CSS Properties for Responsive Layout Failures [0.6] 開発者が通常手動でローカライズする特定のCSSプロパティを特定するアプローチを提案する。
このツールは45.2%(Top-1)から92.86%(Top-7)まで、MSRは76%、P@3は77.13%であった。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:30:25 GMT)
Discoverable Agent Knowledge -- A Formal Framework for Agentic KG Affordances (Extended Version) [0.5] 20年前、セマンティックWebサービスコミュニティは、異なる存在論的コミットメントを持つエージェントがWebサービスを一貫性を持って発見し、構成し、呼び出す方法について質問された。
我々は、4次元の形式的枠組みを用いて、これらの洞察をKG設定のために再検討し、拡張する。
エージェント計画時のKG選択, 組成, 故障診断を基本としたAAP(Agenic Affordance Profile)を導出する。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:01:05 GMT)
Single-Ensemble Multiparameter Squeezing with Qudits [0.5] 1つのアンサンブルは、各センサがキュービットからキューディットに昇格したときに、同時マルチパラメータスキューズをサポートすることができることを示す。
拡張性のあるメロジカルゲインを数値的に示し、ハミルトニアンと相互作用する集合的なツイストのような相互作用を同定する。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:53:35 GMT)
Implicit Null-space Manifold Generation for Redundant Robotic Systems [0.5] 本稿では,解空間の幾何学的構造を推定する表現中心の手法を提案する。
平面型3リンクロボットと7自由度フランカマニピュレータを用いた実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:21:22 GMT)
From Latent Space to Training Data: Explainable Specialization in Minimal MLPs [0.5] トレーニングバイアスが隠れたニューロンを最小の1つの隠れた層に特化させるかどうかを検討する。
均一にサンプリングされた1次元データセットの実験では、N = 3 から N = 100 までの安定なパターンが480個の制御されたランで示されている。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:18:22 GMT)
DeCoDrift: Stabilizing Decoder Coupling in Closed-Loop Foundation Segmentation [0.4] フィードバックループは、マスクデコーダのクロスアテンションがターゲットオブジェクトとのアライメントを徐々に失い、繰り返しにわたってエラーが蓄積されるような、以前見過ごされた障害モード、デコーダ結合ドリフトを誘導できることを示す。
DeCoDriftは、トレーニング不要な推論時間安定化フレームワークで、更新の速やかな制限とイテレーション間のデコーダ結合の保存を行う。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:41:21 GMT)
Retrying vs Resampling in AI Control [0.4] AI制御の観点からの再試行は、モデルを潜在的に敵対的なものとして扱う。
再試行は正直な疑念のスコアを減少させるが、信頼できないモデルは監視の合理性を利用してスニーカー攻撃を構築することができる。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:10:41 GMT)
Ecosystem-Driven Privacy Exposure in Mobile Gaming Apps: A Configuration-Aware Empirical Analysis [0.4] 本研究は,Android モバイルゲームアプリにおけるプライバシ暴露に関する経験的評価を意識した構成を提示する。
Google Playエコシステムから収集された41の広くデプロイされたAndroidモバイルゲームアプリに対して,システマティックな静的解析が行われた。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:14:04 GMT)
Trade-off Relation for Black Hole Entropy Fluctuations [0.4] ブラックホールは、そのエントロピーを変化させることで、落下する量子物質場に反応する。
半古典重力下では、地平線は任意に小さなエントロピー変動を伴う関連する量子情報を記録できないことを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:00:01 GMT)
When Gradients Collide: Failure Modes of Multi-Objective Prompt Optimization for LLM Judges [0.4] テキスト勾配法は多目的テキスト勾配設定には適用されないことを示す。
勾配特異性は、勾配が複数の基準を共同で処理するときに59%(9.0から3.7まで)低下する。
最適化時勾配解法と推論時命令干渉の2つの分離可能な障害モードを同定する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:08:55 GMT)
Practical Tests and Witnesses of Fermionic non-Gaussianity [0.3] 我々はフェルミオン性反平坦性(FAF)に基づく試験と目撃者を開発する。
2-copy Bell測定と1-copyスキームという2つの相補的プロトコルを用いて,$n$-qubit状態に対してFAFを推定する。
混合状態に対しては、非ガウス性を証明する純度補正されたFAF証人を導入し、ノイズに対して非常に堅牢である。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:00:03 GMT)
SafetyRepro: Configuration-Conditional Rank Instability on Alignment Benchmarks [0.3] 有限エンベロープ命題は、厳密な順序付けが構成対逆転を許容するか否かを計測可能なペアワイズ判定率に結びつける。
テストするすべてのベンチマークにおいて、設定の選択だけでペアワイズな判断を覆すことができます。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:54:44 GMT)
Pre-Registering the Detectable Effect: A Paired-MDE Budget for 4-bit Quantization Benchmarks, with a Pilot Audit [0.3] 古典的なペア化されたサンプルサイズ計算を量子化ベンチマークに適用する。
境界は「私の量子化の主張はどの程度信頼できるのか?」を1行の予算に転換する。
5行の事前登録テンプレートで境界を補完する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:13:35 GMT)
SAM3-Assisted Training of Lightweight YOLO Models for Precision Pig Farming [0.3] 本研究は、効率の良いYOLOv8検出器を訓練するためのゼロショット擬似ラベルを生成するための完全自動知識蒸留パイプラインを提案する。
SAM 3をオフライン自動アノテーションとして扱うことにより,手作業によるラベル付けのボトルネックを解消し,リソース制約のあるハードウェア上でリアルタイムな推論が可能なモデルを生成する。
その結果、SAM 3 トレーニングされた YOLOv8m が平均平均平均精度 79.4% を人間の介入なしに達成し、推論遅延を教師モデルと比較して約200$times$に削減した。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:50:24 GMT)
UWM-JEPA: Predictive World Models That Imagine in Belief Space [0.3] 本稿では,JEPAの世界モデルであるUnitary World Model JEPAを紹介した。
この構造はロールアウト中に関節状態スペクトルを正確に保存するため、予測器自体が表現された不確かさを解消することはできない。
JEPAの世界モデルでは、部分的な可観測性、潜伏幾何学、予測力学が重要であり、フリーズされたコンテキストエンコーディング能力だけではありません。
論文参考訳(メタデータ) (Mon, 25 May 2026 00:28:51 GMT)
AgentSecBench: Measuring Prompt Injection, Privacy Leakage, and Tool-Use Integrity in LLM Agents [0.3] 本稿では,AgentSecBenchを,この問題に対する正式なセキュリティフレームワークの実証的なインスタンス化として紹介する。
3つのゲーム・インストラクション・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス(英語版)・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス(英語版)・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス・インテリジェンス(英語版)を定めている。
これは、承認された観察と能力に対するプロジェクションとしてのアプリケーションポリシーを表し、プロジェクションの即時アノテーションとプロジェクションの強化を区別し、敵のアドバンテージと、防衛が生成前に関連するモデル可視チャネルを閉鎖するかどうかを計測する。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:53:22 GMT)
Mapping twist fields to local operators via tensor networks [0.3] 我々は、行列積状態におけるツイスト場の作用を期待値が再現する物理ヒルベルト空間に作用する明示的局所作用素を構築する。
この結果は、量子シミュレータにおける絡み合いを探索するスケーラブルで実験的に利用できるフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:00:01 GMT)
Invariant-Based Weight Sharing for Message Passing [0.3] メッセージパッシングニューラルネットワーク(MPNN)は、グラフ構造化ドメインの表現を学習するための強力なフレームワークである。
本稿では,グラフ構造に固有の情報を明示的に組み込んだ構造対応重み共有方式を提案する。
簡単なエンコーダデコーダアーキテクチャでこの原理をインスタンス化し,学習可能な隣接性とトランスフォーマーのような接続性を備えたMPNNを実現する。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:02:31 GMT)
Accelerating Bayesian inverse design in computational fluid dynamics using neural operators [0.2] 後部構造を保ちながらMCMC推論ループに直接神経オペレーターを埋め込むことができることを示す。
完全に観察された間、代理ベースの推論はCFD参照の後方幾何学と不確実性傾向を再現する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:18:18 GMT)
Considerations for an Integrated Detector Design at FCC-ee: A Human-AI Exploration [0.2] 本報告は、電子-陽電子モード(FCC-ee)におけるFuture Circular Colliderの検出器設計に関する考察である。
これは、AIアシスタントが明示的な物理学者の入力なしで提案した最初の「偏見」検出器の概念から始まる。
この議論はビームパイプから光度モニターまでの全検出器について、特にサブシステム選択間の相互作用に注目している。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:27:01 GMT)
Formal Verification of Probing Security via Conditional Independence [0.1] サイドチャネル攻撃は暗号システムのセキュリティにとって大きな脅威である。
マスキングはこのような攻撃に対して広く用いられている対策であるが、マスクされたアルゴリズムの安全性を証明することは、正式な検証なしにエラーを起こしやすい。
本稿では,確率的分離論理に基づくマスク付きアルゴリズムの非干渉特性の形式的検証手法を提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:31:47 GMT)
Preparing thermal states of frustrated quantum spin systems using 139 qubits [0.0] ディジタル量子コンピュータを用いたフラストレーションスピンシステムの散逸熱状態生成について検討する。
最大79ドルのスピンと60ドルの環境量子ビットを結合したカゴメ格子上にAFIMの近似熱状態を作成する。
2量子ゲートの1000層以上の回路で持続する、調整可能な有効温度で安定な定常状態の出現を観察する。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:12:10 GMT)
Entanglement Pattern Transition of Quantum States from Directed Percolation [0.0] 絡み合い構造や臨界現象の変化は、量子相転移の目印となる。
物質の安定平衡相のパラダイムを超えた、異なる絡み合いパターンを持つ状態のクラス間の遷移においてそれらがどのように現れるかを示す。
この結果から, 安定な基底状態を超えた空間構造を探索するために, アイソTNSと古典的進化の対応をいかに利用できるかが示唆された。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:00:04 GMT)
Experiments in Agentic AI for Science [0.0] 本稿では,自律型エージェントAIを科学研究で開発するための2つの新しい枠組みを詳述する。
最初のエージェントであるDeepTS/DeepCollectorは、時系列データセットの大規模、抽出、重複を自動化する。
2つめのDeepScribeは、視覚的に密度が高く、数学的に複雑な物理講義を構造化された科学的レポートに変換する、自律的なプレゼンテーションである。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:57:57 GMT)
When Interpretability Becomes a Liability: Adversarial Attacks on CBM Concept Layers [0.0] 概念ボトルネックモデル(Concept Bottleneck Models、CBM)は、解釈可能な機械学習の基盤となるアプローチとして登場した。
CBMにおける概念レベルの敵対的脆弱性を包括的かつ体系的に研究する。
我々は、安定原理の正規化防衛であるSPECTRAを紹介する。
論文参考訳(メタデータ) (Mon, 25 May 2026 00:03:47 GMT)
What is 'undone computer science'? [0.0] 「無科学」とは、無視されたり、無視されたり、未資金のままにされた研究問題を指す。
この課題は、コンピュータ科学の構造が、その発展と概念に不可欠な問題を特定し、倫理的問題を可能にするかどうかを考察する。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:48:12 GMT)
What Molecular Structure Cannot Tell Us: A Taxonomy of Explainability Gaps in GNN-Based Drug Toxicity Prediction [0.0] この研究は、その分子構造に実際にエンコード可能な、薬物の既知の薬理学的プロファイルのごく一部に対処する。
メッセージパッシングニューラルネットワーク(MPNN)はTox21ベンチマークでトレーニングされ、GNNExplainerは原子レベルの属性を特徴付ける。
結果は、分子構造が既知のASAの副作用の約45%(5/11)を説明できることを示している。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:51:15 GMT)
Wave-particle duality of unpolarized photons [0.0] 本稿では,各経路情報量を適切に定量化する識別可能性の尺度D$を紹介する。
完全混合(非偏光化)状態で生成した真の単一光子を用いて,$V$と$D$を実験的に評価した。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:49:06 GMT)
Utility-scale quantum experiments using dynamic circuits to address collective dissipation in interacting qubits [0.0] 我々は、相互作用量子ビットの散逸ダイナミクスを正確に再現するユーティリティスケール量子回路の実装と実行を行う。
我々は,IBM System Two textttibm_basquecountry上で最大86個のエミッタからなる鎖の力学の大規模量子実験を行う。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:28:37 GMT)
Uncovering multi-channel magnetic hopfion annihilation via a single-node, billion-spin-scale atomistic framework [0.0] SpinXは、統一されたハミルトンインターフェイスを中心に構築されたGPUネイティブな原子論的スピンシミュレーションフレームワークである。
その中核は、スピン相互作用において翻訳的に再構成される結晶下地分解である。
1つの加速器において、ピークスループットは毎秒100億回以上のスピンサイト動作を示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:33:53 GMT)
Uncertainty Relation for a Single Observable [0.0] 観測可能状態と量子状態の間の非可換性に由来する非自明な下界が既に存在することを示す。
我々は、単一可観測体の分散に対する鋭い下界を証明し、固定状態の下で可観測体の古典的不確実性を導入することにより、それらをより鋭くする。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:07:54 GMT)
Thermalization in Spatially Extended Open Quantum Systems: Local versus Global Markovian Evolution [0.0] 熱貯留層に局所的に結合したクビット鎖の力学について検討した。
結果として生じるリンドブラッド方程式は、適切な条件下で熱力学的に整合である。
この枠組みは、グローバルリンドブラッド方程式と、しばしば文献で使用される局所散逸モデルとの交叉を明らかにする。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:13:59 GMT)
The Timing Dependencies of Trust: Speed, Accuracy, and cBCI Neuro-Decoupling in Human-AI Teams [0.0] 本研究では,AIアシスタントであるFLA-AI(Fast/Less-Accurate)とSlow/Accurate(SA-AI)の特性が,VRドローンタスクにおける協調型脳-コンピュータインタフェース(cBCI)チームの相乗効果に与える影響について検討した。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:56:17 GMT)
The Privacy Subsidy in Continuous-Time Kyle: Cumulative Welfare under Noise-Perturbed Order-Flow Observation [0.0] 単一周期カイルモデルから連続時間へ、中村(2026, arXiv05.15746)のクローズドフォームのプライバシ・サブシディ結果を拡張した。
我々は、この累積プライバシー補助金とロス・ヴァーサス・リバランシングの2つの構造的双対性を確立する。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:31:40 GMT)
Thaka at KSAA-2026 Task 2: Regularized Fine-Tuning for Arabic Speech Diacritization [0.0] KSAA-2026 音声自動発音によるアラビア語発音における共有課題の第2タスクの入賞システムについて述べる。
本システムでは、事前訓練したCATTテキストエンコーダと凍結したWhisper音声エンコーダを組み合わせた文字レベルのマルチモーダルモデルであるCATT-Whisperを微調整する。
このシステムは、主要なリーダーボードの基準で23.26%のWERを達成し、全参加者の1位となった。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:07:48 GMT)
Testing Superpositions of Detector Trajectories [0.0] 本稿では,相対論的量子場と相互作用する位置の重ね合わせで調製した粒子検出器の応答をテストするための実測実験を提案する。
ビームスプリッターを用いて、変調レーザープローブの2つの重畳された枝を作成し、これらの枝はパンケーキ型のボース・アインシュタイン凝縮体を2つの別々の場所で交差するように向けられている。
出力の1つをヘテロダイニングすることにより、(2+1)次元のマスレススカラー場と相互作用する位置の重畳におけるUnruh-deWitt検出器に対応する応答関数が、差光電流パワースペクトルに現れることを示した。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:48:25 GMT)
TIP: A Decentralized Intent-Based Protocol for Declarative IoT Interoperability and Sandboxed Schema Adaptation [0.0] 本稿では,分散型宣言型ネットワークプロトコルであるTIP(The Intent Protocol)を提案する。
特定の物理的エンドポイントに対処する代わりに、ノードは望ましい機能、スキーマ、QoS(Quality of Service)制約を指定する抽象的なインテントを送信します。
選択は、ネットワークレイテンシ、過去の評価、契約遵守を組み込んだマルチ基準スコアリングアルゴリズムによって最適化される。
セキュリティは、Ed25519署名、X25519鍵交換、Cha20-PolyWAS 1305ペイロード暗号化によって強制される。
論文参考訳(メタデータ) (Mon, 25 May 2026 01:28:12 GMT)
Strategic Non-Shareability of Quantum Correlations [0.0] 有限個のアルファベットに対して、ゲーム最適化された反共役能力はシャドーへの全変分距離と等しいことを証明した。
我々は、量子媒介戦略ネットワークにおいて、絡み合いモノガミーを測定可能な共有性障害として再考する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:19:53 GMT)
Steady-state phases in long-range measurement-only quantum circuits [0.0] 本研究では、競合する2量子ビットと3量子ビットの量子回路を用いて、測定のみの量子回路のクラスについて検討する。
回路は定常構造が豊富であることを示し、その結果の位相に対する測定範囲の強い影響を明らかにする。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:38:32 GMT)
Stateful Inference for Low-Latency Multi-Agent Tool Calling [0.0] LLMベースのシステムでは,マルチエージェント・ツール・コールが主要なインタラクション・パターンになりつつある。
本稿では,従来のサービスにおける$O(n_t)=ターン当たりのコストを$O(_t)$デルタのみのコストに変換する,ステートフルな推論アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:27:49 GMT)
SomaliBench Eval: Measuring English-to-Somali Refusal Gaps in Open-Weight Language Models [0.0] SomaliBench v0。
4つのモデルすべてに対して、大きな英語とソマリアの拒絶ギャップが見つかる。
3つのモデルにおいて、支配的なソマリアの非拒絶モードは、有害なコンプライアンスに恵まれず、不明確な出力である。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:45:44 GMT)
Sideband fingerprints of antibunched light in cascaded quantum wave mixing [0.0] 単一超伝導量子ビット上の量子波の混合は、弾性多光子散乱経路に関連するコヒーレント側ピークの階層を生成する。
我々は、弱い運転体制におけるカスケードマスター方程式から始まるこの効果の分析理論を開発する。
結果として生じるサイドバンド階層は、アンチバンチされたイテナントマイクロ波光の周波数ドメイン指紋を提供する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:23:25 GMT)
Sequential Spatiotemporal Magnetic-Field Reconstruction via Quantum Hamiltonian Learning with NV-Center Spin-1 Hamiltonians [0.0] 動的2次元磁場マップのための量子ハミルトニアン学習に基づく逐次再構成フレームワークを提案する。
局所的な測定は、局所磁場値と共有双極子結合パラメータによって支配される窒素空隙スピンダイナミクスによって生成される。
その結果、試験対象のフィールドクラスの実現可能性を示し、結合推定を主な識別可能性ボトルネックとして同定した。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:48:49 GMT)
Sensitivity to perturbations in the three-dimensional Anderson model [0.0] 摂動に対する単一粒子固有状態の感度を定量化するフィデリティ感受性について検討する。
フィデリティの感受性のピークを生じる2つの異なるシナリオが見つかる。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:46:54 GMT)
Semigroup Consistency as a Diagnostic for Learned Physics Simulators [0.0] 本稿では, 直接予測と合成予測を比較したモデル非依存診断法として, 正規化半群誤差を提案する。
時間条件のConvNetとFNOベースラインを持つ1次元熱とバーガース力学では、半群誤差はロールアウト劣化と正の相関を持つ。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:00:29 GMT)
SPIN: Decentralized Swarm Control via Tensorized Policy Coordination [0.0] 本稿では,Swarm Policy Interference Network(SPIN)フレームワークを紹介する。
局所多エージェント傾斜角の合同ポリシーテンソルを行列積状態鎖に分解する。
局所的な連続空間幾何学をこの離散代数的バックエンドでブリッジするために、分離されたハイブリッド型ニューロシンボリック制御パイプラインを導入する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:45:51 GMT)
Routed Closure: Rethinking Value Capture in Decentralized Ecosystems [0.0] 分散されたエコシステムは価値をとらえることができ、それでも実行し続けるアクターに資金を提供しない。
本稿では,従来の価値獲得分析が集中型プールを前提とする場合が多いことを論じる。
我々はこの区別をRoute-Admissible Valueで定式化し、外部値クロージャプロトコルで運用する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:57:11 GMT)
Retrieval-Augmented Detection of Potentially Abusive Clauses in Chilean Terms of Service [0.0] 本稿では,チリのサービス用語における潜在的虐待条項の自動検出と分類のための検索拡張生成フレームワークを提案する。
ローカル実行用に設計され、効率的な節検出、ハイブリッドな高密度スパース検索、再ランク付け、そして中規模のオープンウェイト言語モデルをサポートするために即時拡張を組み合わせている。
また、違法、暗、グレーの条項にまたがる法的根拠のある24のカテゴリーにおいて、100の契約と10,029の注釈付き条項からなるチリの虐待的サービス拡張コーパスを紹介します。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:38:10 GMT)
RepSAM: Bridging Foundation Models to Robotic Vision via Representation-Guided Adaptation [0.0] RepSAMは、ロボットビジョンに基礎モデルを適用するための表現誘導パラメータ効率の微調整フレームワークである。
RepSAMは完全な微調整性能(89.0%対90.9% mIoU)の97.9%を達成し、トレーニング可能なパラメータを158倍(632Mから4.0M)削減した。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:56:42 GMT)
Rao-Blackwellized Score Matching on Manifolds [0.0] 本研究では,滑らかな組込み多様体上に潜伏分布が支持された場合,DSM(Denoising score matching)について検討する。
最近点射影 $(X)$ 上の条件付けは、この特異点を正則に除去することを示す。
次に、この標準的対象の小さな雑音展開を計算する。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:18:45 GMT)
R5DGS: Semantic-Aware 4D Gaussian Splatting with Rigid Body Constraints for Efficient Dynamic Scene Reconstruction [0.0] マルチビュービデオからダイナミックな3Dシーンを再構築し、予測することは、ロボティクス、AR/VR、デジタルツインの基本的なタスクである。
近年の物理インフォームドガウシアン・スティング法は, 将来的なフレーム外挿を実現するが, 意味的認識が欠如し, 計算オーバーヘッドが大きい。
物理駆動の 4D ガウス表現をコンパクトな恒等ベクトルで拡張するフレームワークである $textbfR5DGS$ を紹介する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:46:04 GMT)
Quantum Domain Decomposition for Preconditioning the Finite Element Method [0.0] 特に逆行列の条件数は決定的なパラメータである。
良く知られた古典的、そして現在では量子的救済法は、行列$H$でプリマル化することで線型系 $A x = b$ をプリコンディションすることであり、$HA$ の条件数は$A$ の条件数よりもかなり小さい。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:52:13 GMT)
Quantitative Evaluation of the Severity of Posttraumatic Stress Disorder through Transfer Learning from Specific Phobia Data [0.0] 本研究では,PTSD重大度を客観的に評価するための機械学習(ML)アプローチを提案する。
心拍数 (HR) とガルバニック皮膚反応 (GSR) の信号とPTSD Checklist - Military Version (PCL-M) のラベルを, 没入型シミュレーションで21名から収集した。
このモデルはPTSD状態の分類において86%の精度を達成し、PTSDの有無を効果的に識別した。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:13:45 GMT)
QAM-W: Joint 2D Codebook Quantization for LLM Weights via Hadamard Rotation and Activation-Aware Scaling [0.0] トレーニング後の量子化器は、重み列内のペアワイズ座標構造を捨てる。
本稿では,QAM-W (Quadrature Amplitude Modulation for Weights) を導入する。
3.5bpwの変種は量子化耐性アーキテクチャと競合する。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:28:46 GMT)
Proof of Useful Attestation: A Consensus Primitive for Attestation-Native Chains [0.0] 本論文は, この機構, 6層化シビルおよび研削防衛, フル層化防御におけるモンテカルロの実証的戦略探索, 明確なしきい値の導出による研削検出器について述べる。
これは、正式な経済基盤を持つメカニズム設計の提案であり、完全な暗号セキュリティ証明ではなく、BFTの安全性と生存性を継承している。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:37:50 GMT)
Predicting Stock Price Direction on Earnings Announcement Days using Multi-modal Deep Learning [0.0] 我々は、発表前のニュースセンチメント、確固たる基礎、最近の市場動態が、決算発表日の株式の方向性価格変動を共同で予測するかどうかを評価する。
我々は、FinBERTを用いて処理された財務ニュース記事から得られた15の基本的な指標、3つの価格に基づく技術指標と感情スコアを組み合わせたマルチモーダル特徴空間を構築した。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:25:25 GMT)
Photon position eigenstates in configuration space [0.0] 構成空間におけるホートン光子位置作用素の固有関数の式を提供する。
位置固有値の値 $mathbf q$ だけでなく、$mathbf q$ を含む平面上でも発散することを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:47:13 GMT)
Phantom transitions in language model fine-tuning [0.0] ほぼ同期の競合相手とコンテキスト上で言語モデルを微調整することは、しばしばサイレントに失敗する。
2つのファミリーにまたがる5つの変圧器アーキテクチャと5つのパラメータ範囲にまたがるこの構造について検討する。
位相遷移に類似した順序パラメータにおいて,鋭いカタパルト様ジャンプを観察する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:44:42 GMT)
PauLIB: A High-Performance Library for Processing Pauli Strings [0.0] PauLIBは、大きなパウリ和を処理するためのヘッダのみのC++20ライブラリである。
2ビットで各キュービットを符号化するビットパック二進シンプレクティック表現は、パウリの乗算をビットワイズXORと人口数に還元する。
分岐予測可能なSIMDバルク操作を可能にするためにハッシュマップを置き換えるソートされた配列レイアウト。
明示的なSIMDベクトル化のために連続したワード配列を公開する構造体配列(SoA)メモリレイアウト。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:48:14 GMT)
Path Following Control System of Line-of-Sight Guidance for Robotic Dolphin with Multi-Link Mechanism in Underwater Simulator [0.0] 生物模倣型自律水中車両(BAUV)とマルチリンク機構は、水生生物観測や環境調査で広く利用されている。
BAUVの経路追従システムは制限されており、マルチリンク機構ロボットによる評価はまだ明らかにされていない。
本研究では,マルチリンク機構を備えたBAUVの経路追従システムを提案し,水中シミュレーションにおける評価を行った。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:52:29 GMT)
Page image classifier fine-tuned on century-spanning archives of scanned documents for further content-specific processing [0.0] 人文科学におけるデジタル化プロジェクトは、歴史的文書の膨大な、異質なアーカイブを生み出している。
この作業は、ビジュアルコンテンツタイプに基づいてスキャンされたページイメージを分類する自動化システムの必要性に対処する。
注釈付き歴史ページイメージ48,000枚以上のデータセットを用いて,画像分類システムを開発し,評価した。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:36:36 GMT)
Negative entropy in scrambling black holes [0.0] 我々は、落下物体が吸収され、その微視的な自由度にスクランブルされると、ブラックホール内で引き起こされるエントロピーの増加を導出する。
それらの分割関数による寄与は,地平線領域に付随するコヒーレント情報バランスをキャンセルすることを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 00:34:38 GMT)
Native topological readout on qubit hardware: a Fibonacci-chain benchmark of measurement-compilation trade-offs [0.0] 我々は、測定コストとコンパイルコストのトレードオフを理解するモデルとして、Fibonacci anyons chainを使用します。
我々は、Floquetの時間進化型量子回路と変分型量子固有解器量子回路という、2つの異なる種類の量子回路に基づいてベンチマークを行った。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:49:36 GMT)
Mode-selective excitation in parametrically driven coupled quantum oscillators [0.0] 本研究では、2つの量子調和体間の結合をパラメトリックに変調する異なる駆動プロトコルについて検討する。
駆動周波数を原理的に調整して任意の通常モードを励起し、他方を基底状態に近づけることが示される。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:00:15 GMT)
Minimal surfaces, Knots, and Neural Networks [0.0] ジョエル・ファインによる最近の予想は、3次元球面$S3$における結び目$K$のHOMFLYの係数と、双曲 4-空間$mathrmH4$ における最小曲面の符号付き数との関係を示唆している。
ハイパーボリック空間における最小曲面方程式を解くために,物理情報ニューラルネットワーク(PINN)に基づく新しい機械学習フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:02:41 GMT)
Metric-Aware PCA as a Linear Instance of Geometric Deep Learning [0.0] Metric-Aware principal Component Analysis (MAPCA)は、正定距離行列による主成分分析をパラメータ化する。
本稿では,MAPCAを幾何学的深層学習フレームワークに位置づける。
我々はMAPCAと幾何学的深層学習の正確な辞書を構築した。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:07:24 GMT)
Meta-Engineering Harnesses for AI-Native Software Production: A Contract-Driven Adversarial Verification Architecture with Early Deployment Report [0.0] 運用および製品機能要件を明示的な契約に変換する,ソフトウェア生産アーキテクチャを提案する。
本稿では,2パスのコントラクトコンパイルを含む階層アーキテクチャについて述べる。
数週間にわたって17の機能にまたがる初期の運用デプロイメントの結果を報告します。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:15:24 GMT)
Memory Architectures for Multi-Turn Text-to-SQL: A Benchmark and Empirical Study [0.0] Multi-turn Text-to-BIRDはエンタープライズ分析の中心であるが、シングルターン設定では主に評価されている。
GPT-5 mini, GPT-5.2, Claude Sonnet 4.5, Sonnet 4.6, Opus 4.6の5つのモデルを5つのメモリ条件で評価した。
全てのクロードモデルは拡張思考で評価され、GPT推論モデルと同等に維持できる。
論文参考訳(メタデータ) (Mon, 25 May 2026 23:52:15 GMT)
Mapping the Schedule x Bit-Width Boundary in Sub-100M Quantisation-Aware Training [0.0] 我々は,100M未満のデコーダ言語モデルに対する初期化量子化学習(QAT)において,最適学習率スケジュールがビット幅に依存するかどうかを検証する。
ビット幅 x LR 級数 x LR モデルサイズ x シード (FP16/INT8/INT6 QAT) 上の 720 個の因子格子 (Phase 2) により、最適な暖房は、各(ビット幅、サイズ)セルで33%となる。
nullは3つの設定変更すべてで堅牢である。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:42:34 GMT)
Managing Uncertainty in LLM-Generated Procedural Knowledge for Virtual Laboratory Planning [0.0] 仮想実験室計画のためのLLM生成手続き的知識の不確実性を管理するためのプロトタイプフレームワークを提案する。
このフレームワークは、構造化されたドメイン表現と不確実なLCM生成状態遷移サンプルを使用することで、手続き的不確実性を低減することを目的としている。
本稿では,実験器具,容器,工具,物質移動動作を含む仮想実験室領域におけるアプローチについて述べる。
論文参考訳(メタデータ) (Mon, 25 May 2026 21:12:47 GMT)
MTLLFM: Multimodal-Temporal Laughter Localization: UR-FUNNY-Temporal and SMILE-Temporal Benchmarks with an Adaptive Multimodal Fusion Model [0.0] UR-FUNNY-TemporalデータセットとSMILE-Temporalデータセットを導入し,2つのユーモアベンチマークを拡張した。
私たちのアノテーションは11,053本のビデオ(78.8時間)をカバーし、それぞれの笑いイベントに対して正確なオンセット/オフセット境界を提供します。
本アーキテクチャでは,HuBERTとMAEエンコーダを時間的ソフトマックスプーリングと適応的モダリティゲーティングを組み合わせることで,クリップレベルのラベルから微細な時間的グラウンドを学習する。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:21:37 GMT)
Leveraging Language Models for Log Statement Generation in Multilingual Scenarios: How Far Are We? [0.0] 最先端のアプローチであるUniLogは、多言語環境においても高い効率を保ちながら、全体的なパフォーマンスを最高のものにしている。
Pythonはより大きな課題を示し、JavaScriptは比較的優れたパフォーマンスをもたらす。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:58:21 GMT)
LearnedCache: An eBPF-Integrated Perceptron-Based Eviction Policy for the Linux Page Cache [0.0] 我々は Linux ページキャッシュのための eBPF 統合単層パーセプトロンベースのキャッシュ消去ポリシーである LearnedCache を開発した。
複数の線形モデルモデリングページの再利用時間に対して,AUCの中央値が80%近くであることを示す。
次に、これらのモデルをLinuxカーネルに組み込んで、リアルタイムのパフォーマンス評価を行う。
論文参考訳(メタデータ) (Mon, 25 May 2026 00:15:38 GMT)
Kubo-Ando Means and Rigidity of Quantum Positivity Cones [0.0] 久保安藤が正部分転位とシュミット数錐とどのように相互作用するかを示す。
コンベックス混合は、絡み合う量子チャネルを保存するために一意に許容できるKubo--Ando演算である。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:57:05 GMT)
Krylov Complexity in Periodically Driven CFTs and Critical Fermions [0.0] 周期的に駆動される共形場の理論と、臨界フェルミオンによる格子実現におけるクリロフ構成について研究する。
加熱および非加熱相における周期的に駆動される共形場理論におけるアルノルニ係数と戻り振幅について検討する。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:22:13 GMT)
Krylov Complexity for Plane Wave Matrix Model [0.0] BMN平面波行列モデルにおけるKrylovの大規模変形における複雑性について検討した。
我々は、ハミルトン解析を実行できる行列モデルの様々な一貫した還元を考える。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:15:34 GMT)
KYA: A Framework-Agnostic Trust Layer for Autonomous Systems with Verifiable Provenance and Hierarchical Policy Composition [0.0] 可観測性(Observability)は、エージェントが遅いときにオペレータに通知する。KYAは、エージェントが間違っているとき、ドリフトしているとき、リークしているとき、または静かにローグしているとき、オペレータに通知する。
我々は,5つのプリミティブから構成される自律システムのための,オープンソースの信頼とガバナンス層であるKYAを紹介する。
純粋な関数スコアラは、p99でミリ秒以下で動作し、システムは、HMACチェーンの完全保存されたエンドツーエンドの20の並行ワーカーで1,800 ops/secを持続する。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:59:54 GMT)
Journey in quantum metrology and sensing from foundations to applications: a review [0.0] 本稿では,その基礎から応用まで,量子力学とセンシングについて概観する。
パラメータ推定に対する頻繁なアプローチとベイズ的アプローチの両方を考慮すること。
量子多体センサー、原子アンサンブルにおける検出プロトコル、原子-光子系、連続可変系を含む多様なアリーナの応用。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:46:02 GMT)
Interpreting Bohm quantum potentials in Computing quantum waves exactly from classical action [0.0] 最近のarXivの投稿では、この証明は密度の空間微分が欠落しており、ボーム量子ポテンシャルにつながると主張している。
この技術的注記は、プロパゲート密度がレマ3.1のファインマンプロパゲーター構成に空間依存しない理由を示している。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:41:12 GMT)
Insuring Every Action: An Authority Frontier Framework for Runtime Actuarial Control of Autonomous AI Agents [0.0] 本稿では,アクタリカル・アクション・インタフェース (AAI) を提案する。
次に、各予備資本のレベルにおいて、ランタイムがどれだけ自律的にリリースするかを測定する、評価プリミティブであるオーソリティフロンティアを開発します。
このコントリビューションは、自律エージェントサイドエフェクトのランタイムアクチュエータ制御のためのベンチマーク対応評価フレームワークである。
論文参考訳(メタデータ) (Mon, 25 May 2026 09:31:48 GMT)
Implementation of distillation protocols using a recirculating bricks mesh network [0.0] マッハ・ツェンダー干渉計の2次元ブリック導波路メッシュは、フォトニックニューラルネットワークの領域においてかなりのポテンシャルを持つことが示されている。
本稿では, 量子信号処理に必要な蒸留プロトコルに対して, 再循環型ブリックメッシュアーキテクチャの適用範囲を拡大することを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:47:54 GMT)
Geometric Quantization on Orbifolds [0.0] このテキストはオービフォールドに幾何学的量子化を導入する。
必要な背景をレビューした後、シンプレクティックオービフォールドに対する前処理、分極、およびメタプレクティック補正の新しい治療法を開発する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:47:20 GMT)
Geometric Evolution Maps: Extracting Stable Concept Probes from Transformer Residual Streams [0.0] 391 の概念 x モデル対のアブレーション実験により、GEM 抽出プローブは少なくともピーク層プローブと同程度正確であることが示されている。
方向特異性制御は、アブレーション効果が概念指向性であることを確認する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:40:15 GMT)
Generating 3D models from sketches of human faces using a combined approach of Convolutional Neural Networks, Procedural Modeling, and Contour Mapping [0.0] スケッチから3次元モデルを生成する新しい手法を提案する。
CNNは、アクティブなFACSアクションユニットを検出することで、与えられたスケッチ内の表現を検出するように訓練される。
この表現はバレーガールで複製され、同様の表現を持つ3Dモデルが得られる。
論文参考訳(メタデータ) (Mon, 25 May 2026 04:37:01 GMT)
Generalising gravitationally induced decoherence beyond linear environmental interactions in a microscopic quantum mechanical toy model [0.0] 環境の位置演算子のワイル要素の観点から定式化された相互作用を考える。
一階項は、Xu, Blencowe (2022) と Domi et al. (2024) のデコヒーレンスモデルを再現することを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:17:00 GMT)
Forgotten Words: Benchmarking NeoBERT for Dementia Detection in Low-Resource Conversational Filipino and English Speech [0.0] フィリピン語音声における変圧器による認知症検出の最初の体系的評価について述べる。
ドメイン・エフェクトから言語を分離するため、4000のDementiaBank由来のパラレル・バイリンガル・データセットを構築した。
英語で訓練されたBERTは、フィリピンのMacro-F1 = 0.455に低下している。
しかし、バイリンガル微調整はすべてのトランスモデル間の言語間劣化を排除し、マクロ-F1 = 0.969-0.973に収束する。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:26:15 GMT)
Fine-Tuning Over Architectural Complexity: Broad-Coverage PII Detection on PIIBench with DeBERTa [0.0] PII検出システムは、狭いソースまたはドメイン境界内で頻繁に訓練され、異種テキストにデプロイする場合のカバレッジを制限する。
我々は,10個のソースデータセットに82個の保持されたエンティティタイプにまたがる修正されたマルチソースPIIBenchのモデル微調整について検討した。
直接トークン分類の微調整,ソース条件付き階層モデル(SC+H),3段階のカリキュラム拡張(SC+H+Curr)の3つのアプローチを評価した。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:12:42 GMT)
Fermion renormalized vertex functions, effective mass, and condensate in an external Yang-Mills gauge field [0.0] 外部のヤン・ミルズゲージ場においてフェルミオンが伝播するときのフェルミオン凝縮について検討する。
非アベリア平面-波動ゲージ場におけるディラック作用素に対して、正確なグリーン関数を用いる。
強磁場QCDおよび非アベリア・シュウィンガー物理学への応用について論じる。
論文参考訳(メタデータ) (Mon, 25 May 2026 08:30:49 GMT)
Fault-Tolerant QLDPC Syndrome Measurement via LDGM Encoding [0.0] 本稿では,量子低密度パリティチェック(QLDPC)のためのSM符号として,LDGM符号を用いる方法を提案する。
我々は、効率的なプログレッシブエッジ成長型アルゴリズムを用いて、列と行の重みを持つLDGM SM符号を作成し、一定の重みを持つ測定安定化器を生成する。
論文参考訳(メタデータ) (Mon, 25 May 2026 00:39:58 GMT)
Extended Bose-Hubbard Model on Small Grids: Exact Diagonalization and Monte Carlo Studies [0.0] 我々は、小さな正方形と三角形の格子上に拡張されたボース・ハッバードモデルのハードコア極限を考える。
地中状態の特徴は, 熱力学の限界に現れるものとは大きく異なる。
その後,超流動と断熱的挙動の二分法を二次元系で検討した。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:55:48 GMT)
Explore Before You Solve: The Speed--Depth Trade-off in Epistemic Agents for ARC-AGI-3 [0.0] 一般に25のARC-AGI-3ゲームについて検討し、すべてのゲームが非知的な戦略によって到達可能であることを確認する。
このベンチマーク批判は、公開評価セットが知的探索を識別できないことを示唆している。
これら25試合でRHAE=0.2116を達成する三相(EXPLORE / VERIFY / PLAN)エージェントであるAERAを提案する。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:13:18 GMT)
Exact strong zero modes are generic in integrable spin systems with large anisotropy [0.0] 強零モード (SZMs) は、ハミルトニアンと通勤するエッジ局所作用素であり、システムサイズにおいて指数関数的に小さい補正を行う。
既存のESZM構造はモデルによってモデル化され、共通のフレームワークに統一されていない。
ここでは、ESZMsは、異方性相互作用を持つ可積分スピンモデルの広いファミリーで一般化されることを示す。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:00:00 GMT)
Evaluating passing decision-making in professional football: An enhanced MPNN approach to Receiver Selection [0.0] この研究は、受信者選択を予測するように設計されたグラフニューラルネットワークフレームワークを導入する。
プロの試合からの追跡データとイベントデータを組み合わせて,MPNN(Message-Passing Neural Network)を開発した。
MPNNは、実際の選択された受信機を識別する際の競合精度と、その上位3つの提案の中で最先端の精度を達成する。
論文参考訳(メタデータ) (Mon, 25 May 2026 10:53:47 GMT)
Evaluating System-Level Fidelity with Peaked Random Circuits [0.0] ピークランダム回路(Paked Random Circuits, PRCs)は、NISQデバイス上で量子優位性を示すための有効な経路として提案されている。
累積雑音,ゲートエラー,接続制約に拘わらず,決定論的ピークを識別するシステムの能力の定量化を行う。
PRCは量子ボリュームに匹敵する高精度な計量を提供するが、干渉効果に対する感度は高い。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:59:39 GMT)
Entangling gate performance and fidelity limits with neutral atom Förster resonances [0.0] 近くのFrster共鳴は、ランドスケープと忠実さを制御するために共鳴的に結合された相互作用チャネルを含んでいる。
この状態に対する2固有状態モデルを構築し、共振における両状態とのカップリングを許容する場合、ゲートの忠実度は$mathcalFleq 1-(/2)/(V_R)$で制限されることを示す。
我々は、この境界を大きなラビ周波数制限で飽和させ、既存の忠実度制限を約40%改善するゲートプロトコルを構築した。
論文参考訳(メタデータ) (Mon, 25 May 2026 16:28:35 GMT)
Energy-Gated Attention and Wavelet Positional Encoding: Complementary Inductive Biases for Transformer Attention [0.0] 標準的な注意力に欠ける2つの相補的帰納バイアスを同定する。
正当性と局所性は相補的帰納バイアスであり、それぞれが単独では満たせないギャップに対処する。
この超添加性は、2つの独立したトレーニングランで観察され、中心的な経験的発見である。
論文参考訳(メタデータ) (Mon, 25 May 2026 22:04:31 GMT)
Emergence via Phase Transitions: Mechanism Landscapes and Universal Convergence Across Complex Systems [0.0] 機械学習、生物学、物理学全般において、独立して進化するシステムは、しばしば著しく類似した高レベル構造に収束する。
このような収束現象の普遍性候補フレームワークとして階層的創発フレームワーク(HEF)を提案する。
HEFは出現の普遍的理論としてではなく、複雑な系にまたがる収束現象を研究するための数学的な足場として表される。
論文参考訳(メタデータ) (Mon, 25 May 2026 18:32:52 GMT)
Electricity Consumption Forecasting: An Approach Using Cooperative Ensemble Learning with SHapley Additive exPlanations [0.0] Weaker Separator Booster (WSB)はデータセットの最高のパフォーマンスを示した。
共通性は、タグ付けされた時系列値の強い影響と気候変数の最小の影響であった。
論文参考訳(メタデータ) (Mon, 25 May 2026 00:03:52 GMT)
ESBMC: A Survey of Its Evolution, Integration, and Future Directions in Formal Software Verification [0.0] この調査は、ESBMCの当初の設計原則から2025-2026年の最先端まで、完全な軌道を辿っている。
我々は、その経済的な影響 - GBP 9.3百万ドル、EUR 4.98百万ドル - を、確認された公的研究資金、VeriBeeのスピンオフ、ロッキード・マーティンの防衛産業展開で合成する。
論文参考訳(メタデータ) (Mon, 25 May 2026 00:18:27 GMT)
Does Continued Pretraining on a Learner Corpus Improve Automated Essay Scoring on English Proficiency Tests? Evidence from EFCAMDAT [0.0] 本研究では,ドメイン適応型継続事前学習が変圧器を用いた自動エッセイスコアを向上するかどうかを検討する。
フルコーパスDAPTは、モデル、データセット、メトリクス間で混合結果を生成する。
異なる英語の習熟度テストデータセット間での転送性を自動的に改善するものではない。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:04:37 GMT)
Dirac-Line Criticality and Emergent Horizons in Weyl Lifshitz Transitions [0.0] ブラックホールの地平線と、ディラック線を通るタイプIからタイプIIのワイルフェルミオンへの変換の間には、いくつかの類似点がある。
我々は,タイプIからタイプIIのディラックフェルミオンへの遷移状態をブラックホール地平線とみなすことができることを示した。
論文参考訳(メタデータ) (Mon, 25 May 2026 03:14:50 GMT)
Co-folding model guided by structural proteomics [0.0] AIMS-Foldは、タンパク質構造生成モデルのための推論時誘導拡散フレームワークである。
XL-MS空間拘束とHDX-MS溶媒アクセシビリティプロファイルから導かれる物理的ポテンシャルの微分による生成的サンプリング軌道の導出を行う。
これにより、構造に基づく薬物設計のための強力で統合的な計算手法として、我々の枠組みが確立される。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:54:08 GMT)
Capability and Robustness Cannot Both Be Free: An Information-Theoretic Bound for Vision-Language-Action Models [0.0] VLA(Vision-Language-Action)モデルは、予測されたアクションが実行され、障害毎に安全コストがかかる実際のロボットにますますデプロイされる。
OpenVLA-7Bに対する$16/255$のPGD攻撃は、LIBEROの成功を95%以上から5%以下に下げる。
実証的な防御は、清潔な正確さを犠牲にしてある程度の堅牢性を取り戻すが、このトレードオフが理論的なフロアを持つかどうかは文献では定かではない。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:16:57 GMT)
CNNs, Transformers, Hybrid, and Vision Language Models for Skin Cancer Detection [0.0] PAD-UFES-20データセットを用いた2値皮膚がん検出のための12種類の深層学習モデルの統一評価を行った。
モデルは、畳み込みニューラルネットワーク(CNN)、ビジョントランスフォーマー(ViT)、ハイブリッド畳み込みトランスフォーマーバックボーン、ビジョン言語モデル(VLM)の4つのファミリーにまたがる。
結果は、よく調整されたCNNが既に強力なベースラインを提供していることを示しているが、トランスフォーマーベースのファミリーは、常に差別を改善している。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:37:14 GMT)
Building an Adversarial Malware Dataset by Family and Type: Generation, Evasion, and Poisoning Evaluation [0.0] 実世界のマルウェアバイナリの公開RawMal-TFコレクションから得られた,敵対的なマルウェアサンプルのデータセットを提案する。
敵のマルウェア生成装置群を用いて, 44,347のファミリーラベル付きサンプルと33,596のタイプラベル付きサンプルの2組の逆PEファイルを構築した。
各対向バイナリには、EMBERスコアや VirusTotal 分類を含む詳細なメタデータが添付されている。
論文参考訳(メタデータ) (Mon, 25 May 2026 15:17:02 GMT)
Broken Object Level Authorization in the Wild: An Empirical Taxonomy from 100+ Bug Bounty Disclosures [0.0] Broken Object Level Authorization (ABOL)は、APIセキュリティの最も重要な脆弱性を一貫してランク付けしている。
本論文は,BOLAの大規模実験分析として,公開バグ報奨金を報告した最初の事例である。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:55:24 GMT)
Beyond Summaries: Structure-Aware Labeling of Code Changes with Large Language Models [0.0] 本稿では,コードパッチにおけるコード変更の分類に基づくラベル付けに,大規模言語モデル(LLM)を用いた体系的研究を行う。
我々のアプローチでは、従来の分析パイプラインのエンジニアリングオーバーヘッドを伴わずに、言語に依存しない、カスタマイズ可能なラベルを生成するために、数発のプロンプトを採用しています。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:56:46 GMT)
Beyond Differences: Doubly Robust Meta-Learners for Ratio-Based Treatment Effects [0.0] Q-Learnerは$(x)$を2つの奇数比の積に分解する。
S/T-とQ-style比学習者の2倍頑健な増分を導出する。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:24:57 GMT)
Benchmarking Convolutional, Transformer, Hybrid, and Vision Language Models for Multi Disease Retinal Screening [0.0] 我々は、畳み込みニューラルネットワーク、ビジョントランスフォーマー、ハイブリッドCNN変換器バックボーン、ビジョン言語モデルという、4つのモデルファミリにまたがる12のアーキテクチャをベンチマークした。
網膜疾患に対するバイナリスクリーニングと,28の疾患クラスにまたがる多ラベル分類の2つの課題について検討した。
SwinTinyとCoAtNet0とMaxViTTinyのハイブリッドモデルは、最強のバイナリスクリーニング結果を実現し、マルチラベル設定におけるマクロおよびマイクロF1を改善する。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:09:35 GMT)
Bargmann Zeros as a Diagnostic of the Tunneling Transition in Double-Well Quantum Systems [0.0] 一次元アンハーモニックおよび励起ハミルトニアンの固有状態のバーグマン零点が対称二重井戸のトンネル遷移の符号を持つことを示す。
調和ポテンシャルとクォートアンハーモニックポテンシャルに対して、ゼロは好ましくない配向を示す。
一方、二重井戸固有状態に対しては、零点が虚軸に収束する。
論文参考訳(メタデータ) (Mon, 25 May 2026 13:53:29 GMT)
Anchor: Mitigating Artifact Drift in Agent Benchmark Generation [0.0] ドメインエキスパートの仕様を制約最適化プログラムに形式化するタスク生成パイプラインであるAnchorを紹介する。
Anchorでは、パラメータを変更することで、制御の困難さと既知の最適解を持つ新しいタスクが生成される。
本研究では,ERP-Benchの生産にAnchorを適用し,生産レベルのERPシステムにおける調達と製造にまたがる300の長期タスクのベンチマークを行った。
論文参考訳(メタデータ) (Mon, 25 May 2026 20:44:17 GMT)
AgentSociety: Incentivizing Agentic Social Intelligence [0.0] 我々は、$mathttAgentSociety$が、エージェントがローカルコンテキストを利用して自律的な意思決定を行う環境を提供することを示した。
我々のメカニズムは、エージェントが隣のエージェントに情報を選択的に開示するインセンティブを与える。
我々は、$mathttAgentSociety$でデプロイされたオープンでプロプライエタリな言語モデルで採用されている戦略プロファイルを比較し、ベンチマークする。
論文参考訳(メタデータ) (Mon, 25 May 2026 17:59:59 GMT)
AgentGrounder: Zero-Shot 3D Visual Pointcloud Grounding using Multimodal Language Models [0.0] 3Dビジュアルグラウンド(3DVG)は、AIを具現化する上で不可欠な機能であり、自然言語の記述に基づいて、エージェントがオブジェクトを3Dシーンにローカライズする必要がある。
タスク固有の3Dトレーニングを必要とせずに,色のついた点クラウド上で直接動作する,ゼロショットの3Dビジュアルグラウンドティングフレームワークである。
論文参考訳(メタデータ) (Mon, 25 May 2026 14:29:04 GMT)
ATV-Net: Adaptive Triple-View Network with Dynamic Feature Fusion [0.0] 本稿では,ResNet-101のバックボーンを強化する適応型トリプルビューネットワークであるATV-Netを提案する。
Cityscapesの検証セットの実験では、ATV-Netは80.31% mIoUを達成した。
論文参考訳(メタデータ) (Mon, 25 May 2026 12:52:01 GMT)
AI-Associated Lexical Shifts Across 34 Languages: Cross-Lingual Convergence and Diachronic Uptake in News Writing [0.0] 我々はこの作業をWMT News Crawl corpusの34言語に拡張する。
各言語について、ログの頻度比を用いて、ランク付けされたAI過剰な補題を導出する。
我々は言語間セマンティックコンバージェンスをかなり見つけている。
論文参考訳(メタデータ) (Mon, 25 May 2026 02:24:46 GMT)
A multifractal-based masked auto-encoder: an application to medical images [0.0] マスケードオートエンコーダ (MAE) は医用画像分類において有望である。
本稿では,マルチフラクタル測度(Renyi entropy)を用いてマスキング戦略を最適化する手法を提案する。
提案手法はMO-MAE (Multifractal-Optimized Masked Autoencoder) と呼ばれ,多フラクタル解析を用いて複雑度と情報量の高い領域を同定する。
論文参考訳(メタデータ) (Mon, 25 May 2026 19:20:31 GMT)
A Universal Cliff and a Design Fingerprint: Cross-Section Defect Detection Under LLM Orchestration [0.0] 生産言語モデルシステムは、労働者エージェントの目に見えないオーケストレーションにまたがってそれを拡大する要求に答える。
これは、単一のワーカーが見ることができない欠陥のクラスに何をもたらすか尋ねる。
1人の開発者から5世代にわたる10のシステムと、異なるアライメントパラダイムからの5つのプロバイダのみです。
論文参考訳(メタデータ) (Mon, 25 May 2026 05:09:48 GMT)
A Tertiary Review of Large Language Model-Based Code Generating Tasks: Trends, Challenges, and Future Directions [0.0] 大規模言語モデル(LLM)は、ソフトウェア工学におけるコード生成タスク(CGT)にますます応用されている。
本研究は, LLMに基づくCGTに関する二次的証拠を整理し, 出版状況, 効果, シナリオ, 統合課題, 今後の研究方向性について考察する。
論文参考訳(メタデータ) (Mon, 25 May 2026 07:49:23 GMT)
A Lightweight Hybrid Transformer-CRF Architecture for Multi-Type Bangla Medical Entity Recognition [0.0] バングラ語のための軽量なMedERフレームワークを提案する。
12層BanglaBERTモデルを用いて厳密なベースラインを構築した。
我々はこの教師モデルを知識蒸留により4階層の学生ネットワークに圧縮する。
論文参考訳(メタデータ) (Mon, 25 May 2026 06:14:34 GMT)
A Deep Dive into Axiomatic Design -- Part I: Problem Formulation [0.0] 顧客ニーズと制約を最小限の独立したファーストレベルの機能要件に翻訳する問題の定式化は、すべての設計フレームワークにおいて最も重要なステップであることは間違いない。
本稿では,第一級FRとは何か(かつそうではないのか)を明らかにする公理設計における問題定式化にのみ焦点をあてる。
同じニーズと制約を与えられたデザイナ間で合法的に異なるべきではない理由を説明し、本質的な困難と繰り返し発生する落とし穴を強調します。
論文参考訳(メタデータ) (Mon, 25 May 2026 11:43:54 GMT)