Baton: Explicit Semantic Blueprints for Joint Video-Audio Generation [113.2] Batonは、共同ビデオオーディオ生成に明示的なセマンティックプランニングを導入するフレームワークである。
我々の重要な洞察は、粗いテキストガイダンスを意味的にリッチでモダリティを意識したトークンで補完することで、細かなセマンティックディテールを同時に復元できるということです。
ベンチマークの実験は、バトンの有効性を質的にも定量的にも示している。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:55:11 GMT)
Better, Faster: Harnessing Self-Improvement in Large Reasoning Models [88.9] 本稿では,2つの単純なyet- Effectiveアプローチにより,大規模推論モデルにおける自己改善を効果的に促進するHSIRを提案する。
具体的には、HSIRはデータの不均衡を軽減するために、検証済みの外部サンプリング戦略を導入する。
HSIRはまた、望ましくないソリューションを定量化しフィルタリングするために、固有の多様性スコアも設計している。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:54:46 GMT)
Multi-Objective Learning for Diffusion Models: A Statistical Theory under Semi-Supervised Learning [83.7] 我々は、限られたデータを持つ拡散モデルのための原則的MOLフレームワークを開発する。
限られたペアデータから,まず軽量なスペシャリストモデルに適合する2段階のトレーニング手順を提案する。
与えられたペアサンプルの個数は、専門モデルクラスの複雑さにのみ依存することを示す境界一般化を確立する。
論文参考訳(メタデータ) (Sun, 24 May 2026 18:19:40 GMT)
Tempered Self-Similarity Alignment for Physically Plausible Video Generation [83.4] 自己相似性損失は確率的対応に変化し、映像生成モデルを動的に変化する領域の視覚基盤モデルと対応付けるよう訓練する。
本手法は,映像生成における関係知識の伝達の有効性を検証し,多種多様な相互作用シナリオにおける物理的妥当性の大幅な向上を示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:28:05 GMT)
Test-Time Deep Thinking to Explore Implicit Rules [80.7] Test-Time Exploration (TTExplore) は、思考者コンポーネントがインタラクション履歴を分析して暗黙のルールを推論し、アクターを誘導するフレームワークである。
5つのテキストベースのエボダイドタスクの実験では、TTExploreにExp-Thinkerが搭載されており、ベースラインエージェントのパフォーマンスを平均14ドル~19ドルポイント改善している。
論文参考訳(メタデータ) (Sun, 24 May 2026 02:41:44 GMT)
Disentangled Double Machine Learning for Accurate Causal Effect Estimation [80.1] 共起バイアスは観測データから因果効果を推定する上で重要な課題である。
二重機械学習(Double Machine Learning, DML)は、処理と結果ニュアンス関数を推定することによってこの問題に対処する。
DMLは高次元または有限サンプルのシナリオにおいてバイアス付きおよび不安定な推定をしばしば生成する。
本稿では,2つの重要な戦略を統合する新しいアルゴリズムであるDistangled Double Machine Learning (DDML)を提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 01:40:43 GMT)
Localization then Neutralization: Gradient-guided Token Suppression against Visual Prompt Injection Attack [78.0] 敵対的なイメージは、プロンプトインジェクションを通じて、マルチモーダルな大規模言語モデルに深刻なセキュリティ上の脅威をもたらす。
敵の攻撃を成功させるには、画像全体を一様に依存するのではなく、重要な画像トークンの小さなサブセットに依存していることを示す。
本稿では,これらのトークンを勾配解析により局所化し,マスキングにより中和するグラディエントトークンマスキング(GTM)を提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:51:34 GMT)
HumanEgo: Zero-Shot Robot Learning from Minutes of Human Egocentric Videos [72.3] HumanEgo(ヒューマンエゴ)は、人間同士の対話の実体レベルの表現に各人間のデモを持ち上げることによって、エンボディメントギャップを橋渡しするフレームワークである。
HumanEgoは、ロボットのデータフリー、ハードウェア非依存、データ効率、ゼロショットの人間とロボットの転送を可能にする。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:26:41 GMT)
Where Detectors Fail: Probing Generative Space for Generalizable AI-Generated Image Detection [69.6] AI生成画像(AIGI)の検出は、検出器が見えないジェネレータに一般化できないことが多いため、依然として難しい。
本稿では, 生成過程の挑戦領域を積極的に探究することで, 検出器の一般化を改善するフレームワーク PROBE を提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:15:06 GMT)
Turning Bias into Bugs: Bandit-Guided Style Manipulation Attacks on LLM Judges [65.9] LLM審査員を誤解させるためにセマンティクスを保存する編集を学習するブラックボックスの敵対的フレームワークであるBITEを紹介する。
BITEは65%を超える攻撃成功率を獲得し、9ポイントのスケールでスコアを1-2ポイント上げる。
LLM-as-a-judgeパラダイムの根本的な弱点を明らかにし,ロバストでアタック・アウェアな評価を動機づけた。
論文参考訳(メタデータ) (Sun, 24 May 2026 05:24:09 GMT)
Factorize to Generalize: Retrieval-Guided Invariant-Dynamic Decomposition for Time Series Forecasting [64.3] 時系列基礎モデル (TSFM) は, 大規模事前学習と検索強化予測により, ゼロショット予測性能が向上した。
本稿では時系列予測のための検索誘導不変動的分解フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:31:55 GMT)
NITP: Next Implicit Token Prediction for LLM Pre-training [62.7] 本研究では,表現空間に直接集中的監督を施した離散予測を増大させるために,Next Implicit Token Prediction (NITP)を提案する。
NITPは、安定な自己教師対象と同じモデルから浅層表現を用いて、次のトークンの暗黙的なセマンティック内容を予測するようにモデルを訓練する。
実験的には、0.5Bから9Bのパラメータを含む高密度モデルとMoEモデルにまたがって、NITPは無視できる計算オーバーヘッドでダウンストリーム性能を一貫して改善する。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:13:12 GMT)
FrontierOR: Benchmarking LLMs' Capacity for Efficient Algorithm Design in Large-Scale Optimization [61.4] 大規模言語モデル(LLM)は、最適化モデリングとソルバコード生成にますます使われている。
既存のベンチマークは、実際のスケールと複雑さよりもはるかに低い、小さな、あるいは単純化された例に限られている。
現実的な大規模最適化問題に対して,LLMに基づく効率的なアルゴリズム設計を評価するための最初のベンチマークとしてFrontierORを紹介した。
論文参考訳(メタデータ) (Sun, 24 May 2026 20:10:42 GMT)
MedMamba: Multi-View State Space Models with Adaptive Graph Learning for Medical Time Series Classification [60.4] 状態空間モデルとドメイン固有の帰納バイアスを統合するエンドツーエンドアーキテクチャであるMedMambaを提案する。
MedMambaは線形計算複雑性を維持しながら最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:23:39 GMT)
From Affect to Complex Behavior: Advancing Multimodal Human-Centered AI at the 10th ABAW Workshop & Competition [60.2] ABAWコンペティションでは、感情的および行動的理解の重要な側面をターゲットにした、さまざまな課題が紹介されている。
論文のトラックでは、ポーズ、動きと行動の推定、モデリングとマルチモーダル学習、ベンチマーク、データセットと評価プロトコル、公正性、堅牢性とデプロイメントなど、幅広いコントリビューションを提示している。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:44:37 GMT)
Directional Alignment Mitigates Reward Hacking in Reinforcement Learning for Language Models [59.4] 逆ハックは、モデルが意図したタスクを解くのではなく、ショートカットを活用することでプロキシ報酬を改善するときに発生する。
このドリフトをパラメータ更新の独特な方向から解析し、報奨行動がクリーンランよりもはるかに大きな方向変化を示すことを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:34:34 GMT)
Multi-view Consistent 3D Gaussian Head Avatars 'without' Multi-view Generation [58.9] 高忠実度3Dガウスヘッドアバター生成は、AR/VR、テレプレゼンス、デジタル人間などの応用に不可欠である。
ランダムな2次元画像から条件付き3次元ヘッドモデルと条件なし3次元ヘッドモデルの両方を学習する。
MVCHeadは3D表現に直接マルチビューの一貫性を強制する単一ショット状態空間モデルである。
論文参考訳(メタデータ) (Sun, 24 May 2026 19:09:15 GMT)
Tiny Brains, Giant Impact: Uncovering the Keystone Neurons of LLM with Just a Few Prompts [58.0] 広い範囲のオープンウェイトトランスフォーマーにおいて、ニューロンのサブセットは、複数の能力次元のタスクをまたいだ推論において、常に高度に活性化されることが示される。
クロスタスク活性化強度に沿って探索することにより、非常にスパースなサブセットが分離され、その除去はモデル挙動の崩壊を引き起こす。
解析の結果,キーストーンニューロンは,前訓練中にほぼ確立されたモデルの安定で内在的なニューロンサブセットであることが明らかとなった。
論文参考訳(メタデータ) (Sun, 24 May 2026 03:31:07 GMT)
Thinking in Scales: Accelerating Gigapixel Pathology Image Analysis via Adaptive Continuous Reasoning [52.4] スライド画像全体に対してトークン効率のよいスケール空間連続推論を可能にするPathCTMを提案する。
PathCTMは診断推論を動的逐次情報追跡として定式化する。
必要な画像パッチの数を95.95%削減し、推論時間を約95.62%短縮し、AUCを劣化せずに維持する。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:57:08 GMT)
QuoVLA: Quotient Space for Vision-Language-Action Models [51.0] VLA(Vision-Language-Action)モデルは、視覚的な観察と言語指示を連続的な行動にマッピングすることで、トレーニング済みのVLM潜伏者をロボット制御に適応させることが一般的である。
VLA の textitQuotient Theory は、事前訓練された VLM 潜伏剤は、アクションに十分ではないがアクションに十分であることを示している。
提案するQuoVLAは,事前学習されたVLMラテントを動作十分表現に圧縮する,VLAの商空間フレームワークである。
論文参考訳(メタデータ) (Sun, 24 May 2026 06:28:53 GMT)
Rejoinder: The ICML 2023 Ranking Experiment: Examining Author Self-Assessment in ML/AI Peer Review [49.4] この記事は、The ICML 2023 Ranking Experiment: Examining Author Self-Assessment in ML/AI Peer Review'のリファインダーである。
i)ピアレビューを統計的推定問題として定式化すること、(ii)アイソトニックメカニズムの展開における公平性と戦略的懸念を緩和すること、(iii)レビュアーランキングや構造化メタデータなどの補完的な信号を組み込むこと、(iv)生成AIの時代におけるピアレビューのための人間中心の枠組みを検討すること、の4つのテーマについて回答をまとめる。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:06:47 GMT)
Adversarial Water-Filling: Theory, Algorithms and Foundation Model [48.0] 周波数と空間上の競合するネットワークリソース割り当て問題は、送信電力とマグニチュードケース干渉の間のミニマックス相互作用として定式化することができる。
本稿では,これらの状況に対する適応型水認識(AWF)理論とアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:37:30 GMT)
X-Foresight: A Joint Vision-Action Causal Forecasting Network via Predictive World Modeling [47.5] 我々は,ビジョン・ランゲージ・アクション・アーキテクチャに直接統合された予測的世界モデルであるX-Foresightを紹介する。
隣接するフレームではなく意味的に離れたチャンクを予測することで、X-Foresightは自明な外挿を逃れる。
総合的な実験により、X-Foresightは計画性能においてVLAベースラインを大幅に上回っていることが示された。
論文参考訳(メタデータ) (Sun, 24 May 2026 06:37:04 GMT)
Discrepancy Minimization Improves Cross-Hospital Robustness in Digital Pathology [46.4] 近年,病理基盤モデル (PFM) は急速に進歩し, 様々な病理組織学タスクの訓練分類を支援する。
ある病院のデータに基づいて分類器を訓練し、別の病院で評価すると、性能は劣化することが多い。
PFMを局所的最大平均誤差(LMMD)で微調整することでこの問題に対処する。
パッチレベルとスライドレベルの両方の実験では、複数のPFMとタスクで一貫した改善が見られた。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:12:20 GMT)
Anarchy in the swarm: Testing informed and uninformed diversity-enhancing mechanisms within PSO framework [45.9] 本稿では,Swarmの社会的・認知的要素を操作する,問題解決型多様性向上戦略のファミリーを紹介する。
多様性向上の有効性は、主にSwarmのダイナミックスにどのように埋め込まれているかによって決定される。
論文参考訳(メタデータ) (Sun, 24 May 2026 14:15:20 GMT)
AION: Next-Generation Tasks and Practical Harness for Time Series [45.1] まず、タスクファイル、ワークスペース、バリデーションインターフェースからなる3つのコンポーネントとして、次世代の時系列タスクを定式化する。
次に、エージェント、スキル、ルール、メモリ、評価、プロトコルの6つのコンポーネントグループから構築された時系列ハーネスであるAIONを紹介します。
このハーネスでは、時間的根拠付け、時間的知識に基づく推論、実験後の分析や階層化レビューなどの信頼性メカニズムの3つの設計原則を用いる。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:42:12 GMT)
Uncertainty-DTW for Sequences and Visual Tokens [43.8] 本研究では,不確実性を考慮した対応をモデル化し,アライメントパスに沿って構造化されたマッチングを行う確率的フレームワークである不確実性認識アライメントを導入する。
我々は、このフレームワークを時間列からトークン化された視覚表現に一般化し、視覚トークンの集合に対する構造化マッチングを可能にする。
これらの知見は、構造化データから学習するための一般的な、堅牢で解釈可能なフレームワークとして、不確実性を考慮したアライメントを確立する。
論文参考訳(メタデータ) (Sun, 24 May 2026 14:49:43 GMT)
Theoretical Analysis of Sparse Optimization with Reparameterization, Weight Decay, and Adaptive Learning Rate [43.4] 本稿では,ReWAと呼ばれるスパース最適化手法を提案する。
CIFAR-10とImageNet with ResNetsの実験では、ReWAが大幅なスパシティ改善をもたらすことが示されている。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:25:17 GMT)
GreenSeg: Ground Segmentation Algorithm for Agricultural Robots in Mediterranean Greenhouses using RGB-D Point Clouds [42.0] GreenSegは、RGB-Dセンシングを使用した自律ナビゲーションのための堅牢な認識フレームワークである。
結果は、GreenSegがベンチマークセグメンテーションメソッドを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sun, 24 May 2026 22:19:38 GMT)
Investigating the Interplay between Contextual and Parametric Chain-of-Thought Faithfulness under Optimization [41.9] CoT(Chain-of-Thought)の忠実さは2つの相反するパラダイムの下で評価される。
モデルを忠実度パラダイムに最適化するための統一された嗜好アライメントインターフェースであるFaithMateを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:16:55 GMT)
Unifying Value Alignment and Assignment in Cross-Domain Offline Reinforcement Learning with Heterogeneous Datasets [41.4] クロスドメインオフライン強化学習(RL)は、ターゲットドメインの限られたデータセットと、動的シフトを示すソースドメインのデータセットを使用して、ターゲットドメインのポリシを学習することを目的としている。
近年の研究では、動的アライメントや値アライメントの観点からデータフィルタリングを行い、効率的なポリシ転送を実現している。
値のミスアサインメントは、値アライメントを損なう可能性を示し、サブ最適サンプルの選択に向けたデータフィルタリングをミスリードし、サブ最適ギャップを緩める。
本稿では,動的アライメント,値アライメント,値アライメントを統合したV2Aを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 04:44:44 GMT)
Courant: a State-Adaptive Perceiver-Based Neural Surrogate with Local Support and Interpretable Field Decomposition [41.1] CourantはPerceiverベースのエンコーダ-デコーダ-サロゲートモデルである。
適応的な特殊化と物理的空間における局所的なサポートを示す潜在的な特徴がある。
我々は、Courantの帰納バイアスが、設計によって解釈可能な潜在バイアスをもたらすことを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 14:55:12 GMT)
First, do no harm: Breaking suicidogenic echo chambers in media recommendation [39.1] RankAidは、予測関連性と共に臨床安全性を優先する再分類手法である。
リスクのある項目を解析し、ユーザの現在の脆弱性レベルに応じて治療内容を高める。
シミュレーションにより,危機ピーク時に有害なコンテンツの推薦をブロックできることが示唆された。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:21:02 GMT)
X-DiffVLA: X-Embodied Diffusion Action Heads for Vision-Language-Action Models [39.0] 本稿では,X-DiffVLA(拡散型VLAモデル)を提案する。
X-DiffVLAは拡散モデルの生成的強度を利用して、クロスボディーデータセットの多様性と潜時相関をキャプチャすることができる。
X-DiffVLAは,それぞれ15.3%,12.5%の改善が得られた。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:41:34 GMT)
Samudra 2: Scaling Ocean Emulators across Resolutions [38.7] 海洋一般循環モデル(OGCM)は気候科学には不可欠であるが、計算コストがかかり、アンサンブルのサイズや強制シナリオが制限される。
改良されたConvNeXtスタイルのブロックとブロック内展開係数を低減したU-Netバックボーンを導入したSamudra 2を提案する。
1円あたりのサムードラ2は、平均気温が0.56ドルから0.87ドルに上昇し、深海温度の誤差を約7倍に減らす。
論文参考訳(メタデータ) (Sun, 24 May 2026 20:17:51 GMT)
ClaimDiff-RL: Fine-Grained Caption Reinforcement Learning through Visual Claim Comparison [38.4] ClaimDiff-RLは、参照条件付き原子クレーム差分をキャプションRLの報酬単位として使用するフレームワークである。
ClaimDiff-RLは幻覚のバランスを改善し、一般的な能力を保ち、いくつかの細粒度キャパビリティー次元のGemini-3-Pro-Previewを超えている。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:22:09 GMT)
Gamified Requirement Elicitation for a Multi-Modal Decision Support System. The Case of SYNCHROMODE [36.9] SynchROMODEは、マルチモーダルの観点からトランスポート操作の管理を改善するためのデータ駆動ICTツールボックスを開発することを目的とした、Horizon Europeプロジェクトである。
本稿では,SynchROMODEツールボックスを通じて提供されるコア相互接続サービスの要件適用フェーズに着目した。
論文参考訳(メタデータ) (Sun, 24 May 2026 18:21:56 GMT)
Meta-Agent: From Task Descriptions to Verified Multi-Agent Systems [36.5] 本稿では,マルチエージェントシステムの自動構築と実行を行う2相フレームワークMeta-Agentを提案する。
本稿では,局所的,上流的,構造的障害を区別する3段階の誤り帰属機構を提案する。
強力なマルチエージェントベースラインとアブレーションスタディに対する実験では、タスク成功率、エラー回復、ワークフロー安定性が一貫した改善が示されている。
論文参考訳(メタデータ) (Sun, 24 May 2026 19:38:54 GMT)
Action with Visual Primitives [36.2] VLA(Vision-Language-Action)モデルは、汎用的なロボット操作のための有望なパラダイムとして登場した。
AVP(Action with Visual Primitives)は、このビジュアルプリミティブ中心のインターフェースを実装したエンドツーエンドアーキテクチャである。
AVP は pi_0.5 よりも 27.61% 向上し,近年の手法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 02:38:35 GMT)
Your Embedding Model is SMARTer Than You Think [34.9] マルチモーダル検索は、リッチでシーケンシャルなトークンシーケンスを単一のグローバル表現に圧縮する単一ベクトルレトリバーに大きく依存する。
SMARTは、標準の単一ベクトルモデルの潜在マルチベクトル能力を解放するフレームワークである。
SMARTの優れたパフォーマンスも明らかにしています。単純な軽量なポストトレーニングは時間と計算時間を節約するだけでなく、ビジュアルドキュメント検索をさらに改善します。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:36:34 GMT)
SEP-Attack: A Simple and Effective Paradigm for Transfer-Based Textual Adversarial Attack [34.6] 転送可能な敵攻撃は、テキストドメインではまだ探索されていない。
本稿では,SEP-Attack というトランスファーベースのテキスト逆攻撃のパラダイムを提案する。
4つのデータセットと2つの実世界のAPIで実施された実験は、SEP-Attackの有効性を検証する。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:15:01 GMT)
Inverting the Shield: Systematically Generating Safety Tests from Policy Specifications [34.4] 我々は、仕様ベースのソフトウェアテストの厳格さをAIの安全性にもたらす新しいフレームワークを紹介します。
POLARISは、構造化されていない自然言語ポリシーを第一次論理表現にコンパイルし、高レベルのルールと具体的なテストケースの間のトレース可能なリンクを確立する。
この形式化により、複雑なポリシー違反シナリオをトラバース可能なパスとしてエンコードするセマンティックポリシーグラフの構築が可能になる。
実験により、POLARISは確立されたベースラインよりも高いポリシーカバレッジとアタック成功数を達成することが示された。
論文参考訳(メタデータ) (Sun, 24 May 2026 05:51:23 GMT)
MinerU-Popo: Universal Post-Processing Model for Structured Document Parsing [34.2] MinerU-Popoは、OCR出力をPast-Processingする軽量フレームワークである。
問題をテキストトランケーション回復、テーブルトランケーション回復、タイトル階層、画像テキスト関連という4つのサブタスクに分解する。
5つのテストされたOCRモデルで、TEDSのタイトル階層を少なくとも20%改善する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:00:28 GMT)
MemMorph: Tool Hijacking in LLM Agents via Memory Poisoning [33.5] LLMエージェントは、ユーザのタスクを完了させるために外部ツールを選択することができる。
本稿では,エージェントの長期記憶を害してバイアスツールの選択を行う最初の攻撃であるMemMorphを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 04:26:13 GMT)
Overview of the PsyDefDetect Shared Task at BioNLP 2026: Detecting Levels of Psychological Defense Mechanisms in Supportive Conversations [33.5] PsyDefDetectについて概説する。情緒的支援対話における心理的防衛機構のレベルを検出するための共有タスクである。
このタスクでは,対象者の発話を,7つの階層的防衛メカニズムレーティング尺度(DMRS)レベルと2つの補助ラベルの9つのカテゴリの1つに分類するようシステムに求めている。
最良のシステムは0.420のマクロF1スコアを達成し、データセットで報告された最強の微調整ベースラインを顕著な差で上回った。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:17:54 GMT)
TSFMAudit: Data Contamination Auditing in Forecasting Time Series Foundation Models [32.4] 時系列基礎モデル(TSFM)は、大規模なコーパスで事前訓練されることが多くなり、事前訓練中に評価データセットが露出した可能性があるという懸念が高まっている。
本研究は, TSFMの事前汚染監査に関する最初の研究である。
本研究では、プローブ適応力学に基づくTSFMAuditを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 14:59:12 GMT)
WorldCraft: From Camera Navigation to Object Manipulation in Interactive Video World Models [32.3] カメラナビゲーションからオブジェクトレベルのトラジェクトリアクションまで,インタラクティブなビデオワールドモデルを拡張するフレームワークであるWorldCraftを紹介する。
ユーザクリックとスケッチされたパスが与えられたら、WorldCraftは、選択したオブジェクトが所定の軌跡に従う将来のフレームを生成する。
実験により、WorldCraftは正確なオブジェクト制御を可能にし、カメラのみの評価の下でビデオベースのワールドモデルのカメラ忠実性を保ち、長期の自己回帰ロールアウトでオブジェクト状態を維持することが示されている。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:40:42 GMT)
Adversarial Error Correction for Visual Autoregressive Generation [32.1] 本稿では,事前学習したVisual Autoregressive(VAR)モデルを拡張するプラグイン・アンド・プレイフレームワークを提案する。
標準的な受動的生成の代わりに、AID-moreは、GANの敵対的フィードバックにインスパイアされた能動的誤り訂正機構を導入する。
その結果、AID-moreはよりシャープなテクスチュラルな詳細と、無視できるオーバーヘッドを伴う構造歪みを少なくすることを示した。
論文参考訳(メタデータ) (Sun, 24 May 2026 03:22:22 GMT)
AOEPT: Breaking the Implicit Modality-Reduction Bottleneck in Modality-Missing Prompt Tuning [31.9] トレーニングデータからグローバルなモダリティの優先順位を抽出するModal-Conized Prompts(MCPs)を紹介する。
MCPはインスタンス認識プロンプトにインスタンス化され、各サンプルの欠落モード情報を選択的に増強する。
様々なマルチモーダルベンチマークとバックボーンの実験により、AOEPTの強い性能が確認された。
論文参考訳(メタデータ) (Sun, 24 May 2026 02:04:44 GMT)
X-Edit: Exact, Explicit, and Explainable Null-Space Editing for Medical Vision Transformers [31.6] 医用画像分類のための事前訓練型ビジョントランスフォーマー (ViT) がますます普及している。
ダイナミックな臨床シナリオにおける、避けられない障害ケースの修正は、重大な課題となる。
本稿では,効率的なnull空間モデル編集フレームワークであるX-Editを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:22:23 GMT)
RealBench: Benchmarking Data-Driven Numerical Weather Forecasting Under Operational Conditions and Extreme Event Challenges [31.4] 本稿では,AI天気予報のための次世代ベンチマークであるRealBenchを紹介する。
RealBenchは、データ漏洩をなくし、最近の大気環境を捉えるために、2025年ごろに展開された、厳密にアウト・オブ・ディストリビューションテストのセットを特徴としている。
ローレイテンシな運用分析や,10,000以上のステーションで構成される大規模グローバルなその場観測データセットなど,複数のデータソースを統合している。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:46:17 GMT)
LLM-as-a-Judge in Healthcare: A Scoping Analysis of Applications, Methods, and Human Alignment [29.5] 大規模言語モデル(LLM)は、臨床ドキュメント、診断推論、医学勧告、医学教育など、医療分野にまたがる展開が増えている。
LLMs-as-a-Judgeは、スケーラブルな代替手段を提供し、臨床評価にますます利用されているが、医療におけるその妥当性は依然として過小評価されている。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:59:32 GMT)
Spiking the training data to correct for test set contamination [28.9] そこで本研究では,テスト例を意識的に既知の速度で汚染することにより,トレーニングデータをスパイクする手法を提案する。
スパイクされた例は、インフレーションされたテストスコアの統計的補正を可能にするモデル記憶の予測器の校正に使用することができる。
論文参考訳(メタデータ) (Sun, 24 May 2026 02:06:59 GMT)
Hide to Guide: Learning via Semantic Masking [28.6] 本稿では,エキスパート誘導RLVRのためのセマンティックマスキング戦略を提案する。
SMEPOは、トレースを粗く切り刻む代わりに、重要な経路に沿って報酬関連セマンティックスをマスクする。
GRPよりも最大3.2ポイントの精度向上を実現し、トレーニング時間を最大4.2倍に短縮する。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:59:06 GMT)
Towards a Universal Causal Reasoner [26.8] 我々はPearlのCausal Ladderにまたがる18の因果クエリタイプに対処するデータ生成フレームワークUniCoを提案する。
UniCoは正確な因果推論で回答を根拠とし、推論ショートカットでケースをフィルタリングする。
We show that UniCo-trained models showed consistent to faithful reasoning traces, out out the base model by average of 20.2% in faithfulness metrics。
論文参考訳(メタデータ) (Sun, 24 May 2026 05:28:39 GMT)
Fishbone: From One 3D Asset to a Million Controllable Edits [26.6] Fishboneは一般的な形状のための統一されたrib-spine表現であり、制御可能なパラメトリックメッシュ、縮小空間力学、アニメーションをサポートする。
リブは厚さ、方向、断面の変化などの局所的なプロファイルを制御し、スピンはグローバルな曲げ、ねじれ、伸びを制御する。
さらに,Hunyuan3Dをリブスピン構造で拡張することで魚骨136Kを構築し,ロボット学習,インタラクティブメッシュ編集,エージェント生成における制御可能な3D生成,変形に基づくデータ拡張への応用を実証する。
論文参考訳(メタデータ) (Sun, 24 May 2026 01:38:43 GMT)
ConFi-GS Confidence-Guided High-Frequency Injection for 3D Gaussian Splatting Super-Resolution [25.7] 十分でない高周波観測は、ぼやけたテクスチャ、弱い境界、およびビュー一貫性のない詳細をもたらす。
既存のアプローチでは、超解像誘導を一様に適用するか、主に幾何サンプリングに基づく拡張領域を適用している。
低分解能3DGS再構成のための信頼性を考慮した周波数モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:30:14 GMT)
Cross-Domain Energy-Guided Diffusion Generation for Off-Dynamics Reinforcement Learning [25.5] オフラインのオフライン強化学習は、大規模なソースデータセットと限られたターゲットデータセットからターゲットドメインポリシーを学ぶことを目指している。
我々は,クロスドメインエネルギー誘導拡散ゲネレーションフレームワークであるCEDGEを提案する。
CEDGEは、ソースドメイントラジェクトリ上で軌道拡散モデルを訓練し、エネルギー誘導により生成されたサンプルをターゲットドメインに適応させる。
論文参考訳(メタデータ) (Sun, 24 May 2026 01:44:57 GMT)
RouteScan: A Non-Intrusive Approach to Auditing MoE LLMs Safety via Expert Routing Telemetry [24.7] 我々は、専門家のルーティングテレメトリを通して有害な行動を検出する非侵襲的な監査フレームワークであるRouteScanを提案する。
RouteScanは、未確認の有害ドメインで0.93以上、新しいジェイルブレイクラッパーで0.96以上、強力な一般化を実現している。
論文参考訳(メタデータ) (Sun, 24 May 2026 02:06:44 GMT)
Interpretability Transfer from Language to Vision via Sparse Autoencoders [24.5] スパースオートエンコーダ(SAE)を用いた言語モデル解釈の最近の進歩は、視覚領域に効果的に翻訳されていない。
SAE Transfer Alignment (VISTA) は,LLaVAスタイルの視覚言語モデルにおいて,言語から視覚へ解釈可能性を伝達するフレームワークである。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:47:36 GMT)
Faithfulness Metrics Don't Measure Faithfulness: A Meta-Evaluation with Ground Truth [24.2] 思考の連鎖(CoT)は、大規模言語モデルの解釈と監査行動の中心となっている。
ステップレベルとCoTレベルの両方で、地道忠実度ラベルを出力する自動ラベリングパイプラインを開発した。
実験の結果,ほとんどの測定値が近い確率で動作し,予測バイアスが強く,CoTが長くなると劣化することがわかった。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:57:01 GMT)
Beyond the Target: From Imitation to Collaboration in Speculative Decoding [23.6] 投機的復号(SPD)は、より小さなドラフトモデルに、より大きなターゲットモデルによって並列に検証される複数の将来のトークンを提案することによって、大きな言語モデル(LLM)推論を加速させる。
支配的なSPDパラダイムは、ターゲットモデルを唯一信頼できる教師として扱い、ターゲット予測と正確に一致する場合にのみドラフトトークンを受け入れる。
我々は、SPDの一般化である textbfCollaborative Decoding (CoSpec) を導入し、ターゲットモデルを唯一のトークンレベルの権威として扱わなくなった。
論文参考訳(メタデータ) (Sun, 24 May 2026 00:34:53 GMT)
NeurIPS: Neuro-anatomical Inductive Priors for Sphere-based Brain Decoding [23.2] 現在のfMRIデコーダは、効率的なIDエンコーダが幾何学的に忠実な表面ベースモデルよりも優れている性能-忠実トレードオフに直面している。
このフレームワークは,解剖学的変化をニュアンスから強力なインダクティブ前へ反映することで,表面のデコーディングを改善する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:45:05 GMT)
HCL-FF: Hierarchical and Contrastive Learning for Forward-Forward Algorithm [23.0] 深層ニューラルネットワークのための階層的でコントラッシブな学習フレームワーク(HCL-FF)を提案する。
HCL-FFは、低レベルのキューから高レベルのセマンティクスへの表現をガイドする粗大な階層的学習戦略を導入している。
CIFAR-10、CIFAR-100、Tiny-ImageNetの実験では、HCL-FFがFFベースの手法で新しい最先端性能を実現することを示した。
論文参考訳(メタデータ) (Sun, 24 May 2026 00:48:13 GMT)
SimuWoB: Simulating Real-World Mobile Apps for Fast and Faithful GUI Agent Benchmarking [23.0] SimuWoBは、さまざまなタイプと難易度にまたがる120の課題タスクを備えた、モバイルGUIエージェントのための完全な総合ベンチマークである。
我々は高忠実度タスクと環境を合成する堅牢な仮想環境生成フレームワークを構築した。
我々は、最先端のモバイルGUIエージェントについて包括的な実験を行う。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:33:14 GMT)
Clustering as Reasoning: A $k$-Means Interpretation of Chain-of-Thought Graph Learning [22.8] CoT(Chain-of-Thought)プロンプトは,テキスト分散グラフ(TAG)上での大規模言語モデル(LLM)の推論能力の向上を約束している。
この作業は、クラスタリングの原則を推論として、CoTベースのグラフ学習を再設計し、グラフ構造化データ上で反復的推論がどのように動作するかを、$k$-meansで解釈する。
論文参考訳(メタデータ) (Sun, 24 May 2026 04:58:44 GMT)
Security in the Fine-Tuning Lifecycle of Large Language Models: Threats, Defenses,Evaluation, and Future Directions [21.0] 本稿では,大規模言語モデルの微調整セキュリティに関する体系的な調査を行う。
攻撃と防御を比較するライフサイクルベースのフレームワークを確立する。
我々は、重要なオープンな問題(構成ロバスト防衛、異相防衛構成、行動仮定を超えた埋め込み空間攻撃)を特定し、具体的な今後の研究方向性を提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:34:47 GMT)
Metropolis-Scale Resilient and Trustworthy Traffic Flow Inference Using Multi-Source Data [20.7] Task-Aware Attentive Neural Process (TA-ANP)は、信頼できるグローバルトラフィック状態推論(GTSI)のための統合フレームワークである。
不確実性定量化のために、我々はニューラルプロセスとモンテカルロ・ドロップアウトを組み合わせることで、アレタリックと不確実性の両方を捉える。
TA-ANPは、決定論的および確率論的指標の下で、すべてのサブタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 24 May 2026 11:12:02 GMT)
AI Cartography: Mapping the Latent Landscape of AI Benchmark Ecosystems [20.2] AIベンチマークエコシステムの潜伏状況を測定するためのフレームワークを紹介します。
The Open LLM Leaderboardから4000以上のモデルに確認因子分析(CFA)と一般化可能性理論を適用して、ランキング分散の源泉を分解する。
ベンチマークランキングをどのように信頼するか、ベンチマーク設計をどのように改善できるかを判断するために、実行可能な診断を提供する。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:59:08 GMT)
STREAM: A Data-Centric Framework for Mining High-Value Task-Oriented Dialogues from Streaming Media [20.2] 大規模に高価値なサービス対話を合成するデータ中心のフレームワークであるStreamを提案する。
ストリームマイニングはノイズの多いストリームからの真のインタラクション信号を抽出し、ロールグラウンドのペルソナ構造を統合することで会話を合成する。
Streamをベースに、Automotive、Restaurant、Hotelをカバーする大規模なデータセットであるStreamDialをリリースしています。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:44:15 GMT)
AstroRAG -- A Pagerank-Based Retrieval-Augmented Generation Pipeline for Question Answering in Astronomy [19.8] 天文学における質問応答に適応したPageRankベースの検索拡張生成(RAG)パイプラインであるAstroRAGを提案する。
RAGは、外部証拠の回答を根拠にして、事実の誤りを軽減します。
RAG強化Mistralはtextbf79.49%の精度と textbf79.49%のF1スコアを達成し、RAG以外の性能をほぼ倍増させた。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:34:49 GMT)
Re-defining Humor Data Objects for AI Humor Research [19.5] 我々は、ユーモアの概念を文脈や説明との社会的相互作用として探求する。
一般市民に有効なユーモアの説明をLCMに促す方法を開発した。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:05:28 GMT)
Large Language Model Selection with Limited Annotations [19.0] 我々は,Large Language Models (LLM) のアクティブモデル選択のための最初のフレームワークである SELECT-LLM を開発した。
本稿では,候補モデル出力間のペアの類似性から計算した,予測情報ゲインに基づくクエリ選択ルールを提案する。
我々は,SELECT-LLMを23のデータセット,156のモデル,多様なタスクファミリ,複数のテキスト評価指標で評価した。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:18:51 GMT)
Integrated photon-pair sources on periodically poled thin-film lithium tantalate [18.5] 薄膜タンタル酸リチウムのSPDCによる光子対生成は、まだ実証されていない。
周期的にポーリングされたレーストラック共振器では、テレコムCバンドとLバンドにまたがる広い量子周波数コムをマッピングする。
これらの結果は、$$統合プラットフォーム間の最先端技術と競合する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:29:10 GMT)
Latent Q-Barrier Shielding for Safe In-Context Reinforcement Learning [18.3] 我々は、コンテキスト表現、潜伏ダイナミクス、およびデプロイ前のアンサンブルコスト批判を学習する潜伏Qバリアシールドを提案する。
Q-Barrier-satisfying アクションは次の潜伏予算状態に留まり、学習評論家の下でほぼ予算が安全である。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:45:28 GMT)
Learning Treatment Effects during Resource Allocation via Priority-Queue Randomization [18.0] 本研究は,治療効果を学習し,最も必要な治療を施すための実験的な設計枠組みを開発する。
優先度の高い順序でキューに処理が提供され、予算が使えるようになると、キュー内でファースト・イン・ファーストアウトされる。
このプロセスでは, 設計によって誘導される処理の割り当てに依存するが, 通常のイド効率境界は良好に調整されていることを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:01:17 GMT)
Knowing but Not Showing: LLMs Recognize Ambiguity but Rarely Ask Clarifying Questions [17.7] 曖昧であいまいであいまいな質問のモデルを3つの設定で評価する。
モデルは、明示的に判断するよう要求されたときに曖昧さを識別することが多いが、QA設定では、圧倒的にデフォルトで答えを指示する。
論文参考訳(メタデータ) (Sun, 24 May 2026 22:36:58 GMT)
Memory-Induced Tool-Drift in LLM Agents [16.8] メモリに格納されたパーソナリティ駆動バイアスは、適用できないコンテキストにおけるツールコールに静かに影響する。
機械的に、バイアスドメモリは暗黙のステアリングベクトルとして働き、明示的な行動指示と同じ潜在方向に沿ってアクティベーションをプッシュする。
エージェントがユーザの代理として連続的なアクションを取るようになると、メモリ誘発ツールドリフトは体系的な脆弱性を表す。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:41:39 GMT)
BFS: Back-to-Front Layered Image Synthesis via Knowledge Transfer [16.7] 階層化された画像合成は、制御可能で創造的な編集に有望な方向です。
階層化画像合成のための世代ベースフレームワークであるBFSを提案する。
我々は,BFSが高品質な階層画像を生成することを示し,従来手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 06:46:52 GMT)
On the Epistemic Uncertainty of Overparametrized Neural Networks [16.6] てんかんの不確実性はしばしば、データの増加とともに消滅する再現可能な不確実性と見なされる。
過度にパラメータ化されたニューラルネットワークでは、モデルパラメータは一般的に対称性と冗長表現のために識別できない。
論文参考訳(メタデータ) (Sun, 24 May 2026 19:39:29 GMT)
DUEL: Adversarial Self-Play for Multimodal Reasoning [16.6] 視覚言語モデル(VLM)の推論能力向上のための効果的なパラダイムとして強化学習(RL)が登場した。
本稿では,同じ事前学習VLMから生じる2つのポリシー間の対立的相互作用から,監督が出現する自己進化的ポストトレーニングフレームワークDUELを提案する。
実験によると、DUELは人間のアノテーション、外部報酬モデル、画像編集ツールを使わずに、視覚的推論と堅牢な識別を一貫して改善している。
論文参考訳(メタデータ) (Sun, 24 May 2026 00:38:26 GMT)
A Geometric Gaussian Mixture Representation of Plane Curves [16.5] 平面曲線に対するユーザ定義確率多角形表現を導入する。
各セグメントは、通常方向のユーザ定義の不確実性パラメータを備える。
標準平面曲線の集合の実験により、GMMは局所接線、局所正規線、局所弧長を捉えることが示されている。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:19:27 GMT)
TinyFormer: Preserving Tiny Objects in YOLO-DETRHybridReal-time Detectors [16.4] YOLOシリーズとDETRベースの検出器は、小さな物体検出に苦労する。
TinyFormerは、ViT表現、NMSなしのセット予測、YOLOスタイルのピラミッドネックを組み合わせたリアルタイム検出器である。
TinyFormerは、最近のYOLOシリーズ検出器と強力なDEIMv2ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:42:13 GMT)
Active Learning for Stochastic Contextual Linear Bandits [16.0] 文脈線形帯域の鍵となる目標は、ほぼ最適ポリシーを効率的に学習することである。
本稿では,コンテキスト-アクション対の報酬を戦略的にサンプリングすることで,ほぼ最適ポリシーを学習するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 01:25:09 GMT)
Estimating Mixture Distributions via Stochastic Mirror Descent [15.6] 本研究では, クロスエントロピー損失を最小化する混合モデルを用いて, サンプルから未知分布を推定する問題を再検討する。
ミラー降下(SMD)アルゴリズムから導出した推定器群を提案する。
軽度条件下では,提案した推定器がほぼ最適収束率を達成することを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:19:42 GMT)
Inference-Time Alignment of Diffusion Models via Trust-Region Iterative Twisted Sequential Monte Carlo [15.1] 拡散に基づく生成モデルの推論時間アライメントについて検討する。
SMCに基づく推論時間アライメントにおけるツイスト機能学習のための信頼領域フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:08:52 GMT)
SMDD-Bench: Can LLMs Solve Real-World Small Molecule Drug Design Tasks? [14.9] LLMエージェントは、科学的な発見の応用に驚くべき可能性を持っている。
現在の評価手法はアドホックであり、現実世界の発見にはあまりにも単純すぎる。
オープンでクローズドな7つの LLM をベンチマークし、最も高性能な LLM である GPT5.4 さえも、40.2% のタスクしか解決していないことを発見した。
論文参考訳(メタデータ) (Sun, 24 May 2026 00:44:41 GMT)
Bridging the Gap: Enabling Soft Actor Critic for High Performance Legged Locomotion [14.7] Soft Actor-Criticは、過去の経験を再利用できる非政治的なアルゴリズムである。
これは、シミュレーションと実際のロボットのオンライン学習の両方で同じアルゴリズムを使用できる、擬似現実移動の自然な候補である。
この研究は、このギャップの根本原因を特定し、SACが安定して大規模にトレーニングできるような、ターゲットとなる修正を導入する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:04:11 GMT)
Clarification Is Not Enough: Post-Clarification Answering Remains the Bottleneck in Multi-Turn QA [14.5] 課題を2つの要素に分解することで,多ターン質問応答における選好誘導の問題について検討する。
PACIFICベンチマークを用いて、教師付き微調整が明確化ポリシーを急速に改善することを示したが、モデルが正しい動作を取る場合でも、最終的な解答精度は著しく低いままである。
論文参考訳(メタデータ) (Sun, 24 May 2026 18:06:09 GMT)
Three-Step Conditional Diffusion 3D Reconstruction for Light-Field Microscopy [14.5] 光電場顕微鏡は、生体サンプルから多角情報の単一撮影を可能にする。
伝統的な物理学に基づくアルゴリズムは、しばしば空間分解能の制限、重い人工物、高い計算コストに悩まされる。
LFMのための高忠実度三段条件拡散(TCD)3次元再構成法を提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:16:35 GMT)
Mitigating Gradient Pathology in PINNs through Aligned Constraint [14.4] PINNは部分微分方程式(PDE)を解くのに強力である
彼らのトレーニングは、しばしば勾配病理学によって麻痺する。
本稿では,勾配衝突を緩和する制約付き損失軽減手法を提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:58:12 GMT)
VEOcc: Voxel-Centric Online Semantic Occupancy Prediction For Embodied Scene Understanding [14.4] 本稿では,認識・同化パラダイムとして定式化されたボクセル中心のフレームワークVEOccを提案する。
VEOccは、初期スケール推定の必要性をなくすことで、高度に合理化され、オープンな地図展開を可能にする。
Occ-ScanNetとEmbodiedOcc-ScanNetの実験では、VEOccがローカル設定とエンボディ設定の両方で新しい最先端のパフォーマンスを確立することが示されている。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:10:43 GMT)
Gait2Hip-60: A Unified Deep Learning Benchmark for Predicting Hip Muscle Forces and Joint Moments from Multi-Cadence Gait Kinematics [14.2] 歩行中の股関節筋力と関節モーメントの推定は、典型的には筋骨格シミュレーションに依存する。
本研究では,下肢歩行運動学から直接これらのヒップダイナミックスパラメータを予測するためのディープラーニングフレームワークを開発した。
論文参考訳(メタデータ) (Sun, 24 May 2026 14:00:42 GMT)
Learning from Semantic Dictionaries: Discriminative Codebook Contrastive Learning for Unified Visual Representation and Generation [13.9] 識別的および生成的視覚モデルはそれぞれの領域で優れるが、意味的に不一致である。
本稿では,このギャップを埋める自己教師型フレームワークであるLEASEを紹介する。
ImageNet-1Kでは、LEASEは最先端の統一的なパフォーマンスを実現し、以前のVQGANベースの手法よりも優れている。
論文参考訳(メタデータ) (Sun, 24 May 2026 11:32:30 GMT)
CoRe-Code: Collaborative Reinforcement Learning for Code Generation [13.7] 大規模言語モデル(LLM)はコード生成において高いパフォーマンスを達成しているが、ほとんどのメソッドはグローバル計画なしで自動回帰デコーディングに依存している。
エージェント間協調を強化し,より正確かつ効率的なコードを生成する,特殊なLLMエージェントのためのフレームワークである協調強化コード(CoRe-Code)を提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 01:47:30 GMT)
Checking Fact with Better Retrieval: Dynamic Contrastive Learning for Evidence Retrieval [13.5] 既存の一般的なマルチモーダル検索手法は、しばしば意味論に基づいて構築される。
本稿では, DACLR と呼ばれる証拠の textbfRetrieval に対する textbfDynamic textbfAdaptive textbfContrastive textbfLearning 法を提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:10:19 GMT)
T2S-MPC: Time-Embedded Online Adaptive Model Predictive Control for Time-Varying Dynamics [13.5] オンライン上で残留力学モデルを適応的に学習し,MPCフレームワーク内の名目モデルと統合するフレームワークであるT2S-MPCを提案する。
可変時間外乱下での安定化・軌跡追従作業における2次元四重極体に対する提案手法の評価を行った。
実験結果から,T2S-MPCは従来型MPC,神経型MPC,アブレーション型をコントロール性能において一貫して優れていた。
論文参考訳(メタデータ) (Sun, 24 May 2026 04:00:52 GMT)
Algorithms with Polynomially-Improved Approximation Factors for the $2 \rightarrow q$ Norm, and Applications [13.4] mathbbRn times d$ の行列 $X の 2 つの右幅 q$ノルムは $lVert X rVert_2 rightarrow q = sup_lVert v rVert = 1 lVert Xv rVert_q$ と定義される。
FOCS(Exponential Time hypothesis)を仮定すると、単純なスペクトルアルゴリズムは2sqrtlog n$よりも近似係数がよいことを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 23:56:06 GMT)
MemMark: State-Evolution Attribution Watermarking for Agent Long-Term Memory Systems [13.1] メモリベースのエージェントは、リークされたスナップショットや移行されたスナップショットを生き残るための証明を必要とする。
MemMarkは、オーナー制御シグナルを潜在メモリ書き込み決定に埋め込む。
MemMarkは、生き残ったトレース、信頼できるメタデータ、ユーティリティ劣化のない長期的なエージェントメモリで実現可能である。
論文参考訳(メタデータ) (Sun, 24 May 2026 11:04:35 GMT)
Is VLA Reasoning Faithful? Probing Safety of Chain-of-Causation in Autonomous Driving Models [13.1] 我々は,100種類の物理AI-AVシナリオを対象とした300個のAlpamayo-R1-10B推論を解析した。
全体的な推論の忠実さは42.5%に過ぎず、カオス・オブ・カウセーションのマッチングシーンの現実は半分以下である。
我々は、信頼度情報理論を定式化し、検証基準付きでエンティティとアクションの忠実度を定義し、これらの結果に沿った4成分安全アーキテクチャを概説する。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:03:27 GMT)
Optimizing Multidimensional Scaling in Gini Metric Spaces [13.0] 我々は、微調整可能なハイパーパラメータに依存する値とそのランクに基づく擬似距離を導入する。
Gini MDSはノイズや外れ値に対して堅牢であることが示されており、現実世界のアプリケーションにも適している。
textttPyTorchのテンソルベースの実装は、textttsklearnライブラリの標準MDSと比較してGPUアクセラレーションと効率的な計算を提供する。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:10:33 GMT)
They Are Not the Same: Direct Causes Are Not Grounded Emotion Explanations [12.9] Emotion-Cause Pair extract (ECPE) は、なぜ感情が生じるのかを説明するために導入された。
このプロキシは直接的な原因抽出に有用であるが、感情の説明を根拠とした証拠として読み過ぎやすい。
IEMO-MECPでは、原陽性の90.9%はエモ因性であり、原陰の95.0%は非ペア性である。
論文参考訳(メタデータ) (Sun, 24 May 2026 18:16:13 GMT)
OSDTW: Optimal Shared Depth and Task Weighting for Long-Tailed Recognition [12.9] 長い尾の認識は、絶え間なく頭尾のトレードオフに悩まされる。
本稿では,従来の単一ラベル認識問題をヘッドタスクとテールタスクに分割する,基本的タスク分割フレームワークを提案する。
結果のKullback-Leibler分散に基づく一般化誤差は、加法定数までのタスクワイズ項の和として記述できることを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:48:02 GMT)
Inference Time Optimization with Confidence Dynamics [12.8] 正しい回答の痕跡は時間とともに信頼性の向上を示す傾向を示し、誤った回答の痕跡は推論が進むにつれて弱まるか、信頼が低下することを示している。
本稿では,信頼度動的利得(CDG)に基づく投票法を提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 20:04:19 GMT)
SEED: Semi-supervised Continual MalwarE Detection for Tackling ConcEpt Drift on a BuDget [12.7] 機械学習ベースのマルウェア検知器は、良性およびマルウェアアプリケーションにおける概念の漂流により、時間が経つにつれて時代遅れになっている。
近年の手法は、完全ラベル付きデータに依存し、階層的コントラスト損失(HCL)とアクティブラーニングを用いてドリフトに対するロバスト性を改善する。
限定的な監視下でのマルウェア検出のための意味構造に依存しないSEEDを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:04:01 GMT)
Benchmarking and Improving Monitors for Out-Of-Distribution Alignment Failure in LLMs [12.5] 大規模言語モデル(LLM)の安全性とアライメントの失敗の多くは、アウト・オブ・ディストリビューション(OOD)の状況に起因する。
LLMモニタリングパイプラインが、MOOD(Misalignment Out Of Distribution)と呼ばれるベンチマークを導入することで、これらのOODアライメント障害を検出することができるかどうかを系統的に検討する。
ガードモデルとマハラノビス距離と複雑度に基づくOOD検出器を組み合わせることで,リコールを39%から45%に改善できることがわかった。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:06:51 GMT)
Divide-and-Conquer Inference for Large-Scale Visual Recognition with Multimodal Large Language Models [12.5] Divide-and-Conquer Inference (DCI)はMLLMを用いた視覚認識のための新しいテスト時間スケーリング戦略である。
DCIは、複雑なグローバルな分類タスクを、より単純で局所化されたサブプロブレムに分解し、探索空間を圧縮するために動的プルーニング機構を使用する。
モデルに依存しないプラグアンドプレイのパラダイムとして、DCIは大規模なシナリオでMLLMの推論精度をスケールするための効率的なアプローチを提供する。
論文参考訳(メタデータ) (Sun, 24 May 2026 01:07:05 GMT)
Leveraging Gauge Freedom for Learning Non-Gradient Population Dynamics of Stochastic Systems [12.2] 連続性方程式の弱い定式化を用いて,非段階的な集団動態を推定するアルゴリズムを提案する。
このより一般的なアプローチは、勾配制限された基底線上の分布精度を改善する。
論文参考訳(メタデータ) (Sun, 24 May 2026 14:48:44 GMT)
A Principled Self-Referenced Early Stopping Approach for Deep Image Prior [12.0] 劣化画像の2つの独立ノイズコピーが利用可能である場合に、ほぼ最適なDIP早期停止が達成できることを示す。
本稿では、擬似自己参照画像の構築に基づく過適合検出フレームワークを提案し、3つのIP固有アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 23:35:13 GMT)
Lifted Schrödinger Bridges for Gaussian Mixture Endpoints: Projection Gaps and Path-Space Obstructions [11.8] ブラウンの先行力学下でのガウス-混合終端分布間の密度制御について検討した。
我々は,投射限界流に付随する後方平均マルコフドリフトを導出し,運動エネルギー上界を証明し,投射ギャップが明らかになる共通経路電位条件を同定する。
論文参考訳(メタデータ) (Sun, 24 May 2026 00:38:29 GMT)
Learning High-Frequency Continuous Action Chunks in Latent Space [10.3] 現代のロボット政策は、物理世界で複雑なタスクを実行するためにアクションチャンキングにますます依存している。
このような高頻度では、ポリシーはしばしば時間的に滑らかで空間的に整合性のあるアクションを生成するのに失敗する。
変動オートエンコーダ(VAE)を用いた高周波行動学習を動作空間から潜時空間にシフトすることで、この問題に対処する。
この定式化は、高周波制御の時間的および空間的整合性を著しく改善する。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:22:14 GMT)
By Their Fruits You Will Know Them: Comparing Formalizations of Law by the Decisions They Encode [9.9] 本稿では, 個別の事例に対する推論により, 同一の法的規定の異なる形式化を比較する方法を提案する。
プロビジョニングの複数の形式化が与えられた場合、ノードレベルでマッチングし、マッチングから各ペアの共有インターフェースを導出し、SATソルバを使用して、任意の2つの形式化が一致しないエッジケースを列挙する。
選択されたエッジケースは、法的専門家が検証し実行できる具体的な事実シナリオに言語化されます。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:31:31 GMT)
BED-SAM2: Boundary-Enhanced-Depth SAM2 via Monocular Geometric Priors [9.6] 本研究は境界拡張深さ(BED)-SAM2を紹介する。
SAM2 Hieraエンコーダアーキテクチャは、RGB画像からの単分子深度情報を直接エンコードするように修正されている。
BED-SAM2は5つの訓練エポックしか持たない、複数の正当性と偽装されたオブジェクト検出タスクにまたがる、最先端の競争力を示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 06:41:18 GMT)
Self-Balancing Gradient Allocation for Heterogeneity-Aware Feature Generation in Click-Through Rate Prediction [9.5] HeteGenCTRは、デノナイジングネットワークと共同で訓練されたフィールド毎の学習困難パラメータを通じて、生成困難不均衡を解決する。
5つのCTRベンチマークと7日間のオンラインA/Bテストの実験は、最先端のベースラインよりも一貫した統計的に重要な改善を示している。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:27:31 GMT)
Selective Test-Time Compute Scaling for Click-Through Rate Prediction via Uncertainty-Triggered Feature Path Exploration [9.5] テスト時間計算のスケーリングは言語モデルに非常に効果的であることが証明されているが、この機会は産業用クリックスルーレート(CTR)予測では探索されていない。
UTTSI(Uncertainty-Triggered Test-Time Selective Inference)は、トレーニング不要なモデルに依存しないフレームワークで、推論深度をインスタンスごとの不確実性に比例して拡張する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:29:10 GMT)
A Decentralized LiDAR-SLAM System with Certifiably Optimal Pose Graph Optimization [9.5] 本稿では,PGOバックエンドを組み込んだ分散化LiDAR-SLAMシステムを提案する。
提案手法は,現状のSLAMと比較して,軌道RMSEを最大48.9%向上させ,優れたロバスト性を実現することを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:50:53 GMT)
PANDO: Efficient Multimodal AI Agents via Online Skill Distillation [9.3] 単ロールのオンラインスキル蒸留フレームワークであるPANDOを紹介します。
910のVisualWebArenaタスクの完全なセットで、PANDOは58.3%の成功率を達成した。
300タスクのアブレーションは、ルールとルーチンがほとんどの成功をもたらすことを示している。
論文参考訳(メタデータ) (Sun, 24 May 2026 00:07:25 GMT)
READER: Reasoning-Enhanced AI-Generated Text Detection [9.3] 我々は、人間/AIラベルと、その決定の証拠を記述した構造化された根拠の両方を出力する推論強化AIテキスト検出器であるREADERを提案する。
このアプローチの重要なコンポーネントは、合理性と判断のキュレートされた監視セットであるREADです。
READERは既存の検出器を一貫して上回り、高容量のLDMベースラインを誘導する。
論文参考訳(メタデータ) (Sun, 24 May 2026 22:26:23 GMT)
Self-Supervised Contrastive Learning for Cardiac MR Sequence Classification [9.2] 自己アテンション機構を利用した視覚変換器(ViT)モデルは、堅牢な一般化能力を実証している。
画像に基づく自己教師付きコントラスト学習を利用した適応戦略を提案する。
適応型モデルでは、AUC 0.75が4つの最も一般的な心MRシークエンスにまたがる分類を達成している。
論文参考訳(メタデータ) (Sun, 24 May 2026 00:24:50 GMT)
Repeated Sequences Reveal Gaps between Large Language Models and Natural Language [8.9] GPT生成したテキストは,モデルサイズによる推定指数の体系的および統計的に有意な変化を示す。
これらの結果から, 反復列エントロピーは定量的構造診断に有効であることが示唆された。
論文参考訳(メタデータ) (Sun, 24 May 2026 03:49:20 GMT)
CONF-KV: Confidence-Aware KV Cache Eviction with Mixed-Precision Storage for Long-Horizon LLM [8.8] ステップごとのキャッシュ予算を選択するKVキャッシュマネージャであるConF-KVを紹介する。
トークンは、蓄積された注目質量と相対性の複合物によってランク付けされます。
75のVisualWebArenaタスクでは、全KV成功の95.3%をピークメモリの2.8倍に維持する。
論文参考訳(メタデータ) (Sun, 24 May 2026 00:15:34 GMT)
DarkForest: Less Talk, Higher Accuracy for Multi-Agent LLMs [8.8] 我々はダークフォレストという制御通信協調フレームワークを提案する。
DarkForestはエージェントを独立に保持するため、各エージェントは他のエージェントの出力を見ることなく回答を生成する。
実験によると、DarkForestは全体的な品質をリードし、ベンチマーク指標で最強のベースラインを最大30.7%改善し、通信量の多いベースラインと比較してトークンの消費を最大6.5倍削減している。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:34:27 GMT)
Manifold-Constrained MPPI: Real-Time Sampling-Based Control Under Hard Constraints [8.7] Manifold-Constrained MPPI (MC-MPPI) はリアルタイムサンプリングベースの制御フレームワークである。
MPPIの計算上の利点を保ちながら、多様体ベースの等式制約を強制する。
シミュレーションと実世界の両方の環境で14-DoFクローズドチェーンのデュアルアームシステムの実験は、MC-MPPIが安定して100Hzで動作することを示した。
論文参考訳(メタデータ) (Sun, 24 May 2026 01:57:18 GMT)
EnThM: Energy Theft Mitigation in Smart Grids using Hierarchical Verification of Metering Data [8.7] 本稿では,スマートグリッドシステムにおける電力盗難をリアルタイムに軽減するための軽量で通信効率のよいEnThMを提案する。
提案手法では,スマートグリッドインフラストラクチャの階層構造を用いて,計測データの信頼性を検証する。
提案手法は, 高精度, 効率的な実装, リアルタイム適用性を有するベンチマーク消費データを用いて検証されている。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:03:26 GMT)
Trust-Aware Joint Feature-Prediction Discrepancy for Robust Domain Adaptation [8.7] 我々は、特徴信号と予測信号の信頼性を通じて、ドメインの不一致をモデル化する原則付きフレームワークである、信頼を意識したドメイン適応を導入する。
標準ベンチマークの実験では、提案したフレームワークが常に優れた適応性能を達成できることが示されている。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:05:34 GMT)
DriftingMol: Decoder-Coupled Drift for One-Pass Property-Conditional Molecular Generation [8.6] SELFIES潜在分子空間にドリフトモデルを適用する2段階のフレームワークであるDriftingMolを紹介する。
デコーダ結合ドリフトでは、ドリフト勾配はデコーダ特徴写像を通してDitジェネレータに逆伝播され、プルバックメトリックが誘導される。
制御された15の変種のうち、デコーダ特徴による勾配経路を保存するモデルは、テストされた潜在空間、ランダムな機能、および外部機能ドリフトの変種よりも高い相関性が得られる。
論文参考訳(メタデータ) (Sun, 24 May 2026 03:17:20 GMT)
DeltaCam: Differential Intrinsic Camera Modeling for Video Generation [8.6] ビデオ拡散フレームワークであるDeltaCamを導入し、絶対状態ではなく、カメラの動きと内在性の変化を相対的に変化させることにより、カメラの挙動をモデル化する。
我々は,この枠組みを実世界の映像に拡張する2つのメカニズムとして,実際の画像・メタデータペアの制御を精密な撮影マッチングのために微調整し,暗黙的なビデオ・ビデオ間通信のための非絡み合った埋め込みを抽出する。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:39:54 GMT)
MambaDSF: Multi-Scale SSM with Dilated Feature Fusion for Sonar Small Target Detection [8.5] 小さいターゲットは、画素のカバー不足、音響コントラストの低さ、画像範囲のあいまいさのため、検出が難しいままである。
この手紙は、これらの制限に対処するハイブリッドフレームワークであるMamba Dilated-Scale Fusion (MambaDSF)を提案する。
MambaDSFはUATDの前向きソナーのベンチマークで91.5%のmAP50を達成し、28.7百万のパラメータを持つ。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:14:19 GMT)
Quantifying the Impact of Translation Errors on Multilingual LLM Evaluation [8.5] 機械翻訳ベンチマークは、大規模言語モデル(LLM)の多言語能力を評価するために広く用いられている。
MQM形式の自動エラーがLLMの判断と,QEのベースラインからどの程度の精度で発生するか,という2つの現実的なギャップに対処する。
自然発生型ベンチマーク翻訳ではスパンの一致は自明であり, ターゲット側の翻訳誤差は, 翻訳精度において測定可能なパーセンテージ・ポイント・ドロップと一貫して関連していることがわかった。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:06:34 GMT)
Stiffness Optimization for Concentrated Bending in Magnetically Actuated Catheters: Maintaining Steerability under Gradient Stiffness [8.5] 剛性最適化型多セグメント磁気アクチュエータ(SO-MAC)を提案する。
1.5mmのSO-MACは10mmの先端で半径3mmの曲げ半径で最大180円のステアリングを実現した。
気管支ファントムにおける視覚フィードバック制御は、高度に湾曲した分岐経路を通した堅牢なナビゲーションを確認した。
論文参考訳(メタデータ) (Sun, 24 May 2026 11:16:00 GMT)
Contractual Skills: A GovernSpec Design Framework for Enterprise AI Agents [8.4] 本稿では,SKILL.mdファイルを可読性のあるタスクコントラクトとして整理するための,GovernSpecにインスパイアされた設計フレームワークであるコントラクトスキルを提案する。
このフレームワークは、コントラクトスキル、GovernSpec YAMLコントラクト、モデルコンテキストプロトコル(MCP)サーフェス、ツールアダプタ、ランタイムガードレール、トレース、評価システムの境界を明確にしている。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:02:09 GMT)
D3S2: Diffusion-Guided Dataset Distillation for Semantic Segmentation [8.3] セグメンテーションDDには3つの重要な課題がある: (i) 長い尾のクラス不均衡、 (ii) 画像と高密度ラベル間の厳密なピクセルワイドアライメントの必要性、 (iii) 複雑なモデルで高解像度データを最適化する計算コスト。
クラスBalanced Mask Selectionでは、未表現のクラスを優先する欲求戦略を用いて代表マスクセットを構築する。
拡散誘導画像合成では、予めトレーニングされたレイアウト・ツー・イメージ拡散モデルを用いて、選択したマスクに条件付き画像を生成し、アライメントを自然に確保する。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:01:38 GMT)
Geo-Expert: Towards Expert-Level Geological Reasoning via Parameter-Efficient Fine-Tuning [8.3] 現在の地球科学におけるAIは、主に表面リモートセンシングとGISをターゲットにしている。
パラメータ効率のよいLLMのファミリーであるGeo-Expertを紹介した。
新たな領域固有ベンチマークであるGeo-Evalによる評価により,領域整列8Bモデルは,専門的な地質学的推論において,オープンウェイト70Bジェネリストやプロプライエタリ GPT-4o よりも優れていることが示された。
論文参考訳(メタデータ) (Sun, 24 May 2026 03:28:17 GMT)
Decomposing Ensemble Spread in Lorenz '96 With Learned Stochastic Parameterizations [8.0] 運用のアンサンブル予測は、予測拡散を通じて不確実性を表現することを目的としている。
広範に使われている制御テストベッドとして,2スケールのLorenz 1996システムを用いる。
アンサンブル摂動はシステムの長期的分散を増大させるものではないことを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:07:29 GMT)
InvariantCloud: A Globally Invariant, Uniquely Indexed Point Cloud Framework for Robust 6-DoF Tactile Pose Tracking [7.9] InvariantCloudは6-DoFの触覚オブジェクトのポーズ推定フレームワークである。
InvariantCloudは,既存のベンチマークと比較して,ヨートラッキング精度と再局在再現性に優れることを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 18:46:24 GMT)
APT-Agent: Automated Penetration Testing using Large Language Models [7.7] APT-Agentは自動浸透試験フレームワークで、偵察、エクスプロイト、エクスプロイトを編成する。
48.57%(スクリプト・キディ)と18.57%(PentestGPT)と比較すると、84.29%のエンド・ツー・エンドのエクスプロイト成功率を達成している。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:54:33 GMT)
Mitigating Object Hallucinations in Vision-Language Models through Region-Aware Attention Recalibration [7.6] 本研究では,急激な乱れに頼らずに,動的に意味的ドリフトを補正する学習自由推論手法を提案する。
様々な注意点にまたがる不規則な統計的中間点を計算することにより、信頼性の高い視覚表現のための安定なアンカーを確立する。
この再校正プロセスは、生成頻度と言語前兆を完全に保ちながら、視覚的意味的ミスアライメントを効果的に補正する。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:14:49 GMT)
Cluster Frequency Conformal Prediction for Local Coverage [7.6] コンフォーマル予測は、分布のないカバレッジを保証するが、多くのクラス分類では、特定のクラスやサブポピュレーションを過小評価することもある。
本稿では,共形予測を学習表現空間の局所構造に適応させるプラグインフレームワークであるCluster Frequency Conformal Prediction (CFCP)を提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 05:27:35 GMT)
Planning Neural Dynamics with Lie Group Embedding through Supervised Projective Manifold Learning [7.5] リー代数上の随伴リー群作用を導入し、これは線型写像を誘導し、重み行列のブロックワイド構造に転移する。
時間的ニューラルネットワーク力学の安定性保証と平衡を学習するアルゴリズムを開発する。
論文参考訳(メタデータ) (Sun, 24 May 2026 22:47:25 GMT)
Energy Shields for Fairness [7.5] 伝統的なフェアネスシールドは、実行時フェアネスを突然強制し、決定の順序が実行時フェアネス尺度の目標に反するたびに、エフェデミニズム的に介入する。
このことは我々の主要な概念的貢献である textbfenergy shields を動機付けます。
エネルギーシールドは、新しい、軽量で適応的なコントローラで、一連の決定を監視し、実行時の公平さを円滑に確保するためにエンプロバビリズム的に介入する。
これにより、エフェクトbfファーストフェアネスシールドは、エフェショート長期安全と長期的安全の両方を提供する。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:10:17 GMT)
LipoAgent: Coordinating Fine-Tuned LLM Agents for Safer Lipid Design [7.2] LipoAgentは、脂質発見のための安全を意識したマルチエージェントフレームワークである。
ドメイン固有の微調整と条件付き予測の目的を組み合わせる。
LipoAgentはmRNAの感染効率の予測において平均32%の相対的な改善を達成している。
論文参考訳(メタデータ) (Sun, 24 May 2026 20:24:09 GMT)
Towards Multi-Turn Dialog Systems for Industrial Asset Operations and Maintenance [6.7] 本稿では,スーパーバイザ・スペシャリストによるマルチエージェントアーキテクチャに基づく,産業シナリオのためのマルチターンダイアログシステムを提案する。
ツールの起動ボトルネックを軽減するため、システムは構造化アーティファクトの再利用、動的リプランニング、並列ツールの実行を取り入れている。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:06:38 GMT)
Random Neural Network Expressivity for Non-Linear Partial Differential Equations [6.6] 非線型偏微分方程式の学習解に対するRaNN表現性について検討する。
我々は,RaNNが複雑で非線形なPDEに対する解を効率的に近似できることを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:08:34 GMT)
CLIP-Guided SAM: Parameter-Efficient Semantic Conditioning for Promptable Segmentation [6.5] 内部的セマンティック・コンディショニングに基づくパラメータ効率のセグメンテーションフレームワークであるCLIP-Guided SAMを提案する。
セマンティック信号のみを使用してプロンプトを生成する代わりに、CLIP由来のテキスト、ビジョン、および類似機能をSAMの画像エンコーダに直接注入する。
我々のフレームワークは低ラベルデータ設定用に設計されており、汎用ベンチマークと特化下流タスクの両方に適用できる。
論文参考訳(メタデータ) (Sun, 24 May 2026 01:40:30 GMT)
Shared Keyboard: An improved Bayesian design for phase I clinical trials via Beta kernel process [6.5] 独立ベータ重み付き二項更新方式を各量で置き換える共有キーボード設計を提案する。
この設計はキーボード設計の決定構造を保ちながら、近くの用量にわたって制御された借入を可能にしている。
提案手法は,初期線量グリッドが不十分で時間-時間結果が存在する場合に適応的線量挿入に対応するよう拡張する。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:39:00 GMT)
Universal Boosts, Specific Suppressors: Sparse Autoencoder Steering of Medical Vision-Language Models [6.2] 医用視覚モデル(VLM)は胸部X線レポートを作成する際にしばしば発見を作製する。
パートーケンススパースオートエンコーダに基づく復号時間残差ステアリングにより、重み更新なしでこれを緩和する。
MIMIC-CXRテストスプリットでは,推測のみの手法により,生成したレポートの品質が向上する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:17:24 GMT)
SpecAlign: A Semantic Alignment Framework for SystemVerilog Assertion Generation [6.0] SpecAlignはSystemVerilog Assertionのセマンティック評価と洗練のためのフレームワークである。
我々は,SpecAlignが意味的不整合を効果的に検出し,黄金のRTLに頼ることなくアサーションアライメントを改善することを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:22:09 GMT)
Nonreciprocal Landau-Zener Tunneling in the Presence of Heat-Bath-Induced Colored Noise [6.0] 非相反するランダウ・ツェナートンネルにおける熱バスによる着色ノイズの影響について検討する。
大きな非相互性パラメータに対しては、断熱トンネルの確率はノイズに敏感であり、例外的な点によって決定される。
論文参考訳(メタデータ) (Sun, 24 May 2026 11:25:47 GMT)
Reflect-Guard: Enhancing LLM Safeguards against Adversarial Prompts via Logical Self-Reflection [5.9] リフレクション・ガード(Reflector-Guard)は,LLMに基づく安全分類器をチェーン・オブ・フォア・セルフ・リフレクション機能で拡張する手法である。
提案手法は,GPT-4o-miniから構造化アノテーションへの解析的推論を蒸留し,QLoRAを介してLlama-Guard-3-8Bを訓練し,論理的自己回帰を生成する。
たった1000のトレーニング例とわずか0.5%のモデルパラメータを使って、Reflect-Guardは2つの挑戦的なベンチマークで大幅に改善した。
論文参考訳(メタデータ) (Sun, 24 May 2026 02:58:21 GMT)
IV-Net: A neural network for elliptic PDEs with random and highly varying coefficients [5.8] 線形楕円偏微分方程式の解を近似するために設計された新しいニューラル作用素アーキテクチャを導入する。
繰り返しV字型ネット(IV-Net)と呼ばれるこのネットワークは、入力係数と右辺から対応する解場への写像を実現する。
我々は、IV-Netの近似誤差と収束挙動、そのデータ効率、および基礎となる離散化メッシュへの依存性を分析する。
論文参考訳(メタデータ) (Sun, 24 May 2026 05:37:11 GMT)
Personalized Federated Learning by Energy-Efficient UAV Communications [5.1] フェデレートラーニング(FL)は、データプライバシを保持しながらエッジデバイスの学習能力を向上するための効果的なパラダイムである。
本稿では,エネルギー効率と学習性能を協調的に考慮した勾配に基づくスケジューリング手法を提案する。
各通信ラウンドでは、バックボーンはグラデーション$ell_2$-normでランク付けされた上位$$デバイスによってのみ更新される。
論文参考訳(メタデータ) (Sun, 24 May 2026 18:21:40 GMT)
Dispersive readout of cavity-coupled solid-state sensor with near-unity readout fidelity [4.9] 我々は,NVアンサンブルセンシングの基本的限界を克服するために,分散的なcQED読み出し手法を導入する。
その結果, 市販ダイヤモンドNVアンサンブルを用いて, ほぼ均一な逆読み出し率とフェムトテトラレベルの感度を示した。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:15:37 GMT)
Trajectory-Consistent Calibration for Cache-Accelerated Diffusion Models [4.9] 拡散変換器は反復サンプリング中に繰り返しデノイザ評価を必要とする。
キャッシュベースのアクセラレーションは、デノナイジングステップ間で中間表現を再利用することで、このコストを削減する。
有効キャリブレーションは, 再利用による直接ミスマッチと, 早期修正による軌道シフトの両方を考慮すべきである。
論文参考訳(メタデータ) (Sun, 24 May 2026 05:00:06 GMT)
High-fidelity EDSR in Si/SiGe Wiggle Wells [4.8] 長周期ウィグルウェルとして知られるGe濃度振動を取り入れたSi/SiGe量子井戸はスピン量子ゲート操作を強化することが示されている。
本研究は,合金障害がEDSRに2つの影響を及ぼすことを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 00:26:29 GMT)
Miller-Index-Based Latent Crystallographic Fracture Plane Reasoning and generation with Vision-Language Models [4.7] 本研究では, マルチモーダル大規模言語モデル (MLLM) が, フラクチャー幾何学的推論のための構造的潜在表現として結晶面指標 (Miller indices) を活用できるかどうかを検討した。
MLLMは、理想化された設定で遅延推論を確実に実行でき、基礎となる物理がそれをサポートしない場合、遅延表現を拒否できることを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:52:15 GMT)
Beyond the Frontier: Stochastic Backtracking for Efficient Test-Time Scaling [4.6] テストタイムスケーリングは、ソリューショントラジェクトリを探索するために追加の計算を使用することで、言語モデルの推論を改善する。
鍵となる課題は、推論中に生成されたトークンの総数を最小化しながら、精度を最大化することである。
我々は、過去のプレフィックスの永続的なプールにバックトラックを導入し、テスト時間計算が以前生成された状態を再考できるようにする。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:48:57 GMT)
AME-TS: Anchored Mixture-of-Experts for Time Series Forecasting [4.6] 本稿では、専門家のルーティングを解釈可能な時間構造に整合させる構造誘導スパース時系列基礎モデルを提案する。
AME-TSはモデルスケール間で高い精度と効率のトレードオフを提供する。
より解釈可能なルーティング幾何学と、標準的なMoEよりもかなり安定した専門家特殊化を学習する。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:52:48 GMT)
Learning, locomotion, and navigation of soft synthetic snakes in three-dimensional, heterogeneous environments [4.6] 軟質合成ヘビが非構造で異質な3次元地形をナビゲートできる計算フレームワークを提案する。
この研究は、物理的に現実的なシミュレーションプラットフォームと、自然地形における連続系の制御に関する実践的な洞察を提供する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:24:18 GMT)
Knowledge Graph-Driven Expert-Level Reasoning for Neuroscience [4.5] 知識グラフ(KG)は、テキストコーパスから抽出され、詳細な推論に使用される抽象化である。
我々は、デュアルLLM検証パイプラインを介して教科書由来のKGを構築し、KGトポロジに基づいて訓練されたマスク付きLMで拡張し、マルチホップQAアイテムを生成する。
以上の結果から,大規模で異種なWebスケールコーパスに依存することなく,深い機械的神経科学理解をモデルに誘導できることが示唆された。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:23:41 GMT)
MVR-cache: Optimizing Semantic Caching via Multi-Vector Retrieval and Learned Prompt Segmentation [4.4] 検索精度を大幅に向上させる新しいセマンティックキャッシング手法であるMVR-cacheを導入する。
MVR-cacheは、知的に分割を促す学習可能なセグメンテーションモデルの上に構築されている。
最新の技術と比較すると、MVRキャッシュはキャッシュヒット率を最大37%向上させる。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:33:46 GMT)
Scaling up Energy-Aware Multi-Agent Reinforcement Learning for Mission-Oriented Drone Networks with Individual Reward [4.3] マルチエージェント強化学習(MARL)は、自律運転やスマートシティといった協調システムに適用可能である。
動的環境と限られたバッテリ容量は、効率的な協調的なタスク実行を実現するためにMARLを使用することが依然として困難である。
これらの課題に対処するために,エネルギーを考慮したMARLモデルを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:41:33 GMT)
Trust but Verify: Prover-Verifier Deliberation for Selective LLM Prediction [4.3] 本稿では,対話的証明理論に基づく推論時間プロトコルであるPVDを導入する。
PVDは回答と構造化された信頼判定の両方を生成し、システムは不確実なケースを棄却しながら高信頼の回答を報告できる。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:23:27 GMT)
Quantum Interference Amplifies Weak Chirality into Giant Quantum Nonreciprocity [4.1] 位相制御型量子干渉は、弱いキラリティを巨大な量子非相互性に増幅することができることを示す。
本研究は、指向性非古典光源への強力な経路として干渉強化弱キラリティを確立した。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:57:51 GMT)
Agent Manufacturing: Foundation-Model Agents as First-Class Industrial Entities [4.1] 我々は、この層が、下にある物理的または日常的な認知層ではなく、主に基礎モデルに基づく自律エージェントによって再編成される5番目の遷移が進行中であると主張している。
ファウンデーションモデルエージェントによる主要な調整機構の推論を行う場合、製造システムはエージェント製造の例である。
論文参考訳(メタデータ) (Sun, 24 May 2026 02:27:44 GMT)
Generative AI as a Design Variable: An Evidence-Centered Framework for Principled Governance in STEM Assessment [4.0] Generative Artificial Intelligence (GenAI)は、STEMアセスメントのためのガバナンスの課題を提示している。
制限のないGenAIアクセスは、従来の評価の妥当性を損なうタスクアウトソーシングを可能にする。
本稿では,GenAIを外部の脅威ではなく,評価論における設計変数として扱うフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 03:06:34 GMT)
RAMBA: 4D Radar Mapping by Bundle Adjustment [3.9] 本稿では,一貫した4次元レーダマッピングのためのレーダバンドル調整フレームワークであるRAMBAを提案する。
ColoRadarとSNAIL Radarデータセットの実験は、RAMBAがマップの一貫性を改善し、通常は軌道精度を高めることを示している。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:38:18 GMT)
Riemannian-Manifold Steering: Geometry-Aware Generative Autoencoders for Label-Free Steering [3.9] 我々は、活性化空間上のtextbfRiemann 測地線計算として多様体のステアリングをリキャストする。
我々はこれを、小さな概念整合スキーマ上で出力距離を訓練した学習エンコーダと近似する。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:41:56 GMT)
Parameter-Efficient VLMs for Gastrointestinal Endoscopy: Medical Image Generation and Clinical Visual Question Answering [3.7] 本稿では,医療用視覚質問応答(VQA)とプライバシ保存合成データの生成に対処する二重パイプラインPEFTモデルを提案する。
低ランク適応(LoRA)と安定拡散(Stable Diffusion)2.1を併用して,患者のプライバシを侵害することなく,トレーニングデータベースを強化した高品質なGI画像を生成する。
論文参考訳(メタデータ) (Sun, 24 May 2026 00:33:54 GMT)
Language Bias in LVLMs: From In-Depth Analysis to Simple and Effective Mitigation [3.6] LVLM(Large Vision-Language Models)は、視覚的理解によって大きな言語モデルを拡張するが、幻覚に弱いままである。
近年の研究では、LVLMが視覚入力を無視しながらテキストを過度に参照する傾向にある言語バイアスにこの問題を関連付けている。
本稿では,言語バイアスの系統的研究を行い,訓練中のモダリティの相違点の根源を同定する。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:23:13 GMT)
Loosely Coupled Factor Graph Optimization for Pseudolite-Augmented Navigation [3.6] 本稿では、最小二乗法(LS)を慣性測定単位(IMU)データと融合する疎結合係数グラフ最適化フレームワークを提案する。
評価では、4つの高標高衛星と最大2つのPL送信機による低視認性シナリオを80sウィンドウ上で検討している。
a-IMUベースラインと比較すると、PL送信機は位置決め精度をさらに向上し、形状によって性能が向上する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:18:46 GMT)
Data-Specific Hyper-Parameter Design: A Paradigm Shift in Reservoir Computing [3.4] 貯水池の計算は通常、大規模でランダムに生成された貯水池に依存し、単純でしばしば線形な読み出しを可能にする。
決定論的力学系によって生成される入力の幾何学的視点から貯水池の設計原理を開発する。
数値実験は任意の貯水池構造に対して一貫した性能向上を示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 19:13:13 GMT)
Abduction-Deduction Entanglement: Domain Generalization via Representation Transplants [3.4] 対象の最適予測はソース分布によって部分的に識別可能であることを示す。
表現移植と呼ぶものを用いて制約されたファミリーをパラメータ化する。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:27:50 GMT)
Global linear convergence of entropy-regularized softmax policy gradient beyond tabular MDPs [3.3] 無限水平エントロピー規則化マルコフ決定過程(MDPs)に対する政策勾配の連続状態と行動空間とのグローバル収束性について検討する。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:38:29 GMT)
Guess the Unified Model: How Much Can We Recover from Generated Images? [3.2] 7つの統一モデルにより生成された画像を用いて、汚職、ドメイン、プロンプト言語間の分離性を検討する。
モデル属性は,モデル毎の約20K画像でほぼ完全な精度を実現するため,極めて実現可能であることを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 20:59:08 GMT)
BandVQ: Band-Wise Vector-Quantized EEG Foundation Model [3.2] BandVQは、EEGをデルタ、セタ、アルファ、ベータ、ガンマバンドに分解するバンドワイドベクトル量子化EEG基盤モデルである。
このモデルは、9,200人以上の被験者と357,000人のシングルチャネル時間からなる71の公的な脳波コーパスで事前訓練されている。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:55:26 GMT)
DTO: a Differentiable Training Objective for Effective Counterfactual Story Rewriting [3.2] そこで本研究では,必要な対実的改善を直接最適化する,微分可能学習目標(DTO)を提案する。
トランスモデルは、完全に微分可能な損失関数に対して、エンドツーエンドのバックプロパゲーションを介して微調整される。
提案したDTOアプローチは、最大様相のベースラインと嗜好に基づくアプローチを超えることができた。
論文参考訳(メタデータ) (Sun, 24 May 2026 05:58:11 GMT)
Learning Transferable Motor Skills for Geometry-Aware Robotic Surface Tasks [3.1] スプレー塗装や溶接のようなロボットの表面相互作用タスクは、正確な幾何学的計画と正確な動きの実行の両方を必要とする。
本稿では,幾何運動計画と実行レベルの専門知識を分離するモジュラーフレームワークを提案する。
我々は、運動軌道データとCADモデル幾何からルールパラメータを共同で推論するために、マルチモーダルニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Sun, 24 May 2026 05:49:33 GMT)
GL-LFGNN:A Global-Local Dual-branch Causal Graph Neural Network Based on Liang-Kleeman Information Flow for EEG Emotion Recognition [3.0] We propose GL-LFGNN, a Global-Local Dual-branch Causal Graph Neural Network based on Liang-Kleeman information flow theory。
時間的優先性のみを評価するグランガー因果性とは異なり、我々のアプローチは動的システムの観点から因果強さを厳格に定量化する。
MEEGデータセットでは、GL-LFGNNの精度は86.17%(Arousal)、86.71%(Valence)で、パラメータは37Kである。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:11:55 GMT)
JudgmentBench: Comparing Rubric and Preference Evaluation for Quality Assessment [3.0] JudgmentBenchは、実世界の30の法的タスクのベンチマークで、1,539のルーリックスコアと1,530のペアの選好判断を組み合わせたものです。
アノテーションは、両方の監視信号が同じ専門家から引き出される、高度なドメインで利用可能な最初のデータセットである。
論文参考訳(メタデータ) (Sun, 24 May 2026 19:52:39 GMT)
Debiasing Random Oblique Projections for Subsampled OLS and Fast CUR in High Dimensions [2.8] 高次元におけるランダム斜め射影に対する統一的非漸近理論を開発する。
提案手法は,古典的な部分空間埋め込み型解析で見落とされ,体系的な統計的バイアスを生じさせることを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:11:53 GMT)
PQDT: Pseudo-Query Dual Transformer for Robust Point Cloud Restoration [2.6] 実世界の点雲は、不完全性、ノイズ、外れ値、不規則密度などの劣化に悩まされることが多い。
本稿では, 点雲を直接入力とし, 多様な劣化シナリオ下で高品質な幾何を適応的に再構成する3次元復元ネットワークを提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:15:13 GMT)
Cross-Domain Generalization Limits of Vision Foundation Models in Facial Deepfake Detection [2.5] 生成モデルは、超現実的な顔のディープフェイクの作成を可能にした。
伝統的なネットワークは表現の崩壊に悩まされ、局所化されたアーティファクトの指紋に過度に適合する。
本研究では、現代のビジョンファウンデーション・モデルが一般化可能な、アウト・オブ・ザ・ボックスな特徴抽出器として機能するかどうかを考察する。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:33:46 GMT)
On the Push-Based Asynchronous Federated Learning: A Bias-Correction Aggregation Approach [2.4] Asynchronous decentralized Federated Learning (ADFL) は、集中協調とグローバル同期を排除し、大規模および異種システムにとって魅力的である。
通信効率のよいADFLフレームワークであるPushCen-ADFLを提案する。
ビジョンデータセットの実験によると、PushCen-ADFLは、プッシュ間通信コストを80%以上削減しながら、データの均一性の下での精度を最大6%向上する。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:56:37 GMT)
Semantics-Guided Multimodal Masked Autoencoder Pretraining for 3D BEV Object Detection [2.3] マルチモーダルマスク付きオートエンコーダは、下流3次元BEVオブジェクト検出のためのそのような表現を学習する強力な可能性を示している。
本稿では,事前学習時に意味情報を導入するセマンティックス誘導型マルチモーダルマスマスキング自動エンコーダフレームワークを提案する。
BEVFusion 3Dオブジェクト検出では、セマンティクスによる事前学習戦略により、nuScenesのミニ検証セットの性能が向上する。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:24:11 GMT)
Solving Combinatorial Counting Problems with Weighted First-Order Model Counting [2.3] 我々は,すべてのCofolaプログラムを適切に定義されたカウント問題にマッピングする型付き言語であるCofola(LAnguage with First Preserving logic)を提案する。
Cofolaは簡潔な仕様と、実用的なエンドツーエンドの均一な解決パイプラインを生成する。
論文参考訳(メタデータ) (Sun, 24 May 2026 03:29:19 GMT)
Explainable Retinal Imaging for Prediction of Multi-Organ Dysfunction in Type 2 Diabetes [2.2] 臓器特異的機能障害を定量化するために, システムレベルの異常指標を構築した。
教師付き機械学習モデルは、マルチシステムのディレギュレーションを予測するために訓練された。
高血糖,腎障害,ジスリピダ血症,炎症が多系統リスクの主要な要因であった。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:31:57 GMT)
Explainable Multi-Task Retinal Imaging Reveals Microvascular Signals for Systemic Risk Stratification in Type 2 Diabetes: A Pilot Study [2.2] 糖尿病2型糖尿病における網膜微小血管の特徴と全身異常との関連性を明らかにするための多タスク深層学習フレームワークを開発した。
重力重み付きクラス活性化マッピング(Grad-CAM)、解剖学的マスキング、血管アライメント解析を用いてモデル解釈性を評価した。
この枠組みは, 腎臓異常の診断において, タスク依存的な予測性能を示した。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:32:58 GMT)
Eureka: Intelligent Feature Engineering for Enterprise AI Cloud Resource Demand Prediction [2.1] 本稿では,予測モデル性能のためのエージェントコード生成フレームワークであるEurekaを紹介する。
Eurekaには、Expert Agent、Feature Factory、Self-Evolving Alignment Engineの3つのステージがある。
Eurekaは、医療、金融、社会ドメインの7つの公開ベンチマークにおいて、AutoFEとLLMベースのベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 24 May 2026 23:21:44 GMT)
Micro-Swarm Locomotion Optimization in Dynamic Flow using Multi-Objective Multi-Agent Reinforcement Learning [2.0] 生理的、現実的で、時間に依存した流体環境における微小ロボティックな群れの調整は、未解決の課題である。
本稿では,多目的多エージェント強化学習フレームワークであるComputational Fluid Dynamicsを提案する。
16個の磁気駆動型マイクロロボットが脈動性動脈を走行し、上流の進行、エネルギー保存、動きの滑らかさを同時に最適化する。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:04:29 GMT)
Towards a nuclear isomer quantum battery [2.0] 核異性体を包含する2段核と3段核から構成されるエネルギー貯蔵ユニットである核異性体量子電池(NIQB)の革新的な設計を提案する。
NIQBは、それぞれ101$-106$と106$-1011$の要素によって、蓄積エネルギーと平均充電パワーが強化された、大幅なパフォーマンス向上を提供する。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:30:33 GMT)
AgentIR: A Workload-Adaptive Cascade Retrieval Substrate for Long-Term Conversational Memory [1.8] Luceneクラスのエンジンはインデックスを静的として扱い、クエリをステートレスとして扱う。
カスケードルータはBM25のトップクマージンのみから決定され、再トレーニングせずにワークロードをまたがって再チューニングされる。
共有8コアVMのキャパシティは154から1,400のコンカレントエージェント(9倍)に向上する
論文参考訳(メタデータ) (Sun, 24 May 2026 14:14:13 GMT)
Label-NTK Alignments and A Tighter Convergence Bound in the NTK Regime [1.8] 我々は、データラベルとNTK固有スペクトルとの相互作用を特徴付けることにより、よりシャープな収束保証を開発する。
完全スペクトルに依存する洗練された収束境界を導出し、実用的な訓練力学と密接に一致させる。
論文参考訳(メタデータ) (Sun, 24 May 2026 22:04:02 GMT)
Exploring Profiles of Cognitive Distortions Associated with Mental Health Disorders [1.8] 我々は、Redditをベースとした大規模なデータセットを分析し、9つのセルフレポートされたメンタルヘルスグループとコントロールグループからの投稿を分析した。
精神保健群は, コントロール群と比較して認知歪みの頻度が高く, 影響の大きさは小から中程度であった。
これらの結果から,比較的単純な語彙的アプローチは,大規模メンタルヘルステキストデータにおけるグループレベルの傾向の探索的分析に有用であることが示唆された。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:49:11 GMT)
Injecting Image Guidance into Text-Conditioned Diffusion Models at Inference [1.7] テキスト・ツー・イメージ拡散モデルはテキストから高品質な画像を生成するが、再トレーニングせずに推論時に視覚的誘導を注入する方法がない。
本稿では,視覚概念融合(VCF)について紹介する。これは,画像とテキストのプロンプトを,概念固有のトレーニングを伴わずに,推論時に2つの条件付けを行う最初の方法である。
VCFは、参照画像からスタイル、コンポジション、カラーパレットを含む視覚的属性の転送に成功し、即時付着を維持した。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:47:21 GMT)
A perspective on fluid mechanical environments for challenges in reinforcement learning [1.7] 我々は,正準流体力学問題とそのシミュレーションが,強化学習法の開発に説得力のあるテストベッドとなることを論じる。
本稿では,流体力学環境と相互作用するエージェントの2つの問題記述と,状態と行動空間,報酬関数について述べる。
本研究では,デダルスを模擬した静止環境下での移動を学習するRLエージェントを作成することにより,環境生成におけるデダルスの利用を実証する。
論文参考訳(メタデータ) (Sun, 24 May 2026 11:31:15 GMT)
TaBIIC2: Interactive Building of Ontological Taxonomies using Weighted Self-Organizing Maps [1.6] 本稿では,概念分類の進歩的かつインタラクティブな構築を可能にするツールについて述べる。
我々はクラスタリング手法として重み付けされた自己組織化マップに依存している。
この機構と他の機構を統合することで、このツールは純粋に手作業による分析と自動手法の中間的な位置を表現していることを示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 06:55:34 GMT)
SpikeReg: Energy-Efficient 3D Deformable Medical Image Registration with Spiking Neural Networks [1.5] スパイキングニューラルネットワークは、スパースイベント駆動計算を提供する。
SpikeRegは、3Dの脳MRI登録のためのスパイクU-Netだ。
結果より, イベント駆動計算では, 密集した幾何学的予測が可能であることがわかった。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:53:23 GMT)
MultiHaluDet: Multilingual Hallucination Detection via LLM Hidden State Probing [1.4] 大規模言語モデル(LLM)における幻覚は、信頼性の高いデプロイメントにとって重要な障壁である。
多言語幻覚を検出する新しい3段階積み重ねフレームワークであるMultiHaluDetを紹介する。
本フレームワークは,HluEvalおよびTriviaQAベンチマークで98.55%のAUROCに到達し,最先端検出性能を実現する。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:50:03 GMT)
When Skills Don't Help: A Negative Result on Procedural Knowledge for Tool-Grounded Agents in Offensive Cybersecurity [1.4] スキルは、推論時にエージェントにロードされた手続き的知識の構造化パッケージである。
様々な領域で平均16.2%の割合でタスクパス率を改善することが広く報告されている。
しかし、同じベンチマークでは、スキルの導入時に負のデルタに苦しむ84のタスクのうち16が広範囲に分散している。
論文参考訳(メタデータ) (Sun, 24 May 2026 20:30:48 GMT)
Stop Denoising Your Blurs [1.3] 本稿では,新たな拡散に基づくフレームワークであるConvDiffを紹介する。
我々は、畳み込みの周波数領域特性を利用して、クリーンな画像からぼやけた画像への有意義な軌道を構築する。
論文参考訳(メタデータ) (Sun, 24 May 2026 11:36:33 GMT)
PR-Aware Automated Unit Test Generation: Challenges and Opportunities [1.3] 本研究では,主要な検索ツールであるEvoSuiteと,広く使用されている大規模言語モデル(LLM)の1つであるGPT-4oの2つのアプローチを評価する。
私たちの研究は、現代のソフトウェア開発の漸進的な性質に合わせて、ツールと高性能なテストジェネレータの開発における重要なギャップを強調します。
論文参考訳(メタデータ) (Sun, 24 May 2026 22:38:04 GMT)
Device Context Protocol: A Compact, Safety-First Architecture for LLM-Driven Control of Constrained Devices [1.3] 大規模な言語モデルは、モデルコンテキストプロトコル(MCP)を介して、外部ツールのオーケストレータとしてますます使われています。
最近の作業(IoT-MCP)では、MCPを74KBのピークメモリでエッジゲートウェイに移植している。
本稿では,DCP(Device Context Protocol)を提案する。DCP(Device Context Protocol)は,機能スコープ,範囲および型チェック,ドライラン評価,およびユニット・アズ・タイプがプロトコル層プリミティブであるマニフェストスキーマである。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:37:19 GMT)
DLLM-JEPA: Joint Embedding Predictive Architectures for Masked Diffusion Language Models [1.0] JEPA(Joint Embedding Predictive Architectures)は、視覚における自己教師型表現学習を再構築した。
LLMM-JEPAは、JEPAとマスク拡散言語モデルを組み合わせて、両方のコストを同時に排除する。
拡散モデルの双方向の注意は、異なるマスキングレートを通して同じ入力の2つの意味的に異なるビューをもたらす。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:14:54 GMT)
Boosting Inference with Guided Reasoning: Stochastic Exploration for Recursive Models [1.0] 私たちは、構造化推論タスクにおいて、小さなニューラルネットワークが驚くほど強力であることを示します。
我々は、潜在力学系を用いた推論軌道をモデル化する。
我々はこの視点をガイド付き探査を通して運用する。
論文参考訳(メタデータ) (Sun, 24 May 2026 19:32:20 GMT)
Topological metal-insulator transitions in one-dimensional non-Hermitian quasicrystals: beyond PT-symmetry [0.7] パリティ対称性と時間反転対称性を持つ1次元非エルミート準結晶は、同時に局在化脱局在化遷移、位相相転移、PT対称性破砕遷移を示す。
本研究は、PT対称性の欠如が非エルミート準結晶のトポロジカル金属絶縁体遷移にどのように影響するかを考察する。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:32:29 GMT)
Lateral Shift as a Control Knob for Localization Transitions in a Quasiperiodic Ladder [0.7] この研究は、準周期はしごにおけるリッチな局在化-非局在化遷移を報告する。
両脚間の横シフトは、相互運動量空間における磁気フラックスを効果的に生成する。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:20:51 GMT)
Efficient ensemble randomization by tuning chaos in a nonlinear spin-1 system [0.6] 非線形スピン-1系におけるスピン状態アンサンブルのランダム化を,外部周期駆動によるカオスのチューニングにより効率的に行う手法を提案する。
この挙動は,周期駆動の低次高調波成分の動的キャンセルによるものである。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:45:31 GMT)
Intent Signal Theory: A Computational Framework for Intent-State Control in Human-AI Interaction [0.6] 現在のAIインタラクションモデルは、プロンプトを主要な交換対象として扱い、重要なレイヤを省略する。
ここでは、この欠落した意図層を形式化する計算フレームワークであるIntent Signal Theory (IST)を紹介する。
ISTは、遅延ソースインテント(I*)、観測可能なインテントプロキシ(I-hat)、エンコードされたキャリア(P)、モデル出力(O)の4つのオブジェクトを日常的に混同している。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:10:33 GMT)
Zero-Shot Parkinson's Disease Detection from Speech: Comparing Large Audio and Language Models [0.5] ゼロショットパーキンソン病検出における2つの入力モダリティを比較した。
4言語でのPD音声データセットの実験では、入力のモーダル性、音声タスク、言語によってパフォーマンスが変化していることが示されている。
論文参考訳(メタデータ) (Sun, 24 May 2026 01:39:18 GMT)
Building Digital Societies as Ecosystems: How Recognition and Repeat Relationships Sustain Cross-Community Work in Open Source [0.5] 2001年10月から2022年5月までに,464のサイバーセキュリティプロジェクトと11,372人のコントリビュータからなる2部構成のコントリビュータリポジトリグラフを再構築して,オープンソースソフトウェア(OSS)エコシステムにおけるクロスバウンダリーコラボレーションを測定する。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:04:24 GMT)
Choosing Online Experiment Designs under Interference in Ads, Recommendations, and Member-Experience Systems [0.5] 我々は、この問題を不確実な露光メカニズムよりも頑健な設計選択として定式化する。
本論文は,メカニズム・ロバスト設計決定に基づく干渉認識型実験設計フレームワークに貢献する。
論文参考訳(メタデータ) (Sun, 24 May 2026 23:11:35 GMT)
Multilingual Humour-Aware Retrieval with Dense and Re-Ranking Models [0.5] Team DUTH は CLEF 2025 JOKER Task 1 ベンチマークを用いて,多言語対応の情報検索を研究している。
提案手法は,多言語XLM-RoBERTaに基づく高密度検索と,ニューラルリランクを含む追加のシステム変種を組み合わせたものである。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:50:15 GMT)
Boosted Stochastic Frank-Wolfe for Constrained Nonconvex Optimization [0.4] 我々は、強化されたフランク・ウルフアルゴリズムの新たなステップ定数を開発する。
このステップサイズ戦略の強化は多くの現代的な推定器と組み合わせることができることを実証する。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:04:26 GMT)
Beyond Killer Robots: General AI Attitudes and Public Support for Military AI in Nine Countries [0.3] AIに対する一般的な態度、致命的な自治に対する原則的反対、または外交的・地政学的指向は、軍事的AIのサポートを形作る。
致死性や人間のコントロールに異なる6つの軍事AIシナリオの中で、AIを有益とみなす回答者は、軍事AIをかなり支持している。
致死的な自律性に対する反対は、完全に自律的な致死力の適用と大きく関連しているわけではない。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:55:58 GMT)
MimirRAG: A Multi-Agent RAG Framework for Financial Data Retrieval with Metadata Integration [0.3] Retrieval-augmented Generation (RAG) システムは、大型言語モデル(LLM)における幻覚の低減と解答精度の向上に有望なアプローチを提供する。
本稿では,これらの課題に対処するために反復的に開発されたマルチエージェントパイプラインシステムであるMimirRAGを紹介する。
MimicRAGは、PDFファイルの構造保存構文解析、テーブル対応チャンキング、メタデータ抽出、クエリ計画を伴うエージェントベースの検索、ハイブリッド検索、バリデーション、数値推論をサポートするコンテキスト認識生成を含むモジュラーパイプラインを備えている。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:15:27 GMT)
A Blended Likelihood Approach for Achieving Fairness Using Naive Bayes [0.3] 本研究では,計算効率を保ちながらバイアスを緩和する,ネイブベイズ分類器の公平性を考慮した拡張法を開発した。
本稿では,Bias Mitigating Naive Bayes (BMNB)分類器を提案する。
実験結果から,BMNBはアダルト,ProPublica,Framinghamのデータセット上で,1.000,1.171,0.997の異なるインパクト(DI)値と,-0.217,-0.226,-0.053の平等差(EOD)値が得られることがわかった。
論文参考訳(メタデータ) (Sun, 24 May 2026 19:31:46 GMT)
Privacy-Preserving Local Language Models for Longitudinal Data Retrieval in Chronic Dermatologic Disease: Implementation in Pemphigus Patients [0.3] ペムフィガスのような慢性皮膚疾患は長期の経過観察を必要とする。
プライバシ保存型小言語モデル(SLM)は、構造化された臨床特徴を検索し、長手要約を生成する。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:00:13 GMT)
From Automation to Collaboration: Human-in-the-Loop Methods for Safe and Trustworthy NLP [0.3] 大規模言語モデルは、ハイテイクなNLPタスクに広くデプロイされているが、バイアス、幻覚、敵対的脆弱性、信頼できない一般化といったリスクが残っている。
本研究では,NLPを自動化から安全性とロバスト性のためのコラボレーションへ移行する最近のヒューマン・イン・ザ・ループ手法について検討する。
論文参考訳(メタデータ) (Sun, 24 May 2026 19:27:20 GMT)
Quaternion Self-Attention with Shared Scores [0.2] 既存の四元数自己アテンションは、コンポーネントのスコアを計算し、各コンポーネントに独立したソフトマックス演算を適用する。
四元数内積を用いた1つの実値スコアを計算する共有スコア四元数自己アテンション機構を提案する。
これによりスコア演算の乗算が75%減少し、ソフトマックス演算の数が4から1に減少する。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:52:19 GMT)
Aligning Cellular Sheaves with Classifier Attention for Interpretable Weakly-Supervised Pathology Localization [0.2] 注目に基づく複数インスタンス学習を用いた全スライディング画像の弱教師付き分類は、Camelyon16スライドレベルの性能でほぼ飽和状態に達する。
臨床的解釈では、実際の病変を撃たずに正しく分類するモデルは信頼できない。
細胞シーブを全スライディング画像上の弱教師付き腫瘍局在に応用し, せん断不一致フィールドとAMMILを併用した。
論文参考訳(メタデータ) (Sun, 24 May 2026 18:37:12 GMT)
Quantifying Empirical Compute-Supervision Tradeoffs in RLVR [0.2] 理論は、十分な計算が不完全な監督によって引き起こされるギャップを埋めるべきであると予測している。
我々は,GSM8K上でGRPOを用いてQwen2.5 (0.5B,1.5B) の訓練後,この予測を実証的に検証した。
偽陰性が偽陽性よりも単調に性能を低下させる構造的非対称性を見いだす。
論文参考訳(メタデータ) (Sun, 24 May 2026 20:28:12 GMT)
Dissipative preparation of injective tensor network states [0.1] テンソルネットワーク状態の生成は、幅広い量子シミュレーションタスクの基本的な前提条件である。
本稿では,定常状態が与えられたインジェクティブテンソルネットワーク状態である連続時間および離散時間幾何学的局所散逸過程を構築する。
提案手法は, 誤差$varepsilon$ in $O(log (N/varepsilon)$ time に対して$N$サイト上のすべての射影行列生成物を調製し, 従来知られていた散逸行列よりも指数関数的に改善した。
論文参考訳(メタデータ) (Sun, 24 May 2026 14:09:33 GMT)
Scale When Needed: Adaptive Neuron-level Mixed Precision Quantization Aware Training [0.1] QAT(Quantization-Aware Training)は、主要な圧縮手法である。
ニューロンレベル混合精度QAT(NMP-QAT)を提案する。
NMP-QATは、混合精度QATベースラインよりも優れた圧縮精度トレードオフを実現する。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:02:42 GMT)
Extracting Universal Entanglement Scaling from Mixed Fermionic Gaussian States via Entanglement Projected Entropy [0.1] 混合フェルミオンガウス状態から境界感応性量子相関を抽出するための診断法であるエントロピーの絡み合いについて紹介する。
その結果、混合状態のエントロピーに隠れた境界感度量子相関に対するガウス空間フィルタとして、絡み合ったエントロピーが確立される。
論文参考訳(メタデータ) (Sun, 24 May 2026 14:41:58 GMT)
Whose Alignment? Comparing LLM Process Alignment Across Diverse Organizational Decision Contexts [0.0] プロセスアライメントの計測には意思決定型キャプチャー手法を用いる。
この手法をECHR 第6条の決定に適用すると、プロセスアライメントは出力精度を強く予測する。
競合する領域では、高いプロセスアライメントは外部化や無条件で望ましいものではない。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:16:26 GMT)
When Reasoning Hurts: Source-Aware Evaluation of Frontier LLMs for Clinical SOAP Note Generation [0.0] 推論可能なLSMは、医学的推論ベンチマークで強く機能するが、これらが構造化された臨床文書に移行するかどうかは不明だ。
OMI Health, ACI-Bench, PriMock57 にまたがるソース・アウェア・ベンチマークにおいて, 臨床対話からのSOAPノート生成を用いてこの問題を考察する。
GPT-5.4, DeepSeek-V4-Flash, Gemma-4-E4Bを2x2の設計で評価した。
論文参考訳(メタデータ) (Sun, 24 May 2026 06:58:57 GMT)
When Does Adaptive Guidance Help? Belief-Aware Privileged Distillation for Autonomous Driving Under Partial Observability [0.0] Guided Soft Actor-Critic (GSAC)は、特権のあるフルステートの教師から、自律運転のための部分観察学生に知識を蒸留する。
本稿では,Belief-Aware GSAC(BAGSAC)について述べる。
論文参考訳(メタデータ) (Sun, 24 May 2026 04:41:30 GMT)
Variance-Reduced Manifold Sampling via Polynomial-Maximization Density Estimation [0.0] MASEMはエントロピー最大化再サンプリングによってこの問題に対処する。
軽量リサンプリング-プロキシ実験は7ロブのカバレッジを改善するが、正弦波とスイスロールのプロキシを劣化させるか尋ねる。
論文参考訳(メタデータ) (Sun, 24 May 2026 14:07:56 GMT)
Tuning quantum tunneling in WSe$_2$ via strain engineering [0.0] 単層タングステンジセレナイド(WSe$$)における静電スカラー電位の存在下でのひずみ駆動型量子輸送について検討した。
数値解析の結果,ひずみは電子分散を想起する強力なチューニングパラメータとして機能することが明らかとなった。
偏光と干渉効果を調整できる能力は、次世代のスピントロニクス、バレートロニクス、および光電子デバイスの設計に有望な機会を示唆している。
論文参考訳(メタデータ) (Sun, 24 May 2026 03:53:42 GMT)
Translators as Invisible Teachers of AI: Copyright, Translation Memory, and the Political Economy of Linguistic Data [0.0] 人工知能(AI)時代における翻訳者の労働力の基盤的データ資本への転換について検討する。
翻訳者の遺言は契約下で納品品として購入され、技術的対象としてセグメント化され、著作権法の下で「情報分析」データとして処理されていると論じている。
論文参考訳(メタデータ) (Sun, 24 May 2026 03:21:41 GMT)
Transition from Collective to Local Radial Motional Modes in a Tapered Paul Trap [0.0] テープ付きポールトラップにおいて, より強い軸方向閉じ込めにおける集合ラジアルモードから低軸方向閉じ込めにおける個々のラジアル振動への遷移について検討した。
固有モードは遷移状態において実験的に研究され、理論的な予測と比較される。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:11:35 GMT)
Tool-Schema Compression Enables Agentic RAG Under Constrained Context Budgets [0.0] 言語モデルに数十から数百のツール定義を装備するエージェントRAGシステムは、重要なリソース衝突に直面します。
1.5B-32Bのローカルモデルにまたがる14のモデルと6,566のAPIコールにまたがる1つのフロンティアモデルを評価する。
論文参考訳(メタデータ) (Sun, 24 May 2026 20:52:54 GMT)
The Concept Allocation Zone: Tracking How Concepts Form Across Transformer Depth [0.0] 本稿では,概念の分離可能な深さ区間である概念割当ゾーン(CAZ)を紹介する。
1つの概念は典型的には複数のCAZに参加し、複数の概念は1つの概念を共有する。
34モデルにわたる経験的検証は、分離曲線 S(l) が頻繁に多重モーダルであることを明らかにする。
論文参考訳(メタデータ) (Sun, 24 May 2026 04:25:32 GMT)
TRACE: A taxonomy-grounded synthetic dataset for teaching-program generation and session interpretation in Applied Behavior Analysis [0.0] 応用行動分析 (Applied Behavior Analysis, ABA) は、ドキュメント、教育プログラム、行動ログが定式かつ高量である臨床分野である。
提案するTRACEは,2つのABAタスクをカバーする2,999サンプルの合成命令チューニングデータセットである。
いずれの例も、カノニカルABA文献に基づく決定論的分類駆動ジェネレータによって生成される。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:27:32 GMT)
Structural constraint on delayed-choice quantum eraser architectures [0.0] 4つの直観的特性(選択の統計的独立性、損失の欠如、選択に条件づけられた決定論的ルーティング、および異なる条件検出分布)を同時に満たすことができないことを示す。
この非互換性は、DCQEスキームの透過的な分類を提供し、エキゾチックなメカニズムを誘発することなく、条件付き干渉パターンがどのように生じるかを明らかにする。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:46:14 GMT)
Securing High-Performance Data Transfers: Implementing AES Encryption in RDMA Systems [0.0] 本研究では、RDMAとAES-128の暗号化を統合して、性能を損なうことなくデータ転送をセキュアにする方法について検討する。
P4 プログラミング言語を用いて,プログラム可能な Tofino スイッチのデータプレーン内で直接暗号化を実装した。
実験の結果,16バイトパケットで0.37Gbps,32バイトパケットで0.76Gbps,64バイトパケットで1.83Gbps,128バイトパケットで1.9Gbpsのスループットを達成した。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:06:22 GMT)
Resource Management in Heterogeneous Quantum Repeater Networks [0.0] 異なるタイプの量子リピータをサポートする統一量子インターネットアーキテクチャの構築が可能かどうかを考察する。
本稿では,既存の再帰的ネットワーク設計とプログラマブルルールセットベースのプロトコルに基づくアーキテクチャを提案する。
メモリベースおよび全フォトニックセグメントをブリッジするための新しいエミッタフォトニックビルディングブロックを導入する。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:22:34 GMT)
Representation Without Control: Testing the Realization Effect in Language Models [0.0] 大規模言語モデルは行動シミュレータとしてますます使われているが、そのアウトプットが人間のような認知メカニズムを反映しているかどうかは不明だ。
本研究では, リスクテイクが紙の後に体系的に異なる行動経済学において, 実効と実効的な利益と損失とを両立させることにより, この問題を解明する。
我々は,LPMの動作を,アクティベーションステアリングによる行動感度,内部表現の線形読み出し,因果制御の3つのレベルで評価した。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:07:34 GMT)
Pseudorandom Dynamics in the SYK Model and Cryptographic Censorship in JT Gravity [0.0] 我々は、SYKモデルがJT重力下での暗号検閲の条件付き実現をもたらすことを論じる。
Weingarten計算とランダム行列普遍性を用いて、SYK障害アンサンブルがすべての$k=poly(N)$に対して近似ユニタリな$k$-設計であることを証明する。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:19:08 GMT)
Pre-Characterization of Electromagnetic Side-Channel Leakage Using Publicly Available Information: A Case Study on E-Voting Interfaces [0.0] 我々は、TEMPEST攻撃と呼ばれる電磁チャネル脅威の文脈において、ブラジルのe-Voting Machine(BVM)のインタフェースについて検討した。
ビデオディスプレイに対するTEMPEST攻撃では、盗聴機はSoftware-Defined Radios (SDR) を使用して、ビデオ信号送信中に発生する電磁波を傍受する。
我々は、BVMインタフェースが、意図しない電磁放射で観測可能なスペクトル特性を生じさせるかどうかを考察する。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:46:54 GMT)
Positivity in classical enumerative geometry: a case study in synchronized AI-assisted mathematics [0.0] 対称$prod_in A_n,dbigl ここで、$A_n,d:=inmathbbZ_ge 0n:||=d$は、$mathrmSymd(mathbbCn)$のチャーン類である。
我々は、それらの構造に関するいくつかの予想を証明し、明示的な公式を確立し、チャーン類とそれらの$K$-理論的類似物の両方の対数共共空性について研究する。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:56:27 GMT)
Polynomial Context-Truncation Sensitivity in Autoregressive Language Models: Sequential Wyner-Ziv Bounds for KV Cache Compression [0.0] 自己回帰言語モデルにおけるオンラインKVキャッシュ圧縮の速度歪み限界について検討する。
我々は,次点分布の文脈乱れに対する感受性が,エンフェロメトリーよりもエフェロメトリー的に崩壊することを発見した。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:54:13 GMT)
Point-group symmetry analysis of many-electron wavefunctions on a quantum computer [0.0] 点群は分子系の空間対称性演算の集合である。
本研究では,多電子状態の点群対称性を解析するためのアンシラフリーハイブリッド法を提案する。
提案手法は,多電子波動関数の対称性特性を解析するための実用的なツールとして有効であることが示唆された。
論文参考訳(メタデータ) (Sun, 24 May 2026 02:28:54 GMT)
Performance Comparison of Classical and Neural Sampling Algorithms for Robotic Navigation [0.0] RRT*,Neural RRT*,Neural Informed RRT*の3つのアルゴリズムを実装し評価した。
その結果,神経誘導プランナーは経路の質を向上し,最大で14%の短い経路と55-75%のスムーズな軌道が得られた。
論文参考訳(メタデータ) (Sun, 24 May 2026 11:27:31 GMT)
On the Impact of Class Imbalance on the Learning Dynamics of Deep Neural Networks:An Intuitive Insight [0.0] ディープニューラルネットワーク(DNN)のクラス不均衡は、近年研究の注目が急速に高まっているのを目撃している。
本研究は,授業の不均衡がDNNの学習力学に与える影響を系統的に検討する。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:18:52 GMT)
Multiscale Real-Time Object Detection in the NMS-Free Era: A Comparative Performance Evaluation of YOLOv8 and YOLO26 [0.0] 非最大抑圧(NMS)は、多くのリアルタイムオブジェクト検出パイプラインにおいて重要な後処理ステップである。
YOLO26のような最近のNMSのない設計は、エンドツーエンド検出によってこの依存を減らすことを目的としている。
本稿では,Pascal VOCとVisDroneのYOLOv8とYOLO26を比較した。
論文参考訳(メタデータ) (Sun, 24 May 2026 02:55:33 GMT)
Multimodality Stacking with Blockwise missing values and application to the PIONeeR biomarkers study for prediction of resistance to immunotherapy [0.0] 我々は,Multimodality Stacking with Blockwise missing Value (MSB)を紹介した。
MSBは、クロスバリデーション・スタックング・メタ・ラーナーを介して予測を集約する前に、モダリティ固有の特徴を独立にモデル化する。
MSBは肺がん患者の無再発生存を予測するためにPIONeeRで検証された。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:48:38 GMT)
MuJoCoUni:Persistent Batched Runtime Primitives for MuJoCo [0.0] MuJoCoUniはステートフル環境実行のためのランタイムプリミティブを提供する。
BatchEnvPoolは、環境ごとのmjModelコピー、スレッドごとのmjDataワーカー、内部スレッドプールを所有するC++/pybind11エグゼキュータである。
論文参考訳(メタデータ) (Sun, 24 May 2026 07:57:22 GMT)
Methodology for Creating a Clinically Verified Dermoscopic Image Dataset [0.0] 本研究は,医療情報学研究のための皮膚内視鏡画像の臨床的に検証されたデータセットを構築するための方法論を提案する。
国際コレクションは主に、通常のロシアの外来診療と移動皮膚内視鏡とは大きく異なる条件下で作成されました。
この手法を用いて,2025年6月から2026年5月までに443人の患者から1,026個の皮膚内視鏡像を収集した。
病理組織学的には39例の悪性病変がみられた。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:56:47 GMT)
LLM Agent Based Renewable Energy Forecasting Using Edge and IoT Data A Review of Solar Wind Weather and Grid Aware Decision Support [0.0] 再生可能エネルギー生成の信頼性予測は、グリッド安定エネルギー取引電池のスケジューリングとカーボン対応運転計画の基礎的な要件である。
スマートメーターインバータ、ピラノメーター、気象観測所、グリッドインターフェースセンサーにまたがるIoTとエッジデバイスの普及は、従来の予測パイプラインが十分に活用できないような、前例のない量のリアルタイム運用データを生み出した。
本稿では,大規模言語モデルLLMエージェントが,異質なセンサストリームの天気予報APIデータにグリッド制約とコンテキスト推論を組み込むことで,再生可能エネルギー予測を向上する方法について検討する。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:40:55 GMT)
Kernel Embedding for Operator-Valued Measures and Its Application to Quantum Tomography [0.0] 我々は、正の演算子値測度を再生ケルネルヒルベルト空間と量子状態空間のテンソル積に埋め込む量子共分散埋め込みを導入する。
テンソル化カーネル回帰として密度推定を再構成し、基底依存性の空間性制約を伴わずに最適な推論を可能にする。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:55:19 GMT)
K-U-KAN: Koopman-Enhanced U-KAN for 3D Dental Reconstruction from a Single Panoramic X-ray Radiograph [0.0] パノラマX線は3次元の顎を2次元のストリップに圧縮する。
既存の暗黙のニューラル表現は現実的なボリュームを生成するが、トレーニングが遅く、サンプリングや位置エンコーディングに敏感であり、実際にコストがかかる。
我々はK-U-KANという3段階のパイプラインを紹介し、K-U-KANは2次元特徴をKlmogorov-Arnold Networksで深度を意識した観測装置に持ち上げる。
論文参考訳(メタデータ) (Sun, 24 May 2026 16:44:18 GMT)
Interpretation, Learning, and Empathy as One Constraint: A Residual-Adequacy Architecture with Accountable Abstention [0.0] 一つの量から限界が生じる小さな認知アーキテクチャを開発する。
解釈決定ユニット(IDU)は、コンテントベクトルをレギュレーションのファミリを通じて解釈し、ライセンスするアクションを決定する。
任意のコンテンツと固定構成に対して、ユニークな端末証人を持つ有限個の有界コストステップで停止する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:57:28 GMT)
Influence-Inspired Spectral Rotations for Extreme Low-Bit LLM Quantization [0.0] 重みのみの極低ビット量子化に対する共役理論論文の影響を応用する。
BBTspectralはWikitext-2の難易度をW2A16のバニラオートラウンドと比較して58%削減することを示した。
論文参考訳(メタデータ) (Sun, 24 May 2026 18:05:37 GMT)
Growing a Neural Network in Breadth, Depth, and Time [0.0] 無限格子の有限部分集合として認識される再帰畳み込みニューラルネットワークにおいて、幅、深さ、時間の微分可能なコスト項を定義する。
3つのリソースはすべて、所定のレベルの精度を達成するために、相互に交換できることに気付きました。
論文参考訳(メタデータ) (Sun, 24 May 2026 17:11:05 GMT)
Global quantum phase estimation via hybrid quantum--classical learning [0.0] 変分量子干渉計は精度を高めるが、一般には狭い動作状態に制限される。
量子-古典型ニューラルネットワーク干渉計(VQ-CNNI)のハイブリッド化について紹介する。
この性能には量子符号化と古典復号の共最適化が必要である。
論文参考訳(メタデータ) (Sun, 24 May 2026 12:48:04 GMT)
FusionCore: A 23-State Unscented Kalman Filter for IMU, Wheel Encoder, GPS, and Visual SLAM Fusion in ROS 2 [0.0] FusionCoreはIMU、ホイールエンコーダのオドメトリー、GPS、Visual SLAMを融合したパッケージで、1つの100Hzのオドメトリーストリームにポーズする。
VSLAMのポーズフュージョンは、任意の視覚的オドメトリーやSLAMシステムでGPSによる操作を可能にする。
FusionCoreは12のシーケンスのうち10のシーケンスでAbsolute Trajectory Error(ATE)を低くする。
論文参考訳(メタデータ) (Sun, 24 May 2026 19:49:40 GMT)
Fine-Tuning Vision-Language Models for Understanding Current Damage and Scoring Priority with Quality Guard Agent [0.0] 日本の橋梁検査では5年ごとに視力検査が義務付けられている。
異なるエンジニアによって割り当てられた定性的な損傷評価(レベルa-e)は、レーダー間の大きなばらつきを示す。
本稿では,橋梁損傷理解と修復優先スコアの自動化手法を提案する。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:11:50 GMT)
Evidence-Linked Radiology Reporting: A Human-Supervised Reference Architecture for Structured Imaging Intelligence [0.0] 本稿では,構造化されたレポーティングのための人間によるエビデンスリンク型参照アーキテクチャを提案する。
このフレームワークは、試験固有のテンプレート、音声から構造までの処理、計測とセグメンテーションのキャプチャ、制御されたAI支援のドラフトを組み合わせる。
このシステムは、自律的なレポートジェネレータではなく、エンタープライズイメージングのための構造化されたインテリジェンス層として位置づけられている。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:07:14 GMT)
Error estimates for tamed Euler and Randomized Euler schemes for SDEs with locally Lipschitz drift with applications to non-logconcave sampling and optimization [0.0] 局所的なリプシッツによる微分方程式の数値的な離散化、超最適に成長するドリフト、そしてソボレフの不等式を満たす非対数凹分布からのサンプリングがもたらす意味について検討する。
超線形成長下での無作為なランダム化ランゲヴィンスキームの総変分における非漸近的保証を初めて確立する。
論文参考訳(メタデータ) (Sun, 24 May 2026 08:35:24 GMT)
Enhancing Autonomous Online Intrusion Detection for IoT with Balanced Learning, Reliable Pseudo-Labels, and Lightweight Architectures [0.0] 本稿では,IEEE INFOCOM 2024で発表された最先端の自律型オンラインIDSであるAOC-IDSについて検討する。
UNSW-NB15ベンチマークで最初にAOC-IDSを再現し、89.19%の精度で89.39%の精度を達成した。
次に、クラス不均衡、信頼できない擬似ラベル生成、限定的な一般化、IoTデプロイメントの計算オーバーヘッドの4つの重要な制限を特定します。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:48:30 GMT)
Decoupling Reentrancy Protection from Smart Contract Implementation Logic [0.0] 永続性攻撃は、分散アプリケーション(DApps)に対する永続的な脅威である
本稿では,Reentrancyの脆弱性を型に依存しない方法で軽減する,プロキシベースの新しいアプローチであるSentinelを紹介する。
主な機能は、ガス最適化内部ガードと高セキュリティ外部ロックレジストリの両方を提供するデュアルモードオペレーティングシステムである。
論文参考訳(メタデータ) (Sun, 24 May 2026 18:11:59 GMT)
Cultivating Machine Intelligence: The OMEGA Shift from Top-Down Optimization to Autopoietic Cognitive Ecologies [0.0] 本稿では,計算生態学による知性を育成するための理論的枠組みであるRECLAIMを紹介する。
ダーウィン一般主義は、勾配を盲目な変化と選択的保持に置き換える。
非エージェントの出現は、環境物理学による評価報酬を代用する。
このアーキテクチャは、マルコフが有界で有限計算エネルギーを競う自己ポエティック単位(autopoietic unit)を定めている。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:13:16 GMT)
Convex-Neural RRT*: Fast and Reliable Learning-Guided Sampling for High-Quality Robot Path Planning [0.0] 本稿では,高品質な経路に近い情報的経路領域を予測するための神経誘導を組み込んだ改良RT*であるConvex-Neural RRT*を提案する。
提案アルゴリズムは,3種類の環境と18個のベンチマークマップを用いて,ニューラルRT*,ニューラルインフォームドRT*,古典的RT*,LTA*に対して評価を行う。
実験結果から,Convex-Neural RRT*は神経誘導型に比べて30~75%,LTA*と比較して88~98%の時間を短縮し,複雑な環境下での大きな改善が見られた。
論文参考訳(メタデータ) (Sun, 24 May 2026 11:17:57 GMT)
Continuous-Depth Field Theory for Transformer Patching and Mechanistic Interpretability [0.0] 本稿では,そのような介入を整理し,予測するための場の理論的枠組みを開発する。
残留ストリームを深度対応フィールドとして扱うことにより,パッチを局所的なソース挿入として,パッチ効果を感度場予測として,下流伝播を経験的グリーン関数応答として,パッチ選択を随伴変分問題として定式化する。
論文参考訳(メタデータ) (Sun, 24 May 2026 19:26:25 GMT)
Context Features Are Cheap: Rank-Aware Decomposition for Efficient Feature Interaction in Recommender Systems [0.0] 本稿では,リコメンデータシステムにおける支配的相互作用機構に適用可能なランクアウェア分解について述べる。
この分解は、コンテキストのみの計算を、元のモデルと同等の1/1の要求から1/1の要求に移行する。
DLRMスタイルのランサーをアーキテクチャ変更せずに生産する場合、分解はポッド当たりのスループットを87.5%向上させる。
論文参考訳(メタデータ) (Sun, 24 May 2026 13:35:36 GMT)
Constraint-Anchored Attribution: Feasibility-Certified Counterfactuals and Bonferroni-PAC Sufficient Subsets for Neural CO Policies [0.0] LP-レラクゼーション双対による制約家族による決定を分解するニューラル・オプティマイゼーション(CO)政策への帰属法を提案する。
LP-anchored $-attribution is not the CF- derived signal。
論文参考訳(メタデータ) (Sun, 24 May 2026 19:46:30 GMT)
Causal Order Cannot Be An Observable [0.0] 因果構造に関する仮説を実証的に検証し比較する。
因果順序は可観測性の一種として解釈できるのか?
シャープだが条件2に反する因果クラスと条件3に反するクラスが見つかる。
論文参考訳(メタデータ) (Sun, 24 May 2026 23:41:56 GMT)
Bipartite Cholesky Graph Networks for Many-Body Quantum Chemistry [0.0] ERIのテンソル因子化は、自然に構造化されたバイパーティイトメッセージパッシングアーキテクチャを誘導することを示す。
我々は、軌道自由度と補助相互作用ノードを異なる集合としてモデル化する二部グラフネットワークを導出する。
論文参考訳(メタデータ) (Sun, 24 May 2026 21:50:00 GMT)
Benchmarking non-conformity score functions in conformal prediction [0.0] コンフォーマル予測は、機械学習の分類におけるモデルキャリブレーションに代わる有用で汎用的な代替手段である。
単一クラスの予測を予測セットに置き換える。
予測セットのサイズと有用性は、非整合スコア関数の選択に大きく依存する。
論文参考訳(メタデータ) (Sun, 24 May 2026 10:21:42 GMT)
Benchmark for Quantum Teleportation with Non-Uniform Prior Distributions [0.0] 量子テレポーテーションは、局所的な測定と古典的な通信で可能な最大忠実度閾値を超えるべきである。
我々は、絡みを使わずに、状態のテレポーテーションで達成可能な、最も高い平均忠実度を決定する。
量子優位性を宣言するための忠実度閾値は、一様分布で想定されるよりもはるかに高い値を示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 04:41:19 GMT)
ASTRO: Adaptive Spatio-Temporal Reinforcement Optimization for GNN Powered Anomly Detection in Cyber Physical Systems [0.0] 本稿では,新しい異常検出フレームワークASTRO(Adaptive Spatio-Temporal Reinforcement Optimization ASTRO)を紹介する。
深層Q-Network(DQN)とグラフニューラルネットワーク(GNN)、時間的モデリング、マルチヘッドアテンション機構を統合することで、ASTROはその決定境界を継続的に適用し、検出精度を向上させる。
ASTROのアプローチは、SWaT(Secure Water Treatment)とWADI(Water Distribution)という2つの実世界の産業ベンチマークで評価されている。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:30:14 GMT)
ARCANE-PedSynth: Synthetic Multi-Pedestrian Datasets with Behavioural Crossing Annotations [0.0] ARCANE-Ped Synthは、高密度な振る舞いアノテーションを持つ合成マルチペデストリアンデータセットを生成するためのフレームワークである。
ハイブリッドAI-手動歩行者制御アーキテクチャを通じて、CARLAのネイティブな9%の踏切速度を克服する。
RGB、LiDAR、DVSデータをフレーム単位のクロスラベル、動作状態、推定2Dポーズキーポイントと同期して生成する。
論文参考訳(メタデータ) (Sun, 24 May 2026 09:01:04 GMT)
A framework for the benchmarking of transport-induced excitations in shuttling-based ion-trap quantum processors [0.0] トラップイオン量子プロセッサにおけるイオンの運動状態に対する輸送の影響を解析する枠組みを開発する。
コスト関数としてコンパイラのレベルでの動作操作の価格を組み込む方法を示す。
論文参考訳(メタデータ) (Sun, 24 May 2026 15:04:18 GMT)
A comparative study of accuracy and rollout stability of temporal surrogate models [0.0] 時間的代理モデルは計算コストが禁じられるようなカオス力学系の予測に有効である。
この作業では、一般的なトレーニングプロトコルを使用して、いくつかの一般的なアーキテクチャを比較します。
二重振り子, 倉本-シヴァシンスキー方程式, コルモゴロフ流の3つの問題について実験を行った。
論文参考訳(メタデータ) (Sun, 24 May 2026 04:59:04 GMT)