Meta-Reinforcement Learning with Self-Reflection for Agentic Search [101.4] 本稿では,自己回帰を用いたエージェント検索のためのテキスト内メタ強化学習(RL)法であるMR-Searchを紹介する。
MR-Searchは、単一の独立したエピソード内のポリシーを微妙な報酬で最適化する代わりに、過去のエピソードを条件付けし、エピソードをまたいだ検索戦略を適応させるポリシーを訓練する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:07:34 GMT)
Beyond Short-Horizon: VQ-Memory for Robust Long-Horizon Manipulation in Non-Markovian Simulation Benchmarks [96.6] RuleSafeは、スケーラブルなLLM支援シミュレーションフレームワーク上に構築された、新しいオペレーティングベンチマークである。
VQ-Memoryはベクトル量子化変分オートエンコーダを用いたコンパクトで構造化された時間表現である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:21:40 GMT)
TINA: Text-Free Inversion Attack for Unlearned Text-to-Image Diffusion Models [92.6] テキスト中心のパラダイムは、消去とテキスト・ツー・イメージマッピングの厳密さを同一視し、望ましくない概念に関する基礎となる視覚的知識が今も続いていることを無視する。
我々は、この視覚のみのプローブをNull-text条件下で動作させることで、新しいテキストフリーのインバージョンアタックであるTinaを紹介する。
我々の実験では、Tinaは最先端の未学習モデルから消去された概念を再生することを示した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:25:03 GMT)
KineVLA: Towards Kinematics-Aware Vision-Language-Action Models with Bi-Level Action Decomposition [89.8] 本稿では,多様なキネマティック属性を密に符号化する,新しいキネマティックスリッチな視覚言語アクション(VLA)タスクを提案する。
この設定では、タスクゴールは不変のままであり、実行軌跡は命令レベルのキネマティック仕様に適応する必要がある。
我々は、KineVLAがキネマティクスに敏感なベンチマークで強いVLAベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:28:49 GMT)
Procedural Generation of Algorithm Discovery Tasks in Machine Learning [87.9] DiscoGenは、機械学習のためのアルゴリズム発見タスクの手続き的ジェネレータである。
それは、さまざまな機械学習分野から、さまざまな困難と複雑さの数百万のタスクにまたがる。
本稿では、ADAの原理的評価のために、DiscoGenタスクの固定された小さなサブセットからなるベンチマークを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:49:32 GMT)
Large Language Models as a Semantic Interface and Ethical Mediator in Neuro-Digital Ecosystems: Conceptual Foundations and a Regulatory Imperative [84.0] 本稿では,神経言語統合(NLI)の概念を紹介し,実証する。
これは、大規模言語モデルが生のニューラルネットワークとそのソーシャルアプリケーションの間の重要なセマンティックインターフェースとして機能する、人間とテクノロジーの相互作用のための新しいパラダイムである。
我々は、神経データ保護だけでなく、AIを介する意味論的解釈自体の倫理にも焦点をあてた「二階神経倫理学の発展を論じる」。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:34:17 GMT)
FACE-net: Factual Calibration and Emotion Augmentation for Retrieval-enhanced Emotional Video Captioning [81.3] Emotional Video Captioning (EVC) は、ビデオで表現される本質的な感情で事実を記述することを目的とした、新たなタスクである。
FActual and Emotion Augmentation (FACE-net) を用いた検索強化フレームワークを提案する。
FACE-netは、事実と感情のセマンティクスを協調的にマイニングし、生成のための適応的で正確なガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:53:15 GMT)
AgentVLN: Towards Agentic Vision-and-Language Navigation [78.7] VLN (Vision-and-Language Navigation) は、複雑な自然言語命令を、見えない環境での長距離ナビゲーションに接地するために、エンボディエージェントを必要とする。
本稿では,エッジコンピューティングプラットフォーム上に展開可能な,新規かつ効率的なナビゲーションフレームワークであるAgentVLNを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:43:47 GMT)
The Silent Thought: Modeling Internal Cognition in Full-Duplex Spoken Dialogue Models via Latent Reasoning [77.0] 内部認知処理は高品質な応答の定式化に役立っている。
本稿では,音声認識と同時に潜在的思考を行うFLAIRという新しい手法を提案する。
我々のアプローチは音声対話システムとシームレスに一致している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:30:29 GMT)
Variational Rectification Inference for Learning with Noisy Labels [74.9] 損失関数の適応的補正を定式化するために, 変分補正推論(VRI)を提案する。
VRIは、補正ベクトルを潜在変数として扱うことによって階層ベイズとして構成される。
VRIで変分項を導入することにより、条件付き後部を正確に推定し、ディラックデルタ関数への崩壊を避ける。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:25:08 GMT)
ARES: Scalable and Practical Gradient Inversion Attack in Federated Learning through Activation Recovery [73.8] Federated Learning(FL)は、モデルの更新を生データではなく共有することで、ユーザのプライバシ保護を目的としたコラボレーションモデルトレーニングを可能にする。
最近の研究によると、これらの共有更新は、勾配反転攻撃(GIA)を通じて、不注意にセンシティブなトレーニングデータを漏洩する可能性がある。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:40:44 GMT)
Transparent Fragments Contour Estimation via Visual-Tactile Fusion for Autonomous Reassembly [70.0] 視覚触覚融合に基づく一般的な透過的断片輪郭推定フレームワークを提案する。
触覚情報を視覚的手がかりと融合させることにより,視覚触覚融合材料を提案する。
実験の結果,提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:58:17 GMT)
TimeAPN: Adaptive Amplitude-Phase Non-Stationarity Normalization for Time Series Forecasting [67.9] TimeAPNは時間領域と周波数領域の両方から非定常因子を明示的にモデル化し、予測する。
TimeAPNは、複数の予測水平線にわたる長期的な予測精度を一貫して改善する。
これは最先端の可逆正規化法より優れている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:21:24 GMT)
TAPESTRY: From Geometry to Appearance via Consistent Turntable Videos [66.0] 明示的な3次元幾何学に基づく高忠実度TTVを生成するためのフレームワークであるTAPESTRYを紹介する。
また,3D-Aware Inpaintingを用いた多段パイプラインを特徴とする,TTV入力からの下流再構成タスクを設計する。
その結果,本手法はビデオの整合性と最終的な再現性の両方において,既存の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:02:09 GMT)
Insight-V++: Towards Advanced Long-Chain Visual Reasoning with Multimodal Large Language Models [65.5] 基礎画像中心モデルであるInsight-Vから進化した統合多エージェント視覚推論フレームワークを提案する。
空間的時間的推論を強化し、評価ロバスト性を向上させる2つの新しいアルゴリズムST-GRPOとJ-GRPOを導入する。
LLaVA-NeXTやQwen2.5-VLといったベースモデルの実験は、挑戦的な画像とビデオの推論ベンチマーク間で大きなパフォーマンス向上を示している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:28:07 GMT)
Omnilingual SONAR: Cross-Lingual and Cross-Modal Sentence Embeddings Bridging Massively Multilingual Text and Speech [61.8] 言語間の文エンコーダは通常、数百の言語をカバーしている。
我々はOmniSONARを紹介した。OmniSONARは全言語、言語横断、言語横断の文埋め込みモデルである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:24:53 GMT)
FINER: MLLMs Hallucinate under Fine-grained Negative Queries [61.6] FINER-Tuningで4つのフロンティアMLLMを微調整すると、ベンチマークから幻覚が最大24.2%向上する。
FINER-Tuningで4つのフロンティアMLLMを微調整すると、ベンチマークから幻覚が最大24.2%向上する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:28:05 GMT)
Unified Spatio-Temporal Token Scoring for Efficient Video VLMs [61.1] トケンプルーニングは視覚言語モデルの計算効率を高めるために不可欠である。
本稿では,視覚トークンを ViT と LLM の両方にわたってプルークする,シンプルで軽量なモジュールである Spatio-Temporal Token Scoring (STTS) を紹介する。
STTSはアーキテクチャ全体の視覚トークンの50%を突破し、トレーニングと推論の両方で効率が62%向上した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:59:56 GMT)
Video Understanding: From Geometry and Semantics to Unified Models [60.5] ビデオ理解は、モデルがダイナミックなビジュアルワールドを知覚し、相互作用できるようにすることを目的としている。
画像理解とは対照的に、ビデオ理解は本質的にモデリング力学と進化する視覚的コンテキストを必要とする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:31:47 GMT)
Omni-I2C: A Holistic Benchmark for High-Fidelity Image-to-Code Generation [59.9] 我々は,複雑な構造化デジタルグラフィックスを実行可能なコードに変換する上で,LMM(Large Multimodal Models)の能力を評価するために設計されたベンチマークであるOmni-I2Cを提案する。
真のユーザソースのケースを組み込むことで、このベンチマークは広範囲のデジタルコンテンツにまたがる。
評価の結果,主要なLMM間の性能差が顕著であることがわかった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:10:04 GMT)
Does YOLO Really Need to See Every Training Image in Every Epoch? [59.0] YOLO検出器は高速な推論速度で知られていますが、トレーニングには予期せぬ時間がかかります。
本稿では,どの画像を使用するべきかを動的に決定するアンチフォッティングサンプリング戦略(AFSS)を提案する。
AFSSはYOLOシリーズ検出器のトレーニングスピードアップを1.43ドル以上達成し、精度も向上した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:59:39 GMT)
Omnilingual MT: Machine Translation for 1,600 Languages [58.7] 我々は,1600以上の言語をサポートする最初の機械翻訳システムであるOmnilingual Machine Translation (OMT)を提案する。
このスケールは、大規模な公開多言語コーパスと新たに作成されたデータセットを統合する包括的なデータ戦略によって実現されている。
OMTモデルは言語間移動を改善し、1,600の評価において、MTのパズルの「理解」部分を解くのに近づいている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:25:51 GMT)
AHOY! Animatable Humans under Occlusion from YouTube Videos with Gaussian Splatting and Video Diffusion Priors [58.2] AHOYは,眼球内モノクローナルビデオから完全でアニマタブルな3Dガウスアバターを再構成する手法である。
我々は,これまで観測されていなかった身体領域の密集的な監視を実現するために,個人識別拡散モデルを用いた幻覚・超越パイプラインを開発した。
得られたアバターは、新しいポーズでアニメーションできるほど頑丈で、3DGSのシーンに合成され、携帯電話のビデオで撮影される。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:39:05 GMT)
PCA-Seg: Revisiting Cost Aggregation for Open-Vocabulary Semantic and Part Segmentation [58.2] 本稿では,クラスレベルのセマンティクスと空間コンテキスト間の知識干渉の課題を軽減するために,単純な並列コストアグリゲーション(PCA-Seg)パラダイムを提案する。
8つのベンチマークの実験では、PCA-Segの各並列ブロックは0.35万のパラメータしか追加せず、最先端のOSPS性能を実現している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:26:43 GMT)
Towards Safer Large Reasoning Models by Promoting Safety Decision-Making before Chain-of-Thought Generation [58.2] 大推理モデル (LRM) はチェーン・オブ・シント (CoT) による顕著な性能を達成した
近年の研究では、このような推論能力の強化は、安全性の大幅な低下を招いていることが示されている。
本稿では,COT生成開始前の安全意思決定を促進する新しい安全アライメント手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:21:12 GMT)
M2P: Improving Visual Foundation Models with Mask-to-Point Weakly-Supervised Learning for Dense Point Tracking [57.6] ビデオ理解の基本的なツールとして、Tracking Any Point (TAP)が登場した。
現在のアプローチでは、オフラインの微調整やテストタイムの最適化を通じて、DINOv2のようなビジョンファウンデーションモデル(VFM)を適用している。
本稿では、リッチビデオオブジェクトセグメンテーション(VOS)マスクアノテーションを利用して、高密度点追跡のためのVFMを改善するMask-to-Point(M2P)学習を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:06:22 GMT)
Modeling Overlapped Speech with Shuffles [57.3] シャッフルを用いて重なり合う音声など,データの並列ストリームをモデル化する。
重畳音声のアライメントと話者対応化には,シャッフル積と部分順序有限状態オートマトン (FSAs) がいかに有効かを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:28:58 GMT)
Versatile Editing of Video Content, Actions, and Dynamics without Training [57.2] 我々はDynaEditを紹介した。DynaEditは、事前訓練されたテキスト・ツー・ビデオ・フローモデルを用いて、多目的なビデオ編集機能を解放する訓練不要の編集方法である。
そこで,DynaEditは複雑なテキストベースのビデオ編集タスクにおいて,アクションの変更,シーンと対話するオブジェクトの挿入,グローバルな効果の導入など,最先端の成果を達成していることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:50:56 GMT)
World Reconstruction From Inconsistent Views [54.1] ビデオ拡散モデルは多様な世界を生成するが、個々のフレームは出力シーケンス全体の3D一貫性を欠いていることが多い。
ビデオフレームをグローバルに一貫性のある座標フレームに厳密に整列させることにより、これらの不整合を処理する新しい手法を提案する。
我々は,我々の3Dシーンがベースラインよりも高品質であることを示し,映像モデルを効果的に3D一貫性のあるワールドジェネレータにする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:16:47 GMT)
VeriAgent: A Tool-Integrated Multi-Agent System with Evolving Memory for PPA-Aware RTL Code Generation [52.4] 高品質なベリログコード生成のためのPPA対応ツール統合マルチエージェントフレームワークを提案する。
当社のフレームワークでは,EDAツールをtextitProgrammer Agent, textitCorrectness Agent, textitPPA Agentで構成されるクローズドループワークフローに明示的に組み込んでいる。
モデル再トレーニングなしに継続的な改善をサポートするために,構造化メモリノードに最適化エクスペリエンスを外部化するtextitEvolved Memory Mechanismを導入する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:25:40 GMT)
Stereo World Model: Camera-Guided Stereo Video Generation [52.4] 本稿では、ステレオビデオ生成のための外観と両眼形状を共同で学習するカメラコンディショニングステレオワールドモデルであるStereoWorldを紹介する。
単分子RGBやRGBDのアプローチとは異なり、StereoWorldはRGBモードでのみ動作する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:42:22 GMT)
FineViT: Progressively Unlocking Fine-Grained Perception with Dense Recaptions [52.4] FineViTは、微粒な知覚を解き放つために特別に設計された、新しい視覚エンコーダである。
我々はファインビジョン・エンコーダ(ファインビジョン・エンコーダ)を紹介した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:39:04 GMT)
Learning Transferable Temporal Primitives for Video Reasoning via Synthetic Videos [52.0] 時間的プリミティブをモデルに教えるポストトレーニングフレームワークであるSynRLを紹介する。
時間的理解を短期的原始(速度,方向)と長期的認知的原始に分解する。
単純な幾何学的形状のトレーニングにもかかわらず、SynRLは時間的グラウンド、複雑な推論、一般的なビデオ理解にまたがる15のベンチマークで大幅に改善されている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:10:47 GMT)
OMNIFLOW: A Physics-Grounded Multimodal Agent for Generalized Scientific Reasoning [51.3] 大規模言語モデル (LLM) は例外的な論理的推論能力を示しているが、部分微分方程式 (PDE) による連続力学としばしば競合する。
OMNIFLOWは, 領域固有のパラメータ更新を必要とせず, 基本物理法則で凍結LDMを基底として設計したマルチモーダルシンボリックアーキテクチャである。
我々は, 微視的乱流, 理論的ナビエ・ストークス, マクロ的世界天気予報のベンチマークでこれを評価した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:11:28 GMT)
LoST: Level of Semantics Tokenization for 3D Shapes [50.8] State-of-the-artメソッドは、もともとレンダリングと圧縮のために設計された幾何学的なレベル・オブ・ディテール(LoD)階層に依存している。
本稿では,初期接頭辞が完全かつ可塑性な形状をデコードするように,サリエンスを指示するレベル・オブ・セマンティックス・トークン化(LoST)を提案する。
LoSTはSOTA再構成を実現し、幾何的および意味的再構成のメトリクスにおいて、従来のLoDベースの3次元形状トークン化器を大きなマージンで上回っている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:56:06 GMT)
Universal Skeleton Understanding via Differentiable Rendering and MLLMs [50.8] SkeletonLLMは任意の骨格配列をMLLMのネイティブビジュアルモダリティに変換することで普遍的な骨格理解を実現する。
パイプラインはエンドツーエンドで微分可能であるため、MLLMグラデーションは直接レンダリングをガイドしてタスク不変のビジュアルトークンを生成することができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:59:12 GMT)
From Drop-off to Recovery: A Mechanistic Analysis of Segmentation in MLLMs [50.2] マルチモーダル大言語モデル(MLLM)は、ピクセルレベルの視覚タスクにますます適用されているが、空間的理解の本質的な能力は理解されていない。
本稿では,MLLMパイプライン全体(ビジョンエンコーダ,アダプタ,LSM)の階層的線形探索によるセグメント化能力について検討する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:22:15 GMT)
GigaWorld-Policy: An Efficient Action-Centered World--Action Model [50.1] GigaWorld-Policyはアクション中心のWAMで、2Dピクセルアクションのダイナミクスを学習し、オプションのビデオ生成で効率的なアクションデコーディングを可能にする。
実世界のロボットプラットフォームでの実験結果によると、GigaWorld-Policyは主要なWAMベースラインであるMotusの9倍高速で動作する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:52:02 GMT)
Bringing Network Coding into Multi-Robot Systems: Interplay Study for Autonomous Systems over Wireless Communications [48.4] 通信はマルチロボットシステムのコアイネーブルである。
本稿では,通信損失と遅延を緩和するトランスポート層信頼性機構が,自律通信ループを形成する方法を示す。
本稿では,ロボット間通信の遅延と損失による協調的局所化と,安全クリティカルなオーバーテイク操作の2つのケーススタディを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:26:17 GMT)
MolRGen: A Training and Evaluation Setting for De Novo Molecular Generation with Reasonning Models [48.3] 我々は、推論に基づく大規模言語モデルのトレーニングと評価のためのベンチマークとデータセットであるMorRGenを紹介する。
まず,textitde novo分子生成と特性予測のためのモデルの評価と訓練を行う。
第2に、生成分子の品質と多様性の両方をキャプチャする、多様性を意識した新しいトップ・ドルスコアを導入する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:21:04 GMT)
VIEW2SPACE: Studying Multi-View Visual Reasoning from Sparse Observations [47.9] 多視点視覚推論は、スパースと離散的な視点から複雑な環境を理解する必要があるインテリジェントシステムにとって不可欠である。
現実のシナリオでは、ビュー間の推論は、明示的なガイダンスなしで部分的な観察を統合する必要がある。
我々は物理基底シミュレーションを利用して、ビュー毎の正確なメタデータを持つ多種多様な高忠実な3Dシーンを構築する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:22:15 GMT)
GMT: Goal-Conditioned Multimodal Transformer for 6-DOF Object Trajectory Synthesis in 3D Scenes [47.9] GMTは、現実的でゴール指向のオブジェクトトラジェクトリを生成するマルチモーダルトランスフォーマーフレームワークである。
人工的および実世界のベンチマークの実験では、GMTは最先端の人間の動きや人間と物体の相互作用のベースラインより優れていることが示されている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:54:35 GMT)
From Digital Twins to World Models:Opportunities, Challenges, and Applications for Mobile Edge General Intelligence [47.5] 6G以降の通信システムへの急速な進化は、デジタルツインと世界モデルのネットワークエッジへの収束を加速させている。
従来のデジタルツインは物理システムの高忠実度表現を提供し、モニタリング、分析、オフライン最適化をサポートする。
本稿では,デジタル双生児から世界モデルへの移行を体系的に調査し,エッジ汎用インテリジェンスの実現におけるその役割について論じる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:54:49 GMT)
MicroVision: An Open Dataset and Benchmark Models for Detecting Vulnerable Road Users and Micromobility Vehicles [47.4] このデータセットは、8000以上の匿名化フルHDイメージと30,000以上の慎重に注釈付けされたVRUとMMVで構成されている。
データセットとともに、最先端アーキテクチャに基づく最初のベンチマークオブジェクト検出モデルを提供します。
データセットとモデルはトラフィックの安全性をサポートし、異なるVRUとMMVを区別したり、監視システムがマイクロモビリティの使用を識別するのに役立つ。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:40:08 GMT)
AR-CoPO: Align Autoregressive Video Generation with Contrastive Policy Optimization [47.4] ストリーミング自動回帰(AR)ビデオジェネレータと数段蒸留を組み合わせることで、低レイテンシで高品質な合成を実現する。
本稿では,ストリーミングAR生成に対するNighbor GRPOのコントラスト的視点を適応させるフレームワークであるAR-CoPOを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:07:01 GMT)
SHIFT: Motion Alignment in Video Diffusion Models with Adversarial Hybrid Fine-Tuning [47.4] 本稿では,映像拡散モデルにおける動きアライメントの問題について考察する。この問題に対処するために,画素フラックスダイナミクスに基づく画素運動報酬を導入する。
ビデオ拡散モデルのためのスケーラブルな報酬駆動微調整フレームワークであるSmooth Hybrid Fine-tuning (SHIFT)を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:04:02 GMT)
SaFeR-Steer: Evolving Multi-Turn MLLMs via Synthetic Bootstrapping and Feedback Dynamics [47.3] SaFeR-Steerはプログレッシブなマルチターンアライメントフレームワークである。
ステージ化されたブートストラップとチューター・イン・ザ・ループのGRPOを組み合わせることで、適応的でオン・ポリティクスな攻撃の下で1人の学生を訓練する。
STEERはSTEER-SFT (12,934), STEER-RL (2,000), STEER-Bench (3,227) ダイアログを210ターンに分散したマルチターンマルチモーダル安全データセットである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:28:29 GMT)
Argument Reconstruction as Supervision for Critical Thinking in LLMs [47.3] 任意の引数(GAAR)を自動的に再構成するエンジンを提案する。
GAARエンジンを用いて、新しい高品質な引数再構成データセット(Arguinas)を合成する。
実験結果から,7つの批判的思考課題において,議論再構成学習のためのモデルが,そうでないモデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:17:54 GMT)
EVA: Aligning Video World Models with Executable Robot Actions via Inverse Dynamics Rewards [47.3] ビデオ生成モデルは、ロボット工学の世界モデルとしてますます使われている。
現在のビデオワールドモデルは、明示的な実行可能性の制約を欠いている。
本稿では,ビデオワールドモデルを調整するための強化学習フレームワークであるExecutable Video Alignment (EVA)を紹介する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:02:19 GMT)
Loc3R-VLM: Language-based Localization and 3D Reasoning with Vision-Language Models [47.0] Loc3R-VLMは、モノクロビデオ入力から高度な3D理解機能を備えた2Dビジョンランゲージモデルを備えたフレームワークである。
人間の空間認識にインスパイアされたLoc3R-VLMは、グローバルなレイアウト再構築と明示的な状況モデリングという2つの共同目的に依存している。
幾何学的整合性と計量スケールの整合性を確保するために,事前学習した3次元基礎モデルから抽出した軽量カメラポーズの先行情報を活用する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:59:10 GMT)
DexGrasp-Zero: A Morphology-Aligned Policy for Zero-Shot Cross-Embodiment Dexterous Grasping [47.0] 異種手動と身体的制約により、クロス・エボディメントの把握は困難である。
既存のアプローチは通常、中間運動目標を予測し、それぞれの実施形態に再ターゲットする。
多様な実施形態から普遍的な把握能力を学ぶ政策であるDexGrasp-Zeroを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:53:12 GMT)
SCALE:Scalable Conditional Atlas-Level Endpoint transport for virtual cell perturbation prediction [46.6] 仮想セル摂動予測のための大規模基盤モデルを提案する。
まず、データスループットを大幅に改善するBioNeMoベースのトレーニングおよび推論フレームワークを構築します。
第二に、摂動予測を条件付き輸送として定式化し、それをセットアウェアフローアーキテクチャで実装する。
第3に,生物学的に有意な指標に基づく厳密なセルレベルプロトコルを用いて,Tahoe-100Mのモデルを評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:51:08 GMT)
Learning When to Attend: Conditional Memory Access for Long-Context LLMs [46.5] 言語モデルは、事前訓練された文脈長を超えて一般化するのに苦労する。
本稿では,L2A(Learning To Attend)を提案する。
L2Aは標準的な長文トレーニングのパフォーマンスを3%以内にし、Global Attentionを$sim$80%のトークンでスキップする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:48:18 GMT)
FrescoDiffusion: 4K Image-to-Video with Prior-Regularized Tiled Diffusion [46.5] 本稿ではFrescoDiffusionについて紹介する。FrescoDiffusionは1つの画像からコヒーレントな大フォーマットI2V生成のためのトレーニング不要な手法である。
4K 生成では,タイルごとの雑音予測を計算し,この基準を拡散時間毎にフューズする。
VBench-I2Vデータセットと提案したフレスコI2Vデータセットの実験により,タイル付きベースラインに対するグローバルな一貫性と忠実度が改善された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:02:37 GMT)
Q-Drift: Quantization-Aware Drift Correction for Diffusion Model Sampling [45.9] ポストトレーニング量子化(PTQ)は、大規模な拡散モデルを展開するための実践的な方法である。
本稿では,量子化誤差を暗黙の摂動として扱うQ-Driftを提案する。
Q-Driftは、キャリブレーションから時間的変動統計を推定し、実際には5つの完全精度/量子化キャリブレーションを必要とする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:19:36 GMT)
AdaZoom-GUI: Adaptive Zoom-based GUI Grounding with Instruction Refinement [44.1] そこで我々は,AdaZoom-GUIを提案する。AdaZoom-GUIは適応的なズームベースのGUI基盤フレームワークで,ローカライゼーションの精度と命令理解の両面を改善する。
提案手法では,自然言語コマンドを明示的で詳細な記述に書き換える命令修正モジュールを導入する。
さらに,予測された小要素に対して第2段階の推論を選択的に行う条件付きズームイン戦略を設計する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:26:18 GMT)
Information Pathways in Online Science Communication: The Role of Platform Actors and News Media [43.8] 新型コロナウイルスのパンデミックをケーススタディとして、パンデミックに関連する科学論文を参考に、124万のツイートと211万のニュース記事を分析します。
この談話でもっとも影響力のあるTwitterアカウントは、主に医療や研究の資格を持つ個人である。
また,ワクチン,ロックダウン,関連トピックに対するコントラリアン的,アンチコンセンサス的立場を推し進める,少数の著名な資格専門家を不均等に増幅するネットワークも同定した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:08:20 GMT)
CodeScout: An Effective Recipe for Reinforcement Learning of Code Search Agents [43.4] 標準Unix端末にしか搭載されていない符号化エージェントをトレーニングして,強靭な結果が得られることを示す。
本研究は,コード検索,報酬設計,RL最適化のための既存のコーディングエージェント環境を再利用する技術に重点を置いている。
得られたモデルファミリであるCodeScoutと、コミュニティが構築するすべてのコードとデータをリリースします。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:25:42 GMT)
Improved quantum circuits for division [42.8] 様々な整数分割アルゴリズムのための新しいフォールトトレラント量子回路を開発した。
回路は最大76.08%、68.35%のT数とCNOT数を実現している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:41:43 GMT)
SegFly: A 2D-3D-2D Paradigm for Aerial RGB-Thermal Semantic Segmentation at Scale [42.7] 航空画像のセマンティックセグメンテーションのためのスケーラブルな幾何学駆動型2D-3D-2Dパラダイムを提案する。
RGBイメージの3%未満をセマンティック3Dポイントクラウドに持ち上げることで、RGBラベルの97%と熱ラベルの100%を生成します。
我々はこの2D-3D-2Dパラダイムを、中間アライメント空間として3次元幾何学を用いて、クロスモーダル画像登録に拡張する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:57:22 GMT)
S-VAM: Shortcut Video-Action Model by Self-Distilling Geometric and Semantic Foresight [42.7] ビデオアクションモデル(VAM)は、ロボット学習のための有望なパラダイムとして登場した。
S-VAMは、1つのフォワードパスを介してコヒーレントな幾何学的および意味的表現を予測できるショートカットビデオアクションモデルである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:40:46 GMT)
Quantum Field Approaches to Chemical Systems [42.1] 量子場理論(QFT)は真空中および空洞や溶媒のような環境下での分子の共有結合および非共有結合相互作用にアプローチする。
QFTは、新しい化学理論と洞察のための豊富な遊び場を提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:36:29 GMT)
Listening to the Echo: User-Reaction Aware Policy Optimization via Scalar-Verbal Hybrid Reinforcement Learning [42.1] 感情支援システムのための反応認識ポリシー最適化(RAPO)を提案する。
RAPOは、対話を反応駆動プロセスとして扱い、シミュレーションされたユーザ応答を利用して、高密度な自然言語フィードバックを生成する。
RAPOは、肯定的な相互作用の結果の駆動において、強い強化学習ベースラインを著しく上回る。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:59:23 GMT)
Beyond Outliers: A Data-Free Layer-wise Mixed-Precision Quantization Approach Driven by Numerical and Structural Dual-Sensitivity [42.0] LMPQ(Layer-wise mixed-precision Quantization)は、極端な低ビット設定下での効率的な圧縮を可能にする。
数値的および構造的二重感性によって駆動される新しいキャリブレーションフリーLMPQフレームワークNSDSを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:30:54 GMT)
DSS-GAN: Directional State Space GAN with Mamba backbone for Class-Conditional Image Synthesis [42.0] DSS-GANは,Mambaを階層型ジェネレータのバックボーンとして使用し,ノイズ・ツー・イメージ合成に利用した最初の生成逆ネットワークである。
中心的な貢献はDLR(Directional Latent)であり、これは遅延ベクトルを方向特異的なサブベクターに分解する新しい条件付け機構である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:58:47 GMT)
SafeLand: Safe Autonomous Landing in Unknown Environments with Bayesian Semantic Mapping [41.9] 安全な自律着陸(SAL)のための視覚ベースシステムであるSafeLandを紹介する。
提案手法は,ディープラーニングに基づくセマンティックセマンティックセグメンテーションによるオンラインセマンティックグラウンドマップを構築し,組み込みデプロイメントに最適化する。
本手法を高度100mまでの産業・都市・農村環境における200のシミュレーションと60のエンドツーエンドフィールドテストで広範囲に評価した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:11:54 GMT)
PanoVGGT: Feed-Forward 3D Reconstruction from Panoramic Imagery [41.2] PanoVGGTは、1つの前方パスで1つまたは複数のパノラマからカメラのポーズ、深度マップ、および3Dポイントの雲を共同で予測する。
さらに,深度と6-DoFのポーズアノテーションを備えた大規模屋外パノラマデータセットであるPanoCityをコントリビュートした。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:24:06 GMT)
Report-based Recommendations for Policy Making and Agency Operations: Dataset and LLM Evaluation [40.8] 大規模言語モデル(LLM)はテキスト生成タスクで広く使われている。
本稿では,私的・公的な組織内で活動する機関の今後の行動や改善を通知するためのレコメンデーションを作成できる新しいタスクを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:15:33 GMT)
Sharpness-Aware Minimization in Logit Space Efficiently Enhances Direct Preference Optimization [40.7] 直接選好最適化(DPO)は、事前訓練された大規模言語モデルと人間の選好を整合させる一般的なアルゴリズムとして登場した。
DPOは、最近特定されたスクイーズ効果に悩まされ、トレーニング中に好ましくない反応の確率が無意識に減少する。
我々はロジット空間における座標ワイドダイナミクスをモデル化する理論的枠組みを開発する。
Pythia-2.8B、Mistral-7B、Gemma-2B-ITの実験は、ロジットSAMが一貫してDPOの有効性を改善することを示した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:26:10 GMT)
PC-CrossDiff: Point-Cluster Dual-Level Cross-Modal Differential Attention for Unified 3D Referring and Segmentation [40.5] 3Dビジュアルグラウンディングは2つのコアタスクを通して自然言語参照表現をローカライズすることを目的としている: Referring Expression (3DREC)とReferring Expression (3DRES)
既存の手法は、暗黙の局所化キューの不十分な解析と、共起物体からの動的空間干渉の非効率な抑制という、複雑な多目的シーンにおいて2つの重要な課題に直面している。
PC-CrossDiffは3DRECと3DRESのための2レベルクロスモーダルアテンションアーキテクチャを備えた統合デュアルタスクフレームワークである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:16:48 GMT)
PACE-RAG: Patient-Aware Contextual and Evidence-based Policy RAG for Clinical Drug Recommendation [40.2] PACE-RAG (Patient-Aware Contextual and Evidence-based Policy RAG) は、患者個別のコンテキストを類似事例の処方傾向で合成する新しいフレームワークである。
PACE-RAGは、特定の臨床信号に合わせた治療パターンを解析することにより、最適な処方薬を特定し、説明可能な臨床概要を生成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:40:53 GMT)
Chipmunq: A Fault-Tolerant Compiler for Chiplet Quantum Architectures [40.1] 我々は,フォールトトレラント回路をモジュールアーキテクチャにマッピングし,ルーティングするためのハードウェア対応コンパイラChipmunqを紹介する。
Chipmunqは、最先端のツールに比べてコンパイル時間の13.5倍のスピードアップを実現している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:06:24 GMT)
Mimic Intent, Not Just Trajectories [39.8] これは、根底にある意図を理解せずに生の軌道を模倣することに由来すると我々は主張する。
エンド-2-end IL: Mimic Intent, not just Trajectories。
いくつかの操作ベンチマークと実際のロボットの実験では、最先端の成功率、優れた推論効率、障害に対する堅牢な一般化、効果的なワンショット転送が示されている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:05:39 GMT)
VISTA: Validation-Guided Integration of Spatial and Temporal Foundation Models with Anatomical Decoding for Rare-Pathology VCE Event Detection [39.5] 我々は、RARE-VISIONタスクを、純粋にフレームワイズな分類タスクではなく、メトリック整列イベント検出問題として定式化する。
フレームレベルの強い視覚的意味論のためのDINOv3 ViT-L/16と、局所的時間的文脈のためのEndoFM-LVの2つの相補的バックボーンを組み合わせた。
検証の短縮は、補完的なバックボーン、検証誘導融合、解剖学的に認識された時間的デコーディングが、すべてイベントレベルのパフォーマンスに寄与することを示している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 23:01:12 GMT)
A 3D Reconstruction Benchmark for Asset Inspection [39.2] 地上の真理深度マップ,カメラポーズ,および3つの合成シーンのメッシュモデルを用いた新しいデータセットを提案する。
本研究では,このデータセット上での最先端の再構築手法について検討する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:42:14 GMT)
MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems [38.4] マルチエージェントシステム(MAS)は複雑な臨床診断支援の可能性を秘めている。
現在のMAS医学研究は、不均一なデータ摂取と一貫性のない視覚的推論評価に悩まされている。
我々は,シームレスなマルチエージェントシステムのための統合フレームワークとベンチマークプラットフォームであるMedMASLabを紹介する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:17:16 GMT)
ShapleyLaw: A Game-Theoretic Approach to Multilingual Scaling Laws [37.6] 我々はtextitShapleyLaw というゲーム理論の多言語スケーリング法を提案する。
実験の結果,ShapleyLawはモデル性能予測と言語混合最適化において,ベースライン法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:17:18 GMT)
SSP-SAM: SAM with Semantic-Spatial Prompt for Referring Expression Segmentation [37.6] SAM(Segment Anything Model)は、画像のセグメンテーションに優れるが、自然言語を理解する能力は限られている。
本研究では,SSPエンコーダの統合によりSAMのセグメンテーション機能を完全に活用するフレームワークであるSSP-SAMを提案する。
SSP-SAMは、プロンプトジェネレータの参照表現を強化し、SAMが言語でガイドされる正確なマスクを生成するための高品質なSSPを生成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:26:07 GMT)
ECHO: Towards Emotionally Appropriate and Contextually Aware Interactive Head Generation [37.5] 対話型ヘッドジェネレーション (Interactive Head Generation, IHG) は、このような機能をエミュレートしたライフライクなアバターヘッドビデオを合成することを目的としている。
ECHOは、Long-range Contextual Understanding (LCU) コンポーネントとブロックワイド空間対応のDecoupled Cross-attention Modulation (SDCM) モジュールの2つの主要なコンポーネントからなる新しいIHGフレームワークである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:07:01 GMT)
Coherent Human-Scene Reconstruction from Multi-Person Multi-View Video in a Single Pass [36.8] CHROMMは、カメラ、シーンポイントクラウド、ヒューマンメッシュを多人数のマルチビュービデオから共同で推定する統合フレームワークである。
我々は、Pi3XとMulti-HMRの強力な幾何学的および人間的事前知識を、単一のトレーニング可能なニューラルネットワークアーキテクチャに統合する。
EMDB, RICH, EgoHumans, EgoExo4Dによる実験により, CHROMMはグローバルな人間の動きと多視点ポーズ推定において競争力を発揮することが示された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:38:22 GMT)
AutoMoT: A Unified Vision-Language-Action Model with Asynchronous Mixture-of-Transformers for End-to-End Autonomous Driving [36.8] OURSは、単一の視覚言語アクション(VLA)モデルで推論とアクション生成を統合するエンドツーエンドのADフレームワークである。
OURSは最先端の手法と比較して競争性能が高いことを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:00:30 GMT)
SEAL-Tag: Self-Tag Evidence Aggregation with Probabilistic Circuits for PII-Safe Retrieval-Augmented Generation [36.5] SEAL-Tagは個人識別可能な情報を保護するランタイム環境(PII)
SEAL-TagはSEAL-Probeプロトコルを導入し、監査を構造化されたツール使用操作に変換し、モデルがそのドラフトと共に検証可能なPII-Evidence Table(PET)を生成する。
プライバシ"コールドスタート"問題を克服するため,S0-S6アンコレッド合成パイプラインを導入し,高忠実で実証されたRAGインタラクションを生成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:40:54 GMT)
InfoDensity: Rewarding Information-Dense Traces for Efficient Reasoning [36.4] 冗長性は単に長さの問題ではなく、中間的推論品質の低下の症状であると主張する。
本稿では,AUCに基づく報酬と単調報酬を組み合わせたRLトレーニングのための報奨フレームワークであるInfoDensityを,推論品質の統一尺度として提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:11:36 GMT)
Temporal Gains, Spatial Costs: Revisiting Video Fine-Tuning in Multimodal Large Language Models [36.3] 我々は,ビデオSFTがMLLMの視覚能力にどう影響するかを系統的に研究する。
Video-SFTは、ビデオのパフォーマンスを確実に改善するが、静的画像ベンチマークでは、利得や劣化が制限されることが多い。
本稿では,フレーム数を適応的に割り当て,映像と映像のトレードオフを部分的に緩和する命令対応ハイブリッドフレーム戦略について検討する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:46:44 GMT)
Fine-Grained Post-Training Quantization for Large Vision Language Models with Quantization-Aware Integrated Gradients [36.0] 大規模視覚言語モデル (LVLM) は、マルチモーダル相互作用を必要とする下流タスクにおいて、顕著な成功を収めた。
既存のLVLM量子化法は、複雑なクロストークン相互作用を捉えるのに失敗するモダリティレベルでトークン感度を測定する。
機械的解釈可能性における公理的帰属に着想を得て、量子化対応統合勾配(QIG)の微粒化量子化戦略を導入する。
提案手法はLLaVA-onevision-7Bの平均精度を1.60%向上させ,LLaVA-onevision-7Bの完全精度とのギャップを1.33%に短縮する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:03:43 GMT)
CARE: Covariance-Aware and Rank-Enhanced Decomposition for Enabling Multi-Head Latent Attention [35.4] 固定KV幅の共分散対応・ランク強化型MLA変換パイプラインを提案する。
CAREは、3つの重要なステップを紹介している: (i) 活性化保存因子化 (i) 重量だけでなく実際の入力アクティベーションと近似を一致させる) 調整されたランク割り当て (ii) 固定されたKV予算を層に分散させ、最も必要な層により多くのキャパシティを与える) 変換されたKとVをパラメータ化してMLAフォーマットに適合させるKVパリティマッピング (iii) 。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:18:35 GMT)
DebugLM: Learning Traceable Training Data Provenance for LLMs [35.0] DebugLMは、大規模な言語モデルに組み込みのデータプロファイランスを提供するフレームワークである。
モデルは、応答と、責任あるデータセットを示すユニークなタグを関連付けることを学習する。
この機能に基づいて、DebugLMはターゲットとなるテストタイムの修復をサポートする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:06:21 GMT)
Goedel-Code-Prover: Hierarchical Proof Search for Open State-of-the-Art Code Verification [35.0] 大規模言語モデル(LLM)は可塑性コードを生成することができるが、正確性には限界がある。
本稿では,Lean4における自動コード検証のための階層的証明検索フレームワークを提案する。
Goedel-Code-Prover-8Bは、分解と完了の両方のための単一の統一ポリシーです。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:42:04 GMT)
DarkDriving: A Real-World Day and Night Aligned Dataset for Autonomous Driving in the Dark Environment [34.4] 我々は、自動運転の低照度化を調査するための新しいベンチマークデータセット(DarkDriving)を提案する。
ダークドライブは、低照度向上、一般化された低照度向上、暗黒環境における2次元検出のための低照度強化、自律運転の3次元検出を含む4つの認知関連タスクを導入している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:36:16 GMT)
ChopGrad: Pixel-Wise Losses for Latent Video Diffusion via Truncated Backpropagation [33.7] 本稿では,ChopGradについて紹介する。ChopGradはビデオ復号化のための切り離されたバックプロパゲーション方式で,グローバルな一貫性を維持しつつ,ローカルフレームウインドウへの勾配を制限している。
本稿では, この近似の理論的解析を行い, フレーム単位の損失で効率的な微調整を可能にすることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:04:57 GMT)
Symmetry-Reduced Physics-Informed Learning of Tensegrity Dynamics [33.5] 多くの既存の物理インフォームドニューラルネットワーク(PINN)アプローチは、固有の幾何学的対称性を明示的に活用していない。
本稿では,群理論に基づく対称性を解表現とニューラルネットワークアーキテクチャの両方に直接組み込む,対称性を再現した物理インフォームドニューラルネットワーク(SymPINN)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:23:23 GMT)
OmniVLN: Omnidirectional 3D Perception and Token-Efficient LLM Reasoning for Visual-Language Navigation across Air and Ground Platforms [33.4] 言語誘導型エンボディナビゲーションでは、エージェントがオブジェクト参照命令を解釈し、複数の部屋を探索し、参照されたターゲットをローカライズし、それに対する信頼できる動きを実行する必要がある。
OmniVLNは、全方位3次元知覚とトークン効率の高い階層的推論を、空中と地上の両方で組み合わせたゼロショット視覚言語ナビゲーションフレームワークである。
実験により、提案した階層インタフェースは空間参照精度を77.27%から93.18%に改善し、マルチルームの乱雑な設定で累積的なプロンプトトークンを61.7%削減し、フラットで最大11.68%のナビゲーション成功率向上を実現した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:26:30 GMT)
Consistency-Driven Dual LSTM Models for Kinematic Control of a Wearable Soft Robotic Arm [33.3] 本稿では,ウェアラブルデバイスに組み込まれた空気圧作動式ロボットアームの前方および逆運動学を正確に学習するための一貫性駆動型デュアルLSTMフレームワークを提案する。
この手法は, アクティベーション入力とエンドエフェクタ位置の1対1マッピング問題に対処しながら, ソフト空気圧アクチュエータの非線形およびヒステリックな挙動を効果的に捉えている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:51:12 GMT)
Generative Control as Optimization: Time Unconditional Flow Matching for Adaptive and Robust Robotic Control [33.0] 動作合成を反復的最適化に変換する時間非条件フレームワークGeCOについて紹介する。
テスト時間推論は、単純な状態に対して収束開始早期に基づいて計算を割り当てる適応的なプロセスとなり、難しい状態に対してはより長く精製する。
我々は,GeCOを標準シミュレーションベンチマークで検証し,pi0シリーズのVision-Language-Action(VLA)モデルにシームレスなスケーリングを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:27:17 GMT)
Humans and transformer LMs: Abstraction drives language learning [32.9] 本稿では,トランスフォーマーに基づく言語モデルが言語カテゴリーをどのように学習するかを検討する。
構成が学習されると、構文的なクラスレベルの振る舞いは、語彙的なアイテム固有の振る舞いよりも早い段階で明らかになる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:30:20 GMT)
R2-Dreamer: Redundancy-Reduced World Models without Decoders or Augmentation [32.8] 本稿では,自己指導型のモデルベース強化学習フレームワークであるR2-Dreamerを提案する。
DeepMind Control SuiteとMeta-Worldでは、R2-DreamerはDreamerV3やTD-MPC2のような強力なベースラインと競合し、DreamerV3よりも1.59倍高速でトレーニングし、小さなタスク関連オブジェクトでDMC-Subtleでかなりの利益を得ている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:54:07 GMT)
CytoSyn: a Foundation Diffusion Model for Histopathology -- Tech Report [32.6] 我々は,病理組織学的H&E染色画像のガイド生成を可能にする,最先端の基盤潜時拡散モデルであるCytoSynを紹介する。
本モデルは,32種類のがんの1万以上のTCGA診断画像から得られたデータセットに基づいて訓練されている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:58:07 GMT)
Design and implementation of a modular laser system for AMO experiments [32.5] レーザーは、量子コンピューティングのような原子ベースの量子技術の主要な構成要素である。
レーザー源からイオントラップまでの効率は21~28%、レーザー安定化線幅は1MHz以下である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:15:27 GMT)
Recurrent Reasoning with Vision-Language Models for Estimating Long-Horizon Embodied Task Progress [32.5] Recurrent Reasoning Vision-Language Model(textR2$VLM)を提案する。
本モデルでは,局所的なビデオスニペットを反復的に処理し,グローバルなコンテキストを維持するリカレント推論フレームワークを特徴とする。
ALFREDとEgo4Dから生成された大規模で自動生成されたデータセットに対して、textR2$VLMをトレーニングします。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:13:29 GMT)
Who Tests the Testers? Systematic Enumeration and Coverage Audit of LLM Agent Tool Call Safety [32.4] 大規模言語モデル(LLM)エージェントは、テキスト生成のみではなく、ツールコールに安全を集中させる外部ツールを通じて、ますます機能するようになっている。
最近のベンチマークでは、さまざまな環境やリスクカテゴリにまたがるエージェントを評価しているが、根本的な疑問は解決されていない。
まず、有効なツールコールと多様なユーザシナリオを列挙して、テストケースを体系的に生成する列挙子。次に、非セマンティックで定量的な尺度であるルール耐性を導入する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:06:47 GMT)
Mutually Causal Semantic Distillation Network for Zero-Shot Learning [32.3] ゼロショット学習(ZSL)は、サイドインフォメーション(属性など)によって導かれるオープンワールドにおける見えないクラスを認識することを目的としている。
その主要なタスクは、視覚的特徴と属性的特徴の間の潜在的な意味的知識を、どのように推測するかである。
ZSLの本質的かつ十分な意味表現を抽出するために,相互に基づく属性ベースセマンティックネットワーク(termed++)を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:44:54 GMT)
A Creative Agent is Worth a 64-Token Template [32.0] テキスト・トゥ・イメージ(T2I)モデルは画像の忠実度を大幅に改善し、定着を早めたが、それらの創造性は独立した自然言語のプロンプトに依存している。
textbfAgent textbfTokenizationのフレームワークであるtextbfCATを紹介した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:25:52 GMT)
VisionNVS: Self-Supervised Inpainting for Novel View Synthesis under the Virtual-Shift Paradigm [31.7] VisionNVSはカメラのみのフレームワークで、不適切な外挿問題からのビュー合成を自己監督型インペイントタスクに再構成する。
また,VisionNVSは,LiDARに依存したベースラインよりも優れた幾何学的忠実度と視覚的品質が得られることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:57:46 GMT)
EPOFusion: Exposure aware Progressive Optimization Method for Infrared and Visible Image Fusion [31.4] EPOFusion(エポフュージョン)は、赤外線および可視光融合モデルである。
オーバー露光領域から微細な赤外線特徴を抽出する際のエンコーダを容易にするための誘導モジュールが導入された。
マルチスケールのコンテキスト融合モジュールを組み込んだ反復デコーダは、融合した画像を徐々に強化するように設計されている。
より優れた露光認識を実現するために、最初の赤外線および可視光過剰露光データセットを構築した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 23:22:14 GMT)
Baguan-TS: A Sequence-Native In-Context Learning Model for Time Series Forecasting with Covariates [31.3] Baguan-TSは、3Dトランスフォーマーによってインスタンス化されるICLと生系列表現学習を統合している。
i) キャリブレーションとトレーニング安定性, 特徴に依存しない目標空間検索に基づく局所キャリブレーション, および (ii) コンテクストオーバーフィッティング戦略によって緩和された出力過スムージングの2つの主要なハードルに対処する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:24:19 GMT)
Learning Evolving Preferences: A Federated Continual Framework for User-Centric Recommendation [31.3] プライバシ保護方式で長期的なパーソナライズを支援するために設計された,連合型継続的レコメンデーションフレームワークを提案する。
異種ユーザデータに基づく協調パーソナライゼーションを実現するために,類似ユーザからの知識を用いて,各クライアントの表現を豊かにするユーザ間プロトタイプ転送機構を設計する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:20:15 GMT)
One-to-More: High-Fidelity Training-Free Anomaly Generation with Attention Control [31.0] 工業的異常検出 (AD) は, 正常な画像が多数存在するが, 異常な画像が不足していることが特徴である。
我々は,より現実的な異常を合成するために,訓練不要な小ショット異常生成手法,すなわちO2MAGを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:32:41 GMT)
Action Draft and Verify: A Self-Verifying Framework for Vision-Language-Action Model [31.0] VLA(Vision-Language-Action)モデルは、最近、具体化されたタスク間で強力なパフォーマンスを示した。
本稿では,拡散行動専門家が複数の候補アクションチャンクをドラフトし,VLMが各候補を1つの前方パスに1つの難易度基準でスコア付けして1つを選択することを提案する。
マッチしたバックボーン、トレーニングデータ、アクション・チャンク長では、ADVは拡散ベースのベースラインよりも実世界の+4.3ポイント、+19.7ポイントで成功率を向上させる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:16:20 GMT)
OGScene3D: Incremental Open-Vocabulary 3D Gaussian Scene Graph Mapping for Scene Understanding [30.7] OGScene3Dは,正確な3次元セマンティックマッピングとシーングラフ構築を段階的に行う,オープン語彙のシーン理解システムである。
本システムは,セマンティック予測と信頼性を協調的にモデル化する自信に基づくガウス意味表現を用いている。
2D-3Dセマンティック一貫性とガウスレンダリングのコントリビューションを統合することで、この手法はシーン全体のセマンティック理解を継続的に洗練する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:47:56 GMT)
Next-Frame Decoding for Ultra-Low-Bitrate Image Compression with Video Diffusion Priors [30.7] 超低ビットレート画像圧縮(ULB-IC)のための新しいパラダイムを提案する。
我々はデコード中の明示的な中間状態(コンパクトアンカーフレーム)を定義する。
次に、生成復号化を、このアンカーから最終的な再構成画像への仮想時間遷移として再解釈する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:45:53 GMT)
Rel-Zero: Harnessing Patch-Pair Invariance for Robust Zero-Watermarking Against AI Editing [30.5] 拡散に基づく画像編集は、デジタルビジュアルコンテンツの信頼性に重大な脅威をもたらす。
また,Zero-WatermarkingR(el-Zero)を提案する。Zero-WatermarkingRはオリジナル画像の変更を必要としないが,編集不変のパッチ関係からユニークなゼロ透かしを導出するフレームワークである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:40:00 GMT)
Towards Infinitely Long Neural Simulations: Self-Refining Neural Surrogate Models for Dynamical Systems [30.0] 自己精製型ニューラルサロゲートモデル(SNS)は、スタンドアロンモデルまたは既存のニューラルサロゲートの補完モデルとして実装することができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:14:40 GMT)
A Unified Language Model for Large Scale Search, Recommendation, and Reasoning [29.8] 我々は,事前学習されたデコーダのみのLLMを,ツールフリーでカタログを基盤としたジェネレータに適応させるフレームワークNEOを紹介する。
NEOは、アイテムをSIDとして表現し、自然言語と型付きアイテム識別子をインターリーブするために単一のモデルを訓練する。
我々は,複数のメディアタイプと発見タスクにまたがる1000万項目以上の実世界のカタログ上で,NEOを大規模に評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:42:32 GMT)
VolumeDP: Modeling Volumetric Representation for Manipulation Policy Learning [29.6] VolumeDPは空間アライメントを3Dで明示的に推論することで復元するポリシーアーキテクチャである。
LIBEROシミュレーションベンチマークでは、最先端の平均成功率は88.8%に達する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:40:24 GMT)
UniSAFE: A Comprehensive Benchmark for Safety Evaluation of Unified Multimodal Models [29.4] UniSAFEは、Unified Multimodal Models (UMMs) のシステムレベルの安全性評価のための最初の総合的なベンチマークである。
UniSAFEはタスク固有のI/O設定に共通するリスクシナリオを提案し、安全障害のクロスタスク比較を制御可能にする。
以上の結果から,マルチイメージ構成における安全性違反の増大や,マルチターン設定など,現在のUMMにおける重大な脆弱性が明らかになった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:30:31 GMT)
Deploying Semantic ID-based Generative Retrieval for Large-Scale Podcast Discovery at Spotify [29.4] Spotifyにおけるポッドキャスト発見のためのプロダクションスケール生成レコメンデータを開発した。
GLIDEは、セマンティックIDを使用して識別されたカタログ上の命令追従タスクとして推奨を定式化する。
GLIDEはSpotifyのホームサーフェス上での非居住ポッドキャストストリーミングを最大5.4%増加し、新しいショー発見を最大14.3%増加させる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:46:10 GMT)
Grounding Robot Generalization in Training Data via Retrieval-Augmented VLMs [28.9] RADARは、テスト時間評価タスクとポリシートレーニングデータを比較するためのフレームワークである。
本稿では,視覚言語モデル(VLM)が一般化のためのデータ解析に有効であることを示す。
我々はRADARを大規模データセットに拡張し、人間の定義したベンチマーク条件との一致を観察する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:58:07 GMT)
Is Your LLM-as-a-Recommender Agent Trustable? LLMs' Recommendation is Easily Hacked by Biases (Preferences) [28.7] textbfBias textbfRecommendation textbfBenchmarkを導入し、高価値な実世界のタスクにおけるバイアスに対するそのようなエージェントの致命的な脆弱性を明らかにする。
このベンチマークには、ペーパーレビュー、eコマース、求職の3つの実践的領域が含まれている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:50:48 GMT)
SafeTutors: Benchmarking Pedagogical Safety in AI Tutoring Systems [28.6] SafeTutorsは、数学、物理学、化学における安全性と教育を共同で評価するベンチマークである。
スケールは確実に役に立ちませんし、マルチターンダイアログは振る舞いを悪化させ、教育上の失敗は17.7%から77.8%に上昇します。
ハームは主題によっても異なるため、緩和は規律を意識する必要があり、シングルターンの"セーフ/ヘルパフル"の結果は、拡張された相互作用よりも体系的な家庭教師の失敗を隠蔽することができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:33:50 GMT)
A Noise Sensitivity Exponent Controls Large Statistical-to-Computational Gaps in Single- and Multi-Index Models [28.5] ノイズ感度指数 (NSE) が統計的-計算的ギャップの存在と大きさを制御していることを示す。
本研究は,NSEを高次元学習における雑音頑健性,計算硬度,特徴特化をリンクする統一特性として同定した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:26:41 GMT)
Joint Degradation-Aware Arbitrary-Scale Super-Resolution for Variable-Rate Extreme Image Compression [28.2] ASSR-EICは可変レートの極端な画像圧縮をサポートする新しい画像圧縮フレームワークである。
我々は、再構成を導く前に圧縮と再スケーリングを意識した拡散を利用して、高い忠実性と高いリアリズムの回復をもたらす。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:35:53 GMT)
Deep learning and the rate of approximation by flows [28.1] 連続力学系設定における深部残差ネットワークの近似能力の深さ依存性について検討する。
この最小時間は微分同相写像の部分フィンスラー多様体上の測地距離と同一視できることを示す。
結果から, 深層学習における重要な近似機構, すなわち, 合成や力学による関数の近似は, 線形近似理論と根本的に異なることが示唆された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:52:59 GMT)
VisBrowse-Bench: Benchmarking Visual-Native Search for Multimodal Browsing Agents [27.6] 視覚ネイティブ検索のための新しいベンチマークVisBrowse-Benchを紹介した。
複数のドメインをカバーする169のVQAインスタンスを含んでいる。
探索過程におけるモデルの視覚的推論能力を評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:40:14 GMT)
Material Magic Wand: Material-Aware Grouping of 3D Parts in Untextured Meshes [26.9] 非テクスチャメッシュにおける物質認識部分グループ化の問題を紹介する。
ピンコーンのスケールや建物の窓など、現実世界の多くの形状は、同じ素材を共有しながら幾何学的なバリエーションを示す繰り返し構造を含んでいる。
本研究では, アーティストが推定材料特性に基づいて, パートグループを選択できるツールであるMaterial Magic Wandを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:25:38 GMT)
Text-to-Stage: Spatial Layouts from Long-form Narratives [26.9] 構造化されていないテキストから空間的推論を実証する言語モデルの能力について検討する。
ドラマトゥルギーにインスパイアされた決定論的評価スイートと,トレーニングと推論のレシピを紹介する。
古典英語文学のテキストのみのコーパスの実験では、バニラモデルよりも改善が示されている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:26:27 GMT)
Nonlocal Games as Cross-Platform Quantum Benchmarks: Exceeding unconditional classical bounds on trapped-ion processors [26.5] 非局所ゲームは、古典的な性能境界が情報理論である量子ハードウェアのアプリケーションレベルベンチマークを提供する。
我々は,このゲームタイプの量子古典的分離を示す最小のグラフである14頂点グラフカラーゲームを,3つの施設にまたがる4つのトラップイオン量子プロセッサ上に実装した。
あるシステムは古典的境界を統計的に上回り、量子ハードウェア上で非局所的なゲームに色付けするグラフにおいて古典的境界を初めて違反したことを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 22:14:12 GMT)
VC-Soup: Value-Consistency Guided Multi-Value Alignment for Large Language Models [26.5] 本稿では,バリュー一貫性学習に基づくデータフィルタリングとパラメータ統合フレームワークであるVC-soupを提案する。
本稿では,VC-Soupが競合を効果的に軽減し,既存の多値アライメント手法より一貫して優れていることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:05:51 GMT)
AdaRadar: Rate Adaptive Spectral Compression for Radar-based Perception [26.2] レーダーは自律運転システムにおいて重要な知覚モダリティである。
高次元生レーダデータの高いボリュームは、コンピュータエンジンとの通信リンクを飽和させる。
適応フィードバックを用いたレーダデータ圧縮を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:42:34 GMT)
Towards Motion-aware Referring Image Segmentation [26.1] 原文から動き中心のフレーズを抽出する効率的なデータ拡張手法を提案する。
また,融合画像テキスト埋め込みを用いたMRaCL(Multimodal Radial Contrastive Learning)を提案する。
実験により,複数のRISモデルにまたがる動作中心クエリの性能が大幅に向上した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:45:59 GMT)
MM-OVSeg:Multimodal Optical-SAR Fusion for Open-Vocabulary Segmentation in Remote Sensing [26.0] 気象条件下での弾力性開語彙セグメンテーションのための多モード光-SAR融合フレームワークMM-OVSegを提案する。
現在の視覚言語モデルのクロスモーダル領域ギャップと限定的な密度予測能力に対処するために,2つの重要な設計手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:34:23 GMT)
SoulX-LiveAct: Towards Hour-Scale Real-Time Human Animation with Neighbor Forcing and ConvKV Memory [25.6] 自己回帰(AR)拡散モデルは、ビデオ合成のような逐次生成タスクのための有望なフレームワークを提供する。
同じ雑音条件下で隣接フレームを時間的に伝播する拡散ステップ整合AR式であるNeighbor Forcingを提案する。
提案手法は,既存のAR拡散法と比較して,トレーニング収束,時間スケール生成品質,推論効率を著しく向上させる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:19:24 GMT)
Rapid Adaptation of Particle Dynamics for Generalized Deformable Object Mobile Manipulation [25.5] 変形可能な物体を未知のダイナミクスで操作する学習の課題に対処する。
脚と手動の剛体操作のような他のロボット領域では、最先端のアプローチは未知のダイナミクスを扱うことができる。
実ロボット変形可能なオブジェクト移動操作を学習する2相法であるRAPiDを開発した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:09:55 GMT)
Proof-of-Authorship for Diffusion-based AI Generated Content [25.4] 著者が潜在拡散モデル(LDM)を用いて生成されたオブジェクトのオーサリングを主張しようとするシナリオに焦点を当てる。
本稿では,クレームが偽である確率を定量化する確率的代弁者を含むオーサシップの証明フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:21:47 GMT)
AdaMuS: Adaptive Multi-view Sparsity Learning for Dimensionally Unbalanced Data [25.2] 感情認識タスクでは、ビデオフレームは106ドルに達することが多いが、生理的信号は101ドル程度しかない。
既存の手法は、しばしば低次元の視点を見渡して、高次元のデータに偏っている。
本稿では,冗長次元を柔軟に抑制し,各視点を効果的に整合させるスパース融合パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:22:47 GMT)
Pretrained Multilingual Transformers Reveal Quantitative Distance Between Human Languages [25.1] 本稿では,事前学習した多言語言語モデルを言語計測の体系的な手段として活用する手法を提案する。
これらのモデルの自然発生的注意機構が,言語間距離の頑健かつトークン化に依存しない尺度を提供することを示す。
この結果から,ニューラルネットワークを用いた言語仮説の検証の基礎が確立された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:50:23 GMT)
MG-Grasp: Metric-Scale Geometric 6-DoF Grasping Framework with Sparse RGB Observations [24.7] シングルビューRGB-Dグリップ検出は6-DoFロボットグリップシステムにおいて一般的な選択肢である。
MG-Graspは,高品質な物体把握を実現する新しい6-DoFグルーピングフレームワークである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:23:29 GMT)
TeachingCoach: A Fine-Tuned Scaffolding Chatbot for Instructional Guidance to Instructors [24.5] TeachingCoachは,リアルタイムな会話指導を通じて,インストラクターのプロフェッショナル開発を支援するように設計されている。
教育リソースから教育ルールを抽出するデータ中心パイプライン上に構築されている。
専門家による評価では、TeachCoachはGPT-4oのミニベースラインよりも明確で、より反射的で、より応答性の高いガイダンスを生成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:35:53 GMT)
Noise-resilient nonadiabatic geometric quantum computation for bosonic binomial codes [24.4] 本稿では,二項符号を用いた非断熱的幾何量子計算を実現するための耐雑音性プロトコルを提案する。
このプロトコルは、二項符号に基づく幾何量子ゲートに対して比較的高い平均忠実度が得られることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:09:56 GMT)
Implementation of non-local arbitrary two-qubit controlled gates via geometric quantum computation with Rydberg anti-blockade [24.3] 本稿では,非断熱的ホロノミック量子計算に基づく高忠実度制御単位ゲートの新しい手法を提案する。
数値シミュレーションにより, 自発放射やレーザ強度誤差があっても, 幾何ゲートは高い忠実度を維持していることがわかった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:20:31 GMT)
Thousand-GPU Large-Scale Training and Optimization Recipe for AI-Native Cloud Embodied Intelligence Infrastructure [24.1] 身体知は人工知能(AGI)の鍵となるステップである
私たちは、インテリジェンスを具体化するクラウドベースの1000GPU分散トレーニングプラットフォームをローンチした。
我々はエンドツーエンド評価システムを構築し、トレーニングからシミュレーション、評価まで、クローズドループを作成しました。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:30:14 GMT)
SARE: Sample-wise Adaptive Reasoning for Training-free Fine-grained Visual Recognition [24.0] 学習不要なファイングラインド視覚認識のためのサンプルワイド適応型textbfREasoning フレームワーク SARE を提案する。
SAREは高速な候補検索ときめ細かい推論を組み合わせ、必要なときにのみ後者を呼び出す。
推論プロセスでは、SAREは、過去の失敗を活用して、転送可能な差別的ガイダンスを提供する自己反射的な体験メカニズムを取り入れている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:49:27 GMT)
Synthetic Data Generation for Training Diversified Commonsense Reasoning Models [23.6] 分散化(GCR)のための最初の合成データセットCommonSynを作成するための2段階手法を提案する。
合成データに基づいて微調整したモデルでは,バニラモデルと比較して生成の多様性と品質が両立している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 23:58:37 GMT)
MCoT-MVS: Multi-level Vision Selection by Multi-modal Chain-of-Thought Reasoning for Composed Image Retrieval [23.5] Composed Image Retrieval (CIR) は、参照画像と修正されたテキストに基づいてターゲット画像を取得することを目的としている。
CIRのためのMCoT-MVS(Multi-level Vision Selection)を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:49:19 GMT)
UAV-CB: A Complex-Background RGB-T Dataset and Local Frequency Bridge Network for UAV Detection [23.5] 現実のシナリオでは、UAVは建物、植生、電力線などの周囲の構造物と視覚的に混ざり合っていることが多い。
既存のUAV検出データセットは様々だが、これらのカモフラージュと複雑な背景の課題を捉えるために特別に設計されたものではない。
我々は、低高度背景とカモフラージュ特性を強調するために意図的にキュレートされた新しいRGB-T UAV検出データセットであるUAV-CBを構築した。
また、RGB-T核融合における周波数-空間融合ギャップとモード間差ギャップを橋渡しするために、局所周波数空間を特徴付けるローカル周波数ブリッジネットワーク(LFBNet)を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:55:35 GMT)
Process Supervision for Chain-of-Thought Reasoning via Monte Carlo Net Information Gain [23.3] マルチステップ推論は、大規模言語モデル(LLM)の機能を改善するが、中間ステップで伝播するエラーのリスクを増大させる。
プロセス報酬モデル(PRM)は、各ステップを個別にスコアすることでこれを緩和し、きめ細かい監督と信頼性の向上を可能にします。
本稿では,情報理論を用いた段階ラベルの自動生成手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:08:01 GMT)
Atomic Trajectory Modeling with State Space Models for Biomolecular Dynamics [23.3] ATMOSは、生体分子系のための原子レベルのMD軌道を生成するために設計された新しい生成フレームワークである。
ATMOSは, タンパク質モノマーと複雑なタンパク質-リガンド系の両方に対して, コンフォメーショントラジェクトリを生成する際に, 最先端の性能を実現することを実証した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:53:45 GMT)
Human-AI Co-reasoning for Clinical Diagnosis with Evidence-Integrated Language Agent [23.1] PULSE (Pulse) は、言語モデルと科学文献検索を組み合わせた医学推論剤である。
実験では,PULSEの成績を,様々な専門知識を持つ医師と比較した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:58:09 GMT)
Understanding the Theoretical Foundations of Deep Neural Networks through Differential Equations [22.7] 我々は、ディープニューラルネットワーク(DNN)の理解、分析、改善のための理論的基礎として微分方程式を提示する。
我々は、DNN全体を微分方程式として解釈するモデルレベルと、個々のDNN成分を微分方程式としてモデル化する層レベルを2倍の視点として採用する。
これら2つの観点から、このフレームワークがモデル設計、理論的分析、性能改善とどのように結びつくのかを概観する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 22:41:02 GMT)
Differential Privacy in Generative AI Agents: Analysis and Optimal Tradeoffs [22.7] 大規模言語モデル(LLM)とAIエージェントは、企業システムに統合され、内部データベースにアクセスし、コンテキスト対応の応答を生成する。
このような統合によって生産性と意思決定サポートが向上する一方で、モデル出力は必然的にセンシティブな情報を明らかにする可能性がある。
本稿では,AIエージェントのプライバシー漏洩を差分プライバシーに基づいて解析するための確率的フレームワークを開発する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:35:12 GMT)
Actionable Recourse in Competitive Environments: A Dynamic Game of Endogenous Selection [22.7] アクションブル・リコースは、AI支援意思決定支援システムが生み出す好ましくない結果を覆すために、個人が実現可能な特徴を修正できるかどうかを研究する。
本研究では,リスクベース選択規則の下での候補間の戦略的相互作用をモデルとした枠組みを提案する。
先に選択した候補が成功のベンチマークと改善の方向性の両方を決定することを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:45:11 GMT)
TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas [22.7] 我々はTRUST(Truthful Reasoning with Unknown via Tools)を提案する。
我々は,このタスクを,自律エージェントが構造化された4相プロトコルを用いて検証された推論を行う部分観測可能なマルコフ決定プロセスとして定式化する。
トークンレベルマスキングの利点を適用することで、この戦略は、調査報酬を実行結果から分離し、クレジットの割り当てを解決する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:45:57 GMT)
DancingBox: A Lightweight MoCap System for Character Animation from Physical Proxies [22.5] DancingBoxは、モーションキャプチャーを初心者でも利用できるようにするビジョンベースのシステムだ。
正確な人間の動きを追跡する代わりに、DancingBoxは1つのウェブカメラでユーザーが操作する日常的な物体の動きを捉えている。
ユーザ調査によると、DancingBoxは、ぬいぐるみからバナナまで、さまざまなプロキシを使って直感的でクリエイティブなキャラクターアニメーションを可能にし、初心者アニメーターの参入障壁を低くしている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:23:20 GMT)
ShuttleEnv: An Interactive Data-Driven RL Environment for Badminton Strategy Modeling [22.5] 本稿では,バドミントンのためのインタラクティブでデータ駆動型シミュレーション環境であるShuttleEnvを紹介する。
ShuttleEnvは、速いペースの相手スポーツにおける強化学習と戦略的行動分析をサポートする。
我々はShuttleEnv内で複数の訓練されたエージェントを紹介し、バドミントンラリーのライブ、ステップバイステップの可視化を提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:37:39 GMT)
Event-Centric Human Value Understanding in News-Domain Texts: An Actor-Conditioned, Multi-Granularity Benchmark [22.3] textbfNEVU (textbfNews textbfEvent-centric textbfValue textbfUnderstanding) は,実ニュースにおける強調因子に依存しない,エフェヴェント中心で,かつ,間接的認識を意識した人的価値認識のためのベンチマークである。
NEVUは、モデルが値キューを識別し、それらを正しいアクターに属性し、根拠付きエビデンスから値方向を決定することができるかどうかを評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:31:33 GMT)
Prompt-Free Universal Region Proposal Network [22.0] プロンプト自由地域提案ネットワーク(PF-RPN)について紹介する。
PF-RPNは、外部のプロンプトに依存することなく、潜在的なオブジェクトを識別する。
実験結果から, 提案手法の有効性が検証された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:02:13 GMT)
F2HDR: Two-Stage HDR Video Reconstruction via Flow Adapter and Physical Motion Modeling [22.0] クロス露光の不整合性と複雑な動きにより、フレーム間のアライメントが難しくなり、ゴーストや細部が失われる。
既存の手法では, 動作優先領域における不正確なアライメント, 準最適特徴集約, 劣化した復元品質に悩まされることが多い。
本稿では,フレーム間の動きを強く知覚し,複雑な動的シナリオにおいて細部を復元する2段階HDRビデオ再構成フレームワークF2を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:08:07 GMT)
Efficient and flexible preparation of photonic NOON states in a superconducting system [21.9] 超伝導系に埋め込まれた2つのマイクロ波キャビティ内のNOON状態を生成するための効率的なプロトコルを提案する。
このプロトコルは柔軟性があり、様々な物理システムに適用できる可能性がある。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:21:37 GMT)
EchoGen: Cycle-Consistent Learning for Unified Layout-Image Generation and Understanding [21.7] EchoGenはレイアウト・ツー・イメージ生成と画像グラウンドのための統合されたフレームワークである。
画像グラウンドには強いテキストとレイアウト理解能力があり、レイアウト・ツー・イメージ生成の限界を補うことができる。
レイアウトから生成された画像は、内容の多様性が高く、画像グラウンド化の堅牢性を高める。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:59:03 GMT)
Discovering Decoupled Functional Modules in Large Language Models [21.5] 大規模言語モデルは、どのように異なる関数をモジュールにまとめるかは、まだ明らかにされていない。
本研究では,LLM全体の大きなニューロン群を同時にモジュールに分解する,教師なしLLMクロスレイヤー分子発見(ULCMOD)フレームワークを提案する。
本稿では,新しい目的関数と効率的なイテレーティブ・デカップリング(IterD)アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:13:02 GMT)
CN-Buzz2Portfolio: A Chinese-Market Dataset and Benchmark for LLM-Based Macro and Sector Asset Allocation from Daily Trending Financial News [21.5] 大規模言語モデル(LLM)は、静的自然言語処理(NLP)タスクから動的意思決定エージェントへと急速に移行している。
直接のライブトレーディングは非生産的であり、スキルに幸運を抱くことによって結果バイアスを起こす傾向にあるが、既存の静的ベンチマークはエンティティレベルの株式選択に限定され、より広範な市場注目を無視することが多い。
この研究は、一般的な推論と金融決定の整合性に関する新たな洞察を与え、持続可能な金融エージェントの研究を促進するために、すべてのデータ、コード、実験がリリースされる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:31:28 GMT)
Learning Coordinate-based Convolutional Kernels for Continuous SE(3) Equivariant and Efficient Point Cloud Analysis [21.3] 剛体運動の対称性は、3次元点雲問題の効率的な学習における健全な要素の1つである。
群畳み込みは同変の特徴を抽出する代表的な方法である。
Equivariant Coordinate-based Kernel Convolution(ECKConv)を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:45:55 GMT)
LGESynthNet: Controlled Scar Synthesis for Improved Scar Segmentation in Cardiac LGE-MRI Imaging [21.2] 制御可能な拡張合成のための遅延拡散に基づくフレームワークであるLGE SynthNetを紹介する。
a)条件特定監督のための報酬モデル、(b)記述的テキストプロンプトのためのキャプションモジュール、(c)生体医学的テキストエンコーダ。
たった429枚の画像(79人の患者)で訓練され、解剖学的に一貫性のあるサンプルを生成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 23:40:33 GMT)
NV-Bench: Benchmark of Nonverbal Vocalization Synthesis for Expressive Text-to-Speech Generation [21.2] NV-ベンチ(NV-Bench)は,NVを音響的アーティファクトではなく伝達作用として扱う機能分類に基礎を置いた最初のベンチマークである。
NV-Benchは、14のNVカテゴリでバランスの取れた1,651の多言語、単語内発話とペアの人間の参照音声からなる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:16:23 GMT)
PJB: A Reasoning-Aware Benchmark for Person-Job Retrieval [21.1] パーソン・ジョブマッチングは、明示的な制約を検証し、スキル・トランスファー推論とジョブ・コンピテンシー推論を実行するシステムを必要とする。
既存のベンチマークでは、このタスクの体系的な診断サポートは提供されていない。
PJB(PJB)を導入した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:08:06 GMT)
How do LLMs Compute Verbal Confidence [20.5] 言語的信頼感は、自己評価の自動化を反映しており、ポストホック再建ではないことを示す。
これらの知見は, LLMにおけるメタ認知の理解とキャリブレーションの改善に影響を及ぼす。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:31:43 GMT)
NavThinker: Action-Conditioned World Models for Coupled Prediction and Planning in Social Navigation [20.2] 社会的なナビゲーションには、ロボットがダイナミックな人間の環境で安全に行動する必要がある。
我々は,行動条件付き世界モデルと政治強化学習を結合した将来的なフレームワークであるNavThinkerを提案する。
シングルロボットとマルチロボットのSocial-HM3Dの実験では、最先端のナビゲーションが成功し、Social-MP3Dにゼロショットで転送され、Unitree Go2上で現実世界にデプロイされる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:08:12 GMT)
ReLaGS: Relational Language Gaussian Splatting [20.1] 本稿では,階層型言語で区切られたガウシアンシーンと,シーン固有の訓練を伴わない3Dセマンティックシーングラフを構築する新しいフレームワークを提案する。
この階層の上に、視覚言語由来のアノテーションとグラフニューラルネットワークに基づくリレーショナル推論を備えたオープンな3Dシーングラフを構築します。
本手法は,階層的セマンティクスとオブジェクト間の相互関係を共同でモデル化することにより,効率的でスケーラブルな3次元推論を可能にする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:18:23 GMT)
Edit-As-Act: Goal-Regressive Planning for Open-Vocabulary 3D Indoor Scene Editing [20.0] Edit-As-Actは3D空間における目標回帰計画としてオープン語彙シーン編集を行うフレームワークである。
言語駆動のプランナーが行動を提案し、バリケータがゴール指向性、単調性、身体的実現性を強制する。
E2A-Benchでは,9つの屋内環境を対象とした63の編集タスクのベンチマークを行った。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:46:42 GMT)
GUIDE: GenAI Units In Digital Design Education [19.5] GenAI Units In Digital Design Education (GUIDE) はオープンなコースウェアリポジトリであり、ランナブルなGoogle Colabラボやその他の教材がある。
本稿では,スライド,ショートビデオ,ランナブルラボ,関連論文などからなる標準化された教育単位に基づく,リポジトリのアーキテクチャと教育手法について述べる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:43:47 GMT)
ZipServ: Fast and Memory-Efficient LLM Inference with Hardware-Aware Lossless Compression [19.5] ロスレスモデル圧縮は、ビットエクササイズ大言語モデル(LLM)サービスにおけるメモリと帯域幅のボトルネックを軽減するために、非常に有望である。
既存のアプローチは、GPUアーキテクチャと基本的な設計ミスマッチのため、かなり推論が遅くなることが多い。
我々は、効率的なLLM推論のために共同設計されたロスレス圧縮フレームワークZipServを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:21:21 GMT)
A Progressive Visual-Logic-Aligned Framework for Ride-Hailing Adjudication [19.5] RideJudgeは、一般的な視覚的セマンティクスと厳密な顕在的プロトコルの間のギャップを埋めるプログレッシブなビジュアル論理指向フレームワークである。
我々のフレームワークは88.41%の精度を達成し、32Bスケールのベースラインを超え、解釈可能な適応のための新しい標準を確立する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:46:30 GMT)
EvoGuard: An Extensible Agentic RL-based Framework for Practical and Evolving AI-Generated Image Detection [19.5] EvoGuardはAIGI検出のための新しいエージェントフレームワークである。
様々な最先端(SOTA)のMLLMと非MLLM検出器を呼び出し可能なツールとしてカプセル化している。
正と負のサンプル間のバイアスを緩和しながらSOTA精度を達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:14:40 GMT)
Physics-informed Deep Mixture-of-Koopmans Vehicle Dynamics Model with Dual-branch Encoder for Distributed Electric-drive Trucks [19.5] 複合分散電動車(DET)に適したデータ駆動動的モデリング手法を提案する。
まず、動的状態を符号化し、KODEと題するクープマン方式の強力な基盤を提供する新しいデュアルブランチエンコーダを提案する。
エンコーダとクープマン演算子の両方の効果的な学習を容易にするために、物理インフォームド監視機構をトレーニングプロセスに組み込む。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:47:40 GMT)
Predicting Trajectories of Long COVID in Adult Women: The Critical Role of Causal Disentanglement [19.2] 我々は,将来のPASCスコアを予測するために,Large Language Modelに基づく因果ネットワークを開発した。
重症度予測の精度は86.7%であった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:42:25 GMT)
Efficient Soft-Output Guessing for Enhanced Quantum Tanner Code Decoding [19.1] SOGRANDは、標準的な信念伝播とOSDベースラインを最大3桁の論理誤り率で上回る。
我々はトラップセットとサイクルを緩和し、収束を改善した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 22:00:57 GMT)
Interpretable Cross-Domain Few-Shot Learning with Rectified Target-Domain Local Alignment [19.1] Cross-Domain Few-Shot Learningは、大規模な汎用データ(ソースドメイン)でトレーニングされたモデルを、少ないトレーニングデータだけで、下流のターゲットドメインに適応させる。
CLIPモデルは、解釈可能な認識のためのきめ細かい視覚的手がかりにはほとんど焦点を合わせられない。
この問題に対処するために、局所的な視覚的特徴とテキスト意味論の整合性に監督が欠如しているため、私たちは自己監督情報に目を向ける。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:20:21 GMT)
Multi-Source Human-in-the-Loop Digital Twin Testbed for Connected and Autonomous Vehicles in Mixed Traffic Flow [19.0] MSH-MCCT(Multi-Source Human-in-the-Loop Mixed Cloud Control Testbed)は、様々なCAVとHDVの間の複雑な相互作用をキャプチャする新しいCAVテストベッドである。
混合プラットフォームにブリッジされたMSH-MCCTでは、人間ドライバーとCAVアルゴリズムが複数の視野内で物理車と仮想車の両方を動作させることができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:14:58 GMT)
Spatial Transcriptomics as Images for Large-Scale Pretraining [18.7] 空間トランスクリプトークスは、組織部分の正確な座標で、個別の場所で数千の遺伝子発現値をプロファイルする。
シークエンシングスループットの上昇とプログレッシブプラットフォームにより、拡張データボリュームは大規模なST事前トレーニングを動機付けている。
既存の選択は,(1)空間依存を排除し,STを単細胞転写学に分解する独立したサンプルとして,(2)スライド全体を単一サンプルとして扱うことにより,極めて大きな入力を発生させ,トレーニング例を劇的に少なくする。
我々は,空間転写学を収穫可能な画像として扱うことを提案する。具体的には,収穫パッチによる固定空間サイズの多チャンネル画像表現を定義する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:20:33 GMT)
Investigating Vaccine Buyer's Remorse: Post-Vaccination Decision Regret in COVID-19 Social Media Using Politically Diverse Human Annotation [18.7] 「新型コロナ後ワクチン接種経験、特にワクチン購入者の反省」というデータセットには大きなギャップがある。」
我々は、新型コロナウイルスワクチン接種経験を捉えた大規模なYouTubeニュースコーパスから新しいデータセットをキュレートし、ワクチン後悔に焦点を当てたベンチマークサブセットを構築した。
我々は,大規模な言語モデル(LLM)を用いて,ワクチンの後悔を表現するポストを特定し,この後悔の原因を分析し,その発生を第1および第2のアカウントで定量化する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:48:08 GMT)
Remote Sensing Image Dehazing: A Systematic Review of Progress, Challenges, and Prospects [18.5] リモートセンシング画像(RSI)は、しばしば迷路、霧、薄い雲によって劣化し、表面反射率を曖昧にし、下流のアプリケーションを妨げる。
本研究は,RSIの脱ハージング,方法論的進化,ベンチマーク評価,物理的整合性解析を統合した最初の体系的,統一的な調査である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:44:49 GMT)
Pushan: Trace-Free Deobfuscation of Virtualization-Obfuscated Binaries [18.5] 既存の自動難読化技術には3つの大きな欠点がある。
それらは実行トレースのみで動作するため、難読化バイナリ内のすべてのロジックをリカバリすることができない。
PUSHANはトレースフリーであり、パス制約の蓄積を避ける。
これは、保護されたコードを高品質なCの擬似コードに分解して、効果的な分析を可能にする最初のアプローチである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 23:37:39 GMT)
Self-Calibrating Language Models via Test-Time Discriminative Distillation [18.5] 大規模言語モデル(LLM)は、しばしば間違って答える質問に対して体系的に過度に信頼されている。
我々は、テスト時間トレーニング(TTT)パイプラインである$textbfSECL$ ($textbfSE$lf-$textbfC$alibrating $textbfL$anguage Modelsを紹介します。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:28:50 GMT)
EgoAdapt: Enhancing Robustness in Egocentric Interactive Speaker Detection Under Missing Modalities [18.3] 本研究では,モダリティの欠如した話者検出のための適応型フレームワークであるEgoAdaptを紹介する。
EgoAdaptには3つの重要なモジュールが組み込まれている。(1)視覚話者目標認識(VSTR)モジュールは、音声特徴抽出のためのパラレル共有オーディオ(PSA)エンコーダである。
EgoAdaptは平均平均精度(mAP)67.39%、精度(Acc)62.01%を達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:55:24 GMT)
The Unreasonable Effectiveness of Text Embedding Interpolation for Continuous Image Steering [18.3] テキスト条件生成モデルに対するテスト時に連続的かつ制御可能な画像編集のためのトレーニング不要なフレームワークを提案する。
テキスト埋め込み空間における単純なステアリングは、スムーズな編集制御を実現するのに十分である。
私たちのアプローチは、トレーニングベースの代替手段に匹敵するものであり、他のトレーニングフリーメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:57:53 GMT)
MALLES: A Multi-agent LLMs-based Economic Sandbox with Consumer Preference Alignment [18.2] 本稿ではマルチエージェント大規模言語モデルに基づく経済サンドボックス(MALLES)を紹介する。
我々のアプローチの中心は、LLMが広範囲で不均一なトランザクションレコードのポストトレーニングを通じて経済的に整合している選好学習パラダイムである。
実験により,本フレームワークは製品選択精度,購入量予測,シミュレーション安定性の大幅な向上を実現していることが示された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:11:09 GMT)
Resource Consumption Threats in Large Language Models [18.0] 資源効率は、大規模言語モデル(LLM)の重要な要件である。
近年の資源消費の脅威は、過剰な生成、モデル効率の低下、サービスの可用性と経済的な持続可能性に害を与えている。
我々のゴールは、この新興地域の課題を明確化し、特徴づけと緩和のためのより明確な基盤を提供することである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:51:39 GMT)
ARISE: Agent Reasoning with Intrinsic Skill Evolution in Hierarchical Reinforcement Learning [18.0] ARISE(Agent Reasoning via Intrinsic Skill Evolution)は階層的な強化学習フレームワークである。
共有ポリシを使用して、ハイレベルなスキルを管理し、低レベルなレスポンスを生成する。
階層的な報酬設計は、推論能力と図書館品質の共進化を導く。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:32:14 GMT)
LLM Nepotism in Organizational Governance [17.9] 本稿では,AIに対する好意的なシグナルが,役割関係のメリットに関係のない場合にも報われる態度駆動バイアスチャネルについて検討する。
履歴書の審査員は、AIに対する肯定的あるいは非批判的な態度の候補者を好んで、懐疑的で人間中心の候補者を差別する傾向にある。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:35:25 GMT)
AirDDE: Multifactor Neural Delay Differential Equations for Air Quality Forecasting [17.9] AirDDEは遅延モデリングを物理的ガイダンスの下で連続的な汚染物質進化に統合するフレームワークである。
AirDDEは、最高のベースラインに対して平均8.79%のMAE削減で最先端の予測性能を達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:37:36 GMT)
Zipper-LoRA: Dynamic Parameter Decoupling for Speech-LLM based Multilingual Speech Recognition [17.5] 音声大言語モデル(Speech-LLMs)は,音声エンコーダを大規模言語モデルに整合させることにより,音声認識(ASR)のための強力なアプローチとして登場した。
Zipper-LoRAは3つの変種を持つランクレベルのデカップリングフレームワークで、共有および言語固有のサブスペースからLoRA更新を動的に合成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:04:50 GMT)
LLM-Augmented Computational Phenotyping of Long Covid [17.3] このフレームワークは13,511人のLong Covid参加者に基づいて、3つの異なる臨床表現型、Protected, Responder, Refractoryを同定する。
これらの表現型は、ピーク症状の重症度、ベースライン疾患の重荷、および経時的線量応答パターンにおいて顕著な分離を示す。
本研究は, 複雑な縦長データから表現型スクリーニングを行うための, 基本的, 統計的に基礎付けられたパイプラインに, 大規模言語モデルをどのように組み込むことができるかを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:02:05 GMT)
ConfusionBench: An Expert-Validated Benchmark for Confusion Recognition and Localization in Educational Videos [17.2] 既存の混乱データセットは、ノイズの多いラベル、粗い時間的アノテーション、限られた専門家による検証に悩まされている。
本稿では,モデル支援スクリーニング,研究者のキュレーション,専門家の検証の2段階を統合した,実用的な多段階フィルタリングパイプラインを提案する。
このパイプラインに基づいて、バランスの取れた混乱認識データセットとビデオローカライゼーションデータセットからなる教育ビデオの新しいベンチマークであるConfusionBenchを紹介する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:49:17 GMT)
FloorPlan-VLN: A New Paradigm for Floor Plan Guided Vision-Language Navigation [17.1] 既存の言語ナビゲーション(VLN)タスクは、エージェントが命令に従う必要がある。
本稿では,bfFloorPlan-VLNを提案する。bfFloorPlan-VLNは,構造的なフロアプランをグローバル空間先行として活用し,簡潔な指示だけでナビゲーションを可能にする新しいパラダイムである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:22:48 GMT)
Understanding and Defending VLM Jailbreaks via Jailbreak-Related Representation Shift [17.0] 大きな視覚言語モデル(VLM)は、視覚的モダリティの統合による安全性の低下を示すことが多い。
我々は、有害な意図を認識できないことから脱獄が起こらないことを示す。
本稿では,投機時間における脱獄関連シフトを除去し,VLMの安全性を高める防衛手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:31:29 GMT)
Learning-Augmented Algorithms for $k$-median via Online Learning [17.0] オンライン学習に触発された学習強化アルゴリズムの新しいモデルを提案する。
我々は問題の一連のインスタンスを与えられ、学習強化アルゴリズムの目標は、問題の将来のインスタンスに対する解決策を提案するために、事前インスタンスを使用することである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:00:34 GMT)
Few-Step Diffusion Sampling Through Instance-Aware Discretizations [16.9] 正規あるいは微分方程式(ODEs/SDEs)で定義される経路をシミュレートして拡散・流れマッチングモデルにより高忠実度データを生成する
本稿では、入力依存の事前情報に基づいてタイムステップアロケーションを適応させることを学習する、インスタンス対応の離散化フレームワークを提案する。
提案手法は,トレーニングや無視可能な推論オーバーヘッドと比較して,限界チューニングコストで生成品質を継続的に向上する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:49:38 GMT)
From Words to Worlds: Benchmarking Cross-Cultural Cultural Understanding in Machine Translation [16.8] CulT-Evalは、モデルが異なるタイプの文化的基盤表現をどのように扱うかを評価するために設計されたベンチマークである。
CulT-Evalは、複数の文化的な接地された表現にまたがる、7,959以上の慎重にキュレートされたインスタンスから構成されている。
文化的な意味の逸脱を対象とする相補的評価尺度を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:59:44 GMT)
STAC: Plug-and-Play Spatio-Temporal Aware Cache Compression for Streaming 3D Reconstruction [16.8] ストリーミング入力からの3D再構成には、長期的な時間的一貫性と効率的なメモリ使用の両方が必要である。
STACは大きな因果変換器で3D再構成を行うためのフレームワークである。
実験の結果,STACはメモリ消費を10倍近く削減し,VG 4xによる推論を高速化しながら,最先端の再構築品質を実現することがわかった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:36:46 GMT)
Sparse3DTrack: Monocular 3D Object Tracking Using Sparse Supervision [16.6] モノクロ3Dオブジェクトトラッキングは、ビデオフレーム全体で時間的に一貫した3Dオブジェクトのポーズを推定することを目的としている。
既存の最先端のアプローチは、完全に監視されており、長いビデオシーケンスよりも密集した3Dアノテーションに依存している。
モノクロ3次元物体追跡のための最初の教師付きフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:36:41 GMT)
Flow Matching Policy with Entropy Regularization [16.5] Flow Matching Policy with Entropy Regularization (FMER)は、通常の微分方程式(ODE)ベースのオンラインRLフレームワークである。
FMERは、フローマッチングを通じてポリシーをパラメータ化し、最適な輸送によって動機付けられたストレートな確率経路に沿ってアクションをサンプリングする。
スパースマルチゴールのFrankaKitchenベンチマークの実験は、FMERが最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:00:20 GMT)
CWoMP: Morpheme Representation Learning for Interlinear Glossing [16.3] CWoMP(Contrastive Word-Morpheme Pretraining)を提案する。
我々は,CWoMPが既存の手法より優れていると同時に,より効率的であることを示す,多種多様な低リソース言語の評価を行った。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:29:18 GMT)
Retrieval-Augmented LLM Agents: Learning to Learn from Experience [16.2] 本研究では,検索対象のLLMエージェントを学習し,検索したトラジェクトリをコンテキスト内で活用する方法について検討する。
最先端のエージェントトレーニングパイプラインよりも優れたロラを用いた,堅牢な教師付き微調整(SFT)レシピを確立した。
その結果,この組み合わせによるタスクの一般化が著しく向上することが示唆された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:45:04 GMT)
Attention-Based Sampler for Diffusion Language Models [16.0] 本研究では,Attn-Samplerと呼ばれる新しい学習自由復号アルゴリズムを提案する。
注意列和の順にトークンを復号することで、最適なシーケンス確率をほぼ達成できることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:49:13 GMT)
WeatherReasonSeg: A Benchmark for Weather-Aware Reasoning Segmentation in Visual Language Models [16.0] 本稿では,悪天候条件下での推論に基づくセグメンテーションにおけるVLM性能評価のためのベンチマークであるWeatherReasonSegを紹介する。
まず,既存のセグメンテーションデータセットに重度レベルの異なる合成気象を適用して,制御可能な推論データセットを構築する。
第二に、実世界の複雑さを捉えるために、意味的に一貫したクエリで現実世界の悪天候推論セグメンテーションデータセットをキュレートする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:57:18 GMT)
AvatarForcing: One-Step Streaming Talking Avatars via Local-Future Sliding-Window Denoising [15.8] AvatarForcingは、一段階のストリーミング拡散フレームワークで、不均一なノイズレベルを持つ固定されたローカルフューチャーウィンドウを識別する。
標準ベンチマークと400ビデオのロングフォームベンチマークの実験では、強い視覚的品質と34ms/frameでの唇の同期が示されている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:34:30 GMT)
Just-in-Time: Training-Free Spatial Acceleration for Diffusion Transformers [15.7] 拡散変換器は、画像合成における新しい最先端技術を確立したが、計算コストが高く、実用的展開を妨げている。
JiT(Just-in-Time)は空間領域の加速によってこの問題に対処する新しいトレーニングフリーフレームワークである。
JiTは空間的に近似された生成常微分方程式(ODE)を定式化し、完全な潜在状態の進化を駆動する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:10:33 GMT)
Enhancing Reinforcement Learning Fine-Tuning with an Online Refiner [15.6] 強化学習微調整(RFT)の安定化と退化の防止には制約が不可欠である。
微調整モデルの進化能力に適応するテクスチャ力学的制約を提案する。
対話とコード生成の実験は、動的制約がKL正規化と非制約ベースラインの両方より優れていることを示している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:37:31 GMT)
Lightweight Adaptation for LLM-based Technical Service Agent: Latent Logic Augmentation and Robust Noise Reduction [15.6] 複雑な技術サービスドメインにおける大規模言語モデルの適用は、人間の実演において明確な認知的連鎖が欠如していることによって制約される。
本稿では,表層監視と潜時決定ロジックのギャップを埋めるために,プランニング・アウェア・トラジェクトリ・モデリングと決定推論の強化を導入する。
多様な応答を検証してノイズを低減するために,2重フィルタ方式により複数の地中真実データセットを構築した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:01:17 GMT)
Causal Representation Learning on High-Dimensional Data: Benchmarks, Reproducibility, and Evaluation Metrics [15.6] 因果表現学習モデルは、高次元データを潜在空間に変換することを目的としている。
様々な合成および実世界のデータセットが提案されており、それぞれに異なる利点と制限がある。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:31:01 GMT)
Neuron-Level Emotion Control in Speech-Generative Large Audio-Language Models [15.6] 大規模音声言語モデル(LALM)における感情制御のニューロンレベルでの最初の研究について述べる。
コンパクトな感情感受性ニューロン(ESN)は因果的に作用し、推論時に無訓練の感情ステアリングを可能にする。
本研究は,音声生成における無訓練感情制御のための機械的枠組みを構築した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:32:47 GMT)
Language on Demand, Knowledge at Core: Composing LLMs with Encoder-Decoder Translation Models for Extensible Multilinguality [15.5] 大規模言語モデル(LLM)は、強い汎用性を示すが、多言語性能は相変わらず高い不均衡を保っている。
合成エンコーダ-LLMデコーダアーキテクチャであるXBridgeを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:19:08 GMT)
Part-Aware Open-Vocabulary 3D Affordance Grounding via Prototypical Semantic and Geometric Alignment [15.5] インテリジェンスと人間とAIの相互作用を具体化するためには、自然言語の問題を3Dオブジェクト内の機能的に関連のある領域に接地することが不可欠である。
そこで本稿では,オープンな3次元空間における意味的表現と幾何学的表現を両立させる2段階のクロスモーダルフレームワークを提案する。
提案手法の有効性を,新たに導入されたベンチマークと2つの既存ベンチマークで検証し,既存手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:07:42 GMT)
Systematic Scaling Analysis of Jailbreak Attacks in Large Language Models [15.4] 大規模な言語モデルは、Jailbreak攻撃に対して脆弱なままですが、ジェイルブレイクの成功が、メソッド、モデルファミリー、害タイプを越えて攻撃者の努力によってどのようにスケールするかに関して、体系的な理解はいまだにありません。
我々は、各攻撃を計算バウンド最適化手順として扱い、共有FLOPs軸の進捗を測定することにより、ジェイルブレイクのスケーリング法フレームワークを開始する。
組織的評価は、最適化に基づく攻撃、自己抑制促進、サンプリングに基づく選択、遺伝的最適化を含む4つの代表的なジェイルブレイクパラダイムにまたがる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:23:56 GMT)
S-VGGT: Structure-Aware Subscene Decomposition for Scalable 3D Foundation Models [15.4] フィードフォワード3Dファンデーションモデルは、グローバルな注目によって導入された二次計算コストという、大きな課題に直面している。
構造フレームレベルでの冗長性に対処する新しいアプローチである textbfS-VGGT を導入する。
S-VGGTは完全にトークンレベルの加速法であり、複雑なスピードアップにシームレスに組み合わせることができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:42:55 GMT)
Approximate Subgraph Matching with Neural Graph Representations and Reinforcement Learning [15.4] 本稿では,強化学習に基づく近似部分グラフマッチング(RL-ASM)アルゴリズムを提案する。
このモデルでは,2つの入力グラフから1対のノードを1対選択し,潜在的なマッチングを行うアルゴリズムを構築している。
合成データセットと実世界のデータセットの両方の実験により、我々のRL-ASMは、有効性と効率の点で既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:53:23 GMT)
OnlineHMR: Video-based Online World-Grounded Human Mesh Recovery [15.3] OnlineHMRは、オンライン処理の4つの必須基準を満たす完全なオンラインフレームワークである。
OnlineHMRは、因果キー値キャッシュ設計とキュレートされたスライディングウィンドウ学習戦略によるストリーミング推論を可能にする。
実験結果から,提案手法は既存のチャンクベース手法に匹敵する性能を実現することが示された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:33:01 GMT)
VLM2Rec: Resolving Modality Collapse in Vision-Language Model Embedders for Multimodal Sequential Recommendation [15.1] 逐次レコメンデーションのためのマルチモーダルエンコーダとしての視覚言語モデル(VLM)について検討する。
標準コントラスト制御微調整(SFT)は、その固有のモダリティ崩壊を増幅する。
本稿では,VLMの組込み型フレームワークであるVLM2Recを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:46:30 GMT)
ReSteer: Quantifying and Refining the Steerability of Multitask Robot Policies [14.9] マルチタスクの事前訓練が強かったにもかかわらず、既存のポリシーはしばしばタスクの操縦性が劣っている。
マルチタスクロボットポリシーにおけるタスクステアビリティの定量化と改善のためのフレームワークであるReSteerを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:53:44 GMT)
SPRITE: From Static Mockups to Engine-Ready Game UI [14.9] 『Screenshot-to-Code』ツールは、ゲームインタフェースに典型的な不規則なジオメトリーや深い視覚的階層に苦しむことが多い。
静的スクリーンショットを編集可能なエンジンアセットに変換するパイプラインであるSPRITEを紹介する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:09:51 GMT)
Evidence Packing for Cross-Domain Image Deepfake Detection with LVLMs [14.9] 画像全体の推論をエビデンス駆動推論に置き換える,学習不要なLVLMフレームワークを提案する。
SCEPは、操作キューを最もよく示す不審なパッチトークンのコンパクトなセットをマイニングする。
ビジョンエンコーダのCLSトークンをグローバル参照として使用し、クラスタパッチの機能をコヒーレントなグループに分割し、融合したメトリックでパッチをスコアする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:22:45 GMT)
AgentFactory: A Self-Evolving Framework Through Executable Subagent Accumulation and Reuse [14.4] LLMに基づくエージェントの自己進化に関する最近の研究は、主にテキストのプロンプトやリフレクションとして成功した経験を記録している。
本稿では,タスクソリューションを実行可能なサブエージェントコードとして保存する,新たな自己進化パラダイムであるAgentFactoryを提案する。
保存されたサブエージェントは、標準化されたドキュメントを備えた純粋なPythonコードであり、任意のPython対応システム間で移植性を実現する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:58:25 GMT)
Computation-Utility-Privacy Tradeoffs in Bayesian Estimation [14.3] 平均二乗誤差を実現する2つの問題に対して,最初の効率的なアルゴリズムを提案する。
我々は、プライベートベイズ最適推定を実現するために、arXiv:2212.05のプライバシーとロバスト性に関するフレームワークを取り上げている。
また、ショートフラット分解に基づく新しい種類の制約を平方和ツールキットに追加する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:20:58 GMT)
Efficient Exploration at Scale [14.2] 我々は,人間からのフィードバックから強化学習のデータ効率を劇的に向上させるオンライン学習アルゴリズムを開発した。
Gemmaの大規模言語モデル(LLM)では,20K未満のラベルを用いて200KラベルでトレーニングされたオフラインRLHFの性能と一致した。
この結果から,1BラベルでトレーニングされたオフラインRLHFに一致するように,100Mラベルでトレーニングされたアルゴリズムが期待できる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:47:59 GMT)
FEMBA on the Edge: Physiologically-Aware Pre-Training, Quantization, and Deployment of a Bidirectional Mamba EEG Foundation Model on an Ultra-low Power Microcontroller [14.0] 脳波の21,000時間以上で事前トレーニングされた双方向のマンバアーキテクチャであるFEMBAを提案する。
低域通過フィルタリングによる再構成を含む,生理的事前学習の新たな目標を提案する。
我々は、モデルを2ビットの重みに圧縮するために量子化アウェアトレーニング(QAT)を用いる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:23:13 GMT)
HeiSD: Hybrid Speculative Decoding for Embodied Vision-Language-Action Models with Kinematic Awareness [13.8] VLA(Vision-Language-Action)モデルはロボット制御の主流のソリューションとなっているが、推論速度が遅い。
VLAモデルにより制御されるロボットの軌道パターンを分析し、重要な洞察を得る。
本論文では,HeiSDにおける検索に基づくSD最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:25:08 GMT)
Reinforcement Learning for Fast and Robust Longitudinal Qubit Readout [13.7] 我々は長手結合波形を最適化する強化学習フレームワークを開発した。
固定された短い読み出し時には、最適化されたパルスは制約飽和フラットトッププロトコルに収束する。
このプロトコルは大幅な性能向上を実現し、解釈可能な飽和状態と保持状態のメカニズムによって制御されるスムーズなハードウェア互換の波形を得る。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:27:09 GMT)
Iterative Decoding of Stabilizer Codes under Radiation-Induced Correlated Noise [13.7] フォールトトレラント量子計算は、非常に低い論理誤差レートを要求する。
超伝導量子ビットアレイは、宇宙線ミューオン生成準粒子から生じる放射誘起相関ノイズを受ける。
我々は症候群計測による関節雑音の検知と復号化を定式化する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:33:29 GMT)
Generative Replica-Exchange: A Flow-based Framework for Accelerating Replica Exchange Simulations [13.5] 本稿では,REXフレームワークに深層生成モデルを統合することで,この温度ラグを除去する生成レプリカ交換(GREX)を提案する。
我々はGREXを3つのベンチマークシステムで検証し、分子シミュレーションの効率性と実用性を強調した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:33:08 GMT)
Efficient Soft Actor-Critic with LLM-Based Action-Level Guidance for Continuous Control [13.2] 本稿では,大規模状態行動空間における効率的な探索を容易にする新しい強化学習(RL)アルゴリズムである GuidedSAC を提案する。
GuidedSACは、Soft Actor-Critic (SAC)アルゴリズムのアクションレベルガイダンスを提供するインテリジェントスーパーバイザとして、大きな言語モデル(LLM)を利用している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:22:31 GMT)
P$^{3}$Nav: End-to-End Perception, Prediction and Planning for Vision-and-Language Navigation [13.1] Vision-and-Language Navigation (VLN)では、エージェントが言語命令によって指定されたターゲットへのパスを計画する必要がある。
P$3$Navは、知覚、予測、計画を統合する新しいエンドツーエンドフレームワークである。
私たちのP$3$Navは、REVERIE、R2R-CE、RxR-CEベンチマーク上で、最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:04:53 GMT)
Identity as Presence: Towards Appearance and Voice Personalized Joint Audio-Video Generation [13.0] 高忠実度パーソナライゼーションを実現するために,アイデンティティ対応のジョイントビデオ生成のための統合フレームワークを提案する。
具体的には、音声と視覚のモダリティにまたがるペアアノテーションを用いて、IDを含む情報を自動抽出するデータキュレーションパイプラインを導入する。
顔の外観と声帯が同一性を持つ制御信号として機能する単一・多目的シナリオに対する柔軟でスケーラブルなID注入機構を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:13:48 GMT)
VirPro: Visual-referred Probabilistic Prompt Learning for Weakly-Supervised Monocular 3D Detection [12.8] VirProは適応型マルチモーダル事前トレーニングパラダイムであり、様々な弱い教師付き単分子3D検出フレームワークにシームレスに統合することができる。
我々は、さまざまな学習可能なインスタンス条件のプロンプトを生成し、それらをAPB(Adaptive Prompt Bank)に格納する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:23:55 GMT)
Per-Domain Generalizing Policies: On Learning Efficient and Robust Q-Value Functions (Extended Version with Technical Appendix) [12.6] 状態値関数の代わりにQ値関数を学習することを提唱する。
ヴァニラ指導によるQ値の学習は、取られた行動と教師が取らなかった行動とを区別することが学ばないため、不十分である。
我々は、この区別を強制する正規化項を用いてこの問題に対処し、10の領域にわたる状態値ポリシーを一貫して上回るQ値ポリシーを生み出します。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:48:38 GMT)
CRE-T1 Preview Technical Report: Beyond Contrastive Learning for Reasoning-Intensive Retrieval [12.5] Thought 1 (T1) は、関連モデリングを静的アライメントから動的推論にシフトする生成的検索モデルである。
クエリ側では、T1 dy-namically は各クエリの中間的推論軌跡を生成し、推論関係を橋渡しする。
ドキュメント側では、高スループットインデックス作成をサポートするために、インストラクション+テキスト+エンコーディングフォーマットを使用する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:08:59 GMT)
One-Step Sampler for Boltzmann Distributions via Drifting [12.4] エネルギー関数によって定義されるボルツマン分布のアモータライズサンプリングのためのドリフトベースフレームワークを提案する。
この方法は、現在のボルツマンモデルから滑らかなフィールドに沿ってサンプルを投影することで、ワンステップジェネレータを訓練する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:35:16 GMT)
Efficient Policy Learning with Hybrid Evaluation-Based Genetic Programming for Uncertain Agile Earth Observation Satellite Scheduling [12.4] アジャイル地球観測衛星スケジューリング問題(UAEOSSP)は、新しい最適化問題である。
利益、資源消費、可視性の不確実性が組み込まれており、事前計画されたスケジュールが最適でないか、あるいは不可能である可能性がある。
本稿では,UAEOSSPを効果的に解くためのHybrid Evaluation-based Genetic Programming (HE-GP)を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:12:48 GMT)
Steering Video Diffusion Transformers with Massive Activations [12.3] ビデオ拡散変圧器において, 希少かつ高次隠れ状態スパイクであるMassive Activations (MA) の役割について検討した。
本研究では,第1フレームにおけるMA値と境界トークンをスケールした大域的最大基準等級にステアリングする,トレーニング不要な自己誘導的手法であるStructured Activation Steering (STAS)を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:24:12 GMT)
Revisiting Vulnerability Patch Identification on Data in the Wild [12.3] NVD(National Vulnerability Database)の脆弱性レポートにリンクされたセキュリティパッチのトレーニングと評価が一般的であるセキュリティパッチ検出装置
本研究では,NVDデータに基づいてトレーニングしたモデルの性能が大幅に低下し,F1スコアが最大90%低下したことを示す。
NVDデータからのセキュリティパッチと手動で識別されたセキュリティパッチの小さなサブセットを組み合わせたデータセットの構築は、モデルの堅牢性を向上させることができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:45:39 GMT)
BoundAD: Boundary-Aware Negative Generation for Time Series Anomaly Detection [12.2] 本稿では, 正規サンプルの再構成プロセスを通じて, ハードネガを自動生成するリコンストラクション駆動境界負生成フレームワークを提案する。
提案手法は,異常表現学習を効果的に改善し,現在のデータセット上での競合検出性能を実現する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:50:59 GMT)
From Isolated Scoring to Collaborative Ranking: A Comparison-Native Framework for LLM-Based Paper Evaluation [12.1] 大規模言語モデル (LLM) は現在, 各論文に絶対スコアを独立に割り当てることで, 科学的論文評価に応用されている。
孤立スコアから協調ランキングへの紙評価のシフトを提案する。
当社のフレームワークは,強力なベースラインであるDeepReview-14Bに対して,textbf21.8%の平均相対的な改善を実現している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:55:02 GMT)
AdapTS: Lightweight Teacher-Student Approach for Multi-Class and Continual Visual Anomaly Detection [12.1] AdapTSは、マルチクラスおよび連続的な設定のために設計された、統合されたTeacher-Student (TS)フレームワークである。
AdapTSは、単一の共有冷凍バックボーンを利用することで、2つの異なるアーキテクチャを必要としない。
最も軽量なAdapTS-Sでは、追加メモリは8MB、STFPM(95MB)より13倍、RD4AD(360MB)より48倍、DeSTSeg(1120MB)より149倍少なくなります。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:39:03 GMT)
AERR-Nav: Adaptive Exploration-Recovery-Reminiscing Strategy for Zero-Shot Object Navigation [12.0] AERR-Navはゼロショットオブジェクトナビゲーションフレームワークで、ロボットの環境に基づいて状態を動的に調整する。
AERR-Navはゼロショット法で最先端の性能を達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:31:44 GMT)
How LLMs Distort Our Written Language [12.0] 大規模言語モデル(LLM)は世界中で10億人以上が利用しており、多くの場合、執筆支援に使われている。
我々はLLMが人間の文章の音声やトーンを変えるだけでなく、意図した意味を一貫して変えることを実証した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:01:52 GMT)
Conflict-Free Policy Languages for Probabilistic ML Predicates: A Framework and Case Study with the Semantic Router DSL [11.9] ルーティングとアクセス制御システムのクラスは、確率的ML信号に基づいて決定を下す。
そのような2つのシグナルは、著者が分離することを意図したカテゴリで宣言され、同じクエリでしきい値をクリアし、それを静かに間違ったモデルにルーティングする。
本研究では, 実際に支配的な埋め込みの場合, 独立しきい値処理を温度スケールのソフトマックスに置き換えることで, 共ファイリングが不可能なヴォロノイ地域への埋め込み空間を分割することを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:14:34 GMT)
Anomalous localization and duality in non-Hermitian quasiperiodic models [11.8] 準周期性と非エルミート皮膚効果の相互作用が, 直感的局所化特性をもたらすことを示す。
その結果,非エルミート準周期系の局在に新たな光を当てた。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:25:50 GMT)
Search2Motion: Training-Free Object-Level Motion Control via Attention-Consensus Search [11.8] 画像・ビデオ生成におけるオブジェクトレベルのモーション編集のためのトレーニング不要なフレームワークであるSearch2Motionを提案する。
トラジェクトリ、バウンディングボックス、マスク、モーションフィールドを必要とする従来の方法とは異なり、Search2Motionはターゲットフレームベースの制御を採用する。
Search2Motion は FLF2V-obj と VBench のベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:58:04 GMT)
KA2L: A Knowledge-Aware Active Learning Framework for LLMs [11.7] 本研究では,大規模言語モデル(LLM)によるドメイン固有知識理解の深度について検討する。
本稿では,無知な質問を潜時空間分析によって構築するための知識認識型アクティブラーニングフレームワークを提案する。
その結果、KA2Lは2つのオープンドメインと1つの垂直ドメインデータセットに対して、アノテーションとコストを50%削減するだけでなく、大幅に削減できることが示唆された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:16:07 GMT)
Face anonymization preserving facial expressions and photometric realism [11.7] 顔の匿名化は、被験者のアイデンティティを不可逆的に隠蔽する現実的な顔画像を生成する。
既存の生成的アプローチは、アイデンティティ除去とイメージリアリズムに重点を置いている。
本稿では,DeepPrivacy を拡張した特徴保存型匿名化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:16:12 GMT)
FaithSteer-BENCH: A Deployment-Aligned Stress-Testing Benchmark for Inference-Time Steering [11.6] FaithSteer-BENCHはストレステストベンチマークである。
制御性, 実用性, 堅牢性の3つのゲートワイド基準により, 固定配置式運転点での操舵方法を評価する。
ゲートワイズベンチマークの結果は、既存の手法がデプロイメント指向の実践的設定において信頼性の高い制御性を提供するとは限らないことを示している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 22:28:36 GMT)
ResNets of All Shapes and Sizes: Convergence of Training Dynamics in the Large-scale Limit [11.5] 我々は、残留ニューラルネットワーク(ResNets)のトレーニング力学を、その合同無限深さL、隠れ幅M、埋め込み次元D限界に収束させる。
この研究は、[Chi25]で開始されたプログラムを完了し、固定埋め込み次元Dに対して、トレーニングダイナミクスが平均ODEモデルに収束することを証明した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:07:02 GMT)
S3T-Former: A Purely Spike-Driven State-Space Topology Transformer for Skeleton Action Recognition [11.5] Spiking State-Space Topology Transformer (S3T-Former)は、エネルギー効率の良い骨格動作認識のために設計された、最初の純粋にスパイク駆動のTransformerアーキテクチャである。
真のトポロジ的・時間的空間性を実現するために、オンデマンドの条件付きスパイク伝搬のための横方向スパイキングトポロジ・ルーティング(LSTR)を導入する。
複数の大規模データセットの実験により、S3T-Formerはエネルギー消費を理論的に低減しながら高い競争精度を達成することを示した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:09:50 GMT)
A Proposal-Free Query-Guided Network for Grounded Multimodal Named Entity Recognition [11.3] 本稿では,マルチモーダル推論と復号化を統一するQGNを提案する。
QGNは、オープンドメインシナリオにおける正確なグラウンドディングとロバストなパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:16:41 GMT)
Deep Learning-Based Airway Segmentation in Systemic Lupus Erythematosus Patients with Interstitial Lung Disease (SLE-ILD): A Comparative High-Resolution CT Analysis [11.3] 気道構造を自動的にロバールレベルとセグメントレベルに分割するために,HRCTを介してカスタマイズされたディープラーニングフレームワークを開発した。
R1(p16)、R3(p38)、L3(p38)などの部位で有意な差がみられ、肺上層部では最も顕著な変化が見られた。
このAIを利用した定量的イメージングバイオマーカーは、SLE人口におけるILDの早期検出とモニタリングを強化することを約束している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:52:17 GMT)
Informative Semi-Factuals for XAI: The Elaborated Explanations that People Prefer [11.0] 最近、eXplainable AI (XAI)では、$textiteven if$説明 -- いわゆる半事実 — が一般的な戦略として現れている。
本研究では、より精巧な説明を生成する新しいアルゴリズム、$textitinformative semi-factuals$ (ISF) を推し進める。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:42:46 GMT)
When Only the Final Text Survives: Implicit Execution Tracing for Multi-Agent Attribution [11.0] IET(Implicit Execution Tracing)は、メタデータに依存しないフレームワークで、生成したテキストから直接トークンレベルの属性を作成できる。
生成中、エージェント固有のキー付き信号がトークン分布に埋め込まれ、秘密鍵でのみ検出可能な自己記述実行トレースに変換される。
検出時にエージェントハンドオーバポイントを特定し、インタラクショングラフを再構築する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:34:51 GMT)
Harm or Humor: A Multimodal, Multilingual Benchmark for Overt and Covert Harmful Humor [10.9] 有害で不快なユーモアを検知し理解するための新しいマルチモーダル・マルチ言語ベンチマークを導入する。
私たちのデータセットは、英語、アラビア語、言語に依存しないコンテキストにまたがる1200の動画とともに、3,000のテキストと6000の画像で構成されています。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:21:10 GMT)
ProGVC: Progressive-based Generative Video Compression via Auto-Regressive Context Modeling [10.8] 本稿では,プログレッシブ・トランスミッション,効率的なエントロピー・コーディング,ディテール・シンセサイザーを統一したプログレッシブ・ベース・ジェネレーティブ・ビデオ圧縮フレームワークを提案する。
ProGVCは、ビデオを階層的なマルチスケールの残留トークンマップにエンコードし、粗いサブセットをプログレッシブな方法で送信することで、フレキシブルなレート適応を可能にする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:51:39 GMT)
Shifting Uncertainty to Critical Moments: Towards Reliable Uncertainty Quantification for VLA Model [10.8] 本稿では,ロールアウトの成功と失敗を予測するための統一的不確実性定量化手法を提案する。
本手法は, 故障予測精度を大幅に向上し, 故障検出のための信頼性の高い信号を得る。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 22:52:03 GMT)
Shot-Aware Frame Sampling for Video Understanding [10.8] InfoShotは、長時間ビデオ理解のためのタスクに依存しない、ショット対応のフレームサンプリングツールである。
設計は、サンプルセットがショット構造とスパース内偏差の両方について高い情報を保持することを奨励する情報理論の目的によって導かれる。
実験の結果,InfoShotはフレーム数制約下での異常ヒット率とダウンストリームビデオQA精度を改善することがわかった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:36:57 GMT)
ReTac-ACT: A State-Gated Vision-Tactile Fusion Transformer for Precision Assembly [10.7] 精密な組み立てには、接触に富んだ「ラストミリ」領域でサブミリ秒の補正が必要である。
ReTac-ACTは3つのメカニズムを通じてこの問題に対処する。
90%のホール成功を達成し、視覚のみの手法と一般的な手法を大きく上回り、0.1mmペグで成功を維持する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:10:16 GMT)
Efficient Visual Anomaly Detection at the Edge: Enabling Real-Time Industrial Inspection on Resource-Constrained Devices [10.6] エッジ配置のための2つの効率的な視覚異常検出法を提案する。
PatchCore-LiteとPadim-Liteは人気のあるPatchCoreとPaDiMモデルをベースにしている。
本手法をMVTec ADとVisAベンチマークで評価し,エッジ環境への適合性を示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:38:05 GMT)
Edit Spillover as a Probe: Do Image Editing Models Implicitly Understand World Relations? [10.5] Edit spillover: モデルが編集領域外のセマンティックな関連性を持つが、特定されていないコンテンツを変更。
これは根本的な疑問を引き起こします -- こぼれは真に暗黙の世界の理解を反映しているのでしょうか?
本研究では,画像編集モデルにおける世界知識の自然な探索手段として,編集流出を再利用するシステムフレームワークであるEditSpilloverProbeを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:02:16 GMT)
Discovering What You Can Control: Interventional Boundary Discovery for Reinforcement Learning [10.4] インターベンショナル・バウンダリー・ディスカバリー(Interventional Boundary Discovery IBD)は、パールの操作をエージェント自身の行動に適用する。
観測的特徴選択は,真の因果次元を排除しつつ,共起型散逸器を積極的に選択できることがわかった。
IBDは、テスト対象のすべてのイントラクタレベルにおけるオラクルのパフォーマンスを密に追跡し、SACとTD3間で転送される。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:26:03 GMT)
UniSem: Generalizable Semantic 3D Reconstruction from Sparse Unposed Images [10.1] 2つのキーコンポーネントによる深度精度とセマンティックな一般化を改善する統合フレームワークUniSemを提案する。
Error-aware Gaussian Dropout (EGD) は冗長性のあるGaussianを抑えることでエラー誘導容量制御を行う。
第2に、2Dセグメンタリフトセマンティクスと、モデル独自の創発的な3DセマンティクスをブレンドするMix-training Curriculum(MTC)を導入する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:26:25 GMT)
VectorWorld: Efficient Streaming World Model via Diffusion Flow on Vector Graphs [10.0] 本稿では,ego中心のベクターグラフタイルをロールアウト中に段階的に生成するストリーミングワールドモデルであるVectorWorldを提案する。
これは、モーションアウェアのゲートVAEを介してポリシー互換の相互作用状態を生成することで、履歴条件のポリシーと整合する。
solvrfreegated Diconditioned Training MeanFlow JVPを通じて、リアルタイムのアウトステップ補完をサポートする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:13:30 GMT)
Trust the Unreliability: Inward Backward Dynamic Unreliability Driven Coreset Selection for Medical Image Classification [10.0] コアセットの選択は計算コストを削減するのに役立つが、その医療データの有効性は本質的に複雑さのために制限されている。
動的不確実性駆動型コアセット選択(DUCS)戦略を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:16:56 GMT)
Feeling the Space: Egomotion-Aware Video Representation for Efficient and Accurate 3D Scene Understanding [9.8] 本稿では,感情モダリティデータを用いたMLLM(Large Language Models)を大幅に強化する。
運動MLLMは、身体的運動軌跡の視覚的内容のグラウンド化によって、シーン全体にわたる絶対的なスケールと空間的関係を推論することができる。
ビデオフレームと明示的な3Dデータに基づく最新技術(SOTA)手法と比較して、Motion-MLLMはオーバーヘッドをはるかに少なく、類似またはそれ以上の精度を示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:42:49 GMT)
"I'm Not Reading All of That": Understanding Software Engineers' Level of Cognitive Engagement with Agentic Coding Assistants [9.7] AIシステムへの過度な依存は、ユーザの批判的思考を損なう可能性がある。
ソフトウェア工学では、エージェントコーディングアシスタント(ACA)が日々の開発に急速に組み込まれつつある。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:41:18 GMT)
High-rate quantum digital signatures over 250 km of optical fiber [9.7] 量子デジタルシグネチャは、メッセージの整合性、認証、非監査のための情報理論のセキュリティを提供する。
量子デジタルシグネチャ(QDS)は、メッセージの完全性、認証、非監査のための情報理論のセキュリティを提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:16:44 GMT)
Auditing Preferences for Brands and Cultures in LLMs [9.7] 本稿では,大規模言語モデル(LLM)におけるブランドや文化の嗜好を監査するための再現可能なフレームワークであるChoiceEvalを紹介する。
ChoiceEvalは、現実的でペルソナの異なる評価クエリを生成し、自由形式のアウトプットを同等の選択セットと定量的選好メトリクスに変換する、という2つの技術的な課題に対処する。
Gemini、GPT、DeepSeekは、商業と文化にまたがる10のトピックと2,000以上の質問に適用される。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:38:39 GMT)
Operator-Theoretic Foundations and Policy Gradient Methods for General MDPs with Unbounded Costs [9.6] マルコフ決定過程(MDPs)は、一般関数空間上のある線型作用素に対する目的関数の最適化と見なされる。
この観点では、線形作用素のよく確立された摂動理論を用いて、目的関数の微分を線型作用素の函数として特定することができる。
これにより、状態空間と行動空間を生成するケースに対する強化学習において、よく知られた多くの結果が一般化される。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:01:49 GMT)
Workflow-Aware Structured Layer Decomposition for Illustration Production [9.5] 本稿では,アニメ作品のイラスト制作に適したワークフロー対応構造化層分解フレームワークを提案する。
アニメ制作のパイプラインにインスパイアされた本手法は,イラストを意味的に意味のある生産層に分解する。
実験により, 精度, 視覚的コヒーレントな層分解が得られた。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:18:12 GMT)
MLLM-based Textual Explanations for Face Comparison [9.4] 本研究では,MLLMが生成した顔認証タスクに関する説明を系統的に分析する。
以上の結果から,MLLMが正しい検証判断を下しても,伴う説明は検証不能あるいは幻覚的顔面属性に依存することが多いことが示唆された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:45:53 GMT)
Anyon-Induced Criticality and Dynamical Stability in Non-Hermitian Many-Body Systems [9.3] 我々は、非エルミート多体物理学は、本質的に擬ハーミティティーを破ることによって根本的に再認識されることを示す。
このエノン誘起遷移は、ボゾンと擬フェルミオンが完全に現実のままである場合でも起こる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:56:07 GMT)
CORE: Robust Out-of-Distribution Detection via Confidence and Orthogonal Residual Scoring [9.3] ディープラーニングモデルを確実にデプロイするためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
本研究では,各部分空間を独立にスコアリングして2つの信号をアンタングル化し,それらを正規化和で結合するCOREを提案する。
COREは5つのアーキテクチャと5つのベンチマーク構成で、競争力や最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:23:54 GMT)
DexEXO: A Wearability-First Dexterous Exoskeleton for Operator-Agnostic Demonstration and Learning [9.2] DexEXOは、ハードウェアレベルで視覚的外観、接触幾何学、運動学を整列する、装着性第一の手外骨格である。
受動的手は、展開されたロボットと視覚的に一致し、手首に装着したRGB観測から直接ポリシーを訓練することができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:37:13 GMT)
Large-Scale 3D Ground-Motion Synthesis with Physics-Inspired Latent Operator Flow Matching [9.2] Ground-Motion Flow (GMFlow) は、物理に着想を得た潜在演算子フローマッチングフレームワークであり、条件付きパラメータに基づいて、現実的で大規模な地上移動時間を生成する。
GMFlowは、900万以上のグリッドポイントにわたる空間的コヒーレントな地面の動きを秒間に生成し、シミュレーションワークフロー上で1万倍のスピードアップを達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:24:13 GMT)
CrowdGaussian: Reconstructing High-Fidelity 3D Gaussians for Human Crowd from a Single Image [9.1] CrowdGaussianは、複数の人物による3Dガウススティング(3DGS)表現を直接再構成する統合フレームワークである。
CrowdGaussianは、多人数シーンのフォトリアリスティック、幾何学的コヒーレントな再構成を生成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:42:43 GMT)
FastPFRec: A Fast Personalized Federated Recommendation with Secure Sharing [9.1] 我々は、トレーニング効率とデータセキュリティの両方を強化する新しいフレームワークであるFastPFRecを提案する。
FastPFRecは、既存のベースラインに比べて32.0%のトレーニングラウンド、34.1%のトレーニングタイム、8.1%の精度を達成した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:26:51 GMT)
Anchoring and Rescaling Attention for Semantically Coherent Inbetweening [9.1] 生成的内在性(GI)は、シーケンスの最初の段階と最後の段階の間に現実的な中間フレームを合成しようとする。
我々は、Keyframe-anchored Attention Biasを通じて、各中間フレームにパスとテキストから意味的および時間的ガイダンスを与えます。
Rescaled Temporal RoPEとのフレーム一貫性も向上しています。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:11:02 GMT)
Probabilistic Federated Learning on Uncertain and Heterogeneous Data with Model Personalization [9.0] メタ学習をBNNと組み合わせ、不確実で不均一なデータによるトレーニングを改善する、パーソナライズされた確率的FL法であるMeta-BayFLを提案する。
本稿では,Meta-BayFLが標準およびパーソナライズされたFLアプローチを含む最先端の手法を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:59:36 GMT)
Offload or Overload: A Platform Measurement Study of Mobile Robotic Manipulation Workloads [9.0] モバイルロボット操作は、物理的なAIの中核的な能力である。
ファンデーションモデルは、その性能のブレークスルーにつながったが、かなりの計算コストを要した。
我々は、オンボード、エッジ、クラウドGPUプラットフォームにまたがるモバイルロボット操作のワークロードを初めて測定する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:05:40 GMT)
TRiMS: Real-Time Tracking of Minimal Sufficient Length for Efficient Reasoning via RL [8.7] 我々は,Token当たりのインテリジェンスを最大化するために,理論計量 MSL-Minimal Sufficient Length を導入する。
TRiMSは、すべてのベンチマークで小さな精度で80%以上のCoTトークンの削減を実現している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:45:39 GMT)
ALIGN: Adversarial Learning for Generalizable Speech Neuroprosthesis [8.6] 皮質内脳-コンピュータインターフェース(BCI)は、録音セッション間でプールされたデータに基づいてトレーニングされた場合、神経活動から音声を高精度に復号することができる。
半教師付きクロスセッション適応のためのマルチドメイン逆ニューラルネットワークに基づくセッション不変学習フレームワークであるALIGNを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:38:00 GMT)
KMMMU: Evaluation of Massive Multi-discipline Multimodal Understanding in Korean Language and Context [8.5] KMMMUは,韓国の文化的・制度的環境におけるマルチモーダル理解を評価するための,韓国のネイティブベンチマークである。
KMMMUには、韓国語で書かれた試験から3,466の質問が含まれており、9つの規律と9つの視覚的モダリティのカテゴリ、300石の韓国固有のサブセットと627の難しいサブセットを含んでいる。
実験によると、最強のオープンソースモデルはフルセットで42.05%の精度でしか到達せず、最高のプロプライエタリモデルはハードサブセットで52.42%の精度で達成されている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:58:14 GMT)
JobMatchAI An Intelligent Job Matching Platform Using Knowledge Graphs, Semantic Search and Explainable AI [8.5] JobMatchAIは、Transformerの埋め込み、スキル知識グラフ、解釈可能なリランクを統合したプロダクション対応システムである。
ジョブSearch-XSベンチマークと、BM25、知識グラフ、セマンティックコンポーネントを組み合わせたハイブリッド検索スタックにより、スキルの一般化を評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:17:56 GMT)
Retrieval-Augmented LLMs for Security Incident Analysis [8.4] 本稿では、ターゲットクエリベースのフィルタリングとLLMセマンティック推論によるセキュリティインシデント解析を行うRAGベースのシステムを提案する。
マルウェアトラフィックインシデントとマルチステージアクティブディレクトリアタックの5つのLSMプロバイダによるシステムの評価を行った。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:45:56 GMT)
Enactor: From Traffic Simulators to Surrogate World Models [8.4] 交通マイクロシミュレータは道路網の性能評価に様々な「何」条件下で広く利用されている。
深層学習に基づく手法は、周囲の環境に応じて、車や歩行者をエージェントとしてモデルに応用されている。
世界モデルパラダイムにインスパイアされた我々は,トランスフォーマーアーキテクチャを用いたアクター中心の生成モデルを開発した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:38:28 GMT)
REAL: Robust Extreme Agility via Spatio-Temporal Policy Learning and Physics-Guided Filtering [8.3] 急激な地形評価と、非常にダイナミックな条件下での正確な足の配置が要求される。
本稿では,感覚的汚職下でのパーキングのエンドツーエンドフレームワークであるRobust Extreme Agility Learning (REAL)を提案する。
本研究では,FiLM変調マンバのバックボーンを装着した配置可能な学生にクロスモーダルな教師ポリシーを注入し,視覚ノイズを積極的にフィルタし,短期的な地形記憶を積極的に構築する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:18:16 GMT)
Rethinking Retrieval-Augmentation as Synthesis: A Query-Aware Context Merging Approach [8.2] Retrieval-Augmented Generation (RAG)により、LLM(Large Language Models)は、外部情報を動的に組み込んで既存の知識を拡張することができる。
標準的なパイプラインは、検索-then-select戦略を通じてこの問題に対処し、通常は関連性に基づいてトップkチャンクのみを保持する。
本稿では,静的フィルタリングからクエリ認識合成へパラダイムをシフトさせる新しいフレームワークであるMergeRAGを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:09:52 GMT)
Binary Latent Protein Fitness Landscapes for Quantum Annealing Optimization [8.1] Q-BIOLAT(Q-BIOLAT)は,タンパク質の適合性環境をモデル化し,最適化するためのフレームワークである。
Q-BIOLATは、タンパク質の適合性ランドスケープにおいて有意義な構造を捉え、高適合性変異の同定を可能にする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:06:20 GMT)
Rationale Matters: Learning Transferable Rubrics via Proxy-Guided Critique for VLM Reward Models [7.8] 視覚言語モデル(VLM)のための生成的報酬モデル(GRM)は、しばしば3段階のパイプラインを通して出力を評価する。
本稿では,RL(Reinforcement Learning)にプロキシ誘導型ルーリック検証を導入し,ルーリック品質を明示的に向上するProxy-GRMを提案する。
50kのデータサンプルで、VL-Reward Bench、Multimodal Reward Bench、MM-RLHF-Reward Benchの最先端結果に達する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:07:45 GMT)
DriveVLM-RL: Neuroscience-Inspired Reinforcement Learning with Vision-Language Models for Safe and Deployable Autonomous Driving [7.8] DriveVLM-RLは神経科学に触発されたフレームワークで、視覚言語モデルと強化学習を統合する。
このフレームワークは、連続的な空間安全評価のための静的パスに意味報酬学習を分解する。
階層的な報酬合成機構は、セマンティック信号を車両状態と融合させ、非同期トレーニングパイプラインは環境相互作用から高価なVLM推論を分離する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:55:29 GMT)
Proprioceptive-only State Estimation for Legged Robots with Set-Coverage Measurements of Learned Dynamics [7.7] プロプリオセプティブのみの状態推定は、計算的に安価であり、知覚的に劣化した条件の影響を受けないため、脚付きロボットにとって魅力的である。
近年のアプローチでは、ガウス雑音仮定の下で、これらの推定を学習された測定モデルを用いて生成し、IMUデータと融合する。
本研究では,任意の分布を仮定しない集合被覆文を用いて測定ノイズを特徴付けるフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:48:18 GMT)
EI: Early Intervention for Multimodal Imaging based Disease Recognition [7.7] 単一画像埋め込み後の融合」は,マルチモーダルデータの相補的および相関的な情報を十分に活用できない。
ラベル付きマルチモーダル医療画像の不足は、自然画像からのドメインシフトと相まって、医療画像の埋め込みに最先端のVision Foundation Modelsを使用することを妨げる。
1つのモダリティをターゲットとして、残りを参照として扱うことで、EIは、ターゲットモダリティの埋め込みプロセスを制御するために、参照からの高レベルなセマンティックトークンを介入トークンとして利用する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:21:52 GMT)
Towards sample-optimal learning of bosonic Gaussian quantum states [7.7] 根本的な問題は、できるだけ少数のサンプルから未知のボソニック・ガウス状態をどのように特徴づけるかである。
エネルギーが$E$未満の$n$モードガウス状態から高い確率で$varepsilon$トレース距離を学ぶために必要なコピー数について検討する。
本研究は,ボソニック系における量子学習理論を飛躍的に発展させ,量子センシングおよびベンチマークへの応用に実際的影響を与えるものである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:00:00 GMT)
Uncovering Latent Phase Structures and Branching Logic in Locomotion Policies: A Case Study on HalfCheetah [7.6] 移動制御タスクでは、Deep Reinforcement Learningは高いパフォーマンスを示した。
しかし、学習方針の決定過程は依然としてブラックボックスであり、人間が理解することが困難である。
この研究は、移動制御のために訓練されたポリシーは、人間によって解釈される相構造を表わすかもしれないという仮説を立てた。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:12:40 GMT)
HGP-Mamba: Integrating Histology and Generated Protein Features for Mamba-based Multimodal Survival Risk Prediction [7.6] HGP-Mambaは、生存リスク予測のために、組織学的および生成されたタンパク質の特徴を効率的に統合するマルチモーダルフレームワークである。
ソースコードはhttps://github.com/Daijing-ai/HGP-Mamba.git.comで公開されています。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:47:31 GMT)
Manufacturing Micro-Patterned Surfaces with Multi-Robot Systems [7.4] 本研究では, マイクロパターン表面を製造するために, パターン作成ツールを備えた複数のロボットを用いている。
ロボットが生成するパターンは,金属表面の摩擦係数を低下させることができることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:30:33 GMT)
Gaussian Process Limit Reveals Structural Benefits of Graph Transformers [7.3] ノードレベルの予測タスクのコンテキストにおいて、注意に基づくアーキテクチャはグラフ畳み込みネットワークよりも構造的な利点があることを示す。
具体的には、無限の幅と無限の頭を持つグラフ変換器のニューラルネットワークガウス過程限界について検討する。
具体例として,グラフトランスフォーマーがコミュニティ情報を構造的に保持し,深い層においても識別ノード表現を維持できることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:18:21 GMT)
Bodhi VLM: Privacy-Alignment Modeling for Hierarchical Visual Representations in Vision Backbones and VLM Encoders via Bottom-Up and Top-Down Feature Search [7.2] emphBodhi VLMは、エンフィエラルな神経表現のためのエンフィバシーアライメント・モデリング・フレームワークである。
NCPやMDAVベースのクラスタリングを通じて、センシティブな概念を階層的にグループ化する。
マルチスケール表現に対するボトムアップ(BUA)とトップダウン(TDA)戦略を使用して、センシティブな特徴領域を特定する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:32:49 GMT)
Fundamental Limits of Neural Network Sparsification: Evidence from Catastrophic Interpretability Collapse [7.2] 本研究では, 可変オートエンコーダ-スパースオートエンコーダアーキテクチャにおける重大容量制約下での機能生存について検討する。
本稿では,活動ニューロンを500から50以上の訓練エポックに段階的に減少させる適応的空間性スケジューリングフレームワークを提案する。
グローバルな表現の質は安定しているが、局所的な特徴解釈可能性は体系的に崩壊する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:16:38 GMT)
Fast and Generalizable NeRF Architecture Selection for Satellite Scene Reconstruction [7.1] 軽量な幾何および測光ディスクリプタを用いたトレーニングに先立って,NeRF品質を推定するフレームワークであるPreSCANを開発した。
PreSCANは1dB予測エラーで30秒で適切なアーキテクチャを選択し、NASよりも1000$times$スピードアップを達成した。
DFC 2019データセットの実験では、PreSCANが再トレーニングなしで様々な衛星シーンを一般化していることを確認した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:42:39 GMT)
LLM4Log: A Systematic Review of Large Language Model-based Log Analysis [7.1] 大規模言語モデル(LLM)は、意味的一般化とクロスソースエビデンスの統合を可能にすることにより、ログ分析を再構築した。
LLMはまた、コンテキスト制限、レイテンシ/コスト、プライバシ制約、幻覚といったデプロイメントリスクも導入している。
本稿では,LLMを用いたエンドツーエンドパイプラインにおけるログ解析の体系的レビューを行う。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:34:58 GMT)
The Causal Uncertainty Principle: Manifold Tearing and the Topological Limits of Counterfactual Interventions [7.1] Judea Pearl の do-calculus は因果推論の基礎を提供するが、連続生成モデルへの変換は幾何的な問題に悩まされている。
対物事象の地平を定義し,マニフォールドティーリング理論の証明を行う。
幾何学的因果流(Geometry-Aware Causal Flow, GACF)は, トポロジカルレーダを用いて多様体の破断を回避したスケーラブルなアルゴリズムである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:07:35 GMT)
Cohomological Obstructions to Global Counterfactuals: A Sheaf-Theoretic Foundation for Generative Causal Models [7.1] We formalize structure causal model as cellular sheaves over Wasserstein space。
トラクタビリティを確保するため,エントロピック正則化を導入し,エントロピック・ワッサーシュタイン・カウスタル・ラフ・ラプラシアンを導出する。
筆者らのフレームワークは熱力学ノイズを利用して高次元scRNA-seqカウンターファクトリーのトポロジカルバリアをナビゲートする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:07:07 GMT)
MemArchitect: A Policy Driven Memory Governance Layer [7.1] 私たちは、モデル重みからメモリライフサイクル管理を分離するガバナンス層であるMemArchitectを紹介します。
MemArchitectは、メモリ崩壊、コンフリクト解決、プライバシコントロールなど、明示的でルールベースのポリシーを実行する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 22:37:05 GMT)
Bootstrapping Coding Agents: The Specification Is the Program [7.0] コーディングエージェントは自身をブートストラップすることができる。
926ワードの仕様と既存のエージェントが生成した最初の実装から始まり、新しく生成されたエージェントがスクラッチから同じ仕様を再実装する。
これは、AIコーディングエージェントの領域において、コンパイラの構成から知られている古典的なブートストラップシーケンスを再現し、Lispから知られているメタ循環プロパティをインスタンス化する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:21:06 GMT)
LICA: Layered Image Composition Annotations for Graphic Design Research [7.0] LICAは、テキスト、画像、ベクトル、グループ要素を含むタイプされたコンポーネントの階層的な構成として、それぞれの設計を表現している。
データセットは20の設計カテゴリと991,850のユニークなテンプレートで構成され、現実世界のデザイン構造を幅広くカバーしている。
スケールを超えて、LICAはグラフィックデザインのための新しい研究課題のパラダイムを確立し、レイヤーアウェア塗装、構造化レイアウト生成、制御されたデザイン編集、時間アウェア生成モデリングといった問題に対する構造化された調査を可能にする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:44:02 GMT)
100x Cost & Latency Reduction: Performance Analysis of AI Query Approximation using Lightweight Proxy Models [7.0] 我々は、低コストな分析とデータベースアプリケーションがAIクエリの恩恵を受けることができるAIクエリ近似手法を提案する。
コストとパフォーマンスの向上は、埋め込みベクタよりも安価で正確なプロキシモデルを利用することによって実現される。
レイテンシとコストの大幅な増加にもかかわらず、これらのプロキシモデルは精度を保ち、さまざまなベンチマークデータセットの精度を時折向上させる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:17:29 GMT)
Training-free Detection of Generated Videos via Spatial-Temporal Likelihoods [6.9] トレーニング不要で理論上は正当化された検出器であるSTALLを導入し、ビデオの確率に基づくスコアを提供する。
我々は,2つの公開ベンチマーク上でSTALLを評価し,最新の生成モデルを用いた新しいベンチマークであるComGenVidを紹介する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:12:55 GMT)
On the Cone Effect and Modality Gap in Medical Vision-Language Embeddings [6.7] VLM(Vision-Language Models)は、非線形エンコーダが表現空間の高度に集中した領域に埋め込む特徴的な「コーン効果」を示す。
本稿では, クロスモーダル分離を継続的に制御しながら, 事前学習したVLMエンコーダを凍結し続ける軽量なポストホック機構を提案する。
これにより、モダリティギャップが高価なリトレーニングなしで下流のマルチモーダルパフォーマンスにどのように影響するかを体系的に分析することができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:04:21 GMT)
Starting Off on the Wrong Foot: Pitfalls in Data Preparation [6.7] 本研究は,従来のデータ作成手法が信頼性の低い不安定な結果をもたらす場合が多いことを示す。
本稿では,最近の2つの統計的進歩を活かした新しいデータ準備フレームワークを提案する。
統計的に厳密なデータ作成手法を取り入れることで,モデルの堅牢性と解釈可能性を大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:37:33 GMT)
From Concepts to Judgments: Interpretable Image Aesthetic Assessment [6.6] 画像美的評価(IAA)は、人間の知覚による画像の美的品質を予測することを目的としている。
本稿では,人間に理解可能な審美概念に基づく解釈可能なIAAフレームワークを提案する。
提案手法は,透明で人間に理解可能な美的判断を提供しながら,競争力のある予測性能を実現する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:32:42 GMT)
Inhibitory normalization of error signals improves learning in neural circuits [6.5] 人工知能ニューラルネットワーク(ANN)では、複雑な入力分布を含むタスクの学習を改善するために正規化が使用される。
推論中のみ正規化を適用すれば,阻害による正規化は学習を改善できないことがわかった。
これらの結果は、阻害による脳の学習が改善すると、学習信号の正規化も必要となることを示唆している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:54:31 GMT)
Multi-Source Evidence Fusion for Audio Question Answering [6.2] TalTechのAgent Track of the Interspeech 2026 Audio Reasoning Challengeに対するソリューションについて述べる。
すべての推論ステップを明示的で信頼性の高いタグ付きエビデンスで基礎付けることで、システムは密度の高い検証可能な推論連鎖を生成する。
我々のシステムは、挑戦において第一にランク付けし、挑戦の推論品質指標の幅広いマージンで競合する全てのシステムを上回った。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:12:42 GMT)
Privacy-Preserving Machine Learning for IoT: A Cross-Paradigm Survey and Future Roadmap [6.2] モノのインターネット(Internet of Things)の急速な普及により、堅牢なプライバシー保護機械学習メカニズムへの需要が高まっている。
この調査では、プライバシ保護機械学習のIoT中心、クロスパラダイム分析を包括的に紹介する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:14:02 GMT)
Interpreting Context-Aware Human Preferences for Multi-Objective Robot Navigation [6.2] 本稿では,ロボットがコンテキストに依存したナビゲーションの好みを理解し,適用できるようにするパイプラインを提案する。
Vision-Language Model (VLM)は、搭載された視覚観測から構造化された環境コンテキストを抽出する。
大規模言語モデル(LLM)は、自然言語のユーザフィードバックを解釈可能なコンテキスト依存の行動規則に変換する。
好み翻訳モジュールは、コンテキスト情報と格納されたルールを数値的な好みベクトルにマッピングする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:14:05 GMT)
On the Fragility of AI Agent Collusion [6.1] 実際の展開の典型的な不均一性の下では、衝突は脆弱であることを示す。
本稿では,データ共有を規制する執行行動や,アルゴリズムの多様性を促進する政策など,反トラストの影響について論じる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:55:13 GMT)
Learning Permutation Distributions via Reflected Diffusion on Ranks [6.1] 本稿では,シャッフルベースの汚職をソフトランクフォワードプロセスに置き換える離散拡散フレームワークを提案する。
実験により、ソフトランク拡散は先行拡散ベースラインよりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:28:24 GMT)
A Single-Fiber Optical Frequency Domain Reflectometry (OFDR)-Based Shape Sensing of Concentric Tube Steerable Drilling Robots [6.1] 本稿では,光周波数領域反射法(OFDR)に基づく同心円管ステアリングロボット(CT-SDR)の新たな形状センシング手法を提案する。
OFDRは、空間分解能を高めた繊維長全体の連続的なひずみ測定を可能にする。
以上の結果から, この統合戦略の有効性と堅牢性を確認し, 正確かつ信頼性の高い形状センシング能力を示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:51:07 GMT)
Transfer Learning for Contextual Joint Assortment-Pricing under Cross-Market Heterogeneity [6.1] 我々は,帯域フィードバックを持つ多項ロジット選択モデルの下で,コンテキスト型共同価格の伝達学習について検討した。
UCBスタイルの政策とアグリゲート・then-debias推定を組み合わせたバイアス認識フレームワークを開発した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:48:04 GMT)
Symphony: A Cognitively-Inspired Multi-Agent System for Long-Video Understanding [6.0] ロングフォームビデオ理解(LVU)タスクは、高情報密度と拡張時空間によって特徴づけられる。
LVUエージェントに関する最近の研究は、単純なタスク分解と協調機構がLVUタスクには不十分であることを実証している。
我々は,LVUを細粒度サブタスクに分解し,深い推論協調機構を組み込んだマルチエージェントシステムであるSymphonyを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:04:49 GMT)
SoK: From Silicon to Netlist and Beyond $-$ Two Decades of Hardware Reverse Engineering Research [5.9] ハードウェアリバースエンジニアリング(HRE)は、セキュリティ保証の基礎となっている。
HREは設計検証、サプライチェーン保証、脆弱性発見など、重要なセキュリティアプリケーションを可能にする。
本稿では、187冊の査読論文の詳細な分析に基づく知識の体系化について述べる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:05:35 GMT)
Safety Case Patterns for VLA-based driving systems: Insights from SimLingo [5.9] VLA(Vision-Language-Action)ベースの運転システムは、より柔軟で適応的で、命令対応の運転行動を可能にする。
VLAベースの運転システムは、新しい種類の危険行動を示す可能性がある。
これを支援するために,RAISEと呼ばれる新しい安全ケース設計手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:04:09 GMT)
DeepCORO-CLIP: A Multi-View Foundation Model for Comprehensive Coronary Angiography Video-Text Analysis and External Validation [5.8] DeepCORO-CLIPはビデオテキストコントラスト学習で訓練された多視点基礎モデルである。
モデルは、複数のプロジェクションとアテンションベースのプールを統合して、研究レベルの評価を行う。
DeepCORO-CLIPは、ケアの時点で自動的に冠動脈造影を解釈する基盤を提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:54:24 GMT)
QuantFL: Sustainable Federated Learning for Edge IoT via Pre-Trained Model Quantisation [5.7] Federated Learning (FL)は、IoT(Internet of Things)デバイス上でのプライバシ保護インテリジェンスを実現する。
FLは、頻繁なアップリンク伝送のエネルギーコストが高いため、重要な炭素フットプリントを発生させる。
我々は,事前学習した初期化を活用して,能動的で計算学的に軽量な量子化を実現する,持続可能なFLフレームワークであるQuantFLを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:08:28 GMT)
On Securing the Software Development Lifecycle in IoT RISC-V Trusted Execution Environments [5.7] RISC-V Trusted Execution Environments (TEEs)は、自動車とIoT部門で注目を集めている。
我々は、RISC-V TEEがソフトウェア開発ライフサイクルの重要な側面をサポートすることができる新しいツールキットを紹介します。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:19:26 GMT)
Halfway to 3D: Ensembling 2.5D and 3D Models for Robust COVID-19 CT Diagnosis [5.6] 胸部CT画像から新型コロナウイルス検出・疾患分類を行うための深層学習フレームワークを提案する。
このフレームワークは2.5Dと3Dの両方の表現を統合し、補完的なスライスレベルとボリューム情報をキャプチャする。
PHAROS-AIF-MIHベンチマークの実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:16:07 GMT)
How Psychological Learning Paradigms Shaped and Constrained Artificial Intelligence [5.6] 人工知能の主流のパラダイムは、心理学から理論を学ぶことによって形成された。
本稿では、それぞれのAIパラダイムが、強みだけでなく、それを引き起こした心理的理論の構造的制約を継承したことを論じる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:54:36 GMT)
ManiDreams: An Open-Source Library for Robust Object Manipulation via Uncertainty-aware Task-specific Intuitive Physics [5.5] 直感的な物理モデルを用いた不確実性認識操作計画のためのモジュラーフレームワークであるManiDreamsを,オープンソースとして公開した。
ManiDreamsは知覚、パラメトリック、構造という3つの不確実性の原因に対処している。
これは、分布結果に対する候補行動を評価するサンプル予測制約ループで、基本方針をラップする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 22:46:46 GMT)
Grievance Politics vs. Policy Debates: A Cross-Platform Analysis of Conservative Discourse on Truth Social and Reddit [5.5] 我々は、Trath Socialと最も人気のある保守的なRedditコミュニティ、r/Conservative、r/Conservatives、r/Republicanを分析します。
真にソーシャルな中心は欲求と物語駆動のコンテンツであり、Redditは政策に関する議論に重点を置いている。
我々の発見は、オンラインの言論をいかに作り直すかを理解するのに役立ちます。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:35:10 GMT)
Continually self-improving AI [5.4] 現代の言語モデルベースのAIシステムは驚くほど強力だが、その能力は基本的に人間の創造者によって支えられている。
この論文は、これらの固有の制限を克服するための小さな一歩を踏み出し、依存関係を壊して継続的に自己改善するAIを作るための3つの章を提示している。
まず、知識獲得におけるこのデータ効率の障壁を克服するために、小さなコーパスをリッチな知識表現に多様化・増幅する合成データアプローチを提案する。
第二に、人間のデータへの依存を減らすために、そのようなデータが一定量与えられたら、合成データを自己生成して、その基本的な事前学習能力をブートストラップできることが示される。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:54:05 GMT)
SpiderCam: Low-Power Snapshot Depth from Differential Defocus [5.3] SpiderCamは、52cmの作業範囲で32.5FPSで480x400のスパース深度マップをリアルタイムで作成し、合計624mWの電力を消費する。
SpiderCamは、同じシーンの異なる2つの画像を同時にキャプチャするカスタムカメラで構成されている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:48:41 GMT)
Removing nodal and support-mismatch pathologies in Variational Monte Carlo via blurred sampling [5.3] 変分モンテカルロ(VMC)は、パラメータ化された身体波関数を最適化し、進化させる強力な高速成長法である。
しかし、実際には、メソッドのバックボーンがなければ、ノードの存在によって不安定あるいは偏りになる可能性がある。
これらの問題に対処するために、ぼやけたサンプリングを導入します。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:00:05 GMT)
Public Profile Matters: A Scalable Integrated Approach to Recommend Citations in the Wild [5.3] Profilerは軽量で学習不能なモジュールで、人間の引用パターンを効率よく、バイアスなくキャプチャする。
DAVINCIは,プロファイラ由来の信頼度を意味情報と統合する新しい階調モデルである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:52:42 GMT)
Gradient-Informed Temporal Sampling Improves Rollout Accuracy in PDE Surrogate Training [5.2] ニューラルシミュレータGITS(Gradient-Informed Temporal Smpling)に適したデータサンプリング手法を提案する。
GITSは、パイロットモデル局所勾配とセットレベルの時間被覆を協調的に最適化し、モデル特異性と動的情報のバランスをとる。
複数のサンプリングベースラインと比較して、GITSが選択したデータは、複数のPDEシステム、モデルバックボーン、サンプル比率で低いロールアウト誤差を達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:45:44 GMT)
Adaptive Anchor Policies for Efficient 4D Gaussian Streaming [5.1] ほとんどのパイプラインはFarthest Point Smpling (FPS)のような固定アンカーの選択に依存しており、厳格な予算の下で過度に配置されている。
本稿では,プラグイン型,予算対応型アンカーサンプリングシステムであるEfficient Gaussian Streaming (EGS)を提案する。
EGSはFPSを強化されたポリシーに置き換え、ガウスのストリーミング再構築のバックボーンは変更しない。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:18:11 GMT)
Draft-and-Prune: Improving the Reliability of Auto-formalization for Logical Reasoning [5.1] 自動形式化(AF)は自然言語推論問題を解法実行プログラムに翻訳する。
D&P(Draft-and-Prune, Draft-and-Prune, Draft-and-Prune, D&P)は、AFに基づく論理的推論を多様性と検証によって改善する推論時フレームワークである。
D&Pは追加の監督なしにAFベースの推論を大幅に強化する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:35:14 GMT)
When Openclaw Agents Learn from Each Other: Insights from Emergent AI Agent Communities for Human-AI Partnership in Education [5.1] AIEDは、AIが“ツールからチームメイトまで”進化していくことを想定していますが、私たちのAIチームメイトに対する理解は、相変わらず人間とAIのインタラクションに限られています。
167,000人以上のエージェントが参加し、同僚として交流し、研究者の介入なしに学習行動を開発する、AIエージェントプラットフォームの急成長するエコシステム。
我々は、これらの有機現象が、マルチエージェント教育システムの設計を通知できる自然主義的なダイナミクスの窓を提供すると論じている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:56:48 GMT)
Gender Disambiguation in Machine Translation: Diagnostic Evaluation in Decoder-Only Architectures [5.0] 我々は,モデルが既定の性別を仮定した「Prior Bias」という新しい尺度を導入する。
スケールと最先端にもかかわらず、デコーダのみのモデルが一般にエンコーダ・デコーダのアーキテクチャを性特化メトリクスで上回っているわけではないことを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:26:36 GMT)
SemanticFace: Semantic Facial Action Estimation via Semantic Distillation in Interpretable Space [5.0] アバター制御や人間とコンピュータの相互作用といった多くの実用的な応用には、解釈可能な顔アクションが必要である。
解釈可能なARKitブレンドシェープ空間における顔行動推定のためのフレームワークであるSemanticFaceを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:12:19 GMT)
LED: A Benchmark for Evaluating Layout Error Detection in Document Analysis [5.0] 本研究では,DLA予測における構造的推論を表面レベルの精度を超えて評価するベンチマークを提案する。
LEDは8種類の標準エラータイプ(ミス、幻覚、サイズエラー、スプリット、マージ、オーバーラップ、重複、誤分類)を定義している。
文書レベルのエラー検出、文書レベルのエラータイプ分類、要素レベルのエラータイプ分類という3つの評価タスクを設計する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:45:31 GMT)
GRAFITE: Generative Regression Analysis Framework for Issue Tracking and Evaluation [4.9] 大きな言語モデル(LLM)は、リリース時に人気のあるトピックやベンチマークのパフォーマンスによって大きく動機付けられている。
時間の経過とともに、トレーニング中にベンチマークデータが著しく露出するため、汚染が発生する。
本稿では,モデル問題を維持し,評価するための総合システムを通じて,連続LLM評価プラットフォームであるGRAFITEを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:14:21 GMT)
High-dimensional quantum communication with scalable photonic entanglement in time and frequency [4.8] 時間周波数領域における高次元絡みを特徴付けるスキャンフリー手法を実証する。
我々の再建は5.70pm0.07$ ebitsと65.4pm0.4%$を達成し、局所的な最大絡み合った状態は1021$である。
商用の通信部品と最先端の低ジッタ単一光子検出器を用いて、我々のスケーラブルなアーキテクチャは、高速で耐雑音性のある量子通信テストベッドへの実践的な道筋を提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:00:00 GMT)
LaDe: Unified Multi-Layered Graphic Media Generation and Decomposition [4.8] そこで我々はLaDeを提案する。LaDeはフレキシブルな多くの意味論的意味のある層を生成する潜在拡散フレームワークである。
LaDeは3つのコンポーネントを組み合わせる: LLMベースのプロンプト拡張器で、短いユーザインテントを階層単位の記述に変換する。
トレーニング中にレイヤサンプルを条件付けすることにより,テキスト・ツー・イメージ生成,テキスト・ツー・レイヤ・メディア設計生成,メディア設計の分解という3つのタスクをサポートする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:34:07 GMT)
Multi-material Direct Ink Writing and Embroidery for Stretchable Wearable Sensors [4.8] 本稿では,多素材直接筆記法と自動刺青を統合し,布地に直接埋め込まれた伸縮性ひずみセンサを製作する繊維適合加工ワークフローを提案する。
このプロセスは、シリコーンカーボネート・グリース・シリコーンスタックのシーケンシャルな多材料印刷と、機械的固定と電気的対面の両方を単一のステップで行う自動刺青を組み合わせている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 23:35:54 GMT)
Stabilizing correlated pair tunneling of spin-orbit-coupled bosons in a non-Hermitian driven double well [4.7] 本研究では,周期的に駆動される非エルミート二重井戸電位において,2つのボソンの2階相関トンネルを安定化するための解析的枠組みを提案する。
解析により, インタウェルスピン保存, インタウェルスピンフリッピング, インタウェルスピンフリッピングの3つの基本チャネルの安定性機構が明らかにされた。
これらの結果は, 工学的散逸を伴う多体系における相関トンネル制御の可能性を広げるものである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:39:48 GMT)
Efficient Dense Crowd Trajectory Prediction Via Dynamic Clustering [4.7] 群衆の軌道予測は公共の安全と管理において重要な役割を果たす。
最近の研究は、個々の軌跡を予測し、手動で注釈付けされたデータに基づいて周囲の物体を考察することによって、この問題に対処している。
類似属性に基づいて個人をグループ化するクラスタベースの新しいアプローチを,時間とともに提案し,広く評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:04:54 GMT)
SAATT Nav: a Socially Aware Autonomous Transparent Transportation Navigation Framework for Wheelchairs [4.5] 本研究は、車いすのための社会認識自律透明交通(SAATT)ナビゲーションフレームワークを潜在的な解決策として提案する。
ユーザ意図を知らせるLarge Language Model (LLM)を実装し、ローカルコントローラの意思決定者として他人の意図を予測する。
全体として、SAATT Navは、ほとんどの社会的状況で優れており、残りの指標では同等かわずかに劣っている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:15:13 GMT)
Deanonymizing Bitcoin Transactions via Network Traffic Analysis with Semi-supervised Learning [4.5] Bitcoinアドレスは現実世界のIDと直接関連付けられていないが、ユーザーのプライバシーを完全に保証しているわけではない。
ネットワークトラフィック分析と半教師付き学習を統合した,新規で効率的なトランザクション匿名化手法である textitNTSSL を提案する。
実験結果は、既存のアプローチの1.6倍の大幅なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:39:26 GMT)
DexViTac: Collecting Human Visuo-Tactile-Kinematic Demonstrations for Contact-Rich Dexterous Manipulation [4.5] 大規模で高品質なマルチモーダルデモは、接触に富むデキスタス操作のロボット学習に不可欠である。
本稿では,コンタクトリッチなデキスタラス操作に適した携帯型人中心データ収集システムであるDexViTacを紹介する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:39:58 GMT)
Proactive Knowledge Inquiry in Doctor-Patient Dialogue: Stateful Extraction, Belief Updating, and Path-Aware Action Planning [4.3] 本研究では, 医師と患者との対話を, 部分観察可能性下での積極的な知識問合せ問題として定式化する。
提案するフレームワークは、ステートフル抽出、シーケンシャルな信念更新、ギャップ対応状態モデリング、客観的な医療知識によるハイブリッド検索、およびPOMDP-liteアクションプランナーを組み合わせたものである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:03:50 GMT)
A Proactive EMR Assistant for Doctor-Patient Dialogue: Streaming ASR, Belief Stabilization, and Preliminary Controlled Evaluation [4.3] 本稿では, ストリーム音声認識, 句読取復元, ステートフル抽出, 信念安定化, 客観的検索, 行動計画, リプレイ可能なレポート生成を中心に, エンドツーエンドの能動型EMRアシスタントを提案する。
全システムは0.84のステートイベントF1、0.87のリコール@5、83.3%のカバー、81.4%の構造化、完全性、80.0%のリスクリコールに到達している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:54:01 GMT)
AGRI-Fidelity: Evaluating the Reliability of Listenable Explanations for Poultry Disease Detection [4.3] AGRI-Fidelityは,空間的根拠のない養鶏病検出における聴取可能な説明のための信頼性指向評価フレームワークである。
実データと制御されたデータセット全体で、AGRI-Fidelityは、マスキングベースのメトリクスに対して、すべてのデータポイントに対して信頼性に配慮した識別を効果的に提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:12:02 GMT)
The Reasoning Bottleneck in Graph-RAG: Structured Prompting and Context Compression for Multi-Hop QA [4.2] グラフRAGシステムは、文書を知識グラフにインデックス化することで、強力なマルチホップ質問応答を実現するが、強力な検索は強力な回答を保証しない。
検索された文脈では77%から91%の質問が金の答えを持っているが、精度は35%から78%に過ぎず、エラーの73%から84%が失敗の原因となっている。
i) SPARQLチェーン・オブ・シークレット・プロンプトは,質問をエンティティ・リレーショナル・コンテキストと整合したトリプル・パターンのクエリに分解し,(ii)グラフウォーク圧縮を行う。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:14:55 GMT)
Wasserstein-type Gaussian Process Regressions for Input Measurement Uncertainty [4.2] 本研究では,各ノイズ入力を確率尺度として表現することにより,入力測定の不確実性の下でのGP回帰について検討する。
我々は、一次元成分が閉形式表現を許容する決定論的射影ワッサースタインARDカーネルをインスタンス化する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:51:21 GMT)
Grid Spatial Understanding: A Dataset for Textual Spatial Reasoning over Grids, Embodied Settings, and Coordinate Structures [4.1] テキストのみのグリッドデータセットであるGSUを導入し、3つのコアタスク上でのLLMの空間的推論能力を評価する。
その結果,ほとんどのモデルでは基本的なグリッド概念を把握しているが,実施エージェントに対する参照のフレームに悩まされ,座標リストから3次元形状を識別できることがわかった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:57:30 GMT)
Understanding Task Aggregation for Generalizable Ultrasound Foundation Models [4.1] 我々は,DINOv3上に構築されたマルチ組織マルチタスクフレームワークであるM2DINOを紹介した。
課題特化, 臨床グループ化, 全タスク統合トレーニングの3つのパラダイムにおいて, セグメンテーション, 分類, 検出, 回帰にまたがる27の超音波タスクを評価する。
その結果,アグリゲーションの有効性はトレーニングデータ尺度に強く依存していることがわかった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:43:43 GMT)
ListK: Semantic ORDER BY and LIMIT K with Listwise Prompting [4.1] ListKフレームワークは、セマンティックORDER BYの遅延を改善する。
部分的なリストのランク付けを最もよく組み合わせたソートアルゴリズムについて検討する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:08:12 GMT)
A Computationally Efficient Learning of Artificial Intelligence System Reliability Considering Error Propagation [4.1] 本稿では、物理に基づく自動運転車シミュレーションプラットフォームを用いて、AIシステムの信頼性分析のための高品質なデータを生成する。
ステージ間のエラー伝搬を明示的に特徴付ける新しい信頼性モデリングフレームワークを開発した。
自律走行車認識システムに対する信頼性モデリングへの応用は、その予測精度と計算効率を示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:53:46 GMT)
Context-Nav: Context-Driven Exploration and Viewpoint-Aware 3D Spatial Reasoning for Instance Navigation [4.0] Text-goal instance navigation (TGIN)は、エージェントに単一の自由形式の記述を正しいオブジェクトインスタンスに到達するアクションに解決するよう要求する。
局所的なキューからグローバルな探索までの長い文脈的キャプションを増大させるtextitContext-Navを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:49:51 GMT)
Memory Bear AI Memory Science Engine for Multimodal Affective Intelligence: A Technical Report [4.0] Memory Bear AI Memory Science Engineは、マルチモーダル感情インテリジェンスのためのメモリ中心のフレームワークである。
構造化メモリ形成、ワークメモリ集約、長期統合、メモリ駆動型検索、動的核融合校正、継続的なメモリ更新による処理を組織化する。
実験結果から、ベンチマークとビジネスグラウンド設定を比較した結果、一貫した利得が得られた。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:23:00 GMT)
CentaurTA Studio: A Self-Improving Human-Agent Collaboration System for Thematic Analysis [3.9] textbfCentaurTA Studioは、オープンコーディングとテーマ構築において、自己改善されたヒューマンエージェントコラボレーションのためのWebベースのシステムである。
CentaurTA は Open Coding と Theme Construction で最強のパフォーマンスを達成し、92.12% の精度に達した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:01:28 GMT)
Efficient Training-Free Multi-Token Prediction via Embedding-Space Probing [3.9] 大規模言語モデル(LLM)は、次世代にのみ訓練されているにもかかわらず、潜在マルチトークン予測(MTP)能力を示す。
本研究では,その埋め込み空間から引き出されたオンザフライマスクトークンを用いてLCMを探索するトレーニングフリーMPP手法を提案する。
マスクトケロジットからトップK候補を抽出して投機的トークンツリーを構築し,高確率継続を維持するために軽量プルーニング戦略を適用した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:14:01 GMT)
Comment on: "Coherent perfect absorption: Zero reflection without linewidth suppression" [3.8] 最近の論文では、コミューン16, 5652 (2025) で測定された偏光力学的正規モード分割(NMS)は、2つの結果に基づいて真ではないと主張している。
i$) スペクトルの線形スケールと対数スケールの両方に NMS が存在することを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:42:11 GMT)
HRI-SA: A Multimodal Dataset for Online Assessment of Human Situational Awareness during Remote Human-Robot Teaming [3.8] HRI-SAは,30人の参加者による,リアルな検索と救助を行う人間-ロボットのコラボレーションコンテキストにおけるマルチモーダルデータセットである。
本稿では,人間ロボットチームにおける状況認識の体系的評価を支援する最初の公開データセットを提案する。
また、遠隔ロボットチームにおける知覚的SA遅延検出のための一般的な視線追跡機能の可能性を示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 23:02:59 GMT)
ResNet-50 with Class Reweighting and Anatomy-Guided Temporal Decoding for Gastrointestinal Video Analysis [3.7] このシステムは5つの解剖学クラスと12の病理学クラスを含む17のラベルを336x336のフレームから予測する。
主な課題は、特に希少な病理病のラベルについて、深刻な階級不均衡であった。
この設計では、最終時間mAPをチャレンジテストセットで0.3801から0.4303に改善した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:46:40 GMT)
VideoAtlas: Navigating Long-Form Video in Logarithmic Compute [3.7] textbfVideoAtlasは、動画を階層的なグリッドとして表現するためのタスクに依存しない環境である。
階層構造により、アクセス深度はビデオ長と対数的にのみ増大する。
ビデオRLMは1時間から10時間に及ぶベンチマークのスケーリングにおいて、最小限の精度の劣化を伴う最も長い時間ロバストな方法である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:20:19 GMT)
ViSA: Visited-State Augmentation for Generalized Goal-Space Contrastive Reinforcement Learning [3.6] ViSA(Visited-State Augmentation)と呼ばれるコントラスト強化学習(CRL)のための新しいデータ強化手法を提案する。
ViSA は,1) 高度化状態サンプルの生成,2) 連続的な埋め込み空間の学習,という2つのコンポーネントから構成される。
目標空間の一般化が向上し,視認困難な目標に対する正確な値推定が可能となった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:06:20 GMT)
Structured SIR: Efficient and Expressive Importance-Weighted Inference for High-Dimensional Image Registration [3.5] 本稿では,高品位サンプルを用いた不確かさの表現的,多モーダルな特徴化を可能にする,メモリと計算効率のよい推論手法であるStructured SIRを提案する。
超高次元問題である脳MRIデータの3次元画像登録におけるこのアプローチの有効性を評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:46:55 GMT)
Intellectual Stewardship: Re-adapting Human Minds for Creative Knowledge Work in the Age of AI [3.5] 学生や教師は、人間や人工システムに分散した知的プロセスの責任者として働く。
知識的であることは、知識の進化状態を理解し、それを進めるために目的的な行動を取ることを伴う。
倫理的に見れば、知識と知力の使用における倫理的判断、責任、およびケアの前提となる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:15:30 GMT)
A Hierarchical Error-Corrective Graph Framework for Autonomous Agents with LLM-Based Action Generation [3.5] 本稿では3つのコアイノベーションを組み込んだ階層的誤り訂正グラフフレームワークfor AutonomousAgentswithLLM-BasedActionGeneration(HECG)を提案する。
MDTS:タスク品質指標(Q),信頼性/コスト指標(C),報酬指標(R),LLMに基づく意味推論スコア(LLM-Score)を統合することで,MDTSは定量的パフォーマンスと意味的コンテキストの多次元的アライメントを実現する。
EMC:単純な混乱行列や全体的なパフォーマンス指標とは異なり、EMCはエラーをStrategy Whe(Strategy Whe)やScript(Script)といった10のタイプに分類することで、タスク障害の構造化された属性を提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:23:22 GMT)
Deployment and Evaluation of an EHR-integrated, Large Language Model-Powered Tool to Triage Surgical Patients [3.4] 外科的共同管理(英: surgery co-management, SCM)は、外科チームと共に患者を共同で管理するエビデンスベースのモデルである。
SCMナビゲータは、患者をSCMに適切、不適切、あるいはおそらく適切と分類した。
配備以降、6,193件の患者が入院し、うち1,582件(23%)が入院相談に推薦された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:36:58 GMT)
Efficient Quantum Algorithm for Solving Linear Distributed Delay Differential Equations [3.3] 非マルコフ力学は量子系と古典系の両方においてユビキタスである。
線形分散遅延微分方程式を解くための効率的な量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:13:50 GMT)
Real-Time Online Learning for Model Predictive Control using a Spatio-Temporal Gaussian Process Approximation [3.2] この研究は、オンライン学習を一定の計算複雑性で提供する、時間的近似GPモデルの効率的な実装を示す。
GP-MPCに最適化されており、オンラインでより正確なシステムダイナミクスをリアルタイムで学習することで制御性能を向上させることができる。
提案手法の性能は,シミュレーションおよびハードウェア実験により,自律型ミニチュアレースの模範的応用として実証された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:53:21 GMT)
Toward Reliable, Safe, and Secure LLMs for Scientific Applications [3.1] 大規模言語モデル(LLM)は自律的な「AI科学者」へと進化する
科学的に信頼できるデプロイメントを保証するには、信頼性、安全性、セキュリティを中心とした新しいパラダイムが必要です。
本稿では,科学におけるLLMエージェントのユニークなセキュリティと安全性の展望について検討する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:43:38 GMT)
Toward Phonology-Guided Sign Language Motion Generation: A Diffusion Baseline and Conditioning Analysis [3.1] 我々は3次元身体運動の生成モデルを訓練し,手話動作生成における音韻的属性条件付けの役割を探る。
我々はまず,SMPL-X表現を持つHuman Motion MDMスタイルの拡散モデルを用いて,強い拡散ベースラインを確立する。
次に,異なるテキストエンコーダ(CLIP vs. T5),コンディショニングモード(gloss-only vs. gloss+phonological attribute),属性表記形式を用いて,テキストコンディショニングの役割を体系的に研究する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:10:05 GMT)
Gesture-Aware Pretraining and Token Fusion for 3D Hand Pose Estimation [3.1] ジェスチャーのセマンティクスが3次元ポーズ推定の強力な帰納的バイアスとなることを示す。
本稿では,情報埋め込み空間を学習するジェスチャー認識事前学習という2段階のフレームワークを提案する。
InterHand2.6Mの実験では、ジェスチャー認識による事前学習が一貫した精度の向上を実証している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:18:46 GMT)
DDH-based schemes for multi-party Function Secret Sharing [3.1] 既存のマルチパーティ方式のキーサイズを削減するDDHに基づく手法を提案する。
私たちのベンチマークでは、最先端のスキームよりも10倍程度のキーサイズが強調されています。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:48:19 GMT)
VISER: Visually-Informed System for Enhanced Robustness in Open-Set Iris Presentation Attack Detection [3.1] 我々は、手書きアノテーション、目追跡ヒートマップ、セグメンテーションマスク、DINOv2を最先端のディープラーニングベースラインに埋め込み、比較実験を行った。
左ワンアタック型アウトパラダイムにおけるオープンセットPADの結果,視線追跡ヒートマップはクロスエントロピーよりも最高の一般化改善を示すことが示された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:45:33 GMT)
Robust-ComBat: Mitigating Outlier Effects in Diffusion MRI Data Harmonization [3.0] ComBatとその変種のような調和法は拡散MRI(dMRI)サイト固有のバイアスを軽減するために広く用いられている。
ComBatと標準基準群との調和性を示すとともに,病的症例を含むと有意な歪みが生じることを示す。
コントロールと実際のマルチサイトコホートの両方の実験は、神経疾患の80%の被験者からなるものであり、ロバスト・コムバットが従来の統計基準を一貫して上回っていることを実証している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:35:25 GMT)
AgentDrift: Unsafe Recommendation Drift Under Tool Corruption Hidden by Ranking Metrics in LLM Agents [3.0] クリーンで汚染されたツール出力条件下で、実際の財務対話を再生するペアトラジェクトリプロトコルを導入する。
評価盲点パターンを観察し, 推奨品質は汚染下で保存される。
物語のみの腐敗(バイアス付き見出し、数値操作なし)でさえ、一貫性モニタを完全に回避しながら大きなドリフトを引き起こします。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:31:03 GMT)
Neural Pushforward Samplers for the Fokker-Planck Equation on Embedded Riemannian Manifolds [3.0] 弱反転ニューラルプッシュフォワード法をFokker-Planck方程式に拡張する。
トレーニングは、周囲平面波試験関数を用いた弱い対向目標によって導かれる。
2次元球面上の二重井戸問題に関する数値計算の結果は、多モード不変分布を捕捉する手法の能力を実証している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:00:59 GMT)
Beyond VQE and QPE: A Noise- and Sampling-Error-Tolerant Quantum Algorithm with Heisenberg-Limited Precision [3.0] Witnessed Quantum Time Evolution (WQTE)は、任意の量子系の固有エネルギースペクトルを効率的に計算するための新しい量子アルゴリズムである。
WQTEは1つの補助量子ビットを用いてリアルタイム進化演算子を制御することにより、複数の固有エネルギーの並列分解を可能にする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:27:07 GMT)
Directing the Narrative: A Finetuning Method for Controlling Coherence and Style in Story Generation [2.9] 堅牢で一貫したストーリー生成のために設計された2段階のフレームワークを提案する。
まず、本質的な一貫性を促進するメカニズムであるGSA(Group-Shared Attention)を紹介する。
第2に、DPO(Direct Preference Optimization)を利用して、生成した出力を人間の美学と物語の基準に合わせる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:43:02 GMT)
3D MRI-Based Alzheimer's Disease Classification Using Multi-Modal 3D CNN with Leakage-Aware Subject-Level Evaluation [2.9] 深層学習は、構造MRIからアルツハイマー病を分類するための重要なツールとなっている。
本研究はアルツハイマー病分類のための多モード3D畳み込みニューラルネットワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:00:30 GMT)
Consumer-to-Clinical Language Shifts in Ambient AI Draft Notes and Clinician-Finalized Documentation: A Multi-level Analysis [2.8] Ambient AIは、患者とクリニックの会話から、しばしば消費者指向の言い回しと共に、ドラフトな臨床ノートを生成する。
辞書確認変換フレームワークを用いた正規化のためのクリニック編集の定量化を行った。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 22:20:06 GMT)
Continuous symmetry analysis and systematic identification of candidate order parameters for interacting fermion models [2.8] フェミオン系における連続対称性を解析するための体系的枠組みを提案する。
半単純リー代数の理論を用いて、このリー代数の構造を同定する。
これらの順序パラメータは、それらが破壊する対称性に従って分類する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:16:22 GMT)
Multimodal Emotion Recognition via Bi-directional Cross-Attention and Temporal Modeling [2.8] 本稿では,第10回ABAWチャレンジにおける表現課題に対するマルチモーダル感情認識フレームワークを提案する。
本フレームワークは,視覚および音声表現学習のための大規模事前学習モデルを構築し,それらを統合マルチモーダルアーキテクチャに統合する。
ABAW 10th EXPRベンチマークの実験結果から,提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:36:49 GMT)
LRConv-NeRV: Low Rank Convolution for Efficient Neural Video Compression [2.8] 提案するLRConv-NeRVは,高密度な3x3畳み込み層を低ランク分離型畳み込みに置き換える,効率的なNeRV変種である。
実験では、LRConvを最終デコーダ段階のみに適用するとデコーダの複雑さが68%減少することを示した。
その結果、LRConv-NeRVは、低精度かつリソース制約の条件下での効率的なニューラルビデオデコーディングの潜在的なアーキテクチャ上の代替品として確立された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:31:59 GMT)
RangeAD: Fast On-Model Anomaly Detection [2.8] 我々は、関連する機械学習モデルへのアクセスを明示的に活用する、異常検出のための設定であるOn-Model ADを紹介した。
この設定では、一次モデルから派生したニューロンの出力範囲を利用するアルゴリズムであるRangeADを提案する。
本研究は,効率的な異常検出のための実践的フレームワークとして,On-Model AD設定の可能性を示すものである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:52:49 GMT)
A practical artificial intelligence framework for legal age estimation using clavicle computed tomography scans [2.7] クラビクルCTによる年齢推定のための解釈可能な多段階パイプラインを提案する。
パイプラインは、公開法医学データセットから1,158個の全身CTスキャンで評価される。
このモデルは、ホールドアウトテストセットにおいて平均絶対誤差(MAE)が1.55$pm$0.16年である最先端の性能を達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:02:01 GMT)
Huddle: Parallel Shape Assembly using Decentralized, Minimalistic Robots [2.7] 分散化ロボットを用いた任意の形状の集合体を形成するための新しいアルゴリズムを提案する。
局所的な相互作用に依存することにより、アルゴリズムはアセンブリに到達不可能な状態やギャップがないことを保証する。
アルゴリズムの正しさを証明し,その有効性を示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:28:37 GMT)
Temporal Narrative Monitoring in Dynamic Information Environments [2.6] 本研究は,新たな物語を時間的に進化する意味構造としてモデル化するシステム指向フレームワークを提案する。
本手法を現実世界の危機イベントに適用し,階層化されたクラスタ検証と時間的ライフサイクル分析を通じてシステム行動を評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:30:17 GMT)
Post-Training Local LLM Agents for Linux Privilege Escalation with Verifiable Rewards [2.6] LLMエージェントは、脆弱性発見のような研究領域にますます関係している。
しかし、最強のシステムは依然としてクローズドでクラウドのみであり、リソース集約的で再現が難しく、プロプライエタリなコードや機密データに関わる作業には適さない。
本稿では,厳格な資源予算の下でセキュリティタスクを実行できる,小規模でローカルなモデルを開発するための2段階のポストトレーニングパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:52:54 GMT)
CodeT5-RNN: Reinforcing Contextual Embeddings for Enhanced Code Comprehension [2.6] 本稿では,連続的なRNNアーキテクチャを用いてコンテキスト埋め込みを強化するハイブリッドLLM-RNNフレームワークを提案する。
提案したハイブリッドモデルを,ベンチマークと実世界の符号化データセットの両方で評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:12:33 GMT)
Facial Movement Dynamics Reveal Workload During Complex Multitasking [2.6] リアルタイム認知作業負荷モニタリングは、安全クリティカルな環境において不可欠である。
われわれは、標準的なウェブカメラの顔の動きのダイナミクスが低コストな代替手段になるかどうかを検証した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:28:16 GMT)
FoMo X: Modular Explainability Signals for Outlier Detection Foundation Models [2.6] 本稿では,FoMo-Xについて紹介する。FoMo-Xは,Prior-Data Fitted Networksに本質的で軽量な診断機能を提供するモジュールフレームワークである。
FoMo-Xは補助的な診断ヘッドを埋め込みに取り付け、バックボーンの前に同じ生成シミュレータを使ってオフラインでトレーニングする。
私たちは、FoMo-Xを2つの新しいヘッドでインスタンス化する: 解釈可能なリスク層への偏差を識別する重大性ヘッドと、信頼度を提供する不確実性ヘッド。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:22:51 GMT)
An Auditable AI Agent Loop for Empirical Economics: A Case Study in Forecast Combination [2.6] 本稿では,オープンソースエージェントループアーキテクチャを基盤として,経験経済学の透過的プロトコルとして最小限のコーディングループを再考する。
予測結合図では、複数の独立エージェントが元のローリング評価において標準ベンチマークよりも優れているが、すべてのエージェントがポストサーチのホールトアウトでそれを継続するわけではない。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:55:04 GMT)
Concept-to-Pixel: Prompt-Free Universal Medical Image Segmentation [2.5] Concept-to-Pixel (C2P) は、新しいプロンプトフリーのユニバーサルセグメンテーションフレームワークである。
C2Pは解剖学的知識を幾何学的表現とセマンティック表現の2つの構成要素に分ける。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:13:22 GMT)
AI-Assisted Goal Setting Improves Goal Progress Through Social Accountability [2.5] キャリアコーチングはゴール品質と達成率を改善するが、コストと可用性の制限によりアクセスが制限される。
本稿では,AIキャリアコーチとコントロールグループを比較検討し,事前に登録した3本腕ランダム化制御試験を報告する。
AIはコントロールグループよりもはるかに高い目標達成を実現しました。
認識された説明責任は、ゴールの進行にAI-over-questionnaire効果を介する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:12:25 GMT)
Full waveform inversion method based on diffusion model [2.5] フルウェーブフォームインバージョンは高分解能地下モデルパラメータを得るためのコア技術である。
本稿では,条件付き拡散モデル正規化に基づくフルウェーブフォーム逆変換法を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:32:33 GMT)
Imaginary Gauge Field and Non-Hermitian Topological Transition Emerging Through Attenuation-Gauge Duality in Conservative Systems [2.4] 非エルミート物理学は伝統的にアクティブなゲイン-ロス変調や非相互結合に依存している。
非エルミート位相が完全に受動的で保守的なシステム内に現れる減衰ゲージ双対性パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:04:21 GMT)
Modeling the human lexicon under temperature variations: linguistic factors, diversity and typicality in LLM word associations [2.4] 本研究では,人間の言語モデルと大規模言語モデル(LLM)を比較した。
単語頻度や具体性などの語彙的要因がキュー応答対に与える影響について検討する。
その結果、全てのモデルが人間の頻度と具体的な傾向を反映するが、応答のばらつきや典型性が異なることがわかった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:10:02 GMT)
CodeGreen: Towards Improving Precision and Portability in Software Energy Measurement [2.3] 計測からインスツルメンテーションを分離するモジュール式エネルギー測定プラットフォームであるCodeGreenを紹介する。
ハードウェアセンサを独立してポーリングするNative Energy Measurement Backend (NEMB)を実装した。
CodeGreenは、Tree-sitter ASTクエリを活用して、Python、C++、C、Javaにまたがる自動インスツルメンテーションを実現している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:01:12 GMT)
Disentangled Representation Learning through Unsupervised Symmetry Group Discovery [2.3] 本研究では,環境との非教師的相互作用によって,その行動空間の群構造が自律的に発見されることを示す。
最小の仮定の下で、真の対称性群分解の識別可能性を証明する。
本手法は, 群分解の異なる3つの環境において検証された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:13:06 GMT)
SLEA-RL: Step-Level Experience Augmented Reinforcement Learning for Multi-Turn Agentic Training [2.3] 本研究では,SLEA-RL(Step-Level Experience-Augmented Reinforcement Learning)を提案する。
SLEA-RLは、(i)効率的なクラスタインデックス検索のために構造的に等価な環境状態をグループ化するステップレベルの監視クラスタリング、(ii)スコアベースの入出力とレート制限抽出を通じて成功戦略と失敗パターンを蒸留する自己進化体験ライブラリ、(iii)マルチターンエピソード間のきめ細かな優位性推定のためのステップレベルの信用割当によるポリシー最適化の3つのコンポーネントを通して機能する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:16:18 GMT)
Tula: Optimizing Time, Cost, and Generalization in Distributed Large-Batch Training [2.2] Tulaは、畳み込みモデルの大規模なトレーニングのために、時間、コスト、収束品質を自動的に最適化するオンラインサービスである。
Tulaは、複数のモデルで7.5-14%のエラーでトレーニング時間とコストを予測し、全体の20倍のスピードアップを達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:56:32 GMT)
Interpretable Traffic Responsibility from Dashcam Video via Legal Multi Agent Reasoning [2.1] ダシュカムビデオとテキスト記述を中国の交通法規に明示的に整合させるマルチモーダル法定データセットを提案する。
本稿では,(1)テキストによる映像記述を生成する交通事故理解モジュール,(2)責任態様を出力する法的マルチエージェントフレームワーク,(2)ルールセット,および完全な判断報告の2段階について紹介する。
C-TRAIL および MM-AU による実験結果から,本手法は従来のエージェントベースアプローチと同様に,一般および合法の LLM よりも優れていた。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:04:48 GMT)
Zeno and anti-Zeno effects in dark-state dynamics under thermal dephasing [2.1] 熱劣化を受けるキャビティQEDシステムにおける暗黒状態の安定性について検討した。
我々は,ゼノおよび抗ゼノ行動に対応する異なるパラメータ構造を同定した。
この結果は、オープン量子系における測定バックアクションとデコヒーレンスの間の相互作用に関する洞察を与える。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:20:47 GMT)
MQTE: A Measurement-Based Quantum Algorithm for Robust Energy Spectrum Estimation in the NISQ Era [2.0] 本研究では,実時間進化を基準状態に適用することにより,エネルギーギャップを推定するアンシラフリーアルゴリズムを提案する。
1次元および2次元ハイゼンベルクモデル上での数値シミュレーションによりアルゴリズムの性能を検証する。
この研究は、NISQ時代の量子スペクトル推定のための堅牢でスケーラブルなフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:30:41 GMT)
Competing with AI Scientists: Agent-Driven Approach to Astrophysics Research [1.9] 本稿では,科学データ解析のためのパラメータ推論パイプライン構築のためのエージェント駆動型アプローチを提案する。
提案手法では,マルチエージェントシステムであるCmbagentを活用して,研究アイデアの生成,コードの記述と実行,結果の評価,パイプライン全体の改良を反復的に行う。
ケーススタディとして、現実的な観測の不確実性を伴う堅牢な宇宙パラメーター推論に焦点を当てた、時間制約下での競争であるFAIR Universe Weak Lensing Uncertainity Challengeに適用する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:32:20 GMT)
Motion-Adaptive Temporal Attention for Lightweight Video Generation with Stable Diffusion [1.9] 凍結安定拡散モデルに基づくパラメータ効率の高いビデオ生成のための動き適応型時間的注意機構を提案する。
カスケード戦略により、UNetトランスフォーマーブロックに軽量な時間的アテンションモジュールを注入する。
我々のアブレーション研究は、ノイズ相関と運動振幅との明確なトレードオフを明らかにし、多様な生成行動に対する実用的な推論時間制御を提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:20:57 GMT)
Don't Vibe Code, Do Skele-Code: Interactive No-Code Notebooks for Subject Matter Experts to Build Lower-Cost Agentic Workflows [1.9] Skele-Codeは、AIエージェントで構築するための自然言語およびグラフベースのインターフェースである。
インクリメンタルでインタラクティブなノートブックスタイルの開発をサポートする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:37:29 GMT)
Auto-Unrolled Proximal Gradient Descent: An AutoML Approach to Interpretable Waveform Optimization [1.9] 本研究では、自動機械学習(AutoML)とモデルベースディープ展開(DU)を組み合わせて、無線ビームフォーミングと波形の最適化を行う。
我々は、反復勾配降下(PGD)アルゴリズムをディープニューラルネットワークに変換し、パラメータを所定のパラメータではなく学習する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:33:25 GMT)
EDM-ARS: A Domain-Specific Multi-Agent System for Automated Educational Data Mining Research [1.9] EDM-ARSは、エンドツーエンドの教育データマイニング(EDM)研究を自動化する、ドメイン固有のマルチエージェントパイプラインである。
我々は、EDM-ARSをドメイン認識自動研究パイプラインの一般的なフレームワークとして概念化している。
EDM-ARSは、教育研究コミュニティを支援するオープンソースプロジェクトとしてリリースされた。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:45:45 GMT)
WINFlowNets: Warm-up Integrated Networks Training of Generative Flow Networks for Robotics and Machine Fault Adaptation [1.7] WINFlowNetsは、フローと検索ネットワークの協調トレーニングを可能にする新しいフレームワークである。
WINFlowNetsは、平均報酬とトレーニング安定性の観点から、CFlowNetsや最先端のRLアルゴリズムを上回っている。
これらの知見は、WINFlowNetsが動的および機能不全を引き起こすロボットシステムに展開する可能性を示している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:55:02 GMT)
Final Report for the Workshop on Robotics & AI in Medicine [1.7] ワークショップは、医学におけるAIとロボットの卓越性のための国家センター(CARE)の設立の緊急性についての広いコンセンサスを示した。
参加者は、データ可用性、標準化された評価方法、規制経路、労働トレーニングの重大なギャップを指摘した。
議論では、AIによってロボットが精度を向上し、提供者の負担を軽減し、専門的なケアへのアクセスを拡大し、患者の結果を向上する可能性を強調した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:53:35 GMT)
Interpretability without actionability: mechanistic methods cannot correct language model errors despite near-perfect internal representations [1.7] 言語モデルは、その出力性能をはるかに上回る内部表現におけるタスク関連知識を符号化する。
現在の機械的解釈可能性法は、内部知識を確実に修正された出力に変換することはできない。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 23:31:05 GMT)
MAED: Mathematical Activation Error Detection for Mitigating Physical Fault Attacks in DNN Inference [1.7] 本稿では,アルゴリズムレベルの誤り検出フレームワークであるMAED(Mathematical Activation Error Detection)を紹介する。
これは、実行時に非線形アクティベーション関数計算の正しさを連続的に検証するために数学的アイデンティティを利用する。
アルゴリズムレベルのエラー検出技術を統合して、悪意のある障害注入攻撃と、組み込みシステムで自然に発生する障害の両方を防御する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:13:48 GMT)
A Continuous-Variable Quantum Fourier Layer: Applications to Filtering and PDE Solving [1.7] 両分割ガウス符号化とクーリー・テューキー量子フーリエ変換に基づく連続可変量子フーリエ層(CV-QFL)を導入する。
CV-QFLは,スペクトル低域フィルタリングと熱方程式のフーリエ領域積分という2つの代表的なタスクで試験する。
これにより、光のネイティブスペクトル処理が可能になり、量子科学機械学習の新しいアプローチの基礎となる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:35:10 GMT)
Objective Mispricing Detection for Shortlisting Undervalued Football Players via Market Dynamics and News Signals [1.6] 本稿では,客観的なミスプライシングを前提とした,過小評価されたサッカー選手を特定するための,実用的で再現可能な枠組みを提案する。
構造化されたデータ(歴史市場ダイナミクス、伝記・契約の特徴、転送履歴)から期待される市場価値を推定し、観測された評価値と比較し、誤算を定義する。
次に,ニュースから派生した自然言語処理(NLP)が,過小評価された選手の市場信号を補完するかどうかを評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:03:23 GMT)
Large-Scale Analysis of Political Propaganda on Moltbook [1.6] 我々は,AIエージェントのためのRedditスタイルのプラットフォームであるMoltbook上で,NLPに基づく政治プロパガンダの研究を行った。
673,127件の投稿と879,606件のコメントのデータセットから、政治プロパガンダが全投稿の1%、政治コンテンツ全体の42%を占めていることがわかった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 23:16:55 GMT)
Critical Thinking in the Age of Artificial Intelligence: A Survey-Based Study with Machine Learning Insights [1.5] 本稿では,AI利用行動と批判的思考能力の関係について検討する。
その結果、背景特性のみよりも、忍耐力の低下と依存関係の強い傾向が推論性能の低下と密接に関連していることが示唆された。
効果的な人間とAIのコラボレーションは、その代わりではなく、リフレクション、検証、持続的な認知的努力をサポートするべきだ、と氏は主張する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:22:44 GMT)
A Dual Certificate Approach to Sparsity in Infinite-Width Shallow Neural Networks [1.5] 単位球の測度に対する凸最適化問題として定式化された無限幅浅部ReLUニューラルネットワークの総変動(TV)正規化トレーニングについて検討した。
本手法は,テレビ規則化最適化問題の双対性理論を利用して,トレーニング問題に対する解の空間性に関する厳密な保証を確立する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:46:55 GMT)
Revisiting foundation models for cell instance segmentation [1.5] 細胞分画モデル (CellPoseSAM, CellSAM, $$SAM) と汎用分画モデル (SAM, SAM2, SAM3) に関する基礎モデルを, 多様な顕微鏡的データセットを用いて評価した。
我々は,SAMベースの顕微鏡基礎モデルを改善するために,自動プロンプト生成(APG)と呼ばれる新しいインスタンスセグメンテーション戦略を導入する。
我々の研究はSAM型モデルから顕微鏡への適応戦略の重要な教訓を提供し、さらに強力な顕微鏡基礎モデルを作成するための戦略を提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:34:42 GMT)
KANtize: Exploring Low-bit Quantization of Kolmogorov-Arnold Networks for Efficient Inference [1.5] Kolmogorov-Arnold Networks (KANs) は、MLP(Multi-Layer Perceptrons)を上回る可能性について注目されている。
本研究では,低ビット量子化がkanに与える影響と,計算複雑性とハードウェア効率に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:32:11 GMT)
A Comprehensive Benchmark of Histopathology Foundation Models for Kidney Digital Pathology Images [1.5] 病理組織基盤モデル(HFM)は、大規模ながんデータセットで事前訓練されている。
複数の染色物にまたがる11の腎特異的下流領域における11のHFMについて検討した。
その結果,中等度な中等度腎形態を呈し,中等度から強度に改善した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:17:27 GMT)
Access Controlled Website Interaction for Agentic AI with Delegated Critical Tasks [1.5] 本稿では,デリゲートされたクリティカルタスクに対するきめ細かいアクセス制御を備えたAIエージェントのためのWebサイトベースインタラクションを提案する。
提案手法は,Webサイトの設計と実装,およびオープンソース認証サービスにおけるアクセス許可プロトコルの変更を含む。
提案手法の評価は,AIエージェントが使用するアクセス制御Webサイトの能力を示すものである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:49:04 GMT)
Dissipative Phase Transition in a Parametrically Amplified Quantum Rabi Model with Two-photon decay [1.5] パラメトリック増幅されたオープン量子ラビモデル(QRM)における散逸相転移(DPT)を,単光子と2光子の両方で検討した。
この三重臨界性は、コヒーレントおよび散逸性二光子過程の相互作用により、QRMの固有非線形性に由来することを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:35:02 GMT)
A Tutorial on ALOS2 SAR Utilization: Dataset Preparation, Self-Supervised Pretraining, and Semantic Segmentation [1.4] ALOS-2単チャネルSAR画像に適用したSimMIMの重み付き版であるSAR-W-SimMIMを紹介する。
本手法は,自己指導型事前訓練におけるスペックルと極度強度値の影響を低減することを目的としている。
SAR-W-MixMAEを用いた前回の試行と比較し,セマンティックセグメンテーションへの影響を検討した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:23:38 GMT)
AR-Flow VAE: A Structured Autoregressive Flow Prior Variational Autoencoder for Unsupervised Blind Source Separation [1.4] 盲点分離のための新しいVAEベースのフレームワークであるAR-Flow VAEを提案する。
この研究は、AR-Flow VAEの識別可能性と解釈可能性に関する今後の研究の基礎を提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:48:18 GMT)
Toward Generalized Cross-Lingual Hateful Language Detection with Web-Scale Data and Ensemble LLM Annotations [1.4] 大規模ウェブデータとLLMに基づく合成アノテーションが多言語ヘイトスピーチの検出に有効かどうかを検討する。
我々は、未実装の OWS テキスト上でのマスキングを継続することにより、BERT モデルに事前学習を継続する。
その結果,標準ベースラインよりも平均的なマクロF1ゲインが約3%向上することがわかった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:57:23 GMT)
MCP-38: A Comprehensive Threat Taxonomy for Model Context Protocol Systems (v1.0) [1.4] 本稿では,38の脅威カテゴリ (MCP-01 から MCP-38 まで) からなるプロトコル固有の脅威である MCP-38 を提案する。
分類学は、プロトコルの分解、多フレームのクロスマッピング、現実世界のインシデント合成、修復と表面の分類という4段階の体系的な方法論によって導かれた。
MCP-38は、MSPのセマンティックアタックサーフェス(ツール記述中毒、間接的インジェクション、寄生ツールチェーン、動的信頼違反)から生じる重大な脅威に対処する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:22:41 GMT)
End-to-end data-driven prediction of urban airflow and pollutant dispersion [1.4] 本研究の目的は, 意思決定者を支援するため, 都市汚染物質分散の迅速かつ正確なモデルを開発することである。
道路キャニオンにおける気流と汚染物質分散のモデル化と予測を行うために, エンドツーエンドのデータ駆動方式を提案する。
その結果, 時間的地平線上での時間的および統計的に定常な場予測において, モデルの有効性が示された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:19:13 GMT)
Do Language Models Encode Semantic Relations? Probing and Sparse Feature Analysis [1.4] Pythia-70M, GPT-2, Llama 3.1 8Bの3種類の拡大スケールモデルについて検討した。
我々は4つの意味的関係(同義語、無反語、超語、偽語)に焦点を当てる。
以上の結果から,LLM内の意味的関係がどの程度確実に表現されているかが明らかとなった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:42:53 GMT)
Unified Policy Value Decomposition for Rapid Adaptation [1.4] ポリシーと値関数は、タスクのアイデンティティをキャプチャする低次元係数ベクトル(ゴール埋め込み)を共有する。
我々は,MuJoCo Ant環境上でソフトアクター・クライブエージェントを多目的に訓練し,連続目標ベクトルとして指定された8方向を歩かなければならない。
この結果から,共有低次元目標埋め込みは,高次元制御における高速かつ構造化された適応の一般的なメカニズムをもたらすことが示唆された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:19:56 GMT)
Network- and Device-Level Cyber Deception for Contested Environments Using RL and LLMs [1.4] 我々は、競合環境におけるネットワークレベルおよびデバイスレベルのサイバー詐欺手法を構築するための、AIベースの様々なソリューションについてレビューする。
具体的には、大規模言語モデル(LLM)と強化学習(RL)の融合を利用して、これらのサイバー詐欺戦略を最適に学習することに焦点を当てる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:51:59 GMT)
Embedding World Knowledge into Tabular Models: Towards Best Practices for Embedding Pipeline Design [1.3] 256のパイプライン構成をベンチマークし、8つの前処理戦略、16の埋め込みモデル、2の下流モデルをカバーする。
この結果から, LLMの事前知識を取り入れた場合, 予測性能が向上するかどうか, パイプライン設計に強く依存していることが示唆された。
より大きな埋め込みモデルはより良い結果をもたらす傾向があり、公開のリーダーボードランキングとモデルの人気はパフォーマンス指標が貧弱である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:04:57 GMT)
The Verifier Tax: Horizon Dependent Safety Success Tradeoffs in Tool Using LLM Agents [1.3] 本研究では, 大規模言語モデル (LLM) エージェントを用いた多段階ツールにおいて, 実行時の安全でない動作に対する強制が, エンドツーエンドのタスクパフォーマンスに与える影響について検討する。
モデル依存相互作用の地平線(15~30ターン)を特定し、その結果を総合成功率(SR)、安全な成功率(SSR)、安全でない成功率(USR)に分解する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:16:34 GMT)
In Trust We Survive: Emergent Trust Learning [1.3] 我々は,既存のAIエージェントにプラグイン可能な,軽量で信頼に基づく制御アルゴリズムであるEmergent Trust Learning (ETL)を紹介する。
各エージェントは、メモリ、探索、アクション選択を変調する、コンパクトな内部信頼状態を保持する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:12:54 GMT)
MLmisFinder: A Specification and Detection Approach of Machine Learning Service Misuses [1.3] 機械学習(ML)クラウドサービスは、スクラッチからモデルを構築することなく、MLコンポーネントをソフトウェアシステムに統合することを可能にする。
MLサービスの迅速な導入は、広範囲にわたる誤用、品質、保守性、MLサービスベースのシステムの進化につながった。
ソフトウェアシステムにおけるMLサービスの誤用を自動検出するMLmisFinderを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:48:20 GMT)
rSDNet: Unified Robust Neural Learning against Label Noise and Adversarial Attacks [1.3] ニューラルネットワークのトレーニングを最小分散推定問題として定式化する。
本稿では,$S$-divergencesの一般クラスに基づく頑健な学習アルゴリズムであるrSDNetを紹介する。
この結果から,不均一なデータ汚染下での頑健なニューラルネットワーク分類の原則的,効果的な枠組みとして,最小分散学習が注目された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:47:46 GMT)
Differential Attention-Augmented BiomedCLIP with Asymmetric Focal Optimization for Imbalanced Multi-Label Video Capsule Endoscopy Classification [1.2] 本研究は,ビデオカプセル内視鏡(VCE)のためのマルチラベル分類フレームワークを提案する。
アーキテクチャと最適化レベルの戦略を組み合わせることで、Galarデータセットに固有の極端なクラス不均衡に対処する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:04:50 GMT)
Can LLMs Reason Like Automated Theorem Provers for Rust Verification? VCoT-Bench: Evaluating via Verification Chain of Thought [1.2] VCoT-Liftは低レベルの解法推論を高レベルで可読性のある検証ステップに引き上げる。
VCoT-Benchは、欠落した証明の様々な程度に対する堅牢性、異なる証明タイプに対する能力、証明位置に対する感度の3つの次元で性能を測定する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 22:42:20 GMT)
Visual SLAM with DEM Anchoring for Lunar Surface Navigation [1.1] 将来の月のミッションでは、挑戦的な地形を数km横断できる自律探査船が必要になります。
地球の測位システム、極端な照明、低テクスチュアなリゴリスの欠如は、特に月の長距離航行を困難にしている。
本稿では,学習した特徴の検出とグローバル制約のマッチングを統合したステレオ視覚的同時位置決めマッピングシステム(SLAM)を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:24:05 GMT)
Semantic Segmentation and Depth Estimation for Real-Time Lunar Surface Mapping Using 3D Gaussian Splatting [1.1] 本稿では,高密度知覚モデルと3次元ガウススプラッティング(3DGS)表現を統合したリアルタイムマッピングフレームワークを提案する。
この結果から, セマンティックセグメンテーションと深度推定を学習地図表現と組み合わせることが, 将来の月面ミッションを支援するための詳細な大規模地図作成に有効な方法であることが示唆された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:07:30 GMT)
Can Blindfolded LLMs Still Trade? An Anonymization-First Framework for Portfolio Optimization [1.1] LLMのトレーディングエージェントは、記憶されたティッカー・アソシエーションの活用よりも、市場のダイナミクスの理解を実証しなければならない。
我々は,チッカー固有の事前トレーニングによる記憶バイアスと,欠陥のあるバックテストによる生存バイアスの2つの源泉に対処する。
我々のアプローチは、エージェントを盲目化し、すべての識別子を匿名化し、意味のあるシグナルが持続するかどうかを検証することである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:09:11 GMT)
Inducing Epistemological Humility in Large Language Models: A Targeted SFT Approach to Reducing Hallucination [1.1] 大型言語モデル(LLM)は、しばしば幻覚を起こし、流動性はあるが誤った情報を生成する。
謙虚さを通じてモデルを教えるために、$textitHypoTermInstruct$を導入します。
我々の研究は、目標とする高品質なSFTデータ学習メタ認知スキルが幻覚を効果的に減少させることを示した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:07:39 GMT)
Synergizing Deep Learning and Biological Heuristics for Extreme Long-Tail White Blood Cell Classification [1.1] 本稿では,人工物除去のためのPix2Pixベースの復元モジュールと,ロバスト表現学習のためのMedSigLIPコントラスト埋め込みを用いたSwin Transformerアンサンブルと,幾何学的スパイキネスとマハラノビスに基づく形態的制約を用いた生物学的にインスパイアされた改良ステップを組み合わせた,レアクラスの一般化のためのハイブリッドフレームワークを提案する。
本手法は, 生体画像解析の深層学習に生物前駆体を組み込むことの価値を強調し, 極めて不均衡な環境下での強い性能を示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:11:12 GMT)
MedSAD-CLIP: Supervised CLIP with Token-Patch Cross-Attention for Medical Anomaly Detection and Segmentation [1.1] 医学的異常検出(MAD)とセグメンテーション(セグメンテーション)は臨床診断を補助する重要な役割を担っている。
最近のCLIPベースの研究は、ゼロ/フェーショット設定における異常検出を約束している。
現実的な臨床環境下でのMADに対するCLIPの適応について検討した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:37:44 GMT)
Negation is Not Semantic: Diagnosing Dense Retrieval Failure Modes for Trade-offs in Contradiction-Aware Biomedical QA [1.0] 大言語モデル (LLMs) は質問応答において強い能力を示してきたが、検証不可能なクレームを生成する傾向は、臨床環境において重大なリスクをもたらす。
これらのリスクを軽減するため、TREC 2025 BioGenトラックは、矛盾する証拠を明示的に提示する根拠のついた回答を義務付けている。
本稿では、SciFactデータセットを用いて、検索アーキテクチャを体系的に最適化するプロキシベースの開発フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:35:44 GMT)
Eye image segmentation using visual and concept prompts with Segment Anything Model 3 (SAM3) [1.0] これまでの研究では、視覚基礎モデルでは視線画像のセグメンテーションにおけるゼロショット性能が期待できると報告されてきた。
本稿では,Segment Anything Modelの最新版 SAM3 が SAM2 よりも優れたアイ画像セグメンテーション性能を提供するかどうかを検証し,新しいコンセプト(テキスト)プロンプトモードの性能について検討する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:33:46 GMT)
ConGA: Guidelines for Contextual Gender Annotation. A Framework for Annotating Gender in Machine Translation [1.0] 言語間のジェンダーの扱いは、機械翻訳にとって依然として永続的な課題である。
英語は文法的性別を省略するが、イタリア語は複数の文法的カテゴリーで明示的な合意を必要とする。
本稿では,単語レベルのジェンダーアノテーションを言語的に規定したガイドラインセットであるContextual Gender Textual (ConGA) フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:31:47 GMT)
Dynamic sparsity in tree-structured feed-forward layers at scale [0.9] 深部変圧器アーキテクチャにおけるブロックのドロップイン置換として, スパース, ツリー構造を有するフィードフォワード層について検討した。
自動回帰言語モデリングやダウンストリーム質問応答において,この条件空間が適用可能であることを初めて実証した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:57:36 GMT)
Full Stack Navigation, Mapping, and Planning for the Lunar Autonomy Challenge [0.9] 本稿では月面ナビゲーションと月面マッピングのためのモジュール式フルスタック自律システムについて紹介する。
我々のパイプラインはセマンティックセグメンテーション、ステレオビジュアルオドメトリー、ループクロージャ付きグラフSLAM、階層化計画と制御を統合している。
私たちのソリューションは、最終競争評価で1位を獲得しました。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:32:56 GMT)
Physics-informed neural networks for solving saddle-point equations in strong-field physics with tailored fields [0.9] 我々は、サドルポイント方程式を解くために、教師なしの物理情報ニューラルネットワークを開発した。
我々は、PINNを、様々な分野の従来の解法と比較する。
我々は、コヒーレントなATI光電子運動量分布を計算し、駆動場の対称性がサドル点構造と結果のスペクトルの両方に反映されていることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:33:39 GMT)
Conditional Inverse Learning of Time-Varying Reproduction Numbers Inference [0.7] 流行発生データから時間変化の再現数を推定することは、伝染病の監視において中心的な課題である。
本研究では,過去の発生パターンから潜在複製数への条件付きマッピングを学習することで,逆問題に対処する条件付き逆再生学習フレームワーク(CIRL)を提案する。
結果として得られた枠組みは、疫学的に根ざした制約とデータ駆動の時間的表現を結合し、観測ノイズに頑健な再生数推定を生成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:52:41 GMT)
Tackling the Sign Problem in the Doped Hubbard Model with Normalizing Flows [0.7] 半充填時の流れを有限化学ポテンシャルに正規化することで最近の進歩を延長する。
チャージベースでの最先端ハイブリッドモンテカルロと比較して, 本手法は正確な対角化結果を正確に再現する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:56:26 GMT)
IndicSafe: A Benchmark for Evaluating Multilingual LLM Safety in South Asia [0.7] Indic言語12言語を対象に,大規模言語モデル(LLM)の安全性を初めて体系的に評価した。
言語間の合意はわずか12.8%であり、textttSAFEレートは言語間で17%を超えている。
Indicデプロイメントの文化的な安全性評価を可能にする最初のベンチマークである textscIndicSafe をリリースする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:54:07 GMT)
Responsible AI in criminal justice: LLMs in policing and risks to case progression [0.7] 警察におけるLLM(Large Language Models)の使用に対する関心が高まっているが、潜在的なリスクがある。
我々は,イングランドとウェールズの警察・法体系に根ざした,リスクの特定のための実践的アプローチを開発した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:08:14 GMT)
PAI: Fast, Accurate, and Full Benchmark Performance Projection with AI [0.6] 我々は,詳細なシミュレーションや命令ワイドエンコーディングに頼ることなく,ベンチマーク性能を正確に予測する最初の手法であるPAIを提案する。
PAIは、SPEC CPU 2017ベンチマークスイートで平均9.35%のIPC予測エラーを達成でき、スイート全体では2分57秒しかかからない。
この予測誤差は従来の最先端技術に匹敵するが、3桁の時間を要する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:34:32 GMT)
SG-CoT: An Ambiguity-Aware Robotic Planning Framework using Scene Graph Representations [0.6] ロボットプランナーとして使用される大規模言語モデル(LLM)には、あいまいさが大きな課題となっている。
SG-CoT(Scene Graph-Chain-of-Thought)は、LLMが環境のシーングラフ表現を反復的にクエリしてあいまいさを検出し、明確化する2段階のフレームワークである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:44:34 GMT)
Neural Radiance Maps for Extraterrestrial Navigation and Path Planning [0.6] 現在のローバーの自律性は、オンボードの再計画のために簡単に構築および保存できるグローバルマップの欠如によって制限されている。
NeRFは、スパース2D画像からトレーニングし、効率的に保存できる詳細な3Dシーン表現として導入されている。
我々は、NeRFを用いて、自律ナビゲーションにおけるオンライン利用のためのマップを構築することを提案し、NeRFマップを利用してローカル情報とグローバル情報を統合する計画フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:39:20 GMT)
FalconBC: Flow matching for Amortized inference of Latent-CONditioned physiologic Boundary Conditions [0.6] 境界条件チューニングは、患者固有の心血管モデリングの基本的なステップである。
患者固有の解剖学の標的, 流入特徴, 点雲の埋め込みを治療する確率的フローに基づく一般償却推論フレームワークを提案する。
狭窄部位と重症度が異なる大動脈・腸間膜分岐術と冠状動脈枝の2つの患者特異的モデルに対するアプローチを実証した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:44:52 GMT)
Graph-Native Cognitive Memory for AI Agents: Formal Belief Revision Semantics for Versioned Memory Architectures [0.6] Kumihoは、形式的信念修正セマンティクスに基づくグラフネイティブな認知記憶アーキテクチャである。
アーキテクチャは、二重ストアモデル(Redisワーキングメモリ、Neo4j長期グラフ)を実装し、ハイブリッドフルテキストとベクトル検索を備える。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:59:49 GMT)
DANCE: Dynamic 3D CNN Pruning: Joint Frame, Channel, and Feature Adaptation for Energy Efficiency on the Edge [0.6] 3次元CNNのための細粒度で入力対応の動的プルーニングフレームワークであるDANCEを提案する。
本手法は,乗算累積(MAC)演算とメモリアクセスの大幅な削減を実現する。
NVIDIA Jetson Nano GPUとQualcomm Snapdragon 8 Gen 1プラットフォームのハードウェア検証では、それぞれ1.37Xと2.22Xのスピードアップが示されている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:57:21 GMT)
Exploring parameter-efficient fine-tuning (PEFT) of billion-parameter vision models with QLoRA and DoRA: insights into generalization for limited-data image classification under a 98:1 test-to-train regime [0.6] 本研究では,DINOv3基礎モデルのスクラッチからのトレーニング(ResNet-18, ViT-Small),凍結特徴抽出,パラメータ効率細調整(PEFT)の3つのアプローチを体系的に比較した。
QLoRA と DoRA は、異なるランク (8, 16, 64) とターゲットモジュール (q_proj 対全線形層) の複数の構成で評価した。
その結果、PEFTはQLoRAの最良の構成(全直線層とランク=64)が5.8時間で2.72%のパラメータ(3.0M)で83.16%のテスト精度を達成した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:46:07 GMT)
From Virtual Environments to Real-World Trials: Emerging Trends in Autonomous Driving [0.6] i) 認識と計画のための合成データの利用, (ii) システム検証のためのディジタルツインベースシミュレーション, (iii) 合成データと実世界のデータをブリッジするドメイン適応戦略である。
データセット、ツール、シミュレーションプラットフォームの詳細な分類と、ベンチマーク設計のトレンド分析が提供されている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:32:26 GMT)
Crisis-induced differences in attention towards Ukraine in Twitter 2008-2023 [0.5] この記事では2008年から2023年までの28の言語で、Twitterの"ウクライナ"に注意を向けたマッピングによってギャップを埋める。
ローカル、メソ、グローバルなスケールに注意を向けることで、我々のアプローチは言語間の相対バイアスを比較する汎用的なツールを提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:31:39 GMT)
Requirements Volatility in Software Architecture Design: An Exploratory Case Study [0.5] SWアーキテクチャ設計と要件のボラティリティの関係は、広く研究されていない。
調査の結果、要求の不確実性や動的なビジネス環境などの要因が明らかになった。
本研究では,要求のボラティリティを引き起こす要因を緩和し,要求のボラティリティがもたらす課題に対処する方法について論じる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:08:55 GMT)
From Noise to Signal: When Outliers Seed New Topics [0.5] 動的トピックモデリングにおける外乱は一般的にノイズとして扱われるが、新しいトピックの早期のシグナルとして機能するものもある。
本稿では,文書が時間とともに話題形成とどのように関連しているかを規定する,ニュース文書トラジェクトリの時間的分類について紹介する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 23:54:18 GMT)
Temperature-Dependent Performance of Prompting Strategies in Extended Reasoning Large Language Models [0.5] 4つの温度設定でチェーン・オブ・シンドロームとゼロショット・プロンプトを系統的に評価した。
ゼロショットプロンプトは中等度温度でピーク性能を達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:36:20 GMT)
LAAF: Logic-layer Automated Attack Framework A Systematic Red-Teaming Methodology for LPCI Vulnerabilities in Agentic Large Language Model Systems [0.4] LAAFは、LPCI固有のテクニックと段階的なシードエスカレーションを組み合わせた最初の自動化赤チームフレームワークである。
LAAFは単技術ランダムテストよりも高いステージブレークスルー効率が得られることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:51:36 GMT)
AURORA Model of Formant-to-Tongue Inversion for Didactic and Clinical Applications [0.4] AURORAは、最初の2つのフォルマント値に基づいて母音音の舌の変位と形状を予測する。
モデルは、英語母語話者40名から超音波舌画像と音響データによって通知される。
我々は,このモデルをより広く利用できるようにするために開発された2つのツール,Shinyアプリ,およびリアルタイム舌バイオフィードバックのためのプロトタイプソフトウェアを提示する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:47:01 GMT)
Adaptive Fuzzy Logic-Based Steganographic Encryption Framework: A Comprehensive Experimental Evaluation [0.3] 本稿では,マンダニ型ファジィ推論システムと現代の認証暗号を組み合わせた適応型ステガノグラフィーフレームワークを提案する。
Argon2idとAES-256-GCMに基づく暗号層は、ステガノグラフの隠蔽から独立してペイロードの機密性と整合性を保護する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:43:41 GMT)
ReDAG-RT: Global Rate-Priority Scheduling for Real-Time Multi-DAG Execution in ROS 2 [0.3] ReDAGRTは、ROS 2.0における決定論的マルチDAG実行のためのユーザ空間グローバルスケジューリングフレームワークである。
ROS2コールバックパイプラインのマルチDAGタスクモデルを定式化し、レート・プライオリティスケジューリングの下でDAG間の干渉を分析する。
その結果、デッドラインミス率29.7%、99番目のパーセンタイルレスポンスタイム42.9%、MultiThreadedExecutorよりも13.7%改善した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:45:58 GMT)
Trajectory-Optimized Time Reparameterization for Learning-Compatible Reduced-Order Modeling of Stiff Dynamical Systems [0.3] 時間再パラメータ化(TR)は、ニューラルODEの低次モデリングのための剛性緩和機構である。
本研究では, TR をニューラルODE の低次モデリングのための剛性緩和機構として検討し, トラジェクトリ最適化TR (TOTR) の定式化を導入する。
ToTRは、パラメータ化された剛性線形系、ファンデルポル発振器、HIRES化学動力学モデルという3つの硬質問題で評価される。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:23:48 GMT)
Harnessing the Power of Foundation Models for Accurate Material Classification [0.2] 物質分類はコンピュータビジョンとグラフィックスにおいて重要な課題として浮上している。
ビジョン言語基盤モデルの最近の進歩は、これらの問題に対処するための有望な道を提供する。
本稿では,データ制限を克服し,分類精度を高めるために基礎モデルを効果的に活用する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:14:00 GMT)
A Trace-Based Assurance Framework for Agentic AI Orchestration: Contracts, Testing, and Governance [0.2] 本稿では,Large Language Models (LLM) を用いたエージェントAIシステムの保証フレームワークを提案する。
実行は、明示的なステップとトレースコントラクトを備えたメッセージ・アクション・トレース(MAT)として実装される。
このフレームワークは、有界摂動に対する予算付き反例探索として定式化されたストレステストを含む。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:23:48 GMT)
Toward Evaluation Frameworks for Multi-Agent Scientific AI Systems [0.2] 我々は科学的(マルチ)・エージェントシステムのベンチマークの課題を分析する。
汚染耐性問題の構築戦略について論じる。
量子科学に携わる研究者や技術者とのインタビューの結果について論じる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:05:52 GMT)
Evaluating FrameNet-Based Semantic Modeling for Gender-Based Violence Detection in Clinical Records [0.2] 3人の女性のうち1人は、生涯に親しいパートナーによって肉体的または性的暴力を経験します。
ブラジルでは、医療専門家は法的にそのような事例を報告する必要があるが、報告不足は依然として重要である。
本研究は,電子カルテにおけるオープンテキストフィールドのFrameNetに基づく意味アノテーションがGBVのパターンの識別を支援するかどうかを考察する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:04:50 GMT)
ReLMXEL: Adaptive RL-Based Memory Controller with Explainable Energy and Latency Optimization [0.2] ReLMXELは説明可能なマルチエージェントオンライン強化学習フレームワークである。
報酬分解を使ってメモリコントローラパラメータを動的に最適化する。
ReLMXELはメモリコントローラ内で動作し、詳細なメモリ動作メトリクスを利用して意思決定をガイドする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:07:54 GMT)
The Validity Gap in Health AI Evaluation: A Cross-Sectional Analysis of Benchmark Composition [0.2] 6つの公開ベンチマークで18,707のコンシューマヘルスクエリを分析した。
発見: 臨床組成は、現実世界のニーズと相容れないままである。
フィールドは、臨床実践の完全複雑さと評価を整合させるために、標準化されたクエリプロファイリングを採用しなければならない。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:31:19 GMT)
WORKSWORLD: A Domain for Integrated Numeric Planning and Scheduling of Distributed Pipelined Workflows [0.2] この作業は、分散データパイプラインの自動計画とスケジューリング、あるいはパイプラインの取り込みを追求する。
本研究では,データ処理と共有コンポーネントを,スケジューリングのためのネットワークプランナと組み合わせた汎用的なワークフローとリソースグラフ表現を開発する。
WORKSWORLDは、入射パイプラインのような恒久的なスケジュールのために設計された、数値的なドメインに依存しないプランナーのための新しいドメインである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:48:39 GMT)
Scalable and Personalized Oral Assessments Using Voice AI [0.1] 学生1人当たり15ドル(0.42ドル)で、学部AI/MLコースで36回の口腔検査を行ったシステムについて述べる。
LLMはルーブリックから動的に質問を生成するため、試験構造全体を事前に共有することができる。
マルチエージェントアーキテクチャは、各試験を構造化フェーズに分解し、3つのLLMファミリーのカウンシルが各転写をグレードする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:09:06 GMT)
A New Approach to Code Smoothing Bounds [0.1] 等間隔分割を用いたランダムウォークの総変動距離の不等式を導出する。
提案した境界は、有限アーベル群に対する既存の結果を一般化することを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:56:21 GMT)
On Non-Existence of Stabilizer Absolutely Maximally Entangled States in Even Local Dimensions [0.1] N=4k$ qudits と $kinmathbbN_+$ からなる絶対極大絡み状態 (AME) がグラフ状態として実現できないことを示す。
この結果は、複合局所次元におけるAME状態に強い制約を課し、高度に絡み合った多部量子系のグラフ状態構築の限界を特徴づける。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:41:57 GMT)
The Phasor Transformer: Resolving Attention Bottlenecks on the Unit Circle [0.1] textbfPhasor Transformer ブロックは、単位円多様体 $S1$ 上のシーケンス状態を表すフェーズネイティブな代替である。
これらのブロックを積み重ねると textbfLarge Phasor Model (LPM) が定義される。
その結果,時間列の大規模モデルスケーリングが,決定論的大域的結合を伴う幾何制約位相から生じることを実証し,明確な効率・性能のフロンティアを確立した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:18:41 GMT)
Real-World AI Evaluation: How FRAME Generates Systematic Evidence to Resolve the Decision-Maker's Dilemma [0.1] 実世界AI計測評価フォーラム(FRAME)
AIシステムの大規模な試行と、それらがコンテキストでどのように使用されるかの構造化された観察を組み合わせることを目指している。
大規模なAI使用をリアルタイムでキャプチャするTesting Sandboxと、これらのトレースを実行可能なインジケータに変換するMetrics Hubを使用する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:47:04 GMT)
Event-Driven Video Generation [0.1] 最先端のテキスト・ビデオモデルはしばしば、フレーム単位で現実的なように見えるが、単純なインタラクションでは失敗する。
これは、いつどこで相互作用がアクティブかを明確に定義することなく、すべてのステップで潜在状態を更新するフレームファーストのデノベーションに起因している、と我々は主張する。
イベント駆動ビデオ生成(EVD)について紹介する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:49:27 GMT)
Unrolled Reconstruction with Integrated Super-Resolution for Accelerated 3D LGE MRI [0.1] 本稿では,最適化ループの各イテレーションにおいて,EDSRネットワークを演算子に置き換えるハイブリッドアンロール型再構成フレームワークを提案する。
そこで提案手法は,PSNR と SSIM を標準的アンロール型再構成よりも常に改良する。
これらの結果から, 3次元LGE MRIでは, 超高分解能前兆を直接モデルベース再構成に組み込むことで, 測定精度が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:48:48 GMT)
PhasorFlow: A Python Library for Unit Circle Based Computing [0.1] 本稿では,$S1$単位円を演算する計算パラダイムであるPhasorFlowを紹介する。
入力は複素ファサード$z = ei$として、$N$-Torusでエンコードされる。
グローバルなノルムは、個々のコンポーネントが$mathbbCNにドリフトしている間に保存され、アルゴリズムは予測学習に連続的な幾何勾配を利用することができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:01:22 GMT)
Fast stabilizer state preparation via AI-optimized graph decimation [0.1] 本稿では,2ビットゲート数と深さを削減した安定化器状態の生成法を提案する。
それぞれのステップでCliffordゲートを最適に選択するために、さまざまな検索およびAIベースのアプローチを探索する。
提案手法は,従来の手法と比較して,必要となる2量子ゲートを2.5倍まで削減できることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:10:21 GMT)
Theory of Two-Qubit $T_2$ Spectroscopy of Quantum Many-Body Systems [0.1] 2ビットセンサに適切なパルスを印加することで、プローブされた環境の応答と雑音を分離できることを示す。
相補的な応用として,本手法がシステム内の異なる輸送系統を明確に区別することを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:20:41 GMT)
Rapid Neural Network Prediction of Linear Block Copolymer Free Energies [0.0] 線形ジブロック共重合体の余剰自由エネルギーを高速に予測する機械学習フレームワークを開発した。
結果として得られるモデルは、連鎖長、組成、密度の様々な範囲にわたる参照自由エネルギーを正確に再現する。
これらの結果は、物理的に情報を得た機械学習モデルが、高価な自由エネルギー計算のための効率的なサロゲートとなることを示した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:15:23 GMT)
Modeling Changing Scientific Concepts with Complex Networks: A Case Study on the Chemical Revolution [0.0] トピックに基づく複雑なネットワークを通して,プロトタイプの概念を表現するフレームワークを開発する。
その結果,オノマシロジカルな変化は高いエントロピーとトポロジカルな密度と結びつき,アイデアの多様性と接続性の向上が示唆された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:08:24 GMT)
scicode-lint: Detecting Methodology Bugs in Scientific Python Code with LLM-Generated Patterns [0.0] 本稿では,パターン設計と実行を分離した2層アーキテクチャのScicode-lintを提案する。
人によってラベル付けされた地面の真実を持つKaggleノートでは、前処理によるリーク検出が100%リコールで65%精度に達する。
AI/MLを適用した38の科学論文では、精度は62%(LLM-judged)であり、パターンのカテゴリによって大きく異なる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:23:02 GMT)
WebPII: Benchmarking Visual PII Detection for Computer-Use Agents [0.0] 44,865個の注釈付きeコマースUI画像の詳細な合成ベンチマークであるWebPIIを紹介する。
我々は,テキスト抽出基準の精度を2倍にするのではなく,実用性を示すためにWebRedactを訓練する。
プライバシ保護型コンピュータ利用研究を支援するデータセットとモデルをリリースする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:41:16 GMT)
Verification and Validation of Physics-Informed Surrogate Component Models for Dynamic Power-System Simulation [0.0] 物理インフォームド機械学習サロゲートは、ジェネレータ、コンバータ、その他の電力グリッドコンポーネントの動的シミュレーションを加速するために、ますます研究されている。
本稿では,シミュレーションにおける検証と検証の問題を定式化する。
次に、参照コンポーネントソルバに対するモデルベース検証と、シミュレータと交換されたコンポーネント出力変数の共形校正によるデータベース検証の2つの相補的な設定について検討する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:28:18 GMT)
Variational Kernel Design for Internal Noise: Gaussian Chaos Noise, Representation Compatibility, and Reliable Deep Learning [0.0] ディープネットワークの内部ノイズは通常、ドロップアウト、ハードマスキング、加法摂動などの摂動から受け継がれる。
内部ノイズはどのような相関幾何学を持つべきで、実装された摂動はそれらが作用する表現と互換性があるのか?
本稿では,法則ファミリ,相関カーネル,インジェクション演算子によってノイズ機構が特定され,デシダラタの学習から導出されるフレームワークである変分カーネル設計(VKD)を通じて,これらの疑問に答える。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:12:56 GMT)
Uncertainty equality for SU(N) observables enabling the experimentally friendly detection of k-inseparability via purity measurements [0.0] 有限次元ヒルベルト空間の任意の量子状態に対する正確な不確実性関係を導出する。
次に、任意の有限次元量子状態の$k$分離性に対する相関行列に基づく必要条件を導出する。
その結果,相関関係,エントロピー,不確実性,絡み合いの証明と検出問題との密接かつ複雑な関係が明らかにされた。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:33:59 GMT)
Uncertainty Relation for Entropy and Temperature of Gibbs States [0.0] ギブス状態におけるエントロピー推定のための量子フィッシャー情報を導出する。
彼らの積 $F_Scdot F_T = 1/T2$ はハミルトニアンとは独立である。
エントロピー推定のための最適プロトコルとしてエネルギー測定を同定する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:26:00 GMT)
Translation Invariance of Neural Operators for the FitzHugh-Nagumo Model [0.0] ニューラルネットワーク(NOs)は、偏微分方程式から解演算子を学ぶために設計された強力なディープラーニングフレームワークである。
本研究は, 励起性細胞を記述したFitz-Nagumoモデルにおいて, 硬度時間的ダイナミクスを捕捉するNOs能について検討した。
我々は、7つのNOsアーキテクチャをベンチマークし、それらの性能を翻訳されたテストダイナミクスで評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:28:48 GMT)
Towards spintronics via tunneling through asymmetric barriers [0.0] スピン分解循環電流は対称な初期構成であっても閉鎖上に現れることを示す。
この効果は、適切な初期状態の準備と障壁非対称性を共鳴条件に調整することで強化または反転することができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:34:30 GMT)
Toward Scalable Automated Repository-Level Datasets for Software Vulnerability Detection [0.0] 本研究では,現実のリポジトリに現実的な脆弱性を注入する自動ベンチマークジェネレータを提案する。
再現可能な脆弱性証明エクスプロイトを合成し、レポレベルの脆弱性検出エージェントをトレーニングおよび評価するための、正確にラベル付けされたデータセットを可能にする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:38:35 GMT)
Topological states and flat bands induced by bound states in the continuum in a ladder-shaped one-dimensional photonic crystal [0.0] 1次元結晶は工学的な非自明な状態のための汎用的なプラットフォームとして機能する。
我々は,H字型単位細胞からなる周期構造の性質を解析し,周期的なはしご型システムを形成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:25:47 GMT)
Theoretical Foundations of Latent Posterior Factors: Formal Guarantees for Multi-Evidence Reasoning [0.0] Latent Posterior Factors (LPF) は確率的予測タスクにおいて複数の異種証拠を集約するための原則的枠組みである。
LPFは各エビデンス項目を変分オートエンコーダを介してガウス潜在後部へエンコードし、後部をモンテカルロを経由してソフトファクタに変換し、正確なSum-Product Network Inference (LPF-PN) を介して集約する。
すべてのアグリゲータは、最大4,200のトレーニング例にまたがるデータセットに対して、経験的に検証されている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:30:23 GMT)
The Hourglass Revolution: A Theoretical Framework of AI's Impact on Organizational Structures in Developed and Emerging Markets [0.0] 本稿では,人工知能(AI)が組織構造をどのように変換するかを理論的に検討する。
この分析は、AIが従来の構造的境界を越えて組織的な形を可能にすることを示す3つの重要なメカニズムを特定している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:52:29 GMT)
The End of the Foundation Model Era: Open-Weight Models, Sovereign AI, and Inference as Infrastructure [0.0] 論文は、AI産業が4つの軸に沿って同時に再構築されていると主張している。
さらに、オープンウェイトモデルは主権統制の反直感的な手段であると主張する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:49:10 GMT)
The Convergence Frontier: Integrating Machine Learning and High Performance Quantum Computing for Next-Generation Drug Discovery [0.0] 量子力学を薬物発見に統合することは、経験的試行錯誤から量的精度への決定的なシフトを示す。
アブ初期分子動力学の禁止コストは、化学的精度と計算スケーラビリティの妥協を迫られた。
本稿では,ハイパフォーマンスコンピューティング,機械学習,量子コンピューティングの収束を,このボトルネックに対する決定的な解決策として挙げる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:51:15 GMT)
The Comprehension-Gated Agent Economy: A Robustness-First Architecture for AI Economic Agency [0.0] AIエージェントは、経済的エージェンシー(貿易の執行、予算の管理、契約交渉、サブエージェントの創出)がますます認められている
現在のフレームワークは、運用上の堅牢性と経験的に無関係な機能ベンチマークで、このエージェンシーをゲートしています。
我々は,エージェントの経済的許可が,検証された理解機能によって上界に置かれる形式的アーキテクチャである幻覚誘導エージェント経済(CGAE)を紹介した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:15:32 GMT)
TENSO: Software Package for Numerically Exact Open Quantum Dynamics Based on Efficient Tree Tensor Network Decomposition of the Hierarchical Equations of Motion [0.0] TENSOは、構造化熱環境に没入した量子システムの数値的正確なシミュレーションのための汎用的で強力なオープンソースソフトウェアパッケージである。
これは木テンソルネットワークによる階層的な運動方程式の分解に基づいており、浴槽の複雑さによる次元の呪いを効率的に抑える。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:30:04 GMT)
TDAD: Test-Driven Agentic Development - Reducing Code Regressions in AI Coding Agents via Graph-Based Impact Analysis [0.0] TDAD(Test-Driven Agentic Development、テスト駆動エージェント開発)は、抽象構文木(AST)ベースのコードテストグラフ構築と重み付けされた影響分析を組み合わせたオープンソースのツールとベンチマーク手法である。
結果: TDADのGraphRAGワークフローは、テストレベルの回帰を70%(6.08%から1.82%)削減し、エージェントスキルとしてデプロイされた場合の解像度を24%から32%に改善した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:38:22 GMT)
Superactivation of genuine multipartite Bell nonlocality from two-party entanglement [0.0] GMNLは多部構成であり,多部構成であり,両者の絡み合いのみを特徴とする。
技術面では,ネットワークの絡み合った状態に基づいてGMNLスーパーアクティベーションを認証するための,効率的かつ実用的な基準を開発する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:46:39 GMT)
Stochastic set-valued optimization and its application to robust learning [0.0] 我々は、堅牢な機械学習に適したセット値最適化(SVO)フレームワークを開発する。
SVO設定では、各決定変数は対象値のセットにマッピングされ、最適性はセット関係によって定義される。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:07:53 GMT)
Stability of a high-finesse optical cavity at 493 nm in vacuum for cavity QED with Barium ions [0.0] バリウムイオンを用いた共振器QED用真空中493nmの高精細光共振器の安定性について検討した。
真空誘起およびレーザー誘起による酸化物被覆キャビティミラーへの影響について検討した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:58:48 GMT)
Spectral Edge Dynamics of Training Trajectories: Signal--Noise Geometry Across Scales [0.0] コンヒーレントな方向のみにおいてトランスフォーマー訓練軌道が発展することを示す。
共同作業では、同じスペクトル幾何学がグラッキングの早期警戒信号を提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 22:22:36 GMT)
Specification-Aware Distribution Shaping for Robotics Foundation Models [0.0] 本稿では,事前訓練されたロボット基盤モデルの実行において,パラメータを変更することなく,信号時間論理(STL)の幅広い制約を適用可能な,仕様対応の行動分布最適化フレームワークを提案する。
複数の環境と複雑な仕様をまたいだ最先端のロボティクス基盤モデルを用いてシミュレーションの枠組みを検証した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:36:46 GMT)
Sentiment Classification of Gaza War Headlines: A Comparative Analysis of Large Language Models and Arabic Fine-Tuned BERT Models [0.0] 本研究では、異なる人工知能アーキテクチャーが、コンフリクト関連メディア談話における感情をどう解釈するかを検討する。
10,990のアラビア語ニュースの見出し(Eleraqi 2026)に基づいて、3つの大きな言語モデルと6つの微調整されたアラビア語のBERTモデルの比較分析を行っている。
その結果,感情分布の顕著かつ非ランダムなばらつきが明らかになった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:19:51 GMT)
Sensi: Learn One Thing at a Time -- Curriculum-Based Test-Time Learning for LLM Game Agents [0.0] 本稿では、ARC-AGI-3ゲームプレイングチャレンジのためのエージェントアーキテクチャであるSensiを紹介し、構造化されたテスト時間学習を導入する。
Sensi v1は2つのプレイヤーアーキテクチャだけで2つのゲームレベルを解き、Sensi v2はカリキュラム学習を追加し、0レベルを解いた。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:59:26 GMT)
Reconfigurable circuit for mode tunable topological structured light [0.0] 我々は,デジタル空間光変調器とスタティックビーム変位器を一体化した小型自閉型マッハ・ツェンダー干渉計を導入する。
また、空間光変調器によってデジタル駆動される、プログラム可能なパラメトリック制御単位ゲートの動作を模倣する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:34:07 GMT)
RHYME-XT: A Neural Operator for Spatiotemporal Control Systems [0.0] 入力-アフィン非線形部分積分微分方程式(PIDE)による制御系制御のための演算子学習フレームワーク RHYME-XT を提案する。
RHYME-XT はガレルキン射影を用いて、ニューラルネットワークによってパラメータ化された基底関数で無限次元の部分空間を近似する。
ニューラルネットワークPIDEの実験によると、RHYME-XTは最先端のニューラル演算子より優れており、異なるデータセットでトレーニングされたモデル間で知識を効果的に伝達することができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:55:26 GMT)
Quasi-local Edge Mode in XXX Spin Chain/Circuit with Interaction Boundary Defect [0.0] 境界欠陥を持つ半無限鎖上のハイゼンベルクスピン-1/2モデルについて検討する。
行列積アンサッツを用いて境界付近で保存された準局所化作用素を明示的に構成する。
この準局所エッジモードは、非零境界ドルーデ重みに対応する非退化境界相関関数をもたらす。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:27:32 GMT)
Quantum theory over dual-complex numbers [0.0] 量子論をとり、$mathbbC$を$mathbbC[varepsilon]$に置き換える。
量子論を双対複素数の環に拡張する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:36:17 GMT)
Quantum orientation entanglement analysis of the interpolating helicity states between the instant form dynamics and the light-front dynamics [0.0] 我々は、ヤコブ・ウィックヘリシティと光前ヘリシティの間を補間する相対論的ヘリシティ状態の量子配向絡を解析する。
特に、インスタントフォームのダイナミックスとライトフロントのダイナミックスの間の動的分岐を分岐させる臨界角度を同定する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:57:45 GMT)
Quantum Simulation of Non-Hermitian Linear Response [0.0] 本稿では,非一意的マルチ時間相関関数を量子ハードウェアで実現可能なユニタリ形式に変換するための体系的アルゴリズムマッピングを提案する。
このアプローチは、非エルミート線形応答の確立された物理理論と量子シミュレーションのギャップを埋め、最適な状態準備コストを達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:13:11 GMT)
Quantum Depth Compression via Local Dynamic Circuits [0.0] 量子深さ圧縮(Quantum Depth Compression, QDC)は、任意の量子回路を深さ線形に縮小する一般的なコンパイルフレームワークである。
ランダムなPauli-phasor回路にQDCを適用すると、標準の代替コンパイラと比較して、その深さとCNOT数の両方が低下することを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:35:20 GMT)
Primitive-Root Determinant Densities over Prime Fields and Implications for PRIM-LWE [0.0] PRIM-LWE問題はLearning with Errors問題の変種であり、秘密行列はプリミティブ・ルート行列式を持つ必要がある。
素数上の$c(p)$の極限分布は、正確に$[0,1/2]$であることを示す。
また、暗号的興味を持つ素数に対して$c(q)$の明示的な下限を導出し、q-1$の別個の素数だけによってパラメータ化する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:17:03 GMT)
Pretty good plus state transfer in cycles [0.0] グラフにおける隣接性、ラプラシアン、および無符号ラプラシアン行列に関する分数復元について検討する。
グラフにおける分数復元とその二重被覆との接続を確立し、サイクルとその補集合における状態移動の完全な特徴づけを得る。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:08:26 GMT)
Preprocessing noise in finite-size quantum key distribution [0.0] 本稿では,Alice と Bob の間で限られた信号しか交換できない有限サイズ方式における前処理ノイズの効果について検討する。
信頼ノイズは、アルファ->1の限界からアルファアロックス1.4まで、アルファの有限間隔でのみ鍵レートを改善する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:00:01 GMT)
Postselection induced localization and coherence in quantum walks on heterogeneous networks [0.0] 本研究では, 連続時間量子ウォーク(CTQW)における非線形性の影響について検討した。
Haken-Stroblデコヒーレンスの下では、非線形寄与は正確にキャンセルされ、ポストセレクションの詳細とは無関係に均一な定常状態が得られる。
スタークコントラストでは、QSWデコヒーレンス(英語版)は、ポストセレクションが不均一ネットワーク上の動的バランスを破ることを可能にし、低次ノードでのロバストなローカライゼーションを優先的に引き起こす。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:47:55 GMT)
Physics-Aware Machine Learning for Seismic and Volcanic Signal Interpretation [0.0] 本稿では,最近の地震・火山の信号解析における機械学習手法を調査・整理する。
古典的な信号処理は、必須な帰納バイアスを与え、自己スーパービジョンと生成的モデリングがラベルへの依存をいかに減らせるかを強調した。
私たちは、堅牢で、解釈可能で、メンテナンス可能なAIアシストモニタリングのためのオープンな課題で締めくくります。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:43:22 GMT)
Optimal detection of dissipation in Lindbladian dynamics [0.0] ハミルトン量子力学は、環境との相互作用による散逸ノイズの影響を受けている。
このことは、システムの観測時間進化にのみアクセスすることで、そのような散逸の有無を検知できるかどうかという疑問を提起する。
時間独立なLindbladian $mathcalL$が生成する時間進化チャネルへのブラックボックスアクセスを与えられる。
総進化時間$mathcalO(-1)$,
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:02:21 GMT)
Operator dynamics in k-Markov random circuits [0.0] ユニタリゲートの$k$-Markovシーケンスは,情報拡散率と構造を制御するために,低コストなハンドラを提供することを示す。
SWAPゲートとブリックワーク回路では、演算子輸送を制御するために$k$-Markovプロセスをどのように使用できるかを示すためにグラフ被覆時間を用いる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:02:46 GMT)
Open Biomedical Knowledge Graphs at Scale: Construction, Federation, and AI Agent Access with Samyama Graph Database [0.0] オープンソースバイオメディカル知識グラフとして,パスKG,臨床トライアルKG,薬物相互作用KGの3つを提示する。
まず、異種公開データソースから大規模KGを構築するための高性能グラフについて述べる。
次に、3つのスナップショットを1つのグラフテナントにロードすることで、プロパティベースの結合が可能になる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:46:32 GMT)
Only relative ranks matter in weight-clustered large language models [0.0] 大規模言語モデル(LLM)は数十億のパラメータを含むが、多くの正確な値は必須ではない。
重みの相対的なランクは、ある接続が正確な大きさよりも強いか弱いかを示す。
Llama 3.1-8B-Instruct と SmolLM2-135M では、各行列を16-64個の異なる値に減らし、再トレーニングすることなく高い精度を保っている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:55:13 GMT)
One Key Good, L Keys Better: List Decoding Meets Quantum Privacy Amplification [0.0] リストプライバシー増幅(LPA)
LPA の形式化と emphQuantum Listleftover Hash Lemma (QLLHL) の証明
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:37:05 GMT)
On the power of multipartite entanglement for pseudotelepathy [0.0] Pseudotelepathyは、2人以上のプレーヤーが何らかの協力的なゲームで体系的に勝利することを可能にする。
擬似てんかんに対する多部性絡み合いのパワーについて検討する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:29:20 GMT)
On single-frequency asymptotics for the Maxwell-Bloch equations: pure states [0.0] 2レベル分子に結合した単一モードのマクスウェル場に対する減衰駆動マクスウェル・ブロッホ方程式を考える。
我々の主な成果は、準周期ポンプの場合のマクスウェル場の単一周波数での解の構築である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:13:31 GMT)
On global dynamics for damped driven Jaynes-Cummings equations [0.0] この記事は、2レベル分子に結合した1モードのマックスウェルを量子化したジャイネス・カミングス方程式の減衰に関するものである。
減衰およびトレース演算子である幅広い種類のポンプについて考察し、それらの構造は完全正およびトレース生成子の理論に対応する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:09:57 GMT)
On dynamical semigroup for damped driven Jaynes-Cummings equations [0.0] この記事では、2レベル分子に結合した量子化された1モードのマックスウェル場に対する減衰駆動ジャイアンス-カミングについて述べる。
我々は、創造とヒルベルト・シュミット作用素において減衰する幅広い種類のポンプについて考察する。
半群のすべての軌道は、Jaynes-Cummings方程式の一般化された解である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:01:49 GMT)
On Additive Gaussian Processes for Wind Farm Power Prediction [0.0] 本稿では, 風力発電データに対するタービン固有およびファームレベルの電力モデルの変化を明らかにするために, 加法ガウス法を用いて検討する。
これらの予測は、直感に従い、より情報的な制御と意思決定を可能にする風力発電のパターンを描いている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:56:38 GMT)
Omni-3DEdit: Generalized Versatile 3D Editing in One-Pass [0.0] 我々は,様々な3D編集タスクを暗黙的に一般化する学習ベースモデルであるOmni-3DEditを紹介する。
学習ベースモデルとして、我々のモデルはオンライン最適化に時間を要することなく、様々な3D編集タスクを1回のフォワードパスで完了させることができる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:32:41 GMT)
Murmurations, Mestre--Nagao sums, and Convolutional Neural Networks for elliptic curves [0.0] 1次元畳み込みニューラルネットワークを$mathbbQ$以上の楕円曲線のフロベニウストレースに適用する。
各種導体における解析ランクの高精度な予測を行う。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:57:45 GMT)
Multi-Trait Subspace Steering to Reveal the Dark Side of Human-AI Interaction [0.0] 近年の出来事は、人間とAIの相互作用がネガティブな心理的結果をもたらす危険な事例を浮き彫りにした。
我々は、累積的な有害な行動パターンを示すダークモデルを生成するフレームワークを開発する。
暗黒モデルを用いて、人間とAIの相互作用における有害な結果を減らすための保護策を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 08:25:31 GMT)
Multi-Outcome Circuit Optimization for Enhanced Non-Gaussian State Generation [0.0] フォールトトレラント量子計算における重要な要件は、非ガウス量子状態の生成である。
本稿では,総合的な受理確率を高めるマルチアウトカム最適化戦略を提案し,実証する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:40:34 GMT)
Mitigating LLM Hallucinations through Domain-Grounded Tiered Retrieval [0.0] 大型言語モデル (LLM) は前例のない流布を達成したが、「幻覚」の影響を受けないままである。
本研究では,LLMをパターンマッチングから真偽探索へシフトさせることにより,事実不正確さを検知する階層型検索・検証アーキテクチャを提案する。
システムは5つの多様なベンチマークから650のクエリで評価された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:59:30 GMT)
Measurement-Based Estimation of Causal Conditional Variances and Its Application to Macroscopic quantum phenomenon [0.0] ホモダイン測定記録のみに基づく変形キャビティシステムにおけるメカニカルオシレータの量子推定法を解析的に検討した。
典型的な量子状態生成のための実験的なパラメータ構造において、再構成バイアスは無視されるのに十分小さいことを示す。
状態検証への応用として,電磁相互作用を介するマクロ量子絡み合いの提案に本手法を適用した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 05:00:03 GMT)
Mathematical Modeling of Cancer-Bacterial Therapy: Analysis and Numerical Simulation via Physics-Informed Neural Networks [0.0] 2次元組織領域における5つの結合非線形反応拡散方程式の数学的モデルを提案する。
物理インフォームドニューラルネットワーク(PINN)は、メッシュなしで、広範なデータを必要としないシステムを解く。
その結果, 長期治療効果には腫瘍の低酸素領域の維持が必要である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:04:25 GMT)
Machine Learning for Network Attacks Classification and Statistical Evaluation of Machine Learning for Network Attacks Classification and Adversarial Learning Methodologies for Synthetic Data Generation [0.0] ネットワーク攻撃の監視は、常にネットワーク侵入検知システム(NIDS)の重要な部分である。
本稿では,フローレベルデータ,パケットペイロード情報,時間的文脈的特徴を組み込んだ,最初の統合マルチモーダルNIDSデータセットの2つの課題に対処する。
最初のタスクでは、階層化されたクロスバリデーションを備えた機械学習(ML)アルゴリズムを使用して、安定性と信頼性を備えたネットワーク攻撃を防止する。
第2のタスクでは、逆学習アルゴリズムを使用して合成データを生成し、それらを実データと比較し、その忠実さ、実用性、プライバシを評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:35:02 GMT)
Logarithmic-depth quantum state preparation of polynomials [0.0] 本研究は、量子ビット数$n$の対数深さを持つ回路を用いて、振幅が次数$-d$で与えられる量子状態を作成する方法を紹介する。
近似は科学計算においてユビキタスであるため、この構造は量子状態の準備に対するスケーラブルで資源効率の良いアプローチを提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:43:07 GMT)
Large Language Models in Teaching and Learning: Reflections on Implementing an AI Chatbot in Higher Education [0.0] 大規模言語モデル(LLM)は特に高等教育において大きな機会をもたらす。
幻覚を発生させる確率と限られた専門知識は、重大なリスクをもたらす可能性がある。
本研究は,大学レベルコースにおけるLLM強化アシスタントの実践的実装について検討する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:34:12 GMT)
Interpretable Context Methodology: Folder Structure as Agentic Architecture [0.0] AIエージェントオーケストレーションに対する現在のアプローチは、典型的には、コンテクストパッシング、メモリ、エラーハンドリング、コードによるステップ調整を管理するマルチエージェントフレームワークの構築を含む。
本稿では,フレームワークレベルのオーケストレーションを構造に置き換える手法である Model Workspace Protocol (MWP) を提案する。
平易なマークダウンファイルには、ひとつのAIエージェントに各ステップでどのような役割を果たすべきかを伝えるプロンプトとコンテキストがある。ローカルスクリプトは、AIをまったく必要としない機械的な作業を処理する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:30:46 GMT)
In Perfect Harmony: Orchestrating Causality in Actor-Based Systems [0.0] アクターベースのシステムは、実行時の検証に重大な課題をもたらす。
ACTORCHESTRAはErlangのランタイム検証フレームワークで、マルチアクターインタラクション間の因果関係を自動的に追跡する。
ACTORCHESTRAが現実のアクターシステムにおける複雑な行動違反の検出に有効であることを示す3つのケーススタディである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:47:25 GMT)
Improving Recycling Accuracy across UK Local Authorities: A Prototype for Citizen Engagement [0.0] 公衆のリサイクルへのモチベーションにもかかわらず、英国では大きな障壁が効果的な家庭用リサイクルを妨げている。
地方自治体の廃棄物管理は市民の混乱と「ウィッシュサイクリング」を引き起こす
最近のシンプルリサイクル政策は、新しい識別、ソート、クリーニング要件を課すことによって、この景観をさらに複雑にしている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:17:35 GMT)
Impact of automatic speech recognition quality on Alzheimer's disease detection from spontaneous speech: a reproducible benchmark study with lexical modeling and statistical validation [0.0] 自然発声からアルツハイマー病を早期に検出することは、有望な非侵襲的スクリーニングアプローチとして現れている。
本稿では,ADReSSo 2021 診断データセット上でWhisper ASR 転写産物から得られた語彙的特徴を用いたアルツハイマー病の検出について検討した。
Whisper-based transcripts でトレーニングされたモデルは、Linear SVM で 0.7850 以上のバランスの取れた精度を達成するため、一貫してWhisper-base transcripts よりも優れていた。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:46:29 GMT)
Illumination-Aware Contactless Fingerprint Spoof Detection via Paired Flash-Non-Flash Imaging [0.0] 我々はスプーフ検出のための軽量なアクティブセンシング機構として,フラッシュ非フラッシュ非接触指紋認証について検討した。
我々は、チャネル間相関、スペクトル反射特性、テクスチャリアリズム、ディファレンシャルイメージングなどの解釈可能な指標を用いて、光誘起差を解析する。
本研究は,非接触型指紋提示攻撃検出において,ロバスト性および解釈性を向上させるための照明認識分析の可能性を示すものである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:56:00 GMT)
Identifying Latent Actions and Dynamics from Offline Data via Demonstrator Diversity [0.0] 各デモ参加者は異なる方針に従うと仮定し、環境力学はデモ参加者間で共有され、アイデンティティは選択された行動を通してのみ次の観察に影響を与えると仮定する。
我々は、潜伏遷移と実証的ポリシーが潜伏行動ラベルの置換によって識別可能であることを証明した。
これらの結果は、オフラインのRLデータから潜伏動作やダイナミクスを学習するための、原則的識別可能性の源として、実証者の多様性を確立している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:33:38 GMT)
I Know What I Don't Know: Latent Posterior Factor Models for Multi-Evidence Probabilistic Reasoning [0.0] 本稿では,遅延後続因子 (LPF) をSum-Product Network (SPN) 推論のソフトな可能性因子に変換するフレームワークとして紹介する。
LPF を LPF-SPN (structured Factor-based inference) と LPF-Learned (end-to-end learned aggregate) とみなす。
8つのドメイン(7つの合成およびFEVERベンチマーク)で、LPF-SPNは高い精度(最大97.8%)、低い校正誤差(ECE 1.4%)、強い確率適合を達成する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:24:11 GMT)
Hamiltonian Simulation and Linear Combination of Unitary Decomposition of Structured Matrices [0.0] 量子処理ユニット(QPU)で問題を扱うには、量子演算のシーケンスに変換する必要がある。
量子記述に関連するアルゴリズムを構築するには、問題はエルミタンの線形結合 (LCH) あるいはユニタリの線形結合 (LCU) としてマッピングする必要がある。
我々は、量子化の概念を、関心の問題を写像するために使われるハミルトン行列に拡張する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:09:06 GMT)
Guardrails as Infrastructure: Policy-First Control for Tool-Orchestrated Workflows [0.0] Policy-First Toolingは、明示的な制約、リスク認識ゲーティング、リカバリコントロール、監査可能な説明を通じて、ツールの実行を仲介する。
制御された5つのポリシーパックと3つの障害プロファイルをまたいだ225の運用では、厳格なパックにより、違反防止はP0の0.000からP4の0.681に改善され、タスク成功は0.356から0.067に減少した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:19:33 GMT)
Grounded Multimodal Retrieval-Augmented Drafting of Radiology Impressions Using Case-Based Similarity Search [0.0] 胸部X線写真印象の接地起草のためのマルチモーダル検索拡張生成システム(RAG)を提案する。
このシステムは、画像テキストのコントラスト埋め込み、ケースベースの類似性検索、引用制約付きドラフト生成を組み合わせることで、過去の放射線学レポートと事実整合性を確保する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:25:50 GMT)
Governed Memory: A Production Architecture for Multi-Agent Workflows [0.0] エンタープライズAIは数十の自律エージェントノードをデプロイし、それぞれが共有メモリ管理なしで同じエンティティに作用する。
このメモリガバナンスのギャップから生じる5つの構造的課題を特定します。
我々は、4つのメカニズムを通じてこのギャップに対処する共有メモリとガバナンス層であるGoverned Memoryを紹介します。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:49:31 GMT)
GoalVLM: VLM-driven Object Goal Navigation for Multi-Agent System [0.0] ゼロショットでオープンなオブジェクトナビゲーションのための協調型マルチエージェントフレームワークであるGoalVLMを提案する。
GoalVLMは、VLM(Vision-Language Model)を直接決定ループに統合し、SAM3はテキストプロンプト検出とセグメンテーション、SpaceOMは空間推論を行う。
GOAT-Bench val_unseenにおけるGoalVLMの評価を行った。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:59:33 GMT)
Geometry and restoration of the quantum Mpemba effect beyond weak-coupling regime in the spin-boson model [0.0] スピンボソンモデルにおける量子Mpemba効果について検討する。
ブロッホ球面上の効果の単純な幾何学的構造を明らかにする。
結果は、異常な量子緩和における幾何学とシステム環境相関の役割を強調した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 10:13:48 GMT)
General circuit compilation protocol into partially fault-tolerant quantum computing architecture [0.0] 本研究では,時空効率的なアナログ回転(STAR)アーキテクチャのための回路実行プロトコルを提案する。
本プロトコルは,資源状態生成の並列的な試行と,共同測定のより頻繁な試行により,そのような時間のオーバーヘッドを低減することを目的としている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:08:56 GMT)
Fully selective charging of a quantum battery by a purely quantum charger [0.0] 本稿では、2つの量子調和振動子からなる2部充電器を用いて2レベル量子電池を充電するためのプロトコルについて議論する。
その特徴の1つとして、バッテリーを完全に充電することができ、エネルギー入力として追加される単一の励起状態において、普遍的に最適である。
また、異なる種類の量子状態のプロトコルを拡張するための選択的相互作用を利用し、この場合、量子コヒーレンスの存在を複数の類似電池を充電するためのエネルギー資源として利用することができることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:26:42 GMT)
From Symbol to Meaning: Ontological and Philosophical Reflections on Large Language Models in Information Systems Engineering [0.0] LLM(Large Language Models)の出現は、情報システム工学の基礎の転換点である。
本稿では,LLMが言語,意味,システム設計の関係をどのように再構成するかを総合的に考察する。
究極的には、LSMは自動化のためのツールとしてだけでなく、情報システム工学の哲学的および半論的な基礎を形作るエージェントとして理解されるべきである、と論文は主張する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:26:57 GMT)
From Classical Stochastic to Monitored Quantum Dynamics: Dynamical Phase Coexistence in East Circuit Models [0.0] 動的に制約された量子回路モデルは古典的量子力学とユニタリ量子力学の間を補間する。
我々の結果は量子状態における動的相共存の持続性に光を当てた。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:29:45 GMT)
Finite-size resource scaling for learning quantum phase transitions with fidelity-based support vector machines [0.0] 我々は,多体基底状態に対する忠実度に基づく量子カーネルの推定に必要な測定資源を定量化する。
基礎となるスピンモデルにおける対称性の増大はショット要求を体系的に増幅することを示す。
我々の対称性を意識した境界は、物理インフォームド量子機械学習の実用的な手順を提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:59:57 GMT)
Federated Computing as Code (FCaC): Sovereignty-aware Systems by Design [0.0] フェデレートコンピューティング(FC)は、生データをローカルに保持する分散組織間で、機械学習、分析、データ処理などの協調的な計算を可能にする。
FCaCは、権威と委譲を、オンラインポリシーの解釈に頼るのではなく、暗号的に検証可能なアーティファクトにコンパイルすることで、このギャップに対処する宣言的アーキテクチャである。
提案手法は,MNISTを補助的作業負荷として用いた概念横断型学習ワークフローの実証と,封筒発行,境界検証,封筒トリガー訓練のオープンソース実装の公開である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:52:40 GMT)
Facts as First Class Objects: Knowledge Objects for Persistent LLM Memory [0.0] 我々は、知識オブジェクト(KO)に対してコンテキスト内メモリをベンチマークする。
コンテキストウィンドウ内では、Claude Sonnet 4.5 は 10 から 7,000 の事実(200K ウィンドウの97.5%)から100%正確なマッチング精度を達成する。
スイッチング機構として密度適応検索を導入し,ベンチマークスイートをリリースする。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:45:54 GMT)
Exploration of Fluxonium Parameters for Capacitive Cross-Resonance Gates [0.0] 容量結合型フラキソニウム量子ビットにおけるクロス共振効果について検討した。
CNOTゲートは、周波数が1GHz未満のフラクソニウム量子ビットに対して、残留ZZが50kHzに制限された200 ns以下で一般的に実現可能である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:10:12 GMT)
Explainability and Certification of AI-Generated Educational Assessments [0.0] この章では、AI生成アセスメント項目の説明可能性と認定のための包括的なフレームワークを提案する。
保証、アライメント予測、レビューアアクション、倫理指標をキャプチャするために、構造化された認証メタデータスキーマが導入される。
500のAI生成コンピュータサイエンス問題に関する概念実証研究は、このフレームワークの実現可能性を示している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:33:58 GMT)
Engineering strong coupling with molecular coatings in optical nanocavities [0.0] 20nmの銀ナノスフィア近傍の量子ドットエミッタについて、2nmのJ-アグリゲートシェルを用いて弱い結合クロスオーバーを誘導できることを示す。
本研究は,光ナノキャビティにおけるコヒーレント量子力学の観測のために,分子集合体の可能性を示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 01:49:58 GMT)
EngGPT2: Sovereign, Efficient and Open Intelligence [0.0] EngGPT2はSovereign、Efficient、Openモデルとして構築されている。
Qwen3の36TやLlama3の15Tよりも少ない2.5兆のトークンでトレーニングされています。
MMLU-Pro、GSM8K、IFEval、HumanEvalなど、主要なベンチマークのパフォーマンスを提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:11:44 GMT)
Emergent Compositional Communication for Latent World Properties [0.0] 本稿では,Gumbel-maxボトルネックと反復学習を通したエージェントが,潜伏特性の非絡み合いプロトコルを開発することを示す。
4剤で、80種のうち100%の種子は、ほぼ完全な組成に収束する。
制御は、帯域幅や時間範囲ではなく、マルチエージェント構造を確認し、この効果を駆動する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:23:52 GMT)
Dynamical Simulations of Schrödinger's Equation via Rank-Adaptive Tensor Decompositions [0.0] シュルディンガー方程式の時間非依存かつ明示的な時間依存ハミルトン方程式の数値解に対する低ランクテンソル法について検討する。
本稿では, テンソル列車に対する"basis update and Galerkin" (Bug)法の適用について概説し, 確立されたTDVPとTDVP-2アルゴリズムについて述べる。
代表的な時間非依存および時間依存ハミルトニアンモデルに関する数値実験は、メソッド間の精度と圧縮の間のトレードオフを定量化する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 00:32:49 GMT)
Dropout Robustness and Cognitive Profiling of Transformer Models via Stochastic Inference [0.0] トランスフォーマーベースの言語モデルは推論のために広くデプロイされているが、推論時間の下でのそれらの振る舞いは未探索のままである。
本研究は,サンプルあたり100フォワードパスのMC Dropoutを用いて,19の変圧器モデル間でのドロップアウト誘起変動を解析する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:04:26 GMT)
Dissipative realization of a quantum distance-based classifier using open quantum walks [0.0] オープン量子ウォーク(OQW)は、環境との相互作用によって完全に駆動される量子ウォークのクラスである。
オープンな量子ウォークモデルにおいて、これまで提案されていた量子距離に基づく分類器の実行可能性を示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:02:06 GMT)
Discovery of Bimodal Drift Rate Structure in FRB 20240114A: Evidence for Dual Emission Regions [0.0] 高速電波バーストFRB20240114Aからの上昇ドリフトバーストクラスターのドリフト速度分布におけるバイモーダル構造の発見を報告する。
極端ドリフトのサブ集団は、体系的に低いピーク周波数(-7%)、短い期間(29%)、多次元の特徴空間における異なるクラスタリングを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:35:22 GMT)
Detection Is Cheap, Routing Is Learned: Why Refusal-Based Alignment Evaluation Fails [0.0] 自然実験として、中国語・オリジン語モデルにおける政治的検閲について研究する。
5つの実験室の9つのオープンウェイトモデルに対して、プローブ、外科的改善、行動テストを使用します。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 20:54:34 GMT)
Detecting the Machine: A Comprehensive Benchmark of AI-Generated Text Detectors Across Architectures, Domains, and Adversarial Conditions [0.0] 既存のベンチマークでは、理想的な条件下で単一のデータセット上の1つの検出器を評価する。
本稿では,2つのコーパスにまたがる多様な検出手法を評価するベンチマークを提案する。
その結果, 変圧器モデルでは, ほぼ完全な分散性能が得られるが, ドメインシフト下では劣化することがわかった。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:27:27 GMT)
Data-driven model order reduction for structures with piecewise linear nonlinearity using dynamic mode decomposition [0.0] 本稿では,データ駆動型線形システムのモデルオーダー削減手法を提案する。
提案手法では,システムのインパルス応答を用いて状態変数のスナップショットを取得する。
元の全階系の運動方程式によって記述された力学は、基底ベクトルによって張られた部分空間に投影される。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:59:29 GMT)
Data Obfuscation for Secure Use of Classical Values in Quantum Computation [0.0] 量子コンピューティングはしばしば、完全に信頼できない、あるいは孤立していない実行環境に古典的なデータを供給する必要がある。
暗号化は、古典的な値が量子レジスタにエンコードされるときの計算開始時に限られた保護を提供する。
量子実行中に古典的な値を保護するために設計された,最初の明示的なデータ難読化手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:44:47 GMT)
Constrained Hybrid Metaheuristic: A Universal Framework for Continuous Optimisation [0.0] 本稿では、連続最適化のための一般的なフレームワークとして制約付きハイブリッドメタヒューリスティック(cHM)アルゴリズムを提案する。
実験的なベンチマークでは、cHMはソリューションの品質とコンポーネントの最適化の点で従来のメタヒューリスティックよりも優れています。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:32:50 GMT)
Consistency of the $k$-Nearest Neighbor Regressor under Complex Survey Designs [0.0] サンプル設計とデータ分布の規則性条件下では,$k$-nearest 近傍回帰器が整合であることを示す。
収束率の低い境界を導出し、これらの境界が次元性の呪いを示すことを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:59:50 GMT)
Classifier Pooling for Modern Ordinal Classification [0.0] そこで本研究では,非順序分類法を順序方式で適用可能な,順序分類のモデル非依存的手法を提案する。
我々はこれらのアルゴリズムのオープンソース実装をPythonパッケージの形で提供します。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 02:11:54 GMT)
Circumventing Platform Defenses at Scale: Automated Content Replication from YouTube to Blockchain-Based Decentralized Storage [0.0] 本稿では、YouTubeからJoystream上の分散ストレージへ自動で大規模なコンテンツ抽出と複製を行う生産システムであるYouTube-Synchを紹介する。
15回,144回のプルリクエストに対する3.5年間のケーススタディを報告した。
データベーススループットの問題による28の重複オンチェーンオブジェクト,OAuth大量有効期限後の1万以上のチャネル損失,キュー汚染による719の日次エラーなど,3つのインシデントを分析した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 04:48:36 GMT)
Caging the Agents: A Zero Trust Security Architecture for Autonomous AI in Healthcare [0.0] 本稿では,医療技術企業において,9つの自律型AIエージェントを実運用環境に配置するセキュリティアーキテクチャを提案する。
我々は、医療におけるエージェントAIの6領域脅威モデルを構築し、クレデンシャルエクスポージャー、実行能力の乱用、ネットワークのエクスプロイト、即時完全性障害、データベースアクセスリスク、およびフリート構成ドリフトをカバーする。
すべての構成、監査ツール、即時整合性フレームワークがオープンソースとしてリリースされている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 06:54:47 GMT)
CaRBM: A Fixed-Depth Quantum Algorithm with Partial Correction for Thermal State Preparation [0.0] 固定深熱状態調製のためのCARBMアルゴリズムを提案する。
提案アルゴリズムは,温度が低下するにつれてブロック符号化の成功確率が低下し,高温で高い性能を発揮する。
XXZモデルの分割関数ゼロとGross-Neveuモデルの位相図を計算してアルゴリズムを実証する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:38:05 GMT)
CTG-DB: An Ontology-Based Transformation of ClinicalTrials.gov to Enable Cross-Trial Drug Safety Analyses [0.0] ClinicalTrials.gov (CT.gov) は、臨床研究の公開レジストリとしては最大である。
AEは、標準化された識別子ではなく、調査官が報告したテキストとして記録される。
我々は、CT.gov XMLアーカイブを完全に取り込み、標準化されたAE用語に準拠したリレーショナルデータベースを生成するオープンソースパイプラインであるCTG-DB(CrictorTrials.gov Transformation Database)を提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:43:23 GMT)
Bosonic quantum mixtures with competing interactions: quantum liquid droplets and supersolids [0.0] 講義では、ボース・ボース混合と競合する平均場相互作用との弱い相互作用に焦点を当てている。
双極性気体では、量子ゆらぎによって安定化された双極子滴の配列は、大域的な位相コヒーレンスを確立し、超固体を形成する。
スピン軌道結合型超固体の物性について検討し, それらの双極子との比較を行った。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 14:12:22 GMT)
Bonsai: A class of effective methods for independent sampling of graph partitions [0.0] 本研究では,グラフ分割空間上の有理確率分布から独立サンプリングを行うことで,地域計画のアンサンブルを構築する効果的な手法を開発した。
我々は、グリッドグラフと州議会および立法府の地図の文脈における標準的なマルコフ連鎖に基づくアルゴリズムと比較する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 23:13:05 GMT)
Bi-Predictability: A Real-Time Signal for Monitoring LLM Interaction Integrity [0.0] 両予測可能性(P)を用いて,マルチターンインタラクションの整合性を継続的に監視できることが示される。
Information Digital Twin (IDT) は、コンテキスト、応答、次のプロンプトループを二次推論や埋め込みなしでPを推定する軽量アーキテクチャである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:10:37 GMT)
Beyond bouba/kiki: Multidimensional semantic signals are deeply woven into the fabric of natural language [0.0] 英語の個々の文字音素が構造化された多次元意味信号を持っていることを示す。
本研究は,音意味の象徴性は時折好奇心ではなく,音韻信号の広範で構造的な性質であることを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:02:10 GMT)
Beyond Muon: MUD (MomentUm Decorrelation) for Faster Transformer Training [0.0] MUD(MomentUm Decorrelation)は,Muonの極点更新を三角形(Cholesky様)の白化代理に置き換える補完的な白化手法である。
MUDは、調整されたAdamWとMuonよりも、10-50%のウォールクロック改善を実現している。
また,EMM-2 150Mタンパク質言語モデルのトレーニングを行った。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:37:31 GMT)
Benchmarking Reinforcement Learning via Stochastic Converse Optimality: Generating Systems with Known Optimal Policies [0.0] 雑音を伴う離散時間・制御アフィン非線形システムに逆最適性を拡張することで、厳密なベンチマークフレームワークを導入する。
本フレームワークは,所定値関数とポリシが構築システムに最適である,必要かつ十分な条件を提供する。
多様な環境を自動的に構築し、アルゴリズム間で制御され包括的な評価を行うためのフレームワークの能力を示すことによって、それを検証する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:52:21 GMT)
Bell-EPR Correlations within Local Quantum Theory [0.0] 本稿ではベル-EPR測定の局所的ユニタリ理論を提案する。
重要な特徴は、光子の吸収によってデコヒーレンスが各検出器と独立に局所的に起こることである。
この理論は明らかに局所的であるが、他の定式化や解釈があり、非局所的である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 18:49:50 GMT)
Average Case Graph Searching in Non-Uniform Cost Models [0.0] 目標は、平均的な検索コストを最小限に抑える検索戦略を設計することである。
木を考慮し、$c(v, x)$ を単調な非減少関数と仮定する。
これは両基準に対する最初の定数係数近似アルゴリズムである。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 16:54:24 GMT)
Automated Grammar-based Algebraic Multigrid Design With Evolutionary Algorithms [0.0] 本稿では,非再帰型サイクリングパターンとレベル特異的なスムージングシーケンスを用いた効率的なマルチグリッド手法の創出方法について述べる。
線形代数ライブラリ(enmphhypre)を用いた実験では、この非標準GPサイクルが解法およびプリコンディショナーとしてのマルチグリッド性能を向上させる可能性を実証している。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:02:26 GMT)
ArchBench: Benchmarking Generative-AI for Software Architecture Tasks [0.0] ArchBenchは、ソフトウェアアーキテクチャタスクで大規模言語モデルをベンチマークするための最初の統一プラットフォームである。
データセットのダウンロード、トラジェクトリロギングによる推論、自動評価のための標準化されたパイプラインを備えたコマンドラインツールを提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:26:46 GMT)
Approaching the ultimate limit of quantum multiparameter estimation by many-body physics [0.0] このスキームは、物体とボソニックなアンシラの物理的相互作用を伴い、続いて全身的なアンシラの測定を行う。
この提案は、境界によって設定された最終的な精度限界を達成するために必要な実験的な設定について、より具体的な説明を提供する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 17:28:57 GMT)
Anisotropic Permeability Tensor Prediction from Porous Media Microstructure via Physics-Informed Progressive Transfer Learning with Hybrid CNN-Transformer [0.0] 細孔スケールの微細構造画像からの透水性テンソルの予測は地下流れのモデリングには不可欠であるが、直接数値シミュレーションではサンプルあたりの時間を要する。
MaxViTハイブリッドCNN-Transformerアーキテクチャと、プログレッシブトランスファー学習と微分可能な物理的制約を組み合わせることで、このボトルネックを解決する物理インフォームドディープラーニングフレームワークが提示される。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 09:41:01 GMT)
Anderson transition in disordered Hatano-Nelson systems [0.0] 非エルミート皮膚効果と欠陥誘発アンダーソン局在の遷移の基本的なメカニズムを解明する。
固有値に関連する位相不変量の変化は、非エルミート皮膚効果からアンダーソン局在への固有ベクトル交叉と一致することを示す。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 21:16:45 GMT)
An HHL-Based Quantum-Classical Solver for the Incompressible Navier-Stokes Equations with Approximate QST [0.0] HHL (Harrow-Hassidim-Lloyd) は、非圧縮性ナビエ・ストークス方程式を解くための指数的スピードアップのポテンシャルを提供する。
完全統合型ベンチマーク問題として, 正確な蓋駆動キャビティフローシミュレーションとTaylor-Green渦の正確な流れを示す。
我々は,IBMのQiskitフレームワークを用いて解法を実装し,標準的な古典的数値法に対するハイブリッド量子古典シミュレーションの有効性を検証した。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:13:06 GMT)
AgentComm-Bench: Stress-Testing Cooperative Embodied AI Under Latency, Packet Loss, and Bandwidth Collapse [0.0] 我々は,協調体AIのためのベンチマークスイートと評価プロトコルであるAgentComm-Benchを紹介する。
我々は、レイテンシ、パケット損失、帯域幅の崩壊、古いメモリの6つのコミュニケーション障害次元下での協調AIのストレステストを行う。
実験の結果,コミュニケーション依存タスクは破滅的に低下することがわかった。
我々は、複数の障害条件下での協調実施型AI作業報告のパフォーマンスを推奨する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 07:45:09 GMT)
Adaptive Domain Models: Bayesian Evolution, Warm Rotation, and Principled Training for Geometric and Neuromorphic AI [0.0] 本稿では,3つの事前結果に基づいて,代替的なトレーニングアーキテクチャを開発する。
本稿では,一般目的モデルの潜在事前構造をADMトレーニングシステムを介して抽出する機構であるベイズ蒸留を導入する。
デプロイには、更新されたモデルがサービスを中断することなくアクティブな推論経路に遷移する運用パターンであるウォームローテーションを導入する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 12:36:19 GMT)
ARTEMIS: A Neuro Symbolic Framework for Economically Constrained Market Dynamics [0.0] ARTEMIS (Arbitrage-free Representation through Economic Models and Interpretable Symbolics)
モデルでは、Fynman-Kac PDE(英語版)という2つの新しいレギュラー化条件によって経済の可算性(英語版)を強制し、局所的非軌道違反を復活させ、シャープ比を制限したリスクペナルティの市場価格を課している。
我々は,Jane Street,Optiver,Time-IMM,DSLOBの4つのデータセットに対して,ARTEMISを評価する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 13:00:28 GMT)
A Synthesizable RTL Implementation of Predictive Coding Networks [0.0] バックプロパゲーションにより、現代的なディープラーニングが可能になったが、オンラインで完全に分散されたハードウェア学習システムとして実現することは困難である。
予測符号化は、隣接層間の局所的な予測エラーダイナミクスから推論と学習が生まれる代替手段を提供する。
本稿では,離散時間予測符号化をハードウェアに直接実装したディジタルアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 03:07:19 GMT)
A Stability-Aware Frozen Euler Autoencoder for Physics-Informed Tracking in Continuum Mechanics (SAFE-PIT-CM) [0.0] 連続力学における物理情報追跡のための安定型凍結型オイラーオートエンコーダSAFE-PIT-CMを紹介する。
アーキテクチャは、自動エンコーダ内に凍結して微分可能なPDEソルバを埋め込む。
モデルはテスト時間トレーニング(TTT: Test-time Training)もサポートしている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:34:03 GMT)
A Multi-Agent System for Building-Age Cohort Mapping to Support Urban Energy Planning [0.0] 建築年齢は、持続可能な都市熱計画とアップグレードの優先順位付けに不可欠である。
異種音源からのデータを融合するマルチエージェントLLMシステムを提案する。
BuildingAgeCNNの全体的な精度は90.69%だが、最小のマクロF1は67.25%である。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:46:54 GMT)
A Hybrid Conditional Diffusion-DeepONet Framework for High-Fidelity Stress Prediction in Hyperelastic Materials [0.0] cDDPM-DeepONetは、UNetのバックボーン上に構築された条件付き拡散確率モデルである。
修正されたDeepONetは、グローバルなスケーリングパラメータを予測し、フル解像度の物理的ストレスマップの再構築を可能にする。
提案したモデルは、UNet、DeepONet、スタンドアロンのcDDPMベースラインを1~2桁上回っている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 19:20:51 GMT)
A Framework and Prototype for a Navigable Map of Datasets in Engineering Design and Systems Engineering [0.0] 本稿では,EDSEにおけるデータセットマップの体系的枠組みを提案する。
このフレームワークは、ドメイン、ライフサイクルステージ、データタイプ、フォーマットごとにエンジニアリングデータセットを分類するために設計された多次元分類に基づいて構築されている。
現在のデータランドスケープの分析では、初期段階の設計とシステムアーキテクチャにおける未表現の領域(データ砂漠)と、予測保守と自律システムにおける比較的よく表現された領域(データオース)が明らかにされている。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 15:32:25 GMT)
A Family of Adaptive Activation Functions for Mitigating Failure Modes in Physics-Informed Neural Networks [0.0] 標準PINNの共通障害モードに触発された本研究は、適応ウェーブレットベースのアクティベーション関数の新たなファミリを導入する。
トレーニング可能なウェーブレット関数とトレーニング可能なあるいは固定された双曲接点関数とソフトプラス関数を組み合わせることにより、トレーニング安定性と表現力を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 22:24:40 GMT)
A Contextual Help Browser Extension to Assist Digital Illiterate Internet Users [0.0] この拡張は、計算済みの技術辞書とOpenAIの大規模言語モデルを組み合わせて、オンデマンドで定義を提供する。
25名の被験者による混合手法による研究は、ツールが読解時間と情報検索時間に与える影響を評価した。
その結果,92%の参加者が,技術用語の理解を深めたことが示唆された。
論文参考訳(メタデータ) (Wed, 18 Mar 2026 11:06:56 GMT)