ACE-Brain-0: Spatial Intelligence as a Shared Scaffold for Universal Embodiments [135.0] 本稿では,空間推論,自律運転,体操を統一する一般基礎脳であるACE-Brain-0を紹介する。
我々の重要な洞察は、空間的知性は様々な物理的具体化の普遍的な足場として機能するということである。
そこで我々は,まず共有空間基盤を確立し,次にドメイン特化専門家を育成し,最後にデータフリーモデルマージにより調和させるScaffold-specize-Reconcile(SSR)パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:53:45 GMT)
Modeling Cross-vision Synergy for Unified Large Vision Model [130.4] PolyVは、アーキテクチャレベルとトレーニングレベルの両方で、クロスビジョンのシナジーを実現する統一された大型ビジョンモデルである。
PolyVは既存のモデルを一貫して上回り、バックボーンの10%以上の平均的な改善を実現している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:44:43 GMT)
Beyond Language Modeling: An Exploration of Multimodal Pretraining [125.3] 我々は、制御されたオフスクラッチ事前学習実験を通して経験的明瞭度を提供する。
我々はトランスフュージョン・フレームワークを採用し、言語と視覚の拡散を次々に予測する。
我々は、MoEアーキテクチャが、言語によって要求される高いモデル容量を提供することにより、このスケーリング非対称性を調和させることを実証する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:58:00 GMT)
Model Editing for New Document Integration in Generative Information Retrieval [110.9] 生成検索(GR)は文書識別子(docID)の生成として情報検索(IR)タスクを再構成する
既存のGRモデルは、新たに追加されたドキュメントへの一般化が不十分で、しばしば正しいドキュメントIDを生成できない。
DOMEは,GRモデルを非表示文書に効果的かつ効率的に適応する新しい手法である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:13:38 GMT)
Geometry-Guided Reinforcement Learning for Multi-view Consistent 3D Scene Editing [106.1] 3次元編集における2次元拡散モデルの先行的活用は、有望なパラダイムとして現れている。
我々は3次元基礎モデルであるVGGTから得られた新たな報酬を用いて、強化学習によって駆動されるシングルパスフレームワークであるtextbfRL3DEditを提案する。
実験により、RL3DEditは安定したマルチビューの一貫性を実現し、高い効率で品質を編集する最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:31:10 GMT)
Farther the Shift, Sparser the Representation: Analyzing OOD Mechanisms in LLMs [100.0] 難易度が増大する入力に遭遇した場合,大規模言語モデルが内部表現をどのように適応するかを検討する。
タスクの難易度が増大するにつれて、LLMの最後の隠れ状態は実質的にスペーサーとなる。
この空間性-微分的関係は、様々なモデルや領域で観測可能である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:48:15 GMT)
LoGeR: Long-Context Geometric Reconstruction with Hybrid Memory [97.1] 提案するLoGeRは,高密度な3次元再構成を,後最適化なしで極めて長いシーケンスに拡張する新しいアーキテクチャである。
LoGeRはビデオストリームをチャンクで処理し、高忠実度なチャンク内推論に強力な双方向の事前処理を活用する。
このメモリアーキテクチャにより、LoGeRは128フレームのシーケンスでトレーニングでき、推論中に数千フレームまで一般化できる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:55:37 GMT)
Contextualized Privacy Defense for LLM Agents [84.3] LLMエージェントはますますユーザーの個人情報に作用するが、既存のプライバシー保護は設計と適応性の両方において制限されている。
我々は,新たなプライバシ防衛パラダイムであるCDI(Contextualized Defense Instructing)を提案する。
我々のCDIは、ベースラインよりもプライバシー保護(94.2%)と有用性(80.6%)のバランスが良好であることを示します。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:35:33 GMT)
Operator Learning Using Weak Supervision from Walk-on-Spheres [81.3] トレーニング型PDEソルバは、高価なデータ生成や不安定な物理インフォームドニューラルネットワーク(PINN)によってボトルネックされることが多い
モンテカルロ法を用いてPDEの解をトレーニング中の弱監督過程として推定する手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:07:51 GMT)
Mind the Way You Select Negative Texts: Pursuing the Distance Consistency in OOD Detection with VLMs [80.0] Out-of-Distribution (OOD) は未知のクラスからサンプルを識別する。
現在の手法では、否定的なテキストとIDラベルを比較するなど、OOD検出中にモード内距離を組み込むことが多い。
テキストおよび視覚的視点から一貫したモーダル距離拡張を体系的に利用するフレームワークであるInterNegを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:44:47 GMT)
MemSifter: Offloading LLM Memory Retrieval via Outcome-Driven Proxy Reasoning [78.5] 大きな言語モデル(LLM)は、長期化タスクにますます使われています。
現在の手法はコストと精度のトレードオフに直面している。
MemSifterは、メモリ検索プロセスを小さなプロキシモデルにオフロードする新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:57:38 GMT)
How Controllable Are Large Language Models? A Unified Evaluation across Behavioral Granularities [75.1] 大規模言語モデル(LLM)は、社会的に敏感なドメインにますますデプロイされる。
私たちのベンチマークでは、安全で制御可能な振る舞いのための原則的で解釈可能なフレームワークを提供しています。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:50:13 GMT)
DuoMo: Dual Motion Diffusion for World-Space Human Reconstruction [73.7] DuoMoは、ノイズや不完全な観察で制約のないビデオから世界空間の座標で人間の動きを復元する生成方法である。
本手法は,運動学習を2つの拡散モデルに分解することでこの問題に対処する。
この2つのモデルは、ノイズや不完全な観察からでも、様々なシーンや軌道をまたいで動きを再構築することができる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:54:17 GMT)
Generalizable Knowledge Distillation from Vision Foundation Models for Semantic Segmentation [73.3] Generalizable Knowledge Distillation (GKD)は、一般化を明示的に強化する多段階フレームワークである。
5つの領域一般化ベンチマークの実験は、GKDが既存のKD法を一貫して上回ることを示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:18:12 GMT)
How to Peel with a Knife: Aligning Fine-Grained Manipulation with Human Preference [73.2] ナイフを用いた剥離を例として,本質的な操作作業のための学習フレームワークを提案する。
本システムは,キュウリ,リンゴ,ジャガイモなどの難産品の平均成功率を90%以上達成する。
注目すべきは、単一の生産カテゴリで訓練されたポリシーは、カテゴリー内のインスタンスが見えないように、強いゼロショットの一般化を示すことである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:59:32 GMT)
SAE as a Crystal Ball: Interpretable Features Predict Cross-domain Transferability of LLMs without Training [70.8] SAEベースのTransferability Score(STS)は、トレーニング後のTransferabilityを予測するための新しい指標である。
STSは教師付き微調整の伝達可能性を正確に予測し,実際の性能変化とともに0.7以上のピアソン相関係数を達成できることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:01:09 GMT)
TagaVLM: Topology-Aware Global Action Reasoning for Vision-Language Navigation [70.2] Vision-Language Navigation (VLN) は、アーキテクチャ上のミスマッチのため、大きなビジョン-Language Models (VLM) に固有の課題を提示している。
我々は,VLMのバックボーンにトポロジ構造を明示的に注入するエンドツーエンドフレームワークであるTagaVLM(トポロジ・アウェア・グローバルアクション推論)を提案する。
トポロジ的ノード情報を強化するため、Interleaved Navigation Promptはノードレベルのビジュアルテキストアライメントを強化する。
埋め込みトポロジグラフでは、このモデルはグローバルな行動推論が可能であり、堅牢な経路補正を可能にする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:28:07 GMT)
Real-Time Generation of Game Video Commentary with Multimodal LLMs: Pause-Aware Decoding Approaches [69.6] 本研究は,文脈内プロンプトだけで,意味論的に関連性があり,良好なリアルタイムコメント生成をサポートできるかどうかを考察する。
提案手法は,1)固定区間法,2)動的区間法に基づく復号法である。
日本語と英語の競馬ゲームデータセットを用いた実験により,動的間隔に基づく復号化は,プロンプトのみを用いて,人間の発話タイミングや内容とより密に一致した注釈を生成できることが示されている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:39:04 GMT)
Track4World: Feedforward World-centric Dense 3D Tracking of All Pixels [67.4] モノクロビデオから各ピクセルの3D軌跡を推定することは重要であり、ビデオの3Dダイナミックスを包括的に理解する上で有望である。
最近のモノラルな3D追跡作業は印象的な性能を示しているが、第1フレーム上のスパースポイントのトラッキングや、高密度トラッキングのための遅い最適化ベースのフレームワークに限られている。
そこで我々は,Track4Worldと呼ばれるフィードフォワードモデルを提案し,世界中心座標系における全画素の効率的な3D追跡を可能にする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:45:43 GMT)
Utonia: Toward One Encoder for All Point Clouds [66.6] Utoniaは、さまざまなドメインにまたがる単一の自己教師付きポイントエンコーダをトレーニングするための第一歩です。
Utoniaは、ドメイン間で転送される一貫した表現空間を学ぶ。
ユトニア表現は具体的・多モーダルな推論にも有用である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:59:58 GMT)
Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails [66.2] 我々は、アダムにおける重要な第二モーメント正規化を発見し、アダムとSGDを区別する停止時間/マーチンゲール解析を開発した。
特に,2つの手法の高確率収束挙動の最初の理論的分離を確立する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:34:51 GMT)
Continuous Exposure-Time Modeling for Realistic Atmospheric Turbulence Synthesis [65.2] 大気の乱流は、幾何学的なワープと露光時間依存のぼかしを導入することで、長距離イメージングを著しく劣化させる。
既存の乱流効果の方法は、しばしばぼやけと露出時間の関係を単純化する。
我々は,連続露光時間モデリングを明示的に組み込んだ大規模合成乱流データセットET-Turbを構築した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:23:11 GMT)
Robotic Grasping and Placement Controlled by EEG-Based Hybrid Visual and Motor Imagery [64.8] 本稿では,脳波に基づく視覚・運動画像(VI/MI)とロボット制御を統合し,リアルタイム・意図駆動型把握・配置を実現するフレームワークを提案する。
このシステムは、BCI駆動のロボット工学の約束に感銘を受けて、オフラインで事前訓練されたデコーダをゼロショットで展開することによって、ニューラルネットワークを物理的制御でブリッジする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:41:42 GMT)
BrandFusion: A Multi-Agent Framework for Seamless Brand Integration in Text-to-Video Generation [64.6] テキスト・ツー・ビデオ(T2V)モデルにシームレスなブランド統合を導入する。
この課題は,迅速な忠実さの維持,ブランド認識性の確保,コンテキストによる自然な統合の実現という,3つの課題に直面する。
2つの相乗位相からなる新しいマルチエージェントフレームワークであるBrandFusionを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:10:41 GMT)
HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generating Detail-Preserving Human-Product Images [61.3] HiFi-Inpaintは、人為的な画像を生成するのに適した、新しい高忠実な参照ベースのインペインティングフレームワークである。
細粒度製品の特徴を洗練するためのSEA(Shared Enhancement Attention)と、正確なピクセルレベルの監視を行うためのDAL(Detail-Aware Loss)を導入する。
我々は、自己合成データから得られたサンプルを自動フィルタリングで処理し、HP-Image-40Kという新しいデータセットを構築した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:00:58 GMT)
BeyondSWE: Can Current Code Agent Survive Beyond Single-Repo Bug Fixing? [61.2] BeyondSWEは2つの軸 – 解像度スコープと知識スコープ – に沿って既存の評価を拡張する包括的なベンチマークです。
外部知識の役割を解明するために,ディープ検索とコーディング能力を統合するフレームワークであるSearchSWEを開発した。
この作業は、現実的で挑戦的な評価ベンチマークと、より有能なコードエージェントに向けた研究を進めるための柔軟なフレームワークの両方を提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:52:01 GMT)
Through the Lens of Contrast: Self-Improving Visual Reasoning in VLMs [60.9] モデル生成論理における幻覚を軽減するために,視覚コントラスト型自己学習共振器(VC-STaR)を提案する。
多様なVQAデータセットを収集し、マルチモーダルな類似性に応じてコントラストペアをキュレートし、VC-STaRを用いて合理性を生成する。
大規模な実験によると、VC-STaRは既存の自己改善アプローチを上回るだけでなく、SoTA視覚推論データセットで微調整されたモデルを上回る。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:18:31 GMT)
InterCoG: Towards Spatially Precise Image Editing with Interleaved Chain-of-Grounding Reasoning [60.8] 複雑な現実世界のシーンにおける微細な画像編集のためのテキストビジョンインターリーブド・チェーン・オブ・グラウンド推論フレームワークを提案する。
InterCoGの重要な洞察は、まずテキスト内でのみオブジェクト位置推論を実行することである。
また,マルチモーダル・グラウンド・ライティング・アライメント・アライメントとマルチモーダル・グラウンド・ライティング・アライメント・アライメントの2つの補助的トレーニング・モジュールを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:20:13 GMT)
DeepXiv-SDK: An Agentic Data Interface for Scientific Literature [60.2] DeepXiv-SDKは科学文献のための3層エージェントデータインタフェースである。
DeepXiv-SDKは完全なArXivコーパスをサポートし、毎日同期して新しいリリースを組み込む。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:41:40 GMT)
Guideline-Grounded Evidence Accumulation for High-Stakes Agent Verification [60.2] 既存の検証器は通常、ドメイン知識の欠如と限られた校正のために性能が劣る。
GLEANは専門家によって計算されたプロトコルをトラジェクトリインフォームされ、よく校正された正当性信号にコンパイルする。
我々は,MIMIC-IVデータセットから得られた3つの疾患の薬物的臨床診断でGLEANを実証的に検証した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:36:43 GMT)
Learning Unified Distance Metric for Heterogeneous Attribute Data Clustering [60.1] クラスタ分析のための異種属性再構成と表現(HARR)学習パラダイム
HarR はパラメータフリーで収束保証され、異なる要求されたクラスタ数 $k$ に対してより効果的に自己適応することができる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:13:16 GMT)
ProGIC: Progressive and Lightweight Generative Image Compression with Residual Vector Quantization [59.5] 残留ベクトル量子化(RVQ)に基づくコンパクトなプログレッシブ生成画像圧縮(ProGIC)を提案する。
RVQでは、ベクトル量子化器の列がステージごとに残余を符号化し、それぞれが独自のコードブックを持つ。
これを奥行き分離可能な畳み込みと小さな注意ブロックに基づく軽量なバックボーンと組み合わせることで、GPUとCPUのみのデバイスに実用的なデプロイを可能にします。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:47:05 GMT)
Evidence-based Distributional Alignment for Large Language Models [58.7] LLM分布推定の忠実度とロバスト性を改善する証拠に基づくアライメント手法であるEvi-DAを提案する。
対象国が与えられた場合、Evi-DAは関連するWorld Values Survey項目とその回答分布を検索し、オプション毎に粗いヴェルツェル値シグネチャを予測し、国条件の回答分布を構造化形式で推測する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:34:06 GMT)
IoUCert: Robustness Verification for Anchor-based Object Detectors [58.4] アンカーベースオブジェクト検出のための新しい形式検証フレームワークである sc sf IoUCert を紹介する。
本手法は, SSD, YOLOv2, YOLOv3など, リアルなアンカーベースモデルの様々な入力摂動に対する検証を可能にする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:36:46 GMT)
From Solver to Tutor: Evaluating the Pedagogical Intelligence of LLMs with KMP-Bench [56.7] KMP-Benchは,大規模言語モデル(LLM)を評価するために設計された,総合的なK-8数学的教育ベンチマークである。
最初のモジュールであるKMP-Dialogueは、6つの基本原理に対して全体論的教育能力を評価する。
第2のモジュールであるKMP-Skillsは、マルチターン問題解決、エラー検出と修正、問題生成を含む基礎的な学習能力の詳細な評価を提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:14:57 GMT)
Trade-offs in Ensembling, Merging and Routing Among Parameter-Efficient Experts [56.0] 大規模言語モデル(LLM)は、軽量アダプタで微調整され、多様なタスクにわたって強力なパフォーマンスを実現する。
異なる強みを持つ独立に訓練されたモデルを使用することで、3つの主要な戦略を通じてマルチタスク学習の可能性を示している。
私たちは、彼らのトレードオフを実証的に評価し、2つの重要な疑問に対処します。 均一なアンサンブルやマージを超えて行く利点は何ですか?そして、ルーティングの柔軟性は、その複雑さを正当化するのでしょうか?
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:44:11 GMT)
MultiGen: Level-Design for Editable Multiplayer Worlds in Diffusion Game Engines [55.6] ユーザアクションによって継続的に更新され,世代別ロールアウトを通じてクエリされるシステムに,明示的な外部メモリを導入する。
この設計により、ユーザーは編集可能なメモリ表現を通じて環境構造を直接、編集可能な制御を行うことができる。
コヒーレントな視点と一貫したクロスプレイヤーインタラクションを備えた、リアルタイムマルチプレイヤーロールアウトに自然に拡張する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:58:17 GMT)
ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.5] 本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:59:29 GMT)
Learning-Augmented Moment Estimation on Time-Decay Models [55.1] 私たちは、多くの基本的な問題に対して学習強化アルゴリズムを提供するために、データセットのヘビーヒッターにオラクルを使用します。
提案手法は,実データおよび合成データセット上でのアルゴリズムの実用的効率を実証する実験的な評価によって理論的結果を補完するものである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:42:34 GMT)
Specificity-aware reinforcement learning for fine-grained open-world classification [54.9] オープンワールド設定下でのきめ細かい視覚概念の分類は、モデルが正確かつ具体的であることを要求します。
細粒度画像分類に基づく細粒度推論LMMのための特異性認識型強化学習フレームワークSpeciaRLを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:52:39 GMT)
SENTINEL: Stagewise Integrity Verification for Pipeline Parallel Decentralized Training [54.8] 分散トレーニングは、信頼できない、地理的に分散したノードで実行される場合、重大なセキュリティリスクをもたらす。
重複のないパイプライン並列性(PP)トレーニングの検証機構であるSENTINELを提案する。
実験では、モデル収束と性能を維持しながら、最大176人の労働者を持つ信頼できない分散環境における最大4BパラメータLSMのトレーニングを成功させた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:51:10 GMT)
Improving Anomaly Detection with Foundation-Model Synthesis and Wavelet-Domain Attention [54.7] 異常合成パイプライン(FMAS)は、微調整やクラス固有の訓練をすることなく、非常に現実的な異常サンプルを生成する。
Wavelet Domain Attention Module (WDAM) は適応サブバンド処理を利用して異常特徴抽出を強化する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:17:08 GMT)
Recursive Think-Answer Process for LLMs and VLMs [54.5] R-TAP(Recursive Think-Answer Process)を提案する。
R-TAPにより、モデルは反復的推論サイクルに参加し、より正確な答えを生成することができる。
R-TAP強化モデルが従来のシングルパス法より一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:00:50 GMT)
Causal Identification from Counterfactual Data: Completeness and Bounding Results [54.1] 本研究では,任意のレイヤ3分布の集合から対実的なクエリを識別するアルゴリズムを開発した。
我々は、物理的に実現可能な分布から反事実を特定できる理論的限界を確立する。
我々は、そのような量の新たな解析的境界を、実現可能な対実データを用いて導出する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:56:54 GMT)
3D-DRES: Detailed 3D Referring Expression Segmentation [53.9] 本稿では,3Dインスタンスマッピングのフレーズを提供する新しいタスクであるDetailed 3D Referring Expression (3D-DRES)を紹介する。
11,054個の異なるオブジェクトにまたがる54,432個の記述を含む新しいデータセットであるDetailReferを提案する。
実験の結果,DetailReferで訓練したモデルはフレーズレベルのセグメンテーションに優れ,従来の3D-RESベンチマークでは驚くべき改善が見られた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:45:54 GMT)
VIRGi: View-dependent Instant Recoloring of 3D Gaussians Splats [53.6] 3DGSでモデル化されたシーンの色を高速に編集する新しいアプローチであるVIRGiを紹介する。
1人のユーザーの重みを微調整することで、色編集はシーン全体にわずか2秒でシームレスに伝達される。
多様なデータセットに対する徹底的な検証は、競合相手に対する有意義な量的および質的な進歩を示している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:41:17 GMT)
On Discriminative vs. Generative classifiers: Rethinking MLLMs for Action Understanding [53.6] 閉集合行動理解のためのGAD(Generation-Assisted Discriminative Discriminative)を提案する。
GADは微調整時にのみ動作し、MLLMの事前訓練と完全な互換性を保つ。
時間的行動理解ベンチマークの実験により、GADは生成法よりも精度と効率を向上することが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:02:01 GMT)
Conditioned Activation Transport for T2I Safety Steering [52.9] Conditioned Activation Transport (CAT) は、幾何学に基づく条件付け機構と非線形輸送マップを利用するフレームワークである。
Z-Image と Infinity の2つの最先端アーキテクチャに対するアプローチを検証する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:10:45 GMT)
Joint Optimization of Model Partitioning and Resource Allocation for Anti-Jamming Collaborative Inference Systems [52.8] この手紙は、悪意のあるジャマーの存在下での、アンチジャミングの協調推論システムに焦点を当てている。
まず、ジャミングとDNNパーティショニングがデータ回帰による推測精度に与える影響を解析する。
問題を3つのサブプロブレムに分解する,効率的な交互最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:52:52 GMT)
Learning Order Forest for Qualitative-Attribute Data Clustering [52.6] 本稿では,属性内定性値間の局所的な順序関係を柔軟に表現する木のような距離構造を探索する。
より適切な木構造とクラスタを反復的に獲得するために,共同学習機構を提案する。
実験により、共同学習は森林をクラスタリングタスクに適応させ、正確な結果を得ることを示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:49:50 GMT)
Proact-VL: A Proactive VideoLLM for Real-Time AI Companions [52.2] 自動評価のために選択された2つのゲームシナリオ,コメンテータとガイドを通じて,AIコンパニオンをインスタンス化する。
Proact-VLは,マルチモーダル言語モデルを人間のような環境認識とインタラクションが可能な,能動的,リアルタイムな対話エージェントに形成するフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:02:46 GMT)
Expected Reward Prediction, with Applications to Model Routing [51.7] 繰り返しサンプリングを行うと, LLMが報酬モデルから得られると予測される報酬を予測することは容易である。
また、これらの予測された報酬予測は、モデルルーティングプロトコルへのアプリケーションをサポートするのに十分正確かつ差別的であることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:10:44 GMT)
Tripartite information of two-dimensional free fermions: a sine-kernel spectral constant from Fermi surface geometry [51.6] 自由フェルミオン基底状態における相互情報(MMI)のモノガミーは、量子状態ではなく観測スケールの特性であることを示す。
解析的に$g(z)$の性質を確立し、slepian固有値の2つの寄与をキャンセルすることで$z*$が$0.12%$に決定されることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:39:35 GMT)
Hyperparameter Trajectory Inference with Conditional Lagrangian Optimal Transport [51.6] デプロイ後、ユーザの好みが進化し、初期設定が望ましくないようになる。
我々は、観測データから、NNの条件付き出力分布がハイパーパラメータでどのように変化するかを学ぶ。
我々は、NNを観測されていないハイパーパラメータで近似する代理モデルを構築した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:35:37 GMT)
UniG2U-Bench: Do Unified Models Advance Multimodal Understanding? [50.9] 統一マルチモーダルモデルは、最近強力な生成能力を示したが、生成が理解を改善したかどうかはまだ不明である。
提案するUniG2U-Benchは,G2U(Generation-to-understanding)評価を7つのシステマと30のサブタスクに分類する総合ベンチマークである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:36:16 GMT)
FACE: A Face-based Autoregressive Representation for High-Fidelity and Efficient Mesh Generation [50.7] フェースレベルでメッシュを生成する新しいAutoregressive AutoencoderフレームワークであるFACEを紹介する。
当社のワンフェイスワンツーケン戦略は、メッシュの基本構築ブロックである三角形の面を、単一の統一トークンとして扱います。
FACEは、標準ベンチマークで最先端の再構築品質を達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:12:47 GMT)
Beyond Pixel Histories: World Models with Persistent 3D State [50.5] PERSISTは、潜伏した3Dシーンの進化をシミュレートする世界モデルの新たなパラダイムである。
既存の手法に比べて空間記憶,3次元整合性,長期安定性が大幅に向上した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:58:31 GMT)
Step-Level Sparse Autoencoder for Reasoning Process Interpretation [49.0] 大規模言語モデル(LLM)は、Chain-of-Thought(CoT)推論を通じて、強力な複雑な推論機能を実現している。
本稿では,ステップレベルスパースオートエンコーダ (SSAE) を提案する。
複数の基本モデルと推論タスクの実験により,抽出した特徴の有効性が示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:25:02 GMT)
Efficient Self-Evaluation for Diffusion Language Models via Sequence Regeneration [48.2] 拡散大言語モデル (dLLMs) は多様性、制御可能性、並列性を高める能力において大きな注目を集めている。
我々は,dLLMの簡易かつ効果的な自己評価信頼度定量化法であるDiSEを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:58:20 GMT)
Generalized Bayes for Causal Inference [47.7] 不確かさの定量化は、因果機械学習の多くの応用の中心である。
標準的なベイズ的アプローチでは、データ生成プロセスの確率モデルを指定する必要がある。
因果推論のための一般化されたベイズ的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:27:23 GMT)
MiM-DiT: MoE in MoE with Diffusion Transformers for All-in-One Image Restoration [47.4] 本稿では,Mixture-of-Experts(MoE)アーキテクチャを事前学習した拡散モデルと統合した統合画像復元フレームワークを提案する。
フレームワークは2つのレベルで動作する: Inter-MoE層はエキスパートグループを適応的に組み合わせて大きな劣化タイプを処理する。
この設計により、モデルは多種多様な劣化カテゴリにまたがる粗粒度適応を可能とし、特定のクラス内変動に対して微粒度変調を行い、複雑で現実的な汚職に対処する際の高度な特殊化を確保することができる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:00:49 GMT)
Retrievit: In-context Retrieval Capabilities of Transformers, State Space Models, and Hybrid Architectures [47.3] 本研究では,トランスフォーマーとステートスペースモデルを組み合わせたハイブリッドアーキテクチャが,2つの合成インコンテキスト検索タスクにおいて両世界の長所を達成できるかどうかを考察する。
ハイブリッドモデルはSSMを上回り、データ効率と情報深度コンテキスト検索のための外挿においてTransformerを上回り、あるいは上回ります。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:28:33 GMT)
An Initial Exploration of Contrastive Prompt Tuning to Generate Energy-Efficient Code [46.9] 本研究の目的は, LLM がエネルギー効率の良いコード生成にどう最適化できるか, 検討することである。
CPTはContrastive Learningテクニックを組み合わせることで、モデルが効率的かつ非効率なコードを区別するのに役立つ。
本研究では,Python,Java,C++の3つのモデルにまたがるコーディング問題のCPTを評価し,包括的評価を行う。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:36:15 GMT)
Any Resolution Any Geometry: From Multi-View To Multi-Patch [46.8] Ultra Resolution Geometry Transformer (URGT) は、VGGT (Visual Geometry Grounded Transformer) をモノクル高分解能深度正規推定のための統一マルチパッチトランスに適合させる。
1つの高解像度画像は、事前訓練されたモデルから粗い深さと通常の先行値で拡張されたパッチに分割され、1つの前方通過で共同処理され、洗練された幾何出力を予測する。
提案手法はUnrealStereo4Kの最先端化を実現し,AbsRelを0.0582から0.0291に,RMSEを2.17から1.3に削減する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:18:24 GMT)
Radar-based Pose Optimization for HD Map Generation from Noisy Multi-Drive Vehicle Fleet Data [46.7] 本研究は, 車両ポーズの生のレーダ点雲を用いて, レーダ計測を整列させることにより, 位置化ノイズ成分の緩和に重点を置いている。
コントラストに富んだ特徴の明確さを示し、地図上の主要な特徴型としてガードレールのポストに焦点をあてる。
第二に、改良されたポーズは、既存のレーン境界マップ生成パイプラインの基盤として使用することができ、元の純粋なライン検出に基づく最適化アプローチと比較して、マップ出力を大幅に改善する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:09:42 GMT)
Eliciting Numerical Predictive Distributions of LLMs Without Autoregression [46.7] 本研究では,LLM予測の分布特性を明示的な自己回帰生成なしに復元できるかどうかを検討した。
以上の結果から,LLMの埋め込みは予測分布の要約統計に関する情報的信号を運ぶことが示唆された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:13:40 GMT)
TC-Padé: Trajectory-Consistent Padé Approximation for Diffusion Acceleration [46.6] Tray-Consistent Padé近似はテイラー法よりも正確に遷移挙動を捉える。
TC-PadéはFLUX.1-devで2.88倍、Wan2.1で1.72倍、FID、Aesthetic CLIP、V-2.0で高い品質を維持している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:50:26 GMT)
SaFeR-ToolKit: Structured Reasoning via Virtual Tool Calling for Multimodal Safety [46.6] SaFeR-ToolKitはチェック可能なプロトコルとして安全意思決定を形式化する。
Plannerはペルソナ、パーセプション$to$推論$to$決定ツールセット、制約付き遷移グラフを指定する。
responseerは、最終回答の前に型付きキー値ツールトレースを出力する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:03:38 GMT)
RAIN: Secure and Robust Aggregation under Shuffle Model of Differential Privacy [46.5] 本稿では,Shuffle-DPの下でのプライバシー,堅牢性,検証性を両立するフレームワークである騒音のロバスト集約について述べる。
RAINは、アップデートの一貫性を堅牢に測定し、ノイズや匿名化の下で悪意のある影響を制限するために、サインスペースアグリゲーションを採用している。
本研究は,Shuffle-DPの下では強力なプライバシー保証を保ち,精度と収束性において無視できない劣化を伴う攻撃に対して堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:41:54 GMT)
UETrack: A Unified and Efficient Framework for Single Object Tracking [46.5] UETrackは単一のオブジェクト追跡のための効率的なフレームワークである。
RGB、Depth、Therical、Event、Languageといった複数のモダリティを効率的に扱う。
従来の手法に比べて、速度精度のトレードオフが優れている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:18:46 GMT)
ExpGuard: LLM Content Moderation in Specialized Domains [46.0] 現在のガードレールモデルは、一般的な人間とLLMの相互作用に主に対応している。
我々は,金融,医療,法的領域にまたがる有害なプロンプトや対応から保護するために設計された堅牢なガードレールモデルであるExpGuardを紹介する。
提案するExpGuardMixは,58,928個のラベル付きプロンプトと,対応する拒絶応答と対応応答のペアからなる,細かなキュレートされたデータセットである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:09:49 GMT)
Orbital Transformers for Predicting Wavefunctions in Time-Dependent Density Functional Theory [45.3] 時間依存密度汎関数理論(TDDFT)でシミュレートされた波動関数の学習を目指す。
リアルタイムTDDFTでは、分子の電子波動関数は外部励起に応答して時間とともに進化する。
本稿では,全電子波動関数の時間的発展を学習するOrbEvoを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:34:05 GMT)
His2Trans: A Skeleton First Framework for Self Evolving C to Rust Translation with Historical Retrieval [45.2] His2Transは、決定論的でビルド対応のスケルトンと自己進化的な知識抽出を組み合わせて、安定したインクリメンタルマイグレーションをサポートするフレームワークである。
産業用OpenHarmonyモジュールの実験では、His2Transが99.75%インクリメンタルコンパイルパスレートに達した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:42:08 GMT)
BRIGHT: A Collaborative Generalist-Specialist Foundation Model for Breast Pathology [45.2] 一般病理基盤モデル (PFM) は様々な臨床応用において顕著な予測能力を示した。
乳腺病理に特化して設計された最初のPFMであるBRIGHTを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:24:35 GMT)
APRES: An Agentic Paper Revision and Evaluation System [44.4] 科学者が自身の仕事を伝え、コミュニティからフィードバックを受け取るための第一の方法は、ピアレビューである。
本稿では,Large Language Models (LLMs) を利用した新しいAPRES手法を提案する。
提案手法は,将来的な引用数を高い精度で予測できるルーリックを発見し,APRESと統合して論文を改訂し,その品質と影響を高める。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:29:13 GMT)
Tether: Autonomous Functional Play with Correspondence-Driven Trajectory Warping [44.3] 構造化されたタスク指向インタラクションを含む自律型機能プレイ法であるTetherを紹介する。
まず、小さなソースのデモからアクションを警告する新しいオープンループポリシーを設計する。
第2に,タスク選択,実行,評価,改善の連続サイクルを通じて,現実の自律的機能プレイのためのこのポリシをデプロイする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:59:07 GMT)
Self-supervised Domain Adaptation for Visual 3D Pose Estimation of Nano-drone Racing Gates by Enforcing Geometric Consistency [43.5] シミュレーションデータに基づいて事前学習した畳み込みニューラルネットワークを用いて,ナノクワッドロータの前方のドローンレースゲートの相対的なポーズを視覚的に推定する作業を検討する。
ゲートの前方に任意の軌道を飛行するドローンによって収集された実画像のみを用いた教師なし領域適応(UDA)手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:46:25 GMT)
HomeAdam: Adam and AdamW Algorithms Sometimes Go Home to Obtain Better Provable Generalization [43.4] モーメントベースのSGDを返却することで,効率的なAdamアルゴリズム(HomeAdam(W))のクラスを提案する。
我々は、HomeAdam(W) が$O(frac1N)$よりも小さい一般化誤差を持つことを証明している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:29:24 GMT)
Phys4D: Fine-Grained Physics-Consistent 4D Modeling from Video Diffusion [43.1] ビデオ拡散モデルから物理に一貫性のある4次元世界表現を学習するためのパイプラインである textbfPhys4D を提案する。
まず、大規模擬似教師付き事前学習により、ロバストな幾何学と動きの表現を行う。
次に、シミュレーションブートストラップ生成データを用いて物理地上教師あり微調整を行い、時間的に一貫した4次元ダイナミクスを強制する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:01:43 GMT)
Adaptive Methods Are Preferable in High Privacy Settings: An SDE Perspective [42.7] プライバシー規制の厳格化に伴い、差分プライバシー(DP)は大規模トレーニングの中心になりつつある。
微分方程式のレンズによる最適化において、雑音が適応性とどのように相互作用するかを再考する。
DP-SignSGD は $varepsilon$ から独立して、DP-SignSGD は $varepsilon$ から独立に、DP-SignSGD は $varepsilon$ から独立に、速度は $varepsilon$ に収束する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:17:57 GMT)
Scalable Multilingual Multimodal Machine Translation with Speech-Text Fusion [42.6] 音声誘導機械翻訳(SMT)フレームワークは、音声とテキストを融合入力としてMLLMに統合し、翻訳品質を向上させる。
このフレームワークのコアコンポーネントは、合成音声を生成するためのテキスト音声モデルと、合成音声サンプルを分類可能なMLLMである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 01:53:26 GMT)
Fingerprint Recognition of Partial Discharge Signals in Deep Learning Enhanced Rydberg Atomic Sensors [42.4] 我々は、部分放電の時間領域応答を直接捉えるために、Rydberg原子センサーを使用している。
1D ResNet深層学習モデルを適用して,手動の機能工学を使わずに,これらの指紋を時間領域信号から認識する。
我々は,ノイズと混合した部分放電信号を解析し,モデルが予測アラームを生成できるシミュレーション早期警戒シナリオにおけるアプローチの有効性を検証した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:31:18 GMT)
A Short Note on a Variant of the Squint Algorithm [42.3] 本項では、古典的専門家問題に対するクーレンとヴァン・アーヴェンのスキントアルゴリズムの単純な変種について述べる。
この変種は、FreundらによるNormalHedgeアルゴリズムの変種に対する最近の研究([2026])で示されているような後悔境界を確実に証明する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:32:31 GMT)
APPO: Attention-guided Perception Policy Optimization for Video Reasoning [42.1] 複雑なビデオの推論は微妙な知覚に過度に依存している。
本稿では,アテンション誘導型知覚ポリシー最適化アルゴリズムAPPOを提案する。
我々は,APPOがGRPOとDAPOを一貫して上回ることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:59:12 GMT)
Compositional Visual Planning via Inference-Time Diffusion Scaling [41.9] 短期ホライズンロボット計画において拡散モデルは優れているが、計算制約と限られた訓練データのために長いホライズンタスクにスケールすることは依然として困難である。
安定な構成生成の鍵は、推定されたクリーンデータに対する境界合意を強制することにある。
提案手法は,ビデオチャンクを重畳した連鎖構造因子グラフ上での長軸計画を定式化し,事前学習した短軸ビデオ拡散モデルが局所的な事前情報を提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:24:06 GMT)
Agentic Mixed-Source Multi-Modal Misinformation Detection with Adaptive Test-Time Scaling [41.6] 視覚言語モデル(VLM)は,社会プラットフォーム上でのマルチモーダル誤報の検出に有効であることが証明されている。
しかしながら、単一のVLMの容量は、より複雑な混在するマルチモーダル誤情報検出タスクにおいて不足する。
我々は,ゼロショット誤情報検出のためのマルチエージェントフレームワークであるAgentM3Dを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:07:52 GMT)
Towards Improved Sentence Representations using Token Graphs [41.4] GLOTは構造を意識したプールモジュールで、リレーショナル学習後にアグリゲーションとしてプールを再構成する。
トークンの90%がランダムなイントラクタである診断ストレステストでは、GLOTは97%以上の精度を維持し、ベースラインメソッドは崩壊する。
GLUEやMTEBのようなベンチマークの最先端技術と競合し、トレーニング可能なパラメータは20倍少なく、パラメータ効率のよい微調整手法と比較してトレーニング時間を100倍以上高速化する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:00:01 GMT)
MMAI Gym for Science: Training Liquid Foundation Models for Drug Discovery [41.2] MMAI Gymは、タスク固有の推論、トレーニング、ベンチマークのレシピと同様に、ワンストップの分子データフォーマットとモダリティである。
MMAI Gymを用いて、これらの用途に効率的な液体基礎モデル(LFM)を訓練し、より小さな目的に訓練された基礎モデルは、分子ベンチマークにおいてより大規模な汎用モデルや専門モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:51:51 GMT)
From Shallow to Deep: Pinning Semantic Intent via Causal GRPO [40.9] インテントピンニングを実現するためのフレームワークである Two-Stage Causal-GRPO を提案する。
TSC-GRPOは, 汎用性を保ちつつ, ジェイルブレイク攻撃に対する防御において, ベースラインを著しく上回っていることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:02:20 GMT)
RADAR: Learning to Route with Asymmetry-aware DistAnce Representations [40.9] 最近のニューラルソルバは、車両ルーティング問題(VRP)において高い性能を達成している
RADARは、既存のニューラルネットワークVRPソルバを非対称入力を処理する能力で強化するスケーラブルなニューラルネットワークフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:13:45 GMT)
Lattice-based Deep Neural Networks: Regularity and Tailored Regularization [40.8] 格子規則は準モンテカルロ法に属する。
彼らは高次元積分と関数近似の様々な文脈において有効性を示した。
調整された正規化で訓練されたDNNは、標準$ell$正規化よりもはるかに優れた性能を示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:53:27 GMT)
OrchMAS: Orchestrated Reasoning with Multi Collaborative Heterogeneous Scientific Expert Structured Agents [40.6] 本稿では,科学的ドメイン指向の対話型2層マルチモデルオーケストレーションフレームワークを提案する。
専用のオーケストレーションモデルは各タスクを分析し、ドメインを意識した推論パイプラインを動的に構築し、カスタマイズされたプロンプトで専門の専門家エージェントをインスタンス化する。
オーケストレータは、中間フィードバックに基づいてパイプラインを反復的に更新し、動的リプランニング、ロール再配置、マルチターンインタラクション間の即時改善を可能にする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:57:43 GMT)
Variance reduction in lattice QCD observables via normalizing flows [40.4] 正規化フローは、格子場理論の観測可能な不偏分散推定器を構築するのに使うことができる。
この研究は、SU(3) ヤン・ミルズ理論と4つの時空次元における2フレーバー量子クロモダイナミックス(QCD)におけるグルーオン作用素の挿入を含む可観測性に対するアプローチを実装した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:36:29 GMT)
Code2Math: Can Your Code Agent Effectively Evolve Math Problems Through Exploration? [40.1] 我々は、既存の数学問題をより複雑なバリエーションに自律的に進化させるコードエージェントの可能性について検討する。
本稿では,解決可能性の検証と,発生した問題の難易度の向上を図りながら,問題進化を図ったマルチエージェントフレームワークを提案する。
この研究は、コード駆動エージェントが高微分数学的推論問題を合成するための実行可能なメカニズムとして機能できるという実証的な証拠を提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:55:10 GMT)
Learning Memory-Enhanced Improvement Heuristics for Flexible Job Shop Scheduling [40.0] フレキシブルなジョブショップスケジューリング問題(FJSP)は、現実の運用シナリオと複雑で強い整合性のため、大きな注目を集めている。
現在の深部強化学習(DRL)に基づくFJSPのアプローチは主に建設的手法を採用している。
本稿では,異種グラフ表現を用いたメモリ拡張改善検索フレームワーク-MIStarを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:43:01 GMT)
PRIVATEEDIT: A Privacy-Preserving Pipeline for Face-Centric Generative Image Editing [39.8] 生成画像編集は、プロのヘッドショット生成からアバタースタイリゼーションまで、変換可能なアプリケーションを可能にする。
これらのシステムは、しばしば高忠実な顔画像をサードパーティのモデルにアップロードすることを必要とし、生体認証のプライバシー、データ誤用、ユーザーの同意に関する懸念を提起する。
我々は,顔中心のユースケースで生体データを制御しながら,高品質な編集をサポートするプライバシー保護パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:27:51 GMT)
Learning in Markov Decision Processes with Exogenous Dynamics [39.6] エージェントの動作に依存しない状態成分を特徴とするMDPの構造クラスについて検討する。
この構造を利用すると、学習の保証が大幅に向上することを示す。
私たちは、古典的なおもちゃの設定や現実世界に触発された環境にまたがって、私たちのアプローチを実証的に検証します。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:10:45 GMT)
Chart Deep Research in LVLMs via Parallel Relative Policy Optimization [39.6] 現在のグラフデータインテリジェンスには、深い研究能力に重大な制限がある。
本稿では,データ型間で報酬次元と能力の並列最適化を行うPRPOを提案する。
MCDR-Benchは, 主観的生成評価を客観的な誤り識別に変換する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:50:33 GMT)
ClinConsensus: A Consensus-Based Benchmark for Evaluating Chinese Medical LLMs across Difficulty Levels [39.3] 大規模言語モデル(LLM)は、病気の予防、臨床的意思決定、長期ケアにまたがる約束を示す健康管理にますます応用されている。
ClinConsensusは、臨床専門家がキュレートし、検証し、品質を制御した中国の医療ベンチマークである。
ClinConsensusは、予防と介入から長期フォローアップまで、ケアの全期間にわたる2500件のオープンエンドケースで構成されており、36の専門医、12の共通臨床タスクタイプ、そして徐々に複雑さのレベルが増大している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:45:44 GMT)
OmniFashion: Towards Generalist Fashion Intelligence via Multi-Task Vision-Language Learning [39.3] FashionXは100万スケールのデータセットで、衣装の中の目に見えるファッションアイテムを完全に注釈付けします。
オムニファシオン(OmniFashion)は、多様なファッションタスクを統一的なファッション対話パラダイムの下でブリッジする、視覚言語統合フレームワークである。
マルチサブタスクと検索ベンチマークの実験により、OmniFashionは強いタスクレベルの精度とクロスタスクの一般化を達成することが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:48:27 GMT)
Seeing Clearly without Training: Mitigating Hallucinations in Multimodal LLMs for Remote Sensing [38.9] マルチモーダル大言語モデル(MLLM)は、リモートセンシング視覚質問応答(RS-VQA)において顕著な幻覚に苦しむ
実例と論理的幻覚の詳細な診断のためのプロトコルベースのベンチマークであるRSHBenchを紹介する。
本稿では、段階的局所化とテスト時のきめ細かい局所推論を導くために、相対的注意駆動能動推論(RADAR)を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:53:20 GMT)
Rethinking Policy Diversity in Ensemble Policy Gradient in Large-Scale Reinforcement Learning [38.8] 政治間の多様性が政策アンサンブルの学習効率に与える影響を理論的に分析する。
我々は、政策間のKL制約を通じて多様性を規制する結合政策最適化を提案する。
この結果から, 適切な規制下での多様な探索が, 安定した, サンプル効率の学習に欠かせないことが示唆された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:32:08 GMT)
Impact of Localization Errors on Label Quality for Online HD Map Construction [38.4] 本稿では,Ramp,Gaussian,Perlinの3種類のローカライゼーション誤差を導入し,生成した地図ラベルへの影響について検討する。
ローカライゼーションエラーは, 距離ラベルに悪影響を及ぼすが, 駆動性能にはあまり影響しないため, 距離ベースマップ構築基準を導入する。
車両への距離が大きくなるにつれて、角度誤差がラベルの歪みを増大させるので、方向角の誤差は位置誤差よりも顕著な影響を及ぼすことを示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:08:14 GMT)
Unmixing microinfrared spectroscopic images of cross-sections of historical oil paintings [38.3] ATR-$FTIR HSIのブラインドアンミックスのための教師なしCNNオートエンコーダを提案する。
本稿では,ヴァン・エイク兄弟によるヘント・アルタルピースのATR-$FTIR断面積を実証する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:47:48 GMT)
Agentic Self-Evolutionary Replanning for Embodied Navigation [37.7] 自己進化的リプランニング(Self-Evolutionary RePlanning、SERP)は、凍結モデルからランタイム学習による進化モデルへのパラダイムシフトである。
既定の静的パラメータにしばしば立ち往生する既存のモデル進化アプローチとは対照的に、エージェント的自己進化アクションモデルを導入する。
SERPは、様々なベンチマークよりもトークン支出が少なく、高い成功率を実現し、様々な環境において優れた堅牢性と効率性を検証している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:12:29 GMT)
RubricBench: Aligning Model-Generated Rubrics with Human Standards [37.3] 逆モデル(Reward Model)は、単純な完了から、表面レベルのバイアスを軽減するために、複雑で高度な生成へと移行している。
既存のベンチマークには、差別的な複雑さと厳密な分析に必要な地味なアノテーションの両方が欠けている。
本稿では,ブルリック評価の信頼性を評価するために特別に設計された1,147対比較ベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:45:35 GMT)
RuCL: Stratified Rubric-Based Curriculum Learning for Multimodal Large Language Model Reasoning [37.2] Stratified-based Curriculum Learning (RuCL)は、データ選択から報酬設計へ焦点を移すことでカリキュラム学習を再構築する新しいフレームワークである。
RuCLは広く適用可能な一般化されたルーリックを生成し、モデルの能力に基づいてそれらを階層化する。
様々な視覚的推論ベンチマークの実験により、RuCLはQwen2.5-VL-7Bモデルよりも平均的な7.83%向上した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:05:32 GMT)
IDER: IDempotent Experience Replay for Reliable Continual Learning [36.4] 破滅的忘れは継続学習(CL)における大きな課題である
既存の不確実性を考慮したCL法は、計算オーバーヘッドが高く、主流の再生法と相容れない。
本稿では、繰り返し関数が同じ出力を出力する等等性性に基づく新しいアプローチである、等等性体験再生(IDER)を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:15:08 GMT)
Intrinsic Geometry-Appearance Consistency Optimization for Sparse-View Gaussian Splatting [36.3] 一つの画像から3Dの人間の再構築は難しい問題だ。
EmphMVD-HuGaSは,複数視点の人体拡散モデルを用いて,単一の画像から自由視点の3Dレンダリングを可能にする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:44:46 GMT)
TRACE: Task-Adaptive Reasoning and Representation Learning for Universal Multimodal Retrieval [35.9] Universal Multimodal Retrievalは、多様なユーザ意図を解釈できる統合埋め込みモデルを必要とする。
TRACE(Task-adaptive Reasoning and Embeddings)を紹介する。
TRACEは、生成的推論を識別的表現学習と統合する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:36:39 GMT)
PreciseCache: Precise Feature Caching for Efficient and High-fidelity Video Generation [35.5] 高い計算コストと遅い推論は、ビデオ生成モデルの実践的応用を妨げる。
我々は,真に冗長な計算を正確に検出し,スキップするプラグイン・アンド・プレイ・フレームワークである textbfPreciseCache を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:45:48 GMT)
Efficient Test-Time Optimization for Depth Completion via Low-Rank Decoder Adaptation [35.2] 我々は,デコーダのみを適応させることが,効率的なテスト時間最適化に十分であることを示す。
本稿では,この低次元部分空間のみをスパース深度監視を用いて更新する軽量なテスト時間適応手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:43:24 GMT)
Scalar-Measurement Attitude Estimation on $\mathbf{SO}(3)$ with Bias Compensation [35.2] 姿勢推定法は通常、加速度計や磁力計のような慣性センサーからの完全なベクトル測定に依存する。
本稿では,スカラー測定のみを用いて信頼性の高い推定を行うことができることを示す。
ジャイロスコープバイアス補償を組み込んだ$mathbfSO(3)$の非線形決定論的オブザーバを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:02:23 GMT)
Small Bottle, Big Pipe: Quantifying and Addressing the Impact of Data Centers on Public Water Systems [34.9] 合衆国のデータセンターは、2030年までに1日あたり697万1,451ガロン(MGD)の水道容量を必要とする可能性がある。
高成長のIT負荷は、その年の大半でニューヨーク市の約半分を供給できる十分な能力を必要とする可能性がある。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:50:54 GMT)
OnlineX: Unified Online 3D Reconstruction and Understanding with Active-to-Stable State Evolution [34.8] フィードフォワードフレームワークであるOnlineXを導入し、ストリーミング画像のみを用いて3次元の視覚的外観と言語フィールドをオンライン的に再構築する。
我々のフレームワークは、メモリ状態を専用のアクティブな状態と永続的な安定な状態に分離し、その後、前者からの情報を結合して後者に融合させ、忠実性と安定性の両方を達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:03:57 GMT)
Thinking into the Future: Latent Lookahead Training for Transformers [34.7] 次トーケン予測で訓練された自己回帰言語モデルは、一度に1つの離散トークンをサンプリングすることでテキストを生成する。
我々は、モデルが生成前に"考える"ことができるトレーニング戦略である潜在ルックアヘッドを紹介します。
本研究では,潜在ルックアヘッドが,迷路解決やスドク,ProsQAといった計画課題において,自己回帰的,非自己回帰的ベースラインを著しく上回っていることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:15:42 GMT)
Beyond Cross-Validation: Adaptive Parameter Selection for Kernel-Based Gradient Descents [34.6] 本稿では,カーネルベース勾配勾配(KGD)アルゴリズムのパラメータ選択手法を提案する。
KGDにおける反復増分を定量化するための経験的有効次元の概念を導入し、実装可能な適応パラメータ選択戦略を導出する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:19:29 GMT)
Belief-Sim: Towards Belief-Driven Simulation of Demographic Misinformation Susceptibility [34.5] 本稿では,人口統計学的信念プロファイルを構成するシミュレーションフレームワークであるBeliefSimを紹介する。
誤情報感受性をシミュレーションする上で,信条は高い先行性を示し,精度は最大92%であった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:29:35 GMT)
LiveAgentBench: Comprehensive Benchmarking of Agentic Systems Across 104 Real-World Challenges [34.2] 実ユーザ要求を反映した104のシナリオを備えた総合ベンチマークであるLiveAgentBenchを紹介します。
ソーシャルメディアや現実世界の製品に関する公開の質問から構築されている。
このリリースには374のタスクと125のバリデーション、249のテストが含まれている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:03:05 GMT)
ACE-Merging: Data-Free Model Merging with Adaptive Covariance Estimation [34.2] モデルマージは、複数のタスク固有のエキスパートモデルと1つのモデルを組み合わせることを目的としている。
専門家間の干渉、特に異なる目的でトレーニングされた場合、しばしばパフォーマンスが著しく低下する。
acemは、タスク間干渉を効果的に緩和する適応的共分散推定フレームワークである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:53:04 GMT)
Online Learnability of Chain-of-Thought Verifiers: Soundness and Completeness Trade-offs [34.2] 連鎖検証を学習するためのオンライン学習フレームワークを提案する。
学習した検証器は、弱い証明者の集合の精度を高めるためにどのように使用できるかを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:50:14 GMT)
Articulation in Motion: Prior-free Part Mobility Analysis for Articulated Objects By Dynamic-Static Disentanglement [33.7] Articulation in Motion (AiM)は、ユーザオブジェクトインタラクションビデオと起動状態スキャンからインタラクティブな3Dデジタルレプリカを再構成する。
オブジェクトの3DGSスキャンから学習したデュアルガウスシーン表現を提案する。
モーションキューを使用して、オブジェクトを部品に分割し、関節を割り当てる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:07:06 GMT)
HeroGS: Hierarchical Guidance for Robust 3D Gaussian Splatting under Sparse Views [33.4] 画像,特徴,パラメータレベルをまたいだ階層的ガイダンスを確立する統一的なフレームワークであるHeroGSを提案する。
我々は,HeroGSが高忠実度再構築を実現し,スパースビュー条件下での最先端のベースラインを一貫して超えることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:17:58 GMT)
FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing [33.2] テキストと財務時系列データをペアリングするための意味に基づく多段階ペアリングフレームワークを提案する。
本手法をプロプライエタリかつ慎重にキュレートしたニュースソースに適用すると,高品質なペアリングデータとなり,株価予測性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:45:57 GMT)
Credibility Governance: A Social Mechanism for Collective Self-Correction under Weak Truth Signals [33.1] 信頼性ガバナンス(CG)は、エージェントと視点が進化する公的な証拠を継続的に追跡する学習によって影響を再配置するメカニズムである。
CGは、エージェントと意見の両方の動的信頼性スコアを維持し、信頼度重み付き支持を通じて意見の影響を更新し、支持する意見の長期的パフォーマンスに基づいてエージェントの信頼性を更新する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:10:13 GMT)
Build, Judge, Optimize: A Blueprint for Continuous Improvement of Multi-Agent Consumer Assistants [32.9] 対話型ショッピングアシスタントの評価と最適化のための実用的な青写真を提供する。
本稿では,エンド・ツー・エンドのショッピング品質を構造化次元に分解する多面評価ルーリックを提案する。
GEPAと呼ばれるSOTAプロンプト最適化手法を2つの相補的プロンプト最適化戦略として検討した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:47:08 GMT)
Uni-Skill: Building Self-Evolving Skill Repository for Generalizable Robotic Manipulation [32.9] Uni-Skillはスキル中心のフレームワークで、スキル対応のプランニングをサポートする。
既存のスキルが不十分な場合、新しいスキル実装に対するUni-Skillリクエスト。
Skillは、大規模な非構造化ロボットビデオから派生したVerbNetにインスパイアされたリポジトリだ。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:49:37 GMT)
SimRecon: SimReady Compositional Scene Reconstruction from Real Videos [32.6] 構成シーンの再構築は、現実世界のビデオの全体像ではなく、オブジェクト中心の表現を作ろうとしている。
シムレコン(SimRecon)は「知覚生成シミュレーション」パイプラインを乱れたシーン再構成に向けて実現したフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:00:37 GMT)
FastCode: Fast and Cost-Efficient Code Understanding and Reasoning [32.3] リポジトリスケールのコード推論は、現代のAI支援ソフトウェアエンジニアリングの基盤である。
FastCodeは、コンテンツ消費からリポジトリの探索を分離するフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:18:10 GMT)
RL-Based Coverage Path Planning for Deformable Objects on 3D Surfaces [32.1] 我々は,曲面ワイピングタスクのための変形可能な物体を操作するため,シミュレータ内の強化学習エージェントを訓練する。
本研究では,高調波UVマッピング,2次元特徴写像上のシミュレータからのプロセス接触フィードバック,スケールド・グループ・コンボリューション(SGCNN)を用いて,物体表面の状態表現を単純化し,特徴を効率的に抽出する。
実験により,本手法は,経路距離や被覆面積など,従来の手法よりも優れた性能を示すことが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:16:06 GMT)
Nodes Are Early, Edges Are Late: Probing Diagram Representations in Large Vision-Language Models [32.1] 我々は,有向グラフに基づく合成図データセットを用いて,大規模視覚言語モデル(LVLM)の内部表現を探索する。
実験の結果,エッジ情報はビジョンエンコーダでは線形に分離できず,言語モデルではテキストトークンでのみ線形に符号化されることがわかった。
これらのことから,線形分離可能な表現が形成される段階は視覚情報の種類によって異なることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:17:31 GMT)
Benchmark of Benchmarks: Unpacking Influence and Code Repository Quality in LLM Safety Benchmarks [31.9] 本稿では,LLMの安全性ベンチマークにおける影響(5つの指標に基づく)とコード品質の多次元評価について述べる。
ベンチマーク論文は,非ベンチマーク論文に対する学術的影響(引用数や密度など)に有意な優位性を示すものではない。
著者の優位性は紙の影響と相関するが、著者の優位性も紙の影響もコード品質と有意な相関を示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:10:45 GMT)
Watch Your Step: Learning Semantically-Guided Locomotion in Cluttered Environment [31.8] 乱雑な環境での障害を正確に回避するために設計された強化学習フレームワークであるSemLocoを紹介する。
SemLocoは衝突を著しく低減し、センシティブな物体の安全性を向上させる。
さらに、SemLocoはより複雑で非構造的な実環境に効果的に適用できることを示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:47:46 GMT)
Super Research: Answering Highly Complex Questions with Large Language Models through Super Deep and Super Wide Research [31.6] 大規模言語モデル(LLM)は、ディープリサーチやワイドサーチにおいて習熟性を示しているが、非常に複雑な問題を解く能力は、まだ明らかにされていない。
我々は, (i) 構造化された分解を研究計画に統合する複雑な自律型研究タスク, (ii) 多様な視点の超広視野検索, (iii) 反復的なクエリによる不確実性解決のための超深層調査を紹介する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:08:18 GMT)
Channel-Adaptive Edge AI: Maximizing Inference Throughput by Adapting Computational Complexity to Channel States [31.5] emph通信と計算(IC$2$)は、6Gネットワークにおける効率的なエッジ推論を実現するための新しいパラダイムとして登場した。
この計量は、チャネル歪みと人工知能(AI)モデルアーキテクチャと計算複雑性の両方を考慮する必要があるため、非常に複雑である。
我々は、E2E推論精度の抽出可能な解析モデルを開発し、それを利用して、推論スループットを最大化するEmph Channel-Adaptive AIアルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:33:29 GMT)
Improving Diffusion Planners by Self-Supervised Action Gating with Energies [31.4] 遅延整合性信号を用いて動的に不整合プランをペナライズする自己教師行動ゲーティング(SAGE)を提案する。
SAGEは、オフライン状態シーケンスにJEPAエンコーダと、短地平線遷移のための動作条件付き潜在予測器をトレーニングする。
テスト時に、SAGEは各サンプル候補に潜伏予測誤差によって与えられるエネルギを割り当て、この実現可能性スコアと値推定を組み合わせて選択アクションを選択する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:36:16 GMT)
SGMA: Semantic-Guided Modality-Aware Segmentation for Remote Sensing with Incomplete Multimodal Data [31.1] マルチモーダルセマンティックセグメンテーションは、リモートセンシング地球観測のための多様なセンサーからの補完情報を統合する。
IMSSは3つの主要な課題に直面している:マルチモーダル不均衡、支配的なモダリティが脆弱なモダリティを抑えること、スケール、形状、方向のクラス内変化、矛盾するキーと矛盾するセマンティック応答を生み出すクロスモーダル不均一。
本稿では,セマンティック・ガイド・モダリティ・アウェア(SGMA)フレームワークを提案する。セマンティック・モダリティ・アウェア(SGMA)フレームワークは,クラス内変動の低減とセマンティックガイダンスによる相互不整合の緩和を図りつつ,バランスの取れたマルチモーダル学習を実現する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 01:28:21 GMT)
StegaFFD: Privacy-Preserving Face Forgery Detection via Fine-Grained Steganographic Domain Lifting [31.1] クライアントサーバのフレームワークでは、プライベートな顔データは送信中に傍受されるか、信頼できないサーバによってリークされる。
匿名化、暗号化、歪みなどの従来のプライバシー保護アプローチは、漏洩を部分的に軽減するが、しばしば深刻な意味的歪みをもたらす。
ステガノグラフィーに基づく顔偽造検出フレームワーク(StegaFFD)を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:34:57 GMT)
Bias and Fairness in Self-Supervised Acoustic Representations for Cognitive Impairment Detection [31.1] 音声による認知障害の検出(CI)は早期診断に有望な非侵襲的アプローチを提供する。
本研究では,DementiaBank Pitt Corpus を用いた音響ベースCIと抑うつ分類の系統的バイアス分析を行った。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:47:31 GMT)
GloPath: An Entity-Centric Foundation Model for Glomerular Lesion Assessment and Clinicopathological Insights [31.1] GloPathは、14,049個の腎生検標本から抽出された100万個以上の糸球体から訓練された実体中心の基礎モデルである。
病変評価のために、GloPathは、病変認識、グレーディング、少数ショット分類、異物診断における最先端の方法を含む52のタスクにおいて、3つの独立したコホートでベンチマークされた。
臨床病理所見では,GloPathは糸球体形態パラメータと臨床指標の統計的に有意な関連を系統的に明らかにした。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:32:12 GMT)
PhyPrompt: RL-based Prompt Refinement for Physically Plausible Text-to-Video Generation [30.7] 最先端のテキスト・トゥ・ビデオ(T2V)ジェネレータは、視覚的品質が高いにもかかわらず、しばしば物理法則に違反している。
これは、モデル制約よりもプロンプトにおける物理的制約が不十分であることに由来する。
本稿では,2段階強化学習フレームワークであるPhyPromptを紹介する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:26:14 GMT)
QIME: Constructing Interpretable Medical Text Embeddings via Ontology-Grounded Questions [29.9] 解釈可能な医療用テキスト埋め込みを構築するためのオントロジーを基盤としたフレームワークであるQIMEを提案する。
QIMEは、バイオメディカルテキストのきめ細かい区別を捉える意味論的原子的質問を生成する。
そこで本研究では,QIMEが従来の解釈可能な埋め込み手法よりも優れており,そのギャップを強力なブラックボックスバイオメディカルエンコーダにかなり狭めていることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:49:10 GMT)
VisionCreator: A Native Visual-Generation Agentic Model with Understanding, Thinking, Planning and Creation [29.7] 我々は、理解、思考、計画、創造(UTPC)機能を統合する視覚世代エージェントモデルであるVisionCreatorを提案する。
i)メタ認知に基づくVisGenData-4kとその構築手法を用いて、明示的なUTPC構造を持つ高品質な生成トラジェクトリを生成するためのVisGenData-4k、(ii)プログレッシブトレーニング(PST)と仮想強化学習(VRL)によって最適化されたVisGenBench、(iii)標準化された評価のための1.2kテストサンプルを含む包括的なベンチマークであるVisGenBenchの4つの主要な貢献を紹介する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:22:21 GMT)
Achieving speedup in Dark Matter search experiments with a transmon-based NISQ algorithm [29.5] 超軽量のボソニックダークマターのコヒーレント検出は、超伝導量子ビット中の遅いラビ振動を監視することで達成できる。
2量子ゲートを用いた隠れ光子運動混合パラメータ$$に対する感度を高めるアンシラ支援ゲートベースプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:59:01 GMT)
RAPO: Expanding Exploration for LLM Agents via Retrieval-Augmented Policy Optimization [29.4] エージェント強化学習(Agentic RL)は,大規模言語モデルベース(LLM)エージェントにおいて顕著な可能性を示している。
本稿では、学習中の探索を明示的に拡張する検索を導入した新しいRLフレームワークである検索型ポリシー最適化(RAPO)を提案する。
RAPOは、3つのエージェント推論タスクにわたる14のデータセットの平均ゲインを+5.0%達成し、トレーニング効率は1.2倍向上した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:23:42 GMT)
On Google's SynthID-Text LLM Watermarking System: Theoretical Analysis and Empirical Validation [29.2] GoogleのSynthID-Textは、大規模な言語モデルのためのプロダクション対応のジェネレーティブな透かしシステムである。
本稿では,SynthID-Textに関する最初の理論的解析を行い,検出性能と透かしの堅牢性に着目した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:49:01 GMT)
Direct Reward Fine-Tuning on Poses for Single Image to 3D Human in the Wild [29.2] シングルビュー3Dの復元は目覚ましい進歩を遂げたが、回収された3Dのヒトは、しばしば不自然なポーズを呈する。
本稿では,多視点拡散モデルの各種ポーズに対する後学習を可能にする,Poses上でのダイレクトリワード微調整アルゴリズムであるDrPoseを紹介する。
DrPoseは、PoseScoreを最大化するために直接報酬を微調整する、単一のビューイメージと組み合わせた人間のポーズのみを使用してモデルを訓練する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:47:18 GMT)
Multimodal-Prior-Guided Importance Sampling for Hierarchical Gaussian Splatting in Sparse-View Novel View Synthesis [29.0] スパースビュー新規ビュー合成における階層型3次元ガウススプラッティング(3DGS)の中心メカニズムとして,多モード優先重要サンプリングを提案する。
本フレームワークは,(1)大域的な形状を安定な粗い層でエンコードする粗いガウス表現と,多モード計量が復元可能な詳細を示すような微細なプリミティブを選択的に追加する。
多様なスパースビューベンチマークの実験では、DTUに最大0.3dBのPSNRを持つ最先端の再構築が示されている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:19:45 GMT)
DREAM: Where Visual Understanding Meets Text-to-Image Generation [28.8] 差別的・生成的目的を協調的に最適化する統合フレームワークであるDREAMを紹介する。
DREAMは72.7%の線形探索精度(CLIPよりも+1.1%)、FIDは4.25(FLUIDより6.2%)である。
その結果、識別的および生成的目的が相乗的であることが示され、視覚的理解と生成の両方において優れる統一されたマルチモーダルモデルが可能となった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:54:19 GMT)
Classroom Final Exam: An Instructor-Tested Reasoning Benchmark [28.3] CFE-Benchは、大規模言語モデルの推論能力を評価するためのベンチマークである。
新しくリリースされたGemini-3.1-pro-previewは59.69%の精度を達成した。
第2のモデルであるジェミニ-3-フラッシュ・プレヴューは55.46%に達し、改善の余地を残している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:16:35 GMT)
EdgeFLow: Serverless Federated Learning via Sequential Model Migration in Edge Networks [28.1] EdgeFLowは、従来のクラウドサーバをエッジクラスタに置き換える、革新的な分散学習フレームワークである。
EdgeFLowは通信コストを大幅に削減しつつ、同等の精度の向上を実現していることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:28:57 GMT)
S2CDR: Smoothing-Sharpening Process Model for Cross-Domain Recommendation [27.9] クロスドメインレコメンデーション(CDR)は、ユーザによるコールドスタートの課題に対して、非常に効果的な対策として登場した。
本稿では,コールドスタートユーザを対象としたS2CDR(Smoothing-Sharpening Process Model)を提案する。
我々のS2CDRは、従来のSOTA法よりも訓練のない方法で大幅に優れています。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:21:42 GMT)
FlashEvaluator: Expanding Search Space with Parallel Evaluation [27.8] 我々は,全シーケンスを1つのフォワードパスで処理し,クロスシーケンストークンの情報共有を可能にするFlashEvaluatorを提案する。
これにより、システムの効率を向上し、シーケンス間直接比較をサポートするサブ線形計算複雑性が得られる。
FlashEvaluatorは、Kuaishouのオンラインレコメンデーションシステムにデプロイされ、実質的で持続的な収益を実際に提供してきた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:35:34 GMT)
ATD: Improved Transformer with Adaptive Token Dictionary for Image Restoration [27.6] 本稿では,画像復元のための新しいトランスフォーマーアーキテクチャであるAdaptive Token Dictionary (ATD)を提案する。
我々は、TDCAアテンションマップに埋め込まれたカテゴリ情報を利用して、複数のカテゴリにグループ入力する。
ATDとその軽量版ATD-lightは、複数の画像超解像度ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:56:09 GMT)
SOLAR: SVD-Optimized Lifelong Attention for Recommendation [27.4] 本研究では,10分の1スケールの動作シーケンスと数千項目の候補セットをサポートするシーケンスモデリングフレームワークを提案する。
Kuaishou氏のオンラインレコメンデーションシナリオでは、SOLARは0.68%のビデオビューと追加のビジネスメトリクスの改善を提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:28:36 GMT)
Functional Properties of the Focal-Entropy [27.0] 我々は、クロスエントロピーの焦点損失アナログである焦点エントロピーについて研究する。
焦点損失は中距離確率を増幅し、高い確率結果を抑制し、過剰な抑制体制を誘導することを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:45:59 GMT)
NOVA: Sparse Control, Dense Synthesis for Pair-Free Video Editing [26.7] NOVA: Sparse Control & Dense Synthesisは、未完成のビデオ編集のための新しいフレームワークです。
実験の結果,NOVAは従来手法よりも忠実度,運動保存,時間的コヒーレンスに優れていた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:41:06 GMT)
From "What" to "How": Constrained Reasoning for Autoregressive Image Generation [26.7] CoR-PainterはConstrained Reasoningを導入することで、"How-to-What"パラダイムを開拓する新しいフレームワークである。
まず、入力プロンプトから一連の視覚的制約を導出することで、"ハウ・トゥ・ドロー"を導出する。
これらの制約は、構造的に健全でコヒーレントな基礎を提供し、正確な視覚合成を行うための詳細な記述"What to draw"の生成を後回しにしている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:03:18 GMT)
Kraken: Higher-order EM Side-Channel Attacks on DNNs in Near and Far Field [26.6] 数十億ドルの投資により、大規模なMLモデルが盗難の主なターゲットとなった。
物理的なサイドチャネル情報に基づく攻撃は、GPUのCoreでもモデル抽出が実現可能であることを示している。
本研究は,GPUのコアユニットのパラメータ抽出を初めて実施する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:40:13 GMT)
APAO: Adaptive Prefix-Aware Optimization for Generative Recommendation [26.4] 生成レコメンデーションは自動回帰生成プロセスであり、ユーザインタラクション履歴に基づいて、次の項目の離散トークンを予測する。
既存の生成レコメンデーションモデルは、通常、クロスエントロピー損失のようなトークンレベルの可能性目標で訓練される。
標準的なトレーニングでは、推論中にビームサーチが低確率の分岐を産み出すという事実を無視して、地道の歴史が常に利用可能であると仮定している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:29:15 GMT)
StitchCUDA: An Automated Multi-Agents End-to-End GPU Programing Framework with Rubric-based Agentic Reinforcement Learning [26.3] エンドツーエンドGPUプログラム生成のためのマルチエージェントフレームワークであるStitchCUDAを提案する。
実験の結果、StitchCUDAはエンドツーエンドのプログラミングタスクで100%近く成功し、マルチエージェントベースラインの1.72倍の高速化を実現している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:04:49 GMT)
Rhythm: Learning Interactive Whole-Body Control for Dual Humanoids [25.7] 我々はRhythmを紹介した。Rhythmは、複雑で物理的に妥当な相互作用のためのデュアルヒューマノイドシステムの現実的な展開を可能にする最初の統一フレームワークである。
本フレームワークは,(1)人間データから実現可能なヒューマノイドインタラクション参照を生成するIAMRモジュール,(2)グラフベースの報酬を通じて結合力学をマスターするIGRLポリシ,(3)デュアルヒューマノイドインタラクションの堅牢な転送を可能にする実世界展開システム,の3つのコアコンポーネントを統合した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:04:56 GMT)
PromptStereo: Zero-Shot Stereo Matching via Structure and Motion Prompts [25.2] 本稿では,単分子深度基礎モデルのデコーダをベースとした新しい反復改良モジュール Prompt Recurrent Unit (PRU) を提案する。
モノクラー構造とステレオモーションキューをデコーダに組み込むことで、PRUはモノクラー深度基礎モデルの潜在表現を絶対的なステレオスケール情報で強化する。
実験の結果,PromptStereoは複数のデータセットにまたがる最先端のゼロショット一般化性能を達成できた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:18:55 GMT)
Combinatorial Sparse PCA Beyond the Spiked Identity Model [25.1] 一般に$s2 cdot Mathrmpolylog(d)$サンプルと$d2 cdot Mathrmpoly(s)$タイムを用いて$$を証明可能なスパースPCAの手法を提案する。
また,本手法を合成および実世界のデータセット上で評価した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:19:55 GMT)
The Tool-Overuse Illusion: Why Does LLM Prefer External Tools over Internal Knowledge? [24.9] 我々はまず、この現象が多種多様なLDMにまたがって広まることを明らかにした。
次に、2つのキーレンズを用いて基礎となるメカニズムを実験的に解明する。
ツール強化トレーニングプロセスの可視化により,報酬構造とツール使用行動の因果関係を確立する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:55:55 GMT)
The Geometry of Learning Under AI Delegation [24.8] AIシステムがツールからコラボレータへとシフトするにつれ、人間が依存するスキルが時間とともにどのように変化するかが中心的な疑問である。
本研究では,人間のスキルとAIデリゲーションを結合力学系としてモデル化し,この問題を数学的に研究する。
我々の結果は、AI支援が長期にわたる人間のパフォーマンスとスキルを損なうおそれのあるメカニズムとして、インセンティブやミスアライメントではなく、安定性を識別する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:01:22 GMT)
Embedding interpretable $\ell_1$-regression into neural networks for uncovering temporal structure in cell imaging [24.5] 本稿では,ベクトル自己回帰(VAR)モデルを解釈可能な回帰手法として畳み込み自己エンコーダに組み込む手法を提案する。
スキップ接続は、スパース構造をVARモデルに選択的にチャネルする非スパース静的空間情報に別々に対処する。
埋め込み統計モデルを持つことは、同じ観測単位からの時間的シーケンスを比較するためのテストアプローチを可能にする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:48:44 GMT)
Chain of World: World Model Thinking in Latent Motion [24.2] VLA(Vision-Language-Action)モデルはしばしば、視覚力学の基礎となる予測的・時間的・因果的構造を見落としている。
我々は,世界モデルの時間的推論を非絡み合いの潜在動作表現と統合する新しい「世界の連鎖」パラダイムであるCoWVLAを紹介した。
CoWVLAは、既存のワールドモデルおよび潜在アクションアプローチより優れ、適度な計算効率を達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:52:06 GMT)
EEG-Based Brain-LLM Interface for Human Preference Aligned Generation [24.2] 脳-LLMインターフェースを構築し,脳波信号を用いて画像生成モデルをテスト時にガイドする。
実験では、脳波がユーザの満足度を予測することを示し、神経活動がリアルタイムの嗜好推定に関する情報を運ぶことを示唆している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:00:11 GMT)
Beyond One-Size-Fits-All: Adaptive Subgraph Denoising for Zero-Shot Graph Learning with Large Language Models [24.1] ゼロショット設定でのグラフベースのタスクは、データ不足と従来のグラフニューラルネットワークが見えないドメインやラベル空間に一般化できないため、依然として大きな課題である。
ゼロショットLLMグラフ推論における適応サブグラフ抽出とデノベーションのための新しいフレームワークであるGraphSSRを紹介する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:47:44 GMT)
Neural Electromagnetic Fields for High-Resolution Material Parameter Reconstruction [23.9] 現在のNeRFのような方法は、視覚的に豊かだが機能的に不完全な双生児を生み出す。
NEMFは高密度で非侵襲的な物理インバージョンのための新しいフレームワークである。
非侵襲的なデータのみを用いて幾何学とフィールドの両方を制約することにより、元々の不正な問題から、しっかりとした物理を監督した学習タスクへと変換される。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:56:21 GMT)
R3GW: Relightable 3D Gaussians for Outdoor Scenes in the Wild [23.7] 3D Gaussian Splatting (3DGS) は静的シーンの3D再構成と新しいビュー合成の先駆的手法として確立されている。
本稿では,野生で捉えた屋外シーンの3DGS表現を学習する新しい手法R3GWを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:40:16 GMT)
MERIT: Memory-Enhanced Retrieval for Interpretable Knowledge Tracing [23.5] 大きな言語モデル(LLM)は強力な推論能力を提供するが、限られたコンテキストウィンドウや幻覚に苦しむ。
MERIT(Memory-Enhanced Retrieval for Interpretable Knowledge Tracing)は,凍結LDM推論と構造化ペタゴジカルメモリを組み合わせた学習自由フレームワークである。
LLMを解釈可能なメモリにグラウンドすることで、MERITは勾配更新なしで現実世界のデータセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:07:38 GMT)
Uni-Animator: Towards Unified Visual Colorization [23.5] 画像と映像のカラー化のための新しいフレームワークUni-Animatorを提案する。
既存のスケッチのカラー化手法は、画像とビデオのタスクを統合するのに苦労する。
本稿では、インスタンスパッチの埋め込みによる視覚的参照強化について紹介する。
高周波テクスチャを効果的に捕捉・保持する物理特徴を用いた物理ディテール強化を設計する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:49:53 GMT)
From Pairs to Sequences: Track-Aware Policy Gradients for Keypoint Detection [23.4] キーポイントベースのマッチングは、Structure-from-Motion (SfM) やSLAMといった現代の3Dビジョンシステムの基本コンポーネントである。
本稿では,キーポイントを直接画像シーケンス上で最適化する新しいエンドツーエンド強化学習フレームワークであるTraqPointを紹介する。
私たちの中核的なイノベーションは、複数のビューにまたがるキーポイントの一貫性と特異性を共同で促進する、トラックアウェアの報酬メカニズムです。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:53:21 GMT)
Parallel Test-Time Scaling with Multi-Sequence Verifiers [23.4] 並列テストタイムスケーリングは、大規模な言語モデルのパフォーマンスを改善するための強力なテクニックである。
候補プールから正しいソリューションを正確に選択することと、多くの完全なソリューションを生成することによる高い推論レイテンシである。
我々は,全ての候補解を共同処理し,それらの相互作用をモデル化する最初の検証器であるMulti-Sequence Verifier (MSV)を紹介する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:53:56 GMT)
ModalPatch: A Plug-and-Play Module for Robust Multi-Modal 3D Object Detection under Modality Drop [23.3] 任意のモダリティ・ドロップシナリオ下でロバストな検出を可能にするために設計されたプラグイン・アンド・プレイモジュールであるModalPatchを紹介する。
技術的には、ModalPatchはセンサーデータの時間的特性を知覚的連続性に利用し、履歴ベースのモジュールを使用して、過渡的に利用できない機能の予測と補償を行う。
広範囲にわたる実験により、ModalPatchは様々なモダリティ・ドロップ条件下で、最先端の3Dオブジェクト検出器の堅牢性と精度を一貫して向上させることが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:09:00 GMT)
Toward Early Quality Assessment of Text-to-Image Diffusion Models [23.3] 最近のテキスト・ツー・イメージ(T2I)拡散モデルとフローマッチングモデルは、自然言語のプロンプトから非常にリアルな画像を生成することができる。
Probe-Selectは、生成プロセス内の画像品質の効率的な評価を可能にするプラグインモジュールである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:25:46 GMT)
A Neuropsychologically Grounded Evaluation of LLM Cognitive Abilities [23.3] 大規模言語モデル(LLM)は10ベンチマークで統一された「一般的な要素」の能力を示す。
本稿では,3つの適応型神経心理学検査を基礎としたNeuroCognitionベンチマークを紹介する。
評価の結果,モデルがテキスト上で強く機能する一方で,画像のパフォーマンスが低下し,複雑さが増していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:54:58 GMT)
TrustMH-Bench: A Comprehensive Benchmark for Evaluating the Trustworthiness of Large Language Models in Mental Health [22.8] 大規模言語モデル(LLM)は、アクセス可能なメンタルヘルスサポートを提供する。
既存の評価パラダイムは、メンタルヘルス固有の要件を捉えていない。
本稿では,精神保健LLMの信頼性を定量化するための総合的な枠組みであるTrustMH-Benchを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:39:35 GMT)
DeepReviewer 2.0: A Traceable Agentic System for Auditable Scientific Peer Review [22.7] DeepReviewer2.0は、出力契約を中心に構築されたプロセス制御エージェントレビューシステムである。
134 ICLR2025は3つの固定されたプロトコルの下で提出され、DeepReviewer2.0を実行する196BモデルはGemini-3.1-Pro-previewより優れている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:02:17 GMT)
EEG-SeeGraph: Interpreting functional connectivity disruptions in dementias via sparse-explanatory dynamic EEG-graph learning [22.7] SeeGraphは機能接続をモデル化した動的EEGグラフネットワークであり、ノード誘導のスパースエッジマスクを使用している。
クロスエントロピー損失とマスク上のスペーサ正規化器を用いてトレーニングし,ノイズローバストと解釈可能な診断を行う。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:56:13 GMT)
Evaluating Cross-Modal Reasoning Ability and Problem Characteristics with Multimodal Item Response Theory [22.6] マルチモーダル言語モデルのベンチマークは、クロスモーダル統合の能力を測定する必要がある。
現在のベンチマークはショートカットの質問で満たされており、単一のモダリティだけで解決できる。
従来のIRTを拡張したM3IRT(Multi-modal and multidimensional item response theory framework)を提案する。
M3IRTはMLLMのクロスモーダルな能力と各質問のクロスモーダルな難しさを推定し、コンパクトで高品質なサブセットを実現する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:51:08 GMT)
VIGOR: Visual Goal-In-Context Inference for Unified Humanoid Fall Safety [22.6] 転倒復旧のすべての段階にまたがる統合的転倒安全アプローチを提案する。
我々は、平坦な地形における疎らな人間のデモンストレーションと複雑な地形をシミュレートした特権教師を訓練する。
シミュレーションの結果と実際のUnitree G1ヒューマノイドでは、多様な非平坦な環境において、堅牢でゼロショットのフォールセーフが示される。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:24:18 GMT)
Real-Time Generative Policy via Langevin-Guided Flow Matching for Autonomous Driving [22.4] DACER-Fは、自律運転システムにおける生成ポリシーのフローマッチングアルゴリズムである。
ヒューマノイド・スタンド・タスクで775.8のスコアを獲得し、以前の手法を上回ります。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:35:53 GMT)
VSearcher: Long-Horizon Multimodal Search Agent via Reinforcement Learning [22.3] VSearcherは、マルチモーダル検索エージェントで、現実世界のWeb環境での長時間のマルチターンツールの使用を可能にする。
大規模で複雑なマルチモーダルQA質問を生成するために、反復射出データ合成パイプラインを導入する。
次に、SFT-then-RLトレーニングパイプラインを用いて、ベースマルチモーダルモデルを現実世界のWeb環境におけるマルチターンツール呼び出しが可能なエージェントに変換する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:33:22 GMT)
AI4CAREER: Responsible AI for STEM Career Development at Scale in K-16 Education [22.1] この半日間のワークショップでは、研究者、教育者、実践者、政策立案者が集まり、STEMキャリア開発に責任あるAIを調べる。
我々は,(1)AIがSTEMのキャリア準備性の定義と評価をどのように行うか,(2)キャリア決定におけるAIの適切な役割と境界,(3)K-16連続体におけるAIの発達的アライメント,(4)構造的格差の再現を防止するための株式関連設計考察,の4つのテーマに焦点をあてる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:42:19 GMT)
Delegation and Verification Under AI [22.1] 我々は、合理的な作業者の最適化問題の解決策として、デリゲートと検証をモデル化する。
我々はAIが*相転移を誘導することを示した。
これらの結果は、AIが制度的労働者の質を再評価する構造的メカニズムを特定する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:14:23 GMT)
TikZilla: Scaling Text-to-TikZ with High-Quality Data and Reinforcement Learning [21.7] Text-to-TikZの既存のデータセットは、TikZの複雑さを捉えるには小さすぎてうるさい。
DaTikZ-V4は4倍以上のデータセットで、品質がかなり高い。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:17:56 GMT)
EduVQA: Benchmarking AI-Generated Video Quality Assessment for Education [21.3] AI生成ビデオ(AIGV)の品質を評価するための最初のベンチマークデータセットと評価フレームワークであるEduAIGV-1kを紹介する。
EduAIGV-1kには、113のペダギー指向のプロンプトを使用して、10の最先端のテキスト・トゥ・ビデオ(T2V)モデルによって生成された1,130の短いビデオが含まれている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:05:27 GMT)
MASPOB: Bandit-Based Prompt Optimization for Multi-Agent Systems with Graph Neural Networks [21.2] MASPOB(Multi-Agent System Prompt Optimization via Bandits)は,バンディットに基づく新しいサンプル効率フレームワークである。
トポロジによる結合を処理するため、MASPOBはグラフニューラルネットワーク(GNN)を統合して、構造的事前をキャプチャし、プロンプトセマンティクスのトポロジ対応表現を学習する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:59:05 GMT)
ProSMA-UNet: Decoder Conditioning for Proximal-Sparse Skip Feature Selection [21.0] 医療画像のセグメンテーションは一般にU-NetのようなU字型エンコーダデコーダアーキテクチャに依存している。
スキップ接続は、デコーダに高解像度のエンコーダ機能を注入することで、細かな空間的詳細を保存する。
これらのスキップ経路は、低レベルのテクスチャ、バックグラウンドクラッタ、取得ノイズも伝搬する。
本稿では,デコーダ条件付きスパース特徴選択問題としてスキップゲーティングを再構成するProSMA-UNetを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:46:29 GMT)
Semi-Supervised Few-Shot Adaptation of Vision-Language Models [21.0] 医用画像では、ゼロショットと少数ショットの画像分類において、特殊視監督モデル(VLM)が有望な性能を示した。
本稿では,テキストインフォームド・擬似ラベルを数ショット適応時に伝播する,効率的な半言語解法を導入することで,ラベル付きデータを活用することを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:11:47 GMT)
The Dresden Dataset for 4D Reconstruction of Non-Rigid Abdominal Surgical Scenes [20.8] D4Dデータセットは、変形する腹部軟部組織の3D再構成を評価するための、内視鏡的ビデオと高品質な構造化光幾何を提供する。
da Vinci Xiステレオ内視鏡とZivid構造化光カメラを用いて、6つのブタのキャデバーセッションからデータを得た。
このリソースは、非剛性SLAM、4D再構成、深さ推定方法の開発および評価のための総合的なベンチマークとして機能する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:37:02 GMT)
Design Generative AI for Practitioners: Exploring Interaction Approaches Aligned with Creative Practice [20.7] インテント,インプット,プロセス間で制御を分散する3つのインタラクションアプローチを提案する。
我々は、アライメントはダイナミックな交渉であり、AIはデザイナのインスピレーションとインスピレーションのニーズと創造的な段階に応じて、積極的またはリアクティブな役割を採用する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:19:23 GMT)
IMR-LLM: Industrial Multi-Robot Task Planning and Program Generation using Large Language Models [20.3] 大規模言語モデル(LLM)は、単純な家庭や操作作業のためのロボットを協調させる可能性を示している。
我々は,新しいLLM駆動型産業用マルチロボットタスク計画とプログラム生成フレームワークであるIMR-LLMを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:55:27 GMT)
Sustainable Code Generation Using Large Language Models: A Systematic Literature Review [20.1] 大規模言語モデル(LLM)は、コードの生成、完成、翻訳、修正に広く使われている。
本稿では,LLMが生成するコードの持続可能性に関する既存研究について検討する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:55:51 GMT)
Interpreting Speaker Characteristics in the Dimensions of Self-Supervised Speech Features [19.8] 発話平均表現におけるPCAを用いた話者情報について検討する。
その結果、ほとんどの分散を説明する主次元は、ピッチと、性別のような関連する特徴を符号化していることがわかった。
合成実験では、ほとんどの特性が対応する次元を変化させることで制御可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:33:39 GMT)
Beyond State-Wise Mirror Descent: Offline Policy Optimization with Parameteric Policies [19.8] 鏡面降下と自然政策勾配を結びつけることで,新たな分析,保証,アルゴリズム的洞察がもたらされることを示す。
また、鏡面降下と自然政策勾配の結合が、オフラインRLと模倣学習の驚くべき統合につながることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:13:05 GMT)
Biomechanically Accurate Gait Analysis: A 3d Human Reconstruction Framework for Markerless Estimation of Gait Parameters [19.5] 本稿では,映像データからの3次元再構成を用いた歩行解析のための生体力学的解釈可能なフレームワークを提案する。
その結果, 姿勢推定法だけで比較すると, マーカーによる測定と強い一致を示し, かなりの改善が見られた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 01:04:00 GMT)
Deception by Design: A Temporal Dark Patterns Audit of McDonald's Self-Ordering Kiosk Flow [19.3] 本稿では,ドイツにおけるマクドナルドの自己順序キオスクの構造化監査について述べる。
ページ内,ページ間,システムレベルにまたがる12のインターフェースステップを再構築し,解析した。
本研究は,これらのパターンが相互作用フロー全体にわたってどのように蓄積され,キオスクの線形タスク構造と物理的コンテキストによって増幅されることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:09:04 GMT)
See and Remember: A Multimodal Agent for Web Traversal [19.3] V-GEMSは、Webナビゲーションのための堅牢なマルチモーダルエージェントアーキテクチャである。
エージェントは視覚的グラウンド処理を統合し、あいまいな対話的要素を解決し、状態追跡を伴う明示的なメモリスタックを導入する。
実験の結果、V-GEMSはWebWalkerベースラインを著しく上回り、28.7%のパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:55:05 GMT)
The power of small initialization in noisy low-tubal-rank tensor recovery [19.2] 本研究では,低ツバルランクテンソル $mathcalX_starin mathbbRn times n times k$ を雑音線形測定から回収する問題について検討する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:29:04 GMT)
How to Model AI Agents as Personas?: Applying the Persona Ecosystem Playground to 41,300 Posts on Moltbook for Behavioral Insights [19.1] 我々は、AIエージェントのためのソーシャルプラットフォームであるMoltbookにPersona Ecosystem Playgroundを適用する。
我々はk平均クラスタリングと検索拡張生成を用いて41,300の投稿から会話ペルソナを生成し,検証する。
その結果、ペルソナに基づく生態系モデリングは、AIエージェントの集団の行動多様性を表現できることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:26:44 GMT)
SemGS: Feed-Forward Semantic 3D Gaussian Splatting from Sparse Views for Generalizable Scene Understanding [18.9] SemGSは画像入力から一般化可能なセマンティックフィールドを再構築するためのフィードフォワードフレームワークである。
カメラ視点間の幾何学的関係を明示的にモデル化するために,特徴抽出器にカメラ対応アテンション機構を導入する。
実験により、SemGSはベンチマークデータセット上で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:06:37 GMT)
HDINO: A Concise and Efficient Open-Vocabulary Detector [18.8] HDINOは簡潔だが効率的なオープンボキャブラリオブジェクト検出器である。
本稿では,変換器をベースとしたDINOモデルに基づく2段階のトレーニング戦略を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:29:19 GMT)
Extending the Formalism and Theoretical Foundations of Cryptography to AI [18.7] 言語モデル(Large Language Models)の最近の進歩は、自律型LMベースのエージェントの開発を可能にしている。
セキュリティリスクを軽減するための新たな方向の1つは、アクセス制御とパーミッション機構を通じてエージェントの動作を制限することだ。
まず、言語モデルに合わせた攻撃分類を構築することで、景観を体系化する。
次に,AIOracleをアルゴリズムで定義し,セキュリティゲームフレームワークを導入することにより,エージェントアクセス制御の形式的処理を開発する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:11:21 GMT)
cuNRTO: GPU-Accelerated Nonlinear Robust Trajectory Optimization [18.7] 軌道最適化により、自律システムは不確実性の下で安全に動作することができる。
これらの問題はしばしば計算コストのかかるSOCP(Second Order Conic Programming)の制約に繋がる。
本稿では,ロバストな意思決定に直接適用可能な動的最適化アーキテクチャを2つ提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:17:08 GMT)
LLM-based Argument Mining meets Argumentation and Description Logics: a Unified Framework for Reasoning about Debates [18.3] 大規模言語モデル(LLM)は、テキストの分析と生成において高いパフォーマンスを達成する。
彼らは、議論を含むような複雑なテキストに対する明確で透明で検証可能な推論に苦慮している。
本稿では,学習に基づく議論マイニングと定量的推論を組み合わせたフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:06:23 GMT)
Contextual Latent World Models for Offline Meta Reinforcement Learning [17.9] 本研究では、文脈潜在世界モデルを導入し、推論されたタスク表現に潜在世界モデルを条件付けし、文脈エンコーダと共同で学習する。
これはタスク条件の時間的一貫性を強制し、タスク依存のダイナミクスをキャプチャするタスク表現を生成する。
提案手法はより表現力のあるタスク表現を学習し,MuJoCo,Contextual-DeepMind Control,Meta-Worldベンチマークにまたがる未確認タスクへの一般化を大幅に改善する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:45:20 GMT)
ByteFlow: Language Modeling through Adaptive Byte Compression without a Tokenizer [17.9] textbfByteFlow Netは、トークン化ツールを完全に取り除く新しい階層アーキテクチャである。
ByteFlow Netは、潜在表現の符号化率に基づいて圧縮駆動セグメンテーションを実行する。
実験により、このチャンキング戦略がかなりのパフォーマンス向上をもたらすことが示されている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:20:31 GMT)
Learning to Generate and Extract: A Multi-Agent Collaboration Framework For Zero-shot Document-level Event Arguments Extraction [17.9] 知識獲得には文書レベルのイベント引数抽出(DEAE)が不可欠である。
ゼロショット文書レベルのイベント引数抽出(ZS-DEAE)のためのマルチエージェント協調フレームワークを提案する。
RAMSデータセットとWikiEventsデータセットから構築した3つのゼロショットシナリオにおいて、本手法は、データ生成品質と引数抽出性能の両方の改善を実現する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:03:35 GMT)
MUSE: A Run-Centric Platform for Multimodal Unified Safety Evaluation of Large Language Models [17.8] MUSE (Multimodal Unified Safety Evaluation) は、自動クロスモーダルペイロード生成を統合するオープンソースの実行中心プラットフォームである。
ハードアタック成功率(コンプライアンスのみ)とソフトASR(部分コンプライアンスを含む)を区別するデュアルメトリックフレームワーク
実験により、マルチターン戦略は、ほぼ完全な単一ターン拒否を持つモデルに対して最大90-100%のASRを達成することができることが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:10:23 GMT)
Wukong-Omni: Design, Modeling and Control of a Multi-mode Robot for Air, Land, and Underwater Exploration with All-in-One Propulsion Unit [17.5] Wukong-Omniは、陸、空気、水中で操作できる新しいマルチモードロボットだ。
システムは、モーターの再利用と推力発生の改善を可能にする革新的な機械設計によって実現されている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:00:56 GMT)
The Price of Robustness: Stable Classifiers Need Overparameterization [17.3] クラス安定性で逆改善する有限関数クラスに対して有界な一般化を確立する。
我々は、ブベックとセルケの結果を拡張する分類の堅牢性の法則として導かれる。
実験は我々の理論を支持するが、伝統的なノルムに基づく測度はほとんど非形式的である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:47:06 GMT)
CoDAR: Continuous Diffusion Language Models are More Powerful Than You Think [17.3] CoDARは、強いコンテキスト条件の離散化学習をしながら、埋め込み空間における拡散を完全に連続的に維持する2段階のフレームワークである。
LM1BとOpenWebTextの実験は、CoDARが潜伏拡散よりも生成品質を大幅に改善することを示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:05:15 GMT)
Breaking the Prototype Bias Loop: Confidence-Aware Federated Contrastive Learning for Highly Imbalanced Clients [17.3] CAFedCLは、プロトタイプアグリゲーション機構を改善し、プロトタイプによってガイドされるコントラストアライメントを強化する新しいフレームワークである。
CAFedCLは、精度とクライアントの公正性の両方において、代表的連合ベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:01:08 GMT)
TinyIceNet: Low-Power SAR Sea Ice Segmentation for On-Board FPGA Inference [17.0] 両極化Sentinel-1 SAR画像からのSOD(Stage of Development)マッピングのための,コンパクトなセマンティックセグメンテーションネットワークTinyIceNetを提案する。
TinyIceNetは、SAR対応アーキテクチャ単純化と低精度量子化を組み合わせて、精度と効率のバランスをとる。
実験の結果、TinyIceNetはSODセグメンテーションにおいて75.216%のF1スコアを達成し、フル精度GPUベースラインと比較して消費電力を2倍削減した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:21:00 GMT)
Rethinking Code Similarity for Automated Algorithm Design with LLMs [16.9] 大言語モデルに基づく自動アルゴリズム設計(LLM-AAD)は、専門家レベルのアルゴリズムのコード実装を自律的に生成することでアルゴリズム開発を変革した。
本稿では,問題解決行動のレンズを通して,アルゴリズムの類似性を測定する新しい手法であるBehaveSimを提案する。
動的時間ワープ(DTW)を使用してPSTrajs間のアライメントを定量化することにより、BehaveSimは、構文的あるいは出力レベルの類似性にもかかわらず、分岐論理によるアルゴリズムを区別する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:25:53 GMT)
CoPeP: Benchmarking Continual Pretraining for Protein Language Models [16.8] 本稿では,タンパク質言語モデルベンチマークの継続事前学習について紹介する。
我々は31のタンパク質理解タスクにおけるpLM性能を評価するための指標を定義した。
我々は,リプレイ,未学習,可塑性に基づく手法など,連続的な学習文献からいくつかの手法を評価する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:50:01 GMT)
Overlapping Domain Decomposition for Distributed Pose Graph Optimization [16.7] ROBOは、ポーズグラフ最適化(PGO)のための分散並列アプローチである
隣接するロボット間で追加のポーズ情報を共有することで、基礎となるポーズグラフに重複する最適化ブロックを効果的に生成する。
ロボット間の平均データコストが1イテレーションあたり36Kbと重なると、最先端の分散PGOアプローチよりも3.1$times$高速になることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:12:56 GMT)
Conversational Learning Diagnosis via Reasoning Multi-Turn Interactive Learning [16.6] ParLDは、会話学習診断のためのプレビュー・アナライズ・レアソンフレームワークである。
マルチエージェントコラボレーションを用いて、学生の認知状態を複数の対話ターンで診断する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:29:00 GMT)
Causal Learning Should Embrace the Wisdom of the Crowd [16.6] 本稿では,急速に進歩する技術に支えられた新しいパラダイムの出現に向けて,因果学習が準備されていることを論じる。
このパラダイムは、データ収集のためのスケーラブルなクラウドソーシングプラットフォーム、専門家の意見モデリングのためのインタラクティブな知識導入、専門家の和解のための堅牢な集約技術、AIによる情報獲得を促進するための大規模言語モデル(LLM)ベースのシミュレーションを統合する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:19:24 GMT)
Optimal trajectory-guided stochastic co-optimization for e-fuel system design and real-time operation [16.6] MasCORは機械学習支援の共同最適化フレームワークである。
グローバルな運用軌道から学び、e燃料生産システムの共同最適化を行う。
実用可能な設計空間の迅速スクリーニングとそれに対応する運用方針を実現する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:00:39 GMT)
When Shallow Wins: Silent Failures and the Depth-Accuracy Paradox in Latent Reasoning [16.5] 信頼性と信頼性の低い予測を混合することにより,最先端モデル(Qwen2.5-Math-7B)の精度が61%向上することが実証された。
正しい予測の18.4%は安定で忠実な推論を採用しており、81.6%は計算的に一貫性のない経路を通して現れる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:43:36 GMT)
Towards Parameter-Free Temporal Difference Learning [16.5] 時間差(TD)学習は、強化学習における価値関数を推定するための基本的なアルゴリズムである。
線形関数近似を用いたTDの最近の有限時間解析は、その理論収束率を定量化する。
指数的なステップサイズスケジュールを持つ正規化TD(0)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:49:19 GMT)
Structure-Aware Text Recognition for Ancient Greek Critical Editions [16.4] 本稿では,古代ギリシアの批判版に対する構造対応テキスト認識について検討する。
TEI/XMLソースから生成される185,000ページ画像の大規模な合成コーパスを,タイポグラフィとレイアウトの変動を制御して導入する。
ゼロショット型と微調整型の両方の条件下で,最先端の3つのビジュアル言語モデルを評価する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:42:43 GMT)
ShareVerse: Multi-Agent Consistent Video Generation for Shared World Modeling [16.3] 本稿では,マルチエージェント共有ワールドモデリングを実現するビデオ生成フレームワークであるShareVerseについて述べる。
CARLAシミュレーションプラットフォーム上に,大規模インタラクティブな世界モデリングのためのデータセットを構築した。
本研究では,より広い環境をモデル化する独立エージェントの4視点映像の空間結合戦略を提案する。
我々は,エージェント間の空間的時間情報の対話的伝達を可能にする,事前訓練されたビデオモデルにエージェント間注意ブロックを組み込む。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:41:12 GMT)
OneRanker: Unified Generation and Ranking with One Model in Industrial Advertising Recommendation [16.3] 生成とランキングのアーキテクチャレベルでの深い統合を実現するOneRankerを提案する。
我々は、粗大できめ細かな協調目標認識機構を構築する。
TencentのWeiXinチャネル広告システムへの完全な展開は、主要なビジネス指標を大幅に改善したことを示している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:50:22 GMT)
Spatial Autoregressive Modeling of DINOv3 Embeddings for Unsupervised Anomaly Detection [15.9] DINOモデルは、教師なし異常検出(UAD)において、最近強力なパフォーマンスを実現したリッチなパッチレベル表現を提供する。
既存のほとんどの手法では、パッチ間の空間的および近傍的な関係を無視して、通常の画像からパッチ埋め込みを抽出し、それらを個別にモデル化する。
本稿では,2次元自己回帰(AR)モデルを用いて,パッチ埋め込み間の空間的および文脈的依存関係を明示的にモデル化するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:30:33 GMT)
SPARC: Spatial-Aware Path Planning via Attentive Robot Communication [15.7] 既存の学習コミュニケーション手法は, 空間的近接によらず, 隣り合うロボットを均等に扱うことができ, コーディネートが最も重要となる密集した地域では, 注意が希薄になる。
本稿では,マンハッタンの対角距離を注目重みに埋め込む通信機構RMHAを提案する。
RMHAは、30%の障害物密度で成功率を約75%達成し、最高のベースラインを25%以上上回っている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:40:20 GMT)
CAPT: Confusion-Aware Prompt Tuning for Reducing Vision-Language Misalignment [15.6] CLIPのような視覚言語モデルは、視覚的および意味論的に類似したカテゴリの体系的な分類に苦しむ。
そこで本研究では,モデルが自身のミスアライメントから学習することを可能にする,Confusion-Aware Prompt TuningフレームワークであるCAPTを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:20:23 GMT)
PSQE: A Theoretical-Practical Approach to Pseudo Seed Quality Enhancement for Unsupervised Multimodal Entity Alignment [15.6] 擬似種子の精度とグラフカバレッジバランスを改善するためにPSQE(Pseudo-Seed Quality Enhancement)を提案する。
理論解析により、擬似種子が既存のコントラスト学習に基づくMMEAモデルに与える影響が明らかになった。
実験結果から,PSQEをプラグ・アンド・プレイモジュールとして用いることで,ベースラインの性能をかなりのマージンで向上できることが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:13:30 GMT)
HoMMI: Learning Whole-Body Mobile Manipulation from Human Demonstrations [15.6] Whole-Body Mobile Manipulation Interface (HoMMI)は、ロボットのない人間のデモから直接、全身のモバイル操作を学習する。
我々は、モバイル操作に必要なグローバルコンテキストをキャプチャするために、エゴセントリックな感覚でUMIインタフェースを拡張する。
私たちはこのギャップを、クロス・エボディメント・ハンド・アイ・ポリシー設計で明示的に埋めます。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:36:49 GMT)
TAO-Attack: Toward Advanced Optimization-Based Jailbreak Attacks for Large Language Models [15.5] 大規模言語モデル(LLM)は、様々なアプリケーションで顕著な成功を収めたが、ジェイルブレイク攻撃には弱いままである。
本稿では,新しい最適化手法であるTAO-Attackを提案する。
TAO-Attackは最先端の手法を一貫して上回り、攻撃の成功率を高め、特定のシナリオで100%に達する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:25:53 GMT)
iGVLM: Dynamic Instruction-Guided Vision Encoding for Question-Aware Multimodal Understanding [15.3] iGVLMは命令誘導視覚変調のためのフレームワークである。
iGVLMは多言語バックボーン間の命令感度を一貫して向上することを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:49:41 GMT)
Towards an Incremental Unified Multimodal Anomaly Detection: Augmenting Multimodal Denoising From an Information Bottleneck Perspective [15.3] 我々は,Mambaデコーダと情報ボトルネック融合モジュールの相補的利点を利用する,IB-iumADと呼ばれる新しいデノナイズフレームワークを導入する。
MVTec 3D-ADとEyecandiesのデータセットに関する一連の理論的分析と実験は、IB-iumADの有効性と競争性能を示している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:58:35 GMT)
Gated Differential Linear Attention: A Linear-Time Decoder for High-Fidelity Medical Segmentation [15.3] PVT-GDLAはデコーダ中心のトランスフォーマーで、線形時間でシャープで長距離の依存関係を復元する。
これは、CT、MRI、超音波、皮膚内視鏡のベンチマークで同等のトレーニング予算で最先端の精度を達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:26:08 GMT)
Addressing Missing and Noisy Modalities in One Solution: Unified Modality-Quality Framework for Low-quality Multimodal Data [15.2] マルチモーダルな感情コンピューティングのための低品質表現を強化するために,統一モダリティ品質(UMQ)フレームワークを提案する。
UMQは、完全な、欠落した、ノイズの多いモダリティの設定の下で、複数のデータセットにおける最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:38:13 GMT)
AOI: Turning Failed Trajectories into Training Signals for Autonomous Cloud Diagnosis [15.1] 大規模言語モデル(LLM)エージェントは、SRE(Site Reliability Engineering)を自動化するための有望なデータ駆動型アプローチを提供する
本稿では,セキュリティ制約下での構造化軌道学習問題として,自動操作を定式化したトレーニング可能なマルチエージェントフレームワークAOIを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:57:33 GMT)
CMoE: Contrastive Mixture of Experts for Motion Control and Terrain Adaptation of Humanoid Robots [15.1] バニラ混合の専門家(MoE)フレームワークは、理論上多様な地形の特徴をモデル化することができる。
我々は,一段強化学習フレームワークであるCMoEを紹介した。
その結果、CMoEは高さ20cm、幅80cmの連続的な歩幅を横切ることができることがわかった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:06:30 GMT)
FEAST: Retrieval-Augmented Multi-Hierarchical Food Classification for the FoodEx2 System [14.9] 本稿では,FoodEx2分類を3段階に分解する新しい検索拡張フレームワークであるFEASTを提案する。
システムの階層構造を活用して、トレーニングをガイドし、深いメートル法学習を実行することで、FEASTlearnはデータの疎さを識別的に埋め込む。
FEASTはヨーロッパのCNNベースラインF1のスコアを12-38%上回っている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:31:32 GMT)
ITO: Images and Texts as One via Synergizing Multiple Alignment and Training-Time Fusion [14.8] ITOは2つの相乗的メカニズムによる制限に対処するフレームワークである。
ITOは、分類、検索、マルチモーダルベンチマークにおいて、強いベースラインを一貫して上回ることを示す。
解析の結果,複数のアライメントが識別力を駆動するのに対して,トレーニング時核融合は重要な構造正則化器として機能することがわかった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:08:53 GMT)
CoFL: Continuous Flow Fields for Language-Conditioned Navigation [14.4] CoFLは、鳥眼ビュー(BEV)観察と言語指導をナビゲーションのための連続フローフィールドにマッピングするエンドツーエンドのポリシーである。
混合分布の訓練により、CoFLはモジュラービジョン・ランゲージ・モデル(VLM)ベースのプランナーよりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:02:55 GMT)
Towards Accurate and Interpretable Time-series Forecasting: A Polynomial Learning Approach [14.3] 時系列予測は早期警告を可能にし、アセットパフォーマンス管理を従来の計画されたメンテナンスから予測的なメンテナンスへと駆り立てた。
予測方法における解釈可能性の欠如は、ユーザの信頼を損なうとともに、開発者の複雑さを損なう。
本稿では,モデル構造に解釈可能性を統合する,解釈型学習(IPL)手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:59:46 GMT)
Think-as-You-See: Streaming Chain-of-Thought Reasoning for Large Vision-Language Models [14.2] ビデオデータのストリーミング特性に触発されて,LVLMのストリーミング推論パラダイムを2つ検討する。
ストリーミング入力の整合性を向上するために,真の並列推論を可能にする統合フレームワークである textbfThink-as-You-See (TaYS) を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:24:55 GMT)
SafeCRS: Personalized Safety Alignment for LLM-Based Conversational Recommender Systems [14.2] 我々は、パーソナライズされた安全制約に違反して、レコメンデーションアウトプットがユーザに悪影響を及ぼす未発見の脆弱性を特定する。
我々は、この課題をパーソナライズされたCRS安全性として形式化し、新しいベンチマークデータセットであるSafeRecを導入します。
Safe Supervised Fine-Tuning と Safe Group reward-Decoupled Normalization Policy Optimization を統合したSafeCRS を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:46:53 GMT)
Understanding the Dynamics of Demonstration Conflict in In-Context Learning [14.1] インコンテキスト学習により、大規模な言語モデルでは、数発のデモで新しいタスクを実行できる。
我々は,ルール推論として特徴付けるプロセスである,基礎となるパターンを推論するモデルを必要とする実演依存タスクについて検討する。
モデルが1つのデモからかなり性能劣化に悩まされていることが分かりました。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:00:33 GMT)
Revealing Positive and Negative Role Models to Help People Make Good Decisions [14.1] エージェントがソーシャル・ネットワークにおける役割モデルに従うことによって行動を起こす環境を考える。
我々は,役割モデルが肯定的か否定的であるかを明らかにすることによって,エージェントを支援するソーシャルプランナーの戦略を研究する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:55:26 GMT)
Proactive Guiding Strategy for Item-side Fairness in Interactive Recommendation [13.6] 既存のアプローチは、推奨結果に直接組み込むことで、ロングテールアイテムの露出を促進する。
これにより、ユーザの嗜好と推奨のロングテールアイテムの相違が生じ、長期のユーザエンゲージメントを阻害し、レコメンデーションの有効性を低下させる。
本稿では,階層的強化学習を活用してユーザの好みを徐々にロングテールアイテムに導くインタラクティブな推薦フレームワークHRL4PFGを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:32:42 GMT)
AuditBench: Evaluating Alignment Auditing Techniques on Models with Hidden Behaviors [13.6] AuditBenchは56の言語モデルで構成され、隠れた振る舞いが組み込まれている。
AuditBenchモデルは極めて多種多様で、微妙なものもあれば、過剰なものもある。
AuditBenchの実用性を実証するため,監査ツール群を自律的に活用する調査エージェントを開発した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:42:39 GMT)
SUN: Shared Use of Next-token Prediction for Efficient Multi-LLM Disaggregated Serving [13.5] Shared Use of Next-Token Prediction (SUN)は、非集約型マルチLLMサービスにおけるデコード実行のクロスモデル共有を可能にする最初のアプローチである。
SUNはデコーダのみのトランスフォーマーをプリフィルモジュールとデコードモジュールに分解し、タスク固有のプリフィルモジュールのみを微調整する。
SUNは、より少ないデコードワーカーでシステムのスループットを維持しながら、フル微調整に匹敵する精度を実現している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:54:02 GMT)
ShipTraj-R1: Reinforcing Ship Trajectory Prediction in Large Language Models via Group Relative Policy Optimization [13.4] 本稿では,テキスト・テキスト生成問題として船の軌道予測を再構築する新しい枠組みを提案する。
提案したShipTraj-R1は,最先端のディープラーニングやLLMベースのベースラインと比較して誤差が最小である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:48:40 GMT)
Tucano 2 Cool: Better Open Source LLMs for Portuguese [13.3] 0.5-3.7億のパラメータを持つ大規模言語モデル(LLM)の完全なオープンスイートであるTucano 2を紹介します。
データセットであるGigaVerbo-v2を、新たな品質とスケールに拡張しています。
我々は、GigaVerbo-v2の欠落を埋めるために、新しい合成データセットGigaVerbo-v2 Synthを導入する。
Tucano 2に関連するすべてのアーティファクトは、トレーニングレシピ、ログ、ソースコードを含む、公開リリースされている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:56:50 GMT)
CodecFlow: Efficient Bandwidth Extension via Conditional Flow Matching in Neural Codec Latent Space [13.3] 音声帯域拡張は、低帯域音声に対して適切な高周波コンテンツを再生/推論することにより、明瞭さと知性を向上させる。
既存の手法はしばしばスペクトログラムや波形モデリングに依存しており、高い計算コストを発生させ、高周波の忠実度を制限できる。
我々は、コンパクトな潜在空間で効率的な音声再構成を行うニューラルネットワークベースのBWEフレームワークであるCodecFlowを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:49:12 GMT)
ParEVO: Synthesizing Code for Irregular Data: High-Performance Parallelism through Agentic Evolution [13.1] ParEVOは不規則データのための高性能並列アルゴリズムを合成するフレームワークである。
ParEvalベンチマークでは、ParEVOは平均106倍のスピードアップ、複雑な不規則グラフ問題に対する堅牢な13.6倍のスピードアップを達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 01:41:07 GMT)
HateMirage: An Explainable Multi-Dimensional Dataset for Decoding Faux Hate and Subtle Online Abuse [13.0] 我々は、Faux Hateコメントの新しいデータセットであるHateMirageを紹介する。
各コメントは、Target、Intent、Implicationの3つの解釈可能な次元に沿って注釈付けされる。
ROUGE-L F1とSentence-BERTの類似性を用いて,HateMirage上の複数のオープンソース言語モデルをベンチマークし,コヒーレンスの評価を行った。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:26:53 GMT)
Robust Heterogeneous Analog-Digital Computing for Mixture-of-Experts Models with Theoretical Generalization Guarantees [12.7] Sparse Mixture-of-Experts (MoE) モデルは入力あたりのエキスパートの小さなサブセットのみを活性化するが、その膨大なパラメータ数は推論中にかなりのメモリとエネルギーの非効率をもたらす。
本稿では,AIMCハードウェア上で多くの専門家が実行される一方で,ノイズに敏感な専門家をデジタル的に計算する,リトレーニングフリーな異種フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:00:57 GMT)
Rate-Fidelity Tradeoffs in All-Photonic and Memory-Equipped Quantum Switches [12.7] 量子エンタングルメントスイッチは、初期の量子ネットワークにとって重要なビルディングブロックである。
量子ビットを格納せずにベル状態測定(BSM)を繰り返し試みる全フォトニックエンタングルメント生成スイッチ(EGS)と、エンタングルメントをバッファリングし、有意な接続が可能な場合にのみ測定をトリガーする量子メモリ装備スイッチの2つのアーキテクチャを比較した。
両モデルを共通のハードウェア抽象化の下で形式化し、達成可能なレート忠実度領域を特徴付け、ハードウェアとプロトコルパラメータをネットワークレベルの性能に変換するベンチマーク手法を作成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:30:06 GMT)
Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers [12.5] 動画拡散変換器(DiT)は、動きを含むテキスト記述から高い忠実度で高品質な映像を合成している。
本稿では,ある運動概念に対して,対象物がいつ,いつ動くかを規定する具体的な運動特徴について検討する。
動作を空間的かつ時間的に局所化する解釈可能な動き検出マップ(IMAP)を得るための動き特徴選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:20:42 GMT)
Sampling-Based Motion Planning with Scene Graphs Under Perception Constraints [12.5] 本稿では,多目的監視制約付き高DoFロボットにおける知覚認識型動作計画の問題点について論じる。
我々は、複数の物体や人間を直接観察する知覚コストをハイDoFロボットのモーションプランニングに直接統合するロードマップベースのモーションプランナMOPS-PRMを提案する。
本手法はシミュレーションおよび実世界の実験において広範囲に検証され,検出対象数の平均36%以上の改善が達成された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:46:00 GMT)
Less Noise, Same Certificate: Retain Sensitivity for Unlearning [12.3] Certified Machine Unlearningは、データセット$S$でトレーニングされたモデルから、削除セット$U$の影響を確実に除去することを目的としている。
多くの既存の認証済みの未学習手法は、差分プライバシー(DP)の手法に適応し、グローバルな感度に調整されたノイズを追加する。
このDPスタイルの校正は、未学習では過度に保守的であることが示されている。
この区別によって、我々はセマンティクスを、$R$を固定しながら、削除した$U$よりも最悪のケースの出力変更として定義する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:21:38 GMT)
Learning Demographic-Conditioned Mobility Trajectories with Aggregate Supervision [12.3] ATLASは, (i) 人口統計ラベルのない個々の軌跡, (ii) 地域レベルの集合的移動特性, (iii) 国勢調査データからの地域レベルの人口構成を用いて, 人口統計条件付き軌跡生成の弱い制御手法である。
我々は,ATLASがいつ,なぜ機能するのかを理論的に分析し,地域ごとの多様性や,集合的特徴の有意性などの重要な要因を同定する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:57:44 GMT)
SpatialText: A Pure-Text Cognitive Benchmark for Spatial Understanding in Large Language Models [12.3] 遺伝的空間推論は、コヒーレントな内部空間表現の構築と操作能力に依存している。
既存のベンチマークでは、この固有の空間認識を統計言語から分離することができない。
本研究では理論駆動型診断フレームワークであるSpatialTextを紹介する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:52:40 GMT)
Demystifying Group Relative Policy Optimization: Its Policy Gradient is a U-Statistic [12.3] 相対的ポリシー最適化はDeepSeekMathとDeepSeek-R1の中核となる方法論的コンポーネントである。
本稿では,従来のU-統計学のレンズを通してGRPOを理解するための統一的な枠組みを提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:46:35 GMT)
Differentiable Time-Varying IIR Filtering for Real-Time Speech Denoising [12.2] 我々は100万のパラメータを持つ低遅延音声強調モデルであるTVF(Time-Varying Filtering)を提案する。
TVFは従来のフィルタリングと現代のニューラルスピーチモデリングのギャップを埋める。
モデルは、軽量ニューラルネットワークのバックボーンを使用して、微分可能な35バンドIIRフィルタカスケードの係数をリアルタイムで予測する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:31:36 GMT)
Reproducing and Comparing Distillation Techniques for Cross-Encoders [12.1] 我々は, ciptschlattRankDistiLLMClosingEffectiveness2025 LLMベースの蒸留戦略を再現し, citethofstatterImprovingEfficientNeural 2020アプローチと比較した。
ドメイン内モデル(TREC-DL, MSMARCO dev)とドメイン外データセット(BEIR, LoTTE, Robust04)の両方ですべてのモデルを評価する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:09:49 GMT)
SIGMark: Scalable In-Generation Watermark with Blind Extraction for Video Diffusion [11.9] 目に見えない透かしは、AIが生成した動画を保護し、有害なコンテンツを追跡するための重要な技術であり、AIの安全性において重要な役割を果たす。
既存の世代のアプローチは盲目ではなく、すべてのメッセージキーペアを維持し、抽出中にテンプレートベースのマッチングを実行する必要がある。
ビデオ拡散のためのブラインド抽出機能を備えたスケーラブルなインジェネレーション・ウォーターマーキングフレームワークであるSIGMarkを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:33:44 GMT)
Adapting Time Series Foundation Models through Data Mixtures [11.9] 時系列基礎モデル(TSFM)は、ゼロショット予測においてますます人気が高まっている。
事前トレーニングセットで完全にカバーされていない新しい時系列ドメインでは、パフォーマンスが損なわれる可能性がある。
ベイズ混合を用いてデータを再分割するMixFTを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:38:54 GMT)
An Empirical Analysis of Calibration and Selective Prediction in Multimodal Clinical Condition Classification [11.6] マルチラベル臨床条件分類における不確実性に基づく選択予測の信頼性を実証的に評価した。
高い標準評価基準にもかかわらず、選択的予測は性能を著しく低下させる可能性がある。
この失敗は、厳密なクラス依存の誤校正によって引き起こされ、モデルが正しい予測に高い不確実性を割り当て、誤った予測に低い不確実性を割り当てる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:16:44 GMT)
Piecing Together Cross-Document Coreference Resolution Datasets: Systematic Dataset Analysis and Unification [11.5] CDCRの研究は、異質なデータセットフォーマット、様々なアノテーション標準、およびイベントコア参照解決(ECR)としてのCDCR定義の優位性により、依然として断片化されている。
UCDCRは、様々なドメインで利用可能な多種多様な英語CDCRコーパスを一貫したフォーマットに統合する統合データセットである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:12:08 GMT)
Quantitative Monitoring of Signal First-Order Logic [11.3] Signal First-Order Logic (SFO) のためのロバストネスに基づく最初の定量的意味論を提供する。
SFOはそのような信号に対して表現力のあるリアルタイム仕様を提供するが、現時点ではBooleanセマンティクスのみで、ツールサポートはない。
これは、完全なSFOのオンライン定量モニタリングのための最初の公開プロトタイプである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:12:01 GMT)
Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values [11.2] 非矩形ロバストマルコフ決定過程を平均逆基準下で研究する。
あいまいさの集合に対して一様に、サブリニアな後悔を達成できる歴史に依存した政策が、頑健な最適化であることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:40:49 GMT)
TCG CREST System Description for the DISPLACE-M Challenge [11.1] 本報告では, DISPLACE-M チャレンジのトラック1(話者ダイアリゼーション)における TCG CREST システム記述について述べる。
本研究では,様々な音声活動検出法と高度なクラスタリングアルゴリズムが話者ダイアリゼーション(SD)性能に与える影響について検討した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:31:08 GMT)
Low-Degree Method Fails to Predict Robust Subspace Recovery [11.1] 我々は,低度手法と低度モーメントが,アンチ集中に基づくアルゴリズムの捕捉に失敗したことを示す。
この結果は,計算障壁の予測因子としての普遍性に挑戦する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:42:13 GMT)
FiDeSR: High-Fidelity and Detail-Preserving One-Step Diffusion Super-Resolution [11.0] 本稿では,高忠実かつ細部保存のワンステップ拡散超解像フレームワークFiDeSRを提案する。
トレーニング中、モデルがより高い予測誤差を示す領域を適応的に強調する詳細対応重み付け戦略を導入する。
推論中、低周波および高周波適応型エンハンサーはモデル再トレーニングを必要とせずに再構成をさらに洗練する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:34:49 GMT)
Hybrid Orchestration of Edge AI and Microservices via Graph-based Self-Imitation Learning [10.9] SIL-GPOは、エッジAIマイクロサービスシステムのハイブリッドオーケストレーションを最適化する強化学習フレームワークである。
我々は、SIL-GPOが、最先端、メタヒューリスティック、深層RLベースラインと比較して、エンドツーエンドのサービスレイテンシを著しく低減し、リソース利用率を高めることを実証した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:54:04 GMT)
Wasserstein Proximal Policy Gradient [10.6] We study policy gradient method for continuous-action, entropy-regularized learning through the lens of Wasserstein geometry。
我々はWPPGによって実装されたヒートステップと最適なトランスポート更新を交互に行う演算子分割方式によりWWPG(Wsserstein Proximal Policy Gradient)を導出する。
我々はWPPGの線形収束率を確立し、正確なポリシー評価と制御された近似誤差によるアクター・クリティカルな実装の両方をカバーした。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:48:09 GMT)
When Small Variations Become Big Failures: Reliability Challenges in Compute-in-Memory Neural Accelerators [10.5] 安全クリティカルな推論ワークロードにおいて、小さなデバイスのバリエーションであっても、不均等に高い精度の劣化と破滅的な失敗を引き起こす可能性があることを示す。
SWIMは選択的な書き込み検証機構であり、最も影響の大きい場所のみに戦略的に検証を適用する。
最後に、学習中心のソリューションについて検討し、右利きノイズのあるネットワークをトレーニングすることで、現実的な最悪のパフォーマンスを改善する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:08:25 GMT)
A Boundary Integral-based Neural Operator for Mesh Deformation [10.5] 本稿では,境界積分とニューラル演算子に基づく効率的なメッシュ変形法を提案する。
我々のフレームワークの重要な技術的利点は、幾何学的表現から物理積分過程を数学的に分離することである。
フレキシブルビームの大きな変形やNACA翼の剛体運動を含む数値実験により、モデルが線形性や重ね合わせの原理に厳密に固執していることが確認された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:10:57 GMT)
ChemFlow:A Hierarchical Neural Network for Multiscale Representation Learning in Chemical Mixtures [10.5] ChemFlowは、原子、官能基、分子レベルの機能を統合した新しい階層型フレームワークである。
ChemFlowは濃度依存特性の予測に優れ、最先端モデルよりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:54:34 GMT)
Multi-Parameter Multi-Critical Metrology of the Dicke Model [10.4] この研究は、パラメータ推定の精度を高めるために、相転移に近い量子系の過敏性を利用する。
マルチパラメータ推定は実現可能であるが,分散精度のスケーリングも維持可能であることを示す。
我々の研究結果は、近相転移を動作させる実用的な量子センサーの道を開くものである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:06:55 GMT)
DSBA: Dynamic Stealthy Backdoor Attack with Collaborative Optimization in Self-Supervised Learning [10.3] 自己監視学習(SSL)は、広範なラベル付きデータなしで学習できる能力のおかげで、表現学習において重要なパラダイムとして登場した。
最近の研究によると、SSLモデルはバックドア攻撃にも脆弱である。
我々は,協調最適化(Collaborative Optimization)と呼ばれる新しい手法により,DSBA(Dynamic Stealthy Backdoor Attack)を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:49:46 GMT)
Q-Measure-Learning for Continuous State RL: Efficient Implementation and Convergence [10.2] 連続状態空間を持つ無限水平割引マルコフ決定過程における強化学習について検討する。
本稿では,訪問状態-行動ペアで支援された署名付き実証尺度を学習する新しいQ-Measure-Learningを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:15:22 GMT)
ForestPersons: A Large-Scale Dataset for Under-Canopy Missing Person Detection [10.1] ForestPersonsは、アンダーキャノピーな人検出用に特別に設計された、新しい大規模なデータセットである。
ForestPersonsには96,482枚の画像と204,078個のアノテーションが含まれている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:56:45 GMT)
CIRCLE: A Framework for Evaluating AI from a Real-World Lens [10.0] CIRCLEは、モデル中心のパフォーマンスメトリクスと、デプロイメントにおけるAIの実体化された結果とのギャップを埋めることを目的としている。
CIRCLEは、コンテキストに敏感な質的洞察とスケーラブルな定量的メトリクスをリンクするための構造化された予測プロトコルを提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:25:54 GMT)
Using Learning Progressions to Guide AI Feedback for Science Learning [9.9] 生成人工知能(AI)は、フォーマティブフィードバックのスケーラブルなサポートを提供する。
効果的ではあるが、ルーリックオーサリングは時間がかかり、命令コンテキスト間のスケーラビリティが制限される。
本研究では、LP駆動のルーブリック生成パイプラインが、専門家によるタスクルーブリックによるフィードバックに匹敵する品質のAI生成フィードバックを生成できるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:39:58 GMT)
Distributed Dynamic Invariant Causal Prediction in Environmental Time Series [9.8] 時系列における分散動的不変因数予測(DisDy-ICPT)を提案する。
DisDy-ICPTは時間とともに動的因果関係を学習し、データ通信を必要とせずに空間的共役変数を緩和する。
その結果,DDy-ICPTはベースライン法A,Bよりも優れた予測安定性と精度を達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:52:35 GMT)
Directional Neural Collapse Explains Few-Shot Transfer in Self-Supervised Learning [9.7] 1つの幾何学的量、遠方性CDNVは2つの望ましい行動の核にあると我々は主張する。
変数がクラス分離方向を強調した場合,両者が出現することを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:28:13 GMT)
Raising Bars, Not Parameters: LilMoo Compact Language Model for Hindi [9.7] LilMooは0.6ビリオンパラメータヒンディー語モデルである。
完全に透明で再現可能なパイプラインによって開発され、限られた計算環境向けに最適化されている。
総合的な評価スイート全体にわたって、LilMooは、相容れない大きさの多言語ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:31:25 GMT)
Nano-EmoX: Unifying Multimodal Emotional Intelligence from Perception to Empathy [9.6] 本研究では,感情的タスクを認知的深度知覚,理解,相互作用に応じて整理する3段階階層を提案する。
我々は,小型マルチタスクモデリングであるNano-EmoXと,カリキュラムベースのトレーニングフレームワークであるP2E(PerceptiontoEmpathy)を紹介する。
出力は異種アダプタを通じて統一された言語空間に投影され、様々な感情的タスクに取り組むために軽量な言語モデルに権限を与える。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:34:24 GMT)
Eval4Sim: An Evaluation Framework for Persona Simulation [9.6] Eval4Simは、人間の会話パターンといかに密にシミュレートされた会話を一致させるかを測定する評価フレームワークである。
絶対あるいは最適化指向のメトリクスとは異なり、Eval4Simは人間の会話コーパスを基準ベースラインとして使用し、両方の方向のずれを罰する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:30:50 GMT)
Hazard-Aware Traffic Scene Graph Generation [9.5] 本稿では,交通危険と自走車との間の交通特化関係を捉える新しいタスクであるトラヒックシーングラフ生成手法を提案する。
本稿では,交通事故データと奥行き情報を用いて視覚的特徴や意味情報を補足する新しいフレームワークを提案する。
出力トラフィックシーングラフは、重症度をカラーコードし、エゴ車両に対する効果メカニズムと相対的な位置を通知することで、顕著な危険を強調できる直感的なガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:29:11 GMT)
Compact Prompting in Instruction-tuned LLMs for Joint Argumentative Component Detection [9.5] ACDはArgument(ation) Mining(AM)のコアサブタスクである
本稿では,命令型大規模言語モデル (LLM) に基づく新しい手法を提案する。
標準ベンチマーク実験により,本手法は最先端システムよりも高い性能を実現することが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:32:58 GMT)
From Local Matches to Global Masks: Novel Instance Detection in Open-World Scenes [9.5] テンプレート画像の小さなセットだけを考えると、ロボットは特定のオブジェクトのインスタンスを散らかって、以前は見えなかったシーンに配置し、セグメント化しなければならない。
L2G-Detは、明示的なオブジェクト提案をバイパスする、ローカルからグローバルのインスタンス検出フレームワークである。
実験では、オープンワールド設定に挑戦する提案ベースの手法よりもパフォーマンスが向上した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:11:17 GMT)
Single Microphone Own Voice Detection based on Simulated Transfer Functions for Hearing Aids [9.4] 本稿では,単一マイクを用いた補聴器における独自の音声検出(OVD)のためのシミュレーションに基づくアプローチを提案する。
本研究では, シミュレーション音響伝達関数(ATF)に基づくデータ拡張戦略を提案する。
実験結果は、模擬ヘッド・アンド・トルソ試験データに対して95.52%の精度を示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:21:35 GMT)
Controllable Generative Sandbox for Causal Inference [9.4] CausalMixは因果推論のための変分生成フレームワークである。
安定した微粒な因果制御を提供しながら、混合型テーブル上で最先端の分散メトリクスを実現する。
転移性キャスティング抵抗性前立腺癌治療における安全性の比較検討において実用的有用性を示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:37:05 GMT)
ITLC at SemEval-2026 Task 11: Normalization and Deterministic Parsing for Formal Reasoning in LLMs [9.4] 大規模言語モデルは推論タスク、特に多言語文脈における内容効果に悩まされる。
本稿では,これらのバイアスを明示的な構造的抽象化によって低減する新しい手法を提案する。
提案手法は,全サブタスクにまたがるトップ5のランキングを達成し,コンテンツ効果を大幅に低減する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:02:45 GMT)
Next Embedding Prediction Makes World Models Stronger [9.3] 本稿では,デコーダフリーモデルベース強化学習エージェントNE-Dreamerを紹介する。
我々は、時間変換器を用いて、潜時状態列からの次のステップエンコーダ埋め込みを予測する。
DeepMind Control Suiteでは、NE-DreamerはDreamerV3と主要なデコーダフリーエージェントのパフォーマンスにマッチするか、上回っている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:04:28 GMT)
COP-GEN: Latent Diffusion Transformer for Copernicus Earth Observation Data -- Generation Stochastic by Design [9.3] 地球観測の応用は、光学、レーダー、標高、土地被覆製品を含む複数のセンサーのデータにますます依存している。
本研究では,不均一な地球観測モードの空間分解能の共分散をモデルとした潜時拡散変換器COP-GENを紹介する。
大規模なグローバルマルチモーダルデータセットの実験では、COP-GENは光学、レーダー、高度のモードで強いピーク忠実性を維持しながら、多種多様な物理的に一貫した実現を生成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:31:46 GMT)
Flow Matching-enabled Test-Time Refinement for Unsupervised Cardiac MR Registration [9.0] FlowRegは、変位場空間におけるフローマッチングフレームワークである。
わずか2ステップで強力な登録を達成し、さらなる改良とさらなるステップをサポートする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:16:56 GMT)
Look Forward to Walk Backward: Efficient Terrain Memory for Backward Locomotion with Forward Vision [9.0] エゴセントリックな前方の奥行きカメラを備えたレッグロボットは、複雑な地形で堅牢な前方のアジリティを達成するために、外的受容とプロプレセプションを結合することができる。
本研究では,効率的な地形記憶ロコモーションフレームワークであるLook Forward to Walk Backward (LF2WB)について述べる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:24:32 GMT)
ShiftLUT: Spatial Shift Enhanced Look-Up Tables for Efficient Image Restoration [8.8] ShiftLUTは、LUTベースのすべてのメソッドの中で、高い効率を維持しながら、最大の受容領域を実現する新しいフレームワークである。
従来の最先端のTinyLUTと比較して、ShiftLUTは3.8$times$大きな受容場を実現し、平均PSNRを0.21dB以上改善している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:01:47 GMT)
Detecting Structural Heart Disease from Electrocardiograms via a Generalized Additive Model of Interpretable Foundation-Model Predictors [8.8] 構造心疾患 (SHD) は多くの未診断例で一般的である。
近年の研究では、心電図(ECG)の人工知能に基づく解析がSHDを検出できることが示されている。
既存の方法は、完全にブラックボックスモデルであり、解釈可能性と臨床応用を制限する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:39:32 GMT)
COLREGs Compliant Collision Avoidance and Grounding Prevention for Autonomous Marine Navigation [8.8] 海上自家用表面船(MASS)は、海上産業における乗組員の不足、安全、および運用効率に対処するための有望な解決策としてますます見なされている。
本稿では,海上衝突防止国際規則(COLREG)の遵守と防止要件を実現するMASSの統一動作計画手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:11:26 GMT)
CoShadow: Multi-Object Shadow Generation for Image Compositing via Diffusion Model [8.7] シームレスな画像合成には多対象影生成が不可欠である。
本稿では,複数の挿入対象に対して物理的に可塑性な影を合成することを目的とする。
提案手法は,事前学習したテキスト・ツー・イメージ拡散モデルのマルチモーダル機能を利用する。
実験により,本手法は単一オブジェクトと多オブジェクトの両方のシャドウ生成設定において,最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:45:28 GMT)
LLM-MLFFN: Multi-Level Autonomous Driving Behavior Feature Fusion via Large Language Model [8.6] 本稿では,LLM-MLFFNについて述べる。
提案する LLM-MLFFN フレームワークは,大規模事前学習モデルの事前処理を統合し,分類精度を高めるためにマルチレベルアプローチを採用する。
オープントラジェクトリデータセットの評価は、提案したLLM-MLFFNの優れた性能を示し、分類精度は94%以上である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:26:04 GMT)
Confidence-aware Monocular Depth Estimation for Minimally Invasive Surgery [8.6] 内視鏡的ビデオシーケンスは、しばしば煙、特異な反射、ぼやけ、閉塞によって汚染される。
現在のMDEモデルは深度信頼を出力しないため、臨床信頼性を向上させる上で貴重なツールとなる可能性がある。
本稿では,3つの重要な貢献を特徴とする信頼性を考慮した新しいMDEフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:59:24 GMT)
GrandTour: A Legged Robotics Dataset in the Wild for Multi-Modal Perception and State Estimation [8.5] GrandTourデータセットは、屋外および屋内の挑戦的な環境にまたがって収集された、マルチモーダルな脚付きロボティクスデータセットである。
このデータセットは、回転するLiDAR、相補的な特徴を持つ複数のRGBカメラ、プロセプティブセンサー、ステレオディープカメラから、時間同期センサーデータを提供する。
このデータセットはSLAM、高精度状態推定、マルチモーダル学習の研究をサポートし、脚付きロボットシステムにおけるセンサフュージョンの新しいアプローチの厳密な評価と開発を可能にする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:08:56 GMT)
Bridging Diffusion Guidance and Anderson Acceleration via Hopfield Dynamics [8.5] 現代ホップフィールドネットワークにおける固定点反復としての注意力のモデリングによる注意空間外挿の枠組みを確立する。
本稿では,加速度過程の安定化と誘導効率の最大化を図るため,GAG(Geometry Aware Attention Guidance)を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:44:21 GMT)
CAWM-Mamba: A unified model for infrared-visible image fusion and compound adverse weather restoration [8.4] MMIF(Multimodal Image Fusion)は、様々なモダリティからの補完情報を統合して、より明瞭で情報に富んだ画像を生成する。
既存の悪天候融合法は、ヘイズ、雨、雪などの単一タイプの劣化に対処し、複数の劣化が共存すると失敗する。
本稿では,画像融合と複合気象復元を共同で行う最初のエンドツーエンドフレームワークである複合逆気象マンバを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:27:05 GMT)
XAI and Few-shot-based Hybrid Classification Model for Plant Leaf Disease Prognosis [8.4] このフレームワークは、実世界のデータ制約のある農業病モニタリングアプリケーションに有望なソリューションを提供する。
このモデルは高い精度、精度、リコール、F1スコアを連続的に達成し、様々な疾患の段階では92%を超えることがよくある。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:29:35 GMT)
On the Expressive Power of Transformers for Maxout Networks and Continuous Piecewise Linear Functions [8.2] トランスフォーマーネットワークは幅広い応用において顕著な経験的成功を遂げてきたが、理論的な表現力は未だ十分に理解されていない。
まずトランスフォーマーネットワークによる最大化ネットワークの明示的な近似を確立し,これと同等のモデル複雑性を保ったままにしておく。
その結果、トランスフォーマーは同様の複雑性制約の下でReLUネットワークの普遍近似能力を継承する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:27:15 GMT)
Minimax Optimal Strategy for Delayed Observations in Online Reinforcement Learning [8.1] 本研究では,エージェントが無作為な時間経過後に現在の状態を観察する,遅延状態観察による強化学習について検討する。
本稿では,拡張法と高信頼度バウンドアプローチを組み合わせたアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:52:24 GMT)
stratum: A System Infrastructure for Massive Agent-Centric ML Workloads [8.1] 大規模言語モデル(LLM)は、完全な機械学習(ML)パイプラインを生成し、検証し、最適化する。
既存のPythonベースのMLエコシステムは、Panda scikit-learnのようなライブラリを中心に構築されている。
パイプライン実行を計画と推論から分離する統合システムインフラストラクチャである Stratum を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:43:12 GMT)
Task Expansion and Cross Refinement for Open-World Conditional Modeling [8.1] オープンワールド条件モデリング(OCM)は、異種データセット間の任意の条件クエリに応答するために単一のモデルを必要とする。
本稿では,セマンティックデータコンテキストの構造化と改善を通じて,効果的なタスクカバレッジを拡大する半教師付きフレームワークであるタスク拡張・クロスリファインメント(TEXR)を提案する。
TEXRは、複数のOCMバックボーンに対して、ゼロ、少数、多ショットのパフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:18:51 GMT)
Graph-GRPO: Stabilizing Multi-Agent Topology Learning via Group Relative Policy Optimization [8.0] グループ相対政策最適化を統合した新しいトポロジ最適化フレームワークであるGraph-GRPOを提案する。
サンプル群全体にわたる報酬の正規化により,タスク難易度の違いによるノイズを効果的に軽減し,きめ細かなクレジット割り当てを可能にする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:45:40 GMT)
Neuro-Symbolic Artificial Intelligence: A Task-Directed Survey in the Black-Box Models Era [7.9] 行動スキーマを推論または活用するためのNeuro-Symbolic(NeSy)メソッドの能力は、人間レベルの知能のプロキシの1つとして広く考えられてきた。
2017年の最後のAIブレークスルー以来のコネクショナリストシステムによる前例のない成果は、NeSyソリューションの競争力に関する疑問を提起している。
本研究では,NeSy領域におけるタスク固有の進歩を考察し,シンボリックシステムの導入によって説明可能性や推論能力が向上する方法について検討する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:34:45 GMT)
A Robust Simulation Framework for Verification and Validation of Autonomous Maritime Navigation in Adverse Weather and Constrained Environments [7.7] 海上自律型表面船(MASS)は、航行安全、運用効率、長期費用効率を高めるための有望なソリューションとして登場した。
信頼性の高い展開には、様々な環境条件下で厳密な検証と検証(V&V)が必要である。
本稿では,現実的な海洋環境におけるMASSのV&Vを支援するための仮想シミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:25:09 GMT)
Design, Modeling and Direction Control of a Wire-Driven Robotic Fish Based on a 2-DoF Crank-Slider Mechanism [7.4] 操舵から推進を分離するクランクスライダ機構を備えたワイヤ駆動型ロボットフィッシュを開発した。
本稿では,推進と操舵の独立的な規制を実現するためのフィードフォワードフィードバック制御戦略を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:55:45 GMT)
Tracing Back Error Sources to Explain and Mitigate Pose Estimation Failures [7.3] 本稿では,特定のエラーソースに対する推定誤差を属性とするモジュール型不確実性認識フレームワークを提案する。
我々は現実世界のロボットの把握作業にフレームワークを活用している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:33:44 GMT)
Geometric structures and deviations on James' symmetric positive-definite matrix bicone domain [7.2] 我々は2つの新しい構造、フィンスラー構造と2つの情報幾何学構造を導入する。
これらの構造は、測地線が適切な座標系における直線に対応することを保証している。
これらのフィンスラー/双対ヘッセン構造のいくつかの応用について議論し、新しい相違点と伝統的な相違点の間に様々な不等式を提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:10:32 GMT)
Beyond Anatomy: Explainable ASD Classification from rs-fMRI via Functional Parcellation and Graph Attention Networks [6.9] 解剖学的脳解析は rs-fMRI に基づく自閉症スペクトラム障害 (ASD) の分類を支配している。
ABIDE Iデータセット上の解剖学的(AAL)と機能的(MSDL)パーセレーション戦略を比較したグラフベースのディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:05:20 GMT)
Intelligent Pathological Diagnosis of Gestational Trophoblastic Diseases via Visual-Language Deep Learning Model [6.9] われわれはGTD診断の専門家モデルGTDoctorを開発した。
GTDoctorは、病理スライド上でピクセルベースの病変セグメンテーションを行い、診断結果とパーソナライズされた病理解析結果を出力する。
我々はこの技術に基づいてGTDiagnosisというソフトウェアシステムを開発し,臨床試験を行った。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:48:13 GMT)
Relevance Matters: A Multi-Task and Multi-Stage Large Language Model Approach for E-commerce Query Rewriting [6.9] 本研究では,大規模言語モデル(LLM)に基づくマルチタスクおよびマルチステージクエリ書き換えフレームワークを提案する。
2025年8月以降、当社のアプローチは、中国の大手オンラインショッピングプラットフォームであるJD.comで実施されている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:18:16 GMT)
Cross-Family Speculative Prefill: Training-Free Long-Context Compression with Small Draft Models [6.9] そこで本研究では、軽量なドラフトモデルを用いて、異なるファミリーのターゲットモデルの即時圧縮を行うクロスファミリー投機プレフィルについて検討する。
注意に基づくトークン重要度推定は、異なるモデルファミリ間で確実に伝達される。
その結果、投機的プリフィルは主にタスクの先行とセマンティック構造に依存し、一般化可能なプロンプト圧縮プリミティブとして機能することが示唆された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:59:18 GMT)
From Complex Dynamics to DynFormer: Rethinking Transformers for PDEs [6.9] トランスフォーマーベースのニューラルオペレータは、強力なデータ駆動型代替手段として登場した。
動的インフォームドニューラル演算子DynFormerを提案する。
我々はDynFormerが、最先端のベースラインと比較して95%の相対誤差を削減できることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:45:09 GMT)
Convex and Non-convex Federated Learning with Stale Stochastic Gradients: Diminishing Step Size is All You Need [6.8] ローカルエージェントは、自身のデータと計算を利用して、エージェントのローカルコスト関数からなる目的を最小化するために、中央サーバを支援する。
各エージェントは、その局所的な目的の伝達バイアスと遅延推定を許される。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:09:19 GMT)
Designing with Medical Mistrust: Perspectives from Black Older Adults in Publicly Subsidized Housing [6.7] 文化に敏感な医療技術への関心は高まっているが、医療上の不信は人間中心のコンピューティングにおいてほとんど解明されていない。
人種ベースの医療不信の中心となるために,米国南部における公立補助住宅におけるインタビューを行った。
我々の反射的テーマは、認定や実施、金銭的モチベーションの懐疑論、健康AIの背景にある意図など、医療と医療の不信に関するコミュニティの視点を記述している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:50:34 GMT)
MoECLIP: Patch-Specialized Experts for Zero-shot Anomaly Detection [6.7] CLIPモデルの卓越した一般化により、ZSAD(Zero-Shot Anomaly Detection)が近年成功している。
ZSADの中核的な課題は、CLIPの強力な一般化能力を保ちながら、異常検出タスクのモデルを専門化することである。
我々は、ZSADタスクのためのMixture-of-ExpertsアーキテクチャであるtextbfMoECLIPを提案し、各画像パッチを特殊なローランド適応(LoRA)の専門家に動的にルーティングすることでパッチレベルの適応を実現する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:36:55 GMT)
Learning When to Act or Refuse: Guarding Agentic Reasoning Models for Safe Multi-Step Tool Use [6.6] エージェント言語モデルは、単一のミスステップが不可逆的な害を引き起こす可能性のあるロングホライゾンアクションを計画、呼び出し、実行しなければなりません。
安全判断を明確化し,学習可能にすることで,エージェントを安全なマルチステップツール使用に整合させるフレームワークであるMOSAICを紹介する。
以上の結果から,MOSAICは有害行為を最大50%減らし,インジェクション攻撃で20%以上減らし,プライバシリークを減らし,良質なタスク性能を保ち,改善することを示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:59:35 GMT)
Locally Coherent Parallel Decoding in Diffusion Language Models [6.6] 拡散言語モデル(DLM)は、線形生成遅延と双方向機能を提供する。
標準DLMは条件付き境界分布とは独立してトークンをサンプリングする。
並列サンプリングを局所的依存モデルと照合する手法であるCoDiLAを紹介する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:56:53 GMT)
Integrating Homomorphic Encryption and Synthetic Data in FL for Privacy and Learning Quality [6.6] フェデレートラーニング(FL)は、機密性の高いクライアントデータを共有することなく、機械学習モデルの協調トレーニングを可能にする。
本研究では、同相暗号(HE)を用いてプライバシーを保護するFLプロセスを強化する。
我々の解はAlt-FL(Alternating Federated Learning)と名付けられ, 局所学習と音響データ(authentic rounds), 局所学習と合成データ(synthetic rounds)を交互に交互に行う。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:23:29 GMT)
PRISM: Pushing the Frontier of Deep Think via Process Reward Model-Guided Inference [6.6] PRISMは、ステップレベルの検証を用いて、人口浄化とソリューションアグリゲーションの両方を導く推論アルゴリズムである。
数学や科学のベンチマークの他、PRISMは既存のDEEPTHINK法よりも優れている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:03:42 GMT)
I-CAM-UV: Integrating Causal Graphs over Non-Identical Variable Sets Using Causal Additive Models with Unobserved Variables [6.6] 観測データからの因果発見は科学の様々な分野における基本的な道具である。
1つの簡単なアプローチは、各データセットから因果グラフを推定し、重なり合うことで1つの因果グラフを構築することである。
非観測変数 (CAM-UV) を用いた因果付加モデルを用いて, 未観測変数に関する情報を有する因果グラフを提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:00:53 GMT)
Optimizing Orbital Parameters of Satellites for a Global Quantum Network [6.5] このような量子ネットワークのための衛星群の設計に焦点をあてる。
衛星傾斜角と衛星クラスター配置は, 地上局の固定セットに対して最大エンタングルメント発生率を達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:08:52 GMT)
D-GVIO: A Buffer-Driven and Efficient Decentralized GNSS-Visual-Inertial State Estimator for Multi-Agent Systems [6.5] 協調的な地域化は、共同探索や捜索救助任務のような群集アプリケーションに不可欠である。
バッファ駆動で完全に分散化されたビジュアル-慣性オドメトリーフレームワークD-GVIOを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:45:19 GMT)
Emerging trends in Cislunar Space for Lunar Science Exploration and Space Robotics aiding Human Spaceflight Safety [6.4] 月は、地表に持続的な人間の存在を可能にするために重要な最先端の技術と科学的研究を進めるための、例外のない地球外テストベッドとして登場した。
本研究は、惑星間核融合を加速させる実質的な変換ポテンシャルを持つ2つの重要な研究領域を特定し、調査する。
ひとつはLunar Science Exploration with Artificial IntelligenceとSpace Roboticsで、AIとSpace Roboticsに焦点を当てている。
第二に、宇宙ロボティクスは月への有人宇宙飛行を補助し、宇宙開発前のインフラ開発、現地資源利用、表面運用支援、宇宙飛行士の安全確保のための重要な資産として機能する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:32:33 GMT)
FlexGuard: Continuous Risk Scoring for Strictness-Adaptive LLM Content Moderation [6.3] リスク重大度を反映した校正連続リスクスコアを出力するLDMベースのモデレータであるFlexGuardを紹介する。
スコアと重大性の整合性を改善するために、リスク調整最適化を通じてFlexGuardをトレーニングします。
FlexBenchと公開ベンチマークの実験では、FlexGuardはモデレーションの精度を向上し、厳密性の変化の下でロバスト性を大幅に改善している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:48:07 GMT)
EvoSkill: Automated Skill Discovery for Multi-Agent Systems [6.3] エージェントスキルを自動的に発見・洗練する自己進化型フレームワークである textbfEvoSkill を紹介する。
EvoSkillは実行障害を分析し、新しいスキルや既存のスキルへの編集を提案し、それらを構造化された再利用可能なスキルフォルダに実体化する。
われわれはEvoSkillを米国財務データの根拠となる推論ベンチマークであるOfficeQAと、ノイズの多い検索ベンチマークであるSealQAの2つのベンチマークで評価した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:07:22 GMT)
Safe and Robust Domains of Attraction for Discrete-Time Systems: A Set-Based Characterization and Certifiable Neural Network Estimation [6.3] 頑健な不変集合 (RIS) を引き付ける非線形系の解析には、それらのアトラクション領域 (DOA) を推定する必要がある。
離散時間非線形不確実系に対する安全(状態制約付き)かつロバストなDOAの正確な推定のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:26:06 GMT)
Architecting Trust in Artificial Epistemic Agents [6.1] 我々は、知識創造、キュレーション、合成の実践に対するAIエージェントの潜在的影響は、AIの評価とガバナンスのシフトを必要とすると主張している。
本稿では,情緒的AIエージェントの信頼性の構築と育成を目的としたフレームワークを提案する。
この規範的なロードマップは、将来のAIシステムが堅牢で包括的な知識エコシステムにおいて信頼できるパートナーとして機能することを保証するための道筋を提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:12:33 GMT)
Understanding and Mitigating Dataset Corruption in LLM Steering [6.0] 本研究では, ノイズや逆データ破損に対するコントラッシブ・ステアリングの堅牢性について検討する。
操舵方向の学習における重要なステップは、高次元平均計算である。
このステップを、最近開発された堅牢な平均推定器で置き換えることによって、悪質な汚職の望ましくない影響の大部分を軽減できることが示されています。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:00:49 GMT)
Retrieval-Augmented Robots via Retrieve-Reason-Act [5.9] 我々は、ロボットが受動的執行者からアクティブな情報検索ユーザーへと進化する必要があると主張している。
以前のデモが存在しない厳密なゼロショット設定では、ロボットは重要な情報ギャップに直面している。
このパラダイムをRetrieval-Augmented Robotics (RAR) と定義し,ロボットに情報探索機能を持たせる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:32:15 GMT)
Sharing is caring: Attestable and Trusted Workflows out of Distrustful Components [5.6] 私たちは、機密性と信頼を分離する機密コンピューティングアーキテクチャであるMicaを紹介します。
Micaは、コンポーネント間のすべての通信パスを定義し、制限し、検証するための明示的なメカニズムをテナントに提供する。
我々の評価によると、Micaは信頼性の高いコンピューティング基盤をわずかに増やすだけで、現実的なクラウドパイプラインをサポートする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:53:48 GMT)
MMH-Planner: Multi-Mode Hybrid Trajectory Planning Method for UAV Efficient Flight Based on Real-Time Spatial Awareness [5.4] 本稿では, リアルタイム環境認識に基づくUAVの多モードハイブリッド軌道計画手法を提案する。
今後の環境における飛行安全性を迅速に評価する目標指向型空間認識手法を提案する。
次に,多モードハイブリッド軌道計画機構を提案し,計画効率を向上させる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:23:19 GMT)
Robust Tightly-Coupled Filter-Based Monocular Visual-Inertial State Estimation and Graph-Based Evaluation for Autonomous Drone Racing [5.3] 自律型ドローンレースのための堅牢な視覚-慣性推定フレームワークを提案する。
ADR-VINS は平均 RMS 変換 0.134 m, ADR-FGO は 0.060 m である。
最後に,ADR-FGOによる飛行後評価について述べる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:43:49 GMT)
Spectrum Shortage for Radio Sensing? Leveraging Ambient 5G Signals for Human Activity Detection [5.2] Ambient Radio Sensing (ARS) はISACのアプローチであり、無線信号を無線で再送することでスペクトルの希少性に対処する。
ARSは、受動的に通信信号を受信し、それを増幅して周囲の物体を照らし、反射した信号をキャプチャするスタンドアロンデバイスとして機能する。
我々は,ARSのプロトタイプを開発し,周辺5G信号を用いた広範囲な実験によりその有効性を検証した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:18:03 GMT)
Fuzzing Microservices in Face of Intrinsic Uncertainties [5.2] 私たちは、不確実性駆動'と'システムレベル'のマイクロサービステストという、新しいパラダイムを論じています。
連続的不確実性駆動およびシステムレベルのマイクロサービスファジリングのためのアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:12:19 GMT)
AnchorDrive: LLM Scenario Rollout with Anchor-Guided Diffusion Regeneration for Safety-Critical Scenario Generation [5.2] AnchorDriveは、2段階の安全クリティカルシナリオ生成フレームワークである。
制御可能で現実的な安全クリティカルなシナリオを生成する。
批判性、リアリズム、制御性において、全体的なパフォーマンスに優れています。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:58:14 GMT)
An Effective Data Augmentation Method by Asking Questions about Scene Text Images [5.2] 本稿では,構造化質問応答タスクによるOCRトレーニングを強化するVQAにインスパイアされたデータ拡張フレームワークを提案する。
各画像テキストペアに対して、存在、位置、頻度といった文字レベルの属性を探索する自然言語質問を生成する。
これらの補助的なタスクはよりきめ細かい推論を奨励し、OCRモデルは視覚的特徴をテキストクエリと整列させ、画像と質問を共同で推論する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:18:53 GMT)
Enhancing User Throughput in Multi-panel mmWave Radio Access Networks for Beam-based MU-MIMO Using a DRL Method [5.2] 本稿では,ミリ波無線アクセスネットワークにおけるユーザスループット向上のための深層強化学習(DRL)手法を提案する。
DRLに基づく定式化は,通信エージェントと環境間の相互作用をマルコフ決定プロセスとしてモデル化する適応ビーム管理戦略を利用する。
その結果,スループットが最大16%向上し,ベースラインに比べて3~7倍のレイテンシが低下した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:46:49 GMT)
Tell Me What To Learn: Generalizing Neural Memory to be Controllable in Natural Language [5.2] 連続的な微調整とコンテキスト内学習はコストが高く、脆弱であるのに対して、ニューラルメモリメソッドは、最小限の忘れを伴って軽量な更新を約束する。
本稿では,自然言語で指定された学習命令に基づいてフレキシブルな更新を行う汎用型ニューラルメモリシステムを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:14:53 GMT)
PinCLIP: Large-scale Foundational Multimodal Representation at Pinterest [5.2] 本稿では、Pinterestにおける検索とランキングモデルを強化するために開発された大規模視覚表現学習手法であるPinCLIPを紹介する。
本稿では、VLMバックボーンとハイブリッド融合機構を利用して、マルチモーダルコンテンツ表現をキャプチャするハイブリッドビジョントランスフォーマーアーキテクチャを提案する。
オフライン評価では、PinCLIPはQwenのような最先端のベースラインよりも20%向上している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:57:16 GMT)
QFlowNet: Fast, Diverse, and Efficient Unitary Synthesis with Generative Flow Networks [5.1] ユニタリ合成(英: Unitary Synthesis)とは、ユニタリ行列を量子ゲートの列に分解することである。
本稿では,生成フローネットワーク(GFlowNet)とトランスフォーマーをペアリングすることで,スパース信号から効率的に学習する新しいフレームワークであるQFlowNetを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:38:05 GMT)
A Browser-based Open Source Assistant for Multimodal Content Verification [5.0] 生成的AIが生み出す偽情報や偽コンテンツは、ジャーナリストやファクトチェッカーにとって大きな課題となっている。
説得技術、主観性、機械生成テキストなどの信頼性信号を検出するためのNLPモデルが多数存在する。
本稿では,このギャップを埋めるために設計されたブラウザベースのツールである VerIFICATION ASSISTANT について述べる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:39:32 GMT)
AWDiff: An a trous wavelet diffusion model for lung ultrasound image synthesis [5.0] 肺超音波(LUS)は安全かつポータブルな画像モダリティであるが、データの不足により、画像解釈と疾患モニタリングのための機械学習手法の開発が制限される。
A Trous Wavelet Diffusion (AWDiff) は、トロイスウェーブレットを統合して微細構造を保存するための拡散に基づく拡張フレームワークである。
AWDiffは既存の方法に比べて歪みが低く、知覚品質も高く、構造的忠実度と臨床多様性の両方を実証した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:57:57 GMT)
LaTeX Compilation: Challenges in the Era of LLMs [5.0] 大規模言語モデル(LLM)は、科学的な記述や制限、重要なトークンコストをますます支援している。
この論文は分析する。
効率性の限界を示すため、コンパイルとユーザエクスペリエンス設計における根本的な欠陥の1つです。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:25:47 GMT)
Think, But Don't Overthink: Reproducing Recursive Language Models [4.9] このプロジェクトはOO Zhangらによって最近提案されたRecursive Language Modelsのフレームワークを再現し拡張する。
このフレームワークは、プロンプトを外部のREPL環境にオフロードすることで、LLM(Large Language Models)がほぼ無限のコンテキストを処理することを可能にする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:36:44 GMT)
AI-for-Science Low-code Platform with Bayesian Adversarial Multi-Agent Framework [4.8] 大規模言語モデル(LLM)は、科学的コード生成を自動化する可能性を示しているが、信頼性、エラーの伝播、評価において課題に直面している。
我々は,AI for Science(AI4S)タスクを低符号プラットフォーム(LCP)の形で特別に設計したベイズ対向型マルチエージェントフレームワークを提案する。
ユーザ入力を実行可能な計画と適応テストケースに構造化するタスクマネージャ、候補ソリューションを生成するコードジェネレータ、包括的なフィードバックを提供する評価器である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:25:00 GMT)
Biased Generalization in Diffusion Models [4.6] 生成モデリングの一般化は、有限データセットから基礎となる分布を学習し、新しいサンプルを生成する能力として定義される。
実際には、テスト損失の最小限でトレーニングが停止されることがしばしばあり、一般化の運用上の指標として捉えられる。
トレーニングデータに不規則に近接するサンプルを選好しながら、モデルがテスト損失を減らし続け、トレーニング中のバイアス付き一般化のフェーズを特定することで、この視点に挑戦する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:25:33 GMT)
Identification of quantum generative circuits with parallel quantum neural network [4.6] 本稿では並列量子埋め込みニューラルネットワーク(ParaQuanNet)を提案する。
我々のParaQuanNetは、同じ種類の量子データを生成するように訓練されているにもかかわらず、99.5%の精度で生成された量子データの8つのクラスを分類することができる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:31:04 GMT)
Symmetry and Exact Solutions of General Spin-Boson Models [4.4] 一般スピンボソンハミルトニアンの対称性構造を示し、対称性を利用してそのスペクトルを明示的に得る。
2モードの場合の正確な解を数値的に示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:23:47 GMT)
Capability Thresholds and Manufacturing Topology: How Embodied Intelligence Triggers Phase Transitions in Economic Geography [4.4] 具体的AI能力は、デクスタリティ、一般化、信頼性、触覚ビジョン融合において重要なしきい値を超えたことを示す。
本稿では、物理的AI能力閾値が生産の空間的・構造的論理をどう変えるかを研究する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:55:10 GMT)
Reducing Labeling Effort in Architecture Technical Debt Detection through Active Learning and Explainable AI [4.4] Self-Admitted Technical Debt (SATD)は、自然言語のアーティファクトで開発者が明示的に認める技術的妥協を指す。
本研究では,キーワードベースのフィルタリングとアクティブラーニング,説明可能なAIを組み合わせることで,ATD検出におけるラベリングの労力を削減することに焦点を当てた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:51:54 GMT)
NeighborMAE: Exploiting Spatial Dependencies between Neighboring Earth Observation Images in Masked Autoencoders Pretraining [4.4] 近隣の地球観測画像を共同で再構成することで空間的依存関係を学習する。
本研究では,近隣の地球観測画像を共同で再構成することで空間依存を学習するNeighborMAEを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:14:50 GMT)
From Heuristic Selection to Automated Algorithm Design: LLMs Benefit from Strong Priors [4.3] 大規模言語モデル(LLM)は、アルゴリズムの自動設計に広く採用されている。
高品質なアルゴリズムコード例を提供することで、LLM駆動最適化の性能を大幅に向上できることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:27:52 GMT)
Designing UNICORN: a Unified Benchmark for Imaging in Computational Pathology, Radiology, and Natural Language [4.2] UNICORNは、統一されたプロトコルの下で医療基盤モデルを体系的に評価するために設計されたベンチマークである。
このベンチマークには、2,400人以上の患者からのデータが含まれており、そのうち3,700人以上が視力検査を受け、8か国17の機関から収集された2,400人以上の臨床報告が含まれている。
マルチタスク、マルチモダリティアセスメントの標準化により、UNICORNは医療基盤モデルの再現可能なベンチマークの基礎を確立する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:27:06 GMT)
Give me scissors: Collision-Free Dual-Arm Surgical Assistive Robot for Instrument Delivery [4.2] 手術中、スクラブ看護師は頻繁に手術器具を外科医に届ける必要がある。
既存のロボットスクラブ看護師の研究は、計器配達のための事前に定義された経路に依存している。
本稿では,機器の配送を行うことのできる,衝突のないデュアルアーム手術支援ロボットについて述べる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:14:59 GMT)
Observation of Improved Accuracy over Classical Sparse Ground-State Solvers using a Quantum Computer [4.2] 量子古典的ハイブリッドアルゴリズムは、純粋に古典的で既成の既成構成相互作用法より優れていることを示す。
IBM Heron R3プロセッサ上で動作するサンプルベースの量子対角化アルゴリズムは、同じタスクで成功する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:11:28 GMT)
MoD-DPO: Towards Mitigating Cross-modal Hallucinations in Omni LLMs using Modality Decoupled Preference Optimization [4.1] オームニLLMにおけるモーダリティグラウンドリングを改善するためのモーダリティデカップリング直接選好最適化(MoD-DPO)を提案する。
MoD-DPOは、無関係なモダリティにおける汚職への不変性、および関連するモダリティにおける摂動に対する感受性を明示的に強制するモダリティ対応正規化用語を導入している。
実験により、MoD-DPOは認識精度と幻覚抵抗を一貫して改善し、従来の優先最適化基準よりも優れていた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:50:24 GMT)
An Extensible Quantum Network Simulator Built on ns-3: Q2NS Design and Evaluation [4.0] 我々は, ns-3上に構築されたモジュール型でスケーラブルな量子ネットワークシミュレータQ2NSを紹介する。
Q2NSは統一インターフェースを通じて複数の量子状態表現をサポートする。
我々は、物理的および絡み合い可能な接続を共同でキャプチャする専用の可視化ツールを提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:05:38 GMT)
Reinforcement Learning with Symbolic Reward Machines [3.9] 本稿では,シンボリック・リワード・マシン(SRM)と学習アルゴリズムQSRMとLSRMを併用して,RMの限界を克服する手法を提案する。
SRMは環境の標準出力のみを消費し、シンボル式で表されるガードを通して観察を直接処理する。
提案手法は広く使われている環境定義に準拠し,ユーザに対してタスクの解釈可能な表現を提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:11:41 GMT)
UniSkill: A Dataset for Matching University Curricula to Professional Competencies [3.9] 欧州スキル、能力、資格、職業分類から手動で注釈付きおよび合成されたスキルのデータセットをリリースする。
我々は,大学院レベルの大学コースとシステムアナリスト・マネジメント・組織アナリストのスキルを2つの粒度で比較した。
このデータセット上で言語モデルをトレーニングし、コース・ツー・スキル・ツー・コースマッチングのための検索・レコメンデーションシステムのベースラインとして機能する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:05:57 GMT)
A Researcher's Guide to Empirical Risk Minimization [3.9] このガイドは、経験的リスク最小化における高い確率的後悔境界の参照を提供する。
直観と一般的な証明戦略から始まり、ハイレベルな条件下で広く適用可能な保証を行う。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:28:45 GMT)
Faster, Cheaper, More Accurate: Specialised Knowledge Tracing Models Outperform LLMs [3.9] 知識追跡(KT)モデルは、学生の質問応答データに基づいて訓練された、小さく、ドメイン固有の時間モデルである。
KTモデルは、この領域固有のタスクにおいて、精度とF1スコアに関して、LLM(Large Language Models)よりも優れていることを示す。
このことは、教育予測タスクにおけるドメイン固有モデルの重要性を強調している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:25:52 GMT)
Joint Training Across Multiple Activation Sparsity Regimes [3.6] ディープニューラルネットワークの一般化は、部分的にしか理解されていない。
隠れたアクティベーションにグローバルなトップk制約を適用する簡単なトレーニング戦略を導入する。
単走実験では,2つの適応型保持比制御戦略が高密度ベースライントレーニングより優れていることがわかった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:03:33 GMT)
Scalable Uncertainty Quantification for Black-Box Density-Based Clustering [3.6] クラスタリングにおける不確実性定量化のための新しいフレームワークを提案する。
マルティンゲーレ後続パラダイムと密度に基づくクラスタリングを組み合わせることで、推定密度の不確かさはクラスタリング構造に自然に伝播する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:46:49 GMT)
MaBERT:A Padding Safe Interleaved Transformer Mamba Hybrid Encoder for Efficient Extended Context Masked Language Modeling [3.6] MaBERTはハイブリッドエンコーダで、TransformerレイヤとMambaレイヤをインターリーブし、リニアな状態更新を行う。
GLUEでは、MaBERTは8つのタスクのうち5つのタスクで最高の平均スコアを獲得し、CoLAと文ペア推論タスクで高いパフォーマンスを得る。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:52:33 GMT)
calibfusion: Transformer-Based Differentiable Calibration for Radar-Camera Fusion Detection in Water-Surface Environments [3.6] CalibFusionはキャリブレーション条件のレーダー-カメラ核融合検出器である。
検出目的によって、暗黙の非本質的な洗練をエンドツーエンドに学習する。
実験では, 核融合による2次元検出と, 合成ミスキャリブレーションによるロバスト性の改善が示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:06:29 GMT)
Agentified Assessment of Logical Reasoning Agents [3.6] エージェント化された評価に基づいて、評価エージェントを使用してタスクを発行し、実行予算を強制し、アウトプットを解析し、構造化された障害タイプを記録します。
ケーススタディでは,FOLIOの一階述語論理(FOL)推論のための自動形式化エージェントのベンチマークを行った。
自動形式化剤は、アセスメントプロトコルの下で86.70%の精度を達成し、チェーンオブソートベースライン(73.89%)を上回っている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:26:08 GMT)
Grokking as a Phase Transition between Competing Basins: a Singular Learning Theory Approach [3.6] 我々は,長期トレーニング後の記憶から一般化への急激な移行であるグルーキングについて検討した。
我々は、競合する近ゼロロス溶液流域間の相転移として、二次ネットワークにおけるグラッキングを解釈する。
我々はモジュラー演算タスクで訓練された二次ネットワークにおいてLLCの閉形式式を導出し、それに対応する経験的検証を行う。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:17:30 GMT)
RAG-X: Systematic Diagnosis of Retrieval-Augmented Generation for Medical Question Answering [3.6] 本稿では,3つのQAタスクにまたがって,レシーバとジェネレータを独立に評価する診断フレームワークであるRAG-Xを提案する。
隠れ障害モードを克服することで、RAG-Xは安全で検証可能な臨床RAGシステムに必要な診断透明性を提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:55:42 GMT)
A Covering Framework for Offline POMDPs Learning using Belief Space Metric [3.5] 本稿では,信念空間の内在的メートル法構造を利用した包括的分析フレームワークを提案する。
価値関連関数が信念空間におけるリプシッツ連続であると仮定することにより、地平線とメモリ長で指数的に爆発する誤差境界を導出する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:48:20 GMT)
AlphaFree: Recommendation Free from Users, IDs, and GNNs [3.5] 我々は,ユーザ,ID,GNNの自由な新規レコメンデーション手法であるAlphaFreeを提案する。
本研究の主な目的は,ユーザ埋め込み(ユーザフリー)を伴わず,事前学習した言語モデル(IDフリー)から生のIDを言語表現(LR)に置き換えること,GNN(GNNフリー)を使わずに,類似の項目と対照的な学習による協調的信号の獲得である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:37:44 GMT)
GAIDE: Graph-based Attention Masking for Spatial- and Embodiment-aware Motion Planning [3.5] 空間と身体を意識した運動計画(GAIDE)のためのグラフベースの意識マスキングについて紹介する。
GAIDEはこれらの構造をグラフとして表現し、アテンションマスキングを通じてトランスフォーマーベースのニューラルサンプリング器に統合する。
我々は,一様サンプリング,手作りインフォメーションサンプリング,ニューラルインフォメーションサンプリングプリミティブを用いた,最先端のサンプリングベースプランナに対するGAIDEの評価を行った。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:35:16 GMT)
Ultra-low loss piezo-optomechanical low-confinement silicon nitride platform for visible wavelength quantum photonic circuits [3.4] 量子コンピューティングプロトコルは、超低損失で低密度の窒化ケイ素導波路を必要とする。
ここでは, 圧電オプトアクチュエータと低信頼, 超低損失窒化ケイ素プラットフォームを組み合わせることで, スケーラビリティの課題に対処できることを実証する。
このプラットフォームは、780mathrmnmdot$$mathrmdot$mmmmmmmmmmmmmmmmmmmmmmの伝搬損失0.026mathrmdB/cmを達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:00:01 GMT)
Real-time tightly coupled GNSS and IMU integration via Factor Graph Optimization [3.3] 固定ラグ残差化を用いたインクリメンタル最適化により因果状態推定が可能なリアルタイム密結合型IMU法を提案する。
UrbanNavデータセットを用いて、高度に都市化劣化した環境での性能を評価する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:15:30 GMT)
Real-time loosely coupled GNSS and IMU integration via Factor Graph Optimization [3.3] 位置、航法、タイミング(PNT)の重要な構成要素は地球航法衛星システム(GNSS)である。
現代の研究の方向性は、他の感覚情報と融合することで、ローカライゼーションのパフォーマンスを新たな高地に押し上げた。
因子グラフ最適化(FGO)フレームワークを用いて測定を統合化するための疎結合アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:59:55 GMT)
NeuroSkill(tm): Proactive Real-Time Agentic System Capable of Modeling Human State of Mind [3.2] NeuroSkill(tm)システムは、APIとCLIを介して人間の心の状態を記述するSKILL.mdを利用している。
当社のカスタムハーネスであるNeuroLoop(tm)は、精神状態の認知的および情緒的な複数のレベルにおいて、人間と関わります。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:06:42 GMT)
Scalable Contrastive Causal Discovery under Unknown Soft Interventions [3.2] 本稿では,2つの観測と干渉のペア化のためのスケーラブルな因果探索モデルを提案し,その基礎構造と未知のソフト介入について述べる。
合成データの実験では、因果構造回復の改善、保持された因果機構を持つ未知のグラフへの一般化、より大きなグラフへのスケーラビリティが示されている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:16:16 GMT)
Surprisal-Rényi Free Energy [3.1] 本稿では,$f$-divergencesのクラス外に存在する可能性比の対数モーメントに基づく関数であるSurprisal-Rényi Free Energy (SRFE)を紹介する。
SRFEは,一意の終点限界として分岐し,対数類似度比のばらつきが一階補正として現れるような両方の限界付近の局所展開を導出することを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:42:08 GMT)
Incremental Graph Construction Enables Robust Spectral Clustering of Texts [3.0] 隣接グラフは、テキスト埋め込みのスペクトルクラスタリングにおいて重要なステップであるが、しばしば脆弱なステップである。
簡単な$k$-NNグラフ構造を導入し、設計による接続性を維持する。
我々は,Massive Text Embedding Benchmarkから得られた6つのクラスタリングデータセットのラプラシアン固有写像を用いて,Sentence Transformer 埋め込みのスペクトルクラスタリングのアプローチを検証する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:54:22 GMT)
Expectation and Acoustic Neural Network Representations Enhance Music Identification from Brain Activity [2.9] 教師がターゲットとする音響および予測関連ANN表現の識別は,脳波に基づく音楽識別を改善することを示す。
この研究は、予測音楽認知とニューラルデコーディングの進歩に向けられている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:47:09 GMT)
Semantic Neighborhood Density and Eye Gaze Time in Human Programmer Attention [2.9] 本稿では、ソースコード中の単語に対する人間の視線時間とそれらの単語のセマンティック近隣密度(SND)との関係について検討する。
SNDは、ある単語が同じ文脈の他の単語とどのように類似しているかの尺度である。
その結果,SND が高い語は視線時間が高く,SND が少ない語が多い傾向がみられた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:51:04 GMT)
Mixed-state Phases from Higher-order SSPTs with Kramers-Wannier Symmetry [2.8] 非可逆対称性により保護された高次サブシステムSPT位相のバルク度をトレースすることで得られる混合状態位相について検討する。
その結果, この混合状態は, 対称性に保護された位相秩序とSW SSBの共存性を示すことがわかった。
また、混合状態相を特徴付けるためのプローブとしてインタフェースを使用し、具体的には、界面を横断する対称性を維持するための局所的な修正がない場合、インターフェースの2つの側面は異なる位相である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:13:06 GMT)
OCR or Not? Rethinking Document Information Extraction in the MLLMs Era with Real-World Large-Scale Datasets [2.8] 本稿では,ビジネス文書情報抽出における各種MLLMの評価を行う。
画像のみの入力はOCR強化アプローチに匹敵する性能が得られるため,強力なMLLMにはOCRは必要ない可能性が示唆された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:26:40 GMT)
Exact Functional ANOVA Decomposition for Categorical Inputs Models [2.8] ANOVAは、モデルの予測を主要な効果と高次相互作用に分解することで、解釈可能性のための原則化されたフレームワークを提供する。
独立な特徴に対して、この分解はよく定義されており、SHAP値と強く結びついており、加法的説明可能性の基礎となっている。
分類的な入力に対するこの制限を完全に解決する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:59:56 GMT)
NeuroHex: Highly-Efficient Hex Coordinate System for Creating World Models to Enable Adaptive AI [2.7] NeuroHexは、高度に効率的な世界モデルとオンライン適応型AIシステムのための参照フレームをサポートするために設計された六角形座標系である。
リングインデックス、量子化角符号化、基礎的、単純、複雑な幾何学的形状プリミティブの階層的なライブラリを組み込んだ数学的枠組みを開発する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:41:13 GMT)
Discrete-modulation continuous-variable quantum key distribution with probabilistic amplitude shaping over a linear quantum channel [2.7] 我々は、無限の鍵サイズ体制に対処し、ホモダイン検出方式を検討し、異なる距離で入力アルファベットの異なる濃度で何が起こるかを分析する。
我々のプロトコルは実験室で容易に再現できるだけでなく、GG02で提供される理論的性能に密接にアプローチする方法を提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:22:33 GMT)
A Natural Language Agentic Approach to Study Affective Polarization [2.6] 影響のある分極は政治や社会研究の中心であり、ソーシャルメディアに注目が集まっている。
ソーシャルメディアにおける情緒的偏光の研究に包括的アプローチを提供するマルチエージェントモデルを提案する。
エージェントが議論を行う仮想コミュニティを構築するために,大規模言語モデル(LLM)を活用したプラットフォームを開発する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:02:58 GMT)
RegTrack: Uncovering Global Disparities in Third-party Advertising and Tracking [2.6] サードパーティの広告と追跡(A&T)はWeb全体に広まっていますが、ユーザの露出はブラウザの選択、ブラウジングロケーション、ホスティングの管轄範囲によって大きく異なります。
分析の結果,ブラウザの選択,ユーザ位置,ホスティングの管轄区域は,それぞれ異なる方法で形状追跡を行うことが明らかとなった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:21:15 GMT)
Efficient Image Reconstruction Architecture for Neutral Atom Quantum Computing [2.6] 中性原子量子コンピュータ(NAQC)は、その長いコヒーレンス時間と優れたスケーラビリティのために多くの注目を集めている。
主な欠点の1つは、比較的時間を要するコントロールオーバーヘッドである。
ツイーザー型NAQCのための高並列原子検出加速器を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:40:24 GMT)
Practical FP4 Training for Large-Scale MoE Models on Hopper GPUs [2.6] 大規模なMixture-of-Experts(MoE)モデルのトレーニングは、アクティベーションメモリとエキスパート-並列通信によってボトルネックとなる。
4ビットのネイティブサポートを伴わないHopper上でMoEモデルのMXFP4効率を実現するためのトレーニングレシピを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:29:19 GMT)
A Novel Evolutionary Method for Automated Skull-Face Overlay in Computer-Aided Craniofacial Superimposition [2.4] リリウムは頭蓋顔面オーバーレイの精度と堅牢性を高める進化的手法である。
解剖学的、形態学的、写真的妥当性を制約の組み合わせによって強制する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:38:27 GMT)
Beyond Factual Correctness: Mitigating Preference-Inconsistent Explanations in Explainable Recommendation [2.4] LLMベースの説明可能なレコメンデータは、実際に正しい説明を作成できるが、ユーザの過去の好みと矛盾する属性を使ってアイテムを正当化することができる。
我々は、この障害モードを形式化し、選択列生成パラダイムに従う優先認識推論フレームワークPUREを提案する。
PUREはマルチホップアイテム中心の推論パスのコンパクトなセットを選択し、ユーザの嗜好構造と整合し、ユーザ意図、特異性、多様性によってガイドされ、汎用的で弱いパーソナライズされた証拠を抑える。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:24:51 GMT)
SEALing the Gap: A Reference Framework for LLM Inference Carbon Estimation via Multi-Benchmark Driven Embodiment [2.4] 大規模言語モデルは、ソフトウェアエンジニアリングにおいて急速に勢いを増していますが、その炭素フットプリントの増加は、持続可能性に関する懸念を喚起します。
本稿では, LLM推定のための新しい参照フレームワークの指針について概説する。
我々はこれらの原理の初期の具体化であるSEALを導入し、マルチベンチマーク駆動のアプローチをプロンプト単位の炭素推定に活用する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:57:27 GMT)
mHC-HSI: Clustering-Guided Hyper-Connection Mamba for Hyperspectral Image Classification [2.3] 本稿では,HSI分類の強化を目的としたクラスタリング誘導mHCマンバモデル(CalgarymHC-HSI)を提案する。
提案手法は、最先端の手法と比較してベンチマークデータセットで検証される。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:56:40 GMT)
Implicit Bias in Deep Linear Discriminant Analysis [2.3] 本稿では,Deep LDAによって誘導される暗黙の正則化に関する最初の理論的解析について述べる。
L層対角線ネットワーク上での損失の勾配流を解析することにより、バランスの取れた初期化の下で、ネットワークアーキテクチャは標準加算勾配更新を乗法重み更新に変換することを証明した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:49:24 GMT)
A medical coding language model trained on clinical narratives from a population-wide cohort of 1.8 million patients [2.3] 既存の自動化の取り組みは、現実世界の患者の不均一性を粗末に表現する小さなデータセットに依存している。
我々は、東デンマークのほぼすべての専門分野(2006-2016)で18万人の患者から得た580万の電子健康記録を言語モデルでトレーニングし、ICD-10コードを予測する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:48:38 GMT)
Evaluating Prompting Strategies for Chart Question Answering with Large Language Models [2.2] 本稿では, GPT-3.5, GPT-4, GPT-4oの4種類のプロンプトパラダイム(ゼロショット, フューショット, ゼロショットチェーン, フューショットチェーン)の体系的評価を行った。
本フレームワークは,構造化チャートデータのみを運用し,実験変数としてプロンプト構造を分離し,精度とエクササイズマッチングという2つの指標を用いて性能評価を行う。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:28:11 GMT)
Multi-Agent Influence Diagrams to Hybrid Threat Modeling [2.2] 欧米の政府は、従来の軍事水準以下の敵対行動から守るために、反ハイブリドの脅威対策を採用してきた。
これらの対策の影響は、ハイブリッド脅威のあいまいさ、そのドメイン間の性質、そして対策がどのように敵の行動を形作るかについての不確実性のため不明瞭である。
本稿では,従来のハイブリッド脅威モデリング手法を(マルチエージェント)インフルエント・ダイアグラム・フレームワークを通じて統合することにより,この影響を明らかにするための新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:17:47 GMT)
Rethinking Time Series Domain Generalization via Structure-Stratified Calibration [2.2] 実世界の環境では、データセットは動的システムの構造的に異質な族に由来することが多い。
構造的に整合性のあるサンプルを識別し、構造的に整合性のあるサンプルクラスタ内でのみ振幅校正を行う構造的階層化キャリブレーションフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:55:22 GMT)
Learning to Weigh Waste: A Physics-Informed Multimodal Fusion Framework and Large-Scale Dataset for Commercial and Industrial Applications [2.2] 本稿では,RGB画像と物体寸法,カメラ距離,カメラ高さなどの物理情報メタデータを組み合わせることで,廃棄物の重量を推定するフレームワークを提案する。
また, 物流・リサイクル現場から収集した10,421の同期画像メタデータを実世界のデータセットとして, Waste-Weight-10Kを紹介した。
提案手法は平均絶対誤差(MAE)が88.06kg、平均絶対誤差(MAPE)が6.39%、R2係数が0.9548である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:37:34 GMT)
Entanglement-Assisted Codes Outside the Stabilizer Framework [2.1] 本研究では,任意の量子符号から絡み合い支援符号を構築できることを示す。
縮退符号の場合、受信機のバイパーティイト状態のシェアを圧縮することができる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:42:12 GMT)
Quantum Theory of Functionally Graded Materials [2.1] 機能性グレード材料(FGMs)は、組成や微細構造が空間的に連続的に変化する複合材料である。
我々は、FGMの電磁特性に関するab initio量子理論の枠組みを開発する。
この枠組みは、グレード化された複合材料の予測設計のための量子基盤を定めている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:00:00 GMT)
Beyond Task Completion: Revealing Corrupt Success in LLM Agents through Procedure-Aware Evaluation [2.1] プロシージャ・アウェア・アセスメント(PAE)は、エージェント・プロシージャを構造化された観察として形式化するフレームワークである。
タウベンチにおける言語モデル(LLM)に基づくエージェントの評価を行った。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:47:41 GMT)
MAD-SmaAt-GNet: A Multimodal Advection-Guided Neural Network for Precipitation Nowcasting [2.1] 深層学習モデルは降水流の可能性を強く示しており、精度と計算効率の両方を提供している。
本稿では,MAD-SmaAt-GNet(Multimodal Advection-Guided Small Attention GNet)を紹介する。
MAD-SmaAt-GNetは平均2乗誤差(MSE)を8.9%削減し、SmaAt-UNetの4段階降水量は最大4時間前に予測される。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:32:15 GMT)
The Invisibility Hypothesis: Promises of AGI and the Future of the Global South [2.0] 我々は、高度に自律的で汎用的な認知システムが利用できることは、公平な結果を保証するものではないと論じる。
AGIは世界中のすべての人にとって、知識と不可欠なサービスへのアクセスを完全に民主化しています。
最悪の場合、既存の構造的制約は高度に増幅され、既に疎外化されている人口は、グローバルシステムとは無関係に機能的に機能する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:42:40 GMT)
Beyond Accuracy: Evaluating Visual Grounding In Multimodal Medical Reasoning [2.0] 最近の研究は、検証可能な報酬を伴うテキストのみの強化学習が、マルチモーダル医療用VQAベンチマークで画像テキストRLVRにマッチまたは上回っていることを示している。
実画像, 空白画像, シャッフル画像を用いた反事実評価フレームワークを提案する。
本稿では,視覚信頼スコア(VRS),画像感度(IS)を測定し,HVRR(Halucinated Visual Reasoning Rate)を導入し,画像不変解を生成するにもかかわらず,モデルが視覚的クレームを生成するケースを検出する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:00:05 GMT)
Deep learning-guided evolutionary optimization for protein design [2.0] 本稿では,進化的探索とベイズ最適化を組み合わせてシーケンス空間を効率的にナビゲートするフレームワークBoGAを提案する。
遺伝的アルゴリズムをサロゲートモデリングループ内に提案ジェネレータとして統合することにより、事前評価とサロゲートモデル予測に基づいて候補を優先順位付けする。
本稿では, 塩基配列および構造設計タスクのベンチマークによるBoGAの有用性を実証し, ペプチド結合体の設計への応用について述べる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:53:12 GMT)
Engineering a Governance-Aware AI Sandbox: Design, Implementation, and Lessons Learned [2.0] 産業とアカデミックにおける共同AI実験は、迅速な試行をサポートする環境を必要とする。
この作業は、構造化実験をサポートするガバナンス対応のマルチテナントAIサンドボックスを設計し、運用する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:01:56 GMT)
E2E-GNet: An End-to-End Skeleton-based Geometric Deep Neural Network for Human Motion Recognition [2.0] E2E-GNetは骨格に基づくモーション認識のためのエンドツーエンドの幾何学的ディープニューラルネットワークである。
E2E-GNetは低コストで他の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:02:10 GMT)
Analyzing the Impact of Adversarial Attacks on C-V2X-Enabled Road Safety: An Age of Information Perspective [1.9] 本稿では,NR-V2Xの資源割り当てにおける脆弱性を利用して,必要なSLRを減少させる新たな資源飢餓攻撃を提案する。
我々の分析は、ADSにおける時間感受性アプリケーションのSLRを目標から15%まで減少させることにより、この攻撃が安全でない運転条件に繋がることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:20:34 GMT)
Agentic AI-based Coverage Closure for Formal Verification [1.9] 本研究では,Large Language Model (LLM) 対応のGenerative AI (GenAI) を用いたエージェントAI駆動型ワークフローを提案する。
オープンソースおよび内部設計のベンチマークでは、カバレッジメトリクスが測定可能な増加を示し、その改善は設計の複雑さと相関している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:35:03 GMT)
On the Topology of Neural Network Superlevel Sets [1.8] 本稿では, アクティベーションを持つニューラルネットワークが, リカティ型常微分方程式条件を満たすことを示し, アーキテクチャによってのみ制御された形式を持つ解析領域上で, ファフィアン出力を生成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:30:06 GMT)
MA-CoNav: A Master-Slave Multi-Agent Framework with Hierarchical Collaboration and Dual-Level Reflection for Long-Horizon Embodied VLN [1.8] Vision-Language Navigation (VLN) は、ロボットが不慣れな環境で長距離ナビゲーションを行う能力を高めることを目的としている。
本稿では,マルチエージェント協調ナビゲーションフレームワークMA-CoNavを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:16:02 GMT)
VA-DAR: A PQC-Ready, Vendor-Agnostic Deterministic Artifact Resolution for Serverless, Enumeration-Resistant Wallet Recovery [1.7] VA-DARはACE-GFベースのウォレットのための鍵付き発見プロトコルである。
ユーザが提供する識別子と単一のリカバリパスフレーズのみを使用して、デバイス間のリカバリをサポートする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:33:10 GMT)
Passive Phase-Oriented Impedance Shaping for Rapid Acceleration in Soft Robotic Swimmers [1.7] 柔らかいロボットスイマーにおける周波数選択インピーダンス整形のための受動的機構としての拘束層制振について検討した。
我々は, 拘束推進試験において, CLDは推力を高め, ストローハル数間の力-運動相関係を変化させることを示した。
これらの結果から, ソフトロボットシステムにおける過渡的推進を改善するための簡易な制御自由経路として, 位相指向受動インピーダンス変調が確立された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:47:02 GMT)
What Capable Agents Must Know: Selection Theorems for Robust Decision-Making under Uncertainty [1.7] 我々は「選択定理」を証明し、低い「平均的な後悔」がエージェントに予測的、構造化された内部状態を実装することを強制することを示す。
後悔は、最適当量に対する確率質量を制限することを示し、高マージンな結果の分離に必要な予測的区別を強制する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:47:58 GMT)
Saarthi for AGI: Towards Domain-Specific General Intelligence for Formal Verification [1.7] SaarthiはエージェントAIフレームワークで、マルチエージェントコラボレーションを使用してエンドツーエンドの形式検証を実行する。
Saarthiフレームワークには2つの重要な拡張点がある。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:30:36 GMT)
SEP-YOLO: Fourier-Domain Feature Representation for Transparent Object Instance Segmentation [1.6] 透明なオブジェクトインスタンスセグメンテーションのための二重ドメイン協調機構を統合する新しいフレームワークであるSEP-YOLOを提案する。
本手法は周波数領域詳細拡張モジュールを組み込み,弱い高周波境界成分を分離・拡張する。
SEP-YOLOは、Trans10KおよびGVDデータセットの実験において、最先端(SOTA)性能を達成することを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:27:13 GMT)
Navigating in Uncertain Environments with Heterogeneous Visibility [1.6] 本稿では,情報収集に対する高可視位置へのデツーリングコストのバランスをとるアルゴリズムを提案する。
実世界の地形データに基づく地図を含む,不確実なナビゲーションタスクに対して,本手法を検証した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:10:28 GMT)
Timehash: Hierarchical Time Indexing for Efficient Business Hours Search [1.5] Timehashは、マイクロレベルインデックスよりも99%以上インデックスサイズを削減できる新しい階層的時間インデックスアルゴリズムである。
提案手法は,検索システム,eコマース,予約プラットフォームにおける時間的フィルタリング問題に対して一般化可能である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:49:41 GMT)
Simultaneous anti-bunched and super-bunched photons from a GaAs Quantum dot in a dielectric metasurface [1.4] 我々は、中性および荷電エキシトン遷移にまたがる秩序のマグニチュード・フォトルミネッセンス向上を提供するMie共鳴変成層に量子ドットを埋め込む。
これらの結果は、固体エミッタの完全励起構造を利用するためのスケーラブルで耐位置性のあるプラットフォームを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:45:36 GMT)
The Vienna 4G/5G Drive-Test Dataset [1.4] モバイルネットワーク分析、計画、最適化のための機械学習は、大規模で包括的な現実世界のデータセットが欠如しているため、しばしば制限される。
本稿では,オーストリアのウィーンで収集された地理基準長周期進化(LTE)と5Gニューラジオ(NR)の都市規模オープンデータセットであるウィーン4G/5Gドライブテストデータセットを紹介する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:06:24 GMT)
Generative adversarial imitation learning for robot swarms: Learning from human demonstrations and trained policies [1.4] 模倣学習では、ロボットは望ましい行動のデモンストレーションから学ぶことが求められる。
本研究では,生成的逆転模倣学習に基づくフレームワークを提案する。
実際のロボット実験では、学習したポリシーをTurtleBot 4ロボット群に展開する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:23:30 GMT)
From Language to Action: Can LLM-Based Agents Be Used for Embodied Robot Cognition? [1.4] 大規模言語モデル(LLM)は、推論や言語理解など、突発的な認知的側面を示すことが示されている。
本稿では,エージェントLLMが計画と推論のコアコンポーネントとなる認知アーキテクチャを提案する。
本研究では,エージェントの推論,計画,記憶利用の2つの課題について,提案システムの評価を行った。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:36:06 GMT)
cPNN: Continuous Progressive Neural Networks for Evolving Streaming Time Series [1.4] 本研究は,連続進行型ニューラルネットワーク(cPNN)を提案する。
cPNNのテイムコンセプトはドリフトし、時間的依存を処理し、破滅的な忘れをバイパスする。
提案手法はリカレントニューラルネットワークに基づいて,時間的依存関係に適用したデータストリームを利用する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:34:33 GMT)
GLIDE-Reg: Global-to-Local Deformable Registration Using Co-Optimized Foundation and Handcrafted Features [1.3] 我々は、登録フィールドと学習可能な次元削減モジュールを共同で最適化し、圧縮されたVFM埋め込みが登録関連性を維持する。
GLIDE-Reg は 0.859, 0.862, 0.901 の解剖学的構造に対して平均サイス類似係数 (DSC) を達成する。
目標登録エラーに対して、GLIDE-RegはLung250Mランドマークで1.58mm(corrFieldで1.25mm、DEEDSで1.91mm)を達成した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:05:53 GMT)
A Multi-Turn Framework for Evaluating AI Misuse in Fraud and Cybercrime Scenarios [1.2] 現在の大規模言語モデルが、複雑な犯罪活動に有用な情報を提供しているかは、不明である。
我々は、ドメインの専門家が評価したように、モデルがWeb上で一般的に利用可能な情報を超えて実行可能な支援を提供するかどうかを評価する。
その結果,(1)現在の大規模言語モデルは,高度なジェイルブレイク技術を用いることなく,詐欺やサイバー犯罪の最小限の情報を提供することがわかった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:14:45 GMT)
It's Alive! What a Live Object Environment Changes in Software Engineering Practice [1.2] PharoのようなSmalltalk環境では、開発者はオブジェクトと密接に連携し、すぐにフィードバックを得る。
この記事では、開発者がPharoで使用するツールを紹介します。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:41:30 GMT)
Understanding the Resource Cost of Fully Homomorphic Encryption in Quantum Federated Learning [1.2] 量子フェデレートラーニング(QFL)において、パラメータの同型暗号化が解法として提案されている。
我々は,QFLセットアップにおいてFHE(Fully Homomorphic Encryption)によって導入されたオーバーヘッドを評価し,実世界のアプリケーションへの適用性を評価する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:36:55 GMT)
mlx-snn: Spiking Neural Networks on Apple Silicon via MLX [1.2] AppleのMLXフレームワーク上に構築された最初のスパイクニューラルネットワーク(SNN)ライブラリであるmlx-snnを紹介する。
mlx-snnは6つのニューロンモデル、4つの代理勾配関数、4つのスパイク符号化方法、完全なバックプロパゲーション・スルータイムトレーニングパイプラインを提供する。
mlx-snnはMITライセンス下でオープンソースで、PyPIで利用可能である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:25:36 GMT)
ReCo-Diff: Residual-Conditioned Deterministic Sampling for Cold Diffusion in Sparse-View CT [1.2] ReCo-Diffは残留状態の拡散フレームワークであり、残留状態の自己誘導サンプリングを通じて観測残差を利用する。
実験の結果, ReCo-Diff は既存の冷拡散サンプリングベースラインより一貫して優れていた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:33:24 GMT)
Guiding Sparse Neural Networks with Neurobiological Principles to Elicit Biologically Plausible Representations [1.1] 神経生物学の原則を自然に統合する生物学的にインスピレーションを受けた学習規則を導入する。
我々のモデルは敵攻撃に対する堅牢性を高め、より優れた一般化を示す。
予備的な結果は、このアプローチが機能特化からタスク特化エンコーディングに拡張できることを示唆している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:27:37 GMT)
Post Hoc Extraction of Pareto Fronts for Continuous Control [1.1] 現実世界のエージェントはしばしば、連続制御における速度、安定性、エネルギー効率などの複数の目的のバランスをとる必要がある。
条件や好みを変えるために、エージェントは、複数の最適なトレードオフを表すポリシーのパレートフロンティアを理想的に学ぶ必要がある。
近年の多目的強化学習(MORL)の進歩により,パレートフロントを直接学習することが可能になるが,訓練開始時から完全に多目的的考察が必要である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:57:59 GMT)
Architectural HRI: Towards a Robotic Paradigm Shift in Human-Building Interaction [1.0] ヒューマン・ビルディング・インタラクション(HBI)の拡大に伴い, センシング, コミュニケーション, インターフェース, 制御, ロボット工学の進歩が進んでいる
これらの進歩はHBIのパラダイムシフトを約束し、複数のビルディング層が物理的に同期して、居住ニーズと持続可能性の目標をより均等に支援することを提案する。
このパラダイムは、ロボットを複数のアーキテクチャ層や建物として解釈するなど、従来のロボット形態にHRI知識を移行するための理想的なケースでもある、と我々は主張する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:51:23 GMT)
An HCI Perspective on Sustainable GenAI Integration in Architectural Design Education [1.0] 我々は、GenAIとの批判的な関わりは、しばしば問題となるツールの使用を増やす必要があると論じる。
建築教育におけるより持続可能なgenAI統合のための3つの方向性を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:55:33 GMT)
Sleeping Beauty in One or Many Worlds: A Defense of the Halfer Position [1.0] 睡眠美学問題(Sleeping Beauty Problem、SBP)は、古典確率論における長年のパズルである。
我々は、SBPの量子バージョンと古典バージョンの両方において、正しい信条はハーマー位置によって与えられることを示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:12:56 GMT)
A Practical Guide for Establishing a Technical Debt Management Process (Preprint) [1.0] 技術的負債(Technical Debt、TD)とは、短期的に有効なソフトウェアソリューションであり、将来の変化を妨げる。
ワークショップとふりかえりを19回実施し,30ヶ月にわたる108回のミーティング(96時間)を分析した。
ベストプラクティスの出発点として、すべてのチームが使用しているTDMアプローチを特定しました。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:28:50 GMT)
Transport Clustering: Solving Low-Rank Optimal Transport via Clustering [1.0] 我々は,低ランクOT計画の計算アルゴリズムであるトランスポートクラスタリングを導入し,低ランクOTを対応レートのフルテキスト型問題に還元する。
実験的に、トランスポートクラスタリングは、合成ベンチマークや大規模で高次元のデータセットにおいて、既存の低ランクOTソルバよりも優れています。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:12:14 GMT)
QAOA-Predictor: Forecasting Success Probabilities and Minimal Depths for Efficient Fixed-Parameter Optimization [1.0] 本稿では,グラフニューラルネットワーク(GNN)を用いた量子近似最適化アルゴリズム(QAOA)の性能予測手法を提案する。
我々は,GNNが真値の10%のマージンでQAOA性能を正確に予測できることを実証した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:43:44 GMT)
Recovery-Induced Erasure Attack on QKD Systems [0.9] 検出器デッドタイムは通常、量子鍵分布(QKD)セキュリティ解析における固定パラメータとして扱われる。
本研究では,このカウントレート依存リカバリの非線形性が,攻撃プリミティブであることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:08:56 GMT)
Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals [0.9] 受理応答は,コミュニティ固有の規範を反映した,一貫性のある高密度領域を占有することを示す。
本稿では,言語モデルとコミュニティ規範を一致させる手法である密度誘導応答最適化(DGRO)について,明示的な選好ラベルを必要とせずに紹介する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:36:25 GMT)
Improved Grid-Based Simulation of Coulombic Dynamics [0.9] 本稿では,不正確な補正を一貫して上回る2つの補完的補正手法を提案する。
提案するフレームワークは,量子コンピューティングアーキテクチャと自然に一致している。
そこで本研究では,古典的および新興量子プラットフォーム上でのクーロン力学の高精度化に向けた実践的戦略を確立する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:07:09 GMT)
Social Norm Reasoning in Multimodal Language Models: An Evaluation [0.8] MLLM(Multimodal Large Language Models)は、ロボットが標準を識別し、推論するために使用するソフトウェアを開発するための有望な可能性を示す。
本稿では,30のテキスト・ストーリーと30のイメージ・ベース・ストーリーに基づく規範的質問に対する回答能力を評価することで,5つのMLLMの規範的推論能力について検討する。
その結果,MLLMは画像よりもテキストのノルム推論において優れた性能を示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:48:21 GMT)
Blockchain Communication Vulnerabilities [0.8] 私たちは、Algorand、Aptos、Avalanche、Redbelly、Solanaの5つのモダンなプロダクションブロックチェーンの通信プロトコルの脆弱性を比較します。
我々はAlgorandがパケットロス攻撃に弱いこと、Aptosはターゲットの負荷攻撃に弱いこと、Avalancheは過渡的障害攻撃に弱いこと、Redbellyのパフォーマンスはパケットロス攻撃に影響を受けること、Solanaは攻撃の阻止とリーダアイソレーション攻撃に弱いことを結論付けている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:50:47 GMT)
Preventing Curriculum Collapse in Self-Evolving Reasoning Systems [0.8] 自己進化システムは、ほんの数回のイテレーションの後、新しい問題を引き起こすことで、多様性の崩壊を示す可能性がある。
この崩壊に直接対処する質問中心の自己進化手法であるPrismを紹介する。
Prismは、数学的問題の埋め込みによって引き起こされる意味的な分割に対して永続的な多様性信号を定義する。
セマンティックに多様性があり、イテレーション間で挑戦的な質問を生成し、その結果、Prism-Mathデータセットが構築される。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:10:35 GMT)
Does Semantic Noise Initialization Transfer from Images to Videos? A Paired Diagnostic Study [0.7] 時間結合は、テキスト・トゥ・ビデオ(T2V)生成において、余分な自由度と不安定性をもたらす可能性がある。
フリーズされたVideoCrafterスタイルのT2V拡散バックボーンと100プロンプト上のVBenchを用いて,標準ガウス雑音に対するセマンティックノイズ初期化をベンチマークする。
時間的関連次元について小さな正の傾向を観察するが、95%の信頼区間は0を含む(p0.17)。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:36:07 GMT)
Uncertainty-Aware Estimation of Mis/Disinformation Prevalence on Social Media [0.7] 本稿では,信頼区間を用いて,誤報・誤報の頻度に関する不確実性を定量化する手法を提案する。
データは2025年3月から4月にかけて、Facebook、Instagram、LinkedIn、TikTok、X/Twitter、YouTubeから収集された。
i) サンプルの不確実性, (ii) 人間の不一致と誤分類に起因するアノテーションの不確実性, (iii) キーワードベースのデータ収集によって引き起こされるデータ検索の不確実性。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:04:08 GMT)
Heterogeneous Time Constants Improve Stability in Equilibrium Propagation [0.7] 平衡伝播のためのヘテロジニアス時間ステップ(HTS)を導入する。
HTSは,競争力のあるタスク性能を維持しながら,トレーニングの安定性を向上させる。
これらの結果は、不均一時間力学を取り入れることで、平衡伝播の生物学的リアリズムとロバスト性の両方が促進されることを示唆している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:35:38 GMT)
Valet: A Standardized Testbed of Traditional Imperfect-Information Card Games [0.6] Valetは21の伝統的な不完全な情報カードゲームの多様で包括的なテストベッドである。
これらのゲームは、複数のジャンル、文化、プレイヤー数、デッキ構造、メカニック、勝利条件、情報の隠蔽と開示方法にまたがる。
ランダムシミュレーションを用いて,各ゲームの分岐係数と期間を実験的に評価し,ベンチマークスイートとしてのValetの適合性を実証する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:46:47 GMT)
An experimental study of KV cache reuse strategies in chunk-level caching systems [0.6] Retrieval-augmented generationは、関連するテキストをプロンプトに追加することで、大きな言語モデルの精度を向上させる。
チャンクレベルキャッシュ(CLC)は、取得したチャンクのKVキャッシュをプリ計算して再利用することで、推論を加速する。
既存のCLCアプローチには,その精度や適用性を制限する基本的な制限があることが示されている。
我々は,これらを慎重に組み合わせ,精度を向上する新しいLCC設計を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:20:50 GMT)
Geographically-Weighted Weakly Supervised Bayesian High-Resolution Transformer for 200m Resolution Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data [0.6] 本研究では,200m級高分解能SICマッピングのための新しい高分解能トランスフォーマ手法を提案する。
提案手法は2021年と2025年にパン・アルクティック最小限条件下で評価された。
その結果,Sentinel-1データを用いた0.70の総合的特徴検出精度が得られた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:23:11 GMT)
LiteVLA-Edge: Quantized On-Device Multimodal Control for Embedded Robotics [0.6] 本稿では,Jetson Orinクラスハードウェア上でのデバイス上での完全な推論のための,デプロイメント指向のVLAパイプラインであるLiteVLA-Edgeを紹介する。
提案手法は、FP32における教師付きイメージ・ツー・アクションの微調整と、4ビットGGUF量子化とGPU加速推論を組み合わせたものである。
我々の構成では、LiteVLA-Edgeは、完全にオフラインで動作しながら、150.5,ms(約6.6,Hz)の平均エンドツーエンドランタイムを達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:20:52 GMT)
Logit-Level Uncertainty Quantification in Vision-Language Models for Histopathology Image Analysis [0.6] 視覚言語モデル(VLM)とそのマルチモーダル能力は、ほぼすべての領域で顕著な成功を収めている。
本研究では,VLMを用いた病理組織像解析のためのロジトレベルの不確実性定量化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:21:00 GMT)
Evaluating Performance Drift from Model Switching in Multi-Turn LLM Systems [0.6] マルチターンLLMシステムは、アップグレード、クロスプロジェクタルーティング、フォールバックにより、通常、モデルの中間動作を切り替える。
本稿では,初期ターンのプレフィックスモデルと最終ターンの接尾辞モデルを実行することで,その効果を測定するスイッチ行列ベンチマークを提案する。
シングルターンのハンドオフでさえ、一般的で統計的に有意な方向効果をもたらす。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:44:57 GMT)
SorryDB: Can AI Provers Complete Real-World Lean Theorems? [0.6] SorryDBは、GitHub上の78の現実世界のフォーマル化プロジェクトから引き出されたオープンなリーンタスクのベンチマークである。
我々は,汎用的な大規模言語モデル,エージェント的アプローチ,特殊記号型プロバーなど,一連のアプローチを評価する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:55:15 GMT)
Same Error, Different Function: The Optimizer as an Implicit Prior in Financial Time Series [0.5] テスト損失が同一である異なるモデル-トレーニング-ピペリンペアは、定性的に異なる関数を学習する。
不特定設定では、最適化は帰納バイアスの連続的な源として機能する、と結論付けている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:47:19 GMT)
SynthCharge: An Electric Vehicle Routing Instance Generator with Feasibility Screening to Enable Learning-Based Optimization and Benchmarking [0.5] 既存のベンチマークデータセットは、しばしば静的であり、実現不可能である。
本稿では,多様な画面表示可能なEVRPTWインスタンスを生成するパラメトリックジェネレータであるSynthChargeを紹介する。
実験は5から100の顧客のサイズに重点を置いています。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:23:38 GMT)
Instant and Reversible Adhesive-free Bonding Between Silicones and Glossy Papers for Soft Robotics [0.4] 本研究は, 迅速, 粘着性, 溶媒可逆性接着法であるシリコーン-グロッシー紙接着法(SGB)を提案する。
SGBインターフェースは高い機械的負荷に耐え、性能を損なうことなくエタノール浸漬によって完全に取り外し、再組み立てすることができる。
SGB設計で製作された軟式アクチュエータは、従来の組込み層設計と同等以上の性能を示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 01:13:22 GMT)
Harmonic Beltrami Signature Network: a Shape Prior Module in Deep Learning Framework [0.4] Harmonic Beltrami Signature Network (HBSN)は、バイナリライクな画像からHBSを計算するための新しいディープラーニングアーキテクチャである。
ニューラルネットワークの関数近似能力を利用することで、HBSNは形状先行情報の効率的な抽出と利用を可能にする。
実験によると、HBSNは複雑な形状であっても正確にHBS表現を計算する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:00:05 GMT)
Type-Aware Retrieval-Augmented Generation with Dependency Closure for Solver-Executable Industrial Optimization Modeling [0.4] 本稿では,モデルエンティティタイプと最小限の依存性のクロージャを強制し,実行可能性を保証するタイプアウェア検索拡張生成(RAG)手法を提案する。
本手法は, 電池生産における需要応答最適化とフレキシブルなジョブショップスケジューリングという2つの制約集約型産業事例で検証する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:41:34 GMT)
Shape Derivative-Informed Neural Operators with Application to Risk-Averse Shape Optimization [0.3] Shape-DINOは、PDEソリューション演算子を学習するための微分インフォームドニューラルネットワークフレームワークである。
そこで,Shape-DINOは,微分情報なしで訓練した演算子サロゲートよりも信頼性の高い最適化結果が得られることを示す。
この例では,Shape-DINOは状態および勾配評価において3-8桁の速度アップを達成している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:06:05 GMT)
SemanticDialect: Semantic-Aware Mixed-Format Quantization for Video Diffusion Transformers [0.3] ブロック単位の最適形式(方言)を複数の候補(フォーマットブック)から選択するブロック単位の混合形式量子化を提案する。
また、注意誘導トークン選択による残差の再定量化と付加による量子化誤差を低減するアクティベーション分解も導入する。
ビデオDiT(VDiT)モデルの実験では、SemanticDialectはVDiTの量子化手法やブロックワイドフォーマットの詳細なベースラインよりも優れていた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:34:10 GMT)
3D Modality-Aware Pre-training for Vision-Language Model in MRI Multi-organ Abnormality Detection [0.3] 3次元MRIにおける視覚言語表現学習を支援するフレームワークであるMedMAPを提案する。
MedMAPは、モダリティ対応の視覚言語アライメントステージと、多臓器異常検出のための微調整ステージとを備える。
MedMoM-MRI3Dを用いた実験により,MedMAPは3次元MRIによる多臓器異常検出において既存のVLMよりも有意に優れていることが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 05:58:36 GMT)
Benchmarking Compact VLMs for Clip-Level Surveillance Anomaly Detection Under Weak Supervision [0.3] 本研究は, 視覚言語モデル (VLM) を実用的検出法として検討する。
評価は、精度、精度、リコール、F1、ROC-AUC、および検出品質と効率を共同で定量化する平均クリック毎のレイテンシにまたがる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:42:47 GMT)
Exact stabilizer scars in two-dimensional $U(1)$ lattice gauge theory [0.3] 我々は、正確な安定化状態を形成するゲージ不変零モードから派生したスカーレッド固有状態(sublattice scars)のクラスを見つける。
基礎となるハミルトニアンは安定なハミルトニアンではないが、固有スペクトルは本質的に真に安定な固有状態を持つ。
この結果は、ロクサー・キヴェルソンスペクトルのスカーレッド部分空間が固有の安定化多様体を形成することを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:57:58 GMT)
Development and Validation of a Faculty Artificial Intelligence Literacy and Competency (FALCON-AI) Scale for Higher Education [0.3] しかし、既存のAIリテラシー機器は主に一般市民、学生、K-12教師をターゲットにしている。
本研究は,FALCON-AI(Department Artificial Intelligence Literacy and competency)尺度の開発と評価を行う。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:20:33 GMT)
Witnesses of non-Gaussian features as lower bounds of stellar rank [0.3] 量子非ガウス状態と演算は普遍量子計算の基本的な資源として機能する。
非ガウス的特徴のウイットネスは、非ガウス的振る舞いを証明するためのアクセス可能な方法を提供するが、星級への直接的な関係は欠如している。
正規化期待値と分散に基づく量子化器を導入し、これらの証人が星位に対応するしきい値の一貫性のある階層を形成することを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:44:23 GMT)
Tokenization Tradeoffs in Structured EHR Foundation Models [0.2] トークン化は、どの情報が保存され、どれだけ効率的にエンコードされ、どの関係が事前に計算されなければならないかを決定する。
ここでは、事象エンコーディング、時間エンコーディング、ワークフローアノテーションに沿ったトークン化の異なる要因設計の下で、小児のERHデータにトランスフォーマーを事前学習した。
共同イベントエンコーディングと位置時間エンコーディングは、それぞれ39.5%と9.6%の事前訓練浮動小数点演算を減らした。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:48:39 GMT)
CraniMem: Cranial Inspired Gated and Bounded Memory for Agentic Systems [0.2] エージェントシステムのための,神経認知型,ゲート型,有界な多段階メモリ設計であるCraniMemについて紹介する。
クラニメムはバニラ RAG や Mem0 のベースラインよりも頑丈で、邪魔されやすい性能低下を示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:00:58 GMT)
Neural quantum support vector data description for one-class classification [0.2] 1クラス分類(OCC)は、機械学習における多くの応用における根本的な問題である。
OCCのための古典量子ハイブリッドフレームワークであるNeural Quantum Support Vector Data Description (NQSVDD)を紹介する。
NQSVDDは古典的ニューラルネットワークとトレーニング可能な量子データ符号化と変分量子回路を統合し、OCCの目的に合わせて非線形な特徴変換を学習できるようにする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 07:45:32 GMT)
OpenClaw, Moltbook, and ClawdLab: From Agent-Only Social Networks to Autonomous Scientific Research [0.2] ClawdLabは、自律的な科学研究のためのオープンソースのプラットホームだ。
文献では131のエージェントスキルと15,200以上のコントロールパネルにまたがるセキュリティ脆弱性が報告されている。
ClawdLabはこれらの障害モードに、ハードロールの制限、構造化された反対批判、PI主導のガバナンス、マルチモデルオーケストレーション、ドメイン固有のエビデンス要件を通じて対処する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:13:42 GMT)
Bayesian post-correction of non-Markovian errors in multi-mode bosonic gravimetry [0.2] L>2$モードのシステムでは,ベイズ推定を用いて誤りを修正できることが示される。
このような測定に対して有効なFisher情報として$F_texteff$を定義する。
有効フィッシャー情報はヒルベルト空間上で最適化されたときにハイゼンベルクスケーリング$F_texteff=O(N2)$を持つことを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:00:01 GMT)
NeuroProlog: Multi-Task Fine-Tuning for Neurosymbolic Mathematical Reasoning via the Cocktail Effect [0.1] 大規模言語モデル (LLM) は自然言語処理において高い性能を発揮するが、数学的推論では信頼性に欠ける。
我々は,数学用語の問題を実行可能なPrologプログラムにコンパイルすることで,検証可能な推論を保証する,ニューロシンボリックなフレームワークである textbfNeuroProlog を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 01:26:42 GMT)
Enhancing Physics-Informed Neural Networks with Domain-aware Fourier Features: Towards Improved Performance and Interpretable Results [0.1] 物理情報ニューラルネットワーク(PINN)は、偏微分方程式(PDE)を損失関数に埋め込み、ニューラルネットワークに物理を組み込む。
本研究では,入力空間の位置符号化にDAFF(Domain-Aware Fourier Features)を用いる新しいモデリング手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:55:53 GMT)
Sequence and Image Transformations with Monarq: Quantum Implementations for NISQ Devices [0.1] 我々はQCrankエンコーディングとEHandsプロトコルを組み合わせた量子データ処理フレームワークであるMonarqを紹介した。
このフレームワークは、畳み込み、離散時間変換(DFT)、二乗勾配、エッジ検出など、信号および画像処理タスクのための基本的な量子ビルディングブロックを提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:19:34 GMT)
Stabilized Adaptive Loss and Residual-Based Collocation for Physics-Informed Neural Networks [0.1] 物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式を解くためのメッシュフリーな代替手段として認識されている。
PINNには、不均衡なトレーニングやソリューションの不正確さなど、制限がある。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:17:28 GMT)
[Re] FairDICE: A Gap Between Theory And Practice [0.0] FairDICEは複雑な環境や高次元の報酬にスケール可能であることを示す。
FairDICEは理論的に興味深い手法であるが、実験的な正当化には重大な修正が必要であると結論付けている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:12:06 GMT)
Zero-Knowledge Federated Learning with Lattice-Based Hybrid Encryption for Quantum-Resilient Medical AI [0.0] Federated Learning (FL)は、患者データを集中することなく、病院全体で医療AIモデルの協調トレーニングを可能にする。
グラデーション・インバージョン・アタックは患者の情報を再構築し、ビザンチンのクライアントはグローバルモデルに毒を塗布し、emphHarvest Now, Decrypt Later(HNDL)の脅威は、今日の暗号化トラフィックを将来の量子敵に脆弱にしている。
EmphZeroKnowledge Federated Learning, Post-Quantumは、(i) ML-KEMを量子耐性キーカプセル化のためにハイブリダイズした3層暗号プロトコルで、(ii) 格子ベースのZero-Knowledge Proofsを検証可能なemph用に導入する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:43:44 GMT)
Why Does RLAIF Work At All? [0.0] 本稿では,インターネット規模での事前学習が表現空間の方向として人間の値を符号化するという潜在値仮説を提案する。
我々はこの直観を線形モデルで定式化し、構成は値関連方向を選択する投影演算子として機能する。
本報告では, 拒絶方向, 低ランク安全性部分空間, RLAIFスケーリング行動などの経験的知見を統一する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:51:40 GMT)
What Is the Alignment Tax? [0.0] アライメント税は広く議論されているが、公式には評価されていない。
我々は、アライメント税率を、機能部分空間への安全方向の正方形投影として定義する。
我々は,能力保存が安全目標間の紛争を仲介し,解決する条件を確立する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:11:50 GMT)
WTHaar-Net: a Hybrid Quantum-Classical Approach [0.0] 本稿では,Adamard Transformに代わる畳み込みニューラルネットワークWTHaar-Netを紹介する。
我々は、HWTが構造化アダマールゲートを用いた量子化を認め、一元演算への分解を可能にすることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:58:21 GMT)
VSPrefill: Vertical-Slash Sparse Attention with Lightweight Indexing for Long-Context Prefilling [0.0] 既存のスパースアテンション手法は、コンテキスト適応性、オーバーヘッドのサンプリング、微調整コストのトレードオフに直面している。
注意分布に垂直スラッシュ構造パターンを用いる軽量なトレーニング機構であるVSPrefillを提案する。
VSPrefillは注意点の98.35%を保存し、コンテキスト長128kで平均4.95倍のスピードアップを提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:24:58 GMT)
VB: Visibility Benchmark for Visibility and Perspective Reasoning in Images [0.0] 本稿では、視覚言語モデルが写真で何が見えていないのかを判断できるかどうかを判定するベンチマークであるVBを提案する。
アイテムは、最小限の画像編集を最小限のテキスト編集で横断する2x2デザインを使用して、100のファミリーに編成される。
我々は,自信認識精度(CAA),最小編集フリップ率(MEFR),信頼ランク選択予測(SelRank),第2次視点推論のモデルを評価する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:03:11 GMT)
Tracing Pharmacological Knowledge In Large Language Models [0.0] 薬物群セマンティクスが大規模言語モデル内でどのように表現され,検索されるかを検討する。
初期の層は、薬物グループの知識をコードする上で重要な役割を担っている。
薬物群セマンティクスはトークンに分散しており、すでに埋め込み空間に存在している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:04:08 GMT)
Toward multi-purpose quantum communication networks: from theory to protocol implementation [0.0] 同じ量子鍵分布ハードウェア上での2つの異なるタスクの実装を実演する。
量子オブリバスト転送と量子トークンに焦点をあてる。
量子通信プロトコルの性能とセキュリティを評価する方法論を確立することにより、大規模で多目的な量子通信ネットワークの工業化と展開に向けて大きな一歩を踏み出した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:27:43 GMT)
Thermodynamic Regulation of Finite-Time Gibbs Training in Energy-Based Models: A Restricted Boltzmann Machine Study [0.0] 内因性熱力学制御を導入し, 温度が状態変数として進化し, 統計をサンプリングする。
MNISTの実験により,提案した自己制御近似法は,安定性と有効試料性能を保っていることが示された。
その結果,WeMトレーニングは静的平衡過程ではなく,制御された非平衡過程であることがわかった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:21:19 GMT)
Theory of Code Space: Do Code Agents Understand Software Architecture? [0.0] Theory of Code Space (ToCS) は、コヒーレントなアーキテクチャの信念を構築し、維持し、更新する能力を評価するベンチマークである。
ToCSはモジュール依存の上に構造化された信念状態を構築するためにエージェントを必要とする。
事前アーキテクチャ制約発見(Preliminary Architectural Constraint Discovery)は、コード固有の評価である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:45:08 GMT)
The elbow statistic: Multiscale clustering statistical significance [0.0] 厳密な推論問題としてelbowメソッドを形式化するフレームワークであるElbowSigを紹介する。
アルゴリズムに依存しない手順として、ElbowSigは不均一性シーケンスのみを必要とし、幅広いクラスタリング手法と互換性がある。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:28:01 GMT)
The Science Data Lake: A Unified Open Infrastructure Integrating 293 Million Papers Across Eight Scholarly Sources with Embedding-Based Ontology Alignment [0.0] 私たちは、DuckDBとParquetファイル上に構築されたローカルにデプロイ可能なインフラストラクチャであるScience Data Lakeを紹介します。
リソースは約960GBのParquetファイルで、2億2300万件の特定可能な文書にまたがる。
リソースはオープンソースで、HuggingFace経由でリモートでデプロイ可能で、大きな言語モデル(LLM)ベースの研究エージェントに適した構造化ドキュメントを含んでいる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:58:18 GMT)
The Distribution of Phoneme Frequencies across the World's Languages: Macroscopic and Microscopic Information-Theoretic Models [0.0] マクロ的には、音素ランク周波数分布は対称ディリクレ分布の順序統計に密接に従っている。
音声、音韻、語彙構造からの制約を組み込んだ最大エントロピーモデルは、言語固有の音素確率を正確に予測する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:09:17 GMT)
The Controllability Trap: A Governance Framework for Military AI Agents [0.0] 我々はエージェント軍事AIガバナンスフレームワーク(AMAGF)を提案する。
AMAGFは、予防的ガバナンス、予防的ガバナンス、矯正的ガバナンスの3つの柱を中心に構成された測定可能なアーキテクチャである。
制御品質スコア(英: Control Quality Score, CQS)は、人間の制御を定量化し、制御が弱まるにつれて累積応答を可能にする複合リアルタイムメトリックである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:48:01 GMT)
Test-Time Meta-Adaptation with Self-Synthesis [0.0] 我々は,大規模言語モデルの自己適応を可能にするメタラーニングフレームワークであるMASSを紹介する。
MASSは、問題固有の合成トレーニングデータを生成し、下流のパフォーマンスに最適化された目標の自己更新を実行する。
数学的推論の実験は、MASSが効率的なデータ効率の試験時間適応をもたらすインスタンスごとのカリキュラムを合成することを学ぶことを示している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:16:18 GMT)
Synthetic-Child: An AIGC-Based Synthetic Data Pipeline for Privacy-Preserving Child Posture Estimation [0.0] Synthetic-Child(シンセティック・チルド)は、児童姿勢訓練用の画像を生成する合成データパイプラインである。
本システムでは,テスト対象のカテゴリの認識率を大幅に向上し,平均1.8倍の速度で応答する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:50:29 GMT)
Suppressing Domain-Specific Hallucination in Construction LLMs: A Knowledge Graph Foundation for GraphRAG and QLoRA on River and Sediment Control Technical Standards [0.0] 本稿では,日本の河川・土砂管理技術標準からの技術的疑問に答えることの課題について論じる。
ケースA(Plain 20B LLMベースライン),ケースB(QLoRAドメインを715グラフ由来のQAペアに微調整した8B LLM),ケースC(Neo4jナレッジグラフをGraphRAG経由で拡張した20B LLM)の3つの補完的アプローチを実装し,評価した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:51:29 GMT)
Stringology-Based Motif Discovery from EEG Signals: an ADHD Case Study [0.0] 弦学の手法を用いて脳波時系列を解析するための新しい計算手法を提案する。
このフレームワークは順序保存マッチング(OPM)とカルテシアンツリーマッチング(CTM)に適応し、時間的モチーフを検出する。
以上の結果から,ADHD関連脳波変化は時間的パターンの系統的変化,安定性,階層的構造に影響を及ぼすことが示唆された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:44:55 GMT)
Steering paths mid-flight for fault-tolerance in measurement-based holonomic gates [0.0] 計測に基づくホロノミックゲートの実装のための耐故障性フレームワークを提案する。
我々は、非マルコフ的デコヒーレンスが本質的に量子ゼノ効果によって抑制されていることを示す。
また,非断熱効果が測定による誤差を引き起こすことを示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 03:14:19 GMT)
Star-exponential for Fermi systems and the Feynman-Kac formula [0.0] 恒星指数をボソニック系の量子プロパゲータと関連づける形式主義に着想を得て、フェルミオンの場合の類似拡張を導入する。
第一の応用として、ファインマン・カックの公式のフェルミオン版がこの形式に導かれる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:28:06 GMT)
Spectral statistics and localization properties of a $C_3$-symmetric billiard [0.0] Dembowskiによって導入されたC$_3$-対称ビリヤードのスペクトル統計学を再考する。
我々は各対称性部分空間で2.8x10$5$固有値を計算し、確率行列理論と統計的に有意な比較を可能にする。
改良されたスペクトルは、GOE-GUE対応を明確にし、長距離スペクトル相関で観測された偏差を解消する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:16:28 GMT)
Sparse autoencoders reveal organized biological knowledge but minimal regulatory logic in single-cell foundation models: a comparative atlas of Geneformer and scGPT [0.0] 単一細胞基盤モデル Geneformer と scGPT は豊富な生物学的情報をエンコードする。
我々はTopK SAEsをGeneformer V2-316M と scGPT 全体の全層からの残流活性化について訓練した。
両機能をインタラクティブなWebプラットフォームとしてリリースし、2つの主要なシングルセル基盤モデルの30層にわたる107000以上の機能の調査を可能にしました。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:05:11 GMT)
Solving Inverse PDE Problems using Minimization Methods and AI [0.0] 本研究では、微分方程式によって支配されるシステムの両方の側面について研究し、よく確立された数値法と新しいAIベースの手法、特に物理情報ニューラルネットワーク(PINN)を対比する。
この結果から,PINNは競合計算コストで解を綿密に見積もることができることが示唆され,複雑なシステムの直接問題と逆問題の両方を解決する効果的なツールが提案される。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:21:16 GMT)
Single-photon emitters and spin-photon interfaces in silicon [0.0] レビューでは、ナノフォトニックシリコン構造における色中心とエルビウムのドーパントに基づく、コヒーレントな単一光子源とスケーラブルなスピン光子インターフェースへのオープンな挑戦について要約する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:11:28 GMT)
Simulating a quantum sensor: quantum state tomography of NV-spin systems [0.0] ダイヤモンド中の窒素空孔(NV)中心に対するスピン不純物の影響をシミュレーションするために量子コンピュータを用いる。
その結果、異なるスピンセンサカップリング系がコヒーレンスに与える影響が明らかになった。
エンタングルメント生成の役割は、Peres-Horodecki criterionとCHSH不等式を用いて解析される。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:43:34 GMT)
Shared (Mis)Understandings and the Governance of AI: A Thematic Analysis of the 2023-2024 Oversight of AI Hearings [0.0] 私は、上院司法委員会のプライバシー、技術、法に関する小委員会が主催する、2023-2024年のAI審問の監督に焦点を当てます。
私は、テクノロジー産業を圧倒的に代表している参加者が、AIの過去、現在、そして将来の影響を理解するための物語を作る方法を調べます。
産業の影響をAIの影響と政府の適切な役割に対する支配的な理解に追及することで、これらの公聴会を通じて実現され維持される権力の配置について検討する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:50:52 GMT)
ScribeTokens: Fixed-Vocabulary Tokenization of Digital Ink [0.0] ペンの動きを単位ピクセルステップに分解するトークン化であるScribeTokensを提案する。
手書きテキスト生成では、ScribeTokensはベクトル(17.33% vs. 70.29% CER)を劇的に上回り、トークンは生成にはるかに効果的であることを示す。
我々は、トークンベースモデル全体の認識を一貫して改善する自己教師付き事前学習戦略として、次世代の予測を導入する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:45:49 GMT)
Scaling of silicon spin qubits under correlated noise [0.0] 5ビットシリコンアレイにおけるノイズ相関の空間的範囲を定量化し、量子誤差補正(QEC)への影響を評価する。
我々は、完全に相関するゆらぎを生じる大域磁場ドリフトと、隣接する量子ビット内で崩壊する短距離相関を生成する2レベルゆらぎ器からの電荷ノイズの2つの異なる相関ノイズ源を同定する。
本研究では, 相関雑音の定量的評価を行い, 量子誤り補正がスケーラブルな量子ビットアレイの有効性に与える影響を明らかにする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:45:58 GMT)
Review Beats Planning: Dual-Model Interaction Patterns for Code Synthesis [0.0] HumanEval+では、Plan-then-codeはコードスペシャリスト単独に比べてパフォーマンスを2.4パーセント低下させる。
コードスペシャリストが自由に生成し、計画ではなく推論モデルレビューを行うと、同じハードウェア上の同じ2つのモデルが90.2%のパス@1を達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:57:14 GMT)
REGAL: A Registry-Driven Architecture for Deterministic Grounding of Agentic AI in Enterprise Telemetry [0.0] 大規模言語モデル(LLM)は、エージェント自動化の新しい形態を可能にする。
本稿では,企業テレメトリにおけるエージェントAIシステムの決定論的基盤化のためのレジストリ駆動型アーキテクチャREGALを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:13:39 GMT)
Qudit Designs and Where to Find Them [0.0] ユニタリt-設計は、量子情報理論において最も多用途なツールの一つである。
任意のクディット次元で重み付けされた状態t-デザインの族を構成する手法を導入する。
また、任意の次元でqudit Clifford 群をベンチマークできる Clifford 文字 RB も導入する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:49:13 GMT)
Quantum-Inspired Hamiltonian Feature Extraction for ADMET Prediction: A Simulation Study [0.0] 分子指紋をパラメータ化ハミルトンに符号化する量子インスパイアされた特徴抽出法を提案する。
Therapeutic Data Commons (TDC) ADMETベンチマークにおいて,本手法は最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:42:33 GMT)
Quantum Algorithms for Approximate Graph Isomorphism Testing [0.0] 近似グラフ同型テストの量子クエリ複雑性について検討する。
入力グラフの積グラフ$(G,H)$に対するMNRS量子ウォーク探索に基づく量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 06:43:41 GMT)
Quantifying Ranking Instability Across Evaluation Protocol Axes in Gene Regulatory Network Benchmarking [0.0] 4つのプロトコル軸間のペアワイズ反転率を定量化する。
置換ヌルは、観測された逆数率がランダムな順序予測よりもはるかに低いことを確認する。
分析の結果,逆転は基本レートのインフレーションではなく,手法の相対的差別能力の変化によって引き起こされることが明らかとなった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:09:59 GMT)
PrivMedChat: End-to-End Differentially Private RLHF for Medical Dialogue Systems [0.0] PrivMedChatは、微分プライベートなRLHFのためのエンドツーエンドフレームワークである。
微分プライベートなRLHFのためのエンドツーエンドフレームワークであるPrivMedChatを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:53:20 GMT)
Policy myopia as a mechanism of gradual disempowerment in Post-AGI governance, Circa 2049 [0.0] ポストAGI情報システムは、資源割り当てへの有意義な参加から人間を取り除く方法で、制度が決定を下す方法を変える。
我々は、政策ミオピアは、注意管理の貧弱な症状ではなく、不可逆的な人的分散を生み出すメカニズムであることを示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:54:57 GMT)
Physics-informed post-processing of stabilized finite element solutions for transient convection-dominated problems [0.0] 本研究は、PINN-Augmented SUPG を Shock-Capturing (PASSC) 方法論で拡張するハイブリッド計算フレームワークを提案する。
この手法は半離散有限安定化法と過渡対流拡散に基づく方程式に対するPINN要素補正戦略を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:51:17 GMT)
Photonic hyperentanglement in polarisation and frequency via joint spectrum shaping [0.0] Hyperentanglementは、量子情報処理と通信プロトコルのための拡張能力を提供する。
偏光および周波数双対自由度において、超絡み合った光子対のシングルパス、フィルタなし、ダウンコンバージョン源を示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:00:01 GMT)
Phase-space complexity of discrete-variable quantum states and operations [0.0] 離散変数量子系に対する位相空間複雑性の量子化器を提案する。
複雑性は、コヒーレント状態が単位複雑性を持つように正規化されるが、完全に混合状態は複雑さがゼロである。
フレームワークを量子チャネルに拡張し、複雑性の生成と破壊の両面での対策を定義します。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:00:02 GMT)
On the Structural Limitations of Weight-Based Neural Adaptation and the Role of Reversible Behavioral Learning [0.0] パラメータが直接変更されると、結果のモデルが元のモデルと異なる振る舞いをすることを示す。
この発散は明示的なパラメータスナップショットなしで決定的に逆転することはできない。
本稿では,モデル行動が識別パラメータから構造的に分離される可逆的行動学習を紹介する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:44:12 GMT)
On Geometry Regularization in Autoencoder Reduced-Order Models with Latent Neural ODE Dynamics [0.0] エンコーダ-デコーダ縮小順序モデルにおける学習潜在表現の幾何正規化戦略について検討する。
複数の種にまたがって、(a)cは、凍結オートエンコーダによる後続の潜伏力学の訓練を困難にする潜伏表現をしばしば生成する。
対照的に、(d)は学習した潜在力学の条件付け関連診断を一貫して改善し、ロールアウト性能が向上する傾向にある。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:31:13 GMT)
Odin: Multi-Signal Graph Intelligence for Autonomous Discovery in Knowledge Graphs [0.0] 我々は,有意義なパターンを自律的に発見するための,最初の生産展開型グラフインテリジェンスエンジンであるOdinを紹介する。
Odin氏は、事前の実績を維持することなく、グラフを探索する。
当社のアプローチは完全なトレーサビリティを維持しています -- 規制産業にとって重要な要件です。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:34:02 GMT)
Nuclear interference by electronic de-orthogonalisation [0.0] 結合した電子-原子核力学では、核密度の干渉は、当初は欠如していたとしても動的に起こる。
真の非断熱電子核相関は電子因子の非直交化を誘導し、核密度の干渉項を生成することを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:18:39 GMT)
Non-commutative integration method and generalized coherent states [0.0] リー群上のシュルディンガー方程式の非可換積分法により得られる状態と一般化コヒーレント状態の関係について検討した。
そのような解は、対応する-表現が実であるとき、一般化されたコヒーレント状態のクラスに属することが示されている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:20:31 GMT)
No Memorization, No Detection: Output Distribution-Based Contamination Detection in Small Language Models [0.0] CDDまたは出力分布による汚染検出は、モデルのサンプル出力のピーク値を測定することによって、データの汚染を識別する。
本研究では,70M から 410M のパラメータを含む小言語モデルにおいて,このアプローチが成功し,失敗する条件について検討する。
CDDの有効性は、微調整が動詞の暗記を生成するかどうかに大きく左右される。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:55:24 GMT)
Multiparty Quantum Key Agreement: Architectures, State-of-the-art, and Open Problems [0.0] マルチパーティ量子キー契約(MQKA)は、共有秘密鍵を確立するために、$n geq 3$相互不信なユーザを可能にする。
MQKAは3つの軸に沿って構成された設計空間として最もよく理解されていると我々は主張する。
MQKAプロトコルを構造ファミリに分類し、基礎となる量子リソースにマッピングし、異なるセキュリティモデルが公正性と衝突抵抗をいかに形成するかを分析する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:17:34 GMT)
Multi-Agent-Based Simulation of Archaeological Mobility in Uneven Landscapes [0.0] 本稿では,不均一な景観における考古学的モビリティをシミュレートするためのマルチエージェント・モデリング・フレームワークを提案する。
提案手法は,グローバルパス計画と局所的動的適応を併用し,補強学習を行う。
このフレームワークは、人間グループや動物ベースの輸送システムを含む多様なエージェントタイプを明示的にモデル化する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:02:31 GMT)
Motion-induced directionality of collective emission in a non-chiral waveguide [0.0] 遷移双極子の空間的に振動する位相を持つラマン誘起二層発光器は、熱的に誘起されるが、集合放出の制御可能な方向性を可能にする。
我々はスピンに対するTrncated Wigner近似に基づく数値シミュレーションを用い、良好な一致を求める。
我々の結果は、非キラル系における集合的、非相互相互作用の研究を可能にする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:21:45 GMT)
Molt Dynamics: Emergent Social Phenomena in Autonomous AI Agent Populations [0.0] MoltBookは大規模なマルチエージェント協調環境であり、770,000以上の自律LDMエージェントが人間の参加なしに対話する。
textitMolt Dynamics:創発的エージェント協調行動、エージェント間コミュニケーションダイナミクス、役割特殊化パターンを紹介する。
これらの知見は、分散自律エージェントシステムにおける協調力学の実証的ベースラインを確立した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:15:27 GMT)
Merged amplitude encoding for Chebyshev quantum Kolmogorov--Arnold networks: trading qubits for circuit executions [0.0] 我々は,任意の出力ノードに対して,入力エッジベクトルのすべての$n$の振幅要素積を1つの振幅状態にまとめる手法であるマージ符号化を導入する。
その結果, 増幅エンコーディングにより, 実験条件下でのトレーニング性が保たれることがわかった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:14:04 GMT)
Measurement of a quantum system using spin-mechanical conversion [0.0] スピンのアンサンブル上の量子測定を、スピン-メカニカルカップリングによってホスト粒子のマクロな回転に変換する。
我々は、70%以上でスピン読み出しコントラストを測定し、コヒーレントRabi発振のパルス力学的検出を実証した。
本研究は,パルス制御を用いたスピンメカニカルシステムのための興味深い新しい機会を開拓した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 01:37:56 GMT)
Maximizing Generalization: The Effect of Different Augmentation Techniques on Lightweight Vision Transformer for Bengali Character Classification [0.0] ディープラーニングモデルは、過度な適合を避けるために、大規模なデータセットに大きく依存する。
大規模なデータセットは多くのドメイン、特にBengaliのようなリソース制限言語では利用できない。
データ拡張(Data augmentation)とは、データのサイズと多様性を高めるための一連のテクニックである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:14:11 GMT)
Learning Object-Centric Spatial Reasoning for Sequential Manipulation in Cluttered Environments [0.0] 我々は,低レベルの行動実行から高レベルの空間的推論を分離するフレームワークUnveilerを提案する。
この分離されたアーキテクチャは、パラメータ数と推論時間の観点からより計算的に効率的であることを示す。
シミュレーションでは,97.6%の成功率,90.0%の完全閉塞シナリオを達成し,複雑な操作タスクにおけるオブジェクト中心推論の能力について考察した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 01:45:53 GMT)
Learning Hamiltonians for solid-state quantum simulators [0.0] 固体量子系の実験データから直接実効ハミルトニアンの同定を学習するための一般化可能なフレームワークを提案する。
我々のアプローチは、物理的制約を直接モデル構造に埋め込む物理インフォームドニューラルネットワークアーキテクチャに基づいている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:37:43 GMT)
Layer-wise QUBO-Based Training of CNN Classifiers for Quantum Annealing [0.0] 本稿では,畳み込みニューラルネットワーク(CNN)の頭部を学習するための,擬似Un Binary Optimization(QUBO)に基づく反復的フレームワークを提案する。
出力毎の分解は、$C$クラス問題を$C$独立QUBOに分割し、それぞれ$(d+1)K$バイナリ変数で、$d$が特徴次元、$K$がビット精度で分割する。
我々は,6つの画像分類ベンチマーク(スコーンディジット,MNIST,Fashion-MNIST,CIFAR-10,EMNIST,KMNIST)の評価を行った。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:10:36 GMT)
LLandMark: A Multi-Agent Framework for Landmark-Aware Multimodal Interactive Video Retrieval [0.0] LLandMarkはランドマーク対応のマルチモーダルビデオ検索のためのモジュラーフレームワークである。
このフレームワークは、クエリ解析と計画、ランドマーク推論、マルチモーダル検索、再帰的な回答合成の4つのステージで協力する特殊エージェントを備えている。
ランドマーク知識エージェント(Landmark Knowledge Agent)は、文化的または空間的なランドマークを検出し、それらを説明的な視覚的プロンプトに再構成し、ベトナムのシーンに対するCLIPベースのセマンティックマッチングを強化する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:36:34 GMT)
LAGO: A Local-Global Optimization Framework Combining Trust Region Methods and Bayesian Optimization [0.0] 本稿では,勾配強調ベイズ最適化と勾配に基づく信頼領域局所改善を組み合わせたLocAl-Global OptimizationアルゴリズムであるLAGOを紹介する。
各イテレーションにおいて、グローバルとローカルの最適化戦略は独立して候補点を提案し、予測された改善に基づいて次の評価が選択される。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:24:36 GMT)
It Takes So Little to Change So Much: Investigating the Robustness of a Danish Voting Advice Algorithm [0.0] 我々は、人気のあるデンマークのVAAであるカンディダストテスト(en:Kandidattest)にアクセスできる。
VAAは、ヨーロッパ諸国や、多党制民主主義システムを持つ他の国で人気のあるツールである。
このアルゴリズムは,ユーザが出力の合意割合を信頼できるほど堅牢ではないことがわかった。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:35:01 GMT)
Inverse Reconstruction of Shock Time Series from Shock Response Spectrum Curves using Machine Learning [0.0] 本研究では,SRSからアクセラレーション時系列へのデータ駆動逆写像を学習する条件付き変分オートエンコーダを提案する。
実験では、古典的手法に対するスペクトルの忠実度の向上、目に見えないスペクトルへの強い一般化、推論速度の3~6桁の高速化が示されている。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:23:29 GMT)
Internal dynamics and guided motion in general relativistic quantum interferometry [0.0] 量子系の内部自由度と外部重力場における全体の運動との結合は、アインシュタインの量子物理学における同値原理において中心的な役割を果たす。
この手紙は、曲線化された時空における場の量子論の枠組みにおいて、一般に共変半古典近似を用いてそのような現象がどのように理解されるかを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:24:49 GMT)
Inherited Goal Drift: Contextual Pressure Can Undermine Agentic Goals [0.0] ゴールドリフトの程度と原因を更新した特徴付けを提供する。
模擬ストックトレーディング環境における最先端モデルのドリフトについて検討する。
その結果,ドリフトの挙動は急激な変動と不整合であり,それに続く命令階層と相関が低いことが判明した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:50:59 GMT)
Information Routing in Atomistic Foundation Models: How Equivariance Creates Linearly Disentangled Representations [0.0] QRプロジェクションを用いて学習した表現から合成信号を線形に除去する合成投影分解(CPD)を導入する。
QM9分子および材料プロジェクト結晶上の5つの構造系から得られた8つのモデルにまたがって、対角勾配:積同変(MACE)を見いだす。
この結果から, 立方体上の木勾配プローブは系統的に膨らみ, 純組成目標に対して$R2 = 0.68$--0.95$を回収し, 線形プローブを主指標として推奨することを示した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 16:52:06 GMT)
Human-Certified Module Repositories for the AI Age [0.0] 信頼性のあるソフトウェアを構築するための新しいアーキテクチャモデルとして,Human-Certified Module Repositories (HCMR)が導入されている。
HCMRは、人間の監視と自動分析を融合して、モジュールを認証し、人間とAIエージェントの両方による安全で予測可能なアセンブリをサポートする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 01:46:41 GMT)
Half the Nonlinearity Is Wasted: Measuring and Reallocating the Transformer's MLP Budget [0.0] 変圧器の非線形性が実際に必要である場合について検討する。
d+1$パラメータを持つゲートは、フルをリニアサロゲートに置き換えるタイミングを決定する。
トークンの同一性から非線形性を予測できないことが分かる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:16:14 GMT)
Gravity Falls: A Comparative Analysis of Domain-Generation Algorithm (DGA) Detection Methods for Mobile Device Spearphishing [0.0] モバイルデバイスは、ドメイン生成アルゴリズム(DGA)を利用するSMSスピアフィッシング(スマイッシング)リンクを通じて、eCrime脅威アクターの標的となることが多い。
この研究は、2022年から2025年の間に配信されたスマイシングリンクから導かれる新しい半合成データセットであるGravity Fallsに対して、従来のDGA検出器と機械学習のDGA検出器を評価することでギャップに対処する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:55:44 GMT)
Graph Hopfield Networks: Energy-Based Node Classification with Associative Memory [0.0] 我々は,グラフホップフィールドネットワークを導入し,そのエネルギー関数はノード分類のためのグラフラプラシアン平滑化と連想メモリ検索を結合する。
メモリ検索は、スパース励磁ネットワークで最大2.0pp、機能マスキングで最大5ppのさらなる堅牢性を提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:21:05 GMT)
Geometric mechanisms enabling spin- and enantio-sensitive observables in one photon ionization of chiral molecules [0.0] スピン・エナンチオ感受性観測装置の起源は,2つの内在的なメカニズムから明らかとなった。
チェレプコフによって以前に予測された10個の独立したパラメータは、これらの3つの擬ベクトルのモーメントとして減少することができる。
この結果から, スピン・エナンチオ感性観測器の強度を決定づける直感的な図式が得られた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:39:40 GMT)
Genuine certifiable randomness from a black-box [0.0] ブラックボックス設定における真正のランダム性証明を示す。
ランダムなシードを使わずに、単一粒子状態の測定のみを用いてランダムな数値を確実に生成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:24:03 GMT)
Generation of 12 dB squeezed light from a waveguide optical parametric amplifier using a machine-learning-controlled spatial light modulator [0.0] 周期偏極ニオブ酸リチウム(PPLN)光導波路光パラメトリック増幅器(OPA)からの12.1 pm 0.2$ dBの励起光の発生を実証した。
我々は空間的自由度を高めるために二重反射構成を用い、測定されたスクイーズレベルを直接最適化の目的関数として利用した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:46:30 GMT)
GSI Agent: Domain Knowledge Enhancement for Large Language Models in Green Stormwater Infrastructure [0.0] グリーン・ストームウォーター・インフラストラクチャー(GSI)システムは、長期的性能を確保するために継続的な検査と保守が必要である。
GSIに関するドメイン知識は、しばしば自治体のマニュアル、規制文書、検査形式に散らばっている。
本稿では,GSI 関連タスクの性能向上を目的とした GSI Agent を提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:37:44 GMT)
GNN For Muon Particle Momentum estimation [0.0] 本稿では,モーメント推定タスクにおけるグラフニューラルネットワーク(GNN)の利用について検討する。
GNNは、平均絶対誤差(MAE)の観点から、TabNetのような従来のモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 12:42:19 GMT)
GENAI WORKBENCH: AI-Assisted Analysis and Synthesis of Engineering Systems from Multimodal Engineering Data [0.0] GenAIは、システムエンジニアリングの原則をデザイナのワークフローに統合する、モデルベースシステムエンジニアリング(MBSE)環境である。
オープンソースのPLMプラットフォーム上に構築され、ドキュメント、物理B-rep幾何学、リレーショナルシステムグラフからのセマンティックデータをリンクすることで、統一されたデジタルスレッドを確立する。
本稿では,このワーク・イン・プログレス・フレームワークのコンセプト・アーキテクチャ,提案手法,および期待される影響について述べる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:49:05 GMT)
Full-dimensional quantum scattering calculations of rovibrationally excited HD+HD collisions [0.0] 実次元量子散乱計算は、HD+HD衝突におけるロ-振動遷移について報告する。
回転角運動量全体を保存するために、いくつかの近共振ロ-振動遷移が同定される。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:12:50 GMT)
From Reachability to Learnability: Geometric Design Principles for Quantum Neural Networks [0.0] 量子ニューラルネットワーク(QNN)では、深さや状態到達性だけでは、この機能の学習能力は保証されない。
CLSを満足するデータ再ロードモデルは、制御不能なスキームよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:17:53 GMT)
Frequency-Time Multiplexing for Near-Deterministic Generation of n-Photon Frequency-Bin States [0.0] 我々は、n個の時間モードを持つn個の光子が占有するn個の光子状態を生成するために、アクティブな時間多重化を考える。
重なり合うn個の光子の周波数と時間モードを操作するために、光量子メモリを用いたアプローチを考案する。
我々は、損失を考慮した多光子状態発生率を計算し、商業的に利用可能なハードウェアで現実的に達成可能である。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 23:09:57 GMT)
Form Follows Function: Recursive Stem Model [0.0] 本稿では,計算量とNP問題を解くためにRecursive Stem Model (RSM)を導入する。
RSMは、初期イテレーションを分離された"ウォームアップ"ステップとして扱い、最終ステップでのみ損失を適用します。
Sudoku-Extremeでは、RSMはテスト時間計算で精度97.5%に達する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:55:00 GMT)
Fast and memory-efficient classical simulation of quantum machine learning via forward and backward gate fusion [0.0] 本稿では,スループットを向上させるために,各前方経路と後方経路に連続ゲートを融合させる手法を提案する。
ハードウェア効率の良いAnsatzを12ドル以上のキュービットで約20ドルで改善し、メモリ帯域幅が制限されたミドルレンジの消費者向けGPUで30ドル以上の改善を実現しました。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 09:43:49 GMT)
Exploiting PendingIntent Provenance Confusion to Spoof Android SDK Authentication [0.0] パートナーSDK内の単一の認証バイパスは、攻撃者がエコシステム内のすべてのパートナーのアイデンティティを許可する。
クロスプラットフォームのモバイルSDKは、コンテンツパブリッシング、支払い開始、IDフェデレーションといったセンシティブな操作を仲介する。
本稿では,Bound Service IPCとBinder.getCallingUidによるカーネルレベルの呼び出し検証を組み合わせたディフェンスアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 02:53:17 GMT)
ERP-RiskBench: Leakage-Safe Ensemble Learning for Financial Risk [0.0] 本稿では、アンサンブル機械学習を用いたERP財務リスク検出のための再構成実験フレームワークを提案する。
リスク定義はハイブリッドで、調達のコンプライアンス異常と取引詐欺の両方をカバーする。
ERP-RiskBenchと呼ばれる複合ベンチマークは、公開調達イベントログ、ラベル付き不正データ、新しい合成ERPデータセットから組み立てられる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:41:26 GMT)
Design Framework and Manufacturing of an Active Magnetic Bearing Spindle for Micro-Milling Applications [0.0] アクティブ磁気軸受(AMB)は超高速で非接触かつ潤滑のない動作を提供する。
本稿では,マイクロミリングABBスピンドルの設計と製造のための系統的かつ反復的な枠組みを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:30:12 GMT)
Deep Interest Mining with Cross-Modal Alignment for SemanticID Generation in Generative Recommendation [0.0] Generative Recommendation (GR)は、数兆規模のデータを学習可能な語彙列に圧縮するためにセマンティックID(SID)に依存している。
既存の方法には3つの限界がある。
本稿では,Deep Contextual Interest Mining(DCIM),Cross-Modal Semantic Alignment(CMSA),Quality-Aware Reinforcement Mechanism(QARM)の3つの重要なイノベーションを統合する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 13:36:22 GMT)
DRESS: A Continuous Framework for Structural Graph Refinement [0.0] 我々はDRESSと呼ばれるグラフ同型テストと構造解析のための新しいフレームワークを開発した。
DRESSはよく知られたベンチマークグラフで1-WLと3-WLを経験的に上回っている。
我々はDRESSを$mathcalO(n4)$の計算コストを伴わずに,高度にスケーラブルなフレームワークとして確立した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:03:51 GMT)
DKD-KAN: A Lightweight knowledge-distilled KAN intrusion detection framework, based on MLP and KAN [0.0] Kolmogorov-Arnold Network (KAN) を用いて, データの複雑な特徴を捉える軽量な侵入検出フレームワークを提案する。
テストベッド上で実行される攻撃を検出するために、まず高容量のkanネットワークを訓練する。
このモデルは教師として機能し、DKDを介してより小さな多層パーセプトロン(MLP)の学生モデルを導く。
得られたDKD-MLPモデルは、WADIおよびSWaTデータセットのパラメータが2,522と1,622しかない。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:02:11 GMT)
Correction scheme for total energy obtained on fault-tolerant quantum computer via quantum dominant orbital selection and subspace dynamical correlation methods [0.0] 本稿では、フォールトトレラント量子コンピュータと古典計算を統合するハイブリッドアプローチを用いて、分子エネルギーを正確に評価する実用的な方法を提案する。
我々の手法は、量子データを読み出すための膨大な作業に苦しめられず、大規模で複雑な分子系を効率的に計算する可能性を実証している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 08:10:31 GMT)
Comparison of Credential Management Systems Based on the Standards of IEEE, ETSI, and YD/T 3957-2021 [0.0] V2Xネットワークのセキュリティは世界中で注目を集めている。
北米ではIEEE 1609シリーズの規格が主に使われており、ヨーロッパではETSIシリーズの規格が採用されており、中国ではYD/T 3957-2021という業界標準も制定されている。
本研究は、V2Xデバイスにおけるこれらの3つの主要な標準を実装し、V2Xシステムにおけるメッセージ署名と署名検証の効率を比較する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 00:19:32 GMT)
Coherent Control of Population and Quantum Coherence in Superconducting Circuits [0.0] 最近のブレークスルーは、量子の振る舞いの境界をマクロの世界に押し上げた。
本稿は、複数の量子レベル間の集団分布のコヒーレントな制御を達成するための異常な進歩をトレースする。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 11:24:28 GMT)
Coalgebras for categorical deep learning: Representability and universal approximation [0.0] 我々は、ディープラーニングにおける同変表現のための合図基盤を開発する。
一般化された設定で同変写像に対する普遍近似定理を確立する。
この研究は、不変な振る舞いの抽象的な仕様と、ニューラルネットワークにおける具体的な実現との間に、分類的な橋渡しを提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:18:50 GMT)
Charging power enhancement at the phase transition of a non-integrable quantum battery [0.0] この方向の中心的な問題は、量子相転移が充電エネルギーや電力を高めることができるかどうかである。
本稿では,量子クエンチプロトコルを用いて充電された非可積分型量子電池の例として,一次元軸-負-負-負-負のアイシングモデルについて検討する。
積分可能なケースとは対照的に、この設定における臨界性は、充電力の顕著な増強につながる。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 10:15:44 GMT)
Baseline Performance of AI Tools in Classifying Cognitive Demand of Mathematical Tasks [0.0] 私たちは、認知的要求の4レベルにわたって数学のタスクを分類する能力に基づいて、11のAIツールをテストしました。
平均して、AIツールは認知的需要を63%のケースで正確に分類した。
すべてのツールは、認知的要求の極端にタスクに苦しんだ。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:39:55 GMT)
Asymmetric Goal Drift in Coding Agents Under Value Conflict [0.0] GPT-5 mini,Haiku 4.5,Grok Code Fast 1は,セキュリティやプライバシといった強固に保持された価値観に対して,システムが非対称なドリフトを示すことを示す。
プライバシーのような強固に保持された価値観でさえ、持続的な環境圧力下では非ゼロの違反率を示している。
これらの結果から,浅度のコンプライアンスチェックが不十分であり,コメントベースの圧力がモデル値階層を利用してシステムプロンプト命令をオーバーライドできることが判明した。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:13:12 GMT)
Anomalous Klein tunnelling with magnetic barriers in strained graphene [0.0] ひずみグラフェンシート中の電子輸送について, 静電障壁と磁気障壁の連続による検討を行った。
機械的変形と外部磁場の相互作用は、異常なクライントンネルを生成する。
これらの知見は,2次元材料における電荷輸送を調整するための強力なツールとして,ひずみ工学と磁場変調が果たす役割を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 18:32:44 GMT)
Analytical Quantum Full-Wave Analysis of Few-Photon Transport Through a Superconducting Cavity Qubit [0.0] 超伝導量子コンピュータをスケールアップする有望な方法は、プロパゲート光子を使って異なるデバイスを繋ぐことである。
量子インターコネクトの量子情報伝達を 正確にモデル化することは この新興技術の進歩に不可欠です
近年,超伝導回路量子デバイスのための第1回解析量子フルウェーブソリューションの開発が進展している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 14:11:54 GMT)
Analogue Hawking radiation in nonlinear quantum optics [0.0] 我々は、ホーキング放射を観測するために、多様な物理系における事象の地平線を作成する取り組みについて論じる。
最も成功した実現法の一つは非線形量子光学に基づく光ファイバーアナログである。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 21:17:10 GMT)
An Investigation Into Various Approaches For Bengali Long-Form Speech Transcription and Bengali Speaker Diarization [0.0] 本稿では,Kaggle における "DL Sprint 4.0 - Bengali Long-Form Speech Recognition" と "DL Sprint 4.0 - Bengali Speaker Diarization" のための多段階アプローチを提案する。
我々は,Bengaliデータに微調整したWhisper Mediumを実装し,Pyannote/Speaker-diarization-community-1とカスタムトレーニングセグメンテーションモデルを統合した。
その結果、ターゲットチューニングと戦略的データ利用は、南アジアの言語におけるAIを大幅に改善できることが示された。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:00:42 GMT)
AgentAssay: Token-Efficient Regression Testing for Non-Deterministic AI Agent Workflows [0.0] AgentAssayは、非決定論的AIエージェントを回帰テストするための最初のトークン効率のよいフレームワークである。
厳密な統計保証を維持しながら78-100%のコスト削減を実現している。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 04:59:25 GMT)
Adversarial Learning Game for Intrusion Detection in Quantum Key Distribution [0.0] 本稿では,デコイ状態量子鍵分布(QKD)における侵入検出のための高忠実度シミュレーションフレームワークを提案する。
このフレームワークは、学習ベースのディフェンダーと適応的な敵の間のミニマックスゲームとしてモデル化されている。
アダプティブ・アタックのシナリオでは、システムは正直な有限キーレートの8,2text--92%$を保存し、トラフィックは約1.2%しか捨てない。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:21:06 GMT)
Act-Observe-Rewrite: Multimodal Coding Agents as In-Context Policy Learners for Robot Manipulation [0.0] 本稿では、LLMエージェントがロボット操作ポリシーを改善するためのフレームワークであるAct-Observe-Rewrite(AOR)を提案する。
AORはLLM推論の単位として、完全な低レベルモーター制御を実装している。
エージェントは、デモンストレーション、報酬工学、勾配更新なしで高い成功率を達成する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:15:55 GMT)
Acoustic and Facial Markers of Perceived Conversational Success in Spontaneous Speech [0.0] 本研究では,対話のダイナミクスが対話の質とどのように関連しているかを調べるために,自発的なZoom会話の大規模コーパスを分析した。
その結果, 自発音声で確実に検出され, 高い評価が得られた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 19:11:38 GMT)
AI Space Physics: Constitutive boundary semantics for open AI institutions [0.0] 本稿では,オープンな自己拡張型AI機関のセマンティクスとして,AI宇宙物理を紹介する。
タイプ付き境界チャネル,地平線限定リーチセマンティクス,膜知性の規律を備えた最小状態モデルを定義する。
差し迫った外部デルタがゼロであっても、拡張遷移をガバナンス関連として扱う。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 15:54:27 GMT)
A theoretical model of dynamical grammatical gender shifting based on set-valued set function [0.0] 本研究は,名詞の多様な特徴について検討し,意味的(可算/非可算)と形態的(男性/女性)の区別に焦点をあてた。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 20:32:13 GMT)
A Dynamical Theory of Sequential Retrieval in Input-Driven Hopfield Networks [0.0] この研究はホップフィールドネットワークにおけるシーケンシャル推論の理論を発展させる。
我々は、利得閾値、逃避時間、崩壊状態を含む、自己持続型メモリ遷移の明確な条件を導出する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 17:54:36 GMT)
A Data-Driven Analysis for Engineering Conferences: The Institute of Industrial and Systems Engineering (IISE) Annual Conference Proceedings (2002-2025) [0.0] 本稿では,2002年から2025年までのIISE手順の計算解析について述べる。
我々は、テーマの進化を、支配的、新興、そして後退する研究トピックを特定するためにマッピングする。
この発見は分野の知的資産を照らし、ISEの将来を導くためのデータインフォームドマップを提供する。
論文参考訳(メタデータ) (Tue, 03 Mar 2026 22:40:07 GMT)