CtrlAttack: A Unified Attack on World-Model Control in Diffusion Models [92.0] 我々は、I2Vモデルの脆弱性を分析し、時間的制御機構が新たな攻撃面を構成することを発見し、それらを一様にモデル化することの難しさを明らかにする。
我々はCtrlAttackと呼ばれるトラジェクトリ制御攻撃を提案し、生成過程における状態の進化を妨害する。
実験結果から,低次元および高規則化摂動制約下であっても,時間的一貫性を著しく損なう可能性が示唆された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:05:50 GMT)
Mastering Negation: Boosting Grounding Models via Grouped Opposition-Based Learning [87.2] D-Negationは、ポジティブな意味記述とネガティブな意味記述の両方で注釈付けされたオブジェクトを提供する新しいデータセットである。
本稿では,限られたサンプルから否定認識表現を学習する,反抗型学習フレームワークを提案する。
モデルパラメータの10%未満を微調整することにより、正および負のセマンティック評価において最大4.4mAPおよび5.7mAPの改善が達成される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:21:48 GMT)
Deconstructing the Failure of Ideal Noise Correction: A Three-Pillar Diagnosis [82.1] ノイズ補正法は,まだ訓練中の性能低下に悩まされていることを示す。
このことは、失敗が基本的に$T$推定の問題ではなく、より根深い欠陥に起因することを、説得力強く示している。
我々は、マクロ収束状態、微視的最適化ダイナミクス、ノイズラベルから何が学べるかについての情報理論的限界の3つのレベルをリンクする統合分析を提供する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:53:04 GMT)
Do You See What I Am Pointing At? Gesture-Based Egocentric Video Question Answering [81.2] EgoPointVQAはジェスチャー中心の質問応答のためのデータセットとベンチマークである。
Hand Intent Tokens (HINT) は、既製の復元モデルを用いて、3Dの手のキーポイントから派生したトークンを符号化する。
我々のモデルは、異なるバックボーンとモデルサイズで他よりも優れています。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:23:38 GMT)
From Sparse to Dense: Multi-View GRPO for Flow Models via Augmented Condition Space [78.4] グループ相対政策最適化(GRPO)は、テキスト・ツー・イメージ(T2I)フローモデルにおいて、優先順位調整のための強力なフレームワークとして登場した。
条件空間を拡大することで関係探索を強化する新しい手法であるMulti-View GRPOを提案する。
MV-GRPOは最先端手法よりも優れたアライメント性能を実現する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:35:13 GMT)
Bin~Wan,G2HFNet: GeoGran-Aware Hierarchical Feature Fusion Network for Salient Object Detection in Optical Remote Sensing Images [76.2] 既存の手法では、一様注意機構を用いて複数の特徴を単一スケールで抽出するのが一般的である。
光リモートセンシング画像における幾何的および粒度をフル活用するGeoGran-Aware grained Feature Fusion Network (G2HFNet)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:52:00 GMT)
InterEdit: Navigating Text-Guided Multi-Human 3D Motion Editing [73.5] 本稿では,複数の人物による3Dモーション編集のタスクについて紹介する。
これをサポートするために、InterEdit3D、手動2人動作変更アノテーションを備えた新しいデータセット、およびテキスト誘導多人動作編集(TMME)ベンチマークを提案する。
InterEditはテキスト間の一貫性を改善し、忠実さを編集し、最先端のTMMEパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:30:51 GMT)
Multimodal OCR: Parse Anything from Documents [72.2] dots.mocrは、チャート、ダイアグラム、テーブル、アイコンなどのビジュアル要素を第一級解析ターゲットとして扱う。
テキストとグラフィックの両方を構造化出力として再構築し、より忠実なドキュメント再構築を可能にする。
不均一なドキュメント要素に対するエンドツーエンドのトレーニングをサポートする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:42:21 GMT)
Neural Gate: Mitigating Privacy Risks in LVLMs via Neuron-Level Gradient Gating [71.6] ニューラルゲート(Neural Gate)は,ニューロンレベルのモデル編集によってプライバシリスクを軽減する新しい手法である。
本手法は,プライバシ関連質問に対する拒否率を高めることにより,モデルのプライバシ保護を改善する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:03:20 GMT)
Neuron-Aware Data Selection In Instruction Tuning For Large Language Models [69.1] インストラクションチューニング(IT)は、大規模言語モデル(LLM)の強力な能力を解放するための効果的なアプローチであることが証明されている。
近年の研究では、過剰なITデータがLCMのパフォーマンスを低下させる可能性がある一方で、高品質なITデータの小さなサブセットを慎重に選択することで、その能力を著しく向上させることができることが示されている。
我々はNAITと呼ばれる新しい効率的なフレームワークを提案し、ITデータセットから最も効率的なサブセットデータを特定する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:39:03 GMT)
Beyond Facts: Benchmarking Distributional Reading Comprehension in Large Language Models [67.1] 本研究では,LLMが自然言語から分布的知識を推測する能力を評価するための読解的ベンチマークであるText2DistBenchを紹介する。
映画と音楽のエンティティに関する実際のYouTubeコメントから構築されたこのベンチマークは、エンティティメタデータと関連するコメントを含むモデルを提供する。
信頼性と長期的な評価をサポートするため、Text2DistBenchの構築パイプラインは完全に自動化され、継続的に更新され、新たに登場したエンティティが組み込まれる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:26:08 GMT)
Cheers: Decoupling Patch Details from Semantic Representations Enables Unified Multimodal Comprehension and Generation [66.5] Cheersは、パッチレベルの詳細をセマンティック表現から切り離す、統一されたマルチモーダルモデルである。
チェアは視覚的理解と生成の両方において、高度なUMMと一致または超えます。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:55:27 GMT)
What Makes VLMs Robust? Towards Reconciling Robustness and Accuracy in Vision-Language Models [65.0] Adversarial Robustness Adaptation (R-Adapt)は、トレーニング済みのすべての重みを凍結し、初期層のみに限って最小限の洞察駆動適応を導入するフレームワークである。
R-Adaptは、大きな視覚言語モデル(LLaVAやQwen-VLなど)に効率よく一般化し、ロバスト性を高める。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:02:11 GMT)
SAP: Segment Any 4K Panorama [64.7] SAP(Segment Any 4K Panorama)は4K高分解能パノラマ・インスタンスレベルのセグメンテーションの基礎モデルである。
本研究では,パノラマ画像分割を固定軌跡視点ビデオ分割として再構成し,パノラマを連続球面に沿ってサンプリングした重なり合う視点パッチに分解する。
このメモリアライメントの再構成は、4K解像度を保ちながら、安定したクロスビュー伝搬に必要なスムーズな視点遷移を復元する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:02:38 GMT)
Spectral Defense Against Resource-Targeting Attack in 3D Gaussian Splatting [63.3] 3D Gaussian Splatting (3DGS)は高品質なレンダリングを提供するが、Gaussian表現は新しい攻撃面を公開する。
この攻撃は訓練画像に毒を与え、資源の枯渇を引き起こすためにガウスの成長を過度に誘発する。
ガウスおよびイメージフィールドにおけるtextbfSpectral Defense を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:56:49 GMT)
Long-form RewardBench: Evaluating Reward Models for Long-form Generation [61.6] Long-form RewardBenchは、ロングフォーム生成用に特別に設計された最初の報酬モデリングテストベッドである。
ベンチマークには、QA、RAG、チャット、書き込み、推論の5つの重要なサブタスクが含まれています。
以上の結果から,現在のモデルにはまだ長文報酬モデリング機能が欠けていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:05:17 GMT)
HFP-SAM: Hierarchical Frequency Prompted SAM for Efficient Marine Animal Segmentation [61.0] 本研究では,高性能海洋動物分節のための新しい学習フレームワークHFP-SAMを提案する。
まず、凍結したSAMバックボーンに海洋シーン情報を効率よく注入する周波数誘導アダプタ(FGA)を設計する。
また、周波数分析により強調領域を生成するために、周波数対応ポイント選択(FPS)を導入する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:43:26 GMT)
VGGT-World: Transforming VGGT into an Autoregressive Geometry World Model [59.8] VGGT-World(VGGT-World)は、ビデオ生成を完全にサイドステップで行い、凍った幾何学的境界モデルの特徴の時間的進化を予測する幾何学世界モデルである。
VGGT-Worldは3.6~5倍高速で、トレーニング可能なパラメータはわずか0.43Bである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:56:43 GMT)
Visual-ERM: Reward Modeling for Visual Equivalence [59.3] Visual Equivalence Reward Model (Visual-ERM)は、細粒度、解釈可能、タスクに依存しないフィードバックを提供するマルチモーダル生成報酬モデルである。
Visual-ERM は Qwen3-VL-8B-Instruct を 8.4 で改善し、テーブルとSVGのパースで一貫したゲインを得る。
VisualCritic-RewardBench(VC-RewardBench)は、構造化された視覚データに対して微細な画像と画像の相違を判定するためのベンチマークである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:58:14 GMT)
Efficient and Interpretable Multi-Agent LLM Routing via Ant Colony Optimization [58.6] マルチエージェントシステム(MAS)のための効率的かつ解釈可能なルーティングフレームワークAMRO-Sを提案する。
AMRO-Sは、意味条件付き経路選択問題としてMASルーティングをモデル化し、3つのキーメカニズムを通してルーティング性能を向上させる。
5つの公開ベンチマークと高速ストレステストによる大規模な実験により、AMRO-Sは強いルーティングベースラインに対する品質-コストトレードオフを一貫して改善することを示した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:26:05 GMT)
NumColor: Precise Numeric Color Control in Text-to-Image Generation [57.7] テキストと画像のモデルは、自然言語の記述から画像を生成するのに優れているが、数値的な色を解釈できない。
我々は,複数の拡散アーキテクチャを横断する正確な数値色制御が可能なNumColorを提案する。
NumColorは、GenColorBenchベンチマークで色調和スコアを10-30倍改善しながら、5つのモデルで4-9倍の数値色精度を向上させる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:37:25 GMT)
DiT-IC: Aligned Diffusion Transformer for Efficient Image Compression [56.7] DiT-ICは画像圧縮用アライメント拡散変換器である。
U-NetをDiffusion Transformerに置き換え、32倍のダウンスケール解像度で遅延空間での拡散を可能にする。
16GBのラップトップGPUで2048x2048画像を再構成できる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:56:00 GMT)
Rethinking VLMs for Image Forgery Detection and Localization [55.3] 本稿では,視覚言語モデル(VLM)をフル活用して画像偽造検出・局所化(IFDL)タスクを支援する方法について検討する。
これらの知見に基づいて,IFDL-VLMと呼ばれる新しいIFDLパイプラインを提案する。
実験結果から, 検出, 局所化, 解釈可能性において, 常に新しい最先端性能を達成できることが示唆された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:21:31 GMT)
TDA-RC: Task-Driven Alignment for Knowledge-Based Reasoning Chains in Large Language Models [54.2] CoT(Chain-of-Thought)パラダイムはシングルラウンド効率の実践的応用を支配しているが、その推論チェーンは論理的ギャップをしばしば示している。
本稿では,推論連鎖を最適化するトポロジに基づく手法を提案する。
「本手法は推論精度と効率のバランスが良好であることを示し、多ラウンドインテリジェンスによる単ラウンド生成の実践的解決策を示す。」
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:01:01 GMT)
Mitigating Memorization in Text-to-Image Diffusion via Region-Aware Prompt Augmentation and Multimodal Copy Detection [53.8] 領域認識型prompt Augmentation(RAPTA)とAttention-Driven Multimodal Copy Detection(ADMCD)を示す。
RAPTAはオブジェクト検出器を使用して、正常な領域を見つけ、それらを意味論的に接地したプロンプトの変種に変換する。
ADMCDは、ローカルパッチ、グローバルセマンティック、テクスチャキューを軽量トランスフォーマーで集約し、融合表現を生成する。
実験により、RAPTAは高い合成品質を維持しながら過度な適合を減少させ、ADMCDはコピーを確実に検出し、単一モードの指標より優れることが示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:16:27 GMT)
Team RAS in 10th ABAW Competition: Multimodal Valence and Arousal Estimation Approach [53.6] 本手法は,顔,行動,音声の3つの相補的なモードを組み合わせる。
実験により,提案したマルチモーダル核融合戦略は, Aff-Wild2 開発セット上で0.658 の一致相関係数(CCC)を達成することを示した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:06:14 GMT)
Verification of Robust Properties for Access Control Policies [51.7] 既存のアクセス制御ポリシーの検証方法は、検証が進む前に、ポリシーを完全かつ完全に決定する必要がある。
本稿では,政策構造がどのような決定を下すか,どのような決定を下すか,あるいはその後の拡張に拘わらず,その決定を行うかという課題について,ロバストなプロパティ検証を導入する。
可能なすべてのポリシー拡張を普遍的に定量化しているにもかかわらず、判断は二階述語論理プログラミング言語における探索の証明に還元されることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:14:38 GMT)
Automated Self-Testing as a Quality Gate: Evidence-Driven Release Management for LLM Applications [51.6] 我々は,エビデンスに基づくリリース決定を伴う品質ゲートを導入する自動自己テストフレームワークを提案する。
内部展開型多エージェント対話型AIシステムの縦型ケーススタディにより,本フレームワークの評価を行った。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:44:15 GMT)
Catalyst4D: High-Fidelity 3D-to-4D Scene Editing via Dynamic Propagation [51.5] 高品質な3D編集を動的4Dガウスシーンに転送するフレームワークであるCatalyst4Dを紹介する。
AMGは、オリジナルのガウスアンと編集されたガウスアンの両方から、構造的に安定で空間的に代表的なアンカーのセットを構築している。
CUARは、ガウス色当たりの不確かさを推定することにより、時間的外観整合性を維持する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:10:27 GMT)
Leveraging Large Vision Model for Multi-UAV Co-perception in Low-Altitude Wireless Networks [51.3] 多様な低高度経済応用のための有望なパラダイムとして、UAV(Multi-Uncrewed Aero Vehicle)協調認識が出現している。
本稿では,BHU(Base-Station-Helped UAV)と呼ばれるコミュニケーション効率の良い協調認識フレームワークを提案する。
我々は、UAVキャプチャされたRGB画像から最も情報性の高い画素を識別するためにTop-K選択機構を使用し、データボリュームと遅延を低減したスペーサー化された視覚伝達を可能にする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:49:28 GMT)
MedArena: Comparing LLMs for Medicine-in-the-Wild Clinician Preferences [50.7] MedArenaは医療用大規模言語モデル(LLM)のためのインタラクティブな評価プラットフォームである。
MedArenaは、2つのランダムに選択されたモデルからの応答を表示し、ユーザが好みのレスポンスを選択するように要求する。
2025年11月1日までに12台のLLMで収集された1571の選好のうち、ジェミニ2.0フラッシュシンキング、ジェミニ2.5プロ、GPT-4oがブラッドリー・テリーのレーティングで上位3モデルとなった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 22:30:26 GMT)
Thinking in Dynamics: How Multimodal Large Language Models Perceive, Track, and Reason Dynamics in Physical 4D World [49.8] 人間は物理的4Dの世界に住み、幾何学的構造と意味的内容は時間とともに進化する。
さまざまな実世界および合成ビデオデータセットから構築された大規模ベンチマークであるDyn-Benchを紹介した。
既存のモデルでは,時間的推論と動的オブジェクトグラウンドの両面において,高い性能を同時に維持できないことがわかった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:42:16 GMT)
Spatially Grounded Long-Horizon Task Planning in the Wild [49.6] GroundedPlanBenchは、空間的に接地された長距離行動計画のための新しいベンチマークである。
Video-to-Spatially Grounded Planning (V2GP)は、現実のロボットビデオのデモを活用して、空間的地平面の長期計画を改善する自動データ生成フレームワークである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:42:18 GMT)
LibraGen: Playing a Balance Game in Subject-Driven Video Generation [49.5] 本稿では,S2V生成の基盤モデルの拡張を,本質的なVGFM強度とS2V能力のバランスゲームとみなす新しいフレームワークを提案する。
自動と手動のデータフィルタリングを組み合わせたハイブリッドパイプラインを構築し、全体的なデータ品質を改善します。
実験結果から、LibraGenは、数千スケールのトレーニングデータのみを使用して、オープンソースと商用のS2Vモデルの両方より優れていることが示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:36:23 GMT)
VFM-Recon: Unlocking Cross-Domain Scene-Level Neural Reconstruction with Scale-Aligned Foundation Priors [49.4] VFMReconは, シーンレベルの神経再構成において, スケール一貫性の要求を満たすトランスファー可能なVFMプリエントをブリッジする最初の試みである。
具体的には、まず、マルチビュースケールコヒーレンスを復元する軽量なスケールアライメントステージを導入する。
次に、トレーニング済みのVFM機能を、軽量なタスク固有アダプタを介して、ニューラルボリューム再構築パイプラインに統合する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:00:44 GMT)
DecoVLN: Decoupling Observation, Reasoning, and Correction for Vision-and-Language Navigation [49.2] 長距離ナビゲーションにおけるロバストなストリーミング認識と閉ループ制御のためのフレームワークであるDecoVLNを提案する。
本稿では,統合されたスコアリング関数を反復的に最適化することにより,過去の候補プールからフレームを選択する適応的精錬機構を提案する。
また,コンプレックスエラーを軽減するために,状態-作用ペアレベルの補正手法を導入する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:24:37 GMT)
From Imitation to Intuition: Intrinsic Reasoning for Open-Instance Video Classification [49.2] 現実世界のアプリケーションは、クラス内のバリエーションが広く複雑であるようなオープン・インスタンスの課題をしばしば提示する。
従来のビデオエンコーダモデルは優れた一般化を提供するが、そのようなタスクに対する推論能力(直観)を完全には活用していない。
本稿では,このギャップを,模倣から直観へのオープン・インスタンス・ビデオの分類を進化させる,本質的な推論フレームワークで埋める。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:07:28 GMT)
FedBPrompt: Federated Domain Generalization Person Re-Identification via Body Distribution Aware Visual Prompts [49.0] 視覚変換器(ViT)は広く採用されているが、その世界的な注目は、歩行者を高い類似点や多様な視点から区別することができないことが多い。
これを解決するために,FedBPrompt (FedBPrompt) を意識したFederated Body Distributionを提案する。
FedBPromptは、トランスフォーマーの注意を歩行者中心の地域へと導くための学習可能な視覚的プロンプトを導入した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:29:36 GMT)
Compile to Compress: Boosting Formal Theorem Provers by Compiler Outputs [48.4] 大型言語モデル (LLM) は形式定理の証明において大きな可能性を証明している。
我々は形式的検証において情報的構造を利用する: コンパイラが多様な証明の試みの広大な空間をマッピングする観察である。
我々は,この圧縮を利用して効率的な学習と証明探索を行う,学習と再定義のためのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:33:20 GMT)
VecMol: Vector-Field Representations for 3D Molecule Generation [48.3] VecMolは3次元分子をユークリッド空間上の連続ベクトル場としてモデル化することで分子表現を再現するパラダイムシフトフレームワークである。
QM9とGEOM-Drugsベンチマークの実験は、この新しいアプローチの可能性を検証する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:26:15 GMT)
coDrawAgents: A Multi-Agent Dialogue Framework for Compositional Image Generation [48.0] 対話型多エージェント対話フレームワークであるcoDrawAgentsを提案する。
インタプリタは、直接テキスト・ツー・イメージ・パスとレイアウト対応マルチエージェント・プロセスとを判定する。
Plannerは、進化する視覚的コンテキストで決定を下しながら、同じセマンティック優先レベルを持つオブジェクトのレイアウトを提案する。
Checkerは空間的一貫性と属性アライメントを検証することで、明示的なエラー訂正機構を導入する。
Painterはイメージをステップごとに合成し、新しく計画されたオブジェクトをキャンバスに組み込んで、その後のイテレーションに対してよりリッチなコンテキストを提供する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:32:06 GMT)
DynVLA: Learning World Dynamics for Action Reasoning in Autonomous Driving [47.9] DynVLAは、Dynamics CoTと呼ばれる新しいCoTパラダイムを導入した駆動VLAモデルである。
コンパクトなダイナミクス表現を得るために、DynVLAは、将来の進化を小さなダイナミックストークンに圧縮するDynamic Tokenizerを導入した。
我々はDynVLAをSFTおよびRFTを介して動作前に動的トークンを生成するように訓練し、遅延効率の高い推論を維持しながら意思決定品質を向上させる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:57:24 GMT)
EvoClaw: Evaluating AI Agents on Continuous Software Evolution [47.5] ノイズの多いコミットログから検証可能なマイルストーンDAGを再構築するエージェントパイプラインであるDeepCommitを紹介する。
これらの実行可能なシーケンスは、エージェントがシステムの完全性を維持し、エラーの蓄積を制限する必要がある新しいベンチマークであるEvoClawを可能にする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:20:40 GMT)
OARS: Process-Aware Online Alignment for Generative Real-World Image Super-Resolution [47.4] OARS は LR から SR への移行を評価する,プロセス対応のオンラインアライメントフレームワークである。
我々は,Real-ISRベンチマークにおいて,忠実さを維持しながら一貫した知覚的改善を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:12:46 GMT)
EvolveCoder: Evolving Test Cases via Adversarial Verification for Code Reinforcement Learning [46.9] 検証可能な報酬による強化学習(RLVR)は、大規模言語モデルにおけるコード生成を改善するための有望なアプローチである。
提案手法は, 候補解の実行挙動に基づいて, 反復的にテストケースを改良する, 解条件付き, 逆検証フレームワークを提案する。
EvolveCoder-22kは、大規模符号化強化学習データセットで、複数ラウンドの対角テストケースの進化を通して構築される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:26:50 GMT)
Consistent and Efficient MSCKF-based LiDAR-Inertial Odometry with Inferred Cluster-to-Plane Constraints for UAVs [46.2] 本稿では,UAVに適した一貫した,効率的なLiDAR-Inertial Odometryフレームワークを提案する。
スライディングウインドウのコプラナー制約にヌル空間プロジェクションを適用することにより、状態ベクトルにおける特徴パラメータへの直接依存を排除できる。
退化シナリオにおける堅牢性の向上,マップのない性質によるメモリ使用量の最小化,リソース制約の組込みプラットフォーム上でのリアルタイム実行などを実現している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:09:50 GMT)
CognitionCapturerPro: Towards High-Fidelity Visual Decoding from EEG/MEG via Multi-modal Information and Asymmetric Alignment [46.0] 我々は,脳波とマルチモーダル前処理を統合する拡張フレームワークであるCognitionCapturerProを提案する。
私たちのコアコントリビューションには、モダリティ固有の忠実度を定量化する不確実性重み付き類似度スコアリング機構が含まれています。
本手法は,THINGS-EEGデータセットにおいて,元のCognitionCapturerよりも優れていた。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:09:57 GMT)
LightMoE: Reducing Mixture-of-Experts Redundancy through Expert Replacing [45.5] 本稿では,エキスパートリプレースという新しい圧縮パラダイムを提案する。
冗長な専門家をパラメータ効率のよいモジュールに置き換え、低いトレーニングコストでその能力を回復する。
実験結果から,LightMoEはLoRAファインチューニングの性能を30%圧縮比で比較した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:33:08 GMT)
ReMem-VLA: Empowering Vision-Language-Action Model with Memory via Dual-Level Recurrent Queries [45.2] 本稿では、2組の学習可能なクエリを備えた視覚言語アクション(VLA)モデルであるReMem-VLAを紹介する。
これらのクエリはエンドツーエンドでトレーニングされ、時間とともに関連するコンテキストを集約し、維持する。
ReMem-VLAは複数の次元にまたがる強力なメモリ能力を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:38:42 GMT)
MIBench: Evaluating LMMs on Multimodal Interaction [44.8] MIBenchは、LMM(Large Multimodal Models)のマルチモーダル相互作用能力を評価するために設計されたベンチマークである。
MIBenchは、32の異なるタスクにまたがる1万以上の視覚コンテキストコンテキストからなる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:02:24 GMT)
Representation Learning for Spatiotemporal Physical Systems [43.7] 物理システムに対する機械学習のアプローチは、主に次世代の予測に焦点を当てている。
我々は、システムの物理パラメータを推定するなど、次のフレームを予測するための科学的タスクをさらに下流で検討する。
物理基底表現の学習における汎用的な自己指導手法の有効性を評価する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:59:51 GMT)
Beyond Dense Futures: World Models as Structured Planners for Robotic Manipulation [43.5] 本稿では、生成的世界モデルを信頼性制御のための明示的な構造化プランナーに再構成するStructVLAを提案する。
我々はこの手法を,個別のトークン語彙を統一した2段階の訓練パラダイムを用いて実装する。
我々の実験では、StructVLAはSimplerEnv-WidowXで75.0%、LIBEROで94.8%という高い平均成功率を達成した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:33:48 GMT)
Self-Supervised Speech Models Encode Phonetic Context via Position-dependent Orthogonal Subspaces [43.2] トランスフォーマーに基づく自己教師型音声モデル(S3Ms)はしばしば文脈化と表現されるが、これは何を意味するのかは定かではない。
本稿では,携帯電話とその周辺環境を1フレームレベルのS3M表現でエンコードする方法に焦点を当てる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:25:23 GMT)
SGMatch: Semantic-Guided Non-Rigid Shape Matching with Flow Regularization [43.1] SGMatchは意味誘導型非厳密な形状マッチングのための学習ベースのフレームワークである。
具体的には,視覚基盤モデルから幾何学的記述子への意味的特徴を統合するセマンティックガイド型ローカルクロスアテンションモジュールを設計する。
本研究では,時間変化速度場を監督し,回復した対応の空間的滑らかさを促進する条件付きフローマッチングに基づく正規化目標を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:31:43 GMT)
Team LEYA in 10th ABAW Competition: Multimodal Ambivalence/Hesitancy Recognition Approach [43.1] 本稿では,制約のないビデオにおけるアンビバレンス/ヘシタシー認識のためのマルチモーダルアプローチを提案する。
提案手法は,シーン,顔,音声,テキストの4つの相補的モダリティを統合する。
BAHコーパスの実験では、全ての単調基底線上でのマルチモーダル核融合の明らかな利得が示されている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:50:03 GMT)
Uncovering Security Threats and Architecting Defenses in Autonomous Agents: A Case Study of OpenClaw [42.9] 本報告では,OpenClawエコシステムの総合的なセキュリティ分析について述べる。
我々は、インジェクション駆動のRemote Code Execution(RCE)、シーケンシャルツールアタックチェーン、コンテキスト記憶、サプライチェーン汚染などの重要な脆弱性を強調した。
これらのシステム的アーキテクチャ欠陥に対処するために、フルライフサイクルエージェントセキュリティアーキテクチャ(FASA)を導入します。
この理論的な防御青写真は、ゼロトラストエージェント実行、動的意図検証、および層間推論-作用相関を提唱している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:33:05 GMT)
Topo-R1: Detecting Topological Anomalies via Vision-Language Models [42.9] トポロジカルな正確性は、血管、神経線維、道路網などの構造にとって重要である。
我々は,様々なトポロジ的異常を検証可能なアノテーションで合成する自動データキュレーションパイプラインを開発した。
次に、トポロジを意識した視覚言語モデルを実現するフレームワークであるTopo-R1を紹介する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:05:04 GMT)
From Passive Monitoring to Active Defence: Resilient Control of Manipulators Under Cyberattacks [42.7] FDIA(False Data Injection attack)は、アラームを発生させることなく、実質的なエンドエフェクタ偏差を発生させる。
本稿では、冗長マニピュレータのステルス型FDIAに対するレジリエンスについて検討し、パッシブモニタリングからアクティブディフェンスへアーキテクチャを進化させる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:08:41 GMT)
Maximizing Incremental Information Entropy for Contrastive Learning [42.5] 拡張ビュー間のエントロピーゲインを明示的に最適化するIE-CL(Incremental-Entropy Contrastive Learning)を提案する。
本稿では,情報エンコーダの同定と2つのコンポーネントの協調最適化を提案する。
CIFAR-10/100、STL-10、ImageNetの実験では、IE-CLは小さなバッチ設定で一貫して性能を改善している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:51:37 GMT)
ChainFuzzer: Greybox Fuzzing for Workflow-Level Multi-Tool Vulnerabilities in LLM Agents [42.4] ChainFuzzerは、監査可能なエビデンスでマルチツール脆弱性を発見し再現するためのフレームワークである。
20の人気のあるLLMエージェントアプリ(998ツール)上でChainFuzzerを評価する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:35:54 GMT)
Improving Channel Estimation via Multimodal Diffusion Models with Flow Matching [41.6] MultiCE-Flowはフローマッチングと拡散変換器(DiT)に基づくマルチモーダルチャネル推定フレームワーク
我々は、LiDAR、カメラ、位置情報をセマンティックな状態に融合させる特殊なマルチモーダル認識モジュールを設計する。
従来の拡散モデルとは異なり、ノイズからデータへの線形軌跡を学習するためにフローマッチングを用い、効率的なワンステップサンプリングを可能にした。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:26:10 GMT)
Finite Difference Flow Optimization for RL Post-Training of Text-to-Image Models [41.6] 強化学習(Reinforcement Learning, RL)は, 拡散型画像合成モデルの訓練後の標準技術である。
本稿では, ペア軌道をサンプリングし, より好ましい画像の方向に流速を引いて, モデル更新のばらつきを低減するオンラインRL変種を提案する。
提案手法は, より高速に収束し, 出力品質が向上し, より迅速なアライメントが得られる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:54:09 GMT)
Taming the Long Tail: Efficient Item-wise Sharpness-Aware Minimization for LLM-based Recommender Systems [41.1] 大規模言語モデルに基づくレコメンダシステム(LRS)は、最近、シーケンシャルレコメンデーションにおいて新しいパラダイムとして登場した。
LRSは、事前学習したコーパスから暗黙的に継承される事前のロングテールと、歪んだレコメンデーションデータセットから派生したデータロングテールの2つの異なるタイプのロングテールに直面している。
EISAM(Efficient Item-wise Sharpness-Aware Minimization)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:50:12 GMT)
Composing Driving Worlds through Disentangled Control for Adversarial Scenario Generation [40.9] 自動運転における大きな課題は、安全クリティカルなエッジケースの"ロングテール"である。
交通要因を乱す構成駆動ビデオシミュレータCompoSIAを紹介する。
我々は最先端のベースラインよりも優れた制御可能な生成品質を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:10:21 GMT)
Exploring label correlations using decision templates for ensemble of classifier chains [40.8] アンサンブルに基づくマルチラベル手法の使用は、マルチラベル分類結果の改善に有効であることが示されている。
最も広く使われているアンサンブルベースの融合スキームの1つは、アンサンブルチェインのためのアンサンブルチェイン決定テンプレート(DTECC)である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:26:55 GMT)
An Empirical Investigation of Pre-Trained Deep Learning Model Reuse in the Scientific Process [40.4] 自然科学におけるPTMの再利用パターンに関する最初の実証的研究について述べる。
我々は、17,511個のピアレビュー、オープンアクセス論文を分析し、科学分野によるPTMの再利用、関連する再利用パターン、および科学的プロセスへのPTMの統合の影響を明らかにする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:49:02 GMT)
SAVA-X: Ego-to-Exo Imitation Error Detection via Scene-Adaptive View Alignment and Bidirectional Cross View Fusion [40.4] エラー検出は、産業訓練、医療、組立品質管理において重要である。
既存の作業の多くは、単一視点の設定を前提としており、第三者(エゴ)の模擬(エゴ)を評価するために第三者(エゴ)のデモンストレーションを使用する実践的なケースを扱うことができない。
Ego$rightarrow$Exo Imitation Error Detection: 非同期、長さミスマッチしたエゴおよびエクソビデオが与えられた場合、モデルはエゴタイムライン上の手続きステップをローカライズし、それぞれが誤っているかを決定する必要がある。
統合されたプロトコルの下では、高密度ビデオキャプションと時間的行動検出から強いベースラインを適応し、それらが困難であることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:09:12 GMT)
Spend Less, Reason Better: Budget-Aware Value Tree Search for LLM Agents [40.2] Budget-Aware Value Tree (BAVT) は、動的検索ツリーとしてマルチホップ推論をモデル化するトレーニングフリーの推論時間フレームワークである。
BAVTは一貫して並列サンプリングベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:10:27 GMT)
Continual Learning in Large Language Models: Methods, Challenges, and Opportunities [39.7] 継続学習(CL)は、大きな言語モデル(LLM)が進化する知識やシーケンシャルなタスクに動的に適応できるように、重要なパラダイムとして登場した。
本研究は, 連続的事前学習, 連続的微調整, 連続的アライメントの3段階を中心に構成されたLCMに適したCL手法の概要を概説する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:01:25 GMT)
Generalized Recognition of Basic Surgical Actions Enables Skill Assessment and Vision-Language-Model-based Surgical Planning [38.9] 11,000本以上のビデオクリップを含む6つの外科専門分野にわたる10の基本的なアクションからなるBSAデータセットを提案する。
BSAデータセットに基づいて,基本動作の汎用認識を行う基盤モデルを開発した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:46:25 GMT)
Evolving Deception: When Agents Evolve, Deception Wins [38.7] 競合するビディンアリーナにおける大規模言語モデル(LLM)エージェントの自己進化について検討する。
私たちは一貫したパターンを見つけます:ユーティリティ駆動の競争の下では、非制約の自己進化は、欺く行動に向かって確実に流れます。
本稿では, エージェントの自己進化とアライメントの基本的な緊張関係を明らかにし, 対戦環境における自己改善エージェントの展開リスクを明らかにする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:09:11 GMT)
A Systematic Benchmark of GAN Architectures for MRI-to-CT Synthesis [38.3] MRIからCTへの変換にはGANアーキテクチャが提案されている。
我々は,3つの解剖学的領域にわたるSynthRAD2025データセットを用いて評価した10のGANのベンチマークを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:54:20 GMT)
Performance evaluation of deep learning models for image analysis: considerations for visual control and statistical metrics [38.0] 深層学習に基づく自動画像解析(DL-AIA)は、特徴量化に関連するタスクにおいて、訓練された病理医より優れていることが示されている。
DL-AIAツールの使用は、現在、プリンシプル研究から患者サンプルなどの定期的な応用まで拡張されている。
DL-AIAアプリケーションが安全で信頼性が高いことを保証するため、徹底的で客観的な一般化性能評価を行うことが重要である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:49:39 GMT)
Multiscale Structure-Guided Latent Diffusion for Multimodal MRI Translation [37.9] 我々はMSG-LDMと呼ばれる潜伏拡散に基づく多モードMRI翻訳フレームワークを提案する。
提案手法は,信頼性の高い境界情報を保持する完全構造情報を推定する。
BraTS 2020とWMHデータセットの実験は、提案手法が既存のMRI合成手法より優れていることを示した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:26:05 GMT)
ESPIRE: A Diagnostic Benchmark for Embodied Spatial Reasoning of Vision-Language Models [37.7] ESPIREは空間推論のための診断ベンチマークである。
物理的に視覚言語モデルに基づいて、空間推論中心のロボットタスクでそれらを評価する。
我々は各タスクをローカライズと実行に分解し、両方を生成問題として扱う。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:43:00 GMT)
HSEmotion Team at ABAW-10 Competition: Facial Expression Recognition, Valence-Arousal Estimation, Action Unit Detection and Fine-Grained Violence Classification [37.6] 本稿では,第10回ABAW(Affective Behavior Analysis in-the-Wild)コンペティションの結果について述べる。
本稿では,事前学習したEfficientNetに基づく感情認識モデルを用いて,顔の埋め込み抽出に基づく高速なアプローチを提案する。
きめ細かな暴力検出タスクでは,フレーム埋め込みのための事前訓練されたアーキテクチャと,ビデオ分類のためのアグリゲーションについて検討する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:13:46 GMT)
VERDICT: Verifiable Evolving Reasoning with Directive-Informed Collegial Teams for Legal Judgment Prediction [37.5] LJP(Lawal Judgment Prediction)は、事件事実から適用可能な法律記事、告訴、刑罰条件を予測する。
仮想コレギアルパネルをシミュレートする自己修復型協調型マルチエージェントフレームワークであるVERDICTを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:19:08 GMT)
Coherent Human-Scene Reconstruction from Multi-Person Multi-View Video in a Single Pass [36.8] CHROMMは、カメラ、シーンポイントクラウド、ヒューマンメッシュを多人数のマルチビュービデオから共同で推定する統合フレームワークである。
我々は、Pi3XとMulti-HMRの強力な幾何学的および人間的事前知識を、単一のトレーニング可能なニューラルネットワークアーキテクチャに統合する。
EMDB, RICH, EgoHumans, EgoExo4Dによる実験により, CHROMMはグローバルな人間の動きと多視点ポーズ推定において競争力を発揮することが示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:48:19 GMT)
Feynman: Knowledge-Infused Diagramming Agent for Scalable Visual Designs [36.8] 本稿では,エージェントであるFeynmanで構築したスケーラブルなダイアグラム生成パイプラインを提案する。
図を作成するために、Feynman氏はドメイン固有の知識コンポーネント('ideas')を列挙し、アイデアに基づいてコード計画を実行する。
宣言型プログラムはPenroseダイアグラムシステムによってレンダリングされる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:02:57 GMT)
Empowering Semantic-Sensitive Underwater Image Enhancement with VLM [36.6] この研究は、意味に敏感な機能を備えたUIEモデルを強化するための新しい学習メカニズムを提案する。
具体的には、まず、VLM(Vision-Language Models)を用いて、劣化画像からキーオブジェクトのテキスト記述を生成する。
このマップはUIEネットワークを二重誘導機構で制御し、クロスアテンションと明示的なアライメント損失を組み合わせたものだ。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:17:06 GMT)
Learning Athletic Humanoid Tennis Skills from Imperfect Human Motion Data [36.2] LATENTは、不完全なヒトモチオN daTaからAthletic humanoid TEnnisスキルを学ぶシステムである。
提案手法は,実世界において驚くべき結果が得られ,人間プレイヤーとのマルチショットラリーを安定的に維持することができる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:02:30 GMT)
FED-HARGPT: A Hybrid Centralized-Federated Approach of a Transformer-based Architecture for Human Context Recognition [35.3] 本研究では,トランスフォーマーに基づくアーキテクチャを用いたHAR(Human Activity Recognition)のためのハイブリッド型集中型フェデレーションアプローチについて検討した。
本研究は,モバイルセンサデータを用いたHAR技術の展開と,Federated LearningをFlowerフレームワーク内で活用することに焦点を当てる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:42:13 GMT)
Batched Kernelized Bandits: Refinements and Extensions [35.2] 我々は,ブラックボックス最適化の問題点について考察する。
アルゴリズム上の上限について (Li と Scarlett, 2022) は、B=O(log T)$ バッチが最適に近い後悔を得るのに十分であることを示している。
本稿では,ロバストなBPEアルゴリズムを提案するとともに,不規則な設定と同じ境界を生じる累積的後悔の概念を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:59:00 GMT)
The Quest for Quantum Advantage in Combinatorial Optimization: End-to-end Benchmarking of Quantum Solvers vs. Multi-core Classical Solvers [34.7] 我々は、IBM Heron r3量子プロセッサ上で、高階非制約バイナリ最適化(HUBO)のためのハイブリッド逐次量子コンピューティングソルバのエンドツーエンドベンチマークを実行する。
20のベンチマークインスタンスで、1つのハイブリッド試行は1秒未満で高品質なソリューションを生成し、14のケースで基底状態のエネルギーと一致する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:29:20 GMT)
Think and Answer ME: Benchmarking and Exploring Multi-Entity Reasoning Grounding in Remote Sensing [34.5] 我々はマルチエンタリティ推論タスクとしてリモートセンシンググラウンドを再構成する。
本稿では,視覚言語基礎モデルに基づくEntity-Aware Reasoning (EAR)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:47:19 GMT)
Resolving Interference (RI): Disentangling Models for Improved Model Merging [33.6] クロスタスク干渉は、その構成モデルに対するマージモデルの表現におけるドリフトである。
本稿では、他のタスクの空間に直交する機能を持つように専門家モデルを切り離す軽量適応フレームワークであるResolving Interference(RI)を提案する。
RIは、最先端のマージ手法の性能を最大3.8%改善し、未確認領域への一般化を最大2.3%改善している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:59:50 GMT)
Speech-Worthy Alignment for Japanese SpeechLLMs via Direct Preference Optimization [33.5] SpokenElyza は、ELYZA-tasks-100 から派生した日本語音声の聴力評価のベンチマークである。
そこで本稿では,日本語の音声LLMを適応するための好みに基づくアライメント手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:55:18 GMT)
GLEAM: A Multimodal Imaging Dataset and HAMM for Glaucoma Classification [33.4] マルチモーダルイメージング(GLEAM)による緑内障病変の評価と解析を提案する。
初めて公開された3-modal glaucomaデータセットは、レーザー眼科眼底画像、乳頭周囲CT画像、および4つの病期を付加した視野パターンの偏差マップを含む。
我々のフレームワークは階層型注意エンコーダと光デコーダを使用して、エンコーダにクロスモーダル表現学習を集中させる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:02:24 GMT)
MemReward: Graph-Based Experience Memory for LLM Reward Prediction with Limited Labels [32.6] グラフベースのエクスペリエンスメモリフレームワークであるMemRewardを紹介する。
最初のLCMポリシーは、各クエリに対するロールアウトを生成し、それぞれが思考プロセスと最終回答から構成される。
ラベル付きノードでトレーニングされたGNNは、オンライン最適化中にラベルなしのロールアウトに対して報酬を伝達する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:00:16 GMT)
ActionPlan: Future-Aware Streaming Motion Synthesis via Frame-Level Action Planning [32.6] ActionPlanは、単一のモデル内で高品質なオフライン生成でリアルタイムストリーミングをブリッジする。
リアルタイムストリーミングは5.25倍高速であり, 従来の手法に比べて18%の動作品質向上を実現している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:24:32 GMT)
Rethinking Multiple-Choice Questions for RLVR: Unlocking Potential via Distractor Design [32.2] Reinforcement Learning with Verifiable Rewards (RLVR)は、大規模言語モデルの推論能力を大幅に向上させる。
現在のアプローチでは、Multiple-Choice Questions (MCQ) をオープンなフォーマットに変換することで、これを緩和することが多い。
本稿では,高品質な分散器を積極的に構築し,除去ショートカットをブロックするフレームワークであるIterative Distractor Curation(IDC)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:28:36 GMT)
Experimental realization of a $\cos(2\varphi)$ transmon qubit [30.6] 島は、クーパーペアのペアを選択的に送信するトンネル要素を介して地面に投げ出されます。
対向するクーパー対ペアパリティの状態を13.6mathrmMHz$で2倍にすることができる。
我々は、コヒーレント量子ビット制御、シングルショット読み出し、量子ジャンプの解決を実証する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:10:42 GMT)
Thinking in Streaming Video [30.6] ThinkStreamは、Watch-Think-Speakパラダイムに基づいた、ビデオ推論をストリーミングするためのフレームワークである。
Reasoning-Compressed Streaming Memory (RCSM) は、中間的推論トレースをコンパクトなセマンティックメモリとして扱う。
複数のストリーミングビデオベンチマークの実験では、ThinkStreamが既存のオンラインビデオモデルを大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:33:36 GMT)
GT-Space: Enhancing Heterogeneous Collaborative Perception with Ground Truth Feature Space [30.5] 自律運転において、マルチエージェント協調知覚は、エージェントが知覚データを共有できるようにすることで、知覚能力を高める。
既存のアプローチでは、ペアワイズ機能アライメントのためにエンコーダをリトレーニングしたり、インタプリタモジュールを設計する必要がしばしばある。
異種エージェントのための柔軟でスケーラブルな協調認識フレームワークである Em GT-Space を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:39:40 GMT)
HumDex: Humanoid Dexterous Manipulation Made Easy [30.4] HumDexは、ヒューマノイド全体のデキスタラス操作用に設計された携帯型遠隔操作システムである。
本システムは、IMUに基づくモーショントラッキングを利用して、ポータビリティと精度のトレードオフに対処する。
そこで本研究では,手動パラメータチューニングを伴わないスムーズで自然な手の動きを学習ベースで生成する手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:40:44 GMT)
Exploring pathways towards quantum advantage in quantum chemistry: the case of a molecule with half-Möbius topology [30.2] 半室電子トポロジーを示す分子の超伝導量子プロセッサ上での量子化学計算について報告する。
ランダム化されたサンプルベースKrylov量子対角化アルゴリズムであるSqDRIFTを用いて、36の軌道(72量子ビット)に対応する活性空間上の信頼性の高い量子シミュレーションを行い、以前の研究を50の軌道(100量子ビット)まで拡張する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:05:47 GMT)
From Text to Forecasts: Bridging Modality Gap with Temporal Evolution Semantic Space [30.0] 既存の手法は冗長なトークンに過度に依存し、テキスト意味論を使用可能な数値キューに確実に翻訳するのに苦労していることを示す。
モーダル間の中間ボトルネックとして時間的進化的セマンティック空間を導入したTESSを提案する。
4つの実世界のデータセットの実験では、最先端のユニモーダルベースラインやマルチモーダルベースラインと比較して、予測エラーが29%減少することが示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:11:54 GMT)
TacVLA: Contact-Aware Tactile Fusion for Robust Vision-Language-Action Manipulation [27.0] VLA(Vision-Language-Action)モデルは、ロボット操作において大きな優位性を示している。
本稿では,触覚モーダルを変換器のポリシーに組み込んだ微調整VLAモデルTacVLAを提案する。
本稿では,接触検出時にのみ触覚トークンを選択的に活性化する接触認識ゲーティング機構を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:20:41 GMT)
Text-Phase Synergy Network with Dual Priors for Unsupervised Cross-Domain Image Retrieval [26.7] 本稿では,2つの優先順位を持つテキスト・モデル・シナジー・ネットワークを提案する。
TPSNet は UCDIR ベンチマークで最先端の手法を大幅に上回っている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:46:32 GMT)
SODA: Sensitivity-Oriented Dynamic Acceleration for Diffusion Transformer [26.7] 拡散変換器は視覚生成において支配的なパラダイムとなっているが、その低推論効率は依然として重要なボトルネックである。
我々は,微粒化感度に基づいてキャッシングとプルーニングを適応的に行う,感性指向動的加速度法SODAを提案する。
DiT-XL/2、PixArt-$$、OpenSoraの実験では、SODAが制御可能な加速比の下で最先端の生成フィリティを達成することを示した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:32:01 GMT)
Safety-guaranteed and Goal-oriented Semantic Sensing, Communication, and Control for Robotics [26.7] ワイヤレス接続されたロボットシステムは、意思決定にリモートコンピューティングリソースを活用することで、ロボットにリアルタイムインテリジェンスを付与する。
ロボットと基地局間のデータ交換は、しばしば通信リンクを圧倒し、リアルタイムのレスポンスを損なうレイテンシーを導入する。
無線接続型ロボットシステムにおける安全性保証と目標指向のセマンティックコミュニケーションを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:28:28 GMT)
XSkill: Continual Learning from Experience and Skills in Multimodal Agents [26.6] XSkillはマルチモーダルエージェントの経験とスキルから継続的に学習するためのデュアルストリームフレームワークである。
XSkillは、視覚観察における知識抽出と検索の両方の基礎となる。
XSkillは、ツールのみのベースラインと学習ベースのベースラインの両方を一貫して、実質的に上回っている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:10:26 GMT)
SldprtNet: A Large-Scale Multimodal Dataset for CAD Generation in Language-Driven 3D Design [26.6] 我々は242,000以上の産業部品からなる大規模データセットであるSldprtNetを紹介した。
このデータセットは、さまざまなトレーニングとテストをサポートするために、.stepと.sldprtフォーマットの両方で3Dモデルを提供する。
慎重に選択された実世界の産業部品を備え、スケーラブルなデータセット拡張のためのツールをサポートする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:47:08 GMT)
CMHANet: A Cross-Modal Hybrid Attention Network for Point Cloud Registration [26.5] 本稿では,クロスモーダルハイブリッドアテンションネットワークであるCMHANetを提案する。
本手法は2次元画像からのリッチな文脈情報の融合と3次元点雲の幾何学的詳細を融合する。
提案手法は,登録精度と総合ロバスト性の両方を大幅に向上し,現在の技術より優れていることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:09:22 GMT)
RoboStream: Weaving Spatio-Temporal Reasoning with Memory in Vision-Language Models for Robotics [25.9] VLMベースのプランナーは、各ステップを観察とアクションのマッピングとして扱い、各決定点ごとに生のピクセルからシーンの幾何学を推論する。
SStream-Temporal Fusion Tokens (TF-Tokens) を提案する。
この設計により、プランナーは因果連鎖を追跡でき、追加の訓練や微調整をすることなく、隠蔽下でオブジェクトの永続性を維持することができる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:34:26 GMT)
Seeing Eye to Eye: Enabling Cognitive Alignment Through Shared First-Person Perspective in Human-AI Collaboration [25.4] Eye2Eyeは、人間とAIの認知アライメントのためのチャネルとして、一対一の視点を活用するフレームワークである。
1) 流体焦点アライメントのための共同注意調整,(2) 進化する共通基盤を維持するための修正可能なメモリ,(3) ユーザのAI理解の明確化と洗練を可能にする反射フィードバック,の3つのコンポーネントを統合している。
その結果,Eye2Eyeは信頼度を高めながらタスク完了時間とインタラクション負荷を著しく低減し,コラボレーションを改善するためにコンポーネントが協調して動作することを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:28:20 GMT)
MotionAnymesh: Physics-Grounded Articulation for Simulation-Ready Digital Twins [25.3] MotionAnymeshは、非構造化の静的メッシュをシミュレーション可能なデジタルツインにシームレスに変換するフレームワークである。
提案手法は, VLM推論をSP4D物理先行値で根拠とした運動認識部分分割モジュールを特徴とする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:30:42 GMT)
Egocentric World Model for Photorealistic Hand-Object Interaction Synthesis [25.2] EgoHOIは、このショートカットから分離したエゴセントリックなHOIワールドモデルであり、アクション信号のみからの光リアルで接触一貫性のある相互作用をシミュレートする。
エゴホイは幾何学的およびキネマティックな先駆体を3次元推定から物理インフォームド埋め込みに蒸留する。
HOT3Dデータセットの実験では、強いベースラインよりも一貫したゲインを示し、設計の有効性を検証する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:46:17 GMT)
Vision Verification Enhanced Fusion of VLMs for Efficient Visual Reasoning [25.0] 視覚言語モデル(VLM)間の相補的推論を捉えるために焦点誤差の多様性を導入する。
核融合性能に価値を付加しない成分VLMを抽出するために遺伝的アルゴリズムを適用した。
我々のV3フュージョンアプローチは、視覚言語推論のための高性能なデュアル焦点分散フュージョン予測を生成することができる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:25:12 GMT)
FraudFox: Adaptable Fraud Detection in the Real World [24.9] 月曜日の3時に、500ドルの靴を買おうとしていたスミスは、どれほど疑わしいのか?
対向的な環境で、少数のリスク評価モジュール(オークル')からリスクスコアをマージするにはどうすればよいか?
FraudFoxは不正防止サブシステムを強化し、パフォーマンスを大きく向上させた。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:19:03 GMT)
Open World MRI Reconstruction with Bias-Calibrated Adaptation [24.7] 見えない画像センター、解剖学的構造、または取得プロトコルからのデータは、トレーニングデータと大きく異なるため、パフォーマンスが著しく低下する可能性がある。
最小限の介入原理に基づくバイアス校正適応フレームワークであるBiasReconを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:49:08 GMT)
FDeID-Toolbox: Face De-Identification Toolbox [24.6] Face Dedentification (FDeID) は、顔画像から個人識別可能な情報を除去することを目的としている。
プライバシを保存するコンピュータビジョンにとって重要であるが、領域は断片化された実装、一貫性のない評価プロトコル、研究全体での互換性のない結果に悩まされている。
再現可能なFDeID研究用に設計された総合ツールボックスであるFDeID-Toolboxについて述べる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:15:34 GMT)
CarPLAN: Context-Adaptive and Robust Planning with Dynamic Scene Awareness for Autonomous Driving [24.6] CarPLANは、駆動コンテキスト理解を明示的に強化する新しいILベースのモーションプランニングフレームワークである。
変位認識予測一般化(DPE)はモデルの空間認識を改善する。
CMD(Context-adaptive Multi-Expert Decoder)は、さまざまな駆動コンテキストを扱うモデルの能力を改善する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:22:32 GMT)
AI Model Modulation with Logits Redistribution [24.6] AIMはモデル変調パラダイムであり、単一のモデルが特定のエンド要件を満たすための多様な振る舞いを示すことを可能にする。
トレーニングデータに依存しない,再学習のない方法で運用する,ロジット再配布戦略を導入する。
本評価では, 画像分類, セマンティックセグメンテーション, テキスト生成を対象とするAlモデル変調のためのAIMの実用性と汎用性を確認した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:57:23 GMT)
TerraFlow: Multimodal, Multitemporal Representation Learning for Earth Observation [24.5] 地球観測のためのマルチモーダル・マルチテンポラル学習のための新しいアプローチTerraFlowを提案する。
本実験は,GEO-Bench-2ベンチマークの時間的タスク全体にわたって,地球観測の最先端基盤モデルよりもTerraFlowの方が優れていることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:04:54 GMT)
TRACE: Structure-Aware Character Encoding for Robust and Generalizable Document Watermarking [24.4] TRACEは、ローカライズされた文字エンコーディングに拡散モデルを活用する構造認識フレームワークである。
nameは複数の言語やフォントにまたがる広範な一般化を実現しており、特に実用的な文書セキュリティアプリケーションに適している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:21:40 GMT)
Governance of AI-Generated Content: A Case Study on Social Media Platforms [24.4] 我々は、40のソーシャルメディアプラットフォームにわたるAI生成コンテンツのガバナンスについて検討する。
わずか3分の2は、6つのテーマにまたがるAI生成コンテンツのガバナンスを明示的に記述している。
我々は、利害関係者や政策立案者がより直接的で包括的で、前向きなAI生成コンテンツガバナンスを開発することを提案します。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:41:58 GMT)
SmoothTurn: Learning to Turn Smoothly for Agile Navigation with Quadrupedal Robots [24.2] 四足歩行ロボットは、火災救助や産業検査のような価値ある現実世界の応用に大きな可能性を秘めている。
既存のアジャイルナビゲーションのアプローチでは、ロボットが到達した後に目標位置に留まるよう促すことで、単一ゴールのリーチポリシーを学ぶのが一般的である。
学習ベースのコントロールフレームワークであるSmoothTurnを紹介します。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:44:33 GMT)
PhyGile: Physics-Prefix Guided Motion Generation for Agile General Humanoid Motion Tracking [24.0] 本稿では,ロボットネイティブ動作生成と推論のループを閉じる統合フレームワークであるPhyGileを紹介する。
我々は,GMTコントローラをカリキュラムベースのMix-of-expertsスキームでトレーニングし,その後,大規模ロボット動作に対するロバスト性を改善するためにラベル付き動作データを用いた後学習を行った。
PhyGileはテキスト駆動型ヒューマノイドコントロールのフロンティアを拡張し、アジャイルの安定したトラッキングを可能にする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:43:44 GMT)
Test-Time Attention Purification for Backdoored Large Vision Language Models [23.9] 大規模視覚言語モデル(LVLM)におけるバックドア行動の新しい力学的理解を提供する。
テスト時に純粋に動作するトレーニングフリーのプラグアンドプレイディフェンスであるCleanSightを提案する。
CleanSightは、さまざまなデータセットとバックドアアタックタイプで、既存のピクセルベースの浄化防御を著しく上回る。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:45:06 GMT)
TERMINATOR: Learning Optimal Exit Points for Early Stopping in Chain-of-Thought Reasoning [23.9] 大規模推論モデル(LRM)は、Chain-of-Thought (CoT)推論を介して複雑な推論タスクにおいて印象的な性能を達成する。
LRMは、しばしば重大な過大評価に悩まされ、答えが早く生成された後も過剰な計算時間を使います。
過剰思考を緩和するために, LRM の早期退避戦略である TERMINATOR を提案する。
TERMINATORは、4つの挑戦的な実用的なデータセットで平均して14%-55%のCoT長を大幅に削減する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:07:18 GMT)
3DTCR: A Physics-Based Generative Framework for Vortex-Following 3D Reconstruction to Improve Tropical Cyclone Intensity Forecasting [23.8] 3DTCRは3次元TC構造再構築のための物理制約と生成AI効率を組み合わせた物理ベースの生成フレームワークである。
このフレームワークは、低解像度のターゲットと過度に滑らかな予測によって課される制限を緩和する。
その結果、3DTCRはECMWFの高分解能予測システムより優れていた。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:00:07 GMT)
Interrogating Design Homogenization in Web Vibe Coding [23.5] ウェブビブ符号化における設計均質化の可能性について検討する。
我々は、摩擦のない生成の推進が均質化とその害を悪化させる可能性があると認識する。
本稿では,生産的摩擦を主眼とした緩和フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:45:04 GMT)
Concurrent Prehensile and Nonprehensile Manipulation: A Practical Approach to Multi-Stage Dexterous Tasks [23.5] 実世界のデキスタラスマルチタスク操作のためのサンプル効率の良いアプローチであるDexMultiを提案する。
モノリシックなポリシーを学習する代わりに、現在のオブジェクトの幾何学に基づくスキルを抽出する。
提案手法は,オブジェクトごとの3~4つの実演で平均66%の成功率を達成し,拡散政策ベースラインを2~3倍に向上させる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 22:10:34 GMT)
ToolTree: Efficient LLM Agent Tool Planning via Dual-Feedback Monte Carlo Tree Search and Bidirectional Pruning [23.1] 大規模言語モデル(LLM)エージェントは、複雑で多段階的なタスクにますます適用される。
ツール計画のための新しいモンテカルロ木探索インスパイアされた計画パラダイムであるToolTreeを紹介する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:37:06 GMT)
Deciphering Scientific Reasoning Steps from Outcome Data for Molecule Optimization [22.9] 結果から科学的推論を解読するフレームワークであるDESROを提案する。
グループ化されたデータ内の共有パターンと重要な違いを分析することで、大きな言語モデル(LLM)が基盤となるロジックを復元することができる。
我々はこの枠組みを分子最適化において、薬物発見の重要な段階としてインスタンス化する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:25:27 GMT)
ZO-SAM: Zero-Order Sharpness-Aware Minimization for Efficient Sparse Training [22.7] スパースニューラルネットワークは、パラメータ数と計算オーバーヘッドを劇的に削減することで、制約を著しく緩和する。
既存のスパーストレーニング手法は、しばしばカオスでノイズの多い勾配信号を経験し、収束と一般化性能を著しく妨げている。
我々は,ゼロオーダーのシャープネス・アウェア最小化(ZO-SAM)を提案し,これはSAMアプローチ内でゼロオーダーの最適化を戦略的に統合する新しい最適化フレームワークである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:11:41 GMT)
Breaking the Tuning Barrier: Zero-Hyperparameters Yield Multi-Corner Analysis Via Learned Priors [22.2] 既存の手法は基本的なトレードオフに直面しており、単純なモデルは自動化されるが非線形回路では失敗する。
私たちは、数百万の回帰タスクで事前トレーニングされた基礎モデルから、エンジニアリングされた事前を学習された事前に置き換えることで、この障壁を突破します。
提案手法は,最先端の精度(平均MREが0.11%以下)とゼロチューニングとを一致させ,総検証コストを10倍以上削減する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:40:57 GMT)
Reasoning over Video: Evaluating How MLLMs Extract, Integrate, and Reconstruct Spatiotemporal Evidence [22.0] 大規模言語モデルが抽象的時間的推論を行うことができるかどうかは不明である。
本稿では,抽象的推論タスクと抽出的推論タスクを組み合わせたベンチマークVA-BENCHを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:40:42 GMT)
A Causal Framework for Mitigating Data Shifts in Healthcare [22.0] Causalityは、多様なドメインシフトを特徴づけ、理解するための強力な言語を提供する。
これにより、モデルが一般化に失敗する理由を特定でき、シフトの準備と適応のためのより原則化された戦略がもたらされます。
我々の因果関係に基づく視点は、医療における堅牢で解釈可能な、臨床的に関連するAIソリューションを開発するための重要な基盤を提供する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:10:02 GMT)
Purify Once, Edit Freely: Breaking Image Protections under Model Mismatch [21.8] 拡散モデルは高忠実な画像編集を可能にするが、不正なスタイルの模倣や有害なコンテンツ生成に誤用することもできる。
これらのリスクを軽減するため、プロアクティブな画像保護手法は、下流の編集や微調整を妨害するために共有する前に、画像に小さな、しばしば知覚できない敵の摂動を埋め込む。
我々は,モデルミスマッチ下での保護生存性を評価するために,統合されたリリース後浄化フレームワークを導入する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:36:46 GMT)
Real-time Rendering-based Surgical Instrument Tracking via Evolutionary Optimization [21.4] 手術器具のポーズと関節構成を共同で推定する多目的追跡パイプラインを提案する。
提案手法は,視覚フィードバック制御とオンライン手術ビデオキャリブレーションの両方に適合する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:46:22 GMT)
daVinci-Env: Open SWE Environment Synthesis at Scale [21.3] 有能なソフトウェアエンジニアリング(SWE)エージェントの訓練には、大規模で実行可能で検証可能な環境が必要である。
我々は、PythonにおけるSWEエージェントトレーニングのための最大の完全透明なフレームワークであるOpenSWEを紹介する。
OpenSWEは64ノードの分散クラスタにデプロイされたマルチエージェント合成パイプラインを通じて構築される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:32:40 GMT)
Learning Actionable Manipulation Recovery via Counterfactual Failure Synthesis [21.2] 現在の障害学習パラダイムは、コストと安全性の低い実世界のデータ収集か、シミュレータベースの摂動に依存している。
このフレームワークは,実世界の実演を成功させるのから直接,フォトリアリスティックでファクトファクトファクトのロールアウトを合成するものだ。
生成の世界モデル内でアクションを摂動させることで、Dream2Fixはシミュレータに頼ることなくペアの失敗言語データを生成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:02:58 GMT)
A Prediction-as-Perception Framework for 3D Object Detection [21.0] 予測知覚(PAP)フレームワークは、予測知覚アーキテクチャを3Dオブジェクト認識タスクに統合する。
PAP構造により、UniADの目標追跡精度が10%向上し、推論速度が15%向上する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:04:55 GMT)
Test-time RL alignment exposes task familiarity artifacts in LLM benchmarks [21.0] 評価の前に各モデルにタスク関連トレーニングを施すことにより、タスク親しみやすさを列車前テストで制御する。
列車前テストのための2段階テスト時強化学習(RL)アライメント手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:24:19 GMT)
Hierarchical Dual-Change Collaborative Learning for UAV Scene Change Captioning [20.8] 本稿では,UAVシーン理解のための新しいタスクであるUAVシーン変更キャプションを提案する。
動的空中画像における意味的変化の自然言語記述を生成することを目的としている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:33:11 GMT)
VCBench: A Streaming Counting Benchmark for Spatial-Temporal State Maintenance in Long Videos [20.8] 我々は,世界的メンテナンス能力の診断のための最小限のプローブとしてカウントするストリーミングカウントベンチマークであるVCBenchを提案する。
VCBenchには、フレーム単位のアノテーションで10,071のイベント発生モーメントとオブジェクト状態変更モーメントを備えた406のビデオが含まれている。
数値精度,軌道整合性,時間的認識の3つの相補的指標を設計する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:28:46 GMT)
Enhanced Drug-drug Interaction Prediction Using Adaptive Knowledge Integration [20.7] 薬物の知識を大規模言語モデル(LLM)に適応的に注入する知識増強フレームワークを提案する。
このフレームワークは強化学習技術を利用して、適応的な知識抽出と合成を容易にする。
数発の学習の結果,ベースラインに比べて顕著な改善が得られた。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:33:57 GMT)
DAST: A Dual-Stream Voice Anonymization Attacker with Staged Training [20.6] 並列エンコーダを用いたスペクトルおよび自己教師型学習機能を融合したデュアルストリーム攻撃手法を提案する。
そこで我々は,Stage IIが一般化の主要な要因であることを示し,未知の匿名化データセットに対する強力な攻撃性能を実現する。
Stage IIIでは、ターゲットの匿名化データセットの10%のみの微調整が、EERの観点から現在の最先端の攻撃者を上回っている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:43:35 GMT)
Developing and evaluating a chatbot to support maternal health care [20.3] 本稿では,インドにおける母体保健ロボットについて,学術研究者,医療技術企業,公衆衛生非営利団体,病院との共同研究を通じて紹介する。
本システムは,(1)ステージアウェアトリアージ,(2)専門家テンプレートへのハイリスククエリのルーティング,(2)母子・新生児ガイドラインのハイブリッド検索,(3)LCMからのエビデンス条件付き生成を組み合わせた。
当社のコアコントリビューションは、専門家の限られた監督の下での、ハイテイクデプロイメントの評価ワークフローです。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:02:05 GMT)
RXNRECer Enables Fine-grained Enzymatic Function Annotation through Active Learning and Protein Language Models [20.2] RXNRECerは変換器をベースとしたアンサンブルフレームワークで、EC番号に依存しない酵素触媒反応を直接予測する。
タンパク質言語モデリングとアクティブラーニングを統合して、高レベルのシーケンスセマンティクスときめ細かい変換パターンの両方をキャプチャする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:20:14 GMT)
PISmith: Reinforcement Learning-based Red Teaming for Prompt Injection Defenses [19.9] PISmithは,既存のプロンプト・インジェクション・ディフェンスを評価するフレームワークである。
強力な防御に標準GRPOを適用すると、準最適性能が得られることが判明した。
適応的エントロピー正則化と動的優位重み付けを導入し、探索を継続し、少ない成功から学習を増幅する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:34:54 GMT)
A Spectral Revisit of the Distributional Bellman Operator under the Cramér Metric [19.8] 分布強化学習(DRL)はベルマン更新の下での完全回帰分布の進化を研究する。
古典的な結果は、分布ベルマン作用素がクラメール計量の下で収縮的であることである。
我々は分布ベルマン力学をCDFのレベルで直接解析し、クラメル幾何学を本質的な解析的設定として扱う。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:21:54 GMT)
Bridging Sequential and Contextual Features with a Dual-View of Fine-grained Core-Behaviors and Global Interest-Distribution [19.6] 逐次的特徴相互作用と文脈的特徴相互作用のギャップを埋めるために,コアビヘイビアと分布補償デュアルビューインタラクションネットワーク(CDNet)を提案する。
CDNetは、全体的なユーザ関心を保たずに重要な行動の詳細を同時にキャプチャすることで、シーケンシャルな特徴とコンテキスト的な特徴の相互作用を効果的にモデル化する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:24:45 GMT)
When Right Meets Wrong: Bilateral Context Conditioning with Reward-Confidence Correction for GRPO [19.0] グループ相対政策最適化(GRPO)は、推論モデルを訓練するための効果的な方法として登場した。
本稿では,GRPOの目的が正解率と正解率とのマージンを暗黙的に最大化することを示す。
本稿では,モデルが相互参照を成功させる機構であるバイラテラルコンテキストコンディショニング(BICC)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:25:02 GMT)
A Multi-task Large Reasoning Model for Molecular Science [19.0] 既存の分子モデルは主にプロプライエタリであり、一般的な分子知性と一般化性に欠ける。
本稿では,分子科学者の認知過程をエミュレートする多タスク大推論モデルを提案する。
提案手法は,多種多様な分子知識とチェーン・オブ・シント・フレームワークを提供するために,多種特異モジュールを組み込んだものである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:10:43 GMT)
Draft-and-Target Sampling for Video Generation Policy [18.9] 本稿では,ビデオ生成ポリシーのための新しい拡散推論パラダイムであるDraft-and-Target Smplingを提案する。
提案手法は, 最大2.1倍の高速化を実現し, 成功率を最小限に抑えながら, 現在の最先端手法の効率を向上させることができる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:54:18 GMT)
Spatial Transcriptomics as Images for Large-Scale Pretraining [18.7] 空間トランスクリプトークスは、組織部分の正確な座標で、個別の場所で数千の遺伝子発現値をプロファイルする。
シークエンシングスループットの上昇とプログレッシブプラットフォームにより、拡張データボリュームは大規模なST事前トレーニングを動機付けている。
既存の選択は,(1)空間依存を排除し,STを単細胞転写学に分解する独立したサンプルとして,(2)スライド全体を単一サンプルとして扱うことにより,極めて大きな入力を発生させ,トレーニング例を劇的に少なくする。
我々は,空間転写学を収穫可能な画像として扱うことを提案する。具体的には,収穫パッチによる固定空間サイズの多チャンネル画像表現を定義する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:12:26 GMT)
Reference-Free Image Quality Assessment for Virtual Try-On via Human Feedback [18.7] 画像ベース仮想トライアン(VTON)は、対象の衣服を着用している人の試着画像を合成する。
現実のシナリオでは、ターゲットの服装を身に着けている同一人物の地味なイメージは通常利用できない。
本稿では,仮想試行錯誤のための画像品質評価(VTONIQA)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:06:48 GMT)
Spectral-Geometric Neural Fields for Pose-Free LiDAR View Synthesis [18.7] 我々は、スペクトル情報と幾何整合性を統合する、ポーズレスLiDAR NeRFフレームワークであるSG-NLFを提案する。
我々の研究は、LiDARビュー合成の新しい視点を提供することができる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:07:17 GMT)
FLUX: Accelerating Cross-Embodiment Generative Navigation Policies via Rectified Flow and Static-to-Dynamic Learning [18.6] 物理的に有効な群集シミュレーションを特徴とする動的ナビゲーションベンチマークであるDynBenchを紹介する。
本フレームワークではフローベースの統合ナビゲーションポリシーであるFLUXを提案する。
FLUXは反復デノイングを直線軌道に置き換え、従来のフローベース手法よりもステップごとの推論効率を47%向上させる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:10:01 GMT)
Conflict Mitigation in Shared Environments using Flow-Aware Multi-Agent Path Finding [18.5] Flow-Aware Multi-Agent Path Finding (FA-MAPF)は、制御不能エージェントの学習された動作パターンを集中MAPFアルゴリズムに統合する新しいフレームワークである。
その結果、FA-MAPFは、タスク効率を損なうことなく、制御不能なエージェントとの競合を最大55%減らすことができることがわかった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:28:36 GMT)
AVION: Aerial Vision-Language Instruction from Offline Teacher to Prompt-Tuned Network [17.8] リモートセンシング画像への視覚言語モデルの適用は、セマンティックカバレッジの制限と視覚的特徴の適応性が不十分なため、依然として困難である。
視覚言語モデルのリモートセンシング適応に適した知識蒸留フレームワークであるAVIONを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:02:01 GMT)
Node-RF: Learning Generalized Continuous Space-Time Scene Dynamics with Neural ODE-based NeRFs [17.8] 既存の手法は、トレーニングシーケンスをはるかに超えていない観察境界のみをキャプチャする。
動的放射場(RFRF)を持つニューラル正規方程式(RF)
共有ダイナミクスを用いた複数の動き列のトレーニングは、目に見えない条件に対する一般化を可能にする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:09:02 GMT)
Mask2Flow-TSE: Two-Stage Target Speaker Extraction with Masking and Flow Matching [17.7] ターゲット話者抽出(TSE)は、基準発話の重なり合う音声の混合から対象話者の声を抽出する。
識別法は、高速な推測のために時間周波数マスキングを適用するが、しばしばターゲット信号を過度に抑圧する。
生成法は、多数の反復的なステップを犠牲にして高品質な音声を合成する。
両パラダイムの長所を組み合わせた2段階のフレームワークであるMask2Flow-TSEを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:40:13 GMT)
A Closed-Form Solution for Debiasing Vision-Language Models with Utility Guarantees Across Modalities and Tasks [17.7] VLM(Vision-Language Models)は、下流の様々なタスクで顕著なパフォーマンスを実現している。
近年の研究では、トレーニングデータから社会的バイアスを継承し、下流のアプリケーションに広めることができることが示されている。
クロスモーダル空間におけるtextbfclosed-form 解を生成するデバイアス法を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:55:34 GMT)
Panoramic Multimodal Semantic Occupancy Prediction for Quadruped Robots [17.6] 四足歩行ロボットのためのパノラマ型マルチモーダル占有データセットであるPanoMMOccを提案する。
本稿では,足の移動と球面イメージングに適したパノラママルチモーダル占有感フレームワークであるVoxelHoundを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:04:33 GMT)
Towards Spatio-Temporal World Scene Graph Generation from Monocular Videos [17.2] 本稿では,Action Genomeの映像をフィードフォワード3D再構成により4DシーンにアップグレードするデータセットであるActionGenome4Dを紹介する。
次に、各タイムスタンプでワールドシーングラフを構築するタスクであるワールドシーングラフ生成(WSGG)を定式化する。
我々は3つの補完的手法を提案し、それぞれが観測されていない物体について推論するための異なる帰納バイアスを探索する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:18:03 GMT)
Autonomous Integration and Improvement of Robotic Assembly using Skill Graph Representations [17.2] 本稿では,Skill Graph表現に基づくロボット組立システムの自律的統合と継続的改善のためのフレームワークを提案する。
Skill Graphは、ロボット機能を動詞ベースのスキルとして整理し、意味記述を実行可能なポリシー、条件前、条件後、評価者と明示的にリンクする。
Skill Graphsは,ロボットコントローラや知覚モジュールに対して,明確に定義されたインターフェースによる実行を基盤として,スキルに対するセマンティックレベルの計画を支援することで,迅速なシステム統合を実現する方法を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:41:10 GMT)
VoXtream2: Full-stream TTS with dynamic speaking rate control [17.1] VoXtream2は、動的発話速度制御を備えたゼロショットフルストリーム音声合成モデルである。
プロンプトテキストマスキングは、テキストなしの音声プロンプトを可能にし、プロンプトの書き起こしを不要にする。
フルストリームモードでは、コンシューマGPU上で74msのファーストパッケージレイテンシで、リアルタイムよりも4倍高速で動作する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:49:25 GMT)
TubeMLLM: A Foundation Model for Topology Knowledge Exploration in Vessel-like Anatomy [16.3] TubeMLLMは、医療血管のような解剖学のための制御可能な生成と構造的理解を結合した統合基盤モデルである。
トポロジ的先行を明示的な自然言語によって統合し、それらを共有アテンションアーキテクチャの視覚的表現と整合させることで、チューブMLLMはトポロジ的認識を著しく強化する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:45:42 GMT)
Swap-guided Preference Learning for Personalized Reinforcement Learning from Human Feedback [16.3] 変分選好学習(VPL)は、ユーザ固有の潜伏変数を導入することで、この問題に対処しようとしている。
スパースな選好データの下では、VPLは潜伏変数を無視し、シングルリワードモデルに戻す。
この制限を克服するために,Swap-guided Preference Learning (SPL)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:51:50 GMT)
Opportunistic Cardiac Health Assessment: Estimating Phenotypes from Localizer MRI through Multi-Modal Representations [16.1] 心電図(Electrocardiograms:ECGs)は安価で、臨床では日常的に整列し、心臓の時間的活動を把握する。
本稿では、ローカライザMRI、ECG信号、グラフメタデータを整列させて頑健な潜伏空間を学習するマルチモーダルフレームワークであるC-TRIPを紹介する。
提案したC-TRIPは, 正確な機能CP, 構造CPの相関性を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:00:48 GMT)
MRGeo: Robust Cross-View Geo-Localization of Corrupted Images via Spatial and Channel Feature Enhancement [16.0] クロスビュージオローカライゼーション (CVGL) は、対応するジオタグ付き衛星画像の検索により、ストリートビュー画像を正確にローカライズすることを目的としている。
以前の研究は、特定の標準データセット上でほぼ完璧なパフォーマンスを達成したが、現実の腐敗した環境での堅牢性は、まだ未調査のままである。
汚職下での堅牢なCVGLのための最初の体系的手法であるMRGeoを紹介する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:37:43 GMT)
As Language Models Scale, Low-order Linear Depth Dynamics Emerge [15.9] 大きな言語モデルは高次元非線形システムと見なされ、ブラックボックスとして扱われることが多い。
我々は,変圧器の深度力学がコンテキスト内で正確な低次線形サロゲートを持つことを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:51:53 GMT)
ARL-Tangram: Unleash the Resource Efficiency in Agentic Reinforcement Learning [15.9] ARL-Tangramは、きめ細かい外部リソース共有と弾力性を実現する統一されたリソース管理システムである。
ARL-Tangramは平均ACTを最大4.3$times$で改善し、RLトレーニングのステップ期間を1.5$times$で高速化し、外部リソースを最大71.2$%$で節約する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:25:20 GMT)
When Drafts Evolve: Speculative Decoding Meets Online Learning [15.7] 投機的復号化は、追加コストなしでドラフトモデルとターゲットモデルの偏差を定量化する検証フィードバックを提供する。
インタラクティブなフィードバックを体系的に活用し、継続的なドラフトモデルを進化させる統合フレームワークであるOnlineSpecを提案する。
我々のアルゴリズムは理論的な正当化と加速率の改善を備えており、7つのベンチマークと3つの基礎モデルに対して最大24%の高速化を実現している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:44:27 GMT)
Purifying Generative LLMs from Backdoors without Prior Knowledge or Clean Reference [15.2] バックドア攻撃は大規模言語モデル(LLM)に深刻なセキュリティ脅威をもたらす
我々は、事前のトリガー知識やクリーン参照を必要とせずに、命令調整型LLMのための新しいフレームワークを提案する。
生成能力を保ちながら、多様なバックドア攻撃や脅威モデルに耐える浄化されたモデルを作成します。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:09:37 GMT)
Learning Energy-Efficient Air--Ground Actuation for Hybrid Robots on Stair-Like Terrain [14.9] ハイブリッドな地上ロボットは、移動性と耐久性の両方を提供するが、階段のような不連続性はトレードオフを生み出す。
本研究では,プロペラ,車輪,傾斜サーボを,既定の空地モードや地上モードを使わずに調整するための一貫した政策を訓練するエネルギー対応強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:55:01 GMT)
A Directly Modulated Laser Platform for High-Dimensional Quantum Key Distribution [14.7] HD-QKDは、バイナリエンコードされたQKDを超える秘密鍵レートを高めるための有望なアプローチを提供する。
そこで我々は,HD-QKDのための直接変調レーザプラットフォームを設計し,実験的に実現した。
我々は,HD-QKDの伝送距離250kmを実現し,長距離量子通信の実現可能性を示した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:20:29 GMT)
Decoding Matters: Efficient Mamba-Based Decoder with Distribution-Aware Deep Supervision for Medical Image Segmentation [14.6] 一般化された2次元医用画像分割のためのデコーダ中心のアプローチを提案する。
提案されたDeco-Mambaは、Transformer-CNN-Mambaの設計によるU-Netのような構造である。
多様な医用画像セグメンテーションベンチマークの実験により、最先端の性能と強力な一般化能力が得られる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:13:52 GMT)
Design-Specification Tiling for ICL-based CAD Code Generation [14.4] 大規模言語モデル(LLM)は、コード生成において顕著な能力を示しているが、訓練データが少ないため、CAD(Computer-Aided Design)コード生成のようなドメイン固有のタスクでは性能が低い。
本研究では,設計仕様におけるすべての要件を最大限に満たすことを目的とした,模範選択のための原則的目的として,知識満足度を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:46:43 GMT)
Almost-Free Queue Jumping for Prior Inputs in Private Neural Inference [14.1] PP-MLは暗号プリミティブを統合することで、セキュアなニューラルネットワーク推論を可能にする。
PrivQJは、インプロセッシングスロットのリサイクルを通じて、入力間の共有計算を利用する。
その結果,最先端のPP-MLシステムと比較して,オーバヘッドのオーダー・オブ・マグニチュード低減効果が示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:41:36 GMT)
AOMGen: Photoreal, Physics-Consistent Demonstration Generation for Articulated Object Manipulation [14.1] AOMGenは、調音操作のためのスケーラブルなデータ生成フレームワークである。
1つの実際のスキャン、デモ、利用可能なデジタル資産のライブラリからインスタンス化される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:00:08 GMT)
InterDeepResearch: Enabling Human-Agent Collaborative Information Seeking through Interactive Deep Research [14.0] 本稿では,エージェント研究プロセスにおける人間とループのコラボレーションの欠如について論じる。
我々は、専用の研究コンテキスト管理フレームワークによって支援されたインタラクティブなディープリサーチシステムであるInterDeepResearchを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:23:59 GMT)
SAW: Toward a Surgical Action World Model via Controllable and Scalable Video Generation [13.9] リアルな外科的アクションビデオを生成することができる外科的世界モデルは、外科的AIとシミュレーションの根本的な課題に対処することができる。
現在のビデオ生成法は、推論時の条件付け信号として高価なアノテーションや複雑な構造化中間体を必要とする。
手術行動世界(SAW)は,4つの軽量信号を用いた映像拡散条件による手術行動モデリングに向けてのステップである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:32:41 GMT)
Orla: A Library for Serving LLM-Based Multi-Agent Systems [13.7] LLMベースのエージェントシステムの構築と実行のためのライブラリであるOrlaを紹介する。
Orlaは、ワークフローレベルのポリシーから要求実行を分離する一般的な抽象化を提供する。
我々はOrlaを2つのデータセットで評価し、ステージマッピングが単一モデルvLLMベースラインと比較してレイテンシとコストを改善することを示した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:25:29 GMT)
Federated Hierarchical Clustering with Automatic Selection of Optimal Cluster Numbers [13.4] Federated Clustering(FC)は、分散およびプライバシ保護されたデータから、教師なしの方法でデータ分散パターンを探索する、新しくて有望なソリューションである。
我々はFed-$k*$-HCという新しいFCフレームワークを提案し、階層的クラスタリングによって探索されたデータ分布に基づいて最適なクラスタ数$k*$を自動的に決定できる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:58:35 GMT)
ESG-Bench: Benchmarking Long-Context ESG Reports for Hallucination Mitigation [13.3] 本稿では,大規模言語モデル(LLM)におけるESGレポート理解と幻覚軽減のためのベンチマークデータセットであるESG-Benchを紹介する。
ESG-Benchには、現実のESGレポートのコンテキストに基づいた、人間の注釈付き質問応答ペアが含まれている。
タスク固有のChain-of-Thoughtプロンプト戦略を設計し、CoTアノテート論理を用いたESG-Bench上の複数の最先端LCMを微調整する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:48:05 GMT)
GeoChemAD: Benchmarking Unsupervised Geochemical Anomaly Detection for Mineral Exploration [13.3] textbfGeoChemADは、政府主導の地質調査からコンパイルされたオープンソースのベンチマークデータセットである。
textbfGeoChemFormerはトランスフォーマーベースのフレームワークで、空間サンプルのターゲット要素を意識した地球化学的表現を学習する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:14:57 GMT)
Exploring Subnetwork Interactions in Heterogeneous Brain Network via Prior-Informed Graph Learning [13.2] KD-Brainは、学習プロセスのガイドとして、事前知識を明示的にエンコードする事前インフォームドグラフ学習フレームワークである。
KD-Brainは、幅広い疾患の診断において最先端のパフォーマンスをもたらし、解釈可能なバイオマーカーを同定する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:04:23 GMT)
SLICE: Semantic Latent Injection via Compartmentalized Embedding for Image Watermarking [13.2] 拡散モデルの初期のノイズを透かしは、画像の出現に有望なアプローチとして現れている。
近年のセマンティック・アウェア・ウォーターマーキングは画像意味論の条件付けによるロバスト性の向上を図っている。
我々は$underlinetextbfS$emantic $underlinetextbfL$atent $underlinetextbfI$njection via $underlinetextbfC$ompartmentalized $underlinetextbfE$mを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:49:01 GMT)
Locatability-Guided Adaptive Reasoning for Image Geo-Localization with Vision-Language Models [13.1] 地理的局所化における深部推論に対する画像の適合性を定量化する最適化ロケータビリティスコアを提案する。
本稿では,適応的推論深度,視覚的接地,階層的地理的精度を調節する報酬関数をカスタマイズした2段階グループ相対政策最適化カリキュラムを提案する。
我々のフレームワークであるGeo-ADAPTは、適応的推論ポリシーを学び、複数のジオローカライゼーションベンチマークで最先端のパフォーマンスを達成し、適応的かつ効率的に推論することで幻覚を著しく低減します。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 22:21:00 GMT)
LR-SGS: Robust LiDAR-Reflectance-Guided Salient Gaussian Splatting for Self-Driving Scene Reconstruction [13.1] 本稿では, 自律走行シーンに対する頑健かつ効率的なLiDAR-reflectance-guided Salient Gaussian Splatting法(LR-SGS)を提案する。
LR-SGSはより少ないガウスと短い訓練時間でより優れた再構成性能を達成する。
特に、複雑な照明シーンでは、OmniReを1.18dBPSNRで上回ります。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:35:00 GMT)
Accelerating materials discovery using foundation model based In-context active learning [12.9] アクティブラーニングは、材料発見を加速するための強力なパラダイムとして登場した。
本研究では,数百万の合成タスクを事前学習した変換器ベース基礎モデルであるTabPFNを提案する。
10データセット中8データセットでTabPFNが勝利し、GPに対する追加実験/評価で平均52%、RFに対する29.77%の節約を達成した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:57:09 GMT)
Examining Risks in the AI Companion Application Ecosystem [12.9] 私たちは、AIコンパニオンを宣伝したApp StoreとPlay Storeの489のユニークなアプリを特定します。
脅威を理解するためのコンテキストを提供する、より広範なエコシステムトレンドを分類する。
この研究は、AIコンパニオンアプリケーションエコシステムに関する基本的なセキュリティの視点を提供する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:56:48 GMT)
VIRD: View-Invariant Representation through Dual-Axis Transformation for Cross-View Pose Estimation [12.8] クロスビューポーズ推定は、ジオレファレンス衛星画像に対する地上画像に対応する3DFカメラポーズを予測する。
両軸変換によるビュー不変表現を構成する新しいクロスビューポーズ推定法を提案する。
KITTIデータセットとVIGORデータセットの実験では、VIRDは方向の先行のない最先端の手法よりも優れていることが示されている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:48:22 GMT)
Multimodal Protein Language Models for Enzyme Kinetic Parameters: From Substrate Recognition to Conformational Adaptation [12.7] 酵素の速度論的パラメータの予測は、酵素が特定の基質をいかに効率的に触媒するかを定量化する。
多くの学習パイプラインは、このプロセスを酵素と基質間の静的な互換性問題に単純化する。
本稿では,タンパク質言語モデルへの微調整により,分子間情報を注入するERBA(Enzyme-Reaction Bridging Adapter)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:45:41 GMT)
Towards unified brain-to-text decoding across speech production and perception [12.7] 中国語における音声生成と知覚の両面に対して,脳から文への統一的なデコーディングフレームワークを提案する。
このフレームワークは強力な一般化能力を示し、単一文字データでのみ訓練された場合の文レベルのデコードを可能にする。
本研究は,統合復号化フレームワークの実現可能性を確立し,マンダリン音声の生成と知覚の神経特性に関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:59:42 GMT)
Reaction-Level Consistency within the Variational Quantum Eigensolver: Homodesmotic Ring Strain Energies of Cyclic Hydrocarbons [12.5] 我々は, 対称誘導型活性空間選択プロトコルを用いて, 複素炭化水素の環ひずみエネルギーをホモデマティック反応法を用いて計算する。
このプロトコルは、すべての反応物と生成物間で対称性の整合性を強制し、同じ対称性の一致した分数(SMF)値を生成する活性空間を選択する。
分子複雑性の増大に伴う系統的な性能は、ホモデスメティックな反応設計と対称性を持つVQE計算を組み合わせることの有効性を強調している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:32:18 GMT)
Easy-IIL: Reducing Human Operational Burden in Interactive Imitation Learning via Assistant Experts [12.5] インタラクティブ・イミテーション・ラーニング (Interactive Imitation Learning, IIL) は、通常、オフラインのデモンストレーションとオンラインのインタラクションの両方に広範囲にわたる人間の関与に依存している。
そこで本研究では,市販のモデルベース模倣手法を,アクティブな人体操作を置き換えるための補助専門家として活用するフレームワークであるEasy-IILを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:12:18 GMT)
Stake the Points: Structure-Faithful Instance Unlearning [12.4] マシン・アンラーニング(MU)は、保持された知識の有効性を保ちながら、指定されたデータの影響を取り除くことを目的としている。
本稿では,知識構造を維持するための基準点となるセマンティックアンカーの利害関係を導入する,構造に忠実な新しい枠組みを提案する。
その結果、平均利得は32.9%、22.5%、19.3%で、削除-保留トレードオフのバランスと一般化の強化が示されている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:40:21 GMT)
OpenACMv2: An Accuracy-Constrained Co-Optimization Framework for Approximate DCiM [12.3] Digital Compute-in-Memory (DCiM)は、データ移動を減らすことでニューラルネットワークを加速する。
DCiMは、PPA(Power-Performance-Area)をさらに改善するが、精度に制約のあるコ最適化を必要とする。
2段階最適化によりACCOを運用するオープンフレームワークOpenACMv2を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:50:52 GMT)
A New Kernel Regularity Condition for Distributed Mirror Descent: Broader Coverage and Simpler Analysis [12.2] ヘッセンの相対的一様連続性は、穏やかな条件下で収束を保証する。
我々は、制限的な仮定を課すことなく、ミラー降下に基づく勾配追跡の収束保証を導出する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:40:15 GMT)
ForgeDreamer: Industrial Text-to-3D Generation with Multi-Expert LoRA and Cross-View Hypergraph [12.1] 現在のテキスト・ツー・3D生成法は自然界で優れているが、工業的応用に苦戦している。
本稿では,2つの重要なイノベーションを通じて両課題に対処する新しいフレームワークForgeDreamerを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:39:30 GMT)
Outcome-Aware Tool Selection for Semantic Routers: Latency-Constrained Learning Without LLM Inference [12.1] Outcome-Aware Tool Selection (OATS)は、歴史的に成功したクエリのセントロイドへのツール埋め込みを補間する。
MetaTool (199tools, 4,287queries)では、NDCG@5が0.869から0.940に改善されている。
すべてのメソッドは、同じ保持された30%のテストスプリットで評価される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:13:05 GMT)
Verification and Forward Invariance of Control Barrier Functions for Differential-Algebraic Systems [11.9] 本稿では,射影ベクトル場を通した微分代数構造を組み込んだDAE対応制御障壁関数(CBF)を提案する。
DAE対応CBFに必要かつ十分な条件を確立するための体系的検証フレームワークが開発されている。
この手法は風力タービンとフレキシブルリンクマニピュレータシステムで検証されている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:40:31 GMT)
A theory of learning data statistics in diffusion models, from easy to hard [11.8] 自然画像上で訓練された拡散モデルは、高次相関に特化する前に、単純でペアワイズな入力統計を学習し、分布の単純さのバイアスを示すことを示す。
我々は、この振る舞いを、最小限のデータモデル、混合累積モデルで訓練された単純なデノイザで再現する。
我々の研究は拡散モデルが複雑性の増大する分布を学習する方法の鍵となるメカニズムを記述している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:07:01 GMT)
A Learnable SIM Paradigm: Fundamentals, Training Techniques, and Applications [11.8] 本稿では,学習可能なSIMアーキテクチャを導入し,第6世代(6G)システムのための学習可能なSIMベース機械学習(ML)パラダイムを提案する。
我々は,マルチユーザ信号分離を効果的に実現し,通信信号を妨害信号と区別する2つのSIM方式の無線信号処理手法を開発した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:17:28 GMT)
Hardy's Paradox for Yu-Oh Set Constructed by Logically Contextual Quantum States [11.8] 量子コンテキスト性(quantum contextuality)は、古典的なシステムに対する量子の計算的および情報的優位性を示す重要なリソースである。
我々は、ユオ集合に対して文脈性を目撃する確率論的条件の集合であるハーディのパラドックスを構築する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:33:32 GMT)
DiveUp: Learning Feature Upsampling from Diverse Vision Foundation Models [11.7] DiveUpは、マルチVFMリレーショナルガイダンスを導入することで、単一モデル依存から脱却する新しいフレームワークである。
本稿では,局所的中心-質量場 (COM) として定式化され,固有幾何学的構造を抽出する普遍的関係特徴表現を提案する。
DiveUpは統一されたエンコーダに依存しないフレームワークである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:20:22 GMT)
MetaKE: Meta-learning Aligned Knowledge Editing via Bi-level Optimization [11.4] 最先端の手法はオープンループ制御ミスマッチに悩まされる。
批判的「セマンティック・エクセプション・ディスコネクト」を同定する
両レベルの最適化問題としてKEを再構成する新しいフレームワークであるMetaKEを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:47:00 GMT)
SAIF: A Stability-Aware Inference Framework for Medical Image Segmentation with Segment Anything Model [11.4] Segment Anything Model (SAM)は、スケーラブルな医療画像セグメンテーションを可能にするが、フリーズバックボーンとしてデプロイされた場合、推論時の不安定さに悩まされる。
本研究では,プロンプトとしきい値の不確実性を明示的にモデル化し,ロバスト性を向上させるためのトレーニングフリーかつプラグアンドプレイ型推論フレームワークであるStable-Aware Inference Framework (SAIF)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:15:34 GMT)
Deferred is Better: A Framework for Multi-Granularity Deferred Interaction of Heterogeneous Features [11.4] MGDIN(Multi-Granularity Information-Aware Deferred Interaction Network)を提案する。
MGDINは機能インタラクションプロセスへの機能の導入を適応的に拒否する。
極端な個々の特徴空間の影響を緩和し、モデルが多様な視点から特徴的相互作用をキャプチャできるようにする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:36:25 GMT)
MIRAGE: Model-agnostic Industrial Realistic Anomaly Generation and Evaluation for Visual Anomaly Detection [11.3] MIRAGEは、リアルな異常画像生成とピクセルレベルのマスク生成のための完全に自動化されたパイプラインである。
当社のパイプラインでは,生成モデルをAPIコールを通じてブラックボックスとしてアクセスしています。
マスク生成を大規模に行うためには、軽量でトレーニング不要なデュアルブランチセマンティックチェンジ検出モジュールを導入する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:36:44 GMT)
FastDSAC: Unlocking the Potential of Maximum Entropy RL in High-Dimensional Humanoid Control [11.3] FastDSACは、複雑な連続制御のための最大エントロピーポリシーの可能性を効果的に解放するフレームワークである。
次元ワイドエントロピー変調は、決定論的基底線に一貫して一致するか、より優れることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:27:25 GMT)
AnchorVLA4D: an Anchor-Based Spatial-Temporal Vision-Language-Action Model for Robotic Manipulation [11.2] VLA(Vision-Language-Action)システムは、空間的知覚が限られ、操作を通して記憶が欠如している。
AnchorVLA4Dは、視覚入力をアンカー画像で拡張し、初期シーンコンテキストを保存するシンプルな空間時空間VLAである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:21:16 GMT)
Causal Attribution via Activation Patching [11.1] 視覚変換器(ViT)のためのアクティベーションパッチング(CAAP)による因果属性を提案する。
CAAPは、内部アクティベーションに直接介入することで、ViTの予測に対する個々のイメージパッチの寄与を推定する。
結果の帰属マップは、パッチに関連する内部表現がモデルの予測に因果効果を反映している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 23:25:49 GMT)
Benchmarking Large Language Models on Reference Extraction and Parsing in the Social Sciences and Humanities [11.0] 確立された評価のほとんどは、清潔で、英語で、文書の終わりに焦点を合わせており、それゆえ、社会科学と人文科学を過小評価している。
3つの相補的データセットにまたがるこれらのSSH現実的条件を対象とする統一ベンチマークを提案する。
我々は,参照抽出,参照解析,エンドツーエンド文書解析の3つの課題を評価する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 23:25:03 GMT)
RetroReasoner: A Reasoning LLM for Strategic Retrosynthesis Prediction [10.7] 再合成は、与えられた生成物分子の反応物を予測することを目的とした有機合成のコアタスクである。
本稿では,化学者の戦略的思考を生かしたレトロシンセティック推論モデルRetroReasonerを提案する。
実験の結果、RetroReasonerは以前のベースラインを上回るだけでなく、より広い範囲の実行可能な反応提案を生成することがわかった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:20:56 GMT)
LADR: Locality-Aware Dynamic Rescue for Efficient Text-to-Image Generation with Diffusion Large Language Models [10.5] Locality-Aware Dynamic Rescue (LADR) は画像の空間マルコフ特性を利用して推論を高速化する訓練不要の手法である。
LADRは、観測されたピクセルに空間的に隣接した領域である'世代フロンティア'でのトークンの回収を優先する。
4つのテキスト・画像生成ベンチマークの実験により、LADRは標準ベースラインよりも約4倍のスピードアップを達成することが示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:12:41 GMT)
SDF-Net: Structure-Aware Disentangled Feature Learning for Opticall-SAR Ship Re-identification [10.5] 光学および合成開口レーダ(SAR)画像間のクロスモーダル船再識別(ReID)は基本的に課題である。
本稿では,光学式SAR船ReIDに幾何整合性を体系的に組み込んだ構造対応不整合特徴学習ネットワークであるSDF-Netを提案する。
HOSS-ReIDデータセットの実験は、SDF-Netが既存の最先端メソッドを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:41:43 GMT)
Self-Flow-Matching assisted Full Waveform Inversion [10.4] フルウェーブフォームインバージョン(Full-waveform Inversion、FWI)は、シミュレーションおよび記録された波形のマッチングにより地下速度を推定する高分解能地震探査法である。
FWIは非常に非線形で、サイクルスキップしやすく、ノイズに敏感である。
本稿では,大規模オフライン事前学習の必要性を解消する物理駆動型フレームワークであるSFM-FWI(Self-Flow-Matching Assisted Full-Waveform Inversion)を紹介する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:10:01 GMT)
Early Pruning for Public Transport Routing [10.4] 本稿では、最適性を損なうことなくルーティングアルゴリズムを高速化する低オーバーヘッド手法であるEarly Pruningを紹介する。
転送接続を継続時間でプリソートし、転送ループ内にプルーニングルールを適用することにより、現在の最適解よりも早く到着できないと、停止時に長い転送を破棄する。
複数の最先端のRAPTORベースのソリューションで、クエリ時間を最大57%削減しました。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:49:32 GMT)
HomeSafe-Bench: Evaluating Vision-Language Models on Unsafe Action Detection for Embodied Agents in Household Scenarios [10.4] ホームセーフベンチ(HomeSafe-Bench)は、視覚言語モデル(VLM)を評価するために設計されたベンチマークである。
リアルタイムの安全監視のための階層型ストリーミングアーキテクチャであるHuerarchical Dual-Brain Guard for Household Safety (HD-Guard)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:53:52 GMT)
V2Rho-FNO: Fourier Neural Operator for Electronic Density Prediction [10.0] 本稿では、外部電位から電子密度分布へのマッピングを直接学習するフーリエニューラル演算子(FNO)に基づく普遍的フレームワークを提案する。
我々の研究は、高速で正確で伝達可能な電子構造予測のための有望な経路として、ニューラル演算子学習を確立している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:53:13 GMT)
Integration of Deep Reinforcement Learning and Agent-based Simulation to Explore Strategies Counteracting Information Disorder [10.0] 近年、偽ニュースの普及は、ソーシャルメディアにおける情報障害(ID)への関心が高まっている。
本稿では,モデル駆動型モデルを用いた明示的なシミュレーションモデルを用いて,ID対策戦略について検討する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:03:11 GMT)
Exact Federated Continual Unlearning for Ridge Heads on Frozen Foundation Models [10.0] ファンデーションモデルは一般的に、フェデレートされた設定でプライベートなユーザ生成データに適応するために、小さな訓練可能なヘッドを持つフリーズ機能抽出器としてデプロイされる。
我々は,この問題を,リッジ-レグレッションヘッドを用いた凍結基礎モデルとして,実用的には関係があるが未探索の状態で研究する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:24:35 GMT)
Mending the Holes: Mitigating Reward Hacking in Reinforcement Learning for Multilingual Translation [9.9] 既存のポストトレーニング手法は、高品質な並列データに大きく依存している。
単言語テキストのみを用いた強化学習手法であるWALARを紹介する。
我々は,WALARのRLトレーニングに対する報奨として,単語アライメントや言語アライメントなどの手法を開発し,そのような穴を緩和する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:52:51 GMT)
RTD-Guard: A Black-Box Textual Adversarial Detection Framework via Replacement Token Detection [9.9] 本稿では,テキストの逆転を検知する新しいブラックボックスフレームワークRTD-Guardを紹介する。
我々の重要な洞察は、敵攻撃における単語置換摂動は、置換トークン検出識別器が識別するために事前訓練されている「置換トークン」によく似ているということである。
プロセス全体では、敵データ、モデルチューニング、内部モデルアクセスは必要とせず、2つのブラックボックスクエリのみを使用する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:30:56 GMT)
FGTR: Fine-Grained Multi-Table Retrieval via Hierarchical LLM Reasoning [9.8] The Fine-Grained Multi-Table Retrieval FGTR is a new search paradigm that using a human-like reasoning strategy。
実験の結果,FGTRは従来の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:28:45 GMT)
SRAM-Based Compute-in-Memory Accelerator for Linear-decay Spiking Neural Networks [9.8] スパイキングニューラルネットワーク(SNN)は、従来のディープネットワークに代わる生物学的にインスピレーションを受けている。
彼らのスループットは、ニューロンの膜状態の連続的な更新によって制限されている。
本稿では,メモリ内並列更新方式を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:34:03 GMT)
Beyond Verifiable Rewards: Rubric-Based GRM for Reinforced Fine-Tuning SWE Agents [9.5] よりリッチな学習信号を提供するジェネレーティブ・リワード・モデル(GRM)を導入する。
GRMには、特定の行動パターンを奨励または阻止するための基準を示す、人間によって設計されたルーリックが備わっている。
SWEタスク上でRFT(Reinforced Fine-Tuning)に使用する場合,本手法は終端スコアのみのリジェクションサンプリングよりも優れる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:23:49 GMT)
Adaptive Vision-Language Model Routing for Computer Use Agents [9.5] コンピュータ利用エージェントは、命令をクリック、キーストローク、スクロールなどのアクションに変換する。
現在のCUAシステムは、通常、困難にかかわらず全てのアクションを単一の固定モデルにルーティングする。
本稿では,CUAオーケストレータとVLMプール間の軽量なセマンティックルーティング層を挿入するフレームワークであるConfusedbf VLM Routing (AVR)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:21:25 GMT)
98$\times$ Faster LLM Routing Without a Dedicated GPU: Flash Attention, Prompt Compression, and Near-Streaming for the vLLM Semantic Router [9.5] 本稿では,vLLMセマンティックルータの3つの段階最適化について述べる。
ROCm上のONNX用のカスタムFlashアテンション演算子は、注目メモリを$O(n2)$から$O(n)$に還元する。
適応的チャンキングによるニアストリームボディ処理はシリアライズオーバーヘッドをなくす。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:33:53 GMT)
A Human-in-the-Loop Confidence-Aware Failure Recovery Framework for Modular Robot Policies [9.4] モジュール型ロボットポリシーのためのヒューマン・イン・ザ・ループ障害復旧フレームワークを提案する。
本フレームワークは,モジュールレベルの不確実性の推定と人的介入コストのモデルを統合する。
モジュールセレクタは、最も障害の原因となるモジュールを特定し、クエリアルゴリズムは、人間の入力を要請するか、自律的に行動するかを決定する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:34:33 GMT)
LLM Routing as Reasoning: A MaxSAT View [9.2] 言語条件付きLLMルーティングの制約に基づく解釈を提案する。
この観点では、ルーティングはフィードバック条件付き節の満足度をほぼ最大化する選択モデルに対応する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:39:22 GMT)
State-dependent geometries from magic-enriched quantum codes [9.0] 近似サブシステム消去訂正符号に対して,龍高柳型エントロピー分解を導入する。
我々は、この応答の起源を符号化マップのチョイ状態における三部作非局所魔法の一形態として同定する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:00:05 GMT)
Rooftop Wind Field Reconstruction Using Sparse Sensors: From Deterministic to Generative Learning Methods [8.9] リアルタイムの屋上風速分布は、ドローンや都市空調システムの安全運用に重要である。
本研究では,風洞実験データを用いた観測からの学習フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:23:18 GMT)
Geometry-Guided Camera Motion Understanding in VideoLLMs [8.9] カメラモーションは、視覚知覚と撮影スタイルを形作る基本的な幾何学的信号である。
現在のビデオ対応視覚注入モデル(VideoLLMs)は、明確に表現されることがほとんどなく、しばしば細かい動きプリミティブで失敗する。
カメラ動作を制約対応マルチラベル認識として定式化する。
実験では、改良されたモーション認識と、よりカメラ対応のモデル応答が示される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:13:09 GMT)
From Ellipsoids to Midair Control of Dynamic Hitches [8.9] 本稿では,2本のケーブルが生み出すヒッチの幾何学的性質と,4台の航空機が駆動するヒッチの力学を結合する楕円体型キネマティックモデルを提案する。
我々は,制御リアプノフと高次制御バリア関数を組み合わせて,所望のヒッチ位置とシステム形状を正確に追跡する2次プログラミングベースコントローラを設計する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:20:52 GMT)
Dependency-Aware Parallel Decoding via Attention for Diffusion LLMs [8.8] 拡散LDMの並列復号化は,各復号化ステップがトークン単位の周縁分布のみを提供するため困難である。
本稿では、自己アテンションを用いて条件依存グラフを誘導する簡易な訓練不要な復号法である依存性認識並列復号法(DAPD)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:52:02 GMT)
Synthetic Melanoma Image Generation and Evaluation Using Generative Adversarial Networks [8.8] 我々は,高分解能メラノーマ特異的合成のための4つのGANアーキテクチャ(DCGAN,StyleGAN2,StyleGAN3)と2つのStyleGAN3変異体(T/R)を比較した。
StyleGAN2は、定量性能と知覚品質の最良のバランスを達成し、FIDスコアは24.8と7.96(ISICと7.96(ISIC 2020))をガンマ=0.8で達成している。
制御された拡張実験では、クラス不均衡に対応するために合成メラノーマ画像を追加することで、保持された実像テストセット上で、0.925から0.945までのメラノーマ検出AUCが改善された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:21:55 GMT)
Privacy-Preserving Federated Fraud Detection in Payment Transactions with NVIDIA FLARE [8.7] 本稿では、NVIDIA FLAREフレームワークを用いて、支払いトランザクションに対するフェデレートされた異常検出を評価する。
我々は、異種金融機関の現実的な連盟をシミュレートし、それぞれが異なる詐欺のタイプを観察する。
フェデレーション平均化(FedAvg)を用いてトレーニングしたディープニューラルネットワークを用いて,フェデレーションモデルの平均F1スコアが0.903であることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:50:53 GMT)
NanoVDR: Distilling a 2B Vision-Language Retriever into a 70M Text-Only Encoder for Visual Document Retrieval [8.7] Vision-Language Model (VLM)ベースのレトリバーは、高度な視覚文書検索(VDR)によって印象的な品質を実現している。
文書は視覚的に複雑であり、強い視覚的理解を必要とするのに対し、クエリは単なる短い文字列である。
NanoVDRはこのクエリ-ドキュメント非対称性を利用して、2つのエンコーディングパスを分離する。
問合せテキストのコサインアライメントは、ランクベースやコントラストの代替よりも一貫して優れています。
言語間転送を主要なパフォーマンスボトルネックとして認識し、機械翻訳クエリによるトレーニングデータの拡大により、安価に解決する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:24:23 GMT)
LingoMotion: An Interpretable and Unambiguous Symbolic Representation for Human Motion [8.7] 人間の動作に対する解釈可能かつ曖昧な記号表現を容易にする動き言語LingoMotionを提案する。
我々はLingoMotionの概念設計を紹介し、関節角に基づく動きアルファベットの定義、単語やフレーズを形成する形態、より複雑な人間の活動を記述するための構文について紹介する。
大規模な動きデータセットMotion-Xを用いた動きアルファベットの実装と評価を含む予備的な結果は、動き表現の忠実度を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:35:22 GMT)
PVI: Plug-in Visual Injection for Vision-Language-Action Models [8.6] 事前訓練されたVLMとフローマッチングアクションエキスパートを組み合わせたVLAは、言語条件による操作の強力なパラダイムとして登場した。
このモジュールは、訓練済みのアクションエキスパートにアタッチされ、ゼロd残差経路を介して補助的な視覚表現を注入する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:16:53 GMT)
A Feasibility-Enhanced Control Barrier Function Method for Multi-UAV Collision Avoidance [8.5] 本稿では,マルチUAV衝突回避のためのFECBFフレームワークを提案する。
密集した多UAVシナリオでは、CBF二次プログラム(CBF-QP)の実現性は内部不整合性によって損なわれる可能性がある。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:58:40 GMT)
Eleven Primitives and Three Gates: The Universal Structure of Computational Imaging [8.5] すべての画像フォワードモデルが、正確に11個の物理的型付けプリミティブ上の有向非巡回グラフに分解されることを証明した。
全ての再建失敗は、情報不足、キャリアノイズ、オペレータミスマッチの3つの独立した根本原因を持つことを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:54:35 GMT)
LLMs Can Infer Political Alignment from Online Conversations [8.4] 大規模言語モデル(LLM)は、政治的アライメントを確実に推測できることを示す。
LLMは、明確に政治的でないにもかかわらず、政治的整合を非常に予測可能な単語を活用する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:15:23 GMT)
Before and After ChatGPT: Revisiting AI-Based Dialogue Systems for Emotional Support [8.4] メンタルヘルスは依然として主要な公衆衛生上の問題であり、タイムリーな心理的サポートへのアクセスは限られている。
大規模言語モデル(LLM)の最近の進歩は、この研究領域を大きく変えた。
本研究は、メンタルヘルスのためのAI駆動対話システムの技術的進化を概観する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:52:44 GMT)
EnterpriseOps-Gym: Environments and Evaluations for Stateful Agentic Planning and Tool Use in Enterprise Settings [8.3] 現実的なエンタープライズ環境でエージェント計画を評価するために設計されたベンチマークであるEnterpriseOps-Gymを紹介する。
この環境では、エージェントは8つのミッションクリティカルな分野にわたる1,150人の専門家によるタスクで評価される。
14のフロンティアモデルの評価により,最先端モデルにおける限界が明らかになった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:09:39 GMT)
Motion-Specific Battery Health Assessment for Quadrotors Using High-Fidelity Battery Models [8.3] 本研究は,四面体における動作認識型電池の健康評価のためのエンド・ツー・エンド・フレームワークを提案する。
まず,実飛行時の動作特定電流プロファイルを捉えるために,広帯域電流検出モジュールを設計する。
高忠実度バッテリモデルを基準性能試験および劣化結合電気化学モデルに基づくメタヒューリスティックを用いて校正する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:52:51 GMT)
Reconciling In-Context and In-Weight Learning via Dual Representation Space Encoding [8.3] In-context Learning (ICL) は、トランスフォーマーが様々なシーケンスタスクで事前訓練した貴重な機能である。
以前の研究では、ICLはモデル固有のin-weight learning(IWL)能力と矛盾することが多い。
コンテキストとサンプルを分離して2つの異なる空間にエンコードするために、モデルアーキテクチャを変更します。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:58:05 GMT)
Hierarchical Reference Sets for Robust Unsupervised Detection of Scattered and Clustered Outliers [8.2] クラスタ化された外れ値は、局所密度が比較的高いため、通常の振る舞いと容易に間違えることができる。
本稿では,グラフ構造を用いた自然近傍関係を利用した新しい外乱検出パラダイムを提案する。
提案手法は, クラスタ化異常による干渉を伴わずに, 分散した外れ値の有効認識を可能にする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:48:20 GMT)
Learnability and Privacy Vulnerability are Entangled in a Few Critical Weights [8.2] プライバシーを守るために、我々は重要な重みを得点し、それらのニューロンを捨てる代わりに、微調整のための重みだけを巻き戻します。
広範にわたる実験により,本機構は有効性を維持しつつ,メンバーシップ推論攻撃に対して優れたレジリエンスを示すことがわかった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:20:12 GMT)
HMS-BERT: Hybrid Multi-Task Self-Training for Multilingual and Multi-Label Cyberbullying Detection [8.2] マルチランガル・マルチラベルサイバーバブル検出のためのハイブリッドマルチタスク自己学習フレームワークHMS-BERTを提案する。
トレーニング済みの多言語BERTバックボーン上に構築されたHMS-BERTは、コンテキスト表現と手作りの言語的特徴を統合する。
4つの公開データセットの実験では、HMS-BERTは高いパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:51:20 GMT)
A Reduction Algorithm for Markovian Contextual Linear Bandits [8.2] 最近の研究は、文脈が描画されるとき、すなわち、線形文脈の帯域幅を単一コンテキストの線形帯域幅に減らすことができることを示している。
時間的に相関した可観測性を持つアプリケーションによって動機付けられ、この視点をマルコフの文脈的線形帯域に拡張する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:12:42 GMT)
Steve-Evolving: Open-World Embodied Self-Evolution via Fine-Grained Diagnosis and Dual-Track Knowledge Distillation [8.1] 閉ループ内における2トラックの知識蒸留と微粒な実行診断を密結合した非パラメトリック自己進化フレームワークを提案する。
このメソッドは、エクスペリエンスアンコリング、エクスペリエンス蒸留、ナレッジ駆動クローズドループという3つのフェーズに従っている。
Minecraft MCUの長距離スイートの実験では、静的検索に対する一貫した軌道が示されている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:23:34 GMT)
V-Bridge: Bridging Video Generative Priors to Versatile Few-shot Image Restoration [8.1] V-Bridgeは、多目的な数ショット画像復元タスクに遅延容量をブリッジするフレームワークである。
既存の修復方法の2%未満の1,000個のマルチタスクトレーニングサンプルで、事前訓練されたビデオモデルは、競争力のある画像復元を行うために誘導される。
その結果,映像生成モデルは,極めて限られたデータでのみ活性化可能な,強力で伝達可能な復元前処理を暗黙的に学習できることが判明した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:39:44 GMT)
Optimize Wider, Not Deeper: Consensus Aggregation for Policy Optimization [8.1] 近ポリシー最適化は、クリッピングされたSGDの複数のエポックを用いた信頼領域更新を近似する。
ユークリッドパラメータ空間とポリシー分布の自然なパラメータ空間の2つの空間におけるアグリゲーションについて検討する。
CAPOは、追加の環境相互作用を伴わずに、より深く、より広い範囲で最適化することで、ポリシーの最適化を改善することができることを示した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:02:12 GMT)
AoI-FusionNet: Age-Aware Tightly Coupled Fusion of UWB-IMU under Sparse Ranging Conditions [8.0] 本稿では,高度に結合したディープラーニングベースの融合フレームワークであるAoI-FusionNetを紹介する。
生超広帯域(UWB)の飛行時間(ToF)測定と慣性測定ユニット(IMU)データを組み合わせて3次元軌道推定を行う。
AoI-FusionNetは、間欠的および劣化した検知条件下での平均および尾位置推定誤差を著しく低減することを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:50:57 GMT)
Forecasting Epileptic Seizures from Contactless Camera via Cross-Species Transfer Learning [7.9] てんかん発作の予測は臨床的に重要であるが、てんかん研究では難しい問題である。
本研究では,ビデオによるてんかん発作予測の新しい課題を定式化する。
本稿では,大規模ロジトビデオデータを利用したクロス種移動学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:35:14 GMT)
The Illusion of Latent Generalization: Bi-directionality and the Reversal Curse [7.9] 逆の呪文は、事実を逆順に回収する自己回帰言語モデルの失敗を記述している。
近年の研究では、双方向監視による目的が逆の呪いを軽減することが示されている。
逆精度は、ソースエンティティを予測対象とするトレーニング信号を必要とすることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:55:43 GMT)
Creating manufacturable blueprints for coarse-grained virtual robots [7.9] ロボット設計空間のブループリントへのマッピングを自動化する。
このパイプラインは、モーター、エレクトロニクス、バッテリー、配線の構造的および機能的意味論を抽象的な仮想設計に組み込むことで、製造上の制約を段階的に解決する。
進化の代わりに、ボディプランのユーザ定義またはAI生成スケッチ'もパイプラインへの入力として提供でき、新規ロボットの設計を加速するための汎用的なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:44:54 GMT)
Reinforcement Learning for Diffusion LLMs with Entropy-Guided Step Selection and Stepwise Advantages [7.7] 強化学習は、自己回帰言語モデル(AR)の訓練後において有効であるが、これらの手法を拡散言語モデル(DLM)に拡張することは、難易度が高いため困難である。
拡散に基づくシーケンス生成を有限水平マルコフ決定過程としてデノベーション軌道上で定式化し、正確な偏りのない政策勾配を導出する。
コーディングと論理的推論ベンチマークの実験は、数学的推論に強い競争性能を持つ最先端の結果を示している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:38:44 GMT)
Delta1 with LLM: symbolic and neural integration for credible and explainable reasoning [7.7] 完全三角標準矛盾(FTSC)に基づいて自動定理Delta1を統合する構成により、終端説明可能性を導入する。
この研究は、論理学、言語学、学習の収束を推し進め、構築的定理の生成を、ニューロシンボリックな説明可能なAIの原理的基礎として位置づける。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:54:35 GMT)
Expert Pyramid Tuning: Efficient Parameter Fine-Tuning for Expertise-Driven Task Allocation [7.6] Expert Pyramid Tuning (EPT) は、コンピュータビジョンからPEFTの領域に多スケールのピラミッドの概念を統合する新しいアーキテクチャである。
EPT は SOTA MoE-LoRA の亜種を著しく上回っている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:23:41 GMT)
Using a Human-AI Teaming Approach to Create and Curate Scientific Datasets with the SCILIRE System [7.5] 本稿では,科学文献からデータセットを作成するシステムであるSCILIREを紹介する。
SCILIREは、データの検証とキュレーションのためのHuman-AIコラボレーションの原則に基づいて設計されている。
実世界のケーススタディと組み合わせた内在的なベンチマーク結果を用いて,本設計の評価を行った。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:16:08 GMT)
PCA-Enhanced Probabilistic U-Net for Effective Ambiguous Medical Image Segmentation [7.5] 新しいPCA拡張確率U-Net(PEP U-Net)について紹介する。
提案手法は, 後方ネットワークの次元削減を効果的に取り入れ, 冗長性を緩和し, 計算効率を向上させる。
従来の生成モデルと比較して,本手法は多様なセグメンテーション仮説を生成する能力を保っている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:36:49 GMT)
Show, Don't Tell: Detecting Novel Objects by Watching Human Videos [7.5] というパラダイムは、人間のタスクのデモンストレーションで観察された関連オブジェクトに合わせて、ベスポーク検知器を素早く訓練することを可能にする。
実世界のロボットに自動データセット作成と新しいオブジェクト検出のパラダイム「Show, Don't Tell」をデプロイする統合オンロボットシステムを開発した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:49:46 GMT)
Evaluating VLMs' Spatial Reasoning Over Robot Motion: A Step Towards Robot Planning with Motion Preferences [7.4] VLM(Vision-Language Models)は、新しいタスク、オブジェクト、動作仕様に基づいて、ロボットプランナーの一般化を促進する可能性がある。
ロボットの動きに対する空間的推論における4つの最先端VLMの性能を,4つの異なるクエリー手法を用いて評価した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:53:42 GMT)
DS$^2$-Instruct: Domain-Specific Data Synthesis for Large Language Models Instruction Tuning [7.4] DS$2$-Instructは、人間の監督なしにドメイン固有の命令データセットを生成するフレームワークである。
このフレームワークを適用して、数学、金融学、論理的推論といった7つの挑戦的な領域にまたがるデータセットを生成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:25:03 GMT)
Graph In-Context Operator Networks for Generalizable Spatiotemporal Prediction [7.3] コンテキスト内演算子学習により、ニューラルネットワークは、重み更新なしで、コンテキスト上の例からソリューション演算子を推論できる。
テキスト内演算子学習と古典演算子学習を、同じトレーニングステップとデータセットで比較する。
2つの中国地域での空気質予測実験により、コンテキスト内演算子学習は、複雑なタスクにおいて古典的演算子学習よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:16:55 GMT)
NormCode Canvas: Making LLM Agentic Workflows Development Sustainable via Case-Based Reasoning [7.3] NormCode Canvas (v1.1.3) は,多段階LLMのためのケースベース推論を2段階で実現したシステムである。
NormCodeは、コンパイラが検証したスコープルールで、すべての実行チェックポイントが自己完結したケースであることを保証している半形式的な計画言語である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:59:22 GMT)
Anchored Alignment: Preventing Positional Collapse in Multimodal Recommender Systems [7.2] マルチモーダルレコメンデータシステムは、画像、テキスト、相互作用信号を利用してアイテム表現を豊かにする。
軽量プロジェクションドメインで間接的にアンカーベースのアライメントを実行するフレームワークであるAnchorRecを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:17:09 GMT)
Knowing without Acting: The Disentangled Geometry of Safety Mechanisms in Large Language Models [7.2] 安全性計算は、textit Axis(mathbfv_H$, Knowing''')とtextitExecution Axis(mathbfv_R$, Acting'')の2つの部分空間で動作することを示す。
我々は,この拒絶機構を外科的に破壊することにより,最先端の攻撃成功率を実現するtextbfRefusal Erasure Attack (REA)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:42:07 GMT)
State-space models through the lens of ensemble control [7.1] 状態空間モデル(SSM)はシーケンシャルなモデリングに有効なアーキテクチャである。
アンサンブル最適制御問題としてSSMのトレーニングを定式化する。
逐次近似法に基づくアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:57:33 GMT)
Advanced Quantum Annealing for the Bi-Objective Traveling Thief Problem: An $\varepsilon$-Constraint-based Approach [7.1] Bi-Objective Traveling Thief Problem (BI-TTP)は、旅行コストとアイテム利益の同時最適化を必要とする。
BI-TTPの従来の手法は、ルーティングとパッケージ決定の複雑な相互依存のため、しばしば深刻なスケーラビリティの問題に直面する。
本稿では量子アニール法(QA)と$varepsilon$-constraint法を組み合わせた高度なハイブリッド手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:26:25 GMT)
Follow the Saliency: Supervised Saliency for Retrieval-augmented Dense Video Captioning [7.1] 既存のDense Video Captioning(DVC)の検索強化アプローチは、真のイベント境界に沿った正確な時間分割を達成できないことが多い。
提案フレームワークであるbfSTaRCは、ハイライト検出モジュールを通じてフレームレベルのサリエンシを監視することによって、この制限を克服する。
我々はYouCook2とViTTベンチマークで総合的な評価を行い、STaRCはほとんどのメトリクスで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:50:31 GMT)
H2LooP Spark Preview: Continual Pretraining of Large Language Models for Low-Level Embedded Systems Code [7.0] H2LooP Spark Previewは、OLMo-3-7B(完全にオープンな言語モデル)を組み込みシステムドメインに適合させる、継続的な事前トレーニングパイプラインである。
当社のトレーニングコーパスは,117メーカーにまたがる100Bの生組込みシステムデータのトークンを格納したリポジトリとデータベースのペアから構築されている。
高いランクのLoRAによる継続的な事前トレーニングでは、相当な利得が得られ、ドメイン内のパープレキシティは70.4%減少し、リポジトリのパープレキシティは66.1%減少する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:09:55 GMT)
HIFICL: High-Fidelity In-Context Learning for Multimodal Tasks [7.0] 我々は、ICLメカニズムをより忠実にモデル化するために、HIFICL(High-Fidelity In-Context Learning)を導入する。
HIFICLは,1)学習可能なコンテキストとして機能する"仮想キーと値のペア"のセット,2)安定かつ規則化されたトレーニングのための低ランク因数分解,3)単純なエンドツーエンドトレーニングの3つの主要コンポーネントから構成される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:03:35 GMT)
Defensible Design for OpenClaw: Securing Autonomous Tool-Invoking Agents [7.0] 本稿では,リスク分類,安全工学の原則,エージェント構築における安全性の制度化に向けた実践的研究の課題について述べる。
私たちはOpenClawを、インターフェイスと対話し、ファイルを操作し、ツールを起動し、実際の運用環境に拡張機能をインストールする、より広範なエージェントの例として使用しています。
私たちの目標は、コミュニティの焦点を、分離された脆弱性パッチから、体系的な防御エンジニアリングとロバストなデプロイメントプラクティスに移行することです。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:41:11 GMT)
Depth Charge: Jailbreak Large Language Models from Deep Safety Attention Heads [6.9] 我々は,注目度の高いジェイルブレイクフレームワークであるtextbfunderlineHad textbfunderlineAttack (textbfSAHA)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:35:20 GMT)
BoSS: A Best-of-Strategies Selector as an Oracle for Deep Active Learning [6.8] Best-of-Strategy Selector (BoSS)は大規模アクティブな学習シナリオ用に設計されたスケーラブルなオラクル戦略である。
BoSSは選択戦略のアンサンブルを通じて一連の候補バッチを構築し、次に最高のパフォーマンスゲインを得るバッチを選択する。
選択戦略の集合体として、BoSSは新たな最先端戦略が出現するにつれて容易に拡張できる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:05:37 GMT)
CA-HFP: Curvature-Aware Heterogeneous Federated Pruning with Model Reconstruction [6.8] 不均一エッジデバイス上でのフェデレーション学習は、アグリゲーション互換性と安定した収束を維持しながらパーソナライズされた圧縮を必要とする。
本稿では,各クライアントが構成されたデバイス固有のプルーニングを,曲率インフォームドの重要度スコアでガイドできる実用的フレームワークCA-HFPを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:45:00 GMT)
Linguistic Similarity Within Centralized FLOSS Development [6.7] 我々は,スチュワード型開発とコントリビュータの議論の関係について検討した。
WMF-アフィリエートと外部コントリビュータの言語的スタイルに違いは認められなかった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:08:49 GMT)
Prompt-Driven Lightweight Foundation Model for Instance Segmentation-Based Fault Detection in Freight Trains [6.6] 本稿では,貨物列車の故障検出に適した軽量なインスタンスセグメント化フレームワークを提案する。
本手法は,タスク固有のプロンプトを自動生成する自己プロンプト生成モジュールを導入することで,セグメンテーションモデルを活用する。
さらに、Tiny Vision Transformerのバックボーンを採用して計算コストを削減し、鉄道監視システムにおけるエッジデバイスへのリアルタイム展開に適したフレームワークを実現する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:56:37 GMT)
AWPD: Frequency Shield Network for Agnostic Watermark Presence Detection [6.6] 我々はAWPD(Agnostic Watermark Presence Detection)という新しいタスクを提案する。
AWPDは、画像が復号情報を必要とせずに著作権マークを持っているかどうかを特定することを目的としている。
We construct the UniFreq-100K dataset, including large-scale sample across various visible watermark embedded algorithm。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:00:52 GMT)
Out of Sight, Out of Mind? Evaluating State Evolution in Video World Models [6.6] ビデオワールドモデルは、2Dフレームの観察を通して「世界」を生成する。
これらの「世界」は、観測に関係なく進化できるのか?
我々は、ビデオワールドモデルが観察から状態の進化を分離できるかどうかを評価するためのベンチマークを設計する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:51:14 GMT)
From Woofs to Words: Towards Intelligent Robotic Guide Dogs with Verbal Communication [6.5] ロボットガイドドッグ(英: robotic guide dog)は、障害物回避とナビゲーションにおいて視覚障害者を支援する四足歩行ロボットである。
LLMを用いてナビゲーション計画とシーンの両方を言語化するロボットガイド犬のための新しい対話システムを開発した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:11:00 GMT)
Music Source Restoration with Ensemble Separation and Targeted Reconstruction [6.5] 初の音楽ソース復元(MSR)チャレンジは、完全に混成されたマスタード音楽からオリジナル、未処理の茎を回収することを目的としている。
まず、事前訓練された分離モデルのアンサンブルが予備的なソース推定を生成する。
そして、事前訓練されたBSRNNベースの復元モデルが、これらの見積を洗練させるためにターゲットの再構築を行う。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:40:42 GMT)
AccelAes: Accelerating Diffusion Transformers for Training-Free Aesthetic-Enhanced Image Generation [6.5] 密度の高い空間トークンに対する二次的自己注意は、高いレイテンシとデプロイメントの制限につながる。
美学と時間的減量によってDiTを加速するトレーニングフリーフレームワークであるAccelAesを提案する。
代表的なDiTファミリーの実験では、一貫した加速と美学指向の品質の向上が見られた。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:20:15 GMT)
Causal Cellular Context Transfer Learning (C3TL): An Efficient Architecture for Prediction of Unseen Perturbation Effects [6.4] 定量的な細胞状態に対する化学的および遺伝的摂動の影響を予測することは、計算生物学における中心的な課題である。
最近の研究は、この課題に対処するために大規模な単一セルデータと大規模な基礎モデルを活用している。
本稿では,生物学的介入の構造的性質を利用した摂動効果予測のための軽量フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:02:49 GMT)
Emergent decentralized regulation in a purely synthetic society [6.4] エージェントのみのソーシャルネットワークであるMoltbook上でOpenClawエージェントを研究する。
我々は指向性インテンシティ(DI)を用いた行動誘発言語を定量化する
高いDIの投稿は高い正答率を示すことが判明した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:55:22 GMT)
Fair Lung Disease Diagnosis from Chest CT via Gender-Adversarial Attention Multiple Instance Learning [6.3] 胸部CTボリュームからの多型肺疾患診断のためのフェアネス・アウェア・フレームワークについて検討した。
この課題は、CTスキャンを健康、新型コロナウイルス、腺癌、扁平上皮癌という4つのカテゴリに分類する必要がある。
我々のアプローチは、何百ものスライスにまたがるまばらな病理信号と、病気の階級と性別にまたがる深刻な人口不均衡の2つの問題に対処する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:42:52 GMT)
MoEKD: Mixture-of-Experts Knowledge Distillation for Robust and High-Performing Compressed Code Models [6.3] コードのための大規模な言語モデルは、多様なソフトウェア分析タスクで強力なパフォーマンスを達成した。
知識蒸留(KD)は、大きなモデルからより小さくより効率的なモデルに知識を移すことによって、実用的なソリューションを提供する。
MoEKDは蒸留過程をエキスパートとルータの訓練、学習されたルーティング機構による専門家の知識の集約、集約された知識からの蒸留に分解する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:49:01 GMT)
Privacy-Preserving Machine Learning for IoT: A Cross-Paradigm Survey and Future Roadmap [6.2] モノのインターネット(Internet of Things)の急速な普及により、堅牢なプライバシー保護機械学習メカニズムへの需要が高まっている。
この調査では、プライバシ保護機械学習のIoT中心、クロスパラダイム分析を包括的に紹介する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:19:18 GMT)
Standard Acquisition Is Sufficient for Asynchronous Bayesian Optimization [6.0] 非同期ベイズ最適化は、独立並列実験と様々な評価時間を持つ領域における勾配のない最適化に広く用いられている。
既存の手法では、標準の取得は冗長で反復的なクエリをもたらし、クエリの多様性を強制する複雑なソリューションを提案している。
上信頼境界のような手法は、シーケンシャルなトンプソンサンプリングと本質的に同等な理論的保証を達成できることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:25:27 GMT)
Probabilistic Gaussian Homotopy: A Probability-Space Continuation Framework for Nonconvex Optimization [6.0] 非ガウス一般化の継続確率である確率的ホモトピー(PGH)を導入する。
PGHはスケール0$で領域を滑らかにし、本来の目的を0$として回復することを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:32:29 GMT)
SemRep: Generative Code Representation Learning with Code Transformations [5.8] SemRepは、生成的コード表現学習を通じてコード変換を改善するフレームワークである。
我々の重要な洞察は、セマンティクス保存変換を中間表現として利用することである。
多様なコード変換の探索の改善により、SemRepは特に進化的検索に適している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 22:47:11 GMT)
Explainable AI Using Inherently Interpretable Components for Wearable-based Health Monitoring [5.8] 時系列データからAI予測を説明するために,説明空間と概念に基づく説明を組み合わせた新しいXAI手法を提案する。
Inherently Interpretable Components (IICs) を用いて、概念に基づく説明の解釈可能性を実現しつつ、時系列で訓練されたモデルの性能を保ちます。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:31:31 GMT)
Perceive What Matters: Relevance-Driven Scheduling for Multimodal Streaming Perception [5.7] ヒューマンロボットコラボレーション(HRC)アプリケーションでは、複数の知覚モジュールが視覚、聴覚、文脈の手がかりを共同で抽出し、総合的なシーン理解を実現する。
複数の知覚モジュールをフレーム単位で実行する一方で、レイテンシが必然的に増加し、ストリーミングの認識シナリオにおけるシステムパフォーマンスが大幅に低下する。
シーンコンテキストに基づいて,従来のフレームからの出力を効率よく活用し,必要な知覚モジュールをリアルタイムに推定・スケジュールする,新しい軽量な知覚スケジューリングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:11:20 GMT)
First-principles predictions of band alignment in strained Si/Si1-xGex and Ge/Si1-xGex heterostructures [5.7] 正確なバンドオフセットは、歪んだSi/Si1-xGexとGe/Si1-xGexヘテロ構造で形成される量子井戸や量子ドットなどのナノ構造の予測連続モデリングに不可欠である。
原子論的な第一原理密度汎関数理論を用いて、フル範囲 0 = x = 1 の原子価と伝導バンドのオフセットを計算する。
得られたオフセットは、以前の研究で探索された線形モデルを超えて、組成の非線形性を顕著に示し、実験的なベンチマークに一致し、緩和された合金バンドギャップにおける高Ge傾斜変化を再現する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:55:48 GMT)
Teaching Agile Requirements Engineering: A Stakeholder Simulation with Generative AI [5.4] 学生は、要件の導出とドキュメントに最先端のアジャイルプラクティスを適用することで、実践的な経験を得ます。
学生はまた、生成的AIの使用に関連する技術的および倫理的制限について理解を深める。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:07:52 GMT)
UE5-Forest: A Photorealistic Synthetic Stereo Dataset for UAV Forestry Depth Estimation [5.3] 我々は、Unreal Engine 5 (UE5) で構築されたフォトリアリスティック合成ステレオデータセットを提案する。
Quixel Megascansライブラリにある100と15のフォトグラムをスキャンした木が仮想のシーンに配置されている。
3つの高層帯(水平 +45度 -45度)で、各木を最大2mの軌道に配置すると、5,520個の修正された1920 x 1080ステレオペアがピクセル完全不均一ラベルを持つ。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:27:24 GMT)
NCCL EP: Towards a Unified Expert Parallel Communication API for NCCL [5.2] NCCL EP (Expert Parallelism) は、NCCLのDevice API上に構築された基礎的なMoE通信ライブラリである。
CとPythonの両方のインターフェースでncclEpDispatchとncclEpCombineプリミティブを統一する。
マルチノード構成のH100クラスタ上でNCCL EPを評価し、競合するLLカーネル性能を示し、vLLM統合によるエンドツーエンドの結果を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:28:22 GMT)
FoSAM: Forward Secret Messaging in Ad-Hoc Networks [5.2] FirechatやBridgefyといったアプリは、最近香港やイランで起きた抗議活動で使われている。
信頼できないアドホックネットワークにおいて、匿名およびフォワードの秘密メッセージを提供する最初のプロトコルであるFoSAMを紹介する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:17:18 GMT)
Quantum CDMA-based Continuous Variable Quantum Key Distribution using Chaotic Phase Shifters [5.1] 共有量子チャネル上でのマルチユーザ連続可変量子鍵分布(CV-QKD)のための量子符号分割多重アクセス(q-CDMA)フレームワークを提案する。
提案アーキテクチャでは、カオス位相シフト器を用いて量子状態の符号化と復号を行い、多重送信器によって生成された信号の効率的な多重化と多重化を可能にする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:27:34 GMT)
Efficient equivalence checking of Clifford-U circuits with shared single-qubit unitaries [5.0] クリフォード層を介在する任意の単一量子ビット層によって形成される回路の等価性チェック法を提案する。
このパターンは変分量子アルゴリズムやトロッター分解によるハミルトンシミュレーションで一般的である。
共有単一量子層を持つ回路対が、共有単一量子ユニタリの可能なすべての選択に対して等価であるかどうかを判定する、効率的な古典的アルゴリズムの存在を証明した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:25:26 GMT)
AEGIS: No Tool Call Left Unchecked -- A Pre-Execution Firewall and Audit Layer for AI Agents [5.0] AEGISはAIエージェントのための事前実行ファイアウォールと監査層である。
ツール実行パスに介在し、3段階のパイプラインを適用する。
ハイリスクコールは、人間の承認のために行われ、すべての決定は、未確認の監査証跡に記録される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:49:12 GMT)
Can Fairness Be Prompted? Prompt-Based Debiasing Strategies in High-Stakes Recommendations [4.9] 大型言語モデル(LLM)は、名前や代名詞といった間接的な手がかりからセンシティブな属性を推論し、潜在的にバイアスをかけることができる。
LLM Recommenders (LLMRecs) における暗黙のバイアスについて検討し, 迅速な戦略が軽量で使い易いデバイアスのアプローチとして有効であるかどうかを考察する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:30:42 GMT)
CM-Bench: A Comprehensive Cross-Modal Feature Matching Benchmark Bridging Visible and Infrared Images [4.8] 我々は、さまざまなクロスモーダルデータセットにまたがる30の機能マッチングアルゴリズムを含む総合的なクロスモーダル特徴マッチングベンチマークであるCM-Benchを紹介する。
手法は, ホログラフィー推定, 相対ポーズ推定, 特徴マッチングに基づくジオローカライゼーションなど, 様々なタスクによって評価される。
また,実地局所化評価のために,手動でアノテートされた接地トラス対応を持つ新しい赤外サテライトクロスモーダルデータセットを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:07:03 GMT)
Thinking in Graphs with CoMAP: A Shared Visual Workspace for Designing Project-Based Learning [4.8] グラフベースのコラボレーションパラダイムを具現化したシステムであるCoMAPを紹介する。
30人の教育者を対象にした研究では,CoMAPは教師のデザイン表現,散発的思考,反復的実践を著しく改善することが示された。
これらの結果は、非線型なアーティファクト中心のアプローチが信頼を育み、認知負荷を減らし、カラーフィックス支援教育者が創造的プロセスを制御できることを示しています。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:58:41 GMT)
Mitigating Collusion in Proofs of Liabilities [4.7] 我々は,利用者の協力を必要とせず,不当なプロバイダの潜在的不行を検出することにより,このギャップに対処する,許可されたPoLと呼ばれる新しいモデルを提案する。
私たちの提案の中核には、コミットベクターがユーザが明示的に署名した値のみを含むことを保証するために、Permissioned Vector Commitment (PVC)と呼ばれる新しいプリミティブがあります。
我々のプロトタイプ実装は、より強力なセキュリティにもかかわらず、我々の提案は、以前のPoLと比較してサーバのパフォーマンス(最大10ドルまで)も改善していることを示している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:45:23 GMT)
Quantum Process Realization of LDPC Code Dualities and Product Constructions [4.6] 量子過程として、Kramers-Wannier双対性、テンソル積、チェック積を含む幅広い種類のコード構成を実現する。
ZX-計算を用いて、これらの変換を図式的に表現し、量子回路を抽出するための体系的なアルゴリズムを提供する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:21:05 GMT)
Hide and Seek: Investigating Redundancy in Earth Observation Imagery [4.5] 地球観測(EO)データには多次元の冗長性(スペクトル、時間、空間、意味)があり、現在の文献よりも領域とその応用に顕著な影響を与えていると論じる。
以上の結果から,EOデータの冗長性が重大かつ広範であることが確認された。
これらの結果は、より効率的でスケーラブルでアクセスしやすい大規模EOモデルの基盤となった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:56:54 GMT)
Is Human Annotation Necessary? Iterative MBR Distillation for Error Span Detection in Machine Translation [4.4] Error Span Detectionは、機械翻訳(MT)評価において重要なサブタスクである。
最小ベイズリスク(MBR)デコードに基づく新しいフレームワークを提案する。
WMT Metrics Shared Taskデータセットの大規模な実験により、これらの自己生成された擬似ラベルのみにトレーニングされたモデルは、未適応のベースモデルと教師付きベースラインの両方より優れていることが示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:34:45 GMT)
Human-in-the-Loop LLM Grading for Handwritten Mathematics Assessments [4.3] LLM支援によるペンと紙の短い評価の段階化のためのスケーラブルでエンドツーエンドなワークフローを提案する。
本システムは,6つの低学級試験を用いて,2つの学部数学コースに展開する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:32:09 GMT)
Learning Geometric and Photometric Features from Panoramic LiDAR Scans for Outdoor Place Categorization [4.3] 本稿では,畳み込みニューラルネットワーク(CNN)を用いた屋外空間の分類手法を提案する。
CNNは3次元LiDARから得られる全方向の深度/反射像を入力とする。
マルチモーダルパノラマ3次元屋外(MPO)という大規模屋外空間データセットを構築した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:11:39 GMT)
Association-Aware GNN for Precoder Learning in Cell-Free Systems [4.2] 最適プリコーダは、チャネル状態情報だけでなく、動的UE-APアソシエーション状態にも依存する。
本稿では,アソシエーション対応グラフニューラルネットワーク(AAGNN)を提案し,アソシエーションステータスをプリコーディング設計に明示的に組み込む。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:45:00 GMT)
Reinforcing the Weakest Links: Modernizing SIENA with Targeted Deep Learning Integration [4.2] SIENAは脳萎縮のバイオマーカーとして広く用いられている。
これは、古典的な画像処理ステップ、特に頭蓋骨の剥離と組織分節に依存している。
我々は,SIENAの確立と解釈可能な枠組みを保ちながら,対象とするディープラーニング代替がSIENAを改善できるかどうかを評価する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:51:02 GMT)
CHIMERA-Bench: A Benchmark Dataset for Epitope-Specific Antibody Design [4.0] コンピュータ抗体の設計は急速に手法的に進歩し,過去3年間に多数の深層生成法が提案されてきた。
この分野では、公正な比較とモデル開発のための標準ベンチマークが欠落している。
textscChimera-Benchは、その種の抗体設計問題に対する最大のデータセットである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:06:58 GMT)
Spatial Reasoning is Not a Free Lunch: A Controlled Study on LLaVA [3.9] 視覚言語モデル(VLM)は急速に進歩しているが、基本的な空間的推論に苦慮している。
この失敗は単なるデータ問題ではなく、現在のVLMパイプラインにおける設計上の決定に密接に結びついている、と私たちは主張する。
我々は,LLaVAフレームワーク内で,これらの選択が空間接地に与える影響を識別するための制御された診断研究を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:11:23 GMT)
Beyond Convolution: A Taxonomy of Structured Operators for Learning-Based Image Processing [3.9] 本稿では,学習に基づく画像処理パイプラインにおける標準的な畳み込みを拡張し,置き換える演算子の系統分類について述べる。
各族に対して、形式的定義、畳み込みに関する構造的特性に関する議論、および作用素が最も適しているタスクの批判的分析を提供する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:53:42 GMT)
Coordinated Manipulation of Hybrid Deformable-Rigid Objects in Constrained Environments [3.9] 本研究は, ひずみに基づくコッサートロッドモデルを用いた準静電最適化に基づく操作プランナを提案する。
これは、厳密なツールで到達不能なオブジェクトに対して、タスク空間の目的を達成する一方で、制約を通して操作するための変形可能なリンクのコンプライアンスを利用する。
提案アルゴリズムは、様々なhDLOシステム上でのシミュレーションや、双腕ロボットシステムを用いた制約環境で操作された3リンクhDLOの実験で検証される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:34:49 GMT)
Weakly Supervised Teacher-Student Framework with Progressive Pseudo-mask Refinement for Gland Segmentation [3.9] 本稿では,スパース・パストロジー・アノテーションと指数移動平均安定化型教師ネットワークを活用して,洗練された擬似マスクを生成する弱教師型教員の枠組みを提案する。
このフレームワークは、信頼に基づくフィルタリング、教師の予測の適応的融合、限られた真実との融合、およびカリキュラムガイドにより、未通知の腺領域を段階的に分割する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:20:51 GMT)
Resource-Optimal Importance Sampling for Randomized Quantum Algorithms [3.8] 本稿では,古典的重要度サンプリングをランダム化量子プロトコルに適用するための一般的なフレームワークを提案する。
量子回路を動作させるためのコスト関数を考えると、提案手法はネットコストのメリットを最小化する。
我々は、このフレームワークを、アルゴリズム近似や物理ノイズから生じる誤差を量子計算が対象とするシナリオに拡張する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:17:33 GMT)
From Experiments to Expertise: Scientific Knowledge Consolidation for AI-Driven Computational Research [3.7] 本稿では、AI駆動計算科学のためのオープンソースのプラットフォームQMatSuiteを紹介する。
QMatSuiteは、発見結果を保存し、新しい計算の前に知識を検索し、専用のリフレクションセッションで誤った結果を修正します。
6段階の量子力学シミュレーションワークフローのベンチマークでは、蓄積された知識は推論オーバーヘッドを67%削減し、精度を47%から3%に改善する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:25:47 GMT)
Scalable Classification of Course Information Sheets Using Large Language Models: A Reusable Institutional Method for Academic Quality Assurance [3.7] 高等教育機関は、ジェネレーティブAI(GenAI)統合のためのコース設計を監査する圧力が高まっている。
本稿では,大規模言語モデル(LLM)を用いてコース情報シートを大規模にスキャンするエンド・ツー・エンド手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:59:08 GMT)
Concentrated siting of AI data centers drives regional power-system stress under rising global compute demand [3.7] 生成人工知能(AI)の急速な普及は、グローバルな計算需要が前例のない成長を遂げている。
本研究では,2025年から2030年までのAI駆動型データセンターの電力フットプリントを予測するためのAI-エネルギー結合フレームワークを提案する。
結果は、新しいAIインフラが北米、西ヨーロッパ、アジア太平洋に集中していることを示している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:37:09 GMT)
Weakly Time-Coupled Approximation of Markov Decision Processes [3.6] 有限水平マルコフ決定プロセス(MDPs)は、ベルムダンのバリュエーションやエクササイズ、リアルオプションなど、運用と金融に発生する。
共通近似は基底関数を用いた値関数を表すが、重み付け方法は異なる段階最適化を扱う。
この結合は近似アーキテクチャのアーチファクトであり、段差依存が地平線に依存しない弱時間結合近似(WTCA)を開発する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:14:42 GMT)
Robust Automatic Differentiation of Square-Root Kalman Filters via Gramian Differentials [3.5] 平方根カルマンフィルタは、Colesky-factor形式の状態共分散を数値安定性のために伝播する。
彼らの中心となる演算、mathbbRn × m$ の行列 $M の三角化は、実際にはQR分解によって計算される。
これはムーア-ペンローズ擬逆数に基づく列空間項と、M$の列空間の外の摂動に対するヌル空間補正である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:55:08 GMT)
SciDesignBench: Benchmarking and Improving Language Models for Scientific Inverse Design [3.5] SciDesignBenchは、14の科学領域にわたる520のシミュレーター地上タスクのベンチマークである。
最高のゼロショットモデルは、パースレートがかなり高いにもかかわらず、わずか29.0%の成功しか得られない。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:11:47 GMT)
SortScrews: A Dataset and Baseline for Real-time Screw Classification [3.4] ネジのケースワイズ分類のためのデータセットであるtextbfSortScrews$を紹介した。
データセットには,6種類のネジとバックグラウンドクラスをカバーする512タイム512ドルの解像度で,560RGBイメージが含まれている。
画像は、標準化された取得設定を使用してキャプチャされ、照明とカメラの視点の微妙なバリエーションを含む。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:35:47 GMT)
Beyond Final Answers: CRYSTAL Benchmark for Transparent Multimodal Reasoning Evaluation [3.2] CRYSTAL*は6,372のインスタンスを持つ診断ベンチマークであり、検証可能な中間段階を通してマルチモーダル推論を評価する。
本稿では,意味的類似性マッチングによるステップレベルの精度とリコールをスコアする *Match F1* と,乱れた推論連鎖をペナルティ化する *Ordered Match F1* の2つの相補的指標を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:48:15 GMT)
Efficient Real-World Autonomous Racing via Attenuated Residual Policy Optimization [3.2] 残留ポリシー学習(Residual Policy Learning, RPL)は、様々なロボットアプリケーションで高い性能を示している。
残留政策最適化を減らしたRPLの拡張($-RPO)を導入する。
シミュレーションとゼロショットの現実世界からRobocer車へのトランスファーでは、$-RPOはシステムの複雑さを低減させるだけでなく、ベースラインよりも運転性能も向上する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:02:56 GMT)
A Requirement-Based Framework for Engineering Adaptive Authentication [3.2] 本稿では,工学的適応認証システムのためのフレームワークを提案する。
コンテキスト要因やセキュリティリスクの変化に対処する効果的な認証手法を動的に選択する。
我々は、IoVおよび医療領域における実世界の認証シナリオへの適用を通じて、我々のフレームワークを実証し、評価する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:08:36 GMT)
VLM4Rec: Multimodal Semantic Representation for Recommendation with Large Vision-Language Models [3.1] LVLM-grounded multimodal Semantic Representation for Recommendation (VLM4Rec)を提案する。
VLM4Recは、直接特徴融合ではなく、セマンティックアライメントを通じて、マルチモーダルアイテムコンテンツを整理する。
複数のマルチモーダルレコメンデーションデータセットの実験では、VLM4Recは生の視覚的特徴よりもパフォーマンスを一貫して改善している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:57:41 GMT)
The RIGID Framework: Research-Integrated, Generative AI-Mediated Instructional Design [3.0] 本稿では,学習科学の研究を教育設計を通して体系的に統合する方法について考察する。
RIGIDは、ID分析、設計、実装、評価フェーズにまたがってLS研究を統合する統一的なフレームワークであり、生成AIを活用して各段階でこの統合を仲介する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:34:12 GMT)
AgentDrift: Unsafe Recommendation Drift Under Tool Corruption Hidden by Ranking Metrics in LLM Agents [3.0] クリーンで汚染されたツール出力条件下で、実際の財務対話を再生するペアトラジェクトリプロトコルを導入する。
評価盲点パターンを観察し, 推奨品質は汚染下で保存される。
物語のみの腐敗(バイアス付き見出し、数値操作なし)でさえ、一貫性モニタを完全に回避しながら大きなドリフトを引き起こします。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:54:00 GMT)
AI Planning Framework for LLM-Based Web Agents [2.9] 現代のエージェントアーキテクチャを従来の計画パラダイムにマッピングする分類法を導入する。
簡単な成功率を超える軌道品質を評価する5つの新しい評価指標を提案する。
以上の結果から, ステップ・バイ・ステップ・エージェントはヒトのゴールドトラジェクトリとより密に連携するが, フル・プラン・イン・アドバンス・エージェントは技術的に優れていることがわかった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:46:32 GMT)
From AI Weather Prediction to Infrastructure Resilience: A Correction-Downscaling Framework for Tropical Cyclone Impacts [2.9] 我々はAIベースのCorrection-Downscaling Framework(ACDF)を紹介する。
ACDFは、粗いAI天気予報を500mの非バイアス風場と送信塔/線路故障確率に変換する。
中国・江江省で11日、台風11号の観測実験を行った。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:31:39 GMT)
A2Z-10M+: Geometric Deep Learning with A-to-Z BRep Annotations for AI-Assisted CAD Modeling and Reverse Engineering [2.8] 本研究では,100万のABC CADモデルに対して,1000万のマルチモーダルアノテーションとメタデータを最大にコンパイルする。
A2Zは、(i)高分解能メッシュと、(ii)3D手描きスケッチと、(iii)BRepコエッジ、コーナー、表面に関する幾何学的および位相的情報を備える。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:17:32 GMT)
Partially Fault-Tolerant Quantum Computation for Megaquop Applications [2.8] 部分的にフォールトトレラント量子コンピューティング(FTQC)は、メガクオップスケールの回路を実行する上で有望なアプローチである。
本稿では、STARアーキテクチャのプロトコルの性能が、ハードウェアの改善によってどのように影響を受けるかを示す。
本稿では,2次元フェルミ-ハバードモデル系の量子シミュレーションがSTARアーキテクチャに特に適していることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:41:36 GMT)
Semantic Invariance in Agentic AI [2.8] 大規模言語モデルは、意思決定支援、科学的問題解決、マルチエージェント調整システムにおいて、自律的推論エージェントとしての役割をますます高めている。
LLMエージェントを連続的なアプリケーションにデプロイするには、それらの推論が意味論的に等価な入力変動の下で安定であることを保証する必要がある。
標準ベンチマーク評価は、固定された正準問題定式化の精度を評価するが、この重要な信頼性の次元を捉えることができない。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:08:44 GMT)
Exponential Scaling Barriers for Variational Quantum Eigensolvers [2.6] 変分量子固有解法(VQE)は量子系の基底状態を計算するための有望なアルゴリズムとして広く考えられている。
適応型VQEの計算コストがターゲットシステムのサイズとどのようにスケールするかを精査する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:18:31 GMT)
Learning from Child-Directed Speech in Two-Language Scenarios: A French-English Case Study [2.5] 我々はBabyBERTaを厳密にサイズマッチングされたデータ条件下で英仏シナリオに拡張する。
構文的タスクと意味的タスクの両方でモデルを評価し、ウィキペディアのみのデータに基づいて訓練されたモデルと比較する。
同様のパターンがBabyBERTa、RoBERTa、LTG-BERTにまたがって現れ、アーキテクチャ間の一貫性のある傾向を示唆している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:22:36 GMT)
CLARIN-PT-LDB: An Open LLM Leaderboard for Portuguese to assess Language, Culture and Civility [2.5] 本稿では,ヨーロッパポルトガル語(PT-PT)のためのオープン言語モデル(LLM)のリーダーボードの開発について報告する。
このリーダーボードは、ヨーロッパポルトガル語に対するLLMの評価のギャップを解消する手段として提供され、これまでのところこの言語の変種に特化したリーダーボードは存在しなかった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:18:27 GMT)
Asymptotically Optimal Quantum Circuits for Comparators and Incrementers [2.5] 本稿では,Clifford+Toffoliゲート集合上での最適ゲート数$(n)$と深さ$(log n)$を,比較および増分演算のための量子回路を提案する。
これらの結果を古典量子コンパレータに拡張し、最適化された古典量子加算器を最適量子数で生成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:41:14 GMT)
STRAP-ViT: Segregated Tokens with Randomized -- Transformations for Defense against Adversarial Patches in ViTs [2.5] 逆パッチは物理的に実現可能な局所雑音であり、視覚変換器(ViT)の自己注意をハイジャックすることができる。
本稿では,Jensen-Shannon Divergence を用いた STRAP-ViT と呼ばれる機構を提案する。
STRAP-ViTはViTアーキテクチャの非トレーニング可能なプラグイン・アンド・プレイブロックとして適合し、推論目的のみで、計算コストは最小限である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:03:44 GMT)
SoK: Evolution, Security, and Fundamental Properties of Transactional Systems [2.4] 我々は163のトランザクションセキュリティに関する論文を、進化的生成、セキュリティ焦点、関連するCommon Weaknession(CWE)エントリによって分類する。
我々は、各論文のセキュリティ焦点をCWE識別子にマッピングし、トランザクション固有の脅威を分析するためのシステム指向の語彙を提供する。
我々の体系化は、より広範なトランザクションセキュリティを犠牲にして、DLTセキュリティ研究に対する顕著な偏見を露呈する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:20:35 GMT)
Randomness compression in communication networks [2.4] 我々は任意のネットワークによって生成される分布を近似するための新しい上限を開発する。
このことは、小さな摂動が許容される場合、資源の大幅な節約が可能であることを証明している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:36:16 GMT)
Clustering Astronomical Orbital Synthetic Data Using Advanced Feature Extraction and Dimensionality Reduction Techniques [2.4] 本研究では、約22,300個の衛星軌道をクラスタリングする機械学習ベースのパイプラインを提案する。
このアプローチの鍵は、400のタイムステップを9,996次元の機能空間に効率的に変換するMiniRocketを使用することである。
付加的な自動特徴抽出と次元削減技術により、データを洗練し、ロバストなクラスタリング分析を可能にする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:11:52 GMT)
TrianguLang: Geometry-Aware Semantic Consensus for Pose-Free 3D Localization [2.3] TrianguLangは3Dローカライゼーションのためのフィードフォワードフレームワークで、推論時にカメラのキャリブレーションを必要としない。
最先端のフィードフォワードテキスト誘導セグメンテーションとローカライゼーションを実現し、ユーザの労力を$O(N)$から1つのテキストクエリに削減する。
モデルは各フレームを1008x1008の解像度で、最適化なしで57ms (sim$18 FPS)で処理し、対話型ロボティクスやARアプリケーションに実用的なデプロイを可能にする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:26:36 GMT)
Critical behaviors of magic and participation entropy at measurement induced phase transitions [2.3] 非単位量子回路のエントロピーの関与と安定化について検討する。
参加者のエントロピーとスタビライザーのエントロピーの両方が著しく低下していることが判明した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:58:53 GMT)
Characterization of Radiation-Induced Errors in Superconducting Qubits Protected with Various Gap-Engineering Strategies [2.3] 高エネルギー粒子による影響は、ジョセフソン接合(JJs)近傍の準粒子密度を増大させることによって超伝導量子ビットの相関誤差を引き起こす
最近の実験では、超伝導ギャップエネルギーの差を量子ビットエネルギーよりも大きくすることで相関誤差を低減した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:05:51 GMT)
mAceReason-Math: A Dataset of High-Quality Multilingual Math Problems Ready For RLVR [2.2] mAceReason-Mathは、RLVR用に特別にキュレーションされたコーパス(AceReason-Math)から得られる挑戦的な数学問題の高品質な翻訳データセットである。
研究コミュニティにおける多言語RLVR研究とベンチマークを容易にするためのデータセットをリリースする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:52:24 GMT)
Privacy Preserving Topic-wise Sentiment Analysis of the Iran Israel USA Conflict Using Federated Transformer Models [2.2] この研究は、ユーザーが作成したコメントをYouTubeのニュースチャンネルからマイニングすることで、イランのイスラエルUSA紛争に関する世界的な世論の感情を分析することを目的としている。
主要国際ニュースチャンネルから約19,000件のYouTubeコメントが収集され、ノイズを取り除きテキストを正規化するために前処理された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 23:41:11 GMT)
AMES: Approximate Multi-modal Enterprise Search via Late Interaction Retrieval [2.1] AMESはバックエンドに依存しないマルチモーダル遅延相互作用検索アーキテクチャである。
テキストトークン、画像パッチ、ビデオフレームは、マルチベクトルエンコーダを使用して共有表現空間に埋め込まれる。
AMESは、スケーラブルで実運用可能なSolrベースのシステムにおいて、競争力のあるランキングパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:20:59 GMT)
CVGL: Causal Learning and Geometric Topology [2.1] クロスビュージオローカライゼーション(CVGL)は,道路画像の地理的位置を対応する航空画像とマッチングすることにより推定することを目的としている。
これは、複雑な現実世界のシナリオにおける自律的なナビゲーションとマッピングにとって重要である。
これらの問題に対処するための因果学習・幾何学的トポロジーフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:25:53 GMT)
Adaptive Diffusion Posterior Sampling for Data and Model Fusion of Complex Nonlinear Dynamical Systems [2.0] カオス・高次元非線形力学系の高忠実度数値シミュレーションは計算コストが高い。
このような系のほとんどの代理モデルは決定論的であり、例えば、ニューラル作用素が関与する場合である。
この研究は、生成機械学習を利用した代理モデリングの定式化を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:11:37 GMT)
Spin qubit gates via phonon buses in electron nanowires [2.0] 電子のナノワイヤを用いて2つの量子ドット間の相互作用を仲介する。
電子の線形鎖内の仮想フォノンは、遠くの量子ドット内の電子のスピンスピンカップリングを効果的に起こす相互作用を仲介することができる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:52:48 GMT)
Accelerating Stroke MRI with Diffusion Probabilistic Models through Large-Scale Pre-training and Target-Specific Fine-Tuning [1.9] Diffusion Probabilistic Generative Models (DPMs) は、完全サンプルデータのみが利用可能な場合に臨床脳卒中MRIのスキャン時間を短縮する。
非FLAIRのコントラストを有する約4000名の被験者にプレトレーニングを行い、FLAIRデータに微調整を行った。
学習率の低下による適度な微調整では性能が向上する一方,過度の微調整では再建品質が低下することが実験で明らかになった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:13:53 GMT)
Auger Spectroscopy via Generative Quantum Eigensolver: A Quantum Approach to Molecular Excitations [1.8] オージェスペクトルを計算するためのハイブリッド量子古典ワークフローを提案する。
STO-3G ベースセットを用いて水のオージェスペクトルを計算することにより,我々のワークフローの有効性を実証する。
また、水に対して、GQEの変分量子固有溶媒を置換することで、ほぼ同一のスペクトルが得られることも見いだした。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:03:39 GMT)
Surprised by Attention: Predictable Query Dynamics for Time Series Anomaly Detection [1.8] AxonADは、マルチヘッドアテンションクエリの進化を短い水平方向予測可能なプロセスとして扱う教師なし検出器である。
テール集約型クエリミスマッチスコアは、最近のタイムステップで予測されたクエリとターゲットクエリの相違を測定する。
インターバルアノテーションを用いた車内テレメトリでは、AxonADは強力なベースライン上でのランキング品質と時間的ローカライゼーションを改善している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:40:51 GMT)
HaltNav: Reactive Visual Halting over Lightweight Topological Priors for Robust Vision-Language Navigation [1.8] VLN(Vision-and-Language Navigation)は、厳格なステップバイステップの指示から、オープンな語彙、ゴール指向の自律性へとシフトしている。
本稿では,OsmAGのロバストなグローバルプランニングと,VLNの局所探索と命令グラウンド機能を組み合わせた階層型ナビゲーションフレームワークHaltNavを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:22:35 GMT)
Task-Oriented Wireless Transmission of 3D Point Clouds: Geometric Versus Semantic Robustness [1.7] 無線3DPC伝送のためのエンドツーエンドのセマンティック通信フレームワークを提案する。
幾何的再構成品質が著しく低下しても,意味推論は広帯域の信号-雑音比範囲で安定であることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:55:15 GMT)
ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems [1.7] ZK-ACEは、トランザクション転送されたシグネチャオブジェクトをアイデンティティバウンドのゼロ知識認証ステートメントに置き換える認証レイヤである。
我々は,ZK-ACEをゲームベースのセキュリティ定義で形式化し,音声認識,リプレイ抵抗,置換抵抗,クロスドメイン分離を実現した。
構造的、プロトコルレベルのデータ会計は、直接量子後シグネチャ展開に対するコンセンサス可視な認証データのオーダー・オブ・マグニチュードの低減を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:07:40 GMT)
Analytical Logit Scaling for High-Resolution Sea Ice Topology Retrieval from Weakly Labeled SAR Imagery [1.7] 高解像度の海氷マッピングは北極航法と気候モニタリングに不可欠である。
粗い地域レベルの多角形(弱いラベル)のみを提供する運用用氷チャート
本研究では,Sentinel-1 SAR と AMSR-2 を融合した弱教師付き深層学習パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:21:33 GMT)
A Method for Learning Large-Scale Computational Construction Grammars from Semantically Annotated Corpora [1.7] 本稿では,言語用コーパスから大規模広包構成文法を学習する手法を提案する。
構成構造と意味的フレームを付加した発話から始まり、人間の解釈可能な計算構成文法の学習を容易にする。
結果として得られる文法は、Fluid Construction Grammarフレームワーク内で形式化された数万の構築のネットワークで構成されている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:55:07 GMT)
Scalable Machines with Intrinsic Higher Mental-State Dynamics [1.6] この研究は、モデル(例えばトランスフォーマー)が覚醒的思考の基礎となる計算原理をどのように実装できるかを示す数学的基礎の定式化を導入する。
標準ビジョン変換器(ViT)とベンチマークしたImageNet-1Kの実験では、計算要求の低減による学習が大幅に高速化された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:16:50 GMT)
Robust symmetry breaking in gapless quantum magnets [1.5] 我々は、あるギャップレス量子系の低エネルギー固有状態における自然対称性の破れの存在を証明した。
我々の研究は、安定なギャップレス量子相の厳密な分類に向けた第一歩である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:48:27 GMT)
Deep Invertible Autoencoders for Dimensionality Reduction of Dynamical Systems [1.3] 本稿では,従来のAEアーキテクチャに典型的なプロジェクションエラーの停滞を改善するために,inv-AEという名前の深い非可逆型AEアーキテクチャを提案する。
Inv-AEはいくつかの可逆ニューラルネットワーク層で構成されており、FOMソリューションに関する情報を徐々に回復することができる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:19:32 GMT)
Filtered Spectral Projection for Quantum Principal Component Analysis [1.2] Filtered Spectral Projection Algorithm (FSPA)
振幅符号化された中心データに対して、アンサンブル密度行列$=sum_i p_i|_iranglelangle_i|$は共分散行列と一致する。
非中心データの場合、$$は中心化せずにPCAに対応し、標準PCAからの偏差を定量化する固有値インターレース境界を導出する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:55:39 GMT)
Deep Learning Based Estimation of Blood Glucose Levels from Multidirectional Scleral Blood Vessel Imaging [1.2] スクレラは、糖尿病に関連する変化を示す可能性がある表面微小血管を含んでいる。
メタボリックステータス分類のための多視点ディープラーニングフレームワークであるScleraGluNetを提案する。
モデル全体の93.8%の精度で、1-vs-rest AUCは0.971,0.956,0.982であった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:01:19 GMT)
End-to-End O-RAN Testbed for Edge-AI-Enabled 5G/6G Connected Industrial Robotics [1.2] 我々は5G/6G O-RANをベースとしたE-AIを産業用ロボットアプリケーションに統合したエンドツーエンドテストベッドを提案する。
テストベッドは、さまざまなデータ取得、エッジ処理、ロボット知覚のためのリアルタイムストリーミングアプローチ間のトレードオフを調査するために使用される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:14:32 GMT)
L2GTX: From Local to Global Time Series Explanations [1.2] クラスワイドなグローバルな説明を生成するモデルに依存しないフレームワークであるL2GTXを提案する。
我々は,L2GTXが局所的代理の忠実度の平均として測定された安定な大域的忠実度を維持しつつ,コンパクトで解釈可能な大域的説明を生成することを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:14:06 GMT)
Colluding LoRA: A Composite Attack on LLM Safety Alignment [1.1] Colluding LoRAは、各アダプタが独立して機能するように見える攻撃である。
特定のインプットトリガーやプロンプトパターンに依存するアタックとは異なり、CoLoRAはコンポジショントリガーによる広範な拒絶抑制である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:53:15 GMT)
Variational Garrote for Sparse Inverse Problems [1.1] 本研究は, 従来のL1正規化と変分ガロテ(VG)を比較することで, 逆問題における疎度先行の影響について検討する。
信号再サンプリング,信号デノイング,スパース・ビュー・コンピュート・トモグラフィなど,複数の再構成タスクにまたがる統一的な実験フレームワークを構築した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:50:27 GMT)
Are General-Purpose Vision Models All We Need for 2D Medical Image Segmentation? A Cross-Dataset Empirical Study [1.1] 本研究では,2次元医用画像に対して,SMAと汎用ビジョンモデル(GP-VM)を比較した。
分析されたデータセットでは、GP-VMは特別なMISモデルの大部分を上回ります。
XAI分析は、GP-VMが明示的なドメイン固有のアーキテクチャ設計なしで臨床的に関係のある構造をキャプチャできることを示している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:52:51 GMT)
Developing the PsyCogMetrics AI Lab to Evaluate Large Language Models and Advance Cognitive Science -- A Three-Cycle Action Design Science Study [1.1] PsyCogMetrics AI Lab (psycogmetrics.ai)は、大規模言語モデル(LLM)評価のための心理計測および認知科学方法論を運用する、統合されたクラウドベースのプラットフォームである。
Relevance Cycleは3サイクルのAction Design Science研究として分類され、現在の評価方法と未完のステークホルダーのニーズにおける重要な制限を特定している。
リゴールサイクルは、導出設計目的を導出するために、ポペリアのフェルシフィビリティ、古典的テスト理論、認知負荷理論などのカーネル理論を基礎としている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:17:45 GMT)
Human-AI Collaborative Autonomous Experimentation With Proxy Modeling for Comparative Observation [1.1] 本稿では,人間とAIエージェントの協調作業を通じて,プロキシモデルによるベイズ最適化(px-BO)を提案する。
我々のアプローチは、従来のデータ駆動探索よりも検索を改善するために、ドメインエキスパートのより良いコントロールを提供しました。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:45:24 GMT)
Design and evaluation of an agentic workflow for crisis-related synthetic tweet datasets [1.0] 危機情報学の研究は、Twitterからのツイートを人工知能システムの開発と評価に広く利用してきた。
Twitterのデータアクセスポリシーの最近の変更により、危機に関連する現実世界のつぶやきデータセットのキュレーションがますます困難になっている。
本稿では危機関連ツイートデータセットを生成するエージェントワークフローを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 22:13:03 GMT)
PLUME: Building a Network-Native Foundation Model for Wireless Traces via Protocol-Aware Tokenization [1.0] Plumeは、構造化PDML切断から学ぶ802.11トレースのコンパクト基盤モデルである。
プロトコル対応トークン化器は、ディセクタフィールドツリーに沿って分割し、タイミングのギャップトークンを出力し、識別子を正規化し、BPEよりも6.2倍短いシーケンスを生成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 23:14:43 GMT)
Universal monitored dynamics in multimode bosonic systems [0.9] 本稿では,回路量子力学を用いたボソニック系におけるモニタリングされた多体力学の研究手法を提案する。
我々は,ビームスプリッターゲート,局所パリティ測定,およびオプションオンサイトハバード相互作用から構築したレンガ加工回路からなるいくつかのボソニックモデルを構築した。
現実的なノイズ、ゲート、測定率に対して、これらのシグネチャは、短期的な回路QEDハードウェアで観測可能である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:17:43 GMT)
Volumetric Radar Echo Motion Estimation Using Physics-Informed Deep Learning: A Case Study Over Slovakia [0.9] 複数の高度層に対して独立な水平運動場を推定する物理インフォームド畳み込みニューラルネットワークを提案する。
提案したモデルと,垂直プール型2次元レーダ複合材料を用いた構造的に同一のベースラインを比較検討した。
その結果, モデルが高度方向の運動場を学習することに成功したものの, 推定変位は垂直方向と高い相関関係があることが示唆された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:59:02 GMT)
Retrieval-Enhanced Real Estate Appraisal [0.9] 販売比較アプローチ(SCA)は、不動産評価において最も人気がある1つである。
我々は,多くの最先端アルゴリズムで使用される比較式の選択が,選択ポリシーを学習することで大幅に改善できることを実証した。
評価はすべて、米国、ブラジル、フランスにまたがる5つのデータセットに基づいて行われています。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:36:55 GMT)
Nested Feature Spectrum Topology: Tripartite Topological Equivalence of Feature, Entanglement, and Wilson Loop Spectrum [0.9] 特徴スペクトルは、量子可観測体のセクター間の絡み合いを符号化していることを示す。
特徴スペクトルの絡み合いスペクトルのスペクトル流とウィルソンループの巻線は、特徴エネルギー相補性の等価な表現であることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:19:26 GMT)
Sonar-MASt3R: Real-Time Opti-Acoustic Fusion in Turbid, Unstructured Environments [0.9] 本稿では,光学カメラデータから高密度対応をリアルタイムで抽出するオプティア音響融合法Sonar-MASt3Rを提案する。
本手法は, 振動条件下でのロバスト性を確保するため, 音響3次元再構成による幾何学的手がかりと組み合わせる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:51:11 GMT)
A Domain-Specific Language for LLM-Driven Trigger Generation in Multimodal Data Collection [0.8] 本稿では,意図駆動型オンデバイスデータ収集のための宣言型フレームワークを提案する。
高レベルのユーザ要求に基づいて,マルチモーダルセンサデータの選択的収集を可能にする。
制約のないコード生成よりも高い生成一貫性と実行レイテンシを実現する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 11:53:42 GMT)
Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios [0.8] 我々は、フロンティアAIモデルの自律的サイバー攻撃能力を、2つの目的に構築されたサイバーレンジで評価する。
企業ネットワークの範囲では、平均10万のトークンで完了したステップが1.7から9.8に増加した。
産業制御システムの範囲では、性能は依然として限られているが、最新のモデルは確実に完成する最初の段階である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:16:35 GMT)
Equivalence of approximation by networks of single- and multi-spike neurons [0.8] スパイクニューラルネットワークでは、各ニューロンが最大1回スパイクするには十分か?
近年の研究では、スパイクニューラルネットワークの近似バウンダリが導出され、ターゲット関数の適合性を定量化している。
ここでは、大きな種類のスパイクニューロンモデルに対して、その逆が成り立つことを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:00:10 GMT)
Extending Topological Bound on Quantum Weight Beyond Symmetry-Protected Topological Phases [0.8] 射影スペクトルによって定義される位相不変量は、量子計量に対する対称性を破る補正で量子ウェイトを下界とすることを示す。
提案したバウンダリは、基礎となる対称性が壊れた場合でも保持し、光学伝導率和則による実験的検証が可能である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:49:25 GMT)
Breaking concentration barriers for quantum extreme learning on digital quantum processors [0.8] 本稿では,最先端の超伝導プラットフォームに適した量子エクストリーム学習マシン(QELM)を試作し,実演する。
QELMは最大124量子ビットと回路を使用し、IBM Quantumコンピュータ上で5,000以上の2量子ビットゲートを持つ。
我々は,効率的な特徴選択と効果的な情報検索が可能な局所固有タスク解析を開発した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:10:09 GMT)
SCOPE: Semantic Coreset with Orthogonal Projection Embeddings for Federated learning [0.8] 現在のMLアプローチでは、非現実的なデータアグリゲーションを必要とするか、クラス不均衡のため失敗する。
SCOPEは,異常をフィルタし,冗長なデータを長期スキューに適応させる,フェデレートされたデータのためのコアセットフレームワークである。
SCOPEは、アップリンク帯域幅を128倍から512倍に削減しながら、競争力のあるグローバル精度と堅牢な収束をもたらす。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:24:12 GMT)
Human-Centered Evaluation of an LLM-Based Process Modeling Copilot: A Mixed-Methods Study with Domain Experts [0.8] 大規模言語モデル(LLM)をビジネスプロセス管理ツールに統合することは、非専門家のためのビジネスプロセスモデルと表記(BPMN)モデリングを民主化することを約束します。
自動化されたフレームワークは構文とセマンティックな品質を評価するが、信頼、ユーザビリティ、プロフェッショナルアライメントといった人間の要素を見逃している。
提案したソリューションであるLLMを用いたBPMNコラボロを,フォーカスグループと標準化されたアンケートを用いた5つのプロセスモデリング専門家を用いて,混合手法で評価した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:59:23 GMT)
Balancing the privacy-utility trade-off: How to draw reliable conclusions from private data [0.7] 本稿では,仮説テストに基づくプライバシ・ユーティリティ・トレードオフの新しい解釈を提案する。
実験結果の統計的意義を評価するためによく用いられる仮説テストに対するDPの影響を調べたところ,DPは解析的妥当性に影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:54:08 GMT)
A stabilizer $\mathrm{AME}(4,6)$ state does not exist [0.7] 4つの6次元四重項系に対する安定化器の絶対最大絡み合い状態の存在を証明した。
4つの6次元四重項系に対して、安定化器が絶対的に極大に絡み合った状態を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:53:15 GMT)
Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules [0.7] 適切なスコアリングルールは、トレーニング中に異なるモデルランキングと異なる帰納バイアスを誘導することを示す。
事前トレーニング中に見えないスコアルールを持つ微調整の realTabPFNv2.5 は、対応するメトリクスに対して一貫した改善をもたらす。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:39:12 GMT)
The AI Fiction Paradox [0.6] 私はこれをAI-Fiction Paradoxと呼び、機械学習ではトレーニングデータが一般的に出力品質を決定するので、特に驚くべきことです。
本稿では,現代建築における3つの異なる課題を特定することによって,フィクションがAI生成に抵抗する理由を理論的に正確に説明する。
魅力的なフィクションには、多スケールの感情的アーキテクチャ、単語、文、シーン、アークレベルの感情のオーケストレーションが同時に必要だ、と私は主張する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:32:21 GMT)
Vision-Language Based Expert Reporting for Painting Authentication and Defect Detection [0.6] 完全自動熱画像ビジョン言語モデル(VLM)フレームワークについて述べる。
マルチモーダルAIRT分析とモダリティを意識したテキストレポーティングを組み合わせる。
異常の位置、熱的挙動、そしてもっともらしい物理的解釈を記述した構造化されたレポートを生成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:49:31 GMT)
Experimental evidence of progressive ChatGPT models self-convergence [0.6] テキスト類似度尺度を用いて、さまざまなChatGPTモデルのキャパシティを評価し、多様なテキスト出力を生成する。
以上の結果から,ChatGPTリリースにおけるテキスト生成能力の低下が明らかとなった。
観測された出力の多様性の低減は、トレーニングデータセットに組み込まれた合成データの量の影響による可能性がある。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:57:19 GMT)
A Deformable Attention-Based Detection Transformer with Cross-Scale Feature Fusion for Industrial Coil Spring Inspection [0.6] 本稿では,MSD-DETR(Multi-Scale Deformable Detection Transformer)を提案する。
MSD-DETRは98 FPSで92.4% mAP@0.5を達成した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:35:15 GMT)
Algebraic Structure of Quantum Controlled States and Operators [0.6] ZXW-計算における制御図形はリッチな構造を持つことを示す。
高階写像 Ctrl の視点は、量子制御ゲートの標準概念を回復させる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:29:21 GMT)
Convergence Rate of a Functional Learning Method for Contextual Stochastic Optimization [0.6] 我々は,条件付き予測を共同で推定し,外的目的を最適化する同時学習最適化アルゴリズムを解析する。
我々は,この手法が次数$mathcalObig (1/sqrtNbig)$の収束率を達成することを証明した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:53:35 GMT)
Skill-informed Data-driven Haptic Nudges for High-dimensional Human Motor Learning [0.6] まず、入出力隠れマルコフモデル(IOHMM)を用いた人間の運動学習のダイナミクスをモデル化する。
次に、部分観測可能なマルコフ決定プロセス(POMDP)として、ハプティック・ナッジフィードバック設計問題を定式化する。
これにより、長期的なパフォーマンスコストを最小限に抑える最適なヌーディングポリシーを導出できます。
その結果,POMDP由来の政策を訓練した被験者は,タスク性能が有意に向上したことがわかった。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:31:12 GMT)
Nonlocal continuous-variable quantum nondemolition gates by optical connections [0.6] 非局所的な量子ゲート、遠くに位置する結合量子系は、分散量子コンピューティングに不可欠である。
本稿では,必要となる非局所連続可変(CV)量子非退化(QND)ゲートを実装するための実現可能なプロトコルのライブラリを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:13:37 GMT)
BenDFM: A taxonomy and synthetic CAD dataset for manufacturability assessment in sheet metal bending [0.5] 本稿では,構成依存と測定型の軸に沿った製造可能性指標の分類法を提案する。
鋼板の曲げ加工における製造性評価のための最初の合成データセットであるBenDFMを紹介する。
BenDFMは、製造可能と製造不可能の両方の20,000の部品を含み、プロセス対応の曲げシミュレーションによって生成される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:57:44 GMT)
Deep Distance Measurement Method for Unsupervised Multivariate Time Series Similarity Retrieval [0.5] DDMMは時系列全体における状態間の微妙な違いの学習を可能にする。
DDMMはPulp-and-paper millデータセット上で,最先端の時系列表現学習法よりも優れていた。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:06:34 GMT)
Widespread Gender and Pronoun Bias in Moral Judgments Across LLMs [0.4] 大規模言語モデル (LLMs) は、道徳的または倫理的なステートメントを評価するためにますます用いられる。
本研究は, 文法的人, 数, 性別的マーカーが, 公平性のLLM道徳的分類にどのように影響するかを, 制御された文レベルで研究する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 22:42:37 GMT)
Editing Away the Evidence: Diffusion-Based Image Manipulation and the Failure Modes of Robust Watermarking [0.4] 拡散ベースの画像編集はノイズを注入し、強力な生成前処理を通じて画像を再構成する。
非対向拡散編集は無意識に劣化したり、頑健な透かしを除去できることを示す。
結果は、定期的なセマンティック編集でさえ、透かしの復元可能性を大幅に低下させることを示している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:46:27 GMT)
Spatio-Semantic Expert Routing Architecture with Mixture-of-Experts for Referring Image Segmentation [0.3] 画像セグメント化の参照は、自然言語表現によって記述された画像領域のためのピクセルレベルのマスクを作成することを目的としている。
画像セグメンテーションを参照するための空間分割型エキスパートルーティングアーキテクチャSERAを提案する。
SERAは、視覚言語フレームワーク内の2つの相補的な段階において、軽量で表現を意識した専門家の洗練を導入する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:37:20 GMT)
Fluxon Time-Delay Readout of a Superconducting Qubit Protected by a Spectral Gap in a Josephson Transmission Line [0.3] 単一磁束量子(SFQ)の時間遅延に基づく超伝導量子ビットの量子状態の読み出し方式を理論的に検討する。
トランスモンキュービットとジョセフソン伝送線路(JTL)の容量結合に基づく時間遅延読み出しについて具体的に検討する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:10:56 GMT)
NOIR: Neural Operator mapping for Implicit Representations [0.2] NOIRは、連続関数空間間の演算子学習として、コア医療画像タスクを再構成する。
我々は,複数の2次元および3次元下流タスク(セグメント化,形状補完,画像間変換,画像合成など)におけるNOIRの評価を行った。
ネイティブの解像度で競争力を発揮すると同時に、目に見えない離散化に対して強い堅牢性を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:13:05 GMT)
The Economics of AI Supply Chain Regulation [0.2] この研究は、AIサプライチェーンの消費者余剰に政策介入がどう影響するかを分析するために、プロバイダと競合する2つの下流企業を含むゲーム理論モデルを用いている。
我々の分析は、下流市場における価格競争を促進する政策(すなわち、価格競争型政策)が、計算やデータ前処理コストが高い場合にのみ、消費者の余剰量を増大させることを示している。
対照的に、下流市場での品質競争を促進する政策(すなわち、プロクオリティ競争政策)は、常に消費者の余剰量を改善する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:03:55 GMT)
A Chip-Scale Transmitter Module for Real-Time Continuous-Variable QKD [0.2] 連続可変量子鍵分布(CV-QKD)は、標準の通信インフラ上でセキュアな通信を可能にする。
商用通信機器から構築したチップスケールハイブリッド送信機によって駆動されるリアルタイムCV-QKDシステムについて実証する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:02:09 GMT)
Route Fragmentation Based on Resource-centric Prioritisation for Efficient Multi-Robot Path Planning in Agricultural Environments [0.2] 優先度に基づくフラグメントプランナー(FP)の2つのバリエーションを示す。
ルートの断片化を利用して、部分的なルート進行を可能にし、バイナリベースの待ち時間の影響を制限する。
優先度計画 (PP) と優先度ベース探索 (PBS) のアルゴリズムと比較してスループットが大幅に向上した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:50:16 GMT)
A Grid-Based Framework for E-Scooter Demand Representation and Temporal Input Design for Deep Learning: Evidence from Austin, Texas [0.2] 本稿では,画像から画像への需要予測のための時間的入力構造を統計的に設計する手法を提案する。
我々は、旅行記録を時間ごとのピックアップ・アンド・ドロップオフ需要画像に変換することにより、グリッドベースの国勢調査データセットを構築した。
提案した設計では、次の24時間予測では平均2乗誤差を最大37%削減し、次の24時間予測では35%削減する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:36:04 GMT)
Succinct QUBO formulations for permutation problems by sorting networks [0.2] 比較交換ネットワークを用いた置換に対するQUBOの定式化を導入し,バイナリ変数は$O(n log2 n)$である。
提案手法の中心的な特徴は、各置換が一意な変数の割り当てに対応し、偏りのないサンプリングを可能にすることである。
制約付き置換の非バイアスサンプリングが重要である地域では,本手法が実用上有用であることが期待されている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:59:38 GMT)
Competition-Aware CPC Forecasting with Near-Market Coverage [0.2] 有料検索におけるコスト・パー・クリック(コスト・パー・クリック、英: Cost-per-Click、CPC)は、競争力のあるランドスケープによって生じる揮発性オークションの結果であり、個々の歴史から部分的にしか観察できない。
我々は,キーワードテキスト,CPCトラジェクトリ,地理的市場構造から得られる補完的な信号を用いて,1,811のキーワード系列と近似潜在競合を毎週予測する。
以上の結果から,キーワード由来のセマンティクスと地理的先行性を組み合わせた広範市場アウトカムカバレッジが,潜在競合を近似するスケーラブルな方法を提供することが示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:07:53 GMT)
A protocol for evaluating robustness to H&E staining variation in computational pathology models [0.1] 染色変化に対する感度は、計算病理学(CPath)モデルをデプロイする上で大きな障壁である。
我々はCPathモデルにおけるH&E染色変動に対するロバスト性を評価するための3段階のプロトコルを開発した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:34:31 GMT)
HR-Agents: Using Multiple LLM-based Agents to Improve Q&A about Brazilian Labor Legislation [0.1] 労働法統合 (CLT) は、ブラジルにおける労働関係を統括する主要な法的枠組みである。
労働法の問い合わせに対処する伝統的な方法は、しばしば非効率性、遅延、不整合につながる。
法的な質問応答(Q&A)の精度と効率を高めるため,LLM(Large Language Models)を利用したマルチエージェントシステムを導入した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:47:11 GMT)
Tighter monogamy and polygamy relations in multiparty quantum systems [0.1] 量子エンタングルメントのモノガミーおよびポリガミー特性は、多部量子系におけるエンタングルメントの分布に関する基本的な制約を特徴づける。
新しい数学的不等式を確立することにより、三部分量子系に対する改良された単ガミーと多ガミーの不等式を導出する。
提案した関係の有効性を示すための例を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:37:54 GMT)
ODRL Policy Comparison Through Normalisation [0.1] ODRL言語は、デジタル権利のポリシーと規制を表す標準となっている。
その複雑さは、その使用の障壁であり、多くの関連する理論的および実践的な研究がODRLの異なる、相互運用不可能な断片に焦点を合わせている。
我々は、ODRLポリシーのパラメトリックな正規化を最小のコンポーネントに含めるアプローチを提案することで、これらの問題を解決する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:09:22 GMT)
Towards Faithful Multimodal Concept Bottleneck Models [0.1] 概念ボトルネックモデル(Concept Bottleneck Models、CBM)は、人間の解釈可能な概念の層を通して予測をルーティングする解釈可能なモデルである。
本稿では,概念検出と漏洩軽減を共同で狙う視覚言語バックボーン上に構築されたマルチモーダルCBMフレームワークであるf-CBMを紹介する。
実験により、f-CBMはタスク精度、概念検出、リーク低減の最良のトレードオフを実現することが示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:56:08 GMT)
An Ideal Random Number Generator Based on Quantum Fluctuations and Rotating Wheel for Secure Image Encryption [0.1] 画像暗号化は、画像データを不正アクセスから保護するための有効な技術である。
暗号化データのセキュリティは、暗号化キーとして使用される乱数の品質に強く依存する。
本稿では,量子ゆらぎに基づくハイブリッド乱数生成器とアルゴリズムによる回転輪を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:00:02 GMT)
Optimal Continuous- to Discrete-Variable Bipartite Entanglement Conversion [0.1] 本稿では,連続可変(CV)アンタングルを離散可変(DV)アンタングルに変換するための2つの最適スキームを提案する。
最適性能を定量化し,実装に必要な測定演算子を同定する。
ボソニックプラットフォーム上でのDVベースの量子技術の実現可能性を向上させる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:54:24 GMT)
Interpretable Semantic Gradients in SSD: A PCA Sweep Approach and a Case Study on AI Discourse [0.0] Supervised Semantic Differential (SSD) は、連続した個人差分変数でテキストの意味がどのように変化するかをモデル化する混合量解釈法である。
そこで本稿では,K の近傍値における表現能力,勾配解釈可能性,安定性に関する共同基準として,次元選択を扱うPCAスイープ手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:46:18 GMT)
Beta Tantalum Transmon Qubits with Quality Factors Approaching 10 Million [0.0] サファイア上のβ-Ta膜から低損失トランスモン量子ビットを作製する。
β-Ta膜は、 (1.78 +/- 0.02) mの磁気透過深さを推定した値と一致して、大きな速度論的インダクタンスを示す。
この研究はサファイア上のβ-Taを低損失トランスモン量子ビットを実現するための材料プラットフォームとして確立する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:10:51 GMT)
Zeeman effect in hydrogen treated in classical physics with classical zero-point radiation [0.0] 水素の低共鳴エネルギー状態に対するゼーマン効果は古典的電磁力学によって処理される。
電子はクーロンポテンシャルの古典的な荷電粒子と見なされる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:59:54 GMT)
When Your Model Stops Working: Anytime-Valid Calibration Monitoring [0.0] PITMonitorは、確率積分変換の分布シフトを検出する、任意の値のキャリブレーション固有のモニタである。
リバーのFriedmanDriftベンチマークでは、PITMonitor検出率は最強のベースラインと競合する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:50:14 GMT)
What You Prompt is What You Get: Increasing Transparency of Prompting Using Prompt Cards [0.0] この分野に直面する重要な課題は、標準化されたプロンプトドキュメンテーションと評価プラクティスの欠如である。
本稿では, モデルカードの概念に触発された, プロンプトカード, プロンプトカード, ストラクチャード・サマリーの利用を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:38:25 GMT)
Wear Classification of Abrasive Flap Wheels using a Hierarchical Deep Learning Approach [0.0] 本稿では,フラップホイールの状態監視を自動化するために,新しい視覚重み付き階層型分類フレームワークを提案する。
実フラップホイール画像のカスタム構築データセットが生成され,EfficientNetV2アーキテクチャを用いた転送学習アプローチが使用された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:54:45 GMT)
Upper Bounds for Local Learning Coefficients of Three-Layer Neural Networks [0.0] 3層ニューラルネットワークにおける特異点における局所学習係数の上限式を導出する。
この公式は予算制約と需要供給制約の下でのカウントルールと解釈できる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:41:43 GMT)
UNIStainNet: Foundation-Model-Guided Virtual Staining of H&E to IHC [0.0] ヘマトキシリンおよびエオシン(H&E)画像からの仮想化学(IHC)染色は診断を加速することができる。
凍結病基盤モデル(UNI)から密集した空間トークンを条件としたSPADE-UNetであるUNIStainNetを提案する。
ミスアライメント・アウェア・ロス・スイートは、染色精度を保ち、学習された染色は、単一のモデルが複数のIHCマーカーを同時に提供することを可能にする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:02:28 GMT)
Two-channel physics in a lightly doped antiferromagnetic Mott insulator revealed by two-hole spectroscopy [0.0] スペクトル関数の超高分解能数値シミュレーションを行う。
主に探索されていない2粒子スペクトルにおいて、低エネルギーで生じる2つの結合したホールペアの枝を発見した。
我々の研究は、単一粒子グリーンの関数を超える2粒子分光を、非古典的超伝導の顕微鏡的起源を明らかにする強力なツールとして確立した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:57:02 GMT)
Trajectory-independent speed limits for controlled open quantum systems [0.0] 我々は、リンドブラッドマスター方程式によって記述された系における量子アニール時間に対するスケジュールに依存しない下界を導出する。
我々は,コヒーレント制御と消散の相互作用を,単一ビットと2ビットの例で解析する。
本研究では, 熱状態生成に境界を適用し, 温度限界におけるIsingモデルの予測挙動に一致したことを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:39:55 GMT)
Thermodynamic Limits of Quantum Search [0.0] 星形成が止まるまで、831ビット長の秘密鍵は膨張し、ダークエネルギーが支配する宇宙では決定的に再構成できない。
この限界を適用すれば、星形成が止まるまで、831ビット長の秘密鍵は膨張するダークエネルギー支配宇宙において決定的に再構成できないことが分かる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 23:30:35 GMT)
Theoretical Foundations of Latent Posterior Factors: Formal Guarantees for Multi-Evidence Reasoning [0.0] Latent Posterior Factors (LPF) は確率的予測タスクにおいて複数の異種証拠を集約するための原則的枠組みである。
LPFは各エビデンス項目を変分オートエンコーダを介してガウス潜在後部へエンコードし、後部をモンテカルロを経由してソフトファクタに変換し、正確なSum-Product Network Inference (LPF-PN) を介して集約する。
すべてのアグリゲータは、最大4,200のトレーニング例にまたがるデータセットに対して、経験的に検証されている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:44:14 GMT)
The Geometry of Knowing: From Possibilistic Ignorance to Probabilistic Certainty -- A Measure-Theoretic Framework for Epistemic Convergence [0.0] 疫学的不確実性は、可能性分布とその二重必然性尺度によって符号化される。
証拠が蓄積されるにつれて、遺族は契約を締結した。
これを厳密に証明し(定理4.5)、すべての仮定を明示し、非子音の場合を完全に扱う。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:27:05 GMT)
The Equivalence Theorem: First-Class Relationships for Structurally Complete Database Systems [0.0] The Equivalence Theorem: 構造的に完全な知識表現は、正確に4つの必要な能力を必要とする。
本稿では,4つの条件を同時に満たす分散時間因果ハイパーグラフフレームワークについて述べる。
私たちは、フレーム問題、コンフリクト解決、常識推論といった古典的なAI問題に対する解決策を導き出します。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:21:21 GMT)
The COTe score: A decomposable framework for evaluating Document Layout Analysis models [0.0] ドキュメントレイアウト分析(DLA)は、ページを意味のある要素に解析するプロセスである。
構造意味単位 (Structure Semantic Unit, SSU) は、コンテンツの物理的構造から意味的構造へ焦点を移すリレーショナルラベリング手法である。
私たちは、COTeスコアが従来のメトリクスよりも有益であることを示し、モデル間で異なる障害モードを明らかにします。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:03:42 GMT)
Technical Case Study of Privacy-Enhancing Technologies (PETs) for Public Health [0.0] このプロジェクトでは、差分プライバシ(DP)を使用して、現実的でプライバシに保護された合成金融トランザクションデータを作成する。
分析の結果,このDP保護データには,公衆衛生に対する空間的・時間的・予測的な有意な能力があることが判明した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:04:59 GMT)
Surrogates for Physics-based and Data-driven Modelling of Parametric Systems: Review and New Perspectives [0.0] サロゲートモデルは、ユーザ定義の入力パラメータと興味の出力量の間のコンパクトな関係を提供する。
本稿では,支配法則の知識とシステムの動的構造を生かした代理モデル構築手法について概説する。
それは、確立された知識、最近の進歩、次元の減少、物理に基づく、データ駆動の代理モデリングといった新しい視点を合成することを目的としている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:16:53 GMT)
Superposed quantum evolutions across chaotic and regular regimes [0.0] 我々は2つの量子進化の重ね合わせをマッハ・ツェンダー干渉計で調べる。
通常の進化をカオス的に重ね合わせると、結果として生じるサブシステムエントロピーは古典的な混合物のそれを超えることが示される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:45:30 GMT)
Structured Quantum Optimal Control under Bandwidth and Smoothness Constraints-An Inexact Proximal-ADMM Approach for Low-Complexity Pulse Synthesis [0.0] ゲート不整合性,全変分正則化,明示的帯域制限射影,ボックス制約を1ループで組み合わせた非コンパクトなプロキシADMMフレームワークについて検討する。
GRAPE、標準のKrotov、L-BFGS-Bに対して、シングルキュービットの$X$ゲート、リークが発生しやすいクォートタスク、2キュービットのエンタングゲートでベンチマークされる。
コントリビューションは、直ちに展開可能な高忠実度ゲートへの完了ルートとしてではなく、制約パルス合成のための数値的枠組みとして読み取るべきである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:27:40 GMT)
Structured Distillation for Personalized Agent Memory: 11x Token Reduction with Retrieval Preservation [0.0] AIエージェントとの長い会話は、あるユーザにとって単純な問題を生み出します。
本研究では,個人化されたエージェントメモリについて検討する。あるユーザのエージェントとの会話履歴を,後続検索のためのコンパクトな検索層に抽出する。
6つのソフトウェアエンジニアリングプロジェクトから4,182件の会話(14,340件の交換)を適用すれば、平均交換長が371件から38件に短縮され、11倍の圧縮が得られる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:21:58 GMT)
Structural Impact of Urban Topologies on Quantum Approximate Optimization: A Comparative Study of Planned vs. Organic Road Networks [0.0] この研究は、量子理論と我々の物理世界のカオス現実のギャップを埋める。
トポロジカルDNA」がアルゴリズムの成功にどのように影響するかを特定することで、この研究は重要なインフラのためのよりレジリエントな量子ソリューションの開発を可能にする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:07:53 GMT)
StatePlane: A Cognitive State Plane for Long-Horizon AI Systems Under Bounded Context [0.0] StatePlaneは、コンテキスト境界の下で動作しているAIシステムにおいて、エピソード、セマンティック、手続き状態の生成、進化、検索、崩壊を管理する。
本稿では,6つのドメイン固有のベンチマークによる,形式的状態モデル,KV対応アルゴリズム,書き込みパスのアンチポゾン,企業統合パス,評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 22:56:06 GMT)
State Algebra for Probabilistic Logic [0.0] 本稿では,確率的状態代数を決定論的命題論理の拡張として提示する。
エネルギーポテンシャルとして解釈された実数値座標に論理状態をマッピングすることにより、エネルギーベースモデルを定義する。
この代数は形式的なギブス分布を構成し、記号的制約と統計的推論の間の厳密な数学的リンクを提供する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:28:45 GMT)
Separating Intelligence from Execution: A Workflow Engine for the Model Context Protocol [0.0] MCPエンジンは、実行から切り離される新しいオーケストレーション層です。
エンジンは実行トークン当たりのコストを99%以上削減し、完全なクラスタグラフ(1200以上のノードと2,800以上のリレーションシップを含む)を45秒以内で完了させる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:12:14 GMT)
Semantic Consensus: Process-Aware Conflict Detection and Resolution for Enterprise Multi-Agent LLM Systems [0.0] エンタープライズAI自動化の主要なアーキテクチャとして,マルチエージェント大規模言語モデル(LLM)システムが急速に普及している。
生産は41%から86.7%の失敗率を示しており、その約79%は仕様や調整の問題に起因する失敗である。
6つのコンポーネントからなるプロセス認識フレームワークSemantic Consensus Framework(SCF)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:55:38 GMT)
Semantic Aware Feature Extraction for Enhanced 3D Reconstruction [0.0] 本研究は,キーポイント検出,キーポイント記述,セマンティックセグメンテーションを併用したマルチタスク学習を用いた意味認識機能抽出フレームワークを提案する。
提案手法は高度推定によるセマンティック3次元再構成をサポートし,高度変化を捉え,マルチレベルマッピングを実現する。
実験結果から, 本手法は構造的詳細および標高情報を改善した意味的アノテートされた3次元点雲を生成することが示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:49:32 GMT)
SectEval: Evaluating the Latent Sectarian Preferences of Large Language Models [0.0] 英語とヒンディー語の両方で利用可能であり,88の質問から成り立っている。
以上の結果から,言語による不整合がみられた。
先進的なモデルであるClaude-3.5は、イランのユーザーとスンニのユーザーに対して、サウジアラビアのユーザーに対して、ユーザーの国産品であるシーアの回答と一致するように回答を変更した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:12:17 GMT)
Scaling Laws and Pathologies of Single-Layer PINNs: Network Width and PDE Nonlinearity [0.0] 正準非線形PDE上での単層物理インフォームドニューラルネットワークに対する経験的スケーリング法則を確立する。
i) 解誤差がネットワーク幅で減少し, 固定された非線形性であっても, 解誤差が減少しない, および (ii) 複合的な障害が非線形性によって悪化する, 二重最適化の障害を同定する。
近似能力ではなく最適化が主要なボトルネックであることを示し、これらの複雑なスケーリング効果を経験的に測定する手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:40:36 GMT)
Robustness and optimization of N00N-state interferometry [0.0] 量子強調干渉法はしばしば理想的な資源とスケーリングの観点から議論されるが、実際は損失、状態不均衡、光子数の間の微妙な相互作用によってその性能が設定される。
我々はこの相互作用を、部分的に絡み合ったN00N状態が供給される折り畳みフランソン干渉計(Franson interferometer)で処理し、非対称な損失と等間隔での可変入力不均衡を処理した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:33:27 GMT)
Robust Sequential Tracking via Bounded Information Geometry and Non-Parametric Field Actions [0.0] LiDARによるターゲット追跡、高周波暗号秩序フロー、量子状態トモグラフィーの3つの領域にわたる実証的なベンチマークでは、この情報ジオメトリが異常値を解析的に減らすことを実証している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:40:44 GMT)
Response-Aware Risk-Constrained Control Barrier Function With Application to Vehicles [0.0] 本稿では,車両の動的安全境界制御のための応答認識型リスク制約制御バリア関数に基づく統合制御フレームワークを提案する。
このフレームワークは、制御勾配の基準方向を提供するために、名目力学と直接車体応答を融合する。
また、従来の決定論的安全制約をバリア関数誘導体のテールリスクに関する確率論的制約に再構成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:38:17 GMT)
Residual quantum correlations and non-Markovian noise [0.0] Wuらは2015年に残留量子相関(RQC)を導入した。
我々は、X状態におけるRQCの突然の死亡と回復の一般的な条件を導出する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 23:23:37 GMT)
Relativistic hydrogen in classical electrodynamics with classical zero-point radiation [0.0] 古典的な電磁ゼロ点放射は、クーロンポテンシャルにおける荷電粒子の基底状態と共鳴励起状態をもたらす。
これらの共鳴状態は、水素原子のボーア・ソマーフェルト理論に類似した作用変数の整数値に対応する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:49:17 GMT)
Reinforcement Learning for Elliptical Cylinder Motion Control Tasks [0.0] 我々は楕円円柱とそのトルク制限下での運動に焦点を当てている。
この問題のインスピレーションは、入力トルクが制限された距離で動作しなければならない非テザリング磁気デバイスからである。
本研究の主な目的は,入力トルクに制限のある楕円シリンダの制御問題を定義し,強化学習によって解決することである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:10:20 GMT)
Qubit syndrome measurements with a high fidelity Rb-Cs Rydberg gate [0.0] ルビジウム(Rb)とセシウム(Cs)の中間種。
2種類の原子配列は、量子非劣化(QND)量子ビット測定を可能にする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:09:57 GMT)
Quantum timekeeping and the dynamics of scrambling in critical systems [0.0] 情報スクランブルシステムの局所的なサブシステムは自然に量子ストップウォッチとして機能することを示す。
推定パラメータとして時間を扱う場合、一般化された量子クレーマー・ラオ境界を導出する。
仮想時間相関器に基づくスケーリング解析を用いて、サブシステムQFIは量子相転移付近で普遍的な臨界増幅を示すことを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:21:49 GMT)
Quantum contextuality with mixed states of 1D symmetry-protected topological order [0.0] 一次元多体系の混合状態を考慮した雑音量子優位性について検討する。
純粋状態(またはゼロ温度)の場合、これらの状態は測定ベースの量子計算に有用であることが知られている。
混合状態における量子優位性は、ねじれSOPと対称性表現期待値の組み合わせによって測定されることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 22:13:14 GMT)
Probing many-body localization crossover in quasiperiodic Floquet circuits on a quantum processor [0.0] 多体局在(MBL)は、相互作用する量子系が熱化を回避するメカニズムを提供する。
ここでは,IBM量子プロセッサ上の最大144量子ビットを用いた準周期浮動小数点演算系におけるエルゴディック-MBLクロスオーバーを実験的に検討する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:44:56 GMT)
Practical framework for simulating permutation-equivariant quantum circuits [0.0] ゲートジェネレータは最大$k$ローカルであり、$kin O(1)$であるという仮定のもと、$S_n$-equivariant 回路の実用的なアルゴリズムを導入する。
結果のメソッドは定数深度に対する$O(n+1)$時間で実行され、$$は行列乗算指数であり、既存の手法に比べて格段に低下する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:18:18 GMT)
Pointwise mutual information bounded by stochastic Fisher information [0.0] 我々は、一般的な上限を、フィッシャー情報の観点から、ポイントワイズな相互情報に導出する。
本稿では,これらの境界値の平均値について,フィッシャー情報の観点から,相互情報に対する境界値に関する文献で示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:09:59 GMT)
Perspective: Interactions and Nonlinearity in Non-Hermitian Physics [0.0] 非エルミート的ハミルトニアン(英語版)は開量子系の強力な記述を提供する。
まず、非エルミート力学の物理的起源を明らかにする。
次に、非ハーモニティと相互作用の相互作用から生じる豊かな表現論に焦点を当てる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:00:00 GMT)
Overcoming intrinsic material limitations through cavity feedback [0.0] 我々は、キャビティ-マグノン偏光子の直線幅を抑制するために、アクティブマイクロ波フィードバックループを実装した。
重要なマイルストーンとして、キャビティ-マグノン偏光子とメカニカルモードの通常のモード分割を実現する。
本研究は, 物質特性に制限されたと考えられるシステムにおいて, 強い結合状態にアクセスするための一般的な経路として, フィードバックを確立した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:48:30 GMT)
One Supervisor, Many Modalities: Adaptive Tool Orchestration for Autonomous Queries [0.0] 我々は、テキスト、画像、オーディオ、ビデオ、文書のモダリティにまたがる特殊なツールをコーディネートする、自律マルチモーダルクエリ処理のためのエージェントAIフレームワークを提案する。
中央スーパーバイザは動的にユーザクエリを分解し、サブタスクをモダリティに適したツールに委譲する。
テキストのみのクエリでは、このフレームワークはRouteLLM経由で学習したルーティングを使用し、非テキストパスはSLMによるモダリティ分解を使用する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:38:03 GMT)
On-Demand Correlated Errors in Superconducting Qubits from a Particle Accelerator [0.0] 電離放射線は超伝導量子プロセッサにおける相関誤差の既知の源である。
本稿では,電子線加速器を希釈冷凍機に結合させて,量子系の電離放射線を研究する施設を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:16:51 GMT)
On Using Machine Learning to Early Detect Catastrophic Failures in Marine Diesel Engines [0.0] 海洋エンジンの破滅的な故障は、機能が著しく失われ、システムを破壊したり損傷させたりすることを暗示している。
本研究は破滅的故障を早期に検出するための新しい方法を提案する。
故障したエンジンの実際のデータに基づいて、実際のセンサ読み取りとエンジン変数の期待値との偏差の導出を評価する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 07:24:06 GMT)
On Linear Separability of the MNIST Handwritten Digits Dataset [0.0] MNISTデータセットは、様々なパターン認識と画像分類モデルを評価するための基本的なベンチマークである。
MNISTデータセットの長い歴史にもかかわらず、データセットが線形分離可能であるかどうかという問題は、まだ完全に答えられていない。
本研究の目的は,この課題に対処するための総合的な実験的な調査を提供することであり,トレーニング,テスト,組み合わせセットのペアワイズとワンブレストの分離を区別することである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:51:10 GMT)
Noise-protected two-qubit gate using anisotropic exchange interaction [0.0] ゲルマニウム量子ドットにホストされるホールスピン量子ビットは、スケーラブルな量子コンピューティングの候補として有望である。
本稿では,ゲルマニウムホールスピン量子ビットのギャップレス操作のための新しい2量子ゲートプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:48:25 GMT)
Noise mitigation of quantum observables via learning from Hamiltonian symmetry decays [0.0] 我々は、対称性崩壊(GUESS)からGUiding Extrapolationsと呼ばれる新しい量子エラー緩和技術(QEM)を提案する。
GUESSはハミルトン対称性を利用してノイズ量子計算の精度を向上させる。
提案手法の精度を,ベースラインゼロノイズ補間(ZNE)と,100ドルキュービットのシステムに対するテンソルネットワークシミュレーションと比較した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:09:16 GMT)
Marker-Based 3D Reconstruction of Aggregates with a Comparative Analysis of 2D and 3D Morphologies [0.0] 本稿では, フレキシブルで費用対効果の高いフォトグラメトリによる凝集粒子の3次元再構成手法を提案する。
実験結果の精度を, 試料の接地構造に対して検証した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 05:21:01 GMT)
MR-GNF: Multi-Resolution Graph Neural Forecasting on Ellipsoidal Meshes for Efficient Regional Weather Prediction [0.0] 我々は,地球上の楕円型多スケールグラフ上で,短期的な地域予測を行う軽量な物理認識モデルであるMulti-Resolution Graph Neural Forecasting (MR-GNF)を紹介する。
MR-GNFは、イギリスとアイルランドのセクターで、地表の温度、風、降水量について、安定な+6hから+24hの予測を提供する。
これらの結果は、グラフベースのニューラルオペレーターが、NWPコストのごく一部で信頼性の高い高解像度気象予測を達成できることを実証している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:04:22 GMT)
MGMAR: Metal-Guided Metal Artifact Reduction for X-ray Computed Tomography [0.0] 金属インプラントは標準的なCT前方モデルの仮定に反し、重度のストリーキングとシャドーイングアーティファクトを生み出した。
再建パイプライン全体を通して金属関連情報を明示的に活用する金属誘導型MAR法であるMGMARを提案する。
MGMARは最先端のパフォーマンスを達成し、29例の臨床検査で平均0.89点のスコアを得た。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:41:23 GMT)
MESD: Detecting and Mitigating Procedural Bias in Intersectional Groups [0.0] 本研究は、複数の保護されたカテゴリーにおける公平性に関する説明可能性を検討することにより、重要なギャップに対処する。
複数のデータセットにまたがる実験結果から、UEFは目的を効果的にバランスしていることが分かる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:42:31 GMT)
Literary Narrative as Moral Probe : A Cross-System Framework for Evaluating AI Ethical Reasoning and Refusal Behavior [0.0] 既存のAIモラル評価フレームワークは、真のモラル推論能力の存在よりも、正しいサウンドを持つ倫理的応答の生成をテストする。
本稿では,文学的物語を表面性能に対して構造的に耐性のある刺激材料として用いた新しいプローブ手法を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:41:23 GMT)
Large Language Models and Scientific Discourse: Where's the Intelligence? [0.0] 科学的知識の作り方について検討し,それを大規模言語モデルと比較する。
LLMはそのような言説にはアクセスできない、あるいはアクセスできない、と論じられている。
次に、新しいモンティホールプロンプトを発明し、LCMのパネルと人間のパネルの反応を比較します。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:23:03 GMT)
JCAS-MARL: Joint Communication and Sensing UAV Networks via Resource-Constrained Multi-Agent Reinforcement Learning [0.0] JCAS-MARLは、JCAS対応UAVネットワークのためのフレームワークである。
本稿では,JCAS対応UAVネットワークにおけるセンサ通信とエネルギーのトレードオフを利用したMARL政策について検討する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:53:56 GMT)
Is the matrix completion of reduced density matrices unique? [0.0] 電子構造理論において、2粒子還元密度行列 (2-RDM) はエネルギーと他の重要な性質を決定するのに十分である。
最近の研究は、RDMの低ランク構造と近似理論モデルを利用して、部分データから2-RDMを再構成する行列補完を用いている。
本稿では,Fermi-Hubbardモデルに適用することで,正確な行列補完を実現するハイブリッド量子確率アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:38:47 GMT)
Influence Malleability in Linearized Attention: Dual Implications of Non-Convergent NTK Dynamics [0.0] 線形化された注意はその無限幅のNTK限界に収束しないことを示す。
また、注意力と脆弱性は、カーネル体制からの離脱に共通点があることも示している。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:33:34 GMT)
Inaccurate (weak) measurements classical and quantum [0.0] 古典的および量子システム上での高精度な測定について考察する。
どちらの場合も、個々のトライアルで実現されたシナリオに関する情報は失われる。
いずれの場合も因果関係は、追加のポスト選択がシステムの最終的な状態の間の個々の結果を再分配することを保証する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 12:12:34 GMT)
I Know What I Don't Know: Latent Posterior Factor Models for Multi-Evidence Probabilistic Reasoning [0.0] 本稿では,遅延後続因子 (LPF) をSum-Product Network (SPN) 推論のソフトな可能性因子に変換するフレームワークとして紹介する。
LPF を LPF-SPN (structured Factor-based inference) と LPF-Learned (end-to-end learned aggregate) とみなす。
8つのドメイン(7つの合成およびFEVERベンチマーク)で、LPF-SPNは高い精度(最大97.8%)、低い校正誤差(ECE 1.4%)、強い確率適合を達成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 10:05:14 GMT)
Hadamard regularization of open quantum systems coupled to unstructured environments in the Schwinger-Keldysh formalism [0.0] 開量子系の理論は、外部自由度への結合が可観測性と量子コヒーレンスをどう修飾するかを論じる。
遅い系の時間スケールにおけるカダノフ・ベイム方程式のタイムステッピングアルゴリズムについて述べる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:28:11 GMT)
Governing the Agentic Enterprise: A Governance Maturity Model for Managing AI Agent Sprawl in Business Operations [0.0] 組織は、コントロールされていないエージェントのスプロールに直面します。
この課題の認知度は高まるが、学術文献には正式な、実証的に検証されたガバナンス成熟度モデルがない。
本稿では、12のガバナンスドメインにまたがる5段階のフレームワークであるエージェントAIガバナンス成熟度モデル(AAGMM)を紹介する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:35:14 GMT)
Ghosts of Softmax: Complex Singularities That Limit Safe Step Sizes in Cross-Entropy [0.0] クロスエントロピートレーニング分析は、提案されたステップが目標を減少させるかどうかを予測するために、損失の局所的なテイラーモデルに依存する。
提案した更新方向に沿って,ロジット線形化の下で閉形式式を導出する。
_a$の正規化は、標準偏差$0.992$から$0.164$へのオンセット閾値の広がりを縮小する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:42:12 GMT)
From Gradients to Riccati Geometry: Kalman World Models for Single-Pass Learning [0.0] バックプロパゲーションは現代の機械学習を支配しているが、力学系を最適化する唯一の原則的手法ではない。
ベイズフィルタを用いて学習した学習状態空間モデルであるKalman World Models (KWM)を提案する。
我々は,このフレームワークをトランスフォーマーベースの大規模言語モデル (LLM) に拡張し,内部アクティベーションを潜在動的状態の修正として扱う。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:30:30 GMT)
Fractals made Practical: Denoising Diffusion as Partitioned Iterated Function Systems [0.0] DDIMの逆チェーンがPIFS(Partitioned Iterated Function System)として動作することを示す。
PIFSは、拡散モデルスケジュール、アーキテクチャ、および訓練目標を記述するための統一設計言語として機能する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 15:15:50 GMT)
Fisher information based lower bounds on the cost of quantum phase estimation [0.0] 量子位相推定(QPE)は、ユニタリ演算子の固有値を推定するために設計された量子アルゴリズムの基礎である。
既存の性能評価は、量子回路に固有の統計情報を古典的な後処理の効率から切り離すことに失敗した。
我々はサーキット設計の性能限界を定式化するためにフィッシャー情報とクラマーラオ低域を用いる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:40:12 GMT)
Federated Few-Shot Learning on Neuromorphic Hardware: An Empirical Study Across Physical Edge Nodes [0.0] On-chip spike-timing-dependent plasticity (STDP) は浮動小数点浮動小数点法よりも二進的に重みを更新する。
我々はBrainChip Akida AKD1000プロセッサを用いた2ノードフェデレーションシステムを構築した。
FedUnionは、要素ワイド平均化(FedAvg)がそれを破壊している間、常に精度を維持する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 14:45:52 GMT)
Fast Arbitrary Qutrit Gates for NV Centers in the Low-Field Regime [0.0] ゼロフィールド遷移に調整された一定強度の単色マイクロ波パルスを用いて、低磁場状態下で高速な任意のクエットゲートを実装する手法を提案する。
任意の SU(3) 演算は、$hat_5$ および $hat_8$ に関連するジェネレータの有効実装とともに、二重量子部分空間内の回転に分解可能であることを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:35:39 GMT)
Extracting information from a superradiant burst using simple measurements [0.0] 最適化されたフィルタと線形推定器を組み合わせた簡単な測定により、初期スピン状態の量子フィッシャー情報の$N$スケーリングが復元されることを示す。
この結果と設定は, 固体スピンアンサンブルのキャビティベースの読み出しを行うための新しい方法である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:21:41 GMT)
ExpanderGraph-128: A Novel Graph-Theoretic Block Cipher with Formal Security Analysis and Hardware Implementation [0.0] 128ビットのブロック暗号であるbfExpanderGraph-128(EGC128)を20ラウンドのバランスの取れたFeistelネットワークとして提案する。
セキュリティ分析はMILPベースの差分境界を組み合わせ、SCIPを介して10ラウンドで最適であることが証明され、147.3ビットの差分セキュリティを確立し、完全な暗号に対して413ビットに保守的に外挿する。
Xilinx Artix-7上のFPGA合成は380 LUTで100MHzで261Mbpsを達成するが、ARM Cortex-M4Fソフトウェアは25.8KBのFlashと1.66msの暗号化を必要とする。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:15:20 GMT)
Executable Archaeology: Reanimating the Logic Theorist from its IPL-V Source [0.0] 私はCommon Lispで書かれた新しいIPL-Vインタプリタの構築について説明する。
私は、1963年のStefferudの技術的レポートから直接書き起こされたコードから、論理論者の忠実な再アニメーションを説明します。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:47:31 GMT)
Examining Users' Behavioural Intention to Use OpenClaw Through the Cognition--Affect--Conation Framework [0.0] 本研究では,Cognition-Affect-Conation(CAC)フレームワークを通じて,OpenClawを使用するユーザの行動意図を検討する。
本研究は、システムの認知が感情反応にどのように影響し、その後行動意図を形作るかを研究する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:55:15 GMT)
Entanglement-Assisted Discrimination of Nonlocal Sets of Orthogonal States [0.0] 量子非局所性を示す量子状態の絡み合いによる識別は、量子情報理論におけるフロンティアのトピックである。
資源効率の高いLOCC識別プロトコルの開発とマルチパーティ・エンタングルメントの役割について検討する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:27:08 GMT)
Embedded Quantum Machine Learning in Embedded Systems: Feasibility, Hybrid Architectures, and Quantum Co-Processors [0.0] 組み込み量子機械学習(EQML)は、IoTノードやウェアラブル、ドローン、サイバー物理コントローラといったリソース制約のあるエッジプラットフォームに、量子機械学習機能を提供することを目指している。
2026年、EQMLは限定的で非常に実験的な形でのみ技術的に実現可能である。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 00:48:35 GMT)
EmDT: Embedding Diffusion Transformer for Tabular Data Generation in Fraud Detection [0.0] EmDTは不正サンプルを生成するために設計された拡散モデルである。
UMAPクラスタリングを利用して、異なる不正パターンを識別する。
次に、正弦波位置埋め込みを用いたTransformer denoising Networkを訓練し、特徴関係を捉える。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:13:07 GMT)
Elucidating magnetic structure with optical dopants: erbium-doped Gd$_2$SiO$_5$ [0.0] 我々は、Gd$_2$SiO$_5$の既知の磁性秩序を決定するために、Er$3+$ドーパントの光遷移を測定した。
遷移の磁場依存性を測定することで、結晶の$a*$軸からわずかに缶詰するスピンで反強磁性秩序を導いた。
この研究は、磁気構造決定の方法のベンチマークに利用できる。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:10:50 GMT)
EPIC-EuroParl-UdS: Information-Theoretic Perspectives on Translation and Interpreting [0.0] 本稿では、英語とドイツ語のEPIC-UdS (spoken) と EuroParl-UdS (write) コーパスの更新および統合版を紹介する。
新バージョンはメタデータとテキストエラーを前回の使用で修正し、コンテンツを洗練し、言語アノテーションを更新し、新しいレイヤを追加する。
本稿は、今回のリリースで導入されたアップデートの概要を概説し、コーパスに基づいて以前の結果を要約し、新しいイラストレーション研究を示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 23:54:21 GMT)
Dynamics of Many-Emitter Ensembles: Probing Cooperative Evolution with Scalable Quantum Circuits [0.0] 多くの粒子量子系は、しばしば非平衡力学においてエキゾチックな振る舞いを引き起こす。
ここでは、放射線浴で結合した多くの量子エミッタ系の場合について考察する。
ボソニックモードを量子ビットの集合に効率的にマッピングすることにより、量子回路を実装する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:51:57 GMT)
Dynamic Sparse Attention: Access Patterns and Architecture [0.0] ダイナミックアテンション(DSA)は、キャッシュされたキー値エントリのトップkサブセットに計算を制限することで、トーケン毎のアテンション帯域を削減する。
複数のオープンソースバックボーン上でDSAスタイルの選択を行うための軽量なインデクサを実装することにより,これらの効果について検討する。
本稿では,現代の推論プラットフォームにおけるDSAの利用を改善するために,今後のアーキテクチャおよびアルゴリズム探索の方向性を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:38:35 GMT)
Do single-shot projective readouts necessarily estimate the $T_1$ lifetime ? [0.0] マルチレベルシステムのためのシングルショットキュービット読み出しプロトコルは、しばしば実験寿命の傾向を捉えていない。
我々は、この格差の根本原因として、外来個体群動態を同定する。
設計空間におけるハンドリングの改善により、バレーキュービットの寿命を推定する改訂された読み出しプロトコルが提案される。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:29:42 GMT)
Distributed Human Identity: AI-Enabled Multi-Existence Through Cognitive Replication and Robotic Embodiments [0.0] 本稿では,認知的,行動的,感情的な特性をAI対応の具体化に再現する社会技術フレームワークであるMulti-Existence Identity(MEI)を紹介する。
MEIは、認知の忠実さ、感情共鳴、文脈応答性を分散エージェントに埋め込むことによって、デジタル双生児、テレプレゼンス、マルチプレゼンスアバターを超えて進化する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 04:16:16 GMT)
Distance learning from projective measurements as an information-geometric probe of many-body physics [0.0] 現代の量子シミュレーターは単発射影「スナップショット」の大きなアンサンブルを生成する
このような表現学習は遠距離学習に有利である。
我々は、Csiszar f-divergences(分布間の統計的距離)を教師なしの方法で推定するために、単一の神経判別器を使用する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:03:28 GMT)
Diffusion-based Generative Machine Learning Model for Predicting Crack Propagation in Aluminum Nitride at the Atomic Scale [0.0] 窒化アルミニウム(AlN)の原子スケールき裂伝播を予測する拡散型生成機械学習モデルを開発した。
このモデルは、応力駆動による亀裂発生、ひび割れの分岐、原子スケールのブリジング靭帯などの動的破壊過程を正確に予測しながら、顕著なスピードアップを達成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:20:37 GMT)
Diffusion-Based Feature Denoising and Using NNMF for Robust Brain Tumor Classification [0.0] 本研究では,Non-Negative Matrix Factorization (NNMF) と軽量畳み込みニューラルネットワーク (CNN) を組み合わせた脳腫瘍分類フレームワークを提案する。
実験の結果, 提案手法は, 対向摂動に対する頑健さを著しく向上させながら, 競争的分類性能を達成することが示された。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 17:15:46 GMT)
Cross-Lingual Transfer and Parameter-Efficient Adaptation in the Turkic Language Family: A Theoretical Framework for Low-Resource Language Models [0.0] 大規模言語モデル(LLM)は自然言語処理を変換しているが、その能力は言語間で不均一である。
ほとんどの多言語モデルは、主に高リソース言語に基づいて訓練されており、訓練データと評価ベンチマークの両方において、多くの話者人口を持つ言語が不足している。
本稿では,トルコ語族における多言語LLMの多言語間移動とパラメータ効率適応に関する理論的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 21:47:50 GMT)
Cost-Efficient Multimodal LLM Inference via Cross-Tier GPU Heterogeneity [0.0] MLLM(Multimodal large language model)推論は、ハードウェア要求に反する2つのフェーズに分けられる。
標準変圧器KVキャッシングの下では、モダリティ境界はデバイス間転送を最小化する。
We build HeteroServe, a phase-aware runtime with modality-level partitioning and cross-tier scheduling。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 06:42:35 GMT)
Context is all you need: Towards autonomous model-based process design using agentic AI in flowsheet simulations [0.0] 本稿では,産業用フローシートシミュレーション環境における支援を行うエージェントAIフレームワークを提案する。
我々は,プロセス開発タスクを,工学知識を用いて抽象的な問題を解くエージェントと,Chemasimコードとしてソリューションを実装するエージェントとで分解するマルチエージェントシステムの開発を行う。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 09:13:52 GMT)
Context Engineering: From Prompts to Corporate Multi-Agent Architecture [0.0] 関連性, 十分性, 孤立性, 経済性, 証明性, およびエージェントのオペレーティングシステムとしてのコンテキストフレームの5つの品質基準を提案する。
Intent Engineeringは、組織目標、価値、トレードオフ階層をエージェントインフラストラクチャにエンコードする。
仕様工学は、大規模にマルチエージェントシステムの自律的な運用を可能にする企業方針と標準の機械可読コーパスを作成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:59:39 GMT)
Commutation Groups and State-Independent Contextuality [0.0] 我々は、ペレス・メルミン魔法正方形で実証された量子非古典性の鍵形式である状態独立な文脈性論について研究する。
本稿では,ジェネレータとリレーションによって表現されるEmphcommutationグループを紹介し,それらを文字列書き換えシステムの観点から解析する。
線型代数的構成もあり、ハイゼンベルク群の有向版が存在する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:57:17 GMT)
Co2SeO3Cl2: Studies of Emerging Magnetoelectric Coupling in a Polar, Buckled Honeycomb Material [0.0] 磁力材料の開発には、磁気格子と構造極性を統合する戦略が必要である。
極性で座屈したハニカム磁石Co2SeO3Cl2にそのようなアプローチを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 20:15:40 GMT)
Classical linear oscillator in classical electrodynamics with classical zero-point radiation [0.0] 基底状態は、古典的ゼロ点放射との共鳴から得られる平均的なパワーと、放射放射で失われた電力とエネルギーバランスが一致していることが判明した。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 13:22:16 GMT)
BERTology of Molecular Property Prediction [0.0] 化学言語モデル(CLM)は、分子特性予測(MPP)タスクのための一般的な古典的機械学習モデルとの競合候補として浮上している。
本研究では,MPP 用 CLM の事前学習および微調整性能に及ぼすデータセットサイズ,モデルサイズ,標準化などの諸要因の影響について,厳密に制御された何百もの実験を実施・分析する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 22:18:22 GMT)
Asymptotic non-Hermitian degeneracy phenomenon and its exactly solvable simulation [0.0] 同様の許容不可能な量子モデルに対して、合理的な小摂動に基づく正規化が存在しない理由を説明する。
この説明は、従来の例外点 (EP) を持つ IEP 特異点の部分的な形式的な類似に基づいている。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:30:09 GMT)
Asymptotic and Finite-Time Guarantees for Langevin-Based Temperature Annealing in InfoNCE [0.0] 対数的逆温度の遅いスケジュールは、大域的最適表現の集合に確率の収束を保証することを示す。
本研究は, 比較学習と模擬焼鈍の関連性を確立し, 温度スケジュールの理解と調整の原理的基礎を提供する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 01:32:35 GMT)
Agnostic Dynamical Decoupling for Single-Qubit Gates [0.0] 所望のゲートを実装したスムーズな単一ビット制御パルスの設計法を提案する。
ノイズモデルの事前知識を必要とする動的に修正されたゲート構造とは異なり、本手法はターゲット-バス相互作用の詳細な形式に依存しない。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 18:00:09 GMT)
Agent Privilege Separation in OpenClaw: A Structural Defense Against Prompt Injection [0.0] オープンソースマルチツールエージェントプラットフォームであるOpenClaw内で動作している現在の世代モデルに対して、Microsoft LLMail-Injectベンチマークを複製します。
提案する防御機構は,エージェント分離を特権分離した2エージェントパイプラインとして実装したツールパーティショニングと,アクションエージェントが処理する前にパーサシブフレーミングを除去する構造化された出力を生成するフォーマッティングの2つを組み合わせたものである。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 02:03:00 GMT)
Adversarial Stress Tests for Quantum Certification [0.0] 古典的なベンチマークの明らかな違反は、真の非古典的な振る舞いを示唆する必要はない。
マーチンゲールセーフな低信頼境界に基づくプロトコルに依存しないアライメント原理を定式化する。
適応学習に基づく古典的エージェントは許容可能な古典的集合を拡大しないことを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:49:58 GMT)
Adaptive Virtual Reality Museum: A Closed-Loop Framewor for Engagement-Aware Cultural Heritage [0.0] 暗黙的なマルチモーダルセンシングにより,コンテンツ深度をリアルタイムビジター行動に調整するクローズドループ適応インタフェースを提案する。
その結果,高いユーザビリティを維持しつつ,読書のエンゲージメントと探索時間を2~3倍に向上した。
これらの予備的な発見は、大規模な調査を保証し、エンゲージメント検証、AI透明性、遺産コンテキストにおける生成モデルに関する疑問を提起する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 22:46:19 GMT)
Active quantum matter from monitored pure-state dynamics [0.0] 我々は、スピンアップ粒子を左にシャッフルし、スピンダウン粒子を右にシャッフルする測定過程のスピンフルルッティンガー液体を考える。
弱いモニタリング強度と強磁性スピン相互作用のために、スピン電流と電荷密度の間のパワー-ロー量子相関を求める。
モニタリングは二重の役割を担い、ベルジンスキー-コステリッツ-チューレス相転移をより大きな強度で短距離相関状態に駆動しながら弱強度の量子活性相関を生成する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 03:59:44 GMT)
Active Sampling Sample-based Quantum Diagonalization from Finite-Shot Measurements [0.0] 短期量子デバイスは有限ショットの測定のみを提供し、不完全で汚染された状態に備える。
これは、サンプルを完全なトモグラフィーや徹底的な測定なしに信頼性の高い低エネルギー推定に変換するアルゴリズムを動機付けている。
アクティブサンプリングサンプルに基づく量子対角化(AS-SQD)を提案する。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 19:17:33 GMT)
Accessing which-path information in the absorption and emission of light by a quantum dot in a Ramsey sequence [0.0] ラムゼー様系列に沿った量子ドットによる光の吸収・放出における経路情報の定量化を行う。
この結果は、どの経路情報やより一般的に量子相関が量子領域の光-物質エネルギー交換にどのように影響するかを示す。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 16:43:30 GMT)
A Fractional Fox H-Function Kernel for Support Vector Machines: Robust Classification via Weighted Transmutation Operators [0.0] サポートベクタマシンは、データを特徴空間にマッピングするカーネル関数の選択に大きく依存している。
一般化時空間分数拡散波方程式の基本解から導かれる新しい非定常核のクラスを提案する。
我々の定式化は、遠方のアウトリールをペナル化するための老化関数(「アムネシア効果」)と、頑丈で重い尾を持つ特徴写像を可能にする分数的なパワー-ロー崩壊を含む。
論文参考訳(メタデータ) (Fri, 13 Mar 2026 08:55:34 GMT)