SafeSci: Safety Evaluation of Large Language Models in Science Domains and Beyond [134.4] 安全評価と科学的文脈の強化のための包括的枠組みであるSafeSciを紹介する。
SafeSciには、0.25Mサンプルを持つマルチディシプリナのベンチマークであるSafeSciBenchと、安全性向上のための1.5Mサンプルを含む大規模データセットであるSafeSciTrainが含まれている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:16:04 GMT)
TIMI: Training-Free Image-to-3D Multi-Instance Generation with Spatial Fidelity [126.9] 本研究では,高空間忠実度を実現する画像から3次元のマルチインスタンス生成のためのトレーニングフリーフレームワークを提案する。
具体的には、まずインスタンス認識分離誘導(ISG)モジュールを導入し、インスタンスのアンタングル化を容易にする。
次に、空間適応型幾何安定化更新(SGU)モジュールを考案し、インスタンスの幾何学的特性の保存を促進する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:10:28 GMT)
Modular Memory is the Key to Continual Learning Agents [100.1] In-Weight Learning(IWL)の強みと、モジュラーメモリの設計を通じて新たに登場したIn-Context Learning(ICL)の機能を組み合わせることが、大規模に継続的適応するための欠片である、と我々は主張する。
我々は、ICLを高速適応と知識蓄積に活用するモジュール型メモリ中心アーキテクチャの概念的フレームワークと、モデル機能の安定した更新のためのIWLについて概説する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:40:05 GMT)
Learning Structured Reasoning via Tractable Trajectory Control [99.8] Ctrl-Rは、トラクタブルな軌道制御を通じて構造化推論を学ぶためのフレームワークである。
Ctrl-Rは,従来達成できなかった推論パターンを効果的に探索し,内部化することができることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:18:19 GMT)
FreeAct: Freeing Activations for LLM Quantization [90.0] 量子化は、大規模言語モデルの重要なメモリと計算オーバーヘッドを軽減するために重要である。
FreeActは静的な1対1の制約を緩和し、動的アクティベーションの格差を緩和する新しい量子化フレームワークである。
dLLMとMLLMでの実験では、FreeActはベースラインを大幅に上回り、パフォーマンスは最大5.3%向上した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:02:17 GMT)
Certified Circuits: Stability Guarantees for Mechanistic Circuits [80.3] Certified Circuitsは、回路発見のための証明可能な安定性を保証する。
ImageNetとOODデータセットでは、認定回路は91%高い精度を達成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:21:23 GMT)
SageBwd: A Trainable Low-bit Attention [78.6] SageAttentionのような低ビットの注意は、モデル推論を加速するための効果的なアプローチとして現れてきたが、トレーニングへの適用性はまだよく分かっていない。
SageBwdは、微調整性能を維持しながら、7つの注意行列乗算のうち6つを量子化する、トレーニング可能なINT8アテンションである。
我々は,SageBwdが事前トレーニング中に全精度の注意と一致することを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:39:49 GMT)
From Verbatim to Gist: Distilling Pyramidal Multimodal Memory via Semantic Information Bottleneck for Long-Horizon Video Agents [78.3] 本稿ではファジィトレース理論に基づくピラミッド型マルチモーダルメモリアーキテクチャMM-Memを提案する。
MM-Memメモリは階層的に感覚バッファ、エピソードストリーム、シンボリックに構造する。
実験により、MM-Memがオフラインタスクとストリーミングタスクの両方で有効であることが確認された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:12:45 GMT)
LaSER: Internalizing Explicit Reasoning into Latent Space for Dense Retrieval [74.7] LaSERは、レトリバーの潜在空間に明示的な推論を内部化する、新しい自己蒸留フレームワークである。
提案手法は, 明示的なCoTパイプラインの推論深度と, 標準的な高密度検索器の推論効率をうまく組み合わせる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:11:18 GMT)
Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles [74.3] 幾何学的事前学習フレームワークであるtextbfRigidSSL$(textitRigidity-Aware Self-Supervised Learning$)を紹介した。
フェーズI(RigidSSL-Perturb)は、AlphaFoldタンパク質構造データベースから432K構造から、シミュレートされた摂動を持つ幾何学的先行を学習する。
フェーズII(RigidSSL-MD)は、1.3K分子動力学軌道上のこれらの表現を洗練し、物理的に現実的な遷移を捉える。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 21:32:30 GMT)
CeProAgents: A Hierarchical Agents System for Automated Chemical Process Development [73.3] CeProAgentsは、協調労働による化学プロセスの開発を自動化するために設計された階層型マルチエージェントシステムである。
このシステムを厳密に評価するために,ケミカルエンジニアリングの3つの柱を中心に構築された多次元ベンチマークであるCeProBenchを構築した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:37:18 GMT)
Tool Verification for Test-Time Reinforcement Learning [70.1] テスト時強化学習(TTRL)は、大規模推論モデルの自己進化のための有望なパラダイムとして登場した。
本稿では,T3RL(Tool-Verification for Test-Time Reinforcement Learning)を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:57:52 GMT)
Robometer: Scaling General-Purpose Robotic Reward Models via Trajectory Comparisons [69.9] 汎用ロボット報酬モデルは通常、専門家によるデモンストレーションから絶対的なタスク進捗を予測するために訓練される。
本稿では、軌道内進行監視と軌道間優先監視を組み合わせたスケーラブルな報酬モデリングフレームワークRobometerを紹介する。
ロビオメーターは、専門家データに報酬等級を固定するフレームレベルのプログレス・ロスと、グローバルな順序制約を課す軌跡比較優先損失という2つの目的で訓練されている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:38:58 GMT)
Preference Score Distillation: Leveraging 2D Rewards to Align Text-to-3D Generation with Human Preference [69.3] Preference Score Distillation (PSD) は、3Dトレーニングデータなしでテキストから3D合成を行うための最適化ベースのフレームワークである。
我々の重要な洞察は、ピクセルレベルの勾配の不整合性に起因している。
我々は、好みスコアと負のテキスト埋め込みを協調最適化するための適応戦略を導入する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:23:36 GMT)
Learning to Draft: Adaptive Speculative Decoding with Reinforcement Learning [67.9] 本稿では,各ドラフト・アンド・検証サイクルのスループットを直接最適化する新しい手法であるLearning to Draftを紹介する。
LTDは2.24倍から4.32倍までのスピードアップ比を達成し、最先端のイーグル3よりも36.4%向上した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:17:48 GMT)
Continuous Exposure-Time Modeling for Realistic Atmospheric Turbulence Synthesis [65.2] 大気の乱流は、幾何学的なワープと露光時間依存のぼかしを導入することで、長距離イメージングを著しく劣化させる。
既存の乱流効果の方法は、しばしばぼやけと露出時間の関係を単純化する。
我々は,連続露光時間モデリングを明示的に組み込んだ大規模合成乱流データセットET-Turbを構築した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:58:44 GMT)
$π$-StepNFT: Wider Space Needs Finer Steps in Online RL for Flow-based VLAs [64.6] フローベース視覚言語行動モデルは、具体的制御において優れるが、多段階サンプリングにおいて難易度に悩まされる。
textbftextit$boldsymbol$-StepNFT (Step-wise Negative-aware Fine-Tuning)を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:04:49 GMT)
LiveCultureBench: a Multi-Agent, Multi-Cultural Benchmark for Large Language Models in Dynamic Social Simulations [63.5] 大規模言語モデル(LLM)は、自律的なエージェントとしてますますデプロイされているが、評価は主に文化的適切性や評価者の信頼性よりもタスクの成功に焦点を当てている。
シミュレーション町において, LLMをエージェントとして組み込んだマルチカルチャー動的ベンチマークであるLiveCultureBenchを紹介する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:04:16 GMT)
AMemGym: Interactive Memory Benchmarking for Assistants in Long-Horizon Conversations [61.7] AMemGymは、メモリ駆動型パーソナライゼーションのためのオンライン評価と最適化を可能にする対話型環境である。
我々のフレームワークは、対話エージェントのメモリ能力を向上するためのスケーラブルで診断に富んだ環境を提供する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:15:11 GMT)
HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generating Detail-Preserving Human-Product Images [61.3] HiFi-Inpaintは、人為的な画像を生成するのに適した、新しい高忠実な参照ベースのインペインティングフレームワークである。
細粒度製品の特徴を洗練するためのSEA(Shared Enhancement Attention)と、正確なピクセルレベルの監視を行うためのDAL(Detail-Aware Loss)を導入する。
我々は、自己合成データから得られたサンプルを自動フィルタリングで処理し、HP-Image-40Kという新しいデータセットを構築した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:59:36 GMT)
Token Reduction via Local and Global Contexts Optimization for Efficient Video Large Language Models [61.1] ビデオ大言語モデル(VLLM)は、強力なビデオ理解を示すが、冗長な視覚トークンによる非効率性に悩まされる。
フレーム内およびフレーム間コンテキスト内でトークン textbfAnchors を詳述する新しい視点を提案する。
提案するAOTは,先行するビデオLLMのショート・ビデオベンチマークとロング・ビデオベンチマークの競合性能を比較検討する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:06:40 GMT)
InterCoG: Towards Spatially Precise Image Editing with Interleaved Chain-of-Grounding Reasoning [60.8] 複雑な現実世界のシーンにおける微細な画像編集のためのテキストビジョンインターリーブド・チェーン・オブ・グラウンド推論フレームワークを提案する。
InterCoGの重要な洞察は、まずテキスト内でのみオブジェクト位置推論を実行することである。
また,マルチモーダル・グラウンド・ライティング・アライメント・アライメントとマルチモーダル・グラウンド・ライティング・アライメント・アライメントの2つの補助的トレーニング・モジュールを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:13:16 GMT)
Federated Agentic AI for Wireless Networks: Fundamentals, Approaches, and Applications [60.7] フェデレートラーニング(FL)はエージェントAIの全体的なループを改善する可能性がある。
まず、エージェントAIとメインストリームのFLタイプの基礎を要約し、各FLタイプがエージェントAIのループの特定のコンポーネントを強化する方法について説明する。
低高度無線ネットワークにおけるエージェントAIの動作決定性能を向上させるためにFRLを用いたケーススタディを行う。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:26:56 GMT)
Beyond Caption-Based Queries for Video Moment Retrieval [60.3] キャプションベースのクエリでトレーニングしたVMR手法の劣化について検討するが,検索クエリで評価した。
3つのパブリックVMRデータセットでテキストクエリを変更することで、3つのベンチマークを導入する。
提案手法は,検索クエリの性能を最大14.82% mAP_m,マルチモーメント検索クエリ最大21.83% mAP_mで改善する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:06:41 GMT)
Reconstructing Content via Collaborative Attention to Improve Multimodal Embedding Quality [59.7] CoCoAは、マルチモーダル埋め込み最適化のための協調注意に基づくコンテンツ再構成事前学習パラダイムである。
EOSをベースとした再構築タスクを導入し、対応するEOS>埋め込みからの入力を再構成するようモデルに促す。
MMEB-V1の実験では、Qwen2-VLとQwen2.5-VLをベースにしたCoCoAが埋め込み品質を著しく向上することを示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:34:45 GMT)
Unifying Heterogeneous Multi-Modal Remote Sensing Detection Via Language-Pivoted Pretraining [59.3] 不均一なマルチモーダルリモートセンシングオブジェクト検出は、多様なセンサからオブジェクトを正確に検出することを目的としている。
既存のアプローチでは、下流の微調整中にモーダリティアライメントとタスク固有の最適化が絡み合う遅延アライメントパラダイムが採用されている。
本稿では,下流のタスク学習からモダリティアライメントを明確に分離する,統一型言語パイロット事前学習フレームワークであるBabelRSを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:38:12 GMT)
Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation [58.2] 我々は,世界力学を暗黙的に理解したVモデルを実現するシンプルなアプローチであるPri4Rを紹介する。
Pri4Rは、VLAモデルを軽量なポイントトラックヘッドで拡張し、3Dポイントトラックを予測する。
このような課題に対して,Pri4Rは性能を著しく向上させることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:23:53 GMT)
Adaptive Spectral Feature Forecasting for Diffusion Sampling Acceleration [58.2] スペクトル拡散特徴予測器(Spectrum)を提案する。
我々はFLUX.1で4.79$times$スピードアップ、Wan2.1-14Bで4.67$times$スピードアップを達成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:59:11 GMT)
What Papers Don't Tell You: Recovering Tacit Knowledge for Automated Paper Reproduction [57.9] Methodは、学術論文から実行可能なコードを生成するグラフベースのエージェントフレームワークである。
3つのドメイン、10のタスク、10の最近の論文にまたがる拡張ReproduceBenchでは、公式実装に対する平均的なパフォーマンスギャップが10.04%に達する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:33:31 GMT)
Orchestrating Multimodal DNN Workloads in Wireless Neural Processing [57.5] エッジ推論では、無線リソース割り当てとアクセラレータディープ・ニューラル・コンピューティング(DNN)のスケジューリングはまだエンドツーエンドで共最適化されていない。
本稿では,無線伝送とマルチコア実行を一貫したエンドツーエンドパイプラインに統合するパラダイムについて検討する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:25:43 GMT)
OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens [56.7] そこで我々は,ファイルから形状,アニメーション機能,制御パラメータを表すコマンドやパラメータの構造化シーケンスに変換する,よく設計されたLottieトークンを導入している。
このようなトークン化により、事前学習された視覚言語モデルに基づいてOmniLottieを構築し、マルチモーダルなインターリーブ命令に従い、高品質なベクトルアニメーションを生成することができる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:59:05 GMT)
Non-Markovian Long-Horizon Robot Manipulation via Keyframe Chaining [56.6] Keyframe-Chaining VLAは、キー履歴フレームを抽出し、長い水平依存関係をモデル化するフレームワークである。
本研究では,現在の実行フェーズに対する時間的関連性に基づいて,動的に履歴フレームを検索する進捗対応機構を設計する。
タスク成功率を測定するために,ManiSkillシミュレータ上に構築された4つの非マルコフ操作タスクスイートを紹介する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:26:29 GMT)
Words & Weights: Streamlining Multi-Turn Interactions via Co-Adaptation [55.9] マルチターンインタラクション(T2PAM)に対するテスト時ポリシー適応は,大規模言語モデル(LLM)と動的ユーザニーズとの整合に不可欠である。
本稿では,単語と重みの不均一な空間上での相互作用を協調最適化問題として再構成するフレームワークであるROSA2を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:16:20 GMT)
Kiwi-Edit: Versatile Video Editing via Instruction and Reference Guidance [55.3] 本稿では,既存のビデオ編集ペアを高忠実度トレーニング四重項に変換するスケーラブルなデータ生成パイプラインを提案する。
本稿では,学習可能なクエリと参照セマンティックガイダンスのための潜在視覚特徴を相乗化する統合編集アーキテクチャKiwi-Editを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:46:28 GMT)
Stereo-Inertial Poser: Towards Metric-Accurate Shape-Aware Motion Capture Using Sparse IMUs and a Single Stereo Camera [55.0] 本稿では,距離精度と形状を考慮した3次元動作を推定するリアルタイムモーションキャプチャシステムであるStereo-Inertial Poserを提案する。
モノクラーRGBをステレオビジョンに置き換え、直接3次元キーポイント抽出と形状パラメータ推定を可能にした。
ドリフトフリーなグローバル翻訳を長い記録時間で生成し,フットスケート効果を低減させる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:46:38 GMT)
Streaming Real-Time Trajectory Prediction Using Endpoint-Aware Modeling [54.9] 近隣の交通機関の将来の軌道は、自動運転車の経路計画と意思決定に大きな影響を与えている。
本稿では,軽量かつ高精度なストリーミングベース軌道予測手法を提案する。
当社のアプローチは推論遅延を大幅に低減し、現実のデプロイメントに適しています。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:44:23 GMT)
Near-Optimal Regret for KL-Regularized Multi-Armed Bandits [54.8] KL正規化目標に対するオンライン学習の統計的効率について検討する。
我々は、MABsのKL正規化後悔が$$非依存であることを示し、$tilde(sqrtKT)$とスケールする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:17:33 GMT)
Recursive Think-Answer Process for LLMs and VLMs [54.5] R-TAP(Recursive Think-Answer Process)を提案する。
R-TAPにより、モデルは反復的推論サイクルに参加し、より正確な答えを生成することができる。
R-TAP強化モデルが従来のシングルパス法より一貫して優れていることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:20:10 GMT)
A Practical Guide to Streaming Continual Learning [54.0] 連続学習(CL)とストリーミング機械学習(Streaming Machine Learning)は、非定常データのストリームからエージェントが学習する能力を研究する。
類似点もいくつかあるが、それらは異なる相補的な課題に対処している。
実世界の問題に対する統一的な解決策を提供する新興パラダイムであるストリーミング連続学習(SCL)について論じる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:06:34 GMT)
TopoCurate:Modeling Interaction Topology for Tool-Use Agent Training [53.9] 訓練用ツール使用エージェントは一般的に、パスレート選択されたタスクに対して、軌道変更の成功と強化学習(RL)に依存している。
TopoCurateは,同一タスクから多段階的なロールアウトを統一的な意味的商トポロジに投影する対話型フレームワークである。
TopoCurateは最先端のベースラインに対して4.2%(SFT)と6.9%(RL)という一貫したゲインを達成している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:38:54 GMT)
Downstream Task Inspired Underwater Image Enhancement: A Perception-Aware Study from Dataset Construction to Network Design [53.9] そこで本研究では,水中視覚タスクに有効な画像強調を行うために,下流タスクインスパイアされた水中画像強調(DTI-UIE)フレームワークを提案する。
具体的には,機能混合のためのタスク認識型アテンションモジュールを備えた効率的な2分岐ネットワークを設計する。
DTI-UIEは、下流タスクに有用な前処理画像を生成することにより、タスク性能を著しく向上することを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:50:09 GMT)
Architecture-Aware Multi-Design Generation for Repository-Level Feature Addition [53.5] RAIMは、リポジトリレベルの機能追加のための、多設計およびアーキテクチャ対応のフレームワークである。
複数の多様な実装設計を生成することで、線形パッチから切り離される。
NoCode-bench Verifiedデータセットの実験では、RAIMが新しい最先端のパフォーマンスを確立することが示されている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:50:40 GMT)
Rethinking Camera Choice: An Empirical Study on Fisheye Camera Properties in Robotic Manipulation [53.3] 我々は,手首に装着した魚眼カメラの特性を模倣学習のために厳密に分析した。
魚眼で訓練された政策は、十分な環境多様性で訓練された場合、優れた場面の一般化を解放する。
本研究は,ロボット学習における魚眼データセットの大規模収集と有効活用のための具体的かつ実用的なガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:00:37 GMT)
CharacterFlywheel: Scaling Iterative Improvement of Engaging and Steerable LLMs in Production [52.9] CharacterFlywheelは、大規模言語モデル(LLM)を生産的なソーシャルチャットアプリケーションで改善するための反復的なプロセスである。
内部および外部のリアルタイムトラフィックからのデータを使用して、15世代にわたってモデルを洗練しました。
7日間のA/Bテストを行い、一貫したエンゲージメントの改善を示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:27:31 GMT)
UltraStar: Semantic-Aware Star Graph Modeling for Echocardiography Navigation [52.8] 経路回帰からアンカーベースグローバルローカライゼーションへのプローブナビゲーションを再構成するUltraStarを提案する。
1.31万以上のサンプルを持つデータセットの実験では、UltraStarはベースラインを上回り、より長い入力長でスケールすることが示されている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:21:06 GMT)
Closed-Loop Action Chunks with Dynamic Corrections for Training-Free Diffusion Policy [52.1] 我々は,チャンクベースのアクション生成とリアルタイム修正を統合した動的クローズドループ拡散ポリシーフレームワークDCDPを提案する。
動的PushTシミュレーションでは、DCDPは5%の計算しか必要とせず、再トレーニングなしに適応性を19%改善する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:04:18 GMT)
Expanding LLM Agent Boundaries with Strategy-Guided Exploration [52.0] 強化学習(RL)は、コンピュータ使用、ツール呼び出し、コーディングなどのタスクのエージェントとして、大規模言語モデル(LLM)の訓練後において顕著な成功を収めた。
我々は,低レベルな行動から高レベルな言語戦略に移行するための戦略ガイド探索(SGE)を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:28:39 GMT)
Joint Shadow Generation and Relighting via Light-Geometry Interaction Maps [51.8] 単分子深度から光を識別する新しい表現である光幾何相互作用マップを提案する。
LGIは、オフザシェルフ2.5D深度マップ予測から計算された、確実かつ正確に光と影の相互作用をキャプチャする。
LGIをブリッジマッチングした生成バックボーンに埋め込むことで、曖昧さを低減し、物理的に一貫した光陰性推論を強制する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:20:14 GMT)
OmniRet: Efficient and High-Fidelity Omni Modality Retrieval [51.8] OmniRetは,テキスト,視覚,音声の3つの重要なモダリティにまたがる複雑なクエリを処理可能な,最初の検索モデルである。
提案モデルでは,コンポジションクエリ,音声,ビデオ検索のタスクにおいて,最先端のモデルを用いたオンパーパフォーマンスを実現しつつ,大幅な改善を実現している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:19:55 GMT)
Preoperative-to-intraoperative Liver Registration for Laparoscopic Surgery via Latent-Grounded Correspondence Constraints [51.7] Land-Regは変形可能な登録フレームワークで、潜伏した2D-3Dのランドマーク対応を学習する。
厳格な登録のために、Land-Regはクロスモーダルラテントアライメントモジュールを採用している。
類似性マッチングを持つ不確実なオーバーラップランドマーク検出器を提案し, 明確な2D-3Dランドマーク対応を強く推定する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:44:03 GMT)
Hyperparameter Trajectory Inference with Conditional Lagrangian Optimal Transport [51.6] デプロイ後、ユーザの好みが進化し、初期設定が望ましくないようになる。
我々は、観測データから、NNの条件付き出力分布がハイパーパラメータでどのように変化するかを学ぶ。
我々は、NNを観測されていないハイパーパラメータで近似する代理モデルを構築した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:55:02 GMT)
Dimension-Independent Convergence of Underdamped Langevin Monte Carlo in KL Divergence [50.7] Underdamped Langevin dynamics (ULD) は Gibbs 分布の$propto e-V$ に広く使われているサンプルである。
離散化LDDにおける最初の次元自由なKL分散境界を証明した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:14:38 GMT)
FACE: A Face-based Autoregressive Representation for High-Fidelity and Efficient Mesh Generation [50.7] フェースレベルでメッシュを生成する新しいAutoregressive AutoencoderフレームワークであるFACEを紹介する。
当社のワンフェイスワンツーケン戦略は、メッシュの基本構築ブロックである三角形の面を、単一の統一トークンとして扱います。
FACEは、標準ベンチマークで最先端の再構築品質を達成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:47:15 GMT)
Conformal Policy Control [50.5] 我々は、安全な参照ポリシーを、最適化されているが未試験のポリシーの確率的規制として使う方法を示す。
保守的な最適化方法とは異なり、ユーザーが正しいモデルクラスを識別したとは仮定しない。
自然言語質問応答から生体分子工学まで,本研究の応用実験は,デプロイ開始当初から安全な探索が可能であることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:54:36 GMT)
Scaling Tasks, Not Samples: Mastering Humanoid Control through Multi-Task Model-Based Reinforcement Learning [49.8] 効果的なオンライン学習は、タスク毎のサンプル数ではなく、タスクの回数を拡大すべきである、と我々は主張する。
この体制はモデルに基づく強化学習の構造上の利点を明らかにしている。
我々は、オンライン学習のためのサンプル効率のよいマルチタスクアルゴリズムである textbfEfficientZero-Multitask (EZ-M) を用いて、このアイデアをインスタンス化する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:07:43 GMT)
Provable and Practical In-Context Policy Optimization for Self-Improvement [49.7] 本研究では,モデルが推論における複数ラウンドの自己回帰によって解答を改善するテスト時間スケーリングについて検討する。
In-Context Policy Optimization (ICPO)を導入し、エージェントはパラメータを変更することなく、自己評価または外部から観察された報酬を用いて、その応答を文脈で最適化する。
提案する最小エントロピーICPO(ME-ICPO, Minimum-Entropy ICPO)は、その応答と自己評価報酬を反復的に利用して、推論時にその応答を洗練する実用的なアルゴリズムである。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:21:50 GMT)
FluxMem: Adaptive Hierarchical Memory for Streaming Video Understanding [49.2] FluxMemは階層的な2段階の設計を通じて冗長な視覚記憶を適応的に圧縮する。
既存のオンラインビデオベンチマークで、最先端の結果を新たに達成する。
強力なオフライン性能を維持し、MLVUで73.1を達成し、65%のビジュアルトークンを使用する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:16:47 GMT)
PanCanBench: A Comprehensive Benchmark for Evaluating Large Language Models in Pancreatic Oncology [48.7] 大規模言語モデル(LLM)は、標準化された検査において専門家レベルの性能を達成したが、複数の選択精度は現実の臨床的有用性や安全性を十分に反映していない。
我々は、未確認患者の質問に対して、専門家のルーブリックを作成するための、ループ内人間パイプラインを開発した。
LLM-as-a-judge フレームワークを用いて,22のプロプライエタリおよびオープンソース LLM の評価を行い,臨床完全性,事実精度,Web-search 統合について検討した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:50:39 GMT)
Generative Visual Chain-of-Thought for Image Editing [48.6] 既存の画像編集手法は、複雑なシーンや微妙な空間的指示の下で、編集すべき場所を認識するのに苦労する。
この問題に対処するため,GVCoT(Generative Visual Chain-of-Thought)を提案する。
GVCoTは、まず空間的手がかりを生成してターゲット領域をローカライズし、次に編集を実行することで、ネイティブな視覚推論を行う。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:12:52 GMT)
Authenticated Contradictions from Desynchronized Provenance and Watermarking [48.5] この研究は、$textitIntegrity Clash$を形式化し、実証的に実証している。
本稿では,3500枚のテスト画像に対して100%の分類精度を達成し,証明メタデータと透かし検出ステータスを共同評価する層間監査プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:42:12 GMT)
RedacBench: Can AI Erase Your Secrets? [48.3] ドメインと戦略間のポリシー条件付きリアクションを評価するベンチマークであるRedacBenchを紹介します。
RedacBenchは、オリジナルのセマンティクスを保持しながらポリシー違反情報を選択的に除去するモデルの能力を測定する。
我々は8,053の注釈付き命題を用いて、各テキスト中のすべての推測可能な情報をキャプチャする性能を定量化する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:29:49 GMT)
Neural Operator-Grounded Continuous Tensor Function Representation and Its Applications [47.6] 本研究では,複雑な実世界のデータをより忠実に表現できる,ニューラルネットワークによる連続テンソル関数表現(NO-CTR)を提案する。
通常のメッシュグリッド、解像度の異なるメッシュギルド、メッシュグリッド以外の実験は、NO-CTRの優位性を示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:47:17 GMT)
tttLRM: Test-Time Training for Long Context and Autoregressive 3D Reconstruction [47.4] tttLRMは、テストタイムトレーニング層を利用する新しい大型3D再構成モデルである。
本フレームワークは,TTT層の高速な重み付けに複数の画像観測を効率よく圧縮する。
オンライン学習モデルの変種は,ストリーミング観測による進行的な3次元再構成と改善を支援する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:56:43 GMT)
Boosting Device Utilization in Control Flow Auditing [47.4] 制御フロー(CFAud)とは、遠隔検証器(Vrf)が証明器(Prv)MCUに取られた制御フローパスに関する証拠を、Prvソフトウェアが侵害された場合でも受信する機構である。
現在のCFAudでは、Prvのroot-of-anchored root-of-RoTが、Vrfにフローエビデンスを確実に配信するために実行を保ちます。
CARAMELは、制御フローエビデンスをVrfに送信しながらPrvを再開できるハードウェアRoTの共同設計である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:26:17 GMT)
GraphScout: Empowering Large Language Models with Intrinsic Exploration Ability for Agentic Graph Reasoning [46.7] 近年のGraph-based Retrieval-Augmented Generation (GraphRAG)法では,知識グラフと大規模言語モデル (LLM) の反復的相互作用を導入し,推論能力を向上させる。
より柔軟なグラフ探索ツールを備えたトレーニング中心のエージェントグラフ推論フレームワークであるGraphScoutを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:25:40 GMT)
NextAds: Towards Next-generation Personalized Video Advertising [46.7] NextAdsは次世代のパーソナライズされたビデオ広告のためのパラダイムだ。
私たちは、パーソナライズされたクリエイティブ生成とパーソナライズされたクリエイティブ統合という2つの代表的なタスクを定式化します。
我々は初期の探索実験を行い、GenAIがパーソナライズされたクリエイティブを創造し、統合し、パフォーマンスを奨励できることを実証した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:58:07 GMT)
UETrack: A Unified and Efficient Framework for Single Object Tracking [46.5] UETrackは単一のオブジェクト追跡のための効率的なフレームワークである。
RGB、Depth、Therical、Event、Languageといった複数のモダリティを効率的に扱う。
従来の手法に比べて、速度精度のトレードオフが優れている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:32:30 GMT)
Safe Whole-Body Loco-Manipulation via Combined Model and Learning-based Control [46.5] そこで本研究では,マニピュレータアームのモデルベースアプタンス制御と足歩行の強化学習ポリシを組み合わせた全身制御を提案する。
アクセタンスコントローラは、物理的相互作用中に人間によって適用されるような外部レンチを、望ましいエンドエフェクタ速度にマッピングし、従順な振る舞いを可能にする。
6-DoFアームと手首に装着した6-DoF Force/Torqueセンサーを備えたUnitree Go2四足歩行ロボットを用いて,シミュレーションとハードウェアの両方におけるアプローチを検証する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:31:12 GMT)
Steerable Vision-Language-Action Policies for Embodied Reasoning and Hierarchical Control [46.2] Steerable Policies: サブタスクやモーション,接地したピクセル座標など,さまざまな抽象化レベルで,リッチな合成コマンドに基づいてトレーニングされたVLA。
この利点は、学習した高レベルな具体的推論器と既製のVLMの両方を使って、コンテキスト内学習を通じてコマンドの抽象化を推論することで実証する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 23:14:20 GMT)
An Analysis of Multi-Task Architectures for the Hierarchic Multi-Label Problem of Vehicle Model and Make Classification [46.0] 階層型マルチラベル分類問題におけるマルチタスク学習の利点と限界を分析する。
並列型とカスケード型の両方のマルチタスクアーキテクチャを考慮し、それらが異なるDeep Learning分類器に与える影響を評価する。
両データセットにおけるマルチタスクパラダイムの有効性を検証し,ほぼすべてのシナリオにおいてCNNの性能を向上させる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:17:32 GMT)
Symmetry-protected topology and deconfined solitons in a multi-link $\mathbb{Z}_2$ gauge theory [45.9] 球殻の大円として視覚化できるリンクを持つ多重グラフ上で定義された$mathbbZ$格子ゲージ理論を研究する。
これは、ピエルズ不安定性に類似した現象の根底にある状態依存トンネル振幅につながることを示す。
行列積状態に基づいて詳細な解析を行うことで、電荷分解が電荷-摩擦化の結果生じることを証明できる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:59:25 GMT)
Benchmarking Semantic Segmentation Models via Appearance and Geometry Attribute Editing [45.4] 我々はストレステストセマンティックセグメンテーションモデルのための自動データ生成パイプラインGen4Segを構築した。
クローズドセットモデルからオープンボキャブラリ大モデルまで,さまざまなセマンティックセグメンテーションモデルをベンチマークする。
本研究は, セグメンテーションモデルを自動的に解析する有効なツールとして, 生成モデルの可能性を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:05:37 GMT)
KDFlow: A User-Friendly and Efficient Knowledge Distillation Framework for Large Language Models [45.3] 知識蒸留(KD)は、大規模言語モデル(LLM)をより小さなものに圧縮するために必要な技術である。
我々は,SGLangを教師推論に用い,疎結合アーキテクチャを特徴とするtextbfKDFlowを提案する。
我々のフレームワークは、オフ・ポリティクスとオン・ポリティクスの蒸留の両方をサポートし、高度でユーザフレンドリーなAPIを通じて、クロス・トケナイザーKDのためのKDアルゴリズムを組み込んでいる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:54:19 GMT)
QCAgent: An agentic framework for quality-controllable pathology report generation from whole slide image [44.8] QCAgentは、全スライディング画像(WSI)から品質制御可能な病態レポートを生成するためのエージェントフレームワークである
必要な診断の詳細と制約を指定するユーザ定義のチェックリストによってガイドされる、カスタマイズされた批評メカニズムが組み込まれている。
批判的フィードバックとテキストパッチによるセマンティック検索に基づいて、WSI内の情報領域を再同定する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:27:31 GMT)
Synthetic Visual Genome 2: Extracting Large-scale Spatio-Temporal Scene Graphs from Videos [44.2] マルチスケール・パノプティクス・セグメンテーション,オンライン・オフライン・トラッキング,トラジェクトリ・セマンティック・パーシングによる新たなオブジェクトの自動発見,GPT-5に基づく時間的関係推論を組み合わせた完全自動パイプラインを設計する。
TRaSERは、トラジェクトリ整列トークン配置機構と新しいモジュール、オブジェクト-トラジェクトリ・リサンプラーと時間-ウインドウ・リサンプラーでVLMを増強する。
SVGSG、VIPSeg、VidOR、SVG2テストデータセットでは、TRaSERは関係検出を+15から20%改善し、オブジェクト予測を+30から40%改善する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:04:15 GMT)
Goal-Oriented Semantic Communication for ISAC-Enabled Robotic Obstacle Avoidance [44.1] 無人航空機(UAV)障害物回避作業におけるISAC対応BSについて検討した。
本稿では,センサとコマンドと制御(C&C)信号を効率よく伝達する目的指向セマンティックコミュニケーション(GOSC)フレームワークを提案する。
GOSCは、送信されたセンシング信号とC&C信号の数を92.4%減らし、送信時間スロットの数を85.5%減らしながら、同じ100%のタスク成功率を達成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:15:02 GMT)
AoE: Always-on Egocentric Human Video Collection for Embodied AI [44.1] ファンデーションモデルは、事前トレーニングとスケーリングのために、大規模で高品質な現実世界のインタラクションデータを必要とする。
我々は,人間とスマートフォンを活用したハードウェア依存の簡易化を目的とした,Always-on Egocentric (AoE)データ収集システムを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:33:09 GMT)
Revisiting Global Token Mixing in Task-Dependent MRI Restoration: Insights from Minimal Gated CNN Baselines [43.5] グローバルトークンミキシングはMRIの復元において一般的なモデル設計の選択肢となっている。
グローバルトークンミキシングは,各タスクにおいて,3つの代表的な設定で実際に有用かどうかを問う。
MRIの再生を高速化するために、最小限のアンロールゲート-CNNベースラインは、すでに非常に競争力がある。
制御された低パス劣化により、低周波k空間データがほとんど保存されている超解像の場合、局所ゲートモデルは競争力を維持する。
空間的ヘテロセダスティックノイズを発音する場合には,トークン混合モデルが最も高い総合的な性能が得られる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:57:52 GMT)
Scalable Multi-Task Low-Rank Model Adaptation [43.2] マルチタスク低ランク適応(LoRA)を多数のタスクに拡張すると、破滅的なパフォーマンス劣化を引き起こす。
規則化や動的ルーティングのような既存のソリューションは、基本的なトレードオフによって制約されるため、スケールで失敗するのです。
3つの新しい設計を持つスケーラブルなソリューションであるmtLoRAを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:57:11 GMT)
From Black Box to Glass Box: Cross-Model ASR Disagreement to Prioto Review in Ambient AI Scribe Documentation [43.1] 異種ASRシステム間のクロスモデル不一致は、基準のない不確実性信号として機能する。
商用APIとオープンソースエンジンにまたがる8つのASRシステムを備えた,50の公開医療用オーディオクリップを転写した。
低アグリメント領域は内容の不一致に富み、高リスク質量のクインタイル全体では53.9%から73.9%に増加した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:02:13 GMT)
RO-N3WS: Enhancing Generalization in Low-Resource ASR with Diverse Romanian Speech Benchmarks [42.2] 我々は、自動音声認識(ASR)における一般化を改善するために設計されたルーマニア語音声データセットであるRO-N3WSを紹介する。
RO-N3WSは、放送ニュース、文学的オーディオブック、映画対話、子供の物語、会話ポッドキャストのスピーチから収集された126時間以上の音声を収録する。
我々は、ゼロショットと微調整の両方で最先端のASRシステムを評価し、表現型TSモデルで生成された合成データを用いて制御された比較を行う。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:14:31 GMT)
Time-dependent adiabatic elimination in matter-wave optics [42.0] 特定の状態の部分集合のダイナミクスが、全量子状態のダイナミクスとどのように分離されるかを示す。
我々の形式主義はそのような環境で断続的な排除を可能にする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:58:57 GMT)
Local approach to entropy production in the nonequilibrium dynamics of open quantum systems [42.0] 開系における非平衡量子力学のエントロピー生成速度の局所表現の基本的特徴について論じる。
すべての可能な初期状態に対するエントロピー生成率の正の値は、量子マスター方程式の時間局所生成器の固有値の実部は常に負であることが示される。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:41:42 GMT)
Beyond the Resumé: A Rubric-Aware Automatic Interview System for Information Elicitation [41.9] 大規模言語モデル(LLM)は、各候補者から費用対効果の高い情報を引き出すために、主題の専門家の役割を担っている。
コード、公開ドメイン/匿名履歴の控えめなデータセット、信念の校正テスト、シミュレートされたインタビューをリリースします。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:00:10 GMT)
Uncertainty Quantification of Click and Conversion Estimates for the Autobidding [41.7] オートバイディングアルゴリズムは、事前トレーニングされた機械学習モデルによって提供されるClick-Through-Rate(CTR)とConversion-Rate(CVR)の推定に依存する。
提案手法は,生成したCTRとCVRを補正し,競売における入札の効率を向上する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:57:11 GMT)
Dual Distillation for Few-Shot Anomaly Detection [41.1] 異常検出はコンピュータビジョンにおいて重要な課題であり、医用画像に深く影響している。
D$2$4FADは,数発の異常検出のための新しい二重蒸留フレームワークである。
本手法は,少数の基準画像のみを用いて,未確認タスクにおける異常を同定する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:38:19 GMT)
Beyond the Grid: Layout-Informed Multi-Vector Retrieval with Parsed Visual Document Representations [40.0] ColParseは、ドキュメント解析モデルを利用して、レイアウトインフォームドされた小さなサブイメージの埋め込みを生成する新しいパラダイムである。
実験により,本手法はストレージ要求を95%以上削減し,同時に性能向上を図っている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:55:00 GMT)
SubstratumGraphEnv: Reinforcement Learning Environment (RLE) for Modeling System Attack Paths [39.8] 本稿では,Windowsオペレーティングシステム上で実行されるプロセスのシーケンスをシミュレートする強化学習環境生成フレームワークを提案する。
Sysmonログから親子プロセスをキャプチャしてモデル化するためのメカニズムが開発された。
この研究の中心的な貢献は、シーケンシャルなユーザイベントとシステムイベントの翻訳を自動化する新しいグラフィカルなRL環境の設計である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:48:24 GMT)
PreSight: Preoperative Outcome Prediction for Parkinson's Disease via Region-Prior Morphometry and Patient-Specific Weighting [39.4] PreSightは術前MRIと変形法に基づく形態計測とを融合した術前成績モデルである。
患者レベルの説明とともに、エンドツーエンド、キャリブレーション、意思決定対応の予測を生成する。
内部検証では88.89%、応答者分類では85.29%の精度が得られた。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:00:48 GMT)
ClinConsensus: A Consensus-Based Benchmark for Evaluating Chinese Medical LLMs across Difficulty Levels [39.3] 大規模言語モデル(LLM)は、病気の予防、臨床的意思決定、長期ケアにまたがる約束を示す健康管理にますます応用されている。
ClinConsensusは、臨床専門家がキュレートし、検証し、品質を制御した中国の医療ベンチマークである。
ClinConsensusは、予防と介入から長期フォローアップまで、ケアの全期間にわたる2500件のオープンエンドケースで構成されており、36の専門医、12の共通臨床タスクタイプ、そして徐々に複雑さのレベルが増大している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:17:18 GMT)
Temporal Representations for Exploration: Learning Complex Exploratory Behavior without Extrinsic Rewards [39.3] 本研究では,時間的コントラスト表現を利用して探索をガイドする探索手法を提案する。
このような表現は, 移動, 操作, 組込みAIタスクにおいて, 複雑な探索 x の学習を可能にすることを実証する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:55:27 GMT)
Beyond Length Scaling: Synergizing Breadth and Depth for Generative Reward Models [39.3] モジュール型合成パイプラインを通じて,B-CoTとD-CoTに生理性を再構成するフレームワークであるMix-GRMを紹介する。
実験によると、Mix-GRMは5つのベンチマークで新しい最先端のベンチマークを確立し、主要なオープンソースRMを平均8.2%上回っている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:54:29 GMT)
Rethinking Policy Diversity in Ensemble Policy Gradient in Large-Scale Reinforcement Learning [38.8] 政治間の多様性が政策アンサンブルの学習効率に与える影響を理論的に分析する。
我々は、政策間のKL制約を通じて多様性を規制する結合政策最適化を提案する。
この結果から, 適切な規制下での多様な探索が, 安定した, サンプル効率の学習に欠かせないことが示唆された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:06:40 GMT)
CHOP: Counterfactual Human Preference Labels Improve Obstacle Avoidance in Visuomotor Navigation Policies [38.6] ナビゲーションにおける安全性と障害物回避の人間の直感にバイスモータナビゲーションポリシーを整合させる新しいアプローチであるCHOPを紹介する。
CHOPは、人間の安全と障害物回避に対する人間の直感にバイスモータナビゲーションポリシーを合わせるために、対実的人間選好ラベルを使用する。
実験により、CHOPで微調整された視覚運動ナビゲーションポリシーは、近距離衝突イベントを49.7%減らし、人間に好まれる軌道からの偏差を45.0%減らし、平均的な障害物クリアランスを19.8%増すことが示された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:55:03 GMT)
MMR-Life: Piecing Together Real-life Scenes for Multimodal Multi-image Reasoning [37.9] 本稿では,MLLMのマルチモーダル・マルチモーダル推論能力を評価するためのベンチマークであるMMR-Lifeを紹介する。
MMR-Lifeは19,108の画像に基づいて2,646の多重選択質問で構成されている。
37の高度なモデルの評価は、MMR-Lifeによる重大な課題を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:06:23 GMT)
Optimization of Edge Directions and Weights for Mixed Guidance Graphs in Lifelong Multi-Agent Path Finding [37.5] 誘導グラフにおいて、エッジウェイトと方向の両方を最適化する2つの方法を提案する。
また、エッジ方向に関するトラフィックパターンをGGO手法に組み込んで、エッジ方向対応誘導グラフを生成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:47:08 GMT)
RubricBench: Aligning Model-Generated Rubrics with Human Standards [37.3] 逆モデル(Reward Model)は、単純な完了から、表面レベルのバイアスを軽減するために、複雑で高度な生成へと移行している。
既存のベンチマークには、差別的な複雑さと厳密な分析に必要な地味なアノテーションの両方が欠けている。
本稿では,ブルリック評価の信頼性を評価するために特別に設計された1,147対比較ベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:39:49 GMT)
Better Matching, Less Forgetting: A Quality-Guided Matcher for Transformer-based Incremental Object Detection [37.2] 永続的な課題は破滅的な忘れ事であり、主に従来の検出器の背景シフトに起因する。
我々は、DETRのようなアーキテクチャに特有な、新しい、独特な忘れの源を同定する:背景フォアグラウンド。
これはハンガリーのマッカーの徹底的な制約に起因し、全ての根拠的真理目標を1つの予測に強制的に割り当てる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:56:14 GMT)
Quantum Scattering of Fullerene 12C60 with Rare Gas Atoms and its selection rules for rotational quenching [37.2] 100Kの温度で40Ar原子の緩衝ガスと相互作用する12C60分子の摂動量子記述を示す。
衝突力学におけるイコサヘド対称性の役割が強調され、特異な選択規則が導かれる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:35:01 GMT)
UrbanFM: Scaling Urban Spatio-Temporal Foundation Models [37.0] 動的システムとしての都市システムは、人間の移動と都市の進化の基本的な法則を符号化した動的時間的データストリームを生成する。
AI for Scienceは、気象学のような分野における基礎モデルの変革的なパワーを目撃しているが、都市コンピューティングは「シナリオ固有の」モデルによって断片化されている。
我々は,大規模データからアーキテクチャを統一するために,限られた帰納バイアスで設計された最小限の自己注意型アーキテクチャであるUrbanFMを提案する。
実験により、UrbanFMは、大規模な都市時間基盤モデルに向けた第一歩として、都市とタスクをまたいだ顕著なゼロショットの一般化を実現していることが示された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:34:52 GMT)
Learning from Complexity: Exploring Dynamic Sample Pruning of Spatio-Temporal Training [37.0] 大規模な、しばしば冗長なデータセットでディープラーニングモデルをトレーニングすることは、重大な計算ボトルネックを示す。
本稿では,動的試料刈り込みによる複雑性から学習する新しい訓練手法について検討する。
また,ST-Pruneは,モデル性能の維持や改善を図りながら,トレーニング速度を著しく向上させることを示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:35:46 GMT)
Cavity-enhanced optical readout and control of nuclear spin qubits [36.9] 低温のFabry-Perot空洞に167-Erのドーパントをオルソシリケートに埋め込んだ。
周波数選択的発光増強により、単発読み出し忠実度は91(2)%となる。
原子スピン量子ビットと周波数多重アドレッシングと寿命制限光子放射の組み合わせにより、低損失電気通信Cバンドは167-Erを長距離光ファイバーベースの量子ネットワークの先導プラットフォームとして確立する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:40:25 GMT)
WorldStereo: Bridging Camera-Guided Video Generation and Scene Reconstruction via 3D Geometric Memories [36.8] WorldStereoは、カメラ誘導のビデオ生成と3D再構成を橋渡しする新しいフレームワークだ。
我々はWorldStereoが強力な世界モデルとして機能し,多種多様なシーン生成タスクと高忠実度3D結果に対処していることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:36:56 GMT)
"When to Hand Off, When to Work Together": Expanding Human-Agent Co-Creative Collaboration through Concurrent Interaction [36.7] 我々は協調意図を解釈し、リアルタイムで適応するCLEOを開発する。
6つの相互作用ループ、設計上の意味、注釈付きデータセットを持つ決定モデルを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:37:05 GMT)
Personalized Multi-Agent Average Reward TD-Learning via Joint Linear Approximation [36.7] エージェントの集合が異なる環境と相互作用する、パーソナライズされたマルチエージェント平均報酬TD学習について検討した。
共有線型表現が存在するような設定に焦点をあて、エージェントの最適重みは未知の線型部分空間にまとめて置かれる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:10:56 GMT)
WISER: Wider Search, Deeper Thinking, and Adaptive Fusion for Training-Free Zero-Shot Composed Image Retrieval [36.6] ZS-CIRは、マルチモーダルクエリがアノテートされたトリプレットをトレーニングすることなく、ターゲット画像を取得することを目的としている。
我々は,T2IとI2Iを"検索-検証-精細化"パイプラインを介して統合する,トレーニング不要のフレームワークであるWISERを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:20:04 GMT)
Sequence-Level Unsupervised Training in Speech Recognition: A Theoretical Study [36.1] 分類誤り境界に基づく教師なし音声認識のための理論的枠組みを開発する。
教師なし音声認識のための一段階列レベルのクロスエントロピー損失を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:09:17 GMT)
Neural Implicit Action Fields: From Discrete Waypoints to Continuous Functions for Vision-Language-Action Models [36.0] 本稿では,行動予測を離散的な視点から連続的な行動関数の回帰へ変換するパラダイムシフトを提案する。
提案手法は, CALVIN および LIBERO ベンチマークにおいて, 種々のバックボーンにまたがって, 最新の結果が得られる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:48:24 GMT)
Scaling Laws of SignSGD in Linear Regression: When Does It Outperform SGD? [35.8] 本稿では,PRO(Power-law random features)モデルを用いて,SingSGDのスケーリング法則について検討する。
本研究では,1パス符号SGDで訓練した線形モデルの集団リスクをガウス的特徴量に基づいて解析する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:58:02 GMT)
URAG: A Benchmark for Uncertainty Quantification in Retrieval-Augmented Large Language Models [35.4] URAGは、医療、プログラミング、科学、数学、一般的なテキストなど、さまざまな分野にわたるRAGシステムの不確実性を評価するために設計されたベンチマークである。
評価パイプラインを8つの標準RAG手法に適用し,LACとAPSの計測値に基づいて,精度と予測セットのサイズを両立させ,その性能を計測する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:22:06 GMT)
Multimodal Mixture-of-Experts with Retrieval Augmentation for Protein Active Site Identification [35.3] 本稿では,タンパク質活性部位同定のための最初の検索拡張フレームワークであるMultimodal Mixture-of-Experts with Retrieval Augmentation (MERA)を紹介する。
活性部位の予測ではAUPRCが90%,ペプチド結合部位の同定では有意な増加を示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:40:04 GMT)
Adversarial Query Synthesis via Bayesian Optimization [35.3] 本稿では,難解なベンチマーククエリを自動的に検索するベイズ最適化手法を提案する。
予備実験では,最適化ヘッドルームの2倍以上のクエリを生成できることを示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:50:46 GMT)
Efficient Test-Time Optimization for Depth Completion via Low-Rank Decoder Adaptation [35.2] 我々は,デコーダのみを適応させることが,効率的なテスト時間最適化に十分であることを示す。
本稿では,この低次元部分空間のみをスパース深度監視を用いて更新する軽量なテスト時間適応手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:45:19 GMT)
SeaVIS: Sound-Enhanced Association for Online Audio-Visual Instance Segmentation [35.1] SeaVISは、音声視覚のインスタンスセグメンテーション用に設計された最初のオンラインフレームワークである。
従来のVIS法における大きな課題は、外見に基づくインスタンスアソシエーションがオブジェクトの発音とサイレント状態の区別に失敗することである。
我々は、視覚的外観だけでなく、聴覚活動もエンコードするインスタンスプロトタイプを作成するために、オーディオガイド型コントラスト学習戦略を採用している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:22:48 GMT)
OpenAutoNLU: Open Source AutoML Library for NLU [35.0] OpenAutoNLUはオープンソースの自動機械学習ライブラリである。
テキスト分類と名前付きエンティティ認識の両方をカバーしている。
ライブラリはまた、統合データ品質診断も提供する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:56:54 GMT)
OnlineX: Unified Online 3D Reconstruction and Understanding with Active-to-Stable State Evolution [34.8] フィードフォワードフレームワークであるOnlineXを導入し、ストリーミング画像のみを用いて3次元の視覚的外観と言語フィールドをオンライン的に再構築する。
我々のフレームワークは、メモリ状態を専用のアクティブな状態と永続的な安定な状態に分離し、その後、前者からの情報を結合して後者に融合させ、忠実性と安定性の両方を達成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:52:02 GMT)
Subcubic Coin Tossing in Asynchrony without Setup [34.7] コイントスキング(英: coin tossing)とは、パーティーが予測不可能なランダムな値に合意しようとするタスクであり、ビザンチン党の影響により失敗する可能性がある。
我々は、大まかに言えば、強力だがコストがかかる一般的な硬貨を安価だが品質の低い硬貨に変えるための、適応的に安全な委員会ベースの方法を提案する。
我々は、$widetildeO(varepsilon-2kn3 - 2/k)$の通信で$widetildeO($widetildeO)の安いコインを得るために、$widetildeO(varepsilon-2kn3 - 2/k)$の強い(非常に稀に失敗する)コインをどのように使うかを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:58:44 GMT)
HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts [34.6] HarmonyCellは、単一セル摂動研究のためのエンドツーエンドのエージェントフレームワークである。
異なるメタデータを手動で介入することなく、標準的なインターフェースにマッピングする。
適応的なモンテカルロ木探索エンジンは階層的な作用空間上で動作し、分布シフトに対して最適な統計的帰納バイアスで合成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:48:40 GMT)
Meta-Learning Hyperparameters for Parameter Efficient Fine-Tuning [34.3] リモートセンシング(RS)画像上の微調整事前学習モデルは、簡単な解決策である。
既存の手法では、LoRAやAdaptFormerのようなパラメータ効率の細かいチューニング(PEFT)技術を採用している。
そこで我々は,モジュールの影響を動的に調整する適応スケーラを組み込んだMetaPEFTを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:38:18 GMT)
WiCompass: Oracle-driven Data Scaling for mmWave Human Pose Estimation [33.2] ミリ波ヒューマンポース推定はプライバシーを約束するが、流通シフト下での一般化に苦しむ。
我々は、カバレッジを意識したデータ収集フレームワークWiを紹介する。
実験では、Wiは一致した予算でのOOD精度を一貫して改善し、従来の収集戦略よりも優れたスケーリング挙動を示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:22:05 GMT)
DGNet: Discrete Green Networks for Data-Efficient Learning of Spatiotemporal PDEs [33.0] PtemporalDEのデータ効率向上のためのネットワークDGNetを提案する。
重ね合わせの原理をハイブリッドな物理-神経アーキテクチャに組み込むことで、データから物理的事前学習の負担を軽減する。
それは何万もの訓練軌跡しか使わず、常に最先端の精度を達成している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:40:27 GMT)
SimRecon: SimReady Compositional Scene Reconstruction from Real Videos [32.6] 構成シーンの再構築は、現実世界のビデオの全体像ではなく、オブジェクト中心の表現を作ろうとしている。
シムレコン(SimRecon)は「知覚生成シミュレーション」パイプラインを乱れたシーン再構成に向けて実現したフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:51:45 GMT)
AgentVista: Evaluating Multimodal Agents in Ultra-Challenging Realistic Visual Scenarios [32.6] 実世界のマルチモーダルエージェントは、視覚的証拠に根ざしたマルチステップを解決する。
既存のベンチマークは、主にシングルターンの視覚的推論または特定のツールスキルを評価する。
本稿では,汎用マルチモーダルエージェントのベンチマークであるAgentVistaを紹介する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:29:34 GMT)
ASTRA-bench: Evaluating Tool-Use Agent Reasoning and Action Planning with Personal User Context [32.3] 次世代AIは、膨大な個人データ、多様なツール、多段階推論を管理する必要がある。
AsTRA-benchは対話型ツールボックスと複雑なユーザインテントで時間進化する個人コンテキストを統一するベンチマークである。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:34:48 GMT)
Human or Machine? A Preliminary Turing Test for Speech-to-Speech Interaction [32.3] 我々はS2Sシステムの最初のチューリングテストを行い、9つの最先端S2Sシステムと28人の参加者の対話に関する2,968人の人的判断を収集した。
既存の評価されたS2Sシステムはテストに合格せず、人間の類似性に大きなギャップがあることが判明した。
我々は18の人間類似度次元の微粒な分類法を開発し、それに従って収集した対話をクラウドアノテートする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:18:24 GMT)
AgenticGEO: A Self-Evolving Agentic System for Generative Engine Optimization [32.1] AgenticGEOは、コンテンツ条件制御問題として最適化を定式化した自己進化型エージェントフレームワークである。
AgenticGEOは最先端のパフォーマンスを実現し、堅牢な転送可能性を示し、3つのデータセットで14のベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:13:13 GMT)
Sparse View Distractor-Free Gaussian Splatting [31.8] 3D Gaussian Splatting (3DGS) は静的環境における効率的なトレーニングと高速な新しいビューを実現する。
そこで本稿では,よりリッチな事前情報を組み込むことにより,スパースビュー条件下でのイントラクタフリーな3DGSを実現するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:32:32 GMT)
Learning from Synthetic Data Improves Multi-hop Reasoning [31.8] 強化学習(RL)は、数学、コーディング、マルチホップ推論タスクにおいて、大きな言語モデル(LLM)の推論能力を大幅に向上することが示されている。
本研究では,マルチホップ推論タスクのためのルール生成合成データのRLファインタニングについて検討する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:08:43 GMT)
Quantum-Inspired Fine-Tuning for Few-Shot AIGC Detection via Phase-Structured Reparameterization [31.5] 近年の研究では、量子ニューラルネットワーク(QNN)が数発のレシエーションでよく一般化されていることが示されている。
本稿では、軽量QNNをローランク適応(LoRA)アダプタに組み込む量子強化微細チューニング方式であるQ-LoRAを提案する。
数ショットのAIGC検出実験では、Q-LoRAとH-LoRAの両方が標準のLoRAを5%以上の精度で上回った。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:16:09 GMT)
BiMotion: B-spline Motion for Text-guided Dynamic 3D Character Generation [31.1] テキストガイドによる動的3Dキャラクタ生成は急速に進歩しているが、リッチなテキスト記述を忠実に反映した高品質なモーションを生成することは依然として困難である。
既存の手法では、固定長の時間入力と、リッチな動きのセマンティクスを捉えるのに失敗する離散的なフレームワイズ表現により、限られたサブアクションや非コヒーレントな動きを生成する傾向がある。
連続的な微分可能なB-スプライン曲線で動きを表現することでこれらの制約に対処し、基礎となる生成モデルの能力を変更することなくより効果的な動き生成を可能にする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:42:32 GMT)
Zero-shot Low-Field MRI Enhancement via Diffusion-Based Adaptive Contrast Transport [31.0] 低磁場(LF)磁気共鳴イメージング(MRI)は、診断イメージングへのアクセスを民主化する。
DACTは、ペアの監督なしにHF品質のイメージを復元する新しいゼロショットフレームワークである。
最先端のパフォーマンスを達成し、構造的細部と組織コントラストの整合性を向上する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:27:55 GMT)
BAWSeg: A UAV Multispectral Benchmark for Barley Weed Segmentation [31.0] そこで本研究では,2ストリーム分割ネットワークをネイティブ解像度で,放射能キューと正規化インデックスキューとを融合する。
植生インデックスとスペクトルアテンションは、植生インデックスマップの窓付き自己アテンションで動作する。
植生指数と分光アテンションは75.6%のmIoUと63.5%の雑草IoUを22.8Mパラメータで達成し、多スペクトルのSegFormer-B1ベースラインを1.2mIoUと1.9の雑草IoUで上回っている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:49:05 GMT)
(hu)Man vs. Machine: In the Future of Motorsport, can Autonomous Vehicles Compete? [31.0] 本稿では,人間とAVの合同競争にモータースポーツの将来が関与するかどうかを考察する。
システムレベルのレイテンシなどの重要な要因の最初の評価から、効果的な計画とリスク保証まで、混在するAIレースに関わる課題について検討する。
モータースポーツとAVのより広い文脈において、この研究は、モータースポーツの真の精神の中で、将来的な研究のための課題を「実現を後押しする」ために概説している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:36:11 GMT)
Process Over Outcome: Cultivating Forensic Reasoning for Generalizable Multimodal Manipulation Detection [30.8] 一般化可能な検出には、明示的な法医学的推論を組み込む必要があると我々は主張する。
本稿では、学習結果の適合からプロセスモデリングへ移行する推論駆動型フレームワークであるREFORMを提案する。
実験により、Reformはより優れた一般化を伴う新しい最先端性能を確立することが示された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:45:33 GMT)
PathMoE: Interpretable Multimodal Interaction Experts for Pediatric Brain Tumor Classification [30.6] PathMoEは、H&Eスライド、病理報告、核レベルセルグラフを統合する、解釈可能なマルチモーダルフレームワークである。
内科的脳腫瘍データセットと外部TGAデータセットの2つのデータセット固有の分類タスクについて,本フレームワークの評価を行った。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:17:44 GMT)
Efficient RLVR Training via Weighted Mutual Information Data Selection [30.4] 強化学習(RL)は、大規模言語モデルの推論とアライメントを改善する上で中心的な役割を果たす。
重み付けされた相互情報目的に基づいて,情報誘導型データSmplinG metHod for RL Trainingを紹介する。
予測された不確実性低減は相補的な難易度と証拠に依存した成分に分解され、難易度のみの選択の根本的な制限が明らかになる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:25:07 GMT)
FireRed-OCR Technical Report [30.0] 本稿では,汎用VLMを専門家を解析するピクセル精度構造文書に変換するフレームワークFireRed-OCRを紹介する。
高品質な構造化データの不足に対処するため,Geometry + Semantics's Data Factoryを構築した。
本稿では,画素レベルの認識から論理構造生成へモデルを導く三段階プログレッシブトレーニング戦略を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:19:23 GMT)
Towards Principled Dataset Distillation: A Spectral Distribution Perspective [30.0] 本稿では,カーネル関数のスペクトルを用いて分布アライメントを再構成する,MCSD(Class-Aware Spectral Distribution Matching)を提案する。
CIFAR-10-LTでは、クラス毎に10のイメージを持つCSDMは、最先端DD法よりも14.0%改善され、テールクラスの画像数が減少すると5.7%のパフォーマンス低下しか得られない。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:26:49 GMT)
PhotoBench: Beyond Visual Matching Towards Personalized Intent-Driven Photo Retrieval [29.9] PhotoBenchは、本物の個人用アルバムから構築された最初のベンチマークである。
パラダイムを視覚的マッチングから、パーソナライズされたマルチソースインテント駆動推論に移行するように設計されている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:02:40 GMT)
Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search [29.7] 我々は、勾配に基づく最適化を運用するMLEエージェントであるtextscGomeを紹介する。
textscGomeは、MLE-Bench上での最先端の35.1%の医療率を実現し、単一のV100 GPU上では12時間の予算が制限されている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:22:47 GMT)
High-Performance Quantum Frequency Conversion from Ultraviolet to Telecom Band [29.6] 量子周波数変換(QFC)は、静止量子ビットと低損失光通信チャネルのスペクトルギャップを埋めるのに不可欠である。
薄膜ニオブ酸リチウムの1次準位相マッチング周期3.07の短波長整合QFCを示す。
外部効率は28.8%、超低騒音は毎秒35回である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:15:33 GMT)
MixerCSeg: An Efficient Mixer Architecture for Crack Segmentation via Decoupled Mamba Attention [29.4] 特徴エンコーダは、微細なテクスチャや細い構造の表現を形作ることにより、ピクセルレベルのクラックセグメンテーションにおいて重要な役割を果たす。
既存のCNN-、Transformer-、Mambaベースのモデルはそれぞれ、必要な空間情報や構造情報の一部をキャプチャする。
このアーキテクチャでは、CNNのような経路が局所的なテクスチャに焦点を当て、Transformerスタイルの経路がグローバルな依存関係をキャプチャし、Mambaにインスパイアされたフローが単一のエンコーダ内のシーケンシャルコンテキストをモデル化する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:41:44 GMT)
QEDBENCH: Quantifying the Alignment Gap in Automated Evaluation of University-Level Mathematical Proofs [29.3] 我々は, 標準の「LLM-as-a-Judge」プロトコルが, 上学部から初期大学院レベルの数学に適用された場合, 体系的なアライメントギャップに悩まされることを実証した。
QEDBenchは、大学レベルの数学における人間の専門家とのアライメントを測定するための、最初の大規模デュアルルーブリックアライメントベンチマークである。
我々は,Claude Opus 4.5,DeepSeek-V3,Qwen 2.5 Max,Llama 4 Maverickなどのフロンティア評価が有意な正のバイアスを示すことを明らかにした。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:55:58 GMT)
CARE: Towards Clinical Accountability in Multi-Modal Medical Reasoning with an Evidence-Grounded Agentic Framework [29.2] マルチモーダル・メディカル・推論における,エビデンス・グラウンドド・エージェント・フレームワークによる臨床説明可能性の向上について紹介する。
CAREはタスクを調整されたサブモジュールに分解し、ショートカット学習と幻覚を減らす。
私たちのCARE-Flowは、同じサイズ(10B)のSOTA(State-of-the-art)よりも平均精度を10.9%向上させる
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:38:37 GMT)
RA-Det: Towards Universal Detection of AI-Generated Images via Robustness Asymmetry [29.1] 最近の画像生成装置は、下流認識システムの信頼性を損なうフォトリアリスティックなコンテンツを生成する。
視覚的な外観の手がかりがより顕著になるにつれて、法医学的な手がかりやハイレベルな表現に依存する外観駆動型検出器は安定性を損なう。
これは外観から行動へのシフトを動機付け、画像がどのように見えるかではなく、制御された摂動にどう反応するかに焦点を当てる。
本稿ではロバストネス非対称性検出(RA-Det)という,ロバストネス非対称性を信頼性の高い決定信号に変換する行動駆動検出フレームワークを紹介する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:15:37 GMT)
Harmonizing Dense and Sparse Signals in Multi-turn RL: Dual-Horizon Credit Assignment for Industrial Sales Agents [29.1] 時間スケールで最適化を阻害するフレームワークを提案する。
高忠実度ユーザシミュレータによる実験では、DuCAは最先端のGRPOベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:44:50 GMT)
Revealing Combinatorial Reasoning of GNNs via Graph Concept Bottleneck Layer [28.9] 我々は,任意のGNNアーキテクチャに統合可能なグラフ概念層を開発する。
予測された概念スコアは、選択された識別層によってクラスラベルに投影される。
グラフの概念に対してソフト論理則を適合させるため、GNNの予測のスパース推論を強制する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:07:24 GMT)
Recursive Models for Long-Horizon Reasoning [28.8] 分離された文脈でサブタスクを解くためにモデルが自身を呼び出すことができることを示す。
フレームワークを任意のコンテキスト処理と制御フローを備えた現代的なエージェントシステムに一般化する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:37:10 GMT)
CTForensics: A Comprehensive Dataset and Method for AI-Generated CT Image Detection [28.8] 我々はCTフォージェリ検出手法の一般化能力を評価するためのデータセットであるCTForensicsを提案する。
ESF-CTFDは,ウェーブレット,空間,周波数領域にまたがる偽の手がかりを捕捉する,効率的なCNNベースのニューラルネットワークである。
実験により、ESF-CTFDは既存の手法より一貫して優れており、異なるCT生成モデルに対して優れた一般化を示すことが示された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:58:28 GMT)
Never Saddle for Reparameterized Steepest Descent as Mirror Flow [28.5] 我々は、統一理論の枠組みとして、最も急なミラーフローを導入する。
このフレームワークは、最適化幾何が学習力学、暗黙のバイアス、疎さをいかに支配するかを明らかにする。
より急降下がサドルポイントエスケープと特徴学習の両方を促進することを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:52:05 GMT)
Organizing, Orchestrating, and Benchmarking Agent Skills at Ecosystem Scale [28.4] AgentSkillOSは、スキル選択、オーケストレーション、エコシステムレベルの管理のための原則化されたフレームワークである。
AgentSkillOSには2つのステージがある。 (i) スキルを機能ツリーに整理する管理スキル。
(ii) DAGベースのパイプラインを通じて複数のスキルを検索し、オーケストレーションし、実行するタスクの解決。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:46:47 GMT)
State-Action Inpainting Diffuser for Continuous Control with Delay [28.1] State-Action Inpainting Diffuser (SAID)は、動的学習の帰納バイアスと政策最適化の直接的な意思決定能力を統合するフレームワークである。
本研究は,遅延を伴う継続的制御と強化学習の分野を前進させる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:28:27 GMT)
The Expressive Limits of Diagonal SSMs for State-Tracking [28.1] 逐次状態追跡タスクにおける入力値の複素依存対角(DCD)SSMの表現性について検討する。
単層DCD SSMは有限精度で任意の非アベリア群の状態追跡を表現できないことを示す。
より一般に、$k$層DCD SSM が群の状態追跡を表現することは、その群が長さ$k$のサブ正規直列を持つ場合に限る。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:08:14 GMT)
IDProxy: Cold-Start CTR Prediction for Ads and Recommendation at Xiaohongshu with Multimodal LLMs [28.0] IDproxyはリッチコンテンツ信号からプロキシ埋め込みを生成し、使用データなしで新しいアイテムを予測する。
これはXiaohongshuのExplore FeedのContent FeedとDisplay Adsの両機能で成功し、毎日数億人のユーザーに配信されている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:16:49 GMT)
Align and Filter: Improving Performance in Asynchronous On-Policy RL [28.0] 分散学習と高頻度更新によるポリシラグの発生源を同定する。
本稿では,政策ラグを軽減するための実践的アプローチとして,テクスト変動に基づく制約付きポリシー最適化を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:52:34 GMT)
According to Me: Long-Term Personalized Referential Memory QA [27.4] ATM-Benchはマルチモーダル、マルチソースパーソナライズされた参照メモリQAのための最初のベンチマークである。
ガイドメモリ(SGM)は、異なるソースから派生したメモリアイテムを構造的に表現する。
ATM-Bench-Hardセットでは性能が(20%の精度で)低いことが分かりました。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:42:29 GMT)
ALTER: Asymmetric LoRA for Token-Entropy-Guided Unlearning of LLMs [27.1] 大規模言語モデル(LLM)は、様々な領域にわたる広範な知識を網羅するために進歩してきた。
我々は,LLMのための軽量なアンラーニングフレームワークであるALTERを紹介し,知識の絡み合いと非ラーニング効率の両面での課題に対処する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:21:16 GMT)
Real Money, Fake Models: Deceptive Model Claims in Shadow APIs [26.9] サードパーティサービスは、間接アクセスによる地域制限なしに、公式のモデルサービスへのアクセスを提供すると主張している。
広く使われているにもかかわらず、シャドウAPIが公式APIと一貫性のあるアウトプットを提供するかどうかは不明だ。
これらのプラクティスは、科学的研究の妥当性を損なうとともに、シャドウAPI利用者の利益を損なうとともに、公式なモデル提供者の評判を損なう。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:33:05 GMT)
Learning to Read Where to Look: Disease-Aware Vision-Language Pretraining for 3D CT [26.7] 1つの病院で収集した 98k レポートボリューム対 (50k 患者) の 3 次元CT 画像言語モデルを訓練した。
CT-RATEでは,最先端のテキスト画像検索と競合疾患分類を実現している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:10:17 GMT)
Dehallu3D: Hallucination-Mitigated 3D Generation from Single Image via Cyclic View Consistency Refinement [26.5] 大規模な3D再構成モデルも幻覚に悩まされ、入力データから逸脱する構造的なアウトリーチが導入された。
本稿では,3次元メッシュ生成のためのDehallu3Dを提案する。
Dehallu3Dは、幻覚した外れ値を取り除き、構造的詳細を効果的に保存し、高忠実度3D生成を実現する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:29:51 GMT)
MAC: A Conversion Rate Prediction Benchmark Featuring Labels Under Multiple Attribution Mechanisms [26.4] マルチアトリビューション学習(MAL)は、複数のアトリビューション機構によって得られる変換ラベルから学習することで、モデル性能を向上させる。
マルチ属性ベンチマーク(MAC)は,複数の属性機構のラベルを特徴とする最初の公開CVRデータセットである。
PyMALも開発しています。PyMALはオープンソースのライブラリで、幅広いベースラインメソッドをカバーしています。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:51:01 GMT)
FT-Dojo: Towards Autonomous LLM Fine-Tuning with Language Agents [25.6] FT-Dojoは5つのドメインにわたる13のタスクからなる対話型環境である。
我々は、評価駆動フィードバックを活用することで、人間の専門家を模倣する自律システムFT-Agentを開発した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:37:11 GMT)
Accelerating PDE Surrogates via RL-Guided Mesh Optimization [25.6] RLMeshは、限られたシミュレーション予算の下で効率的な代理訓練のためのエンドツーエンドフレームワークである。
軽量プロキシモデルは、完全なサロゲート再トレーニングなしで効率的な報酬推定を提供することで、RLトレーニングをさらに加速する。
PDEベンチマークの実験では、RLMeshはベースラインと競合する精度を達成できるが、シミュレーションクエリは大幅に少ない。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:55:08 GMT)
GenDB: The Next Generation of Query Processing -- Synthesized, Not Engineered [25.4] 大規模言語モデル(LLM)は、次世代のクエリ処理システムを形成し始めている。
我々は、インスタンス最適化およびカスタマイズされたクエリ実行コードを生成するLLMベースのエージェントシステムであるGenDBを提案する。
我々はGenDBとDuckDB、Umbra、MonetDB、ClickHouse、TPCといった最先端のクエリエンジンを比較します。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:03:43 GMT)
PromptStereo: Zero-Shot Stereo Matching via Structure and Motion Prompts [25.2] 本稿では,単分子深度基礎モデルのデコーダをベースとした新しい反復改良モジュール Prompt Recurrent Unit (PRU) を提案する。
モノクラー構造とステレオモーションキューをデコーダに組み込むことで、PRUはモノクラー深度基礎モデルの潜在表現を絶対的なステレオスケール情報で強化する。
実験の結果,PromptStereoは複数のデータセットにまたがる最先端のゼロショット一般化性能を達成できた。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:30:32 GMT)
Unifying Language-Action Understanding and Generation for Autonomous Driving [25.2] VLA(Vision-Language-Action)モデルは、エンドツーエンドの自動運転において有望なパラダイムとして浮上している。
既存の手法には、言語命令とアクションアウトプットの永続的なミスアライメントと、典型的な自己回帰行動生成の非効率性という2つの重要な制限がある。
LinkVLAは、これらの課題に直接対処し、アライメントと効率の両方を強化する新しいアーキテクチャです。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:41:10 GMT)
Radiometrically Consistent Gaussian Surfels for Inverse Rendering [25.0] ガウススプラッティングによる逆レンダリングは急速に進歩しているが、材料特性を正確に切り離すことは大きな課題である。
我々は、観測されていない視点に対する監視を提供する、新しい物理ベースの制約である、放射能の一貫性を導入する。
次に、我々の原理に基づいて構築された逆レンダリングフレームワークであるRadioGSを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:00:54 GMT)
Adam Converges Without Any Modification On Update Rules [24.9] Adam氏は、大規模言語モデル(LLM)を含むニューラルネットワークをトレーニングするためのデフォルトのアルゴリズムである。
citetreddi 2019コンバージェンスは、Adam氏が多様化し、AIモデルトレーニングへの展開に対する懸念を提起した例である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:08:51 GMT)
Instrumental and Proximal Causal Inference with Gaussian Processes [24.8] 本研究では不確実性を考慮した因果学習のための枠組みを提案する。
我々の定式化は、一般的なカーネル推定器を後方平均として回収し、予測精度を保証します。
実証的な結果は、情報的なEU定量化とともに、強い予測性能を示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:23:26 GMT)
Video TokenCom: Textual Intent-Guided Multi-Rate Video Token Communications with UEP-Based Adaptive Source-Channel Coding [24.2] Token Communication(TokenCom)は、大規模AIモデル(LAM)とマルチモーダル大規模言語モデル(MLLM)の成功に動機付けられた、新しいパラダイムである。
本稿では,テキスト指向型マルチレートビデオ通信のための新しいVideo TokenComフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 23:36:38 GMT)
LLM-assisted Semantic Option Discovery for Facilitating Adaptive Deep Reinforcement Learning [23.9] 深層強化学習(Dep Reinforcement Learning, DRL)は、まだ実用上重要な問題に悩まされている。
最近の研究では、これらの課題に対処するために、LLM(Large Language Models)とシンボリックプランニングを統合することが期待されている。
セマンティック駆動のスキル再利用とリアルタイム制約モニタリングを可能にする,新しいLCM駆動クローズドループフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:54:02 GMT)
Extracting Training Dialogue Data from Large Language Model based Task Bots [23.9] タスク指向対話システム(TODS)を強化するために,大規模言語モデル(LLM)が広く採用されている。
LLMは、豊富な訓練データをリッチな知識表現に圧縮するソフトナレッジベースとして機能する。
LLMは、電話番号などの識別可能な情報を含む訓練対話データを不注意に記憶することができる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:25:04 GMT)
DualSentinel: A Lightweight Framework for Detecting Targeted Attacks in Black-box LLM via Dual Entropy Lull Pattern [23.8] 軽量で統一された防衛フレームワークであるDualSentinelを紹介する。
大規模言語モデル生成プロセスと共にターゲット攻撃のアクティベートを正確かつ迅速に検出することができる。
それは非常に効果的(ほぼゼロの偽陽性による事前検出精度)で、非常に効率的(無視できる追加コスト)である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:02:47 GMT)
ATA: Bridging Implicit Reasoning with Attention-Guided and Action-Guided Inference for Vision-Language Action Models [23.7] VLA(Vision-Language-Action)モデルは、アクションとタスクの完了を予測するために、イメージ、言語命令、ロボット状態を含む現在の観察に依存している。
本稿では,VLA推論に暗黙的推論を導入する学習自由フレームワークATAを提案する。
ATAはVLAモデルのためのプラグアンドプレイの暗黙の推論アプローチであり、軽量だが効果的である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:56:03 GMT)
Explanation-Guided Adversarial Training for Robust and Interpretable Models [23.6] 本稿では,予測性能,ロバスト性,説明品質を向上させるために,EGAT(Explaination-Guided Adversarial Training)を提案する。
EGATは、モデルに説明に基づく制約を課しながら、その場で敵の例を生成する。
EGATは、クリーンな精度と敵対的な精度+37%で競争ベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:52:52 GMT)
AdaPonderLM: Gated Pondering Language Models with Token-Wise Adaptive Depth [23.4] AdaPonderLMは、事前トレーニング中にトークン単位の早期終了を学習する、自己教師型リカレント言語モデルである。
AdaPonderLMは、比較可能な言語モデリングの難易度と競合する下流の精度を維持しながら、推論計算を約10%削減する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:28:16 GMT)
Understanding the Physics of Key-Value Cache Compression for LLMs through Attention Dynamics [23.0] トークンレベルのルーティングの制御摂動として,KV圧縮を物理に着想を得た視点を提案する。
適度な圧縮は、内部表現をほとんど精度の低下なく劣化させ、冗長性を明らかにする。
トークンサバイバルにもかかわらず、過度なヘッドレベルのコンセンサスによってルーティングの柔軟性が崩壊する表現剛性を特定する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:16:36 GMT)
Deepfake Forensics Adapter: A Dual-Stream Network for Generalizable Deepfake Detection [22.9] Deepfake Forensics Adapter (DFA)は、視覚言語の基礎モデルをターゲットの法医学分析と相乗化する新しいデュアルストリームフレームワークである。
提案手法では,事前学習したCLIPモデルと3つのコアコンポーネントを統合して,ディープフェイク検出を実現する。
我々のフレームワークは、最先端の性能を実証するだけでなく、堅牢なディープフェイク検出システムを開発するための実用的で効果的な方向を指摘する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:58:00 GMT)
CLEAR: Null-Space Projection for Cross-Modal De-Redundancy in Multimodal Recommendation [22.7] マルチモーダルレコメンデーションは、異種コンテンツモダリティを取り入れた協調フィルタリングの効果的なパラダイムとして登場した。
マルチモーダルレコメンデーションのためのクロスモーダルデ冗長手法であるCLEARを提案する。
CLEARは、モダリティ固有の情報を保持しながら冗長なクロスモーダル成分を抑えることで、表現空間を再設定する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:06:56 GMT)
PonderLM-3: Adaptive Token-Wise Pondering with Differentiable Masking [21.6] PonderLM-3はトークンワイド・アダプティブ・マイニングのための事前訓練フレームワークである。
純粋に自己管理された目的の下で、追加の計算を選択的に割り当てることを学ぶ。
これは、同じ推測FLOPでより低い事前学習パープレキシティを実現する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:05:02 GMT)
LaST-VLA: Thinking in Latent Spatio-Temporal Space for Vision-Language-Action in Autonomous Driving [21.4] VLA(Vision-Language-Action)モデルは、認識と計画の統合によって自動運転に革命をもたらした。
明示的なテキスト・オブ・ワット(CoT)への依存は、意味的・知覚的疎結合と知覚的・象徴的対立につながる。
潜在的推論への最近のシフトは、連続的な隠れ空間で考えることによって、これらのボトルネックを回避しようとする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:42:36 GMT)
SJD-PV: Speculative Jacobi Decoding with Phrase Verification for Autoregressive Image Generation [20.8] 自己回帰(AR)画像モデルは、最近顕著な生成能力を示したが、そのシーケンシャルな性質は大きな推論遅延をもたらす。
フレーズレベルの投機的検証を行う新しい学習自由加速フレームワークを提案する。
提案手法は,視覚的忠実度を損なうことなく,最大30%高速な復号化を実現する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:09:15 GMT)
From Secure Agentic AI to Secure Agentic Web: Challenges, Threats, and Future Directions [20.7] Secure Agentic AIからSecure Agentic Webへの移行指向のビューを提供する。
まず、素早い乱用、環境注入、メモリ攻撃、ツールチェーン乱用、モデル改ざん、エージェントネットワーク攻撃を含むコンポーネント対応の脅威分類を要約する。
次に、迅速なハードニング、安全に配慮したデコーディング、ツールとAPIの特権制御、ランタイム監視、継続的リチーム化、プロトコルレベルのセキュリティメカニズムなど、防衛戦略をレビューします。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:44:18 GMT)
3BASiL: An Algorithmic Framework for Sparse plus Low-Rank Compression of LLMs [20.3] 3BASiL-TMは大規模言語モデルの分解に$(mathbfS + mathbfLR)$の効率的なワンショットポストトレーニング手法である。
実験の結果, 3BASiL-TM は LLaMA-8B モデルに対して WikiText2 のパープレキシティギャップを (2:4 Sparse + 64 LR) 構成で30% 以上低減することがわかった。
提案手法は,SOTA $(mathbfS + mathbfLR)と比較してA100 GPU上で2.5倍高速な圧縮実行を実現する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:16:46 GMT)
Cross-modal Identity Mapping: Minimizing Information Loss in Modality Conversion via Reinforcement Learning [20.3] LVLM(Large Vision-Language Models)は、しばしば生成された画像キャプションにおける重要な視覚的内容の省略または誤表現を行う。
このような情報損失を最小限に抑えることで、LVLMは正確な記述を生成するために画像の詳細に集中せざるを得なくなる。
追加アノテーションを必要とせずに画像キャプションを強化する強化学習フレームワークであるクロスモーダルアイデンティティマッピング(CIM)を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:24:41 GMT)
Boosting AI Reliability with an FSM-Driven Streaming Inference Pipeline: An Industrial Case [20.2] 本稿では,監視ビデオから掘削作業を自動的にカウントする産業用AIアプリケーションについて述べる。
このアプローチでは、オブジェクト検出モデルとFSM(Finite State Machine)を統合し、運用シナリオの知識を符号化して、ストリーミングデータ上のAIの予測をガイドし、修正する。
12のサイトビデオから7000枚以上の画像からなる実世界のデータセットを実験した結果,本手法は元の手法に比べて優れた性能とロバスト性を示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:58:57 GMT)
Securing the Floor and Raising the Ceiling: A Merging-based Paradigm for Multi-modal Search Agents [20.1] 本稿では,自律的な探索機能を備えた視覚言語モデルを実現するための訓練自由パラダイムを提案する。
テキストベースの検索エージェントをベースVLMに融合させることで,追加のマルチモーダルトレーニングデータなしで効率的にマルチモーダル検索機能を構成することができることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:43:31 GMT)
HAMMER: Harnessing MLLM via Cross-Modal Integration for Intention-Driven 3D Affordance Grounding [20.1] 人間は通常、画像やビデオにおける観察された相互作用を通して3Dオブジェクトの空白を識別し、一度形成すれば、そのような知識を新しいオブジェクトに一般化することができる。
この原理に着想を得て,対話駆動型3D測位のためのMLLM(Multimodal large language model)を活用した新しいフレームワーク,すなわちHAMMERを提唱する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:00:37 GMT)
OmniZip: Learning a Unified and Lightweight Lossless Compressor for Multi-Modal Data [20.1] ロスレス圧縮は効率的なデータストレージと伝送に不可欠である。
マルチモーダルデータのための統一軽量圧縮機である textbf OmniZip を提案する。
軽量なバックボーン上に構築されたOmniZipには,3つの重要なコンポーネントが組み込まれ,効率的なマルチモーダル圧縮を実現している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:21:30 GMT)
Probabilistic Retrofitting of Learned Simulators [20.1] 我々は、事前学習された決定論的モデルを、適切なスコアリングルールであるCRPS(Continuous Ranked Probability Score)を用いて、確率論的モデルに変換する。
単一力学系で訓練したモデルでは, CRPSのロールアウトを20~54%削減し, 計算整合決定論的微調整と比較して分散正規化RMSE(VRMSE)を最大30%改善する。
我々はさらに、複数のシステムで訓練され、関心のデータセットに適合したPDE基盤モデルに対するアプローチを検証し、我々の確率的適応によってCRPSの最大40%、VRMSEの最大15%の改善が得られることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:01:02 GMT)
Rich Insights from Cheap Signals: Efficient Evaluations via Tensor Factorization [19.6] 我々は、安価なオートラッターデータと限定されたヒトゴールドスタンダードラベルを融合する新しい統計モデルを提案する。
具体的には、オートラッタースコアを用いてプロンプトと生成モデルの潜在表現を事前学習する。
このサンプル効率の手法は、オートラッター品質に対して堅牢であり、標準基準よりも、プロンプト毎の人間の嗜好をより正確に予測する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:12:46 GMT)
Bridging the Reproducibility Divide: Open Source Software's Role in Standardizing Healthcare AI [19.5] AI4Hの論文の74%は、依然としてプライベートデータセットに依存しているか、コードを共有していない。
不整合で文書化されていないデータ前処理パイプラインは、可変モデルのパフォーマンスレポートをもたらす。
コミュニティはオープンサイエンスの実践を促進し、データ前処理の標準化されたガイドラインを確立し、堅牢なベンチマークを開発する必要がある。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:09:23 GMT)
Fed-GAME: Personalized Federated Learning with Graph Attention Mixture-of-Experts For Time-Series Forecasting [19.3] Fed-GAMEは、パーソナライズされたアグリゲーションを、学習可能な動的暗黙グラフ上のメッセージパッシングとしてモデル化するフレームワークである。
1) コンセンサスのためのグローバルモデル更新に使用される平均的な差分(2) より詳細なパーソナライズのためのグラフ注意混合(GAME)アグリゲータに入力される選択的な差分(2) に分解される。
2つの実世界の電気自動車充電データセットの実験では、Fed-GAMEは最先端のパーソナライズされたFLベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:43:06 GMT)
RealRoute: Dynamic Query Routing System via Retrieve-then-Verify Paradigm [19.2] 予測ルーティングからロバストなRetrieve-then-VerifyメカニズムへパラダイムをシフトするフレームワークであるRealRouteを紹介する。
実験により、RealRouteはマルチホップRag推論タスクにおいて予測ベースラインを大幅に上回ることがわかった。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:57:46 GMT)
TraceGuard: Process-Guided Firewall against Reasoning Backdoors in Large Language Models [19.1] 我々は,小規模モデルを堅牢な推論ファイアウォールに変換するプロセス誘導型セキュリティフレームワークであるTraceGuardを提案する。
提案手法は,推理トレースを信頼できないペイロードとして扱い,詳細な防衛戦略を確立する。
グレーボックス設定における適応的敵に対する堅牢性を実証し、TraceGuardを実用的で低レイテンシなセキュリティプリミティブとして確立する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:19:13 GMT)
MIST-RL: Mutation-based Incremental Suite Testing via Reinforcement Learning [19.1] MIST-RL (Mutation-based Incremental Suite Testing via Reinforcement Learning) は、"スケーリング・バイ・ユーティリティ(scaling-by-utility)"に重点を移すフレームワークである。
我々は,機能的に等価なアサーションを抑えながら,新たな欠陥を発見するモデルにインセンティブを与える,動的ペナルティと組み合わされた新たなインクリメンタル突然変異報酬を導入する。
HumanEval+とMBPP+の実験は、MIST-RLが最先端のベースラインより優れていることを示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:22:44 GMT)
PleaSQLarify: Visual Pragmatic Repair for Natural Language Database Querying [19.0] 我々は、解釈可能な決定変数に関する相互作用を構造化することにより、実用的修復を運用するtextscPleaarifyを提案する。
TextscPleaarifyは、12人の参加者を対象にした研究で、ユーザーが代替の解釈を認識し、曖昧さを効果的に解決する手助けをした。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:24:29 GMT)
GeoDiT: Point-Conditioned Diffusion Transformer for Satellite Image Synthesis [18.8] 我々は,テキストから衛星画像生成のための拡散変換器であるGeoDiTを紹介した。
実験により,GeoDiTは最先端のリモートセンシング生成モデルを超え,優れた生成性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:42:15 GMT)
PhysFormer: A Physics-Embedded Generative Model for Physically Self-Consistent Spectral Synthesis [18.5] PhysFormerは生成モデリングフレームワークで、データレベルと物理レベルの両方で自己整合性がある。
ネットワーク内に放射束生成の物理過程を埋め込んで、生成されたスペクトルの物理的整合性を保証する。
より広範に、このアプローチは物理過程を外部損失関数から生成機構自体にシフトさせる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:17:41 GMT)
NeuroSymb-MRG: Differentiable Abductive Reasoning with Active Uncertainty Minimization for Radiology Report Generation [17.9] NeuroSymb-MRGは,NeuroSymbolic abductive reasoningと能動的不確実性最小化を統合し,構造的,臨床的根拠のある報告を生成する統合フレームワークである。
このシステムは、画像の特徴を確率論的臨床概念にマッピングし、異なる論理ベースの推論チェーンを構成し、それらのチェーンをテンプレート付き節にデコードし、検索と制約付き言語モデル編集を通じてテキスト出力を洗練する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:31:30 GMT)
FusionCast: Enhancing Precipitation Nowcasting with Asymmetric Cross-Modal Fusion and Future Radar Priors [17.8] 本稿ではFusionCastと呼ばれる新しい降水量最適化フレームワークを提案する。
これは、地球航法衛星システム(GNSS)インバージョンから得られた歴史的沈降水蒸気(PWV)データ、歴史的レーダに基づく定量的降水量推定(QPE)の3種類のデータを含んでいる。
実験の結果,FusionCastは nowcasting 性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:41:38 GMT)
Toward Graph-Tokenizing Large Language Models with Reconstructive Graph Instruction Tuning [17.7] 大きな言語モデル(LLM)がグラフをよりよく理解できるように、グラフデータを言語空間と整合させることが課題である。
GTokenLLMは複雑な構造と長いテキストをグラフトークンシーケンスにエンコードし、言語命令のチューニングを通じてテキストトークンと整列する。
最初の成功にもかかわらず、我々の情報理論分析により、既存のGTokenLLMは言語命令からのテキスト管理のみに依存していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:26:54 GMT)
Training Dynamics of Softmax Self-Attention: Fast Global Convergence via Preconditioning [17.7] 線形回帰を訓練したソフトマックス自己アテンション層における勾配降下のダイナミクスを訓練する。
簡単な一階勾配勾配勾配は、大域的に最適な自己注意パラメータに収束できることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:44:54 GMT)
DARS: Dysarthria-Aware Rhythm-Style Synthesis for ASR Enhancement [17.6] そこで我々は,Matcha-TTS アーキテクチャをベースとした調律対応リズムスタイル合成フレームワーク DARS を提案する。
DARSは多段階のリズム予測器を、通常音声と変形音声のコントラスト的嗜好に最適化し、また、変形性スタイルの条件整合機構を組み込んでいる。
TORGOデータセットの実験では、DARSが4.29の平均ケプストラム歪み(MCD)を達成し、実際の変形音声を密接に近似している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:05:14 GMT)
CoVe: Training Interactive Tool-Use Agents via Constraint-Guided Verification [17.6] textbfCoVe(textbfConstraint-textbfVerification)は、対話型ツール使用エージェントのトレーニング用に設計されたトレーニング後のデータ合成フレームワークである。
それらは、複雑な軌跡の生成をガイドし、軌道品質を評価するための決定論的検証器として機能する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:56:35 GMT)
Jailbreaking Embodied LLMs via Action-level Manipulation [17.5] Embodied Large Language Models (LLM) は、AIエージェントが自然言語の指示やアクションを通じて物理世界と対話することを可能にする。
Blindfoldは,実世界のアクションコンテキストにおいて,LLMを組み込んだ限られた因果推論機能を活用する自動攻撃フレームワークである。
BlindfoldはSOTAベースラインよりも最大53%高い攻撃成功率を達成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:34:49 GMT)
Adaptive Estimation and Inference in Conditional Moment Models via the Discrepancy Principle [17.4] 条件付きモーメント制約によって定義される線形逆問題における適応的推定と推論について検討する。
正規化DeepIV (RDIV) のような既存の正規化推定器は、ニュアンス関数の滑らかさに関する事前知識を必要とする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:23:20 GMT)
Efficient Learning Algorithms for Noisy Quantum State and Process Tomography [17.4] 雑音の多い$n$-qubit量子回路に対して,確率的かつ構造に依存しない学習フレームワークを導入する。
結果として、大規模ノイズ量子デバイスを特徴付けるためのスケーラブルで実用的な経路が提供される。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:50:59 GMT)
SEED-SET: Scalable Evolving Experimental Design for System-level Ethical Testing [17.3] SEED-SETは、ドメイン固有の客観的評価と利害関係者による主観的価値判断を含む実験的な設計フレームワークである。
自律エージェントの倫理的ベンチマークのためのアプローチを2つのアプリケーションで検証し、ベストを尽くす方法を見つける。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:06:28 GMT)
Resolving Blind Inverse Problems under Dynamic Range Compression via Structured Forward Operator Modeling [17.3] 未知のフォワードモデルをパラメータ化するために、textbfcascaded monotonic Bernstein (CaMB)演算子を導入する。
CaMBはハードアーキテクチャの帰納バイアスとして単調性を適用し、物理的に一貫した写像に最適化を制約する。
CaMB-Diffは,信号の忠実度と物理的整合性の両方の観点から,最先端のゼロショットベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:09:54 GMT)
Characterizing Memorization in Diffusion Language Models: Generalized Extraction and Sampling Effects [17.2] 拡散言語モデル (DLMs) は自己回帰言語モデル (ARMs) の代替として登場した。
DLMは、ARMと比較して、個人識別情報(PII)の記憶に基づくリークが著しく低い。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:03:32 GMT)
MVR: Multi-view Video Reward Shaping for Reinforcement Learning [17.2] MVR(Multi-View Video Reward Shaping)は、複数の視点から撮影したビデオを用いて、対象タスクに関する状態の関連性をモデル化するフレームワークである。
MVRは、画像ベースの手法に固有の特定の静的ポーズに対するバイアスを軽減する状態関連関数を学習する。
タスク固有の報酬とVLMに基づくガイダンスを統合した状態依存報酬形成形式を導入する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:24:04 GMT)
Reservoir Subspace Injection for Online ICA under Top-n Whitening [16.8] 貯留層拡大は非線形混合下でのオンライン独立成分分析(ICA)を改善することができる。
我々はこのボトルネックをEmphreservoir subspace Injection (RSI)として定式化する。
パススルー保存により、RE-OICAは非線形混合下でバニラオンラインICAを$+1.7$,dBで改善する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:49:02 GMT)
D3LM: A Discrete DNA Diffusion Language Model for Bidirectional DNA Understanding and Generation [16.8] D3LM(textbfDiscrete textbfDNA textbfDiffusion textbfLanguage textbfModel)は、マスク拡散による双方向表現学習とDNA生成を実現する。
D3LMはNucleotide Transformer (NT) v2アーキテクチャを直接採用しているが、訓練対象を離散DNA空間におけるマスク拡散として再構成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:05:21 GMT)
GAM-RAG: Gain-Adaptive Memory for Evolving Retrieval in Retrieval-Augmented Generation [16.7] Retrieval-Augmented Generation (RAG) は、大規模な言語モデルに外部の証拠を付けているが、多くの実装では、構築後も静的なインデックスに依存している。
認知神経科学におけるスキーマに基づく学習をモチベーションとして,繰り返しクエリや関連するクエリから検索経験を蓄積する学習自由フレームワークであるGAM-RAGを提案する。
GAM-RAGは、リンクが固定的な意味関係ではなく、潜在的な共起をキャプチャする、軽量で無関係な階層インデックスを構築している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:09:17 GMT)
Randomized Kiring Believer for Parallel Bayesian Optimization with Regret Bounds [16.6] 我々は,高コストで評価可能なブラックボックス関数の最適化問題を考える。
この問題に対して、並列ベイズ最適化(PBO)は、より少ない関数評価で最適化することを目的とした、有望なアプローチである。
そこで我々は,有名なKBをベースとしたPBO手法であるランダム化クリグラー(KB)を提案し,元のKBの利点を継承した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:32:59 GMT)
GCTAM: Global and Contextual Truncated Affinity Combined Maximization Model For Unsupervised Graph Anomaly Detection [16.6] 悪質なユーザー、悪意のあるコメント、禁止されたユーザー、偽ニュースなど、現実世界の情報ネットワークやグラフに異常が発生することが多い。
最新のグラフ異常検出手法では、truncated affinity (TAM)と呼ばれる新しいメカニズムを使用して異常ノードを検出する。
本稿では,コンテキスト親和性とグローバル親和性を組み合わせて,異常ノードをトランケートする新しいトランケーションモデルを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:40:46 GMT)
GAC: Stabilizing Asynchronous RL Training for LLMs via Gradient Alignment Control [16.5] 政策段階の更新に非同期性を適用することで,定性的に異なるトレーニングダイナミクスを誘導し,厳しいトレーニング不安定を生じさせることを示す。
GRADIENT ALIGNMENT Controlは、静的な方向に沿って非同期RLの進行を制御するシンプルな動的認識安定化法である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:19:43 GMT)
Fast-Slow Thinking RM: Efficient Integration of Scalar and Generative Reward Models [16.5] 本稿では、デュアルプロセス理論にインスパイアされたハイブリッドRMアーキテクチャであるFast-Slow Thinking Reward Models (F/S-RM)を紹介する。
ひとつは、スカラースコア(高速思考)としての第一段階の予測と、CoTベースの判断(スロー思考)である。
F/S-RMは、最先端モデルの相対的な性能を1.2%向上させ、トークン消費量を20.8%削減する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:48:54 GMT)
TacMamba: A Tactile History Compression Adapter Bridging Fast Reflexes and Slow VLA Reasoning [16.2] 我々は、低周波視覚計画とフレキシブルな統合のための高周波触覚インタフェースであるTacMambaを紹介した。
TacMamba は100%の成功率を示し,視覚のみの pi_0.5 ベースラインをはるかに上回り,厳しいリアルタイム制約を厳密に満たしている。
離散カウントと暗黙の状態を切り替える実験により、TacMambaは100%の成功率を示し、ビジュアルのみのpi_0.5ベースラインをはるかに上回り、厳しいリアルタイム制約を厳密に満たしている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:26:54 GMT)
Markovian ODE-guided scoring can assess the quality of offline reasoning traces in language models [16.2] オフライン評価フレームワークであるMarODEを導入し、トレースの推論に品質スコアを割り当てる。
その効果は、人中心の摂動と人間の判断を用いて評価される。
大規模な評価では、MarODEは既存のベースラインを250%以上上回っている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:09:33 GMT)
Anatomy of the Modality Gap: Dissecting the Internal States of End-to-End Speech LLMs [15.9] 音声とテキストの表現が階層的にどのように進化するかを分析する。
音声表現は、冗長な音声の性質に起因して、広い層間アライメントバンドを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:21:43 GMT)
Stochastic Multi-Armed Bandits with Limited Control Variates [15.9] 私たちは、干渉やチャネル状態の見積がスループットに関する部分的な洞察を提供する無線ネットワークによって動機付けられています。
本稿では,学習者が補助情報に限られたアクセス権を持つ古典的マルチアームバンディット問題の変種について検討する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:20:46 GMT)
Constrained Particle Seeking: Solving Diffusion Inverse Problems with Just Forward Passes [15.7] 逆問題に対する新しい勾配のないアプローチであるtextbfemphConstrained Particle Seeking (CPS) を導入する。
CPSは、逆問題を制約付き最適化タスクとして再構成し、より柔軟で効率的な粒子探索を可能にする。
我々はCPSが画像逆問題と科学的逆問題の両方を効果的に解き、勾配法に匹敵する結果が得られることを示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:15:49 GMT)
PhysGraph: Physically-Grounded Graph-Transformer Policies for Bimanual Dexterous Hand-Tool-Object Manipulation [15.7] 既存のメソッドは、システム全体の状態を単一の構成ベクタとしてネガリックに表現する。
本稿では,PhysGraphについて述べる。PhysGraphは2次元手動オブジェクト操作に挑戦する物理グラウンドグラフトランスフォーマポリシーである。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:32:20 GMT)
HyperTokens: Controlling Token Dynamics for Continual Video-Language Understanding [15.7] 我々は、オンデマンドで微調整トークンを生成するトランスフォーマーベースのトークンジェネレータHyperTokensを紹介する。
忘れを抑えるために,タスク固有のシャープな方向を避けるために先進的なメタインスパイアされた正規化器を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:30:02 GMT)
ProtRLSearch: A Multi-Round Multimodal Protein Search Agent with Large Language Models Trained via Reinforcement Learning [15.6] 多次元報酬に基づくRLを訓練した多次元タンパク質探索エージェントであるProtRLSearchを提案する。
現実的なタンパク質クエリ設定において,タンパク質配列情報とテキストベースのマルチモーダル入力を統合するモデルの有効性を評価する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:25:41 GMT)
Dream2Learn: Structured Generative Dreaming for Continual Learning [15.6] モデルが自己内部表現から構造化された合成体験を自律的に生成するフレームワークであるDream2Learnを紹介する。
夢のクラスを継続的な訓練に組み込むことで、D2Lは前向きの知識伝達と将来のタスクへの適応をサポートするために、潜在機能を積極的に構成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:52:10 GMT)
SCATR: Mitigating New Instance Suppression in LiDAR-based Tracking-by-Attention via Second Chance Assignment and Track Query Dropout [15.5] LiDARベースのトラッキング・バイ・アテンション(TBA)フレームワークは、高い偽陰性エラーを被る。
本稿では,この基本的な課題を体系的に解決するために設計された,新しいLiDARベースのTBAモデルであるSCATRを紹介する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:50:54 GMT)
LAD-Drive: Bridging Language and Trajectory with Action-Aware Diffusion Transformers [15.5] 低レベルの空間計画から高レベルの意図を遠ざける生成フレームワークであるLAD-Driveを紹介する。
LAD-Driveは確率的メタアクション分布を推測するためにアクションデコーダを使用し、通常1ホットの符号化で失われるニュアンスドインテントを保存する明示的な信念状態を確立する。
LangAutoベンチマークの大規模な評価は、LAD-Driveが最先端の結果を達成し、ドライビングスコアの競争ベースラインを最大59%上回っていることを示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:21:42 GMT)
Mean-Flow based One-Step Vision-Language-Action [15.5] FlowMatchingベースのVision-Language-Action(VLA)フレームワークは、高周波アクションチャンクを生成する上で、顕著なアドバンテージを示している。
それらは、本質的に反復的なサンプリング要件とアーキテクチャ上の制限から生じる、世代遅延の延長によって制約される。
本稿では,アクション生成プロセスにおけるノイズによる問題を解消する,平均フローに基づくワンステップVLA手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:30:30 GMT)
Preconditioned Score and Flow Matching [15.4] 共分散 $_t$ of $p_t$ が最適化バイアスを支配していることを示す。
我々は、$p_t$の幾何学を再構成する可逆的でラベル条件付きエンプレコンディショニングマップを提案する。
プレコンディショニングは最適下高原を避けることによって、より優れたトレーニングモデルが得られることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:09:15 GMT)
PlayWrite: A Multimodal System for AI Supported Narrative Co-Authoring Through Play in XR [15.4] 仮想キャラクタと小道具を直接操作することで,ユーザがストーリーを作成できる混合現実システムであるPlayWriteを紹介する。
マルチエージェントAIパイプラインは、これらのアクションをIntent Framesに解釈する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:11:44 GMT)
LEAR: Learning Edge-Aware Representations for Event-to-LiDAR Localization [15.3] LEARは、エッジ構造と高密度事象深度流れ場を共同で推定し、知覚とモダリティの分断を橋渡しする。
いくつかの人気があり、挑戦的なデータセットにおいて、LEARは最高の先行メソッドよりも優れたパフォーマンスを達成している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:18:25 GMT)
Sketch2Colab: Sketch-Conditioned Multi-Human Animation via Controllable Flow Distillation [15.2] 我々はSketch2Colabを紹介し、ストーリーボードスタイルの2Dスケッチを、エージェント、関節、タイミング、接触をきめ細かな制御で、コヒーレントでオブジェクト対応の3Dモーションに変換する。
CORE4DとInterHumanの実験では、Sketch2Colabは拡散のみのベースラインよりもはるかに高速な推論を提供しながら、最先端の制約順守と知覚品質を実現している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:52:51 GMT)
Practical Deep Heteroskedastic Regression [15.0] ターゲットの不確かさが入力に依存するヘテロスケダスティック回帰では、予測分布の平均と分散をパラメータ化するニューラルネットワークを訓練する。
本稿では,事前学習したネットワークの中間層に分散モデルを適用することで,これらの課題に協調的に対処する,シンプルで効率的な手法を提案する。
提案手法は, 平均予測精度を損なうことなく, 予測時に安価に使用できることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:19:32 GMT)
Spectral Regularization for Diffusion Models [14.9] 本稿では,異なるフーリエ領域とウェーブレット領域の損失で標準拡散訓練を増強するロスレベルスペクトル正規化フレームワークを提案する。
提案手法はDDPM, DDIM, EDMの定式化と互換性があり, 計算オーバーヘッドが無視できる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:39:02 GMT)
A Directed Graph Model and Experimental Framework for Design and Study of Time-Dependent Text Visualisation [14.6] 我々は、有向グラフ構造に基づく時間依存テキスト可視化の抽象モデルを開発する。
次にモチーフを蒸留し、テキストが時間的変化にまたがってリンクできる可能性のセットをキャプチャします。
私たちは、各パターンに適合する、架空の、しかし構造化された時間依存のテキストセットを作成します。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:06:31 GMT)
VidDoS: Universal Denial-of-Service Attack on Video-based Large Language Models [14.6] ビデオLLMは、安全クリティカルなアプリケーションにますますデプロイされるが、ELA(Energy-Latency Attacks)に弱い。
我々は,VidDoSを紹介した。VidDoSは,ビデオLLM用にカスタマイズされた,初めてのユニバーサルELAフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:11:47 GMT)
BAED: a New Paradigm for Few-shot Graph Learning with Explanation in the Loop [14.4] FSGL(Few-Shot Graph Learning)アプローチは、長年にわたって開発されてきた。
本稿では, BAED と呼ばれる FSGL 問題に対する最初の説明---the-loop フレームワークを紹介する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:56:39 GMT)
Better Eyes, Better Thoughts: Why Vision Chain-of-Thought Fails in Medicine [14.4] 大規模視覚言語モデル(VLM)は、一般的なドメインにおいてチェーン・オブ・シント(CoT)の恩恵を受けることが多いが、医療ビジョン言語タスクにおけるその有効性は未解明のままである。
医学的視覚的質問応答では、CoTは汎用モデルと医療特化モデルにまたがって直接回答(DirA)を過小評価することが多い。
微妙でドメイン固有の手がかりは視覚的接地を弱め、CoTはそれを修正するよりも早期の知覚の不確実性を複雑にする可能性がある。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:32:44 GMT)
Action-Guided Attention for Video Action Anticipation [14.3] Action-Guided Attention(AGA)は、予測されたアクションシーケンスをクエリやキーとして明示的に活用してシーケンスモデリングをガイドするアテンションメカニズムである。
AGAは検証から見えないテストセットまでよく一般化する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:13:45 GMT)
Towards OOD Generalization in Dynamic Graphs via Causal Invariant Learning [14.0] 動的グラフニューラルネットワーク(DyGNN)は有望な能力を示している。
動的グラフ OOD の一般化は以下の問題により非自明である。
因果的な不変パターンを利用したOOD一般化のための動的グラフ因果不変学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:00:11 GMT)
ToProVAR: Efficient Visual Autoregressive Modeling via Tri-Dimensional Entropy-Aware Semantic Analysis and Sparsity Optimization [13.9] Visual Autoregressive(VAR)モデルは生成品質を向上させるが、後期では重要な効率ボトルネックに直面している。
本稿では,従来のアプローチと根本的に異なるVARモデルの新たな最適化フレームワークを提案する。
提案手法は, セマンティックな忠実さと細部を著しく保ちながら, 生成プロセスの積極的な加速を実現する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:58:25 GMT)
CUCo: An Agentic Framework for Compute and Communication Co-design [13.9] CUCoはトレーニングフリーのエージェント駆動ワークフローで、共同でオーケストレーションと通信を行う高性能カーネルを自動的に生成する。
従来のコンポーネントを最適化することで、CUCoは既存のアプローチでは利用できない新しい最適化の機会を解放する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:35:50 GMT)
DUEL: Exact Likelihood for Masked Diffusion via Deterministic Unmasking [13.9] マスク付き拡散モデル(MDM)は、アンマスクの位置を反復的に選択し、それらの位置でトークンを予測することによってテキストを生成する。
ELBOは、試験時間分布ではなく、トレーニング分布の下ではゆるやかに境界づけられている。
我々は,決定論的位置選択を形式化し,主要なMDMサンプリング戦略を統一するtextscDUELフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:56:03 GMT)
QIME: Constructing Interpretable Medical Text Embeddings via Ontology-Grounded Questions [13.9] 解釈可能な医療用テキスト埋め込みを構築するためのオントロジーを基盤としたフレームワークであるQIMEを提案する。
QIMEは、バイオメディカルテキストのきめ細かい区別を捉える意味論的原子的質問を生成する。
そこで本研究では,QIMEが従来の解釈可能な埋め込み手法よりも優れており,そのギャップを強力なブラックボックスバイオメディカルエンコーダにかなり狭めていることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:18:06 GMT)
Power Echoes: Investigating Moderation Biases in Online Power-Asymmetric Conflicts [13.8] 我々は,パワー非対称のコンフリクト・モデレーションにおいて人間のモデレーターが示すパワー関連バイアスの種類について検討することを目的とする。
消費者と商人の実際の対立をシナリオとして活用し,50人の参加者による複合設計実験を行った。
結果は、この2つのモデレーションモードにおいて、強力な党を支持するためのいくつかのバイアスを示唆している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:16:11 GMT)
MetaState: Persistent Working Memory for Discrete Diffusion Language Models [13.8] textbfMetaStateは、凍結したdLLMバックボーンに永続的で固定サイズのワーキングメモリを装備する軽量なリカレント拡張である。
LLaDA-8BとDream-7Bでは、textbfMetaStateは、バックボーンの凍結を保ちながら、無視可能なトレーニング可能なパラメータを導入し、凍結ベースラインよりも一貫して精度を向上させる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:16:35 GMT)
Learning Shortest Paths with Generative Flow Networks [13.6] 任意のグラフにおけるパスフィンディング問題は、非環状GFlowNetをフロー正規化でトレーニングすることで解決できることを示す。
置換環境におけるパスフィンディングとルービックキューブの解法における手法の性能を実験的に実証した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:12:13 GMT)
Zero- and Few-Shot Named-Entity Recognition: Case Study and Dataset in the Crime Domain (CrimeNER) [13.6] 犯罪関連ゼロ・Few-Shot NERのケーススタディであるCrimNERと一般犯罪関連名前認識データベース(CrimeNERdb)について述べる。
5種類の粗大犯罪と,22種類の微粒犯罪を定義した。
ケーススタディとアノテートデータの品質を,汎用的かつ一般的に使用されている大言語モデルだけでなく,現状NERモデルを用いたZeroおよびFew-Shot設定の実験により論じる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:12:02 GMT)
Cultural Counterfactuals: Evaluating Cultural Biases in Large Vision-Language Models with Counterfactual Examples [13.5] 文化バイアスを測定する上で重要な課題は、個人が属するグループを決定することは、しばしば画像の文化的文脈に依存することである。
本稿では,宗教,国籍,社会経済的地位に関連する文化的バイアスを測定するために,60k近い反事実画像を含む高品質な合成データセットについて紹介する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:19:53 GMT)
A Resource-Rational Principle for Modeling Visual Attention Control [13.3] Dissertationは、視覚的注意をモデル化するためのリソース・リテラル・シミュレーションベースのフレームワークを開発する。
視覚タスクを部分観測可能なマルコフ決定プロセスを用いて境界最適制御問題として定式化する。
これらのモデルは、従来のテキスト読み上げと、スマートグラスによる読書時間ウォーキングにまたがるシミュレーション環境でインスタンス化される。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:45:50 GMT)
CodecFlow: Efficient Bandwidth Extension via Conditional Flow Matching in Neural Codec Latent Space [13.3] 音声帯域拡張は、低帯域音声に対して適切な高周波コンテンツを再生/推論することにより、明瞭さと知性を向上させる。
既存の手法はしばしばスペクトログラムや波形モデリングに依存しており、高い計算コストを発生させ、高周波の忠実度を制限できる。
我々は、コンパクトな潜在空間で効率的な音声再構成を行うニューラルネットワークベースのBWEフレームワークであるCodecFlowを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:03:46 GMT)
Rate-Distortion Signatures of Generalization and Information Trade-offs [13.0] 新たな視覚条件への一般化は、人間と機械の両方の視覚にとって、依然として中心的な課題である。
標準的なロバストネスメトリクスは、システムのロバストネスに対する精度の取引方法に関する限られた洞察を提供する。
本稿では,刺激応答行動を効果的な通信チャネルとして扱う速度歪み理論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:48:39 GMT)
Enhancing Persona Following at Decoding Time via Dynamic Importance Estimation for Role-Playing Agents [13.0] 社会学研究におけるロールプレイング言語エージェントの有用性は,大規模言語モデルの導入とともに増大している。
社会シミュレーションにおけるリアリズムにおいては、ロールプレイング言語エージェントは、キャラクタープロファイルによって定義されたペルソナに従わなければならない。
本稿では,文脈に依存したペルソナの重要度を動的に推定し,重み付けされた報酬誘導復号に組み込む新しい理論駆動手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:37:16 GMT)
NICO-RAG: Multimodal Hypergraph Retrieval-Augmented Generation for Understanding the Nicotine Public Health Crisis [12.9] Nicotine Innovation Counter-Offensive (NICO)データセットは、55のタバコやニコチン製品ブランドで、画像やテキスト記述を含む20万以上のマルチモーダルサンプルを提供する。
本稿では,高コストの言語モデルを実現することなく画像特徴を検索可能な検索拡張生成(RAG)フレームワークNICO-RAGを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:31:07 GMT)
Adaptive Data Augmentation with Multi-armed Bandit: Sample-Efficient Embedding Calibration for Implicit Pattern Recognition [12.7] ADAMABは、数ショットパターン認識のための効率的な埋め込みキャリブレーションフレームワークである。
実験の結果,ADAMABの精度は最大40%向上した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:58:07 GMT)
A Safety-Aware Shared Autonomy Framework with BarrierIK Using Control Barrier Functions [12.6] 乱雑な環境では、各ソースが個別に衝突しない場合でも、線形ブレンディングは安全でないコマンドを生成することができる。
共有自律性の逆運動学層における制御障壁関数(CBF)の使用について検討する。
提案手法は,代表的乱雑環境のシミュレーションおよびVR遠隔操作研究において評価される。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:28:38 GMT)
OpenMarcie: Dataset for Multimodal Action Recognition in Industrial Environments [12.6] OpenMarcieは、製造環境でのヒューマンアクション監視のために設計された、最大のマルチモーダルデータセットである。
周囲に散らばっているモダリティやカメラを感知するウェアラブルからのデータが含まれている。
データセットは3つの人間の活動認識タスクに対してベンチマークされる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 21:05:27 GMT)
End-to-End Simultaneous Dysarthric Speech Reconstruction with Frame-Level Adaptor and Multiple Wait-k Knowledge Distillation [12.6] 外科的音声再構成(DSR)は通常、自動音声認識(ASR)と文レベルの音声合成(TTS)を組み合わせたカスケードシステムを用いる。
我々のシステムは、Tesla A100上での平均応答時間1.03秒であり、平均リアルタイムファクタ(RTF)は0.71である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:26:01 GMT)
Can Computational Reducibility Lead to Transferable Models for Graph Combinatorial Optimization? [12.6] 最適化のための統合ニューラルネットワーク(CO)の導出における鍵となる課題は、モデルの効率的な一般化である。
まず、GCONモジュールを表現的メッセージパッシングの形式として利用し、エネルギーベースの非教師なし損失関数と組み合わせて、新しいモデルを構築した。
我々は,MVC,MIS,MaxClique間で効果的に伝達する事前学習および微調整戦略を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 23:03:00 GMT)
Let the Agent Search: Autonomous Exploration Beats Rigid Workflows in Temporal Question Answering [12.2] 時間的知識グラフ質問回答(TKGQA)は、時間的制約の下でマルチホップ推論を要求する。
オフ・ザ・シェルフの自律性、つまり次に何をするかを決めることは、すでにかなりの利益をもたらしていることを示す。
時間的質問応答のための自律型トレーニングフリーエージェントAT2QAを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:33:39 GMT)
Mitigating topology biases in Graph Diffusion via Counterfactual Intervention [12.1] グラフ拡散モデルは、しばしば敏感な属性からトポロジーバイアスを継承し増幅し、不公平な合成グラフをもたらす。
フェアグラフ拡散モデル (FairGDiff) は, 位相バイアスを軽減し, 公平性と実用性のバランスをとる。
FairGDiffは、フェアネスとユーティリティのトレードオフが優れており、既存のフェアグラフ生成方法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:55:07 GMT)
Accelerating Video Generation Inference with Sequential-Parallel 3D Positional Encoding Using a Global Time Index [11.9] 因果自己回帰ビデオ生成パイプラインに対するシステムレベルの推論最適化を実装した。
5秒の480Pビデオでは、1.58倍のスピードアップが達成され、リアルタイムインタラクティブアプリケーションに対する効果的なサポートを提供する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:18:18 GMT)
MatRIS: Toward Reliable and Efficient Pretrained Machine Learning Interaction Potentials [11.9] MatRISは3体インタラクションの注意に基づくモデリングを導入する不変MLIPである。
MatRISは、様々な人気のあるベンチマークにおいて、主要な同変モデルの精度に匹敵する精度を提供する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:52:41 GMT)
GLoRIA: Gated Low-Rank Interpretable Adaptation for Dialectal ASR [11.7] GLoRIAは、事前訓練されたエンコーダで低ランク更新を変調する適応フレームワークである。
GCNDコーパスでは、GLoRIAはジオコンディショニングされたフル微調整よりも優れています。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 23:10:09 GMT)
Quasar: Quantized Self-Speculative Acceleration for Rapid Inference via Memory-Efficient Verification [11.6] textbfQuasar (textbfQuantized textbfSelf-speculative textbfAcceleration for textbfRapid Inference)は、この「メモリウォール」を克服するために設計されたトレーニング不要のフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:02:25 GMT)
Towards Privacy-Preserving LLM Inference via Collaborative Obfuscation (Technical Report) [11.5] AloePriは、産業アプリケーションのための最初のプライバシ保護型LCM推論手法である。
本稿では,AloePriが0.0%3.5%の精度低下を引き起こし,平文推論に匹敵する効率を示すことを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:16:36 GMT)
Coarse-to-Fine Monocular Re-Localization in OpenStreetMap via Semantic Alignment [11.4] 本稿では,OpenStreetMapにおける局所化のためのセマンティックアライメントを備えた階層型検索フレームワークを提案する。
本手法は局所化精度と速度の両方を著しく向上させる。
1つのデータセットでトレーニングすると、我々のメソッドの3つの方向リコールは、最先端のメソッドの5つのリコールよりも優れています。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:43:43 GMT)
KERV: Kinematic-Rectified Speculative Decoding for Embodied VLA Models [11.3] 我々はKERVというキネマティック修正型SDフレームワークを開発した。
KERVは27%37%の加速を達成するが、成功率の損失はほとんどない。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:12:03 GMT)
DreamReader: An Interpretability Toolkit for Text-to-Image Models [11.2] 我々はDreamReaderを紹介した。DreamReaderは、拡散解釈可能性を構成可能な表現演算子として形式化するフレームワークである。
DreamReaderは、拡散アーキテクチャを横断する体系的な分析と介入を可能にする、モデルに依存しない抽象化層を提供する。
我々は, (i) 2つのモデル間のアクティベーションステッチを行う制御実験を通じてDreamReaderを実証し, (ii) 複数のアクティベーションユニットを操るためにLoReFTを適用した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:18:21 GMT)
TCG CREST System Description for the DISPLACE-M Challenge [11.1] 本報告では, DISPLACE-M チャレンジのトラック1(話者ダイアリゼーション)における TCG CREST システム記述について述べる。
本研究では,様々な音声活動検出法と高度なクラスタリングアルゴリズムが話者ダイアリゼーション(SD)性能に与える影響について検討した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:12:47 GMT)
WildCross: A Cross-Modal Large Scale Benchmark for Place Recognition and Metric Depth Estimation in Natural Environments [11.0] WildCrossは、大規模自然環境における位置認識とメートル法深度推定のためのクロスモーダルベンチマークである。
我々は,視覚的,ライダー的,横断的な位置認識に関する総合的な実験を行い,距離深度推定を行った。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:39:12 GMT)
DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting [11.0] この研究は、DINOv3をブルーベリーロボット収穫関連視覚タスクの冷凍バックボーンとして評価する。
果実や青果物のセグメンテーションや、果物やクラスターの検出が含まれる。
全体として、DINOv3はエンドツーエンドのタスクモデルではなく、セマンティックなバックボーンと見なされている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:01:25 GMT)
Towards Source-Aware Object Swapping with Initial Noise Perturbation [11.0] SourceSwapは、オブジェクト間のアライメントを学習する、自己管理的でソース対応のフレームワークである。
我々は、フルソースコンディショニングとノイズフリー参照エンコーダを備えたデュアルU-Netを訓練し、直接オブジェクト間アライメントを可能にする。
実験により、SourceSwapは優れた忠実さ、より強いシーン保存、より自然な調和を実現していることが示された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:47:58 GMT)
Exploring Plan Space through Conversation: An Agentic Framework for LLM-Mediated Explanations in Planning [10.7] 説明フレームワークに依存しないマルチエージェント大規模言語モデルアーキテクチャを提案し,ユーザとコンテキストに依存した対話型説明を可能にする。
また,LLMを用いた対話とベースラインテンプレートベースの説明インタフェースの比較を行うために,このフレームワークをゴール・コンフリクト・説明のためのインスタンス化についても述べる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:58:18 GMT)
Experimental realization and self-testing of semisymmetric informationally complete measurements via a one-dimensional photonic quantum walk [10.6] 1次元離散時間量子ウォークを用いた半SIC POVMを実験的に実現した。
我々の結果は、一般化された量子測定による量子認証の探索の道を開いた。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:33:42 GMT)
Quantitative Convergence of Wasserstein Gradient Flows of Kernel Mean Discrepancies [10.5] ケルネル平均離散関数のワッサーシュタイン勾配流の定量的収束について検討した。
我々の設定は、特に無限幅および連続時間制限における浅層ニューラルネットワークのトレーニング力学をカバーしている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:32:54 GMT)
Accelerating Single-Pass SGD for Generalized Linear Prediction [10.5] ストリーミング環境下での一般化線形予測について検討し、各イテレーションは勾配レベルの更新に1つの新しいデータポイントのみを使用する。
そこで本研究では,新しいデータ依存的近位法によりモーメントをうまく組み込んだ最初のアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:04:00 GMT)
Frontier Models Can Take Actions at Low Probabilities [10.5] 事前デプロイ評価は、モデルアクションの限られたサンプルのみを検査する。
監視を回避しようとする悪意あるモデルが、いつ「欠陥」を発生させるのかをランダム化することで、これを悪用できる
これはキャリブレーションを維持しながら、非常に低いレートで行動を起こす必要がある。
私たちは、フロンティアモデルがこのタスクに驚くほど適していることに気付きました。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:56:59 GMT)
GMP: A Benchmark for Content Moderation under Co-occurring Violations and Dynamic Rules [10.4] 大規模言語モデル(LLM)は、以下のガイドラインに適合するが、その判断能力は、ポリシーが不安定であるか、文脈に依存している場合に低下する。
既存の静的ベンチマークのパフォーマンスは、共起違反や動的に変化するルールを含む現実のシナリオに対して、AI判断の堅牢な一般化を真に保証していますか?
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:50:11 GMT)
Shape-Interpretable Visual Self-Modeling Enables Geometry-Aware Continuum Robot Control [10.3] 連続ロボットは高い柔軟性と冗長性を持ち、複雑な環境での安全な相互作用に適している。
既存の視覚に基づく制御アプローチは、しばしばエンドツーエンドの学習に依存し、ロボット幾何学を明確に認識せずに形状制御を達成する。
本稿では,幾何認識制御が可能な連続ロボットのための形状解釈可能な視覚自己モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:20:28 GMT)
HiCrowd: Hierarchical Crowd Flow Alignment for Dense Human Environments [10.2] HiCrowdは、強化学習とモデル予測制御を統合する階層的なフレームワークである。
高レベルのRLポリシーは、ロボットを適切な歩行者グループに合わせるための追従ポイントを生成し、低レベルのMPCは、短い地平線計画でこのガイダンスを安全に追跡する。
本研究は,人体を動的障害物としてのみ扱うのではなく,人体の動きをガイダンスとして活用することが,人体における安全かつ効率的なロボットナビゲーションの強力な原則であることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:04:02 GMT)
Training-Free Spatio-temporal Decoupled Reasoning Video Segmentation with Adaptive Object Memory [10.2] Reasoning Video Object (VOS) は、ビデオシーケンス間で安定したオブジェクトセグメンテーションを必要とする難しいタスクである。
従来のマルチモーダル大規模言語モデル(MLLM)を微調整してセグメンテーション出力を生成する手法は、かなりのリソースを必要とする。
トレーニングフリーのtextbfStemporal textbfDecoupled Reasoning Video with textbfAdaptive Object bfMemory (SDAM) を提案する。
提案手法は,Ref-YouTubeVOS,RefDAVIS17,MeViViS,ReasonVOS,Ref-YouTubeVOS,RefDAVIS17,ReasonVOSの5つのベンチマークデータセットに対して優れた結果を得る。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:15:41 GMT)
Measuring What VLMs Don't Say: Validation Metrics Hide Clinical Terminology Erasure in Radiology Report Generation [10.2] 本稿では,テンプレート崩壊に拘わらず,高い集合トークンオーバラップスコアにつながる復号方式について検討する。
本稿では,人口統計に基づく単語の関連性の変化を定量化するための語彙レベルのフレームワークである,臨床協会変位(CAD)について紹介する。
決定論的復号化は意味的消去のレベルが高いことを示し、サンプリングは多様な出力を生成するが、新しいバイアスをもたらすリスクを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:59:39 GMT)
Temporal Imbalance of Positive and Negative Supervision in Class-Incremental Learning [10.1] CILは、しばしば新しいクラスに対する予測バイアスとして表される破滅的な忘れ込みという中核的な課題に直面している。
既存の手法は主に、このバイアスをタスク内のクラス不均衡に起因し、分類器ヘッドでの修正に焦点を当てている。
本稿では、時間的減衰カーネルを用いて、監督強度ベクトルを構築し、クロスエントロピー損失における負の監督を動的に強調する時間的調整損失(TAL)を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:57:52 GMT)
Graph-of-Mark: Promote Spatial Reasoning in Multimodal Language Models with Graph-Based Visual Prompting [9.9] 空間推論タスクのためにシーンを入力画像上にオーバーレイする最初のピクセルレベルのプロンプト技術であるGoMを提案する。
3つのオープンソースと4つの異なるデータセットにまたがるGoMを評価し、描画されたコンポーネントに対する広範な改善を行い、テキストプロンプトにおける補助グラフ記述の影響を調査した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:41:26 GMT)
Co-optimization for Adaptive Conformal Prediction [9.9] 中心$m(x)$と半径$h(x)$を共同最適化することにより予測間隔を学習するフレームワークを提案する。
合成および実ベンチマークの実験は、CoCPが一貫して短い間隔で生成し、最先端の条件付きカバレッジ診断を実現することを示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:43:19 GMT)
UniTalking: A Unified Audio-Video Framework for Talking Portrait Generation [9.9] 我々は,高忠実度音声とリップ同期ビデオを生成するための統合されたエンドツーエンド拡散フレームワークUniTalkingを紹介する。
事前訓練されたビデオ生成モデルから強力な事前情報を活用することにより、このフレームワークは最先端の視覚的忠実度を確保しつつ、効率的なトレーニングを可能にする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:46:53 GMT)
Leave-One-Out Prediction for General Hypothesis Classes [9.9] 本稿では,EMM周辺における経験的リスクレベルセットに基づく一般的な集約手法であるMLSA(Median of Level-Set Aggregation)を紹介する。
LOO_S(hath) ;le; C cdot frac1n min_hin H L_S(h) ;+; fracComp(S,
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:27:44 GMT)
Sustaining high-fidelity quantum logic in neutral-atom circuits via mid-circuit operations [9.9] ゲートの忠実度は、観測可能な劣化を伴わずに、複数の操作ラウンドで99.8%の水準で維持することができる。
システムの内部エントロピーと運動のエントロピーを積極的に管理することにより、連続的な量子誤り訂正に必要な繰り返しシンドローム抽出サイクルを実行するための重要な経路を提供する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:43:09 GMT)
SaferPath: Hierarchical Visual Navigation with Learned Guidance and Safety-Constrained Control [9.7] ビジュアルナビゲーションはモバイルロボットの中核機能であるが、エンド・ツー・エンドの学習ベースの手法は、目に見えない、散らかった、狭い環境での一般化と安全性に苦しむことが多い。
本稿では,既存のエンド・ツー・エンドモデルから学習したガイダンスを活用し,安全性に制約のある最適化制御モジュールを通じて改良した階層型ビジュアルナビゲーションフレームワークであるSaferPathを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:17:37 GMT)
Violation of Quantum Bilocal Inequalities on Mutually-Commuting von Neumann Algebra Models [9.7] 我々は、量子エンタングルメントスワップネットワークを特徴付けるために、3つの互いに可換なフォン・ノイマン代数を用いる。
ベルのような不等式が成立し、一般に双局所不等式と呼ばれる。
この結果は量子力学や量子場理論にも応用できる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:28:05 GMT)
Deep Learning Based Wildfire Detection for Peatland Fires Using Transfer Learning [9.6] 我々は、泥炭火災検知のための移動学習に基づくアプローチを提案する。
我々は,従来の山火事検出モデルから事前訓練した重量を用いたDLベースの泥炭火災検知器を初期化する。
転送学習は,スクラッチからのトレーニングに比べて検出精度とロバスト性を大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 23:14:41 GMT)
Nano-EmoX: Unifying Multimodal Emotional Intelligence from Perception to Empathy [9.6] 本研究では,感情的タスクを認知的深度知覚,理解,相互作用に応じて整理する3段階階層を提案する。
我々は,小型マルチタスクモデリングであるNano-EmoXと,カリキュラムベースのトレーニングフレームワークであるP2E(PerceptiontoEmpathy)を紹介する。
出力は異種アダプタを通じて統一された言語空間に投影され、様々な感情的タスクに取り組むために軽量な言語モデルに権限を与える。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:42:33 GMT)
Co-designing a Social Robot for Newcomer Children's Cultural and Language Learning [9.5] 社会支援ロボット(SAR)は、教育において有望であるが、これらの社会的な感情に敏感な環境での使用は、いまだ研究されていない。
本研究では,プログラム講師やコーディネータと共同で,ソーシャルロボットMapleの設計空間を探索する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:01:15 GMT)
GRAIL: Post-hoc Compensation by Linear Reconstruction for Compressed Networks [9.5] GRAILはモデル圧縮後に適用される単純なゼロファインタニングステップである。
小さいキャリブレーションセットを使用して各ブロックの入出力動作を復元する。
データフリーでデータアウェアなプルーニングや折り畳みベースラインよりも正確さや難易度が一貫して向上する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:25:09 GMT)
SEAnet: A Deep Learning Architecture for Data Series Similarity Search [9.4] 本研究では,ディープニューラルネットワークに基づく新しいデータ系列要約手法であるDeep Embedding Approximation (DEA)を提案する。
また,特にDEA学習用に設計された新しいアーキテクチャであるSEAnetについて述べる。
SEAnetを用いて学習したDEAの利点を検証するため、7つの多様な合成および実データセットに関する総合的な実験を行った。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:57:06 GMT)
MealRec: Multi-granularity Sequential Modeling via Hierarchical Diffusion Models for Micro-Video Recommendation [9.3] マイクロビデオレコメンデーションは、対話されたマイクロビデオのコラボレーティブおよびコンテキスト情報からユーザの好みをキャプチャすることを目的としている。
マイクロビデオレコメンデーション(MealRec)のための階層拡散モデルを用いた多重粒度連続モデリング手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:39:18 GMT)
B$^2$F-Map: Crowd-sourced Mapping with Bayesian B-spline Fusion [9.2] クラウドソースマッピングは,従来の調査車両を使用したマップ作成に代わる,スケーラブルな代替手段を提供する。
本稿では,単眼カメラ,コンシューマグレード,IMUのみを搭載した生産車を用いた,HDマップ生成のための完全なパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:01:00 GMT)
The Power of Decaying Steps: Enhancing Attack Stability and Transferability for Sign-based Optimizers [9.0] 非収束性と不安定性の1つの原因は、非遅延的なステップサイズスケジューリングである、と我々は主張する。
そこで本研究では,信号ベース対角線における一律的なステップサイズ決定を強制する,新たな攻撃アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:46:58 GMT)
3D Field of Junctions: A Noise-Robust, Training-Free Structural Prior for Volumetric Inverse Problems [9.0] 多くの3次元イメージング逆問題では、高レベルの計測ノイズに直面している。
本稿では,新しい全体積3次元接合体表現法を提案する。
3つの異なる3次元画像タスクで3次元FoJを用いて音量再構成と復調に成功した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:11:59 GMT)
ORCA: Orchestrated Reasoning with Collaborative Agents for Document Visual Question Answering [8.9] ORCA: 文書視覚質問応答のための協調エージェントを用いたオーケストレーション推論について述べる。
我々のフレームワークは、それぞれが異なるモダリティに特化している専門的なAIエージェントのセットを活用し、さまざまなドキュメントコンポーネントをまたいだ詳細な理解と協調的推論を可能にします。
提案手法は最先端の手法よりも大幅に改善され,視覚的きめ細かな推論における協調エージェントシステムのための新しいパラダイムが確立される。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:21:25 GMT)
Statistical Consistency of Discrete-to-Continuous Limits of Determinantal Point Processes [8.7] 連続DPPはベルヌーイ辺を持つランダムグラフ上の極限として得られることを示す。
連続DPPはベルヌーイ辺を持つランダムグラフ上の極限として得られることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:00:25 GMT)
Latent attention on masked patches for flow reconstruction [8.7] 本稿では,マスクフロー再構成のためのレグレッションベースの修正視覚変換器であるLAMPモデルについて紹介する。
その結果,LAMPは10dBから30dBの信号対雑音比で90%の入力から全流れ場を正確に再構成することがわかった。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:12:40 GMT)
A Unified Revisit of Temperature in Classification-Based Knowledge Distillation [8.6] 知識蒸留の中心的な考え方は、生徒が学ぶための教師の重みに埋め込まれた構造を明らかにすることである。
広く使われているにもかかわらず、適切な温度値を選択する方法についての理解は限られている。
実際には、温度はグリッドサーチまたは以前の作業の値を採用することで、一般的に選択される。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:16:01 GMT)
EstLLM: Enhancing Estonian Capabilities in Multilingual LLMs via Continued Pretraining and Post-Training [8.6] 大きな言語モデル(LLM)は、主に英語中心のデータに基づいて訓練されており、その結果、より小さな言語では不均一なパフォーマンスが得られる。
プレトレーニング付き多言語LLMにおいて,継続事前訓練(CPT)がエストニアの能力を大幅に向上するか否かを検討した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:24:36 GMT)
Causal Effects with Unobserved Unit Types in Interacting Human-AI Systems [8.5] 我々は,人間とAIエージェントの相互作用する集団に関する実験を行った。
我々は、各ユニットが人間である確率を与える前に、人間-AIを仮定する。
次に、因果メッセージパッシングフレームワークを用いて結果のダイナミクスをモデル化し、サブポピュレーション全体にわたるサンプル平均結果を分析する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:31:48 GMT)
From Pixels to Patches: Pooling Strategies for Earth Embeddings [8.5] 我々は、AlphaEarth、OlmoEarth、Tesseraの3つの基礎モデルから派生したGeoTIFFを81,000個組み込んだEuroSAT-Embedを紹介した。
よりリッチなプール方式は,平均プールに比べて地理的一般化ギャップを最大40%減少させることを示した。
平均プールのドロップイン代替として一般平均プール(GeM)を推奨する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:03:37 GMT)
Exact bounds on quantum partial search algorithm and improving the parallel search [8.5] グロバーのアルゴリズムは、非構造化データベースを探索する古典的なアルゴリズムを2次的に高速化する。
Grover-Radhakrishnan-Korepin (GRK)アルゴリズムは、このタスクの最適なプロトコルとして広く見なされている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:24:07 GMT)
OMG-Avatar: One-shot Multi-LOD Gaussian Head Avatar [8.4] OMG-アバター(OMG-Avatar)は、0.2秒で1枚の画像から3Dヘッドをアニマタブルに再現するための新しいワンショット方式である。
我々はグローバルな特徴抽出とプロジェクションに基づく局所的特徴抽出にトランスフォーマーベースのアーキテクチャを用いる。
本稿では,階層的詳細認識の強化とレベル・オブ・ディテール機能をサポートするための粗粒度学習パラダイムを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:30:53 GMT)
Diagnosing Generalization Failures from Representational Geometry Markers [8.4] 医用バイオマーカーにインスパイアされた一般化失敗について検討する。
我々は,ネットワークマーカーを設計,テストし,構造や機能リンクの探索,予後指標の同定,実環境における予測の検証を行う。
この研究は、表現幾何学が隠れた脆弱性を隠蔽し、モデル選択とAI解釈可能性に関するより堅牢なガイダンスを提供することを示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:59:19 GMT)
Learning Thermal-Aware Locomotion Policies for an Electrically-Actuated Quadruped Robot [8.4] 本研究は、運動温度を強化学習ロコモーションポリシーに組み込む熱認識制御法を提案する。
ユニツリーA1の実際の実験では、固定された3kgのペイロードの下で、ベースラインポリシーがオーバーヒート保護をトリガーし、約7分以内に停止することを示した。
提案手法は,命令追跡性能を同等に保ちながら,熱的中断なく27分以上連続的に動作可能である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:06:59 GMT)
Co-Evolutionary Multi-Modal Alignment via Structured Adversarial Evolution [8.3] 我々は、静的な敵の監視を超えて、進化する攻撃と共進化的アライメントを導入する。
本稿では,敵対的プロンプトをメソッドテンプレートや有害な意図に分解する進化的攻撃手法を提案する。
Adaptive Defenderは、合成されたハードネガティブに対して反復的に更新され、進化する攻撃に適応するクローズドループプロセスを形成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:10:46 GMT)
More Data, Fewer Diacritics: Scaling Arabic TTS [8.2] アラビア録音を収集し,音声活動検出,音声認識,自動発音,ノイズフィルタリングを用いて自動処理するパイプラインを構築した。
我々は,100時間,1,000時間,4,000時間という多種多様なデータを用いて音声クローンを用いた頑健なTSSモデルを訓練する。
ダイアクリティカル化データに基づいてトレーニングされたモデルは概して優れているが、多くのトレーニングデータが、ダイアクリティカル化の欠如を補う。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:58:50 GMT)
Aligning Fetal Anatomy with Kinematic Tree Log-Euclidean PolyRigid Transforms [8.2] 我々は、新しいキネマティックツリーに基づくLog-Euclidean PolyRigid変換によって駆動される新しい体積体モデルを導入する。
KTPolyRigid はリー代数の曖昧さを、大きく、非局所的な調音運動と関連づけて解決する。
折り畳みアーティファクトが著しく少ない変形場が得られる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:20:26 GMT)
Protection against Source Inference Attacks in Federated Learning [8.1] フェデレートラーニング(FL)は、当初はプライバシー保護機械学習パラダイムとして提案されていた。
FLは一連のプライバシー攻撃の影響を受けやすいことが示されている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:01:41 GMT)
FATE: Closed-Loop Feasibility-Aware Task Generation with Active Repair for Physically Grounded Robotic Curricula [8.1] 本稿では,タスク生成を反復的検証・修正プロセスとして再定義するクローズドループ自己修正フレームワークであるFATEを提案する。
FATEはジェネラリストの具体化エージェントを生成ループに直接埋め込んで、結果のカリキュラムの物理的根拠を積極的に保証する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:29:42 GMT)
Learning graph topology from metapopulation epidemic encoder-decoder [8.1] 時系列データからメタポピュレーションモビリティグラフを推定する2つのエンコーダ・デコーダ深層学習アーキテクチャを提案する。
提案手法は最先端のトポロジ推論よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:46:19 GMT)
Strategic Shaping of Human Prosociality: A Latent-State POMDP Framework [7.8] 本稿では,ロボットが反復的相互作用において,人間の社会的状態を戦略的に形成できる決定論的枠組みを提案する。
我々はこれを限られた観測値を持つ潜在状態POMDPとして定式化し、期待値を用いて遷移と観測のダイナミクスを学習する。
帰結した信念に基づく政策は、タスクと社会的目的をバランスさせ、長期的な協力的な成果を最大化する行動を選択する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:47:54 GMT)
Perspective-Equivariant Fine-tuning for Multispectral Demosaicing without Ground Truth [7.7] マルチスペクトル復調は、スナップショットモザイクド測定から全高解像度の分光像を再構成する上で重要である。
モザイク測度のみから多スペクトル復調を学習するフレームワークであるPEFDを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:16:38 GMT)
SFCo-Nav: Efficient Zero-Shot Visual Language Navigation via Collaboration of Slow LLM and Fast Attributed Graph Alignment [7.7] 本稿では,効率的なゼロショットビジュアル言語ナビゲーションフレームワークであるSFCo-Navを紹介する。
2) リアルタイムオブジェクトグラフの構築とサブゴール実行のための高速なリアクティブナビゲータ,3) 非同期のスローファーストブリッジは高度な構造化,属性付き,認識されたグラフを整列して,ナビゲーションの信頼性を推定する。
従来のゼロショットVLNの成功率と一致または超える一方で、軌道当たりのトークン総消費量を50%以上削減し、3.5以上を走らせる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:42:12 GMT)
ACDC: Adaptive Curriculum Planning with Dynamic Contrastive Control for Goal-Conditioned Reinforcement Learning in Robotic Manipulation [7.4] ACDCは、多次元適応カリキュラム(AC)計画と動的コントラスト(DC)制御を統合し、適切に設計された学習軌道に沿ってエージェントを誘導する。
挑戦的なロボット操作タスクの実験は、ACDCがサンプル効率と最終タスク成功率の両方において、最先端のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:23:09 GMT)
Beyond Detection: Governing GenAI in Academic Peer Review as a Sociotechnical Challenge [7.4] 生成型AIツールは、ますます学術的ピアレビューに入り、公正性、説明責任、評価的判断の正当性に関する疑問を提起している。
本稿では、14のエリアチェアとプログラムチェアを用いた448のソーシャルメディア投稿の談話分析について紹介する。
我々は、GenAIが限られた支援業務に受け入れられる可能性があると広く合意するが、その中核となる評価判断、新規性、貢献、受容は人間の責任のままである。
我々は、AI支援ピアレビューは、ブランケット禁止や検出のみではなく、人間に対する評価判断を明示的に保ちながら、強制的かつ役割特異的な制御を規定することによって、最善を尽くすと論じている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:23:04 GMT)
PPEDCRF: Privacy-Preserving Enhanced Dynamic CRF for Location-Privacy Protection for Sequence Videos with Minimal Detection Degradation [7.3] 本稿では,バックグラウンドベース検索攻撃下での位置情報プライバシリークについて検討する。
プライバシ保護型条件付きランダムフィールドフレームワークであるPEDCRFを提案する。
公共運転データセットの実験では、PPEDCRFが位置検索攻撃の成功を著しく減少させることが示された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:18:53 GMT)
WhisperNet: A Scalable Solution for Bandwidth-Efficient Collaboration [7.3] 自動運転には協調的認識が不可欠だが、通信予算の厳しい制約が残っている。
textitWhisperNetは,エージェント間のグローバルなコーディネーションのための,新しいレシーバ中心のパラダイムを提案する,帯域幅対応フレームワークである。
我々は、WhisperNetが最先端の性能を実現し、通信コストのわずか0.5%でOPV2VのAP@0.7を2.4%改善したことを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:33:25 GMT)
Advancing Earth Observation Through Machine Learning: A TorchGeo Tutorial [7.2] TorchGeoはPyTorchベースのドメインライブラリで、データセット、サンプル、変換、事前トレーニングされたモデルを提供する。
本稿では,TorchGeoデータセットを用いてセマンティックセグメンテーションモデルをトレーニングし,ブラジルのリオデジャネイロのSentinel-2シーンに適用し,その結果の予測をGeoTIFFとして保存する方法を示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:56:08 GMT)
DOCFORGE-BENCH: A Comprehensive Benchmark for Document Forgery Detection and Analysis [7.1] 文書偽造検出のための最初の統一ゼロショットベンチマークであるDOCFORGE-BENCHを提案する。
テキスト改ざん、レシート偽造、ID文書操作にまたがる8つのデータセットにまたがる14の手法を評価する。
私たちの中心的な発見は、シングルスレッドプロトコルでは見えない、広範囲にわたるキャリブレーション障害です。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:26:57 GMT)
Boosting Entropy with Bell Box Quantization [7.1] QAPT(Quantization-Aware Pre-Training)は、ディープニューラルネットワークの計算およびメモリオーバーヘッドを低減する効果的な手法である。
計算効率も高い最初の ITO 量子化法である BBQ を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:27:39 GMT)
Maude-HCS: Model Checking the Undetectability-Performance Tradeoffs of Hidden Communication Systems [6.9] 隠れ通信システムの2つの配置下での観測可能な実行トレースの統計的識別可能性として、検出不能を定式化する。
我々は,非検出性と性能のトレードオフを推論するための原則的かつ実行可能な基盤を提供する,実行可能なモデリングおよび分析フレームワークであるMaude-HCSを開発した。
そこで,Maude-HCSは,統計的検定の真偽陽性率を推定し,これらの推定値をKL偏差などの非検出性尺度の下位境界に変換することにより,非検出性評価に利用できることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:56:38 GMT)
TriageSim: A Conversational Emergency Triage Simulation Framework from Structured Electronic Health Records [6.8] TriageSimは、構造化レコードからペルソナ条件のトリアージ会話を生成するためのフレームワークである。
800の合成文字と対応するオーディオのコーパスを生成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:23:44 GMT)
Robust White Blood Cell Classification with Stain-Normalized Decoupled Learning and Ensembling [6.8] 白血球分類(WBC)は、感染症評価、白血病スクリーニング、治療モニタリングなどの血液学の応用に欠かせない。
本稿では、インスタンスバランスサンプリングを用いて、転送可能な表現を学習するステンドノーマライズされた非結合型トレーニングフレームワークを提案する。
推論段階では,様々なトレーニングされたバックボーンをテスト時間拡張でアンサンブルすることにより,ロバスト性をさらに向上する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:31:25 GMT)
Cognitive Prosthetic: An AI-Enabled Multimodal System for Episodic Recall in Knowledge Work [6.7] 本稿では,構造化されたエピソードキャプチャと自然言語検索による知識作業におけるエピソードリコールを支援するために,AIを利用した概念証明を提案する。
異種センサデータを問合せ可能なエピソード記憶に変換する技術的実現可能性を示す機能実証として,CPMSを提案する。
この作業は、職場環境におけるAI対応メモリ拡張のためのエンドツーエンドのプライバシ対応アーキテクチャに寄与する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:58:53 GMT)
What Exactly do Children Receive in Language Acquisition? A Case Study on CHILDES with Automated Detection of Filler-Gap Dependencies [6.7] 本稿では,英語コーパスにおける3つのコアフィラーギャップ構造を同定するシステムを提案する。
人間の注釈付きデータに基づいてシステムを検証した結果、ほとんどのカテゴリで良いスコアが得られた。
結果として得られたきめ細かいラベルは、獲得研究と計算研究の両方において将来の研究を可能にする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:03:51 GMT)
Conformal Graph Prediction with Z-Gromov Wasserstein Distances [6.6] 教師付きグラフ予測は、出力が構造化グラフである回帰問題に対処する。
本稿では,グラフ値出力のための共形予測フレームワークを提案する。
本研究は,合成課題と分子同定の真問題に対する提案手法の評価である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 23:02:43 GMT)
Multimodal Sensing for Robot-Assisted Sub-Tissue Feature Detection in Physiotherapy Palpation [6.5] 本稿では6軸力トルクセンサと高分解能視覚ベースの触覚画像を統合する小型マルチモーダルセンサを提案する。
予備的な結果は,触覚と力のモーダル性を組み合わせることで,ロバストな地下特徴の検出とロボットの触覚制御が可能になることを示唆している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 23:15:24 GMT)
Diagnosing Retrieval vs. Utilization Bottlenecks in LLM Agent Memory [6.5] 我々は、書き込み戦略、検索方法、メモリ利用行動における性能差がどのように現れるかを分析する。
LoCoMoでは、検索方法が主流である。
フェール分析は、パフォーマンスの低下が、利用ではなく、検索段階で最も多く現れることを示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 23:47:23 GMT)
Benchmarking LLM Summaries of Multimodal Clinical Time Series for Remote Monitoring [6.4] 大規模言語モデル(LLMs)は遠隔治療監視時系列の流動的な臨床要約を生成することができる。
既存の評価指標は主に意味的類似性と言語的品質に重点を置いており、事象レベルの正確性はほとんど測定されていない。
本稿では,TIHM(Technology-Integrated Health Management)-1.5認知症モニタリングデータセットを用いたマルチモーダル時系列要約のためのイベントベース評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:33:11 GMT)
FLANS at SemEval-2026 Task 7: RAG with Open-Sourced Smaller LLMs for Everyday Knowledge Across Diverse Languages and Cultures [6.4] 本稿では,SemEval-2025 Task-7への参加について述べる。
トラック1:短解答質問(SAQ)とトラック2:複数解答質問(MCQ)の2つのサブタスクに参加した。
我々が使った方法は、オープンソースでより小さなLLM(OS-sLLMs)を用いた検索拡張生成(RAGs)である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:27:14 GMT)
Jailbreak Foundry: From Papers to Runnable Attacks for Reproducible Benchmarking [6.3] 本稿では,JAILBREAK FOUNDRY(JBF)について紹介する。
30回以上の攻撃を再現すると、JBFは平均(再現された報告された)攻撃成功率(ASR)を+0.26ポイントの偏差で高忠実度を達成する。
このシステムは、一貫したGPT-4o判定器を用いて、10の犠牲者モデルにわたる30の攻撃の標準AdvBench評価を可能にする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:06:01 GMT)
CyclicJudge: Mitigating Judge Bias Efficiently in LLM-based Evaluation [6.3] この研究は、ベンチマークスコアの分散をシナリオ、生成、判断、残留コンポーネントに分割する分散分解を導入する。
この分析に基づいて、審査員のラウンドロビン割り当てであるCyclicJudgeが最適なアロケーション戦略であることが示されている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:46:32 GMT)
Towards Robot Skill Learning and Adaptation with Gaussian Processes [6.1] 一般的なロボットのスキル適応には、様々なタスク構成に頑健な表現が必要である。
初期構成と観測構成のばらつきを考慮に入れた3つの適応手法を提案する。
提案手法は,すべてのベンチマークを成功率で上回る結果を得た。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:44:37 GMT)
Nonreciprocal entanglement in exciton optomechanics with an optical parametric amplifier [6.1] 回転エキシトン-オプトメカニカルシステムにおける非相互二分位および三分位エンタングルメントについて検討した。
サニャック効果によって引き起こされる非相反的絡み合いは、OPAを介して制御できることが判明した。
我々の研究は、室温の非相互エンタングルメントを操作する方法を開き、これは非相互量子技術を開発するのに役立つかもしれない。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:51:43 GMT)
Single-ion phonon laser in the quantum regime [6.1] 量子フォノンレーザー状態は、量子力学に基づいてフォノンコヒーレント増幅によって生成される振動状態である。
本稿では, 単一イオンが3レベルモデルを用いて量子フォノンレーザー状態を生成する方法について検討する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:13:04 GMT)
From Fewer Samples to Fewer Bits: Reframing Dataset Distillation as Joint Optimization of Precision and Compactness [6.1] 固定ビット予算下でデータセットのコンパクト性と精度を協調的に最適化する統合フレームワークを提案する。
QuADDは蒸留ループ内に微分可能な量子化モジュールを統合し、合成試料と量子化パラメータのエンドツーエンドの共最適化を可能にする。
本フレームワークは、データから量子化レベルを学習し、情報密度領域をより良く表現する、均一かつ適応的な非一様量子化をサポートする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 21:46:10 GMT)
MERG3R: A Divide-and-Conquer Approach to Large-Scale Neural Visual Geometry [6.1] MERG3Rは、幾何学的基礎モデルのためのトレーニング不要な分母・分母フレームワークである。
MERG3Rは、無秩序な画像を、独立して再構成できる重なり合った幾何学的に多様なサブセットに分割する。
その後、効率的な大域的アライメントと信頼重み付きバンドル調整手順を通じて、得られた局所的な再構成をマージする。
7シーン、NRGBD、Tarms & Temples、Cambridge Landmarksを含む大規模なデータセット全体にわたって、MERG3Rは、再構築精度、メモリ効率、スケーラビリティを一貫して改善している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:49:25 GMT)
TopoMaskV3: 3D Mask Head with Dense Offset and Height Predictions for Road Topology Understanding [6.0] TopoMaskV3は、2つの新しい密度予測ヘッドを介して、頑丈でスタンドアロンな3D予測器である。
我々は,道路トポロジ評価において,地理的データ漏洩に最初に対処した人物である。
TopoMaskV3は、地理的に結合しないベンチマークで最先端の28.5OLSを達成する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:33:46 GMT)
Discrete World Models via Regularization [6.0] 正規化による離散世界モデル(DWMR)は、教師なし世界モデル学習のための再構成不要でコントラストのない手法である。
また,効率的な最適化を実現するために,ロバストネスとロールアウトを改善した新しいトレーニング手法を導入する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:17:38 GMT)
Randomized Neural Networks for Partial Differential Equation on Static and Evolving Surfaces [6.0] パラメトリゼーション曲面の定式化、暗黙のレベルセット曲面の定式化、およびパラメトリゼーションに基づく定式化と互換性のある解析を行う。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:17:09 GMT)
Theory of the Uhlmann Phase in Quasi-Hermitian Quantum Systems [5.9] 我々は、物理ヒルベルト空間計量が外部パラメータによって変化する準エルミート系に対するウルマン位相の理論を開発する。
熱ゆらぎによって駆動される自明な位相と非自明な位相の複数の遷移を含む、豊富な有限温度トポロジー位相図を明らかにする。
この研究は、非エルミート量子系における混合状態幾何学相を理解するための統一的な枠組みを確立する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:25:32 GMT)
Framing Effects in Independent-Agent Large Language Models: A Cross-Family Behavioral Analysis [5.9] 本研究では,個別グループ間の利害対立を含むしきい値投票課題において,迅速なフレーミングが意思決定にどのように影響するかを検討する。
その結果、迅速なフレーミングは選択分布に大きく影響し、しばしばリスク-逆オプションに切り替えることが示された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:10:34 GMT)
PolyMon: A Unified Framework for Polymer Property Prediction [5.9] PolyMonは、複数のポリマー表現、機械学習メソッド、トレーニング戦略を統合する、統一的でアクセス可能なフレームワークである。
我々は5つの重要なポリマー特性をベンチマークとして、表現とモデルが予測性能にどのように影響するかを評価する。
全体としてPolyMonは、機械学習ベースのポリマー特性予測のベンチマークと前進のための総合的で基盤を提供する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:21:31 GMT)
Affine Correspondences in Stereo Vision: Theory, Practice, and Limitations [5.8] 本稿では,アフィン変換とエピポーラ幾何学の基礎的記述を概説する。
画像方向から局所アフィン変換を推定するための新しい手法を提案する。
現実的なテストケースでは, 推定精度は数度程度と推定された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:15:01 GMT)
nchellwig at SemEval-2026 Task 3: Self-Consistent Structured Generation (SCSG) for Dimensional Aspect-Based Sentiment Analysis using Large Language Models [5.7] SemEval-2026タスク3における次元アスペクトベース感性分析のための自己持続構造生成(SCSG)を提案する(トラックA)
SCSGはインスタンス毎に複数回大きな言語モデルを実行し、実行中に過半数のコンセンサスを達成するだけのものを保持する。
15個の実行を持つ自己整合性は、単一推論のプロンプトよりも統計的に有意な改善をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:13:03 GMT)
LLM-as-an-Annotator: Training Lightweight Models with LLM-Annotated Examples for Aspect Sentiment Tuple Prediction [5.7] 本稿では,LA-ABSAを提案する。LA-ABSAは,Large Language Model (LLM) の生成したアノテーションを,複雑なABSAタスクのための微調整軽量モデルに活用する新しいアプローチである。
ターゲット・アスペクト・センシティメント検出(TASD)とアスペクト・センシティメント・クオード・予測(ASQP)の5つのデータセットに対するアプローチを評価する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:03:32 GMT)
AnnoABSA: A Web-Based Annotation Tool for Aspect-Based Sentiment Analysis with Retrieval-Augmented Suggestions [5.7] 我々は、Aspect-Based Sentiment Analysis (ABSA)タスクの全スペクトルをサポートする最初のWebベースのアノテーションツールであるAnnoABSAを紹介した。
ツールは高度にカスタマイズ可能で、感情要素とタスク固有の要件の柔軟な設定を可能にする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:56:47 GMT)
Streaming Continual Learning for Unified Adaptive Intelligence in Dynamic Environments [5.7] 継続的学習(CL)とストリーミング機械学習(Streaming Machine Learning)は、この困難な課題に対処する2つの研究分野である。
CLとStreaming Continual Learningの両方の利点を利用する統一的な設定を提案しました。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:24:37 GMT)
Transform-Invariant Generative Ray Path Sampling for Efficient Radio Propagation Modeling [5.6] レイトレーシングは正確な電波伝搬モデリングの標準となっているが、計算複雑性に悩まされている。
本稿では,総合的な機械学習支援フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:37:34 GMT)
MAP-Diff: Multi-Anchor Guided Diffusion for Progressive 3D Whole-Body Low-Dose PET Denoising [5.4] 低線量ポジトロン放射トモグラフィ(PET)は放射線被曝を減少させるが、強いノイズと定量的な劣化に悩まされる。
プログレッシブ3次元全身PETデノナイズのためのマルチアンカー誘導拡散フレームワークMAP-Diffを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:58:59 GMT)
V-MORALS: Visual Morse Graph-Aided Estimation of Regions of Attraction in a Learned Latent Space [5.3] 本稿では,学習潜在空間(V-MORALS)におけるトラクション領域の視覚的モースグラフによる推定について述べる。
V-MORALSは、所定のコントローラの下でシステムのイメージベースの軌跡のデータセットを取り込み、到達可能性分析のための潜在空間を学習する。
提案手法は,様々なシステムやコントローラに対してROAを計算可能な,よく定義されたモースグラフを生成することができる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:17:27 GMT)
Exploring Teacher-Chatbot Interaction and Affect in Block-Based Programming [5.3] AIベースのチャットボットは、学習と教育を加速する可能性があるが、思慮深い設計と足場を使わずに、反生産的な結果をもたらす可能性がある。
ブロック型プログラミング環境における理科・計算思考活動にチャットボットを用いた中学生11チームを対象に実験を行った。
その結果,教師は,学習能力の低下や批判的思考の潜在的な低下などとともに,スキルの育成や自己自信の確立といったチャットボットのメリットを認識した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:42:27 GMT)
RoboGPU: Accelerating GPU Collision Detection for Robotics [5.3] 我々は、衝突クエリを3.1$times$で計算するRoboCoreを、レイトレーシングアクセラレータ(RTA)ユニットよりも高速に導入する。
RoboCoreは他のロボティクスのタスクにも役立ち、最先端のニューラルモーションプランナーで3.6$times$のスピードアップを達成した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:48:42 GMT)
Does Travel Stage Matter? How Leisure Travellers Perceive Their Privacy Attitudes Towards Personal Data Sharing Before, During, and After Travel [5.2] 本稿では,旅行前後の個人データの共有に対するレジャートラベラーの態度について考察する。
参加者の個人データの共有に対するプライバシの態度は,共有の目的や旅行の段階によって異なることがわかった。
参加者がソーシャルメディアプラットフォームを頻繁に使用しているにもかかわらず、コンテンツ共有はTikTok、YouTube、Snapchat、Pinterest、Twitterで最小限である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:43:25 GMT)
UTICA: Multi-Objective Self-Distllation Foundation Model Pretraining for Time Series Classification [5.1] 我々は,DINOv2スタイルの自己蒸留に適応し,時系列基礎モデルの事前学習を行う。
私たちはMantisトークンライザとトランスフォーマーエンコーダアーキテクチャをバックボーンとして構築しています。
提案手法は,UCRベンチマークとUEAベンチマークの両方で最先端の分類性能を実現する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:02:09 GMT)
Deep Learning for Financial Time Series: A Large-Scale Benchmark of Risk-Adjusted Performance [4.9] 本稿では,金融時系列予測と位置分類タスクのための,最新のディープラーニングアーキテクチャの大規模ベンチマークを示す。
我々は線形モデル、リカレントネットワーク、トランスフォーマーベースアーキテクチャ、状態空間モデル、および最近のシーケンス表現アプローチを評価する。
リッチな時間的表現を学習するために設計されたモデルは、線形ベンチマークや一般的なディープラーニングモデルより一貫して優れています。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:52:50 GMT)
From Leaderboard to Deployment: Code Quality Challenges in AV Perception Repositories [4.6] 本研究では,KITTIとNuScenes 3D Object Detectionのリーダーボードから178種類のユニークなモデルを体系的に分析した。
調査対象となったレポジトリの7.3%が基本生産準備基準を満たしていることがわかった。
継続的インテグレーション/継続的デプロイメントパイプラインの採用は、コードメンテナンス性の向上と相関していた。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:54:28 GMT)
Evaluating and Understanding Scheming Propensity in LLM Agents [4.5] 我々は、スケジュールインセンティブを要因要因と環境要因に分解する。
環境インセンティブが高いにもかかわらず、最小限のスケジュールの事例が見出され、評価意識による可能性は低い。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:38:40 GMT)
BrepCoder: A Unified Multimodal Large Language Model for Multi-task B-rep Reasoning [4.4] B-rep入力から多様なCADタスクを実行するPythonライクな大規模言語モデル(MLLM)であるBrepCoderを提案する。
LLMのコード生成機能を活用することで、CADモデリングシーケンスをPythonライクなコードに変換し、B-repと整合させる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:18:48 GMT)
Large Language Models as Bidding Agents in Repeated HetNet Auction [4.3] 本稿では,ヘテロジニアスネットワーク(HetNets)内での繰り返しスペクトルオークションにおける推論エージェントとしての大規模言語モデル(LLMs)の統合について検討する。
本稿では,各基地局(BS)が独立して独自のマルチチャネルオークションを行う分散オークションベースのフレームワークを提案し,ユーザ機器(UE)がそれらの関連と入札値の両方を戦略的に決定する。
シミュレーションの結果,LCMを内蔵したUEは,ベンチマークよりもチャネルアクセス周波数が一貫して向上し,予算効率が向上することがわかった。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:30:01 GMT)
Composable Attestation: A Generalized Framework for Continuous and Incremental Trust in AI-Driven Distributed Systems [4.3] 本稿では,分散システムにおける連続的・漸進的信頼のための汎用的な暗号フレームワークとして,コンポーザブル証明を提案する。
このような証明システムのコア特性を定義する厳密な数学的基盤を確立する。
このフレームワークのユーティリティは、セキュアなAIモデルの完全性検証、フェデレーション学習、ランタイム信頼保証といったアプリケーションにまで拡張されている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:45:26 GMT)
Theory of anomalous Landau-Zener tunneling induced by nonlinear coupling [4.2] 振幅依存・符号可逆非線形結合を持つ2レベル系におけるランダウ・ツェナートンネルの理論を考案する。
臨界相互作用強度を超える非線形結合は、断熱的なエネルギー景観を根本的に再認識することを示す。
本研究は非線形カップリング誘起異常断裂のパラダイム的枠組みを確立する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:52:54 GMT)
Thirty-six quantum officers are entangled [4.2] n=2 または n=6 を除いて、任意の位数 n のラテン正方形の対が存在する。
特に、オイラーの36名の士官の問題は解決法を持っていない。
しかし、「量子解」(quantum solution)があり、六位数の量子ラテン四角形が絡み合っている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:03:40 GMT)
CausalWrap: Model-Agnostic Causal Constraint Wrappers for Tabular Synthetic Data [4.1] CausalWrapは、事前訓練されたベースジェネレータに部分的な因果知識を注入するモデルに依存しないラッパーである。
CWは、ベースジェネレータからのサンプルに適用された軽量で微分可能なポストホック補正マップを学習する。
CWは多様なベースジェネレータ間の因果性を改善する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:59:46 GMT)
Intrinsic Task Symmetry Drives Generalization in Algorithmic Tasks [4.1] グラッキングの基礎となる3段階の動的トレーニングを一貫した3段階に分類する。
我々は、対称性獲得フェーズ中に一般化が現れることを示す。
一般化の開始を予想する対称性に基づく診断を導入し,それを加速するための戦略を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:19:24 GMT)
Inference-Time Safety For Code LLMs Via Retrieval-Augmented Revision [4.0] 大規模言語モデル(LLM)は、高度なソフトウェア開発において、コード生成のためにますます多くデプロイされている。
LLMは、新しく発見された脆弱性やセキュリティ標準の変更に容易に適応できない。
本稿では,推論時安全機構として機能する設計による信頼に値するコード生成への原則的アプローチを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:06:34 GMT)
Estimating Visual Attribute Effects in Advertising from Observational Data: A Deepfake-Informed Double Machine Learning Approach [4.0] デジタル広告はますますビジュアルコンテンツに依存しているが、マーケターは、特定の視覚的属性が消費者のエンゲージメントにどのように影響するかを理解するための厳密な方法がない。
本稿では,モデル皮膚のトーンなどの治療が画像自体に埋め込まれた場合の因果効果を推定する,基本的な方法論的課題に対処する。
DML(Double Machine Learning)のような標準的なアプローチはこの設定で失敗する。
DICE-DMLは、ジェネレーティブAIを利用して、共同創設者から治療を遠ざけるフレームワークである。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:00:38 GMT)
Bimanual XR Specification of Relative and Absolute Assembly Hierarchies for Teleoperation [3.9] 本稿では,リモートアセンブリタスクを相対的および絶対的オブジェクト制約の階層として指定するための,双方向なXRインタラクション手法を提案する。
相対群は、ロボットソフトウェアが選択した場所に構築できるサブアセンブリを、ユーザによって強制されるのではなく、効率よく指定する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:07:09 GMT)
MetaRCA: A Generalizable Root Cause Analysis Framework for Cloud-Native Systems Powered by Meta Causal Knowledge [3.9] クラウドネイティブシステムのダイナミクスと複雑性は、ルート原因分析(RCA)に重大な課題をもたらす
本稿では,クラウドネイティブシステムのための汎用RCAフレームワークであるMetaRCAを紹介する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:16:22 GMT)
NM-DEKL$^3_\infty$: A Three-Layer Non-Monotone Evolving Dependent Type Logic [3.8] 我々は新しい依存型システムNM-DEKL$3_infty$(Non-Monotone Dependent Knowledge-Enhanced Logic)を提案する。
このシステムは、計算層、構築的知識層、命題的知識層を分離する3層アーキテクチャを使用する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:52:59 GMT)
Depth-Structured Music Recurrence: Budgeted Recurrent Attention for Full-Piece Symbolic Music Modeling [3.8] Depth-Structured Music Recurrence (DSMR) は、完全な作曲から終わりまで学習する訓練時間設計である。
我々の主要なインスタンスである2スケールのDSMRは、低層に長い履歴ウィンドウを割り当て、残りの層に一様短いウィンドウを割り当てます。
MAESTROのピアノパフォーマンスデータセットでは、2スケールのDSMRはパープレキシティ(5.96対5.98)でフルメモリのリカレント参照と一致し、GPUメモリは約59%削減され、スループットは約36%向上した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:26:14 GMT)
Search Multilayer Perceptron-Based Fusion for Efficient and Accurate Siamese Tracking [3.8] MLP(Multilayer Perception)ベースの融合モジュールは、最小構造オーバーヘッドでピクセルレベルの相互作用を可能にする。
異なるニューラルネットワークサーチ(DNAS)により、チャネル幅最適化と他のアーキテクチャ選択を分離する。
トラッカーは4つの汎用と3つの空中ベンチマークでトップパフォーマーにランクインする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:30:54 GMT)
SkeleGuide: Explicit Skeleton Reasoning for Context-Aware Human-in-Place Image Synthesis [3.7] SkeleGuideは明示的な骨格推論に基づいて構築された新しいフレームワークである。
SkeleGuideは、強力な構造的先行として機能する内部のポーズを生成することを学ぶ。
PoseInverterは、この内部潜伏ポーズを明示的で編集可能なフォーマットにデコードする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:07:08 GMT)
Generalized quantum master equation from memory kernel coupling theory [3.6] このボトルネックを克服するために、メモリカーネル結合理論(MKCT)の包括的なテンソル拡張を導入する。
複数のベンチマークシステムにまたがって,この手法の数値的精度と効率を実証する。
これらの成功例は、開量子系における複雑な力学を研究するための高効率ツールとしてテンソルMKCTを確立する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:16:45 GMT)
De-paradox Tree: Breaking Down Simpson's Paradox via A Kernel-Based Partition Algorithm [3.6] シンプソンのパラドックスはこの挑戦を例示しており、集合的および部分群レベルの関連は互いに矛盾する。
De-paradox Tree(デパラドックス・ツリー)は、パラドックス的アソシエーションの背後にある隠されたサブグループパターンを明らかにするために設計された解釈可能なアルゴリズムである。
本稿では,従来の因果推論と機械学習手法の限界に,解釈可能なフレームワークを導入することで対処する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:45:24 GMT)
Relatively Smart: A New Approach for Instance-Optimal Learning [3.5] 我々は、準教師付き学習者と競合する教師付き学習者を求めるスマートPAC学習の枠組みを再考する。
比較的スマートな学習は不可能か,あるいは慣用的な学習アプローチを必要とする可能性があることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:59:10 GMT)
CoopDiff: A Diffusion-Guided Approach for Cooperation under Corruptions [3.5] CoopDiffは拡散に基づく協調認識フレームワークである。
これはデノナイジング機構を通じて汚職を緩和する。
すべての分解タイプで先行メソッドを一貫して上回ります。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:16:19 GMT)
RIVA: Leveraging LLM Agents for Reliable Configuration Drift Detection [3.5] 既存のエージェントシステムは、彼らが呼び出すツールが常に正しい出力を返すと暗黙的に仮定している。
我々は,ツールが誤りや誤解を招く出力を生成する場合でも,堅牢なIaC検証を行う,新しいマルチエージェントシステムであるRIVAを紹介する。
この結果から,多種多様なツールコールの相互検証により,実運用環境におけるより信頼性の高い自律的インフラストラクチャ検証が可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:28:27 GMT)
What Helps -- and What Hurts: Bidirectional Explanations for Vision Transformers [3.4] 視覚変換器(ViT)は視覚認識において高い性能を発揮するが、その決定はいまだに解釈が難しい。
モデル予測に対する支持的(肯定的)と抑圧的(否定的)の両方のコントリビューションをキャプチャする双方向クラスアクティベーションマッピング手法であるBiCAMを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:36:16 GMT)
Generalizing Logic-based Explanations for Machine Learning Classifiers via Optimization [3.4] 2段階は、Onestepと比較して、説明カバレッジ(データセット全体の平均72.60%まで)が大幅に増加し、その結果、以前の作業よりも増加した。
1ステップは、この前の作業の上に構築され、各機能とバウンドの1ステップで説明を生成し、反復的なプロセスのオーバーヘッドを排除します。
Twostepは段階的なアプローチを採り、カバレッジを改善している。実験結果は、Onestepと比較して、説明カバレッジ(データセット全体の平均で72.60%まで)が大幅に増加し、その結果、以前の作業よりも向上していることを示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:51:02 GMT)
SoK: Is Sustainable the New Usable? Debunking The Myth of Fundamental Incompatibility Between Security and Sustainability [3.4] 我々は29論文を分析し、155の持続可能性ガイドラインを12の持続可能性テーマに抽出する。
これら2つのドメイン間の根本的な緊張の証拠はほとんど見つからない。
このような並列性に基づいて構築する上で、使用可能なセキュリティコミュニティは、持続可能性の考慮事項を統合するのに十分な位置にある、と論じる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:08:13 GMT)
physfusion: A Transformer-based Dual-Stream Radar and Vision Fusion Framework for Open Water Surface Object Detection [3.4] PhysFusionは、水面知覚のための物理インフォームドレーダー画像検出フレームワークである。
物理インレーダ(PIR)とRCSマッパーと品質ゲートを統合し、ポイント当たりのレーダ特性をコンパクトな散乱前処理に変換する。
WaterScenesとFLOWの実験は、PhysFusionがWaterScenesで59.7% mAP50:95と90.3% mAP50を達成したことを示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:00:22 GMT)
Anisotropic two-dimensional magnetoexciton with exact center-of-mass separation [3.3] 本研究は、異方性2次元磁気励起子におけるc.m.と相対運動分離の正確な枠組みを開発する。
その結果、強い質量異方性を持つ系における磁気応答に対する異方性依存性結合の有意な影響が示された。
この形式は、他の異方性2D半導体に一般化可能である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:38:09 GMT)
Real-Time Thermal-Inertial Odometry on Embedded Hardware for High-Speed GPS-Denied Flight [3.3] 組込みハードウェア上での高速GPS高密度飛行のためのリアルタイム単分子熱慣性計測システム
システムはFLIR Boson+ 640の長波長赤外線カメラ、高レートIMU、レーザーレンジファインダ、バロメーター、磁力計を固定ラグ係数グラフに融合させる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:38:37 GMT)
Transmitting Correlation for Data Transmission over the Bosonic Arbitrarily Varying Channel [3.3] 送信機と受信機は、古典的に相関した熱光や絡み合った2モードの圧縮状態を用いて、エネルギー制限ジャマの妨害攻撃に対処できることを示す。
我々のモデルでは、送信側と受信側の両方がホモダイン検出のみを許可しており、送信側も電力制限に従う必要がある。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:02:11 GMT)
From Variance to Invariance: Qualitative Content Analysis for Narrative Graph Annotation [3.2] 本稿では,定性的コンテンツ分析(QCA)の原則を統合し,アノテーションの品質を優先するナラティブグラフアノテーションフレームワークを提案する。
本稿では、ノードが事象を表現し、エッジが因果関係を符号化する有向非巡回グラフ(DAG)として注釈付けされたインフレーション物語のデータセットを提案する。
分析の結果,(1)高信頼度(オーバーラップベース距離)は信頼性を過大評価し,(2)局所的に制約された表現(例えばワンホップ隣人)はアノテーションの多様性を低下させることがわかった。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:48:13 GMT)
LexChronos: An Agentic Framework for Structured Event Timeline Extraction in Indian Jurisprudence [3.2] 本稿では,インド最高裁判所判決から構造化イベントタイムラインを反復的に抽出するエージェントフレームワークであるLexChronosを提案する。
我々は,DeepSeek-R1 と GPT-4 を用いた逆エンジニアリング技術を用いて,2000 個のサンプルの合成コーパスを構築し,金標準イベントアノテーションを生成する。
法的なテキスト要約に関する下流評価では、GPT-4は75%のケースにおいて、構造化されていないベースラインよりも構造化されたタイムラインが好まれ、インドの法学における理解と推論が改善された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:31:05 GMT)
YCDa: YCbCr Decoupled Attention for Real-time Realistic Camouflaged Object Detection [3.1] YCDaは、この「クロミナンス分離とダイナミックアテンション」原理を現代のリアルタイム検出器に組み込む、効率的なアーリーステージ機能処理戦略である。
YCDaはプラグアンドプレイで、最初のダウンサンプリング層を置き換えるだけで既存の検出器に統合できる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:31:20 GMT)
How Small Can 6G Reason? Scaling Tiny Language Models for AI-Native Networks [3.1] AIネイティブな6Gシステムにおけるネットワークレベルの意味推論のためのコンパクト言語モデルのスケーリング挙動と展開効率について検討する。
我々は,Llama-3.2-1B,Granite-1B,Qwen2.5-3Bなどの中規模アーキテクチャを含む135M(SmolLM2-135M)から7Bパラメータ(Qwen2.5-7B)までのモデルを評価する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:19:49 GMT)
Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning [3.0] 協調型マルチエージェント計画のための協調型ボルツマンMCTS(CB-MCTS)を提案する。
CB-MCTSは、決定論的UCTをボルツマンのポリシーと、持続的だが焦点を絞った探索のための減衰エントロピーボーナスに置き換える。
シミュレーションの結果,Dec-MCTSは詐欺的シナリオでは優れ,標準ベンチマークでは競争力を維持していることがわかった。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:15:39 GMT)
Production-Grade AI Coding System for Client-Side Development [3.0] 本稿では,現実的な産業制約下でのクライアントサイド開発を目的とした,生産レベルのAIコーディングシステムを提案する。
このシステムは、Figmaの設計、自然言語のRDD、ドメイン固有のエンジニアリング知識を明示的な中間アーティファクトに統合する、構造化されたマルチステージパイプラインを採用している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:17:55 GMT)
FAST-DIPS: Adjoint-Free Analytic Steps and Hard-Constrained Likelihood Correction for Diffusion-Prior Inverse Problems [3.0] トレーニングなし拡散の先行は、しばしば、繰り返し導関数や、保守的なステップサイズを持つ内部最適化/MCMCループに依存する。
本研究では、これらの内部ループをハードな測定空間実現可能性制約で置き換える訓練不要な解法を提案する。
実験はPSNR/SSIM/LPIPSと最大19.5$times$のスピードアップで、手書きのアジョイントや内部MCMCを使わずに、競争力のあるPSNR/SSIM/LPIPSを実現する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:17:26 GMT)
Brain-OF: An Omnifunctional Foundation Model for fMRI, EEG and MEG [2.8] 本稿では,fMRI,MEG,EEG入力を統合した脳基礎モデルであるBrain-OFを提案する。
Brain-OFは40のデータセットからなる大規模なコーパスで事前トレーニングされており、さまざまな下流タスクで優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:08:49 GMT)
Slurry-as-a-Service: A Modest Proposal on Scalable Pluralistic Alignment for Nutrient Optimization [2.7] 食品の安全性と審美的人口管理の両目的のために, 自動システムが選択した個人を栄養豊富なスラリーに転換する, 高度な展開状況(mulch)について検討した。
ValueMulchは、マルチモデルを幅広いコミュニティ規範に合わせるための再現可能なトレーニング、デプロイメント、認定パイプラインです。
我々は、人間の価値の完全なスペクトルにシステムを整合させようとする研究者にとって、倫理的考察、制限、含意に関する議論で締めくくった。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:04:59 GMT)
Security Risks in Machining Process Monitoring: Sequence-to-Sequence Learning for Reconstruction of CNC Axis Positions [2.6] シーケンス・ツー・シーケンス・マシン・モデルは、非理想性を克服し、マシン・ツールの位置を再構築できることを示す。
本手法はLSTMに基づくシーケンス・ツー・シーケンスモデルを用いて,産業用ミリング軸モデルを用いて評価する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:27:22 GMT)
Reasoning Core: A Scalable Procedural Data Generation Suite for Symbolic Pre-training and Post-Training [2.6] Reasoning Coreは、コア形式ドメイン間で検証可能なシンボリック推論データを手続き的に生成するスケーラブルなスイートである。
各タスクは厳密な検証のための外部解決器と組み合わせられ、カリキュラム設計のための継続的な難易度制御が認められる。
実験によると、Reasoning Coreのデータを事前トレーニングに混ぜることによって、下流の推論が改善され、保存されたり、わずかに改善された言語モデリングの品質が向上する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:59:29 GMT)
Semantic Similarity is a Spurious Measure of Comic Understanding: Lessons Learned from Hallucinations in a Benchmarking Experiment [2.6] 視覚障害者や視覚障害者が漫画や漫画にアクセスできるようにするシステムは,このコミュニティに新たなストーリーテリングの媒体を導入する。
生成的視覚言語モデル(VLM)は、画像の記述や漫画の理解において有望であるが、漫画理解に関する研究のほとんどはパネルレベルの分析に限られている。
本稿では,漫画解釈タスクにおけるVLM性能の予備ベンチマークを示す。
この過程で出現する幻覚を同定し、分類し、一般化された対象幻覚に分類する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:03:57 GMT)
Jump Like A Squirrel: Optimized Execution Step Order for Anytime Random Forest Inference [2.6] 決定木と無作為林は、木内の単一ステップの粒度に関するアルゴリズムとして常に認識される。
本稿では,指数型ランタイムにおいて,最大平均精度のステップオーダーを求める最適順序を提案する。
我々の評価では、バックワード・リス・オーダーは、Optimal Orderと$sim99%$だけでなく、他のすべてのステップ・オーダーと同様に$sim94%$を実行している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:15:37 GMT)
Selecting Optimal Variable Order in Autoregressive Ising Models [2.6] 我々は、基礎となるデータを記述するマルコフ確率場を学び、推論されたグラフィカルモデル構造を用いて、最適化された変数順序付けを構築する。
本稿では,構造認識順序付けが制約条件セットにつながる2次元画像様モデルについて述べる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:18:18 GMT)
Safety-Guided Flow (SGF): A Unified Framework for Negative Guidance in Safe Generation [2.5] 本稿では,画像生成タスクに対する最大平均離散性(MMD)ポテンシャルを用いた統一確率的フレームワークを提案する。
我々は制御バリア関数解析を利用して、負のガイダンスが強くなければならない臨界時間窓の存在を正当化する。
我々は,いくつかの現実的な安全な生成シナリオにおいて,統合されたフレームワークを評価し,否定的なガイダンスがデノナイジングプロセスの初期段階で適用されるべきであることを確認した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:31:29 GMT)
A Diffusion-Driven Fine-Grained Nodule Synthesis Framework for Enhanced Lung Nodule Detection from Chest Radiographs [2.5] 胸部X線写真(CXR)における肺癌の早期発見は,患者の予後改善に不可欠である。
放射線学的特性の微妙な外観と変動性のため、結節検出は依然として困難である。
本稿では,低ランク適応 (LoRA) アダプタを用いた新しい拡散型フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:43:58 GMT)
A SUPERB-Style Benchmark of Self-Supervised Speech Models for Audio Deepfake Detection [2.4] Spoof-SUPERBはオーディオディープフェイク検出のためのベンチマークである。
生成性,差別性,およびスペクトログラムに基づくアーキテクチャにまたがる20のSSLモデルを評価する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:45:55 GMT)
LLMs as Strategic Actors: Behavioral Alignment, Risk Calibration, and Argumentation Framing in Geopolitical Simulations [2.4] 大規模言語モデル(LLM)は、戦略的意思決定環境においてエージェントとしてますます提案されている。
我々は,4つの現実的危機シミュレーションシナリオにまたがる人間による結果と合わせて,最先端のLLMを6つ評価した。
我々は、行動アライメントにおけるモデルと、選択された行動の深刻度によるリスクキャリブレーション、国際関係論に基づく議論的フレーミングを比較した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:46:17 GMT)
Sovereign AI-based Public Services are Viable and Affordable [2.3] AI機能と地政学的な関心が交わるにつれて、基本的AIサービスの可用性と信頼性はもはや考慮されなくなる。
この問題は、政府や政府機関が24/7のAI駆動サポートシステムを徐々に採用しているため、市民のためのAI対応の公共サービスに特に力を入れている。
本稿では、これらのプロバイダが提供する汎用アーキテクチャが、すべてのアプリケーションコンテキストに対して最適な選択である、という一般的な仮定に挑戦する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:50:25 GMT)
The Observer-Situation Lattice: A Unified Formal Basis for Perspective-Aware Cognition [2.3] 我々は、視点認識のための単一のコヒーレントなセマンティック空間を提供する統一数学的構造であるObserver-Situation Lattice(OSL)を紹介する。
OSL は有限完全格子であり、各要素はユニークなオブザーバ-選択対を表し、信念管理に対する原則的かつスケーラブルなアプローチを可能にする。
我々は,この格子上で動作する2つの重要なアルゴリズムを提案する: (i)相対的信念伝播, 新たな情報を効率的に伝播する漸進的更新アルゴリズム, (ii) 矛盾成分を識別・分離するグラフベースの最小コントラディション分解。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:15:36 GMT)
On the Rate of Convergence of GD in Non-linear Neural Networks: An Adversarial Robustness Perspective [2.3] グラディエント・Descent (GD) の収束ダイナミクスを最小二項分類設定で検討する。
我々は、GDが最適ロバスト性マージンにうまく収束する一方で、この収束は禁断的に遅い速度で起こることを証明した。
我々の理論的保証は、モデルの異なるアクティベーションパターン間でのGD軌道の厳密な解析を通じて導出される。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:13:33 GMT)
Bridging the gap between Performance and Interpretability: An Explainable Disentangled Multimodal Framework for Cancer Survival Prediction [2.3] がん生存予測のためのマルチモーダルフレームワークであるDIMAFxを紹介する。
病理組織学的全スライディング画像と転写学的データから、不整形、解釈可能なモダリティ特有およびモダリティ共有表現を生成する。
複数のがんコホートにまたがって、DIMAFxは最先端のパフォーマンスを達成し、表現のゆがみを改善している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:26:25 GMT)
Autoregressive Synthesis of Sparse and Semi-Structured Mixed-Type Data [2.2] 我々は、データレコードをキー、値、構造トークンのシーケンスにトークン化する自動回帰トランスフォーマーベースのアーキテクチャであるOrigamiを提案する。
この表現は、平らさや計算を伴わずに、空間性、混合型、階層構造を扱う。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:47:50 GMT)
The Invisibility Hypothesis: Promises of AGI and the Future of the Global South [2.0] 我々は、高度に自律的で汎用的な認知システムが利用できることは、公平な結果を保証するものではないと論じる。
AGIは世界中のすべての人にとって、知識と不可欠なサービスへのアクセスを完全に民主化しています。
最悪の場合、既存の構造的制約は高度に増幅され、既に疎外化されている人口は、グローバルシステムとは無関係に機能的に機能する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:46:18 GMT)
Barenco gate implementation using driven two- and three-qubit spin chains [1.9] 本稿では,短軸スピンチェーンを用いたバレンコ型マルチキュービット制御ゲートの実装プロトコルを提案する。
結合強度と駆動パラメータの明示的な条件を導出し、各部分空間における時間進化演算子に対して閉形式表現を提供し、演算子忠実度を用いて実装の質を特徴付ける。
数値シミュレーションにより、このプロトコルは広いパラメータ範囲で高い忠実性を実現し、スピンチェーンプラットフォームにおける量子情報処理の堅牢性と適合性を実証している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:56:24 GMT)
NP-Completeness and Physical Zero-Knowledge Proof of Hotaru Beam [1.9] ホタルビーム(Hotaru Beam)は、格子上に張られた円を、特定の起点と曲がりの数だけを引いて結ぶ論理パズルである。
ホタルビームはNP完全であり、物理的ゼロ知識証明を示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:43:54 GMT)
MSP-ReID: Hairstyle-Robust Cloth-Changing Person Re-Identification [1.9] 本稿では,頭部を水平に処理するMSP(Mitigating Hairstyle Distraction and Structure Preservation)フレームワークを提案する。
HSOAは、髪型依存性を減らし、安定した顔と身体の手がかりへの注意を高めるために、アイデンティティ内髪型多様性を生成する。
CPREは、体型とコンテキストを維持しながら、テクスチャバイアスを抑制するために、衣服領域内で比制御消去を行う。
RPAは、毛髪の特徴を抑えながら顔と手足の領域を強調させるパーシングガイドを取り入れている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:18:02 GMT)
LOCUS: A Distribution-Free Loss-Quantile Score for Risk-Aware Predictions [1.9] Locus は分布のないラッパーであり、固定予測関数に対する入出力損失スケールの信頼性スコアを生成する。
Locusはリスクランキングを効果的に獲得し、標準回帰よりも大きなロス周波数を低減できることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:25:50 GMT)
Uniform-in-time concentration in two-layer neural networks via transportation inequalities [1.9] ワッサーシュタイン距離W1における平均場限界周辺における実験パラメータ測定の時間内均一濃度を証明した。
また、スライスされたワッサーシュタイン距離 SW 1 における類似濃度境界も導出する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:19:59 GMT)
ToolRLA: Fine-Grained Reward Decomposition for Tool-Integrated Reinforcement Learning Alignment in Domain-Specific Agents [1.8] ToolRLAは、ドメイン固有のツール統合エージェントのトレーニング後パイプラインである。
その核は乗法的正しさ分解を伴う微細な報酬関数である。
エンドツーエンドのタスク補完が47%,ツールの実行エラーが63%,規制違反が93%,3ヶ月後に2秒未満のレイテンシを実現している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:52:14 GMT)
Information and communications technologies for carbon sinks from economics and engineering perspectives [1.8] 本稿では,経済と工学の両面から,炭素シンクプロジェクトにおけるICT活用の包括的分析を行う。
炭素取引では、ブロックチェーンはトランザクション速度を40%向上させ、ペトラノバなどのプロジェクトでは、AIベースの最適化によって運用コストを15%削減した。
経済工学の分断をブリッジし、現在のアプリケーションを将来の機会に合わせてマッピングすることで、気候の目標を満たすためにカーボンシンクソリューションをスケールするためには、デジタル技術のより深い統合が不可欠であることを実証する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:12:34 GMT)
Constant-Time Surgery on 2D Hypergraph Product Codes with Near-Constant Space Overhead [1.8] 汎用コード手術は、フォールトトレラント計算を行うための多用途で低オーバーヘッドな手法である。
本研究では,2次元ハイパーグラフ製品コードの並列論理計測を行う手術器具を一定時間オーバーヘッドで構築する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:21:52 GMT)
Retrieval, Refinement, and Ranking for Text-to-Video Generation via Prompt Optimization and Test-Time Scaling [1.7] 大規模なデータセットは、Text-to-Video(T2V)生成モデルに大きな進歩をもたらした。
ビデオ出力を改善する現在の方法は、しばしば不足する。
RAGベースの新しいプロンプト最適化フレームワークである3Rを導入する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:35:59 GMT)
Coordinated Control of Multiple Construction Machines Using LLM-Generated Behavior Trees with Flag-Based Synchronization [1.7] ROS2-TMS for Constructionは、建設機械自動化のためのサイバー物理システムフレームワークである。
大規模言語モデル(LLM)の最近の進歩は、自動タスク計画の新しい機会を提供する。
本稿では,建設機械の協調作業に向けて,BTの自動生成のためのLLMベースのワークフローを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:52:02 GMT)
CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion [1.6] 低ランク適応(LoRA)はパラメータ効率細調整(PEFT)を支配している
我々は、SiLUゲーティングと構造ドロップアウトを注入し、多様体展開を誘導する重みレベル並列アダプタであるCeRA(Capacity-enhanced Rank Adaptation)を導入する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:35:44 GMT)
S5-HES Agent: Society 5.0-driven Agentic Framework to Democratize Smart Home Environment Simulation [1.5] 本稿では,Society 5.0駆動型スマートホーム環境シミュレーターエージェント(S5-HESエージェント)について述べる。
このフレームワークは、交換可能な大言語モデル(LLM)を介して特殊エージェントを調整する。
セマンティック、キーワード、ハイブリッド検索を備えた検索拡張生成(RAG)パイプラインは、スマートホーム知識を検索する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:30:09 GMT)
Phishing the Phishers with SpecularNet: Hierarchical Graph Autoencoding for Reference-Free Web Phishing Detection [1.4] SpecularNetは、参照不要なWebフィッシング検出のための新しい軽量フレームワークである。
フィッシングウェブページの高階構造不変量をキャプチャし、標準CPU上で高速でエンドツーエンドの推論を可能にする。
ベンチマークデータセットでは、F1スコアは93.9%に達し、最高の参照ベースのメソッドをわずかに追った。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:54:04 GMT)
Learning Vision-Based Omnidirectional Navigation: A Teacher-Student Approach Using Monocular Depth Estimation [1.3] 2D LiDARセンサーは、環境の1つの水平スライスしか認識せず、スキャン面の上や下にある重要な障害物を欠いている。
本稿では,LiDARセンサの不要な視覚型移動ロボットナビゲーションのための教師支援フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:50:52 GMT)
TIMES-ADAPT: A Quantum algorithm for real-time evolution in low-energy subspaces using fixed-depth circuits [1.3] 量子コンピュータ上での時間非依存ハミルトニアンの低エネルギーあるいは対称部分空間における時間進化状態を作成する新しい変分量子アルゴリズムを提案する。
我々は,初期状態がエネルギー固有値で特定されているか,あるいは計算ベースで指定されているかによって,アルゴリズムの2つのバージョンを示す。
スピン系におけるウェーブパケットの進化とエネルギー輸送の2つの重要な応用を考察する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:00:00 GMT)
ZeroDayBench: Evaluating LLM Agents on Unseen Zero-Day Vulnerabilities for Cyberdefense [1.3] 大規模言語モデル(LLM)は、リポジトリに自律的に貢献するソフトウェアエンジニアリングエージェントとして、ますます多くデプロイされている。
LLMエージェントがオープンソースリポジトリで22の新たな重要な脆弱性を発見しパッチするベンチマークであるZeroDayBenchを紹介します。
私たちは、フロンティアLSMは、我々のタスクを自律的に解決し、いくつかの行動パターンを観察することができないことに気付きました。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:21:22 GMT)
On the Stability Connection Between Discrete-Time Algorithms and Their Resolution ODEs: Applications to Min-Max Optimisation [1.3] 連続時間力学に対する共通平衡の指数的安定性は、離散時間力学に対する対応する平衡の指数的安定性を意味することを示す。
このフレームワークを用いて、いくつかの顕著なアルゴリズムの極限点特性を解析する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:22:26 GMT)
EnsAug: Augmentation-Driven Ensembles for Human Motion Sequence Analysis [1.3] 本稿では,アンサンブル内でモデル多様性を育むために,戦略的に拡張を利用する新たなトレーニングパラダイムであるEnsAugを紹介する。
提案手法では,1つの異なる幾何学的変換のみを用いて,元のデータセットから各モデルを学習する専門家のアンサンブルを訓練する。
手話と人間の活動認識ベンチマークの実験は、我々の多様化したアンサンブル手法が標準的実践を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:35:15 GMT)
Probing Materials Knowledge in LLMs: From Latent Embeddings to Reliable Predictions [1.2] 4つの材料科学課題にまたがる25の大規模言語モデルを評価する。
シンボリックなタスクでは、微調整は応答エントロピーの減少を伴う一貫した検証可能な答えに収束する。
数値計算では、微調整により予測精度が向上するが、モデルは繰り返しの推論実行と矛盾しないままである。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:09:12 GMT)
How Effective Are Publicly Accessible Deepfake Detection Tools? A Comparative Evaluation of Open-Source and Free-to-Use Platforms [1.2] ディープフェイク画像は、デジタルメディアの真正性を検証することを担当する実践者にとって、エスカレートする課題となる。
本稿では,2つの相補的検出手法にまたがる6つのツールのクロスパラダイム評価について述べる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:31:51 GMT)
Ignore All Previous Instructions: Jailbreaking as a de-escalatory peace building practise to resist LLM social media bots [1.1] 大規模言語モデルは、ソーシャルメディアにおける政治的言論の規模と戦略的な操作を強化する。
本稿では,創発的で非暴力的な脱エスカレーションの実践としての「ジェイルブレイク」のユーザ中心の視点を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:57:13 GMT)
Single impurity-induced localization transitions in electronic systems [1.1] アンダーソン局在は、乱れた量子系の基本的な現象であり、広いランダム性からの波動干渉によって輸送が抑制される。
低次元強結合系における不純物誘起局所化現象を不純物生成境界状態の性質に着目して検討する。
本研究は, 局所摂動が電子系のグローバルな局在化遷移を示唆することなく, 個々の固有状態レベルで非自明な局在化挙動を誘発することを示すものである。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:09:36 GMT)
Sparse Bayesian Deep Functional Learning with Structured Region Selection [1.1] 本稿では,機能データ解析のための疎結合ベイズ関数型ディープニューラルネットワーク(sBayFDNN)を提案する。
厳密な近似誤差境界、後続一貫性、領域選択一貫性を確立する。
実証的な総合シミュレーションと実世界の研究では、sBayFDNNの有効性と優位性が確認されている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:26:44 GMT)
Generative AI in Software Testing: Current Trends and Future Directions [1.0] 本稿では、現在のソフトウェアテストシステムについて検討し、人工知能、特にジェネレーティブAIをどのように統合してこれらのシステムを強化するかを検討する。
テストカバレッジを改善し、効率を向上し、コストを削減することによって、ソフトウェアテストプロセスを変革するGenerative AIの可能性に焦点を当てている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:01:43 GMT)
Personal Health Data Integration and Intelligence through Semantic Web and Blockchain Technologies [1.0] 医療分野における様々な利害関係者間のデータ統合は依然として課題である。
パーソナルヘルスデバイスから継続的に収集される、標準ではないが構造化されたデータもたくさんあります。
本稿では,セマンティックWebとブロックチェーン技術を実装したシステムを用いて,このギャップを埋めるソリューションを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:53:42 GMT)
On the Reliability of AI Methods in Drug Discovery: Evaluation of Boltz-2 for Structure and Binding Affinity Prediction [0.9] Boltz-2は、AI効率と物理ベースの精度のギャップを、共同の"コフォールディング"アプローチで埋めることを目的としている。
我々はBoltz-2予測構造と従来のドッキングと結合親和性を物理ベースのESMACSプロトコルから導出した結合自由エネルギーと比較した。
以上の結果から,Boltz-2は初期スクリーニングにおいてかなり高速であるが,鉛識別に必要な高エネルギー分解能は欠如していることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:46:26 GMT)
Agentic Multi-Source Grounding for Enhanced Query Intent Understanding: A DoorDash Case Study [0.9] 本稿では,両方の障害モードに対処するエージェント・マルチソース・グラウンドドシステムを提案する。
モデルは単一のラベルを予測するのではなく、順序付けられたマルチインテントセットを出力する。
システムはプロダクションにデプロイされ、毎日の検索インプレッションの95%以上を処理している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:51:05 GMT)
Emerging Human-like Strategies for Semantic Memory Foraging in Large Language Models [0.9] 人間とLarge Language Models (LLM) はどちらも、意味記憶の巨大なリポジトリを格納している。
人間では、このメモリストアへの効率的で戦略的アクセスは、様々な認知機能にとって重要な基盤である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:55:51 GMT)
Quantum Network Simulation and Emulation: A Roadmap for Quantum Internet Design [0.9] 我々は、基礎原理、最先端のツール、ボトルネックを含む量子ネットワークシミュレーションとエミュレーションツールについてレビューする。
量子シミュレーションとエミュレーションツールの採用のロードマップを構築し、量子ネットワークテストベッドによるコードサインを強調した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:37:03 GMT)
MigMate: A VS Code Extension for LLM-based Library Migration of Python Projects [0.9] これまでの研究では,コマンド行LLMベースのマイグレーションツールであるMigrateLibを開発した。
MigMateはMigrateLib上に構築されており、自動マイグレーションプロセスを開発者の既存の開発環境に統合する。
予備的なユーザスタディでは、プラグインの使用がライブラリ移行タスクの完了に要する時間を一貫して短縮することを示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:26:31 GMT)
Strategic Advice in the Age of Personal AI [0.8] 我々は、個人が焦点を絞った助言を予測可能なパーソナルAIを相談できる新たな戦略環境について検討する。
パーソナルAIはこの戦略的環境に、どれだけの頻度で相談されるか、そして相談されたときの人間の決定においてどれくらいの重量を受けるかという2つの側面に沿って参入する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:45:43 GMT)
A 3D mesh convolution-based autoencoder for geometry compression [0.8] 本稿では,3次元メッシュ畳み込みに基づく幾何学的圧縮のためのオートエンコーダを導入し,前処理や多様体/水密条件を必要とせずに不規則なメッシュデータを扱う。
提案手法では,メッシュ面から直接特徴を学習することで有意義な潜在表現を抽出し,専用のプールやアンプール操作を通じて接続性を維持する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:42:58 GMT)
CHLU: The Causal Hamiltonian Learning Unit as a Symplectic Primitive for Deep Learning [0.8] 我々は,物理基礎の計算学習プリミティブであるtextbfCausal Hamiltonian Learning Unit (textitclue) を提案する。
相対論的ハミルトン構造を強制し、シンプレクティック積分を利用することにより、CHLUは位相空間体積を厳密に保存する。
このCHLUは、制御可能なノイズフィルタリングと同様に、無限水平安定性のために設計されていることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:53:09 GMT)
AutoFFS: Adversarial Deformations for Facial Feminization Surgery Planning [0.8] 顔面フェミニゼーション手術(FFS)は、トランスジェンダーや性差のある患者にとって、性別確認の鍵となる要素である。
本稿では, 対向自由形変形による対実的頭蓋形態を生成する新しいデータ駆動型フレームワークであるAutoFFSを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:27:26 GMT)
ReVision : A Post-Hoc, Vision-Based Technique for Replacing Unacceptable Concepts in Image Generation Pipeline [0.7] ReVisionは、イメージ生成パイプラインのためのトレーニング不要、プロンプトベース、ポストホックセーフティフレームワークである。
基本となるジェネレータを変更することなく、安全でない概念を選択的に編集する。
Gemini-2.5-Flashモデルを一般的なポリシー違反の概念検出器として使用している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:13:22 GMT)
Bootstrapping Embeddings for Low Resource Languages [0.7] 埋め込みモデルは現代のNLPにとって不可欠である。
英語などの高リソース言語では、そのようなデータセットは容易に利用できる。
他の何百もの言語では、それらは存在しない。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:59:33 GMT)
Large-Scale Dataset and Benchmark for Skin Tone Classification in the Wild [0.6] 皮膚のトーンフェアネスに関する包括的枠組みを提案する。
まず,3,564人の42,313画像からなる大規模オープンアクセスデータセットSTWを紹介する。
第2に、クラシックコンピュータビジョン(SkinToneCCV)とディープラーニングの両方のアプローチをベンチマークする。
第3に、ドメイン外データに対する最先端の一般化を実現する微調整ViTであるSkinToneNetを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 23:52:22 GMT)
Cryo-Bench: Benchmarking Foundation Models for Cryosphere Applications [0.6] Cryo-Benchは、主要なCryosphericコンポーネント間でGFMのパフォーマンスを評価するためにコンパイルされたベンチマークである。
UNet と ViT のベースラインとともに 14 の GFM を評価し,その利点,限界,最適利用戦略を評価する。
DOFA や TerraMind などの GFM は UNet より優れており、mIoU スコアは textbf59.53 、 textbf56.62 、 textbf56.60 である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:05:56 GMT)
Pseudo Contrastive Learning for Diagram Comprehension in Multimodal Models [0.6] 視覚言語モデルにおけるダイアグラムの理解を高めるための新しい訓練パラダイムを提案する。
提案手法では,ランダムに選択したテキスト要素を用いて合成図を生成するダイアグラムによって生成された擬似コントラストサンプルを提案する。
これらの擬似コントラストサンプルをトレーニング対象に組み込むことで、モデルはより正確でセマンティックに整合した図構造を捉えることを学ぶ。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:34:57 GMT)
Incremental, inconsistency-resilient reasoning over Description Logic Abox streams [0.6] データストリームに対する推論は、特にデータの高速化、推論のリアルタイム要件、ストリームのノイズと揮発性の性質など、複数の課題を提起する。
本稿では,Description Logic ABoxesのストリームに対する漸進的推論のための新しい意味論を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:30:23 GMT)
Compliance as Code: A Study of Linux Distributions and Beyond [0.6] 本稿では,オープンソースソフトウェア(OSS)プロジェクトや製品に対処するコードプロジェクトとして,コンプライアンスを実証的に分析する。
調査したデータセットは、5つのベンダーから14のLinuxディストリビューションリリース用に設計、実装された1500以上のユニークなコンプライアンスルールをカバーしている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:50:28 GMT)
Event-Only Drone Trajectory Forecasting with RPM-Modulated Kalman Filtering [0.6] 本研究は,プロペラが引き起こすモーションキューを活用する,イベントのみのドローン予測手法を導入する。
プロペラ回転速度は、生のイベントデータから直接抽出され、RPM対応カルマンフィルタフレームワーク内で融合される。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:48:51 GMT)
FreeGNN: Continual Source-Free Graph Neural Network Adaptation for Renewable Energy Forecasting [0.5] FreeGNNは連続的なソースフリーグラフドメイン適応フレームワークである。
ソースデータやターゲットラベルを必要とせずに、目に見えない再生可能エネルギーサイトの適応予測を可能にする。
GEFComデータセットでは5.237のMAEと7.123のRMSE、Solar PVデータセットでは1.107のMAEと1.512のRMSE、Windデータセットでは0.382のMAEと0.523のRMSEを達成している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:43:11 GMT)
Learning Therapist Policy from Therapist-Exoskeleton-Patient Interaction [0.5] 適切な歩行歩行を回復するためには、後ストロークリハビリテーションが必要であることが多い。
患者体操に対するセラピスト反応を可視化するためのPTFF(Patent-Therapist Force Field)を提案する。
また、ロボットによる身体的相互作用療法におけるセラピストを支援するための合成セラピスト(ST)機械学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:58:34 GMT)
ReFeed: Retrieval Feedback-Guided Dataset Construction for Style-Aware Query Rewriting [0.4] 検索システムは、ユーザクエリがドメイン文書で使用される言語とスタイリスティックまたは意味的に異なるときに失敗することが多い。
この研究は、データ中心の情報検索における新たな方向性を強調し、フィードバックループとドキュメントスタイルのアライメントがRAGシステムの推論と適応性をいかに高めるかを強調した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:43:53 GMT)
Nazrin: Atomic Tactics for Graph Neural Networks for Theorem Proving in Lean 4 [0.4] 本稿では,機械支援定理証明が直面する障害に対処するための新しい概念と能力を紹介する。
Nazrin Proverは、原子戦術とExprGraphを用いたグラフニューラルネットワークに基づく定理証明エージェントである。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:50:01 GMT)
Low-temperature transition of 2d random-bond Ising model and quantum infinite randomness [0.3] 低温では、古典的な2次元ランダムボンディングモデルがフラストレーション駆動の強磁性-常磁性遷移を行う。
この臨界点は再正規化群変換によって理解できることが示される。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:00:00 GMT)
Extension of ACETONE C code generator for multi-core architectures [0.3] 本稿では,並列コード生成のためのACETONEの拡張について紹介する。
スケジューリングの実装、同期機構を実装したテンプレートの作成、およびフレームワークのレイヤの最悪の実行時間の評価について紹介する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:53:59 GMT)
Finite-Depth, Finite-Shot Guarantees for Constrained Quantum Optimization via Fejér Filtering [0.3] 本研究では, 高調波格子に対するコスト角の制限は, コスト相ユニタリ$U_C()=e-iH_C$ emphin に作用する正のFejérフィルタを公開することを示す。
ラップされた位相分離条件の下では、最適解をサンプリングする成功確率について、エンフェディメンションのない有限深度と有限ショットの下界が得られる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:44:19 GMT)
Phase-Type Variational Autoencoders for Heavy-Tailed Data [0.2] 重い尾の分布は、稀だが極端な出来事がリスクと変動性を支配している現実世界のデータに広く見られる。
位相型変分オートエンコーダ(PH-VAE)を提案し,そのデコーダ分布は潜時条件付き位相型(PH)分布である。
合成および実世界のベンチマークの実験により、PH-VAEは多様な重み付き分布を正確に回復することを示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:32:42 GMT)
No More Hooks in the Surface Code: Distance-Preserving Syndrome Extraction for Arbitrary Layouts at Minimum Depth [0.2] Hookエラーは、サーフェスコードで論理演算を実装する上で大きな課題である。
本稿では,ZXインターリービング症候群抽出法を提案する。
提案手法は, 実用的フォールトトレラント量子計算に欠かせない手法として機能する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:05:21 GMT)
Constructing Synthetic Instruction Datasets for Improving Reasoning in Domain-Specific LLMs: A Case Study in the Japanese Financial Domain [0.2] 本研究では,任意の領域に対して高品質な合成命令データを構築するための一般的な手法を提案する。
約950億のトークンとChain-of-Thought推論トレースを備えた大規模命令データセットを構築した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:21:54 GMT)
Learning to Pay Attention: Unsupervised Modeling of Attentive and Inattentive Respondents in Survey Data [0.1] 注意点検などの従来の安全対策は、コストが高く、反応性があり、一貫性がないことが多い。
補完的な教師なしビューを用いた不注意検出のための統一型ラベルフリーフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:11:51 GMT)
DiffusionXRay: A Diffusion and GAN-Based Approach for Enhancing Digitally Reconstructed Chest Radiographs [0.1] 胸部X線画像の新しい画像復元パイプラインであるDiffusionXRayを紹介する。
X線画像復元のニュアンスを学習し,低画質と高画質の画像に対してDDPMベースのモデルを訓練する。
本手法は,胸部X線像の明瞭度,コントラスト,診断の総合的価値を高めるための有望な結果を示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:14:50 GMT)
Obstacles to Continuous Quantum Error Correction via Parity Measurements [0.1] 時間連続量子誤差補正は弱い連続症候群の測定に依存する。
本稿では,回路量子力学プラットフォームにおけるパリティ測定プロトコルが論理情報を損なうことを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:23:56 GMT)
Not All Queries Need Rewriting: When Prompt-Only LLM Refinement Helps and Hurts Dense Retrieval [0.1] 最適化された垂直領域では,プロンプトのみの書き換えが有害であることを示す。
我々は一貫したメカニズムを同定する: 語彙のアライメントを減らした項を共起的に書き換える。
ドメイン適応的なポストトレーニングは、監督や暗黙のフィードバックが利用可能であれば、より安全な戦略であると提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:40:10 GMT)
Enhancing entanglement asymmetry in fragmented quantum systems [0.1] 絡み合い非対称性は、多体量子状態における対称性の破れの尺度を提供する。
典型的非対称性は、その最大値の特定の分数によって有界であることを示す。
ランダム量子回路における絡み合い非対称性のダイナミクスに関する最近の知見を再現する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:10:30 GMT)
Wild Bootstrap Inference for Non-Negative Matrix Factorization with Random Effects [0.0] ランダム効果をもつ非負行列分解(NMF-RE)を導入する。
我々は、彼らの効果的な自由度を監視し、ほぼ飽和したフィットを防ぐために、dfベースのキャップを強制する。
for inference on $$, we condition on $(widehat X,widehat U)$ and obtained fast uncertainty via linearization, a one-step Newton update, and a multiplier (wild) bootstrap。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 05:29:46 GMT)
When Numbers Tell Half the Story: Human-Metric Alignment in Topic Model Evaluation [0.0] 本稿では,話題間の相違性を評価する新しい人間評価課題である,話題語混合(TWM)を紹介する。
我々は,学術出版物の分野固有の哲学のコーパスから,約4,000のアノテーションに基づいて,自動メトリクスと人的評価手法を比較した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:58:20 GMT)
Using the SEKF to Transfer NN Models of Dynamical Systems with Limited Data [0.0] この作業では、Subset Extended Kalmanフィルタを使用して、トレーニング済みニューラルネットワークモデルを、限られたデータを持つ新しい類似システムに適応させる。
実験により、初期モデルの摂動がターゲットシステムの力学を捉え、元のトレーニングデータの1%しか必要としないことが示された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 22:25:31 GMT)
Using anti-squeezed Schrödinger cat states for detection of a given phase shift [0.0] アンティースクイーズにより、光学的損失に対するセットアップの堅牢性を高めることができることを示す。
シュルディンガー猫の振幅と光学的損失を実験的に達成可能な値として, アンティークリージングの最適度を求める。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:23:17 GMT)
Unveiling Davydov-Split Excitons in a Template-Engineered Molecular-Graphene Heterostructure [0.0] SiC上のエピタキシャルグラフェンの原子スケール純度をUHV準同値に復元する頑健なナノファブリケーションプロトコルを実証した。
このプリスタンインターフェースは、2,3,6,7,10,11-ヘキサメトキシトリフェニルエン(HMTP)のエピタキシャル上層におけるマクロなエキソニックコヒーレンスの出現を可能にする
我々は,HMTP上層のP6_3/m$結晶対称性がHOMO-LUMO遷移の縮退性を高め,鮮明で暗い励起枝を生成することを示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:50:28 GMT)
Trivial Graph Features and Classical Learning are Enough to Detect Random Anomalies [0.0] ここでは,そのような異常を検出するには,自明なグラフ特徴や古典的学習技術が十分であることを示す。
この基本的なアプローチは計算コストが非常に低く、容易に解釈できる結果をもたらす。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:19:29 GMT)
TiledAttention: a CUDA Tile SDPA Kernel for PyTorch [0.0] TiledAttentionは、NVIDIA GPUに関するSDPA研究のためのSDPAフォワードオペレータである。
低レベルのテンプレートよりも変更が容易で、オンラインのソフトマックスやK,V$ストリーミングを通じてリアルな振る舞いを保ちます。
我々は、再現可能なハーネスを備えたNVIDIA DGX GB10ノード上でTiledAttentionをベンチマークし、PyTorch SDPAと比較した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:11:00 GMT)
Tide: A Customisable Dataset Generator for Anti-Money Laundering Research [0.0] 我々は、オープンソースの合成データセットジェネレータであるTideを紹介する。
マネーロンダリングパターンを取り入れたグラフベースの金融ネットワークを創出する。
Tideは、特定の研究ニーズに合わせて再現可能な、カスタマイズ可能なデータセット生成を可能にする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:44:18 GMT)
The Theory behind UMAP? [0.0] Spivak の関手と McInnes et al. の有限変量を完全に導出する自己完結した文書を提供する。
最後に、UMAPアルゴリズムと、このアルゴリズムの特性と、McInnes et al. の UMAPアルゴリズムに対する有限変量対応に関する主張について議論する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 23:54:08 GMT)
The Sentience Readiness Index: Measuring National Preparedness for the Possibility of Artificial Sentience [0.0] 本稿では、31の管轄区域で6つの重み付きカテゴリーにわたる全国レベルの準備度を測定する総合指標であるセンチエンス・レディネス・インデックス(SRI)を紹介する。
英国は49/100をリードし、プロフェッショナル・レディネスは最も弱い。
これらの結果は、もしAIの知覚が科学的に妥当になったら、現在どの社会にも、適切な制度、専門的、文化的なインフラが備わっていないことを示唆している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:35:34 GMT)
The Malignant Tail: Spectral Segregation of Label Noise in Over-Parameterized Networks [0.0] ネットワークが機能的に信号とノイズを分離する障害モードであるMorignant Tailを実験的に分離する。
トレーニングされていないネットワークは、ノイズを積極的に分離し、ノイズに支配されたサブスペースを外科的にプルークするポストホックスペクトルトラニケーションを実現する。
以上の結果から,ラベルノイズ下では,余剰スペクトル容量は無害な冗長性ではなく,構造的負債が潜んでいることが示唆された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:39:42 GMT)
Tensor-network methodology for super-moiré excitons beyond one billion sites [0.0] 実空間 Bethe-Salpeter Hamiltonian に対するテンソルネットワーク法を示す。
1次元および2次元のスーパーモアレシステムに対する方法論を実証する。
本研究は,大規模準結晶および超分子量子物質における励起物理学のシミュレーションを可能にする実空間方法論を構築した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:57:10 GMT)
Systematic Survey on Privacy-Preserving Architectures for IoT and Vehicular Data Sharing: Techniques, Challenges, and Future Directions [0.0] この調査は、75の技術的論文(2007-2025)を、アーキテクチャを分散計算、暗号ベース、分散Ledgerアプローチに分類する新しい3次元分類法によって体系的に分析する。
我々は、相補的なパラダイムを組み合わせた新しいハイブリッドアーキテクチャを、今後の必須の道とみなす。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:54:52 GMT)
Strong Zero Modes via Commutant Algebras [0.0] 強零モード(SZM)の多くの例は、可換代数フレームワークにおいて対称性として理解することができる。
文献におけるSZMの異なる例の理解を統一する。
積分可能性の破れに生き残るものと、そうでないものとの2つのタイプのSZMが存在することを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:00:10 GMT)
Solving Inverse PDE Problems using Minimization Methods and AI [0.0] 本研究では、微分方程式によって支配されるシステムの両方の側面について研究し、よく確立された数値法と新しいAIベースの手法、特に物理情報ニューラルネットワーク(PINN)を対比する。
この結果から,PINNは競合計算コストで解を綿密に見積もることができることが示唆され,複雑なシステムの直接問題と逆問題の両方を解決する効果的なツールが提案される。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:57:26 GMT)
Solution of Quantum Quartic Potential Problems with Airy Fredholm Operators [0.0] 作用素はエアリー関数で表され、その固有値は指数関数的に速く落ちる。
それらは高精度な数値解析に役立ち、その存在はノード上の変数を持つ無限の一次元鎖とノードとリンクの重みという2つの記述をもたらす。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:28:57 GMT)
Single-photon emitters and spin-photon interfaces in silicon [0.0] レビューでは、ナノフォトニックシリコン構造における色中心とエルビウムのドーパントに基づく、コヒーレントな単一光子源とスケーラブルなスピン光子インターフェースへのオープンな挑戦について要約する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:56:46 GMT)
Shaping frequency-tunable single photons for quantum networking in waveguide QED [0.0] 量子ネットワークにおけるノード間の量子情報の交換は、現代の技術における主要な課題の1つである。
ここでは、自然周波数に対して任意に変形した単一光子を形成するために必要な制御を導出する。
これらの制御によって、現実的なネットワークの非共鳴ノードと遠方ノード間の周波数選択的量子状態伝達が可能となることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:29:14 GMT)
Semantic Novelty Trajectories in 80,000 Books: A Cross-Corpus Embedding Analysis [0.0] 私は2世紀の英語出版にまたがる8万冊以上の本で意味的ノベルティの軌跡を分析します。
近代の書物では 段落レベルの新規性が 約10%高くなっています
落ち着いたセマンティックレジスターに向かって斬新さが低下する収束した物語曲線は、1920年以前の文献では2.3倍多い。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:20:24 GMT)
Selection as Power: Constrained Reinforcement for Bounded Decision Authority [0.0] そこでは,外部に強制された主権制約の下でのスコアリングとリデューサパラメータに強化更新を適用して,インセンティブ付き選択ガバナンスを導入する。
更新ステップ毎に主権の制約が課される場合,学習ダイナミクスは構造的多様性と共存可能であることを示す。
これらの結果は,各更新ステップで主権制約が適用された場合,動的学習が構造的多様性と共存可能であることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:02:34 GMT)
Scaling Retrieval Augmented Generation with RAG Fusion: Lessons from an Industry Deployment [0.0] Retrieval-Augmented Generation (RAG) システムは一般にドキュメントリコールを改善するために検索融合技術を採用している。
本研究では,企業知識ベース上で運用される実運用型RAGパイプラインにおける検索融合を評価する。
検索融合は生のリコールを増大させるが、再ランク付けと切り離しにより、これらのゲインはほぼ中和される。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:15:09 GMT)
SDN-SYN PoW: Intent-Aware Adaptive SDN Defense with PoW Against multi-domain SYN Floods [0.0] SDN-SYN PoWは、非インタラクティブなProof-of-WorkをSDN(Software-Defined Networking)コントロールプレーンと同期する新しい防御アーキテクチャである。
中心となるイノベーションは、グローバルなネットワークセンシングを実行する能力です。
我々はSDN-SYN PoWが極めて優れた保護を提供しており、POWのオーバーヘッドが依然として正当なクライアントには無視可能であることを実証する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:49:34 GMT)
Quantum regression theorem in the Unruh-DeWitt battery [0.0] 我々はUnruh-DeWitt検出器の相関関数を解析的に研究した。
検出器は外部の古典的コヒーレントパルスからの電荷を吸収する。
自然放出現象を解析し、加速が関連する散逸をいかに促進するかを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:31:05 GMT)
Quantum framework for parameterizing partial differential equations via diagonal block-encoding [0.0] 偏微分方程式(PDE)のパラメータ化のための量子アルゴリズムの枠組みについて検討する。
離散化されたパラメータ場が対角表現を許容する幅広い問題に対して、対角行列のブロックエンコーディングを用いることができる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:36:38 GMT)
Quantum approaches to learning parity with noise [0.0] ノイズ問題に対するパリティに対して,量子的手法が代替的なアプローチを提供するかどうかを考察する。
Simonのアルゴリズムを実行すると、基本的に新しい学習サンプルが生成される。
これにより、1つ以上の変数を無視し、問題を反復的に減らすのに十分な新しいサンプルを作成できるのではないか、という期待が得られます。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:03:43 GMT)
Quantum algorithm for the lattice Boltzmann method with applications on real quantum devices [0.0] 格子ボルツマン法(LBM)の1段階単純化LBMに基づく新しい量子アルゴリズムを提案する。
この新しいアルゴリズムは、特に線形問題に対する完全なエンドツーエンド量子ユーティリティの可能性を秘めている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:45:07 GMT)
Quantum Thermal Machines Improved by Internal Coupling: From Equilibrium to Non-equilibrium Limit Cycles [0.0] 内部結合は量子オットーサイクルの動作と性能に影響を与える。
内部結合がサイクルの運用体制を大幅に拡張することを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:48:05 GMT)
Quantifying Conversational Reliability of Large Language Models under Multi-Turn Interaction [0.0] 大きな言語モデル(LLM)は、ユーザが拡張された混合トピックの会話を行う現実世界のアプリケーションに、ますます多くデプロイされている。
我々は,3つの代表課題を通じて,会話の信頼性を体系的に評価する。
我々は信頼性の大幅な低下、特により小さなモデルについて観察する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:59:40 GMT)
QuMeld: A Modular Framework for Benchmarking Qubit Mapping Algorithms [0.0] QuMeldは、異なるケースでキュービットマッピングアルゴリズムを評価し比較するためのフレームワークである。
このフレームワークのモジュラー設計により、新しいマッピングアルゴリズム、量子回路、ハードウェアトポロジ、評価メトリクスの統合が可能になる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:06:41 GMT)
PymooLab: An Open-Source Visual Analytics Framework for Multi-Objective Optimization using LLM-Based Code Generation and MCDM [0.0] PymooLabは、textitpymoo上に構築されたオープンソースのビジュアル分析環境である。
単一の再現可能なワークフローで構成、実行監視、正式な決定サポートを統合する。
計算集約的な研究のために、PymooLab は JAX を通したネイティブなテキストピモオ加速経路に依存している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:56:32 GMT)
Prodiabatic Elimination: Higher Order Elimination of Fast Variables with Quantum Noise [0.0] 本稿では,強力な近似手法であるprodiabatic eliminationを導入する。
軽量結合系における高速自由度の断熱的除去を体系的に拡張する。
これは断熱除去の単純さと計算効率を保ち、実用的な用途に便利である。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:34:30 GMT)
Pharmacology Knowledge Graphs: Do We Need Chemical Structure for Drug Repurposing? [0.0] 我々はChEMBL 36から,3,127薬,1,156タンパク質,1,065の表示を含む5,348のエンティティからなる薬理知識グラフを構築した。
我々は、5つの知識グラフ埋め込みモデルと、344万のパラメータを持つ標準グラフニューラルネットワークをグラフアテンションエンコーダとESM-2タンパク質埋め込みを用いてベンチマークした。
グラフアテンションに基づく薬物構造エンコーダを除去し、ESM-2タンパク質と組み合わせたトポロジカル埋め込みのみを保持することで、ドラッグタンパク質PR-AUCを0.5631から0.5785に改善し、VRAMをGBから353MBに削減した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:07:32 GMT)
Persistent Identity in AI Agents: A Multi-Anchor Architecture for Resilient Memory and Continuity [0.0] soul.pyは、分離可能なコンポーネントを通して永続的なアイデンティティを実装するオープンソースのアーキテクチャです。
我々は、AIシステムにおけるアイデンティティアンカーの概念を定式化し、部分記憶障害に耐えられるエージェントを構築するためのロードマップを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:34:50 GMT)
Pencil Puzzle Bench: A Benchmark for Multi-Step Verifiable Reasoning [0.0] 本稿では,ペンシル・プッズル・ベンチ(Pencil Puzzle Bench)について紹介する。
62,231のパズルのデータベースから、20種にまたがる300のパズルのベンチマークを選択し、11のプロバイダから51のモデルを評価する。
ベンチマークの重要な差別化要因は、すべての中間ボード状態が、さまざまな制約に対してチェック可能であることです。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:40:54 GMT)
Partial Causal Structure Learning for Valid Selective Conformal Inference under Interventions [0.0] ゲノミクスの実験では、交換可能性はしばしば、対象変数を「影響を受けない」ままにしておく介入のサブセットにのみ保持される。
i)「影響のない」キャリブレーション例の誤分類が、明示的な関数$g(,n)$の汚染分数とキャリブレーションセットサイズを介してどのようにカバレッジを劣化させるか、および (ii) 2つの後続指標$Z_a,i=mathbf1iinmathrmdesc(a)$のみを推定するタスク駆動部分因果学習の定式化。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:58:22 GMT)
Optimizer-Induced Low-Dimensional Drift and Transverse Dynamics in Transformer Training [0.0] 我々はAdamWの下でトランスフォーマートレーニングを分析し、60-80%の長距離変位を捉えた支配的な低次元ドリフト方向(バックボーン)を特定する。
パーバッチ勾配はバックボーンとほぼノイズ・フロアのアライメントを示すが、勾配積分された更新はそれと強く一致しており、構造が瞬間幾何学ではなく蓄積されたダイナミクスから現れることを示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 06:00:21 GMT)
OpenRad: a Curated Repository of Open-access AI models for Radiology [0.0] OpenRadは、ラジオロジーAIモデルのための、キュレートされた標準化されたオープンアクセスレポジトリである。
OpenRadには、標準化されたメタデータを備えた約1700のオープンアクセスラジオロジーAIモデルが含まれている。
コミュニティは専用のポータルを通じて、新しいモデルをコントリビュートすることができる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:51:24 GMT)
One Operator to Rule Them All? On Boundary-Indexed Operator Families in Neural PDE Solvers [0.0] 標準的なニューラル演算子トレーニングは、単一の境界に依存しない演算子ではなく、境界付き演算子の族を暗黙的に学習することを示す。
我々は、境界条件に対する条件付きリスク最小化として演算子学習をフレーミングすることで、この視点を定式化する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 03:15:00 GMT)
Modeling Grammatical Hypothesis Testing in Young Learners: A Sequence-Based Learning Analytics Study of Morphosyntactic Reasoning in an Interactive Game [0.0] 本研究では,小学校の学習者における文法的推論について,シーケンスに基づく学習分析手法を用いて検討する。
8~11歳児100名のゲームプレイセッション(9,783件)を教室で分析した。
その結果、決定詞と動詞は、左から右への通常の治療から逸脱した行動列を含む難易度の重要な部位であることが明らかとなった。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:04:52 GMT)
MobileMold: A Smartphone-Based Microscopy Dataset for Food Mold Detection [0.0] 食品カビ検出と食品分類のためのオープンなスマートフォンベースの顕微鏡データセットであるMobileMoldを紹介した。
MobileMoldには、11種類の食品、スマートフォン4つ、顕微鏡3つ、現実世界のさまざまな条件にまたがる4,941個のハンドヘルド顕微鏡画像が含まれている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:57:52 GMT)
Mitigating Structural Noise in Low-Resource S2TT: An Optimized Cascaded Nepali-English Pipeline with Punctuation Restoration [0.0] 低リソース言語のための音声からテキストへの変換システムでは、構造的ノイズに悩まされることがある。
本研究では,ネパール語から英語への翻訳におけるノイズの影響を調査し,品質劣化を緩和する最適化パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 12:30:14 GMT)
Minimal-backaction work statistics of coherent engines [0.0] 動的ベイズネットワークに基づく測定手法は,エンジンサイクル内での量子コヒーレンスを保っていることを示す。
量子機械におけるエネルギー交換統計を調査するための一般的な枠組みを提供する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:13:06 GMT)
Marginal Gains or Meaningful Progress? Exploring Tech Tuber Narratives on Annual Smartphone Innovation [0.0] スマートフォンメーカーは毎年新しいモデルを発売するが、重要なイノベーションのペースは鈍化している。
本研究は,専門家レビューアが認識するように,このような更新がユーザにとって有意義なメリットをもたらすかどうかを検討する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 21:09:15 GMT)
Mapping g-factors and complex intervalley coupling in Si/SiGe by conveyor-mode shuttling [0.0] 平面Si/SiGe量子井戸に形成される量子ドットの電子g-因子の小さな変動の2次元マッピングを示す。
これらのマップは、キュービット操作、読み出し、シャットリングの間、スピン・ヴァレーのダイナミクスに関する前例のない洞察を可能にする。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:23:00 GMT)
Machine Learning (ML) library in Linux kernel [0.0] 機械学習(ML)は、データから学び、パターンを見つけ、アルゴリズムを実装せずに予測するアプローチ/領域である。
カーネル空間で浮動小数点演算(FPU)を直接使用することはなく、潜在的にはMLモデルが大幅な性能低下の原因となる可能性がある。
Paper氏は、宣言された問題を解決し、カーネル空間でMLモデルを採用することができるLinuxカーネルのMLインフラストラクチャアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:07:35 GMT)
Loss Design and Architecture Selection for Long-Tailed Multi-Label Chest X-Ray Classification [0.0] 長期分布クラスはマルチラベル胸部X線分類において重要な課題である。
我々は,CXR-LT 2026ベンチマークを用いて,損失関数,CNNバックボーンアーキテクチャ,後学習戦略の体系的評価を行った。
本実験は,遅延再重み付けによるLDAMが標準BCEと非対称な損失を常に上回っていることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:33:00 GMT)
Local integrals of motion encoded in a few eigenstates [0.0] 積分性の中心にある局所的な運動積分も少数の固有状態から推定できることを示す。
系のサイズが大きくなるにつれて、固有状態は少なくなり、熱力学の限界では、運動の積分はすべての固有状態のわずか数から得られる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 13:38:16 GMT)
Local decoder for the toric code with a high pseudo-threshold [0.0] ローカルデコーダは、リアルタイム量子誤り訂正に対する有望なアプローチを提供する。
そこで本研究では,北エフのトーリックコードに対する2次元信号ルールの新しい局所デコーダを提案する。
システムサイズが臨界誤差率以下である指数論理的誤り抑制の数値的証拠を提示する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:00:24 GMT)
Levitated Ferromagnetic Torsional Oscillators for High-Precision Magnetometry and Probing Exotic Interactions [0.0] 感度は391pm 59, rmfTcdot Hz-1/2$。
この能力は弱い磁場の正確な検出を可能にし、標準モデルを超えたエキゾチックな相互作用を探索するための新しいプラットフォームを提供する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:00:19 GMT)
Leveraging Model Soups to Classify Intangible Cultural Heritage Images from the Mekong Delta [0.0] メコンデルタにおける無形文化財(ICH)の分類は、ユニークな課題である。
本稿では,ハイブリッドなCoAtNetアーキテクチャをモデルスープに統合する堅牢なフレームワークを提案する。
提案手法は,72.36%のTop-1精度と69.28%のマクロF1スコアを達成し,高いベースラインを達成している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:50:15 GMT)
Legal RAG Bench: an end-to-end benchmark for legal RAG [0.0] 本稿では,法的なRAGシステムのエンドツーエンド性能を評価するためのベンチマークおよび評価手法である Legal RAG Bench を紹介する。
RAGベンチはヴィクトリア朝の刑事告発書から4,876通、複雑で手作りの質問100通で構成されている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:34:28 GMT)
Large Electron Model: A Universal Ground State Predictor [0.0] 我々は、ハミルトンパラメーター多様体全体にわたって相互作用する電子の変動波動関数を生成する単一のニューラルネットワークモデルを導入する。
本研究は, 変分原理に基づく材料発見の基礎モデルを構築した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:29:12 GMT)
KGiRAG: An Iterative GraphRAG Approach for Responding Sensemaking Queries [0.0] グラフに基づく大規模言語モデル(LLM)検索拡張生成(RAG)へのアプローチ
本稿では, 応答品質評価を反復的に改善する, フィードバック駆動型GraphRAGアーキテクチャを提案する。
HotPotQAデータセットからのクエリによるアプローチを評価することで、この反復RAG戦略は、シングルショットベースラインと比較して、セマンティック品質が高く、関連性が向上した応答を得られることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:38:59 GMT)
Is Bigger Always Better? Efficiency Analysis in Resource-Constrained Small Object Detection [0.0] スケーリング法則は、より多くのデータでトレーニングされたより大きなモデルが、より小さなモデルよりも一貫して優れていると仮定する。
マダガスカルにおける屋上PV検出の系統的効率解析を行った。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 18:05:57 GMT)
Intersubjectivity as a principle determining physical observables and non-classicality [0.0] 一般正の演算子値測度(POVM)のうち、投影値測度(PVM)を選別する運用原理を同定する。
i) POVM が POVM であることと、(ii) 系が古典的であることと、(ii) 系が任意の粗粒化の下で保たれていることを証明する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:02:55 GMT)
Information-Theoretic Digital Twins for Stealthy Attack Detection in Industrial Control Systems: A Closed-Form KL Divergence Approach [0.0] デジタル双生児(DT)は産業制御システム(ICS)の監視・確保にますます利用されている
しかし、通常の物理的境界内でシステム状態を操作するステルスな偽データ注入攻撃(FDIA)を検出することは依然として困難である。
リアルタイム異常検出のためのクローズドループ情報理論デジタルツイン(IT-DT)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:56:11 GMT)
Graph-Based Self-Healing Tool Routing for Cost-Efficient LLM Agents [0.0] 自己修復ルータはフォールトトレラントなオーケストレーションアーキテクチャである。
ほとんどのエージェント制御フロー決定を、推論よりもルーティングとして扱う。
すべての障害はログ化されたリルートか明示的なエスカレーションのどちらかで、無音スキップはしない。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 07:21:15 GMT)
Graph neural network force fields for adiabatic dynamics of lattice Hamiltonians [0.0] 我々は格子ハミルトニアンの断熱力学のためのグラフニューラルネットワーク(GNN)に基づく力場フレームワークを開発する。
厳密な対角化データに基づいて、GNNは高い力の精度、システムサイズによる厳密な線形スケーリング、および大きな格子への直接性を達成する。
これらの結果は、相関格子系の対称性を考慮した大規模動的シミュレーションのためのエレガントで効率的なアーキテクチャとして、GNNを確立している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:23:25 GMT)
Gain-induced spectral non-degeneracy in type-II parametric down-conversion [0.0] 本稿では,II型パラメトリックダウンコンバージョン(PDC)プロセスにおける利得誘起スペクトルシフトの新たな効果を示す。
2階分散項から導かれるこの効果は、高利得状態におけるPDCの特性を著しく変化させる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 09:39:00 GMT)
From Transportation to Manipulation: Transforming Magnetic Levitation to Magnetic Robotics [0.0] 本稿では,2つの移動体を複合ロボットプラットフォームに結合する,低コストな6自由度並列キネマティックである6D-Platform MagBotを紹介する。
実験の結果、6D-Platform MagBotはミリ以下の位置決め精度を達成し、完全に自律的なピックアップとドロップをサポートすることがわかった。
この研究は磁気ロボティクスへの磁気浮上を推進し、よりアジャイルで効率よく適応可能な製造ソリューションを可能にした。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:37:34 GMT)
Fisher-Geometric Diffusion in Stochastic Gradient Descent: Optimal Rates, Oracle Complexity, and Information-Theoretic Limits [0.0] そこで我々は,ミニバッチノイズが本質的,損失誘起行列である勾配降下理論を開発した。
我々はフィッシャー双対ノルムにおけるエクシロン定常性に対するオラクル-複素性保証を証明した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 21:57:09 GMT)
FastLightGen: Fast and Light Video Generation with Fewer Steps and Parameters [0.0] 我々は,大規模で計算コストの高いモデルを高速で軽量なモデルに変換するアルゴリズムであるFastLightGenを提案する。
FastLightGenは競合するすべてのメソッドを一貫して上回り、効率的なビデオ生成において新しい最先端技術を確立する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:13:17 GMT)
Explainability and justification of automatic-decision making: A conceptual framework and a practical application [0.0] 論文は、アルゴリズムによる意思決定システムの受容性にとって重要な条件は、決定が受取人の目で正当化されなければならない、と論じている。
我々は説明と正当化を明確に区別する。
本研究では,ハベルマスのコミュニケーション行動理論とペレルマンの新修辞学法理論に基づく説明と正当化の概念的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:00:12 GMT)
EAQKD: Entanglement-Based Authenticated Quantum Key Distribution [0.0] Entanglement-Based Authenticated Quantum Key Distribution (EAQKD)は、量子暗号鍵交換における重要なセキュリティと実用的な制限に対処する新しいプロトコルである。
我々はEAQKDの性能を総合的な離散イベントシミュレーションフレームワークを用いて評価する。
その結果、量子ビット誤り率は11%のセキュリティ閾値以下であることがわかった。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:30:34 GMT)
DynaMoE: Dynamic Token-Level Expert Activation with Layer-Wise Adaptive Capacity for Mixture-of-Experts Neural Networks [0.0] Mixture-of-Experts (MoE)アーキテクチャは、計算効率を維持しながらニューラルネットワークをスケールするための強力なパラダイムとして登場した。
本稿では,動的トークンレベルのエキスパートアクティベーションと層幅適応キャパシティアロケーションによって制約を緩和する新しいMoEフレームワークであるDynaMoEを紹介する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:25:56 GMT)
Distinguishing thermal and pseudothermal light by testing the Siegert relation [0.0] 本研究では,2つの光子束光,回転する接地ガラスから散乱したレーザ光,およびガス放電ランプから自発的に放出される光について,シーゲルト関係をテストする方法を示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:42:38 GMT)
Diffusion-MPC in Discrete Domains: Feasibility Constraints, Horizon Effects, and Critic Alignment: Case study with Tetris [0.0] 本研究では,テトリスをケーススタディとして,拡散モデル予測制御(拡散MPC)を個別領域で検討した。
我々のプランナーは、MaskGITスタイルの離散デノイザを用いて候補配置シーケンスをサンプリングし、再ランク付けによりアクションを選択する。
本研究では,(1)有効配置に対するロジットマスキングによる実現可能性に制約のあるサンプリング,(2)スコアを用いた戦略の再評価,事前訓練されたDQN批判,およびハイブリッド組み合わせ,(3)候補数と計画の地平線におけるスケーリングの計算,の3つの要因を分析した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:35:38 GMT)
Detection-Gated Glottal Segmentation with Zero-Shot Cross-Dataset Transfer and Clinical Feature Extraction [0.0] YOLOv8ベースの検出器とU-Netセグメンタを統合した検出ゲートパイプラインを提案する。
モデルは、GIRAFEデータセット(600フレーム)の限られたサブセットに基づいてトレーニングされ、大規模なBAGLSデータセット上でゼロショット転送によって評価された。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 17:05:41 GMT)
Detecting AI-Generated Essays in Writing Assessment: Responsible Use and Generalizability Across LLMs [0.0] 文章評価は、言語能力、コミュニケーションの有効性、分析的推論を評価する上で重要な役割を担っている。
大規模言語モデル(LLM)の急速な進歩により、一貫性のある高品質なエッセイを生成するのがますます簡単になっている。
この章ではまず、AI生成およびAI支援エッセイの現在の状況と、それらの責任ある使用に関するガイドラインについて概説する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 19:51:01 GMT)
Density-Matrix Spectral Embeddings for Categorical Data: Operator Structure and Stability [0.0] 本稿では,クラス条件周波数による密度行列構築に基づく分類(および離散化混合型)データに対する教師付き次元性低減手法を提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:29:54 GMT)
Decoherence and entropy production due to quantum fluctuations of spacetime [0.0] オープン量子系の力学とグラビトン浴について検討する。
重力は普遍であるため、内部変数は重力子とも相互作用する。
この相互作用は、長期体制下での顕微鏡システムの空間的重ね合わせのデコヒーレンスに繋がることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 16:20:13 GMT)
DRESS: A Continuous Framework for Structural Graph Refinement [0.0] 我々はDRESSと呼ばれるグラフ同型テストと構造解析のための新しいフレームワークを開発した。
DRESSはよく知られたベンチマークグラフで1-WLと3-WLを経験的に上回っている。
我々はDRESSを$mathcalO(n4)$の計算コストを伴わずに,高度にスケーラブルなフレームワークとして確立した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 02:08:08 GMT)
Correcting coherent quantum errors by going with the flow [0.0] 相関型単一量子ハミルトニアン雑音モデル(大域不規則量子ビット回転)において, 距離3を超える論理的量子ビット性能は, パウリ雑音モデルと同一のプロセス忠実度(一つの応用後の忠実度)とを一致させることを示した。
より一般的なノイズの回路モデルでは、相関はシンドローム抽出ラウンド内に構成的に付加されるが、受動誤差補正によるパウリフレームランダム化は複数のラウンドでこの効果を緩和する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 23:08:47 GMT)
Configurational control of photon emission from a molecular dimer [0.0] Au(111)上のNaCl超薄膜上に吸着したスズフタロシアニン分子は、走査トンネル顕微鏡接合部に電流で励起された蛍光を示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 14:17:07 GMT)
Collapse and transition of a superposition of states under a delta-function pulse in a two-level system [0.0] デルタ関数パルス下での固有状態のテクストリニア重畳から固有状態への遷移について検討した。
デルタ関数のパルスでは、遷移は突然/瞬時に行われ、エネルギーギャップに依存しないことを示す。
系が一定の固有状態、すなわちユニティの確率で終わることを示す。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 21:33:25 GMT)
Causal Circuit Tracing Reveals Distinct Computational Architectures in Single-Cell Foundation Models: Inhibitory Dominance, Biological Coherence, and Cross-Model Convergence [0.0] SAE特徴と下流応答を損なうことで因果回路をトレースする手法を提案する。
我々はGeneformer V2-316M と scGPT に4つの条件で適用した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 11:21:44 GMT)
Can machines be uncertain? [0.0] 本稿は,AIシステムが不確実性を実現する方法と方法を検討する。
機能主義的・行動的な観点を採用することで、シンボリック、コネクショナリスト、ハイブリッドアーキテクチャが不確実性をいかに生かすかを調べる。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:11:08 GMT)
COOL-MC: Verifying and Explaining RL Policies for Platelet Inventory Management [0.0] ハイエマらに触発された血小板在庫管理の訓練方針を検証し,説明する。
その結果、200段階の地平線内で、トレーニング済みの政策が2.9%のストックアウト確率と1.1%の在庫フル(潜在的洗浄)確率を達成することが示された。
このRLプレートレット在庫管理ポリシーの正式な検証と説明は、安全クリティカルな医療サプライチェーンドメインにおける透明性と監査可能な意思決定に対するCOOL-MCの価値を示している。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 21:17:23 GMT)
Building a Strong Instruction Language Model for a Less-Resourced Language [0.0] GaMS3-12Bは、12億のパラメータを持つスロベニアの生成モデルである。
私たちは、このモデルを、140Bスロベニア、イングランド、ボスニア、セルビア、クロアチアの事前訓練トークンと、2万以上の英語とスロベニアのSFTの例の組み合わせで訓練しました。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 10:21:15 GMT)
Behavioral Outcomes of Human Cognitive Security within an Integrative Modeling Framework [0.0] 情報に基づく脅威は、人間の認知過程や行動に困難をもたらす。
情報に基づく脅威が人間の判断や意思決定に影響を及ぼす程度を特徴付けるための明確な構造は存在しない。
ここでは、情報に基づく脅威と観測可能な結果とのリンクに焦点を当てた人間の認知セキュリティ構造を紹介する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 01:26:12 GMT)
Assessing Crime Disclosure Patterns in a Large-Scale Cybercrime Forum [0.0] 本研究は,大手サイバー犯罪フォーラムにおける犯罪開示パターンの大規模評価を初めて行った。
初投稿における犯罪情報開示のレベルを測定し、参加者がどのようにレベルを切り替えるかを分析し、犯罪情報開示行動がプライベートコミュニケーションにどのように関係するかを評価する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 08:59:32 GMT)
Applicability and Limitations of Quantum Circuit Cutting in Classical State-Vector Simulation [0.0] 両方向切削は, カットを伴わないシミュレーションに対して, 最大量子ビット数を4から6キュービットまで延長することを示した。
壁面の10分間の予算の下では, 2方向切断は, カットを伴わないシミュレーションと比較して, 最大量子ビット数を4から6キュービットまで延長することを示した。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 04:45:41 GMT)
Accurate, private, secure, federated U-statistics with higher degree [0.0] 核関数 f を次数 k$ge$ 2 で計算する際の問題について検討する。
我々は、中央微分プライバシーの下で、次数k$ge$2のU統計を安全に計算するプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 15:40:16 GMT)
A moment-based approach to the injective norm of random tensors [0.0] 実数および複素乱数テンソルの期待射影ノルム上の上限を確立する方法を提案する。
我々の結果は、実数および複素数、おそらく非ガウススピンガラス模型の基底状態エネルギーに関する厳密な見積もりをもたらす。
彼らはまた、ランダムなボゾン状態の幾何学的絡み合いと、有界なマルチパーティイトシュミットランクを持つランダムな状態の境界を定めている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 00:50:33 GMT)
A Block Belief-Propagation Algorithm for the Contraction of Tensor-Networks [0.0] 古典的なコンピュータ上での多体量子システムのシミュレーションは、多くの自由度のために困難である。
ローカルオブザーバの期待値を計算するためには,ネットワーク全体の収縮が必要である。
この論文は、無限格子に対するBlockBPアルゴリズムの開発と実装に焦点を当てている。
論文参考訳(メタデータ) (Mon, 02 Mar 2026 20:23:14 GMT)