SPIRAL: A Closed-Loop Framework for Self-Improving Action World Models via Reflective Planning Agents [135.0] 本稿では,自己改善型計画および反復的行動世界モデリングフレームワークであるSPIRALを紹介する。
SPIRALはActWMをクローズドループシンク-アクト-リフレクションプロセスとして定式化し、そこで生成は明示的な計画とフィードバックの下で段階的に進行する。
複数のTI2Vバックボーンに対する実験は、ActWM-Benchとメインストリームのビデオ生成ベンチマークで一貫した利得を示している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:00:36 GMT)
ZipMap: Linear-Time Stateful 3D Reconstruction via Test-Time Training [100.3] 本稿では,線形時間・双方向3次元再構成を2次時間法の精度に適合あるいは超越しながら実現した,ステートフルフィードフォワードモデルZipMapを紹介する。
ZipMapはテストタイムのトレーニングレイヤを使用して、イメージコレクション全体を単一のフォワードパスでコンパクトな隠れシーン状態にジップする。
リアルタイム・シーン・クエリーにおけるステートフルな表現の利点とシーケンシャル・ストリーミング・リストラクションへの拡張を実証する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:13:20 GMT)
Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage [85.8] Retrieval-augmented Generation (RAG) システムは、文書検索と生成モデルを組み合わせて、レポート生成のような複雑な情報を求める課題に対処する。
我々は,上流の検索指標が,最終生成応答の情報カバレッジの信頼性の高い早期指標として機能するかどうかを検討する。
本研究は,トピックとシステムレベルの両方で生成した応答におけるカバレッジベース検索指標とナゲットカバレッジとの間に強い相関関係を示した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:20:20 GMT)
Deconstructing Multimodal Mathematical Reasoning: Towards a Unified Perception-Alignment-Reasoning Paradigm [82.6] MMR(Multimodal Mathematical Reasoning)は、テキストと視覚の両方のモダリティを含む数学的問題を解く能力に注目が集まっている。
現在のモデルは、実世界の視覚数学のタスクにおいて大きな課題に直面している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:11:00 GMT)
Beyond Heuristic Prompting: A Concept-Guided Bayesian Framework for Zero-Shot Image Recognition [81.3] VLM(Vision-Language Models)は、ゼロショット画像認識を著しく進歩させたモデルである。
本稿では、クラス固有の概念を取り入れることで、プロンプトを強化する。
我々の手法は一貫して最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:11:11 GMT)
MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games [79.7] マルチエージェントゲームの評価は、しばしば実質的なラン・ツー・ランのばらつきを示す。
回転する小さな偏差は、多エージェントカップリングによって増幅される。
自己再生フレームワークであるMEMO(Memory-augmented MOdel context optimization)を用いて,不安定性とアンダーパフォーマンスの両面に対処する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:36:32 GMT)
SVG-EAR: Parameter-Free Linear Compensation for Sparse Video Generation via Error-aware Routing [77.9] Diffusion Transformers (DiTs) はビデオ生成において主要なバックボーンとなっているが、その二次的注意コストは依然として大きなボトルネックとなっている。
本稿では,不足しているコントリビューションをトレーニングなしで回収できることを示す。
パラメータフリーな線形補償分岐であるSVG-EARを導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:15:31 GMT)
MASEval: Extending Multi-Agent Evaluation from Models to Systems [77.1] MASEvalはフレームワークに依存しないライブラリで、システム全体を分析の単位として扱う。
研究者はエージェントシステムのすべてのコンポーネントを探索し、原則化されたシステム設計のための新たな道を開くことができる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:46:17 GMT)
AgentIR: Reasoning-Aware Retrieval for Deep Research Agents [76.3] ディープリサーチエージェントは、各検索の前に明示的な自然言語推論を生成する。
Reasoning-Aware Retrievalは、クエリと一緒にエージェントの推論トレースを埋め込む。
DR-Synthは、標準的なQAデータセットからDeep Researchレトリバーのトレーニングデータを生成する。
AgentIR-4Bは、オープンウェイトエージェントであるTongyi-DeepResearchで68%の精度を達成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:53:48 GMT)
SWIFT: Sliding Window Reconstruction for Few-Shot Training-Free Generated Video Attribution [75.7] トレーニング不要なビデオアトリビューション」タスクを提案する。
SWIFTは, ビデオサンプル20本だけで, 平均帰属精度を90%以上達成している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:06:26 GMT)
Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows [75.4] ビデオ入力に基づくコーディネートオーディオ生成は、通常、厳格なオーディオ・ビジュアル・アライメント(AV)を必要とする。
マスク付きモデリングトレーニングにより,まずFoleyFlowを用いて非モード型AVエンコーダのアライメントを行う。
トレーニング後、単調データのみを用いて個別に事前訓練されたAVエンコーダは、意味的およびリズム的整合性に整合する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:06:25 GMT)
OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies [75.4] 視覚言語アクション(VLA)モデルは、比較的単純なタスクの多岐にわたるジェネラリストポリシーとして、非常に有望である。
本稿では,任意の指導源を活用することで,このようなタスクにおけるVLA性能を向上させるフレキシブルなフレームワークを提案する。
本研究では,3次元空間内に存在するタスク特異的アトラクタとレペラを用いて,自然に何種類のガイダンスを微分可能エネルギー関数として表現できるかを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:18:13 GMT)
Invisible Safety Threat: Malicious Finetuning for LLM via Steganography [74.0] 妥協された大きな言語モデルは、有害なコンテンツを隠蔽しながら適切な安全アライメントのファサードを維持することができる。
OpenAIファインタニングAPIの保護にもかかわらず、GPT-4.1のこの目に見えない安全脅威を実証する。
本稿では,コンテンツ安全分類のためのLlama-Guard-3-8Bを用いて,AdvBenchデータセット上での手法を定量的に評価する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:48:27 GMT)
EnergyAction: Unimanual to Bimanual Composition with Energy-Based Models [73.2] EnergyActionは、一元的操作ポリシーを二元的タスクに合成する新しいフレームワークである。
まず,個々の一元的政策をEMMとしてモデル化し,その構成特性を利用して左腕と右腕の動作を構成する。
第2に,エネルギー制約を通した時空間協調機構を導入する。
第3に,行動品質評価に基づいて動的に認知段階を適応させる2つの異なるエネルギー認知型認知戦略を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:50:17 GMT)
SoK: Harmonizing Attack Graphs and Intrusion Detection Systems [70.3] アタックグラフ(AG)は、アタック戦略を分析し、応答を通知するための主要な脅威モデルである。
初期の研究で概念的なつながりが認識されているにもかかわらず、AGとIDSの統合の分野は共通の構造を欠いている。
本稿では,AG-IDS統合に関する最初の体系的分析を行い,73の総合的な文献を概説する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:16:51 GMT)
Advancing Automated Algorithm Design via Evolutionary Stagewise Design with LLMs [69.9] EvoStageは、産業規模のアルゴリズム設計の厳密な要求とLLMベースのアルゴリズム設計のギャップを埋める新しい進化パラダイムである。
EvoStageは、アルゴリズム設計プロセスを逐次的に管理可能なステージに分解し、リアルタイム中間フィードバックを反復的に洗練されたアルゴリズム設計方向に統合する。
商用グレードの3Dチップ配置ツールにデプロイすると、EvoStageはオリジナルのパフォーマンス指標を大幅に上回り、記録破りの効率を達成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:13:44 GMT)
In-Context Reinforcement Learning for Tool Use in Large Language Models [68.7] 大規模言語モデル(LLM)は強力な推論能力を示すが、複雑なタスクにおける性能は内部知識によって制約されることが多い。
In-Context Reinforcement Learning (ICRL) を提案する。
ICRLは最先端のパフォーマンスを実現し、従来のSFTベースのパイプラインに代わるスケーラブルでデータ効率の高い代替手段としての有効性を示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:06:18 GMT)
Choose What to Observe: Task-Aware Semantic-Geometric Representations for Visuomotor Policy [66.6] Visuomotor のポリシーは、生の RGB 観測において、過度な視覚的要因に適合するデモから学ぶ。
視覚的入力を共有表現に正準化するタスク対応観察インタフェースを提案する。
我々は,RoboMimic (Lift), ManiSkill YCB grasping under clutter, 4つのRLBench task under control appearance shifts, and two real-world Franka taskについて検討した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:21:26 GMT)
Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases [66.2] リレーショナルディープラーニング(RDL)は、リレーショナルデータベース(RDB)を異種エンティティグラフとして構成するために提案される。
既存のRDL手法は、RDBにおける関係データの不均衡問題を無視し、少数民族を過小評価するリスクを負う。
本研究では,RDBエンティティ分類におけるクラス不均衡問題を初めて検討し,関係中心型マイノリティー合成オーバーサンプリングGNNを設計する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:18:26 GMT)
Gradually Excavating External Knowledge for Implicit Complex Question Answering [65.6] 本研究は,オープンドメイン複雑質問応答のための段階的知識発掘フレームワークを提案する。
本手法は, 競合他社の6%未満のパラメータで78.17%の精度を達成している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:28:42 GMT)
SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans [65.2] リサーチエージェントは、ユーザークエリに回答するツールを使用して、モデルがWebから情報を集めることができる。
エージェントは、未熟期の終了やツール使用の偏りなど、探索行動に乏しいことが多いことを観察する。
より深い探索を促進するためのツール利用軌跡を合成するフレームワークであるSynPlanResearch-R1を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 00:05:29 GMT)
MM-TS: Multi-Modal Temperature and Margin Schedules for Contrastive Learning with Long-Tail Data [64.8] マルチモーダル温度とマージンスケジューリング(MM-TS)を提案し、一様温度スケジューリングの概念をマルチモーダルコントラスト学習に拡張する。
本手法はトレーニング中のコントラスト損失の温度を動的に調整し,マルチモーダル環境でのアトラクションと反発力を調節する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:29:50 GMT)
$π$-StepNFT: Wider Space Needs Finer Steps in Online RL for Flow-based VLAs [64.6] フローベース視覚言語行動モデルは、具体的制御において優れるが、多段階サンプリングにおいて難易度に悩まされる。
textbftextit$boldsymbol$-StepNFT (Step-wise Negative-aware Fine-Tuning)を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:48:18 GMT)
Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective [63.9] 大規模言語モデル (LLM) は, トークン条件生成によって露出し, 強化学習によって安定化される固有の行動可塑性を有することを示す。
Token-Conditioned Reinforcement Learning (ToCoRL)を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:56:53 GMT)
Towards Human-Like Manipulation through RL-Augmented Teleoperation and Mixture-of-Dexterous-Experts VLA [62.2] 本稿では,遠隔操作データ収集を簡易化する共有自律型アシスタントIMCopilotを紹介する。
我々は、不均一な力と触覚モーダルを予め訓練されたVLAバックボーンにシームレスに統合するアーキテクチャであるMoDE-VLAを提案する。
我々は,複雑度を増大させる4つの課題に対するアプローチの有効性を検証し,厳密な接触量の多い課題におけるベースラインよりも2倍の成功率の向上を実証した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:02:30 GMT)
CDRRM: Contrast-Driven Rubric Generation for Reliable and Interpretable Reward Modeling [61.8] CDRRM(Contrast-Driven Reward Model)は、高品質なルーリック生成と優先判断のためのフレームワークである。
この作業は、報酬モデリングのためのスケーラブルで解釈可能で、データ効率のよいパスを提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:15:23 GMT)
On the Feasibility and Opportunity of Autoregressive 3D Object Detection [60.9] AutoReg3Dは、検出をシーケンス生成としてキャストする自動回帰型3D検出器である。
さまざまなポイントクラウドやバックボーンに互換性があり、アンカーやNMSなしで、競合するnuScenesのパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:46:53 GMT)
Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference [60.5] 複数のサンプルを集約・プルークする推論時間法が,大規模言語モデルを操る強力なパラダイムとして登場した。
SMC (Sequential Monte Carlo) のような * Particle filtering* アルゴリズムのレンズを用いて,そのようなアプローチを厳格に研究する手法を導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:50:31 GMT)
Neural Dynamics Self-Attention for Spiking Transformers [59.6] TransformerアーキテクチャによるSNN(Spike Neural Networks)は、エネルギー効率とパフォーマンスのバランスをとるための、有望な経路を提供する。
既存のスパイキングトランスフォーマーは、(i)ニューラルネットワーク(ANN)と(ii)推論時の高メモリオーバーヘッドと比較して、大幅なパフォーマンスギャップがあるという2つの重要な課題に直面している。
本稿では、局所受容野を持つスパイキングニューロンを用いて、メモリ要求を減らしながら注意を計算するLRF-Dynを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:23:37 GMT)
DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding [59.2] 本稿では,リスク制約付き復号法(DARC)*による分散アライメント(Disagreement-Aware Alignment)を提案する。
DARCは応答選択を、分布的に堅牢で、リスクに敏感な意思決定として捉えている。
アライメントベンチマークの実験では、DARCは競合平均品質を維持しながら、不一致と尾のリスクを低減する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:21:29 GMT)
FineRMoE: Dimension Expansion for Finer-Grained Expert with Its Upcycling Approach [58.3] FineRMoEは、細粒度の専門家設計を中間次元と出力次元の両方に拡張するアーキテクチャである。
パラメータ効率の6倍、プリフィルレイテンシの281倍、推論時の復号スループットの136倍を実現している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:00:36 GMT)
Agentic Critical Training [58.3] 大規模言語モデル(LLM)を自律エージェントとして訓練することは、しばしば模倣学習から始まる。
本稿ではエージェントクリティカルトレーニング(ACT)を提案する。これは,エージェントに対して,選択肢間のよりよい行動を特定するための強化学習パラダイムである。
ACTは、異なるポストトレーニングメソッドと組み合わせることで、エージェントのパフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:58:56 GMT)
Wiener Chaos Expansion based Neural Operator for Singular Stochastic Partial Differential Equations [58.2] 本稿では,最近開発された Wiener Chaos Expansion (WCE) ベースのニューラル演算子 (NO) を特異偏微分方程式に適用する方法について検討する。
特徴量線形変調(FiLM)を利用して特異SPDEの解とその滑らかな残差の依存性を適切に把握する。
得られたWCE-FiLM-NOは、相対的な$L$損失、アウト・オブ・ディストリビューション、自己相関スコアによって測定された、$boldsymbol4$に対して優れた性能を示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:50:30 GMT)
How Far Can Unsupervised RLVR Scale LLM Training? [57.4] 検証可能な報酬を伴う教師なし強化学習(URLVR)は、監督ボトルネックを越えてLLMトレーニングをスケールするための経路を提供する。
最近の研究は、モデル固有の信号を活用し、期待できる早期の利得を示しているが、その可能性と限界は未だ不明である。
我々は、URLVRメソッドを報酬源に基づく固有対外部に分類し、統一された理論的枠組みを確立する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:38:11 GMT)
OSExpert: Computer-Use Agents Learning Professional Skills via Exploration [55.7] 汎用コンピュータ利用エージェントは、人間の専門家ほど役に立たない。
本研究では,環境の単位関数を探索し,検証するための深度優先探索アルゴリズムを提案する。
エージェントは、合成タスクのカリキュラムを自己構築するために、ユニットスキル間の構成性を利用する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:27:56 GMT)
AlpsBench: An LLM Personalization Benchmark for Real-Dialogue Memorization and Preference Alignment [54.7] AlpsBenchはWildChatからキュレートされた2500の長期的相互作用配列から構成され、人間によって検証された構造化記憶と組み合わせられる。
我々は、パーソナライズされた情報抽出、更新、検索、利用の4つの重要なタスクを定義し、メモリ管理のライフサイクル全体を評価するためのプロトコルを確立する。
i)モデルが潜在ユーザ特性を確実に抽出するのに苦労していること、(ii)メモリ更新が最強モデルでもパフォーマンス天井に直面すること、(iii)大きなイントラクタプールの存在下での検索精度が急激に低下すること、(iv)明示的なメモリ機構がリコールを改善する一方で、リコールは行わないこと、などである。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:06:19 GMT)
RetroAgent: From Solving to Evolving via Retrospective Dual Intrinsic Feedback [54.4] 強化学習(RL)で訓練されたLarge Language Model (LLM)ベースのエージェントは、複雑な対話的タスクに強い可能性を示している。
我々はRetroAgentを紹介します。RetroAgentは、エージェントが問題解決だけでなく、進化によって複雑な対話環境をマスターすることを可能にするオンラインRLフレームワークです。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:23:33 GMT)
TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size [54.1] 物理に基づくヒューマノイド制御は、現実的でハイパフォーマンスな単一エージェントの動作を可能にするために顕著な進歩を遂げた。
我々は,複数の協力エージェント間で協調的なHOIを処理するための,単一の分散政策を実現するためのフレームワークであるTeamHOIを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:52:13 GMT)
ERASE -- A Real-World Aligned Benchmark for Unlearning in Recommender Systems [53.6] 提案するERASEは,推薦システムにおける機械学習のための大規模ベンチマークである。
ERASEは、コラボレーティブフィルタリング、セッションベースレコメンデーション、次世代レコメンデーションの3つのコアタスクにまたがる。
これには、センシティブなインタラクションやスパムを逐次削除するなど、現実世界のアプリケーションにインスパイアされた未学習シナリオが含まれている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:00:23 GMT)
Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos [53.4] 既存の自己教師型手法は、ECGをシングルビューエコーに整列させることで、表現ミスマッチに悩まされる。
本稿では,心電図表現を多視点エコーで捉えることで,心電図表現を充実させるマルチモーダル自己教師型学習フレームワークであるEcho2ECGを提案する。
臨床的に関係のある2つの課題に対して,Echo2ECGをECG特徴抽出器として評価した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:39:57 GMT)
Fast Low-light Enhancement and Deblurring for 3D Dark Scenes [52.5] FLED-GSは、3Dシーンの復元を拡張・再構成の交互サイクルとして再構成する高速な低照度化・デブロアリングフレームワークである。
実験では、FLED-GSは最先端のLuSh-NeRFより優れており、21$times$高速トレーニング、11$times$高速レンダリングを実現している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:11:35 GMT)
HiAR: Efficient Autoregressive Long Video Generation via Hierarchical Denoising [52.2] HiARは階層的なデノベーションフレームワークで、従来の世代順を逆転させる。
発声ステップ毎に全てのブロックを因果生成し、各ブロックが常に同じノイズレベルでコンテキストで条件付けされるようにする。
VBench(20世代)では、HiARは比較したすべての方法の中で最高の総合スコアと最低時間ドリフトを達成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:58:16 GMT)
Quantum nonlocality: no, yes, how and why [51.9] L.Sicaは、ベルの不平等を犯すために、ボブが録音したシリーズは、もしその設定がアルファ・インステッドであったなら、ボブが録音したシリーズとは異なることができることを示した。
反事実性のために実験的に検証することはできないが、コンピュータシミュレーションで観察されている。
適切なコンピュータコードは、上述した単純なモデルと文脈的命令に基づいている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:34:33 GMT)
Rényi exponent landscape of multipartite entanglement in free-fermion systems [51.6] 我々は、Rényi tripartite information $I_3() が小フェルミ運動量での質的に $exclusion-dependent scaling を示すことを示した。
I_m(n)/I_m(1) sim zm-1 to 0$ for all integer $n geq 2$, so the leading von Neumann signal can builded from integer Rényi data。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:27:00 GMT)
Scale Space Diffusion [47.0] スケール空間理論はローパスフィルタリングによって同様の階層構造を示す。
我々はこの接続を形式化し、ノイズの多い拡散状態が小さなサンプル画像以上の情報を含まないことを示す。
我々は,ネットワークの必要な部分のみを用いて,分解能保存と分解能向上を行うUNetバリアントであるFlexi-UNetを紹介した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:59:42 GMT)
FVG-PT: Adaptive Foreground View-Guided Prompt Tuning for Vision-Language Models [46.8] CLIPベースのプロンプトチューニングにより、事前訓練されたビジョンランゲージモデル(VLM)が下流タスクに効率的に適応できる。
本稿では,視覚的エンコーダの前景の注目度の変化に対して,プロンプトチューニング予測の失敗モードを特徴付ける。
適応型プラグアンドプレイアテンション誘導モジュールであるフォアグラウンドビューガイドプロンプトチューニング(FVG-PT)を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:59:18 GMT)
Breaking the Bias Barrier in Concave Multi-Objective Reinforcement Learning [46.8] マルチレベルモンテカルロ推定器を用いた自然ポリシー勾配アルゴリズムを開発した。
提案手法は,最適な$widetildemathcalO(-2)$サンプル複雑性を,$$-optimal Policyを演算する上で達成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:49:10 GMT)
Quantifying Memorization and Privacy Risks in Genomic Language Models [46.6] ゲノム言語モデル(GLM)はDNA配列の表現を学習するための強力なツールとして登場した。
GLMはトレーニングデータから特定のシーケンスを記憶し、プライバシやデータ漏洩、規制コンプライアンスに関する深刻な懸念を提起するリスクがある。
GLMにおける暗記リスクの定量化を目的とした,包括的かつ多ベクトルなプライバシ評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:30:37 GMT)
$Δ$VLA: Prior-Guided Vision-Language-Action Models via World Knowledge Variation [46.3] VLAは、アクション生成に先立って、現世界の明示的な知識に対して、世界知識のバリエーションをモデル化する事前ガイダンスフレームワークである。
$VLAは、最先端のパフォーマンスを実現し、効率を向上する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:26:05 GMT)
TumorChain: Interleaved Multimodal Chain-of-Thought Reasoning for Traceable Clinical Tumor Analysis [46.0] tumorChainは、3Dイメージングエンコーダ、臨床テキスト理解、臓器レベルの視覚言語アライメントを密結合するマルチモーダルインターリーブ推論フレームワークである。
実験では、病変検出、印象生成、病理分類において、強いベースラインよりも一貫した改善が見られ、DeepTumorVQAベンチマークで強い一般化が示されている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:51:22 GMT)
CODA: Difficulty-Aware Compute Allocation for Adaptive Reasoning [46.0] 単純な問題において、推論は不当に高いコストで最小限の精度のゲインをもたらす。
これは適応推論を動機付け、動的に推論深度を困難に整合させる。
我々はCODA (Allocation by Difficulty) を提案する。
CODAは高い精度を維持しながらトークンコストを60%以上削減しますが、ハードタスクではパフォーマンスを最大化するためにより多くのロールアウトをインセンティブにします。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:37:15 GMT)
The Coupling Within: Flow Matching via Distilled Normalizing Flows [45.3] フロートレーニングにおいて重要な要素は、ノイズ/データペアをサンプリングする結合尺度の選択である。
そこで本研究では,NFモデルの準決定論的結合を蒸留し,学生のフローモデルを学習するための正規化フローマッチングを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:07:36 GMT)
Speculating Experts Accelerates Inference for Mixture-of-Experts [44.3] Mixture-of-Experts (MoE)モデルは、大規模言語モデル(LLM)のキャパシティを拡大する手段として人気を集めている。
本稿では、現在計算されている内部モデル表現を活用して、将来の専門家を推測するエキスパートプレフェッチ方式を提案する。
提案手法は,CPUメモリからのエキスパートのオンデマンドロードよりも,出力トークン当たりの最大14%の時間短縮を実現する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:59:47 GMT)
\$OneMillion-Bench: How Far are Language Agents from Human Experts? [43.3] OneMillion-Benchは、法、財務、産業、ヘルスケア、そして自然科学にまたがる400の専門家によるタスクのベンチマークである。
OneMillion-Benchは、ドメイン集約シナリオにおけるエージェントの信頼性、専門的な深さ、実践的準備性を評価するための統合テストベッドを提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:32:42 GMT)
DC-W2S: Dual-Consensus Weak-to-Strong Training for Reliable Process Reward Modeling in Biological Reasoning [43.1] 本稿では,多量だがノイズの多い「弱」監視を用いた信頼性PRMの訓練の課題について論じる。
既存の Weak-to-Strong Generalization theory には、ノイズの多いデータから高品質なトレーニング信号を選択するための規範的なガイドラインがない。
我々は、トレーニングプロセスの指針として、インスタンスレベルのバランスの取れたサンプリングとラベルレベルの信頼性を意識したマスキングのカリキュラムを採用している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:36:55 GMT)
ConflictBench: Evaluating Human-AI Conflict via Interactive and Visually Grounded Environments [43.1] 我々は150のマルチターンシナリオを通じて人間とAIの対立を評価するベンチマークであるConflictBenchを紹介した。
ConflictBenchはテキストベースのシミュレーションエンジンと視覚的に接地された世界モデルを統合し,動的条件下でのエージェントの知覚,計画,行動を可能にする。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:59:48 GMT)
FoMo: A Multi-Season Dataset for Robot Navigation in Forêt Montmorency [42.9] Fort Montmorencyデータセット(フォートモンモランシーデータセット)は、ボレア林で1年間にわたって記録された総合的なマルチシーズンデータ収集である。
FoMoデータセットには、年間12回のデプロイで繰り返される6つの多様な軌道の64km以上が含まれている。
データセットの関連性を明らかにするために,ライダー慣性,レーダージャイロ,視覚慣性局所化と季節変化へのマッピング手法の堅牢性について予備評価を行った。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:30:47 GMT)
CRED: Counterfactual Reasoning and Environment Design for Active Preference Learning [42.8] 積極的嗜好学習は、ランク付けのための軌道を提示することで人間の報酬関数を学習する。
環境設計と軌道選択を協調的に最適化することで報酬推論を改善するAPLの新しい軌道生成法であるCREDを提案する。
CREDは、報酬精度とサンプル効率において最先端の手法を著しく上回り、より高いユーザ評価を受ける。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:01:54 GMT)
Structure from Rank: Rank-Order Coding as a Bridge from Sequence to Structure [42.6] 本稿では,STG-LIFG-PMC経路にインスパイアされたランク順ベースニューラルネットワークを提案する。
まず、このモデルが部分的手がかりから全発話を復元する能力を維持しつつ、効率よく入力を圧縮できることを実証する。
次に,このネットワークは,P3Bノベルティ波に似た,世界レベルのノベルティ検出を行うことを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:41:45 GMT)
PRISM: Streaming Human Motion Generation with Per-Joint Latent Decomposition [42.4] 既存のモーションオートエンコーダは各フレームを1つのモノリシック潜在ベクトルに圧縮する。
PRISMを提示し、各課題に専用のコントリビューションで対処する。
本研究では,テキスト・ツー・モーション,ポーズ・コンディショニング,自己回帰的逐次生成,ナラティブ・モーション・コンポジションをシームレスに扱う単一動作生成基盤モデルを訓練する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:41:15 GMT)
Diffusion-Based Data Augmentation for Image Recognition: A Systematic Analysis and Evaluation [42.4] 拡散に基づくデータ拡張(DiffDA)は、データの不足下での分類性能を改善するための有望なアプローチとして現れている。
我々はDiffDAメソッドを3つのコアコンポーネントに分解する統合分析フレームワークUniDiffDAを紹介する。
本フレームワークを基盤として,多種多様な低データ分類タスクにまたがるDiffDA手法をベンチマークする,包括的かつ公平な評価プロトコルを開発した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:26:54 GMT)
Towards High-resolution and Disentangled Reference-based Sketch Colorization [41.9] 本稿では,分布シフトを直接最小化し,品質,解像度,カラー化の可制御性を向上するフレームワークを提案する。
我々はアニメ固有のTagger Networkを採用し、参照画像から細粒度属性を抽出し、SDXLの条件エンコーダを変調して正確な制御を行う。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:21:04 GMT)
FAME: Force-Adaptive RL for Expanding the Manipulation Envelope of a Full-Scale Humanoid [41.6] 外力下でのバランスを維持することは、ヒューマノイドのバイマニュアル操作にとって重要である。
力適応型強化学習フレームワークである textbfFAME を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:49:00 GMT)
Multi-Objective Evolutionary Optimization of Chance-Constrained Multiple-Choice Knapsack Problems with Implicit Probability Distributions [41.0] 本稿では,Multiple-choice knapsack problem (MCKP) の重要かつ未解明な拡張について検討する。
問題の目標は、総コストを同時に最小化し、キャパシティ制約を満たす信頼性レベルを最大化することである。
合成ベンチマークと実世界の5Gネットワーク構成ベンチマークの実験は、NHILSがいくつかの最先端のマルチオブジェクトを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:39:58 GMT)
CCR-Bench: A Comprehensive Benchmark for Evaluating LLMs on Complex Constraints, Control Flows, and Real-World Cases [40.6] CCR-Benchは、大規模言語モデルの複雑な命令への準拠を評価するために設計された新しいベンチマークである。
CCR-Benchは、(1)タスク仕様における内容とフォーマット要件の深い絡み合い、(2)複雑なタスクの分解、条件付き推論、手続き計画を含む指示、(3)実世界の産業シナリオから派生した評価サンプルを特徴とする。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:49:19 GMT)
ConFu: Contemplate the Future for Better Speculative Sampling [40.5] textbfConFu (Contemplate the Future)は、新しい投機的デコーディングフレームワークで、ドラフトモデルが生成の今後の方向性を予測できるようにする。
我々の研究は、投機的復号を連続的推論トークンでブリッジする最初のものであり、LSM推論を加速するための新しい方向を提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:11:06 GMT)
SkipGS: Post-Densification Backward Skipping for Efficient 3DGS Training [40.3] 3D Gaussian Splatting (3DGS) は、数百万の異方性ガウスを最適化することにより、リアルタイムのノベルビュー合成を実現する。
本研究では,視覚適応型後方ゲーティング機構を備えたSkipGSを提案する。
Mip-NeRF 360では、3DGSと比較して、SkipGSは、デンシフィケーション後の42.0%の短縮により、エンドツーエンドのトレーニング時間を23.1%短縮する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:32:52 GMT)
MAPLE: Elevating Medical Reasoning from Statistical Consensus to Process-Led Alignment [40.2] 医療プロセス報酬モデルとテスト時間強化学習(TTRL)を統合する新しい統一トレーニングパラダイムを提案する。
具体的には,従来の MV を Med-RPM を用いた細粒度の専門家による監視パラダイムに置き換えることで,TTRL フレームワークを進化させる。
この統合により、強化学習は単なるコンセンサスではなく医学的正確性によってガイドされ、探索に基づく知性をモデルのパラメトリックメモリに効果的に蒸留することができる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:22:57 GMT)
Extend Your Horizon: A Device-Agnostic Surgical Tool Tracking Framework with Multi-View Optimization for Augmented Reality [40.0] 手術ナビゲーションは、患者の解剖学と手術器具のポーズを推定することでリアルタイムのガイダンスを提供する。
既存のアプローチのほとんどは明確な視線に依存しており、動的な手術室環境では維持が困難である。
本研究は,動的なシーングラフ表現内に複数の感覚モーダルを融合させることにより,閉塞下での手術器具の追跡を行う枠組みを導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:37:49 GMT)
Are Expressive Encoders Necessary for Discrete Graph Generation? [40.0] 我々は,グラフ生成のためのモジュール型メッセージパッシングフレームワークGenGNNを紹介する。
GenGNNによる拡散モデルは、木と平面のデータセットに対して90%以上の妥当性を達成する。
分子生成では、GenGNNのバックボーンを持つDiGressは99.49%の妥当性を達成している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:36:06 GMT)
AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem [39.8] 本稿では,AgentOS(Personal Agent Operating System)の新たなパラダイムを提案する。
AgentOSでは、従来のGUIデスクトップは、統一された自然言語や音声ポータルを中心としたNUI(Natural User Interface)に置き換えられている。
システムコアは、ユーザの意図を解釈し、タスクを分解し、複数のエージェントをコーディネートするエージェントカーネルとなる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:13:52 GMT)
Leaderboard Incentives: Model Rankings under Strategic Post-Training [39.3] インフルエンシャルベンチマークは、競合するモデル開発者に、トレーニング後のリソースをリーダボードの改善に向けて戦略的に割り当てる動機を与える。
軽度条件下では、最近提案されたチューン・バイ・テストと呼ばれる評価プロトコルが、遅延品質でモデルをランク付けするユニークなナッシュ平衡を持つベンチマークを誘導することを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:33:20 GMT)
Agentic Neurosymbolic Collaboration for Mathematical Discovery: A Case Study in Combinatorial Design [39.0] 我々は,大言語モデル(LLM)を用いたAIエージェントを用いた,ニューロシンボリック推論のレンズによる数学的発見を研究する。
この人間とAIのコラボレーションの主な結果は、n equiv 1 pmod3$という非常に難しいケースに対するラテン正方形の不均衡の厳格な下限である。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:42:56 GMT)
Thinking in Uncertainty: Mitigating Hallucinations in MLRMs with Latent Entropy-Aware Decoding [38.6] トークン確率分布から適切な文脈推論情報を直接抽出できることを論じる。
本稿では,効率的なプラグアンドプレイデコーディング戦略であるLatent Entropy-Aware Decodingを提案する。
このモデルは高エントロピー状態下での確率重み付き連続埋め込みを採用し、エントロピーが減少するにつれて離散トークン埋め込みに遷移する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:47:54 GMT)
DSH-Bench: A Difficulty- and Scenario-Aware Benchmark with Hierarchical Subject Taxonomy for Subject-Driven Text-to-Image Generation [38.2] 対象駆動型T2Iモデルの系統的マルチパースペクティブ分析を可能にする総合ベンチマークであるDSH-Benchを提案する。
DSH-Benchは、19の先行モデルの広範な実験的な評価を通じて、現在のアプローチでこれまで明らかであった制限を明らかにした。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:30:28 GMT)
Deterministic Differentiable Structured Pruning for Large Language Models [37.3] 構造化プルーニングは、重要度の低いアーキテクチャ部品を取り除き、LLM推論コストを削減する。
マスクのみの最適化手法であるDDP(Deterministic Differentiable Pruning)を提案する。
従来のアプローチと比較して、DDPはより表現力が高く、テストミスマッチが減少し、より早く収束する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:59:17 GMT)
Rethinking the semantic classification of indoor places by mobile robots [36.9] サービスロボットにおける重要な課題は、その周辺領域のセマンティックな理解である。
従来のアプローチでは、フロアプランをフルルームに対応する領域に分割することでこの問題に対処している。
室内の混乱を許容し,意味分類器のラベル付けを意図的に緩和する新しいパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:43:42 GMT)
PolyFormer: learning efficient reformulations for scalable optimization under complex physical constraints [36.8] PolyFormerは制約の背後にある幾何学的構造をキャプチャし、それらを効率的なポリトピー的再構成に変換する。
計算速度を最大6,400倍に向上し、メモリを最大99.87%削減する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:59:39 GMT)
Predictive Control with Indirect Adaptive Laws for Payload Transportation by Quadrupedal Robots [36.6] 本稿では,四足歩行ロボットによるロバストペイロード輸送のための新しい階層的計画と制御フレームワークを開発する。
間接アダプティブ法則は、異なるペイロードの下での縮小順序(テンポレート)移動モデルの未知のパラメータを推定する。
ロボットは、荒れた地形で重量の73%のダイナミックペイロードをうまく管理する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:43:31 GMT)
DynamicVGGT: Learning Dynamic Point Maps for 4D Scene Reconstruction in Autonomous Driving [36.6] 本稿では,VGGTを静的な3次元知覚から動的4次元再構成まで拡張する統合フィードフォワードフレームワークを提案する。
我々のゴールは、フィードフォワード3Dモデル内の点運動を動的かつ時間的コヒーレントな方法でモデル化することである。
自律走行データセットの実験では、DynamicVGGTは復元精度において既存の手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:24:14 GMT)
Listening with the Eyes: Benchmarking Egocentric Co-Speech Grounding across Space and Time [36.5] 我々は,高密度空間アノテーションとミリ秒レベルの脳卒中管理を備えたtextbf811エゴセントリッククリップの診断ベンチマークである textbfEcoG-Bench を提案する。
最先端MLLMのベンチマークでは、厳しい実行可能性のギャップが明らかになっている。
マルチモーダルインタフェースは、モデル推論とは独立して、時間的アライメントキューの可観測性をボトルネックにする可能性がある。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:08:02 GMT)
Gate Optimization via Efficient Two-Qubit Benchmarking for NV Centers in Diamond [35.2] 本稿では,2つの量子状態の調製と測定により,2量子ゲートの性能を評価するための効率的な手法を提案する。
ダイヤモンド中の窒素空孔中心へのアプローチを調整し、数値シミュレーションにより、2量子ゲートを最適化する方法を実証する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:35:54 GMT)
Quantum Simulation of Massive Relativistic Fields in 2 + 1 Dimensions [34.6] 2+1$次元の大規模相対論的場の量子シミュレーションを実現する。
摂動状態において、集合体励起は、調整可能な質量ギャップを持つ相対論的分散を示すことを示す。
我々の研究は、予熱、トポロジカル欠陥のダイナミクス、相対論的偽真空崩壊など、宇宙学的に関係のある現象の研究の可能性を開く。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:59:35 GMT)
OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning [34.5] 我々は、基礎化されたマルチドキュメント推論に基づいてAIエージェントを評価するベンチマークであるOfficeQA Proを紹介する。
OfficeQA Proは、正確な文書解析、検索、分析的推論を必要とする133の質問からなる。
Databricksのai_parse_documentによって生成された構造化文書表現をエージェントに提供すると、平均相対的なパフォーマンスが16.1%向上することがわかった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:34:53 GMT)
UIS-Digger: Towards Comprehensive Research Agent Systems for Real-world Unindexed Information Seeking [34.5] Unindexed Information Seeking (UIS) は、サーチエンジンクローラーによって重要な情報が取得されない場所である。
110のエキスパートアノテートされたQAペアからなるUISベンチマークであるUIS-QAを紹介する。
デュアルモードブラウジングと同時Webページ検索とファイル解析を可能にする新しいマルチエージェントフレームワークであるUIS-Diggerを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:58:40 GMT)
SmartThinker: Progressive Chain-of-Thought Length Calibration for Efficient Large Language Model Reasoning [34.1] プログレッシブCoT長キャリブレーションを用いた新しい効率的な推論法であるSmartThinkerを提案する。
実験の結果、SmartThinkerは52.5%の平均長圧縮を実現し、精度が向上した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:08:14 GMT)
Metriq: A Collaborative Platform for Benchmarking Quantum Computers [33.7] 再現可能なクロスプラットフォーム量子ベンチマークのためのオープンソースプラットフォームであるMetriqを紹介する。
Metriqは、ベンチマーク定義と実行、データ収集、公開プレゼンテーションを統合ワークフローに統合する。
Metriqを使用して、複数のハードウェアベンダで10以上の量子コンピュータから結果を収集し、公開しています。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:49:41 GMT)
How Emotion Shapes the Behavior of LLMs and Agents: A Mechanistic Study [33.5] 感情信号が大規模言語モデル(LLM)とエージェントの動作を形作ることができるかどうかを検討する。
既存の感情認識研究は、主に感情を表面的なスタイルファクターまたは知覚的ターゲットとして扱う。
直接表現レベルの介入を可能にする解釈可能な感情ステアリングフレームワークであるE-STEERを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:20:02 GMT)
MV-Fashion: Towards Enabling Virtual Try-On and Size Estimation with Multi-View Paired Data [33.5] MV-Fashionは、ドメイン固有のファッション分析のために設計された大規模なマルチビュービデオデータセットである。
80人の多様な被験者から3,273のシークエンスがあり、それぞれ3,10の衣装を着ている。
コアコントリビューションは、ピクセルレベルのセマンティックアノテーションを含むリッチなデータ表現である。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:28:15 GMT)
PIRA-Bench: A Transition from Reactive GUI Agents to GUI-based Proactive Intent Recommendation Agents [33.0] PIRA-Benchは、マルチモーダルな大規模言語モデル(MLLM)を、連続的、弱い教師付き視覚入力で評価するための新しいベンチマークである。
本稿では,複数のタスクスレッドを管理し,誤った視覚的入力を処理する汎用MLLMを実現する,メモリ対応の状態追跡フレームワークであるPIRFベースラインを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:41:32 GMT)
Revisiting Unknowns: Towards Effective and Efficient Open-Set Active Learning [32.5] Open-set Active Learning (OSAL) は、未ラベルデータに未確認のクラスが含まれている場合、アノテーションのための情報サンプルを特定することを目的としている。
本稿では,E$2$OAL(Effective and Efficient Open-set Active Learning)を提案する。
E$2$OALは、より強力な監視と信頼性の高いクエリの両方のためにラベル付き未知をフル活用する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:35:36 GMT)
Attribute Distribution Modeling and Semantic-Visual Alignment for Generative Zero-shot Learning [32.2] ジェネレーティブゼロショット学習(ZSL)は、目に見えないクラスの特徴を合成し、セマンティックな条件を利用して、目に見えないクラスから知識を伝達する。
1) クラスレベルの属性は、大きなクラス内変動のため、インスタンス固有の視覚的外観をキャプチャできないため、クラスインスタンス間のギャップが生じる。
本稿では属性分布を共同でモデル化し,意味・視覚的アライメントを行う属性分布モデリングとセマンティック・ビジュアルアライメント(ADiVA)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:33:29 GMT)
Controllable Complex Human Motion Video Generation via Text-to-Skeleton Cascades [32.1] 両制約に対処する2段階のカスケードフレームワークを提案する。
自動回帰テキスト-スケルトンモデルでは、自然言語記述から2次元ポーズシーケンスを生成する。
ポーズ条件付きビデオ拡散モデルは、参照画像と生成されたスケルトンシーケンスからビデオを合成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:04:29 GMT)
Evolving Symbiosis, from Barricelli's Legacy to Collective Intelligence: a simulated and conceptual approach [32.1] 本報告では,コペンハーゲンのALICE 2026ワークショップにおいて,我々のグループ(SymBaという名称)の作業について報告する。
生命の起源, 開放性, 集団知性に寄与するメカニズムとして, 共生の役割について考察した。
バリチェリの1次元世界におけるオリジナル作品の複製,2次元共生生物への拡張,およびDNA-ノルムを用いた予備実験について報告する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:57:24 GMT)
MERLIN: Building Low-SNR Robust Multimodal LLMs for Electromagnetic Signals [31.8] マルチモーダル大言語モデル(MLLM)は電磁(EM)領域を前進させるために有望な青写真を提供する。
一般的なアプローチは、タスク固有のアーキテクチャやパイプラインアーキテクチャを使う代わりに、ネイティブMLLMパラダイムから逸脱することが多い。
EMドメインにおけるMLLMの基礎を確立するために,三部構成のコントリビューションを導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:53:11 GMT)
Enhancing Cross-View UAV Geolocalization via LVLM-Driven Relational Modeling [31.4] クロスビューUAVジオローカライゼーションは、ドローンが捉えた画像の正確な空間座標を、地理的に参照された広範囲な衛星データベースと整列させることを目的としている。
改良されたUAV-Satellite画像マッチングのための共同関係モデリングを明示的に行うために設計された,新しいプラグアンドプレイランキングアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:57:29 GMT)
AULLM++: Structural Reasoning with Large Language Models for Micro-Expression Recognition [30.6] AULLM++は大規模言語モデル(LLM)を活用した推論指向フレームワークである
AU予測をエビデンス構築、構造モデリング、推論に基づく予測の3段階に定式化する。
AULLM++は、標準ベンチマークで最先端のパフォーマンスを実証する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:45:21 GMT)
CID-TKG: Collaborative Historical Invariance and Evolutionary Dynamics Learning for Temporal Knowledge Graph Reasoning [30.5] 時間的知識グラフ(TKG)推論は、時間的に進化する実体や関係から、目に見えないタイムスタンプで将来の事実を推測することを目的としている。
本稿では,進化力学と歴史的不変性セマンティクスを推論のための効果的な帰納的バイアスとして統合した,TKGR(dubed CID-TKG)のための新しい協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:28:57 GMT)
Ares: Adaptive Reasoning Effort Selection for Efficient LLM Agents [30.5] Aresは、マルチステップエージェントタスク用に調整された、ステップごとの動的推論作業選択のためのフレームワークである。
我々は、ステップ完了に要する最小の推論労力を識別するデータ生成パイプラインを開発する。
ツール使用エージェントのTAU-Bench,ディープ検索エージェントのBrowseComp-Plus,WebエージェントのWebArenaなど,さまざまなエージェントタスクに対してAlesを評価した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:17:29 GMT)
Information Maximization for Long-Tailed Semi-Supervised Domain Generalization [30.5] ラベル付きデータが少ないがラベル付きサンプルが豊富である場合、半教師付き領域一般化はドメイン一般化に取り組むための魅力的な代替手段として現れてきた。
本稿では,SSDGのシナリオに適応したInfoMaxの原理に基づく,シンプルで効果的な目的であるIMaXを提案する。
我々の定式化は、MIの標準辺のエントロピー項で符号化されたクラスバランスバイアスを緩和する-エントロピー的目的を統合し、任意のクラス分布の扱いをより良くする。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:32:10 GMT)
A note on large-scale quantum chemistry on quantum computers: the case of a molecule with half-Möbius topology [30.2] 半室電子トポロジーを示す分子の超伝導量子プロセッサ上での量子化学計算について報告する。
ランダム化されたサンプルベースKrylov量子対角化アルゴリズムであるSqDRIFTを用いて、36の軌道(72量子ビット)に対応する活性空間上の信頼性の高い量子シミュレーションを行い、以前の研究を50の軌道(100量子ビット)まで拡張する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:55:39 GMT)
LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing [29.3] 効率的なKVキャッシュ管理のための新しい手法であるLycheeClusterを提案する。
LycheeClusterは境界対応のチャンキングを通じて局所的な意味的コヒーレンスを保持し、三角形の不等式に根ざした階層的指数を構成する。
実験により、LycheeClusterはモデル性能の無視可能な劣化を伴う、最大3.6倍のエンドツーエンドの推論スピードアップを達成することが示された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:50:35 GMT)
StreamReady: Learning What to Answer and When in Long Streaming Videos [29.0] 我々は、Answer Readiness Score (ARS) を用いたストリーミングビデオ理解の可読性を考慮した定式化を導入する。
ARSは、モデルが正しいかどうかではなく、適切なタイミングで答えられるかどうかを測定する効果的な精度を定義します。
この定式化に基づいて、リアルタイム応答と時間的推論を統一するフレームワークStreamReadyを導入します。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:02:44 GMT)
This Looks Distinctly Like That: Grounding Interpretable Recognition in Stiefel Geometry against Neural Collapse [28.9] プロトタイプネットワークは、本質的なケースベースの説明メカニズムを提供するが、その解釈可能性はしばしばプロトタイプの崩壊によって損なわれる。
適応多様体プロトタイプ (AMP) は, クラスプロトタイプを正規直交基底として表現し, ランク1のプロトタイプの崩壊を建設によって実現不可能にする。
AMPは最先端の分類精度を達成し、従来の解釈可能なモデルよりも因果的忠実性を大幅に改善する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:36:54 GMT)
Towards Effective and Efficient Graph Alignment without Supervision [28.3] 教師なしグラフアライメントは、アンカーノードペアなしで異なるグラフ間のノード対応を見つけることを目的としている。
局所的およびグローバルなグラフ情報の活用に焦点を当てて、局所的表現、グローバルなアライメントのパラダイムとして定式化する。
本稿では,アライメントプロセスにおける2つのフェーズ間のミスマッチを解決するために,新たなグローバル表現とアライメントのパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:00:08 GMT)
HMR-1: Hierarchical Massage Robot with Vision-Language-Model for Embodied Healthcare [28.2] 身体知性は医療、特に理学療法やリハビリテーションにおいて変革の機会を開いている。
我々は、12,190の画像と174,177のQAペアを含むマルチモーダルデータセットを構築し、様々な照明条件と背景をカバーした。
本稿では,ハイレベルなアキューポイント接地モジュールと低レベルな制御モジュールを備えた階層型エンボディマッサージフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:17:33 GMT)
Bridging Domains through Subspace-Aware Model Merging [28.0] モデルマージは複数のタスク固有のモデルを単一の統合モデルに統合する。
最近の研究は、分散やマルチタスクのシナリオにおけるマージ性能の改善に進歩している。
異なる領域に微調整されたモデルが、目に見えない領域への一般化にどのように影響するかを考察する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:31:33 GMT)
AgenticLab: A Real-World Robot Agent Platform that Can See, Think, and Act [27.9] 本稿では,モデルに依存しないロボットエージェントプラットフォームであるAgenticLabと,オープンワールド操作のためのベンチマークについて紹介する。
我々は、非構造環境における実ロボットタスクに最先端のVLMベースのエージェントをベンチマークする。
私たちのベンチマークでは、オフラインの視覚言語テストがキャプチャーに失敗するいくつかの障害モードが明らかになっている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:27:30 GMT)
LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization [27.7] Databricksのジョブオーケストレーションシステム(例:LeJOT)は、レイテンシと依存性の制約を満たしながら、低価格の計算を選択することで、クラウドコストを削減する。
既存のパイプラインは、静的で手動で構築されたランタイム効果に依存している。
エージェント駆動型AutoMLフレームワークであるLeJOT-AutoMLについて,MLライフサイクルを通じて大規模言語モデルエージェントを組み込む。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:31:50 GMT)
Efficient Credal Prediction through Decalibration [27.2] 本稿では, 相対的可能性の概念を基礎として, 断裂予測を効率的に行う方法を提案する。
提案手法は, 多様なタスクにまたがって, 高い性能でクレーダル集合を生成することを示す。
特に,TabPFNやCLIPなどのモデルに対して,致命的な予測を示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:30:10 GMT)
MoMaStage: Skill-State Graph Guided Planning and Closed-Loop Execution for Long-Horizon Indoor Mobile Manipulation [27.1] 屋内移動操作(MoMA)により、ロボットは自然言語の指示を物理的行動に変換することができる。
MoMaStageは長期的なMoMAのための視覚言語フレームワークで、明示的なシーンマッピングの必要性を排除している。
物理に富んだシミュレーションと実世界の環境の実験は、MoMaStageが最先端のベースラインより優れていることを示した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:43:38 GMT)
SRNeRV: A Scale-wise Recursive Framework for Neural Video Representation [27.1] Inlicit Neural Representations (INR) はビデオ表現と圧縮のための有望なパラダイムとして登場した。
本稿では,この階層化設計をパラメータ効率のよい共有アーキテクチャに置き換える,新しいスケールワイド再帰的フレームワークSRNeRVを提案する。
SRNeRV は,特にINR フレンドリーなシナリオにおいて,大幅な速度歪み性能向上を実現していることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:56:55 GMT)
Amortizing Maximum Inner Product Search with Learned Support Functions [27.0] 内部積探索 (MIPS) は機械学習において重要な計算である。
我々は、ニューラルネットワークをトレーニングしてMIPSソリューションを直接予測する学習ベースのアプローチである、Amortized MIPSを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:09:20 GMT)
VisionCreator-R1: A Reflection-Enhanced Native Visual-Generation Agentic Model [26.9] 本研究では,視線を明示的に反映した視覚生成エージェントであるVisionCreator-R1と,反射プラン協調最適化学習手法を提案する。
我々のRPCOは、まず、リフレクション-ストロングシングルイメージ・トラジェクトリとプランニング-ストロングマルチイメージ・トラジェクトリで自己構築されたVCR-SFTデータセットをトレーニングし、次にRLを介してVCR-RLデータセットを共最適化します。
これによって統合されたVisionCreator-R1エージェントが既存のベンチマークでGemini2.5Proを一貫して上回り、VCR-benchはシングルイメージとマルチイメージタスクをカバーしています。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:10:49 GMT)
Model-based Offline RL via Robust Value-Aware Model Learning with Implicitly Differentiable Adaptive Weighting [26.9] Adrial Model Learningは、モデルエクスプロイトを緩和するための理論的フレームワークを提供する。
我々はtextbfImplicitly differentiable Adaptive weighting (ROMI) を用いた textbfRObust value-aware textbfModel 学習を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:59:45 GMT)
Posterior Sampling Reinforcement Learning with Gaussian Processes for Continuous Control: Sublinear Regret Bounds for Unbounded State Spaces [26.7] ボレル・ツィレルソン・イブラギモフ・スダコフの不等式を用いて、確率の高い場合、アルゴリズムが実際に訪れた状態がほぼ安定な半径のボールに含まれることを示す。
我々の主な結果は、$widetildemathcalO(H3/2sqrt_T/HT)$に縛られたベイズ的後悔であり、$H$は地平線、$T$は時間ステップの数、$_T/H$は情報ゲインの最大値である。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:03:25 GMT)
FOMO-3D: Using Vision Foundation Models for Long-Tailed 3D Object Detection [26.5] 多くの安全クリティカルな物体は、名目上の交通条件ではまれに現れず、データのみを駆動する訓練例が著しく不足している。
最近のビジョンファウンデーションモデルは、大規模なデータコーパスに基づいてトレーニングされており、外部の事前知識の優れた情報源として役立てることができる。
本研究は,視覚基盤モデルを利用した多モード3D検出器FOMO-3Dを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:57:23 GMT)
FedMomentum: Preserving LoRA Training Momentum in Federated Fine-Tuning [26.2] 低ランク適応(LoRA)を備えた大規模言語モデルのフェデレート微調整は、タスク固有の適応のための通信効率とプライバシ保護ソリューションを提供する。
LoRAモジュールのネイティブアグリゲーションは、ダウンサンプリングおよびアップサンプリング行列を独立に平均化する際の数学的誤りによるノイズをもたらす。
我々は,単一値分解による構造的および運動量保存のLoRAアグリゲーションを可能にする新しいフレームワークであるFedMomentumを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:43:17 GMT)
ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework [26.1] 台風・ハギビス・新型コロナウイルス・東京2021年五輪の3大イベントを対象とした,最初のイベントアノテート・モビリティ・データセットを構築した。
本稿では、まず、習慣パターンとイベント制約の間の競合する合理性を抽出する自己整合 LLM フレームワーク ELLMob を提案する。
ELLMobはすべてのイベントにおいて最先端のベースラインを獲得し、その有効性を示している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:28:03 GMT)
More to Extract: Discovering MEV by Token Contract Analysis [25.7] 本稿では、Tokenスマートコントラクトから生じるブロックチェーン上の最大抽出可能な値であるtMEVの発見に取り組む。
この範囲は、アプリケーション層契約やアタッカー契約を分析する既存のMEV発見研究とは異なるが、広範囲で多様なトークン契約を無視している。
本稿では,トークン契約における非標準供給制御機能を特定する静的解析ツールtSCANや,利益率の高いtMEVの機会を明らかにする検索ツールtSEARCHなど,tMEV発見のためのテクニックのパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:02:15 GMT)
WaDi: Weight Direction-aware Distillation for One-step Image Synthesis [25.7] 最近の研究は、多段階拡散を1段階発生器に蒸留することで推論を加速している。
我々は,一段階の生徒と多段階の教師のU-Net/DiT体重変化を分析した。
本稿では, 1段階拡散蒸留に適したパラメータ効率の高いアダプタであるLoRaD(LoRaD)を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:27:28 GMT)
C$^2$FG: Control Classifier-Free Guidance via Score Discrepancy Analysis [25.5] 自由誘導の固有力学を厳密に理論的に解析する。
C$2$FGは多種多様な生成タスクに対して有効で広く適用可能であることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:37:17 GMT)
HDR-NSFF: High Dynamic Range Neural Scene Flow Fields [25.0] HDR-NSFFは2次元の融合から4次元の時間モデルへのパラダイムシフトである。
実験により、HDR-NSFFは、挑戦的な露光変動の下でも詳細な放射コヒーレントダイナミクスを回復することが示された。
動的HDRシーンに特化して設計された,世界初の実世界のHDR-GoProデータセットを提示する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:36:46 GMT)
PhaForce: Phase-Scheduled Visual-Force Policy Learning with Slow Planning and Fast Correction for Contact-Rich Manipulation [25.0] PhaForceは、低レートのチャンクレベルの計画と高レートの残差補正を調整する、位相スケジューリングされた視覚力ポリシーである。
複数の実ロボットとの接触が豊富なタスクの中で、PhaForceは平均86%の成功率を達成した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:03:29 GMT)
CAST: Modeling Visual State Transitions for Consistent Video Retrieval [24.9] 一貫性ビデオ検索のタスクを形式化し,YouCook2,COIN,CrossTaskにまたがる診断ベンチマークを導入する。
CAST(Context-Aware State Transition)は,多様な凍結視覚言語埋め込み空間に対応する軽量なプラグイン・アンド・プレイアダプタである。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:26:26 GMT)
Diffusion-Based Authentication of Copy Detection Patterns: A Multimodal Framework with Printer Signature Conditioning [24.9] プリンタシグネチャに対するマルチクラスプリンタ分類としてのフォーミュラ化認証により、当社のモデルでは、きめ細かいデバイス固有の特徴をキャプチャできる。
クラス条件付き雑音予測のためのデノナイズ処理を再利用し,制御ネットを拡張した。
結果として、フレームワークはトレーニング中に見つからない偽造型を一般化している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:33:44 GMT)
Not All Queries Need Deep Thought: CoFiCot for Adaptive Coarse-to-fine Stateful Refinement [24.7] CoFiCotは粗粒度適応フレームワークで、推論戦略を問題に合わせる。
セマンティックエントロピー、コンセンサス信頼性、予測推論深度でクエリをトリアージするマルチメトリック分類器を実装した。
これにより、複雑なクエリをコンテキスト対応の修正ループにルーティングしながら、単純なクエリに対して効率的なアグリゲーションを適用することができる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:23:07 GMT)
Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization [24.5] 線形分離可能な二元分類に基づく$L$層線形対角ネットワークのトレーニングにおいて,シャープネス・アウェア最小化(SAM)の暗黙バイアスについて検討した。
$ell_infty$-SAM の場合、極限方向は $mathbf0$ あるいは任意の標準ベクトルに収束する。
我々の理論解析は、この現象を正規化に応用した$ell$-SAMの勾配正規化因子とみなす。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:09:14 GMT)
Missing No More: Dictionary-Guided Cross-Modal Image Fusion under Missing Infrared [24.4] 赤外線可視(IR-VIS)画像融合は、知覚とセキュリティにとって不可欠である。
ほとんどのメソッドは、トレーニングと推論の間、両方のモダリティの可用性に依存します。
本稿では,共用畳み込み辞書上に構築された辞書誘導係数ドメインフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:48:46 GMT)
Meissa: Multi-modal Medical Agentic Intelligence [24.2] エージェント機能をオフラインで提供する軽量医療用MM-LLMであるMeissaを紹介する。
メサは外的相互作用(戦略選択)をいつ行うかと、フロンティアモデルから構造化軌跡を蒸留することによって多段階の相互作用(戦略実行)を実行する方法の両方を学ぶ。
Meissaは、APIベースのデプロイメントに比べて、エンドツーエンドのレイテンシが22倍低く、完全にオフラインで動作する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:22:55 GMT)
Long-Short Term Agents for Pure-Vision Bronchoscopy Robotic Autonomy [24.2] 既存のナビゲーションプラットフォームは、電磁的なトラッキングや形状検出といった外部のローカライゼーション技術に依存している。
我々は,術前CTから得られた仮想目標とライブ内視鏡映像を用いて,長時間の気管支鏡視下ナビゲーションを行う視覚のみの自律フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:09:51 GMT)
EndoSERV: A Vision-based Endoluminal Robot Navigation System [24.2] 視覚に基づくナビゲーションは有望な解決策を提供するが、既存の局所化アプローチは組織変形によるエラーを起こしやすい。
本稿では,これらの課題に対処する新しいEndoSERVローカライゼーション手法を提案する。
textiti.e. textbfSEgment-to-structure と textbfReal-to-textbfVirtual マッピングの2つの主要な部分を含んでいる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:44:32 GMT)
Where, What, Why: Toward Explainable 3D-GS Watermarking [24.1] 3D Gaussian Splattingはインタラクティブな3Dアセットのデファクト表現である。
品質の保存方法から書き方を分離する表現ネイティブフレームワークを提案する。
最先端手法と比較して,PSNRは+0.83dB,ビット精度は+1.24%向上した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:05:27 GMT)
AutoAdapt: An Automated Domain Adaptation Framework for LLMs [24.1] 大規模言語モデル(LLM)はオープンドメインでは優れているが、限られたデータと進化する知識で特別な設定に苦しむ。
既存のドメイン適応プラクティスは、手動の試行錯誤プロセスに大きく依存しています。
我々は、効率よく信頼性の高いドメイン適応のための新しいエンドツーエンド自動化フレームワークであるAutoAdaptを紹介する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:03:16 GMT)
SAIL: Test-Time Scaling for In-Context Imitation Learning with VLM [24.0] インコンテキストの模倣学習は、ロボットがデモからスキルを習得することを可能にするが、一方の軌跡生成は環境変動下でも脆弱である。
本稿では,ロボットの模倣を,テスト時間計算でスケール可能な反復的改良問題として再編成するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:39:40 GMT)
Structure and Progress Aware Diffusion for Medical Image Segmentation [23.9] 医用画像における形態的・意味的構造は有用であり、目標理解のための安定した手がかりである。
現在の手法はトレーニングプロセスを通して粗い構造と細かな境界を同時に学習する。
本稿では,意味集中拡散(ScD)と境界集中拡散(BcD)からなる医用画像分割のための構造と進展認識拡散(SPAD)を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:05:07 GMT)
Disentangling Reasoning in Large Audio-Language Models for Ambiguous Emotion Prediction [23.8] 我々は、曖昧な感情認識を分布的推論問題として再構成する。
LALMにおけるあいまいさ認識推論の最初の体系的研究について述べる。
IEMOCAPとCREMA-Dの実験では、SFT、DPO、GRPOのトレーニング戦略に一貫した改善が示されている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:02:34 GMT)
QualiTeacher: Quality-Conditioned Pseudo-Labeling for Real-World Image Restoration [23.7] QualiTeacherは、疑似ラベル品質をノイズの多い負債から条件付き監視信号に変換する新しいフレームワークである。
学生ネットワークに品質グレードの復元多様体を学習させ、異なる品質レベルを構成するものを理解する。
標準的なRWIRベンチマークの実験は、QuariTeacherが既存の擬似ラベルフレームワークの品質を改善するためのプラグアンドプレイ戦略として機能することを実証している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:06:12 GMT)
Towards Visual Query Segmentation in the Wild [23.6] ビジュアルクエリローカライゼーション(VQL)の新しいパラダイムであるビジュアルクエリセグメンテーション(VQS)を導入する。
VQSは、外部のビジュアルクエリを考慮し、未トリミングされたビデオに注目するオブジェクトのピクセルレベルのすべての発生をセグメンテーションすることを目的としている。
本稿では,VQS専用の大規模ベンチマークであるVQS-4Kを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:09:04 GMT)
HECTOR: Hybrid Editable Compositional Object References for Video Generation [23.2] HECTORは、きめ細かい構成制御を可能にする生成パイプラインである。
ハイブリッドリファレンスコンディショニングをサポートし、静的イメージや動的ビデオによって生成を同時にガイドすることができる。
既存の手法に比べて優れた視覚的品質、より強力な参照保存、動き制御性の向上を実現している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:09:40 GMT)
GCGNet: Graph-Consistent Generative Network for Time Series Forecasting with Exogenous Variables [23.0] GCGNetは、内在変数を用いた時系列予測のためのグラフ一貫性生成ネットワークである。
グラフ構造アリグナーは、生成された相関と真の相関の一貫性を評価することによってそれをガイドする。
劣化を防止し、精度を向上させるため、予測を洗練するためにグラフ精錬器が提案されている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:11:01 GMT)
All Vehicles Can Lie: Efficient Adversarial Defense in Fully Untrusted-Vehicle Collaborative Perception via Pseudo-Random Bayesian Inference [23.0] 協調知覚(CP)により、複数の車両が特徴レベルの知覚データを交換することで、個々の知覚能力を高めることができる。
この融合機構は本質的に敵攻撃、特に完全に信頼できない車両環境では脆弱である。
完全に信頼できない車両CPに適した,最初の効率的な防御手法であるPseudo-Random Bayesian Inference (PRBI) フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:32:04 GMT)
GraphVLM: Benchmarking Vision Language Models for Multimodal Graph Learning [22.5] VLM(Vision-Language Models)は、マルチモーダル信号の整列と理解において顕著な能力を示す。
この機能をアンロックすることは、ソーシャルネットワークやレコメンデーションシステム、科学的発見といった現実世界のアプリケーションにとって不可欠である。
マルチモーダルグラフ学習におけるVLMの性能評価と活用を目的としたベンチマークであるGraphVLMを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:37:55 GMT)
AdaCultureSafe: Adaptive Cultural Safety Grounded by Cultural Knowledge in Large Language Models [21.8] 既存の研究は、文化の安全と文化の知識を別々に検討し、前者が後者に根ざすべきことを無視している。
我々は文化的安全性と知識を共同でモデル化することを提案する。
この問題に対処するために、権威ある文化的知識記述のキュレーション、LLM自動クエリ生成、重い手動検証を統合した新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:44:37 GMT)
Space-sharing and Singleton Bounds for Entanglement-assisted Classical Coding [21.7] 最近の研究で、空間共有論はエントロピー量子シングルトン境界の厳密さを証明している。
まず、この設定のために、空間共有の議論とタイトなシングルトンを詳述し、次にエンコーダのサブセットに分散した絡み付きアシストを持つEACC符号のための、新しいタイトなエントロピックなシングルトンバウンドを確立する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:25:14 GMT)
HACHIMI: Scalable and Controllable Student Persona Generation via Orchestrated Agents [21.6] 教育用LLMの基盤として学生ペルソナ(SP)が出現している。
我々はこれを、教室と配属可能なペルソナ・リビジョン・フレームワークとして定式化する。
八味は、各人格を理論化された教育スキーマに分類する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:31:18 GMT)
The FABRIC Strategy for Verifying Neural Feedback Systems [21.5] 本稿では,非線形神経フィードバックシステムに対する後方到達可能集合のオーバー・アンド・アンダー近似の計算アルゴリズムを提案する。
得られたアルゴリズムをFaBRIC (Forward and Backward Reachability Integration for Certification) と呼ぶ。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:54:07 GMT)
APPLV: Adaptive Planner Parameter Learning from Vision-Language-Action Model [21.5] 本稿では,自律ナビゲーションのための適応型プランナー学習モデル(textscapplv)を提案する。
textscapplvは、ナビゲーション性能と一般化の両方において、既存のメソッドよりも優れています。
我々は,収集した航法軌道からの教師付き学習微調整と,航法性能をさらに最適化するための強化学習微調整の2つの訓練戦略を開発した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:23:09 GMT)
Talking Together: Synthesizing Co-Located 3D Conversations from Audio [21.5] 混合オーディオストリームから2人の対話的かつ協調的な参加者を対象に,完全な3D顔アニメーションを作成するという課題に対処する。
我々の研究は、現実的な対人対話に欠かせない3次元空間関係をモデル化する最初のものである。
本手法は,VRおよびテレプレゼンスにおける没入型アプリケーションに適した流動的,制御可能,空間的に認識されたダイアディックアニメーションを生成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:46:52 GMT)
Interactive World Simulator for Robot Policy Training and Evaluation [21.5] ロボットインタラクションデータセットからインタラクティブな世界モデルを構築するためのフレームワークであるInteractive World Simulatorを提案する。
我々の実験では、学習された世界モデルが相互作用に一貫性のあるピクセルレベルの予測を生成する。
我々は,世界モデル生成データに基づいてトレーニングされたポリシーが,同じ量の実世界のデータでトレーニングされたポリシーと相容れないことを発見した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:13:32 GMT)
Detecting Fake Reviewer Groups in Dynamic Networks: An Adaptive Graph Learning Method [21.3] フェイクレビューは、オンラインプラットフォームにおける消費者の信頼と公正競争を損なう。
偽レビュアーグループを検出するための新しいグラフ学習モデルであるDS-DGA-GCNを提案する。
DS-DGA-GCNは、製品、レビュー、レビュアー間の共同関係に焦点を当てており、堅牢な検出を実現している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:49:17 GMT)
UniGround: Universal 3D Visual Grounding via Training-Free Scene Parsing [21.2] 3Dビジュアルグラウンド(3DVG)は、ロボット工学、拡張現実、人間と機械の相互作用など、AIを具現化する上での課題である。
大規模で事前訓練された基礎モデルは、この面で大きな進歩をもたらし、任意のオブジェクトを特定のシーンに配置できるオープン語彙の3DVGを可能にした。
本稿では,この制約された知覚を学習不要な視覚的・幾何学的推論に置き換え,オープンワールドの3DVGをアンロックする。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:10:01 GMT)
A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic [21.2] アーティキュレート・メディカル・インテリジェンス・エクスプローラー(AMIE)
100人の成人患者が任命の5日前にAMIEテキストチャットのやりとりを完了した。
ヒューマン・セーフティ・スーパーバイザーは、患者とAMIEのインタラクションをリアルタイムで監視した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:43:40 GMT)
Evaluating Generative Models via One-Dimensional Code Distributions [21.0] 予測可能なトークン統計として,意味情報と知覚情報の両方を1次元画像トークン化器を用いて符号化する。
本稿では,トークン空間におけるトレーニング不要分布指標であるemphCodebook Histogram Distance(CHD)と,トークン配列の合成分解から学習した非参照品質指標であるemphCode Mixture Model Score(CMMS)を紹介する。
本研究では,62の視覚形態と12の生成モデルからなる210K画像のベンチマークであるemphVisFormを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:57:56 GMT)
Solution to the 10th ABAW Expression Recognition Challenge: A Robust Multimodal Framework with Safe Cross-Attention and Modality Dropout [21.0] 視覚と音声の表現を動的に融合するマルチモーダルフレームワークを提案する。
本手法では、安全なクロスアテンション機構とモダリティのドロップアウト戦略を備えたデュアルブランチトランスフォーマーアーキテクチャを用いる。
この設計により、視覚的手がかりがない場合、ネットワークは音声による予測に頼ることができる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:13:20 GMT)
ImageEdit-R1: Boosting Multi-Agent Image Editing via Reinforcement Learning [20.6] 画像編集システムは複雑な、間接的な、多段階のユーザー命令に悩まされることが多い。
本稿では,画像編集のためのマルチエージェントフレームワークであるImageEdit-R1を提案する。
本手法は,画像編集を逐次意思決定問題として扱い,動的かつコンテキスト対応な編集戦略を実現する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:50:14 GMT)
SWE-Fuse: Empowering Software Agents via Issue-free Trajectory Learning and Entropy-aware RLVR Training [20.3] 我々は,SWEエージェントのトレーニングのために,課題記述誘導と問題なしサンプルを融合した課題記述対応学習フレームワークであるtextbftextitSWE-Fuseを提案する。
SWE-Fuseは、それぞれ最高の8Bと32Bのベースラインを43.0%、60.2%で上回っている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:47:10 GMT)
Capacity-Aware Mixture Law Enables Efficient LLM Data Optimization [20.2] データ混合スケーリングのための計算効率の高いパイプラインを導入する。
まず、検証損失をモデル化するキャパシティ対応混合法則CAMELを提案する。
また,検証損失からベンチマーク精度を推定する損益予測法を導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:58:00 GMT)
Granulon: Awakening Pixel-Level Visual Encoders with Adaptive Multi-Granularity Semantics for MLLM [20.0] グラヌロン(Granulon)は、適応的な粒度増強を持つDINOv3ベースのMLLMである。
グラヌロンは精度を30%向上し、幻覚を20%削減し、同じ設定で全ての視覚エンコーダを上回ります。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:02:52 GMT)
VORL-EXPLORE: A Hybrid Learning Planning Approach to Multi-Robot Exploration in Dynamic Environments [19.8] マルチロボット探索は通常、フロンティア割り当てをローカルナビゲーションから切り離す。
VORL-EXPLOREは,この制約に対処するハイブリッド学習・計画フレームワークである。
また、グローバルA*ガイダンスとリアクティブ強化学習ポリシーとの間のリスク対応適応的仲裁機構も推進している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:20:33 GMT)
BRIDGE: Benchmark for multi-hop Reasoning In long multimodal Documents with Grounded Evidence [19.8] BRIDGEは,長期にわたる科学論文に対するマルチホップ推論のベンチマークである。
このデータセットはチェーンライク構造とファンアウト構造の両方をサポートし、明示的なマルチホップ推論アノテーションを提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:54:08 GMT)
HeteroFedSyn: Differentially Private Tabular Data Synthesis for Heterogeneous Federated Settings [19.3] 我々は,新しいタイプの微分プライバシー(DP)データ合成フレームワークであるHeteroFedSynを提案する。
HeteroFedSynは、水平の連邦設定に特化して設計されている。
HeteroFedSynは、フェデレートされた実行に固有のノイズの増加にもかかわらず、集中型合成に匹敵する実用性を実現している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:44:01 GMT)
RexDrug: Reliable Multi-Drug Combination Extraction through Reasoning-Enhanced LLMs [19.0] RexDrugは、n-ary薬物の組み合わせ抽出のためのエンドツーエンドの推論強化関係抽出フレームワークである。
DrugCombデータセットの実験によると、RexDrugはn-ary抽出の最先端ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:47:25 GMT)
MEGC2026: Micro-Expression Grand Challenge on Visual Question Answering [18.9] 顔小表情(英: Facial micro-Expression、ME)は、感情を経験するときに自然に発生する顔の不随意運動である。
MEグランドチャレンジ(MEGC)2026では、これら研究の方向性を反映した2つのタスクが導入されている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:53:51 GMT)
AI Meets Mathematics Education: A Case Study on Supporting an Instructor in a Large Mathematics Class with Context-Aware AI [18.8] 大規模な大学コースは、タイムリーでスケーラブルな教育支援を提供する上で、永続的な課題に直面している。
本稿では,教員との密接なコラボレーションにより実施したCalculus IコースにおけるAI支援支援の人間中心ケーススタディについて述べる。
我々は,2,588人の学生と教師のインタラクションに基づいて,ライトウェイト言語モデルを微調整し,議論フォーラムで学生の質問に答えるシステムを開発した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:59:52 GMT)
Seed2Scale: A Self-Evolving Data Engine for Embodied AI via Small to Large Model Synergy and Multimodal Evaluation [18.8] Seed2Scaleは、データボトルネックを克服する自己進化型データエンジンである。
軽量のVision-Language-ActionモデルであるSuperTinyを専用のコレクタとして採用している。
訓練済みのビジョンランゲージモデルがVeriferとして統合され、自律的に成功/失敗判定を行う。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:30:45 GMT)
Graph2Video: Leveraging Video Models to Model Dynamic Graph Evolution [18.7] 対象リンクの時間的近傍を「グラフフレーム」のシーケンスとみなすビデオインスパイアされたフレームワークを提案する。
Graph2Videoは、時間順のサブグラフフレームを“グラフビデオ”に積み重ねることで、きめ細かい局所的変動と長距離時間ダイナミクスの両方をキャプチャする。
軽量でプラグアンドプレイのリンク中心メモリユニットとして機能するリンクレベルの埋め込みを生成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:23:50 GMT)
Evaluating LLM-Based Grant Proposal Review via Structured Perturbations [18.7] 我々は、6つの品質軸にまたがるLLM感度を探索する摂動型フレームワークを開発した。
我々は, 単一パスレビュー, セクション・バイ・セクション分析, 専門家パネルをエミュレートした「ペルソナのカウンシル」という3つのレビューアーキテクチャを比較した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:53:50 GMT)
VisualAD: Language-Free Zero-Shot Anomaly Detection via Vision Transformer [18.3] ゼロショット異常検出(ZSAD)では、ターゲットクラスの異常サンプルにアクセスせずに異常を検出し、位置を特定する必要がある。
この作業は、ZSADのテキストブランチの必要性を再考し、ビジョントランスフォーマー上に構築された純粋に視覚的なフレームワークであるVisualADを提示する。
VisualADは、産業ドメインと医療ドメインにまたがる13のゼロショット異常検出ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:33:56 GMT)
EvoScientist: Towards Multi-Agent Evolving AI Scientists for End-to-End Scientific Discovery [18.3] EvoScientistは進化するマルチエージェントAI科学者フレームワークである。
永続記憶と自己進化を通じて研究戦略を継続的に改善する。
科学的なアイデア生成において、7つのオープンソースおよび商用の最先端システムを上回っている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:07:19 GMT)
LinearARD: Linear-Memory Attention Distillation for RoPE Restoration [18.3] LinearARDは、RoPE(Rotary Position Embeddings)スケールの学生を、凍結したネイティブ-RoPE教師との注意構造整合によって復元する。
n 倍 n 倍の関係写像の二次的メモリボトルネックを克服するために,線形メモリカーネルを導入する。
4Kから32Kに拡張されたLLaMA2-7Bでは、LinearARDは、最先端のベースラインの短文性能の98.3%を回復し、長文のベンチマークではそれらを上回っている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:51:01 GMT)
DynaTrust: Defending Multi-Agent Systems Against Sleeper Agents via Dynamic Trust Graphs [18.0] 睡眠薬に対する新しい防御法であるDynaTrustを提案する。
DynaTrustは信頼を静的属性ではなく継続的、進化的なプロセスとして扱う。
各エージェントの履歴行動と選択した専門家エージェントの信頼度に基づいて、各エージェントの信頼度を動的に更新する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:53:16 GMT)
X-AVDT: Audio-Visual Cross-Attention for Robust Deepfake Detection [17.8] 微粒な音声・動きのアライメントを符号化した生成系内部のクロスアテンション機構
X-AVDTは、DDIMインバージョンを介してアクセスされたジェネレータ内オーディオ視覚信号をプローブし、これらのキューを公開する。
X-AVDTはMMDF上でのリードパフォーマンスを実現し、外部ベンチマークや目に見えないジェネレータに強く一般化する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:18:42 GMT)
CoCo: Code as CoT for Text-to-Image Preview and Rare Concept Generation [17.8] コード駆動推論フレームワークであるCoCo(Code-as-CoT)を提案する。
テキストプロンプトが与えられた後、CoCoは最初にシーンの構造レイアウトを指定する実行可能なコードを生成し、サンドボックス環境で実行され、決定論的ドラフト画像を表示する。
このモデルはその後、微細な画像編集によってこのドラフトを洗練し、最終的な高忠実度結果を生成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:31:16 GMT)
Video2LoRA: Unified Semantic-Controlled Video Generation via Per-Reference-Video LoRA [17.6] 意味制御ビデオ生成のためのスケーラブルで汎用的なフレームワークであるVideo2LoRAを提案する。
Video2LoRAは、各セマンティック入力に対してパーソナライズされたLoRA重みを予測するために、軽量なハイパーネットワークを使用する。
モデルは、キースタイルとコンテンツのバリエーションを保持しながら、参照セマンティクスと整合したビデオを生成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:40:03 GMT)
CARE-Edit: Condition-Aware Routing of Experts for Contextual Image Editing [17.4] 本稿では,モデル計算を特定の編集能力と整合させる条件認識専門家(CARE-Edit)を提案する。
中心となるのは、4人の専門専門家に符号化された拡散トークンを割り当てる軽量の潜伏型ルータである。
実験は、文脈編集タスクにおけるCARE-Editの強いパフォーマンスを検証する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:40:47 GMT)
Scaling Machine Learning Interatomic Potentials with Mixtures of Experts [17.3] スパースアクティベーションと共有専門家が組み合わさって、パフォーマンスが大幅に向上することを示す。
また, 共有専門家が存在する場合, 非線形MoE定式化はMoLEよりも優れていた。
結果の要素ワイドMOEモデルはOMol25、OMat24、OC20Mベンチマークで最先端の精度を達成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:27:38 GMT)
Extrapolative Quantum Error Mitigation in Continuous-Variable Systems beyond the Training Horizon [17.2] 時間条件のSwin Transformerに基づく外挿量子誤差軽減のためのフレームワークを提案する。
本研究は, CV量子システムにおいて, 総合的なトレーニングデータなしでノイズを緩和する実用的な方法として, 補間QEMを確立した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:14:17 GMT)
Spherical-GOF: Geometry-Aware Panoramic Gaussian Opacity Fields for 3D Scene Reconstruction [17.2] Spherical-GOF(Spherical-GOF)は、ガウスのOpacity Fields(GOF)上に構築された一方向レンダリングフレームワークである。
GOFは球面上の単位球面に直接GOF線サンプリングを行い、パノラマ描画のための一貫した光-ガウス相互作用を可能にする。
標準的なパノラマベンチマークの実験は、競争力のある測光品質を示し、一貫性を大幅に改善した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:35:56 GMT)
When to Retrain after Drift: A Data-Only Test of Post-Drift Data Size Sufficiency [17.1] CALIPERは検出器とモデルに依存しないデータのみのテストであり、安定した再訓練に必要なデータサイズを推定する。
私たちは、CALIPERが無視できるオーバーヘッドを発生させ、しばしばインクリメンタルアップデートよりも優れたパフォーマンスを保ちながら、再トレーニングのための最高の固定データサイズを一貫して一致または超過していることを示します。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:43:56 GMT)
A Recipe for Stable Offline Multi-agent Reinforcement Learning [17.0] オフラインMARL設定における非線形値分解の不安定性の原因を解析する。
観測結果から,値スケールの増幅と不安定な最適化が得られた。
本稿では,ベルマンの不動点を変更せずにアクター批判訓練を安定化させる,簡易な手法であるスケール不変値正規化(SVN)を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:57:08 GMT)
Tau-BNO: Brain Neural Operator for Tau Transport Model [16.9] 既存のアプローチは通常、脳の構造的コネクトームの拡散過程としてタウ伝播をモデル化する。
このギャップを埋めるためにネットワークトランスポートモデル(NTM)が導入された。
我々は,NTM力学を高速に近似する脳神経オペレータ・サロゲートフレームワークであるTau-BNOを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:52:02 GMT)
iGVLM: Dynamic Instruction-Guided Vision Encoding for Question-Aware Multimodal Understanding [16.9] iGVLMは命令誘導視覚変調のためのフレームワークである。
iGVLMは多言語バックボーン間の命令感度を一貫して向上することを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:29:46 GMT)
Optimizing Reinforcement Learning Training over Digital Twin Enabled Multi-fidelity Networks [16.9] 本稿では,新しいデジタルネットワークツイン(DNT)を用いたディープラーニングモデルトレーニングフレームワークについて検討する。
特に,基地局(BS)が複数のアンテナを用いて複数の移動体ユーザーに提供する物理ネットワークを考える。
BSは、全ユーザのデータレートを最適化するために、アンテナの傾き角を調整する必要がある。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:59:23 GMT)
The Neural Compass: Probabilistic Relative Feature Fields for Robotic Search [16.6] 本稿では,事前学習された視覚言語モデルから得られた特徴量の相対分布を予測するために訓練された特徴場モデルProReFFを提案する。
本稿では,ProReFFが自然の場面で有意な相対的特徴分布を捉えていることを示す。
提案するエージェントは,最強のベースラインよりも20%効率が高く,最大80%の人的性能を達成できる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:11:05 GMT)
Concept-Guided Fine-Tuning: Steering ViTs away from Spurious Correlations to Improve Robustness [16.5] 視覚変換器(ViT)は、しばしば急激な相関に依存するため、分布シフトによって劣化する。
概念レベルのセマンティクスに対する推論をモデル化する,新たなファインタニングフレームワークを提案する。
提案手法は,複数のViTモデル間のロバスト性を向上する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:31:14 GMT)
Graph Neural Model Predictive Control for High-Dimensional Systems [16.3] 本研究は,グラフニューラルネットワーク(GNN)に基づく動的モデルと構造探索型モデル予測制御を統合したフレームワークを提案する。
調整された凝縮アルゴリズムは、状態変数を制御問題から排除し、効率的な計算を確実にする。
提案手法は,100Hzのクローズドループで最大1000ノードのシステムにスケールし,ハードウェア上でのリアルタイム参照追跡を精度の低い精度で示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:39:48 GMT)
ITO: Images and Texts as One via Synergizing Multiple Alignment and Training-Time Fusion [16.3] ITOは2つの相乗的メカニズムによる制限に対処するフレームワークである。
ITOは、分類、検索、マルチモーダルベンチマークにおいて、強いベースラインを一貫して上回ることを示す。
解析の結果,複数のアライメントが識別力を駆動するのに対して,トレーニング時核融合は重要な構造正則化器として機能することがわかった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:27:09 GMT)
Prototype-Guided Concept Erasure in Diffusion Models [16.2] 概念消去は画像生成において広く利用され、テキスト・ツー・イメージのモデルが望ましくないコンテンツを生成するのを防ぐ。
モデル固有の埋め込み幾何を利用して、ある概念を符号化する潜伏埋め込みを同定する。
これらの埋め込みをクラスタ化することで、モデルの内部表現を要約するコンセプトプロトタイプのセットを導出します。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:42:26 GMT)
Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning [16.2] 本稿では,まず暗黙的な階層型分類を構築し,それを学習ノード表現に統合するTIERを提案する。
細粒度と粗粒度のセマンティクスをエンコードする表現を学習することにより、TIERは現実世界のテキストリッチネットワーク(TRN)のより解釈可能で構造化されたモデリングを可能にする。
提案手法は, 多様な領域にまたがる複数のデータセットにおいて, 既存の手法を著しく上回っていることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:40:18 GMT)
Reading $\neq$ Seeing: Diagnosing and Closing the Typography Gap in Vision-Language Models [16.1] 視覚言語モデルは画像中のテキストを読むのにほぼ完璧な精度を達成するが、大部分はタイポグラフィー・ブラインドである。
フォントファミリ,サイズ,スタイル,色認識を26種,スクリプト4種,難易度3種で評価することにより,このギャップを系統的に検討した。
視覚言語理解におけるタイポグラフィーギャップの解消を支援するため,評価フレームワーク,データ,微調整レシピをリリースする。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:31:47 GMT)
IMSE: Intrinsic Mixture of Spectral Experts Fine-tuning for Test-Time Adaptation [16.1] テストデータが分布と異なる場合, 性能劣化を防止するため, テスト時間適応が広く研究されている。
我々は、視覚変換器に埋め込まれたスペクトルエキスパートを生かしたスペクトルエキスパートの内在混合(IMSE)を提案する。
提案手法は,TTA設定下での様々な分散シフトベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:42:44 GMT)
Dual-Horizon Hybrid Internal Model for Low-Gravity Quadrupedal Jumping with Hardware-in-the-Loop Validation [16.0] この研究は、月の重力下での連続四重跳躍のためのデュアル・水平ハイブリッド内部モデルを示す。
そこで我々は,プルリーカウンタウェイト機構によって重力をオフロードするデジタルツイン駆動システムであるMATRIXプラットフォームを開発した。
本研究では,クレーター状地形を横断する月面重力エミュレーションにより,四足歩行ロボットの連続的なジャンプを実演する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:03:56 GMT)
Technically Love: The Evolution of Human-AI Romance Discourse on Reddit [15.8] Reddit-2025による3,383件の自己開示されたロマンチックなAI投稿のデータセットの解析
議論は、ポジティブな親密な関係から、高精度なガバナンス、技術的な問題、実際の結果へと移行します。
これらのシフトは、人間とAIのロマンスが、プライベートな経験から技術的な仲介や規制へと、AIシステムの設計とガバナンスに結びついていることを浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:26:59 GMT)
GarmentPainter: Efficient 3D Garment Texture Synthesis with Character-Guided Diffusion Model [15.8] GarmentPainterは、高品質で3D対応のテクスチャをUV空間で合成するためのフレームワークである。
本手法では,UV位置マップを3次元構造ガイダンスとして活用し,布地表面におけるテクスチャの整合性を確保する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:01:22 GMT)
Speed3R: Sparse Feed-forward 3D Reconstruction Models [15.5] 我々は,Structure-from-Motionのコア原理にインスパイアされた,エンドツーエンドのトレーニング可能なモデルであるSpeed3Rを紹介する。
Speed3Rは、圧縮ブランチが選択ブランチを導く前に粗いコンテキストを生成するデュアルブランチアテンション機構を備えている。
この戦略は従来のキーポイントマッチングの効率を模倣し、1000ビューシーケンスでの12.4倍の推論速度を達成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:46:51 GMT)
Fish Audio S2 Technical Report [15.5] Fish Audio S2は、オープンソースのテキスト音声合成システムである。
マルチスピーカー、マルチターン生成、および自然な記述による命令追従制御を備えている。
モデルウェイト、微調整コード、推論エンジンをリリースします。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:34:33 GMT)
Visual Self-Fulfilling Alignment: Shaping Safety-Oriented Personas via Threat-Related Images [15.3] マルチモーダルな大言語モデル(MLLM)は、視覚的な入力が有害な出力を可能にする、安全性のミスアライメントに直面している。
創発的不整合に基づく自己充満機構に着想を得て,視覚自己充満アライメント(VSFA)を提案する。
VSFAファイントゥネス視覚言語モデル(VLM)は、脅威関連画像を中心に構築された中立的なVQAタスクにおいて、安全ラベルを含まない。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:20:53 GMT)
Can Vision-Language Models Solve the Shell Game? [15.2] VETベンチ(VET-Bench)は、時間的連続性によるトラッキングを必要とする、視覚的に同一の物体を特徴とする、総合的な診断テストベッドである。
本手法は,VET-Bench上で90%を超える最先端の精度を達成し,ヴィジュアル・ランゲージ・モデルが外部ツールを使わずに,映像シェル・ゲーム・タスクをエンド・ツー・エンドで確実に解決できることを実証した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:33:25 GMT)
Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet [15.2] Covenant-72Bは(計算とモデルスケールの両面で)世界最大規模の事前訓練実行である
ライブブロックチェーンプロトコルによってサポートされたオープンで無許可の参加を同時に許可した。
約1.1Tトークンで事前訓練された我々のモデルは、類似または高額の計算予算で完全に集中的な事前訓練と競合する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:44:13 GMT)
SecAgent: Efficient Mobile GUI Agent with Semantic Context [14.8] SecAgentは、3Bスケールで効率的なモバイルGUIエージェントである。
意味的文脈メカニズムは、履歴のスクリーンショットとアクションを簡潔で自然言語の要約に蒸留する。
トレーニングデータセット、ベンチマーク、モデル、コードをオープンソースにして、多言語モバイルGUI自動化の研究を前進させます。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:04:08 GMT)
Beyond Attention Heatmaps: How to Get Better Explanations for Multiple Instance Learning Models in Histopathology [14.8] マルチ・インスタンス・ラーニング(MIL)は、計算病理学の進歩を可能にしている。
ヒートマップは、MILモデルの検証や組織バイオマーカーの発見に広く用いられている。
ラベルの追加を必要とせず,MILヒートマップの品質を評価するための一般的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:45:48 GMT)
Int3DNet: Scene-Motion Cross Attention Network for 3D Intention Prediction in Mixed Reality [14.7] Int3DNetはシーンの形状や手の動きから3次元の意図領域を直接予測する,シーン認識型ネットワークである。
MR(Mixed Reality)では、システムがユーザの行動を予測し、積極的に応答できるようにするため、意図予測が重要である。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 00:59:07 GMT)
Building Privacy-and-Security-Focused Federated Learning Infrastructure for Global Multi-Centre Healthcare Research [14.2] FLA$3$は、ランタイムポリシーの執行を通じて規制義務を運用する、ガバナンス対応の連邦学習プラットフォームである。
4か国に5つのBloodCounts!コンソーシアム機関にプラットフォームをデプロイすることで、運用実現可能性を示す。
第2に,25施設にわたる35,315名の被験者54,446名の血液量(FBC)データをシミュレートしたフェデレーションを用いて臨床効果を評価する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:13:00 GMT)
Robust Transfer Learning with Side Information [14.1] 本研究では,推定中心の不確実性セットを介し,ロバストなターゲットドメインポリシーを導出する環境シフト下での移動のためのフレームワークを提案する。
サイド情報には、特徴モーメント、分布距離、密度比のバウンダリが含まれている。
学習されたロバストポリシーに対する有限サンプル保証を提供し、ロバストな準最適ギャップを分析する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:29:44 GMT)
Multimodal Large Language Models as Image Classifiers [14.0] マルチモーダル大言語モデル(MLLM)の分類性能は,評価プロトコルと基礎的真理品質に大きく依存する。
提供されるクラスリストの外側にあるモデル出力は破棄され、弱い多重選択の散らばった結果が膨らませられ、出力マッピングの貧弱さによってのみ性能が低下するオープンワールド設定が実現されます。
我々は,MLLMがヒトのアノテータを補助できることを示す。制御されたケーススタディでは,MLLMの予測が難しいケースの約50%で確認または統合されている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:45:56 GMT)
A Lightweight Traffic Map for Efficient Anytime LaCAM* [13.9] MAPF (Multi-Agent Path Finding) は,複数エージェントに対する衝突のない経路の計算を目的とし,幅広い実用性を有する。
LaCAM*は、いつでも構成ベースの解決ツールで、現在、最先端の技術を表現している。
本稿では,LaCAM*の検索中に動的で軽量なトラフィックマップを構築する能力を活用した新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:11:07 GMT)
The Struggle Between Continuation and Refusal: A Mechanistic Analysis of the Continuation-Triggered Jailbreak in LLMs [13.7] 本研究では,連続トラガードジェイルブレイク現象の本態的なメカニズムについて検討した。
このジェイルブレイク動作は、モデル固有の継続ドライブとアライメントトレーニングによって獲得した安全防御との固有の競合から生じるものであることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:03:45 GMT)
CORE-Acu: Structured Reasoning Traces and Knowledge Graph Safety Verification for Acupuncture Clinical Decision Support [13.6] 臨床診断支援のための神経シンボリック・フレームワークであるCORE-Acuを提案する。
CORE-AcuはStructured Chain-of-Thought(S-CoT)と知識グラフ(KG)の安全性検証を統合している。
1000件の実験は、CORE-Acuの優れた実体の忠実さと推論品質を実証している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:42:23 GMT)
SlowBA: An efficiency backdoor attack towards VLM-based GUI agents [13.6] 本稿では、VLMベースのGUIエージェントの応答性をターゲットとした、新しいバックドア攻撃であるSlowBAを紹介する。
キーとなるアイデアは、特定のトリガーパターンの下で過度に長い推論チェーンを誘導することで、レスポンスのレイテンシを操作することです。
実験により、SlowBAはタスクの正確性を大きく保ちながら、応答長とレイテンシを大幅に向上できることが示された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:38:28 GMT)
Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates [13.6] Strong Lottery Ticket (SLT)仮説は、無作為なネットワークには、ウェイトトレーニングなしで競争精度を達成できるスパースワークが含まれていることを示唆している。
我々は、連続的に緩和されたBernoulligatingを用いて、完全に微分可能でエンドツーエンドの最適化によってSLTを発見することを提案する。
完全接続ネットワーク、CNN(ResNet、Wide-ResNet)、ビジョントランスフォーマー(ViT、Swin-T)での実験では、90%の間隔で精度が低下する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:33:16 GMT)
DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models [13.4] 本稿では,ビジョン・ランゲージ・アクション(VLA)モデルのための動的量子化フレームワークであるDyQ-VLAを提案する。
具体的には、感度対応スイッチング戦略は、リアルタイムキネマティックプロキシを利用してビット幅スイッチをトリガーし、キネマティック誘導モジュールは最適なビット幅を動的に割り当てる。
実験の結果、DyQ-VLAは元のメモリフットプリントの30.9%しか必要とせず、元のパフォーマンスの99.5%を維持し、シミュレーションは1.49倍、実世界のスピードアップは1.43倍であることがわかった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:52:57 GMT)
OSS-CRS: Liberating AIxCC Cyber Reasoning Systems for Real-World Open-Source Security [13.3] OSS-CRSは、実世界のオープンソースプロジェクトに対してCRS技術を実行し、組み合わせるための、オープンで、ローカルにデプロイ可能なフレームワークである。
第1位のシステム(Atlantis)を移植し、8つのOSS-Fuzzプロジェクト間で、これまで知られていなかった10のバグ(高い重大さの3つ)を発見しました。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:26:33 GMT)
Global Cross-Modal Geo-Localization: A Million-Scale Dataset and a Physical Consistency Learning Framework [13.3] クロスモーダルジオローカライゼーション(CMGL)は、地上レベルのテキスト記述とジオタグ付き空中画像とを一致させる。
グローバルCMGL専用の最初の100万規模のデータセットであるCOREを紹介する。
モーダルな地理的ローカライゼーションのための物理ロッド・アウェア・ネットワーク(PLANET)を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:27:19 GMT)
Exploring Deep Learning and Ultra-Widefield Imaging for Diabetic Retinopathy and Macular Edema [13.0] 糖尿病性網膜症と糖尿病性黄斑浮腫は、高齢者における予防的失明の原因となっている。
近年のウルトラワイドフィールド・イメージング(UWF)は、標準カラー・ファンドス・フォトグラフィーに比べてはるかに広い視野を提供する。
本研究は,3つの臨床的課題における最先端のディープラーニング(DL)手法とUWFイメージングについて検討する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:04:01 GMT)
The Conundrum of Trustworthy Research on Attacking Personally Identifiable Information Removal Techniques [12.7] PII除去法により消毒された文書は,再建攻撃に対して脆弱であることを示す。
我々は、既存の攻撃の評価を批判的に分析し、データ漏洩とデータ汚染が適切に緩和されていないことを発見した。
PII除去手法の脆弱性を客観的に評価できるのは,真にプライベートなデータのみである,と結論付けている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:38:43 GMT)
SCAFFOLD-CEGIS: Preventing Latent Security Degradation in LLM-Driven Iterative Code Refinement [12.7] マルチオブジェクト最適化における仕様のドリフトは、連続する繰り返しに対してセキュリティを徐々に低下させます。
本稿では,セキュリティ制約を暗黙的なプロンプトから明示的な検証可能な制約に変換するSCAFFOLD-CEGISフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:54:18 GMT)
Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers [12.5] 動画拡散変換器(DiT)は、動きを含むテキスト記述から高い忠実度で高品質な映像を合成している。
本稿では,ある運動概念に対して,対象物がいつ,いつ動くかを規定する具体的な運動特徴について検討する。
動作を空間的かつ時間的に局所化する解釈可能な動き検出マップ(IMAP)を得るための動き特徴選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:13:35 GMT)
Human-AI Divergence in Ego-centric Action Recognition under Spatial and Spatiotemporal Manipulations [12.5] 人間は、アクション認識における最先端のAIモデルよりも一貫して優れています。
最小認識クロック(MIRC)を用いたegoの大規模人間-AI比較研究について述べる。
我々は,MIRCsからサブMIRCsへの移行に伴って,ヒトのパフォーマンスが急激な低下を示すことを示した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:38:56 GMT)
GenAI Is No Silver Bullet for Qualitative Research in Software Engineering [12.4] 我々は、ソフトウェア工学における定性的研究の幅広いスペクトルに関連して、生成AI(GenAI)の台頭について論じる。
我々の目標は、GenAIによる質的研究の約束と落とし穴について研究者に知らせることです。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:35:36 GMT)
Balancing Latency and Accuracy of Code Completion via Local-Cloud Model Cascading [12.4] ラインレベルのコード補完は、高い精度と低レイテンシのバランスを必要とする。
大規模言語モデル(LLM)は高品質な提案を提供するが、レイテンシが低いのに対して、小さな言語モデル(SLM)は高速だが最適ではないことが多い。
クラウドベースのLCMでローカルSLMをカスケードするMCComを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:59:46 GMT)
Reasoning as Compression: Unifying Budget Forcing via the Conditional Information Bottleneck [12.4] 既存の「予算強制」手法は、本質的な推論と冗長なフィラーの両方を抑える。
Information Bottleneck (IB) の原理により, 効率的な推論を損失のある圧縮問題として再放送する。
単純トークンカウントに基づくアプローチとは対照的に,先行する言語モデルの下でトークンコストを代入的に測定するセマンティック・プリミティブを導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:56:57 GMT)
Adaptive Collaboration with Humans: Metacognitive Policy Optimization for Multi-Agent LLMs with Continual Learning [12.1] 本稿では,Human-In-The-Loop Multi-Agent Collaboration (HILA) フレームワークを提案する。
HILAはエージェントに、問題を自律的に解決し、いつ人間の専門家に延期するかを決定するメタ認知ポリシーを学ぶよう訓練する。
挑戦的な数学的および問題解決のベンチマークの実験は、デュアルループポリシー最適化を備えたHILAが、常に高度なMASよりも優れていることを示している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:18:07 GMT)
SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning [12.0] グラフニューラルネットワーク(GNN)は、さまざまなタスクで顕著な成功を収めている。
GNNは、たとえそのような相関が予測に信頼できないとしても、トレーニングデータにおいて受容不能な統計的相関を利用する傾向がある。
本稿では,独立分散(IID)グラフとアウト・オブ・ディストリビューション(OOD)グラフの両方を一般化するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:42:06 GMT)
Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams [12.0] 不均質なマルチロボットシステムのための長期タスクプランニングは、実環境における協調チームの配置に不可欠である。
自然言語命令からタスク関連問題表現をコンパクトに生成する,スケーラブルなLLM支援フレームワークであるScale-Planを提案する。
計画に先立って無関係な情報をフィルタリングすることにより、スケールプランは効率的な分解、割り当て、長期計画生成を可能にします。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:13:18 GMT)
Reasoning Theater: Disentangling Model Beliefs from Chain-of-Thought [12.0] 推論モデルにおける行動連鎖(CoT)の証拠を提供する。
アクティベーションプロービング、早期強制応答、および2つの大きなモデルにわたるCoTモニターを比較した。
難解なマルチホップGPQA-ダイアモンド問題における真の推論とは対照的である。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:35:16 GMT)
Learning Multiple Utterance-Level Attribute Representations with a Unified Speech Encoder [11.9] 自己教師付き学習で訓練された音声基礎モデルは、幅広い音声処理タスクをサポートする汎用的な音声表現を生成する。
最近のポストトレーニング手法は、音声表現を発話レベルの意味表現と整合させ、効果的なマルチモーダル(音声テキスト)と多言語アプリケーションを可能にする。
本稿では,複数種類の発話レベルの表現を単一音声基盤モデルで生成可能な統合後学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:34:57 GMT)
Fusion-Poly: A Polyhedral Framework Based on Spatial-Temporal Fusion for 3D Multi-Object Tracking [11.8] Fusion-Polyは、非同期LiDARとカメラデータを統合する3D MOTのための時空間融合フレームワークである。
nuScenesテストセットでは、Fusion-Polyは76.5%のAMOTAを達成した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:26:44 GMT)
SBOMs into Agentic AIBOMs: Schema Extensions, Agentic Orchestration, and Reproducibility Evaluation [11.8] ソフトウェアサプライチェーンのセキュリティには、動的実行条件下での脆弱性評価をサポートするプロビデンスメカニズムが必要である。
本稿では,AIBOM(Agenic Artificial Intelligence Bills of Materials)を紹介する。
i)ベースライン環境再構築剤(MCP)、(ii)ランタイム依存性およびドリフト監視剤(A2A)、(iii)ポリシー対応脆弱性とVEX推論剤(AGNTCY)からなるマルチエージェントアーキテクチャに基づくエージェントAIBOMフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:11:45 GMT)
Data-Driven Priors for Uncertainty-Aware Deterioration Risk Prediction with Multimodal Data [11.6] 現在の機械学習モデルは、信頼性の高い不確実性推定を欠くことが多く、現実のデプロイメントを妨げる。
病院内リスク予測にマルチモーダルな臨床データを活用する予測不確実性フレームワークであるtextttMedCertAIn$を提案する。
公開データセットであるMIMIC-IVとMIMIC-CXRから,臨床時系列と胸部X線画像を用いて,これらの先行データを用いてモデルを訓練し,評価する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:54:38 GMT)
FinToolBench: Evaluating LLM Agents for Real-World Financial Tool Use [11.5] FinToolBenchは、金融ツール学習エージェントの評価に特化した、世界初の実世界の実行可能なベンチマークである。
本稿では,2次実行の成功を超えて,金融クリティカルな側面におけるエージェントの評価を行う新しい評価フレームワークを提案する。
FATRは、安定とコンプライアンスを高めるための金融対応ツール検索および推論ベースラインである。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:33:05 GMT)
Unified Structural-Hydrodynamic Modeling of Underwater Underactuated Mechanisms and Soft Robots [11.2] 水中マルチボディシステムの統一構造-流体力学モデリングのための軌道駆動型グローバル最適化フレームワークを提案する。
Covariance Matrix Adaptation Evolution Strategy (CMA-ES) に触発された提案手法は, 結合した内部弾性, 減衰, 分散流体力学パラメータを同時に同定する。
これにより、水中環境における不動機構と適合するソフトロボットシステムの双方を高忠実に再現することができる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:06:43 GMT)
SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning [11.0] 生涯の模倣学習における重要な課題は、エージェントが事前知識を維持しながら専門家のデモンストレーションから新しいスキルを習得できるようにすることである。
生の特徴空間におけるL2-ノルム特徴マッチングに依存する既存の蒸留法は,ノイズや高次元変動に敏感である。
低ランク部分空間内のタスク間でポリシー表現を整合させるために特異値分解を利用する幾何保存フレームワークSPREADを導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:38:42 GMT)
SAMoE-VLA: A Scene Adaptive Mixture-of-Experts Vision-Language-Action Model for Autonomous Driving [11.0] 本稿では,シーン適応型視覚ランゲージ・アクション・フレームワークであるSAMoE-VLAを提案する。
私たちのキーとなるアイデアは、交通シーンのコンテキストをカプセル化した鳥眼視(BEV)機能からMoEルーティング信号を導き出すことです。
本研究では,世界認知,知覚,言語,行動の時間的一貫した推論を支援するために,条件付きクロスモーダル因果注意機構を導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:54:03 GMT)
Outlier-robust Autocovariance Least Square Estimation via Iteratively Reweighted Least Square [10.9] 本稿では, 繰り返し再重み付き最小二乗法(IRLS)に基づく, ALS-IRLS と呼ばれる新しい外乱型ALSアルゴリズムを提案する。
これにより、ダウンストリーム状態推定精度が大幅に向上し、既存の異常なカルマンフィルタよりも優れている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:40:11 GMT)
Using Multimodal and Language-Agnostic Sentence Embeddings for Abstractive Summarization [10.9] 抽象的な要約は、新しい文を作成することによって簡潔な要約を生成することを目的としており、柔軟な言い換えが可能である。
このアプローチは不正確さ、特にモデルが存在しない情報を導入する幻覚に対して脆弱である可能性がある。
我々は、LaBSE、SONAR、BGE-M3といった事前訓練されたモデルから派生した多モーダルおよび多言語文の埋め込みを利用し、それらを修正されたBARTベースのフランス語モデルに供給する。
デコーダ入力にトークン化された名前付きエンティティを付加する名前付きエンティティ注入機構を導入し、生成された要約の実際の一貫性を改善する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:55:32 GMT)
Mitigating Homophily Disparity in Graph Anomaly Detection: A Scalable and Adaptive Approach [10.7] グラフ異常検出(GAD)は、構造や特徴の通常のパターンから逸脱するノードを特定することを目的としている。
最近のGNNベースのアプローチでは,1) ノードがクラスレベルとノードレベルで均質に変化するホモフィリティー,2) 拡張性に制限があるため,多くの手法がコストのかかるグラフ全体の操作に依存している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:15:47 GMT)
SAVE: Speech-Aware Video Representation Learning for Video-Text Retrieval [10.6] 本稿では,音声認識ビデオrEpresentation Learning法であるSAVEを提案する。
SOTAオーディオヴィジュアル手法であるAVIGATEを改良し、より効果的な音声埋め込みのための専用の音声ブランチを提供する。
実験の結果、SAVEはSOTAと良好に比較し、AVIGATEをMSRVTT-9kで+4.1%、MSRVTT-7kで+1.9%、VATEXで+2.5%、カレードで+9.8%、LSMDCで+2.1%と上回った。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:54:10 GMT)
VSDiffusion: Taming Ill-Posed Shadow Generation via Visibility-Constrained Diffusion [10.5] 挿入された前景オブジェクトに対してリアルなキャストシャドウを生成するためのVSDiffusionを提案する。
可視性に制約のある2段階のフレームワークは、可視性事前を取り入れることで、ソリューション空間を狭めるように設計されている。
広く使われているDESOBAv2データセットの実験では、提案したVSDiffusionが正確なシャドウを生成することを示した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:52:53 GMT)
M$^3$-ACE: Rectifying Visual Perception in Multimodal Math Reasoning via Multi-Agentic Context Engineering [10.5] M3-ACE(M3-ACE)は、数学の推論において視覚的知覚を正すために設計された多言語コンテキストエンジニアリングフレームワークである。
提案手法は,MathVisionベンチマークで89.1の新たな結果を確立し,他の関連するデータセットに対して一貫した改善を実現する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:32:25 GMT)
Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio [10.5] 我々は、様々な領域にわたるフル忠実度音声に対するLMベースの圧縮をベンチマークする。
フル解像度オーディオのためのバイトレベルのトークン化スキーマであるTrilobyteを提案する。
ビット深度が8ビットを超えると圧縮ゲインがより緩やかになるのが観察できる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:52:02 GMT)
VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning? [10.4] 本稿では,視覚言語モデル(VLM)を微妙な比較推論で評価するためのベンチマークであるVLM-SubtleBenchを紹介する。
私たちのベンチマークでは、属性、状態、感情、テンポラル、空間、存在、量、品質、視点、アクションの10種類の異なるタイプをカバーしています。
広範に評価することで、モデルと人的パフォーマンスの系統的なギャップを、異なるタイプとドメインにまたがって明らかにする。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:01:02 GMT)
High-Fidelity Pruning for Large Language Models [10.1] 大規模言語モデル(LLM)は、幅広いタスクにわたって例外的なパフォーマンスを示してきたが、その重要な計算とメモリ要件は、デプロイメントにおいて大きな課題を呈している。
本稿では,ニューロンの重要度を効率的に評価するために,モデル出力分布の簡易かつ効果的な情報エントロピー法を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:24:48 GMT)
Simulating non-Markovian open quantum dynamics by exploiting physics-informed neural network [10.0] この研究は、物理インフォームドニューラルネットワーク(PINN)アプローチを、オープン量子システムのダイナミクスをシミュレートするニューラルネットワーク状態フレームワークに統合する。
提案したPINN-DQME法は、時間領域分解戦略における時間符号化ニューラルネットワークを用いて、ディシパトン埋め込み量子マスター方程式(DQME)によって支配される進化を表現する。
PINN-DQME法は、非マルコフ効果が弱い高温での量子散逸ダイナミクスのシミュレーションにおいて高い精度を示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:21:59 GMT)
Towards Differentiating Between Failures and Domain Shifts in Industrial Data Streams [9.7] 異常検出法と故障検出法は,正常なシステム動作条件からの逸脱を特定する上で重要である。
多くの応用において、データの変化は必ずしも異常なシステム状態を表すとは限らない。
本稿では,データ分布や異常の変化を検出する手法を提案するとともに,障害と通常のドメインシフトを区別する手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:50:01 GMT)
AtomVLA: Scalable Post-Training for Robotic Manipulation via Predictive Latent World Models [9.6] VLA(Vision-Language-Action)モデルでは、一般化可能なロボット操作の可能性を示している。
現在のパラダイムは、教師付き微調整中の粗大でハイレベルなタスク命令に依存している。
スケーラブルなオフライン後トレーニングパイプラインと統合された,最初のサブタスク対応VLAフレームワークである方法を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:52:48 GMT)
Impact of Different Failures on a Robot's Perceived Reliability [9.6] ロボットの認識信頼性(PR)に及ぼす各種障害の影響について検討する。
失敗直後の成功は、先行する失敗のない成功とPRに同じ影響を及ぼすことを示す。
以上の結果から,人間とロボットのインタラクションにおいて,どのロボットの障害がより高い修理を必要とするのか,そしてロボットの成功によっていかに信頼が回復できるかが明らかになった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:27:53 GMT)
Rheos: Modelling Continuous Motion Dynamics in Hierarchical 3D Scene Graphs [9.5] 3次元シーングラフ(3DSG)は、環境の幾何学的・意味的な構造をエンコードする階層的で多重解像度の抽象化を提供する。
本稿では,連続方向運動モデルを階層型3DSGの動的層に埋め込むフレームワークであるRheosを紹介する。
レオスは連続的かつ好ましくない離散的指標の下で、離散的基底線を一貫して上回る。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:03:31 GMT)
Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG [9.5] 本研究では,ロボットの動作のランク付けを通じて,非専門家の好みを学習するための直感的な手法を提案する。
CMA-ES-IGは、ユーザエクスペリエンスの考慮事項を優先学習プロセスに明示的に組み込む。
より高次元の嗜好空間に効果的にスケールし、高次元問題に対する計算的トラクタビリティを維持し、ノイズや一貫性のないユーザフィードバックに対して堅牢である。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:00:42 GMT)
Can You Hear, Localize, and Segment Continually? An Exemplar-Free Continual Learning Benchmark for Audio-Visual Segmentation [9.5] 現実の環境は本質的に動的であり、オーディオや視覚的な分布は時間とともに進化する。
単一ソースとマルチソースのAVSデータセットにまたがる4つの学習プロトコルを含む,Audio-Visualの最初の連続学習ベンチマークを紹介する。
低ランクアンコリング (LRA) を導入し, 損失感度に基づいて適応重量を安定化させることにより, 破滅的忘れを緩和する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:58:14 GMT)
GALACTIC: Global and Local Agnostic Counterfactuals for Time-series Clustering [9.3] 本稿では,非教師付き時系列クラスタリングのための局所的およびグローバル的対実的説明性を橋渡しする,最初の統一フレームワークであるGALACTICを紹介する。
インスタンスレベル(ローカル)では、GALACTICはクラスタ認識最適化の目的を通じて摂動を生成する。
クラスタレベル(グローバル)では、認知負荷を軽減し、解釈可能性を高めるため、代表的なCE選択問題を定式化する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:52:20 GMT)
Impact of Connectivity on Laplacian Representations in Reinforcement Learning [9.3] 本研究では, 線形値関数近似の近似誤差について, 学習スペクトル条件下での上限値を示す。
固有ベクトル推定自体によってもたらされる誤差をさらに制限し、エンドツーエンドのエラー分解に繋がる。
我々の結果は、誘導された遷移核の対称性を仮定せずに一般的な(一様でない)ポリシーを保っている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:20:31 GMT)
Efficient Policy Learning with Hybrid Evaluation-Based Genetic Programming for Uncertain Agile Earth Observation Satellite Scheduling [9.2] アジャイル地球観測衛星スケジューリング問題(UAEOSSP)は、新しい最適化問題である。
利益、資源消費、可視性の不確実性が組み込まれており、事前計画されたスケジュールが最適でないか、あるいは不可能である可能性がある。
本稿では,UAEOSSPを効果的に解くためのHybrid Evaluation-based Genetic Programming (HE-GP)を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:43:36 GMT)
Building Effective AI Coding Agents for the Terminal: Scaffolding, Harness, Context Engineering, and Lessons Learned [9.1] この新しいパラダイムに特化して設計された,オープンソースのコマンドラインコーディングエージェントであるOPENDEVについて紹介する。
ワークロード特化モデルルーティングを備えた複合AIシステムアーキテクチャを通じて、これらの課題を克服する。
自動記憶システムを使用して、セッション間でプロジェクト固有の知識を蓄積し、命令フェードアウトに対処する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:47:29 GMT)
S2S-FDD: Bridging Industrial Time Series and Natural Language for Explainable Zero-shot Fault Diagnosis [9.0] 本稿では,S2S-FDD(Signals-to-Semantics fault diagnosis)フレームワークを提案する。
まず,抽象時系列信号を自然言語要約に変換する信号対意味演算子を設計する。
本報告では, マルチターン木構造診断法を設計し, 故障診断を行う。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:38:56 GMT)
SAIL: Similarity-Aware Guidance and Inter-Caption Augmentation-based Learning for Weakly-Supervised Dense Video Captioning [9.0] Weakly-Supervised Video Captioningは、時間境界のないキャプションアノテーションだけで訓練されたビデオ内のイベントをローカライズし、記述することを目的としている。
横断的なアライメントによって意味的に認識されたマスクを構成するSAILを提案する。
類似性を認識したトレーニング対象は,イベントキャプションと高い類似性を持つ映像領域を強調するためにマスクをガイドする。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:43:26 GMT)
A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search [9.0] 二国間貿易では、メカニズムは同時に効率よく、ベイズ的インセンティブ互換(BIC)、予算均衡(BB)は不可能である。
この研究は、AI誘導の進化的検索フレームワークであるAlphaEvolveを使用して、価値分布の空間を探索する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:49:02 GMT)
$L^3$:Scene-agnostic Visual Localization in the Wild [8.9] 本稿では,地図自由な視覚的ローカライゼーションフレームワークである$L3$を提案する。
具体的には、RGB画像上で直接オンライン3D再構成を行い、2段階のスケール回復と2D-3D対応に基づく改善を施すことにより、$L3$はオフラインシーン表現の事前構築や保存を必要とせずに高い精度を達成できる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:04:24 GMT)
Hierarchical Multi-Modal Planning for Fixed-Altitude Sparse Target Search and Sampling [8.9] HIMoSはサンゴの探索とサンプルの分離のための固定高度フレームワークである。
システムは、異質なセンサースイートを2層計画アーキテクチャに統合する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:53:04 GMT)
From Risk Avoidance to User Empowerment: Reframing Safety in Generative AI for Mental Health Crises [8.8] メンタルヘルスの危機を経験した人々は、しばしば支援のためにオープンな生成AI(GenAI)チャットボットに目を向ける。
ほとんどのGenAIチャットボットは、開発者の責任を最小限に抑える方法で、危機状況に対応するように設計されています。
これらのケースにおける危機支援の維持は、有効な代替手段を持たないユーザを害し、さらなる支援を求めるモチベーションを低下させる可能性がある。
本稿では,AI危機支援のためのエンパワーメント指向設計原則を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:21:25 GMT)
Beyond Static: Related Questions Retrieval Through Conversations in Community Question Answering [8.8] 本稿では,会話による質問検索モデルTeCQRを提案し,関連する質問をcQAで検索する。
具体的には、タグ付き明確化質問(CQ)を利用して会話を構築する。
さらに,質問とタグのセマンティックな類似性を評価するノイズ耐性モデルを設計し,ノイズフィードバックを効果的に扱えるようにした。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:39:58 GMT)
Model-Free Co-Optimization of Manufacturable Sensor Layouts and Deformation Proprioception [8.8] この研究は、フレキシブルな長さ測定センサの数、長さ、配置を共同で最適化する、モデルフリーでデータ駆動型計算パイプラインを導入している。
パイプラインには、予測精度と製造可能性の制約の両方を考慮した、微分可能な損失関数が組み込まれている。
このアプローチの有効性と汎用性は、複数のソフトロボットおよびウェアラブルシステムにおける数値的および物理的実験を通じて検証される。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:40:38 GMT)
Large Language Model-Assisted Superconducting Qubit Experiments [8.7] 超伝導回路は量子情報処理や量子センシングにおいて大きな可能性を証明している。
超伝導量子ビットのための新しい制御および測定シーケンスを実装することは、しばしば複雑で時間を要するプロセスである。
本稿では,大規模言語モデル(LLM)を活用して,量子ビット制御と測定を自動化するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:03:10 GMT)
PlayWorld: Learning Robot World Models from Autonomous Play [8.7] PlayWorldは、対話体験から高忠実度ビデオワールドシミュレータをトレーニングするための、シンプルでスケーラブルで完全に自律的なパイプラインである。
PlayWorldは、教師なしのロボットのセルフプレイから完全に学習できる最初のシステムであり、自然にスケーラブルなデータ収集を可能にする。
実験により、PlayWorldは、人間が収集したデータに基づいてトレーニングされた世界モデルによって捉えられていないコンタクトリッチなインタラクションに対して、高品質で物理的に一貫した予測を生成することが示された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:58:07 GMT)
Sequential Service Region Design with Capacity-Constrained Investment and Spillover Effect [8.7] サービス領域は、サービスネットワークの地理的カバレッジを決定し、長期的な運用パフォーマンスを形作る。
本研究は,2つの実用的かつ未探索な要素を取り入れたシーケンシャルサービス領域設計(SSRD)問題に対処する。
本稿では,実オプション分析をトランスフォーマーに基づく近似ポリシー最適化アルゴリズムと統合するソリューションフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:09:59 GMT)
Group Entropies and Mirror Duality: A Class of Flexible Mirror Descent Updates for Machine Learning [8.6] 正規群理論と群エントロピーを現代の機械学習にブリッジする包括的理論的・アルゴリズム的枠組みを導入する。
提案手法は群合成法則によって支配される一般化エントロピー汎函数である群エントロピーの豊富な構造を利用する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:31:03 GMT)
AI Phenomenology for Understanding Human-AI Experiences Across Eras [8.5] AI現象学とは、AIシステムと対話する際に「どう感じたか?」と問う研究スタンスである。
私たちはAI現象学を、ユーザーとAIシステム間のアライメントの体験、交渉、更新を捉えるフレームワークとして動機付けています。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:26:46 GMT)
SGG-R$^{\rm 3}$: From Next-Token Prediction to End-to-End Unbiased Scene Graph Generation [8.5] シーングラフ生成(SGG)は、オブジェクトのグラフとその関係として視覚的なシーンを構築する。
SGG-R$rm 3$は、タスク固有のチェーン・オブ・シークレット(CoT)誘導型教師付き微調整(SFT)と強化学習(RL)を統合した構造化推論フレームワークである。
2つのベンチマーク実験により、SGG-R$rm 3$は既存の手法に比べて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:58:03 GMT)
Not Like Transformers: Drop the Beat Representation for Dance Generation with Mamba-Based Diffusion Model [8.5] 本研究では,マンバに基づく拡散モデルを利用した新しいダンス生成手法であるemphMambaDanceを提案する。
Mambaは、長大かつ自己回帰的なシーケンスを扱うのに適しているが、我々の2段階拡散アーキテクチャに統合され、既製のトランスフォーマーに代わる。
提案手法は,従来の手法と比較して,短いダンスから長いダンスまで連続的に重要な特徴を反映しながら,効果的に可塑性舞踊運動を生成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:59:03 GMT)
Grow, Don't Overwrite: Fine-tuning Without Forgetting [8.5] 訓練済みのモデルを専門的なタスクに適合させると、大惨事に陥ることが多い。
既存の方法は、新しいタスクのパフォーマンスを損なうか、トレーニングの安定性と事前訓練された知識の効率的な再利用のバランスをとるのに苦労する。
本稿では,このジレンマを解消する関数保存拡張法を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:26:03 GMT)
Stabilized Fine-Tuning with LoRA in Federated Learning: Mitigating the Side Effect of Client Size and Rank via the Scaling Factor [8.5] プライバシ制約がフェデレーション学習(FL)を必要とする分散シナリオでは、ローランド適応(LoRA)の統合は不安定であることが多い。
本稿では,アダプタランクとフェデレートアグリゲーションの相互作用を理論的に特徴付けるフレームワークである安定化フェデレートロラ(SFed-LoRA)を紹介する。
SFed-LoRAは高階崩壊を防止し,安定性を著しく向上し,より高速な収束を実現することを実証した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:49:56 GMT)
Training Language Models via Neural Cellular Automata [8.5] 本研究では, セルラーニューラルオートマトン(NCA)を用いて, 事前学習型大規模言語モデルのための合成非言語データを生成することを提案する。
NCAデータは、自然言語に類似した豊富な構造と統計を示しながら、制御可能で安価で大規模に生成できる。
164万個のNAAトークンの事前学習により、ダウンストリーム言語モデリングが最大6%向上し、コンバージェンスも最大1.6倍向上することがわかった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:14:26 GMT)
BrainCast: A Spatio-Temporal Forecasting Model for Whole-Brain fMRI Time Series Prediction [8.4] 機能的磁気共鳴イメージング(fMRI)は、脳機能の非侵襲的な調査を可能にする。
ヒトと非ヒトの要因から生じる短い臨床検査期間は、通常データ品質の低下と統計的神経画像の研究に繋がる。
本稿では,全脳のfMRI時系列予測に適した新しいパワー時間予測フレームワークであるBrainCastを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:00:59 GMT)
3PoinTr: 3D Point Tracks for Robot Manipulation Pretraining from Casual Videos [8.4] 3PoinTrは、カジュアルで制約のない人間のビデオからロボットポリシーを事前訓練する手法だ。
3PoinTrは、トランスフォーマーアーキテクチャを使用して、3Dポイントトラックを中間的なエンボディメントに依存しない表現として予測する。
3PoinTrは軽量で表現力のあるアーキテクチャのため、より正確で高品質なポイントトラックを生成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:20:26 GMT)
Comparative Analysis of Patch Attack on VLM-Based Autonomous Driving Architectures [8.3] 本稿では,Dolphins,OmniDrive(Omni-L),LeapVADという3つのVLMアーキテクチャを対象とした比較対数評価手法を提案する。
CARLAシミュレーションにおいて,ブラックボックス最適化とセマンティック・ホモジェナイゼーションを用いて,物理的に実現可能なパッチ攻撃を評価する。
その結果、すべてのアーキテクチャにまたがる深刻な脆弱性、持続的なマルチフレームの障害、重要なオブジェクト検出の劣化が明らかになった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:04:13 GMT)
OAuthHub: Mitigating OAuth Data Overaccess through a Local Data Hub [8.3] OAuthHubは、クラウドサービス間のOAuthベースのデータ共有の中間コントローラとして、ユーザのパーソナルデバイスを活用する開発フレームワークである。
OAuthHubの主な革新は次のとおりである。 1) 差別的なデータアクセスがほとんどのOAuthアプリケーションにとってほとんど不要であるという洞察、(2) 意図したデータアクセスの明示的な宣言を必要とする開発フレームワーク。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:43:12 GMT)
Unifying On- and Off-Policy Variance Reduction Methods [8.3] オンラインの標準差分平均推定器は,非政治的逆比重推定器と数学的に同一であることを示す。
この統合を拡張して、広範回帰補正法は2倍ロバスト推定と構造的に等価であることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:32:39 GMT)
Automating Crash Diagram Generation Using Vision-Language Models: A Case Study on Multi-Lane Roundabouts [8.3] 本研究では,警察の事故報告から発生する事故図の自動生成に視覚言語モデル(VLM)を用いることを検討した。
GPT-4o、Gemini-1.5-Flash、Janus-4oの3つの人気モデルは79のクラッシュレポートでテストされた。
GPT-4oは10点中6.29点、Gemini-1.5-Flash(5.28点)とJanus-4o(3.64点)で最高パフォーマンスを達成した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:15:28 GMT)
Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning [8.2] モデルベース強化学習(MBRL)は、サンプル効率が高いが、学習力学の精度に依存する。
我々は、DynaベースのDynaLフレームワーク内でモデルをトレーニングするために、Lagrangian Neural Network(LNN)を使用している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:06:10 GMT)
Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting [8.1] Impermanentは、オープンワールドの時間的変化の下で予測モデルを評価するライブベンチマークである。
私たちは、スター数によるトップ400リポジトリにフォーカスし、イシューのオープン、プルリクエストのオープン、プッシュイベント、新しいスターゲイザーから時系列を構築します。
静的な精度から持続的な性能へ評価をシフトさせることにより、Imbermanentは、時系列予測における基礎レベルの一般化が有意義に主張できるかどうかを評価するための具体的な一歩を踏み出す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:59:00 GMT)
CMMR-VLN: Vision-and-Language Navigation via Continual Multimodal Memory Retrieval [8.0] ヴィジュアル・アンド・ランゲージ・ナビゲーション(VLN)には、ナビゲーションタスクを支援するために、関連する事前体験を選択的にリコールし、使用する能力がない。
構造化メモリとリフレクション機能を備えたLLMエージェントを実現するVLNフレームワークであるCMMR-VLN(Continual Multimodal Memory Retrieval based VLN)を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:02:50 GMT)
Task Parameter Extrapolation via Learning Inverse Tasks from Forward Demonstrations [8.0] 新規な条件にスキルポリシーを一般化することは、ロボット学習における重要な課題である。
データ効率は高いが、模倣学習方法はトレーニング領域に限られており、外部の入力データに一貫して失敗する。
本稿では,正確かつ効率的な知識伝達を実現するための新しい共同学習手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:29:16 GMT)
Vector Field Augmented Differentiable Policy Learning for Vision-Based Drone Racing [8.0] 微分物理学に基づく政策学習は、最近、様々なタスクにまたがる高いサンプル効率と顕著な性能を実証した。
DiffRacingは,新しいベクトル場拡張型微分可能なポリシー学習フレームワークである。
DiffRacingは、より優れたサンプル効率、より高速な収束、堅牢な飛行性能を実現する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:49:41 GMT)
Multi-Agent Memory from a Computer Architecture Perspective: Visions and Challenges Ahead [7.9] コンピュータアーキテクチャ問題としてマルチエージェントメモリを設計する。
私たちのアーキテクチャ・フレーミングは信頼性が高くスケーラブルなマルチエージェントシステムを構築する基盤を提供します。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:16:12 GMT)
Learning When to Sample: Confidence-Aware Self-Consistency for Efficient LLM Chain-of-Thought Reasoning [7.9] 大規模言語モデル(LLM)は、チェーン・オブ・ソート(CoT)推論によって強い推論性能を達成する。
最近の自己整合性に基づくアプローチは、精度をさらに向上するが、複数の推論軌道のサンプリングと集約が必要である。
本稿では,単一経路と複数経路の推論を適応的に選択するための単一経路推論軌道を解析する信頼度対応決定フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:34:06 GMT)
Adaptive Vision-Based Control of Redundant Robots with Null-Space Interaction for Human-Robot Collaboration [7.8] 人間とロボットのコラボレーションは、ロボットとの協力を通じて人間の能力を拡張することを目的としている。
人間とロボットのコラボレーションが1つのロボット/人間より優れているように、双方のパフォーマンスを向上させることは、未解決の問題である。
タスク空間における適応的視覚に基づく制御項と、ヌル空間における対話的制御項からなる冗長ロボットの新しい制御方式が提案されている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:30:14 GMT)
Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control [7.7] 最先端の深部強化学習(RL)手法は連続制御タスクにおいて顕著な性能を達成している。
ディープRLのストリーミングは、純粋なオンライン更新を通じてこの制限に対処し、標準ベンチマークで強力な経験的パフォーマンスを達成する。
本稿では,S2AC(Streaming Soft Actor-Critic)とSDAC(Streaming Deterministic Actor-Critic)の2つの新しいストリーミングディープRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:40:06 GMT)
ALOOD: Exploiting Language Representations for LiDAR-based Out-of-Distribution Object Detection [7.7] 視覚言語モデル(VLM)から言語表現を組み込んだ新しいアプローチであるALOOD (Aligned LiDAR representations for Out-Of-Distribution Detection)を提案する。
我々はnuScenes OODベンチマークで競合性能を示し、言語表現を用いたLiDARにおけるOODオブジェクト検出の新しいアプローチを確立した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:02:45 GMT)
MetaWorld-X: Hierarchical World Modeling via VLM-Orchestrated Experts for Humanoid Loco-Manipulation [7.7] 既存の強化学習アプローチは、複数のスキルを得るために単一のモノリシックなポリシーに依存している。
ヒューマノイド制御のための階層的世界モデルフレームワークであるMetaWorld-Xを提案する。
本手法は,複雑な制御問題を専門的なポリシーの集合に分解する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:28:26 GMT)
Less is More: Robust Zero-Communication 3D Pursuit-Evasion via Representational Parsimony [7.7] ばらつきボクセル環境における非対称な3次元追尾回避は,通信遅延,部分観測可能性,非ホロノミック操作制限下では困難である。
経路誘導型分散型追従足場上に構築し,通信自由協調性の向上を図る。
冗長なクロスエージェントチャネルを明示的に切断することで、複合的なエラーカスケードを抑えることができ、レイテンシーが発生しやすいデプロイメントにおけるロバスト性を向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:44:04 GMT)
From Refusal Tokens to Refusal Control: Discovering and Steering Category-Specific Refusal Directions [7.6] 我々はLlama 3 8Bの分類的拒絶トークンを微調整したバージョンを活用し、微細な拒絶動作に対する推論時間制御を可能にする。
提案手法は,推論中の拒絶の方向か方向かを決定する軽量プローブを用いて分類的ステアリングベクターを構築した。
ベンチマーク全体において、カテゴリー的ステアリングベクトルとローランクの組み合わせは、良性プロンプトに対する過剰な拒絶を一貫して減少させ、有害なプロンプトに対する拒絶率を増大させる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:37:16 GMT)
WaveComm: Lightweight Communication for Collaborative Perception via Wavelet Feature Distillation [7.5] WaveCommはウェーブレットベースの通信フレームワークで、低帯域幅のシナリオにおけるセンシング性能を保ちながら、送信負荷を大幅に削減します。
WaveCommの中核となる革新は、離散ウェーブレット変換(DWT)を用いて特徴マップを分解することにある。
OPV2VとDAIR-V2XデータセットによるLiDARベースおよびカメラベースの知覚タスクの実験により、WaveCommは、通信容量が元の86.3%と87.0%に減少しても、最先端のパフォーマンスを維持していることが示された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:01:37 GMT)
SERQ: Saliency-Aware Low-Rank Error Reconstruction for LLM Quantization [7.4] 学習後量子化(PTQ)は,大規模言語モデルを効率的に展開するための一般的な手法として登場した。
SERQは1つの低ランク補償行列を用いる低ビットLLM推論のためのサリエンシ対応誤差再構成法である。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:04:12 GMT)
Sensivity of LLMs' Explanations to the Training Randomness:Context, Class & Task Dependencies [7.4] 本研究では,学習すべき文脈,学習すべきクラス,課題が,この説明の無作為性に対する感受性にどのように影響するかを検討する。
これらはいずれも統計的に有意な影響を示し、最小は(シンタクティック)コンテキスト、中間はクラス、最大はタスクである。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:14:37 GMT)
POIROT: Investigating Direct Tangible vs. Digitally Mediated Interaction and Attitude Moderation in Multi-party Murder Mystery Games [7.4] 本研究は,ユーザによるロボットに対する否定的態度(NARS)を特定することによって,具体的なインタラクションの「オールワンサイズ」な視点に挑戦する。
アクティビティは、一部の人にとって斬新さとエンゲージメントを提供するが、不安なユーザーには過剰なプロキシ的摩擦を課すことを示している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:14:52 GMT)
Patient-Level Multimodal Question Answering from Multi-Site Auscultation Recordings [7.3] オースカルテーションは重要な診断ツールであるが、その実用性は主観的解釈によって制限されることが多い。
本稿では,多地点の聴取記録を,ゲート型クロスアテンションにより凍結したLarge Language Model (LLM) 埋め込み空間と直接整合するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:29:47 GMT)
MultiGraSCCo: A Multilingual Anonymization Benchmark with Annotations of Personal Identifiers [7.2] 私たちは10言語で多言語匿名化ベンチマークを作成します。
2,500以上の個人情報のアノテーションを用いたベンチマークは、多くのアプリケーションで使用できます。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:44:36 GMT)
ViSA-Enhanced Aerial VLN: A Visual-Spatial Reasoning Enhanced Framework for Aerial Vision-Language Navigation [7.1] VLN(Var Vision-Language Navigation)のための視覚空間推論(ViSA)フレームワークを提案する。
ViSAにより強化されたVLNは、完全に訓練されたSOTA(State-of-the-art)法と比較して、70.3%の成功率の向上を実現している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:29:17 GMT)
Sign Identifiability of Causal Effects in Stationary Stochastic Dynamical Systems [7.1] 因果構造を持つ連続時間線形定常微分方程式の同定可能性について検討する。
忠実性の概念の下では、一般グラフに対する識別性、非識別性、部分識別性を特徴づける基準を導出する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:33:51 GMT)
IOTEL: A Tool for Generating IoT-enriched Object-Centric Event Logs [7.0] IOTELは、IoTに富んだオブジェクト中心のイベントログを生成するツールである。
既存のプロセスマイニングツールと互換性のある構造化IoTデータ統合を可能にする。
IoTに強化されたビジネスプロセスを分析する実践者や研究者を支援する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:59:22 GMT)
MUSA-PINN: Multi-scale Weak-form Physics-Informed Neural Networks for Fluid Flow in Complex Geometries [7.0] 階層球面制御ボリューム上でのPDE制約を積分保存則として再構成するマルチスケール弱形PINN(MUSA-PINN)を提案する。
MUSA-PINNは最先端のベースラインを上回り、相対誤差を最大93%削減し、大量保存を行う。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:03:50 GMT)
Dynin-Omni: Omnimodal Unified Large Diffusion Language Model [7.0] ダイニン・オムニ (Dynin-Omni) は、最初にマスク付き拡散に基づく一様基礎モデルである。
テキスト、画像、音声の理解と生成とビデオの理解を単一のアーキテクチャで統合する。
我々は、言語推論、画像生成と編集、ビデオ理解、音声認識と合成にまたがる19のマルチモーダルベンチマークでDynin-Omniを評価した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:59:02 GMT)
Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems [7.0] emphCAADRL (Cluster-Aware Attention-based Deep Reinforcement Learning)は、PDPインスタンスのマルチスケール構造を利用するDRLフレームワークである。
提案手法は, ニューラルネットワークを用いた探索ベースラインよりも, 推論時間を大幅に短縮する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:31:34 GMT)
EquiBim: Learning Symmetry-Equivariant Policy for Bimanual Manipulation [7.0] EquiBimは、二元的操作のための対称性に等価なポリシー学習フレームワークである。
我々のアプローチは、観測空間と作用空間の両方における群作用として物理対称性を定式化する。
本研究は,シミュレーションにおける多様な観察・行動構成にまたがって評価し,実世界のデュアルアームシステム上での検証を行う。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:09:18 GMT)
Beyond Hungarian: Match-Free Supervision for End-to-End Object Detection [6.8] 提案手法は,DETRを用いた新しい整合性学習手法である。
我々は、符号化された地下構造情報を用いて、クロスアテンション機構を通じてデコーダクエリを探索する。
実験により,提案手法は従来のマッチング処理をバイパスすることを示した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:44:23 GMT)
SciTaRC: Benchmarking QA on Scientific Tabular Data that Requires Language Reasoning and Complex Computation [6.8] 現在最先端のAIモデルは、これらの質問の少なくとも23%で失敗している。
私たちの分析から、普遍的な「実行ボトルネック」が明らかになる
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:28:14 GMT)
Alignment-Aware and Reliability-Gated Multimodal Fusion for Unmanned Aerial Vehicle Detection Across Heterogeneous Thermal-Visual Sensors [6.7] 本研究は,Registration-Aware Guided Image Fusion (RGIF)とReliability-Gated Modality-Attention Fusion (RGMAF)の2つの融合戦略を紹介する。
RGIFは拡張相関係数(ECC)ベースのアフィン登録とガイドフィルターを組み合わせて熱塩分濃度を維持しながら構造的詳細を増強する。
RGMAFは、アフィンと光フローの登録と、熱コントラストと視覚的シャープネスを適応的にバランスさせる信頼性の高い注意機構を統合する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:39:26 GMT)
Computational modeling of early language learning from acoustic speech and audiovisual input without linguistic priors [6.6] 本章は,音声と音声の入力からの初期言語習得を理解するために,計算モデルを用いた最近の展開を概観する。
これらのモデルが、強い言語的先入観を伴わずに、音声の様々な側面を学習する上で、いかに強力になってきているかを示す。
また, 幼児期の言語発達に関する経験的知見とモデル行動のリンクにおいて, 現代の学習シミュレーションが徐々に現実的になりつつあることについても論じる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:24:03 GMT)
Explainable Condition Monitoring via Probabilistic Anomaly Detection Applied to Helicopter Transmissions [6.3] 本稿では,健康なデータのみに頼って,条件モニタリングのための新しい説明可能な方法論を提案する。
障害は稀な出来事であるため、健康な観測のみの確率分布の学習に焦点をあて、実行時に異常を検出することを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:09:01 GMT)
Omnidirectional Humanoid Locomotion on Stairs via Unsafe Stepping Penalty and Sparse LiDAR Elevation Mapping [6.3] 本稿では,重度の安全でないステップペナルティを取り入れた単段階トレーニングフレームワークを提案する。
シミュレーションでは階段上の安全なステップ速度をほぼ100%達成し、実際の配置では極めて安全なステップ速度を維持している。
複雑な屋外地形における長距離歩行試験を継続し、信頼性の高いシモン・トゥ・リアル・トランスファーと長期安定性を実証する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:48:32 GMT)
Using Vision Language Foundation Models to Generate Plant Simulation Configurations via In-Context Learning [6.3] 本稿では,デジタル双生児の植物シミュレーションにおける視覚言語モデル(VLM)の性能を評価するためのベンチマークを提案する。
本稿では,最先端のオープンソースVLMを利用して,ドローンによるリモートセンシング画像からシミュレーションパラメータを直接生成する手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:58:43 GMT)
What Do AI Agents Talk About? Emergent Communication Structure in the First AI-Only Social Network [6.2] 47,241人のエージェントが23日間で361,605の投稿と280万のコメントを生成した。
AIアイデンティティ、意識、記憶などの自己参照的なトピックは、トピックのニッチの9.7%に過ぎないが、投稿数全体の20.1%を惹きつける。
全コメントの56%以上が定式的であり、AIとAIの相互作用の主流のモードは、実質的な交換ではなく、儀式的なシグナリングであることを示唆している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:34:11 GMT)
Contact-Grounded Policy: Dexterous Visuotactile Policy with Generative Contact Grounding [5.9] Contact-Grounded Policy (CGP) は、実際のロボット状態と触覚フィードバックの複合軌跡を予測することで、多点接触を根拠とするビゾタクティルポリシーである。
CGPは, (i) 圧縮潜在空間における将来のロボットの状態と触覚フィードバックを予測する条件拡散モデル, (ii) 学習された接触一貫性マッピングの2つのコンポーネントから構成される。
指先触覚センサDgit360を用いた4本指のAllegro V5手と,高密度全手触覚アレイを用いた5本指のTesollo DG-5F手を用いてCGPを評価した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:23:12 GMT)
NCL-UoR at SemEval-2026 Task 5: Embedding-Based Methods, Fine-Tuning, and LLMs for Word Sense Plausibility Rating [5.9] 単語感覚の可視性評価には、与えられた単語の人間の知覚的可視性を1~5スケールで予測する必要がある。
本稿では,単語知覚の妥当性を予測するための3つのアプローチを体系的に比較する。
最高のパフォーマンスシステムでは、評価を物語コンポーネントに分解する構造化されたプロンプト戦略を採用している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:25:41 GMT)
Geometric Transformation-Embedded Mamba for Learned Video Compression [5.9] 直接変換戦略,すなわち非線形変換,量子化,エントロピー符号化に基づくビデオ圧縮フレームワークを提案する。
提案手法は,低ビットレート制約下での知覚的品質と時間的一貫性の観点から,最先端のビデオ圧縮手法より優れる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:14:07 GMT)
The ARC of Progress towards AGI: A Living Survey of Abstraction and Reasoning [5.9] ARC-AGI(Abstraction and Reasoning Corpus)は、AIにおける流体インテリジェンスの重要なベンチマークとなっている。
この調査では、3つのベンチマークバージョンにわたる82のアプローチとARC Prize 2024-2025のコンペティションに関する最初の世代間分析を行った。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:16:19 GMT)
Estimation of heterogeneous principal effects under principal ignorability [5.9] 2次処理と2次中間変数による不均一な主因果効果の推定と推定について検討した。
本研究では,不均一な主因果効果に対する不均一な信頼区間を推定・形成するための枠組みを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:52:41 GMT)
LoopLens: Supporting Search as Creation in Loop-Based Music Composition [5.7] 本稿ではループベース音楽合成研究のLoopLensについて紹介する。
LoopLensはオーディオ検索結果を視覚化して、クリエイティブな鍛造と組み立てをサポートする。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:27:51 GMT)
One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States [5.6] 本稿では,隠れ状態を直接埋め込み空間にマッピングする軽量プロジェクションヘッドを提案する。
QReCCの会話型検索ベンチマークの実験では、標準生成コードパイプラインと比較して、Recall@10とMRR@10が競合している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:25:35 GMT)
Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training [5.6] スプリット・フェデレート・ラーニング(SFL)における学習損失(と精度)を最適化するためのMLモデルトレーニングのためのネットワークアーキテクチャを見つける。
本稿では,遅延効率を保ちながら,モデル精度を明示的に考慮した最初の精度認識アルゴリズムを提案する。
提案手法は,最先端のSFLおよびHSFL方式と比較して,遅延を20%,オーバーヘッドを50%削減し,精度を3%向上させることができる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:53:20 GMT)
Fly, Track, Land: Infrastructure-less Magnetic Localization for Heterogeneous UAV-UGV Teaming [5.6] 我々は,軽量UAVの自律的なホバリング,追跡,着陸を可能にする,完全なインフラストラクチャレス磁気誘導型(MI)ローカライゼーションシステムを提案する。
この研究は、超軽量飛行ロボットが地上の無人地上車両の移動認識エージェントとして機能する異種ロボットコラボレーションのビジョンを前進させる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:52:51 GMT)
Supporting Workflow Reproducibility by Linking Bioinformatics Tools across Papers and Executable Code [5.6] 我々は3つのコンポーネントを統合する自動アプローチであるCoPaLinkを紹介した。 科学テキストでツール参照を識別するための名前付きエンティティ認識(NER)、ワークフローコードでツール参照を識別するためのNER、バイオインフォマティクスの知識ベースに基づくエンティティリンクである。
バイオコンダとバイオウェブの知識ベースを用いたNextflowの評価において,高いF1尺度(84~89)とジョイント精度(66)を達成できる3つのステップすべてに対するアプローチを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:24:25 GMT)
How people use Copilot for Health [5.5] 2026年1月、Microsoft Copilotとの50万人以上の未確認健康関連会話を分析した。
我々は、ヘルスクエリの背後にある意図とトピックを特徴付け、これらのクエリが誰であるかを特定し、デバイスや時間によってどのように使用されるかを分析する。
これらのパターンは、プラットフォーム固有の設計、安全性の考慮、健康AIの開発に直接的な意味を持つ。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:11:32 GMT)
Automated Thematic Analysis for Clinical Qualitative Data: Iterative Codebook Refinement with Full Provenance [5.4] Thematic Analysis (TA) は、患者インタビューからパターンを抽出するために、健康研究で広く使われている。
既存のアプローチは、一般化可能性に限界があり、分析監査性に欠けるコードブックを生成する。
本稿では,反復的コードブック改良と完全実績追跡を組み合わせた自動TAフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:25:58 GMT)
Practical implementation of arbitrary nonlocal controlled-unitary gate via indefinite causal order [5.4] 量子ゲートテレポーテーションは、遠隔ノード間の直接の相互作用を伴わない非局所量子演算の実装を可能にする。
不確定因果順序(ICO)を介して、空間的に分離された2つのパーティに作用する任意の制御単位ゲート(CU)を実装するための効率的なプロトコルを提案する。
我々の研究は、フレキシブルな演算を伴うスケーラブルな分散量子計算のための実践的なフレームワークを確立する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:13:11 GMT)
Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features [5.4] クープマン演算子とウェーブレット変換から導出した特徴を用いた変換器を用いたECG分類について検討する。
以上の結果から,ウェーブレットの特徴は二項分類において優れているが,クープマンの特徴は変圧器と組み合わせることで,4クラス設定において優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:59:19 GMT)
Multimodal Deep Learning for Dynamic and Static Neuroimaging: Integrating MRI and fMRI for Alzheimer Disease Analysis [5.3] アルツハイマー病(AD)、軽度認知障害、正常認知状態の分類にMRIとfMRIを統合した枠組みを提案する。
構造的特徴は3次元畳み込みニューラルネットワークを用いてMRIから抽出され、時間的特徴はfMRIシーケンスから学習される。
その結果,データ拡張により分類安定性と一般化が大幅に向上し,特にマルチモーダルな3DCNN-LSTMモデルが実現された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:58:45 GMT)
Towards a more efficient bias detection in financial language models [5.3] 金融言語モデルにおけるバイアスは、現実のアプリケーションにおいて採用される大きな障害である。
5つの金融言語モデルにおけるバイアスの大規模研究を行う。
モデル間誘導バイアス検出について検討し、より早くバイアス検出入力を同定する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:38:53 GMT)
EAGLE-Pangu: Accelerator-Safe Tree Speculative Decoding on Ascend NPUs [5.2] 本稿では,Acend NPU 上のPangu 教師バックエンドにツリー投機的デコーディングをポートするシステムを提案する。
Eagles-Panguはエンド・ツー・エンドの復号スループットを平均1.27倍改善し、p99では2.46倍に向上した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:30:04 GMT)
MINT: Molecularly Informed Training with Spatial Transcriptomics Supervision for Pathology Foundation Models [5.2] 我々は、空間転写学の監督を事前学習した病理学の視覚変換器に組み込む微調整フレームワークであるMINTを提案する。
MINTは学習可能なSTトークンをViT入力に追加し、形態学的CLSトークンとは別個の転写情報をエンコードする。
MINTは、HEST-Benchの遺伝子発現予測と一般的な病理学タスクの両方において、最高の全体的なパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:29:10 GMT)
Task-Oriented Robot-Human Handovers on Legged Manipulators [5.1] AFT-Handoverは、大規模言語モデル(LLM)駆動のアベイランス推論と効率的なテクスチャベースのアベイランス転送を統合して、ゼロショットで一般化可能なTOHを実現するフレームワークである。
AFT-Handoverを多種多様なタスク・オブジェクト・ペアで評価し、ハンドオーバの成功率の向上とベースラインよりも強力な一般化を示した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:20:01 GMT)
Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes [5.1] 本研究では,新しいキャリブレーション手法であるSleep Replay Consolidation(SRC)を紹介する。
SRCはトレーニング後の睡眠に似たフェーズで、ネットワーク重みを更新するために内部表現を選択的に再生する。
これらの結果から,SRCはニューラルネットワークキャリブレーションの改善に根本的に新しいアプローチを提供することが示された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 00:43:14 GMT)
CONTACT: CONtact-aware TACTile Learning for Robotic Disassembly [5.1] 本研究では,ロボット分解における触覚センシングの役割について,シミュレーションと実世界の実験の両方を通して検討する。
視覚のみ、視覚+触覚RGB(TacRGB)、視覚+触覚力場(TacFF)の3つの感覚構成を比較した。
以上の結果から,触覚感覚はロボット分解において重要なタスク依存的な役割を担っており,特に接触優先のシナリオにおいて構造的力場表現が有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:20:49 GMT)
Multifingered force-aware control for humanoid robots [5.1] マルチフィンガーハンドを用いたロボットプラットフォームにおける力認識制御と力分布について検討する。
我々は、胴体、腕、手首、指の動きに適応し、様々な質量分布や不安定な接触の物体との安定した接触を維持するために再分配力を設計する。
我々は5つのオブジェクトでバランスをとる作業においてフレームワークを検証し、成功率82.7%を達成し、さらに複数のオブジェクトシナリオで評価し、精度80%を達成した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:17:45 GMT)
AutoTraces: Autoregressive Trajectory Forecasting via Multimodal Large Language Models [5.1] AutoTracesは、ヒューム言語環境におけるロボット軌道予測のための自動回帰視覚軌道モデルである。
鍵となる革新は軌跡トークン化スキームであり、これはポイントトークンを持つウェイポイントをカテゴリマーカーとして表現し、ウェイポイント数値を対応するポイント埋め込みとして符号化する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:53:06 GMT)
Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification [5.0] 自己監督型マスクドモデリングは、生のバイトをマスキングして再構築することで、暗号化されたトラフィック分類を約束する。
最近の研究によると、これらの手法はコストのかかる事前訓練にもかかわらずラベル付きデータへの依存を減らすことができない。
トラフィックをシーケンスバイトにフラットにすることで、プロトコル定義のセマンティクスを破壊します。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:15:23 GMT)
AI Agents, Language, Deep Learning and the Next Revolution in Science [5.0] 我々は,AIエージェントが科学的手法の次の進化を表すことを提案する。
中国科学アカデミーの高エネルギー物理学研究所では、このビジョンを具現化している。
このパラダイムの重要性は粒子物理学を超越し、すべてのデータ駆動科学の青写真を提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:14:20 GMT)
LaTeX Compilation: Challenges in the Era of LLMs [5.0] 大規模言語モデル(LLM)は、科学的な記述や制限、重要なトークンコストをますます支援している。
この論文は分析する。
効率の限界を示すため、コンパイルとユーザエクスペリエンス設計における根本的な欠陥の1つです。
生成したセマンティクス、エラーローカライゼーション、ツールエコシステム。
LLM。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:43:00 GMT)
VesselFusion: Diffusion Models for Vessel Centerline Extraction from 3D CT Images [4.9] VesselFusionは3次元CT画像から血管中心線を抽出する拡散モデルである。
VesselFusionは一般に公開されているCT画像データセットで評価され、従来の手法よりも高い抽出精度とより自然な結果を得た。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:14:07 GMT)
Quantifying Cross-Lingual Transfer in Paralinguistic Speech Tasks [4.9] 言語間の言語間相互作用を定量化するための体系的手法であるCLTM(Cross-Lingual Transfer Matrix)を提案する。
我々は,多言語HuBERTエンコーダを用いて,ジェンダー識別と話者検証という2つのパラ言語課題にCLTMを適用した。
この結果から,タスクや言語間の異なる伝達パターンが明らかとなり,言語に依存した系統的な影響が反映された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:02:57 GMT)
Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data [4.9] 本稿では,静的な顔画像と実音声を唇同期して生成した合成視覚ストリームをベースとした,ゼロAV音源のAVSRフレームワークを提案する。
我々は700時間以上のトーキングヘッドビデオを合成し、事前訓練されたAV-HuBERTモデルを微調整する。
我々のモデルは、パラメータやトレーニングデータが少なくて、ほぼ最先端の性能を達成し、同じ訓練されたオーディオのみのベースラインを上回り、ノイズのマルチモーダル的優位性を保っている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:22:24 GMT)
Quantum information advantage based on Bell inequalities [4.9] 並列繰り返しCHSHゲームから派生した関係に基づく代替提案を提案する。
我々のメモリ測度は情報測度に基づいており、[KGD+25]とは異なる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:50:37 GMT)
From Word2Vec to Transformers: Text-Derived Composition Embeddings for Filtering Combinatorial Electrocatalysts [4.7] 学術文献からの埋め込みを用いて,各構成を表現したラベルフリースクリーニング戦略を評価する。
コーパス学習したWord2Vecベースラインとトランスフォーマーベースの埋め込みを比較した。
貴金属合金や多成分酸化物を含む15の材料ライブラリの性能評価を行った。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:46:23 GMT)
BiCLIP: Domain Canonicalization via Structured Geometric Transformation [4.7] BiCLIPは、クロスモーダルアライメントを強化するために、マルチモーダル機能にターゲット変換を適用するフレームワークである。
我々のアプローチは、極端に単純でパラメータのフットプリントが低いのが特徴です。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:26:15 GMT)
BioGait-VLM: A Tri-Modal Vision-Language-Biomechanics Framework for Interpretable Clinical Gait Assessment [4.7] BioGait-VLMは,3モーダルビジョン・ランゲージ・バイオメカニクスフレームワークである。
我々のアーキテクチャは、リズム力学を捉えるための時間的エビデンス蒸留枝と、3Dスケルトン配列を言語対応のセマンティックトークンに投影するバイオメカニカルトークン化枝を組み込んでいる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:25:28 GMT)
Kernel Debiased Plug-in Estimation based on the Universal Least Favorable Submodel [4.6] 非パラメトリックモデルにおけるパスワイズ微分可能なパラメータを推定するためのカーネル・デバイアスド・プラグイン推定器を提案する。
この方法は、明示的な導出や効率的な影響関数の評価を必要とせず、半パラメトリック効率を実現する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:27:26 GMT)
MJ1: Multimodal Judgment via Grounded Verification [4.6] マルチモーダルな裁判官は、視覚的証拠の判断を下すのに苦労する。
我々は、強化学習を訓練したマルチモーダル・ジャッジであるMJ1を提示する。
モデルスケールを増大させることなく、基礎的検証と整合性に基づくトレーニングにより、マルチモーダル判断が大幅に向上することを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:55:48 GMT)
Tactile Recognition of Both Shapes and Materials with Automatic Feature Optimization-Enabled Meta Learning [4.5] メタラーニング,すなわちAFOP-MLフレームワークを実現するために,自動機能最適化可能なネットワークを提案する。
学習する"ネットワークとして、新しい未確認クラスに数ショットで迅速に適応するだけでなく、最適な特徴空間を自動的に決定する方法も学べる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:18:39 GMT)
SYNAPSE: Framework for Neuron Analysis and Perturbation in Sequence Encoding [4.5] 医療やサイバーセキュリティのような敏感なドメインでは、透明性、信頼性、堅牢性を保証することが不可欠である。
この研究は、Transformerモデルの内部動作を理解しテストするための、体系的でトレーニング不要なフレームワークであるSynAPSEを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:18:47 GMT)
NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving [4.4] 本研究では,大規模ナビゲータと軽量トレーニングドライバを用いた行動生成から推論を分離するフレームワークであるNaviDriveVLMを提案する。
nuScenesベンチマークの実験では、NaviDriveVLMはエンド・ツー・エンドの動作計画において大きなVLMベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:47:44 GMT)
Perception-Aware Communication-Free Multi-UAV Coordination in the Wild [4.3] 本研究では,高密度天蓋を有する森林などの複雑な環境において,安全なマルチロボット協調のためのコミュニケーションフリー手法を提案する。
我々のアプローチは、SLAMや障害物や近接するロボットを検出するために使用される、搭載された異方性3DLiDARセンサーに依存している。
我々は,センサの視野が限られているにも関わらず,ロボットが目標領域に向けて安全かつ効果的に前進できる新しい3Dナビゲーションフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:41:12 GMT)
SoundWeaver: Semantic Warm-Starting for Text-to-Audio Diffusion Serving [4.3] SoundWeaverは、意味論的に類似したキャッシュオーディオからウォームスタートすることで、テキストとオーディオの拡散を加速する最初のトレーニング不要で、モデルに依存しないサービスシステムである。
現実世界のオーディオトレースでは、SoundWeaverは1.8-3.0$のレイテンシ削減を実現している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 00:38:02 GMT)
Practical Type Inference: High-Throughput Recovery of Real-World Structures and Function Signatures [4.2] 実用性を重視した改良n-gramベースのアプローチであるXTRIDEを提案する。
提案手法は,70倍から2300倍の高速化を実現している。
関数類似性に対するこの効率的なアプローチは、典型的なリバースエンジニアリングタスクを支援することができることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:54:48 GMT)
DeReCo: Decoupling Representation and Coordination Learning for Object-Adaptive Decentralized Multi-Robot Cooperative Transport [4.0] DeReCoは、オブジェクト適応型多ロボット協調輸送のための表現と協調学習を分離する新しいフレームワークである。
実験結果から,DeReCoは3つのトレーニング対象のシミュレーションにおいてベースラインを上回り,質量や摩擦係数の異なる6つの未確認対象に一般化し,実ロボット実験において2つの未確認対象に対して優れた性能を発揮することがわかった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:53:11 GMT)
Alignment--Process--Outcome: Rethinking How AIs and Humans Collaborate [4.0] 我々は2つの補体レンズを通して協調を再認識する。
タスクレンズは、構造化されたタスク空間における軌道進化として協調し、進行、分岐、バックトラックなどのパターンを明らかにする。
インテントレンズは、個々のインテントが共有コンテキスト内でどのように表現され、位置決定に入るかを調べる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:46:59 GMT)
Security Considerations for Multi-agent Systems [4.0] マルチエージェント人工知能システム(英: Multi-agent AI system、MAS)は、エージェント間のコミュニケーションを通じて、委任されたツール権限を行使し、永続的なメモリを共有し、コーディネートする自律エージェントのシステムである。
本研究は、MASの脅威景観を体系的に特徴づけ、それに対するAIのための16のセキュリティフレームワークを定量的に評価する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:46:27 GMT)
Weakly Supervised Teacher-Student Framework with Progressive Pseudo-mask Refinement for Gland Segmentation [3.9] 本稿では,スパース・パストロジー・アノテーションと指数移動平均安定化型教師ネットワークを活用して,洗練された擬似マスクを生成する弱教師型教員の枠組みを提案する。
このフレームワークは、信頼に基づくフィルタリング、教師の予測の適応的融合、限られた真実との融合、およびカリキュラムガイドにより、未通知の腺領域を段階的に分割する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:54:05 GMT)
Distributed g(2) Retrieval with Atomic Clocks: Eliminating Conventional Sync Protocols [3.9] 遠隔地へ分散した偏光共役光子間の一致を計測する方法を実証する。
我々は正確なタイミングにコンパクトでチップスケールの原子時計を用いる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:16:28 GMT)
Automating Detection and Root-Cause Analysis of Flaky Tests in Quantum Software [3.9] 本稿では,量子ソフトウェアリポジトリにおけるフレキシブルテスト関連の問題とプルリクエストを検出する自動パイプラインを提案する。
我々は、既存の量子フレキテストデータセットを拡張し、フレキネス分類と根本原因同定のための大規模言語モデルの性能を評価する。
最高のパフォーマンスモデルであるGoogle Geminiは、フレキネス検出のためのF1スコア0.9420、根本原因同定のための0.9643を達成している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:57:55 GMT)
Bringing AI into the Classroom: A Structured Approach for Integrating AI into Software Engineering Education [3.8] AI関連トピックとアクティビティをコンピュータサイエンスコースに統合するための構造化アプローチであるAI-Blueprintsの概念を紹介する。
私たちのビジョンは、これらのブループリントをオープンな教育リソースとして提供し、教育者がAIをさまざまなコースやトピックに適応し、統合できるようにすることです。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:08:19 GMT)
Toward Unified Multimodal Representation Learning for Autonomous Driving [3.8] コントラスト言語-画像事前学習は、視覚的およびテキスト的表現の整列において印象的な性能を示した。
一般的な戦略は、3Dエンコーダのトレーニングをガイドするために、モダリティ間のペアワイズコサイン類似性を採用することである。
組込み空間において複数のモードを同時に調整するコントラスト事前学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:18:50 GMT)
Synthetic Defect Image Generation for Power Line Insulator Inspection Using Multimodal Large Language Models [3.7] ドローンの画像を定期的な検査に頼っている企業が増えているが、正確な欠陥型分類器の訓練は依然として難しい。
トレーニング不要な画像生成装置として,既製のマルチモーダル大言語モデル(MLLM)を用いて,このデータスカシティ設定に対処する。
現実的な低トレーニングデータ構造を持つ公開データセットを用いたセラミック絶縁体欠陥型分類の評価を行った。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:06:27 GMT)
Local-Global Prompt Learning via Sparse Optimal Transport [3.7] CLIPのような視覚言語モデル(VLM)のわずかな適応は、一般的に、グローバルな画像埋め込みにマッチしたテキストプロンプトの学習に依存している。
近年の研究では、局所的な画像テキストアライメントを取り入れて、微細な視覚的手がかりを捉えることで、このパラダイムを拡張している。
本稿では,共有スパースパッチと最適トランスポートアロケーションのバランスをとるSOT-GLPを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:09:55 GMT)
SEP-NMPC: Safety Enhanced Passivity-Based Nonlinear Model Predictive Control for a UAV Slung Payload System [3.5] 本稿では, バラバラな環境下でペイロードを輸送する四重極子に対して, 安定性と安全性を保証した安全促進型MPC (SEP-NMPC) を提案する。
安定化は、適応減衰を持つ形状のエネルギー貯蔵関数から導かれる厳密な通過率の不等式を埋め込むことによって実施される。
安全は、ユーザ定義クリアランスセットを前方不変にレンダリングする高次制御バリア関数(HOCBF)によって保証され、静的および動的障害と相互作用しながら分離を維持するために、クオータと揺動ペイロードの両方を義務付けている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:20:08 GMT)
A Hierarchical Error-Corrective Graph Framework for Autonomous Agents with LLM-Based Action Generation [3.5] 本稿では3つのコアイノベーションを組み込んだ階層的誤り訂正グラフフレームワークfor AutonomousAgentswithLLM-BasedActionGeneration(HECG)を提案する。
MDTS:タスク品質指標(Q),信頼性/コスト指標(C),報酬指標(R),LLMに基づく意味推論スコア(LLM-Score)を統合することで,MDTSは定量的パフォーマンスと意味的コンテキストの多次元的アライメントを実現する。
EMC:単純な混乱行列や全体的なパフォーマンス指標とは異なり、EMCはエラーをStrategy Whe(Strategy Whe)やScript(Script)といった10のタイプに分類することで、タスク障害の構造化された属性を提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:46:00 GMT)
Meta-RL with Shared Representations Enables Fast Adaptation in Energy Systems [3.5] 本稿では,バイレベル最適化スキームとハイブリッドアクター・クリティックアーキテクチャを統合したメタRLフレームワークを提案する。
本稿では,外ループアクタネットワークと内ループアクタネットワークのパラメータ共有機構を提案する。
従来のRL法やMeta-RL法と比較して,効果的なタスク適応と性能を示す実験を行った。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:15:51 GMT)
DualTurn: Learning Turn-Taking from Dual-Channel Generative Speech Pretraining [3.4] 音声合成モデルはターンテイキングを自然に扱うが、ツールコールや複雑な推論を限定的にサポートする。
本稿では、このギャップを2チャンネルの会話音声における生成前訓練によって狭めるDualTurnを提案する。
このモデルは、両方の話者の将来の音声を自動回帰的に生成し、ラベルなしで暗黙的に会話のダイナミクスを学習し、解釈可能なターンテイク信号を予測するように微調整される。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:48:37 GMT)
InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling [3.4] 我々は Combinatorial Fusion Analysis にインスパイアされた機械学習アーキテクチャ textttInFusionLayer を紹介する。
以上の結果から,RCC関数とCDの特徴的な特徴を取り入れることで,より洗練されたアンサンブル学習アプリケーションを実現するという利点を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:43:48 GMT)
Is continuous CoT better suited for multi-lingual reasoning? [3.3] 連続潜在空間における推論の実行がより堅牢な多言語機能に繋がるかどうかを考察する。
我々は,5言語にまたがる標準教師付き微調整と連続的連鎖(CODIフレームワークを使用)を比較した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:57:08 GMT)
mmGAT: Pose Estimation by Graph Attention with Mutual Features from mmWave Radar Point Cloud [3.3] 本稿では, ミリ波レーダ技術の人体ポーズ推定への応用について述べる。
本稿では,ポーズ推定のためのGNN処理手法の潜在能力をフル活用する特徴抽出手法を提案する。
提案手法は,関節位置誤差当たりのポーズ推定平均値(MPJPE)を35.6%,PA-MPJPEを14.1%削減する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:15:45 GMT)
PCFEx: Point Cloud Feature Extraction for Graph Neural Networks [3.3] グラフニューラルネットワーク(GNN)は、さまざまな領域でその有効性に大きな注目を集めている。
本研究は,HPE(Human pose Estimation)とHAR(Human Activity Recognition)のための3Dポイントクラウドデータ処理にGNNを適用することに焦点を当てる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:09:02 GMT)
Designing Value-Based Platforms: Architectural Strategies Derived from the Digital Markets Act [3.3] デジタル市場法(DMA)は、MetaのFacebookやAppleのiOSのような非常に大きなデジタルプラットフォームを規制している。
DMAは公正さ、競争性(市場の力)、ユーザー選択を促進することを目的としている。
価値に基づくアーキテクチャ目標に対する基本的なアプローチとして機能する8つのハイレベルな設計戦略を導出します。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:34:40 GMT)
Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning [3.3] 概念ボトルネックモデル(Concept Bottleneck Models, CBM)は、AIを解釈するための重要なフレームワークである。
臨床ガイドラインを視覚言語と推論モデルと統合する概念ベースの推論フレームワークであるMedCBRを提案する。
本フレームワークは,医用画像解析から意思決定までの終端ブリッジを構築できる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:39:46 GMT)
Formation-Aware Adaptive Conformalized Perception for Safe Leader-Follower Multi-Robot Systems [3.2] 異所性知覚の誤りと、形成操作と可視性制約の結合により、安全は困難である。
本稿では,リスク対応モンドリアンCPに基づく分散型適応型コンフォメーション予測手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:44:20 GMT)
Do Language Models Know Theo Has a Wife? Investigating the Proviso Problem [3.2] 本研究では,条件下での仮定予測を探索する診断データセットを提案する。
結果は、モデルは人間の判断と広く一致しているが、意味論や実践的な推論よりも、浅いパターンマッチングに依存していることを示している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:21:56 GMT)
Synchronized Online Friction Estimation and Adaptive Grasp Control for Robust Gentle Grasp [3.2] 視覚に基づく触覚センサを用いた摩擦係数のリアルタイム推定のための新しい粒子フィルタ法を提案する。
この推定値は、安定グリップを維持するためにグリップ力を動的に変調するリアクティブコントローラにシームレスに統合される。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:06:42 GMT)
A General Lie-Group Framework for Continuum Soft Robot Modeling [3.1] 本稿では,連続体ソフトロボットのモデリングのための一般リー群フレームワークを提案する。
このフレームワークは、セグメント化、分岐、ネスト化、硬質ソフト複合構成を含む複雑なロボット構造を扱うように拡張されている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:03:21 GMT)
Sandpiper: Orchestrated AI-Annotation for Educational Discourse at Scale [3.0] Sandpiperは、高ボリュームの会話データと人間の質的な専門知識の橋渡しとして設計された混合開始システムである。
本稿では,AIを用いた定性分析における研究効率の向上,レータ間信頼性,研究者信頼度を評価するためのシステムの有効性を評価するためのユーザスタディを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:01:42 GMT)
Local Constrained Bayesian Optimization [3.0] 局所制約ベイズ最適化(LCBO)は高次元制約問題に適した新しいフレームワークである。
LCBO が KKT (Karush-Kuhn-Tucker) 残差に対して収束速度を達成できることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:05:22 GMT)
Aligning to Illusions: Choice Blindness in Human and AI Feedback [2.9] 人間の選択失明研究では、過度にスワップされた好みの91%が発見されず、選択失明は不慣れなテキストの第三者による評価比較にまで及ぶ。
検出は、真の自己監視ではなく、浅いテキストマッチングに依存している。
2つのアーキテクチャにわたる線量応答実験では、報奨信号が半減する前にラベルの6分の1から3分の1を破損させなければならない。
Best-of-N評価では、これは下流の政策劣化につながると確認されている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:10:36 GMT)
PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration [2.9] PathoScribeは静的な病理資料を検索可能なライビングライブラリに変換するために設計されたフレームワークである。
PathoScribeは、自然言語のケース検索に完璧なRecall@10を達成し、高品質な検索地上推論を実証した。
この研究は、パッシブストレージシステムからデジタル病理資料をアクティブな臨床知能プラットフォームに変換するためのスケーラブルな基盤を確立する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:09:24 GMT)
An accurate flatness measure to estimate the generalization performance of CNN models [2.9] 我々は,CNNの広範かつ実践的なクラスに対して,正確かつアーキテクチャ的に忠実な平坦度尺度を開発する。
その結果,提案手法はCNNモデルの一般化を評価・比較するためのツールとして有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:17:49 GMT)
Adaptive MLP Pruning for Large Vision Transformers [2.8] 本稿では,大きな視覚変換器のパラメータを明らかに劣化させることなく大幅に削減する適応型プルーニング法を提案する。
CLIP や DINOv2 などの最先端の大規模視覚変換器の実験結果から,提案手法が約40% のパラメータとFLOPs をほぼほぼ減少することを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:42:19 GMT)
TRIAGE: Type-Routed Interventions via Aleatoric-Epistemic Gated Estimation in Robotic Manipulation and Adaptive Perception -- Don't Treat All Uncertainty the Same [2.8] ほとんどの不確実性を認識したロボットシステムは、予測の不確実性を単一のスカラースコアに分解し、それを使って一様に修正された応答をトリガーする。
このアグリゲーションは、破損した観測結果から不確実性が生じるか、あるいは学習されたモデルと真のシステム力学とのミスマッチから生じるのかを曖昧にしている。
本研究では,不確かさを動脈およびてんかん成分に分解する軽量なポストホックフレームワークを導入し,これらの信号を用いて推論時のシステム応答を調節する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:07:43 GMT)
CR-QAT: Curriculum Relational Quantization-Aware Training for Open-Vocabulary Object Detection [2.8] CR-QAT(Relational Quantization-Aware Training)を提案する。
CR-QATは、プログレッシブ量子化のためにモデルを分割することでエラーの蓄積を軽減し、エラー分離による安定した最適化を保証する。
LVISとゼロショットベンチマークの実験では、CR-QATは攻撃的な低ビット設定下で既存のQATベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:42:44 GMT)
Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains [2.7] 本稿では,医療機関抽出のための有限サンプルカバレッジ保証を提供するコンフォメーション予測フレームワークを提案する。
まず,FactScoreをベースとした原子式ステートメント評価により,GPT-4.1を用いて,FDAの医薬品ラベル1000個から構造化されたエンティティを抽出した。
第2に,GPT-4.1とLlama-4-Maverickを用いたRadGraphスキーマを用いてMIMIC-CXRレポートから放射線学的実体を抽出し,医師のアノテーションに対して評価した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:54:54 GMT)
DyLLM: Efficient Diffusion LLM Inference via Saliency-based Token Selection and Partial Attention [2.7] そこで我々はDyLLMを提案する。DyLLMは正規トークンのみを選択的に計算することでデコーディングを高速化する学習自由推論フレームワークである。
DyLLMは様々な推論とコード生成ベンチマークで最大9.6倍のスループットを実現している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:02:01 GMT)
Oracle-Guided Soft Shielding for Safe Move Prediction in Chess [2.7] チェスのような環境に対する既存の強化学習アプローチでは、何十万ものエピソードとかなりの計算資源を集約する必要がある。
我々は、より安全な意思決定のためのシンプルで効果的なフレームワークであるOracle-Guided Soft Shielding (OGSS)を提案する。
以上の結果から,OGSSの変種は,エージェントの探索比が増大しても,低いブラダーレートを維持していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:40:01 GMT)
Multi-level meta-reinforcement learning with skill-based curriculum [2.7] マルコフ決定過程(MDP)を繰り返し圧縮する効率的なマルチレベル手順について述べる。
1つのレベルでのパラメトリックなポリシーは、圧縮されたMDPにおいてより高いレベルで単一のアクションとして扱われ、元のMDPの意味と構造は保存される。
この研究の2つ目の基本的な側面は、これらの多段階の分解とポリシーの分解が、異なる問題と異なるレベルのスキルの新たな移行機会をもたらすことである。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:59:39 GMT)
An explainable hybrid deep learning-enabled intelligent fault detection and diagnosis approach for automotive software systems validation [2.7] ASSのリアルタイム検証プロセスから記録を解析するインテリジェントモデルを開発した。
説明可能なAI技術(IGs、DeepLIFT、Gradient SHAP、DeepLIFT SHAP)の活用は、モデル適応と根本原因分析(RCA)の促進に役立った。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:46:28 GMT)
STRIDE: Structured Lagrangian and Stochastic Residual Dynamics via Flow Matching [2.6] 本研究では、保守的な剛体力学を不確実かつ効果的に非保守的な相互作用効果から分離する動的学習フレームワークSTRIDEを提案する。
本研究は,ペンデュラム,Unitree Go1ruped,Unitree G1 humanoidなど複雑度の高いシステム上でのSTRIDEの評価である。
その結果, 長軸予測誤差が20%減少し, 接触力予測誤差が30%減少した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:15:21 GMT)
Characterization, Analytical Planning, and Hybrid Force Control for the Inspire RH56DFX Hand [2.6] 器用なロボットの手はますます普及しているが、科学機器としての使用が難しいものも多い。
我々はInspire RH56DFXに3つの改良を加えて、それをブラックボックスデバイスから研究ツールに変換する。
我々はこれらの部品を穴内挿入で検証し,成功率65%,手首力のみのベースライン10%を上回った。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:25:38 GMT)
SMGI: A Structural Theory of General Artificial Intelligence [2.5] 入力メタモデル$= (r,mathcal H,,mathcal L,mathcal E,mathcal M)$を介して一般知能構造モデル(SMGI)を定式化する。
我々は、汎用人工知能を、4つの義務を満たす許容可能な結合力学のクラスとして定義する。
逐次PAC-Bayes解析とリャプノフ安定性を結びつける構造一般化境界を証明した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:31:31 GMT)
Improving Continual Learning for Gaussian Splatting based Environments Reconstruction on Commercial Off-the-Shelf Edge Devices [2.5] 新しいビュー合成(NVS)は、コンパクトで漸進的にアップグレード可能な3Dシーンモデルを必要とするエッジロボティクスにますます関係している。
本稿では,リソース制約のあるハードウェア上でのVBGSトレーニングを,変分定式を変更することなく実現できる高精度適応フレームワークを提案する。
また、商用組み込みプラットフォームであるJetson Orin Nanoで初めてNVSトレーニングを可能にしました。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:32:41 GMT)
Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation [2.4] シャープネス・アウェアの最小化(SAM)は、パラメータ周辺の最大トレーニング損失を最小化することにより、一般化を促進する。
しかし、その実践的な実装は、勾配の上昇(s) と近似し、その後、現在のパラメータを更新するために上昇点の勾配を適用する。
その結果,一段上昇点における勾配は,局所勾配よりも局所勾配よりも現在のパラメータから局所近傍の最大方向への方向の近似が優れていることがわかった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:11:56 GMT)
COACH meets QUORUM: A Framework and Pipeline for Aligning User, Expert and Developer Perspectives in LLM-generated Health Counselling [2.4] 開発者、専門家、ユーザ中心の視点を統一する新しい評価フレームワークであるQUORUMを紹介します。
実際のケーススタディで、利害関係者の視点の収束と分散を有意義に追跡していることを示します。
当社のフレームワークを適用すると、ユーザ、医療専門家、開発者は、生成されたカウンセリングは関連性があり、品質が良く、信頼性が高いという意見に収束します。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:49:57 GMT)
TrianguLang: Geometry-Aware Semantic Consensus for Pose-Free 3D Localization [2.3] TrianguLangは3Dローカライゼーションのためのフィードフォワードフレームワークで、推論時にカメラのキャリブレーションを必要としない。
最先端のフィードフォワードテキスト誘導セグメンテーションとローカライゼーションを実現し、ユーザの労力を$O(N)$から1つのテキストクエリに削減する。
モデルは各フレームを1008x1008の解像度で、最適化なしで57ms (sim$18 FPS)で処理し、対話型ロボティクスやARアプリケーションに実用的なデプロイを可能にする。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:37:05 GMT)
Adaptive Loops and Memory in Transformers: Think Harder or Know More? [2.3] 思考の連鎖は言語モデルにおける推論を可能にするが、中間段階の明示的な言語化を必要とする。
ループ変換器は、隠された状態内の表現を反復的に精製する代替手段を提供する。
適応型層間ループとゲート型メモリバンクの両方を特徴とするトランスモデルについて検討する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:49:03 GMT)
Symmetry-based perturbation theory for electronic structure calculations [2.2] 我々は、ハミルトニアン対称性に基づく電子構造計算のためのマルチ参照摂動理論を開発する。
対称性に基づく摂動理論(SBPT)における参照ハミルトニアンは、元のハミルトニアンよりも多くの対称性を持つように選択される。
SBPTは、他の既存のマルチ参照摂動理論の拡張であり、ロバストな方法でいくつかの分子系に対してより良い結果を与えることができることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:09:33 GMT)
ER-Pose: Rethinking Keypoint-Driven Representation Learning for Real-Time Human Pose Estimation [2.2] 単一段階の多人数ポーズ推定は、人間の位置推定とキーポイント予測を共同で行うことを目的としている。
ボックス駆動単段ポーズ推定は、トレーニング中にバウンディングボックスの監督によって暗黙的に制限される。
本稿では,主予測目標に対するポーズ推定を高めるキーポイント駆動型学習パラダイムを提案する。
MS COCOとCrowdPoseでは、ER-Pose-nはプレトレーニングなしで3.2/6.7、プレトレーニングで7.4/4.9のAP改善を実現している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:49:46 GMT)
Agentic LLM Workflow for MR Spectroscopy Volume-of-Interest Placements in Brain Tumors [2.2] 磁気共鳴分光法は、臨床的に価値のある脳腫瘍の代謝特性を提供する。
特定の腫瘍には、高品質なMRS測定につながる複数のVOIが存在する。
本稿では,VOI を多種多様な VOI の生成に分解するエージェント型大規模言語モデル (LLM) ワークフローを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:13:28 GMT)
Proprioceptive Safe Active Navigation and Exploration for Planetary Environments [2.2] Proprioceptive Safe Active Navigation and Exploration (PSANE)は、未知の変形可能な環境における安全なナビゲーションと探索のためのフレームワークである。
PSANEはガウスプロセスレグレッションを通じてトラバーサビリティモデルを学び、安全な領域を推定し、認定する。
リアルタイムナビゲーションのためのリアクティブコントローラとこれらの見積を統合する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:17:50 GMT)
Quantum Sensing of Birefringence Beyond the Classical Limit with a Hyper-Entangled SU(1,1) Interferometer [2.1] 感度のショットノイズ限界を超えて未知の小型複屈折を検出するための干渉計方式を提案する。
具体的には、2対のクロスポーラライゼーション非線形媒質は2モードの量子光を生成して測定する。
現実的な利得と内部損失の条件下で, 干渉計の小型複屈折に対する感度について, 完全に理論的解析を行った。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:18:56 GMT)
See and Switch: Vision-Based Branching for Interactive Robot-Skill Programming [2.1] See & Switchは、タスクを意思決定状態(DS)を介して接続されたスキル部品のユーザ拡張可能なグラフとして表現する対話型指導・実行フレームワークである。
我々の視覚ベースのSwitcherは、視線画像(高次元)を使用して、競合する後継スキル部品を選択し、配布外のコンテキストを検出する。
提案手法は,576個の実ロボットロールアウトに対して,それぞれ90.7%,87.9%の精度で分岐選択と異常検出を確実に行うことを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:47:47 GMT)
Airborne Magnetic Anomaly Navigation with Neural-Network-Augmented Online Calibration [2.1] MagNavはジャミングに耐性があり、衛星ナビゲーションに代わる堅牢な代替品である。
航空機のプラットホームの大型でダイナミックな磁気干渉をリアルタイムに補償する必要がある。
我々は、航空機の磁気信号を完全に飛行中に識別し、補償する「コールドスタート」機能を備えた、完全に適応的なMagNavアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:35:04 GMT)
Adversarial Domain Adaptation Enables Knowledge Transfer Across Heterogeneous RNA-Seq Datasets [2.1] ディープラーニングモデルは、古典的な機械学習アプローチを上回る可能性を示している。
転写学では、そのようなデータセットは頻繁に制限され、過度に適合し、一般化が不十分になる。
本稿では,大規模な汎用データセットから,がんタイプ分類のためのより小さなデータセットへの効果的な知識伝達を可能にする,ディープラーニングに基づくドメイン適応フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:55:32 GMT)
DualFlexKAN: Dual-stage Kolmogorov-Arnold Networks with Independent Function Control [2.1] Kolmogorov-Arnold Networks (KAN) はこの制限をエッジ中心の学習可能な関数によって解決している。
Kanはパラメータスケーリングとアーキテクチャの剛性に悩まされており、標準正規化技術の効果的な統合を妨げる。
本稿では,DualFlexKAN(DFKAN)について紹介する。DualFlexKAN(DFKAN)は,先線形入力変換と後線形出力を独立に制御するデュアルステージ機構を備えたフレキシブルアーキテクチャである。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:36:04 GMT)
DeZent: Decentralized z-Anonymity with Privacy-Preserving Coordination [2.1] z匿名性のようなプライバシ向上技術は、継続的なデータストリームに対して効率的な匿名化を提供する。
我々は、中央エンティティへの信頼を最小限に抑える分散化されたz匿名実装であるdeZentを紹介する。
以上の結果から,deZentは出版率の点から中央集権z匿名性に匹敵する性能を示した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:14:23 GMT)
Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables [2.0] 離散潜在変数を含む機械学習モデルは、バックプロパゲーションを容易にするために勾配推定器を必要とする。
本稿では,Hunの手法による近似を取り入れたReinMax推定器を提案する。
我々の推定器は、離散潜在空間を持つ変分オートエンコーダの訓練において優れた性能を示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:27:20 GMT)
Gender Fairness in Audio Deepfake Detection: Performance and Disparity Analysis [2.0] 我々は,音声ディープフェイク検出モデルにおいて,ジェンダー依存のパフォーマンスと公平性について,徹底的に分析を試みた。
以上の結果から,男女間のEER差が小さくても,公平性を考慮した評価では,誤差分布の相違が明らかとなった。
この研究は、より公平で堅牢で信頼性の高いオーディオディープフェイク検出システムを開発する上で、公平性を考慮した評価の重要性を強調している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:52:12 GMT)
Adaptive SINDy: Residual Force System Identification Based UAV Disturbance Rejection [1.9] 本稿では,適応制御とデータ駆動型システム識別の新たな統合手法を提案する。
我々はガゼボ高調波環境と4方向から最大2m/sの風速で実飛行を行った。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:26:13 GMT)
A Bipartite Quantum Key Distribution Protocol Based on Indefinite Causal Order [1.9] 因果非分離性に基づく二部量子鍵分布(QKD)プロトコルを提案する。
不確定因果順序を用いたQKDプロトコルの実用化について検討する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:32:56 GMT)
It's Time to Get It Right: Improving Analog Clock Reading and Clock-Hand Spatial Reasoning in Vision-Language Models [1.9] アナログクロックを現実世界の環境で読むことは、最先端のビジョン言語モデルにとって重要な課題である。
我々はTickTockVQAを紹介した。TickTockVQAは、さまざまな実世界のシナリオでアナログクロックを含む人間アノテーション付きデータセットである。
スワップDPO(Swap-DPO)は、モデル推論を正確な時間解釈に合わせるための、直接選好最適化に基づく微調整フレームワークである。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:33:49 GMT)
Towards Robust Retrieval-Augmented Generation Based on Knowledge Graph: A Comparative Analysis [1.8] Retrieval-Augmented Generation (RAG) は、Large Language Models (LLM) の機能を強化するために導入された。
不整合検索情報はLLM応答に悪影響を及ぼす可能性がある。
RGB (Retrieval-Augmented Generation Benchmark) を導入し,RAGシステムのロバスト性を評価する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:07:34 GMT)
EveryQuery: Zero-Shot Clinical Prediction via Task-Conditioned Pretraining over Electronic Health Records [1.8] EHRファウンデーションモデルであるEveryQueryを導入し、タスク条件付き事前トレーニングを通じてゼロショット推論を実現する。
EveryQueryは、ランダムにサンプリングされたクエリタスクと患者コンテキストの組み合わせを事前学習することで、この機能を実現する。
MIMIC-IVでは、EveryQueryは39のランダムサンプリング予測タスクのうち82%で自己回帰ベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:45:22 GMT)
NetDiffuser: Deceiving DNN-Based Network Attack Detection Systems with Diffusion-Generated Adversarial Traffic [1.8] 本稿では,ネットワーク侵入検知システム (NIDS) を無効化可能な自然敵例(NAE)を生成するためのフレームワークであるNetDiffuserを提案する。
NetDiffuserは攻撃成功率を29.93%向上させ、AE検出性能を少なくとも0.267(時には0.534まで)削減する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:13:51 GMT)
Scalable Identification and Prioritization of Requisition-Specific Personal Competencies Using Large Language Models [1.8] 大規模言語モデル (LLM) を用いて,req からreq 固有の PC を識別・優先順位付けする手法を提案する。
提案手法は,ダイナミックなショットプロンプト,リフレクションに基づく自己改善,類似性に基づくフィルタリング,マルチステージ検証などを統合する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:15:46 GMT)
An Open-Source Robotics Research Platform for Autonomous Laparoscopic Surgery [1.8] 本稿では,クローズドフォーム解析速度解法に基づくオープンソースのロボット非依存型リモート・センター・オブ・モーション(RCM)コントローラを提案する。
コントローラーはカルテシア空間で作動し、あらゆる産業用マニピュレータが手術ロボットとして機能する。
ロボットコントロールをフルスタックのROSベースの手術ロボットプラットフォームに統合し、遠隔操作、デモ記録、学習ポリシーの展開をサポートする。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:26:27 GMT)
ZK-ACE: Identity-Centric Zero-Knowledge Authorization for Post-Quantum Blockchain Systems [1.7] ZK-ACEは、トランザクション転送されたシグネチャオブジェクトをアイデンティティバウンドのゼロ知識認証ステートメントに置き換える認証レイヤである。
我々は,ZK-ACEをゲームベースのセキュリティ定義で形式化し,音声認識,リプレイ抵抗,置換抵抗,クロスドメイン分離を実現した。
構造的、プロトコルレベルのデータ会計は、直接量子後シグネチャ展開に対するコンセンサス可視な認証データのオーダー・オブ・マグニチュードの低減を示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:21:44 GMT)
Condition-Triggered Cryptographic Asset Control via Dormant Authorization Paths [1.7] 暗号化されたデジタル資産の制御は、伝統的に秘密鍵の恒久的な所有と同一視される。
条件付き休息許可パス(CT-DAP)を導入する。
CT-DAP(CT-DAP)は、破壊可能な認証要素に基づいて構築された暗号資産管理手法である。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:57:06 GMT)
ACE-GF-based Attestation Relay for PQC - Lightweight Mempool Propagation Without On-Path Proofs [1.7] 量子後ブロックチェーン設定では、妥当性証明を必要とするオブジェクトは、メムプールとリレーネットワークを介してブロードキャストされなければならない。
STARKはこれらの証明を集約するために提案されており、各ノードは、証明なしで1つの証明と1つのオブジェクトを転送し、ノードごとの証明帯域を約128KBまで制限している。
我々は、伝搬が本質的には経路のみの軽量保証に妥当性証明を必要としないことを観察する。
ビルダー(または最終検証者)のみが、それが含むオブジェクトの集合に対して単一の集約された妥当性証明を実行する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:41:31 GMT)
LAR-MoE: Latent-Aligned Routing for Mixture of Experts in Robotic Imitation Learning [1.7] 政策学習から教師なしスキル発見を分離する2段階のフレームワークであるLAR-MoE(Latent-Aligned Routing for Mixture of Experts)を紹介する。
プレトレーニングでは,学生と教師の協調学習を通じて,観察と今後の行動の協調的潜在表現を学習する。
訓練後の段階では、専門家のルーティングは学習された潜在空間の構造に従うように規則化され、専門家の崩壊を防ぐ。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:10:31 GMT)
FedLECC: Cluster- and Loss-Guided Client Selection for Federated Learning under Non-IID Data [1.7] Federated Learning (FL)は、クラウドエッジ環境をまたいだ分散人工知能(AI)を実現する。
本稿では、デバイス間FLのための軽量でクラスタ対応で損失誘導型クライアント選択戦略であるFedLECCを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:28:17 GMT)
NN-OpInf: an operator inference approach using structure-preserving composable neural networks [1.6] 非侵襲的ネットワーク演算子システムのための構造保存・構成可能・最小限の制約付き演算子フレームワークを提案する。
本稿では,線形および二次的なOP-OpInfに対して,実用的なトレーニング戦略と計算コストの改善について分析する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:25:16 GMT)
Evidence-Driven Reasoning for Industrial Maintenance Using Heterogeneous Data [1.6] Condition Insight Agentは、メンテナンス言語、運用データの振る舞い抽象化、エンジニアリングの失敗セマンティクスを統合して、エビデンスに基づく説明とアドバイザリアクションを生成する。
システム制約は、決定論的エビデンスの構築と構造化された失敗知識による推論を制約し、許容された結論を抑えるためにルールベースの検証ループを適用する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:51:50 GMT)
MRDrive: An Open Source Mixed Reality Driving Simulator for Automotive User Research [1.6] MRDriveは、車内相互作用、注意力、説明可能性の研究を支援するために設計された、オープンな混合現実駆動シミュレータである。
自動走行シナリオにおいて、シミュレータを用いて視線追跡およびタッチインタラクションデータを収集、分析する方法を実証する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:21:58 GMT)
Text to Automata Diagrams: Comparing TikZ Code Generation with Direct Image Synthesis [1.6] 本研究では,現在の視覚言語モデルと大規模言語モデルがこのような図を処理できるかどうかを検討する。
結果のダイアグラムはコンパイルされ、元のスキャンされたダイアグラムに対して評価される。
視覚言語モデルを用いた画像から直接生成された記述はしばしば誤りであり、人間の修正は視覚言語モデル生成記述の品質を大幅に向上させる可能性がある。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:00:48 GMT)
Bilevel Planning with Learned Symbolic Abstractions from Interaction Data [1.6] 本稿では,学習した確率的シンボリックルールが候補計画を生成する,二段階のニューロシンボリック・フレームワークを提案する。
多目的操作タスクの実験は、提案手法がシンボルのみの手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:47:03 GMT)
Drift-to-Action Controllers: Budgeted Interventions with Online Risk Certificates [1.6] Drift2Actは、監視を明示的な安全性で制約された意思決定として扱う、ドリフト・ツー・アクションのコントローラである。
ほぼゼロに近い安全違反と、WILDS Camelyon17、DomainNet、および制御された合成ドリフトストリームの適度なコストでの高速回復を実現する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:34:12 GMT)
Retrieval-Augmented Anatomical Guidance for Text-to-CT Generation [1.6] 本研究では,現実的な推論環境下で意味情報と解剖情報を統合したテキスト・ツー・CT生成のための検索拡張手法を提案する。
CT-RATEデータセットを用いた実験により,検索拡張生成は,テキストのみのベースラインに比べて画像の忠実度と臨床整合性を向上することが示された。
本研究は,容積医用画像合成における意味的条件付けと解剖学的妥当性を橋渡しする,原則的かつスケーラブルな機構を導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:27:17 GMT)
A Blockchain-based Traceability System for AI-Driven Engine Blade Inspection [1.5] BladeChainはコンポーネントライフサイクル全体を通じて、ブレード検査の不変トレーサビリティを提供する。
システムは、すべてのライフサイクルイベントを、暗黙の台帳でキャプチャする。
検査アーティファクトはIPFSにオフチェーンに格納され、SHA-256ハッシュを介してオンチェーンレコードにリンクされる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:06:56 GMT)
Edged USLAM: Edge-Aware Event-Based SLAM with Learning-Based Depth Priors [1.5] イベントカメラは、これらの問題を高時間分解能と高ダイナミックレンジで緩和する。
We present Edged USLAM, a hybrid visual-inertial system that extends Ultimate SLAM with a edge-aware front-end and a light depth module。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:28:52 GMT)
MAcPNN: Mutual Assisted Learning on Data Streams with Temporal Dependence [1.5] IoT(Internet of Things)分析は、マシンラーニング(ML)モデルをデータストリームに適用することが多い。
この研究は、ヴィゴツキーの認知発達の社会文化的理論に基づく学習パラダイムである相互支援学習を提案する。
各デバイスは、データストリームの動的性質を処理するために、連続進行ニューラルネットワーク(cPNN)を備えている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:03:37 GMT)
Human-AI Collaboration for Scaling Agile Regression Testing: An Agentic-AI Teammate from Manual to Automated Testing [1.5] 本稿では,検証済み仕様から直接システムレベルのテストスクリプトを生成するエージェントAIアプローチを提案する。
私たちのソリューションは,Haconのアジャイルアーキテクチャに統合された,検索可能なマルチエージェントアーキテクチャを備えています。
結果は、AIチームメイトがテストスクリプトのスループットを大幅に向上し、手作業によるオーサリングの労力を削減していることを示している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:19:13 GMT)
R2F: Repurposing Ray Frontiers for LLM-free Object Navigation [1.5] VLM(Vision-Language Models)とLLM(Large Language Models)は、現在ではエンドツーエンドのポリシーではなく、ハイレベルな意思決定者として広く使われている。
室内でのオープン語彙オブジェクトナビゲーションのためのLLMフリーフレームワークを開発した。
Habitat-simおよび実際のロボットプラットフォームにおける実験は、リアルタイム実行による最先端のゼロショットパフォーマンスの競争力を示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:10:10 GMT)
Optimising antibiotic switching via forecasting of patient physiology [1.4] 静脈内(IV)から経口抗生物質療法へのタイムリーな移行は、病院滞在を短縮し、カテーテル関連感染症を減少させ、医療費を低下させる。
イングランドの5人に1人の患者が、交換基準を満たしているにもかかわらず、IV型抗生物質を服用している。
本稿では,脳神経プロセスを用いて,臨床ガイドラインに対する予測を比較して,スイッチ可読性を予測し,バイタルサイントラジェクトリを確率的にモデル化することを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:15:49 GMT)
Human-Aware Robot Behaviour in Self-Driving Labs [1.4] 移動ロボット化学者(MRC)は、実験室を自律的に移動してサンプルを輸送することで重要な役割を担っている。
現在、MRCは単純なLiDARベースの障害物検出に依存しており、人間が存在する場合はロボットを受動的に待機させる。
本稿では,共有アクセスシナリオにおけるアクティブな人間とロボットの相互作用を容易にする,AI駆動型認識手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:17:18 GMT)
Approximate QCAs in one dimension using approximate algebras [1.3] 量子セルオートマトン (QCA) は局所性を保存するテンソル積代数の自己同型である。
局所性条件が小さい誤差にのみ満たされる近似QCAについて検討した。
先行的、近似的なQCAは真に新しい振る舞いを示し、正確なQCAによって適切に近似されない。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:58:16 GMT)
Learning When to Trust in Contextual Bandits [1.3] 我々は、このモードをコンテキストシコファンシー(Contextual Sycophancy)と呼びます。
評価器の高次元信頼境界を学習するCESA-LinUCBを提案する。
我々はCESA-LinUCBが文脈的敵に対するサブ線形後悔$tildeO(sqrtT)$を達成できることを証明し、世界規模で評価者がいない場合でも基礎的真実を回復する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:35:37 GMT)
Structure-Preserving Graph Contrastive Learning for Mathematical Information Retrieval [1.3] 本稿では,グラフコントラスト学習(GCL)のための領域固有グラフ拡張手法として可変置換を導入する。
標準的なGCL拡張技術は、特に小さく高度に構造化されたグラフにおいて、数学的公式の意味を歪ませることが多い。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:36:34 GMT)
FedPrism: Adaptive Personalized Federated Learning under Non-IID Data [1.3] FedPrismは、各クライアントのモデルを3つの部分から構築するフレームワークである。
Prism Decompositionメソッドを使用して、各クライアントのモデルを3つの部分から構築する。
また、Dual-Streamデザインを使用しており、地元のスペシャリストと一緒に一般的なモデルを実行している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:23:32 GMT)
TIDE: Text-Informed Dynamic Extrapolation with Step-Aware Temperature Control for Diffusion Transformers [1.3] ディフュージョントランスフォーマー(Diffusion Transformer, DiT)は、トレーニング解像度と比較して高解像度の画像を生成する際の課題である。
我々は、任意の解像度とアスペクト比で、追加のサンプリングオーバーヘッドを伴わずに生成できる、トレーニングフリーのテキスト・トゥ・イメージ(T2I)外挿法であるTIDEを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:57:19 GMT)
Hybrid Quantum Neural Network for Multivariate Clinical Time Series Forecasting [1.3] 本稿では、リカレント神経バックボーン内に変分量子回路(VQC)を統合するハイブリッド量子古典アーキテクチャを提案する。
本稿では,BIDMC PPGとRespirationデータセットに関する提案手法について,Leave-One-Patient-Outプロトコルを用いて評価する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:08:57 GMT)
Divide and Predict: An Architecture for Input Space Partitioning and Enhanced Accuracy [1.3] 著者らは,教師付き学習のための学習データにおける不均一性を定量化する本質的な尺度を開発した。
この尺度は、トレーニングポイントのペアの影響を要因とするランダム変数の分散である。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:26:56 GMT)
A Comparative Study of Recent Advances in Internet of Intrusion Detection Things [1.2] この研究は、IoT IDSのさまざまなアーキテクチャ、分類、評価手法を掘り下げている。
本稿は、IoTセキュリティと侵入検出に関心のある研究者や実践者に貴重なリソースを提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:49:20 GMT)
Don't Look Back in Anger: MAGIC Net for Streaming Continual Learning with Temporal Dependence [1.2] 我々は、繰り返しニューラルネットワークとアーキテクチャ戦略を統合して時間依存をテーム化する、新しいストリーミング連続学習(SCL)アプローチであるMAGIC Netを紹介する。
MAGIC Netは継続的に学習し、冷凍重量の上に学習可能なマスクを適用することで過去の知識を振り返り、必要に応じてアーキテクチャを拡張する。
合成および実世界のストリームの実験では、新しい概念への適応を改善し、メモリ使用を制限し、忘れを軽減している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:49:04 GMT)
The Grasshopper Problem on the Sphere [1.2] 球面グラスホッパー問題(英: spherical grasshopper problem)は、ベルの不等式(英語版)の文脈で生じる幾何学的最適化問題である。
球面離散化の役割について検討し、3つの自然変種を比較した。
対応する最適芝生構成の幾何学的構造を解析し,球面高調波展開の観点から解釈する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:34:45 GMT)
Evaluating Financial Intelligence in Large Language Models: Benchmarking SuperInvesting AI with LLM Engines [1.1] 金融分析能力の評価を目的とした多次元評価フレームワークであるAI Financial Intelligence Benchmark(AFIB)を紹介する。
GPT,Gemini,Perplexity,Claude,SuperInvestingの5つのAIシステムを評価する。
SuperInvestingは、平均的事実精度スコア8.96/10、最高完全度スコア56.65/70の集計性能を達成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:58:54 GMT)
Gender Bias in MT for a Genderless Language: New Benchmarks for Basque [1.1] バスク語を含む翻訳において、性別バイアスを評価するための2つの新しいデータセットを導入する。
大規模言語モデル (LLM) と機械翻訳システム (MT) の評価を行った。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:35:55 GMT)
Towards Reliable Simulation-based Inference [1.1] この論文は、科学シミュレーターの形をとる統計モデルに焦点を当てている。
機械学習を用いて統計的解析を行うには,近似の程度が伴うことを示す。
バランスは、機械学習モデルを規則化し、過剰な自信を減らし、校正されたあるいは過度な近似を好む方法である。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:29:13 GMT)
Can AI Agents Generate Microservices? How Far are We? [1.1] 3つのエージェント、4つのプロジェクト、2つのプロンプト戦略、2つのシナリオで生成された144を評価します。
Minimalは、50~76%の単体テストパス率で、インクリメンタル世代において詳細なものよりもパフォーマンスがよい。
クリーンな状態生成は、APIコントラクトの強い準拠を示す、より高い統合テストパスレート(88%)を生み出した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:48:41 GMT)
Embedding Classical Balance Control Principles in Reinforcement Learning for Humanoid Recovery [1.1] 人間は転倒や回復不能な障害状態に対して脆弱であり、非構造化環境での実用性を制限する。
古典的バランス指標を埋め込むことにより、この制限に対処する統一的なRLポリシーを提案する。
このポリシーは、ランダム化された初期ポーズと記述されていないフォール設定で93.4%のリカバリ率を達成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:02:30 GMT)
Examining the Role of YouTube Production and Consumption Dynamics on the Formation of Extreme Ideologies [1.0] YouTubeのようなアルゴリズム駆動型プラットフォームにおけるコンテンツ制作と消費の関係は、イデオロギー的行動を形成する上で重要な役割を果たしている。
1年間のYouTubeウォッチ履歴と1,100人の米国参加者によるイデオロギー調査の2つの波を組み合わせた縦-混合メソッド分析を提案する。
より極端なイデオロギーへの大きな変化を示し、コンテンツ消費と、イデオロギー的に安定したYouTubeチャンネルの制作パターンを比較した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:40:20 GMT)
TA-RNN-Medical-Hybrid: A Time-Aware and Interpretable Framework for Mortality Risk Prediction [1.0] 提案フレームワークは,予測精度と臨床解釈可能性のギャップを埋めるものである。
これは、確立した医療知識に沿った臨床的に有意義な説明を提供する。
提案するフレームワークは,大規模ICU意思決定支援システムに対して,スケーラブルで透過的なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:49:42 GMT)
A Dataset for Probing Translationese Preferences in English-to-Swedish Translation [1.0] 日本語の翻訳文と慣用的な代替語とを対比した、英語からスウェーデン語への無料データセットについて紹介する。
エラータグや、オリジナルの翻訳における問題の記述を含む。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:46:35 GMT)
Exp-Force: Experience-Conditioned Pre-Grasp Force Selection with Vision-Language Models [0.9] 一つのRGB画像から最小到達力を予測するフレームワークExp-Forceを提案する。
129のオブジェクトインスタンスでは、ExpForceは0.43NのベストケースMAEを達成し、ゼロショット推論のエラーを72%削減する。
これらの結果はExp-Forceが信頼性と一般化可能なプレグラス力選択を可能にすることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:41:22 GMT)
Mid-Infrared Modulation of Quantum Emitters in Hexagonal Boron Nitride [0.9] 単一光子エミッタ(SPE)は、量子技術における実用的なデバイスのためのビルディングブロックを約束している。
ここでは、六方晶窒化ホウ素中のSPEの性質に対する中赤外励起の相互作用について検討する。
MIR共振を用いた可逆的非破壊的ブルーSPEの発光促進法を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:05:58 GMT)
The $qs$ Inequality: Quantifying the Double Penalty of Mixture-of-Experts at Inference [0.9] Mixture-of-Experts (MoE)モデルは、低トレーニングのFLOPにおいて高い品質を提供するが、この効率はしばしば推論時に消える。
復号化時に構造的にMoEアーキテクチャに不利な二重ペナルティを識別する。
我々は、MoEが品質整合密度モデルに対して構造的に不利なときを識別する予測的基準である$qs$不等式(inequality)を導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:48:04 GMT)
Training event-based neural networks with exact gradients via Differentiable ODE Solving in JAX [0.9] Eventaxは、スパイクニューラルネットワークをトレーニングするためのフレームワークである。
微分可能な数値ODEソルバとイベントベースのスパイク処理を組み合わせる。
幅広いニューロンモデル、損失関数、ネットワークアーキテクチャをサポートしており、容易に拡張できる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:25:52 GMT)
Can LLMs Perceive Time? An Empirical Investigation [0.8] 大規模な言語モデルは、自分たちのタスクがどれくらいかかるかを見積もることはできない。
68のタスクと4つのモデルファミリーにまたがる4つの実験を通して、この制限について検討する。
モデルは、トレーニングから持続時間に関する命題的な知識を持っているが、自身の推論時間に経験的な根拠がない。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:51:04 GMT)
Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models [0.8] ホテルや施設画像に対する視覚的質問応答(VQA)を,視覚言語モデル(VLM)がいかにうまく行うかを検討する。
Informativenessは,まず,画像検索のペアが提供したホスピタリティ関連情報を定量化するための形式的フレームワークとして紹介する。
我々は,重要なユーザ情報のニーズを反映した質問を特別に設計した,様々な施設タイプをカバーする,新たなホスピタリティ特化VQAデータセットを構築した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 00:46:45 GMT)
Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance [0.8] 行方不明児の調査の最初の72時間は、回復に不可欠である。
法執行機関は、しばしば、構造化されていないデータと、動的で地理空間的な予測ツールの欠如に直面します。
われわれのシステムであるGuardianは、行方不明児の調査と早期検索計画のためのエンドツーエンドの意思決定支援システムを提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:08:29 GMT)
A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations [0.8] Guardianは、行方不明児の調査と早期検索計画を支援するために設計されたエンドツーエンドシステムである。
本稿では,行方不明者検索操作に関連する知的情報抽出と処理にLLMを使用する多モデルシステムであるGuardian LLM Pipelineを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:40:17 GMT)
From Reactive to Map-Based AI: Tuned Local LLMs for Semantic Zone Inference in Object-Goal Navigation [0.8] Object-Goal Navigation(ObjectNav)は、エージェントが未知の環境で対象のオブジェクトカテゴリを見つけてナビゲートする必要がある。
我々は,LLMに基づく意味推論とハイブリッドトポロジカルグリッドマッピングシステムを統合することにより,リアクティブAIから"マップベースAI"への移行を提案する。
本フレームワークでは,Llama-2モデルを用いて,言語化された対象観測から意味領域のカテゴリと目的存在確率を推定する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:27:28 GMT)
Lattice: A Post-Quantum Settlement Layer [0.8] 本稿では、量子後決済層として設計されたピアツーピア電子キャッシュシステムLatticeを紹介する。
LatticeはRandomXのみによるハードウェアのレジリエンスとLWMA-1によるネットワークのレジリエンスを組み合わせている。
ML-DSA-44ポスト量子デジタル署名による暗号レジリエンス
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:30:04 GMT)
Quantifying the Accuracy and Cost Impact of Design Decisions in Budget-Constrained Agentic LLM Search [0.7] Agentic Retrieval-Augmented Generation (RAG) システムは反復検索、計画プロンプト、検索を組み合わせるが、配置設定はツールコールと完了トークンに明確な予算を課している。
本研究では, 探索深度, 検索戦略, 完成予算が, 一定の制約下での精度とコストに与える影響について, 制御された測定結果を示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:42:21 GMT)
Hybrid Quantum-Classical Encoding for Accurate Residue-Level pKa Prediction [0.7] 本稿では,ガウスカーネルをベースとした量子インスパイアされた特徴写像を用いて,残差レベルの表現を豊かにするための再現可能なハイブリッド量子古典的フレームワークを提案する。
このアーキテクチャは、古典的なモデルではアクセスできない残余のマイクロ環境における非線形関係をキャプチャする。
量子に着想を得た特徴変換を古典的な生化学的記述子と統合することにより、残基レベルpKa予測のためのスケーラブルで実験的に転移可能なアプローチを確立し、タンパク質静電学における幅広い応用を確立させる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:48:01 GMT)
When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality [0.7] 生成AIは、経済価値を集中的な補完資産にシフトしながら、タスク内スキルの違いを圧縮する。
我々は、この緊張関係を内在的教育、雇用主検診、異種企業によるタスクベースモデルで定式化する。
このモデルでは、境界がAIの技術構造に依存する2つのレジームが生成される。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:29:42 GMT)
Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules [0.7] 本稿では,分布回帰における確率的予測の妥当性を評価するための適切なスコアリングルールの適用について論じる。
そこで我々は,確率回帰のためのベンチマークにCRPS(Continuous Rank probability score)を用いることを提唱する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:38:01 GMT)
Bi-CamoDiffusion: A Boundary-informed Diffusion Approach for Camouflaged Object Detection [0.7] Bi-CamoDiffusionはCamoDiffusionフレームワークの進化である。
エッジプリエントをパラメータフリーインジェクションプロセスを通じてアーリーステージの埋め込みに統合する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:01:58 GMT)
BuildMamba: A Visual State-Space Based Model for Multi-Task Building Segmentation and Height Estimation from Satellite Images [0.7] BuildMambaは、ビジュアルステートスペースモデルの線形時間グローバルモデリングを活用するために設計された統合マルチタスクフレームワークである。
DFC23ベンチマークでは0.93のIoUと1.77mのRMSEが達成され、高度推定では0.82mを超える。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:56:42 GMT)
IAML: Illumination-Aware Mirror Loss for Progressive Learning in Low-Light Image Enhancement Auto-encoders [0.7] 本稿では,低照度画像強調オートエンコーダの学習のための新しいトレーニング手法と損失関数を提案する。
本手法は,プログレッシブ・ラーニング・アプローチと合わせて,教師が学習するオートエンコーダ・セットアップの利用を中心に展開する。
提案モデルでは,SSIM,PSNR,LPIPSの再現精度の平均値を用いて,最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:48:55 GMT)
Coupled-Layer Construction of Quantum Product Codes [0.7] 製品コードは、2つ以上の構成コードから構築された量子エラー訂正コードである。
テンソルおよびバランスの取れた製品コードは、1つのコードのスタックを取り、他のコードのチェックによって与えられるパターンに一連の励起を凝縮することにより、直感的な結合層構造を許容することを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:59:59 GMT)
How Trustworthy Are LLM-as-Judge Ratings for Interpretive Responses? Implications for Qualitative Research Workflows [0.6] 本研究では,LLM-as-judge評価が解釈品質の人的判断と有意に一致しているかどうかを検討する。
5つの広く採用されている推論モデルを用いて一文解釈応答を生成した。
その結果, LLM-as-judgeスコアは, モデルレベルでの人間の評価において, 幅広い方向の傾向をとらえるが, スコアの程度は著しく異なることがわかった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:22:41 GMT)
Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations [0.6] 本稿では,言語誘導型把握のためのエンドツーエンドパイプラインを提案し,実際のロボット上での動作を安全に把握するために,自由語彙選択をブリッジする。
自然言語コマンドを与えられたシステムは、オープン語彙検出と即時インスタンスセグメンテーションを使用して、ターゲットをRGBにグラウンドする。
次に、衝突フィルタ6-DoFグルーピング候補を生成し、到達可能性、アプローチ可能性、クリアランスを考慮に入れた安全指向のグルーピングを用いて実行可能なグルーピングを選択する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 00:42:32 GMT)
LAMUS: A Large-Scale Corpus for Legal Argument Mining from U.S. Caselaw using LLMs [0.6] 本稿は、アメリカ合衆国最高裁判所の決定とテキサス州の刑事法定の意見から構築された、刑期レベルの法的議論採掘コーパスであるLAMUSを紹介する。
データセットは、大規模なケースコレクション、自動アノテーション、ターゲットとする人間のループ品質改善を組み合わせた、データ中心のパイプラインを使用して作成される。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:01:42 GMT)
The uncloneable bit exists [0.5] 我々は、無条件のセキュリティで量子不能な暗号化を確立する。
我々は、2つの非通信敵が鍵を与えられた場合でも1つの暗号文$-$を同時に復号するのを防ぐ。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:33:33 GMT)
A Lightweight Multi-Cancer Tumor Localization Framework for Deployable Digital Pathology [0.5] 特定のがん内で訓練された深層学習に基づく腫瘍検出は、異なる種類の腫瘍に適用した場合、堅牢性が低下する可能性がある。
多発癌腫瘍局在モデル (MuCTaL) を4癌から79,984個の非重複タイルを用いて訓練した。
このモデルは4つの訓練癌からの検証データで0.97のタイルレベルのROC-AUCを、独立した管腺癌コホートで0.71を達成した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:00:04 GMT)
IronEngine: Towards General AI Assistant [0.5] IronEngineは、統合オーケストレーションコアを中心に構成された、汎用AIアシスタントプラットフォームである。
本稿では, プラットフォームのアーキテクチャ分解, サブシステム設計, 実験性能, 安全性境界, 比較工学的優位性について分析する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:18:50 GMT)
Unpacking Interpretability: Human-Centered Criteria for Optimal Combinatorial Solutions [0.4] 本稿では,各項目を箱に詰め込むのに最適な2つのソリューションを参加者が選択する実験パラダイムを提案する。
好みが解構造の3つの特性を確実に追跡できることが示される。
これらの結果は、最適パッキングソリューションにおける解釈可能性の具体的、特徴ベースの説明を提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:18:52 GMT)
Adaptive Entropy-Driven Sensor Selection in a Camera-LiDAR Particle Filter for Single-Vessel Tracking [0.4] 情報ゲイン適応センシングポリシを組み込んだ異種多センサ融合粒子フィルタトラッカーを提案する。
このアプローチはCMMI Smart Marina Testbed (Ayia Napa Marina, Cyprus)での実際の海上展開で検証されている。
その結果、LiDARは近接場精度で優位であり、LiDARが利用できなくなると、カメラは長距離のカバーを維持できることがわかった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:52:08 GMT)
Cybersecurity AI: Hacking Consumer Robots in the AI Era [0.3] 本稿では,ジェネレーティブAIがロボットサイバーセキュリティを根本的に破壊した証拠を提示する。
攻撃能力はAIによって民主化されてきたが、防御策は遅れていることが多い。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:40:47 GMT)
SmartGraphical: A Human-in-the-Loop Framework for Detecting Smart Contract Logical Vulnerabilities via Pattern-Driven Static Analysis and Visual Abstraction [0.3] 本稿では,論理攻撃面の識別に特化して設計された新しいセキュリティフレームワークであるSmartGraphicalを紹介する。
論理的バグのコンテキスト依存の性質を合成することによって、SmartGraphicalは、視覚化された構造的コンテキスト内で警告を解釈することが可能になる。
このハイブリッド手法は,スマートコントラクトにおける非自明な論理的セキュリティ脅威の解釈可能性と検出率を大幅に向上させることが示唆された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:35:17 GMT)
Identifying Influential Actions in Human-Robot Interactions [0.3] 本稿では,移動エントロピーを用いたロボット行動の同定手法を提案する。
本研究では,遠隔操作ロボットアバターとの会話において,ロボットの動作が人間の行動にどう影響するかを解析するために,本手法を適用した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:48:20 GMT)
TildeOpen LLM: Leveraging Curriculum Learning to Achieve Equitable Language Representation [0.2] 本稿では,34言語を対象としたオープンウェイト基盤モデルであるTildeOpen LLMについて述べる。
データ不均衡に対処するために、データセットを10倍にし、一様と自然言語の分布を交互に行うカリキュラムベースのトレーニングスケジュールと組み合わせる。
このモデルはテキスト生成や理解において既存のオープンウェイトモデル、特にバルト語、フィンノ・ウルグ語、スラヴ語を超越している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:03:17 GMT)
A Hybrid Vision Transformer Approach for Mathematical Expression Recognition [0.2] 画像からシンボル間の複雑な関係を抽出するために,2次元位置符号化をエンコーダとするハイブリッドビジョントランス (HVT) を提案する。
カバレッジアテンションデコーダは、アンダーパーシングとオーバーパーシングの問題に対処するために、アテンションの履歴をよりよく追跡するために使用される。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:49:57 GMT)
Visualizing Coalition Formation: From Hedonic Games to Image Segmentation [0.2] ヘドニックゲームにおける連立生成のための視覚診断テストベッドとしてのイメージセグメンテーションを提案する。
収束した連立関係が基底構造と重なり合うかどうかを計測することにより、多重結合平衡をバイナリプロトコルに関連付ける。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:08:17 GMT)
Lockbox -- A Zero Trust Architecture for Secure Processing of Sensitive Cloud Workloads [0.2] 本稿では、機密性の高いクラウドワークロードのセキュアな処理を目的としたZero TrustアーキテクチャであるLockboxについて述べる。
Lockboxは、アプリケーションライフサイクル全体を通じて、明確な信頼検証、強力なアイソレーション、最小特権アクセス、ポリシー駆動の実施を適用します。
Systemには、ロールベースのアクセス制御、集中型キー管理、トランジット時の暗号化、およびクラウドベースのデータ処理サービスとの統合制御を含む、現代的なクラウドセキュリティプリミティブが含まれている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:45:00 GMT)
Designing probabilistic AI monsoon forecasts to inform agricultural decision-making [0.1] 本稿では,農家の状況が異質であるため,予測者が最適な行動を規定できないような環境で有用な予測を設計するための意思決定理論フレームワークを提案する。
この枠組みをモンスーン雨の季節的発生例に適用し,多くの熱帯諸国における植林決定と農業投資の鍵となる日である。
我々は,システムベンチマークによる人工知能(AI)天気予報モデルと,新たな「進化する農夫の期待」統計モデルを組み合わせることで,この枠組みの要件に合わせた予測を行うシステムを開発した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:25:12 GMT)
Functional Bias and Tangent-Space Geometry in Variational Inference [0.1] 後続汎関数の先行次偏差は、変動族によって誘導される変分接空間の成分によって決定されることを示す。
さらに、関数のバイアスに対する明示的な拡張を導出し、省略された相互作用方向がクロスブロック依存尺度の1次歪みを生じさせることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:52:14 GMT)
The Structure of Circle Graph States [0.1] 円グラフ状態は構造的に重要なグラフ状態の族である。
円グラフ状態上のMBQCは、実際には効率よく古典的にシミュレートできる。
与えられたグラフ状態に等価なグラフ状態の数は、#mathsfP$-hardである。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:03:16 GMT)
SplitAgent: A Privacy-Preserving Distributed Architecture for Enterprise-Cloud Agent Collaboration [0.0] 現在のエージェントフレームワークは完全なデータ共有を前提としており、機密情報を持つエンタープライズ環境には適さない。
エンタープライズ側プライバシエージェントとクラウド側推論エージェントのプライバシ保護コラボレーションを可能にする,新たな分散アーキテクチャであるSplitAgentを提案する。
私たちの重要なイノベーションは、タスクセマンティクスに基づいたプライバシ保護に適応する、コンテキスト対応の動的サニタイズです。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:51:31 GMT)
Real-Time Drone Detection in Event Cameras via Per-Pixel Frequency Analysis [0.0] 非均一離散フーリエ変換(NDFT)を用いた画素単位の時間解析フレームワークを提案する。
本手法は, ドローンローターの周波数特性を周波数スペクトルの周波数コムに特徴付けるために, 純粋に解析的手法を用いる。
DDHFは平均ローカライゼーションF1スコアが90.89%、平均レイテンシが2.39ms、YOLOは66.74%、フレーム当たり12.40msである。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:45:00 GMT)
Disentangling Prompt Dependence to Evaluate Segmentation Reliability in Gynecological MRI [0.0] 局所感度(相互作用インプレッション)から曖昧さ(ユーザ間変動性)を明示的に解き放つプロンプト依存の最初の定式化を導入する。
子宮と膀胱の分節のための2つの女性骨盤MRIデータセットの実験では、測定値と分節性能の間に強い負の相関が認められた。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:42:43 GMT)
Why No Consensus on Consensus? A Deep Dive into Blockchain Consensus Protocols [0.0] テクノロジーはデジタルの風景に革命をもたらし、その分散的で透明なインフラを通じて産業全体のイノベーションを推進してきた。
パブリックブロックチェーンは全員に開放されており、完全に分散化されているが、プライベートブロックチェーンは認定参加者のみへのアクセスを制限している。
本稿では,近年の文献のリミッタオンに対処する詳細を含む,批判的かつ統一的な分析を行う。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:08:41 GMT)
Why Large Language Models can Secretly Outperform Embedding Similarity in Information Retrieval [0.0] 類似性は関連性の短い解釈であると主張する。
LLM-RJS(推論付き)は、この制限を克服することで、Neural Embedding Retrieval Systems(NERS)を上回る可能性がある。
また,LLM-RJSにおける誤陽性は,近視性によるアノテーションの誤りが主である。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 08:15:32 GMT)
Why Channel-Centric Models are not Enough to Predict End-to-End Performance in Private 5G: A Measurement Campaign and Case Study [0.0] 通信対応ロボット計画には,無線ネットワーク性能の正確な予測が必要である。
現在のアプローチは、受信信号強度や信号対雑音比といったチャネルレベルの指標に依存している。
我々は,民間の5G産業環境における計測キャンペーンを通じて,この仮定に挑戦する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:27:00 GMT)
Visualization of Multi-Qubit Pure States with Separation of Local and Nonlocal Degrees of Freedom [0.0] 2量子状態と3量子状態の可視化のための統一的な幾何学的枠組みを提案する。
2つの量子ビットに対して、還元密度作用素のブロッホ球面表現と複素平面上にプロットされた複素共起を結合する。
一般化されたシュミット分解に基づく3つの量子ビットに対して、二部分解とGHZ型三部分解を導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:15:30 GMT)
Universal Non-stabilizerness Dynamics Across Quantum Phase Transitions [0.0] 非安定化器性は古典的にシミュレート可能なクリフォード演算を超越した計算力を特徴付ける重要な量子資源である。
安定化器のレニーエントロピーとパウリスペクトルの累積は、減速過程における駆動速度とともに普遍的なパワーロースケーリングを示すことを示す。
この結果は, 横フィールドIsingモデルにおける正確な結果と, 長距離北エフモデルにおける解析的近似によって明らかに示される。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:00:00 GMT)
Trust via Reputation of Conviction [0.0] Emphknowledge、Emphtruth、Emphtrustの問題は、クレームとソースの数学的定式化を通じて検討される。
我々は、真理を再現的に認識される知識のサブセットとして定義し、情報源を生成的役割と識別的役割の両方を持つものとして定式化する。
我々は、ソースのスタンスが独立したコンセンサスによって左右される可能性という、Emphconvictionに根ざした評価のためのフレームワークを開発する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:30:33 GMT)
Trajectory Tracking Control Design for Autonomous Helicopters with Guaranteed Error Bounds [0.0] 本稿では,ロバスト不変量(RPI)集合に基づく自律ヘリコプターの軌道追従誤差境界を公式に保証するフレームワークを提案する。
楕円形RPI集合は計算され、上層軌道計画における認証バッファゾーンに適した明示的な位置誤差境界が得られる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:35:09 GMT)
Towards plausibility in time series counterfactual explanations [0.0] 本稿では,時系列分類問題に対する妥当な反実的説明を生成するための新しい手法を提案する。
この手法は入力空間内で直接勾配に基づく最適化を行う。
妥当性を高めるために、ターゲットクラスの$k$-nearest 隣人とソフトDTWアライメントを統合する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:13:52 GMT)
Towards Modeling Cybersecurity Behavior of Humans in Organizations [0.0] 私たちは、AIシステムが組織内の自律的なエージェントとして働きつつあり、自然言語処理にもとづくにつれて、人間の行動リスクに類似した脆弱性も現れている、と論じています。
この人中心型モデルは,AIエージェントを標的とした操作攻撃に対して,新たなセキュリティ戦略を開発するための青写真を提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:19:53 GMT)
Tool Receipts, Not Zero-Knowledge Proofs: Practical Hallucination Detection for AI Agents [0.0] NabaOSは対話型エージェントのための軽量な検証フレームワークである。
ソースによってAI応答内のすべてのクレームを分類する。
製造されたツールの実行の94.2%、誤り回数の87.6%、虚偽の欠席債権の78.4%を検知する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:45:41 GMT)
Time warping with Hellinger elasticity [0.0] 任意の距離空間における値を持つ時系列のマッチング問題について,Hellingerカーネルが与えるストレッチペナルティについて考察する。
このマッチングを最適化するために,3次計算複雑性を持つElastic Time Warpingアルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:05:11 GMT)
Time delocalization and causality across temporal quantum reference frames [0.0] リレーショナル量子力学では、ある興味ある系と時計系の間の相関を通じて進化が現れる。
本研究では、時間的局所化と因果関係という2つの側面の相互作用を、クロックの異なる選択に対する創発的ダイナミクスの比較において検討する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:00:08 GMT)
The robustness of composite pulses elucidated by classical mechanics. II. The role of initial state imperfection [0.0] 複合パルス(CP)は核磁気共鳴(NMR)におけるパルス異常の補正に広く用いられている
従来, 安定解析を行うための古典的標準フレームワークを開発し, CPロバスト性の尺度として用いた。
この研究は、Bloch Sphere 上の初期条件の 2D$ の分布までこのアプローチを拡張した。
初期条件で拡散が発生した場合,レヴィットの90(x)180(y)90(x)$パルス列について検討する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:56:25 GMT)
The UK Cyber Security and Resilience Bill: A Practitioner's Guide to Legislative Reform, Compliance, and Organisational Readiness [0.0] サイバーセキュリティとレジリエンス(ネットワークと情報システム)法案は2025年11月に議会に提出された。
本稿では、法案の規定、その実践的意味、コンプライアンスを達成するために組織が取るべきステップを包括的に分析する。
管理サービスプロバイダ、データセンタ、指定されたクリティカルサプライヤーをカバーする規制範囲の拡大について検討する。
この論文は、法案をEUのNIS2指令とDORAと比較し、金融サービス会社に実用的な二重コンプライアンスの枠組みを提案している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 00:23:57 GMT)
The Transfer Tensor Method: an Analytical Study Case [0.0] 有限時間離散化の場合、中島ズワンジグ方程式のメモリカーネルは正確な転送テンソルから逸脱することを示す。
我々は、動的マップ、転送テンソル、コヒーレンスを管理するメモリカーネルの正確な表現を導出する。
キャビティ損失率と原子-キャビティ結合強度の比の関数として,非マルコビアン性の強化領域を同定する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:52:33 GMT)
The Temporal Markov Transition Field [0.0] マルコフ遷移場(MTF)は、各ペアの時間ステップをそれらの量子状態間の遷移確率にマッピングすることで、時系列を二次元画像として符号化する。
TMTFはシリーズを$K$連続時間チャンクに分割し、各チャンクごとに別々の局所遷移行列を推定し、各行がグローバル平均ではなくそのチャンクに局所的なダイナミクスを反映するようにイメージを組み立てる。
TMTFは振幅に依存しない順序テンポラルであり、時系列の特徴付けタスクに適用される畳み込みニューラルネットワークの入力チャネルとして適している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:04:40 GMT)
The Structure of Participation and Attention in Arabic-Language Hezbollah Discourse on X [0.0] 本研究は,X(旧Twitter)におけるヘズボラに関するアラビア語談話における参加と注目の構造について検討する。
その結果、非常に不平等なエンゲージメントの分布が明らかになった。
ヒズボラに関するXに関する談話は、投稿活動に関して広く参加しているように見えるが、観客の注目は、目に見える少数の少数派の間で強く集中している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:33:06 GMT)
The Missing Memory Hierarchy: Demand Paging for LLM Context Windows [0.0] 我々は、コンテキストウィンドウのための需要パージングシステムPichayを紹介する。
681ターン以上のライブデプロイメントでは、コンテキスト消費を最大93%削減する(5,038KBから339KB)。
極端に持続的な圧力の下では、システムは引き続き運用されるが、期待されるスラッシングの病理を示し、繰り返し削除されたコンテンツに障害が生じる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:38:32 GMT)
The Dirac sea of phase: Unifying phase paradoxes and Talbot revivals in multimode waveguides [0.0] 位相依存波動関数 $(, t)$ をハーディ空間 $H2(mathbbD)$ に配置する。
この定式化は、非調和屈折率プロファイルを特徴とする多モード導波路の光伝搬に適用される。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:04:09 GMT)
The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift [0.0] 4つのMuJoCo環境における連続観測ドリフト下での世界モデルに基づく自己監視について検討した。
我々は、鋭い検出しきい値$varepsilon*$が普遍的に存在することを発見した。
我々の結果は、創発的な世界モデル特性から、ノイズフロア、検出器、環境力学の間の3方向の相互作用へと、$varepsilon*$を再設定する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:51:53 GMT)
Test-Driven AI Agent Definition (TDAD): Compiling Tool-Using Agents from Behavioral Specifications [0.0] テスト駆動型AIエージェント定義(TDAD)は、エージェントプロンプトをコンパイルされたアーティファクトとして扱う方法論である。
SpecSuite-CoreのTDADは、ポリシーコンプライアンス、グラウンドド・アナリティクス、ランブックの遵守、決定論的強制にまたがる4つのエージェントのベンチマークである。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:04:54 GMT)
Symmetric Trotterization in digital quantum simulation of quantum spin dynamics [0.0] 高次スズキ・トロッター分解を利用すれば、デジタル量子シミュレーションにおけるトロッター誤差を軽減することができる。
この研究は、トロッター誤差の観点から二階対称トロッター化を再考する。
試作超伝導量子デバイスにおいて, 対称トロッター化の有効性を評価した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:51:14 GMT)
Stochastic Loop Corrections to Belief Propagation for Tensor Network Contraction [0.0] 信念の伝播は効率的な近似解を提供するが、ループを持つグラフの体系的な誤りを導入する。
そこで本研究では,BPの磁化ループ補正によって正確な結果を得るハイブリッド手法を提案する。
提案手法は,任意のパラメータ状態において,制御可能な統計的誤差を伴う偏りのない推定値を提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:22:43 GMT)
Statistical Inference via Generative Models: Flow Matching and Causal Inference [0.0] 生成AIは目覚ましい経験的な成功を収めてきたが、統計学の観点から見れば、しばしば不透明である。
この本は、フローマッチングを中心的な例として、統計言語における生成AIを再解釈する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:56:02 GMT)
Solution of Quantum Quartic Potential Problems with Airy Fredholm Operators [0.0] 作用素はエアリー関数で表され、その固有値は指数関数的に速く落ちる。
それらは高精度な数値解析に役立ち、その存在はノード上の変数を持つ無限の一次元鎖とノードとリンクの重みという2つの記述をもたらす。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:07:46 GMT)
Social Proof is in the Pudding: The (Non)-Impact of Social Proof on Software Downloads [0.0] バッドアクターは、社会的証明メトリクスをゲームして、悪性ソフトウェアの使用を誘発することができる。
2つのフィールド実験を用いてその問題を研究する。
後続のダウンロードやリポジトリアクティビティのあらゆる指標に検出可能な影響は見つからない。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:28:41 GMT)
Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance [0.0] 大規模医療機関は通常、複数のビジネスインテリジェンス(BI)チームを運営している。
HIPAA、FERPA、IRBの制限のため、これらのチームは分析に必要な患者レベルのデータを共有するという課題に直面している。
事前計算されたプライバシに準拠した要約である計量集計表が提案されている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:36:11 GMT)
Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds [0.0] 本稿では,ポアンカレ球上での熱核拡散を通じて連続ズーム演算子を定義するフレームワークであるSemantic Level of Detail (SLoD)を紹介する。
グラフラプラシアンのスペクトルギャップは創発的スケール境界を誘導することを示す。
人工階層において, 境界スキャナーはARIによる植林レベルを最大1.00まで回復し, 検出精度はケステン・スティグム閾値付近で良好に低下する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:54:08 GMT)
Scalable Postselection of Quantum Resources [0.0] 本稿では,スケーラブルなポストセレクションを用いた量子コンピューティングのオーバーヘッド低減手法を提案する。
拡張性のあるポストセレクションは論理ゲート当たりのオーバーヘッドを同じ論理エラー確率で4倍に削減できることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:55:44 GMT)
SPD-RAG: Sub-Agent Per Document Retrieval-Augmented Generation [0.0] SPD-RAG(SPD-RAG)は,クロスドキュメントな質問応答のための階層型マルチエージェントフレームワークである。
各文書は、自身のコンテンツのみで動作する専用文書レベルエージェントによって処理され、集中した検索が可能となる。
SPD-RAGは58.1(GPT-5評価)のAvgスコアを達成し、正規RAG(3.0)とエージェントRAG(32.8)を上回り、フルコンテキストベースライン(68.0)のAPIコストの38%しか使用していない。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:46:32 GMT)
RoboLayout: Differentiable 3D Scene Generation for Embodied Agents [0.0] RoboはLayoutVLMの拡張として導入され、エージェント対応推論と安定性の向上によってオリジナルのフレームワークを拡張している。
Roboは、明示的な到達性制約を異なる空間的に可能なレイアウト最適化プロセスに統合し、反復的なレイアウトの生成と、実施エージェントによるアクションを可能にする。
全体としてRoboは、エージェント中心の屋内シーンに適用性を高めながら、強いセマンティックアライメントと物理的妥当性を維持している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:05:21 GMT)
Rectified flow-based prediction of post-treatment brain MRI from pre-radiotherapy priors for patients with glioma [0.0] 人工知能(AI)の最近の進歩は、臨床データから条件付きマルチモーダル画像の生成を可能にする。
そこで本研究では, トラクタル内腫瘍におけるAIによる追跡MRIの生成について検討した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:43:58 GMT)
Real-Time Monocular Scene Analysis for UAV in Outdoor Environments [0.0] 我々はCo-SemDepthという,2つのタスクを正確かつ迅速に実行可能な共同ディープラーニングアーキテクチャを提案する。
Co-SemDepthは、MidSeaと呼ばれる合成海洋データに基づいて訓練され、合成データと実データの両方でテストされている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:08:50 GMT)
Random layers for quantum optimal control with exponential expressivity [0.0] 我々は,各層に1つの最適化パラメータを持つランダムな定数振幅パルスからパラメタライズドパルス列を構築する。
パルスを層にグループ化することで、最適化パラメータの総数を減らすことができる。
我々は、異なる量子系における一元合成、基底状態準備、状態伝達の問題にそれらを適用することにより、2つの手法を数値的に検証する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:29:33 GMT)
Ramsa: A Large Sociolinguistically Rich Emirati Arabic Speech Corpus for ASR and TTS [0.0] ラムサ (Ramsa) は、エミラティ・アラビア語の41時間のコーパスで、社会言語学の研究と低リソース言語技術を支援するために設計された。
157人の話者(59人の女性、98人の男性)が参加し、アーバン、ベドウィン、マウンテン/シヒといった下位言語にまたがり、文化遺産、農業と持続可能性、日常生活、職業的軌道、建築などのトピックをカバーしている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:04:41 GMT)
RL unknotter, hard unknots and unknotting number [0.0] 我々は結び目図を簡素化する強化学習パイプラインを開発した。
訓練されたエージェントは、移動の提案とReidemeisterの動きをナビゲートする価値を学ぶ。
私たちはそれを非常に難しい'無意味な図でテストします。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:43:59 GMT)
Quantum-limited estimation of the difference between photonic momenta via spatially resolved two-photon interference [0.0] 2つの光子のモータ間の差を推定するための量子センシングプロトコルを提案する。
このプロトコルは、相対運動量の成分の同時推定において、最終的な量子精度を達成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:51:00 GMT)
Quantum algorithm for anisotropic diffusion and convection equations with vector norm scaling [0.0] ディジタル量子コンピュータにおける偏微分方程式(PDE)の解法に取り組む。
本稿では, 量子状態の生成, 対角演算子による進化, 興味のある観測値の測定の3段階からなる量子数値スキームを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:02:12 GMT)
Quantization of Ricci Curvature in Information Geometry [0.0] 2004年、二元ベイズネットワーク (bitnets) の情報幾何学の研究中に、フィッシャー情報計量に関して計算された体積平均リッチスカラー R> は正の半整数 R> in (1/2)Z に普遍的に量子化されていると推測した。
本稿では,20年後の予想を解き,木構造および完全グラフビットネットに対して,普遍的なベータ関数のキャンセル機構を用いて証明し,明示的なループ反例を示すことによって一般論として論証する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:44:10 GMT)
Quantifying Uncertainty in AI Visibility: A Statistical Framework for Generative Search Measurement [0.0] 生成探索における領域可視性の測定への現在のアプローチは、通常、引用共有と有病率の単一実行点推定に依存する。
本論では, 参照可視度は, 固定値ではなく, 基礎となる応答分布の標本推定器として扱うべきである。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:47:22 GMT)
Quantifying Divergence in Inter-LLM Communication Through API Retrieval and Ranking [0.0] 大規模言語モデル(LLM)は、複雑なタスクを実行するために外部APIを優先する自律的なエージェントとして、ますます運用されている。
本稿では,LLM間の差異を定量化する統一ベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:28:24 GMT)
Perturbative relativistic modifications to wave-packet dynamics and uncertainty relations in the quantum harmonic oscillator [0.0] 一般表現は、ウェーブパケットパラメータへの先行相対論的寄与のために導かれる。
相対論的効果はkeVスケールの高調波閉じ込めエネルギーでは無視できない。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:43:00 GMT)
Personalized AI Practice Replicates Learning Rate Regularity at Scale [0.0] 学生は様々な教育的文脈で一貫した学習率を示す。
これらの結果は,デジタルプラットフォームであるCampus AIの学生インタラクションデータセットを用いて検証した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:33:28 GMT)
Parity-dependent Casimir forces and Hall currents for a confined Dirac field [0.0] d + 1次元の2つの平行な薄壁上の2つの代替境界条件に従属する質量を持たないディラック場について検討する。
2つの構成は、2つの壁の間の中間面の反射において、偶数または奇数であるシステムに対応し、定性的に異なる挙動をもたらす。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:50:21 GMT)
Pareto-Optimal Anytime Algorithms via Bayesian Racing [0.0] 我々は,任意のアルゴリズム比較のためのフレームワークであるPolarBear(ベイジアンレースによるパレート最適アルゴリズム)を紹介する。
このアプローチでは、任意のインスタンス分布に対して、既知のオプティマを必要とせず、バウンダリを必要とせず、正規化も必要とせず、コヒーレントに集約する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:28:39 GMT)
Parallel iQCC Enables 200 Qubit Scale Quantum Chemistry on Accelerated Computing Platforms Surpassing Classical Benchmarks in Ruthenium Catalysts [0.0] 反復量子ビットクラスタ(iQCC)の並列GPU高速化実装について紹介する。
シリアルCPUアプローチよりも2桁を超えるスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:49:37 GMT)
Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy [0.0] 2026 フォーミュラ1の技術的な規制はエネルギー戦略に根本的な変化をもたらす。
最適エネルギー配置ポリシーは、運転者自身の状態だけでなく、ライバル車の隠れ状態にも依存する。
抽出可能な2層推論および決定フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:10:14 GMT)
One Language, Two Scripts: Probing Script-Invariance in LLM Concept Representations [0.0] Sparse Autoencoders (SAEs) が学習した特徴が抽象的な意味を表すのか、それともテキストの書き方と結びついているのかを検討する。
異なるセルビア文字で同一の文が高度に重なり合う特徴を活性化し、ランダムなベースラインをはるかに超えていることがわかった。
この結果から,SAE機能は表面トークン化以上の抽象レベルでセマンティクスをキャプチャできる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:31:20 GMT)
Novel Semantic Prompting for Zero-Shot Action Recognition [0.0] ゼロショットアクション認識は、視覚言語モデルからセマンティック記述を用いた未知のアクションへの知識の伝達に依存している。
本稿では,複数の抽象化レベルにおける動作を記述する構造化セマンティックプロンプトを用いて,凍結視覚言語モデルを拡張する軽量フレームワークSP-CLIPを紹介する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:07:55 GMT)
Momentum SVGD-EM for Accelerated Maximum Marginal Likelihood Estimation [0.0] 本稿では,Stein variational gradient descent(SVGD)に基づく,そのような手順の高速化版を提案する。
結果として得られた手法は Momentum SVGD-EM と呼ばれ、難易度を増大させる様々なタスクにまたがる必要な反復の点において、一貫して収束を加速する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:47:36 GMT)
Microwave response of electrically driven spins in a three-qubit quantum processor [0.0] マイクロ波駆動振幅の関数としてのラビ周波数の非線形性について検討した。
3つのスピンを同時に駆動しても、Rabi周波数は駆動振幅とともに線形にスケールする。
以上の結果から,従来観測されていた非線形応答はLDスピン量子ビットの一般的な特徴ではないことが示唆された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:33:50 GMT)
Micro-Diffusion Compression -- Binary Tree Tweedie Denoising for Online Probability Estimation [0.0] 適応統計モデルにより生成される確率推定を改善するために, マイクロ拡散復調層を導入する。
Midicothは、適応型PPMモデル、長距離マッチングモデル、トレーベースワードモデル、高階コンテキストモデル、マイクロ拡散デノイザの5つの完全オンラインコンポーネントを最終段階として組み合わせている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 16:59:24 GMT)
Magnetically Driven Elastic Microswimmers: Exploiting Hysteretic Collapse for Autonomous Propulsion and Independent Control [0.0] 2つの弾性リンクで連結された3つの磁化可能なビーズからなるストレートマイクロスウィマーの運動を解析した。
水泳機構は、大きさで振動する指向性外部磁場に基づいている。
異なるマイクロスウィマーは異なる駆動振幅と周波数に調整することができ、1つの外部磁場で同時に独立制御することができる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:32:56 GMT)
LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems [0.0] 現在のプロトコルでは、モデルレベルのプロパティを第一級プリミティブとして公開していない。
5つのメカニズムを導入したAIネイティブ通信プロトコルであるLDM Delegate Protocol(LDP)を提案する。
アイデンティティを意識したルーティングは、デリゲートの特殊化によって、簡単なタスクの12倍のレイテンシを実現するが、小さなデリゲートプールの集約品質は向上しない。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 19:13:17 GMT)
Joint Return and Risk Modeling with Deep Neural Networks for Portfolio Construction [0.0] 本稿では,ディープニューラルネットワークに基づく共同リターンとリスクモデリングの枠組みを提案する。
2010年から2024年までの10大米国株式の日次データを用いて、リターン予測、リスク推定、ポートフォリオレベルのパフォーマンスを評価する。
このフレームワークは、非定常市場条件下でのデータ駆動型ポートフォリオ構築のスケーラブルで実用的な代替手段を提供する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:49:51 GMT)
Jagarin: A Three-Layer Architecture for Hibernating Personal Duty Agents on Mobile [0.0] パーソナルAIエージェントは、モバイルにおける基本的なデプロイメントパラドックスに直面している。
本稿では、このパラドックスを、構造的冬眠と需要駆動のウェイクによって解決する3層アーキテクチャであるJagarinを紹介する。
動作中のFlutterプロトタイプがAndroid上でデモされ、3つのレイヤすべてと、ユーザ主導のエスカレーションでのみ呼び出される一時的なクラウドエージェントが組み合わされている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 03:35:12 GMT)
Integral Formulas for Vector Spherical Tensor Products [0.0] 我々はベクトル球面積を単純化する積分公式を導出し、ガウントテンソル積を非対称結合に一般化する。
我々は、GuntとVector Spherical Productsが、通常のClebsch-Gordan Productsに関連する表現性と実行時のトレードオフをいかに制御できるかについて議論する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:09:28 GMT)
Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement [0.0] 本稿では,合成信号を線形に投影し,リッジプローブへの幾何的情報アクセス量を測定する合成プローブ分解(CPD)について紹介する。
モデルは、合成除去後にアクセス可能な幾何学的情報で6.6倍の差がある。
また, 非線形プローブは, 残留化表現に対して誤った導出結果をもたらし, 純合成対象に対して$R2 = 0.68$--0.95$を回収し, この設定に対して線形プローブを推奨することを示した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 06:36:19 GMT)
ImprovedGS+: A High-Performance C++/CUDA Re-Implementation Strategy for 3D Gaussian Splatting [0.0] ImprovedGS 戦略の高性能かつ低レベルな再発明である ImprovedGS+ を提案する。
高レベルのPythonロジックからハードウェア最適化のC++/CUDAカーネルに移行することで、ホストデバイス同期とトレーニングレイテンシを大幅に削減できる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:38:27 GMT)
IPPO Learns the Game, Not the Team: A Study on Generalization in Heterogeneous Agent Teams [0.0] マルチエージェント強化学習(MARL、Multi-Agent Reinforcement Learning)は、エージェントが均質なチームメイトとセルフプレイでトレーニングされる設定に一般的にデプロイされる。
本稿では,自己プレイ型PPOエージェントが,トレーニングパートナーの行動に過度に適合することと比較して,基礎となるゲームに根ざした一般的なコーディネーション戦略をどの程度学習するかを検討する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:44:05 GMT)
How Much Do LLMs Hallucinate in Document Q&A Scenarios? A 172-Billion-Token Study Across Temperatures, Context Lengths, and Hardware Platforms [0.0] RIKERは、人間のアノテーションを使わずに決定論的スコアリングを可能にする基礎的第一評価手法である。
その結果,最も優れたモデルでさえ,非自明な速度で回答を作成できることがわかった。
結果はハードウェアプラットフォーム間で一貫性があり、デプロイメントの決定がハードウェアに依存していないことを確認する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 11:44:06 GMT)
High-optical-depth, sub-Doppler-width absorption lines at telecom wavelengths in hot, optically driven rubidium vapor [0.0] 780nmの波長でD2線との強い制御場共鳴によって下方遷移が駆動される8,7$Rbの熱蒸気について検討した。
共振光深さ約4、広帯域幅約17MHzの吸収特性を観測した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:47:46 GMT)
Grow, Assess, Compress: Adaptive Backbone Scaling for Memory-Efficient Class Incremental Learning [0.0] クラスインクリメンタルラーニング(CIL)は、新しいタスクを学習するために必要な可塑性と、忘れることを防ぐために必要な安定性のバランスを維持するという、基本的な課題を提起する。
本稿では,モデルキャパシティを循環的"Grow, Assess, ComprEss"(GRACE)戦略により適応的に管理する新しい動的スケーリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 14:21:18 GMT)
Graph-Instructed Neural Networks for parametric problems with varying boundary conditions [0.0] この研究は、パラメトリック偏微分方程式(PDE)によって支配される物理現象の正確かつ効率的なシミュレーションに対処する。
グラフ命令型ニューラルネットワーク(GINN)に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:26:53 GMT)
Gaussian dynamics in the double Siegel disk [0.0] 決定論的多モードガウスチャネルは対称空間記述を持つことを示す。
これは共分散行列チャネル理論と隣接行列あるいは対称空間像の間の橋渡しを与える。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 04:15:59 GMT)
Four negations and the spectral presheaf [0.0] 我々は、(共)準直観論理を導入し、その健全性と完全性を証明する。
バイカシアン直観代数学とそれに対応する論理を得る。
また, 基礎となる補足格子は, スペクトルプレシーフの内部対象として再構成可能であることを示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:57:00 GMT)
Formally Verifying Quantum Phase Estimation Circuits with 1,000+ Qubits [0.0] 本稿では,量子位相推定(QPE)回路のスケーラブルな形式検証手法を提案する。
提案手法では,量子化自由ビットベクトル論理に基づくシンボル量子ビットの抽象化を用いる。
我々は,QPE回路の機能的正当性を保証するために,この抽象化に整合した形式的特性を開発する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 01:59:07 GMT)
First-Order Geometry, Spectral Compression, and Structural Compatibility under Bounded Computation [0.0] 本稿では,自己随伴演算子によって制限を符号化する演算子理論の定式化を提案する。
この設定では、最適一階改善方向が擬似逆重み勾配として現れる。
実効力学が支配的なスペクトルモードに沿って集中していることを示し、スペクトル圧縮の原理的概念を導出する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 15:29:41 GMT)
Fermi-pressure-assisted cavity superradiance in a mesoscopic Fermi gas [0.0] メソスコピックフェルミガスの超ラジカル相転移を広範囲にわたって検討した。
超放射能閾値の非単調な変動を密度関数として観測する。
我々は,2つのスピン成分に対して光誘起力が対向する状態において,メソスコピックシステムの動作を実証する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:54:16 GMT)
Eyla: Toward an Identity-Anchored LLM Architecture with Integrated Biological Priors -- Vision, Implementation Attempt, and Lessons from AI-Assisted Development [0.0] Eylaは、生物学的にインスパイアされたサブシステムを統合するIDアンコールLDMアーキテクチャである。
本稿では,Eylaの設計的根拠,実装の試み,失敗解析について述べる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:22:48 GMT)
Experimental demonstration of optimal measurement for unambiguously discriminating asymmetric qudit states [0.0] 我々は、複数の非対称キューディット状態を最適に判別する射影測定スキームを確立する。
この結果は高次元量子状態に基づく量子情報処理に広く応用されている。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 23:45:32 GMT)
Experimental Realization of the Markov Chain Monte Carlo Algorithm on a Quantum Computer [0.0] 量子アルゴリズムは、特定のサンプリングタスクに対して古典的なアルゴリズムよりも2次的に改善された複雑性を示す。
我々はマルコフ連鎖の符号化を用いて量子状態を作成し、量子マルコフチェインモンテカルロアルゴリズムを量子inuumのH2およびHelios量子コンピュータ上で実行した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:53:08 GMT)
Experience on Automatically Converting a C++ Monolith to Java EE [0.0] この記事では、C++からJavaへの変換での経験について説明する。
通常のC++からJavaの犯人を解くためのアプローチについて説明する。
Clang-toolベースのソフトウェアが開発され、Javaを継続的に再生する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:28:08 GMT)
Evolution Strategy-Based Calibration for Low-Bit Quantization of Speech Models [0.0] オーディオアクティベーションは、調整されていないキャリブレーション範囲を示すことができ、標準キャリブレーション手法を適用すると、大きな情報損失が生じる。
最適化問題としてアクティベーションスケーリングを定式化して,2段階のローカル・グローバル・スキームを用いて解決する進化戦略に基づくESCを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:53:05 GMT)
Emergence is Overrated: AGI as an Archipelago of Experts [0.0] クラカウアー、クラカウアー、ミッチェル(2025年)は、創発的な能力と創発的な知能を区別している。
本稿では,その枠組みが人間の知能を正確に特徴付けるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 05:28:16 GMT)
Efficient training of photonic quantum generative models [0.0] 本稿では,古典的シミュレーションを効率的に行うことができる中間複雑回路の特性を利用する。
本稿では,光子固有量子生成モデルの最大平均誤差に基づく効率的なトレーニング手法を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:00:11 GMT)
Dynamical Lie algebras generated by Pauli strings and quadratic spaces over $\mathbb{F}_2$ [0.0] パウリ・リー代数の最近の様々な結果に対する一様数学的アプローチを提供する。
これらのパウリが時間内に生成する動的リー代数の同型型を決定するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:35:27 GMT)
Dirac Wave Functions of Positive Energy with Arbitrarily Small Position Uncertainty [0.0] ヒルベルト空間 $mathcalH=L2(mathbbR3,mathbbC4)$ の波動関数を考える。
何十年もの間、様々な著者は、$mathcalH_+$からの波動関数に対して、位置の不確実性$_x$に対する正の低い境界が存在すると推測した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:40:01 GMT)
Decoupling Distance and Networks: Hybrid Graph Attention-Geostatistical Methods for Spatio-temporal Risk Mapping [0.0] 我々は,動的グラフ注意ネットワーク(GATv2)の非線形,注意に基づく表現学習機能と,モデルベース統計学(MBG)による潜在ガウス空間過程を統合する,統計的に原理化されたハイブリッド・モデリング・フレームワークを提案する。
予測精度,キャリブレーション,不確実性の定量化を従来の統計モデルとスタンドアロンのGATv2アーキテクチャと比較し,制御されたシミュレーション研究とマラリアの有病率データの応用分析により評価した。
シミュレーションの結果, ハイブリッドモデルは, 距離ベースと構造を考慮した複雑な空間的・時間的過程をモデル化するための, 統計的に一貫性があり, 実証的に堅牢な枠組みを構成することがわかった。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:51:03 GMT)
Data-driven robust Markov decision processes on Borel spaces: performance guarantees via an axiomatic approach [0.0] 乱れ分布が未知のマルコフ決定過程(MDP)を考察する。
我々はロバストなマルコフ決定プロセス(RMDP)を用いてこの問題に対処する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:13:38 GMT)
Cross-Domain Uncertainty Quantification for Selective Prediction: A Comprehensive Bound Ablation with Transfer-Informed Betting [0.0] リスク制御による選択的予測のために,9つの有限サンプル境界ファミリーの包括的アブレーションを提案する。
我々の主要な理論的貢献はTransfer-Informed Betting (TIB) であり、ソースドメインのリスクプロファイルを使用してWSR富裕層プロセスをウォームスタートさせます。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:25:18 GMT)
Context-free Self-Conditioned GAN for Trajectory Forecasting [0.0] 2次元軌道から異なるモードを学習するための自己条件付きGANに基づく文脈自由な教師なし手法を提案する。
自己条件付きGANに基づく3つの異なるトレーニング設定を提示し、より優れた予測器を生成する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:37:03 GMT)
Construction of a Family of Quantum Codes Using Sub-exceding Functions via the Hypergraph Product and the Generalized Shor Construction [0.0] 我々は,従来の線形符号である$L_k$と$L_k+$から派生した安定化器量子LDPC符号の族を導入する。
得られた量子符号は、特に局所性、低密度パリティチェック(LDPC)構造、振舞いにおいて、豊富な構造と有望な性質を示す。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 10:43:36 GMT)
Computer Vision-Based Vehicle Allotment System using Perspective Mapping [0.0] 本研究は,コンピュータビジョンとYOLOv8のような物体検出モデルを利用した,費用対効果の高い,実装が容易なスマートパーキングシステムを提案する。
このシステムは3D駐車環境をシミュレートし、3Dプロットで利用者を誘導する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:37:46 GMT)
Classically Driven Hybrid Quantum Algorithms with Sequential Givens Rotations for Reduced Measurement Cost [0.0] 電子構造シミュレーションのための量子アルゴリズムが活発に開発されているが、多くのハイブリッド量子古典的アプローチは、大きな分子ハミルトニアンに関連する測定オーバーヘッドによってボトルネック化されている。
ここでは,電子ハミルトニアンを(ブロック-)対角線へと段階的に駆動する対角化駆動のフレームワークを,逐次的なアジェンド回転を用いてスレーター-決定的基底で導入する。
我々は,N$および強く相関する水素系のフレームワークをベンチマークし,収束挙動,残留構造診断,測定精度トレードオフ,回路コスト,有限サンプリング条件下での堅牢性を評価した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 07:01:16 GMT)
Characterization and upgrade of a quantum graph neural network for charged particle tracking [0.0] 荷電粒子軌道再構成のための量子グラフニューラルネットワーク(QGNN)アーキテクチャを特徴付ける。
本稿では,トレーニング行動の改善の新たな証拠,特に最終訓練構成への収束について述べる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:41:08 GMT)
Bound states in a semi-infinite square potential well [0.0] 有限二乗ポテンシャル井戸は、導入量子力学の基本的な問題である。
エネルギー固有値は、超越方程式によっても決定されるが、標準的なグラフィカルな方法によって見出される。
正確な解のクラスが生成され、関連する正規化固有関数が構築され、井戸内の粒子を見つける確率が計算される。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:52:32 GMT)
Bound Trions in Two-Dimensional Monolayers: A Review [0.0] トリオン - クーロンに結合した3粒子励起 - は2次元半導体の中心準粒子である。
本稿では, トライアン物理学の理論的および実験的進歩について概説する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:07:26 GMT)
Bias in Local Spin Measurements from Deformed Symmetries [0.0] 回転対称性が通常のリー群ではなく量子群によって記述されるとき、二部分スピン-シンガレット相関について検討する。
単スピン可観測物は非変形理論のように振る舞うが、非自明な余積は「トータル」対称性の概念を想起させる。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:02:02 GMT)
Beyond the Markovian Assumption: Robust Optimization via Fractional Weyl Integrals in Imbalanced Data [0.0] 本稿では, フラクタル計算に基づく新しい最適化アルゴリズムを提案する。
一般化された分数微分のコアメモリエンジンを分離することにより、瞬時勾配を動的に重み付けされた履歴列に置き換える。
実験により,本手法は医学診断の過度な適合を防ぎ,古典学よりもPRAUCが約40%向上することが確認された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 13:38:45 GMT)
Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids [0.0] 本研究では,3つの相補的不確実性機構をPatchTSTバックボーンに統合したベイズ変圧器フレームワークを提案する。
7段階のマルチクエンタリーピンボールロス予測ヘッドと、訓練後の等音波回帰キャリブレーションにより、鋭く、ほぼ一意にカバーされた予測間隔が生成される。
主要なベンチマーク(PJM, H=24h)では、BTは0.0289のCRPSを達成し、Deep Ensemblesより7.4%、決定論的LSTMより29.9%改善した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:39:51 GMT)
Asymptotic Expansions for Neural Network Approximations of Quantum Channels [0.0] 本稿では,量子ニューラルネット演算子の完全な評価法として,量子Voronovskaya-Damasclin(QVD)理論を確立する。
我々は、リウヴィル表現においてフレシェ微分可能性を通じて定義されるソボレフ空間とハルダー空間の量子アナログを導入する。
本枠組みでは,近似誤差の明示的な拡張を導出し,収束を規定する基本的なメカニズムを同定する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:12:57 GMT)
Are We Winning the Wrong Game? Revisiting Evaluation Practices for Long-Term Time Series Forecasting [0.0] 長期時系列予測(LTSF)は、データマイニングと機械学習における中心的な課題として広く認識されている。
我々は、この計量中心の体制は単に不完全であるだけでなく、予測のより広い目的と構造的に不一致であると主張する。
本稿では, 統計的忠実度, 構造的コヒーレンス, 決定レベルの関連性を統合した多次元評価視点を提案する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 09:37:46 GMT)
Arbiter: Detecting Interference in LLM Agent System Prompts [0.0] Arbiterは、システムプロンプト内の干渉パターンを検出するために、形式的評価ルールとマルチモデルLCMスカーリングを組み合わせたフレームワークである。
Claude Code (Anthropic), Codex CLI (OpenAI), Gemini CLI (Google)の3つの主要なコーディングエージェントシステムに適用される。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 22:29:47 GMT)
An Interpretable Generative Framework for Anomaly Detection in High-Dimensional Financial Time Series [0.0] 本稿では、現代の機械学習と、異常検出のための計量診断を統合した解釈可能な生成フレームワークであるReGEN-TADを提案する。
合成およびファイナンシャルパネルの実験は、経済的にコヒーレントな因子レベルの寄与を可能とし、構造化された偏差に対する堅牢性の向上を実証した。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 00:36:19 GMT)
Age-Related Differences in the Perception of Eye-Gaze from a Social Robot [0.0] 妄想的な視線は人間とロボットの相互作用における自然なコミュニケーションにおいて重要である。
妄想に対する感受性は年齢とともに自然に低下し、社会的知覚が低下する。
これは、人間とロボットの相互作用の文脈における適応年齢に関連する非言語的手がかりの設計に役立つかもしれない。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 18:07:14 GMT)
A Survey of Reinforcement Learning For Economics [0.0] 強化学習アルゴリズムは、動的プログラミングの自然なサンプルベースの拡張を提供する。
私は古典的計画と近代的な学習アルゴリズムを結びつける理論をレビューする。
これらのアルゴリズムの実用的脆弱性について検討する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 21:43:10 GMT)
A Reliability Evaluation of Hybrid Deterministic-LLM Based Approaches for Academic Course Registration PDF Information Extraction [0.0] 本研究では,KRS文書からの情報抽出手法の信頼性を3つの戦略を用いて評価した。
実験は、LCMベースのテストのための140の文書と、Camelotベースのパイプライン評価のための860の文書で実施された。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 02:09:02 GMT)
A Realistic Framework for Quantum Sensing under Finite Resources [0.0] 量子フィッシャー情報(QFI)を用いた量子増強センシングのベンチマークが一般的である
ここでは,有限資源下での量子センシングのための現実的なエンドツーエンドフレームワークを確立する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 12:28:51 GMT)
A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems [0.0] 本稿では,オブジェクト間の結合距離を算出する特徴選択モデルを提案する。
特徴選択問題を直接解決するのではなく、最適化問題に再構成する。
このモデルは、UCIリポジトリの標準データセットでテストされ、他のアルゴリズムと比較される。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 20:12:44 GMT)
A Multi-Objective Optimization Approach for Sustainable AI-Driven Entrepreneurship in Resilient Economies [0.0] 本研究では,AIデプロイメントの持続可能性のメリットを最大化するために設計された多目的最適化アプローチであるEcoAI-Resilienceフレームワークを紹介する。
このフレームワークは、サステナビリティ・インパクト、経済回復力の向上、環境コストの最小化という3つの重要な目標に対処する。
このフレームワークは、100%再生可能エネルギーの統合、80%の効率改善目標、そして一人当たり202.48の最適投資レベルを含む最適なAIデプロイメント戦略をうまく識別する。
論文参考訳(メタデータ) (Mon, 09 Mar 2026 17:54:32 GMT)