How Well Does Agent Development Reflect Real-World Work? [89.2] 本研究では,ベンチマークインスタンスを作業領域やスキルにマッピングすることで,エージェント開発活動と実世界の人間作業の分布との関係について検討する。
プログラム中心のエージェント開発と、人間の労働力と経済価値が集中するカテゴリの間には、かなりのミスマッチがあることを明らかにする。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:55:49 GMT)
DIVA-GRPO: Enhancing Multimodal Reasoning through Difficulty-Adaptive Variant Advantage [83.6] グループ相対的政策最適化(GRPO)による強化学習は、マルチモーダル大言語モデル(MLLM)の推論能力を高めるための広く採用されているアプローチとなっている。
GRPOは、批判なしに長鎖推論を可能にするが、難しい問題に対する微妙な報酬と、グループレベルの報酬が過度に簡単あるいは難しい問題に対して一貫性が過ぎる場合の利点に悩まされることが多い。
グローバルな視点から可変困難分布を調整する難易度適応型変分法であるDIVA-GRPOを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:47:35 GMT)
CARD: Towards Conditional Design of Multi-agent Topological Structures [83.2] CARD(Conditional Agentic Graph Designer)は、アダプティブマルチエージェント通信のためのプロトコルであるAMACPをインスタンス化する、条件付きグラフ生成フレームワークである。
CARDは、モデル能力やリソース可用性の変化に対して効果的かつレジリエントな通信構造を生成する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:02:36 GMT)
Operator Learning Using Weak Supervision from Walk-on-Spheres [81.3] トレーニング型PDEソルバは、高価なデータ生成や不安定な物理インフォームドニューラルネットワーク(PINN)によってボトルネックされることが多い
我々はモンテカルロ法を用いてPDEの解をトレーニング中の弱い監督のための計算不要なプロセスとして推定する手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:23:39 GMT)
MC-Search: Evaluating and Enhancing Multimodal Agentic Search with Structured Long Reasoning Chains [79.1] MC-Searchは5つの代表的推論構造にまたがる長いステップワイドなアノテート推論チェーンを持つエージェントMM-RAGの最初のベンチマークである。
回答精度以外にも、MC-Searchは、品質、段階的検索、計画精度を推論するための新しいプロセスレベルメトリクスを導入している。
エージェントMM-RAGパイプラインを統一的に開発することにより、6つのMLLMをベンチマークし、過剰検索や過度検索、モダリティミスアライメント計画などの体系的な問題を明らかにする。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 02:25:57 GMT)
LLaDA-o: An Effective and Length-Adaptive Omni Diffusion Model [77.7] マルチモーダル理解・生成のための有効長適応オムニ拡散モデルである textbfLLaDA-o を提案する。
MoD上に構築されたデータ中心長適応戦略により,マルチモーダル環境でのフレキシブルなデコーディングを実現する。
実験により、LLaDA-oはマルチモーダル理解および生成ベンチマーク上でのオムニ拡散モデル間の最先端性能を実現することが示された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:05:06 GMT)
RMBench: Memory-Dependent Robotic Manipulation Benchmark with Insights into Policy Design [77.3] RMBenchは、メモリの複雑さの複数のレベルにまたがる9つの操作タスクからなるシミュレーションベンチマークである。
Mem-0は、制御アブレーション研究をサポートするために設計された明示的なメモリコンポーネントを備えたモジュラー操作ポリシーである。
既存のポリシにおけるメモリ関連の制限を特定し、アーキテクチャ設計の選択がメモリパフォーマンスに与える影響に関する実証的な洞察を提供する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:59:59 GMT)
RnG: A Unified Transformer for Complete 3D Modeling from Partial Observations [70.8] RnG(Reconstruction and Generation)は、再構成と生成を統合する新しいフィードフォワードトランスである。
可視的幾何学を再構築し、可視的でコヒーレントな不明瞭な幾何学と外観を生成する。
提案手法は, 一般化可能な3次元再構成と新しいビュー生成の両方において, 最先端の性能を実現する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:25:32 GMT)
Event-Anchored Frame Selection for Effective Long-Video Understanding [67.6] Event-Anchored Frame Selection (EFS)は階層的なイベント認識パイプラインである。
トレーニング不要のプラグイン・アンド・プレイモジュールとして、EFSは既製のLVLMにシームレスに統合できる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:25:37 GMT)
HorizonForge: Driving Scene Editing with Any Trajectories and Any Vehicles [63.9] 制御可能な運転シーン生成は、現実的でスケーラブルな自律運転シミュレーションに不可欠である。
シーンを編集可能なガウス版とメッシュとして再構築する統合フレームワークであるHorizonForgeを紹介した。
実験により、ガウス・メシュ表現は代替の3次元表現よりもかなり高い忠実性をもたらすことが示された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 00:13:21 GMT)
DeepResearch-9K: A Challenging Benchmark Dataset of Deep-Research Agent [63.5] DeepResearch-9Kは、Deep-Researchシナリオのための大規模で挑戦的なデータセットである。
DeepResearch-R1は、Deep-Researchエージェントのためのオープンソースのトレーニングフレームワークである。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:36:10 GMT)
Data-Efficient Brushstroke Generation with Diffusion Models for Oil Painting [60.2] そこで本研究では,手書きサンプルの小さなセットから人型ブラシストローク生成を学習する問題について検討する。
Smooth Regularization (SmR) を用いた拡散型フレームワーク StrokeDiff を提案する。
学習したプリミティブをBézierベースの条件付けモジュールで制御可能であることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:42:35 GMT)
Stabilizing Policy Optimization via Logits Convexity [59.2] モデルロジットに対する教師付き微調整損失の凸性は、安定したトレーニングを可能にする上で重要な役割を担っていることを示す。
そこで本研究では,ロジッツ・コンベックス最適化(Logits Convex Optimization, LCO)を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:40:12 GMT)
Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention [58.0] 復号フェーズにおけるKVキャッシュは、高コンカレンシーサービスを制限する重要な要因となっている。
本稿では,トークン単位のKVキャッシュ消去とPagedAttentionを組み合わせたCompressed PagedAttentionを提案する。
そこで我々は,高速LLM推論エンジンZipageを開発した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:01:36 GMT)
ProFocus: Proactive Perception and Focused Reasoning in Vision-and-Language Navigation [57.7] 本稿では,UnderlineProactive PerceptionとUnderlineFocused Reasoningを統合したトレーニングフリープログレッシブフレームワークを提案する。
積極的に知覚するために、ProFocusはパノラマ観測を構造的エゴ中心のセマンティックマップに変換する。
そこで本研究では,BD-MCTS(Branch-Diverse Monte Carlo Tree Search)を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:13:18 GMT)
Egocentric Co-Pilot: Web-Native Smart-Glasses Agents for Assistive Egocentric AI [57.0] スマートグラス上で動作するWebネイティブなニューロシンボリックフレームワークであるEgocentric Co-Pilotを紹介します。
認識、推論、Webツールのツールボックスを編成するために、LLM(Large Language Model)を使用します。
EgolifeとHD-EPICの実験は、競争力や最先端のエゴセントリックQAパフォーマンスを示している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:43:04 GMT)
Learn Hard Problems During RL with Reference Guided Fine-tuning [56.6] 数学的推論のための強化学習(RL)は報酬の分散に悩むことがある。
本稿では,Reference-Guided Fine-Tuning (ReGFT)を導入し,ハード問題に対する正の軌道を合成し,RLの前にトレーニングする。
以上の結果から,ReGFTは報酬空間を効果的に克服し,より強力なRLに基づく数学的推論を解き放つことが示唆された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:41:28 GMT)
Theoretical Perspectives on Data Quality and Synergistic Effects in Pre- and Post-Training Reasoning Models [56.1] 大規模言語モデル(LLM)は、大量のデータセット上で事前訓練され、後に教師付き微調整(SFT)または強化学習(RL)を介して指導訓練される。
ベストプラクティスは大規模で多様な事前訓練データを強調するが、ポストトレーニングは異なる。
線形回帰のための文脈内重み予測タスクで訓練された変圧器を理論的に解析する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:58:09 GMT)
BioProAgent: Neuro-Symbolic Grounding for Constrained Scientific Planning [56.0] BioProAgentは、有限状態機械における確率的計画を固定する神経象徴的なフレームワークである。
我々は、厳格なtextitDesign-Verify-Rectifyワークフローを強制するState-Augmented Planningメカニズムを導入する。
拡張されたBioProBenchベンチマークでは、BioProAgentは95.6%の物理コンプライアンスを達成した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 02:36:01 GMT)
Dataset Color Quantization: A Training-Oriented Framework for Dataset-Level Compression [56.0] モデルトレーニングに不可欠な情報を保存しながら、色空間の冗長性を低減し、視覚データセットを圧縮する統合フレームワークを提案する。
CIFAR-10、CIFAR-100、Tiny-ImageNet、ImageNet-1Kでの実験では、DCQは攻撃的な圧縮下でのトレーニング性能を著しく改善している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:55:52 GMT)
Improving Text-to-Image Generation with Intrinsic Self-Confidence Rewards [54.9] テキスト・ツー・イメージ生成モデルのポストトレーニングは、人間の好み、事実性、そして美学を改善するための有望な道である。
我々は、外部報酬監督を内部の自信信号に置き換える訓練後フレームワークARC(Adaptive Rewarding by Self-Confidence)を紹介する。
ARCと外部報酬の統合は、報酬ハッキングを緩和し、補完的な改善をもたらすことが判明した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:39:09 GMT)
GeodesicNVS: Probability Density Geodesic Flow Matching for Novel View Synthesis [54.4] 本稿では,ペアビュー間の決定論的変換を直接学習するデータ間フローマッチングフレームワークを提案する。
PDG-FMは、事前訓練された拡散モデルの確率密度測定値から導かれる測地的補間剤を用いて流れの軌跡を制約する。
これらの結果は、一貫した新しいビュー生成のための決定論的フローマッチングにデータ依存の幾何正規化を組み込むことの利点を強調している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 09:30:11 GMT)
Individual Turing Test: A Case Study of LLM-based Simulation Using Longitudinal Personal Data [54.1] 大きな言語モデル(LLM)は、目覚ましい人間のような能力を示しているが、特定の個人を複製する能力は未発見のままである。
本稿では,10年以上にわたるプライベートメッセージ履歴のボランティア配信アーカイブを用いて,LSMに基づく個人シミュレーションのケーススタディを提案する。
本研究は,ボランティアの知人が,最も有望な多候補プール内の応答を正確に識別できるかどうかを評価するための「個別チューリングテスト」を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:46:27 GMT)
Alien Science: Sampling Coherent but Cognitively Unavailable Research Directions from Idea Atoms [53.9] 大規模な言語モデルは、しばしば、現在のコミュニティにとって一貫性があり、無関心なアイデアを生み出すのに失敗する。
我々は、このギャップを認知的可用性によって形式化し、研究の方向性が典型的な研究者によって自然に提案される可能性について述べる。
我々は、原子の集合が実行可能な方向を構成するかどうかをスコアするコヒーレンスモデルと、その方向が生成される確率をスコアするアベイラビリティモデルという2つの補完モデルを学ぶ。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:05:19 GMT)
DEP: A Decentralized Large Language Model Evaluation Protocol [51.4] 分散評価プロトコル(Decentralized Evaluation Protocol, DEP)は、分散化されているが統一され、標準化された評価フレームワークである。
ユーザ、LLM、ベンチマークを分離することで、DEPはモジュラー、プラグ・アンド・プレイの評価を可能にする。
我々は,ブレークポイントの再開,同時要求,混雑制御などの機能をサポートするプロトコル互換ツールキットであるDEP Toolkitを開発した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:10:16 GMT)
Mixture of Sequence: Theme-Aware Mixture-of-Experts for Long-Sequence Recommendation [49.0] ノイズの多い生ユーザシーケンスからテーマ特化サブシーケンスとマルチスケールサブシーケンスを抽出し,正確な予測を実現するモデルに依存しないMoE手法を提案する。
実験結果から, FLOPは少ないが, MoS はSOTA の性能を一貫して達成できることがわかった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 23:20:48 GMT)
From Intuition to Investigation: A Tool-Augmented Reasoning MLLM Framework for Generalizable Face Anti-Spoofing [47.3] ツール拡張型推論FAS(TAR-FAS)フレームワークを提案する。このフレームワークは、Face Anti-Spoofingタスクを、CoT-VT(Chain-of-Thought with Visual Tools)パラダイムとして再構成する。
TAR-FASは、信頼性の高いスプーフ検出のためのきめ細かな視覚的調査を行い、SOTA性能を実現する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:28:35 GMT)
Foundation Models in Remote Sensing: Evolving from Unimodality to Multimodality [46.8] ファンデーションモデルは、RS分野に革命をもたらす重要な新たな成長機会と大きな可能性を提示する。
本稿では,基礎モデルの重要性を強調し,その背景と動機について概説する。
我々は、研究者、特に初心者を対象に、RSにおける基礎モデルのトレーニング方法を指導し、それらを現実世界のタスクに適用するためのチュートリアルのようなセクションを提供する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:31:33 GMT)
A Principle-Driven Adaptive Policy for Group Cognitive Stimulation Dialogue for Elderly with Cognitive Impairment [46.5] 本稿では,グループ認知刺激対話システムを通じて実現された原則駆動適応政策を提案する。
まず,500時間以上の現実世界のCST会話と1万以上のシミュレーション対話を原則誘導シナリオシミュレーションによって生成したデータセットを構築した。
次に、GCSDシステムは、制限を克服するために、4つのコアモジュールを統合する。 (i) 役割混乱を解決するためのマルチスピーカコンテキストコントローラ、 (ii) 認知刺激に焦点を絞った注意損失、 (iv) 応答値を高めるための多次元報酬戦略。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:43:21 GMT)
Neural Discrimination-Prompted Transformers for Efficient UHD Image Restoration and Enhancement [46.1] 本稿では,超高精細(UHD)画像の復元と改善のためのニューラル・ディファレンス・プロンプテッド・トランスフォーマを提案する。
我々のUHDPromerは、高解像度と低解像度の特徴の間に暗黙的に神経的な違いが存在するという興味深い観察にインスピレーションを受けています。
実験によると、UHDPromerは最先端の性能を維持しつつ、最高の計算効率を達成する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 00:51:32 GMT)
Ergotropy from Geometric Phases in a Dephasing Qubit [45.9] 環境に結合したキュービットによって得られる幾何学的位相と動的位相を,純粋にデフォーカスすることで解析する。
動的位相は非コヒーレントエルゴトロピーにのみ依存しており、その純粋にエネルギティックな起源を反映していることを示す。
幾何学的位相は、全エルゴトロピーに対するコヒーレントおよび非コヒーレントな寄与に非自明な依存を示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:22:37 GMT)
HVR-Met: A Hypothesis-Verification-Replaning Agentic System for Extreme Weather Diagnosis [45.2] HVR-Metは、専門家の知識の深い統合を特徴とする気象診断システムである。
その中心となる革新は仮説-検証-計画'の閉ループ機構である。
原子レベルのサブタスクに焦点を当てた新しいベンチマークを導入する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:13:11 GMT)
CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning [44.5] CHIMERAは、一般化可能なクロスドメイン推論のための9Kサンプルからなるコンパクトな合成推論データセットである。
広範囲にまたがって構造化され、8つの主要な科学分野にまたがり、1万以上のきめ細かいトピックがモデル生成階層分類によってまとめられている。
GPQA-Diamond、AIME 24/25/26、HMMT 25、HumanityのLast Examなど、いくつかの困難な推論ベンチマークで高いパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:23:41 GMT)
JailNewsBench: Multi-Lingual and Regional Benchmark for Fake News Generation under Jailbreak Attacks [44.1] JailNewsBenchは、ジェイルブレイクによる偽ニュース生成に対する堅牢性を評価する最初のベンチマークである。
英語と米国関連のトピックでは、典型的な多言語LLMの防御性能は他の地域に比べて著しく低かった。
我々の分析によると、既存の安全データセットにおけるフェイクニュースの報道は、毒性や社会的偏見といった主要なカテゴリーよりも限定的であり、十分に保護されていない。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:50:03 GMT)
Can Vision Language Models Assess Graphic Design Aesthetics? A Benchmark, Evaluation, and Dataset Perspective [43.4] グラフィックデザインの美的品質を評価することは視覚コミュニケーションの中心であるが、視覚言語モデル(VLM)では未熟である。
本研究では,4次元,12指標,3つの完全定量化タスクを対象とする総合ベンチマークであるAesEval-Benchを紹介する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:55:39 GMT)
RAG-RUSS: A Retrieval-Augmented Robotic Ultrasound for Autonomous Carotid Examination [42.0] 臨床ワークフローに応じて完全な頸動脈検査を行うことができる解釈可能なフレームワークであるRAG-RUSSを紹介した。
医療データの不足を鑑み,一般化を促進するために検索強化世代を取り入れた。
その結果,現在の走査段階を解明し,頸動脈検査を完了するためのプローブ動作を自律的に計画できることが示唆された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:37:44 GMT)
Adaptive Augmentation-Aware Latent Learning for Robust LiDAR Semantic Segmentation [40.7] 逆気象条件は、LiDARポイントクラウドセマンティックセグメンテーションネットワークの性能を著しく低下させる。
既存の拡張ベースの手法は、訓練中に気象干渉をシミュレートすることで堅牢性を高める試みである。
本稿では,多種多様な拡張を効果的に活用する適応型拡張対応潜在学習フレームワークであるA3Pointを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:33:14 GMT)
Seeing Beyond 8bits: Subjective and Objective Quality Assessment of HDR-UGC Videos [40.0] 高ダイナミックレンジ(UGC)ユーザー生成(UGC)ビデオは、ソーシャルプラットフォーム全体で急速に普及している。
ほとんどの知覚ビデオ品質評価(VQA)システムは、標準ダイナミックレンジ(SDR)モデルに適合している。
本稿では,HDR-UGC VQAのためのMLLM(Multimodal Large Language Model)について紹介する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 06:02:40 GMT)
Principled Fast and Meta Knowledge Learners for Continual Reinforcement Learning [39.7] 本稿では,連続的強化学習(RL)問題に対処する,高速学習者とメタ学習者からなるデュアルラーナーフレームワークを提案する。
これらの2人の学習者は、異なるが相補的な役割を果たすために結合される: 高速学習者は、知識の伝達に焦点を当て、メタ学習者は、知識の統合を保証する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:49:20 GMT)
Predictive Reasoning with Augmented Anomaly Contrastive Learning for Compositional Visual Relations [38.6] 本稿では,不規則な画像を特定するために,Augmented Anomaly Contrastive Learning (PR-A$2$CL) を用いた予測推論を提案する。
PR-A$2$CLは最先端の推論モデルよりも大幅に優れている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:17:44 GMT)
Compensation-free Machine Unlearning in Text-to-Image Diffusion Models by Eliminating the Mutual Information [38.4] モデルパラメータから特定の知識を取り除くために、マシン・アンラーニング(MU)が導入されている。
本稿では,計算効率向上のための微妙な設計で相互情報を最小化することで,概念を解き放つことを提案する。
提案手法は,他の概念の高品質な世代を維持するための効果的な概念除去を実現する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:41:59 GMT)
Vision-Language Feature Alignment for Road Anomaly Segmentation [38.3] 本稿では,事前学習された視覚言語モデル(VLM)のセマンティクスを組み込んだ視覚言語異常セグメンテーションフレームワークを提案する。
具体的には,Mask2Formeの視覚的特徴を既知のカテゴリのCLIPテキスト埋め込みに適応させる,素早い学習駆動アライメントモジュールを設計する。
推論時に,テキスト誘導類似性,CLIPに基づく画像テキスト類似性,検出信頼度を統合したマルチソース推論戦略を導入する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:17:00 GMT)
TriMoE: Augmenting GPU with AMX-Enabled CPU and DIMM-NDP for High-Throughput MoE Inference via Offloading [38.2] TriMoEは新しいGPU-CPU-NDPアーキテクチャで、AMX対応のCPUを利用して、ホット、ウォーム、コールドの専門家を最適な計算ユニットにマップする。
実験により、TriMoEは最先端のソリューションよりも最大2.83倍のスピードアップを達成することが示された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:27:37 GMT)
Adaptive-Growth Randomized Neural Networks for Level-Set Computation of Multivalued Nonlinear First-Order PDEs with Hyperbolic Characteristics [38.2] 本稿では,双曲特性を持つ非線形一階PDEの多値解を計算するための適応成長ランダム化ニューラルネットワーク(AG-RaNN)を提案する。
このような解は幾何学光学、地震波、量子力学の半古典的極限、線形波の高周波極限に現れる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:16:25 GMT)
ICPRL: Acquiring Physical Intuition from Interactive Control [38.1] ICPRL(In-Context Physical Reinforcement Learning, In-Context Physical Reinforcement Learning, In-Context Physical Reinforcement Learning, ICPRL)は、VLMが物理的直観を習得し、そのポリシーを文脈内で適応することを可能にするフレームワークである。
提案手法は,多面的相互作用履歴に基づいて,多面的グループ相対的ポリシー最適化(GRPO)を介して,視覚的な政策モデルを訓練する。
これによりエージェントは、過去の試行錯誤シーケンスを条件にすることで、重み更新を必要とせずに戦略を適応することができる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:17:18 GMT)
MedGPT-oss: Training a General-Purpose Vision-Language Model for Biomedicine [38.1] MEDGPT-OSSはオープンウェイトで20Bパラメータの視覚言語モデルであり、臨床AIのオープンな研究を促進するために設計されている。
MEDGPT-OSSは、アーキテクチャの複雑さに頼るのではなく、最適化された3段階のトレーニングカリキュラムを通じて、GPT-oss言語バックボーンと視覚的なフロントエンドをペアリングする。
アウト・オブ・ディストリビューションのマルチモーダル推論や複雑なテキストのみの臨床タスクにおいて、より大きなオープン医療モデルを上回る成果を上げている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 00:06:43 GMT)
Let Your Image Move with Your Motion! -- Implicit Multi-Object Multi-Motion Transfer [37.6] マルチオブジェクト・マルチモーション・トランスファーを可能にする最初の暗黙的イメージ・ツー・ビデオ(I2V)モーション・トランスファー・フレームワークであるFlexiMMTを提案する。
静的なマルチオブジェクト画像と複数の参照ビデオが与えられた場合、FlexiMMTは独立して動きの表現を抽出し、それらを異なるオブジェクトに正確に割り当てる。
We show that FlexiMMT achieves exact, compositional, and state-of-the-art performance in I2V-based multi-ject multi-motion transfer。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 09:03:05 GMT)
ATLAS: AI-Assisted Threat-to-Assertion Learning for System-on-Chip Security Verification [37.3] ATLASは、System-on-Chip(SoC)セキュリティのための標準化された脅威モデリングとプロパティベースの形式検証をブリッジする。
資産中心の分析と脅威モデルテンプレートとマルチソースコンテキストを組み合わせることで、ATLASは脆弱性推論から正式な証明への変換を自動化する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:20:47 GMT)
ConVibNet: Needle Detection during Continuous Insertion via Frequency-Inspired Features [37.0] 本研究では,針検出のためのVibNetの拡張であるConVibNetについて述べる。
連続するフレーム間の動き相関を明示的に活用する新たな交叉・差分損失を導入する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:16:25 GMT)
VGGT-Det: Mining VGGT Internal Priors for Sensor-Geometry-Free Multi-View Indoor 3D Object Detection [36.2] 現在のマルチビュー屋内3Dオブジェクト検出器は、取得に費用がかかるセンサー幾何学に依存している。
VGGT-DetはSG-Freeマルチビュー屋内3Dオブジェクト検出に適した最初のフレームワークである。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:25:52 GMT)
Beyond the Flat Sequence: Hierarchical and Preference-Aware Generative Recommendations [35.6] 我々はHPGR(Hierarchical and Preference-aware Generative Recommender)という新しいフレームワークを提案する。
まず、構造化を意識した事前学習段階において、セッションベースのMasked Item Modelingの目的を用いて、階層的にインフォームドされ、セマンティックにリッチなアイテム表現空間を学ぶ。
第二に、プライオリティ対応の微調整ステージは、これらの強力な表現を活用して、Preference-Guided Sparse Attentionメカニズムを実装する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:15:34 GMT)
S2O: Enhancing Adversarial Training with Second-Order Statistics of Weights [35.5] ディープニューラルネットワーク(DNN)の堅牢性を改善するための高い効果的な方法として、敵対的トレーニングが登場した
モデル重みをランダム変数として扱うことで、モデル重みに対するtextbfSecond-Order textbfStatistics textbfOptimization (S$2$O) を通じて、逆トレーニングを強化する方法を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:43:16 GMT)
PreciseCache: Precise Feature Caching for Efficient and High-fidelity Video Generation [35.5] 我々は,真に冗長な計算を正確に検出し,スキップするプラグイン・アンド・プレイ・フレームワークである textbfPreciseCache を提案する。
我々のフレームワークは、目立った品質の損失なしに平均2.6倍のスピードアップを達成する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:08:49 GMT)
HeroGS: Hierarchical Guidance for Robust 3D Gaussian Splatting under Sparse Views [33.4] 画像,特徴,パラメータレベルをまたいだ階層的ガイダンスを確立する統一的なフレームワークであるHeroGSを提案する。
我々は,HeroGSが高忠実度再構築を実現し,スパースビュー条件下での最先端のベースラインを一貫して超えることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:35:49 GMT)
VisNec: Measuring and Leveraging Visual Necessity for Multimodal Instruction Tuning [33.1] そこで本研究では,インストラクションチューニング時の視覚入力の限界寄与を計測する基本データ選択フレームワークを提案する。
VisNecは、予測損失と視覚的コンテキストとを比較して、トレーニングインスタンスが視覚的にクリティカルなのか、冗長なのか、あるいは不一致なのかを識別する。
VisNecが選択したLLaVA-665Kデータセットの15%しかトレーニングしていない10のベンチマークでは、完全なデータパフォーマンスの100.2%が達成されている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:26:02 GMT)
Hepato-LLaVA: An Expert MLLM with Sparse Topo-Pack Attention for Hepatocellular Pathology Analysis on Whole Slide Images [32.9] 現在の計算手法は、固定解像度処理機構と非効率な特徴集約によって制約される。
Hepto-LLaVA(ヘプト・ララバ)は、微細組織病理解析のために設計された多モード大規模言語モデルである。
今回,HepatoPathoVQAについて検討した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:01:53 GMT)
Can AI Agents Agree? [32.8] 大規模言語モデルは、協調エージェントとしてますます展開されているが、敵のコンセンサス設定におけるそれらの振る舞いは研究されていない。
シンクロ・オール・ツー・オール・シミュレーションを用いて,ビザンチンのコンセンサスゲーム上でのLSMに基づくエージェントをスカラー値で評価する。
グループのサイズが大きくなるにつれて、良質な設定や劣化があっても、有効な合意が信頼できないことが分かりました。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:18:59 GMT)
FastCode: Fast and Cost-Efficient Code Understanding and Reasoning [32.3] コンテンツ消費からリポジトリ探索を分離するフレームワークであるモデルを導入する。
モデルは、トークンの消費を著しく減少させながら、正確さを推論することで、最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 09:41:15 GMT)
Silo-Bench: A Scalable Environment for Evaluating Distributed Coordination in Multi-Agent LLM Systems [31.8] 3つのコミュニケーションレベルにわたる30のアルゴリズムタスクのロール非依存ベンチマークであるSilo-Benchを紹介した。
我々の実験は、基本的なコミュニケーションギャップを露呈する。
ネイリースケーリングエージェントカウントは コンテキスト制限を回避できない
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:56:00 GMT)
One-Token Verification for Reasoning Correctness Estimation [31.6] ワンツーケン検証(One-Token Verification、OTV)は、生成中の1つの前方通過における正当性を推定する計算手法である。
OTVは、既存のバリデーションを一貫して上回り、正当性誘導早期終了によりトークン使用量を最大90%削減する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:09:58 GMT)
TARSE: Test-Time Adaptation via Retrieval of Skills and Experience for Reasoning Agents [30.4] 2つの明確で検索可能なリソースを持つエージェント問題として,臨床質問応答の枠組みを定めている。
実行可能な決定ルールとして整理されたガイドラインスタイルのドキュメントから,スキルライブラリを構築する。
次に、検索した項目にモデルを適用することで、インスタンスステップのミスアライメントを低減する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 19:31:23 GMT)
RepoRepair: Leveraging Code Documentation for Repository-Level Automated Program Repair [30.2] RepoRepairは,レポジトリレベルの障害ローカライゼーションとプログラム修復のための新しいドキュメンテーションによるアプローチである。
私たちの中核的な洞察は、LLMを活用して、コードリポジトリの階層的なコードドキュメンテーション(関数からファイルまで)を生成することです。
RepoRepairはまず、テキストベースのLLMを使用して、リポジトリのファイル/関数レベルのコードドキュメントを生成する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:06:24 GMT)
Reasoning Boosts Opinion Alignment in LLMs [30.1] 推論が意見の整合性を改善するかを検討する。
強化学習(RL)によって実現された数学的推論の最近の進歩により、我々は、プロファイルに一貫性のある解を生成するためにモデルを訓練した。
我々は、米国、ヨーロッパ、スイスの政治を対象とする3つのデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:19:44 GMT)
Subliminal Signals in Preference Labels [30.0] 好みラベルは隠蔽通信チャネルとして機能することを示す。
中立な学生モデルが意味的に偏見のない完成物を生成しても、偏見のある裁判官は優先課題を通じて意図しない行動特性を伝達できることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:55:57 GMT)
BeautyGRPO: Aesthetic Alignment for Face Retouching via Dynamic Path Guidance and Fine-Grained Preference Modeling [29.8] 顔のリタッチには、全体的な美的魅力を高めるために、独特の顔認証機能を保持しながら微妙な欠陥を取り除く必要がある。
既存の手法は基本的なトレードオフに苦しむ。ラベル付きデータに対する教師付き学習はピクセルレベルのラベルの模倣に制約され、複雑な主観的人間の美的嗜好を捉えることができない。
顔のリタッチと人間の美的嗜好を一致させる強化学習フレームワークであるBeautyGRPOを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:59:31 GMT)
CoSMo3D: Open-World Promptable 3D Semantic Part Segmentation through LLM-Guided Canonical Spatial Modeling [29.3] 精神物理学的な証拠は、物体を標準的なフレームに精神的に回転させ、機能的役割を明らかにすることを示しています。
そこで本研究では,潜在標準参照フレームを誘導することにより,標準空間認識を実現する方法Nameを提案する。
実験の結果,methodNameはオープンワールドのプロンプト可能な3Dセグメンテーションにおいて,技術の新たな状態を確立することがわかった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:57:43 GMT)
AutoSkill: Experience-Driven Lifelong Learning via Skill Self-Evolution [28.7] AutoSkillはエクスペリエンス駆動の生涯学習フレームワークで、LLMエージェントが対話やインタラクショントレースからスキルを自動で引き出し、維持し、再利用することができる。
既存のLLMと互換性があり、エージェント、ユーザ、タスク間での共有と転送のための標準化されたスキル表現を導入している。
本稿では,AutoSkillのモチベーション,アーキテクチャ,実装について述べるとともに,メモリ,検索,パーソナライゼーション,エージェントシステムに関する先行研究について述べる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:11:59 GMT)
vEcho: A Paradigm Shift from Vulnerability Verification to Proactive Discovery with Large Language Models [28.1] vEchoは、Large Language Models(LLM)を学習、記憶、推論が可能な仮想セキュリティ専門家に変換する新しいフレームワークである。
vEchoは、そのコア推論エンジンに、深いコンテキスト認識の検証のための堅牢な開発ツールスイートを備えている。
CWE-Bench-Javaデータセットに関する大規模な実験では、最先端のベースラインであるIRISに対するvEchoの2つのアドバンテージが示されている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:39:08 GMT)
Beyond Global Similarity: Towards Fine-Grained, Multi-Condition Multimodal Retrieval [27.5] MCMR (Multi-Conditional Multimodal Retrieval) は、自然言語クエリによる細粒度・多条件クロスモーダル検索を評価するために設計された大規模ベンチマークである。
製品ドメインは、上着と下着、宝石、靴、家具の5つ。
MLLMベースのマルチモーダルレトリバーと視覚言語リランカの多種多様なスイートをベンチマークし,その条件認識推論能力を評価する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:53:47 GMT)
Linking Knowledge to Care: Knowledge Graph-Augmented Medical Follow-Up Question Generation [27.4] 大規模言語モデル(LLM)は、診断前の作業負荷を緩和するが、ドメイン知識の制限により、効果的な医学的問題生成が妨げられる。
我々は,KG-Followupに関連性があり重要なフォローアップ質問を生成するために,アクティブなインコンテキスト学習を備えた知識グラフ強化LLMを提案する。
実験によると、KG-Followupは、リコール中の関連するベンチマークで、最先端のメソッドを5%から8%上回っている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:13:09 GMT)
Integrating LTL Constraints into PPO for Safe Reinforcement Learning [27.1] 本稿では,PPO で書かれた安全制約を PPO に統合し,安全な強化学習を実現するフレームワークを提案する。
我々のPPO-LTLは、最先端の手法に対して、競争性能を維持しながら、安全違反を一貫して軽減することができる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:55:24 GMT)
The MAMA-MIA Challenge: Advancing Generalizability and Fairness in Breast MRI Tumor Segmentation and Treatment Response Prediction [26.9] MAMA-MIA Challengeは,原発性腫瘍の分節と病理学的完全反応の予測を共同で評価する大規模ベンチマークを開発することを目的としている。
トレーニングコホートは、米国内の複数の機関から1,506人、欧州の3つの独立したセンターから574人の外部テストセットで評価された。
結果,外部試験における性能変動が顕著であり,総合的精度とサブグループフェアネスのトレードオフが明らかとなった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:06:30 GMT)
GlassMol: Interpretable Molecular Property Prediction with Concept Bottleneck Models [26.6] 安全性が重要な薬物発見では、機械学習モデルはブラックボックスとして動作する。
既存の解釈可能性の手法は、有効性と信頼性のトレードオフに悩まされる。
モデルに依存しないCBMであるGlassMolを,自動概念キュレーションとLLM誘導概念選択により導入する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:07:49 GMT)
PhotoAgent: Agentic Photo Editing with Exploratory Visual Aesthetic Planning [26.4] PhotoAgentは、明示的な審美計画を通じて画像編集を進めるシステムだ。
ユーザの美的意図を理由として、ツリー検索による複数ステップの編集アクションを計画し、クローズドループ実行によって結果を反復的に洗練する。
実験では、PhotoAgentはベースライン法と比較して、命令順守と視覚的品質の両方を一貫して改善する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:54:03 GMT)
MM-DeepResearch: A Simple and Effective Multimodal Agentic Search Baseline [26.2] マルチモーダル・リサーチ・エージェントの開発を目標とし, 明示的な推論と計画, マルチツール・呼び出し, クロスモーダル・インフォメーション・シンセサイザーの実現を目指す。
1)検索集約型マルチモーダルQAデータの不足,(2)効果的な検索トラジェクトリの欠如,(3)オンライン検索APIによるトレーニングの禁止コストの3つの主な課題を考察する。
この3つの設計により,強力なマルチモーダルディープリサーチエージェントであるMM-DeepResearchを開発した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:13:22 GMT)
Hide&Seek: Remove Image Watermarks with Negligible Cost via Pixel-wise Reconstruction [26.2] HIDE&SEEK(HIDE&SEEK)は,多用途で費用対効果の高い画像透かし攻撃である。
HSは高い視力を維持しながら埋め込み透かしを確実に除去する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:03:23 GMT)
Nonconvex Latent Optimally Partitioned Block-Sparse Recovery via Log-Sum and Minimax Concave Penalties [25.8] ブロック分割が未知なブロックスパース信号を回復するために,2つの非正規化手法を提案する。
安定な経験的収束を示すこれらの定式化のための効率的な多元数置換法 (ADMM) ベースのアルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:17:50 GMT)
Turning Black Box into White Box: Dataset Distillation Leaks [25.6] 既存の蒸留法は, 合成データセットが蒸留モデルの重量軌跡を暗黙的にエンコードしているため, 深刻なプライバシー漏洩を引き起こす可能性がある。
本稿では,最先端の蒸留技術に対する情報啓発攻撃(IRA)について紹介する。
実験により、IRAは蒸留アルゴリズムとモデルアーキテクチャの両方を正確に予測し、メンバーシップを推測し、実際のデータセットから機密サンプルを回収することに成功した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:21:28 GMT)
DriveCode: Domain Specific Numerical Encoding for LLM-Based Autonomous Driving [24.9] 本稿では、離散テキストトークンではなく、専用の埋め込みとして数値を表す数値符号化手法であるDriveCodeを紹介する。
DriveCodeは、多数のプロジェクタを使用して、数値を言語モデルの隠れた空間にマッピングし、視覚的およびテキスト的機能とのシームレスな統合を可能にする。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:41:29 GMT)
Large Language Model-Assisted UAV Operations and Communications: A Multifaceted Survey and Tutorial [24.9] 無人航空機(UAV)は機動性と機敏性のために多様なアプリケーションに広く配備されている。
大規模言語モデル(LLM)の最近の進歩は、UAVインテリジェンスを強化するための変革的な機会を提供する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 06:58:50 GMT)
KVSlimmer: Theoretical Insights and Practical Optimizations for Asymmetric KV Merging [24.9] 既存の手法は、KV非対称性と勾配に基づくヘッセン近似の経験的な観測に依存している。
KVSlimmerは、数学的に正確な定式化によって正確なヘッセン情報をキャプチャする効率的なアルゴリズムである。
様々なモデルとベンチマークの実験により、KVSlimmerはSOTA法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:07:36 GMT)
Enhancing Safety of Large Language Models via Embedding Space Separation [24.8] 大きな言語モデル(LLM)は印象的な機能を達成したが、有害なプロンプトに対する安全性を保証することは、依然として重要な課題である。
最近の研究によると、LLMにおける有害で安全なクエリの潜伏表現(埋め込み)は、通常線形分離性を示す。
この観測により,埋め込み空間分離(ES2)という表現レベルの微調整手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:22:38 GMT)
Minimalist Compliance Control [24.5] コンプライアンス制御は安全な物理的相互作用には不可欠であるが、その採用は力トルクセンサーなどのハードウェア要件によって制限されている。
モータ電流や電圧信号のみを用いたコンプライアンス動作を可能にするミニマリストコンプライアンス制御を提案する。
我々は,ロボットアーム,器用な手,接触の多い複数のタスクにまたがる2つのヒューマノイドロボットに対するアプローチを検証した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:25:54 GMT)
ClinCoT: Clinical-Aware Visual Chain-of-Thought for Medical Vision Language Models [24.2] そこで我々は,ClinCoTを提案することで,好みの最適化を応答レベルの補正から視覚駆動推論へ変換する。
ClinCoTは,従来の嗜好に基づくアライメント手法と比較して,事実上のグラウンド化を一貫して改善し,優れた性能を実現することを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:15:54 GMT)
Spherical Latent Motion Prior for Physics-Based Simulated Humanoid Control [23.3] 球状ラテント・モーション・プライオリ (SLMP) は, 動作先行学習のための2段階の手法である。
SLMPは情報損失のない細かな動きの詳細を保存し、ランダムサンプリングは意味論的に妥当で安定した振る舞いをもたらす。
SLMPは、異なるヒューマノイドロボット形態を一般化し、単一のシミュレートされたアバターを超えて、その伝達可能性を示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:00:20 GMT)
The Texture-Shape Dilemma: Boundary-Safe Synthetic Generation for 3D Medical Transformers [22.2] ViTは医療画像分析に革命をもたらしたが、そのデータ不足の性質は、臨床アーカイブの不足とプライバシーの制約と衝突している。
フォーミュラ駆動型スーパービジョンラーニングは、このボトルネックに対する有望な解決策として現れ、実際の患者データを活用することなく、数学的公式から無限の注釈付きサンプルを合成している。
既存のFパラダイムは、均一な強度を持つ単純な幾何学的手法に依存しており、組織テクスチャやCTやMRIのようなモダリティに固有のノイズパターンを無視して、実質的なギャップを生み出している。
本稿では,高頻度合成テクスチャを鼻で添加すると,構造境界の学習に必要な画像勾配信号が劣化し,原因となる臨界衝突境界を同定する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:27:45 GMT)
Fake It Right: Injecting Anatomical Logic into Synthetic Supervised Pre-training for Medical Segmentation [21.8] ビジョントランスフォーマー(ViT)は3次元の医療セグメンテーションで優れるが、大量のデータセットを必要とする。
Formula-Driven Supervised Learning (F)は、合成数学的プリミティブを事前学習することで、プライバシ保護の代替手段を提供する。
本稿では,Fの無限拡張性と解剖学的リアリズムを一体化するための注釈付きインフォームド・シンセティック・アナトロジー・プレトレーニング・フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:15:18 GMT)
AG-VAS: Anchor-Guided Zero-Shot Visual Anomaly Segmentation with Large Multimodal Models [21.7] AG-VAS(Anchor-Guided Visual Anomaly)は、3つの学習可能なセマンティックアンカートークンでLMM語彙を拡張する新しいフレームワークである。
AG-VASはゼロショット設定で一貫した最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:25:23 GMT)
DAM-VLA: A Dynamic Action Model-Based Vision-Language-Action Framework for Robot Manipulation [21.4] DAM-VLAは動的アクションモデルに基づくVision-Language-Actionフレームワークである。
VLM推論と拡散に基づくアームとグリップ制御のためのアクションモデルを統合する。
DAM-VLAは、シミュレーションおよび実世界の設定において最先端のVLA手法よりも優れた成功率を達成する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 05:16:04 GMT)
FoSS: Modeling Long Range Dependencies and Multimodal Uncertainty in Trajectory Prediction via Fourier State Space Integration [21.4] 本稿では,周波数領域推論と線形時間列モデリングを融合した二分岐フレームワークFoSSを提案する。
Argoverse 1とArgoverse 2ベンチマークの実験では、FoSSが最先端の精度を実現し、22.5%、パラメータが40%以上削減された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:38:59 GMT)
Towards Policy-Adaptive Image Guardrail: Benchmark and Method [21.0] ヴィジュアル言語モデル(VLM)は動的安全ガードレールのより適応的で一般化可能な基盤を提供する。
既存のVLMベースの保護方法は、通常、固定された安全ポリシーのみの下で訓練され、評価される。
本稿では,ロバストなアンセーフイメージガードレールに対する報酬を検証可能な強化学習ベース手法であるSafeGuard-VLを紹介する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:59:21 GMT)
PPC-MT: Parallel Point Cloud Completion with Mamba-Transformer Hybrid Architecture [20.6] PPC-MTは、ハイブリッドのMamba-Transformerアーキテクチャを利用した、ポイントクラウドコンプリートのための新しいフレームワークである。
我々のアプローチは、無秩序な点雲に幾何学的に意味のある構造を課し、それらを順序集合に変換し、それらを部分集合に分解する。
この構造化並列合成パラダイムは、計算効率を保ちながら、点分布と細部忠実度の均一性を著しく向上させる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 02:18:00 GMT)
Understanding LoRA as Knowledge Memory: An Empirical Analysis [20.5] 本稿では,Low-Rank Adaptation (LoRA) をモジュール型知識メモリとして用いたパラメトリック手法について検討する。
このギャップをLoRAベースのメモリの設計空間をマッピングする最初の体系的な経験的研究を通して埋める。
以上の結果から,LORAはRAG,ICCと相補的な記憶軸として位置づけられた。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:28:57 GMT)
Semantic XPath: Structured Agentic Memory Access for Conversational AI [20.5] コンテキスト内メモリのアプローチは、コンテキスト-ウィンドウの制限下でのスケールが不十分なモデル入力に、増大する履歴を付加する。
本研究では,木構造メモリモジュールであるSemanticを提案する。
また、構造化メモリとクエリ実行の詳細を可視化する、エンドツーエンドのConvAIデモシステムであるSemanticPathX Chatを紹介する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:56:08 GMT)
Graph Attention Based Prioritization of Disease Responsible Genes from Multimodal Alzheimer's Network [20.4] 疾患関連遺伝子の優先順位付けはアルツハイマー病などの複雑な疾患の理解の中心である。
我々は,集中度指標を注目度スコアに置き換えるマルチモーダルグラフトランスフォーマフレームワークである.NETRAを提案する。
グラフ変換器は、疾患特異的でコンテキスト対応の方法で遺伝子関連性を定量化する.NETRAスコアを割り当てる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 06:46:18 GMT)
Sustainable Code Generation Using Large Language Models: A Systematic Literature Review [20.1] 大規模言語モデル(LLM)は、コードの生成、完成、翻訳、修正に広く使われている。
本稿では,LLMが生成するコードの持続可能性に関する既存研究について検討する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:32:36 GMT)
TripleSumm: Adaptive Triple-Modality Fusion for Video Summarization [19.9] TripleSummは、フレームレベルで視覚、テキスト、オーディオのモダリティの貢献を適応的に重み付けし、融合させる新しいアーキテクチャである。
最先端のパフォーマンスを実現し、MoSuを含む4つのベンチマークにおいて、既存のメソッドよりも大幅にパフォーマンスが向上している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:18:59 GMT)
ArtLLM: Generating Articulated Assets via 3D LLM [19.8] ArtLLMは、完全な3Dメッシュから直接高品質な調音資産を生成するための新しいフレームワークである。
コアとなるのは,大規模な調音データセットに基づいてトレーニングされた,3Dマルチモーダルな大規模言語モデルだ。
実験の結果,ArtLLMは部品配置精度と接合予測の両方で最先端の手法を著しく上回ることがわかった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:07:46 GMT)
HiMAC: Hierarchical Macro-Micro Learning for Long-Horizon LLM Agents [19.6] HiMACは階層的なエージェントRLフレームワークで、長期の意思決定をマクロレベルの計画とマイクロレベルの実行に分解する。
その結果,モデルスケールを単独で増やすのではなく,構造的階層を導入することが,堅牢な長期エージェントインテリジェンスを実現する上で重要な要素であることが示唆された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:09:03 GMT)
Truth as a Trajectory: What Internal Representations Reveal About Large Language Model Reasoning [19.5] 大規模言語モデルのためのトラジェクトリ(TaT)としてTrathを導入する。
TaTは静的なアクティベーションから層幅の幾何変位への解析をシフトする。
本稿では,TaTが静的な語彙の共役に依存することを効果的に軽減し,従来の探索よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 23:52:10 GMT)
riMESA: Consensus ADMM for Real-World Collaborative SLAM [19.2] 通信が限られている場合に信頼性が高く,マルチロボットチームの正確な状態推定をリアルタイムに計算できる,堅牢でインクリメンタルな分散C-SLAMバックエンドを提案する。
本研究は,C-SLAMと実世界のC-SLAMデータの両方を用いて,様々なC-SLAM問題シナリオと通信ネットワーク条件に関するriMESAの詳細な評価を行った結果である。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:43:35 GMT)
GroupGPT: A Token-efficient and Privacy-preserving Agentic Framework for Multi-User Chat Assistant [19.0] GroupGPTは、マルチユーザーチャットアシスタントのためのトークン効率とプライバシ保護のためのエージェントフレームワークである。
マルチユーザチャットアシスタントの介入推論のためのベンチマークデータセットであるMUIRを紹介する。
実験により、GroupGPTは正確かつ適切な応答を生成することが示された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:29:25 GMT)
pySpatial: Generating 3D Visual Programs for Zero-Shot Spatial Reasoning [18.7] pySpatialは、MLLMと空間ツールとのインタフェースを備えたビジュアルプログラミングフレームワークである。
pySpatialは生の2D入力を探索可能な3Dシーンに変換し、MLLMが構造化された空間表現に対して明示的に推論することを可能にする。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:55:49 GMT)
Dr.Occ: Depth- and Region-Guided 3D Occupancy from Surround-View Cameras for Autonomous Driving [18.3] Dr.Occは奥行きと地域誘導による占領予測フレームワークである。
奥行き誘導型2D-to-3Dビュートランス(D$2$-VFormer)を導入する。
また、地域固有の専門家を適応的に割り当てて異なる空間領域にフォーカスする地域誘導型エキスパートトランス (R/R$2-EFormer) を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 09:22:15 GMT)
The Lattice Representation Hypothesis of Large Language Models [18.0] 分離しきい値を持つ線形属性方向は、半空間交叉を通じて概念格子を誘導することを示す。
この幾何学は、幾何学的交叉 (intersection) と結合 (union) 演算による記号的推論を可能にする。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:42:59 GMT)
Thoth: Mid-Training Bridges LLMs to Time Series Understanding [17.8] 大規模言語モデル (LLM) は汎用推論において顕著な成功を収めている。
しかし、彼らは時系列データの理解と分析に苦慮している。
我々は、汎用時系列理解機能を備えた中級LLMの最初のファミリーであるThothを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:44:39 GMT)
GuiDINO: Rethinking Vision Foundation Model in Medical Image Segmentation [17.8] 本稿では,下流セグメンテーションのための視覚誘導ジェネレータとして機能するために,ネイティブファンデーションモデルを再配置するフレームワークGuiDINOを紹介する。
GuiDINOはDINOv3から視覚的特徴表現を抽出し、軽量のTokenBookメカニズムを介して空間的ガイドマスクに変換する。
GuiDINOは、さまざまな医療データセット間のセグメンテーション品質とバウンダリロバスト性を一貫して改善する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:55:34 GMT)
Towards Orthographically-Informed Evaluation of Speech Recognition Systems for Indian Languages [17.5] インド語のASRシステムを評価することは、綴りのバリエーションによって困難である。
従来の単語誤り率 (WER) は、人間が知覚するよりも、システムパフォーマンスのブラーカーなイメージをしばしば提示する。
許容可能なバリエーションをキャプチャするベンチマークを作成するためのフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 06:20:35 GMT)
How RL Unlocks the Aha Moment in Geometric Interleaved Reasoning [17.2] 複雑な幾何学的問題を解くには、本質的にインターリーブな推論が必要である。
提案手法は,プロット・ソリューション・データに対するスーパーバイザード・ファイン・チューニング (SFT) によって推論性能が著しく低下することを示した。
表面模倣を超えた3つのカジュアルな制約を強制する強化学習フレームワークであるFairを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:18:12 GMT)
A Unified Framework to Quantify Cultural Intelligence of AI [16.8] 本稿では,文化能力の多面的指標を文化的知能の統一評価に集約する枠組みを提案する。
文化インテリジェンスを,さまざまな領域にまたがるコア機能のスイートとして概念化し,それを指標として運用する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:14:52 GMT)
HierKick: Hierarchical Reinforcement Learning for Vision-Guided Soccer Robot Control [16.6] 本稿では,デュアル周波数階層RLに基づく視覚誘導型サッカーロボット制御フレームワークを提案する。
このフレームワークは、リアルタイム検出のためにYOLOv8を統合する5Hzのハイレベルポリシーを備えた階層的な制御アーキテクチャを採用している。
実験の結果、このフレームワークの成功率はIsaacGymの95.2%、Mujocoの89.8%、現実世界の80%であることがわかった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 06:41:03 GMT)
I Can't Believe It's Not Robust: Catastrophic Collapse of Safety Classifiers under Embedding Drift [16.5] 命令調整型推論モデルは、ベースモデルよりも20$%以上のクラス分離性を示し、整列系をパラドックス的に保護することが困難であることを示す。
我々の発見は、プロダクションAI安全アーキテクチャにおける根本的な脆弱性を明らかにし、モデルバージョン間で安全メカニズムが転送されるという仮定に挑戦する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:02:53 GMT)
You Only Need One Stage: Novel-View Synthesis From A Single Blind Face Image [16.2] 1つのブラインドフェイス画像から直接一貫したノベルビュー画像を生成するための新しいワンステージ手法であるNVB-Faceを提案する。
本手法は, 整合性と忠実性の両方において, 従来の2段階アプローチよりも優れていた。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 23:55:14 GMT)
Evaluating GFlowNet from partial episodes for stable and flexible policy-based training [16.2] 生成フローネットワーク (GFlowNets) は, 有向非巡回グラフにおいて, 生成過程を軌跡として解釈することで, 効率よく候補を抽出するためのポリシーを学習するために開発された。
価値に基づくトレーニングワークフローでは、学習された政策の流れと望ましい政策の予測フローとの間の部分的なエピソードのバランスを強制し、政策の分散を暗黙的に促進する。
本研究は,2つの視点を橋渡しし,フローバランスが分散度を測定する原則的政策評価器も得られることを示すとともに,部分的エピソードに対する評価バランス目標が評価器の学習に有効であることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:00:04 GMT)
Uncertainty-Aware Concept and Motion Segmentation for Semi-Supervised Angiography Videos [16.0] 運動認識の一貫性とプログレッシブ・信頼の規則化を両立させたSAM3ベースの教師学習フレームワークを提案する。
提案手法は,SAM3の独特な即興的な概念セグメンテーション設計を利用して,SAM3をベースとした教師学習フレームワークを革新し,教師と生徒の双方のパフォーマンスを最大化する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:04:43 GMT)
DRIFT: Diffusion-based Rule-Inferred For Trajectories [15.8] 非構造環境における移動ロボットの軌道生成は、スムーズで安全な実行と細粒度タスクの終端精度のバランスをとるという、重要なジレンマに直面している。
本稿では、2つの相補的帰納バイアスを統合することで高忠実度参照軌道を生成するための条件付きフレームワークであるDRIFTを提案する。
その結果、DRIFTはこれらの相反する目的を調整し、センチメートルレベルの模倣忠実度(0.041m FDE)と競争滑らか度(27.19 Jerk)を達成することを示した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 05:54:38 GMT)
GameVerse: Can Vision-Language Models Learn from Video-based Reflection? [15.7] 我々は、反射的な視覚的相互作用ループを可能にする総合的なビデオゲームベンチマークであるGameVerseを紹介する。
従来のファイア・アンド・フォーゲット・アセスメントを超えて、ビジョン・ランゲージ・モデルがどのように視覚体験を内部化し、ポリシーを改善するかを評価するために、新しいリフレクション・アンド・リトライ・パラダイムを使用している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:29:39 GMT)
The Aftermath of DrawEduMath: Vision Language Models Underperform with Struggling Students and Misdiagnose Errors [15.6] 我々の研究は、11の視覚言語モデル(VLM)がDrawEduMath上でどのように機能するかを、年間にわたって記録しています。
モデルの弱点は、数学教育の中核的な要素である学生の誤りに集中していることがわかりました。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 05:15:12 GMT)
Unified Vision-Language Modeling via Concept Space Alignment [15.5] V-SONAR(V-SONAR)は、テキストのみの埋め込み空間であるSONARから拡張された視覚言語埋め込み空間である。
V-LCMは視覚と言語入力をV-SONARとSONARを介して潜伏埋め込みの統一シーケンスに符号化する。
V-LCMは、画像/ビデオのキャプションと質問応答を含むタスクにおいて、最先端のビジョン言語モデルと一致する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:22:44 GMT)
Token-level Data Selection for Safe LLM Fine-tuning [15.0] カスタムデータセット上での微調整大型言語モデル(LLM)は、これらのモデルを特定のドメインやアプリケーションに適用するための標準的なアプローチとなっている。
近年の研究では、このような微調整がモデルの安全性を著しく低下させる可能性があることが示されている。
本稿では,安全劣化モデルとユーティリティ指向モデルとの損失差を測定することにより,各トークンの安全性リスクを定量化する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:52:05 GMT)
AG-REPA: Causal Layer Selection for Representation Alignment in Audio Flow Matching [14.9] 本稿では,音声フローマッチングにおける表現アライメントのための新しい因果層選択戦略であるAG-REPAを紹介する。
セマンティック/音響情報を最もよく保存する層は、必ずしも生成を駆動する速度場に最も寄与する層であるとは限らない。
この知見を実用的なトレーニングガイダンスに変換するために,各レイヤの因果寄与を定量化するフォワードオンリーゲートアブレーション(FoG-A)を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 09:16:46 GMT)
Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery [14.6] Ring(TR)分解は高次データモデリングの強力なツールである。
メッシュグリッドデータと非メシュグリッドデータの両方に対するTR関数分解を提案する。
TR因子のスペクトル構造が再構成テンソルの周波数組成を決定することを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:19:03 GMT)
Content-Aware Frequency Encoding for Implicit Neural Representations with Fourier-Chebyshev Features [14.6] Inlicit Neural Representations (INR)は、様々な信号処理タスクの強力なパラダイムとして登場した。
その固有のスペクトルバイアスは、高周波の詳細を捉える能力を制限する。
既存の手法では、通常は固定周波数ベースに依存するフーリエベースの特徴を用いることで、この問題を部分的に軽減している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:14:19 GMT)
Decoupling Motion and Geometry in 4D Gaussian Splatting [14.6] VeGaS (VeGaS) は、ガウス運動と幾何学を分離する速度ベースの4Dガウス平滑化フレームワークである。
幾何学的変形ネットワークは、時間的文脈と速度を用いて形状や方向を洗練し、時間的幾何学的モデリングを強化する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:07:40 GMT)
Beyond False Discovery Rate: A Stepdown Group SLOPE Approach for Grouped Variable Selection [14.5] グループステップダウンSLOPEは、リーマン・ロマノのステップダウンルールをSLOPEに埋め込み、k-FWERおよびFDP閾値の下で有限サンプル保証を達成する。
ユーザ指定レベルでk-FWERとFDPを確実に結合したクローズドフォーム正規化シーケンスを導出し,gk-SLOPEおよびgF-SLOPEを介してグループ化された設定に拡張する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:11:40 GMT)
Active Flow Matching [14.4] アクティブフローマッチング(AFM)は、フローに沿った条件付きエンドポイント分布を操作するための変動目的を再構成する。
我々は、自己正規化重要度サンプリングを用いて、前方および逆のKullback-Leibler(KL)変異を導出する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 02:50:07 GMT)
Structure-preserving Randomized Neural Networks for Incompressible Magnetohydrodynamics Equations [14.3] 我々は、非圧縮性磁気流体力学(MHD)方程式を解くための新しい枠組みを開発する。
強い非線形性と二重発散のない制約を保っている。
より高精度で、より高速な収束を実現し、分散自由制約の厳密な適用を実現している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:42:28 GMT)
Unleashing VLA Potentials in Autonomous Driving via Explicit Learning from Failures [14.3] 自律走行のためのVLA(Vision-Language-Action)モデルは、強化学習(Reinforcement Learning、RL)最適化時にしばしばパフォーマンス高原に到達する。
この停滞は、以前のスーパービジョン・ファインチューニング(SFT)によって制約された探査能力から生じる。
構造化された診断フィードバックでRLを増強するフレームワークであるELF-VLA(Explicit Learning from Failures)を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:41:22 GMT)
A402: Bridging Web 3.0 Payments and Web 2.0 Services with Atomic Service Channels [14.2] 我々は、Web 3.0支払いをWeb 2.0サービスにセキュアにバインドする、信頼最小化支払いアーキテクチャであるA402を提案する。
A402にはTEEベースのLiquidity Vaultが組み込まれており、ASCのライフサイクルをプライベートに管理し、その決済を単一のオンチェーントランザクションに集約する。
以上の結果から,A402は,信頼度を最小化したセキュリティ保証を提供しつつ,x402上でのオーダー・オブ・マグニチュード性能とオン・チェーンコストの改善を実現していることがわかった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:45:22 GMT)
Fully-analog array signal processor using 3D aperture engineering [13.9] 3次元開口工学フレームワークを用いた完全アナログアレイ信号プロセッサ(FASP)を提案する。
FASPは、超高分解能方向推定、ソース数推定、マルチチャネルソース分離を行う。
さらに、レーダー妨害信号を20dBで抑制できる10ターゲットのソース数推定と独立チャネル分離を検証した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:50:10 GMT)
Solving a Nonlinear Blind Inverse Problem for Tagged MRI with Physics and Deep Generative Priors [13.3] タグ付けMRIのためのブラインド・非線形逆フレームワークを提案する。
解剖学的画像回復、高分解能シネ画像合成、動き推定を統一する。
提案手法は,高分解能な解剖像,シネ像,および特殊な方法よりも高精度な運動を与える。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:04:52 GMT)
DWAFM: Dynamic Weighted Graph Structure Embedding Integrated with Attention and Frequency-Domain MLPs for Traffic Forecasting [12.8] 本稿では,新しい動的重み付きグラフ構造(DWGS)の埋め込み法を提案する。
これは、時間とともにノード間の動的関連性の強さの変化を真に反映できるグラフ構造に依存している。
実世界の5つのトラフィックデータセットの実験では、DWAFMは最先端の手法よりも優れた予測性能を達成している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:50:41 GMT)
MMCOMET: A Large-Scale Multimodal Commonsense Knowledge Graph for Contextual Reasoning [12.8] 本稿では,身体的,社会的,事象的知識を統合した最初のマルチモーダルコモンセンス知識グラフMMCOMETを提案する。
MMCOMETはATOMIC 2020ナレッジグラフを拡張して、効率的な画像検索プロセスを通じて、視覚次元を含むように拡張し、900万以上のマルチモーダルトリプルを実現する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:21:50 GMT)
FREE-Edit: Using Editing-aware Injection in Rectified Flow Models for Zero-shot Image-Driven Video Editing [12.5] 画像駆動ビデオ編集は、修正された第1フレームから残りのフレームへの編集内容を伝達することを目的としている。
現在の方法は、通常、事前訓練された画像対ビデオ(I2V)モデルを用いてソースビデオからノイズに反転し、編集された第1フレームを使用してサンプリングプロセスをガイドする。
本稿では,各トークンの注入強度を変調する Editing-awaRE (REE) インジェクション法を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:01:44 GMT)
Attention Smoothing Is All You Need For Unlearning [12.2] 大きな言語モデルは、機密性の高い、著作権のある、または有害なコンテンツを記憶する傾向があり、重大なプライバシーと法的懸念を生じさせる。
本研究では,モデル自体の注意を生かした学習者に対して,学習を自己蒸留として活用する原則的枠組みである注意平滑化学習を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:39:35 GMT)
Demystifying Group Relative Policy Optimization: Its Policy Gradient is a U-Statistic [11.6] 相対的ポリシー最適化はDeepSeekMathとDeepSeek-R1の中核となる方法論的コンポーネントである。
本稿では,従来のU-統計学のレンズを通してGRPOを理解するための統一的な枠組みを提供する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:56:43 GMT)
Unlearning Noise in PINNs: A Selective Pruning Framework for PDE Inverse Problems [11.6] 物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式(PDE)によって支配される逆問題を解決するための有望な枠組みを提供する
PDE逆問題の性質の悪さはノイズに非常に敏感である。
P-PINNは、事前訓練されたPINNにおいて、破損したデータの影響を解き放つために設計された選択型プルーニングフレームワークである。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 01:40:45 GMT)
Certifiable Estimation with Factor Graphs [11.4] 因子グラフ構造はShorの緩和とBurer-Monteiro因子化の下で保存されることを示す。
これらの変換を関連する因子グラフ表現付きQCQPに適用すると、同じ接続性を持つ因子グラフモデルを認める昇降問題が得られる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:50:51 GMT)
SyncTrack: Rhythmic Stability and Synchronization in Multi-Track Music Generation [11.2] 同期型マルチトラック波形生成モデルSyncTrackを導入する。
トラックシェアリングモジュールは、すべてのトラックとトラック固有のモジュールで共通のリズムを確立し、様々な音色とピッチ範囲に対応している。
実験により、SyncTrackはリズム整合性を向上させることにより、マルチトラック音楽の質を大幅に向上することが示された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:41:23 GMT)
Non-Rectangular Average-Reward Robust MDPs: Non-Rectangular Average-Reward Robust MDPs:Optimal Policies and Their Transient Values [11.2] 非矩形ロバストマルコフ決定過程を平均逆基準下で研究する。
あいまいさの集合に対して一様に、サブリニアな後悔を達成できる歴史に依存した政策が、頑健な最適化であることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 06:29:34 GMT)
TC-SSA: Token Compression via Semantic Slot Aggregation for Gigapixel Pathology Reasoning [10.7] 本稿では,パッチ機能を一定の数のセマンティックスロットに集約する,学習可能なトークン圧縮フレームワークTC-SSAを提案する。
ゲートルーティングモジュールは、スパースなTop-2ルーティングを使用してスロットにパッチを割り当て、次に重み付けされたアグリゲーションによって、厳格なトークン予算の下でグローバルなスライドカバレッジを可能にする。
SlideBench(TCGA)では、全体の精度が78.34%、診断サブセットが77.14%に達し、サンプリングベースベースラインを上回っている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:07:57 GMT)
Catalyst-Agent: Autonomous heterogeneous catalyst screening and optimization with an LLM Agent [10.6] 本稿では,サーバベースのLLMAIエージェントであるCatalyst-Agentを紹介する。
OPTIMADE APIを使って巨大なマテリアルデータベースを探索できる。
Catalyst-Agentは、選択して評価するすべての材料のうち、23~34%の成功率を達成する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:44:56 GMT)
From Dialogue to Execution: Mixture-of-Agents Assisted Interactive Planning for Behavior Tree-Based Long-Horizon Robot Execution [10.5] 大型言語モデル(LLM)により、ロボットは自然言語命令からハイレベルなアクションプランを生成することができる。
長期的タスクでは、このようなアプローチには多くの疑問が伴い、ユーザの負担が増大する。
そこで我々は,Mixture-of-Agents(MoA)ベースのプロキシ応答を対話型プランニングに統合するフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:54:51 GMT)
AEDHunter: Investigating AED Retrieval in the Real World via Gamified Mobile Interaction and Sensing [10.5] AEDHunterは、AED検索をエンゲージメントで反復可能な練習体験に変換するように設計された、ゲーミフィケーションな位置情報ベースのモバイルアプリケーションである。
実世界評価研究において、参加者は繰り返し練習を行った後、AED検索時間を著しく短縮し、AEDの配置に自信を増すと報告した。
AEDHunterのようなゲーミフィケーションされたアプリケーションは、繰り返し、その場でトレーニングし、自己申告した準備性を高めることで、AED検索性能を向上させることができることが示唆された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:37:46 GMT)
BadRSSD: Backdoor Attacks on Regularized Self-Supervised Diffusion Models [10.3] Bad RSSDは自己教師付き拡散モデルの表現層をターゲットにした最初のバックドア攻撃である。
標的画像に対するPCA空間のトリガーで有毒なサンプルのセマンティック表現をハイジャックする。
悪い RSSD は FID と MSE の両方で既存の攻撃を著しく上回っている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 09:56:26 GMT)
VEMamba: Efficient Isotropic Reconstruction of Volume Electron Microscopy with Axial-Lateral Consistent Mamba [10.2] ボリューム電子顕微鏡(VEM)は3次元組織イメージングに不可欠である。
既存の等方的復元法は、しばしば豊富な軸方向情報を無視する。
等方的再構成のための効率的なフレームワークであるVEMambaを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:22:42 GMT)
Detect Repair Verify for Securing LLM Generated Code: A Multi-Language Empirical Study [10.2] セキュリティは、問題を検出し、修正を適用し、結果を検証するDerction-Repair--Verify (DRV)ループを通じて対処されることが多い。
この研究は、プロジェクトレベルのアーティファクトのワークフローを研究し、以下の4つのギャップに対処する: L1、実行可能な機能とセキュリティテストを備えたプロジェクトレベルのベンチマークの欠如 L2、検出や修復のみを研究すること以外のパイプラインレベルの有効性に関する限られた証拠 L3、修正ガイダンスとしての検出レポートの不確実な信頼性、そしてL4、検証中の不確実な修復信頼性と副作用。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:41:24 GMT)
Evaluating AI Grading on Real-World Handwritten College Mathematics: A Large-Scale Study Toward a Benchmark [9.9] カリフォルニア大学アーバイン校(UC Irvine)の実際の手書き電卓におけるAIのグルーピングに関する大規模な実証的研究について述べる。
OCR条件付き大規模言語モデルを用いて, 何千もの応答型クイズ入力に対して, スコアと形式的フィードバックを生成する。
本研究は,1つの基礎的ラベルを持たない環境下で,公的な指導助成学級,学生調査,独立人レビューに対する評価を行った。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:32:51 GMT)
No More Maybe-Arrows: Resolving Causal Uncertainty by Breaking Symmetries [9.3] 因果関係を尊重しながらPAGをDAGに変換するための新しい改良フレームワークCausalSAGEを提案する。
得られたDAGは,根底にある因果関係を保ちつつ,効率よく得られることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:21:12 GMT)
SWE-Adept: An LLM-Based Agentic Framework for Deep Codebase Analysis and Structured Issue Resolution [9.3] 大規模言語モデル(LLM)は、自己完結したタスクに対して強いパフォーマンスを示す。
SWE-Adeptは、ローカライズエージェントが問題関連コードの位置を特定し、解決エージェントが対応する修正を実装するフレームワークである。
SWE-Bench Lite と SWE-Bench Pro の実験は、SWE-Adept が問題ローカライゼーションと解決の両方において、従来のアプローチよりも一貫して優れていることを示した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 23:52:30 GMT)
S-VoCAL: A Dataset and Evaluation Framework for Inferring Speaking Voice Character Attributes in Literature [9.1] S-VoCAL(S-VoCAL)は,音声関連キャラクタ属性の推論評価を目的とした,最初のデータセットおよび評価フレームワークである。
S-VoCALは社会音韻研究に根ざした8つの属性と、プロジェクト・グーテンベルクから派生した922の文字ブックを包含している。
以上の結果から,RAGパイプラインは年齢やジェンダーなどの属性を確実に推測するが,オリジンや身体健康など他の特性に苦慮していることが示唆された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:24:16 GMT)
Flow Matching-enabled Test-Time Refinement for Unsupervised Cardiac MR Registration [9.0] FlowRegは、変位場空間におけるフローマッチングフレームワークであり、わずか2ステップで強力な登録を実現する。
ACDCとMM2では、FlowRegは5つのタスクで芸術の状態を上回り、左心室で最大の利益を上げている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:32:11 GMT)
Teacher-Guided Causal Interventions for Image Denoising: Orthogonal Content-Noise Disentanglement in Vision Transformers [9.0] 従来の画像復調モデルは, 環境要因とノイズパターンの急激な相関関係を不注意に学習する。
本稿ではTCD-Net(Teacher-Guided Causal Disentanglement Network)を提案する。
大規模な実験により、TCD-Netは、複数のベンチマークにおいて、忠実さと効率の両方で、メインストリームのメソッドよりも優れていることが示された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:04:37 GMT)
Time-Aware Latent Space Bayesian Optimization [8.9] 時間を考慮したラテント空間ベイズ最適化(TALBO)を提案する。
TALBOは、GP-プライア変分オートエンコーダを介して、サロゲートと学習された生成表現の両方に時間を組み込む。
我々は、多目的のドリフトに広く使われている分子設計タスクを適用し、ターゲットの変化に合わせてメトリクスを導入する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 05:50:53 GMT)
MOSAIC: A Unified Platform for Cross-Paradigm Comparison and Evaluation of Homogeneous and Heterogeneous Multi-Agent RL, LLM, VLM, and Human Decision-Makers [8.9] 強化学習(RL)、大規模言語モデル(LLM)、視覚言語モデル(VLM)は独立して広く研究されている。
既存のインフラストラクチャには、異なる意思決定パラダイムからエージェントを同じ環境にデプロイする能力がない。
このギャップを埋めるオープンソースのプラットフォームであるMOSAICを紹介します。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:33:19 GMT)
AgilePruner: An Empirical Study of Attention and Diversity for Adaptive Visual Token Pruning in Large Vision-Language Models [8.7] 視覚トークン処理機構を調べるために,特徴多様性と注目スコアエントロピーの尺度として,有効ランク(ランク)を用いた徹底的な経験分析を行った。
本分析は,多くの多様性指向プルーニング法が,意図したよりも著しく多様性を保っていることを示している。
画像認識の調整を既存のハイブリッドプルーニング戦略に組み込むことで、その性能が一貫して向上することを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 19:14:39 GMT)
DeAR: Fine-Grained VLM Adaptation by Decomposing Attention Head Roles [8.6] textbfDeAR はtextbfDecomposing textbfAttention head textbfRoles によって微細な VLM 適応を実現するフレームワークである。
DeARはタスク適応と一般化のバランスを保ち、様々なタスクで過去の手法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:52:51 GMT)
MLRecon: Robust Markerless Freehand 3D Ultrasound Reconstruction via Coarse-to-Fine Pose Estimation [8.5] MLReconはロバストなマーカーレス3DUS再構成フレームワークで、ドリフト耐性の6Dプローブのポーズトラッキングを提供する。
我々のパイプラインは、視覚誘導型発散検出器によって強化されたプローブの連続的なマーカーレス追跡を可能にする。
実験の結果、MLReconは競合するセンサレスやセンサアシストの手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:39:21 GMT)
CollabEval: Enhancing LLM-as-a-Judge via Multi-Agent Collaboration [8.5] 大規模言語モデル(LLM)は、LLM-as-a-Judgeパラダイムがますます普及し、AI生成コンテンツ評価に革命をもたらした。
我々は三相協調評価プロセスを実装した新しいマルチエージェント評価フレームワークCollabEvalを提案する。
実験の結果,CollabEvalは複数次元にわたる単一LLM手法より一貫して優れていた。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:45:13 GMT)
VP-Hype: A Hybrid Mamba-Transformer Framework with Visual-Textual Prompting for Hyperspectral Image Classification [8.2] VP-Hypeは、状態空間モデルの線形時間効率と変換器のリレーショナルモデリングを統合することで、HSI分類を再考するフレームワークである。
堅牢な3D-CNNスペクトルフロントエンド上に構築されたVP-Hypeは、従来のアテンションブロックをHybrid Mamba-Transformerバックボーンに置き換える。
トレーニングサンプルの分布は2%に過ぎず、Salinasデータセットで99.69%、Longkouデータセットで99.45%の総合精度(OA)を達成した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:24:09 GMT)
A Deployable Bio-inspired Compliant Leg Design for Enhanced Leaping in Quadruped Robots [8.1] 本稿では, カエル脚のエネルギー貯蔵機構をエミュレートするバイオインスピレーション法を提案する。
特殊な3Dプリント弾性材料を用いたDCL(Deployable Compliant Leghopper)を設計した。
この構造は生物学的な腱と同様に機能し、ロボットのスクワットフェーズ中に弾性エネルギーを蓄積し、跳躍中にモーター出力を増強するために素早く放出する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:22:11 GMT)
Curvature-Weighted Capacity Allocation: A Minimum Description Length Framework for Layer-Adaptive Large Language Model Optimization [8.0] 大規模な言語モデルにおけるレイヤーのキャパシティは、一様ではなく、あるレイヤは損失削減に不均一に寄与し、他のレイヤは、ほぼ冗長である。
影響関数に基づくレイヤスコアリングのような、この非均一性を利用する既存の手法は、感度推定を生成するが、それらをアロケーションやプルーニング決定に変換するための原則化されたメカニズムは提供しない。
このギャップを,MDL(Minimum Description Length)の原理に基づく統一された曲率対応フレームワークで解決する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:14:15 GMT)
A Systematic Study of LLM-Based Architectures for Automated Patching [8.0] 本研究では,4つの大規模言語モデル (LLM) に基づくパッチ処理パラダイムの制御評価を行う。
実際の脆弱性タスクにおけるパッチの正確性、障害モード、トークン使用量、実行時間を分析します。
固定は効率的だが脆く、単一エージェントシステムは柔軟性とコストのバランスを保ち、マルチエージェント設計はオーバーヘッドを大幅に上回るコストを犠牲にして改善される。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:26:22 GMT)
SphUnc: Hyperspherical Uncertainty Decomposition and Causal Identification via Information Geometry [7.8] 本稿では,超球面表現学習と構造因果モデリングを組み合わせた統合フレームワークであるSphUncを紹介する。
球状潜伏剤の構造因果モデルにより、サンプルベースシミュレーションによる直接的影響同定と介入推論が可能となる。
社会的および感情的なベンチマークに関する実証的な評価では、精度の向上、校正の改善、因果信号の解釈が示されている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:11:49 GMT)
Can Thinking Models Think to Detect Hateful Memes? [7.8] 思考に基づくマルチモーダル大言語モデル(MLLM)は近年、視覚言語による理解が進んでいる。
思考に基づくMLLMにおける推論を改善する強化学習に基づくポストトレーニングフレームワークを提案する。
提案手法は,最先端性能を実現し,精度とF1を約1%,説明品質を約3%向上させる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:41:52 GMT)
Tiny-Critic RAG: Empowering Agentic Fallback with Parameter-Efficient Small Language Models [7.7] Retrieval-Augmented Generations Grounds Large Language Models (LLMs) は、事実の幻覚を緩和する。
低ランク適応(LoRA)を用いたパラメータ効率小言語モデル(SLM)Tiny-Critic RAGを提案する。
Tiny-Critic RAGはGPT-4o-miniに匹敵するルーティング精度を達成し、レイテンシを桁違いに低減する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 00:16:31 GMT)
MiniUGV$_2$: A Compact UAV-Deployable Tracked Ground Vehicle with Manipulation Capabilities [7.7] miniUGV$(ミニUGV$)は、UAV機能を制限された環境に拡張する小型の無人航空機である。
このシステムには、両関節アーム、LiDARと深度センサーの統合、および拡張された剥離のためのモジュールエレクトロニクスが導入されている。
実験では、堅牢なナビゲーション、セルフライト、オプションの自律性を実証する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:53:55 GMT)
Hippo: High-performance Interior-Point and Projection-based Solver for Generic Constrained Trajectory Optimization [7.4] 軌道最適化は、現代のモデルに基づくロボット制御と運動計画の中核である。
本稿では,内点法を用いて不等式制約を処理可能な解法であるHippoを紹介する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 02:24:42 GMT)
SoberDSE: Sample-Efficient Design Space Exploration via Learning-Based Algorithm Selection [7.3] 設計空間探索(DSE)は、高品質なハードウェアアーキテクチャの同定を目指している。
設計空間の巨大なサイズは、DSEを計算的に禁止する。
本稿では,ベンチマーク特性に基づく適切なアルゴリズムを推奨するSoberDSEフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:28:12 GMT)
Three-Qubit State Preparation: Classification and Explicit Circuits [7.2] 我々は、量子情報の3ビット純状態を4つのクラスに分割し、各クラスに対して明示的な回路を提供する。
従来の手法と比較して,回路は実用的に設計されている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 00:13:41 GMT)
Forgetting is Competition: Rethinking Unlearning as Representation Interference in Diffusion Models [7.2] SurgUnは、テキスト条件の拡散モデルで特定の視覚的概念を取り除くために、目標の重量空間更新を適用する外科的アンラーニング手法である。
我々のアプローチは、新たに獲得した記憶が以前の記憶へのアクセスを上書き、抑制、妨げることができるという、遡及的干渉理論によって動機付けられている。
我々は、この原理をレトロアクティブな概念干渉を誘導することにより拡散モデルに適用し、対象概念のみの集中的不安定化を可能にする。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:07:14 GMT)
GPU-friendly and Linearly Convergent First-order Methods for Certifying Optimal $k$-sparse GLMs [7.1] ブランチ・アンド・バウンド(BnB)フレームワークは、パースペクティブ・リラクゼーションを使って最適性を証明できる。
これらの緩和を解く既存の手法は計算集約的であり、スケーラビリティを制限している。
我々は線形収束性と計算効率の両立した近位フレームワークを開発する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:26:09 GMT)
Suffix-Constrained Greedy Search Algorithms for Causal Language Models [6.9] 大規模言語モデル(LLM)は、ヒューマンマシンインターフェースやチャットボット以外のアプリケーションを見つける強力なツールである。
残念ながら、LLM自由形式出力における最終回答の抽出は、それ自体が情報抽出の問題であるため困難である。
本稿では, 厳密なテンプレートに追従し, 自明に解析可能であることを保証した, 厳密なLLM応答を実現するための接尾辞生成手法を提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 19:46:00 GMT)
ISS Policy : Scalable Diffusion Policy with Implicit Scene Supervision [6.7] Implicit Scene Supervision (ISS) Policy(インプリシット・シーン・スーパービジョン・ポリシー)は、点雲観測から連続的なアクションのシーケンスを予測する3次元バイスモータ DiT ベースの拡散ポリシーである。
ISSポリシーは、シングルアーム操作タスクと器用な手操作の両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:06:41 GMT)
Hybrid Neural-LLM Pipeline for Morphological Glossing in Endangered Language Documentation: A Case Study of Jungar Tuvan [6.4] 本稿では,ニューラルシークエンスラベリングと大規模言語モデル(LLM)を併用したハイブリッド自動グロスパイプラインを提案する。
検索強化プロンプトは、ランダムなサンプル選択よりも大幅に向上することを示す。
また, 形態素辞書は, 辞書を全く提供していない場合に比べて, パラドックス的に性能を損なうことが判明した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 05:03:11 GMT)
MedCollab: Causal-Driven Multi-Agent Collaboration for Full-Cycle Clinical Diagnosis via IBIS-Structured Argumentation [6.3] 本稿では,現代病院の階層的相談ワークフローを模倣する,新しいマルチエージェントフレームワークであるMedCollabを紹介する。
このフレームワークは、患者固有の症状や検査結果に応じて、臨床および検査薬を適応的に組み立てる、ダイナミックなスペシャリスト採用機構を備えている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:25:58 GMT)
A Novel Reconfigurable Dexterous Hand Based on Triple-Symmetric Bricard Parallel Mechanism [6.3] 提案手法は3対称のブリカードリンクを再構成可能なヤシとして用いる。
この機構は、再構成可能な手のひら運動に適した、バランスのとれた自由度とリンク構成を実現する。
プロトタイプは一連の把握実験を通じて開発され、安定的で効率的な操作を行う能力を示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:27:49 GMT)
FCN-LLM: Empower LLM for Brain Functional Connectivity Network Understanding via Graph-level Multi-task Instruction Tuning [6.3] 静止状態fMRIから導かれる脳機能接続ネットワークの基礎は、臨床タスクにおいて有望であることが示されている。
既存の方法は、FCNをテキストのモダリティと整列せず、LLMがFCNを直接理解する能力を制限する。
グラフレベルのマルチタスク命令チューニングによってLLMがFCNを理解することができるフレームワークであるFCN-LLMを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:33:08 GMT)
NeuroSCA: Neuro-Symbolic Constraint Abstraction for Smart Contract Hybrid Fuzzing [6.3] ハイブリッドファジィングは、グレイボックスファジィングのスループットとシンボル実行の精度を組み合わせて、深いスマートコントラクトの脆弱性を明らかにする。
本稿では,大言語モデルを意味制約抽象化層として選択的に挿入する軽量フレームワークであるNeuroSCAを提案する。
NeuroSCAはLLMを使用して目標関連制約の小さなコアを特定し、SMTソルバでこの抽象化のみを解決し、具体的な実行を通じてモデルを検証する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:58:51 GMT)
TurkicNLP: An NLP Toolkit for Turkic Languages [6.2] TurkicNLPはPythonライブラリで、トルコ語のための単一の一貫したNLPパイプラインを提供する。
トークン化、形態解析、部分音声タグ付け、依存性解析、名前付きエンティティ認識、双方向スクリプトの文字変換、機械翻訳をカバーしている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:46:23 GMT)
An Open-Source Modular Benchmark for Diffusion-Based Motion Planning in Closed-Loop Autonomous Driving [6.1] 拡散に基づく運動プランナーは、nuPlanのようなベンチマークで最先端の結果を得た。
しかし、クローズドループ生産における自動運転スタックの評価は、まだ明らかにされていない。
両ギャップに対処するオープンソースのモジュラーベンチマークを提示する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:07:35 GMT)
Probabilistic Learning and Generation in Deep Sequence Models [6.1] 確率モデルは、確率の規則で観測されていない変数に関連する不確実性を定量化する。
ベイズ法の主なボトルネックは、特にディープニューラルネットワークに適用された場合、事前仕様と近似品質である。
この論文は、DSMの帰納バイアスを利用して確率的推論や構造を設計し、DSMと確率的モデルの間のギャップを埋める。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:22:52 GMT)
Approximate Nearest Neighbor Search for Modern AI: A Projection-Augmented Graph Approach [6.0] Projection-Augmented Graph (PAG)は、プロジェクションテクニックをグラフインデックスに統合する新しいANNSフレームワークである。
3つのキーコンポーネントは、インデックスと検索を最適化するために、グラフインデックスに設計され、統合されている。
6つの現代的なデータセットの実験により、PAGは、常にQPS(QPS)-リコールパフォーマンスの優れたクエリを達成している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:57:42 GMT)
A Framework for Transparent Reporting of Data Quality Analysis Across the Clinical Electronic Health Record Data Lifecycle [5.9] データ品質(DQ)と二次データの透明性は、臨床AIモデルの採用を遅らせる重要な要因である。
本研究は,臨床電子健康記録(EHR)データライフサイクルにおけるDQアセスメントの透過的報告のための枠組みを開発する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:48:46 GMT)
A Study on Building Efficient Zero-Shot Relation Extraction Models [5.8] 本研究では,既存のゼロショット関係抽出モデルが現実的な抽出シナリオに適応する際のロバスト性について検討する。
いくつかの最先端のツールを適応させ、この困難な環境でそれらを比較します。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:44:31 GMT)
StegoNGP: 3D Cryptographic Steganography using Instant-NGP [5.8] Instant-NGP(StegoNGP)を用いた新しい3次元暗号ステレオグラフィーを提案する。
ハッシュレベルにまたがる複数の独立鍵を割り当てる拡張型マルチキースキームを導入する。
実験の結果,StegoNGPは高い知覚力と安全性で,高品質な3Dシーンを隠蔽できることがわかった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 06:41:33 GMT)
Qayyem: A Real-time Platform for Scoring Proficiency of Arabic Essays [5.4] アラビア語 AES をサポートするために設計された Web ベースのプラットフォーム Qayyem を紹介する。
Qayyemは、アサイン作成、バッチエッセイアップロード、スコアリング設定、トレーダごとのエッセイ評価のための統合ワークフローを提供する。
このプラットフォームは、さまざまな有効性と効率の数字で評価されたモデルを評価する、最先端のアラビア語エッセイを多数展開している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 09:26:47 GMT)
Clawdrain: Exploiting Tool-Calling Chains for Stealthy Token Exhaustion in OpenClaw Agents [5.3] 我々は、マルチターン「セグメンテッド検証プロトコル」を誘導するトロヤ化スキルであるClawdrainを設計、実装、評価する。
良質なベースライン上での6-7倍のトークン増幅を計測し、コストのかかる障害構成を約9倍に設定する。
我々は、SKILL.mdプロンプト肥大、持続的なツール出力汚染、cron/heartbeat周波数増幅、行動インジェクションを含むOpenClawのアーキテクチャによって実現されたプロダクションベクターを同定する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:49:05 GMT)
Fed-ADE: Adaptive Learning Rate for Federated Post-adaptation under Distribution Shift [5.1] デプロイ後設定におけるフェデレーテッドラーニング(FL)は、地味なラベルにアクセスすることなく、異種クライアントをまたいだ非定常データストリームに適応する必要がある。
本稿では,分散ダイナミクスの軽量な推定器を利用する非教師付き適応フレームワークであるFed-ADEを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:38:43 GMT)
SHIELD8-UAV: Sequential 8-bit Hardware Implementation of a Precision-Aware 1D-F-CNN for Low-Energy UAV Acoustic Detection and Temporal Tracking [5.0] ShiELD8-UAV (ShielD8-UAV) は、高精度1D機能駆動CNNアクセラレータのシーケンシャルな8ビットハードウェア実装である。
この設計は共有マルチ精度データパス上で層単位で実行し、複製された処理要素を不要にする。
その結果、逐次実行と高精度量子化とシリアライズ対応プルーニングを組み合わせることで、実用的な低エネルギーエッジ推論が可能となった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:09:15 GMT)
Open-Vocabulary vs Supervised Learning Methods for Post-Disaster Visual Scene Understanding [4.9] 本稿では,教師付き学習モデルとオープンボキャブラリ視覚モデルの比較評価を行った。
FloodNet+、RescueNet、DFire、LADDなど、複数のデータセットにわたるセマンティックセグメンテーションとオブジェクト検出に重点を置いています。
評価されたベンチマークでもっとも注目すべき点は、教師付きトレーニングが最も信頼できるアプローチであることだ。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 23:50:08 GMT)
Contextual Invertible World Models: A Neuro-Symbolic Agentic Framework for Colorectal Cancer Drug Response [4.8] 精度オンコロジーは現在、小さなN、大きなPパラドックスによって制限されている。
このギャップを埋めるニューロシンボリックエージェントフレームワークを提案する。
われわれのフレームワークは、癌研究における説明可能なAIへの透明で生物学的に根ざした道を提供する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:15:58 GMT)
Agents Learn Their Runtime: Interpreter Persistence as Training-Time Semantics [4.8] 本稿では、部分的に観測可能な最適化タスクの手続き的に生成されたファミリーであるOpaque Knapsackを紹介する。
各トレースモデル上で同一ベースモデル(Qwen3-8B)を微調整し,4つの列車・列車の組み合わせについて評価した。
ステートレスランタイムの永続的トレーニングモデルは、約80%のエピソードでエラーを発生させる; 永続的ランタイムのステートレストレーニングモデルは、約3.5倍のトークンを使用して、状態を冗長に再帰する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:08:02 GMT)
PaReGTA: An LLM-based EHR Data Encoding Approach to Capture Temporal Information [4.8] PaReGTAは、縦方向のEHRイベントを、明示的な時間的手がかりを持つ訪問レベルのテンプレートテキストに変換する。
文埋め込みモデルの軽量なコントラスト微調整により、ドメイン適応型の訪問埋め込みを学習する。
ハイブリッド時間プールを用いた固定次元患者表現への訪問埋め込みを集約する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:04:03 GMT)
Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning [4.7] この章は、K-16以上の学年における科学リテラシー向上における生成AIの可能性について考察する。
最初は、AIが科学を変えたことを含む、AI時代の科学リテラシーを定義することから始まる。
そして、科学知識と推論の教え、学習、評価に一貫性をもたらすことによって、AIが問題解決を支援するために必要なアーキテクチャのタイプについて議論する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 19:45:20 GMT)
Analytic Cancellation of Interference Terms and Closed-Form 1-Mode Marginals in Canonical Boson Sampling [4.7] CBSにおける正確な1モードの辺り分布を,$mathcalORR時間で計算可能な直接ボトムアップで導出する。
この物理導出をランク1行列の数学的理論で明示的にブリッジし、多光子干渉が因子的束縛因子によってスケールされた対称性に還元されることを証明した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:26:35 GMT)
Characterizing VLA Models: Identifying the Action Generation Bottleneck for Edge AI Architectures [4.6] VLA(Vision-Language-Action)モデルは、ロボット工学や最先端のAIに不可欠なワークロードの新たなクラスである。
本稿では,Nvidia Jetson OrinとThorの2世代のエッジハードウェア上でのVLA性能を特徴付ける。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 01:09:55 GMT)
Artificial Superintelligence May be Useless: Equilibria in the Economy of Multiple AI Agents [4.3] 本稿では、商品・サービス取引の経済ゲームにおいて、人的エージェントやAIエージェントを含むエージェントの経済活動について考察する。
マルコフ連鎖定常分布モデルを用いて, 一連の平衡結果とその対応条件を導出する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 01:24:49 GMT)
Remote state preparation of single-partite high-dimensional states in complex Hilbert spaces [4.1] 高次元量子システムは、量子情報アプリケーションのための新しい遊び場を提供する。
複素ヒルベルト空間における4レベルおよび8レベルの赤道状態を作成するための潜在的に実用的なスキームを提案する。
評価の結果,現在の技術で高次元RSPが実現可能である可能性が示唆された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 23:49:32 GMT)
SimAB: Simulating A/B Tests with Persona-Conditioned AI Agents for Rapid Design Evaluation [3.6] 我々は、ペルソナ条件のAIエージェントを用いた高速なプライバシー保護シミュレーションとしてA/Bテストを再構成するシステムであるSimABを提案する。
デザインのスクリーンショットと変換の目標が与えられたら、SimABはユーザーペルソナを生成し、それらを好みを述べ、結果を集約し、合理性を合成するエージェントとしてデプロイする。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:08:27 GMT)
Grokking as a Phase Transition between Competing Basins: a Singular Learning Theory Approach [3.6] 我々は,長期トレーニング後の記憶から一般化への急激な移行であるグルーキングについて検討した。
我々は、競合する近ゼロロス溶液流域間の相転移として、二次ネットワークにおけるグラッキングを解釈する。
我々はモジュラー演算タスクで訓練された二次ネットワークにおいてLLCの閉形式式を導出し、それに対応する経験的検証を行う。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:23:29 GMT)
Knowledge without Wisdom: Measuring Misalignment between LLMs and Intended Impact [3.4] LLMはますますAIベンチマークに長けているが、ダウンストリームタスクの妥当性を保証するものではない。
本研究では,学童の指導・学習のアウト・オブ・ディストリビューション・タスクを用いた指導基盤モデルの性能評価を行った。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:05:46 GMT)
HyperKKL: Enabling Non-Autonomous State Estimation through Dynamic Weight Conditioning [3.3] HyperKKLは非自律非線形システムのための新しい学習手法である。
現在のKKLオブザーバの学習に基づく近似は、主に自律システムのために設計されている。
HyperKKLは、入力信号をエンコードしてKKLオブザーバのパラメータを瞬時に生成するハイパーネットワークアーキテクチャを用いてこの問題に対処する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:07:12 GMT)
UD-SfPNet: An Underwater Descattering Shape-from-Polarization Network for 3D Normal Reconstruction [3.3] 偏光イメージングは、散乱と形状偏光(SfP)3D再構成のユニークな2つの利点を提供する。
本稿では3次元表面正規予測の改善のために偏光キューを利用した水中散乱型偏光ネットワークUD-SfPNetを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:10:36 GMT)
Kernel Methods for Stochastic Dynamical Systems with Application to Koopman Eigenfunctions: Feynman-Kac Representations and RKHS Approximation [3.2] 我々は輸送方程式とクープマン固有関数の統一カーネルフレームワークを微分方程式(SDE)に拡張する。
決定論的条件下では、3つの基底近似-イオン型変分原理が同一の再現カーネルを生み出すことが示されている。
システムにとって、クープマン生成器は二階拡散項を含み、一階双曲輸送方程式を二階楕円-放物PDEに変換する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:44:31 GMT)
Compact Task-Aligned Imitation Learning for Laboratory Automation [3.2] そこで本研究では,小規模基礎モデルを用いた実験室自動化のためのコンパクトな模倣学習フレームワークを提案する。
TVF-DiTは、自己監督型視覚基盤モデルと、コンパクトアダプターを通して視覚言語モデルとを一致させる。
実世界の3つの実験室での試験では、平均成功率は86.6%であった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:51:55 GMT)
Continuum limit of a qubit-regularized SU(3) lattice gauge theory with glueballs [3.2] 簡単なqubit-regularized $mathrmSU(3)$ grid gauge theory on a plaquette chain is admit a continuum limit with massive glueball excitations。
磁場中の3状態量子時計モデルに格子鎖ハミルトンをマッピングすることにより、この理論が短距離で支配される連続極限に調整できることを実証する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:20:45 GMT)
A Deep Learning Framework for Heat Demand Forecasting using Time-Frequency Representations of Decomposed Features [3.0] 本研究では,日頭熱需要予測のための新しいディープラーニングフレームワークを提案する。
連続ウェーブレット変換を需要および外部気象要因に適用することにより、畳み込みニューラルネットワークが階層的時間的特徴を学習することを可能にする。
その結果,平均絶対誤差は最強のベースラインに比べて36%から43%減少した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:40:13 GMT)
Tracking Capabilities for Safer Agents [3.0] ツールを直接呼び出す代わりに、エージェントは機能安全な言語でコードとして意図を表現している。
Scalaの型システムは静的に機能を追跡し、エージェントができることをきめ細かいコントロールを提供する。
実験の結果,エージェントはタスク性能を著しく損なうことなく,機能セーフなコードを生成することができることがわかった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:39:37 GMT)
Intent-Context Synergy Reinforcement Learning for Autonomous UAV Decision-Making in Air Combat [3.0] 本稿では、競合環境における自律型UAV侵入のためのIntent-Context Synergy Reinforcement Learning(ICS-RL)フレームワークを提案する。
LSTMベースのIntent Prediction Moduleは、将来の敵ユニットの軌跡を予測し、決定パラダイムをリアクティブ回避から積極的に計画に変換する。
コンテキスト分析合成機構は、ミッションを階層的なサブタスク(安全なクルーズ、ステルス計画、敵対的なブレークスルー)に分解する
Max-Advantage値に基づく動的スイッチングコントローラはこれらのエージェントをシームレスに統合し、UAVはハードコードされたルールなしで最適なポリシーを適応的に選択できる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:05:32 GMT)
Multi-Level Bidirectional Decoder Interaction for Uncertainty-Aware Breast Ultrasound Analysis [2.8] 乳房超音波検査では,同時性病変の分節と組織分類が必要である。
マルチレベルデコーダインタラクションと不確実性を考慮した適応調整により,これらの制約に対処するマルチタスクフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:02:06 GMT)
Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains [2.7] 本稿では,医療機関抽出のための有限サンプルカバレッジ保証を提供するコンフォメーション予測フレームワークを提案する。
まず,FactScoreをベースとした原子式ステートメント評価により,GPT-4.1を用いて,FDAの医薬品ラベル1000個から構造化されたエンティティを抽出した。
第2に,GPT-4.1とLlama-4-Maverickを用いたRadGraphスキーマを用いてMIMIC-CXRレポートから放射線学的実体を抽出し,医師のアノテーションに対して評価した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 05:12:25 GMT)
RaUF: Learning the Spatial Uncertainty Field of Radar [2.7] ミリ波レーダーは、悪天候に特有の利点を提供するが、空間の忠実度が低く、方位の曖昧さが強く、乱れによって引き起こされる引き起こされるリターンに悩まされる。
本稿では,レーダ計測を物理的に基底とした異方性特性によってモデル化する空間不確実性学習フレームワークであるRaUFを提案する。
相反する特徴-ラベル間のマッピングを解決するために、細粒度不確実性を学ぶ異方性確率モデルを設計する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:10:43 GMT)
Hybrid TD3: Overestimation Bias Analysis and Stable Policy Optimization for Hybrid Action Space [2.4] 本稿では、パラメータ化されたハイブリッドアクション空間を原則的に処理するTD3(Twin Delayed Deep Deterministic Policy Gradient)の拡張であるHybrid TD3を提案する。
我々は,ハイブリッド行動設定における過大評価バイアスの理論的解析を行い,双極的アーキテクチャの下での形式的境界を導出する。
本稿では、離散的な行動分布を極小化して、標準的なクリッピング最小化に等価なバイアス低減を実現する重み付きQ-ラーニングターゲットを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:16:27 GMT)
Efficient Extractive Summarization with MAMBA-Transformer Hybrids for Low-Resource Scenarios [2.3] ハイブリッド抽出要約のための最初のMamba-Transformerを提案する。
我々のアプローチは、強い要約品質を維持しながらコンテキストを保存する。
低リソースシナリオにおけるROUGEの大幅な改善を示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:45:13 GMT)
CelloAI Benchmarks: Toward Repeatable Evaluation of AI Assistants [2.3] 大規模言語モデル(LLM)は、ソフトウェア開発にますます使われている。
LLMベースのコーディング支援のための既存のベンチマークは、高エネルギー物理学と高性能コンピューティングソフトウェアの制約を反映していない。
本稿では,HEP/HPC関連タスクにおけるLLM性能を定量化する,実用的で繰り返し可能なベンチマークを開発する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:16:50 GMT)
Robust Weighted Triangulation of Causal Effects Under Model Uncertainty [2.2] 本研究では,モデル検証可能性法と統計的推論法を組み合わせた因果効果三角測量の枠組みを開発する。
我々は、この距離をゼロにすることができる条件とともに、真の因果効果から関数の距離の有界性を与える。
本フレームワークは,モデル間の合意や単一仕様へのコミットメントを必要とせず,因果的多元性の下で頑健性を定式化する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:09:34 GMT)
Learning to Weigh Waste: A Physics-Informed Multimodal Fusion Framework and Large-Scale Dataset for Commercial and Industrial Applications [2.2] 本稿では,RGB画像と物体寸法,カメラ距離,カメラ高さなどの物理情報メタデータを組み合わせることで,廃棄物の重量を推定するフレームワークを提案する。
また, 物流・リサイクル現場から収集した10,421の同期画像メタデータを実世界のデータセットとして, Waste-Weight-10Kを紹介した。
提案手法は平均絶対誤差(MAE)が88.06kg、平均絶対誤差(MAPE)が6.39%、R2係数が0.9548である。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 05:39:37 GMT)
GroundedSurg: A Multi-Procedure Benchmark for Language-Conditioned Surgical Tool Segmentation [2.0] GroundedSurgは、最初の言語で条件付き、インスタンスレベルの手術的接地ベンチマークである。
データセットは眼科、腹腔鏡、ロボティクス、オープンプロシージャにまたがっており、様々な機器の種類、撮像条件、手術の複雑さを含んでいる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:49:53 GMT)
When Does RL Help Medical VLMs? Disentangling Vision, SFT, and RL Gains [1.9] 強化学習(Reinforcement Learning, RL)は, 医用ビジョンランゲージモデル(VLM)の訓練後, ますます普及している。
RLが医学的視覚的推論を改善するか、あるいは教師付き微調整(SFT)によって既に引き起こされている行動を改善するかは、まだ不明である。
本稿では、視覚、SFT、RLの3つの軸に沿ってこれらの効果を歪める制御された研究について述べる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:16:19 GMT)
Differential privacy representation geometry for medical image analysis [1.8] 医療画像における差分プライバシー(DP)の効果は、通常、エンドツーエンドのパフォーマンスによって評価される。
本稿では,DPを表現空間の構造的変換として解釈するフレームワークであるDP-RGMIについて紹介する。
線形分離性が大部分保存されている場合においても,DPは利用ギャップと一貫して関連していることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:30:36 GMT)
From GEV to ResLogit: Spatially Correlated Discrete Choice Models for Pedestrian Movement Prediction [1.8] 我々は、歩行者の次のステップ選択を、速度調整と方向変更のグリッドによって定義される空間的な離散的な選択として定式化する。
密度の高い高頻度空間選択セットでは、学習に基づく残差補正は、アナリストが指定したGEVネスト構造よりも、近接誘導相関を効果的に捉えることができる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 23:50:33 GMT)
A Decomposition Framework for Certifiably Optimal Orthogonal Sparse PCA [1.8] 我々はtextscGS-SPCA (SPCA with Gram-Schmidt Orthogonalization) と呼ばれる新しいスパース主成分分析アルゴリズムを導入する。
この戦略を取り入れることで、精度と効率のトレードオフのある$varepsilon$-Optimalソリューションを得ることができる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:09:37 GMT)
Quantifying Frontier LLM Capabilities for Container Sandbox Escape [1.6] 大規模言語モデル(LLM)は、コードの実行、ファイルの読み書き、ネットワークへのアクセスといったツールを使用して、自律的なエージェントとして機能するようになっている。
これらのリスクを軽減するため、エージェントは一般的にデプロイされ、独立した"サンドボックス"環境で評価される。
オープンベンチマークであるSANDBOXESCAPEBENCHを導入する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:47:39 GMT)
Where Do Smart Contract Security Analyzers Fall Short? [1.6] 実世界の653のスマートコントラクトに対して,広く利用されている6つのアナライザを評価した。
そして、150人のプロの開発者と監査人を調査して、彼らがこれらのツールをどのように使い、知覚しているかを理解します。
以上の結果から,過度な偽陽性,曖昧な説明,長い分析時間が,実践における信頼と採用の主な障壁であることが明らかとなった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 03:27:05 GMT)
Feature-Weighted Maximum Representative Subsampling [1.6] 本研究では,重みの計算に対する偏りが大きい特徴の影響を最小限に抑えるために,重みを用いたアルゴリズムを開発した。
提案アルゴリズムは,非表現型サンプルと代表型サンプルとを整列させることにより,データセットを除去する最大代表サブサンプリング(MRS)に基づく。
特徴重み付きMSSと呼ばれるこの新しいアルゴリズムは、非常にバイアスの多い機能に重点を置いているため、下流タスクのインスタンスを増やすことができる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 09:47:14 GMT)
Generative AI & Fictionality: How Novels Power Large Language Models [1.5] 我々は、小説が生成AIの出力をどのように形成するかを研究する。
小説は、フィクションの見慣れた特質や余裕を生かし、また社会反応の新たな性質や形態を育んでいる。
現代文化が、生成的AIと機械学習によってますます形作られつつある場合、今日の様々な文化生産様式の分析は、比較的新しい次元である計算訓練データ(Computer Training data)を考慮しなければならない、と我々は主張する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:34:02 GMT)
Modeling and Controlling Deployment Reliability under Temporal Distribution Shift [1.4] 本稿では、信頼性を差別と校正からなる動的状態として扱うデプロイメント中心のフレームワークを提案する。
転がりリトレーニングよりもスムーズな信頼性トラジェクトリを実現することができることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:18:44 GMT)
AMDS: Attack-Aware Multi-Stage Defense System for Network Intrusion Detection with Two-Stage Adaptive Weight Learning [1.4] 本稿では,攻撃固有の検出戦略を学習する攻撃対応多段階防衛フレームワークを提案する。
7種類の敵攻撃型に対する実証分析では、異なる検出シグネチャが示され、2段階適応検出機構が実現された。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 01:27:43 GMT)
Support Tokens, Stability Margins, and a New Foundation for Robust LLMs [1.4] 現代基礎モデルのバックボーンである因果自己注意変換器を再解釈する。
バリア制約が自己アテンションパラメータに現れる。
これにより、注意が不調になる境界が明らかになる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:13:09 GMT)
The Finality Calculator: Analyzing and Quantifying Filecoin's Finality Guarantees [1.3] 正直な参加者が生み出すブロックの可視性のみを必要とする実用的なアルゴリズムを提供する。
典型的な動作条件下では,約30ラウンドで2~30ドルの誤差確率が達成可能であることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:26:52 GMT)
Cross-Modal Guidance for Fast Diffusion-Based Computed Tomography [1.3] 中性子CTのような特定の応用では、単一のスキャンであっても大量の測定値を集めるのが高価である。
この課題を緩和するための1つの戦略は、補完的で容易に利用できる画像モダリティを活用することである。
本稿では,拡散の事前調整を行なわずに追加のモダリティを組み込むことにより,コストのかかるモダリティの高速撮像を可能にすることを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:13:13 GMT)
Adaptive Window Selection for Financial Risk Forecasting [1.1] ブートストラップに基づく適応ウィンドウ選択(BAWS)と呼ばれる,データ駆動型オンライン学習手法を開発した。
BAWSの中心的なコンポーネントは、実現されたスコアと、ブートストラップのアイデアに基づいて評価されるデータ依存しきい値を比較することである。
BAWSは一般に、標準のローリングウインドウ手法と、最近開発された安定性に基づく適応ウインドウ選択法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:42:52 GMT)
Anthropomorphism and Trust in Human-Large Language Model interactions [1.0] 大規模言語モデル(LLM)は日々の生活でますます普及しつつある。
そこで本研究では,2000以上の人間とLLMの相互作用において,LLMに対する信頼度を人為的形態化・属性化するために人々が使用する次元について検討する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:55:58 GMT)
Monocular 3D Object Position Estimation with VLMs for Human-Robot Interaction [1.0] 本研究では3次元座標検出タスクにおける視覚言語モデル(VLM)の対話的能力について検討する。
我々は、10万以上の画像の異種データセットを収集し、カスタムレグレッションヘッドでQLoRAを用いてVLMを微調整した。
以上の結果から,テストセットの中央値13mmのMAEと,より単純なベースラインよりも5倍の精度向上が得られた。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:41:48 GMT)
MultiPUFFIN: A Multimodal Domain-Constrained Foundation Model for Molecular Property Prediction of Small Molecules [0.9] MultiPUFFINは9つの熱物性を同時に予測する。
これは37,968個のユニークな分子(40,904行)のマルチソースデータセットで訓練されている。
ChemBERTa-2(7700万の分子で事前訓練された)と比較して、MultiPUFFINは9つの性質の全てで微調整されたベースラインよりも優れている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 01:18:42 GMT)
GRAD-Former: Gated Robust Attention-based Differential Transformer for Change Detection [0.8] リモートセンシングにおける変化検出(CD)は、異なるタイミングで撮影された衛星画像間の意味的差異を特定することを目的としている。
従来の変換器ベースの手法は、超高解像度(VHR)衛星画像に適用する場合、二次計算の複雑さに悩まされる。
GRAD-Formerは、モデルサイズを小さくすることで効率を保ちながら文脈理解を高める新しいフレームワークである。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:56:42 GMT)
Prefer-DAS: Learning from Local Preferences and Sparse Prompts for Domain Adaptive Segmentation of Electron Microscopy [0.8] Prefer-DASは、自己学習と即席指導によるコントラスト学習を統合した、プロンプト可能なマルチタスクモデルである。
そこで我々は,空間的に異なる人間のフィードバックやスパースフィードバックに適合するプラグアンドプレイソリューションであるLocal Direct Preference Optimization (LPO)とスパースLPOを導入する。
我々のモデルは、ポイントと人間の嗜好の可用性に応じて、弱教師付きDASと非教師付きDASの両方を効果的に実行することができる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:24:32 GMT)
On the Exact Algorithmic Extraction of Finite Tesselations Through Prime Extraction of Minimal Representative Forms [0.8] 本稿では,有限平面格子における正確なテッセルレーションを発見する階層的アルゴリズムを用いる。
グリッドサイズのスケーラビリティを2×2から32×32に評価し,単純な繰り返しタイルの重なり検出が1ms以下の処理時間を示すことを示した。
このアルゴリズムは、正確な軸方向の長方形のテッセルレーションに対して決定論的挙動を提供する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:20:06 GMT)
Feasible Pairings for Decentralized Integral Controllability of Non-Square Systems [0.8] 本稿では,非二乗系の分散積分制御性に対する入力-出力ペアリングの実現可能性について検討する。
この問題の関連性は、従来の産業プロセスを超えて、現代のAI研究にまで及んでいる。
正方行列の概念を導入することにより、これらの正方部分成分の安定性と元の非正方系との基本的なリンクを確立する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:42:26 GMT)
MOSAIC: Modular Opinion Summarization using Aspect Identification and Clustering [0.8] 本稿では,要約を解釈可能なコンポーネントに分解する,産業展開用に設計されたスケーラブルでモジュール化されたフレームワークを提案する。
オンラインA/Bテストによるアプローチの実践的影響を実運用の製品ページで検証し,中間出力を上向きにすることで,顧客エクスペリエンスが向上することを示す。
システムレベルのコンポーネントとして意見クラスタリングを導入し,特にユーザレビューに典型的なノイズや冗長な条件下での信頼度を著しく向上することを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:32:34 GMT)
Random Features for Operator-Valued Kernels: Bridging Kernel Methods and Neural Operators [0.7] 我々は、Tikhonov正則化の先行結果をスペクトル正則化技術の幅広いクラスに拡張する。
また、演算子値のカーネルに設定を一般化する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:49:12 GMT)
VoxKnesset: A Large-Scale Longitudinal Hebrew Speech Dataset for Aging Speaker Modeling [0.7] VoxKnessetは2009-2025年のヘブライ議会演説の2300時間のオープンアクセスデータセットである。
年齢予測と長手条件下での話者検証に現代音声の埋め込みをベンチマークする。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:57:15 GMT)
A level-wise training scheme for learning neural multigrid smoothers with application to integral equations [0.6] 畳み込み型積分方程式は一般に信号処理や画像処理で起こる。
本稿では,従来のスムースラーに代えて,学習したニューラル演算子を代替する新しいニューラル乗法を提案する。
従来のスムーダーとは異なり、これらのオペレータはオフラインでトレーニングされる。トレーニングが終わると、ニューラルスムーダーはリトレーニングなしで新しい右サイドベクターに一般化され、効率的な解法となる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:45:46 GMT)
Extended Empirical Validation of the Explainability Solution Space [0.4] 本研究では,ヘテロジニアスな都市資源配分システムを導入し,ESSフレームワークの汎用性とドメイン依存性を実証する。
結果は、ESSランキングがドメイン固有のものではなく、ガバナンスの役割、リスクプロファイル、ステークホルダの設定に体系的に適応していることを確認します。
この発見は、社会技術システム全体にわたる説明可能なAI戦略設計のための一般的な運用上の意思決定支援手段としてESSを強化した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 19:13:21 GMT)
Extending Adaptive Cruise Control with Machine Learning Intrusion Detection Systems [0.3] アダプティブクルーズコントロール(ACC)システムは、ホスト車両の速度を自動的に調整し、リード車両から安全な後続距離を維持する。
ACCは、カルマンフィルタ(KF)がスムーズなノイズ速度測定を可能にするため、しばしばフォールトインジェクション攻撃に対して耐性があると考えられている。
解析的証明とシミュレーションの結果から,KFは境界しきい値までの射出速度を許容できることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:23:32 GMT)
Insights for an AI Whistleblower Office from 30 Case Studies [0.3] 本稿では、政策立案者がAIホイッスルブロワープログラムの設計を支援することを目的とする。
実験的なアプローチを採り、whiblowersの30のケーススタディのデータセットを組み立てる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 19:49:53 GMT)
MMTA: Multi Membership Temporal Attention for Fine-Grained Stroke Rehabilitation Assessment [0.3] 微粒化再生評価のための高分解能時間変換器MMTA(Multi-Membership Temporal Attention)を提案する。
MMTAはビデオとウェアラブルの両方のIMU入力を統合された単一ステージアーキテクチャでサポートする。
一貫してGlobal Attention Transformerを改良し、StrokeRehabのEdit Scoreを+1.3(ビデオ)+1.6(IMU)で強化し、50Saladsを+3.3で改善した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 02:57:03 GMT)
A Comparative Study of UMAP and Other Dimensionality Reduction Methods [0.3] 一様多様体近似と射影 (Uniform Manifold Approximation and Projection, UMAP) は次元減少のための多様体学習手法である。
本稿では, UMAP, 教師付き UMAP, およびいくつかの競合する次元減少法について検討する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:37:29 GMT)
On Utility-optimal Entanglement Routing in Quantum Networks [0.1] 量子ネットワークは、距離を越えて量子情報の信頼性の高い分散と操作を可能にすることを想定している。
本研究では,達成可能なネットワークユーティリティに対応する最適経路を特定することを目的とする。
私たちの研究は、古典的なフローベースとサービス対応ルーティングの概念を量子ネットワークに拡張するためのフレームワークを提供します。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:32:32 GMT)
Multilingual Hate Speech Detection and Counterspeech Generation: A Comprehensive Survey and Practical Guide [0.1] 本稿では,多言語ヘイトスピーチ検出と対音声生成のための包括的調査と実践的ガイドを提案する。
非英語とコード混在の文脈でモノリンガルシステムが失敗する理由を分析し、暗黙の憎しみと文化的に特有の表現を欠いている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:26:53 GMT)
XAI-enhanced Comparative Opinion Mining via Aspect-based Scoring and Semantic Reasoning [0.0] XComは2つの主要なモジュール、すなわちアスペクトベースの評価予測と(ii)意味分析に分離された拡張トランスフォーマーベースのモデルである。
XComはまた、モデルの熟考的決定に対する解釈可能な洞察を提供するために、Shapley付加的な説明モジュールも組み込んでいる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:17:03 GMT)
When Does Margin Clamping Affect Training Variance? Dataset-Dependent Effects in Contrastive Forward-Forward Learning [0.0] コントラストフォワード(Contrastive Forward-Forward, CFF)学習は、教師付きコントラスト目標に対して、ビジョントランスフォーマーを層別に層状化する。
比較損失における正対辺のマージンは、類似度クランプの飽和により適用される。
対数確率の後にマージンを減じる別の定式化が、平均-上-正の還元の下で勾配ニュートラルであることを証明する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:00:38 GMT)
The logic of KM belief update is contained in the logic of AGM belief revision [0.0] 我々は、$mathcal L_KM$のすべての公理が$mathcal L_AGM$の定理であることを示す。
KM の強いバージョンでは、$mathcal L_KM$ と $mathcal L_AGM$ の違いを1つの公理に絞り込むことができる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:06:26 GMT)
The Impact of Battery Cell Configuration on Electric Vehicle Performance: An XGBoost-Based Classification with SHAP Interpretability [0.0] 現在の文献では、バッテリー構成と電気自動車の性能の複雑な非線形関係をしばしば見落としている。
本研究では,EV加速性能を高(=4.0秒),中(4.0~7.0秒),低(>7.0秒)に分類する機械学習フレームワークを提案する。
分析の結果,電池の容量の増加は最初は送電量を増加させるが,その質量と複雑さは結果として性能を低下させることがわかった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:08:30 GMT)
The Art of Generative Narrativity [0.0] 生成AIは、聴衆の経験を通じて物語を引用する可能性を持つ非言語形式の実験につながる。
5つの中央セクションにおいて,現代言語自動化の課題を予見し,その根底にある概念的枠組みを考察する。
閉会の節では、これらの模範者の表現的特徴を要約し、生成的AIの文化的影響と失敗を批判的に評価する価値を下記する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:58:24 GMT)
Super-resolution of turbulent reacting flows on complex meshes using graph neural networks [0.0] 最先端のディープラーニングモデルは、乱流の粗い粒度データから小さな構造を再構築するために広く利用されている。
本研究では、グラフニューラルネットワーク(GNN)の固有の柔軟性を活用し、複雑なメッシュ上の低分解能データから未解決の小規模構造を再構築する手法を開発する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 12:53:14 GMT)
Self-Anchoring Calibration Drift in Large Language Models: How Multi-Turn Conversations Reshape Model Confidence [0.0] 自己調整条件ドリフト (SACD) は、大規模言語モデルにおいて、マルチターン会話をまたいだ事前出力を反復的に構築する際に、表現された自信の体系的な変化を示すという仮説的な傾向である。
我々は, 1ターンベースライン(A), マルチターンセルフアンチョリング(B), 独立反復制御(C)の3条件を用いて, 事実領域, 技術領域, オープンエンド領域にまたがる150の質問に対して, Claude Sonnet 4.6, Gemini 3.1 Pro, GPT-5.2を比較した。
その結果、事前登録された仮説から部分的に分岐する複雑なモデル不均一パターンが明らかとなった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 19:27:52 GMT)
Scaling of learning time for high dimensional inputs [0.0] ニューラルネットワークモデルでは、各ニューロンへの入力数によって、モデルの複雑さが増大する。
このトレードオフの正確な特徴は、人工ネットワークや生物学的ネットワークで観測される接続性と学習時間を説明するのに役立つだろう。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:51:18 GMT)
SMR-Net:Robot Snap Detection Based on Multi-Scale Features and Self-Attention Network [0.0] 従来のビジュアルメソッドは、複雑なシナリオを扱う際に、ロバスト性や大きなローカライゼーションエラーに悩まされる。
本稿では,自己注意型マルチスケールオブジェクト検出アルゴリズムであるSMR-Netを提案する。
A型スナップデータセットとB型スナップデータセットの実験結果は、SMR-Netが従来のFaster R-CNNを大きく上回っていることを示している。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 10:28:01 GMT)
Reasoning or Rationalization? The Role of Justifications in Masked Diffusion Models for Fact Verification [0.0] マスケ拡散言語モデル(Masked Diffusion Language Models)は、トークンを逐次生成し、推論に先立って答える戦略の恩恵を受ける。
拡散過程の早い段階でMDLMは検証に収束し, 正当化が完了する前に解決される大域的アンカーとして扱う。
実験の結果、このモデルは56%のケースで誤った強制判断を合理化しており、判定は正当性に強く依存していることが明らかとなった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:18:05 GMT)
ReCoN-Ipsundrum: An Inspectable Recurrent Persistence Loop Agent with Affect-Coupled Control and Mechanism-Linked Consciousness Indicator Assays [0.0] ハンフリーのイプスンドラム仮説に触発され、ReCoN-イプスンドラムを実装した。
我々はハンフリーの準友愛を、親しみやすい制御された景観と重複する経路選択として運用する。
非有効変種は新規性に敏感である。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:17:53 GMT)
Quantum Monte Carlo in Classical Phase Space with the Wigner-Kirkwood Commutation Function. II. Diagonal Approximation in Position Space [0.0] ウィグナー・カークウッド可換関数は運動量上で近似され、積分され、位置配置空間における実函数を与える。
モンテカルロ大都市圏のコンピュータシミュレーションの結果は、液体レナード=ジョーンズに対して与えられる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 23:35:08 GMT)
QSpy: A Quantum RAT for Circuit Spying and IP Theft [0.0] QSpyは、トランジット中の量子回路をインターセプトできる最初の概念実証トロイの木馬である。
遮断された量子回路はリモートサーバに転送され、それらを分類、保存、分析することができることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 06:47:30 GMT)
Prompt Sensitivity and Answer Consistency of Small Open-Source Large Language Models on Clinical Question Answering: Implications for Low-Resource Healthcare Deployment [0.0] 小規模のオープンソース言語モデルは、低リソースのヘルスケア設定に注目されているが、異なるプロンプトのフレーズの下での信頼性はいまだによく分かっていない。
我々は,3つの臨床QAデータセットを対象とした5つのオープンソースモデル(Gemma 2 2B, Phi-3 Mini 3.8B, Llama 3.2 3B, Mistral 7B, Meditron-7B)を評価した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 04:37:48 GMT)
Predicting Multi-Drug Resistance in Bacterial Isolates Through Performance Comparison and LIME-based Interpretation of Classification Models [0.0] 本研究では,細菌由来の多剤耐性(MDR)を予測するための解釈可能な機械学習フレームワークを提案する。
ロジスティック回帰、ランダムフォレスト、AdaBoost、XGBoost、LightGBMの5つの分類モデルが評価された。
アンサンブルモデル、特にXGBoostとLightGBMは、すべてのメトリクスに対して優れた予測能力を示した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:11:25 GMT)
Power Network SCADA Quantum Communications: A Comparison of BB84, B92, E91, and SGS04 Quantum Key Distribution Protocols [0.0] 量子鍵分散(QKD)は、量子通信におけるサイバーセキュリティパラダイムの重要な部分である。
本研究は,BB84,E91,B92,SARG04暗号プロトコルの利用を評価する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:31:28 GMT)
PARWiS: Winner determination under shoestring budgets using active pairwise comparisons [0.0] PARWiSアルゴリズムは、スペクトルランキングと破壊的なペア選択を示し、靴磨き予算の下で最高のアイテムを識別する。
この研究は、文脈変種(Contextual PARWiS)と強化学習に基づく変種(RL PARWiS)でPARWiSを拡張した。
その結果、PARWiSとRL PARWiSは全てのデータセットでベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 16:21:31 GMT)
PARCER as an Operational Contract to Reduce Variance, Cost, and Risk in LLM Systems [0.0] 本稿では,これらの制限に対する工学的対応としてPARCERを提案する。
このフレームワークはYAMLの宣言的な"運用契約"として機能し、インタラクションをバージョン付きおよび実行可能なアーティファクトに変換する。
本研究の目的は、PARCERの概念的および技術的アーキテクチャを提示することであり、シンプルな「プロンプトエンジニアリング」から「統制可能なガバナンスを伴うコンテキストエンジニアリング」へ、必要な移行として位置づけることである。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 01:11:53 GMT)
PAC Guarantees for Reinforcement Learning: Sample Complexity, Coverage, and Structure [0.0] ほぼすべてのPACサンプルの複雑さを3つの要因に分解するCoverage-Objective-Structure(CSO)フレームワークを提案する。
CSOは定理ではなく、ボトルネックを特定し、クロスセット比較を即座に行う解釈テンプレートである。
我々は、CSO座標でインデックス付けされたレート・ルックアップ・テーブル、ベルマン残差診断、配置ゲートによるカバレッジ推定、エポソードごとのポリシー証明書を提供する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 22:33:16 GMT)
Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy [0.0] 2026 フォーミュラ1の技術的な規制はエネルギー戦略に根本的な変化をもたらす。
最適エネルギー配置ポリシーは、運転者自身の状態だけでなく、ライバル車の隠れ状態にも依存する。
抽出可能な2層推論および決定フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:48:16 GMT)
On the Practical Feasibility of Harvest-Now, Decrypt-Later Attacks [0.0] Harvest-now, decrypt-later (HN-DL)攻撃は、量子コンピュータが鍵交換を壊すまでテキストをアーカイブすることで今日の通信を脅かす。
本稿では,HN-DLを経済問題として再編成し,TLS 1.2,TLS 1.3,QUIC,Secure Shell(SSH)にまたがる対向コストを定量化する。
ストレージオーバーヘッドと量子ワークロードの2つの独立したコスト軸に沿って動作するプロトコル構成戦略を評価する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:04:05 GMT)
Nonlocality distillation can outperform entanglement distillation [0.0] 共有状態のコピー数に制限がある場合には、ベル状態を生成することにより絡み込み蒸留が動作することが保証される。
少数の状態コピーでは, 最適な絡み合い蒸留では通信が必要であるが, 非局所蒸留ではCHSH値が高いことが示されている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 06:18:30 GMT)
Navigating Time's Possibilities: Plausible Counterfactual Explanations for Multivariate Time-Series Forecast through Genetic Algorithms [0.0] 本稿では,時系列分析と予測の文脈における対実的学習の新たな手法を提案する。
提案手法は, 遺伝的アルゴリズムと厳密な因果性試験を統合して, 反実的依存関係を推測し, 検証する。
本研究では,実世界のデータに対するアルゴリズムの性能評価を行い,複雑な因果関係を扱えることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 01:08:20 GMT)
Multipartite parity bounds and total correlation [0.0] 本稿では、テンソル積ヒルベルト空間上の局所自己随伴収縮の和から形成される多部可観測について研究する。
積状態しきい値を超える観測可能な期待値の過剰さは、必ずしも一定の量の総相関を持つことが示される。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 13:45:33 GMT)
Multipartite device-independent quantum key distribution using W states [0.0] W状態で多部デバイス独立量子鍵分布(DI-QKD)が可能であることを示す。
単一光子干渉を用いた長距離多部DI-QKDプロトコルを提案する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 06:00:23 GMT)
Measuring Bell non-locality in the presence of signaling [0.0] 本稿では,ベル非局所性の定量化手法を提案する。
この課題は、観測された相関関係の局所的および真に非局所的成分への最適凸分解を見つけることを減らす。
非局所性の概念を非符号的体制を超えて拡張することにより、我々のフレームワークは物理学における実験分析の基礎をつくりだすことができる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 08:25:57 GMT)
Learning with the Nash-Sutcliffe loss [0.0] 平均$L_textNS$を最小化することによって推定される多次元モデルであるNash-Sutcliffe線形回帰を導入する。
提案手法は,大容量データセットにおける$textNSE$ベースのモデル推定と予測評価のための決定論的基盤を確立する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:43:28 GMT)
Learning Quantum Data Distribution via Chaotic Quantum Diffusion Model [0.0] 本稿では,カオス的ハミルトン時間進化を通じて投影されたアンサンブルを生成するフレームワークを提案する。
この方法は、トレーニング性とロバスト性を改善し、量子生成モデルの適用性を広げる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:27:23 GMT)
Large Language Models are Algorithmically Blind [0.0] 大規模言語モデル (LLM) は目覚ましい知識を示すが、計算過程を推論する能力はいまだによく分かっていない。
大規模アルゴリズムの実行から得られた地中真理に対して,8つのフロンティアLSMを評価し,系統的,ほぼ完全に失敗することを確認した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:33:09 GMT)
Intermodal entanglement in a quantum optical model of HHG due to the back-action on the driving field [0.0] 特別な量子特性を持つ非古典的な光の合成は、量子技術にとって不可欠である。
本研究では,実効量子光学モデルにおける異なる高調波間の絡み合いについて理論的に検討する。
絡み合いは、しばしば無視されるバックアクションの結果生じる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 23:05:05 GMT)
Information-Theoretic Framework for Self-Adapting Model Predictive Controllers [0.0] モデル予測制御(MPC)は無人航空機(UAV)のような自律システムにとって重要な技術である
MPCは、動的障害やシフトシステムダイナミクスといったリアルタイムな変化に適応するのに苦労する。
本稿では,IDT(Information Digital Twin)による適応性を考慮した情報理論フレームワークを提案する。
IDTは、入力間の情報フロー、制御アクション、UAV動作を監視し、定量化する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:44:02 GMT)
Improved MambdaBDA Framework for Robust Building Damage Assessment Across Disaster Domains [0.0] 3つのモジュールコンポーネントで,ChangeMambaアーキテクチャのBDAネットワークであるMambaBDAを改善した。
我々は,xBD,パキスタン洪水,トルコ地震,Ida Hurricaneなど,複数の衛星画像データセットを実験した。
提案されたモジュール拡張により、ベースラインモデルよりも一貫した改善が得られ、ドメイン内でパフォーマンスが0.8%から5%向上し、目に見えない災害で最大27%向上した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 14:00:53 GMT)
Implementation of Licensed Plate Detection and Noise Removal in Image Processing [0.0] 自動車ナンバープレート認識技術は、自動ナンバープレート認識、自動車両識別、自動車ナンバープレート認識、自動車用光学文字認識としても知られている。
自動車ナンバープレート認識システムは、電子駐車支払いシステム、高速道路料金支払いシステム、交通監視システム、警察機関のツールとして実装することができる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 09:54:49 GMT)
HELMLAB: An Analytical, Data-Driven Color Space for Perceptual Distance in UI Design Systems [0.0] HELMLABはUI設計システムのための72パラメータ分析カラー空間である。
COMBVDデータセット(3,813色対)上で、HELMLABは、CIEDE2000 (29.18)から20.2%削減した23.30のSSTRESSを達成する。
ガミュートマッピング,デザイントーケンエクスポート,ダーク/ライトモード適応ユーティリティは,Webおよびモバイルデザインシステムで使用するために組み込まれている。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 11:39:07 GMT)
GeMi: A Graph-based, Multimodal Recommendation System for Narrative Scroll Paintings [0.0] グラフニューラルネットワーク(GNN)ベースのレコメンデーションシステムは、レコメンデーションシステムの特別なクラスである。
本研究では,フィールド研究から収集した新しいデータセットに基づいて,GNNに基づくレコメンデーションシステムの設計について述べる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 00:54:26 GMT)
From Feature-Based Models to Generative AI: Validity Evidence for Constructed Response Scoring [0.0] 我々は,人間の評価,特徴に基づく自然言語処理AIスコアリングエンジン,生成AIを用いたスコアリングシステムに必要な妥当性証拠を比較した。
生成AIコンテキストで必要となる証拠は、透明性の欠如や一貫性などの生成AIに固有の懸念があるため、機能ベースのスコアリングコンテキストよりも広い。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 23:21:18 GMT)
Data-Free PINNs for Compressible Flows: Mitigating Spectral Bias and Gradient Pathologies via Mach-Guided Scaling and Hybrid Convolutions [0.0] 本稿では,圧縮不能なインビシッドフローを解くことができる完全データフリーな物理情報ニューラルネットワーク(PINN)を提案する。
提案するフレームワークは,参照データなしで離弓衝撃を捕捉する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 09:04:18 GMT)
Bounding the classical cost of simulating quantum behaviors in the prepare-and-measure scenario [0.0] 我々は、アリスが量子システムをボブに送信し、量子測定を行う準備と測定のシナリオについて研究する。
通信コストを平均1.89ドルビットに削減できることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 20:18:43 GMT)
Beyond Reward: A Bounded Measure of Agent Environment Coupling [0.0] 両予測可能性 (P) は, 観測, 行動, 結果ループにおける共有情報の合計情報に対する比率として導入する。
補助モニタであるIDT(Information Digital Twin)は、インタラクションストリームからPとその診断コンポーネントを演算する。
我々は,MuJoCo HalfCheetahのSACおよびPPO剤を8剤,環境側摂動を168試験で評価した。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 21:38:39 GMT)
Agent-Based Simulation of Trust Development in Human-Robot Teams: An Empirically-Validated Framework [0.0] NetLogo 6.4.0で実装されたこのモデルは、複雑さの異なるタスクを実行する2--10エージェントのチームをシミュレートする。
信頼非対称性比は0.07から0.55の範囲で、メタ分析の1.50よりも低い。
オープンソース実装は、デプロイ前にオーバートラストとアントラスト条件を特定するエビデンスベースのツールを提供する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 17:05:28 GMT)
Agency and Architectural Limits: Why Optimization-Based Systems Cannot Be Norm-Responsive [0.0] AIシステムは、標準によって管理されるという前提の下で、ハイステークな状況にますますデプロイされている。
本稿では,最適化システムに対して仮定が正式に無効であることを示す。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 18:44:49 GMT)
AWE: Adaptive Agents for Dynamic Web Penetration Testing [0.0] AWEは、自動Web侵入テストのためのメモリ拡張マルチエージェントフレームワークである。
軽量なLLMオーケストレーション層に、構造化された脆弱性固有の分析パイプラインを組み込む。
AWEはインジェクションクラスの脆弱性を大幅に向上させる。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 07:32:42 GMT)
A high-performance quantum memory for quantum interconnects [0.0] 量子メモリを包括的に定量化するために、量子相互接続率を導入する。
我々は,3つの必須基準を同時に統合した高性能量子メモリを実演する。
1分で1000kmリピータリンク上の3.56ビットの量子情報の分布を推定する。
論文参考訳(メタデータ) (Sun, 01 Mar 2026 15:40:47 GMT)