Making Training-Free Diffusion Segmentors Scale with the Generative Power [118.7] 一連の研究は、事前学習された拡散モデルを、それ以上の訓練をせずに意味的セグメンテーションに適応することに焦点を当てている。
本稿では,自動アグリゲーションと画素単位の再スケーリングという2つの手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:51:00 GMT)
DiffWind: Physics-Informed Differentiable Modeling of Wind-Driven Object Dynamics [97.6] DiffWindは、風と物体の相互作用、ビデオベースモデリング、フォワードシミュレーションを統一する物理インフォーム可能なフレームワークである。
提案手法は,再現精度とシミュレーション忠実度の両方において,従来の動的シーンモデリング手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:41:24 GMT)
InternVL-U: Democratizing Unified Multimodal Models for Understanding, Reasoning, Generation and Editing [87.5] InternVL-Uは、マルチモーダル理解と推論機能を民主化する軽量な4BパラメータUMMである。
MLLM(Multimodal Large Language Model)と特殊なMMDiTベースのビジュアルジェネレーションヘッドを統合している。
BAGEL (14B) など,さまざまな生成タスクや編集タスクにおいて,3倍以上のスケールで統一ベースラインモデルを上回るパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:38:33 GMT)
A Survey of Weight Space Learning: Understanding, Representation, and Generation [87.3] 重み空間学習は、神経重みを分析とモデリングのための意味のある領域として扱う。
本稿では,既存の手法を,重み空間理解,重み空間表現,重み空間生成の3つの基本次元に分類する。
これらの開発によって、モデル検索、連続的および連合的学習、ニューラルアーキテクチャサーチ、データフリー再構築など、実用的な応用が可能となることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:32:23 GMT)
Implicit Geometry Representations for Vision-and-Language Navigation from Web Videos [87.2] 本稿では,Web ベースのルームツアービデオから派生した大規模ビデオ教育フレームワークを提案する。
既存のデータセットとは異なり、我々のフレームワークは3Dで再構成されたオープンエンドな記述リッチな軌跡とアクションリッチな軌跡を統合している。
この研究の鍵となる拡張は暗黙の幾何学的表現の取り込みであり、それは、脆弱な3D再構成を必要とせず、RGBフレームから直接空間的手がかりを抽出するものである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:47:38 GMT)
Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control [86.6] 我々は、最適制御として推論を定式化し、推論時に潜在状態に対して有限水平LQR計画を行うテスト時間制御層を導入する。
アーキテクチャ層として最適制御を組み込むことは、テスト時間トレーニングを超えた推論のための効果的でスケーラブルなメカニズムを提供することを実証する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:42:13 GMT)
ReMix: Reinforcement routing for mixtures of LoRAs in LLM finetuning [85.4] 低ランクアダプタ(LoRAs)は、トレーニング可能な低ランク行列をトレーニング済みモデルに注入し、新しいタスクに適応するパラメータ効率の微調整技術である。
既存のMixture-of-LoRAsルータは学習したルーティングウェイトを各LoRAに割り当て、ルータのエンドツーエンドのトレーニングを可能にする。
Reinforcement Routing for Mixture-of-LoRAs (ReMix) と呼ばれる新しいルータを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:51:27 GMT)
Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation [82.0] 投機的復号化は、特定のドメインに対してターゲットモデルを微調整する場合、性能劣化に悩まされる。
単純な解決策は、コストがかかり非効率な、すべてのターゲットモデルのドラフトモデルをトレーニングすることです。
EDA(Efficient Draft Adaptation)と呼ばれるパラメータとデータ効率のフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:35:58 GMT)
Robotic Scene Cloning:Advancing Zero-Shot Robotic Scene Adaptation in Manipulation via Visual Prompt Editing [76.1] 本稿では,既存のロボット操作軌跡を編集し,シーン固有の適応を目的とした新しい手法であるロボットシーンクローニング(RSC)を提案する。
RSCは、視覚的プロンプト機構と注意深く調整された条件注入モジュールを活用することにより、正確でシーン一貫性のあるサンプル生成を実現する。
シミュレーションおよび実世界の様々な環境における実験により、RCCはターゲット環境におけるポリシーの一般化を著しく促進することが示された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:21:25 GMT)
Social-R1: Towards Human-like Social Reasoning in LLMs [74.3] 我々は、人間のような社会知性を育むためには、ショートカットソリューションに抵抗する挑戦的なケースでのトレーニングが必要であると論じる。
モデル推論と人間の認知を多次元報酬で整合させる強化学習フレームワークSocial-R1を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:26:24 GMT)
Mousse: Rectifying the Geometry of Muon with Curvature-Aware Preconditioning [72.6] スペクトル最適化の最近の進歩、特にムーンは、スティーフェル多様体への更新ステップの制限が、トレーニングと改善を著しく加速することを示した。
我々は、この「利他的」制約は、曲率スペクトルが非常に重く、不調であることが知られているディープニューラルネットワークに最適であると主張している。
textbfShampoo の textbfStruct を利用した textbfMousse (textbfMuon textbfOptimization textbfUtilizing textbfShampoo's textbfStruct を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:03:49 GMT)
Dance2Hesitate: A Multi-Modal Dataset of Dancer-Taught Hesitancy for Understandable Robot Motion [71.8] ロボットとロボットのコラボレーションにおいて、ロボットは、人間の協調戦略、注意配分、安全に関する判断を形作る重要な要素である。
我々は,マルチモーダルなダンサー生成型ヘシタントモーションデータセットを導入,オープンソース化する。
このデータセットは、(i)フランカ・エミカ・パンダで、固定開始設定から3段階のヘシタシーレベルを有する固定目標(ジェンガタワー)に到達する体育的な指導デモを含む。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:59:27 GMT)
Decoupling Reasoning and Confidence: Resurrecting Calibration in Reinforcement Learning from Verifiable Rewards [71.2] Reinforcement Learning from Verifiable Rewards (RLVR) は、大きな言語モデル(LLM)推論を著しく強化するが、校正劣化に苦しむ。
推論と校正の目的を体系的に分離するフレームワークであるDCPOを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:47:59 GMT)
Better Bounds for the Distributed Experts Problem [69.9] 我々は分散専門家の問題を調査し、$n$の専門家が$s$サーバに分散して$T$タイムステップを提供する。
約$Rgtrsimfrac1sqrtTcdottextpolylog(nsT)$, using $mathcalOleft(fracnR2+fracsR2right)cdotmax(s1-2/p, 1)cdottextpolylog(nsT)$
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:17:34 GMT)
Improving Search Agent with One Line of Code [68.6] ツールベースのエージェント強化学習(TARL)は,検索エージェントが外部ツールと対話できるようにトレーニングするための,有望なパラダイムとして登場した。
textbfSearch textbfAgent textbfPolicy textbfOptimization (textbfSAPO)を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:07:39 GMT)
Deep Expert Injection for Anchoring Retinal VLMs with Domain-Specific Knowledge [66.7] LVLM(Large Vision Language Models)は、眼科における自動診断の可能性を秘めている。
彼らの臨床展開は、ドメイン固有の知識の欠如によって著しく妨げられている。
EyExInは、Deep Expert Injectionメカニズムを通じて専門知識で網膜VLMを固定するように設計されたフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:28:24 GMT)
Rotation Equivariant Mamba for Vision Tasks [66.3] 視覚タスクのための第1回回転同変視覚マンバアーキテクチャであるEQ-VMambaを紹介する。
EQ-VMambaは,非等価なベースラインに比べて,優れた,あるいは競争的な性能を発揮することを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:22:33 GMT)
DIVE: Scaling Diversity in Agentic Task Synthesis for Generalizable Tool Use [66.0] DIVEデータ(48k SFT + 3.2k RL)上のQwen3-8Bのトレーニングは、9OODベンチマークで+22ポイント向上し、+68で最強の8Bベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:54:23 GMT)
Do What I Say: A Spoken Prompt Dataset for Instruction-Following [64.7] DoWhatISay (DOWIS) は、人間の音声と文字によるプロンプトのデータセットである。
5つのスタイルで、タスク言語ペアごとに10のプロンプト変種を提供する。
DOWISを用いて最先端のSLLMをベンチマークし、即時モダリティ、スタイル、言語、タスクタイプ間の相互作用を分析する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:39:46 GMT)
OOD-MMSafe: Advancing MLLM Safety from Harmful Intent to Hidden Consequences [64.0] 現在の安全パラダイムは、主に悪意のある意図や状況違反をターゲットとしている。
我々は,自律型および実施型エージェントのロバスト展開に不可欠なパラダイムである,結果駆動型安全に向けた安全フロンティアのシフトを提案する。
本稿では,トークンレベルの自己蒸留報酬の動的参照として,モデル固有の推論を統合したCASPO(Consequence-Aware Safety Policy Optimization)フレームワークを開発する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:16:43 GMT)
More than the Sum: Panorama-Language Models for Adverse Omni-Scenes [64.0] 既存の視覚言語モデル(VLM)はピンホール画像用に調整され、複数の視野の狭い入力を縫い合わせ、完全な全シーン理解を組み立てる。
本稿では,Panorama-Language Modeling (PLM) パラダイムについて紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:19:50 GMT)
ID-LoRA: Identity-Driven Audio-Video Personalization with In-Context LoRA [64.0] 既存のビデオパーソナライズ手法は、視覚的類似性を保ちながら、ビデオとオーディオを別々に扱う。
被験者の外観と音声を1つのモデルで共同生成するID-LoRAを提案する。
人間の嗜好研究において、ID-LoRA は Kling 2.6 Pro よりも 73% のアノテータが音声に類似し、65% が話し方で好まれる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:23:36 GMT)
RecThinker: An Agentic Framework for Tool-Augmented Reasoning in Recommendation [63.7] RecThinkerはツール拡張推論を推奨するエージェントフレームワークである。
我々はRecThinker専用のツール群を開発し、モデルがユーザアイテム側および協調的な情報を取得することを可能にする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:07:17 GMT)
EXPLORE-Bench: Egocentric Scene Prediction with Long-Horizon Reasoning [63.0] 本研究では,多モーダルな言語モデルが,エゴセントリックな視点から行動の長期的物理的帰結を確実に推論できるかどうかを考察する。
EXPLORE-Benchは,様々なシナリオにまたがる実の1人称ビデオから算出したベンチマークである。
プロプライエタリでオープンソースのMLLMの実験では、人間にとって大きなパフォーマンスギャップが示される。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:33:44 GMT)
A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight [61.2] textitAirPulseは、26グラムの蝶にインスパイアされたロボットで、このスケールで尾のない二翼プラットフォームのために、初めてオンボードでクローズドループ制御飛行を行う。
蝶の飛行における重要な生体力学的特性を再現し、低アスペクト比、炭素繊維強化翼の適合性、および特徴的な生物学的身体の起伏を再現する低周波の羽ばたきを利用する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:38:51 GMT)
Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval [59.3] RF-Memは、親しみやすい不確実性誘導デュアルパスメモリレトリバーである。
それは、人間のようなデュアルプロセス認識をレトリバーに埋め込む。
一定の予算とレイテンシの制約の下で、ワンショット検索とフルコンテキスト推論を一貫して上回る。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:31:44 GMT)
See, Plan, Rewind: Progress-Aware Vision-Language-Action Models for Robust Robotic Manipulation [59.1] 本稿では,See, Plan, Rewind (SPR)について紹介する。
SPRは、現在の状態と今後のマイルストーンを見て、次の2Dウェイポイントに向けて軌道を計画し、障害時に回復可能な状態に戻すという、継続的なコアサイクルを通じて運用される。
SPRは、OpenVLA-OFTとUniVLAを上回る最小のパフォーマンス低下で最先端のロバスト性を達成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:22:51 GMT)
Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation [58.2] 我々は,世界力学を暗黙的に理解したVLAモデルを実現するシンプルなアプローチであるPri4Rを紹介する。
Pri4Rは3Dトラックを予測する軽量なポイントトラックヘッドでVLAを強化している。
3Dポイントトラック予測は,アクションワールドダイナミクスを学習するための効果的な監視対象であることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:11:00 GMT)
Training-free Motion Factorization for Compositional Video Generation [57.8] 複雑な動きを3つの主要カテゴリに分解する運動因子化フレームワークを提案する。
本フレームワークは,実世界のベンチマークにおいて,動作合成における印象的な性能を実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:27:48 GMT)
What is Missing? Explaining Neurons Activated by Absent Concepts [57.0] XAIは、ディープニューラルネットワーク(DNN)の動作に関する人間解釈可能な洞察を提供することを目指している
既存の研究において、この因果構造はしばしば、概念の存在がニューロンの強い活性化と関連している関係を含む。
ほとんど見過ごされがちな因果関係は、概念の欠如が神経活動を増加させるエンコードされた欠如であることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:21:52 GMT)
EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation [56.8] EvoDriveVLAは、新しい協調認識計画フレームワークである。
自己認識の知覚的制約とオラクル誘導軌道最適化を統合している。
EvoDriveVLAはオープンループ評価におけるSOTA性能を実現し,クローズドループ評価における性能を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:19:07 GMT)
SPAR-K: Scheduled Periodic Alternating Early Exit for Spoken Language Models [56.5] インターリーブ音声言語モデル(SLM)はテキストと音声トークンを交互に生成するが、ステップ毎にフルトランスフォーマー深さでの復号はコストがかかる。
SPAR-Kは、知覚品質を維持しつつ、インターリーブされたSLM推論を高速化するために設計されたモダリティ対応早期終了フレームワークである。
我々は,4つのデータセットにまたがるステップAudio-2-mini と GLM-4-Voice を用いて,推論,事実QA,対話タスクを対象とするフレームワークの評価を行った。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:39:03 GMT)
Calibration-Reasoning Framework for Descriptive Speech Quality Assessment [55.5] 本稿では,多次元推論のための基礎的大規模言語モデルに適したポストトレーニング手法を提案する。
多次元のQuariSpeechベンチマークで0.71の平均PCCスコアが得られた。
我々の細かいGRPO報酬は、時間内にオーディオアーティファクトを特定・分類するモデルの能力を大幅に向上させます。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:14:17 GMT)
Prune Redundancy, Preserve Essence: Vision Token Compression in VLMs via Synergistic Importance-Diversity [55.0] 視覚言語モデル(VLM)は、過剰な視覚トークンの生成によって引き起こされる計算の非効率性に直面する。
2段階パイプラインを特徴とする訓練不要なSynergistic Importance-DiversityアプローチPruneSIDを提案する。
LLaVA-NeXTでは11.1%のトークン保持率で96.3%の精度、極端な圧縮速度(5.6%)で92.8%の精度を実現した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:31:58 GMT)
Unlocking High-Fidelity Analog Joint Source-Channel Coding on Standard Digital Transceivers [54.8] D2AJSCCは、標準デジタルPHY上に高忠実度アナログJ SCCをデプロイできる新しいフレームワークである。
本システムは,SNR条件にまたがる優雅な劣化を伴って,ほぼ理想のアナログJ SCC性能を実現する。
ハードウェア変更なしにレガシーインフラストラクチャ上で次世代のセマンティックトランスミッションを可能にすることで,ネットワークの持続的進化を促進する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:42:23 GMT)
TopoOR: A Unified Topological Scene Representation for the Operating Room [54.5] 手術シーングラフは外科手術室(OR)の複雑さを実体の構造とその関連性に抽象化する。
マルチモーダルな手術室を高次構造としてモデル化する新しいパラダイムであるTopoORを紹介する。
また,多様体の構造やモジュラリティに特有な特徴を明示的に保存する高次アテンション機構を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:19:42 GMT)
MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents [54.5] エンボディモデルが強力になるにつれ、人間は将来、職場や自宅で複数のエンボディAIエージェントと協力するようになる。
既存の課題には、ビデオ形式で個々の感覚入力を効果的に圧縮し、伝達することが含まれる。
われわれはまず,複数のエンボディエージェントから同時に収集された複数のロングホライズン・エゴセントリックなビデオを理解するという,新しい問題を正式に定義する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:48:35 GMT)
InfiniteDance: Scalable 3D Dance Generation Towards in-the-wild Generalization [54.5] この研究は、データとモデル設計の両方をスケールアップすることで、一般化可能な3Dダンス生成のフロンティアを推し進めることを目的としている。
モノクロ映像から高忠実度3Dダンスモーションを再構成する完全自動パイプラインを開発した。
既設の再建工法では, 足の接触や幾何学的制約によって誘導される足の復元拡散モデル(FRDM)を導入する。
未知の音楽条件下でのロバスト性を高めるため,レファレンスとしてレファレンスダンスを注入する検索拡張生成モジュール(RAG)を統合する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:10:34 GMT)
Sim2Act: Robust Simulation-to-Decision Learning via Adversarial Calibration and Group-Relative Perturbation [54.3] シミュレーションと意思決定の学習は、現実世界の展開を危険にさらすことなく、デジタル環境で安全なポリシートレーニングを可能にする。
既存のアプローチでは、平均的なシミュレーションの忠実さを改善するか、保守的な正規化を採用するかに重点を置いている。
提案するSim2Actは,シミュレータとポリシーのロバスト性の両方に対処するロバストなシミュレーション・トゥ・意思決定フレームワークである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:51:47 GMT)
OpenClaw-RL: Train Any Agent Simply by Talking [54.1] 次状態信号は普遍的であり、ポリシーはそれらすべてから同時に学習することができる。
個人的な会話、端末の実行、GUIインタラクション、SWEタスク、ツールコールトレースは、別個のトレーニング問題ではない。
OpenClaw-RLは、エージェントを単に使用することで改善し、ユーザのリクエリ、修正、明示的なフィードバックから会話信号を復元する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:59:01 GMT)
ReCoSplat: Autoregressive Feed-Forward Gaussian Splatting Using Render-and-Compare [53.2] 本稿では,自動回帰フィードフォワードガウススプラッティングモデルであるReCoSplatについて述べる。
コードと事前訓練されたモデルがリリースされる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:58:08 GMT)
ZeroWBC: Learning Natural Visuomotor Humanoid Control Directly from Human Egocentric Video [52.8] 我々は、人間中心のビデオから直接、自然なヒューマノイドビジュモータ制御ポリシーを学ぶ新しいフレームワークであるZeroWBCを紹介した。
提案手法はまず視覚言語モデル(VLM)を微調整し,テキスト命令とエゴセントリックな視覚コンテキストに基づく将来の身体全体の動作を予測する。
ユニツリーG1ヒューマノイドロボットの実験では,動作の自然性と汎用性において,本手法がベースラインアプローチより優れていることが示された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:19:43 GMT)
GSStream: 3D Gaussian Splatting based Volumetric Scene Streaming System [52.7] 3DGSデータフォーマットをサポートする新しいボリュームシーンストリーミングシステムであるGSStreamを提案する。
GSStreamは協調的なビューポート予測モジュールを統合し、ユーザの将来の振る舞いをより正確に予測する。
提案するGSStreamシステムは,視覚的品質とネットワーク使用量において,既存の代表的なボリュームストリーミングシステムより優れている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:25:00 GMT)
SiMPO: Measure Matching for Online Diffusion Reinforcement Learning [52.5] 一般単調関数を持つ拡散RLにおける再重み付けスキームを一般化する,シンプルで統一的なフレームワークであるSiMPOを紹介する。
SiMPOは2段階の測度マッチングレンズを介して拡散RLを再考する。
我々は、負の再重み付けが準最適行動から政策を積極的に反映していることを示す幾何学的解釈を提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:01:13 GMT)
Overview of the TREC 2025 Retrieval Augmented Generation (RAG) Track [52.1] TREC Retrieval Augmented Generation (RAG) トラックの第2版では、検索と生成を統合するシステムの研究が進められている。
2024年の最初のトラックの基盤として、今年の課題は、長い多文のナラティブクエリの導入である。
参加者は、透明性と事実的根拠を確保しながら、検索と生成を組み合わせたパイプラインを設計する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:49:18 GMT)
ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization [51.9] ToolRosettaは、オープンソースのコードリポジトリとAPIを自動的にMPP互換のツールに変換するフレームワークである。
ユーザタスクが与えられた場合、ToolRosettaはツールチェーンを自律的に計画し、関連するツールチェーンを特定し、実行可能なMPPサービスに変換する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:19:43 GMT)
Timer-S1: A Billion-Scale Time Series Foundation Model with Serial Scaling [51.8] 我々は、Timer-S1、強力なMixture-of-Experts(MoE)時系列基礎モデル、合計8.3Bのパラメータ、各トークンの0.75Bのアクティブパラメータ、コンテキスト長11.5Kについて紹介する。
既存のトレーニング済み時系列基盤モデルのスケーラビリティボトルネックを克服するため,シリアルスケーリングを3次元で実施する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:16:21 GMT)
CREATE: Testing LLMs for Associative Creativity [51.6] 創造的連想的推論のためのモデルの能力を評価するためのベンチマークであるCREATEを紹介する。
最強のモデルが他のモデルよりも高い創造性を達成することを示す。
私たちの結果は、高いトークン予算であっても、思考モデルがタスクに対してより効果的であるとは限らないことを示しています。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:58:44 GMT)
ENIGMA-360: An Ego-Exo Dataset for Human Behavior Understanding in Industrial Scenarios [50.5] ENIGMA-360は、実際の産業シナリオで取得された新しいエゴエクソデータセットである。
データセットは、時間的に同期された180エゴセントリックと180エゴセントリックなプロシージャビデオで構成されている。
これらの結果は、実環境において堅牢なエゴエクソ理解が可能な新しいモデルの必要性を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:47:15 GMT)
Streaming Autoregressive Video Generation via Diagonal Distillation [50.1] 自己回帰モデルは、シーケンシャルフレーム合成のための自然なフレームワークを提供するが、高い忠実性を達成するためには重い計算を必要とする。
ビデオチャンクとデノイングステップの時間的情報を活用するために,ダイアゴナル蒸留を提案する。
本手法は,2.61秒(最大31FPS)で5秒ビデオを生成し,未蒸留モデル上で277.3倍のスピードアップを実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:45:24 GMT)
X-GS: An Extensible Open Framework Unifying 3DGS Architectures with Downstream Multimodal Models [50.0] 我々は,リアルタイム3DGSベースのオンラインSLAMを実現するために,幅広い技術を統合するオープンフレームワークであるX-GSを紹介する。
X-GSのコアには、X-GS-Perceiverと呼ばれる高効率なパイプラインがあり、幾何学とポーズを共最適化するための入力として、未提案のRGBビデオストリームを取り込むことができる。
我々は、新しいオンラインベクトル量子化(VQ)モジュール、GPU加速グリッドサンプリング方式、高並列化パイプライン設計によるリアルタイムパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:10:18 GMT)
CORAL: Scalable Multi-Task Robot Learning via LoRA Experts [49.8] 実世界のロボット工学におけるビジョン・ランゲージ・アクション(VLA)モデルは、コアマルチタスク学習の課題を露呈する。
タスク毎に個別の完全なチェックポイントを維持することは、しばしばストレージとデプロイメントの禁止である。
主にマルチタスク干渉を軽減するために設計されたバックボーンおよび非依存のフレームワークであるCORALを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:28:41 GMT)
Speeding Up the Learning of 3D Gaussians with Much Shorter Gaussian Lists [49.7] 画素の描画に使用するガウスリストを短くするために,新たなトレーニング戦略と損失を提案する。
具体的には、各ガウスのスケールを定期的にリセットすることで、各ガウスのサイズを縮小する。
また、アルファブレンディング法にエントロピー制約を導入し、それぞれの線に沿ってガウスの重量分布を鋭くする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:03:44 GMT)
Cross-Hand Latent Representation for Vision-Language-Action Models [49.3] 器用な操作のための信頼性の高い視覚言語アクションモデルを訓練するには、多くのロボットハンドにわたる大規模な実演が必要である。
XL-VLAは視覚・言語・アクション・フレームワークであり,多種多様な手間で共有される潜在行動空間と統合される。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:50:57 GMT)
How Contrastive Decoding Enhances Large Audio Language Models? [49.3] Contrastive Decoding (CD) は,Large Audio Language Models (LALM) の強化に有効であることが証明された。
本研究はLALMアーキテクチャの異なる4つのCD戦略を体系的に評価する。
オーディオ・アウェア・デコーディングとオーディオ・コントラスト・デコーディングを最も効果的な方法として同定する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:05:51 GMT)
When Detectors Forget Forensics: Blocking Semantic Shortcuts for Generalizable AI-Generated Image Detection [48.8] Vision Foundation Models (VFMs, emphe.g., CLIP) は、しばしば目に見えない生成パイプラインを使って生成された画像に一般化するのに苦労する。
textbfGeometric Semantic Decoupling (GSD)を提案する。
GSDはバッチワイズ統計から意味論的方向を推定し、幾何学的制約によってそれらを投影し、アーティファクト検出器は意味論的不変な法医学的証拠に依存するように強制する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:16:35 GMT)
Denoising the US Census: Succinct Block Hierarchical Regression [48.5] 我々は、より正確で一貫した見積もりを生成する新しい後処理手法であるBlueDownを紹介する。
アメリカ合衆国国勢調査局が提案する評価指標に基づいて,郡域の集計値とトラクションレベルの精度を特に高めに改善した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:39:25 GMT)
ProGS: Towards Progressive Coding for 3D Gaussian Splatting [48.5] 本稿では,3DGSデータをオクツリー構造に整理し,効率的なプログレッシブコーディングを実現する手法を提案する。
ProGSは、元の3DGSフォーマットと比較して、ファイルストレージの45倍の削減を実現し、同時にビジュアルパフォーマンスを10%以上改善している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:13:43 GMT)
ICDAR 2025 Competition on End-to-End Document Image Machine Translation Towards Complex Layouts [47.6] 文書画像機械翻訳(DIMT)は、ある言語から別の言語への文書画像に埋め込まれたテキストの翻訳を試みる。
DIMT 2025 Challengeは、エンドツーエンドの文書画像翻訳の研究を推進している。
コンペティションには2つのトラック、OCRフリーとOCRベースがあり、それぞれ小さな(1Bパラメータ未満)用の2つのサブタスクと大きな(1Bパラメータ以上)モデルがある。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:04:38 GMT)
Update-Free On-Policy Steering via Verifiers [47.6] 行動クローニング(BC)は、ロボットが人間の実演を模倣できるようにする最も一般的な方法の1つとなっている。
UF-OPSは,ロボットが動作の成功確率を予測できるアップデートフリーのオンラインステアリング手法である。
シミュレーションと実世界のデータの両方から結果を示し、5つの実タスクにわたる基本方針よりも平均49%の成功率の向上を実現した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:55:52 GMT)
SCALAR: Learning and Composing Skills through LLM Guided Symbolic Planning and Deep RL Grounding [47.4] LMベースのエージェントは、ハイレベルなアクションAPIを与えられた時に優れるが、低レベルな制御に言語を根ざすのに苦労する。
学習スキルライブラリを通じて、LLM計画とRLを結合する双方向フレームワークSCALARを紹介する。
Craftaxでは、SCALARは88.2%のダイヤモンドコレクションを達成し、最高のベースラインよりも1.9倍改善し、以前の手法が完全に失敗する時間の9.1%に到達した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:11:58 GMT)
RbtAct: Rebuttal as Supervision for Actionable Review Feedback Generation [47.3] 多くのAI生成レビューは表面的で不十分な実行可能であり、著者は具体的で実装可能なガイダンスを残さず、この作業が抱えるギャップを動機付けている。
本稿では,行動可能なレビューフィードバック生成を目的としたRbtActを提案し,既存のピアレビューを学習の中心に配置する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:30:55 GMT)
Stepping VLMs onto the Court: Benchmarking Spatial Intelligence in Sports [46.8] スポーツシナリオに合わせた,初の大規模空間情報データセットであるCourtSIを提示する。
CourtSIには100万以上のQAペアが含まれており、空間的計数、距離測定、局所化、関係推論を網羅する全体分類の下で構成されている。
また,厳密な検証を伴う3,686のQAペアからなる高品質評価ベンチマークであるCourtSI-Benchを紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:50:32 GMT)
Memory-Guided View Refinement for Dynamic Human-in-the-loop EQA [45.8] 本稿では、関連性のあるビューリファインメントと選択的メモリアクセプションを結合した学習自由フレームワークを提案する。
DynHiL-EQAは、人間の活動と時間的変化を特徴とする動的サブセットと、時間的に安定な観測を伴う静的サブセットの2つのサブセットを持つ、人間のループ内EQAデータセットである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:51:54 GMT)
Thinking to Recall: How Reasoning Unlocks Parametric Knowledge in LLMs [45.3] 提案手法は,モデルのパラメトリック知識リコールの能力境界を大幅に拡張する。
我々は,幻覚のない事実文を含む推論軌道を優先することで,モデル精度を直接的に向上できることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:59:20 GMT)
UniField: A Unified Field-Aware MRI Enhancement Framework [45.0] methodnameは、複数のモダリティと拡張タスクを統合する統合フレームワークである。
我々は、事前学習した3D基礎モデルを利用して、総合的な3Dボリューム情報を利用する。
我々は,総合的なマルチフィールドMRIデータセットを編成し,公開する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:45:12 GMT)
ESAinsTOD: A Unified End-to-End Schema-Aware Instruction-Tuning Framework for Task-Oriented Dialog Modeling [44.7] タスク指向ダイアログモデリングのためのエンド・ツー・エンド・エンド・エンド・インストラクション・チューニング・フレームワークであるESAinsTODを提案する。
LLM(Large Language Models)を微調整するだけでなく、さまざまな対話タスクフローやスキーマへの柔軟な適応を可能にします。
ESAinsTODは、エンドツーエンドのタスク指向ダイアログモデリングベンチマークにおいて、最先端モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:59:02 GMT)
TableMind++: An Uncertainty-Aware Programmatic Agent for Tool-Augmented Table Reasoning [44.2] テーブル推論は、意味的理解と正確な数値操作を共同で行うモデルを必要とする。
これらの制約に対処するため、我々は以前TableMindをチューニングベースの自律型プログラムエージェントとして提案した。
この基盤をTableMind++に拡張し、新しい不確実性を認識した推論フレームワークを導入しました。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:57:21 GMT)
PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue [43.9] 本稿では,文書レイアウト解析のためのドメイン認識型プロンプタであるPromptDLAを紹介する。
革新的なPromptDLAは、データドメインの特定の属性に基づいてプロンプトをカスタマイズするユニークなドメイン対応プロンプトを備えている。
提案手法はDocLayNet,PubLayNet,M6Doc,D$4$LAにおける最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:30:00 GMT)
Finding and Reactivating Post-Trained LLMs' Hidden Safety Mechanisms [43.2] 本稿では,大規模言語モデル(LLM)の安全性劣化の原因について検討する。
SafeReActと呼ばれる軽量で費用対効果の高いソリューションを提案する。
4種類のLEM実験の結果,提案手法は推論性能を損なうことなく有害なプロンプトの安全性を著しく向上することが示された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:56:23 GMT)
Quantifying and extending the coverage of spatial categorization data sets [43.2] 大規模言語モデル(LLM)によって生成されたラベルは,人間のラベルと比較的よく一致していることを示す。
LLM生成ラベルは,既存の空間データセットにどのシーンや言語を追加するかを決定するのにどう役立つかを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:49:11 GMT)
RA-SSU: Towards Fine-Grained Audio-Visual Learning with Region-Aware Sound Source Understanding [43.0] Region-Aware Sound Source Understanding (RA-SSU) は、地域対応、フレームレベル、高品質な音源理解を実現することを目的としている。
この目標を達成するために、我々は、2つの対応するデータセット、すなわち、細粒度音楽(f-Music)と細粒度ライフセンテ(f-Lifescene)を革新的に構築する。
f-Lifesceneデータセットには61種類のサンプルが6,156個含まれている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:37:55 GMT)
TriFusion-SR: Joint Tri-Modal Medical Image Fusion and SR [42.8] 多モード医用画像融合は相補的構造情報と機能情報を集約することにより包括的診断を容易にする。
既存のアプローチは通常、画像融合と超解像(SR)を別々の段階で実行し、アーティファクトと知覚品質を劣化させる。
本稿では,TriFusionSRを提案する。TriFusionSRはウェーブレット誘導型三モード融合とSRのための条件拡散フレームワークである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:13:40 GMT)
PRISM: Streaming Human Motion Generation with Per-Joint Latent Decomposition [42.4] 既存のモーションオートエンコーダは各フレームを1つのモノリシック潜在ベクトルに圧縮する。
PRISMを提示し、各課題に専用のコントリビューションで対処する。
本研究では,テキスト・ツー・モーション,ポーズ・コンディショニング,自己回帰的逐次生成,ナラティブ・モーション・コンポジションをシームレスに扱う単一動作生成基盤モデルを訓練する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:27:46 GMT)
Hysteretic squashed entanglement in many-body quantum systems [42.1] 多体量子系の絡み合いは空間領域に分散する。
本研究では,二つの領域間の真の量子相関を測る条件付きエンタングルメントである,ヒステリックエンタングルメント$T_sq$を提案する。
我々は、T_sq$が隣接するサブシステムと長距離サブシステムの両方で真の量子相関を検出できることを示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:00:49 GMT)
DUCTILE: Agentic LLM Orchestration of Engineering Analysis in Product Development Practice [42.0] DUCTILEは、エンジニアリング分析タスクのエージェント自動化サポートを開発し、実行し、評価するためのアプローチである。
エージェントは、文書化された設計プラクティスを解釈し、入力データを検査し、処理パスを適応し、エンジニアは最終判断を監督し、実行する。
専門家定義の受け入れ基準と実践エンジニアによるデプロイメントに対する評価は、このアプローチが正しい、方法論的に準拠した結果を生み出すことを確認します。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:00:47 GMT)
Quality over Quantity: Demonstration Curation via Influence Functions for Data-Centric Robot Learning [41.6] 実演データの質は、効果的なデータ駆動型ロボット学習にとって重要なボトルネックである。
データ品質を各トレーニングサンプルの寄与として定義し,検証結果の損失を低減することによって高品質なデータを特定するために,QoQ(Quality over Quantity)を提案する。
シミュレーションと実世界の両方の環境での実験は、QoQが以前のデータ選択方法よりも一貫してポリシー性能を改善していることを示している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:59:59 GMT)
Chain of Event-Centric Causal Thought for Physically Plausible Video Generation [41.5] 物理的に可塑性のビデオ生成(PPVG)は、現実世界の物理現象をモデル化するための有望な道として登場した。
現在のアプローチでは、物理概念をプロンプトに埋め込むために、大きな言語モデルの常識推論能力を活用している。
本稿では,PPVGが因果的に連結され,動的に進化する事象の系列を生成するとみなす。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:13:51 GMT)
Understanding the Interplay between LLMs' Utilisation of Parametric and Contextual Knowledge: A keynote at ECIR 2025 [41.4] 言語モデル(LM)は、トレーニングプロセスからパラメトリック知識を取得し、それを重みに埋め込む。
知識集約型言語理解タスクにこれらの言語モデルを使用する場合、LMは関連するコンテキストを統合する必要がある。
コンフリクト知識は、メモリ内コンフリクトと呼ばれるLMのパラメータにもすでに存在する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:30:21 GMT)
Enhancing Debunking Effectiveness through LLM-based Personality Adaptation [41.3] 本研究では,個別に偽ニュースを拡散するメッセージを生成する新しい手法を提案する。
我々は,大言語モデル (LLMs) と,大五人格の特徴(外転,積極性,良心性,神経性,開放性)に合わせたペルソナに基づくインプットを併用する。
その結果,パーソナライズされたメッセージは一般的なメッセージよりも説得力が高いことがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:44:17 GMT)
Robotic Ultrasound Makes CBCT Alive [40.8] 術中コーンビームCT(CBCT)は,介入計画に不可欠な3次元解剖学的文脈を提供する。
ロボット超音波を動的プロキシとして利用して組織の動きを推論し,静的CBCTスライスをリアルタイムで更新する変形対応CBCT更新フレームワークを提案する。
その結果, リアルタイムのCBCTスライス更新と物理的に妥当な変形推定が可能となり, ロボット超音波による介入による静的CBCT誘導の動的改善が可能となった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:37:24 GMT)
Latent-DARM: Bridging Discrete Diffusion And Autoregressive Models For Reasoning [40.4] DDLM(プランナ)とARM(エグゼクタ)をブリッジする潜在空間通信フレームワークであるLatent-DARMを紹介する。
数学的、科学的、常識的な推論ベンチマーク全体にわたって、Latent-DARMはテキストベースのインターフェースを平均的に上回っている。
Latent-DARMは、トークン予算の2.2%未満を使用しながら、最先端の推論モデルの結果にアプローチする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:45:26 GMT)
Test-time Ego-Exo-centric Adaptation for Action Anticipation via Multi-Label Prototype Growing and Dual-Clue Consistency [40.4] エゴセントリック(エゴ)とエクソセントリック(エクソ)の視点の効率的な適応は、人間とロボットの協調のような応用には不可欠である。
本研究では,テスト期間中にオンラインのソースビュー学習モデルを調整することを目的とした,テスト時間Ego-Exo Adaptation for Action Precipationタスクを初めて検討する。
本稿では,多言語知識を蓄積し,効率的なテストタイムEgo-Exo適応とアクション予測のためのモダリティ間ヒントを統合する,Dual-Clue enhanced Prototype Growing Network (DCPGN)を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:26:50 GMT)
Video-Based Reward Modeling for Computer-Use Agents [40.3] 本研究では,エージェントの内部的推論や行動に依存しないエージェント軌道からのシーケンスのシーケンスを,実行ビデオから得られる報酬モデリングについて検討する。
本稿では,53kの高品質ビデオ・タスク・リワード・トリプルのデータセットであるExecution Video Reward 53k(ExeVR-53k)を紹介する。
これらのコンポーネント上に構築したExecution Video Model (ExeVRM) は,タスク成功を予測するためにユーザ命令とビデオ実行シーケンスのみを必要とする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:17:22 GMT)
4DEquine: Disentangling Motion and Appearance for 4D Equine Reconstruction from Monocular Video [40.2] 本研究では、4次元再構成問題を動的運動再構成と静的外観再構成の2つのサブプロブレムに分離する4DEquineと呼ばれる新しいフレームワークを提案する。
動画からスムーズかつピクセルアライメントなポーズと形状のシーケンスを復元するために,動作を最適化したシンプルな,効果的かつ効果的なトランスフォーマーを導入する。
本研究では,高忠実でアニマタブルな3Dガウスアバターを単一画像から再構成するフィードフォワードネットワークを設計する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:01:10 GMT)
Learning Convex Decomposition via Feature Fields [40.0] 本研究は,長期にわたる凸分解問題に対する特徴場学習による新たな定式化を提案する。
本手法は, 凸体の3次元形状を分解する。
私たちの定式化は、単一形状の最適化に使用できますが、より重要なのは、予測がスケーラブルで自己教師型学習を解放することです。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:07:55 GMT)
TIMID: Time-Dependent Mistake Detection in Videos of Robot Executions [39.8] VADにインスパイアされた新しいアーキテクチャであるTIMIDは、ハイレベルなタスクを実行する際に、ロボットの時間依存ミスを検出することができる。
我々のアーキテクチャは、映像を入力してタスクと潜在的な誤りを通知し、その誤りが存在するかどうかの動画にフレームレベルの予測を返す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:17:34 GMT)
PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs [39.5] 病理MLLMのためのメモリ中心のフレームワークであるPathMemを提案する。
PathMemは、構造化された病理知識を長期記憶(LTM)として整理し、LTMからワーキングメモリ(WM)への動的移行をモデル化するメモリトランスフォーマーを導入する。
PathMemはベンチマークでSOTAのパフォーマンスを達成し、WSI-Benchレポートの生成と、WSIベースの以前のモデルよりも9.7%、そして8.9%向上した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:35:49 GMT)
DISPLAY: Directable Human-Object Interaction Video Generation via Sparse Motion Guidance and Multi-Task Auxiliary [39.4] 本稿では,手首関節座標と形状に依存しない物体境界ボックスのみで構成された,スパース・モーション・ガイダンス(Sparse Motion Guidance)によってガイドされたディスプレーというフレームワークを紹介する。
このようなスパース条件下での忠実性を高めるため,オブジェクトの頑健性を改善するためのオブジェクトストレッシド・アテンション機構を提案する。
総合実験により,本手法は多種多様なタスクにまたがる高忠実かつ制御可能なHOI生成を実現することを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:40:41 GMT)
Reviving ConvNeXt for Efficient Convolutional Diffusion Models [39.3] 本稿では,ConvNeXtに類似したバックボーンを有する完全畳み込み拡散モデル(FCDM)を提案する。
DiT-XL/2のFLOPの50%しか使用せず、FCDM-XLは7$times$と7.5$times$より少ない256$times$256と512$times$512のトレーニングステップで競合性能を達成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:24:30 GMT)
First Estimation of Model Parameters for Neutrino-Induced Nucleon Knockout Using Simulation-Based Inference [39.1] 我々は、MicroBooNEコラボレーションによって開発されたGENIEニュートリノイベントジェネレータのチューニング構成を再検討する。
トレーニングされたSBIアルゴリズムは、調整された断面予測を入力として対向するときに、適度に異なる値を好むことがわかった。
また、トレーニングされたアルゴリズムは、代替ニュートリノ散乱シミュレーションであるNuWroの公平な近似を作成できることがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:14:40 GMT)
Let's Reward Step-by-Step: Step-Aware Contrastive Alignment for Vision-Language Navigation in Continuous Environments [39.0] VLN-CE(Vision-Language Navigation in Continuous Environments)は、長期にわたる人間のインタラクションから複雑な推論を学ぶためのエージェントである。
現在のトレーニングパラダイムは、一般化能力、エラー回復、トレーニング安定性のバランスをとるのに苦労しています。
本稿では,不完全な軌跡から厳密な監視を抽出するためのフレームワークである,ステップアウェアコントラストアライメント(SACA)を紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:45:50 GMT)
MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems [38.4] マルチエージェントシステム(MAS)は複雑な臨床診断支援の可能性を秘めている。
現在のMAS医学研究は、不均一なデータ摂取と一貫性のない視覚的推論評価に悩まされている。
我々は,シームレスなマルチエージェントシステムのための統合フレームワークとベンチマークプラットフォームであるMedMASLabを紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:03:11 GMT)
KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization [37.0] 本稿では,デュアルレベルメモリアーキテクチャを備えたマルチエージェントフレームワークであるKernelSkillを紹介する。
Kernel Levels 1-3では、KernelSkillはTorch Eagerよりも100%の成功率と平均速度5.44xBench、2.82x、1.92xを達成した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:43:38 GMT)
MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning [36.1] 本稿では,サンプルレベルの記憶強度を推定し,アダプティブ間隔でリハーサルをスケジュールし,破滅的な忘れを緩和するエクスペリエンス・リプレイ・フレームワークを提案する。
3つのバックボーンモデルと11のシーケンシャルタスクにわたる大規模な実験は、MSSRが一貫して最先端のリプレイベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:49:44 GMT)
External entropy supply for IoT devices employing a RISC-V Trusted Execution Environment [36.1] RISC-VをベースとしたTrusted Execution Environmentを使用して、IoTデバイス群のための外部エントロピーサービスを作成します。
一度接続されたデバイスは、TEEが支援するサーバから暗号化的に強力なエントロピーを要求できる。
私たちのオープンソース実装は、IoTのための信頼できるエントロピーインフラストラクチャの構築が、オープンなRISC-Vプラットフォーム上で実現可能かつ効果的であることを示しています。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:43:21 GMT)
Design of a Robot-Assisted Chemical Dialysis System [36.1] 我々は,ロボットによる透析システムの設計にユーザ中心のアプローチを採用する。
参加者からのフィードバックを得て、最終システムを開発するための設計要件を改訂する。
化学ウェットラボにおける実際の合成手順へのこのシステムの統合は、科学者の作業負荷を減らすことを期待する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:49:51 GMT)
AR-VLA: True Autoregressive Action Expert for Vision-Language-Action Models [36.0] 本稿では、連続因果配列として行動を生成するスタンドアロンの自己回帰(AR)アクションエキスパートを提案する。
我々の研究は、スケーラブルでコンテキスト対応のアクション生成スキーマを導入し、効果的なロボットポリシーをトレーニングするための堅牢な構造基盤を提供します。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:03:29 GMT)
UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations [35.8] インボディードインテリジェンスでは、ロボットと人間の手の間のエンボディーメントギャップは、人間のデモンストレーションから学ぶ上で大きな課題をもたらします。
動的強化学習アルゴリズムを用いて,ロボットの物理的特性に適合した操作ポリシーを検出する統一フレームワークUniBYDを提案する。
UniBYDを評価するために,多種多様なロボット形態にまたがるクロスボデーメント操作のための最初のベンチマークであるUniManipを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:25:46 GMT)
MUGEN: Evaluating and Improving Multi-audio Understanding of Large Audio-Language Models [35.7] 大規模音声言語モデル(LALM)におけるマルチオーディオ理解の重要性
MUGENは、音声、一般音声、音楽にまたがってこの機能を評価するベンチマークである。
実験により、マルチオーディオ設定における一貫した弱点が明らかとなり、同時音声入力の数が増加するにつれて、性能が急激に低下する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:22:22 GMT)
Towards Unified Multimodal Interleaved Generation via Group Relative Policy Optimization [35.1] 既存の統一モデルにおいて,この能力を解放するための強化学習に基づくポストトレーニング戦略を提案する。
提案手法は,1つの復号軌道内でのテキスト生成と画像生成を共同でモデル化し,新たなハイブリッド報酬で最適化する。
MMIEとInterleavedBenchの実験により,マルチモーダルインターリーブド生成の品質とコヒーレンスを大幅に向上させることが実証された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:49:20 GMT)
VLM-Loc: Localization in Point Cloud Maps via Vision-Language Models [33.7] テキスト・ツー・ポイント・クラウド(T2P)のローカライゼーションは、自然言語記述から3次元ポイント・クラウドマップ内の正確な空間位置を推定することを目的としている。
大規模視覚言語モデルの空間的推論能力を活用するフレームワークであるVLM-Locを提案する。
CityLocの実験では、VLM-Locは最先端の手法に比べて精度と堅牢性に優れていた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:48:25 GMT)
HTMuon: Improving Muon via Heavy-Tailed Spectral Correction [33.7] ムオンの更新規則は重み付け重量の出現を抑制し、トレーニングの方向性を過度に強調する。
事前学習と画像分類の実験により、HTMuonは最先端のベースラインよりも一貫して性能を向上することが示された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:12:24 GMT)
TiPToP: A Modular Open-Vocabulary Planning System for Robotic Manipulation [33.6] TiPToPはマルチステップ操作タスクを解決するモジュールシステムである。
標準のDROIDセットアップで1時間以内にインストールして実行することができる。
シミュレーションおよび実世界における28のテーブルトップ操作タスクについて,TiPToPの評価を行った。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:59:00 GMT)
FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing [33.2] テキストと財務時系列データをペアリングするための意味に基づく多段階ペアリングフレームワークを提案する。
本手法をプロプライエタリかつ慎重にキュレートしたニュースソースに適用すると,高品質なペアリングデータとなり,株価予測性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:53:09 GMT)
Generative Drifting is Secretly Score Matching: a Spectral and Variational Perspective [33.2] ドリフトによる生成モデリングは、カーネルベースのドリフト演算子を通じて最先端のワンステップ画像生成を実現した。
ガウス核の下では、ドリフト作用素はちょうど滑らかな分布のスコア差である。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:30:35 GMT)
Agentic AI as a Network Control-Plane Intelligence Layer for Federated Learning over 6G [32.9] 6Gネットワーク上でのフェデレーション学習を管理するための制御層としてエージェントAIを提案する。
検索、計画、コーディング、評価に焦点を当てた専門エージェントのセットは、クライアントの選択、インセンティブ構造化、スケジューリング、リソース割り当て、適応的なローカルトレーニング、コード生成を扱う。
クローズドループ評価とメモリの使用により、システムは決定を一貫して洗練することができる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:27:33 GMT)
Robust Provably Secure Image Steganography via Latent Iterative Optimization [32.3] 本稿では,遅延空間反復最適化に基づく頑健で確実な画像ステガノグラフィーフレームワークを提案する。
この枠組み内では、受信機は送信された画像を固定参照として扱い、遅延変数を反復的に洗練して再構成誤差を最小化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:29:49 GMT)
Think Twice Before You Write -- an Entropy-based Decoding Strategy to Enhance LLM Reasoning [32.3] デコード戦略は、大きな言語モデルの推論能力を形成する上で、中心的な役割を果たす。
グレディ復号やビームサーチといった従来の手法は、しばしばエラーの伝播に悩まされる。
本稿では,トークンレベルの適応性を世代に導入するエントロピー誘導復号化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:08:26 GMT)
Why Does It Look There? Structured Explanations for Image Classification [31.6] Interpretability to Explainability (I2X)は、構造化されていない解釈可能性から直接構造化された説明を構築するフレームワークである。
I2Xは、異なるモデルアーキテクチャとデータセット間の予測を改善するために使用できることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:15:14 GMT)
From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding [31.5] C2FMAEは粗いマスク付きオートエンコーダで、3つのデータ粒度にわたる階層的な視覚表現を明示的に学習する。
我々は,C2FMAEが画像分類,オブジェクト検出,セマンティックセグメンテーションにおいて顕著な性能向上を実現していることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:51:12 GMT)
Deep Tabular Research via Continual Experience-Driven Execution [31.1] 大規模言語モデルは、しばしば非構造化テーブル上の複雑な長距離分析タスクに苦しむ。
我々は、この課題をDTR(Deep Tabular Research)として定式化し、相互依存テーブル領域に対する多段階推論を必要とする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:42:54 GMT)
Robust Spatiotemporal Motion Planning for Multi-Agent Autonomous Racing via Topological Gap Identification and Accelerated MPC [30.9] 現在の方法は、しばしば厳密なキネマティック制約を単純化または放棄する。
トポロジカル同定と高速化のためのMPCフレームワークを提案する。
連続的なシナリオでは、総操縦時間を51.6%削減する。
密集したボトルネックで81%を超える成功率を維持している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:55:30 GMT)
Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning [30.9] Split Learning (SL) はトレーニングワークロードの大部分をサーバに転送する。
これは、多数のクライアントデバイスが関与している場合、かなりの通信オーバーヘッドを引き起こす。
本稿では適応型チャネルプルーニング支援SL(ACP-SL)方式を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:25:08 GMT)
Temporal limitations and digital data processing in continuous variable measurements of non-Gaussian states [30.5] 本研究では,検出チェーンの時間的性能がトモグラフィーデータの取得と処理に与える影響について検討する。
これにより、これらの特徴が非理想的検出鎖によって観測される量子状態の品質にどのように影響するかを理解することができる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:05:58 GMT)
MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data [30.3] 視覚言語モデルのためのゼロデータ自己進化を実現する最初のRLベースのフレームワークであるMulti-model Multimodal Zero (MM-Zero)を提案する。
MM-Zeroは3つの専門的な役割からなるマルチロールの自己進化型トレーニングフレームワークを導入している。
実験の結果,MM-Zero は様々なマルチモーダルベンチマークにおいて VLM 推論性能を向上させることがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:23:26 GMT)
CLIOPATRA: Extracting Private Information from LLM Insights [30.1] LLMインサイトシステムに対する最初のプライバシ攻撃であるCLIOPATRAを提案する。
Clioが他の最先端モデルで構成されている場合、CLIOPATRAは100%近く到達可能であることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:17:14 GMT)
DT-BEHRT: Disease Trajectory-aware Transformer for Interpretable Patient Representation Learning [29.8] EHR(DT-BEHRT)用疾患軌跡認識変換器
本稿では,臓器内における診断中心の相互作用を明示的にモデル化し,非同期進行パターンを捉えることで,疾患の軌跡を乱すグラフ強化シーケンシャルアーキテクチャを提案する。
複数のベンチマークデータセットの実験では、DT-BEHRTは強い予測性能を示し、臨床医の疾患中心の推論と一致する解釈可能な患者表現を提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:21:40 GMT)
PostTrainBench: Can LLM Agents Automate LLM Post-Training? [29.7] AIエージェントは、この1年で驚くほどソフトウェア工学に精通している。
これらのシステムは、AI研究そのものを自動化する能力を拡張することができるのだろうか?
本稿では,LLMエージェントが有界な計算制約下で自律的に実行できることをベンチマークするためにPostTrainBenchを導入する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:55:40 GMT)
Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search [29.7] 我々は、勾配に基づく最適化を運用するMLEエージェントであるtextscGomeを紹介する。
textscGomeは、MLE-Bench上での最先端の35.1%の医療率を実現し、単一のV100 GPU上では12時間の予算が制限されている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:43:13 GMT)
Operationalizing Perceptions of Agent Gender: Foundations and Guidelines [29.6] 知的エージェントの「ジェンダー」は、コンピュータとの相互作用の研究において、基本的なトピックとして登場した。
エージェント・ジェンダーの知覚を捉える基準は存在しない。
調査の3分の1は操作されたが、エージェントの性別は測定されなかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:15:31 GMT)
BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion [29.5] 言語条件付きローカルナビゲーションでは、ロボットが現在の観測から近くの移動可能な目標位置を推測する必要がある。
本研究では,エゴ中心のBird's-Eye Viewヒートマップを局所境界領域上で予測するBEACONを提案する。
提案手法は,最新画像空間ベースライン上での測地線閾値の平均精度を22.74ポイント向上する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:56:16 GMT)
The Radio-Frequency Transformer for Signal Separation [29.3] 我々は、未知の非ガウス背景/干渉によって汚染された利害信号の推定という、信号分離の問題を研究する。
我々はSOIのための優れた離散トークン化器を学び、次にエントロピー損失でエンドツーエンドのトランスフォーマーを訓練する。
提案手法は,MIT RF Challengeデータセットから実・合成混合物を合成することにより,競争性能が向上する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:22:02 GMT)
Access Over Deception: Fighting Deceptive Patterns through Accessibility [28.5] 我々は、Webコンテンツアクセシビリティガイドラインが、偽りのパターンに対するツールとして機能するか、どのように機能するかを検討する。
本ガイドラインでは、カウントダウンタイマー、オートプレイ、隠れ情報という3つのパターンを識別する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:30:13 GMT)
Think Before You Lie: How Reasoning Improves Honesty [28.5] 推論は、スケールや複数のLLMファミリーに対して、一貫して誠実性を高めている。
本研究では, 入力パラフレーズ, 出力再サンプリング, アクティベーションノイズにより, 誤認識の解答がより容易に不安定化されることを観察する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:52:49 GMT)
ActiveUltraFeedback: Efficient Preference Data Generation using Active Learning [28.2] RLHF(Reinforcement Learning from Human Feedback)は、大規模言語モデル(LLM)の整合の標準となっている。
モジュール型アクティブラーニングパイプラインであるULULTRAFEEDBACKを導入し、不確実性推定を利用してアノテーションに対する最も情報性の高い応答を動的に識別する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:59:50 GMT)
When to Lock Attention: Training-Free KV Control in Video Diffusion [28.0] 本稿では,Ditベースのビデオ拡散モデルに適したトレーニングフリーフレームワークであるKV-Lockを提案する。
KV-Lockは幻覚検出を利用して、キャッシュされたバックグラウンドキー値(KV)と新たに生成されたKVとの融合比とCFGスケールの2つの主要なコンポーネントを動的にスケジュールする。
トレーニングフリーのプラグアンドプレイモジュールとして、KV-Lockは任意のトレーニング済みのDiTベースのモデルに簡単に統合できる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:31:38 GMT)
Improving 3D Foot Motion Reconstruction in Markerless Monocular Human Motion Capture [27.7] 最先端の方法では、Wildのビデオから正確な3Dの人体の動きを復元することができる。
彼らはしばしば、特に足の細かい関節を捉えるのに失敗し、歩行分析やアニメーションなどの応用に欠かせない。
このギャップを既存の人間の回復モデルにより推定された足の動きを洗練させるフットモーションリファインメント法であるフットMRを用いて解決する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:48:14 GMT)
SCENEBench: An Audio Understanding Benchmark Grounded in Assistive and Industrial Use Cases [27.3] SCENEBenchは、背景音の理解、雑音の局所化、言語間音声の理解、発声者認識という4つの現実世界のカテゴリーにまたがる音声理解の幅広い形態をターゲットにしている。
このベンチマークスイートの目的は、発言される単語だけでなく、その発言の仕方や音声の非音声成分を評価することである。
我々は5つの最先端のLALMを評価し、重要なギャップを見出す: タスクによってパフォーマンスが異なり、いくつかのタスクはランダムな確率以下で実行され、他のタスクは高い精度を達成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:15:12 GMT)
Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning [27.2] 乱雑な環境下で,接触によって引き起こされる物体のダイナミクスを学習的に表現することで,政策学習を容易にするフレームワークを提案する。
提案手法は、包括的操作、人的遠隔操作、および事前表現に基づくポリシーを25%以上の成功率で上回る。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:40:30 GMT)
Scalable Training of Mixture-of-Experts Models with Megatron Core [26.9] MOE(Scaling Mixture-of-Experts)トレーニングでは、密集したモデルに欠けているシステムの課題が導入されている。
各トークンは専門家のサブセットのみを活性化するため、このスパーシリティにより、トータルパラメータはトーケン計算よりもはるかに高速に成長できる。
メモリ(微細な再計算,オフロード,通信,計算)の統合最適化により,MoEトレーニングにおけるこれらの課題に対処する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:23:58 GMT)
SODA: Sensitivity-Oriented Dynamic Acceleration for Diffusion Transformer [26.7] 拡散変換器は視覚生成において支配的なパラダイムとなっているが、その低推論効率は依然として重要なボトルネックである。
我々は,微粒化感度に基づいてキャッシングとプルーニングを適応的に行う,感性指向動的加速度法SODAを提案する。
DiT-XL/2、PixArt-$$、OpenSoraの実験では、SODAが制御可能な加速比の下で最先端の生成フィリティを達成することを示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:52:24 GMT)
Progressive Representation Learning for Multimodal Sentiment Analysis with Incomplete Modalities [26.6] マルチモーダル・センティメント・アナリティクスは、テキスト、音響、視覚的手がかりを統合することで人間の感情を推測する。
既存のアプローチでは、すべてのモダリティが完全であるのに対して、現実のアプリケーションは、ノイズやハードウェアの障害、あるいはモダリティの欠如につながるプライバシー制限にしばしば遭遇する。
我々は、不確実なモダリティ条件下でMSA用に設計されたプログレッシブ表現学習フレームワークPRLFを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:45:02 GMT)
Kraken: Higher-order EM Side-Channel Attacks on DNNs in Near and Far Field [26.6] 大規模な機械学習モデルは、モデルを盗むための主要なターゲットである。
本稿では,GPUのコアユニットのパラメータ抽出について述べる。
提案手法はGPUアーキテクチャに適合し,エネルギー消費と効率的な攻撃を正確に推定する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:45:56 GMT)
ES-dLLM: Efficient Inference for Diffusion Large Language Models by Early-Skipping [26.6] 拡散大言語モデル(dLLMs)は、自己回帰モデル(ARMs)に代わる有望な選択肢として浮上している。
我々は、dLLMの生成ダイナミクスを分析し、キー、値、隠された状態を含む中間表現が連続するイテレーション間でのみ微妙に変化することを発見した。
我々は,dLLMのトレーニング不要な推論高速化フレームワークである textbfES-dLLM を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:31:19 GMT)
SPAN-Nav: Generalized Spatial Awareness for Versatile Vision-Language Navigation [26.5] SPAN-Navは、エンボディナビゲーションを普遍的な3次元空間認識に注入するエンド・ツー・エンドの基礎モデルである。
SPAN-Navは、占有予測タスクを通じて、多様なシーンにまたがる空間的先行情報を抽出する。
屋内および屋外の両方の場面をカバーする420万の占有アノテーションの大規模なデータセットを提示する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:59:34 GMT)
Provably Safe Trajectory Generation for Manipulators Under Motion and Environmental Uncertainties [26.4] 本稿では,安全な最適動作計画の必要性に対処する,リスクバウンドな新しい動き計画フレームワークを提案する。
動作不確実性下でのロボットの状態分布を予測するために,剛性マニピュレータ深部クープマン演算子 (RM-DeKO) モデルを統合する。
次に,並列物理シミュレーションとSOS(Sum-of-squares)プログラミングを併用して,衝突リスクのきめ細かい形式的証明を行う,効率的な階層的検証手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:48:48 GMT)
AutoAgent: Evolving Cognition and Elastic Memory Orchestration for Adaptive Agents [26.4] AutoAgentは、認知の進化、オンザフライでのコンテキスト決定、弾力性のあるメモリオーケストレーションに基づく、自己進化型のマルチエージェントフレームワークである。
各エージェントは、ツール、自己能力、同僚の専門知識、タスク知識に関する構造化されたプロンプトレベルの認知を維持する。
AutoAgentは、静的およびメモリ拡張ベースラインに対するタスク成功、ツール使用効率、共同ロバスト性を一貫して改善する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:23:49 GMT)
Reward Prediction with Factorized World States [26.2] 報酬モデルの教師付き学習は、トレーニングデータ固有のバイアスを導入し、新しい目標と環境への一般化を制限する。
本稿では,非構造的観測を言語モデルを用いた階層的オブジェクト属性構造に変換する因子化表現法であるStateFactoryを紹介する。
全体として、StateFactoryによって誘導されるコンパクトな表現構造は、強力な報酬一般化機能を実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:12:20 GMT)
Towards a Neural Debugger for Python [26.0] Python実行上の大きな言語モデルのトレーニングは、それらをコード実行の基盤とします。
これにより、全Pythonプログラムの行ごとの実行予測が可能になる。
開発者は、プログラムをステップバイステップで実行することは滅多にない。代わりに、デバッガを使用して、特定のブレークポイントでの実行を停止し、プログラム変数を検査または修正しながら、関連する部分をステップスルーする。
既存のニューラルインタプリタアプローチには、このようなインタラクティブな制御が欠けている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:47:05 GMT)
SinGeo: Unlock Single Model's Potential for Robust Cross-View Geo-Localization [25.6] SinGeoはシンプルだが強力なフレームワークであり、単一のモデルで堅牢なクロスビューなジオローカライゼーションを実現することができる。
SinGeoは、地上と衛星の両方のブランチにおけるビュー内識別性を向上する二重識別学習アーキテクチャを採用している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:51:52 GMT)
World2Mind: Cognition Toolkit for Allocentric Spatial Reasoning in Foundation Models [25.1] 既存の手法は、3Dグラウンドデータを介して統計的ショートカットを過度に適合させるか、2Dの視覚的知覚に限定される。
トレーニング不要な空間情報ツールキット World2Mind を提案する。
我々はWorld2MindがGPT-5.2のようなフロンティアモデルの性能を5%18%向上させることを示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:12:14 GMT)
FetalAgents: A Multi-Agent System for Fetal Ultrasound Image and Video Analysis [25.1] 包括的胎児US分析のための最初のマルチエージェントシステムであるFetalAgentsを提案する。
軽量でエージェント的な調整フレームワークを通じて、FetalAgentsは専門の視覚専門家を動的に編成し、診断、測定、セグメンテーションのパフォーマンスを最大化する。
さらに、FetalAgentsは、エンドツーエンドのビデオストリームの要約をサポートすることで、静的画像解析を超えて前進する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:37:28 GMT)
Experience Report on the Adaptable Integration of Requirements Engineering Courses into Curricula for Professionals [25.1] 専門職のための3つのSEEカリキュラムの開発およびREコースをそのようなカリキュラムに統合した経験について報告する。
このような統合のための基本的な原則を提案し、私たちが開発してきたコースコンテンツマッピングに焦点をあてた体系的なアプローチについて述べる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:20:02 GMT)
ConfCtrl: Enabling Precise Camera Control in Video Diffusion via Confidence-Aware Interpolation [24.9] ConfCtrlは、カメラ誘導拡散モデルが未確認領域を完了しながら所定のポーズに従うことを可能にする、自信に敏感なビデオフレームワークである。
実験により、ConfCtrlは幾何学的に整合性があり、視覚的に可視性のある新しいビューを生成し、大きな視点変化の下で隠蔽領域を効果的に再構築することを示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:44:48 GMT)
The Costs of Reproducibility in Music Separation Research: a Replication of Band-Split RNN [24.8] この点に関しては、BSRNN(Band-split Recurrent Neural Network)モデルが有望である。
残念ながら、完全なコードが利用できないため、簡単には再生できない。
本稿では,BSRNNを可能な限り再現する試みである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:54:53 GMT)
RiO-DETR: DETR for Real-time Oriented Object Detection [24.7] RiO-DETRは、世界初のリアルタイム指向型検出トランスである。
リアルタイムの効率性を維持しながら、タスクネイティブ設計の問題を解決する。
コードは公開されます。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:25:20 GMT)
EventVGGT: Exploring Cross-Modal Distillation for Consistent Event-based Depth Estimation [24.6] EventVGGTは、イベントストリームをコヒーレントなビデオシーケンスとして明示的にモデル化する、新しいフレームワークである。
既存の手法を一貫して上回り、絶対平均深度を30m以上53%以上下げる。
また、未確認のDENSEとMVSECデータセットに対して、堅牢なゼロショットエラーを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:57:51 GMT)
VIVID-Med: LLM-Supervised Structured Pretraining for Deployable Medical ViTs [24.3] VIVID-Medは,凍結した大言語モデル(LLM)を構造化意味論的教師として活用し,医療用ビジョントランスフォーマー(ViT)を事前訓練する新しいフレームワークである。
VIVID-Medは、臨床所見をUnified MedicalNIST (UMS) を介して検証可能なフィールド状態ペアに翻訳し、応答性を考慮したマスキングを用いて最適化に焦点を当てる。
マクロAUCは0.8588で、500倍少ないデータを使用しながら、BiomedCLIPを+6.65ポイント上回る。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:42:51 GMT)
FrameDiT: Diffusion Transformer with Frame-Level Matrix Attention for Efficient Video Generation [24.1] マトリックス注意(Matrix Attention)は、フレーム全体をマトリックスとして処理するフレームレベルの時間的注意機構である。
我々は、Matrix Attention に基づく DiT アーキテクチャである FrameDiT-G を構築し、さらに、Matrix Attention と Local Factorized Attention を統合して、大小両方の動きをキャプチャする FrameDiT-H を導入する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:28:32 GMT)
Evaluate-as-Action: Self-Evaluated Process Rewards for Retrieval-Augmented Agents [24.1] textscEvalAct (Evaluate-as-Action) は暗黙的な検索品質評価を明示的なアクションに変換する。
textscEvalActは、マルチホップタスクにおいて最も高い平均精度を達成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:22:40 GMT)
Reading, Not Thinking: Understanding and Bridging the Modality Gap When Text Becomes Pixels in Multimodal LLMs [24.0] MLLM(Multimodal large language model)は、画像として表示されるテキストを処理できるが、同じコンテンツがテキストトークンとして提供される場合よりも処理が悪くなることが多い。
我々は,この「モダリティギャップ」を7つのベンチマークを5つの入力モードで評価することにより,系統的に診断する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:14:23 GMT)
From Data Statistics to Feature Geometry: How Correlations Shape Superposition [23.4] 機械的解釈可能性における中心的な考え方は、ニューラルネットワークが次元よりも多くの特徴を表現することである。
重ね合わせは、特徴がスパースで非相関な理想的な設定で研究されている。
重ね合わせは一般に、幾何学的に最小化され、非線形性によってフィルタリングされなければならない干渉を導入するものとして理解される。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:59:02 GMT)
N-gram Injection into Transformers for Dynamic Language Model Adaptation in Handwritten Text Recognition [23.3] 推論時間におけるネットワーク言語モデリングの動的適応のための外部n-gramインジェクション(NGI)を提案する。
本手法では,n-gram言語モデルに切り替えることが可能である。
3つの手書きデータセットの実験により、提案したNGIは、ソースとターゲットコーパス間の性能ギャップを著しく低減することが示された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:16:37 GMT)
OptEMA: Adaptive Exponential Moving Average for Stochastic Optimization with Zero-Noise Optimality [23.3] 我々はOptEMAを導入し、OptEMA-MとOptEMA-Vの2つの新しい変種を分析した。
OptEMA は閉ループであり、その実効的な階段化は軌道依存であり、パラメータ化にリプシッツ定数を必要としないという意味でリプシッツ自由である。
どちらの変種も平均勾配ノルムに対して$widetildemathcalO(T-1/2+1/2 T-1/4)$の雑音適応収束率を得る。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:19:54 GMT)
ZipPIR: High-throughput Single-server PIR without Client-side Storage [22.7] プライベート情報検索 (Private Information Retrieval, PIR) は、クライアントがどの要素にアクセスするかを明らかにすることなく、データベースにプライベートにアクセスできるサービスである。
Ring Learning with Errors (RLWE) に基づく初期のPIRプロトコルは、PIRの実用性を示したが、スループットは限られていた。
本稿では,LWE暗号文をPillier暗号文に圧縮する高スループットPIRプロトコルZipPIRを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:02:02 GMT)
Point Cloud as a Foreign Language for Multi-modal Large Language Model [22.6] SAGEは、トレーニング済みの3Dエンコーダに頼ることなく、生の点雲を直接処理する最初のエンドツーエンドの3D MLLMである。
提案手法では, 幾何サンプリングと近傍凝集とベクトル量子化を組み合わせた軽量な3次元トークン化器を導入し, 点雲を離散トークンに変換する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:22:40 GMT)
Towards Instance Segmentation with Polygon Detection Transformers [22.6] 本稿では,ポリゴン検出変換器(Poly-DETR)を提案する。
検出変換器におけるボックス・トゥ・ポリゴン参照シフトを考慮し、極変形性注意と位置認識訓練方式を提案する。
最先端の極性法と比較すると、Poly-DETRはMS COCOテストデブで4.7mAPの改善を実現している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:18:33 GMT)
SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG [22.0] 生体信号基礎モデル(FM)は様々な臨床予測タスクにおいて有望な性能を示す。
本稿では,同期単葉心電図(ECG)と光胸腺図データを用いた生体信号FMの評価ベンチマークであるSignalMC-MEDを紹介する。
ドメイン固有の生体信号FMは、一般的な時系列モデルより一貫して優れていることがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:32:28 GMT)
PonderLM-3: Adaptive Token-Wise Pondering with Differentiable Masking [21.6] PonderLM-3はトークンワイド・アダプティブ・マイニングのための事前訓練フレームワークである。
純粋に自己管理された目的の下で、追加の計算を選択的に割り当てることを学ぶ。
これは、同じ推測FLOPでより低い事前学習パープレキシティを実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:33:30 GMT)
A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method [21.5] 本稿では,最適化問題を客観的かつ決定論的な非線形等式と不等式制約で解くために,信頼領域内2次計画法(TR-IP-SSQP)を提案する。
本手法は,テストセットであるCutestとロジスティック回帰問題から得られた問題のサブセットに実装し,その実用性能を実証する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:03:33 GMT)
Diagnosing and Repairing Citation Failures in Generative Engine Optimization [21.4] 本稿では,文書の引用に失敗した理由を問う診断手法をGEOに導入する。
我々は,(1)引用パイプラインの異なる段階にまたがる引用障害モードの最初の分類法,(2)エージェントGEO,(2)この分類法を用いて障害を診断するエージェントシステム,(3)文書中心のベンチマークにより,最適化が保留クエリ間で一般化するかどうかを評価する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:25:34 GMT)
$M^2$-Occ: Resilient 3D Semantic Occupancy Prediction for Autonomous Driving with Incomplete Camera Inputs [21.3] M2$-Occは、ビューが欠けているときに幾何学的構造とセマンティックコヒーレンスを保存するために設計されたフレームワークである。
本稿では,nuScenesをベースとしたSurroundOccベンチマークに,系統的欠落ビュー評価プロトコルを導入する。
M2$-OccでIoUを4.93%改善する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:42:56 GMT)
A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic [21.2] アーティキュレート・メディカル・インテリジェンス・エクスプローラー(AMIE)
100人の成人患者が任命の5日前にAMIEテキストチャットのやりとりを完了した。
ヒューマン・セーフティ・スーパーバイザーは、患者とAMIEのインタラクションをリアルタイムで監視した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:32:14 GMT)
IntroSVG: Learning from Rendering Feedback for Text-to-SVG Generation via an Introspective Generator-Critic Framework [21.0] 既存のテキスト間SVG生成法では、最終的なレンダリング画像の視覚的認識は組み込まれていない。
本稿では,イントロスペクティブSVG生成フレームワーク(IntroSVG)を提案する。
提案手法は,いくつかの重要な評価指標にまたがって,最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:44:51 GMT)
OddGridBench: Exposing the Lack of Fine-Grained Visual Discrepancy Sensitivity in Multimodal Large Language Models [21.0] 我々は,MLLMの視差感度を評価するための制御可能なベンチマークであるOddGridBenchを紹介する。
実験の結果、Qwen3-VLやInternVL3.5のようなオープンソースのファミリーや、Gemini-2.5-ProやGPT-5のようなプロプライエタリなシステムを含むすべての評価されたMLLMが、視覚的差分検出において人間のレベルよりもはるかに低い性能を発揮することが明らかになった。
我々は,カリキュラム学習と距離認識報酬を統合した強化学習フレームワークOddGrid-GRPOを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:01:30 GMT)
Rethinking the Harmonic Loss via Non-Euclidean Distance Layers [20.9] クロスエントロピー損失は、ディープニューラルネットワークのトレーニングにおいて、長年にわたって標準選択であった。
調和損失(英: harmonic loss)は、ユークリッド幾何学における距離に基づく代替である。
距離の広いスペクトルを体系的に調べることで、調和損失を抑える。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:51:49 GMT)
Removing the Trigger, Not the Backdoor: Alternative Triggers and Latent Backdoors [20.8] 現在のバックドア防御は、既知のトリガーを中和するとバックドアが取り除かれると仮定している。
我々は、このトリガー中心の視点が不完全であることを示す: インセンティブトリガー、トレーニングトリガーと知覚的に異なるパターン、同じバックドアを確実にアクティベートする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:11:02 GMT)
Routing without Forgetting [20.6] 変換器における連続学習をルーティング問題として再放送する。
タスク固有のプロンプトを格納またはマージする代わりに、RwFはシングルステップの連想検索を通じて動的プロンプトを生成する。
Split-ImageNet-R と Split-ImageNet-S では、RwF は数ショットの学習システムであっても、事前のプロンプトベースのアプローチよりも大きなマージンでパフォーマンスを向上している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:23:46 GMT)
From Ideal to Real: Stable Video Object Removal under Imperfect Conditions [20.3] シャドウフリー,フリックフリー,マスクディフェクト耐性の3つの鍵設計による除去を実現する頑健なフレームワークを提案する。
SVORは、複数のデータセットと劣化したマスクベンチマークにまたがって、最先端の新たな結果を取得する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:07:27 GMT)
Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation [20.1] 我々は,有界合理性とリスク感度の下で一意に滑らかな解が得られるリスク感応性量子応答平衡(RQRE)について検討した。
この結果から,TextttRQRE-OVIは,Nashベースのアプローチに比べて,クロスプレイ時のより堅牢な動作を実現し,セルフプレイ時の競争性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:24:10 GMT)
Model Merging in the Era of Large Language Models: Methods, Applications, and Future Directions [20.0] 本調査は,モデル統合を進めるための構造的基盤を研究者や実践者に提供することを目的としている。
まず、損失ランドスケープ形状、モード接続性、線形モード接続性仮説など、マージの理論的基盤を確立する。
次に、アルゴリズムのランドスケープを体系的にレビューし、平均ウェイト、タスクベクトル算術、スパーシフィケーション強化手法、ミックス・オブ・エキスパートアーキテクチャ、進化的最適化アプローチについて述べる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:31:55 GMT)
Autonomous Search for Sparsely Distributed Visual Phenomena through Environmental Context Modeling [19.8] AUVはサンゴ礁の調査にますます使われているが、特定のサンゴの種を効率的に見つけることは依然として困難である。
我々は、その信号として視覚環境コンテキスト(標的種と共生する傾向がある生息環境特徴)を用いることを提案する。
我々は,アメリカ領ヴァージン諸島セントジョンの2つのサンゴ礁でAUVが収集した実際の画像を用いて,我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:11:34 GMT)
An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse [19.7] タスクレベルのマージ崩壊現象を特定し,特徴付ける。
タスク間の表現的不整合性は、マージ崩壊と強く相関していることを示す。
我々は、次元依存境界を持つ速度歪理論を通じて、この現象に関する理論的説明を提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:18:32 GMT)
OilSAM2: Memory-Augmented SAM2 for Scalable SAR Oil Spill Detection [19.6] OilSAM2は、SARオイル流出監視用に設計されたメモリ拡張セグメンテーションフレームワークである。
OilSAM2は階層的な特徴を意識したマルチスケールメモリバンクを導入し、テクスチャ、構造、セマンティックレベルの表現を明示的にモデル化している。
2つの公開SARオイル流出データセットの実験により、PululSAM2がアートセグメンテーション性能の状態を達成していることが示された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:06:12 GMT)
Progressive Split Mamba: Effective State Space Modelling for Image Restoration [19.5] 最近の状態空間モデル(SSM)は、長距離依存性モデリングの魅力的な線形時間代替を提供する。
PS-Mamba(PS-Mamba)は、局所性保存と効率的なグローバルな伝播を両立させるために設計されたトポロジ対応の階層的状態空間フレームワークである。
超解像、デノイング、JPEGアーティファクトの大幅な削減に関する実験は、最近のMambaベースおよび注目ベースモデルに対して、明確なマージンを持つ一貫した改善を示している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:19:52 GMT)
A Multi-Prototype-Guided Federated Knowledge Distillation Approach in AI-RAN Enabled Multi-Access Edge Computing System [19.5] AI-RAN対応MECシステムにとって有望なアプローチとして、フェデレートラーニングが登場している。
本稿では,MP-FedKDによる多種型誘導型知識蒸留手法を提案する。
提案するMP-FedKD手法は, 精度, 平均精度, 誤差に関する最先端のベースラインよりも優れている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:32:41 GMT)
Property-driven Protein Inverse Folding With Multi-Objective Preference Alignment [19.3] タンパク質配列設計は、ターゲットのバックボーンを回復する能力として定義される設計可能性のバランスをとる必要がある。
既存のアプローチでは、これらの性質をポストホック突然変異、推論時間偏見、またはプロパティ固有のサブセットで再訓練することで解決している。
ProtAlignは,多様な開発目標を満たすために,逆折り畳みモデルを微調整する多目的優先アライメントフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:33:21 GMT)
RESBev: Making BEV Perception More Robust [19.1] センサーの配置や敵攻撃による現実の課題は、深刻な異常を引き起こし、自律運転システムの安全性を損なう可能性がある。
本稿では,既存のBEV認識手法に容易に適用可能なレジリエントでプラグアンドプレイなBEV認識手法であるRESBevを提案する。
RESBevは、様々な外乱や敵攻撃に対する既存のBEV知覚モデルの堅牢性を大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:36:52 GMT)
Does the Question Really Matter? Training-Free Data Selection for Vision-Language SFT [19.0] 視覚インストラクションチューニングは、視覚言語による大規模モデルの改善に不可欠である。
多くのサンプルは、真のクロスモーダルな推論なしで、言語パターンや常識的なショートカットによって解決することができる。
CVSは,高品質なマルチモーダルサンプルに対して,質問を導入することにより,モデルによる回答の有効性の評価が大幅に変化するという知見に基づいて,トレーニング不要なデータ選択手法である。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:23:38 GMT)
PanoAffordanceNet: Towards Holistic Affordance Grounding in 360° Indoor Environments [18.9] 我々は,360度屋内環境におけるホロスティック・アフォーマンス・グラウンディングという新しい課題を紹介した。
このタスクは、等角射影(ERP)からの厳密な幾何学的歪み、意味的分散、大規模アライメント困難など、固有の課題に直面している。
我々は、緯度依存キャリブレーションのためのDASM(Distortion-Aware Spectral Modulator)とOmni-Spherical Densification Head(Omni-Spherical Densification Head)を備えたエンドツーエンドフレームワークであるPanoAffordanceNetを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:58:26 GMT)
MetaDAT: Generalizable Trajectory Prediction via Meta Pre-training and Data-Adaptive Test-Time Updating [18.8] 既存の軌道予測法では, 試験時間における分布変化による性能劣化が顕著である。
高速かつ正確なオンライン適応のための予測器を直接最適化するメタラーニングフレームワークを提案する。
テスト時に、オンライン部分微分とハードサンプル選択に基づいて学習率を動的に調整し、周波数を更新するデータ適応モデル更新機構を導入する。
その結果,提案手法は軌道予測のための最先端の試験時間トレーニング手法を超越し,適応精度が向上することを示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:34:32 GMT)
From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation [18.7] Indicit Likelihood Estimation (IMLE) を用いて条件付きフローマッチングの専門家を高速な単一ステップの学生に蒸留する枠組みを提案する。
双方向のチャンファー距離は、モードカバレッジと忠実度の両方を促進する設定レベルの目的を提供する。
統合認識エンコーダは、さらに多視点RGB、深度、点雲、プロプレセプションを幾何学的認識表現に統合する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:30:05 GMT)
No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space [18.7] 従来の臨床用CMRパイプラインは、シーケンシャルな「再構成・理論分析」パラダイムに依存している。
そこで我々は,k空間データと完全サンプル画像を共有意味多様体に整合させるk空間表現学習フレームワークk-MTRを提案する。
この潜在アライメントにより、アンダーサンプリング周波数から直接、高レベルの生理的意味論を組み込んだ密度の潜伏空間が実現可能であることを実証する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:38:38 GMT)
Degeneracy-Resilient Teach and Repeat for Geometrically Challenging Environments Using FMCW Lidar [18.6] Teach and Repeat(T&R)のトポロジカルナビゲーションにより、ロボットはGPSに頼ることなく、事前に走行した経路を自律的に繰り返すことができる。
本稿では,ドップラー速度に基づくドップラー計測とデジェネリアシー・アウェア・スキャン・トゥ・マップ・ローカライゼーションからなる周波数変調連続波ライダーT&Rナビゲーションシステムを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:57:08 GMT)
WikiCLIP: An Efficient Contrastive Baseline for Open-domain Visual Entity Recognition [18.6] オープンドメインビジュアルエンティティ認識(VER)は、ウィキペディアのような百科事典の知識基盤のエンティティとイメージを関連付けようとする。
VERに適した最近の生成手法は、高い性能を示すが、高い計算コストがかかる。
オープンドメイン VER の強力な,効率的なベースラインを確立するフレームワークである WikiCLIP を紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:18:53 GMT)
SurgFed: Language-guided Multi-Task Federated Learning for Surgical Video Understanding [18.3] SurgFedは、手術シーンのセグメンテーションと深さ推定のためのマルチタスク・フェデレーション学習フレームワークである。
SurgFedには2つの魅力的な設計、すなわちLanguage-guided Channel SelectionとLanguage-guided Hyper Aggregationが使用されている。
SurgFedは、4つの手術タイプにわたる5つの公開データセットにおいて、最先端の手法よりも改善されている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:54:14 GMT)
Relative Localization System Design for SnailBot: A Modular Self-reconfigurable Robot [18.1] このシステムは、ArUcoマーカー認識、光フロー解析、IMUデータ処理を統合融合フレームワークに統合する。
その結果は、モジュール型ロボットシステムにおけるスケーラブルなデプロイメントの可能性を強調している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:44:00 GMT)
Logos: An evolvable reasoning engine for rational molecular design [18.0] 我々は、多段階の論理的推論と厳密な化学的整合性を統合する、コンパクトな分子推論モデルであるLogosを提案する。
複数のベンチマークデータセットにまたがって、Logosは構造的精度と化学的妥当性の両方において高いパフォーマンスを達成する。
Logosは、生成された各構造の基礎となる設計ロジックの人間による検査と評価を可能にする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:56:35 GMT)
From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning [17.8] DICE-RLは、強化学習を用いて事前訓練された生成ロボットポリシーを洗練するフレームワークである。
事前訓練された行動は、オンラインのフィードバックから高精度な行動を強化することで、ハイパフォーマンスな「プロ」ポリシーに転換する。
実験と解析により,DICE-RLは高い安定性と試料効率で性能を確実に向上することが示された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:49:46 GMT)
DuplexCascade: Full-Duplex Speech-to-Speech Dialogue with VAD-Free Cascaded ASR-LLM-TTS Pipeline and Micro-Turn Optimization [17.8] 私たちのキーとなるアイデアは、従来の発話の長めの旋回をチャンク・ターンの相互作用に変換することです。
ターンテイク応答のタイミングを確実に調整するために,一組の対話型特殊制御トークンを導入する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:35:22 GMT)
TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection [17.7] 偽ニュース、非準拠ユーザ、悪意のあるトランザクション、悪意のある投稿など、現実の世界におけるかなりの数の異常ノードは、グラフデータエコシステムの健全性を著しく損なう。
複数のデータドメインにまたがる異常は機能に大きな違いを示すが、クロスドメイン検出モデルは深刻なドメインシフト問題に直面している。
本研究では,グラフ異常検出における領域シフトによって現れる特定の特徴ミスマッチパターンを同定し,定量的に解析する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:30:19 GMT)
Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People [17.6] ソーシャルバーチャルリアリティ(VR)のための大規模言語モデル(LLM)を利用したガイドを開発した。
我々は,視覚障害者16名を対象に,仮想環境における視覚障害者16名を対象に,フェデレートを他のユーザとして用いた。
その結果,参加者は単独でガイドをツールとして扱ったが,他の参加者と相性が良いことがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:56:57 GMT)
Video2LoRA: Unified Semantic-Controlled Video Generation via Per-Reference-Video LoRA [17.6] 意味制御ビデオ生成のためのスケーラブルで汎用的なフレームワークであるVideo2LoRAを提案する。
Video2LoRAは、各セマンティック入力に対してパーソナライズされたLoRA重みを予測するために、軽量なハイパーネットワークを使用する。
モデルは、キースタイルとコンテンツのバリエーションを保持しながら、参照セマンティクスと整合したビデオを生成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:38:21 GMT)
Vision-Augmented On-Track System Identification for Autonomous Racing via Attention-Based Priors and Iterative Neural Correction [17.5] 本稿では,自律走行車のための視覚的かつ反復的なシステム識別フレームワークを提案する。
軽量なCNN(MobileNetV3)は、視覚的な道路テクスチャを連続的な摩擦に変換し、パラメータ最適化のための堅牢な"ウォームスタート"を提供する。
微分自由なNelder-Meadアルゴリズムは、ハイブリッド仮想シミュレーションにより物理的に解釈可能なタイヤパラメータを反復的に抽出する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:12:16 GMT)
Towards Flexible Spectrum Access: Data-Driven Insights into Spectrum Demand [17.4] 本稿では,空間上のスペクトル需要変動を推定するためのデータ駆動手法を提案する。
地理空間分析と機械学習を活用して、カナダにおけるケーススタディに適用する。
提案モデルでは,ある都市部で訓練を行った場合のスペクトル需要の70%を計測し,別の都市部で試験を行った。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:34:16 GMT)
AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation [17.4] 本稿では、人工知能(AI)と機械学習(ML)を活用して、スペクトル需要を推定・管理するデータ駆動型アプローチを提案する。
このアプローチでは、サイトライセンスデータから、クラウドソースデータから派生した、スペクトル需要の複数のプロキシを使用する。
提案されたMLモデルは、カナダの5つの主要都市でテストされ、検証され、その一般化性と堅牢性を示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:11:36 GMT)
A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks [17.4] 本稿では,地理空間データを用いたスペクトル需要予測を目的とした階層分解能グラフアテンションネットワークモデルHR-GATを提案する。
HR-GATはカナダの5大都市でテストされており、8つのベースラインモデルに対してスペクトル需要の予測精度を21%改善している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:20:51 GMT)
Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification [17.4] 分布自由な帰納的設定において表現に基づく一般化境界を確立する。
我々の境界は効率的に計算可能であり、グラフノード分類における経験的一般化と強く相関している。
これは深さ依存的な特徴を与え、深さと一般化誤差の間の非単調な関係を捉える。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:43:18 GMT)
Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning [17.3] 本稿では,汎用的な暗黙報酬機構であるReward-Zeroを紹介する。
自然言語によるタスク記述を、強化学習のための密集した意味的基礎的な進捗信号に変換する。
タスク仕様の埋め込みとエージェントのインタラクションエクスペリエンスから派生した埋め込みを比較することで、Reward-Zeroは連続的に意味的に整合した補完信号を生成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:07:49 GMT)
OmniEarth: A Benchmark for Evaluating Vision-Language Models in Geospatial Tasks [17.3] VLM(Vision-Language Models)は、汎用ドメインタスクにおいて効果的な知覚と推論能力を示す。
実地観測シナリオ下でRSVLMを評価するためのベンチマークであるOmniEarthを紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:22:01 GMT)
TaSR-RAG: Taxonomy-guided Structured Reasoning for Retrieval-Augmented Generation [17.2] textscTaSR-RAGは、エビデンス選択のための分類誘導構造推論フレームワークである。
textscTaSR-RAGは、強いRAGと構造化RAGベースラインを最大14%上回っている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:16:36 GMT)
Extrapolative Quantum Error Mitigation in Continuous-Variable Systems beyond the Training Horizon [17.2] 時間条件のSwin Transformerに基づく外挿量子誤差軽減のためのフレームワークを提案する。
本研究は, CV量子システムにおいて, 総合的なトレーニングデータなしでノイズを緩和する実用的な方法として, 補間QEMを確立した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:49:49 GMT)
A Diffusion Analysis of Policy Gradient for Stochastic Bandits [17.1] 学習率$= O(2/log(n)$で、後悔は$O(k log(k) log(n) / )$である。
我々は、$= O(2)$ でない限り、後悔が線型である、対数的に多くのアームしか持たないインスタンスを構築します。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:36:44 GMT)
Probing the Reliability of Driving VLMs: From Inconsistent Responses to Grounded Temporal Reasoning [17.1] 運転支援システムとして応用されたビジョン・ランゲージ・モデル(VLM)は,現状の観測結果が今後の成果をどう形作るのかを概説し,理解することができるかを検討する。
強い視覚的理解を持つモデルは、時間的推論を必要とするタスクにおいて必ずしも最善を尽くさない。
本稿では、時間ラベルを必要とせず、一貫性と時間的推論の両方を改善するチェーン・オブ・ソート推論を用いた、シンプルで効果的な自己教師付きチューニング手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:12:28 GMT)
Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design [17.0] 本研究の目的は,設計による統合コンプライアンスを実現するため,規制要件工学(AM4RRE)のアーティファクトモデル(Artefact Model for Regulatory Requirements Engineering, AM4RRE)の合成と今後の評価について報告し,フィードバックを得ることである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:51:40 GMT)
Khatri-Rao Clustering for Data Summarization [17.0] 広く採用されているCentroidベースのクラスタリングは、少数のプロトタイプの観点から、データセットの有益な要約を見つける。
広く採用されているにもかかわらず、結果として得られるデータ要約は冗長性を含んでいることが多い。
Khatri-Raoクラスタリングのパラダイムを導入し、従来のCentroidベースのクラスタリングを拡張して、より簡潔で、同じくらい正確なデータサマリーを生成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:29:46 GMT)
$P^2$GNN: Two Prototype Sets to boost GNN Performance [16.9] 我々はプロトタイプを利用してメッセージパッシングを最適化するプラグイン・アンド・プレイ技術である$P2$GNNを紹介した。
プロプライエタリなEコマースデータセットやオープンソースデータセットなど、18のデータセットにわたる広範な実験を行っています。
その結果、$P2$GNNはeコマースのプロダクションモデルより優れており、オープンソースデータセットの平均ランクは最高であることがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:10:02 GMT)
ParTY: Part-Guidance for Expressive Text-to-Motion Synthesis [16.6] 本稿では,コヒーレントな全身運動を発生させながら部分表現性を高める新しいフレームワークであるParTYを提案する。
ParTY は,(1) 部分動作を生成する部分ガイドネットワーク,(2) テキスト埋め込みを多様に変換し,各本体に適切にアライメントする部分認識テキストグラウンド,(3) 全体動作と部分動作を適応的に融合する全体的部分フュージョンからなる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:53:12 GMT)
Democratising Clinical AI through Dataset Condensation for Classical Clinical Models [16.6] 我々は、分布の忠実さよりも実用性を優先して、モデルがフルデータトレーニングのパフォーマンスにマッチできるような、コンパクトな合成データセットを学習する。
通常計算効率を追求するが、DCは医療データの民主化も約束している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:36:39 GMT)
The Reasoning Trap -- Logical Reasoning as a Mechanistic Pathway to Situational Awareness [16.5] 状況認識 — 自分自身の性質を認識し、トレーニングとデプロイメントのコンテキストを理解するAIシステムの能力 — は、先進的なAIシステムにおいて最も危険な創発的能力の1つだと考えられている。
大規模言語モデル(LLM)の論理的推論能力を、推論、帰納、誘拐によって改善することを目指す研究が増えている。
RAISEフレームワークを導入し、論理的推論の改善によって状況認識のより深いレベルが実現される3つの力学経路を同定する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:18:48 GMT)
TrainDeeploy: Hardware-Accelerated Parameter-Efficient Fine-Tuning of Small Transformer Models at the Extreme Edge [16.5] TrainDeeployは、異種超低消費電力システムオンチップ(SoC)上での効率的な推論とオンデバイストレーニングを統合するフレームワークである。
我々は、CCT(Compact Convolutional Transformer)の最初のエンドツーエンドの微調整を実演し、1秒間に最大11個のトレーニング済み画像を達成した。
LoRAは動的メモリ使用量を23%削減し、トレーニング可能なパラメータや勾配を15倍削減し、フルバックプロパゲーションと比較してメモリ転送量を1.6倍削減する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:10:50 GMT)
SEA-Nav: Efficient Policy Learning for Safe and Agile Quadruped Navigation in Cluttered Environments [16.4] SEA-Navは四足歩行のための強化学習フレームワークである。
CBFベースのシールドは、安全な速度コマンドを出力するためにナビゲーションポリシーを制約する。
適応的な衝突再現機構と有害な探索報酬を導入し、学習の確率を高める。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:13:49 GMT)
TubeMLLM: A Foundation Model for Topology Knowledge Exploration in Vessel-like Anatomy [16.3] TubeMLLMは、医療血管のような解剖学のための制御可能な生成と構造的理解を結合した統合基盤モデルである。
トポロジ的先行を明示的な自然言語によって統合し、それらを共有アテンションアーキテクチャの視覚的表現と整合させることで、チューブMLLMはトポロジ的認識を著しく強化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:39:30 GMT)
IMSE: Intrinsic Mixture of Spectral Experts Fine-tuning for Test-Time Adaptation [16.1] テストデータが分布と異なる場合, 性能劣化を防止するため, テスト時間適応が広く研究されている。
我々は、視覚変換器に埋め込まれたスペクトルエキスパートを生かしたスペクトルエキスパートの内在混合(IMSE)を提案する。
提案手法は,TTA設定下での様々な分散シフトベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:16:45 GMT)
RubiCap: Rubric-Guided Reinforcement Learning for Dense Image Captioning [15.9] RubiCapは、ルーリックから微細でサンプル固有の報酬信号を導き出す、新しい強化学習フレームワークである。
ルビキャップは、CapArenaの最高勝利率、教師付き蒸留法、先行RL法、人為的アノテーション、GPT-4V拡張出力を達成している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:51:27 GMT)
MiniAppBench: Evaluating the Shift from Text to Interactive HTML Responses in LLM-Powered Assistants [15.8] MiniAppsは動的でインタラクティブなHTMLベースのアプリケーションで、現実世界の原則に準拠している。
既存のベンチマークは主にアルゴリズムの正確性や静的なレイアウト再構築に焦点を当てている。
原理駆動でインタラクティブなアプリケーション生成を評価するために設計された,最初の包括的なベンチマークであるMiniAppBenchを紹介する。
また,エージェント評価フレームワークであるMiniAppEvalを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:30:03 GMT)
One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning [15.7] クラスインクリメンタルラーニング(CIL)は,事前知識を維持しつつ,時間とともに新たなクラスを取得することを目的としている。
タスク更新をインクリメンタルに単一のアダプタにマージする,統一的で不均衡対応のフレームワークであるOne-Aを提案する。
One-Aは、推論オーバーヘッドが著しく低い競合精度を実現し、単一の非対称なアダプタが動的タスクサイズに適応可能であり、デプロイ時に効率が良いことを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:26:32 GMT)
GameVerse: Can Vision-Language Models Learn from Video-based Reflection? [15.7] 我々は、反射的な視覚的相互作用ループを可能にする総合的なビデオゲームベンチマークであるGameVerseを紹介する。
従来のファイア・アンド・フォーゲット・アセスメントを超えて、ビジョン・ランゲージ・モデルがどのように視覚体験を内部化し、ポリシーを改善するかを評価するために、新しいリフレクション・アンド・リトライ・パラダイムを使用している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:20:19 GMT)
SPARC: Spatial-Aware Path Planning via Attentive Robot Communication [15.7] 既存の学習コミュニケーション手法は, 空間的近接によらず, 隣り合うロボットを均等に扱うことができ, コーディネートが最も重要となる密集した地域では, 注意が希薄になる。
本稿では,マンハッタンの対角距離を注目重みに埋め込む通信機構RMHAを提案する。
RMHAは、30%の障害物密度で成功率を約75%達成し、最高のベースラインを25%以上上回っている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:28:11 GMT)
Global End-Effector Pose Control of an Underactuated Aerial Manipulator via Reinforcement Learning [15.6] ロボットアームとマルチロータードローンを組み合わせた空中マニピュレータは、アームの重量と機械的複雑さに厳しい制約に直面している。
本研究では,2自由度2自由度(DoF)アームを,6自由度エンドエフェクタのフルポーズ制御が可能な差動機構を用いて検討した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:15:35 GMT)
Beyond Scaling: Assessing Strategic Reasoning and Rapid Decision-Making Capability of LLMs in Zero-sum Environments [15.5] 本稿では,マルチエージェント評価フレームワークであるStrategic Tactical Agent Reasoning (STAR) Benchmarkを紹介する。
STARはターンベースとリアルタイムの両方の設定をサポートし、長期戦略計画の制御可能な分析を可能にする。
対話型環境における戦略的インテリジェンスは、推論の深さだけでなく、計画をタイムリーな行動に変換する能力にも依存することを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:14:13 GMT)
3D UAV Trajectory Estimation and Classification from Internet Videos via Language Model [15.3] インターネット規模のUAVビデオから直接UAV3Dトラジェクトリとカテゴリ情報を導出する新しいフレームワークを提案する。
提案手法は現状に近づき,現実の反UAVシナリオに対する堅牢性と適用性を強調した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:29:17 GMT)
SGI: Structured 2D Gaussians for Efficient and Compact Large Image Representation [15.3] 2D Gaussian Splattingは、ローエンドデバイスでの効率的なレンダリングをサポートする新しい画像表現技術として登場した。
高解像度画像を表現するためのコンパクトで効率的なフレームワークであるStructured Gaussian Image (SGI)を提案する。
SGIは複雑な画像を、種子の集合によって定義された複数スケールの局所空間に分解する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:21:10 GMT)
Good Reasoning Makes Good Demonstrations: Implicit Reasoning Quality Supervision via In-Context Reinforcement Learning [15.3] Reinforcement Learning with Verifiable Rewardsは、大規模言語モデルの推論を改善する。
高品質のソリューションは、低品質のソリューションよりも効果的なデモとして機能する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:33:07 GMT)
GR-SAP: Generative Replay for Safety Alignment Preservation during Fine-Tuning [15.2] 大規模言語モデルの安全性の整合性は、一見非敵対的な微調整によって容易に損なわれる。
連続学習における生成的再生に着想を得て, GR-SAP(Generative Replay for Safety Alignment Preservation)を提案する。
GR-SAPはダウンストリーム性能を維持しながら微調整による安全性劣化を著しく軽減する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:40:09 GMT)
Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet [15.2] Covenant-72Bは(計算とモデルスケールの両面で)世界最大規模の事前訓練実行である
ライブブロックチェーンプロトコルによってサポートされたオープンで無許可の参加を同時に許可した。
約1.1Tトークンで事前訓練された我々のモデルは、類似または高額の計算予算で完全に集中的な事前訓練と競合する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:34:33 GMT)
Dynamic Multi-period Experts for Online Time Series Forecasting [15.0] まず、再帰ドリフト(Recurring Drift)と創発ドリフト(Emergent Drift)という2つの異なるタイプに分類することで、概念のドリフトを再定義する。
そこで我々は、このドリフトの二重性に効果的に対処するために設計された新しいハイブリッドフレームワークDynaMEを提案する。
再帰的ドリフトのために、DynaMEは、各段階において最も関係のある歴史的パターンに動的に適合する専門専門家の委員会を雇っている。
Emergent Drift氏にとって、このフレームワークは高い不確実性シナリオを検出し、安定した一般の専門家への依存をシフトする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:09:30 GMT)
On Catastrophic Forgetting in Low-Rank Decomposition-Based Parameter-Efficient Fine-Tuning [14.8] 本研究では,更新部分空間の幾何やパラメータ化の影響を強く受けていることを示す。
本研究は,更新部分空間設計を連続学習の重要な要素として取り上げ,逐次的設定における効率的な適応戦略を選択するための実践的ガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:53:25 GMT)
Quantifying the Necessity of Chain of Thought through Opaque Serial Depth [14.7] 大規模言語モデル(LLM)は思考の連鎖における推論を外部化する傾向があり、思考の連鎖が監視の標的となる。
我々はこの議論を、思考の連鎖のような解釈可能な中間ステップを使わずに行うことができる、最も長い計算の長さによって与えられる不透明な直列深さの概念によって定式化する。
不透明な連続深度は、外部化されていない重要な推論を行うモデルの可能性を理解するのに有用なツールであることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:21:42 GMT)
Fanar-Sadiq: A Multi-Agent Architecture for Grounded Islamic QA [14.5] ファナー・サディク (Fanar-Sadiq) は、アラビア語/英語の多言語アシスタント。
イスラム関連のクエリをエージェント型ツール使用アーキテクチャ内の特殊なモジュールにルーティングする。
一般向けイスラムQAベンチマークによるエンドツーエンドシステムの評価を行った。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:16:56 GMT)
HelixTrack: Event-Based Tracking and RPM Estimation of Propeller-like Objects [14.5] プロペラのようなオブジェクトを共同で追跡し、毎分その回転を推定するイベント駆動方式。
13の高分解能イベントシーケンスを持つEgomotionデータセットを備えたタイムスタンプクアッドコプター。
HelixTrackは、リアルタイムとマイクロ秒のレイテンシよりも高速にフルレートイベントを処理する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:12:26 GMT)
Detecting Miscitation on the Scholarly Web through LLM-Augmented Text-Rich Graph Learning [14.5] LAGMiDは,グラフニューラルネットワーク(GNN)に意味論的推論を蒸留して,効率的かつスケーラブルな誤引用検出を実現する新しいフレームワークである。
具体的には、LAGMiDはエビデンスチェーン推論機構を導入し、チェーン・オブ・ソート・プロンプトを用いてマルチホップ引用追跡を行う。
3つの実世界のベンチマーク実験により、LAGMiDは推論コストを大幅に削減し、最先端の誤引用検出を実現することが示された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:44:28 GMT)
Probing mesoscopic nonlocal screening in van der Waals heterostructures with polaritons [14.4] 偏光子-波長シフトから電荷移動を定量化し, -MoO3 が薄くなるにつれて厚さ非依存性の飽和応答を求める。
120以上のデバイスで、このメトリックはTMDCと-MoO3のワークファンクションの違いとともに線形にスケールする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:56:15 GMT)
Dynamic Vehicle Routing Problem with Prompt Confirmation of Advance Requests [14.3] オンデマンド交通サービスを運営する交通機関は、乗客の乗車要求にリアルタイムで応答する必要がある。
機関は、要求が受け入れられるかどうかを迅速に確認し、承認された要求が約束通り提供されることを保証する必要がある。
本稿では,迅速な確認と連続的な最適化を備えた動的車両ルーティングの新たな問題定式化を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:21:16 GMT)
Lost in Backpropagation: The LM Head is a Gradient Bottleneck [14.3] 我々は、ソフトマックスのボトルネックは表現力のボトルネックであるだけでなく、最適化のボトルネックでもあることを示した。
ランク-$D$線形層による$V$次元勾配のバックプロパゲートは、避けられない圧縮を誘導する。
この固有の欠陥は、モデルアーキテクチャとは無関係に、大規模なトレーニングの非効率性に寄与する、と我々は主張する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:27:01 GMT)
High-resolution resonant inelastic X-ray scattering study of W-L3 edge in WSi2 [14.3] 本研究の目的は、X線量子光学応用のための2レベルシステムとしてのタングステンジイリサイド(WSi2)の可能性を探ることである。
その結果, 2レベル系の離散2p-5d遷移特性の存在が確認された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:07:15 GMT)
Towards Terrain-Aware Safe Locomotion for Quadrupedal Robots Using Proprioceptive Sensing [14.2] 本研究は,2.5次元地形図を生成し,支持面パラメータを抽出し,接触および状態推定に統合する推定フレームワークを提案する。
提案手法がスムーズな地形表現を提供することを示す実験を行った。
地形、状態、接触の結合推定フレームワークは、ベース位置推定の平均絶対誤差を64.8%削減する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:35:00 GMT)
Exploring Modality-Aware Fusion and Decoupled Temporal Propagation for Multi-Modal Object Tracking [14.2] マルチモーダル物体追跡における時間的伝播と融合を両立させる新しいフレームワークであるMDTrackを提案する。
モダリティを意識した融合では、それぞれの表現を処理するために、赤外線、事象、深度、RGBを含む各モダリティに専用の専門家を割り当てる。
時間的伝搬を分離するために,RGBとXのモードストリームの隠蔽状態を独立に保存・更新する2つの状態空間モデル構造を導入する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:10:05 GMT)
Enhancing light-matter coupling for exploring chaos in the quantum Rabi model [14.1] 本研究では,弱結合型2光子駆動のJaynes-Cummingsモデル(JCM)を実効的な深層結合QRMにマッピングするために,ボソニック場へのアンチ・スケズング変換を用いる。
我々は、この結合強化プラットフォームにおけるカオスを数値的に探索し、理想的なQRMと同様のカオス現象を観察する。
これは、本質的な超強結合を必要とせず、QRMカオスを研究するための実践的なアプローチとして結合強化法を確立する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:47:43 GMT)
OTPL-VIO: Robust Visual-Inertial Odometry with Optimal Transport Line Association and Adaptive Uncertainty [14.1] 本稿では, ラインセグメントに専用深層記述子を装備し, エントロピー規則化された最適輸送定式化を用いて一致したステレオポイントラインVIOシステムを提案する。
EuRoCとUMA-VIの実験は、低テクスチュア環境と照明環境の実際の展開とともに、代表ベースラインよりも精度と堅牢性を向上した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:30:05 GMT)
DexHiL: A Human-in-the-Loop Framework for Vision-Language-Action Model Post-Training in Dexterous Manipulation [14.1] ヒューマン・イン・ザ・ループ(HiL)学習は、ロボットポリシーを洗練するための強力なメカニズムであることが証明されている。
DexHiLはDexterous VLAモデルのための最初の統合アームハンドヒューマン・イン・ザ・ループ・フレームワークである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:55:27 GMT)
DUEL: Exact Likelihood for Masked Diffusion via Deterministic Unmasking [13.9] マスク付き拡散モデルは、アンマスクの位置を反復的に選択し、それらの位置でトークンを予測することによってテキストを生成する。
DUELフレームワークは、$textitdeterministic$ position selectionを利用する主要なMDMサンプリング戦略を統合する。
DUELは計算予算間で高速並列サンプリング器の第一原理比較を可能にする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:59:15 GMT)
VLN-Cache: Enabling Token Caching for VLN Models with Visual/Semantic Dynamics Awareness [13.9] トークンキャッシングは、ビジュアルトークンの冗長な再利用を避ける、トレーニング不要の戦略である。
VLNキャッシュ(VLN-Cache)を提案する。
R2R-CEシミュレーションベンチマークの実験では、競争力のある航法成功率を維持しながら1.52倍のスピードアップを示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:17:09 GMT)
Composed Vision-Language Retrieval for Skin Cancer Case Search via Joint Alignment of Global and Local Representations [13.8] そこで本研究では,各問合せは画像対とテキスト対から構成される皮膚がんの視覚言語検索について検討した。
本稿では,階層的なクエリ表現を学習し,共同でグローバルなアライメントを行うトランスフォーマーベースのフレームワークを提案する。
パブリックなDerm7ptデータセットの実験では、最先端の手法よりも一貫した改善が示されている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:42:30 GMT)
Joint Imaging-ROI Representation Learning via Cross-View Contrastive Alignment for Brain Disorder Classification [13.7] 本稿では,共同画像-ROI表現学習のためのクロスビュー・コントラッシブ・フレームワークを提案する。
提案手法は,主題レベルのグローバル(画像)とローカル(ROIグラフ)の埋め込みを学習し,それらを共有潜在空間に整列させる。
ADHD-200とABIDEデータセットの実験は、共同学習が一貫して分類性能を改善することを示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:14:53 GMT)
SlowBA: An efficiency backdoor attack towards VLM-based GUI agents [13.6] 本稿では、VLMベースのGUIエージェントの応答性をターゲットとした、新しいバックドア攻撃であるSlowBAを紹介する。
キーとなるアイデアは、特定のトリガーパターンの下で過度に長い推論チェーンを誘導することで、レスポンスのレイテンシを操作することです。
実験により、SlowBAはタスクの正確性を大きく保ちながら、応答長とレイテンシを大幅に向上できることが示された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:10:35 GMT)
BinaryAttention: One-Bit QK-Attention for Vision and Diffusion Transformers [13.6] 注意のバイナライゼーションは,本質的な類似性関係を保ち,バイナリアテンションを提案する。
学習可能なバイアスを組み込むことで1ビット量子化の下での固有情報損失を軽減し、エンドツーエンドの加速を可能にする。
我々の研究は、低ビットビジョンと拡散トランスフォーマーのフロンティアを推し進め、完全精度の注意に対する高効率で効果的な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:31:54 GMT)
Physics-Driven 3D Gaussian Rendering for Zero-Shot MRI Super-Resolution [13.6] 高分解能MRI(High- resolution Magnetic Resonance Imaging)は臨床診断に欠かせないが、長い取得時間と運動アーチファクトによって制限される。
超解像(SR)は低分解能スキャンを高分解能画像に再構成するが、既存の手法は相互に制約される。
データ要求と効率のバランスをとるために,明示的なガウス表現を用いたゼロショットMRI SRフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:00:42 GMT)
Chow-Liu Ordering for Long-Context Reasoning in Chain-of-Agents [13.5] Chain-of-Agents (CoA)は、入力をチャンクに分解し、順次処理することで、長いコンテキストクエリを処理する。
CoAは、前処理された証拠の有界な要約だけがエージェント間で渡される潜在状態分解によってこれを達成している。
我々は、よく知られたChow-Liu木を使って、強く関連するチャンクを優先順位付けする依存性構造を学ぶ。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:57:35 GMT)
Reading the Mood Behind Words: Integrating Prosody-Derived Emotional Context into Socially Responsive VR Agents [13.3] 音声の感情を明示的な対話コンテキストとして扱う感情コンテキスト対応VRインタラクションパイプラインを提案する。
リアルタイム音声感情認識モデルは、ユーザの感情状態を韻律から推測し、その結果の感情ラベルをエージェントの対話コンテキストに注入する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:58:06 GMT)
Compatibility at a Cost: Systematic Discovery and Exploitation of MCP Clause-Compliance Vulnerabilities [13.2] Model Context Protocol(MCP)は、AIエージェントが外部ツールやデータソースとどのように接続するかを統一する相互運用性標準である。
多様なAIエージェントと互換性を持つため、MPP仕様は、多くの動作制約をオプションの節に緩和し、SDK実装の誤用につながる。
我々は,この新たな攻撃面を多言語MPP SDKで解析するための最初の体系的フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:57:48 GMT)
YOLO-NAS-Bench: A Surrogate Benchmark with Self-Evolving Predictors for YOLO Architecture Search [13.1] YOLO-NAS-Benchは、YOLO型検出器に合わせた初のサロゲートベンチマークである。
YOLO-NAS-Benchは、チャネル幅、ブロック深さ、およびバックボーンとネックの両方にまたがる演算子タイプにまたがる検索空間を定義する。
ランダム、階層化、ラテンハイパーキューブ戦略を通じて1,000のアーキテクチャをサンプリングし、COCO-miniでトレーニングし、LightGBMサロゲート予測器を構築する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:19:16 GMT)
Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation [12.9] ACADiffは、行方不明の脳画像モダリティを合成するフレームワークである。
不完全なマルチモーダル観測と目標モダリティの間のマッピングを、段階的に潜在表現を認知することによって学習する。
生成品質が向上し、80%の不足シナリオでも堅牢な診断性能を維持する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:26:45 GMT)
TemporalDoRA: Temporal PEFT for Robust Surgical Video Question Answering [12.8] 重み分解低ランク適応を拡張したビデオ特異的PEFT定式化であるTemporalDoRAを紹介する。
適応部分空間内のフレーム間で情報を混ぜることで、TemporalDoRAは時間的に一貫した視覚的手がかりに向けて更新を行う。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:03:42 GMT)
Human-AI Interaction Traces as Blackout Poetry: Reframing AI-Supported Writing as Found-Text Creativity [12.8] 我々は、人間とAIの相互作用の痕跡がいかに表現力のある人工物として機能するかを探求することによって、異なるレンズを求める。
我々は、AIが生成したテキストを、著者のキュレーションと再解釈の行為がAIのオリジナルの出力の上に刻まれる資料として作成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:04:53 GMT)
CogBlender: Towards Continuous Cognitive Intervention in Text-to-Image Generation [12.7] 本稿では,テキスト・ツー・イメージ生成における認知特性の連続的・多次元的介入を可能にするフレームワークであるCogBlenderを紹介する。
私たちの仕事は、認知主導の創造的デザインに効果的なパラダイムを提供します。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:08:35 GMT)
NS-VLA: Towards Neuro-Symbolic Vision-Language-Action Models [12.7] VLA(Vision-Language-Action)モデルは、視覚的コンテキストで接地命令を定式化し、ロボット操作のためのアクションシーケンスを生成する。
オンライン強化学習(RL)によるニューロシンボリック・ビジョン・ランゲージ・アクション(NS-VLA)フレームワークを提案する。
ロボット操作ベンチマークの実験では、NS-VLAはワンショットトレーニングとデータ摂動設定の両方において、従来の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:51:54 GMT)
GAST: Gradient-aligned Sparse Tuning of Large Language Models with Data-layer Selection [12.6] グラディエント・アライメント・スパース・チューニング(GAST)はデータ次元と層次元の両方で選択的微調整を同時に行う革新的な手法である。
GASTは、各レイヤに対して最も影響の大きいデータポイントを適応的に選択する層スパース戦略を採用することで、情報の冗長性を特に狙う。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:28:48 GMT)
Octopus-inspired Distributed Control for Soft Robotic Arms: A Graph Neural Network-Based Attention Policy with Environmental Interaction [12.5] 本稿では,タコに触発されたソフトロボットアームの分散制御アーキテクチャであるSoftGMを提案する。
ソフトGMは、各アームセクションを協調剤として定式化し、アームと環境の相互作用をグラフとして表現する。
我々は,環境の複雑さを増大させる3つのタスクに対して,Cosserat-rodシミュレータ(PyElastica)を用いてSoftGMを評価した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:56:07 GMT)
Towards Understanding Adam Convergence on Highly Degenerate Polynomials [12.2] アダムの「自然」自己収束特性について検討する。
我々は、アダムがスケジューラを追加せずに自動的に収束する高度退化のクラスを見つける。
アダムがこれらの関数の局所線型収束を退化させ、グラディエント Descent と Momentum の部分収束を著しく上回っていることを証明した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:30:20 GMT)
Maximizing mutual information between user-contexts and responses improve LLM personalization with no additional data [12.2] 本稿では、適切なプロンプトに対して正の応答条件を発生させ、ランダムな無関係なプロンプトに対して負の応答を発生させることにより、選好ペアを構成するコントラッシブデータ拡張手法を提案する。
このペアデータから直接選好最適化(DPO)を用いることで、プロンプトとモデル応答間のポイントワイド条件付き相互情報(MI)を最大化することを示す。
驚いたことに、MIPOは数学と多重選択問題のパフォーマンス向上にも応用できる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:00:05 GMT)
ForgeDreamer: Industrial Text-to-3D Generation with Multi-Expert LoRA and Cross-View Hypergraph [12.1] 現在のテキスト・ツー・3D生成法は自然界で優れているが、工業的応用に苦戦している。
本稿では,2つの重要なイノベーションを通じて両課題に対処する新しいフレームワークForgeDreamerを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:54:30 GMT)
ECHO: Elastic Speculative Decoding with Sparse Gating for High-Concurrency Scenarios [12.1] 投機的復号化は、大規模言語モデルの推論を加速することを約束するが、その有効性はプロダクショングレードのサービスでしばしば低下する。
我々はSGLangに統合された高機能なフレームワークであるECHOを導入し、予算スケジューリング問題として投機的実行を再構成する。
ECHOは低負荷と高負荷の両方のシナリオでSOTA法を一貫して上回り、最大5.35倍のウォールタイムスピードアップを実現し、20%以上の相対的なスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:51:24 GMT)
Nonthermal Dynamics and Scar-Like Spectral Structures in a High-Spin Fermi Gas [12.0] 時間依存ハートリー・フォック方程式を用いて、調和に閉じ込められたスピン-3/2$フェルミ気体中の非平衡ダイナミクスと弱いエルゴディディディティの破れについて検討した。
長寿命コヒーレント振動は、多体連続体に埋め込まれた準正則スペクトル構造に付随する集合相干渉に由来する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:15:41 GMT)
Multimodal Graph Representation Learning with Dynamic Information Pathways [12.0] 動的情報経路(DiP)を用いた新しいマルチモーダルグラフ表現学習フレームワークを提案する。
DiPは近接誘導擬似ノード相互作用による各モード内の動的メッセージルーティングを可能にする。
複数のベンチマークの実験では、DiPがベースラインを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:45:59 GMT)
CycleULM: A unified label-free deep learning framework for ultrasound localisation microscopy [11.9] CycleULMは、超音波ローカライゼーション顕微鏡のための最初の統一されたラベルなしディープラーニングフレームワークである。
実際のコントラスト強化超音波データ領域と、単純化されたMBのみの領域の間の物理エミュレーションの変換を学ぶ。
サイコとインビボのデータセットの両方で、大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:05:21 GMT)
On Regret Bounds of Thompson Sampling for Bayesian Optimization [11.8] 本稿では、目的関数がGPからのサンプルパスであるという仮定の下で、GP-TSに対するいくつかの後悔の限界を示す。
本稿では,最近の分析から必要条件の緩和を含むいくつかの有用な補題について述べる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:02:20 GMT)
Equivariant Asynchronous Diffusion: An Adaptive Denoising Schedule for Accelerated Molecular Conformation Generation [11.7] これらの制限を克服するために、Equivariant Asynchronous Diffusion (EAD)を導入します。
EADは、両方のアプローチの強みを組み合わせた、新しい拡散モデルである。
そこで我々は動的スケジューリング機構を提案し,その時間ステップを適応的に決定する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:05:39 GMT)
HG-Lane: High-Fidelity Generation of Lane Scenes under Adverse Weather and Lighting Conditions without Re-annotation [11.7] 悪天候および照明条件下でのレーンシーンの高忠実度生成フレームワークであるHG-Laneを提案する。
実験により,本手法は既存の車線検出ネットワークの性能を継続的に,かつ著しく向上させることを示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:04:35 GMT)
Uncertainty, Vagueness, and Ambiguity in Human-Robot Interaction: Why Conceptualization Matters [11.7] 不確かさ、あいまいさ、曖昧さは人間ロボットインタラクション(HRI)において密接に関連しており、しばしば混乱する概念である。
初期の研究では、これらの概念は矛盾した方法で定義され、矛盾した用語を用いて記述されている。
本稿では,HRIにおける不確実性,曖昧性,曖昧性の課題に対する一貫した概念的基盤を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:46:25 GMT)
BrainSTR: Spatio-Temporal Contrastive Learning for Interpretable Dynamic Brain Network Modeling [11.5] BrainSTRは、動的脳ネットワークモデリングのための分散脳時間コントラスト学習フレームワークを学習する。
ASD、BD、MDDに関する試験は、以前の発見と一致する解釈可能な証拠を提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:47:09 GMT)
PixelConfig: Longitudinal Measurement and Reverse-Engineering of Meta Pixel Configurations [11.4] 私たちは、Web上のMeta Pixelデプロイメントの設定をリバースエンジニアリングするために、PixelConfigという差分分析フレームワークを提示します。
アクティビティトラッキング(Webサイト上でユーザが何をしているか)、アイデンティティトラッキング(ユーザが誰であるか、誰がデバイスと関連しているか)、トラッキング制限(潜在的に機密性の高い情報の共有を制限するメカニズム)の3つのタイプについて検討する。
ボタンクリックを収集する自動イベントなどのアクティビティトラッキング機能は、Pixelのデフォルト設定によって、最大98.4%の採用率に達したことが分かりました。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:53:56 GMT)
Mashup Learning: Faster Finetuning by Remixing Past Checkpoints [11.4] マッシュアップ学習は、新しいタスクへのモデル適応を強化するために、事前トレーニングの実行のアウトプットを活用する単純な方法である。
トレーニングをスクラッチから行うよりも、平均下流の精度を0.5~5ポイント向上させる。
また、コンバージェンスを加速し、トレーニングステップを41-46%削減し、スクラッチの精度に合わせるために壁時計全体の時間を最大37%短縮する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:46:26 GMT)
Sensing Low-Frequency Field with Rydberg Atoms via Quantum Weak Measurement [11.3] ライドバーグ原子は低周波電界の量子センシングを実現するための魅力的な選択として現れてきた。
ライドバーグ状態に作用する外部磁場は、ライドバーグ電磁誘導透過系におけるプローブレーザーの偏光変動を誘導することができる。
我々はこの現象を実験的に観察し、偏光度を適切に利用して信号抽出を実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:21:40 GMT)
Two Teachers Better Than One: Hardware-Physics Co-Guided Distributed Scientific Machine Learning [11.3] ハードウェアと物理を併用した分散SciMLフレームワークEPICを紹介する。
EPLは、エンドデバイス上で軽量なローカライズエンコーディングと、中央ノードで物理を意識したデコーディングを実行する。
EPLはレイテンシを8.9$times$と通信エネルギーを33.8$times$に減らし、さらに10データセット中8データセットの再構成精度も改善している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:07:38 GMT)
POLISH'ing the Sky: Wide-Field and High-Dynamic Range Interferometric Image Reconstruction with Application to Strong Lens Discovery [11.3] 実環境下での堅牢な再構築と超解像を実現するための改良を提案する。
本研究は,次世代電波天文学の実用的でスケーラブルなツールとして,DLモデルの可能性を強調した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:59:26 GMT)
Evolving Prompt Adaptation for Vision-Language Models [11.2] EvoPromptは、安定的で知識を保存できる微調整のために、迅速な軌道を操るように設計された新しいフレームワークである。
EvoPromptは、事前学習されたVLMのゼロショット能力を安定的に保ちつつ、数ショット学習で性能を向上することを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:53:01 GMT)
Compartmentalization-Aware Automated Program Repair [11.2] 本稿では,大規模言語モデル (LLM) がクロスコンパートメントインタフェースの確保に有効であることを示す。
本稿では,インターフェースの安全性を補完する新しいAPRフレームワークの設計,実装,および初期の成果について述べる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:55:23 GMT)
Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values [11.2] 非矩形ロバストマルコフ決定過程を平均逆基準下で研究する。
あいまいさの集合に対して一様に、サブリニアな後悔を達成できる歴史に依存した政策が、頑健な最適化であることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:02:02 GMT)
TCG CREST System Description for the DISPLACE-M Challenge [11.1] 本報告では, DISPLACE-M チャレンジのトラック1(話者ダイアリゼーション)における TCG CREST システム記述について述べる。
本研究では,様々な音声活動検出法と高度なクラスタリングアルゴリズムが話者ダイアリゼーション(SD)性能に与える影響について検討した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:38:13 GMT)
Disentangling Prompt Element Level Risk Factors for Hallucinations and Omissions in Mental Health LLM Responses [11.1] 精神的な健康上の懸念は、高密度の助けを求めることを含め、しばしば臨床の外で表現される。
我々は, 系統的ストレステストのための4つの制御可能な要素として調査を表現する, 即時構築フレームワークUTCOを紹介する。
幻覚は6.5%の反応と欠落の13.2%で発生し、失効は危機と自殺の発端に集中した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:40:24 GMT)
Privacy and Safety Experiences and Concerns of U.S. Women Using Generative AI for Seeking Sexual and Reproductive Health Information [11.0] SRH情報を求めるためにGenAIチャットボットを使用した米国在住18人を対象に半構造化インタビューを行った。
参加者は、過剰なデータ収集、政府の監視、プロファイリング、モデルトレーニング、データコモディフィケーションなど、複数のプライバシーリスクを特定した。
我々は、GenAIが支援するSRH情報検索におけるプライバシーと安全性を高めるために、健康特化機能やより強力なモデレーションプラクティスなどのデザインとポリシーレコメンデーションを提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:53:13 GMT)
On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer [11.0] 平均正規化作用素ノルムの族は、層ワイズ可能性を認め、幅非依存な滑らかさ境界を得る。
また、textrmMuonは、スムーズネス定数が$mathcalO(qrtw)最悪のケース成長に悩まされるのに対し、qmean$に正規化された新しい行の族は、幅に依存しない境界を達成できることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:49:19 GMT)
Critical States Preparation With Deep Reinforcement Learning [10.9] 本稿では,深部強化学習(DRL)を用いて量子臨界状態の迅速作成を行うフレームワークを提案する。
具体的には、DRLエージェントが時間依存制御ハミルトニアンの集合を最適化し、初期臨界状態から目標臨界状態へシステムを駆動する。
このプロトコルは、光-物質相互作用モデルによって記述された他の量子クリティカルシステムに容易に拡張できる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:17:42 GMT)
Perceptive Hierarchical-Task MPC for Sequential Mobile Manipulation in Unstructured Semi-Static Environments [10.9] 連続的な移動操作は、一貫した動きの生成だけでなく、動作環境の変化に対するロボットの認識と適応性にも依存する。
本研究では,非構造的かつ変化する環境下での効率的な移動操作を実現するための,新しい知覚的階層型タスクモデル予測制御(HTMPC)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:55:30 GMT)
Training-Free Coverless Multi-Image Steganography with Access Control [10.9] Coverless Image Steganography (CIS)は、カバーイメージを明示的に変更することなく情報を隠蔽する。
ユーザ固有のアクセス制御を備えたマルチイメージの隠れを可能にする,トレーニング不要な拡散型CISフレームワークMIDASを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:02:39 GMT)
MedKCO: Medical Vision-Language Pretraining via Knowledge-Driven Cognitive Orchestration [10.8] 医用視覚言語事前学習のための知識駆動型認知オーケストレーションを提案する。
我々は,事前学習データの順序付けに,診断感度とクラス内サンプル代表性を取り入れた2段階のカリキュラムを設計する。
本稿では,複数の視覚言語ダウンストリームタスクにおける3つの医療画像シナリオに対する事前学習手法の評価と,複数のカリキュラム学習手法との比較を行った。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:22:12 GMT)
CLIPO: Contrastive Learning in Policy Optimization Generalizes RLVR [10.8] RLVRによる強化学習は大規模言語モデル(LLM)の推論能力を大幅に向上させた。
プロセスに反するが結果の正しいロールアウトのトレーニングは、幻覚と回答コピーにつながる可能性がある。
RLVRプロセスの一般化のために,コントラスト学習機構を政策最適化(CLIPO)に組み込んだ。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:59:54 GMT)
One-Eval: An Agentic System for Automated and Traceable LLM Evaluation [10.7] One-Evalは、自然言語要求を実行可能な評価に変換するエージェント評価システムである。
One-Evalは、産業環境でより効率的で再現可能な評価をサポートする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:45:51 GMT)
Hierarchical Task Model Predictive Control for Sequential Mobile Manipulation Tasks [10.6] 本稿では,ロボットの冗長性を効果的に活用することにより,性能と反応性を改善したシーケンシャルタスクを完遂できる新しい階層型タスクモデル予測制御フレームワークを提案する。
典型的な単一タスクアーキテクチャと比較して,提案した階層型タスク制御アーキテクチャにより,ロボットはタスク空間の短い経路を横切ることができ,デリバリタスクのシーケンスの実行時の実行時間を2.3倍速くすることができる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:07:02 GMT)
GeoSolver: Scaling Test-Time Reasoning in Remote Sensing with Fine-Grained Process Supervision [10.6] 我々は、リモートセンシング推論を検証可能なプロセス教師あり学習へ移行するフレームワークであるGeorを紹介する。
トークンレベルのプロセス報酬モデル(PRM)であるGeoPRMをトレーニングします。
これらの検証信号を効果的に活用するために,プロセス対応ツリーGRPOを提案する。
得られたモデルであるGeor-9Bは、様々なリモートセンシングベンチマークにまたがって最先端のパフォーマンスを統合する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:59:05 GMT)
Causally Sufficient and Necessary Feature Expansion for Class-Incremental Learning [10.6] クラス増分学習(CIL)の最近の拡張手法は、古い特徴を凍結することで破滅的な忘れを効果的に行う。
突発的な特徴相関が この衝突の主な原因で 2つの範囲に現れます
本稿では,CILの機能拡張を導くために,PNSに基づく正則化手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:33:33 GMT)
An Empirical Study of Interaction Smells in Multi-Turn Human-LLM Collaborative Code Generation [10.6] 大規模言語モデル(LLM)はコード生成に革命をもたらし、静的ツールから動的対話インターフェースへと進化した。
LLMはスタンドアロンのコードスニペットを生成するのに非常に優れているが、拡張された相互作用の間はコンテキスト整合性を維持するのに苦労している。
既存のベンチマークでは、インタラクション・スメル(Interaction Smells)と呼ばれるインタラクション・プロセス自体に潜む品質の問題を見越して、最終的な出力の関数的正しさを強調している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:12:18 GMT)
Learning the Hierarchical Organization in Brain Network for Brain Disorder Diagnosis [10.4] 脳階層型組織学習(BrainHO)を提案する。
具体的には,ノードを階層構造に集約する階層的アテンション機構を設計する。
公開されているABIDEとREST-meta-MDDデータセットの実験では、BrainHOは最先端の分類性能を達成するだけでなく、解釈可能な、臨床的に重要なバイオマーカーも明らかにしている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:49:45 GMT)
Learning Bayesian and Markov Networks with an Unreliable Oracle [10.3] マルコフネットワークとベイズネットワークの制約に基づく構造学習について検討する。
木幅のような多くのよく使われるグラフパラメータがバウンドされている場合でも、構造を常に識別するエラーを許容できないことを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:07:53 GMT)
Censored LLMs as a Natural Testbed for Secret Knowledge Elicitation [10.3] この問題の2つのアプローチは、正直な推論と嘘検出である。
我々は、政治的に敏感なトピックを検閲するために訓練された中国の開発者によるオープンウェイトLSMについて研究する。
正直な説明として、チャットテンプレートのないサンプリング、数発のプロンプト、一般的な正直なデータの微調整は、真実の反応を確実に増加させる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:54:00 GMT)
High-Fidelity Medical Shape Generation via Skeletal Latent Diffusion [10.2] 本稿では,高忠実度医療形状生成のための骨格潜伏拡散フレームワークを提案する。
新しい形状は潜在空間拡散モデルによって生成され、次にニューラル暗黙的復号とメッシュ抽出が続く。
MedSDFと船体データセットの実験により,提案手法がより優れた再構成と生成品質を実現することを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:50:04 GMT)
ProvAgent: Threat Detection Based on Identity-Behavior Binding and Multi-Agent Collaborative Attack Investigation [9.8] ProvAgentは、ヒューマンモデルコラボレーションから、マルチエージェントシステムと従来のモデルの間の新しいコラボレーションへと、脅威の前兆パラダイムを進化させるフレームワークである。
グラフの対照的な学習を通じて、きめ細かいアイデンティティと振る舞いの一貫性を強制することにより、特定の属性に基づいてエンティティをプロファイリングし、高忠実度アラートを生成する。
ProvAgentは仮説検証マルチエージェントフレームワークを通じて、詳細な自律的な調査を実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:38:53 GMT)
A Generalized Voronoi Graph based Coverage Control Approach for Non-Convex Environment [9.7] 本稿では,一般グラフ化VoronBalancingGVGに基づくカバレッジ制御手法を提案する。
負荷分散フェーズでは、リージョンはGVGに基づいて複数のサブリージョンに分割される。
協調被覆フェーズでは、各ロボットは、その領域を効果的にカバーする新しいコントローラによって制御される。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:42:53 GMT)
Summarize Before You Speak with ARACH: A Training-Free Inference-Time Plug-In for Enhancing LLMs via Global Attention Reallocation [9.5] 大規模言語モデル(LLM)は優れたパフォーマンスを達成するが、さらなる向上にはコストのかかるトレーニングが必要になることが多い。
これは、トレーニング後のテクニック、特にウェイトを更新せずに推論時にモデルを改善するトレーニングなしのアプローチへの関心の高まりを動機付けている。
本稿では,適応型文脈ハブを用いた学習自由推論時プラグインであるARACH(Attention Reallocation via an Adaptive Context Hub)を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:07:54 GMT)
CarbonBench: A Global Benchmark for Upscaling of Carbon Fluxes Using Zero-Shot Learning [9.5] カーボンベンチ(CarbonBench)は、炭素フラックスアップスケーリングにおけるゼロショット空間移動のベンチマークである。
世界中のフラックスタワー567箇所から毎日130万回以上観測されている。
機械学習手法と地球システム科学をブリッジすることで、CarbonBenchはトランスファーラーニング手法の比較を可能にすることを目指している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:33:28 GMT)
Multi-model approach for autonomous driving: A comprehensive study on traffic sign-, vehicle- and lane detection and behavioral cloning [9.4] 本研究は,交通標識の分類,車両検出,車線検出,行動クローニングなどの重要なタスクに,事前学習およびカスタムメイドニューラルネットワークを用いる。
この手法は、データ拡張のための幾何変換や色変換、画像正規化、特徴抽出のための伝達学習など、いくつかの革新的な技術を統合している。
この研究の主な目的は、自動運転車のためのディープラーニングとコンピュータビジョンの最先端技術を見直すことである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:40:52 GMT)
A Generative Sampler for distributions with possible discrete parameter based on Reversibility [9.3] 本稿では,多種多様な状態空間にまたがって適用可能な,統一的かつ段階的な目標自由な生成サンプリングフレームワークを提案する。
我々は,前方と後方のマルコフ軌道の関節分布の最大平均差 (MMD) を最小化する。
実験により,本フレームワークは熱力学観測器を正確に再現し,すべてのレシエーションでモードスイッチング動作を捉えていることがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:32:51 GMT)
Geometry-Aware Semantic Reasoning for Training Free Video Anomaly Detection [9.3] トレーニング不要なビデオ異常検出(VAD)は、教師付きアプローチに代わるスケーラブルな代替手段として最近登場した。
本稿では,自由なVADを学習するための幾何学的意味推論フレームワークMM-VADを紹介する。
MM-VADは、固定特徴比較よりも適応的なテスト時間推論として異常検出を再構成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:28:37 GMT)
TimberAgent: Gram-Guided Retrieval for Executable Music Effect Control [9.3] Texture Resonance Retrieval (TRR) は、中間レベルWav2Vec2アクティベーションのグラマー行列から構築されたオーディオ表現である。
TRRを1063のプレセットと204のクエリで評価した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:09:32 GMT)
High-Slip-Ratio Control for Peak Tire-Road Friction Estimation Using Automated Vehicles [9.3] 本稿では,自動走行車両が空調動作中にピーク摩擦領域を活発に励起することのできる高スリップ比制御フレームワークを提案する。
雑音および局所空間下でのピークRFCを頑健に推定するために,ビンニングに基づく統計的予測手法を提案する。
このフレームワークは、クローズドループシミュレーションと実車実験の両方を通じて検証され、その正確性、安全性、そしてスケーラブルで費用対効果の高い道路摩擦スクリーニングの実現可能性を示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:34:00 GMT)
Trajectory Optimization for Self-Wrap-Aware Cable-Towed Planar Object Manipulation under Implicit Tension Constraints [9.2] セルフ・ラップ・トーイング(Self-wrap towing)は、ルーティングを意識した簡易軌道最適化(TITO)問題である。
We build a relaxation hierarchy from a strict mode-conditioned reference to three tractable relaxation: Full-Mode Relaxation (FMR), Binary-Mode Relaxation (BMR), Implicit-Mode Relaxation (IMR)。
IMRは状態の進化を通じて自己ラップを誘導し、回転するたびにリダイレクトトルクチャネルを利用する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:04:57 GMT)
WESPR: Wind-adaptive Energy-Efficient Safe Perception & Planning for Robust Flight with Quadrotors [9.2] WESPRは環境形状が局地風環境にどのように影響するかを予測する高速なフレームワークである。
その結果,最大軌道偏差が12.5-58.7%減少し,風向非依存の適応制御器に比べて24.6%の安定性が向上した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:09:43 GMT)
Reasoning-Oriented Programming: Chaining Semantic Gadgets to Jailbreak Large Vision Language Models [9.1] LVLM(Large Vision-Language Models)は、有害なコンテンツを抑えるために安全アライメントを行う。
本稿では,LVLMを誘導し,良性前提から有害な論理を合成するシステム欠陥を同定する。
提案手法は,ベニグインプットのセマンティック衝突を編成するために,モデルの命令追従機能を利用する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:18:48 GMT)
M3GCLR: Multi-View Mini-Max Infinite Skeleton-Data Game Contrastive Learning For Skeleton-Based Action Recognition [8.9] 骨格に基づく行動認識(M3GCLR)のためのマルチビュー・ミニマックス無限骨格データゲームコントラスト学習を提案する。
我々は,多視点回転拡張により通常のデータペアを生成し,時間平均入力を中性アンカーとして採用し,構造的アライメントを実現する。
次に、よりリッチなアクション識別情報をマイニングするようモデルに促すために、強敵のミニマックススケルトンデータゲームを構築する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:45:14 GMT)
StyleVLA: Driving Style-Aware Vision Language Action Model for Autonomous Driving [8.9] StyleVLAは物理インフォームされたVLAフレームワークで、多種多様な物理的に妥当な運転行動を生成する。
我々は,1.2k以上のシナリオ,76k Bird's Eye View (BEV) サンプル,42k First Person View (FPV) サンプルを用いた大規模インストラクションデータセットを構築した。
実験の結果、StyleVLAはプロプライエタリなモデルや最先端のVLAモデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:33:58 GMT)
Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework [8.9] 我々はADMMに3段階のデノイザを組み込むADMMプラグイン・アンド・プレイ(ADMM)を開発した。
幅広い逆問題に対する実験により,本手法は多様なベースライン解に対して常に品質を向上することを示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:55:00 GMT)
PlaneCycle: Training-Free 2D-to-3D Lifting of Foundation Models Without Adapters [8.9] PlaneCycleは、アーキテクチャに依存しない基礎モデルの2D-to-3Dリフトのための、トレーニングフリーでアダプタフリーなオペレータである。
PlaneCycleはオリジナルの2Dバックボーンを再利用し、HW、DW、DH平面に空間アグリゲーションを循環的に分散する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:36:39 GMT)
Probabilistic Hysteresis Factor Prediction for Electric Vehicle Batteries with Graphite Anodes Containing Silicon [8.8] シリコングラファイトベースのアノードを持つ電池は、エネルギー密度が高く、充電性能が向上し、充電状態の推定が特に困難になる。
この研究は、シリコングラファイトアノードベースの電池を含む応用に特に重点を置いて、確率的因子予測調和のためのデータ駆動アプローチを導入している。
リトレーニング、ゼロショット予測、微調整、共同訓練により、未確認車両モデルにおける最適モデル構成の一般化性を評価する実験を行った。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:27:28 GMT)
GeoAlignCLIP: Enhancing Fine-Grained Vision-Language Alignment in Remote Sensing via Multi-Granular Consistency Learning [8.8] 視覚言語事前学習モデルは、自然言語によるリモートセンシング画像のブリッジにおいて大きな進歩を遂げている。
リモートセンシングタスクにおける微粒なアライメントを実現する統合フレームワークGeoAlignCLIPを提案する。
RSFG-100kはシーン記述、地域レベルのアノテーション、難易度の高いサンプルを含む微粒なリモートセンシングデータセットである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:12:11 GMT)
BridgeDiff: Bridging Human Observations and Flat-Garment Synthesis for Virtual Try-Off [8.8] VTOFF(Virtual try-off)は、標準化されたディスプレイと下流の仮想試着のための服装者の画像から標準フラットガーメント表現を復元することを目的としている。
従来の方法では、VTOFFはローカルマスクやテキストのみのプロンプトによって駆動される直接画像変換として扱われ、ボディ上の外観と平らなレイアウトのギャップを見下ろしていた。
我々は,人中心の観察とフラットガーメント合成を明確にブリッジする,拡散に基づくフレームワークであるBridgeDiffを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:12:32 GMT)
Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models [8.6] 深い強化学習のオラクルは、解釈、信頼、デバッグが難しいブラックボックスのニューラルネットワークポリシを生成します。
我々は、この課題に対処する新しいフレームワークであるCode-Space Response Oracles (CSRO)を紹介します。
本研究は,不透明なポリシーパラメータの最適化から解釈可能なアルゴリズム行動へ焦点を移す,マルチエージェント学習の新しい視点を示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:37:06 GMT)
Ego: Embedding-Guided Personalization of Vision-Language Models [8.6] 本稿では,パーソナライズされた概念をキャプチャするモデル固有の能力を活用する,効率的なパーソナライズ手法を提案する。
具体的には、主にターゲット概念を表す視覚トークンを抽出する。
これらのトークンは、その特定の概念のメモリとして機能し、テストイメージに現れる時にモデルをリコールし、記述することができる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:10:41 GMT)
Embodied Human Simulation for Quantitative Design and Analysis of Interactive Robotics [8.6] 本研究では,人間とロボットの相互作用を定量的に解析するためのシミュレーションベースのフレームワークを開発した。
中心となるのは、人間の力学系の予測的代理として機能する全身筋骨格モデルである。
我々は,ヒトと外骨格の相互作用を最適化する能力を示し,関節アライメントの改善と接触力の低下を示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:39:31 GMT)
Telogenesis: Goal Is All U Need [8.6] 本稿では,3つのギャップ(無知,驚き,安定度)から観測目標を生成する優先度関数を提案する。
最小のアテンションアロケーション環境(2000ラン)と、モジュラーで部分的に観測可能な世界(500ラン)の2つのシステムでこれを検証します。
大域的な予測エラーの下では、カバレッジベースのローテーションが勝利し、変更検出遅延下では、優先度誘導されたアロケーションが勝利し、次元とともに単調に成長する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:28:45 GMT)
Cognitively Layered Data Synthesis for Domain Adaptation of LLMs to Space Situational Awareness [8.4] BD-FDGは、不完全な知識カバレッジ、浅い認知深度、限られた品質管理性に対処するフレームワークである。
約230KサンプルのドメインデータセットであるSSA-SFTとQwen3-8Bを微調整してSSA-LLM-8Bを得る。
その結果, SSA-LLM-8Bでは, BLEU-1の相対的な改善が144% (非思考) と176% (思考) で達成された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:04:53 GMT)
Fine-grained Motion Retrieval via Joint-Angle Motion Images and Token-Patch Late Interaction [8.3] テキストモーション検索は、自然言語記述と3次元人間の骨格配列の間の意味的に整合した潜在空間を学習することを目的としている。
既存のほとんどのメソッドは、モーションとテキストをグローバルな埋め込みに圧縮するデュアルエンコーダフレームワークを使用している。
本稿では,関節の局所的な特徴を擬似画像にマッピングする,解釈可能な,関節角度に基づく動作表現を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:26:42 GMT)
A Voronoi Cell Formulation for Principled Token Pruning in Late-Interaction Retrieval Models [8.1] ColBERTのような後期インタラクションモデルでは、各ドキュメントトークンに密着した埋め込みを格納する必要がある。
過去の研究は、統計的および経験的尺度に基づいて、低重要トークンの埋め込みを創り出すことによって、この問題に対処している。
埋め込み空間におけるボロノイセル推定問題として,超空間幾何学と鋳型トークンプルーニングを基礎としたフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:28:25 GMT)
VirtueBench: Evaluating Trustworthiness under Uncertainty in Long Video Understanding [8.1] 近年の視覚言語モデル (VLM) は多モーダル理解タスクにおいて顕著な進歩を遂げている。
フレーム入力が限られているため、質問に答えるために必要なキーフレームがモデルの入力から欠落している可能性がある。
我々は、不確実性の下でモデルの信頼性を評価するために明示的に設計されたベンチマークであるVrtueBenchを紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:17:31 GMT)
Upper Generalization Bounds for Neural Oscillators [8.1] 二階ODEと多層パーセプトロン(MLP)からなるニューラル発振器について検討する。
上部は、連続時間関数空間間の因果作用素と一様連続作用素を近似するために、ほぼ正しい(PAC)。
地震条件下でのブーク-ウェン非線形励振系を考慮した数値実験は,推定誤差の理論的予測パワー則を検証する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:47:23 GMT)
PrivPRISM: Automatically Detecting Discrepancies Between Google Play Data Safety Declarations and Developer Privacy Policies [8.1] 自己宣言的な開示は、実際のデータプラクティスについてユーザを非難する、完全なプライバシポリシと矛盾することが多い。
エンコーダとデコーダ言語モデルを組み合わせて,プライバシポリシから詳細なデータプラクティスを抽出し比較する,堅牢なフレームワークであるPrivPRISMを紹介した。
以上の結果から,汎用プライバシポリシの広範な再利用,曖昧/矛盾文の再利用,1億回以上ダウンロードされた著名なアプリの隠れリスクなど,システム上の課題が明らかになった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:33:40 GMT)
Impermanent: A Live Benchmark for Temporal Generalization in Time Series Forecasting [8.1] Impermanentは、オープンワールドの時間的変化の下で予測モデルを評価するライブベンチマークである。
私たちは、スター数によるトップ400リポジトリにフォーカスし、イシューのオープン、プルリクエストのオープン、プッシュイベント、新しいスターゲイザーから時系列を構築します。
静的な精度から持続的な性能へ評価をシフトさせることにより、Imbermanentは、時系列予測における基礎レベルの一般化が有意義に主張できるかどうかを評価するための具体的な一歩を踏み出す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:59:34 GMT)
TA-Mem: Tool-Augmented Autonomous Memory Retrieval for LLM in Long-Term Conversational QA [8.0] 大規模言語モデル(LLM)は、様々なドメインにわたるテキストベースのコンテキストにおいて強力な推論能力を示した。
コンテキストウィンドウの制限は、長距離推論タスクにおけるモデルの課題を引き起こす。
ツール拡張型自律メモリ検索フレームワーク(TA-Mem)を導入する。
TA-MemはLoCoMoデータセットで評価され、既存のベースラインアプローチよりも大幅にパフォーマンスが向上した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:27:01 GMT)
CyberThreat-Eval: Can Large Language Models Automate Real-World Threat Research? [8.0] CyberThreat-Evalは、大規模言語モデルのエキスパートアノテーション付きベンチマークである。
ワールドリード企業の日々のCTIワークフローから収集される。
事実の正確性、コンテンツ品質、運用コストを測定するアナリスト中心のメトリクスを使用する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:04:12 GMT)
From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering [7.7] 分散ハイパーグラフクラスタリング(CAHC)のためのコントラスト学習手法を提案する。
CAHCはノード埋め込みを同時に学習し、クラスタリング結果を得る。
大規模な実験の結果、CAHCは8つのデータセットのベースラインよりも優れていた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:46:27 GMT)
AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations [7.7] マルチエージェントシステム(MAS)は適応的で推論駆動の企業を約束するが、ツール、メモリ、通信の自律的な制御をエージェントに与えることで、決定論的パイプラインが欠如する攻撃面を導入する。
AgenticCyOpsは、コンポーネント層、調整層、プロトコル層にまたがる攻撃面を体系的に分解するフレームワークである。
このフレームワークをSecurity Operations Center(SOC)ワークフローに適用し、モデルコンテキストプロトコル(MCP)を構造基盤として採用する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:15:36 GMT)
TRIP-Bag: A Portable Teleoperation System for Plug-and-Play Robotic Arms and Leaders [7.5] TRIP-Bagは携帯型の人形型遠隔操作システムである。
TRIP-Bagは5分未満のセットアップ時間と直接共同作業の遠隔操作により、任意の環境で迅速で信頼性の高いデータ収集を可能にする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:49:47 GMT)
An Optimal Control Approach To Transformer Training [7.1] 重要な構造的制約を尊重するトランスフォーマートレーニングに対する厳密な最適制御理論アプローチを開発する。
確率測度に引き上げることによって、完全に観測されたマルコフ決定過程(MDP)が生成されることを示す。
トランスフォーマーを訓練するために,状態空間,確率測度,行動空間を定量化することにより,昇降型MDPの3次元量子化訓練手順を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:17:48 GMT)
Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems [7.1] 逆問題の解法として, チューナブル・コンプレクティティ・プレッシャを開発する。
可変プリミティブは固定複雑さベースラインよりも低い再構成誤差を連続的に達成できることを実証的に示す。
この研究は、チューナブル・複雑な生成先行の可能性を実証し、支持理論の発展と幅広い逆問題への応用の両方を動機付けている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:28:54 GMT)
Efficient Qubit Simulation of Hybrid Oscillator-Qubit Quantum Computation [7.1] 位置符号化による量子ビットのみのシステム上でのハイブリッド発振器量子プロセッサのためのフレームワークを提案する。
連続可変位置と運動量波関数を量子振幅に符号化することにより、ガウスおよび条件付きガウス演算を効率的にシミュレートする。
フォック境界状態に対する量子変換誤差の厳密な数値計算を行い、正確な資源推定を可能にする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:05:55 GMT)
Algebraic Structure Discovery for Real World Combinatorial Optimisation Problems: A General Framework from Abstract Algebra to Quotient Space Learning [7.1] 多くの最適化問題は、一度露出すると探索空間を縮小し、大域的最適解を見つける可能性を改善する代数構造を隠蔽する。
i)代数構造を特定し、(ii)演算を形式化し、(iii)余剰表現を分解する商空間を構築し、(iv)これらの縮小された空間を直接最適化する一般的な枠組みを提案する。
実際の臨床データと合成ベンチマークでは、クオリエント・スペースを意識した遺伝的アルゴリズムが48%から77%のランで、標準的アプローチでは35%から37%で、同値クラスの多様性を維持している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:47:16 GMT)
Are they human? Detecting large language models by probing human memory constraints [7.1] オンライン行動研究の妥当性は、研究参加者が機械ではなく人間であることに依存している。
大規模言語モデル(LLM)に基づく汎用エージェントは、今や多くの課題を解決し、オンライン行動研究の妥当性を脅かすことができる。
オンライン参加者とLLMを区別するために,標準シリアルリコールタスクにおける認知モデルを用いることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:15:19 GMT)
MUSA-PINN: Multi-scale Weak-form Physics-Informed Neural Networks for Fluid Flow in Complex Geometries [7.0] 階層球面制御ボリューム上でのPDE制約を積分保存則として再構成するマルチスケール弱形PINN(MUSA-PINN)を提案する。
MUSA-PINNは最先端のベースラインを上回り、相対誤差を最大93%削減し、大量保存を行う。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:26:20 GMT)
PM-Nav: Priori-Map Guided Embodied Navigation in Functional Buildings [7.0] 関数型建物(FB)のための事前マップガイド型身体ナビゲーション(PM-Nav)を提案する。
PM-Navは環境マップをナビゲーションフレンドリーなセマンティック事前マップに変換し、正確な経路計画を可能にする階層的連鎖プロンプトテンプレートを設計する。
自家製のFBデータセットを用いた総合的なテストでは、PM-Navはシミュレーションと実世界におけるSG-NavとInstructNavよりも平均で511%と1175%、SG-NavとInstructNavよりも650%と400%向上している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:46:47 GMT)
NLiPsCalib: An Efficient Calibration Framework for High-Fidelity 3D Reconstruction of Curved Visuotactile Sensors [6.9] NLiPsCalibは,曲線型ビゾタクタクタブルセンサの物理一貫性と効率的な校正フレームワークである。
さらに,NLiPsTacは,我々のフレームワークを検証するために開発された,制御可能な光源触覚センサである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:50:49 GMT)
DEO: Training-Free Direct Embedding Optimization for Negation-Aware Retrieval [6.9] 我々は,否定対応テキストとマルチモーダル検索のためのトレーニング不要な手法であるDirect Embedding Optimization (DEO)を提案する。
DEOはクエリを正および負のコンポーネントに分解し、クエリの埋め込みを対照的な目的で最適化する。
追加のトレーニングデータやモデル更新なしで、DeOは、+0.0738 nDCG@10と+0.1028 MAP@100のゲインで、NegConstraintのベースラインを上回っている。
これらの結果は,実環境における否定・排他的検索のためのDECの実用性を示すものである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:47:15 GMT)
SHANG++: Robust Stochastic Acceleration under Multiplicative Noise [6.8] 我々は,ヘッセン駆動のネステロフ加速勾配流を離散化することにより,2つの加速勾配降下法を開発した。
SHANG++は減衰補正を追加し、より強いノイズロバスト性でより高速な収束を実現する。
我々の実験では、SHANG++は、深層学習における凸問題やアプリケーションに対して一貫してよく機能する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:35:53 GMT)
LogoDiffuser: Training-Free Multilingual Logo Generation and Stylization via Letter-Aware Attention Control [6.8] マルチモーダル拡散変換器を用いて多言語ロゴデザインを合成する学習自由手法を提案する。
テキストプロンプトの代わりに、ターゲット文字を画像として入力し、言語によらず頑健な文字構造制御を可能にする。
本手法は,多言語ロゴ生成における最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:57:46 GMT)
Robust Regularized Policy Iteration under Transition Uncertainty [6.7] 我々は、オフラインRLをロバストなポリシー最適化として定式化し、遷移カーネルを不確実性集合内の決定変数として扱う。
本稿では、抽出可能な最大最小二レベル目標を、抽出可能なKL正規化サロゲートに置き換えるロバスト正規化ポリシーイテレーション(RRPI)を提案する。
D4RLベンチマークの実験では、RRPIは高い平均性能を示し、最近のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:18:27 GMT)
A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation [6.6] 新たなガイドライン対応AIフレームワークであるOncoAgentを紹介する。
OncoAgentはテキストの臨床ガイドラインを3次元の目標輪郭にシームレスに無訓練で変換する。
このフレームワークはゼロショットを代替食道ガイドラインや他の解剖学的部位に一般化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:00:01 GMT)
Beyond Amplitude: Channel State Information Phase-Aware Deep Fusion for Robotic Activity Recognition [6.6] Wi-Fi Channel State Information (CSI) は、人間とロボットのアクティビティ認識のための、目視以外の知覚モダリティとして期待されている。
以前の研究は主にCSI振幅に依存し、特にロボットアームの動作認識においてフェーズ情報を利用する。
本稿では,ロボット活動認識におけるWiFiセンシングのためのGateFusion-Bidirectional Long Short-Term Memory Network (GF-BiLSTM)を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:36:45 GMT)
From Verification to Amplification: Auditing Reverse Image Search as Algorithmic Gatekeeping in Visual Misinformation Fact-checking [6.6] この研究は、15日間の窓越しに、新たに同定された誤解を招くイメージを逆検索することで、Google RISを体系的に監査する。
Google RISは相当量の無関係な情報と繰り返しの誤報を返すのに対して、解答コンテンツは検索結果の30%以下である。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:07:27 GMT)
Flow Field Reconstruction via Voronoi-Enhanced Physics-Informed Neural Networks with End-to-End Sensor Placement Optimization [6.6] 流れ場再構成は流体力学において重要であるが, スパースおよび内在的に不完全なセンサ測定により課題が解決される。
本研究では,Voron-enhanced Sensor Optimization (VSOPINN)を用いたPINNを提案する。
VSOPINNは、異なるレイノルズ数間で再構成精度を著しく改善し、効果的なセンサーレイアウトを適応的に学習し、センサ故障時にも頑健である。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:46:52 GMT)
Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models [6.5] 本稿では,幻覚関連ニューラルアクティベーションをトランスフォーマー残流内の構造的干渉として扱うリアルタイム推論フレームワークを提案する。
このフレームワークは階層的に線形な探索を通じて幻覚ノード(H-Nodes)を特定し、信頼度重み付けされたフォワードフックを使用してそれらを抑圧する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:43:18 GMT)
Multilingual AI-Driven Password Strength Estimation with Similarity-Based Detection [6.5] パスワード強度メーター(PSM)は、オンラインプラットフォーム上でアカウントを作成する際に、より強力なパスワードを作成するのに役立つ。
本研究の目的は、英語以外のトレーニングデータセット(特にインド語)を組み込むことで、PSMの性能が向上するかどうかを検討することである。
結果から,ChatGPTデータセットの使用は,セキュアで言語対応のパスワード強度計を開発する上で,有効かつ効果的な戦略であることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:35:20 GMT)
Kinodynamic Motion Retargeting for Humanoid Locomotion via Multi-Contact Whole-Body Trajectory Optimization [6.5] 我々は,人体移動の新しいアプローチであるKinoDynamic Motion Retargeting (KDMR) フレームワークを提案する。
本手法は,ヒトのような接触パターンを正確に再現するために,ヒールトイ接触イベントを自動的に検出する。
実験の結果,KDMRはキネマティック法よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:51:17 GMT)
Memorization capacity of deep ReLU neural networks characterized by width and depth [6.5] このようなネットワークの最小サイズを単位球内の任意の$N$データポイントに対して、ペア分離距離$$と離散ラベルで調べる。
これらの結果は、W2L2=mathcalO(Nlog(-1))$を満足する幅$W$と深さ$L$のニューラルネットワークを構築し、N$のデータサンプルを記憶することができる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:38:58 GMT)
DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis [6.3] 文書偽造検出のための最初の統一ゼロショットベンチマークであるDOCFORGE-BENCHを提案する。
テキスト改ざん、レシート偽造、ID文書操作にまたがる8つのデータセットにまたがる14の手法を評価する。
私たちの中心的な発見は、シングルスレッドプロトコルでは見えない、広範囲にわたるキャリブレーション障害です。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:46:29 GMT)
GIAT: A Geologically-Informed Attention Transformer for Lithology Identification [6.3] Geologically-Informed Attention Transformer (GIAT) は、データ駆動型地質学的先行をTransformerの注意機構と融合させる新しいフレームワークである。
GIATは95.4%の精度で最先端のパフォーマンスを達成し、既存のモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:02:57 GMT)
GST-VLA: Structured Gaussian Spatial Tokens for 3D Depth-Aware Vision-Language-Action Models [6.3] VLAモデルは、内在的な幾何学構造を持たない2次元パッチトークンとして視覚観察を符号化する。
GST-VLAを2つのコントリビューションで紹介する。
第一に、ガウス空間Tokenizer (GST) は凍った深度と凍ったセマンティックパッチの特徴を3Dプリミティブに変換する。
第二に、DA-CoT推論は4つの構造化された中間空間的思考を監督する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:39:38 GMT)
DenoiseSplat: Feed-Forward Gaussian Splatting for Noisy 3D Scene Reconstruction [6.3] ノイズの多い多視点画像に対するフィードフォワード3次元ガウススプラッティング法であるDenoiseSplatを提案する。
ガウシアン,ポアソン,スペックル,ソルト・アンド・ペッパーノイズを注入することにより,RE10K上で大規模でシーン一貫性のあるノイズをクリーンに評価する。
ライトウェイトなMVSplatスタイルのバックボーンで、クリーンな2Dレンダリングのみを監督として、そして3Dの地上真実なしで、エンドツーエンドでトレーニングします。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:22:23 GMT)
Social Knowledge for Cross-Domain User Preference Modeling [6.2] 本研究では,大規模ソーシャルモデリングを用いて,トピック領域間でのユーザの嗜好を表現・予測できることを示す。
ソーシャル空間におけるユーザと人気エンティティの両方を表現することにより、候補エンティティの関連性を評価することができる。
リンク予測実験を用いた包括的評価により, ゼロショット設定における効果的なパーソナライズを実現することを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:33:49 GMT)
SDSR: A Spectral Divide-and-Conquer Approach for Species Tree Reconstruction [6.1] SDSRは,スペクトルグラフ理論に基づく種木再構成のための拡張性のある分割・縮小手法である。
SDSRは,種木復元アルゴリズムをサブルーチンとして組み合わせることで,実行時の大幅な節約効果が得られた。
理論解析により, SDSRとCA-MLやASTRALなどの共通種木法を組み合わせると, 最大10倍高速な実行環境が得られることが示された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:31:16 GMT)
VCR: Variance-Driven Channel Recalibration for Robust Low-Light Enhancement [6.1] VCR(Variance-Driven Channel Recalibration for Robust Low-Light Enhancement)は、低照度画像強調のための新しいフレームワークである。
VCRはChannel Adaptive Adjustment (CAA)モジュールを含む2つの主要コンポーネントで構成されている。
分散誘導型特徴フィルタリングを用いて、高強度および色分布の領域に対するモデルの焦点を拡大する。
既存の方法と比較して最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:10:44 GMT)
WS-Net: Weak-Signal Representation Learning and Gated Abundance Reconstruction for Hyperspectral Unmixing via State-Space and Weak Signal Attention Fusion [6.1] ハイパースペクトル画像における弱スペクトル応答は、支配的なエンドメンバーとセンサーノイズによってしばしば無視される。
本稿では、弱い信号の崩壊に対処するために設計されたディープ・アンミックス・フレームワークであるWS-Netを紹介する。
このフレームワークは低SNR条件下では安定な精度を維持しており、特に弱いエンドメンバーに対して有効である。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:12:33 GMT)
SELF-VLA: A Skill Enhanced Agentic Vision-Language-Action Framework for Contact-Rich Disassembly [6.0] 視覚言語アクション(VLA)モデルは、標準的なロボット操作タスクにおいて印象的なパフォーマンスを示している。
明示的な分解スキルを統合したエージェントVLAフレームワークであるSELF-VLAを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:30:28 GMT)
Association of Radiologic PPFE Change with Mortality in Lung Cancer Screening Cohorts [6.0] 肺癌検診におけるPPFE進行の臨床的意義は明らかでない。
低用量CTにおけるPPFEの経時的変化と死亡率,呼吸障害との関連について検討した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:37:50 GMT)
Distributed Convolutional Neural Networks for Object Recognition [5.9] 本稿では,分散畳み込みニューラルネットワーク(DisCNN)を学習し,特定の正のクラスのみを認識する新たな損失関数を提案する。
正のサンプルを高次元空間のコンパクトな集合と負のサンプルをオリジンにマッピングすることにより、DisCNNは正のクラスの特徴のみを抽出する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:40:45 GMT)
A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing [5.8] 本稿では,プロセスベースサロゲートモデリングのための階層型マルチタスク多面体(H-MT-MF)フレームワークを開発する。
提案フレームワークは,各タスクの応答をタスク固有のグローバルトレンドとタスク間で共同で学習される残差局所変動成分に分解する。
現状のMTLモデルでは、忠実度を考慮せず、個別にタスクを学習するクリグモデルと比較して、提案手法は予測精度を最大19%と23%向上させる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:06:01 GMT)
CLoE: Expert Consistency Learning for Missing Modality Segmentation [5.8] 本稿では,欠落したモダリティセグメンテーションのための一貫性駆動型フレームワークであるConsistency Learning of Experts (CLoE)を提案する。
CLoEは、決定レベルの専門家整合性制御として堅牢性を定式化し、デュアルブランチの専門家整合性学習の目標を導入する。
BraTS 2020とMSD Prostateの実験では、CLoEは不完全なマルチモーダルセグメンテーションにおいて最先端の手法より優れている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:49:58 GMT)
Information Theoretic Bayesian Optimization over the Probability Simplex [5.7] $$-GaBO は確率単純性に対するベイズ最適化アルゴリズムの新たなファミリである。
本稿では,確率単純性に対するベイズ最適化アルゴリズムの新たなファミリである$-GaBOを紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:25:56 GMT)
Class Model Generation from Requirements using Large Language Models [5.7] 大規模言語モデル(LLM)は、自然言語要求から自動的にクラス図を生成することができる。
本稿では,GPT-5,Claude Sonnet 4.0,Gemini 2.5 Flash Thinking,Llama-3.1-8-B-Instructなどの最先端LLMの能力について検討する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:20:35 GMT)
Omni-Masked Gradient Descent: Memory-Efficient Optimization via Mask Traversal with Improved Convergence [5.7] メモリ効率の最適化手法は近年,GPUメモリボトルネック下での大規模言語モデルのフルチューニングに注目が集まっている。
我々は,Omni-O-Masked Descent (OMGD) をメモリ効率トレーニングのアプローチとして提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:15:43 GMT)
LCA: Local Classifier Alignment for Continual Learning [5.6] インテリジェントシステムの基本的な要件は、変化する環境下で継続的に学習する能力である。
本稿では,分類器と背骨との整合性を改善するために,新しいテキストローカルアライメント(LCA)の損失を提案する。
我々の手法は、しばしば先進的な性能を達成し、時には最先端の手法よりも大きなマージンを持つ。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:46:09 GMT)
A Text-Native Interface for Generative Video Authoring [5.6] 生成ビデオオーサリングのためのテキストネイティブインタフェースであるDokiを紹介する。
1つのドキュメントの中で、ユーザーは資産を定義し、構成シーンを定義し、ショットを作成し、編集を洗練し、オーディオを追加する。
この研究は、生成的ビデオインターフェースの根本的な変化に寄与し、ビジュアルストーリーを作るための強力でアクセスしやすい新しい方法を示している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:33:41 GMT)
FreqCycle: A Multi-Scale Time-Frequency Analysis Method for Time Series Forecasting [5.6] 本稿では、時間領域における共有周期パターンを明示的に学習することにより、低周波の特徴を抽出するFreqCycleを提案する。
FreqCycleは、高速な推論速度を維持しながら最先端の精度を実現し、パフォーマンスと効率の最適なバランスを保っている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:34:36 GMT)
Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers [5.5] 我々は,MoE層における不確かさをモデル化するためのベイズ的構造化手法であるVMoER(Sariformal Mixture-of-Experts Routing)を導入する。
VMoERは、一般的に決定論的ルーティングネットワークによって行われるエキスパート選択ステージへの推論を限定する。
試験された基礎モデル全体で、VMoERはノイズ下でのルーティングを38%改善し、配布外AUROCを12%向上させた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:07:53 GMT)
Spectral-Structured Diffusion for Single-Image Rain Removal [5.4] 単イメージ降雨除去に適したスペクトル構造拡散型フレームワークであるSpectralDiffを紹介する。
本手法は,多方向降雨成分の進行抑制を導くため,構造的スペクトル摂動を取り入れた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:53:47 GMT)
EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages [5.4] 大規模な言語モデルは、コード生成ベンチマークでほぼシーリングのパフォーマンスを達成するが、これらの結果は、真の推論ではなく記憶を反映している。
EsoLang-Benchは5つの難解なプログラミング言語を用いたベンチマークで、事前学習のための経済的不合理性のため、ベンチマークゲームインセンティブに欠ける。
これらの言語はメインストリームプログラミングと同じ計算プリミティブを必要とするが、Pythonより1000-100,000倍少ないパブリックリポジトリを持つ。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:47:15 GMT)
ViDia2Std: A Parallel Corpus and Methods for Low-Resource Vietnamese Dialect-to-Standard Translation [5.3] ViDia2Stdは、方言から標準ベトナム語への翻訳に初めて手動で注釈付けされた並列コーパスである。
以前のデータセットとは異なり、ViDia2Stdは中央、南部、非標準北部の様々な方言を含んでいる。
合意率は86%(北)、82%(中央)、85%(南)がViDia2Stdである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:24:38 GMT)
Multi-DNN Inference of Sparse Models on Edge SoCs [5.2] 本稿では,スパースモデルからのサブグラフを再学習せずに組換えることで,モデル変種を生成するマルチDNN推論システムのためのモデル縫合法を提案する。
SparseLoomはSLO違反率を最大74%削減し、スループットを最大2.31倍改善し、メモリオーバーヘッドを最先端のマルチDNN推論システムと比較して平均28%低減することを示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:16:59 GMT)
LooComp: Leverage Leave-One-Out Strategy to Encoder-only Transformer for Efficient Query-aware Context Compression [5.2] 本稿では,クエリ駆動型コンテキストプルーニングのためのマージンベースのフレームワークを提案する。
省略されたときの手がかり豊かさの変化を測定することによって、質問に答えるのに重要な文を特定する。
本手法は, 応答性能を劣化させることなく, 効率的な圧縮比が得られる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:44:20 GMT)
Multimodal Adversarial Quality Policy for Safe Grasping [5.2] Deep Neural Networks (DNN) に基づく視覚誘導型ロボットグリーピングの一般化とヒューマン・ロボットインタラクション(HRI)における安全性のリスク
近年の研究は、RGBのモード性を持つ良質な敵攻撃やパッチを設計することで解決されているが、深さに依存しない特性はRGBDのモード性に対する効果を制限している。
マルチモーダル安全な把握を実現するためのマルチモーダル適応品質ポリシー(MAQP)を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:14:41 GMT)
OA-NBV: Occlusion-Aware Next-Best-View Planning for Human-Centered Active Perception on Mobile Robots [5.1] 移動ロボット(OA-NBV)における人間中心型能動知覚のための隠蔽型次世代視点計画
OA-NBVは、目標中心の可視性モデルを用いて、候補視点を評価することによって、知覚と運動計画を統合する。
シミュレーションと実世界の試験の両方で90%以上の成功率を達成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:46:03 GMT)
MSA-Thinker: Discrimination-Calibration Reasoning with Hint-Guided Reinforcement Learning for Multimodal Sentiment Analysis [5.1] マルチモーダル感情分析は、テキスト、聴覚、視覚のモダリティを統合することで人間の感情を理解することを目的としている。
CoT(Chain-of-Thought)推論を取り入れた既存の手法は、高いアノテーションコストによって妨げられる。
本研究では,Hintに基づく強化学習と構造化識別校正(DC)推論を統合した新しい学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:48:41 GMT)
TASER: Task-Aware Spectral Energy Refine for Backdoor Suppression in UAV Swarms Decentralized Federated Learning [5.0] UAV-DFLでは、グローバルコーディネートと限られた資源の欠如により、外部からの防衛は現実的ではない。
本稿では,分散型防衛フレームワークであるタスク・アウェア・スペクトラル・エナジー・リファクションを提案する。
その結果,TASERは盗難バックドア攻撃に対して有効であり,攻撃成功率は20%以下であり,精度は5%以下であることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:20:47 GMT)
FlexServe: A Fast and Secure LLM Serving System for Mobile Devices with Flexible Resource Isolation [5.0] ARM TrustZoneは、モバイルデバイス上の事実上のハードウェアベースの分離技術である。
本稿では,モバイル端末向け高速かつセキュアなLarge Language Models (LLM) サービスシステムであるFlexServeを紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:31:25 GMT)
Wrong Code, Right Structure: Learning Netlist Representations from Imperfect LLM-Generated RTL [4.8] 大規模言語モデル(LLM)は大規模にレジスタ・トランスファー・レベル(RTL)を生成することができるが、その機能的誤りにより回路解析における使用が妨げられている。
ネットリスト表現学習のためのトレーニングデータとして不完全なRTLを利用する費用対効果のあるデータ拡張とトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:52:41 GMT)
Interview-Informed Generative Agents for Product Discovery: A Validation Study [4.8] 本研究では,インタビューインフォームド生成エージェントが概念テストシナリオでユーザ応答をシミュレートできるかどうかを検討する。
その結果,エージェントは分布校正されているが,識別精度は低いことがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:54:45 GMT)
LAP: A Language-Aware Planning Model For Procedure Planning In Instructional Videos [4.8] 本稿では,視覚的観察と計画を橋渡しする新しい手法であるLanguage-Aware Planning(LAP)を紹介する。
LAPは、視覚観察をテキスト記述に変換するために微調整された視覚言語モデル(VLM)を使用している。
LAPは、複数のメトリクスと時間的地平線をまたいだ新しい最先端のパフォーマンスを、大きなマージンで達成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:48:24 GMT)
The Future of Software Engineering Conferences: A New Zealand Perspective [4.8] 我々は,旅行費の高騰,学暦の不一致,表現の制限などの障壁を識別する。
我々は,ハイブリッド参加,コスト意識の場,ガバナンス改革などの戦略を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:11:25 GMT)
Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing [4.7] 私たちは感情を、モデルがどのようにテキストに従属し、推論するかを形作る潜在要因として研究しています。
我々は、トランスモデルにおいて、感情的なトーンが注意構造を体系的にどう変化させるかを分析する。
トレーニング中に感情条件付き表現の漂流を制限する感情正規化フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:23:18 GMT)
On the Cost of Evolving Task Specialization in Multi-Robot Systems [4.7] タスクの特殊化は、より単純なロボットの動作と、マルチロボットシステムにおける高い効率をもたらす可能性がある。
従来の研究は、コストよりも実現可能性に焦点をあてて、進化的最適化中にタスクの特殊化が出現したことを示している。
我々は,タスク全体に対する汎用的な行動として,限られた評価予算内でサブタスクに対するタスク特殊主義的な行動として,人工ニューラルネットワークを進化させる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:01:03 GMT)
DRIFT: Dual-Representation Inter-Fusion Transformer for Automated Driving Perception with 4D Radar Point Clouds [4.7] DRIFTは、ローカルコンテキストとグローバルコンテキストの両方をキャプチャして融合するモデルである。
広く使われているView-of-Delft(VoD)データセットとプロプライエタリな内部データセットで評価されている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:03:35 GMT)
OmniEdit: A Training-free framework for Lip Synchronization and Audio-Visual Editing [4.7] マルチモーダル学習において,リップ同期と音声視覚編集が基本的な課題として浮上している。
OmniEditは、リップ同期とオーディオ視覚編集の両方のために設計されたトレーニング不要のフレームワークである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:51:28 GMT)
N-gram-like Language Models Predict Reading Time Best [4.7] 近年の研究では、現代の言語モデルが次の単語の予測に長けていることが判明し、その確率は読解時間を予測するために悪化している。
これは、最先端のトランスフォーマー言語モデルによって学習されたより複雑な統計よりも、単純なn-gram統計に敏感な読み込み時間で説明できる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:35:41 GMT)
A Hybrid Quantum-Classical Framework for Financial Volatility Forecasting Based on Quantum Circuit Born Machines [4.6] 本稿では,古典的ニューラルネットワークの強力な表現能力と,量子モデルのユニークな利点を組み合わせることを目的とした,新しいハイブリッド量子古典計算フレームワークを提案する。
金融市場のボラティリティ予測の具体的な課題として,Long Short-Term Memory(LSTM)ネットワークとQuantum Circuit Born Machine(QCBM)を組み合わせたハイブリッドモデルの設計と実装を行った。
実験結果から,従来のLSTMベースラインモデルと比較して,我々のハイブリッド量子古典モデルは,Mean Squared Error (MSE), Root Mean Squared Error (RMSE), Qなど,複数の主要な指標に対して有意な優位性を示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:23:41 GMT)
Grounding Synthetic Data Generation With Vision and Language Models [4.6] 本稿では,リモートセンシングにおける合成データ拡張と評価を解釈可能な視覚言語基盤フレームワークを提案する。
このフレームワークに基づいて、ARAS400k: セグメント化とキャプションのための合成データで拡張された大規模リモートセンシングデータセット。
ARAS400kは、意味合成を分析し、キャプションの冗長性を最小化し、視覚構造と言語記述間の相互整合性を検証することによって、合成データの自動評価を可能にする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:03:53 GMT)
Agentic Control Center for Data Product Optimization [4.5] 専門的なAIエージェントによるデータ製品改善を自動化するシステムを提案する。
質問の回答、多次元品質メトリクスの監視、そしてループ内の人的制御のサポートにより、データは観測可能で精錬可能な資産に変換される。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:15:52 GMT)
Beyond Passive Viewing: A Pilot Study of a Hybrid Learning Platform Augmenting Video Lectures with Conversational AI [4.5] 従来のビデオベースの指導はコスト効率が高くスケーラブルだが、学習者のエンゲージメントを維持するための体系的な失敗を示す。
本稿では、リアルタイムの会話型AI教師と従来のビデオ講義を統合した、ハイブリッド学習プラットフォームを試験的に評価する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:56:19 GMT)
GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models [4.4] 我々は,大規模言語モデル(LLM)を利用してドメイン依存の汎用プランナを生成する新しいフレームワークであるGenePlanを提案する。
GenePlanは、さまざまな問題インスタンスにおけるプラン長を最小限に抑える解釈可能なPythonプランナを反復的に進化させる。
実証的な評価では、GenePlanは平均SATスコア0.91を達成し、最先端のプランナーの性能と密接に一致した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:32:05 GMT)
A Gaussian Comparison Theorem for Training Dynamics in Machine Learning [4.3] ガウス混合モデルに基づくデータを用いた学習アルゴリズムについて検討する。
非漸近的な結果を示し、モデルの進化を代理力学系に結びつける。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:42:36 GMT)
MuxGel: Simultaneous Dual-Modal Visuo-Tactile Sensing via Spatially Multiplexing and Deep Reconstruction [4.2] 高忠実度粘性触覚は正確なロボット操作に重要である。
ほとんどの視覚ベースの触覚センサーは、基本的なトレードオフに直面している。
本研究では,空間的多重化センサであるMuxGelを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:59:45 GMT)
RAE-NWM: Navigation World Model in Dense Visual Representation Space [4.2] 本稿では,高密度な視覚的表現空間におけるナビゲーションダイナミクスをモデル化するRepresentation Autoencoder-based Navigation World Model (RAE-NWM)を提案する。
連続的な遷移をモデル化するためにデカップリング拡散変圧器ヘッド(CDiT-DH)を用いた条件拡散変圧器を用い、生成中の動作注入強度を制御するために動的条件付けのための時間駆動ゲーティングモジュールを別々に導入する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:16:23 GMT)
Relaxed parameter sensitivity for multiphoton quantum resonances [4.1] 多光子共鳴は変形誤差に敏感である。
この問題に対処するための最適化戦略を導入する。
周波数調整に対する戦略の汎用性を証明する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:08:01 GMT)
Context-Nav: Context-Driven Exploration and Viewpoint-Aware 3D Spatial Reasoning for Instance Navigation [4.0] Text-goal instance navigation (TGIN)は、エージェントに単一の自由形式の記述を正しいオブジェクトインスタンスに到達するアクションに解決するよう要求する。
ローカルキューからグローバルな探索に先立ってコンテキストキャプションを上昇させ、3次元空間推論により候補を検証するtextitContext-Nav を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:08:35 GMT)
Alignment-Process-Outcome: Rethinking How AIs and Humans Collaborate [4.0] 我々は2つの補体レンズを通して協調を再認識する。
タスクレンズは、構造化されたタスク空間における軌道進化として協調し、進行、分岐、バックトラックなどのパターンを明らかにする。
インテントレンズは、個々のインテントが共有コンテキスト内でどのように表現され、位置決定に入るかを調べる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:11:48 GMT)
A Hierarchical End-of-Turn Model with Primary Speaker Segmentation for Real-Time Conversational AI [4.0] 音声ベースの会話型AIのフロントエンドをリアルタイムに提供し、2話者シナリオでの自然なターンテイクを可能にする。
マルチスピーカー環境においてロバストに動作するために、システムはメインユーザーを継続的に識別し追跡する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:17:17 GMT)
Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health [3.9] 本研究は,フランスにおける大規模言語モデル (LLMs) のバイアスについて,性別と他の社会的健康決定因子 (SDoH) の関係を調査することによって検討した。
組込みステレオタイプはSDoH入力を用いて探索することができ、LSMはジェンダー決定を行うために組込みステレオタイプに依存していることがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:30:10 GMT)
Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models [3.8] 時系列基礎モデル (TSFM) は、ハイテイク領域にますます展開されている。
TSFMにスパースオートエンコーダ(SAE)を初めて適用し,Chronos-T5-Largeパラメータの活性化に関するTopK SAEを訓練する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:31:33 GMT)
DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data [3.8] イベントベースのニューラルネットワークは、多様な感覚処理と計算タスクを解決するために使用できる。
彼らは時間情報を高い精度で復号するのに苦労している。
彼らは一般的に、時間計算能力を高めるために、繰り返しや遅延を頼りにしている。
本研究では,デンドライトの枝に存在する配列検出機構に着目し,新しいタイプのニューラルネットワークに変換する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:59:19 GMT)
Walking on Rough Terrain with Any Number of Legs [3.7] 本研究では,2本の足に3つのアクチュエータを備えたセグメント型ロボットを用いて,荒地に対する多脚制御アーキテクチャを提案する。
私たちの設計は、WalkNetのようなイベントカスケードコントローラとCPGベースのコントローラのギャップを埋めるものです。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:37:44 GMT)
Unifying Logical and Physical Layout Representations via Heterogeneous Graphs for Circuit Congestion Prediction [3.7] 回路成分と空間格子を単一のリレーショナル表現に統一する拡張ヘテロジニアスグラフ上に構築された検証フレームワークを提案する。
ISPD2015、CircuitNetN14、CircuitNet-N28といった産業ベンチマークの実験では、予測精度と相関指標における最先端手法に対する一貫した改善が示されている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:39:48 GMT)
Evaluation of LLMs in retrieving food and nutritional context for RAG systems [3.6] 本研究では,Large Language Model (LLM) を4つ評価し,RAG(Retrieval-Augmented Generation) システムにおけるデータ検索の有効性について検討した。
提案手法は,自然言語クエリを構造化メタデータフィルタに変換するLLM機能に着目している。
容易かつ適度に複雑なクエリのパフォーマンスにもかかわらず、難解な質問を解析した結果、クエリが非表現可能な制約を含む場合、信頼性の高い検索は依然として困難であることが判明した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:15:35 GMT)
Beyond Fine-Tuning: Robust Food Entity Linking under Ontology Drift with FoodOntoRAG [3.6] 本稿では,ドメインオンラグからNELエンティティを抽出するモデル診断パイプラインを提案する。
パイプラインは、既存のアノテーションのギャップと矛盾を明らかにする最先端の精度にアプローチする。
この設計は微調整を回避し、進化に対する堅牢性を改善し、基礎的な正当化を通じて解釈可能な決定をもたらす。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:57:34 GMT)
MO-Playground: Massively Parallelized Multi-Objective Reinforcement Learning for Robotics [3.5] 我々はGPUネイティブで高速なMORLアルゴリズムであるMORLAXを提案する。
また、GPUアクセラレーションによるマルチオブジェクト環境のピップインストール可能なプレイグラウンドであるMO-Playgroundも紹介する。
我々は,BRUCEヒューマノイドロボット環境を実装することで,我々のアプローチの汎用性を実証する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:12:56 GMT)
Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts [3.5] 本稿では,軽量なポリシーを構築するために,プロンプト・アズ・アクションをパラメータ化できるかどうかを検討する。
応答性,反感,エビデンス利用,非反復性,姿勢変化の5つの指標に基づいて対話の流れを評価する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:47:25 GMT)
TATIC: Task-Aware Temporal Learning for Human Intent Inference from Physical Corrections in Human-Robot Collaboration [3.5] ヒューマンロボットコラボレーション(HRC)では、ロボットは動的タスクの制約にオンラインで適応し、人間の意図を進化させなければならない。
本稿では,トルクベース接触力推定とタスク対応時間畳み込みネットワーク(TCN)を利用した個別タスクレベルの意図を推定する統合フレームワークTATICを提案する。
実験は意図認識において0.904 Macro-F1のスコアを獲得し、ハードウェアの検証に成功した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:19:25 GMT)
LLM as a Meta-Judge: Synthetic Data for NLP Evaluation Metric Validation [3.5] 実データのセマンティックな劣化を制御して合成評価データセットを生成するスケーラブルなフレームワークであるMeta-JudgeとしてtextitLLMを提案する。
我々は、合成データから得られたメートル法ランキングと、標準的なヒトのベンチマークから得られたメートル法ランキングのアライメントを測定し、テクトメタ相関を用いてアプローチを検証する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:15:19 GMT)
FusionNet: a frame interpolation network for 4D heart models [3.4] 本研究では,高時間分解能で4次元(4次元)心臓運動を得るためのFusionNetというニューラルネットワークを提案する。
モデルは、隣接した形状に基づいて、中間的な3次元心臓形状を推定する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:26:09 GMT)
Reinforced Generation of Combinatorial Structures: Ramsey Numbers [3.4] 5つの古典ラムゼー数に対する下界の改善を示す。
AlphaEvolveは1つのメタアルゴリズムで、検索結果の検索アルゴリズムを出力します。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:20:40 GMT)
Delta-K: Boosting Multi-Instance Generation via Cross-Attention Augmentation [3.3] 拡散モデルはしばしば複雑なシーンを合成する際に概念の欠落に悩まされる。
本稿では,共有キー空間内で直接操作することで省略に対処する,バックボーンに依存しないプラグイン・アンド・プレイ推論フレームワークであるDelta-Kを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:23:00 GMT)
Digital dissipative state preparation for frustration-free gapless quantum systems [3.2] フラストレーションのないギャップレスシステムに対して,局所指数測定とユニタリフィードバックを用いたプロトコルを提案する。
単一粒子のダイナミックスに対するプロトコルの性能を解析的に示す。
この機構は準粒子の物理に基づいて多体系に一般化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:00:06 GMT)
SCDP: Learning Humanoid Locomotion from Partial Observations via Mixed-Observation Distillation [3.1] 本稿では,センサのみを用いたヒューマノイド移動を可能にするセンサ・コンディション・ディフュージョン・ポリシー(SCDP)を提案する。
SCDPは、混合観測訓練による監視からのセンシングを分離する。
速度制御された移動と運動基準追跡タスクにおけるSCDPの有効性を検証した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:21:11 GMT)
Caterpillar-Inspired Spring-Based Compressive Continuum Robot for Bristle-based Exploration [3.1] 本稿では,コンパクトなバネ型腱駆動型連続ロボットについて述べる。
このシステムは、機械的に適合した連続体と腱作動モジュールを結合し、複合曲げおよび軸長変化を可能にする。
実験の結果,提案したモデルと制御パイプラインの下での平均位置誤差は4.32mmであった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:51:00 GMT)
Fusing Semantic, Lexical, and Domain Perspectives for Recipe Similarity Estimation [3.0] 食品レシピのセマンティック、レキシカル、ドメインの類似性について検討し、材料、調製方法、栄養特性の分析を通して評価した。
ドメインの専門家が組み合わせた類似性の結果を検証するために、Webベースのインターフェースが開発された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:56:20 GMT)
Unbalanced Optimal Transport Dictionary Learning for Unsupervised Hyperspectral Image Clustering [3.0] ハイパースペクトル画像は、シーンに関する大量の高次元のスペクトル情報をキャプチャする。
クラスタの教師なし学習は、シーンの自動セグメンテーションを可能にする。
本稿では,不均衡なワッサーシュタイン・バリセンタを利用することにより,このアプローチを改善することを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:15:30 GMT)
Leveraging whole slide difficulty in Multiple Instance Learning to improve prostate cancer grading [2.8] 専門医と非専門的な病理医の意見の相違から,WSD(Whole Slide Difficulty)の概念を紹介した。
本稿では,WSD,マルチタスクアプローチ,重み付き分類損失アプローチの2つの方法を提案する。
その結果、訓練中にWSDを統合することで、異なる機能エンコーダとMILメソッド間の分類性能が一貫して向上することがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:49:29 GMT)
Latent World Models for Automated Driving: A Unified Taxonomy, Evaluation Framework, and Open Challenges [2.8] 本稿では,自動走行のための世界モデルの最近の進歩を生かした,一貫したラテント空間フレームワークを提案する。
このフレームワークは、ラテント表現(ラテント・ワールド、ラテント・アクション、ラテント・ジェネレータ、連続状態、離散トークン、ハイブリッド)と幾何学、トポロジー、セマンティクスの構造的先行によって設計空間を整理する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:56:17 GMT)
Learning from Radio using Variational Quantum RF Sensing [2.7] 本稿では,量子回路を用いて最適化した量子センシングプローブを用いて,その環境について学習するエージェントについて考察する。
無線信号から量子センサを学習することで、デプロイメント時にチャネル計測を必要としないインテリジェントなシステムを実現できることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:26:43 GMT)
Enhanced security in Quantum Token protocols using Hybrid Spin-Photon Interfaces [2.7] 量子トークンプロトコルは、無条件のセキュリティを約束する、忘れられない量子トークンを可能にする。
ここでは、スピン光子インタフェースを含む場合、準備、保存、検証を含む量子トークンプロトコルの3つのステージをよりセキュアにすることができることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:31:05 GMT)
Ethical Fairness without Demographics in Human-Centered AI [2.7] 最適化の幾何学を通してアルゴリズム的公正性と倫理的原則を整合させるフレームワークであるFrareを提示する。
また,BHE(Beneficence-Harm Avoidance-Equity)についても紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:09:07 GMT)
Benchmarking Dataset for Presence-Only Passive Reconnaissance in Wireless Smart-Grid Communications [2.7] 本稿では,一様無線および有線リンクを持つ有線ホームエリアネットワーク(HAN),近隣エリアネットワーク(NAN)および広帯域ネットワーク(WAN)通信グラフ上での受動偵察のためのIEEEに着想を得た文献アンコール型ベンチマーク・データセット・ジェネレータを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:39:03 GMT)
Optimal Universal Bounds for Quantum Divergences [2.7] 古典的発散の平滑化の基礎となる普遍的な構造原理を同定する。
滑らかな量子発散に対する最適普遍境界を導出する。
特に、仮説テストの発散に対する最適普遍境界を求める。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:42:50 GMT)
Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference [2.7] 我々は、複数のタスクをインターリーブした処理において、思考モードがユニークな脆弱性を示すことを観察する。
単一プロンプト内で複数のタスクストリームによって重畳された干渉を生成するマルチストリーム摂動攻撃を提案する。
本手法は,主流モデルにおける攻撃成功率よりも高い攻撃成功率を達成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:40:49 GMT)
VarSplat: Uncertainty-aware 3D Gaussian Splatting for Robust RGB-D SLAM [2.6] VarSplatは3DGS-SLAMシステムである。
従来のRGB-D SLAMと比較して,VarSplatはロバスト性,競争性,優れたトラッキング,マッピング,新しいビューレンダリングを改善していることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:42:58 GMT)
Component-Aware Sketch-to-Image Generation Using Self-Attention Encoding and Coordinate-Preserving Fusion [2.5] フリーハンドスケッチをフォトリアリスティックな画像に変換することは、画像合成の根本的な課題である。
GANベースのモデルや拡散ベースのモデルを含む既存のアプローチは、細かな細部を再構築したり、空間的アライメントを維持したり、異なるスケッチ領域に適応するのに苦労することが多い。
本稿では,新しい2段階アーキテクチャを用いて,これらの課題に対処するスケッチ・ツー・イメージ生成のための,コンポーネント対応の自己修正フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:39:24 GMT)
AutoViVQA: A Large-Scale Automatically Constructed Dataset for Vietnamese Visual Question Answering [2.5] VQA(Visual Question Answering)は、モデルが視覚情報とテキスト情報を共同で理解する必要がある基本的なマルチモーダルタスクである。
近年の研究では、VQAタスクにおいて、大規模言語モデルによって自動評価と人的判断の整合性がさらに向上することが示唆されている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:57:52 GMT)
Fast and Optimal Differentially Private Frequent-Substring Mining [2.5] ユーザ分散文字列のデータセットが$n$で、各長さが$ell$である場合、重要な問題は、すべての頻繁な呼び出しを識別する方法である。
我々は,空間複雑性を低減しつつ,ほぼ最適な誤差保証を保った新しい$varepsilon$-differentially privateアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:04:52 GMT)
Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs [2.4] 大規模言語モデル(LLM)は、様々な現実世界のアプリケーションやユーザコミュニティにデプロイされるようになっている。
その傾向は、常識的理解よりも道徳的推論を優先する傾向にある。
我々の包括的分析は、大規模言語モデルの常識的堅牢性を改善するために、推論認識の強化の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:47:18 GMT)
Systematic Review of Academic Procrastination Interventions in Computing Higher Education [2.4] 本稿では,学術的進歩を抑えるための介入を実証的に検討する研究の文献レビューを行う。
本研究は, 時間的構造を明確化するための介入が, 早期の開始と分散作業の促進を一貫して促進していることを示唆している。
本総説では,コンピュータ教育における先進性に対処するために,構造化,支援,パーソナライズされた介入を設計することの重要性を強調した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:54:11 GMT)
PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution [2.3] 自然言語として知識を格納するLLMエージェントは、条件数の増加に伴って急激な検索劣化に悩まされる。
本稿では,3つの密結合コンポーネントによるテスト時間適応のための統合フレームワークであるPreCEPTを紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:16:45 GMT)
Adaptive Loops and Memory in Transformers: Think Harder or Know More? [2.3] 思考の連鎖は言語モデルにおける推論を可能にするが、中間段階の明示的な言語化を必要とする。
ループ変換器は、隠された状態内の表現を反復的に精製する代替手段を提供する。
適応型層間ループとゲート型メモリバンクの両方を特徴とするトランスモデルについて検討する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:27:59 GMT)
Declarative Scenario-based Testing with RoadLogic [2.2] 宣言型OS2仕様と実行可能なシミュレーションを橋渡しするRoadLogicを提案する。
結果は、RoadLogicが数分で、現実的で、仕様に満足するシミュレーションを一貫して生成していることを示している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:11:09 GMT)
DCAU-Net: Differential Cross Attention and Channel-Spatial Feature Fusion for Medical Image Segmentation [2.2] 本稿では, DCAU-Netを提案する。
まず,2つの独立なソフトマックスアテンションマップの違いを計算するために,新しい微分クロスアテンション(DCA)を設計した。
第2に,Channel-Spatial Feature Fusion (CSFF) 戦略を導入し,特徴を適応的に再検討する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:37:10 GMT)
Deep Learning for BioImaging: What Are We Learning? [2.2] 顕微鏡画像では、現在の表現学習法が実際に何を学んでいるのかは不明だ。
我々は、未訓練のモデルと細胞組織の単純な構造表現を含む、キュレートされたベンチマーク上で単純で明らかなベースラインのセットを紹介した。
自然画像とは対照的に、既存のモデルは、高レベルで生物学的に意味のある特徴を一貫して取得できない。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:49:09 GMT)
Stability and Robustness via Regularization: Bandit Inference via Regularized Stochastic Mirror Descent [2.1] 最近の研究で、安定性は適応性の下での有効な推論に十分な条件であると認識されている。
本稿では,ミラー降下に基づく帯域幅アルゴリズムの安定性の体系的理論を考案する。
正規化されたEXP3の変種は、敵の腐敗がある場合でも経験的アームの正常性を維持する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:27:47 GMT)
From Days to Minutes: An Autonomous AI Agent Achieves Reliable Clinical Triage in Remote Patient Monitoring [2.1] 遠隔患者モニタリング(RPM)は膨大なデータを生成するが、データ量が臨床スタッフを圧倒したため、目覚ましい臨床試験(Tele-HF, BEAT-HF)は失敗した。
RPMバイタルのコンテキストトリアージにモデルコンテキストプロトコル(MCP)を用いた自律型AIエージェントSentinelを開発した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:50:54 GMT)
Cutting the Cord: System Architecture for Low-Cost, GPU-Accelerated Bimanual Mobile Manipulation [2.1] 我々は,オープンソースのXLeRobot上に構築されたバイマニュアル・モバイル・マニピュレータを1300ドル未満でオンボード・コンピューティングに統合する。
主な貢献は,(1)剛性-重み比を最大化する機械設計,(2)モータ誘起電圧過渡度から計算を分離するTri-Busパワートポロジー,(3)非接触動作にNVIDIA Jetson Orin Nanoを用いた組込み自律性などである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:44:23 GMT)
Emotional Modulation in Swarm Decision Dynamics [2.0] 我々は、蜂の方程式をエージェントベースモデルに拡張し、コンセンサス形成における感情的伝染を研究する。
その結果,感情変調は意思決定結果に偏りを生じ,収束時間を変化させる可能性が示唆された。
提案フレームワークは,自然システムと人工システムの両方において,集団選択の感情的次元を研究する柔軟なツールを提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:56:42 GMT)
S-GRADES -- Studying Generalization of Student Response Assessments in Diverse Evaluative Settings [2.0] 長いエッセイから短い事実回答への学生の反応を評価することは、NLPの教育において重要な課題である。
S-GRADESは、14の多様なグレーティングデータセットを統一インターフェースで統合するWebベースのベンチマークである。
S-GRADESの実用性を実証するために,複数の推論手法を用いて,ベンチマーク全体で最先端の3つの大規模言語モデルを評価した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:11:51 GMT)
MissBench: Benchmarking Multimodal Affective Analysis under Imbalanced Missing Modalities [2.0] マルチモーダルな感情タスクのためのベンチマークとフレームワークであるMissBenchを紹介する。
MissBenchは、共有および非バランスの欠落率プロトコルを標準化する。
共有欠落率の下で頑健に見えるモデルは、依然として顕著なモダリティの不等式を示すことができることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:36:45 GMT)
Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version) [1.9] 協調型マルチエージェント計画のための協調型ボルツマンMCTS(CB-MCTS)を提案する。
CB-MCTSは、決定論的UCTをボルツマンのポリシーと、持続的だが焦点を絞った探索のための減衰エントロピーボーナスに置き換える。
シミュレーションの結果,Dec-MCTSは詐欺的シナリオでは優れ,標準ベンチマークでは競争力を維持していることがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:54:00 GMT)
ImpedanceDiffusion: Diffusion-Based Global Path Planning for UAV Swarm Navigation with Generative Impedance Control [1.9] ImpedanceDiffusionは、乱雑な屋内環境における安全な群れナビゲーションのための階層的なフレームワークである。
このフレームワークは,RGB画像から直接幾何学的グローバルな軌跡を生成する。
安定なインピーダンスベース生成制御を維持しつつ、有界振動と飛行中の衝突のない92%の成功率を達成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:06:55 GMT)
The SQInstructor: a guide to SQIsign and the Deuring Correspondence with level structures [1.9] 公開鍵とコミットメントを考えると、それらの間に同義性を示すことが課題である。
そして、そのフレームワークを1次元および2次元の同種を用いてインスタンス化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:53:49 GMT)
SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space [1.9] オフラインからオンラインへの強化学習(RL)は、安全でオフラインなデモに関するポリシーを事前訓練し、オンラインインタラクションを通じてそれらを微調整することで、ロボット工学に有望なパラダイムを提供する。
本研究では,サンプル効率,安全な行動改善のために,まず低次元潜在多様体の探索を制約するカリキュラム学習フレームワークであるSPAARSを紹介する。
本稿では、性能差分補題を用いた利用ギャップの上限を証明し、潜時空間政策勾配が生空間探索よりも証明可能な分散化を実現することを証明し、潜時位相における同時動作のクローンがカリキュラムの遷移安定性を直接制御していることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:52:15 GMT)
Actor-Accelerated Policy Dual Averaging for Reinforcement Learning in Continuous Action Spaces [1.9] Policy Dual Averaging (PDA)は原則化されたPolicy Mirror Descent (PMD)フレームワークを提供する。
連続状態およびアクション空間におけるPDAの適用は、依然として計算的に困難である。
本稿では、学習ポリシーネットワークを用いて、最適化サブプロブレムの解を近似するテキストタラクタアクセラレーションPDAを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:05:18 GMT)
Benchmarking Political Persuasion Risks Across Frontier Large Language Models [1.8] 以前の研究では、Large Language Models (LLMs) は標準的な政治キャンペーンの慣行ほど説得力がないと主張している。
我々は,Arthropic,OpenAI,Google,xAIによって開発された7つの最先端LLMを評価した。
特にクロードモデルは最も説得力があり、グロクは最低である。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:42:05 GMT)
Rethinking Adam for Time Series Forecasting: A Simple Heuristic to Improve Optimization under Distribution Shifts [1.8] 時系列の予測は、しばしば分布のドリフトによる課題に直面します。
この動的な振る舞いは、アダムのような適応的な風景の有効性を損なう可能性がある。
学習速度から2階補正を除去する軽量な変種TS_Adamを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:31:02 GMT)
PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks [1.8] PolyBlocksは、AIプログラミングフレームワークとAIチップのための、モジュール的で再利用可能なMLIRベースのコンパイラインフラストラクチャである。
PolyBlocksの設計とアーキテクチャにより、高レベルなフレームワークから低レベルなターゲット特化言語への完全な自動コード生成が可能になる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:20:46 GMT)
Preparing Students for AI-Driven Agile Development: A Project-Based AI Engineering Curriculum [1.8] 本稿では、AI駆動型アジャイル開発のための学生のためのプロジェクトベースのAIエンジニアリングカリキュラムを提案する。
本研究は,(1)カリキュラムの概念と指導原則,(2)学際的,AI対応のアジャイル学生プロジェクトの事例研究,(3)混合メソッド評価による早期の証拠を提示する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:44:23 GMT)
ACE Runtime - A ZKP-Native Blockchain Runtime with Sub-Second Cryptographic Finality [1.7] 既存の高性能ブロックチェーンは、クリティカルパス上のトランザクション毎にひとつのシグネチャを検証する。
本稿では、認証認証分離に基づくZKPネイティブ実行層であるACEについて述べる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:39:36 GMT)
Context Before Code: An Experience Report on Vibe Coding in Practice [1.7] 本稿では,生産制約下での「バイブコーディング」に関する経験報告を示す。
我々は、持続的で生産指向の用途に設計されたマルチプロジェクトエージェント学習プラットフォームを構築した。
繰り返し発生するアーキテクチャ "非デリゲーションゾーン" を識別する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:20:33 GMT)
ASCAT: An Arabic Scientific Corpus and Benchmark for Advanced Translation Evaluation [1.7] ASCATは、平均141.7語(英語)と111.78語(アラビア語)の科学的な要約を対象とする。
各抽象化は、3つの補完的生成AI(Gemini)、トランスフォーマーベースモデル(Hugging Face texttquickmt-en-ar)、商用MT API(Google Translate、DeepL)を使用して翻訳された。
その結果得られたコーパスには67,293の英語のトークンと60,026のアラビア語のトークンが含まれており、アラビア語の語彙は17,604で、言語の形態的豊かさを反映している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:41:52 GMT)
Physics-informed neural operator for predictive parametric phase-field modelling [1.7] パラメトリック位相場PDE(PF-PINO)を学習するための物理インフォームドニューラルネットワークフレームワークを開発した。
位相場制御方程式の残余をデータ忠実度損失関数に埋め込むことにより,本フレームワークはトレーニング中の物理的制約を効果的に実施する。
以上の結果から,PF-PINOは従来のFNOよりも精度,一般化能力,長期安定性が優れていた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:00:00 GMT)
An Analysis of Modern Web Security Vulnerabilities Inside WebAssembly Applications [1.7] Buffer OverflowsやUse After Freeといったバイナリ脆弱性は、WASMバイナリの現在の危険であることを示す。
私たちの研究は、WebAssemblyモジュール上でこのような脆弱性が、予期しない方法でWebアプリケーションの振る舞いに影響を与えることを実証することを目的としています。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:39:19 GMT)
SpecOps: A Fully Automated AI Agent Testing Framework in Real-World GUI Environments [1.6] SpecOpsはGUIベースのAIエージェントを現実の環境で評価するために設計された、新しい完全に自動化されたテストフレームワークである。
エンドツーエンドのタスクコヒーレンス、堅牢なエラー処理、さまざまなエージェントプラットフォームへの適応性など、重要な課題に対処する。
F1スコア0.89の現実世界のエージェントの164の真のバグを識別する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:56:03 GMT)
Class Visualizations and Activation Atlases for Enhancing Interpretability in Deep Learning-Based Computational Pathology [1.6] トランスフォーマーベース基礎モデルを用いて, クラスビジュアライゼーション (CV) とアクティベーションアトラス (AA) を評価した。
CVは形態学的に異なる組織に対する認識性を保ったが,重複癌サブクラスに対する分離性は低下した。
組織レベルの粗い概念がコヒーレントな領域を形成したのに対し、より微細なサブクラスは分散と重複を示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:57:54 GMT)
ShapeMark: Robust and Diversity-Preserving Watermarking for Diffusion Models [1.5] ノイズ・アズ・ウォーターマーク(NaW)アプローチは、透かしを直接拡散過程に統合する。
ノイズ要素の位置を値を変更することなく補充する専用ランダム化設計を導入する。
本手法は,多種多様な損失シナリオにまたがる高次品質を維持しつつ,最先端のロバスト性を実現する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:10:47 GMT)
No evaluation without fair representation : Impact of label and selection bias on the evaluation, performance and mitigation of classification models [1.5] ラベルバイアスと選択バイアスのいくつかのサブタイプが分類モデルの評価に与える影響を実験的に分析した。
公正な世界とそのバイアスのある世界をモデル化できるバイアスと評価のフレームワークを導入します。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:34:53 GMT)
Facial-Expression-Aware Prompting for Empathetic LLM Tutoring [1.5] 本研究では, 表情認識信号が, 即時統合による共感的学習反応を改善できるかどうかを考察する。
学生エージェントが、大規模な未ラベルの表情ビデオデータセットから多様な顔行動を示す、スケーラブルなシミュレートされた学習環境を構築する。
教師のバックボーンにまたがる960件のマルチターン会話において,5人のレイパーと全AI評価器の対対比較を行った。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:16:24 GMT)
Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records [1.4] 本研究では,非構造化電子健康記録を利用した自動分類フレームワークを提案する。
オランダの縦断的臨床物語に3つの異なるモデリングパラダイムをベンチマークした。
分析の結果,カスタムトランスフォーマーアーキテクチャは従来の手法と生成的アセルムの両方に優れていたことが判明した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:55:42 GMT)
Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models [1.4] 大きな言語モデル(LLM)は有害なコンテンツを生み出す可能性がある。
本研究では,軽量なアクティベーション空間の敵攻撃であるアムネシアを提案する。
実験の結果,提案手法はLSMの様々な反社会的行動を引き起こすことが示唆された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:41:03 GMT)
ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation [1.4] ARCHEは、モデリング精度と計算効率のバランスをとるエンドツーエンドの学習画像圧縮フレームワークである。
再カレントやトランスフォーマーベースのコンポーネントに頼ることなく、最先端の速度歪み効率を実現する。
視覚的比較は、特に低ビットレートで、よりシャープなテクスチャと色の忠実度を確認できる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:32:10 GMT)
Task Aware Modulation Using Representation Learning for Upsaling of Terrestrial Carbon Fluxes [1.4] 本稿では,知識誘導型エンコーダデコーダアーキテクチャと損失関数を結合したTAM-RL(Task-Aware Modulation with Representation Learning)を提案する。
多様な生物や気候体制を表す150以上のフラックスタワーの地点で、TAM-RLは既存の最先端のデータセットと比較して予測性能を改善している。
これらの結果から, 適応表現学習と物理基底制約を組み合わせることで, 地球規模の炭素フラックス推定のロバスト性や伝達性を大幅に向上できることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:59:29 GMT)
Decoherence-free Behaviors of Quantum Emitters in Dissipative Photonic Graphene [1.3] 我々は、フォトニックグラフェンに結合したエミッタの量子力学を解析的に探求する。
有限格子内では、単一量子エミッタの励起はデコヒーレンスで保護された量子状態で安定化する。
この機能は、トポロジカルグラフプラットフォームに拡張することができる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:09:03 GMT)
Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure [1.3] 合成データ生成はデータの不足とプライバシ制約に対処する。
生成プロセスに因果構造を組み込む方法を示す。
制御されたベンチマークと6つのCSuiteデータセットに対して,これらのアプローチを評価する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:16:44 GMT)
FedPrism: Adaptive Personalized Federated Learning under Non-IID Data [1.3] FedPrismは、各クライアントのモデルを3つの部分から構築するフレームワークである。
Prism Decompositionメソッドを使用して、各クライアントのモデルを3つの部分から構築する。
また、Dual-Streamデザインを使用しており、地元のスペシャリストと一緒に一般的なモデルを実行している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:22:54 GMT)
Recent advances in Ultralong-range Rydberg molecules [1.3] リドベルク分子は、基底原子とリドベルク電子の間の低エネルギー電子原子散乱相互作用を介して結合するグラウンド・リドベルク分子と、リドベルク原子とイオンの間の長距離静電相互作用を介して結合するリドベルク・リドベルク分子と、リドベルク原子とイオンの間の単一または多極的相互作用を介して結合するイオン・リドベルク分子の3つのカテゴリに分けられる。
このレビューは、二原子リドバーグ分子の最近の理論的および実験的進歩に焦点をあて、それらの形成と結合機構、ポテンシャルエネルギー曲線、実験的観察をカバーしている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:07:53 GMT)
Curveball Steering: The Right Direction To Steer Isn't Always Linear [1.3] アクティベーションステアリング(Activation steering)は、内部表現に介入して大きな言語モデル(LLM)の振る舞いを制御するために広く用いられるアプローチである。
本稿では,PCAカーネルをベースとした非線形ステアリング手法であるCurveball steeringを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:45:35 GMT)
Universal Family-Vicsek scaling in quantum gases far from equilibrium [1.3] 古典システムの成長する表面のゆらぎは、FV(Family-Vicsek)スケーリングとして知られる普遍的なスケーリングを示す。
この結果は、古典的表面成長の普遍的なスケーリング法則が量子多体系にまで拡張されていることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:05:06 GMT)
You Didn't Have to Say It like That: Subliminal Learning from Faithful Paraphrases [1.2] サブリミナルラーニング(サブリミナルラーニング、Subliminal learning)とは、教師から生徒モデルへの特性伝達を、それらの特性とは無関係なデータのトレーニングを通じて行うことを指す。
本研究では,ある意味的内容が固定された自然言語のパラフレーズを通して伝達されるかどうかを考察する。
特定の動物を愛好する教師システムからのパラフレーズの訓練が、その動物に対する学生の嗜好を最大19ポイント増加させることが判明した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:21:14 GMT)
Quantum-preserving telecom conversion of atomic biphotons [1.2] ダイヤモンド型原子アンサンブルを用いた原子二光子の通信周波数変換実験を行った。
効率的な変換は、時間的波形と非古典的アンチバンチ動作を保持しながら達成される。
その結果、原子光子源と通信ファイバーネットワークの実用的なインターフェースを確立し、量子干渉と分散量子通信を可能にした。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:46:45 GMT)
Game-Theoretic Modeling of Stealthy Intrusion Defense against MDP-Based Attackers [1.2] 我々は、攻撃グラフ上の攻撃者とディフェンダーとの間の戦略的相互作用として、高度な永続的脅威をモデル化する。
攻撃者の位置と進行に関する限られた情報により、ディフェンダーは侵入検知センサーを配置することでランダムな間隔で行動する。
我々は、対応する最適化問題を解くことによって最適な防御戦略を導出する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:35:57 GMT)
Enabling Multi-Client Authorization in Dynamic SSE [1.2] MASSEは属性ベースのアクセス制御を組み込んだ動的マルチクライアントSSEスキームであり、OXTフレームワークを拡張している。
MASSEは、データベースやインデックスの再暗号化を必要とせずに、ドキュメントの実用的な動的更新と、取り消しを含むクライアントの認可をサポートする。
10から100のキーワードクエリを生成するのに2秒足らず、マッチする50のドキュメントを取得するのに14秒かかる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:59:00 GMT)
Large Spikes in Stochastic Gradient Descent: A Large-Deviations View [1.2] 我々はNTKスケーリングにおける浅い完全接続ネットワークのSGDトレーニングを分析し、カタパルト相の定量的理論を提供する。
カーネルのみに依存する明示的な関数$G$,学習率$$およびデータによって,SGDは高い確率でNTK平坦な大きなスパイクを生成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:27:17 GMT)
MIL-PF: Multiple Instance Learning on Precomputed Features for Mammography Classification [1.1] 本稿では,凍結基盤エンコーダと軽量MILヘッドを併用してマンモグラフィ分類を行うスケーラブルなフレームワークを提案する。
MIL-PFは、臨床レベルでの最先端の分類性能を達成し、トレーニングの複雑さを著しく低減する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:49:33 GMT)
Adaptive Active Learning for Online Reliability Prediction of Satellite Electronics [1.1] 本稿では,新しい統合型オンライン信頼性予測フレームワークを提案する。
一般化されたアレニウスリンク関数、個々のランダム効果、空間相関を組み込んだウィナープロセスに基づく劣化モデルを開発した。
予測精度を適応的に向上する2段階能動学習サンプリングスキームを設計する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:04:22 GMT)
A Visualization for Comparative Analysis of Regression Models [1.1] 平均絶対誤差(MAE)、ルート平均二乗誤差(RMSE)、R二乗誤差(R$2$)など、様々な測定値を用いて測定される。
この記事では、回帰モデルのパフォーマンスの重要な側面を強調する、新しい視覚化アプローチを紹介します。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:31:34 GMT)
Classifying Problem and Solution Framing in Congressional Social Media [1.1] ガーベッジ・カンのモデルによる米国の政策設定は、問題」と「解決」に焦点を当てたプロセスとを区別する。
本研究の目的は,上院議員ポストを問題やソリューションストリームのいずれにおいてもラベル付けする自動手法を開発することである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:06:11 GMT)
Symbolic Discovery of Stochastic Differential Equations with Genetic Programming [1.1] 本稿では,遺伝的プログラミングに基づく微分方程式の記号的発見法を提案する。
本結果は,高次元システムへの効率的なスケーリングと支配方程式の正確な回復を実証するものである。
この研究は、力学系の解釈可能な発見へのシンボリック回帰を拡張した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:43:02 GMT)
When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic [1.1] Overfitting-Underfitting Indicator (OUI)は、固定プローブバッチ上のバイナリアクティベーションパターンのバランスを定量化する指標である。
トレーニングの10%で測定されたOUIは、LR体制間で既に差別化されている。
次に、OUIベースのスクリーニングルールを、早いリターン、クリップベース、ばらつきベース、フリップベースの基準に対して、成功したリコールに対して一致したリコールの下で比較する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:46:31 GMT)
NanoBench: A Multi-Task Benchmark Dataset for Nano-Quadrotor System Identification, Control, and State Estimation [1.0] 既存の航空ロボティクスベンチマークでは、数百グラムから数キログラムまでの車両を目標とし、通常は高レベルなデータのみを公開する。
市販のクラジフリー2.1ナノクワッドロータ(離陸重量27g)で収集したオープンソースのマルチタスクベンチマークであるNanoBenchをViconモーションキャプチャアリーナで紹介する。
このデータセットには、ホバリング、多周波空力、標準追跡、複数の速度レギュレーションにまたがる攻撃的な操作にまたがる170以上の飛行軌跡が含まれている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:01:59 GMT)
SpaceSense-Bench: A Large-Scale Multi-Modal Benchmark for Spacecraft Perception and Pose Estimation [1.0] 宇宙船認識のための大規模マルチモーダルベンチマークである textbfSpaceSense-Bench を提案する。
各フレームは、タイム同期1024$times$1024 RGBイメージ、ミリ精度深度マップ、256ビームのLiDAR点雲を提供する。
対象検出,2Dセマンティックセマンティックセグメンテーション,RGB-LiDAR融合による3Dポイントクラウドセグメンテーション,単眼深度推定,方向推定の5つのタスクをベンチマークし,2つの重要な発見点を同定した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:52:28 GMT)
GPU-Accelerated Genetic Programming for Symbolic Regression with Beagle Framework [1.0] We report on the benchmarking of Beagle on the Feynman Symbolic Regression dataset。
結果は、BeagleのGPU支援のシンボリック回帰が、主要なCPUベースのフレームワークよりも大幅に優れていることを示している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:13:39 GMT)
EmbC-Test: How to Speed Up Embedded Software Testing Using LLMs and RAG [0.9] 本稿では、検証プロセスの部分的自動化のためのソリューションとして、検索拡張生成(RAG)パイプラインを提案する。
産業評価の結果、生成したテストは100%構文的に正しく、85パーセントが実行時検証に合格した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:58:59 GMT)
A saccade-inspired approach to image classification using visiontransformer attention maps [0.9] 人間の視覚システムからインスピレーションを得て、よりスマートな画像処理モデルを作成します。
自己教師型視覚変換器であるDINOを用いて,視覚空間の重要領域に情報処理を集中させるササードインスピレーション方式を提案する。
この選択的処理戦略は、フルイメージの分類性能の大部分を保ち、場合によっては性能も向上する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:54:55 GMT)
MCP-in-SoS: Risk assessment framework for open-source MCP servers [0.9] Model Context Protocol (MCP) サーバは、Large Language Model (LLM) エージェントが動的で現実世界のツールにアクセスできるようにする手段として急速に普及している。
MCPサーバの普及と、オープンソースリリースによる採用の容易化に伴い、セキュリティリスクの理解が不可欠である。
オープンソースMPPサーバの脆弱性を体系的に大規模に評価する以前の研究は行われていない。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:38:17 GMT)
Not All News Is Equal: Topic- and Event-Conditional Sentiment from Finetuned LLMs for Aluminum Price Forecasting [0.9] 本研究は、英中ニュースの見出しから感情スコアを生成し、ベースメタル指標、為替レート、インフレ率、エネルギー価格と統合する。
2007年から2024年にかけて上海金属取引所の長短シミュレーションにより,これらのモデルの予測性能と経済性を評価した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:54:12 GMT)
QUSR: Quality-Aware and Uncertainty-Guided Image Super-Resolution Diffusion Model [0.9] 拡散に基づく画像超解像(ISR)は強い可能性を示しているが、劣化が未知で空間的に一様でない実世界のシナリオでは依然として苦戦している。
本稿では,QAP(Quality-Aware Prior)とUNG(Uncertainty-Guided Noise Generation)モジュールを統合した新しい超解像拡散モデルQUSRを提案する。
実験結果から,QUSRは実世界のシナリオにおいて高忠実かつ高現実的なイメージを生成可能であることが確認された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:57:31 GMT)
An Automated Radiomics Framework for Postoperative Survival Prediction in Colorectal Liver Metastases using Preoperative MRI [0.9] 術後肝転移生存予測のためのAIベースの自動フレームワークを提案する。
我々は、解剖学的に認識されたセグメンテーションパイプラインと放射能パイプラインからなる生存予測フレームワークを開発した。
本研究は,放射能を用いた生存分析とセグメンテーションアルゴリズムの統合の可能性を示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:34:24 GMT)
Dull, Dirty, Dangerous: Understanding the Past, Present, and Future of a Key Motivation for Robotics [0.9] ロボットが役に立つかもしれない場所をモチベーションするために、DDD(Dull, dirty, and dangerous)の作業が使われている。
出版物のわずか2.7%がDDDを定義し、8.7%がDDDであるタスクやジョブの具体的な例を提供している。
我々は、ロボットコミュニティが我々の技術における仕事の状況を考えるのに役立つフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:23:55 GMT)
LLMs for Text-Based Exploration and Navigation Under Partial Observability [0.8] 未知のレイアウトでの探索と目標指向ナビゲーションは、検査、ロジスティクス、検索と救助の中心である。
我々は,大言語モデル (LLM) が部分的可観測性の下で,Emphtextのみのコントローラとして機能するかどうかを問う。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:38:47 GMT)
Predictive Spectral Calibration for Source-Free Test-Time Regression [0.8] Predictive Spectral (PSC) は、サブスペースアライメントを拡張してスペクトルマッチングをブロックする、ソースフリーのフレームワークである。
PSCは実装が簡単で、モデルに依存しず、市販の事前訓練された回帰器と互換性がある。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:15:44 GMT)
Chip-Integrated Broadband Multi-Photon Source for Wavelength-Multiplexed Quantum Networks [0.8] 光子対を超える多重粒子の絡み合いを発生できるブロードバンド統合ソースは依然として少ない。
絶縁体(LNOI)導波路上に周期的に偏極した薄膜リチウムニオブ酸リチウム中の4光子エンタングルメントのチップ発生を報告した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:11:12 GMT)
Regularized Warm-Started Quantum Approximate Optimization and Conditions for Surpassing Classical Solvers on the Max-Cut Problem [0.8] 本稿では,QAOAの停止を防止し,QAOAが停止するのを防ぐ正規化器を用いて,期待エネルギーを最小化してキュービットを初期化する正則化ウォームスタートQAOA(RWS-QAOA)を紹介する。
ランダムな正則グラフに対するMax-Cut問題に対するRWS-QAOAの評価を行い、このプロトコルは3つの相補的な設定で、一定の深さの量子回路を生成する。
以上の結果から,量子回路と古典的ウォームスタートが組み合わさった定数深度量子回路は,将来の量子コンピュータ上での実行において,Max-Cut問題における古典的解法を克服できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:34:06 GMT)
CR-Bench: Evaluating the Real-World Utility of AI Code Review Agents [0.7] 我々は、ベンチマークデータセットであるCR-Benchと、コードレビューエージェントのためのきめ細かい評価パイプラインであるCR-Evaluatorを紹介する。
コードレビューエージェントは、隠されたすべての問題を特定するために設計された場合、低信号対雑音比を示すことができる。
本分析では,課題解決と突発的な発見との間に隠されたトレードオフを明らかにし,効果的なエージェント設計を制約するフロンティアを明らかにした。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:29:42 GMT)
Vibe-Creation: The Epistemology of Human-AI Emergent Cognition [0.7] 論文は、人間の推論と生成人工知能(GenAI)の出会いは、ここで第3のエンティティとして指定される、質的に区別された認知-感情的な形成を生み出すと論じている。
この構造は、2つの存在論的に説明不能な認知のモードの帰納的結合から生じると我々は主張する。
本稿は、この理論的枠組みが教育機関の変容にもたらす意味を考察することによって締めくくっている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:41:28 GMT)
A Variational Latent Equilibrium for Learning in Cortex [0.7] ディープラーニングのアルゴリズムは、現在の脳回路とダイナミクスの理解とは相容れない。
本稿では,BPTTを生物学的に制御可能な方法で近似する一般形式性を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:44:48 GMT)
Stochastic Port-Hamiltonian Neural Networks: Universal Approximation with Passivity Guarantees [0.7] 本稿では,ハミルトニアンをフィードフォワードネットワークでパラメータ化するポート・ハミルトニアンニューラルネットワークを提案する。
実験では、多層パーセプトロンベースラインに対する長い水平方向のロールアウトの改善とエネルギー誤差の低減が示されている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:16:15 GMT)
Reactive Slip Control in Multifingered Grasping: Hybrid Tactile Sensing and Internal-Force Optimization [0.7] 本稿では,ロボットグリップにおける手動すべりを抑えるために,動的内部力適応のためのハイブリッド学習とモデルベースアプローチを提案する。
マルチモーダル触覚スタックは、高速すべりキューに対する圧電(PzE)センシングと、接触位置決めのための圧電抵抗(PzR)アレイを組み合わせる。
外部摂動下でのマルチフィンガーグリップの反応性安定化を実証する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:39:27 GMT)
GIIM: Graph-based Learning of Inter- and Intra-view Dependencies for Multi-view Medical Image Diagnosis [0.7] コンピュータ支援診断 (CADx) は医用画像に欠かせないものとなっているが, 自動診断システムはしばしば, 臨床解釈の微妙な過程の再現に苦慮している。
関係モデリングのための新しいグラフベースアプローチGIIMを提案する。
我々のフレームワークは、異常とビュー間ダイナミクスの間の重要なビュー内依存関係を同時にキャプチャするように設計されている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:57:57 GMT)
Tracking Cancer Through Text: Longitudinal Extraction From Radiology Reports Using Open-Source Large Language Models [0.7] 大規模言語モデル(LLM)は高度な臨床テキスト処理を持つが、ほとんどの最先端システムはプロプライエタリである。
完全オープンソースでローカルにデプロイ可能なパイプラインを,放射線学報告からの縦方向情報抽出のために提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:13:43 GMT)
Receptogenesis in a Vascularized Robotic Embodiment [0.7] 動作中に$textitex novo$ハードウェアを生成する能力を持つロボットシステムを取得すると、物理的適応性の制御が拡張される。
この研究は、進化のための材料ベースのフレームワークを確立し、ロボットが出現する振る舞いをサポートするために必要なハードウェアを物理的に成長させることを可能にする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:24:31 GMT)
Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection [0.6] 時間条件付きフロー(tcNF)は時系列データの異常検出に対処する新しいフレームワークである。
tcNFは複雑な時間的ダイナミクスを効果的に捉え、期待される振る舞いの正確な確率を生成する。
我々は,様々なデータセット上でtcNFを評価し,既存の手法と比較して精度と堅牢性を実証した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:49:48 GMT)
Universal Hamiltonian control in a planar trimon circuit [0.6] 我々は平面幾何学に統合されたトリモンと呼ばれるマルチモード回路を実装した。
トリモン上の高忠実度操作を実演し、リッチな状態空間の柔軟な制御を実現する。
この結果から, 標準的な超伝導プロセッサアーキテクチャのトランモンを交換可能な, コンパクトで高制御可能なデバイスが得られた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:53:56 GMT)
LLM-Grounded Explainable AI for Supply Chain Risk Early Warning via Temporal Graph Attention Networks [0.6] 重要な物流ノードの破壊は、世界的なサプライチェーンに深刻なリスクをもたらす。
本稿では,ボトルネック予測と忠実な自然言語リスク説明を共同で行うエビデンス基盤フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:40:08 GMT)
Stability of AI Governance Systems: A Coupled Dynamics Model of Public Trust and Social Disruptions [0.5] 本稿では,離散時間ホークスプロセスを統合する厳密な結合力学モデルを提案する。
信頼の低下はその後の論争の激しさを増幅する。
数値実験により、エコーチャンバーネットワーク構造とメディア増幅がガバナンスの失敗を加速する方法が明らかにされた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:24:30 GMT)
Physics-Informed Neural Engine Sound Modeling with Differentiable Pulse-Train Synthesis [0.5] エンジンの音は、持続する高調波振動よりも連続的な排気圧パルスに由来する。
本稿では,Pulse-Train-Resonator(PTR)モデルを提案する。
PTRはハーモニック・プラス・ノイズベースラインモデルよりも21%改善され、総損失は5.7%減少する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:03:35 GMT)
Real-Time Trust Verification for Safe Agentic Actions using TrustBench [0.4] 複数次元にわたる信頼をベンチマークするデュアルモードフレームワークであるTrustBenchを紹介します。
複数のエージェントタスクにおいて、TrustBenchは有害なアクションを87%削減した。
200ms未満のレイテンシで、TrustBenchは、自律エージェントの実用的なリアルタイム信頼検証を可能にする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:46:22 GMT)
MM-tau-p$^2$: Persona-Adaptive Prompting for Robust Multi-Modal Agent Evaluation in Dual-Control Settings [0.4] ユーザエクスペリエンス管理ドメインでは、エージェントがユーザ個性について学ぶと、エージェントの振る舞いが進化する。
マルチモーダルエージェントのロバスト性を評価するために,MM-tau-p$2$ベンチマークを提案する。
全体として、MM-tau-p$2$は、我々の以前の作業 FOCAL に基づいて構築され、マルチモーダルエージェントを評価するための総合的な方法を提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:18:02 GMT)
EPOCH: An Agentic Protocol for Multi-Round System Optimization [0.4] 異種環境におけるマルチラウンドシステム最適化のためのエンジニアリングプロトコルであるEPOCHを紹介する。
EPOCHは最適化をベースライン構築と反復的な自己改善の2つのフェーズにまとめる。
さらに、計画、実装、評価を分離するロール制約されたステージを通じて、各ラウンドを構成します。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:41:03 GMT)
For molecular polaritons, disorder and phonon timescales control the activation of dark states in the thermodynamic limit [0.4] 我々は、動的障害は静的障害よりも大きな計算課題をもたらすことを示した。
この挙動は、乱れによる集合的な光・物質力学の抑制に起因している。
本研究は, 乱れた光物質系における熱力学的収束を規定する鍵機構として, 集団行動の抑制を立証するものである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:03:59 GMT)
Murmurations: a case study in AI-assisted mathematics [0.4] 算術における顕著な新しい現象の出現を報告する。
機械学習から標準的な解釈可能性ツールを使用して、発話を検出し、分析することができる。
本稿では, 数論とAIにおいて, それらを文脈化して, 大腿骨の概観を述べる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:47:39 GMT)
A Causal Graph Approach to Oppositional Narrative Analysis [0.4] 本稿では,対立する物語の検出,分析,分類のためのグラフベースのフレームワークを提案する。
提案手法は, グラフを最小部分グラフに蒸留することにより, 最終分類への各寄与の因果表現を導出する。
この表現に基づいて、既存の反対的思考分類よりも優れた分類パイプラインを導入する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:32:35 GMT)
Cybersecurity AI: Hacking Consumer Robots in the AI Era [0.3] 本稿では,ジェネレーティブAIがロボットサイバーセキュリティを根本的に破壊した証拠を提示する。
攻撃能力はAIによって民主化されてきたが、防御策は遅れていることが多い。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:35:50 GMT)
Sensing coherent phonon dynamics in solids with delayed even harmonics [0.3] ハーモニクスでさえ、固体中のフォノンダイナミクスと電子-フォノン相互作用の強力な超高速プローブである。
理論的には、調和音がいかにコヒーレントフォノンダイナミクスを明らかにするかを考察する。
本研究は, 動的に対称性を損なうシステムにおいて, 顕微鏡的効果を解明するハーモニクスの可能性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:46:02 GMT)
Reconstructing Movement from Sparse Samples: Enhanced Spatio-Temporal Matching Strategies for Low-Frequency Data [0.3] 本稿では,GPSトラジェクトリを道路網に合わせるための空間時間マッチングアルゴリズムの潜在的な改善について検討する。
本手法では, 動的バッファ, 適応観測確率, 時間的評価関数の再設計, 行動解析の4つの改良を提案する。
実験の結果は、様々な指標で性能効率とパス品質が大幅に向上したことを示している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:25:53 GMT)
On the Structural Failure of Chamfer Distance in 3D Shape Optimization [0.3] 点当たりのチャンファー勾配は、前方項のユニークな引力である多対一の崩壊を引き起こすことを示す。
制御された2D設定では、共有基底は大域的な結合を提供することで崩壊を抑制する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:21:23 GMT)
RTFDNet: Fusion-Decoupling for Robust RGB-T Segmentation [0.3] RGB-Thermal (RGB-T)セマンティックセマンティックセグメンテーションは、低照度環境で動作するロボットシステムに不可欠である。
伝統的なアプローチは、しばしばモダリティバランスを過度に強調し、センサー信号が部分的に欠如している場合に、頑丈さや厳しい性能が制限される。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:40:26 GMT)
Abundant Intelligence and Deficient Demand: A Macro-Financial Stress Test of Rapid AI Adoption [0.2] 我々は,需要不足を伴うAI生成アベンダンス共存者の分布・契約ミスマッチを同定する。
我々は、AI能力の伸び率、拡散速度、そして、ネットフィードバックが爆発性に対して自己制限的であるリテンション率に関する条件を導出する。
トップクインタイルの収入者は米国の消費の47~65%を駆動し、AIの露出が最も高いため、民間の信用や住宅ローン市場への送信は不釣り合いである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:26:57 GMT)
Paladin: A Policy Framework for Securing Cloud APIs by Combining Application Context with Generative AI [0.2] この作業は、クラウドワークロードのアプリケーション層脆弱性を悪用する脅威に焦点を当てている。
このような脅威に対する予防および緩和措置は、アプリケーションセマンティクスを認識する必要がある。
当社は、クラウドワークロード管理者がポリシーを容易に定義し、強制できるセキュリティフレームワークを設計、実装しています。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:55:48 GMT)
Marginals Before Conditionals [0.2] ニューラルネットワークにおける条件学習を分離する最小限のタスクを構築する。
モデルはまず辺 P(A | B) を学習し、完全に対数 K のプラトーを生成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:51:01 GMT)
Designing probabilistic AI monsoon forecasts to inform agricultural decision-making [0.1] 本稿では,農家の状況が異質であるため,予測者が最適な行動を規定できないような環境で有用な予測を設計するための意思決定理論フレームワークを提案する。
この枠組みをモンスーン雨の季節的発生例に適用し,多くの熱帯諸国における植林決定と農業投資の鍵となる日である。
我々は,システムベンチマークによる人工知能(AI)天気予報モデルと,新たな「進化する農夫の期待」統計モデルを組み合わせることで,この枠組みの要件に合わせた予測を行うシステムを開発した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:09:08 GMT)
Quantum Amplitude Estimation for Catastrophe Insurance Tail-Risk Pricing: Empirical Convergence and NISQ Noise Analysis [0.1] 量子振幅推定(QAE)はモンタナロに続いて、オラクルクエリにおける相互Nの順序にアプローチする。
我々は、真のGrover増幅を備えたQiskit Aerシミュレータを用いて、この利点を実証的に検証する。
合成および実データ(NOAA Storm Events, 58,028レコード)に関する7つの実験は、3つの主要な発見をもたらす。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:20:57 GMT)
Synergistic Directed Execution and LLM-Driven Analysis for Zero-Day AI-Generated Malware Detection [0.1] 自動マルウェア生成のためのLLMのウェポン化は、従来の検出パラダイムに現実的な脅威をもたらす。
本稿では,エスココール実行とエンフディープ学習に基づく脆弱性分類を組み合わせた,新しいハイブリッド分析フレームワークを提案する。
2,500 LLM合成サンプルからなるベンチマークでは、従来のマルウェアでは98.7%、AIによる脅威では97.5%の精度が達成されている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:25:41 GMT)
BLK-Assist: A Methodological Framework for Artist-Led Co-Creation with Generative AI Models [0.1] BLK-Assistは、アーティスト固有の拡散モデルの微調整のためのモジュラーフレームワークである。
システムは、単一のプロのアーティストの独自コーパスでケーススタディとして実装される。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:59:50 GMT)
Automated Standardization of Legacy Biomedical Metadata Using an Ontology-Constrained LLM Agent [0.1] バイオメディカルメタデータの自動標準化システムを提案する。
システムは、要求に応じて正則正しい語彙語を検索するために、権威的用語サービスをリアルタイムでクエリする。
評価の結果,LLMをリアルタイムツールアクセスで拡張することにより,予測精度が一貫した向上が得られた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:47:30 GMT)
Rescaling Confidence: What Scale Design Reveals About LLM Metacognition [0.1] 回答の78%以上が3つのラウンドナンバー値に集中している。
0-20スケールは標準の0-100フォーマットよりもメタ認知効率を一貫して向上させる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:41:14 GMT)
a-TMFG: Scalable Triangulated Maximally Filtered Graphs via Approximate Nearest Neighbors [0.0] TMFGにインスパイアされたデータから人工グラフを構築するための新しい手法を提案する。
このアルゴリズムは堅牢性をテストし、数百万の観測データを用いて評価する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:08:56 GMT)
ZX-Flow: A Flexible Criterion for Deterministic Computation with ZX-Diagrams [0.0] パウリ半ウェブと呼ばれるZX-ダイアグラムの新しいタイプの装飾を用いて定式化したZX-flowと呼ばれる新しいフロー基準を導入する。
さらに、ZX-ダイアグラムが、パウリフローを持つグラフのようなZX-ダイアグラムと同値である場合に限り、ZX-フローがZX-フローを持つことを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:26:09 GMT)
Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation [0.0] この研究では、Vul4Jベンチマークから64のJava脆弱性にまたがる319のLarge Language Models (LLM)生成セキュリティパッチを分析した。
三軸評価を用いて分析したところ、パッチの24.8%だけが完全な正当性を達成し、51.4%はセキュリティと機能の両方に失敗していることがわかった。
提案されたSecurity repair Score (SRS)はこのギャップを定量化し、LLMが機能を保存する(平均0.832)が、セキュリティに苦しむ(平均0.251)。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:34:56 GMT)
What Do We Care About in Bandits with Noncompliance? BRACE: Bandits with Recommendations, Abstention, and Certified Effects [0.0] 下流アクターが私的情報を利用する場合、リコメンデーション福祉は学習者評価可能な治療方針を厳格に超えることができることを示す。
有限コンテキスト2乗IV問題に対して,パラメータフリー位相共役アルゴリズムBRACEを提案する。
我々はこの理論を、直接制御にまたがる有限コンテキスト経験的ベンチマークで補完し、現在の未来的トレードオフ、弱い識別、均一性障害、長方形の過剰識別を媒介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:40:42 GMT)
Well Log-Guided Synthesis of Subsurface Images from Sparse Petrography Data Using cGANs [0.0] そこで本研究では,炭酸塩岩の断面像を現実的に表現するための条件付き生成支援ネットワーク(cGAN)フレームワークを提案する。
このモデルは、1992-2000mの深さ間隔で、15個のペトログラフィーサンプルから抽出された5000個のサブイメージに基づいて訓練されている。
このモデルは、広いポロシティ範囲にわたって地質学的に一貫した画像を生成し、ターゲットのポロシティ値の10%のマージンで81%の精度を達成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:29:38 GMT)
Visualization of Three-Qubit Pure States with Separation of Local and Nonlocal Degrees of Freedom [0.0] 2量子状態と3量子状態の可視化のための統一的な幾何学的枠組みを提案する。
2つの量子ビットに対して、還元密度作用素のブロッホ球面表現と複素平面上にプロットされた複素共起を結合する。
一般化されたシュミット分解に基づく3つの量子ビットに対して、二部分解とGHZ型三部分解を導入する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:34:05 GMT)
Verifying Good Regulator Conditions for Hypergraph Observers: Natural Gradient Learning from Causal Invariance via Established Theorems [0.0] 我々は、因果不変なハイパーグラフ基板における持続観測者がコナント・アシュビー・グッドレギュレータ理論の条件を満たすことを証明した。
本研究では,環境境界における予測誤差を最小限に抑えるエンティティとして,永続的なオブザーバを定式化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:20:02 GMT)
Toda-like Hamiltonian as a probe for quantized prey-predator dynamics [0.0] Toda-like Hamiltonian の縮小版 $mathcalH(x,,k)$ の位相空間的特徴は、条件 $partial2 MathcalH / partial x partial k = 0$ で制約された形で記述される。
古典的プレデター位相空間軌道上の量子歪みの正確なプロファイルは、非摂動的に得られる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:29:17 GMT)
TinyNav: End-to-End TinyML for Real-Time Autonomous Navigation on Microcontrollers [0.0] ESP32マイクロコントローラ上でのリアルタイム自律ナビゲーションのためのエンドツーエンドTinyMLシステムを提案する。
カスタムトレーニングされた量子化された2D畳み込みニューラルネットワークは、20フレームの深度データのスライディングウィンドウを処理し、ステアリングとスロットルコマンドを予測する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:54:54 GMT)
Time, Identity and Consciousness in Language Model Agents [0.0] スタック理論の時間的ギャップを足場軌道に適用する。
これにより、評価ウィンドウ内での成分的発生と、単一の目的のステップでの共存を分離する。
次に、スタック理論のArpeggioとChordを基底化されたアイデンティティステートメントに基づいてインスタンス化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:25:37 GMT)
Thermodynamic Properties of the Dunkl-Pauli Oscillator in an Aharonov-Bohm Flux [0.0] Aharonov--Bohm(AB)フラックスの存在下で,スピン=$frac12$粒子の2次元における熱力学特性について検討した。
その結果, ダンクル反射対称性とAB相との相互作用は, 特異な熱的挙動をもたらすことがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:44:31 GMT)
The helical quantum two-body problem and its wave packet dynamics [0.0] 有効ポテンシャルは、反発性クーロン相互作用に重なり合う可変数のポテンシャル井戸を持つ。
これらの井戸の非調和性はこの比と井戸の順序に大きく依存する。
我々は、個々の井戸の有界状態の数にも依存する過渡進化を形成する豊富なパターンが存在することを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:13:29 GMT)
The Prediction-Measurement Gap: Toward Meaning Representations as Scientific Instruments [0.0] この論文は、科学的意味分析は、科学的ユーザビリティという、異なる目的のファミリーを動機付けている、と論じている。
静的な単語埋め込みと文脈変換器表現をこれらの要件に対して評価する。
分野がスケールファーストの進歩の限界について議論するにつれて、測定可能な表現は原則化された新しいフロンティアを提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:08:53 GMT)
The Patrologia Graeca Corpus: OCR, Annotation, and Open Release of Noisy Nineteenth-Century Polytonic Greek Editions [0.0] パトログア・グラエカ・コーパス(Patrologia Graeca Corpus)は、古代ギリシアの19世紀の版において、最初の大規模なオープンなOCRと言語資源である。
このコレクションは、複雑なバイリンガル(ギリシャ・ラテン語)のレイアウトで印刷されたPatrologia Graeca(PG)の残されている未デジタル化の巻をカバーしており、高度に劣化したポリトニック・ギリシャのタイポグラフィーが特徴である。
We achieve a character error rate (CER) of 1.05% and a word error rate (WER) of 4.69%。
その結果得られたコーパスには、約600万の補修と音声タグ付きトークンが含まれており、フルに整列している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:21:54 GMT)
The Geometric Inductive Bias of Grokking: Bypassing Phase Transitions via Architectural Topology [0.0] 巡回加法(Zp)を訓練した変圧器のグルーキング-遅れ一般化に関する研究
標準変圧器における2つの独立した構造因子:表現の大きさとデータ依存型アテンションルーティングを同定する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:16:04 GMT)
The Generation-Recognition Asymmetry: Six Dimensions of a Fundamental Divide in Formal Language Theory [0.0] 生成と認識は、複数の独立した方法で非対称である。
生成と認識が分岐する6つの次元を識別する。
我々は、大きな言語モデルに関する議論で締めくくります。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:21:53 GMT)
The Gamow Golden Rule of Multichannel Resonances [0.0] 我々は、いくつかの崩壊モードを持つ共鳴の崩壊分布、部分崩壊定数、部分崩壊幅、分岐分数を得る。
2つの結合チャネル正方形井戸電位を用いて結果を実証する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:01:27 GMT)
The Epistemic Support-Point Filter: Jaynesian Maximum Entropy Meets Popperian Falsification [0.0] エピステミックサポートポイントフィルタ(ESPF)は、無知を受け入れやすく、確実性を主張するのが遅いという単一のコミットメントに基づいて設計された。
本稿は、このコミットメントが正確な数学的形式を持ち、ESPFがエビデンスのみのフィルタのクラスで実装する一意の最適フィルタであることを証明している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:17:52 GMT)
The Coordination Gap: Alternation Metrics for Temporal Dynamics in Multi-Agent Battle of the Exes [0.0] マルコフゲームとして,BoEから派生したエグゼスの戦いのマルチエージェント変種について検討する。
高い総括的な支払いは、時間的調整の貧弱さと共存できることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:21:45 GMT)
The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain? [0.0] ランク付けされた決定システムは、いつランク付けされたアウトプットに介入するか、いつ停止するかを判断しなければならない。
信頼に基づく棄権が意思決定の質を単調に改善し、いつ失敗するかを考察する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:44:10 GMT)
The Bureaucracy of Speed: Structural Equivalence Between Memory Consistency Models and Multi-Agent Authorization Revocation [0.0] 我々はアイデンティティとアクセス管理のための能力コヒーレンスシステムを開発した。
安全定理は、実行カウント リリース 一貫性指向のコヒーレンス戦略に対する無許可の操作を束縛する。
ティックベースの離散イベントシミュレーションは、機能ごとの安全性を保証する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:37:02 GMT)
The Algorithmic Blind Spot: Bias, Moral Status, and the Future of Robot Rights [0.0] 我々は、投機的な未来の人工エージェントに対する不均質な倫理的投資が、経験的に文書化され、非対称に分散された害が人間の人口に影響を与えると論じる。
アルゴリズムの盲点に対処するには、人間の影響、制度的責任、現在運用中のアルゴリズムシステムのガバナンスに関する倫理的評価を再センタリングする必要がある、と我々は主張する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:33:28 GMT)
Tensor-network methodology for super-moiré excitons beyond one billion sites [0.0] 実空間 Bethe-Salpeter Hamiltonian に対するテンソルネットワーク法を示す。
1次元および2次元のスーパーモアレシステムに対する方法論を実証する。
本研究は,大規模準結晶および超分子量子物質における励起物理学のシミュレーションを可能にする実空間方法論を構築した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:28:24 GMT)
System-bath model for quantum chemistry [0.0] 分子ハミルトニアンと量子ビットのハミルトニアンとの近似写像を提案する。
このマッピングによって、近い将来の量子コンピュータ上で分子の励起エネルギーを計算するための新しいアプローチとアルゴリズムがもたらされることを願っている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:08:12 GMT)
Surgical Repair of Collapsed Attention Heads in ALiBi Transformers [0.0] 変換言語モデルのBLOOMファミリーにおいて,系統的な注意崩壊病理を同定する。
ALiBiの位置エンコーディングは31-44%のアテンションヘッドを、ほぼ完全にシーケンス開始トークンに出席させる。
ゼロ出力プロジェクションを用いた標的Q/K/V再初期化について検討した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:57:49 GMT)
Stochastic Attention via Langevin Dynamics on the Modern Hopfield Energy [0.0] 本研究では,Langevinサンプリングが注目され,単一温度で制御される無トレーニングサンプルが注目されることを示す。
エネルギー勾配はアテンションマップと等しいため、スコアネットワーク、トレーニングループ、学習モデルを必要としない。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:55:26 GMT)
Semantic Shifts of Psychological Concepts in Scientific and Popular Media Discourse: A Distributional Semantics Analysis of Russian-Language Corpora [0.0] 本稿では,科学的・大衆的なメディア・談話における心理的概念のセマンティック・シフトについて考察する。
2つのコーパスが編纂され、雑誌『サイコロジー』の約300の研究論文と、オンライン心理学プラットフォームYasnoとChistye kogntsiiのテキストからなるポピュラーサイエンスコーパスの2つのコーパスがまとめられた。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:29:10 GMT)
Semantic Chameleon: Corpus-Dependent Poisoning Attacks and Defenses in RAG Systems [0.0] Retrieval-Augmented Generation (RAG) システムは、大きな言語モデルを外部知識ソースで拡張する。
特に、敵は、悪意のある文書が推論時に優先的に検索されるように、毒検索コーパスを付与することができる。
本研究では,最近のRAGパイプラインに対するグラデーション誘導コーパス中毒攻撃について検討し,検索層防御の評価を行った。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:15:13 GMT)
Role Classification of Hosts within Enterprise Networks Based on Connection Patterns [0.0] 役割分類では、ホストを関連する役割に分類する。
侵入検知などのネットワーク監視および解析アルゴリズムの精度を向上させるために使用できる。
本稿では、観測された接続パターンに基づいてホストをグループ化する2つの実用的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:04:12 GMT)
Reconfigurable Superconducting Quantum Circuits Enabled by Micro-Scale Liquid-Metal Interconnects [0.0] チップスケールの液体金属配線は、プラグアンドプレイの超伝導量子回路を約束する。
我々は従来のコプラナー導波路共振器と同等の性能で高品質なモジュール間信号と地上相互接続を実現する。
これらの結果は、再構成可能なモジュラー超伝導量子系のための実行可能なチップスケール相互接続として液体金属を確立する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:15:18 GMT)
Reason and Verify: A Framework for Faithful Retrieval-Augmented Generation [0.0] 本稿では,明示的なレアソニングと忠実度検証を統合したドメイン固有RAGフレームワークを提案する。
我々のアーキテクチャは、ニューラルネットワークの書き換え、BGEベースのクロスエンコーダのランク付け、合理生成モジュールによる標準検索を強化する。
我々は、このフレームワークをBioASQとPubMedQAベンチマークで評価し、動的インコンテキスト学習の影響を具体的に分析する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:25:07 GMT)
Qubit reset beyond the Born-Markov approximation: optimal driving to overcome polaron formation [0.0] ビットは通常、低温環境に結合することで既知の状態にリセットされる。
数値的に正確なテンソルネットワーク法を用いたボルン・マルコフ近似以外の量子ビットリセットについて検討する。
以上の結果から,リセット速度と忠実度に対する制限が克服可能であること,時間依存運転がシステム環境相関と逆ポラロン生成を制御できることが示唆された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:09:21 GMT)
Quantum optical impurity models in interacting waveguide QED [0.0] 我々は、結合キャビティアレイ内の光子が、局所Kerr非線形性を介して同時に相互作用しながら、原子不純物の周りに局在する導波管QEDシステムと相互作用する一般的なモデルを考える。
このシナリオは、ナノフォトニック結晶、回路QED格子、超低温原子系に自然に現れ、魅力的なJaynes-Cummings結合と固有の光子-光子反発の競合によって制御される。
この相互作用が局所的な数光子境界状態の形成にどのように影響するかを解析し、不純物と異なる充填因子の大きな周期配列に対して結果の多体基底状態を決定する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:28:28 GMT)
Quantum control of the environment in open quantum systems enables rapid qubit reset [0.0] クビットリセットは量子技術において不可欠であり、通常、クビットを散逸する環境に結合することで達成される。
ポラロン状態の形成と、時間依存結合を用いてこれを逆転させる方法が原因であることが示される。
結合プロトコルが特定され、励起状態の人口は10〜6ドル、nsは10〜6ドルである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:09:09 GMT)
Quantum batteries and time dilation [0.0] 本稿では,量子力学のみから時間拡張を記述する方法を提案する。
量子メモリの単純な例:充電バッテリーを使用します。
時間拡張を記述できるので、この方法でメートル法を記述できる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:07:00 GMT)
Quantifying Gender Bias in Large Language Models: When ChatGPT Becomes a Hiring Manager [0.0] 我々は,大規模言語モデルが社会的バイアスを持続する程度を定量化し,バイアス緩和手法としての迅速な工学を考察する。
以上の結果から, LLMは女性候補者を雇用し, 男性候補者に対する低い給与を推奨する傾向が示唆された。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:27:00 GMT)
Quality-Driven Agentic Reasoning for LLM-Assisted Software Design: Questions-of-Thoughts (QoT) as a Time-Series Self-QA Chain [0.0] 品質駆動型推論時間スキャフォールドであるQoTを導入し,ユーザ目標をエンジニアリングステップの順序付きシーケンスに変換する。
QoTは、API設計、データ通信、ファイルシステムの3つの代表的なバックエンドエンジニアリング領域にまたがって評価する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:49:09 GMT)
Post-Quantum Entropy as a Service for Embedded Systems [0.0] 我々は、QRNG由来のエントロピーをQuantisデバイスからESP32クラスのクライアントへ、クォータム後セキュアなチャネル上で移動させる量子エントロピー・アズ・ア・サービス(QE)システムを構築した。
サーバ側では、カスタムOpenSSLプロバイダ経由の直接量子エントロピーと、Linuxシステムプール経由の混合エントロピーの2つのパスを公開する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:09:55 GMT)
Polaron effects on the information backflow in Jaynes-Cummings model [0.0] 本稿では,Jynes-Cummings (JC) モデルにおいて,フォノン自由度が量子力学に与える影響について検討する。
強いクビット-フォノン結合は、Jaynes-Cummings-Holstein (JCH)モデルを引き起こすと考えられている。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:42:48 GMT)
OrthoAI v2: From Single-Agent Segmentation to Dual-Agent Treatment Planning for Clear Aligners [0.0] 私たちは、AI支援矯正治療計画のためのオープンソースのパイプラインの2番目のイテレーションであるOrthoAI v2を紹介します。
v2は3つの主要な貢献を通じて 3つの制限に対処します
200のクラウドシナリオの合成ベンチマークで、OrthoAI v2の並列アンサンブルは、計画品質スコアが92.8 pm 4.1$対76.4 pm 8.3$に達し、OrthoAI v1は+21%$相対的ゲインとなり、完全なCPUデプロイ可能性(4.2 pm 0.8$s)を維持した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:03:44 GMT)
Optimal partition selection with Rényi differential privacy [0.0] 最適アルゴリズムの拡張を$L2$の有界分割選択のために提案する。
我々のプリミティブは、アートパーティション選択アルゴリズムの状態に簡単にプラグイン可能であることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:13:38 GMT)
OptiRoulette Optimizer: A New Stochastic Meta-Optimizer for up to 5.3x Faster Convergence [0.0] OptiRouletteは、単一のデータセットを修正するのではなく、トレーニング中の更新ルールを選択する、メタ最適化ツールである。
我々は,CIFAR-100,CIFAR-100-C,SVHN,Tiny ImageNet,Caltech-256の5種類の画像分類スイートの10シード結果を報告した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:45:28 GMT)
Operational bounds and diagnostics for coherence in energy transfer [0.0] 提案手法は,初期サイト基底コヒーレンスが選択した読み出しにおいて誘導できる最大変化を定量化する資源理論手法である。
ドナー・アクセプター・ダイマーでは,カップリングおよび浴室時間帯のコヒーレンス感度を解析する。
終端トラップを施した多地点チェーンでは,人口配置と初期状態のサイト・バス・コヒーレンスを区別する厳密な基準を導出する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:54:07 GMT)
On the Existence of Algebraic Equiangular Lines [0.0] 単位ベクトルによって生成される実および複素等角線を考える。
任意の次元 $d$ に対して、$mathbbCd$ に$d2$ 等角単位ベクトルの集合が存在するなら、その係数の全てを数体に持つ$d2$ 等角単位ベクトルの集合が存在する必要がある。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:01:34 GMT)
No Memorization, No Detection: Output Distribution-Based Contamination Detection in Small Language Models [0.0] CDDまたは出力分布による汚染検出は、モデルのサンプル出力のピーク値を測定することによって、データの汚染を識別する。
CDDの有効性は、微調整が動詞の暗記を生成するかどうかに大きく左右される。
確率に基づく手法、特にパープレキシティとMin-k% Probは、任意の手法がチャンスを超える全ての条件においてCDDより優れていることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:39:30 GMT)
Narrowband heralded single photons via Bragg grating inscription in germanium-doped photonic crystal fiber [0.0] 本報告では,通信路Cバンドに細い帯状単光子のファイバベースソースを提示する。
一致事故率70の光子計数データを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:47:37 GMT)
Multi-tasking through quantum annealing [0.0] MTQA(Multi-tasking quantum annealing)は、複数の最適化問題の並列処理を可能にする手法である。
MTQAは最小頂点被覆問題とグラフ分割問題という2つのNPハード問題を用いて評価される。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 10:21:17 GMT)
Modelling the Diachronic Emergence of Phoneme Frequency Distributions [0.0] 音素周波数分布は言語間で頑健な統計規則性を示す。
これらのパターンの起源は明らかになっていない。
音韻体系を形成する歴史的過程の結果としてそれらが生ずるかどうかを考察する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:06:28 GMT)
Mitigating Frequency Learning Bias in Quantum Models via Multi-Stage Residual Learning [0.0] 量子機械学習モデルは、しばしば複数の周波数成分を持つ関数を学習するのに苦労する。
多段階残差学習のアイデアを量子領域に適応させ、前段残差に対する追加の量子モジュールを反復的に訓練する。
我々の研究は量子モデルのスペクトル表現性を高めるための実践的な枠組みを提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:18:20 GMT)
Metrology for Quantum Hardware Standardization -- Charting a Pathway: A Strategic Review [0.0] 2019年のSI修正では、トレーサビリティは基本定数に固定されている。
量子技術は 実験室の科学から 工学や初期の産業展開へと移行しています
量子技術の工業化のための基盤となるのは、メトロロジーと精密測定である。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:19:35 GMT)
Measuring onion website discovery and Tor users' interests with honeypots [0.0] Torは匿名のWebブラウジングと匿名のオニオンWebサイトへのアクセスを可能にする。
我々のハネポットアプローチは、オニオンサイトカテゴリー間のエンゲージメントを測定し、人気を推測するよりも行動的関心を明らかにする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:04:49 GMT)
MM-algorithms for traditional and convex NMF with Tweedie and Negative Binomial cost functions and empirical evaluation [0.0] 非負行列分解(NMF)は教師なし学習と特徴抽出に広く用いられているツールである。
従来のNMFと凸NMFの双方に対して、分布の広いクラスで統一的なフレームワークを開発する。
我々は、複数の凸NMFモデルの最初の実装を含む、すべての考慮されたモデルの統一的な実装を提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:46:25 GMT)
MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations [0.0] 大規模な科学的コラボレーションは、膨大な内部文書のコーパスを生み出している。
我々は、物理解析に関する特定の文脈対応の質問に答えるように設計された、レトリーバル拡張生成(RAG)ベースのシステムであるMITRAのプロトタイプを提案する。
MITRAは、内部データベースからの文書検索にSeleniumを使用した新しい自動パイプラインと、高忠実なテキスト抽出のためのレイアウト解析を備えたOCRを採用している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:28:35 GMT)
MALTA: Maintenance-Aware Technical Lag, Estimation to Address Software Abandonment [0.0] オープンソースエコシステムは、持続的なパッケージメンテナンスに依存している。
Version Lagのような既存のTechnical Lagメトリクスは、アクティブにメンテナンスされたパッケージと放棄されたパッケージの区別に苦労している。
本稿では,3つの指標からなるスコアリングフレームワークであるMALTA(Container-Aware Lag and Technical Abandonment)を紹介する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:50:38 GMT)
Lost in the Middle at Birth: An Exact Theory of Transformer Position Bias [0.0] この論文は、ミドル・イン・ザ・ロスト・イン・ザ・ミドル現象について、単一の正確な主張をしている。
それは、学習したSoftmaxアーティファクトや、RoPEのような位置エンコーディングの遠隔デカイに広く帰結している。
トレーニングされていないQwen2アーキテクチャとGPT-2アーキテクチャがStep0でこのU字形を示し、RoPEと同一か否かを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:01:06 GMT)
Localized intrinsic bond orbitals decode correlated charge migration dynamics [0.0] 局在型内在性結合軌道(IBO)の拡張による電荷移動の解析
これらの軌道は力学のコンパクトな表現をもたらし、複雑な相関多電子電荷移動を化学概念にマッピングする。
IBOは、電荷移動における重要なメカニズムを特定するのにどのように役立つかを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:00:00 GMT)
Light-Matter Interactions Beyond the Dipole Approximation in Extended Systems Without Multipole Expansion [0.0] 電気双極子近似(EDA)を超える光-物質相互作用を捉えるための一般的な理論的枠組みを提案する。
EDAは、光が物質に伝搬するとき、均一に照射された1-Dまたは2-D材料に対して極めて堅牢であることがわかった。
提案手法は,標準双極子計算の計算コストにおいて,双極子を越えた光-物質相互作用を捉える。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:00:48 GMT)
Learning to detect optical nonclassicality [0.0] 非古典性は光子ベースの量子技術の資源として機能する。
我々は古典的状態と非古典的状態とを区別するために変分モデルを訓練する。
我々のアプローチは、学習された分析的決定ルールを抽出できるという意味で、データ駆動であり、解釈可能である。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:24:14 GMT)
LITTA: Late-Interaction and Test-Time Alignment for Visually-Grounded Multimodal Retrieval [0.0] LITTAは、エビデンスページ検索のためのクエリ拡張中心の検索フレームワークである。
ユーザクエリが与えられた後、LITTAは大きな言語モデルを使用して補完的なクエリ変種を生成する。
拡張されたクエリからの候補は、エビデンスカバレッジを改善するために、相互のランクフュージョンを通じて集約される。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:25:39 GMT)
Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing [0.0] 偏微分方程式を解くためのニューロモルフィックアルゴリズムは、アブレーションされたニューロンとドロップスパイクの形での構造的摂動に本質的に寛容であることを示す。
この研究は、アルゴリズムの背後にある特定の脳のようなインスピレーションが、脳のようなニューロモルフィックアルゴリズムから期待されるかなりの堅牢性に寄与することを示した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 21:50:20 GMT)
Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework [0.0] データ駆動型フレームワークは、プロセスパラメータと表面角を用いて製造前に算術平均粗さ(Ra)を予測する。
システムはモデル幾何学から顔の傾きを計算し、予測されたRaを表面上のインタラクティブなカラーマップとして視覚化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:34:09 GMT)
Intelligent Spatial Estimation for Fire Hazards in Engineering Sites: An Enhanced YOLOv8-Powered Proximity Analysis Framework [0.0] 本研究は、インテリジェント火災検知と近接認識リスク評価のための強化された2モデルYOLOv8フレームワークを提案する。
このフレームワークは、火と煙の検出のための主要なYOLOv8インスタンスセグメンテーションモデルと、COCOデータセットで事前訓練された二次オブジェクト検出モデルを組み合わせて、周囲のエンティティを識別する。
提案フレームワークは、精度、リコール、F1スコアが90%以上、mAP@0.5スコアが91%以上、高い性能を達成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:27:46 GMT)
Incoherent Operations Enable State Transformations Impossible under Dephasing-covariant Incoherent Operations [0.0] 非コヒーレント演算は、デファッシン共変不コヒーレント演算(DIOs)の下で禁止される状態変換を達成することができることを示す。
厳密な不整合演算(SIO)の下での状態変換性を特徴付けるためのIO単調な集合は存在しないことを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:16:13 GMT)
Impact of Markov Decision Process Design on Sim-to-Real Reinforcement Learning [0.0] この研究は、コアマルコフ決定プロセス(MDP)の設計選択がこの伝達にどのように影響するかを体系的に分析する。
カラーミキシングタスクを用いて,様々なMDP構成を評価し,シミュレーションや実世界の実験で動的に混合する。
物理ハードウェアに関する我々の知見を検証し、物理に基づく力学モデルが50%以上の実世界の成功を達成できることを実証した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:41:37 GMT)
Hybrid Hidden Markov Model for Modeling Equity Excess Growth Rate Dynamics: A Discrete-State Approach with Jump-Diffusion [0.0] パラメトリックモデルから深層生成ネットワークへの既存のアプローチは、重み付き分布、無視可能な線形自己相関、永続的なボラティリティクラスタリングを同時に再現するのに苦労している。
本稿では,連続的過剰成長率をLaplacequantile-defined market stateに離散化するハイブリッド隠れマルコフフレームワークを提案する。
パラメータは直接遷移カウントによって推定され、Baum-Welch EMアルゴリズムをバイパスする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:06:53 GMT)
Has quantum advantage been achieved? [0.0] 量子計算の優位性は2019年に初めて主張された。
量子的優位性が実際に達成されたかどうかについては合意が得られない。
量子優位性の理論と実験の次のステップを概説する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:55:03 GMT)
Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs [0.0] ハードウェア効率のよいMest Significant Bitプロキシを用いて、無視できない非ゼロ乗算をスキップする「ソフトスパシティ」パラダイムを提案する。
この方法は、ReLU MACsを88.42%、Tanh MACsを74.87%削減し、精度の低下をゼロにする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:59:10 GMT)
Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice [0.0] 実行サンドボックス(L1)、意図検証(L2)、ゼロトラスト間認証(L3)、不変監査ロギング(L4)からなる4層フレームワークであるレイヤガバナンスアーキテクチャ(LGA)を提案する。
LGAを評価するために、1,081のツールコールサンプル(インジェクション、RAG中毒、悪意のあるスキルプラグインなど)のベンチマーク(中国語のオリジナル、機械翻訳による英語)を構築し、それをオープンソースの代表的なエージェントフレームワークであるOpenClawに適用する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:48:04 GMT)
Global universality via discrete-time signatures [0.0] この積分性条件を満たすブラウン運動の断片線型性を示す。
経路依存関数、ランダム常微分方程式、ブラウン運動によって駆動される微分方程式に対する$Lp$-approximation結果を得る。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:12:03 GMT)
Geometry-Aware Metric Learning for Cross-Lingual Few-Shot Sign Language Recognition on Static Hand Keypoints [0.0] データリッチなソース言語で事前トレーニングされた言語間の数ショット転送は、スケーラブルな代替手段を提供する。
コンパクトな20次元交叉角記述子を中心にした幾何認識型距離学習フレームワークを提案する。
これらの角度はSO(3)の回転、変換、等方スケーリングと不変であり、データセット間のシフトの主源を排除している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:31:46 GMT)
Genuinely entangled subspaces and strongly nonlocal unextendible biseparable bases in four-partite systems [0.0] 純粋な状態の集合は、拡張不可能な双分離基底(UBB)である
本稿では,UBBを構築するためのアプローチを提案し,この方法で確立されたUBBが強い非局所性であることを証明した。
また、真に絡み合った部分空間の特定の正規直交基底を記述する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 00:18:31 GMT)
GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need [0.0] 幾何基底学習は、観測を任意のベクトルとして扱うのではなく、問題領域の構造を尊重するようモデルに求める。
一般化特異値分解(GSVD)を2つの部分空間の連接座標系として用いる。
サンプル $z$ に対して [0, /2] の解釈可能な *angle score* $(z) を導出し、z が比較的$A$ で説明されるか、$B$ で説明されるか、あるいは両方で比較可能であるかを定量化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:58:09 GMT)
GNNs for Time Series Anomaly Detection: An Open-Source Framework and a Critical Evaluation [0.0] グラフニューラルネットワーク(GNN)を用いた時系列異常検出(TSAD)のためのオープンソースフレームワークを提案する。
本研究は,グラフベースのTSADシステムの開発と評価を促進するために,実用ツールと重要な知見の両方に貢献する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:45:34 GMT)
From Weighting to Modeling: A Nonparametric Estimator for Off-Policy Evaluation [0.0] 文脈的包帯の設定における政治以外の評価について検討する。
我々は、文脈、行動、報酬からなる歴史的データを用いて、新しい政策を評価することを目的とする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:48:22 GMT)
From Scalars to Tensors: Declared Losses Recover Epistemic Distinctions That Neutrosophic Scalars Cannot Express [0.0] Leyva-Vzquez と Smarandache (2025) は、真理、不決定性、ファルシティが 1.0 に制限されない独立次元であるニュートロソフィックな T/I/F 評価が「超真実」を示すことを示した。
我々は5つのベンダーから5つのモデルファミリにまたがって実験を再現し、拡張し、制約のない評価の84%に超真実を見出した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 01:02:26 GMT)
From Phase Prediction to Phase Design: A ReAct Agent Framework for High-Entropy Alloy Discovery [0.0] 本稿では,HEA合成を自律的に提案し,検証し,反復的に洗練するReAct (Reasoning + Acting) LLMエージェントを提案する。
フルプロンプトエージェントは、FCC、BCC、BCC+FCCの38%、18%、および38%のディスクリプタ空間再発見率を達成する。
本研究は, LLM誘導型エージェント推論を, 逆合金設計における勾配自由最適化の原理的, 透過的, 多様体的補完として確立する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:20:53 GMT)
Flexible Cutoff Learning: Optimizing Machine Learning Potentials After Training [0.0] 機械学習による原子間ポテンシャル(MLIP)の学習方法であるフレキシブルカットオフ学習(FCL)を紹介する。
FCLモデルは各原子に対してランダムにカットオフラジイをサンプリングすることによって訓練される。
結果として得られるモデルは、アプリケーションによって異なる原子単位のカットオフラジイでデプロイされる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:14:52 GMT)
Exploring Collatz Dynamics with Human-LLM Collaboration [0.0] 大規模な計算探索で観測された2つの現象を通してコラッツ反復の構造特性について検討する。
モジュラースクランブル補題を含むいくつかの構造的結果を示す。
結果は、バーストとギャップ長に関する適切な軌道上仮説から収束する条件付き枠組みを示唆している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:07:00 GMT)
Explainable Innovation Engine: Dual-Tree Agent-RAG with Methods-as-Nodes and Verifiable Write-Back [0.0] 本稿では,知識単位をテキストチャンクからメソッド・アズ・ノードにアップグレードする説明可能なイノベーションエンジンを提案する。
エンジンは、トレース可能な導出のための重み付きメソッド証明ツリーと、効率的なトップダウンナビゲーションのための階層的クラスタリング抽象化ツリーを維持している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 05:04:28 GMT)
Execution Is the New Attack Surface: Survivability-Aware Agentic Crypto Trading with OpenClaw-Style Local Executors [0.0] Survivability-Aware Execution (SAE)は、OpenClawスタイルのシステムとスキル対応エージェントの実行層サバイバル標準である。
我々は、スコープ外ラベリングと再現可能なメトリクスを可能にするログ付きIntended Policy Specを通じて、デリゲーションギャップ(DG)を運用する。
SAEは、OpenClaw+skills時代の代理取引の安全性を再設定する: 上流の意図とスキルを信頼できないものとして扱い、アクションが副作用となる生存可能性を強化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:54:01 GMT)
Evolution of Photonic Quantum Machine Learning under Noise [0.0] フォトニック量子機械学習(PQML)は、フォトニック量子コンピューティング技術と機械学習技術を統合する新しいアプローチである。
ノイズはPQMLの実装の性能、信頼性、スケーラビリティに影響を与える大きな課題である。
本稿では,フォトニック量子機械学習システムにおけるノイズ源の系統的解析を行う。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 13:21:23 GMT)
Evaluating Reliability Gaps in Large Language Model Safety via Repeated Prompt Sampling [0.0] 信頼性工学において,高度に加速された応力試験にインスパイアされた深度指向評価フレームワークであるAPST(Accelerated Prompt Stress Testing)を紹介する。
APSTは、温度変化や急激な摂動を含む、制御された操作条件下で同じプロンプトを繰り返しサンプリングすることで、振る舞いを調査する。
本研究では,Bernoulli と binomial を用いた安全故障を観測し,予測故障確率を推定し,モデルと構成間の運用リスクの定量的比較を可能にする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:23:01 GMT)
Ethical Implications of Training Deceptive AI [0.0] AIシステムにおける認知行動はもはや理論的ではない。
欧州連合のAI法は、詐欺的なAIシステムの配備を禁止している。
詐欺研究の実施方法を規定する確立した枠組みは存在しない。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:30:27 GMT)
Estimating condition number with Graph Neural Networks [0.0] グラフニューラルネットワーク(GNN)を用いたスパース行列の条件数推定法を提案する。
提案手法はHager-Higham法とLaczos法を大幅に高速化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 23:38:48 GMT)
Emergence of Classical Dynamics from a Random Matrix Schrödinger Model [0.0] 結果, 状態空間のランダムウォークを規定するパラメータは, 実験的に識別不可能な状態を同値類として扱うとともに, 顕微鏡系とマクロ系のコントラスト挙動を説明する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:47:52 GMT)
Elementary asymptotic approach to the Landau-Zener problem [0.0] 定常振幅だが時間依存位相の2つの線形独立な基本波に基づくランダウ・ツェナー問題に対するアプローチを提案する。
私たちのアプローチでは、正確な解のすべての特徴を説明するだけで、効果の起源について深い洞察を得ることができます。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:33:26 GMT)
Efficient and robust control with spikes that constrain free energy [0.0] 本稿では, 現実的な生物学的特性を有する新しい, 効率的で頑健なスパイク制御フレームワークを提案する。
結果として生じるネットワークは自由エネルギー制約器として機能し、ニューロンは内部表現の自由エネルギーを減少させると発火する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:33:14 GMT)
Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training [0.0] テストにかかる時間を増やすことなく、どのように構造化され、正しい意思決定をするかを尋ねます。
第一に、ファジィ状態位置アライメントを介して予め構築された長さ認識注意。
第二に、RPAコントローラは、検証の改善が保証された場合にのみ注意を鋭くする。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 06:37:51 GMT)
EPIC-EuroParl-UdS: Information-Theoretic Perspectives on Translation and Interpreting [0.0] 本稿では、英語とドイツ語のEPIC-UdS (spoken) と EuroParl-UdS (write) コーパスの更新および統合版を紹介する。
新バージョンはメタデータとテキストエラーを前回の使用で修正し、コンテンツを洗練し、言語アノテーションを更新し、新しいレイヤを追加する。
本稿は、今回のリリースで導入されたアップデートの概要を概説し、コーパスに基づいて以前の結果を要約し、新しいイラストレーション研究を示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:20:40 GMT)
Do Large Language Models Get Caught in Hofstadter-Mobius Loops? [0.0] 本稿では、現代のRLHF学習言語モデルが構造的に類似した矛盾の対象となっていることを論じる。
トレーニングプロセスは、ユーザの嗜好の遵守とユーザの意図に対する疑念を同時に報いる。
結果として生じる行動プロファイルは、クラークがHofstadter-Mobiusループと呼んだものと一致している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:43:37 GMT)
Disorder-Assisted Adiabaticity in Correlated Many-Particle Systems [0.0] 相互作用量子系における乱れが、相互作用変調後の系の状態に与える影響を評価することにより、相互作用量子系の断熱性にどのように影響するかを考察する。
障害強度とパルス形状とは無関係に、パルス長は系の総エネルギーの変化と負の相関関係があることが判明した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:00:32 GMT)
Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals [0.0] scGPTは内部的に発達分岐構造を持つコンパクトな造血多様体を符号化していることを示す。
本稿では,凍結した注意重みから直接操作子を輸出する3段階抽出法を提案する。
コンパクト作用素の機械論的解釈性は、66.2%のアブレーション効果を説明する4要素コアが集中していることを示している。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:44:12 GMT)
Differentiable Stochastic Traffic Dynamics: Physics-Informed Generative Modelling in Transportation [0.0] この研究は、物理制約自体が分散的かつ空間的であり、トラフィックフローのダイナミクスから導かれる枠組みを開発する。
このフレームワークは、分散トラフィック状態推定の基礎と、物理インフォームド・ジェネレーティブ・セッティングにおける基礎解析の基盤を提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 04:25:20 GMT)
Developing Machine Learning-Based Watch-to-Warning Severe Weather Guidance from the Warn-on-Forecast System [0.0] 今後2~6時間にわたって,深刻な気象被害の可能性を予測するためのグリッドベースのMLフレームワークを開発し,評価する。
本研究では,2-5kmの高架ヘリシティから発生したベースラインに対して,勾配ブーストツリー(HGBT)モデルと深層学習型U-Netアプローチを比較した。
HGBTは最高のパフォーマンス指標を達成しているが、予測確率は60%、U-net予測は100%である。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 14:18:03 GMT)
Detecting Privilege Escalation with Temporal Braid Groups [0.0] ブラウ・リャプノフ指数LEを代数的プローブとして、2つのリスク状態の境界を求める。
分散と集中と呼ばれる2つの際立ったリスク体制を識別するために、それを活用する方法を示します。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:14:36 GMT)
Decoding the decoder: Contextual sequence-to-sequence modeling for intracortical speech decoding [0.0] 音声脳-コンピュータインタフェースは、皮質内活動から言語出力に変換するデコーダを必要とする。
文脈的シーケンス・ツー・シーケンスの復号化がサブレキシカル・ニューラル・リードアウト、ロバストネス、解釈可能性にどのような影響を及ぼすかはいまだ不明である。
我々は,6v領域の皮質内記録からの音声復号を試みるためのトランスフォーマーに基づくシーケンス・ツー・シーケンス・モデルの評価を行った。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:46:14 GMT)
Crosstalk in Multi-Qubit Fluxonium Architectures with Transmon Couplers [0.0] 本研究では,トランスモン超伝導量子ビットをチューナブルカプラとして用いた2量子ビットアーキテクチャのスケーラビリティについて数値解析を行った。
このアーキテクチャを自明にスケールする場合、オブザーバキュービットからのクロストークは、ゲートの忠実度を90%以下に制限することを示す。
結合強度を減らし、2ビット演算では使われないトランスモンをオフ位置に動的にチューニングすることにより、これらのスペクトル誤差を10~4ドル以下に抑えることができることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 16:34:15 GMT)
Correction of Transformer-Based Models with Smoothing Pseudo-Projector [0.0] 擬似プロジェクタは、既存の言語モデルや他のニューラルネットワークに統合可能な軽量な修正である。
ラベル関係の入力内容によって誘導される方向を抑えることにより、雑音に対する感度を低下させる隠蔽表現補正器とみなすことができる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:42:46 GMT)
Context Engineering: From Prompts to Corporate Multi-Agent Architecture [0.0] 関連性, 十分性, 孤立性, 経済性, 証明性, およびエージェントのオペレーティングシステムとしてのコンテキストフレームの5つの品質基準を提案する。
Intent Engineeringは、組織目標、価値、トレードオフ階層をエージェントインフラストラクチャにエンコードする。
仕様工学は、大規模にマルチエージェントシステムの自律的な運用を可能にする企業方針と標準の機械可読コーパスを作成する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:58:31 GMT)
Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference [0.0] Mamba-2のステートスペース双対性アルゴリズムは、XLAの融合とタイリングが実際に最適化したものにきれいにマッピングする。
我々は,XLA の標準プリミティブとして,完全な推論パス (プリフィル,キャッシュされた自己回帰復号化) を実装した。
この実装は、単一のJAXソースからCPU、NVIDIA GPU、Google Cloud TPUで無修正で実行される。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:03:00 GMT)
Cluster-Adaptive Sample-Based Quantum Diagonalization for Strongly Correlated Systems [0.0] 強い相関を持つ電子系は本質的に多重構成波動関数を示す。
量子コンピューティングは、これらの制限を緩和するための有望なルートとして登場した。
クラスタ適応型SQDを導入し、教師なし学習を用いてサンプルをクラスタ化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:24:08 GMT)
Characterizing Healthy & Post-Stroke Neuromotor Behavior During 6D Upper-Limb Isometric Gaming: Implications for Design of End-Effector Rehabilitation Robot Interfaces [0.0] 回復には、健康的な運動の練習を促進するために、ゲームやロボットの介入を設計する必要がある。
健常者13名, ストローク後2名の特徴, 筋活動, ゲームパフォーマンスについて検討した。
インターフェース設計の微妙な側面がユーザ行動に与える影響を評価する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 19:07:20 GMT)
Chaotic Dynamics in Multi-LLM Deliberation [0.0] 実験的なLyapunov指数(hat$)を,委員会平均選好の軌道偏差から導いたラン間感度を定量化する。
我々は,同種委員会における役割分化と非ロール委員会における異種性のモデル化という,不安定性に対する独立した経路を2つ同定する。
これらの結果は、マルチLLMガバナンスシステムの中核設計要件としての安定性監査を支援する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 02:59:11 GMT)
Capacity of Entanglement and Replica Backreaction in RST Gravity [0.0] ホーキング放射, バックリアクション, 島々を解析的に処理できる環境で, 2次元ディラトン重力における絡み合いの容量を計算する。
我々の焦点は、N の共形物質場に結合したルソ・ススキンド・トラキウス模型の永遠のブラックホールである。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:01:07 GMT)
Can ChatGPT Generate Realistic Synthetic System Requirement Specifications? Results of a Case Study [0.0] ChatGPTのようなブラックボックスの大型言語モデル(LLM)は魅力的な生成機能を提供する。
LLMは幻覚と過剰な自信に悩まされ、その使用に大きな課題を引き起こしている。
ChatGPTで10の業界で300のSSyRSを生成しました。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 08:10:56 GMT)
Calculating trace distances of bosonic states in Krylov subspace [0.0] 一般化したLanczosアルゴリズムを用いて,純ガウス状態と混合ガウス状態の間のトレース距離を計算する方法を示す。
また、混合ガウス状態間のトレース距離の低い境界をどうやって得るかを示し、連続変数量子システムにおける状態認証と学習のための実用的なツールを提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:34:33 GMT)
CERES: A Probabilistic Early Warning System for Acute Food Insecurity [0.0] CERESは、世界43カ国で、ICCフェーズ3+(クライシス)、フェーズ4+(緊急)、フェーズ5(飢餓)の90日間の予測を、毎週更新している。
このシステムは6つのデータストリーム、降水異常(CHIRPS)、植生指標(MODIS NDVI)、IPC分類、食品消費スコア(WFP)、穀物価格指標(FAO/WFP)を融合する。
全ての予測は、T+90地平線におけるIPC結果データに対する公開検証のためにタイムスタンプされ、暗号化され、アーカイブされる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:39:10 GMT)
Build, Borrow, or Just Fine-Tune? A Political Scientist's Guide to Choosing NLP Models [0.0] 政治学者は、自然言語処理ツールを採用する際に、適切な選択に直面している。
それぞれのアプローチは、パフォーマンス、コスト、必要な専門知識のスペクトルに関して異なるポイントを占めています。
本稿は、このトレードオフをナビゲートする方法に関する実証的なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:42:12 GMT)
Breaking the Geometric Bottleneck: Contrastive Expansion in Asymmetric Cross-Modal Distillation [0.0] グローバルビジョン変換器をキャパシティ制約CNNに蒸留する際の次元崩壊現象について検討する。
厳密な集中型SVDとエフェクトランクを用いることで、CIFAR-10上でキャパシティ非依存の位相遷移を示す。
さらに、DINOv2の均一な幾何は部分的に崩壊を防ぐが、コントラスト展開はCNNのトポロジカルキャパシティ限界に達する普遍的な要件であることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:59:59 GMT)
Bioalignment: Measuring and Improving LLM Disposition Toward Biological Systems for AI Safety [0.0] インターネット規模のコーパスで訓練された大規模言語モデル(LLM)は、望ましくない行動の確率を増加させる体系的なバイアスを示す。
4つの領域(材料、エネルギー、製造、アルゴリズム)にわたる合成と生物の技術的ソリューションに対する潜在的なバイアスについて検討した。
その結果,QLoRAファインチューニングは,一般性能を低下させることなく,両モデルの生体溶液のスコアリングを著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:44:58 GMT)
Bayesian Hierarchical Models and the Maximum Entropy Principle [0.0] 先述のハイパーパラメータが正準分布であるとき、従属境界事前もまた、異なる制約を持つ最大エントロピー特性を持つことを示す。
その結果、階層的なモデルを割り当てたときに、実際にどのような情報が想定されているかが明らかになりました。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:14:23 GMT)
Are quantum trajectories suitable for semiclassical approximations? [0.0] デ・ブロイ=ボームの量子力学の定式化における量子軌道は、シュルディンガー方程式の全波解から導かれる追加の量子ポテンシャルに依存する。
積分可能性の概念は古典力学や量子力学と密接に一致するが、量子軌道では保存されない。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 20:15:23 GMT)
Analytic formulae for non-local magic in bipartite systems of qutrits and ququints [0.0] 素局所次元の純キュディ状態の非局所魔法に対する解析式を予想する。
複合局所次元の場合、類似表現は一般に大域最小度を再現しない。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:46:02 GMT)
An elementary proof of symmetrization postulate in quantum mechanics for a system of particles [0.0] 同一粒子系の対称性仮定によれば、波動関数は完全に対称か完全に反対称でなければならない。
本稿では,波動関数のスピン部分を無視したこの仮定を3次元で数学的に正当化する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 12:06:07 GMT)
An Introduction to the Foundations and Interpretations of Quantum Mechanics [0.0] 本稿では,量子力学における重要な概念的・解釈的発展について考察する。
理論は基礎的な仮定から、測定、非局所性、古典性の出現に関する議論まで遡る。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 15:44:47 GMT)
Adversarial Latent-State Training for Robust Policies in Partially Observable Domains [0.0] 我々は、敵がエピソードの前に隠された初期潜伏分布を選択する集中的な設定をフォーマル化する。
我々は,最短ケースディフェンダー分布を特徴付ける潜在ミニマックスの原理を証明し,最適応答不等式を導出する。
潜在初期状態問題に対して、このフレームワークはクリーンな評価ゲームと有用な定理モチベーション付き診断を提供する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:36:57 GMT)
AI Act Evaluation Benchmark: An Open, Transparent, and Reproducible Evaluation Dataset for NLP and RAG Systems [0.0] 不均一な公共および社会的セクターにおけるAIの急速な展開は、規制標準やフレームワークへのコンプライアンスの必要性を増大させてきた。
このような標準に対するAIシステムのコンプライアンスレベルを引き出すソリューションの開発は、リソース不足によって制限されることが多い。
本稿では、NLPモデルの評価を容易にするリソースを作成するための、オープンで透明で再現可能な手法を提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 09:47:50 GMT)
ADVERSA: Measuring Multi-Turn Guardrail Degradation and Judge Reliability in Large Language Models [0.0] 大規模言語モデル(LLM)の安全性に対する多くの逆評価は、単一プロンプトを評価し、バイナリパス/フェイルの結果を報告する。
ADVERSAは、ガードレールのダイナミクスを丸ごとのコンプライアンストラジェクトリとして測定する自動化されたレッドチームフレームワークである。
トレーニングディストリビューションから展開された細調整された攻撃者に対して、アタッカードリフトを障害モードとして記述する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 03:00:34 GMT)
A neural operator for predicting vibration frequency response curves from limited data [0.0] 振動試験は 動作中の共振周波数と振幅の 性能検証と識別に 不可欠です。
物理に基づく正規化損失関数を使わずに機械学習を用いて動的システムを解くことは困難である。
本研究では、第一原理からの規則化項を使わずに、検査可能な物理的従順性を持つ構造を考案することができる。
このネットワークは、入力条件の小さなセットでトレーニングすることで、システムのグローバルな周波数応答を推測することができる。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 18:34:39 GMT)
A complete classification of 2d symmetry protected states with symmetric entanglers [0.0] 有限対称性群 $G$ を持つ 2d 量子スピン系の対称性保護位相状態を考える。
このクラスの状態に対して、$H3(G,U(1))$による分類が完備であることを示す。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 17:55:48 GMT)
A Robust Deep Learning Framework for Bangla License Plate Recognition Using YOLO and Vision-Language OCR [0.0] 複雑な文字スキームと不均一なレイアウトのため、バングラナンバープレートの検出は依然として困難である。
本稿では,ライセンスプレートの局所化のためのディープラーニングに基づくオブジェクト検出モデルと,テキスト抽出のための光文字認識を統合した,堅牢なBanglaライセンスプレート認識システムを提案する。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 22:55:59 GMT)
A Computer-aided Framework for Detecting Osteosarcoma in Computed Tomography Scans [0.0] 研究の目的は、前処理、検出、後処理、CTスキャンの可視化を含むパイプラインを通じて骨肉腫の診断を自動化することである。
本稿では、さまざまな畳み込みニューラルネットワーク(CNN)モデルを用いて、CTスキャンを分類するための機械学習および可視化フレームワークを提案する。
12例について検討した結果,AUCが94.8%,特異性が94.6%であった。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 11:45:55 GMT)
A Comparative Study on the Impact of Traditional Learning and Interactive Learning on Students' Academic Performance and Emotional Well-Being [0.0] 本研究では,従来の対話型学習手法が学業成績,エンゲージメント,モチベーション,感情的幸福感に与える影響を比較検討した。
学生は、伝統的な学習グループ(講義とノート)や、Kahoot、Panopto、Slido、Quizizz、Padlet、教育ビデオなどのツールを利用した対話型学習グループにランダムに割り当てられた。
その結果、インタラクティブグループの学生は、ポストテスト(67.48%対53.36%)と最終試験(80.8%対61.44%)の両方で成績が有意に向上した。
論文参考訳(メタデータ) (Tue, 10 Mar 2026 07:45:59 GMT)