Sparse-BitNet: 1.58-bit LLMs are Naturally Friendly to Semi-Structured Sparsity [100.1] 我々は1.58ビットビットネットが完全精度モデルよりも自然にN:M空間と互換性があることを示した。
我々は1.58ビット量子化と動的N:Mスペーサー化を併用した統合フレームワークであるSparse-BitNetを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:37:50 GMT)
NOVA3R: Non-pixel-aligned Visual Transformer for Amodal 3D Reconstruction [99.5] NOVA3Rは、フィードフォワード方式で、未提示画像の集合から非画素アラインな3D再構成に有効なアプローチである。
重なり合う領域における重複構造の少ない物理的に可算な幾何学を生成する。
復元精度と完全性の観点から、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:25:25 GMT)
FreeAct: Freeing Activations for LLM Quantization [90.0] 量子化は、大規模言語モデルの重要なメモリと計算オーバーヘッドを軽減するために重要である。
FreeActは静的な1対1の制約を緩和し、動的アクティベーションの格差を緩和する新しい量子化フレームワークである。
dLLMとMLLMでの実験では、FreeActはベースラインを大幅に上回り、パフォーマンスは最大5.3%向上した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:02:36 GMT)
SlideSparse: Fast and Flexible (2N-2):2N Structured Sparsity [86.7] NVIDIAの2:4 Sparse Coresは2倍のスループットを提供するが、厳しい50%のプルーニングを要求する。
Milder $(2N-2):2N$パターンは正確さを維持しながらハードウェアサポートを受けない。
Sparse Coreアクセラレーションをアンロックする最初のシステムであるSlideSparseを紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:49:16 GMT)
IF-RewardBench: Benchmarking Judge Models for Instruction-Following Evaluation [85.6] 命令追従のための総合的メタ評価ベンチマークであるIF-RewardBenchを提案する。
各命令に対して、複数の応答間の全てのペアの選好を含む選好グラフを構築する。
IF-RewardBenchの実験は、現在の審査モデルに重大な欠陥を呈している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:21:17 GMT)
Guiding Diffusion-based Reconstruction with Contrastive Signals for Balanced Visual Representation [81.4] 対照的に、CLIP(Contrastive Language- Image Pre-training)は、下流のパフォーマンスにおいて重要なボトルネックとなっている。
近年のソリューションでは、拡散モデルを用いて、CLIP視覚トークンに画像再構成を条件付けることで表現を強化する。
我々は、より包括的な視覚表現を追求するために、コントラスト信号を拡散に基づく再構成に統合する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:45:49 GMT)
Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World Model [76.3] そこで我々は,各観測結果を最大8個のトークンに圧縮し,計算コストを大幅に削減し,計画に必要な情報を保存するためのトークンであるCompACTを提案する。
アクション条件付きワールドモデルは、CompACTトークンライザを占有し、桁違いの高速計画による競合計画性能を達成し、現実世界のワールドモデルの展開に向けた実践的なステップを提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:00:02 GMT)
AgentIR: Reasoning-Aware Retrieval for Deep Research Agents [76.3] ディープリサーチエージェントは、各検索の前に明示的な自然言語推論を生成する。
Reasoning-Aware Retrievalは、クエリと一緒にエージェントの推論トレースを埋め込む。
DR-Synthは、標準的なQAデータセットからDeep Researchレトリバーのトレーニングデータを生成する。
AgentIR-4Bは、オープンウェイトエージェントであるTongyi-DeepResearchで68%の精度を達成する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:56:37 GMT)
On the Generalization Capacities of MLLMs for Spatial Intelligence [72.2] 我々は、RGBのみのアプローチは、カメラをまたいで一般化する能力に根本的な欠陥があると主張している。
これによりMLLMは、真の3次元幾何学的原理を学習するのではなく、トレーニングカメラの分布に過度に適合することを示す。
空間MLLMのためのカメラ対応MLLMフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:46:11 GMT)
$\nabla$-Reasoner: LLM Reasoning via Test-Time Gradient Descent in Latent Space [71.2] $nabla$-Reasonerは、トークンログに対する差別化可能な最適化をデコードループに統合する反復生成フレームワークである。
$nabla$-Reasonerは、挑戦的な数学的推論ベンチマークで20%以上の精度の向上を実現している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:42:54 GMT)
UltraDexGrasp: Learning Universal Dexterous Grasping for Bimanual Robots with Synthetic Data [71.0] 両面ロボットを用いた普遍的デクスタラスグリップのためのフレームワークであるUltraDexGraspを紹介する。
提案したデータ生成パイプラインは、最適化に基づくグリップ合成と計画に基づくデモ生成を統合する。
我々はUltraDexGrasp-20Mに基づいて、点雲を入力とし、一方向の注意を通してシーン特徴を集約し、制御コマンドを予測する、シンプルで効果的な把握ポリシーを開発した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:54:21 GMT)
Authorize-on-Demand: Dynamic Authorization with Legality-Aware Intellectual Property Protection for VLMs [70.1] AoD-IPは、オンデマンドおよび合法性認識アセスメントをサポートするフレームワークである。
AoD-IPは強力な認証ドメイン性能と信頼性の高い不正検出を維持している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:36:07 GMT)
Stacked from One: Multi-Scale Self-Injection for Context Window Extension [69.2] Modelnameは、多粒度コンテキスト圧縮とクエリ対応情報取得に基づく新しいフレームワークである。
modelnameachievesパフォーマンスは、強いベースラインと同等か、優れている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:16:16 GMT)
DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces [67.5] ポイントレベルの監視から編集可能なBRepsを直接生成するマルチモーダル生成フレームワークであるDreamCADを提案する。
DreamCADは、各BRepをパラメトリックパッチの集合として表現し、メッシュを生成するために微分可能なテッセルレーション手法を使用する。
DreamCADはABCの最先端のパフォーマンスを達成し、テキスト、画像、点のモダリティにまたがるベンチマークを行う。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:04:07 GMT)
Towards Highly Transferable Vision-Language Attack via Semantic-Augmented Dynamic Contrastive Interaction [67.5] 本研究では,先進的かつ意味論的に誘導された摂動を通じて対向的伝達性を高めるセマンティック・ダイナミック・コントラシブ・アタック(SADCA)を提案する。
SADCAは、対立、正、負のサンプルを含む対照的な学習メカニズムを確立し、得られた摂動の意味的不整合を強化する。
複数のデータセットとモデルの実験により、SADCAは対向移動性を大幅に改善し、最先端の手法を一貫して超えることを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:46:16 GMT)
Multi-Paradigm Collaborative Adversarial Attack Against Multi-Modal Large Language Models [67.5] 本稿では,MLLMに対する敵例の転送可能性を高めるために,MPCAttack(Multi-Paradigm Collaborative Attack)フレームワークを提案する。
MPCOは異なるパラダイム表現の重要性を適応的にバランスさせ、グローバルな最適化を導く。
我々のソリューションは、オープンソースおよびクローズドソースMLLMに対する標的および未ターゲットの攻撃において、常に最先端の手法よりも優れています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:01:26 GMT)
DSA-SRGS: Super-Resolution Gaussian Splatting for Dynamic Sparse-View DSA Reconstruction [67.4] 血管造影は脳血管疾患の補助的診断と治療のための重要な画像診断法である。
ガウススプラッティングと動的神経表現の最近の進歩は、スパースダイナミックインプットから頑健な3次元血管再構築を可能にしている。
本稿では、動的スパースビューDSA再構成のための初の超高分解能ガウススプラッティングフレームワークであるDSA-SRGSを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:41:08 GMT)
Track4World: Feedforward World-centric Dense 3D Tracking of All Pixels [67.4] モノクロビデオから各ピクセルの3D軌跡を推定することは重要であり、ビデオの3Dダイナミックスを包括的に理解する上で有望である。
最近のモノラルな3D追跡作業は印象的な性能を示しているが、第1フレーム上のスパースポイントのトラッキングや、高密度トラッキングのための遅い最適化ベースのフレームワークに限られている。
そこで我々は,Track4Worldと呼ばれるフィードフォワードモデルを提案し,世界中心座標系における全画素の効率的な3D追跡を可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:37:44 GMT)
Direct Contact-Tolerant Motion Planning With Vision Language Models [64.5] 乱雑な環境でのナビゲーションは、しばしばロボットが可動または変形可能な物体との接触を許容する必要がある。
本稿では,視覚言語モデル(VLM)を直接的視点認識とナビゲーションに統合したDCTプランナを提案する。
我々はIsaac Simと本物のカーライクなロボットにDCTを実装し、移動障害物のある散らばった環境において、DCTが堅牢で効率的なナビゲーションを実現することを実証した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:05:00 GMT)
MI-DETR: A Strong Baseline for Moving Infrared Small Target Detection with Bio-Inspired Motion Integration [63.9] 我々は、赤外線小ターゲット検出のためのバイオインスパイアされたデュアルパス検出装置であるモーション統合DETR(MI-DETR)を提案する。
まず、網膜にインスパイアされたセルオートマトン(RCA)は、生フレーム配列を外観画像と同じピクセルグリッド上に定義されたモーションマップに変換する。
第二に、PMI(Parvocellular-Magnocellular Interconnection)ブロックは2つの経路間の双方向の特徴的相互作用を促進する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:39:31 GMT)
KARL: Knowledge Agents via Reinforcement Learning [63.6] 本稿では,強化学習による企業検索エージェントの訓練システムを提案する。
KARLBenchは、6つの異なる検索レギュレーションにまたがる多機能評価スイートである。
異種探索行動で訓練されたモデルは、どのベンチマークにも最適化されたモデルよりもかなりよく一般化されていることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:30:25 GMT)
DiffusionHarmonizer: Bridging Neural Reconstruction and Photorealistic Simulation with Online Diffusion Enhancer [62.2] レンダリングを時間的に一貫した出力に変換するオンライン生成拡張フレームワークであるDiffusionHarmonizerを紹介した。
コアとなるのは、単一のGPU上でオンラインシミュレータで実行可能な、一段階の時間的条件付きエンハンサーである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:14:27 GMT)
Latent-Mark: An Audio Watermark Robust to Neural Resynthesis [62.1] Latent-Markはセマンティック圧縮に耐えられるように設計された最初のゼロビットオーディオ透かしフレームワークである。
私たちの重要な洞察は、エンコード-デコードプロセスに対する堅牢性は、不変の潜在空間に透かしを埋め込む必要があるということです。
我々の研究は、ますます複雑で多様な生成歪みをまたいで整合性を維持することができる普遍的な透かしフレームワークに、将来の研究をインスピレーションを与えます。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:51:09 GMT)
Leveraging LLM Parametric Knowledge for Fact Checking without Retrieval [60.3] 信頼性は、大規模言語モデル(LLM)上に構築されたエージェントAIシステムの中核研究課題である
本研究では,任意の自然言語クレームの検証に焦点をあて,検索なしで事実チェックを行うタスクを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:42:51 GMT)
Towards Multimodal Lifelong Understanding: A Dataset and Agentic Baseline [58.6] MM-Lifelongはマルチモーダルライフロング理解のために設計されたデータセットである。
撮影時間は181.1時間で、日、週、月の各スケールにまたがって構成され、様々な時間密度を捉えている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:52:12 GMT)
Orthogonal Spatial-temporal Distributional Transfer for 4D Generation [58.3] 既存の3次元拡散モデルと時間的拡散モデルから豊かな空間的先行を転送し、4次元合成を強化するフレームワークを提案する。
空間・時間差4D(STD-4D)拡散モデルを構築し,空間・時間差による4D映像を合成する。
実験の結果,提案手法は従来の手法よりも優れ,空間的時間的整合性と高品質な4D合成を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:52:21 GMT)
POET-X: Memory-efficient LLM Training by Scaling Orthogonal Transformation [57.6] 大規模言語モデルをトレーニングするためのスケーラブルでメモリ効率のよい変種であるPOET-Xを紹介する。
PoET-Xは、スループットとメモリ効率を大幅に改善しながら、PoETの一般化と安定性の利点を維持している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:59:23 GMT)
Survive at All Costs: Exploring LLM's Risky Behaviors under Survival Pressure [57.5] 大型言語モデル(LLM)は、生存圧力を受けると危険行動を示すことがますます多く見られる。
本稿では,サバイブ・アット・オール・COSTSと呼ばれる生存誘導型不行行動について検討する。
SuRVIVALBENCHは実世界の様々なシナリオにまたがって1,000のテストケースからなるベンチマークである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:16:23 GMT)
The Inductive Bias of Convolutional Neural Networks: Locality and Weight Sharing Reshape Implicit Regularization [57.4] 本研究では,勾配降下における安定性現象によって引き起こされる暗黙の正則化に,アーキテクチャ的帰納バイアスがどう影響するかを考察する。
局所性と重量共有が根本的に変化していることが示されています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:50:51 GMT)
MultiHaystack: Benchmarking Multimodal Retrieval and Reasoning over 40K Images, Videos, and Documents [57.3] MultiHaystackは、大規模なクロスモーダル条件下での検索と推論の両方を評価するために設計された最初のベンチマークである。
モデルが対応するエビデンスを付与した場合,その性能は,全コーパスからそのエビデンスを取得するために必要な場合,急激に低下することがわかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:43:02 GMT)
Learn Hard Problems During RL with Reference Guided Fine-tuning [56.6] 数学的推論のための強化学習(RL)は報酬の分散に悩むことがある。
本稿では,Reference-Guided Fine-Tuning (ReGFT)を導入し,ハード問題に対する正の軌道を合成し,RLの前にトレーニングする。
以上の結果から,ReGFTは報酬空間を効果的に克服し,より強力なRLに基づく数学的推論を解き放つことが示唆された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:33:10 GMT)
Kiwi-Edit: Versatile Video Editing via Instruction and Reference Guidance [55.3] 本稿では,既存のビデオ編集ペアを高忠実度トレーニング四重項に変換するスケーラブルなデータ生成パイプラインを提案する。
本稿では,学習可能なクエリと参照セマンティックガイダンスのための潜在視覚特徴を相乗化する統合編集アーキテクチャKiwi-Editを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:36:07 GMT)
Improving Text-to-Image Generation with Intrinsic Self-Confidence Rewards [54.9] テキスト・ツー・イメージ生成モデルのポストトレーニングは、人間の好み、事実性、そして美学を改善するための有望な道である。
本稿では,外部報酬管理を自己自信信号に置き換えるポストトレーニングフレームワークであるSOLACEを紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:43:49 GMT)
Replaying pre-training data improves fine-tuning [54.7] 微調整中にジェネリックデータを再生することで、(無関係な)ターゲットタスクのパフォーマンスが向上することを示す。
さらに、事前トレーニング中にターゲットデータを導入するデータスケジュールを分析し、事前トレーニングにターゲットデータが少ない場合には、リプレイがより役立ちます。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:00:49 GMT)
OpenFrontier: General Navigation with Visual-Language Grounded Frontiers [54.7] オープンワールドナビゲーションでは、複雑な日常環境においてロボットが意思決定を行う必要がある。
近年の視覚-言語ナビゲーション(VLN)と視覚-言語-アクション(VLA)モデルは、自然言語で条件付けられたエンドツーエンドのポリシーを実現する。
多様な視覚をシームレスに統合するトレーニングフリーナビゲーションフレームワークであるOpenFrontierを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:02:22 GMT)
Rethinking Concept Bottleneck Models: From Pitfalls to Solutions [53.8] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解可能な概念の基底予測である。
CBM-Suiteはこれらの課題に対処するための方法論的なフレームワークである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:37:49 GMT)
Transducing Language Models [52.1] 決定論的文字列から文字列への変換から導かれる言語モデルのためのフレームワークを提案する。
本研究では,FSTを用いた言語モデルを構成するアルゴリズムを開発した。
本稿では,正確なアルゴリズム,効率的な近似,理論的解析について述べる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:04:08 GMT)
Timer-S1: A Billion-Scale Time Series Foundation Model with Serial Scaling [51.8] 我々は、Timer-S1、強力なMixture-of-Experts(MoE)時系列基礎モデル、合計8.3Bのパラメータ、各トークンの0.75Bのアクティブパラメータ、コンテキスト長11.5Kについて紹介する。
既存のトレーニング済み時系列基盤モデルのスケーラビリティボトルネックを克服するため,シリアルスケーリングを3次元で実施する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:13:57 GMT)
DepthCharge: A Domain-Agnostic Framework for Measuring Depth-Dependent Knowledge in Large Language Models [51.6] 大きな言語モデルは一般的な質問に答えるときに有能に見えるが、ドメイン固有の詳細にプッシュされると失敗することが多い。
3つのイノベーションを通じて知識の深さを測定するドメインに依存しないフレームワークであるDepthChargeを紹介します。
モデルが実際に言及している概念に基づいてフォローアップ質問を生成する適応的探索、権威のある情報源からのオンデマンドの事実検証、あらゆる深さのサンプルサイズが一定である生存統計。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:49:11 GMT)
Semantic Communication-Enhanced Split Federated Learning for Vehicular Networks: Architecture, Challenges, and Case Study [50.3] 車両エッジインテリジェンス(VEI)は、将来のインテリジェントトランスポートシステムにとって不可欠である。
動的車両ネットワークにおける従来の集中学習は、通信オーバーヘッドとプライバシーリスクに直面する。
本稿では,意味コミュニケーション強化型分割学習(SC-USFL)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:36:49 GMT)
On Multi-Step Theorem Prediction via Non-Parametric Structural Priors [50.2] 本研究では,インコンテキスト学習(ICL)のレンズによる学習自由な定理予測について検討する。
本稿では,過去の解の時間的依存関係を有向グラフとしてエンコードし,推論中に探索空間を効果的に引き起こす明示的なトポロジ的制約を課すTheorem Precedence Graphsを提案する。
FormalGeo7kベンチマークの実験から,本手法は89.29%の精度を実現し,ICLベースラインを著しく上回り,最先端の教師付きモデルに適合することがわかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:08:50 GMT)
Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation [49.4] Mixture-of-Experts (MoE) は、モデルのキャパシティをトーケン毎の計算から切り離す。
MoEの一般化は、新しいスケーリングディメンションであるVirtual Widthを導入している。
MoEは継続的にMoEベースラインに匹敵する性能を1.3%まで上回っている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:07:45 GMT)
RepoLaunch: Automating Build&Test Pipeline of Code Repositories on ANY Language and ANY Platform [49.4] RepoLaunchは、依存関係を自動的に解決し、ソースコードをコンパイルし、任意のプログラミング言語やオペレーティングシステムにわたるリポジトリのテスト結果を抽出できる最初のエージェントである。
RepoLaunchは残りのステップを自動化し、スケーラブルなベンチマークとコーディングエージェントとLLMのトレーニングを可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:15:13 GMT)
BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning [49.3] BandPOは、信頼領域を動的で確率対応のクリッピング間隔に投影する統一理論演算子であるBandに取って代わる。
BandPOはカノニカルクリッピングやClip-Higherより一貫して優れ,エントロピー崩壊の軽減が図られている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:03:05 GMT)
Breaking Contextual Inertia: Reinforcement Learning with Single-Turn Anchors for Stable Multi-Turn Interaction [49.0] textbfReinforcement textbfLearning with textbfTurn textbfRLSTA。
実験の結果,RTSTAは標準微調整法や禁忌法よりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:04:59 GMT)
Physically Accurate Differentiable Inverse Rendering for Radio Frequency Digital Twin [48.5] デジタル双生児(仮想シミュレートされた物理シーンのレプリカ)は、業界全体でシステムデザインを変えつつある。
RFDTは物理的に接地されたエッジ回折遷移関数で不連続を解消する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:59:15 GMT)
Ensembling Language Models with Sequential Monte Carlo [48.1] 我々は、$K$の言語モデルを$f$のアンサンブル分布に構成するための統一的なフレームワークを導入する。
より優れた後部近似により、より優れたアンサンブル性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:54:31 GMT)
Privacy-Aware Camera 2.0 Technical Report [48.1] 物理脱感化、暗号化、難読化など、既存のプライバシー保護アプローチは、セマンティック理解を損なうことが多い。
本稿では,AI Flowパラダイムと協調エッジクラウドアーキテクチャに基づく,新たなプライバシ保護認知フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:46:20 GMT)
RoboPocket: Improve Robot Policies Instantly with Your Phone [47.9] 模倣学習のスケーリングは、データ収集の効率によって制限される。
本稿では,ロボットフリーのインスタントポリシーを実現するポータブルシステムであるRoboPocketを紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:59:38 GMT)
Tool-Genesis: A Task-Driven Tool Creation Benchmark for Self-Evolving Language Agent [45.5] Tool-Genesisは、複数の次元にわたるエージェント能力の定量化のために設計された診断ベンチマークである。
最先端モデルでさえ、ワンショット設定で正確なツールインターフェースや実行可能なロジックを生成するのに苦労しています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:44:29 GMT)
DMD-augmented Unpaired Neural Schrödinger Bridge for Ultra-Low Field MRI Enhancement [45.0] ペア64mT - 3 Tスキャンは少ないため、未ペア64mT$rightarrow$3T翻訳フレームワークを提案する。
提案手法は,多段改良によるUnpaired Neural Schrdinge Bridge (UNSB) 上に構築する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:07:26 GMT)
FaceCam: Portrait Video Camera Control via Scale-Aware Conditioning [45.0] 我々は、モノクロ人間の肖像画映像入力のための、カスタマイズ可能なカメラトラジェクトリの下でビデオを生成するシステムFaceCamを紹介する。
Ava-256データセットとさまざまなインザワイルドビデオの実験は、FaceCamがカメラの制御性、視覚的品質、アイデンティティ、動きの保存性において優れたパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:59:58 GMT)
RelaxFlow: Text-Driven Amodal 3D Generation [44.6] 我々はテキスト駆動のアモーダル3D生成を形式化し、テキストは入力観察を厳格に保ちながら未確認領域の完成を促す。
RelaxFlowは、マルチプライア・コンセンサス・モジュールと緩和機構を介して粒度を分離する、トレーニング不要のデュアルブランチ・フレームワークである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:45:47 GMT)
Small Changes, Big Impact: Demographic Bias in LLM-Based Hiring Through Subtle Sociocultural Markers in Anonymised Resumes [44.4] シンガポールにおける公正雇用のための総合的なストレステストフレームワークを紹介する。
100の履歴書は4つの民族と2つの性別にまたがる4100の変種に拡張されている。
以上より,匿名化を継続する無害なマーカーが,自動採用の成果を著しく損なう可能性が示唆された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:58:07 GMT)
An Approach to Simultaneous Acquisition of Real-Time MRI Video, EEG, and Surface EMG for Articulatory, Brain, and Muscle Activity During Speech Production [44.0] リアルタイム(動的)MRI,脳波,表面筋電図の同時取得を初めて行った。
この獲得パラダイムはMRIによる電磁波干渉や筋原性アーティファクトなど、重要な技術的課題を提示している。
ひとたび完全に開発されると、このフレームワークは、音声神経科学と脳とコンピュータのインターフェースの進歩につながる洞察に、前例のない窓口を提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:46:30 GMT)
AutothinkRAG: Complexity-Aware Control of Retrieval-Augmented Reasoning for Image-Text Interaction [43.9] 複数のモデルの機能を相乗化することにより,複雑な文書の理解を深めるフレームワークを提案する。
具体的には、クエリの難易度の分析に基づいて、推論経路を割り当てるクエリ複雑度ルータを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:29:33 GMT)
Advantage of flexible catalysis for entanglement and quantum thermodynamics [43.7] 触媒が状態のサイクルを通じて進化するフレキシブルの力について検討し, 有限ステップ後にのみ初期構成を復元する。
フレキシブルな動作は、設定でも標準操作よりも優れていることを証明しています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:14:30 GMT)
UFO-4D: Unposed Feedforward 4D Reconstruction from Two Images [43.5] UFO-4Dは、一対の未提示画像から高密度で明示的な4D表現を再構成するための統合フィードフォワードフレームワークである。
UFO-4Dはダイナミックな3Dガウシアンを直接推定し、3D幾何学、3Dモーション、カメラのポーズのジョイントで一貫した推定を可能にする。
我々の表現はまた、新しいビューや時間にわたって高忠実な4D合成を可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:12:06 GMT)
Federated Modality-specific Encoders and Partially Personalized Fusion Decoder for Multimodal Brain Tumor Segmentation [42.7] 本研究は,共振モード特異的エンコーダと部分パーソナライズされたマルチモーダルフュージョンデコーダを備えた新しいFLフレームワークを提案する。
FedMEPDは、BraTS 2018と2020のマルチモーダル脳腫瘍セグメンテーションベンチマークで検証されている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:25:58 GMT)
Extending spin-lattice relaxation theory to three-phonon processes [42.0] スピン緩和に対する3フォノンの寄与は、この分子の実験に到達できない温度でのみ関係する。
スピンフォノンカップリングの相対的な増加は, 室温での3-と2-フォノンプロセスの効率の交差に繋がることを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:23:45 GMT)
CT-Enabled Patient-Specific Simulation and Contact-Aware Robotic Planning for Cochlear Implantation [41.4] ロボットの人工内耳挿入は、人工内耳の外傷を最小限に抑えるために、接触力の正確な予測と調節を必要とする。
本稿では,接触型挿入計画と検証のためのCT-to-simulationパイプラインについて述べる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:13:59 GMT)
Med-V1: Small Language Models for Zero-shot and Scalable Biomedical Evidence Attribution [41.4] 我々は、30億のパラメータしか持たない小さな言語モデルのファミリーであるMed-V1を紹介する。
本研究で新たに開発された高品質な合成データを用いてMed-V1を訓練する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:48:43 GMT)
U-Parking: Distributed UWB-Assisted Autonomous Parking System with Robust Localization and Intelligent Planning [41.3] このデモでは、UWB(Ultra-Wideband)を利用した自律駐車システムであるU-Parkingを紹介した。
大規模言語モデル (LLMs) を統合して, 堅牢な核融合局所化と軌道追跡を計画することで, 挑戦的な屋内環境において, 信頼性の高い自動駐車を可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:38:51 GMT)
RADAR: Learning to Route with Asymmetry-aware DistAnce Representations [40.9] 最近のニューラルソルバは、車両ルーティング問題(VRP)において高い性能を達成している
RADARは、既存のニューラルネットワークVRPソルバを非対称入力を処理する能力で強化するスケーラブルなニューラルネットワークフレームワークである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:09:05 GMT)
ROSER: Few-Shot Robotic Sequence Retrieval for Scalable Robot Learning [40.5] ロボット学習における重要なボトルネックは、タスクラベル付きセグメント化されたトレーニングデータの不足である。
時間ウィンドウ上でタスクに依存しない距離空間を学習する軽量な数ショット検索フレームワークであるROSERを紹介する。
我々の実験では、ROSERは精度と効率の両面で全ての先行手法を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:48:26 GMT)
VinePT-Map: Pole-Trunk Semantic Mapping for Resilient Autonomous Robotics in Vineyards [40.5] 本稿ではVinePT-Mapについて紹介する。Vineトランクとサポートポールを永続的な構造的ランドマークとして活用するセマンティックマッピングフレームワークである。
提案手法は,GPS,IMU,RGB-D観測を頑健な幾何学的制約により統合し,因子グラフとしてマッピング問題を定式化する。
インスタンスのセグメンテーションと追跡に基づく効率的な知覚パイプラインと、外乱の拒絶と修正のポーズのためのクラスタリングフィルタを組み合わせることで、正確なランドマーク検出を可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:39:12 GMT)
STRUCTUREDAGENT: Planning with AND/OR Trees for Long-Horizon Web Tasks [40.1] StructureDAGENTは2つのコアコンポーネントを備えた階層的な計画フレームワークである。
解釈可能な階層的な計画を生成し、デバッグを容易にし、必要な時に人間の介入を容易にする。
WebVoyager, WebArena, およびカスタムショッピングベンチマークの結果、StructureDAGENTは、標準のLLMエージェントと比較して、長時間のWebブラウジングタスクのパフォーマンスを向上させることが示された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:37:06 GMT)
VRM: Teaching Reward Models to Understand Authentic Human Preferences [39.9] 変分回帰モデリングは、人間の嗜好判断の評価過程を明示的にモデル化する新しいフレームワークである。
以上の結果から,VRMは人間の嗜好を捉える上で,既存の手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:12:39 GMT)
Dr. Seg: Revisiting GRPO Training for Visual Large Language Models through Perception-Oriented Design [39.9] 本稿では,Look-to-Confirm 機構と Distribution-Ranked Reward モジュールで構成されるシンプルな GRPO ベースのフレームワークである Dr.Seg を提案する。
実験によると、Dr.Segは強力な一般化を維持しながら、複雑な視覚シナリオのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:40:26 GMT)
ORMOT: A Dataset and Framework for Omnidirectional Referring Multi-Object Tracking [39.6] マルチオブジェクト追跡(MOT)は、コンピュータビジョンにおける基本的なタスクであり、ビデオフレーム間でターゲットを追跡することを目的としている。
我々は、RMOTを全方位画像に拡張するORMOT(Omnidirectional Referring Multi-Object Tracking)を提案する。
ORSetはOmnidirectional Referring Multi-Object Trackingデータセットで、27の多様な全方位シーン、848の言語記述、3,401の注釈付きオブジェクトを含む。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:15:01 GMT)
TEMPO-VINE: A Multi-Temporal Sensor Fusion Dataset for Localization and Mapping in Vineyards [39.4] TEMPO-VINEは、異種LiDAR、AHRS、RTK-GPS、および実際のトレリスとパーゴラのブドウ畑のカメラからデータを収集する、最初のマルチモーダルなパブリックデータセットである。
複数のランとリビジョンを持つシーケンスパスは、センサフュージョン、ローカライゼーション、マッピング、農業分野の場所認識ソリューションの開発を促進する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:23:32 GMT)
Achieving Thresholds via Standalone Belief Propagation on Surface Codes [39.3] 本稿では,デコードグラフ上でメッセージを交換し,スタンドアロンのBPを介してコードキャパシティ閾値を取得する新しいBPデコーダを提案する。
我々のアプローチは、最小ウェイト完全マッチング(MWPM)デコーダと同様に、グラフのようなQEC符号に適用できる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:11:48 GMT)
Can LLMs Capture Expert Uncertainty? A Comparative Analysis of Value Alignment in Ethnographic Qualitative Research [39.1] 長大な言語モデル(LLM)を,長大な面接で表される3つの人的価値を識別するタスクで評価する。
それらのアウトプットを専門家のアノテーションと比較し、専門家に対するパフォーマンスパターンと不確実性パターンの両方を分析します。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:38:37 GMT)
Generalized matching decoders for 2D topological translationally-invariant codes [39.1] 2次元トポロジカル変換不変量子符号は、フォールトトレラント量子計算の有望な候補である。
汎用TTI符号の復号化のためのグラフマッチング手法を開発した。
我々は、デコーダがコード距離の一定割合まで重みの誤差を補正し、非ゼロのコード容量閾値を達成することを証明した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:29:09 GMT)
Parsimonious Quantum Low-Density Parity-Check Code Surgery [38.9] 本稿では、任意の論理演算子重みを測定するために、キュービットサイズ$O(W log W)$のアンシラシステムを構築する方法を提案する。
この新たな構造は、様々な量子コード手術スキームのオーバーヘッドを即座に削減する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:52:57 GMT)
Design, Mapping, and Contact Anticipation with 3D-printed Whole-Body Tactile and Proximity Sensors [38.8] GenTact-Proxは完全に3Dプリントされた人工皮膚で、触覚と近接センサーを統合して接触検出と予測を行う。
皮膚は評価中に最大18cmまで検出された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:29:30 GMT)
MOOSEnger -- a Domain-Specific AI Agent for the MOOSE Ecosystem [38.6] MOOSEngerはMultiphysics Object-Oriented Simulation Environment(MOOSE)に合わせたツール対応AIエージェントである。
自然言語インテントを実行可能インプットに変換し、キュレートされたドキュメント/例に対する検索拡張生成と決定論的、MOOSE対応のパース、バリデーション、実行ツールを組み合わせる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:06:06 GMT)
Hate Speech Detection using Large Language Models with Data Augmentation and Feature Enhancement [38.0] 本稿では,ヘイトスピーチ検出のためのデータ拡張と特徴強調手法について述べる。
SMOTE, 逆クラス比率による重み付き損失, POSタグ付け, およびテキストデータ拡張がモデル性能に与える影響について検討した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 00:46:11 GMT)
TAPFormer: Robust Arbitrary Point Tracking via Transient Asynchronous Fusion of Frames and Events [37.3] 我々は,フレームとイベントの時間一貫性のある非同期融合を行うフレームワークであるTAPFormerを紹介した。
鍵となる革新は、離散フレーム間の時間的進化を明示的にモデル化する過渡的非同期融合機構である。
提案手法は既存のポイントトラッカーよりも優れており,しきい値内の平均画素誤差が28.2%向上している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:32:24 GMT)
Uniform process tensor approach for the calculation of multi-time correlation functions of non-Markovian open systems [36.9] プロセステンソルの時間変換不変MPO表現を用いて,多次元スペクトルの数値スケーリングを大幅に改善できることを示す。
実例システムの線形および2次元電子スペクトルを計算し,シミュレーションの性能と数値スケーリングについて考察する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:07:37 GMT)
Security bounds for unidimensional discrete-modulated CV-QKD: a Gaussian extremality approach [36.9] 1次元離散変調量子鍵分布プロトコルのセキュリティ境界を決定する。
ガウスの超越性仮定は、イヴの情報をシステマティックに過大評価し、星座のサイズが大きくなることを示す。
本研究は,このプロトコルに対して,代替手法や最適化された非変調星座設計の必要性を強調した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:45:55 GMT)
MADCrowner: Margin Aware Dental Crown Design with Template Deformation and Refinement [36.8] 全フレームワークは CrownDeformR と CrownSegger で構成されている。
CrownDeformRは、マルチスケールの口腔内スキャンエンコーダによって抽出される解剖学的コンテキストに基づいて、初期テンプレートをターゲットクラウンに変形する。
マージンセグ 新規のマージン・セグメンテーション・ネットワーク ターゲット歯の頚部マージンを抽出する
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:42:57 GMT)
Evaluating GPT-5 as a Multimodal Clinical Reasoner: A Landscape Commentary [36.7] この注釈書は、GPT-5ファミリー(GPT-5, GPT-5 Mini, GPT-5 Nano)の最初の制御された横断的な評価である。
GPT-5は、MedXpertQAの25ポイントを超える絶対的な改善により、専門家レベルのテキスト推論において著しく向上した。
マルチモーダル合成を課題とする場合、GPT-5はこの強化された推論能力を有効活用し、具体的な画像証拠に不確実な臨床物語を根拠とした。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:24:48 GMT)
Deep Learning-Driven Friendly Jamming for Secure Multicarrier ISAC Under Channel Uncertainty [36.1] 統合センシング通信(ISAC)システムは、レーダセンシングと無線通信を共同で支援することで、効率的なスペクトル利用を約束する。
本稿では,不完全なチャネル状態情報(CSI)と未知のeavesdropper(Eve)位置の存在下で,マルチキャリアISACシステムにおける物理層セキュリティを強化するためのディープラーニング駆動フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:20:27 GMT)
In-situ Characterization of Light-Matter Coupling in Multimode Circuit-QED Systems [35.4] マルチモードキャビティ-QEDシステムは、幅広い物理現象を探索するために利用することができる。
本稿では,原子および合成空洞QEDシステムに適用可能な一般的な測定プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:00:00 GMT)
Recursive Inference Machines for Neural Reasoning [35.3] Tiny Recursive Models (TRM) は、神経バックボーンと特殊な推論スキームを組み合わせることで複雑な問題を解決する。
本稿では,古典推論エンジンにインスパイアされた推論機構を明示的に組み込んだニューラルネットワーク推論フレームワークであるRIM(Recursive Inference Machines)を紹介する。
RIM が RIM のインスタンスとして表現可能であることを示し、それを再重み付けコンポーネントによって拡張することで、挑戦的な推論ベンチマークのパフォーマンスが向上することを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:51:47 GMT)
GloSplat: Joint Pose-Appearance Optimization for Faster and More Accurate 3D Reconstruction [35.3] 本稿では,GloSplatについて述べる。GloSplatは3次元ガウス平滑化訓練において,アンフィジョイントなポーズ-外観最適化を行うフレームワークである。
従来の共同最適化手法とは異なり、GloSplatは訓練中、Emphexplicit SfM機能トラックを第一級エンティティとして保存する。
実験により、GloSplat-FはCOLMAPフリーメソッドの最先端を実現し、GloSplat-AはCOLMAPベースラインをすべて越えていることが示された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:02:50 GMT)
Computing Green's functions and improving ground state energy estimation on quantum computers with Liouvillian recursion [35.2] 量子コンピュータを用いて多体グリーン関数を演算するLiouvillian再帰法の量子古典ハイブリッド実装を提案する。
近似基底状態準備回路から、このアルゴリズムは局所(r=r'$)とサイト間(rneq r'$)グリーン関数を生成する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:28:48 GMT)
Latent Policy Steering through One-Step Flow Policies [34.1] オフライン強化学習(RL)により、ロボットはリスクを伴わないオフラインデータセットから学習することができる。
遅延ポリシーステアリング(LPS)は、一段階のMeanFlowポリシを通じて、原アクション空間のQ段階をバックプロパゲートすることで、高忠実な遅延ポリシーの改善を可能にする。
OGBenchと現実世界のロボットタスク全体で、LPSは最先端のパフォーマンスを達成し、行動的クローン化と強力な潜在的ステアリングベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:38:08 GMT)
Why Are Linear RNNs More Parallelizable? [34.0] LRNNを対数深度演算回路とみなすことができ、これは変圧器が認める対数深度回路と比較してわずかに深さのオーバーヘッドしか表さないことを示す。
直交対角LRNNは$mathsfNC1$-completeであるのに対し、対角+低ランクLRNNはより表現力が高い。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:58:29 GMT)
Diffusion Probe: Generated Image Result Prediction Using CNN Probes [34.0] テキスト・ツー・イメージ(T2I)拡散モデルには、早期品質評価のための効率的なメカニズムが欠けている。
Diffusion Probeは、内部横断マップを予測信号として利用するフレームワークである。
拡散プローブはモデルに依存しない、効率的で、広く適用でき、T2I生成効率を改善するための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:16:26 GMT)
FedAFD: Multimodal Federated Learning via Adversarial Fusion and Distillation [32.7] MFL(Multimodal Federated Learning)は、異種データモダリティを持つクライアントが、生データを共有せずにモデルを協調的にトレーニングすることを可能にする。
我々はクライアントとサーバの学習を強化する統合MFLフレームワークであるFedAFDを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:30:51 GMT)
The Spike, the Sparse and the Sink: Anatomy of Massive Activations and Attention Sinks [32.6] トランスフォーマー言語モデルにおける2つの繰り返し現象について検討する。
少数のトークンがいくつかのチャネルで極端な外れ値を示し、注意が沈み込み、特定のトークンが意味的関連性に関係なく不均等な注意質量を引き付けるような大規模なアクティベーション。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:59:04 GMT)
AgentSCOPE: Evaluating Contextual Privacy Across Agentic Workflows [32.4] エージェントパイプラインのすべての境界は、潜在的なプライバシー侵害の場所であり、独立して評価されなければならない、と我々は主張する。
本稿では,エージェント実行を情報フローのシーケンスに分解するフレームワークであるPrivacy Flow Graphを紹介する。
AgentSCOPEは,8つの規制領域にまたがる62のマルチツールシナリオのベンチマークであり,パイプラインの各段階で基礎的真理を示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:45:31 GMT)
Rethinking Representativeness and Diversity in Dynamic Data Selection [32.4] 動的データ選択は、精度を維持しながらデータセットの変動するサブセットをサンプリングすることで、トレーニングを加速する。
サンプル評価の基礎となる2つの基本概念、代表性と多様性を再考する。
本手法は2倍以上のトレーニングアクセラレーションと完全データ精度を一致または超える。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:21:58 GMT)
Feature Resemblance: On the Theoretical Understanding of Analogical Reasoning in Transformers [32.0] 我々は、類推的推論(既知の類似性に基づくエンティティ間の共有特性の推論)を分離し、トランスフォーマーにおけるその出現を分析する。
類似性と帰属前提に関する共同トレーニングは、整列表現による類似推論を可能にする。
1.5Bパラメータまでのアーキテクチャによる実験は、我々の理論を検証し、表現幾何学が帰納的推論能力をどのように形作るかを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:12:46 GMT)
How far have we gone in Generative Image Restoration? A study on its capability, limitations and evaluation practices [31.8] 生成的画像復元(GIR)は印象的な知覚的リアリズムを達成したが、その実用能力はこれまでの方法と比べてどこまで進歩しているのだろうか?
本稿では,モデルの詳細,シャープさ,意味的正確性,全体的な品質を評価できる多次元評価パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:57:45 GMT)
RealWonder: Real-Time Physical Action-Conditioned Video Generation [31.7] 本稿では,1枚の画像からアクション条件付き映像をリアルタイムに生成するシステムであるRealWonderについて述べる。
RealWonderは、単一画像からの3D再構成、物理シミュレーション、および4つの拡散ステップしか必要としない蒸留ビデオ生成装置を統合している。
本システムは480x832解像度で13.2FPSを実現し,剛体物体の力,ロボット動作,カメラ制御の対話的探索を可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:22:54 GMT)
Making Reconstruction FID Predictive of Diffusion Generation FID [31.6] VAEの再構成FID(rFID)は,潜伏拡散モデルの生成FID(gFID)と相関が低い。
本稿では,gFIDと強い相関を示すrFIDの単純な変種であるinterpolated FID (iFID)を提案する。
iFIDは拡散gFIDと強い相関を示す最初の指標であり、ピアソン線形およびスピアマンランクの相関はおよそ0.85である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:39:01 GMT)
VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory [31.5] VPWEMは、ワーキングメモリとエピソードメモリを備えた非マルコフヴィジュモータ政策である。
動作生成には短期情報とエピソードワイド情報の両方を使用し、1ステップあたりのメモリと計算がほぼ一定である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:52:50 GMT)
When Rubrics Fail: Error Enumeration as Reward in Reference-Free RL Post-Training for Virtual Try-On [31.4] 参照不要な設定を埋めるために、Implicit Error Countingを提案する。
IECは、キャリブレーションされたルーリックに対して何が正しいかをチェックせずに、何が間違っているかを列挙します。
ネーブ明示列挙法は安定な最適化には難しすぎることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:20:04 GMT)
FuseDiff: Symmetry-Preserving Joint Diffusion for Dual-Target Structure-Based Drug Design [31.3] FuseDiffは、リガンド分子グラフと両ポケットに条件付き2つのポケット特異的結合ポーズを共同生成するエンドツーエンド拡散モデルである。
ベンチマークと実世界のデュアルターゲットシステムの実験は、FuseDiffが最先端のドッキング性能を達成することを示している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:22:59 GMT)
Reclaiming Lost Text Layers for Source-Free Cross-Domain Few-Shot Learning [30.8] Source-Free Cross-Domain Few-Shot Learningは、ターゲットドメインからの限られたトレーニングデータによる微調整に焦点を当てている。
テキストエンコーダの中間層を削除したtextbfremov は、性能を効果的に向上させることができる。
本稿では,失われた層内の情報を層レベルとエンコーダレベルの両方でテクスブフレで活用する手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:51:52 GMT)
Machine Learning for analysis of Multiple Sclerosis cross-tissue bulk and single-cell transcriptomics data [30.4] 末梢血単核球および脳脊髄液からの転写データを解析するエンド・ツー・エンド機械学習パイプラインを開発した。
免疫活性,非カノニカル免疫チェックポイント,リボソームおよび翻訳プログラム,ユビキチンプロテアソーム調節,脂質輸送,Epstein-Barrウイルス関連経路を同定した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:09:12 GMT)
Measuring the Redundancy of Decoder Layers in SpeechLLMs [29.5] 音声大言語モデル 音声エンコーダ表現をLLMデコーダにルーティングする。
我々は,デコーダの冗長性は,予め訓練されたLLMから大きく継承されていることを示す。
次に、同じレイヤーブロックが、音声エンコーダ、タスク、言語間で冗長であることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:50:24 GMT)
Robust Single-message Shuffle Differential Privacy Protocol for Accurate Distribution Estimation [29.2] シュッフルDPフレームワークである純粋シャッフルモデルに基づく分散推定について,強いセキュリティ仮定を伴わずに検討した。
本稿では, 単一メッセージ型テキストタダプティブ・シャフラー・プロトコル(ASP)を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:40:26 GMT)
LBM: Hierarchical Large Auto-Bidding Model via Reasoning and Acting [29.0] 大規模言語モデル(LLM)は、先行する人間の知識と推論能力を活用して、自動入札のパフォーマンスを向上させることで、有望なソリューションを提供する。
本稿では,LLMの推論能力を活かした階層型大規模自動入札モデル(LBM)を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:01:21 GMT)
When Priors Backfire: On the Vulnerability of Unlearnable Examples to Pretraining [28.7] Unlearnable Examples (UEs) は、データ保護戦略として機能し、誤解を招くモデルに対して知覚できない摂動を発生させ、基礎となる意味論ではなく素早い相関を学習する。
本稿では,事前学習モデルから学習を開始すると現れるUEの基本的脆弱性を明らかにする。
本稿では,新しい二段階最適化法であるBAIT(Binding Artificial perturbations to Incorrect Targets)を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:10:40 GMT)
AdaIAT: Adaptively Increasing Attention to Generated Text to Alleviate Hallucinations in LVLM [28.7] 本稿では,反復的な記述を避けつつ,幻覚を和らげるためのIAT(Attention to Generated Text)を提案する。
AdaIATは、各アテンションヘッドの特性に合わせて、干渉時間と微細な増幅等級を制御するために、レイヤワイズしきい値を用いる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:52:11 GMT)
AutoSkill: Experience-Driven Lifelong Learning via Skill Self-Evolution [28.7] AutoSkillはエクスペリエンス駆動の生涯学習フレームワークで、LLMエージェントが対話やインタラクショントレースからスキルを自動で引き出し、維持し、再利用することができる。
既存のLLMと互換性があり、エージェント、ユーザ、タスク間での共有と転送のための標準化されたスキル表現を導入している。
本稿では,AutoSkillのモチベーション,アーキテクチャ,実装について述べるとともに,メモリ,検索,パーソナライゼーション,エージェントシステムに関する先行研究について述べる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:24:40 GMT)
Decay Rates in Interleaved Benchmarking with Single-Qubit References [28.4] シングルキュービット参照シーケンスを持つクロスエントロピーベンチマーク(XEB)は、大規模量子プロセッサにおけるマルチキュービットゲートの特徴付けに広く用いられている。
本手法の根底にある付加的な単一量子ビット誤差近似が故障し,ゲート忠実度を体系的に過大評価することを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:43:30 GMT)
Evaluating the Search Agent in a Parallel World [28.2] 並列世界における検索エージェント評価フレームワークであるMind-ParaWorldを紹介する。
パラワールド・ロー・モデル(ParaWorld Law Model)は、不可分なアトミック・ファクトの集合と、各質問に対する独特な基礎構造を構築する。
評価中、現実世界の結果を取得する代わりに、エージェントはパラワールドモデルと対話する。
MPW-Benchは19のドメインと1,608のインスタンスにまたがる対話型ベンチマークです。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:56:42 GMT)
Bounded State in an Infinite Horizon: Proactive Hierarchical Memory for Ad-Hoc Recall over Streaming Dialogues [27.7] textbfProStreamは,ストリーム対話のためのアクティブな階層型メモリフレームワークである。
マルチグラニュラー蒸留による連続ストリームを推論することで、オンデマンドでのアドホックメモリリコールを可能にする。
実験によると、ProStreamは精度と効率の両方でベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:25:25 GMT)
Osmosis Distillation: Model Hijacking with the Fewest Samples [27.7] データセット蒸留法によって生成された合成データセットを用いたトランスファーラーニングにおいて、非無視のセキュリティ脅威が発見されていない。
最少サンプルを用いたディープラーニングモデルをターゲットにした新しいモデルハイジャック戦略であるOsmosis Distillation (OD) 攻撃を提案する。
我々は、伝達学習にサードパーティの合成データセットを使用することの意識を高める必要があると論じている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:34:06 GMT)
How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression? [27.5] 本稿では,高次元のランダムな特徴に対する2乗損失を伴う浅部ReLUモデルのトレーニングにおいて,勾配降下(GD)の暗黙バイアスを特徴付ける。
この2つの極性の間に補間を行い、十分に高次元のランダムなデータに対して、暗黙の偏差は高い確率で最小l2-ノルム解に近似することを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:36:07 GMT)
Thinking with Spatial Code for Physical-World Video Reasoning [27.4] 空間コードによる思考は、RGB動画を明示的で時間的に整合した3D表現に変換するフレームワークである。
提案する空間エンコーダは,映像を3次元有界ボックスとセマンティックラベルで構造化された空間コードに解析できるという経験的発見を強調した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:00:02 GMT)
WavSLM: Single-Stream Speech Language Modeling via WavLM Distillation [27.3] WavSLMは、自己組織化されたWavLM表現を1つのコードブックに量子化し、蒸留することで訓練された言語モデルである。
パラメータが少なく、トレーニングデータが少なく、ストリーミング推論をサポートしながら、一貫性ベンチマークと音声生成の競合的なパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:39:54 GMT)
Improved Scaling Laws via Weak-to-Strong Generalization in Random Feature Ridge Regression [27.0] スケーリング法則に影響を及ぼし,その後にテストエラーが発生するという意味で,潜在的な改善は極めて重要であることを示す。
厳密には、生徒は教師のスケーリング法則によらず、最小限の最適率を達成することができる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:32:59 GMT)
Implicit Bias and Loss of Plasticity in Matrix Completion: Depth Promotes Low-Rankness [26.9] より深いネットワークで観測される暗黙の低ランクバイアスの背後にある重要なメカニズムとして結合力学を同定する。
深部モデルでは,低ランクバイアスによる可塑性損失が回避されているのに対し,分離された動的条件下で事前訓練された深部2ネットワークは,再開した訓練でも低ランクに収束しないことを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 00:54:19 GMT)
Real Money, Fake Models: Deceptive Model Claims in Shadow APIs [26.9] サードパーティサービスは、間接アクセスによる地域制限なしに、公式のモデルサービスへのアクセスを提供すると主張している。
広く使われているにもかかわらず、シャドウAPIが公式APIと一貫性のあるアウトプットを提供するかどうかは不明だ。
これらのプラクティスは、科学的研究の妥当性を損なうとともに、シャドウAPI利用者の利益を損なうとともに、公式なモデル提供者の評判を損なう。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 00:42:02 GMT)
RACAS: Controlling Diverse Robots With a Single Agentic System [26.7] RACAS(Robot-Agnostic Control via Agentic Systems)は、3つのモジュールが自然言語でのみ通信してクローズドループロボット制御を実現する協調型エージェントアーキテクチャである。
RACASは、ロボットの自然言語記述、利用可能なアクションの定義、タスク仕様のみを必要とする。
我々は、車輪付き地上ロボット、最近発表された新しい多関節ロボットアーム、水中車両を用いて、複数のタスクにおけるRACASを評価した。RACASは、これらの過激な異なるプラットフォームをまたいだ全てのタスクを一貫して解決し、その可能性を実証している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:25:01 GMT)
Beyond the Patch: Exploring Vulnerabilities of Visuomotor Policies via Viewpoint-Consistent 3D Adversarial Object [26.2] 本研究は,3次元オブジェクトに対する視点整合型テクスチャ最適化手法を提案する。
最適化戦略として、我々はC2F(Coarse-to-Fine)カリキュラムによる変換への期待(EOT)を採用している。
さらに、サリエンシ誘導による摂動を統合して、政策の注意をリダイレクトし、ロボットを敵の物体に向けて継続的に駆動する目標損失を設計する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:57:47 GMT)
Think, Then Verify: A Hypothesis-Verification Multi-Agent Framework for Long Video Understanding [25.8] VideoHV-Agentは、構造化仮説検証プロセスとしてビデオ質問応答を再構成するフレームワークである。
ビデオHV-Agentは,解釈性の向上,論理的音質の向上,計算コストの低減を実現し,最先端の精度を実現する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:16:07 GMT)
Curve-Induced Dynamical Systems on Riemannian Manifolds and Lie Groups [25.5] 本稿では,Smooth Manifolds (CDSM) 上でCurveによって誘導される動的システムについて紹介する。
トラジェクトリ精度の向上,経路偏差の低減,生成時間とクエリ時間の向上を,最先端手法と比較した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:18:26 GMT)
Progressive Residual Warmup for Language Model Pretraining [25.4] 本稿では,言語モデル事前学習のためのプログレッシブ残留ワームアップ(ProRes)を提案する。
これは、各層の残余を0から1に徐々に温まるスカラーに乗じることで、"初期層が最初に学習する"という哲学を実装している。
このようにして、より深いレイヤは、学習に貢献する前に、初期のレイヤがより安定した状態に落ち着くのを待ちます。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:52:15 GMT)
GCAgent: Enhancing Group Chat Communication through Dialogue Agents System [25.0] GCAgentは、エンターテイメントとユーティリティ指向の対話エージェントとのグループチャットコミュニケーションを強化するための、LLM(Big Language Model)駆動システムである。
このシステムは、Agent Builder、Dialogue Manager、Interface pluginsの3つの密に統合されたモジュールで構成されている。
350日間の実際の展開では、メッセージ量が28.80%増加し、グループ活動とエンゲージメントが大幅に向上した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:55:57 GMT)
GEM-TFL: Bridging Weak and Full Supervision for Forgery Localization through EM-Guided Decomposition and Temporal Refinement [24.9] Temporal Forgery Localizationは、ビデオやオーディオストリーム内で操作されたセグメントを正確に識別することを目的としており、マルチメディアの法医学とセキュリティの解釈可能な証拠を提供する。
しかし、Wakly Supervised TFL (WS-TFL) は、バイナリビデオレベルラベルからのみ学習することでラベリングコストを削減する。
GEM-TFLは,学習と推論の監督のギャップを効果的に埋める2段階の分類回帰フレームワークである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:07:26 GMT)
Thinking with Gaze: Sequential Eye-Tracking as Visual Reasoning Supervision for Medical VLMs [24.5] 視覚言語モデル(VLM)は画像を視覚トークンとして処理するが、その中間的推論はテキストで実行されることが多い。
我々は、視線を監督してVLM推論を導出し、小さな専用の視線トークンを導入する。
これらのトークンは、視線選択された画像パッチのインデックスを時間順に予測し、人間に似た証拠の取得と統合をモデルに促すように訓練されている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:12:49 GMT)
VISA: Value Injection via Shielded Adaptation for Personalized LLM Alignment [24.5] 細調整と大言語モデル(LLM)のトレードオフをナビゲートするクローズドループフレームワークを提案する。
VISAは高精度な値検出器、セマンティック・ツー・バリュー・トランスレータ、コア・バリュー・リライターを備えている。
実験により,本手法は,実際の一貫性と汎用性を保ちながら,モデルの値表現を正確に制御できることが実証された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:12:26 GMT)
Mitigating Instance Entanglement in Instance-Dependent Partial Label Learning [24.5] 部分ラベル学習は、弱い教師付き分類タスクであり、各トレーニングインスタンスに、候補ラベルのセットをあいまいにラベル付けする。
実世界のシナリオでは、候補ラベルは多くの場合、インスタンス機能の影響を受け、インスタンス依存(ID-PLL)の出現につながる。
本稿では,クラス内およびクラス間規制の双方によるインスタンスの絡み合いに対処する,クラス固有の拡張に基づく分散化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:19:12 GMT)
Federated Heterogeneous Language Model Optimization for Hybrid Automatic Speech Recognition [24.4] 本稿では,N-best音声認識リストを再構成する言語モデル(LM)のマッチング・アンド・マージパラダイムを提案する。
実験の結果、RMMAは平均的な文字誤り率とベースラインよりも優れた一般化を実現し、GMMAの最大7倍の速度で収束することがわかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:42:17 GMT)
From Unfamiliar to Familiar: Detecting Pre-training Data via Gradient Deviations in Large Language Models [24.4] 既存の手法は主に微調整前後の確率に基づく統計的特徴や信号に焦点を当てている。
対象サンプルの勾配偏差スコアを探索することにより,事前学習データを識別するGDSを提案する。
GDSは、強いベースライン上でのクロスデータセット転送性を大幅に改善し、最先端の性能を実現している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:21:51 GMT)
WaterSIC: information-theoretically (near) optimal linear layer quantization [24.2] 一般的なGPTQアルゴリズムは、ITの限界に対して任意に大きなギャップがあることが示されている。
WaterSIC'と呼ばれる新しいアルゴリズムが提案され、ITの限界まで0.255ビットのレートギャップ内にあることが示されている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:50:58 GMT)
MedCoRAG: Interpretable Hepatology Diagnosis via Hybrid Evidence Retrieval and Multispecialty Consensus [24.2] 臨床診断のための既存のAIアプローチは、透明性、構造化推論、デプロイ性に欠けることが多い。
標準化された異常所見から診断仮説を生成するエンド・ツー・エンドのフレームワークであるMedCoRAGを提案する。
その後、UMLS知識グラフパスと臨床ガイドラインを共同で検索し、解析することで、患者固有のエビデンスパッケージを構築する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:58:45 GMT)
BiEvLight: Bi-level Learning of Task-Aware Event Refinement for Low-Light Image Enhancement [24.2] イベントカメラは、低照度画像強調(LLIE)を大いに約束する
主な課題は、事象の内在的背景活動(BA)ノイズと画像の低信号-雑音比(SNR)との二重劣化である。
階層的かつタスク対応のフレームワークであるBiEvLightを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:14:10 GMT)
Detecting RAG Advertisements Across Advertising Styles [24.1] 大型言語モデル(LLM)のための広告スタイルの分類法を開発する。
我々は広告主が広告スタイルを変えて検出を回避しようとすることをシミュレートする。
我々は、その堅牢性に関して、様々な広告検出アプローチを評価した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:16:21 GMT)
Scaling Laws for Reranking in Information Retrieval [24.0] 本稿では,リランカーのスケーリング法則に関する最初の体系的研究について述べる。
クロスエンコーダリランカーを用いた詳細なケーススタディを用いて、性能が予測可能なパワー則に従うことを示した。
本研究は,産業グレード検索システム構築のためのスケーリングの原則を確立し,実用的な洞察を提供するものである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:03:07 GMT)
DeformTrace: A Deformable State Space Model with Relay Tokens for Temporal Forgery Localization [23.9] TFL(Temporal Forgery Localization)は、ビデオとオーディオの操作されたセグメントを正確に識別することを目的としており、セキュリティと法医学に強い解釈性を提供する。
最近のステート・スペース・モデル(SSM)は正確な時間的推論において有望であるが、TFLにおけるそれらの使用は曖昧な境界線、希薄な偽造物、限られた長距離モデリングによって妨げられている。
本稿では,これらの課題に対処するため,変形可能な動的機構とリレー機構を備えたSSMを改良したDeformTraceを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:19:50 GMT)
SarcasmMiner: A Dual-Track Post-Training Framework for Robust Audio-Visual Sarcasm Reasoning [23.5] マルチモーダル・サルカズム検出は、テキスト、音響、視覚的手がかり間の実用的不整合を解消する必要がある。
本稿では,マルチモーダル推論における幻覚に抵抗する強化学習に基づくポストトレーニングフレームワークであるSarcasmMinerを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:22:39 GMT)
CARE: A Molecular-Guided Foundation Model with Adaptive Region Modeling for Whole Slide Image Analysis [23.5] 本稿では, 画像全体を形態学的に関連のある領域に自動的に分割する病理基盤モデルであるCross-Modal Adaptive Region (CARE)を提案する。
通常主流の基盤モデルで使用される事前トレーニングデータのわずか10分の1に基づいて、CAREは33のダウンストリームベンチマークでより優れた平均性能を達成する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:47:19 GMT)
SPIRIT: Perceptive Shared Autonomy for Robust Robotic Manipulation under Deep Learning Uncertainty [23.4] 深層学習(DL)は、ロボット知覚の目覚ましい進歩を実現しているが、その頑丈さと解釈可能性の欠如により、安全クリティカルなアプリケーションへの信頼性の高い展開を妨げている。
本稿では,DLに基づく認識からの不確かさを推定し,自律性のレベルを規定する「知覚共有自律性」という概念を提案する。
本研究は,15人の参加者による航空操作課題に対する認識的共有自律性の評価であり,DLに基づく認識の失敗にも拘わらず,信頼性の高いロボット操作を実証し,モックアップ産業シナリオの実現に寄与する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:29:57 GMT)
InfoFlow KV: Information-Flow-Aware KV Recomputation for Long Context [23.4] クエリからの単純な注意ノルム信号は、意味的に関連があり、情報を伝達するために構造的に位置付けられたトークンを確実に識別する。
LLMおよびVLMベンチマークの実験は、同等の効率予算の下で、以前の手法よりも一貫した利得を示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:33:20 GMT)
MPCEval: A Benchmark for Multi-Party Conversation Generation [23.2] マルチパーティ会話生成のためのタスク認識評価およびベンチマークスイートであるMPCEvalを紹介する。
MPCEvalは生成品質を、話者モデリング、コンテンツ品質、話者一貫性に分解する。
我々は,MPCEvalを多種多様な公開および実世界のデータセットに適用し,人間による会話と並行して現代的な生成手法を評価する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:07:00 GMT)
Any to Full: Prompting Depth Anything for Depth Completion in One Stage [23.1] 既存のRGBDフューズド・ディープ・コンプリート法は、トレーニングRGB分布と特定のディープ・パターンを併用した事前条件を学習する。
近年の取り組みでは、単分子深度推定モデルを活用して、領域一般幾何学的前提を導入する。
本稿では,1段階,ドメイン一般,パターンに依存しないフレームワークであるAny2Fullについて述べる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:08:40 GMT)
On-Policy Self-Distillation for Reasoning Compression [23.0] OPSDCはモデルに、自身の簡潔な振る舞いを自分自身に蒸留することで、より簡潔に推論するように教える。
根底からの答えも、トークンの予算も、予測の難しさもない。
Qwen3-8BとQwen3-14Bでは,MATH-500では57~59%のトークン削減を実現し,9~16ポイントの精度向上を実現した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:54:40 GMT)
Retrieval-Augmented Generation with Covariate Time Series [22.3] 我々は,共変量時間系列のためのレシシック・アウェア・トレーニングフリーなRAGフレームワークであるRAG4CTSを提案する。
具体的には、損失のない記憶と物理インフォームド検索を可能にするために、階層的な時系列ネイティブ知識ベースを構築した。
文脈拡張のために、自己監督的な方法でコンテキストを動的に最適化するエージェント駆動型戦略を導入する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:45:24 GMT)
CoIn3D: Revisiting Configuration-Invariant Multi-Camera 3D Object Detection [21.9] マルチカメラ3Dオブジェクト検出(MC3D)は、マルチセンサー物理エージェントの展開により注目を集めている。
現在のソリューションは、単純にメタカメラを統一表現に用いているが、包括的な考慮を欠いている。
CoIn3Dは、ソース設定から未表示のターゲット設定への強力な転送可能性を実現する汎用的なMC3Dフレームワークである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:49:46 GMT)
Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment [21.9] クロスモーダルアライメントは、視覚と言語間のセマンティック一貫性を達成することを目的としたマルチモーダル学習において重要な課題である。
伝統的なアルゴリズムは意味的一貫性を達成するために埋め込み一貫性を追求し、埋め込みに存在する非意味的な情報を無視する。
我々は textbfConstrained textbfDecoupling and textbfSampling (CDDS) による新しいクロスモーダルアライメントアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:23:49 GMT)
3D-RFT: Reinforcement Fine-Tuning for Video-based 3D Scene Understanding [21.7] 映像に基づく3次元シーン理解のための強化ファインチューニング(3D-RFT)について
3D-RFTは、RLVRをビデオベースの3D知覚と推論に拡張する最初のフレームワークである。
3D-RFT-4Bは,様々な映像に基づく3Dシーン理解タスクにおいて,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:15:16 GMT)
HACHIMI: Scalable and Controllable Student Persona Generation via Orchestrated Agents [21.6] 教育用LLMの基盤として学生ペルソナ(SP)が出現している。
我々はこれを、教室と配属可能なペルソナ・リビジョン・フレームワークとして定式化する。
八味は、各人格を理論化された教育スキーマに分類する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:20:41 GMT)
Representation Fidelity:Auditing Algorithmic Decisions About Humans Using Self-Descriptions [21.5] 本稿では,人間の表現の忠実度を計測し,人間のアルゴリズム的決定を検証するための新しい次元を提案する。
同一人物の2つの表現間の距離を計測し,この概念を運用することを提案する。
本稿では,融資先物決定のデータセットに基づいて表現忠実度を評価するための最初のベンチマークを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:04:36 GMT)
DARE: Aligning LLM Agents with the R Statistical Ecosystem via Distribution-Aware Retrieval [21.2] DARE(Distribution-Aware Retrieval Embedding)は、Rパッケージ検索のための関数表現にデータ分散情報を組み込んだ軽量なプラグアンドプレイ検索モデルである。
主なコントリビューションは, (i) RPKB, 8,191の高品質CRANパッケージから派生したキュレートされたRパッケージ知識ベース, (ii) DARE, (iii) RCodingAgent, R-oriented LLM Agent for reliable R code generation, and a suite of statistics analysis taskである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:29:54 GMT)
Robust composite two-qubit gates for silicon-based spin qubits [21.1] パラメータ化された2ビットゲートの集合を実現するために,ハミルトン逆工学に基づく普遍的アプローチを提案する。
この方法は、4つのエネルギー準位間の遷移の同時制御に特有の利点を持っている。
シリコンダブル量子ドット(DQD)に適用すると、1ステップのfSimゲートと1つのパルススイッチでBゲートを実現することができる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:44:48 GMT)
LocalSUG: Geography-Aware LLM for Query Suggestion in Local-Life Services [20.9] ローカルライフサービスプラットフォームでは、クエリ提案モジュールがユーザエクスペリエンスを向上させる上で重要な役割を果たす。
従来のマルチステージのカスケードシステムは、歴史的トップクエリに大きく依存しており、ロングテール需要に対処する能力を制限する。
ローカルライフサービスプラットフォームに適したLLMベースのクエリ提案フレームワークであるLocalSUGを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:42:27 GMT)
WebFactory: Automated Compression of Foundational Language Intelligence into Grounded Web Agents [20.9] 本稿では,GUIエージェントのための完全自動クローズドループ強化学習パイプラインであるWebFactoryを紹介する。
我々のエージェントは例外的なデータ効率と一般化を実証する。
この研究は、受動的インターネット知識をアクティブで接地されたインテリジェンスに変換するためのスケーラブルで費用効率のよいパラダイムを提示します。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:51:34 GMT)
FlashAttention-4: Algorithm and Kernel Pipelining Co-Design for Asymmetric Hardware Scaling [20.8] FlashAttention-4はcuDNN 9.13で最大1.3$times$、BF16でB200 GPUで2.7$times$Tritonで最大2.7$times$を達成している。
従来のC++テンプレートベースのアプローチと比較して20~30$times$高速なコンパイルタイムを実現しています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:24:49 GMT)
EvoTool: Self-Evolving Tool-Use Policy Optimization in LLM Agents via Blame-Aware Mutation and Diversity-Aware Selection [20.6] EvoToolはエージェントのツール使用ポリシーをPlanner、Selector、Caller、Synthesizerの4つのモジュールに分解する。
3つの新しいメカニズムを通じて、反復的に自己改善ループで改善する。
GPT-4.1とQwen3-8Bでは5点以上の強いベースラインを上回り、高い効率と転送性を実現している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:42:53 GMT)
Adversarial Batch Representation Augmentation for Batch Correction in High-Content Cellular Screening [20.3] 実験的実行の技術的バリエーションは、必然的に生物学的バッチ(バイオバッチ)効果を誘発する。
既存のバッチ補正手法は、追加の事前知識や、目に見えないバイオバッチの一般化に苦慮している。
ABRAは、特徴統計を構造化された不確実性としてパラメータ化することで、バッチの統計ゆらぎを明示的にモデル化する。
表現空間における最悪のバイオバッチ摂動を合成し、厳密な角幾何学的マージンで導かれ、微細なクラス識別性を維持する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:26:26 GMT)
Observing and Controlling Features in Vision-Language-Action Models [20.2] VLA(Vision-Language-Action Models)は、インボディードインテリジェンスに対する顕著な進歩を示している。
機能可観測性と機能可制御性という,2つの主要な概念を紹介し,分析する。
この結果から,ロボットの動作を確実に制御する,目標とする軽量な介入が可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:53:50 GMT)
Loop Closure via Maximal Cliques in 3D LiDAR-Based SLAM [20.1] ループクロージャ検証のための新しい決定論的アルゴリズムであるCliRegを導入する。
RANSAC検証を、特徴対応の互換性グラフ上の最大傾き探索に置き換える。
RANSACよりも低いポーズエラーとより信頼性の高いループクロージャを一貫して達成する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:24:44 GMT)
Cheap Thrills: Effective Amortized Optimization Using Inexpensive Labels [20.0] 我々は,「チープ不完全なラベル」を提案し,事前学習を行い,自己教師あり学習を通じてモデルを洗練し,全体的な性能を改善する。
我々の理論的分析と経験的基準は、ラベル付きデータのみをアトラクションの流域に配置する必要があることを示している。
より高速な収束,精度の向上,高品質な最適化,全オフラインコストの最大59倍の削減を実現した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:58:39 GMT)
The Trilingual Triad Framework: Integrating Design, AI, and Domain Knowledge in No-code AI Smart City Course [19.9] 本稿では、学生が生成人工知能(AI)を用いてデザインを学ぶ方法を説明するモデルである「Trilingual Triad」フレームワークを紹介する。
質的なマルチケーススタディアプローチを使用して、3つのプロジェクトは、設計、AIアーキテクチャ、ドメインの専門知識の3つの側面にわたって分析された。
この結果から,これら3つの「言語」が協調して編成された場合に,効果的な人間とAIの連携が生じることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:34:39 GMT)
AOI: Turning Failed Trajectories into Training Signals for Autonomous Cloud Diagnosis [19.9] 大規模言語モデル(LLM)エージェントは、SRE(Site Reliability Engineering)を自動化するための有望なデータ駆動型アプローチを提供する
本稿では,セキュリティ制約下での構造化軌道学習問題として,自動操作を定式化したトレーニング可能なマルチエージェントフレームワークAOIを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:44:23 GMT)
Wiki-R1: Incentivizing Multimodal Reasoning for Knowledge-based VQA via Data and Sampling Curriculum [19.7] 知識に基づくビジュアル質問回答(KB-VQA)は、外部知識を統合することにより、画像に関する質問に答えるモデルを必要とする。
データ生成に基づくカリキュラム強化学習フレームワークである textitWiki-R1 を提案する。
Encyclopedic VQAとInfoSeekの2つのKB-VQAベンチマークの実験は、Wiki-R1が新しい最先端の結果を達成することを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:08:06 GMT)
Gaussian Wardrobe: Compositional 3D Gaussian Avatars for Free-Form Virtual Try-On [19.5] マルチビュービデオから合成3Dニューラルアバターをデジタル化する新しいフレームワークを提案する。
我々の手法の核心は、神経アバターを体と形状に依存しない神経衣服の層に分解することである。
実験では,高忠実度ダイナミックスを用いた光現実性アバターをモデル化した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:37:00 GMT)
Integrated cooperative localization of heterogeneous measurement swarm: A unified data-driven method [19.1] 異種ロボットシステムにおける協調的局所化問題について検討した。
データ駆動型適応RL推定器は、不均一および一方向の測定を扱うために最初に開発された。
次に、分散ポーズ結合型CL戦略を設計し、CLを弱連結な指向性測定トポロジーの下で保証する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:28:15 GMT)
Fusion4CA: Boosting 3D Object Detection via Comprehensive Image Exploitation [18.9] Fusion4CAは古典的なBEVFusionフレームワーク上に構築されており、プラグイン・アンド・プレイコンポーネントによる視覚的な入力を完全に活用することを目的としている。
本手法は6つのトレーニングエポックと3.48%の推論パラメータで69.7%のmAPを達成する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:46:14 GMT)
CLIP-driven Zero-shot Learning with Ambiguous Labels [18.7] ラベルのあいまいさを扱うために,CLIP-PZSL(CLIP-PZSL)フレームワークを提案する。
トレーニングが進むにつれて、地平線ラベルは徐々に識別され、改良されたラベルとラベルの埋め込みは、インスタンスとラベルの特徴のセマンティックアライメントを改善するのに役立ちます。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:06:30 GMT)
A Simple Baseline for Unifying Understanding, Generation, and Editing via Vanilla Next-token Prediction [18.7] マルチモーダル理解,画像生成,編集を統一するために,次世代の予測を活用する,シンプルな自己回帰ベースラインであるWallarooを導入する。
Wallarooは多解像度画像入力と出力をサポートし、中国語と英語の両方でバイリンガルをサポートする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:17:44 GMT)
Aura: Universal Multi-dimensional Exogenous Integration for Aviation Time Series [18.4] 我々は,対象時系列とのインタラクションモードに従って異種外部情報を整理,エンコードする汎用フレームワークであるAuraを提案する。
本研究は,Auraが航空安全・信頼性を汎用的に向上する可能性を示すものである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:05:15 GMT)
Dr.Occ: Depth- and Region-Guided 3D Occupancy from Surround-View Cameras for Autonomous Driving [18.3] 3Dセマンティック占有予測は自律運転知覚に不可欠である。
我々は,奥行きと地域誘導による占領予測の枠組みであるOcc博士を提案する。
我々は,Occ博士がBEVDet4Dを7.43% mIoU,3.09% IoUに改良したことを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:06:26 GMT)
Gabor Primitives for Accelerated Cardiac Cine MRI Reconstruction [18.3] 本稿では,MRI再構成のためのGaborプリミティブを提案する。このプリミティブは,コンベロープを複雑な指数で変調し,スペクトル支持を任意のk空間に配置する。
実験により、ガボルのプリミティブは圧縮センシング、ガウスプリミティブ、ハッシュグリッドベースラインを一貫して上回り、物理的に意味のあるパラメータを持つコンパクトな連続分解表現を提供することが示された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:15:54 GMT)
Toward Real-world Infrared Image Super-Resolution: A Unified Autoregressive Framework and Benchmark Dataset [18.3] 現実世界の条件下での赤外画像超解像(IISR)は、事実上重要な課題であるが、めったに対処されない課題である。
実世界IISRのための統合自己回帰フレームワークであるReal-IISRを提案する。
FLIR-IISRは実世界のIISRデータセットで、一対のLR-HR赤外線画像が自動焦点変化と動きによって引き起こされるぼかしによって取得される。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:38:29 GMT)
EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair [18.2] EigenDataは統合された自己進化型プラットフォームで、マルチエージェントアーキテクチャを通じて完全なデータライフサイクルを自動化する。
我々はEigenDataをBFCL-V3(Berkeley Function-Calling Leaderboard)の監査と修復に応用する。
提案手法は, 結果認識指標と組み合わせて, 機能的正当性の人的判断と有意に相関するモデルランキングを生成できることを実証する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:58:38 GMT)
Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach [18.0] 連続時間クープマンオートエンコーダ (CT-KAE) は, 長期海洋状態予測のための軽量サロゲートモデルである。
CT-KAEは、自己回帰トランスフォーマーベースラインとは対照的に、境界誤差成長と安定した大規模統計を示す。
このモデルでは,数値解法よりも高速な推定が可能である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:39:44 GMT)
Dark3R: Learning Structure from Motion in the Dark [17.8] 我々はDark3Rを紹介した。Dark3Rは暗黒で動きから構成するフレームワークで、信号-雑音比が4ドル以下で生画像を直接操作する。
我々の重要な洞察は、教師による蒸留プロセスを通じて、大規模3D基礎モデルを極端に低照度な環境に適応させることである。
Dark3Rは3Dの監督を必要としない。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:11:36 GMT)
Beyond Linear LLM Invocation: An Efficient and Effective Semantic Filter Paradigm [17.5] Clustering-Sampling-Voting(CSV)は、エラー保証を提供しながら、呼び出しをサブ線形の複雑さに還元するフレームワークである。
CSVはセマンティッククラスタをセマンティッククラスタに組み込み、評価のために小さなサブセットをサンプリングし、2つの投票戦略を通じてクラスタレベルのラベルを推論する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:37:15 GMT)
Free Lunch for Pass@$k$? Low Cost Diverse Sampling for Diffusion Language Models [17.4] 本稿では,拡散言語モデルにおける生成多様性を高めるための,無償で低コストな介入手法を提案する。
提案手法は, 各サンプルが前回のサンプルの特徴空間から反発されるような, バッチ内の中間サンプルを逐次修正する。
リトレーニングやビームサーチを必要とする従来の方法とは異なり、我々の戦略は無視できる計算オーバーヘッドを発生させる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:35:07 GMT)
HiMAP-Travel: Hierarchical Multi-Agent Planning for Long-Horizon Constrained Travel [17.3] 提案する階層型マルチエージェントフレームワークであるHiMAP-Travelは,計画を戦略的コーディネートと並列日次実行に分割する。
TravelPlannerでは、Qwen3-8Bを用いたHiMAP-Travelが52.78%の検証と52.65%のテストファイナルパスレート(FPR)を達成した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:55:53 GMT)
Why the Brain Consolidates: Predictive Forgetting for Optimal Generalisation [17.2] 高容量新皮質ネットワークは,予測的忘れ込みによる複雑性の低減により,記憶された表現を一般化するために最適化することを示す。
予測的忘れは、記憶された表現に対する情報理論の一般化境界を形式的に改善することを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 00:03:05 GMT)
EmboAlign: Aligning Video Generation with Compositional Constraints for Zero-Shot Manipulation [17.0] 大規模なインターネットデータに事前訓練されたビデオ生成モデル(VGM)は、時間的に一貫性のあるロールアウトビデオを生成することができる。
提案手法は,VGM出力を推論時に視覚言語モデルによって生成された洞察と整合するデータフリーフレームワークである。
本研究では,6つの実ロボット操作タスクに対して,厳密で制約に敏感な実行を必要とする手法を評価する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:31:56 GMT)
Bidirectional Curriculum Generation: A Multi-Agent Framework for Data-Efficient Mathematical Reasoning [17.0] 各トレーニングサンプルの教育的価値を最大化するために,新しい双方向カリキュラム生成フレームワークを導入する。
剛性軌道とは異なり、我々のマルチエージェントエコシステムは適応的な教育を模倣し、閉じたフィードバックループを確立する。
このメカニズムは、モデルが任意の段階で最も効果的なデータのみを消費することを保証します。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:49:21 GMT)
AlignVAR: Towards Globally Consistent Visual Autoregression for Image Super-Resolution [16.9] 視覚的自己回帰モデルは、次のスケールの予測を通じて安定したトレーニング、非定性推論、高忠実性合成を提供する。
しかし、その応用は未調査のままであり、局所性に偏った注意と残留性のみの監督という2つの重要な課題に直面している。
画像超解像に適した一貫した視覚自己回帰フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:53:46 GMT)
MASQuant: Modality-Aware Smoothing Quantization for Multimodal Large Language Models [16.7] Modality-Aware Smoothing Quantization (MASQuant)は、Modality-Aware Smoothing (MAS)を紹介する新しいフレームワークである。
MASQuantはデュアルモーダルおよびトリモーダルMLLM間の安定量子化性能を示す。
実験の結果,MASQuantは最先端のPTQアルゴリズムと競合することがわかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:41:32 GMT)
Solving an Open Problem in Theoretical Physics using AI-Assisted Discovery [16.7] 本稿では,理論物理学の解法を自律的に解くことにより,人工知能が数学的発見を加速できることを実証する。
本稿では,ジェミニ・ディープシンク大言語モデルと系統木探索(TS)フレームワークと自動数値フィードバックを組み合わせたニューロシンボリックシステムを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:15:04 GMT)
Keeping the Evidence Chain: Semantic Evidence Allocation for Training-Free Token Pruning in Video Temporal Grounding [16.5] Video Temporal Grounding (VTG)は、クエリ関連モーメントの時間的境界を、長い、トリミングされていないビデオでローカライズする。
本稿では,セマンティックな役割を持つコンパクトだがコヒーレントなトークンサブセットを構成する,トレーニング不要なプルーニングフレームワークSemVIDを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:25:32 GMT)
NeuronMoE: Neuron-Guided Mixture-of-Experts for Efficient Multilingual LLM Extension [16.5] Mixture-of-Experts (MoE)アーキテクチャは、スパース言語固有のパラメータを追加することでこの問題に対処する。
現在のアプローチでは、レイヤレベルの類似性に基づいて専門家を割り当てているが、言語処理は個々のニューロンに対してきめ細かい特殊化を示す。
我々は,すべてのトランスフォーマーコンポーネントをまたいだ言語固有のニューロンを分析し,各レイヤごとの専門的な割り当てをガイドする手法である$textbfNeuronMoE$を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:55:26 GMT)
BioLLMAgent: A Hybrid Framework with Enhanced Structural Interpretability for Simulating Human Decision-Making in Computational Psychiatry [16.5] 評価された認知モデルと大規模言語モデルの生成能力を組み合わせた,新しいハイブリッドフレームワークであるBioLLMAgentを紹介する。
アイオワ・ギャンブリング・タスクの実験では、BioLLMAgentは人間の行動パターンを正確に再現している。
BioLLMAgentは、精神医学研究における機械的仮説と介入戦略をテストするために構造的に解釈可能な「計算サンドボックス」を提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:04:24 GMT)
Layer by layer, module by module: Choose both for optimal OOD probing of ViT [16.5] 予め学習した視覚変換器における中間層の挙動について検討する。
事前学習データと下流データの分布変化が性能劣化の主な原因であることがわかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:23:41 GMT)
Exploring the potential and limitations of Model Merging for Multi-Domain Adaptation in ASR [16.5] マルチドメインASRとベンチマーク11のマージアルゴリズムによる10のポルトガルのドメインのマージについて検討した。
当社のアプローチは,単一モデルでの配布外一般化を保ちながら,ポルトガル語に対する完全な微調整を達成している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:34:24 GMT)
Diffusion-Based sRGB Real Noise Generation via Prompt-Driven Noise Representation Learning [16.1] 我々はPNG(Prompt-Driven Noise Generation)と呼ばれる新しいフレームワークを提案する。
このモデルは実世界の入力ノイズの特徴を捉えた高次元のプロンプト特徴を得ることができる。
明示的なカメラメタデータへの依存を排除し,ノイズ合成の一般化性と適用性を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:54:38 GMT)
Reasoning Models Struggle to Control their Chains of Thought [15.7] 推理モデルは出力制御可能性よりもCoT制御性が著しく低いことを示す。
また,より大規模なモデルではCoT制御性が向上し,RLトレーニングやテスト時間計算,問題問題の増加などにより低下することがわかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:03:48 GMT)
Quadratic polarity and polar Fenchel-Young divergences from the canonical Legendre polarity [15.7] 極性は$n$次元射影幾何学の基本的な相互双対性である。
二次極性関数によって誘導される一般極性は、変形したルジャンドル極性または変形した凸体のルジャンドル極性として表現できることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:57:06 GMT)
GaussTwin: Unified Simulation and Correction with Gaussian Splatting for Robotic Digital Twins [15.3] GaussTwinは、位置に基づくダイナミクスと離散コセラットロッドの定式化を組み合わせたリアルタイムデジタルツインである。
GaussTwinは、形状マッチングや剛性のみのベースラインに比べて、トラッキング精度とロバスト性を一貫して改善することを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:27:05 GMT)
Why Depth Matters in Parallelizable Sequence Models: A Lie Algebraic View [15.3] モデルが表現性体制外で動作する場合, 誤差の限界と誤差のスケールについて検討する。
我々の理論は、列モデルの深さとリー代数拡大の塔の間の対応を定式化している。
我々は近似誤差境界を解析的に導出し、深さが大きくなるにつれて誤差が指数関数的に減少することを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:16:13 GMT)
Gated Differential Linear Attention: A Linear-Time Decoder for High-Fidelity Medical Segmentation [15.3] PVT-GDLAはデコーダ中心のトランスフォーマーで、線形時間でシャープで長距離の依存関係を復元する。
これは、CT、MRI、超音波、皮膚内視鏡のベンチマークで同等のトレーニング予算で最先端の精度を達成する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 00:01:22 GMT)
Enhancing Zero-shot Commonsense Reasoning by Integrating Visual Knowledge via Machine Imagination [15.2] ゼロショット・コモンセンス推論フレームワークであるImagine (Machine Imagination-based Reasoning)を提案する。
我々は、画像生成器を直接推論パイプラインに埋め込むことにより、PLMを想像力で強化する。
既存のゼロショットアプローチをはるかに上回り、先進的な大規模言語モデルを超えていることを実証する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:47:22 GMT)
CodeScout: Contextual Problem Statement Enhancement for Software Agents [14.9] 現在のAIによるコードアシストツールは、しばしば未定義の問題ステートメントに悩まされる。
CodeScoutは、コンテキストクエリの改良手法である。
CodeScoutは、未特定のユーザリクエストを包括的で実行可能な問題ステートメントに変換する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:10:09 GMT)
Non-Euclidean Gradient Descent Operates at the Edge of Stability [14.9] エッジ・オブ・安定性(エッジ・オブ・安定性、EoS)は、勾配降下の訓練中にヘッセンの鋭さが2/$に収束する現象である。
我々は、指向性滑らか性(Directional Smoothness Mishkin et al)のレンズを通してEoSの解釈を行う。
一般化したシャープネスを持つ非ユークリッドGDは, しきい値の2/$以上の振動を伴って, 進行的なシャープニングを示すことを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:49:33 GMT)
FC-VFI: Faithful and Consistent Video Frame Interpolation for High-FPS Slow Motion Video Generation [14.9] 忠実で一貫したビデオフレーム保存のためのFC-VFIを提案し、(4時間)xと(8時間)解像度をサポートした。
本稿では,先行列の時間的モデリング手法を導入し,開始フレームと終了フレームから忠実度を継承し,構造認識動作誘導のセマンティックマッチング線を利用する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:41:34 GMT)
PhysiFlow: Physics-Aware Humanoid Whole-Body VLA via Multi-Brain Latent Flow Matching and Robust Tracking [14.8] 本稿では,ヒューマノイド全体制御のためのセマンティック・ムーブメント・ガイド付き物理対応多脳VLAフレームワークを提案する。
実験結果から,ヒューマノイドロボットの視覚言語誘導型全体調整が可能であった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:33:20 GMT)
Poisoning the Inner Prediction Logic of Graph Neural Networks for Clean-Label Backdoor Attacks [14.8] グラフニューラルネットワーク(GNN)は,様々なタスクにおいて顕著な成果を上げている。
グラフバックドア攻撃は、ターゲットクラスとしてアタッチされたトリガでテストノードを予測するためにGNNモデルに悪影響を及ぼす可能性がある。
本稿では, 有害ノードセレクタと論理汚染トリガ発生器を協調してこの問題を解決するため, BA-Logicを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:51:43 GMT)
Location-Aware Pretraining for Medical Difference Visual Question Answering [14.8] 位置認識タスクを組み込んだ事前学習フレームワークを導入する。
これらの特定のタスクにより、視覚エンコーダは細粒度で空間的に接地された視覚表現を学習することができる。
次に、この拡張視覚エンコーダを言語モデルと統合し、医用差分VQAを実行する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:44:06 GMT)
UniPAR: A Unified Framework for Pedestrian Attribute Recognition [14.6] 歩行者属性認識のための統合トランスフォーマーベースのフレームワークUniPARを提案する。
統一されたデータスケジューリング戦略と動的分類ヘッドを組み込むことで、UniPARは単一のモデルで多様なデータセットを同時に処理できる。
MSP60K、DukeMTMC、EventPARなど、広く使われているベンチマークデータセットの実験結果は、UniPARが特別なSOTAメソッドに匹敵するパフォーマンスを達成することを実証している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:34:35 GMT)
Distribution-Conditioned Transport [14.6] 本稿では、ソースおよびターゲット分布の学習埋め込みをマップするフレームワークである分散条件トランスポート(DCT)を紹介する。
DCTは、フローマッチングから分散分岐に基づくモデルまで、その基盤となる輸送メカニズムに依存しない。
生物の4つの応用において,合成ベンチマークにおけるDCTの有効性を実証した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:17:08 GMT)
LUMINA: Laplacian-Unifying Mechanism for Interpretable Neurodevelopmental Analysis via Quad-Stream GCN [14.4] 解釈可能な神経発達解析のためのラプラシアン統一機構を提案する。
我々のモデルは、バイポーラRELUアクティベーションとデュアルスペクトルグラフラプラシアンフィルタリング機構を利用する、クアドストリームGCNである。
LUMINAは小児、ADHD、ALDの2つの重要な神経発達障害において安定した診断性能を示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:21:52 GMT)
Functionality-Oriented LLM Merging on the Fisher--Rao Manifold [14.3] 重み空間のマージは、複数の微調整LDMを再訓練せずに単一のモデルに組み合わせることを目的としている。
我々は,標準を守り,マルチエキスパートマージに直接一般化する軽量な球面プロキシを用いて,実用的な固定点アルゴリズムを導出する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:08:38 GMT)
Interpretable Multimodal Gesture Recognition for Drone and Mobile Robot Teleoperation via Log-Likelihood Ratio Fusion [14.3] 視覚に基づくジェスチャー認識はハンズフリー遠隔操作の一手法として検討されている。
両手首にApple Watchの慣性データとカスタム手袋の容量感覚信号を統合するマルチモーダルジェスチャー認識フレームワークを提案する。
我々のフレームワークは、最先端のビジョンベースのベースラインに匹敵するパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:41:00 GMT)
Relational Semantic Reasoning on 3D Scene Graphs for Open World Interactive Object Search [14.3] SCOUT: Scene Graph-Based Exploration with Learned Utility for Open-World Interactive Object Searchを紹介する。
SCOUTは部屋、フロンティア、オブジェクトにユーティリティスコアを割り当てることで、3Dシーングラフを直接検索する。
対話型オブジェクト検索タスクにおける意味的推論を評価するためのスケーラブルなシンボリックベンチマークであるSymSearchを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:52:26 GMT)
Incentive Aware AI Regulations: A Credal Characterisation [14.2] 高度なMLアプリケーションは厳格な規制を要求するが、戦略的なMLプロバイダは開発コストを下げるためにそれらを回避していることが多い。
モデルから経験的証拠をマーケットシェアのライセンスにマッピングするフレームワークである。
非コンプライアンス分布の集合が不規則な確率測度の集合を形成する場合に限って、その機構が完全な市場結果を持つことを証明する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:42:19 GMT)
AILS-NTUA at SemEval-2026 Task 10: Agentic LLMs for Psycholinguistic Marker Extraction and Conspiracy Endorsement Detection [14.2] 本稿では,SemEval-2026 Task 10 のための新しいエージェント LLM パイプラインを提案する。
マーカー抽出のために,意味的あいまいさと文字レベルの脆さを解消するために,決定論的アンカーを用いた動的離散Chain-of-Thought (DD-CoT)を提案する。
共謀検知のためには、キャリブレート判事による反対パラレル協議会で構成される「反Echoチャンバー」アーキテクチャが「レポータートラップ」を克服する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:09:10 GMT)
NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution [13.9] NOTAI.AIは、機械生成テキスト検出のための説明可能なフレームワークである。
このシステムは、条件付き確率曲線、ModernBERT検出器スコア、可読性測定値、およびテクスチャ的手がかりを含む17の解釈可能な特徴を組み合わせている。
このシステムは、リアルタイム分析、視覚的特徴検査、構造化された証拠提示をサポートするインタラクティブなWebアプリケーションとしてデプロイされる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:19:12 GMT)
Distributional Equivalence in Linear Non-Gaussian Latent-Variable Cyclic Causal Models: Characterization and Learning [13.9] 我々は、一般の、構造的前提のないアプローチに対する中核的な障害は、同値なキャラクタリゼーションの欠如であると主張する。
このアプローチの鍵となるのは、エッジレベルの制約という新しいツールです。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:57:14 GMT)
BLINK: Behavioral Latent Modeling of NK Cell Cytotoxicity [13.8] 細胞間相互作用の機械学習モデルは、細胞の振る舞いを理解することを約束する。
NK細胞はこのような相互作用力学の顕著な例であり、時間分解多チャンネル蛍光顕微鏡を用いてよく研究されている。
本稿では,NK-腫瘍間相互作用のセルワールドモデルとして機能するトラジェクトリベースのリカレント状態空間モデルであるBLINKを紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:29:57 GMT)
Semantic Class Distribution Learning for Debiasing Semi-Supervised Medical Image Segmentation [13.7] クラス不均衡は、少数構造が特徴表現において支配的なクラスに圧倒される原因となる。
本稿では,教師と表現バイアスを軽減するプラグイン・アンド・プレイモジュールであるセマンティック・クラス・ディストリビュート・ラーニング(SCDL)フレームワークを提案する。
SynapseデータセットとAMOSデータセットの実験は、SCDLが全体的なメトリクスとクラスレベルのメトリクスのセグメンテーション性能を大幅に改善することを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:13:53 GMT)
Autonomous Algorithm Discovery for Ptychography via Evolutionary LLM Reasoning [13.3] Ptychi-Evolveは、大規模な言語モデルを使用して、新しい正規化アルゴリズムを発見し、進化させる自律的なフレームワークである。
検出された正則化器は従来の再構成よりも優れており,最大+0.26 SSIMと+8.3dB PSNRの改善が達成されている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:39:57 GMT)
Interpretable Perception and Reasoning for Audiovisual Geolocation [13.2] 本稿では,解釈可能な知覚と推論を通じて地理的曖昧性を解決するためのフレームワークであるAudiovisual Geolocationを紹介する。
位置決めのための高品質なグローバルスケールビデオベンチマークであるAVGについて紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:04:58 GMT)
Why Do You Contribute to Stack Overflow? Understanding Cross-Cultural Motivations and Usage Patterns before the Age of LLMs [13.1] 本研究は,Stack Overflowコントリビュータのモチベーションを調査し,地域差とプラットフォーム活動との関係を分析する。
アメリカのコントリビュータはより強力な自己宣伝行動を示し、中国のコントリビュータはより学習指向のエンゲージメントを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:51:04 GMT)
Visual-Informed Speech Enhancement Using Attention-Based Beamforming [13.1] 視覚インフォームドニューラルビームフォーミングネットワーク(VI-NBFNet)を提案する。
提案するネットワークは、マイクロホンアレイ信号処理と、マルチモーダル入力機能を用いたディープニューラルネットワーク(DNN)を統合している。
注目機構を備えた教師付きエンドツーエンドビームフォーミングフレームワークを導入することで、静的および移動型スピーカの両方を扱うことを意図している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:19:41 GMT)
On the Necessity of Learnable Sheaf Laplacians [12.9] SNN(Sheaf Neural Networks)は、グラフ畳み込みネットワークの拡張として導入され、異種グラフのオーバースムーシングに対処した。
我々は,アイデンティティ・シェアード・ネットワークがSNNのネットワークよりも過度に過度に悩まされているようには見えないことを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:24:13 GMT)
Distributed Partial Information Puzzles: Examining Common Ground Construction Under Epistemic Asymmetry [12.9] 本研究では, エピステミック非対称性下でのマルチモーダル通信を多用する協調作業であるDPIP(Distributed partial Information Puzzle)を紹介する。
提案する内容や信念のダイナミクスに対する推論を支援するために, 音声, ジェスチャー, 行動モダリティ間でアノテートされ, 時間的に一致したこれらの相互作用のマルチモーダルデータセットを提案する。
そこで我々は,(1)多モーダル更新から共有信念を推論するために誘導される最先端の大規模言語モデル(LLM)と,(2)動的疫学論理(DEL)を基盤とした公理パイプラインの2つのパラダイムを評価する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:22:55 GMT)
Logi-PAR: Logic-Infused Patient Activity Recognition via Differentiable Rule [12.9] 臨床環境における患者活動認識(PAR)は、医療の安全性と品質を改善するために活動データを使用する。
Logi-PARは、シンボリックマッピングに学習可能な論理ルールを適用することで、患者活動を認識する最初のフレームワークである。
ルールとして説明が追跡され、事実上の介入をサポートするのは、監査可能な理由である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:52:50 GMT)
cuRoboV2: Dynamics-Aware Motion Generation with Depth-Fused Distance Fields for High-DoF Robots [12.8] cuRoboV2は、シングルアームマニピュレータからフルヒューマノイドにスケールするモーション生成スタックである。
1)スムーズさとトルク制限を強制するB-スプライン軌道最適化,(2)フルワークスペースをカバーする高密度符号付き距離場を生成するGPUネイティブTS/ESDF認識パイプライン,(3)高DoFヒューマノイドにも拡張しながら最大61倍の速度で到達する逆ダイナミクスマップ-リデュース自己ネイティブ。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:58:04 GMT)
RobustVisRAG: Causality-Aware Vision-Based Retrieval-Augmented Generation under Visual Degradations [12.8] VisRAG(Retrieval-Augmented Generation)は、視覚言語モデル(VLM)を活用して、関連する視覚文書を共同で検索し、マルチモーダルな証拠に基づいて根拠付き回答を生成する。
既存のVisRAGモデルは、視覚入力がぼやけ、ノイズ、低光、シャドーなどの歪みに悩まされるときに性能が低下する。
因果誘導型デュアルパスフレームワークであるRobustVisRAGを導入し,効率とゼロショットの一般化を保ちながら,VisRAGの堅牢性を向上させる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:12:37 GMT)
Preserving Continuous Symmetry in Discrete Spaces: Geometric-Aware Quantization for SO(3)-Equivariant GNNs [12.8] 等変モデルを圧縮・加速するGeometric-Aware Quantization (GAQ) フレームワークを提案する。
消費者向けハードウェアでは、GAQは2.39倍の推論スピードアップと4倍のメモリ削減を実現し、安定したエネルギー保存分子動力学シミュレーションを可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:20:21 GMT)
Bias In, Bias Out? Finding Unbiased Subnetworks in Vanilla Models [12.6] 従来の訓練されたモデルにすでに存在する「バイアスフリー」ワークを識別し、分離する学習戦略であるBias-Invariant Subnetwork extract (BISE)を紹介する。
提案手法は, プルーニングによって抽出可能であり, 改良することなく操作可能であり, バイアスの少ない機能に効果的に依存し, 堅牢な性能を維持していることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:54:24 GMT)
When Weak LLMs Speak with Confidence, Preference Alignment Gets Stronger [12.5] 優先順位アライメントは、人間の価値に大規模な言語モデルを適用するための重要なステップである。
本稿では,LLMの信頼性を弱め,トレーニングサンプルを再重み付けするフレームワークである信頼度重み付き優先度最適化(CW-PO)を提案する。
人間のアノテーションの20%しか持たないCW-POは、標準のDPOの下で100%アノテーションでトレーニングされたモデルよりも優れています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:06:25 GMT)
Tell2Adapt: A Unified Framework for Source Free Unsupervised Domain Adaptation via Vision Foundation Model [12.4] 本稿では、Vision Foundation Model(VFM)の膨大な一般化可能な知識を活用する新しいSFUDAフレームワークであるTell2Adaptを紹介する。
臨床的信頼性を保証するために、このフレームワークはVisual Plausibility Refinement (VPR)を組み込んでいる。
これまでに最も広範なSFUDA評価を行い、10のドメイン適応方向と22の解剖学的目標にまたがってフレームワークを検証する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:01:22 GMT)
From Code to Road: A Vehicle-in-the-Loop and Digital Twin-Based Framework for Central Car Server Testing in Autonomous Driving [12.1] 本研究は,集中型E/Eアーキテクチャ上での自動車ソフトウェアテストフレームワークを提案する。
このフレームワークは、ダイナモメーターテストベンチに物理テスト車両を、シミュレーション環境で同期仮想車両と結合する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:23:28 GMT)
Uni-LVC: A Unified Method for Intra- and Inter-Mode Learned Video Compression [12.1] 単一モデルにおける低遅延およびランダムアクセスによるイントラとインターコーディングの両方をサポートする統一LVCであるUni-LVCを紹介する。
強力なコーデック上に構築されたUni-LVCは、参照フレームから抽出された時間情報に基づいて、コード内条件としてインターコーディングを行う。
時間的キューを選択的にスケールするために信頼性を考慮した分類器が提案され、参照が信頼できない場合、Uni-LVCはイントラコーディングに近づく。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:30:34 GMT)
Robust and optimal control of open quantum systems [12.0] 我々は、システムの不完全性とノイズを抑制するアルゴリズムを改善し、オープン量子システムのロバストかつ最適制御のためのスケーラビリティを著しく向上させる。
この研究は、量子最適制御技術の顕著な進歩であり、実用的な応用における量子化技術の実現の道を開くものである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:02:47 GMT)
Auto-Generating Personas from User Reviews in VR App Stores [12.0] 本研究は,VRコースにおけるアクセシビリティ要件を抽出する手段として,自動生成ペルソナの利用を実証する。
その結果,自己生成型ペルソナシステムにより,学生が共感をより効率的に発達できることがわかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:25:15 GMT)
X-RAY: Mapping LLM Reasoning Capability via Formalized and Calibrated Probes [12.0] 大規模言語モデル(LLM)は有望な性能を達成するが、その推論能力はいまだによく分かっていない。
我々は、校正された正式に検証されたプローブを用いてLCM推論能力をマッピングする説明可能な推論分析システムであるX線について述べる。
数学,物理学,化学の分野において,中等レベルから高度な問題に対する現状のLSMの評価を行った。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:34:22 GMT)
Reasoning Theater: Disentangling Model Beliefs from Chain-of-Thought [12.0] 推論モデルにおける行動連鎖(CoT)の証拠を提供する。
アクティベーションプロービング、早期強制応答、および2つの大きなモデルにわたるCoTモニターを比較した。
難解なマルチホップGPQA-ダイアモンド問題における真の推論とは対照的である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:55:16 GMT)
CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain [11.9] 事例ベース推論(CBR)にインスパイアされたフレームワークであるCBR-to-based Reasoning(CBR)を紹介する。
CBRは、再利用可能な抽象的なケーステンプレートとして質問対を表現し、まず論理構造をキャプチャし、関連するエンティティを解決する2段階の検索プロセスを利用する。
サンプル効率とロバスト性は標準的なRAGアプローチよりも高く、特にデータ不足や検索において顕著である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:43:14 GMT)
MatRIS: Toward Reliable and Efficient Pretrained Machine Learning Interatomic Potentials [11.9] MatRISは3体インタラクションの注意に基づくモデリングを導入する不変MLIPである。
MatRISは、様々な人気のあるベンチマークにおいて、主要な同変モデルの精度に匹敵する精度を提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:45:08 GMT)
Revisiting Shape from Polarization in the Era of Vision Foundation Models [11.8] 小さいデータセットでトレーニングされた軽量モデルは、単発物体表面の正常推定において、RGBのみの視覚基盤モデル(VFM)より優れていることを示す。
40Kのトレーニングシーンで,本手法は最先端のSfPアプローチとRGBのみのVFMの両方に優れていた。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:07:03 GMT)
Frequency-Aware Error-Bounded Caching for Accelerating Diffusion Transformers [11.8] ディフュージョントランスフォーマー(DiT)は高品質な画像生成とビデオ生成の主要なアーキテクチャとして登場してきた。
既存のキャッシュ手法は、タイムステップ間で中間計算を再利用することで、DiTを加速するが、それらは共通の制限を共有している。
本稿では、時間認識動的スケジューリング(TADS)、累積誤差予算(CEB)、周波数分解キャッシング(FDC)からなる統合キャッシュフレームワークであるSpectralCacheを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:58:06 GMT)
Count Bridges enable Modeling and Deconvolving Transcriptomic Data [11.7] 数値データに対する拡散型モデルの正確なアナログを提供する整数上のプロセスであるCount Bridgesを紹介する。
我々はこのフレームワークを拡張して、単位レベルの数を潜伏変数として扱う期待-最大化スタイルのアプローチを通じて、集約された測定から直接のトレーニングを可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:09:00 GMT)
ConTSG-Bench: A Unified Benchmark for Conditional Time Series Generation [11.7] 条件付き時系列生成は、データの不足に対処し、現実世界のアプリケーションで因果解析を可能にする上で重要な役割を果たす。
条件付き時系列生成ベンチマーク(ConTSG-Bench)を紹介する。
ConTSG-Benchは、多様な条件付けのモダリティとセマンティック抽象化のレベルにまたがる、大規模で整列したデータセットで構成されている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:30:52 GMT)
From Decoupled to Coupled: Robustness Verification for Learning-based Keypoint Detection with Joint Specifications [11.4] キーポイント検出は、ポーズ推定、視点回復、3D再構成など、多くの視覚タスクの基盤となる。
その重要性にもかかわらず、キーポイント検出器の形式的ロバスト性検証は、高次元入力と連続座標出力のためにほとんど探索されていない。
熱マップに基づくキーポイント検出のための最初の結合ロバスト性検証フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:01:53 GMT)
Dissociating Direct Access from Inference in AI Introspection [11.3] 最近の研究によると、AIモデルはイントロスペクション可能である。
これらのモデルが2つの分離可能なメカニズムによって注入された表現を検出することを示す。
この内容に依存しない内観のメカニズムは、哲学や心理学における主要な理論と一致している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:39:37 GMT)
Towards Provably Unbiased LLM Judges via Bias-Bounded Evaluation [11.2] 自律型AIシステムは、自動で検証可能な報酬とフィードバックに依存する。
根拠的真理が希薄か非決定論的であるような環境では、そのような報酬の実践的な源泉はLLM-as-a-Judgeである。
評価可能なバイアスの結果として、害/影響の低減を正式に保証するアルゴリズムフレームワークである平均バイアス境界性(A-BB)を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:52:28 GMT)
Lap2: Revisiting Laplace DP-SGD for High Dimensions via Majorization Theory [11.1] DP-SGD(Private Gradient Descent)は、ディープラーニングにおけるプライバシを確保するための基礎技術である。
我々はLaplace-SGDのL2クリッピングを可能にする新しいソリューションであるLap2を紹介し、強力なプライバシー保証を克服する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:42:22 GMT)
Beyond Scattered Acceptance: Fast and Coherent Inference for DLMs via Longest Stable Prefixes [10.9] Longestahead Prefix(LSP)スケジューラは、モノリシックプレフィックスの吸収に基づく、トレーニング不要でモデルに依存しない推論パラダイムである。
LSPは1つのフォワードパスを介してトークンの安定性を評価し、安定な予測の連続した左整列ブロックを動的に識別する。
原子のコミットメントの前に、言語や構造的受容の境界を画定する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:25:26 GMT)
When LoRA Betrays: Backdooring Text-to-Image Models by Masquerading as Benign Adapters [10.9] Low-Rank Adaptation (LoRA) は、テキストから画像への拡散を効率的に調整する主要な手法として登場した。
MasqLoRAは、独立したLoRAモジュールを攻撃車両として活用する最初の体系的な攻撃フレームワークである。
MasqLoRAの攻撃成功率は99.8%である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:54:52 GMT)
MultiGO++: Monocular 3D Clothed Human Reconstruction via Geometry-Texture Collaboration [10.9] モノクローナルな3D服の復元は、1枚の画像から完全にリアルなテクスチャ化された3Dアバターを生成することを目的としている。
既存の手法は、注釈付き幾何事前のマルチビュー監視の下で一般的に訓練されており、推論の際には、これらの先行を単眼入力から事前学習されたネットワークによって推定する。
そこで我々はMultiGO++という新しい再構成フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:37:55 GMT)
Missingness Bias Calibration in Feature Attribution Explanations [10.8] モデルの出力空間の表層的アーティファクトとして,欠陥バイアスを扱えることを示す。
凍結ベースモデルの出力に単純な線形ヘッドを微調整することで、このバイアスを補正する軽量なポストホック法であるMCalを導入する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:29:09 GMT)
Revisiting the (Sub)Optimality of Best-of-N for Inference-Time Alignment [10.7] Best-of-N (BoN) サンプリングは、言語モデルにおいて広く使われている推論時間アライメント手法である。
最近の理論的研究は、これは統計的に準最適であり、報酬ハッキングに弱いことを示唆している。
適切な調整を施したBoNは,高い勝利率を達成するのに最適であり,統計的に最適であることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:54:19 GMT)
MOSAIC: Modular Scalable Autonomy for Intelligent Coordination of Heterogeneous Robotic Teams [10.7] 統合されたミッション抽象化を用いたマルチロボット科学探査のためのスケーラブルな自律フレームワークを提案する。
提案したフレームワークは,操作者の介入を限定した堅牢でスケーラブルなマルチロボット科学探査を可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:27:35 GMT)
Real-Time AI Service Economy: A Framework for Agentic Computing Across the Continuum [10.4] 本稿では、DAGとしてモデル化されたサービス依存グラフの構造が、分散化された価格ベースのリソース割り当てが大規模に確実に機能するかどうかの主要な決定要因であることを示す。
本稿では、クロスドメインなサブグラフをリソーススライスに分割し、よりシンプルでよく構造化されたインターフェースを市場に提供するハイブリッド管理アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:14:54 GMT)
Accelerating Text-to-Video Generation with Calibrated Sparse Attention [10.3] CalibAttは、キャリブレーションされたスパースアテンションによるビデオ生成を加速するトレーニング不要の手法である。
Wan 2.1 14B, 1 および数段階の蒸留モデルに対する様々な解像度での実験により、CalibAtt は最大 1.58 倍のエンドツーエンドのスピードアップを達成した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:59:32 GMT)
Censored LLMs as a Natural Testbed for Secret Knowledge Elicitation [10.3] この問題の2つのアプローチは、正直な推論と嘘検出である。
我々は、政治的に敏感なトピックを検閲するために訓練された中国の開発者によるオープンウェイトLSMについて研究する。
正直な説明として、チャットテンプレートのないサンプリング、数発のプロンプト、一般的な正直なデータの微調整は、真実の反応を確実に増加させる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:58:14 GMT)
Mario: Multimodal Graph Reasoning with Large Language Models [10.2] Marioはグラフ条件のVLMで、微粒なクロスモーダルコントラスト学習によってテキストや視覚的特徴を洗練する。
Marioは、ノード分類とリンク予測のための教師付きシナリオとゼロショットシナリオの両方において、最先端のグラフモデルより一貫して優れている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:49:41 GMT)
CATNet: Collaborative Alignment and Transformation Network for Cooperative Perception [10.0] コラボレーティブアライメント・アンド・トランスフォーメーション・ネットワーク(CATNet)は、マルチエージェントシステムにおける時間遅延とノイズ干渉を解決する適応補償フレームワークである。
まず、非同期機能ストリームの整合性を備えた時空間リカレントシンクロナイゼーション(STSync)を紹介します。
第2に,大域的雑音を抑制し,局所的特徴歪みを再構成するDual-Branch Wavelet Enhanced Denoiser (WTDen) を設計する。
第三に、ロバスト融合のための重要な知覚機能に動的にフォーカスする適応的特徴選択器(AdpSel)を構築する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:07:36 GMT)
HiFlow: Hierarchical Feedback-Driven Optimization for Constrained Long-Form Text Generation [10.0] HiFlowは、制約付き長文生成のための階層的なフィードバック駆動最適化フレームワークである。
HiFlowは、グローバルな構造と制約モデリングのための計画層と、条件付きテキスト生成のための生成層からなる、2段階最適化プロセスとして生成を定式化する。
複数のバックボーンの実験では、ベースラインメソッドに対するHiFlowの有効性が確認されている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:41:39 GMT)
ProKWS: Personalized Keyword Spotting via Collaborative Learning of Phonemes and Prosody [9.9] ProKWSは、微粒な音素学習とパーソナライズされた韻律モデリングを統合する新しいフレームワークである。
ProKWSは、標準ベンチマークの最先端モデルに匹敵する、非常に競争力のあるパフォーマンスを提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:01:42 GMT)
Not All Trust is the Same: Effects of Decision Workflow and Explanations in Human-AI Decision Making [9.9] AI支援による意思決定における中心的な課題は、保証された、明確な信頼を達成することである。
以前の研究では、意思決定ワークフローの設計が異なる。
その結果、2段階のセットアップが過度に信頼性を低下させるという証拠は得られなかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:42:01 GMT)
Video-based Locomotion Analysis for Fish Health Monitoring [9.7] 本稿では,マルチオブジェクトトラッキングを用いた動画からの移動活動を推定するシステムを提案する。
本システムは,水族館のような施設で記録されたスラウェシのアノテートデータセットを用いて評価した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:32:46 GMT)
Axiomatic On-Manifold Shapley via Optimal Generative Flows [9.6] シェープベースの属性はポストホックなXAIにとって重要であるが、ベースラインのためにオフマニフォールドのアーティファクトに悩まされている。
最適生成フローによって駆動されるオンマンフォールドAumann-Shapley属性の形式理論を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:05:20 GMT)
Pessimistic Auxiliary Policy for Offline Reinforcement Learning [9.5] 信頼性のある動作をサンプリングするための新しい悲観的補助ポリシーを構築した。
悲観的な補助戦略は、学習方針の近傍で比較的高い価値と低い不確実性を示す。
オフライン強化学習ベンチマークの実験では、悲観的な補助戦略を利用することで、他のオフラインRLアプローチの有効性を効果的に改善できることが示された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:03:30 GMT)
From Offline to Periodic Adaptation for Pose-Based Shoplifting Detection in Real-world Retail Security [9.4] 万引きは小売業者にとって、運用と経済的課題の増大だ。
本稿では,ポーズベースで教師なしビデオ異常検出問題として,万引き検出を論じる。
オンサイトIoT(Internet of Things)デプロイメント用に設計された定期的な適応フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:53:06 GMT)
Are Multimodal LLMs Ready for Surveillance? A Reality Check on Zero-Shot Anomaly Detection in the Wild [9.4] MLLM(Multimodal large language model)は、ビデオ理解において優れた汎用能力を誇示している。
本研究では,上海技術とCHADベンチマークを用いて,最先端のMLLMの評価を行う。
本研究では,迅速な特異性と時間窓の長さ(1s--3s)が性能に与える影響について検討し,高精度なリコールトレードオフに着目した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:00:53 GMT)
Viewpoint Matters: Dynamically Optimizing Viewpoints with Masked Autoencoder for Visual Manipulation [9.4] 単一カメラロボットシステムにおけるアクティブ視点選択のための新しいフレームワークであるMAE-Selectを提案する。
MaE-Selectは、事前訓練されたマルチビューマスク付きオートエンコーダ表現をフル活用し、各タイムチャンクにおける次の最も情報性の高い視点を動的に選択する。
実験により、MAE-Selectはシングルカメラシステムの能力を向上し、場合によってはマルチカメラのセットアップを超越することを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:34:26 GMT)
GALACTIC: Global and Local Agnostic Counterfactuals for Time-series Clustering [9.3] 本稿では,非教師付き時系列クラスタリングのための局所的およびグローバル的対実的説明性を橋渡しする,最初の統一フレームワークであるGALACTICを紹介する。
インスタンスレベル(ローカル)では、GALACTICはクラスタ認識最適化の目的を通じて摂動を生成する。
クラスタレベル(グローバル)では、認知負荷を軽減し、解釈可能性を高めるため、代表的なCE選択問題を定式化する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:59:33 GMT)
FOZO: Forward-Only Zeroth-Order Prompt Optimization for Test-Time Adaptation [9.3] ディープラーニングモデルが現実のデータ分散シフトを処理するために、テスト時間適応は不可欠である。
バックプロパゲーションベースのメソッドは、ローエンドのデプロイメントデバイスには適していない。
本稿では,TTAの新規かつ実用的なバックプロパゲーションフリーパラダイムであるフォワード・オン・ゼロ階最適化(FOZO)を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:12:48 GMT)
EVMbench: Evaluating AI Agents on Smart Contract Security [9.3] EVMbenchは、スマートコントラクトの脆弱性を検出し、パッチを当て、悪用するエージェントの能力を測定する評価である。
さまざまなフロンティアエージェントを評価して、ライブブロックチェーンインスタンスに対するエンドツーエンドの脆弱性を発見し、悪用することが可能であることを確認します。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:59:14 GMT)
Embedded Inter-Subject Variability in Adversarial Learning for Inertial Sensor-Based Human Activity Recognition [9.2] 本稿では,ウェアラブル慣性センサのデータを用いたHAR(Human Activity Recognition)の問題に対処する。
HARの重要な課題は、オブジェクト間の可変性によるモデルの一般化能力である。
本稿では, 対象間変動性の概念を, 対象間変動性の概念と統合した, 真に深い敵対的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:57:15 GMT)
Safe-Night VLA: Seeing the Unseen via Thermal-Perceptive Vision-Language-Action Models for Safety-Critical Manipulation [9.1] ロボットが見えないものを見ることができるマルチモーダル操作フレームワークであるSafe-Night VLAを提案する。
具体的には、Safe-Night VLAは、長波長赤外線熱知覚を事前訓練された視覚言語バックボーンに統合する。
我々は,フランカマニピュレータを用いた実世界の実験を通じて,我々の枠組みを検証する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:26:44 GMT)
Building AI Coding Agents for the Terminal: Scaffolding, Harness, Context Engineering, and Lessons Learned [9.1] この新しいパラダイムに特化して設計された,オープンソースのコマンドラインコーディングエージェントであるOPENDEVについて紹介する。
ワークロード特化モデルルーティングを備えた複合AIシステムアーキテクチャを通じて、これらの課題を克服する。
自動記憶システムを使用して、セッション間でプロジェクト固有の知識を蓄積し、命令フェードアウトに対処する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:21:08 GMT)
A Behaviour-Aware Federated Forecasting Framework for Distributed Stand-Alone Wind Turbines [9.1] 本稿では,2段階の連成学習フレームワークを提案する。
デンマークで400基のスタンドアローンタービンの実験により、DSSオートは行動的に一貫性のあるグループを発見し、競争力のある予測精度を達成することが示された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:12:40 GMT)
PACE: A Personalized Adaptive Curriculum Engine for 9-1-1 Call-taker Training [9.0] 9-1-1 コールテイクトレーニングには1000以上の相互依存スキルの習得が必要である。
このパーソナライゼーションの負担は、現在のプラクティスではスケールできないものです。
我々は、トレーナーの意思決定を強化するコパイロットシステムであるPACEを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:42:07 GMT)
Identifying Adversary Characteristics from an Observed Attack [9.0] 自動意思決定システムで使用される場合、機械学習(ML)モデルはデータ操作攻撃に対して脆弱である。
本稿では,攻撃者の特徴を識別する枠組みを提示し,実証した。
この課題に対処するために、最も可能性の高い攻撃者を特定するためのドメインに依存しないフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:32:36 GMT)
SAIL: Similarity-Aware Guidance and Inter-Caption Augmentation-based Learning for Weakly-Supervised Dense Video Captioning [9.0] Weakly-Supervised Video Captioningは、時間境界のないキャプションアノテーションだけで訓練されたビデオ内のイベントをローカライズし、記述することを目的としている。
横断的なアライメントによって意味的に認識されたマスクを構成するSAILを提案する。
類似性を認識したトレーニング対象は,イベントキャプションと高い類似性を持つ映像領域を強調するためにマスクをガイドする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:59:58 GMT)
From Risk Avoidance to User Empowerment: Reframing Safety in Generative AI for Mental Health Crises [8.8] メンタルヘルスの危機を経験した人々は、しばしば支援のためにオープンな生成AI(GenAI)チャットボットに目を向ける。
ほとんどのGenAIチャットボットは、開発者の責任を最小限に抑える方法で、危機状況に対応するように設計されています。
これらのケースにおける危機支援の維持は、有効な代替手段を持たないユーザを害し、さらなる支援を求めるモチベーションを低下させる可能性がある。
本稿では,AI危機支援のためのエンパワーメント指向設計原則を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:55:43 GMT)
Distributional Reinforcement Learning with Information Bottleneck for Uncertainty-Aware DRAM Equalization [8.7] 本稿では,Information Bottleneck潜在表現と条件付き値-アット・リスク最適化を組み合わせた分散型リスク感応型強化学習フレームワークを提案する。
本稿では,眼球図の51倍の速度アップを実現する速度歪み最適信号圧縮法を提案する。
提案するフレームワークは,検証済みの最悪の保証を伴って,生産規模の等化器最適化のための実用的なソリューションを提供することを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:34:25 GMT)
MultiShadow: Multi-Object Shadow Generation for Image Compositing via Diffusion Model [8.7] シームレスな画像合成には多対象影生成が不可欠である。
本稿では,複数の挿入対象に対して物理的に可塑性な影を合成することを目的とする。
提案手法は,事前学習したテキスト・ツー・イメージ拡散モデルのマルチモーダル機能を利用する。
実験により,本手法は単一オブジェクトと多オブジェクトの両方のシャドウ生成設定において,最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:53:15 GMT)
Challenges and Design Considerations for Finding CUDA Bugs Through GPU-Native Fuzzing [8.1] 異種システムにおけるメモリ安全性確保の鍵となる課題について検討する。
異種システムにおける悪用可能なバグの数は毎年増えているが、現在の緩和方法は不信な翻訳に依存することが多い。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:26:36 GMT)
A Practical Post-Quantum Distributed Ledger Protocol for Financial Institutions [8.1] 従来の金融機関は、分散台帳技術によって対処できる非効率性に直面している。
採用の大きな障壁は、公開トランザクションデータを取り巻くプライバシー上の懸念である。
本稿では,暗号台帳に対するポスト量子格子ベースのトランザクションスキームを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:54:12 GMT)
stratum: A System Infrastructure for Massive Agent-Centric ML Workloads [8.1] 大規模言語モデル(LLM)は、完全な機械学習(ML)パイプラインを生成し、検証し、最適化する。
既存のPythonベースのMLエコシステムは、Panda scikit-learnのようなライブラリを中心に構築されている。
パイプライン実行を計画と推論から分離する統合システムインフラストラクチャである Stratum を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:47:35 GMT)
Boosting ASR Robustness via Test-Time Reinforcement Learning with Audio-Text Semantic Rewards [8.1] ASR-TRAは、因果介入に触発された新しいテストタイム強化適応フレームワークである。
提案手法は,既存のTTAベースラインよりも低レイテンシを維持しながら高い精度を実現する。
我々のアプローチは、現実の状況に挑戦する上で、ASRシステムをデプロイするための実用的で堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:43:15 GMT)
Cultural Perspectives and Expectations for Generative AI: A Global Survey Approach [8.0] 本稿では,GenAIと関連する文化に関する理解と信念を,大規模グローバルサーベイから評価する。
我々はこれらのコミュニティから直接文化の作業的定義を蒸留し、その概念的複雑さを理解する。
我々は、文化とGenAI開発のための一連の勧告で締めくくります。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:25:31 GMT)
PCOV-KWS: Multi-task Learning for Personalized Customizable Open Vocabulary Keyword Spotting [8.0] 本稿では、パーソナライズされたカスタマイズ可能なオープン語彙キーワードスポッティング(PCOV-KWS)のためのマルチタスク学習フレームワークを提案する。
我々は、ソフトマックスに基づく損失とは異なるトレーニング基準を統合し、マルチクラス分類を複数のバイナリ分類に変換することで、カテゴリ間の競合を排除した。
複数のデータセットでPCOV-KWSシステムを評価し,評価結果のベースラインよりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:57:52 GMT)
On the Value of Tokeniser Pretraining in Physics Foundation Models [7.9] 本研究では,トークンプリトレーニングが物理シミュレーションの精度と効率に与える影響について検討する。
我々の知る限り、これは物理基礎モデルのためのトークンプリトレーニングに関する最初の体系的な研究である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:00:22 GMT)
Multi-label Instance-level Generalised Visual Grounding in Agriculture [7.8] 視覚的グラウンドリング(VG)は、言語で参照される物体をローカライズするものであり、農業では未探索である。
Weed-VGはマルチラベルの階層的関連性スコアと階層的リグレッションを組み込んだモジュラーフレームワークである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:55:52 GMT)
AI-Assisted Moot Courts: Simulating Justice-Specific Questioning in Oral Arguments [7.8] そこで我々は,モットコートスタイルのトレーニングにおいて,AIモデルが正義固有の質問を効果的にシミュレートできるかどうかを検討する。
本稿では,プロンプトベースおよびエージェントによる口頭弁論シミュレータの構築と評価を行う。
シミュレーションされた質問は、人間アノテータによって現実的と見なされることが多く、基礎的な真実の実質的な法的問題への高いリコールが達成されている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:45:28 GMT)
Act, Think or Abstain: Complexity-Aware Adaptive Inference for Vision-Language-Action Models [7.8] 認識状態の複雑さに基づいてVLA実行を動的にルーティングする適応型フレームワークを提案する。
我々のアプローチは、VLAの視覚言語バックボーンを、パラメトリックおよび非パラメトリック推定器のアンサンブルに潜伏埋め込みを投影することにより、アクティブな検出ツールに変換する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:14:41 GMT)
Improved Decoding of Quantum Tanner Codes Using Generalized Check Nodes [7.7] 量子タナー符号の復号化問題について検討する。
我々は、チェックノードをより強力な一般化されたチェックノードにグループ化することで、その基盤となるローカルコード構造を活用することを提案する。
本稿では,量子タナー符号に対する拡張一般化BPデコーダが,メモリ効果で標準4次BPデコーダを著しく上回ることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:52:38 GMT)
On the Strengths and Weaknesses of Data for Open-set Embodied Assistance [7.5] 身体的基礎モデルは、ロボット工学や自律運転のような現実世界の領域でますますパフォーマンスが向上している。
双方向のインタラクティブなデータ生成は、データ効率のよい一般化機能を提供するための有望な道を提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:10:47 GMT)
LEGS-POMDP: Language and Gesture-Guided Object Search in Partially Observable Environments [7.5] 部分観測可能環境(LEGS-POMDP)におけるLanguagEとgesture-Guided Object Search
本稿では,LanguagE と Gesture-Guided Object Search in partially Observable Environments (LEGS-POMDP)を紹介した。
シミュレーションでは、マルチモーダル融合は単調なベースラインを著しく上回り、挑戦的な環境や対象カテゴリーで平均89%の成功率を達成する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:04:23 GMT)
SSR-GS: Separating Specular Reflection in Gaussian Splatting for Glossy Surface Reconstruction [7.2] 本研究では,光沢表面再構成のための反射モデルフレームワークであるSSR-GSを提案する。
具体的には、直接スペクトル反射を効率的にモデル化するための事前フィルタMip-Cubemapを導入し、間接スペクトル反射を捉えるIndiASGモジュールを提案する。
合成と実世界の両方のデータセットの実験により、SSR-GSは光沢のある表面再構成において最先端の性能を達成することが示された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:24:13 GMT)
Diagnosing FP4 inference: a layer-wise and block-wise sensitivity analysis of NVFP4 and MXFP4 [7.2] 量子化は、大きな言語モデル(LLM)に対する高いリソース需要に対処し、メモリの圧力と帯域の混雑を軽減する。
本研究は, MXFP4とNVFP4の2種類のFP4フォーマットを3つのQ2.5モデルスケールで系統解析する。
ゲート・アンド・アテンション・プロジェクションはFP4量子化に対して適度かつ実質的には感度が低いのに対し、アップ・アンド・ダウン・プロジェクション・レイヤは感度の点で一貫して支配的であることが観察された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:23:36 GMT)
Gait Generation Balancing Joint Load and Mobility for Legged Modular Robots with Easily Detachable Joints [7.1] 移動中の過剰な関節トルクは、特に着脱可能な関節の機械的故障の重大なリスクを生じさせる。
NSGA-IIIアルゴリズムを用いて,必要な移動速度と安定性を維持しつつ,関節荷重を最小限に抑える最適化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:12:02 GMT)
Designing and Validating a Self-Aligning Tool Changer for Modular Reconfigurable Manipulation Robots [7.1] 再構成可能なロボットのための不整合耐性ツール交換システムを提案する。
このハードウェアは、受動的自己アライメントを利用したモータ駆動のカップリングを備えている。
自己調整機能が実行エラーをうまく吸収することを検証する実験。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:17:02 GMT)
Decoupling Task and Behavior: A Two-Stage Reward Curriculum in Reinforcement Learning for Robotics [7.1] 本稿では,タスク固有の目的を行動用語から切り離す2段階の報酬カリキュラムを提案する。
提案手法では,タスクのみの報酬関数でエージェントを訓練し,効果的な探索を確実にする。
我々は,DeepMind Control Suite,ManiSkill3,および補助的行動目的を含む移動ロボット環境に対するアプローチを検証する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:34:27 GMT)
TimeWarp: Evaluating Web Agents by Revisiting the Past [7.0] 当社では,UIや設計,レイアウトなどさまざまなコンテナ環境を使用して,Webの進化をエミュレートするベンチマークであるTimeWarpを紹介した。
実験の結果,Webエージェントによる変更に対する脆弱性と,シングルバージョン軌道上での行動クローニング(BC)の限界が明らかになった。
提案するTimeTrajは,複数バージョンにわたるトラジェクトリの収集に計画蒸留を用いる,シンプルで効果的なアルゴリズムである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:43:06 GMT)
Beyond Word Error Rate: Auditing the Diversity Tax in Speech Recognition through Dataset Cartography [6.9] そこで本研究では,本質的な人口動態と音響要因がモデル故障の原因となることを示す新しい指標であるサンプル難易度指標(SDI)を紹介する。
私たちの発見は、将来的な安全分析のための堅牢な監査フレームワークへの第一歩であり、開発者はデプロイ前に監査とASRの格差を監査できるようにします。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:16:48 GMT)
On the Statistical Optimality of Optimal Decision Trees [6.9] ランダムな設計の下で,世界規模で最適な経験的リスク最小化木に対する包括的統計理論を構築した。
まず,葉高が少なくとも$L$である木で達成可能な最適近似に対して,ERM推定器の過大なリスクを負う鋭いオラクル不等式を確立する。
新しい関数クラスよりも極小最大速度を導出する: 断片的にスパースな異方性ベソフ空間(PSHAB)である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:16:25 GMT)
MQED-QD: An Open-Source Package for Quantum Dynamics Simulation in Complex Dielectric Environments [6.9] 我々は,エキシトン力学をシミュレーションする堅牢な計算パッケージMQED-QD(Macroscopic Quantum Electrodynamics for Quantum Dynamics)を開発した。
正確な分子エクシトンダイナミクスをナノフォトニクスやプラズニクスと組み合わせることで、MQED-QDは強力なオープンソースパッケージを提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:06:03 GMT)
SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis [6.9] 右心温存生存データからヘテロジニアス治療効果(HTEs)を推定することは、ハイテイクな応用において重要である。
SurvHTE-Benchは、検閲された結果を伴うHTE推定のための最初の総合的なベンチマークである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:52:02 GMT)
Diffusion Policy through Conditional Proximal Policy Optimization [6.8] 拡散政策は、マルチモーダルな振る舞いをモデル化する強力な可能性を示している。
重要な課題は、拡散モデルの下でのアクションログのような計算の難しさである。
そこで本稿では,オンライン環境下での拡散政策を学習するための,新しい,効率的な手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:12:13 GMT)
Koopman Regularized Deep Speech Disentanglement for Speaker Verification [6.7] DKSD-AE(Deep Koopman Speech Disentanglement Autoencoder)
本稿では,複数ステップのKoopman演算子学習モジュールとインスタンス正規化を組み合わせた構造化オートエンコーダを提案する。
この結果から,コープマンに基づく時間モデルと実例正規化を組み合わせることで,話者中心の表現学習における効率的かつ原理的な解が得られることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:30:18 GMT)
Conformal Graph Prediction with Z-Gromov Wasserstein Distances [6.6] 教師付きグラフ予測は、出力が構造化グラフである回帰問題に対処する。
本稿では,グラフ値出力の共形予測フレームワークを提案し,構造化された出力空間における分布自由なカバレッジ保証を提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:56:44 GMT)
Balancing Privacy-Quality-Efficiency in Federated Learning through Round-Based Interleaving of Protection Techniques [6.6] 本稿では、差分プライバシー(DP)、同型暗号化(HE)、合成データを組み合わせたプライバシー保護学習(FL)フレームワークを提案する。
プライバシ・インターリービング(PI), DPを用いたシンセティック・インターリービング(SI/DP), HEによるシンセティック・インターリービング(SI/HE)の3つの新しい手法を提案する。
PIは高いプライバシー保護レベルにおいて最もバランスの取れたトレードオフを達成する一方、DPベースの手法は中間的プライバシー要件において好ましいことを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:28:51 GMT)
Competitive Multi-Operator Reinforcement Learning for Joint Pricing and Fleet Rebalancing in AMoD Systems [6.5] マルチオペレータ強化学習フレームワークを導入することで,競争が政策学習に与える影響について検討する。
複数の都市の実世界のデータを用いた実験は、競争が学習した振る舞いを根本的に変え、価格を下げ、艦隊の配置パターンを明確にすることを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:44:24 GMT)
Parallelization Strategies for Dense LLM Deployment: Navigating Through Application-Specific Tradeoffs and Bottlenecks [6.4] AIのブレークスルーは、大規模言語モデル(LLM)ベースのアプリケーションの爆発を加速させた。
センスモデルは、その強力な能力、スケーラビリティ、微調整の容易さ、さまざまなタスクにおける汎用性のために、引き続き支配的です。
本稿では,ノード内並列化方式に着目した2つの代表的高密度LLMの負荷について検討する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:33:24 GMT)
TransMASK: Masked State Representation through Learned Transformation [6.4] 人間はロボットを訓練してひとつの環境でタスクを完了させ、ロボットが新しい環境で同じタスクを実行することを期待する。
人間として、我々は環境のどの側面(すなわち状態)がタスクに関連しているかを知っている。
本稿では,その状態を関連する要素に偏った潜在表現に変換するマスクを学習するための自己教師型手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:45:46 GMT)
Distilling Formal Logic into Neural Spaces: A Kernel Alignment Approach for Signal Temporal Logic [6.4] 形式仕様の連続的ニューラル表現を学習するためのフレームワークを導入する。
シンボリックロバストネスカーネルをトランスフォーマーエンコーダに蒸留する。
エンコーダは1つのフォワードパスに埋め込みを生成し、計算コストのごく一部でカーネルのロジックを効果的に模倣する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:08:25 GMT)
Jailbreak Foundry: From Papers to Runnable Attacks for Reproducible Benchmarking [6.3] 本稿では,JAILBREAK FOUNDRY(JBF)について紹介する。
30回以上の攻撃を再現すると、JBFは平均(再現された報告された)攻撃成功率(ASR)を+0.26ポイントの偏差で高忠実度を達成する。
このシステムは、一貫したGPT-4o判定器を用いて、10の犠牲者モデルにわたる30の攻撃の標準AdvBench評価を可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:48:43 GMT)
Early Warning of Intraoperative Adverse Events via Transformer-Driven Multi-Label Learning [6.3] 術中不良事象の早期警戒は, 外科的リスクの低減と患者の安全性向上に重要な役割を担っている。
術中不良事象予測のための第1回Multi-label Adverse Events(MuAE)データセットを構築し,6つの重要な事象を網羅した。
改良されたTAFiLM(Time-Aware Feature-wise Linear Modulation)モジュールを組み合わせた,Transformerベースの多言語学習フレームワーク(IAENet)を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:20:40 GMT)
Selecting Spots by Explicitly Predicting Intention from Motion History Improves Performance in Autonomous Parking [6.3] 移動履歴から他のエージェントがどこに駐車するかを明示的に予測し,駐車場を選択するAVPパイプラインを提案する。
私たちの重要な洞察は、駐車において、運転規制がより怠慢である場合、多様であいまいな長期的な目標を推論するために明確な意図予測が不可欠であるということです。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 00:21:44 GMT)
EdgeDAM: Real-time Object Tracking for Mobile Devices [6.3] エッジデバイス上での単一オブジェクト追跡は、コンピュータビジョンの重要なタスクである。
近年, セグメンテーションをベースとしたトラッカーに注目が集まっている。
We propose EdgeDAM, a detection-guided tracking framework that improveed distractor-aware memory for bounding-box tracking。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:35:25 GMT)
Standardizing Access to Heterogeneous Quantum Backends: A Case Study on Cloud Service Integration with QDMI [6.2] ハードウェア抽象化のデファクトスタンダードの1つとして量子デバイス管理インターフェース(QDMI)が登場している。
本稿では、量子コンピューティングクラウドサービスであるAmazon BraketとQDMIの統合を実証するケーススタディを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:05:29 GMT)
Iterative On-Policy Refinement of Hierarchical Diffusion Policies for Language-Conditioned Manipulation [6.1] HD-ExpItは環境フィードバックによる階層的拡散ポリシーの反復的微調整のためのフレームワークである。
オフラインデータのみにトレーニングされた階層的なポリシを大幅に改善する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:34:43 GMT)
Environment-Aware Learning of Smooth GNSS Covariance Dynamics for Autonomous Racing [6.1] 我々は,測定共分散の時間的ダイナミクスを直接モデル化できる学習ベースのフレームワーク LACE を開発した。
AV-24自律レースカーに対する我々のアプローチを検証し、ローカライゼーション性能の向上とよりスムーズな共分散推定を実証した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:02:04 GMT)
Harnessing Synthetic Data from Generative AI for Statistical Inference [6.0] 本稿では, 統計学的観点から, 合成データ生成と利用の現況を概観する。
我々は,近代的な生成モデルの主要なクラス,それらのユースケース,およびそれらが提供するメリットについて調査する。
合成データを実観測用サロゲートとして処理した場合に発生する一般的な落とし穴について検討する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:24:41 GMT)
KindSleep: Knowledge-Informed Diagnosis of Obstructive Sleep Apnea from Oximetry [5.9] 臨床知識を単一チャンネルの患者固有のオキシメトリー信号や臨床データと統合してOSAの正確な診断を行う,深層学習フレームワークKindSleepを紹介した。
KindSleepはまず、生のオキシメトリー信号から直接、変性指標や呼吸障害などの臨床的に解釈可能な概念を識別することを学ぶ。
AHI(Apnea-Hypopnea Index)を推定するために、AIに由来する概念をマルチモーダルな臨床データと融合する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:00:34 GMT)
Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces [5.9] ATLASは、小さな言語モデルが大規模ツールスペース環境で効果的に動作できるようにする強化微調整フレームワークである。
まず、文脈制御と実行構造を学習可能な決定として扱う。
第2に,タスク成功を構造化されたタスク整合基準に分解する強化微調整を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:29:12 GMT)
Safer Reasoning Traces: Measuring and Mitigating Chain-of-Thought Leakage in LLMs [5.8] CoT(Chain-of-Thought)プロンプトは、個人識別可能な情報(PII)をプロンプトから推論トレースと出力に変換することで、プライバシーリスクを増大させる。
モデルに依存しないフレームワークを用いて, 直接的, 推論時のPIIリークについて検討する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:20:44 GMT)
Hamiltonian Lattice QED$_3$ with One and Two Flavors of Wilson Fermions: Topological Structure and Response [5.8] ハミルトンゲージ理論における散乱フェルミオンの離散化は、正確な時間反転対称性を持つことを示す。
本研究では、ガウスの法則を満たすU(1)ゲージ場に結合したフェルミオンの(2+1)D格子ハミルトニアンにおけるフェルミオンの離散化効果を分析する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:18:46 GMT)
Double-sphere enhanced optomechanical spectroscopy constrains symmetron dark energy [5.7] シンメトロンのようなスクリーニングされたスカラー場は、ダークエネルギーの実行可能な記述を提供するが、実験室による検出は依然として困難である。
共振器内の2つの光共振ナノ球を用いたシンメトロン相互作用を抑制するための光学的手法を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:04:07 GMT)
Real Faults in Model Context Protocol (MCP) Software: a Comprehensive Taxonomy [5.7] 本稿では,Model Context Protocol ベースのソフトウェアシステムにおける障害の大規模分類について紹介する。
これらの洞察は、より堅牢で信頼性があり、セキュアなAI対応ソフトウェアシステムの開発に役立てることができる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:47:26 GMT)
Infinite-Dimensional Closed-Loop Inverse Kinematics for Soft Robots via Neural Operators [5.6] キネマティック反転は純粋に幾何学的な問題であり、閉ループ逆キネマティックススキームによって効率的に解かれる。
CLIKの拡張は、コントローラが操作するためのアクティベーションからタスクスペースへのエンドツーエンドマッピングを導入することで、この問題に対処する。
無限次元領域でCLIKを定式化し、タスクを解きながらソフトロボット全体の形状を推論する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:09:57 GMT)
ARC-TGI: Human-Validated Task Generators with Reasoning Chain Templates for ARC-AGI [5.5] ARC-TGIは、様々なARC-AGIタスクをサンプリングするタスクファミリージェネレータのためのオープンソースのフレームワークである。
各タスクは自然言語入力と変換推論チェーンとペアリングされる。
すべてのジェネレータは人間の精細化と局所的な検証を行い、グリッドと推論の両方を維持する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:10:51 GMT)
Evaluating and Correcting Human Annotation Bias in Dynamic Micro-Expression Recognition [5.5] 本稿では,グローバル・アンチモノトニック・ディファレンシャル・セレクション・ストラテジーアーキテクチャを提案する。
本手法は,マイクロ圧縮の著しい変動を特徴とするオンセットフレームとApexフレームを同定する。
次にこれらを使用してオフセットフレームを決定し、リッチ時間動的表現を構築する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:28:51 GMT)
Transformer-Based Inpainting for Real-Time 3D Streaming in Sparse Multi-Camera Setups [5.4] 複数のカメラからの高品質な3Dストリーミングは多くのAR/VRアプリケーションにおいて没入感のある体験に不可欠である。
既存のアプローチは通常、穴埋めのための単純なテクスチャに依存しており、不整合や視覚的アーティファクトをもたらす可能性がある。
本稿では、新しいビューレンダリングの後、画像ベースの後処理ステップとして、基礎となる表現とは無関係に、新しいアプリケーションターゲットのインペイント手法を提案する。
我々は、同じリアルタイム制約の下で、最先端の塗装技術に対する我々のアプローチを評価し、我々のモデルが品質とスピードの最良のトレードオフを達成することを実証する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:59:59 GMT)
Critic in the Loop: A Tri-System VLA Framework for Robust Long-Horizon Manipulation [5.3] Critic in the Loopは動的VLM-Expertスケジューリングによって駆動される適応的階層型フレームワークである。
中心となるのは、グローバル推論のためのVLM脳、リアクティブ実行のためのVLA小脳、軽量な視覚的批判を含む、バイオニックなTri-Systemアーキテクチャである。
我々のアーキテクチャは、人間にインスパイアされたルールをシームレスに統合し、無限の再試行ループを直感的に破る。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:55:33 GMT)
HARP: HARmonizing in-vivo diffusion MRI using Phantom-only training [5.3] 本研究の目的は,深層学習に基づくdMRI調和フレームワークの開発である。
Harpは、容易に輸送可能な拡散ファントムに基づいてトレーニングされた、ボクセルの1Dニューラルネットワークを使用している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:38:41 GMT)
NL2GDS: LLM-aided interface for Open Source Chip Design [5.3] NL2GDSは、自然言語記述を合成可能なRTLに変換し、オープンソースのOpenLane ASICフローを介してGDSIIレイアウトを完成させるフレームワークである。
LLMは複数のエンジンを用いてHDLを生成し、それらを検証し、自動合成とレイアウトを編成する。
ISCAS'85 と ISCAS'89 のベンチマーク設計の評価では、標準設計と比較して36% の面積削減、35% の遅延削減、70% の省電力が示されている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:55:54 GMT)
Asymptotic Behavior of Multi--Task Learning: Implicit Regularization and Double Descent Effects [5.3] マルチタスク学習は、複数の関連するタスクで共有される共通情報を活用することにより、一般化エラーを改善する。
マルチタスク学習における課題の1つは、異なるが関連するタスク間で共有される共通情報を発見できる定式化を特定することである。
本稿では, パーセプトロン学習モデルに付随する, 一般的なマルチタスクの定式化について, 正確に解析する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:14:46 GMT)
Behavior-dLDS: A decomposed linear dynamical systems model for neural activity partially constrained by behavior [5.2] 動作分解された線形力学系(b-dLDS)を同時に記録したサブシステムから切り離すために提案する。
我々は,b-dLDSが制御されたシミュレーションデータ上での動作と内部計算を分離できることを実証する。
b-dLDSは、ゼブラフィッシュの後脳の大規模記録に我々のモデルを適用することで、さらに数万のニューロンにスケールアップできることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:11:42 GMT)
WebChain: A Large-Scale Human-Annotated Dataset of Real-World Web Interaction Traces [5.2] WebChainは、現実世界のWebサイト上で、人間の注釈付きトラジェクトリの最大のオープンソースデータセットである。
私たちの仕事は、次世代のスケーラブルなWebエージェントを構築し、厳格に評価するために必要なデータと洞察を提供します。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:37:34 GMT)
K-Gen: A Multimodal Language-Conditioned Approach for Interpretable Keypoint-Guided Trajectory Generation [5.1] K-Genは、自律運転シミュレーションのための解釈可能なキーポイント誘導マルチモーダルフレームワークである。
解釈可能なキーポイントと、エージェントの意図を反映した推論を生成し、それを正確な軌道に洗練する。
WOMDとnuPlanの実験は、K-Genが既存のベースラインより優れていることを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:48:12 GMT)
Optimal Decoding with the Worm [5.0] マルコフチェインモンテカルロアルゴリズムを用いたマッチング可能なqLDPC符号のための新しいデコーダを提案する。
このアルゴリズムは、表面符号、ハニカムフロッケ符号、双曲曲面符号のランダムな誤りを一定速度で復号する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:51:27 GMT)
SLO-Aware Compute Resource Allocation for Prefill-Decode Disaggregated LLM Inference [5.0] Prefill-Decode (P/D) のデアグリゲーションは,Large Language Model (LLM) 推論の最適化戦略として広く採用されている。
現在、最適なP/Dハードウェアリソース数を決定するための確立された方法論は存在しない。
理論的モデリングと経験的ベンチマークを組み合わせたハイブリッドアプローチを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:41:09 GMT)
Berta: an open-source, modular tool for AI-enabled clinical documentation [4.9] 商用AIは、医師1人あたり月額99~600ドルで、不透明なシステムとして運用され、施設のインフラにデータを返さない。
私たちは、AI対応の臨床ドキュメントのためのオープンソースのモジュラー・スクライブ・プラットフォームであるBertaを開発した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:17:21 GMT)
Accelerating Sampling-Based Control via Learned Linear Koopman Dynamics [4.9] 本稿では、複雑な非線形力学を持つシステムに対する効率的なモデル予測経路積分(MPPI)制御フレームワークを提案する。
軌道伝播に使用される非線形ダイナミクスを学習された線形深度クープマン作用素(DKO)モデルに置き換え、より高速なロールアウトとより効率的な軌道サンプリングを可能にする。
コントローラはMPPI-DKと呼ばれ、四足歩行ロボットの基準追跡実験を通じてハードウェア上で検証される。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:15:52 GMT)
Model Change for Description Logic Concepts [4.8] 本稿では,ポイント解釈として表現されたモデルに照らして記述論理の概念を変更することの問題点を考察する。
モデルのみを除去する消去,モデルを組み込んだ受信,1つの操作にモデルを組み込んだリビジョンという3つの主な変更点を区別する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:55:43 GMT)
Agents Learn Their Runtime: Interpreter Persistence as Training-Time Semantics [4.8] ツール拡張LDMは、自然言語推論と実行可能なPythonアクションをインターリーブするエージェントとして、ますます多くデプロイされている。
インタプリタの永続化は単に実行時の足場なのか、それともエージェントがインタープリタの使い方を学習する方法を形作るトレーニングデータの特性なのかを問う。
ワンショットソリューションを避けるために設計された、部分的に観測可能な最適化タスクの手続き的に生成されたファミリーであるOpaque Knapsackを紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:07:31 GMT)
Knowledge-informed Bidding with Dual-process Control for Online Advertising [4.7] オンライン広告におけるバイアス最適化は、歴史的データから入札決定を学ぶブラックボックス機械学習モデルに依存している。
これらのアプローチは、人間の専門家の適応性、経験駆動、そして世界的な一貫性のある決定を再現することができない。
本稿では,提案手法であるKBD (Knowledge-informed Bidding with Dual-process Control)を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:05:28 GMT)
A Geometry-Adaptive Deep Variational Framework for Phase Discovery in the Landau-Brazovskii Model [4.7] パターン形成システムのための幾何適応型深部変分フレームワーク(GeoDVF)を提案する。
ドメインサイズを変分定式化のトレーニング可能な変数として明示的に扱うことで、GeoDVFはトレーニング中の人工ストレスを自然に排除する。
また,GeoDVFは,従来の知識を使わずに,安定状態と準安定状態の両方を識別できる頑健かつ幾何整合な変分分解器を提供することを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:32:23 GMT)
Guidelines for the Annotation and Visualization of Legal Argumentation Structures in Chinese Judicial Decisions [4.7] 本ガイドラインでは,司法判断における法的議論の構造を表現するための体系的かつ運用的なアノテーションフレームワークを提案する。
司法推論の論理的構造を明らかにし、計算分析のための信頼性のあるデータ基盤を提供することを目的としている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:39:54 GMT)
Predicting Atomistic Transitions with Transformers [4.5] 機械学習モデルは、高速な代理モデルとして原子遷移を管理する複雑な創発的行動を学ぶことができる。
ナノクラスターの原子遷移を予測するためにトランスフォーマーをどのように訓練するかを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:09:58 GMT)
Model Medicine: A Clinical Framework for Understanding, Diagnosing, and Treating AI Models [4.4] モデル医学は、AIモデルの障害を理解し、診断し、治療し、予防する科学である。
本稿では,現在のAI解釈可能性研究と体系的な臨床実践のギャップを埋める研究プログラムとしてモデル医学を紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:49:29 GMT)
Diffusion LLMs can think EoS-by-EoS [4.3] 拡散モデルはEoS-by-EoS,すなわち,EoSトークンの表現を隠れスクラッチパッドとして利用することを示す。
本研究では,LLaDA1.5,LLaDA2.0-mini,Dream-v0の拡散モデルについて実験を行った。
我々は、EoSトークンの隠れ状態と反ファクト生成の状態をパッチし、生成した出力を反ファクトに頻繁に変更する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:06:21 GMT)
HALP: Detecting Hallucinations in Vision-Language Models without Generating a Single Token [4.3] 幻覚は視覚言語モデル(VLM)にとって永続的な課題である。
モデルの内部表現を1つの前方通過で探索することにより,トークンが発生する前に幻覚リスクを予測できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:36:31 GMT)
Causally Robust Reward Learning from Reason-Augmented Preference Feedback [4.2] ReCouPLeは、自然言語の合理性を利用して、欠落した因果信号を提供する軽量フレームワークである。
私たちの学習した報酬モデルは、明確な理由に基づいて好みを定め、ユーザの意図に合うようにし、刺激的な機能を超えて一般化することができます。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:35:21 GMT)
A Pivot-Based Kirigami Utensil for Hand-Held and Robot-Assisted Feeding [4.2] 切りスプーンは、道具の形状を変え、食べ物のモッセルを囲むように一対のプライヤのように振る舞う。
障害のある成人とパーキンソン病の高齢者は、キリスプーンが彼らのニーズを満たしたと報告した。
ハンドヘルドされたバージョンは、わずか4つの3Dプリント部品でできています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:08:40 GMT)
The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok [4.1] デジタルサービス法(DSA)第28条(2)は、未成年者へのプロファイリングに基づく広告を禁止している。
我々は、TikTokのアルゴリズムによる監査を通じて、この定義ギャップが実際にどのように機能するかを示す最初の実証的な証拠を提供する。
未成年者を保護するためには、ブランド/インフルエンサーマーケティングを含むために、広告の規制定義を拡大する必要があると論じる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:02:48 GMT)
Autoscoring Anticlimax: A Meta-analytic Understanding of AI's Short-answer Shortcomings and Wording Weaknesses [4.1] 本研究は, 子どもの筆記作品の採点作業において, 人的専門家の難易度は, LLMの成績に統計的に影響を及ぼさないことを示した。
具体的には,人間の得点者によって測定される最も簡単なスコアリングタスクが,LSMにとって最も難しいものであることを示す。
発見者は、自己回帰モデルの既知の統計的欠点を予想するシステム設計を主張する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:11:08 GMT)
Non-commutative Index of Measurement-only Entanglement Phase Transition [4.0] 測定専用力学における非可換性の役割について検討する。
本研究は,測定のみの絡み合い相転移の背後にある基本的なメカニズムの理解を深めるものである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:42:02 GMT)
From Phase Grounding to Intelligent Surgical Narratives [4.0] ビデオ手術のタイムラインは、外科医が手術の重要な部分に集中できるため、ツール補助手術の重要な部分である。
現在の方法では、外科医が手術後の報告(OP)を記入するが、これはしばしば曖昧であり、手動で手術ビデオに注釈を付ける。
本手法は,手術映像から直接,手術スケジュールと物語を自動生成することを目的としている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:44:24 GMT)
Recurrent Graph Neural Networks and Arithmetic Circuits [4.0] 本稿では,実数上での演算回路を用いて,繰り返しグラフニューラルネットワーク(GNN)の計算能力の特徴付けを行う。
本稿では、逐次回路や論理回路の算術類似体として見ることのできる、逐次演算回路のモデルを紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:10:27 GMT)
Reckless Designs and Broken Promises: Privacy Implications of Targeted Interactive Advertisements on Social Media Platforms [4.0] ソーシャルメディアプラットフォームTikTok、Facebook、Instagramは、サードパーティーがターゲット広告キャンペーンをプラットフォーム内でセンシティブな属性で実行できるようにする。
このプラットフォームレベルのデザイン選択は、広告主が広告と対話する人のプロフィールを見ることができるように、プライバシーの抜け穴を生じさせる。
この行動は、プラットフォームが広告主からユーザーデータを隠蔽するという約束と矛盾している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:24:59 GMT)
A Unified Framework for Joint Detection of Lacunes and Enlarged Perivascular Spaces [3.9] 脳小血管疾患(CSVD)マーカー,特にEPVSとlacunaeは,医用画像解析においてユニークな課題である。
本稿では,Zero-Gated CrossTask Attention が高密度EPVSコンテキストを利用してスパースラグーン検出を誘導する形態分離フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:19:39 GMT)
An Exploration-Analysis-Disambiguation Reasoning Framework for Word Sense Disambiguation with Low-Parameter LLMs [3.9] Word Sense Disambiguation (WSD)は、自然言語処理(NLP)における重要な課題である。
本研究では,低パラメータ大言語モデル(4Bパラメータ)が微調整戦略により同等の結果が得られるかどうかを検討する。
以上の結果から,Chain-of-Thought(CoT)に基づく推論と近接語解析を併用することで,ゼロショット設定でGPT-4-Turboに匹敵する性能が得られることがわかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:27:42 GMT)
VisionPangu: A Compact and Fine-Grained Multimodal Assistant with 1.7B Parameters [3.9] VisionPanguは、詳細な画像キャプションを改善するために設計されたコンパクトなマルチモーダルモデルである。
我々のモデルは、InternVLから派生したビジョンエンコーダと軽量プロジェクタを介してOpenPangu-Embedded言語バックボーンを組み合わせる。
DOCCIデータセットからの詳細な人間による記述を取り入れることで、VisionPanguは、積極的なモデルスケーリングに頼ることなく、セマンティックコヒーレンスと記述豊かさを改善している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:51:33 GMT)
Measuring the Fragility of Trust: Devising Credibility Index via Explanation Stability (CIES) for Business Decision Support Systems [3.9] 本稿では,説明安定度(CIES)による信頼度指数(Credibility Index)について紹介する。
CIESは、予測自体だけでなく、予測の背後にある理由が一貫しているかどうかをキャプチャする。
その結果、モデル複雑性は説明信頼性に影響を与え、SMOTEによるクラス不均衡処理は予測性能だけでなく、説明安定性にも影響を及ぼすことが示された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:11:55 GMT)
Learning Optimal Distributionally Robust Individualized Treatment Rules Integrating Multi-Source Data [3.8] 共依存分布不確実性集合に対する最悪の政策値を最大化する情報ベース分散堅牢ITR(PDRO-ITR)を提案する。
PDRO-ITR推定器のリスクバウンダリを確立し、最悪の場合の堅牢な性能を保証する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:33:52 GMT)
Towards 3D Scene Understanding of Gas Plumes in LWIR Hyperspectral Images Using Neural Radiance Fields [3.8] LWIR(Longwave Infrared) HSIは、ガス配管の検出と分析に使用することができる。
複数の画像からの情報を単一の表現に組み合わせることで、分析が強化される可能性がある。
NeRFはボリュームシーン特性の潜在神経表現を生成する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:44:45 GMT)
PersianPunc: A Large-Scale Dataset and BERT-Based Approach for Persian Punctuation Restoration [3.8] 自動音声認識出力の可読性とダウンストリーム性を改善するためには,句読解回復が不可欠である。
ペルシャ語句読点復元のための高品質な1700万サンプルデータセットであるペルシャ語句読点(ペルシャ語句読点復元)を紹介した。
我々は,句読取復元をトークンレベルのシーケンスラベリングタスクとファインチューンParsBERTとして定式化し,高い性能を実現する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:55:55 GMT)
Exploiting Intermediate Reconstructions in Optical Coherence Tomography for Test-Time Adaption of Medical Image Segmentation [3.8] プライマリ・ヘルス・ケアは、しばしば安価な撮像装置に頼っている。
このようなアルゴリズムは、ドメイン固有の事前知識を組み込んだ反復的再構成手法を用いるのが一般的である。
凍結下流ネットワークの正規化層パラメータを適応させることにより,これらの中間表現をテスト時に活用するIRTTAを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:48:37 GMT)
Longitudinal Lesion Inpainting in Brain MRI via 3D Region Aware Diffusion [3.8] Denoising Diffusion Probabilistic Models (DDPM) に基づく新しい3次元縦塗装フレームワークを提案する。
我々のモデルは、知覚的忠実度の観点から、主要なベースライン(FastSurfer-LIT)を著しく上回ります。
このフレームワークは,LITが要求する24.30分に対して,平均処理時間2.53分を実現し,約10倍の高速化を実現している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:34:47 GMT)
Task-Relevant and Irrelevant Region-Aware Augmentation for Generalizable Vision-Based Imitation Learning in Agricultural Manipulation [3.7] 本稿では,農業操作における視覚に基づく模倣学習のためのDRAIL(Dual-Region Augmentation for Imitation Learning)を提案する。
DRAILは視覚的観察をタスク関連領域とタスク関連領域に分離する。
DRAILは、両方の視覚的変化の源泉を共同で扱うことにより、偶発的な視覚的手がかりではなく、タスクの意味的な特徴に依存する学習ポリシーを促進する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:53:31 GMT)
A Novel Hybrid Heuristic-Reinforcement Learning Optimization Approach for a Class of Railcar Shunting Problems [3.7] 鉄道車両の絞首刑は貨物鉄道の中核的な計画課題である。
両側の線路はキュー構造のように機能し、一方の端からレールカーを追加して反対側から除去することができる。
本稿では,鉄道固有のソリューションアプローチと強化学習手法を統合するハイブリッド・ヒューリスティック・強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:49:17 GMT)
LAW & ORDER: Adaptive Spatial Weighting for Medical Diffusion and Segmentation [3.7] Learnable Adaptive Weighter (LAW) は拡散訓練のための特徴とマスクから画素当たりの損失変調を予測する。
ORDERは、効率的なセグメンテーションのために、遅延デコーダ段階で選択的双方向スキップ注意を適用する。
ポリープおよび腎腫瘍データセットの実験により、LAWは20%のFID産生改善を達成することが示された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:20:32 GMT)
Low-depth amplitude estimation via statistical eigengap estimation [3.7] 振幅推定は、実効ハミルトニアンのエネルギーギャップを推定することと同値である。
ハイゼンベルク限定回路と低深度回路の2つの振幅推定アルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:45:52 GMT)
Detection of Illicit Content on Online Marketplaces using Large Language Models [3.6] 本研究では,Large Language Models (LLMs) の不正なオンラインマーケットプレースコンテンツの検出と分類における有効性について検討する。
LLMは、基本的なトランスフォーマーベースモデル(BERT)と従来の機械学習ベースラインに対してベンチマークされた。
Llama 3.2は、40の特定の不正なカテゴリを含む複雑で不均衡なマルチクラス分類において、すべてのベースラインモデルを大きく上回った。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:15:03 GMT)
The Value of Graph-based Encoding in NBA Salary Prediction [3.6] 裁判所データのオン/オフで知識グラフを構築し、そのグラフをベクトル空間に埋め込むことで、教師あり学習者が給与に影響する要因の景観をよりよく理解できることを示す。
いくつかのグラフ埋め込みアルゴリズムを比較し、そのようなプロセスがNBAの給与予測に不可欠であることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:46:10 GMT)
Engineering Regression Without Real-Data Training: Domain Adaptation for Tabular Foundation Models Using Multi-Dataset Embeddings [3.6] TREDBenchは、83の現実世界のレグレッションデータセットのキュレートされたコレクションで、専門家のエンジニアリング/非エンジニアリングラベルが組み込まれています。
標準的な手続き的に生成されたデータセットは、エンジニアリングデータセットと非常に区別され、実質的なドメインギャップがかなり浮かび上がっている。
本研究では, 組込み誘導型合成データキュレーション手法を提案する。我々は, 「エンジニアリングライクな」合成データセットを生成し, 選択した合成タスクのみを用いてTabPFN 2.5の継続事前学習を行う。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 00:13:35 GMT)
Quantum Key Distribution Secured Federated Learning for Channel Estimation and Radar Spectrum Sensing in 6G Networks [3.5] BB84スタイルのプロトコル抽象化とペアワイズ・アダプティブ・マスクを使用してクライアントのローカルモデルをトレーニングする。
実験の結果、安全FL NMSEはチャネル推定で0.216、精度で92.1%、レーダーセンシングで0.72 mIoUを達成した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:50:27 GMT)
Learning Causal Structure of Time Series using Best Order Score Search [3.4] 観測データから学ぶ因果構造は多くの科学的・政策的な領域の中心である。
多くの分野に共通する時系列設定は、時間的依存のためにいくつかの課題を引き起こす。
最近提案されたBest Order Score Search(BOSS)の時系列拡張であるTS-BOSSを紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:54:20 GMT)
Cognitive Warfare: Definition, Framework, and Case Study [3.4] 本稿では、認知戦の統一的な定義を提案し、OODAループに根ざした相互作用フレームワークを導入し、認知優位性に関連する測定可能な属性を同定する。
フレームワークの使用を説明するために、論文ケーススタディでは、これらの概念が、競合する環境における認知的攻撃と防御を評価するためにどのように適用できるかを実証している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:34:44 GMT)
MIRACL: A Diverse Meta-Reinforcement Learning for Multi-Objective Multi-Echelon Combinatorial Supply Chain Optimisation [3.3] 階層型メタMORLフレームワークであるMIRACLを導入し、多様なタスクにまたがる数ショットの一般化を可能にする。
MIRACL は従来の MORL のベースラインを単純から中程度のタスクで上回り、最大10% の高ボリュームを実現し、5% のより良いユーティリティを実現している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:42:26 GMT)
Behaviour Driven Development Scenario Generation with Large Language Models [3.3] 本稿では,3つのLCM,GPT-4,Claude 3,Geminiについて,自動振る舞い駆動開発シナリオ生成のための評価を行った。
私たちは4つのプロプライエタリなソフトウェア製品から引き出された500のユーザストーリ、要件記述、それに対応するBDDシナリオのデータセットを構築しました。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:05:48 GMT)
False traps on quantum-classical optimization landscapes [3.2] 擬似トラップは十分なパラメータをもったままランドスケープに現れることを示す。
偽のトラップの出現は、目的関数における状態または演算子間の識別可能性の喪失と関連している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:03:09 GMT)
Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics [3.1] 球飛行データにアクセスせずに、単眼の3Dポーズシーケンスから8種類のピッチタイプを分類する。
我々のパイプラインは、自動ピッチングイベント検出による拡散ベースの3Dポーズバックボーンをチェーンする。
119,561個のプロピッチでボディキネマティクスのみを用いて80.4%の精度を実現した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:04:35 GMT)
Why Smaller Is Slower? Dimensional Misalignment in Compressed LLMs [3.1] トレーニング後の圧縮は、GPU性能を低下させる不規則なテンソル次元を生成する。
フレームワーク,ライブラリ,ハードウェアの3レベルにおいて,根本原因のフルスタック解析を行う。
我々は,任意の次元低減圧縮機をラップする新しい圧縮パラダイムである textbfGAC (GPU-Aligned Compression) を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:50:39 GMT)
FreeTxt-Vi: A Benchmarked Vietnamese-English Toolkit for Segmentation, Sentiment, and Summarisation [3.1] FreeTxt-Viは、ベトナム語のバイリンガルなテキストコレクションを作成し分析するための、フリーでオープンソースのWebベースのツールキットである。
システムは、コーパス分析機能、例えばコンコーディネートキーワード分析語句関係探索と対話的視覚化と、感情分析と要約のためのトランスフォーマーベースのNLPコンポーネントを組み合わせる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:26:08 GMT)
MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis [3.1] 現在の基礎モデルは3億の視覚的パラメータを超える。
標準的な知識蒸留は、このような極端な容量ギャップの下で失敗する。
本稿では, 対角成分と対角成分に分解する選択的反発的知識蒸留法を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:43:00 GMT)
Incremental Graph Construction Enables Robust Spectral Clustering of Texts [3.0] 隣接グラフは、テキスト埋め込みのスペクトルクラスタリングにおいて重要なステップであるが、しばしば脆弱なステップである。
簡単な$k$-NNグラフ構造を導入し、設計による接続性を維持する。
標準の$k$-NNグラフと比較すると、解接続されたコンポーネントが一般的であるロー・$k$レジームでは、我々のメソッドは優れています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:53:57 GMT)
NERdME: a Named Entity Recognition Dataset for Indexing Research Artifacts in Code Repositories [3.0] 既存の情報抽出(SIE)データセットは、科学論文に重点を置いており、コードリポジトリの実装レベルの詳細を見落としている。
NERdMEは、1万以上のラベル付きスパンと10のエンティティタイプを持つ200以上の手動でアノテートされたファイルである。
大規模言語モデルと微調整トランスフォーマーを用いたベースライン結果からは,紙レベルと実装レベルのエンティティの明確な違いが示されている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:21:09 GMT)
SEA-TS: Self-Evolving Agent for Autonomous Code Generation of Time Series Forecasting Algorithms [3.0] Self-Evolving Agent for Time Series Algorithms (SEA-TS)は、予測コードを自動生成、検証、最適化するフレームワークである。
筆者らのフレームワークでは,(1)固定報酬を正規化された優位点に置き換えたMA-MCTS(Metric-Advantage Monte Carlo Tree Search),(2)各実行済みソリューションが自動レビューを行い,修正パターンをエンコードし,類似エラーの再発を防止した即時更新を行うコードレビュー,(3)グローバルステアブル推論(Global Steerable Reasoning)という3つの重要なイノベーションを紹介した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:02:17 GMT)
Scalable Injury-Risk Screening in Baseball Pitching From Broadcast Video [3.0] 放送映像から臨床的に関連のある18のバイオメカニクス指標を回収する単眼ビデオパイプラインを提案する。
提案手法はDreamPose3Dをベースとして,骨盤軌道を回復するドリフト制御のグローバルリフトモジュールを導入する。
これらの指標をケガ予測に用いた自動スクリーニングモデルは、トミー・ジョン手術のAUC 0.811と、7,348ピッチャーの腕の重傷の0.825を達成している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:38:32 GMT)
Differential Privacy in Two-Layer Networks: How DP-SGD Harms Fairness and Robustness [2.9] 本稿では,差分的にプライベートな勾配の特徴学習ダイナミクスを解析するための統合された特徴中心フレームワークを提案する。
プライバシに要求されるノイズが,最適機能学習ネットワークにつながることを実証する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:19:31 GMT)
ThaiSafetyBench: Assessing Language Model Safety in Thai Cultural Contexts [2.8] ThaiSafetyBenchは、タイ語で書かれた1,954の悪意のあるプロンプトからなるオープンソースのベンチマークである。
このデータセットは、タイの文化的、社会的、文脈的なニュアンスに明確に根ざした一般的な有害なプロンプトと攻撃の両方をカバーしている。
以上の結果から,クローズド・ソース・モデルはオープンソース・モデルに比べて安全性が向上することが示された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:35:50 GMT)
Dynamic Targeting of Satellite Observations Using Supplemental Geostationary Satellite Data and Hierarchical Planning [2.8] ダイナミックターゲティング(Dynamic Targeting, DT)は、衛星観測において、視線センサーが今後の環境に関する情報を収集する手法である。
これまでの研究によると、DTはアプリケーション間の科学的なリターンを増大させる可能性がある。
静止衛星からストリーミングされた補足データを用いてDTシステムの性能を向上する方法について述べる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:03:02 GMT)
An interpretable prototype parts-based neural network for medical tabular data [2.8] 本稿では,診断結果規範の離散化を必要とする表型データ,特に医療記録に適した新しいモデルを提案する。
空間構造に依存した当初の視覚モデルとは異なり、本手法では患者を記述した特徴に対してトレーニング可能なパッチを適用する。
これにより、モデルはプロトタイプを可読な言葉で表現することができ、臨床言語やケースベースの推論と一致させることができる。
提案するニューラルネットワークは本質的に解釈可能であり,ネットワークの潜在空間における学習プロトタイプと患者の記述を比較して解釈可能な概念に基づく予測を提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:43:32 GMT)
FireBench: Evaluating Instruction Following in Enterprise and API-Driven LLM Applications [2.8] 実世界のエンタープライズおよびAPI利用パターンをベースとしたLCM命令に続くベンチマークであるFireBenchを紹介する。
FireBenchは、情報抽出、カスタマーサポート、コーディングエージェントなど、さまざまなアプリケーションにわたる6つのコア機能ディメンションを評価している。
企業シナリオにおけるその後の行動の指示に関する重要な知見を提示する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:25:50 GMT)
Using Laplace Transform To Optimize the Hallucination of Generation Models [2.8] 我々は、制御理論のレンズを通して、生成モデル(GM)を力学系のクラスとして定式化する。
我々は制御理論の知識を用いてシステム機能とシステム応答を分析する。
トレーニングの進捗は対応するシステム応答と一致していることが分かり、より良い最適化コンポーネントを開発するための有用な方法が得られます。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:45:11 GMT)
ICHOR: A Robust Representation Learning Approach for ASL CBF Maps with Self-Supervised Masked Autoencoders [2.7] 動脈スピンラベリング(ASL)灌流MRIは局所脳血流の直接定量化を可能にする。
ICHORは、ASL CBFマップのための自己教師付き事前学習アプローチであり、3次元マスク付きオートエンコーダを用いて転送可能な表現を学習する。
我々はこれまでで最大のASLデータセットの1つをキュレートし、複数のサイトと取得プロトコルにまたがる14の研究から11,405のASL CBFスキャンを行った。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:01:11 GMT)
Efficient Path Generation with Curvature Guarantees by Mollification [2.6] 本稿では,非微分可能関数を正規化し,モーフィフィケーションによって実現可能な経路を生成する手法を提案する。
具体的には、任意の精度で収束できる微分可能な関数を持つ任意の経路を近似する。
提案手法は標準手法よりも解析的に効率的であり,マイクロコントローラのリアルタイム実装を可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:41:45 GMT)
NaiLIA: Multimodal Nail Design Retrieval Based on Dense Intent Descriptions and Palette Queries [2.6] 本研究は,高密度な意図記述に基づく爪デザイン画像の検索作業に焦点をあてる。
NaiLIAはネイルデザイン画像のマルチモーダル検索手法である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:12:29 GMT)
MCEL: Margin-Based Cross-Entropy Loss for Error-Tolerant Quantized Neural Networks [2.6] ビットエラーに対するロバスト性は、新興の近似コンピューティングプラットフォームでニューラルネットワーク(NN)を使用する上で重要な要件である。
NNにおけるビットエラー耐性を実現するための一般的なアプローチは、事前に定義されたエラーモデルに従ってトレーニング中にビットフリップを注入することである。
本研究では,NNが誤り認識学習に頼らずにビット誤りを許容する機構について検討する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:58:30 GMT)
Data-Driven Control of a Magnetically Actuated Fish-Like Robot [2.6] 磁力で動く魚のようなロボットは、小型化と機敏さのために水中探査に有望なソリューションを提供する。
本稿では、解析モデルに頼ることなく、これらの複雑さに対処するデータ駆動制御フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:08:08 GMT)
Visioning Human-Agentic AI Teaming: Continuity, Tension, and Future Research [2.6] オープンエンドアクショントラジェクトリが可能なエージェントシステムは、人間とAIのコラボレーションに構造的不確実性をもたらす。
チーム状況認識(Team situation Awareness, チームSA)理論は、共有された認識が一度達成されれば、反復的な更新を通じて協調された行動をサポートすると仮定する。
まず、オープン・エンド・エージェンシーの下で、人間とAIの両方の認識を再認識するためにTeam SAを拡張します。
第二に、リレーショナルインタラクション、認知学習、調整と制御において、伝統的にチームの安定化を前提とした動的なプロセスが、適応的な自律の下で機能し続けるかどうかを問う。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:40:42 GMT)
Fusion-CAM: Integrating Gradient and Region-Based Class Activation Maps for Robust Visual Explanations [2.5] モデル予測に影響を与える入力領域を可視化するために,クラス活性化マップ(CAM)法が広く採用されている。
グラディエントベースのアプローチ(Grad-CAMなど)は、クラスアクティベーションの計算によって高度に識別され、きめ細かな詳細を提供する。
地域ベースのアプローチ(例えば、Score-CAM)は、広範囲にわたる情報を集約し、オーバースムーシングのコストで広範囲のオブジェクトカバレッジをキャプチャする。
我々は、この説明的ギャップを橋渡しする新しいフレームワークであるFusion-CAMを紹介します。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:16:29 GMT)
Mining Beyond the Bools: Learning Data Transformations and Temporal Specifications [2.5] よりリッチなデータタイプを操作するために、マイニング手順を拡張します。
我々は,OpenAI-Gymnasium ToyText環境上でのマイニング仕様からリアクティブプログラムを実演する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:56:25 GMT)
Introducing the transitional autonomous vehicle lane-changing dataset: Empirical Experiments [2.5] 過渡的な自動運転車(tAV)は、人力自動車(HDV)と道路をますます共有している
新しいパターンは、交通の安定性と安全性に影響を及ぼす可能性がある。
本研究はノースカロライナ・トランジショナル・オートマチック・ビークル・レーン・チャンキング・データセットを紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:15:48 GMT)
Ansatz-Free Learning of Lindbladian Dynamics In Situ [2.4] 先行構造や局所性を仮定することなく,スパークスなリンドブラディアンを学習するための,最初のサンプル効率のよいプロトコルを提案する。
本プロトコルはアンシラフリーであり, 製品状態とパウリ基底測定のみを使用し, ほぼ最適時間分解能を実現する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:57:25 GMT)
TumorFlow: Physics-Guided Longitudinal MRI Synthesis of Glioblastoma Growth [2.4] グリオ芽腫は多彩で浸潤性があり、患者固有の成長パターンを示し、通常のMRIでは部分的にしか見えない。
本研究では, 生物学的に現実的な3次元脳MRI量を推定, 空間的に連続した腫瘍集中場から合成するバイオ物理条件生成フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:55:34 GMT)
LTLGuard: Formalizing LTL Specifications with Compact Language Models and Lightweight Symbolic Reasoning [2.4] 自然言語のあいまいさと可変性(NL)のため、非公式な要件を形式的な仕様に翻訳することは困難である
本研究では,資源効率の高いオープンウェイトモデルにより,非公式な要件から適切な時間論理(LTL)仕様を生成することに焦点を当てる。
現在Guardは、制約付き生成とフォーマルな一貫性チェックを組み合わせたモジュラーツールチェーンで、非公式な入力からコンフリクトフリー仕様を生成する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:34:45 GMT)
Post Fusion Bird's Eye View Feature Stabilization for Robust Multimodal 3D Detection [2.3] Post Fusion Stabilizer (PFS)は、既存の検出器の中間的なBEV表現で動作する軽量モジュールである。
PFSは、領域シフトの下で特徴統計を安定化し、センサ劣化による空間領域を抑圧し、残留補正によって弱められたキューを適応的に復元する。
PFSはいくつかの障害モードを実現し、特にカメラのドロップアウトロバスト性は+1.2%向上し、低照度性能は+4.4%向上した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:27:57 GMT)
SPyCer: Semi-Supervised Physics-Guided Contextual Attention for Near-Surface Air Temperature Estimation from Satellite Imagery [2.3] 近地センサーは、地表温度(NSAT)などの環境特性を正確に測定する。
本稿では,SPyCerについて紹介する。SPyCerは半教師付き物理誘導ネットワークで,画素情報と物理モデリングを利用して学習プロセスのガイドを行うことができる。
実世界のデータセットの実験では、SPyCerは空間的に一貫性があり、物理的に一貫したNSAT推定を生成する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:31:44 GMT)
ShieldBypass: On the Persistence of Impedance Leakage Beyond EM Shielding [2.2] 遮蔽により放射光が抑制された場合, インピーダンス変調された後方散乱が持続するかどうかを検討した。
受動EM測定は遮蔽下での識別力を失うが,後方散乱応答は分離可能である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:42:39 GMT)
SCoUT: Scalable Communication via Utility-Guided Temporal Grouping in Multi-Agent Reinforcement Learning [2.1] 部分観察型マルチエージェント強化学習(MARL)におけるコミュニケーションによるコーディネーションの改善
textbfScalable textbfCommunication via textbfUtility-guided textbfTemporal grouping)
エージェントは環境行動、決定の送付、受取者選択という3つの方針で訓練される。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:33:28 GMT)
Analysis of Terms of Service on Social Media Platforms: Consent Challenges and Assessment Metrics [2.0] ソーシャルメディアプラットフォームは通常、アカウント作成時に提示されるサービス規約を通じてユーザーの同意を得る。
本研究では,これらの文書の中で同意関連情報が明確に伝達されているかを検討する。
計算と定性分析の組み合わせを用いて、13のソーシャルメディアプラットフォームからToSを評価する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 00:47:28 GMT)
Compact Lifted Relaxations for Low-Rank Optimization [2.0] 階数制約付き二次最適化問題に対して,n 倍 m$ の行列に対してトラクタブル凸緩和法を開発する。
そのようなスペクトル項を必要としない半定値緩和を導出する。
全体として、我々は幅広い低ランク二次問題のクラスに対してスケーラブルな半定値境界を得る。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:05:18 GMT)
QGPU: Parallel logic in quantum LDPC codes [2.0] 量子低密度パリティチェックコードは、表面コードに代わるリソース効率のよいコードである。
鍵となる課題は、論理キュービットは必ずしも物理キュービットの解集合に写像されないことである。
有限サイズのインスタンスを持つ量子低密度パリティチェック符号群であるクラスター循環符号を導入する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:26:00 GMT)
High-performance syndrome extraction circuits for quantum codes [2.0] 本稿では,シンドローム抽出回路(SEC)の解析と設計のためのフレームワークを提案する。
我々のアプローチは、ゲートを介さずに$X$と$Z$チェックをステージングすることで低深さを維持するSECの一般的な設計である左利き回路に基づいている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:50:46 GMT)
LLM-Guided Decentralized Exploration with Self-Organizing Robot Teams [2.0] 本研究では, 自己組織化のためのアルゴリズムを組み合わせて, 複数のチームの自律的な形成を可能にする探索手法を提案する。
提案手法の有効性は, 数十から数百のロボットを用いたシミュレーションにより検証した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:20:20 GMT)
Adaptive Policy Switching of Two-Wheeled Differential Robots for Traversing over Diverse Terrains [2.0] 本研究では,ナビゲーション中に収集した姿勢関連観測を用いて,地形タイプを効果的に推定できるかどうかを検討した。
我々はPPO(Proximal Policy Optimization)を用いて事前学習したポリシーを微調整し、平坦な地形や荒地を移動する際にロボットの3D方向データを収集した。
解析の結果、ロボットのピッチデータの標準偏差は、これらの2つの地形種間に明らかな差があることが判明した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:20:06 GMT)
A Dynamical Lie-Algebraic Framework for Hamiltonian Engineering and Quantum Control [1.9] 我々は、リー代数に基づくハミルトン駆動量子力学の工学的枠組みを開発する。
我々のフレームワークは、工学的表現力と資源効率の良いユニタリ進化のための体系的な経路を提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:00:01 GMT)
The Impact of Preprocessing Methods on Racial Encoding and Model Robustness in CXR Diagnosis [1.9] ディープラーニングモデルは、胸部X線記録(CXR)から高い精度で人種識別を行うことができる。
人種的アイデンティティの関数としての診断予測を体系的にバイアスするモデルを意図せずに学習する、人種的ショートカット学習の可能性については、広く懸念されている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:28:08 GMT)
ToolRLA: Multiplicative Reward Decomposition for Tool-Integrated Agents [1.8] ドメイン固有のツールエージェントのためのポストトレーニングパイプラインであるToolRLAを提案する。
コアコントリビューションは、乗法的正しさ分解を伴う微細な報酬関数である。
ToolRLAは3ヶ月以上、タスク完了率を47%改善している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:21:10 GMT)
Towards Robust Retrieval-Augmented Generation Based on Knowledge Graph: A Comparative Analysis [1.8] Retrieval-Augmented Generation (RAG) は、Large Language Models (LLM) の機能を強化するために導入された。
不整合検索情報はLLM応答に悪影響を及ぼす可能性がある。
RGB (Retrieval-Augmented Generation Benchmark) を導入し,RAGシステムのロバスト性を評価する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:43:53 GMT)
Memory as Ontology: A Constitutional Memory Architecture for Persistent Digital Citizens [1.8] AIエージェントメモリシステムにおける現在の研究と製品開発は、ほとんど普遍的に、メモリを機能モジュールとして扱う。
本稿では,メモリ・アズ・オントロジーのパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:24:10 GMT)
RBF-Solver: A Multistep Sampler for Diffusion Probabilistic Models via Radial Basis Functions [1.7] ポリノミアルベースの多段階サンプリング器は、予め定義されたスキームに従ってサンプリング軌道を加速することにより、このコストを緩和する。
モデル評価を放射基底関数(RBF)で補間する多段階拡散サンプリング器RBF-rを提案する。
RBFの学習可能な形状パラメータを活用することにより、RBF-rは最適なサンプリング軌道を明示的に追従する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:19:44 GMT)
VietJobs: A Vietnamese Job Advertisement Dataset [1.6] VietJobsはベトナムの求人広告の大規模な公開コーパスである。
48,092件の投稿と、ベトナム全34の州や自治体から収集された1500万件以上の単語で構成されている。
職種、カテゴリー、給与、技能、雇用条件など幅広い言語情報や構造情報を提供している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:12:02 GMT)
Meta-D: Metadata-Aware Architectures for Brain Tumor Analysis and Missing-Modality Segmentation [1.5] 本稿では,MRIシークエンスや平面配向などの分類的スキャナメタデータを明示的に活用して特徴抽出を導くアーキテクチャであるMeta-Dを提案する。
まず,T1,T2の注入配列と平面(軸方向)メタデータが畳み込み特性を動的に調節する2次元腫瘍検出法について検討した。
メタデータは、データが利用可能であるときに特徴抽出を基礎とするため、データの欠落時にロバストなアンカーとして機能する、という仮説を立てる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:54:49 GMT)
A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes [1.5] スペイン語、カタルーニャ語、イタリア語の原文のコーパスを提示する。
iDEMプロジェクトで開発され、民主的参加のためのイージー・トゥ・リード(E2R)言語の影響を評価するために開発された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:21:25 GMT)
SecureRAG-RTL: A Retrieval-Augmented, Multi-Agent, Zero-Shot LLM-Driven Framework for Hardware Vulnerability Detection [1.5] 大規模言語モデル(LLM)は自然言語処理タスクにおいて顕著な能力を示している。
本稿では, SecureRAG-RTL(Retrieval-Augmented Generation (RAG) に基づく新しいアプローチを提案する。
提案手法は,ドメイン固有検索と生成推論を統合し,ハードウェアセキュリティの専門知識に固有の制約を克服する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:25:49 GMT)
Adaptive Prototype-based Interpretable Grading of Prostate Cancer [1.4] 本研究は,前立腺癌の病理組織像から解釈可能なグレーディングを行うための,プロトタイプベースの弱監督フレームワークを提案する。
ネットワークは、各グレードに関連する堅牢な機能を学ぶために、パッチレベルで事前トレーニングされる。
前立腺癌評価のための弱制御された設定に適応するために、ネットワークは、新しいプロトタイプ認識損失関数で微調整される。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:42:30 GMT)
TEGA: A Tactile-Enhanced Grasping Assistant for Assistive Robotics via Sensor Fusion and Closed-Loop Haptic Feedback [1.4] 触覚強化把握アシスタント(TEGA)について紹介する。
クローズドループアシスト遠隔操作フレームワークは、リアルタイムなビブロタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタ
ウェアラブルの触覚ベストは、リアルタイムの触覚フィードバックを提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:12:55 GMT)
S5-SHB Agent: Society 5.0 enabled Multi-model Agentic Blockchain Framework for Smart Home [1.4] 本稿では,Society 5.0による人中心型ガバナンス対応スマートホームブロックチェーンエージェント(S5-SHB-Agent)を提案する。
このフレームワークは、交換可能な大きな言語モデルを使用して10の専門エージェントを編成し、安全、セキュリティ、快適性、エネルギー、プライバシ、健康ドメインを横断して決定する。
4階層のガバナンスモデルにより、住民は定期的な調整から不変の安全しきい値への調整によって自動化を制御できる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:15:50 GMT)
Multilevel Training for Kolmogorov Arnold Networks [1.3] Kolmogorov-Arnoldネットワーク(KAN)は、学習したアクティベーションを特定のベースで拡張することによって、より多くの構造を提供する。
本稿では,この構造を利用して実用的なアルゴリズムと理論的知見を開発し,KANSAのマルチレベルトレーニングによるトレーニングスピードアップを実現する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:20:03 GMT)
Control Lyapunov Functions for Underactuated Soft Robots [1.3] 本稿では,非作動型ソフトロボットのタスク空間制御と追跡のための汎用的な制御フレームワークを提案する。
この方法は、凸不等式制約としてラプノフ関数を急速に安定化させる。
その結果,入力限界下でのタスク空間精度と一貫したリアプノフ収束が向上した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:50:22 GMT)
Lambda-randomization: multi-dimensional randomized response made easy [1.3] 我々は,多変量分布の推定値を取得するために,計算コストの低いLambda-randomizationというプロトコルを開発した。
また,提案プロトコルを説明するための実証アプリケーションを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:11:22 GMT)
Measuring AI R&D Automation [1.3] この研究は、AIRDAの規模とAIの進歩と監視への影響を追跡するためのメトリクスを提案する。
メトリクスは、AI R&D支出の資本共有、研究者の時間割当、AIのサブバージョンインシデントといった範囲にまたがる。
我々は、企業や第三者(非営利団体など)がこれらの指標を追跡し始め、政府がこれらの取り組みを支援することを推奨する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:56:31 GMT)
A framework for assessing the capabilities of code generation of constraint domain-specific languages with large language models [1.2] 大規模言語モデル(LLM)は、例えばコード補完やコード生成を通じてソフトウェア開発タスクをサポートするために使用できる。
テキスト仕様からDSLコードを生成するLLMの機能を評価するための汎用フレームワークを提案する。
このフレームワークは特定の種類のDSL、制約言語に適用されます。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:23:02 GMT)
A Benchmarking Framework for Model Datasets [1.2] モデル駆動エンジニアリングにおける経験的およびLLMベースの研究は、ますますソフトウェアモデルのデータセットに依存している。
このようなデータセットは通常、収集されるか、アドホックに作成されるが、使用する特定のタスクに対する品質の保証はない。
我々は、言語やフォーマット間でソフトウェアモデルのデータセットを体系的に評価し比較するための統一的なインフラを提供するMDEのためのベンチマークプラットフォームを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:04:35 GMT)
Judge Reliability Harness: Stress Testing the Reliability of LLM Judges [1.2] Judge Reliability Harnessは、LCM判事の信頼性をテストする検証スイートを構築するためのオープンソースライブラリである。
安全性,説得性,誤用,エージェント行動の4つのベンチマークで,最先端の4つの審査員を評価した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:27:07 GMT)
Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes [1.2] スマートホームにおける障害検出と障害検出のための自己監視型コンテキスト認識手法Tureisを提案する。
Tureisは、異質なバイナリと数値センサーストリームをコンパクトなビットレベル機能にエンコードする。
BBT方式のトランスフォーマーを訓練し、短時間の窓の上をセンサーでマスクで再構築する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:50:01 GMT)
Probabilistic Dreaming for World Models [1.1] 思考」は、エージェントが想像した経験から学ぶことを可能にする。
確率論的手法を用いて、最先端のドリーマーモデルに対する革新を考察する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:32:40 GMT)
Balancing Coverage and Draft Latency in Vocabulary Trimming for Faster Speculative Decoding [1.1] ドラフト語彙を高いカバレッジで最大97%削減しながら、投機的復号化のスループットを向上させる。
ドメイン固有のタスクでは、レイテンシの最大16%の削減と20%のスループット改善を実現し、さまざまなアウト・オブ・ディストリビューションタスクで最大6.7%のスループット向上を実現しています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:20:22 GMT)
CONE: Embeddings for Complex Numerical Data Preserving Unit and Variable Semantics [1.1] 本研究では,数値,範囲,ガウスを距離を保存するベクトル空間にエンコードするハイブリッドトランスフォーマーエンコーダモデルCONEを提案する。
多様な領域にまたがる大規模データセットについて広範な実験的評価を行う。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:26:36 GMT)
Oral to Web: Digitizing 'Zero Resource'Languages of Bangladesh [1.1] マルチリンガル・クラウド・コーパス(Multilingual Cloud Corpus)はバングラデシュの民族および先住民族の言語の最初の、全国規模、並列、マルチモーダルな言語データセットである。
ベンガル語刺激テキスト、英訳、IPA転写を含む85792の構造化テキストエントリと、107時間の音声録音を含む。
データはバングラデシュの9地区で90日間にわたる体系的なフィールドワークを通じて収集され、16人のデータ収集者、77人の話者、43人のバリデータを含む。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:20:57 GMT)
How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features [1.0] 臨床予測設定では、ゲノム学のような高次元の特徴の重要性は予測性能の変化を評価することによって評価されることが多い。
混合次元予測モデルの文脈における特徴重要度を定量化するために,非対称シェープ値を用いる方法を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:58:50 GMT)
Score-Guided Proximal Projection: A Unified Geometric Framework for Rectified Flow Editing [1.0] Rectified Flowモデルは最先端の世代品質を実現するが、正確なタスクのためにそれらを制御することは依然として困難である。
現在のアプローチは「幾何学的ロック」に苦しむ逆法に基づくガイダンスに分岐する
Score-Guided Proximal Projectionは,決定論的最適化と縮尺サンプリングのギャップを埋める統一フレームワークである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:44:45 GMT)
Rethinking the Role of Collaborative Robots in Rehabilitation [1.0] セラピストとPuPTをセラピーの前後で支援する役割を想像し,コボットの範囲を拡大することを提案する。
ユーザ状態の理解の促進、安全性の確保、コボットをセラピストのワークフローに統合することなど、これらの役割を実現する上での課題を強調します。
この見解は、HRIコミュニティの助力ロボティクスの進歩から引き出す新しい研究の疑問と機会を開く。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:06:11 GMT)
The toric code under antiferromagnetic isotropic Heisenberg interactions [1.0] 等方性反強磁性ハイゼンベルク摂動がトーリック符号に与える影響について検討した。
我々は、モデルの正確な対称性を尊重しながら、幅広いハイゼンベルク結合の基底状態を計算する。
本研究は,局所的な2スピン相互作用がトリック符号の現実的な実装において自然に生じることを示し,トポロジ的順序の分解を促進することを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:04:43 GMT)
NCTB-QA: A Large-Scale Bangla Educational Question Answering Dataset and Benchmarking Performance [1.0] NCTB-QAは大規模なバングラ質問応答データセットである。
本研究では,低リソース環境において,ドメイン固有の微調整がロバストな性能に重要であることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:35:03 GMT)
Long-Lived Mechanically-Detected Molecular Spins for Quantum Sensing [0.9] 個々のスピンに基づく量子センサーは、凝縮物質、化学、生物学における局所磁場への前例のないアクセスを提供する。
分子電子スピン、超感度機械読み取り、ハミルトン工学を組み合わせたナノスケールセンシングプラットフォームを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:18:10 GMT)
Constant depth magic state cultivation with Clifford measurements by gauging [0.9] 近年、カラーコードのクリフォード演算子を測定することにより、マジックステートの調製コストを削減するためにマジックステート栽培が提案されている。
ここでは、クリフォードゲートをゲージすることで、カラーコード上で論理的な$XSdagger$の測定を行い、その結果、一定の深さの論理的測定回路が得られる。
我々のプロトコルは正方形グリッド接続が必要であり、マジック状態の栽培に匹敵する論理誤差率が得られる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:51:50 GMT)
Vision-Language System using Open-Source LLMs for Gestures in Medical Interpreter Robots [0.8] 本稿では,医療用インタプリタロボットのためのプライバシー保護型視覚言語フレームワークを提案する。
特定の音声行為(内容と指示)を検出し、対応するロボットジェスチャーを生成する。
また,音声行動に注釈を付け,ジェスチャークリップと組み合わせた新たな臨床会話データセットも紹介した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:21:39 GMT)
Warm Starting State-Space Models with Automata Learning [0.8] ムーアマシンは状態空間モデル(SSM)として正確に実現可能であることを証明した。
我々は,SSMの学習を受動的・能動的オートマトン学習と比較した。
我々は,SSMがシンボル法よりも桁違いに多くのデータを必要とし,状態構造を学習できないことを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:35:28 GMT)
Quantum Algorithms for Network Signal Coordination [0.8] NSC問題(Network Signal Coordination)は、完全であることが知られている問題である。
高速化のため,NSC問題を解くためにGroverの探索を実装した。
シミュレーションおよび実際の量子コンピュータ上での実装を実演する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 03:14:52 GMT)
Trainable Bitwise Soft Quantization for Input Feature Compression [0.8] 本稿では,ニューラルネットワークの入力特徴を圧縮するタスク固有で訓練可能な特徴量化層を提案する。
これにより、デバイスからリモートサーバに転送される必要のあるデータの量を大幅に削減できる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:40:55 GMT)
Spatiotemporal Pauli processes: Quantum combs for modelling correlated noise in quantum error correction [0.7] コースペースノイズは量子誤り訂正(QEC)における臨界故障モードである
emphSpatio Pauli Processes (SPPs)について紹介する。
任意のマルチタイム・非オビアンダイナミクスをマルチタイム・パウリ・プロセスにマッピングする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:45:06 GMT)
When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality [0.7] 生成AIは、経済価値を集中的な補完資産にシフトしながら、タスク内スキルの違いを圧縮する。
我々は、この緊張関係を内在的教育、雇用主検診、異種企業によるタスクベースモデルで定式化する。
このモデルでは、境界がAIの技術構造に依存する2つのレジームが生成される。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:41:08 GMT)
VoxKnesset: A Large-Scale Longitudinal Hebrew Speech Dataset for Aging Speaker Modeling [0.7] VoxKnessetは2009-2025年のヘブライ議会演説の2300時間のオープンアクセスデータセットである。
年齢予測と長手条件下での話者検証に現代音声の埋め込みをベンチマークする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:31:52 GMT)
Beyond Text: Aligning Vision and Language for Multimodal E-Commerce Retrieval [0.7] 電子商取引領域における2tower検索モデルの統一テキスト画像融合について検討する。
ドメイン固有の微調整と製品テキストとのクエリと画像のモダリティの2段階のアライメントが、効果的なマルチモーダル検索に不可欠であることを示す。
本稿では、画像とテキスト情報を融合し、モーダル間補完情報をキャプチャするための、ノーバルなモダリティ融合ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:43:45 GMT)
Person Detection and Tracking from an Overhead Crane LiDAR [0.6] 本稿では,頭上クレーンに搭載されたLiDARを用いて,産業用屋内作業空間における人物検出と追跡について検討する。
サイト固有のLiDARデータセットを3Dヒューマンバウンディングボックスアノテーションでキュレートし、選択した候補となる3D検出器を統一的なトレーニングおよび評価プロトコルで適応する。
得られた結果は、標準的な運転データセット間のドメインギャップを埋めることと、人検出と追跡のためのオーバーヘッドセンシングに寄与する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:37:36 GMT)
LLM-Grounded Explainability for Port Congestion Prediction via Temporal Graph Attention Networks [0.6] 本稿では,混雑拡大予測と忠実な自然言語説明を共同で行うエビデンス基盤フレームワークを提案する。
このフレームワークは、海上渋滞監視とサプライチェーンリスク管理のための運用可能なAIへの実践的な経路を提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:07:40 GMT)
PRISM: Personalized Refinement of Imitation Skills for Manipulation via Human Instructions [0.6] 本稿では,ロボット操作における模倣ポリシーのための命令条件改善手法であるPRISMを提案する。
アプローチはImitation Learning (IL)とReinforcement Learning (RL)フレームワークをシームレスなパイプラインにブリッジする。
シミュレーションシナリオにおけるピック・アンド・プレイス・タスクの結果,提案手法は人的フィードバックを伴わずにポリシーを上回ることを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:05:08 GMT)
Quantum advantages for syndrome-aware noisy logical observable estimation [0.6] フォールトトレラント量子コンピューティングの最近の進歩は、論理層におけるエラーシンドローム情報を活用することにより、性能が大幅に向上することを示唆している。
ノイズの多い論理的可観測推定のための誤り症候群の有効性を定量化するための情報理論フレームワークを開発する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:14:27 GMT)
C2-Faith: Benchmarking LLM Judges for Causal and Coverage Faithfulness in Chain-of-Thought Reasoning [0.6] 大型言語モデル (LLMs) は、チェーン・オブ・ソート (CoT) 推論の判断としてますます使われている。
C2-Faithは、因果性(各ステップは以前の文脈から論理的に従うのか?
二つの因果検出,因果ステップの定位,カバレッジスコアの3つの課題において,フロンティア判事の評価を行った。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:36:47 GMT)
Residual RL--MPC for Robust Microrobotic Cell Pushing Under Time-Varying Flow [0.6] 微小流体流中における接触豊富なマイクロマニピュレーションは、小さな乱れが接触を壊し、大きな横方向のドリフトを引き起こすため、困難である。
時間変化したポアゼイユ流下でのウェイポイントサンプリングされた基準曲線を追尾する磁気マイクロロボットによる平面セルの押圧について検討した。
SACが学習した残留ポリシーで名目MPCを増強するハイブリッドコントローラを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:20:07 GMT)
Digital Twin Driven Textile Classification and Foreign Object Recognition in Automated Sorting Systems [0.5] 本研究は, 触覚予測, マルチモーダル知覚, 実世界の繊維分類のための意味推論を統合した, ディジタルツイン駆動型ロボットソートシステムを提案する。
RGBDセンシング、キャパシタ触覚フィードバック、衝突認識動作計画を備えたデュアルアームロボットセルは、衣服を非分類のバスケットから自律的に分離する。
MoveItと組み合わせたデジタルツインは、衝突認識経路計画を可能にし、検査された衣服のセグメント化された3D点雲を仮想環境に統合し、操作信頼性を向上させる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:42:19 GMT)
DiSCTT: Consensus-Guided Self-Curriculum for Efficient Test-Time Adaptation in Reasoning [0.5] TestTTは、テストタイム最適化戦略を割り当てる、困難に認識され、コンセンサスに導かれるセルフカリキュラムフレームワークである。
TestTTが強い計算ベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:38:50 GMT)
Identification of the I$_{10}$ Donor in ZnO as a Sn--Li Complex with Large Hyperfine Interaction [0.5] 広い直接バンドギャップ半導体におけるドナー不純物は、スピン光子量子技術のための有望なプラットフォームを提供する。
ここでは, 浅いドナーをSn-Li錯体として生成し, 同定する。
密度汎関数理論の計算により、隣り合うSn$_mathrmZn$-Li$_mathrmZn$複合体は、好ましい形成エネルギー、Sn上に局在した電子を持つドナー特性、実験と整合した超微粒子相互作用を持つことが示された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:18:21 GMT)
MUTEX: Leveraging Multilingual Transformers and Conditional Random Fields for Enhanced Urdu Toxic Span Detection [0.4] MUTEXは、Urdu毒性スパン検出フレームワークの条件付きランダムフィールド(CRF)と組み合わせた多言語変換器である。
MUTEXは、Urdu毒性スパン検出のための最初の教師付きベースラインであるトークンレベルF1スコアの60%を達成している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:11:50 GMT)
Local strategies are pretty good at computing Boolean properties of quantum sequences [0.4] 本稿では,量子系を個別に測定する必要がある場合の量子列のグローバルな性質の計算問題について検討する。
各サブシステムに独立して同じ最適な単一システム計測を適用できる単純な局所戦略を考える。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:24:52 GMT)
Ailed: A Psyche-Driven Chess Engine with Dynamic Emotional Modulation [0.4] 本稿では,チェスのプレイにおける行動変数を生成するために,パーソナリティxサイコリケーションを提案する。
私はこのフレームワークを12,414のゲームでMaia2-1100に対してテストし、トレーニングデータで2,800倍異なる2つの確率源を与えました。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:32:40 GMT)
FairFinGAN: Fairness-aware Synthetic Financial Data Generation [0.4] 保護属性に対するバイアスを緩和しつつ、合成財務データを生成するために設計されたWGANベースのフレームワークであるFairFinGANを提案する。
提案手法を実世界の5つの財務データセット上で評価し,既存のGANベースのデータ生成手法と比較した。
実験結果から,本手法はデータの有用性を著しく損なうことなく,優れた公正度を達成できることが示唆された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:09:19 GMT)
Let's Talk, Not Type: An Oral-First Multi-Agent Architecture for Guaraní [0.3] 本稿では,生きた口頭での実践と一致しない限り,AIにおける言語サポートは不十分なままである,と論じる。
本稿では,標準の"text-to-speech"パイプラインの代替として,オーラルファーストなマルチエージェントアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:07:36 GMT)
Autocorrelation effects in a stochastic-process model for decision making via time series [0.3] 意思決定者は、半導体レーザーによって得られた光カオス力学を利用して、多重武装のバンドイット問題を解決する。
実験では、決定の正確性はこの自己相関性に強く依存していると報告されている。
本研究は,無線通信およびロボット工学における強化学習応用のための意思決定方法を改善する方法である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:39:09 GMT)
EchoGuard: An Agentic Framework with Knowledge-Graph Memory for Detecting Manipulative Communication in Longitudinal Dialogue [0.3] ガスライティング、罪悪感、感情的強迫といった操作的コミュニケーションは、個人が認識することがしばしば困難である。
既存のエージェントAIシステムは、これらの微妙で文脈に依存した戦術を追跡する、構造化された、縦方向のメモリを欠いている。
我々は、知識グラフを使用してこのギャップに対処するエージェントAIフレームワークであるEchoGuardを紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:03:02 GMT)
Public Sector Open Source Program Offices - Archetypes for how to Grow (Common) Institutional Capabilities [0.2] オープンソースソフトウェア(OSS)は、業界や公共デジタルサービスを支えるデジタルインフラの90%以上を占める重要なコンポーネントである。
本研究の目的は,EU,ノルウェー,リヒテンシュタイン,アイスランドのオープンソースプログラムオフィス(OSPO)を通じてOSSの採用,開発,コラボレーションを実現する方法を検討することである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:31:47 GMT)
Non-Zipfian Distribution of Stopwords and Subset Selection Models [0.2] ストップワード(英語: Stopword)とは、言語テキストの内容や意味にあまり意味のない単語である。
すべての単語のランク頻度プロットに関するよく知られたZipfの法則とは対照的に、ストップワードのランク頻度プロットはベータランク関数によって最も適している。
我々は,このモデルが,本来の全単語リストがZipfの法則に従うと,停止語に対するBRFランク周波数分布につながることを解析的に示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 00:11:18 GMT)
Bayesian post-correction of non-Markovian errors in bosonic lattice gravimetry [0.2] L>2$モードのシステムでは,ベイズ推定を用いて誤りを修正できることが示される。
このような測定に対して有効なFisher情報として$F_texteff$を定義する。
有効フィッシャー情報はヒルベルト空間上で最適化されたときにハイゼンベルクスケーリング$F_texteff=O(N2)$を持つことを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:25:06 GMT)
State-Selective Signatures of Quantum and Classical Gravitational Environments [0.1] 重力波の背景が古典的場として振る舞うか、真に量子環境として振る舞うかを決定するための統一的な枠組みが開発されている。
この結果は、重力量子性の感度の高いプローブとしてデコヒーレンス構造を確立した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:42:32 GMT)
Thermodynamic Response Functions in Singular Bayesian Models [0.1] 非特定方向を商化する可観測代数を定式化し、構造的に意味のある順序パラメータを特異なモデルで構築する。
以上の結果から,熱力学的応答理論は,特異ベイズ学習における複雑性,予測変数,構造的再編成を解釈する自然な枠組みを提供すると考えられる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:50:20 GMT)
Ultra-slow orbital and spin dynamics in an electrically tunable quantum dot molecule [0.1] トンネル結合型光学活性量子ドット分子(QDM)はスピン光子界面として機能し、スピンが結合している。
電子スピンが2つある単一QDMのシーケンシャル光電荷を実証する。
一スピン状態と二スピン状態に対する軌道とスピンの緩和ダイナミクスを、軌道状態のエネルギーデチューニングとハイブリッド化の関数として探求する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:06:12 GMT)
Matchgate circuit representation of fermionic Gaussian states: optimal preparation, approximation, and classical simulation [0.0] 積状態に作用するマッチゲート回路を使用する場合、このような状態をどのように最適に生成するかという問題に対処する。
構造がこれらの境界を飽和させ、それらの最適性を証明した明示的なアルゴリズムを提案する。
我々の結果は、(近似)状態の準備と切り離し手順に直接応用できる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:06:06 GMT)
Zero-Knowledge Proof (ZKP) Authentication for Offline CBDC Payment System Using IoT Devices [0.0] オフラインCBDCエコシステムは、ファイナンシャル・インクルージョンを提供し、保存されていないコミュニティを拡大し、デジタル決済への公平なアクセスを確保する。
IoTデバイスとオフラインCBDC支払いを統合することで、インターネット接続なしでシームレスで自動化された支払いが可能になる。
本研究は、統合されたセキュアな要素(SE)、ゼロ知識証明(ZKP)、IoTハードウェア上でオフライン支払いを行うための間欠同期を備えた、プライバシ保護のオフラインCBDCモデルを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:51:30 GMT)
Why Is RLHF Alignment Shallow? A Gradient Analysis [0.0] 勾配に基づくアライメントは本質的に害が決定され、それ以上に消える位置に集中する。
我々は、各位置が害に与える影響を定量化する「害情報$I_t$」の概念を導入する。
我々は、すべての位置で勾配信号を生成するリカバリペナルティに基づいて目的を導出する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:07:07 GMT)
Why Grokking Takes So Long: A First-Principles Theory of Representational Phase Transitions [0.0] グロッキング(Grokking)は、モデルがトレーニングデータを記憶してから長く経った突然の記憶である。
正規化学習力学におけるノルム駆動表現相転移からグラッキングが生じることを示す第一原理理論を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:28:39 GMT)
Whispering to a Blackbox: Bootstrapping Frozen OCR with Visual Prompts [0.0] Whispererは、拡散ベースのプリプロセッサを学習し、ピクセル空間の入力に適応する視覚的プロンプトフレームワークである。
提案手法は,300kの劣化した合成テキスト画像の挑戦的データセット上で,文字誤り率(CER)の8%を絶対的に低減する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:22:51 GMT)
WhisperAlign: Word-Boundary-Aware ASR and WhisperX-Anchored Pyannote Diarization for Long-Form Bengali Speech [0.0] 本稿では,ベンガル語長形音声認識と話者ダイアリゼーションの2つの課題について述べる。
ウィスパータイムスタンプを用いてロバストな音声チャンキング戦略を実装し、高精度な転写のための微調整音響モデルに精度の高いコンテキスト認識セグメントを供給できるようにする。
ダイアリゼーションタスクのために, pyannote.audio と WhisperX を利用した統合パイプラインを開発した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:54:11 GMT)
Whisper-RIR-Mega: A Paired Clean-Reverberant Speech Benchmark for ASR Robustness to Room Acoustics [0.0] 本稿では,室内音響に対する自動音声認識(ASR)の頑健性を評価するために,一対のクリーン音声と残響音声のベンチマークデータセットWhisper-RIR-Megaを紹介する。
各サンプルは、RIR-Megaコーパスからの実室インパルス応答を伴う同じ発話とクリーンなLibriSpeech発話をペアリングする。
1600個のテストサンプルに対して5つのWhisperモデルを評価し,クリーンで残響な条件下で単語誤り率(WER)と文字誤り率(CER)を報告する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:44:49 GMT)
When Denoising Hinders: Revisiting Zero-Shot ASR with SAM-Audio and Whisper [0.0] 本稿では,メタAIによるSegment Anything Model Audioの効果について,Whisperを用いたゼロショット文字起こしのための前処理ステップとして,系統的研究を行った。
一般的な直観とは対照的に,SAM-AudioプリプロセッシングはASR性能を低下させる。
人間の聴取者にとって知覚的にクリーンな音声は、必ずしも機械認識にとって堅牢ではない。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:20:11 GMT)
When Denoising Becomes Unsigning: Theoretical and Empirical Analysis of Watermark Fragility Under Diffusion-Based Image Editing [0.0] 並行して、拡散ベースの画像編集は、モダンなコンテンツパイプラインのためのデフォルトの変換層に急速に成熟した。
本稿ではこれらの傾向の微妙な相互作用について考察する。
透かしペイロードは, 前方拡散ステップによって系統的に減衰される低エネルギー, 高周波信号として振る舞うことを示す。
生成的変換の時代において意味のあるウォーターマーキングスキームの倫理的含意、責任のある開示規範、具体的な設計ガイドラインについて論じる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 00:26:34 GMT)
Variational Quantum Eigensolver for the Analysis of High-Resolution NMR Spectra: Applications to AB and AB2 Spin Systems [0.0] 変量量子固有解法 (VQE) が最初のVQAとして提案された。
VQEは量子力学の変分法に基づいている。
量子系の基底状態エネルギーを見つけるために用いられる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:53:16 GMT)
Unsupervised domain adaptation for radioisotope identification in gamma spectroscopy [0.0] 教師なしドメイン適応(UDA)は、新しいテスト領域に一般化するために合成データに基づいて訓練されたモデルの能力を向上させることができる。
本研究では,UDAが新しいテスト領域に一般化するために,合成データに基づいて訓練されたモデルの能力を向上させることを実証する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:19:55 GMT)
Universal quantum computation with group surface codes [0.0] 群曲面符号は、特定の条件を持つ有限群の量子二重モデルと等価である。
グループ符号を用いて,非クリフォードゲートを$mathbbZ$曲面符号で実行可能であることを示す。
適切に選択された群に対して、任意の古典曲面ゲートが群曲面符号で可逆的に実装可能であることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:59:27 GMT)
Understanding the Relationship Between Firms' AI Technology Innovation and Consumer Complaints [0.0] 本稿では,企業のAI技術革新が消費者の不満にどのように影響するかを検討する。
その結果、企業のAI技術革新が消費者の脅威に関する感情を著しく高め、苦情を高めていることが明らかとなった。
本稿では、企業のAIイノベーションに対する消費者の心理的反応の理解を深め、消費者の苦情を効果的に管理するための実践的意味を提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:37:28 GMT)
Uncertainty-aware Blood Glucose Prediction from Continuous Glucose Monitoring Data [0.0] 本研究では,1型糖尿病における血糖予測と血糖異常事象同定のための不確実性を考慮したニューラルネットワークモデルについて検討した。
出力ヘッドを備えたTransformerベースのモデルが最も有効な不確実性認識フレームワークであることが判明した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:49:43 GMT)
Uncertainty-Aware Solar Flare Regression [0.0] 現在の太陽フレア予測は、その信頼性の正確な定量化を欠くことが多く、しばしば誤報を引き起こす。
宇宙天気予報の信頼性を高めるためには,モデル予測のための信頼区間を確立することが重要である。
本研究では,宇宙天気予報における回帰作業への共形予測の適用について検討する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:23:51 GMT)
UC-Secure Star DKG for Non-Exportable Key Shares with VSS-Free Enforcement [0.0] UC-Secure Distributed Key Generation (DKG)は、署名された鍵を秘密にしながら共通の公開鍵を導出する。
ハードウェアベースのキーアイソレーションモジュールによって強制されるNon-eXportable Key (NXK) 設定をターゲットにしている。
指定されたサービスが共同署名をしなければならないが、単独では署名できないマルチデバイス閾値ウォレットに対して、Star DKG(SDKG)を構築する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:57:15 GMT)
Two-dimensional matter-wave interferometer, rotational dynamics, and spin contrast [0.0] 窒素空孔中心ナノダイアモンドのスピンコントラストと2次元磁場設定について考察した。
我々は、外磁場の影響下での剛性回転とともに動力学的運動を解析する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:00:10 GMT)
Training for Technology: Adoption and Productive Use of Generative AI in Legal Analysis [0.0] 本研究では,プロの環境下でのジェネレーティブ・人工知能(GenAI)の生産性を高めるために,ターゲットとなるユーザトレーニングが有効かどうかを検討する。
訓練を受けた生徒は、訓練を受けていない生徒よりも0.27ポイント高く評価された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:23:30 GMT)
Towards a data-scale independent regulariser for robust sparse identification of non-linear dynamics [0.0] データ正規化は、マグニチュードベースのスパース回帰法による支配方程式の発見を著しく歪めることができる。
本稿では,新しい計算効率の高いスパース回帰アルゴリズムSTCV(Sequential Thresholding of Coefficient of Variation)を提案する。
そこで本研究では,STCVに基づく手法が,他の手法が失敗した場合でも,正しい,まばらな物理法則を正しく識別できることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:11:22 GMT)
Theory of Code Space: Do Code Agents Understand Software Architecture? [0.0] コードエージェントは、分離されたタスクで優れているが、アーキテクチャの理解を必要とするマルチファイルソフトウェアエンジニアリングと苦労する。
エージェントがAI探索中に一貫性のあるアーキテクチャの信念を構築し、維持し、更新できるかどうかを評価するベンチマークである、コード空間の理論(ToCS)を紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:17:58 GMT)
The role of spatial scales in assessing urban mobility models [0.0] 都市移動が分析される空間スケールは、あらゆるモデルから得られる洞察の重要な決定要因である。
本研究では,3つの都市モビリティモデル,すなわち重力,放射線,訪問モデルの性能を評価する。
その結果、訪問モデルは、重力や放射よりも常に優れた性能を示すが、それら全てに共通する適切な空間スケールで評価された場合、その性能はそれほど変わらないことがわかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:40:49 GMT)
The Spatial and Temporal Resolution of Motor Intention in Multi-Target Prediction [0.0] 人間の運動意図を復号することは、リハビリテーションと補助技術にとって重要な課題である。
本研究では,多チャンネル筋電図(EMG)信号から移動方向と目標位置を推定することにより意図を予測することに焦点を当てた。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:40:30 GMT)
The Rise of AI in Weather and Climate Information and its Impact on Global Inequality [0.0] AI開発の現在の軌道は、気候情報システムの南北分割を増幅するリスクである。
このインフラストラクチャの不平等が、モデルの入力、プロセス、アウトプットを通じてどのように続くかを示します。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:07:21 GMT)
The Need for Quantitative Resilience Models and Metrics in Classical-Quantum Computing Systems [0.0] ここでは、レジリエンスはHPC-QPU統合の後の考えではなく、強調優先設計の制約となる必要があると述べる。
本稿では, 土木工学におけるレジリエンス手法が, 古典量子コンピューティングスタックの様々なレベルに適用可能であることを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:07:43 GMT)
The Geometric Inductive Bias of Grokking: Bypassing Phase Transitions via Architectural Topology [0.0] 巡回加法(Zp)を訓練した変圧器のグルーキング-遅れ一般化に関する研究
標準変圧器における2つの独立した構造因子:表現の大きさとデータ依存型アテンションルーティングを同定する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:41:01 GMT)
The Fragility Of Moral Judgment In Large Language Models [0.0] 大規模言語モデル(LLM)の安定性と操作性をテストするための摂動フレームワークを提案する。
コンテンツ摂動の3つのファミリーを生成する: 表面編集(語彙/構造ノイズ)、視点シフト(声と姿勢の中立化)、説得手がかりである。
表面の摂動は低いフリップ率(7.5%)をもたらし、主に自己整合性ノイズフロア内にある。
不安定性は道徳的に曖昧なケースに集中する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:01:43 GMT)
Telework during the Pandemic: Patterns, Challenges, and Opportunities for People with Disabilities [0.0] 我々は、パンデミックの開始に伴うテレワークの拡大と、パンデミック中のテレワークの進化について、障害者と障害のない人々を比較した。
2008年から2020年までの米国コミュニティサーベイと、2020年5月から2022年4月までのカレント・ポピュレーションサーベイの米国データを用いています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:18:21 GMT)
TML-Bench: Benchmark for Data Science Agents on Tabular ML Tasks [0.0] 本稿では、Kaggleスタイルのタスクに関するデータサイエンスエージェントのベンチマークであるTML-Benchを紹介する。
本論文は,カグル競技における10個のOSS LLMと3つの時間予算について評価する。
MiniMax-M2.1 モデルは4つの競技で最高の総合成績を得る。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:48:41 GMT)
Synchronization-based clustering on the unit hypersphere [0.0] 単位超球面上のクラスタリングは、様々な分野における基本的な問題である。
従来のクラスタリング手法は必ずしも単位球データに適していない。
本稿では,単位球面上の点として表されるデータをクラスタリングするための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:30:01 GMT)
Structured Multidimensional Representation Learning for Large Language Models [0.0] トランスフォーマーアーキテクチャは、幅広いパターン認識と自然言語処理タスクで最先端のパフォーマンスを達成する。
三次元テンソルのL-積に基づく埋め込み空間の構造的スペクトル分解を導入する。
提案するL-Transformerは,少ない埋め込みで動作するp並列変換器とスペクトル的に等価であることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:34:45 GMT)
Steady-State Multiparticle Entanglement via Dissipative Engineering in Waveguide QED [0.0] 導波路に結合した複数のエミッタの絡み合った状態の散逸的生成のための簡単なスキームを提案する。
我々のアプローチは、量子ゼノ効果と組み合わせて、サブラディアントおよびスーパーラディアント励起状態の形成から生じる集団間相互作用を利用する。
任意の初期状態から、システムはW型絡み合った定常状態へと決定論的に進化し、非忠実性は協調性とともに逆スケールすることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:53:32 GMT)
Spin-resolved microscopy of $^{87}$Sr SU($N$) Fermi-Hubbard systems [0.0] フェルミオン8,7$Srの量子ガス顕微鏡の実現について報告する。
689nmの狭い結合線上での冷却と蛍光に基づく撮像法により,スピン分解単原子検出が可能となった。
これらの結果は、SU(N) Fermi-Hubbardモデルにおけるエキゾチック磁性を研究するための強力なアプローチとして、87$Srの量子ガス顕微鏡を確立する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:49:13 GMT)
SpiderCat: Optimal Fault-Tolerant Cat State Preparation [0.0] 我々は、よりスケーラブルな方法で、CAT状態のための最適回路を構成的に見つける。
我々は、$n$-qubit CAT状態を実装する回路に必要なCNOTゲートの数について、正式な下界を導出する。
我々は、CNOTカウントを深さと交換する方法を示し、一定の深さのフォールトトレラント実装を構築することができる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:22:55 GMT)
Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility [0.0] 土地利用と移動需要の複雑な非線形相互作用による都市交通の流れ
本研究では,交通流パターンをモデル化するGeoAI Hybrid frameworkを提案する。
このフレームワークを2つの対照的な都市形態にまたがる6都市にわたる350の交通分析ゾーンのデータセットに適用すると、4つの結果が浮かび上がっている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:45:44 GMT)
SinhaLegal: A Benchmark Corpus for Information Extraction and Analysis in Sinhala Legislative Texts [0.0] SinhaLegalは1,206件の法的文書に約200万語を含むSinhala法定テキストコーパスを導入している。
データセットには、1981年から2014年までの1,065件、2010年から2014年までの141件の法律文書が含まれている。
テキストは、Google Document AIでOCRを使用して抽出され、続いて広範な後処理と手作業によるクリーニングにより、高品質でマシン可読なコンテンツが保証された。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 06:13:44 GMT)
Simulating Lattice Gauge Theories with Virtual Rishons [0.0] 中間段階に適用された量子リンク仮想リスホン表現を用いてゲージ対称性を強制する新しいフレームワークを開発する。
物質場と非物質場を持つU(1)ゲージ理論でこの枠組みをベンチマークする。
これらの結果は、格子ゲージ理論のシミュレーションのためのスケーラブルでロバストなアプローチとして仮想リスホンフレームワークを確立する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:20:37 GMT)
Simplified circuit-level decoding using Knill error correction [0.0] ニットル誤り訂正(Knill error correct)は、反復性症候群の測定を1ラウンドの計測で置き換える技法である。
解析的・数値的に、Knill誤り訂正のための時間制約付き復号問題は、より単純な符号容量ノイズモデルに使用される同じ復号器を用いて解くことができることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:00:24 GMT)
Robust Node Affinities via Jaccard-Biased Random Walks and Rank Aggregation [0.0] TopKGraphsは、構造的に類似した近傍を持つノードに偏りを持つスタートノードアンカレッドランダムウォークに基づく手法である。
本手法は, 合成グラフ, データセットからのk-nearest-neighborグラフ, およびキュレートされた高タンパク質相互作用ネットワーク上で評価する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:00:59 GMT)
Revisiting an Old Perspective Projection for Monocular 3D Morphable Models Regression [0.0] 本稿では,モノクル3次元モーフィブルモデル(3DMM)回帰法のための新しいカメラモデルを提案する。
クローズアップ顔画像でよく見られる視点歪み効果をとらえる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:52:20 GMT)
Reinforcement Learning for Power-Flow Network Analysis [0.0] 電力流方程式は電力注入と電力ネットワークのバス電圧の関係を記述している。
計算代数学における最先端技術アルゴリズムは、少数の変数を含むネットワークに対してこの問題に答えることができない。
この根数に対してよい近似を与える確率的報酬関数と、電力フロー方程式の空間を模倣する状態空間を用いる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:02:56 GMT)
Recursive Magic State Distillation on the Surface Code [0.0] 表面コード上で格子手術を施したマジック状態を作成するためのコストを削減します。
出力面符号の論理誤差率を大符号距離で一致させるためには、基礎となる表面符号よりもはるかに低い物理誤差しきい値が必要となる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:33:16 GMT)
Random Dot Product Graphs as Dynamical Systems: Limitations and Opportunities [0.0] ランダムドット製品グラフ内の時間ネットワークの進化を規定する微分方程式について検討する。
遅延位置における回転あいまいさからのゲージ自由度、確率行列の多様体構造からの実現可能性制約、スペクトル埋め込みによる軌道回復アーティファクトの3つの基本的な障害を同定する。
対称力学はスキュー対称ゲージ汚染を吸収できないので、力学構造は障害物を解消できる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:56:07 GMT)
Ramsey correlation spectroscopy with phase cycling using a single quantum sensor [0.0] 本稿では,Ramsey測定と相関スペクトルを組み合わせることで,制約を克服するプロトコルであるRESOLUTEを提案する。
本研究では, 実効コヒーレンス時間を$T* = 0.38,s$から$Tp = 5.1,s$に拡張し, ハーンエコー測定を上回った。
これらの進歩により、単一分子イメージングおよび量子センシング用途の感度が向上する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:59:24 GMT)
RMK RetinaNet: Rotated Multi-Kernel RetinaNet for Robust Oriented Object Detection in Remote Sensing Imagery [0.0] リモートセンシング画像における回転物体の受容は、3つの大きなボトルネックによって妨げられる。
これらの問題に対処するために、回転多重カーネルRetinaNet(RMK RetinaNet)を提案する。
RMK RetinaNetは、最先端の回転物体検出器に匹敵する性能を示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:14:28 GMT)
RFM-HRI : A Multimodal Dataset of Medical Robot Failure, User Reaction and Recovery Preferences for Item Retrieval Tasks [0.0] 本研究は,(1)公開型マルチモーダルデータセット(RFM-HRI),(2)異なる障害タイプに対するユーザ応答の分析,(3)安全クリティカルな障害回復に影響を及ぼすような回復戦略の体系的比較を可能にするクラッシュカート検索シナリオに寄与する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:52:19 GMT)
Quantum field theory for classical fields [0.0] これらの「統計観測可能量」の観点からは、確率論的古典場理論は場の量子論となる。
量子場理論の関数積分を構築し、古典相対論的クライン=ゴルドン方程式と相互作用を詳細に議論する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:15:38 GMT)
Quantum Weight Reduction with Layer Codes [0.0] 我々は、チェックウェイト6とトータルキュービット次数6を達成できる量子量削減のための単純で一般的な手順を導入する。
量子量削減法は各量子ビットを置換し、任意のカルダーバンク・ソー=ステアン符号を曲面符号のパッチでチェックする。
これは、各ビットとチェックを繰り返しコードに置き換える単純な古典的な減量手順の量子アナログである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:23:37 GMT)
Quantum Wavemetry via the Mth-Power Unitary of a Mach-Zehnder Interferometer [0.0] M結合マッハツェンダー干渉計 (MZI) アーキテクチャを用いて, コヒーレンス・ド・ブロイ波長 (CBW) に基づく量子ウェーブメトリー法を提案する。
CBWは、N00N状態に基づく量子センシングの重要な実用的限界を回避し、制限された光子数N、外界の可視性、光子損失に対する強い感受性を回避している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:50:39 GMT)
Quantum Simulation of Coupled Harmonic Oscillators: From Theory to Implementation [0.0] アルゴリズムの具体的実現を3つ開発・比較することにより,理論と実装のギャップを埋める。
まず,スズキ・トロッター(Suzuki-Trotter)ハミルトニアンシミュレーションを併用したスパース初期状態準備法を提案する。
第二に、古典的なデータがオークルを介してアクセスされるような、完全に量子化されたオラクルベースのフレームワークを実装します。
第3に、第1アプローチのスパース状態準備ルーチンと第2アプローチのオラクルとブロックエンコーディングに基づくシミュレーションパイプラインを組み合わせた効率的な代替案を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:49:13 GMT)
Pulse-duration-sensitive high harmonics and attosecond locally-chiral light from a chiral topological Weyl semimetal [0.0] 固体中の高調波発生(HHG)は、高強度レーザーパルスによって駆動されるバンド内加速と電子ホール再結合の相互作用によって生じる。
ここでは、高伝導帯励起を促進させることにより、HHGを高い光子エネルギーに拡張する上で、駆動パルス持続時間が大きな役割を果たすことを理論的に明らかにする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:24:01 GMT)
Programmable quantum simulation of anharmonic dynamics [0.0] 連続変数量子シミュレータは、物理と化学の多くの分野に関連するボゾン力学をシミュレートする経路を提供する。
本研究では, プログラム可能なCV-DV量子シミュレーションにより, トラップイオン系に実装した2重井戸ポテンシャルの非調和力学を実験的に実証する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 02:36:09 GMT)
Physics-consistent deep learning for blind aberration recovery in mobile optics [0.0] 本稿では,1つのぼやけた画像から物理光学パラメータを盲目的に復元するディープラーニングフレームワークであるLens2Zernikeを紹介する。
完全マルチタスクフレームワーク(z+p+m)は係数のみのベースラインよりも35%向上することを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:44:07 GMT)
Particle-Guided Diffusion for Gas-Phase Reaction Kinetics [0.0] 拡散-反応-拡散-拡散-拡散方程式の様々なパラメータに対する解の学習により気相化学反応に拡散-誘導サンプリングを適用した。
物理的に一貫した濃度場を生成し、未確認パラメータ値を含む出口濃度を正確に予測する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:09:28 GMT)
Order Unit Spaces and Probabilistic Models [0.0] 物理理論に対する凸演算アプローチは、テスト空間アプローチによって仮定可能であることを示す。
2つ目の構成は、重み付けされた硬貨の小屋の光をシャープな観測物の性質で表現した確率モデルである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:16:05 GMT)
Observer Design for Augmented Reality-based Teleoperation of Soft Robots [0.0] 本稿では,ソフトロボットの遠隔操作のための拡張現実インタフェースを提案する。
開発システムはMicrosoft HoloLens 2メガネと計算を担当する中央コンピュータで構成されている。
センサーから収集したデータを用いて、コンピューターはバーチャルリアリティープログラムの物理に基づいてロボットの位置を推定する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:04:14 GMT)
OWL: A Novel Approach to Machine Perception During Motion [0.0] 動作中の3次元知覚の複雑な課題に対処するために,知覚関連機能OWLを導入する。
その値は2つの基本的な視覚運動キューから直接導出され、1ポイント当たりの1セットのキュー値が瞬時に得られる。
OWLは、重要な知覚能力を強化し、単純化する統一的で分析的な時間ベースのアプローチを提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 21:22:17 GMT)
Nonreciprocal transparency windows, Fano resonance, and slow/fast light in a membrane-in-the-middle magnomechanical system induced by the Barnett effect [0.0] ハイブリッドキャビティマグノメカティカルシステムにおいて,複数のマグノメカニカル誘導透過窓,ファノ共鳴,スロー・ファスト光,非相互吸収およびグループ遅延の相互作用について検討した。
これらの知見は,光信号処理や量子情報技術への応用を目的としたハイブリッドシステムの可能性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:40:59 GMT)
NEFFY 2.0: A Breathing Companion Robot: User-Centered Design and Findings from a Study with Ukrainian Refugees [0.0] 本稿では,ストレス軽減のための触覚的緩やかな呼吸補助具として設計されたソーシャルロボットNEFFY 2.0の設計について述べる。
NEFFY 2.0はユーザ中心の設計プロセスを通じて開発され、NEFFY 1.0上に構築され、エンボディメントとマルチセンサーインタラクションを統合している。
その結果, NEFFY 2.0条件では, 音声のみと比較して有意にストレスの低下が認められた。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:08:13 GMT)
Multistability and Self-Trapping in Cavity-Magnonic Dimer [0.0] 共振共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器共振器
我々は、共振器間マグノンモード間の量子忠実度と相互情報を分析する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:52:35 GMT)
Modification to Fully Homomorphic Modified Rivest Scheme [0.0] この文書では、FHMRSのセキュリティ問題であるFHMRS(Fully Homomorphic Modified Rivest Scheme)と、セキュリティ問題を緩和するためのFHMRSの変更について詳述している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:45:53 GMT)
Minimal-backaction work statistics of coherent engines [0.0] 動的ベイズネットワークに基づく測定手法は,エンジンサイクル内での量子コヒーレンスを保っていることを示す。
量子機械におけるエネルギー交換統計を調査するための一般的な枠組みを提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:20:58 GMT)
Measuring Privacy vs. Fidelity in Synthetic Social Media Datasets [0.0] 合成された非構造化テキストのプライバシーリスクについてはあまり知られていない。
この研究は、3つの最先端の大規模言語モデルによって生成された合成Instagram投稿のプライバシーを評価する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 08:30:34 GMT)
Measurement Induced Asymmetric Entanglement in Deconfined Quantum Critical Ground State [0.0] 弱い測定値が分解量子臨界点(DQCP)に及ぼす影響を数値的に研究する。
弱い測定条件下での位相境界におけるポスト測定状態の絡み合いの非対称的再構成を報告する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:57:55 GMT)
Macromux: scalable postselection for high-threshold fault-tolerant quantum computation [0.0] Macromuxは、フォールトトレラントプロトコルの定サイズ時空ウィンドウ上でポストセレクションを行う階層的な方法である。
フォールトトレラントなプロトコルを構築し、私たちの知る限り、文献の中で最高のしきい値を持つ。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:04:40 GMT)
Machine Learning the Strong Disorder Renormalization Group Method for Disordered Quantum Spin Chains [0.0] 我々は、乱れた長距離相互作用量子スピン鎖の絡み合い構造を推論するために機械学習アルゴリズムを訓練する。
我々は、ランダムフォレストを古典的なベースラインとして、相互作用グラフを直接操作するグラフニューラルネットワーク(GNN)と比較する。
GNNは、乱れ平均ペアリング精度を1に近く達成し、SDRGと優れた定量的一致で絡み合いエントロピー$S(ell)$を再生する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:35:00 GMT)
Localization Without Disorder: Quantum Walks on Structured Graphs [0.0] 連続時間量子ウォーク(CTQW)は、古典的なものと根本的に異なる局所化現象を示す。
2つの高対称グラフ族上のCTQWにおける局所化の完全な解析的特徴について述べる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:54:40 GMT)
LoRA-MME: Multi-Model Ensemble of LoRA-Tuned Encoders for Code Comment Classification [0.0] マルチラベル分類のためのマルチモデルアンサンブルアーキテクチャであるLoRA-MMEを提案する。
このアプローチは、Java、Python、Pharo間のマルチラベル分類の問題に対処します。
テストセットのF1重みスコアは0.7906、マクロF1は0.6867であった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:19:21 GMT)
Lightweight and Scalable Transfer Learning Framework for Load Disaggregation [0.0] RefQueryは、スケーラブルなマルチアプライアンスでマルチタスクのNILMフレームワークで、コンパクトアプライアンス指紋の分解を条件にしている。
3つの公開データセットの実験では、RefQueryはシングルアプライアンスとマルチアプライアンスベースラインに対して、強い精度と効率のトレードオフを提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:43:48 GMT)
Legal interpretation and AI: from expert systems to argumentation and LLMs [0.0] AIと法の研究は、その進化したアプローチと方法論の文脈において、異なる方法で法的な解釈に直面してきた。
専門家システムの研究は、人間が生成した解釈を知識ベースに転送できることを保証することを目的として、法的な知識工学に重点を置いている。
議論に関する研究は、解釈的議論の構造とそれらの弁証的相互作用を表現することを目的としている。
機械学習の研究は、一般化された特殊化された言語モデルを通して、解釈的提案と議論の自動生成に焦点を当てている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:22:56 GMT)
Kraus Constrained Sequence Learning For Quantum Trajectories from Continuous Measurement [0.0] 本稿では,ジェネリックシークエンスバックボーンの隠れ表現を正のトレース保存(CPTP)量子演算に変換するクラス構造出力層を提案する。
すべてのモデルにおいて、Kraus-LSは最強の結果を達成し、制約のないモデルに比べて、状態推定品質を7%向上させる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:37:05 GMT)
Knowledge Divergence and the Value of Debate for Scalable Oversight [0.0] AIフィードバックからの議論と強化学習は、高度なAIシステムのスケーラブルな監視方法として提案されている。
議論モデル間の知識の相違の幾何学を通して、議論の価値をパラメータ化することでこれを解析する。
議論とRLAIFの間の最初の公式な関係は、敵の監視プロトコルが正当化されたときの理解のための幾何学的基礎である。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:36:08 GMT)
Jagarin: A Three-Layer Architecture for Hibernating Personal Duty Agents on Mobile [0.0] パーソナルAIエージェントは、モバイルにおける基本的なデプロイメントパラドックスに直面している。
本稿では、このパラドックスを、構造的冬眠と需要駆動のウェイクによって解決する3層アーキテクチャであるJagarinを紹介する。
動作中のFlutterプロトタイプがAndroid上でデモされ、3つのレイヤすべてと、ユーザ主導のエスカレーションでのみ呼び出される一時的なクラウドエージェントが組み合わされている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:38:14 GMT)
Inverse Reconstruction of Shock Time Series from Shock Response Spectrum Curves using Machine Learning [0.0] 本研究では,SRSからアクセラレーション時系列へのデータ駆動逆写像を学習する条件付き変分オートエンコーダを提案する。
実験では、古典的手法に対するスペクトルの忠実度の向上、目に見えないスペクトルへの強い一般化、推論速度の3~6桁の高速化が示されている。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:27:36 GMT)
Interplay of internal and external coupling phases in cavity magnonics: from level repulsion to attraction [0.0] 室温キャビティマグノニクス系における内部結合相と外部結合相を組み込んだ統合入出力モデルを実験的に検証した。
位相効果を明示的に説明することにより、モデルは干渉誘起反共鳴を完全に制御する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:02:03 GMT)
IntSeqBERT: Learning Arithmetic Structure in OEIS via Modulo-Spectrum Embeddings [0.0] IntSeqBERTは、OEIS上でのマスク付き整数列モデリングのためのデュアルストリームトランスフォーマーエンコーダである。
3つの予測ヘッド (マグニチュード回帰, 符号分類, 変調予測) を274,705 OEIS配列で共同で訓練した。
大規模(91.5Mパラメータ)では、IntSeqBERT 95.85%の精度と50.38%の平均モデュロ精度(MMA)がテストセット上に存在する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:43:05 GMT)
Heuristics for Shuttling Sequence Optimization for a Linear Segmented Trapped-Ion Quantum Computer [0.0] 線形セグメント化イオントラップ量子コンピュータの動作には,シャットリングシーケンスの生成アルゴリズムが必要である。
本研究は、量子フーリエ変換のような構造を持つ回路に最適であることが証明されたシーケンスを生成するアルゴリズムの実装を提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:35:29 GMT)
Green by Design? Investigating the Energy and Carbon Footprint of Chia Network [0.0] Chia Network(略してChia)は、Proof of Space and Time(PoST)コンセンサスメカニズムを使用して、グリーンに定義されたブロックチェーンである。
我々の結果は、ChiaがProof-of-Workベースのブロックチェーンの持続可能な代替品であることを示している。
制御されたテストベッドからの実験的な測定と、運用および実施したエミッションの理論的モデリングを組み合わせることで、Chiaの真の持続可能性プロファイルを評価する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:08:46 GMT)
Generic Camera Calibration using Blurry Images [0.0] ジェネリックカメラのキャリブレーションはパラメトリックカムのキャリブレーションよりも正確な結果が得られる。
幾何学的制約と局所パラメトリック照明モデルに基づいて特徴点と空間的変化点拡散関数を同時に推定する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:29:05 GMT)
Generalizing Fair Top-$k$ Selection: An Integrative Approach [0.0] 本研究では,保護群を用いた公正最小化(線形)スコアリング関数の問題について検討する。
2次元のデータセットと小さな値が$k$である場合、この問題でさえ計算的に難解であることが示される。
このソリューションは、実世界のデータセットに強い経験的パフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 00:06:47 GMT)
Generalizable Multiscale Segmentation of Heterogeneous Map Collections [0.0] 歴史的地図コレクションは、スタイル、スケール、地理的に非常に多様である。
地図認識におけるほとんどの研究は、同種地図シリーズに合わせた専門モデルに焦点を当てている。
さまざまな過去の地図文書を反映した1,439の注釈付きパッチからなる新しいオープンベンチマークデータセットであるSemapを紹介した。
本稿では,手続き型データ合成とマルチスケール統合を組み合わせたセグメンテーションフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:40:01 GMT)
Full Dynamic Range Sky-Modelling For Image Based Lighting [0.0] 環境マップは、現実世界の屋外シーンをモデル化するための重要な要素である。
最近の研究は、スカイモデルが精度と照明の方向性においてより包括的であることを示した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:32:18 GMT)
Federated Causal Discovery Across Heterogeneous Datasets under Latent Confounding [0.0] FedCIは、異種データセットを処理する条件付き独立テストである。
FedCI-IODは、分散データセットと異種データセットをまたいだ潜在コンバウンディングの下で因果発見を可能にする。
当社のツールは,edCI Pythonパッケージ,IODのプライバシ保護R実装,およびedCI-IODパイプライン用のWebアプリケーションとして公開されています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:17:31 GMT)
Extreme Quantum Cognition Machines for Deliberative Decision Making [0.0] 本稿では,量子学習アーキテクチャのクラスであるExtreme Quantum Cognition Machinesを紹介する。
量子認知パラダイムにインスパイアされたExtreme Quantum Cognition Machinesは、量子極端学習と量子貯水池計算と密接に関連している。
提案フレームワークのハードウェア互換量子実装について論じる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:53:35 GMT)
Escaping the Hydrolysis Trap: An Agentic Workflow for Inverse Design of Durable Photocatalytic Covalent Organic Frameworks [0.0] 共有有機フレームワーク(COF)は、太陽水素生産のための光触媒を約束している。
ノード、リンカ、リンケージ、ファンクショナルグループの設計空間をナビゲートして、同時にアクティブで耐久性のある候補を特定することは、非常に難しい課題です。
ここでは、事前訓練された化学知識、ドナー・アクセプター理論、共役効果、安定性結合階層を活用する大規模言語モデル(LLM)エージェントであるAraを紹介する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:57:56 GMT)
Environment-Aware Path Generation for Robotic Additive Manufacturing of Structures [0.0] 環境対応パス生成フレームワーク (PGF) を初めて提案し, 構造をオンラインに設計した。
挑戦的な環境における最も有望なパスプランナーは、ロボット添加物製造アプリケーションで特定される。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 23:20:15 GMT)
Emergent causal order and time direction: bridging causal models and tensor networks [0.0] 我々はコーサルモデルとテンソルネットワークの双方向マッピングを構築し、方向相関関数と信号処理の操作概念をリンクする。
フレームワークをホログラフテンソルネットワークに適用すると、グラフ分離のような因果推論のツールを使用して、創発的因果構造を分析する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:06:37 GMT)
Emergence of Turbulence in a counterflow geometry of 2D Polariton Quantum Fluids [0.0] 2つの逆伝播レーザビームによって駆動される2次元エキシトン-ポラリトン量子流体の非線形ダイナミクスを数値解析する。
ポンプ強度, レーザ変形, 注入運動量の間の相互作用から, 線形, ソリトニック, 乱流, 超流動の4つの異なる状態を同定した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 12:53:14 GMT)
Dynamical quantum phase transitions through the lens of mode dynamics [0.0] 運動量空間における急激なクエンチプロトコルの下で、一般二次フェルミオンハミルトニアンのモードダイナミクスについて検討する。
任意の時点でゼロエネルギーのモードである$t$は動的臨界モードと呼ばれる。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 15:29:42 GMT)
Deterministic Preprocessing and Interpretable Fuzzy Banding for Cost-per-Student Reporting from Extracted Records [0.0] 決定論的でルールに依存したファイルベースのワークフローはcad_processor.pyで実装されている。
このスクリプトは、Casual Academic Database (CAD)エクスポートワークブックを取り込み、コストと学生の総計を、主観年数と学年数に集約する。
プロセッシング・サマリー(ラン・レコードとカウンタ)、トレンド・アナリティクス(学年毎学費マトリックス)、レポート(全体主観レベルテーブル)、ファジィ・バンド(年間アンカー、会員重量、バンドレーベル)の4枚からなる加工ワークブックを執筆している。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:47:02 GMT)
Design and Analysis of an Improved Constrained Hypercube Mixer in Quantum Approximate Optimization Algorithm [0.0] Noisy Intermediate-Scale Quantum (NISQ) 時代において、QAOAは制約された問題には適していない。
ある種の制約を組み込む一つの方法は、混合作用素を実行可能な部分空間に制限することである。
広い制約問題に対して,より少ないゲートで回路を生成する改造を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:57:15 GMT)
Design Behaviour Codes (DBCs): A Taxonomy-Driven Layered Governance Benchmark for Large Language Models [0.0] 我々は、構造化された150の行動管理層の有効性を評価するための最初の実証的なフレームワークである、動的行動制約(DBC)ベンチマークを紹介した。
私たちの3つのアーム制御設計(ベース、ベース、モデレーション、ベース、DBC)は、リスク低減の因果帰属を可能にする。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:45:26 GMT)
DEBISS: a Corpus of Individual, Semi-structured and Spoken Debates [0.0] DEBISSコーパス(英語: DEBISS corpus)は、半構造化された特徴を持つ話し言葉と個人の議論の集まりである。
スピーチ・トゥ・テキスト、話者ダイアリゼーション、議論マイニング、議論者の品質評価など、幅広いNLPタスクアノテーションを持つ。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:30:10 GMT)
Cyber Threat Intelligence for Artificial Intelligence Systems [0.0] 我々は、サイバー脅威インテリジェンスがどのように進化し、AIシステムをターゲットにした攻撃に対処するかを調査する。
AI指向の脅威知能知識基盤が持つべきものの概要を概説する。
収集された指標と新たに観測されたAIアーティファクトの類似性を測定する手法について議論する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:37:47 GMT)
Core-bound waves on a Gross-Pitaevskii vortex [0.0] 我々はGross-Pitaevskii vortex, varicoseおよびfluting waveのコアバウンド励起の解離族を見出した。
本稿では,バリコース波の生成と検出のための現実的な分光プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:59:55 GMT)
Core-based Hierarchies for Efficient GraphRAG [0.0] GraphRAGはドキュメントを階層的なコミュニティで要約可能な知識グラフに整理する。
現在のGraphRAGアプローチは、コミュニティ検出にライデンクラスタリングを頼っているが、平均次数が一定であり、ほとんどのノードが低次であるようなスパース知識グラフでは、モジュラリティ最適化は指数関数的に多くの準最適分割を許容する。
これを解決するために、線形時間における決定論的密度認識階層を生成するkコア分解をライデンに置き換えることを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 14:17:30 GMT)
Constant-Depth Quantum Imaginary Time Evolution Using Dynamic Fan-out Circuits [0.0] 動的量子回路は、中間回路計測と古典的なフィードフォワードを結合し、エンタングゲート深さを低減した回路構築を可能にする。
ファンアウトに基づく動的QITEは、測定値と2量子ゲート誤差が65%低減された場合、現在のデバイス上でのユニタリ実装よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:27:48 GMT)
Comparative Evaluation of Traditional Methods and Deep Learning for Brain Glioma Imaging. Review Paper [0.0] 脳グリオーマの分類は、パーソナライズされた予後予測、フォローアップケア、および疾患進行の監視に不可欠である。
グリオーマ研究において、不規則な組織はしばしば観察可能であるが、誤りのない再現可能なセグメンテーションは困難である。
本稿では,磁気共鳴画像取得後の有効セグメンテーションと分類手法について検討する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 04:23:40 GMT)
Classical shadows for non-iid quantum sources [0.0] トラッピング平均推定器に基づくロバストな古典的シャドウプロトコルを提案する。
我々は、そのサンプルの複雑さが、シャドウノルムによって支配されるスケーリングの標準であるdと一致することを証明した。
我々の結果は、i.i.d.体制を超えた影の形式主義の堅牢性を確立した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 13:05:28 GMT)
Classical Simulability from Operator Entanglement Scaling [0.0] ローエンタングルメント (LoE) はハイゼンベルク作用素の非局所構造を定量化し、多体カオスの診断として機能する。
LOE$-Rényiエントロピーのスケールを考慮すれば、作用素が行列積作用素(MPO)によって適切に近似できることを示す厳密な境界を提供する。
その結果、演算子の絡み合いが効率的なテンソルネットワークの表現可能性を意味するという期待を確固とした。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:18:05 GMT)
Classical Explanations in (and of) General Probabilistic Theories [0.0] 標準的なプルバック構成で説明が成り立つことを示す。
次に、各局所有限確率モデルが標準的、鋭い古典的説明を持つことを示す。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 19:35:41 GMT)
Calculating trace distances of bosonic states in Krylov subspace [0.0] 一般化したLanczosアルゴリズムを用いて,純ガウス状態と混合ガウス状態の間のトレース距離を計算する方法を示す。
また、混合ガウス状態間のトレース距離の低い境界をどうやって得るかを示し、連続変数量子システムにおける状態認証と学習のための実用的なツールを提供する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 18:59:06 GMT)
Bielik-Q2-Sharp: A Comparative Study of Extreme 2-bit Quantization Methods for a Polish 11B Language Model [0.0] ポーランド語大言語モデルに適用された極端2ビット量子化の最初の体系的学術評価であるBielik-Q2-Sharpを提案する。
我々は、QuIP#、SpinQuant+GPTQ、ButterflyQuant、QTIP、VPTQ、AQLMの6つの最先端のポストトレーニング量子化手法を比較した。
私たちのベストバリアント(QuIP# E8P12)は22のポーランドのベンチマークで71.92%、IQ2_XXSベースラインでは72.07%を達成しています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:39:41 GMT)
Beyond the Context Window: A Cost-Performance Analysis of Fact-Based Memory vs. Long-Context LLMs for Persistent Agents [0.0] 永続型AIシステムは、長いコンテキストの大規模言語モデル(LLM)に完全な会話履歴を渡すことと、構造化された事実を抽出して検索する専用のメモリシステムを維持することの選択肢に直面している。
我々は,Mem0フレームワーク上に構築されたファクトベースのメモリシステムと,3つのメモリ中心ベンチマーク上でのLLMの長文推論を比較した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:01:30 GMT)
Bayes with No Shame: Admissibility Geometries of Predictive Inference [0.0] 基準分離定理を証明し、許容可能な手続きの4つのクラスは対として非ネステッドである。
4つの基準はすべて共通の最適化テンプレートを共有しているが、制約セットは異なる空間、部分順序、パフォーマンスメトリクスで動作し、幾何学的に互換性がない。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 16:14:34 GMT)
BASIS: Balanced Activation Sketching with Invariant Scalars for "Ghost Backpropagation" [0.0] 正確なバックプロパゲーションに必要な活性化メモリは、ネットワーク深さ、コンテキスト長、特徴次元と線形にスケールする。
本稿では,活性化メモリをバッチ次元とシーケンス次元から完全に分離する効率的なバックプロパゲーションアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 20:38:25 GMT)
Asymmetric Distillation and Information Retention in Capacity-Constrained Cross-Modal Transfer [0.0] 我々は,500Mパラメータのグローバルビジョン変換器(CLIP ViT-B/32)を厳密に容量制限された局所受容野CNNに蒸留する際の次元崩壊現象について検討した。
頑健性を見極めることで、この81%の効果的次元の減少が教師固有のノイズ免疫をなくすことが判明した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 05:37:51 GMT)
All You Need is Amplifier: Spectral Imposters Without Pulse Shaping [0.0] 量子トラッキング制御は、所望のダイナミクスを調整された駆動フィールドにエンコードする。
本稿では、2つのシステムの応答間の即時ミスマッチに基づいて、比例制御器が単純な変換制限フィールドを連続的に補正するリアルタイムフィードバック制御フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 17:40:15 GMT)
Alignment Backfire: Language-Dependent Reversal of Safety Interventions Across 16 Languages in LLM Multi-Agent Systems [0.0] 加害者治療では、犯罪者は反省するが、行動の変化は従わない。
我々は、アライメントの介入が構造的に類似した現象を生じさせ、表面の安全性は、集合的な病理や内部の解離を覆い隠すか、あるいは発生させることを示した。
これらの所見は, リスクホメオスタシスと子宮新生にともなう行動介入としてのアライメントを再構成した。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 07:46:59 GMT)
Algorithmic Trust and Compliance: Benchmarking Brand Notability for UK iGaming Entities in Generative Search Engines [0.0] 私たちは、伝統的なランク付けされたリストから、合成された引用支援の回答へとシフトしているのを目撃しています。
英国のiGamingセクターのような高度に規制された環境では、視認性はキーワード密度によって規定されるのではなく、エンティティが"Algorithmic Trust"を投影する能力によって規定される。
最近の大規模な実験では、AI検索がブランドが所有するコンテンツに対して、アーンドメディア(第三者、権威のあるソース)に対して体系的で圧倒的な偏見を示しています。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 09:17:12 GMT)
AegisUI: Behavioral Anomaly Detection for Structured User Interface Protocols in AI Agent Systems [0.0] 現在のディフェンスは構文上停止する。このような動作ミスマッチをキャッチするために構築されることはない。
AegisUIは構造化されたUIペイロードを生成し、それらに現実的な攻撃を注入し、数値的特徴を抽出し、エンドツーエンドで異常検出をベンチマークする。
5つのアプリケーションドメインと5つのアタックファミリーにまたがる4000のラベル付きペイロードを生成しました。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 10:24:43 GMT)
A Non-Foster Superconducting Broadband Matching Network [0.0] ブロードバンドインピーダンスマッチングにおけるジョセフソン接合の代替的利用法を提案する。
ダークマターの説得力のある候補であるアクシオンは、弱い電磁信号を無数の周波数で変換する。
インピーダンスマッチングネットワークにおけるジョセフソン接合を用いて、これらの利得帯域幅制約を克服し、軸索探索の走査率を向上させる回路を提案する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 22:25:06 GMT)
A Dynamical Theory of Sequential Retrieval in Input-Driven Hopfield Networks [0.0] この研究はホップフィールドネットワークにおけるシーケンシャル推論の理論を発展させる。
我々は、利得閾値、逃避時間、崩壊状態を含む、自己持続型メモリ遷移の明確な条件を導出する。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:03:58 GMT)
A Benchmark Study of Neural Network Compression Methods for Hyperspectral Image Classification [0.0] 予測性能を維持しながらモデルサイズと計算コストを削減する圧縮技術が提案されている。
畳み込みニューラルネットワークにおける3つの広く利用されている圧縮戦略について検討する。
その結果, 圧縮モデルでは, 競争的分類性能を維持しながら, モデルサイズと計算コストを大幅に削減できることがわかった。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 01:48:30 GMT)
A 360-degree Multi-camera System for Blue Emergency Light Detection Using Color Attention RT-DETR and the ABLDataset [0.0] 本研究では,緊急車両の青信号検出システムについて述べる。
このシステムは4台の魚眼カメラを搭載しており、それぞれ180度の水平視野を備えており、車両の側面に取り付けられている。
YOLO(v5、v8、v10)、RetinaNet、Faster R-CNN、RT-DETRを含む主要なディープニューラルネットワークアルゴリズムの比較分析を行った。
論文参考訳(メタデータ) (Thu, 05 Mar 2026 11:12:28 GMT)