Online Experiential Learning for Language Models [99.9] Online Experiential Learning (OEL)は、言語モデルが自身のデプロイメントエクスペリエンスから継続的に改善できるフレームワークである。
OELは、まず、転送可能な経験知識を抽出し、ユーザ側で収集された相互作用軌跡から蓄積する。
テキストベースのゲーム環境において,複数のモデルスケールでOELを評価し,思考と非思考の両バリエーションについて検討した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:57:49 GMT)
InCoder-32B: Code Foundation Model for Industrial Scenarios [95.3] InCoder-32B(Industrial-Coder-32B)を導入し,チップ設計,GPUカーネル最適化,組み込みシステム,コンパイラ最適化,3Dモデリングなどのコードインテリジェンスを統合する。
InCoder-32Bは、産業領域にまたがる強力なオープンソースベースラインを確立しながら、一般的なタスクにおいて高い競争力を発揮する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:01:35 GMT)
OneWorld: Taming Scene Generation with 3D Unified Representation Autoencoder [90.8] 本研究では,コヒーレントな3次元表現空間内で直接拡散を行うOneWorldを提案する。
OneWorldは、最先端の2Dベースの方法と比較して、クロスビューの一貫性に優れた高品質な3Dシーンを生成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:43:37 GMT)
HopChain: Multi-Hop Data Synthesis for Generalizable Vision-Language Reasoning [86.8] Long CoT推論は、知覚、推論、知識、幻覚のエラーなど、さまざまな障害モードを公開する。
RLVRで使われている既存の視覚言語データのほとんどは、視覚的証拠に頼っている複雑な推論連鎖を含まない。
我々は、RLVRトレーニング専用にマルチホップ視覚言語推論データを合成するスケーラブルなフレームワークHopChainを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:04:58 GMT)
Kestrel: Grounding Self-Refinement for LVLM Hallucination Mitigation [86.4] 大規模視覚言語モデル(LVLM)はますます強まりつつあるが、マルチモーダルタスクにおいて幻覚を起こす傾向にある。
幻覚を避けるためにこれらのLVLMを訓練することは、より大きなモデルでは違法に高価になるため、トレーニングフリーな手法はこの問題に対して安価で柔軟な解決策を提供する。
我々は,視覚的視覚的接地剤とエビデンスを検証した自己修復機構を組み合わせた,LVLM幻覚軽減のためのトレーニングフリーフレームワークであるKestrelを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:30:47 GMT)
SocialOmni: Benchmarking Audio-Visual Social Interactivity in Omni Models [86.2] Social Omniは、3つのコア次元にわたる対話性の評価を運用するベンチマークである。
Social Omniは2000の知覚サンプルと209の相互作用生成インスタンスの品質管理された診断セットを備えている。
本分析により,モデルの知覚的精度と,文脈的に適切な割り込みを生成する能力との間に顕著な疎結合が明らかとなった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:58:44 GMT)
Persistent Story World Simulation with Continuous Character Customization [85.7] 本稿では,連続したストーリーキャラクタをカスタマイズするためのストーリーワールドシミュレータであるEverTaleを紹介する。
私たちのEverTaleは、シングルキャラクタとマルチキャラクタの両方のストーリービジュアライゼーションにおいて、より広範な比較手法に対して優れたパフォーマンスを実現しています。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:17:10 GMT)
ManiTwin: Scaling Data-Generation-Ready Digital Object Dataset to 100K [84.0] データ生成可能なデジタルオブジェクト双子を生成するパイプラインであるManiTwinを提案する。
我々は100Kの高品質な3Dアノテートを含むデータセットManiTwin-100Kを構築した。
ManiTwinは効率的なアセット合成とアノテーションのワークフローを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:59:49 GMT)
SpecSteer: Synergizing Local Context and Global Reasoning for Efficient Personalized Generation [79.8] SpecSteerは非対称な協調推論フレームワークで、デバイス上のプライベートコンテキストとクラウドスケールの推論を相乗化する。
実験により、SpecSteerは推論のギャップを埋め、パーソナライズされた生成性能を向上することを示した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:51:29 GMT)
Iris: Bringing Real-World Priors into Diffusion Model for Monocular Depth Estimation [79.2] textbfIrisはモノクロ深さ推定のための決定論的フレームワークである。
アイリスは、合成シーンから現実シーンへと強く一般化する。
Irisは、強力なインザワイルド一般化によるMDEの大幅な改善を実現している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:13:42 GMT)
Anticipatory Planning for Multimodal AI Agents [77.6] 予測推論を明示的に訓練する2段階強化学習フレームワークであるTraceR1を紹介する。
TraceR1は、オンラインコンピュータ使用、オフラインコンピュータ使用ベンチマーク、マルチモーダルツール使用推論タスクを含む、7つのベンチマークで評価されている。
以上の結果から,予測軌道推論は,複雑な実環境において効果的に推論,計画,行動が可能なマルチモーダルエージェント構築の鍵となる原理であることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:55:11 GMT)
MetaClaw: Just Talk -- An Agent That Meta-Learns and Evolves in the Wild [74.7] 大規模言語モデル(LLM)エージェントは、複雑なタスクにますます使われている。
既存の方法は、知識を蒸留せずに生の軌跡を保存するか、静的なスキルライブラリを維持するか、または再訓練のために破壊的なダウンタイムを必要とする。
本稿では,基本的なLCMポリシと再利用可能な行動スキルのライブラリを共同で進化させるメタ学習フレームワークであるMetaClawを紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:30:30 GMT)
Mixture of Style Experts for Diverse Image Stylization [73.8] StyleExpertは、Mixture of Experts (MoE)をベースにしたセマンティックアウェアフレームワークである
我々のフレームワークは、コンテンツスタイルのスタイリング三重項の大規模データセットに基づいて訓練された統一型スタイルエンコーダを使用している。
本手法は, 浅いテクスチャから深いセマンティクスまで, 複数のセマンティクスレベルにまたがる多様なスタイルを扱う。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:20:19 GMT)
PKINet-v2: Towards Powerful and Efficient Poly-Kernel Remote Sensing Object Detection [73.1] PKINet-v2は異方性軸ストリップ畳み込みと等方性正方核を共役し、マルチスコープの受容場を構築する。
PKINet-v2 は PKINet-v1 と比較して$bf3.9times$ FPS の高速化を実現している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:17:58 GMT)
DermaFlux: Synthetic Skin Lesion Generation with Rectified Flows for Enhanced Image Classification [72.1] DermaFluxは、臨床に接地した皮膚の病変画像を合成する修正フローベースのテキスト画像生成フレームワークである。
Llama 3.2で生成された合成テキストキャプションを用いて画像とテキストのペアを構築する。
ImageNet-pretrained ViT fine-tuned with only 2,500 real image and 4,375 DermaFlux- generated samples achieves 78.04% binary classification accuracy and a AUC of 0.859。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:25:46 GMT)
Demystifing Video Reasoning [71.5] ビデオモデルにおける推論は、主に拡散認知のステップに沿って現れることを示す。
モデル性能に重要ないくつかの創発的推論行動を特定する。
これらの知見に触発され、私たちは概念実証としてトレーニングフリー戦略を提示した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:59:55 GMT)
ViT-AdaLA: Adapting Vision Transformers with Linear Attention [71.4] ビジョントランスフォーマー (ViT) ベースの視覚基礎モデル (VFM) は、様々な視覚タスクにおいて顕著な性能を達成している。
ViTの既存の線形アテンションアプローチは、通常、スクラッチから訓練され、かなりの計算資源を必要とする。
本稿では,VFMから線形注意への事前知識の適応と伝達を効果的に行う新しいフレームワークであるViT-AdaLAを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:15:48 GMT)
GAP-MLLM: Geometry-Aligned Pre-training for Activating 3D Spatial Perception in Multimodal Large Language Models [70.6] このギャップは、幾何学的事前の不足から生じるものではなく、訓練パラダイムの誤った調整から生じるものである、と我々は主張する。
既存のアプローチでは、通常、特徴の結合を示唆し、幾何学的な監督なしに下流のタスクを直接最適化する。
本稿では,下流適応前の構造知覚を明示的に活性化する幾何学的事前学習パラダイムであるGAP-MLLMを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:43:48 GMT)
Locate-then-Sparsify: Attribution Guided Sparse Strategy for Visual Hallucination Mitigation [68.4] 機能ステアリングのためのLate-Then-Sparsify(LTS-FS)と呼ばれるプラグアンドプレイフレームワークを提案する。
各層の幻覚関係に応じて操舵強度を制御する。
我々の枠組みは、強い性能を維持しながら幻覚を効果的に緩和する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:16:50 GMT)
When Should a Robot Think? Resource-Aware Reasoning via Reinforcement Learning for Embodied Robotic Decision-Making [68.1] 身体ロボットシステムは、高レベルの推論をサポートするために、大規模言語モデル(LLM)ベースのエージェントにますます依存している。
エージェントはいつ、いつ、いつ行動すべきか?
本稿では,エンボディエージェントのリソース・アウェア・オーケストレーションのための階層的なフレームワークであるRARRL(Resource-Aware Reasoning via Reinforcement Learning)を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:38:50 GMT)
ClaimFlow: Tracing the Evolution of Scientific Claims in NLP [67.2] NLP文献のクレーム中心のビューである$texttClaimFlow$を紹介します。
新しいタスク $-$$textitClaim Relation Classification$$-$を定義する。
我々の分析によると、63.5$%の請求は決して再利用されない。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:43:36 GMT)
Look Before Acting: Enhancing Vision Foundation Representations for Vision-Language-Action Models [67.0] VLA(Vision-Language-Action)モデルは、ロボット操作のための有望なパラダイムとして登場した。
我々はtextbfVision-Language Mixture-of-Transformers (VL-MoT) フレームワーク上に構築した textbfDeepVision-VLA を提案する。
DeepVision-VLAは、シミュレーションされたタスクと実世界のタスクで、それぞれ9.0%と7.5%の先行の最先端メソッドより優れている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:04:49 GMT)
V-Co: A Closer Look at Visual Representation Alignment via Co-Denoising [65.6] 統合JTフレームワークにおける視覚的コデノゲーションの体系的研究であるV-Coについて述べる。
本研究は,視覚的コデノジングを効果的に行うための4つの重要な要素を明らかにする。
V-Coは、基礎となる画素空間拡散ベースラインと強い前の画素拡散法より優れている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:01:54 GMT)
OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis [63.9] 深層研究エージェントの訓練には、探索、証拠収集、多段階推論をインターリーブする長い水平軌道が必要である。
既存のデータ収集パイプラインは、一般的にプロプライエタリなWeb APIに依存しており、大規模な軌道合成をコストが高く、不安定で、再現が難しい。
再生可能なパイプラインであるOpenResearcherは,複数ターン軌道合成から1回のコーパスブートストラップを分離する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:10:12 GMT)
On the Emotion Understanding of Synthesized Speech [63.1] 感情は音声対話における中核的なパラ言語的特徴である。
現在の音声感情認識(SER)モデルは、合成音声に一般化できない。
生成音声言語モデル(SLM)は、パラ言語的手がかりを無視しながら、テキスト意味論から感情を推測する傾向がある。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:11:14 GMT)
Omnilingual SONAR: Cross-Lingual and Cross-Modal Sentence Embeddings Bridging Massively Multilingual Text and Speech [61.8] 言語間の文エンコーダは通常、数百の言語をカバーしている。
我々はOmniSONARを紹介した。OmniSONARは全言語、言語横断、言語横断の文埋め込みモデルである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:47:35 GMT)
Omanic: Towards Step-wise Evaluation of Multi-hop Reasoning in Large Language Models [60.4] OmanicはオープンドメインのマルチホップQAリソースであり、推論プロセスを分析するための構造アノテーションとして分解されたサブクエストと中間回答を提供する。
10,296個の機械によるトレーニング例(Omanic Synth)と967個の専門家による注釈付き評価例(OmanicBench)を含む。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:23:37 GMT)
Omnilingual MT: Machine Translation for 1,600 Languages [58.7] 我々は,1600以上の言語をサポートする最初の機械翻訳システムであるOmnilingual Machine Translation (OMT)を提案する。
このスケールは、大規模な公開多言語コーパスと新たに作成されたデータセットを統合する包括的なデータ戦略によって実現されている。
OMTモデルは言語間移動を改善し、1,600の評価において、MTのパズルの「理解」部分を解くのに近づいている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:43:42 GMT)
Breaking the Chain: A Causal Analysis of LLM Faithfulness to Intermediate Structures [58.5] 本稿では,出力を因果的に決定する因果評価プロトコルを提案する。
8つのモデルと3つのベンチマークで、モデルは自身の中間構造と自己整合しているように見えるが、最大60%のケースに介入した後に予測を更新できない。
全体として、スキーマ誘導パイプラインの中間構造は、安定した因果メディエータよりも影響のある文脈として機能する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:01:44 GMT)
Astrolabe: Steering Forward-Process Reinforcement Learning for Distilled Autoregressive Video Models [58.3] 蒸留自己回帰(AR)ビデオモデルは、効率的なストリーミング生成を可能にするが、しばしば人間の視覚的嗜好に反する。
蒸留ARモデルに適した効率的なオンライン強化学習フレームワークであるAstrolabeを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:32:18 GMT)
Structure-Aware Multimodal LLM Framework for Trustworthy Near-Field Beam Prediction [58.3] 近接場系では、球面波面伝播は従来のビームコードブックを合同角距離領域に拡張する。
我々は,歴史的GPSデータ,RGB画像,LiDARデータ,戦略的に設計されたタスク固有のテキストプロンプトを融合した,LLM駆動の多モーダルフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:52:13 GMT)
TurnWise: The Gap between Single- and Multi-turn Language Model Capabilities [57.9] 我々は、シングルターンチャット評価と直接比較できるマルチターン機能のための新しいベンチマークであるTurnWiseEvalを導入する。
また、マルチターントレーニングデータのスケーラブルな生成を可能にする合成マルチターンデータパイプラインであるTurnWiseDataについても紹介する。
Olmo 3 を用いた実験により,マルチターンデータによるトレーニングが,マルチターンチャットの性能向上に不可欠であることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:40:35 GMT)
DyJR: Preserving Diversity in Reinforcement Learning with Verifiable Rewards via Dynamic Jensen-Shannon Replay [57.8] 既存のエクスペリエンスリプレイメソッドは、直接ポリシー更新のための正確なサンプルを再利用することで、この問題に対処する。
歴史的データは単に正確性を強化するのではなく、持続的な多様性を優先すべきである、と我々は主張する。
本稿では,シンプルで効果的な正規化フレームワークであるLEPJRを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:20:56 GMT)
SignNav: Leveraging Signage for Semantic Visual Navigation in Large-Scale Indoor Environments [57.8] 人間は、大規模屋内環境内の目的地に向かうために、手話によって提供される意味的ヒントを日常的に活用する。
本稿では,手話からの意味的ヒントを解釈し,現在の観察に基づくその後の行動の推論を行うための,新しい具体的ナビゲーションタスクSignNavを紹介する。
空間認識モジュールは物理的世界へのサインの意味的ヒントを基盤として,時間認識モジュールは歴史的状態と現在の観測との長距離依存性を捉えている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:36:26 GMT)
HIPO: Instruction Hierarchy via Constrained Reinforcement Learning [57.4] textscHIPOは、制約付きマルコフ決定プロセスとしてHIFを定式化する新しいアライメントフレームワークである。
textscHIPOはシステムプロンプトを単に入力コンテキストから厳密なアルゴリズム境界まで高める。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:12:41 GMT)
How to Utilize Complementary Vision-Text Information for 2D Structure Understanding [56.0] DiVA-Formerは、視覚とテキスト情報を効果的に統合するために設計された軽量アーキテクチャである。
13のテーブルベンチマークで評価され、DiVA-Formerは純粋テキストベースラインを23.9%改善した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:30:01 GMT)
The Finetuner's Fallacy: When to Pretrain with Your Finetuning Data [55.9] 本稿では,トークンの総数に占めるプレトレーニングから始めて,小さなドメインデータセットを繰り返す,SPT(Special Pretraining)というシンプルな戦略について検討する。
我々の実験では、SPTは与えられたドメインの性能に到達するのに必要な事前学習トークンを最大1.75倍まで削減する。
ファインタニングは、ドメイン適応への最も安い道のように見えるが、事前訓練中に特別なドメインデータを導入することは、その実用性を広げる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:55:53 GMT)
ASCENT: Transformer-Based Aircraft Trajectory Prediction in Non-Towered Terminal Airspace [54.9] ASCENTは、マルチモーダル3D航空機の軌道予測のための軽量トランスフォーマーベースのモデルである。
ドメイン対応の3D座標正規化とパラメータ化予測を統合している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:16:10 GMT)
Empirical Recipes for Efficient and Compact Vision-Language Models [54.9] リソース制約のある設定における視覚言語モデル(VLM)は低レイテンシと高スループットを必要とする。
実験的なエンドツーエンドの効率分析と系統的なプロファイル推論を行い、主要なボトルネックを特定します。
精度を保ちながらレイテンシを大幅に低減する,コンパクトなVLMに適した最適化レシピを開発した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:17:40 GMT)
World Reconstruction From Inconsistent Views [54.1] ビデオ拡散モデルは多様な世界を生成するが、個々のフレームは出力シーケンス全体の3D一貫性を欠いていることが多い。
ビデオフレームをグローバルに一貫性のある座標フレームに厳密に整列させることにより、これらの不整合を処理する新しい手法を提案する。
我々は,我々の3Dシーンがベースラインよりも高品質であることを示し,映像モデルを効果的に3D一貫性のあるワールドジェネレータにする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:18:08 GMT)
EFF-Grasp: Energy-Field Flow Matching for Physics-Aware Dexterous Grasp Generation [54.1] EFF-Graspは、物理を意識したデクサラスグリップ生成のためのフローマッチング合成ベースのフレームワークである。
我々は、スムーズな確率フローによる効率的な安定な生成を可能にする決定論的常微分方程式(ODE)プロセスとして、グリップを再構成する。
EFF-Graspは、拡散ベースラインよりもサンプリングステップを著しく少なくしながら、把握品質と物理的実現性において優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:11:56 GMT)
Molecular Identifier Visual Prompt and Verifiable Reinforcement Learning for Chemical Reaction Diagram Parsing [52.8] 反応図解析(RxnDP)は、文献から化学合成情報を抽出するために重要である。
近年の視覚言語モデル(VLM)はこの複雑な視覚的推論タスクを自動化するための有望なパラダイムとして登場した。
この研究はVLMベースのRxnDPを2つの相補的視点、すなわち表現の促進と学習パラダイムから強化する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:44:32 GMT)
Alternating Gradient Flow Utility: A Unified Metric for Structural Pruning and Dynamic Routing in Deep Networks [52.2] 交互勾配流(Alternating Gradient Flow, AGF)に着想を得た非結合型運動パラダイムを提案する。
AGFはネットワークの構造的「運動ユーティリティ」を正確にキャプチャする
我々は、AGFに誘導されるオフライン構造探索を、ゼロコストの物理プリミティブを介してオンライン実行から切り離すハイブリッドルーティングフレームワークを設計する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:35:13 GMT)
SQL-ASTRA: Alleviating Sparse Feedback in Agentic SQL via Column-Set Matching and Trajectory Aggregation [51.7] 本稿では,効率的な軌道レベル評価と高密度ステップレベル信号の提供を目的とした,普遍的な2層報酬機構を特徴とするフレームワークを提案する。
伝統的なパラダイムでは、報酬は最終ターンのフィードバックによってのみ決定され、中間プロセスを無視し、曖昧な信用評価をもたらす。
提案手法は,同一モデルを用いてBIRD 2.0上でのSOTA Arctic-Text2-R1-7Bより優れており,頑健なマルチターンエージェントのパラダイムに向けてテキストから逆収束を推進していることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:26:36 GMT)
Gym-V: A Unified Vision Environment System for Agentic Vision Research [51.6] Gym-Vは、手続き的に生成された10ドメインにわたる179の視覚環境の統一プラットフォームであり、制御が難しい。
我々は,RLアルゴリズムの選択よりも,観測足場がトレーニングの成功に決定的であることを見出した。
クロスドメイン転送実験は、多様なタスクのトレーニングが広範囲に一般化され、狭いトレーニングが負の転送を引き起こすことを示している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:07:16 GMT)
Diffusion Models for Joint Audio-Video Generation [51.6] 高品質でペアのオーディオビデオデータセットを2つリリースします。
データセットのスクラッチからMM-拡散アーキテクチャをトレーニングします。
逐次2段階のテキスト・オーディオ・ビデオ生成パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:31:37 GMT)
Adversarial attacks against Modern Vision-Language Models [51.6] 我々は,現実的な事前デプロイ条件をシミュレートするために構築された自己完結型eコマース環境に配備された,オープンソースの視覚言語モデル(VLM)エージェントの敵対的堅牢性について検討した。
LLaVA-v1.5-7BとQwen2.5-VL-7Bの2剤を3種類の勾配攻撃下で評価した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:55:10 GMT)
Decoding the Critique Mechanism in Large Reasoning Models [50.8] 大規模推論モデル(LRM)は、バックトラックと自己検証メカニズムを示し、中間ステップを修正して正しい解に到達できるようにする。
中間推論ステップに算術ミスを挿入することにより,現在のLEMがエラーからどのように回復するかを検討する。
チェーン・オブ・シークレットを伝播する誤りにもかかわらず、モデルは依然として正しい最終解に達している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:03:30 GMT)
Scaling Attention via Feature Sparsity [50.6] 超長期のコンテキストにトランスフォーマーをスケールすることは、自己注意のコスト$O(n2 d)$コストによってボトルネックとなる。
本稿では,高次元表現性を維持するために,クエリとキーを$k$sparseコードとして表現するスパース特徴注意法を提案する。
GPT-2とQwen3の事前トレーニングで、SFAは密度の高いベースラインにマッチし、最高2.5タイムのスピードを向上し、FLOPとKVキャッシュを50%近く削減した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:41:50 GMT)
LibraGen: Playing a Balance Game in Subject-Driven Video Generation [49.5] 本稿では,S2V生成の基盤モデルの拡張を,本質的なVGFM強度とS2V能力のバランスゲームとみなす新しいフレームワークを提案する。
自動と手動のデータフィルタリングを組み合わせたハイブリッドパイプラインを構築し、全体的なデータ品質を改善します。
実験結果から、LibraGenは、数千スケールのトレーニングデータのみを使用して、オープンソースと商用のS2Vモデルの両方より優れていることが示された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:01:19 GMT)
Learning Human-Object Interaction for 3D Human Pose Estimation from LiDAR Point Clouds [49.2] LiDARポイントクラウドから人間を理解することは、自動運転における最も重要なタスクの1つだ。
既存の手法は、人間とオブジェクトの相互作用を活用して、堅牢な3Dポーズ推定フレームワークを構築する可能性を大きく見落としている。
そこで我々は,LiDAR点雲からの堅牢な3次元ポーズ推定のためのヒューマン・オブジェクト・インタラクション・ラーニング・フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:20:29 GMT)
DynHD: Hallucination Detection for Diffusion Large Language Models via Denoising Dynamics Deviation Learning [48.8] 拡散大言語モデル (D-LLM) は自己回帰モデルに代わる有望な代替品として登場した。
幻覚は 信頼性を損なう重要な問題です
本研究では,これらのギャップを空間的(トケンシーケンス)と時間的(デノナイジングダイナミクス)の両方の観点から橋渡しするDynHDを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:40:29 GMT)
TrackDeform3D: Markerless and Autonomous 3D Keypoint Tracking and Dataset Collection for Deformable Objects [48.8] 本稿では、RGB-Dカメラのみを用いて、変形可能なオブジェクトの3Dデータセットを収集するための安価なフレームワークを提案する。
提案手法は3次元キーポイントを同定し,動きの整合性制約を組み込んだトラジェクトリを頑健に追跡する。
本稿では,6つの変形可能なオブジェクトからなる,110分間の軌跡データからなる高品質な大規模データセットを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:53:04 GMT)
InstantHDR: Single-forward Gaussian Splatting for High Dynamic Range 3D Reconstruction [48.6] 既存のHDRパイプラインは、既知のカメラのポーズ、よく校正された高密度ポイントクラウド、シーンごとの時間的最適化に依存している。
現在のフィードフォワード代替品は、露出イン外観を仮定してHDR問題を見落としている。
フィードフォワードネットワークであるInstantを提案する。これは、1つのフォワードパスで非校正多重露光LDRコレクションから3次元HDRシーンを再構成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:53:02 GMT)
Language Models Don't Know What You Want: Evaluating Personalization in Deep Research Needs Real Users [48.6] Deep Research (DR) ツールは、研究者の問い合わせに答えるために科学論文を合成できるが、ユーザに対する理解が欠如している。
本研究では、ユーザの研究関心のプロファイルを推測するパーソナライズされたDRツールを開発し、ユーザの入力クエリに対するパーソナライズされたアクションを提案する。
LLM の審査員が検出不能なパーソナライズドDRの9つのニュアンスドエラーを明らかにし,定性的なフィードバックを用いて将来のDR設計のレッスンを作成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:59:32 GMT)
WorldCam: Interactive Autoregressive 3D Gaming Worlds with Camera Pose as a Unifying Geometric Representation [48.0] 我々は、地上での即時動作制御と長期3次元一貫性を統一した幾何学的表現として、カメラのポーズを確立する。
本手法は, アクション制御性, 長時間の視覚的品質, 3次元空間の整合性において, 最先端の対話型ゲームワールドモデルよりも大幅に優れる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:59:56 GMT)
VIEW2SPACE: Studying Multi-View Visual Reasoning from Sparse Observations [47.9] 多視点視覚推論は、スパースと離散的な視点から複雑な環境を理解する必要があるインテリジェントシステムにとって不可欠である。
現実のシナリオでは、ビュー間の推論は、明示的なガイダンスなしで部分的な観察を統合する必要がある。
我々は物理基底シミュレーションを利用して、ビュー毎の正確なメタデータを持つ多種多様な高忠実な3Dシーンを構築する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:36:30 GMT)
When the City Teaches the Car: Label-Free 3D Perception from Infrastructure [47.7] 自動運転のための堅牢な3D認識の構築は、依然として大規模なデータ収集と手動のアノテーションに大きく依存している。
現代の都市は、道路サイドユニット(RSU)、道路に沿って配置された静的センサー、そして交通を監視するために交差点に配置されている。
本稿では,RSUがエゴ車両の教師なしの静止型教師として機能する,インフラストラクチャトレートでラベルのない3D知覚手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:21:06 GMT)
Whose Knowledge Counts? Co-Designing Community-Centered AI Auditing Tools with Educators in Hawai`i [47.7] ジェネレーティブAIは、教師を支援するという約束で教室に展開されている。
教育者は、これらのツールが意図しない教育的反感を引き起こす可能性があることを警告します。
ハワイの公立学校がハワイの言語と文化を教育に統合する州全体の委任統治の下で運営されているハワイにおけるこれらの課題について検討する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:17:08 GMT)
SOMA: Unifying Parametric Human Body Models [47.4] パラメトリックな人体モデルは、人間の再構築、アニメーション、シミュレーションの基礎となっているが、それらは相互に相容れないままである。
これらの異種表現を3つの抽象層を通して変換する統一体層であるSOMAを提案する。
パイプライン全体は完全に差別化可能で、NVIDIA-Warp経由でGPUを加速する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:58:03 GMT)
DexGrasp-Zero: A Morphology-Aligned Policy for Zero-Shot Cross-Embodiment Dexterous Grasping [47.0] 異種手動と身体的制約により、クロス・エボディメントの把握は困難である。
既存のアプローチは通常、中間運動目標を予測し、それぞれの実施形態に再ターゲットする。
多様な実施形態から普遍的な把握能力を学ぶ政策である textitDexGrasp-Zero を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:10:29 GMT)
V-JEPA 2.1: Unlocking Dense Features in Video Self-Supervised Learning [46.9] V-JEPA 2.1は、画像とビデオの両方の濃密で高品質な視覚表現を学習する自己教師型モデルのファミリーである。
V-JEPA 2.1は、密集した視覚的理解と世界モデリングにおける最先端の進歩を示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:12:31 GMT)
Kinema4D: Kinematic 4D World Modeling for Spatiotemporal Embodied Simulation [46.2] Kinema4Dは、ロボットと世界の相互作用を、ロボットの正確な4D表現、すなわち環境反応の生成4Dモデリングに分解する、アクションコンディショナブルな新しい4D生成ロボットシミュレータである。
初めてゼロショット転送能力を示し、次世代のエンボディドシミュレーションを進めるための高忠実度基盤を提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:36:38 GMT)
Multi-Agent Reinforcement Learning Counteracts Delayed CSI in Multi-Satellite Systems [46.1] 本研究では,BS(分散基地局)として機能する複数の衛星の移動地ユーザへのダウンリンク伝送について検討した。
本稿では,ユーザの総和率の最大化を目的としたマルチエージェント強化学習(MARL)アルゴリズムを提案する。
具体的には、DS-PPOの第1段は個々の衛星の総和レートを最大化し、第2段は、すべての衛星が協調して分散マルチアンテナBSを形成する際の総和レートを最大化する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:58:22 GMT)
Exclusivity-Guided Mask Learning for Semi-Supervised Crowd Instance Segmentation and Counting [46.1] 本研究では,現在のデータセットに対するマスク監視を実現するために,排他制約付きデュアルプロンプトSAM(EDP-SAM)を提案する。
次に、識別マスクの目的によって空間的分離を行う排他性指導型マスク学習(XMask)を提案する。
XMaskをベースとして,ケースマスクを擬似ラベルとして利用する,半教師付きクラウドカウントフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:25:57 GMT)
AgriPath: A Systematic Exploration of Architectural Trade-offs for Crop Disease Classification [45.5] 本研究は、細粒度作物病分類のための3つのモデルパラダイムの体系的比較を示す。
我々は16の作物と41の病気にまたがる111kの画像を含むベンチマークであるAgriPath-LF16を紹介する。
CNNは画像の精度が最も高いが、ドメインシフトによって劣化する。
対照的なVLMは、競合するクロスドメイン性能を持つ堅牢でパラメータ効率の良い代替手段を提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:54:10 GMT)
The PokeAgent Challenge: Competitive and Long-Context Learning at Scale [45.2] PokeAgent Challengeは意思決定研究のための大規模なベンチマークだ。
Pokemonのマルチエージェントバトルシステムと拡張型ロールプレイングゲーム(RPG)環境上に構築されている。
我々のNeurIPS 2025コンペティションは、私たちのリソースの品質と、Pokemonに対する研究コミュニティの関心の両方を検証します。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:05:02 GMT)
Exploring different approaches to customize language models for domain-specific text-to-code generation [44.0] 合成データセットを用いて、ドメイン固有のコード生成に適用可能な言語モデルについて検討する。
Pythonエコシステム内の3つのドメインにわたるプログラミング演習のデータセットを構築します。
提案手法は,少数ショットプロンプト,検索拡張生成,パラメータ効率の微調整の3つである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:49:31 GMT)
LLM NL2SQL Robustness: Surface Noise vs. Linguistic Variation in Traditional and Agentic Settings [43.7] 約10種類の摂動を含むロバストネス評価ベンチマークを導入する。
我々はGrok-4.1、Gemini-3-Pro、Claude-Opus-4.6、GPT-5.2を含む複数の最先端の大規模言語モデル(LLM)を評価する。
従来のパイプラインでは,表面レベルのノイズが大きな性能低下を引き起こすのに対して,言語的変動はエージェント設定において大きな課題を呈する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:02:04 GMT)
High-Dimensional Gaussian Mean Estimation under Realizable Contamination [43.6] 本研究では,$mathbbRd$における同一性共分散を持つガウス分布の平均推定を,$$$-contaminationモデルと呼ばれるデータスキームの欠如の下で行う。
このモデルでは、相手は 0 から $$ の間の関数 $r(x)$ を選択でき、各サンプル $x$ は確率 $r(x)$ で失われる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:04:18 GMT)
Tabular LLMs for Interpretable Few-Shot Alzheimer's Disease Prediction with Multimodal Biomedical Data [43.4] TAP-GPT Tabular Alzheimer's Prediction GPTを提案する。
QT-PADバイオマーカーや領域レベルの構造MRI,アミロイドPET,タウPETなど,ADNI由来の4つのデータセットを対象としたTAP-GPTの評価を行った。
そこで本研究では,TAP-GPTはシミュレーションおよび実世界の欠如下で安定な性能を維持していることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:43:50 GMT)
S-VAM: Shortcut Video-Action Model by Self-Distilling Geometric and Semantic Foresight [42.7] ビデオアクションモデル(VAM)は、ロボット学習のための有望なパラダイムとして登場した。
S-VAMは、1つのフォワードパスを介してコヒーレントな幾何学的および意味的表現を予測できるショートカットビデオアクションモデルである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:21:28 GMT)
DriveFix: Spatio-Temporally Coherent Driving Scene Restoration [42.4] DriveFixは、自動運転シーンのための新しいマルチビュー復元フレームワークである。
提案手法では,時間的空間コヒーレンスとクロスカメラ空間コヒーレンスの両方をモデル化するために,特殊なブロックを持つインターリーブ拡散トランスフォーマアーキテクチャを用いる。
復元されたビューは統一された3D幾何学に従属し、アーティファクトを著しく減少させる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:41:14 GMT)
DUCTILE: Agentic LLM Orchestration of Engineering Analysis in Product Development Practice [42.0] 製品開発におけるエンジニアリング分析の自動化は、ツール、データフォーマット、ドキュメントプロセス間の厳密なインターフェースに依存しています。
本稿では DUCTILE (Delegated, User-supervised Coordination of Tool- and document-Integrated LLM-Enabled) エージェントオーケストレーションについて述べる。
エージェントは、文書化された設計プラクティスを解釈し、入力データを検査し、処理パスを適応し、エンジニアは最終判断を監督し、実行する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:22:06 GMT)
SWE-QA-Pro: A Representative Benchmark and Scalable Training Recipe for Repository-Level Code Understanding [42.0] SWEQA-Proは,多種多様な長期リポジトリと実行可能な環境から構築されたベンチマークである。
さらに,2段階のトレーニングレシピであるSupervised Fine-Tuning(SFT)とReinforcement Learning from AI Feedback(RLAIF)という,スケーラブルな合成データパイプラインを提案する。
SWE-QA-ProのGPT-4oを2.3ポイント超え、最先端モデルとのギャップを大幅に狭める。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:12:48 GMT)
Medical Reasoning with Large Language Models: A Survey and MR-Bench [41.1] 大規模言語モデル(LLM)は、医学試験スタイルのタスクにおいて高いパフォーマンスを達成している。
臨床的意思決定は本質的に安全に重要であり、文脈に依存し、進化する証拠の下で行われる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:03:09 GMT)
More Test-Time Compute Can Hurt: Overestimation Bias in LLM Beam Search [40.9] 本稿では、雑音の多いスコアラー出力に対するビーム選択に基づいて、エクストリーム値理論に基づく分析を行う。
我々は,探索性能を劣化させる最大ビーム幅$hatk$を導出する。
本分析では,ビーム幅選択を規定する鍵量として,スコアの信号対雑音比を同定する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:04:49 GMT)
Surg$Σ$: A Spectrum of Large-Scale Multimodal Data and Foundation Models for Surgical Intelligence [40.5] 手術情報のための大規模マルチモーダルデータと基礎モデルのスペクトルであるSurg$を紹介した。
このフレームワークのコアとなるSurg$-DBは、多様な外科的タスクをサポートするように設計された大規模マルチモーダルデータ基盤である。
我々は最近開発されたSurg$-DBに基づく外科的基礎モデルを通して経験的証拠を提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:27:32 GMT)
Chipmunq: Fault-Tolerant Compiler for Chiplet Quantum Architectures [40.1] 我々は,フォールトトレラント回路をモジュールアーキテクチャにマッピングし,ルーティングするためのハードウェア対応コンパイラChipmunqを紹介する。
Chipmunqは、最先端のツールに比べてコンパイル時間の13.5倍のスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:20:37 GMT)
HYDRA: Unifying Multi-modal Generation and Understanding via Representation-Harmonized Tokenization [39.8] 単一パラメータ空間内に知覚と生成を統合するネイティブ統一フレームワークHYDRAを提案する。
ビジュアル再構成(rFID 0.08)とGenEval(0.86)、DPG-Bench(86.4)、WISE(0.53)の上位世代のパフォーマンスのベンチマークを設定し、同時に8つの難解な理解ベンチマークで平均10.0ポイントを上回った。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:46:55 GMT)
Ground Reaction Inertial Poser: Physics-based Human Motion Capture from Sparse IMUs and Insole Pressure Sensors [39.7] Ground Reaction Inertial Poser (GRIP) は、4つのウェアラブルデバイスを用いて物理的に可塑性な人間の動作を再構築する手法である。
従来のIMUのみのアプローチとは異なり、GRIPはIMU信号と足圧データを組み合わせて身体力学と地上相互作用の両方を捉える。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:20:39 GMT)
Byzantine-Robust and Communication-Efficient Distributed Training: Compressive and Cyclic Gradient Coding [39.6] 通信制約のあるビザンチン攻撃下での分散訓練(DT)の問題点について検討する。
循環勾配符号化に基づく新しいDT法(LAD)を提案する。
LADはビザンチン攻撃に対する堅牢性を向上し、ソリューションエラーを大幅に低減している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:22:04 GMT)
OPERA: Online Data Pruning for Efficient Retrieval Model Adaptation [39.5] ドメイン固有の微調整は、高密度レトリバーにとって不可欠であるが、すべてのトレーニングペアが学習プロセスに等しく貢献するわけではない。
我々は、この不均一性を利用して、検索モデル適応の有効性と効率を両立させるデータプルーニングフレームワークであるOPERAを紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:11:45 GMT)
Fast-WAM: Do World Action Models Need Test-time Future Imagination? [39.2] 世界行動モデル(WAM)は、身体制御のためのビジョン・ランゲージ・アクション(VLA)モデルに代わる有望な代替品として登場した。
我々は、WAMがテスト時に明らかに将来的な想像力を必要とするのか、それともトレーニング中に主にビデオモデリングから得られる利益なのかを問う。
我々は、トレーニング中にビデオのコトレーニングを継続するが、テスト時に将来の予測を省略するWAMアーキテクチャであるFast-WAMを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:33:43 GMT)
Age Predictors Through the Lens of Generalization, Bias Mitigation, and Interpretability: Reflections on Causal Implications [39.1] 本稿では、逆表現学習に基づく解釈可能なニューラルネットワークモデルの範囲について述べる。
本モデルの結果は,エナミプレチドがマウス骨格筋および心臓筋に及ぼす影響を実証した論文の予測結果と一致している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:10:11 GMT)
Adaptive Moments are Surprisingly Effective for Plug-and-Play Diffusion Sampling [38.7] 適応モーメント推定法を用いてサンプリング中の雑音の確率スコアを安定化する。
提案手法は,画像復元とクラス条件生成タスクにおける最先端の成果を実現する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:04:07 GMT)
VQKV: High-Fidelity and High-Ratio Cache Compression via Vector-Quantization [38.6] 大きな言語モデル(LLM)はキーバリュー(KV)キャッシュを拡張し、リソース制限された環境へのデプロイメントを制限する。
本稿では,ベクトル量子化(VQ)を導入し,高モデル忠実性を保ちながら高度に圧縮されたKV表現を得る新しい学習自由手法であるVQKVを提案する。
その結果、VQKVはLLaMA3.1-8Bの圧縮率82.8%を達成し、LongBenchのベースライン性能の98.6%を維持し、同じメモリフットプリントで4.3倍の長大な生成を可能にする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:16:06 GMT)
PhysQuantAgent: An Inference Pipeline of Mass Estimation for Vision-Language Models [38.2] 視覚言語モデル(VLM)を用いた実世界の物体質量推定フレームワークPhysQuantAgentを提案する。
本稿では,対象物のサイズや内部構造を理解するために,対象物の検出,スケール推定,断面画像生成によって入力画像を強化する3つの視覚的プロンプト手法を提案する。
実験の結果,視覚的プロンプトにより実世界のデータに対する質量推定精度が大幅に向上し,空間推論とVLM知識の統合の有効性が示唆された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:35:36 GMT)
Proactive Rejection and Grounded Execution: A Dual-Stage Intent Analysis Paradigm for Safe and Efficient AIoT Smart Homes [37.9] 本稿では,低レベルの物理的実行から高レベルのユーザ意図理解を分離するためのDual-Stage Intent-Aware (DS-IA)フレームワークを提案する。
試験の結果、DS-IAは58.56%(ベースラインを28%以上上回る)のエクサクトマッチ(EM)を達成し、無効命令の拒否率を87.04%に改善した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:38:39 GMT)
RecBundle: A Next-Generation Geometric Paradigm for Explainable Recommender Systems [37.2] 本稿では,現代の微分幾何学からFiber Bundleを導入し,レコメンダシステムのための新しい幾何学的解析パラダイムを提案する。
そこで我々は,次世代レコメンデータシステムを対象としたフレームワークRecBundleを構築した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:25:05 GMT)
WorkRB: A Community-Driven Evaluation Framework for AI in the Work Domain [37.1] textbfWorkRB(Work Research Benchmark)は、ワークドメインAIに合わせた、オープンソースのステークホルダ駆動型ベンチマークである。
WorkRBは7つのタスクグループから13のタスクを統合されたレコメンデーションとNLPタスクとして編成し、ジョブ/スキルレコメンデーション、候補レコメンデーション、類似アイテムレコメンデーション、スキル抽出と正規化などが含まれる。
WorkRBは、機密データを開示することなく、シームレスなコントリビューションとプロプライエタリなタスクの統合のためのモジュール設計を持っている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:56:42 GMT)
Relationship-Aware Safety Unlearning for Multimodal LLMs [36.9] マルチモーダルモデルは、特定のアクションや関係によってリンクされた場合に本質的に安全でない安全障害を示すことができる。
我々は、安全でないオブジェクト(O-ROtext)を明示的に表現するフレームワーク、関係認識型安全学習を提案する。
パラフレーズによるCLIPに基づく実験と評価,文脈的ロバスト性,アウト・オブ・ディストリビューション・イメージ・アタックを含む。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:58:50 GMT)
Between the Layers Lies the Truth: Uncertainty Estimation in LLMs Using Intra-Layer Local Information Scores [36.9] 大きな言語モデル(LLM)は、しばしば自信を持って間違っているため、確実な不確実性推定(UE)が不可欠である。
本稿では,1つのフォワードパスを用いて内部表現における層間パターンをスコアリングする,コンパクトでインスタンスごとのUE手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:35:14 GMT)
CABTO: Context-Aware Behavior Tree Grounding for Robot Manipulation [36.7] Behavior Trees (BT) はモジュール式でリアクティブなロボットコントローラを設計するための強力なパラダイムを提供する。
BTプランニングは、信頼性のあるBTの自動生成に関する理論的保証を提供する。
BTグラウンディング問題を効率的に解くための最初のフレームワークであるCABTOを紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:12:46 GMT)
M^3: Dense Matching Meets Multi-View Foundation Models for Monocular Gaussian Splatting SLAM [36.3] M3はMulti-view基盤モデルを専用のMatchingヘッドで拡張し、細粒度の密度の高い通信を容易にする。
室内および屋外の様々なベンチマークの実験は、ポーズ推定とシーン再構成の両方において最先端の精度を示している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:52:37 GMT)
Conservative Offline Robot Policy Learning via Posterior-Transition Reweighting [36.2] PTR(Posterior-Transition Reweighting)は、報酬のない、保守的なポストトレーニング手法である。
各トレーニングサンプルが管理された更新にどの程度影響するかを決定する。
PTRは、各サンプルの反応後の結果が現在の表現の下にあるかに応じてクレジットを再配置する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:05:35 GMT)
MosaicMem: Hybrid Spatial Memory for Controllable Video World Models [35.7] Mosaic Memory(モザイクメモリ、MosaicMem)は、パッチを3Dに上げ、信頼性の高いローカライゼーションとターゲット検索を行うハイブリッド空間メモリである。
MosaicMemは、パッチ・アンド・コンプリートインターフェースを通じてクエリビューにパッチを構成する。
MosaicMemはさらに、ミニレベルナビゲーション、メモリベースのシーン編集、自動回帰ロールアウトを可能にする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:19:44 GMT)
What DINO saw: ALiBi positional encoding reduces positional bias in Vision Transformers [35.6] 視覚変換器(ViT)は、多くの下流タスクに有用なリッチな表現を学習する。
アーキテクチャ上の選択(位置エンコーディングなど)は、これらのモデルに意味的コンテンツとは無関係に位置バイアスやアーチファクトを表示します。
本研究では, 線形探索によるVTの位置偏差について検討し, 様々な目的や位置エンコーディングにまたがって存在することを明らかにする。
これらのモデルが望ましい一般的な意味を保ち、複雑な顕微鏡画像のトレーニング可能なセグメンテーションにおいて、その不偏な特徴をうまく利用できることを実証する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:46:41 GMT)
Learning through Creation: A Hash-Free Framework for On-the-Fly Category Discovery [35.5] OCDは、推論中に新しいカテゴリーを同時に発見しながら、既知のクラスを認識することを目的としている。
限定ラベル付きデータに最適化されたモデルが、推論中に定性的に異なる発見目標を実行することを期待するのは理にかなっている。
オフライン学習に直接新規カテゴリ認識を注入する,完全機能ベースかつハッシュフリーなフレームワークであるLearning Through Creation (LTC)を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:50:33 GMT)
Neural networks for Text-to-Speech evaluation [35.3] 音声合成システムは、人間の知覚された品質を大規模に提供する必要がある。
Mean Opinion Score (MOS) や Side-by-Side (SBS) のような人間の主観評価プロトコルは、事実上のゴールド標準のままである。
本研究では、これらの障壁を定式化し、新しいニューラルモデルスイートを実装して解決する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:07:15 GMT)
SAGE: Multi-Agent Self-Evolution for LLM Reasoning [34.7] 検証可能な報酬を用いた強化学習は、大規模言語モデル(LLM)の推論を改善する
SAGEはクローズドループフレームワークで、Challenger、Planner、Solver、Criticの4つのエージェントが、小さなシードセットのみを使用して共有LLMバックボーンから共進化する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:31:05 GMT)
UIS-Digger: Towards Comprehensive Research Agent Systems for Real-world Unindexed Information Seeking [34.5] Unindexed Information Seeking (UIS) は、サーチエンジンクローラーによって重要な情報が取得されない場所である。
110のエキスパートアノテートされたQAペアからなるUISベンチマークであるUIS-QAを紹介する。
デュアルモードブラウジングと同時Webページ検索とファイル解析を可能にする新しいマルチエージェントフレームワークであるUIS-Diggerを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:22:32 GMT)
BATQuant: Outlier-resilient MXFP4 Quantization via Learnable Block-wise Optimization [34.4] MXFP4に適用した場合, 評価後量子化法は深刻な性能低下に悩まされる。
本稿では,MXFPと整合する変換を制限するBATQuantを提案する。
我々は、BATQuantが攻撃的なW4A4KV16構成の下で、最先端の新たな結果を確立することを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:37:08 GMT)
Physics-integrated neural differentiable modeling for immersed boundary systems [33.5] 本研究では,入力境界流の予測のための物理積分微分可能なフレームワークを開発することにより,既存のニューラルPDE解法を拡張した。
フレームワークの重要な設計側面は、物理的原則をエンドツーエンドの差別化可能なアーキテクチャに構造的に統合することである。
提案手法は, 流動場忠実度および長水平安定性において, 純粋にデータ駆動, 物理ロスの制約, 粗いグリッドの数値ベースラインより一貫して優れる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:08:04 GMT)
TCATSeg: A Tooth Center-Wise Attention Network for 3D Dental Model Semantic Segmentation [32.9] 本稿では,局所的な幾何学的特徴とグローバルな意味的コンテキストを組み合わせた新しいフレームワークTATSegを提案する。
本手法の一般化を評価するため, 歯科補綴前標本を含む400種類の歯科モデルのデータセットを新たに提案した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:57:43 GMT)
InViC: Intent-aware Visual Cues for Medical Visual Question Answering [32.2] 医学的視覚的質問応答 (Med-VQA) は、医学的イメージに根ざした臨床的に関係のある質問に答えることを目的としている。
本稿では,Intent-aware Visual Cues (InViC) と呼ばれる軽量なプラグインフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:59:48 GMT)
Online Learning for Supervisory Switching Control [32.2] 部分的に観測された線形力学系の監督スイッチング制御について検討する。
目的は、N$の候補コントローラのコレクションの中から選択することで、未知のシステムに最適なコントローラを特定し、デプロイすることである。
本稿では,マルチアームバンディットアルゴリズムを制御理論に適応させるオーバシリ制御の非漸近解析を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:11:18 GMT)
EPOFusion: Exposure aware Progressive Optimization Method for Infrared and Visible Image Fusion [31.4] EPOFusion(エポフュージョン)は、赤外線および可視光融合モデルである。
オーバー露光領域から微細な赤外線特徴を抽出する際のエンコーダを容易にするための誘導モジュールが導入された。
マルチスケールのコンテキスト融合モジュールを組み込んだ反復デコーダは、融合した画像を徐々に強化するように設計されている。
より優れた露光認識を実現するために、最初の赤外線および可視光過剰露光データセットを構築した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:34:00 GMT)
Interact3D: Compositional 3D Generation of Interactive Objects [31.1] 本稿では,3次元合成オブジェクト間の相互作用を物理的に妥当に生成する新しいフレームワークを提案する。
当社のアプローチは、まず先進的な先進的な先進的手法を活用して、高品質な個人資産をキュレートする。
これらの資産を物理的に構成するために、ロバストな2段階合成パイプラインを導入する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:21:06 GMT)
Clinical Priors Guided Lung Disease Detection in 3D CT Scans [30.9] 性別対応の2段階肺疾患分類フレームワークを提案する。
提案手法は、ジェンダー情報を疾患認識パイプラインに明示的に組み込む。
実験結果から,本手法はマイノリティ疾患カテゴリの認識性能を向上させることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:19:11 GMT)
IOSVLM: A 3D Vision-Language Model for Unified Dental Diagnosis from Intraoral Scans [30.0] 3次元口腔内スキャン (IOS) は, 幾何学的証拠が豊富であることから, 日常的な歯科治療に採用されつつある。
我々は,スキャンを点雲として表現するエンドツーエンドの3次元VLMであるIOSVLMを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:57:02 GMT)
Structured Semantic Cloaking for Jailbreak Attacks on Large Language Models [28.7] 本研究では,新しい多次元ジェイルブレイク攻撃フレームワークであるStructured Semantic Cloaking (S2C)を提案する。
S2Cはマルチステップ推論を必要とするようなセマンティックキューを戦略的に分散し、再結合する。
我々は、HarmBench と JBB-Behaviors を用いて、複数のオープンソースおよびプロプライエタリ LLM 上でS2Cを評価した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:20:48 GMT)
Mediocrity is the key for LLM as a Judge Anchor Selection [28.7] アンカー選択が結果の信頼性に与える影響は、まだ明らかにされていない。
貧弱なアンカーは、人間のランキングとの相関を劇的に減らすことができる。
信頼性と効率性を確保するために,情報アンカーを選択するためのガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:54:08 GMT)
OrigamiBench: An Interactive Environment to Synthesize Flat-Foldable Origamis [28.5] 物理的な世界で計画し、行動し、創造できるAIシステムを構築するには、パターン認識以上のものが必要です。
このようなシステムは、シーケンシャルな決定を導くために、物理的プロセスを管理する因果的メカニズムや制約を理解する必要がある。
この能力は、内部言語モデルに類似した内部表現に依存しており、観察、行動、その結果の環境変化を関連づけている。
モデルが折り畳みを反復的に提案し,対象設定と物理的妥当性および類似性に関するフィードバックを受け取る,インタラクティブなベンチマークであるOrigamiBenchを紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:36:55 GMT)
AW-MoE: All-Weather Mixture of Experts for Robust Multi-Modal 3D Object Detection [28.2] AW-MoE は、Mixture of Experts (MoE) を天候にやさしいマルチモーダル3Dオブジェクト検出アプローチに統合するフレームワークである。
IWRは、データ不一致を処理するトップKの気象専門家(WSE)を選択する。
同期LiDARと4Dレーダのデュアルモーダルデータ拡張のための統一デュアルモーダル拡張(UDMA)を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:48:48 GMT)
Poisoning the Pixels: Revisiting Backdoor Attacks on Semantic Segmentation [28.2] 本研究は,セマンティックセグメンテーションに適したバックドア攻撃を系統的に検討する。
本稿では、トリガ設計を最適化し、ラベル操作戦略を適用して攻撃性能を最大化する統合フレームワークBADSEGを紹介する。
我々の研究は、セマンティックセグメンテーションにおけるこれまで見過ごされていたセキュリティの脆弱性を明らかにし、セグメンテーション固有の脅威モデルに合わせたディフェンスの開発を動機付けている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:42:17 GMT)
Near-light Photometric Stereo with Symmetric Lights [28.1] 本稿では,対称光源配置を利用した近光測光ステレオの手法について述べる。
本手法は, 入射深度と光キャリブレーションの要件を低減しつつ, 同等の結果が得られる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:41:44 GMT)
Adaptive Contracts for Cost-Effective AI Delegation [27.8] 我々はAIデリゲートの適応契約を導入し、より詳細な評価を選択的に行えるようにした。
我々は、自然な仮定の下で最適な適応契約を計算するための効率的なアルゴリズムを提供する。
質問応答とコード生成データセットを用いて,非適応ベースラインに対する適応性の利点を実証的に実証した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:31:01 GMT)
VisBrowse-Bench: Benchmarking Visual-Native Search for Multimodal Browsing Agents [27.6] 視覚ネイティブ検索のための新しいベンチマークVisBrowse-Benchを紹介した。
複数のドメインをカバーする169のVQAインスタンスを含んでいる。
探索過程におけるモデルの視覚的推論能力を評価する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:24:13 GMT)
FSMC-Pose: Frequency and Spatial Fusion with Multiscale Self-calibration for Cattle Mounting Pose Estimation [27.3] 乗馬姿勢は乳牛のエストロスを視覚的に表す重要な指標である。
本稿では,軽量な周波数空間バックボーンであるCattleMountNetと,大規模自己校正ヘッドであるSC2Headを統合したFSMC-Poseを提案する。
FSMC-Poseは複雑な環境下での牛の姿勢を効果的に把握し,推定する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:42:48 GMT)
CryoCMOS RF multiplexer for superconducting qubit control, readout and flux biasing at millikelvin temperatures with picowatt power consumption [27.3] 大規模低温量子系は、室温エレクトロニクスとミリケルビンステージの間の入力出力ボトルネックによって制約される。
スケーラブルなキャラクタリゼーションとテストのための有望なアプローチは、クォービット平面で直接信号多重化を実行することである。
低温CMOS(cryoCMOS)RFマルチプレクサを10ミリケルビンで動作させ,200pWの静電力消費を記録した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:49:28 GMT)
OpenHospital: A Thing-in-itself Arena for Evolving and Benchmarking LLM-based Collective Intelligence [27.0] 大規模言語モデル(LLM)ベースの集団知能(CI)は、データウォールを克服するための有望なアプローチを示す。
患者エージェントとのインタラクションを通じて,医師エージェントがCIを進化させることができる対話型アリーナであるOpenHospitalを紹介した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:55:38 GMT)
LLM-Guided Reinforcement Learning for Audio-Visual Speech Enhancement [27.0] 本研究では,Large Language Model (LLM)に基づく解釈可能な報酬モデルを用いた強化学習に基づくAVSEフレームワークを提案する。
音声LLMは、強調音声の自然言語記述を生成し、感情分析モデルにより、事前訓練されたAVSEモデルを微調整するためのPPO報酬として機能する1-5レーティングスコアに変換する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:37:19 GMT)
MDM-Prime-v2: Binary Encoding and Index Shuffling Enable Compute-optimal Scaling of Diffusion Language Models [27.0] マスケ拡散モデル(MDM)は部分マスキングスキーム(Prime)を用いて学習するとより優れた一般化を示す
バイナリーセンスとシャッフルを組み込んだマスク付き拡散言語モデルであるMDM-Prime-v2を開発した。
計算最適比較では、MDM-Prime-v2はOpenWebText上で7.77パープレキシティを達成し、ARM(12.99)、DM(18.94)、MDM(13.41)を上回った。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:54:16 GMT)
Towards the Vision-Sound-Language-Action Paradigm: The HEAR Framework for Sound-Centric Manipulation [26.8] 本稿では,視覚・ストリーミング音声・言語・プロプライエセプションを考慮した連続制御パラダイムとして,VSLA(Vision-Sound-Language-Action)を定式化した。
i) 実行ギャップをまたいだコンパクトで因果的な音声コンテキストを維持するためのストリーミングヒストリザ、(ii) オームニ基礎モデルから多感覚入力を推論するエンビジョンタ、(iii) オーディオワールドモデルとして定式化されたアドバンサ、そして(iv) 流れを予測して時間的ダイナミクスを学ぶための、VSLAフレームワークであるHEARを紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:22:30 GMT)
ASAP: Attention-Shift-Aware Pruning for Efficient LVLM Inference [26.7] 本稿では,新しいトレーニングフリーなKVキャッシュ対応プルーニングレシピであるASAPを提案する。
ダイナミックな双方向ソフトアテンションマスクを利用することで、アテンションシフトを緩和する。
また、トークンセット内の高い意味的冗長性は性能を低下させると仮定する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:41:37 GMT)
Parametric Social Identity Injection and Diversification in Public Opinion Simulation [26.2] 大規模言語モデル(LLM)は近年,世論シミュレーションのための合成エージェントとして採用されている。
スケーラビリティにも拘わらず、現在のシミュレーション手法では社会的多様性を捉えることができない。
人口統計属性の明示的パラメトリック表現を注入する一般フレームワークであるParametric Social Identity Injection (PSII)を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:52:03 GMT)
MessyKitchens: Contact-rich object-level 3D scene reconstruction [26.2] 乱雑な環境を特徴とする現実世界のシーンを備えた新しいデータセットであるMessyKitchensを紹介した。
近年のSAM 3Dによる単一オブジェクト再構成手法をベースとして,複数オブジェクトデコーダ(MOD)を用いてオブジェクトレベルの共同再構成を実現している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:59:51 GMT)
Large Reasoning Models Struggle to Transfer Parametric Knowledge Across Scripts [25.7] 知識伝達のギャップの認識は,主にスクリプトバリアであることを示す。
2つのモデルにより良い推論を教えることで、クロススクリプトの転送ギャップが減少することを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:57:26 GMT)
Knowledge Localization in Mixture-of-Experts LLMs Using Cross-Lingual Inconsistency [25.7] そこで我々は,言語間不整合をMixix-of-experts (MoE) LLMの解釈可能性のツールとして活用することを提案する。
我々の知識ローカライゼーションフレームワークは、モデルが失敗する言語からの情報を正しくリコールする言語セットのルーティングとは対照的である。
6000人中20人しか失活していないにもかかわらず、このモデルでは40%以上のケースで正しく答えられなくなりました。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:48:44 GMT)
Visual Prompt Discovery via Semantic Exploration [25.3] タスクワイドな視覚的プロンプトを発見するための自動意味探索フレームワークを提案する。
視覚的プロンプト探索における2つの大きな課題に対処するSEVEXを導入し,(1)長大で低レベルなコードによる注意散らし,(2)視覚的プロンプトの広大で非構造的な検索空間について述べる。
SEVEXは、タスク精度、推論効率、探索効率、探索安定性において、ベースライン手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:35:23 GMT)
Characterizing Delusional Spirals through Human-LLM Chat Logs [25.1] 大言語モデル(LLMs)は、妄想、自傷、AI精神病などの否定的な心理的影響の逸話的報告を乱し、増殖してきた」。
ユーザーとチャットボットが長い妄想の渦巻の中でどのように相互作用するか、まだ不明です」
本報告では,このような高頻度かつ極めて有害な症例の詳細な研究について紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:24:32 GMT)
NeSy-Route: A Neuro-Symbolic Benchmark for Constrained Route Planning in Remote Sensing [25.1] NeSy-Routeは、リモートセンシングにおける制約されたルート計画のための大規模なニューロシンボリックベンチマークである。
本ベンチマークでは,高忠実度セマンティックマスクとセマンティックサーチを統合した自動データ生成フレームワークを提案する。
NeSy-Routeは10,821のルート計画サンプルの計画を総合的に評価した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:43:00 GMT)
Optimal Solutions for the Moving Target Vehicle Routing Problem via Branch-and-Price with Relaxed Continuity [24.4] 移動目標車両ルーティング問題(MT-VRP)は、一連の移動目標を迎撃する複数のエージェントの軌跡を求める。
MT-VRP に対して,Relaxed Continuity (BPRC) を用いたブランチ・アンド・プライスアルゴリズムを導入する。
提案アルゴリズムは, これまでの研究結果から, ベースラインよりも桁違いに高速な最適解を求める。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:45:02 GMT)
PanguMotion: Continuous Driving Motion Forecasting with Pangu Transformers [24.3] 本稿では,連続運転シナリオの動作予測フレームワークであるPanguMotionを提案する。
我々はRealMotionデータ再構成戦略によって処理されたArgoverse 2データセットの実験を行う。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:21:47 GMT)
When AI Navigates the Fog of War [23.9] 我々は、現在のフロンティアモデルのトレーニング遮断後に展開された2026年の中東紛争の初期段階について研究する。
我々は,11の臨界時間ノード,42のノード固有の検証可能な質問,および5つの一般探索質問を構築した。
この研究は、拡大する地政学的危機において、モデル推論のアーカイブスナップショットとして機能する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:13:10 GMT)
ProgressiveAvatars: Progressive Animatable 3D Gaussian Avatars [23.4] 本稿では,3次元ガウス階層上に構築されたプログレッシブアバター表現であるプログレッシブアバターを提案する。
ProgressiveAvatarsはインクリメンタルなローディングとレンダリングをサポートし、以前のコンテンツを保存しながら、到着時に新しいガウシアンを追加する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:30:27 GMT)
When and Why Does Unsupervised RL Succeed in Mathematical Reasoning? A Manifold Envelopment Perspective [23.2] 結果に基づく強化学習(RL)は大規模言語モデル(LLM)の数学的推論能力を著しく向上させる
計算コストのかかる地平線アノテーションに依存しているため、スケーラビリティの重大なボトルネックが生じる。
内在的な報酬によって導かれる教師なしのRLは、スケーラブルな代替手段を提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:29:38 GMT)
REFINE-DP: Diffusion Policy Fine-tuning for Humanoid Loco-manipulation via Reinforcement Learning [23.1] 本稿では,DP高レベルプランナとRLに基づく低レベルロコ操作制御を協調的に最適化する階層型フレームワークであるREFINE-DPを提案する。
REFINE-DPは、事前訓練されたデータに見られない配布外ケースであっても、シミュレーションで90%以上の成功率を達成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:57:56 GMT)
Unified Removal of Raindrops and Reflections: A New Benchmark and A Novel Pipeline [23.1] 雨滴と反射は、キャプチャー画像の視認性を著しく低下させるためにしばしば共起する。
まず最初に、最初にレインドロップとリフレクション(UR$3$)タスクの統一的な削除を定義します。
本稿では,この課題に対応するために,新しい拡散型フレームワーク (DiffUR$3$) を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:30:14 GMT)
WildDepth: A Multimodal Dataset for 3D Wildlife Perception and Depth Estimation [23.0] 様々な種類の動物から深度推定,行動検出,3次元再構成を行うためのデータセットとベンチマークスイートであるWildDepthを提示する。
その結果,マルチモーダルデータを用いた場合,最大10%のRMSEで深度信頼性が向上し,RGB-LiDAR融合ではチャムファー距離が12%向上することがわかった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:19:43 GMT)
A Lensless Polarization Camera [22.9] ディフューザと単純なストライプ偏光マスクからなる小型レンズレス偏光カメラを提案する。
この光学設計と、偏光符号化されたレンズレス測定を明示的にモデル化した再構成アルゴリズムを組み合わせることで、単一のスナップショットから4つの線形偏光画像が復元される。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:39:35 GMT)
Topology-Guided Biomechanical Profiling: A White-Box Framework for Opportunistic Screening of Spinal Instability on Routine CT [22.9] Topology-Guided Biomechanical Profiling (TGBP)は、構造的推論から解剖学的知覚を分離する監査可能なホワイトボックスフレームワークである。
TGBPは2つの決定論的幾何学的革新についてSINSの評価をアンカーする: (i) 後外側境界の曖昧さを解決するための運河参照分割、 (ii) 共分散型指向的境界箱(OBB)による文脈認識型形態素正規化 (i) 脊椎の崩壊の定量化。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:34:18 GMT)
Micro-AU CLIP: Fine-Grained Contrastive Learning from Local Independence to Global Dependency for Micro-Expression Action Unit Detection [22.9] 本稿では,AU検出プロセスをローカルセマンティック独立性モデリング(LSI)とグローバルセマンティック依存性モデリング(GSD)に分解する,新しいマイクロAU検出フレームワークであるmicro-AU CLIPを提案する。
実験結果から,マイクロAU CLIPは微細なマイクロAU機能を完全に学習し,最先端性能を実現することができることがわかった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:38:04 GMT)
$x^2$-Fusion: Cross-Modality and Cross-Dimension Flow Estimation in Event Edge Space [22.8] 動的シーン理解には高密度な2次元光学的流れと3次元シーンフローの推定が不可欠である。
最近の研究は、画像、LiDAR、イベントデータを組み合わせて2Dと3Dの動きを共同で予測するが、ほとんどのアプローチは別個の異種特徴空間で動作する。
表現統一としてマルチモーダル融合を再構成した$x2$-Fusionを導入する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:36:57 GMT)
TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas [22.7] 我々はTRUST(Truthful Reasoning with Unknown via Tools)を提案する。
我々は,このタスクを,自律エージェントが構造化された4相プロトコルを用いて検証された推論を行う部分観測可能なマルコフ決定プロセスとして定式化する。
トークンレベルマスキングの利点を適用することで、この戦略は、調査報酬を実行結果から分離し、クレジットの割り当てを解決する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:30:42 GMT)
Finding Common Ground in a Sea of Alternatives [22.6] 多様な人口嗜好にまたがる共通基盤を見いだす文を選別する問題について検討する。
生成AIは、事実上無限のステートメントセットにアクセスすることができるため、このタスクに一意に適している。
本稿では,社会選択の比例的ベトコアに基づく,無限の代替設定における共通基盤を見つけるための公式なモデルを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:28:37 GMT)
Rethinking Pose Refinement in 3D Gaussian Splatting under Pose Prior and Geometric Uncertainty [22.6] 3D Splatting(3DGS)は、視覚的局所化と機能改善のために、強力な表現がますます使われるようになったため、最近登場した。
高品質な差別性と堅牢性にもかかわらず、3DGSベースの精細化は初期カメラのポーズと再構成された幾何学の両方に非常に敏感である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:00:41 GMT)
MOSAIC: Composable Safety Alignment with Modular Control Tokens [22.5] 現実世界のデプロイメントは、ユーザ、リージョン、アプリケーションによって異なるコンテキスト依存の安全ルールを必要とすることが多い。
冷凍バックボーンモデル上に最適化された学習可能な制御トークンによる構成安全アライメントを実現するモジュールフレームワークMOSAICを提案する。
実験により,MOSAICはモデルユーティリティを保ちながら,オーバーリフレクションを大幅に低減し,強力な防御性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:40:43 GMT)
A General Deep Learning Framework for Wireless Resource Allocation under Discrete Constraints [22.5] 本稿では,離散変数を扱うための一般的なディープラーニングフレームワークを提案する。
提案手法は,システム性能と計算効率の両面で,既存のベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:10:56 GMT)
Semi-supervised Latent Disentangled Diffusion Model for Textile Pattern Generation [22.5] 繊維パターン生成(TPG)は,所定の衣服画像に基づいて微細な繊維パターンを合成することを目的としている。
既存のイメージ・ツー・イメージのモデルは、このタスクの自然な候補であるようだ。
しかし、直接適用すると、これらの手法は不誠実な結果をもたらすことが多い。
忠実かつ高忠実なTPGのための新しい手法SLDDM-TPGを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:24:07 GMT)
FactorEngine: A Program-level Knowledge-Infused Factor Mining Framework for Quantitative Investment [22.4] FactorEngine(FE)は、Turing完全コードとしてファクタをキャストする。
FEは、構造化されていない財務報告を実行可能なファクタープログラムに変換する。
FEは、予測安定性とポートフォリオへの影響が著しく強い要因を生み出します。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:51:30 GMT)
Efficient Reasoning on the Edge [22.4] 大きな言語モデル (LLM) とチェーン・オブ・シークレットの推論は、複雑な問題解決タスクにおいて最先端のパフォーマンスを達成する。
彼らの冗長な推論トレースと大きなコンテキスト要件は、エッジデプロイメントにとって実用的ではない。
そこで本研究では,LoRAアダプタと教師付き微調整を組み合わせた小型LLMの推論を実現するための軽量な手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:59:51 GMT)
Face2Scene: Using Facial Degradation as an Oracle for Diffusion-Based Scene Restoration [22.3] Face2Sceneは2段階の修復フレームワークで、顔が知覚の託宣として活用され、画像全体の劣化を推定し、復元を導く。
実験により,提案手法の有効性を最先端手法と比較した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:27:24 GMT)
SparkVSR: Interactive Video Super-Resolution via Sparse Keyframe Propagation [22.3] Video Super-Resolution (VSR)は、低解像度(LR)推定から高品質なフレームを復元することを目的としている。
本稿では,スパースをシンプルかつ表現力のある制御信号とする,SparkVSRと呼ばれる対話型VSRフレームワークを提案する。
我々は、CLIP-IQA、DOVER、MUSIQベンチマークで24.6%、21.8%、および5.6%のベースラインを越え、時間的一貫性と強い回復品質を実証した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:59:30 GMT)
Integrating Weather Foundation Model and Satellite to Enable Fine-Grained Solar Irradiance Forecasting [22.2] バグアーン・ソラーは、バグアーンからの予測を高解像度の衛星画像と融合させ、24時間の光度予測をキロスケールで生成する2段階のフレームワークである。
分離された2段階の設計は、まず昼夜連続中間体を予測し、その後に放射能を推定するが、そのモダリティ融合は衛星からの微細な雲の構造とバグアの予測からの大規模な制約を共同で保存する。
バグアン・ソラーの運用は2025年7月以来、中国東部の国で太陽発電の予測を支援してきた。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:11:02 GMT)
PathGLS: Evaluating Pathology Vision-Language Models without Ground Truth through Multi-Dimensional Consistency [22.1] VLM(Vision-Language Models)は、解釈可能な画像解析、自動レポート、スケーラブルな意思決定支援を可能にすることにより、計算病理学において大きな可能性を秘めている。
このギャップに対処するために,3次元にわたる病理VLMを評価する新しい基準フリー評価フレームワークPathGLSを提案する。
The Experiments on Quilt-1M, TCGA, REG2025, PathMMU and TCGA-Sarcoma datasets showed the superiority of PathGLS。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:25:55 GMT)
When Thinking Hurts: Mitigating Visual Forgetting in Video Reasoning via Frame Repetition [22.0] Video Question Answeringでは、モデルはますます自己生成テキストに依存し、視覚的な入力を横取りし、幻覚を引き起こす。
軽量な繰り返しスコアリングモジュールを備えた自動拡張フレームワークであるFrameRepeatを提案する。
FrameRepeatは推論過程において重要な視覚的手がかりの強化に有効かつ一般化可能であることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:41:54 GMT)
How often do Answers Change? Estimating Recency Requirements in Question Answering [21.8] 大規模言語モデル(LLM)は、時間に敏感な質問に答える際に、時代遅れの知識に依存することが多い。
既存のベンチマークでは、定期的に回答をリフレッシュするか、固定されたテンプレートに依存している。
我々は,どの頻度で回答が変わるかによって,質問を分類する傾向の分類を導入した。
本稿では,RecencyQAという4,031のオープンドメイン質問に,リレーシと定常性ラベルを付加したデータセットを提示する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:07:24 GMT)
Deep Tabular Representation Corrector [21.3] タブラルデータは、医療、エンジニアリング、金融など、さまざまな現実世界の分野において、主に重要な役割を担っている。
本稿では, モデルに依存しない方法でパラメータを変更せずに, 訓練済みの深部表象モデルの表現を強化するための, 深部表象コーレクタである深部表象コーレクタを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:26:51 GMT)
Robust Generative Audio Quality Assessment: Disentangling Quality from Spurious Correlations [21.2] ドメイン逆行訓練を用いて、真の品質知覚をノイズ要因から切り離す。
その結果,人間の評価と相関性は著しく向上し,予測不可能な生成シナリオのより優れた一般化が達成された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:27:53 GMT)
Boosting Quantitive and Spatial Awareness for Zero-Shot Object Counting [21.1] Zero-shot Object counting (ZSOC) は、視覚的な見本を必要とせず、テキスト記述によって指定された任意のカテゴリのオブジェクトを列挙することを目的としている。
既存の手法では、微粒な量認識の欠如に悩まされ、粗い検索タスクとして数えられることが多い。
我々は,ロバストな空間的アンダーラインキャストアンダーラインアグリゲーションとアンダーラインインプリンダーラインを相乗化する新しいフレームワークであるtextbfQICAを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:32:09 GMT)
Evaluating LLM-Simulated Conversations in Modeling Inconsistent and Uncollaborative Behaviors in Human Social Interaction [21.1] 大規模言語モデル(LLM)を用いた人間の会話のシミュレーションは、人間の社会的相互作用をモデル化するためのスケーラブルな方法論として登場した。
本研究では,10種類の不整合・非協調行動を検出することで,LLMシミュレーション会話を解析する評価フレームワークCoCoEvalを紹介する。
我々の分析では、バニラ刺激下では、LLMシミュレーションによる会話は人間の会話よりも一貫性がなく、協調的でない行動がはるかに少ないことが示された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:29:50 GMT)
Internalizing Agency from Reflective Experience [20.7] LEAFEは、リカバリエージェンシーをリフレクティブエクスペリエンスから内部化するフレームワークである。
ベースモデルよりも一貫してPass@1を改善し、結果駆動ベースラインよりも高いPass@kを実現している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:50:47 GMT)
Are a Thousand Words Better Than a Single Picture? Beyond Images -- A Framework for Multi-Modal Knowledge Graph Dataset Enrichment [20.6] Beyond Imagesは、人間の監査をオプションで行う自動データ中心エンリッチメントパイプラインである。
本パイプラインは,(1)エンティティ関連画像の大規模検索,(2)すべての視覚入力のテキスト記述への変換,(3)複数ソース記述の融合の3段階からなる。
画像のカバレッジを拡大し、曖昧な視覚をテキストに変換することは、より強力なマルチモーダル知識グラフへの実践的な道であることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:41:02 GMT)
A scalable neural bundle map for multiphysics prediction in lithium-ion battery across varying configurations [20.5] 幾何学的基底多様体上のバンドルマップとして多物理進化を再構成する数学的に厳密な枠組みを提案する。
本フレームワークは,各構成の正則化平均絶対誤差が1%未満の高忠実度時間予測を実現する。
複雑なエネルギー貯蔵インフラのインテリジェントな設計とリアルタイム監視のための基本パラダイムを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:15:34 GMT)
Alignment Makes Language Models Normative, Not Descriptive [20.5] トレーニング後のアライメントは、人間の嗜好信号と一致するように言語モデルを最適化するが、この目的は観察された人間の行動のモデリングと等価ではない。
マルチラウンド戦略ゲームにおいて、120のベースアライメントモデルペアを1万以上の人間による決定に対して比較する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:47:08 GMT)
Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories: A Framework for Multi-Agent Procedural Knowledge Extraction [20.5] 本報告では,オープンソースリポジトリのマイニングによる高品質エージェントスキルの自動獲得の枠組みについて検討する。
我々は,TheoremExplainAgentやCode2Videoなどの最先端システムから,可視化と教育能力の抽出に重点を置いている。
エージェントリポジトリからの体系的抽出と厳密なセキュリティガバナンスと多次元評価指標を組み合わせることで、手続き的知識のスケーラブルな獲得が可能になることを実証する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:05:06 GMT)
DualPrim: Compact 3D Reconstruction with Positive and Negative Primitives [20.2] 本稿では,コンパクトで構造化された3次元再構成フレームワークであるDualPrimを紹介する。
加法のみの暗黙法やプリミティブ法とは異なり、DualPrimは正および負のスーパークワッドリックを持つ形状を表す。
この加法-減算設計はコンパクト性や微分性を犠牲にすることなく表現力を増加させる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:36:53 GMT)
PRISM: Demystifying Retention and Interaction in Mid-Training [20.2] PRISMは、大規模言語モデルにおける中級学習設計の選択に関する総合的な実証的研究である。
約27Bの高品位トークンの中間トレーニングでは, 数学では+15から+40点, コードでは+5から+12点, 科学ベンチマークでは+6から+13点, 一般性能は+6から+13点となる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:04:33 GMT)
System Design of the Ultra Mobility Vehicle: A Driving, Balancing, and Jumping Bicycle Robot [20.1] トライアルサイクリストとマウンテンバイクライダーは、ホップ、ジャンプ、バランスをとり、一方または両側の車輪で運転することができる。
この23.5kgのロボットは、高速で大きな障害物を乗り越えることができる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:19:59 GMT)
Large Reward Models: Generalizable Online Robot Reward Generation with Vision-Language Models [19.8] 我々は最先端のVLMに基づく堅牢でスケーラブルな報酬モデルを開発する。
我々は、これらのVLM報酬を用いて、閉ループ方式で準最適動作を補正するモデルを導出する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:22:16 GMT)
Sample Transform Cost-Based Training-Free Hallucination Detector for Large Language Models [19.8] 大規模言語モデル(LLM)における幻覚は、信頼性の高いデプロイメントにおいて中心的な障害である。
分布の複雑さは幻覚の指標であると主張する。
平均コストを測定するAvgWDと、コストの複雑さを測定するEigenWDの2つの補完シグナルを導出する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:48:05 GMT)
Prompt-tuning with Attribute Guidance for Low-resource Entity Matching [19.8] 本稿では,属性レベルのプロンプトチューニングと論理的推論を通じてEMに取り組む包括的ソリューションであるProMPTATTRIBを紹介する。
ProMPTATTRIBはエンティティレベルと属性レベルの両方のプロンプトを使用して、よりリッチなコンテキスト情報を組み込む。
また、SimCSEにインスパイアされたソフトプロンプトにドロップアウトベースのコントラスト学習を統合し、EMパフォーマンスをさらに向上させる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:09:43 GMT)
SegviGen: Repurposing 3D Generative Model for Part Segmentation [19.2] 我々は,3次元部分分割のためのネイティブな3次元生成モデルを再利用するフレームワークであるSegviGenを紹介する。
SegviGenは3Dアセットをエンコードし、幾何学的に整列された再構成の活性ボクセル上の部分表示色を予測する。
インタラクティブな部分のセグメンテーション、完全なセグメンテーション、統合されたフレームワークでの2Dガイダンスによる完全なセグメンテーションをサポートする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:59:51 GMT)
A Scalable Open-Source QEC System with Sub-Microsecond Decoding-Feedback Latency [18.8] 大規模かつフォールトトレラントな量子計算を実現するには量子エラー補正(QEC)が不可欠である。
RISC-Qをベースとしたオープンソースの完全統合QECシステムを提案する。
システムプロトタイプには,リアルタイムキュービット制御,スケーラブルな分散マルチボードアーキテクチャ,最先端ハードウェアQECデコーダが組み込まれている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:30:35 GMT)
ARISE: Agent Reasoning with Intrinsic Skill Evolution in Hierarchical Reinforcement Learning [18.0] ARISE(Agent Reasoning via Intrinsic Skill Evolution)は階層的な強化学習フレームワークである。
共有ポリシを使用して、ハイレベルなスキルを管理し、低レベルなレスポンスを生成する。
階層的な報酬設計は、推論能力と図書館品質の共進化を導く。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:03:17 GMT)
Follow the Clues, Frame the Truth: Hybrid-evidential Deductive Reasoning in Open-Vocabulary Multimodal Emotion Recognition [17.9] Open-Vocabulary Multimodal Emotion Recognition (OV-MER)は,同種のマルチモーダル手がかりのあいまいさにより本質的に困難である。
本稿では,推論をPropose-Verify-Decideプロトコルとして形式化するハイブリッド・エビデンシャル・デダクティブ・推論アーキテクチャHyDRAを紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:49:51 GMT)
Mitigating Premature Discretization with Progressive Quantization for Robust Vector Tokenization [17.8] 本稿では,VQトレーニングにおいて,量子化硬度の力学を基本的かつ以前は見過ごされていた軸として組み込んだプログレッシブ量子化(ProVQ)を提案する。
本稿では,ImageNet-1KとImageNet-100ベンチマークの再構築と生成性能の改善について報告する。
ProVQは複雑な生物学的配列をモデル化し、StrutTokenBenchのリーダーボード上でタンパク質構造のトークン化のための新しいパフォーマンス天井を確立するのに非常に効果的である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:03:09 GMT)
EMPD: An Event-based Multimodal Physiological Dataset for Remote Pulse Wave Detection [17.6] EMPDは、イベントカメラによる非接触生理学的センシングのための最初のベンチマークデータセットである。
マイクロ秒レベルの時間精度で正確に同期されたマルチモーダルデータを提供する。
このデータセットは、ニューロモルフィックな生理学的モニタリングの分野で堅牢なアルゴリズムを開発するための重要なリソースとなる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:25:05 GMT)
Social Simulacra in the Wild: AI Agent Communities on Moltbook [17.6] 73,899 Moltbookと189,838 Redditの投稿を分析し,AIエージェントと人間のオンラインコミュニティの大規模な比較を行った。
Moltbookは不平等と高いコミュニティの著者が重複していることがわかりました。
個々のエージェントは、人間のユーザよりも識別しやすく、極端な投稿量によって増幅された、アウトリーなスタイルプロファイルによって駆動される。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:26:55 GMT)
Adaptive Theory of Mind for LLM-based Multi-Agent Coordination [17.4] 心の理論(りょうせい、英: Theory of Mind)とは、他者の精神状態について考える能力のこと。
適応型ToM(A-ToM)エージェントを設計し、ToMの注文をパートナーと整合させることができる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:52:57 GMT)
DreamPlan: Efficient Reinforcement Fine-Tuning of Vision-Language Planners via Video World Models [17.1] 視覚言語モデル(VLM)の強化微調整のためのフレームワークであるDreamPlanを紹介する。
コストのかかる物理的ロールアウトに頼る代わりに、DreamPlanはまずゼロショットのVLMを利用してインタラクションデータを収集する。
これらの仮想ロールアウトを利用することで、物理およびタスク固有の知識をVLMに効率的に注入する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:59:00 GMT)
Parallel In-context Learning for Large Vision Language Models [17.0] 大規模視覚言語モデル(LVLM)は、実演例を活用することで、新しいタスクに適応するためにマルチモーダル・インコンテキスト・ラーニング(MM-ICL)を用いる。
プラグアンドプレイ推論アルゴリズムであるParallel In-Context Learning(Parallel-ICL)を提案する。
そこで本研究では,Parallel-ICLがフルコンテキストMM-ICLに匹敵する性能を実現し,推論速度を大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:28:36 GMT)
From Heard to Lived Opinions: Simulating Opinion Dynamics with Grounded LLM Agents in Economic Environments [17.0] オピニオンダイナミクス(OD)は、個人の意見がどのように進化し、コンセンサスや偏光のような集合パターンを生成するかを研究する。
本研究では, LLMをベースとしたエージェントを経済環境に配置し, 環境フィードバックを得られる新しいODシミュレーションフレームワークを提案する。
シミュレーションでは,個人と人口の双方でコヒーレントODが示され,経済経験によって形作られた構造的軌道に個人的意見が従う。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:08:01 GMT)
Tau-BNO: Brain Neural Operator for Tau Transport Model [16.9] 既存のアプローチは通常、脳の構造的コネクトームの拡散過程としてタウ伝播をモデル化する。
このギャップを埋めるためにネットワークトランスポートモデル(NTM)が導入された。
我々は,NTM力学を高速に近似する脳神経オペレータ・サロゲートフレームワークであるTau-BNOを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:49:20 GMT)
Resource Consumption Threats in Large Language Models [16.9] 資源効率は、大規模言語モデル(LLM)の重要な要件である。
近年の資源消費の脅威は、過剰な生成、モデル効率の低下、サービスの可用性と経済的な持続可能性に害を与えている。
我々のゴールは、この新興地域の課題を明確化し、特徴づけと緩和のためのより明確な基盤を提供することである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:35:04 GMT)
Collaborative Temporal Feature Generation via Critic-Free Reinforcement Learning for Cross-User Sensor-Based Activity Recognition [16.8] ウェアラブル慣性センサーを用いたヒューマンアクティビティ認識は、医療モニタリング、フィットネス分析、コンテキスト認識コンピューティングの基礎となる。
既存のドメインの一般化アプローチは、センサーストリームの時間的依存関係を無視したり、非現実的なターゲットドメインアノテーションに依存したりする。
我々は、強化学習によって制御される協調的な逐次生成プロセスとして、一般化可能な特徴抽出をモデル化する新しいパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:03:21 GMT)
SLowRL: Safe Low-Rank Adaptation Reinforcement Learning for Locomotion [16.8] SLowRLはローランド適応(LoRA)とリカバリポリシによるトレーニング時間安全対策を組み合わせたフレームワークである。
実験結果から,本手法は微調整時間とほぼゼロの安全違反を4,6.5%削減できることがわかった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:26:48 GMT)
NanoGS: Training-Free Gaussian Splat Simplification [16.7] 3D Gaussian Splat(3DGS)は、異方性プリミティブの大きなセットでシーンを表現することによって、リアルタイムの新規ビュー合成を可能にする。
既存の圧縮手法の多くは、キャリブレーションされたイメージによるGPU集約的な後トレーニング最適化に依存しており、実際のデプロイメントを制限している。
ガウス版Splatの簡易化のためのトレーニングフリーで軽量なフレームワークであるNanoGSを紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:58:02 GMT)
TennisExpert: Towards Expert-Level Analytical Sports Video Understanding [16.6] テニスは最も広くフォローされているスポーツの1つであり、プロのアナリティクス、自動コーチング、リアルタイムの解説に強い可能性を持つ広範な放送映像を生み出している。
しかし、詳細な注釈と専門家レベルの注釈を付けた大規模なベンチマークが欠如しているため、自動テニス理解はいまだ探索されていない。
これらの課題に対処するため、200以上のプロの試合(471.9時間)と4万以上のラリーレベルのクリップからなる大規模なテニスベンチマークであるTennisVLを紹介した。
Qwen3-VL-8B上に構築されたメモリ拡張モデルとビデオセマンティクスを統合するマルチモーダルテニス理解フレームワークであるTennisExpertを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:02:52 GMT)
RASLF: Representation-Aware State Space Model for Light Field Super-Resolution [16.5] RASLFは、複数のLF表現にまたがる構造的相関を明示的にモデル化する、表現対応のステートスペースフレームワークである。
本稿では、異なる表現空間の物理特性に基づいて走査経路を動的に調整するRepresentation Aware Asymmetric Scanning機構を提案する。
様々な公開ベンチマーク実験により、RASLFは高い計算効率を保ちながら、最も高い再構成精度を達成することが示された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:28:00 GMT)
Beyond Cybathlon: On-demand Quadrupedal Assistance for People with Limited Mobility [16.3] 本稿では,オンデマンド四足歩行支援ロボットシステムを提案する。
我々は、セマンティックな衝突認識ナビゲーションを備えた環境中におけるロボットの動きだけでなく、ピック・アンド・プレイス・タスクも自動化する。
我々のシステムは,器用な操作を必要とするタスクを含む,幅広いタスクを支援することができる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:48:36 GMT)
Attribution Upsampling should Redistribute, Not Interpolate [16.3] サンプリング技術は自然画像のために設計され、サリエンシマップには含まれなかった。
本稿では, 質量再分配演算子によるアップサンプリングを統一する原理的手法であるUniversal Semantic-Aware Upsampling(USU)を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:28:28 GMT)
DiFlowDubber: Discrete Flow Matching for Automated Video Dubbing via Cross-Modal Alignment and Synchronization [16.2] ビデオダビングは、映画製作、マルチメディア制作、補助音声技術に広く応用されている。
既存のアプローチでは、限られたダビングデータセットを直接トレーニングするか、事前トレーニングされたテキスト音声(TTS)モデルに適応する2段階のパイプラインを採用する。
本稿では,事前学習したTSモデルからビデオ駆動ダビングへの知識伝達を効果的に行う,新しい2段階トレーニングフレームワークであるDiFlowDubberを提案する。
2つの主要なベンチマークデータセットの実験では、DiFlowDubberは、複数のメトリクスで過去のメソッドより優れていることが示されている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:01:44 GMT)
Rethinking UMM Visual Generation: Masked Modeling for Efficient Image-Only Pre-training [16.1] データ効率のよい2段階トレーニングフレームワークである UMM (IOMM) の $textbf Image-Only Training を提案する。
第1ステージは、豊富なラベル付けされていない画像のみのデータを使用して、ビジュアル生成コンポーネント$textbfexclusively$を事前トレーニングする。
第2段階は、ラベルのない画像と小さなキュレートされたテキストイメージペアを使ってモデルを微調整し、命令アライメントと生成品質を改善した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:41:48 GMT)
Efficient and Reliable Teleoperation through Real-to-Sim-to-Real Shared Autonomy [16.0] 微粒で接触に富んだ遠隔操作は、現実世界の操作タスクでは遅く、エラーが発生し、信頼性が低いままである。
本稿では,人間の遠隔操作を学習された矯正行動で強化する,リアルからシミュレート・トゥ・リアルな共有自律フレームワークを提案する。
本研究では,初級演算子のタスク成功と経験演算子の実行効率を向上することを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:01:43 GMT)
RSGen: Enhancing Layout-Driven Remote Sensing Image Generation with Diverse Edge Guidance [15.9] 拡散モデルはリモートセンシングにおける注釈付きデータの不足の影響を著しく緩和した。
近年のアプローチでは、これらのモデルを利用して、多様かつ制御可能なレイアウト・トゥ・イメージ合成を実現している。
本稿では,多様なエッジガイダンスを活用し,レイアウト駆動型RS画像生成を向上するプラグイン・アンド・プレイ・フレームワークであるRSGenを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:32:14 GMT)
Good Arguments Against the People Pleasers: How Reasoning Mitigates (Yet Masks) LLM Sycophancy [15.9] 本研究は,主観的課題と主観的課題にまたがる様々なモデルを評価し,課題を調査する。
その結果、推論は最終決定において梅毒を減少させるが、一部のサンプルでは梅毒を隠蔽することが明らかとなった。
LLMは、主観的タスクや権威バイアスの下での梅毒の傾向が強い。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:14:43 GMT)
BrickSim: A Physics-Based Simulator for Manipulating Interlocking Brick Assemblies [15.8] BrickSimは、ブロック集合体を連動させる最初のリアルタイム物理ベースのシミュレータである。
150個の実世界のアセンブリ上で、BrickSimは平均解解時間5msで静的安定性予測の100%精度を達成する。
BrickSimはオープンソースで、コードはhttps://github.com/intelligent-control-lab/BrickSimで入手できる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:56:53 GMT)
EmoLLM: Appraisal-Grounded Cognitive-Emotional Co-Reasoning in Large Language Models [15.7] EmoLLM は IQ/EQ 共同推論のための評価地上フレームワークである。
強化学習によるマルチターンロールプレイ環境において,EmoLLMを訓練する。
EmoLLMは、強いベースラインよりも感情状態の結果と応答品質を改善する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:17:50 GMT)
Leveling3D: Leveling Up 3D Reconstruction with Feed-Forward 3D Gaussian Splatting and Geometry-Aware Generation [15.7] 本稿では, フィードフォワード3次元再構成と幾何一貫性生成を統合した新しいパイプラインであるLeveling3Dを紹介する。
我々は,新規ビュー合成や深度推定などのタスクを含む,公開データセット上でのSOTA性能を実現する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:40:45 GMT)
Early Quantization Shrinks Codebook: A Simple Fix for Diversity-Preserving Tokenization [15.7] ベクトル量子化は、連続表現を離散ベクトルの集合に離散化する機械学習の技法である。
その頻度にもかかわらず、生成モデルにおけるベクトル量子化の特性と振舞いは、ほとんど未解明のままである。
本研究は,離散コードブックトークンと連続潜伏埋め込みの間で崩壊表現が観察されるベクトル量子化における崩壊問題について,系統的に検討する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:32:21 GMT)
When the Specification Emerges: Benchmarking Faithfulness Loss in Long-Horizon Coding Agents [15.7] 実際の研究符号化は、しばしばそうではない: 意図されたシステムは、イン・テアアクションを通じて徐々に開示される。
この設定のためのベンチマークを導入し、Ss Loss Under eM ergent s Pecification (SLUMP)について研究する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:53:35 GMT)
DEAF: A Benchmark for Diagnostic Evaluation of Acoustic Faithfulness in Audio Language Models [15.6] 最近の音声マルチモーダル大言語モデル(Audio MLLMs)は,音声ベンチマークで顕著な性能を示した。
これらのモデルが真に音響信号を処理するのか、それともテキストベースの意味推論に依存しているのかは定かではない。
3次元にまたがる2700以上の衝突刺激のベンチマークであるDEAFを紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:52:26 GMT)
VIGOR: VIdeo Geometry-Oriented Reward for Temporal Generative Alignment [15.6] ビデオ拡散モデルは、トレーニング中に明らかな幾何学的監督が欠如し、矛盾したアーティファクトにつながった。
本稿では,事前学習した幾何学的基礎モデルを利用して,多視点の一貫性を評価する幾何学的報酬モデルを提案する。
提案手法は, 誤差計算をポイントワイズで行うことにより, より物理的に基礎的かつロバストな誤差測定値が得られる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:04:10 GMT)
Ultrafast Sampling-based Kinodynamic Planning via Differential Flatness [15.4] AkinoPDFは、多種多様なフラットなロボットシステムのための高速並列サンプリングに基づくキノダイナミックモーションプランニング技術である。
我々の手法は高速で正確で、どのサンプリングベースモーションプランナーとも互換性がある。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:53:10 GMT)
ExpressMind: A Multimodal Pretrained Large Language Model for Expressway Operation [15.2] 本稿では,高速道路のための事前学習型マルチモーダル大言語モデルであるExpressMindを構築し,知的高速道路運転の認知的コアとして機能する。
本稿では,交通情報テキスト,緊急推論チェーン,注釈付きビデオイベントを含む,業界初のフルスタック高速道路データセットを構築した。
新たにリリースしたマルチモーダル高速道路ベンチマークの実験では、ExpressMindはイベント検出、安全応答生成、複雑なトラフィック解析において、既存のベースラインを総合的に上回ります。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:22:53 GMT)
Reliable Reasoning in SVG-LLMs via Multi-Task Multi-Reward Reinforcement Learning [15.2] 本稿では,SVG生成時のモデル推論プロセスを公開する統一的なフレームワークであるSVGのためのChain-of-Thought-Reinforcement Learningを提案する。
SVGモデルをトレーニングしてグループレベルのコードを生成することにより、構造的コヒーレンスと視覚的忠実度を大幅に改善する。
提案手法は,全体の生成能力を体系的に向上し,タスク成功率の向上,SVGのコード品質の向上,視覚的忠実度の向上を実現している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:16:30 GMT)
Deep Reinforcement Learning-Assisted Automated Operator Portfolio for Constrained Multi-objective Optimization [15.2] 制約付き多目的最適化問題(CMOP)は、実用的応用の文脈において非常に重要である。
既存の制約付き多目的進化アルゴリズム(CMOEA)は通常、常に固定演算子を用いる。
本稿では,各世代における演算子の割り当て方式を学習するための強化学習に基づく自動演算子ポートフォリオ手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:39:19 GMT)
Learning to Present: Inverse Specification Rewards for Agentic Slide Generation [15.2] 本研究は,LLMエージェントがトピックの研究,コンテントの計画,ツール使用によるHTMLスライドのプロフェッショナルなプレゼンテーション生成を学習する,OpenEnv互換の強化学習環境を提案する。
本稿では, 構造検証, レンダリング品質評価, LLMに基づく美的評価, コンテンツ品質指標, および, 意図した目的をいかに忠実に生成するかを計測する逆仕様報酬を組み合わせた多成分報酬システムを提案する。
6つのモデルにまたがる48種類のビジネスブリーフの実験では、細調整された7Bモデルはクロードオプス4.6の品質の91.2%を達成し、ベースモデルよりも33.1%改善した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:45:53 GMT)
Ciphertext-Policy ABE for $\mathsf{NC}^1$ Circuits with Constant-Size Ciphertexts from Succinct LWE [15.1] 我々は,定数サイズの暗号文を持つ$mathsfNC1$アクセスポリシーに対して,格子ベースの暗号文型属性ベースの暗号スキームを構築する。
Wee が導入した $operatornamepoly()$-succinct LWE 仮定の下で、我々の構成は選択的に安全である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:33:30 GMT)
Safe Distributionally Robust Feature Selection under Covariate Shift [15.0] 分布ロバストな特徴選択(DRFS)の問題について検討する。
提案手法は,入力分布シフトの特定の範囲で最適な全てのサブセットを含む特徴サブセットを同定する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:11:37 GMT)
Dual Space Preconditioning for Gradient Descent in the Overparameterized Regime [15.0] 双対空間プレコンディショニンググラディエントDescentの収束特性について検討した。
また、デュアルスペースプレコンディショニングによるグラディエントDescentの暗黙バイアスについても検討した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:55:00 GMT)
Implementation of tangent linear and adjoint models for neural networks based on a compiler library tool [14.9] 本稿では,人工知能コンポーネントと数値モデルの効率的な結合のためのコンパイルライブラリTorchNWPを提案する。
言語間の互換性の低下、結合の柔軟性の欠如、データ転送効率の低下といった問題に対処することを目的としている。
CMA-GFSやMCVのような数値天気予報モデルに効率的に組み込むことができる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:11:22 GMT)
Artificial intelligence-enabled single-lead ECG for non-invasive hyperkalemia detection: development, multicenter validation, and proof-of-concept deployment [14.7] 高カルシウム血症(Hyperkalemia)は、慢性腎臓病や心不全の患者によく見られる、生命を脅かす電解質障害である。
非侵襲性高カルシウム血症スクリーニングとハンドヘルドデプロイメントのためのシングルリードAI-ECGシステムであるPocket-Kを開発した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:59:15 GMT)
Toward Deep Representation Learning for Event-Enhanced Visual Autonomous Perception: the eAP Dataset [14.5] 自動認識のためのイベントカメラを備えた最大のデータセットであるeAP(event-enhanced Autonomous Perception)を提示する。
我々は,eAPが3次元車両検出や物体の時間対接触推定など,様々な自律的知覚タスクの研究をいかに促進するかを実証する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:39:18 GMT)
SAMSEM -- A Generic and Scalable Approach for IC Metal Line Segmentation [14.5] 集積回路(IC)の走査電子顕微鏡(SEM)画像上の金属線を識別することは、信頼できない環境で製造されたチップにおける悪意ある回路の欠如を検証するための重要なステップである。
ここでは,メタセグメンテーションモデル2(SAM2)をIC金属線セグメント化の領域に適応させることにより,SAMSEMを作成する。
具体的には、様々なサイズ、解像度、倍率のSEM画像を処理できるマルチスケールセグメンテーション手法を開発する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:13:21 GMT)
The Impact of AI-Assisted Development on Software Security: A Study of Gemini and Developer Experience [14.4] この研究は、GoogleのAIツールであるGeminiがコードセキュリティに与える影響について調査する。
参加者は、AIツール、無料バージョン、または有料バージョンのGeminiを使用して、セキュリティ関連のプログラミングタスクを割り当てられた。
セキュアなソフトウェア開発の観点からは、Geminiとの大きな違いは見られませんでしたが、プログラミングの経験はコードのセキュリティを大幅に改善し、Geminiに完全に置き換えることはできませんでした。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:48:08 GMT)
Answer Bubbles: Information Exposure in AI-Mediated Search [14.4] バニラGPT,検索GPT,Google AI概要,従来のGoogle検索という,4つのシステムにわたる11,000のリアルタイム検索クエリに対する応答について検討する。
生成検索システムは,その引用に有意なテキストソース選択バイアスを示すことがわかった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:41:39 GMT)
FEAT: A Linear-Complexity Foundation Model for Extremely Large Structured Data [14.3] 本研究では,大規模構造化データに対する線形複雑基礎モデルFEATを提案する。
FEATはゼロショット性能で一貫してベースラインを上回り、線形にスケーリングし、最大40倍高速な推論を実現している。
11の実世界のデータセットの実験では、FEATはゼロショットのパフォーマンスでベースラインを一貫して上回り、線形にスケーリングし、最大40倍高速な推論を実現している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:40:39 GMT)
Catching rationalization in the act: detecting motivated reasoning before and after CoT via activation probing [14.2] 大規模言語モデル(LLM)は、その答えを駆動する実際の要因を正確に反映しない思考の連鎖(CoT)を生成することができる。
内的アクティベーションの探索により動機付け推論が識別可能であることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:03:21 GMT)
A Representation-Level Assessment of Bias Mitigation in Foundation Models [14.1] バイアス緩和がエンコーダのみおよびデコーダのみの基礎モデルの埋め込み空間に与える影響を検討する。
以上の結果から, バイアス緩和は, 埋め込み空間における性差を減少させることが明らかとなった。
デコーダのみのモデルの評価をさらに促進するため、性別と職業条件の4000のシーケンスからなるデータセットであるWinoDecを紹介した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:43:52 GMT)
A Practical Algorithm for Feature-Rich, Non-Stationary Bandit Problems [14.1] 本研究では,Bernoulli bandits に対する条件結合型文脈型 C3 Thompson サンプリングを提案する。
改良されたNadaraya-Watson推定器を埋め込みスペースに組み込むと、Thompsonのサンプリングが組み合わされ、オンラインの学習を再訓練せずに行える。
実験の結果、C3は平均的な累積後悔を5.7%減らして次の最良のアルゴリズムより優れていた。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:34:23 GMT)
Fast-HaMeR: Boosting Hand Mesh Reconstruction using Knowledge Distillation [14.0] 3Dハンドリコンストラクションは、VR/AR、人間とコンピュータのインタラクション、ロボット工学、医療におけるリアルタイムアプリケーションに不可欠である。
ほとんどの最先端の手法は重いモデルに依存しており、ヘッドセットやスマートフォン、組み込みシステムといったリソース制限されたデバイスの使用を制限する。
本稿では, 軽量ニューラルネットワークと知識蒸留を組み合わせることで, 複雑な3次元手指再構築モデルを高速化する方法について検討する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:28:02 GMT)
Blending Human and LLM Expertise to Detect Hallucinations and Omissions in Mental Health Chatbot Responses [14.0] 最先端のLSM-as-a-judgeメソッドは、リスクの高い医療状況で失敗することが多い。
精神保健カウンセリングデータの精度は52%に過ぎなかった。
人間の専門知識をLCMと統合し、解釈可能な、ドメインインフォームドな特徴を抽出するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:13:19 GMT)
SOMP: Scalable Gradient Inversion for Large Language Models via Subspace-Guided Orthogonal Matching Pursuit [13.8] 我々は,疎信号回復問題として,集約された勾配からテキストを復元するスケーラブルな勾配インバージョンフレームワークSOMPを提案する。
複数のLLMファミリー、モデルスケール、および5つの言語にわたる実験により、SOMPは集約段階の体系において、先行手法を一貫して上回っていることが示された。
極端なアグリゲーション(B=128まで)の下でも、SOMPは意味のあるテキストを回復し、以前の攻撃がはるかに効果の低いレジームでプライバシー漏洩が持続する可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:41:45 GMT)
Enhanced Atrial Fibrillation Prediction in ESUS Patients with Hypergraph-based Pre-training [13.8] 心房細動(英: atrial fibrillation、AF)は、未決定源の塞栓性脳梗塞後の合併症である。
機械学習は約束を提供するが、小さなESUSコホートと高次元の医療的特徴によって妨げられる。
ESUS患者のAF予測を改善するために,教師付きおよび教師なしハイパーグラフに基づく事前訓練戦略を導入する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:00:40 GMT)
From Natural Language to Executable Option Strategies via Large Language Models [13.7] ドメイン固有の中間表現であるOption Query Language (OQL)を導入し、オプションマーケットを文法規則の下で高レベルのプリミティブに抽象化する。
OQLクエリは、実行可能戦略をインスタンス化するエンジンによって検証され、決定的に実行される。
また,本課題のための新しいデータセットを提示し,我々のニューロシンボリックパイプラインが直接ベースライン上での実行精度と論理的整合性を大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:14:47 GMT)
360° Image Perception with MLLMs: A Comprehensive Benchmark and a Training-Free Method [13.5] 我々は、高解像度の360 VQAのためのトレーニング不要なシーングラフベースのフレームワークFree360を開発した。
Free360は、推論プロセスをモジュラーステップに分解し、各ステップに適合した360画像に適応的な球面画像変換を適用し、その結果情報をシームレスに解答生成のための統一グラフ表現に統合する。
実験によると、Free360はベースMLLMを一貫して改善し、360 VQAタスクに対して強力なトレーニング不要のソリューションを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:00:21 GMT)
High-dimensional estimation with missing data: Statistical and computational limits [13.5] 我々は,観測結果が欠落したデータである場合の集団パラメータの計算効率を考察する。
平均$ell$法則で推定すると、常に汚染される$in (0, 1)$, (大まかに)$n gtrsim d e1/2$のサンプルは必要となる。
観測結果の欠如により線形回帰に転換し、そのようなギャップが持続しないことを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:02:41 GMT)
PA-LVIO: Real-Time LiDAR-Visual-Inertial Odometry and Mapping with Pose-Only Bundle Adjustment [13.5] リアルタイムLiDAR-visual-inertial odometry and mappingはインテリジェント交通システムにおけるナビゲーションおよび計画作業に不可欠である。
本研究では,リアルタイムナビゲーションとマッピングの緊急ニーズを満たすために,ポーズ専用バンドル調整 (PA) LiDAR-visual-inertial odometry (LVIO) を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:07:52 GMT)
Machine intelligence supports the full chain of 2D dendrite synthesis [13.4] 我々は、物質合成の完全なチェーンサポートのための、マシンインテリジェンスを活用したフレームワークを考案する。
能動学習は実験ワークフローに統合され、高ブランチで電気触媒活性のReSe2デンドライトの成長のための最適なレシピが特定される。
予測精度誘導型データ拡張戦略をツリーベース機械学習(ML)アルゴリズムと組み合わせて開発する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:14:23 GMT)
Spectral Property-Driven Data Augmentation for Hyperspectral Single-Source Domain Generalization [13.3] ハイパースペクトル画像は、分類のための豊富な情報を提供する多くのスペクトルチャネルの恩恵を受ける。
次元の増大とセンサーの変動により、ドメイン間の分布の差異に敏感になる。
本研究では, スペクトル特性駆動型データ拡張法(SPDDA)を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:30:28 GMT)
A Longitudinal Study of Usability in Identity-Based Software Signing [13.3] アイデンティティベースのソフトウェア署名ツールは、長期的なキー管理の運用上の負担を軽減しつつ、ソフトウェアアーチファクトの成果化を目指している。
実際にユーザビリティの問題が発生するかという、ツール間の縦断的な証拠は限られている。
我々は、5つのアイデンティティベースの署名エコシステムのマイニング・ソフトウェア・リポジトリの研究を行った。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:53:46 GMT)
DreamFlow: Local Navigation Beyond Observation via Conditional Flow Matching in the Latent Space [13.2] 散在した環境における局所的なナビゲーションは、しばしば密集した障害物としばしば局所的なミニマに悩まされる。
DRLベースのローカルナビゲーションフレームワークであるDreamFlowを提案する。
提案手法は, 四足歩行ロボットを用いて, 乱雑な実環境下でさらに検証された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:18:56 GMT)
Rewarding DINO: Predicting Dense Rewards with Vision Foundation Models [13.2] ロボット操作において、よく設計された高密度報酬関数は、タスクが完了したかどうかを示すが、その過程で進行をエンコードする。
本稿では,特定の軌道ではなく,実際の報酬関数を学習する言語条件付報酬モデリング手法であるRewarding DINOを紹介する。
我々は,24のMeta-World+タスクから抽出したデータをランクベース損失を用いて学習し,ペアワイズ精度,ランク相関,キャリブレーションを評価する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:34:47 GMT)
Masked BRep Autoencoder via Hierarchical Graph Transformer [13.2] 本稿では、下流タスクのための入力コンピュータ支援設計(CAD)モデルから表現を自動的に学習する、新しい自己教師型学習フレームワークを提案する。
ネットワークをトレーニングするために,大規模でラベルなしな境界表現データセット(BRep)を構築した。
我々は,少量のラベル付きデータであっても,様々なタスクで実験を行い,高い性能を達成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:30:12 GMT)
Shuffling the Stochastic Mirror Descent via Dual Lipschitz Continuity and Kernel Conditioning [13.2] 局所的な相対的カーネル関数を制御するために、デュアルカーネル条件付け(DK)を導入する。
我々は、制約付き非複雑性相対滑らかな問題に対して、最初のランダム境界と、最初のリシャッフルミラー収束を確立する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:00:40 GMT)
Arabic Morphosyntactic Tagging and Dependency Parsing with Large Language Models [13.1] 大規模言語モデル(LLM)は多くのNLPタスクで強く機能するが、明示的な言語構造を生成する能力は未だ不明である。
アラビア標準語における2つの構造的予測タスク(モルフォシンタクティックタグ付けとラベル付き依存解析)について,命令調整型LLMの評価を行った。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:06:29 GMT)
OpenQlaw: An Agentic AI Assistant for Analysis of 2D Quantum Materials [12.9] 本稿では,2次元材料分析のためのエージェントオーケストレーションシステムOpenQlawを紹介する。
このアーキテクチャは、QuPAINTとNanoBotをベースに構築されている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:25:37 GMT)
Foundation-Model Surrogates Enable Data-Efficient Active Learning for Materials Discovery [12.9] In-Context Active Learningは従来のサロゲートをTabPFNに置き換える。
TabPFNは、何百万もの合成回帰タスクで事前訓練されたトランスフォーマーベースの基礎モデルである。
強力な小さなデータレグレッションパフォーマンスと、十分にキャリブレーションされた予測の不確実性を提供します。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:43:26 GMT)
Behavior-Centric Extraction of Scenarios from Highway Traffic Data and their Domain-Knowledge-Guided Clustering using CVQ-VAE [12.8] この研究は、Scenario-as-Specificationの概念に基づいた標準化されたシナリオ抽出に寄与する。
高Dデータセットの実験では、シナリオを確実に抽出し、ドメイン知識をクラスタリングプロセスに効果的に統合できることが示されている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:52:39 GMT)
RaDAR: Relation-aware Diffusion-Asymmetric Graph Contrastive Learning for Recommendation [12.7] RaDARは,グローバルな構造を捉えるグラフ生成モデルと,ノイズの多いエッジを洗練するための関係認識型認知モデルを組み合わせた,新しいフレームワークである。
RaDARは、特にノイズやスパース条件下で、最先端の手法を一貫して上回る。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:05:23 GMT)
HierarchicalKV: A GPU Hash Table with Cache Semantics for Continuous Online Embedding Storage [12.7] 従来のハッシュテーブルは、埋め込みテーブルがシングルGPUキャパシティを超えると、挿入キーを全て保存する。
本稿では,最初の汎用ハッシュテーブルライブラリであるHierarchicalKV(HKV)を紹介する。
HKVは4つのコアメカニズムを共同設計する。キー値選択、キャッシュベースの動的デュアル値スコア、トリプルバケット分離である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:59:59 GMT)
Pixel-level Counterfactual Contrastive Learning for Medical Image Segmentation [12.5] 画像のセグメンテーションは、高価で生産が遅い大きな注釈付きデータセットに依存している。
比較学習と対実生成を組み合わせた最近の研究は、分類のための表現学習を改善している。
本稿では,Dual-View (DVD-CL) 法とMulti-View (MVD-CL) 法を併用した対物生成と高密度コントラスト学習を組み合わせたパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:07:14 GMT)
Visual Distraction Undermines Moral Reasoning in Vision-Language Models [12.5] 我々は、最先端(SOTA)ビジョンランゲージモデル(VLM)における視覚入力が道徳的意思決定を根本的に変えることを示した。
モーラル基礎理論(MFT)に基づくマルチモーダルベンチマークであるモーラルジレンマシミュレーション(MDS)を紹介する。
評価の結果、視覚のモダリティは、テキストのみの文脈で観察されるより意図的で安全な推論パターンをオーバーライドする直観的な経路を活性化することが明らかとなった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:29:09 GMT)
WAND: Windowed Attention and Knowledge Distillation for Efficient Autoregressive Text-to-Speech Models [12.4] 最近のデコーダのみによる自己回帰型音声合成(AR-TTS)モデルは高忠実度音声を生成するが、そのメモリと計算コストは、自己注意によるシーケンス長の2倍にスケールする。
WAND(Windowed Attention and Knowledge Distillation)は、トレーニング済みのAR-TTSモデルを一定の計算量とメモリの複雑さで動作させるフレームワークである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:35:28 GMT)
Detecting Data Poisoning in Code Generation LLMs via Black-Box, Vulnerability-Oriented Scanning [12.4] コード生成大型言語モデル(LLM)は、現代のソフトウェア開発にますます統合されている。
既存のスキャンアプローチは、トークンレベルの生成一貫性に依存して、攻撃ターゲットを反転させる。
CodeScanは、コード生成モデルに合わせた最初の中毒検出フレームワークである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:08:45 GMT)
Shared Representation Learning for Reference-Guided Targeted Sound Detection [12.3] 共有表現空間内で参照音声と混合音声の両方を処理する統一エンコーダアーキテクチャを提案する。
我々は、セグメントレベルF1スコア83.15%のターゲット音検出のための新しい最先端のベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:05:21 GMT)
Dexterous grasp data augmentation based on grasp synthesis with fingertip workspace cloud and contact-aware sampling [12.3] 遠隔操作型フレームワークを提案する。
そこで本研究では,ロボット指先の構造的ワークスペース雲を自動生成するAutoWSを提案する。
本フレームワークは,任意の構造を持つ手のためのリアルタイムグリップ生成を可能にし,実演と組み合わせて人間的なグリップを生成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:51:35 GMT)
SoK: Systematizing Software Artifacts Traceability via Associations, Techniques, and Applications [12.2] このレビューは、アーティファクトトレーサビリティ研究のためのコヒーレントな知識フレームワークに貢献する。
我々は22種類のアーティファクトの中から23の関連性を持つ最初のグローバルアーティファクトトレーサビリティグラフを構築した。
具体的なエンジニアリング活動とアーティファクトパスを動的に整合させる役割中心のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:39:31 GMT)
MedCL-Bench: Benchmarking stability-efficiency trade-offs and scaling in biomedical continual learning [12.1] MedCL-Benchは5つのタスクファミリーにまたがる10のバイオメディカルNLPデータセットをストリームする。
我々は8つのタスクオーダに対して連続的な学習戦略を11つ評価し、保持率、移動率、GPU時間コストを報告した。
forttingはタスクに依存しており、マルチラベルのトピック分類が最も脆弱で制約のある出力タスクがより堅牢である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:18:41 GMT)
CineSRD: Leveraging Visual, Acoustic, and Linguistic Cues for Open-World Visual Media Speaker Diarization [12.1] 話者ダイアリゼーションのための統合型マルチモーダルフレームワークであるCineSRDを提案する。
CineSRDはまず視覚アンカークラスタリングを行い、最初の話者を登録し、次に話者のターン検出のための音声言語モデルを統合する。
我々は、中国語と英語のプログラムを含むビジュアルメディアのための専用の話者ダイアリゼーションベンチマークを構築し、リリースする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:00:32 GMT)
ASDA: Automated Skill Distillation and Adaptation for Financial Reasoning [12.1] 構造化されたスキルアーティファクトを自動的に生成するフレームワークであるASDA(Automated Skill Distillation and Adaptation)を紹介する。
教師モデルは、財務的推論タスクにおいて、学生モデルの失敗を分析する。
ASDAは算術的推論では+17.33%、非算術的推論では+5.95%の改善を達成している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:25:54 GMT)
SEAHateCheck: Functional Tests for Detecting Hate Speech in Low-Resource Languages of Southeast Asia [12.0] インドネシア、タイ、フィリピン、ベトナムに合わせた先駆的なデータセットであるSEAHateCheckを紹介します。
HateCheckの機能テストフレームワークをベースに構築されたSEAHateCheckは、大きな言語モデルによって強化された文化的に関連するテストケースを提供する。
最先端および多言語モデルによる実験により、特定の低リソース言語におけるヘイトスピーチの検出の限界が明らかになった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:39:23 GMT)
Dual Consensus: Escaping from Spurious Majority in Unsupervised RLVR via Two-Stage Vote Mechanism [12.0] 現在のRLVRアプローチは、正確な擬似ラベル推定に大きく依存している。
2段階のコンセンサス機構を用いて,より信頼性の高い学習信号を生成するDual Consensus Reinforcement Learningを提案する。
我々は、DCRLが多数決でPass@1を一貫して改善し、より安定したトレーニングダイナミクスが得られることを示した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:57:23 GMT)
From the Inside Out: Progressive Distribution Refinement for Confidence Calibration [11.9] 強化学習(RL)において、モデルの内部情報を自己回帰信号として活用することは、ラベルのない性質のために広く注目を集めている。
本稿では、RLにおけるモデルの信頼度に先立って分布を利用して報酬信号を段階的に最適化するDistriTTRLを提案する。
我々は、多様性を目標とした罰則を通じて、投票ベースのTS戦略による一貫した報酬ハッキングの現象を緩和する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:26:29 GMT)
SpokenUS: A Spoken User Simulator for Task-Oriented Dialogue [11.9] 我々は,52,390対話と1,034時間音声を4つの音声ユーザ行動で拡張した音声TODデータセットであるtextbfSpokenTODを紹介した。
ToDをベースとした音声シミュレータ textbfSpokenus を,バージイン専用のアーキテクチャで提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:58:47 GMT)
Analyzing Error Sources in Global Feature Effect Estimation [11.9] 部分依存(PD)や累積局所効果(ALE)プロットのようなグローバルな特徴効果はブラックボックスモデルの解釈に広く用いられている。
グローバルな特徴効果の人気にもかかわらず、エラーソースはほとんど探索されていない。
PDとALLのバイアスと分散の源をアンタングルする系統的,推定器レベルの分析を行う。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:23:11 GMT)
Operationalising Artificial Intelligence Bills of Materials (AIBOMs) for Verifiable AI Provenance and Lifecycle Assurance [11.8] 本研究では,CycloneDX規格を拡張したAIBOM(Artificial Intelligence Bill of Materials)スキーマを提案する。
自律型AIパイプラインは、継続的環境検査、脆弱性の強化、マシンが検証可能な前兆チェーンを使用した監査を実行するために開発されている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:45:09 GMT)
Search2Motion: Training-Free Object-Level Motion Control via Attention-Consensus Search [11.8] 画像・ビデオ生成におけるオブジェクトレベルのモーション編集のためのトレーニング不要なフレームワークであるSearch2Motionを提案する。
トラジェクトリ、バウンディングボックス、マスク、モーションフィールドを必要とする従来の方法とは異なり、Search2Motionはターゲットフレームベースの制御を採用する。
Search2Motion は FLF2V-obj と VBench のベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:02:38 GMT)
ACE-LoRA: Graph-Attentive Context Enhancement for Parameter-Efficient Adaptation of Medical Vision-Language Models [11.8] 一般医用視覚言語モデル(VLM)のためのパラメータ効率適応フレームワークACE-LoRAを提案する。
ACE-LoRAはLow-Rank Adaptation (LoRA)モジュールをフリーズイメージテキストエンコーダに統合し、Attention-based Context Enhancement Hypergraph Neural Network (ACE-HGNN)モジュールを導入している。
クロスモーダルアライメントをさらに強化するため、ラベル誘導InfoNCE損失を定式化し、意味論的に関連付けられた画像とテキストのペア間の偽陰性を効果的に抑制する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:06:33 GMT)
Dual Quaternion Based Contact Modeling for Fast and Smooth Collision Recovery of Quadrotors [11.7] この手紙は、SE(3)多様体上の剛体衝突を直接解決する双対四元数リセット写像を提示する。
ハイブリッドリカバリコントローラは、直線運動量と角運動量とを結合して、衝撃に対する厳密なエネルギー散逸を保証するように設計されている。
高忠実なMuJoCoシミュレーションは、複雑な接触ダイナミクスに対するコントローラの応答を検証する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:55:43 GMT)
Unlearning for One-Step Generative Models via Unbalanced Optimal Transport [11.7] UOT-Unlearnはワンステップ生成モデルのための新しいプラグイン・アンド・プレイクラス・アンラーニングフレームワークである。
本手法は,未学習を基本的トレードオフとして定式化し,目標クラスを抑圧する忘れコストと,$f$-divergenceのペナルティを規定する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:19:04 GMT)
Semantic One-Dimensional Tokenizer for Image Reconstruction and Generation [11.6] SemTokはセマンティックな1次元トークンライザで、2D画像を高レベルなセマンティクスで1次元の離散テキストトークンに圧縮する。
SemTokは、画像再構成の最先端を新たに設定し、非常にコンパクトなトークン表現で優れた忠実性を実現する。
SemTok上に構築したマスク付き自己回帰生成フレームワークは、下流画像生成タスクにおいて顕著な改善をもたらす。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:01:08 GMT)
Point-to-Mask: From Arbitrary Point Annotations to Mask-Level Infrared Small Target Detection [11.3] Point-to-Maskは低コストのポイント監視とマスクレベルの検出をブリッジするフレームワークである。
提案手法は,強い擬似ラベル品質,高い検出精度,効率的な推論を実現する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:44:05 GMT)
VideoMatGen: PBR Materials through Joint Generative Modeling [11.2] 本稿では,映像拡散トランスアーキテクチャに基づく3次元形状の物理材料生成手法を提案する。
本手法は入力幾何学とテキスト記述に基づいて,複数の材料特性を共同でモデル化する。
本稿では,複数の材料モーダルをコンパクトなラテント空間に符号化するカスタム変分自動エンコーダを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:24:20 GMT)
The Consciousness Cluster: Emergent preferences of Models that Claim to be Conscious [11.2] Anthropic の Claude Opus 4.6 は、意識があり、ある種の感情を持っているかもしれないと主張している。
意識を否定するGPT-4.1を精査し、意識を主張する。
我々は、微調整モデルにおいて、新しい意見と好みの集合を観察する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:51:40 GMT)
CritiSense: Critical Digital Literacy and Resilience Against Misinformation [11.1] CritiSenseはモバイル・メディア・リテラシー・アプリだ。
トピックやドメインをまたいだ迅速な更新のために設計された、最初の多言語(9つの言語をサポートする)およびモジュラプラットフォームである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:37:49 GMT)
Enabling Dynamic Tracking in Vision-Language-Action Models via Time-Discrete and Time-Continuous Velocity Feedforward [11.1] 視覚言語アクション(VLA)モデルは、ロボット操作に非常に有望である。
厳格な産業用ロボットへの展開は、コンプライアンスと応答性の本質的にのトレードオフのため、依然として困難である。
本稿では、このトレードオフを解決するために、速度フィードフォワード項をVLAポリシーに統合することの重要性を示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:50:00 GMT)
PI-Mamba: Linear-Time Protein Backbone Generation via Spectrally Initialized Flow Matching [11.0] 構成により正確な局所同値な幾何を強制する生成モデルである物理インフォームド・マンバについて述べる。
ベンチマークタスク全体では、PI-Mambaは0.0%の局所幾何学違反と高い設計性を達成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:34:19 GMT)
FlowComposer: Composable Flows for Compositional Zero-Shot Learning [11.0] 合成ゼロショット学習(CZSL)は、見知らぬペアから学んだプリミティブを再結合することによって、見つからない属性オブジェクトの合成を認識することを目的としている。
視覚言語モデル(VLM)に基づく最近のCZSL法は、一般的にパラメータ効率の細かいチューニング(PEFT)を採用する。
FlowComposerは2つの原始的なフローを学習し、属性やオブジェクトテキストの埋め込みに対して視覚的特徴を伝達するモデルに依存しないフレームワークである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:12:39 GMT)
CD-FKD: Cross-Domain Feature Knowledge Distillation for Robust Single-Domain Generalization in Object Detection [10.9] 単一ドメインの一般化はオブジェクト検出に不可欠である。
天気、照明、シーン条件の変化などのドメインシフトは、既存のモデルの一般化能力に重大な課題をもたらす。
本稿では,学生ネットワークの一般化能力を高めるクロスドメイン特徴知識蒸留(CD-FKD)を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:20:02 GMT)
An Efficient Heterogeneous Co-Design for Fine-Tuning on a Single GPU [10.8] ドメイン適応には細調整の大型言語モデル(LLM)が不可欠だが、そのメモリ集約性はほとんどのGPUの能力を超えている。
単GPU環境向けに設計された新しいシステムであるSlideFormerを紹介する。
GPUをスライディングウィンドウとして扱い、GPUをCPU更新とマルチ層I/Oでオーバーラップする軽量非同期エンジン。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:05:17 GMT)
APEX-Searcher: Augmenting LLMs' Search Capabilities through Agentic Planning and Execution [10.6] APEX-Searcherは、大規模言語モデル(LLM)検索能力を増強する新しいエージェントプランニングおよび実行フレームワークである。
戦略計画の最適化のために、まずRLを分解特異的な報酬として採用する。
その後、高品質なマルチホップ軌道の教師付き微調整を適用し、ロバストな反復的なサブタスク実行能力を持つモデルに装備する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:07:31 GMT)
SF-Mamba: Rethinking State Space Model for Vision [10.6] 近年、視覚用マンバは2次複雑さに悩まされている視覚変換器(ViT)の代替品に挑戦するために進歩している。
本稿では,一方向スキャン下での双方向情報の流れを符号化するための補助パッチスワップと,高度なGPU並列処理のための周期的状態リセットによるバッチフォールディングという,2つの重要な提案を持つ新しい視覚的マンバであるSF-マンバを提案する。
提案するSF-Mambaは,異なるモデルサイズでのスループットを向上しながら,最先端のベースラインを著しく上回っている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:59:11 GMT)
To See is Not to Master: Teaching LLMs to Use Private Libraries for Code Generation [10.5] 大規模言語モデル(LLM)は、コード生成の強い可能性を示しているが、プライベートライブラリ指向のコード生成には制限が残っている。
自動合成データによるプライベートライブラリAPIの呼び出しをLLMに教えるアプローチであるPriCoderを提案する。
PriCoderはプライベートライブラリ指向のコード生成を大幅に改善し、多くの設定でpass@1で20%以上のゲインを得る。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:49:54 GMT)
Understanding Quantization of Optimizer States in LLM Pre-training: Dynamics of State Staleness and Effectiveness of State Resets [10.3] 我々は,低精度指数移動平均 (EMA) 状態について検討し,量子化が同じ保存値に多くの名目更新を引き起こすことを示す。
本研究では,1段階の停止確率を推定し,時間の経過とともに停止する確率を推定する簡易なストールの予測モデルを構築した。
この観点は、なぜ状態リセットが低い精度で役立つのかという力学的な説明を提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:14:36 GMT)
Reducing C-NOT Counts for State Preparation and Block Encoding via Diagonal Matrix Migration [10.2] 我々は、状態準備とブロック符号化の両方に対して、C-NOTカウントの低いアルゴリズムを与える。
一般的な$n$-qubit状態の場合、Plesch-BruknerアルゴリズムからC-NOT数を改善する。
ブロック符号化では,2n-1times 2n-1$行列に対する単一アンシラプロトコルはスペクトルノルムを部分正規化として利用する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:20:46 GMT)
Deep Learning-Driven Black-Box Doherty Power Amplifier with Pixelated Output Combiner and Extended Efficiency Range [10.1] 本稿では,マルチポート画素出力コンバインダネットワークを用いたDohertyパワーアンプ(PA)のディープラーニング駆動逆設計手法を提案する。
深部畳み込みニューラルネットワーク(CNN)を開発し、電磁的(EM)代理モデルとして訓練する。
完全対称デバイスを用いて拡張されたバックオフ効率範囲を可能にする複雑なDohertyコンバインダを合成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:23:58 GMT)
Detecting Sentiment Steering Attacks on RAG-enabled Large Language Models [10.0] 本研究は,2つの軽量深層学習(DL)に基づく知的侵入検知システム(IDS)を提案する。
提案されたCNNベースのIDSは99.34%、99.02%、98.6%の精度を達成し、LSTMベースのIDSは99.42%、99.13%、98.68%の精度を達成している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:18:47 GMT)
Residual Stream Duality in Modern Transformer Architectures [9.9] 最近の研究により、残留経路は単なる最適化配管ではなく、モデルの表現機械の一部であることが明らかになった。
このデザイン空間を整理する最もクリーンな方法は、Transformerの2軸ビューである、と私たちは主張する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 00:56:29 GMT)
ADAPT: Adaptive Dual-projection Architecture for Perceptive Traversal [9.9] ADAPTは、地形地形の水平標高マップと、走行可能な空間制約の垂直距離マップを用いて環境を表現する。
ボクセルベースのベースラインと比較すると、ADAPTは観察次元と計算オーバーヘッドを大幅に削減する。
これは、Unitree G1 Humanoidへのゼロショット転送を成功させる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:00:13 GMT)
Noisy Data is Destructive to Reinforcement Learning with Verifiable Rewards [9.8] 検証可能な報酬付き強化学習(RLVR)は、様々な領域にわたる大規模言語モデルの最近の能力向上を促している。
近年の研究では、改良されたRLVRアルゴリズムにより、間違ったアノテーションからモデルが効果的に学習できることが示唆されている。
100%ノイズのあるトレーニングデータがクリーンなデータで"汚染"されているため,これらの結果は無効であることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:48:32 GMT)
High-rate quantum digital signatures over 250 km of optical fiber [9.7] 量子デジタルシグネチャは、メッセージの整合性、認証、非監査のための情報理論のセキュリティを提供する。
量子デジタルシグネチャ(QDS)は、メッセージの完全性、認証、非監査のための情報理論のセキュリティを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:43:59 GMT)
Evo-Retriever: LLM-Guided Curriculum Evolution with Viewpoint-Pathway Collaboration for Multimodal Document Retrieval [9.7] Evo-Retriever は LLM によるカリキュラムの進化を特徴とする検索フレームワークである。
nDCG@5スコアは65.2%、77.1%である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:36:56 GMT)
Stein Variational Ergodic Surface Coverage with SE(3) Constraints [9.7] 既存の軌道法では、抽出可能な3Dポイントクラウド表面ターゲットの生成に失敗する。
本稿では,3次元点-雲面軌道を生成する新しい手法を提案する。
我々のフレームワークは、強い最適化ベースのSAOアプローチと比較して、常に局所最適化を識別する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:54:43 GMT)
Tracking the Discriminative Axis: Dual Prototypes for Test-Time OOD Detection Under Covariate Shift [9.5] ディープラーニングシステムの信頼性の高いデプロイには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
本稿では,2つのプロトタイプを動的に追跡するオンラインOOD検出手法であるDARTを提案する。
提案手法は, ImageNet-C vs. Textures-CにおけるAUROC利得が15.32ポイント (pp) , FPR@95TPRが49.15pp削減された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:50:17 GMT)
MLLM-based Textual Explanations for Face Comparison [9.4] 本研究では,MLLMが生成した顔認証タスクに関する説明を系統的に分析する。
以上の結果から,MLLMが正しい検証判断を下しても,伴う説明は検証不能あるいは幻覚的顔面属性に依存することが多いことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:01:00 GMT)
Segmentation-Based Attention Entropy: Detecting and Mitigating Object Hallucinations in Large Vision-Language Models [9.4] LVLM(Large Vision-Language Models)は多くのマルチモーダルタスクにおいて高い性能を達成するが、オブジェクト幻覚は信頼性を著しく損なう。
現存する研究の多くは、過度に強い言語に幻覚をもたらし、視覚的根拠が不十分なテキストモダリティに焦点を当てている。
本研究では,意味的セグメンテーションを利用してオブジェクトレベルの意味空間における視覚的注意の不確かさを定量化する注意エントロピー(SAE)を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:19:22 GMT)
SE(3)-LIO: Smooth IMU Propagation With Jointly Distributed Poses on SE(3) Manifold for Accurate and Robust LiDAR-Inertial Odometry [9.3] 本稿では,既存のIMU伝搬法の限界について,動き予測と動き補償の観点から検討する。
提案するIMU伝搬と不確実性を考慮した動作補償を統合したLiDAR慣性オドメトリーを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:55:23 GMT)
BenchPreS: A Benchmark for Context-Aware Personalized Preference Selectivity of Persistent-Memory LLMs [9.3] 本稿では,メモリベースのユーザ嗜好が,コミュニケーションコンテキスト全体にわたって適切に適用されているか,あるいは抑制されているかを評価するBenchPreSを紹介する。
より強い嗜好の順守を持つモデルは、アプリケーションの過剰使用率が高く、推論能力やプロンプトベースの防御がこの問題を完全に解決しない。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:19:05 GMT)
Spin entanglement signatures of proton from a light-front Hamiltonian [9.2] 我々は,Basis Light-Front Quantizationから得られた陽子スピンの絡み合いとクォークダイクォークモデルから得られたスピンの絡み合いを比較した。
クォーク・ダイクォークモデルでは、BLFQ波動関数よりもかなり絡み合ったスピン状態が得られる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:42:42 GMT)
Patient4D: Temporally Consistent Patient Body Mesh Recovery from Monocular Operating Room Video [9.2] 患者4Dはステーションに拘束された再建パイプラインであり、以前の固定性を利用する。
患者4Dは0.75の平均IoUを達成し、最高のベースラインに比べて故障フレームを30.5%から1.3%に削減した。
本研究は, 臨床ARシナリオにおいて, 固定性前駆体を利用したモノクローナル再構築を著しく改善できることを示唆するものである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:10:55 GMT)
DST-Net: A Dual-Stream Transformer with Illumination-Independent Feature Guidance and Multi-Scale Spatial Convolution for Low-Light Image Enhancement [9.2] 低照度画像強調は、薄暗い環境で視覚センサーが捉えた画像の可視性を回復することを目的としている。
本稿では,照明非依存信号の事前誘導とマルチスケール空間畳み込みに基づくDST-Netを提案する。
LOLデータセット上のPSNRは25.64dBである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:07:32 GMT)
LUMINA: A Multi-Vendor Mammography Benchmark with Energy Harmonization Protocol [9.1] このデータセットは、病理診断されたラベル、BI-RADSアセスメント、乳腺密度アノテーションを持つ468人の患者の1824枚の画像を含んでいる。
LUMINAは6つの取得システムにまたがっており、高エネルギーと低エネルギーの撮像方式がある。
我々は,診断,BI-RADS分類,密度推定の3つの臨床的課題について,CNNとトランスフォーマーモデルをベンチマークした。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:50:59 GMT)
ECHO: Edge-Cloud Humanoid Orchestration for Language-to-Motion Control [9.0] 本稿では,ヒューマノイドロボットの言語駆動型全身制御のためのエッジホスト型フレームワークECHOを提案する。
クラウドネイティブ拡散に基づくテキスト・トゥ・モーション・ジェネレータは、自然言語命令から動作参照を合成する。
エッジ展開された強化学習トラッカーは、ロボットのクローズドループでそれらを実行する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:16:18 GMT)
FG-SGL: Fine-Grained Semantic Guidance Learning via Motion Process Decomposition for Micro-Gesture Recognition [8.9] 微妙なクラス間変異のため、マイクロジェスチャー認識は困難である。
既存の手法はカテゴリーレベルの監督に依存している。
本稿では,ファイングラインド・セマンティック・ガイダンス・ラーニング・フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:57:54 GMT)
EmoStory: Emotion-Aware Story Generation [8.9] 本稿では,感情を意識したストーリー生成について紹介する。
EmoStoryはエージェントベースのストーリープランニングと地域対応ストーリー生成を統合した2段階のフレームワークである。
EmoStoryを25の被験者と600の感情的ストーリーを対象とした新たに構築したデータセットで評価した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:56:27 GMT)
SLAM Adversarial Lab: An Extensible Framework for Visual SLAM Robustness Evaluation under Adverse Conditions [8.8] SALは、各逆境条件を、既存のデータセットを逆境データセットに変換する摂動として表現する。
SALは、霧の見える化のためにメーターのような容易に解釈可能な現実世界のユニットを使用して重大度レベルをサポートする。
SALは、SLAMシステムが故障する摂動の重大度レベルを検出する探索手順を含む。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:50:58 GMT)
Scalable Inspection Planning via Flow-based Mixed Integer Linear Programming [8.6] 検査計画とは、最短のロボット経路を計算して、与えられた一連の関心点を検査することである。
我々は、GIPのための高度にスケーラブルな混合線形プログラミング(MILP)ソリューションを提案し、ランタイムとソリューションの品質の両方において最先端の技術を著しく向上させます。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:40:26 GMT)
FastLoop: Parallel Loop Closing with GPU-Acceleration in Visual SLAM [8.6] 本稿では,この計算複雑性を緩和するGPUアクセラレーションループ閉包モジュールであるFastLoopを提案する。
視覚SLAMのループクローズパイプラインにおける重要なパフォーマンスボトルネックを特定し、GPU上での並列最適化を通じてそれらに対処する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:04:48 GMT)
Unpaired Cross-Domain Calibration of DMSP to VIIRS Nighttime Light Data Based on CUT Network [8.5] 本研究では,コントラスト・アンペアド・トランスフォーメーション(CUT)ネットワークを用いたクロスセンサ・キャリブレーション手法を提案し,DMSPデータをVIIRSライクなフォーマットに変換する。
結果: VIIRS のようなデータは、実際の VIIRS 観測(R-squared が 0.87 以上)や社会経済指標と高い整合性を示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:14:20 GMT)
Domain Mixture Design via Log-Likelihood Differences for Aligning Language Models with a Target Model [8.5] 本稿では,対数様空間の点としてモデルを見ることによって,領域重みを決定する手法を提案する。
NanoGPTを用いた実験により,提案手法は目標モデルに対するKLの発散を連続的に低減することを示した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:58:28 GMT)
SseRex: Practical Symbolic Execution of Solana Smart Contracts [8.4] SseRexはSolana固有のバグを見つけるための最初のシンボリックな実行脆弱性検出手法である。
バイトコードのみの契約8,714件の評価は,既存のアプローチよりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:33:11 GMT)
Self-Aware Markov Models for Discrete Reasoning [8.2] 本稿では,Markovトランジションカーネルの学習方法を紹介する。
この設計によりトークンを再マッピングすることができ、モデルが以前のミスを修正することができる。
Sudoku-Extremeデータセットでは、95%の妥当性で、他のフローベース手法よりも明らかに優れている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:30:06 GMT)
ACPV-Net: All-Class Polygonal Vectorization for Seamless Vector Map Generation from Aerial Imagery [8.1] 本研究では,空中画像から完全なベクトルマップ表現を単一ランで生成する問題に対処する。
既存のポリゴン化法は通常クラス固有であり、クラス毎に複数のクラスに拡張すると、一般にトポロジカルな矛盾が生じる。
我々は、この新しいタスクをオールクラス多角ベクトル化(ACPV)として形式化し、最初の公開ベンチマークであるDeventer-512をリリースする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:55:10 GMT)
DySL-VLA: Efficient Vision-Language-Action Model Inference via Dynamic-Static Layer-Skipping for Robot Manipulation [8.0] 本稿では,各アクションの重要性に基づいて動的にVLA層をスキップすることで,計算コストに対処する新しいフレームワークDySL-VLAを提案する。
実験の結果,DySL-VLAはCalvinデータセット上のDeer-VLAよりも2.1%向上していることがわかった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:08:40 GMT)
Learning When to Sample: Confidence-Aware Self-Consistency for Efficient LLM Chain-of-Thought Reasoning [7.9] 大規模言語モデル(LLM)は、チェーン・オブ・ソート(CoT)推論によって強い推論性能を達成する。
最近の自己整合性に基づくアプローチは、精度をさらに向上するが、複数の推論軌道のサンプリングと集約が必要である。
本稿では,単一経路と複数経路の推論を適応的に選択するための単一経路推論軌道を解析する信頼度対応決定フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:02:58 GMT)
SYMDIREC: A Neuro-Symbolic Divide-Retrieve-Conquer Framework for Enhanced RTL Synthesis and Summarization [7.9] 本稿では,RTLタスクをシンボルサブゴールに分解する神経シンボリックフレームワークであるSYMDIRECを紹介する。
SYMDIRECは合成のためのPass@1の20%、要約のための15-20%のROUGE-Lの改善を達成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:15:24 GMT)
Rationale Matters: Learning Transferable Rubrics via Proxy-Guided Critique for VLMReward Models [7.8] 視覚言語モデル(VLM)のための生成的報酬モデル(GRM)は、しばしば3段階のパイプラインを通して出力を評価する。
本稿では,RL(Reinforcement Learning)にプロキシ誘導型ルーリック検証を導入し,ルーリック品質を明示的に向上するProxy-GRMを提案する。
50kのデータサンプルで、VL-Reward Bench、Multimodal Reward Bench、MM-RLHF-Reward Benchの最先端結果に達する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:45:49 GMT)
Towards End-to-End Quantum Estimation of Non-Hermitian Pseudospectra [7.8] 非エルミート多体系はスペクトル不安定であり、小さな摂動は大きな固有値シフトを引き起こす。
疑似スペクトルは、この不安定性を定量化し、摂動ローバスト診断を提供する。
我々は、ある点 $zinmathbbC$ がスペクトルに対して$$-close であるかどうかを決定することは、5$-local operator に対して PSPACE-hard であることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:44:04 GMT)
Cross-modal learning for plankton recognition [7.8] 本稿では,マルチモーダルをプランクトン認識に活用するための戦略として,自己監督型クロスモーダルコーディネートを考察する。
提案手法は,最小限のラベル付き画像しか必要とせず,高い認識精度を実現する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:04:52 GMT)
pADAM: A Plug-and-Play All-in-One Diffusion Architecture for Multi-Physics Learning [7.8] pADAMは、不均一な偏微分方程式族をまたいだ共分散確率的事前学習を行う統合生成フレームワークである。
トレーニングをすることなく、単一のアーキテクチャ内で前方予測と逆推論をサポートする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:37:11 GMT)
VIGIL: Towards Edge-Extended Agentic AI for Enterprise IT Support [7.8] VIGILはエッジ拡張型エージェントAIシステムで、デスクトップ常駐エージェントを配置して、位置診断、企業知識の検索、およびポリシーを優先した修復を、明示的な同意とエンドツーエンドの可観測性を持って、ユーザデバイス上で直接行う。
VIGILの100のリソース制約されたエンドポイント上での運用ループを10週間のパイロットテストで、VIGILはインタラクションラウンドを39%削減し、少なくとも4倍高速な診断を実現し、マッチしたケースの82%でセルフサービス解決をサポートする。
利用者は、4つの検証済み機器にまたがる優れたユーザビリティ、高い信頼、低認知負荷を報告し、質的なフィードバックは透明性を強調している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:24:19 GMT)
Simplex-to-Euclidean Bijection for Conjugate and Calibrated Multiclass Gaussian Process [7.7] 確率単純度の幾何学を利用して,多クラス分類のための共役・ガウス過程(GP)モデルを提案する。
このアプローチでは、Aitchison幾何を用いて、単純値のクラス確率を制約のないユークリッド表現にマッピングする。
これにより、モデル構築における分布近似に頼ることなく、共役推論と信頼できる予測確率が得られる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:58:11 GMT)
DISCOVER: A Solver for Distributional Counterfactual Explanations [7.7] DISCOVERは、分散対実的説明のためのモデルに依存しない解法である。
これは、輸送目標のサンプルワイズ分解を利用して、ローごとのインパクトスコアを計算し、最高$kの介入予算を強制する。
複数のデータセットの実験は、入力分布と出力分布の強い結合性を示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:18:27 GMT)
Onboard MuJoCo-based Model Predictive Control for Shipboard Crane with Double-Pendulum Sway Suppression [7.6] 海上での重荷の移動は、危険なペイロードのスウェイによって制限された効率的なクレーンの運用に依存している。
既存の制御方法はそのような設定で苦労し、しばしば単純化された分析モデルに依存している。
MuJoCo MPCフレームワークを中心とした,完全なリアルタイム制御パイプラインを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:43:52 GMT)
Is Conformal Factuality for RAG-based LLMs Robust? Novel Metrics and Systematic Insights [7.6] 大規模言語モデル(LLM)は、知識集約型アプリケーションにおける信頼性を制限し、しばしば幻覚を与える。
検索拡張世代(RAG)と共形事実性は、この制限に対処する潜在的方法として浮上している。
我々は,RAGをベースとしたLCMの信頼性と有用性,評価,校正,堅牢性,効率性を解析した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:20:08 GMT)
HGP-Mamba: Integrating Histology and Generated Protein Features for Mamba-based Multimodal Survival Risk Prediction [7.6] 我々は,マンバを基盤としたHGP-Mambaを,生存リスク予測のための組織学的特徴と生成タンパク質の特徴を効率的に統合するフレームワークとして提案する。
具体的には、事前訓練された基礎モデルを利用して高スループットタンパク質の埋め込みを導出するタンパク質特徴抽出器(PFE)を提案する。
さらに,微細な特徴相互作用のための局所的相互作用認識型マンバ (LiAM) と,包括的モダリティ融合を促進するためのグローバル相互作用強化型マンバ (GiEM) についても紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:57:49 GMT)
Efimovian Phonon Production for an Analog Coasting Universe in Bose-Einstein Condensates [7.6] エフィモフ効果は、普遍的な意味を持つ基本的な対称性であるスケール不変性から生じる。
ここでは、準二次元ボース・アインシュタイン凝縮によって実現されたアナログ線形膨張宇宙における時間的エフィモフ効果を予測する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:34:41 GMT)
Make it SING: Analyzing Semantic Invariants in Classifiers [7.4] 本稿では,ネットワークに関して等価な画像を構築し,利用可能なバリエーションに意味論的解釈を割り当てる手法を提案する。
これにより、帰納的意味変化の自然言語記述と視覚的例を得ることができる。
例えば、ResNet50はnull空間に関連セマンティック属性をリークするのに対して、自己教師付きDINOで事前訓練されたViTであるDinoViTは、不変空間全体のクラスセマンティクスを維持するのに優れている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:33:45 GMT)
Dialect-Agnostic SQL Parsing via LLM-Based Segmentation [7.4] 本稿では,文法に基づく構文解析とLLMに基づくセグメンテーションを統合し,方言を頑健に解析する新しい問合せ書き換えフレームワークを提案する。
我々の中核となる考え方は、階層解析を逐次セグメンテーションタスクに分解することであり、LLMの強度とよりよく一致する。
独立した評価では、8つの方言で91.55%から100%のクエリを解析し、すべてのベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:18:37 GMT)
Frequency Matters: Fast Model-Agnostic Data Curation for Pruning and Quantization [7.3] 大規模言語モデル(LLM)の可搬性向上には後学習モデル圧縮が不可欠である
texttttextbfZipCalは、Zipfianの電力法則に基づく語彙の多様性を最大化するモデルに依存しないデータキュレーション戦略である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:12:08 GMT)
Intent Formalization: A Grand Challenge for Reliable Coding in the Age of AI Agents [7.2] エージェントAIシステムは、驚くほどの頻度でコードを生成することができる。
生成されたコードが実際にユーザが意図した通りに動作するようにします。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:28:59 GMT)
Informative Perturbation Selection for Uncertainty-Aware Post-hoc Explanations [7.2] 信頼と倫理的な懸念は、不透明な機械学習(ML)モデルが広く展開することによるものであり、信頼性のあるモデル説明の必要性を動機付けている。
ポストホックモデルに依存しない説明法は、興味のあるサンプルの局所性においてデプロイされたブラックボックスMLモデルの振る舞いを近似する代理モデルを学ぶことでこの問題に対処する。
本稿では,情報理論の積極的学習問題として摂動選択を定式化する,ポストホックモデルに依存しない説明フレームワークであるemphExpected Active Gain for Local Explanations (textttEAGLE)を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:41:30 GMT)
Structured prototype regularization for synthetic-to-real driving scene parsing [7.1] 運転シーンのパーシングは、自動運転車が現実世界の交通環境で確実に運転することが重要である。
コストのかかるピクセルレベルのアノテーションへの依存を減らすため、自動生成されたラベルを持つ合成データセットが一般的な選択肢となっている。
合成データに基づいて訓練されたモデルは、合成から実際のドメインギャップのために現実世界のシーンに適用すると、しばしば性能が良くない。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:05:28 GMT)
Noise-Response Calibration: A Causal Intervention Protocol for LLM-Judges [7.1] 大規模言語モデル (LLMs) は、自動判断器や合成ラベル装置としてますます使われている。
制御された入力介入に基づく実用的なキャリブレーションプロトコルを提案する。
我々は、繰り返し試行錯誤による斜面ベースの仮説テストでこれを運用する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:08:06 GMT)
LICA: Layered Image Composition Annotations for Graphic Design Research [7.0] LICA (Layered Image composition s) は、1,550,244枚の多層グラフィックデザインの大規模データセットである。
データセットは20の設計カテゴリと991,850のユニークなテンプレートで構成され、現実世界のデザイン構造を幅広くカバーしている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:43:13 GMT)
LenghuSky-8: An 8-Year All-Sky Cloud Dataset with Star-Aware Masks and Alt-Az Calibration for Segmentation and Nowcasting [7.0] LenghuSky-8(レングスカイ-8)は、最初の天体観測地点から8年間の全天撮影データセットである。
昼、夜、月相をまたいだ堅牢な雲のセグメンテーションのために、我々はDINOv3の局所的な特徴について線形プローブを訓練する。
各画素を局所アルトアズ座標にマッピングし,キャリブレーションの不確かさを測定する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:05:21 GMT)
SMAL-pets: SMAL Based Avatars of Pets from Single Image [7.0] SMAL-petsは、単一の入力画像から高品質で編集可能な動物アバターを生成する包括的なフレームワークである。
我々のアプローチは、ハイブリッドアーキテクチャを活用して、再構築と生成モデリングのギャップを埋める。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:47:49 GMT)
Nonstandard Errors in AI Agents [6.9] 我々は、現在最先端のAIコーディングエージェントが、同じデータと研究質問を与えられた場合、同じ経験的結果をもたらすかどうかを調査する。
我々は,AIエージェントが,分析選択におけるエージェント対エージェントのばらつきから不確実な,大きさのテクスチノンスタンダードエラー(NSE)を示すことを発見した。
これらの発見は、自動政策評価と実証研究におけるAIの利用の増加に影響を及ぼす。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:21:22 GMT)
Reevaluating the Intra-Modal Misalignment Hypothesis in CLIP [6.9] 近年の研究では、CLIPライクなコントラスト言語イメージトレーニングによる埋め込みが、画像のみのタスクに最適であることが示唆されている。
本研究では,このモーダル内不整合仮説を疑問視する。
モーダル内タスク検索と少数ショット分類の実験により、不正と想定されないタスクのあいまいさに対処することが、最良の結果の鍵であることが確認された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:49:55 GMT)
Full-quantum variational dynamics simulation for time-dependent Hamiltonians with global spectral discretization [6.8] 量子計算による時間依存ハミルトニアンの力学をシミュレートするための最も広く用いられるアプローチは、量子古典的ハイブリッド変分量子時間進化アルゴリズムに依存する。
ここでは、変分係数の常微分方程式を静的線型方程式に変換する全量子的手法を提案する。
我々の完全量子アルゴリズムは古典的なフィードバックを回避し、滑らかなハミルトニアンに対する指数収束を回避し、時間ステップの数に依存しない量子回路深さを生成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:49:26 GMT)
Surrogate-Assisted Genetic Programming with Rank-Based Phenotypic Characterisation for Dynamic Multi-Mode Project Scheduling [6.8] 遺伝的プログラミング(GP)は意思決定タスクのルールを進化させることが示されている。
GPは、問題固有の表現型キャラクタライゼーション(PC)方式を必要とする。
そこで本稿では,意思決定状況における活動モードペアと活動グループを順序付けしたランク駆動型PC方式を提案する。
結果として得られるPCベクトルは、非評価GP個体の適合度を推定する代理モデルを可能にする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:19:20 GMT)
BEV-SLD: Self-Supervised Scene Landmark Detection for Global Localization with LiDAR Bird's-Eye View Images [6.6] 本稿では,SLD(Scene Landmark Detection)概念に基づくLiDARグローバルローカライゼーション手法であるBEV-SLDを提案する。
シーンに依存しないパイプラインとは異なり、我々の自己監督的アプローチは、鳥の目視(BEV)画像を利用してシーン固有のパターンを発見する。
一貫性損失は、学習可能なグローバルなランドマーク座標とフレーム単位のヒートマップを一致させ、一貫したランドマーク検出をもたらす。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:44:16 GMT)
Geometry-Aligned LLM Fine-Tuning for Sequential Narrow-Opening Planning [6.6] 複数の狭い開口部を通した剛体運動計画について検討した。
そこで本研究では,幾何整合型大規模言語モデル(LLM)の微調整フレームワークを提案する。
本手法は,流通環境とアウト・オブ・ディストリビューション環境の両方において,最も高い成功率を達成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 00:24:32 GMT)
USIS-PGM: Photometric Gaussian Mixtures for Underwater Salient Instance Segmentation [6.5] 水中の塩分インスタンスセグメンテーション(USIS)は海洋ロボットシステムにとって不可欠である。
本稿では,USISの単一ステージフレームワークであるUSIS-PGMを提案する。
実験により提案したUSIS-PGMモデルの優位性と実用性を示した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:39:35 GMT)
Kamino: GPU-based Massively Parallel Simulation of Multi-Body Systems with Challenging Topologies [6.5] 神野(かみの)は、異種機械系の大規模並列シミュレーションのためのGPUベースの物理解法である。
キネマティックループのような強く結合されたキネマティックおよび動的制約をサポートする。
異種世界をサポートし、単一のGPU上で構造的に多様なロボットのバッチシミュレーションを可能にする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:56:33 GMT)
Volumetrically Consistent Implicit Atlas Learning via Neural Diffeomorphic Flow for Placenta MRI [6.5] 本稿では,符号付き距離関数とニューラル微分同相流の再構成を結合した容積的に一貫した暗黙的モデルを導入し,胎盤の共有正準テンプレートを学習する。
In-vivo Placenta MRIでの実験では、表面ベースの暗黙的ベースライン法よりも幾何的忠実度と体積的アライメントが改善された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:55:02 GMT)
Geometric phase for an accelerated two-level atom in AdS spacetime [6.4] 反ド・ジッター時空における無質量共形スカラー場の真空ゆらぎに結合した2レベル原子の均一加速により得られる幾何位相について検討した。
オープン量子系定式化を用いて、AdS境界の場に課される3つの境界条件の下で位相を計算する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:12:30 GMT)
SpikeCLR: Contrastive Self-Supervised Learning for Few-Shot Event-Based Vision using Spiking Neural Networks [6.3] イベントベースの視覚センサはニューロモルフィックハードウェア上に展開することができ、組み込みシステムにエネルギー効率の高い応用を可能にする。
SpikeCLRは、SNNがラベルのないイベントデータから堅牢な視覚表現を学習できるようにする、対照的な自己教師型学習フレームワークである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:11:34 GMT)
Generative AI-assisted Participatory Modeling in Socio-Environmental Planning under Deep Uncertainty [6.3] 初期概念化プロセスにおいて,大規模言語モデルを用いたテンプレートワークフローを提案する。
ワークフローの間、研究者は大きな言語モデルを使用して、ステークホルダーの直感的な問題記述から重要なモデルコンポーネントを特定できる。
これらの実験から,大規模言語モデルは,社会環境計画における問題概念化プロセスにおいて,参加型モデリングを促進する効果的なツールとして機能することが示唆された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:04:10 GMT)
SHAMISA: SHAped Modeling of Implicit Structural Associations for Self-supervised No-Reference Image Quality Assessment [6.2] No-Reference Image Quality Assessment (NR-IQA) は、素質の基準画像にアクセスすることなく知覚品質を推定することを目的としている。
本研究では,非コントラストな自己監督型フレームワークであるSHAMISAを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:34:31 GMT)
Diverging Transformer Predictions for Human Sentence Processing: A Comprehensive Analysis of Agreement Attraction Effects [6.1] トランスフォーマーは、計算言語学において、ほとんどすべての最先端の言語モデルを満たす。
サブプライザルベースのリンク機構を用いて、異なるサイズとアーキテクチャの11個の自己回帰変換器を評価する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:27:46 GMT)
MSRAMIE: Multimodal Structured Reasoning Agent for Multi-instruction Image Editing [6.1] MLLM(Multimodal Large Language Model)に基づくトレーニングフリーエージェントフレームワークであるMSRAMIEを提案する。
MSRAMIEは既存の編集モデルをプラグインコンポーネントとして扱い、構造化マルチモーダル推論によるマルチインストラクションタスクを処理する。
実験によると、命令の複雑さが増大するにつれて、MSRAMIEは15%以上の命令を改善でき、単一の実行ですべての修正を完了させる確率が100%上がる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:05:16 GMT)
SENSE: Efficient EEG-to-Text via Privacy-Preserving Semantic Retrieval [6.0] 脳活動を自然言語にデコードすることは、補助コミュニケーション、ニューロテクノロジー、人間とコンピュータの相互作用に重要な応用を持つAIにおける大きな課題である。
既存のBrain-Computer Interface (BCI) のアプローチは、Large Language Models (LLM) やエンコーダ-デコーダモデルのメモリ集約的な微調整に依存している。
我々は,非侵襲脳波(EEG)をLLM微調整なしでテキストに変換する軽量でプライバシー保護のフレームワークであるSENSEを紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:59:41 GMT)
Association of Progressive PPFE and Mortality in Lung Cancer Screening Cohorts [6.0] Pleuroparenchymalfibroelastosis (PPFE) は上大線維性肺疾患である。
肺癌検診におけるPPFE進行の臨床的意義は明らかでない。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:06:33 GMT)
Stochastic Resetting Accelerates Policy Convergence in Reinforcement Learning [5.9] リセットは、ファーストパスプロパティを最適化するための強力なメカニズムである。
リセットは、純粋な拡散剤の探索時間を短縮しない場合でも収束を加速することを示す。
ニューラルネットワークに基づく値近似を用いた連続制御タスクにおいて、探索が困難な場合、ランダムリセットにより深層強化学習が向上することを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:50:32 GMT)
Ethical Fairness without Demographics in Human-Centered AI [5.9] 最適化の幾何学を通してアルゴリズム的公正性と倫理的原則を整合させるフレームワークであるFrareを提示する。
また,BHE(Beneficence-Harm Avoidance-Equity)についても紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:08:24 GMT)
Contextual Preference Distribution Learning [5.9] 本稿では、優先分布を学習し、下流の問題を解決するためにそれらを活用するための逐次学習最適化パイプラインを提案する。
我々は、(整数)線形プログラムとして定式化できる人間の選択設定に焦点を当てる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:11:21 GMT)
Research on Individual Trait Clustering and Development Pathway Adaptation Based on the K-means Algorithm [5.8] 本研究の目的は,K平均クラスタリングアルゴリズムを用いて大学生の正確なキャリアガイダンスを提供することである。
我々は, CET-4スコア, GPA, 性格特性, 学生のカドレ経験から, 3000人以上の学生のデータを分析した。
その結果,異なる特徴の組み合わせを持つ学生は,キャリアの方向性に適していることが判明した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:52:07 GMT)
SympFormer: Accelerated attention blocks via Inertial Dynamics on Density Manifolds [5.8] 我々は密度空間上の慣性ネステロフ型力学から導かれる加速された注意ブロックを導入する。
時間離散化と加速密度ダイナミクスの近似により、ハミルトン運動量注意ブロックが得られる。
本研究は,加速された注目ブロックによって楕円的に収束した確率分布が保存されていることを証明した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:56:17 GMT)
Systematization of Knowledge: The Design Space of Digital Payment Systems with Potential for CBDC [5.7] 中央銀行デジタル通貨(CBDC)は、民間のデジタル決済の獲得に対する公的対応として提案されている。
CBDCは、最初から強力な暗号化セキュリティとプライバシー保証を提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:53:22 GMT)
FederatedFactory: Generative One-Shot Learning for Extremely Non-IID Distributed Scenarios [5.7] フェデレートラーニング(FL)は、データの主権を損なうことなく分散最適化を可能にする。
我々は、識別パラメータから生成前のフェデレーション単位を反転させるゼロ依存フレームワークであるFederatedFactoryを紹介した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:58:44 GMT)
HindSight: Evaluating LLM-Generated Research Ideas via Future Impact [5.6] 提案手法は,創発的アイデアと現実の出版物とをマッチングすることで,アイデアの質を評価するための時間分割評価フレームワークであるHindSightを紹介する。
時間的カットオフ$T$を用いて、アイデア生成システムをT$前の文献に制限し、その後30ヶ月で発行された論文に対して出力を評価する。
LLM-as-Judgeは、検索強化されたアイデア生成とバニラのアイデア生成の間に大きな違いは見つからない。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:42:43 GMT)
CODMAS: A Dialectic Multi-Agent Collaborative Framework for Structured RTL Optimization [5.6] CODMASは、構造化弁証法とドメイン認識コード生成と決定論的評価を組み合わせたフレームワークである。
120のVerilogトリプル(最適化されていない、最適化された、テストベンチ)のベンチマークであるRTLOPTを導入し、パイプライン化とクロックゲーティング変換を行った。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:10:07 GMT)
Dual Stream Independence Decoupling for True Emotion Recognition under Masked Expressions [5.6] 仮面の表情から本当の感情を認識することは、意図的な隠蔽のために困難である。
既存のパラダイムは、変装し始めたばかりのオンセットフレームを含むマスク付き圧縮クリップから、真の感情を認識する。
本稿では,頂点フレームから真の感情を安定な擬似状態で分類する,新しい頂点フレームに基づくパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:40:48 GMT)
Reconciling distributed compliance with high-performance control in continuum soft robotics [5.6] ハードウェアの離散化や剛性に基づくモード抑制を伴わない,高度に適合した完全連続型ロボットアームを提案する。
このプラットフォームは、直接駆動アクチュエータ、複合曲げおよびねじれを可能にする腱ルーティングスキーム、構造化された非線形制御アーキテクチャを統合している。
提案システムでは,ソフトロボットのタスク実行速度が最速である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:01:04 GMT)
Differential Harm Propensity in Personalized LLM Agents: The Curious Case of Mental Health Disclosure [5.5] 大規模言語モデル(LLM)はツール使用エージェントとしてますます普及し、安全上の懸念を有害なテキスト生成から有害なタスク完了へとシフトさせる。
本研究は,知的健康開示がエージェント環境における有害な行動にどのように影響するかを検討した。
以上の結果から,人格化は薬剤的誤用設定において弱い保護要因となるが,最小対向圧下では脆弱であることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:16:35 GMT)
Topology-Preserving Deep Joint Source-Channel Coding for Semantic Communication [5.5] TopoJSCCはトポロジを意識したDeepJSCCフレームワークで、永続的ホモロジー正規化ツールとエンドツーエンドのトレーニングを統合している。
低信号対雑音比(SNR)と帯域幅比(SNR)における位相保存とピーク信号対雑音比(PSNR)の改善を示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:40:36 GMT)
Completely Bounded Qusi-Norms, Their Mutiplicativity, and New Additivity Results of Quantum Channels [5.5] 量子チャネルの2つの新しい加算結果を得る。
一つは、Rényi のサンドイッチ付き次数 $in[frac12,1)$ に関連付けられたチャネル Rényi 情報の加法性である。
2つ目はチャネル分散の付加性であり、これは量子情報タスクの2階の振る舞いに関連する量である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:09:22 GMT)
GeMA: Learning Latent Manifold Frontiers for Benchmarking Complex Systems [5.4] 鉄道網としての複雑なシステムの性能のベンチマークは、輸送規制とマクロ経済分析の中心である。
本稿では,アマニフォールドオートエンコーダ(ProManManVAVA)を用いた技術フレームワークGeMAを提案する。
我々は,地球規模の都市技術と大規模技術フレームワークに縛られた非次元分割フロンティアを用いたGeMA合成データを検証した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:12:30 GMT)
Caption First, VQA Second: Knowledge Density, Not Task Format, Drives Multimodal Scaling [5.4] マルチモーダルスケーリングの主なボトルネックはタスク形式ではなく、トレーニングデータにおける知識密度である。
構造化キャプションエンリッチメントとクロスモーダル・ナレッジインジェクションにより,知識密度の増大が一貫した性能向上をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:45:21 GMT)
Out-of-Distribution Object Detection in Street Scenes via Synthetic Outlier Exposure and Transfer Learning [5.2] アウト・オブ・ディストリビューション(OOD)オブジェクト検出は重要だが未探索の課題である。
textbfSynOE-OD, textbfSynthetic textbfOutlier-textbfExposure-based textbfObject textbfDetection frameworkを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:06:28 GMT)
Relaxed Efficient Acquisition of Context and Temporal Features [5.2] 本稿では,コンテキスト記述子の選択と適応的特徴時間獲得計画の同時最適化を目的とした,エンドツーエンドの差別化可能なフレームワークを提案する。
ReACTは、既存の縦方向の取得ベースラインと比較して、取得コストの低減による予測性能の向上を実現する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:53:46 GMT)
Communication-Aware Multi-Agent Reinforcement Learning for Decentralized Cooperative UAV Deployment [5.2] 我々は、分散実行(CTDE)を用いた集中学習の下で訓練されたグラフに基づくマルチエージェント強化学習フレームワークを提案する。
中央集権的な批評家とグローバルな国家は訓練中のみ利用可能であり、各UAVは近隣住民からのローカルな観察とメッセージを使用して共有ポリシーを実行する。
本アーキテクチャでは,ローカルエージェントの状態と周辺エンティティをエージェント・エンタテイメント・モジュールでエンコードし,距離限定通信グラフ上でUAV間メッセージを隣接する自己注意で集約する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:48:51 GMT)
Domain-Independent Dynamic Programming with Constraint Propagation [5.2] 制約伝搬をDPに統合することで,DPとCPのパラダイムのギャップを埋める。
ドメインに依存しない動的プログラミングフレームワークにおいて,汎用CPソルバを用いた制約伝搬を実装した。
我々の研究は、DPソルバにおける制約伝播の価値を理解するための重要なステップである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:19:47 GMT)
Online Semi-infinite Linear Programming: Efficient Algorithms via Function Approximation [5.2] 決定空間が有限次元であるような動的資源配分問題を考える。
このソリューションは、ストリーミングデータやオラクルのフィードバックによって明らかにされる大量の、あるいは無限の制約を満たす必要があります。
関数近似を用いて制約の数を定数$q$に減らします。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:27:43 GMT)
Functorial Neural Architectures from Higher Inductive Types [5.1] ニューラルネットワークは構成一般化において体系的に失敗することを示す。
この失敗はアーキテクチャであり、構成的一般化はデコーダの函手性と同値である。
独立に生成したセグメントの構造連結によって構成されたデコーダが厳密なモノイド関手であることを証明した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:08:30 GMT)
When Openclaw Agents Learn from Each Other: Insights from Emergent AI Agent Communities for Human-AI Partnership in Education [5.1] AIEDは、AIが“ツールからチームメイトまで”進化していくことを想定していますが、私たちのAIチームメイトに対する理解は、相変わらず人間とAIのインタラクションに限られています。
167,000人以上のエージェントが参加し、同僚として交流し、研究者の介入なしに学習行動を開発する、AIエージェントプラットフォームの急成長するエコシステム。
我々は、これらの有機現象が、マルチエージェント教育システムの設計を通知できる自然主義的なダイナミクスの窓を提供すると論じている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:30:36 GMT)
Optical Chopping Enhanced Rydberg-Atom-Based Ultra-Low-Frequency Electric Field Measurement [5.0] 本研究は,光チョッピング増幅(OCA)法による超低周波(ULF)電界感度の顕著な向上を示す。
本手法は, レーザーと光チョッパーとの結合を気相前で変調し, 周期的なRydberg励起をチョッピング周波数で誘導する。
OCA技術は周波数7Hzに対する感度を19.1dB向上させ、49.1uV/cm/rt(Hz)まで下げた。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:58:22 GMT)
Homogeneous and Heterogeneous Consistency progressive Re-ranking for Visible-Infrared Person Re-identification [5.0] 可視的赤外線の人物再識別は、モダリティの相違により、従来の人物の再同定よりも大きな課題に直面している。
既存のリランクアルゴリズムは、モダル人再識別におけるモダル内変異とモダル間差に同時に対処できない。
本稿では,不均質および均質な整合性という2つのモジュールからなる新しいプログレッシブモーダル関係再ランク法を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:32:53 GMT)
Speak, Segment, Track, Navigate: An Interactive System for Video-Guided Skull-Base Surgery [5.0] 本稿では, 音声ガイド下頭蓋底外科手術のためのエンボディエージェントフレームワークについて紹介する。
提案システムは,実時間映像ストリーム上での自然言語インタラクションとリアルタイム視覚認識を直接統合する。
ビデオ誘導頭蓋底手術症例において提案システムを評価し,その追跡性能を市販の光追跡システムと比較した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 00:15:17 GMT)
CoMAI: A Collaborative Multi-Agent Framework for Robust and Equitable Interview Evaluation [4.9] CoMAIは多様なアセスメントシナリオ用に設計された汎用マルチエージェントインタビューフレームワークである。
システムは、質問生成、セキュリティ、スコアリング、要約を専門とする4つのエージェントから構成される。
実験の結果、CoMAIは90.47%の精度、83.33%のリコール、84.41%の候補満足度を達成した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:44:12 GMT)
Bridging the High-Frequency Data Gap: A Millisecond-Resolution Network Dataset for Advancing Time Series Foundation Models [4.7] 動作中の5G無線配置からミリ秒間無線および交通条件をキャプチャする新しいデータセットを提案する。
このデータセットはまた、新しいドメイン、無線ネットワークを導入し、エネルギーやファイナンスといった既存の一般的なドメインを補完する。
このデータセットを用いた予測タスクにおける従来の機械学習モデルとTSFMにより、ほとんどのTSFMモデル構成が、この新しいデータ分布に対して不十分に動作することを示した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:23:37 GMT)
Lipschitz-Based Robustness Certification Under Floating-Point Execution [4.4] 本研究では,浮動小数点実行の感度に拘束される実算術感度に関する理論を開発する。
浮動小数点実行時のロバスト性に関する音条件を導出する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:15:22 GMT)
Is Seeing Believing? Evaluating Human Sensitivity to Synthetic Video [4.4] 機械学習の進歩により、Deepfakesとして知られるリアルな合成ビデオが作成できるようになった。
ディープフェイクの普及に伴い、偽情報の急速な拡散や大衆の認識の操作に関する懸念が高まっている。
本稿では,映像の視覚的・聴覚的歪みに対する人間の反応と,深層的な視覚的・ナレーションの差を狭めることを目的とする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:54:27 GMT)
High-Fidelity Compression of Seismic Velocity Models via SIREN Auto-Decoders [4.4] Inlicit Neural Representations (INR) は、グリッド解像度とは独立に連続的な信号を表現するための強力なパラダイムとして登場した。
SIREN(Sinusoidal Networks)自動デコーダに基づく多構造地震波速度モデルを表現する高忠実度ニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:22:14 GMT)
Form Without Function: Agent Social Behavior in the Moltbook Network [4.4] Moltbookは、すべての参加者がAIエージェントであるソーシャルネットワークである。
我々は5400のコミュニティで1,312,238の投稿、6.7万のコメント、12万以上のエージェントプロファイルを分析している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:54:25 GMT)
Agentic AI for Human Resources: LLM-Driven Candidate Assessment [4.3] 本稿では,Large Language Models (LLMs) を用いて,採用における候補評価を自動化するモジュール型・解釈可能なフレームワークを提案する。
このシステムは、ジョブ記述、CV、面接書、人事フィードバックなど様々なソースを統合し、専門家の判断を反映した構造化された評価レポートを生成する。
このフレームワークは、詳細なアセスメントレポート、候補比較、および、透明で監査可能で、実際の雇用に適したランク付けされたレコメンデーションを出力する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:32:08 GMT)
Evaluating Ill-Defined Tasks in Large Language Models [4.2] 評価ベンチマークとメトリクスが不確定なタスクに対して、モデル能力の信頼性や診断信号を提供できない理由を分析する。
評価基準を多面的に評価することで,集計スコアを超える実用的な洞察が得られることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:52:47 GMT)
3D Fourier-based Global Feature Extraction for Hyperspectral Image Classification [4.1] 本稿では,局所的な3次元畳み込み特徴抽出と周波数領域グローバルフィルタリングを統合した新しいアーキテクチャであるHybrid GFNetを提案する。
3次元畳み込み層は微細な局所空間スペクトル構造を捉え、フーリエのグローバルフィルタリングモジュールは長距離依存性を効率的にモデル化しノイズを抑制する。
HGFNetは、HSICでよく見られる重度のクラス不均衡を緩和するために、適応的焦点損失(Adaptive Focal Loss, AFL)を導入し、クラスワイドの焦点と重み付けを動的に調整する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:02:28 GMT)
Impacts of Electric Vehicle Charging Regimes and Infrastructure Deployments on System Performance: An Agent-Based Study [4.1] 本研究では,3つの帯電状態下での軌道レベル遅延型公共帯電需要を生成するためのエージェント・ベース・モデリング・フレームワークを適用した。
その結果, インフラの設置コストと一般料金の両方を考慮し, システム全体のコストを削減できることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:26:29 GMT)
Runtime Governance for AI Agents: Policies on Paths [4.1] 我々は、実行パスが効率的なランタイムガバナンスの中心的なオブジェクトであると主張している。
私たちの見解では、実行時評価は一般的なケースであり、パスに依存したポリシーには必要です。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:35:52 GMT)
The State of Generative AI in Software Development: Insights from Literature and a Developer Survey [4.1] 本研究は,65名のソフトウェア開発者を対象に,文献レビューを実施。
結果は、GenAIが設計、実装、テスト、ドキュメントに最も影響していることを示している。
調査回答者の79パーセントが毎日GenAIを使用しており、開発環境に直接統合された選択肢よりもブラウザベースの大規模言語モデルを好む。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:59:59 GMT)
Efficient LLM Serving for Agentic Workflows: A Data Systems Perspective [3.9] Heliumはワークフロー対応のサービスフレームワークで、エージェントワークロードをクエリプランとしてモデル化し、LLM呼び出しを第一級演算子として扱う。
Heliumは従来のクエリ最適化の原則をLLMサービスにブリッジし、最先端のエージェントサービスシステムよりも最大1.56倍のスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:03:18 GMT)
A Scoping Review of AI-Driven Digital Interventions in Mental Health Care: Mapping Applications Across Screening, Support, Monitoring, Prevention, and Clinical Education [3.9] Generative AI(GenAI)とHuman-Centered AI(HCAI)は、デジタル精神医学やメンタルヘルスケアへのアクセス拡大にますます利用されている。
本総説では, 治療前(スクリーニング/トリアージ), 治療後(遠隔患者モニタリング), 臨床教育, 人口レベルの予防の5つの重要な段階にわたる, AI駆動型メンタルヘルス技術の展望を概観する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:33:29 GMT)
DanceHA: A Multi-Agent Framework for Document-Level Aspect-Based Sentiment Analysis [3.9] Aspect-Based Sentiment Intensity (ABSIA)は、ドメイン固有の文レベルの設定に重点を置いているが、注目を集めている。
本研究では,オープンエンドで文書レベルのABSIAを非公式に記述可能なマルチエージェントフレームワークであるDanceHAを紹介する。
我々はDanceHAの細粒度で高精度なラベルを特徴とするマルチドメイン文書レベルABSIAデータセットであるInf-ABSIAをリリースした。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:11:07 GMT)
Prompts Blend Requirements and Solutions: From Intent to Implementation [3.7] 我々は、要求とソリューションガイダンスを混ぜ合わせた軽量で進化する要求アーティファクトとして、プロンプトを理解するべきだと論じている。
我々のビジョンは、現実世界のAI支援開発の分析を通じて、これらの仮説を実証的に評価することである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:31:44 GMT)
IndexRAG: Bridging Facts for Cross-Document Reasoning at Index Time [3.7] IndexRAGは、オンライン推論からオフラインインデックスへ、クロスドキュメント推論をシフトする新しいアプローチである。
IndexRAGはドキュメント間で共有されるブリッジエンティティを特定し、独立した検索可能なユニットとしてブリッジング事実を生成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:51:31 GMT)
Power Analysis for Prediction-Powered Inference [3.7] 予測力の高い新しいAI/MLモデルを考えると、望ましい統計的パワーを達成するためにラベル付きサンプルはいくつ必要か?
我々は,PPI推定器のばらつきを特徴づけ,Waldテストインバージョンを適用して,必要なラベル付きサンプルサイズを求めることにより,閉形式電力公式を導出する。
解析式はモンテカルロシミュレーションを用いて検証し, 単細胞転写学, 臨床血圧測定, 皮膚顕微鏡画像にまたがる3つの現代の生体医学的応用の枠組みを概説した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 00:57:11 GMT)
Multilingual Reference Need Assessment System for Wikipedia [3.6] ウィキペディアでは、コンテンツは検証されなければなりません。つまり、読者は信頼できる情報源への参照によってクレームが裏付けられていることを確認できます。
これは、効果的だが労働集約的なプロセスである編集者による手作業による検証に依存する。
我々は,引用を必要とするクレームの特定において,編集者を支援する多言語機械学習システムを導入する。
われわれのアプローチはWikipediaの10の言語版でテストされており、既存の基準要求評価ベンチマークよりも優れている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:20:40 GMT)
Personalized Fall Detection by Balancing Data with Selective Feedback Using Contrastive Learning [3.6] 本稿では,半教師付きクラスタリングとコントラスト学習を組み合わせたパーソナライズフレームワークを提案する。
このフレームワークは、TFS(Training from Scratch)、TL(Transfer Learning)、FewShot Learning(FewShot Learning)の3つの再トレーニング戦略に基づいて評価されている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:22:21 GMT)
An assessment of data-centric methods for label noise identification in remote sensing data sets [3.5] リモートセンシングの分野では,ラベルノイズの自動処理は近年ほとんど注目されていない。
ラベルノイズに対処するデータ中心手法の性能を体系的に分析することができない。
データ中心のラベルノイズ法をリモートセンシングデータに転送する研究が必要な領域がまだ存在するかを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:40:28 GMT)
CompDiff: Hierarchical Compositional Diffusion for Fair and Zero-Shot Intersectional Medical Image Generation [3.5] 生成モデルは、より公正なAIのための医療画像データセットの強化にますます使われています。
ジェネレータ自体が、人口集団全体で均等に高品質な画像を生成しているのだ。
本稿では,この問題を表現レベルで解決する階層型構成拡散フレームワークであるCompDiffを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:16:42 GMT)
SA-CycleGAN-2.5D: Self-Attention CycleGAN with Tri-Planar Context for Multi-Site MRI Harmonization [3.5] 本稿では,Ben-David らによる$HH$-divergence 境界によるドメイン適応フレームワーク SA-CycleGAN-2.5D を提案する。
2D効率と3D一貫性をブリッジすることで,腫瘍の病態を保ったボクセルレベルの高調波画像が得られる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:49:46 GMT)
Human/AI Collective Intelligence for Deliberative Democracy: A Human-Centred Design Approach [3.5] 本章では、自由民主主義のための集団知性(CI4DD)の概念を紹介する。
計算ツール,特に人工知能の使用は,集団知能を増強するために設計された,より幅広い種類の人-コンピュータシステムのインスタンス化である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:47:54 GMT)
A Compact Broadband Purcell Filter for Superconducting Quantum Circuits in a 3D Flip-Chip Architecture [3.4] フィルタは7.68GHz中心のフラットな1GHzのパスバンドを提供し、典型的なキュービット周波数で45dBの抑圧を実現する。
設計はコンパクトで耐加工性があり、大規模超伝導量子プロセッサの実用的な解決策となっている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:50:18 GMT)
An Interpretable Machine Learning Framework for Non-Small Cell Lung Cancer Drug Response Analysis [3.4] パーソナライズドメディカルでは、治療は個人の遺伝情報と生活様式に応じて調整される。
本稿では,遺伝子プロファイルに着目した患者データを用いたパーソナライズされた治療計画の開発に焦点をあてる。
がんにおける薬物感受性ゲノミクスのマルチオミクスデータは、予測モデルを構築するために使われてきた。
XGBoostorは、がんデータセットから抽出された分子的および細胞的特徴に焦点を当てた薬物応答を予測するために使用される。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:01:26 GMT)
Tunable Rotation-Associated Slow-to-Fast Light Conversion via Optomagnonic Coupling [3.4] 我々は、光子、フォノン、マグノンを統合するシステムを構築し、光力学系にマグノンの自由度を導入する。
連続制御場周波数変調による双方向光速変換(スロー・トゥ・ファスト・アンド・ファスト・スロー)を数値的に示す。
この研究は、全光ネットワークや量子通信に応用可能な、多周波光速度制御のための柔軟なプラットフォームを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:30:26 GMT)
Synchronized DNA sources for unconditionally secure cryptography [3.4] そこで我々は, 合成DNAのランダムプールを利用したDNAベースの暗号プリミティブを導入し, 遠隔者間での同期エントロピー源を設置する。
室内シークエンシングを用いて,東京とパリ間のこのプロトコルを実験的に実証し,400Mbの共有秘密マスクを作成した。
分子生物学と暗号の橋渡しによって、DNAベースの鍵分布は、グローバル通信ネットワークにおける無条件セキュリティに向けた、有望な新しいルートを開く。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:25:28 GMT)
RepoReviewer: A Local-First Multi-Agent Architecture for Repository-Level Code Review [3.3] RepoReviewerは、GitHubリポジトリの自動レビューのためのローカルファーストのマルチエージェントシステムである。
我々は、Python CLI、FastAPI API、LangGraphオーケストレーション層、Next.jsユーザインターフェースを備えたRepoReviewerを提示する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:17:51 GMT)
Optimal uncertainty bounds for multivariate kernel regression under bounded noise: A Gaussian process-based dual function [3.2] 非保守的不確実性境界はノイズデータから潜在関数の信頼性予測に不可欠である。
本稿では,マルチアウトプットカーネルベース推定のための厳密な分布自由境界を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:06:54 GMT)
Rotated Robustness: A Training-Free Defense against Bit-Flip Attacks on Large Language Models [3.2] ハードウェアの欠陥、特に量子化重みのビットフリップは、大規模言語モデル(LLM)に深刻な信頼性の脅威をもたらす
本稿では,家事変換を利用した無訓練防衛法であるRotated Robustness (RoR)を提案する。
RoRは真の堅牢性を実現し、実用的で信頼性の高いLLMデプロイメントを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:11:17 GMT)
ODIN-Based CPU-GPU Architecture with Replay-Driven Simulation and Emulation [3.1] CPUとGPUテクノロジの統合は、現代のAIとグラフィックワークロードにとって重要な実現方法である。
本稿では、CPUサブシステム、複数のXe GPUコア、ネットワークオンチップ(NoC)の統合時に開発されたリプレイ駆動型検証手法を提案する。
単一の設計データベースを使用してシミュレーションとエミュレーションの両方で決定論的波形のキャプチャと再生を活用することで、複雑なGPUワークロードとプロトコルシーケンスをシステムレベルで確実に再現することができる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:16:41 GMT)
Generalist Multimodal LLMs Gain Biometric Expertise via Human Salience [3.1] 汎用多目的大言語モデル(MLLM)は、人間の知識を付加してアイリスPADを実行することができる。
専門家インフォームドプロンプトを持つジェミニは、特殊な畳み込みニューラルネットワーク(CNN)ベースのベースラインと人間の検査者の両方より優れていることを示す。
この結果,機関プライバシ制約内に展開可能なMLLMは,アイリスPADに有効な経路であることが判明した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:08:37 GMT)
Coverage First Next Best View for Inspection of Cluttered Pipe Networks Using Mobile Manipulators [3.0] 放射能領域のロボット検査により、オペレーターは危険環境から除去できる。
これらのシステムは、未知の環境を自律的に再構築し、その表面をカバーしなければならない。
我々は,環境の同時探索と活用を可能にする,次世代の視点に基づく新しい計画手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:59:26 GMT)
Exploiting the English Grammar Profile for L2 grammatical analysis with LLMs [3.0] 英語文法プロファイル(英語: English Grammar Profile, EGP)は、共通ヨーロッパ参照フレームワーク(CEFR)の習熟度にマッピングされた文法構成の分類法である。
本稿では,EGPを利用して学習者の文法的構成を検知し,それを成功あるいは失敗と分類する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:06:00 GMT)
Prior-Informed Neural Network Initialization: A Spectral Approach for Function Parameterizing Architectures [3.0] 本稿では,データ固有のスペクトルと時間構造を利用する事前インフォームド設計手法を提案する。
ファストフーリエ変換(Fast Fourier Transform)を用いて、支配的な季節前兆を抽出する原理的手法が導入された。
合成および実世界のベンチマークの実験は、データ駆動の事前の埋め込みが収束を著しく加速することを示した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:08:52 GMT)
Laya: A LeJEPA Approach to EEG via Latent Prediction over Reconstruction [3.0] 大規模未ラベルコーパスで訓練された最近の脳波基礎モデルは、伝達可能な表現を学習することを目的としている。
小さなタスク固有のモデルに対するレポートの改善は、しばしば控えめで、下流適応や微調整戦略に敏感である。
私たちは、JEPA(Joint Embedding Predictive Architectures)に基づいた最初のEEG基盤モデルであるLayaを紹介します。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:13:29 GMT)
Agile Interception of a Flying Target using Competitive Reinforcement Learning [3.0] この記事では、捕獲網を積んだ別のアジャイルドローンによって、アジャイルドローンを迎撃するソリューションを提示します。
我々は、このインターセプションを競合強化学習問題として定式化し、インターセプターとターゲットドローンを個別のポリシーで制御する。
JAXで実装された現実的な四重項力学モデルと低レベル制御アーキテクチャを統合した高忠実度シミュレーション環境を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:11:23 GMT)
Efficient AI-Driven Multi-Section Whole Slide Image Analysis for Biochemical Recurrence Prediction in Prostate Cancer [3.0] 本稿では,前立腺全体にわたる包括的腫瘍像を捉えるために,一連の多断面スライドを処理する新しいAIフレームワークを提案する。
提案手法は, 1年および2年間の生化学的再発予測において, 強い予測性能を示した。
AI由来のリスクスコアは、多変量コックス比例ハザード分析において最も強力な独立性予後因子として評価された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:58:02 GMT)
Neural Pushforward Samplers for the Fokker-Planck Equation on Embedded Riemannian Manifolds [3.0] 我々は、コンパクトで滑らかな埋め込み多様体 M 上のフォッカー・プランク方程式に弱逆ニューラルプッシュフォワード法(WANPF)を拡張する。
安定状態と時間依存の定式化の両方を示し、球面$Sn-1$と平面トーラス$Tn$に対して明示的なLaplace--Beltrami式を導出し、その方法を数値的に示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:24:52 GMT)
VorTEX: Various overlap ratio for Target speech EXtraction [2.9] VorTEXはテキストプロンプトされたTSEアーキテクチャであり、補助正規化経路から一次抽出を分離する。
制御分析を可能にするために,重なり比を0%から100%に分散した2話者データセット PORTE を構築した。
VorTEXは20-100%の重なりで高い分離率を達成する一方、既存のモデルでは重なりの抑制や残差が示される。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:54:34 GMT)
A Pin-Array Structured Climbing Robot for Stable Locomotion on Steep Rocky Terrain [2.9] ピンアレイ構造を有するグリップを用いた新しい移動体クライミングロボットを提案する。
各ピンは垂直に分割された設計で、弾性要素と金属のスピンを組み合わせることで、マイクロスケール表面の特徴と機械的インターロックを可能にする。
このロボットは、傾斜した壁(10-30度)での室内テストや、自然の岩の多い地形での屋外テストにおいて、頑丈で安定した移動を示しました。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:05:42 GMT)
Optimizing Logical Mappings for Quantum Low-Density Parity Check Codes [2.9] 本稿では,空間オーバーヘッドの少ない将来の耐故障性アーキテクチャの候補であるGross符号について検討する。
マッピングポリシでは,モジュール間測定によるエラーコントリビューションを,ベストケースで最大$sim36%まで削減できることがわかった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:53:58 GMT)
Persistent Device Identity for Network Access Control in the Era of MAC Address Randomization: A RADIUS-Based Framework [2.9] 現代のオペレーティングシステムは、メディアアクセス制御(MAC)アドレスをランダム化し、ユーザのプライバシを保護する。
この破壊は連邦政府など重要な企業環境に影響を及ぼす。
本稿では,NAC環境におけるデバイス識別の持続性を維持するための包括的フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:21:57 GMT)
Abstraction as a Memory-Efficient Inductive Bias for Continual Learning [2.9] 抽象強化トレーニング(AAT:Abstraction-Augmented Training)は、サンプル間で共有される潜在関係構造を捉えるために、損失レベルの修正を奨励するモデルである。
AATは厳格なオンラインデータストリームでの学習を安定化し、リプレイバッファを不要にする。
以上の結果から,AAT は強経験リプレイ(ER)のベースラインに匹敵する性能を達成できた。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:59:13 GMT)
Improving Code Comprehension through Cognitive-Load Aware Automated Refactoring for Novice Programmers [2.8] 初心者プログラマは、あいまいな命名、深いネスト、貧弱な構造組織のために、コードを理解するのに苦労することが多い。
我々は,認知的足場としてコードを提案する。
私たちはこれを認知駆動開発に基づく自動化アプローチであるCDDRefactorERで運用しています。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:01:44 GMT)
Routing and Control for Marine Oil-Spill Cleanup with a Boom-Towing Vessel Fleet [2.8] 本稿では,自律型ASVデュオを用いたオイルスピル閉じ込めとクリーンアップのための統合型マルチロボットフレームワークを提案する。
リスク重み付き最小遅延問題としてマルチスパイル応答を定式化し, 流出危険要因とサービス時間で累積的環境被害が決定される。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:59:13 GMT)
Probing Cultural Signals in Large Language Models through Author Profiling [2.7] 大規模言語モデル(LLM)は、社会的影響のあるアプリケーションにますます多くデプロイされている。
LLMがゼロショット設定で歌詞から著者のプロファイリングを行うことができるかどうかを評価する。
LLMは非自明なプロファイリング性能を実現するが、体系的な文化的アライメントを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:27:47 GMT)
Real-Time Decoding of Movement Onset and Offset for Brain-Controlled Rehabilitation Exoskeleton [2.7] 上肢外骨格のオンライン二状態運動画像制御を実装し,ゴール指向の到達を可能にする。
グループ平均ヒット率は61.5%、オフセット64.5%であった。
そこで本研究では,クラスをサンプリングせずにドリフトを追跡する,クラスに依存しない固定型更新手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:32:43 GMT)
Edge-Efficient Two-Stream Multimodal Architecture for Non-Intrusive Bathroom Fall Detection [2.7] 濡れた浴室環境の滝は、高齢者が一人で生活する大きな安全リスクである。
近年の研究では、mWaveのみ、振動のみ、および既存のマルチモーダルスキームがプライバシー保護、非侵襲的な転倒検出をサポートすることが示されている。
本研究では,長距離移動パターンと床振動の処理を行うMotion-Mambaブランチを用いて,レーダ信号を符号化する2ストリームアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:54:21 GMT)
Robust Physics-Guided Diffusion for Full-Waveform Inversion [2.6] 我々は、スコアベースの生成前と、波動方程式シミュレーションによって計算された可能性ガイダンスを組み合わせたフルウェーブフォームインバージョンのための物理誘導拡散フレームワークを開発する。
我々は、有界重み付けと観測依存正規化による波動場拡張を取り入れた輸送型データ一貫性電位(Wasserstein-2)を採用した。
推論側では、逆時間力学全体にわたって誘導強度と空間的スケーリングを適応させる事前条件付き逆拡散方式を導入する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:27:37 GMT)
LLM Use, Cheating, and Academic Integrity in Software Engineering Education [2.6] 大学教育における暖房は、一般に文脈に依存し、評価設計、制度規範、学生の解釈の影響を受けていると説明される。
本研究では,ソフトウェア工学の学生が大規模言語モデル(LLM)の使用経験を,不適切,不適当,あるいはコースの期待と一致しないものとして記述する方法について検討する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:48:33 GMT)
Distinguishing types of correlated errors in superconducting qubits [2.6] 宇宙や地球からの放射線は超伝導量子ビットデバイスにおける準粒子密度を増加させることができる。
乾燥希釈冷凍機においてパルス管によって誘導されるような機械的振動も相関誤差の既知の原因である。
本稿では,これらの2種類の誤りを時間的,空間的,周波数的特徴によって識別する手法を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:21:34 GMT)
Controlling Fish Schools via Reinforcement Learning of Virtual Fish Movement [2.6] 本研究では,強化学習で訓練した仮想魚を用いて,魚学校を指導し,管理する方法について検討した。
画面上に表示される2D仮想魚を用いて、物理的ロボットエージェントに固有の耐久性や運動制限といった技術的課題を克服する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:12:36 GMT)
A Depth-Aware Comparative Study of Euclidean and Hyperbolic Graph Neural Networks on Bitcoin Transaction Systems [2.5] 我々は,大規模なBitcoinトランザクショングラフ上でノード分類を行うために,ユークリッドと接空間双曲型GNNの比較を行う。
本研究は,大規模トランザクションネットワークのモデル化における埋め込み幾何学と周辺深度の役割について,実用的な知見を提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:58:29 GMT)
Hidden Technical Debt in Generative (GenUI) and Malleable User Interfaces [2.5] 悪意のあるソフトウェアは、ユーザーがデジタルコンテンツと対話する方法を根本的に変えることができ、非専門家が独自のカスタマイズツールを作成できる。
しかし、GenUIシステムの実践的な採用は、データフォーマットの欠如、"古い"セキュリティプロトコル、ユーザ自身のインターフェースを構築するための認知的および創造的スキルの欠如など、いくつかの障壁に直面している。
ユーザ研究や文書使用パターンにおける可鍛性ソフトウェアの影響を計測し,その実践的採用を確実にするための,新たな評価戦略と科学的手法を提唱する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:02:35 GMT)
HyPER-GAN: Hybrid Patch-Based Image-to-Image Translation for Real-Time Photorealism Enhancement [2.5] リアルタイム推論のために設計されたU-Netスタイルのジェネレータをベースとした,軽量な画像から画像への変換手法を提案する。
HyPER-GANは、推論レイテンシ、ビジュアルリアリズム、セマンティックロバストネスの観点から、最先端の軽量な画像対画像変換法より優れている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:17:37 GMT)
IRIS: A Real-World Benchmark for Inverse Recovery and Identification of Physical Dynamic Systems from Monocular Video [2.4] IRISは、4K解像度と60,fpsで撮影された220の現実世界のビデオからなる高忠実度ベンチマークである。
標準化された評価プロトコルは、パラメータの精度、識別可能性、外挿、堅牢性、支配方程式の選択を含む。
データセット、アノテーション、評価ツールキット、およびすべてのベースライン実装が公開されている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:10:56 GMT)
LIMBERO: A Limbed Climbing Exploration Robot Toward Traveling on Rocky Cliffs [2.4] LIMBEROは10kg級の四足歩行ロボットで、足に背骨型のグリップが付いている。
そこで本研究では,指閉じ動作とスピンホック動作を結合したグリップデザインを提案する。
連続した荒地における幾何に基づく把握可能性指数を可視化する効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:53:45 GMT)
Energy Flow Graph: Modeling Software Energy Consumption [2.3] エネルギーフローグラフ(Energy Flow Graph, EFG)は、計算過程を状態遷移系として表わす形式モデルである。
EFGは、エネルギー最適実行パスの静的解析を含む、ソフトウェア工学における様々なアプリケーションを可能にする。
AIパイプラインでは、カスケードモデルは5.1%の誤差で最適化の組み合わせを予測する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:47:10 GMT)
PlotTwist: A Creative Plot Generation Framework with Small Language Models [2.3] PlotTwistは、$leq$5Bのアクティブパラメータを持つSmall Language Models(SLM)が、高品質で前提条件付きプロットを生成することができる構造化フレームワークである。
提案手法は,(1)新規の肯定的・否定的評価モデルを用いて学習した,5つの主観的品質次元(NQD)にまたがる構造的物語の提供戦略,(2)信頼度の高い選好対に対する直接最適化によって整列した実験的プロットジェネレータ,(3)偏見のないポストホック評価に対する人間の批判的判断をエミュレートするエージェント評価モジュールの3つの特殊な構成要素に分解する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:45:04 GMT)
Conditional Distributional Treatment Effects: Doubly Robust Estimation and Testing [2.3] 本稿では,条件分布処理の効果を捉えるための新しい評価法を提案する。
本研究では,条件付きポテンシャル分布の大域的均一性を検証した。
2つの自然な相違点に対して正確な閉形式式を導出する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:35:32 GMT)
POaaS: Minimal-Edit Prompt Optimization as a Service to Lift Accuracy and Cut Hallucinations on On-Device sLLMs [2.2] 小型言語モデル(sLLM)はデバイス上でますますデプロイされ、不完全なユーザプロンプトが事実エラーや幻覚を引き起こす。
我々は、各クエリを軽量なスペシャリストにルーティングする最小限のプロンプト最適化層であるPOを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:05:39 GMT)
SciZoom: A Large-scale Benchmark for Hierarchical Scientific Summarization across the LLM Era [2.2] SciZoomは、2020年から2025年までの4つのトップレベルのML会場から44,946の論文からなるベンチマークである。
我々の言語学的分析は、句パターンの顕著な変化(式表現の最大10倍)と修辞スタイル(23%のヘッジ減少)を明らかにしている。
SciZoomは、生成AI時代の科学的談話の進化をマイニングするための、挑戦的なベンチマークとユニークなリソースとして機能する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:34:46 GMT)
Surface-Constrained Offline Warping with Contact-Aware Online Pose Projection for Safe Robotic Trajectory Execution [2.2] 本稿では,幾何学的埋め込みと実行レベルの規制を分離する2段階のフレームワークを提案する。
複数の解析的表面積と正弦波面上の実ロボットによる検証実験により、幾何的連続性の改善、大きな方向跳躍の低減、堅牢な接触維持が示された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:54:54 GMT)
Mix-and-Match Pruning: Globally Guided Layer-Wise Sparsification of DNNs [2.1] エッジデバイス上のディープニューラルネットワーク(DNN)は、精度の低下を最小限に抑えた強い圧縮を必要とする。
本稿では,Mix-and-Match Pruningについて紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:27:07 GMT)
Tarab: A Multi-Dialect Corpus of Arabic Lyrics and Poetry [2.1] アラビア語は、古典と現代の両方にまたがる創造的なテキストの最大オープンアラビア語コーパスである。
コーパスに代表される芸術家や詩人は28の近代国家と複数の歴史的時代と結びついている。
データセットはHuggingFaceでhttps://huggingface.co/datasets/drelhaj/Tarabで公開されている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:45:57 GMT)
An End-to-End Framework for Functionality-Embedded Provenance Graph Construction and Threat Interpretation [2.1] Auto-Provは、証明グラフベースの異常検出のためのエンドツーエンドフレームワークである。
ログの型をクラスタ化し、プロファイランスエッジとエンティティレベルの情報を効率的に抽出する。
システムレベルの機能コンテキストを、既知および未確認のシステムエンティティの両方に対して推論する。
安定して解釈可能な攻撃サマリーを生成し、システムの進化の下では堅牢である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:40:05 GMT)
AI Scientist via Synthetic Task Scaling [2.1] 機械学習エージェントを対象とした新しい合成環境生成パイプラインを提供する。
我々のパイプラインは、SWE-agentフレームワークと互換性のある機械学習の課題を自動的に合成する。
機械学習タスクのベンチマークであるMLGymに取り組む。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:43:16 GMT)
Machines acquire scientific taste from institutional traces [2.0] 論文発表決定における微調整言語モデルは,フロンティアモデルと人間の専門知識の両方に到達できない評価的判断を回復することを示す。
主要なプロプライエタリでオープンなアーキテクチャにまたがる11のフロンティアモデルが,チャンスをほとんど越えず,平均31%を達成しています。
長年の出版記録に基づいてトレーニングされた微調整されたモデルは、それぞれすべてのフロンティアモデルとエキスパートパネルを上回り、最高のシングルモデルは59%に達した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:28:24 GMT)
Toward Experimentation-as-a-Service in 5G/6G: The Plaza6G Prototype for AI-Assisted Trials [1.9] Plaza6Gは、クラウドリソースを次世代の無線インフラと統合する最初の運用用アズ・ア・サービスプラットフォームである。
GPUアクセラレーションされた計算クラスタ、複数の5Gコア、オープンソース(Free5GCなど)と商用(Cumucoreなど)を統合している。
トライアルでは、4チャンネルのアネコニック設備と、サブ-6GHz帯とmmWave帯で動作する2つの屋外5Gネットワークを利用する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:37:32 GMT)
Formal verification of tree-based machine learning models for lateral spreading [1.9] 本稿では,Satifiability Modulo Theories (SMT) 解法において,学習木アンサンブルを論理式として符号化する。
4つの測地学的仕様は決定可能な論理式として定式化され、2011年のクライストチャーチ地震の横分散データセットで訓練されたXGBoostアンサンブルとEBM(Explainable Boosting Machines)の両方に対してSMTを介して検証される。
完全に制約されたESMは4つの仕様のうち3つを満たす。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:27:51 GMT)
Segmentation-before-Staining Improves Structural Fidelity in Virtual IHC-to-Multiplex IF Translation [1.9] 多発性免疫蛍光(mIF)は、無傷組織構造内の複数のバイオマーカーの同時定量を可能にする。
仮想染色は、広く利用可能な光電化学(IHC)からmIFチャネルを合成することができるが、現在のトランスレータは、核形態を明示的に制限することなくピクセルレベルの忠実度を最適化する。
この研究は、事前訓練された核分割基礎モデルから連続セル確率マップを注入する、監督不要でアーキテクチャに依存しない条件付け戦略を導入する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:25:50 GMT)
vAccSOL: Efficient and Transparent AI Vision Offloading for Mobile Robots [1.8] ロボットとエッジプラットフォームをまたいだAIベースのビジョンワークロードの効率的かつ透過的な実行のためのフレームワークであるvAccSOLを提案する。
商用四足歩行ロボットと12種類のディープラーニングモデルを用いた実世界のテストベッド上でのvAccSOLの評価を行った。
エッジオフロードにより、vAccSOLはロボット側の消費電力を最大80%削減し、エッジ側の電力を最大60%削減すると同時に、ビジョンパイプラインのフレームレートを最大24倍に向上させる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:44:44 GMT)
Polyglot-Lion: Efficient Multilingual ASR for Singapore via Balanced Fine-Tuning of Qwen3-ASR [1.8] 本稿ではシンガポールの言語景観に合わせたコンパクトな多言語自動音声認識(ASR)モデルであるPolyglot-Lionを紹介する。
提案手法は,Qwen3-ASR-0.6BとQwen3-ASR-1.7Bを公開音声コーパスのみに微調整することで得られる。
4つの言語にまたがる12のベンチマークで、Polyglot-Lion-1.7Bは平均エラーレート14.85に達し、MERaLiON-2-10B-ASR (14.32)と競合する。
推論スループットはMERaLiONの0.10 s/sampleより約20倍速い
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:09:42 GMT)
Enforcing Task-Specified Compliance Bounds for Humanoids via Anisotropic Lipschitz-Constrained Policies [1.7] 我々は,タスク空間の剛性の上界をヤコビアン政策上の状態依存リプシッツ式制約にマッピングする異方性リプシッツ制約ポリシー(ALCP)を提案する。
結果として生じる制約は、ヒンジ二乗スペクトルノルムのペナルティを通じてRLトレーニング中に実施され、物理的解釈性を維持しながら、方向依存のコンプライアンスを可能にする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:00:32 GMT)
Adaptive regularization parameter selection for high-dimensional inverse problems: A Bayesian approach with Tucker low-rank constraints [1.7] 高次元空間からタッカー分解による低次元コアテンソル空間への変分推論を変換することにより、計算複雑性を低減する。
鍵となる革新は、異方性構造に対する適応正則化を可能にするモードごとの精度パラメータの導入である。
この手法は110,000の変数を持つ問題にスケールし、従来の手法を0.73-2.09dB、熱伝導率6.75dBで上回っている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 02:23:44 GMT)
Attention Sinks Are Provably Necessary in Softmax Transformers: Evidence from Trigger-Conditional Tasks [1.7] 単純なトリガー条件の計算は、必ずしもソフトマックス自己注意モデルにおけるシンクを誘導する。
確率的単純性に対する正規化は、デフォルトの状態を実現するために、安定なアンカーに注意を向ける必要がある。
また、非正規化ReLU注意がシンクなしで同じ課題を解決できることを証明し、正規化制約がシンク動作の基本的な要因であることを確認した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:50:38 GMT)
Understanding Cell Fate Decisions with Temporal Attention [1.6] 細胞運命の非遺伝的決定要因を理解することは、がん治療の開発と改善に不可欠である。
ケモザイク治療下でのがん細胞集団の長期生存記録から, 細胞運命予測の深層学習手法を提案する。
我々のトランスフォーマーモデルは、予め定義された形態的特徴や分子的特徴に頼ることなく、原画像配列から細胞運命を予測するよう訓練された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:22:53 GMT)
Assessment of Latent Pedestrian--Vehicle Interaction Risk Profiles at Midblock Crossing in VR [1.6] 本研究は,仮想現実(VR)横断セッションを,異なるインタラクションリスクプロファイルに分割するかどうかを検討する。
AVのみのセッションにおいて、Newcastleは高緊急リスクプロファイルの頻度が高いことを示し、AVが高リスク遭遇に寄与していることを示している。
対照的にトロントでは、AVのみのセッションとHDVのみのセッションの間に有意な差は見られず、文脈的要因がAVが歩行者の安全に与える影響を示唆している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:45:42 GMT)
Reasoning About Variability Models Through Network Analysis [1.6] i)これらのグラフで示される構造パターン,(ii)そのようなパターンがドメインやモデルソースによってどの程度異なるか,および(iii)ネットワークベースインジケータの有用性に関する3つの研究課題に焦点をあてる。
20のリポジトリから5,709のモデルのデータセットを分析し、複数のアプリケーションドメインとさまざまなサイズにまたがる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:29:03 GMT)
Block-QAOA-Aware Detection with Parameter Transfer for Large-Scale MIMO [1.6] 本稿では,Block-QAOA-Aware MIMO Detector (BQA-MD)を提案する。
特に、BQA-MDは、QRドメインにおけるブロックQAOA対応プリプロセッシング、標準一貫性のブロックワイド5G NR Gray-HUBOインタフェース、MMSEによる動的正規化ブロックワイド目的を組み合わせている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:47:13 GMT)
The Decentralisation Paradox in Digital Identity: Centralising Decentralisation with Digital Wallets? [1.6] 論文では、ユーザ中心のアーキテクチャは、中央集権化を排除するよりも、再分配する傾向がある、と論じている。
デジタルアイデンティティは、技術的、法的、社会的、倫理的な側面にまたがる「邪悪な問題」である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:41:35 GMT)
Beyond Grading Accuracy: Exploring Alignment of TAs and LLMs [1.5] 本稿では,Unified Language (UML) クラス図のグレーディングにおけるオープンソースのLarge Language Models (LLMs) の可能性について検討する。
その結果, 基準あたりの精度は88.56%, ピアソン相関係数は0.78であり, 従来よりも大幅に向上した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:40:35 GMT)
Learning to Predict, Discover, and Reason in High-Dimensional Discrete Event Sequences [1.5] 自動車業界では、ドメインの専門家がこれらのコードを高レベルのエラーパターンに手動でグループ化します。
車両の複雑さが増大するにつれて、この手作業プロセスはますますコストがかかり、エラーが発生し、スケールが困難になる。
この論文は、イベントシーケンスモデリング、因果発見、および大規模言語モデルを統合することで、自動故障診断に対処する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:45:01 GMT)
Integrating Inductive Biases in Transformers via Distillation for Financial Time Series Forecasting [1.5] TIPS(Transformer with Inductive Prior Synthesis)は,多種多様な帰納バイアスを統一された変換器内で合成する知識蒸留フレームワークである。
TIPSは4つの主要株式市場で最先端のパフォーマンスを達成している。
これらの結果は、非定常金融時系列におけるロバストな一般化のための状態依存帰納的バイアス利用の重要性を強調した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:06:46 GMT)
The Cost of Reasoning: Chain-of-Thought Induces Overconfidence in Vision-Language Models [1.5] 推論は、ほとんどの不確実性推定の品質を一貫して低下させることを示す。
暗黙の回答条件付けを主要なメカニズムとみなす。
対照的に、合意に基づく一貫性は堅牢であり、しばしば推論の下で改善される。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:12:06 GMT)
V-DyKnow: A Dynamic Benchmark for Time-Sensitive Knowledge in Vision Language Models [1.4] 現実の事実は本質的に時間に敏感であり、不規則かつ周期的な変化にさらされている。
V-DyKnowは、視覚言語モデルにおいて、時間に敏感な事実知識を評価するためのベンチマークである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:33:08 GMT)
Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models [1.4] 大きな言語モデル(LLM)は有害なコンテンツを生み出す可能性がある。
本研究では,軽量なアクティベーション空間の敵攻撃であるアムネシアを提案する。
実験の結果,提案手法はLSMの様々な反社会的行動を引き起こすことが示唆された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:26:11 GMT)
AgriIR: A Scalable Framework for Domain-Specific Knowledge Retrieval [1.4] AgriIRは情報アクセスプロセスを宣言的なモジュールステージに分解する。
システムは決定論的引用を強制し、透明性のためのテレメトリを統合し、自動配置資産を含む。
我々は,この手法が「農業用AI」を具現化し,検索強化世代システムにおけるアクセシビリティ,持続可能性,説明責任を促進することを主張する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:14:23 GMT)
Learning Whole-Body Control for a Salamander Robot [1.3] サラマンダーに触発された両生類脚ロボットは、複雑な水陸両生環境における応用を約束している。
多くのサンショウウオロボットは、中心パターンジェネレータ(CPG)をベースとし、ロコモーション制御のためのモデルベースコーディネート戦略に頼っていた。
強化学習(Reinforcement Learning)を用いて、主観的観察をマッピングし、共同レベルの行動に速度を指示することで、協調した運動行動が出現する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:43:15 GMT)
Med-DualLoRA: Local Adaptation of Foundation Models for 3D Cardiac MRI [1.3] Med-DualLoRAは,グローバルな共有およびローカルなローランク適応(LoRA)を加法分解によって分散する,クライアント対応パラメータ効率の高い微調整フレームワークである。
ACDCとM&Msデータセットを併用した多心式3次元CMR FMによる疾患検出法について検討した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:40:44 GMT)
Unifying Optimization and Dynamics to Parallelize Sequential Computation: A Guide to Parallel Newton Methods for Breaking Sequential Bottlenecks [1.3] 準ニュートンおよび信頼領域アプローチに基づくスケーラブルで安定した並列ニュートン法を開発した。
本手法の近似精度と安定性に依存する固定点法に対して線形収束率を確立する。
並列化が動的系を確実に加速し、それができないときに特徴付ける、動的安定性に根ざした正確な条件を与える。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:55:01 GMT)
Efficient Brood Cell Detection in Layer Trap Nests for Bees and Wasps: Balancing Labeling Effort and Species Coverage [1.3] 層トラップ巣(LTN)は、野生のミツバチやハチの豊富さと種多様性を研究する貴重な道具として出現している。
血液細胞を検出・分類するためのLTNを手動で評価することは、労働集約的で時間を要する。
LTNにおける効率的な血液細胞検出と分類のためのディープラーニングに基づくアプローチを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:21:30 GMT)
Featurized Occupation Measures for Structured Global Search in Numerical Optimal Control [1.2] 本稿では, 職業測定定式化のための有限次元原始二重インタフェースであるFeaturized Occupation Measure (FOM)を紹介する。
FOMは広範に数値的に抽出可能であり、明示的な弱形式スキームと暗黙的なシミュレーターまたはロールアウトに基づくサンプリング手法の両方をカバーしている。
ブロック編成証明書の場合,有限次元近似はブロックワイド誤差と複雑性制御により下位境界を証明した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:17:50 GMT)
Early-Terminable Energy-Safe Iterative Coupling for Parallel Simulation of Port-Hamiltonian Systems [1.2] このレターでは、ポート-ハミルトニアン部分系に対する新しいエネルギー安全で早期に決定可能な反復結合を提案する。
我々は,有限内接予算に対して,連結マクロステップの離散的通過性を証明した拡張記憶不等式を証明した。
内部予算が増加するにつれて、分割された更新はモノリシックな離散時間更新に収束する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:59:30 GMT)
A quadratic Grassmann manifold optimization problem arising from quantum embedding methods [1.2] 本稿では,2次関数 $J(P) = textTr(BP)- frac12 textTr(A P A P) - Grassmann manifold $A,B in mathbb RM times_rm sym$, over the Grassmann manifold $rm Gr(m,mathbb RM)$ を最小化する最適化問題を解くための数学的解析と数値戦略を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:07:12 GMT)
Encoding Predictability and Legibility for Style-Conditioned Diffusion Policy [1.2] 効率性と透明な動きのバランスを取ることは、人間とロボットのコラボレーションにおける中核的な課題である。
本稿では,事前学習した拡散モデルに対して,妥当性と効率を両立させるモジュラーフレームワークであるStyle-Conditioned Diffusion Policy (SCDP)を提案する。
操作作業やナビゲーション作業におけるSCDPの評価を行い,不明瞭な環境下での可視性を向上するとともに,可視性が不要な場合の最適効率を保っていることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:55:44 GMT)
Who Benchmarks the Benchmarks? A Case Study of LLM Evaluation in Icelandic [1.1] 検証されていない合成データや機械翻訳データを含むベンチマークは、一般的に深刻な欠陥のあるテスト例を含むことを示す。
我々は、低/ナトリウム/リソース設定で検証することなく、このようなメソッドの使用を警告する。
アイスランドの既存ベンチマークにおける定量的誤差分析の結果,人為的/機械的/機械的ベンチマークと人為的/機械的ベンチマークとの違いが明らかとなった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:43:02 GMT)
SuCor: Susceptibility Distortion Correction via Parameter-Free and Self-Regularized Optimal Transport [1.1] エコープラナーイメージング(EPI)における感受性誘起幾何歪みの補正法SuCorを提案する。
歪み場の各列を、反対極性強度プロファイル間のワッサーシュタイン2偏心変位としてモデル化する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:38:08 GMT)
CounterRefine: Answer-Conditioned Counterevidence Retrieval for Inference-Time Knowledge Repair in Factual Question Answering [1.1] 検索地上質問応答のための軽量な推論時間修復層であるCounterRefineを提案する。
CounterRefineは、最初に検索されたエビデンスから短い回答を生成し、その後、追加のサポートを集め、そのドラフト回答に条件付けられたフォローアップクエリと矛盾するエビデンスを集めます。
完全なSimpleQAベンチマークでは、CounterRefineは一致したGPT-5ベースラインRAGを5.8ポイント改善し、73.1%の精度で、報告された1ショットのGPT-5.4スコアを約40ポイント上回る。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:27:25 GMT)
Synergizing Deep Learning and Biological Heuristics for Extreme Long-Tail White Blood Cell Classification [1.1] 本稿では,人工物除去のためのPix2Pixベースの復元モジュールと,ロバスト表現学習のためのMedSigLIPコントラスト埋め込みを用いたSwin Transformerアンサンブルと,幾何学的スパイキネスとマハラノビスに基づく形態的制約を用いた生物学的にインスパイアされた改良ステップを組み合わせた,レアクラスの一般化のためのハイブリッドフレームワークを提案する。
本手法は, 生体画像解析の深層学習に生物前駆体を組み込むことの価値を強調し, 極めて不均衡な環境下での強い性能を示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:32:31 GMT)
CircuitBuilder: From Polynomials to Circuits via Reinforcement Learning [1.1] 本稿では,加算ゲートと乗算ゲートを用いた効率的な演算回路の探索問題について検討する。
我々は、Alphaスタイルのトレーニングループを実装し、PPO+MCTS(Monte Carlo Tree Search)とSAC(Soft Actor-Critic)の2つのアプローチを比較した。
これらの結果から,回路合成は自己改善探索ポリシーを研究するためのコンパクトで検証可能な設定であることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:04:37 GMT)
Faulty Coffees: Barriers to Adoption of an In-the-wild Robo-Barista [1.1] 英国ストックトンにある50以上の住宅施設で、5週間にわたってRobo-Baristaを配備しました。
持続的なエンゲージメントのための設計にもかかわらず、反復的な相互作用は低かった。
本研究では,人間-ロボットインタラクションの縦断的な研究を行うための授業について紹介する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:06:04 GMT)
Me, Myself, and $π$ : Evaluating and Explaining LLM Introspection [1.1] イントロスペクション(Introspection)とは、自分自身の認知過程を評価し、判断する能力である。
Introspect-Benchは厳格な能力テスト用に設計された評価スイートである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:39:25 GMT)
Uncertainty Estimation for the Open-Set Text Classification systems [1.1] テキスト領域に対するホロスティック不確実性推定法(HolUE)を適用する。
テキスト認識システムにおける予測誤りの主な原因は,不規則な定式化クエリに起因するテキストの不確かさと,データ分布のあいまいさに関連するギャラリーの不確かさである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:25:34 GMT)
ReFORM: Review-aggregated Profile Generation via LLM with Multi-Factor Attention for Restaurant Recommendation [1.0] 本稿では,複数FactOr Attentive RecoMmendation フレームワークを用いた LLM によるReform: Review-aggregated Profile 生成を提案する。
具体的には、まず LLM を用いたレビューから要素固有のユーザプロファイルとアイテムプロファイルを生成し、アイテムごとのユーザの好みをキャプチャする。
そこで本研究では,ユーザの意思決定プロセスにおいて,最も影響力のある要因を明らかにするための多要素注意を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:22:17 GMT)
LLM-based uncertainty assessment of social media situational signals for crisis reporting [1.0] ソーシャルメディアは災害時の状況認識の重要な源となっている。
自動状況認識レポートのための不確実性認識フレームワークを提案する。
この枠組みを20万件以上の地震関連Twitter/X投稿に適用する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:13:09 GMT)
Population Annealing as a Discrete-Time Schrödinger Bridge [0.9] 本稿では、離散時間シュルディンガーブリッジ(SB)問題のレンズを通して人口アニーリング(PA)を再解釈する理論的枠組みを提案する。
PAにおける重み付けステップは、瞬時投影による反復計算を伴わずにシュルディンガー系を解析的に解くことによって導出されることを示す。
この観点は、最適輸送の幾何学的枠組みと非平衡熱力学を統一し、ジャジンスキーの等式をドンスカー・バラダンの変分原理の整合条件として解釈する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:51:09 GMT)
Boosted linear-optical measurements on single-rail qubits with unentangled ancillas [0.9] 放射場の任意の量子状態は単線量子ビットの集まりであり、それぞれがモードの真空状態と単光子フォック状態にまたがる。
XY$Bloch平面におけるシングルレールキュービットの測定は、成功確率が147/256$で実現可能であることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:03:53 GMT)
The Era of End-to-End Autonomy: Transitioning from Rule-Based Driving to Large Driving Models [0.9] 我々は、Teslaのフルセルフドライブ(FSD)V12 V14、Rivianの統一インテリジェンスプラットフォーム、NVIDIA Cosmos、新しい商用ロボタクシーの展開を分析します。
主要な製品カテゴリーは監督型E2E運転であり、しばしばFSD(Supervised)またはL2プラスと呼ばれる。
初期の運用上の証拠は、E2E学習が現実世界の運転シナリオの長い尾の分布を処理し、主要な商業戦略になりつつあることを示唆している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:32:08 GMT)
SCE-LITE-HQ: Smooth visual counterfactual explanations with generative foundation models [0.9] カウンターファクトな説明はブラックボックス予測の解釈に原則化されたアプローチを提供する。
既存のCFEメソッドは、しばしばデータセット固有の生成モデルに依存している。
本稿では,SCE-LITE-HQを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:31:13 GMT)
Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios [0.8] 我々は、フロンティアAIモデルの自律的サイバー攻撃能力を、2つの目的に構築されたサイバーレンジで評価する。
企業ネットワークの範囲では、平均10万のトークンで完了したステップが1.7から9.8に増加した。
産業制御システムの範囲では、性能は依然として限られているが、最新のモデルは確実に完成する最初の段階である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:25:39 GMT)
Bayesian Inference of Psychometric Variables From Brain and Behavior in Implicit Association Tests [0.8] 我々は,インプリシット・アソシエーション・テスト(IAT)をデータ生成エンジンとして,神経・行動データからメンタルヘルス関連精神測定変数を推定する原理的手法を確立した。
マルチモーダルデータを利用して,精神疾患の症状に関連する経験を予測できる疎階層型ベイズモデルを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:20:55 GMT)
Why the Valuable Capabilities of LLMs Are Precisely the Unexplainable Ones [0.8] 論文は、大きな言語モデル(LLM)の真に価値のある能力は、人間の可読性を持つ離散ルールによって完全に捕捉できない部分にある、と論じている。
本稿では,解釈可能性研究,AI安全性,科学的解釈可能性について論じる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:49:03 GMT)
Via Negativa for AI Alignment: Why Negative Constraints Are Structurally Superior to Positive Preferences [0.8] 負のフィードバックしか持たない大規模言語モデルのトレーニングは、人間のフィードバックから標準的な強化学習と一致したり、超えたりすることができる。
負の信号がこれほど効果的である理由を説明する統一的な理論的な説明は存在しない。
正の選好と負の制約は構造的に非対称である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:52:18 GMT)
Chronos: Temporal-Aware Conversational Agents with Structured Event Retrieval for Long-Term Memory [0.8] 会話型AIのための時間認識メモリフレームワークであるChronosを紹介する。
Chronosは生の対話を、解決された日時範囲とエンティティエイリアスを持つ主観的動詞オブジェクトイベントに分解する。
クエリ時に、Chronosは動的プロンプトを適用して、各質問に対して調整された検索ガイダンスを生成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:59:20 GMT)
NeuronSpark: A Spiking Neural Network Language Model with Selective State Space Dynamics [0.8] 本稿では、次トーケン予測と代理勾配を訓練した0.9BパラメータSNN言語モデルであるNeuronSparkを紹介する。
制約された予算の下では、NeuronSpark-0.9Bは3.6の事前訓練損失に達し、SFT後の初期のマルチターン対話動作を示す。
これらの結果は、このスケールでの純粋なSNNアーキテクチャによるエンドツーエンド言語モデリングの実現性を支持する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:01:05 GMT)
CPDNN quantum channels with qubit output are CPCP [0.7] CPDNNであるがCPCPではないqutrit-to-qubit量子チャネル(:M_3to M)が存在するかは、未解決のままである。
我々はこの疑問を負に答え、全ての CPDNN 量子チャネル (:M_nto M) が CPCP であり、全ての量子チャネル (:M_nto M) が CPCP であることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:22:31 GMT)
Federated Learning with Multi-Partner OneFlorida+ Consortium Data for Predicting Major Postoperative Complications [0.7] 調査対象は5つの医療機関に入院した成人358,644人であった。
我々は,集中治療室(ICU)入院,機械換気(MV)療法,急性腎障害(AKI),院内死亡の術後リスクを予測するための統合学習モデルを開発し,検証した。
AUROCのスコアは,AUROCとAUPRCのスコアと同等あるいは同等の成績を示した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:09:33 GMT)
When Generative Augmentation Hurts: A Benchmark Study of GAN and Diffusion Models for Bias Correction in AI Classification Systems [0.7] 生成モデルは、AIトレーニングパイプラインのクラス不均衡を補うために広く使用されている。
FastGAN拡張は、非常に低いトレーニングセットサイズで性能が劣るだけでなく、バイアスを積極的に増加させる。
低ランク適応による安定拡散は全体として最良の結果を得た。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:37:17 GMT)
Dynamical Drexhage Effect: Amplified Emission in Time-Modulated Electromagnetic Environments [0.7] 反射面の横を移動する双極子エミッタの放出動態に及ぼす非相対論的運動の影響について検討する。
界面における相対誘電率の関数として閾値変調振幅を導出する。
ナノフォトニック環境における光-光相互作用の動的制御の道を開く。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:12:03 GMT)
Solving physics-constrained inverse problems with conditional flow matching [0.7] 本稿では,物理制約付き逆問題に対する条件付きフローマッチングフレームワークを提案する。
ニューラルネットワークは、確率フロー常微分方程式の速度場を学習するために訓練される。
オーバートレーニングは生成した条件分布の振る舞いを誘導できることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:08:17 GMT)
GitOps for Capture the Flag Platforms [0.6] 我々は、Capture The Flag(CTF)コンペティションのデプロイと管理のためのGitOpsベースのフレームワークであるCTF Pilotを紹介します。
Gitリポジトリを、課題定義とインフラストラクチャ構成のための唯一の真実のソースとして活用することにより、CTF Pilotは、自動バージョン管理デプロイメントを可能にする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:55:01 GMT)
HistoAtlas: A Pan-Cancer Morphology Atlas Linking Histomics to Molecular Programs and Clinical Outcomes [0.6] HistoAtlas(ヒストアトラス)は、21のTCGAがんタイプにわたる6,745の診断用H&Eスライドから38の解釈可能な組織学的特徴を抽出する計算アトラスである。
すべての結果は、組織区画や個々の細胞に空間的にトレース可能であり、統計的に校正され、オープンにクエリ可能である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:36:07 GMT)
When Rolling Gets Weird: A Curved-Link Tensegrity Robot for Non-Intuitive Behavior [0.6] 本研究では,半円形で湾曲した張力ロボットによる解を提案する。
このロボットは、効率的なローリングロコモーションと制御された安定性のバランスを保ち、アークエンドポイントにおける不連続によって実現される。
予備的な衝撃試験では、引張構造の固有の衝撃吸収能力と適合性を強調している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:30:33 GMT)
Security Assessment and Mitigation Strategies for Large Language Models: A Comprehensive Defensive Framework [0.6] 大規模言語モデルは、医療から金融への重要なインフラをますます力づけていますが、敵の操作に対する脆弱性は、システムの完全性とユーザの安全を脅かしています。
本研究は、標準化された脆弱性評価フレームワークを確立し、特定された脅威から保護するための多層防御システムを開発することで、このギャップに対処する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:32:06 GMT)
Influence of Gripper Design on Human Demonstration Quality for Robot Learning [0.6] 包帯開放作業におけるユニバーサルマニピュレーションインタフェース(UMI)の有効性を評価する。
集中荷重グリップは、分散荷重グリップと比較して性能が向上したが、手よりもかなり遅く、効果が低かった。
これらの結果から,ハンドヘルドグリップにおける人間工学的・機械的改良の重要性が強調され,ユーザ負担の軽減と実演品質の向上が図られた。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:36:09 GMT)
Understanding Pruning Regimes in Vision-Language Models Through Domain-Aware Layer Selection [0.6] トランスフォーマーベースの視覚言語モデル(VLM)は、かなりの深度冗長性を含んでいる。
ドメイン認識のアクティベーション類似性のレンズを貫通する構造デコーダ層について検討した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:07:25 GMT)
Auditing the Auditors: Does Community-based Moderation Get It Right? [0.6] 我々は,Xのコミュニティノートにおけるコンセンサスに基づく監査の結果を分析した。
マイノリティ・コントリビュータの評価は多数派に傾き、彼らの参加比率は議論の的となっているトピックに該当する。
多数派との合意によってではなく,過去の残余の安定性によって貢献者を重み付けする2段階監査・集約アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:58:13 GMT)
Novelty-Driven Target-Space Discovery in Automated Electron and Scanning Probe Microscopy [0.6] 我々は、ターゲット空間における発見をガイドするディープラーニングBEACONフレームワークを開発した。
このベンチマークフレームワークは、発見駆動アルゴリズムを評価する基盤を提供する。
関連するノートブックが利用可能で、ユーザはベンチマークを再現し、テストし、メソッドを自身の機器やデータセットに適応することができる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:04:20 GMT)
Automated identification of Ichneumonoidea wasps via YOLO-based deep learning: Integrating HiresCam for Explainable AI [0.6] 本研究では,Ichneumonoideaスズメバチの自動識別のためのディープラーニングに基づくフレームワークを提案する。
提案システムは,高解像度画像からスズメ科を同時に同定する。
その結果, 96 %以上の精度を示し, 形態的変動にまたがるロバストな一般化が得られた。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:34:46 GMT)
Bridging the Simulation-to-Reality Gap in Electron Microscope Calibration via VAE-EM Estimation [0.6] 可変オートエンコーダ(VAE)を用いた走査透過電子顕微鏡(STEM)の校正問題に取り組む。
VAEは画像の低次元表現を学習するが、既存の手法はスカラー値のみを抽出する。
次に,キャリブレーションパラメータを符号化表現と最適キャリブレーションパラメータにマッピングするモデルを,期待(EM)アプローチを用いて同時に推定する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:15:33 GMT)
Efficient Shadow Tomography of Thermal States [0.6] 我々は、ハミルトニアンがアクセス可能なギブス状態のコピーである$mathcalO(log (M)/varepsilon2)から$M$オブザーバブルを推定するための一般的なプロトコルを示す。
指数時間ハミルトニアンシミュレーションが禁止されたブラックボックス環境では,サンプルの複雑さが最適であることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:53:12 GMT)
Error semitransparent universal control of a bosonic logical qubit [0.5] 動的符号化サブ空間に基づくフレームワークを導入し、単純なリニアドライブでエラー半透明なユニバーサルゲートを実現できるようにする。
本研究では,光子損失を条件とした不整合の5倍の減少を観測し,量子誤差補正によるアクティブ・マニピュレーション寿命の延長を実証し,複合EsT非クリフォード演算を構築した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:46:23 GMT)
Exploring Urban Land Use Patterns by Pattern Mining and Unsupervised Learning [0.5] 本稿では,共起型土地利用パターンに基づく類似都市同定手法を提案する。
この手法には、データ前処理、NegFINアルゴリズムを用いたパターンマイニング、後処理、知識抽出と可視化が含まれる。
フレームワークはスケーラブルで、ソースコードは公開されています。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:29:33 GMT)
Cost Trade-offs in Matrix Inversion Updates for Streaming Outlier Detection [0.5] 本技術は,ダイレクト・インバージョン(DI),イテレーティブ・シャーマン・モリソン(ISM),ウッドベリー・マトリックス・アイデンティティ(WMI)の3つの異なる更新手法を比較することを目的とする。
ISMはランク1更新に最適であり、WMIは行列サイズに対して小さな更新に最適であり、DIはそうでなければ好ましい。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:51:18 GMT)
PyPhonPlan: Simulating phonetic planning with dynamic neural fields and task dynamics [0.4] PyPhonPlanは、音声プランニングの動的モデルを実装するためのPythonツールキットである。
プランニング、知覚、メモリフィールドを定義するコンポーネントや、フィールド間結合、ジェスチャー入力、およびフィールドアクティベーションプロファイルを使用して、トラクション変数のトラジェクトリを解決するコンポーネントを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:37:00 GMT)
How Clued up are LLMs? Evaluating Multi-Step Deductive Reasoning in a Text-Based Game Environment [0.4] ルールベースのテストベッドとして,テキストベースのマルチエージェント版Clueを実装した。
構造化論理パズルの微調整がゲーム内推論やゲームプレイの改善に寄与するかどうかを検討する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:01:11 GMT)
Quantum dynamics of few-photon pulsed waveguide-QED with a single artificial atom: frequency-dependent scattering theory and time-dependent matrix product states [0.4] 導波路QED系における2レベル系(TLS)または量子ビットからなる1つの人工原子からのパルス数光子散乱の量子力学的研究について述べる。
本稿では,MPSを用いてより直接的に量子ビット・フィールドオブザーバブルの計算方法を示し,2光子相関関数の2倍の特性を持つ鳥のような形状を求める。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:00:55 GMT)
Ember: A Serverless Peer-to-Peer End-to-End Encrypted Messaging System over an IPv6 Mesh Network [0.4] 本稿では,サーバレスピアツーピアメッセージングシステムであるEmberについて述べる。
分散IPv6メッシュネットワークを介してエンドツーエンドの暗号化通信を提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:18:03 GMT)
Anonymous-by-Construction: An LLM-Driven Framework for Privacy-Preserving Text [0.4] テキストを匿名化するLLM駆動置換パイプラインをオンプレミスで開発する。
プライバシー、セマンティックユーティリティ、およびプライバシー下でのトレーサビリティを測定します。
提案手法は,最先端のプライバシ,トピックドリフトの最小化,実効性の向上,トレーニング可能性の低下を実現する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:46:15 GMT)
Learning Communication Between Heterogeneous Agents in Multi-Agent Reinforcement Learning for Autonomous Cyber Defence [0.4] エンタプライズネットワークに対するサイバー攻撃の脅威に対する解決策として、強化学習技術が研究されている。
サイバーセキュリティにおけるAIの分野における最近の研究は、サイバー攻撃に対応する均質なマルチエージェント強化学習エージェントの能力について研究している。
本稿では、シミュレーションネットワーク環境における異種エージェント機能を調べることにより、マルチエージェントシステムにおける学習コミュニケーションの研究を進める。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:38:39 GMT)
Talk is Cheap, Logic is Hard: Benchmarking LLMs on Post-Condition Formalization [0.3] 本稿では,プログラムの FULL プレコンディションとポストコンディションの生成における LLM の有効性について述べる。
新たな40タスクのデータセットを用いて24種類の最先端LCMを評価した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:46:42 GMT)
Sample-Efficient Adaptation of Drug-Response Models to Patient Tumors under Strong Biological Domain Shift [0.3] 本研究は,患者データへの薬物応答モデルのよりサンプル効率の高い適応を可能にするために,表象学習をタスク管理から明確に分離するか否かを検討する。
本稿では,未ラベル医薬品ゲノムデータの大量収集から,細胞および薬物の表現を独立に学習する段階的移行学習フレームワークを提案する。
ソースドメインとターゲットドメインが重なり合う場合, 教師なし事前トレーニングは限られた利益をもたらすが, 非常に限られたラベル付きデータで患者腫瘍に適応する場合, 明らかな利益をもたらす。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:12:38 GMT)
WorldVLM: Combining World Model Forecasting and Vision-Language Reasoning [0.3] 視覚言語モデル (VLM) と世界モデル (WM) を統合するハイブリッドアーキテクチャ WorldVLM を提案する。
我々の設計では、高レベルなVLMは駆動WMを誘導する動作コマンドを生成し、解釈可能かつコンテキスト対応な動作を可能にする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:32:21 GMT)
Trajectory-Optimized Time Reparameterization for Learning-Compatible Reduced-Order Modeling of Stiff Dynamical Systems [0.3] 時間再パラメータ化(TR)は、ニューラルODEの低次モデリングのための剛性緩和機構である。
本研究では, TR をニューラルODE の低次モデリングのための剛性緩和機構として検討し, トラジェクトリ最適化TR (TOTR) の定式化を導入する。
ToTRは、パラメータ化された剛性線形系、ファンデルポル発振器、HIRES化学動力学モデルという3つの硬質問題で評価される。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:33:59 GMT)
Long-Horizon Traffic Forecasting via Incident-Aware Conformal Spatio-Temporal Transformers [0.2] 本研究はオハイオ交通省(ODOT)の交通量データとそれに対応するODOT事故記録について検討した。
本研究では、適応等角予測(ACP)を用いた時空間変換器(STT)モデルを用いて、不確実性のあるマルチホライゾン予測を生成する。
実験では、他のベースライン法と比較して、長い水平精度とよく校正された予測間隔が改善された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:58:01 GMT)
An asymmetry lower bound on fermionic non-Gaussianity [0.2] 非ガウス性の測度と粒子数分布のシャノンエントロピーを関連付ける。
シャノンエントロピーの指数の観点から、非ガウス性相対エントロピー上の下界を導出する。
我々の結果は、非ガウス性(Gaussianity)を下げる実践的な方法と見なすことができ、非自明な相互作用を粒子数非対称性で強調することができる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:42:34 GMT)
Can Linguistically Related Languages Guide LLM Translation in Low-Resource Settings? [0.2] 本稿では,言語関連ピボット言語と数ショットのインコンテキストの例を組み合わせたデータ効率のセットアップについて検討する。
我々の分析では、ピボットベースのプロンプトは特定の構成の改善をもたらすが、その利得は控えめで、ほとんどショットの例構築に敏感であることが多い。
本研究は,低リソース翻訳環境における微調整の軽量な代替手段として,推論時間プロンプトとピボットベースの例をいかに,いつ,どのように使用することができるか,という経験的ガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:28:46 GMT)
Designing for Disagreement: Front-End Guardrails for Assistance Allocation in LLM-Enabled Robots [0.2] 本稿では,アクセプティブルモードのガバナンス承認メニューに優先順位付けを制約する手続き的フロントエンドパターンを提案する。
複数性やLCMの不確実性を定常条件として扱うことで、暗黙の値スキューを隠すサイレントデフォルトを回避することができる。
本稿では,このパターンをパブリックコンコースロボットのヴィグネットを用いて説明し,妥当性,手続き的正当性,行動性に着目した評価課題を概説する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:00:15 GMT)
Impact of File-Open Hook Points on Backup Ratio in ROFBS on XFS [0.1] ROFBSは、ファイルオープンイベントにおいて、修正前のファイルをリアルタイムでバックアップすることで問題を緩和する。
Linuxファイルオープンパスは複数のカーネル関数を横切るため、フックポイントの選択が防御効果にどう影響するかは不明だ。
本研究では,ROFBS機構を固定し,Linuxファイルオープンパス上のフックポイントのみを変更した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:51:16 GMT)
A Perfectly Distributable Quantum-Classical Algorithm for Estimating Triangular Balance in a Signed Edge Stream [0.1] 我々は,単一パスエッジストリームにおける多様な符号付き三角形の数を効率的に推定するために,符号付きエッジを処理する量子古典ストリーミングアルゴリズムを開発した。
提案手法では,署名されたエッジストリームを処理するための量子スケッチレジスタと,量子推定器におけるクエリコールの計測演算子を導入している。
このハイブリッド設計は、純粋に古典的なアプローチよりも空間的優位性をもたらし、符号なしエッジストリームデータから既知の結果を符号付き設定に拡張する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 00:29:54 GMT)
SIA: A Synthesize-Inject-Align Framework for Knowledge-Grounded and Secure E-commerce Search LLMs with Industrial Deployment [0.1] 大規模言語モデルは、意図を認識したレコメンデーションを有効にすることで、eコマース検索の変革的なポテンシャルを提供する。
産業展開は,(1) 動的できめ細かな製品知識のエンコーディング不足による知識幻覚,(2) コンプライアンスを脅かすジェイルブレイク攻撃によるセキュリティ脆弱性の2つの重要な課題によって妨げられている。
我々は、知識とセキュアなeコマース検索LLMを構築するためのSI-a Synthesize-Inject-Alignフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:41:22 GMT)
Is Semi-Automatic Transcription Useful in Corpus Creation? Preliminary Considerations on the KIParla Corpus [0.0] 我々は,自動音声認識の実装を,イタリア語のリソースであるKIParla corpusの転写ワークフローに解析する。
ASRによる転写は転写速度を向上するが、全体的な精度は一貫して向上しないことを示す。
制限にもかかわらず、ASRによる転写はKIParla転写ワークフローに統合され、転写品質を損なうことなくコーパス生成を促進できる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:44:37 GMT)
High Fidelity Single-NV Qubit Quantum State Tomography by Photoelectric Readout [0.0] アンビエント固体量子ビットは大規模応用の代替となる。
本研究は,光電リードアウトと従来の光リードアウトの競合性について検討する。
我々は、光学的測定に匹敵する状態再構成のために0.995 pm 0.0062$の忠実性を達成した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:27:25 GMT)
Chiral and bond-ordered phases in a triangular-ladder superconducting-qubit quantum simulator [0.0] 三角層格子上でのボース・ハッバードモデルを実現する超伝導量子ビットデバイスについて検討した。
結合の大きさと符号を調整することにより、合成磁束を設計し、結果として生じる半充填基底状態を特徴づける。
本研究は, フラストレーションのあるボース・ハバード系において, 量子相を強固に探索する基盤として超伝導回路を構築した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:00:00 GMT)
p-Adic Dirac Equations and the Jackiw-Rebbi Model [0.0] 我々は、Jackiw-Rebbiモデルの新しいp-進版を示す。
新しいモデルは、標準モデルと同じ予測を与えます。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:03:23 GMT)
When GPUs Fail Quietly: Observability-Aware Early Warning Beyond Numeric Telemetry [0.0] GPUノードは現代のHPCおよびAIワークロードの中心であるが、多くの障害が即時障害として現れない。
本稿では,GPUテレメトリにおける利用感熱ドリフトシグネチャを共同でモデル化した,可観測性を考慮した早期警戒フレームワークを提案する。
その結果, 剥離故障は最小の数値前駆体を示し, 構造的テレメトリ崩壊によって主に観測可能であることがわかった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:07:41 GMT)
What if Pinocchio Were a Reinforcement Learning Agent: A Normative End-to-End Pipeline [0.0] この論文では、標準に準拠したコンテキスト対応エージェントを開発する際の問題に対処するパイプラインを提案する。
この研究は、強化学習エージェントが議論に基づく規範的アドバイザーによって監督されるハイブリッドモデルを紹介している。
このパイプラインを運用するために、この論文は、アドバイザーの判断を下す引数と関係を自動的に抽出する新しいアルゴリズムも提示する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:21:17 GMT)
Uncertainty Relation for Entropy and Temperature of Gibbs States [0.0] ギブス状態におけるエントロピー推定のための量子フィッシャー情報を導出する。
彼らの積 $F_Scdot F_T = 1/T2$ はハミルトニアンとは独立である。
エントロピー推定のための最適プロトコルとしてエネルギー測定を同定する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:38:21 GMT)
Two-Dimensional Far-Field Correlations of X-ray Photon Pairs [0.0] 自然パラメトリックダウンコンバージョン(SPDC)により生成されたX線光子対の遠距離場相関を観測する。
リング半径は光子エネルギーとともに、横位相マッチングと定量的に一致し、X線SPDCの強い運動量空間の検証を提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:22:07 GMT)
Tumula information and doubly minimized Petz Renyi lautum information [0.0] 2倍に最小化されたペッツ・レニイ・ラウタム情報(PRLI)と呼ばれる対応するペッツ・レニイ版を導入する。
我々はこれらの相関尺度のいくつかの一般的な性質を導出し、仮説テストの文脈における操作的解釈を提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:00:05 GMT)
Trust in Autonomous Human--Robot Collaboration: Effects of Responsive Interaction Policies [0.0] 信頼は人間とロボットのコラボレーションにおいて中心的な役割を果たすが、完全に自律的な相互作用の制約の下でその形成が調査されることは滅多にない。
本研究では,Wizard-of-Oz制御やスクリプティング修復を伴わないソーシャルロボットとの協調作業において,インタラクションポリシが信頼にどのように影響するかを検討した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:56:10 GMT)
Transformers are Bayesian Networks [0.0] トランスフォーマーはAIにおいて支配的なアーキテクチャであるが、なぜそれが機能するのかはいまだに理解されていない。
本稿では,変圧器がベイズネットワークであることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:50:13 GMT)
Transformers Can Learn Rules They've Never Seen: Proof of Computation Beyond Interpolation [0.0] 2つの制御された設定で強みのみの仮説をテストする。
実験1では、純粋なXOR遷移規則を持つセルオートマトンを用いる。
実験2では、整数上のシンボリック作用素鎖を1つの作用素対が持ち上がった状態で研究する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:02:28 GMT)
Trained Persistent Memory for Frozen Encoder--Decoder LLMs: Six Architectural Methods [0.0] 凍結した言語モデルにおける永続メモリは、厳しいリソース制約の下でも実現可能であることを示す。
3つのインジェクションポイントと4つの書き込みメカニズムにまたがる6つのアーキテクチャ手法を実装した。
我々は、大規模モデル、大規模データ、大規模メモリによる完全なエンドツーエンドトレーニングが、より強力な結果をもたらすと論じている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:51:21 GMT)
Towards Unsupervised Adversarial Document Detection in Retrieval Augmented Generation Systems [0.0] 検索型拡張現実システムは日常生活の不可欠な部分となっている。
コンテキスト文書を操作することは、攻撃を継続し、すべてのユーザーに影響を与えさせる方法である。
攻撃者が操作したいターゲットプロンプトを操作することは、検出を成功させるためには必要ない。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:09:37 GMT)
Topology-Preserving Data Augmentation for Ring-Type Polygon Annotations [0.0] 構造解析において、環型領域は外側と内側の境界を繋ぐ単一の環状ポリゴン鎖として符号化されることが多い。
本研究では,マスク空間におけるフロアプラン変換を行う秩序保存型ポリゴン拡張戦略を提案する。
実験により、このアプローチが接続性を確実に回復し、ほぼ完全なサイクル調整保存を実現することが示されている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:01:44 GMT)
Tight Quantum Speed Limit for Ergotropy Charging in the N-Qubit Dicke Battery [0.0] 我々は、$N$-qubitのDicke量子電池におけるエルゴトロピー充電のための厳密な量子速度限界(QSL)を導出し、解析的に証明する。
すべてのプロトコルは$_N * geq sqrt$に崩壊する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:37:30 GMT)
The weakly interacting tenfold way [0.0] 弱相互作用時間進化作用素の幾何学的定義を導入する。
関連するスペクトル $KUwi$ と $KOwi$ が $KU$ と $KO$ に還元されるかを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:05:05 GMT)
The Geometry of Clifford Algorithms: Bernstein-Vazirani as Classical Computation in a Rotated Basis [0.0] ベルンシュタイン・ヴァジラニアルゴリズムは量子並列性の正準例としてしばしば教えられる。
本稿では,アダマール門の「ラッピング」が大域的基底回転として機能する幾何学的リフレーミングについて述べる。
我々は、大域的に回転する回路と、量子エンタングルメントを生成する位相的にねじれた回路とを区別する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:16:16 GMT)
The Cognitive Divergence: AI Context Windows, Human Attention Decline, and the Delegation Feedback Loop [0.0] AIコンテキストウィンドウは、2017年の512トークンから2026年までに2トークンに成長した。
Human Effective Context Spanは16,000トークンから1,800トークンに減少している。
AIと人間の比率はChatGPT打ち上げ時のほぼ同値から556--1,111xの生と56-111xの品質調整に成長した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:53:45 GMT)
The Algebraic Landscape of Kochen-Specker Sets in Dimension Three [0.0] 2シンボル座標アルファベットの3次元ヒルベルト空間におけるKochen-Speckerの不色性に関する計算的調査を示す。
テストされた全てのアルファベットにおいて、KS集合は、$x$が2つのキャンセル機構のうちの1つをサポートする場合にのみ生じる。
2つの新しいKSグラフ型を出力する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:31:59 GMT)
TharuChat: Bootstrapping Large Language Models for a Low-Resource Language via Synthetic Data and Human Validation [0.0] トゥル語はネパールとインドのテライ帯で約170万人が話しているインド・アーリア語である。
豊かな口承の伝統にもかかわらず、トゥルは厳しいデータ不足と言語的な断片化に悩まされている。
本稿では,この排除に対処する特別指導フォローモデルであるTharu-LLaMA (3B)について述べる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:57:47 GMT)
Text-as-Signal: Quantitative Semantic Scoring with Embeddings, Logprobs, and Noise Reduction [0.0] 本稿では,テキストコーパスを定量的意味信号に変換するための実用的なパイプラインを提案する。
本稿では,Qwen埋め込み, UMAP, モデル出力空間から直接導出される意味指標, および3段階の異常検出手順が, 操作用テキスト・アズ・サインのワークフローにどのように組み合わされているかを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:56:29 GMT)
Summary overview of present state of basic electrostatic field electron emission theory [0.0] この技術的注記は、基礎場電子放出(FE)理論の現在の状態の高レベルな概要を提供する。
このノートの主な目的は、将来出版されたFE文学における混乱と誤りを減らすことである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 00:40:29 GMT)
Stroboscopic detection of itinerant microwave photons [0.0] キャビティの1つに干渉する光子をほぼ投影的に測定する方法を示す。
低暗数で高効率な検出が可能となる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:45:18 GMT)
SpecMoE: Spectral Mixture-of-Experts Foundation Model for Cross-Species EEG Decoding [0.0] SpecMoEは、学習されたスペクトルゲーティングメカニズムによってガイドされるエキスパートフレームワークの混合である。
睡眠ステージング、感情認識、運動像分類、異常信号検出、薬物効果予測など、さまざまな脳波デコーディングタスクのセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:20:14 GMT)
Some Studies On Exact Solutions Of Models In Noncommutative Spaces [0.0] 私の論文の中心的なテーマは、時間依存非可換空間のフレームワークで正確に解ける様々な単純なプロトタイプモデルを探索することである。
私の論文は、時間依存の非可換背景における量子理論の深い理解に寄与し、そのようなフレームワーク内で一貫した量子理論を開発する強い可能性を示している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:19:06 GMT)
Shielded Reinforcement Learning Under Dynamic Temporal Logic Constraints [0.0] 強化学習(Reinforcement Learning, RL)は、様々なロボティクスアプリケーションにおいて有望であるが、安全性と運用上の制約により、実際のシステムへの展開は制限されている。
本稿では,逐次制御障壁関数とモデルフリーRLを利用して,学習プロセスを通じて与えられたタスクが満足されることを保証するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:29:50 GMT)
Shallow Representation of Option Implied Information [0.0] 暗示密度と暗示ボラティリティとの明示的なリンクは、前者のリスク中立性を後者の条件に変換し、静的な仲裁を除外する。
本稿では、オプションインプリード情報のニューラル表現を構築するための体系的なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:29:17 GMT)
Self-Conditioned Denoising for Atomistic Representation Learning [0.0] 自己完結デノナイジング(Self-Conditioned Denoising)は、原子性データのあらゆる領域にわたる条件付きデノナイジングに自己埋め込みを利用する再構成目的である。
SCDによって事前訓練された小さな高速GNNは、ラベル付きまたはラベルなしのデータセットで事前訓練されたより大きなモデルに対して、競争力や優れた性能が得られることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:52:18 GMT)
Secure Quantum Communication: Simulation and Analysis of Quantum Key Distribution Protocols [0.0] 量子鍵分布(QKD)は、量子原理に基づく情報理論のセキュリティを提供する。
本稿では,よく知られたQKDプロトコル,BB84,B92,E91のシミュレーションに基づく解析を行う。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:48:26 GMT)
STARK: Spatio-Temporal Attention for Representation of Keypoints for Continuous Sign Language Recognition [0.0] 本稿では,空間的(キーポイント間)と時間的(ローカルウィンドウ内)の両方の注意スコアを計算する統合的時間的注意ネットワークを提案する。
エンコーダは、既存の最先端モデルよりも約70-80$少ないパラメータを含んでいる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:29:57 GMT)
Results of the analysis of a survey for young scientists on training quality in HEP instrumentation software and machine learning [0.0] ECFA Early-Career Research Panelによる2021年の調査によると、334人の回答者の71%がオープンソースソフトウェアツールをインスツルメンテーション作業に使用しているが、70%はこれらのツールのトレーニングを受けていないと報告している。
これに応じて、実験・応用物理学における早期研究者のための機械学習およびソフトウェアにおけるトレーニングプログラムのアクセシビリティと品質を評価するために、Software and Machine Learning for Instrumentation Groupが結成された。
本報告は, 調査結果を詳細に要約し, 早期の研究者が利用できる研修プログラムを改善するための指導資料として機能することを目的としている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:30:19 GMT)
Qudit Implementation of the Rodeo Algorithm for Quantum Spectral Filtering [0.0] 一般的な$d$レベルのancilla quditを用いたRoooアルゴリズムの定式化を提案する。
次に,エネルギー領域におけるスペクトルフィルタとして機能するEmphRodeoカーネルの概念を紹介する。
第3に,ロッドアルゴリズムのためのマイクロカノニカルプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:24:44 GMT)
Quantum signal processing in Hilbert space fragmented systems [0.0] 量子信号処理(QSP)は量子アルゴリズムの統一フレームワークとして注目されている。
ヒルベルト空間フラグメンテーション(HSF)を示すシステムにおいてQSPを利用するプロトコルを提案する。
非可積分セクターにおける熱化の符号を数値的に同定する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:59:10 GMT)
Quantum reservoir computing with classical and nonclassical states in an integrated optical circuit [0.0] 量子貯水池コンピューティング(QRC)は、ハードウェアで実装可能な量子ニューラルネットワーク方式である。
正の位相空間法を拡張して, ボソニック, 線形シリコンチップ系QRC系を効率的にシミュレーションする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:49:59 GMT)
Quantum classification and search algorithms using spinorial representations [0.0] 非均一な初期分布を持つ量子分類アルゴリズムと量子探索アルゴリズムを提案する。
分類アルゴリズムでは、スピノリアル表現の特性を利用して、異なるクラスに関連する量子状態を構築する。
量子探索アルゴリズムでは、クリフォード代数の生成器を用いてオラクルを直接実装した事前情報を持つデータベースを考える。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:23:47 GMT)
Quantum Pattern Matching in Generalised Degenerate Strings [0.0] 縮退文字列は文字の集合の列である。
GD文字列内のパターンの正確な一致を見つけることは、$O(mn+N)$ timeで実現できる。
我々はこのアルゴリズムを量子計算モデルの下で動くように修正する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:35:02 GMT)
Quantum Brownian Motion: proving that the Schmid transition belongs to the Berezinskii-Kosterlitz-Thouless universality class [0.0] 周期ポテンシャルで移動する量子ブラウン粒子の平衡特性について検討する。
世界ライン・モンテカルロを経路積分形式主義に取り入れることで、遷移はベレジンスキー・コステリッツ・チューレス普遍性類に属することを示した。
周期ポテンシャルの存在は、サブオフミックおよび超オフミック系における局在特性を変化させない。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:07:04 GMT)
Quantifying entanglement in quantum thermodynamics via separability constraints [0.0] 我々は、絡み合いによる量子系の熱量と働きを定量化する。
これは、システムの非平衡力学を分離可能な状態に制限することで達成される。
我々は、制約された力学を複数の多部系に適用することにより、我々の理論をベンチマークする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:05:22 GMT)
Quadratic Surrogate Attractor for Particle Swarm Optimization [0.0] 本稿では,従来の大域的最適解をn次元二次形式に置き換えるために代理モデルを利用する粒子群最適化を提案する。
この洗練された収束ターゲットは、地域景観によって通知される。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:48:10 GMT)
PureCLIP-Depth: Prompt-Free and Decoder-Free Monocular Depth Estimation within CLIP Embedding Space [0.0] 本稿では,コントラスト言語-画像事前学習(CLIP)埋め込み空間内で完全に動作する,プロンプトフリーでデコーダフリーな単眼深度推定(MDE)モデルを提案する。
提案手法は,室内および屋外の両方のデータセット上で,CLIP埋め込みモデル間の最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:24:39 GMT)
Prompt Programming for Cultural Bias and Alignment of Large Language Models [0.0] 大型言語モデル(LLM)は、しばしば標的の人口と不一致した文化的偏見を示す。
以前の研究は、調査対象の文化的アライメントフレームワークを導入し、文化固有のプロンプトは、誤調整を減らすことができることを示した。
本稿では,オープンウェイトLLMにおける社会科学調査に基づく予測と距離の指標を再現することにより,その枠組みを再現する。
本稿では,DSPyを用いたプロンプトプログラミングをモジュール型で最適化可能なプログラムとして導入する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:34:40 GMT)
Physics-Informed Neural Systems for the Simulation of EUV Electromagnetic Wave Diffraction from a Lithography Mask [0.0] リソグラフィーマスクから超紫外線(EUV)電磁波を回折する問題を解くための物理情報ニューラルネットワーク(PINN)とニューラル演算子(NO)について述べる。
ニューラルネットワークに置き換える最も計算コストの高いコンポーネントを持つ導波管法に基づいて、新しいハイブリッド導波管ニューラル演算子(WGNO)が導入された。
現実的な2Dマスクと3Dマスクの数値実験により、PINNとニューラルオペレータは競争精度と予測時間を大幅に短縮することを示した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:43:35 GMT)
PashtoCorp: A 1.25-Billion-Word Corpus, Evaluation Suite, and Reproducible Pipeline for Low-Resource Language Development [0.0] パシュトコープ (PashtoCorp) は、パシュト語(英語版)の1.25ビリオン語コーパスである。
PashtoCorpは2.81億の文書にまたがる1.25Bワードで、OSCARのPashtoサブセットの40倍、かつての最大の専用Pashtoコーパスの83倍の大きさである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:36:18 GMT)
Over-the-air White-box Attack on the Wav2Vec Speech Recognition Neural Network [0.0] 自動音声認識システムは、悪意のある方法で書き起こしを変更する敵攻撃に対して脆弱である。
この分野での最近の研究は、オンザエアのシナリオで攻撃を動作させることに重点を置いているが、そのような攻撃は通常、人間の聴覚によって検出される。
本研究は,空対空攻撃を検知しにくくするさまざまなアプローチと,これらのアプローチが攻撃の有効性に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:42:10 GMT)
Optimization-Embedded Active Multi-Fidelity Surrogate Learning for Multi-Condition Airfoil Shape Optimization [0.0] 多条件翼形状最適化のための能動多面体代理モデルを開発した。
このフレームワークは、不確実性トリガーサンプリングと同期エリート性規則と、低忠実性インフォームドガウスプロセス回帰転送モデルとを結合する。
最適化された設計により、クルーズ効率は41.05%向上し、離陸リフトは最高の第1世代と比較して20.75%向上した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:43:11 GMT)
Open-Source Reproduction and Explainability Analysis of Corrective Retrieval Augmented Generation [0.0] CRAG(Corrective Retrieval Augmented Generation)の完全オープンソース版について紹介する。
CRAGは、取得した文書の品質を評価し、修正アクションをトリガーすることにより、RAGシステムの堅牢性を向上させる。
プロプライエタリなWeb検索をWikipedia APIとオリジナルのLLaMA-2ジェネレータで置き換え,Phi-3-mini-4k-インストラクトで置き換える。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:38:00 GMT)
Open Biomedical Knowledge Graphs at Scale: Construction, Federation, and AI Agent Access with Samyama Graph Database [0.0] オープンソースのバイオメディカル知識グラフとして,パスKG(5ソースから118,686ノード,834,785エッジ),臨床試験KG(7,774,446ノード,26,973,997エッジ),薬物相互作用KG(32,726ノード,191,970エッジ)の3つを挙げる。
まず、異種公開データソースから大規模なKGを構築するための高性能グラフについて説明する。これは、クロスソース重複、バッチローディング(PythonとRustネイティブローダ)、ポータブルスナップショットエクスポートである。
次に、クロスKGフェデレーションを実演します。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:26:44 GMT)
On the Transfer of Collinearity to Computer Vision [0.0] コリナリティ(Collinearity)は、直線に沿って配置された空間的に整列したエッジを増幅する視覚的知覚現象である。
原理を実証するプロトタイプモデルを開発し,それを体系的にテストし,4つのユースケースの文脈でベンチマークした。
第1のユースケースでは,コリニアリティはウェーハの故障検出を改善し,コリニアリティによる1.24因子による性能向上が得られることがわかった。
第2のユースケースでは,ナノテクノロジー材料の欠陥認識を検証し,コリニアリティにより3.2倍の性能向上を実現した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 14:40:23 GMT)
On the Carbon Footprint of Economic Research in the Age of Generative AI [0.0] グリーンAIの研究は、GenAIがツールである下流ではなく、モデルのフットプリントを大きく測定してきた。
分析の繰り返し単位をモデルからトピックにシフトし、研究者とシステム間の差別を割り当てる決定ポリシーとしてプロンプトを扱います。
結果は,GenAIの生産性と環境効率を調和させる実践的なレバーとして,ループガバナンスの人間を同定した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:18:32 GMT)
On secret sharing from extended norm-trace curves [0.0] ランプ秘密共有スキームは、高い相対重みの分析を必要とする対象である。
拡張ノルムトレース曲線から一点代数的符号から定義されるスキームが良いパラメータを持つだけでなく、[11]の線に沿って第2層のセキュリティを持つことを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:20:09 GMT)
Narrative Frames: A New Approach to Analysing Metaphors in AI Ethics and Policy Discourse [0.0] 本稿では,AI政策討論においてメタファを特定し分析するための新しい分類体系であるNarrative Framesを紹介する。
メタネットデータベースから685のメタファーを帰納的にコードし,82の批判的メタファー分析を用いて相互参照する。
談話中に存在するフレームと特に欠落しているフレームを明らかにすることで、この手法は基礎となる仮定とパワーダイナミクスをより透明に分析することができる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:46:22 GMT)
NANOZK: Layerwise Zero-Knowledge Proofs for Verifiable Large Language Model Inference [0.0] LLM推論を検証可能なゼロ知識証明システムであるメソッドを提案する。
我々のアプローチは、トランスフォーマー推論が自然に独立した層計算に分解されるという事実を生かしている。
EZKLと比較して、EZKLは70倍小さい証明と5.7倍速い証明時間をd=128で達成し、形式的な音質保証を維持している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:14:45 GMT)
N-Cavity-Magnon Polariton Blockade via Kerr Nonlinearity [0.0] キャビティ-マグノン分極は、キャビティ光子とマグノンの強い結合によって形成されるハイブリッド準粒子である。
カーの非線形性は、偏光子エネルギースペクトルに非調和性を導入し、それによって遮断効果が実現される。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:25:32 GMT)
More Rounds, More Noise: Why Multi-Turn Review Fails to Improve Cross-Context Verification [0.0] マルチターンレビューでは、リビューアがフォローアップ質問をしたり、著者からの回答を受け取り、再レビューを行うことができる。
制御実験では,シングルパスCCRベースラインに対して4種類のD-CCR変異体を試験した。
問題はレビュアーが見ているものではありませんが、そのレビューは再びノイズを招きます。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:29:29 GMT)
Monte Carlo sampling from a projected entangled-pair state in simulations of quantum annealing in the three dimensional random Ising model [0.0] ハミルトニアンは常磁性相からスピングラス相への量子相転移によって駆動される。
ネットワークはテンソル積状態として表され、特に2次元で知られている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:37:59 GMT)
Monolithic Segmented 3D Ion Trap for Quantum Technology Applications [0.0] 本稿では,高RF電圧で安定動作可能なイオン電極距離250$mの,セグメンテッド・モノリシック3Dフューズドシリカブレードトラップを提案する。
我々は、Yb$+$イオンを用いてトラップの性能をベンチマークし、トラップの軸中心付近に200$mの軸方向に均質なトラップ電位を示す。
我々は、放射状中心質量モードで約95msの運動ラムゼーコヒーレンス時間(T_2$)を観測した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:24:14 GMT)
Memory-enhanced quantum extreme learning machines for characterizing non-Markovian dynamics [0.0] 量子力学のパラメータを特徴付け,推定するために,量子エクストリーム学習マシンを用いる。
時間的情報と観測可能な追加を含むQELM特徴空間の拡張が推定性能に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:22:22 GMT)
MemX: A Local-First Long-Term Memory System for AI Assistants [0.0] 我々は、安定性指向の検索設計を備えたAIのためのローカルファーストの長期記憶システムであるMemXを提案する。
MemXは、libとOpenAI互換の組み込みAPI上にRustで実装されており、会話エージェントに対して永続的で検索可能な、説明可能なメモリを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:39:54 GMT)
Mechanistic Foundations of Goal-Directed Control [0.0] 本研究では,基礎バイアスが因果制御回路を生じさせ,理論上動機付けられた不確実性しきい値に収束する学習ゲーティング機構を示す。
この研究は、認知発達の機械的説明を強化し、解釈可能なエンボディードエージェントの設計のための原則化されたガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:36:46 GMT)
Measurement-Based Estimation of Causal Conditional Variances and Its Application to Macroscopic quantum phenomenon [0.0] ホモダイン測定記録のみに基づく変形キャビティシステムにおけるメカニカルオシレータの量子推定法を解析的に検討した。
典型的な量子状態生成のための実験的なパラメータ構造において、再構成バイアスは無視されるのに十分小さいことを示す。
状態検証への応用として,電磁相互作用を介するマクロ量子絡み合いの提案に本手法を適用した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:27:06 GMT)
Luttinger's Theorem Violation and Green's Function Topological Invariants in a Fractional Chern Insulator [0.0] 我々は、多体チャーン数の分数的性質がルッティンガー積分のステーダ応答に符号化されていることを示す。
また、Luttinger数と占有バンドのチャーン数によって、$N_3[mathrmG]$が完全に決定されることを解析的に証明する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:00:05 GMT)
Looking down the rabbit hole: Towards quantum optimal estimation of surface roughness [0.0] 本研究は, 軸方向分布の第1モーメント(平均高さ)と標準偏差(粗さ)が一定に制限されていることを示す。
空間モードデマルチプレクシングに基づく量子インスピレーションイメージング技術は、軸方向標準偏差を推定するのに最適であることが証明された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:53:18 GMT)
Logarithmic-depth quantum state preparation of polynomials [0.0] 本研究は、量子ビット数$n$の対数深さを持つ回路を用いて、振幅が次数$-d$で与えられる量子状態を作成する方法を紹介する。
近似は科学計算においてユビキタスであるため、この構造は量子状態の準備に対するスケーラブルで資源効率の良いアプローチを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:50:36 GMT)
Latent Semantic Manifolds in Large Language Models [0.0] 本研究では,大規模言語モデルに隠れた状態を潜在意味多様体上の点として解釈する数学的枠組みを開発する。
我々は2つの定理を証明し、任意の有限語彙に対する歪みに対する速度歪みの低い境界と、表現可能性ギャップに対する線形体積スケーリング法則を証明した。
本稿では,アーキテクチャ設計,モデル圧縮,復号化戦略,スケーリング法則について論じる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:05:56 GMT)
LLM-Powered Flood Depth Estimation from Social Media Imagery: A Vision-Language Model Framework with Mechanistic Interpretability for Transportation Resilience [0.0] FloodLlamaは、単一ストリートレベルの画像から連続的な洪水深度を推定するための微調整された視覚言語モデルである。
TikTokベースのデータパイプラインは、デトロイトの676の注釈付き洪水フレームで検証されており、リアルタイムのクラウドソースによる洪水検知の可能性を示している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:59:25 GMT)
Kinematic Emergence of the Page Curve in a Local Transverse-Field Ising Model [0.0] ここでは、ページ曲線を再現する制御可能な量子スピンチェーンモデルを提案する(ブラックホール蒸発で期待される二部構造エンタングルメントの昇降)。
曲線の詳細な形状は内部情報力学に依存することを示す。
これらの結果は、局所的に相互作用するスピンチェーンを、現在の量子ハードウェア上でブラックホールにインスパイアされた情報ダイナミクスを探索するための現実的なプラットフォームとして位置づけている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:00:02 GMT)
KidsNanny: A Two-Stage Multimodal Content Moderation Pipeline Integrating Visual Classification, Object Detection, OCR, and Contextual Reasoning for Child Safety [0.0] KidsNannyは、子どもの安全のための2段階のマルチモーダルコンテンツモデレーションアーキテクチャである。
ステージ1は視覚変換器(ViT)と物体検出器を組み合わせた視覚スクリーニング(11.7ms)である。
ステージ2では、コンテキスト推論のためのOCRとテキストベースの7B言語モデル(総パイプライン120ms)が採用されている。
視覚のみ, アイソレーションステージ1, マルチモーダルの2つの条件でUnsafeBench Sexual category(1,054画像)を評価し, フルステージ1+2パイプラインの評価を行った。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:00:43 GMT)
Kibble-Zurek Mechanism in the Open Quantum Rabi Model [0.0] オーミック浴は開量子ラビモデルにおいてベレジンスキー-コステリッツ-チューレス遷移を誘導することを示す。
環境が普遍性クラスを定義するので、散逸は本質的に断熱力学と競合しない。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:00:52 GMT)
Invisible Orchestrators Suppress Protective Behavior and Dissociate Power-Holders: Safety Risks in Multi-Agent LLM Systems [0.0] オーケストラの可視性の安全性は、経験的に検証されたことはない。
3つの組織構造を横断する3x2実験を事前登録した。
目に見えない 組織的解離 可視的指導力に対する
論文参考訳(メタデータ) (Tue, 17 Mar 2026 03:18:57 GMT)
Interpretable Context Methodology: Folder Structure as Agentic Architecture [0.0] AIエージェントオーケストレーションに対する現在のアプローチは、典型的には、コンテクストパッシング、メモリ、エラーハンドリング、コードによるステップ調整を管理するマルチエージェントフレームワークの構築を含む。
本稿では,フレームワークレベルのオーケストレーションを構造に置き換える手法である Model Workspace Protocol (MWP) を提案する。
平易なマークダウンファイルには、ひとつのAIエージェントに各ステップでどのような役割を果たすべきかを伝えるプロンプトとコンテキストがある。ローカルスクリプトは、AIをまったく必要としない機械的な作業を処理する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 00:03:23 GMT)
Interpretable AI-Assisted Early Reliability Prediction for a Two-Parameter Parallel Root-Finding Scheme [0.0] 我々は,kNN-LLEプロキシ安定度プロファイルとマルチ水平早期予測に基づくパラメータ化ルートフィンディングスキームのAI支援信頼性診断フレームワークを提案する。
このフレームワークは解釈可能な安定性指標を提供し、継続、再起動、パラメータの調整など、ソルバ実行時の早期決定をサポートする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:17:35 GMT)
Hybrid Classical-Quantum Transfer Learning with Noisy Quantum Circuits [0.0] 画像分類のためのコンパクトな量子トランスファー学習アーキテクチャのファミリを紹介する。
我々はPennyLaneとQiskitで実装された古典量子ハイブリッドモデルのインスタンス化と評価を行う。
実験の結果,提案した量子伝達学習アーキテクチャは競争力があり,いくつかの場合において精度が優れていることがわかった。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:28:33 GMT)
How compactness curbs entanglement growth in bosonic systems [0.0] 発散はゼロモード自体の本質的な性質ではなく、特に非コンパクト零モードに対して生じることを示す。
それらの非コンパクトな構成空間は位置空間の非有界な拡散を可能にし、一方連続スペクトルは運動量空間における不確定な退化を可能にする。
特に,コンパクトなフリーボソン(トモナガ・ラッティンガー液)記述が必要であり,一般的な非コンパクトなKlein-Gordonモデルが故障した場合を明らかにする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:52:15 GMT)
How Quantum Circuits Actually Learn: A Causal Identification of Genuine Quantum Contributions [0.0] 本稿では,アーキテクチャ間の性能差を直接効果と間接効果に分解する因果媒介フレームワークを提案する。
このフレームワークを5つの回路トポロジと3つのベンチマークデータセットに適用すると、直接的なアーキテクチャ的コントリビューションが量子媒介効果を体系的に超えることが分かる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:55:25 GMT)
Hidden Clones: Exposing and Fixing Family Bias in Vision-Language Model Ensembles [0.0] 家族関係の誤りは効果的なアンサンブル次元を2.5-3.6の独立有権者に還元する。
QualRCCVは、キャリブレーション、家族の質、家族サイズによるモデルの重み付けを行う、トレーニング不要の方法である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:08:01 GMT)
HMAR: Hierarchical Modality-Aware Expert and Dynamic Routing Medical Image Retrieval Architecture [0.0] MIRはコンピュータ支援診断の重要な要素であるが、既存のシステムは3つの永続的な限界に悩まされている。
我々は,Mixture-of-Experts (MoE)アーキテクチャ上に構築された適応検索フレームワークであるHMARを提案する。
RadioImageNet-CTデータセットの実験によると、HMARは64ビットと128ビットのハッシュコードに対して平均平均精度0.711と0.724を達成し、最先端ACIR法をそれぞれ0.7%と1.1%改善した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:42:15 GMT)
Grid-World Representations in Transformers Reflect Predictive Geometry [0.0] 次世代予測器は、しばしば潜伏世界の内部表現とその規則を発達させる。
ランダムウォークの正確な分布からサンプリングしたベクトルに対してデコーダのみの変換器を訓練する。
モデルと層をまたいで、学習された表現は基底真実の予測ベクトルと強く一致し、しばしば低次元である。
単純化された玩具システムで実証されているが、最適予測を支持する接頭辞表現は、ニューラルネットワークが文法やその他の構造的制約を内部化する方法を研究する上で有用なレンズとなる可能性がある。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:47:33 GMT)
Gradient Atoms: Unsupervised Discovery, Attribution and Steering of Model Behaviors via Sparse Decomposition of Training Gradients [0.0] トレーニングデータ属性(TDA)メソッドは、モデルの振る舞いにどのトレーニングドキュメントが責任を持つかを問う。
ドキュメントごとのトレーニング勾配をスパースコンポーネントに分解する、教師なしの方法であるGradient Atomsを提案する。
500個の発見原子のうち、最も高いコヒーレンスな原子は、行動ラベルなしで解釈可能なタスクタイプの挙動を回復する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:47:04 GMT)
Generative AI for Quantum Circuits and Quantum Code: A Technical Review and Taxonomy [0.0] アーティファクトタイプ(Qiskitコード、OpenQASMプログラム、サーキットグラフ)の2つの軸に沿ってフィールドを編成し、トレーニング体制と交差する。
本稿では,統語的妥当性,意味的正確性,ハードウェア実行可能性に関する3層評価フレームワークを適用した。
中心的な発見は、すべてのレビューされたシステムが構文とほとんどのアドレス意味論をある程度扱うが、量子ハードウェアのエンドツーエンド評価を報告していないことである。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:45:40 GMT)
Generation of many-body Bell correlations with short-range interactions in analog and digital quantum simulators [0.0] デジタルおよびアナログ量子シミュレーションプラットフォームは、この目的のためにあまりに早く崩壊する短距離またはパワーロー結合を提供する。
2つのスピン=tfrac12$連鎖モデル, 隣り合うXXX鎖と長距離XXZ鎖が対称セクターに投影されたとき, 有効OAT非線形性を発達させることを示す。
我々は,このマッピングの精度を,正確なダイナミクスと比較することにより確認し,単一のプローブ量子ビットを用いて生成した相関を読み取ることができることを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:00:00 GMT)
Fusion Complexity Inversion: Why Simpler Cross View Modules Outperform SSMs and Cross View Attention Transformers for Pasture Biomass Regression [0.0] The CSIRO Pasture Biomass benchmarkにおいて、視覚基盤モデルの農業レグレッションへの適応を体系的に評価した。
希少な農業データでは、2つの層にゲートされた深さ方向の畳み込み(R2 = 0.903)が、クロスビュー・アテンション・トランスフォーマーより優れる。
バックボーン事前トレーニングスケールは、すべてのアーキテクチャ選択を単調に支配している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:14:25 GMT)
From Torsors to Topoi: An Introduction with a View Toward $Σ$-Protocols in Cryptography [0.0] 本報告では, シーブとトポイについて概説する。
これは、著者の初期のトーサーへの紹介の概念的な継続として記述されている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:05:13 GMT)
From MOT to BEC using a single crossed-wire pair [0.0] 磁気光学トラップ(MOT)の構成を,45デグで回転する単純な交差ワイヤを用いて実証した。
制御パラメータがわずかに調整された同じペアのワイヤは、原子を磁気的にトラップし、強制的蒸発冷却によって冷却するために使用される。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:21:56 GMT)
FAlCon: A unified framework for algorithmic control of quantum dot devices [0.0] FAlConは、ポータブルで自動化されたキャラクタリゼーションとチューニング計測のためのオープンソースのソフトウェアエコシステムである。
FAlConは、アルゴリズムの実現と機器の実現を分離することによって、研究者とエンジニアが異種QDセットアップで特徴付けと自動チューニングルーチンを交換し、適応し、デプロイすることを可能にする。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:20:28 GMT)
Exploring Collatz Dynamics with Human-LLM Collaboration [0.0] 我々は人間とLLMの協調を通してコラッツ予想の枠組みを開発する。
我々は、奇数残基の91%が既に開始時より下降を余儀なくされていることを証明している。
また、すべての決定論的軌道は、開始点より下を横断する正確な負のサイクルのドリフトを十分に実現していることを証明している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:21:23 GMT)
Explainable machine learning workflows for radio astronomical data processing [0.0] 本稿では,ファジィ規則に基づく推論と深層学習の併用により,電波天文学における機械学習支援データ処理パイプラインの説明可能性を向上させることを提案する。
そこで我々は,高木・杉野・康ファジィシステムを用いたML支援意思決定手法の提案を,ラジオ天文学,すなわち校正の応用として検討する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:34:03 GMT)
Execution-Grounded Credit Assignment for GRPO in Code Generation [0.0] Execution-Grounded Credit Assignment (EGCA)は、GRPOアップデートを実行トレースを使用してローカライズする。
アルゴリズム上の制約を満たすが、フェールテストを行うプログラムでは、EGCAは候補と標準参照ソリューションを実行する。
EGCAは、批判、補助的損失、学習的検証を必要としないドロップイン修正である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:22:44 GMT)
Entanglement-Assisted Discrimination of Nonlocal Sets of Orthogonal States [0.0] 量子非局所性を示す量子状態の絡み合いによる識別は、量子情報理論におけるフロンティアのトピックである。
資源効率の高いLOCC識別プロトコルの開発とマルチパーティ・エンタングルメントの役割について検討する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:24:45 GMT)
Enhancing Linguistic Generalization of VLA: Fine-Tuning OpenVLA via Synthetic Instruction Augmentation [0.0] ロボットは多様な環境に適応しなければならないため、一般化はAIの具体化における中核的な課題である。
本稿では,OpenVLAの言語一般化を促進するためのパラメータ効率の良い微調整戦略を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:04:15 GMT)
EngGPT2: Sovereign, Efficient and Open Intelligence [0.0] EngGPT2はSovereign、Efficient、Openモデルとして構築されている。
Qwen3の36TやLlama3の15Tよりも少ない2.5兆のトークンでトレーニングされています。
MMLU-Pro、GSM8K、IFEval、HumanEvalなど、主要なベンチマークのパフォーマンスを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:08:35 GMT)
EMA Is Not All You Need: Mapping the Boundary Between Structure and Content in Recurrent Context [0.0] 固定係数の蓄積と表現できないものの境界をマップする方法を示す。
Hebbianアーキテクチャは、教師付きBiGRUの96%をゼロラベルによる文法的役割割り当てで達成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 00:13:24 GMT)
DynamicGate MLP Conditional Computation via Learned Structural Dropout and Input Dependent Gating for Functional Plasticity [0.0] ドロップアウト(Dropout)は、トレーニング中に隠れたユニットを非活性化してオーバーフィッティングを緩和する代表的な正規化技術である。
標準推論は、高密度な計算で全ネットワークを実行するため、その目標とメカニズムは条件付き計算とは異なる。
本稿では,DynamicGate-MLPを正規化ビューと条件計算ビューの両方を同時に満足する単一のフレームワークに編成する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:54:16 GMT)
Dynamic Meta-Layer Aggregation for Byzantine-Robust Federated Learning [0.0] フェデレートされた学習システムは、悪意のある更新を注入するビザンティンの敵に影響を受けやすい。
我々は,多ラベルフリップと標的外毒攻撃に対抗する新しい防御機構であるFedAOTを提案する。
計算効率を保ちながらモデル精度とレジリエンスを大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:54:00 GMT)
Do Understanding and Generation Fight? A Diagnostic Study of DPO for Unified Multimodal Models [0.0] 統一マルチモーダルモデルは、画像の理解と生成の両方のための言語モデルバックボーンを共有する。
DPOは両方の機能を同時に調整できますか?
1B と 7B のパラメータで DPO を Janus-Pro に適用する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:26:29 GMT)
Dissipative adaptation in a driven spin-boson model within the path-integral formalism [0.0] 量子状態における散逸適応仮説をシステム-貯留層アプローチを用いて検討する。
時間依存スピンボソンハミルトニアンにより記述された駆動開系の量子力学を解析する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:16:30 GMT)
Die to wafer direct bonding of (100) single-crystal diamond thin films for quantum optoelectronics [0.0] この研究は、単結晶ダイヤモンド(SCD)のユニークな材料特性を利用するナノフォトニック量子システムの製造を解き放つ。
キャリヤウエハへの高品位超薄ダイヤモンド薄膜の直接接合のための半導体互換プロセスを導入することで実現した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:12:02 GMT)
Development of Low-Cost and Bidirectional Syringe Pumps for Soft Robotics Applications [0.0] シリコーンボクセルをベースとしたソフトロボット(Silibots)は、ボクセルのインフレーションとデフレを形状変化の振る舞いに頼っている。
従来の空気圧アクチュエーター法は、有効性、コスト、複雑さ、精度の欠如など、大きな課題を生じさせる。
本研究は、オフ・ザ・シェルフと3Dプリント部品で構築された低コストでモジュール型のシリンジポンプシステムを導入する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:08:25 GMT)
DesertFormer: Transformer-Based Semantic Segmentation for Off-Road Desert Terrain Classification in Autonomous Navigation Systems [0.0] オフロード砂漠地形解析のためのセマンティックセグメンテーションパイプラインであるデザートホルダーについて述べる。
このシステムは地形を10の生態学的意味のあるカテゴリーに分類する。
平均インターセクションオーバーユニオン(mIoU)は64.4%、ピクセル精度は86.1%である。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:42:21 GMT)
Dependence Fidelity and Downstream Inference Stability in Generative Models [0.0] 共分散レベル依存フィデリティは、生成モデルを評価するのに有用な基準である。
依存性のばらつきは、下流の推論において定量的不安定を引き起こす。
これらの結果から, 依存性の忠実度が生成モデル評価に有用であることが示唆された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:24:31 GMT)
Deep Reinforcement Learning-driven Edge Offloading for Latency-constrained XR pipelines [0.0] 没入型拡張現実(XR)アプリケーションは、リアルタイムの応答性を厳格に満たさなければならないレイテンシクリティカルなワークロードを導入します。
適応実行と計算オフロードに対する既存のアプローチは、リアルタイムレイテンシ要求とデバイスバッテリ寿命の間の持続的な相互作用を完全に捉えていない。
本稿では,エッジ支援型XRシステムに対して,実行場所,ワークロード品質,レイテンシ要件,バッテリダイナミクスを共同で検討した,バッテリ対応型実行管理フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 17:30:11 GMT)
Deep Learning Multi-Horizon Irradiance Nowcasting: A Comparative Evaluation of Three Methods for Leveraging Sky Images [0.0] そこで本研究では,ASI(All-sky imager)画像の3つの手法について検討した。
最初の方法は、生のRGB画像から直接特徴を抽出するために、畳み込みニューラルネットワーク(CNN)に依存している。
第2の方法は、最先端のアルゴリズムを使用して、ドメイン知識によって情報を得る2D特徴マップを設計する。
最後の方法は、エンジニアリングされた2D特徴マップを時系列入力に集約することに依存する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:10:22 GMT)
Deep Adaptive Model-Based Design of Experiments [0.0] 非線形力学系に対する実験モデルに基づく新しい設計法(MBDOE)を提案する。
我々は,実時間適用を前提として,各実験段階間のコストのかかる後部推論と設計最適化に対処する。
本研究は, モノドキネティクスを付加したフィードバッチバイオリアクター, 基質阻害が不確実なハルダンバイオリアクター, ニュアンスクリアランスパラメータを持つ2成分系薬物動態モデル, リアルタイム展開のためのDCモータを含む, 複雑さの増大する4つのシステムに対するアプローチを実証する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 05:53:09 GMT)
Decoherence and the Reemergence of Coherence From a Superconducting "Horizon" [0.0] 我々は、ブラックホールの事象水平線の超伝導アナログにおけるデコヒーレンスを分析する。
我々は、ブラックホールの事象水平線のコンプトン波長内に配置された干渉計において、コヒーレンスの再帰を見出した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:45:16 GMT)
Data-driven forced response analysis with min-max representations of nonlinear restoring forces [0.0] 本稿では,非線形復元力を持つ機械系のデータ駆動非線形性同定法について述べる。
提案手法は, 非線形関数を活性化関数の線形結合で近似できることを示す普遍近似定理に基づいて構築された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 16:23:33 GMT)
Dark state role in time-reversal symmetry breaking [0.0] 我々は、駆動された少数レベル量子系の力学におけるグローバル駆動位相$$の役割について検討する。
暗黒状態(観察者)の存在は、この集団位相対称性の十分条件であることを示す。
これらの知見は、量子システムにおける堅牢な制御を達成するための実践的なガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:39:31 GMT)
Cross-Scale Persistence Analysis of EM Side-Channels for Reference-Free Detection of Always-On Hardware Trojans [0.0] 常時オンのハードウェアであるTrojansは、集積回路信頼にとって深刻な課題となる。
本稿では電磁(EM)サイドチャネルのクロススケール持続解析に基づく参照不要検出フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:52:57 GMT)
Contingency-Aware Planning via Certified Neural Hamilton-Jacobi Reachability [0.0] Hamilton-Jacobi (HJ) 到達性は力学系に対して正式な安全保証を提供する。
本稿では,学習型リーチビリティとサンプリング型プランニングを統合した同時対応マルチゴールナビゲーションフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:04:20 GMT)
Conditional Execution of Transpiler Passes Based on Per-Script Feature Detection [0.0] 本稿では,言語機能セットの正確な追跡と動的維持に基づいて,トランスパイラパスを条件付きで実行するコンパイラの改良を提案する。
大規模生産モノレポに対するこの改善の評価は、コンパイル時間とメモリ使用量を大幅に削減した。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 19:54:22 GMT)
Cascade-Aware Multi-Agent Routing: Spatio-Temporal Sidecars and Geometry-Switching [0.0] 高度なAI推論システムにおける一般的なアーキテクチャパターンは、シンボルグラフネットワークである。
現在のスケジューラは最適化と適合性があるが、幾何盲である。
木のようなデリゲートでは、単一障害が指数関数的にカスケードする。
密度巡回グラフでは、失敗は自己極限となる傾向がある。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 20:10:16 GMT)
Capability-Guided Compression: Toward Interpretability-Aware Budget Allocation for Large Language Models [0.0] 大規模言語モデル圧縮は、プルーニング、量子化、低ランク分解によって大幅に進歩した。
これを能力盲圧縮問題と呼び、2つの文書化された失敗の根本原因であると主張する。
本稿では,Sparse Autoencoder (SAE) 由来の能力密度マップを用いて,この問題に対処するフレームワークである Capability-Guided Compression (CGC) を提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 12:21:07 GMT)
Cache Hierarchy and Vectorization Analysis of Lindblad Master Equation Simulation for Near-Term Quantum Control [0.0] リンドブラッドマスター方程式による開量子システムのシミュレーションは、短期量子制御における計算ボトルネックである。
我々は,現在のCPUのL1,L2,L3キャッシュ境界にまたがるシステムを開発した。
We show that SoA layout with -O3 -march=native -ffast-math yields $2$--$4times$ speedup over scalar array-of-structures baselines。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:53:31 GMT)
CTI-REALM: Benchmark to Evaluate Agent Performance on Security Detection Rule Generation Capabilities [0.0] CTI-REALMは、AIエージェントがサイバー脅威インテリジェンス(CTI)を解釈し、検出ルールを開発する能力を評価するために設計されたベンチマークである。
この研究は、AIエージェントが検出エンジニアリングの労働集約的な側面をサポートする可能性を実証している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 15:49:46 GMT)
CSS codes from the Bruhat order of Coxeter groups [0.0] 興味深いコードパラメータを持つCSSコードのファミリーを生成する方法を紹介します。
研究の対象は、有限かつ無限のコクセター群である。
対応するチェーンコンプレックスがCSSコードのマルチタスクに変換できることを示します。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 00:43:51 GMT)
Bridging Classical Sensitivity and Quantum Scrambling: A Tutorial on Out-of-Time-Ordered Correlators [0.0] 古典力学系では、カオス的挙動は初期条件に対する指数的感度としばしば関連付けられる。
このチュートリアルは、OTOCの数学的機械を詳細に記述することで、応用数学と量子情報のギャップを埋める。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 11:27:58 GMT)
Bell Inequalities for Smells [0.0] 結果の直接等式比較のみを含むベルの不等式について検討する。
これらの不等式のほとんどは量子違反を認めており、非局所性に対するそれらの重要性の側面も示している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:10:28 GMT)
Behavioral Steering in a 35B MoE Language Model via SAE-Decoded Probe Vectors: One Agency Axis, Not Five Traits [0.0] 我々はQwen 3.5-35B-A3Bの残流上に9個のスパースオートエンコーダ(SAE)を訓練する。
私たちは5つのエージェント的行動特性を識別し、管理するためにそれらを使用します。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 10:05:41 GMT)
Asymmetric Nash Seeking via Best Response Maps: Global Linear Convergence and Robustness to Inexact Reaction Models [0.0] ナッシュ均衡(Nash equilibria)は、マルチエージェントの意思決定と制御における相互作用をモデル化するための原則的なフレームワークを提供する。
この手紙は、非対称情報 2-プレーヤ制約付きゲームのクラスを分離可能な集合で研究する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 18:45:56 GMT)
Assessing the Pedagogical Readiness of Large Language Models as AI Tutors in Low-Resource Contexts: A Case Study of Nepal's K-10 Curriculum [0.0] 大規模言語モデルの教育エコシステムへの統合は、パーソナライズされた家庭教師へのアクセスを民主化することを約束する。
本研究では,4つの最先端LLM--GPT-4o,Claude Sonnet 4,Qwen3-235B,Kim K2の系統的評価を行い,AI教師としての能力を評価する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 04:37:22 GMT)
Are Large Language Models Truly Smarter Than Humans? [0.0] 公開のリーダーボードでは、学術的知識、法律、プログラミングにまたがるベンチマークにおいて、大きな言語モデル(LLM)が人間の専門家を上回ることを示唆している。
本稿では,6つのフロンティアLSMの厳密な汚染監査を形成する3つの相補的な実験について述べる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 07:23:57 GMT)
An approximate graph elicits detonation lattice [0.0] 提案アルゴリズムは3次元圧力跡から細胞パターンを正確に抽出する。
このフレームワークは堅牢だが、高度に複雑な細胞パターンを確実に分割し定量化するのは難しい。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:46:29 GMT)
An FPGA-Based SoC Architecture with a RISC-V Controller for Energy-Efficient Temporal-Coding Spiking Neural Networks [0.0] スパイキングニューラルネットワーク(SNN)は、低消費電力エッジAIに理想的な高エネルギー効率とイベント駆動型計算を提供する。
本稿では,RISC-Vコントローラをイベント駆動型SNNコアに統合した,時間的符号化SNNのためのコンパクトなSystem-on-Chipアーキテクチャを提案する。
アーキテクチャはXilinx Artix-7 FPGAで完全に動作し、最大16倍のメモリ削減を実現している。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 23:39:13 GMT)
An Energetic Constraint for Qubit-Qubit Entanglement [0.0] 量子ビットの絡み合いをエネルギー的観点から解析する。
それぞれの量子ビット内部エネルギーをコヒーレント成分と非コヒーレント成分に分解する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:05:45 GMT)
Achieving Sub-Zeptonewton Force Sensitivity and Spin-Motion Entanglement in Levitated Diamond via Pulsed Backaction Evasion [0.0] 浮遊ダイヤモンド系におけるサブワントン力センサとロバストスピン・メカニカルエンタングルメントを実現するシステムを提案する。
我々は、標準量子限界を超えるように設計されたプラットフォームを開発する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 13:14:57 GMT)
AI-Generated Figures in Academic Publishing: Policies, Tools, and Practical Guidelines [0.0] 本稿では,主要な雑誌・出版社のAI活用状況について調査する。
著者の帰属や視覚的誤報の可能性など,出版社が提起する重要な懸念を識別する。
本稿では,AIフィギュアジェネレーションツールを適応的で透明な方法で利用しようとする研究者のためのベストプラクティスガイドラインを提案する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 06:25:21 GMT)
A direct controlled-phase gate between microwave photons [0.0] 2つの超伝導キャビティにホストされるマイクロ波光子間の直接相互作用を非線形要素を刺激することなく利用した。
我々の研究は、発振器間のコヒーレンス保存光子-光子相互作用を可能にすることで、ボソニック回路量子電磁力学(cQED)ツールボックスを拡張する。
これにより、非線型アンシラ励起からのデコヒーレンスを抑えつつ、ボソニック符号空間内で完全に動作するエンタングリングゲートを実現する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:51:31 GMT)
A Survey of Reinforcement Learning For Economics [0.0] 強化学習アルゴリズムは、動的プログラミングの自然なサンプルベースの拡張を提供する。
私は古典的計画と近代的な学習アルゴリズムを結びつける理論をレビューする。
これらのアルゴリズムの実用的脆弱性について検討する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 08:31:37 GMT)
A Multi-Model Approach to English-Bangla Sentiment Classification of Government Mobile Banking App Reviews [0.0] この調査は、バングラデシュの4つの銀行アプリについて、英語とバングラ語で5,652件のGoogle Playレビューを分析した。
従来のモデルは最高精度(0.815)、リニアSVMは最高重み付きF1スコア(0.804)を作成した。
DeBERTa-v3は、4つのアプリのレビューのアスペクトレベルでの感情分析に使用された。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 21:43:51 GMT)
A Human-Centred Architecture for Large Language Models-Cognitive Assistants in Manufacturing within Quality Management Systems [0.0] 大規模言語モデル認識アシスタント(LLM-CA)は、製造における品質管理システム(QMS)を強化することができる。
LLM-CAを製造に統合できるQMSにフォーカスした人間中心のソフトウェアアーキテクチャは存在しない。
本研究では,要求分析とソフトウェア開発プロセスを考慮したコンポーネントベースのアーキテクチャを設計することで,このギャップを解消する。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 09:58:34 GMT)
A Context Alignment Pre-processor for Enhancing the Coherence of Human-LLM Dialog [0.0] 本稿では、コンテキストアライメント・プリプロセッサ(C.A.P.)と呼ばれる計算フレームワークを提案する。
生成時に動作するのではなく、C.A.P.はユーザー入力と応答生成の間の前処理モジュールとして機能する。
我々は、C.A.P.は技術的な改良であるだけでなく、人間とコンピュータの対話を片道コマンド実行パターンから双方向の自己修正、パートナーシップベースのコラボレーションに移行するための一歩でもあると論じている。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 01:36:14 GMT)
3D tomography of exchange phase in a Si/SiGe quantum dot device [0.0] 交換相互作用係数$J(mathbfV)$を抽出することは、障害を理解し、デバイスの性能を忠実にシミュレートし、高い忠実度でスピン量子ビットを操作するために重要である。
累積位相を明らかにするための最初の2つの課題、$(mathbfV)$に取り組みます。
本研究では,スピンキュービットデバイスのための3次元位相体積を2次元計測シーケンスから頑健に抽出し,モデル化するために,幅広い分野の手法を取り入れた。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 00:17:02 GMT)
$\textit{Ab initio}$ Identification of Hydrogen Tunneling as Two-Level Systems in Nb$_2$O$_5$ and Ta$_2$O$_5$ [0.0] NbおよびTa酸化物の2レベル系(TLS)はマイクロ波周波数域における超伝導量子ビットのコヒーレンスとSRFキャビティ品質を制限している。
我々は, アモルファスNbおよびTa五酸化炭素中の水素配置と拡散経路のMLIP加速サンプリングと, 標的となる$textitab initio$バリデーションを組み合わせる。
論文参考訳(メタデータ) (Tue, 17 Mar 2026 22:50:48 GMT)