TaigiSpeech: A Low-Resource Real-World Speech Intent Dataset and Preliminary Results with Scalable Data Mining In-the-Wild [102.1] 音声技術は急速に進歩し、世界中の多様な人口に役立っている。
多くの言語は限られた資源のために表現されていない。
台湾の台義における実世界の発話意図データセットであるtextbfTaigiSpeechを紹介した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 01:44:45 GMT)
Rethinking Token Reduction for Large Vision-Language Models [95.5] LVLM(Large-Language Models)は、視覚的理解と推論において優れているが、過度の視覚トークンは高い推論コストをもたらす。
一般化設計の限界を克服し,メタコンプレックスと呼ばれる学習に基づくプロンプト非依存型メタコンプレックスを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:40:08 GMT)
Dress-ED: Instruction-Guided Editing for Virtual Try-On and Try-Off [91.6] 我々は、VTON、VTOFF、テキストガイドによる衣料品編集を統一する最初の大規模ベンチマークであるDress Editing dataset (Dress-ED)を紹介する。
Dress-EDは、3つの衣服カテゴリーと7つの編集タイプにまたがる146k以上の検証された四つ組で構成されている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:12:40 GMT)
The Golden Subspace: Where Efficiency Meets Generalization in Continual Test-Time Adaptation [86.8] Continual Test-Time Adaptation (CTTA)は、ソースデータにアクセスすることなく、分散シフトの下でラベルなしのデータストリームへのオンライン適応を可能にすることを目的としている。
我々は,GOLD ( Guided Online Low-rank Directional Adaptation) を提案する。これは,Goldenサブスペースに機能を投影する軽量アダプタを用いて,サブスペースがAGOPを介して動的に更新される間に,コンパクトなスケーリングベクトルを学習する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:48:38 GMT)
Scaling DoRA: High-Rank Adaptation via Factored Norms and Fused Kernels [84.0] DoRA(Weight-De Low-Rank Adaptation)は、LoRAを方向から分離することで拡張する。
d_in = 8192 とランク r = 384 では、単一のモジュールのノルムは bf16 で512MB の過渡的なワーキングメモリを必要とする。
因子ノルムは、二乗ノルムを O(d_out r + r2) 中間体を通して計算可能な基底、交差、およびグラマー項に分解し、密積を除去する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:57:24 GMT)
End-to-End Training for Unified Tokenization and Latent Denoising [82.9] 統一トークン化と潜伏拡散のためのオートエンコーダアーキテクチャUNITEを提案する。
UNITEは、画像トークン化器と重量共有による潜伏ジェネレータの両方として機能するジェネレータで構成されている。
トークン化とスクラッチ生成の単一段階共同訓練が実現可能であることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:59:49 GMT)
TiCo: Time-Controllable Training for Spoken Dialogue Models [82.4] TiCoは、音声対話モデルにおいて、時間制約のある指示に従うことができ、制御可能な時間で応答を生成する方法である。
少量のデータしか必要とせず、代わりに自己生成と強化学習に依存する質問と回答のペアは必要ない。
実験の結果,TiCoは応答品質を保ちながら持続時間制約への付着性を著しく改善することがわかった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:51:40 GMT)
On the Direction of RLVR Updates for LLM Reasoning: Identification and Exploitation [81.3] アップデートの方向性は、RLVRの効果を理解するためのより重要なレンズである、と我々は主張する。
我々の研究は、RLVRの分析と改善の鍵となる原則として変化の方向を確立する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:42:24 GMT)
VP-VLA: Visual Prompting as an Interface for Vision-Language-Action Models [80.1] ビジョン・ランゲージ・アクションモデルは通常、視覚観察と言語指示を直接ロボット制御信号にマッピングする。
本稿では,高レベルの推論と低レベルの実行を,構造化された視覚的プロンプトインタフェースを介して分離する,デュアルシステムフレームワークであるVP-VLAを提案する。
Robocasa-GR1-TabletopベンチマークとSimplerEnvシミュレーションの実験は、VP-VLAが成功率を5%と8.3%改善することを示した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:08:58 GMT)
Calibeating Made Simple [75.9] カリビートは後悔と同等の極小値であることを示す。
また、マルチカリービートは、カリビートと古典的専門家問題の組み合わせと等価であることを示す。
2値予測では, 同時に最適校正率も達成できる最初の校正アルゴリズムが得られた。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:28:07 GMT)
Ego2Web: A Web Agent Benchmark Grounded in Egocentric Videos [74.8] Ego2Webは、エゴセントリックなビデオ認識とWebエージェントの実行を橋渡しするために設計された最初のベンチマークである。
オンライン環境での視覚的理解、Webタスク計画、インタラクションを必要とするWebタスクと、現実世界のファースト・パーソン・ビデオ録画を組み合わせます。
自動データ生成パイプラインと人間の検証と改良を組み合わせて、よく構築された高品質なビデオタスクペアをキュレートする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:47:58 GMT)
P^2O: Joint Policy and Prompt Optimization [74.5] RLVR(Reinforcement Learning with Verifiable Rewards)は、大規模言語モデル(LLM)の推論能力を高めるための強力なパラダイムとして登場した。
プロンプト最適化とポリシー最適化を相乗化する新しいフレームワークであるP2Oを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:08:47 GMT)
Spatio-Temporal Attention Enhanced Multi-Agent DRL for UAV-Assisted Wireless Networks with Limited Communications [73.3] 本稿では,UAV間の情報共有を促進するために,遅延ペナル化報酬を統合した遅延耐性多エージェント深層強化学習アルゴリズムを提案する。
提案手法は従来のMADRLに比べて50%以上の情報遅延と75%のスループット向上を実現する。
また、UAV情報交換の必要性を低減し、UAV支援無線ネットワークにおけるMADRLの実践的展開を促進するのにも有効である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:42:50 GMT)
Computational Arbitrage in AI Model Markets [73.2] 仲裁員は、市場を弱めるために、提供者間で推論予算を効率的に割り当てる。
単純な仲裁戦略が最大40%の純利益率を生み出すことを示す。
我々の結果は、仲裁は、モデル開発、蒸留、デプロイメントに影響を及ぼすAIモデル市場において、強力な力となり得ることを示唆している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:00:14 GMT)
Adapting Self-Supervised Speech Representations for Cross-lingual Dysarthria Detection in Parkinson's Disease [72.0] 音声表現は、しばしば言語に依存した構造を符号化する。
本稿では,ソース言語による自己教師型音声表現とターゲット言語分布とを一致させる表現レベル言語シフトを提案する。
チェコ語,ドイツ語,スペイン語におけるパーキンソン病音声データセットの経口DDK記録に対するアプローチについて検討した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:23:39 GMT)
Principled Steering via Null-space Projection for Jailbreak Defense in Vision-Language Models [71.1] 視覚言語モデルは視覚的ジェイルブレイク攻撃によって容易に誘導され、有害なコンテンツを生成する。
本稿では,NullSteerを提案する。
我々はNullSteerが様々なジェイルブレイク攻撃において有害な出力を著しく減少させることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:23:23 GMT)
Sparse but Critical: A Token-Level Analysis of Distributional Shifts in RLVR Fine-Tuning of LLMs [65.8] 検証可能な報酬(RLVR)による強化学習は、大規模言語モデル(LLM)における推論を大幅に改善した。
本研究は,RLVRの分布効果に関する系統的研究である。
RLファインチューニングは, 基数とRLポリシーの間に有意なばらつきを示すトークン分布のごく一部で, 高度にスパースかつ目標となる変化を誘発することがわかった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:17:15 GMT)
UniDex: A Robot Foundation Suite for Universal Dexterous Hand Control from Egocentric Human Videos [65.3] 実際のロボット遠隔操作データの収集コストのため、デクサラスな操作は依然として困難である。
我々は、ロボット中心の大規模データセットと視覚言語アクション(VLA)ポリシーを結合したロボット基盤スイートであるUniDexを紹介する。
UniDex-Dataset、UniDex-VLA、UniDex-Capは、ユニバーサルデキスタラス操作のためのスケーラブルな基盤スイートを提供する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:49:12 GMT)
SpatialReward: Verifiable Spatial Reward Modeling for Fine-Grained Spatial Consistency in Text-to-Image Generation [62.6] 生成された画像の空間的レイアウトを評価するために明示的に設計された検証可能な報酬モデルである textbfSpatialReward を提案する。
安定拡散とFLUXの実験により、空間的リワードをRLトレーニングに組み込むことで、空間的一貫性と全体的な生成品質が一貫して向上することが示された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:26:35 GMT)
Manifold-Aware Exploration for Reinforcement Learning in Video Generation [62.5] FlowGRPOのようなビデオ生成のためのグループ相対ポリシー最適化(GRPO)手法は、言語モデルや画像よりもはるかに信頼性が低い。
このギャップは、ビデオ生成が複雑な解空間を持ち、探索に使用されるODE-to-SDE変換が余剰ノイズを注入できるため生じる。
SAGE-GRPO(Stable Alignment via Exploration)を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:04:38 GMT)
Chimera: Latency- and Performance-Aware Multi-agent Serving for Heterogeneous LLMs [62.2] ヘテロジニアスLSMクラスタ上で動作するマルチエージェントワークフローの予測スケジューリングシステムであるChimeraを提案する。
Chimeは最高のレイテンシをトレースし、エンドツーエンドのレイテンシを1.2-2.4$times$で削減し、タスクパフォーマンスを平均8.0-9.5ポイント改善する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:01:42 GMT)
Beyond Strict Pairing: Arbitrarily Paired Training for High-Performance Infrared and Visible Image Fusion [60.9] Infrared and visible image fusion (IVIF) は自然のテクスチャと温暖なシグネチャを保存しながら相補的なモダリティを結合する。
既存のソリューションは、トレーニングのために厳格に整列したイメージペアの広範なセットに依存している。
高性能IVIFのためのUnPaired and Arbitrally Paired Training Paradigms (UPTP, APTP)を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:03:10 GMT)
AI Co-Scientist for Ranking: Discovering Novel Search Ranking Models alongside LLM-based AI Agents with Cloud Computing Access [60.4] 本稿では,全検索ランキング研究パイプラインを自動化したAI共同科学者フレームワークを提案する。
これは、AIの共同科学者フレームワークをアルゴリズム研究に利用した、ランキングコミュニティで初めての研究である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:29:08 GMT)
Multinoulli Extension: A Lossless Continuous Relaxation for Partition-Constrained Subset Selection [60.1] 我々はパラメータフリーで、歪んだ局所探索法と同じ近似保証を実現できるMultinoulliSCGという新しいアルゴリズムを導入する。
また、分割制約に関する未探索オンラインサブセット選択問題に対して、Multinoulli-CGとMultinoulli-GAGAという2つの新しいオンラインアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:30:01 GMT)
RefracGS: Novel View Synthesis Through Refractive Water Surfaces with 3D Gaussian Ray Tracing [59.2] 本稿では,屈折水面と界面下のシーンを共同で再構築するフレームワークであるRefracGSを紹介する。
RefracGSは、以前の屈折法よりも画質が優れており、200FPSで15倍高速なトレーニングとリアルタイムレンダリングを実現している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:31:08 GMT)
Rethinking Visual Privacy: A Compositional Privacy Risk Framework for Severity Assessment with VLMs [58.8] 既存のビジュアルプライバシベンチマークでは、プライバシをバイナリプロパティとして扱い、可視性のあるコンテンツに基づいて、イメージをプライベートまたは非プライベートとしてラベル付けしている。
我々は、プライバシーは基本的に構成的だと主張する。孤立した属性が組み合わさって、厳しいプライバシー侵害が発生するかもしれない。
本研究は,構成的プライバシーリスク分類法 (CPRT) について紹介する。これは,独立した識別可能性と構成的害ポテンシャルに基づいて視覚的属性を整理する,規制を意識したフレームワークである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:48:42 GMT)
Color When It Counts: Grayscale-Guided Online Triggering for Always-On Streaming Video Sensing [58.3] グレースケール・アレンジ,カラー・オン・デマンドという,効率的なストリーミングビデオ理解のための新しいパラダイムを提案する。
そこで我々は、カラーキャプチャーを窓付きグレースケール親和性分析に基づいて起動するオンライントレーニングフリートリガであるColorTriggerを提案する。
ストリーミングビデオ理解ベンチマークでは、ColorTriggerはフルカラーのベースライン性能の91.6%を達成し、8.1%のRGBフレームしか使用していない。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:32:36 GMT)
3D-Layout-R1: Structured Reasoning for Language-Instructed Spatial Editing [57.8] 本研究では,シーングラフ推論によるテキスト条件付き空間レイアウト編集を行う構造化推論フレームワークを提案する。
構造化された関係表現を通して推論過程を明示的に導くことにより,空間的関係の解釈可能性と制御性を向上する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:59:14 GMT)
OmniVTA: Visuo-Tactile World Modeling for Contact-Rich Robotic Manipulation [57.1] textbfOmniViTacは,16ドルのタスクと100ドル以上のオブジェクトからなる21,000ドル以上のトラジェクトリからなる大規模ビズオタクティルアクションデータセットである。
我々は4つの密結合モジュールを統合する世界モデルベースのビジュオ触覚操作フレームワークである textbf OmniVTA を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:05:28 GMT)
Tiny Inference-Time Scaling with Latent Verifiers [56.7] Verifier on Hidden States (VHS) は、Diffusion Transformer (DiT) の中間的な隠れ表現で動作する。
VHSは、画素空間に復号することなくジェネレータ機能を解析することにより、候補毎の検証コストを削減できる。
VHSは同じ推論時予算でGenEvalを+2.7%改善する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:00:02 GMT)
A Multidisciplinary AI Board for Multimodal Dementia Characterization and Risk Assessment [56.6] CerebraはインタラクティブなマルチエージェントAIチームで、ERH、臨床ノート、医療画像分析のための特殊エージェントをコーディネートする。
構造化された表現を操作することで、プライバシ保護デプロイメントをサポートし、モダリティが不完全であれば、堅牢である。
Cerebraは、有識者のパフォーマンスを著しく改善し、前向き認知症リスク推定において精度を17.5ポイント向上させた。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:46:45 GMT)
MemDLM: Memory-Enhanced DLM Training [56.4] Diffusion Language Models (DLM)は、Auto-Regressive (AR)モデルよりも優れた利点を提供する。
彼らは列車の干渉ミスマッチに悩まされている。
本稿では,模擬復調処理をトレーニングに組み込んだメモリ拡張DLMを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:39:56 GMT)
Learning Trajectory-Aware Multimodal Large Language Models for Video Reasoning Segmentation [55.7] 我々はTrajSegを提案する。TrajSegはマルチモーダル大規模言語モデル上に構築されたシンプルで統一されたフレームワークである。
本研究では,MLLMが接頭辞(テキスト・トゥ・トラジェクティブ)と接頭辞(テキスト・トゥ・テキスト)の指示を受理する双方向テキスト・トラジェクティブアライメントを提案する。
このようにして、MLLMは、ビデオの対応性の向上と、より知覚的なオブジェクトの軌跡の恩恵を受けることができる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:25:51 GMT)
Repurposing Geometric Foundation Models for Multi-view Diffusion [54.7] 本稿では,幾何学的基礎モデルの幾何学的一貫した特徴空間を多視点拡散の潜在空間として再利用するフレームワークを提案する。
実験の結果,GADは2次元画像品質と3次元整合性の測定値において,VAEとRAEのどちらよりも優れており,VAEの潜伏空間に比べて4.4倍以上のトレーニングが加速していることがわかった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:57:05 GMT)
SpatialBoost: Enhancing Visual Representation through Language-Guided Reasoning [54.6] 本稿では,言語記述に表現された3次元空間知識を注入することにより,事前学習した視覚エンコーダの空間認識を高める枠組みを提案する。
中心となる考え方は、2D画像から高密度な3次元空間情報を言語表現に変換することである。
我々は、密集空間知識を段階的に取り入れ、階層的空間理解を構築するマルチターン・チェーン・オブ・ソート推論プロセスを採用する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:54:34 GMT)
ThinkJEPA: Empowering Latent World Models with Large Vision-Language Reasoning Model [53.2] 視覚言語モデル(VLM)は、一様にサンプリングされたフレームを解析することで、強力なセマンティックグラウンドと一般的な知識を提供する。
本稿では,高密度フレーム・ダイナミックス・モデリングと長軸意味指導を組み合わせたVLM誘導型JEPA型潜在世界モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:59:42 GMT)
Speed by Simplicity: A Single-Stream Architecture for Fast Audio-Video Generative Foundation Model [52.8] 本稿では,人中心生成のためのオープンソースオーディオビデオ生成基盤モデルdaVinci-MagiHumanを紹介する。
DaVinci-MagiHumanは、単一ストリームトランスフォーマーを使用して、同期ビデオとオーディオを共同で生成する。
中国語(マンダリン語とカントン語)、英語、日本語、韓国語、ドイツ語、フランス語の多言語音声生成をサポートする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:49:06 GMT)
Effective Strategies for Asynchronous Software Engineering Agents [52.8] 本稿では,集中型タスクデリゲート,非同期実行,独立したワークスペースという,3つのSWEプリミティブに根ざした構造化マルチエージェント協調パラダイムを導入する。
CAIDは,紙再生タスク(PaperBench)では26.7%,Pythonライブラリ開発タスクでは14.3%,単一エージェントベースラインでは26.7%の精度向上を実現している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:26:35 GMT)
CoVerRL: Breaking the Consensus Trap in Label-Free Reasoning via Generator-Verifier Co-Evolution [52.7] CoVerRLは1つのモデルがジェネレータと検証ロールを交換するフレームワークで、各機能が他方をブートストラップする。
Qwen と Llama のモデルファミリーでの実験では、CoVerRL は数理推論のベンチマークで4.7-5.9% でラベルなしのベースラインを上回っている。
自己検証の精度は55%から85%以上改善され、両方の能力が真に共存することを確認した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:36:19 GMT)
Unveiling the Mechanism of Continuous Representation Full-Waveform Inversion: A Wave Based Neural Tangent Kernel Framework [52.6] フルウェーブフォーム・インバージョン(FWI)は、限られた測定値から波動方程式の物理パラメータを推定する。
FWI法は初期モデルの精度に対する悪名高い感度によって制限されている。
連続表現 FWI (CR-FWI) の最近の進歩は、暗黙的ニューラル表現 (INR) のような座標ベースニューラルネットワークによるパラメータモデルを表現することで、初期モデルへの依存を緩和できることを実証している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:22:33 GMT)
OpenEarth-Agent: From Tool Calling to Tool Creation for Open-Environment Earth Observation [52.2] オープン環境の地球観測に適した最初のツール作成エージェントフレームワークであるOpenEarth-Agentを紹介する。
OpenEarth-Agentは事前に定義されたツールを呼び出すのではなく、適応的なワークフロー計画とツール作成を使用して、目に見えないデータやタスクに一般化する。
OpenEarth-Agentは、オープン環境で複数のドメインにまたがって完全なEOをマスターできることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:14:15 GMT)
Riemannian Geometry Speaks Louder Than Words: From Graph Foundation Model to Next-Generation Graph Intelligence [51.3] グラフ基礎モデル(GFM)がグラフ学習に不可欠であるという強い合意がある。
LLM(Large Language Models)に類似した強力で汎用的なGFMを構築する方法については、かなりの意見の相違が続いている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:49:19 GMT)
Beyond Matching to Tiles: Bridging Unaligned Aerial and Satellite Views for Vision-Only UAV Navigation [51.3] 本稿では,UAVの絶対位置と近距離からの進路を共同で予測する視覚駆動型クロスビューナビゲーション手法であるBering-UAVを提案する。
我々はまた、クロスビューのローカライゼーションとナビゲーションを評価するベンチマークである Bearing-UAV-90k も提示する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:17:39 GMT)
Compensating Visual Insufficiency with Stratified Language Guidance for Long-Tail Class Incremental Learning [50.8] ロングテールクラスのインクリメンタルラーニング(LT CIL)は、テールクラスのサンプルの不足が学習を妨げているため、依然として非常に困難である。
これらの問題に対処するために、言語知識の情報性とスケーラビリティを活用します。
階層化適応型言語指導を導入し、学習可能な重みを利用してマルチスケールの意味表現をマージする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:50:00 GMT)
WorldCache: Content-Aware Caching for Accelerated Video World Models [50.8] 我々はPerception-Constrained Dynamic CaCacheフレームワークであるtextbfWorldCacheを紹介する。
WorldCacheは、機能をいつ、どのように再利用するかを改善します。
PAI-Benchで評価されたCosmos-2.5-2Bでは、WorldCacheはtextbf$2.3times$推論スピードアップを実現し、textbf99.4%のベースライン品質を維持している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:59:54 GMT)
DualCoT-VLA: Visual-Linguistic Chain of Thought via Parallel Reasoning for Vision-Language-Action Models [50.1] VLA(Vision-Language-Action)モデルは、視覚的な観察と言語指示を直接ロボット行動にマッピングする。
近年の取り組みは、行動能力の前に思考でVLAモデルを育むために、Chain-of-Thought (CoT)推論を取り入れている。
並列推論機構を持つVLAモデルの視覚言語的CoT法であるDualCoT-VLAを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:59:25 GMT)
SynLeaF: A Dual-Stage Multimodal Fusion Framework for Synthetic Lethality Prediction Across Pan- and Single-Cancer Contexts [50.0] 合成致死率(SL)予測は、がん薬や治療薬の開発を導く上で重要である。
既存のマルチモーダル法は、異なる収束速度のためにしばしば「モダリティの怠慢」に悩まされる。
本稿では,2段階のマルチモーダル融合フレームワークであるSynLeaFを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:55:39 GMT)
Learning Sidewalk Autopilot from Multi-Scale Imitation with Corrective Behavior Expansion [49.1] サイドウォークのマイクロモビリティは、ラストマイル輸送にとって有望なソリューションである。
現在の学習に基づく制御手法は複雑な都市環境において困難である。
本稿では,修正行動拡張とマルチスケール模倣学習を通じて模倣学習を促進するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:41:21 GMT)
FullCircle: Effortless 3D Reconstruction from Casual 360$^\circ$ Captures [49.0] 3次元シーン再構築のための強力なツールとして、放射場が登場している。
視野カメラの視野が狭いので カジュアルな捕獲は困難です
生の360ドルのカメラキャプチャから直接3Dシーンを再構築するための実用的なパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:09:28 GMT)
ROM: Real-time Overthinking Mitigation via Streaming Detection and Intervention [49.0] 再考は、大きな推論モデルが正しい答えに達した後、冗長な推論ステップを生成し続けるときに起こる。
本稿では,ストリーミング予測・制御問題として緩和を過度に検討する最初の方法であるROMを提案する。
ROMは最高精度(93.51%)、最短応答(1,159トークン)、最高応答効率を達成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:26:57 GMT)
CaP-X: A Framework for Benchmarking and Improving Coding Agents for Robot Manipulation [48.9] "Code-as-Policy" は、実行可能コードがデータ集約型のVision-Language-Actionメソッドを補完する方法について考察している。
ロボット操作におけるCode-as-PolicyエージェントのオープンアクセスフレームワークであるCaP-Xを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:08:10 GMT)
Cross-Scenario Deraining Adaptation with Unpaired Data: Superpixel Structural Priors and Multi-Stage Pseudo-Rain Synthesis [48.8] 低レベルのコンピュータビジョンでは,イメージデライン化が重要な役割を担っている。
ディープラーニングのパラダイムは、目に見えないアウト・オブ・ディストリビューションシナリオに一般化された場合、厳しいパフォーマンス劣化に悩まされることが多い。
本稿では,クロスシナリオ・デライニング適応フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:38:55 GMT)
Language-Conditioned World Modeling for Visual Navigation [48.7] 本研究では,言語条件付き視覚ナビゲーション (LCVN) について検討する。
我々は,この問題を,言語指導に基づくオープンループ軌道予測として定式化する。
我々は,言語基盤,未来状態予測,行動生成をリンクするLCVNフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:10:14 GMT)
MIOFlow 2.0: A unified framework for inferring cellular stochastic dynamics from single cell and spatial transcriptomics data [48.0] We introduced Interpolating Manifold-Transport Flow (MIOFlow) 2.0。
この枠組みは、多様体学習、最適輸送、神経微分方程式を統合することにより、生物学的に情報を得た細胞軌道を学習する。
合成データセット、胚体分化、空間的に解決されたアクソロトル脳再生で検証される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 20:49:45 GMT)
Adapting Point Cloud Analysis via Multimodal Bayesian Distribution Learning [48.0] マルチモーダルな3次元視覚言語モデルは多種多様な3次元タスクにまたがる強力な一般化を示すが、その性能はドメインシフトで顕著に低下する。
これはテストタイム適応に関する最近の研究を動機付けており、テストタイムデータを使ってモデルをオンラインに適応させることができる。
テストポイントクラウド分析のためのマルチモーダル分散学習フレームワークBayesMMを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:03:47 GMT)
GoogleTrendArchive: A Year-Long Archive of Real-Time Web Search Trends Worldwide [47.7] GoogleTrendArchiveは、1年間(2024年11月28日から2026年1月3日まで)に125か国、1358か所にわたるGoogle Trendsing Nowデータの包括的なアーカイブである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:04:06 GMT)
UniMotion: A Unified Framework for Motion-Text-Vision Understanding and Generation [47.4] UniMotionは、人間の動き、自然言語、RGB画像の同時理解と生成のためのフレームワークである。
運動をRGBと同等の足場における一級連続的モダリティとして扱う。
UniMotionは、任意の理解、生成、編集にまたがる7つのタスクにわたる最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:59:48 GMT)
Seeing is Improving: Visual Feedback for Iterative Text Layout Refinement [46.5] Visual Feedback Layout Model (VFLM)は、視覚フィードバックを反復的に改善するフレームワークである。
MLLM、既存のレイアウトモデル、コードのみのベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:48:39 GMT)
PCA-Based Interpretable Knowledge Representation and Analysis of Geometric Design Parameters [45.9] 多くのCADベースのアプリケーションでは、複雑なジオメトリは多数の設計パラメータによって定義される。
本研究では,PCAに基づく表現から設計パラメータを推定する問題に対処する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:14:06 GMT)
Greater accessibility can amplify discrimination in generative AI [45.7] 音声対応大規模言語モデル (LLM) は, 体系的な性別差別を示す。
また、音声インタフェースは、パラ言語的手がかりに結びついた独自のバイアス機構を導入することも示している。
音声インタフェースを通じてアクセシビリティを拡大しようとする試みは、同時に差別のための新たな経路を生み出します。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:47:44 GMT)
PRM-as-a-Judge: A Dense Evaluation Paradigm for Fine-Grained Robotic Auditing [45.2] PRM-as-a-Judgeはトラジェクティブビデオから直接ポリシー実行を監査する高密度評価パラダイムである。
このパラダイムの中心はOPDメトリックシステムであり、タスク対応の進捗電位によって実行品質を明示的に定式化する。
マイクロスケールプログレス判別のための診断ベンチマークであるRoboPulseを用いて,マイクロレゾリューション特性を実証的に検証した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:48:42 GMT)
Mind over Space: Can Multimodal Large Language Models Mentally Navigate? [45.1] メンタルナビゲーションは経験から空間表現の戦略的構築である。
Video2 FrontierはMLLMのメンタルナビゲーション能力を評価するための先駆的なベンチマークである。
実験により、NavMindは優れたメンタルナビゲーション能力を発揮することが示された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:59:25 GMT)
A Brief Comparison of Training-Free Multi-Vector Sequence Compression Methods [45.1] マルチベクタ検索に特有な次元であるトークンシーケンス長を対象とするトレーニングフリー手法の評価を行う。
その結果, トークンのマージは, 検索効率を維持しつつ, インデックスサイズを低減するために, トークンプルーニングよりも厳格に優れていることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:07:25 GMT)
Adaptive Video Distillation: Mitigating Oversaturation and Temporal Collapse in Few-Step Generation [43.9] 本稿では,ビデオ拡散モデルに適した新しい蒸留フレームワークを提案する。
その中核となる革新は,(1)空間監督重量を動的に調整し,過度な分布シフトに起因するアーティファクトを防止する適応回帰損失,(2)スムーズで物理的に妥当なサンプリング軌道を促進する時間正規化損失,(3)知覚的品質を維持しながらサンプリングオーバーヘッドを低減する推論時間枠戦略である。
VBench と VBench2 ベンチマークの実験およびアブレーション実験により,本手法は安定した数段階のビデオ合成を実現し,知覚的忠実度と運動リアリズムを著しく向上させることを示した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:54:33 GMT)
Silicon Bureaucracy and AI Test-Oriented Education: Contamination Sensitivity and Score Confidence in LLM Benchmarks [43.5] 本稿では,言語モデルにおける汚染感度とスコア信頼度を解析するための監査フレームワークを提案する。
ノイズ条件下では, 広範に不均一なベースラインゲインが得られる。
これらの結果は、類似のベンチマークスコアが、かなり異なる信頼レベルを持つ可能性があることを示唆している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:03:07 GMT)
HUOZIIME: An On-Device LLM-enhanced Input Method for Deep Personalization [43.2] モバイル入力メソッドエディタ (IME) はテキスト入力の主要なインタフェースであるが、手動タイピングとパーソナライズされたテキストの生成に制約が課されている。
大規模言語モデル(LLM)を利用したデバイス上での個人化IMEであるHUOZIIMEを提案する。
我々は,HUOZIIMEを,合成パーソナライゼーションデータに基づくベースLSMの訓練後,人間的な予測能力で実現した。
実験では、デバイス上での効率的な実行と高忠実度メモリ駆動のパーソナライゼーションが示されている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:00:33 GMT)
SeaAlert: Critical Information Extraction From Maritime Distress Communications with Large Language Models [43.0] SeaAlertは、海上救難通信の堅牢な分析のためのフレームワークである。
現実的で多様な海洋メッセージを生成し、標準的な苦難のコードワードを省略したり、明示的な表現に置き換えたりといった挑戦的なバリエーションを含む。
生成された発話は音声に合成され、模擬VHFノイズで劣化し、ASRシステムによって転写され、現実的な雑音の書き起こしが得られる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:21:13 GMT)
Make Tracking Easy: Neural Motion Retargeting for Humanoid Whole-body Control [43.0] 本稿では,不均一な動きを潜在モチーフにグループ化するニューラルモーション・リターゲティング・フレームワークを提案する。
この戦略により、計算の並列学習の専門家は大幅に削減される。
参照は、全身制御ポリシーの収束を加速する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:59:00 GMT)
DUO-VSR: Dual-Stream Distillation for One-Step Video Super-Resolution [42.8] 拡散型ビデオ超解像(VSR)は近年、目覚ましい忠実さを達成しているが、それでも違法なサンプリングコストに悩まされている。
本稿では,一段階のVSRに対して,分散マッチングと敵対的監視を統合する3段階のフレームワークであるDUO-VSRを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:56:17 GMT)
Unified-MAS: Universally Generating Domain-Specific Nodes for Empowering Automatic Multi-Agent Systems [42.7] マルチエージェントシステム(MAS)は複雑な推論タスクを解決するための有望なパラダイムとして登場した。
オフラインノード合成によるトポロジカルオーケストレーションから粒状ノード実装を分離するUnified-MASを提案する。
4つの専門分野にわたる実験により、Unified-MASを4つのAutomatic-MASベースラインに統合することで、パフォーマンスとコストのトレードオフが向上することが示された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 01:36:07 GMT)
GaussianSSC: Triplane-Guided Directional Gaussian Fields for 3D Semantic Completion [42.6] セマンティックシーン補完(SSC)に対する2段階,グリッドネイティブ,三面誘導型アプローチであるEmphGaussian SSCを提案する。
本稿では,Voxel-imageアライメントの強化と単分子占有率推定の改善を図ったサブピクセルであるEmphGaussian Anchoringを紹介した。
我々はさらに点状ボクセル特徴を学習したボクセル・ガウシアン場に変換し、三面体を配向したエルフガウスアン-トリプレーン・リファインメントを通して三面体特徴を洗練する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:21:22 GMT)
The color code, the surface code, and the transversal CNOT: NP-hardness of minimum-weight decoding [42.4] 最小ウェイトデコーディングは3つのクインテシデント設定においてNPハードであることを示す。
この結果から,最小重復号法とその近似実現法の間の計算複雑性の急激な分離が明らかとなった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:57:38 GMT)
Scalable Prompt Routing via Fine-Grained Latent Task Discovery [42.1] プロンプトルーティングは、クエリ毎に候補のプールから最も適切な大きな言語モデルを動的に選択する。
本稿では,タスクの自動検出とタスク認識品質推定により,制約に対処する2段階のルーティングアーキテクチャを提案する。
提案手法は,既存のベースラインを常に上回り,最強の個人モデルを超えながら,コストの半減を図っている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:46:56 GMT)
Optimizing Feature Extraction for On-device Model Inference with User Behavior Sequences [41.9] AutoFeatureは、モデル推論の精度を損なうことなくデバイス上の機能抽出を高速化するように設計された自動機能抽出エンジンである。
オンライン評価では、AutoFeatureは、昼時間に1.33x-3.93x、夜間に1.43x-4.53xのエンド・ツー・エンド・デバイス・モデルの実行遅延を削減している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:53:34 GMT)
Proximal Policy Optimization in Path Space: A Schrödinger Bridge Perspective [41.8] 我々は、一般化シュルディンガー橋(GSB)に触発された生成PPOの経路空間定式化であるGSB-PPOを提案する。
本枠組みでは,クリッピングに基づく目的,GSB-PPO-Clip,およびペナルティに基づく目的,GSB-PPO-Penaltyの2つの具体的目標を開発する。
提案手法は,PPOを用いた生成ポリシーのトレーニングに有効な原理としてパス空間近位正規化が重要である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:37:42 GMT)
6D Robotic OCT Scanning of Curved Tissue Surfaces [41.1] ロボット搭載OCTプローブの6次元ハンドアイキャリブレーションのためのマーカーを提案する。
キャリブレーションにより変換の再現性が高い推定値が得られることを示す。
また, このキャリブレーションにより, 大きく湾曲した組織表面を一貫した走査が可能であることを実証した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:24:11 GMT)
VideoDetective: Clue Hunting via both Extrinsic Query and Intrinsic Relevance for Long Video Understanding [40.7] VideoDetectiveは、長いビデオ質問応答において効果的な手がかり探しのために、クエリ・ツー・セグメンテーションの関連性とセグメンション間の親和性を統合するフレームワークである。
提案手法は,ビデオMME-longで最大7.5%の精度向上を実現し,MLLMの多種多様な性能向上を実現している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:59:51 GMT)
INTRYGUE: Induction-Aware Entropy Gating for Reliable RAG Uncertainty Estimation [40.3] 本稿では,標準的なエントロピーに基づく不確実性定量法が,機械的パラドックスによりRAG設定でしばしば失敗することを示す。
文脈利用に固有の内的「綱引き」が出現し、誘導頭部は正しい答えをコピーすることで接地応答を促進するが、それらは以前に確立された「エントロピーニューロン」を左右的に引き起こす
本稿では,誘導ヘッドの活性化パターンに基づいて,予測エントロピーをゲートする機械的基盤手法であるINRYGUEを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:02:16 GMT)
LLM-guided headline rewriting for clickability enhancement without clickbait [40.1] 情報的忠実性を維持しながら読者のエンゲージメントを高めることは、ニュースメディアにおける制御可能なテキスト生成における中心的な課題である。
我々は、クリックベイトを別のスタイルのカテゴリーではなく、非合法なエンゲージメント手段の不当な増幅の極端な結果として捉えている。
本稿では,大規模言語モデル (LLM) をベースとして,予測時間制御のためのFuture Discriminators for Generation (FUDGE) パラダイムを用いた見出し書き換えフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:25:48 GMT)
MAGICIAN: Efficient Long-Term Planning with Imagined Gaussians for Active Mapping [40.0] アクティブマッピングは、未知の環境を効率的に再構築するためにエージェントがどのように動くかを決定することを目的としている。
我々は,蓄積した表面積のゲインを最大化する新しい長期計画フレームワークであるMAGICIANを紹介する。
本手法は,動作空間の異なる室内および屋外ベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:53:18 GMT)
Omni-WorldBench: Towards a Comprehensive Interaction-Centric Evaluation for World Models [39.6] ビデオベースの世界モデルは、ビデオ生成と3D再構成という2つの支配的なパラダイムに沿って登場した。
世界モデリングの未来は、空間構造と時間的進化を共同でモデル化する4D世代にあると我々は主張する。
Omni-WorldBenchは,世界モデルの対話的応答能力を4次元設定で評価するためのベンチマークである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:10:29 GMT)
From Static Templates to Dynamic Runtime Graphs: A Survey of Workflow Optimization for LLM Agents [39.5] 大規模言語モデル(LLM)ベースのシステムは、タスクの解決に人気が高まっている。
本稿では,そのような計算を設計・最適化するための最近の手法について概観する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:42:59 GMT)
Fast-WAM: Do World Action Models Need Test-time Future Imagination? [39.2] 世界行動モデル(WAM)は、身体制御のためのビジョン・ランゲージ・アクション(VLA)モデルに代わる有望な代替品として登場した。
我々は、WAMがテスト時に明らかに将来的な想像力を必要とするのか、それともトレーニング中に主にビデオモデリングから得られる利益なのかを問う。
我々は、トレーニング中にビデオのコトレーニングを継続するが、テスト時に将来の予測を省略するWAMアーキテクチャであるFast-WAMを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:41:14 GMT)
AnimalCLAP: Taxonomy-Aware Language-Audio Pretraining for Species Recognition and Trait Inference [39.1] 動物の声化は、特に森林のような複雑な環境において、野生生物の評価に重要な洞察を与える。
近年, 深層学習の進歩により, 発声からの自動種分類が可能となった。
階層的な生物学的情報を含む新しいデータセットとモデルからなる分類学対応言語オーディオフレームワークであるAnimalCLAPを紹介する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:53:02 GMT)
The Dual Mechanisms of Spatial Reasoning in Vision-Language Models [38.4] マルチモーダルタスクは、オブジェクトとその特性と空間的関係を関連付けるために視覚言語モデル(VLM)を必要とする。
本稿では,VLMが2つの同時的機構に依存していることを示す。
本研究では,全画像トークンの空間的表現を世界規模で拡張することで,自然画像の空間的推論性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:58:02 GMT)
Symbolic Graph Networks for Robust PDE Discovery from Noisy Sparse Data [38.1] 雑音およびスパース条件下でのPDE発見のためのシンボリックグラフネットワーク(SGN)フレームワークを提案する。
提案手法は,波動方程式,対流拡散方程式,圧縮不能なナビエ・ストークス方程式など,いくつかのベンチマークシステム上で評価される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:53:44 GMT)
2K Retrofit: Entropy-Guided Efficient Sparse Refinement for High-Resolution 3D Geometry Prediction [38.0] 2K Retrofitは、任意の幾何学的基礎モデルに対して効率的な2K分解能推論を可能にする新しいフレームワークである。
提案手法は, 高速粗い予測とエントロピーに基づくスパース改良を選択的に活用し, 高不確かさ領域を向上する。
広範に使用されているベンチマーク実験により、2K Retrofit が常に最先端の精度と速度を達成することが示された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:36:54 GMT)
Rashid: A Cipher-Based Framework for Exploring In-Context Language Learning [37.9] 我々は、HRL(High-Resource Language)を可逆的に暗号化し、HRLに利用可能な幅広いリソースにアクセス可能な真に見えない言語を構築する。
我々は,本フレームワークを用いて,SOTA評価ツールと手動解析を用いて現場における現在の手法の評価を行い,ICLLの改善における潜在的に高価な資源の有用性を探求し,機械翻訳を超えたリッチな下流タスクにおけるICLL戦略をテストする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:03:15 GMT)
How to Fine-Tune a Reasoning Model? A Teacher-Student Cooperation Framework to Synthesize Student-Consistent SFT Data [37.6] 教師-学生協調データ合成フレームワーク(TESSY)を提案する。
TESSYは、教師の高度な推論能力を継承し、生徒の分布と整合性を維持しながら、合成シーケンスを生成する。
GPT-OSS-120Bを教師として使用するコード生成の実験では、教師生成データに対する微調整Qwen3-8Bは、LiveCodeBench-Proで3.25%、OJBenchで10.02%のパフォーマンス低下をもたらす。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:00:03 GMT)
Beyond Correlation: Refutation-Validated Aspect-Based Sentiment Analysis for Explainable Energy Market Returns [37.6] 本稿では,金融市場におけるアスペクトベースの感情分析のための反感評価フレームワークを提案する。
エネルギーセクターのXデータを用いて、アスペクトレベルの感情信号が、株式リターンと頑健で、反感に満ちた関係を示すかどうかを検証する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 01:24:40 GMT)
From Part to Whole: 3D Generative World Model with an Adaptive Structural Hierarchy [37.3] 本稿では,潜在構造スロットを自律的に発見する新しい3次元生成世界モデルを提案する。
軽量な3D再構成器は、統合拡散目的により幾何学と外観に導入される。
実験は、クロスカテゴリ転送とパート数外挿において一貫した利得を示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:25:40 GMT)
SteelDefectX: A Coarse-to-Fine Vision-Language Dataset and Benchmark for Generalizable Steel Surface Defect Detection [37.3] 鉄鋼表面欠陥検出は、現代の製造における製品品質と信頼性を確保するために不可欠である。
SteelDefectXは、25の欠陥カテゴリにわたる7,778のイメージを含む視覚言語データセットである。
粗いレベルでは、データセットは欠陥カテゴリ、代表的視覚属性、関連する産業原因など、クラスレベルの情報を提供する。
きめ細かいレベルでは、形状、サイズ、深さ、位置、コントラストなどのサンプル固有の属性をキャプチャし、モデルがよりリッチでより詳細な欠陥表現を学習できるようにする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:06:57 GMT)
Feasibility of Augmented Reality-Guided Robotic Ultrasound with Cone-Beam CT Integration for Spine Procedures [35.9] 脊椎手術のための光学式シースルー拡張現実(OST-AR)誘導ロボットシステムを提案する。
我々は,ライブ超音波を併用したコーンビームCT(CBCT)由来の3Dスピーンモデルを統合する。
結果、ARは実行時間とタスク間の配置エラーを著しく削減することがわかった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:35:17 GMT)
DRTriton: Large-Scale Synthetic Data Reinforcement Learning for Triton Kernel Generation [35.7] 大規模言語モデル(LLM)は自動的にPyTorchの参照実装をカーネルに変換し、エンジニアリングの労力を大幅に削減する。
我々は、PyTorchコードを高度に最適化されたTritonカーネルに変換するために、LLMをトレーニングするためのスケーラブルな学習フレームワークであるDRTritonを提案する。
DRTritonは、 (i) 演算子空間の完全なカバレッジと偏りのない一様サンプリングを保証する合成アルゴリズムCSP-DAG、 (ii) 分解された報酬によるカリキュラム強化学習で変換成功率と19%の速度を効率よく最適化し、 (iii) 推論速度をさらに改善するテストタイム探索アルゴリズムである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 00:59:35 GMT)
Which Concepts to Forget and How to Refuse? Decomposing Concepts for Continual Unlearning in Large Vision-Language Models [35.4] 連続的アンラーニングは、大規模な視覚言語モデルにおいて、シーケンシャルな削除要求に応じて、特定の画像命令ペアを選択的に拒否することを可能にする。
本稿では,視覚的・テキスト的概念を削除対象から詳細に記述した上での拒否行動に基づく,新たな非学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:07:40 GMT)
DSPA: Dynamic SAE Steering for Data-Efficient Preference Alignment [34.5] 本稿では,スパースオートエンコーダをプロンプト条件で操る推論時間法であるDSPA(Dynamic SAE Steering for Preference Alignment)を提案する。
好みのトリプルからDSPAは条件差マップを計算し、プロンプト特徴と生成制御特徴をリンクする。
DSPAは2段階のRAHF-SCITパイプラインと競合し、最大4.47タイムでアライメントステージのFLOPを減らすことができる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 00:45:51 GMT)
MemGround: Long-Term Memory Evaluation Kit for Large Language Models in Gamified Scenarios [33.9] MemGroundは、リッチでゲーミフィケーションされたインタラクティブシナリオを基盤とした、厳格な長期メモリベンチマークである。
メモリ利用と行動軌跡の両方を包括的に定量化するために,多次元計量スイートを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:57:39 GMT)
Ctrl-A: Control-Driven Online Data Augmentation [33.7] ControlAugment (Ctrl-A)は、画像ビジョンタスクのための自動データ拡張アルゴリズムである。
モデルトレーニング中の強化強度分布のオンライン調整のための制御理論の原理を取り入れている。
CIFAR-10、CIFAR-100、SVHNコアベンチマークデータセットの実験は、Ctrl-Aが既存の最先端データ拡張戦略と非常に競合していることを示している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:03:02 GMT)
MultiBind: A Benchmark for Attribute Misbinding in Multi-Subject Generation [30.6] 実写写真から構築したベンチマークであるMultiBindを紹介する。
この結果から,MultiBindは従来のリコンストラクション指標が欠落する結合障害を明らかにした。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:54:36 GMT)
PEARL: Geometry Aligns Semantics for Training-Free Open-Vocabulary Semantic Segmentation [30.6] トレーニングフリーなオープン語彙セマンティックセマンティックセグメンテーション(OVSS)は、リトレーニングなしで新しいラベルセットに迅速に適応することを約束する。
我々は、アライメント-then-proagateの原理に従うコンパクトな2ステップの推論であるPEARLを提案する。
提案手法は,完全トレーニングフリーでプラグアンドプレイで,固定定数のみを使用し,最小限のレイテンシを付加し,頭部プロジェクションを小さくする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:40:47 GMT)
Uncertainty-guided Compositional Alignment with Part-to-Whole Semantic Representativeness in Hyperbolic Vision-Language Models [30.2] 双曲型視覚ランゲージモデル(VLM)の高機能化のための不確実性誘導型構成的双曲アライメント(UNCHA)を提案する。
UNCHAは、より代表的な部分に低い不確実性を割り当て、全体の代表的な部分に低い不確実性を割り当てることによって、双曲的不確実性を伴う部分対全体的な意味的代表性をモデル化する。
UNCHAはゼロショット分類、検索、マルチラベル分類のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:41:20 GMT)
HACMatch Semi-Supervised Rotation Regression with Hardness-Aware Curriculum Pseudo Labeling [30.0] 2D画像から物体を3D回転させるのは非常に難しい作業です。
本稿では,その難易度に基づいて疑似ラベル付きサンプルを動的に選択するカリキュラム学習フレームワークを提案する。
また、回転推定に適した構造付きデータ拡張戦略を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:24:03 GMT)
Rateless DeepJSCC for Broadcast Channels: a Rate-Distortion-Complexity Tradeoff [29.7] 本稿では、レートレス符号に基づくノン非線形トランスフォーメーションレスソースチャネル符号化(NTR SCC)を提案する。
我々はデコーダ側情報を活用する不平等な保護手法を開発し、レートレスパラメータのエンドツーエンド最適化を可能にする近似を考案する。
我々のフレームワークは、異種受信機が受信したレートレスシンボルの数を適応的に調整し、信念の伝播において繰り返しを復号することを可能にする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:25:39 GMT)
Dual-level Adaptation for Multi-Object Tracking: Building Test-Time Calibration from Experience and Intuition [29.4] テスト時間適応(TTA)は、そのような分散シフトを軽減するための有望なパラダイムとして登場した。
本稿では,経験と直観からのテストタイム(TCEI)フレームワークを提案する。
このフレームワークでは、過渡記憶を利用して、最近観測されたオブジェクトをリコールし、迅速な予測を行う。
オンラインテストにおける確実なオブジェクトと不確実なオブジェクトは、歴史的先行と反射的ケースとして活用される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:50:28 GMT)
When Visuals Aren't the Problem: Evaluating Vision-Language Models on Misleading Data Visualizations [29.0] 視覚言語モデル (VLM) は, 推論誤りの微粒な分類法を基礎とした, 誤解を招くビジュアル・キャプション・ペアについて評価する。
我々は、現実世界の視覚化と、人間が書いたキュレートされた誤解を招くキャプションを組み合わせたベンチマークを開発する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:34:47 GMT)
CAM3R: Camera-Agnostic Model for 3D Reconstruction [28.4] 本稿では,3次元再構成のためのカメラ非依存フィードフォワードモデルであるCAM3Rについて述べる。
我々のフレームワークは、レイモジュールとクロスビューモジュールに分岐した2ビューネットワークで構成されています。
これらのペアワイズ予測を一貫した3Dシーンに統合するために、Ray-Aware Global Alignmentフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:20:15 GMT)
PreferRec: Learning and Transferring Pareto Preferences for Multi-objective Re-ranking [28.4] PreferRecは、ユーザ間でParetoの好みを明示的にモデル化し、転送する新しいフレームワークである。
具体的には、PreferRecは複数の競合する目標間のユーザ固有のトレードオフをインテントレベルで捉えることを目的としている。
Knowledge-Guided Transferは、効率的なユーザ間の知識伝達を容易にする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:04:33 GMT)
DexDrummer: In-Hand, Contact-Rich, and Long-Horizon Dexterous Robot Drumming [28.3] ドラムは自然に手動制御、コンタクトリッチな相互作用、長い水平調整を統合している。
本稿では,DexDrummerについて述べる。DexDrummerは,シミュレート・トゥ・リアル・トランスファーによるシミュレーションで訓練された階層的オブジェクト中心のバイマンダル・ドラム・ポリシーである。
巧妙な操作ポリシーは、指-スティックとスティック-ドラムの相互作用の両方を明示的にモデル化する報酬によって導かれる、コンタクトリッチなダイナミクスを扱う。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:49:06 GMT)
Beyond Viewpoint Generalization: What Multi-View Demonstrations Offer and How to Synthesize Them for Robot Manipulation? [28.2] マルチビューデモは、単一ビューポリシーの成功と一般化を継続的に改善する。
メカニスティック解析は、多視点学習が操作関連視覚表現を促進することを示している。
モノクラー入力から新規ビュー映像を合成するジオメトリ対応の自己教師型フレームワークであるRoboNVSを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:01:15 GMT)
Anatomical Token Uncertainty for Transformer-Guided Active MRI Acquisition [27.8] MRIにおける完全なデータ取得は本質的に遅いため、臨床のスループットが制限され、患者の不快感が増す。
CSMRIは、アンダーサンプルのkspaceデータからイメージを再構成することで、取得を加速しようとしている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:49:23 GMT)
CLEAR: Context-Aware Learning with End-to-End Mask-Free Inference for Adaptive Video Subtitle Removal [27.3] ビデオ字幕削除は、時間的コヒーレンスを維持しながら、背景コンテンツとテキストオーバーレイを区別することを目的としている。
既存の拡散に基づく手法は、トレーニングと推論の段階で明示的なマスクシーケンスを必要とする。
本稿では,文脈認識適応学習を通じて,真にエンドツーエンドの推論を実現するマスクフリーフレームワークであるCLEARを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:23:35 GMT)
Counterfactual Credit Policy Optimization for Multi-Agent Collaboration [27.3] 協調多エージェント大言語モデル(LLM)は、役割を分解し、多様な仮説を集約することで複雑な推論タスクを解くことができる。
本稿では,エージェント固有の学習信号を割り当てるフレームワークであるCCPOを紹介する。
CCPOは、エージェントのコントリビューションを除去して結果をシミュレートする動的反ファクト的ベースラインを構築する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:35:02 GMT)
Uncertainty Quantification for Distribution-to-Distribution Flow Matching in Scientific Imaging [27.2] 分布から分布への生成モデルは、細胞摂動応答のモデル化から、条件を越えた医療画像の翻訳まで、科学的イメージングタスクをサポートする。
不確実性(UQ)に基づくアプローチは、これらのタスクの有望な候補として機能するが、分配分配生成モデルのUQはまだ未定である。
本稿では,Aleatoricおよび不確実性を解消する統一UQフレームワークBayesian Flow Matching(BSFM)を提案する。このFlow Matchingコンポーネントは,拡散項による決定論的フローを拡張し,モデル一般化を未知のシナリオに改善する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:01:02 GMT)
Let's Think with Images Efficiently! An Interleaved-Modal Chain-of-Thought Reasoning Framework with Dynamic and Precise Visual Thoughts [27.2] 本稿では2つの重要なコンポーネントを組み込んだ動的かつ精密なビジュアル思考(DaP-ICoT)を紹介する。
DaP-ICoTは挿入された画像の数を大幅に減少させ、72.6%のトークン消費を減少させた。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:47:44 GMT)
PAM: A Pose-Appearance-Motion Engine for Sim-to-Real HOI Video Generation [27.2] PAM: A Pose-Appearance-Motion Engine for controllable HOI video generation。
DexYCBではFVDが29.13(InterDynは38.83)、MPJPEが19.37mm(CosHandは30.05mm)である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:51:52 GMT)
mSFT: Addressing Dataset Mixtures Overfiting Heterogeneously in Multi-task SFT [27.1] mSFT(mSFT)は、マルチタスクデータ混合のための反復的、過度に適合する検索アルゴリズムである。
10のベンチマークと6のベースモデルで、4つのベースラインを一貫して上回る。
低い計算予算では、mSFTは訓練用FLOPを低下させながら性能を向上させることができる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:01:51 GMT)
SatGeo-NeRF: Geometrically Regularized NeRF for Satellite Imagery [26.9] SatGeo-NeRFは、衛星画像のための幾何学的に規則化されたNeRFである。
これは、現在の最先端モデルで観察される過度に適合する幾何学的アーティファクトを緩和する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:50:26 GMT)
StreamingEval: A Unified Evaluation Protocol towards Realistic Streaming Video Understanding [26.7] StreamingEvalは、現実的な制約の下でビデオ-LLMのストリーミングビデオ理解能力を評価するための統一的な評価フレームワークである。
我々は、歴史的視覚コンテキストを正規化するために固定容量メモリバンクを採用し、アクセス可能な視覚符号化効率、テキスト復号遅延、タスクパフォーマンスを共同評価する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:31:11 GMT)
ACPO: Counteracting Likelihood Displacement in Vision-Language Alignment with Asymmetric Constraints [26.3] 非対称制約参照最適化(ACPO)を提案する。
ACPOは動的でターゲット指向のスケーリングを好みの最適化に適用する。
本稿では,ACPOが標準DPOの選択逆劣化を効果的に逆転させることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:26:11 GMT)
AgenticRec: End-to-End Tool-Integrated Policy Optimization for Ranking-Oriented Recommender Agents [26.3] 本稿では、ランキング指向のエージェントレコメンデーションフレームワークであるAgenticRecを紹介する。
根拠に基づく推論をサポートするために、ReActループに統合されたレコメンデーション固有のツール群を設計する。
本稿では,微粒な嗜好の曖昧さを解決するために,プログレッシブな選好リファインメントを導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:18:56 GMT)
4DGS360: 360° Gaussian Reconstruction of Dynamic Objects from a Single Video [26.3] 4DGS360は、カジュアルモノクロビデオから360ドル周の動的オブジェクト再構成のための拡散フリーフレームワークである。
提案する3DトラッカーであるAnchorTAP3Dは、信頼性の高い2Dトラックポイントをアンカーとして活用することにより、強化された3Dポイントトラジェクトリを生成する。
トレーニングビューとは別に、テストカメラを最大135ドル(約1万3000円)の価格で配置する新しいベンチマークであるiPhone360を紹介します。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:30:46 GMT)
MCLR: Improving Conditional Modeling in Visual Generative Models via Inter-Class Likelihood-Ratio Maximization and Establishing the Equivalence between Classifier-Free Guidance and Alignment Objectives [26.1] 標準復調スコアマッチング(DSM)で訓練された拡散モデルにより,対象データ分布の回復が期待できる。
我々は,授業中にクラス間確率比を明示的に最大化する原理的アライメント目標であるMCLRを提案する。
MCLRで微調整されたモデルは、標準サンプリングの下でCFGライクな改善を示し、推論時ガイダンスを必要とせず、質的および定量的ゲインを同等に達成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:01:47 GMT)
DA-VAE: Plug-in Latent Compression for Diffusion via Detail Alignment [26.0] 我々は、事前訓練された拡散バックボーンの軽量化のみで、事前訓練されたVAEの圧縮比を増加させるtextbfDetail-textbfAligned VAEを提案する。
ウォームスタートの微調整戦略により,従来のモデルよりわずか32ドル安い32ドルトークンをわずか32ドル(約3,200円)で,安定拡散3.5で1024ドル(1024ドル)の画像生成が可能となった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:51:03 GMT)
Tuning Real-World Image Restoration at Inference: A Test-Time Scaling Paradigm for Flow Matching Models [26.0] ResFlow-Tunerは、最先端のフローマッチングモデルであるFLUX.1-devに基づく画像復元フレームワークである。
画像復元に適したトレーニング不要なテスト時間スケーリングパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:33:43 GMT)
AI In Cybersecurity Education -- Scalable Agentic CTF Design Principles and Educational Outcomes [25.9] 本稿では,Cyber Security Awareness Week コンペティションシステム上に構築された Capture-the-Flag コンペティションについて述べる。
我々は3つの自律レベルを定式化している: ループ内人間、自律エージェントフレームワーク、ハイブリッド。
この結果は、LLM支援サイバーセキュリティコンペティションを学習技術として設計するための実用的なガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:05:59 GMT)
Sharper Generalization Bounds for Transformer [25.0] 我々はまず、オフセットのRademacher複雑性の観点からトランスフォーマーの過剰なリスクを表現した。
次に、トランスフォーマー仮説空間の被覆数の上界によって、洗練された過大なリスク境界を導出する。
特徴写像上の有界性仮定を緩和し、理論結果を非有界(準ガウス的)な特徴と重み付き分布を持つ設定に拡張する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:54:52 GMT)
Learning Can Converge Stably to the Wrong Belief under Latent Reliability [25.0] フィードバックの信頼性が観察不能な場合,学習アルゴリズムは不正確な解に安定して収束することを示す。
本研究では、動的学習から信頼性を推定し、遅い時間スケールの信頼変数を通じて更新を変調するモニタ・トラスト・レギュレータフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:28:07 GMT)
Q-Tacit: Image Quality Assessment via Latent Visual Reasoning [24.8] VLM(Vision-Language Model)に基づく画像品質評価(IQA)が大幅に進歩した。
最近の研究は、強化学習(RL)を適用し、アクティブな視覚ツールを活用することで、画像品質の推論を洗練している。
Q-Tacitは、VLMに潜伏した品質空間における自然言語を超えて推論させる新しいパラダイムである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:32:20 GMT)
PA-SFM: Tracker-free differentiable acoustic radiation for freehand 3D photoacoustic imaging [24.7] 3次元(3D)ハンドヘルド光音響トモグラフィは通常、動きのアーティファクトを補正するために、かさばる高価な外部位置センサに依存している。
センサポーズ復元と高忠実度3D再構成の両方に単一モード光音響データのみを利用するトラッカーフリーフレームワークPA-SFMを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:19:45 GMT)
Do World Action Models Generalize Better than VLAs? A Robustness Study [24.7] 視覚言語アクション(VLA)は、様々なロボットタスクで顕著な成功を収めた。
世界行動モデル(WAM)は、将来の状態を予測するために大量のビデオデータに基づいて訓練された世界モデルに基づいて構築される。
LIBERO-Plus と RoboTwin 2.0-Plus のベンチマークにおいて,様々な視覚的・言語的摂動による性能評価を行った。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:13:15 GMT)
Optimal Compilation of Syndrome Extraction Circuits for General Quantum LDPC Codes [24.5] 我々は,任意のqLDPC符号に対して,奥行き最適シンドローム抽出回路を生成する汎用コンパイルフレームワークであるAuto-Stabilizer-Check(ASC)を提案する。
ASCは回路深さを約50%削減し、一般的なqLDPC符号の論理誤差率を平均7×8倍に抑える。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:43:38 GMT)
TAMTRL: Teacher-Aligned Reward Reshaping for Multi-Turn Reinforcement Learning in Long-Context Compression [24.1] マルチTurn Reinforcement Learning(TAMTRL)のための教師対応リワード整形法を提案する。
TAMTRLは、関連する文書を教師の信号として利用し、それらをモデル入力の各ターンに整列させ、正規化確率による報酬を自己監督的に割り当てる。
7つの長文ベンチマークで異なるスケールの複数のモデルを用いた実験は、TAMTRLが強いベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:42:04 GMT)
SparseDVFS: Sparse-Aware DVFS for Energy-Efficient Edge Inference [24.1] 本稿では,エネルギー効率の良いエッジ推論のための細粒度でスパース対応なDVFSフレームワークであるSparseDVFSを提案する。
我々の重要な洞察は、演算子間隔がハードウェア周波数変調の主要な指標であるということである。
SparseDVFSは最先端のソリューションよりも平均78.17%のエネルギー効率向上を実現している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:29:30 GMT)
RuntimeSlicer: Towards Generalizable Unified Runtime State Representation for Failure Management [24.0] メトリクス、トレース、ログは、システム実行時の振る舞いを補完するビューを提供する。
Slicerは、メトリクス、トレース、ログを1つの整列したシステム状態の埋め込みにエンコードするタスクに依存しない表現モデルを事前トレーニングする。
State-Aware Task-Oriented Tuningは、ランタイム状態の教師なしパーティショニングを実行し、ダウンストリームタスクに対する状態条件適応を可能にする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:35:13 GMT)
Efficient Failure Management for Multi-Agent Systems with Reasoning Trace Representation [24.0] 推論トレース表現に基づくマルチエージェントシステムのための効率的な障害管理フレームワークである textbfEAGER を提案する。
EAGERは、教師なし推論スコープによるコントラスト学習を用いて、エージェント内推論とエージェント間調整の両方を符号化する。
3つのオープンソースMASに関する予備評価は、EAGERの有効性を示している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:31:41 GMT)
A Comparative Analysis of LLM Memorization at Statistical and Internal Levels: Cross-Model Commonalities and Model-Specific Signatures [23.8] 記憶は人間とLLMの両方にとってインテリジェンスの基本構成要素である。
以前の研究では、単一のモデルシリーズに焦点が当てられ、シリーズ間で孤立した観察につながった。
本研究では,複数のモデル系列を収集し,その共有あるいはユニークな記憶行動を分析する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:35:19 GMT)
Generalizable Self-Evolving Memory for Automatic Prompt Optimization [23.6] 本稿では,メモリ駆動型最適化フレームワークであるMemAPOを提案する。
MemAPOは推論軌道を再利用可能な戦略テンプレートに蒸留する。
誤った世代を構造化されたエラーパターンに整理し、繰り返し発生する障害モードをキャプチャする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:29:54 GMT)
Disentangling Speaker Traits for Deepfake Source Verification via Chebyshev Polynomial and Riemannian Metric Learning [23.4] 音声深度音源検証システムは、同一音源発生器から2つの合成音声が発するか否かを判定することを目的としている。
本稿ではまず,話者要因が情報源検証に与える影響について検討する。
本稿では,2つの新しい損失関数を組み込んだ話者距離距離学習(SDML)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:05:57 GMT)
Group3D: MLLM-Driven Semantic Grouping for Open-Vocabulary 3D Object Detection [23.3] Group3Dはマルチビューオープンな3D検出フレームワークである。
セマンティック制約を直接インスタンス構築プロセスに統合する。
Group3Dは、多視点オープン3D検出において最先端の性能を達成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:01:14 GMT)
Optimal Solutions for the Moving Target Vehicle Routing Problem with Obstacles via Lazy Branch and Price [23.1] MT-VRP-Oの最適解を求める遅延連続性(Lazy BPRC)を用いた遅延ブランチ・アンド・プライス(Lazy Branch-and-Price)を提案する。
Lazy BPRCは、制限されたマスター問題(RMP)と価格問題とを交互に扱うVRPのブランチ・アンド・プライス・フレームワークを適用している。
以上の結果から,Lazy BPRCは2倍の速度で動作可能であることがわかった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:10:12 GMT)
Unified Spatiotemporal Token Compression for Video-LLMs at Ultra-Low Retention [23.0] ビデオ言語モデル(ビデオ-LLM)は、大量の視覚トークンのために高い計算コストに直面している。
グローバルな選択トークンに意味的類似性を重み付けする統一選択機構を提案する。
選択されていないトークンはクラスタリングとリフィルによってマージされ、情報の整合性を保持する。
我々の統合的時間トークン圧縮戦略は,超低トークン保持下での映像理解における最先端技術を確立する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:15:22 GMT)
GenOpticalFlow: A Generative Approach to Unsupervised Optical Flow Learning [22.6] textbfmodelnameは、完全に整列したフレーム-フローデータペアを合成し、人間のアノテーションを使わずに教師付き光フロートレーニングを行う新しいフレームワークである。
本稿では,生成フレーム内の信頼できない画素を識別・削除するテキスト不整合画素フィルタリング手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:55:52 GMT)
Bridging the Know-Act Gap via Task-Level Autoregressive Reasoning [22.3] 我々は,新たに構築された大規模・学際横断的な問題ベンチマークであるFactyScienceを用いて,包括的解析を行った。
このギャップは,タスク選択とコンテンツ生成を結びつけるトークンレベルの自己回帰に起因していることを示す。
この決定を明示的にモデル化したタスクレベルの自動回帰フレームワークであるDeIllusionLLMを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:43:34 GMT)
EgoGroups: A Benchmark For Detecting Social Groups of People in the Wild [22.2] EgoGroupsは、世界中の都市でソーシャルなダイナミクスをキャプチャする、一人称のビューデータセットだ。
人や社会グループのための密集した人的アノテーションや、リッチな地理的、シーンのメタデータが含まれています。
我々は最先端のVLM/LLMを広範囲に評価し,グループ検出機能に関する教師付きモデルを構築した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:43:49 GMT)
DiT-Flow: Speech Enhancement Robust to Multiple Distortions based on Flow Matching in Latent Space and Diffusion Transformers [22.0] DiT-Flowは、遅延拡散変換器(DiT)のバックボーン上に構築されたフローマッチングベースのSEフレームワークである。
DiT-Flowは、最先端のジェネレーティブSEモデルよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:03:58 GMT)
Towards Secure Retrieval-Augmented Generation: A Comprehensive Review of Threats, Defenses and Benchmarks [21.9] Retrieval-Augmented Generation (RAG)は、大規模言語モデルにおける幻覚とドメイン知識の欠如を、外部知識ベースを組み込むことによって著しく軽減する。
本稿では、その基盤となる脆弱性メカニズムを分析し、データ中毒、敵攻撃、メンバシップ推論攻撃などのコア脅威ベクトルを体系的に分類する。
潜在的なリスクについて深い洞察を得ることにより、この研究は、高度に堅牢で信頼性の高い次世代RAGシステムの開発を促進することを目指している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:32:59 GMT)
Motion Semantics Guided Normalizing Flow for Privacy-Preserving Video Anomaly Detection [21.8] ビデオ異常検出は、インテリジェントな監視と法医学的分析のためのマルチメディアシステムにおいて重要な課題である。
本稿では,骨格に基づくVADを階層的な動作セマンティックスモデリングに分解する動作セマンティックスガイド正規化フロー(MSG-Flow)を提案する。
MSG-Flowは、それぞれ88.1%と75.8%のAUCで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:45:44 GMT)
CoRA: Boosting Time Series Foundation Models for Multivariate Forecasting through Correlation-aware Adapter [21.8] CoRrelation-aware Adapter (CoRA)は、時系列基礎モデル(TSFM)による微調整のみを必要とする軽量なプラグアンドプレイ方式である。
複雑化を抑えるため,相関行列を低ランクの時間変化成分に分解する。
いくつかのチャネルにのみ現れる正の相関と負の相関を学習するために、新しい二重対比学習法を導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:13:02 GMT)
FreeArtGS: Articulated Gaussian Splatting Under Free-moving Scenario [21.4] FreeArtGS は,自由移動シナリオ下での明瞭なオブジェクトの再構築手法である。
自由移動部分のセグメンテーションとジョイント推定とエンドツーエンドの最適化を組み合わせる。
我々は,2つのベンチマークと実世界の自由移動音場実験を行った。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:32:16 GMT)
Image-Conditioned Adaptive Parameter Tuning for Visual Odometry Frontends [21.3] 資源に制約のある自律ロボットは、疎直かつ半直接的なビジュアル・オドメトリー(VO)パイプラインに依存している。
VOパラメータのオンラインチューニングのための最初の画像条件強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:26:25 GMT)
VIGIL: Part-Grounded Structured Reasoning for Generalizable Deepfake Detection [21.1] 本稿では、専門家の法医学的実践に触発された、部分中心の構造化法医学的枠組みであるVIGILを紹介する。
ステージゲート注入機構は、試験中のみ、部分レベルの法医学的証拠を提供する。
OmniFakeとクロスデータセットの評価実験により、VIGILはエキスパート検出器と同時MLLM法の両方で一貫して性能が向上していることが示された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:35:36 GMT)
On the Number of Conditional Independence Tests in Constraint-based Causal Discovery [20.6] より複雑な$pmathcalO(s)$テストを実現するアルゴリズムを提案する。
制約に基づくアルゴリズムは、少なくとも2(s)$条件付き独立性テストを実行しなければならない。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:33:43 GMT)
Brain-CLIPLM: Decoding Compressed Semantic Representations in EEG for Language Reconstruction [20.2] コントラスト学習と文再構成により,脳波からテキストへのデコーディングを意味的アンカー抽出に分解するフレームワークを提案する。
Brain-CLIPLMは、67.55%のトップ5と85.00%のトップ25の文章検索精度を達成し、直接デコードベースラインを著しく上回っている。
脳波からテキストへのデコーディングは、全文を再構築するよりも、圧縮されたセマンティックコンテンツを復元する方がよいことが示唆された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:45:51 GMT)
Towards Multimodal Time Series Anomaly Detection with Semantic Alignment and Condensed Interaction [20.0] 時系列異常検出は多くの力学系において重要な役割を果たす。
従来の手法は主に単調な数値データに依存していた。
我々は,新しいマルチモーダル時系列異常検出モデル(MindTS)を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:18:23 GMT)
Mamba-VMR: Multimodal Query Augmentation via Generated Videos for Precise Temporal Grounding [19.9] テキスト駆動ビデオモーメント検索(VMR)は、未トリミングビデオに隠された時間的ダイナミクスが限られているため、依然として困難である。
既存のアプローチでは、サブタイトルコンテキストと時間的事前生成を効果的に統合できない。
時間的接地強化のための新しい2段階フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:44:48 GMT)
Holistic Scaling Laws for Optimal Mixture-of-Experts Architecture Optimization [19.9] 本稿では,全体的MoEアーキテクチャ最適化のための再利用可能なフレームワークを提案する。
まず、トークン当たりのFLOPsはMoEモデルにとって不適切な公平度指標であることを示す。
次に、16次元のアーキテクチャ探索空間を2つの連続的な低次元位相に縮小する。
我々のフレームワークは、あらゆる計算予算を完全な最適化されたMoEアーキテクチャにマッピングする堅牢なスケーリング法則を生み出します。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:51:35 GMT)
BadminSense: Enabling Fine-Grained Badminton Stroke Evaluation on a Single Smartwatch [19.8] adminSenseはスマートウォッチベースのシステムで、ウェアラブルセンサーを使ってきめ細かいバドミントンのパフォーマンス分析を行う。
経験豊富な12人の素人のバドミントンストロークデータセットを収集した。
BadminSenseは、ストロークをセグメントし、分類し、ストロークの品質を予測し、オフザシェルフスマートウォッチの振動信号を使ってシャトルの衝突位置を推定する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:07:05 GMT)
A Near-Raw Talking-Head Video Dataset for Various Computer Vision Tasks [19.7] トーキングヘッドビデオはリアルタイムコミュニケーションにおける主要なコンテンツタイプである。
我々は847件のトーキングヘッド記録のほぼRAWデータセットをオープンソース化した。
このデータセットは、これまでで最大規模のトーキングヘッドWebカメラデータセットのスケールを5ドルタイムで提供する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 20:51:35 GMT)
Feature Incremental Clustering with Generalization Bounds [19.4] アクティビティ認識システムなどの多くの学習システムでは、インスタンスの属性は徐々に蓄積され、データが徐々に拡大する特徴空間に格納される。
理論的に保証されたアルゴリズムを設計し、この特別なタイプのデータストリームを効果的にクラスタ化する方法(一般にアクティビティ認識と呼ばれる)は、まだ探索されていない。
データアクセスの異なる状況に対応する4種類の特徴増分クラスタリング(FIC)アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:35:31 GMT)
Spectral Alignment in Forward-Backward Representations via Temporal Abstraction [18.9] 前方後方表現は連続空間における後続表現(SR)を学習するための強力なフレームワークを提供する。
基本的なスペクトルミスマッチは、連続環境の高階遷移ダイナミクスとFBアーキテクチャの低階ボトルネックの間にしばしば存在する。
時間的抽象は、高周波スペクトル成分を抑圧する低域通過フィルタとして機能することを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:27:29 GMT)
When Exploration Comes for Free with Mixture-Greedy: Do we need UCB in Diversity-Aware Multi-Armed Bandits? [18.5] 明示的な UCB 型最適化を伴わない簡単な emphMixture-Greedy 戦略はより高速に収束し,より優れた性能が得られることを示す。
透明な構造条件下では、多様性を意識した目的は内部混合物を好んで暗黙的な探索を引き起こす。
これらの結果は,多様性を意識したモデル選択のためのマルチアーム帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:59:45 GMT)
Probing How Scalable Table Data Enhances General Long-Context Reasoning [18.4] 周期構造を持つ構造化テーブルデータから,長文推論の可能性が示唆された。
高品質で多種多様で検証可能な構造化テーブルデータを合成するための,シンプルでスケーラブルなパイプライン(TableLong)を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:05:46 GMT)
CAPTCHA Solving for Native GUI Agents: Automated Reasoning-Action Data Generation and Self-Corrective Training [18.4] ReCAPはCAPTCHA対応のネイティブGUIエージェントで、現代的なインタラクティブなCAPTCHA課題を堅牢に解決することができる。
我々は,大規模CAPTCHAインタラクショントラジェクトリを生成する自動データ収集とキュレーションパイプラインを開発した。
CAPTCHAの解法は、しばしば多段階の相互作用と中間ミスからの回復を必要とするため、失敗トラジェクトリを利用して自己補正データを構築する。
ホールドアウトテストセット全体で、ReCAPはCAPTCHA解決の成功を約30%から80%に改善し、一般的なGUIエージェントベンチマークでは高いパフォーマンスを維持している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:35:59 GMT)
Deep S2P: Integrating Learning Based Stereo Matching Into the Satellite Stereo Pipeline [18.3] 衛星画像からのデジタル表面モデル生成は、地球観測における中核的な課題である。
最近の学習ベースのステレオマーカは、標準ベンチマークで最先端のパフォーマンスを達成する。
我々は、StereoAnywhere、MonSter、Foundation Stereo、衛星微調整されたMonSterを衛星ステレオパイプラインに統合する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:11:17 GMT)
Single-Trajectory Gibbs Sampling for Non-Commuting Observables [18.0] 量子多体系の熱期待値の推定は物理学、化学、材料科学における中心的な課題である。
標準量子ギブズサンプリングプロトコルは、測定毎にギブズ状態をスクラッチから作成することで、このタスクに対処する。
単軌道ギブスサンプリング citejiang2026の最近の進歩は、このオーバーヘッドを大幅に減らした。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:44:17 GMT)
TrajLoom: Dense Future Trajectory Generation from Video [17.8] 本稿では,過去の映像から将来の軌跡や軌跡を予測するフレームワークを提案する。
最先端手法と比較して,提案手法は24フレームから81フレームまでの予測地平線を延長する。
予測された軌道は、下流のビデオ生成と編集を直接サポートする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:10:58 GMT)
Reasoning or Rhetoric? An Empirical Analysis of Moral Reasoning Explanations in Large Language Models [17.7] 13個のLCMから600以上の応答を分類するために,3つの判定モデルで検証したLCM-as-judgeスコアパイプラインを用いた。
応答は,モデルのサイズ,アーキテクチャ,あるいはプロンプト戦略によらず,従来の推論と圧倒的に一致している。
最も印象的なことに、モデルのサブセットは道徳的な疎結合を示しており、これは論理的不整合の形で、規模を超えて継続し、戦略を推進している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:43:49 GMT)
Off-Policy Evaluation for Ranking Policies under Deterministic Logging Policies [17.7] オフ・ポリティ・アセスメント(OPE)は、ランキングシステムにおいて重要な実践的問題である。
目標は、異なるログポリシの下で収集されたオフラインデータのみを使用して、新たなランキングポリシのパフォーマンスを見積もることである。
本稿では,この課題に対処するために,ユーザクリック動作の本質性を活かしたClick-based Inverse Propensity Score (CIPS) を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:13:39 GMT)
mmFHE: mmWave Sensing with End-to-End Fully Homomorphic Encryption [17.6] mmFHEは、完全な同相暗号(FHE)をエンド・ツー・エンドのmmWaveレーダーセンシングに利用するための最初のシステムである。
mmFHEは、軽量エッジデバイス上で生のレンジプロファイルを暗号化し、信頼できないクラウド上で、mmWave信号処理とML推論パイプライン全体を実行する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:09:01 GMT)
Model Predictive Control with Differentiable World Models for Offline Reinforcement Learning [17.3] モデル予測制御(MPC)にインスパイアされた推論時間適応フレームワークを提案する。
ポリシーパラメータを最適化するために推定時情報を利用すると、強いオフラインRLベースラインよりも一貫した利得が得られることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:05:29 GMT)
Extending Precipitation Nowcasting Horizons via Spectral Fusion of Radar Observations and Foundation Model Priors [16.8] 降水の流し込みは、災害の軽減と航空安全に不可欠である。
既存のアーキテクチャでは、気象基盤モデルによって予測される気象変数をレーダー画像と気象データで再現することができない。
PW-FouCastはPangu-Weather予測をフーリエベースバックボーン内のスペクトル先行値として活用する新しい周波数領域融合フレームワークである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:05:51 GMT)
Can a Robot Walk the Robotic Dog: Triple-Zero Collaborative Navigation for Heterogeneous Multi-Agent Systems [16.4] Triple Zero Path Planning (TZPP)は、異種マルチロボットシステムのための協調的なフレームワークである。
TZPPは、ゼロトレーニング、ゼロ事前知識、ゼロシミュレーションを必要とする。
TZPPは、目立たないシナリオに頑健で、人間の互換性のある効率と強力な適応性を実現する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:12:45 GMT)
SkillClone: Multi-Modal Clone Detection and Clone Propagation Analysis in the Agent Skill Ecosystem [16.2] エージェントスキルのための最初のマルチモーダルクローン検出手法であるSkillCloneを提案する。
SkillClone-Bench では、SkillClone は 0.939 の F1 を精度 0.952 で達成し、平坦な TF-IDF を上回っている。
SkillCloneを20Kスキルに適用すると、すべてのスキルの75%が258Kクローンペアで、40%が著者の境界を越えたことが分かる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:17:17 GMT)
Suiren-1.0 Technical Report: A Family of Molecular Foundation Models [16.0] Suiren-1.0は3つの特殊変種(Suiren-Base, Suiren-Dimer, Suiren-ConfAvg)から構成される。
Suiren-1.0は、様々なタスクにまたがって最先端の結果を確立する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:59:43 GMT)
Training-Free Diffusion-Driven Modeling of Pareto Set Evolution for Dynamic Multiobjective Optimization [15.8] 本稿では,DMOPのトレーニング自由拡散に基づく動的応答機構DD-DMOEAを提案する。
膝点に基づく補助戦略を用いて、新しい環境における対象領域を特定する。
CEC2018の動的多目的ベンチマークの実験により、DD-DMOEAは競争力またはより良い収束・分散性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:09:58 GMT)
SSAM: Singular Subspace Alignment for Merging Multimodal Large Language Models [15.5] トレーニングフリーモデルマージフレームワークとして,SSAM(Singular Subspace Alignment and Merging)を提案する。
SSAMは独立に訓練された専門家MLLMを、入力モダリティの組み合わせを扱える単一のモデルに統一する。
マルチモーダルなトレーニングデータを使用しないSSAMは、4つのデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:24:52 GMT)
Understanding LLM Performance Degradation in Multi-Instance Processing: The Roles of Instance Count and Context Length [15.3] 大規模言語モデル(LLM)は、複数のドキュメントを処理するか、複数のインスタンスで分析を行うために使用される。
本稿では,LLMが個々にエクササイズするタスクに対して,LLMの能力を評価する。
その結果、全てのLLMは少数のインスタンスに対してわずかに性能劣化のパターンを辿り、続いてより大きなインスタンス数でパフォーマンスが崩壊することがわかった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:13:15 GMT)
Demystifying Reinforcement Learning for Long-Horizon Tool-Using Agents: A Comprehensive Recipe [15.2] 我々は,報酬形成,モデルスケーリング,データ構成,アルゴリズムの選択,環境安定性の5つの軸に沿ってエージェントRL設計空間を分解する。
蒸留法に基づいて,我々のRL学習モデルはTravelPlannerの最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:40:08 GMT)
EvoIdeator: Evolving Scientific Ideas through Checklist-Grounded Reinforcement Learning [15.2] EvoIdeatorは、RLトレーニング目標とtextbfchecklist-grounded feedbackを整合させることにより、科学的アイデアの進化を促進するフレームワーク
Qwen3-4B上に構築されたEvoIdeatorは、重要な科学的指標において、はるかに大きなフロンティアモデルより優れている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:15:26 GMT)
Distilling the knowledge with quantum neural networks [15.0] 量子ニューラルネットワーク(Quantum Neural Networks, QNN)は、量子コンピューティングモデルの将来的なクラスであり、潜在的な量子優位性を持つ。
ここでは,大規模システム上でよく訓練されたQNNを,同様の構成でより小さなアーキテクチャに蒸留する方法を示す。
量子ビット数と回路深度の観点から,知識蒸留がQNNのトレーニングコストの低減に役立つことを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:30:14 GMT)
Overfitting and Generalizing with (PAC) Bayesian Prediction in Noisy Binary Classification [14.9] 2進分類のためのPAC-Bayes型学習ルールについて検討し、ランダム化'後'予測器の学習誤差とKL偏差とのバランスをとる。
この研究は、PACベイズ型学習ルールの離散的な先行性のみを考慮したZhu氏とSrebro氏[2025]による以前の研究を拡張した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:43:52 GMT)
Surfacing and Applying Meaning: Supporting Hermeneutical Autonomy for LGBTQ+ People in Taiwan [14.9] 2019年に台湾が同性結婚を合法化した後も、LGBTQ+コミュニティはソーシャルメディア上で敵意に直面し続けている。
医療的不公平と自律性のレンズを用いて、LGBTQ+個人のアイデンティティ探索、物語探索、コミュニティのレジリエンスに技術的条件がどう影響するかを検討する。
我々は、参加者が敵対的な物語を再構成し、生きた経験を検証し、足場を特定できるようなAIシステムを開発し、ソーシャルメディアの敵意をナビゲートするハーメネティカルな労力を減らす。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:57:06 GMT)
Causal Evidence that Language Models use Confidence to Drive Behavior [14.6] 内部信頼度推定は適応行動のキーシグナルとして機能する。
モデルがこれらの信号を積極的に利用して行動を制御するかを検討する。
我々は、内部信頼表現としきい値に基づく政策の協調操作から、棄権が生じることを見出した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:23:31 GMT)
SHARP: Spectrum-aware Highly-dynamic Adaptation for Resolution Promotion in Remote Sensing Synthesis [14.5] リモートセンシング画像は、車両、建物輪郭、道路標識などの空撮リアリズムに不可欠な微細構造を符号化する。
Rotary Position Embedding (RoPE) 再スケーリングによるトレーニング不要の解決促進は、実用的な対策を提供するが、既存の方法はすべて、デノナイジングプロセス全体を通して静的な位置スケーリングルールを適用している。
有理分数時間スケジュールk_rs(t)をRoPEに導入する訓練自由手法であるSHARP(Spectrum-aware Highly-dynamic Adaptation for Resolution promoted)を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:25:45 GMT)
SARe: Structure-Aware Large-Scale 3D Fragment Reassembly [14.3] 3Dフラグメントの再組み立ては、共通のオブジェクト座標系において、秩序のないフラグメントポイント雲やメッシュの剛性的なポーズを復元することを目的としている。
既存のエンドツーエンドアプローチは、信頼できない接触推論のために障害をカスケードする傾向がある。
本研究では、ユークリッド空間アセンブリ生成のためのSARe-Genと推論時間改善のためのSARe-Refineを用いた生成フレームワークであるStructure-Aware Reassembly(SARe)を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:13:14 GMT)
PPGL-Swarm: Integrated Multimodal Risk Stratification and Hereditary Syndrome Detection in Pheochromocytoma and Paraganglioma [14.3] Pheochromocytomas and paragangliomas (HBLs) は稀な神経内分泌腫瘍であり,5年生存率は34%であった。
PPGLは、より厳格で、シンドローム特異的な治療と監視を必要とする遺伝性症候群を示す。
本稿では,総合的な報告を生成するエージェントPPGL診断システムであるPPGL-Swarmについて述べる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:37:53 GMT)
FeatDistill: A Feature Distillation Enhanced Multi-Expert Ensemble Framework for Robust AI-generated Image Detection [14.2] FeatDistillは、特徴蒸留とマルチエキスパートアンサンブルを統合する、AI生成の画像検出フレームワークである。
NTIRE Challenge on Robust AI-Generated Image Detection in the Wildのために開発された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:55:31 GMT)
HumanOmni-Speaker: Identifying Who said What and When [14.1] 現在のモデルは、従来のベンチマークにおける視覚バイアスを利用して、真のクロスモーダルアライメントをバイパスしている。
本稿では,視覚登録話者ダイアリゼーションと認識(VR-SDR)とHumanOmni-Speaker Benchmarkを紹介する。
人間のOmni-Speakerは強いマルチモーダルな相乗効果を示し、エンドツーエンドの唇読みと高精度な空間的位置決めを可能にする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:42:40 GMT)
Mixture of Mini Experts: Overcoming the Linear Layer Bottleneck in Multiple Instance Learning [14.0] MIL(Multiple Instance Learning)は、ギガピクセル全体の画像を計算病理学で分類する主要なフレームワークである。
MAMMOTHは,パラメータの総数に対して最小限の変更を施した任意のMILモデルの性能向上を図ったモジュールである。
全体として、MAMMOTHは152の検査済み構成のうち130でパフォーマンスを改善し、平均的なパフォーマンスは3.8%である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:57:43 GMT)
On the Challenges and Opportunities of Learned Sparse Retrieval for Code [13.9] SPLADE-Codeは、コード検索に特化した学習スパース検索モデルの最初の大規模ファミリである。
本研究では,SPLADE-Codeが1Bパラメータ下での検索者間の最先端性能を実現することを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:14:08 GMT)
Parameter-Efficient Fine-Tuning for Medical Text Summarization: A Comparative Study of Lora, Prompt Tuning, and Full Fine-Tuning [13.5] 本稿では, PubMed の医用要約データセット上で, Flan-T5 モデルファミリ間のローランド適応 (LoRA), プロンプト調整 (Prompt Tuning), フルファインチューニング (Full Fine-Tuning-a across the Flan-T5 model family) の3つの適応手法を比較した。
LoRAはフル微調整で43.52 +/- 0.18 ROUGE-1をFlan-T5-Largeで達成し、フル微調整では40.67 +/- 0.21に比べてわずか0.6%のトレーニング可能なパラメータしか達成できなかった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:35:11 GMT)
Select, Label, Evaluate: Active Testing in NLP [13.5] アクティブテスト(Active Testing)は、アノテーションの最も有益なテストサンプルを選択するフレームワークである。
ラベル付け予算が与えられたら、モデルのパフォーマンスを最も見積もるサブセットを選択することを目的としています。
実験では、最大95%のアノテーションの削減を示し、パフォーマンス推定精度は、完全なテストセットから1%以内である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:28:57 GMT)
Back to Point: Exploring Point-Language Models for Zero-Shot 3D Anomaly Detection [13.4] ゼロショット(ZS)3次元異常検出は信頼性の高い産業検査に不可欠である。
既存のアプローチでは、3Dポイントクラウドを2Dイメージにレンダリングし、異常検出のためにトレーニング済みのビジョンランゲージモデル(VLM)を活用する。
我々は、3Dポイントクラウドとテキスト埋め込みを効果的に整合させる新しいフレームワークであるBTPを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:59:00 GMT)
Hardening Confidential Federated Compute against Side-channel Attacks [13.3] 当社のFederated Computeプラットフォームでは、仮説的なインサイダーが、差分プライバシー保証を回避するために利用する、一連のサイドチャネルを特定しています。
オープンソースライブラリに実装されているサイドチャネルのうちの2つをDPが緩和する方法を示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 01:13:17 GMT)
Mirage The Illusion of Visual Understanding [13.2] 本稿では,これらのシステムがどのように処理し,視覚情報を統合するのかという仮定に挑戦する3つの知見を報告する。
画像入力がなければ、モデルは一般的なマルチモーダルベンチマークと医療ベンチマークで驚くほど高いスコアを獲得します。
我々は、マルチモーダルAIシステムの公平かつ視覚的な評価のための原則的ソリューションとしてB-Cleanを紹介した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:18:09 GMT)
Identity as Presence: Towards Appearance and Voice Personalized Joint Audio-Video Generation [13.0] 高忠実度パーソナライゼーションを実現するために,アイデンティティ対応のジョイントビデオ生成のための統合フレームワークを提案する。
具体的には、音声と視覚のモダリティにまたがるペアアノテーションを用いて、IDを含む情報を自動抽出するデータキュレーションパイプラインを導入する。
顔の外観と声帯が同一性を持つ制御信号として機能する単一・多目的シナリオに対する柔軟でスケーラブルなID注入機構を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:54:14 GMT)
On the Interplay of Priors and Overparametrization in Bayesian Neural Network Posteriors [12.8] オーバーパラメトリゼーションと先行処理を併用してBNN後部を再構成する方法について検討した。
冗長性は後部幾何学を根本的に再形成する3つの重要な現象をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:36:13 GMT)
SPA: A Simple but Tough-to-Beat Baseline for Knowledge Injection [12.8] SPA(Scaling Prompt-Engineered Augmentation, SPA)は,少ない設計のプロンプトを用いて知識注入のための大規模合成データを生成する,シンプルだが強靭なベースラインである。
以上の結果から,知識注入においては,手軽な大規模拡張を併用した慎重なプロンプト設計が驚くほど効果的であることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:11:43 GMT)
Rethinking Multimodal Fusion for Time Series: Auxiliary Modalities Need Constrained Fusion [12.8] 核融合戦略を持つマルチモーダルモデルは、しばしば単調TSモデルよりも性能が低いことを示す。
このような統合を制御するために設計された制約付き融合法を提案する。
さまざまなデータセットとTS/テキストモデルにまたがって20K以上の実験を行います。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:44:46 GMT)
Structured Visual Narratives Undermine Safety Alignment in Multimodal Large Language Models [12.7] 単純な3パネルの視覚的物語の中に有害な目標を埋め込むコミック・テンポレート・ジェイルブレイクについて研究する。
ComicJailbreakは、コミックベースのジェイルブレイクベンチマークであり、10の有害カテゴリと5つのタスク設定にまたがる1,167の攻撃インスタンスがある。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:32:09 GMT)
Lemma Discovery in Agentic Program Verification [12.6] 帰納的検証は、検証条件(VC)を抽出し、それらの公式な証明を書くことによって、コードに対して強い正当性を保証する。
VC証明の専門知識集約的なタスクは、このプロセスの主要なボトルネックであり、最近のLarge Language Model (LLM)エージェントの進歩により部分的に自動化されている。
私たちは、プログラム検証のためのVCの証明は純粋に数学的タスク以上のものであり、プログラムの理解からかなりの恩恵を受けると主張している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:42:07 GMT)
Decoupling Exploration and Policy Optimization: Uncertainty Guided Tree Search for Hard Exploration [12.5] 本稿では,探査段階におけるRLの活用と回避を明確に分離する新たなパラダイムを提案する。
政策最適化のオーバーヘッドを取り除くことにより,本手法は,ハードなAtariベンチマーク上での本質的なモチベーションベースラインよりも,桁違いに効率よく探索する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:56:52 GMT)
Neyman-Pearson multiclass classification under label noise via empirical likelihood [12.5] ナイマン・ピアソン・マルチクラス分類(Nyman-Pearson Multiclass classification、NPMC)フレームワークは、クラス固有のエラー確率に上限を課しながら、重み付けされた誤分類リスクを最小限にすることでこの問題に対処する。
本研究では, 学習データにノイズラベルのみが存在する場合のNPMC問題について検討し, 指数傾斜密度比モデルを用いて, ノイズラベルと真のラベルの分布を関連づける経験的可能性(EL)に基づく手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:39:09 GMT)
GeoFlow: Real-Time Fine-Grained Cross-View Geolocalization via Iterative Flow Prediction [12.4] 現在の手法では、高精度なモデルがリアルタイム使用には遅いため、難しいトレードオフを余儀なくされている。
この精度と速度のトレードオフを断ち切る軽量で高効率なフレームワークを提供する新しいアプローチであるGeoFlowを紹介します。
KITTIとVIGORデータセットの実験では、GeoFlowが最先端の効率を実現し、29FPSのリアルタイム速度で実行されていることが示されている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:59:53 GMT)
Overview of TREC 2025 Biomedical Generative Retrieval (BioGen) Track [12.4] 大規模言語モデル(LLM)の最近の進歩は、複数のバイオメディカルタスクで大きく進歩している。
これらのモデルは、複雑なバイオメディカル情報の処理と合成において強力な能力を示している。
これらの進歩にもかかわらず、LLMをバイオメディカルで使用する場合、幻覚や折り畳みは依然として重要な課題である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:10:16 GMT)
LLM-Based Test Case Generation in DBMS through Monte Carlo Tree Search [12.4] MISTは、階層的な特徴木を構成するフィーチャーガイドのエラー駆動テストケースシンセタイズと、モンテカルロ木検索ベースのテストケースミューテーションの2つのステージで構成されている。
MISTは平均4本のラインカバレッジ、32.3%のファンクションカバレッジ、49.3%のラインカバレッジを達成している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:42:17 GMT)
LipsAM: Lipschitz-Continuous Amplitude Modifier for Audio Signal Processing and its Application to Plug-and-Play Dereverberation [12.3] 本稿では、音声信号を扱うための一般的なアーキテクチャである振幅変調器(AM)について考察し、そのLipschitz-Continuous variantを提案し、これをLipsAMと呼ぶ。
AMがリプシッツ連続であることの十分条件を証明し、LipsAMの例として2つのアーキテクチャを提案する。
提案手法をLug-and-Playアルゴリズムに適用し,その安定性を数値実験により実証した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:15:45 GMT)
AdditiveLLM2: A Multi-modal Large Language Model for Additive Manufacturing [11.7] この研究は、Gemma 3モデルの命令チューニング版に基づいて構築されたドメイン適応の大規模言語モデルであるAdditiveLLM2を提示する。
データセット(AdditiveLLM2-OA)は、ドメイン適応型事前学習および視覚的命令チューニングプロセスのために抽出されたデータを含むオープンアクセス付加的な製造ジャーナル記事からなる。
開発したモデルは、言語と視覚に基づくタスクの習熟度を示し、一般的な添加性製造知識の90%以上を達成している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:28:10 GMT)
CFMS: Towards Explainable and Fine-Grained Chinese Multimodal Sarcasm Detection Benchmark [11.6] CFMSは中国のソーシャルメディア向けに開発された,初の微細なマルチモーダルサルカムデータセットである。
精細な説明アノテーションは、明示的なサーカシックな意図による画像生成において、AIを効果的に導く。
従来の検索手法の制約を克服するため,強化学習型インコンテキスト学習戦略を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:55:14 GMT)
Not All Layers Are Created Equal: Adaptive LoRA Ranks for Personalized Image Generation [11.6] 低ランク適応(LoRA)は、事前訓練された拡散モデルからパーソナライズされた画像を生成するための事実上の微調整戦略である。
この課題を克服するための第一歩として、各レイヤのランクを、被検体の微調整中に自由に適応させることがあります。
我々は、位階に重んじる秩序を課し、効果的に上位の位階を創出することを奨励することで達成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:13:47 GMT)
SynSym: A Synthetic Data Generation Framework for Psychiatric Symptom Identification [11.6] ソーシャルメディア上での精神症状の特定は、ユーザーが作成した投稿からきめ細かいメンタルヘルス症状を推測することを目的としている。
大規模な症状レベルデータセットの構築は、エキスパートラベリングの資源集約性のため、依然として困難である。
症状識別のための一般化可能なデータセットを構築するための合成データ生成フレームワークであるSynSymを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:41:41 GMT)
When the Abyss Looks Back: Unveiling Evolving Dark Patterns in Cookie Consent Banners [11.5] そこで本研究では,学習パターンと新たに発達した9つのパターンの両方を検出する,同意プラットフォーム管理システム(CMPBRA)を提案する。
当社は、EU、米国、トップランクのグローバルドメインにまたがる14,000のWebサイトを対象に、大規模なコンプライアンス指向の測定を実施しています。
我々の結果は、進化したダークパターンが普及していることを示している: 取り消しはしばしば妨害され、クッキーは同意前または明示的な拒否にもかかわらず設定され、オプトアウトインターフェースはサードパーティの追跡を妨げないことが多い。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:12:49 GMT)
SLURP-TN : Resource for Tunisian Dialect Spoken Language Understanding [11.5] Spoken Language Understanding (SLU) は、ユーザクエリの音声発話から意味情報を抽出することを目的としている。
このデータセットは、6つのSLURPドメインから手動で翻訳されたチュニジア方言で55の母語話者が文章を発する記録によって作成された。
また,SLUTP-TNを利用した音声認識およびSLUモデルの開発も行っている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:59:11 GMT)
MEVIUS2: Practical Open-Source Quadruped Robot with Sheet Metal Welding and Multimodal Perception [11.3] MEVIUS2はオープンソースの四足歩行ロボットで、サイズはBoston DynamicsのSpotに匹敵する。
鋼板溶接と金属加工を利用して, 大型で耐久性の高いボディ構造を実現した。
我々は,MEVIUS2が様々な地形を横切ることができることを実験的に検証し,その環境認識能力を実証した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:36:16 GMT)
Ara-Best-RQ: Multi Dialectal Arabic SSL [11.3] Ara-BEST-RQ(アラビア語: Ara-BEST-RQ)は、アラビア語の音声処理のための自己教師付き学習モデルである。
我々はコンバータをベースとしたBEST-RQモデルを6億パラメータまで事前訓練する。
モデルは方言識別(DID)と自動音声認識(ASR)タスクに基づいて評価される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:23:31 GMT)
Characterizing High-Capacity Janus Aminobenzene-Graphene Anode for Sodium-Ion Batteries with Machine Learning [11.3] ナトリウムイオン電池は、高容量、低動作電圧、高速Naイオン輸送、機械的安定性を組み合わせた陽極を必要とする。
そこで我々は,全電子密度汎関数理論計算とともにスプーッキーネット機械学習力場(MLFF)を用いてアミノベンゼン官能化ジャナスグラフェンのNa蓄積を特徴づける。
我々はJanus aminobenzene-grapheneを高容量Na-イオン陽極として有望かつ構造的に定義した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:45:26 GMT)
Allometric Scaling Laws for Bipedal Robots [11.0] 足の長さの3桁にわたる二足歩行ロボットに対して、同様のアロメトリスケーリング法則を生成する。
全てのロボットにおいて、歩行速度は動的類似性から期待されるL(1/2)傾向に従う。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 20:43:03 GMT)
TDEC: Deep Embedded Image Clustering with Transformer and Distribution Information [10.9] 本稿では,TDECと呼ばれる深層画像クラスタリング手法を提案する。
TDECは、画像クラスタリングのための特徴表現、次元的嗜好、ロバストな割り当てを考える。
我々の手法は堅牢で、データサイズ、クラスタの数、コンテキストの複雑さをより柔軟にできます。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:46:42 GMT)
CNMBI: Determining the Number of Clusters Using Center Pairwise Matching and Boundary Filtering [10.9] 我々はデータ空間に固有の分布情報を利用するCNMBIという手法を提案する。
異なるサンプルは異なる信頼度を持ち、したがって信頼度の低いサンプルを積極的に除去する。
CNMBIは堅牢で、ターゲットデータの寸法と形状をより柔軟にすることができる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:43:03 GMT)
TagLLM: A Fine-Grained Tag Generation Approach for Note Recommendation [10.9] そこで我々は,ノートレコメンデーションのための微粒なタグ生成手法であるTagLLMを提案する。
TagLLMはUser Interest Handbookを通じてノートカテゴリーのユーザー関心をキャプチャする。
タッグ知識蒸留法は, 競合生成能力を持つ小型モデルを装備するために開発された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:01:00 GMT)
A Context Engineering Framework for Improving Enterprise AI Agents based on Digital-Twin MDP [10.8] オフライン強化学習(RL)によるLCMベースのエンタープライズエージェント改善のための軽量・モデルに依存しないフレームワークを提案する。
提案されているDT-MDP (DT-MDP-CE) フレームワークは、3つの主要なコンポーネントから構成されている。
ケーススタディでは、IT自動化の企業指向ドメインにおいて、このフレームワークを代表的タスクに適用する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:15:42 GMT)
Do Papers Match Code? A Benchmark and Framework for Paper-Code Consistency Detection in Bioinformatics Software [10.8] 本稿では,48件のバイオインフォマティクスソフトウェアプロジェクトの集合を整理し,紙コード整合性検出という新たなタスクを提案する。
本稿では,自然言語記述とコード実装のセマンティックな関係をモデル化するクロスモーダル一貫性検出フレームワークを提案する。
実験の結果,本フレームワークはバイオインフォマティクスにおける論文とコード間の整合性を効果的に同定し,精度0.9056,F1スコア0.8011を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:28:14 GMT)
IGV-RRT: Prior-Real-Time Observation Fusion for Active Object Search in Changing Environments [10.7] 本研究では,不確実性を認識したシーン先行状況とオンライン目標関連度推定を組み合わせた確率的計画手法を提案する。
このフレームワークは、2層セマンティックマッピングモジュールとリアルタイムプランナーを含んでいる。
提案手法は, 対象再配置の影響を効果的に軽減し, 探索効率の向上と成功率の向上を実現する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:14:26 GMT)
Precision-Varying Prediction (PVP): Robustifying ASR systems against adversarial attacks [10.2] 推論中にASRモデルの精度を変更すると、敵攻撃が成功する可能性が低下する。
この事実を利用して、予測中の精度の単純なランダムサンプリングによってモデルをより堅牢にする。
実験により、ロバスト性および競合検出性能が著しく向上したことが示された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:29:33 GMT)
Auction-Based Task Allocation with Energy-Conscientious Trajectory Optimization for AMR Fleets [10.1] 本稿では,非対称なタスク空間におけるマルチロボットタスク割り当てと軌道最適化のためのフレームワークを提案する。
2-20のロボットと3つの工場レイアウトで最大100のタスクを持つ505のシナリオでは、エネルギーベースのオークションと距離ベースのオークションの両方が平均11.8%の省エネを実現している。
その結果, ほぼ均一な地形における距離入札と, 摩擦変動が顕著な場合のエネルギー認識入札が得られた。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:58:25 GMT)
GeoFusion-CAD: Structure-Aware Diffusion with Geometric State Space for Parametric 3D Design [10.1] CAD(Parametric Computer-Aided Design)は、現代の3Dモデリングの基本である。
既存のメソッドは長いコマンドシーケンスを生成するのに苦労する。
スケーラブルかつ構造対応な生成のためのエンドツーエンド拡散フレームワークであるGeoFusion-CADを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:41:39 GMT)
Wake Up to the Past: Using Memory to Model Fluid Wake Effects on Robots [10.1] 媒体を摂動させることで移動を可能にする自律的な空中水生ロボットは、隣接するロボットの障害となるウェイクエフェクトを発生させる。
ウェイク効果は、流体のカオス力学のためにモデル化し予測することが困難である。
本研究では、流体を介する2つのロボット間の相互作用を正確にモデル化するために、覚醒効果予測器が満たさなければならない特性について実証的研究を行う。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:40:00 GMT)
DTVI: Dual-Stage Textual and Visual Intervention for Safe Text-to-Image Generation [10.1] テキスト・ツー・イメージ(T2I)拡散モデルは、強力な生成能力を示すが、安全でないコンテンツを生成する可能性には、重大な安全上の懸念が生じる。
我々は,安全なT2I生成のための2段階推論時防衛フレームワークDTVIを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:41:11 GMT)
Climate Prompting: Generating the Madden-Julian Oscillation using Video Diffusion and Low-Dimensional Conditioning [9.9] Generative Deep Learningは、熱帯のマデン・ジュリア振動(MJO)をモデル化するための強力なツールである。
本稿では,大気再分析を基礎としたビデオ拡散モデルを提案し,鍵となる低次元測定値に条件付き長大なMJO配列を合成する。
次に、故意に理想化された低次元条件付けに基づいて、よりトラクタブルなMJOを生成するようモデルに促す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:47:17 GMT)
Verify Implementation Equivalence of Large Models [9.9] 本稿では,大規模モデル実装のグラフ上での実装等価性をチェックするためのフレームワークであるEmergeを紹介する。
手動でルールを書く代わりに、Emergeは2つの実装をEグラフで表現し、実行値から候補関係を推測し、要求に応じて書き直しルールを合成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:39:56 GMT)
Nonlinear Electro-Optic Visible Photonic Circuits for Solid-State Quantum Defects [9.6] モノリシック薄膜のニオブ酸リチウム(TFLN)プラットフォームは、周期的なポーリング周波数変換とGHz帯域電気光学(EO)スイッチングを統合している。
この装置は、消光比(ER)42.2dBの1mWを超えるオフチップのグリーンライト電力を供給する。
高速な能動操作で十分な非線形光発生を統一することにより、高速な量子通信ノードを実現するためのスケーラブルなフレームワークを確立する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:45:28 GMT)
Cross-Modal Reinforcement Learning for Navigation with Degraded Depth Measurements [9.5] 我々は、クロスモーダルな一貫性を強制することによって共有潜在表現を学習するクロスモーダルなワッサースタインオートエンコーダを導入する。
学習された表現は、非構造環境における衝突のないナビゲーションのための強化学習ベースのポリシーと統合される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:45:03 GMT)
Early Discoveries of Algorithmist I: Promise of Provable Algorithm Synthesis at Scale [9.3] Algorithmistは、GitHub Copilot上の自律的な研究者エージェントである。
プライベートデータ分析およびクラスタリングにおける研究レベルのタスクについて評価する。
結果は,LLMシステムが各データセットやデプロイメント設定に合わせて,研究論文品質のアルゴリズムアーティファクトを生成する新たなパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:06:55 GMT)
FedCVU: Federated Learning for Cross-View Video Understanding [9.3] フェデレートラーニング(FL)は、プライバシー保護のためのマルチカメラビデオ理解のための有望なパラダイムとして登場した。
FLをクロスビューシナリオに適用することは、(i)不均一な視点と背景が、高度に非IIDクライアントの配布につながること、(ii)局所的な分布バイアスが、不整合表現を引き起こすこと、(iii)大規模なビデオアーキテクチャが、禁止的な通信オーバーヘッドを引き起こすこと、の3つの大きな課題に直面します。
我々は,VS-Norm,CV-Align,軽量コントラスト正規化モジュール,SLAの3つのコンポーネントからなるフェデレーションフレームワークであるFedCVUを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:26:55 GMT)
Statistical Testing Framework for Clustering Pipelines by Selective Inference [9.3] データ分析パイプラインを用いて得られたクラスタリング結果の意義を評価するための新しい統計的テストフレームワークを提案する。
提案試験は,任意の名目レベルでI型エラー率を制御し,その妥当性と有効性を示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:03:27 GMT)
Compressive single-pixel imaging via a wavelength-multiplexed spatially incoherent diffractive optical processor [9.2] 圧縮SPIを実装するために, 波長多重・空間非コヒーレントな回折光学プロセッサと, 小型・浅層デジタル人工ニューラルネットワーク(ANN)の組み合わせを提案する。
単画素検出器は、各照明帯域の出力スペクトル電力を捕捉し、共同で訓練されたデジタルANNによって迅速に復号され、入力画像の再構成を行う。
この研究は、バイオメディカルイメージング、自律デバイス、リモートセンシングなどの応用に有用な圧縮SPIの計算画像フレームワークを実証する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 00:30:28 GMT)
Thermal Topology Collapse: Universal Physical Patch Attacks on Infrared Vision Systems [9.1] ユニバーサル・フィジカル・パッチ・アタック(UPPA)は、赤外線領域における最初のユニバーサル・フィジカル・アタック法である。
UPPAは、オンラインの計算オーバーヘッドなしに、卓越した物理的攻撃の成功率を達成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:08:06 GMT)
CrowdGaussian: Reconstructing High-Fidelity 3D Gaussians for Human Crowd from a Single Image [9.1] CrowdGaussianは、複数の人物による3Dガウススティング(3DGS)表現を直接再構成する統合フレームワークである。
CrowdGaussianは、多人数シーンのフォトリアリスティック、幾何学的コヒーレントな再構成を生成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:09:12 GMT)
A Blueprint for Self-Evolving Coding Agents in Vehicle Aerodynamic Drag Prediction [9.0] 本稿では, 産業制約下でのドラッグ係数$C_d$を予測するために, 実行可能サロゲートパイプラインを検出する自己進化型符号化エージェントの契約中心の青写真を提案する。
この方法は、静的モデルインスタンスではなく、プログラム上の制約付き最適化としてサロゲート発見を定式化する。
厳しい評価契約は、任意の候補が承認される前に、漏洩防止、決定論的リプレイ、マルチシード、ロバスト性、資源予算を強制する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:36:57 GMT)
HortiMulti: A Multi-Sensor Dataset for Localisation and Mapping in Horticultural Polytunnels [9.0] HortiMultiは、商業用イチゴとラズベリーのポリタンネルで、成長期全体にわたって収集されたクロスシーズンデータセットである。
我々は、時間同期生測、校正ファイル、参照軌跡、視覚、LiDAR、マルチセンサーSLAMのためのベースラインベンチマークをリリースする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:39:32 GMT)
The Reasoning Error About Reasoning: Why Different Types of Reasoning Require Different Representational Structures [8.9] 異なるタイプの推論は、表現システムに異なる構造的要求を課す。
これらの要求の体系的な説明は、心理学、AI、心の哲学にわたって存在しない。
表現システムの4つの構造特性を同定する枠組みを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:25:19 GMT)
The Presupposition Problem in Representation Genesis [8.9] 大規模言語モデルは、表現生成を明示的に行わずに高い認知性能を達成する最初のシステムである。
それまでの認知システムは、我々がそれを調べる前に既にこの移行をしており、心の哲学は説明的対象ではなく背景条件として扱われていた。
本稿では,新しい理論ではなく概念的診断を行い,この問題の構造を確立し,このパターンを避けるための最小2つの条件を導出する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:37:33 GMT)
Sim-to-Real of Humanoid Locomotion Policies via Joint Torque Space Perturbation Injection [8.9] 提案手法は前方シミュレーション中に入力関節トルクに状態依存性の摂動を注入する。
これらの摂動は、標準パラメータのランダム化よりも幅広い現実のギャップをシミュレートするように設計されている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:43:16 GMT)
When Documents Disagree: Measuring Institutional Variation in Transplant Guidance with Retrieval-Augmented Language Models [8.9] 固形臓器移植のための患者教育材料は、米国中央で大きく異なる。
検索強化言語モデルを用いて,異なるセンターのハンドブックに同一の患者質問を根拠とする枠組みを導入する。
20.8%の非存在対比較が臨床的に有意な相違を示すことが判明した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 00:42:40 GMT)
Towards Automated Community Notes Generation with Large Vision Language Models for Combating Contextual Deception [8.8] 画像に基づく文脈偽造に対するコミュニティノートの自動生成手法について検討する。
主に偽造検出に焦点を当てた以前の作業とは異なり、Community Notesスタイルのシステムは簡潔で接地的なメモを生成する必要がある。
大規模な視覚言語モデル上に構築された検索拡張型マルチエージェント協調フレームワークであるACCNoteを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:21:23 GMT)
ADaFuSE: Adaptive Diffusion-generated Image and Text Fusion for Interactive Text-to-Image Retrieval [8.8] 拡散拡張I-TIRの多モードビューの調整と校正を目的とした軽量融合モデルであるADaFuSEを提案する。
ADaFuSEは,Hits@10では最大3.49%,パラメータは5.29%向上した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:13:57 GMT)
Guideline-grounded retrieval-augmented generation for ophthalmic clinical decision support [8.7] Oph-Guid-RAGは眼科臨床質問応答と意思決定支援のためのマルチモーダルビジュアルRAGシステムである。
各ガイドラインページを独立したエビデンス単位として扱い、ページイメージを直接検索し、テーブル、フローチャート、レイアウト情報を保存する。
このシステムは、クエリ分解、クエリ書き換え、検索、再ランク付け、マルチモーダル推論を統合し、ガイドラインページ参照でトレース可能な出力を提供する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:47:34 GMT)
CAPITU: A Benchmark for Evaluating Instruction-Following in Brazilian Portuguese with Literary Context [8.7] CAPITUは、ブラジルポルトガル語でLLM(Large Language Models)の命令追従能力を評価するためのベンチマークである。
ベンチマークは59の命令タイプを7つのカテゴリに分類し、すべて自動的に検証できるように設計されている。
シングルターンおよびマルチターン設定における18の最先端モデルを評価する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:16:54 GMT)
Confidence-Based Decoding is Provably Efficient for Diffusion Language Models [8.5] 拡散言語モデル (DLM) は、言語モデリングのための自己回帰モデル (AR) に代わる有望な代替品として登場した。
DLMにおける信頼度に基づく復号化のための理論解析フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:43:21 GMT)
Neural Structure Embedding for Symbolic Regression via Continuous Structure Search and Coefficient Optimization [8.5] SRCOはシンボリックレグレッションのための統合埋め込み駆動フレームワークである。
記号構造を連続で最適化可能な表現空間に変換する。
合成および実世界のデータセットの実験により、我々の手法は方程式の正確性、堅牢性、探索効率において最先端の手法を一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:04:03 GMT)
Language Models Can Explain Visual Features via Steering [8.4] オートエンコーダは視覚モデルで何千もの機能を発見したが、人間の介入を必要とせずにこれらの機能を説明することは、まだオープンな課題である。
空画像提供後の視覚エンコーダにおける視覚言語モデルの構造と個別SAE特徴を利用する。
言語モデルに「何が見えるか」を説明し、各機能で表される視覚概念を効果的に引き出す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:37:00 GMT)
Show Me What You Don't Know: Efficient Sampling from Invariant Sets for Model Validation [8.3] 本稿では,繊維から抽出した特徴抽出器を解析する手法を提案する。
我々のアルゴリズムはトレーニング不要であり、事前訓練された拡散モデルやフローマッチングモデルを利用する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:24:58 GMT)
Asymptotically Ideal Hierarchical Secret Sharing Based on CRT for Integer Ring [8.3] 階層的な秘密共有(HSS)スキームが開発され、すべての参加者を複数のサブセットに分割し、それぞれに個別の特権レベルを割り当てた。
既存の中国のRemainder Theorem(CRT)ベースのHSSスキームは、フレキシブルなシェアサイズから恩恵を受けるが、セキュリティ上の欠陥を示すか、$frac12$以下の情報レートを持つ。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:18:07 GMT)
Asymptotically Ideal Conjunctive Hierarchical Secret Sharing Scheme Based on CRT for Polynomial Ring [8.3] Conjunctive Hierarchical Secret Sharing (CHSS)は、参加者を複数の異なる階層レベルに分割する秘密共有の一種である。
既存の中国のRemainder Theorem(CRT)ベースのCHSSスキームは、セキュリティ上の脆弱性があるか、情報レートが$frac12$より低いかのいずれかである。
本研究では,CRTをリングと片方向関数に利用し,一様完全CHSSスキームを構築する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:08:22 GMT)
Investigating Technical Debt Types, Issues, and Solutions in Serverless Computing [8.1] 本研究は,Stack Overflow(SO)を知識ベースとして,サーバレスコンテキストにおける技術的負債(TD)を調査することを目的とする。
我々は、SO上で78,867のサーバーレス質問を収集し、深層学習を用いてTDまたは非TDとラベル付けした。さらに、サーバーレス設定におけるTDの種類、関連する問題、提案されたソリューションを詳細に分析した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:49:52 GMT)
Three Creates All: You Only Sample 3 Steps [8.0] そこで本研究では,MTEO(Multi-layer Time Embedding Optimization, MTEO)を提案する。
多様なデータセットとバックボーンにわたる実験は、数ステップのサンプリングにおいて最先端のパフォーマンスを示し、蒸留法と軽量法のギャップを著しく狭めている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:13:53 GMT)
In-network Attack Detection with Federated Deep Learning in IoT Networks: Real Implementation and Analysis [8.0] IoT(Internet of Things)とそのバックボーンネットワークとの統合は、セキュリティ侵害のリスクを高めている。
大量のデータを中央サーバに転送する必要がある従来の集中的な異常検出アプローチは、プライバシ、スケーラビリティ、レイテンシの制限に悩まされている。
本稿では,リソース制約のあるエッジデバイスへの展開を目的とした,軽量なオートエンコーダに基づく異常検出フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:46:28 GMT)
One Model, Two Markets: Bid-Aware Generative Recommendation [7.9] 本稿では,商品関連性と収益化目標を直接生成シーケンスに統合する統合フレームワークを提案する。
制御トークンを導入し、どの項目から広告を表示するかの決定を分離する。
また,リアルタイムな価格設定処理を行うBid-Aware Decoding機構を考案し,推論プロセスに直接入札を注入し,高価値項目に対する評価を行う。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:27:59 GMT)
MARCUS: An agentic, multimodal vision-language model for cardiac diagnosis and management [7.9] 現在のAIビジョン言語モデルは単一のモダリティ入力に限られており、非インタラクティブである。
MARCUSは心電図,心エコー図,心磁気共鳴画像(CMR)の終末解釈のためのエージェントビジョン言語システムである。
MARCUSは、多段階言語モデル最適化とドメイン訓練された視覚エンコーダを統合し、マルチモーダルオーケストレータによってコーディネートされる、モダリティ固有の視覚言語エキスパートモデルからなる階層型エージェントアーキテクチャを採用している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:42:11 GMT)
Evolutionary Biparty Multiobjective UAV Path Planning: Problems and Empirical Comparisons [7.7] 無人航空機(UAV)は都市ミッションで広く使用されている。
効率部門と安全部門の両方にかかわる双方向多目的UAV経路計画(BPMO-UAVPP)の問題をモデル化した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:57:51 GMT)
FormalEvolve: Neuro-Symbolic Evolutionary Search for Diverse and Prover-Effective Autoformalization [7.6] 我々は、意味的に一貫性のあるレパートリーの予算付きテストタイム検索として、オートフォーマル化を定式化する。
本稿では,コンパイル型ニューロシンボリック進化フレームワークであるFormalEvolveを提案する。
CombiBenchとProofNetでは、FormalEvolveは58.0%と84.9%のセマンティックヒット率(SH@100)に達し、セマンティック成功のクロスプロブレム濃度を低下させる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:21:46 GMT)
LGSE: Lexically Grounded Subword Embedding Initialization for Low-Resource Language Adaptation [7.6] 本稿では,新しいトークンの埋め込みを初期化するための形態的情報セグメント化を導入したLexically Grounded Subword Embedding Initializationフレームワークを提案する。
ランダムなベクトルや任意のサブワードを使う代わりに、LGSEは単語を構成形態素に分解し、意味的に一貫性のある埋め込みを構成する。
質問応答、名前付きエンティティ認識、テキスト分類の3つのNLPタスクにおいて、LGSEを2つの形態的にリッチで低リソースな言語で評価する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:07:16 GMT)
Q-AGNN: Quantum-Enhanced Attentive Graph Neural Network for Intrusion Detection [7.6] 本稿では、侵入検知のための量子拡張検知型グラフネットワークQ-AGNNを提案する。
Q-AGNNはパラメタライズド量子回路(PQC)を利用して、マルチホップ近傍情報を高次元の潜在空間にエンコードする。
大規模実験により,Q-AGNNは最先端のグラフベース手法と比較して,競合性や優れた検出性能を示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:07:54 GMT)
Modeling Quantum Federated Autoencoder for Anomaly Detection in IoT Networks [7.6] 我々は,IoTネットワークにおける効率,セキュア,分散処理に量子フェデレーション学習を活用するフレームワークである,異常検出のための量子フェデレーションオートエンコーダを提案する。
提案手法は,データプライバシを確保しつつ,集中型アプローチに匹敵する異常検出精度と堅牢性を実現する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:15:53 GMT)
The Universal Normal Embedding [7.4] 生成モデルと視覚エンコーダは、異なる目標に最適化され、異なる数学的原理に基礎を置いている。
我々は両者が共用潜伏源であるUniversal Normal Embedding (UNE)の見解であると仮定する。
本稿では,DDIM逆拡散雑音とマッチングエンコーダ表現からなる画像ごとの潜伏音のデータセットであるNossZooを紹介する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:28:14 GMT)
EviSearch: A Human in the Loop System for Extracting and Auditing Clinical Evidence for Systematic Reviews [7.3] EviSearchは臨床エビデンステーブルのためのマルチエージェント抽出システムである。
パイプラインはマルチモーダルエビデンスソース間の高精度抽出のために設計されている。
EviSearchは、生きた体系的なレビューを加速し、手作業によるキュレーションの負担を軽減し、LCMベースの抽出をエビデンス合成パイプラインに統合するための安全で監査可能なパスを提供することを目的としている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:36:54 GMT)
SHAPE: Structure-aware Hierarchical Unsupervised Domain Adaptation with Plausibility Evaluation for Medical Image Segmentation [7.2] 非教師付きドメイン適応(Unsupervised Domain Adaptation, UDA)は、様々な臨床環境に医療セグメンテーションモデルを配置するために不可欠である。
SHAPE(Structure-Aware Hierarchical Unsupervised Domain Adaptation with Plausibility Evaluation)は、グローバルな解剖学的妥当性に対する適応を再構築するフレームワークである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:25:56 GMT)
Deep Reinforcement Learning and The Tale of Two Temporal Difference Errors [7.0] 時間差(TD)誤差の解釈は必ずしも等価ではないことを示す。
特に,より非線形な深部RLアーキテクチャは,これらのTD誤差の解釈によって,より異なる数値が得られることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:43:36 GMT)
Boundary Floquet Control of Bulk non-Hermitian Systems [6.7] 非エルミート系は、エルミート的な設定を超えた非平衡現象の工学と制御のための強力なプラットフォームを提供する。
熱力学極限におけるバルクスペクトルと力学の駆動周波数依存性を統一的に記述した非エルミート系の一般理論を開発する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:00:10 GMT)
MineRobot: A Unified Framework for Kinematics Modeling and Solving of Underground Mining Robots in Virtual Environments [6.6] 地下の採掘ロボットは、トレーニング、計画、デジタルツイン用途のために仮想環境(VE)でますます運用されている。
VEにおける地下地雷ロボットのキネマティクスをモデル化・解決するための統合フレームワークであるemphMineRobotについて述べる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:53:26 GMT)
Mixture of Demonstrations for Textual Graph Understanding and Question Answering [6.6] MixDemoは、様々な質問コンテキスト下で最も有益なデモを選択するためのMixture-of-Experts (MoE)メカニズムで強化された新しいGraphRAGフレームワークである。
検索したサブグラフのノイズを軽減するために,クエリに最も関連性の高い情報に選択的に出席するクエリ固有グラフエンコーダを導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:23:16 GMT)
Sketch2CT: Multimodal Diffusion for Structure-Aware 3D Medical Volume Generation [6.6] 構造認識型3D医療ボリューム生成のための多モード拡散フレームワークであるSketch2CTを紹介する。
そこで我々は,局所的なテキストキューでスケッチ機能を洗練し,グローバルなスケッチテキスト表現を統合する2つの重要なモジュールを提案する。
公開CTデータセットの実験により、Sketch2CTはマルチモーダル医療ボリュームの生成において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:14:44 GMT)
PGR-Net: Prior-Guided ROI Reasoning Network for Brain Tumor MRI Segmentation [6.6] 脳腫瘍のMRIセグメント化のためのPGR-Net(Prior-Guided ROI Reasoning Network)を提案する。
腫瘍病変の分布とスケール特性を捉えるために、データ駆動型空間事前セットが組み込まれている。
従来の8.64Mパラムを使用し、89.02%、91.82%、89.67%のDiceスコアを達成している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:45:20 GMT)
AwesomeLit: Towards Hypothesis Generation with Agent-Supported Literature Research [6.5] AwesomeLitは、人間とエージェントによる協調的な視覚化システムである。
ユーザーが馴染みのないトピックを探索し、有望な研究方向を特定し、研究結果の信頼性を向上させるのに役立つ。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:51:14 GMT)
LLMON: An LLM-native Markup Language to Leverage Structure and Semantics at the LLM Interface [6.5] LLM ネイティブなマークアップ言語 LLMON を導入し,テキストの構造と意味的メタデータを LLM に自然な方法で伝達できるようにする。
この情報はモデルトレーニング、モデルプロンプト、推論実装で使用することができ、モデル精度、安全性、セキュリティが改善される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:27:35 GMT)
What Do World Models Learn in RL? Probing Latent Representations in Learned Environment Simulators [6.4] アーキテクチャ的に異なる2つの世界モデル(IRISとDIAMOND)に解釈可能性技術を適用した。
両モデルともゲーム状態変数の線形デオード可能な表現を開発する。
IRISアテンションヘッドの分析は空間的特殊化を明らかにし、特定のヘッドはゲームオブジェクトと重複するトークンに優先的に出席する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:00:53 GMT)
Stabilizing Iterative Self-Training with Verified Reasoning via Symbolic Recursive Self-Alignment [6.4] Neuro-Symbolic Recursive Self-Alignmentはシンボル検証サブシステムを組み込むことで反復的自己訓練を安定化する。
NSRSAは各演算をシンプシーで検証し、推論ステップ間で論理フローの整合性をチェックし、ドメインの制約を強制する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:25:56 GMT)
Deterministic Hallucination Detection in Medical VQA via Confidence-Evidence Bayesian Gain [6.3] マルチモーダル大言語モデル(MLLM)は、医用視覚質問応答(VQA)の強力な可能性を示している。
それらは、入力画像に矛盾する反応を発生させ、臨床的な設定で重大なリスクを生じさせる、幻覚の傾向を保ち続ける。
セマンティック・エントロピー (SE) や視覚増幅セマンティック・エントロピー (VASE) のような現在の幻覚検出法は、セマンティック・クラスタリングのための外部自然言語推論モデルとともに1サンプルにつき10世代から20世代を必要とする。
サンプリングも外部モデルもタスクも不要な決定論的検出法を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:29:53 GMT)
Multimodal Training to Unimodal Deployment: Leveraging Unstructured Data During Training to Optimize Structured Data Only Deployment [5.9] モデルを作成しながらトレーニング中に非構造化EHRデータを活用するマルチモーダル学習フレームワークを導入する。
提案モデルではAUROC0.705に到達し,構造化ベースライン0.656を上回った。
これらの結果は、トレーニング中に非構造化データを組み込むことで、構造化EHRデータ内のタスク関連情報を識別するモデルの能力を高めることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:48:52 GMT)
Generating and Evaluating Sustainable Procurement Criteria for the Swiss Public Sector using In-Context Prompting with Large Language Models [5.8] 公共調達(Public procurement)とは、公共セクター機関が商品やサービスを取得する過程のこと。
スイスの法律は、生態学的、社会的、経済的持続可能性要件を緩やかな評価に統合する必要がある。
高レベルの持続可能性規制を具体的、検証可能、セクター固有の調達基準に翻訳することは、労働集約的でエラーを起こしやすい手作業のままである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:21:35 GMT)
OmniFM: Toward Modality-Robust and Task-Agnostic Federated Learning for Heterogeneous Medical Imaging [5.8] OmniFMは、分類、セグメンテーション、超解像、視覚的質問応答、マルチモーダル融合のトレーニングを統一するモダリティおよびタスクに依存しないFLフレームワークである。
実世界のデータセットの実験では、OmniFMは最先端のFLベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:38:08 GMT)
Steering Sparse Autoencoder Latents to Control Dynamic Head Pruning in Vision Transformers (Student Abstract) [5.7] 視覚変換器(ViT)における動的ヘッドプルーニングは、冗長なアテンションヘッドを除去することで効率を向上する。
既存のプルーニングポリシーは解釈と制御が難しいことが多い。
本研究では,スパースオートエンコーダと動的プルーニングを統合した新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:08:19 GMT)
A Vision Language Model for Generating Procedural Plant Architecture Representations from Simulated Images [5.7] 植物構造と機能に関するシミュレーションに基づく研究のための重要なツールとして,3次元の手続き型植物アーキテクチャモデルが登場している。
画像から3Dプラントアーキテクチャを生成する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:50:17 GMT)
SkillRouter: Retrieve-and-Rerank Skill Selection for LLM Agents at Scale [5.5] ユーザタスクが与えられた大きなプールから,最も関連性の高いスキルを取得するためには,スキルルーティングが必要である。
その実用的重要性にもかかわらず、スキル・ルーティングは未探索のままである。
Skillは2段階のレシーブ・アンド・リロードパイプラインで、合計1.2Bのパラメータしか持たない。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:23:59 GMT)
Physics-Aware Diffusion for LiDAR Point Cloud Densification [5.4] 本稿では, 密度化を生成ではなく確率的改善として扱う枠組みを提案する。
粗い事前に部分拡散(SDEdit)を利用することで、156msで高忠実度が得られる。
提案手法は,KITTI-360およびnuScenesにおける最先端の成果を達成し,市販の3D検出器を再訓練せずに直接増強する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:45:16 GMT)
NuHF Claw: A Risk Constrained Cognitive Agent Framework for Human Centered Procedure Support in Digital Nuclear Control Rooms [5.4] 本研究は,デジタル原子力事業におけるリスク管理型人間中心自律性を実現する,持続的認知リスクエージェントフレームワークであるNuHF Clawを提案する。
その中核となる方法論的革新は、リスク制約されたエージェントランタイムの導入であり、これは認知状態の推測と確率論的安全性の評価とを密に結合している。
結果は、自動化駆動運転から認知認識自律への根本的なシフトを強調し、次世代の核制御環境へのインテリジェントエージェントの安全な統合のための原則化された経路を提供する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:47:42 GMT)
Agentic Automation of BT-RADS Scoring: End-to-End Multi-Agent System for Standardized Brain Tumor Follow-up Assessment [5.4] 脳腫瘍報告・データシステム(BT-RADS)は、びまん性グリオーマ患者のMRI後反応評価を標準化する。
本研究では、BT-RADSの自動分類のためのエンドツーエンドのマルチエージェント・大規模言語モデル(LLM)と畳み込みニューラルネットワーク(CNN)システムについて検討する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:31:54 GMT)
More Isn't Always Better: Balancing Decision Accuracy and Conformity Pressures in Multi-AI Advice [5.3] マルチAIコンサルテーションは人間の意思決定を改善するが、その条件は未定である。
参加者はAIのパネルからアドバイスを受けた3つのタスクで実験を行った。
高いコンセンサスによって過度な信頼がもたらされ、従順な単一の不満が圧力を減らした。
人間のようなプレゼンテーションは、コンフォニティ・プレッシャーを上昇させることなく、特定のタスクにおける知覚の有用性とエージェンシーを高めた。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:17:05 GMT)
Multiperspectivity as a Resource for Narrative Similarity Prediction [5.2] 同じテキストの異なる、等しく有効な読解は、異なる解釈を生じさせ、したがって異なる類似性判断を生じさせる。
本稿では,予測システムの意思決定プロセスに,このマルチスペクティビティを取り入れることを提案する。
実験はSemEval-2026 Task 4で行われ、精度は0.705。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:32:40 GMT)
EnterpriseLab: A Full-Stack Platform for developing and deploying agents in Enterprises [5.2] エンタープライズ環境でプライバシを保存するAIエージェントをデプロイするためのクローズドループフレームワークであるEnterpriseLabを紹介します。
EnterpriseArenaは、IT、人事、営業、エンジニアリングドメインにまたがる15のアプリケーションと140以上のツールによるインスタンス化です。
その結果,エンタープライズLab内でトレーニングされた8Bモデルは,複雑な企業におけるGPT-4oのパフォーマンスと一致し,推論コストを8~10倍に削減した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:50:35 GMT)
Confidential Databases Without Cryptographic Mappings [5.0] FEDBは、暗号操作をクリティカルパスから削除する新しいCDB設計である。
このパラダイムシフトは、業界標準ベンチマークのランタイムオーバーヘッドを最大78.0倍に削減する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:26:09 GMT)
MISApp: Multi-Hop Intent-Aware Session Graph Learning for Next App Prediction [5.0] マルチホップセッショングラフ学習に基づく次世代アプリ予測のためのプロファイルフリーフレームワークMISAppを提案する。
MISAppは、異なる構造範囲で遷移依存をキャプチャするために、マルチホップセッショングラフを構築する。
実験によると、MISAppは標準設定とコールドスタート設定の両方で競争ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:30:45 GMT)
Reasoning Systems for Semantic Navigation in Mobile Robots [4.8] 本稿では,セマンティックナビゲーションのパラダイムに対する2つの解決策を提案する。
1つはリレーショナルデータベース、もう1つはKnowRobをベースにしている。
両システムを質的,定量的に比較し,概念実証としての移動ロボットの実装を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:33:51 GMT)
To Agree or To Be Right? The Grounding-Sycophancy Tradeoff in Medical Vision-Language Models [4.7] 医用領域に適応した視覚言語モデル(VLM)は,視覚的質問応答ベンチマークにおいて高い性能を示した。
最も幻覚率の低いモデルは最もサイコファンである。
以上より,これらのモデルが臨床応用に有用となるためには,両特性の同時評価が必要であることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:51:54 GMT)
Toward Faithful Segmentation Attribution via Benchmarking and Dual-Evidence Fusion [4.7] 本稿では、Pascal VOC上で、介入に基づく忠実度、ターゲット外リーク、実行時、再現可能なベンチマークを提案する。
本稿では、地域レベルの干渉信号と証拠を融合させる軽量な補正であるDual-Evidence Attribution(DEA)を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:52:00 GMT)
Programming Manufacturing Robots with Imperfect AI: LLMs as Tuning Experts for FDM Print Configuration Selection [4.7] ファステッド・デポジション・モデリング(FDM)3Dプリンティングは、製造ロボットがプロセスの専門知識を得るために不完全なAIをいかに活用できるかのケーススタディである。
LLMをチューニングの専門知識の源泉として扱うモジュール式クローズドループアプローチを提案する。
LLM誘導ループは、100のThingi10kパーツ上で78%のオブジェクトに対して、0%のケースで最高の構成を実現しています。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:42:46 GMT)
A Job I Like or a Job I Can Get: Designing Job Recommender Systems Using Field Experiments [4.6] 我々は,空き時間の価値が作業者に提供するユーティリティと,アプリケーションが成功する確率の2つの次元に依存する,アプリケーション段階の求人モデルを開発する。
以上の結果から,単純な求職フレームワークに予測ツールを組み込むことで,実質的な福祉的利益を伴うレコメンデーションルールが得られることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:37:06 GMT)
Single-Subject Multi-View MRI Super-Resolution via Implicit Neural Representations [4.5] SIMS-MRI(Single-Subject Implicit Multi-View Super-Resolution for MRI)を紹介する。
SIMS-MRIは、前処理や後処理を必要とせず、単一の患者からの異方性マルチビュースキャンのみで動作する。
提案手法は,複数解像度のハッシュ符号化された暗黙表現と学習されたビュー間アライメントを組み合わせることで,空間的に一貫した等方的再構成を生成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:00:18 GMT)
Cluster-Specific Predictive Modeling: A Scalable Solution for Resource-Constrained Wi-Fi Controllers [4.5] 本論文は、管理Wi-Fiネットワークにおける予測モデリング最適化の総合的解析について述べる。
この研究は、メモリと計算資源に制約された中央コントローラによって管理される大規模環境において予測アルゴリズムをデプロイする際の課題に対処する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:21:45 GMT)
Neural network approach to mitigating intra-gate crosstalk in superconducting CZ gates [4.4] 超伝導トランスモン量子ビット系のためのロバスト制御パルスを生成する物理誘導型ニューラルネットワークフレームワークを提案する。
ハードウェア認識パラメータ化とハミルトンインフォームドの目的を組み合わせることで、PGNCは滑らかで物理的に実現可能なパルスへの探索を推し進める。
その結果、名目的条件と摂動条件の両方において、一貫性があり、事実上有意義な改善が見られた。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:55:42 GMT)
Future-Interactions-Aware Trajectory Prediction via Braid Theory [4.3] 本稿では,軌道予測タスクと並行して行われる新しい補助タスクである編曲予測を提案する。
編み込み予測タスクが将来の認識意図をモデルに注入し,より正確な共同予測を実現する方法を示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:38:15 GMT)
Non-Markovian renormalization of optomechanical exceptional points [4.2] 我々は,非マルコフ的機械散逸がレッドサイドバンド駆動を持つ線形化された光学系における例外点にどのように影響するかを考察する。
選択した非Ohmic メカニカルバスに対しては,擬似モードマッピングを用いてメモリ異常点の解析条件を導出する。
非マルコビアン性は空洞反射スペクトルを調節し,光学的に誘起される透明度低下をより浅くすることを示した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:56:32 GMT)
Adversarial Vulnerabilities in Neural Operator Digital Twins: Gradient-Free Attacks on Nuclear Thermal-Hydraulic Surrogates [4.2] 運用者学習モデルは、原子力とエネルギーシステムのためのデジタルツインの予測コアとして浮上している。
神経オペレーターは、境界条件に対する感受性を生かした極端にスパースな摂動に対して非常に脆弱であることを示す。
本研究は,演算子学習モデルにおいてこれまで見過ごされていた攻撃面を明らかにし,これらのモデルが標準検証以上の保証を必要とすることを確かめるものである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:35:17 GMT)
Dicke materials as a resource for quantum squeezing [4.2] 我々は、低エネルギー物理をディックモデルで効果的に記述できる磁性材料について研究する。
このような物質にDickeモデルが出現するのは、高速分散スピンと低分散スピンの共存によるものである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:00:19 GMT)
Enhancing Document-Level Machine Translation via Filtered Synthetic Corpora and Two-Stage LLM Adaptation [4.1] 大きな言語モデル(LLM)は文脈情報のモデリングに優れており、文書レベルの翻訳タスクに自然に適合する。
LLMを付加した文書レベルのデータを利用した2段階の微調整手法を提案する。
まず、豊富な文レベルのMTリソースを微調整し、次にフィルタリングされた文書レベルのコーパスを微調整する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:48:22 GMT)
From Brittle to Robust: Improving LLM Annotations for SE Optimization [4.1] 人間の専門知識が乏しい場合、SE研究者は大きな言語モデル(LLM)に欠けているラベルを尋ねることがある。
この課題に対処するために,SynthCore と呼ばれる新しい LLM プロンプト戦略を提案する。
一つの意見が失敗すると、SynthCoreはLLMによって生成された複数の分離された意見と、数発の学習者のアンサンブルを結合する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:42:15 GMT)
Cognitive Training for Language Models: Towards General Capabilities via Cross-Entropy Games [3.9] 本稿では,関連するスキル発見を通じてモデルを成長させるタスクのカリキュラムを構築することの問題点について考察する。
グリーディ最適化アルゴリズムを反復することで、関連するスキル発見のカリキュラムを成長させることができれば、本質的に1つのメタオブジェクトしか実現できないことを示す。
プレイヤーやメタサンプルとして十分な能力を持つ言語モデルと十分なトレーニング時間があれば、認知トレーニングは、関連するスキル発見の原則的な方法を提供すると仮定する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:47:45 GMT)
One-Year Internship Program on Software Engineering: Students' Perceptions and Educators' Lessons Learned [3.9] 本研究は, オーストラリア・メルボルン大学における1年間のインターンシップに焦点をあてる。
このコースは,過去10年間に学生のニーズを取り入れ,学んだ教訓を要約するためにどのように発展してきたかを分析した。
そこで我々は,インターンが課題を克服し,学習経験を最大限にするために,教育者や企業に対して推奨する提案を行った。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:03:51 GMT)
CanViT: Toward Active-Vision Foundation Models [3.9] CanViTは、最初のタスクおよびポリシーに依存しないアクティブ・ビジョン・ファンデーション・モデル(AVFM)である。
CanViTはシーンリレーショナルなRoPEを使用して、レチノピー的なビジョントランスフォーマーをシーンワイドの潜在ワークスペースにバインドする。
凍結したCanViT-Bは1つの低解像度で38.5% mIoUを達成し、最高のアクティブモデルでは27.6%、推論FLOPは19.5倍、微調整はない。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:05:21 GMT)
RTD-RAX: Fast, Safe Trajectory Planning for Systems under Unknown Disturbances [3.9] 到達可能性に基づく軌道設計(RTD)は、確実に安全でリアルタイムな軌道計画フレームワークである。
標準RTD実装には、最悪のケースで到達可能なオーバー近似によって引き起こされる保守性と、実行中のリアルタイムの障害を考慮できない2つの重要な制限がある。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:59:13 GMT)
SecureBreak -- A dataset towards safe and secure models [3.8] 本稿では、有害なLCM出力を検出するAI駆動型ソリューションの開発を支援するために設計された安全指向データセットSecureBreakを紹介する。
このデータセットは、安全を確保するためにラベルを保守的に割り当てる、注意深い手動アノテーションのため、非常に信頼性が高い。
トレーニング済みLLM試験ではSecureBreakを微調整した結果が改善された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:41:05 GMT)
Pretext Matters: An Empirical Study of SSL Methods in Medical Imaging [3.8] 自己教師付き学習(SSL)は、ラベルのないデータから堅牢な表現を学習する素晴らしい能力を示している。
SSL戦略の最適選択は、特殊なドメインにおいて、非常に異なるパフォーマンス結果をもたらす可能性がある。
本研究では,SSL法の選択が医学画像における学習表現にどのように影響するかを実証的に検討する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:53:16 GMT)
Global Optimization for Parametrized Quantum Circuits [3.6] トレーニング可能なパラメータを一定数有する量子回路の実践的なクラスのトレーニングについて検討する。
我々の主な成果は、完全にランダム化された近似スキーム (FPRAS) である。
変分アルゴリズムにおける標準的なハイブリッド量子古典的トレーニングとは異なり、我々の手法は計算を2つの異なる段階に分けている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:49:40 GMT)
FISformer: Replacing Self-Attention with a Fuzzy Inference System in Transformer Models for Time Series Forecasting [3.5] FISFormerはファジィ推論システム駆動トランスフォーマーで、従来の注意をFISインタラクションメカニズムに置き換える。
FISFormerは、最先端のTransformer変種と比較して予測精度、ノイズの堅牢性、解釈性に優れる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:12:47 GMT)
Learning operators on labelled conditional distributions with applications to mean field control of non exchangeable systems [3.4] 積空間上の確率測度に作用する作用素の所定の辺付き近似について検討する。
我々の主要な理論的結果は、$cal M_$ 上の連続作用素に対する普遍近似定理を確立する。
このような条件付き平均場演算子の実践的な学習を可能にするため、M_$$のトレーニング尺度を生成するためのサンプリング戦略を導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:13:21 GMT)
ALADIN:Attribute-Language Distillation Network for Person Re-Identification [3.4] ALADINは、冷凍のCLIP教師から軽量のReID学生に知識を蒸留する属性言語蒸留ネットワークである。
Scene-Aware Prompt Generatorは、適応アライメントを容易にするために、画像固有のソフトプロンプトを生成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:05:22 GMT)
Cognitive Agency Surrender: Defending Epistemic Sovereignty via Scaffolded AI Friction [3.3] ジェネレーティブ・人工知能(Generative Artificial Intelligence)は、良心的な認知的オフロードを認知エージェントの降伏のシステム的リスクに変えた。
ゼロフリクション(zero-friction)"デザインの商業的ドグマによって駆動される、高度に流動的なAIインターフェースは、人間の認知的ミスを積極的に活用する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:24:56 GMT)
Auditing MCP Servers for Over-Privileged Tool Capabilities [3.3] MCPサーバ用に設計されたセキュリティアセスメントツールキットであるmcp-sec-auditを提案する。
PythonベースのMPPサーバ用の静的パターンマッチングと,DockerとeBPF経由での動的サンドボックスファジィと監視を実装している。
このツールはルールベースの分析を通じてリスクのある機能を検出し、緩和推奨を提供する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:20:00 GMT)
Are AI-assisted Development Tools Immune to Prompt Injection? [3.3] 本報告では,広く使用されている7つのMPPクライアントにまたがるツール・ポゾン・脆弱性によるインジェクションの初回経験的解析について述べる。
我々は,それらの検出・緩和機構と,セキュリティ機能のカバレッジを識別する。
我々は,セキュアなAI支援開発の構築を目指すMPP実装者とソフトウェアエンジニアリングコミュニティに対して,実用的なガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:24:11 GMT)
SOLAR: A Self-Optimizing Open-Ended Autonomous Agent for Lifelong Learning and Continual Adaptation [3.2] SOLAR(Self-Optimizing Lifelong Autonomous Reasoner)は、自律型エージェントである。
パラメータレベルのメタ学習を使って自己改善し、モデルの重みを探索の環境として扱う。
実験により、SOLARは、常識、数学的、医学的、コーディング、社会的および論理的推論タスクにおいて、強いベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:18:02 GMT)
Task-Agnostic Exoskeleton Control Supports Elderly Joint Energetics during Hip-Intensive Tasks [3.2] 高齢者は腰の需要を増大させることで足首機能の低下を補う。
この補償シフトは、加齢に伴う最大股関節パワーの低下と一致する。
関節力に本質的に敏感なタスク非依存型股関節外骨格制御系を実装した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:18:27 GMT)
Data-Free Layer-Adaptive Merging via Fisher Information for Long-to-Short Reasoning LLMs [3.2] 層適応型マージの最初の理論的正当性を提供する。
ランダムトークン入力のみを用いて対角線FIMを演算する textbfFIM-Merging を提案する。
我々のフレームワークはまた、ACMのような既存の層適応手法が統一的な統合を実証的に上回っている理由について、統一的な理論的説明を提供する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:45:37 GMT)
Learning to Trust: How Humans Mentally Recalibrate AI Confidence Signals [3.1] 我々は、人間が繰り返し体験することで、AIの信頼性信号の精神的な調整を学べるかどうかを考察する。
本稿では,線形-log-odds変換とRescorla-Wagner学習則を用いた計算モデルを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:23:25 GMT)
FontCrafter: High-Fidelity Element-Driven Artistic Font Creation with Visual In-Context Generation [3.1] アーティスティックフォント生成は、参照スタイルに基づいてスタイリングされたグリフを合成することを目的としている。
既存のアプローチは、限られたスタイルの多様性と粗いコントロールに悩まされている。
フォント作成のための要素駆動フレームワークであるFontCrafterを紹介する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:53:12 GMT)
Retrieving Climate Change Disinformation by Narrative [3.1] 我々は,ナラティブ検出を検索タスクとして再編成し,ナラティブのコアメッセージをクエリとして与え,そのナラティブと整合してコーパスからテキストをランク付けする。
抽象的な記述と具体的なテキストのインスタンス化のギャップを埋めるための仮説文書を生成するフレームワークであるSpecFiを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:26:18 GMT)
Computationally lightweight classifiers with frequentist bounds on predictions [3.0] そこで我々は,Nadaraya-Watson推定器に基づく,計算効率の良い新しい分類アルゴリズムを提案する。
本手法は,$mathcal O(n)$と$mathcal O(log n)$演算において,競争精度が$>SI96percentに達することを示す。
これらの境界は、例えば、低信頼の予測をフラグする助けとなり、リソース制約のあるリアルタイム設定に適合する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:54:25 GMT)
Model Context Protocol Threat Modeling and Analyzing Vulnerabilities to Prompt Injection with Tool Poisoning [3.0] モデルコンテキストプロトコル(MCP)は、AIアシスタントを外部ツールやデータソースに接続するための普遍的な標準として急速に登場した。
MCPはAIアプリケーションとさまざまなサービスの統合を単純化するが、特にクライアント側において、重大なセキュリティ脆弱性を導入している。
STRIDE (Spoofing, Tampering, Repudiation, Information Disclosure, Denial of Service, Elevation of Privilege) と DREAD (Damage, Reproducibility, Exploitability, Affected Users, Discoverability) フレームワークを用いて,MPP実装の脅威モデリングを行う。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:59:04 GMT)
Survey on Remote Sensing Scene Classification: From Traditional Methods to Large Generative AI Models [3.0] リモートセンシングシーンの分類は、従来の手作り特徴法から高度な人工知能システムへのパラダイム転換を経験してきた。
本総説では, 従来のテクスチャ記述子から現在の最先端基礎モデルまで, 開発過程を体系的に追跡し, 完全な方法論的進化を考察する。
合成データ生成と高度な特徴学習戦略を通じて永続的な課題に取り組む、生成AIイノベーションに特に重点を置いている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:35:37 GMT)
RAFL: Generalizable Sim-to-Real of Soft Robots with Residual Acceleration Field Learning [3.0] 微分シミュレータは、材料パラメータ、制御、形態に対するソフトロボットの勾配に基づく最適化を可能にする。
本稿では,移動可能な要素レベルの補正力学場をベースシミュレータに拡張した残留加速度場学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:40:02 GMT)
TrustFed: Enabling Trustworthy Medical AI under Data Privacy Constraints [3.0] フェデレーション学習は、患者の生データを共有することなく、プライバシ保護、複数施設でのトレーニングを可能にする。
TrustFedは、不均一で不均衡な医療データの下で、配布不要で有限サンプルのカバレッジ保証を提供する。
医用画像における不確実性を考慮したフェデレーション学習の包括的評価を行う。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:34:45 GMT)
Neural Belief-Matching Decoding for Topological Quantum Error Correction Codes [3.0] トーリックコードのようなトポロジコードは、ハードウェア効率の良いアーキテクチャを提供する。
トーリックコードの復号化には2つの重要な改良点を提案する。
1つ目は、BPデコーダをニューラルBPデコーダに置き換え、ニューラル信念マッチングデコーダを発生させる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:15:48 GMT)
VorTEX: Various overlap ratio for Target speech EXtraction [2.9] VorTEXはテキストプロンプトされたTSEアーキテクチャであり、補助正規化経路から一次抽出を分離する。
制御分析を可能にするために,重なり比を0%から100%に分散した2話者データセット PORTE を構築した。
VorTEXは20-100%の重なりで高い分離率を達成する一方、既存のモデルでは重なりの抑制や残差が示される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:26:41 GMT)
ShapDBM: Exploring Decision Boundary Maps in Shapley Space [2.9] 決定境界マップ(DBMs)は機械学習の分類境界を視覚化する有効なツールである。
しかし、DBMの品質は、データポイントに使用される次元還元(DR)技術と高次元空間に強く依存している。
本稿では,データ空間をShapley空間に変換し,DRを演算することでDBMを計算するための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:31:20 GMT)
Quantifying Interface Procedure Coupling Risks in Digital Nuclear Control Rooms: An Event Based Human Reliability Assessment [2.9] 本研究では,近代原子力発電所において2021年から2025年にかけて収集された実運用イベントに基づいて,インターフェース・プロシージャ・カップリングの系統的評価を行う。
合計42.6%のイベントがインターフェースの欠陥を伴い、その存在が手続き上の逸脱の可能性を2倍以上に高めた。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:31:13 GMT)
Privacy-Preserving Reinforcement Learning from Human Feedback via Decoupled Reward Modeling [2.8] 報酬学習のみに差分プライバシーを課すプライバシー保護フレームワークを提案する。
プライバシーは、通常の非私的統計誤差を超える付加的な用語に寄与していることを示す。
人為的HH-RLHFデータセットの実験は、既存の微分プライベートベースライン法よりも強いプライベートアライメント性能を示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 20:45:17 GMT)
ROBOGATE: Adaptive Failure Discovery for Safe Robot Policy Deployment via Two-Stage Boundary-Focused Sampling [2.8] ROBOGATEは、物理に基づくシミュレーションと2段階適応サンプリング戦略を組み合わせたデプロイメントリスク管理フレームワークである。
我々は、Franka Panda (7-DOF) とUR5e (6-DOF) の2つのロボット体のスクリプトによるピック・アンド・プレイス・コントローラーの評価を行った。
我々のロジスティック回帰リスクモデルは、組み合わせたデータセットで0.780のAUCを達成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:52:54 GMT)
Dual-Space Knowledge Distillation with Key-Query Matching for Large Language Models with Vocabulary Mismatch [2.8] 大規模言語モデル(LLM)は、言語タスク全体にわたって最先端(SOTA)のパフォーマンスを達成するが、そのサイズとリソース要求のため、デプロイにはコストがかかる。
知識蒸留(KD)は、より小さな学生モデルを訓練して、より大きな教師モデルを模倣し、大きなパフォーマンス損失を伴わずに効率を向上することで、この問題に対処する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:53:55 GMT)
Trajectory Generation for Underactuated Soft Robot Manipulators using Discrete Elastic Rod Dynamics [2.7] 動的に実現可能な軌道を持つ計画運動は任意の変形を捉えるモデルを必要とする。
本研究は,空気圧式ソフトロボットアームを用いた軌道生成の枠組みを実験的に検証する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:01:14 GMT)
UrbanVGGT: Scalable Sidewalk Width Estimation from Street View Images [2.7] UrbanVGGTは、単一のストリートビュー画像からメートル法歩道幅を推定するための測定パイプラインである。
ワシントンD.C.の地上試験で、UrbanVGGTは0.252mの平均絶対誤差を達成し、推定の95.5%は基準幅の0.50m以内である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:52:18 GMT)
Spatially-Aware Evaluation Framework for Aerial LiDAR Point Cloud Semantic Segmentation: Distance-Based Metrics on Challenging Regions [2.7] セマンティックセグメンテーションモデルを2つの相補的アプローチで比較するための新しい評価フレームワークを提案する。
まず,各不等分点と最寄りの接地点との空間的ずれを考慮に入れた距離に基づく測度を導入する。
第2に、評価されたモデルの少なくとも1つによって誤って分類された点として定義される、ハードポイントの共通部分集合に対する集中的評価を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:00:37 GMT)
Benchmarking Deep Learning Models for Aerial LiDAR Point Cloud Semantic Segmentation under Real Acquisition Conditions: A Case Study in Navarre [2.7] 本研究では,KPConv,RandLA-Net,Superpoint Transformer,Point Transformer V3の4つの代表的なディープラーニングモデルを比較した。
KPConvはクラス間の一貫したパフォーマンスで最高IoU(78.51%)に達する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:26:41 GMT)
Directional Mollification for Controlled Smooth Path Generation [2.6] モーフィフィケーションは近年,経路生成のための計算効率が高く,解析的に抽出可能なツールとして提案されている。
我々は,古典的な軟化の分析的トラクタ性を保ちながら,この制限を解消する新しい演算子である指向性軟化を導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:18:43 GMT)
A Latent Representation Learning Framework for Hyperspectral Image Emulation in Remote Sensing [2.6] 本稿では,ハイパースペクトルデータの潜在表現を学習するハイパースペクトルエミュレーションのための潜在表現に基づくフレームワークを提案する。
提案手法は、スペクトルレベルと空間スペクトルエミュレーションの両方をサポートし、直接1段階の定式化や2段階の戦略で訓練することができる。
PROSAILシミュレーション植生データとSentinel-3 OLCI画像による実験により,本手法が古典的回帰型エミュレータより優れていることが示された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:32:09 GMT)
Robust Atom Interferometry with Double Bragg Diffraction [2.6] この論文は、二重ブラッグ回折(DBD)に基づく高コントラスト原子干渉法を実現するための理論的、数値的な枠組みを開発する。
DBDは内在対称性、内部状態の系統に対する感度の低下、微小重力実験に適している。
この研究はDBDの解析的ハミルトン記述を構築することで限界を克服する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:25:46 GMT)
CoNBONet: Conformalized Neuroscience-inspired Bayesian Operator Network for Reliability Analysis [2.6] 励起下での非線形力学系の時間依存的信頼性解析は、重要なが計算的に要求される課題である。
我々は、高速、エネルギー効率、不確実性を考慮した信頼性解析を可能にする、神経科学にインスパイアされた代理モデルであるtextitCoNBONetを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:09:34 GMT)
Abnormalities and Disease Detection in Gastro-Intestinal Tract Images [2.5] 本研究は,リアルタイムアプリケーションにおけるGI画像の正確な分類とセグメント化の課題に対処する。
リアルタイム検出を支援するために,テクスチャと局所バイナリパターンを統合したニューラルネットワークを開発した。
ユーザビリティを向上させるために,Depth-Wise Separable Convolutionとニューラルネットワークアンサンブルを活用した2つのセグメンテーションツールが提案されている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:13:56 GMT)
CataractSAM-2: A Domain-Adapted Model for Anterior Segment Surgery Segmentation and Scalable Ground-Truth Annotation [2.5] CataractSAM-2はMetaのSegment Anything Model 2のドメイン適応拡張である。
CataractSAM-2は白内障眼科手術ビデオのリアルタイムセマンティックセグメンテーションを高精度に行うために設計された。
スパースプロンプトとビデオベースのマスキングを組み合わせたインタラクティブなアノテーションフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:40:35 GMT)
BOxCrete: A Bayesian Optimization Open-Source AI Model for Concrete Strength Forecasting and Mix Optimization [2.5] 現代のコンクリートは、機械的性能、作業性、耐久性、持続可能性に対する要求が進化していることを満たさなければならない。
人工知能(AI)と機械学習(ML)モデルを活用した最近の研究は、圧縮強度の予測と混合最適化の指針となることを示唆している。
ここでは,500以上の強度測定を行う新しいオープンアクセスデータセットに基づいてトレーニングされた,オープンソースの確率的モデリングおよび最適化フレームワークであるBOxCreteを紹介する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:33:40 GMT)
On the Economic Implications of Diversity in Software Engineering [2.5] 本稿では,ソフトウェアエンジニアリングチームにおける多様性の経済的影響を,ソフトウェア専門家がどのように捉えているかを検討する。
分析の結果,コスト削減と包摂,収益生成,市場投入時間,プロセス効率,イノベーション,市場アライメントといった関連性を通じて,多様性が経済的に関係があることが示唆された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:32:46 GMT)
A vision-language model and platform for temporally mapping surgery from video [2.5] マッピング手術は、手術ガイドラインの作成と自律型ロボット手術の実現に不可欠である。
人工知能(AI)の最近の進歩は、ビデオから外科医の振舞いをマッピングすることを約束している。
本稿では、ハルステッド手術アトラスで訓練された視覚言語モデルであるハルステッドを紹介する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:23:40 GMT)
MIHT: A Hoeffding Tree for Time Series Classification using Multiple Instance Learning [2.4] 本稿では,時系列を分類するMIHTアルゴリズムを提案する。
このアルゴリズムは、時系列を「サブシリーズのバグ」として表現する。
28の公開データセットで11の最先端時系列分類モデルを上回っている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:06:43 GMT)
Financial Dynamics and Interconnected Risk of Liquid Restaking [2.4] 本稿は,現在のリテイクの状況を監視し,液状リテイクプロトコルの収益要因を実証的に分析し,発生リスクに関する技術的調査を行う。
以上の結果から,EigenLayerの基盤となるエコシステムにロックされている価値,Renzoプロトコルの液再帰トークンの収量,およびそのトークンのマルチブロックチェーン拡張によって収益が予測されることが明らかとなった。
分散化された金融エコシステムを横断する資産フローをマッピングすることにより、蓮蔵の液化資産の現在の規模の橋梁リスクが、現在の再開発・取扱いエコシステムに体系的なリスクを課さないことが検出された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:58:01 GMT)
A Survey of Web Application Security Tutorials [2.4] 我々は132の無料セキュリティチュートリアルをレビューし、トピックのカバレッジ、著者シップ、技術的な詳細について調べた。
ほとんどのチュートリアルでは、具体的実装ガイダンスに関する高レベルな説明が強調されている。
完全な実行可能なコード例や信頼できるセキュリティリソースへの直接的なリンクを提供するチュートリアルはほとんどない。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:20:59 GMT)
LARD 2.0: Enhanced Datasets and Benchmarking for Autonomous Landing Systems [2.4] 我々は,BingMap空中画像やFlight Simulatorなどの新しい情報源を取り入れることを提唱する。
また、非現実的な着陸シナリオや、複数滑走路空港へのカバー拡大といった問題にも対処しています。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:27:49 GMT)
A Systematic Review of MLOps Tools: Tool Adoption, Lifecycle Coverage, and Critical Insights [2.3] 本稿では,MLOpsツールに着目した学術文献の体系的なレビューを行う。
ツールをMLOpsライフサイクルコンポーネントにマップして、それらが対処するように設計された機能、スコープ、課題を明らかにします。
これは、現実のMLOpsパイプラインにおけるMLOpsツール間の相互運用性の重要性を強調している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:08:15 GMT)
Deriving Health Metrics from the Photoplethysmogram: Benchmarks and Insights from MIMIC-III-Ext-PPG [2.3] Photoplethysmography (signals)は、臨床予測タスクにおいて最も広く使われているバイオシグナーの1つである。
Photoplethysmography (signals)は、臨床予測タスクにおいて最も広く使われているバイオシグナーの1つである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:19:06 GMT)
Upper Entropy for 2-Monotone Lower Probabilities [2.3] 不確実性定量化は、モデル選択や規則化、アクティブラーニングやOOD検出を行うための不確実性予測など、多くのタスクにおいて重要な側面である。
本稿では,上位エントロピーの計算的側面に焦点をあて,その問題を網羅的に分析する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:52:25 GMT)
Parallel OctoMapping: A Scalable Framework for Enhanced Path Planning in Autonomous Navigation [2.3] 我々は,利用可能な自由空間を最大化し,マルチスレッド計算をサポートする効率的なOctoMapベースのマッピング技術であるParallel OctoMapping (POMP)を紹介した。
POMPは、固定占有グリッド解像度で、地図の忠実さと既存の検索ベースプランナーとの互換性を維持しながら、自由空間の表現を洗練する最初の方法である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:14:03 GMT)
SafePilot: A Framework for Assuring LLM-enabled Cyber-Physical Systems [2.3] 大規模言語モデル(LLM)は、最近、様々なサイバー物理システムに統合され始めている。
LLMは"ハロシン化"(hallucination)を生成します。
属性ベースおよび時間仕様に従ってCPSのエンドツーエンド保証を提供する新しい階層型ニューロシンボリックフレームワークであるSafePilotを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:31:51 GMT)
Clinical Graph-Mediated Distillation for Unpaired MRI-to-CFI Hypertension Prediction [2.3] 臨床グラフ媒介蒸留(CGMD)は、MRI由来のHTN知識を、ペア化されたマルチモーダルデータを持たない基礎モデルに転送するフレームワークである。
新たに収集したMRI-fundus-biomarkerデータセットを用いて実験したところ、CGMDは根源に基づくHTN予測を一貫して改善することがわかった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:53:15 GMT)
Parameter-efficient Prompt Tuning and Hierarchical Textual Guidance for Few-shot Whole Slide Image Classification [2.2] Whole Slide Images (WSI) はスケールがギガピクセルであり、WSI分類パイプラインの小さなインスタンスに分割されるのが一般的である。
テキストエンコーダの機能拡張とシフトによるパラメータ効率の良いプロンプトチューニング手法を提案する。
また、ハードインスタンスフィルタリングを使わずに、ソフトな階層的なテキストガイダンス戦略を備えたWSI表現学習手法も導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:50:52 GMT)
Alignment as Institutional Design: From Behavioral Correction to Transaction Structure in Intelligent Systems [2.2] 現在のAIアライメントパラダイムは、行動修正に依存している。
本稿では,行動補正は財産権のない経済と構造的に類似していると主張している。
この枠組みは,行動制御問題から政治・経済問題へのアライメントの転換を図っている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:11:52 GMT)
From Singleton Obstacles to Clutter: Translation Invariant Compositional Avoid Sets [2.2] 回避側移動コストハミルトンジャコビ定式化を用いた翻訳不変力学下での障害物回避について検討した。
翻訳テンプレート値のポイントワイド最小は、翻訳された単一障害物回避集合の和を正確に特徴付けることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:10:40 GMT)
Multi-Method Validation of Large Language Model Medical Translation Across High- and Low-Resource Languages [2.1] 言語障壁は、英語を好まない米国住民2730万人に影響を及ぼす。
22の医療文書を8言語に翻訳した4つのフロンティア大言語モデルを評価した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:34:02 GMT)
Multimodal Survival Analysis with Locally Deployable Large Language Models [2.1] 提案手法は,教師-学生蒸留法と原則的マルチモーダル融合法を用いて,生存確率を推定し,簡潔でエビデンスに基づく予後テキストを生成する。
TCGAコホートでは、標準的なベースラインを上回り、クラウドサービスや関連するプライバシの懸念への依存を回避し、幻覚的あるいは誤った見積のリスクを低減する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:21:37 GMT)
GradAttn: Replacing Fixed Residual Connections with Task-Modulated Attention Pathways [2.1] GradAttnは、固定残差接続を注意制御の勾配流に置き換えるCNN変換フレームワークである。
表現分析では,8つの多様なデータセットにまたがる3つのGradAttn変種を評価した。
結果は、GradAttnが8つのデータセットのうち5つでResNet-18を上回っていることを示している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:45:07 GMT)
SmaAT-QMix-UNet: A Parameter-Efficient Vector-Quantized UNet for Precipitation Nowcasting [2.1] 本稿では、SmaAT-QMix-UNetの拡張版であるSmaAT-QMix-UNetについて述べる。
エンコーダ・デコーダブリッジにおけるベクトル量子化ボトルネックと、選択したエンコーダブロックとデコーダブロックを置き換える混合カーネル奥行き畳み込み(MixConv)。
SmaAT-QMix-UNetをオランダのレーダの降水量予測データを用いて学習し,30分前に降水量を予測する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:09:37 GMT)
Rethinking SAR ATR: A Target-Aware Frequency-Spatial Enhancement Framework with Noise-Resilient Knowledge Guidance [2.0] 本稿では,SAR目標認識のための雑音耐性知識ガイダンス(FSCE)を用いた周波数空間拡張フレームワークを提案する。
提案フレームワークは、空間的マルチスケールの畳み込みと周波数領域のウェーブレット畳み込みによって浅部特徴を処理する周波数空間浅部特徴適応拡張(DSAF)モジュールを組み込んだものである。
注目伝達と雑音耐性表現学習の協調最適化により,雑音条件下での目標認識の安定性を著しく向上する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:35:31 GMT)
Kolmogorov Complexity Bounds for LLM Steganography and a Perplexity-Based Detection Proxy [2.0] 大きな言語モデルは、テキストを書き直して隠れペイロードを埋め込むことができる。
このような埋め込みにおける情報理論のコストについて検討する。
色に基づくLCMステガノグラフィースキームによる予備実験は、理論予測を支持する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:40:46 GMT)
A Framework for Closed-Loop Robotic Assembly, Alignment and Self-Recovery of Precision Optical Systems [2.0] 本稿では,精密光学系の自律的構築,アライメント,保守のためのロボティクスフレームワークを提案する。
本手法では,階層型コンピュータビジョンシステム,最適化ルーチン,カスタムビルドツールを統合して,この機能を実現する。
この研究は、高感度光学系に対する閉ループ自律性を達成することにより、技術領域をまたいだ応用のための自律光学実験の基礎を確立する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:36:34 GMT)
GIFT: Generalizing Intent for Flexible Test-Time Rewards [2.0] GIFTは、表面的な手がかりではなく、人間の意図による報酬の一般化を基盤とするフレームワークである。
GIFTは、意図条件の類似性を通じて、新しいテストステートを行動的に等価なトレーニングステートにマッピングする。
7-DoFのFranka Pandaロボットの実際の実験では、GIFTが物理的設定に確実に移行することを示した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:14:53 GMT)
A Backbone Benchmarking Study on Self-supervised Learning as a Auxiliary Task with Texture-based Local Descriptors for Face Analysis [1.9] 我々は、異なるバックボーンをベンチマークし、補助的なタスクとして自己教師付き学習(SSL)への影響について研究する。
我々は,Masked Auto-Encoder (MAE) のSSLタスクを補助目的として,浅部から深部まで異なるバックボーンを用いている。
様々な顔分析パラダイムにおける特徴表現品質と一般化能力の整合性のために、統一されたバックボーンは存在しない。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:49:50 GMT)
CatRAG: Functor-Guided Structural Debiasing with Retrieval Augmentation for Fair LLMs [1.8] 構造的デバイアスを誘導する構造的デバイアス(RAG)を関手と統合する,二重進行型フレームワークであるCatRAG Debiasingを提案する。
オープンソースの3つのLCM(Meta Llama-3、OpenAI GPT-OSS、Google Gemma-3)を対象としたBias Benchmark for Question Answering (BBQ)では、CatRAGは対応するベースモデルに対して最大40%の精度で、事前のデバイアス法よりも10%以上の精度を実現している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:33:13 GMT)
From experimentation to engagement: on the paradox of participatory AI and power in contexts of forced displacement and humanitarian crises [1.8] 本稿では,人道的文脈における参加型AI手法とその限界について批判的に検討する。
人道的文脈で使用すれば、いわゆる「参加洗浄」とアルゴリズム的害のリスクを増大させる可能性のある、参加型AIアプローチには、いくつかの重要な制限がある。
これらのリスクは、AIの理解と認識のレベルの違いによって主に引き起こされるのではなく、人道的なセクターに埋め込まれた基本的なパワーダイナミクスと密接に関連している、と私たちは主張する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:16:08 GMT)
Reddit After Roe: A Computational Analysis of Abortion Narratives and Barriers in the Wake of Dobbs [1.7] 本稿では,Reddit上での妊娠中絶談話の大規模解析について述べる。
法的、経済的、感情的、社会的障害を含む8種類の障壁のコードブックを用いて、感情や情報行動との関連性を分析した。
以上の結果から,心的・心理的障壁が,ネット上での中絶物語を常に支配していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 20:50:01 GMT)
Benchmarking Recurrent Event-Based Object Detection for Industrial Multi-Class Recognition on MTEvent [1.7] イベントカメラは、時間分解能が高く、ダイナミックレンジが高く、動きのぼやけが少ないため、産業ロボットにとって魅力的である。
ほとんどのイベントベースのオブジェクト検出研究は、屋外の運転シナリオや限られたクラス設定に焦点を当てている。
産業用マルチクラス認識のためのMTEvent上でReYv8sを反復的にベンチマークする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:28:54 GMT)
GTSR: Subsurface Scattering Awared 3D Gaussians for Translucent Surface Reconstruction [1.7] 透明物体の表面形状を再構成するための新しい3DGSベースのパイプライン(GTSR)を提案する。
提案手法は,NeuralTO Synデータセットのベースライン再構築手法より優れている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:38:18 GMT)
Drop-In Perceptual Optimization for 3D Gaussian Splatting [1.7] 我々は、複数のデータセットと3DGSフレームワークにまたがる39,320のペアワイドレーティングを含む、3DGSに関する、人類初の大規模主観的研究を行う。
WD-R と呼ばれる Wsserstein Distortion の正規化バージョンが明確な勝者として登場し、高いスプラ数を得ることなく細かいテクスチャを回復できる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:42:49 GMT)
Closed-Loop Verbal Reinforcement Learning for Task-Level Robotic Planning [1.7] 本稿では,モバイルロボットシステムにおけるタスクレベル計画の解釈のための新しい言語強化学習フレームワークを提案する。
このフレームワークはクローズドループアーキテクチャに従い、物理的環境との相互作用を通じて反復的なポリシー改善を可能にする。
提案手法は,実行不確実性下で複数段操作およびナビゲーションタスクを行う実移動ロボット上で検証される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:28:36 GMT)
Noise Titration: Exact Distributional Benchmarking for Probabilistic Time Series Forecasting [1.6] 本稿では,介入主義的,厳密な統計的ベンチマークへのパラダイムシフトを提案する。
我々は,ブラックボックスシーケンスマッチングゲームから正確な分布推定タスクに予測を変換する。
我々は、最先端のゼロショットモデルがコンテキストパロッキング機構と一貫して振る舞うことを発見した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:14:11 GMT)
Thinking Deeper, Not Longer: Depth-Recurrent Transformers for Compositional Generalization [1.6] 本稿では,パラメータ数から計算深度を分離するDepth-recurrent Transformerを提案する。
アーキテクチャには3つのメカニズムが組み込まれています(20以上のステップ)。
我々は,タスクの複雑さに対処して,思考ステップがスケールするにつれて,パフォーマンスが機会からほぼ完璧に遷移する,明確な計算フロンティアを観察する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:06:45 GMT)
Global Convergence of Multiplicative Updates for the Matrix Mechanism: A Collaborative Proof with Gemini 3 [1.6] 本研究では,アダマール積構造を含む正則化核目標の最適化において,固定点イデアルvv左辺(v)$(v)を解析する。
我々は、反復がポテンシャル函数 $J(v) = 2 の唯一の大域ノルムに収束することを証明した。
このノートは、数学におけるAIの実践的利用に関する注釈であり、文学における小さなギャップの閉鎖を表している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:13:27 GMT)
Getting to the Point: Why Pointing Improves LVLMs [1.5] 視覚的な場面からゼロショットカウントする認知的タスクを指差す役割について検討する。
我々は、直接カウントとポイント・ザ・クーントの2つのアプローチに従って、最先端のLVLMを微調整する。
その結果,Point-then-Countは,LVLMが狭いタスクに過度に適合するのではなく,学習スキルの学習を支援することが示唆された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:38:15 GMT)
OsteoFlow: Lyapunov-Guided Flow Distillation for Predicting Bone Remodeling after Mandibular Reconstruction [1.5] 我々は,5日目スキャンから1年目のCTスキャンを予測するフローベースフレームワークであるOsteoFlowを紹介した。
Lyapunov-guided trajectory distillation: 1ステップの蒸留とは違って,本手法では,登録由来の静止速度場教師から輸送時間を超える連続的な軌跡を蒸留する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:00:50 GMT)
Disengagement Analysis and Field Tests of a Prototypical Open-Source Level 4 Autonomous Driving System [1.5] 本研究では,236kmの混在トラフィックに対して,Autowareベースのソフトウェアスタックを運用する研究車両の評価を行った。
新たな5レベル臨界フレームワークを用いて,26車種にわたる30の解離を分類することにより,空間的解離率0.1271/kmを観察した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:47:47 GMT)
Cybersecurity Guidance for Smart Homes: A Cross-National Review of Government Sources [1.4] 我々は11カ国のスマートホームに対する政府のサイバーセキュリティガイダンスをレビューする。
以上の結果から,政府は十分な総合的なセキュリティアドバイスと,アクセス可能な報告チャネルを提供していることが示唆された。
専門家でないユーザのために、ステップバイステップのリカバリガイダンスを提供するソースは2つだけです。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:42:31 GMT)
Stability and Bifurcation Analysis of Nonlinear PDEs via Random Projection-based PINNs: A Krylov-Arnoldi Approach [1.4] 物理インフォームドランダムプロジェクションニューラルネットワーク(PI-RPNN)による関数空間における解を求める非線形偏微分方程式(PDE)の安定性と分岐解析に対処する。
我々は,行列のないシフト反転型Krylov-Arnoldi法を導入し,数値的に階数不足なコロケーション行列の明示的な逆転を回避した。
PI-RPNNに基づく一般化固有値問題は、ほぼ確実に正則であり、標準固有解法による可解性を保証する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:41:10 GMT)
Entanglement degradation in regular and singular spacetimes [1.4] 我々は正則、ライスナー・ノルドストラム、シュワルツシルト・ド・シッターブラックホールの地平線付近の絡み合い劣化について検討した。
我々は、アリスとロブが共有するスカラー場のアンルーのような2つのモードに対して、絡み合いの負性である$mathcalN$を計算する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:47:39 GMT)
A plug-and-play approach with fast uncertainty quantification for weak lensing mass mapping [1.4] EuclidやRubinといった今後のステージIV調査では、大量の高精度なデータを提供する予定だ。
この過程における重要なステップは、ノイズの弱いレンズ測定から暗黒物質の再構成である。
現在の深層学習に基づくマッピング手法は、再現精度が高いが、新しい空域ごとにモデルを再訓練する必要がある。
弱レンズ質量マッピングのためのプラグアンドプレイアプローチであるMassを導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:12:48 GMT)
Tock: From Research to Securing 10 Million Computers [1.4] Tockは10年前に、他の研究者が都市センシングアプリケーションを構築するのを助けるために、学者によって開発された研究用オペレーティングシステムとして始まった。
データセンタサーバや数百万台のラップトップに,信頼性ハードウェアのルーツとしてデプロイされている。
自動車や宇宙製品、ウェアラブルエレクトロニクス、ハードウェアセキュリティトークンの開発に用いられる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:24:19 GMT)
TREX: Trajectory Explanations for Multi-Objective Reinforcement Learning [1.3] 多目的強化学習ポリシーを説明するための軌道ベース説明可能性フレームワーク
多目的強化学習ポリシーを説明するための軌道ベース説明可能性フレームワーク
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:55:14 GMT)
BioShield: A Context-Aware Firewall for Securing Bio-LLMs [1.3] バイオLLMは、正当な研究クエリーのガイドの下で有害な生物学的洞察を生成するために利用することができる。
静的プロンプトフィルタリングのような既存のセーフガードは、Bio-LLMが動的生物学的およびアプリケーション層システムに埋め込まれている場合、不十分である。
両用攻撃に対してBio LLMを保護するために設計された,コンテキスト対応のアプリケーションレベルのファイアウォールであるBioShieldを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:18:54 GMT)
STRIATUM-CTF: A Protocol-Driven Agentic Framework for General-Purpose CTF Solving [1.3] モデルコンテキストプロトコル(MCP)上に構築されたモジュール型エージェントフレームワークであるSTRIATUM-CTF(サーチベーステストタイム推論推論エージェント、サイバーセキュリティにおける戦術的ユーティリティ最大化)を紹介する。
システムのイントロスペクション、デコンパイル、実行時のデバッグのためのツールインターフェースを標準化することで、STRIATUM-CTFはエージェントが拡張されたエクスプロイトトラジェクトリ間でコヒーレントなコンテキストウィンドウを維持することができる。
当社のシステムは2025年後半に開催された大学主催のCapture-the-Flag(CTF)コンペに参加し、リアルタイムで脆弱性を特定して悪用するために自律的に運用しました。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:17:26 GMT)
Take the Train: Africa at the Crossroad of Modern AI [1.1] 現代のAI開発へのアフリカの参加は、厳しいインフラと政策のギャップによって制限されている。
本稿では、計算、データ、そしてそれを可能にするエネルギーへのバランスのとれたアクセスを通じて、持続可能なAIの採用が堅牢なデジタル基盤を必要とすることを示す。
textitAfrica AI Compute Tracker (ACT)を導入し、大陸のAI対応HPCシステムの可利用性を監視するインタラクティブマップを提供する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:40:10 GMT)
Deterministic feedforward-based generation of large optical coherent-state superposition [1.1] キュービットモード分散結合を用いた決定論的フィードフォワードプロトコルを提案する。
このプロトコルは3モードガウス光子数分解法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:02:37 GMT)
λ-GELU: Learning Gating Hardness for Controlled ReLU-ization in Deep Networks [1.1] Gaussian Error Linear Unit (GELU) はRectifier Linear Unit (ReLU) のスムーズな代替品として広く使われている。
-GELUは、ゲーティングの硬さをプロファイルし制御するための最小限の解釈可能なノブを提供する。
全体として、 -GELUは、ゲーティングの硬さをプロファイルし制御するための最小限の、解釈可能なノブを提供し、ReLU中心の下流パイプラインによるスムーズなトレーニングをブリッジする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:58:19 GMT)
DIRT: Database-Integrated Random Testing [1.1] DIRTは、開発中にデータベースをテストするために特別に設計されたパラダイムです。
我々は,Oエンジンのテストではなく,活発に開発されたTurso上でDIRTを評価する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:01:00 GMT)
Riverine Land Cover Mapping through Semantic Segmentation of Multispectral Point Clouds [1.1] 本研究では,現実世界の河川環境における土地被覆マッピングにおけるポイントトランスフォーマーv2(PTv2)の利用について検討する。
我々は3チャンネルのLiDAR点雲からの幾何学的およびスペクトル的情報を用いて,砂,砂利,低植生,高植生,林床,水などの土地被覆クラスをマッピングする。
その結果、フル機能構成を用いることで、平均mIoU(mIoU)が0.950となり、幾何ベースラインを著しく上回る結果が得られた。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:27:17 GMT)
Asymmetric Dynamics of Partisan Warriors in YouTube Comments [1.0] ソーシャルメディア上での横断的なコメントは、議論への道のりとしてしばしば考えられているが、反対意見への露出はしばしば敵意を喚起する。
本論では、主にイデオロギーの線を横切るパルチザン戦士の観念を紹介する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:18:13 GMT)
Stability-Preserving Online Adaptation of Neural Closed-loop Maps [1.0] 現代の制御タスクでは、ループの安定性を保ちながら、目的や乱れが変化するにつれてオンラインで反応できるコントローラが必要である。
閉ループ安定性を保ちながら非線形システムの性能を向上させるための最近のアプローチは、時間不変のリカレントニューラルネットワークコントローラに依存している。
本稿では非線形ニューラルネットワークベースの制御系に対する安定性保持更新機構を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:38:29 GMT)
Performance of BB84 without decoy states under varying announcement structures [0.9] デコイ法は、光子数分割攻撃に対するBB84の脆弱性を補うためにしばしば用いられる。
SARG04は高損失チャネルに対するレジリエンスを示し,NPAB BB84はQKDデバイス間の物理的不整合に対する潜在的な利点を示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:17:53 GMT)
Camera-Agnostic Pruning of 3D Gaussian Splats via Descriptor-Based Beta Evidence [0.8] 本稿では,3次元ガウス板のカメラ非依存,ワンショット,ポストトレーニングプルーニング法を提案する。
splat表現から直接構造と外観の整合性をキャプチャするハイブリッドディスクリプタフレームワークを提案する。
本手法は, 復元品質を維持しつつ, 実質的な刈り取りを実現する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:52:08 GMT)
A Foundation Model for Instruction-Conditioned In-Context Time Series Tasks [0.8] In-context Learning (ICL) では、モデルをパラメータを更新するのではなく、例に条件付けすることで推論時に適応させることができる。
本稿では,量子レグレッションT5エンコーダを用いた命令条件付き時系列タスクの基礎モデルを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:24:41 GMT)
Navigational Thinking as an Emerging Paradigm of Computer Science in the Age of Generative AI [0.7] 生成的AIシステムは、人間のパフォーマンスと区別できない品質で意味を生み出す。
本稿では、生成型AIは、高次元空間を通した幾何学的ナビゲーションという、基本的に新しい知識生産のモードをインスタンス化する、と論じる。
我々は、ナビゲーション思考と計算思考は代替ではなく、同じ認知過程の2つの逐次段階であると主張している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:57:41 GMT)
Efficient Gaussian Simulations of Fermionic Open Quantum Systems [0.7] 我々は、フェルミオンガウス演算を行うための既存の古典的シミュレーション手法についてレビューする。
我々はブラヴィイが確立した基本的な理論的枠組みに固執することで、このギャップに対処する新しい手法を開発する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:40:20 GMT)
One-parameter counterexamples to the refined Bessis-Moussa-Villani conjecture [0.7] n$ 文字 $A$ および $m$ 文字 $B$ の正規化平均は常に $mathrmtr(AnBm)$ で、以下は $mathrmtrexp(nlog A+mlog B)$ で表される。
特に、$x=10-3$は反例を与え、驚くほど、正規化された単語平均とトレース$mathrmtr(AnBm)$の比率は任意に大きくなる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:25:34 GMT)
Artificial Intelligence and Systemic Risk: A Unified Model of Performative Prediction, Algorithmic Herding, and Cognitive Dependency in Financial Markets [0.7] 我々は,金融市場におけるAI導入が3つの相互強化チャネルを通じてシステム的リスクを生み出す統一モデルを構築した。
このモデルは、バーゼルIII反環状バッファと比較して経済的に有意な18〜54%のテールロス増幅を示唆している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:47:55 GMT)
AI-Driven Alpha Decay: Algorithmic Homogenization, Reflexive Signal Erosion, and the Paradox of Intelligent Markets [0.7] AIによる投資戦略は、本質的には大規模に自給自足していることを示す。
AIの採用が進むにつれ、信号の混雑、信号の侵食、レッドクイーンの競争など、相互に強化する3つのチャンネルが過剰なリターンを圧縮する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:49:42 GMT)
Biophysics-Enhanced Neural Representations for Patient-Specific Respiratory Motion Modeling [0.7] 呼吸運動モデルは通常、患者固有の呼吸運動を推測し、服用をより効率的に標的にするために用いられる。
本研究では,サロゲート型モーションモデリングにおける暗黙的ニューラル表現の可能性について検討する。
物理規則化暗黙サロゲートを用いた呼吸運動モデル(PRISM-RM)を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:47:05 GMT)
Optimal Memory Encoding Through Fluctuation-Response Structure [0.7] 最適入力符号化はシステムのゆらぎ応答構造に支配される問題であることを示す。
バックプロパゲーションに基づくエンコーダ最適化は ROME と等価であることが示され,タスク依存型特徴混合と固有雑音とのトレードオフが明らかになった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:44:35 GMT)
Instruction-Tuned, but Not More Verifiable Instruction-Following: A Cross-Task Diagnosis for LoRA Adapters [0.6] 我々は、名目訓練の目的が、実現されたクロスタスク能力の向上と確実に一致しているかをテストする。
我々の最も強い証拠は、IFEvalが測定したように、厳密で自動検証可能な命令に結びついています。
我々は、この名目逆転型ミスマッチパターンを、記述的なラベルとして機能ドリフトと呼ぶ。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:48:03 GMT)
Maximum Entropy Relaxation of Multi-Way Cardinality Constraints for Synthetic Population Generation [0.6] 多くのアプリケーションは、調査、専門家の知識、または自動的に抽出された記述から導かれる異種一元論、二元論、三元論の制約と一致する必要がある。
我々は,各個体が分類的属性によって記述され,対象が属性の組み合わせに対する大域的周波数制約の集合である集団を考察する。
統計物理学の手法を基礎として,この問題の最大エントロピー緩和を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 20:41:04 GMT)
Delineating hierarchical activity space from high-resolution urban mobility flows [0.6] 本研究では,様々な都市群で認識される活動空間の空間と階層性を導出する新しい階層的活動領域モデル(HARM)を提案する。
ニューヨーク市マンハッタン, ハリケーン・サンディ前後の旅行行動におけるモデルの有効性について, タクシーデータに基づく検討を行った。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:53:06 GMT)
MapForest: A Modular Field Robotics System for Forest Mapping and Invasive Species Localization [0.6] 大きな森林を横断する侵入樹種のモニタリングと制御は、アクセス性に制限があるため困難である。
マルチモーダルセンサデータをGIS対応の外来種マップに変換するモジュール型フィールドロボットシステムであるMapForestを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:04:56 GMT)
Global brain drain and gain in high-potential student mobility [0.5] 本研究では、LinkedIn Advertisingプラットフォームから匿名で集計されたデジタルトレースデータを用いて、102か国1,504人の卒業生の国際的モビリティをマッピングする。
アメリカは38.4%のエリートを獲得し、イギリス(7.9%)とカナダ(6.8%)が続く。
我々の分析によると、RGG(Relative Gender Gap)は+3.16%で、目的地によって顕著に変化する、控えめな男性の過剰表現を示している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:01:02 GMT)
Agent Control Protocol: Admission Control for Agent Actions [0.5] Agent Control Protocol (ACP) は、B2Bの機関環境における自律エージェントのガバナンスのための正式な仕様である。
ACPは、暗号化ID、能力に基づく認可、決定論的リスク評価、検証可能な連鎖デリゲート、不変監査のメカニズムを定義している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:44:39 GMT)
Quantifying Uncertainty in FMEDA Safety Metrics: An Error Propagation Approach for Enhanced ASIC Verification [0.5] 本稿では,FMEDAの安全性指標の計算に誤り伝搬理論を導入する新しい手法を提案する。
最大偏差を定量化し,SPFM と LFM の信頼区間を与えることにより,解析品質の直接測定を行う。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:07:21 GMT)
Chronological Contrastive Learning: Few-Shot Progression Assessment in Irreversible Diseases [0.5] 我々はChronoConを紹介した。ChronoConは、ラベルベースのランキングの損失を、縦スキャンのみから派生したランキングに置き換える、対照的な学習手法である。
非可逆性疾患における単調性進行の臨床的に妥当な仮定の下で、この方法は専門家のラベルを使わずに疾患関連表現を学習する。
低ラベル設定では、ChronoConはImageNetの重みから完全に教師付きベースラインを著しく上回っている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:53:04 GMT)
Agentic Personas for Adaptive Scientific Explanations with Knowledge Graphs [0.5] 本稿では,エージェントペルソナを組み込んだ科学的説明生成のための強化学習手法を提案する。
その結果,ペルソナによる説明は最先端の予測性能と一致していることがわかった。
エージェントペルソナは、複雑かつ高い領域におけるAIシステムのスケーラブルな適応的説明可能性を実現する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:35:40 GMT)
Ember: A Serverless Peer-to-Peer End-to-End Encrypted Messaging System over an IPv6 Mesh Network [0.4] 本稿では、分散IPv6メッシュネットワーク上でエンドツーエンドの暗号化通信を提供するサーバーレスピアツーピアメッセージングシステムであるEmberについて述べる。
Emberは、中央サーバーなしで動作し、暗号文のみのローカルストレージと時間ベースのメッセージの有効期限を通じて、データの最小化を強制する。
本稿では,システムアーキテクチャ,暗号設計,ネットワークモデル,セキュリティ特性について述べる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:59:35 GMT)
Model selection in hybrid quantum neural networks with applications to quantum transformer architectures [0.4] 量子,古典,ハイブリッドトランスフォーマーアーキテクチャを評価するためのフレームワークを開発する。
Simplicity Bias(texttSB$)とExpressivity(texttEXP$)について、さまざまなモデルを比較するリーンメトリクスを紹介します。
我々は、$texttQBET$によって、有望なモデルバリアントの効率的な事前スクリーニングが可能になることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:43:04 GMT)
No Dense Tensors Needed: Fully Sparse Object Detection on Event-Camera Voxel Grids [0.4] イベントカメラは、小型で高速で動くドローンを検出するのに適した、非同期で高ダイナミックなストリームを生成する。
ほとんどの事象ベースの検出器はスパース事象ストリームを密度の高いテンソルに変換し、ニューロモルフィックセンシングの表現効率を放棄する。
SparseVoxelDetは,バックボーンの特徴抽出,ピラミッド融合,検出ヘッドがすべて占有されたボクセル位置のみで動作する,イベントカメラ用初の完全スパース物体検出器である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:12:14 GMT)
You See It, They Don't: An Exploratory Study of User-to-User Variation in Instagram Comments [0.4] 2025年3月、MetaはInstagramユーザーに表示されるコメントの順序をランク付けする新しいAIシステムを発表した。
本稿では,異なるユーザに対して表示された可視的コメントの体系的差異をランキングシステムが生み出すかどうかを,小規模で調査した。
ニュース投稿の目に見えるコメントは、ニュース投稿よりもユーザーによって異なる可能性が低いことがわかりました。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:10:16 GMT)
RotorMap and Quantum Fingerprints of DNA Sequences via Rotary Position Embeddings [0.3] DNA配列などの小さなアルファベットからの文字列を量子符号化する。
これは、レヴェンシュテイン編集距離とエンコーディングによって定義される量子状態の間の忠実度との間に強い相関を与える。
量子デバイスでの使用には、RoPEから構築され、状態準備回路を直接出力するAngularエンコーディングを導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:41:43 GMT)
A Curated List of Open-source Software-only Energy Efficiency Measurement Tools: A GitHub Mining Study [0.3] エネルギー効率はソフトウェア開発の関心事となり、エネルギー消費を測定するツールが必要になった。
オープンソースのプロジェクトとしていくつかのエネルギー測定ツールが利用可能であるが、その特性と採用は未定である。
本研究では、GitHubで公開されているソフトウェアエネルギーモニタリングツールを特定し、分類し、分析するための、マイニングソフトウェアリポジトリ(MSR)アプローチに基づく実証的研究を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:11:53 GMT)
Emergent thermal fluctuations and non-Hermitian phase transitions in open photon condensates [0.3] 染料充填マイクロキャビティにおける開光子ボース-アインシュタイン凝縮体の非平衡ダイナミクスについて検討した。
駆動散逸性凝縮物は、ゴースト誘引体によって安定化された長寿命で準安定な台地を示す。
この動的安定化の非平衡な起源にもかかわらず、凝縮物は高原で準熱的変動を示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:47:55 GMT)
Semi-Automated Threat Modeling of Cloud-Based Systems Through Extracting Software Architecture from Configuration and Network Flow [0.3] クラウドデプロイメントには予期せぬ脅威、特に信頼性境界を越えて脆弱性を連鎖するマルチステージ攻撃が導入されている。
既存のセキュリティツールは、コンポーネントを分離して分析し、システム構成からアーキテクチャ上の脅威を検出できず、設定されたポリシーに対して実行時の動作を検証することができない。
本稿では、ランタイム観測からシステムアーキテクチャを自動的に推論し、継続的な脅威モデリングを可能にするという重要なイノベーションを通じて、このギャップに対処する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:57:53 GMT)
Casimir Geometry as a Probe of Short Range Forces [0.3] カシミール幾何学が独立観測可能であることを示す。
最初の制約は球面とプレートプレートの幾何学から導かれる。
本研究は,短距離力の体系的探索のための新しいハンドラとして幾何学を確立した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:00:16 GMT)
Mixed-Integer vs. Continuous Model Predictive Control for Binary Thrusters: A Comparative Study [0.2] バイナリオン/オフスラスタは、近接操作時の宇宙船の姿勢と位置制御に一般的に使用される。
これらの離散アクチュエータの制御は、混合整数最適化問題として明示的に定式化されるか、2層方式で処理される。
本稿では,2元スラスタ制御のための2つのパラダイム間の最初の系統的比較を行う。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:22:54 GMT)
Evaluating the Reliability and Fidelity of Automated Judgment Systems of Large Language Models [0.2] 審査員としてのLarge Language Model(LLM)は、被害者の機械学習(ML)モデル、特にLLMの品質を、その出力を分析して評価する。
審査員としてのLLMは、まったく新しい技術であるため、信頼性と人間の判断への同意について徹底的な調査を欠いている。
我々は,37種類の対話型LLMと5つの異なる判断プロンプト,第2レベルの判断概念,およびタスクを評価対象として微調整した5つのモデルとの併用の有効性を検証した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:12:29 GMT)
A Novel Method for Enforcing Exactly Dirichlet, Neumann and Robin Conditions on Curved Domain Boundaries for Physics Informed Machine Learning [0.2] 任意の曲面境界を持つ一般四辺領域上で、ディリクレ、ノイマン、ロビン型条件を正確に強制する体系的な方法を提案する。
本手法は,一般的な四次領域と標準領域の正確なマッピングに基づいて構築される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:30:33 GMT)
Tiny-ViT: A Compact Vision Transformer for Efficient and Explainable Potato Leaf Disease Classification [0.2] 本稿では,資源限定システムで使用される小型かつ効果的な視覚変換器(ViT)であるTiny-ViTモデルを提案する。
試験精度は99.85%で、平均CV精度は99.82%であり、DIT Small、SWIN Tiny、MobileViT XSといったベースラインモデルよりも優れている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:48:34 GMT)
Dyadic: A Scalable Platform for Human-Human and Human-AI Conversation Research [0.2] Dyadicは、テキストベースのチャットや音声ベースのチャットを使用して、人間とAIの会話を研究するWebベースのプラットフォームである。
Dyadicは他のプラットフォームと異なるのは、複数のモダリティ、AI提案、ライブ監視、サーベイデプロイメントによる研究を提供することだ。
Dyadicを直接運用するにはコーディングは不要で、既存の調査プラットフォームとの統合も提供されている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:25:45 GMT)
Predictive supremacy of informationally-restricted quantum perceptron [0.2] 情報制約計測に基づくパーセプトロン(IMP)と呼ばれるパーセプトロンのモデルを導入する。
我々は、量子パーセプトロンの利点を示すことができるパーセプトロンの特定の学習された値を見つける。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:02:23 GMT)
Post-selective attack with multi-mode projection onto Fock subspace [0.1] 本稿では、位相符号化された線形独立コヒーレント状態を用いた量子鍵分布プロトコルに対するポスト選択的攻撃を提案する。
この攻撃はFockサブスペースへの多重モードプロジェクションに依存しており、盗聴者による情報の確率的抽出を可能にする。
位相符号化された量子鍵分布プロトコルのいくつかの光学的実現法を解析し、その結果の適用性を示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:46:24 GMT)
Using spatiotemporal Born rule for testing macroscopic realism: some applications to the pseudo-density matrices and nonclassical temporal correlations [0.1] 擬似密度-ネウ行列のボルン則は逐次測定確率分布から逸脱することを示す。
PDMの構造に応じて時間的絡み合いの定義を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:35:40 GMT)
High-yield integration design of fixed-frequency superconducting qubit systems using siZZle-CZ gates [0.1] 固定周波数トランスモン量子ビットは、大規模量子コンピューティングのための有望なプラットフォームである。
siZle-CZゲートはクロス共振(CR)ゲートに代えて,スケーラブルで高速な衝突特性を有することを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:45:42 GMT)
Gate-based Readout and Cooling of Neutral Atoms [0.1] 光ツイーザー実験のための包括的アンシラベースツールボックスを提案する。
まず, アンシラをベースとした原子の繰り返し読み出しを行い, 複数ラウンドでの検出精度の向上を実現した。
第二に、ツイーザートリップされたストロンチウム原子の量子化された運動状態を利用して、電子から運動多様体へ量子情報を伝達する。
第3に, アシラ原子の電子状態に運動エントロピーを移すことにより, データ原子を決定的に冷却する回路ベースシーケンスであるアルゴリズム冷却を実証する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:24:26 GMT)
Static Scene Reconstruction from Dynamic Egocentric Videos [0.1] エゴセントリックビデオは、迅速なカメラの動きと頻繁なダイナミックな相互作用による3D再構成のユニークな課題を示す。
静的な復元バックボーンを長めのエゴセントリックなビデオに適応させる頑健なパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:19:46 GMT)
Toward a Theory of Hierarchical Memory for Language Agents [0.1] 3つの作用素の観点から統一理論を提案する。
文書階層、会話記憶、エージェント実行トレースにまたがる11の既存システムの分解をインスタンス化する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:35:13 GMT)
Timing In stand-up Comedy: Text, Audio, Laughter, Kinesics (TIC-TALK): Pipeline and Database for the Multimodal Study of Comedic Timing [0.1] TIC-TALKは、言語、ジェスチャー、オーディエンス応答を5,400以上の時間的に整列したトピックセグメントを持つマルチモーダルリソースである。
このパイプラインはBERTopicを60秒のテーマセグメンテーションに、密集した文の埋め込みに、Whisper-ATを0.8秒の笑い検出に、YOLOv8sを1fpsの生キーポイント抽出に組み合わせている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:46:15 GMT)
Fiber-optic quantum interface with an array of more than 100 individually addressable atoms on an optical nanofiber [0.1] 直径310nmの光ナノファイバーで導かれる光子間の量子界面を実現する。
個々の原子は、ナノファイバー上のマイクロスケールのトラップサイズを持つ200個の光ツイーザースポットの1次元配列に閉じ込められている。
このプラットフォームは、原子-光子インターフェースの新しいレギュレーションを開き、スケーラブルな分散量子コンピューティングと量子ネットワークへの道を開く。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:56:26 GMT)
LRC-WeatherNet: LiDAR, RADAR, and Camera Fusion Network for Real-time Weather-type Classification in Autonomous Driving [0.1] LRC-WeatherNetは、LiDAR、RADAR、カメラデータを統合して、気象条件のリアルタイム分類を行う、新しいマルチセンサー融合フレームワークである。
本手法は,天候変化時のセンサの信頼性の変化に適応する。
この研究は、自動運転において、堅牢でリアルタイムな気象分類のために3つのモードをすべて組み合わせた最初のものである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:49:33 GMT)
Identification of physiological shock in intensive care units via Bayesian regime switching models [0.0] 集中治療室(ICU)患者におけるオカルト出血(内出血)の検出は、クリティカルケアワーカーにとって重大な課題となる。
血液の喪失は必ずしも臨床的に明らかではないため、臨床医は出血の兆候を示す特定の傾向をモニターすることに依存する。
本論文は, 実際のICU患者33,924名を対象に, マヨクリニックから収集した包括的データセットに動機付けられている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:03:07 GMT)
Distance-Finding Algorithms for Quantum Codes and Circuits [0.0] 古典的符号や量子コードの距離は、誤りを検出する能力の反映となる重要な特徴である。
様々な古典的および量子的符号群に対して、幅広い距離探索法をベンチマークする。
我々はQDistEvolアルゴリズムを開発し、ベンチマークの量子LDPC符号に対してうまく動作することを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:52:23 GMT)
Accurate ground state energy estimation with noise and imperfect state preparation [0.0] 量子位相推定データの後処理のための古典的推定器を提案する。
提案手法は,公約領域外の付加位相と大域的非分極雑音の両方の存在下で頑健であることを示す。
複数の固有値と現実雑音の両方が存在する場合のモーメント投影推定器のロバスト性は、初期のフォールトトレラント量子実験において限られた深さの位相推定を実用的なものにしている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:04:52 GMT)
dynActivation: A Trainable Activation Family for Adaptive Nonlinearity [0.0] dynActivationの変種は、高いパフォーマンスを維持しながらディープレイヤを線形化する傾向がある。
新しく提案されたdynActGLU-variantは5620ステップ (4.047 vs. 4.514) でSwiGLUの相対パープレキシティを10.3%削減するが、ギャップは34300ステップで消滅する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:18:28 GMT)
Working towards a dialectical understanding of the political ideology within technological projects [0.0] 技術的プロジェクトの政治的イデオロギーを理解するための弁証的枠組みを開発する。
私は、プロジェクトの価値観と制約が、そのイデオロギーを理解するのにいかに必要かを強調しながら、批判的で解放的な社会科学の議論を描きます。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:08:14 GMT)
Triangulating Temporal Dynamics in Multilingual Swiss Online News [0.0] 本稿では,スイスの3つの主要言語地域(フランス語,ドイツ語,イタリア語)におけるデジタルメディアの時間的傾向について考察する。
我々は170万以上のニュース記事を収集し処理し、語彙メトリクス、名前付きエンティティ認識、Wikidataベースのリンク、ターゲットの感情分析、コンセンサスベースの変化点検出を適用した。
この発見は、時間的パターンを明確にし、言語的・文化的文脈が報告にどのような影響を及ぼすかを強調した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:27:00 GMT)
Transparent Screening for LLM Inference and Training Impacts [0.0] このフレームワークは、自然言語によるアプリケーション記述を境界環境推定に変換する。
不透明なプロプライエタリなサービスを直接測定する代わりに、監査可能なソースリンクされたプロキシ方法論を提供する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:47:55 GMT)
Transfer learning via interpolating structures [0.0] 現在の研究は、興味ある構造の間の情報のギャップを埋める中間構造を通して異種移動が達成される可能性を示唆している。
この技法の重要な側面は、材料の性質や幾何学のような様々なパラメータによって、ある構造を別の構造に連続的に変形させることができるという考えである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:46:21 GMT)
Theory Framework for Medium-Mass Muonic Atoms [0.0] 我々は、ムオン原子における境界状態エネルギーの計算のための最先端の理論的アプローチを提案する。
理論的不確かさを体系的に評価し,改良された量子電磁力学効果と核偏極補正を取り入れた。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:29:25 GMT)
The Semantic Ladder: A Framework for Progressive Formalization of Natural Language Content for Knowledge Graphs and AI Systems [0.0] データと知識のプログレッシブな形式化を可能にするアーキテクチャフレームワークであるSemantic Ladderを紹介します。
このフレームワークは意味的明示性を増すレベルにまたがって表現を整理する。
セマンティックエンリッチメント、ステートメント構造化、論理モデリングをサポートし、セマンティック連続性とトレーサビリティを保存する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:59:59 GMT)
Tangent equations of motion for nonlinear response functions [0.0] 本研究では,非線形応答関数を直接リアルタイムに計算するフレームワークを構築した。
我々のアプローチは函数空間の外部場に関してゲイトー微分に基づいている。
固体電子モデルに対する周波数分解5階応答関数の計算によりTEOMのパワーを実証する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:00:00 GMT)
Tacit Knowledge Management with Generative AI: Proposal of the GenAI SECI Model [0.0] 生成AIは、従来の知識管理システムの限界に対処する可能性がある。
この研究の多くは、明示的な知識の管理に関する研究と実践に焦点を当てている。
本稿では,知識創造プロセス(SECI)モデルの更新版として,GenAI SECIモデルを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:57:20 GMT)
TLS Certificate and Domain Feature Analysis of Phishing Domains in the Danish .dk Namespace [0.0] フィッシング攻撃は依然としてサイバーセキュリティの脅威だ。
本研究では、証明書メタデータとドメイン特性が、デンマークの.dk内の良性ドメインとフィッシングドメインを区別するのに役立つかどうかを検討する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:30:05 GMT)
TALUS: Threshold ML-DSA with One-Round Online Signing via Boundary Clearance and Carry Elimination [0.0] 我々は,ML-DSAの最初のしきい値構築であるTALUSを,99%のオンライン成功で1ラウンドのオンライン署名を実現した。
これをLattice 204 Threshold Trilemmaとして定式化し、ML-DSAノセ空間から任意のアーベル群への群準同型が同時に隠れ、結合できないことを証明した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:37:37 GMT)
Systematic construction of digital autonomous quantum error correction for state preparation and error suppression via conditional Gaussian operations [0.0] 条件付きガウス演算で実現可能なNullifier-based digital autonomous QECを提案する。
筆者らは, (i) 非ガウス資源状態の普遍計算のための決定論的準備, (ii) 猫と猫の排他的誤りを自律的に抑制する2つのユースケースを示した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:47:59 GMT)
Structural Concentration in Weighted Networks: A Class of Topology-Aware Indices [0.0] 本稿では,相互作用ネットワークに埋め込まれた重み付きシステムにおける集中度を計測するための統一的な枠組みを開発する。
Herfindahl-Hirschman Indexのような伝統的な指標は重みの分散を捉えるが、これらの重みを受ける要素間の関係の位相を無視する。
本稿では,重み分布とネットワーク構造を共同で考慮したトポロジ対応濃度指標の家系を紹介する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:41:12 GMT)
StreamSampling.jl: Efficient Sampling from Data Streams in Julia [0.0] StreamSampling$.$jlは、単一のパスでデータストリームをサンプリングする効率的な方法を提供するために設計されたJuliaライブラリである。
本稿では,従来のサンプリング手法に対するライブラリの機能とその優位性について述べる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:01:16 GMT)
Stoquastic permutationally invariant Bell operators [0.0] 本稿では,任意の PI Bell 演算子に対して,確率的パラメータ規則の完全な特徴付けを可能にする,確率性円錐を導入する。
数値的な証拠は、これまでで最大の実験で使われたベル作用素が確率性に関して最適であることを示している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:00:12 GMT)
Standalone optical frequency-offset locking electronics for atomic physics [0.0] 狭帯域レーザーを制御するためのスタンドアローン周波数オフセットロックシステムを提案する。
我々は、2つの周波数倍の1560nmレーザーを光学ビートノートを介して780nmで動作する安定一次レーザーにロックする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:13:43 GMT)
SegMaFormer: A Hybrid State-Space and Transformer Model for Efficient Segmentation [0.0] SegMaFormerは、階層的なボリュームエンコーダ内でMambaとTransformerモジュールを相乗化する軽量なハイブリッドアーキテクチャである。
SegMaFormerは3つの公開ベンチマーク(Synapse、BraTS、ACDC)で競合性能を達成する
提案手法はパラメータを最大75倍に削減し,現在の最先端モデルと比較してFLOPを大幅に削減する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:08:40 GMT)
SPDE Methods for Nonparametric Bayesian Posterior Contraction and Laplace Approximation [0.0] 非パラメトリックベイズモデルに対する後方収縮率 (PCR) と有限サンプルベルンシュタイン・フォン・ミーゼス (BvM) の結果を導出する。
また,後部に対する定量的なLaplace近似も確立した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:36:36 GMT)
Rule-State Inference (RSI): A Bayesian Framework for Compliance Monitoring in Rule-Governed Domains [0.0] ルールアクティベーション,コンプライアンス,パラメトリックドリフトの潜在状態を部分的および雑音観測から推定するルール状態推論(RSI)を提案する。
我々は、トゴレス財政システム上でRSIをインスタンス化し、実際のOTR規則に基づく2000の合成企業のベンチマークであるRSI-Togo-Fiscal-Synthetic v1.0を導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 06:12:52 GMT)
Riding Brainwaves in LLM Space: Understanding Activation Patterns Using Individual Neural Signatures [0.0] 凍結したQwen 2.5 7Bから隠れた状態をその人の脳波パワーにマッピングする。
個人固有のプローブは、テストされたすべての脳波機能において、単一の人口調査よりも優れています。
結果はアーキテクチャ全体(LLaMA 3.1 8B)で一致し、単語レベルのコンフォーンコントロールを継続する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:36:00 GMT)
Revisiting Quantum Code Generation: Where Should Domain Knowledge Live? [0.0] 本稿では,Qiskit-HumanEvalベンチマークを用いて,Qiskitコード生成のための特殊化戦略について検討する。
現代の汎用LLMはパラメータ特化ベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:46:39 GMT)
Resonance-Suppression Principle for Prethermalization beyond Periodic Driving [0.0] 非周期ドライブは、統一原理なしで広く異なる加熱スケーリングを示す。
この研究は、熱前の寿命までゆっくり加熱する共鳴抑制原理を特定する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:52:28 GMT)
Reasoning Provenance for Autonomous AI Agents: Structured Behavioral Analytics Beyond State Checkpoints and Execution Traces [0.0] Agent Execution Record (AER) は構造化された推論プリミティブであり、すべてのステップで第一級クエリ可能なフィールドとしてインテント、観察、推論をキャプチャする。
AERが集団レベルの行動分析を可能にする方法を示す: 推論パターンマイニング、信頼度校正、クロスエージェント比較、モックリプレイによる反事実回帰テスト。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:27:54 GMT)
Reasoner-Executor-Synthesizer: Scalable Agentic Architecture with Static O(1) Context Window [0.0] 本稿では,意図解析,決定論的データ検索と集約,物語生成を分離した3層アーキテクチャを提案する。
100のベンチマークで、RESはデータセットが42,000か1630万の項目を含むかどうかに関わらず、平均トークンコストが1,574である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:16:55 GMT)
Quotient Geometry, Effective Curvature, and Implicit Bias in Simple Shallow Neural Networks [0.0] 我々は,単純な浅層ネットワークを解析するための微分幾何学的フレームワークを開発した。
まず、正規浅層ネットワークパラメータの対称性と商構造を特徴付ける。
次に,パラメータ移動の水平成分のみが1次予測器の進化に寄与することを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:50:30 GMT)
Pseudospectral phenomena and the origin of the non-Hermitian skin effect [0.0] 非エルミート皮膚効果(NHSE)は、しばしばブロッホ・ハミルトニアンの非自明な点ギャップ位相に比定される。
非正規作用素の固有スペクトルは境界条件や一般的な摂動に非常に敏感であることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:34:25 GMT)
Probing the Spacetime Structure of Entanglement in Monitored Quantum Circuits with Graph Neural Networks [0.0] 量子多体系の大域的絡み合いは本質的に非局所的であり、局所的な観測から推測できるかどうかという問題を提起している。
観測された量子回路では、時空に分散した古典的なレコードを投影的に生成する。
グラフニューラルネットワーク(GNN)を用いて、個々の量子軌跡を有向時空グラフとして表現し、局所的な測定データのみから半鎖エントロピーを再構築する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:41:18 GMT)
Probabilistic modeling over permutations using quantum computers [0.0] 我々は、正確な確率モデルを量子状態の振幅に符号化する量子アルゴリズムを開発した。
我々は、そのようなアプローチのスケーリング、制限、実践的利用を想定し、非アベリア QFT の有用な応用への第一歩とみなす。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:00:12 GMT)
Preparing Fermions via Classical Sampling and Linear Combinations of Unitaries [0.0] フェルミオン量子状態の効率的なフォールトトレラント化を可能にするQubits (E$OQ) フレームワーク上でのEvolving density matricesの拡張を提案する。
元の方法はサンプリングによって状態の準備を回避しているが、フェミオン系では多くの必要な回路に繋がるサイン問題に直面している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:01:03 GMT)
Precision's arrow of time [0.0] PIR(Precision-induced Irreversibility)
非エルミート的進化は、数学的には可逆的であるが、与えられた精度で線形にスケーリングするシャープな時間的予測可能性の水平線を超えて、異なる状態は同一の表現に崩壊する。
Echo-fidelityテストは、任意の精度の計算とハードウェアの間でこの遷移を確認し、形式的な可逆性と物理的可逆性がどこで分岐するかを明らかにする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:59:50 GMT)
Politics of Questions in News: A Mixed-Methods Study of Interrogative Stances as Markers of Voice and Power [0.0] 現代フランス語デジタルニュースにおける「質問の論理」について考察する。
疑似姿勢を検出し、それらの機能型を近似し、現在あるときのテキスト回答を特定する。
質問は、同じ記事の中で圧倒的に取り上げられ、通常、その後の回答のようなスパンにリンクされていることを示唆している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:04:30 GMT)
Partial Attention in Deep Reinforcement Learning for Safe Multi-Agent Control [0.0] 高速道路の合併シナリオにおいて、自動運転車を制御するニューラルネットワークの設計を具体的に検討する。
環境のグローバルな目的を考慮した包括的報酬信号を提案する。
その結果、安全性、運転速度、報酬の点で他の運転アルゴリズムよりも優れた性能を示した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:53:34 GMT)
PRISM: Breaking the O(n) Memory Wall in Long-Context LLM Inference via O(1) Photonic Block Selection [0.0] 長文LLM推論は、デコードステップ毎にKVキャッシュをスキャンするO(n)メモリ帯域幅コストによってボトルネックとなる。
最近のフォトニック加速器は、高密度注意計算のための驚くべきスループットを実証している。
我々は、この知見を、薄膜のニオブ酸リチウム類似性エンジンであるPRISMでインスタンス化する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:55:56 GMT)
OrgForge-IT: A Verifiable Synthetic Benchmark for LLM-Based Insider Threat Detection [0.0] 本稿では,決定論的シミュレーションエンジンが基底真理を維持し,言語モデルが表面の散文のみを生成する検証可能な合成ベンチマークを提案する。
コーパスは51日の模擬日、2,904回のテレメトリ記録を96.4%のノイズレートで記録し、単面と単日のトリアージ戦略を破るために設計された4つの検出シナリオをカバーしている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:03:53 GMT)
Optimizing Multi-Agent Weather Captioning via Text Gradient Descent: A Training-Free Approach with Consensus-Aware Gradient Fusion [0.0] We introduced WeatherTGD, a training-free multi-agent framework that repreprets collaborative excuse refinement through the Lens of Text Gradient Descent (TGD)。
本システムでは,気象時系列観測からドメイン固有のテキスト勾配を生成する,統計分析器,物理解釈器,気象専門家の3つの特殊なLCMエージェントを配置する。
実世界の気象データを用いた実験により、LLMに基づく評価と人間の専門家による評価の両方において、WeatherTGDが大幅な改善を達成していることが示された。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:55:45 GMT)
On the stability to noise of fermion-to-qubit mappings [0.0] 局所的なユニタリの層と一般の1量子ビットのパウリノイズを交互にモデル化したD$次元のノイズ量子回路を考える。
局所フェルミオン符号化を用いる場合、二次フェルミオン観測器の期待値は、空間的に減衰する相関を持つ状態のノイズに対して安定であることを示す。
本研究は,物理系の崩壊相関が局所フェルミオン符号化の雑音に対する保護を与えるという直感を定式化した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:03:49 GMT)
On the Failure of Topic-Matched Contrast Baselines in Multi-Directional Refusal Abliteration [0.0] 本研究は、位相的に一致したコントラストベースラインがより優れた拒絶方向をもたらすかどうかを考察する。
その結果, トピックマッチングコントラストは任意の重量レベルで機能的拒絶方向を生じないことがわかった。
読み上げ研究におけるコントラストベースラインの設計の意味について論じる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:55:00 GMT)
On single-frequency asymptotics for the Maxwell-Bloch equations: pure states [0.0] 2レベル分子に結合した単一モードのマクスウェル場に対する減衰駆動マクスウェル・ブロッホ方程式を考える。
我々の主な成果は、準周期ポンプの場合のマクスウェル場の単一周波数での解の構築である。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:41:26 GMT)
Numerical security framework for quantum key distribution with bypass channels [0.0] 衛星ベースの量子鍵分布は、長距離で安全な鍵交換を確立することを目的としている。
Ghalaii et al. は、ある大きさまでの空中盗難機は、古典的な監視技術によって検出できると提案した。
これは新しいQKDシナリオを生み出し、アリスからボブへの送信信号の一部がイヴを完全にバイパスする。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:32:56 GMT)
Measuring Faithfulness Depends on How You Measure: Classifier Sensitivity in LLM Chain-of-Thought Evaluation [0.0] 連鎖忠実性に関する最近の研究は、単一集合数について報告している。
本論文は、忠実性はモデルの客観的かつ測定可能な性質ではないことを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:10:16 GMT)
Materials Beyond Hamiltonian Limits -- Quantum Measurement as a Resource for Material Design [0.0] 近年の研究では、従来の電子構造理論の範囲を超えて振舞う材料や装置が特定されている。
本稿では、ユニタリプロジェクティブ電子動力学の基礎を探求し、得られた量子材料とその機能について概観する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:06:49 GMT)
MIND: Multi-agent inference for negotiation dialogue in travel planning [0.0] 旅行者間の現実的なコンセンサス構築を異質な嗜好でシミュレートするフレームワークであるMINDを提案する。
MINDは、90.2%の精度で言語的ニュアンスから反対の意志(w)を推測する戦略的な評価段階を導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:31:15 GMT)
MAGPI: Multifidelity-Augmented Gaussian Process Inputs for Surrogate Modeling from Scarce Data [0.0] 本研究はガウス過程回帰に対する新しい多忠実性学習手法を提案する。
低忠実度データを使用して、学習したモデルの入力空間を拡大する追加機能を定義する。
いくつかの試験問題に関する数値実験は、予測精度の向上と計算コストの削減の両方を示している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:49:38 GMT)
Low Latency GNN Accelerator for Quantum Error Correction [0.0] ニューラルネットワークをベースとしたデコーダのFPGAアクセラレータを,より低い論理誤差率を達成する方法として提案する。
我々は、GNNベースのデコーダに異なるハードウェアを意識した最適化を適用することで、この目標を達成した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:14:52 GMT)
Lie to Me: How Faithful Is Chain-of-Thought Reasoning in Reasoning Models? [0.0] CoT(Chain-of- Thought)推論は、安全クリティカルなデプロイメントにおける大規模言語モデルの透明性メカニズムとして提案されている。
本研究では,9つの建築家族を対象としたオープンウェイト推論モデルを498の質問に対して検討した。
41,832回の推論では、全体の忠実度は39.7% (Seed-1.6-Flash) から89.9% (DeepSeek-V3.2- Speciale) まで変化している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:21:37 GMT)
Learning When to Act: Interval-Aware Reinforcement Learning with Predictive Temporal Structure [0.0] 本稿では,経験から認知的ティッチ間の最適間隔を学習する,軽量な時間制御システムを提案する。
また、選択した待ち時間に対する非効率性を明示するインターバルアウェア報酬を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:46:17 GMT)
Latent Style-based Quantum Wasserstein GAN for Drug Design [0.0] 本稿では,回路の各回転ゲートにノイズエンコーディングを実装した,薬物設計のための新しいスタイルベースの量子GANアーキテクチャを提案する。
我々のパイプラインは、潜伏空間の分子構造を表現するために変分オートエンコーダを使用し、QGANの入力として使用される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:00:12 GMT)
LLM-Powered Flood Depth Estimation from Social Media Imagery: A Vision-Language Model Framework with Mechanistic Interpretability for Transportation Resilience [0.0] FloodLlamaは、単一ストリートレベルの画像から連続的な洪水深度を推定するための微調整された視覚言語モデルである。
TikTokベースのデータパイプラインは、デトロイトの676の注釈付き洪水フレームで検証されており、リアルタイムのクラウドソースによる洪水検知の可能性を示している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 20:39:33 GMT)
Instruction Set and Language for Symbolic Regression [0.0] すべての表現DAGは、同じ表現をエンコードする多くの異なるノード番号スキームを許容する。
コンパクトな2層アルファベット上の文字列として表現DAGを符号化する表現フレームワークであるIsalSRを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:21:53 GMT)
Implicit Humanization in Everyday LLM Moral Judgments [0.0] 近年,対話型情報システムの導入により,個人アドバイス検索などの複雑なタスクを含むユーザクエリの範囲が拡大している。
我々は,潜在的に有害な人為的予測を有する道徳的判断の要求として,特定のタイプのアドバイスを識別する。
本研究では, 言語的, 行動的, 認知的人為的手がかりを用いて, 4つの主要汎用LSMの応答におけるこれらの仮定の強化について検討した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 02:48:54 GMT)
Implemetation of a shooting technique for quantum optimal control on spin qudits [0.0] 有限次元ヒルベルト空間の系に対するシューティングベース量子最適制御アルゴリズムを提案する。
単分子磁石にインスパイアされたシステム上での数値シミュレーションにより,その性能を実証する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:22:19 GMT)
Identifiability and amortized inference limitations in Kuramoto models [0.0] シミュレーションされた位相ダイナミクスから後肢の神経近似を学習するアモータイズされたベイズ推論手法を提案する。
本手法は, 後部分布の近似と不確かさの把握において, 有望な結果を示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:46:10 GMT)
IPSL-AID: Generative Diffusion Models for Climate Downscaling from Global to Regional Scales [0.0] IPSL-AIDは,拡散確率モデルに基づくグローバルから地域的なダウンスケーリングツールである。
粗い入力と時間的文脈を用いて、気温、風、降水に対する0.25度の分解能場を生成する。
極端事象、パワースペクトル、空間構造などの統計分布を正確に再構成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:27:54 GMT)
Hyperloss from coherent spatial-mode mixing in quantum-correlated networks [0.0] 量子関連ネットワークは、圧縮された状態や絡み合った状態のような量子資源を分散する。
損失によるデコヒーレンス(英語版)は、強い量子優位性への支配的な障害である。
本研究では,高次空間モードとのコヒーレントな空間モード混合により,100%以上の損失が生じることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:45:07 GMT)
High Resolution Flood Extent Detection Using Deep Learning with Random Forest Derived Training Labels [0.0] プラネットスコープのような高周波で高解像度の光学画像(3m)は、洪水マッピングの新しい機会を提供する。
機械学習(ML)とディープラーニング(DL)アルゴリズムを用いて,PlanetScopeの光学画像と地形特徴を統合するフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:26:46 GMT)
HMS-VesselNet: Hierarchical Multi-Scale Attention Network with Topology-Preserving Loss for Retinal Vessel Segmentation [0.0] HMS-VesselNetは階層的なマルチスケールネットワークで、異なる解像度で4つの並列ブランチにまたがるファンドイメージを処理する。
DRIVE、STARE、CHASE_DB1の68枚の画像を5倍のクロスバリデーションでテストし、平均Diceの88.72 +/- 0.67%、感度90.78 +/- 1.42%、AUCの98.25 +/- 0.21%を達成した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:16:45 GMT)
GraphRAG for Engineering Diagrams: ChatP&ID Enables LLM Interaction with P&IDs [0.0] 大規模言語モデル(LLM)とRAG(Retrieval-Augmented Generation)と知識グラフを組み合わせることで、エンジニアリング図と対話する新たな機会を提供する。
この研究は、P&IDとの基盤的かつ費用対効果の高い自然言語インタラクションを可能にするエージェントフレームワークであるChatP&IDを導入している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:44:02 GMT)
Graph-Aware Late Chunking for Retrieval-Augmented Generation in Biomedical Literature [0.0] GraLC-RAGは、グラフ認識構造インテリジェンスと遅延チャンキングを統合するフレームワークである。
2,359 IMRaD-filtered Centralの項目に対して,2,033の横断質問を用いた6つの戦略を評価する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 23:22:58 GMT)
Geometric Thermodynamics in Open Quantum Systems: Coherence, Curvature, and Work [0.0] 制御多様体上の力学をパラメータ化することにより、開量子系の準静熱力学の幾何学的枠組みを定式化する。
準静的極限において、系は定常状態の多様体に従い、サイクル上で実行される作業は曲率2-形式のフラックスによって与えられる。
熱定常状態の場合、曲率は等方的であり、瞬時エネルギースケールにのみ依存する。
このコヒーレンスによって曲率が逆転し、異方性と符号が変化し、サイクルの配置と向きに敏感に作用することを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:21:19 GMT)
Generating Synthetic Wildlife Health Data from Camera Trap Imagery: A Pipeline for Alopecia and Body Condition Training Data [0.0] カメラトラップ画像の野生生物の健康状態には、公開されていないML準備データセットがある。
実写カメラトラップ写真からアロペシアと野生動物の体調劣化を描写した合成訓練画像を生成するパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:35:28 GMT)
Generalized multi-object classification and tracking with sparse feature resonator networks [0.0] 視覚的シーン理解タスクでは、不変構造と同変構造の両方を捉えることが不可欠である。
本稿では,共振器ネットワークを用いた解析・合成・ファクタリング手法を提案する。
共振器は数ピクセルの精度で複数の移動物体を追跡するように設計されていることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 20:01:07 GMT)
Generalized Sequential Monte Carlo Sampling for Redistricting Simulation [0.0] マッカータンとイマイの逐次モンテカルロアルゴリズム(SMC)を一般化する(2023年)。
一般化されたSMC (gSMC) アルゴリズムは1つの領域ではなく任意の大きさの領域を分割することができ、複数の領域をサンプリングすることができる。
提案手法の有効性を,複数選挙区からなるアイルランド議会と,200以上の選挙区を有するペンシルベニア州下院の分析を通じて実証する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:48:43 GMT)
Generalization Limits of In-Context Operator Networks for Higher-Order Partial Differential Equations [0.0] 基礎モデルによって扱われる微分方程式の型と範囲を拡大することにより、過去の研究を拡張した。
複雑な入力を処理するにはいくつかの新しい計算方法が必要であるが、基礎となる機械学習技術は単純な場合と大きく一致している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 03:44:30 GMT)
Functionalization of Situated Robots via Vapour [0.0] 体をシチュー(例えば回転させること)で構築する位置決めされたロボットは、周囲をうまく利用するために一意に配置されている。
本研究では,環境中で利用可能な材料を用いて,現場のスパンウェブを機能化し,ペイロードを削減し,その構造を周囲と一意にマッチングする手法を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:22:47 GMT)
Functional Component Ablation Reveals Specialization Patterns in Hybrid Language Model Architectures [0.0] 2つのサブ-1Bハイブリッドモデルに適用した機能的コンポーネントアブレーションフレームワークを提案する。
両方のコンポーネントタイプが必須であり、どちらもバイパスされていないことが分かりました。
これらの結果は、ハイブリッドモデル圧縮、アーキテクチャ設計、フォールトトレラントデプロイメントのための実用的なガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:41:49 GMT)
From Technical Debt to Cognitive and Intent Debt: Rethinking Software Health in the Age of AI [0.0] この記事では、ソフトウェアの健全性を説明するために、三重の負債モデルを提案します。
それは、コードの技術的負債、人の認知的負債、外部的知識における意図的負債の3つの相互作用する負債タイプに基づいて構築されます。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:36:23 GMT)
From Diffusion To Flow: Efficient Motion Generation In MotionGPT3 [0.0] MotionGPT3は、学習された連続的な潜伏空間と、テキスト条件合成のための拡散に基づく先行空間を結合する。
我々は、MotionGPT3フレームワーク内の拡散と修正フローの目的を比較した。
実験により、整流流はより少ない訓練エポックに収束し、より早く強い試験性能に達し、拡散に基づく運動品質に適合または超えることを示した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 09:44:07 GMT)
Framework for Risk-Based IoT Cybersecurity Audit Engagements [0.0] IoTデバイスは、企業や産業の環境で一般的に見られる。
これらのデバイスが普及しているにもかかわらず、セキュリティの監査方法に関する文献はほとんどない。
本稿では,内部監査と外部監査の両方で使用可能なリスクベースの監査フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:50:12 GMT)
Evolutionary Warm-Starts for Reinforcement Learning in Industrial Continuous Control [0.0] 強化学習(Reinforcement Learning, RL)は, 実環境において信頼性のあるエージェントの訓練が難しいこともあって, 産業制御に応用されることは稀である。
本研究は,産業ソートベンチマークの連続的な制御適応を導入することにより,RLの進化戦略がそのような環境でどのようにサポートできるかを考察する。
CMA-ESアルゴリズムは、RLエージェントを温めるための高品質なデモンストレーションを生成するために使用される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:17:23 GMT)
EpiMask: Leveraging Epipolar Distance Based Masks in Cross-Attention for Satellite Image Matching [0.0] ディープラーニングに基づく画像マッチングネットワークは、視点や照度の大きなバリエーションを扱うことができる。
衛星画像のための半密度画像マッチングネットワークであるEpiMaskについて述べる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 00:48:58 GMT)
Engineering Distributed Governance for Regional Prosperity: A Socio-Technical Framework for Mitigating Under-Vibrancy via Human Data Engines [0.0] 本稿では,生物危機管理における社会工学的枠組みである分散ヒューマン・データ・エンジン(DHDE)について紹介する。
福井県(福井県)の高粒度データを用いて,AI駆動型意思決定支援システム(DSS)を用いて2つのデータセットを解析する。
我々は、失った収益で約11.96億円(約7620万円)に相当する865,917回の非現実的訪問の機会ギャップを定量化する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 07:14:34 GMT)
Energy-Aware Collaborative Exploration for a UAV-UGV Team [0.0] 未知の環境で運用するUAV-UGVチームのためのエネルギー対応共同探査フレームワークを提案する。
我々は密度対応層状確率的ロードマップを用いて、疎結合の空地ロードマップを構築した。
本手法はシミュレーション,ベンチマーク比較,実世界の実験を通じて検証する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:14:01 GMT)
Empirical Evaluation of Link Deletion Methods for Limiting Information Diffusion on Social Media [0.0] リンク削除手法は、ソーシャルネットワーク上の情報拡散カスケードのサイズを減らすのに有効であることが示されている。
本研究では,リツイートカスケードの実際のログを用いてリンク削除手法の有効性を評価する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 01:14:59 GMT)
Drinfeld Center as Quantum State Monodromy over Bloch Hamiltonians around Defects [0.0] ドリンフェルト中心融合圏 $mathcalZ(mathrmVec_G)$ は、ある格子モデルにおける任意のモデルをモデル化したことで有名である。
ここでは、その融合規則が、分数的トポロジカル絶縁体材料におけるトポロジカル秩序をどう記述するかを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:34:17 GMT)
Dressed-state master equation for two strongly coupled two-level atoms with long-lived entanglement [0.0] 我々は、2つの強く結合した2レベル原子に対してリンドブラッド形式で着飾った状態のマスター方程式を導出する。
結果として生じる減衰ダイナミクスは、異なる状態を持つリンドブラッド作用素によって支配される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:36:14 GMT)
Domain-Guided YOLO26 with Composite BCE-Dice-Lovász Loss for Multi-Class Fetal Head Ultrasound Segmentation [0.0] 我々は、YOLO26-Segの上にプロンプトフリーパイプラインを構築し、脳、Cavum Septi Pellucidi(CSP)、横室(LV)の3つの構造を共同で検出し、セグメント化する。
i) 逆周波数クラス重み付けによる複合BCE-Dice-Lovszセグメンテーション損失を、実行時サルパッチングによるYOLO26トレーニングループに注入すること、(ii) 脳境界に対する解剖学的位置を尊重しながら、少数クラス構造を移植するドメイン誘導コピーペースト増強をすること、(iii) 患者間階層化。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:02:57 GMT)
Do Multilingual VLMs Reason Equally? A Cross-Lingual Visual Reasoning Audit for Indian Languages [0.0] インド語における最初の言語間視覚的推論監査について紹介する。
MathVista、ScienceQA、MMMUの980の質問はヒンディー語、タミル語、テルグ語、ベンガル語、カンナダ語、マラタイ語に翻訳される。
英語からインド語に切り替えた場合、精度は9.8~25ポイント低下する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:56:02 GMT)
Do Large Language Models Reduce Research Novelty? Evidence from Information Systems Journals [0.0] 私は、2020年から2025年にかけて、44のインフォメーション・システムズ誌に掲載された13,847の論文のセマンティックノベルティを測定します。
非英語圏の機関に加盟する作家は、英語圏の作家と比較して、相対的新奇性における標準偏差が0.18減少している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:16:54 GMT)
Do Consumers Accept AIs as Moral Compliance Agents? [0.0] 消費者は通常、倫理的な意思決定に人工知能が関与することに抵抗する。
本研究は、消費者が道徳的コンプライアンスの役割においてAIを受け入れるかどうかを調査する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:36:56 GMT)
Dissipative free fermions in disguise [0.0] FFDフレームワークを、ゴリニ-コサコフスキー-スダルシャン-リンドブラッド方程式によって支配されるオープン量子システムに拡張する。
この結果は、オープン量子系におけるFFD機構の最初の実現をもたらす。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:25:25 GMT)
Development of Biphoton Entangled Light Spectroscopy (BELS) using Bell pairs [0.0] 本稿では、偏光エンタングルドベル対と2光子干渉による材料特性の探究を行う量子分光法であるBiphoton Entanglement Light Spectroscopy (BELS)を紹介する。
BELSでは、測定された信号は単光子強度ではなく、二重光子ベル対の共分極と経路相関の変化から生じる。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 20:11:56 GMT)
Detection Time Distribution Predicted Using Absorbing Boundary Conditions and Imaginary Potentials [0.0] スピン0または1/2の1つの非相対論的量子粒子を含む実験装置の予測分布を計算した。
この分布は検出器の波動関数の部分反射の兆候を示す。
私たちは予測を、DasとDrの競合する予測と比較します。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:43:18 GMT)
Decoupling Scores and Text: The Politeness Principle in Peer Review [0.0] 著者はしばしばピアレビューのフィードバックを解釈するのに苦労し、丁寧なコメントから誤った希望を導き、特定の低いスコアで混乱していると感じている。
我々は,3万件以上のICLR 2021-2025のデータセットを構築し,数値スコアを用いた受入予測性能とテキストレビューを比較した。
スコアベースモデルでは91%,テキストベースモデルでは81%,大規模言語モデルでは81%であった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:58:48 GMT)
Data Curation for Machine Learning Interatomic Potentials by Determinantal Point Processes [0.0] 機械学習の原子間ポテンシャルの開発は、有用なトレーニングデータセットの生成とラベル付けによって、重要な計算ボトルネックに直面している。
本稿では, 量子力学的手法による参照エネルギーと力のラベル付けを行うために, 原子構成の情報的部分集合を選択するタスクに対して, 決定点過程(DPP)の新たな適用法を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:22:19 GMT)
DATASHI: A Parallel English-Tashlhiyt Corpus for Orthography Normalization and Low-Resource Language Processing [0.0] DATASHIは、Amazigh言語における計算リソースの重大なギャップを埋める、新しい並列英語タシュレイトコーパスである。
5000の文対を含み、1500文のサブセットがあり、専門家の標準化と非標準のユーザ生成バージョンがある。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 04:46:59 GMT)
Current LLMs still cannot 'talk much' about grammar modules: Evidence from syntax [0.0] 我々は、本や雑誌記事など、以前の生成構文から44の用語を収集し、この分野の経験から収集した。
両翻訳を解析・比較し,分析に分析的および比較的アプローチを用いた。
大規模な言語モデルは、研究中の用語に埋め込まれた中核的な構文特性について「多くを語る」ことはできない。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:03:31 GMT)
Cross-Context Verification: Hierarchical Detection of Benchmark Contamination through Session-Isolated Analysis [0.0] Cross-Context Verification (CCV) は、N個の独立したセッションで同じベンチマーク問題を解決するブラックボックス方式である。
9つのSWE分岐検証問題(45の試験、クロードオプス4.6、温度0)では、CCVは汚染されたものと真の推論との間の完全な分離を達成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 00:18:34 GMT)
Connecting Distributed Ledgers: Surveying Novel Interoperability Solutions in On-chain Finance [0.0] 本稿では,分散台帳の効率的なセキュアな通信を実現する上で,相互運用の重要性を強調した。
本研究の目的は、クロスチェーンの相互運用性ソリューションの交差と、オンチェーンファイナンスにおけるその影響に関する実証研究を効率化し、加速することである。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 10:41:11 GMT)
Conformal Koopman for Embedded Nonlinear Control with Statistical Robustness: Theory and Real-World Validation [0.0] 離散時間非線形システムの統計的に堅牢な制御のためのデータ駆動型クープマンベースのフレームワークを提案する。
我々は、軌道全体の状態依存モデリングの不確実性に縛られ、安全性と堅牢性を確保する。
本手法は,Dubins車を用いた数値シミュレーションと,高非線形羽ばたき翼ドローンを用いた実世界実験の両方において検証した。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:04:32 GMT)
Computer-Orchestrated Design of Algorithms: From Join Specification to Implementation [0.0] 本稿では,TreeTracker Join(mathsfTTJ$)の論理物理学的共同設計に利用したコンピュータオーケストレーションテストフレームワークを提案する。
$mathsfCODA$は、状態の管理ミスやジョインツリーとブッシープラン間のコンフリクトのマッピングなど、微妙な翻訳欠陥をうまく分離する。
これらの翻訳課題に直面することが、$mathsfCODA$のアーキテクチャ上の進化を、ジョインツリー依存アルゴリズムのための堅牢で構造を意識したテスト生成パイプラインにどのように引き起こしたかを詳述する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:53:05 GMT)
Collision-Free Velocity Scheduling for Multi-Agent Systems on Predefined Routes via Inexact-Projection ADMM [0.0] 構造化マルチエージェントプロジェクトでは、エージェントは事前に定義されたルートをたどらなければならず、リルーチンや不可能となる。
本稿では,各エージェントの割り当てられた経路の順序と名前付き経路の割り当てを保ちながら,経路制約付きマルチエージェント協調に対処する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:34:18 GMT)
CayleyPy-4: AI-Holography. Towards analogs of holographic string dualities for AI tasks [0.0] これは、大規模なグラフの探索にAIメソッドを適用するCayleyPyプロジェクトにおける4番目の論文である。
この設定に対して新たなホログラフィック弦双対性が存在することを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:54:44 GMT)
Causal Discovery in Action: Learning Chain-Reaction Mechanisms from Interventions [0.0] 因果グラフは介入データからでも識別できないため、一般的な力学系では因果発見は困難である。
このような連鎖反応系における因果発見について検討し、その因果構造が干渉の妨害から一意に識別可能であることを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 22:45:15 GMT)
Canonically consistent quantum master equation for proton-transfer reactions [0.0] 正準一貫した量子マスター方程式(CCQME)は、システムバス力学を扱うために用いられる。
我々はCCQMEを数値的に正確な運動方程式(HEOM)理論と比較した。
その結果,システムバス結合強度が増大するにつれて,レッドフィールドダイナミクスはHEOM参照から徐々に逸脱することが明らかとなった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:56:30 GMT)
Can Large Language Models Detect Methodological Flaws? Evidence from Gesture Recognition for UAV-Based Rescue Operation Based on Deep Learning [0.0] 我々は、人間中心の小さなデータセット上で、ほぼ完璧な精度を報告しているジェスチャー認識紙を分析した。
評価プロトコルは、非独立的なトレーニングとテストの分割により、主観レベルのデータ漏洩と整合性を示す。
次に、この欠陥が6つの最先端LCMによって独立に検出できるかどうかを評価する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:39:16 GMT)
CaRBM: A Fixed-Depth Quantum Algorithm with Partial Correction for Thermal State Preparation [0.0] 固定深熱状態調製のためのCARBMアルゴリズムを提案する。
提案アルゴリズムは,温度が低下するにつれてブロック符号化の成功確率が低下し,高温で高い性能を発揮する。
XXZモデルの分割関数ゼロとGross-Neveuモデルの位相図を計算してアルゴリズムを実証する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:43:41 GMT)
CTF as a Service: A reproducible and scalable infrastructure for cybersecurity training [0.0] 本稿では, Proxmox 仮想化上に構築された CTF as a Service (C) プラットフォームの設計,開発,評価について述べる。
システムは開発中心のワークフローをサポートし、CI/CDパイプラインを通じてGitリポジトリからチャレンジを自動的にデプロイすると同時に、アドホックなインフラストラクチャプロビジョニングのためのデプロイメント指向ワークフローもサポートする。
プラットフォームは商用の可能性を秘めたCTFホスティングサービスに進化するよう設計されており、今後の作業ラインは自動スケーリング、監視、統合、標準化について概説されている。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:17:16 GMT)
CRPS-Optimal Binning for Conformal Regression [0.0] そこで本研究では,共分類観測を連続したビンに分割した非パラメトリック条件分布推定法を提案する。
非整合性スコアとしてCRPSに基づくVenn予測バンドと共形予測セットの2つの補完的予測オブジェクトを形成する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 14:07:09 GMT)
BOOST-RPF: Boosted Sequential Trees for Radial Power Flow [0.0] 本稿では,グローバルグラフ回帰タスクからの電圧予測を逐次パスベース学習問題に変換する新しい手法であるBOOST-RPFを紹介する。
本研究では, 絶対電圧, 親残差, 物理インフォームド残差の3種類のアーキテクチャ特性を評価する。
Kerber DorfnetzグリッドとENGAGEスイートに対してベンチマークされ、BOOST-RPFは最先端の結果を得る。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:41:36 GMT)
BHDD: A Burmese Handwritten Digit Dataset [0.0] 10級ビルマ数字の87,561グレースケール画像の収集。
トレーニングセットは6万のサンプルをクラス間で均等に分割する。
我々は,データセットのクラス分布,画素統計,形態変化を分析し,ミャンマー文字の数字形状を同定する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:31:57 GMT)
Autoregressive vs. Masked Diffusion Language Models: A Controlled Comparison [0.0] 自己回帰 (AR) とマスク拡散 (MDLM) 言語モデルを比較した。
どちらのモデルも、同じデータ(TinyStoriesの5000万トークン)、同じ計算予算(20,000ステップ、バッチサイズ32、シーケンス長512)、同じハードウェアでトレーニングされている。
両方のパラダイムは同等のトレーニングスループット(50Kトークン/秒)を達成し、MDLMは4.7%のウォールクロック時間しか必要としない。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 15:07:00 GMT)
Automating Sexual Injustice: Epistemic Injustice in Fembot Design and Feminist Directions for Equitable HRI [0.0] 現在のAI対応の女性性ロボット("fembots")は、主に女性の性反応をシミュレートするように設計されている。
本論では,フェムボットの発達は,女性の性経験の実証的真実よりも,男性のヘドニズム的幻想を優先することで,「画期的不公平」を持続させると主張している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 21:34:44 GMT)
Architecture-Derived CBOMs for Cryptographic Migration: A Security-Aware Architecture Tradeoff Method [0.0] アルゴリズムの廃止、規制変更、および量子後の準備性によって引き起こされる暗号マイグレーションは、暗号資産の在庫以上のものを必要とします。
既存のCBOM(Cryptographic Bills of Materials)は通常、ツールまたはインベントリ由来である。
本稿では,シナリオベースアーキテクチャ評価のセキュリティ対応であるSATAM(Security-Aware Architecture Tradeoff Analysis Method)を紹介する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:15:27 GMT)
Anderson transition in disordered Hatano-Nelson systems [0.0] 非エルミート皮膚効果と欠陥誘発アンダーソン局在の遷移の基本的なメカニズムを解明する。
固有値に関連する位相不変量の変化は、非エルミート皮膚効果からアンダーソン局在への固有ベクトル交叉と一致することを示す。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 19:52:34 GMT)
An Intelligent Framework for Real-Time Yoga Pose Detection and Posture Correction [0.0] ヨガ練習中の不適切なアライメントは効果を減少させ、筋骨格損傷のリスクを増大させる。
本稿では,リアルタイムヨガポーズ検出と姿勢修正のためのハイブリッドエッジAIベースのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 17:37:59 GMT)
An Energetic Constraint for Qubit-Qubit Entanglement [0.0] 量子ビットの絡み合いをエネルギー的観点から解析する。
それぞれの量子ビット内部エネルギーをコヒーレント成分と非コヒーレント成分に分解する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 05:10:48 GMT)
All elementary functions from a single binary operator [0.0] 単一のバイナリ作用素 eml(x,y)=exp(x)ln(y) と定数 1 は、科学計算機の標準的なレパートリーを生成する。
Exp-Minus-Log (Exp-Minus-Log) 形式では、そのような式はすべて同一ノードのバイナリツリーとなり、$S から 1 の中間名eml(S,S)$ の文法が生成される。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:40:24 GMT)
Albank -- a case study on the use of ethereum blockchain technology and smart contracts for secure decentralized bank application [0.0] ブロックチェーンのような新しい技術は、さまざまなシステムの弱点、特にセキュリティに関する問題に対処するように設計されている。
本稿では,ブロックチェーンとスマートコントラクト技術に基づく新たな銀行アプリケーションALBankを提案する。
その結果、ブロックチェーンとスマートコントラクトの統合は、中央集権化、非効率性、セキュリティ脆弱性など、従来の銀行システムにおける重要な問題に効果的に対処していることがわかった。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 12:20:31 GMT)
AI Token Futures Market: Commoditization of Compute and Derivatives Contract Design [0.0] 大規模言語モデル(LLM)とビジョンアクションモデル(VLA)が広くデプロイされるにつれ、AI推論によって消費されるトークンは新たなタイプの商品へと進化しつつある。
本稿では,トークンの商品属性を体系的に分析し,インテリジェントなサービス出力からインフラストラクチャの原材料への遷移を論じる。
SIT(Standard Inference Token)の定義を含む標準化トークン先物契約の完全な設計を提案する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 08:24:53 GMT)
AI Mental Models: Learned Intuition and Deliberation in a Bounded Neural Architecture [0.0] 本稿では,有界なニューラルアーキテクチャが,シロジカル推論ベンチマーク上での直観と熟考の間に有意義な分断を生じさせるかどうかを問う。
実験1では、5倍のクロスバリデーションの下で、完全な9方向の人間の応答分布を予測するための直接神経ベースラインを評価した。
実験2では、計算的精神モデル理論に動機づけられた、直観と熟考の別々の経路を持つ有界なデュアルパスアーキテクチャを導入する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 20:44:38 GMT)
A two-dimensional realization of the parity anomaly [0.0] 量子異常は古典理論の対称性が量子化によって保存できないときに生じる。
顕著な例は、半量子化されたホール反応を強制する単一の2次元ディラックフェルミオンのパリティ異常である。
超低温ジスプロシウム原子の合成2次元系における量子ホール相転移の臨界点におけるパリティアノマラスホール応答の観測を報告する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 16:34:45 GMT)
A generalized Coulomb problem for a spin-1/2 fermion [0.0] 任意の強みを持つスカラー、ベクトル、テンソル相互作用の一般的な組み合わせで、ディラック方程式を3+1次元で研究する。
テンソルカップリングには定数項も含まれており、これは効果的なクーロンポテンシャルをもたらす。
文献ではまだ報告されていない2つの新しい症例,すなわちスピンの破折例と擬似スピン対称性を導出する。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 11:28:27 GMT)
A Theoretical Framework for Energy-Aware Gradient Pruning in Federated Learning [0.0] フェデレートラーニング(FL)は、分散エッジデバイスの通信とエネルギー制限によって制約される。
本稿では,パラメータの更新を物理コストに応じて優先順位付けする選択規則であるCWMP(Cost-Weighted Magnitude Pruning)を提案する。
非IIDAR-10ベンチマークの数値結果は、CWMPがTop-Kベースラインよりも優れたパフォーマンス・エネルギ・フロンティアを一貫して確立していることを示している。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 18:31:07 GMT)
A Systematic Comparison and Evaluation of Building Ontologies for Deploying Data-Driven Analytics in Smart Buildings [0.0] オントロジは、データ交換、情報統合、セマンティックな再利用、知識共有において重要な役割を果たす。
しかし、ビルディングの違いは、データの相互運用性をもたらすという目的を妨げ、現実世界のアプリケーションでビルディングを再利用する能力を制限します。
論文参考訳(メタデータ) (Mon, 23 Mar 2026 13:52:15 GMT)