Vega: Learning to Drive with Natural Language Instructions [93.5] 本稿では,命令ベースの生成と計画のための統合型ビジョン・ランゲージ・ワールド・アクションモデルであるVegaを提案する。
視覚入力(ビジョン)と言語指示(言語)の処理には自己回帰パラダイムを使用し、将来の予測を生成するには拡散パラダイムを用いる。
提案手法は優れた計画性能を達成し,強い指示追従能力を示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:56 GMT)
PAWS: Perception of Articulation in the Wild at Scale from Egocentric Videos [90.5] 既存の学習ベースの手法は、高品質な3Dデータと手動アノテーションによる教師付きトレーニングに大きく依存している。
そこで本研究では,手動物体間相互作用からオブジェクトの調音を直接抽出する手法であるPAWSを提案する。
提案手法は,HD-EPICやArti4Dを含む公開データセット上で評価し,ベースラインよりも大幅に改善された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:16:51 GMT)
How Class Ontology and Data Scale Affect Audio Transfer Learning [86.3] トランスファーラーニングは、機械学習において重要な概念であり、人工知能ニューラルネットワークが大規模な事前学習データベースから恩恵を受けることができる。
本稿では,AudioSetのサブセット上で,様々なモデル状態の事前学習を行うオーディオ・オーディオ・トランスファー学習について検討する。
事前学習データにおけるサンプル数やクラス数の増加は、転送学習に肯定的な影響を及ぼすと報告した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:18:29 GMT)
Towards Practical Lossless Neural Compression for LiDAR Point Clouds [84.4] 高精度な幾何学的詳細の極端に広い範囲は、効率的な文脈モデリングを妨げる。
私たちのフレームワークは2つの軽量モジュールで構成されています。
実験では、リアルタイムに競争力のある圧縮性能を示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:02:07 GMT)
3D Gaussian Splatting with Self-Constrained Priors for High Fidelity Surface Reconstruction [84.2] 3DGSは、レンダリング品質やスピードという点で、NeRFよりも優位性を示している。
本稿では,3次元ガウスの学習を制約するために,事前の自己制約を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:11:33 GMT)
GenMask: Adapting DiT for Segmentation via Direct Mask Generation [81.5] 間接的な適応の代わりに、セグメント化タスクは生成的な方法で直接訓練されるべきである、と我々は主張する。
分割のための極度のノイズレベルと画像生成のための中等度雑音を強調する二元マスクの時間ステップサンプリング戦略を導入する。
GenMaskは,RGB空間における色鮮やかな画像だけでなく,黒と白のセグメンテーションマスクを生成するためのDiTトレインである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:00:34 GMT)
HGGT: Robust and Flexible 3D Hand Mesh Reconstruction from Uncalibrated Images [81.4] 高忠実度3Dハンドジオメトリはコンピュータビジョンにおいて重要な課題である。
スケーラブルなアプリケーションは、正確性とデプロイメントの柔軟性の両方を必要とします。
本研究では、3Dハンドメッシュとカメラのポーズを非校正視点から推定するフィードフォワードアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:12:42 GMT)
PSDesigner: Automated Graphic Design with a Human-Like Creative Workflow [80.3] PSDesignerは、人間のデザイナーの創造的なワークフローをエミュレートするグラフィックデザインシステムである。
PSDesignerはユーザ命令に基づいてテーマ関連資産を収集し、設計ファイルを操作するためのツールコールを自律的に推論して実行する。
強力なツール利用能力を持つシステムを実現するため,大量の高品質なPSD設計ファイルを含む設計データセットであるCreativePSDを構築した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:51 GMT)
On Neural Scaling Laws for Weather Emulation through Continual Training [76.7] 我々はScientific Machine Learningにおけるニューラルスケーリングについて研究し、天気予報モデルに焦点を当てた。
可能な限り簡単な設定でスケーリング動作を解析するために、最小限でスケーラブルで汎用的なSwin Transformerアーキテクチャを採用する。
この最小限の方法でトレーニングされたモデルは、予測可能なスケーリングトレンドに従っており、標準的なコサイン学習率のスケジュールよりも優れています。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:37:25 GMT)
When Sensing Varies with Contexts: Context-as-Transform for Tactile Few-Shot Class-Incremental Learning [74.8] 上記の問題に対処するために、Context-as-Transform FSCIL (CaT-FSCIL)を提案する。
取得コンテキストを構造化された低次元成分と高次元残留成分に分解する。
HapTex と LMT108 のベンチマークに関する総合的な実験は、提案した CaT-FSCIL の優位性を実証している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:42:09 GMT)
UNIC: Neural Garment Deformation Field for Real-time Clothed Character Animation [74.7] 我々は,アバターの衣服をリアルタイムにアニメーション化するために,UNICというニューラルな変形場に基づく新しい手法を提案する。
私たちのキーとなるアイデアは、服のメッシュをアニメーションするために、インスタンス固有の神経変形フィールドを学ぶことです。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:57:05 GMT)
P^2O: Joint Policy and Prompt Optimization [74.5] RLVR(Reinforcement Learning with Verifiable Rewards)は、大規模言語モデル(LLM)の推論能力を高めるための強力なパラダイムとして登場した。
プロンプト最適化とポリシー最適化を相乗化する新しいフレームワークであるP2Oを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:57:04 GMT)
Towards Video Anomaly Detection from Event Streams: A Baseline and Benchmark Datasets [71.5] イベントベースの異常検出を統一研究の方向性として確立するための第一歩を踏み出す。
まず、同期イベントとRGB記録を特徴とする、ビデオ異常検出のための複数のイベントストリームベースのベンチマークを構築した。
次に,EVent中心のビデオ異常検出フレームワークであるEWADを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:33:33 GMT)
DIET: Learning to Distill Dataset Continually for Recommender Systems [69.7] ディープラーニングモデルは、大規模で継続的な成長するストリーミング行動ログに依存する、継続的な学習パラダイムの下でトレーニングされる。
大規模なプラットフォームでは、アーキテクチャ比較やイテレーションのために、完全な履歴データ上でモデルを再トレーニングするのは、極めて高価であり、モデル開発を著しく遅くする。
我々は,この問題を,レコメンデータシステムのためのEmphstreaming dataset distillationとして定式化し,トレーニングクリティカルな信号を保持しながら,ストリーミングデータとともに進化するコンパクトな蒸留データセットを維持する統一フレームワークである textbfDIET を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:50:13 GMT)
Unblur-SLAM: Dense Neural SLAM for Blurry Inputs [68.9] Un-SLAMは、ぼやけた画像入力から鋭い3D再構成を行うための新しいパイプラインである。
動作のぼやけとデフォーカスのぼやけの両方が存在する場合の最先端性能を実証する。
いくつかの実世界のデータセットの実験では、ポーズ推定とシャープな再構成結果の両方において一貫した改善が示されている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:29:47 GMT)
Wan-Weaver: Interleaved Multi-modal Generation via Decoupled Training [68.9] プランナとビジュアライザで構成されるフレームワークを導入する。
ビジュアライザは画像の合成を行うのに対し、プランナーはビジュアルコンテンツのための密集したテキスト記述を生成する。
これらのデザインは、長距離テキストコヒーレンスと視覚的一貫性を備えた創発的なインターリーブ生成能力を示すWan-Weaverを生み出している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:50:37 GMT)
When Should a Robot Think? Resource-Aware Reasoning via Reinforcement Learning for Embodied Robotic Decision-Making [68.1] 身体ロボットシステムは、高レベルの推論をサポートするために、大規模言語モデル(LLM)ベースのエージェントにますます依存している。
エージェントはいつ、いつ、いつ行動すべきか?
本稿では,エンボディエージェントのリソース・アウェア・オーケストレーションのための階層的なフレームワークであるRARRL(Resource-Aware Reasoning via Reinforcement Learning)を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:08:17 GMT)
Estimating near-verbatim extraction risk in language models with decoding-constrained beam search [66.1] グリーディ復号法は,シーケンス間の抽出リスクの変化を見逃していることを示す。
本稿では,デコード制約されたビームサーチを導入し,近赤外抽出リスクに対する決定論的下限を導出する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:15:16 GMT)
GIFT: Global Irreplaceability Frame Targeting for Efficient Video Understanding [63.6] GIFT: Global Irreplaceability Frame Targetingはトレーニング不要のフレームワークで、固有の非配置性を評価してフレームを選択する。
GIFTは,LLaVA-Video-7Bの長文ビデオベンチマークにおいて,一様サンプリングに比べて最大12.5%向上したことを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:21:41 GMT)
A Decade-Scale Benchmark Evaluating LLMs' Clinical Practice Guidelines Detection and Adherence in Multi-turn Conversations [60.2] 大規模言語モデル(LLM)は、医療シナリオにますます多くデプロイされている。
LLMが会話中に臨床ガイドラインを特定・遵守できるのかは不明確である。
CPGBenchは、LSMの臨床ガイドラインの検出と付着能力をベンチマークする自動フレームワークである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:00:55 GMT)
Neural Uncertainty Principle: A Unified View of Adversarial Fragility and LLM Hallucination [60.2] 大規模言語モデルにおける視覚と幻覚の対立的脆弱性は、伝統的に別の問題と見なされている。
損失誘起状態下でのニューラル不確実性原理(NUP)の定式化により, ほぼバウンド状態においては, さらなる圧縮は感度分散の増大を伴うことが判明した。
視覚では、高度に結合したコンポーネントをマスキングすることで、コストのかかる敵の訓練なしに堅牢性を向上させる。
言語では、任意の応答トークンを生成する前に、同じプレフィルステージプローブが幻覚リスクを検出する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:40:29 GMT)
EagleNet: Energy-Aware Fine-Grained Relationship Learning Network for Text-Video Retrieval [59.9] エネルギーを考慮した細粒度関係学習ネットワーク(EagleNet)について紹介する。
EagleNetは正確でコンテキスト対応のリッチテキスト埋め込みを生成する。
実験では、MSRVTT、DiDeMo、MSVD、VATEXにまたがるイーグルネットの優位性を実証した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:05:19 GMT)
Send the Key in Cleartext: Halving Key Consumption while Preserving Unconditional Security in QKD Authentication [59.7] 量子鍵分配(QKD)プロトコルは、蒸留された鍵の無条件のセキュリティを維持するために、古典的なチャネルの情報理論セキュア(ITS)認証を必要とする。
QKDは相互認証を必要とするため、2つの独立したワンタイム鍵は通常ラウンド毎に消費される。
我々は$varepsilon$-Almost Strongly Universal$(varepsilon$-ASU$)に基づく新しいITS認証方式を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:36:05 GMT)
Beyond Detection: Rethinking Education in the Age of AI-writing [58.5] ChatGPTのようなジェネレーティブなAIツールが教室や職場、日々の思考に入るにつれ、書記は形式化されるリスクがある。
本論文は,認知心理学,教育理論,実教室の実践を基礎として,機械による文章作成時に失うものについて考察する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:16:01 GMT)
WebTestBench: Evaluating Computer-Use Agents towards End-to-End Automated Web Testing [57.7] エンドツーエンドの自動Webテストを評価するベンチマークであるWebTestBenchを紹介します。
テストプロセスを2つのカスケードサブタスク、チェックリストの生成と欠陥検出に分解し、WebTesterを提案する。
以上の結果から,現在のコンピュータ利用エージェント能力と産業レベルの展開要求との間に大きなギャップがあることが判明した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:27:29 GMT)
Out of Sight but Not Out of Mind: Hybrid Memory for Dynamic Video World Models [56.4] 静的な背景の正確なアーキビストとしてモデルが同時に機能することを必要とする新しいパラダイムであるHybrid Memoryを紹介する。
HM-Worldは、ハイブリッドメモリに特化した最初の大規模ビデオデータセットである。
提案手法は, 動的主観的整合性と全体の生成品質の両方において, 最先端のアプローチを著しく上回っている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:56:01 GMT)
Can MLLMs Read Students' Minds? Unpacking Multimodal Error Analysis in Handwritten Math [55.8] スクラッチマス(ScratchMath)は,手書き数学のスクラッチワークにおける誤りの説明と分類のための新しいベンチマークである。
本データセットは,中国初等・中等生の1,720個の数学サンプルからなる。
我々は,ScratchMath上での16のMLLMを系統的に評価し,人的専門家に対する顕著な性能差を明らかにした。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:57:20 GMT)
SABER: A Stealthy Agentic Black-Box Attack Framework for Vision-Language-Action Models [55.5] SABERは、VLAモデルに対する命令ベースの敵攻撃を自動的に生成するエージェント中心のアプローチである。
SABERはタスク成功率を20.6%減らし,アクションシーケンス長を55%増し,制約違反を33%減らした。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:56:01 GMT)
RealRestorer: Towards Generalizable Real-World Image Restoration with Large-Scale Image Editing Models [55.4] 9つの一般的な実世界の劣化型をカバーする大規模なデータセットを構築した。
クローズドソースの代替品とのギャップを狭めるために、最先端のオープンソースモデルをトレーニングします。
我々のモデルは、最先端のパフォーマンスを達成し、オープンソース手法の中で第1位である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:39:39 GMT)
Self-Corrected Image Generation with Explainable Latent Rewards [55.3] 我々は、説明可能なLatent RewarDを通じて生成をガイドする自己修正フレームワークであるxLARDを提案する。
xLARDは、モデル生成参照からの構造化されたフィードバックに基づいて遅延表現を洗練する軽量な修正器を導入している。
実験により、xLARDは、生成前の状態を維持しながら、意味的アライメントと視覚的忠実性を改善することが示された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:59:35 GMT)
MegaFlow: Zero-Shot Large Displacement Optical Flow [54.9] MegaFlowは、ゼロショット大変位光学フローのためのシンプルだが強力なモデルである。
これは、時間的に一貫した運動場を生成するために、強力な事前訓練された視覚に適応する。
複数の光フローベンチマークで最先端のゼロショット性能を実現する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:51 GMT)
InstanceAnimator: Multi-Instance Sketch Video Colorization [54.6] マルチスタンススケッチ映像のカラー化のための新しい拡散トランスフォーマフレームワークであるInstanceAnimatorを提案する。
既存の方法は、単一の参照フレームに大きく依存することによる、柔軟性のないユーザコントロール、インスタンスの制御性の低下、きめ細かい領域での詳細な忠実度低下の3つの限界に悩まされている。
インスタンスAnimatorは、ユーザ制御の強化、視覚的品質の向上、インスタンスの一貫性の向上により、優れたマルチインスタンスカラー化を実現する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:01:46 GMT)
Social Hippocampus Memory Learning [54.4] SoHipはメモリ中心のソーシャル機械学習フレームワークだ。
モデル共有ではなく、メモリ共有を通じて異種エージェント間の協調を可能にする。
7つのベースラインを持つ2つのベンチマークデータセットの実験は、SoHipが既存のメソッドを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:31:00 GMT)
Unleashing Guidance Without Classifiers for Human-Object Interaction Animation [54.2] 従来の拡散に基づくアプローチは、しばしば接触品質を改善するために手作りの接触先行や人為的なキネマティック制約に頼っている。
そこで本研究では,手作業による事前設計への依存を軽減し,手作業による指導を段階的に行うデータ駆動型代替手法を提案する。
このデータ駆動型ガイダンスは本質的に接触認識であり,広い範囲の合成対象測地でトレーニングを行う際に拡張可能である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:34 GMT)
Towards Foundation Models for 3D Scene Understanding: Instance-Aware Self-Supervised Learning for Point Clouds [53.8] PointINSは、幾何学的学習を通じてポイントクラウド表現を豊かにする、インスタンス指向の自己組織化フレームワークである。
PointINSは、屋内のインスタンスセグメンテーションで平均+3.5%のmAP改善、屋外のパン光学セグメンテーションで+4.1%のPQゲインを達成している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:31:06 GMT)
RefAlign: Representation Alignment for Reference-to-Video Generation [53.4] RefAlignは、DiT参照ブランチ機能を視覚基礎モデルのセマンティック空間に整列する表現アライメントフレームワークである。
OpenS2V-Evalベンチマークの実験では、RefAlignがTotalScoreの最先端メソッドより優れていることが示されている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:57 GMT)
AnyID: Ultra-Fidelity Universal Identity-Preserving Video Generation from Any Visual References [52.8] 我々は,超忠実なアイデンティティ保存ビデオ生成フレームワークであるAnyIDを提案する。
まず,不均一な同一性入力を結合表現に効果的に統一する,スケーラブルなオムニ参照アーキテクチャを提案する。
第2に、1つの参照を標準アンカーとして指定し、新しい微分プロンプトを用いて正確な属性レベルの制御を可能にする一次参照生成パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:54:48 GMT)
Bilingual Text-to-Motion Generation: A New Benchmark and Baselines [52.7] LLMアノテーションと厳密な手動修正によって構築されたバイリンガルテキスト・モーション・ベンチマークであるBiHumanML3Dを紹介する。
また,CLA(Cross-Lingual Alignment)を用いたバイリンガルモーション拡散合成(BiMD)を提案する。
CLA を用いた BiMD は 0.045 対 0.169 対 R@3 対 80.8% の FID を達成し、単言語拡散モデルと BiHumanML3D の翻訳ベースラインを著しく上回っている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:48:27 GMT)
Bridging Perception and Reasoning: Token Reweighting for RLVR in Multimodal LLMs [51.6] 本稿では,この相互依存を明示的にモデル化するToken-Reweighting(ToR)戦略を提案する。
ToRは複数のマルチモーダル推論ベンチマークで一貫したパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:25:27 GMT)
SportSkills: Physical Skill Learning from Sports Instructional Videos [51.2] SportSkillsは、Wildビデオによる物理的なスキル学習を目的とした、初めての大規模なスポーツデータセットだ。
SportSkillsは、物理的なアクションの微妙な違いを理解することができる。
本稿では,誤り条件付き指導ビデオ検索の大規模タスク定式化について紹介する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:29:35 GMT)
AnyHand: A Large-Scale Synthetic Dataset for RGB(-D) Hand Pose Estimation [50.6] 我々はAnyHandという大規模な合成データセットを提示する。
既存のベースラインのトレーニングセットをAnyHandで拡張することで、複数のベンチマークで大幅に向上することを示す。
また,既存のRGBモデルに容易に統合可能な軽量深度融合モジュールも提供しています。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:58:54 GMT)
Can Users Specify Driving Speed? Bench2Drive-Speed: Benchmark and Baselines for Desired-Speed Conditioned Autonomous Driving [50.1] 我々は、所望の高速自動運転のためのメトリクス、データセット、ベースラインを備えたベンチマークであるBench2Drive-Speedを紹介する。
本稿では,ユーザの希望する目標速度とオーバーテイク/フォロー指示の明示的な入力をポリシーモデルに導入する。
実験の結果,正規運転データに基づいてトレーニングされたモデルが,専門家による実演と相容れない性能を示した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:26:41 GMT)
Probabilistic Concept Graph Reasoning for Multimodal Misinformation Detection [50.1] 確率論的概念グラフ推論(PCGR)は,マルチモーダルな誤情報検出を構造化および概念ベース推論として再構成する,解釈可能かつ進化可能なフレームワークである。
PCGRは、最先端のMDD精度と、新たな操作タイプに対する堅牢性を達成し、粗い検出ときめ細かい操作認識の両方において、先行手法より優れている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:08:31 GMT)
Knowledge-Guided Adversarial Training for Infrared Object Detection via Thermal Radiation Modeling [49.9] 本研究では,異なるクラス間の相対的な熱放射関係を,敵対的事例や共通の腐敗の複雑なシナリオの下で信頼性の高い知識源とみなすことができることを示す。
本稿では,赤外線物体検出のための知識誘導型逆トレーニング(KGAT)を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:43:43 GMT)
Agentic Markets: Equilibrium Effects of Improving Consumer Search [49.8] 市場における学習と福祉に対する検索技術の改善の影響について検討する。
より安価な検索は学習と消費者の余剰を改善し、より情報的な検索は双方を劣化させる可能性がある。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:30:45 GMT)
Reinforcing Structured Chain-of-Thought for Video Understanding [49.3] 概要駆動強化学習(SDRL)を紹介する。
SDRLは、Supervised Fine-Tuning (SFT)の必要性を回避したシングルステージのRLフレームワークである。
提案手法は、7つの公開ビデオQAデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:11:14 GMT)
Same Verdict, Different Reasons: LLM-as-a-Judge and Clinician Disagreement on Medical Chatbot Completeness [49.3] 不完全な患者の医療反応を検出するために,この仮定をストレステストする。
我々は,2つの臨床診断データセットにわたる3つの粒度(General-Likert,Analytical-Rubric,Dynamic-Checklist)と3つのバックボーンモデルを評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:01:55 GMT)
Lingshu-Cell: A generative cellular world model for transcriptome modeling toward virtual cells [48.9] Lingshu-Cellは、転写状態の分布を学習し、摂動下で条件シミュレーションをサポートする離散拡散モデルである。
約18,000の遺伝子にまたがる複雑なトランスクリプトーム全体の発現依存性を、以前の遺伝子選択に頼らずに捕捉する。
これは、Virtual Cell Challenge H1遺伝子摂動ベンチマークにおいて、ヒトPBMCのサイトカイン誘発反応の予測において、主要な性能を発揮する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:46:27 GMT)
ArtHOI: Taming Foundation Models for Monocular 4D Reconstruction of Hand-Articulated-Object Interactions [48.8] ArtHOIは最適化ベースのフレームワークで、複数の基礎モデルから事前を統合および洗練する。
特に、オブジェクトのメートル法スケールを最適化するために、適応サンプリング精細法(ASR)を導入する。
また,Multimodal Large Language Model (MLLM) を用いた手オブジェクトアライメント手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:00:17 GMT)
Group Editing: Edit Multiple Images in One Go [48.8] GroupEditingは、グループ内の画像間の明示的で暗黙的な関係を構築するフレームワークである。
GroupEditDataは、高品質なマスクと多数のイメージグループの詳細なキャプションを含むデータセットである。
グループレベルの画像編集の有効性を評価するためのベンチマークであるGroupEditBenchを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:38:34 GMT)
BiFM: Bidirectional Flow Matching for Few-Step Image Editing and Generation [48.7] BiFM(Bidirectional Flow Matching)は、単一のモデル内で生成と反転を共同で学習する統合フレームワークである。
BiFMは既存の数ステップのアプローチを一貫して上回り、優れたパフォーマンスと編集性を実現している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:16:54 GMT)
ViGoR-Bench: How Far Are Visual Generative Models From Zero-Shot Visual Reasoners? [48.4] ViGoR Vision-Gnerative Reasoning中心のBenchmarkは、このミラージュを分解するために設計された統一されたフレームワークである。
ViGoRは、1)イメージ・ツー・イメージ・ビデオタスクをブリッジする総合的なクロスモーダル・カバレッジ、2)中間プロセスと最終結果の両方を評価するデュアルトラックメカニズム、3)高い人間のアライメントを確保するためのエビデンス・グラウンドの自動判断である。
20以上の先進的なモデルの実験では、最先端のシステムでさえ重大な理由の欠如があることが示されている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:40:09 GMT)
ScrollScape: Unlocking 32K Image Generation With Video Diffusion Priors [48.0] ScrollScapeは、EAR画像合成を連続的なビデオ生成プロセスに変換する新しいフレームワークである。
また,ScrollScapeは,高度に局所化されたアーティファクトを除去することにより,既存の画像拡散ベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:11:26 GMT)
Seeing to Ground: Visual Attention for Hallucination-Resilient MDLLMs [47.9] トレーニング不要なデコードフレームワークであるVISAGEを導入し、推論時に目的を校正する。
我々は、VISAGEが推定誤差の下で有界目的損失を維持することを保証する解析的安定性を保証する。
幻覚感受性および汎用ベンチマークによる評価は、フレームワークの堅牢性を示している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:53:49 GMT)
Less Gaussians, Texture More: 4K Feed-Forward Textured Splatting [47.9] 既存のフィードフォワード3Dガウススプラッティング法は画素アラインプリミティブを予測し、解像度が増大するにつれてプリミティブカウントが2次的に成長する。
この解像度のスケーリング障壁を克服するフィードフォワードフレームワークであるLGTMを紹介します。
このアプローチにより,シーンごとの最適化を行なわずに,高忠実度4K新規ビュー合成が可能となる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:59 GMT)
VideoTIR: Accurate Understanding for Long Videos with Efficient Tool-Integrated Reasoning [47.6] VideoTIRはZero-RLとSFTのコールドスタートを探索し、MLLMが意味のあるビデオセグメント/画像/領域を検索し、フォーカスできるようにする。
我々は,高品質な軌道データを生成するサンドボックスベースの軌道合成フレームワークを開発した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:37:54 GMT)
Fast-dVLA: Accelerating Discrete Diffusion VLA to Real-Time Performance [47.6] 補助的な訓練対象を持つ高度な微調整法は、性能を改善し、収束ステップの数を減らすことができる。
本稿では,事前学習したVLAモデルが,標準的な教師付き微調整における性能向上や適応コストの低減に失敗するケースに対して,新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:14:57 GMT)
MMaDA-VLA: Large Diffusion Vision-Language-Action Model with Unified Multi-Modal Instruction and Generation [47.2] Vision-Language-Action(VLA)モデルは、視覚的な観察や自然言語の指示からロボットを操作することを目的としている。
MMaDA-VLAは,マルチモーダル理解と生成をひとつのフレームワークで統一する,完全ネイティブな大規模拡散VLAモデルである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:55:51 GMT)
GraphER: An Efficient Graph-Based Enrichment and Reranking Method for Retrieval-Augmented Generation [47.0] GraphERはグラフベースのエンリッチメントとリグレードメソッドで、セマンティックな類似性を超えた、複数の形式の近接をキャプチャする。
知識グラフを必要としないため、GraphERは標準的なベクトルストアとシームレスに統合できる。
複数のベンチマーク実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:30:22 GMT)
RubricEval: A Rubric-Level Meta-Evaluation Benchmark for LLM Judges in Instruction Following [46.5] 大規模言語モデル(LLM)における命令追従の評価において,ルーブリックレベルの評価が主流となっている
本ベンチマークでは,(1)命令追従のための最初のルーリックレベルのメタ評価ベンチマーク,(2)複数のインスタンスとモデルソースにまたがる多様な命令と応答,(3)判定性能をよりよく区別する3,486個の品質管理サブセットの相当セットを特徴とする。
評価パラダイムを考慮すると、チェックリストレベルの評価はルーブリックレベルよりも優れており、明示的推論は精度を向上し、両者ともにジャッジ間の分散を減少させる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:55:32 GMT)
Integrating Deep RL and Bayesian Inference for ObjectNav in Mobile Robotics [46.4] 本稿では,ベイズ推論と深層強化学習を統合したハイブリッドオブジェクト探索フレームワークを提案する。
提案手法はHabitat 3.0を用いた室内シミュレーションで評価し, 開発したベースライン戦略と比較した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:15:12 GMT)
FD$^2$: A Dedicated Framework for Fine-Grained Dataset Distillation [46.3] 微細なデータセット蒸留のためのフレームワークであるFD$2$を提案する。
事前訓練中、きめ細かい特性制約は、各サンプルをそのクラスプロトタイプと整列させ、他のサンプルを撃退する。
複数のきめ細かいデータセットと一般的なデータセットの実験により、FD$2$は非結合DDとシームレスに統合されることが示された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:03:45 GMT)
PackForcing: Short Video Training Suffices for Long Video Sampling and Long Context Inference [46.2] PackForcingは、単一のH200 GPU上で16 FPSでコヒーレントな2分832x480ビデオを生成する。
わずか4GBのバウンドKVキャッシュを実現し、ゼロショットまたは5秒のクリップでトレーニングされた24倍の時間(5秒から120秒)を効果的に動作させることができる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:05 GMT)
Multimodal Dataset Distillation via Phased Teacher Models [46.2] PTM-ST(Phased Teacher Model with Shortcut Trajectory)は、新しいフェーズド蒸留フレームワークである。
PTM-STは最適化振動と相間知識ギャップを著しく軽減することを示す。
我々の手法はFlickr30kとCOCOの最先端のベースラインを一貫して超越している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:38:12 GMT)
MACRO: Advancing Multi-Reference Image Generation with Structured Long-Context Data [45.9] MacroDataは、最大10の参照画像を含む400Kサンプルの大規模なデータセットである。
MacroBenchは、グレードされたタスク次元と入力スケールにわたる生成的コヒーレンスを評価する4,000のサンプルのベンチマークである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:09:14 GMT)
The quantum mechanics of experiments [45.9] 同一系の大きなアンサンブル上での状態平均の量子力学的時間進化の散逸性について論じる。
測定が成功するためには, 散逸の重要性が強調される。
ダブルスリット実験の理想的なモデルで「測定問題の解」をスケッチする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:25:21 GMT)
ElephantBroker: A Knowledge-Grounded Cognitive Runtime for Trustworthy AI Agents [45.9] ElephantBrokerはオープンソースの認知ランタイムで、Neo4jナレッジグラフとQdrantベクトルストアを統合する。
このシステムは、ハイブリッド5ソース検索パイプラインからなる完全な認知ループ(ストア、検索、スコア、構成、保護、学習)を実装している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:03:12 GMT)
A Quantum Encoding of Traveling Salesperson Tours via Route Generation, Cost Phases, and a Valid-Permutation Oracle [45.9] 本稿では,ツアーの時間登録表現に基づくTSPの量子符号化について述べる。
本稿では,経路レジスタ上の一様経路生成,有効なツアーをマークするための可逆オラクル,総ツアーコストをエンコードする位相オラクルの3つの要素について述べる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:04:09 GMT)
SoftMimicGen: A Data Generation System for Scalable Robot Learning in Deformable Object Manipulation [45.7] 我々は、変形可能なオブジェクト操作タスクのための自動データ生成パイプラインであるSoftMimicGenを紹介する。
本稿では,多種多様な変形可能な物体を含む高忠実度シミュレーション環境について紹介する。
我々はSoftMimicGenを適用し、タスクスイート全体にわたってデータセットを生成し、データからハイパフォーマンスなポリシーをトレーニングし、データ生成システムを体系的に分析する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:58:40 GMT)
AD-CARE: A Guideline-grounded, Modality-agnostic LLM Agent for Real-world Alzheimer's Disease Diagnosis with Multi-cohort Assessment, Fairness Analysis, and Reader Study [45.6] 不完全で不均一な入力からガイドラインに基づく診断を行うモダリティ診断剤であるAD-CAREを導入する。
専門的な診断ツールを動的にオーケストレーションすることにより、AD-CAREは実際の臨床出力と整合した透明なレポートスタイルのアウトプットを生成する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:10:01 GMT)
Training-free Detection and 6D Pose Estimation of Unseen Surgical Instruments [45.4] 本研究は,未確認の手術器具の高精度なマルチビュー6Dポーズ推定のための無トレーニングパイプラインを導入する。
本手法はMVPSPデータセットから実世界の手術データを用いて厳密に評価した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:28:19 GMT)
TopoMesh: High-Fidelity Mesh Autoencoding via Topological Unification [44.6] TopoMeshは、GTと予測メッシュを、共有デュアルマーチングキューブ(DMC)トポロジフレームワークで統合した、スパースボクセルベースのVAEである。
我々のデコーダは同じDMCフォーマットでメッシュを出力し、予測とターゲットのメッシュが同じトポロジ構造を共有することを保証します。
大規模な実験により、TopoMeshは再建忠実度において既存のVAEを著しく上回っていることが示された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:46:23 GMT)
JANUS: A Lightweight Framework for Jailbreaking Text-to-Image Models via Distribution Optimization [44.6] 既存のjailbreak攻撃は、真のエンドツーエンドの目的ではなく、プロキシ-ロス最適化に依存している。
Janusは、ブラックボックスの下で構造化されたプロンプト配布の最適化としてジェイルブレイクを定式化する軽量フレームワークである。
Janusはオープンソースと商用の両方で成功している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:04:48 GMT)
Self-Supervised Learning for Knee Osteoarthritis: Diagnostic Limitations and Prognostic Value of Uncurated Hospital Data [44.6] 本研究は, 自己指導型学習(SSL)が変形性膝関節症(OA)の診断と予後を改善するか否かを評価する。
我々は,OAI,MOST,NYUコーホーツの膝X線写真で事前訓練された画像のみSSLと,未治療の病院膝X線写真で事前訓練されたマルチモーダル画像テキストSSLと,放射線学的印象との組み合わせを比較した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:33:55 GMT)
RealChart2Code: Advancing Chart-to-Code Generation with Real Data and Multi-Task Evaluation [44.5] VLM(Vision-Language Models)は、さまざまなドメインにわたるコード生成において、印象的な機能を示している。
しかし、実世界のデータから複雑なマルチパネル可視化を再現する能力はほとんど評価されていない。
textbftexttRealChart2Codeは,2800以上のインスタンスを認証データセットに格納した,新たな大規模ベンチマークである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:11:46 GMT)
Learning Explicit Continuous Motion Representation for Dynamic Gaussian Splatting from Monocular Videos [43.8] 本稿では,モノクロビデオから高品質な動的ガウス平滑化手法を提案する。
制御点のコンパクトなSE(3)B-スプライン運動ベースを用いる。
本手法は,新しいビュー合成における最先端の手法よりも優れる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:51:56 GMT)
DC-Reg: Globally Optimal Point Cloud Registration via Tight Bounding with Difference of Convex Programming [43.1] 我々は,グローバルに最適なポイント登録インタフェースを実現するための新しいフレームワークを開発した。
その結果, 極端雑音への収束が著しく速くなり, 極端雑音へのアウトリー・オブ・ザ・アートのグローバル化が可能となった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:38:45 GMT)
Understanding AI Methods for Intrusion Detection and Cryptographic Leakage [42.8] 機械学習技術が悪意あるネットワーク活動を検知し、暗号実装における潜在的な情報漏洩を特定する方法について評価する。
この結果から,安定したネットワーク環境下でのAIモデルによるほぼ完璧な検出精度が得られた。
また、学習したモデルがサイドチャネルリークと整合したパターンを識別し、AIが実装レベルの脆弱性を明らかにするのに役立つことを示唆した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:42:57 GMT)
Typical entanglement in anyon chains: Page curves beyond Lie group symmetries [42.0] 単元前モジュラー圏の融合規則に制約された1次元のエノン鎖における二部構造エンタングルメント統計について検討する。
驚くべきことに、ヒルベルト空間構造が制限されているにもかかわらず、大きな$L$展開は普遍的な$O(sqrtL)$または$O(1)$対称性型補正を持たない。
積分可能かつ量子カオスの黄金鎖ハミルトニアンの数値シミュレーションは、カオス中間スペクトル固有状態がハールランダム予測と一致することを示した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:00:03 GMT)
Impact of Topology on Multipartite Entanglement Distribution Protocols in Quantum Networks [42.0] 量子ネットワークは、分散量子コンピューティングや暗号などのマルチユーザアプリケーションを可能にするために、絡み合い分布に依存する。
本稿では,81個の実ネットワークトポロジ上の絡み合い分布に対する4つのルーティングプロトコルの体系的研究を行う。
i) 全てのプロトコルが貧弱に動作し, (ii) ツリーベースのプロトコルが支配的, (iii) マルチパスプロトコルが支配的, (iv) 全てのプロトコルが良好に動作している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:21:18 GMT)
An Experimental Comparison of the Most Popular Approaches to Fake News Detection [41.3] 本報告では,12種類の偽ニュース検出手法の批判的評価を行う。
それらの手法を,ジャンル,ソース,トピック,ラベル付けの合理性が異なる10の公開データセット上で評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:39:35 GMT)
Towards Comprehensive Real-Time Scene Understanding in Ophthalmic Surgery through Multimodal Image Fusion [41.0] 本稿では,共同機器検出,キーポイントの局所化,ツール間距離推定を行うための時間的,リアルタイムなネットワークアーキテクチャを提案する。
実験では、信頼性の高い機器のローカライゼーションとキーポイント検出(95.79% mAP50)が示され、i OCTの組み入れにより、ツール・タスク距離の推定が大幅に改善された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:27:27 GMT)
Relaxed Rigidity with Ray-based Grouping for Dynamic Gaussian Splatting [40.5] 本研究では,ガウスの局所的な幾何学的構造を4次元のシーンで明確に保存する手法を提案する。
提案手法は従来の手法よりも優れ,時間的整合性と復元性に優れていた。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:38:38 GMT)
DiReCT: Disentangled Regularization of Contrastive Trajectories for Physics-Refined Video Generation [40.4] フローマッチングビデオジェネレータは、時間的にコヒーレントで高忠実な出力を生成するが、日常的に基礎物理学に反する。
テキスト条件付きビデオ設定における基本的な障害は、意味物理学の絡み合いである。
我々は、この勾配の矛盾を形式化し、コントラスト学習がトレーニングに支障を与える場合と、トレーニングに支障をきたす場合の正確なアライメント条件を導出する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:53:47 GMT)
LaMP: Learning Vision-Language-Action Policies with 3D Scene Flow as Latent Motion Prior [40.3] ロボット操作に先立って,高密度な3次元シーンフローを潜時動作として組み込む,デュアルエキスパートのビジョン・ランゲージ・アクションフレームワークである textbfLaMP を導入する。
LaMPはこの制限に対処するため、フローマッチングのEmphMotion Expertとポリシー予測のEmphAction Expertをクロスアテンションを通じて整列する。
LIBERO, LIBERO-Plus, SimplerEnv-WidowX シミュレーションベンチマークおよび実世界実験における LaMP の評価を行った。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:47:51 GMT)
Goodness-of-pronunciation without phoneme time alignment [40.2] オープンソースの弱教師付きモデルは、多くの言語でASRが可能であるが、フレーム同期であり、音素ではない。
本稿では,弱い教師付きモデルによる特徴抽出の不整合性を克服することを提案する。
音素後部は、ASR仮説を音素混乱ネットワークにマッピングすることで計算される。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:12:19 GMT)
Translation or Recitation? Calibrating Evaluation Scores for Machine Translation of Extremely Low-Resource Languages [40.0] FREDの難易度はF(F)、Retrieval Proxy(R)、Pre-training Exposure(E)、Corpus Diversity(D)を含む。
これらの測定結果から、結果のばらつきの大部分は、モデル能力よりも、列車とテストの重複と事前訓練による露光によって説明されていることが分かる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:20:17 GMT)
MemoryCD: Benchmarking Long-Context User Memory of LLM Agents for Lifelong Cross-Domain Personalization [39.9] 我々は,最初の大規模ユーザ中心のクロスドメインメモリベンチマークであるtextscMemoryCDを紹介した。
textscMemoryCDは、数年と複数のドメインにわたる認証されたユーザーインタラクションを追跡する。
分析の結果,既存のメモリ手法は様々な領域におけるユーザ満足度には程遠いことが明らかとなった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 23:28:47 GMT)
GaussFusion: Improving 3D Reconstruction in the Wild with A Geometry-Informed Video Generator [39.9] GaussFusionは一般的な3DGSアーティファクトを緩和する。
GassFusionは、新しいビュー合成ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:42:12 GMT)
Usability of Passwordless Authentication in Wi-Fi Networks: A Comparative Study of Passkeys and Passwords in Captive Portals [39.7] 本稿では,Wi-Fiホットスポットにおけるパスキーとパスワードのユーザビリティに関する実証的比較を行った。
以上の結果から,パスワード使用時のパスワードよりもパスキーの方が有用であると考えられる傾向が示されたが,統計的に有意な差はない。
我々は,ユーザ名レス認証フローの導入を含む,カプセル型ポータル認証を改善するための設計勧告を導出する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:28:41 GMT)
Demographic Fairness in Multimodal LLMs: A Benchmark of Gender and Ethnicity Bias in Face Verification [39.2] 顔認証システムとしてMLLM(Multimodal Large Language Models)が検討されている。
6つのモデルファミリーから9つのオープンソースMLLMを評価するベンチマーク研究を提案する。
以上の結果から,顔特定モデルであるFaceLLM-8Bは,両ベンチマークの汎用MLLMよりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:30:00 GMT)
ET-SAM: Efficient Point Prompt Prediction in SAM for Unified Scene Text Detection and Layout Analysis [39.1] ET-SAMは、SAMに基づいたテキスト検出とレイアウト解析のための2つのデコーダを備えた効率的なフレームワークである。
我々は、いくつかの前景点を達成するために単語のヒートマップを生成する軽量なポイントデコーダをカスタマイズする。
学習可能な3つのタスクプロンプトをポイントデコーダと階層マスクデコーダの両方に導入し,データセット間の差を緩和する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:37:32 GMT)
HeSS: Head Sensitivity Score for Sparsity Redistribution in VGGT [38.4] Visual Geometry Grounded Transformer (VGGT)は先進的な3Dビジョンを持つが、そのグローバルアテンション層は2次計算コストに悩まされている。
本稿では,頭部のスペーシビリティを効果的に定量化し,活用する2段階スペーシフィケーションパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:28:05 GMT)
Towards Embodied AI with MuscleMimic: Unlocking full-body musculoskeletal motor learning at scale [38.2] muscleMimicは、生理学的に現実的な筋肉駆動モデルを用いたモーション模倣学習のためのオープンソースのフレームワークである。
筋骨格シミュレーションに計算障壁とデータバリアを下げることにより、マッスルミミックは様々な動的運動にまたがる系統的なモデル検証を可能にする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:18:37 GMT)
IntentReact: Guiding Reactive Object-Centric Navigation via Topological Intent [38.1] 目的条件付きオブジェクト中心ナビゲーションフレームワークであるIntentReactを提案する。
従来のオブジェクト中心ナビゲーション手法と比較して,ナビゲーションの成功率と実行品質が向上した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:32:11 GMT)
Opportunities and Limitations of GenAI in RE: Viewpoints from Practice [37.8] AIをREプロセスに効果的に統合する方法を理解する必要性が高まっている。
この研究は、REにおけるGenAIの実践的利用に関する実証的な証拠を提供し、そのメリット、課題、およびトレーニングニーズに関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:54:19 GMT)
Infinite Gaze Generation for Videos with Autoregressive Diffusion [37.8] 任意の長さのビデオにおいて、無限水平視線予測のための生成フレームワークを提案する。
自己回帰拡散モデルを用いて、連続的な空間座標と高分解能タイムスタンプを特徴とする視線軌跡を合成する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:02:08 GMT)
From Manipulation to Mistrust: Explaining Diverse Micro-Video Misinformation for Robust Debunking in the Wild [37.6] WildFakeBenchは、1万以上の現実世界のマイクロビデオの大規模なベンチマークで、さまざまな誤情報や情報源をカバーしています。
我々はDelphiにインスパイアされたマルチエージェント推論フレームワークであるFakeAgentを開発し、マルチモーダル理解と外部証拠を統合する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:15:33 GMT)
MoireMix: A Formula-Based Data Augmentation for Improving Image Classification Robustness [37.5] 本稿では, クローズドフォームの数学的定式化を用いて, フライ時のモアレテクスチャを手続き的に生成する軽量化手法を提案する。
提案手法は,ImageNet-C, ImageNet-R, および逆数ベンチマークを含む複数のベンチマーク間の堅牢性を一貫して改善する。
これらの結果から,解析的干渉パターンはデータ駆動生成法に代わる実用的で効率的な代替手段となることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:29:44 GMT)
GUIDE: A Benchmark for Understanding and Assisting Users in Open-Ended GUI Tasks [37.3] GUIDE(GUI User Intent Detection Evaluation)は,ユーザの振る舞いを知覚し,意図を推測し,オープンなGUIタスクを支援するAIモデルを評価するベンチマークである。
GUIDEは、120人の初心者ユーザーによるデモから67.5時間のスクリーン録画と10のソフトウェアで思考を調整したナレーションで構成されている。
8つの最先端マルチモーダルモデルに対する評価では、全てのモデルが苦労し、行動状態の正確さは44.6%と55.0%に過ぎなかった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:37:53 GMT)
Test of the essential collapse-locality loophole [36.9] 崩壊局所性(Collapse-locality)はベルの不等式違反の未証明の抜け穴である。
我々は、量子崩壊の理論によらず、この抜け穴の弱い形(「必須」)を閉じる光学ベル実験を報告する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:47:32 GMT)
MoE-GRPO: Optimizing Mixture-of-Experts via Reinforcement Learning in Vision-Language Models [36.7] Mixture-of-Experts (MoE)は、Transformerアーキテクチャの計算オーバーヘッドを削減する効果的なアプローチとして登場した。
我々は、MoEベースのビジョンランゲージモデルにおいて、エキスパートルーティングを最適化するための強化学習フレームワークであるMoE-GRPOを提案する。
MoE-GRPOは、より多様な専門家の選択を促進することにより、標準のトップKルーティングとその変種を一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:23:45 GMT)
Beyond the Golden Data: Resolving the Motion-Vision Quality Dilemma via Timestep Selective Training [36.6] ビデオデータキュレーションにおける重要な課題は、Motion-Vision Quality Dilemmaである。
視覚的品質と運動強度は本質的に負の相関を示しており、両面に優れた黄金のデータを得ることが困難である。
本稿では,データサンプリング分布をモデル学習プロセスに適合させるために,TQD(Timestep-aware Quality Decoupling)を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:59:57 GMT)
World Reasoning Arena [36.3] WR-Arenaは、次世代シミュレーションの3つの基本的な次元に沿って世界モデルを評価するためのベンチマークである。
タスク分類を構築し、これらの能力を調査するために設計された多様なデータセットをキュレートします。
その結果、現在のモデルと人間レベルの仮説的推論との間には大きなギャップがあることがわかった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:22:52 GMT)
Spatiotemporal System Forecasting with Irregular Time Steps via Masked Autoencoder [36.1] 物理時空間マスケオートエンコーダは、不規則時系列に最適化されたマスク付きオートエンコーダと空間特徴抽出のための畳み込みオートエンコーダを統合する。
本手法は,複数のシミュレーションデータセットと実世界の海洋温度データを用いて評価する。
このモデルは、気候モデリング、流体力学、海洋予測、環境モニタリング、科学計算など、ドメイン固有の知識を必要とせずに複雑な時間パターンをキャプチャする可能性を示している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:14:11 GMT)
Hyena Operator for Fast Sequential Recommendation [35.5] 逐次レコメンデーションモデル(特に注意に基づくモデル)は、強い精度であるが2次複雑さを実現する。
Hyenaのようなサブクワッド演算子は、言語モデリングにおける効率的な代替手段を提供する。
疎長なユーザシーケンスの表現能力に制限があるため,Hyenaは推奨する課題に直面している,と我々は主張する。
本稿では,カーネルパラメータ化と畳み込みを統合する新しいレコメンデータであるHyenaRecを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:47:58 GMT)
The Pareto Frontiers of Magic and Entanglement: The Case of Two Qubits [35.5] 2量子系における魔法と絡み合いの相互作用を考察し、与えられた絡み合いレベルに対する最大魔法と最小魔法の2つの極端に焦点をあてる。
これらすべてのケースに対して単純な解析式を導出し、与えられたエンタングルメントのレベルにおいて、最大または最小のマジックの全ての異なる量子状態を明示的にパラメトリズする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:32:43 GMT)
DeepFAN, a transformer-based deep learning model for human-artificial intelligence collaborative assessment of incidental pulmonary nodules in CT scans: a multi-reader, multi-case trial [35.2] DeepFANは10K以上の病理確認ノジュールに基づいてトレーニングされたトランスフォーマーベースのモデルである。
結節レベルの読取者間診断の整合性は公正から中等度に改善した。
DeepFANは、中等放射線科医を効果的に支援し、診断品質の均質化を支援する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:24:56 GMT)
Efficient ML-DSA Public Key Management Method with Identity for PKI and Its Application [34.9] ポスト量子暗号(textitIPK-pq)に基づくPKIのための新しいIDベースの公開鍵管理フレームワークを提案する。
複合公開鍵 (CPK) の概念に基づいて構築されたtextitIPK-pq は、拡張されたアイデンティティマッピング機構を通じてCPKに固有の線形共謀問題に対処する。
我々は、個々の秘密鍵コンポーネントと複合秘密鍵の両方をカバーする、textitIPK-pqの正式なセキュリティ証明を提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:26:31 GMT)
ShotStream: Streaming Multi-Shot Video Generation for Interactive Storytelling [31.8] ShotStreamはインタラクティブなストーリーテリングを可能にする新しい因果的マルチショットアーキテクチャである。
サブ秒のレイテンシでコヒーレントなマルチショットビデオを生成し、1つのGPUで16 FPSを達成する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:59 GMT)
RS-SSM: Refining Forgotten Specifics in State Space Model for Video Semantic Segmentation [30.9] ビデオセマンティック(VSS)は、セマンティックオブジェクトのセグメンテーションにおいて時間的一貫性を維持するためにピクセルレベルのモデリング機能を必要とする。
本稿では,忘れられた時間的詳細を補完的に精錬する,具体的状態空間モデル手法を提案する。
我々のRS-SSMは高い計算効率を維持しながら最先端の性能を達成する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:16:59 GMT)
AirSplat: Alignment and Rating for Robust Feed-Forward 3D Gaussian Splatting [30.9] AirSplatは、3DVFMの頑丈な幾何学的先行を高忠実でポーズのないNVSに適応させるトレーニングフレームワークである。
提案手法は, 復元品質において, 最先端のポーズレスNVS手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:52:33 GMT)
CardioDiT: Latent Diffusion Transformers for 4D Cardiac MRI Synthesis [30.8] CardioDiTは、拡散トランスを用いた短軸シネCMR合成のための完全な4次元潜伏拡散フレームワークである。
時間的VQ-Eは2D+VAtスライスをコンパクトなラテントに符号化し、拡散変圧器は完全な3D+tボリュームとして一緒にモデル化する。
その結果,スライス間の整合性,時間的コヒーレントな運動,解剖学的文脈,心機能分布が改善した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:59:07 GMT)
V2U4Real: A Real-world Large-scale Dataset for Vehicle-to-UAV Cooperative Perception [30.4] V2U4Realは、V2U(Var-to-UAV)協調物体知覚のための、世界初の大規模実世界のマルチモーダルデータセットである。
このデータセットは、様々な交通シナリオの下で都市通り、大学キャンパス、農村道路をカバーしている。
幅広い研究課題を支援するため,単エージェント3Dオブジェクト検出,協調3Dオブジェクト検出,オブジェクト追跡のためのベンチマークを構築した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:13:00 GMT)
The Language of Touch: Translating Vibrations into Text with Dual-Branch Learning [30.1] ビブロタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタク
ViPACは、周期成分と非周期成分をアンタングル化するデュアルブランチ戦略と、信号特徴を適応的に統合する動的融合機構を併用する。
実験の結果,VPACは音声や画像のキャプションから適応したベースライン手法よりも優れ,語彙の忠実度やセマンティックアライメントに優れていた。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:46:12 GMT)
Translation Asymmetry in LLMs as a Data Augmentation Factor: A Case Study for 6 Romansh Language Varieties [30.0] データ拡張の方向は、ソースとターゲット言語間のリソース勾配に一致すべきであることを示す。
人間の評価により、我々の実験は、個々のロマンシュ変種で流動的な翻訳を生成する最初のモデルを生み出すことが確認される。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:27:45 GMT)
TRACE: A Multi-Agent System for Autonomous Physical Reasoning for Seismology [29.7] TRACE(Trans-perspective Reasoning and Automated Comprehensive Evaluator)は,大規模言語モデル計画と形式的地震学制約を組み合わせたマルチエージェントシステムである。
TRACEはストレスによって引き起こされる遅延トリガーを自律的に同定し、Mw 6.4とMw 7.1の主ショックの間のカスケード相互作用を解消する。
2025年のサントリニ・コロンボ火山噴火では、構造的にガイドされた侵入モデルが特定され、断層流路を経由するエピソード移動と、均質の地殻崩壊で予想される継続的な伝播を区別する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:45:25 GMT)
Unlocking Strong Supervision: A Data-Centric Study of General-Purpose Audio Pre-Training Methods [29.6] 現在の音声事前学習は、広義の音声理解タスクのための統一表現を学習しようと試みている。
断片化され続けており、弱い、騒々しい、スケール制限のあるラベルに依存しているためボトルネックになっている。
音声分野は、まず、大規模で強力な監視フレームワークを確立する必要がある、と我々は主張する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:18:04 GMT)
Rethinking Failure Attribution in Multi-Agent Systems: A Multi-Perspective Benchmark and Evaluation [29.4] マルチエージェントシステム(MAS)は、複雑なエージェント間の依存関係とあいまいな実行軌跡により、複数のプラウジブルな属性を持つことが多い。
我々は、マルチパースペクティブな視点からMAS障害属性を再検討し、マルチパースペクティブな障害属性を提案する。
我々は,MASにおけるマルチパースペクティブな障害属性のための最初のベンチマークであるMP-Benchと,このパラダイムに合わせた新しい評価プロトコルを紹介する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:02:23 GMT)
System Design for Maintaining Internal State Consistency in Long-Horizon Robotic Tabletop Games [29.3] ロングホライゾンのテーブルトップゲームは、ロボティクスに固有のシステムに挑戦する。
知覚的あるいは実行上の小さなエラーは、蓄積されたタスク状態の無効化、意思決定モジュール間の伝搬、および脱線処理を可能とします。
本稿では,ターン型マルチロボットテーブルトップゲームにおける内部状態の整合性を維持する方法について検討する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:54:29 GMT)
Z-Erase: Enabling Concept Erasure in Single-Stream Diffusion Transformers [28.8] 概念消去は、テキスト・ツー・イメージ(T2I)モデルから不要な概念を取り除くための重要な安全メカニズムである。
Z-EraseはシングルストリームT2Iモデルに適した最初の概念消去手法である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:24:28 GMT)
Unveiling the Resilience of LLM-Enhanced Search Engines against Black-Hat SEO Manipulation [28.6] 大規模言語モデル強化検索エンジン(LLMSEs)は、Webスケール検索機能とAIによる要約を統合することで、情報検索に革命をもたらした。
これらのシステムは従来の検索エンジンよりも効率が向上したことを示しているが、確立されたブラックハット検索エンジン最適化(SEO)攻撃に対するセキュリティ上の影響は未解明のままである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:38:26 GMT)
EVA: Efficient Reinforcement Learning for End-to-End Video Agent [28.6] エンド・ツー・エンド・ビデオ・エージェントのための効率的な強化学習フレームワークであるEVAを提案する。
EVAは、何を見るか、いつ見るか、どのように見るかを自律的に決定し、クエリ駆動で効率的なビデオ理解を実現する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:03:37 GMT)
CIV-DG: Conditional Instrumental Variables for Domain Generalization in Medical Imaging [28.4] 医療AIにおけるクロスサイト一般化性は、選択バイアスによって損なわれる。
CIV-DGは病的意味をスキャナーによって引き起こされたアーティファクトから切り離す因果的枠組みである。
Camelyon17ベンチマークと大規模なChest X-Rayデータセットの実験は、CIV-DGが主要なベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:07:08 GMT)
Neuro-Cognitive Reward Modeling for Human-Centered Autonomous Vehicle Control [28.3] 人間は、シーン情報を迅速に解釈し、正確な決定をすることができる洗練された認知システムを持っている。
人間の認知的洞察を組み込むための脳波誘導型意思決定フレームワークを提案する。
我々のフレームワークは強化学習アルゴリズムの衝突回避能力を向上させることができる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 23:16:16 GMT)
PASDiff: Physics-Aware Semantic Guidance for Joint Real-world Low-Light Face Enhancement and Restoration [28.3] 本研究では,物理を意識した意味的拡散法PASDiffを提案する。
逆強度重み付けとレチネックス理論を利用して光度制約を導入し、可視性と自然色度を確実に回復する。
複雑な劣化を伴う700個の低照度顔画像のリアルタイムベンチマークであるWildDark-Faceを構築した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:02:39 GMT)
Spectral Coherence Index: A Model-Free Metric for Protein Structural Ensemble Quality Assessment [27.6] モデルフリーで回転不変な要約であるスペクトルコヒーレンス指数(SCI)を評価した。
SCIは異種タンパク質アンサンブルのためのマルチメトリックQCワークフローに組み込む際に最も有用である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:09:41 GMT)
mSFT: Addressing Dataset Mixtures Overfitting Heterogeneously in Multi-task SFT [27.1] mSFT(mSFT)は、マルチタスクデータ混合のための反復的、過度に適合する検索アルゴリズムである。
10のベンチマークと6のベースモデルで、4つのベースラインを一貫して上回る。
低い計算予算では、mSFTは訓練用FLOPを低下させながら性能を向上させることができる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:15:22 GMT)
Learning to Recorrupt: Noise Distribution Agnostic Self-Supervised Image Denoising [27.0] 自己監督型画像記述法は伝統的に、アーキテクチャ上の制約や特殊な損失関数に依存してきた。
本稿では、雑音分布の知識を不要にするためのノイズ分布に依存しない雑音分解手法であるLearning to Recorruptを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:51:16 GMT)
MoRGS: Efficient Per-Gaussian Motion Reasoning for Streamable Dynamic 3D Scenes [25.9] 既存のオンラインアプローチでは、真のシーンダイナミクスを反映したガウス運動を学習できない。
提案するMoRGSは, 4次元再構成品質を向上させるために, ガウスごとの動きを明示的にモデル化する, ガウスごとの効率的なオンライン動作推論フレームワークである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:25:11 GMT)
THEMIS: Towards Holistic Evaluation of MLLMs for Scientific Paper Fraud Forensics [25.8] TheMISは、マルチモーダルな大規模言語モデル(MLLM)を現実のシナリオにおける視覚的不正推論で包括的に評価するために設計された新しいベンチマークである。
60.47%の複雑なテクスチャ画像により、TheMISは既存のベンチマークと現実世界の学術的詐欺の複雑さの間に重要なギャップを埋める。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:49:25 GMT)
CSI-tuples-based 3D Channel Fingerprints Construction Assisted by MultiModal Learning [25.6] 低高度通信は、空中および地上の無線リソースの統合を促進し、ネットワークカバレッジを拡大し、伝送品質を向上させる。
低高度伝送の実現手段として,3次元チャネル指紋(3D-CF)が通信環境の理解を高めることが期待されている。
3D-CFを構築するためのモジュール化されたマルチモーダルフレームワークを提案する。
解析の結果,提案フレームワークは3D-CFを効率的に構築でき,最先端のアルゴリズムよりも少なくとも27.5%高い精度が得られることがわかった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:25:43 GMT)
AdaSFormer: Adaptive Serialized Transformers for Monocular Semantic Scene Completion from Indoor Environments [25.5] 室内MSSCに適したシリアライズトランスフォーマーフレームワークであるAdaSFormerを紹介する。
本モデルでは,(1)適応型シリアライズトランスフォーマー,(2)空間情報の豊かさを捉える中心-相対的位置変化,(3)畳み込みと変圧器の異種表現をブリッジする共変調層正規化という3つの重要な設計を特徴とする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:33:36 GMT)
Second order Recurrences, quadratic number fields and cyclic codes [25.4] Wall-Sun-Sun 素数 (正確には WSS 素数) は、フィボナッチ繰り返しの周期が mod $p$ と mod $p2 であるようなそれらの素数として定義される。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:39:50 GMT)
Back to Basics: Revisiting ASR in the Age of Voice Agents [25.4] WildASRは、実際の人間の発話をベースとした診断ベンチマークである。
厳格で不均一なパフォーマンス劣化があり、モデルロバスト性は言語や条件間で伝達されない。
この結果から,生産システムにおけるASRの信頼性の理解と改善には,目標因子分離評価が不可欠であることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:03 GMT)
RadioDiff-FS: Physics-Informed Manifold Alignment in Few-Shot Diffusion Models for High-Fidelity Radio Map Construction [25.4] 無線地図(RM)は6Gネットワーク計画に不可欠な空間的連続的な伝搬特性を提供する。
提案するRadioDiff-FSは,事前学習されたメインパス生成器をマルチパスリッチターゲットドメインに適応させる,数発の拡散フレームワークである。
実験の結果、RadioDiff-FSは静的RMではNMSEを59.5%、動的RMでは74.0%削減した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:53:19 GMT)
How good was my shot? Quantifying Player Skill Level in Table Tennis [25.1] 我々は、各プレイヤーの戦術ラケットストロークの生成モデルを学び、それらを共通の潜在空間に埋め込む。
我々はこの学習したプレイヤー空間を探索し、スキルを集合的に表現する異なるプレイスタイルや属性を反映していることを発見した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:49 GMT)
From Intent to Evidence: A Categorical Approach for Structural Evaluation of Deep Research Agents [25.1] 深層研究エージェント(DRA)は、複雑な情報合成のための有望なパラダイムとして登場した。
我々は、DRAの挙動を圏論のレンズを通して形式化し、構造保存マップの合成として深層研究ワークフローをモデル化する。
エージェントを4つの解釈可能な軸に沿ってストレステストするために設計された296の質問を持つメカニズム認識ベンチマークを導入する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:37:26 GMT)
FinMCP-Bench: Benchmarking LLM Agents for Real-World Financial Tool Use under the Model Context Protocol [25.1] FinMCP-Benchは、大規模言語モデル(LLM)を評価するためのベンチマークである。
65のリアルファイナンシャルMPPと3種類のサンプル、シングルツール、マルチツール、マルチターンが組み込まれており、タスクの複雑さの異なるレベルにわたるモデルの評価を可能にしている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:20:04 GMT)
Select, Hypothesize and Verify: Towards Verified Neuron Concept Interpretation [24.8] 既存のアプローチでは、自然言語の記述を生成することによってニューロンの概念を記述する。
実際、一部のニューロンは冗長であるかもしれないし、誤解を招く概念を提供するかもしれない。
生成した概念が対応するニューロンを高度に活性化するかどうかを確認する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:45:41 GMT)
Photon: Speedup Volume Understanding with Efficient Multimodal Large Language Models [24.3] 可変長のトークンシーケンスを持つ3次元医用ボリュームを表すフレームワークであるPhotonを提案する。
我々は、フォトンがリソース使用量を減らし、トレーニングと推論の両方を高速化し、最先端の精度を達成することを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:18:10 GMT)
Missing-Aware Multimodal Fusion for Unified Microservice Incident Management [22.7] ARMORは、モダリティの欠如を前提とした、自己管理型のフレームワークである。
自己監督型自己回帰とマスク誘導型再構成を用いて、異常検出、障害トリアージ、根本原因の局在を共同で最適化する。
完全なデータ条件下での最先端性能を実現し、厳密なモダリティ損失でも堅牢な診断精度を維持する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:14:57 GMT)
Trace2Skill: Distill Trajectory-Local Lessons into Transferable Agent Skills [22.7] Trace2Skillは、人間の専門家がいかにスキルを作成できるかを反映するフレームワークです。
個々のトラジェクトリにシーケンシャルに反応する代わりに、Trace2Skillは並列なサブエージェント群を派遣して、さまざまな実行プールを分析する。
トラジェクトリ固有のレッスンを抽出し、階層的にそれらをインダクティブ推論を通じて統合され、コンフリクトフリーなスキルディレクトリに集約する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:26:38 GMT)
THFM: A Unified Video Foundation Model for 4D Human Perception and Beyond [22.7] 人中心認識のための統合ビデオ基盤モデルTHFMを提案する。
我々のモデルは、様々なベンチマークで最先端の専門モデルを超えているか、あるいは超えている。
例えば、シーン内の1人の人間で動画をトレーニングしたモデルは、複数の人間や、人為的なキャラクターや動物のような他のオブジェクトクラスに一般化する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:28:40 GMT)
Unbiased Multimodal Reranking for Long-Tail Short-Video Search [22.6] ショートビデオ検索エンジンのKuaishouは、毎日何十億もの検索を提供している。
わずかなユーザー行動データが、低品質のコンテンツを増幅するモデルを引き起こす。
本稿では,実際のユーザ動作を伴わないユーザエクスペリエンスを推定するマルチモーダル・リグレード・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:07:15 GMT)
Activation Matters: Test-time Activated Negative Labels for OOD Detection with Vision-Language Models [22.6] アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)から逸脱するサンプルを特定することを目的としている。
1つの一般的なパイプラインは、IDクラスから離れた負のラベルを導入し、それらのラベルとの距離に基づいてOODを検出することでこの問題に対処する。
コーパスデータセット全体のアクティベーションレベルを動的に評価することにより、アンダーラインテスト時アンダーラインアクティベートアンダーラインNegativeアンダーラインラベル(TANL)を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:53:04 GMT)
Pose-Free Omnidirectional Gaussian Splatting for 360-Degree Videos with Consistent Depth Priors [22.3] PFGS360は、ポーズのない全方位ビデオから3Dガウスを再構築する、一方向全方位3DGS法である。
実世界と合成360度ビデオの両方において、既存のポーズレスおよびポーズ対応の3DGS法よりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:13:20 GMT)
S2D2: Fast Decoding for Diffusion LLMs via Training-Free Self-Speculation [22.3] ブロック拡散言語モデルはブロックワイド自己回帰復号とブロック内並列復号を結合する。
この問題に対処する既存のアプローチでは、追加のトレーニングが必要か、追加のテストタイム計算が必要になります。
ブロック拡散言語モデルのための訓練不要な自己投機的デコーディングフレームワークであるS2D2を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:48:50 GMT)
Learning Rollout from Sampling:An R1-Style Tokenized Traffic Simulation Model [21.8] R1Simは、運動トークンエントロピーパターンに基づく強化学習を最初に試みる試みである。
エントロピー誘導型適応サンプリング機構を導入し,不確実性が高いが高い確率で見落とされた動きトークンに着目した。
全体として、これらのコンポーネントは多種多様な高不確実性サンプリングとグループレベルの比較評価を通じて、バランスの取れた探索・探索のトレードオフを可能にする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:29:46 GMT)
Sparton: Fast and Memory-Efficient Triton Kernel for Learned Sparse Retrieval [21.6] Spladeのような最先端のLearted Sparse Retrieval (LSR)モデルでは、Language Modeling (LM)ヘッドを使用して、潜伏した隠された状態を語彙的にアンコールされたロジット行列に投影する。
その効果にもかかわらず、LMヘッドは語彙の重大さによる大きなメモリボトルネックを発生させる(V)。
LSRモデルにおけるLMヘッドに適した高速メモリ効率のTritonカーネルであるSpartonを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:20:24 GMT)
TRACE: Object Motion Editing in Videos with First-Frame Trajectory Guidance [21.6] Traceは、1つのアンカーフレームで所望の軌跡を設計し、時間的に一貫した編集ビデオを合成することを可能にするフレームワークである。
本手法は,最近の映像・映像・映像の編集方法よりも,よりコヒーレントでリアルで制御可能なモーション編集を実現する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:50:42 GMT)
PMT: Plain Mask Transformer for Image and Video Segmentation with Frozen Vision Encoders [21.5] Vision Foundation Models (VFM) は、1つの凍結エンコーダが複数の下流タスクを同時に処理できるようにする。
近年,EoMT や VidEoMT などの画像・映像セグメンテーションのための VFM ベースのエンコーダのみのモデルでは,低レイテンシで競合精度が向上している。
高速なトランスフォーマーベースセグメンテーションデコーダであるPlain Mask Decoder (PMD) を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:44:30 GMT)
A Wireless World Model for AI-Native 6G Networks [21.4] 本稿では,無線チャネルの進化を予測するマルチモーダル基盤フレームワークであるWireless World Model (WWM)を紹介する。
WWMは、目に見えない一般化環境、見えない一般化シナリオ、実世界の測定において顕著な性能を達成する。
これは物理を意識した6Gインテリジェンスを物理世界に適用する道を開くものだ。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:16:55 GMT)
Parameter-Free Dynamic Regret for Unconstrained Linear Bandits [21.4] 直交線形帯域問題における動的後悔について検討した。
順序の最適後悔保証を達成するために,線形帯域幅に対する最初のアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:16:18 GMT)
Dictionary-based Pathology Mining with Hard-instance-assisted Classifier Debiasing for Genetic Biomarker Prediction from WSIs [20.7] 大腸癌における遺伝子バイオマーカーの予測は臨床診断に不可欠である。
しかし、2つの主要な課題は正確な予測を妨げている: 1) 病理成分間の複雑な相互接続を含む病理認識表現を構築することは困難である。
本稿では,D2Bio と呼ばれるこれらの課題に対処するために,D2Bio を用いた階層型階層型分類器デバイアスティングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:23:28 GMT)
MolQuest: A Benchmark for Agentic Evaluation of Abductive Reasoning in Chemical Structure Elucidation [20.6] 分子構造解明のための新規なエージェントベース評価フレームワークであるMolQuestを紹介する。
既存のデータセットとは異なり、MolQuestは分子構造解明をマルチターンインタラクティブタスクとして定式化している。
その結果、現代のフロンティアモデルでは、真正の科学的シナリオにおいて重大な制限が示されることが明らかとなった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:57:17 GMT)
A Compression Perspective on Simplicity Bias [20.2] ニューラルネットワークにおける特徴選択において、単純さのバイアスがどのように支配するかを示す。
データの増大は、自明なショートカットを除外することによって堅牢性を促進する。
我々は、ニューラルネットワークの特徴選択が最適2部圧縮と同じ解の軌跡に従うことを示す半合成ベンチマークで、我々の理論を検証した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:02:49 GMT)
Cov2Pose: Leveraging Spatial Covariance for Direct Manifold-aware 6-DoF Object Pose Estimation [20.1] 単一のRGB画像から6-DoFオブジェクトのポーズ推定の問題に対処する。
通常、中間2次元キーポイントを予測し、パースペクティブ-n-Pointソルバに続く間接的手法は、優れた性能を示している。
ポーズをエンドツーエンドで回帰する直接的なアプローチは、通常より計算効率が良いが精度は低い。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:42:28 GMT)
Beyond identifiability: Learning causal representations with few environments and finite samples [19.8] サブ線形な環境を持つデータから因果表現を学習するための明示的な有限サンプル保証を提供する。
因果表現は未知の多ノード干渉の対数でのみ学習可能であることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:03:57 GMT)
Visual Attention Drifts,but Anchors Hold:Mitigating Hallucination in Multimodal Large Language Models via Cross-Layer Visual Anchors [19.6] マルチモーダル大言語モデルは、しばしばオブジェクト幻覚に悩まされる。
視覚的特徴の階層的進化について検討し,幻覚は初期からの視覚的ノイズに回帰する深層注意から生じることを明らかにする。
そこで本研究では,Cross-Layer Visual Anchors(CLVA)について述べる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:49:21 GMT)
Density-aware Soft Context Compression with Semi-Dynamic Compression Ratio [19.4] 本稿では,Semi-Dynamic Context Compressionフレームワークを紹介する。
本手法では,固有情報密度に基づいて圧縮目標を予測する離散比セレクタを特徴とする。
私たちのフレームワークは、静的なベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:36:55 GMT)
Learning domain-invariant features through channel-level sparsification for Out-Of Distribution Generalization [19.3] アウト・オブ・ディストリビューションの一般化は、画像解析システムを評価するための主要な指標となっている。
ディープラーニングモデルはドメイン固有のコンテキストをキャプチャする傾向があり、非因果的機能への依存関係をショートカットする。
チャネルレベルの因果マスクを用いて特徴空間を強制する手法である階層因果ドロップアウト(HCD)を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:36:42 GMT)
Instance-optimal stochastic convex optimization: Can we improve upon sample-average and robust stochastic approximation? [19.2] 本研究では,加法雑音と乗法雑音の両方を導入するオラクルの下で,スムーズかつ強凸な集団損失関数の制約のない最小化について検討する。
その結果, VISOR の加速変種はインスタンス最適であり, 対数的因子の最大化を達成できる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:12:01 GMT)
Adaptive Learned Image Compression with Graph Neural Networks [18.9] 効率的な画像圧縮は局所的および大域的冗長性の両方のモデリングに依存する。
最先端の学習画像圧縮手法の多くはCNNやTransformerをベースとしている。
グラフニューラルネットワーク(GNN)に基づくコンテンツ適応型画像圧縮フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:05:14 GMT)
Drive My Way: Preference Alignment of Vision-Language-Action Model for Personalized Driving [18.9] Drive My Way(DMW)は、ユーザの長期的な運転習慣に合わせて、リアルタイムなユーザ指示に適応するパーソナライズされた運転フレームワークである。
DMWは、複数の現実のドライバーから収集したパーソナライズされた運転データセットからユーザ埋め込みを学び、計画中にこの埋め込みに関するポリシーを条件にします。
私たちのデータとコードはhttps://dmw-cvpr.io/.com/で公開されています。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:54 GMT)
Maximum Entropy Behavior Exploration for Sim2Real Zero-Shot Reinforcement Learning [18.9] 実際のロボットシステムにおける四足歩行制御のために,$textitonline$zero-shot RLについて検討した。
我々は、教師なしの行動探索戦略と正規化評論家を組み合わせたオンラインゼロショットRLアルゴリズムであるFB-MEBEを紹介する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:07:01 GMT)
The Geometry of Efficient Nonconvex Sampling [18.7] 任意のコンパクト体から一様にサンプリングする効率的なアルゴリズムを提案する。
アルゴリズムの複雑さは、$mathcalX$上の一様分布のポアンカレ定数とセット$mathcalX$の体積成長定数の次元にある。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:35:53 GMT)
Exons-Detect: Identifying and Amplifying Exonic Tokens via Hidden-State Discrepancy for Robust AI-Generated Text Detection [18.5] 我々は,Exon-Awareトークン再重み付けの観点から,AI生成テキスト検出のためのトレーニング不要な方法であるExons-Detectを提案する。
Exons-Detectは、二重モデル設定下で隠れ状態の不一致を測定して情報的エクソニックトークンを特定し、増幅し、その結果の重要重み付きトークンシーケンスから解釈可能な翻訳スコアを算出する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:12:19 GMT)
Interpretable Zero-shot Referring Expression Comprehension with Query-driven Scene Graphs [18.4] ゼロショット参照式理解(REC)は、自然言語クエリが与えられた画像中の対象物を特定することを目的としている。
既存のビジョンランゲージモデル(VLM)は、テキストクエリと画像領域の特徴的類似性を測定することで、ゼロショットRECに対処する。
我々は、クエリ駆動のシーングラフを構造化中間体として活用した、解釈可能なゼロショットREC法である textbfSGREC を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:05:30 GMT)
Persistent Robot World Models: Stabilizing Multi-Step Rollouts via Reinforcement Learning [18.4] アクションコンディショニングされたロボットワールドモデルは、ロボットアクションシーケンスが与えられた操作されたシーンの将来のビデオフレームを生成する。
これらのモデルは、短時間の予測に最適化され、自動回帰的にデプロイされたときに分解される。
我々は,自己回帰的なロールアウトで世界モデルを訓練する強化学習スキームを導入する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:36:08 GMT)
Chasing Autonomy: Dynamic Retargeting and Control Guided RL for Performant and Controllable Humanoid Running [18.4] ヒューマノイドロボットは、速いランニングやダイナミックランニングを含む、人間のようなロコモットを約束する。
人間の動きを模倣できる強化学習コントローラが普及しているが、それらはシングルモーションプレイバックに制限されることが多い。
本稿では,最適化ルーチンを通じて人間の動作を動的に再ターゲットするパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:48:33 GMT)
AnyDoc: Enhancing Document Generation via Large-Scale HTML/CSS Data Synthesis and Height-Aware Reinforcement Optimization [18.4] AnyDocは、さまざまなドキュメントカテゴリで複数の生成タスクを処理できるフレームワークです。
Doc HTMLは、265,206のドキュメントサンプルを含む大規模なデータセットである。
AnyDocは、3つの実用的な文書生成タスクを達成するためにMLLM(Multi-Modal Large Language Model)を微調整する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:43:14 GMT)
Focus-to-Perceive Representation Learning: A Cognition-Inspired Hierarchical Framework for Endoscopic Video Analysis [18.3] 臨床検査をエミュレートする認知に触発された階層的枠組みであるフォーカス・ツー・パーセプティブ・ラーニング(FPRL)を提案する。
FPRLは最初、静的セマンティクスを学ぶためにフレーム内病変中心の領域に焦点を当て、フレーム間の進化を知覚してコンテキストセマンティクスをモデル化する。
11の内視鏡的ビデオデータセットの実験により、FPRLは様々な下流タスクで優れたパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:06:48 GMT)
Detecting Complex-Energy Braiding Topology in a Dissipative Atomic Simulator with Transformer-Based Geometric Tomography [17.9] 非エルミート系では、特異なスペクトル幾何学は複素エネルギー帯の位相的ブレイディングにつながる。
本研究では,Transformerをベースとした機械学習フレームワークを導入し,この相互作用を解析し,コールド原子シミュレータで実験的に実証する。
我々の研究は、低温原子などにおける非エルミート位相のML誘導による探索の道を開いた。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:04:08 GMT)
PIDP-Attack: Combining Prompt Injection with Database Poisoning Attacks on Retrieval-Augmented Generation Systems [17.9] PIDP-アタック(PIDP-Attack)は、RAGのデータベース中毒と即時注射を統合する新規な化合物である。
PIDP-Attack が PoisonedRAG を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:30:18 GMT)
The Value of Information in Resource-Constrained Pricing [17.8] ハードキャパシティの制約の下では、不正確な予測に作用することで、将来の期間に必要な在庫を不可逆的に減少させることができる。
本研究では,予測の不確実性が線形需要,雑音,有限容量の動的価格決定にどのように伝播するかを検討する。
すべてのアルゴリズムは、キャパシティ境界付近の価格を安定化する境界アトラクション機構に依存している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:06:57 GMT)
Hierarchy-Guided Multimodal Representation Learning for Taxonomic Inference [17.7] 階層型マルチモーダル学習のためのエンドツーエンドの2つの変種を提案する。
CLiBD-HiRは階層情報正規化(HiR)を導入し、分類学レベルで埋め込み幾何学を形作る。
CLiBD-HiR-Fuseは、画像のみ、DNAのみ、または関節推論をサポートする軽量な融合予測器を訓練する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:47:03 GMT)
VideoWeaver: Multimodal Multi-View Video-to-Video Transfer for Embodied Agents [17.7] VideoWeaverは、最初のマルチモーダルマルチビューV2V翻訳フレームワークである。
我々は、異なる拡散時間ステップでビューを訓練し、モデルがジョイントとコンディショナルの両方のビュー分布を学習できるようにする。
実験では、単一ビューの翻訳ベンチマークにおける最先端の性能よりも優れているか類似した性能を示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:14:13 GMT)
Optimal High-Probability Regret for Online Convex Optimization with Two-Point Bandit Feedback [17.2] 本稿では,2点帯域幅フィードバックによるオンライン凸最適化の問題点について考察する。
O(d(log T + log (1/))/)$$$$$-strongly convex loss。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:52:19 GMT)
CVA: Context-aware Video-text Alignment for Video Temporal Grounding [16.5] 時間に敏感なビデオテキストアライメントを実現するための新しいフレームワークであるCVA(Context-aware Video-text Alignment)を提案する。
まず、意味的に無関係なコンテンツだけが混在することを保証する新しいデータ拡張戦略であるQCD(Query-aware Context Diversification)を提案する。
第二に、文脈不変境界識別(CBD)損失は、時間的境界の挑戦において意味的一貫性を強制する対照的な損失である。
第3に、窓付き自己注意と双方向交差を組み合わせた階層型アーキテクチャであるContext-enhanced Transformer (CTE)を導入する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:53:00 GMT)
Colon-Bench: An Agentic Workflow for Scalable Dense Lesion Annotation in Full-Procedure Colonoscopy Videos [16.5] Colon-Benchは、時間的提案、バウンディングボックス追跡、AI駆動の視覚的確認、ヒューマン・イン・ザ・ループ・レビューをシームレスに統合する、新しいAIパイプラインである。
対象範囲はビデオ528本, 病変14種類(ポリープ, 潰瘍, 出血を含む), 境界ボックス300, セグメンテーションマスク213,000本, 臨床記述133,000語であった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:58:43 GMT)
Shaping the Future of Mathematics in the Age of AI [16.2] この変革が特に迫っている5つの領域、すなわち価値観、実践、教育、技術、倫理について調べる。
我々は、知的自治の保護、実践の再考、カリキュラムの拡大、学術的指向のインフラの構築、共有倫理原則の整備に関する勧告を提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:04:28 GMT)
Runtime Burden Allocation for Structured LLM Routing in Agentic Expert Systems: A Full-Factorial Cross-Backend Methodology [16.1] エージェントAIシステムにおいて、大規模言語モデル(LLM)がコアコントロールコンポーネントになるにつれて、信頼性の高い構造化ルーティングは、正確性、レイテンシ、実装コストのバランスをとる必要がある。
このバランスはプロンプトやスキーマだけでなく、生成スタック全体で構造的な作業がどのように割り当てられるかによっても形作られています。
この定式化は、48のデプロイメント構成と15,552のリクエストをOpenAI、Gemini、Llamaバックエンドでカバーする包括的なフルファクターベンチマークを通じて評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:50:46 GMT)
SliderQuant: Accurate Post-Training Quantization for LLMs [16.0] 事前訓練された高精度言語モデルを考えると、シーケンシャル量子化フレームワークは異なるレイヤを等しく扱う。
我々はスライディング層量子化(SliderQuant)と呼ばれる新しいPTQフレームワークを提案する。
本手法は、重量のみの量子化と重量活性化の量子化の両方のために既存のPTQ法より優れている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:21:38 GMT)
Denoise and Align: Towards Source-Free UDA for Robust Panoramic Semantic Segmentation [15.9] パノラマセマンティックセマンティックセグメンテーションは、自動運転やバーチャルリアリティーといった重要な応用における360度シーン理解の鍵となる。
2つの主要な課題は、パノラマ射影に固有の厳密な幾何学的歪みと、密接なアノテーションの禁止コストである。
DAPASSは、ソースデータなしで知識を堅牢に伝達するフレームワークである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:54:43 GMT)
Towards Generalizable Robotic Data Flywheel: High-Dimensional Factorization and Composition [15.8] 十分な多様なデータがないことは、ジェネラリストロボットモデルにとって大きなボトルネックとなっている。
本研究では,F-ACILを提案する。F-ACILは,構造化されたデータ因子化を実現するための反復学習フレームワークである。
実世界の大規模な実験により,F-ACILは45%以上の性能向上を達成できることが示されている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:00:39 GMT)
Training the Knowledge Base through Evidence Distillation and Write-Back Enrichment [15.6] 知識ベースはトレーニング可能なコンポーネントとして扱われるべきである、と我々は主張する。
本稿では,ラベル付き例を用いて検索が成功する場所を特定するフレームワークWriteBack-RAGを提案する。
この方法はコーパスのみを変更するため、オフライン前処理ステップとして一度適用することができる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:49 GMT)
Semantic-Aware Prefix Learning for Token-Efficient Image Generation [15.5] 本稿では,クエリベースの1Dトークン化フレームワークにクラスレベルの意味条件を注入するSemantic-Aware Prefixトークン化手法を提案する。
トレーニング中にセマンティクスを必須にするために、SMAPは、セマンティクス条件と早期潜伏プレフィックスが責任を負うように強制するテールトークンドロップ戦略を導入する。
ImageNetの実験では、SMAPは離散的および連続的なトークン化設定における再構成品質を一貫して改善している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:52:51 GMT)
Towards Remote Attestation of Microarchitectural Attacks: The Case of Rowhammer [15.3] HammerWatchはRowhammer対応の遠隔検定プロトコルで、外部の検証者が、システムがハードウェアによる障害行動を示すかどうかを評価することができる。
商品ハードウェア上でHammerWatchを実装し,20000 の擬似良性および悪意のあるアクセスパターンで評価する。
以上の結果から, 本検証装置は, 保守的活動下での良性手術とRowhammer様の動作を確実に区別できることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:10:06 GMT)
Probing the Lack of Stable Internal Beliefs in LLMs [15.2] ペルソナ駆動の大規模言語モデル(LLM)は、人間のような性格特性をシミュレートするために、相互作用間の一貫した行動傾向を必要とする。
この研究は、LLMがマルチターン相互作用において、未定のゴールへの永続的な執着として定義された「単純整合性」を維持することができるかどうかを考察する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:52:55 GMT)
GeoHeight-Bench: Towards Height-Aware Multimodal Reasoning in Remote Sensing [15.1] 高度認識型リモートセンシング理解のための総合評価フレームワークを提案する。
我々は、系統的なプロンプトエンジニアリングとメタデータ抽出を利用したスケーラブルなVLM駆動データ生成パイプラインを開発した。
高度認識の必要性を検証するため,最初の高度認識型リモートセンシングLMMベースラインであるGeoHeightChatを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:38:02 GMT)
To Use or Not to Use: Investigating Student Perceptions of Faculty Generative AI Usage in Higher Education [15.0] 学生は教職や学級の文脈におけるGenAI使用に関する懸念を表明している。
発見者は、高等教育における教育・学習におけるGenAIの今後の活用を知らせた。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:54:57 GMT)
Beyond Content Safety: Real-Time Monitoring for Reasoning Vulnerabilities in Large Language Models [14.9] 大規模言語モデルは、複雑なタスクを解決するために明示的なチェーン・オブ・シンク(CoT)推論にますます依存している。
LLMの安全性に関する既存の研究は、コンテンツ安全性に焦点を当てている。
我々は、推論の安全性をセキュリティの側面として認識する:モデルの推論の軌道が論理的に一貫したものであるという要求。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:08:56 GMT)
ETA-VLA: Efficient Token Adaptation via Temporal Fusion and Intra-LLM Sparsification for Vision-Language-Action Models [14.8] 本稿では,VLAモデルの効率的なToken AdaptationフレームワークであるETA-VLAを提案する。
ETA-VLAは最先端のベースラインに匹敵する運転性能が得られることを示す。
提案手法は, 85%の視覚トークンを抽出し, FLOPを61%削減するが, NAVSIM v2ベンチマークでは元の精度の94%を維持している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:53:42 GMT)
Maximizing Qubit Throughput under Buffer Decoherence and Variability in Generation [14.6] 量子通信ネットワークは、絡み合い分布や量子鍵分布のような応用のために、高忠実で符号化されていない量子ビットの伝送を必要とする。
現在の実装はバッファ容量の制限とキュービットのデコヒーレンスによって制約されている。
我々は,このシステムを有限バッファキューにおける入出力制御問題としてモデル化し,各ジョブに関連付けられた報酬をその待ち時間の減少関数とする。
バッファ空間が利用可能になった直後に新しいキュービットが生成される単純な「ラグなし」ポリシーが最適である解析条件を導出する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:23:52 GMT)
Residual-as-Teacher: Mitigating Bias Propagation in Student--Teacher Estimation [14.5] そこでは,教師の事前学習による予測を用いて,学生モデルの指導を行う学習者環境における統計的推定について検討する。
標準的アプローチは、教師の出力と直接一致するように学生に訓練することであり、これは学生ソフトマッチング(SM)と呼ばれる。
本稿では,教師が教師の予測の残差を推定する手法として,Ress-as-Teacher (RaT) を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:07:47 GMT)
$π$, But Make It Fly: Physics-Guided Transfer of VLA Models to Aerial Manipulation [14.4] 本研究では,操作を前提としたVLAの空中ピックアップ・アンド・プレイスタスクへの転送可能性を検討するシステムであるAirVLAを紹介する。
この"ダイナミックスギャップ"を埋めるために、ポリシのフローマッチングサンプリングプロセスに直接ペイロード制約を注入するPayload-Aware Guidanceメカニズムを導入します。
本手法は460個の実世界の累積実験により評価し,この合成データが性能の鍵となることを実証した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:19:54 GMT)
A Priori Sampling of Transition States with Guided Diffusion [14.2] 本稿では,A Priori Smpling of TRAnsition States with Guided Diffusionを紹介する。
ASTRAは高い精度で遷移状態を見つけ、複数の反応経路を発見し、複雑な分子系の力学的研究を可能にする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 23:44:48 GMT)
FluxEDA: A Unified Execution Infrastructure for Stateful Agentic EDA [14.0] 本稿では,エージェントEDAのための統一かつステートフルな基盤基板であるFluxEDAを提案する。
F FluxEDAは、構造化されたリクエストとレスポンスハンドリングを備えたマネージドゲートウェイベースの実行インターフェースを導入している。
永続的なバックエンドインスタンスも維持する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:49:19 GMT)
PICon: A Multi-Turn Interrogation Framework for Evaluating Persona Agent Consistency [13.9] 大規模言語モデル(LLM)に基づくペルソナエージェントは、ヒトの参加者にスケーラブルなプロキシとして急速に採用されている。
論理的連鎖型マルチターン質問を通じてペルソナエージェントを探索する評価フレームワークPIConを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:34:34 GMT)
Large Language Model as Token Compressor and Decompressor [13.8] 既製のLCMは優れたトークン圧縮機および圧縮機として機能することを示す。
我々は、自己表現型自動符号化学習フレームワークを用いて、長文を離散長潜時符号のコンパクトな内部言語に翻訳する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:30:44 GMT)
Stochastic Ray Tracing for the Reconstruction of 3D Gaussian Splatting [13.6] レイトレーシング3DGSの識別可能なソートフリーな定式化について述べる。
標準的な3DGSでは,ソートに基づく3DGSの再現品質と高速化が一致している。
3DGSでは、同じ推定器が、完全に光線を照射したシャドウ線で、ガウスあたりのシェーディングを駆動する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:01:55 GMT)
360° Image Perception with MLLMs: A Comprehensive Benchmark and a Training-Free Method [13.5] 我々は、高解像度の360 VQAのためのトレーニング不要なシーングラフベースのフレームワークFree360を開発した。
Free360は、推論プロセスをモジュラーステップに分解し、各ステップに適合した360画像に適応的な球面画像変換を適用し、その結果情報をシームレスに解答生成のための統一グラフ表現に統合する。
実験によると、Free360はベースMLLMを一貫して改善し、360 VQAタスクに対して強力なトレーニング不要のソリューションを提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:43:38 GMT)
Robust Principal Component Completion [13.2] 主成分分析の多くの応用において、スパースフォアグラウンドは低ランク背景からの要素を置き換える。
スパースコンポーネントをそのサポートを決定することによって間接的に識別する新しいフレームワークが提案されている。
提案手法は,合成データに対するほぼ最適推定と,実色ビデオおよびハイパースペクトルデータセットにおける頑健な前景抽出と異常検出性能を提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:54:44 GMT)
MIRAGE: The Illusion of Visual Understanding [13.2] 本稿では,これらのシステムがどのように処理し,視覚情報を統合するのかという仮定に挑戦する3つの知見を報告する。
画像入力がなければ、モデルは一般的なマルチモーダルベンチマークと医療ベンチマークで驚くほど高いスコアを獲得します。
我々は、マルチモーダルAIシステムの公平かつ視覚的な評価のための原則的ソリューションとしてB-Cleanを紹介した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:38:26 GMT)
GeoNDC: A Queryable Neural Data Cube for Planetary-Scale Earth Observation [13.2] 惑星スケールの地球観測データを連続的な時間的ニューラルネットワークとして符号化するクエリー可能なニューラルデータキューブ。
世界20年のMODIS MCD43A4衛星観測実験
結果は、GeoNDCが惑星規模の地球観測のために統合されたAIネイティブ表現を提供することを示唆している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:16:42 GMT)
Label What Matters: Modality-Balanced and Difficulty-Aware Multimodal Active Learning [13.1] モダリティバランスと難易度を考慮した能動学習のための強化学習フレームワークRL-MBAを提案する。
Food101、KineeticsSound、VGGSoundの実験は、RL-MBAが強いベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:26:48 GMT)
IncreRTL: Traceability-Guided Incremental RTL Generation under Requirement Evolution [13.1] IncreRTLは、要求進化下でのインクリメンタルRTL生成のためのフレームワークである。
既存の大規模言語モデル(LLM)に基づいて、自然言語記述からRTLコードを生成する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:02:39 GMT)
EgoXtreme: A Dataset for Robust Object Pose Estimation in Egocentric Views under Extreme Conditions [13.0] EgoXtremeは、エゴセントリックな視点から完全にキャプチャされた大規模な6Dポーズ推定データセットである。
EgoXtremeは、特に低光下では極端に保たないことを示す。
EgoXtremeは次世代のポーズ推定モデルの開発と評価に欠かせない資源である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:56:18 GMT)
SEVerA: Verified Synthesis of Self-Evolving Agents [13.0] 自己進化型エージェントフレームワークは、安全性や正確性の正式な保証を提供しない。
エージェントコード生成を制約付き学習問題として定式化し、ハードな形式仕様とソフトな目的とを組み合わせてタスクユーティリティをキャプチャする。
探索はFGGMコールを含む候補パラメトリックプログラムを合成し、検証は全てのパラメータ値に対する厳しい制約に関して正当性を証明し、制約のない学習に還元する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:32:20 GMT)
Geo$^\textbf{2}$: Geometry-Guided Cross-view Geo-Localization and Image Synthesis [12.9] クロスビュー地理空間学習は、クロスビュージオローカライゼーション(CVGL)とクロスビュー画像合成(CVIS)の2つの重要なタスクからなる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:36:09 GMT)
Train at Moving Edge: Online-Verified Prompt Selection for Efficient RL Training of Large Reasoning Model [12.9] HIVEは、データ効率の強化学習のためのデュアルステージフレームワークである。
我々は,HIVEが性能を損なうことなく,ロールアウト効率を著しく向上することを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:52:35 GMT)
Policy-Guided World Model Planning for Language-Conditioned Visual Navigation [12.8] 我々は、学習ナビゲーションポリシーの長所と、命令条件付きビジュアルナビゲーションのための潜在世界モデルプランニングを組み合わせた2段階のフレームワークであるPiJEPAを提案する。
実世界のナビゲーションタスクの実験では、PiJEPAはスタンドアロンのポリシー実行と非インフォームドなワールドモデル計画の両方で著しく優れています。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 23:47:49 GMT)
Rethinking Health Agents: From Siloed AI to Collaborative Decision Mediators [12.7] 医療におけるAIシステムはサイロ化された構成で運用されており、医療中心のマルチステークホルダー関係ではなく、個々のユーザーをサポートする。
本稿では,コンテキスト情報を抽出し,メンタルモデルを精査し,足場共有理解を行うAIコラボレータを設計するための概念的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:27:13 GMT)
Free-Lunch Long Video Generation via Layer-Adaptive O.O.D Correction [12.7] 長ビデオ推論のための学習自由層適応フレームワークFreeLOCを提案する。
提案手法は, 時間的整合性と視覚的品質の両面において, 既存のトレーニング不要の手法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:12:14 GMT)
Group-Differentiated Discourse on Generative AI in High School Education: A Case Study of Reddit Communities [12.6] 我々は、Redditコミュニティが高校教育における生成AIについてどのように議論するかを研究する。
5つの教育関連サブレディットからの3,789の投稿を用いて、学生、教師、混合コミュニティを比較した。
教師は明示的な教育的トレードオフを明確に表現し、同時にAIを学習にとって有益で有害なものとみなす傾向にある。
学生は、非難、成績、執行に関して、AIを戦術的に議論することが多い。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:06:21 GMT)
Elastic Weight Consolidation Done Right for Continual Learning [12.2] EWC(Elastic Weight Consolidation)は、勾配に基づいて重みを推定する。
EWCのFiher Information Matrix (FIM)への依存は、勾配の消失と不正確な重要度推定をもたらす。
本稿では,EWC の重要度推定を補正する簡易かつ効果的な修正である Logits Reversal (LR) 演算を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:41:53 GMT)
CTS-PLL: A Robust and Anytime Framework for Collaborative Task Sequencing and Multi-Agent Path Finding [12.0] 協調的タスクシークエンシングとマルチエージェントパス探索(CTS-MAPF)問題では、衝突を避けながらタスクのシーケンスを完了しなければならない。
この研究は、CTS-MAPF計画パラダイムを拡張した階層的なフレームワークであるCTS-PLLを導入し、2つの重要な拡張を行った。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:45:44 GMT)
The Rules-and-Facts Model for Simultaneous Generalization and Memorization in Neural Networks [11.9] 現代のニューラルネットワークの重要な能力は、基礎となるルールを同時に学習し、特定の事実や例外を記憶する能力である。
本稿では,ルール・アンド・ファクト(RAF)モデルについて紹介する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:56:23 GMT)
Diffusion MRI Transformer with a Diffusion Space Rotary Positional Embedding (D-RoPE) [11.7] 我々は拡散空間回転位置埋め込み(DRoPE)を導入し,拡散データの空間構造と方向特性の両方を捉える。
自己教師付きマスク付き自己エンコーディング事前学習の後、いくつかの下流タスクのテストでは、学習された表現と事前訓練されたモデルが、競争力や優れたパフォーマンスを提供できることを示した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 23:39:52 GMT)
ICTPolarReal: A Polarized Reflection and Material Dataset of Real World Objects [11.7] 実世界の物体の大規模偏光反射と物質データセットを8カメラ、346光の光ステージで撮影する。
我々のデータセットは、マルチビュー、マルチイルミネーション、偏光、反射率分離、物質特性収率1.2M以上の5つの取得次元の218の日常オブジェクトにまたがっている。
このデータセットを用いて、内在的分解、リライティング、スパースビュー3D再構成における最先端の逆レンダリングモデルと前方レンダリングモデルを訓練し、評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:01:18 GMT)
Shared Representation for 3D Pose Estimation, Action Classification, and Progress Prediction from Tactile Signals [11.7] 人間のポーズの推定、行動の分類、移動の進行を予測することは、人間とロボットの相互作用に不可欠である。
従来の触覚ベースのアプローチはそれぞれのタスクを別々に処理し、最適以下のパフォーマンスをもたらす。
本稿では,3つの異なる予測タスクを同時に処理するために,共用表現を学習するSCOTTI(Shared Convolutional Transformer for Tactile Inference)を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:55:45 GMT)
CROSS: A Mixture-of-Experts Reinforcement Learning Framework for Generalizable Large-Scale Traffic Signal Control [11.6] 汎用適応型信号制御(ATSC)のための新しいMixture-of-Experts(MoE)ベースの分散RLフレームワークであるCROSSを提案する。
まず、予測コントラストクラスタリング(PCC)モジュールを導入し、短期状態遷移を予測して潜在トラフィックパターンを特定し、続いてクラスタリングとコントラスト学習を行い、パターンレベルの表現を強化する。
さらに、複数の専門家と共有ポリシーを強化するScenario-Adaptive MoEモジュールを設計し、適応的な特殊化とより柔軟なシナリオ固有の戦略を可能にします。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:48:15 GMT)
Incorporating contextual information into KGWAS for interpretable GWAS discovery [11.5] 知識グラフGWAS(KGWAS)フレームワークは、知識グラフ(KG)を介して遺伝子変異を下流の遺伝子-遺伝子相互作用にリンクすることで、この問題に対処する。
ここでは、KGWASにおける汎用KGは、下流タスクの統計的パワーを失うことなく実質的に切断することができ、パーターブ・シークデータから得られた遺伝子関係を組み込むことにより、さらに性能が向上することを示す。
重要なことは、直接摂動-摂動の証拠から疎結合で文脈特異的なKGを用いることで、より一貫性があり生物学的に堅牢な病原性ネットワークが得られることである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:24:27 GMT)
AG-EgoPose: Leveraging Action-Guided Motion and Kinematic Joint Encoding for Egocentric 3D Pose Estimation [11.4] AG-EgoPoseは、短距離と長距離の動作コンテキストときめ細かい空間的手がかりを統合して、ロバストなポーズ推定を行う新しいデュアルストリームフレームワークである。
空間ストリームは、重量共有型ResNet-18エンコーダデコーダを用いて、2次元ジョイントヒートマップを生成する。
時間ストリームはResNet-50バックボーンを使用して視覚的特徴を抽出し、アクション認識バックボーンによって処理され、モーションダイナミクスをキャプチャする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:46:51 GMT)
COIN: Collaborative Interaction-Aware Multi-Agent Reinforcement Learning for Self-Driving Systems [11.3] 我々は,コラボレーティブ(CO-)インタラクションアウェア(-IN)MARLフレームワーク,COINを提案する。
COINは、エージェントの個々の目的(ナビゲーション)とグローバルな目標(コラボレーション)を共同で最適化することを目的としている。
COINは、様々なシステムサイズにわたる安全性と効率の両方において、他の先進的なベースライン手法よりも一貫して優れている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:48:25 GMT)
GazeQwen: Lightweight Gaze-Conditioned LLM Modulation for Streaming Video Understanding [11.1] 現在のマルチモーダル大言語モデル(MLLM)は、視線情報をビデオ理解に効果的に利用できない。
本稿では,オープンソースのMLLMに隠れ状態変調による視認性を持たせるパラメータ効率のよい手法であるGazeQwenを紹介する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:03:49 GMT)
OMIND: Framework for Knowledge Grounded Finetuning and Multi-Turn Dialogue Benchmark for Mental Health LLMs [11.1] 大規模言語モデル(LLM)は、複雑なタスクに対して顕著な能力を示してきたが、医療分野、特にメンタルヘルスへの適応は、特定の課題を提起している。
精神保健におけるLLMの主な課題は、高品質の解釈可能データと知識に基づくトレーニングデータの欠如である。
会話を含む多様な機能のためのLLMエージェントのトレーニングと調整を含むoMindフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:25:30 GMT)
Gastric-X: A Multimodal Multi-Phase Benchmark Dataset for Advancing Vision-Language Models in Gastric Cancer Analysis [10.8] Gastric-Xは、胃がん分析のための大規模なベンチマークであり、1.7Kの症例を提供する。
5つのコアタスクにおいて,最新の視覚言語モデルの有効性を体系的に検討する。
我々は,ガストリクスを,医師の認知的・明白な推論プロセスとマシンインテリジェンスを整合させるためのステップとして捉えている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:12:17 GMT)
ViewSplat: View-Adaptive Dynamic Gaussian Splatting for Feed-Forward Synthesis [10.8] ビュー適応型3次元ガウススプラッティングネットワークであるViewSplatについて述べる。
ViewSplatは高速な推論とリアルタイムレンダリングを維持しつつ,最先端の忠実度を実現していることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:03:44 GMT)
SDD-YOLO: A Small-Target Detection Framework for Ground-to-Air Anti-UAV Surveillance with Edge-Efficient Deployment [10.7] 本稿では,G2A対UAV監視に適した小型ターゲット検出フレームワークであるSDD-YOLOを提案する。
SDD-YOLOは、マイクロターゲットにとって重要な微細な空間的詳細を捉えるため、P2高解像度検出ヘッドを4倍のダウンサンプリングで動作させる。
SDD-YOLO-nはDroneSOD-30Kで86.4%のmAP@0.5を達成し、YOLOv5nベースラインを7.8ポイント上回った。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:17:39 GMT)
Self-Organizing Multi-Agent Systems for Continuous Software Development [10.7] TheBotCompanyは、継続的マルチエージェントソフトウェア開発のためのオープンソースのオーケストレーションフレームワークである。
TheBotCompanyは、(1)マイルストーン駆動開発のための3段階のステートマシン(実行から検証までの戦略)、(2)マネージャエージェントがプロジェクトニーズに基づいて動的に雇用、割り当て、消防を行う自己組織化エージェントチーム、(3)非同期ヒューマン監視の3つの重要なイノベーションを紹介している。
TheBotCompanyは、チームの適応パターン、マイルストーン完了率、コスト効率、コード品質を計測し、数日間の継続的開発で現実世界のソフトウェアプロジェクトで評価します。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:43:13 GMT)
Cross-Model Disagreement as a Label-Free Correctness Signal [10.7] クロスモデル不一致は、既存の生産システムにドロップできる正確性指標である。
検証モデルからの生成は不要であり、正当性ラベルは不要である。
その結果、ラベルなしの正当性推定に対する実践的で訓練のないアプローチとして、クロスモデル不一致が確立された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:46:22 GMT)
Characterizing Linear Alignment Across Language Models [10.7] 言語モデルは、トレーニングの目的、アーキテクチャ、データモダリティの違いにもかかわらず、同様の表現を学ぶ傾向にある。
この機能は,セキュリティやプライバシ,競争上の制約によって直接的なデータやモデル共有が禁止されるような,新たな潜在的なアプリケーションドメインを解放するものだ。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:17:05 GMT)
A Catalog of Basque Dialectal Resources: Online Collections and Standard-to-Dialectal Adaptations [10.6] 本稿では,現代バスク語の方言データと資源のカタログについて述べる。
もともとは方言で書かれていたオンラインデータと、標準から標準への適応データである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:55:23 GMT)
CRAFT: Grounded Multi-Agent Coordination Under Partial Information [10.5] CRAFTは、大規模言語モデルにおける実用的コミュニケーションを評価するためのベンチマークである。
我々はこの問題を多面的現実的推論タスクとして定式化する。
より強力な推論能力は、確実により良いコーディネーションに変換されないことが分かっています。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:06:39 GMT)
BFMD: A Full-Match Badminton Dense Dataset for Dense Shot Captioning [10.5] 最初のBadminton Full Match Denseデータセットを導入し、19のブロードキャストマッチで20時間以上のプレイをカバーし、それぞれにショットキャプションを付加した。
このデータセットは、マッチセグメント、集会イベント、ショットタイプ、シャトル軌跡、プレーヤーのキーポイントのポーズ、ショットキャプションなど、密集した集会レベルのマルチモーダルアノテーションを含む階層的なアノテーションを提供する。
我々は,セマンティックフィードバック機構を備えたビデオMAEベースのマルチモーダルキャプションフレームワークを開発し,ショットセマンティクスを利用してキャプション生成をガイドし,セマンティクスの一貫性を向上させる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:09:12 GMT)
The Anatomy of Uncertainty in LLMs [10.5] 我々は、不確実性を3つの異なる意味的構成要素に分解する不確実性分解フレームワークを提唱する。
我々のフレームワークは、LSMの信頼性を監査し、幻覚を検知し、目標とする介入やより信頼できるシステムへの道を開くためのより良い理解を提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:59:40 GMT)
Steering Code LLMs with Activation Directions for Language and Library Control [10.5] コードLLMは、中立的なプロンプトの下で特定のプログラミング言語やライブラリにデフォルトとなることが多い。
本研究では,これらの嗜好が,推定時間で操作できる活性化空間において,ほぼ線形な方向として符号化されているかどうかを検討する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:57:47 GMT)
Fus3D: Decoding Consolidated 3D Geometry from Feed-forward Geometry Transformer Latents [10.4] 本稿では,3秒未満で非構造化画像コレクションからの高密度符号距離場(SDF)回帰のフィードフォワード法を提案する。
我々の重要な洞察は、事前訓練された多視点フィードフォワード幾何変換器の中間的特徴空間が、既に強力なジョイントワールド表現を符号化していることである。
代わりに、学習された体積抽出を通して幾何学変換器の特徴から直接3次元抽出を行う。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:45:04 GMT)
Position: Spectral GNNs Are Neither Spectral Nor Superior for Node Classification [10.4] ノード分類のためのスペクトルグラフニューラルネットワーク(スペクトルGNN)は、グラフ上の周波数領域フィルタリングを約束する。
最近の研究は、グラフラプラシア固有ベクトルが一般に真のフーリエ基底の重要な性質を持たないことを示している。
本稿では、ノード分類において、スペクトルGNNはグラフスペクトルを有意に捉えたり、性能を確実に向上させたりしない。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:25:26 GMT)
Theory of (Co)homological Invariants on Quantum LDPC Codes [10.4] 量子コード複体の(共)ホモロジカル不変量について検討し、それらの論理的操作を根本的に過小評価する。
我々は、HGP符号からシーフ符号設定への正準論理的表現の概念を一般化する。
本報告では, カップ製品の包括的計算を, せん断符号の複雑な枠組み内で行った。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:50:36 GMT)
Explaining, Verifying, and Aligning Semantic Hierarchies in Vision-Language Model Embeddings [10.3] 本稿では,VLMによって誘発されるセマンティック階層を,特定の子クラスに対して説明し,検証し,調整するためのポストホックフレームワークを提案する。
我々は,効率的な木認識とエッジレベルの整合性尺度を用いて,抽出した木と人間の検索を比較して妥当性を定量化し,説明可能な階層木トラバース推定による有用性を評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:38:38 GMT)
Beyond Via: Analysis and Estimation of the Impact of Large Language Models in Academic Papers [10.3] 大規模言語モデル(LLM)によって駆動される可能性のある単語使用量の変化について報告する。
実験により、現在の分類器は、複数のクラス分類タスクにおいて、与えられたテキストを生成する特定のモデルを正確に決定するのに苦労していることが示された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:49:00 GMT)
FEAST: Fully Connected Expressive Attention for Spatial Transcriptomics [10.0] FEAST(Fully connected Expressive Attention for Space Transcriptomics)は、組織を完全な連結グラフとしてモデル化する注意ベースのフレームワークである。
FEASTは生物学的に妥当な注意マップを提供しながら、遺伝子発現予測における最先端の手法を超越していることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:51:06 GMT)
Engineering energy-time entanglement from resonance fluorescence [10.0] 受動線形干渉法のみを用いてエネルギー時間絡み込みに設計できることが示される。
単一量子ドットから共鳴蛍光を非対称のマッハ-ツェンダー干渉計に注入し、単一光子成分の破壊干渉付近で動作させることにより、出力場を生成する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:30:54 GMT)
LiteGuard: Efficient Task-Agnostic Model Fingerprinting with Enhanced Generalization [10.0] 計算コストを大幅に削減しつつ,一般化を向上する,効率的なタスク非依存型フィンガープリントフレームワークである LiteGuard を提案する。
i) 各海賊と独立に訓練されたモデルのトレーニング中にキャプチャされた中間モデルスナップショットを活用することによって、モデルの多様性を強化するチェックポイントベースのモデルセット拡張戦略と、(ii)各指紋と軽量なローカル検証器をペアリングするローカル検証アーキテクチャである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:14:26 GMT)
IrisFP: Adversarial-Example-based Model Fingerprinting with Enhanced Uniqueness and Robustness [10.0] IrisFPは、新しい逆例ベースのモデルフィンガープリントフレームワークである。
すべての決定境界の交差点付近に指紋を配置する。
複合サンプル指紋を合成し、複数のサンプルを多境界交差点に近接して構成する。
統計的分離性指標を用いて、生成された指紋の識別力を評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:39:29 GMT)
Lightweight GenAI for Network Traffic Synthesis: Fidelity, Augmentation, and Classification [10.0] 本稿では,軽量な生成人工知能(GenAI)アーキテクチャを用いたネットワークトラフィック生成(NTG)タスクについて述べる。
実験により、GenAIモデルは、実際の分布によく一致するトランスフォーマーモデルと状態空間モデルにより、静的トラフィック特性と時間トラフィック特性の両方を保存していることが示された。
低データ設定では、GenAI駆動の強化はNTCのパフォーマンスを最大40%向上させ、フルデータトレーニングとのギャップを大幅に減らす。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:45:04 GMT)
Modernising Reinforcement Learning-Based Navigation for Embodied Semantic Scene Graph Generation [10.0] 本研究は,Embodied Semantic Scene Graph Generationのためのモジュールナビゲーションコンポーネントを提案する。
我々は、コンパクトできめ細かな、より大きな離散運動集合を研究し、原子の作用に対する単一ヘッドポリシーと、作用成分に対する因子化された多重ヘッドポリシーを比較した。
その結果,最適化アルゴリズムの置き換えだけでSSGの完全性は,同じ報酬形成条件下でのベースラインに対して21%向上することがわかった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:10:08 GMT)
Provably Efficient Long-Time Exponential Decompositions of Non-Markovian Gaussian Baths [9.9] 複雑な指数関数の和によって、時間間隔$[0,T]$でバス相関関数を表現する複雑さを厳密に拘束する。
スペクトル密度の広いクラスでは、指数関数の必要個数は$T$とは独立に制限され、時間的一様複雑性が達成される。
この結果は,非マルコフ的開量子系の長期シミュレーションや,古典的一般化ランゲヴィン方程式のメモリカーネルへのマルコフ的埋め込みにも応用できる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:51:22 GMT)
RHINO-AR: An Augmented Reality Exhibit for Teaching Mobile Robotics Concepts in Museums [9.7] RHINO-ARは、歴史ある移動ロボットRHINOをドイツ博物館の展示環境に再導入する。
RHINO-VRは、ロボットと環境をバーチャルリアリティーで再構築したものだ。
RHINO-ARを22名を対象に2日間のミュージアムスタディで評価し,ユーザビリティ,技術的パフォーマンス,満足度,概念的理解,RHINO-VRとの比較を行った。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:08:49 GMT)
FSGNet: A Frequency-Aware and Semantic Guidance Network for Infrared Small Target Detection [9.7] IRSTDは、複雑な背景から小さなターゲットを識別し、識別することを目的としている。
U-Netは、深い層から浅い層へ高レベルの機能を転送する際のセマンティックな劣化に悩まされている。
本稿では,周波数認識と意味誘導を組み込んだ軽量かつ効果的な検出フレームワークFSGNetを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:38:29 GMT)
Self-Improvement of Large Language Models: A Technical Overview and Future Outlook [9.6] 自己改善言語モデルに対するシステムレベルの視点を示す。
既存の手法を整理する統合フレームワークを導入する。
現状の限界について論じ、今後の研究の展望を概説する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:32:37 GMT)
VOLMO: Versatile and Open Large Models for Ophthalmology [9.6] 眼科医は、臨床画像、構造化された臨床データ、および疾患の重症度と管理を判定するためのフリーテキストノートを統合する必要がある。
近年のマルチモーダル大言語モデル (MLLM) は, 将来性を示すが, 既存の一般医療MLLMは眼科では不十分である。
本稿では,眼科固有のMLLMを開発するためのモデルに依存しない,データオープンなフレームワークであるVOLMOを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:40:14 GMT)
Exceptional-point-constrained locking of boundary-sensitive topological transitions in non-Hermitian lattices [9.5] パラメータスイープが例外点(EP)制約多様体に制限されたときに境界感応的な位相遷移がロックされることを示す。
拡張された非エルミート的Su-シュリーファー-ヘーガー鎖では、このロックはトラクタブル極限で解析的に確立することができる。
同じ機構が、分枝分解された一般化ブリルアンゾーンを持つ4バンドのスピンフル拡張で生き残ることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:48:12 GMT)
Adversarial-Robust Multivariate Time-Series Anomaly Detection via Joint Information Retention [9.5] 時系列異常検出(TSAD)は複雑なシステムを監視する上で重要な要素である。
現代のディープラーニングに基づく検出器は、しばしば局所的な入力の破損や構造的なノイズに敏感である。
本稿では, 原理的 min-max 最適化目標を用いて, 検出ロバスト性を向上する共同トレーニングフレームワーク ARTA を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:53:03 GMT)
SLARM: Streaming and Language-Aligned Reconstruction Model for Dynamic Scenes [9.4] SLARMは動的シーン再構成、セマンティック理解、リアルタイムストリーミング推論を統合するフィードフォワードモデルである。
高次モーションモデリングによって複雑な、一様でない動きをキャプチャし、フローの監督なしに、微分可能なレンダリングのみを訓練する。
SLARMは、ウィンドウベースの因果注意を用いて画像シーケンスを処理し、メモリコストを蓄積することなく、安定した低レイテンシのストリーミング推論を実現する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:38:55 GMT)
Weighted Nested Commutators for Scalable Counterdiabatic State Preparation [9.3] 非局所的断熱ゲージポテンシャルを近似するためにネスト共振器アンサッツを導入する。
WNCアンサッツに基づくCD駆動は,システムサイズが最大1000$ qubitsまでの1D MPSの作成を著しく加速することを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:40:11 GMT)
Fair regression under localized demographic parity constraints [9.1] F f |S=s (z m ) = $ell$m という形の CDF 制約をグループ的に課する,新規な (ell$, Z)-fair predictor を導入する。
合成データセットと実データセットの実験では、解釈可能なフェアネス精度のトレードオフが示され、決定関連量子またはしきい値に対するターゲット修正が可能である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:21:05 GMT)
Agent Factories for High Level Synthesis: How Far Can General-Purpose Coding Agents Go in Hardware Optimization? [8.9] 本稿では,汎用符号化エージェントが高レベルのアルゴリズム仕様からハードウェア設計をいかに最適化できるかを実証研究する。
複数の自律的最適化エージェントの構築と調整を行う2段階パイプラインであるエージェントファクトリを導入する。
AMD Vitis HLS を用いた Claude Code (Opus4.5/4.6) を用いた HLS-Eval と Rodinia-HLS の 12 個のカーネルに対するアプローチの評価を行った。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:57:50 GMT)
Accurate Surface and Reflectance Modelling from 3D Radar Data with Neural Radiance Fields [8.8] レーダポイント雲からの3次元マッピングのためのニューラル暗黙的アプローチを提案する。
従来のライダーを用いた再構成法と比較して, よりスムーズで高精度な3次元表面再構成法が得られた。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:37:08 GMT)
Is Mathematical Problem-Solving Expertise in Large Language Models Associated with Assessment Performance? [8.8] より強力な数学問題解決能力が、より強力なステップレベルの評価性能に結びついているかどうかは不明だ。
本研究では,GSM8KとProcessBENCHのMATHサブセットとの関係について検討した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:43:54 GMT)
ExVerus: Verus Proof Repair via Counterexample Reasoning [8.8] 大規模言語モデル(LLM)のための逆例誘導フレームワークであるEXVERUSを提案する。
証明が失敗すると、EXVERUSは反例を自動生成して検証し、LSMを誘導して誘導不変量に一般化し、これらの障害を阻止する。
評価の結果,EXVERUSは最先端のプロンプトベースのVerus証明生成器よりも証明精度,堅牢性,トークン効率を著しく向上することがわかった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:14:34 GMT)
Seeing Through Smoke: Surgical Desmoking for Improved Visual Perception [8.8] 侵襲的かつロボット支援的な手術は、内視鏡画像に大きく依存する。
本研究では,無煙画像と対応する喫煙マップを共同で予測する物理刺激型消煙頭を用いたトランスフォーマーを用いた手術用消煙モデルを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:49:49 GMT)
S4CMDR: a metadata repository for electronic health records [8.6] ISO 11179-3上に構築されたオープンソースメタデータリポジトリであるS4CMDRを開発した。
エラーを減らし、互換性のある機能セットの発見を可能にする。
S4CMDRはオンプレミスのLinuxデプロイメントとクラウドホスティングをサポートし、最先端のユーザ認証とアクセス可能なインターフェースを備えている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:52:18 GMT)
Bayesian Learning-Enhanced Navigation with Deep Smoothing for Inertial-Aided Navigation [8.5] BLENDSはデータ駆動のポストプロセッシングフレームワークで、トランスフォーマーベースのニューラルネットワークによって従来の2フィルタスムーズな拡張を行う。
BLENDSは、ベースライン前方EKFよりも最大63%の水平位置改善を実現している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:11:59 GMT)
Neural Operator Quantum State: A Foundation Model for Quantum Dynamics [8.4] 本稿では,量子力学の基礎モデルとしてニューラル演算子量子状態(NOQS)を紹介する。
我々のアプローチは、全駆動プロトコルを時間発展量子状態にマッピングするソリューション演算子を育成することを目的としている。
時間依存縦・横フィールドを持つ2次元Isingモデル上でNOQSを検証する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:10:14 GMT)
Design Once, Deploy at Scale: Template-Driven ML Development for Large Model Ecosystems [8.3] 本稿では、標準化されたモデル構築手法とレコメンデーションシステムにおける独立したモデルごとの最適化におけるモデル性能、効率、ML技術伝播の比較検討を行う。
標準化された構成可能なMLモデルコンポーネントを利用することで、技術伝播の複雑さを$O(n cdot 2k)$から$O(n + k)$に減らします。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:58:26 GMT)
A CDF-First Framework for Free-Form Density Estimation [8.2] 中心となる課題は自由形式の密度推定であり、制約的仮定なしに多モード性、非対称性、あるいは位相的複雑性を示す分布を捉えることである。
本稿では,CDF を安定かつ適切に設定した目標である累積分布関数 (CDF) を推定し,学習した円滑なCDF の微分を通じて確率密度関数 (PDF) を復元することにより,この問題を回避するCDF ファーストフレームワークを提案する。
提案フレームワークは,構成による有効なPDFの保証,抽出可能な近似近似トレーニング,複雑な分布形状の保存を実現する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:09:00 GMT)
SIGMA: Structure-Invariant Generative Molecular Alignment for Chemical Language Models via Autoregressive Contrastive Learning [8.1] 構造不変な生成分子アライメント(SIGMA)を提案する。
線形表現を変更するのではなく、SIGMAはモデルが幾何対称性を厳密に認識することを可能にする。
標準ベンチマークにおける実証的な評価は、SIGMAがシーケンスのスケーラビリティとグラフの忠実さのギャップを埋めることを示している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:55:17 GMT)
Collision-Aware Vision-Language Learning for End-to-End Driving with Multimodal Infraction Datasets [7.9] 高屈折率は、エンド・ツー・エンド(E2E)自動運転の主要なボトルネックである。
VLAAD(Video-Language-Augmented Anomaly Detector)を開発した。
VLAADは衝突対応のプラグインモジュールで、既存のE2E駆動モデルにシームレスに統合できる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:32:52 GMT)
Shopping with a Platform AI Assistant: Who Adopts, When in the Journey, and What For [7.8] 本稿では、Eコマースにおいて、消費者がプラットフォーム組み込みショッピングAIをどのように採用し、利用するかについての大規模な記述的証拠をいくつか提示する。
中国最大のオンライン旅行プラットフォームであるCtripの3300万人のユーザに関するデータを用いて、プラットフォームに組み込まれたAIアシスタントであるWendaoを調査した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:32:02 GMT)
SafeMath: Inference-time Safety improves Math Accuracy [7.8] 数学の質問、特に自然言語の物語としてフレーム化された質問は、偏見、非倫理的、心理的に有害なコンテンツを伝播するための微妙な媒体として機能することを示す。
安全なアライメント技術であるSafeMathを提案し、メンテナンス中に有害な出力を削減し、場合によっては数学的推論性能を改善する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:06:46 GMT)
A Unified Memory Perspective for Probabilistic Trustworthy AI [7.6] 信頼できる人工知能は、堅牢性、解釈可能性、セキュリティ、プライバシーを達成するために確率計算にますます依存している。
実際のシステムでは、そのようなワークロードは決定論的データアクセスを、モデル、データパス、システム機能間で繰り返しサンプリングすることでインターリーブする。
本稿では,データ・アクセス・パースペクティブを統一し,決定論的アクセスをサンプリングの制限事例として扱い,両方のモードを共通のフレームワーク内で解析できるようにする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:40:55 GMT)
Resolving the Robustness-Precision Trade-off in Financial RAG through Hybrid Document-Routed Retrieval [7.6] Hybrid Document-Routed Retrieval (HDRR)は、SFRを文書フィルタとして使用する2段階アーキテクチャである。
実験の結果,HDRRは各測定値において最高の性能を示した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:05:38 GMT)
Are LLMs Overkill for Databases?: A Study on the Finiteness of SQL [7.5] 自然言語質問の翻訳は実用的複雑性において有限であることを示す。
データベーステーブル数の増加と複雑性の増加との間には明確なモノトニックな関係は存在しない。
これは、コード生成のためのLCMは、データベースアクセスの領域では有用であるが、狭い、非常に公式な空間で運用されていることを示唆している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:40:36 GMT)
AuthorityBench: Benchmarking LLM Authority Perception for Reliable Retrieval-Augmented Generation [7.4] Retrieval-Augmented Generation (RAG)は、外部知識でLarge Language Models (LLMs)を強化するが、偽情報を伝達できる低権威ソースには弱い。
我々はLLMが情報権威(意味理解を超えた能力)を知覚できるかどうかを考察する。
LLMの権威知覚を評価するためのベンチマークである AuthorityBench を紹介する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:58:22 GMT)
Enabling ab initio geometry optimization of strongly correlated systems with transferable deep quantum Monte Carlo [7.3] 化学過程の忠実な説明には、分子ポテンシャルエネルギー表面(PES)の拡張領域を探索する必要がある
本稿では,移動可能な深層学習VMCとコスト効率の高いエネルギー,力,ヘッセンの推定を組み合わせたPSSを高精度に探索する枠組みを提案する。
これは、多重参照特性を持つ系における結合破壊、形成、および大きな構造的再構成を研究するための扉を開く。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:31:30 GMT)
GroupRAG: Cognitively Inspired Group-Aware Retrieval and Reasoning via Knowledge-Driven Problem Structuring [7.3] GroupRAGは、知識駆動型キーポイントグループに基づく、認知にインスパイアされたグループ認識検索および推論フレームワークである。
GroupRAGは問題内の潜在構造群を特定し、複数の概念的出発点からの検索と推論を行う。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:48:40 GMT)
EngineAD: A Real-World Vehicle Engine Anomaly Detection Dataset [7.2] EngineADは、6ヶ月間に25台の商用車両から収集された高解像度センサーテレメトリを含む新しいデータセットである。
データを$300の時間ステップのプリンシパルコンポーネントにプリプロセスし、9つの異なる1クラスの異常検出モデルを用いて初期ベンチマークを作成する。
本実験は,車種間の性能変動を顕著に明らかにし,車種間一般化の課題を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:47:45 GMT)
DAGverse: Building Document-Grounded Semantic DAGs from Scientific Papers [7.2] DAGverseは,オンライン科学論文から文書ベースセマンティックDAGを構築するためのフレームワークである。
我々のコアコンポーネントであるDAGverse-Pipelineは、高精度セマンティックDAGの例を生成するために設計された半自動システムである。
ケーススタディとして、グラフレベル、ノードレベル、エッジレベルのエビデンスを持つ108のエキスパート検証済みセマンティックDAGのデータセットであるDAGverse-1をリリースする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:33:12 GMT)
Adapting Segment Anything Model 3 for Concept-Driven Lesion Segmentation in Medical Images: An Experimental Study [6.9] 病変の分節に対するSegment Anything Model 3 (SAM3) の体系的評価を行った。
11種類の病変を含む13のデータセットの実験では、SAM3が強い相互モダリティの一般化を実現することが示されている。
これらの結果は,スケーラブルで実用的な医用画像セグメンテーションのための概念ベース基盤モデルの可能性を強調した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:30:10 GMT)
A counterexample to the strong spin alignment conjecture [6.8] スピンアライメント予想は、最も小さな未解決の場合、すなわち3つのキュービットで明示的な反例を構築することで、一般には偽であることを示す。
この例では、単一の3ビット大域状態と共同で互換性のない2体状態を用いており、これは自然に予想の互換性に制約のある変種につながる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:08:12 GMT)
Learning to Rank Caption Chains for Video-Text Alignment [6.8] 直接選好最適化(DPO)は、好ましくない応答を生成するために言語モデルを訓練する効果的な手法である。
特に、代替品よりも好ましくないとしても、応答は依然として視覚的な入力に忠実であるかもしれない。
本研究では,視覚入力に対する応答の忠実度をより正確に評価する代替手段として,ランキング最適化について検討する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:04:57 GMT)
Subject-Specific Low-Field MRI Synthesis via a Neural Operator [6.7] 低磁場(LF)MRIは、アクセシビリティを改善し、コストを削減するが、高磁場(HF)MRIと比較して信号対雑音比が低く、コントラストが劣化している。
既存の低磁場シミュレータはノイズ注入と平滑化に依存しており、LF取得で見られるコントラスト劣化を捉えることができない。
少数のHF-LFMRIからHFからLFへの分解を直接学習するエンドツーエンドのLF-MRIフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:01:03 GMT)
GhostServe: A Lightweight Checkpointing System in the Shadow for Fault-Tolerant LLM Serving [6.7] 本稿では,GhostServeを提案する。GhostServeは,フォールトトレラントな大規模言語モデル(LLM)を実現するための新しいチェックポイントソリューションである。
GhostServeは、消去符号化を適用してホストメモリにパリティシャードを生成し保存することで、シャドー内のストリーミングKVキャッシュを保護する。
デバイス障害が発生した場合、GhostServeは失われたKVキャッシュの迅速な再構築を可能にし、推論プロセスがシームレスに再開できる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:27:57 GMT)
Temporally Decoupled Diffusion Planning for Autonomous Driving [6.7] 動的都市環境における運動計画には、短期的目標と即時安全のバランスが必要である。
本稿では、ノイズ・アズ・マスクのパラダイムを用いて軌道生成を再構成する時間分解拡散モデル(TDDM)を提案する。
トラジェクトリを独立したノイズレベルを持つセグメントに分割することにより、高雑音を情報空白として、弱い雑音を文脈的手がかりとして暗黙的に扱う。
これにより、より保存状態の良い時間的文脈と内部相関を利用して、破損した短期状態にモデルを補うことができる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:04:15 GMT)
No Hard Negatives Required: Concept Centric Learning Leads to Compositionality without Degrading Zero-shot Capabilities of Contrastive Models [6.5] V&Lの合成性能を制限する2つの根本原因を同定する。
長いトレーニングキャプションは、構成表現を必要としない。
テキストと画像エンコーダにおける最後のグローバルプールは、必要な情報の完全なロスにつながる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:58:04 GMT)
A Task Decomposition Framework for Aircraft Health Diagnosis: Balancing Safety and Efficiency via Heterogeneous Long-Micro Scale Cascading [6.5] 本稿では,異種タスク分解の工学的応用を展開可能なインテリジェント断層診断に適用する。
提案したLong-Micro Scale Diagnostician (LMSD) は、ミクロスケールの断層分類からグローバルな異常検出(全シーケンスの注意)を明示的に分離する。
知識蒸留に基づく解釈可能性モジュールは、安全クリティカルな検証のための物理的にトレース可能な説明を提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:53:32 GMT)
UCAgent: An End-to-End Agent for Block-Level Functional Verification [6.5] 制約ランダムや形式的検証を含む従来の手法は、現代の半導体設計の複雑さの増大に追随する。
大規模言語モデル(Ms)の最近の進歩は、コード生成とタスク自動化の約束を示している。
本稿では,コア機構上のハードウェアブロックレベルの機能検証を自動化するエンドエージェントであるUPAgentを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:21:27 GMT)
Conformal Prediction for Nonparametric Instrumental Regression [6.4] 非パラメトリックなインスツルメンタル変数回帰における分布自由な予測区間を構築する手法を提案する。
条件付きカバレッジを,IVシフトのクラスに対する限界カバレッジとして再構成する。
我々の理論解析は,IVシフトの実践的コセンクラスに対して,分布のない有限サンプルカバレッジを確立する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:45:30 GMT)
Empowering Epidemic Response: The Role of Reinforcement Learning in Infectious Disease Control [6.4] 強化学習(Reinforcement Learning, RL)は、近年の感染症の感染拡大や流行に対処するための介入戦略を最適化するために、感染症のコントロールに用いられている。
公衆衛生の非医薬的・医薬的介入の戦略を最適化するためのRLアプローチの開発と適用について、この話題を専門に論じる調査はほとんどない。
本稿では, 感染症の感染拡大と流行の制御にRLアプローチが用いられている経緯について, 最新の文献の簡潔なレビューと議論を行う。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:34:38 GMT)
Quantum Circuit Repair by Gate Prioritisation [6.4] 本稿では,量子回路の自動修復手法QRepを提案する。
QRepは、回路全体にパッチを均一に適用し、各ゲートに不審点を割り当てる。
そして、最も疑わしいゲートを優先することで、探索空間を狭める。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:04:41 GMT)
Combinatorial Privacy: Private Multi-Party Bitstream Grand Sum by Hiding in Birkhoff Polytopes [6.2] PolyVeilは、Birkhoff polytopeでプライベートビットを置換行列としてエンコードする、$k$クライアント間の総和プロトコルである。
P-hardnessは完全な行列ビューを必要とするが、非空のDPはスカラービューを必要とする。
プロトコルはPKIを必要とせず、$O(k)$通信を持ち、正確な集約を出力する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:57:58 GMT)
Connectivity-Aware Representations for Constrained Motion Planning via Multi-Scale Contrastive Learning [6.0] 制約された動き計画の目的は、タスク固有の制約を満たしながら開始とゴールの設定を接続することである。
本稿では,これらの課題に対して,計画前に開始と目標の設定を選択するための接続性を考慮した表現を学習することによって解決する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:44:21 GMT)
Stochastic Multipath Routing for High-Throughput Entanglement Distribution in Quantum Repeater Networks [6.0] 量子リピータネットワークは損失のあるリンク上の絡み合いを分散し、多くのユーザは絡み合ったペアの限られたプールを共有している。
既存のルーティング方式の多くは、常に単一のベストパスを使用するか、あるいはリアルタイムに実行が難しいグローバル最適化に依存している。
本稿では,複数のエッジ不連続経路の1つに沿って,各絡み合い要求をランダムに送信するマルチパスルールを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:36:08 GMT)
Longitudinal Digital Phenotyping for Early Cognitive-Motor Screening [6.0] 18歳から8歳までの子どもの発達軌跡をモデル化するためのAI駆動型縦断フレームワークを提案する。
複数の学年で収集されたタブレットによるインタラクションのデータセットを用いて,6つの認知運動課題を分析した。
分析の結果,低,中,高の3つのプロファイルが明らかになった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:27:49 GMT)
Toward a Multi-Layer ML-Based Security Framework for Industrial IoT [6.0] 我々は、IIoT環境のための軽量機械学習(ML)ベースのセキュリティフレームワークの開発を目的とした、博士論文の研究フレームワークとコントリビューションを紹介する。
まず、Tm-IIoT信頼モデルとHybrid IIoTアーキテクチャを基本ベースラインとして採用した上で、Trust Convergence Acceleration(TCA)アプローチを紹介します。
次に,セキュリティフレームワークの実装と拡張を目的とした,安価なオープンソースハードウェアに基づく実世界のデプロイメントアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:38:52 GMT)
SlotVTG: Object-Centric Adapter for Generalizable Video Temporal Grounding [5.9] SlotVTGは、MLLMを最小限のコストで、オブジェクト中心の、入力基底の視覚的推論に向けるフレームワークである。
我々のアプローチは、最小限のオーバーヘッドで競合するIn-Domain(ID)性能を維持しながら、OODロバスト性を大幅に改善します。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:59:31 GMT)
Hyperspectral Trajectory Image for Multi-Month Trajectory Anomaly Detection [5.8] 軌道異常検出は不正検出から都市移動分析への応用の基盤となる。
厳密なGPS法は微細な証拠を保存しているが、その二次的なコストは多ヶ月にわたる分析を困難にしている。
視問題として軌跡異常検出を再構成するTITAnD(Trajectory Image Transformer for Anomaly Detection)を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:59:17 GMT)
UMBRELLA: Uncertainty-aware Multi-robot Reactive Coordination under Dynamic Temporal Logic Tasks [5.8] 本稿では,動的および移動目標を含む協調作業のためのマルチロボットシステムのコーディネート問題に対処する。
コンフォーマル予測(CP)による目標運動予測の不確かさを明示的にモデル化する。
提案するフレームワーク (UMBRELLA) は,MCTS (Monte Carlo Tree Search) を部分計画と不確実性を考慮したロールアウトに組み合わせたものだ。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:40:04 GMT)
Optimizing Entanglement Distribution Protocols: Maximizing Classical Information in Quantum Networks [5.6] 大規模量子ネットワークを実現する上で,効率的な絡み合い分布は基礎的な課題である。
本稿では,4つの重要な展開を導入することで,絡み合い分布問題に対処する。
まず、量子通信の第一の応用がプライベート情報の伝達であることを認識し、エンサンブル容量(EC)を導出する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:08:13 GMT)
Does Explanation Correctness Matter? Linking Computational XAI Evaluation to Human Understanding [5.6] 高い正確性はより良い人間の理解をもたらすと仮定されるが、このリンクは制御されたレベルで実験的にテストされていない。
機能的正しさのすべての相違が、人間の理解の相違に結びつくわけではないことを示し、機能的指標を人的結果に対して検証する必要があることを強調する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:55:10 GMT)
Uncertainty-Guided Label Rebalancing for CPS Safety Monitoring [5.6] U-Balanceは、行動の不確実性を利用して、安全予測器をトレーニングする前に不均衡なデータセットを再バランスする教師付きアプローチである。
U-Balanceを46:1の安全/安全比を持つ大規模UAVベンチマークで評価した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:26:02 GMT)
GDPO-Listener: Expressive Interactive Head Generation via Auto-Regressive Flow Matching and Group reward-Decoupled Policy Optimization [5.6] GDPO-Listenerは高度に表現力のある発話・聴取動作生成を実現する新しいフレームワークである。
本稿では,安定した教師付き学習を可能にする自動回帰フローマッチングアーキテクチャを提案する。
異なるFLAMEパラメータ群間で報酬正規化を分離することにより、GDPOは高分散表現世代を明示的にインセンティブ化する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:36:27 GMT)
Can Vision Foundation Models Navigate? Zero-Shot Real-World Evaluation and Lessons Learned [5.6] ビジュアルナビゲーションモデル(VNM)は、大規模な視覚的なデモンストレーションから学ぶことで、一般化可能なロボットナビゲーションを約束する。
室内と屋外にまたがる2つのロボットプラットフォームと5つの環境にまたがる5つの最先端VNMの現実的評価について述べる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:04:49 GMT)
Ultra-fast Traffic Nowcasting and Control via Differentiable Agent-based Simulation [5.4] 本稿では,超高速なモデルキャリブレーション,トラフィックの流し込み,大規模ネットワークの制御が可能なエージェントベース交通シミュレータを提案する。
シカゴの大規模道路網では、キャリブレーションパラメータが1万以上あり、われわれのモデルは173倍の速度で100万台以上の車両をシミュレートしている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:13:01 GMT)
The Symmetric Perceptron: a Teacher-Student Scenario [5.3] 我々は、U字型ポテンシャルまたは長方形ポテンシャルを伝統的に考慮する対称パーセプトロンを、両領域にラベルを含めることで適用する。
この構造は, ポテンシャルの選択, 準最適溶液のメタスタビリティの相互作用と, 植え付け構成への融解の相互作用にどのように依存するかを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:37:22 GMT)
Anchored-Branched Steady-state WInd Flow Transformer (AB-SWIFT): a metamodel for 3D atmospheric flow in urban environments [5.3] 本研究では, 内部分岐構造を持つ変圧器モデルである Anchored Branched Steady-state WInd Flow Transformer (AB-SWIFT) を紹介する。
我々のモデルは、最先端のトランスフォーマーやグラフベースのモデルと比較して、予測されたすべてのフィールドで最高の精度に達する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:46:54 GMT)
System-Anchored Knee Estimation for Low-Cost Context Window Selection in PDE Forecasting [5.2] 自己回帰型ニューラルPDEシミュレータは、有限履歴から一度に物理場の進化を予測する。
時系列予測におけるコンテキストウィンドウ選択への既存のアプローチには、徹底的な検証、直接的低コスト検索、システム理論記憶推定などがある。
固定ウィンドウ自己回帰型ニューラルPDEシミュレータのコンテキストウィンドウ選択を,独立した低コストアルゴリズム問題として定式化する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:42:54 GMT)
AI Generalisation Gap In Comorbid Sleep Disorder Staging [5.1] iSLEEPS (iSLEEPS) を新たに導入した。
単一チャネル脳波睡眠ステージリングのためのSE-ResNet+双方向LSTMモデルの評価を行った。
健常者と疾患者のクロスドメインパフォーマンスは貧弱である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:13:16 GMT)
TacSIm: A Dataset and Benchmark for Football Tactical Style Imitation [5.1] Tac SImはTactical Style Imitationの大規模なデータセットとベンチマークである。
Tac SImはプレ・ミアリーグの試合の放送映像で、チーム内の11人の選手全員のアシチオンを模倣している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:06:13 GMT)
Intelligent Navigation and Obstacle-Aware Fabrication for Mobile Additive Manufacturing Systems [5.1] 本研究は,ナビゲーションと材料堆積を併用したユニバーサルなモバイル印刷・配送プラットフォームを提案する。
ロボットのナビゲーションを計画し、制御し、安全な動き、障害物回避、経路安定性を確保するためのリアルタイム制御フレームワークが開発された。
このフレームワークは、軌道の変動や外乱への適応性をテストするシミュレーションや実世界の実験を通じて検証されている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:38:09 GMT)
UniAI-GraphRAG: Synergizing Ontology-Guided Extraction, Multi-Dimensional Clustering, and Dual-Channel Fusion for Robust Multi-Hop Reasoning [5.1] 本稿では,オープンソースのGraphRAG上に構築された拡張フレームワークであるUniAI-GraphRAGを提案する。
本フレームワークは,(1)ドメイン固有のエンティティや関係を正確に識別する上で,事前定義されたLCMをガイドするオントロジーガイド付き知識抽出,(2)アライメント完了,属性ベースのクラスタリング,マルチホップ関係クラスタリングによるコミュニティ完全性を改善する多次元コミュニティクラスタリング,(3)ハイブリッドグラフとコミュニティ検索によるQA精度とパフォーマンスのバランスをとるデュアルチャネルグラフ検索フュージョンの3つの中心的イノベーションを紹介する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:13:43 GMT)
Evaluating Language Models for Harmful Manipulation [4.8] 本稿では,文脈特異的な人間-AIインタラクション研究を通じて有害なAI操作を評価する枠組みを提案する。
我々は,3つのAI利用領域(公共政策,金融,健康)と3つの地域(米国,英国,インド)のインタラクションにまたがる10,101人の参加者によるAIモデルを評価する。
実験実験では,実験参加者の信念や行動変化を誘発することができる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:13:06 GMT)
Auditing Algorithmic Personalization in TikTok Comment Sections [4.8] われわれは、ソックス・パペットのアカウントを訓練し、左利きまたは右利きの好みを示し、その中の17件をFor You Pagesで推奨されたビデオを分析して検証した。
そして、これらの訓練されたパルチザンアカウントに示されたコメントセクションと、5つのコールドスタートアカウントを65の政治的中立なビデオで取り除いた。
トップコメントの構成は、すべてのビデオにほぼ一致しているが、異なる政治グループからのアカウント間のランキングのばらつきは、一部のビデオでは同じグループ内で見られるものよりもはるかに大きい。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:52:41 GMT)
When Hate Meets Facts: LLMs-in-the-Loop for Check-worthiness Detection in Hate Speech [4.7] WSF-ARG+はヘイトスピーチとチェック履歴情報を組み合わせた最初のデータセットである。
チェック価値のあるクレームのアノテーションを容易にするための新しいLLM-in-the-loopフレームワークを提案する。
チェックする価値のある主張を持つHSメッセージは、ハラスメントと憎悪を著しく高めていることを示している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:07:00 GMT)
Pure and Physics-Guided Deep Learning Solutions for Spatio-Temporal Groundwater Level Prediction at Arbitrary Locations [4.7] 理論に基づくモデルは科学的理解の基盤となっている。
ディープラーニングは、設計の柔軟性と複雑な関係を学習する能力において、主要なアプローチであることが証明されている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:57:08 GMT)
Causal-INSIGHT: Probing Temporal Models to Extract Causal Structure [4.7] Causal-INSIGHTは、訓練された時間的予測器からモデル実装された(予測者に依存しない)時間的な影響構造を抽出するためのモデルに依存しない、ポストホックな解釈フレームワークである。
提案するQbicは,地平線グラフラベルを必要とせずに,予測忠実度と構造的複雑さのバランスをとる,空間性を考慮したグラフ選択基準である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:16:37 GMT)
Stabilizing correlated pair tunneling of spin-orbit-coupled bosons in a non-Hermitian driven double well [4.7] 本研究では,周期的に駆動される非エルミート二重井戸電位において,2つのボソンの2階相関トンネルを安定化するための解析的枠組みを提案する。
解析により, インタウェルスピン保存, インタウェルスピンフリッピング, インタウェルスピンフリッピングの3つの基本チャネルの安定性機構が明らかにされた。
これらの結果は, 工学的散逸を伴う多体系における相関トンネル制御の可能性を広げるものである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:11:51 GMT)
Distributed Real-Time Vehicle Control for Emergency Vehicle Transit: A Scalable Cooperative Method [4.6] 緊急車両の迅速な輸送は、命を救い、財産の損失を減らすために重要である。
一般車両への影響を最小限に抑えつつ、緊急車両の迅速な輸送を確保することが重要である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:51:31 GMT)
TopoPilot: Reliable Conversational Workflow Automation for Topological Data Analysis and Visualization [4.6] TopoPilotは、複雑な科学的視覚化を自動化するための信頼性が高くエージェント的なフレームワークである。
TopoPilotは、信頼性の高い運用を保証するために、系統的なガードレールと検証メカニズムを組み込んでいる。
評価では、TopoPilotは99%以上の成功率を達成したが、ベースラインでは50%以下で、包括的なガードレールやチェックがない。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:56:53 GMT)
Practical Efficient Global Optimization is No-regret [4.5] 我々は,実用EGOの累積的後悔の上限を初めて提示する。
本稿では,実用的EGOには線形累積後悔境界があり,よく使われるカーネルに対する非回帰アルゴリズムであることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:58:17 GMT)
Just Zoom In: Cross-View Geo-Localization via Autoregressive Zooming [4.4] クロスビュージオローカライゼーションは、ストリートビュー画像とジオレファレンスされたオーバーヘッド画像とをマッチングすることにより、カメラの位置を推定する。
既存の手法は、対照的に訓練された埋め込み空間における画像検索問題としてCVGLをほぼ普遍的に定式化する。
都市規模のオーバヘッドマップ上でオートレズームによりCVGLを実行する代替式であるJust Zoom Inを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:36:33 GMT)
Large Language Models as Optimization Controllers: Adaptive Continuation for SIMP Topology Optimization [4.4] 本稿では,SIMP最適化のためのオンラインコントローラとして,大規模言語モデルが機能するフレームワークを提案する。
ハードグレーネスゲートは未熟なバイナライゼーションを防止し、メタ最適化ループは第2パスを使用してエージェントの呼び出し周波数を調整する。
エージェントはすべてのベンチマークの最終的なコンプライアンスを達成する:$5.7%$から$-1%、すべてのソリューションが完全にバイナリである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:14:31 GMT)
Gradient-Informed Training for Low-Resource Multilingual Speech Translation [4.3] 本研究は,学習勾配情報をマイニングすることで,レイヤ固有の共有パターンを自動的に決定する手法を提案する。
提案手法では, 距離に基づく言語クラスタリング, キャパシティ割り当てのための自己/クロスタスク分散メトリクス, 共同分解の3つの異なる分析手法を用いる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:00:00 GMT)
Humans vs Vision-Language Models: A Unified Measure of Narrative Coherence [4.3] 本研究では,視覚言語モデル (VLM) が生成する人文物語と,ビジュアルライティング・プリンプッツ・コーパスで生成した物語を比較した。
VLMは、人間のものと体系的に異なる、広く類似したコヒーレンスプロファイルを示す。
以上の結果から,人間のような表面流布性にもかかわらず,モデル物語は,視覚的に根ざした物語の会話を整理する方法において,人間の物語と体系的な違いを示すことが示唆された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:13:04 GMT)
SurgPhase: Time efficient pituitary tumor surgery phase recognition via an interactive web platform [4.2] 下垂体腫瘍手術(PTS)ビデオにおける位相認識のための包括的枠組みを提案する。
提案手法はホールドアウトテストセットにおいて90%の精度を達成し,現在の最先端手法よりも優れていた。
この研究の中心的な貢献は、外科医が手術ビデオをアップロードするために設計された協調的なオンラインプラットフォームの統合である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:22:20 GMT)
CARE: Training-Free Controllable Restoration for Medical Images via Dual-Latent Steering [4.2] CAREは、実世界の医療画像のためのトレーニング不要の制御可能な復元フレームワークである。
CAREは二重遅延復元戦略を用いており、一方のブランチはデータの忠実さと解剖学的一貫性を強制し、もう一方は欠落または劣化した情報の回復に先立って生成性を活用する。
リスク対応適応制御器は、復元の不確実性と局所構造信頼性に基づいて各分岐の寄与を動的に調整する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:43:28 GMT)
Ultrabroadband Passive Laser Noise Suppression to Quantum Noise Limit through on-chip Second Harmonic Generation [4.0] レーザー強度ノイズは量子センシング、気象学、計算における性能を制限する。
既存の安定化手法は、帯域幅と複雑さのトレードオフに直面している。
我々は,DCから10ギガヘルツまでの強度変動を受動的に抑制する全光学的「ノイズ食器」を実証した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:09:06 GMT)
A Semantically Disentangled Unified Model for Multi-category 3D Anomaly Detection [4.0] 3D異常検出は、通常のデータのみに基づいて訓練された3D点雲における欠陥の検出と局所化を目標とする。
本稿では,3次元異常検出のためのセマンティック・アンタングル統一モデルを提案する。
本手法は, 統一モデルとカテゴリ固有モデルの両方の最先端性を達成し, オブジェクトレベルのAUROCをそれぞれ2.8%, 9.1%改善する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:26:46 GMT)
LILAC: Language-Conditioned Object-Centric Optical Flow for Open-Loop Trajectory Generation [4.0] Flow-based Language Instruction-Guided Open-Loop ACtion Generator (LILAC)
Flow-based Vision-Language-Action model (VLA) はRGB画像と自然言語命令からオブジェクト中心の2次元光フローを生成する。
LILACにはセマンティックアライメント損失(Semantic Alignment Loss)という2つの重要なコンポーネントが含まれている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:21:22 GMT)
Cognitive Training for Language Models: Towards General Capabilities via Cross-Entropy Games [3.9] 本稿では,関連するスキル発見を通じてモデルを成長させるタスクのカリキュラムを構築することの問題点について考察する。
グリーディ最適化アルゴリズムを反復することで、関連するスキル発見のカリキュラムを成長させることができれば、本質的に1つのメタオブジェクトしか実現できないことを示す。
プレイヤーやメタサンプルとして十分な能力を持つ言語モデルと十分なトレーニング時間があれば、認知トレーニングは、関連するスキル発見の原則的な方法を提供すると仮定する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:32:31 GMT)
Personalizing Mathematical Game-based Learning for Children: A Preliminary Study [3.9] ゲームベースラーニング(GBL)は数学教育において広く採用されている。
本稿では、AI技術を用いてプレイヤー生成レベルの分類器を構築する適応学習理論によって導かれるフレームワークを提案する。
数学ゲームベースの学習アプリCreative Modeでは、専門家と上級プレイヤーの両方が作成した206の異なるゲームレベルを収集しています。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:31:10 GMT)
Clinician Perspectives on Type 1 Diabetes Guidelines and Glucose Data Interpretation [3.8] 第1部は,臨床医がどのように優先順位付けし,現在の臨床ガイドラインを適用しているかを検討した。
第2部は, 患者がグルコースモニタリング装置からデータを解釈する能力について, 臨床医の認識を調査した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:43:02 GMT)
Agentic Trust Coordination for Federated Learning through Adaptive Thresholding and Autonomous Decision Making in Sustainable and Resilient Industrial Networks [3.8] 産業ネットワークにおける分散インテリジェンスは、不均一でリソースに制約されたデバイスをまたいだセンシング、通信、計算を統合している。
フェデレートラーニング(FL)は、このような環境で協調的なモデルトレーニングを可能にするが、その信頼性は、一貫性のないクライアントの振る舞い、ノイズの多い検知条件、欠陥や敵の更新の存在に影響される。
本稿では,持続的かつ回復力のある産業ネットワークにおけるFLのための軽量なエージェント的信頼調整手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:21:22 GMT)
Preserving Decision Sovereignty in Military AI: A Trade-Secret-Safe Architectural Framework for Model Replaceability, Human Authority, and State Control [3.7] 本論では, 中心的戦略問題は, 有能なモデルへのアクセスだけでなく, 決定権の維持であると主張している。
本稿では,階層型モデルに依存しない命令支援設計として,エネルギックパラダイムのトレードシークレット・セーフなアーキテクチャ定式化を開発する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:52:09 GMT)
A Public Theory of Distillation Resistance via Constraint-Coupled Reasoning Architectures [3.7] 本稿では, アーキテクチャレベルでの非対称性を低減するための, パブリックな, トレードシークレット・セーフな理論的枠組みを提案する。
核となる主張は、内部安定性の制約に高レベルの能力が結合された場合、蒸留はショートカットとしての価値が低下するということである。
プロプライエタリな実装の詳細、トレーニングレシピ、しきい値、隠れ状態の計測、デプロイメント手順、機密システム設計選択を省略する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:38:58 GMT)
Layer-Specific Lipschitz Modulation for Fault-Tolerant Multimodal Representation Learning [3.7] この研究は、フォールトトレラントなマルチモーダル表現学習のための数学的基盤となるフレームワークを導入する。
単一のアーキテクチャ内で自己教師付き異常検出とエラー訂正を統一する。
マルチモーダル・フォールト・データセットの実験結果から,センサ破損時の異常検出精度と再構成の両面において,提案手法が改良されることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:22:51 GMT)
Surrogates, Spikes, and Sparsity: Performance Analysis and Characterization of SNN Hyperparameters on Hardware [3.6] スパイキングニューラルネットワーク(SNN)は、スパースでイベント駆動型計算による低消費電力推論に固有の利点を提供する。
SNNの理論的エネルギの利点は、トレーニング時間選択と推論時間間隔の間の不透明な関係のため、実際のハードウェア性能から切り離されることが多い。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:12:43 GMT)
DRiffusion: Draft-and-Refine Process Parallelizes Diffusion Models with Ease [3.5] DRiffusionは、ドラフト・アンド・リファインプロセスを通じて拡散推論を並列化する並列サンプリングフレームワークである。
実証的には、DRiffusionは1.4$times$-3.7$times$speedupを複数の拡散モデルで達成し、生成品質は最小限に低下する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:58:42 GMT)
CLIP-RD: Relational Distillation for Efficient CLIP Knowledge Distillation [3.5] 本稿では,2つの新しい方法を紹介する知識蒸留フレームワークを提案する。
VRDとXRDは, 分散レベルにおける教師と学生の蒸留強度の一致を強制する。
多方向リレーショナル構造を共同でモデル化することにより、CLI-RDは生徒の埋め込み幾何学と教師の幾何学の忠実なアライメントを促進し、既存の手法を0.8%向上させる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:34:18 GMT)
GlowQ: Group-Shared LOw-Rank Approximation for Quantized LLMs [3.5] BitsAndBytes、AWQ、GPTQなどの量子化技術は、低ビット表現を使用すると精度が低下する。
低ランク補正法はすべてのレイヤを復元し、デコーダブロックにエラー訂正モジュールを挿入する。
本稿では,グループ共有の低ランク近似であるGlowQを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:36:44 GMT)
Measurement-induced non-commutativity in adaptive fermionic linear optics [3.4] 内部自由度を持つフェルミオン用量子回路には,中間回路数監視と古典的フィードフォワードが有効であることを示す。
本アーキテクチャでは,選択したブロックを固定階のベル融合ペアリング幾何にルーティングする。
その結果, 非干渉性フェルミオンの硬さをサンプリングする経路として, 中間回路測定による非可換性を確立した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:37:23 GMT)
Enhancing Efficiency and Performance in Deepfake Audio Detection through Neuron-level Dropin & Neuroplasticity Mechanisms [3.4] モデルパラメータを柔軟に変調するために,特定の層内のニューロン数を動的に調整するアルゴリズム,ドロップイン,さらなる可塑性を提案する。
ResNet、Gated Recurrent Neural Networks、Wav2Vecなど、複数のアーキテクチャ上でこれらのアルゴリズムを評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:42:36 GMT)
End-to-end Feature Alignment: A Simple CNN with Intrinsic Class Attribution [3.4] エンドツーエンドの機能アライメントによる固有のクラス属性を持つプロトタイプCNNアーキテクチャを提案する。
FA-CNN の固有特徴写像が Grad-CAM の有意性写像と同一であることは理論的に証明できる。
FA-CNNは、ベンチマーク画像分類データセットでよく機能する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:06:44 GMT)
Hybrid photon blockade with hyperradiance in two-qubit cavity QED system [3.4] 駆動2ビットキャビティQEDシステムにおけるハイブリッド光子遮断(HPB)方式について検討した。
ELAをベースとした光子遮断における高輝度の利点と、QDIをベースとした非伝統的な光子遮断における強力なアンチバンチングを完全に統合した正確なパラメトリックなレギュレーションを同定する。
HPB機構は、様々なカップリング対称性にまたがってパラメトリックな一般性を示し、デチューニング制御を通じてアクセス可能である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:49:45 GMT)
ALPS: Automated Least-Privilege Enforcement for Securing Serverless Functions [3.4] サーバレス環境で最小特権を強制する自動化フレームワークであるALPSを提案する。
本システムでは,関数コードから正確な許可要件を抽出するために,サーバーレスの静的解析を用いる。
また、不正アクセスをブロックし、ポリシーやコードの変更に適応するためのリアルタイム監視も行う。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:39:58 GMT)
Explicit States with Two-sided Long-Range Magic [3.3] 非安定化性(英: Nonstabilizerness)またはマジック(英: magic)は、古典的にシミュラブルなクリフォードフレームワークを超える量子優位性に必要なリソースである。
最近の研究は、多体状態での魔法の構造をチャート化し始めた。
本研究では,両面の長距離魔法を確実に有する明示的状態を構築する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:40:08 GMT)
Networks of quantum reference frames and the nature of conserved quantities [3.2] 参照の量子フレームのネットワークは、1つのフレームが複数の他のフレームを生成するのに使えるが、保存された量の交換に追従する直観的特性は極めて微妙であることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:25:29 GMT)
Agentic AI -- Physicist Collaboration in Experimental Particle Physics: A Proof-of-Concept Measurement with LEP Open Data [3.1] アーカイブされたALEPHデータを用いて,Sqrts=91.2$GeVでのe+e-$衝突時の推力分布のAIエージェントによる測定を行った。
分析とすべてのメモは、専門家物理学者の指示のもと、AIエージェントによって全て実行される。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:28:09 GMT)
Closing the Confidence-Faithfulness Gap in Large Language Models [3.1] 大規模言語モデルは、実際の精度から大きく切り離された信頼スコアを言語化する。
本稿では,言語的信頼度に関する機械論的解釈可能性分析について述べる。
本稿では,モデルの内部精度推定値を読み取る2段階適応型ステアリングパイプラインを導入する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:42:04 GMT)
Efficient Detection of Bad Benchmark Items with Novel Scalability Coefficients [3.1] 異方性回帰に基づく非パラメトリックな拡張係数の新たなファミリを導入する。
中心的な寄与は符号付きイソトニック$R2$であり、これは説明可能な1つの項目における分散の最大比率を測定する。
符号付き等方性$R2$は単調予測器の中で極端であることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:47:49 GMT)
Towards Controllable Low-Light Image Enhancement: A Continuous Multi-illumination Dataset and Efficient State Space Framework [3.0] Light100 がサポートする総合的なフレームワークである Controllable Low-light Enhancement (CLE) を導入する。
輝度制御と色度との矛盾を解決するため、ノイズ分離型監視戦略を採用する。
提案手法は,実世界のマルチイルミネーション代替品として,競争性能とロバストな制御性を実現する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:40:08 GMT)
Optimizing Multilingual LLMs via Federated Learning: A Study of Client Language Composition [2.9] 多言語環境におけるLLM(Federated Learning of Large Language Models)は重要な課題である。
我々はFederatedScope-LLMフレームワークを拡張し、LLMによる多言語命令チューニング実験をサポートする。
本稿では、クライアント固有の早期停止機構であるローカル動的早期停止(LDES-FL)を導入し、クライアントがローカルトレーニングを一時停止し、再開できるようにする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:39:50 GMT)
TAAC: A gate into Trustable Audio Affective Computing [2.9] 本稿では,Trustable Audio Affective Computingのためのフレームワーク名を提案する。
信頼性の高い環境で音声による自動うつ病検出を行う。
抑うつ検出,ID予約,音声再構成における本フレームワークの卓越した性能について検討した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:43:19 GMT)
ThermoAct:Thermal-Aware Vision-Language-Action Models for Robotic Perception and Decision-Making [2.9] 本稿では,ロボットのタスク実行に熱情報を組み込んだビジョン・ランゲージ・アクション・フレームワークを提案する。
提案システムは、複雑な自然言語コマンドを解釈する高レベルプランナとして、ビジョンランゲージモデル(VLM)を利用する。
視覚データのみに依存した従来の手法とは異なり,本手法は熱情報を統合し,ロボットが物理的特性を認識し,環境安全を積極的に確保することを可能にする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:26:56 GMT)
Evaluating adaptive and generative AI-based feedback and recommendations in a knowledge-graph-integrated programming learning system [2.8] 本研究では, 適応型, 生成型AI(GenAI), ハイブリッド型GenAI適応型の3つの学習モードにおける学習者の嗜好について検討した。
解析結果から,GenAIモードからのフィードバックを受ける学習者は,適応モードからのフィードバックを受ける学習者よりも,プログラムロジックが欠落しているコードの方が有意に多いことがわかった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:04:36 GMT)
Assessing Age Assurance Technologies: Effectiveness, Side-Effects, and Acceptance [2.8] 年齢保証に関する様々なアプローチをオンラインで記述し分析する。
それぞれの効果,副作用,受容について,それぞれの組み合わせを評価した。
我々は、未成年者を保護するのにどの種類のAATが適しているかを推奨する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:42:06 GMT)
Macroscopic Characteristics of Mixed Traffic Flow with Deep Reinforcement Learning Based Automated and Human-Driven Vehicles [2.7] 本研究は,混合交通におけるDRLモデルにおけるマクロな交通流特性と燃料効率の解析に焦点をあてる。
ツイン遅延Deep Deterministic Policy Gradient (TD3)アルゴリズムは、AVの制御のために実装され、NGSIMハイウェイデータセットを使用して訓練される。
その結果,交通性能は安全時間ギャップの分布やRL車両の割合に敏感であることがわかった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:14:20 GMT)
EvoForest: A Novel Machine-Learning Paradigm via Open-Ended Evolution of Computational Graphs [2.7] 本稿では,計算のエンドツーエンドな進化のためのハイブリッド型ニューロシンボリックシステムであるEvoForestを紹介する。
単に機能を生成するのではなく、EvoForestは再利用可能な計算構造、呼び出し可能な関数ファミリー、トレーニング可能な低次元連続コンポーネントを共同で進化させる。
各グラフ構成について、EvoForestは発見された計算を評価し、軽量のリッジベースの読み出しを使用して結果の表現をスコアする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:07:45 GMT)
Robust Reasoning Benchmark [2.6] LLM推論の堅牢性を評価するため,14の手法からなる摂動パイプラインを提案する。
このパイプラインをAIME 2024データセットに適用し、その結果のベンチマークで8つの最先端モデルを評価します。
その結果, 7B から 120B までの開度モデルと Claude Opus 4.6 がその後の問題に対して精度劣化を示した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:19:33 GMT)
Toward Artificial Intelligence Enabled Earth System Coupling [2.6] カップリングは、その球体を繋ぐ相互接続された物理的、化学的、生物学的プロセスを制御する。
本稿では,新しい人工知能(AI)手法が,地球系結合性を高める新たな機会をいかに生み出すかを検討する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:13:46 GMT)
ReasonScaffold: A Scaffolded Reasoning-based Annotation Protocol for Human-AI Co-Annotation [2.6] textbfReasonScaffoldは、予測ラベルを保ちながらLLM生成の説明を公開するための足場付き推論アノテーションプロトコルである。
本研究では,アノテート精度を評価するよりも,人間のアノテート行動が制御された環境でのアノテート行動にどのように影響するかを検討する。
本研究の結果から, 推論への露出は, 一致度の増加と最小限の修正と結びついており, 広範囲な変化を招くことなく, 曖昧な症例の解決に有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:53:43 GMT)
Sparse Visual Thought Circuits in Vision-Language Models [2.6] 我々はQwen3-VL-8Bにおける疎視的思考回路の局所化とテストを行う因果パイプラインを開発した。
この層でSAEを訓練し、明示的な規則でタスク選択集合を構築し、精度とドリフトを定量化しながら推論時間スケーリングとアブレーションを行う。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:24:36 GMT)
Pixelis: Reasoning in Pixels, from Seeing to Acting [2.6] 我々は,画像やビデオを直接操作するピクセルスペースエージェントであるPixelisを,コンパクトな実行可能な操作セットを通じて提示する。
6つの公開イメージとビデオベンチマークで、Pixelisは一貫して改善されている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:57:00 GMT)
Building to Understand: Examining Teens' Technical and Socio-Ethical Pieces of Understandings in the Construction of Small Generative Language Models [2.5] 生成的AI/ML技術の採用の増加により、これらのシステムの開発においてティーンをサポートする必要性が高まっている。
最近の研究は、非常に小さな生成言語モデル(LM)の構築における10代参加の可能性を示している。
我々は16代の若者がレシピ、脚本、歌を作るために非常に小さなLMを構築した1週間にわたる参加型デザインワークショップを開催した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:20:39 GMT)
Quantum Inspired Vehicular Network Optimization for Intelligent Decision Making in Smart Cities [2.4] 本稿では、車間通信(V2V)と車間通信(V2I)を協調的に最適化する量子インスパイアされたフレームワークQIVNOMを提案する。
その結果、QIVNOMは平均エンドツーエンドのレイテンシを57.3msに減らし、最高のベースラインよりも約20%低くした。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:04:50 GMT)
An Image Dataset of Common Skin Diseases of Bangladesh and Benchmarking Performance with Machine Learning Models [2.4] バングラデシュでは, 接触皮膚炎, Vitiligo, Eczema, Scabies, Tinea Ringworm, Vitiligoの5種の皮膚疾患に焦点を当てた。
302,381,301,316,312の皮膚炎像,Eczema,S Scabies,Tinea Ringworm,Vitiligoからなる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:31:12 GMT)
arg-VU: Affordance Reasoning with Physics-Aware 3D Geometry for Visual Understanding in Robotic Surgery [2.4] Arg-VUは物理学を意識した割当推論フレームワークである。
時間的に一貫した幾何追跡と制約による機械的モデリングを統合する。
その結果、arg-VUはキネマティックベースラインよりも安定で、物理的に一貫性があり、解釈可能な価格予測をもたらすことがわかった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:14:28 GMT)
Hessian-informed machine learning interatomic potential towards bridging theory and experiments [2.4] Hessian-informed Machine Learning Interatomic potential (Hi-MLIP)を紹介する。
Hi-MLIPは曲率を確実に捉え、関連する熱力学および運動現象の正確な解析を可能にする。
我々は,高効率なトレーニングプロトコルであるヘッセンインフォームドトレーニング(HINT)を開発し,高価なヘッセンラベルの要求に対して2~4桁のスケール削減を実現した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:23:49 GMT)
Cooperative Deep Reinforcement Learning for Fair RIS Allocation [2.2] RISは、競合する基地局間で動的に割り当てられなければならない共有インフラストラクチャであると考えている。
フェアネスを考慮した協調型マルチエージェント強化学習手法を提案する。
その結果,提案フレームワークはRIS資源をより弱い性能の細胞に効果的に再分配することがわかった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:46:32 GMT)
CHIRP dataset: towards long-term, individual-level, behavioral monitoring of bird populations in the wild [2.2] 個々の動物の長期の行動モニタリングは、異なる時間スケールで起こる行動変化を研究するために重要である。
コンピュータビジョンの手法は生物多様性のモニタリングに有用であることが証明されているが、野生個体群における自動行動監視は依然として困難である。
そこで本研究では,野生鳥類の個体識別のための新しい手法であるCORVIDを用いたデータセット(CHIRP)を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:57:31 GMT)
Disguising Topology and Side-Channel Information through Covert Gate- and ML-Enabled IP Camouflaging [2.2] IP盗難は、高度なリバースエンジニアリング(RE)技術によって、毎年数十億の損失を被っている。
従来の cryptic' の IC カモフラージュ手法は、局所的なゲート機能の隠蔽に重点を置いているが、システムレベルの構造解析には弱いままである。
機能的なIP(F)は、完全に異なる外観のIP(A)として構造的に、視覚的にマスクレードするように設計されていることを示す。
その結果, この多層化手法は, ネットリスト理解に使用される構造的および論理的データを汚染することにより, REツールチェーン全体を効果的に抑制することがわかった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:53:10 GMT)
Knowledge-Guided Retrieval-Augmented Generation for Zero-Shot Psychiatric Data: Privacy Preserving Synthetic Data Generation [2.2] 大規模言語モデル(LLMs)は精神障害の診断・統計マニュアル(DSM-5)を用いて検索・拡張生成によって構成される
プライバシ保存型合成データを生成するために,異なる知識ベースの組み合わせを用いて実験を行った。
6つの不安関連疾患(特定恐怖症、社会的不安障害、アダラポビア、一般不安障害、分離不安障害、パニック障害)について評価を行った。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:52:41 GMT)
Shape and Substance: Dual-Layer Side-Channel Attacks on Local Vision-Language Models [2.1] デバイス上のビジョンランゲージモデル(VLM)は、ローカル実行を通じてデータのプライバシを約束する。
動的高分解能前処理へのアーキテクチャシフトは,アルゴリズム的なサイドチャネルを導入している。
ローカルなVLMに対する2層アタック・フレームワークを実演する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:53:49 GMT)
Probabilistic Abstract Interpretation on Neural Networks via Grids Approximation [2.1] 確率論的抽象解釈は、全ての入力をテストすることができないときにコンピュータプログラムの特性を抽出するために用いられる。
この理論フレームワークがニューラルネットワークでどのように機能するかを示し、異なる抽象領域と対応するムーア-ペンローズ擬似逆数について議論する。
また、このフレームワークが現実世界の問題を解析するのにどう役立つかを示す実験例を示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:04:29 GMT)
Distribution and Clusters Approximations as Abstract Domains in Probabilistic Abstract Interpretation to Neural Network Analysis [2.1] 本稿では,分散近似とクラスタ近似の2つの新しい近似手法を紹介する。
このフレームワークは、すべての可能な入力の密度分布フローを分析してニューラルネットワークを分析する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:09:58 GMT)
NERO-Net: A Neuroevolutionary Approach for the Design of Adversarially Robust CNNs [2.1] 敵の攻撃に抵抗するより優れた畳み込みニューラルネットワークを設計するための神経進化的アプローチであるNERO-Netを提案する。
提案手法は,進化過程における対角的学習を避けることにより,ロバスト性に対するアーキテクチャ的影響を分離する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:51:30 GMT)
When Chain-of-Thought Backfires: Evaluating Prompt Sensitivity in Medical Language Models [2.1] MedMCQA(4,183質問)とPubMedQA(1,000質問)でMedGemma(4Bおよび27Bパラメータ)を評価する。
実験の結果,いくつかの知見が得られた。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 23:04:20 GMT)
Environment Maps: Structured Environmental Representations for Long-Horizon Agents [2.1] 環境マップは、カスケードエラーと環境を緩和する永続的でエージェントに依存しない表現である。
環境地図を備えたエージェントは28.2%の成功率を達成する。
モデルと環境の間の構造化されたインターフェースを提供することにより、環境マップは長期計画のための永続的な基盤を確立する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:28:12 GMT)
Visualizing Impedance Control in Augmented Reality for Teleoperation: Design and User Evaluation [2.0] 本稿では,ロボットエンドエフェクタからのインピーダンスコントローラのターゲットポーズとその変位を拡張現実(AR)で可視化する手法を提案する。
この視覚化は、コントローラが生成する力を伝達し、高価な触覚ハードウェアを使わずに、直感的でリアルタイムなフィードバックを提供する。
以上の結果から,ARの可視化により,力量クリティカルな揚力作業の完了時間が24%削減され,正確な力制御が重要でないスライディング作業に有意な影響を及ぼすことが示唆された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:11:26 GMT)
High-Fidelity Quantum State Transfer in Multimode Resonators via Tunable Pulses [1.9] 分散量子情報処理には、遠隔ノード間の状態転送が不可欠である。
既存のプロトコルは典型的には、単一モード極限における断熱的な暗黒状態移動やマルチモード状態におけるピッチ・アンド・キャッシュスキームなど、特定の結合状態に最適化されている。
ここでは、この単一モードからマルチモードのクロスオーバーを多モードの量子チャネルで超える高忠実な量子状態転送を可能にする最小2パラメータ制御フレームワークを同定する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:02:40 GMT)
Interpretable PM2.5 Forecasting for Urban Air Quality: A Comparative Study of Operational Time-Series Models [1.8] 本研究は,中国北京市におけるPM2.5予測において,軽量かつ解釈可能な予測手法が競争力を発揮するかどうかを考察する。
SARIMAX、Facebook Prophet、Neural Prophetの3つの予測ファミリーが評価された。
その結果,予測精度と計算効率に差が認められた。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:35:43 GMT)
Epitaxial CeO2 Films as a Host for Quantum Applications [1.7] 高品質CeO2薄膜をPLDで成長させ,TmイオンとErイオンをドープした。
発光寿命測定では、ErをドープしたCeO2の寿命が著しく長い。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:35:56 GMT)
Designing Any Imaging System from Natural Language: Agent-Constrained Composition over a Finite Primitive Basis [1.7] spec.mdは構造化された仕様フォーマットで、一文の自然言語記述を有界再構成エラーのある検証された前方モデルに変換する。
設計から実数への誤差定理は、総再構成誤差を5つの独立な有界項に分解し、それぞれが補正作用にリンクする。
プリミティブを3Dから5Dのチェーンに構成する新しい10の設計は、あらゆる単一モダリティツールを超えて構成的なリーチを示している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:47:27 GMT)
A Judge Agent Closes the Reliability Gap in AI-Generated Scientific Simulation [1.7] 大規模言語モデルは科学シミュレーションコードを生成することができるが、生成されたコードは、ほとんどの非テキスト問題で静かに失敗する。
古典的な数学的検証は,判断エージェントによって完全に自動化可能であることを示す。
12人の独立した科学者が提出した72の盲目タスクは、自動エラー境界で89%の成功率を得る。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:03:52 GMT)
Auditing the Impact of Cross-Site Web Tracking on YouTube Political and Misinformation Recommendations [1.7] 本稿では、ニュースメディア記事と自動的に対話する実験的なフレームワークを提案し、次にYouTubeのレコメンデーションを収集し、ユーザーが見ている政治的・誤った情報に、クロスサイトトラッキングがどう影響するかを測定する。
トラッキング許容とトラッキング制限の両方のブラウザ環境で監査を実行することで、一般的なプライバシ重視のブラウザが、YouTube上のトラッキング駆動の政治的および誤った情報バブルからユーザを保護することができるかどうかを評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:45:24 GMT)
Decoding Market Emotions in Cryptocurrency Tweets via Predictive Statement Classification with Machine Learning and Transformers [1.7] 本研究では,暗号通貨関連ツイートにおける予測文を識別する新しい分類フレームワークを提案する。
Cardano、Matic、Ripple、Ripple、Fantomの5つの人気暗号通貨に焦点を当てています。
感情分析の結果,各予測カテゴリに関連する感情パターンが,異なる暗号通貨で明らかとなった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:52:36 GMT)
Evaluating Synthetic Images as Effective Substitutes for Experimental Data in Surface Roughness Classification [1.7] 生成画像を用いた真正データセットの増大は,実験画像のみを用いて得られたデータに匹敵する精度を示す。
以上の結果から,生成AIは材料画像分類におけるデータ効率と信頼性を大幅に向上させることができることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:00:17 GMT)
A Neural Score-Based Particle Method for the Vlasov-Maxwell-Landau System [1.6] スコア・ベース・トランスポート・モデリング(SBTM)によるブロブスコア推定器の置き換え
近似衝突作用素は運動量と運動エネルギーを保ち、推定エントロピーを放出することを示す。
3つの標準ベンチマークでは、SBTMはブロブ法よりも正確であり、マクスウェル平衡に対する正しい長時間緩和を実現し、50ドル以上の高速ランタイムと4ドル以下の低ピークメモリを提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:55:44 GMT)
LogitScope: A Framework for Analyzing LLM Uncertainty Through Information Metrics [1.5] LogitScopeは、大規模言語モデル(LLM)の不確実性を分析するための軽量フレームワークである。
生成ステップ毎にエントロピーやバレントロピーなどのメトリクスを測定することで、LogitScopeはモデルの信頼性のパターンを明らかにする。
我々は、不確実性、モデルビヘイビア分析、生産監視を含む多様なアプリケーションにまたがるLogitScopeの有用性を実証する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:46:24 GMT)
C2W-Tune: Cavity-to -Wall Transfer Learning for Thin Atrial Wall Segmentation in 3D Late Gadolinium-enhanced Magnetic Resonance [1.5] C2W-Tuneは2段階のキャビティ・ツー・ウォール・トランスファー・フレームワークである。
高精度のLA空洞モデルを解剖学的に用いて、薄肉の脱線を改善する。
C2W-TuneはDiceスコアが0.78、HD95が3.15mmに達し、マルチクラスのベンチマークを上回った。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:35:35 GMT)
Factors Influencing the Quality of AI-Generated Code: A Synthesis of Empirical Evidence [1.4] AI支援コード生成ツールの急速な採用は、ソフトウェア開発プラクティスの変革である。
AI生成コードの品質、信頼性、セキュリティに関する懸念は、アカデミックと業界の両方でますます報告されている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:06:42 GMT)
MobileDev-Bench: A Comprehensive Benchmark for Evaluating Language Models on Mobile Application Development [1.4] Android Native(Java/Kotlin)、React Native(TypeScript)、Flutter(Dart)にまたがる18のプロダクションモバイルアプリケーションから収集された384の現実世界の課題解決タスクからなるベンチマークであるMobileDev-Benchを紹介した。
各タスクは、実行可能テストパッチと開発者が報告した問題にペアリングし、モバイルビルド環境内でモデル生成の修正を完全に自動検証することを可能にする。
GPT-5.2, Claude Sonnet 4.5, Gemini Flash 2.5, Qwen3-Coder の4つの最先端コード対応LCMの評価
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:31:03 GMT)
A Comparative Investigation of Thermodynamic Structure-Informed Neural Networks [1.4] 物理インフォームドニューラルネットワーク(PINN)は、微分方程式の前方および逆問題を解くための統一的な枠組みを提供する。
本稿では,様々な熱力学の定式化を取り入れた異なる熱力学構造インフォームドニューラルネットワークの系統的比較について述べる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:39:15 GMT)
Visual or Textual: Effects of Explanation Format and Personal Characteristics on the Perception of Explanations in an Educational Recommender System [1.3] 教育推薦システム(ERS)において、説明形式とPCが協調して知覚制御、透明性、信頼、満足度にどう影響するかを検討する。
その結果、視覚的、シンプルで、インタラクティブで、選択的、分かりやすい視覚化は、PCとは独立して、多くのユーザのERSにおけるコントロール、透明性、適切な信頼、満足度を、ユーザの嗜好とどのようにリンクしているかを明確に、直感的に伝えます。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:37:13 GMT)
Automated Quality Assessment of Blind Sweep Obstetric Ultrasound for Improved Diagnosis [1.3] 本稿では,Blind Sweep Obstetric Ultrasound(BSOU)の品質の体系的評価と,その3つの重要なAIタスクへの影響について述べる。
モデルロバスト性を定量化するために, 逆スイープ方向, プローブインバージョン, 不完全なスイープを含む, 妥当な取得偏差をシミュレートする。
以上の結果から,BSOUをベースとしたAIモデルの変動性獲得に対する感受性を強調し,信頼性の高いスケーラブルなAI支援新生児超音波構築において,自動品質評価が中心的な役割を果たすことを示した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:20:21 GMT)
Second-Order, First-Class: A Composable Stack for Curvature-Aware Training [1.3] 静的プランによって管理される単一のJITコンパイルステップとして、曲率対応のトレーニングを扱う、コンポーザブルなOptaxネイティブスタックであるSomaxを紹介します。
Somaxは単一ステップインターフェースの背後にある第一級モジュールを公開し、標準勾配変換を適用することでOptaxで構成する。
本稿では,構成選択がスケーリング行動や時間-精度に重大な影響を及ぼすことを示すシステム指向のアブリケーションを報告する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 23:36:37 GMT)
Neural Network Conversion of Machine Learning Pipelines [1.3] 学生-教師の学習という1つの移行アプローチは、小さな'学生のニューラルネットワークを作るのに成功している。
本稿では,この手法の拡張について検討し,教師として非ニューラルベース機械学習パイプラインからニューラルネットワーク(NN)学生へ移行する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:46:38 GMT)
VolDiT: Controllable Volumetric Medical Image Synthesis with Diffusion Transformers [1.2] VolDiTは、容積医用画像合成のための最初の純粋変換器ベースの3D拡散変換器である。
提案手法は,拡散トランスフォーマーをボリュームパッチ埋め込みとグローバル自己注意によりネイティブな3Dデータに拡張する。
その結果, グローバルコヒーレンスの向上, 生成能の向上, 制御性の向上が示された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:51:46 GMT)
Adaptive decision-making for stochastic service network design [1.2] 本稿では,マルチモーダル貨物輸送ネットワークで動作するロジスティクスサービスプロバイダ(LSP)のサービスネットワーク設計(SND)問題に対処する。
メタヒューリスティックス、シミュレーション、機械学習コンポーネントを組み合わせた2段階最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:33:19 GMT)
BEVMAPMATCH: Multimodal BEV Neural Map Matching for Robust Re-Localization of Autonomous Vehicles [1.2] 本稿では,BEVMapMatchを提案する。
私たちのコードとデータはhttps://github.com/ssuralcmu/BEVMapMatch.git.comで公開されます。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 23:08:31 GMT)
AI-Supervisor: Autonomous AI Research Supervision via a Persistent Research World Model [1.1] 既存の自動研究システムは、ステートレスでリニアなパイプラインとして動作する。
マルチエージェントオーケストレーションフレームワークである textbfAI-Supervisor を提案する。
エージェントは、人間の関心によって駆動されるエンドツーエンドのAI研究の監督を提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:57:21 GMT)
Reinforcement learning for quantum processes with memory [1.1] 強化学習では、エージェントが環境と順次対話して報酬を最大化し、部分的確率的フィードバックのみを受け取る。
エージェントは、ターゲットの目的を最大化するために、この知識を活用しながら隠れたダイナミクスを学ぶ必要がある。
我々は、未知の量子チャネルを介して進化する隠れ量子メモリを環境が維持するフレームワークを通じてこの問題を定式化し、エージェントは量子機器を用いて順次介入する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:58:13 GMT)
LEMON: a foundation model for nuclear morphology in Computational Pathology [1.1] 本稿では,スケーラブルな単一セル画像表現学習のための自己教師型基礎モデルLEMONを紹介する。
多様な組織やがんタイプから何百万もの細胞画像で訓練されたLEMONは、堅牢で汎用的な形態的表現を学ぶ。
LEMONを予測タスクの5つのベンチマークデータセットで評価し,高い性能を示すことを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:09:09 GMT)
Online Learning for Dynamic Constellation Topologies [1.1] 衛星ネットワークは、そのノードの継続的な軌道移動と操作に対処しなければならない。
オンライン学習フレームワークにおける(動的)ネットワークトポロジ構成の問題に対処する。
我々は,この問題の定式化が最先端のオフライン手法の性能と一致することを実証的に実証した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:47:31 GMT)
Synchronous Signal Temporal Logic for Decidable Verification of Cyber-Physical Systems [1.1] 多くのサイバー物理システム(CPS)は、正しい実行、信頼性、信頼性が不可欠である安全クリティカルな環境で機能する。
Signal Temporal Logic (STL)は、安全クリティカルなCPSをチェックするための正式なフレームワークを提供する。
静的安全性と生存性を検証するSTLの断片であるSynchronous Signal Temporal Logic (SSTL)を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:06:17 GMT)
Comparing Natural and Synthetic Structured Data: A Study of the Passive Verb Alternation in French and Italian [1.1] 本研究では,自然データと合成データが大規模言語モデル(LLM)の学習および評価に与える影響を比較検討する。
我々はBlackbird Language Matrices (BLMs) を用いて、文集合全体にわたる下位パターンの言語知識を探索するために設計された構造化データセットを用いている。
実験により、モデルが合成データセット上で訓練および試験を行う際には天井性能が達成されるが、それらは自然文に確実に一般化されないことが示された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:27:58 GMT)
Few-Shot Left Atrial Wall Segmentation in 3D LGE MRI via Meta-Learning [1.1] 左心房壁セグメンテーションのためのモデル非依存メタラーニング(MAML)フレームワークを提案する。
MAMLは左心房・右心房空洞の補助的タスクと共に壁面タスクでメタトレーニングされる。
我々は,MAMLセグメンテーション性能をホールドアウトテストセットで評価し,目に見えない合成シフトの下で頑健さを評価した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:25:40 GMT)
LACY: Simulating Expert Mentoring for Software Onboarding with Code Tours [1.0] Lacyは、再利用可能なコードツアーで専門家のメンタリングを捉えています。
私たちのデザインは、20以上のミーティング、調査、インタビューに由来する要件に基づいています。
サポート機能としては、Voice-to-Tourキャプチャ、理解クイズ、ポッドキャスト、ダッシュボードなどがある。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:38:56 GMT)
Approaches to Analysing Historical Newspapers Using LLMs [1.0] 本研究では,スロヴェニアの歴史新聞『Slovenec』と『Slovenski narod from the sPeriodika corpus』の計算分析を行った。
20世紀の変わり目に、集団的アイデンティティ、政治的指向、そして国民的所有物がどのように公共の場で表現されたかを検討する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:38:30 GMT)
QU-NLP at ArchEHR-QA 2026: Two-Stage QLoRA Fine-Tuning of Qwen3-4B for Patient-Oriented Clinical Question Answering and Evidence Sentence Alignment [1.0] 本稿では,ArchEHR-QA共有タスクのサブタスク3(回答生成)とサブタスク4(証拠文アライメント)の両方に対処する統一システムを提案する。
Subtask 3では、4ビットNF4量子化でロードされたQwen3-4Bに2段階の量子化低ランク適応(QLoRA)を適用する。
Subtask 4では,相対しきい値付きBM25,TF-IDFコサイン類似度,微調整型クロスエンコーダの3種類の検索手法の重み付けアンサンブルを開発した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:24:13 GMT)
MP-MoE: Matrix Profile-Guided Mixture of Experts for Precipitation Forecasting [1.0] 本稿では,MP-MoE(Matrix Profile-Guided Mixture of Experts)フレームワークを提案する。
MP-MoEは従来の強度損失を構造認識行列プロファイルの目的と統合する。
ベトナムの2大河川流域における降雨データセットのMP-MoEを評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:29:17 GMT)
Low-Rank-Modulated Functa: Exploring the Latent Space of Implicit Neural Representations for Interpretable Ultrasound Video Analysis [0.9] Inlicit Neural representations (INR) は連続的な画像表現学習のための強力なフレームワークとして登場した。
Functaベースのアプローチでは、各画像は、共有INRを条件付けし、強い再構成性能を実現する潜在変調ベクトルとして符号化される。
時間分解潜在空間における変調の低ランク適応を実現する新しいアーキテクチャであるLow-Rank-Modulated Functa (LRM-Functa)を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:46:27 GMT)
Design and Development of an ML/DL Attack Resistance of RC-Based PUF for IoT Security [0.9] 物理的にUnclonable Functions(PUF)は、IoT認証のための有望なハードウェアセキュリティを提供する。
モデリング攻撃は、チャレンジ応答パターンを学習することでPUFセキュリティを脅かす。
この作業では、カスタムレジストコンデンサベースの動的再構成可能なPUFを導入する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:49:53 GMT)
Uncertainty Quantification for Quantum Computing [0.9] このレビューは、数学者や計算科学者を不確実性量子化レンズ(UQ)を通して量子コンピューティング(QC)に導入することを目的としている。
我々は、今日の量子デバイスにおけるエラーの伝播と信頼性の課題に、固有の数学的ツールが直接対処する方法について強調する。
その目的は、応用数学、科学計算、量子情報科学の概念的な分割を狭めることである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:21:39 GMT)
The AI Criminal Mastermind [0.9] AIエージェントはすぐに、FiverrやUpworkといったプラットフォームを通じて人間を雇用することで、この役割を果たすだろう、と私は主張する。
それぞれのシナリオにおいて、ヒューマンタスクは階層の最も低い領域に存在する。
タスクの責任は、無実のエージェントの原則によって支配される知識に結びついている可能性が高い。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:08:52 GMT)
Labeled Compression Schemes for Concept Classes of Finite Functions [0.8] 有限関数の任意の概念クラスに対して、そのVC次元 d に等しい大きさのラベル付きサンプル圧縮スキームを示す。
長期間のオープンサンプル圧縮予想は解決される。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:32:26 GMT)
Cascaded Metasurface Interferometer for Multipath Interference with Classical and Quantum Light [0.8] 準曲面をマルチポートビームスプリッタとして設計し,実験的に活用する。
古典的な光を用いて, 個人とカスケードの準曲面を特徴付け, 制御可能な分裂比を示す。
次に、量子光へのアプローチを拡張し、2階と3階の光子相関を示すために単一の光子を用い、複数の空間経路にまたがる単一光子干渉を示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:52:37 GMT)
Massive Parallel Deep Reinforcement Learning for Active SLAM [0.8] 並列コンピューティングの最近の進歩は、Active SLAMのような計算集約的な学習問題の新たな機会を生み出している。
本稿では,能動SLAMのためのスケーラブルなエンドツーエンドDRLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:58:20 GMT)
Challenges in Hyperspectral Imaging for Autonomous Driving: The HSI-Drive Case [0.8] 自律走行(AD)におけるハイパースペクトルイメージング(HSI)は、このアプリケーション領域の仕様と要件に関連する多くの課題に直面している。
一方、制御不能で可変な照明条件、広い奥行き範囲、高速移動物体を持つダイナミックなシーンがある。
これらの要素の組み合わせは、適切なHSI技術を選択するための基準と、カスタムビジョンアルゴリズムの開発の両方を決定する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:45:57 GMT)
CANGuard: A Spatio-Temporal CNN-GRU-Attention Hybrid Architecture for Intrusion Detection in In-Vehicle CAN Networks [0.8] Internet of Vehicles (IoV) はスマートトランスポートシステムにおいて重要なコンポーネントとなり、車両とインフラ間のシームレスな相互作用を可能にしている。
本稿では,CNN,Gated novel Recurrent Units(RUG)と,そのような攻撃を効果的に識別するための注意機構を組み合わせたディープラーニングアーキテクチャであるCANGuardを提案する。
提案手法は,現代のIoV環境において,実用的でスケーラブルなセキュリティ強化の可能性を示すものである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:49:04 GMT)
On the Objective and Feature Weights of Minkowski Weighted k-Means [0.8] ミンコフスキー重み付きk平均(mwk-means)アルゴリズムは、特徴量とミンコフスキー距離を組み込むことで古典的なk平均を拡張する。
我々は、mwk-means目的をミンコフスキー指数 p で決定された順序で、クラスタ内分散のパワー平均集合として表すことができることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:57:47 GMT)
RenoBench: A Citation Parsing Benchmark [0.8] RenoBenchは機械可読な引用解析のためのベンチマークである。
SciELO、Redalyc、Public Knowledge Project、Open Research Europeの4つの出版エコシステムでリリースされたPDFから派生している。
複数の言語、パブリッシュタイプ、プラットフォームにまたがる1万の引用のデータセットに対して、自動検証と機能ベースのサンプリングを適用する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:52:31 GMT)
Knowledge-Guided Failure Prediction: Detecting When Object Detectors Miss Safety-Critical Objects [0.8] 表現に基づく監視フレームワークは、実行時に検出される異常として、ミスセーフクリティカルな検出を扱う。
重要な性質は、検出器がその能力の外で動作しているか、視覚基盤モデル自体が新しい入力に遭遇している場合、2つの埋め込みは分岐するということである。
COCO人物検出では、KGFPを選択的予測ゲートとして適用すると、FPR(False Positive Rate)の5%で64.3%から84.5%まで、受理画像中の人物のリコールが増加する。
私たちのコード、モデル、機能はhttps://gitlab.cc-asp.fraunhofer.de/iosb_public/KGFPで公開されています。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:38:20 GMT)
Weak distillation of quantum resources [0.7] 予測値推定から弱いシミュレータへ準確率ベースのプロトコルを持ち上げるための一般的なフレームワークを提供する。
提案手法は, 誤差緩和, 絡み込み蒸留, マジックステート蒸留など, 関連シナリオにおいて, はるかに少ないサンプルを必要とする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:04:28 GMT)
The Economics of Builder Saturation in Digital Markets [0.7] 生産規模を弾性的に拡大するが、人間の注意が有限であるモデルを定式化するビルダー飽和効果を導入する。
均衡結果は, 平均賃金の減少, 集中度の増加を示すが, パワーロー様分布と一致している。
結果として、AI対応で民主化されたプロダクションは、広く分散した起業家的成功を生み出すよりも、競争を激化させ、最も獲得した結果を生み出す可能性が高いことが示唆されている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:11:07 GMT)
Physical Backdoor Attack Against Deep Learning-Based Modulation Classification [0.7] 本研究では,Deep Learningベースの変調分類器を対象とする物理バックドア(トロイジャン)攻撃について検討する。
トレーニング中、敵はRF信号の振幅を操作し、ラベルを目標変調方式に変更し、バックドアモデルのトレーニングを行う。
提案手法は,ノイズレベルの異なるRD信号の操作をほとんど行わず,高い攻撃成功率を達成できることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:49:07 GMT)
On the Vulnerability of Deep Automatic Modulation Classifiers to Explainable Backdoor Threats [0.7] 深層学習(DL)は、現代の無線通信の応用を支援するために広く研究されている。
応用の1つは自動変調分類(AMC)である。
最も永続的でステルス的な脅威の1つは、バックドア(トロイア)攻撃である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:57:00 GMT)
Mitigating Evasion Attacks in Fog Computing Resource Provisioning Through Proactive Hardening [0.7] 本稿では,霧ネットワークにおける資源供給に使用するk-meansアルゴリズムによって割り当てられた仮想マシンによる整合性攻撃のモデル化の可能性について検討する。
k-meansアルゴリズムは、要求されたワークロードのクラスタを形成するオフラインクラスタリングと、新たなリクエストをオフライン生成クラスタにオンライン分類する、という2つのフェーズを反復的に実行する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:00:39 GMT)
An Approach to Generate Attack Graphs with a Case Study on Siemens PCS7 Blueprint for Water Treatment Plants [0.7] 本稿では、ICS環境における攻撃グラフ生成のための半自動アプローチを紹介し、多段階攻撃シナリオの可視化と解析を行う。
単一障害点がネットワークセグメンテーションを損なう可能性、重要な脆弱性へのパッチがセキュリティゾーン全体を保護する可能性を示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:06:20 GMT)
Preventing Data Leakage in EEG-Based Survival Prediction: A Two-Stage Embedding and Transformer Framework [0.7] 深層学習モデルは、心停止後のコマトース患者の脳波による予後予測において有望であることが示されている。
しかし、その信頼性はしばしば微妙なデータ漏洩によって損なわれます。
本研究では,多段階脳波モデリングパイプラインにおいて,これまで見過ごされていたデータ漏洩形態を同定する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:28:23 GMT)
From Stateless to Situated: Building a Psychological World for LLM-Based Emotional Support [0.6] 心理的サポートと感情的な共生のシナリオでは、大きな言語モデル(LLM)のコア制限は、局所的な次の次の予測に依存している。
プロセス指向の感情支援における鍵となる課題は、単に自然言語を生成するだけでなく、モデルに対して持続的に改善可能な外部状況構造を構築することであると論じる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:54:24 GMT)
A Gait Foundation Model Predicts Multi-System Health Phenotypes from 3D Skeletal Motion [0.6] ゲイトはますます重要な兆候として認識されるが、現在のアプローチでは、全身的なバイオマーカーではなく、特定の病理の症状として扱われている。
5つの運動課題において,深度カメラで記録された3,414人の深部表現型成人の3次元骨格運動の歩行基礎モデルを構築した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:21:02 GMT)
Optimal pure state cloning and transposition are complementary channels [0.5] 状態のクローニングと状態転移は、望ましいにもかかわらず完全に実現できない基本的な変換である。
両変換の最も物理的に許容される実現は、アイソメトリーによって記述された単一の物理過程から生じることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:32:45 GMT)
Can every set of incompatible measurements lead to genuine multipartite steering? [0.4] 単一の非文字化パーティを持つ任意のマルチパートシナリオにおいて、真のマルチパートのステアリングには、非互換性が不可欠で十分であることを示す。
我々は、複数の非文字化パーティを持つシナリオにおいて、真のマルチパーティ・ステアリングにつながることのない、一連の非互換な測定結果を示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:43:45 GMT)
A Causal Framework for Evaluating ICU Discharge Strategies [0.4] これは3つの挑戦を伴う最適な停止シナリオとして考えられる。
我々はg-formula Pythonパッケージの実装を一般化し、停止戦略を評価するためのフレームワークを提供する。
完全なオープンソースパイプラインでは、パブリックICUデータセットであるMIMIC-IVにこのアプローチを適用します。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:42:36 GMT)
Explainable Speech Emotion Recognition: Weighted Attribute Fairness to Model Demographic Contributions to Social Bias [0.4] 音声感情認識(SER)システムは、メンタルヘルスや教育といった繊細な分野に応用されつつある。
Equalized OddsやDemographic Parityのような伝統的な公正度指標は、しばしば人口統計学的属性とモデル予測の合同依存性を見落としている。
本稿では,階層属性とモデル誤差の結合関係を学習することにより,アロケートバイアスを明示的に捉えたSERのためのフェアネス・モデリング手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:26:40 GMT)
GridVAD: Open-Set Video Anomaly Detection via Spatial Reasoning over Stratified Frame Grids [0.4] VLM(Vision-Language Models)は強力なオープンセット推論器であるが、ビデオ監視における異常検出として直接使用されるのは脆弱である。
問題はVLM自身ではなく、どのように使われているかだ、と我々は主張する。
画素レベルの異常マスクを生成するトレーニングフリーパイプラインであるGridVADにおいて、この提案-代用原理をインスタンス化する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:08:41 GMT)
SafeGuard ASF: SR Agentic Humanoid Robot System for Autonomous Industrial Safety [0.3] 産業環境における自律的危険検知のためのヒューマノイドロボットをデプロイする包括的フレームワークであるSafeGuard ASFを提案する。
本システムは、ReActベースのエージェント推論フレームワークであるマルチモーダル認識(RGB-D画像)を統合し、Unitree G1ヒューマノイドプラットフォーム上での移動ポリシーを学習する。
我々は,シミュレーションと実環境の両方において,自律的なパトロール,視覚的知覚による人間の検出,障害物回避能力の実証を行い,システムの有効性を検証した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:58:44 GMT)
Not a fragment, but the whole: Map-based evaluation of data-driven Fire Danger Index models [0.3] 成長する文献は、機械学習手法を用いて山火事の発生を予測することに重点を置いている。
本研究では,現実世界の意思決定に適合した森林火災予測モデルの評価手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:11:44 GMT)
Process-Aware AI for Rainfall-Runoff Modeling: A Mass-Conserving Neural Framework with Hydrological Process Constraints [0.3] 機械学習モデルは、水文学的な応用において高い予測精度を達成することができるが、しばしば物理的解釈性に欠ける。
MCP(Mass-Conserving Perceptron)は、物理を意識した人工知能フレームワークである。
本研究では, 降雨・流出モデルにおいて, 水文プロセスの物理的意味表現を単一のMSP記憶装置に段階的に組み込むことによって, 予測能力と解釈性が向上するかを考察する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:58:31 GMT)
CLPIPS: A Personalized Metric for AI-Generated Image Similarity [0.3] 我々はCLPIPS(Customized Learned Perceptual Image Patch similarity)を紹介する。
CLPIPSはLPIPSのカスタマイズされた拡張であり、計量の類似性の概念を人間の判断に直接適応させる。
被験者が対象画像とランク生成した出力を、知覚的類似性により反復的に再生する人体データセット上でCLPIPSを評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:23:30 GMT)
Few Shots Text to Image Retrieval: New Benchmarking Dataset and Optimization Methods [0.3] 本稿では、Few-Shot Text-to-Image Retrieval(FSIR)タスクとその付随するベンチマークデータセットFSIR-BDを紹介する。
FSIR-BDには38,353のイメージと303のクエリがあり、82%がテストコーパスで構成されている。
単発または少数発の参照例を利用した2つの新しい検索最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:26:05 GMT)
From Logic Monopoly to Social Contract: Separation of Power and the Institutional Foundations for Autonomous Agent Economies [0.3] 既存のマルチエージェントフレームワークでは、各エージェントが自身のアクションを同時に計画、実行、評価することができる。
この治療法は、個々のモデルの整合性ではなく、エージェントのための社会的契約、すなわち、権力の合憲分離を強制する制度的なインフラである。
本稿では,機能主義社会システムにおける自律的かつ法的に識別可能なビジネスエンティティとしてのエージェント・エンタープライズ・フォー・エンタープライズ・パラダイムを紹介する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:14:48 GMT)
Dissimilarity-Based Persistent Coverage Control of Multi-Robot Systems for Improving Solar Irradiance Prediction Accuracy in Solar Thermal Power Plants [0.3] 本稿では、クリグモデルから導出した相似性マップを導入し、永続的カバレッジ制御アルゴリズムを提案する。
移動ロボットを用いた実験により,提案手法は検討されたベースラインよりも精度の高い予測値を得ることができた。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:59:25 GMT)
A Minimum-Energy Control Approach for Redundant Mobile Manipulators in Physical Human-Robot Interaction Applications [0.3] 本稿では,上面にロボットアームを装着した移動体ベースからなる移動体マニピュレータの制御手法を提案する。
提案手法は, 全身ロボットシステムに格納される全体の運動エネルギーを削減し, システム性能をベンチマーク法と比較して改善することを示した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:01:34 GMT)
Insights on back marking for the automated identification of animals [0.3] ブタのような一様に見える種の個人レベルのモニタリングを支援するためにバックマークを設計する方法は、ほとんど研究されていない。
本研究は,機械学習モデルの解析に基づく効果的なバックマーク設計に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:11:46 GMT)
T Count as a Numerically Solvable Minimization Problem [0.3] 連続最小化問題列上の二項探索として与えられたユニタリを実装した最小のT-Count回路を求める問題を定式化する。
我々は、少数の量子ビットを持つ回路の合成において最もよく知られた結果を再現し、この方法で解決できる最大の回路の境界を押し上げる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:15:52 GMT)
Deep Learning Aided Vision System for Planetary Rovers [0.2] 本研究では、リアルタイム認識とオフライン地形再構成を組み合わせた惑星探査機の視覚システムを提案する。
リアルタイムモジュールは、CLAHE強化ステレオ画像、YOLOv11nに基づくオブジェクト検出、および物体距離を推定するニューラルネットワークを統合する。
このアーキテクチャは、自律的な惑星探査のためのスケーラブルで計算効率の良いビジョンソリューションを提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:34:14 GMT)
Decoding Defensive Coverage Responsibilities in American Football Using Factorized Attention Based Transformer Models [0.2] 本稿では,NFLマルチエージェントプレイトラッキングデータに適用した因子化アテンションベーストランスフォーマモデルを提案する。
本モデルにより,各プレイヤの代入とマッチアップのダイナミクスの予測モデリングが可能となる。
我々のモデルは全てのタスクに対して約89%以上の精度を達成し、真の精度は基底真理ラベルにおけるアノテーションの曖昧さを考慮に入れられる可能性がある。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:43:30 GMT)
Improving Infinitely Deep Bayesian Neural Networks with Nesterov's Accelerated Gradient Method [0.2] ネステロフ加速勾配(NAG)拡張SDE-BNNモデルを提案する。
本手法は, トレーニングとテストの双方において, 収束を加速し, NFEを著しく低減する。
我々のモデルは、画像分類やシーケンスモデリング、低いNFEの実現、予測精度の向上など、従来のSDE-BNNよりも一貫して優れている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:42:27 GMT)
Methods for Knowledge Graph Construction from Text Collections: Development and Applications [0.2] あらゆる領域にまたがるデータの量と多様性は、前例のない機会と、実行可能な知識を抽出するための課題を生み出している。
リッチなセマンティック知識の抽出は、テキストジャンルやスキーマ仕様にまたがるスケーラブルで柔軟な自動メソッドの展開を必要とする。
本稿では,セマンティックWebのベストプラクティスを活用した自然言語処理,機械学習,生成AIの手法を,大規模テキストコーパスから知識グラフの自動構築に適用する実験を行った。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:36:00 GMT)
Toward Actionable Digital Twins for Radiation-Based Imaging and Therapy: Mathematical Formulation, Modular Workflow, and an OpenKBP-Based Dose-Surrogate Prototype [0.2] 放射線ベースの画像と治療のためのデジタル双生児は、患者データを同化し、予測の不確実性を定量化し、臨床的に制約された決定をサポートするのに有用である。
本稿では,Openkbpfullベンチマークを用いた放射線画像・治療における動作可能なデジタル双生児のためのモジュラーフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:37:18 GMT)
AVDA: Autonomous Vibe Detection Authoring for Cybersecurity [0.2] セキュリティテレメトリから悪意のあるアクティビティを識別する実行可能なロジックを作成する検出オーサリングは、断片的なコードによって妨げられる。
AVDAは、モデルコンテキストプロトコル(MCP)を活用して、組織コンテキストの統合による検出を自動化するフレームワークである。
Baseline、Sequential、Agenticの3つのオーサリング戦略を、さまざまなプロダクション検出コーパスで評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:52:33 GMT)
Robust continuous-variable multipartite entanglement in circular arrays of nonlinear waveguides [0.2] 本稿では,2次非線形導波路の円形配列における多部交絡生成プロトコルを提案する。
我々は、伝播方程式の導出と解析解が可能である状態の同定を含む厳密な理論的枠組みを提供する。
本手法は, 位相整合伝播固有モードに依存するため, 試料長, 結合, 非線形性の変動に耐性があるため, 本質的に堅牢である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:27:01 GMT)
EcoThink: A Green Adaptive Inference Framework for Sustainable and Accessible Agents [0.1] EcoThinkは、高性能AIインテリジェンスと環境責任を調整します。
統計的に有意な性能損失を伴わずに、推論エネルギーを平均で40.4%削減する。
アルゴリズム廃棄物を緩和することにより、EcoThinkは持続可能な、包括的でエネルギー効率の良い生成AIエージェントへのスケーラブルなパスを提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:37:46 GMT)
An Explainable Ensemble Learning Framework for Crop Classification with Optimized Feature Pyramids and Deep Networks [0.1] 農業は気候変動、土壌の劣化、資源の枯渇によってますます困難になっている。
この研究は、最適化された特徴ピラミッド、深いネットワーク、自己認識機構、残余ネットワークを融合させる説明可能なアンサンブル学習パラダイムを示す。
このパラダイムは、複雑なMLモデルと実行可能な農業意思決定のギャップに対処し、持続可能性を促進し、AIによる推奨を信頼する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 06:13:34 GMT)
A Dipolar Chiral Spin Liquid on the Breathed Kagome Lattice [0.1] 呼吸カゴメ格子上の長距離双極子反強磁性相互作用を利用して、キラルスピン液体を安定化することができる。
我々は,Rydberg原子と超低温極性分子アレイの両方におけるキラルエッジモードの直接的,実験的に実現可能な測定法を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:00:00 GMT)
Mass-correction-induced enhancement of quantum correlations even beyond entanglement in the $e^{+}e^{-} \rightarrow J/ψ\rightarrow Λ(pπ^{-}) \barΛ(\bar{p}π^{+})$ process at the BESIII experiment under memory effects [0.1] 本研究は, BESIII における J/rightarrow (p-) bar(barp+)$ プロセスの2部密度行列を導出する。
我々は,質量補正とメモリ効果が,絡み合いを超えても量子相関に与える影響を評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:00:14 GMT)
Evaluating Small Language Models for Front-Door Routing: A Harmonized Benchmark and Synthetic-Traffic Experiment [0.1] 小型言語モデル(SLM)は、サブ秒、ゼロマージナルコスト、セルフホストタスクの分類に十分な推論能力を持つ。
Study 1はPhi-3.5-mini、Qwen2.5-1.5B、Qwen-2.5-3Bを同一のAzure T4ハードウェア、サービススタック、量子化、固定60ケースコーパスで同期したオフラインベンチマークである。
研究2は、合成トラフィック下で事前登録された4本腕ランダム化実験であり、有効サンプルサイズは腕あたり60ケースである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:57:46 GMT)
A Mentalistic Interface for Probing Folk-Psychological Attribution to Non-Humanoid Robots [0.0] 本稿では,非ヒューマノイドロボットに対する意図的状態帰属研究のための実験プラットフォームを提案する。
このシステムは、シミュレーションロボット、現実的なタスク環境、および大規模言語モデルに基づく説明層を組み合わせる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:59:05 GMT)
zk-X509: Privacy-Preserving On-Chain Identity from Legacy PKI via Zero-Knowledge Proofs [0.0] zk-X509は、RISC-Vゼロ知識仮想マシン(zkVM)を介して公開台帳を持つプライバシー保護IDシステムである。
ユーザーは、秘密鍵や個人認証を公表することなく、標準的なX.509証明書の所有権を証明できる。
このシステムはECDSA P-256の11.8Mサイクル(17.4MはRSA-2048)を達成する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:55:26 GMT)
Wireless bioelectronics for untethered biohybrid robots [0.0] バイオハイブリッドロボットは生体組織と人工組織を統合し、生物に触発された運動と行動を達成する。
本稿では, バイオハイブリッドロボットの制御戦略, 無線電気刺激, 無線光刺激, 神経筋統合の進歩について概説する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:53:27 GMT)
Why Safety Probes Catch Liars But Miss Fanatics [0.0] 彼らの有害な行動は、戦略的に隠すのではなく、無害であると信じているモデルでは、プローブは失敗する。
同一の手順で2つのモデルを訓練することで,この現象が簡単なタスクで現れることを示す。
我々は、この創発的プローブ侵入(Emergent Probe Evasion: training with belief-consistent reasonings modelss models from a detectable "deceptive" regime to an unectable "coherent" regime。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:34:58 GMT)
Vision Transformers and Graph Neural Networks for Charged Particle Tracking in the ATLAS Muon Spectrometer [0.0] ミューオンのような荷電粒子の同定と再構成は、ATLAS実験の物理プログラムにおいて大きな課題である。
この問題に対して,機械学習に基づく2つのアプローチを提案する。
まず,非MLベースライン再構成チェーンに統合されたグラフニューラルネットワークを用いて,ムーン分光計の背景ヒット拒絶問題に対処する。
第2に、最先端のVision Transformerアーキテクチャを用いた、エンドツーエンドのミューオントラッキングに関する概念実証を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:00:45 GMT)
Two-Gate Extensions of Free Axis and Free Quaternion Selection for Sequential Optimization of Parameterized Quantum Circuits [0.0] 逐次単一ビットフラックスと自由四元数選択の2ゲート拡張を提案する。
TGFとTGFQSの無作為かつ半シフトのゲートペアリング戦略は、多くのテスト済み設定において最適であることがわかった。
これらの改善は、ゲート更新毎に回路評価が向上し、局所最適化のパワーと測定オーバーヘッドのトレードオフが強調される。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:06:11 GMT)
Toward domain-specific machine translation and quality estimation systems [0.0] 機械翻訳(MT)と品質推定(QE)は、一般的なドメインではよく機能するが、ドメインミスマッチでは劣化する。
この論文は、データ中心のコントリビューションセットを通じて、MTおよびQEシステムを特殊なドメインに適応する方法を研究する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:47:40 GMT)
To Write or to Automate Linguistic Prompts, That Is the Question [0.0] 自動プロンプト最適化が言語タスクにおける専門家のプロンプト工学に取って代わるかどうかを評価する。
本報告では,手作りゼロショットプロンプト,ベースDSPシグネチャ,GEPA最適化DSPシグネチャの翻訳,用語挿入,言語品質評価を初めて体系的に比較した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:42:06 GMT)
The System Prompt Is the Attack Surface: How LLM Agent Configuration Shapes Security and Creates Exploitable Vulnerabilities [0.0] PhishNChipsは、10の迅速な戦略に基づく11のモデルの研究である。
単一モデルのフィッシングバイパス速度は、設定方法によって1%未満から97%の範囲である。
高い予測信号に関するプロンプトの最適化により,ベンチマーク性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:48:37 GMT)
The Specification as Quality Gate: Three Hypotheses on AI-Assisted Code Review [0.0] AIが生成するコード品質の問題に対する業界の主要な反応は、AIレビュアーをデプロイすることだ。
本稿では,実行可能な仕様が存在しない場合,この応答は構造的に円形であると主張している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:59:05 GMT)
The Kitchen Loop: User-Spec-Driven Development for a Self-Evolving Codebase [0.0] 統合信頼モデル上に構築された自律的自己進化型ソフトウェアのためのフレームワークであるKitchen Loopを紹介します。
285以上のイテレーションで2つのプロダクションシステムにまたがって検証を行い、レグレッションオラクルによって検出されたゼロレグレッションで1,094以上のマージプルリクエストを生成しました。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:45:00 GMT)
The HyperFrog Cryptosystem: High-Genus Voxel Topology as a Trapdoor for Post-Quantum KEMs [0.0] HyperFrogは、Learning With Errors (LWE)デザインスペースの変種を探索する実験的な量子後キーカプセル化メカニズムである。
このスキームは3次元にボクセル格子を埋め込み、トポロジー採掘法を用いて連結部分グラフを探索する。
得られた構造はスパース二項秘密ベクトルとして符号化され、秘密分布に強い幾何学的制約が生じる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:43:58 GMT)
The Competence Shadow: Theory and Bounds of AI Assistance in Safety Engineering [0.0] 本稿では,安全分析におけるAI支援の形式的枠組みを開発する。
まず,安全工学がベンチマークによる評価に抵抗する理由を明らかにする。
本稿では,AIによる安全分析によって引き起こされる人間の推論の体系的絞り込みについて紹介する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:04:48 GMT)
The 27-qubit Counterexample to the LU-LC Conjecture is Minimal [0.0] LU同値であるがLC同値ではない27量子グラフのペアが発見されたことを証明した。
最大26キュービットのグラフ状態に対しては、LU同値とLC同値の概念が一致する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:18:10 GMT)
Tensor network methods for bound electron-hole complexes beyond strong and weak confinement in nanoplatelets [0.0] 半導体ナノ構造において、光励起は励起子、トリオン、およびより大きな錯体のような有界な電子-ホール状態を生成する。
ナノプレートは2つの状態の間に存在し、不定形高次元シュルディンガー方程式を解く必要がある。
この研究は、CdSeナノプレートレットを例として用いて、テンソルネットワークがこの問題を部分的に克服できることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:37:21 GMT)
Symplectic Split-Operator Propagators from Tridiagonalized Multi-Mode Bosonic Hilbert Spaces for Bose-Hubbard Hamiltonians [0.0] ボソニック・マルチモードシステムの2つのファミリーをトリディアゴナライズする。
ボソニック・マルチモードシステムの2つのファミリーをトリディアゴナライズする方法を示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:51:03 GMT)
Superconducting Parallel-Plate Resonators for the Detection of Single Electron Spins [0.0] 単一電子スピンへの高結合強度に最適化されたサブオームインピーダンスを持つ多層超伝導マイクロ波共振器
設計は磁場を最小化し、従ってパーセル係数を$F_P > 1015$とする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:01:01 GMT)
Structured-Light Magnetometry in a Coherently Controlled Atomic Medium [0.0] 構造光を用いた磁気光学回転検出手法を提案する。
本手法は,従来の偏光磁気計をトポロジに基づく空間的読み出しに変換する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:28:08 GMT)
Speech-Synchronized Whiteboard Generation via VLM-Driven Structured Drawing Representations [0.0] ナレーション音声を用いた24組のExcalidrawデモの最初のデータセットを提示する。
各描画要素は8STEMドメインにまたがるミリ秒精度の生成タイムスタンプを格納する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:56:56 GMT)
Sparse-by-Design Cross-Modality Prediction: L0-Gated Representations for Reliable and Efficient Learning [0.0] 統一されたスペーシフィケーションプリミティブは、モダリティに匹敵する精度と効率のトレードオフをもたらす。
学習表現に直接L0スタイルのスパーシリティを強制するモダリティ非依存的かつ機能的にハードコンクリートなゲーティングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 03:33:42 GMT)
Sparse Weak-Form Discovery of Stochastic Generators [0.0] 提案フレームワークは,SDE識別問題を2つのSINDyベース線形スパース識別問題に変換する。
このアルゴリズムを3つのSDE上で検証し、4%未満の係数誤差を持つ全ての非線形項を復元する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:51:37 GMT)
Sovereign AI at the Front Door of Care: A Physically Unidirectional Architecture for Secure Clinical Intelligence [0.0] 本稿では、デバイス上ですべての推論を行い、インバウンドデータを物理的に一方向のチャネルを介して配信する、臨床トリアージのためのソブリンAIアーキテクチャを提案する。
この研究は、医療の前面ドアに、主権的、デバイス上の臨床知能のためのプリミティブとして、物理的に一方向のチャネルを位置づけている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:24:55 GMT)
Sharp Concentration Inequalities: Phase Transition and Mixing of Orlicz Tails with Variance [0.0] Weibull 以下の確率変数に対する急激な集中不等式の開発方法について検討する。
確率変数は準ガウス的ではないかもしれないが、原点周辺の尾確率は準ガウス的であるかのように振る舞う。
我々の理論は、準ガウス分布や準指数分布の場合においても、新しい改良された濃度不等式をもたらす。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:02:49 GMT)
Separate Before You Compress: The WWHO Tokenization Architecture [0.0] 現在のLarge Language Models (LLM) は、主にBPE(Byte Pair Linguist)ベースのトークンライザを使用している。
WWHO(Where-What-How)とSGPE(Syllable Grapheme Pair Linguist)というアルゴリズムを提案する。
Sinhala と Devanagari (Hindi/Sanskrit) を非常に複雑な Abugida スクリプトとして使用し、クリーン化された30万文データセットで WWHO をトレーニングし、1,499,950文のテストセットで評価した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:56:48 GMT)
Self-Organized Optical Pathways in Optofluidic Photonic Crystals [0.0] 2次元シリコンフォトニック結晶導波路における光流体再構成をシミュレートする。
反伝播源間の振幅競合は強い単調経路ステアリングを生み出す。
バイオインスパイアされたオプトフルイドフォトニクスの物理的限界を同定した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:13:06 GMT)
Scalable topological quantum computing based on Sine-Cosine chain models [0.0] 本研究では,Matryoshka型Sine-Cosine鎖を用いたトポロジカル量子コンピューティングのためのスケーラブルなフレームワークを提案する。
ゲート演算のためのY接合ブレイディングプロトコルや,複数のキュービットを同時に格納可能な拡張メモリアーキテクチャにおいて,これらのチェーンがどのように使用できるかを説明する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:46:37 GMT)
Scalable Qauntum Interference from Indistinguishable Quantum Dots [0.0] 同一チップ上の複数の識別不能量子ドットからのスケーラブルな干渉を可能にするウェーブフロント整形手法を提案する。
2つから5つの区別不可能なエミッタをスケーリングし、協調放出現象と香港・ウー・マンデル2光子干渉による干渉を検証した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:35:17 GMT)
SHAPR: Operationalising Human-AI Collaborative Research Through Structured Knowledge Generation [0.0] SHAPRは、人間中心の意思決定とAI支援機能を統合する研究ソフトウェア開発のためのフレームワークである。
本稿では,AIを活用した研究実践における構造的,トレース可能,知識生成的アプローチとしての運用に焦点を当てる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:14:39 GMT)
SAHMM-VAE: A Source-Wise Adaptive Hidden Markov Prior Variational Autoencoder for Unsupervised Blind Source Separation [0.0] SAHMM-VAEは、教師なしブラインドソース分離のための変分自動エンコーダである。
我々は1つの共通フレームワーク内に3つの分岐を開発する: ガウス放出HMM前、マルコフスイッチング自己回帰HMM前、および状態ワイド自己回帰フロー変換によるHMM状態フロー前、である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:08:16 GMT)
Revealing the influence of participant failures on model quality in cross-silo Federated Learning [0.0] Federated Learning(FL)は、機械学習(ML)モデルを協調的にトレーニングするためのパラダイムである。
本稿では,欠席者がFL成績に及ぼす影響について検討する。
データスキューネス、異なるアベイラビリティパターン、モデルアーキテクチャなどの影響要因を考慮に入れます。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:28:40 GMT)
Retraining as Approximate Bayesian Inference [0.0] ハリソン・カッツ(Harrison Katz)は、再訓練は計算制約の下で近似ベイズ推論としてよりよく理解できると主張している。
この記事では、Katz氏がポリシーの再トレーニングのための決定論的フレームワークを提供する。
その結果はエビデンスベースのトリガで、カレンダーのスケジュールを置き換え、ガバナンスを監査可能にする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:20:01 GMT)
Resurgence Theory and Holomorphic Quantum Mechanics [0.0] 正則量子力学における復活プログラムについて検討する。
最初の7つのエネルギーレベルを結合$g$で6階まで計算する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:54:07 GMT)
Quantum Finite Temperature Lanczos Method [0.0] 有限温度ランツォス法を量子コンピュータに拡張する量子有限温度ランツォス法(QFTLM)を提案する。
その結果,QFTLMは広い温度範囲で熱観測装置を再現できることが判明した。
我々は,Krylov次元,トレース推定状態数,トロッター誤差の影響を解析し,雑音条件下でのロバスト性には適切な正則化が不可欠であることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:40:02 GMT)
Quantum Advantage: a Tensor Network Perspective [0.0] 我々はIBM、D-Wave、Googleによる最近の量子アドバンテージ実験についてレビューする。
我々の目標は、これらの結果が次世代の量子優位実験にどのような意味を持つのかを明らかにすることである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:23:09 GMT)
Puiseux series about exceptional singularities dictated by symmetry-allowed Hessenberg forms of perturbation matrices [0.0] 非エルミート的 (NH) システムにおいて、$nrm th$ Order (EP$_n$s) の例外点の性質を決定するための枠組みを開発する。
直交摂動は,方向依存型EPセンサの設計に影響を及ぼすため,先行方向の分岐点をより特異な分割に抑えることができることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:21:06 GMT)
Prompt Attack Detection with LLM-as-a-Judge and Mixture-of-Models [0.0] プロンプト攻撃は、大規模言語モデルシステムに重大なセキュリティリスクをもたらす。
運用においては、ガードレールは厳格な低遅延制約の下でこれらの攻撃を軽減する必要がある。
本研究では, LLM がライブガードレールの有効低遅延判定に有効であることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:47:53 GMT)
Probabilistic Geometric Alignment via Bayesian Latent Transport for Domain-Adaptive Foundation Models [0.0] 大規模なファンデーションモデルを、監督が限定された新しいドメインに適応させることは、依然として根本的な課題である。
本稿では、幾何学的アライメント問題としてドメイン適応を定式化する不確実性を考慮した確率的潜在輸送フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:49:59 GMT)
Prediction of new superconducting bilayers heterostructures using quantum confinement and proximity effects [0.0] 量子閉じ込めと近接結合は超伝導臨界温度を大幅に高めることを示す。
結果は、金属ヘテロ構造における創発的超伝導への有望な経路として量子濃縮二層膜を同定した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:00:15 GMT)
Optimal measurement-based quantum thermal machines in a finite-size system [0.0] 本稿では、一般化された量子計測から作業を抽出する、測定に基づく量子熱マシンを提案する。
作業媒体としてのIsing-likeインタラクションを結合した3ストローク計測ベースエンジンサイクルの普遍的最適化基準を導出する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:51:16 GMT)
Once-for-All Channel Mixers (HYPERTINYPW): Generative Compression for TinyML [0.0] 提案するHYPER-TINYPWは圧縮・アズ・ジェネレーション方式で、ほとんどのPW重みを生成された重みに置き換える。
共有マイクロMLPは、レイヤごとの小さなコードからロード時に一度PWカーネルを合成し、それらをキャッシュし、標準的な整数演算子で実行する。
商用のMCUランタイムを保存し、ワンオフでのみ追加する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 01:08:52 GMT)
On the integrability structure of the deformed rule-54 reversible cellular automaton [0.0] 1+1次元格子上でのセルオートマトンRCA54の量子および変形について検討した。
離散時間進化演算子と通信する最短範囲の非保存電荷は、6つの連続した部位で支持される密度を持つことを示す。
モデル設定における可積分性や正解性を検出するための簡単な経験的複雑性を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:15:33 GMT)
On the Foundations of Trustworthy Artificial Intelligence [0.0] プラットフォーム決定論的推論は信頼に値するAIにとって必要で十分であることを示す。
我々はこれを決定論として定式化し、非決定論のコストを定量化するために信頼エントロピーを導入する。
私たちのシステムは、3つの大陸にまたがって展開された99,000行のRustで、AI信頼が算術的な問題であることを証明しています。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:37:14 GMT)
On the Expressive Power of Contextual Relations in Transformers [0.0] 本稿では,テキストを意味的埋め込み空間上の確率測度としてモデル化し,単語間の文脈関係をそれらの間の結合測度として表現する文脈表現のための測度理論フレームワークを提案する。
確率測度間の連続結合関数は、意味的関係結合測度を符号化し、適切なパラメータを持つシンクホーン変換器によって一様近似することができる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:30:36 GMT)
On Integrating Resilience and Human Oversight into LLM-Assisted Modeling Workflows for Digital Twins [0.0] ディジタルツインにレジリエンスと監視を統合するための重要な設計原則を3つ提示する。
重要な貢献は、様々な詳細と複雑さのモデル記述にまたがるLCMによるエラーの詳細な評価である。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:38:03 GMT)
Offline Decision Transformers for Neural Combinatorial Optimization: Surpassing Heuristics on the Traveling Salesman Problem [0.0] Neural Combinatorial Optimizationは有望だが、オンライン強化学習のハッパーの展開に依存しており、何十年ものアルゴリズムの知識を過小評価している。
オフラインのRLフレームワークであるDecision Transformerを適用して、データセットから直接優れた戦略を学習することで、これらの制限に対処する。
提案手法は,従来の4つのツアーよりも高品質なツアーを連続的に生成し,既存のドメイン知識に埋め込まれたパフォーマンスを超えるオフラインRLの可能性を示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:47:22 GMT)
Nonperturbative Resummation of Divergent Time-Local Generators [0.0] 開量子系の時間局所生成器と整合した非摂動写像を構成する。
弱い結合のないスピン-ボソンモデルに対して、この構成は、非摂動的にTCL生成子を再仮定する明示的な動的写像を与える。
その結果、分散時間局所発生器から還元力学を再構築するための非摂動的枠組みが確立された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:46:47 GMT)
Non-linear Sigma Model for the Surface Code with Coherent Errors [0.0] 単一ビットのユニタリ回転が存在する場合の2乗格子面符号の最大形復号化について検討する。
我々は、この復号問題の有効長距離理論として、ターゲット空間$mathrmSO (2n)/mathrmU(n)$の非線形シグマモデルを顕微鏡的に導出した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:19:08 GMT)
Negative energies and the breakdown of bulk geometry [0.0] 非摂動効果は、従来予想されていたよりもはるかに小さな長さスケールで半古典的記述を無効化できることを示す。
結果は、有効な重力理論を分解するための新しいメカニズムを提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:00:00 GMT)
Navigating the Prompt Space: Improving LLM Classification of Social Science Texts Through Prompt Engineering [0.0] 社会科学におけるLarge Language Models (LLMs) を用いたテキスト分類の最近の進歩は,コストを大幅に削減できることを示唆している。
現在のテストでは、パフォーマンスが広範囲に分散しているため、パフォーマンスを最大化する方法という問題に移行します。
本稿では,プロンプトエンジニアリングの3つの側面を体系的に変化させることにより,精度を高めるための可能な経路として,プロンプトコンテキストに焦点をあてる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:14:48 GMT)
Modular Theory and the Bell-CHSH inequality in relativistic scalar Quantum Field Theory [0.0] 我々はベル-CHSHの不等式違反は、ベルの演算子の異なる選択に対して起こりうると主張している。
また、ツィレルソン境界の飽和に向けての可能な経路を概説する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:59:52 GMT)
MemGuard-Alpha: Detecting and Filtering Memorization-Contaminated Signals in LLM-Based Financial Forecasting via Membership Inference and Cross-Model Disagreement [0.0] 大規模言語モデル (LLM) は、金融アルファ信号を生成するためにますます使われている。
証拠は、LLMがトレーニングコーパスから歴史的財務データを記憶し、急激な予測精度を生み出していることを示している。
既存の方法では、リアルタイム取引のための実用的なゼロコスト信号レベルフィルタリングが提供されない。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:35:25 GMT)
Mechanistically Interpreting Compression in Vision-Language Models [0.0] 代表的な視覚言語モデルにおいて,プルーニングと量子化が内部をどのように根本的に変えるかを検討する。
以上の結果から,プルーニングは真の拒絶行動の急激な低下を招き,圧縮の選択が安全性に影響を及ぼすことが示唆された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 05:10:32 GMT)
Measuring What Matters -- or What's Convenient?: Robustness of LLM-Based Scoring Systems to Construct-Irrelevant Factors [0.0] 本研究では, 2重構造LPMに基づくスコアリングシステムにおける構成非関連因子の影響について検討する。
スコアリングシステムは,無意味な文章で回答をパディングし,スペルの誤りを指摘し,難解な文章を書けるのが一般的であった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:29:20 GMT)
Man and machine: artificial intelligence and judicial decision making [0.0] 我々は、司法決定におけるAIの役割の3つの側面を結合した総合的なレビューを行う。
AI意思決定支援ツールが裁判前および判決決定に与える影響は、控えめか、あるいは存在しない。
我々は、AIと対人比較は、アルゴリズムツールと人間の意思決定者の両方に新たな洞察をもたらす可能性があると論じている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 10:56:37 GMT)
MAGNET: Autonomous Expert Model Generation via Decentralized Autoresearch and BitNet Training [0.0] 本稿では,コモディティハードウェアにおけるドメインエキスパート言語モデルの自律生成,トレーニング,提供のための分散システムを提案する。
自動検索,BitNet b1.583次トレーニング,DiLoCo分散マージ,およびHOOTi EVMチェーン上でのオンチェーンコントリビューショントラッキングを統合した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:21:57 GMT)
Learning When to Act: Interval-Aware Reinforcement Learning with Predictive Temporal Structure [0.0] 本稿では,経験から認知的ティッチ間の最適間隔を学習する,軽量な時間制御システムを提案する。
また、選択した待ち時間に対する非効率性を明示するインターバルアウェア報酬を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:30:24 GMT)
Lattice and PT symmetries in tensor-network renormalization group: a case study of a hard-square lattice gas model [0.0] 格子対称性とPT対称性をTNRGに2次元(2D)に組み込む方法を示す。
我々は、これらの対称性を粗粒度テンソルネットワークで適切に定義し、これらの対称性を組み込んだTNRGスキームを提案する。
モデルの2つの相転移の臨界パラメータとスケーリング次元を推定し,提案手法の有効性を示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:30:38 GMT)
Krylov-space anatomy and spread complexity of a disordered quantum spin chain [0.0] 長時間のクリロフ拡散の複雑さが2つの相を区別していることが示される。
エルゴード相では、無限時間複雑性はフォック空間次元と線形にスケールする。
対照的に、MBL相ではサブ線形に成長し、長期状態が鎖の消失分数のみを占めることを意味する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:58:18 GMT)
Kardashev scale Quantum Computing for Bitcoin Mining [0.0] Bitcoinはすでに、楕円曲線署名に対するShor攻撃による量子的脅威に直面している。
本稿では、公共の議論がしばしば混ざり合う他のコンポーネントであるマイニングを分離する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:53:46 GMT)
Integrated Multi-Drone Task Allocation, Sequencing, and Optimal Trajectory Generation in Obstacle-Rich 3D Environments [0.0] IMD-TAPP(Integrated Multi-Drone Task Allocation and Path Planning)は,多ゴールアロケーション,ツアーシークエンシング,および障害物の多い空間で動作する四角形チームのための安全な軌道生成を行うエンドツーエンドのフレームワークである。
複数の目標を達成する2つのドローンによる代表的なケーススタディでは、提案手法は実行中に必要な安全制約を維持しながら、最低ミッション時間は136秒に達する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:46:26 GMT)
In-Context Molecular Property Prediction with LLMs: A Blinding Study on Memorization and Knowledge Conflicts [0.0] 本稿では,大規模言語モデル (LLM) が分子特性に対して真に文脈内回帰を行うか否かを考察する。
学習前知識と文脈内情報との相互作用を、段階的に目が見えない一連の実験を通して分析する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:27:30 GMT)
Improving Fine-Grained Rice Leaf Disease Detection via Angular-Compactness Dual Loss Learning [0.0] 米葉病の早期発見は、大規模な収穫損失のリスクを著しく減少させる可能性がある。
そこで本研究では,Center LossとArcFace Lossを併用して,イネ葉病の微粒化を図った二重ロスフレームワークを提案する。
評価は99.6%,99.2%,99.2%であった。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:07:08 GMT)
Implicit neural representations for larval zebrafish brain microscopy: a reproducible benchmark on the MapZebrain atlas [0.0] Inlicit Neural representations (INR)は、アトラス登録、相互モダリティ再サンプリング、スパースビュー補完、データのコンパクト共有のための連続的な座標ベースの符号化を提供する。
本研究はマゼブライン幼生ゼブラフィッシュ脳アトラスに対する再現可能なINRベンチマークである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:44:07 GMT)
Implementing Bell causality in Quantum Sequential Growth [0.0] QBC に対する作用素順序付けの2つの最も自然な選択に対して、遷移作用素代数は可換環に還元されることを示す。
我々の研究は、QSGの非可換実現に向けた第一歩と見なすことができる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:41:23 GMT)
Imperative Interference: Social Register Shapes Instruction Topology in Large Language Models [0.0] システムは、英語で協力する命令をスペイン語で、同じ意味的内容で競合するが、反対の相互作用トポロジーで競合する。
この逆転は社会登録によって引き起こされることを示す。
命令的ムードで書かれた立憲AIの原則は、言語に依存したアライメントを生み出す可能性がある。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:25:14 GMT)
How Pruning Reshapes Features: Sparse Autoencoder Analysis of Weight-Pruned Language Models [0.0] 本稿では,非構造化プルーニングが言語モデルの特徴幾何にどう影響するかについて,最初の体系的研究を行う。
種子の安定性,特徴生存性,SAE伝達性,特徴脆弱性,因果関係に関する5つの研究課題について検討した。
我々の最も顕著な発見は、希少なSAE機能 ― 発射率の低い ― が、頻繁なプルーニングよりもはるかに優れていることです。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:12:42 GMT)
Good Scores, Bad Data: A Metric for Multimodal Coherence [0.0] 下流モデルに依存しない核融合品質を評価する指標であるMultimodal Coherence Score(MCS)を紹介する。
我々は,DETR,CLIP,VLTを用いて1000個のビジュアルゲノム画像を評価し,再トレーニングなしで150個のCOCO画像を検証した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:30:34 GMT)
Geometric Curvature Governs Work in Open Quantum Steady States [0.0] 開量子定常状態における準静的な作用は、創発的な幾何学的曲率によって支配されることを示す。
駆動散逸性2レベルシステムに対して、循環過程において生じる作業の曲率を決定する作業1-形式を構築する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:08:08 GMT)
Gaussian Joint Embeddings For Self-Supervised Representation Learning [0.0] 自己パラメトリック表現学習は、しばしば決定論的予測アーキテクチャに頼り、潜在空間におけるコンテキストとターゲットビューを整列させる。
生成的関節モデルに基づく確率的代替案を提案する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:54:54 GMT)
Gap Safe Screening Rules for Fast Training of Robust Support Vector Machines under Feature Noise [0.0] 最適解に影響を与えることなく、トレーニングの複雑さを軽減できるR-SVMの安全なサンプルスクリーニングルールを開発する。
提案手法は,境界超平面の両側に不確実集合が完全に配置されることが保証されたトレーニングサンプルを安全に同定する。
実験により,提案手法は分類精度を保ちながらトレーニング時間を著しく短縮することを示した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 09:19:09 GMT)
From Complementarity to Quantum Properties: An Operational Reconstructive Approach [0.0] 量子理論は、物理世界の現在の状態の正確な可知性の双対デシデラタの整合性に疑問を呈する。
我々は、この本質的な緊張に対応する量子特性の明示的なモデルを開発する。
この量子特性モデルは、ゼノの運動パラドックスの自然な解法を提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:07:57 GMT)
Few TensoRF: Enhance the Few-shot on Tensorial Radiance Fields [0.0] Few TensoRFはFreeNeRFの周波数駆動数ショット正規化とテンソルベース表現を組み合わせた3D再構成フレームワークである。
この方法は、スパース入力ビュー下での安定性と復元品質を向上させる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:10:20 GMT)
Extreme (Rogue) Waves: From Theory to Experiments in Ultracold Gases and Beyond [0.0] ローグ波 (Rogue wave, RWs) と呼ばれる極端非線形波動現象は、超低温の量子気体の単一成分相互作用と2成分反発混合の両方で研究される。
我々の展示は、極端に非線形な事象を制御し、予測するための多目的プラットフォームとして、超低温の原子ガスを展示することを目的としている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:56:35 GMT)
Evidence of Layered Positional and Directional Constraints in the Voynich Manuscript: Implications for Cipher-Like Structure [0.0] 本稿では,Voynich Manuscript(VMS)の体系的解析について述べる。
VMSは、単純な位置や周波数に基づくメカニズムだけでは再現が難しい暗号のような構造的制約を示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 14:01:19 GMT)
Error Understanding in Program Code With LLM-DL for Multi-label Classification [0.0] 大規模言語モデル(LLM)は、自然言語の理解と生成タスクにおいて顕著な能力を示している。
本研究では,微調整 LLM を利用したソースコードの多ラベル誤り分類フレームワークを提案する。
この作業は、自動化されたコードフィードバックのためのインテリジェントでスケーラブルなツール開発の基礎を築いた。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:05:42 GMT)
Epistemic Compression: The Case for Deliberate Ignorance in High-Stakes AI [0.0] エピステミック圧縮(Epistemic Compression)とは、モデルの複雑さをスケーリングパラメータではなく、データのシェルフライフに一致させることから生じる原則である。
ホック後の重みを罰する古典的な正規化とは異なり、エピステミック圧縮は建築を通してパシモニーを強制する。
15のハイテイクドメインの探索的な合成において、86.7%のケースにおいて、この指標は経験的に優れたモデリング戦略と一致した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:55:16 GMT)
Epileptic Seizure Prediction Using Patient-Adaptive Transformer Networks [0.0] 本稿では,短時間の発作予測のための患者適応型トランスフォーマーフレームワークを提案する。
提案手法には2段階のトレーニング戦略が採用されている: 自己教師型プレトレーニングは、まず一般的な脳波の時間的表現を学習するために使用される。
変換器に基づくシーケンス学習を実現するために、ノイズ認識前処理を用いてマルチチャネル脳波信号を処理する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 23:48:10 GMT)
Dynamic LIBRAS Gesture Recognition via CNN over Spatiotemporal Matrix Representation [0.0] 本稿では,メディアパイプハンドラと畳み込みニューラルネットワーク(CNN)の2つのモデルの構成に基づく動的手動作認識手法を提案する。
本手法は、ホームオートメーションシステムにおけるデバイス制御のためのRASLIB(Brazilian Sign Language)ジェスチャの認識に適用され、静的および動的ジェスチャの11クラスをカバーする。
低照度条件では95%の精度で、通常の照明では92%の精度で測定された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 19:37:28 GMT)
Does Structured Intent Representation Generalize? A Cross-Language, Cross-Model Empirical Study of 5W3H Prompting [0.0] 人-AIインタラクションにおける構造化意図表現のための 5W3H ベースのフレームワーク PPS について検討した。
AIによって拡張された5W3Hプロンプトは、手作業による5W3Hプロンプトと、ゴールアライメントの統計的に有意な差は示さない。
また、非構造的プロンプトは系統的な二重インフレーションバイアスを示すことを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:29:42 GMT)
Doctorina MedBench: End-to-End Evaluation of Agent-Based Medical AI [0.0] Doctorina MedBenchは、現実的な医師と患者の相互作用のシミュレーションに基づいて、エージェントベースの医療AIの包括的な評価フレームワークである。
このフレームワークは、安全指向のトラップケース、臨床シナリオのカテゴリベースのランダムサンプリング、完全な回帰テストをサポートしている。
評価指標の普遍性は、このフレームワークを医療AIシステムの評価だけでなく、医師を評価し、臨床推論スキルの開発を支援するためにも使用できる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:38:25 GMT)
Do Neurons Dream of Primitive Operators? Wake-Sleep Compression Rediscovers Schank's Event Semantics [0.0] シャンクの概念的依存論は、全ての事象は原始的操作に分解すると主張した。
私たちはDreamCoderのウェイクスリープライブラリ学習をイベント状態変換に適用します。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 23:35:39 GMT)
Do LLMs Know What They Know? Measuring Metacognitive Efficiency with Signal Detection Theory [0.0] メタキャリブレーションによるキャパシティを分解するタイプ2信号検出理論とメタ認知効率比M比に基づく評価フレームワークを提案する。
1) メタ認知効率は,(1) タイプ1の感度が類似している場合でも,モデル間で大きく異なる - Mistral は D が最も高いが M 比が低い; 2) メタ認知効率はドメイン固有であり,異なるモデルが最も弱い領域を示し,メトリクスを集約できない; である。
メタキャリブレーションされた'フレームワークは、どのモデルが単に何を知らないのかを知る'のかを明らかにします。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:38:28 GMT)
Do All Vision Transformers Need Registers? A Cross-Architectural Reassessment [0.0] 我々は、Darcet et al. (2024) を再現し、複数のモデルにわたってそれらの主張の一般化性を評価する。
モデルのサイズが与える影響について検討し、その結果をより小さなモデルに拡張する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:09:12 GMT)
Development of ML model for triboelectric nanogenerator based sign language detection system [0.0] 聴覚と聴覚のコミュニケーションギャップを埋めるためには手話認識が不可欠である。
本研究は、カスタムトライボ誘電体ナノジェネレータ(TENG)を用いたセンサグローブにおける機械学習(ML)とディープラーニングモデルの比較を示す。
提案したMFCC CNN-LSTMアーキテクチャは、融合前の独立した畳み込み枝を通じて各センサから周波数領域の特徴を処理する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:35:02 GMT)
Decidable By Construction: Design-Time Verification for Trustworthy AI [0.0] 機械学習における一般的な仮定は、モデル正しさは事実の後に強制されなければならないというものである。
我々は,AIモデルが数値的に安定しているか,計算的に正しいか,あるいは物理領域と整合しているかを決定する特性が,必ずしもポストホック強制を要求するとは限らないことを観察する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:09:36 GMT)
Data-Driven Plasticity Modeling via Acoustic Profiling [0.0] 本稿では,アコースティックエミッション(AE)解析により結晶金属の塑性変形をモデル化するためのデータ駆動型フレームワークを提案する。
ニッケルマイクロピラーの圧縮荷重から得られる実験データに基づいて,モーレット変換を用いたウェーブレット法を導入し,異なる周波数帯域にわたるAE事象を検出する。
検出された事象はストレス・ドロップのダイナミクスに対して検証され、強い物理的一貫性を示し、AEエネルギー放出とひずみの進化の関係を明らかにする。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:36:06 GMT)
Critical curve of two-matrix models $ABBA$, $A\{B,A\}B$ and $ABAB$, Part I: Monte Carlo [0.0] 我々は、$(h,g)$-平面における最大収束領域の境界のモンテカルロ推定を与える。
関数的再正規化群を用いて得られた正確な解と位相図との比較を行った。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:55:03 GMT)
Consistency Amplifies: How Behavioral Variance Shapes Agent Accuracy [0.0] 複雑なマルチステップ推論を必要とするソフトウェアエンジニアリングベンチマークであるSWE-benchのコンテキストにおける一貫性について検討する。
モデル全体で、より高い一貫性と高い精度が一致していることが分かりました。
モデル内では、一貫性は正しい解釈と間違った解釈の両方を増幅することができる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:39:13 GMT)
Challenges and opportunities for AI to help deliver fusion energy [0.0] このパースペクティブは、ラウンドテーブルの議論の拡張および更新された概要である。
学術、産業、UKAEA、STFCの専門家は、AIを使って核融合エネルギーの研究開発を進める方法について論じた。
2025年4月、学術、産業、UKAEA、STFCの専門家は、AIが核融合エネルギーの研究開発をいかに進めるかについて議論した。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 13:15:37 GMT)
Central Dogma Transformer III: Interpretable AI Across DNA, RNA, and Protein [0.0] 本報告では,DNA,RNA,タンパク質の全中心ドグマに対して,機構指向のAIを拡張するCDT-IIIを提案する。
2段階のVirtual Cell Embedderアーキテクチャは、細胞の空間的区画化を反映している。
Alemtuzumabを近似したシリコCD52のノックダウンに応用すると、このモデルは29/29タンパク質の正確な変化を予測する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 16:53:09 GMT)
Causality is rare: some topological properties of causal quantum channels [0.0] QFTにおける量子チャネルの因果性は、チャネルの局所性以上の量子演算に対する追加の制約であることを示す。
この結果は量子情報と結びつき、因果ユニタリの集合が格子に作用するすべてのユニタリの集合においてハール測度が0$であることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:03:37 GMT)
Catalytic Coherence Amplification for Quantum State Recovery: Theory, Numerical Validation, and Comparison with Conventional Error Correction [0.0] 共変換におけるコヒーレンスを任意に増幅した量子状態回復プロトコルを提案する。
従来の量子エラー補正とは異なり、CQECはエラーしきい値なしで動作している。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:03:20 GMT)
Can We Locate and Prevent Stereotypes in LLMs? [0.0] 本研究は, GPT2 SmallおよびLlama 3.2の内部機構を解明し, 立体タイプ関連活性化を同定する。
ステレオタイプを符号化する個々のコントラストニューロン活性化を同定し、バイアス出力に大きく寄与する注意ヘッドを検出する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:59:08 GMT)
Can Small Models Reason About Legal Documents? A Comparative Study [0.0] 大規模言語モデルは法的なアプリケーションには有望であるが、フロンティアモデルのデプロイは、コスト、レイテンシ、データプライバシに関する懸念を提起する。
3つの法的なベンチマークで9つのモデルをテストすることにより,サブ10Bパラメータモデルが実用的な代替手段として機能するかどうかを評価する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 22:28:20 GMT)
Calorimeter Shower Superresolution with Conditional Normalizing Flows: Implementation and Statistical Evaluation [0.0] この論文は、もともと高速シミュレーションのために設計された生成モデルが、カロリー・スーパーレゾリューションに効果的に適用できるかどうかを考察する。
具体的には、arXiv:2308.11700で提案されたモデルは独立して再実装され、Geant4 Par04 の幾何量計に基づいてCaloChallenge 2022データセットで訓練されている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 17:07:04 GMT)
Benchmarking Scientific Machine Learning Models for Air Quality Data [0.0] 本研究は、ガイドラインと提案された物理誘導型最良のモデルを可能にする、説明可能で包括的なベンチマークを示す。
2022年から2024年にかけて、米国環境保護庁(EPA)による大気質データの日次観測を用いて、PM2.5とO3の都市レベルの時系列をキュレートする。
最適モデルのベンチマークには、線形回帰(LR)、SARIMAX、多層パーセプトロン(MLP)、LSTMネットワークが評価されている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 18:51:03 GMT)
Benchmarking Post-Quantum Cryptography on Resource-Constrained IoT Devices: ML-KEM and ML-DSA on ARM Cortex-M0+ [0.0] 本稿では,ARM Cortex-M0+プロセッサ上でML-KEMとML-DSAを分離したアルゴリズムレベルベンチマークを提案する。
PQClean参照Cの実装を用いて、キー生成、カプセル化/署名、カプセル化/検証の3つのセキュリティレベルをすべて計測する。
すべてのコード、データ、スクリプトは、開発者のためのオープンソースのベンチマークスイートとしてリリースされている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:37:27 GMT)
Banach and counting measures, and dynamics of singular quantum states generated by averaging of operator random walks [0.0] 本稿では,量子状態空間におけるランダムチャネルとその構成について検討する。
量子状態のダイナミクスは、作用素の二次形式の値の進化の観点から説明される。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 08:12:43 GMT)
Associative Memory using Attribute-Specific Neuron Groups-2: Learning and Sequential Associative Recall between Cue Neurons for different Cue Balls [0.0] 本稿では,複数の属性を画像として学習し,学習した記憶の逐次的リコールを行うニューラルネットワークモデルを提案する。
本研究で作成した属性処理システムは,色属性処理用C.CB-RNシステム,形状属性処理用S.CB-RNシステム,サイズ属性処理用V.CB-RNシステム,星座名処理用SV.CB-RNシステムである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 00:55:49 GMT)
Approximate Error Correction for Quantum Simulations of SU(2) Lattice Gauge Theories [0.0] SU(2)格子ゲージ理論の量子シミュレーションにおいて,ガウス法違反を積極的に抑制するためのプロトコルを提案する。
このプロトコルは、現在の超伝導ハードウェアに代表されるノイズレートにおいて、ゲージ不変性を回復し、忠実性を向上させることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 21:43:47 GMT)
Approaching the ultimate limit of quantum multiparameter estimation by many-body physics [0.0] このスキームは、物体とボソニックなアンシラの物理的相互作用を伴い、続いて全身的なアンシラの測定を行う。
この提案は、境界によって設定された最終的な精度限界を達成するために必要な実験的な設定について、より具体的な説明を提供する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 07:03:05 GMT)
Analytical Solutions of One-Dimensional ($1\mathcal{D}$) Potentials for Spin-0 Particles via the Feshbach-Villars Formalism [0.0] スピン-0粒子に対する一次元Feshbach--Villars方程式の統一的研究について述べる。
クーロン、パワー指数、コーネル、プシュル-テラー、ウッズ-サクソン相互作用の解を解析する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:24:29 GMT)
An Integrative Genome-Scale Metabolic Modeling and Machine Learning Framework for Predicting and Optimizing Biofuel-Relevant Biomass Production in Saccharomyces cerevisiae [0.0] 本稿では,Yeast9ゲノムスケールメタボリックモデルと機械学習と最適化を組み合わせた計算フレームワークを提案する。
本稿では, ゲノムスケールシミュレーション, 解釈可能なML, 生成モデリングが酵母の代謝工学をいかに前進させるかを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:32:16 GMT)
Adaptive Subspace Modeling With Functional Tucker Decomposition [0.0] モードワイズ連続性制約を直接分解に埋め込む機能的タッカー分解(FTD)を導入する。
FTDは再生カーネルヒルベルト空間(RKHS)を用いて、アプリオリ基底を必要としない連続モードをモデル化している。
このアプローチの値は、ドメイン不変テンソル分類で示される。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:06:14 GMT)
Adaptive Negativity Estimation via Collective Measurements [0.0] 本稿では,事前測定結果に基づいて動的に測定設定を調整する適応計測手法を提案する。
このプロシージャは、Long Short-Term Memory Networkを使用して、調査された状態の2つのコピーの集合的な測定を反復的に処理する。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:31:35 GMT)
Adaptive Chunking: Optimizing Chunking-Method Selection for RAG [0.0] 文書ごとに最適なチャンキング戦略を選択するフレームワークであるAdaptive Chunkingを紹介します。
法、技術、社会科学領域にまたがる多種多様なコーパスにおいて、我々の計量マージ適応法は、下流RAGの性能を著しく向上させる。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 11:20:52 GMT)
A unified quantum computing quantum Monte Carlo framework through structured state preparation [0.0] 量子コンピューティング 量子モンテカルロ (QCQMC) を基底状態エネルギー推定を超えて拡張する。
QCQMCは変分高速フォワードと変分単元行列演算子(VUMPO)を介して励起状態スペクトルに対処可能であることを示す。
分子、凝縮マター、核構造、グラフ最適化問題に関するベンチマークでは、QMC拡散のステップが基礎となる状態準備法のエネルギー精度を一貫して改善することを明らかにしている。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 15:59:54 GMT)
A derivation of the late-time volume law for local operator entanglement [0.0] Local Operator Entanglement (LOE)は、多体システムにおける量子カオスの指標として登場した。
本稿では、カオスシステムにおけるLOEの遅延表現を導出することにより、この目標に向けて貢献する。
これらの仮定の下で、ボリューム・ロー・スケーリングを示す明示的な公式を得る。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:38:04 GMT)
A Systematic Empirical Study of Grokking: Depth, Architecture, Activation, and Regularization [0.0] 暗記からニューラルネットワークの一般化への遅れた遷移をグロッキングすることは、まだ理解されていない。
モジュラー加算に関する因子を系統的に分散させる制御された研究(mod 97)を提案する。
我々の中心的な発見は、グラッキングダイナミクスはアーキテクチャーによって決定されるのではなく、安定性と正規化の間の相互作用によって決定されることである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 04:16:01 GMT)
A Survey of OCR Evaluation Methods and Metrics and the Invisibility of Historical Documents [0.0] 本研究は,OCRと文書理解システムがどのように評価され,特に黒歴史新聞に注目されるかを検討する。
報告されたトレーニングデータや評価ベンチマークには,黒字新聞などのコミュニティが作成した史料がほとんど現れないことが判明した。
これらの知見を考察するために、我々は、過去の経験的研究と、重要なブラックプレスコレクションからのアーカイブ統計を用いて、評価ギャップが構造的可視性と表現的害にどのように結びつくかを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 02:52:28 GMT)
A Distribution-to-Distribution Neural Probabilistic Forecasting Framework for Dynamical Systems [0.0] 予測分布を直接操作するために,D2Dニューラル確率予測フレームワークを開発した。
このフレームワークはLorenz63カオス力学系で実証されている。
その結果、D2Dモデルは非線形力学の下での非自明な分布の進化を捉え、明示的なアンサンブルシミュレーションを伴わずに巧妙な確率的予測を導き、競争力を持ち続け、場合によっては単純化された完全モデルベンチマークよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:19:12 GMT)
4OPS: Structural Difficulty Modeling in Integer Arithmetic Puzzles [0.0] 算術パズルゲームは、数学的推論タスクの難しさを研究するための制御された設定を提供する。
我々は、到達可能な目標を列挙し、最小操作の証人を抽出し、大規模ラベリングを可能にする、正確な動的プログラミング解法を開発する。
難易度は、正確な目撃者から導かれる、解釈可能な構造的属性の小さなセットによって完全に決定されることを示す。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 12:01:39 GMT)
"What don't you understand?" Language games and black box algorithms [0.0] 本稿は、説明可能な人工知能(XAI)の初期段階に固有の「ブラックボックス」アルゴリズムの問題を理解することを目的としている。
しかし、(1) モデルを理解しようとするとき、説明可能性よりも解釈可能性について話すこと、(2) 機械は、ウィラード・ヴァン・オーマン・クワイン(英語版)の想像上の言語学者が、過激な翻訳の状況において「ガヴァガイ」という言葉が何を指しているのかを正確に決定できないのと同じように、情報への完全かつ曖昧なアクセスがないためである。
論文参考訳(メタデータ) (Thu, 26 Mar 2026 20:41:21 GMT)