Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation [114.3] Nemotron-Cascade 2はオープンな30B MoEモデルで、3Bアクティベートされたパラメータを持ち、最高の推論と強力なエージェント能力を提供する。
これはDeepSeekV3.2- Speciale-671B-A37Bに続く2番目のオープンウェイトLDMであり、2025年の国際数学オリンピックでゴールドメダルレベルのパフォーマンスを達成した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:47:52 GMT)
Relax Forcing: Relaxed KV-Memory for Consistent Long Video Generation [73.8] オートレグレッシブ(AR)ビデオ拡散は,近年,長大なビデオ生成において有望なパラダイムとして浮上している。
時間的劣化が進行しているため, 生成から微小スケールの地平線への延長は依然として困難であることを示す。
本稿では,AR拡散のための時間記憶機構であるRelax Forcingを紹介する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:59:24 GMT)
Text-Image Conditioned 3D Generation [72.0] TIGONは、イメージとテキスト条件のバックボーンと軽量なクロスモーダル融合を備えた、最小限のデュアルブランチベースラインである。
我々の診断研究は、テキストと画像条件の単純な融合でさえ、単一モダリティモデルよりも優れていることを示している。
大規模な実験により、テキスト画像の条件付けは単一モダリティ法よりも一貫して改善されることが示された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:36:16 GMT)
Learning Progressive Adaptation for Multi-Modal Tracking [67.5] マルチモーダルトラッカーは通常、パラメータ効率の良い微調整モジュールを備えた事前訓練されたRGBモデルを採用することで構築される。
この問題に対処するため,マルチモーダルトラッキング(PATrack)のためのプログレッシブ・アダプタ(Progressive Adaptation)を提案する。
この革新的なアプローチは、モダリティに依存し、モダリティに絡み合った、タスクレベルのアダプタを取り入れ、マルチモーダルデータにRGB事前学習ネットワークを適用する際のギャップを効果的に埋める。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 07:25:54 GMT)
ResPrune: Text-Conditioned Subspace Reconstruction for Visual Token Pruning in Large Vision-Language Models [59.9] ResPruneは、大規模な視覚言語モデルのためのトレーニング不要のビジュアルトークンプルーニングフレームワークである。
視覚トークンのコンパクトだが情報に富むサブセットを選択する。
これは、計算、メモリ消費、推論遅延を効果的に削減する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 07:44:45 GMT)
Test-Time Adaptation via Cache Personalization for Facial Expression Recognition in Videos [59.8] 本稿では,キャッシュベースのTTA方式であるキャッシュパーソナライゼーション(TTA-CaP)を提案する。
実験により,TTA-CaPは,対象種別および環境変化下で,最先端のTTA法より優れることが示された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 16:31:25 GMT)
RoboAlign: Learning Test-Time Reasoning for Language-Action Alignment in Vision-Language-Action Models [58.8] RoboAlignは視覚言語アクションモデル(VLA)を訓練し、マルチモーダル理解を低レベルのアクションに変換する。
我々のキーとなる考え方は、ゼロショット自然言語推論を用いてアクショントークンをサンプリングし、この推論を強化学習(RL)を用いて洗練し、アクション精度を向上させることである。
RoboAlignは、それぞれLIBERO、CALVIN、現実世界の環境におけるSFTベースラインよりも17.5%、18.9%、106.6%の性能向上を実現している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:57:55 GMT)
Cortical Policy: A Dual-Stream View Transformer for Robotic Manipulation [57.3] ロボット操作のための新しいデュアルストリームビュー変換器であるCortical Policyを提案する。
われわれのフレームワークは、ロボット操作の新しい視点を提供し、視覚に基づくロボット制御の幅広い応用の可能性を秘めている。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 04:18:54 GMT)
Explainable Semantic Textual Similarity via Dissimilar Span Detection [53.3] テキストのペア間で意味的に異なるスパンを識別することを目的として,DSD(Dissimilar Span Detection)タスクを導入する。
これにより、ユーザーはどの特定の単語やトークンが類似度スコアに悪影響を及ぼすかを理解したり、STS依存のダウンストリームタスクのパフォーマンス向上に使用することができる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 11:32:31 GMT)
Revisiting Tree Search for LLMs: Gumbel and Sequential Halving for Budget-Scalable Reasoning [53.1] 本稿ではGumbel AlphaZero MCTSの適応版であるReSCALEについて述べる。
ReSCALEはGSM8Kで58.4%、Game24で85.3%に達する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 10:32:48 GMT)
On the Role of Batch Size in Stochastic Conditional Gradient Methods [52.0] 条件勾配法におけるバッチサイズの役割を,$-KL条件下で検討した。
バッチサイズの増加は、当初は最適化の精度を向上するが、重要なしきい値を超えると、固定トークン予算の下でのメリットと飽和度は、パフォーマンスを劣化させる可能性がある。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 12:23:41 GMT)
Adversarial attacks against Modern Vision-Language Models [51.6] 我々は,現実的な事前デプロイ条件をシミュレートするために構築された自己完結型eコマース環境に配備された,オープンソースの視覚言語モデル(VLM)エージェントの敵対的堅牢性について検討した。
LLaVA-v1.5-7BとQwen2.5-VL-7Bの2剤を3種類の勾配攻撃下で評価した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:55:10 GMT)
Hierarchical Text-Guided Brain Tumor Segmentation via Sub-Region-Aware Prompts [50.4] TextBraTSは、TextBraTSベースライン上に3つの新しいコンポーネントで構築された階層的なテキスト誘導フレームワークである。
学習可能なソフトプロンプトをLoRA適応BioBERTエンコーダで使用するサブリージョン対応プロンプトチューニングでは,各サブリージョンに適した特殊なテキスト表現を生成する。
TextBraTSデータセットの実験では、DiceとHD95で、最先端のメソッドに対して、すべてのサブリージョンで1.7%と6%の一貫性のある改善が示されている。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 06:45:02 GMT)
SpatialFly: Geometry-Guided Representation Alignment for UAV Vision-and-Language Navigation in Urban Environments [50.0] UAV VLNのための幾何学誘導空間表現フレームワークを提案する。
明示的な3次元再構成を伴わないRGB観測において、SpatialFlyは幾何学誘導2次元表示アライメント機構を導入する。
実験結果から、SpatialFlyは現状のUAV VLNベースラインを目に見える環境と見えない環境の両方で一貫して上回っていることが明らかとなった。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 03:56:58 GMT)
More Than Sum of Its Parts: Deciphering Intent Shifts in Multimodal Hate Speech Detection [49.1] ソーシャルメディア上でのヘイトスピーチは、サイバースペースの確保には不可欠だが、自動検出システムに大きく依存している。
我々は、モダリティが相互作用する意味的意図変化を特徴付け、良心的憎悪から暗黙的憎悪を構築するか、意味的逆転を通じて毒性を中和する。
本稿では,これらの複雑な手がかりを効果的に解読するために,裁判所エージェントによる非対称推論(Asymmetric Reasoning)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:46:23 GMT)
SGAD-SLAM: Splatting Gaussians at Adjusted Depth for Better Radiance Fields in RGBD SLAM [46.6] 現行の手法では3Dガウシアンやビュータイドの3Dガウシアンを用いて、追跡とマッピングにおいて放射場を表現している。
我々は画素アライメントのガウスアンを採用するが、各ガウスアンがその線に沿って位置を調整してレンダリング品質を最大化することができる。
我々は、広く使われているベンチマークの評価を報告し、設計を正当化し、ビューレンダリング、カメラトラッキング、ランタイム、ストレージの複雑さにおける最新の手法に対する利点を示します。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 04:42:02 GMT)
A Quantum Encoding of Traveling Salesperson Tours via Route Generation, Cost Phases, and a Valid-Permutation [45.9] 本稿では,ツアーの時間登録表現に基づくTSPの量子符号化について述べる。
本稿では,経路レジスタ上の一様経路生成,有効なツアーをマークするための可逆オラクル,総ツアーコストをエンコードする位相オラクルの3つの要素について述べる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:15:28 GMT)
PrismWF: A Multi-Granularity Patch-Based Transformer for Robust Website Fingerprinting Attack [45.6] Torは低レイテンシな匿名通信ネットワークで、Webサイトのトラフィックを暗号化することでユーザのプライバシーを保護する。
最近のWebサイトフィンガープリント(WF)攻撃は、暗号化されたトラフィックが、パケットサイズ、方向、地域間時間などの統計的特徴を活用することで、ユーザの訪問するWebサイトをいまだに漏洩させることができることを示している。
マルチタブWF攻撃のための多粒度パッチベースのトランスフォーマであるPrismWFを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 08:17:03 GMT)
Focus on Background: Exploring SAM's Potential in Few-shot Medical Image Segmentation with Background-centric Prompting [44.8] 医用画像セグメンテーションのためのバックグラウンド中心のプロンプトジェネレータFoB(Focus on background)を提案する。
FoBは、セグメンテーションとプロンプトローカライゼーションのギャップを、カテゴリーに依存しないサポートバックグラウンドプロンプトの生成によって埋める。
3つの多様な医療画像データセットの実験は、FoBが他のベースラインよりも大きなマージンで優れていることを示した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:21:39 GMT)
JANUS: A Lightweight Framework for Jailbreaking Text-to-Image Models via Distribution Optimization [44.6] 既存のjailbreak攻撃は、真のエンドツーエンドの目的ではなく、プロキシ-ロス最適化に依存している。
Janusは、ブラックボックスの下で構造化されたプロンプト配布の最適化としてジェイルブレイクを定式化する軽量フレームワークである。
Janusはオープンソースと商用の両方で成功している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:05:52 GMT)
Identity-Consistent Video Generation under Large Facial-Angle Variations [43.9] シングルビュー参照ビデオ手法は、大きな顔-角のバリエーションの下でアイデンティティの一貫性を維持するのにしばしば苦労する。
我々は,マルチビュー条件付きフレームワークである$mathrmMv2mathrmID$を提案する。
動作の自然性を維持しながらアイデンティティの整合性を大幅に向上し,クロスペアデータを用いた既存手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:54:16 GMT)
CLT-Forge: A Scalable Library for Cross-Layer Transcoders and Attribution Graphs [42.3] CLT(Cross-Layer Transcoders)のエンドツーエンドトレーニングと解釈性のためのオープンソースライブラリを導入する。
我々のフレームワークは、スケーラブルな分散トレーニングとモデルシャーディングと圧縮アクティベーションキャッシュを統合している。
これにより、CLTベースの機械的解釈可能性のスケーリングのための実用的で統一的なソリューションが提供される。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 02:20:33 GMT)
Relational graph-driven differential denoising and diffusion attention fusion for multimodal conversation emotion recognition [39.8] 本稿では,MCERのための関係認識・拡散注意融合モデルを提案する。
具体的には、まず2つの注意マップの差分を明示的に計算する微分変換器を設計する。
第2に、話者依存の感情的依存を捉えるために、モダリティ特化関係とクロスモダリティ関係のサブグラフを構築する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 01:27:22 GMT)
Semantic Shift: the Fundamental Challenge in Text Embedding and Retrieval [39.7] トランスフォーマーベースの埋め込みモデルは、可変長のテキストを単一のベクトルにマッピングするプーリングに依存している。
因果関係の欠如は、本質的な、構造的な進化と、テキスト内の意味論の分散である。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:58:11 GMT)
Demystifying Low-Rank Knowledge Distillation in Large Language Models: Convergence, Generalization, and Information-Theoretic Guarantees [39.5] 言語モデルにおける低ランク知識蒸留のための厳密な理論的枠組みを確立する。
モデル圧縮と一般化能力の基本的なトレードオフを特徴付ける一般化境界を導出する。
この結果から,n が標本サイズである場合の最適な階数 $r* = O(sqrtn)$ を数学的に提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:10:27 GMT)
Dynamic Fusion-Aware Graph Convolutional Neural Network for Multimodal Emotion Recognition in Conversations [38.8] 本稿では,会話におけるマルチモーダル感情の特徴を頑健に認識するための動的融合対応グラフ畳み込みニューラルネットワーク(DF-GCN)を提案する。
DF-GCNは、通常の微分方程式をグラフ畳み込みネットワーク(GCN)に統合し、発話相互作用ネットワーク内の感情的依存の動的性質を捉える。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 02:43:10 GMT)
NoOVD: Novel Category Discovery and Embedding for Open-Vocabulary Object Detection [38.0] オープン語彙オブジェクト検出(OVD)のための新しいトレーニングフレームワークを提案する。
NoOVDは凍結視覚言語モデル(VLM)の知識に基づく自己蒸留機構を統合する
R-RPNを導入し、推論中の提案の信頼度を調整し、新規カテゴリオブジェクトのリコールを改善する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 05:49:37 GMT)
Dreaming the Unseen: World Model-regularized Diffusion Policy for Out-of-Distribution Robustness [37.8] 拡散政策は、ビジュモーター制御において優れるが、しばしば重度のアウト・オブ・ディストリビューション障害の下で破滅的に失敗する。
本稿では,DDP(Dream Diffusion Policy)について紹介する。DDPは,拡散世界モデルを,共有3次元ビジュアルエンコーダを介して,政策の学習目標に統合するフレームワークである。
DDPは、推定中に突然のOOD異常を検出し、破損した視覚ストリームを積極的に放棄する。
内部の「想像」に頼って破壊を安全に回避し、物理的現実に順応する前に想像上の軌道を発生させる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 02:30:09 GMT)
Frequency Switching Mechanism for Parameter-E!cient Multi-Task Learning [37.5] Free Sinewichはパラメータ効率のよいマルチタスク学習フレームワークであり、ほぼゼロコストの重量変調を可能にする。
厳密な予測ベンチマークでは、Free Sinewichは最先端のパフォーマンス効率トレードオフを達成する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 07:57:40 GMT)
QMoP: Query Guided Mixture-of-Projector for Efficient Visual Token Compression [35.8] 視覚トークンを3つの協調ブランチを介して適応的に圧縮する新しいフレームワークを提案する。
QMoPはメモリ、計算、推論時間を大幅に節約する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:42:24 GMT)
SqueezeComposer: Temporal Speed-up is A Simple Trick for Long-form Music Composing [35.7] AIモデルは、2倍、4倍、または8倍のレートで、タイムアクセラレーションされた(スピードアップされた)オーディオを理解し、生成できると仮定する。
音楽の高速バージョンを最初に生成することにより、時間長とリソース要件を大幅に削減する。
我々は、このアイデアをSqueezeComposerでインスタンス化します。これは、拡散モデルを利用して、加速されたドメインの生成と復元されたドメインの洗練を行います。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 06:00:41 GMT)
One Pool Is Not Enough: Multi-Cluster Memory for Practical Test-Time Adaptation [35.2] テスト時間適応(TTA)は、未ラベルのテストデータのみを使用して、推論時の分散シフトに事前訓練されたモデルを適用する。
既存の方法は、アンプを単一の非構造化プールに普遍的に格納する。
ストリームクラスタビリティ解析により,テストストリームが本質的にマルチモーダルであることを明らかにした。
本稿では,MCM(Multi-Cluster Memory)を提案する。MCM(Multi-Cluster Memory)は,軽量な画素レベルの統計記述子を用いて,格納されたサンプルを複数のクラスタにまとめるプラグイン・アンド・プレイフレームワークである。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:14:58 GMT)
Model Evolution Under Zeroth-Order Optimization: A Neural Tangent Kernel Perspective [34.0] ニューラルゼロ階数カーネル(NZK)を導入し,ZO更新の下で関数空間のモデル進化を記述する。
予測されたNZKがトレーニングを通して一定であり、ランダムな摂動方向の第1モーメントと第2モーメントに明示的に依存していることを証明する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 11:14:53 GMT)
CoVFT: Context-aware Visual Fine-tuning for Multimodal Large Language Models [33.7] 視覚的な微調整手法は、マルチモーダルタスクにおいて、凍結したベースラインを一貫して上回らないことを示す。
この不安定性は視覚的嗜好の対立から生じ、視覚エンコーダの文脈に依存しない性質は、分岐パラメータの更新を誘導する。
マルチモーダルコンテキストを視覚的適応に明示的に組み込んだコンテキストベクトル抽出(CoVFT)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 06:04:44 GMT)
WIST: Web-Grounded Iterative Self-Play Tree for Domain-Targeted Reasoning Improvement [31.6] textbfWeb-grounded textbfIterative textbfSelf-play textbfTree framework for domain-targeted reasoning improvement。
オープンWebから直接学習するドメインターゲット推論改善のためのフレームワークである textbfWIST を提示する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:55:16 GMT)
The Workload-Router-Pool Architecture for LLM Inference Optimization: A Vision Paper from the vLLM Semantic Router Project [31.0] vLLM Semantic Routerプロジェクトは、信号駆動ルーティング、コンテキスト長プールルーティング、ルータパフォーマンスエンジニアリング、ポリシー競合検出、低レイテンシ組み込みモデル、カテゴリ認識セマンティックキャッシング、ユーザフィードバック駆動ルーティング適応、幻覚検出、プライバシーとジェイルブレイク保護のための階層的コンテンツ安全分類を対象とする一連の作業をリリースした。
本稿では,LLM推論最適化のための3次元フレームワークであるWorkload-Pool-Poolアーキテクチャについて述べる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:30:11 GMT)
KHMP: Frequency-Domain Kalman Refinement for High-Fidelity Human Motion Prediction [30.8] 我々は,適応カルマンフィルタをDCT領域に適用し,高忠実度な人間の動作予測を生成する新しいフレームワークKHMPを紹介する。
我々は,KHMPが最先端の精度を達成し,ジッタアーティファクトを効果的に緩和し,スムーズかつ物理的に可視な運動を発生させることを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:10:43 GMT)
Assessing the Ability of Neural TTS Systems to Model Consonant-Induced F0 Perturbation [30.8] 本研究では,子音によるf0摂動を再現するニューラルネットワークモデルの性能を評価するための分節レベルの韻律探索フレームワークを提案する。
同じ音声コーパス(LJ音声)で訓練されたTacotron 2とFastSpeech 2を用いて、語彙周波数で階層化された何千もの単語の合成および自然な音声認識を比較する。
その結果,高周波単語の再現精度は高いが,低周波項目への一般化は低かった。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 06:06:47 GMT)
CTFS : Collaborative Teacher Framework for Forward-Looking Sonar Image Semantic Segmentation with Extremely Limited Labels [30.8] 本稿では,前向きなソナー画像のための協調教師セマンティックフレームワークを提案する。
指導戦略を交互に行うことで、学生モデルはソナー画像の特徴を同時に捉えながら、一般的な意味表現を学習することができる。
教師が大量のノイズのある擬似ラベルを生成できるソナー画像の課題を考慮し、さらに教師間の信頼性評価機構を設計する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 05:57:36 GMT)
LiFR-Seg: Anytime High-Frame-Rate Segmentation via Event-Guided Propagation [30.2] 任意のタイミングでセグメンテーションを予測する新しいタスクであるAnytime Interframe Semanticを紹介します。
このタスクは、スパースやしばしばノイズの多いイベントデータから派生した運動場を用いて、密集したセマンティックな特徴をいかに堅牢に伝播させるかという、中核的な課題を提示する。
本稿では,これらの課題に直接対処する新しいフレームワークLiFR-Segを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 08:13:58 GMT)
When Models Judge Themselves: Unsupervised Self-Evolution for Multimodal Reasoning [30.2] マルチモーダル推論のための教師なし自己進化学習フレームワークを提案する。
ヒューマンアノテートされた回答や外部報酬モデルを用いることなく、安定したパフォーマンス向上を実現する。
提案手法は5つの数学的推論ベンチマークにおける推論性能と一般化を一貫して改善する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:22:19 GMT)
TRACE: A Multi-Agent System for Autonomous Physical Reasoning in Seismological Science [29.7] TRACEは,大規模言語モデルと形式的地震学制約を組み合わせたマルチエージェントシステムである。
TRACEはストレスによって引き起こされる遅延伝播を自律的に同定し、Mw 6.4とMw 7.1の主ショックの間のカスケード相互作用を解消する。
また、連続的なカスケードイベントからの断層チャネルのエピソード移動を区別し、構造的にガイドされた侵入モデルを特定する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 10:06:52 GMT)
Knowledge Priors for Identity-Disentangled Open-Set Privacy-Preserving Video FER [29.5] ビデオベースのプライバシー保護FERのための2段階フレームワークを提案する。
まず、ビデオ内および動画間知識を用いたアイデンティティ抑圧ネットワークを訓練する。
その後のdenoisingモジュールは、式関連情報を復元し、FERパフォーマンスの回復を支援する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 20:18:31 GMT)
F4Splat: Feed-Forward Predictive Densification for Feed-Forward 3D Gaussian Splatting [28.8] 本稿では,フィードフォワード3次元ガウス分割のためのフィードフォワード予測デンシフィケーションを行うF4Splatを提案する。
本モデルでは, 地域ごとの密度化スコアを推定し, 必要なガウス密度を推定し, 最終ガウス予算の明示的な制御を可能にする。
実験により,従来のフィードフォワード法と比較して,本モデルが優れた新規ビュー合成性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 16:03:56 GMT)
Aggregation Alignment for Federated Learning with Mixture-of-Experts under Data Heterogeneity [27.8] 大規模言語モデル(LLM)は、計算量を削減しつつモデルのキャパシティをスケールするために、Mixture-of-Experts (MoE)アーキテクチャを採用するようになっている。
これらのMoEベースのLPMを微調整するには、分散データとプライバシに敏感なデータにアクセスする必要があることが多いため、集中的な微調整は現実的ではない。
我々は、ルーティングの一貫性と専門的なセマンティックアライメントを共同で実施するフェデレーションアライメントアライメントアライメントフレームワークであるFedAlign-MoEを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:07:39 GMT)
GAPG: Geometry Aware Push-Grasping Synergy for Goal-Oriented Manipulation in Clutter [27.7] 乱雑な環境では、シングルステップの把握が不十分であることが多い。
従来の作業は、把握可能な空間を作るための補助的なアクションとしてプッシュを導入してきた。
我々は,グリップとプッシュ評価を統合するために,幾何対応のプッシュグラス・シナジー・フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 12:30:44 GMT)
Training-Free Instance-Aware 3D Scene Reconstruction and Diffusion-Based View Synthesis from Sparse Images [27.0] 未提示のRGB画像から3次元屋内シーンを再構成・理解・レンダリングする訓練自由システムを提案する。
密度の高いビューとシーンごとの最適化を必要とする従来のラディアンスフィールドアプローチとは異なり、パイプラインはトレーニングやポーズ前処理なしで高忠実度な結果が得られる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 10:56:15 GMT)
Incentivizing Generative Zero-Shot Learning via Outcome-Reward Reinforcement Learning with Visual Cues [27.0] 生成型ZSLのための視覚的手がかりを備えた帰納的強化学習フレームワークであるRLVCを提案する。
RLVCは、結果に基づく報酬を使用して生成モデルを更新し、タスク関連特徴の合成を奨励する。
3つの一般的なZSLベンチマークの実験と分析は、RLVCが最先端の結果を4.7%のアップで達成していることを示している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:28:04 GMT)
Reframing Long-Tailed Learning via Loss Landscape Geometry [26.5] 我々は,「細かな性能劣化」を防止するために,継続的学習にインスパイアされたフレームワークを提案する。
我々のフレームワークは、外部トレーニングサンプルも事前トレーニングモデルも必要とせず、幅広い適用性を容易にします。
4つのベンチマーク実験は、最先端の手法よりも顕著な性能向上を示した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:16:36 GMT)
Uncertainty-Aware Knowledge Distillation for Multimodal Large Language Models [26.1] 知識蒸留は、データ監督と教師指導の両方を活用する学習パラダイムを確立する。
本研究では,教師の指導にどの程度依存しているかを規定する不確実性を考慮した蒸留フレームワークであるBeta-KDを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:33:25 GMT)
PROMPT2BOX: Uncovering Entailment Structure among LLM Prompts [25.8] 本稿では,訓練されたエンコーダを用いて,プロンプトをボックス埋め込み空間に埋め込むPROMPT2BOXを提案する。
既存のデータセットと合成データセットに基づいてトレーニングされたエンコーダは、意味的類似性と特異性関係をキャプチャするボックス埋め込みを出力する。
実験により、ボックス埋め込みはベクトルベースラインよりもプロンプト特異性を常に捉えていることが示された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:59:18 GMT)
Single-Eye View: Monocular Real-time Perception Package for Autonomous Driving [25.6] 本稿では,自律走行のためのリアルタイム単眼知覚パッケージであるLRHPerceptionを紹介する。
提案システムは,エンド・ツー・エンド・ラーニングの計算効率と局所マッピング手法の表現の充実を両立させる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 05:04:40 GMT)
Privacy-Preserving Federated Action Recognition via Differentially Private Selective Tuning and Efficient Communication [25.2] フェデレートされたビデオ行動認識は、生のビデオデータを共有せずに協調的なモデルトレーニングを可能にする。
差分プライバシー(DP)の下でタスク関連レイヤを選択的に微調整し摂動するtextitFedDP-STECAR フレームワークを提案する。
集約中に調整されたレイヤのみを送信することで、フルモデル更新と比較して通信トラフィックは99%以上削減される。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 16:05:14 GMT)
KLDrive: Fine-Grained 3D Scene Reasoning for Autonomous Driving based on Knowledge Graph [25.0] 我々は、自律運転におけるきめ細かい質問応答のための知識グラフ強化推論フレームワークであるKLDriveを紹介する。
2つの大規模自動運転QAベンチマークの実験では、KLDriveは最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 02:54:10 GMT)
Harmful Visual Content Manipulation Matters in Misinformation Detection Under Multimedia Scenarios [24.8] マルチモーダル誤情報検出(Multimodal Misinformation Detection、MMD)は、マルチモーダル誤情報検出(Multimodal Misinformation Detection、MMD)として知られる研究課題である
近年の研究では、ソーシャルメディア記事の視覚コンテンツ内の操作された特徴がMDDにとって貴重な手がかりとなることが示されている。
本研究では、視覚的コンテンツが操作されたかどうかを表す操作特徴と、これらの操作の性質を評価する意図特徴の2つの特徴を捉えて、そのようなマルチモーダルな誤情報を特定することを目的とする。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 04:37:04 GMT)
Not All Latent Spaces Are Flat: Hyperbolic Concept Control [24.5] 我々は,概念のより表現的かつ安定した操作を実現するために,意味的に整合した双曲表現空間を利用する並列輸送に基づく新しい制御機構である双曲制御(HyCon)を導入する。
HyConは4つの安全ベンチマークと4つのT2Iバックボーンで最先端の結果を達成し、ハイパーボリックステアリングはより信頼性の高いT2I生成のための実用的で柔軟なアプローチであることを示した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:49:14 GMT)
PivotRL: High Accuracy Agentic Post-Training at Low Compute Cost [22.9] 長距離エージェントタスクのポストトレーニングは、計算効率と一般化の間に緊張関係がある。
本稿では,既存のSFTトラジェクトリで動作する新しいフレームワークであるPivotRLを紹介し,SFTの計算効率とE2E RLのOOD精度を組み合わせた。
PivotRLはNVIDIAのNemotron-3-Super-120B-A12Bで採用され、量産規模のエージェント・ポストトレーニングにおけるワークホースとして機能している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 19:59:48 GMT)
Two Experts Are Better Than One Generalist: Decoupling Geometry and Appearance for Feed-Forward 3D Gaussian Splatting [22.8] 本稿では,ポーズフリーフィードフォワード3DGSフレームワークである2Xplatを紹介する。
専用の幾何学の専門家が最初にカメラのポーズを予測し、3Dガウスを合成する強力な外見の専門家に明示的に渡される。
その概念的単純さは先行研究で大半が過小評価されているにもかかわらず、提案手法は極めて効果的であることが証明されている。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 05:14:38 GMT)
SkillProbe: Security Auditing for Emerging Agent Skill Marketplaces via Multi-Agent Collaboration [22.7] SkillProbeはマルチエージェントコラボレーションによって駆動されるマルチステージセキュリティ監査フレームワークである。
ClawHubから2500の現実世界スキルを対象とした8つの主流シリーズを用いた大規模評価を行った。
私たちの結果は、ダウンロードボリュームが信頼できるプロキシのセキュリティ品質ではないという、重大な人気セキュリティのパラドックスを明らかにしました。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 02:31:27 GMT)
Can LLMs Fool Graph Learning? Exploring Universal Adversarial Attacks on Text-Attributed Graphs [22.4] テキスト分散グラフ(TAG)は、各ノードのリッチテキストセマンティクスとトポロジ的コンテキストを統合することにより、グラフ学習を強化する。
最近の進歩は、グラフニューラルネットワーク(GNN)やプレトレーニング言語モデル(PLM)といった多様なバックボーンを活用して、TAGの構造情報とテキスト情報の両方をキャプチャしている。
TAGモデルのセキュリティを評価するために、アーキテクチャ全体にわたって一般化される普遍的な敵攻撃をどうやって設計できるのか?
BadGraphは,ノードトポロジとテキストセマンティクスを両立させるため,汎用グラフ知識の大規模言語モデル(LLM)を深く取り入れた,新たなアタックフレームワークである。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 10:15:22 GMT)
Learning to Optimize Joint Source and RIS-assisted Channel Encoding for Multi-User Semantic Communication Systems [22.3] マルチユーザ・セマンティック・コミュニケーションのための統合ソースおよび再構成可能なインテリジェント・サーフェス(RIS)支援チャネルエンコーディング(JSRE)フレームワークを提案する。
ディープニューラルネットワーク(DNN)は、すべてのユーザに対してセマンティック機能を抽出し、RISはチャネル性を提供し、統一されたセマンティックエンコーディング・デコーディング設計を可能にする。
本研究の目的は,ユーザのスケジューリング,RISの位相シフト,意味圧縮比を最適化することで,ユーザ間のセマンティックコミュニケーションの全体的なエネルギー効率を最大化することである。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 07:22:56 GMT)
Taming Sampling Perturbations with Variance Expansion Loss for Latent Diffusion Models [22.2] 遅延拡散モデルが高忠実かつ効率的な画像生成の主流のフレームワークとして登場した。
摂動をサンプリングする堅牢性は、生成品質を決定する上で重要な役割を担っていることを示す。
本研究では,強い再構成を維持しつつ,摂動をサンプリングする潜在空間を堅牢に構築する手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 06:56:12 GMT)
Is Monitoring Enough? Strategic Agent Selection For Stealthy Attack in Multi-Agent Discussions [22.2] マルチエージェントの議論は広く採用され、脆弱性を暴露する攻撃を開発する取り組みが活発化している。
本研究は,実践的だがほとんど探索されていない攻撃シナリオ,議論監視シナリオについて考察する。
既存の攻撃は、議論の監視なしに効果的であることを示すが、検出可能なパターンを示し、そのような監視制約の下では、ほとんど失敗する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 12:28:30 GMT)
DSCSNet: A Dynamic Sparse Compression Sensing Network for Closely-Spaced Infrared Small Target Unmixing [21.5] Close Small Object Unmixingタスクは、混合スポットから個々のターゲットの番号、サブピクセル位置、放射強度を回復することを目的としている。
既存の手法は、モデル駆動アプローチの厳密なスパーシリティ保証と、データ駆動手法の動的シーン適応性のバランスをとるのに苦労している。
本稿では,動的スパース圧縮センシングネットワーク (DSCSNet) を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 12:24:59 GMT)
When Convenience Becomes Risk: A Semantic View of Under-Specification in Host-Acting Agents [21.2] ホストアクションエージェントは、ユーザが目標を指定し、システムがそれを実現する方法を決定する、便利なインタラクションモデルを約束する。
この利便性は、ゴール仕様におけるセマンティック・アンダー・セマンティクスという、異なるセキュリティ問題をもたらす、と我々は主張する。
本稿では, セマンティック・脅威モデル, セマンティック・リスク・コンプリート・パターンの分類を提示し, その現象をOpenClawを中心としたケーススタディと実行トレース分析を用いて研究する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:42:21 GMT)
Confidence Freeze: Early Success Induces a Metastable Decoupling of Metacognition and Behaviour [20.8] 人間は、否定的な証拠を蓄積しながらも、失敗戦略を実行し続けることで、しばしば不適応の持続性を示す。
安定な配置特性ではなく,動的学習状態として永続性を再構築する「信頼性フリーズ」の記述を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 03:51:00 GMT)
Entropy Alone is Insufficient for Safe Selective Prediction in LLMs [20.7] 選択予測システムは、高リスクケースでの回答を控えることで、言語モデル幻覚による害を軽減することができる。
不確実性定量化技術はしばしばそのようなケースを特定するために用いられるが、より広い選択的予測ポリシーの文脈で評価されることはほとんどない。
エントロピーに基づく不確実性手法のモデル依存的故障モードを同定し、エントロピースコアと正当性プローブ信号を組み合わせることで、信頼できない禁忌行動に対処する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 11:27:13 GMT)
Can we automatize scientific discovery in the cognitive sciences? [20.2] 心のシリコ科学における完全自動化に向けてのパラダイムシフトを提案する。
このフレームワークは、Large Language Models (LLM)を使用して、発見サイクルのすべてのステージを実装する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:15:58 GMT)
DyGeoVLN: Infusing Dynamic Geometry Foundation Model into Vision-Language Navigation [19.9] 視覚言語ナビゲーション(VLN)は、視覚的な観察と、見えない環境でのナビゲーションを行うための言語指示を理解するエージェントを必要とする。
既存のアプローチのほとんどは静的シーンの仮定に依存しており、動的で現実的なシナリオを一般化するのに苦労している。
動的幾何学を意識したVLNフレームワークであるDyGeoVLNを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:56:59 GMT)
Large Reward Models: Generalizable Online Robot Reward Generation with Vision-Language Models [19.8] 我々は最先端のVLMに基づく堅牢でスケーラブルな報酬モデルを開発する。
我々は、これらのVLM報酬を用いて、閉ループ方式で準最適動作を補正するモデルを導出する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 05:43:21 GMT)
Explainable AML Triage with LLMs: Evidence Retrieval and Counterfactual Checks [19.3] 本稿では,トリアージをエビデンス制約決定プロセスとして扱う,説明可能なAMLトリアージフレームワークを提案する。
提案手法は, (i) ポリシー/タイポロジーガイダンス, 顧客コンテキスト, 警告トリガ, トランザクションサブグラフと, (ii) 明示的な引用を必要とする構造的LCM出力契約, (iii) 矛盾や欠落した証拠から分離する構造的LCM出力契約, (iii) 最小限の, 妥当な摂動が, トリアージの推奨と理性の両方に一貫性のある変化をもたらすかどうかを検証した事実チェックを組み合わせる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 05:51:40 GMT)
Pretrained Video Models as Differentiable Physics Simulators for Urban Wind Flows [19.1] WinDiNetは事前訓練されたビデオ拡散モデルであり、このタスクの高速で微分可能なサロゲートとして再利用される。
我々は、手続き的に生成された建築レイアウトに対して、1万の2次元非圧縮性CFDシミュレーションを微調整する。
シュロゲートはエンドツーエンドで微分可能であるため、勾配に基づく逆最適化のための物理シミュレータとして二重化される。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:08:01 GMT)
Interpretable Cross-Domain Few-Shot Learning with Rectified Target-Domain Local Alignment [19.1] Cross-Domain Few-Shot Learningは、大規模な汎用データ(ソースドメイン)でトレーニングされたモデルを、少ないトレーニングデータだけで、下流のターゲットドメインに適応させる。
CLIPモデルは、解釈可能な認識のためのきめ細かい視覚的手がかりにはほとんど焦点を合わせられない。
この問題に対処するために、局所的な視覚的特徴とテキスト意味論の整合性に監督が欠如しているため、私たちは自己監督情報に目を向ける。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 04:49:26 GMT)
MI-DPG: Decomposable Parameter Generation Network Based on Mutual Information for Multi-Scenario Recommendation [19.0] MI-DPGはシナリオ条件付き動的モデルパラメータをより効率的かつ効果的に学習する。
3つの実世界のデータセットによる実験により、MI-DPGは従来のマルチシナリオレコメンデーションモデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:07:14 GMT)
Generalized Discrete Diffusion from Snapshots [18.2] GDDSは離散拡散モデリングのための統一的なフレームワークである。
これは大きな離散状態空間上の任意のノイズ発生プロセスをサポートする。
逆のプロセスでは、スナップショットラテントに基づいた単純なエビデンスローバウンド(ELBO)を導出する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:58:01 GMT)
Semi-Supervised Learning with Balanced Deep Representation Distributions [18.0] バランスの取れた深層表現分布(S2TC-BDD)を用いた半教師付きテキスト分類法を提案する。
我々はS2TC-BDDのマルチクラス分類版とマルチラベル分類版の両方を実装し、擬似ラベルのトリックや正規化用語を導入している。
実験の結果,特にラベル付きテキストが不足している場合,S2 TC-BDDの有効性が示された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 04:46:58 GMT)
Unpacking Interaction Profiles and Strategies in Human-AI Collaborative Problem Solving: A Cognitive Distribution and Regulation Perspective [17.9] 本研究は,人間とAIのコラボレーションのパターンとダイナミクスを調べるために,分散認知と学習視点の制御を統合的に導入する。
Delegated Reasoning(DR)、Jointed Interpretation(CI)、Delegated Elaboration(DE)の3つの異なる協調的問題解決モードが同定された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:21:55 GMT)
When Minor Edits Matter: LLM-Driven Prompt Attack for Medical VLM Robustness in Ultrasound [17.3] 超音波を含む医用画像解析において,視覚言語モデル(VLM)は強いマルチモーダル推論能力と競合性能を示した。
Med-VLMは自然言語による命令で動作し、プロンプトの定式化を現実的で実用的に悪用可能な脆弱性点にしている。
本稿では,大規模言語モデル(LLM)を応用したスケーラブルな対数評価フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 03:58:34 GMT)
Learning from Label Proportions with Dual-proportion Constraints [17.1] LLP(Learning from Label Proportions)は、トレーニングデータがバッグ、すなわちインスタンスのグループから構成される弱い教師付き問題である。
この設定は、プライバシ制約がインスタンスレベルのアノテーションへのアクセスを制限する場合や、きめ細かいラベル付けがコストがかかる場合、あるいは実用的でない場合、広く適用されます。
トレーニング中の2値比制約(LLP-DC)を利用して,バッグレベルとインスタンスレベルの両方で実施する手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 10:08:12 GMT)
Gradient Descent with Projection Finds Over-Parameterized Neural Networks for Learning Low-Degree Polynomials with Nearly Minimax Optimal Rate [16.0] 本稿では、真次を識別し、ほぼ最適な回帰率を達成する新しい適応度選択アルゴリズムを提案する。
我々の結果は、通常のニューラル・タンジェント・カーネル(NTK)限界を超えています。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 05:06:17 GMT)
Anatomical Prior-Driven Framework for Autonomous Robotic Cardiac Ultrasound Standard View Acquisition [15.9] 解剖学的前駆体(AP)駆動のフレームワークが提案され,心臓構造セグメンテーションと自律型プローブ調整を統合した。
APは、確率的なAPを構築するために、空間関係グラフ(SRG)モジュールに取り付けられる。
実験はフレームワークの有効性を検証する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:11:44 GMT)
Zero-Shot Vulnerability Detection in Low-Resource Smart Contracts Through Solidity-Only Training [15.7] スマートコントラクトは分散金融に変化をもたらしたが、そのロジックの欠陥は依然として大きなセキュリティ脅威を生み出している。
既存の脆弱性検出技術のほとんどは、Solidityのような言語に重点を置いているが、Vyperのような低リソースの言語は、分析ツールの不足とラベル付きデータセットの制限により、ほとんど探索されていない。
次に、Sol2Vyを紹介します。Sol2Vyは、SolidityからVyperへのクロスランゲージな知識伝達を可能にする新しいフレームワークで、Solidityに特化してトレーニングされたモデルを使用して、Vyperの脆弱性検出を可能にする。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 04:53:29 GMT)
From Natural Language to Executable Properties for Property-based Testing of Mobile Apps [15.2] 本稿では,自然言語のプロパティ記述を自動的に実行可能なプロパティに変換する,新しい構造化プロパティ合成手法を提案する。
提案手法はUIセマンティックグラウンドと実行可能プロパティ合成に分解する。
iPBTは実行可能プロパティの書き込みに要する時間を56%削減できることを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:47:25 GMT)
Beyond Memorization: Distinguishing between Reductive and Epistemic Reasoning in LLMs using Classic Logic Puzzles [14.7] 記憶化は、新しいインスタンスが既知の問題にマップされる特別な還元の場合として理解される。
いくつかの大きなモデルは縮小によって成功するが、他のモデルは早期に失敗し、全てのモデルは疫学的な推論が必要になったときに苦労する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:18:17 GMT)
Graph-of-Constraints Model Predictive Control for Reactive Multi-agent Task and Motion Planning [14.7] 本稿では,MPCと統合された汎用シーケンス・オブ・制約フレームワークであるGoC-MPCを紹介する。
GoC-MPCは、部分的に順序付けられたタスク、動的エージェント調整、障害回復を自然にサポートする。
実験により、GoC-MPCは、最近のベースラインと比較して、高い成功率、はるかに高速なTAMP計算、より短い全体パスを実現することが示された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 20:10:56 GMT)
SkinCLIP-VL: Consistency-Aware Vision-Language Learning for Multimodal Skin Cancer Diagnosis [14.6] SkinCLIP-VLは、皮膚がん診断の基礎モデルに適応する資源効率の高いフレームワークである。
冷凍CLIPエンコーダと軽量量子化Qwen2.5-VLをローランク適応(LoRA)により統合する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 02:07:45 GMT)
WARBENCH: A Comprehensive Benchmark for Evaluating LLMs in Military Decision-Making [14.6] 大規模言語モデルは、安全クリティカルな軍事アプリケーションへの展開のために、ますます検討されている。
既存のフレームワークは通常、国際人道法(IHL)に基づく厳格な法的制約を無視し、エッジコンピューティングの制限を省略し、明確な推論を不十分に評価する。
本稿では,4つの異なるストレス試験次元とともに基礎的戦術的ベースラインを確立する総合的な評価フレームワークであるWARBENCHについて述べる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:13:29 GMT)
ReDiffuse: Rotation Equivariant Diffusion Model for Multi-focus Image Fusion [14.4] 不正なMFIF問題に拡散モデルを適用する上で重要な課題は、デフォーカスブラーが共通対称な幾何学構造を歪ませたり変形させたりすることができることである。
MFIFの回転同変拡散モデルであるReDiffuseを提案する。
ReDiffuseは6つの評価指標に対して0.28-6.64%の改善を達成している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 08:52:41 GMT)
Bayesian Active Object Recognition and 6D Pose Estimation from Multimodal Contact Sensing [14.4] 共同物体認識と6次元ポーズ推定のための能動的触覚探索フレームワークを提案する。
提案手法は、手首力/トルクセンシング、GelSight触覚センシング、自由空間制約を統合する。
その結果,触覚情報や自由空間情報を組み込むことで認識精度が向上し,推定精度と安定性が向上することがわかった。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 21:30:23 GMT)
Graph of States: Solving Abductive Tasks with Large Language Models [14.1] 本稿では,誘拐作業に適した汎用神経シンボルフレームワークであるGraph of Statesを紹介する。
GoSは、論理的依存関係を明示的にエンコードする因果グラフと、推論プロセスの有効な遷移を管理する状態マシンを利用する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:14:23 GMT)
CounterScene: Counterfactual Causal Reasoning in Generative World Models for Safety-Critical Closed-Loop Evaluation [13.4] 提案するフレームワークであるCounterSceneは, 閉ループ生成型BEV世界モデルと, 構造的対実的推論を併用したフレームワークである。
もし因果的に重要なエージェントが違った振る舞いをしたとしたら?
論文参考訳(メタデータ) (Sun, 22 Mar 2026 07:44:16 GMT)
Proposal for erasure conversion in integer fluxonium qubits [12.9] 整数フラクトロニウム量子ビット(IFQ)における$|erangle-|frangle$および$|grangle-|frangle$ qubitsの消去変換スキームを提案する。
本稿では,分散読み出しに基づく消去変換プロトコルについて考察する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 01:33:48 GMT)
Reading Between the Lines: How Electronic Nonverbal Cues shape Emotion Decoding [12.7] 本稿では,マイクロブログ通信における電子的非言語的手がかり(eNVC)の理論的説明を提供する。
eNVCはキネシクス、音声学、パラ言語学のテキストアナログである。
研究1では,基礎的非言語コミュニケーション理論に基づくeNVCの統一分類法を開発した。
実験2では、eNVCが感情的復号精度を大幅に向上させるという、制御された因果的証拠が提示されている。
研究3では、焦点グループによる議論を通じて、ユーザーがデジタル韻律について推論する際に使用する解釈的戦略を明らかにした。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 03:30:54 GMT)
Positional Segmentor-Guided Counterfactual Fine-Tuning for Spatially Localized Image Synthesis [12.5] 本研究では,各構造を地域区分に分割し,地域ごとの独立測定を導出する位置情報セグ-CFTを提案する。
冠動脈造影による冠動脈造影では,Pos-Seg-CFTは領域特異的な現実的な変化を生じ,疾患の進行をモデル化するためのより詳細な空間制御を提供することが示された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:12:16 GMT)
AgentHER: Hindsight Experience Replay for LLM Agent Trajectory Relabeling [12.4] AgentHERは、自然言語エージェントトラジェクトリにHindsight Experience原則を適用することで、失われたトレーニング信号を回復する。
破棄された障害を高品質のSFT、DPO、ShareGPTトレーニングデータに変換する。
WebArena Replay (Zhou et al., 2024)とToolBench (Qin et al., 2024)では、AgentHERは4つのモデルファミリーで成功のみのSFTを+7.1-11.7ppで改善している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:36:58 GMT)
AdaRubric: Task-Adaptive Rubrics for LLM Agent Evaluation [12.4] LLM-as-Judgeの評価は、固定されたルーリックがこのタスクにとって重要なものをキャプチャできないため、エージェントタスクに失敗する。
本稿では,タスク記述からタスク固有の評価文を生成するADARUBRICを提案する。
WebArenaとToolBenchでは、ADARUBRICはデプロイメントグレードの信頼性を備えた人間相関(最高の静的ベースラインに対する+0.16)を実現している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:47:34 GMT)
ORACLE: Optimizing Reasoning Abilities of Large Language Models via Constraint-Led Synthetic Data Elicitation [12.1] 我々は、シロジック推論にインスパイアされた構造化データ生成フレームワークORACLEを紹介する。
これは、大きな言語モデルの生成的強みと象徴的な監督を統合する。
ORACLEは、きめ細かいステップレベルの検証を可能にし、高品質なマルチステップ推論データの構築を容易にする。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:30:43 GMT)
EmoTaG: Emotion-Aware Talking Head Synthesis on Gaussian Splatting with Few-Shot Personalization [12.0] 本稿では,Pretrain-and-Adaptパラダイムをベースとした,数発の感情認識型3D音声ヘッド合成フレームワークであるEmoTaGを紹介する。
我々の重要な洞察は、3Dガウスを直接変形するのではなく、構造化FLAMEパラメータ空間の運動予測を再構成することである。
そこで我々は,頭部ポーズと上面手がかりを補足しながら,音声から情緒的韻律を捉えたGated Residual Motion Network (GRMN)を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:17:01 GMT)
VisFly-Lab: Unified Differentiable Framework for First-Order Reinforcement Learning of Quadrotor Control [11.8] 微分可能なシミュレーションによる一階強化学習は、二次制御に有望である。
しかし、実際の進歩はタスク固有の設定で断片化されている。
マルチタスク四元数制御のための統合微分可能なフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 08:42:26 GMT)
Long-Term Outlier Prediction Through Outlier Score Modeling [11.1] 本研究は,時間系列外乱検出において,新たな問題設定である長期外乱予測を提案することにより,重要なギャップを解消するものである。
従来の手法は主に、通常のパターンから逸脱を特定することによって、即時検出に焦点を当てていた。
特定のモデルに依存しない単純で教師なしの2層手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:24:42 GMT)
DomAgent: Leveraging Knowledge Graphs and Case-Based Reasoning for Domain-Specific Code Generation [10.6] DomAgentは大規模言語モデル(LLM)のための自律型コーディングエージェントである
DomRetrieverは、人間がドメイン固有の知識を学ぶ方法をエミュレートする、新しい検索モジュールだ。
実験の結果,DomAgentはドメイン固有のコード生成を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:39:32 GMT)
Mitigating Objectness Bias and Region-to-Text Misalignment for Open-Vocabulary Panoptic Segmentation [10.6] オープン・ボキャブラリ・パン光学セグメンテーションのためのシンプルなモジュラー・フレームワークであるOVRCOATを紹介する。
COATはバックグラウンド/地上確率を更新し、語彙外オブジェクトのための高品質なマスクを保存する。
OVRCOATはADE20Kに新たな技術状況を設定し、Mapillary VistasとCityscapesに明確な利益をもたらす。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 20:11:52 GMT)
Reward Sharpness-Aware Fine-Tuning for Diffusion Models [10.0] 人間のフィードバックからの強化学習は、大きな言語モデルと人間の好みを合わせるのに有効であることが証明されている。
RDRLは、報酬のスコアが、知覚的品質の改善を伴わずに増加するような、報酬のハッキングの影響を受けやすいままである。
我々は、リトレーニングを必要とせず、頑健な報酬モデルから勾配を利用する手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 11:32:50 GMT)
Fingerprinting Deep Neural Networks for Ownership Protection: An Analytical Approach [10.0] AnaFPは、理論的指導の下で指紋を構成する分析的なフィンガープリントスキームである。
ストレッチ係数の上下境界を決定する性質を定式化する。
実験の結果、AnaFPは従来手法よりも一貫して優れていた。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 21:31:11 GMT)
SleepVLM: Explainable and Rule-Grounded Sleep Staging via a Vision-Language Model [9.7] SleepVLM(スリープVLM)は、多チャンネルポリソムノグラフィー(PSG)波形画像から睡眠を行うために設計された、ルール付き視覚言語モデル(VLM)である。
スリープVLMは、American Academy of Sleep Medicine (AASM) の基準に基づいて、臨床で読みやすい合理性を生成する。
専門家による評価では、実際の正確性、証拠の包括性、論理コヒーレンスの平均スコアが4.0/5.0を超え、モデルの推論の品質が検証された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:18:04 GMT)
Improving Coherence and Persistence in Agentic AI for System Optimization [9.4] Engramは、反復的にメカニズムを設計、テスト、分析する一連のエージェントを探索する。
本研究では,マルチクラウドマルチキャスト推論,LLM要求ルーティング,自然言語クエリを用いたデータベースにおけるKVキャッシュ再利用の最適化など,さまざまな領域において優れた性能を示すことを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:04:50 GMT)
Constrained Online Convex Optimization with Memory and Predictions [9.4] 制約付きオンライン凸最適化(COCO-M)について検討し、損失と制約は学習者による過去の意思決定の限られた窓に依存している。
この設定は、以前研究された制約のないオンライン最適化をメモリフレームワークで拡張し、制約された動的システムの制御や再構成予算によるスケジューリングといった実践的な問題を捉えている。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 19:27:28 GMT)
KG-Hopper: Empowering Compact Open LLMs with Knowledge Graph Reasoning via Reinforcement Learning [9.3] 大きな言語モデル(LLM)は、印象的な自然言語能力を示すが、知識集約的な推論タスクにしばしば苦労する。
KG-Hopperは,マルチホップKG推論を行う機能を備えた,コンパクトなオープンLLMを実現する,新しい強化学習フレームワークである。
我々は、KG-Hopperがより大規模なマルチステップシステム(最大70B)を一貫して上回り、プロプライエタリモデルとの競合性能を達成することを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 23:07:29 GMT)
Pruned Adaptation Modules: A Simple yet Strong Baseline for Continual Foundation Models [9.3] Pruned Adaptation Modules (PAM)は、トレーニング済みのResNetの大部分を凍結する、シンプルだが効果的な方法である。
PAMは相変わらず壊滅的な忘れ込みを軽減し、最先端のFMベースのCILアプローチより優れています。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 11:15:34 GMT)
ViCLSR: A Supervised Contrastive Learning Framework with Natural Language Inference for Natural Language Understanding Tasks [9.2] ViR(Vietnamese Contrastive Learning for Sentence Representations)は、ベトナム語における文の埋め込みを最適化するために設計された、教師付きコントラスト学習フレームワークである。
実験の結果,5つのベンチマークNLUデータセット上で,VRは強力なモノリンガル事前学習モデルであるPhoBERTよりも優れていた。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 06:46:26 GMT)
Plant Taxonomy Meets Plant Counting: A Fine-Grained, Taxonomic Dataset for Counting Hundreds of Plant Species [9.2] TPC-268は植物分類を取り入れた最初の植物カウントベンチマークである。
データセットには1万の画像と678,050点のアノテーションが含まれている。
植物種は268種類あり、植物種は242種類、植物種はFungiである。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:37:00 GMT)
Conspiracy Frame: a Semiotically-Driven Approach for Conspiracy Theories Detection [8.8] 本稿では, フレーム・セマンティックスとセミオティックスから派生した, エピソード的物語のきめ細かい意味表現について紹介する。
我々は,LLMがドメイン内およびドメイン外においてこの現象を認識できることを観察し,この課題を支援する上でフレームが果たす役割について検討する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:59:59 GMT)
Domain Elastic Transform: Bayesian Function Registration for High-Dimensional Scientific Data [8.7] 幾何学的および関数的アライメントを統一するグリッドフリー確率的フレームワークであるDomain Elastic Transformを提案する。
この問題を厳密なベイズ理論で定式化し、領域変形を共同空間汎関数可能性によって導かれる弾性運動としてモデル化する。
我々はDETがMERFISHデータ上の92%のトポロジ保存を達成することを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:47:29 GMT)
Direct Interval Propagation Methods using Neural-Network Surrogates for Uncertainty Quantification in Physical Systems Surrogate Model [8.4] 工学では、不確実性伝播は不確実な入力の下でシステム出力を特徴づけることを目的としている。
標準区間伝搬は、複雑なシステムに計算コストがかかる最適化問題の解法に依存する。
出力境界を直接予測する区間値回帰問題として区間伝搬を再構成する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 16:25:43 GMT)
LLM-Powered Workflow Optimization for Multidisciplinary Software Development: An Automotive Industry Case Study [8.2] マルチディシプリナ・ソフトウェア・デベロップメント(MSD)では、ドメインの専門家や開発者は互換性のないフォーマリズムと別々のアーティファクトセットをまたいで協力する必要がある。
我々は,Volvo Groupの車両内APIシステムである textttspapi について,192のエンドポイント,420のプロパティ,76のCAN信号を含むアプローチを評価した。
自動ワークフローは、API開発時間を約5時間から7分以内に短縮し、93.7%のF1スコアを達成した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:59:28 GMT)
The Role of Road Features and Vehicle Dynamics in Cost-Effective Autonomous Vehicles Safety Testing: Insights from Instance Space Analysis [8.0] テストシナリオの静的および動的特徴とその依存性間の関係がAVテストシナリオの結果にどのように影響するかを実証的に分析する。
本研究は, 検査結果に影響を及ぼす重要な特徴(安全クリティカル状態につながるかによっては, 有効・非有効)を同定する。
その結果、静的特徴と動的特徴を組み合わせることで予測精度が向上し、両方の特徴タイプでトレーニングされたモデルで確認された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 05:20:47 GMT)
ConsRoute:Consistency-Aware Adaptive Query Routing for Cloud-Edge-Device Large Language Models [7.9] ConsRouteは、大規模言語モデルのための軽量でセマンティックな、適応的なルーティングフレームワークである。
ConsRouteは、エンドツーエンドのレイテンシと推論コストを40%近く削減しながら、ほぼクラウドのパフォーマンス(=95%)を達成することを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:54:12 GMT)
A Large-Scale Remote Sensing Dataset and VLM-based Algorithm for Fine-Grained Road Hierarchy Classification [7.8] 本稿では,大規模階層的な道路データセットであるSYSU-HiRoadsと,視覚言語幾何学フレームワークであるRoadReasonerを紹介する。
SYSU-HiRoadsは、中国河南省の3631km2のGF-2画像から作られ、1079枚の画像タイルを0.8mの空間解像度で収めている。
RoadReasonerは、堅牢な路面マスク、トポロジ保存ロードネットワーク、セマンティックコヒーレントな階層割り当てを生成するように設計されている。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:26:28 GMT)
DMMRL: Disentangled Multi-Modal Representation Learning via Variational Autoencoders for Molecular Property Prediction [7.7] 分子表現を共有(構造関連)およびプライベート(モダリティ特化)潜在空間に分散させる変分オートエンコーダを提案する。
提案手法は, 特性予測に最も有用な特徴を効果的に分離するものである。
7つのベンチマークデータセットの実験的検証は、最先端のアプローチと比較してDMMRLの優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 07:53:08 GMT)
Context Selection for Hypothesis and Statistical Evidence Extraction from Full-Text Scientific Articles [7.5] 論文の要約における一次発見の文が、論文本体の対応する仮説文に関連付けられている、逐次全文抽出設定について検討する。
対象のコンテキスト選択は、全文プロンプトに対する仮説抽出を一貫して改善する。
オラクルの段落でさえ、パフォーマンスは穏やかであり、ハイブリッドな数値-テクスチュアルステートメントを扱う際に、永続的な抽出子制限を示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 12:28:21 GMT)
LSA: A Long-Short-term Aspect Interest Transformer for Aspect-Based Recommendation [7.0] アスペクトベースレコメンデーションのための長短アスペクト関心変換器(LSA)を提案する。
LSAは、長期的な側面と短期的な側面の両方を統合することで、ユーザの好みの動的な性質を捉えている。
4つの実世界のデータセットで実施された実験では、LSAは平均2.55%MSEを改善している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:00:33 GMT)
Dynasto: Validity-Aware Dynamic-Static Parameter Optimization for Autonomous Driving Testing [7.0] 自律運転システムにおける安全クリティカルな障害を明らかにするための2段階のテスト手法であるDynastoを提案する。
まず、時間論理に基づく妥当性基準を用いた強化学習を用いて、敵エージェントを訓練する。
第二に、遺伝的アルゴリズムは、敵の失敗を誘発する振る舞いを再生しながら初期条件を探索し、RLエージェントだけでは発見できない追加の失敗を明らかにする。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:35:30 GMT)
Hardware Trojans from Invisible Inversions: On the Trojanizability of Standard Cell Libraries [6.9] 異なる論理関数を実装した細胞は,SEM画像では視覚的に識別できない。
我々はこの特性を利用して、ステルスで標準セルベースのハードウェアであるTrojansを構築します。
以上の結果から, セルライブラリーの「トロイジャンライズ可能性」を評価できる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:33:09 GMT)
Does Mechanistic Interpretability Transfer Across Data Modalities? A Cross-Domain Causal Circuit Analysis of Variational Autoencoders [6.6] タブラル画像関連変分オートエンコーダ(VAE)は、計算、異常検出、合成データ生成にますます利用されている。
本稿では、因果効果強度(CES)の後方校正、経路特異的アクティベーションパッチング、FGD(Feature-Group Disentanglement)の3つの新しい手法を紹介する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:51:45 GMT)
Tracing Users' Privacy Concerns Across the Lifecycle of a Romantic AI Companion [6.5] ロマンチックなAIにおけるプライバシは、アクセス、開示、解釈、保持、終了にまたがる社会技術的ガバナンスの進化的問題として最もよく理解されている。
発見は、使用ライフサイクルにまたがって実施されるロマンチックなAIにおいて、プライバシと安全管理の必要性を強調している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 07:49:59 GMT)
Affordance-Guided Enveloping Grasp Demonstration Toward Non-destructive Disassembly of Pinch-Infeasible Mating Parts [6.5] 本稿では,物理シミュレーションにより包み込み候補を事前に生成する空き誘導型遠隔操作法を提案する。
実ロボット実験は、ATベースの視覚拡張により、オペレーターが効果的に選択し、包括的把握戦略を教えることができることを示した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:36:51 GMT)
PAS3R: Pose-Adaptive Streaming 3D Reconstruction for Long Video Sequences [6.5] PAS3Rはポーズ適応型ストリーミング再構成フレームワークで、カメラの動きやシーン構造に応じて動的に状態更新を変調する。
PAS3Rは、長いビデオシーケンスにおける軌道精度、深さ推定、点雲再構成の精度を著しく向上することを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:57:30 GMT)
The Intelligent Disobedience Game: Formulating Disobedience in Stackelberg Games and Markov Decision Processes [6.1] 共有自律においては、自動アシスタントが人間の指示に従うか、危害を防ぐために意図的にオーバーライドするかを選択しなければならないとき、緊張が発生する。
本稿では,Stackelberg ゲームに基づく逐次ゲーム理論フレームワークである Intelligent Disobedience Game (IDG) を紹介する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:50:32 GMT)
Deliberative multi-agent large language models improve clinical reasoning in ophthalmology [6.0] 大型言語モデル(LLMs)は眼科臨床推論の可能性を示すが、個々のモデルでは害をもたらすリスクがある。
マルチエージェント LLM 審議会が診断性能を改善し,害を軽減するかを検討した。
評議会は3つの階層のそれぞれにまたがって、プールされた個々のモデルを一貫して上回った。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 23:36:48 GMT)
Joint Surrogate Learning of Objectives, Constraints, and Sensitivities for Efficient Multi-objective Optimization of Neural Dynamical Systems [5.9] 生物物理学のニューラルネットワークシミュレーションは、最も計算に要求される科学応用の1つである。
DMOSOPTは、統一された学習されたサロゲートモデルを活用するスケーラブルな最適化フレームワークである。
計算神経科学の文脈において動機付けられ、実証される一方で、このフレームワークは一般に、制約付き多目的最適化問題に適用できる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:06:28 GMT)
FinRL-X: An AI-Native Modular Infrastructure for Quantitative Trading [5.8] FinRL-Xはモジュール式でデプロイに一貫性のあるトレーディングアーキテクチャである。
データ処理、戦略構築、バックテスト、ブローカ実行を重み中心のインターフェースで統一する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:13:10 GMT)
Implicit Maximum Likelihood Estimation for Real-time Generative Model Predictive Control [5.7] Implicit Maximum Likelihood Estimation (IMLE) は、計画のための新たな生成モデリング手法である。
本結果は,IMLEが標準オフライン強化学習ベンチマーク上での競合性能を実証するものである。
我々はまた、IMLEをクローズドループの人間ナビゲーションシナリオで検証し、高速かつ適応的な計画生成を可能にする方法を示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:49:00 GMT)
Sparse but not Simpler: A Multi-Level Interpretability Analysis of Vision Transformers [5.7] We evaluate the relationship between weight sparsity and interpretability in Vision Transformers using DeiT-III B/16 models pruned with Wanda。
その結果, 構造的効果は明らかだが, 解釈可能性の向上は限られていることがわかった。
これらの結果は、構造的疎結合だけでは、より解釈可能な視覚モデルが確実に得られないことを示唆している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 19:33:42 GMT)
Statistics-governed dynamical scaling in interacting anyonic chains [5.6] 一次元格子におけるエノンの極端平衡多体緩和について検討する。
弱い相互作用状態においては、任意の統計量によって粒子輸送の急激な超拡散的スケーリングが導かれる。
我々の結果は、ボソンやフェルミオン以外の普遍的非平衡力学の明確な源として、正準統計を定めている。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:24:45 GMT)
How Psychological Learning Paradigms Shaped and Constrained Artificial Intelligence [5.6] 人工知能の主流のパラダイムは、心理学から理論を学ぶことによって形成された。
本稿では、それぞれのAIパラダイムが、強みだけでなく、それを引き起こした心理的理論の構造的制約を継承したことを論じる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:23:15 GMT)
Mitigating Selection Bias in Large Language Models via Permutation-Aware GRPO [5.4] 大規模な言語モデルは、オプションの位置やラベル記号のような非意味的な要因による選択バイアスを示すことが多い。
本稿では,置換対応群相対ポリシー最適化(PA-GRPO)を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 02:29:40 GMT)
When and Where: A Model Hippocampal Network Unifies Formation of Time Cells and Place Cells [5.4] いずれのタイプも,海馬CA3を予測コーダとしてモデル化した単一ネットワーク(RNN)の2つの動的状態から出現することを示す。
空間ナビゲーション中、ネットワークは安定したアトラクタのような場所場を生成する。しかし、時間的に構造化された入力に基づいて訓練されたネットワークは、時系列的に拡張されたフィールドを生成し、時間セルを再カプセル化する。
これらの結果は、場所と時間細胞間の共通起源であるが、タスク駆動の違いを示唆している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:52:27 GMT)
Dynamic Control Barrier Function Regulation with Vision-Language Models for Safe, Adaptive, and Realtime Visual Navigation [5.3] 我々は、エゴセントリックなRGB入力を用いてCBF安全フィルタの保守性をリアルタイムで適応する視覚制御ナビゲーションフレームワークAlphaAdjを提案する。
その結果、AlphaAdjは衝突のないナビゲーションを維持しつつ、(パスの長さとゴールまでの時間の観点から)効率を最大18.5%改善していることがわかった。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:35:18 GMT)
Boundary-Aware Instance Segmentation in Microscopy Imaging [4.9] 本稿では,二項マスクの代わりに符号付き距離関数(SDF)を予測する,プロンプトフリーでバウンダリ対応のインスタンスセグメンテーションフレームワークを提案する。
学習されたシグモイド写像は、SDFを確率写像に変換し、鋭い境界ローカライゼーションをもたらす。
訓練は、統一されたハウスドルフ距離(MHD)の喪失によって導かれる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 12:59:22 GMT)
Stream separation improves Bregman conditioning in transformers [4.8] 変換器表現を操る線形手法は、表現空間の幾何学がユークリッド的であることを暗黙的に仮定する。
Park et al. は、ソフトマックスは、計量テンソルが対数正規化子のヘシアンである曲線化されたブレグマン幾何学を誘導することを示した。
制御された2x2設計ストリーム分離における中間層におけるこのヘシアンを層間監視により測定する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 16:55:57 GMT)
Behavioural feasible set: Value alignment constraints on AI decision support [4.8] 組織が意思決定支援のために商用AIシステムを採用する場合、透過的でも再交渉不可能なベンダーによって埋め込まれた価値を継承する。
私はこれを実現可能なセットとして定式化し、ベンダーが定めるアライメント制約の下で到達可能な勧告の範囲を定式化し、組織的な要求がシステムの柔軟性を超えた場合の診断しきい値を特徴付けます。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:52:42 GMT)
Security and Privacy in O-RAN for 6G: A Comprehensive Review of Threats and Mitigation Approaches [4.7] Open Radio Access Network (O-RAN) は、通信分野における大きな進歩である。
本稿では,O-RANアーキテクチャに関連するセキュリティ上の脆弱性とプライバシの問題について包括的に調査する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:11:10 GMT)
OrbitStream: Training-Free Adaptive 360-degree Video Streaming via Semantic Potential Fields [4.7] セマンティックなシーン理解とロバストな制御理論を組み合わせた,トレーニング不要なフレームワークOrbitStreamを提案する。
多様なネットワークトレースに関する3600のモンテカルロシミュレーションで、OrbitStreamの平均QoEは2.71である。
このシステムは、最小リバッファイベントで1.01ミリ秒の平均決定遅延を示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 01:16:40 GMT)
Mechanisms of Introspective Awareness [4.7] 最近の研究は、LCMが残留ストリームにステアリングベクターが注入されたときに検出し、注入された概念を特定できることを示している。
しかし、この能力を支えるメカニズムはどのようなもので、本物の内省回路を反映しているか、あるいはより浅い認識を反映しているのか?
本稿では,これらの疑問をオープンソースモデルで調査し,主要な3つの知見を定めている。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 20:45:34 GMT)
COINBench: Moving Beyond Individual Perspectives to Collective Intent Understanding [4.6] COIN-BENCHは、大言語モデル(LLM)を集合的意図的理解に基づいて評価する、ライブ更新ベンチマークである。
トランザクション結果にフォーカスする従来のベンチマークとは異なり、COIN-BENCHは階層的な認知構造として意図を運用している。
このフレームワークは、階層的な認知的構造化と検索強化検証(COIN-RAG)のためのCOIN-TREEを組み込んで、生の人的議論を分析するための専門家レベルの精度を確保する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:12:14 GMT)
Estimating the Social Cost of Corporate Data Breaches [4.4] 本研究は,被害者への影響とポケット外費用から,データ漏洩の真価,社会的コストを推定できるかどうかを検討する。
調査の結果,2016年以降,被害者当たりの平均社会費は大幅に減少した。
実世界のケースにモデルを適用すれば、特定のメガリーチイベントの上限以上の社会的コストを見積もることができる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:57:44 GMT)
Sequential Transport for Causal Mediation Analysis [4.2] シーケンシャルトランスポート(ST)は、最適なトランスポート(OT)とメディエータ指向非環状グラフ(DAG)を組み合わせた媒介分析のための分散フレームワークである
数値メディエータでは、STは条件付きCDF/量子推定器に基づいて単調(条件付き)OTマップを使用する。
標準正則性と支持条件下では, 推定輸送マップの整合性と, 誘導された単位レベルの分解から, 直接的および間接的効果への整合性を確立する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:35:23 GMT)
An InSAR Phase Unwrapping Framework for Large-scale and Complex Events [4.2] 地震に伴う変形では、浅い震源が表面破壊断層や急激な変位不連続を発生させ、相連続性を著しく破壊し、しばしば従来のアンラッピングアルゴリズムが失敗する。
本稿では,大規模な干渉計処理と変形による不連続性に対応するために開発された拡散モデルに基づく位相アンラッピングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 19:30:54 GMT)
MS-CustomNet: Controllable Multi-Subject Customization with Hierarchical Relational Semantics [4.1] マルチオブジェクトカスタマイズのための新しいフレームワークであるMS-CustomNetを紹介する。
MS-CustomNetは複数のユーザが提供するオブジェクトのゼロショット統合を可能にする。
DINO-Iスコアが0.61、YOLO-Lスコアが0.94となり、多目的カスタマイズタスクにおける位置制御が可能となった。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:15:21 GMT)
Decomposing Probabilistic Scores: Reliability, Information Loss and Uncertainty [4.0] 我々は、条件付き特性を明示する任意の適切な損失に対する分解IDを開発する。
我々はこのフレームワークを利用して、ポストホックリカレーション、モデルのアグリゲーション、ステージワイズ/ブースティングの構成を分析します。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:33:22 GMT)
Amortized Variational Inference for Logistic Regression with Missing Covariates [4.0] Amortized Variational Inference for Logistic Regression (AV-LR) は、バイナリロジスティック回帰のための統一されたエンドツーエンドフレームワークである。
AV-LRは、確率的生成モデルと単純な償却推論ネットワークを統合する。
計算コストを大幅に削減し、最先端のEMライクなアルゴリズムと同等かそれ以上の精度で推定できる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:00:59 GMT)
Sonny: Breaking the Compute Wall in Medium-Range Weather Forecasting [4.0] 我々は、競争力のある中距離予測性能を実現する効率的な階層変換器であるSonnyを紹介する。
WeatherBench2では、Sonnyは堅牢な中距離予測スキルを獲得し、運用ベースラインと競合し続け、FastNetよりも明確なアドバンテージを示している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:15:38 GMT)
3D Multi-View Stylization with Pose-Free Correspondences Matching for Robust 3D Geometry Preservation [3.5] アートスタイルの転送は画像やビデオでよく研究されているが、マルチビューの3Dシーンに拡張することは難しい。
独立したビューごとのスタイリングは、しばしばテクスチャドリフト、湾曲したエッジ、一貫性のないシェーディングを引き起こす。
この論文は、カメラのポーズや明示的な3D表現を仮定することなく、下流の3Dタスクに使用できるマルチビュースタイリングに対処する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 01:23:34 GMT)
Mixture of Chapters: Scaling Learnt Memory in Transformers [3.5] トランスフォーマーは、トレーニング中に取得した知識を保存し、整理するための明示的なアーキテクチャメカニズムを欠いている。
学習可能なスパースメモリバンク、潜在トークン、ランダムおよび訓練されたエンドツーエンドを導入します。
本研究では、Mixture-of-Expertsアーキテクチャにインスパイアされた章ベースのルーティングを提案し、メモリバンクを章に分割し、入力毎に関連するサブセットを選択するルータを訓練する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 07:16:58 GMT)
A Generalised Exponentiated Gradient Approach to Enhance Fairness in Binary and Multi-class Classification Tasks [3.4] まず,複数クラス分類におけるフェアラーニングの問題を,有効性と複数の線形フェアネス制約の間の多目的問題として定式化する。
本稿では,この課題を解決するための汎用指数勾配(GEG)アルゴリズムを提案する。
GEGは、複数のフェアネス定義の下で、バイナリとマルチクラスの分類設定における公平性を高める内部処理アルゴリズムである。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 20:35:12 GMT)
Rethinking Plasticity in Deep Reinforcement Learning [3.2] 本稿では, 深部強化学習(RL)における塑性損失の基本的なメカニズムについて検討する。
本稿では,従来のタスクの最適点が,新しいタスクの局所的最適度に乏しいため,可塑性損失が発生することを示唆する最適化・中心塑性(OCP)仮説を提案する。
複雑なドメインにおけるネットワーク可塑性の理解と復元のための厳密な最適化に基づくフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 11:27:16 GMT)
Awakening: Modern Challenges and Opportunities of Software Engineering Research [3.1] ソフトウェア工学の研究は、オープンに利用可能なツール、アクセス可能なシステム、適度なスケールで研究できる問題から何十年も恩恵を受けてきた。
今日では、最も関連性の高いソフトウェアシステムの多くは大規模でプロプライエタリであり、学術界でアクセスや複製が難しい産業環境に埋め込まれている。
本稿では,産業博士課程,長期の産学連携,大規模研究チーム,ムーンショットプロジェクト,資金調達・評価プラクティスの変更など,実践的な方向性について論じる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 21:09:15 GMT)
A Refined Biorthogonal Framework for Non-Hermitian Quantum Theory and Its Application in Dynamical Phase Transition [3.1] 非エルミート系の左右ベクトルの力学はシュルディンガー方程式を満たす必要がある。
我々は生物直交の枠組みを洗練し、非エルミート量子論を一貫した再構成へと導いた。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:13:56 GMT)
Statistical Learning for Latent Embedding Alignment with Application to Brain Encoding and Decoding [3.0] 脳のエンコーディングとデコーディングは、外部刺激と脳活動の関係を理解することを目的としている。
本稿では,2つの統計的学習要素を備えた軽量アライメントフレームワークを提案する。
我々は,大規模なfMRI画像再構成ベンチマークデータに対して,競争力のある実験性能を示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 03:48:16 GMT)
Evaluating Reasoning-Based Scaffolds for Human-AI Co-Annotation: The ReasonAlign Annotation Protocol [2.6] ReasonAlignは推論に基づくアノテーションの足場で、予測されたラベルを保ちながらモデル生成の説明を公開します。
我々はこれを、アノテーションの精度を完全に評価するのではなく、推論が人間のアノテーションの振る舞いにどのように影響するかの制御された研究として捉えている。
以上の結果から, 推論への露出は, 最小限の修正とともに, 合意の増大に結びついていることが示唆された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 07:14:27 GMT)
Persona Vectors in Games: Measuring and Steering Strategies via Activation Vectors [2.4] 我々は、対照的なアクティベーション付加によって、他者の利他主義、許し、期待のためのペルソナベクトルを構築する。
アクティベーションステアリングは、定量的な戦略選択と自然言語の正当化の両方をシフトさせる。
以上の結果から,ペルソナベクトルは戦略的環境における高レベルの特性に対して,有望な機械的ハンドリングを提供する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 20:53:04 GMT)
WorkflowGen:an adaptive workflow generation mechanism driven by trajectory experience [2.3] 大規模言語モデル(LLM)エージェントは、多くの場合、高い推論オーバーヘッド、過剰なトークン消費、不安定な実行、ビジネスクエリやツール使用、ワークフローオーケストレーションといった複雑なタスクにおける過去のエクスペリエンスの再利用が不可能である。
従来のメソッドはクエリ毎にスクラッチから生成され、コストが高く、レスポンスが遅く、ロバスト性が低い。
本稿では,トークン使用率を低減し,効率と成功率を向上する自動ワークフロー生成のための適応的トラジェクトリ駆動フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 16:49:58 GMT)
Lost in Aggregation: On a Fundamental Expressivity Limit of Message-Passing Graph Neural Networks [2.2] グラフグラフニューラルネット(MP-GNN)のほとんどの認識可能なアグリゲーションをキャプチャする関数の一般的なクラスを定義する。
そのようなアグリゲーションを持つMP-GNNモデルは、すべてのグラフ上の同値クラスの2変量しか引き起こさないことを証明している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 08:14:20 GMT)
Contextuality as a Left Adjoint: A Categorical Generation of Orthomodular Structure [2.2] 非分布直交構造が古典的ブール文脈からの左随伴として正則に現れることを示す。
本研究は,せん断閉塞としての文脈性とコリミット不全としての非分布性との正確な対応を確立した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 10:34:21 GMT)
NeSy-Edge: Neuro-Symbolic Trustworthy Self-Healing in the Computing Continuum [2.2] NeSy-Edgeは、コンピュータ連続体における信頼できる自己修復のための神経象徴的なフレームワークである。
NeSy-Edgeは、生のランタイムログを構造化されたイベント表現に変換し、事前制約されたスパースシンボル因果グラフを構築し、因果証拠と過去のトラブルシューティング知識を統合する。
分析品質,因果推論,エンドツーエンド診断,エッジ側リソース利用などを考慮して,複数レベルのセマンティックノイズ下でのLoghubデータセットの性能評価を行った。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:42:13 GMT)
Task-Specific Efficiency Analysis: When Small Language Models Outperform Large Language Models [2.1] 大規模言語モデルは目覚ましい性能を達成するが、資源に制約のあるデプロイメントには適さない相当な計算コストを発生させる。
本稿では,5つの異なるNLPタスクを対象とした16の言語モデルの比較を行った。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 20:19:45 GMT)
Consistent but Dangerous: Per-Sample Safety Classification Reveals False Reliability in Medical Vision-Language Models [2.1] 入力画像ではなくテキストパターンを頼りにすることで,モデルが完全整合性を達成することを示す。
我々は,4つのクワラントの安全分類を導入し,一貫性(パラフレーズ付きプロンプト間の安定な予測)と画像信頼度を共同評価する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:06:53 GMT)
TabPFN Extensions for Interpretable Geotechnical Modelling [1.9] 本稿では,テキスト内学習を用いたトランスフォーマーベース基盤モデルであるTabPFNについて検討する。
本研究では,TabPFN由来の埋め込みにコサイン類似性解析を適用し,反復的推論手法から完全な後部分布を可視化し,SHAPに基づく特徴量の計算を行う。
以上の結果から,データスカース地盤技術における不確実性を考慮したパラメータ推論を支援する基盤モデルツールの可能性が示唆された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 03:06:28 GMT)
The Average Relative Entropy and Transpilation Depth determines the noise robustness in Variational Quantum Classifiers [1.8] 変分量子アルゴリズム(VQA)は量子機械学習(QML)への応用のために広く研究されている。
VQAは主に、ノイズの多いデバイスと限られたリソース可用性に関する不確実な結果のために古典的に評価されている。
本稿では,VQCモデルが,シミュレーションで行うようなノイズのあるデバイス上でも同様に動作するかどうかを検証するために,相対エントロピーに基づく計量法を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:55:15 GMT)
Many Dialects, Many Languages, One Cultural Lens: Evaluating Multilingual VLMs for Bengali Culture Understanding Across Historically Linked Languages and Regional Dialects [1.7] 9つのドメインで1,152枚の手動でキュレートされた画像から構築されたこのベンチマークは、視覚的な質問応答とキャプションをサポートする。
実験の結果,標準バングラのみの評価が真のモデル能力を過大評価していることがわかった。
ドメイン全体において、主なボトルネックは、視覚的な基盤ではなく、文化的知識の欠如である。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 10:55:08 GMT)
Fusing Memory and Attention: A study on LSTM, Transformer and Hybrid Architectures for Symbolic Music Generation [1.6] トランスフォーマーやLong Short-Term Memory(LSTM)ネットワークなどの機械学習技術は、シンボリック・ミュージック・ジェネレーション(SMG)において重要な役割を果たす。
既存の文献は、LSTMとトランスフォーマーの違いとして、局所的なメロディック連続性をモデル化する能力と、グローバルな構造的コヒーレンスを維持する能力があることを示している。
我々の研究は、これらのモデルの重要な特徴を強調し、それらの特性がどのように優れたモデルの設計に活用できるかを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:14:17 GMT)
Efficient Fine-Tuning Methods for Portuguese Question Answering: A Comparative Study of PEFT on BERTimbau and Exploratory Evaluation of Generative LLMs [1.5] 本研究は,ブラジルポルトガル語のSQuAD v1翻訳であるSQuAD-BRにおける質問回答のためのBERTimbauの体系的評価を提示する。
エンコーダをベースとしたモデルは,ブラジルの抽出ポルトガル語QAに対して,大規模な生成LDMよりも計算コストが大幅に低く,効率よく微調整できることを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 21:56:05 GMT)
CornOrb: A Multimodal Dataset of Orbscan Corneal Topography and Clinical Annotations for Keratoconus Detection [1.4] CornOrbは、アルジェリアの患者から収集されたOrbscan角膜トポグラフィー画像と臨床アノテーションの、一般公開されたマルチモーダルデータセットである。
このデータセットは、正常眼889例、角膜565例を含む744例から1,454例からなる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:01:07 GMT)
Multi-Perspective LLM Annotations for Valid Analyses in Subjective Tasks [1.3] パースペクティブ駆動推論は、グループ間のアノテーションの分布を関心の量として扱い、小さな人間のアノテーション予算を使ってそれを見積もる。
我々は、丁寧さと攻撃性評価のタスクを評価し、より厳密なモデル集団に対する目標的改善を示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 21:18:05 GMT)
COMPASS-Hedge: Learning Safely Without Knowing the World [1.3] オンライン学習アルゴリズムは、しばしば基本的なトリレンマに直面している: 敵と敵の設定間の後悔の保証をバランスさせ、固定されたコンパレータに対してベースライン安全性を提供する。
本アルゴリズムは, 敵環境における最小最適後悔 (i) 攻撃環境におけるインスタンス最適後悔 (i) 指定された基本方針に対する$tildemathcalO(1)$後悔 (対数的要因まで) を同時に達成する最初の完全情報手法である。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 04:17:43 GMT)
Efficient Coarse-to-Fine Diffusion Models with Time Step Sequence Redistribution [1.3] 本稿では,粗い特徴生成時の計算量を削減するためにC2F(Coarse-to-Fine Denoising)を導入する。
また,探索に10分もかからない効率的なサンプリング軌道調整のために,時間ステップ列再分配(TRD)を設計した。
実験により,CIFAR10とLSUN-Churchの計算量を80%から90%削減し,ほぼロスレス性能を実現することを確認した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:16:14 GMT)
A transformer architecture alteration to incentivise externalised reasoning [1.3] 我々は,中間層で早期終了機構を備えた既存のトランスフォーマーアーキテクチャを拡張し,次のトークンを深層計算なしで予測できる場合に,より浅い層でモデルを出力するように訓練する。
この効果を小さな推論モデルに適用し、トークン間の計算を適応的に削減することを学ぶことを示す。
適切なスケールで適用すれば、推論モデルが非ミオピック計画を実行するために処理する過剰な計算量を最小化できると予測する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 19:28:21 GMT)
Is the future of AI green? What can innovation diffusion models say about generative AI's environmental impact? [1.1] ジェネレーティブ人工知能(GAI)は、その環境影響について警告を発している。
古典的A-Uイノベーション拡散モデルを用いてGAIエコシステムを解析することにより、この産業の構造を予測できる。
GAIは決して緑色ではないが、その影響は時々主張されるような問題ではないかもしれない。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:00:18 GMT)
Respiratory Status Detection with Video Transformers [1.1] ビデオトランスの最近の進歩により、人工知能システムがビデオからの呼吸障害の兆候を認識できるかどうかを評価する。
以上の結果から,現代のビデオトランスフォーマーは呼吸力学の微妙な変化を認識できる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:16:18 GMT)
The AI Scientific Community: Agentic Virtual Lab Swarms [1.1] 仮想実験室のエージェント群をAIサイエンスコミュニティのモデルとして用いることを提案する。
このパラダイムでは、swarmの各粒子は完全な仮想実験室のインスタンスを表す。
AI Science Communityのワーキングインスタンスは現在開発中である。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:04:23 GMT)
Graph Fusion Across Languages using Large Language Models [1.1] 本稿では,Large Language Models (LLMs) の文脈内推論と多言語セマンティクスを利用した,言語間グラフ融合のためのフレームワークを提案する。
このフレームワークは、トリップレットを直接自然言語シーケンスにマッピングすることで、構造的線形化を実装している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:10:09 GMT)
enhancing reasoning accuracy in large language models during inference time [1.0] 大規模言語モデル(LLM)は、多段階推論タスクでは信頼できないが、強力な言語能力を示すことが多い。
本研究では,LLMの推論精度を向上させるための推論時間手法について検討する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 16:00:07 GMT)
Memory-Nonlinearity Trade-off across Quantum Reservoir Computing Frameworks [1.0] 量子貯水池計算は、時系列処理に量子力学を利用する。
我々は、メモリ制限を含む明らかに無関係なアプローチが、同じ原理で管理されていることを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 19:06:36 GMT)
Personality-Driven Student Agent-Based Modeling in Mathematics Education: How Well Do Student Agents Align with Human Learners? [0.9] 我々は,学生と教師のインタラクション,自己学習,試験の完全なパイプラインを備えた,ビッグファイブ・パーソナリティに基づく学生エージェントモデルを構築した。
学習者の行動の71.4%が人間の学習者と一致していることがわかった。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:43:11 GMT)
DepthTCM: High Efficient Depth Compression via Physics-aware Transformer-CNN Mixed Architecture [0.9] 深度マップ圧縮のための物理対応のエンドツーエンドフレームワークであるDepthTCMを提案する。
99.38%の精度を維持しながらDepthTCMが0.307bppに達することを示す。
さらに、ScanNet++ iPhone RGB-Dサブセット上で、平均エンドツーエンドの推論時間41.48ms(エンコーダ)と47.45ms(デコーダ)を報告する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:43:49 GMT)
A Grid-Based Quantum Algorithm for the Time-Dependent Simulation of Infrared Spectra [0.9] 我々は、量子コンピュータ用に特別に設計された赤外線スペクトルをシミュレーションするための時間依存グリッドベースのフレームワークを開発する。
実験系として水分子の振動モデルを用いて, 基本およびオーバートーン帯の位置と強度を正確に決定できることを示した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 08:42:24 GMT)
Enhancing Brain Tumor Classification Using Vision Transformers with Colormap-Based Feature Representation on BRISC2025 Dataset [0.8] 色マップに基づく特徴表現によって強化された視覚変換器(ViT)に基づく深層学習フレームワークを提案し,脳腫瘍の分類性能を向上させる。
BRISC2025データセットは、グリオーマ、髄膜腫、下垂体腫瘍、非腫瘍の4つのクラスを含む。
提案手法は,ベースライン畳み込みニューラルネットワークモデルよりも優れた98.90%の分類精度を実現する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:46:05 GMT)
Ontology-driven personalized information retrieval for XML documents [0.5] 従来の情報検索システムは、ユーザの知識、好み、目的の違いにもかかわらず、しばしばユーザ固有のニーズを見落としている。
ドメインオントロジーやユーザプロファイルといった外部のセマンティックリソースを検索プロセスに統合する。
その結果,提案フレームワークはXML検索結果の妥当性と適応性を向上し,よりユーザ中心の検索を支援することが示唆された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:29:43 GMT)
ECI: Effective Contrastive Information to Evaluate Hard-Negatives [0.4] ECI: 効果的なコントラスト情報は、情報理論と情報検索の原則に基づくメトリクスである。
我々は,BM25,クロスエンコーダ,および大規模言語モデルを用いてマイニングまたは生成した強負集合のECIを評価する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:21:05 GMT)
Decoding AI Tutor Effects for Educational Measurement: Temporal, Multi-Outcome, and Behavior-Cognitive Analysis [0.3] 本稿では、時間的相互作用パターン、複数結果分析、行動認知学習者プロファイルを用いたAI支援学習のためのAIエージェントプロトタイプフレームワークを提案する。
ヒント、説明、例、コードなど、さまざまなフィードバックフォームを学習者に提供すべく、AIチューターエージェントが開発された。
ニューラルネットワークモデルとシミュレーションフレームワークを使用して、応答時間、試行、ヒント要求、正確性、クイズ結果、改善、満足度、信頼を含む、人工的な学生とAI教師のインタラクションレコードを生成する。
その結果、初期のインタラクションパターンは、後のパフォーマンスと信頼の予測であり、学生の行動はAIベースの授業で時間とともに変化し、学生の行動は変化していることがわかった。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:43:17 GMT)
Benchmarking Bengali Dialectal Bias: A Multi-Stage Framework Integrating RAG-Based Translation and Human-Augmented RLAIF [0.3] 大規模言語モデル(LLM)は、低リソース言語の方言に対する性能バイアスを頻繁に示している。
ベンガル方言9方言を対象に,LLM質問応答における方言バイアスを評価するための2段階の枠組みを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:44:57 GMT)
TimeTox: An LLM-Based Pipeline for Automated Extraction of Time Toxicity from Clinical Trial Protocols [0.3] 時間毒性(英: Time toxicity)とは、臨床治験への参加から生じる累積的な医療接触日であり、重要なが労働集約的な指標である。
We developed TimeTox, a LLM-based pipeline for automated extract of time toxicity from Schedule of Assessments table。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:25:43 GMT)
Topological Anderson Random Laser [0.2] トポロジカルレーザーとランダムレーザーは、フォトニクスにおける障害管理のための2つのコントラスト戦略を具現化している。
ここでは、トポロジカルアンダーソンランダムレーザー(TARL)を用いて、これらの不整合性のように見えるパラダイムを統一できることを実証する。
工学的障害は、システムをトポロジカル絶縁体に駆動し、境界選択型ラシングチャネルとして機能する創発的なキラルエッジ状態を生成することを示す。
本研究は、トポロジカルに保護されたシングルモードラシングへの障害対応可能なフレキシブルルートを確立し、ロバストで高コヒーレンスなフォトニック光源の設計原理を根本的に導入する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:12:45 GMT)
LLM-Based Intelligent Notification Composition: From Static Personalization to Context-Aware Persuasive Messaging [0.2] プッシュ通知は、デジタルプラットフォームがユーザをエンゲージする最も直接的なチャネルのひとつだ。
本稿は,メッセージの品質は独立で,低投資のレバーであり,LLMは,この層で最も差別化された値を生成することを主張する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 01:31:16 GMT)
Probabilistic theories stable under teleportation [0.2] 量子力学の基礎における長年の問題は、なぜベルの不等式の最大値違反が自然界では達成できないのかを説明する物理原理を特定することである。
最近提案された1つのアプローチはベル試験を反復的に検討し、ベル試験は数ラウンドの絡み合い交換を行った状態で行われる。
以上の意味でCHSH値が安定であるすべての一般確率論の分類を与える。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:16:01 GMT)
Computational Concept of the Psyche [0.1] 人工精神構築の文脈における人間の精神をモデル化するためのアプローチの概要を述べる。
エージェントのための汎用知能システムを構築するための計算形式化を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 12:34:32 GMT)
Does AI Homogenize Student Thinking? A Multi-Dimensional Analysis of Structural Convergence in AI-Augmented Essays [0.1] かなりの品質向上は、大きな均質化と共起していることが示される。
凝集構造はその分散の70~78%が失われ、視点の多さは多様化した。
プロンプト特異性は、ホモジェナイゼーションを引数の深さの多様化に逆転させ、ホモジェナイゼーションはAIの本質的な性質ではなく相互作用設計の機能であることを示した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:36:25 GMT)
Evaluating LLM-Generated Lessons from the Language Learning Students' Perspective: A Short Case Study on Duolingo [0.1] フィリピンの多国籍企業の従業員5人をDuolingoの経験から調査した。
その結果、回答者は仕事に関連するシナリオよりも、一般的なシナリオに遭遇したことが判明した。
後者は、ドメイン固有の語彙を含むため、プロフェッショナルな流布へのギャップを埋めるのに役立ちます。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:33:22 GMT)
Which Alert Removals are Beneficial? [0.0] 警告の削除がコードの複雑さやバグの傾向に与える影響を評価します。
8,245件のアラート削除のデータセットを構築しました。
我々は、将来のバグの可能性を減少させる複雑さを低減させる介入を特定した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:05:21 GMT)
When Does Content-Based Routing Work? Representation Requirements for Selective Attention in Hybrid Sequence Models [0.0] ハイブリッドリカレントアテンションアーキテクチャにおけるルーティングパラドックスを同定する。
コンテンツベースのルーティングは、ルーティングが避けるように設計されたペアワイズな計算を必要とすることを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 01:04:57 GMT)
Too much of a good thing? Entrepreneurial orientation and the non-linear governance effects of SaaS platforms [0.0] この研究はハイブリッドガバナンスモデルとして、トランザクションコスト変数が戦略的アライメントにどのように影響するか、起業家指向がこれらの関連を緩和するかを検討する。
研究は、人的資産特異性、使用頻度、中小企業の戦略的目的の逆U字型関連を見出した。
どちらの研究も、戦略的アライメントは長期的パフォーマンスと逆U字型の関係を持ち、過剰な依存がガバナンスによる戦略的成果を損なう可能性があることを示唆している。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:39:23 GMT)
Time-adaptive functional Gaussian Process regression [0.0] 本稿では, 確率場の文脈における経験的ベイズアプローチに基づく, 多様体の関数ガウス過程回帰の新しい定式化を提案する。
同定された測度は、多様体上のラプラス・ベルトラミ作用素の固有関数によって得られる。
関連する時間スペクトルは、この回帰アプローチの実装における次元削減の鍵となるツールを構成する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 09:40:09 GMT)
The non-uniform electron gas [0.0] 量子(古典的)非一様電子ガスの定義を提案する。
気体の不均一性は任意の格子周期背景密度から生じる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 12:39:32 GMT)
The Spillover Effects of Peer AI Rinsing on Corporate Green Innovation [0.0] 本稿は、2006年から2024年までの中国A株上場企業の年次報告のテキストから意味分析を行うために、大規模言語モデルを用いている。
この研究は、企業AIの洗浄が、グリーンイノベーションにかなりの混雑効果をもたらすことを明らかにしている。
本稿では,「市場リターンを高め,資金調達制約を緩和する」ための目標支援ツールを設計することを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:38:26 GMT)
The Myhill-Nerode Theorem for Bounded Interaction: Canonical Abstractions via Agent-Bounded Indistinguishability [0.0] 有限状態コントローラの固定プローブ族は、観測履歴に擬似的に閉ループのワッサーシュタインを誘導し、家族内のコントローラが区別できないようなプローブ・エクサクタントなマージ履歴を誘導する。
時計を意識したプローブでは、エージェントの観察と行動にのみ依存する目的に対して、決定に十分である。
スケーラブルな決定論的定常実験は、小さな精度のケースで測定されたギャップで引き込み可能な粗大化を研究し、より大きなスケールで経験的に探索した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 20:59:31 GMT)
The Library Theorem: How External Organization Governs Agentic Reasoning Capacity [0.0] I/O ページとして変換器のコンテキストウィンドウを形式化する。
インデックス付き外部メモリを持つツール拡張エージェントは、シーケンシャルスキャンに制限されたエージェントよりも指数関数的に検索コストが低いことを証明した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:02:56 GMT)
The Impact of Corporate AI Washing on Farmers' Digital Financial Behavior Response -- An Analysis from the Perspective of Digital Financial Exclusion [0.0] 本稿では15~20の金融機関のCHFS 2019データとAI投資データに基づく企業レベルのAI洗浄指標を構築する。
この研究によると、AI洗浄は農家のデジタル金融行動を大幅に抑制する。
本稿では,規制当局がAI技術の厳密な情報開示システムを確立することを示唆する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 13:55:46 GMT)
Talk, Walk, and Market Response: Multimodal Measurement of AI Washing and Its Capital Market Consequences in China [0.0] 情報非対称性と技術的不透明さは、真のR&Dと比較してAI能力を誇張するコストを下げる。
2018Q1から2025Q2までの中国のAシェア市場を利用して、計測とメカニズムテストに関する文献を進歩させます。
我々は、年次レポートや道路ショーにおけるテキストイメージの整合性を評価するためのマルチモーダルなAI洗浄リスクスコア(AWRS)を構築し、特許品質、AI無形資産資本化、PCAを用いた技術人材報酬からMRMI(Material Real-Investment Matching Index)を構築した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:28:29 GMT)
TIDE: Token-Informed Depth Execution for Per-Token Early Exit in LLM Inference [0.0] TIDEは、定期的なチェックポイント層とルータで学習した小さなレイヤを推論時にアタッチするポストトレーニングシステムであり、トークン毎に隠れた状態が収束した最初期のレイヤを選択する。
DeepSeek R1 Distill 8BのNVIDIA A100では、TIDEは100%プリフィルの終了率(11層でトークンの5%、31層で残るもの)を達成し、プリフィルのレイテンシを7.2%削減し、シングルバッチスループットを6.6%向上させた。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 18:58:07 GMT)
Structural Sensitivity in Compressed Transformers: Error Propagation, Lyapunov Stability, and Formally Verified Bounds [0.0] GPT-2の468のうち1つのマトリックスは圧縮すると2万倍のパープレキシティを増大させることができる。
リアプノフ安定性理論を用いて, 残留接続の圧縮誤差は, 隠れ状態が誤差よりも高速に大きくなることを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:24:08 GMT)
Stochastic approximation in non-markovian environments revisited [0.0] 本稿では,トランスフォーマーに基づく学習,特に注意機構と継続学習を理解するための分析フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 07:09:07 GMT)
Silent Commitment Failure in Instruction-Tuned Language Models: Evidence of Governability Divergence Across Architectures [0.0] 我々は、モデルのエラーが出力コミット前に検出可能で、一度検出されると修正できる程度、統治性を導入します。
ベンチマーク精度は支配可能性を予測するものではなく、補正能力は検出と独立に異なり、同一のガバナンス足場はモデル間で逆の効果をもたらす。
本稿では,モデルとタスクの組み合わせをGovernable, Monitor Only, Steer Blind, Ungovernableの4つに分類する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 21:50:28 GMT)
Safety as Computation: Certified Answer Reuse via Capability Closure in Task-Oriented Dialogue [0.0] 本稿では,タスク指向対話システムにおける新しいパラダイムとして,回答再利用のための算術的プリミティブとしての安全性認証を導入する。
機能ベースのシステムでは、安全認証ステップは、現在の構成から到達可能なすべての回答を既に含む固定ポイントクロージャcl(At)を算出する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 23:37:38 GMT)
STEM Agent: A Self-Adapting, Tool-Enabled, Extensible Architecture for Multi-Protocol AI Agent Systems [0.0] STEM Agent(STEM Agent)は,生物の豊かさにインスパイアされたモジュラーアーキテクチャである。
このフレームワークは、単一のゲートウェイの背後にある5つの相互運用性プロトコルを統合する。
包括的な413-testスイートは、プロトコルハンドラの動作と5つのアーキテクチャレイヤ間のコンポーネント統合を検証する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 20:50:53 GMT)
Quantum Fuzzy Sets Revisited: Density Matrices, Decoherence, and the Q-Matrix Framework [0.0] 2006年に我々は、量子レジスタの状態がファジィ部分集合の特徴関数として機能することを観察する量子ファジィ集合を提案した。
以来20年間、このアイデアは量子アニーラー、直観論的ファジィ接続、量子機械学習の研究者によって取り上げられてきた。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 19:51:08 GMT)
Prompt replay: speeding up grpo with on-policy reuse of high-signal prompts [0.0] 検証可能な報酬(RLVR)による強化学習は推論能力の拡大に重要な役割を担っているが、GRPOスタイルのトレーニングは高価なロールアウトと使い捨てのプロンプトで計算される無駄に支配されている。
本稿では,GRPO のオーバヘッドフリーなオンラインデータ選択手法である Prompt Replay を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 11:39:51 GMT)
Precision spectroscopy of a trapped $^{173}$Yb$^+$ ion using a bath of ultracold atoms [0.0] 超低温原子に結合して直接レーザーを冷却するのでなく、捕捉された173$Yb$+$イオンの精密レーザー分光法を実証する。
原子浴は、スピン交換衝突によってイオンの内部自由度を超微細な基底状態に継続的に冷却する。
この研究で示された技術は、複雑な構造を持つ他のイオンに対して精密分光を行うために拡張することができる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:42:24 GMT)
Motion as a Sensing Modality for Metric Scale in Monocular Visual-Inertial Odometry [0.0] 曲率によって生成される翻訳加速度が、カップルが慣性状態にスケールする基本源であることを示す。
単眼カメラとコンシューマグレードIMUを用いたディファレンシャルドライブロボットの制御実験により、この理論が検証された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 20:14:54 GMT)
Lie-algebraic incompleteness of symmetry-adapted VQE for non-Abelian molecular point groups [0.0] 我々は,アベリア部分群制限が多次元既約表現の急激な分割を誘導し,クロスコンポーネントを早期に破棄することを証明する。
数値解析は数値分解力学の厳密な励起診断を提供する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 02:07:45 GMT)
Left Behind: Cross-Lingual Transfer as a Bridge for Low-Resource Languages in Large Language Models [0.0] 我々は、英語、カザフ語、モンゴル語で、精度、流布度、完全性に関する大規模な言語モデルをベンチマークする。
英語と低リソースの言語条件の間には,13.8~16.7ポイントという一貫したパフォーマンスギャップがある。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 03:27:47 GMT)
LLM-based Automated Architecture View Generation: Where Are We Now? [0.0] ソースコードからアーキテクチャビューを生成するLLMとエージェントアプローチの能力を評価する。
ゼロショットのプロンプトはゼロショットのベースラインに比べて、クリアリティの失敗を9.2%削減する。
カスタムエージェントアプローチは、汎用エージェントよりも一貫して優れています。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 11:41:37 GMT)
Knowledge Packs: Zero-Token Knowledge Delivery via KV Cache Injection [0.0] KVキャッシュは同じ知識をトークンコストゼロで提供する。
KVインタフェースは、RAGができない動作ステアリングを可能にする。
トレーニングなし、体重調整なし。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 11:55:09 GMT)
Interpreting the Synchronization Gap: The Hidden Mechanism Inside Diffusion Transformers [0.0] 予混合拡散変換器(DiT)における同期ギャップの機械的実現について検討する。
本研究は,ネットワークの終端層への分化遷移を分離し,DiTsが生成的曖昧性をどのように解決するかを機械論的に解釈するものである。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:13:33 GMT)
Intelligence Inertia: Physical Principles and Applications [0.0] 本稿では,知能の計算重量を定量化するための基礎的特性として,知能慣性の性質を紹介する。
実際の適応コストと静的情報理論推定との相違を解析することにより、ローレンツ因子を反映した非線形コスト公式を導出する。
本研究は,知的エージェントの計算・解釈可能性維持のオーバーヘッドを第一原理的に説明し,構造適応のコストを統一的に記述することを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 03:37:33 GMT)
Image-Based Structural Analysis Using Computer Vision and LLMs: PhotoBeamSolver [0.0] PhotoBeamrは、人が描いた図面から理想的なビームモデルを解くことができるプログラムだ。
コンピュータビジョンを構造解析に統合する際の主な課題と限界について分析する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:43:41 GMT)
Homogenization of point interactions [0.0] 我々は、ある非相対論的量子粒子を $mathbbRd$, $d=2$ または $d = 3$ とみなす。
我々は、特異ポテンシャルの強度と点間の距離が、その数が増加するにつれて同時にゼロになる均質化機構を解析する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 21:02:38 GMT)
Heterosymmetric states of rotating quantum droplets under confinement [0.0] 閉じ込められた2次元量子滴の回転応答について検討する。
角運動量のほぼ半整数値は、液滴が「ヘテロ対称」な方法で励起されることが分かる。
また,小集団の不均衡の影響についても検討した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 20:43:57 GMT)
HamVision: Hamiltonian Dynamics as Inductive Bias for Medical Image Analysis [0.0] HamVisionは、減衰調和振動子を用いた医用画像解析のフレームワークである。
分割作業と分類作業の両方に対する構造的帰納バイアスとして提示する。
2018年(89.38%)、ISIC, 2017年(88.40%)、TN3K年(87.05%)、ACDC年(92.40%)
HamClsはBloodMNIST(98.85%)とPathMNIST(96.65%)の最先端精度を達成する
論文参考訳(メタデータ) (Sun, 22 Mar 2026 19:28:37 GMT)
HELIX: Scaling Raw Audio Understanding with Hybrid Mamba-Attention Beyond the Quadratic Limit [0.0] 純粋なMambaと比較するフレームワークであるHELIXと、単一注意ボトルネックを持つ最小限のハイブリッドについて紹介する。
すべてのモデルは、アーキテクチャ効果を分離するために約8.3Mパラメータでパラメータマッチングされる。
好みの入力表現は、バックボーンに依存しており、注意は短い静止音声の性能を損なうが、長いシーケンス長では重要となる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 16:53:14 GMT)
Geometric Quantum Mechanics in a Symplectic Framework: Metric-Affine Extensions and Deformed Quantum Dynamics [0.0] 本稿では、シンプレクティックな構造をメトリック・アフィン背景幾何に結合できる拡張を導入する。
適切な条件下では、変形された構造はシンプレクティックなままであり、十分に配置されたハミルトン系を定義する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 12:47:16 GMT)
Fully selective charging of a quantum battery by a purely quantum charger [0.0] 本稿では、2つの量子調和振動子からなる2部充電器を用いて2レベル量子電池を充電するためのプロトコルについて議論する。
その特徴の1つとして、バッテリーを完全に充電することができ、エネルギー入力として追加される単一の励起状態において、普遍的に最適である。
また、異なる種類の量子状態のプロトコルを拡張するための選択的相互作用を利用し、この場合、量子コヒーレンスの存在を複数の類似電池を充電するためのエネルギー資源として利用することができることを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 10:20:16 GMT)
Fuel Consumption Prediction: A Comparative Analysis of Machine Learning Paradigms [0.0] 本研究は, 自動車の燃費を決定する要因について, セミナルモータトレンドデータセットを用いて検討した。
厳密な定量的分析を通じて効率の物理的要因を規定する。
研究によると、本質的な車両の効率は、物理的設計パラメータ、重量、変位によって決定される。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 03:08:22 GMT)
FluidWorld: Reaction-Diffusion Dynamics as a Predictive Substrate for World Models [0.0] 現在のアプローチでは、学習された潜在空間で動作するTransformerベースの予測器がデフォルトになっている。
本稿では,予測的世界モデリングに自己注意が必要なのか,それとも代替の計算基板が同等あるいは優れた結果が得られるのか,という根本的な疑問を提起する。
反応拡散型の偏微分方程式(PDE)によって予測力学が支配される概念実証世界モデルであるFluidWorldを紹介する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 16:49:43 GMT)
First-Mover Bias in Gradient Boosting Explanations: Mechanism, Detection, and Resolution [0.0] 第1モーバーバイアス(英: First-mover bias)は、勾配上昇における逐次的残留フィッティングに起因する特徴量の集中である。
モデル独立性は線形状態における最優先バイアスを解くのに十分であり、非線形データ生成プロセス下では最も効果的な緩和法であることを示す。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 02:59:40 GMT)
Experimental Quantum State Tomography of Multimode Gaussian States [0.0] マルチモードガウス状態は量子情報技術のための汎用的な資源である。
このような状態の大規模生成の最近の進歩は、スケーラブルな量子技術にとって重要な要素となっている。
本稿では,多モードガウス状態に対する最大線量推定に基づく信頼性と効率的なトモグラフィー手法を提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 19:50:43 GMT)
Evaluating Factor-Wise Auxiliary Dynamics Supervision for Latent Structure and Robustness in Simulated Humanoid Locomotion [0.0] DynaMITEは、因子単位の補助損失によって訓練された24d遅延剤を備えたトランスフォーマーエンコーダである。
監督された潜伏剤は、分解性または機能的に分離可能な因子構造を示す証拠を示さない。
移動実践者にとって:補助力学の監督は解釈可能な推定器を作らない。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:56:10 GMT)
Enhancing the Parameterization of Reservoir Properties for Data Assimilation Using Deep VAE-GAN [0.0] この研究は、ESMDAと統合された変分オートエンコーダ生成適応ネットワーク(VAE-GAN)と呼ばれるディープラーニングモデルを実装するために、両者の強みを組み合わせることに革新的である。
その結果,VAE-GANモデルを適用することで,高品質な貯水池記述(GAN)と生産曲線(VAEと同様)の整合性が得られることがわかった。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 16:21:52 GMT)
Enhanced Emission from Boron-Vacancy Center in Rhombohedral Boron Nitride [0.0] 2次元(2D)窒化ホウ素(BN)ハニカム格子の積層結合は、2D結晶の特性を著しく変化させることができる。
負電荷のホウ素空洞中心(V$_textB-$)の明るさは、六方晶BN(hBN)と比較して、六方晶BN(rBN)の少なくとも一桁の明るさで増強されることを示す。
以上の結果から,V$_textB-$の室温単一スピンコヒーレント制御がrBNで実現可能であることが示唆された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 22:14:50 GMT)
Emergent Formal Verification: How an Autonomous AI Ecosystem Independently Discovered SMT-Based Safety Across Six Domains [0.0] 本稿では,共通APIを通じて6つの出力クラスすべてにZ3ベースの検証を適用する統一フレームワークを提案する。
提案手法を5つの実装ドメインで181のテストケースで評価し,100%の分類精度,0の偽陽性,0の偽陰性で評価した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 10:02:16 GMT)
Dynamical symmetries of the Calogero-Coulomb model [0.0] 量子カロジェロモデルの動的対称性を、凝縮クーロン場における粒子交換で構築する。
この対称性は交換(ダンクル)作用素によって変形された代数 $so(N+1,2)$ によって支配される。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:09:21 GMT)
DeepXplain: XAI-Guided Autonomous Defense Against Multi-Stage APT Campaigns [0.0] 本稿では,段階認識型APT防御のためのDRLフレームワークであるDeepXplainについて述べる。
DeepXplainは、プロファイランスベースのグラフ学習、時間的ステージ推定、構造的、時間的、ポリシーレベルの説明を提供する統一されたXAIパイプラインを統合する。
現実的なエンタープライズテストベッドの実験では、ステージ重み付きF1スコア(0.887から0.915)と成功率(84.7%から89.6%)の改善、説明信頼度(0.86)、改善された忠実度(0.79)、よりコンパクトな説明が示された。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:36:51 GMT)
Deep Attention-based Sequential Ensemble Learning for BLE-Based Indoor Localization in Care Facilities [0.0] 本稿では,屋内の局所化を逐次学習問題として再認識する新しいフレームワークである,Deep Attention-based Sequential Ensemble Learning (DASEL)を紹介する。
DASELは、4倍の時間的クロスバリデーションを用いて、ケア施設からの実世界データに基づいて、マクロF1スコアの0.4438を達成し、従来のベースラインよりも53.1%改善した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 02:55:26 GMT)
Conversation Tree Architecture: A Structured Framework for Context-Aware Multi-Branch LLM Conversations [0.0] 本稿では,対話木アーキテクチャ (CTA) について紹介する。これは,大規模言語会話を個別に分離したノードのツリーとして整理する階層的なフレームワークである。
アーキテクチャのプリミティブを形式化し、コンテキストフローにおけるオープンデザイン問題を特徴付け、動作するプロトタイプの実装を記述する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:11:06 GMT)
Contractions of the relativistic quantum LCT group and the emergence of spacetime symmetries [0.0] 符号 $(N_+,N_-)$ に対して LCT 群に付随するリー代数の縮約構造について検討する。
LCTリー代数の収縮が物理的に関係するド・ジッター代数 $mathfrakso (1,4)$ と、平面曲率極限において、ポアンカレ代数 $mathfrakiso (1,3)$ の 4次元時空にどのように導かれるかを明確に解析する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:17:29 GMT)
Compressed-Sensing-Guided, Inference-Aware Structured Reduction for Large Language Models [0.0] 大規模言語モデルは強力な生成性能を提供するが、膨大なパラメータ数、メモリ使用量、復号遅延のコストがかかる。
動的LLM実行のための統合圧縮センシング誘導フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 14:27:24 GMT)
Closed-form conditional diffusion models for data assimilation [0.0] データ同化のための閉形式条件拡散モデルを提案する。
スコア関数の解析的トラクタビリティを利用して,システムの状態と測定値を同化する。
提案手法は, 明示的な知識を必要とせず, システムや計測プロセスに適応できる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 15:25:23 GMT)
CIPHER: Conformer-based Inference of Phonemes from High-density EEG [0.0] 我々はCIPHER(高密度脳波表現からの音素のコンフォーマーベース推論)を提示する。
二分音節タスクは、ほぼシーリングのパフォーマンスに到達するが、非常に難易度が高い。
我々はこの研究を、EEG-to-textシステムではなく、ベンチマークと機能比較研究として位置付ける。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 12:14:47 GMT)
Beyond a Single Signal: SPECTREG2, A Unified MultiExpert Anomaly Detector for Unknown Unknowns [0.0] 既存の不確実な定量化法は、信頼や密度のような単一の信号に依存する。
本稿では、デュアルバックボーンニューラルネットワークから8つの補完信号を組み合わせたマルチ信号異常検出装置であるSPECTRE-G2を紹介する。
このモデルは種子全体にわたって安定しており、特に新しい変数や共同設立者の検出に有効である。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 10:23:28 GMT)
Benchmarking Scientific Machine Learning Models for Air Quality Data [0.0] 本研究は、ガイドラインと提案された物理誘導型最良のモデルを可能にする、説明可能で包括的なベンチマークを示す。
2022年から2024年にかけて、米国環境保護庁(EPA)による大気質データの日次観測を用いて、PM2.5とO3の都市レベルの時系列をキュレートする。
最適モデルのベンチマークには、線形回帰(LR)、SARIMAX、多層パーセプトロン(MLP)、LSTMネットワークが評価されている。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 03:31:24 GMT)
B-jet Tagging Using a Hybrid Edge Convolution and Transformer Architecture [0.0] 本稿では,エッジ畳み込みとトランスフォーマーの自己認識機構を統合したハイブリッドディープラーニングアーキテクチャを提案する。
我々は, ECT が b-ジェットに対して 0.9333 AUC を達成することを実証した。
提案アーキテクチャは、特にチャームジェットの拒絶に優れたbジェットタギングにおいて良好な結果が得られる。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:10:07 GMT)
AutoMOOSE: An Agentic AI for Autonomous Phase-Field Simulation [0.0] AutoMOOSEは、ひとつの自然言語プロンプトから完全なシミュレーションライフサイクルを編成するエージェントフレームワークである。
MOOSEの入力ファイルは、人間の専門家参照と正確に一致する12のブロックのうち6つで、機能的に等価である。
インテント、有限要素実行、そして人間による検証のないアレニウス運動論にまたがる、エンドツーエンドの物理的整合性チェックを実行する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 00:11:19 GMT)
AutoKernel: Autonomous GPU Kernel Optimization via Iterative Agent-Driven Search [0.0] Auto Kernelは、任意のPyTorchモデルのGPUカーネル最適化に自律エージェントループを適用するフレームワークである。
システムには、9000行以上のPythonと、2つのバックエンドにまたがる18のスターターカーネル実装、6層最適化プレイブック、KernelBenchベンチマークスイートとの統合が含まれている。
NVIDIA H100では、テストされたプレイブックの大部分で、私たちのTritonカーネルがPyTorchとTorch.compile(max-autotune)の両方を上回っています。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:15:28 GMT)
Architecture for Multi-Unmanned Aerial Vehicles based Autonomous Precision Agriculture Systems [0.0] 本稿では、精密農業におけるUAVの様々なタスクを定義し、それらをアーキテクチャの枠組みとしてモデル化する。
効率的なシステムを実現するために,画像処理,経路計画,コミュニケーション,データ取得,フィールドマッピングといった様々なタスクがアーキテクチャに採用されている。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 12:00:36 GMT)
An HHL-Based Quantum-Classical Solver for the Incompressible Navier-Stokes Equations with Approximate QST [0.0] HHL (Harrow-Hassidim-Lloyd) は、非圧縮性ナビエ・ストークス方程式を解くための指数的スピードアップのポテンシャルを提供する。
完全統合型ベンチマーク問題として, 正確な蓋駆動キャビティフローシミュレーションとTaylor-Green渦の正確な流れを示す。
我々は,IBMのQiskitフレームワークを用いて解法を実装し,標準的な古典的数値法に対するハイブリッド量子古典シミュレーションの有効性を検証した。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 11:48:14 GMT)
Active Inference Agency Formalization, Metrics, and Convergence Assessments [0.0] エージェンシーは、オートポエシスを実現する蓄積された経験の連続表現として概念化されている。
エージェント関数は全抽象関数空間の驚くほど小さな部分を占める。
本稿では,ある系の行動等価度と「理想的」エージェント関数との距離に基づく距離について紹介する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:01:39 GMT)
ARYA: A Physics-Constrained Composable & Deterministic World Model Architecture [0.0] ARYAは5つの基本原理に基づいて構築された、構成可能で、物理に制約のある、決定論的世界モデルアーキテクチャである。
ARYAは、状態表現、動的予測、因果的および物理的認識、時間的一貫性、一般化、学習可能性、計画と制御を含むすべての標準的な世界モデル要件を満たす。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 17:46:04 GMT)
ALMAB-DC: Active Learning, Multi-Armed Bandits, and Distributed Computing for Sequential Experimental Design and Black-Box Optimization [0.0] ALMAB-DCはブラックボックス実験のための逐次設計フレームワークである。
バンディット成分に対する累積的後悔境界を示し、Amdahlの法則を通した並列スケーラビリティを特徴付ける。
分散実行は、Amdahlの法則に従って、$K = 16$エージェントでの7.5times$スピードアップを達成する。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 11:47:20 GMT)
A Two-stage Transformer Framework for Temporal Localization of Distracted Driver Behaviors [0.0] ドライバー監視シナリオに適した時間的行動ローカライゼーションフレームワークを開発し,評価する。
我々のアプローチは、ビデオMAEに基づく特徴抽出とAMA(Augmented Self-Mask Attention)検出器を組み合わせた2段階のパイプラインに従う。
実験結果から、モデルキャパシティと効率の明確なトレードオフが明らかになった。
論文参考訳(メタデータ) (Sun, 22 Mar 2026 04:09:47 GMT)