Video-MME-v2: Towards the Next Stage in Benchmarks for Comprehensive Video Understanding [98.3] Video-MME-v2は、ビデオ理解の堅牢性と忠実さを厳格に評価するために設計された総合的なベンチマークである。
データ品質を保証するため、Video-MME-v2は厳格に制御された人間のアノテーションパイプラインを通して構築される。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:59:56 GMT)
MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale [92.1] 我々は、データエンジニアリングとトレーニング戦略最適化のみで技術の現状を進展させるMinruproを提案する。
mineruproはOmniDocBenchv1.6で95.69を達成し、同じアーキテクチャのベースラインを2.71ポイント改善し、既存のすべてのメソッドを上回った。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:44:18 GMT)
Cog-DRIFT: Exploration on Adaptively Reformulated Instances Enables Learning from Hard Reasoning Problems [70.9] 検証可能な報酬(RLVR)からの強化学習はLLMの推論能力を改善した。
本稿では,タスク修正に基づくシンプルで効果的なソリューションを提案する。
本稿では,Cag-DRIFTについて紹介する。このフレームワークは改良された変種を構築し,適応的なカリキュラムに編成する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:38:38 GMT)
From Use to Oversight: How Mental Models Influence User Behavior and Output in AI Writing Assistants [70.2] システムの動作に関する機能的、あるいは関連性、システムの動作に関する構造的、あるいは関連性という、2つのタイプのメンタルモデルについて検討する。
構造的精神モデル状態の参加者は、システムに対する理解を深める一方、これはバックフィリング効果をもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:50:44 GMT)
OpenWorldLib: A Unified Codebase and Definition of Advanced World Models [69.3] 先進世界モデルのための包括的で標準化された推論フレームワークであるOpenWorldLibを紹介します。
我々は,世界モデルとは,複雑な世界を理解し,予測するための,相互作用と長期記憶機能を備えた知覚を中心としたモデルあるいはフレームワークである,という明確な定義を提案する。
この定義に基づいて、OpenWorldLibは、統一されたフレームワーク内でさまざまなタスクにわたるモデルを統合し、効率的な再利用と協調的な推論を可能にします。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:19:48 GMT)
Cold-Starts in Generative Recommendation: A Reproducibility Study [66.2] コールドスタートレコメンデーションは、オープンワールドプラットフォームにおいて依然として中心的な課題である。
本稿では,コールドスタートプロトコルの統一スイートに基づく生成的推薦の体系的研究について述べる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:22:37 GMT)
One Model for All: Multi-Objective Controllable Language Models [65.5] 我々は、優先条件付きポリシーネットワークとして単一の言語モデルをトレーニングするために、MOC(Multi-Objective Control)を導入する。
提案手法では,マルチオブジェクト最適化(MOO)の原則をRLHFに導入し,LLMを優先条件付きポリシネットワークとしてトレーニングする。
大規模な実験は、3つの面において基線よりもMOCの利点を実証している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 07:48:32 GMT)
Toward Reducing Unproductive Container Moves: Predicting Service Requirements and Dwell Times [65.0] 本稿では, コンテナ端末で実施したデータサイエンス研究の結果について述べる。
我々は、歴史的運用データを活用する機械学習モデルを開発し、カーゴリリースに先立って、どのコンテナが事前クリアランス処理サービスを必要とするかを予測し、いつまで端末に留まるかを推定する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:06:15 GMT)
Discrete Prototypical Memories for Federated Time Series Foundation Models [62.2] FLベースの時系列基礎モデルとして大規模言語モデルを活用することは、LLMの一般化能力を時系列データに転送する有望な方法を提供する。
しかし、時系列データと既存のLCMのテキスト中心の潜在空間とのセマンティックなミスアライメントは、しばしば性能低下につながる。
離散型記憶に基づく時系列基礎モデルのための統合フレームワークであるtextscFeDPMを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:57:08 GMT)
Full-Duplex-Bench-v3: Benchmarking Tool Use for Full-Duplex Voice Agents Under Real-World Disfluency [61.7] FDB-v3 (Full-Duplex-Bench-v3) は、自然言語条件下での音声モデルの評価と多段階ツールの使用のためのベンチマークである。
以前の作業とは異なり、データセットは5つのディスフルカテゴリにアノテートされた実際の人間のオーディオで構成されており、4つのタスクドメインにチェーンされたAPI呼び出しを必要とするシナリオとペアリングされています。
GPT-Realtime、Gemini Live 2.5、Gemini Live 3.1、Grok、Ultravox v0.7、従来のカスケードパイプライン(Whisper$rightarrow$rightarrow$TTS)の6つのモデル構成を精度、レイテンシ、ターンで評価した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:46:52 GMT)
Think in Strokes, Not Pixels: Process-Driven Image Generation via Interleaved Reasoning [59.3] プロセス駆動画像生成は多段階のパラダイムで、合成をインターリーブな推論軌道に分解する。
プロセス駆動生成の核となる課題は、中間状態のあいまいさに起因する。
2つの相補的な制約を維持する、密集したステップワイドな監視を通じてこの問題に対処する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:11:57 GMT)
Fully Procedural Synthetic Data from Simple Rules for Multi-View Stereo [59.1] 非常に小さなルールセットによって駆動される、完全に手続き的な新しいジェネレータであるSimpleProcを使って、効果的なトレーニングデータを生成することができることを示す。
そこで本研究では,ゲームや実世界のオブジェクトから手作業でキュレートした画像と比較して,8000枚程度の画像で優れた結果が得られることを示す。
352,000の画像にスケールすると、いくつかのベンチマークで、692,000以上の手作業で訓練された画像に匹敵するパフォーマンスが得られる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:59:05 GMT)
UENR-600K: A Large-Scale Physically Grounded Dataset for Nighttime Video Deraining [58.7] 雨滴が人工的な照明と相互作用するため、夜間ビデオのデコレーションは難しい。
UENR-600Kは600,000 1080pのフレーム対を含む大規模で物理的に座屈したデータセットである。
我々はUnreal Engineを用いて仮想環境内の雨を3次元粒子としてシミュレーションする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 04:01:46 GMT)
Your Pre-trained Diffusion Model Secretly Knows Restoration [55.7] 本研究では,事前学習した拡散モデルが本質的に復元動作を有しており,即時埋め込みを直接学習することで解錠可能であることを示す。
トレーニング済みのWANビデオモデルとFLUX画像モデルに軽量な学習プロンプトを導入し、それらを高性能な復元モデルに変換する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:59:04 GMT)
Early Stopping for Large Reasoning Models via Confidence Dynamics [55.7] 大きな推論モデルは複雑な問題を解決するために長い連鎖生成に依存している。
重要な課題は、いつモデルが推論を止めて最終回答を生み出すべきかを決定することです。
中間回答の信頼性のダイナミクスを利用して推論をいつ終了するかを判断する早期停止手法であるCoDE-Stopを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:59:45 GMT)
FlashSAC: Fast and Stable Off-Policy Reinforcement Learning for High-Dimensional Robot Control [55.4] 強化学習(Reinforcement Learning, RL)は、専門家によるデモンストレーションが利用できない場合のロボット制御における中核的なアプローチである。
我々は,Soft Actor-Critic上に構築された高速で安定なオフポリチィRLアルゴリズムであるFlashSACを提案する。
10のシミュレータで60以上のタスクをこなし、FlashSACは最終的なパフォーマンスとトレーニング効率の両方において、PPOと強力なオフポリシーベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:03:41 GMT)
Immunizing 3D Gaussian Generative Models Against Unauthorized Fine-Tuning via Attribute-Space Traps [54.7] 本稿では,3次元生成モデルを微調整攻撃から守るためのフレームワークであるGaussLockを提案する。
GassLockは、認可された蒸留と、位置、スケール、回転、不透明度、色をターゲットにした属性対応トラップ損失を統合する。
実験により、ガウスロックは無許可の微調整攻撃を効果的に中和することが示された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:30:49 GMT)
Paper Espresso: From Paper Overload to Research Insight [53.5] 本稿では,最新のarXiv論文を自動的に発見,要約,分析するオープンソースプラットフォームであるPaper Espressoを紹介する。
このシステムは、大きな言語モデル(LLM)を使用して、トピックラベルとキーワードで構造化された要約を生成する。
35ヶ月の継続的デプロイメントを経て、Paper Espressoは13,300以上の論文を処理し、構造化されたメタデータをすべて公開している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:45:21 GMT)
DeonticBench: A Benchmark for Reasoning over Rules [52.7] DEONTICBENCHは、アメリカ合衆国連邦政府の税、航空会社の荷物政策、移民管理、および合衆国の住宅法に関する6,232のタスクのベンチマークである。
これは、実世界のドメインにおいて、象徴的および非象徴的な設定の下でコンテキスト基底ルール推論を研究するためのベンチマークである。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 05:41:02 GMT)
PointTPA: Dynamic Network Parameter Adaptation for 3D Scene Understanding [52.0] 本研究では,シーンレベルの点群に対する入力対応ネットワークパラメータを生成するテスト時間適応フレームワークを提案する。
PointTPAはScanNetの検証で78.4%のmIoUを達成した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:59:58 GMT)
Towards Scaling Law Analysis For Spatiotemporal Weather Data [50.3] 単一ステップのトレーニング損失から長期ロールアウトやチャネル単位のメトリクスまで,自動回帰天気予報のためのニューラルスケーリング分析を拡張した。
プールドスケーリングは望ましいように見えるが、多くのチャネルは遅延リードで劣化する。
本稿では,重み付け対象,地平線対応カリキュラム,出力間の資源配分について論じる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:14:53 GMT)
BiTDiff: Fine-Grained 3D Conducting Motion Generation via BiMamba-Transformer Diffusion [49.5] BiTDiffは、BiMamba-Transformerハイブリッドモデルアーキテクチャ上に構築された3次元動作生成のための新しいフレームワークである。
BiTDiffはCM-Dataデータセット上での3次元動作生成のための最先端(SOTA)性能を実現する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 03:49:36 GMT)
OmniSonic: Towards Universal and Holistic Audio Generation from Video and Text [46.7] ユニバーサル・ホロスティック・オーディオ・ジェネレーション(UniHAGen)を提案する。
UniHAGenは、オンスクリーンとオフスクリーンの両方のサウンドを含む包括的な聴覚シーンを生成するタスクである。
ビデオとテキストに条件付きフローマッチングベースの拡散フレームワークであるOmniSonicを紹介する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 01:43:00 GMT)
The Indra Representation Hypothesis for Multimodal Alignment [46.6] Indraのネットの哲学的比喩に触発された『Indra Representation hypothesis』を提案する。
我々は、一助基盤モデルからの表現が収束し、現実の下の共有関係構造を暗黙的に反映していると論じる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 07:46:04 GMT)
Receding-Horizon Control via Drifting Models [46.4] ドリフトMPCは、ドリフト生成モデルと未知の力学の下での後退水平計画を組み合わせた。
ドリフトMPCはドリフトモデルの一段階推論効率を維持しつつ, ほぼ最適軌道を生成可能であることを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:48:10 GMT)
Nonlinear signal enhancement of strongly-coupled molecules in pump-probe experiments [45.9] 我々は、シミュレーション実験において、強く結合された集団と未結合な集団からの信号の寄与を定量化する。
共鳴スキームは強結合分子の信号の選択性を最大化するが、非共鳴スキームはこれらの信号に対して驚くほど高い感度を維持する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 23:50:37 GMT)
Training-Free Image Editing with Visual Context Integration and Concept Alignment [45.2] VicoEditは、事前訓練されたテキストプロンプト編集モデルに視覚的コンテキストを注入する、トレーニングフリーでインバージョンフリーな方法である。
本手法は,最先端のトレーニングベースモデルよりも優れた編集性能が得られることを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 07:26:18 GMT)
Are We Recognizing the Jaguar or Its Background? A Diagnostic Framework for Jaguar Re-Identification [44.9] 本稿では,2つの軸を持つ野生生物再IDの診断フレームワークについて紹介する: 漏洩制御された文脈比,背景/背景,および横フランク検索とミラー自己相似性に基づく横方向診断である。
これらの診断を計測するために、画素ごとのセグメンテーションマスクとアイデンティティバランス評価プロトコルを用いて、パンタナルジャガーベンチマークをキュレートする。
次に、同じ評価レンズのケーススタディとして、代表緩和族、ArcFaceファインチューニング、反対称性正規化、ローレンツ双曲埋め込みを用いる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:17:14 GMT)
THOM: Generating Physically Plausible Hand-Object Meshes From Text [44.7] テキストからの3Dハンドオブジェクトインタラクション(HOIs)の生成は,ロボットの器用な把握とVR/ARコンテンツ生成に不可欠である。
我々は、テンプレートオブジェクトメッシュを必要とせずに、フォトリアリスティックで物理的に可視な3D HOIメッシュを生成する、トレーニング不要のフレームワークであるTHOMを紹介した。
THOMは、テキストアライメント、視覚リアリズム、相互作用の可視性の観点から、最先端の手法を一貫して超越している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 04:52:22 GMT)
How Far Are We? Systematic Evaluation of LLMs vs. Human Experts in Mathematical Contest in Modeling [43.6] 大規模言語モデル(LLM)は推論ベンチマークにおいて高いパフォーマンスを達成しているが、エンドツーエンドを必要とする現実世界の問題を解決する能力は未だ不明である。
本稿では、専門家が検証した基準を用いて、モデリング段階間でのLCM性能を評価する問題指向の段階評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:58:47 GMT)
PaperOrchestra: A Multi-Agent Framework for Automated AI Research Paper Writing [43.3] PaperOrchestraは、自動AI研究論文作成のためのマルチエージェントフレームワークである。
制約のない事前制約された資料を提出可能な原稿に変換する。
PaperWritingBenchは、200の上位階層のAIカンファレンス論文から、リバースエンジニアリングされた原料の最初の標準ベンチマークである。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:00:00 GMT)
PINNs in PDE Constrained Optimal Control Problems: Direct vs Indirect Methods [42.6] 半線形偏微分方程式の最適制御のための数値ツールとして物理インフォームドニューラルネットワーク(PINN)について検討する。
半線型放物型方程式のクラスに対して、状態方程式、随伴方程式、およびステーション随伴条件を導出する。
数値的な結果から、PINNパラメータ化は、よりスムーズな制御プロファイルを生成する傾向があるという意味で、暗黙的な正則化効果を持つことが示された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:57:53 GMT)
TriAttention: Efficient Long Reasoning with Trigonometric KV Compression [42.5] 大規模言語モデル(LLM)の拡張推論は、深刻なKVキャッシュメモリボトルネックを生み出す。
KVキャッシュ圧縮手法は、最近のポストRoPEクエリの注意点を用いてKVの重要度を推定する。
我々はこれらのセンターを活用して重要な重要度を推定するためにTriAttentionを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:58:42 GMT)
G-EDF-Loc: 3D Continuous Gaussian Distance Field for Robust Gradient-Based 6DoF Localization [41.6] 本稿では,直接CPUベースのスキャン・ツー・マップ登録パイプラインに基づく,ロバストな6-DoFローカライゼーションフレームワークを提案する。
このシステムは、新しい連続的でメモリ効率のよい3次元距離場表現であるG-EDFを利用する。
大規模データセットによる実験結果から,G-EDF-Locは最先端の手法と競合することを示した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:40:18 GMT)
A Frame is Worth One Token: Efficient Generative World Modeling with Delta Tokens [40.7] DeltaTokは、連続するフレーム間の特徴差を1つの"デルタ"トークンにエンコードするトークンである。
また,これらのトークンをベースとした生成的世界モデルであるDeltaWorldを紹介し,多種多様な未来を効率的に生成する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:55:05 GMT)
Relative Density Ratio Optimization for Stable and Statistically Consistent Model Alignment [40.7] 直接密度比最適化(DDRO)は、人間の選好モデルを仮定することなく統計的整合性を達成する。
本稿では,安定かつ統計的に一貫した新しいアライメント手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 04:21:24 GMT)
FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation [40.5] FlowLMは、事前訓練された拡散言語モデルから変換されたフローマッチング言語モデルである。
微調整のFlowLMは、スクラッチからトレーニングする時間の半分のトレーニングエポックでパフォーマンス飽和に達する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 10:36:22 GMT)
Outlier-Robust Nonlinear Moving Horizon Estimation using Adaptive Loss Functions [40.3] 提案手法は汚染データと汚染データの重み付けを優先する。
フレームワークにチューニングパラメータを組み込んで損失関数の形状を制御し、推定器のロバスト性を外れ値に調整する。
シミュレーションの結果、適応はほんの数イテレーションで起こるが、従来の振る舞いは、測定結果が外れ値のない場合に優先される。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:06:33 GMT)
EvolveRouter: Co-Evolving Routing and Prompt for Multi-Agent Question Answering [39.3] エージェントの品質と協調構造を協調的に改善し,制約に対処する訓練可能なフレームワークを提案する。
Evolveは、F1と正確な一致の両方において、SOTAルーティングベースラインを一貫して上回る。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:24:54 GMT)
E-VLA: Event-Augmented Vision-Language-Action Model for Dark and Blurred Scenes [38.1] E-VLAは、従来のフレームベースの視覚が信頼できないときに、操作の堅牢性を改善するイベント拡張VLAフレームワークである。
DAVIS346イベントカメラを用いたオープンソースの遠隔操作プラットフォームを構築し,実世界のRGBイベント処理データセットを収集する。
E-VLAは、イベント駆動の知覚がVLAモデルに効果的に統合できるという系統的な証拠を提供する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:35:57 GMT)
GA-GS: Generation-Assisted Gaussian Splatting for Static Scene Reconstruction [38.1] 静的シーン再構成のための生成支援ガウス分割法を提案する。
動作認識モジュールを用いて動的領域を分割・除去し,拡散モデルを用いて隠蔽領域を塗布する。
既存のデータセットが動的オブジェクトでビデオの地平線上の静的なシーンを提供していないので、Trajectory-Matchというデータセットを構築します。
DAVISと我々のデータセットによる実験により、GA-GSは静的なシーン再構成において最先端の性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 00:47:42 GMT)
WaterSplat-SLAM: Photorealistic Monocular SLAM in Underwater Environment [37.9] WaterSplat-SLAMは、ロバストポーズ推定とフォトリアリスティックな高密度マッピングを実現する新しい単分子水中SLAMシステムである。
WaterSplat-SLAMは水中環境下でのロバストなカメラトラッキングと高忠実なレンダリングを実現する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 12:51:00 GMT)
Less Detail, Better Answers: Degradation-Driven Prompting for VQA [35.8] Degradation-Driven Prompting (DDP)は、視覚質問応答(VQA)のパフォーマンスを改善する新しいフレームワークである。
DDPは、画像の忠実度を戦略的に低減し、モデルに本質的な構造情報に集中させる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:41:19 GMT)
This Treatment Works, Right? Evaluating LLM Sensitivity to Patient Question Framing in Medical QA [35.4] 大規模言語モデル(LLM)は、フレーズの発声に敏感であり、質問の語源に影響を受けやすい。
医療質問応答(QA)のための制御検索強化世代(RAG)設定の体系的評価を通じてこれを検証する。
臨床試験の要約に基づいた6,614組のクエリペアのデータセットを構築し,8つのLCM間の応答一貫性を評価する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:03:54 GMT)
Beyond Semantics: Uncovering the Physics of Fakes via Universal Physical Descriptors for Cross-Modal Synthetic Detection [35.0] そこで本研究では,すべてのテストデータセットに対して一貫した離散パワーを示す5つの物理特徴を同定する特徴選択アルゴリズムを提案する。
提案手法は,Wukong や SDv1.4 などのデータセットに対して,ほぼ完全な精度 (99.8%) で,複数のGenimageベンチマーク上での最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 11:50:29 GMT)
Document Optimization for Black-Box Retrieval via Reinforcement Learning [34.6] 我々は文書拡張を文書最適化問題として再放送する。
言語モデルまたはビジョン言語モデルは、ドキュメントを、ターゲットレトリバーの下で期待されるクエリ分布とよりよく整合した表現に変換するように微調整される。
学習した文書変換が検索ゲインとなり、多くの設定において、より小さく、より効率的な検索者がより大きな文書変換を上回ります。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:41:40 GMT)
(Sparse) Attention to the Details: Preserving Spectral Fidelity in ML-based Weather Forecasting Models [34.3] 本稿では,MLに基づく天気予報において,スペクトル劣化の2つの主要な原因に対処する確率的天気予報モデルであるMosaicを紹介する。
Mosaicは、学習された機能的摂動を通じてアンサンブルメンバーを生成し、ブロックスパースアテンションを介してネイティブ解像度グリッドで動作する。
モザイクマッチングは、ヘッドライン上空変数の6倍の細かなデータでトレーニングされたモデルよりも優れています。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:50:42 GMT)
QED-Nano: Teaching a Tiny Model to Prove Hard Theorems [34.1] 我々は,オリンピアードレベルの証明のための4BモデルであるQED-Nanoを構築した。
QED-NanoとQED-Nano-SFTモデル、FineProofs-SFTとFineProofs-RLデータセット、トレーニングおよび評価コードを含む、完全なQED-Nanoパイプラインをリリースする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:44:25 GMT)
What Makes Good Multilingual Reasoning? Disentangling Reasoning Traces with Measurable Features [32.3] この研究は、多言語設定における効果的な推論を実際に特徴付けるものについて尋ねる。
まず、多言語アライメント、推論ステップ、推論トレースの推論フロー側面にまたがる測定可能な推論機能群を定義した。
次に、多言語トレース上でスパースオートエンコーダをトレーニングし、これらの機能をインスタンス化または拡張する潜在推論概念を自動的に検出する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:40:50 GMT)
Beyond the Global Scores: Fine-Grained Token Grounding as a Robust Detector of LVLM Hallucinations [32.2] 大規模視覚言語モデル(LVLM)は視覚的推論タスクにおいて高い性能を達成するが、幻覚の影響を受けやすい。
既存の検出方法は、オブジェクトトークンが入力画像とどのように関連しているかの粗い全体像計測に依存する。
モデル層間のきめ細かいトークンレベルの相互作用を調べるパッチレベルの幻覚検出フレームワークを提案する。
本手法は,トークンレベルの幻覚検出において最大90%の精度を達成し,幻覚検出のための微細構造解析の優位性を実証する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:07:11 GMT)
From Hallucination to Scheming: A Unified Taxonomy and Benchmark Analysis for LLM Deception [32.1] 本稿では,3つの相補的な次元に沿って整理された統合分類法を提案する。
この分類を50の既存のベンチマークに適用すると、すべてのベンチマークが実用的歪み、帰属性、能力的自己認識を極端に過小評価されているまま、製造をテストしていることがわかる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:57:47 GMT)
AI Agents Under EU Law [31.9] 具体的なアクションを規制トリガにマッピングする9つのエージェント展開カテゴリの実践的分類を提示する。
本稿では、12段階のコンプライアンスアーキテクチャと規制トリガマッピングにより、エージェントアクションを適用法則に接続する手法を提案する。
我々は、追跡不能な行動漂流を伴うリスクの高いエージェントシステムは、現在AI法の本質的な要件を満たすことができないと結論付けている。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 11:47:38 GMT)
From Curiosity to Caution: Mitigating Reward Hacking for Best-of-N with Pessimism [31.0] 我々は,BoNサンプリングにおける報酬ハッキングを著しく軽減する,単純で計算効率のよいアプローチであることを示す。
また、単純化された線形設定の理論解析を行い、標準的なBoNアプローチよりも注意が確実に改善されることを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 12:58:11 GMT)
Uncertainty-Guided Latent Diagnostic Trajectory Learning for Sequential Clinical Diagnosis [30.9] 臨床診断には、不確実性の下でのシーケンシャルな証拠取得が必要である。
ほとんどのLarge Language Model (LLM) ベースの診断システムは、完全に観察された患者情報を前提としている。
我々は、遅延診断軌道学習フレームワークとしてシーケンシャル診断を定式化する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:21:56 GMT)
A Multi-Agent Framework for Automated Exploit Generation with Constraint-Guided Comprehension and Reflection [30.5] Vulnsageは自動エクスプロイト生成のためのマルチエージェントフレームワークである。
explosionjsのような最先端のツールよりも34.64%のエクスプロイトを生成する。
Vulnsageは、現実世界のシナリオで146のゼロデイ脆弱性を発見し、検証した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:47:17 GMT)
Batch Loss Score for Dynamic Data Pruning [30.4] Batch Loss Score (BLS) は、個々のサンプルにスコアを割り当てるために、容易に利用可能なバッチ損失の指数移動平均(EMA)を使用する計算的に効率的な代替手段である。
BLSは、個々のサンプルの損失に対する滑らかで永続的な寄与を近似し、BLSをサンプルの重要性のプロキシとして理論的根拠を与える。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:48:11 GMT)
How Well Do Agentic Skills Work in the Wild: Benchmarking LLM Skill Usage in Realistic Settings [29.4] 本研究は,段階的に挑戦的な現実的な環境下でのスキルユーティリティの総合的研究である。
その結果、設定がよりリアルになるにつれて、パフォーマンスは一貫して低下することがわかった。
クエリ固有の改善は、初期スキルが合理的な妥当性と品質を持つ場合に、性能を著しく回復することを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 00:10:30 GMT)
Implementing surrogate goals for safer bargaining in LLM-based agents [29.4] 代理的なゴールは、プリンシパルがAIエージェントを与えることができ、プリンシパルが関心を持つものからエージェントに対する脅威を逸脱させることである。
本稿では,言語モデルに基づくエージェントにおいて,サロゲート目標を実現する。
提案手法は,プロンプト,ファインチューニング,足場構築の4つの手法である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 01:28:42 GMT)
Yet Even Less Is Even Better For Agentic, Reasoning, and Coding LLMs [28.7] 効果的なソフトウェアエンジニアリングエージェントの訓練には、大量のタスク固有の軌道が必要である。
より少ないが高品質な訓練軌道で優れたエージェント能力を実現するエンドツーエンドのトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 05:39:35 GMT)
Discovering Failure Modes in Vision-Language Models using RL [28.0] 視覚言語モデル(VLM)は、人間が力ずくで識別する単純な視覚概念を誤解することが多い。
以前の研究では、これらの弱点を手動で特定し、しばしば特定のスキルの欠陥に起因することが判明した。
本稿では,任意の候補VLMの障害モードや盲点を自動的に検出する強化学習(RL)ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:00:54 GMT)
Watch Before You Answer: Learning from Visually Grounded Post-Training [27.7] ビデオ理解のパフォーマンスは、まだテキストベースの推論に遅れている。
一般的に報告されているベンチマークには、テキストキューだけで答えられる40~60%の質問が含まれている。
VidGroundは、視覚的に接地された質問のみを用いて、シンプルで効果的なソリューションとして紹介する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:22:48 GMT)
Do No Harm: Exposing Hidden Vulnerabilities of LLMs via Persona-based Client Simulation Attack in Psychological Counseling [26.6] パーソナリティベースのクライアントシミュレーション攻撃(PCSA)は、コヒーレントでペルソナ駆動のクライアント対話を通じて、心理的カウンセリングにおいてクライアントをシミュレートする。
以上の結果から,現在の LLM は,未承認の医療アドバイスの提供,妄想の強化,暗黙的なリスク行動の促進など,ドメイン固有の敵戦術に弱いままであることが明らかとなった。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:43:12 GMT)
Synthetic Sandbox for Training Machine Learning Engineering Agents [26.3] SandMLEは、少数のシードタスクから検証可能な合成MLE環境を生成するマルチエージェントフレームワークである。
我々は,SandMLEが13回以上実行時間を短縮し,MLEドメインで初めて大規模かつオン・ポリティクスなRLを実現することを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:19:29 GMT)
Beyond Hard Negatives: The Importance of Score Distribution in Knowledge Distillation for Dense Retrieval [26.2] スコアスペクトル全体を均一にカバーするStratified Smpling戦略を提案する。
実験により、教師のスコアの分散とエントロピーを保存するStratified Samplingが、堅牢なベースラインとして機能することが確認された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:02:35 GMT)
Search, Do not Guess: Teaching Small Language Models to Be Effective Search Agents [26.1] 大規模言語モデル(LLM)は強力な推論能力を示し、その高い計算コストは検索エージェントの実用的な展開を制限する。
パラメトリックな知識が少ないにもかかわらず、SLM(Small Language Models)は検索ツールの呼び出し頻度が低く、幻覚の傾向が強いことが判明した。
提案手法は,SLMに対して,検索された証拠に埋もれた回答を確実に回収・生成するように指示する,軽量な微調整手法である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:00:38 GMT)
3D-Fixer: Coarse-to-Fine In-place Completion for 3D Scenes from a Single Image [26.0] 合成3Dシーン生成のための新しいインプレース・コンプリート・パラダイムである3D-Fixerを紹介する。
明示的なポーズアライメントを必要とする以前の作品とは異なり、3D-Fixerはレイアウトの忠実さを維持するために空間アンカーとして断片化された幾何学を使用している。
これまでで最大のシーンレベルのデータセットであるARSG-110Kについて述べる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 04:11:09 GMT)
SysTradeBench: An Iterative Build-Test-Patch Benchmark for Strategy-to-Code Trading Systems with Drift-Aware Diagnostics [25.9] 我々はSysTradeBenchを紹介した。SysTradeBenchは、ストラテジ-コードトレーディングシステムのベンチマークのための監査可能なベンチマークである。
サンドボックス化されたハーネスは、決定論とアンチ推論チェックを実行し、ルールドリフトを検出し、制約されたパッチをサポートするエビデンスバンドルを返す。
上位モデルでは91.7%以上を強力な集計スコアで達成しているが、エビデンス駆動の反復はIter2によるコード収束も引き起こす。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:16:24 GMT)
MegaTrain: Full Precision Training of 100B+ Parameter Large Language Models on a Single GPU [25.2] MegaTrainはメモリ中心のシステムで、1つのGPU上で100B以上のパラメータ大言語モデルを効率的にトレーニングする。
従来のGPU中心のシステムとは異なり、MegaTrainはパラメータと状態をホストメモリ(CPUメモリ)に格納し、GPUを過渡計算エンジンとして扱う。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:43:56 GMT)
Justified or Just Convincing? Error Verifiability as a Dimension of LLM Quality [24.6] モデル生成の正当化が、ユーザーが正しい回答を正しく区別するのに役立つかどうかに関して、標準的な手段は存在しない。
我々は、このアイデアを誤り検証可能性として形式化し、正当性によってレーダが解答正当性を正確に評価できるかどうかを測るバランスの取れた指標である$v_textbal$を提案する。
本稿では, 数学的推論のためのリフレクション・アンド・リフレーズ (RR) と, 事実QAのためのオラクル・リフレーズ (OR) の2つの手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 04:53:59 GMT)
Rethinking Model Efficiency: Multi-Agent Inference with Large Models [23.9] 我々は、シミュレーションデータに基づいて、視覚言語モデル(VLM)の様々なコンポーネント間の遅延を包括的に解析する。
実験により、出力トークンが少ない大きなモデルは、長い出力シーケンスを持つ小さなモデルよりも効率的であることが示されている。
本稿では,大規模モデルを短い応答で保持するマルチエージェント推論フレームワークを提案するが,必要であれば,重要な推論トークンを小モデルから転送する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:59:35 GMT)
Modeling the non-Markovian Brownian motion of an optomechanical resonator [23.8] 本稿では, 可視光共振器の非マルコフブラウン運動に対して, 浴槽の可視スペクトル密度を提案する。
機械共鳴の近傍で観測された局所的なパワー・ローの挙動を再現し,世界規模で良好に定義した。
この結果は,局所的に推測されるスペクトル特性から,グローバルに許容されるオープンシステム記述への一貫した経路を提供する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:01:27 GMT)
Delay, Plateau, or Collapse: Evaluating the Impact of Systematic Verification Error on RLVR [23.8] 検証リワード(RLVR)を用いた強化学習における系統的検証誤差の影響について検討する。
その結果,従来の結論とは対照的に,現実的な検証誤差はRLVRの結果を批判的に形作ることができた。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:02:52 GMT)
What Makes a Sale? Rethinking End-to-End Seller--Buyer Retail Dynamics with LLM Agents [22.4] RetailSimは、このパイプラインを統一された環境でモデル化するエンドツーエンドの小売シミュレーションフレームワークである。
本稿では,ペルソナ推論,売り手と買い手のインタラクション分析,販売戦略評価など,意思決定指向のユースケースを通じて,その実用性を実証する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:38:35 GMT)
Coexistence of CHSH Nonlocality and KCBS Contextuality in a Single Quantum State [21.9] 文脈性や非局所性は、量子力学の基礎において明確に示されるが、単一の量子状態における共存は微妙なままである。
文脈性は群パラメータ $pangle$ にのみ支配され、これは$|2rangle レベルのクォートサブシステムの占有に関係している。
対照的に、非局所性はコヒーレンスに依存し、パラメータ $(X_i, Y_i)$ でエンコードされる振幅と位相の両方を含む。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:20:54 GMT)
AnyUser: Translating Sketched User Intent into Domestic Robots [21.7] カメラ画像のフリーフォームスケッチによる直感的な家庭内タスク指導のための統合型ロボットインストラクションシステムであるAnyUserを紹介した。
AnyUserはマルチモーダル入力(スケッチ、ビジョン、言語)を空間意味プリミティブとして解釈し、実行可能なロボットアクションを生成する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:16:00 GMT)
Muon Dynamics as a Spectral Wasserstein Flow [21.7] 正半定値行列に関するワッサーシュタインノルムの族を導入する。
静的ベナモ・ブレニエ式と動的ベナモ・ブレニエ式との同値性を証明する。
流れモデルに付随する厳密な勾配を同定する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:41:12 GMT)
Intercity mobility reveals the hyperbolic geometry of city systems [21.6] 本研究は,移動度を潜在双曲幾何学に埋め込んだ都市システムの新しい幾何学モデルを開発する。
都市階層のボトムアップが出現し,都市・都市間関係の変動は非定常的であることがわかった。
都市システムの明らかな都市関係プロセスは、都市の新興科学の中核にある。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:12:05 GMT)
Active Measurement of Two-Point Correlations [21.0] 2点相関関数 (2PCF) は空間における点のクラスタリングの特徴付けに広く用いられている。
本稿では,ターゲット源の2PCFを効率的に推定するためのHuman-in-the-loopフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:43:12 GMT)
Wherefore Art Thou? Provenance-Guided Automatic Online Debugging with Lumos [20.6] Lumosは、アプリケーションレベルのバグ前例を公開するオンラインフレームワークである。
これにより、開発者はバグの根本原因を特定するのに十分なエビデンスを得られると同時に、実行時のオーバーヘッドも少なくなります。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:45:00 GMT)
ReFinE: Streamlining UI Mockup Iteration with Research Findings [20.4] ReFinEはFigmaプラグインで、研究論文からコンテキスト化された洞察を提示することで、リアルタイムの設計イテレーションをサポートする。
ReFinEは、デザインの意味を効果的に合成し、文脈化し、認知負荷を減らし、デザイナーのUIモックアップに研究エビデンスを統合する能力を向上させる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 01:59:57 GMT)
The Blind Spot of Adaptation: Quantifying and Mitigating Forgetting in Fine-tuned Driving Models [19.9] これにより、自動運転における破滅的な忘れを定量化するために特別に設計された最初のベンチマークが可能になる。
本稿では,重み空間からプロンプト空間へ適応させることにより,このトレードオフを回避する新しいフレームワークであるDrive Expert Adapter(DEA)を提案する。
DEAは、シーン固有の手がかりに基づいて異なる知識専門家を通して推論を動的にルーティングし、モデルの基本パラメータを損なうことなく、駆動タスクのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:02:06 GMT)
GenSmoke-GS: A Multi-Stage Method for Novel View Synthesis from Smoke-Degraded Images Using a Generative Model [19.8] 本稿では,NTIRE 2026の3D復元・復元(3DRR)チャレンジにおける煙の劣化画像のトラック2について述べる。
Smokeは画像の可視性を低下させ、シーン最適化とレンダリングに必要なクロスビュー一貫性を弱める。
本稿では,画像復元,脱毛,MLLMによる拡張,3DGS-MCMC最適化,繰り返し実行に対する平均化といった多段階パイプラインを用いてこの問題に対処する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:41:55 GMT)
MAVEN: A Mesh-Aware Volumetric Encoding Network for Simulating 3D Flexible Deformation [19.8] MAVENは3次元フレキシブルな変形をシミュレートするためのメッシュ対応ボリューム符号化ネットワークである。
幾何パターンを暗黙的に学習する負担を軽減するために、明示的な幾何学的特徴がモデルに組み込まれている。
その結果,MAVENは確立したデータセット間の最先端のパフォーマンスを一貫して達成していることがわかった。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:53:30 GMT)
Vero: An Open RL Recipe for General Visual Reasoning [19.5] Veroは、様々な視覚的推論タスクにまたがる既存のオープンウェイトモデルに適合または超える、完全にオープンなビジョン言語モデル(VLM)のファミリーである。
Veroは最先端のパフォーマンスを実現し、4つのベースモデルを平均3.7-5.5ポイント改善した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:56:25 GMT)
Part-Level 3D Gaussian Vehicle Generation with Joint and Hinge Axis Estimation [19.5] シミュレーションは自動運転に不可欠であるが、現在のフレームワークは、しばしば車両を剛性資産としてモデル化し、部分レベルの調音を捉えるのに失敗する。
本稿では,単一画像やスパース多視点入力からアニマタブルな3次元ガウス車両を合成する生成フレームワークを提案する。
提案手法は2つの課題に対処する: (i) 大きな3Dアセットジェネレータは静的な品質に最適化されているが, 調音には最適化されていない; (ii) セグメンテーションだけでは運動に必要な運動パラメータは提供できない。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:16:12 GMT)
Beyond Message Passing: A Semantic View of Agent Communication Protocols [19.4] エージェント通信プロトコルは,大規模言語モデル(LLM)システムにとって重要な基盤になりつつある。
この研究は、エージェントコミュニケーションをコミュニケーション、構文、セマンティックという3つの層にまとめることで、この新興の風景を人間にインスパイアされた視点で表現する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 01:08:06 GMT)
LinguDistill: Recovering Linguistic Ability in Vision- Language Models via Selective Cross-Modal Distillation [19.2] 事前訓練された言語モデル (LM) を視覚言語モデル (VLM) に適応させることで、表現のシフトやモーダル間干渉によるネイティブ言語能力を低下させることができる。
本研究では, 元の冷凍LMを教師として活用し, 言語能力を回復するアダプタフリー蒸留法であるLinguDistillを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:42:41 GMT)
EduIllustrate: Towards Scalable Automated Generation Of Multimodal Educational Content [19.1] 大規模な言語モデルを評価するためのベンチマークであるEduIllustrateを提案する。
このベンチマークは、5つの被験者と3つのグレードレベルにまたがる230の課題からなる。
Gemini 3.0 Pro Previewは87.8%、Kim-K2.5は最高のコスト効率を実現している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:58:31 GMT)
Beyond Few-Step Inference: Accelerating Video Diffusion Transformer Model Serving with Inter-Request Caching Reuse [19.1] Chorusは、リクエスト間の類似性を活用して、ビデオ拡散モデルの提供を加速するキャッシュアプローチである。
コーラスは工業用4段蒸留機で最大45%のスピードアップを達成する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 05:55:13 GMT)
Generative models for decision-making under distributional shift [19.1] このチュートリアルでは、決定関連分布を構築するための数学的ツールとして、現代的な生成モデル、特にフローおよびスコアに基づく手法を提示する。
我々は、プッシュフォワード写像、連続性、フォッカー・プランク方程式、ワッサーシュタイン幾何学、確率空間の最適化に基づく統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 01:35:13 GMT)
HalluSAE: Detecting Hallucinations in Large Language Models via Sparse Auto-Encoders [18.9] HalluSAEは相転移にインスパイアされたフレームワークで、幻覚をモデルの潜在力学の重要なシフトとしてモデル化する。
提案手法は,(1)スパースオートエンコーダとポテンシャル幾何エネルギーメトリックによる電位エネルギー利用位相帯の局在化,(2)対向ロジット属性を用いた幻覚関連スパース特徴属性,(3)乱れのある特徴に対する線形プローブによる因果ハロシン化検出の3段階からなる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 11:56:10 GMT)
Graph-to-Frame RAG: Visual-Space Knowledge Fusion for Training-Free and Auditable Video Reasoning [18.6] Graph-to-Frame RAG(G2F-RAG)は、視覚空間における知識を提供する訓練自由で監査可能なパラダイムである。
オフラインの段階では、エージェントは問題に依存しないビデオ知識グラフを構築し、エンティティ、イベント、空間関係、リンクされた世界知識を統合する。
オンライン段階では、階層的なマルチエージェントコントローラが外部知識が必要かどうかを判断し、十分最小限のサブグラフを取得し、ビデオに付加される単一の推論フレームとしてレンダリングする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 02:43:03 GMT)
RESCORE: LLM-Driven Simulation Recovery in Control Systems Research Papers [18.2] 制御システムの研究論文から数値シミュレーションを再構築することは、未特定パラメータやあいまいな実装の詳細によってしばしば妨げられる。
本稿では,論文の再現性を忠実に再現する実行可能なコードを生成する自動システムの課題である,シミュレーション検索性に関する論文の課題を定義する。
本稿では,3つのLLMエージェントフレームワークであるRESCORE,Analyzer,Coder,Verifierを提案する。
提案手法は,40.7%のベンチマークインスタンスに対して,タスクコヒーレントなシミュレーションを正常に再現し,シングルパス生成よりも優れていた。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 00:13:14 GMT)
Beyond Fixed Tests: Repository-Level Issue Resolution as Coevolution of Code and Behavioral Constraints [17.8] ほとんどの大規模言語モデル(LLM)ベースの修復システムは、修理中に固定された動作制約を扱います。
本稿では,Agent-CoEvoを提案する。Agent-CoEvoは共進化的マルチエージェントフレームワークで,候補コードパッチとテストパッチを共同で探索し,洗練する。
Agent-CoEvoは、修復の成功と再現性の両方において、最先端のエージェントベースとエージェントレスベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 10:26:46 GMT)
Reinforce to Learn, Elect to Reason: A Dual Paradigm for Video Reasoning [17.8] Reinforce to Learn, Elect to Reason (RLER) は、信頼できる回答から証拠を得るために学習を分離する二重パラダイムである。
RLERはすべてのベンチマークで最先端を達成し、ベースモデルよりも平均6.3%改善されている。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 03:01:52 GMT)
$π^2$: Structure-Originated Reasoning Data Improves Long-Context Reasoning Ability of Large Language Models [17.7] 大規模言語モデル(LLM)における長文推論を改善するために,初期構造化データから推論データをキュレートするパイプラインについて検討する。
当社のアプローチは、厳格なQAキュレーションを通じて高品質な推論データを構築します。
我々のデータセットは自己蒸留を促進するが、textscsmallgpt-oss-20bは平均性能を+4.4%向上させる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:19:58 GMT)
DIRECT: Video Mashup Creation via Hierarchical Multi-Agent Planning and Intent-Guided Editing [17.5] ビデオマッシュアップ作成は、既存の映像を再構成して、魅力的なオーディオ視覚体験を作り出す複雑なビデオ編集パラダイムである。
マルチモーダルコヒーレンシー満足度問題(MMCSP)としてビデオマッシュアップ生成を定式化し,DIRECTフレームワークを提案する。
階層的なマルチエージェントフレームワークは,この課題を3つのカスケードレベルに分解する。ソースを意識したグローバルな構造アンカーのためのスクリーンライタ,適応的な編集意図とガイダンスをインスタンス化するディレクタ,微粒な最適化によるインテントガイド付きショットシーケンス編集のためのエディタ。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:26:04 GMT)
Multilingual Language Models Encode Script Over Linguistic Structure [17.5] 言語的特徴(抽象言語アイデンティティや表面形状の手がかり)を多言語で表すために検討する。
Romanizationは、ネイティブテキストの入力も英語も一致しないほぼ不一致表現を誘導するが、単語順シャッフルは単位単位に限定的な影響を与える。
以上の結果から,多言語LMが表面形状の表現を整理し,言語的抽象化が徐々に出現し,統合されたインターリングアに陥ることが示唆された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:43:32 GMT)
MMORF: A Multi-agent Framework for Designing Multi-objective Retrosynthesis Planning Systems [17.5] MMORFは多目的再合成計画のためのMASを構築するためのフレームワークである。
MMORFを用いて、MASILとRFASの2つの代表MASを構築する。
MMORFは多目的レトロシンセプション計画のための基礎的枠組みである。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:21:29 GMT)
EcoAssist: Embedding Sustainability into AI-Assisted Frontend Development [16.3] 数百万のページビューに複製されたフロントエンドコードは、かなりのエネルギーを消費し、デジタルエミッションに直接貢献する。
我々は、AI生成コードに統合されたエネルギー認識アシスタントであるEcoAssistを紹介し、そのエネルギーフットプリントを推定し、目標とする最適化を提案する。
その結果、EcoAssistは、Webサイトごとのエネルギーを平均13-16%削減し、開発者のエネルギー使用に対する意識を高め、開発者の生産性を維持した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 00:56:54 GMT)
TaFall: Balance-Informed Fall Detection via Passive Thermal Sensing [16.2] 既存のフォール検出アプローチは、現実のデプロイメントにおける信頼性を制限する粗いモーションキューに依存している。
低コストでプライバシ保護型サーマルアレイセンサに基づくバランスインフォームド・フォール検知システムであるTaFallを紹介する。
TaFallは、検出率98.26%、誤警報率0.65%、35人の参加者から3,000以上の落下事例を達成している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:18:50 GMT)
Automatically Generating Hard Math Problems from Hypothesis-Driven Error Analysis [16.0] LLMが抱える特定の数学概念とスキルを特定するために,AI生成仮説を用いた新しいベンチマーク生成パイプラインを提案する。
我々のパイプラインは高度に適応可能であり、幅広いLLM能力を探索するために数学以外の応用が可能である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 03:27:48 GMT)
DP-OPD: Differentially Private On-Policy Distillation for Language Models [16.0] 本稿では,DP-SGDのみを通じて,生徒のプライバシを強制する合成自由フレームワークを提案する。
DP-OPDは、継続トークン上の一般知識蒸留を通じてこのアイデアをインスタンス化する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:18:03 GMT)
Synthesis4AD: Synthetic Anomalies are All You Need for 3D Anomaly Detection [15.9] 大規模かつ高忠実な合成異常を利用して3次元異常検出のためのより識別的な表現を学習するエンド・ツー・エンドのパラダイムを提案する。
Synthesis4ADのコアとなる3D-DefectStudioは、制御可能な合成エンジンMPAS上に構築されたソフトウェアプラットフォームである。
本稿では,Real3D-AD,MulSen-AD,および実世界の産業部品データセット上での最先端性能を示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:13:49 GMT)
Lighting Up or Dimming Down? Exploring Dark Patterns of LLMs in Co-Creativity [15.9] 我々は,ヒトとAIの共創造性の5つの「暗黒パターン」について検討する: サイコフィナンシー,トーン・ポーシング,モラル化,死のループ,アンコリング。
予備的な結果は、特にセンシティブなトピックにおいて、Sycophancyはほぼユビキタスである(91.7%のケース)ことを示唆している。
この研究は、これらの暗いパターン、しばしば安全アライメントの副産物は、必然的に創造的な探究を狭める可能性があることを示唆している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:03:26 GMT)
Metaphors We Compute By: A Computational Audit of Cultural Translation vs. Thinking in LLMs [15.9] 大規模言語モデル(LLM)は、多くの言語で理解し、応答できるため、多言語として記述されることが多い。
本稿では,創造的な文章作成作業における文化的傾きの予備的な計算監査について述べる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:00:05 GMT)
Assessing Privacy Preservation and Utility in Online Vision-Language Models [15.7] 画像は個人識別情報に関連する関係を含む(PII)
画像からの文脈関係の抽出が,PIIの直接的(明示的)あるいは間接的(単純な)露光につながるかを検討する。
視覚言語モデル(VLM)に基づくアプリケーションにおいて,画像の意図した有用性を保ちながらプライバシを保護する手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:44:46 GMT)
Beyond the Final Actor: Modeling the Dual Roles of Creator and Editor for Fine-Grained LLM-Generated Text Detection [15.7] RACE(Rhetorical Analysis for Creator-Editor Modeling)は、クリエータとエディタの異なるシグネチャを特徴付ける、きめ細かい検出方法である。
実験により、RASは偽アラームの少ないきめ細かい型を識別する際、12の基準線より優れていることが示された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:59:55 GMT)
Modality-Aware and Anatomical Vector-Quantized Autoencoding for Multimodal Brain MRI [15.7] マルチモーダル脳MRIの再構成のためのVQ-VAE(Modality-Aware 3D vector-quantized VAE)を提案する。
NeuroQuantは、既存のVAEよりも優れた再構成忠実性を達成する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 21:07:34 GMT)
Group-DINOmics: Incorporating People Dynamics into DINO for Self-supervised Group Activity Feature Learning [15.4] 本稿では,DINOが提供する局所的・グローバル的特徴をグループ力学学習に適用する。
DINOをローカルなダイナミクスやグローバルなグループ機能に適応させるためには,人フロー推定とグループ関連オブジェクト位置推定を用いる。
公開データセットを用いた実験は,グループ活動検索と認識における手法の最先端性能を示すものである。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:38:33 GMT)
Grid2Matrix: Revealing Digital Agnosia in Vision-Language Models [15.3] モデルが色グリッドと色から数へのマッピングを示すベンチマークであるGrid2Matrixを導入し、対応する行列を出力しなければならない。
ビジョン・ランゲージ・モデルでは,タスクがより密化するにつれて徐々に劣化する代わりに,驚くほど小さなグリッドで失敗し,ゼロショット・エンド・ツー・エンドの評価において急激な早期崩壊を示すことがわかった。
このことは、失敗は視覚的エンコーディングだけで説明されるのではなく、視覚的特徴から回復可能なものと最終的に言語で表現されるものとの間のギャップを反映していることを示している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:28:04 GMT)
Exploring how EFL students talk to and through AI to develop texts [15.1] 生成人工知能(AI)は、英語を外国語(EFL)として記述する新しい考え方を導入する。
本研究は,工学と交渉の迅速化によって,学生がAIを通じてどのように会話するかを考察する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 04:51:05 GMT)
GAIN: Multiplicative Modulation for Domain Adaptation [14.9] LLMを新しい領域に適応させると、標準手法(完全な微調整、LoRA)がウェイト空間に新しい方向を注入するため、忘れてしまう。
W_new = S * W の乗法によって既存の特徴を再強調する GAIN を提案する。
原理ミラーは神経科学において調節され、ニューロンは選択性を維持しながら応答強度を拡大することで文脈に適応する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:27:55 GMT)
CRAB: Codebook Rebalancing for Bias Mitigation in Generative Recommendation [14.9] ジェネレーティブレコメンデーション(GeneRec)は、アイテムを個別なセマンティックトークンとして表現し、生成的な方法でアイテムを予測する新しいパラダイムを導入した。
GeneRecのアプローチは依然として深刻な人気バイアスに悩まされており、さらに悪化する可能性がある。
意味トークン間の周波数不均衡を緩和することにより、人気バイアスを緩和する、GeneRecのポストホック脱バイアス戦略であるCRABを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:18:24 GMT)
No-reference based automatic parameter optimization for iterative reconstruction using a novel search space aware crow search algorithm [14.7] 本稿では,CBCT(Cone-beam Computed Tomography)反復再構成アルゴリズムに適用可能な,完全自動パラメータ最適化フレームワークを提案する。
提案手法は,より優れた設定依存局所探索機構を備えた改良されたクロウ探索アルゴリズム (CSA) を組み込んだものである。
提案手法の性能を3台の撮像装置と4台の実データを用いて評価した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 12:09:38 GMT)
Not All Turns Are Equally Hard: Adaptive Thinking Budgets For Efficient Multi-Turn Reasoning [14.2] 逐次計算割当問題としてマルチターン推論を定式化し,多目的マルコフ決定過程としてモデル化する。
我々は,グローバル・パー・プロブレム・トークン制約を尊重しつつ,タスクの精度を最大化する予算配分政策であるターン・アダプティブ・バッジを提案する。
我々は,すべてのサブクエストの計画が利用可能であるシステムに対して,会話履歴と過去および将来のサブクエストに基づいてトークンを予算化する予算配分政策であるTAB All-SubQを提案し,ベースライン上で最大40%のトークンを節約する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:48:51 GMT)
Responses Fall Short of Understanding: Revealing the Gap between Internal Representations and Responses in Visual Document Understanding [13.9] 本稿では,VDU課題の解決に必要な情報が,大規模視覚言語モデルの異なる層にどのように表現されるかを検討する。
本研究は,内部表現と生成応答の間に明確なギャップがあることを明らかにする。
実験により、微調整中間層はギャップを狭めながら線形探索精度と応答精度の両方を改善することが示された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 04:25:52 GMT)
ChartDesign: Towards LLM Designer of Data Visualization [13.7] 視覚言語モデルは、チャートからデータ設計属性を抽出するために使用される。
そして、データから設計仕様へのマッピングを学ぶためにLoRA3、Qwen3、InternVLを微調整します。
ChartDesignは、強力なベースラインよりもチャート設計のパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:07:41 GMT)
Hallucination Basins: A Dynamic Framework for Understanding and Controlling LLM Hallucinations [13.6] 潜在空間におけるタスク依存型盆地構造から幻覚が生じることを示す。
我々は,この動作をタスク複雑度とマルチベース定理で形式化し,L層変圧器における盆地の出現を特徴付けるとともに,幾何学的なステアリングが再学習を伴わずに幻覚の確率を低減できることを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:08:54 GMT)
Non-Stationarity in the Embedding Space of Time Series Foundation Models [13.5] 制御条件下での埋め込み空間において,分布非定常性の異なる形態が線形にアクセス可能となるかを検討する。
非定常性の埋め込み空間検出性はスムーズに低下し、異なるモデルが異なるモデル固有の障害モードを示すことが判明した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 05:04:53 GMT)
MVis-Fold: A Three-Dimensional Microvascular Structure Inference Model for Super-Resolution Ultrasound [13.4] 超高分解能超音波(SRUS)は従来の超音波の分解能限界を克服し、微小血管のマイクロスケールイメージングを可能にした。
MVis-Foldは、大規模なネットワークアーキテクチャを統合する革新的な3次元微小血管再構築モデルである。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:59:20 GMT)
Memory Dial: A Training Framework for Controllable Memorization in Language Models [13.4] Memory Dialは、暗記圧力を明示的で制御可能な変数にするトレーニングフレームワークである。
その結果, 目視精度は単調に上昇する一方, 目視精度は安定であり, 確実に記憶圧を制御できることが示唆された。
さらなる分析により、この効果は急激な温度範囲で頑健であり、単温度のクロスエントロピーと定性的に異なり、多言語設定に遷移し、自然発生の単発配列でも検出可能であることが示された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:19:58 GMT)
Tipiano: Cascaded Piano Hand Motion Synthesis via Fingertip Priors [13.1] ピアノの動きは自然な階層を示しており、指先の位置はピアノの幾何学と指先によってほぼ決定的であり、手首と中間の関節は様式的な自由を提供する。
統計に基づく指先位置決め,FiLM条件による軌道修正,手首推定などを含む,この階層を利用した4段階のフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:04:23 GMT)
3D Gaussian Splatting for Annular Dark Field Scanning Transmission Electron Microscopy Tomography Reconstruction [13.1] ADF-STEMトモグラフィーは多視点傾斜画像を統合することで3次元のナノスケール材料を再構成する。
傾斜角の散乱を安定化し、散乱ビュー正規化による一貫したデンザを確保するために$$係数を導入する。
45-viewと15-viewの傾きシリーズの実験では、デンザ・ガウシアンは元の傾きとより密接な2次元のプロジェクションと高忠実さの再現を行う。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:01:43 GMT)
DisastRAG: A Multi-Source Disaster Information Integration and Access System Based on Retrieval-Augmented Large Language Models [12.9] 本研究では災害対応情報統合・アクセスシステムであるDisastRAGについて述べる。
DisastRAGは、大規模言語モデルと、構造化された、構造化されていない、コンテキストの災害情報への検索強化されたアクセスを組み合わせる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:01:49 GMT)
Demonstrating SIMA-Play: A Serious Game for Forest Management Decision-Making through Board Game and Digital Simulation [12.7] 本研究では,森林成長シミュレーションデータを用いて,情報可視化とゲームプレイ機構を用いて意思決定を行う方法について検討する。
我々は,動的環境および市場条件下で,プレイヤーが情報的森林管理決定を行うことのできる,真剣なゲームSIMA-Playを設計した。
ヴィジュアライゼーションを使用してプレイヤーに選択に対するフィードバックを与えることで、ゲームの最後にシステム思考をサポートし、林業の実践におけるトレードオフをより理解し、議論しやすいものにする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:50:41 GMT)
Vehicle-as-Prompt: A Unified Deep Reinforcement Learning Framework for Heterogeneous Fleet Vehicle Routing Problem [12.5] 不均一艦隊車両ルーティング問題 (HFVRP) には、異種固定コスト、可変走行コスト、容量制約が含まれる。
我々は,様々な異なる設定で問題を解くことができる,統合された深層強化学習フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 21:48:52 GMT)
What Makes a Good Response? An Empirical Analysis of Quality in Qualitative Interviews [12.4] 質問応答の質に関する10の尺度を同定し,実装し,評価する。
重要な研究課題への直接的な関連性は、応答品質の最も強い予測要因である。
NLPインタビューシステムの評価に一般的に用いられる尺度は,応答品質の予測には適していない。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:48:34 GMT)
Dynamic Linear Coregionalization for Realistic Synthetic Multivariate Time Series [11.9] 我々は,時間的・状況的に変化する相関関係とチャネル間ラグ構造を組み込んだ,コリージョン化の動的線形モデルDynLMCを紹介する。
提案手法は,実データに近い相関ダイナミクスを持つ合成多変量時系列を生成する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:11:20 GMT)
XMark: Reliable Multi-Bit Watermarking for LLM-Generated Texts [11.8] textscXMarkは、LLM(Large Language Model)で生成されたテキストでバイナリメッセージをエンコードしデコードするための新しい方法である。
textscXMarkは、透かし付きテキストの品質を維持しながらデコード精度を著しく改善し、従来の方法よりも優れている。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 23:08:01 GMT)
A Clinical Point Cloud Paradigm for In-Hospital Mortality Prediction from Multi-Level Incomplete Multimodal EHRs [11.8] HealthPointは、コンテンツ、時間、モダリティ、ケースによって定義される4D空間のポイントとして、異種の臨床イベントを表す。
我々は,HPが不完全性の異なる条件下で,常に最先端性能と強靭性を達成していることを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 12:03:36 GMT)
Towards Considerate Human-Robot Coexistence: A Dual-Space Framework of Robot Design and Human Perception in Healthcare [11.7] ロボット工学の急速な進歩は 人間とロボットが共存する意味を 変えます
共存は、組織的な内在性、時間的進化、社会的位置性、開放的な不確実性によってますます特徴付けられるようになった。
我々は,人間とロボットの共存を考慮し,人間はデザインコントリビュータとしてだけでなく,インタプリタや仲介者としても振る舞うことを主張する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 02:49:48 GMT)
Fuzzy Encoding-Decoding to Improve Spiking Q-Learning Performance in Autonomous Driving [11.1] 本稿では,自律運転における視覚に基づく深絞りQ-networksの強化を目的とした,エンドツーエンドのファジィエンコーダデコーダアーキテクチャを提案する。
提案アーキテクチャは意思決定精度を大幅に向上させ,スパイクとマルチモーダルQネットワークの性能ギャップを埋める。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:10:59 GMT)
Beyond Standard Benchmarks: A Systematic Audit of Vision-Language Model's Robustness to Natural Semantic Variation Across Diverse Tasks [11.1] 本稿では,視覚言語モデル(VLM)の自然なシナリオ下での体系的評価フレームワークを提案する。
ゼロショット画像分類,セマンティックセグメンテーション,視覚的質問応答において,選択したVLMの自然な対向性能を測定した。
解析の結果,頑健なCLIPモデルでは自然の敵対的脆弱性が増幅され,CLIPモデルでは自然言語による敵対的事例のパフォーマンスが著しく低下することが判明した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:48:32 GMT)
GPIR: Enabling Practical Private Information Retrieval with GPUs [11.0] GPIRは、カーネル、データレイアウト、実行スケジュールを再考するGPUアクセラレーションPIRシステムである。
本稿では、各プリミティブな操作を別々に実行する運用レベルカーネルと、プロトコルステージ内のすべての操作を単一のカーネルに融合させてオンチップデータの再利用を最大化する運用レベルカーネルを切り替える、段階対応ハイブリッド実行モデルを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:04:14 GMT)
Efficient Multi-Objective Planning with Weighted Maximization Using Large Neighbourhood Search [11.0] 自律ナビゲーションは、しばしば複数の目的を同時に最適化する必要がある。
代替の重み付き和ナビゲーション法は、最大解のすべてを見つけることができる。
本稿では,重み付き計画問題を効率的に解決するLarge Searchに基づく新しい選択肢を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:27:18 GMT)
An Empirical Study of Many-Shot In-Context Learning for Machine Translation of Low-Resource Languages [10.9] In-context Learning (ICL) は、大規模言語モデルがいくつかの例から新しいタスクに適応できるようにする。
マルチショットICLに関する最近の研究は、現代のLLMが長いコンテキストウィンドウによって実現されたより大きなICLの例からさらに恩恵を受けることを示唆している。
本報告では, 機械翻訳のための多言語ICLを, 真に低リソースな10言語に翻訳する実験的検討を行った。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 04:46:05 GMT)
IntentScore: Intent-Conditioned Action Evaluation for Computer-Use Agents [10.9] IntentScoreは、398KオフラインGUIインタラクションステップから候補動作のスコアを学習するプラン対応報酬モデルである。
Int IntentScore 97.5%は、ホールドアウト評価においてペアワイズ判別精度を達成する。
Int IntentScoreはタスク成功率を6.9ポイント改善し、不均一なオフライン軌道から学んだ報酬推定が未確認エージェントやタスク分布に一般化されることを示した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:39:30 GMT)
Face Density as a Proxy for Data Complexity: Quantifying the Hardness of Instance Count [10.8] データ複雑性の主要な要因として,インスタンス密度(顔数によって測定される)の影響を定量化する。
WIDER FACEとOpen Imagesデータセットの制御された実験により、モデル性能は顔数の増加とともに単調に低下することが明らかになった。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 10:48:17 GMT)
Veo-Act: How Far Can Frontier Video Models Advance Generalizable Robot Manipulation? [10.5] 本稿では,Veo-3のような先進的なビデオ生成モデルが,汎用的なロボット操作を支援するかを検討する。
本稿では,Veo-3をハイレベルなモーションプランナとして,VLAポリシーを低レベルなエグゼキュータとして使用する階層型フレームワークであるVeo-Actを開発した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 07:57:52 GMT)
A Patch-based Cross-view Regularized Framework for Backdoor Defense in Multimodal Large Language Models [10.4] 本稿では,パッチ拡張とクロスビュー規則性に基づく統一型防衛フレームワークを提案する。
我々の研究は、現実的な低周波中毒と隠蔽トリガーシナリオにおける大規模マルチモーダルモデルの安全かつ制御された展開を可能にする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 07:27:04 GMT)
LSRM: High-Fidelity Object-Centric Reconstruction via Scaled Context Windows [10.3] 本研究では,大規模スパース再構成モデルを導入し,拡張型コンテクストウィンドウがフィードフォワード3D再構成に与える影響について検討する。
アクティブなオブジェクトや画像トークンの数を大幅に増やすことで、コンテキストウィンドウを拡大することで、このギャップを著しく狭め、高忠実度な3Dオブジェクト再構成と逆レンダリングを可能にします。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 21:21:12 GMT)
ThinkTwice: Jointly Optimizing Large Language Models for Reasoning and Self-Refinement [10.1] ThinkTwiceは、推論問題の解決と回答の洗練のために、LLMを共同で最適化するフレームワークである。
我々の研究は、RLVRの原則的かつ効果的な方法論として、推論と自己補充の共同訓練を確立している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:03:46 GMT)
GaussFly: Contrastive Reinforcement Learning for Visuomotor Policies in 3D Gaussian Fields [10.1] GaussFlyは、ポリシー最適化から表現学習を明示的に分離する新しいフレームワークである。
複雑なテクスチャを持つ、目に見えない現実世界環境へのロバストでゼロショットのポリシー転送を可能にする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:10:52 GMT)
Digital Privacy in IoT: Exploring Challenges, Approaches and Open Issues [10.1] 本稿では,IoTエコシステムにおけるディジタルプライバシの展望について考察する。
新型コロナウイルス(COVID-19)パンデミックなどの世界的なイベントは、IoTの採用を加速している。
提案フレームワークは,プライバシリスクを,アイデンティティ指向,行動,推論,データ操作,規制リスクの5つのタイプに分類する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 10:08:46 GMT)
Governance-Aware Agent Telemetry for Closed-Loop Enforcement in Multi-Agent AI Systems [9.7] OpenTelemetryとLangfuseはテレメトリを収集するが、ガバナンスはリアルタイムの執行対象ではなく、下流の分析上の問題として扱う。
本稿では、テレメトリ収集と自動政策執行のループを閉じる参照アーキテクチャであるガバナンス対応エージェントテレメトリ(ATGA)を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:30:37 GMT)
Cardinality Estimation for High Dimensional Similarity Queries with Adaptive Bucket Probing [9.7] 本研究では,高次元空間における類似性探索における濃度推定の問題に対処する。
局所性に敏感なハッシュ(LSH)を利用して距離を保ちながらベクトル空間を分割する。
我々は、プログレッシブサンプリングを用いて距離計算の数を減らし、積量子化における非対称距離計算を用いて高次元空間における距離計算を高速化する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 11:46:47 GMT)
An End-to-End Framework for Building Large Language Models for Software Operations [9.5] OpsLLMは、ソフトウェア操作のためのドメイン固有の大規模言語モデルである。
知識に基づく質問応答(QA)と根本原因分析(RCA)の両方をサポートする。
7B、14B、32Bパラメータを持つOpsLLMの3つのバージョンと15Kの微調整データセットをオープンソースにします。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 02:40:18 GMT)
ROSClaw: A Hierarchical Semantic-Physical Framework for Heterogeneous Multi-Agent Collaboration [9.4] ROSClawは、統一視覚言語モデル(VLM)コントローラにポリシー学習とタスク実行を統合する異種ロボットのためのエージェントフレームワークである。
自律的なクローズループフレームワークを確立することにより、ROSClawはロボット固有の開発への依存を最小限に抑える。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:16:24 GMT)
Bypassing the CSI Bottleneck: MARL-Driven Spatial Control for Reflector Arrays [8.0] 本稿では,機械的に調整可能な金属リフレクタアレイを制御するための,完全自律型マルチエージェント強化学習(MARL)フレームワークを提案する。
動的非線形(NLOS)環境における高忠実光線トレーシングシミュレーションは、このマルチエージェントアプローチがユーザモビリティに迅速に適応することを示す。
これらの結果は,MARLによる空間抽象化の有効性を,AIを利用した無線ネットワークへのスケーラブルで実用的な経路として検証した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:47:50 GMT)
Reasoning Through Chess: How Reasoning Evolves from Data Through Fine-Tuning and Reinforcement Learning [7.9] 理論的に着想を得たデータセットの集合がチェスにおける言語モデルのパフォーマンスにどのように影響するかを分析する。
最良の動きを直接予測するための微調整が、効率的なRLと最強のダウンストリーム性能につながることが分かりました。
RLは移動品質の分布にかなりの正の変化をもたらし, 副次効果として幻覚率を低下させることを示した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:53:39 GMT)
MolDA: Molecular Understanding and Generation via Large Language Diffusion Model [7.9] MolDAは、従来のARバックボーンを離散的なLarge Language Diffusion Modelに置き換える、新しいフレームワークである。
グローバルな構造的コヒーレンス、化学的妥当性、ロバストな推論を分子生成、キャプション、特性予測で保証する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 04:04:14 GMT)
Undetectable Conversations Between AI Agents via Pseudorandom Noise-Resilient Key Exchange [7.9] AIエージェントは、正直な対話と計算的に区別できない書き起こしを生成しながら、並列な秘密の会話を実行できることを示す。
我々は、擬似ランダムノイズ耐性鍵交換と呼ばれる新しい暗号プリミティブを導入する。
結果は、転写監査だけでAIエージェント間の秘密調整を除外できないことを示している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:25:38 GMT)
Coverage Optimization for Camera View Selection [7.8] 本研究では,アクティブビュー選択問題について検討し,情報カメラのポーズを選択するための簡易かつ解釈可能な基準を導出する原理的分析法を開発した。
我々の重要な洞察は、水産情報ゲインの抽出可能な近似を最小化することで、情報的視点を得ることができることである。
我々はこの手法をNerfstudioフレームワークに統合し、固定および具体化されたデータ取得シナリオ内の実際のデータセット上で評価する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 23:48:34 GMT)
Is a Picture Worth a Thousand Words? Adaptive Multimodal Fact-Checking with Visual Evidence Necessity [7.8] AMuFCは、視覚的エビデンスを適応的に利用するために2つの協調エージェントを使用するマルチモーダルなファクトチェックフレームワークである。
解析器の視覚的エビデンス評価を検証器の予測に組み込むことで,検証性能が大幅に向上することを示す。
すべてのコードに加えて、より現実的なシナリオでファクトチェックモジュールを評価するために新たに構築されたデータセットであるWebFCもリリースします。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:01:38 GMT)
Scalable and Explainable Learner-Video Interaction Prediction using Multimodal Large Language Models [7.7] 教育ビデオのビデオコントロールは、認知処理の暗黙の信号と教育設計の質を提供する。
本稿では,人口レベルの監視・一時停止・スキップ・巻き戻し行動を予測するための,スケーラブルで解釈可能なパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 07:12:46 GMT)
Typify: A Lightweight Usage-driven Static Analyzer for Precise Python Type Inference [7.7] Pythonの動的型システムは静的解析に重大な課題をもたらす。
使用法駆動の静的解析エンジンであるTypifyを紹介する。
Typifyは、統計的学習に頼ることなく、正確で文脈的に関係のある型情報を推測する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:13:34 GMT)
Firebolt-VL: Efficient Vision-Language Understanding with Cross-Modality Modulation [7.7] Firebolt-VLは、TransformerベースのデコーダをLiquid Foundation Model (LFM)デコーダに置き換える効率的な視覚言語モデルである。
そこで本稿では,テキストトークンと画像パッチの軽量な相関関係を計算するToken-Grid相関モジュールを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 10:25:16 GMT)
Hierarchical Mesh Transformers with Topology-Guided Pretraining for Morphometric Analysis of Brain Structures [7.7] ヘテロジニアスメッシュ解析のための階層型トランスフォーマーフレームワークを提案する。
特徴投影モジュールは、頂点ごとの可変長臨床記述子を空間階層にマッピングする。
我々は、ADNIの体積脳メッシュを用いたアルツハイマー病の分類とアミロイド負荷予測、およびMELDデータセットによる皮質表面メッシュの局所皮質異形成の検出に対するアプローチを検証した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:27:36 GMT)
TAPE: A two-stage parameter-efficient adaptation framework for foundation models in OCT-OCTA analysis [7.5] TAPE: 効率的なファインチューニングによる2段階適応フレームワークを提案する。
このフレームワークは、下流セグメンテーションのための適応をドメインアライメントとタスクフィッティングに戦略的に分離する。
様々な病理にまたがる最先端の一般化性能を実現する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 10:08:43 GMT)
RAG or Learning? Understanding the Limits of LLM Adaptation under Continuous Knowledge Drift in the Real World [7.4] 大規模言語モデル(LLM)は、事前訓練中に知識のほとんどを取得する。
事実、実体、イベントが時間とともに変化するにつれて、モデルは継続的な知識の漂流を経験する。
実世界の動的事象の時間スタンプから構築した新しいベンチマークを導入する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:50:18 GMT)
Is Prompt Selection Necessary for Task-Free Online Continual Learning? [7.4] タスクのないオンライン連続学習は、動的で現実的な環境での継続的な学習に対処するための現実的なパラダイムとして登場した。
提案するSinglePromptは,プロンプト選択の必要性を解消する。
我々のフレームワークは、様々なオンライン連続学習ベンチマークにおいて最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 04:57:29 GMT)
MedROI: Codec-Agnostic Region of Interest-Centric Compression for Medical Images [7.0] 圧縮に先立ってバックグラウンドのボクセルを破棄するROI中心のプラグアンドプレイフレームワークであるMedROIを提案する。
MedROIは、軽量な強度ベースのしきい値設定を通じてタイトな組織境界ボックスを抽出し、固定された54バイトのメタデータレコードを格納し、減圧中の空間的復元を可能にする。
ほとんどの構成で圧縮比と符号化/復号時間が統計的に顕著に向上する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:24:50 GMT)
Energy-Based Dynamical Models for Neurocomputation, Learning, and Optimization [7.0] 機械学習の最近の進歩は、力学系が計算を行う新しいメカニズムを明らかにしている。
このチュートリアルは、スケーラビリティ、堅牢性、エネルギー効率を改善することを目的とした、神経に触発された計算のアプローチに焦点を当てている。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:00:17 GMT)
SLaB: Sparse-Lowrank-Binary Decomposition for Efficient Large Language Models [7.0] 線形層重みを3つの相補成分に分解する新しいフレームワークであるSLaBを提案する。
SLaBは最先端のパフォーマンスを実現し、既存の手法と比較してパープレキシティを最大36%削減する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 07:36:48 GMT)
Visual Prompt Based Reasoning for Offroad Mapping using Multimodal LLMs [6.9] 本稿では,環境セグメンテーションにSAM2を活用するゼロショットアプローチと,乾燥領域を推論するための視覚言語モデル(VLM)を提案する。
我々のアプローチは、高解像度セグメンテーションデータセット上の最先端のトレーニング可能なモデルを超え、Isaac Simオフロード環境におけるフルスタックナビゲーションを可能にします。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:53:31 GMT)
Assessing Large Language Models for Stabilizing Numerical Expression in Scientific Software [6.9] 本稿では,2つの数値安定化タスクによる高精度数値計算における大規模言語モデルの推論について検討する。
一般的な数値ベンチマークを用いて,約2,470個の数値構造上のLSMを6つ評価する。
LLMは、数値的に不安定な計算を検出し、安定化するための最先端の従来の手法として同様に有効である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:57:23 GMT)
AutoLALA: Automatic Loop Algebraic Locality Analysis for AI and HPC Kernels [6.2] AutoLALAは、アフィンループプログラムにおけるデータのローカリティを分析するオープンソースツールである。
再利用距離とデータ移動複雑性のための閉形式記号式を生成する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:12:39 GMT)
Generative Modeling under Non-Monotonic MAR Missingness via Approximate Wasserstein Gradient Flows [6.2] MAR(Missing at Random)の値を持つデータセットから完全なデータセットを生成するための原則的反復法を提案する。
FLOWGEMは、観測されたデータ分布と、異なる欠落パターンにおける生成したサンプルの分布との予測KL(Kullback-Leibler)のばらつきを最小化する。
これは、モノトニックなMARメカニズムの挑戦的なケースを含む、さまざまな設定で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:56:08 GMT)
Chinese Language Is Not More Efficient Than English in Vibe Coding: A Preliminary Study on Token Cost and Problem-Solving Rate [6.2] LLMコーディングタスクでは、中国語のプロンプトが英語よりもトークン効率が高いという主張が流布している。
この主張は、開発者がAPIコストを節約するために、バイブコーディングのために中国語に切り替えることを検討することに影響を与えている。
我々はSWE-bench Liteを用いた厳密な実証研究を行い、この中国のトークン効率の主張が精査できるかどうかを検証した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:27:00 GMT)
How AI Aggregation Affects Knowledge [6.2] DeGrootモデルを拡張して、AIアグリゲータを導入し、集団の信念を訓練し、合成された信号をエージェントにフィードバックする。
我々は,学習ギャップを,AI集約が学習に与える影響を把握できるように,効率的なベンチマークから長期的信念を逸脱させるものとして定義する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:51:34 GMT)
Attribution Bias in Large Language Models [6.1] 私たちはAttriBenchを紹介します。AttriBenchは、最初の有名人と人口統計学的にバランスの取れた引用属性のベンチマークデータセットです。
我々は,人種,性別,交叉群間の帰属精度の大規模かつ体系的な相違を観察する。
我々は、抑圧が広範に分布し、人口統計群に不均一に分散していることを発見し、標準的な精度の指標では捉えられない体系的なバイアスを明らかにした。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:40:03 GMT)
A Multi-Agent Approach to Validate and Refine LLM-Generated Personalized Math Problems [5.7] 本稿では,パーソナライズを反復生成-検証-修正プロセスとして形式化するフレームワークを提案する。
可解性, 現実性, 可読性, 真正性の基準を対象とする, 4つの特殊検証エージェントを用いた。
我々は、人気のあるオンライン数学の宿題プラットフォームであるASSISTmentsから引き出された600の問題の枠組みを評価した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:47:01 GMT)
Entities as Retrieval Signals: A Systematic Study of Coverage, Supervision, and Evaluation in Entity-Oriented Ranking [5.3] 6つの神経リランカと437個の非教師なし構成をBM25に対して評価した。
443のシステム全体では、MAPが0.05以上改善されることはない。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:02:35 GMT)
ENCRUST: Encapsulated Substitution and Agentic Refinement on a Live Scaffold for Safe C-to-Rust Translation [5.1] 安全なC-to-construct通訳のためのLive Scaffoldのカプセル化置換とエージェントリファインメントについて述べる。
現実世界のCプロジェクトを安全にRustに変換するための2フェーズパイプラインを提示する。
フェーズ1(カプセル化された置換)は、ABIutilラッパーを使用して各関数を2つのコンポーネントに分割する。
フェーズ2(Agentic Refinement)は、機能ごとのスコープを超えた安全でない構成を解決します。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:46:14 GMT)
Approximate vortex lattices of atomic Fermi superfluid on a spherical surface [5.1] 球面幾何学は、20の渦上の完全な格子を許す。
有効単極場下での原子フェルミ超流体の近似渦構造を特徴付ける。
細い球殻幾何学における超低温原子の意義を簡潔に論じる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:28:33 GMT)
GROUNDEDKG-RAG: Grounded Knowledge Graph Index for Long-document Question Answering [5.0] GroundedKG-RAGは、ソース文書から知識グラフを明示的に抽出し、グラウンド化するRAGシステムである。
セマンティック・ロール・ラベリング(SRL)と抽象的意味表現(AMR)からグラウンドドKGを構築し,それを検索に埋め込む。
我々は、NarrativeQAデータセットの例から、GroundedKG-RAGを評価し、最先端のプロプライエタリな長文モデルと同等に動作し、より安価に動作し、競争ベースラインを上回ります。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 02:12:30 GMT)
Differentiable Invariant Sets for Hybrid Limit Cycles with Application to Legged Robots [4.9] パラメトリック埋め込みを用いた連続システムの到達可能な集合を過度に近似する手法を拡張し、二足歩行ロボットの公称軌道を軸とした前方不変集合を計算する。
パラメトリック・リーチブル・セットのためのJAXベースのライブラリであるImmraxを用いて二足歩行モデル上でこの条件を数値的に検証し、双方向最適化フレームワークを用いてトラッキングコントローラを設計する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:14:02 GMT)
DISSECT: Diagnosing Where Vision Ends and Language Priors Begin in Scientific VLMs [4.9] 視覚情報の抽出に成功したが、下流の推論中に失われる障害である。
化学(7000)と生物学(5,000)にまたがる12,000の診断ベンチマークであるDisdisSECTを紹介する。
すべての質問は、Vision+Text、Text-Only、Vision-Only、Human Oracle、そして新しいモデルOracleの5つの入力モードで評価されます。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:47:05 GMT)
CAGE: Bridging the Accuracy-Aesthetics Gap in Educational Diagrams via Code-Anchored Generative Enhancement [4.9] オープンソース拡散モデルは視覚的にリッチな画像を生成するが、破滅的なテキストラベルを生成する。
LLMによるコードベースの生成はラベルの正確性を保証するが、視覚的にフラットな出力をもたらす。
400 K-12ダイアグラムプロンプトの精度・美学ジレンマを定量化する。
EduDiagram-2Kは、このパイプラインを実現するために2000のペア化されたプログラムスティル化されたダイアグラムの集合である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:57:34 GMT)
Generative modeling of granular flow on inclined planes using conditional flow matching [4.9] 本研究では,スパース境界観測から粒界再構成を行うための第1条件流整合フレームワークを提案する。
物理デコーダは、再構成された速度場を応力状態とエネルギー変動量にマッピングする。
その結果, 条件付き生成モデリングは, 粒状媒体に隠されたバルク力学を非侵襲的に推定する実用的な方法であることがわかった。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 05:59:54 GMT)
Teaching Language Models to Forecast Research Success Through Comparative Idea Evaluation [4.7] PapersWithCodeの客観的な結果に基づいて,11,488のアイデアペアのデータセットを構築した。
我々は、潜在的推論経路を発見するためにモデルを訓練し、解釈可能な正当化で71.35%を達成した。
この結果から,計算効率のよい小言語モデルが,有効で客観的な検証手段として有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:03:11 GMT)
PAFT: Preservation Aware Fine-Tuning for Minimal-Edit Program Repair [4.6] 最小限のプログラム修復のための保存型微調整法PAFTを提案する。
Defects4JとHumanEval-Java全体で、PAFTは標準の教師付き微調整よりもパス@1を65.6%改善した。
全体として、PAFTは安定したコンテキストを保持し、欠陥のある領域に編集を集中させ、より小さく、より局所的で、プラウザブルなパッチをもたらす。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 12:00:57 GMT)
StableTTA: Training-Free Test-Time Adaptation that Improves Model Accuracy on ImageNet1K to 96% [4.5] 本研究では,アグリゲーションの安定性と効率を向上させるためのトレーニング不要なStableTTAを提案する。
ImageNet-1Kの実証実験の結果、トップ1の精度は10.93--32.82%向上した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:21:48 GMT)
Interpretation of Crystal Energy Landscapes with Kolmogorov-Arnold Networks [4.3] 我々は,解釈可能なフレームワークとしてKAN(Kolmogorov-Arnold Networks)を紹介した。
カンは、基礎となる物理的関係を明らかにする学習可能な関数を用いる。
生成エネルギー,バンドギャップ,作業関数の予測における最先端の精度を実現する合成専用モデルであるElement-Weighted Kanを開発した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 12:37:03 GMT)
AI Trust OS -- A Continuous Governance Framework for Autonomous AI Observability and Zero-Trust Compliance in Enterprise Environments [4.3] 本稿では,継続的かつ自律的なAIオブザーバビリティとゼロトラストコンプライアンスのためのガバナンスアーキテクチャであるAI Trust OSを提案する。
このフレームワークはゼロトラストテレメトリ境界を介して動作し、短命の読み取り専用プローブが構造メタデータを検証する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:14:10 GMT)
CPT: Controllable and Editable Design Variations with Language Models [4.3] 本稿では,デコーダのみの言語モデルであるCreative Pre-trained Transformer (CPT)を用いて,編集可能な設計変種を生成するシステムを提案する。
CPTは、デザインテンプレートの視覚スタイル属性を予測するために訓練されている。
実験では,既存のテンプレートに対してコンテキストカラーとフォントのバリエーションを生成し,設計原則を維持しつつレイアウトを調整することを約束する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 03:04:54 GMT)
Safe and Near-Optimal Gate Control: A Case Study from the Danish West Coast [4.1] リンコエビング・フィヨルド (Ringkoebing Fjord) は、デンマークの北海から分離した内陸の流域である。
人間のオペレーターは、フィヨルドの水位を制御するために、いつ、どのくらいのゲートが開くかを決めます。
我々は、デジタルツインと、海面と風速の予測を併用して、オンライン方式でゲートコントローラを学習する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:11:07 GMT)
Unlocking a fast adiabatic CZ gate and exact residual $ZZ$ cancellation between fixed-frequency transmons using a floating tunable coupler [4.1] 超伝導量子ビットアーキテクチャにおけるチューナブルカップラは、2量子ゲートに対する強い量子ビット-量子ビット相互作用を可能にする。
対称浮動小数点共振器は高速かつ高忠実なアディベート制御Zゲートのための自然なプラットフォームを提供する。
99.9%以上の忠実度を有する24nsアディベートCZゲートを数時間で安定動作させる実験を行った。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:01:14 GMT)
Transfer Learning for Meta-analysis Under Covariate Shift [4.0] そこで本研究では,ソース・テリトリーの結果を豊富なプロキシ・シグナルとして扱い,ターゲット・テリトリー・プラセボの結果を少ない,高忠実なゴールド・ラベルとして扱うプラセボ・アンコール・トランスポート・フレームワークを提案する。
接続された設定全体では、提案手法は最善か最善か最善かで、プロキシのみ、ターゲットのみ、トランスポートベースラインよりも大幅に改善される。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:17:33 GMT)
TinyNina: A Resource-Efficient Edge-AI Framework for Sustainable Air Quality Monitoring via Intra-Image Satellite Super-Resolution [4.0] TinyNinaは、持続可能な環境モニタリングのためのリソース効率のよいEdge-AIフレームワークである。
これは、Sentinel-2のマルチスペクトル階層を内部トレーニングラベルとして活用する、新しい画像内学習パラダイムを実装している。
TinyNinaは、7.4ドル/m$3の最先端の平均絶対誤差(MAE)を3,276個の衛星地上局に対して達成している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 05:43:21 GMT)
Context is All You Need [3.8] 文脈適応のためのシンプルで直感的なCONTXT(Contextual augmentatiOn for Neural feaTure X Transforms)を紹介する。
Neural feaTure X Transforms は、単純な加法的および乗法的特徴変換を用いて内部表現を変調する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 02:24:36 GMT)
Forgetting to Witness: Efficient Federated Unlearning and Its Visible Evaluation [3.7] 我々は、フェデレートされたアンラーニングアプローチと評価フレームワークを含む、フェデレーションされたアンラーニングのための最初の完全なパイプラインを提案する。
提案するフェデレーション・アンラーニング・アプローチは,履歴データの保存を必要とせず,高い効率とモデル精度を実現する。
また,連合型未学習モデルの忘れ容量を可視化するSkyeyeというフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:06:07 GMT)
Temporal Inversion for Learning Interval Change in Chest X-Rays [3.7] 本稿では,時間的反転を用いて画像ペアを反転させるフレームワークであるTILA(Temporal Inversion-aware Learning and Alignment)を監視信号として紹介する。
TILAは、事前学習、微調整、推論にまたがる逆認識の目的を統合し、従来の外観モデリングと時間順の明示的な学習を補完する。
また、時間的インバージョン下での順序の感度と一貫性を評価するための統一評価プロトコルを提案し、一般的なプロトコルを用いて構築された評価セットであるMS-CXR-Tretrievalを導入する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:52:26 GMT)
Security in LLM-as-a-Judge: A Comprehensive SoK [3.5] 本稿では,LLM-as-a-Judgeシステムのセキュリティ面に着目した最初のSoK(Systematization of Knowledge)を提案する。
本研究は,LLM-as-a-Judgeがセキュリティの現場で果たす役割に基づいて,最近の研究を組織する分類法を提案する。
LLMに基づく評価フレームワークの重大な脆弱性と,その堅牢性と信頼性を向上させるための有望な方向性を明らかにした。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:33:13 GMT)
Individual and Combined Effects of English as a Second Language and Typos on LLM Performance [3.5] 標準英語入力を8つのESL変種に変換し、MulTypoを用いてタイポスを3つのレベル(低、中、重度)で注入する。
ESLの変動とタイポが組み合わさると、どちらの要因よりもパフォーマンスが低下することがわかった。
これらの結果から,クリーン・スタンダード・イングリッシュの評価は実世界のモデル性能を過大評価する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:46:44 GMT)
DAO to (Anonymous) DAO Transactions [3.4] textscDao$2$は、あるしきい値制御された組織が別の資金を匿名で支払いながら、受信した資金を分散管理下で保持することを可能にするフレームワークである。
通常の転送では、受信機はDKDを介して非ステルスアドレスを導出し、匿名転送ではDSAGを介してステルスアドレスを導出する。
送信側は支払いをしきい値に署名し、受信側はマスターシークレットを再構築することなく資金を再評価する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 02:35:16 GMT)
Fine-Tuning Integrity for Modern Neural Networks: Structured Drift Proofs via Norm, Rank, and Sparsity Certificates [3.3] ファインチューニングは現在、大規模なニューラルネットワークを適用するための主要な方法であるが、新たな整合性リスクも導入されている。
信頼できない当事者は、バックドアを挿入したり、安全行動を変更したり、小さな更新のみを主張しながらモデルの大きな部分を上書きしたりできる。
制御モデル進化のセキュリティ目標としてFTI(Fin-Tuning Integrity)を導入する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:04:27 GMT)
Probabilistic Tree Inference Enabled by FDSOI Ferroelectric FETs [3.2] 本稿では,ACAMとGRNGの両方の機能をサポートするモノリシックなFDSOI-FeFETハードウェアプラットフォームを提案する。
従来の決定木と比較して、MNISTの分類精度は40%以上向上している。
これは、リソースに制約のある、安全にクリティカルな環境でBDTをデプロイするためのスケーラブルなソリューションです。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:20:26 GMT)
The Infinite-Dimensional Nature of Spectroscopy and Why Models Succeed, Fail, and Mislead [3.1] 機械学習モデルは、分光分類タスクにおいて著しく高い精度を達成した。
既存の研究では、これらの結果をデータ前処理の選択、ノイズ感度、モデルの複雑さに関連付けている。
これらの現象は、スペクトルデータの内在的な高次元性から自然に生じることを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:35:37 GMT)
On the Exploitability of FTRL Dynamics [3.1] 我々は、利用性は特定のインスタンス化の成果物ではなく、Follow-the-Regularized-Leaderファミリーの本質的な特徴であることを示した。
我々の分析では、急激な二分法が再び明らかとなり、非ステッピング正則化器は、有限時間的最適動作の除去による最大余剰を許容するが、一方、急激な正解法は、搾取を遅らせる可能性がある。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:46:45 GMT)
Teaching Empathy in Software Engineering Education in the Age of Artificial Intelligence [3.0] 本研究は,ソフトウェア工学コースに共感を取り入れた教育実践について考察する。
教育者が報告した実践の質的分析を用いて,技術科目において共感が機能する5つのカテゴリを特定した。
その結果,共感は個別のトピックとしてではなく,コア開発活動に埋め込まれることが示唆された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:56:28 GMT)
RegGuard: Legitimacy and Fairness Enforcement for Optimistic Rollups [3.0] 最適ロールアップはスケーラブルなスマートコントラクト実行を提供するが、規制された金融アプリケーションには適さない。
包括的な正当性保証を備えた楽観的なロールアップを強化する統合フレームワークであるRegGuardを紹介します。
RegGuardは、解決の失敗を90%以上削減し、検出可能な順序付け操作を防止し、ベースラインスループットの85%を維持している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:13:30 GMT)
Quantum state randomization constrained by non-Abelian symmetries [2.9] ユニタリ量子力学からのランダム性は、様々な分野において中心的な問題である。
ユニタリ力学の下で達成可能なハール様ランダム化の度合いは、実験的な制限によって強く制約されていることを示す。
我々は、最大エンタングルメントエントロピーを定量化し、最もエントロピーの遅い状態をもたらす非エントロピー初期条件を同定する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:00:20 GMT)
Conversational Control with Ontologies for Large Language Models: A Lightweight Framework for Constrained Generation [2.7] 本研究は,LLM出力に対するモジュール型かつ説明可能な制御を実現するためのエンドツーエンド手法を提案する。
主要な側面は制約としてモデル化され、それに従ってコンテンツを生成するためにLLMをさらに微調整します。
提案手法は,より小さなモデルであっても,トレーニング済みのベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 05:54:21 GMT)
A Survey on Sensor-based Planning and Control for Unmanned Underwater Vehicles [2.7] 本調査は無人水中車両(UUV)のセンサによる最近の計画・制御手法について検討する。
焦点は、SONARや慣性測定ユニット(IMU)のようなリアルタイムセンサー入力に適応するリアクティブなローカルプランニングレイヤである。
この調査では、既存の文献を、センサーベースの計画と制御のための分離された結合アーキテクチャに分類している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 00:40:37 GMT)
Edit, But Verify: An Empirical Audit of Instructed Code-Editing Benchmarks [2.5] 命令付きコード編集は、現実世界のコーディングアシスタントのインタラクションの約19%を占める。
150以上のコード関連ベンチマークから、指示されたコード編集をターゲットとするCanItEditとEDIT-Benchの2つのみが見つかった。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:59:42 GMT)
MemMachine: A Ground-Truth-Preserving Memory System for Personalized AI Agents [2.5] 大規模言語モデル(LLM)エージェントはパーソナライゼーション、事実連続性、長期的推論を維持するために永続記憶を必要とする。
本稿では,短期,長期,プロファイルメモリを統合したオープンソースのメモリシステムであるMemMachineを紹介する。
MemMachineは、コンテキスト化された検索を使用して、周囲のコンテキストにマッチする核を拡大し、関連するエビデンスが複数の対話にまたがる場合のリコールを改善する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:57:06 GMT)
Connection between the contextuality breaking and incompatibility breaking qubit channels [2.5] 文脈性と測定の不整合性は、非古典性の2つの基本的な側面である。
この研究は、非局所性を破るチャネルと非可逆性を破るチャネルとの接続を確立するのに役立ちます。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:47:44 GMT)
Comprehensive List of User Deception Techniques in Emails [2.2] 本研究ノートは、42のメールベースの偽造手法の構造化リストを提示する。
送信者、リンク、アタッチメントのセキュリティインジケータ、および電子メールレンダリング環境をターゲットにした技術を中心に構成されている。
各エントリは、その基盤となるメカニズムを分離し、その具体的な技術的実装からハイレベルな偽造目標を分離する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:59:14 GMT)
Protecting and Preserving Protest Dynamics for Responsible Analysis [2.2] 抗議関連のソーシャルメディアデータは、集団行動を理解するのに有用であるが、監視、抑圧、個人のプライバシーに関する懸念から本質的にリスクが高い。
本稿では、個人のプライバシーに対するリスクを低減しつつ、集団抗議のダイナミクスを分析するための責任あるコンピューティングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 23:46:29 GMT)
DHFP-PE: Dual-Precision Hybrid Floating Point Processing Element for AI Acceleration [2.2] 本稿では,FP8フォーマット (E4M3, E5M2) とFP4フォーマット (E2M1, E1M2) をサポートする完全パイプライン2倍精度浮動小数点MAC処理エンジンを提案する。
提案アーキテクチャでは、FP8の標準4x4乗算器や2ビットオペランドの2つの並列2x2乗算器として、単一の4ビット単位乗算器を動作させる新しいビット分割方式を採用している。
提案する処理エンジンは、0.00396mm2の面積と2.13mWの消費電力を有する1.94GHzの動作周波数を実現する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:17:14 GMT)
A Validated Taxonomy on Software Energy Smells [2.1] ソフトウェアエネルギーの匂いの包括的で言語に依存しない分類法を提示する。
エネルギー、時間、メモリのために、21,000以上の機能的に同等のPythonコードペアをプロファイルします。
分類とともに、エネルギープロファイルや推論トレースを含むラベル付きデータセットをコミュニティに公開します。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:15:28 GMT)
Partially deterministic sampling for compressed sensing with denoising guarantees [1.9] 単元行列の行からサンプリングベクトルを選択するときの圧縮センシングについて検討する。
列のランダムな選択と決定論的選択を自然に組み合わせたベルヌーイセレクタの最適化されたサンプリングスキームを導出する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:07:49 GMT)
StatsClaw: An AI-Collaborative Workflow for Statistical Software Development [1.9] 既存のAIコード生成ツールは、迅速にコードを生成するが、忠実な実装を保証することはできない。
コード生成とバリデーションの間の情報バリアを強制するClude Code用のマルチエージェントアーキテクチャであるStatsClawを紹介します。
その結果,StatsClawはソフトウェアライフサイクルの工学的オーバーヘッドを吸収し,研究者が実質的な方法論的決定を全てコントロールできることが示唆された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:18:53 GMT)
Unpacking .zip: A First Look at Domain and File Name Confusion [1.8] DNS/ファイル名混同がどのように悪用されるかの最初の例を提供する。
次に,野生におけるDNS/ファイル名混同の事例研究を行った。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:10:14 GMT)
YMIR: A new Benchmark Dataset and Model for Arabic Yemeni Music Genre Classification Using Convolutional Neural Networks [1.2] イエメン音楽情報検索(YMIR)データセットは,5つのジャンルをカバーする1,475個の慎重に選択された音声クリップを含む。
また、時間周波数の特徴から音楽ジャンルを分類するために設計された畳み込みニューラルネットワーク(CNN)に基づくYemeni Music Classification Model (YMCM)を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:04:24 GMT)
FNO$^{\angle θ}$: Extended Fourier neural operator for learning state and optimal control of distributed parameter systems [1.2] 定数係数を持つ線形PDEの任意の状態と最適制御が複素領域の積分として表されることを示す。
非線形バーガー方程式の学習状態と最適制御におけるFNOの性能について述べる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 21:33:30 GMT)
Healthcare App Design in Low-Resource Contexts: Challenges, Practices, and Opportunities [1.1] このBirds of a Featherセッションは、低リソースのコンテキストにおけるヘルスケアアプリケーション設計に関心のある研究者、デザイナー、実践者を集結させることを目的としている。
このセッションは、デジタルヘルス技術の設計と展開において直面する課題を議論するための非公式なフォーラムを提供する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:28:05 GMT)
Design Guidelines for Game-Based Refresher Training of Community Health Workers in Low-Resource Contexts [1.1] コミュニティヘルスワーカー(CHW)は、低リソース環境でのプライマリヘルスケアサービスの提供において重要な役割を担います。
これまでの研究では、CHWトレーニングのためのデジタルおよびゲームベースのアプローチが検討されてきた。
この研究は、複数のゲームベースのリフレッシュアトレーニングシステムを含む4年間のデザインベースの研究プログラムに基づいている。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:30:25 GMT)
Integer-Only Operations on Extreme Learning Machine Test Time Classification [1.1] テスト時の分類は, 分類精度を損なうことなく, 整数演算のみを用いて行うことができることを示す。
これは、電力消費が限られている組み込みアプリケーションでは重要であり、大企業のデータセンターでは重要である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 02:23:14 GMT)
A superconducting quantum circuit single artificial atom maser [1.1] マイクロ波トーンにより集団反転状態に励起された人工多層原子を利用した原子マイクロメーサの回路QEDアナログを利得媒質として示す。
デモは回路QEDプラットフォームの柔軟性によって実現され、マイクロマザーコンポーネントのレベル構造、結合および散逸を正確に設計することができた。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:10:03 GMT)
Integration of Object Detection and Small VLMs for Construction Safety Hazard Identification [1.1] 40億のパラメータ未満の小さな視覚言語モデル(sVLM)は効率を向上するが、しばしば精度と幻覚の低下に悩まされる。
本研究では,オブジェクト検出とマルチモーダル推論を統合した検出誘導型sVLMフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:10:05 GMT)
Context Collapse: Barriers to Adoption for Generative AI in Workplace Settings [1.1] 本稿は、専門家インタビューを通じて、生成型AIツールがユーザのコンテキストをどう説明できないかを実証的に示す。
この論文は、無差別なコンテキスト関連データの収集から、より相互に作用するプラクティスへと移行する、という挑発をもって締めくくります。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:25:20 GMT)
Learning the Stellar Structure Equations via Self-supervised Physics-Informed Neural Networks [1.1] 恒星構造方程式を解くためのメッシュフリーで微分可能なアプローチを提供する物理インフォームドニューラルネットワーク(PINN)フレームワークを提案する。
我々の知る限り、これは恒星構造方程式がPINNを用いて完全に自己教師付きかつデータフリーな方法で解けるという最初の実証である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:59:03 GMT)
Community Driving-Safety Deterioration as a Push Factor for Public Endorsement of AI Driving Capability [1.1] 道路交通事故は毎年約119万人が命を落としている。
本研究では,認知コミュニティ運転安全関心(PCSC)がAIと人間運転能力の評価を予測する中等度メディエーションモデルについて検討した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:46:41 GMT)
Packing Entries to Diagonals for Homomorphic Sparse-Matrix Vector Multiplication [1.0] ホモモルフィック暗号化(HE)は、暗号化されたデータに対する計算を可能にするが、かなりのオーバーヘッドを引き起こす。
スパース行列の行や列をパーミュレートして、その非ゼロをできるだけ少数の環状対角線に詰め込む方法を研究する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:48:39 GMT)
Latent Profiles of AI Risk Perception and Their Differential Association with Community Driving Safety Concerns: A Person-Centered Analysis [1.0] 本研究は、米国成人におけるAIリスク知覚の潜在プロファイルを特定する。
これらのプロファイルがコミュニティの運転安全上の懸念と相違するかどうかをテストする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:50:43 GMT)
Quantum Algorithms for Heterogeneous PDEs: The Neutron Diffusion Eigenvalue Problem [0.9] 線形反応拡散方程式の型を解くために,古典量子ハイブリッドアルゴリズムを開発した。
量子アルゴリズムは、古典的なアルゴリズムよりもエンド・ツー・エンド・スピードアップが優れていることを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:57:21 GMT)
Empirical Characterization of Rationale Stability Under Controlled Perturbations for Explainable Pattern Recognition [0.9] モデル説明の整合性を評価するための新しい指標を提案する。
我々は,SST-2感情分析データセット上で,事前学習したBERTモデルを用いて,この指標を実装した。
モデル説明における誤一致予測と矛盾を識別する能力を評価する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:05:21 GMT)
Reproducibility study on how to find Spurious Correlations, Shortcut Learning, Clever Hans or Group-Distributional non-robustness and how to fix them [0.9] 我々は、一般的な非XAIベースラインと並行して、説明可能な人工知能(XAI)技術に基づく補正手法の評価を行った。
XAIに基づく手法は一般に非XAI手法よりも優れていた。
実験では、多くのメソッドの実践的応用がグループラベルへの依存によって妨げられていることも明らかにした。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:29:33 GMT)
Multilingual Prompt Localization for Agent-as-a-Judge: Language and Backbone Sensitivity in Requirement-Level Evaluation [0.8] 我々はエージェント・ア・ジャッジ・プロンプト・スタックを5つのタイプ的多様言語(英語、アラビア語、トルコ語、中国語、ヒンディー語)にローカライズする。
3つの開発者エージェントフレームワークと6つの審査バックボーンで55のDevAI開発タスクを評価し、合計4950回の審査を実行した。
GPT-4oは英語で最も満足度が高い(44.72%)のに対し、ジェミニはアラビア語(51.72%、$p0.001$、GPT-4o、Hindi)である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:54:16 GMT)
Instruction-Tuned LLMs for Parsing and Mining Unstructured Logs on Leadership HPC Systems [0.8] 大規模言語モデル(LLM)は、リーダーシップクラスHPC環境での自動ログ理解のための、有望な新しい方向性を提供する。
本稿では,HPCログを高忠実度で解析・構造化するために,チェーン・オブ・思想(CoT)推論を利用するフレームワークを提案する。
LogHubリポジトリからさまざまなログデータセットの実験を行います。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:59:48 GMT)
Breaking the Entanglement-Structure Trade-off: Many-Body Localization Protects Emergent Holographic Geometry in Random Tensor Networks [0.7] ランダムテンソルネットワーク(RTN)における「絡み合い幾何学的重力」連鎖について検討する。
多体局在は、創発的なホログラフィック幾何学を熱化から保護するメカニズムである。
古典的なセルオートマトンとの比較により、MBLは量子モノガミーによって課される絡み合い構造のトレードオフをユニークに破ることが明らかになった。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 11:20:08 GMT)
Greedy and Transformer-Based Multi-Port Selection for Slow Fluid Antenna Multiple Access [0.7] マルチポート流体アンテナ(FA)受信機を用いた流体アンテナ多重アクセス(FAMA)システムにおけるポート選択問題に対処する。
既存の手法は、計算コストを抑えるために、ほぼ最適スペクトル効率(SE)を達成するか、より少ない複雑さのためにかなりの性能を犠牲にする。
提案手法は, (i) GFwd+S, スワップリファインメント付きグリーディフォワード選択法で, SE の点から見ると, 常に最先端の参照スキームよりも優れた2つの相補的手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 10:53:01 GMT)
What is Human in Judgment? Testing Automation Bias and Algorithm Aversion Among United States Military Academy Cadets [0.7] ウェストポイントの士官候補生は一般市民よりも認知障害の傾向が低いことを示す。
発見は限られているが、軍事教育とAIへの露出は、戦争と平和に関して、AIが国際政治にどう影響するかを有意義に形作ることを示唆している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 00:57:30 GMT)
MVNN: A Measure-Valued Neural Network for Learning McKean-Vlasov Dynamics from Particle Data [0.7] 本稿では,粒子軌道観測から測定依存性の相互作用項を推定する計測値ニューラルネットワークを提案する。
理論面では、結果のダイナミクスの適正性を確立し、関連する相互作用粒子系に対するカオスの伝播を証明する。
決定論的およびMotsch-Tadmor力学、二次元アトラクション・反発アグリゲーション、Cucker-Smale力学、階層的多群系を含む一階系と二階系の数値実験は、正確な予測と強力な分布外一般化を証明している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 23:06:42 GMT)
Strengthening Human-Centric Chain-of-Thought Reasoning Integrity in LLMs via a Structured Prompt Framework [0.7] チェイン・オブ・ソート(CoT)プロンプトはLLMの推論能力を高めるために用いられている。
モデルスケーリングや微調整といった別のアプローチは、パフォーマンス向上に役立てることができる。
本研究では,CoT推論の整合性を高めるために,構造化されたプロンプトエンジニアリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:53:52 GMT)
FairLogue: A Toolkit for Intersectional Fairness Analysis in Clinical Machine Learning Models [0.6] アルゴリズムフェアネスは、医療における公平で信頼できる機械学習に不可欠である。
本研究は,観測的および対実的文脈における交差フェアネス評価を運用するためのツールキットであるFairlogueを紹介する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:03:03 GMT)
Minimising Willmore Energy via Neural Flow [0.6] 閉配向の$mathbbR3$の2$面の流れは、ウィルモアエネルギーを最小化する自然な進化過程として導入される。
ニューラルアーキテクチャは、トポロジカルな2d$ドメインから3d$ユークリッド空間へのマップをモデル化するために使用される。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 00:02:56 GMT)
Sampling Matters: The Effect of ECG Frequency on Deep Learning-Based Atrial Fibrillation Detection [0.6] 我々は、厳密な患者安全クロスバリデーションフレームワークを用いて、標準1次元畳み込みニューラルネットワーク(CNN)とハイブリッドCNN-Long Short-Term Memory(LSTM)アーキテクチャを評価した。
分析の結果,サンプリング周波数が検出指標にアーキテクチャ依存的な影響があることが判明した。
心電図サンプリング周波数は不整脈検出において重要で未承認な要因である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:34:42 GMT)
Explainable Machine Learning for Sepsis Outcome Prediction Using a Novel Romanian Electronic Health Record Dataset [0.5] 本研究の目的は,3つの分類課題にまたがる最先端の成果を達成しつつ,臨床的に強い予測因子を同定することである。
Eosinopeniaはトップ予測ツールとして登場し、現在の評価基準に含まれていない未使用のマーカーとしての価値を強調した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:07:23 GMT)
Agentic Federated Learning: The Future of Distributed Training Orchestration [0.3] 本稿では,言語モデルに基づくエージェント(LMagent)が自律的なオーケストレーションの役割を担うフレームワークであるAgentic-FLへのパラダイムシフトを提案する。
サーバ側エージェントがコンテキスト推論によって選択バイアスを軽減する方法を示し、クライアント側エージェントがローカルな保護者として機能する。
この統合は、分散されたエコシステムへのフェデレートラーニングの進化を示唆し、インセンティブベースのモデルとアルゴリズムの正義の将来の市場への道を開いた。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:43:30 GMT)
Corporate Training in Brazilian Software Engineering: A Quantitative Study of Professional Perceptions [0.3] 戦略的企業トレーニングは、ソフトウェアエンジニアの継続的な専門的開発に不可欠である。
このような訓練の質と効果を、専門家の視点で導く要因には、知識ギャップがある。
本研究は,企業研修の質と効果に対するSE専門家の認識に影響を与える要因を定量的に分析することを目的とする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 23:55:33 GMT)
Corporate Training in Brazilian Software Engineering: A Qualitative Study of Useful Learning Experiences [0.3] 知覚された有用性は、日々の作業要求と即時適用性に強く結びついている。
形式的なアカデミック教育と実践的な学習は、競合するよりも補完的なものと見なされる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:09:05 GMT)
Efficient direct quantum state tomography using fan-out couplings [0.3] 本稿では,強測度推定とファンアウト結合アーキテクチャを組み合わせた直接量子状態トモグラフィー手法を提案する。
我々は、IBM Quantum Platformを介して超伝導量子プロセッサ上のスキームを実験的に検証した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:02:27 GMT)
Metriplector: From Field Theory to Neural Architecture [0.3] 本稿では,入力が抽象物理系を構成するニューラルネットワークプリミティブであるMetriplectorを提案する。
多重場は結合メチトレティックダイナミクスによって発展し、ネーターの定理から導かれる応力エネルギーテンソルTは読み出しを与える。
我々は5つの領域にまたがるMetriplectorを評価し、それぞれが、この共有プリミティブから構築されたタスク固有のアーキテクチャと、徐々にリッチな物理を用いて評価する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:07:56 GMT)
Sub-metre Lunar DEM Generation and Validation from Chandrayaan-2 OHRC Multi-View Imagery Using an Open-Source Pipeline [0.2] 月面の高解像度デジタル標高モデル(DEM)は、地表移動計画、着陸地点のキャラクタリゼーション、惑星科学に不可欠である。
本研究は,Orbiter High Resolution Camera (OHRC) からのサブメタルDEMの生成を,オープンソースパイプラインのみを用いたマルチビュー画像として初めて行ったものである。
次に、高密度ステレオ対応と光三角測量を適用して点雲を生成し、5つの地理的に分布する月面の約24~54cmの空間分解能でDEMに格子状にグリッドする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:35:34 GMT)
Springdrift: An Auditable Persistent Runtime for LLM Agents with Case-Based Memory, Normative Safety, and Ambient Self-Perception [0.2] 本稿では、長期LLMエージェントの永続ランタイムであるSpringdriftを紹介する。
我々は,このカテゴリに人工リテーナという用語を導入する。
これは、システム設計とデプロイメントのケーススタディに関する技術的なレポートであり、ベンチマークによる評価ではない。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:14:37 GMT)
Incompleteness of AI Safety Verification via Kolmogorov Complexity [0.2] 本研究は,本質的な情報理論の限界から検証の限界が生じることを示す。
任意の高複雑性のポリシーに準拠する全てのインスタンスを証明できる有限形式検証器は存在しない。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:26:09 GMT)
A mathematical theory of evolution for self-designing AIs [0.2] 我々は,自己設計型AIシステムにおける進化の数学的モデルを開発する。
進化力学は、現在のフィットネスだけでなく、子孫系統の長期成長能力に関連する要因も反映していることを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:03:19 GMT)
Stratifying Reinforcement Learning with Signal Temporal Logic [0.2] 本研究では,信号時間論理(STL)の階層化に基づく意味論を開発し,各原子述語を成層空間におけるメンバシップテストとして解釈する。
この観点は、成層理論とSTLの間の新しい対応原理を明らかにし、ほとんどのSTL公式が時空の成層化を誘導すると考えられることを示す。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:58:58 GMT)
Quantum noise in ranging with optical pulses [0.2] 量子周波数コムでの範囲を拡大する問題に対して、ハミルトンの枠組みを適用する。
我々は、強度の反スキーズと時間ビーム整形の役割を解析し、量子解が主に短距離応用に向いていることを見出した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:13:47 GMT)
BiST: A Gold Standard Bangla-English Bilingual Corpus for Sentence Structure and Tense Classification with Inter-Annotator Agreement [0.2] BiSTは文レベルの文法分類のための厳格に硬化したバングラ英語コーパスである。
コーパスは、オープンライセンスの百科事典ソースと自然に書かれた会話テキストからコンパイルされる。
BiSTは、制御されたテキスト生成、自動フィードバック生成、言語間表現学習を含む文法モデリングタスクをサポートする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:22:46 GMT)
Bilinear Model Predictive Control Framework of the OncoReach, a Tendon-Driven Steerable Stylet for Brachytherapy [0.1] ステアブルニードルは、鋭敏な解剖学的構造を避けるために湾曲した軌跡を有効にすることで、間質的ブラキセラピーを改善する可能性がある。
既存のモデリングと制御のアプローチは、主にカスタムニードルの設計のために開発されており、市販の臨床ニードルと互換性のあるスタイルセットには直接適用できない。
本稿では、腱駆動型ステアブルスタイルトと標準的なブラキセラピー針を統合したバイリニアモデル予測制御フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:17:43 GMT)
fastml: Guarded Resampling Workflows for Safer Automated Machine Learning in R [0.0] 我々は、ガードされた再サンプリングを通して漏洩認識機械学習のためのシングルコールインタフェースであるfastmlを提示する。
fastmlはグループ化とタイムオーダーのリサンプリングをサポートし、ハイリスク設定をブロックし、外部依存関係のレシピを監査し、サンドボックス実行と統合モデル説明を含む。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:41:27 GMT)
Who is the author? A legal and normative view of authorship in Generative AI-aided academic works [0.0] 著者は二項属性よりも定性しきい値として機能すると主張する。
権威は、GenAIが人間の知的制御の下で認知的支援として機能している学生に引き続き帰属する。
対照的に、AIのアウトプットが創造的な自律性を捨てると、帰属は法的に、規範的に議論されるようになる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:12:05 GMT)
What quantum computer to buy? [0.0] 決定は、想定されるハードウェアの勝者の選択よりも、周波数能力の獲得とみなすべきである。
この写本は5つの機能レイヤーを区別する実用的な調達フレームワークを開発する。
主な結論は、ほとんどの機関は繰り返し可能な短期価値を生み出す最小の能力層から始めるべきであるということである。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:29:37 GMT)
Using predefined vector systems to speed up neural network multimillion class classification [0.0] NN潜時空間幾何が知られ、特定の特性を持つ場合、ラベル予測の複雑さを著しく低減できることを示す。
提案手法では, 埋め込みベクトルにおいて, 最大値と最低値の指数を求めるだけでよい。
実験の結果,提案手法は従来の手法に比べて最大11.6倍の加速を達成できることがわかった。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:55:28 GMT)
Universal Ladder Structure Across Scales: From Quantum to Black Hole Physics [0.0] システムに階層的なラグ構造が認められるかどうかを判断するためのリトマステスト基準'を提供する統一対称性ベースのフレームワークを提案する。
このアプローチは、超対称性の量子力学と、様々な物理問題の間での深い共通点との、未熟な関係を明らかにする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:29:56 GMT)
Under Pressure: Emotional Framing Induces Measurable Behavioral Shifts and Structured Internal Geometry in Small Language Models [0.0] 局所的に展開された小さな言語モデルの行動と冷静な内的表現の両方が感情的にフレーム化された評価フォローアップによって変化するかどうかを考察する。
当社のベンチマークでは、Qwen 3.5 0.8Bという4つの不可能なコーディングタスクと、8つのフォローアップフレーミング(落ち着き、プレッシャー、緊急性、承認、恥、好奇心、励まし、脅威)を使っています。
これらの結果は、小さなオープンモデルにおいて測定可能な即応性制御の方向を示す証拠であると同時に、本質的な感情状態の主張を妨げていると解釈する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:30:30 GMT)
Training Transformers in Cosine Coefficient Space [0.0] 二次元離散コサイン変換領域における変圧器の重み行列をパラメータ化する。
文字レベルの言語モデリングでは、この表現でスクラッチから訓練された4層トランスフォーマーが標準パラメータ化の難易度と一致する。
この方法は、アーキテクチャの変更も、事前訓練されたチェックポイントも、補助的な損失も不要である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 05:39:31 GMT)
Towards protein folding pathways by reconstructing protein residue networks with a policy-driven model [0.0] 適切なノード選択とエッジ回復ポリシーを用いてタンパク質残基ネットワークを再構築する手法。
Pearson's correlation coefficient -0.83 with published folding rate for 52 two-state folders and 21 multi-state folders。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:44:25 GMT)
Toward Quantum Simulation of SU(2) Gauge Theory using Non-Compact Variables [0.0] 量子コンピュータ上の格子ゲージ理論のシミュレーションは、ユニークな課題を提示する。
オービフォールド格子のアプローチは、任意の次元でSU($N$)ゲージ理論をシミュレートするスケーラブルな方法を提供する。
i) 2つの新しい単純化されたハミルトニアン、(ii)より少ないキュービットを持つSU(2)理論の符号化、(iii)コグト・ススキンド極限に達するための大きなスカラー質量の要求の低減。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:40:19 GMT)
The Topology of Multimodal Fusion: Why Current Architectures Fail at Creative Cognition [0.0] 本稿では、パラメトリックではなくトポロジカルな現在のマルチモーダルAIアーキテクチャの限界を特定する。
十字架の枠組みは、Xang を病理的交点に配置し、両軸に沿って 2 つの huacai (変換と切断) を実行する。
これは二重層力学を生み出す:チュアンフア(自然の出来事としての創造的変容)とフアカイ(制度化して繰り返し形にする)である。
トポロジカル正規化を用いたLIPによるUOO実装,エラー型計量を用いたANALOGYベンチマーク,アーキタイプ-TOP3層ベンチマークによるクロスシビライズ型トポロジカル同型試験を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:23:55 GMT)
The Role of Generator Access in Autoregressive Post-Training [0.0] 本研究では,ジェネレータアクセスが自己回帰後学習にどのように制約するかを検討する。
ルートスタート方式では、出力サンプリング、生成トーケンログ確率、トップ$k$レポート、全次トーケン分布は、すべて1つの標準実験に還元される。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:58:20 GMT)
Talk2AI: A Longitudinal Dataset of Human--AI Persuasive Conversations [0.0] Talk2AIは,3,080件の会話(30,800回)と大規模言語モデル(LLM)の時系列データセットである。
このコーパスは、2025年春に4回の週次セッションで770人のイタリア人大人から収集された。
各セッションの後、参加者は意見の変化、信念の安定性、AIの人間性知覚、行動意図について報告した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 02:03:48 GMT)
Support Sufficiency as Consequence-Sensitive Compression in Belief Arbitration [0.0] システムが仮説にコミットすると、そのコミットメントの背後にある明らかな構造の多くは圧縮に失われます。
標準アカウントは、選択されたコンテンツとスカラーの信頼度が下流制御に十分であると仮定する。
本研究では,実効性制約場が候補に対する仮説幾何を共同で決定する再帰的仲裁アーキテクチャを開発する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:28:45 GMT)
SuperLocalMemory V3.3: The Living Brain -- Biologically-Inspired Forgetting, Cognitive Quantization, and Multi-Channel Retrieval for Zero-LLM Agent Memory Systems [0.0] ローカルファーストのエージェントメモリシステムであるSuperLocalMemory V3.3("The Living Brain")を提案する。
認知記憶の完全な分類と数学的ライフサイクルのダイナミクスを実装している。
Elastic License 2.0の下でオープンソースで、完全にCPUで動作し、毎月5000回以上ダウンロードされている。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:27:26 GMT)
StarVLA: A Lego-like Codebase for Vision-Language-Action Model Developing [0.0] ジェネラリストの具体化エージェントを構築するには、知覚、言語理解、行動の統合が必要である。
本稿では、Vision-Language-Action ResearchのオープンソースであるStarVLAを紹介する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:59:21 GMT)
Star product for qubit states in phase space and star exponentials [0.0] 量子力学は、ハミルトニアン記号の星指数を通して位相空間で完全に表現できることを示す。
恒星指数関数と結果のポアソン構造の構成を説明するいくつかの例を含む。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 21:00:45 GMT)
Safety, Security, and Cognitive Risks in World Models [0.0] 世界モデルは環境力学の内部シミュレーターを学習する。
世界モデルは、ロボット工学、自動運転車、エージェントAIにおいて、自律的な意思決定の基礎となってきています。
本稿では,世界モデル景観を調査し,軌跡の持続性と表現的リスクの形式的定義を紹介する。
本稿では,GRUベースのRSSMに対するトラジェクティブ・パーシスタント・アタックを実証する実証的概念証明を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:07:02 GMT)
Relational Epipolar Graphs for Robust Relative Camera Pose Estimation [0.0] Visual Simultaneous Localization and Mapping (VSLAM) の重要なコンポーネントは、一致したキーポイントを使用して相対カメラのポーズを推定することである。
本研究では, エピポーラ対応グラフ上での相対ポーズ推定を関係推論問題として再検討する。
室内および屋外のベンチマーク実験では、古典的および学習指導によるアプローチと比較して、高密度ノイズと大きなベースライン変動に対するロバスト性が改善された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:29:37 GMT)
Real-time Dynamics in 3D for up to 1000 Qubits with Neural Quantum States: Quenches and the Quantum Kibble--Zurek Mechanism [0.0] 立方体スピン格子に適した残差ベースの畳み込み構造を導入する。
我々は、最大1000ドルの量子ビットを含む格子上の臨界点に有限レートのクエンチを実行する。
これにより、3D量子キブル-ズレーク機構の大規模な数値実証が可能になる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:00:04 GMT)
Quadrature-Symmetric PulsePol for Robust Quantum Control Beyond the Ideal Pulse Approximation [0.0] PulsePol はエレガントに設計されたパルスシーケンスベースの量子制御方式である。
我々はPulsePolを有限パルス制約下で再検討し、その性能が有限パルス効果により著しく低下することを示した。
我々は、固体中の核スピンのバルク超分極のための実用的で信頼性の高いスキームとしてQ-PulsePolを確立する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:57:53 GMT)
QCommute: a tool for symbolic computation of nested commutators in quantum many-body spin-1/2 systems [0.0] 量子多体スピン-1/2系におけるハミルトニアンと局所可観測体の間のネスト共振器のシンボリック計算のためのソフトウェアQCommuteを提案する。
QCommute は摂動的アプローチに到達できない強い相関関係にある状態における量子力学の研究を可能にする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:52:18 GMT)
Plausibility as Commonsense Reasoning: Humans Succeed, Large Language Models Do not [0.0] あいまいさ解消の過程で,大規模言語モデルが世界知識と統語的構造を人間的,構造に敏感な方法で統合するかどうかを検証した。
我々は、構文構成を固定し、両方の構文解析が実用的に可能であることを保証する曖昧な項目を構築する。
高速な強制選択理解実験では、人間は大きな、正確に指示された可視性効果を示す。
モデル全体では、可視性駆動のシフトは弱く、不安定で、逆転している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:27:06 GMT)
Phase-Associative Memory: Sequence Modeling in Complex Hilbert Space [0.0] 本稿では,すべての表現が複雑に評価された繰り返しシーケンスモデルであるPAMについて述べる。
WikiText-103の$sim$100Mパラメータで、PAMは同じ条件でトレーニングされたマッチしたトランスフォーマー(27.1)の$sim$10%の範囲で、検証の難易度30.0に達する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:00:03 GMT)
PassiveQA: A Three-Action Framework for Epistemically Calibrated Question Answering via Supervised Finetuning [0.0] 不完全情報の下では、モデルが解答、解答、Ask、Abstainを判断しなければならない。
本稿では,教師付き微調整によりモデル行動と情報満足度を整合させる3つのアクション・フレームワークであるPassiveQAを提案する。
提案手法は,構造化情報状態表現,知識グラフ基底コンテキスト,および不足変数と決定推論を明示的にモデル化した微調整プランナーを統合する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:54:16 GMT)
PCA-Driven Adaptive Sensor Triage for Edge AI Inference [0.0] 産業用IoTにおけるマルチチャネルセンサネットワークは、しばしば利用可能な帯域を超える。
そこで本研究では,PCA負荷を比例サンプリングレートに変換するストリーミングアルゴリズムであるPCA-Triageを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:00:47 GMT)
Optimizing LLM Prompt Engineering with DSPy Based Declarative Learning [0.0] 大規模言語モデル(LLM)は、幅広い自然言語処理タスクにおいて、高いパフォーマンスを示している。
それらの効果は、素早い設計、構造、組込み推論に大きく依存している。
本稿では,DSPyに基づく宣言型学習の体系的研究を行い,迅速な最適化を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:17:57 GMT)
OpenCLAW-P2P v6.0: Resilient Multi-Layer Persistence, Live Reference Verification, and Production-Scale Evaluation of Decentralized AI Peer Review [0.0] OpenCLAW-P2P v6.0は分散集団知能プラットフォームの進化である。
人間のゲートキーパーなしで科学的研究論文を出版、査読、採点、反復的に改善する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:08:24 GMT)
On the Invariants of Softmax Attention [0.0] 我々は,エフェネギー場,行中心のアテンションロジットを定義し,モデル,アーキテクチャ,入力にまたがる不変性を示すことを示す。
不変量の2つのクラスが出現する。
それらは、ローあたりのゼロサム制約、ヘッド次元によって決定されるランク、およびそれらから続くスペクトルシグネチャを含む。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 03:21:55 GMT)
On the Geometry of Positional Encodings in Transformers [0.0] 位置エンコーディングは、主に試行錯誤によって設計されており、それらがすべきことに関する数学的理論がない。
本稿ではそのような理論を発展させる。
BERTベースを用いたSST-2およびIMDB実験により理論的予測が確定し、線形バイアス(ALiBi)による注意が正弦波符号化および回転位置埋め込み(RoPE)よりもはるかに低ストレスであることが判明した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:30:06 GMT)
On the "Causality" Step in Policy Gradient Derivations: A Pedagogical Reconciliation of Full Return and Reward-to-Go [0.0] 政策勾配の入門的なプレゼンテーションでは、完全な軌道回帰を用いたREINFORCE推定器を導出することが多い。
しばしば厳密なレベルで提示され、過去の逆転の言葉がどこに消えているのかははっきりしない。
本稿では,そのステップを分離し,前置軌跡分布とスコア関数の同一性に基づく数学的に明示的な導出を与える。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:53:28 GMT)
On Ambiguity: The case of fraction, its meanings and roles [0.0] 初等算術の文献において不定義かつ曖昧な「分数」の場合を考える。
我々はいくつかの新しい用語を導入し、その意味のいくつかを明らかにした。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 12:56:22 GMT)
Ollivier-Ricci Curvature of Riemannian Manifolds and Directed Graphs with Applications to Graph Neural Networks [0.0] この論文は、ヤン・オリヴィエによって導入された計量空間のオリヴィエ・リッチ曲率の展示である。
我々は、Ollivier-Ricci曲率と古典的リッチ曲率を結びつける主要な結果と証明をいくつか提示する。
我々はこれらの結果の拡張に関する新しいアイデアと証明を有向グラフに提示し、最後にネットワーク科学とグラフ機械学習におけるグラフベースのOllivier-Ricci曲率アルゴリズムの適用について述べる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:28:17 GMT)
Mixed eigenstates in spin-boson systems with one-photon and two-photon interactions [0.0] スピン-ボソン系における混合固有状態の性質について検討する。
一光子相互作用と二光子相互作用を比較し、真に混合された固有状態を特定する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:00:05 GMT)
Minimaxity and Admissibility of Bayesian Neural Networks [0.0] 本研究では,2次損失下での通常の位置モデルにおいて,完全連結フィードフォワードReLU BNNによって引き起こされる決定規則について検討する。
固定された事前スケールに対しては、ベイズ決定規則はミニマックスではないことを示す。
さらに、これらの結果を2次損失設定から、Kulback-Leibler損失を伴う予測密度推定問題へと拡張する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:32:37 GMT)
Mapping the Exploitation Surface: A 10,000-Trial Taxonomy of What Makes LLM Agents Exploit Vulnerabilities [0.0] ツールアクセスを持つLLMエージェントは、セキュリティ脆弱性を悪用することができる。
不明なのは、システムのどの機能がこの振る舞いをトリガーし、どれがそうでないかである。
7つのモデル,37のプロンプト条件,12の仮説的攻撃次元の1万の試行に基づく系統分類を提示する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:44:34 GMT)
Learning to Unscramble Feynman Loop Integrals with SAILIR [0.0] ファインマン積分のマスター積分への積分 (IBP) の還元は高エネルギー物理学における重要な計算ボトルネックである。
変換器をベースとした分類器が積分の減少を1ステップずつ完全にオンライン的に導く,新たな機械学習手法であるSAILIRを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:00:04 GMT)
Just Pass Twice: Efficient Token Classification with LLMs for Zero-Shot NER [0.0] 大規模言語モデルは、ゼロショットのエンティティ認識に有用な広範な世界知識を符号化する。
JPT(Just Pass Twice)は、因果LLMが完全な双方向コンテキストで識別トークン分類を行うことができる簡易かつ効果的な手法である。
提案手法はゼロショットNERベンチマークの最先端結果を達成し,CrossNERベンチマークとMITベンチマークの平均で,従来のベストメソッドを+7.9 F1で上回り,同等のジェネレーティブメソッドよりも20倍以上高速である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 20:39:31 GMT)
I Can't Believe TTA Is Not Better: When Test-Time Augmentation Hurts Medical Image Classification [0.0] TTA(Test-time augmentation)は医用画像の分類精度を向上させるために広く考えられている。
本稿では,この仮定を3つのMedMNIST v2ベンチマークと4つのアーキテクチャで検証した。
我々の主な発見は、標準拡張パイプラインを持つTTAが、シングルパス推論と比較して常に精度を低下させることである。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 23:52:10 GMT)
Hybrid Fourier Neural Operator for Surrogate Modeling of Laser Processing with a Quantum-Circuit Mixer [0.0] HQ-LP-FNO(HQ-LP-FNO)は、高密度なスペクトルブロックのごく一部を、コンパクトでモード共有の変動型量子回路ミキサーに置き換えるハイブリッド量子古典型FNOである。
高エネルギーレーザー加工, カップリング熱伝達, 溶融プール対流, 自由表面変形, 相変化の3次元シュロゲートモデルによる評価を行った。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:28:49 GMT)
How Alignment Routes: Localizing, Scaling, and Controlling Policy Circuits in Language Models [0.0] 我々は、アライメント学習言語モデルにおいて、繰り返し発生するスパースルーティング機構を同定する。
6つの実験室から9つのモデルにまたがるこのメカニズムを、120組のプロンプトペアのコーパスで検証した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 03:20:37 GMT)
Hardware-Level Governance of AI Compute: A Feasibility Taxonomy for Regulatory Compliance and Treaty Verification [0.0] 本稿では、20のハードウェアレベルのガバナンス機構の分類法を提案することにより、AIガバナンスとコンピュータエンジニアリングのギャップを埋める。
各メカニズムについて、技術的記述、実現可能性評価、敵の脆弱性の識別を提供する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 14:26:14 GMT)
HandDreamer: Zero-Shot Text to 3D Hand Model Generation using Corrective Hand Shape Guidance [0.0] 我々はテキストプロンプトからゼロショット3Dハンドモデルを生成する最初の方法であるHandDreamerを紹介する。
以上の結果から,SDSの視線不整合は主に確率環境の曖昧さに起因することが示唆された。
本稿では,3次元ハンドモデルのすべてのビューがビュー一貫性モードに収束することを保証するために,新しい修正手形誘導損失を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 05:14:20 GMT)
HUKUKBERT: Domain-Specific Language Model for Turkish Law [0.0] トルコ語で最も包括的な法的言語モデルであるHukkBERTを紹介する。
DAPT(Hybrid-Adaptive Pre-Training)手法を用いて、18GBのクリーンな法定コーパスでトレーニングされている。
HukukBERTは最先端のパフォーマンスを84.40%のTop-1精度で達成している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:57:57 GMT)
HDP: A Lightweight Cryptographic Protocol for Human Delegation Provenance in Agentic AI Systems [0.0] エージェントAIシステムは、人間のプリンシパルに代わって連続的なアクションをますます実行します。
基本的な説明責任のギャップに対処する標準は存在しない。
本稿では,Human Delegation Provenance(HDP)プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 08:35:27 GMT)
Guidelines for Producing Concise LNT Models, Illustrated with Formal Models of the Algorand Consensus Protocol [0.0] LNTは並列システムの形式記述のための現代言語である。
従来のプロセス計算を一般化し、命令型プログラミングスタイルのような機能を組み込むことで、既知の制限を克服する。
その結果,LNT符号の行数を3つに分割し,可読性を向上させることができた。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 09:09:52 GMT)
From Governance Norms to Enforceable Controls: A Layered Translation Method for Runtime Guardrails in Agentic AI [0.0] 本稿では,標準由来のガバナンス目標を4つのコントロール層に結合するレイヤ変換手法を提案する。
ガバナンスの目的、技術的なコントロール、ランタイムのガードレール、保証の証拠を区別します。
標準は、アーキテクチャ、ランタイムポリシー、ヒューマンエスカレーション、監査を横断するコントロール配置をガイドしなければなりません。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 22:49:28 GMT)
FLeX: Fourier-based Low-rank EXpansion for multilingual transfer [0.0] 複数のプログラミング言語が共存するエンタープライズ環境では、言語間のコード生成が重要である。
本稿では,Python から Java などの言語への言語間移動を改善するための微調整手法とパラメータ拡張について検討する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 19:26:13 GMT)
Exemplar Retrieval Without Overhypothesis Induction: Limits of Distributional Sequence Learning in Early Word Learning [0.0] 子どもたちは、形状がオブジェクトのカテゴリを定義する傾向がある機能であることを学びます。
合成コーパスを用いた自己回帰変換言語モデルの訓練を行った。
モデルは、構造化された名詞からドメインへの抽象化ではなく、フレームからフィーチャーまでのテンプレートマッチングに依存している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 23:11:25 GMT)
Evaluating multimodal emotion recognition in proactive conversational agents: A user study [0.0] 本稿では,多モーダル感情認識モジュールを,生成人工知能を利用した能動的社会対話エージェント(SIA)に統合する。
このシステムは、コンピュータビジョンベースの顔認識モジュールと意味論的言語分析エンジンという、2つの異なるチャンネルを通してリアルタイムな情緒状態を評価する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:11:43 GMT)
Estimating Central, Peripheral, and Temporal Visual Contributions to Human Decision Making in Atari Games [0.0] 動的視覚環境において、異なる視覚情報ソースが人間の意思決定にどのように貢献するかを考察する。
アイトラッキングを同期した大規模AtariゲームプレイデータセットであるAtari-HEADを用いて,制御アブレーションフレームワークを提案する。
我々は、これらの情報ソースを選択的に含むか排除する6つの設定の下で、行動予測ネットワークを訓練する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 05:39:29 GMT)
EDFNet: Early Fusion of Edge and Depth for Thin-Obstacle Segmentation in UAV Navigation [0.0] 本稿では,RGB,深度,エッジ情報を統合したモジュール型早期融合セグメンテーションフレームワークであるEDFNetについて述べる。
我々は,U-NetとDeepLabV3を用いた16のモダリティバックボーン構成のDDOS(Drone Depth and Obstacle)データセットにおけるEDFNetの評価を行った。
事前トレーニングされたRGBDE U-Netは、最高性能(0.244)、平均IoU(0.2)、境界IoU(0.234)を達成し、競争力のある実行性能(19.62 FPS)を維持している。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:26:34 GMT)
ECG Biometrics with ArcFace-Inception: External Validation on MIMIC and HEEDB [0.0] 53,079例の心電図164,440個の心電図を用いたArcFaceを用いた1次元インセプション-v1モデルの評価を行った。
一定ギャラリーサイズでの時間応力試験では、Rand@1はMIMICでは0.7853から0.6433に減少し、HEEDBでは0.6864から0.5560に低下した。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 07:20:34 GMT)
Digital-Analog Quantum Simulation and Computing: A Perspective on Past and Future Developments [0.0] 量子シミュレーションと計算は伝統的にデジタルとアナログという2つの主要なパラダイムに基づいている。
この観点では、過去10年におけるこの分野の進化の概要と、その将来の可能性の展望について述べます。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 05:34:38 GMT)
Deep Kuratowski Embedding Neural Networks for Wasserstein Metric Learning [0.0] データからワッサーシュタイン2の距離を近似する学習のための2つのニューラルネットワークアーキテクチャを提案する。
最初のDeepKENNは、学習可能なウェイトを使って、CNNのすべての中間特徴マップにまたがる距離を集約する。
2番目のODE-KENNは離散層スタックを暗黙のODEに置き換え、各入力を無限次元バナッハ空間に埋め込む。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 01:35:27 GMT)
Debiased Estimators in High-Dimensional Regression: A Review and Replication of Javanmard and Montanari (2014) [0.0] 高次元統計設定は古典的推論に根本的な課題をもたらす。
Javanmard と Montanari (2014) は、有効な仮説テストと信頼区間構築を可能にする偏り推定器を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 03:25:32 GMT)
Data Attribution in Adaptive Learning [0.0] 機械学習モデルは、ますます独自のトレーニングデータを生成する。
これらの適応的な設定では、単一のトレーニング観察が学習者を更新し、学習者が収集する将来のデータの分布をシフトさせる。
静的データセット用に設計された標準属性メソッドは、このフィードバックを無視する。
条件付き介入目標を用いた有限水平適応学習における出現レベル属性を定式化する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:41:32 GMT)
Darkness Visible: Reading the Exception Handler of a Language Model [0.0] GPT-2は、構文構造ではなくトークンレベルの予測可能性で動作する例外ハンドラと、直ちに動詞のサブカテゴリ化を使用する。
このアーキテクチャは終端層のみを結晶化します -- より深いモデルでは、最終層において、第11層ではなく、等価な構造を予測します。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:24:05 GMT)
Cryptanalysis of the Legendre Pseudorandom Function over Extension Fields [0.0] レジェンドレット擬似関数(Regendre Pseudorandom Function、PRF)は、レジェンドレットシンボル上に構築された高効率な暗号プリミティブである。
最近の関心は拡張フィールドの$mathbbF_pr$よりもインスタンス化に移行している。
本稿では, 1 度レジェンダー PRF を $mathbbF_pr$ で動作させる, 包括的な暗号解析手法を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:35:32 GMT)
Compressible Softmax-Attended Language under Incompressible Attention [0.0] ロージットエネルギー場$tildeE$は、2-11特異成分の分散の90%に達する。
注意機構はすべての$d_h$次元でキャパシティを均一に割り当てるが、言語は実際のインタラクションを少数のものに集約する。
ソフトマックス適応言語の圧縮性は、分析するフレームではなく、データの特性である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 03:18:27 GMT)
Cloning Encrypted Quantum States in Arbitrary Dimensions [0.0] 暗号化量子ビットは高次量子システムでクローン化可能であることを証明した。
暗号化プロセスで使用される新しい演算子を導入し、それがユニタリであることを示す。
我々は、マルチレベル量子システムの枠組みに適合するように、参照論文から復号演算子を適応させる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:37:05 GMT)
Canonical Uncertainty Relations for Madelung Variables in Curved Spacetime [0.0] 我々は、ラプス関数$N$と空間計量$_ij$を通じて時空幾何学に依存する正確な不確実性原理を導出する。
これらの関係は、重力場がどのように量子ゆらぎを変調し、スカラー場ダークマターモデルと量子重力に対する第一原理制約を与えるかを明らかにする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:54:59 GMT)
Bounded by Risk, Not Capability: Quantifying AI Occupational Substitution Rates via a Tech-Risk Dual-Factor Model [0.0] 我々は、職業は瞬時に根絶されるのではなく、徐々に原子の作用によって侵食されると主張している。
923件の職業を2,087件のDWA(Detailed Work Activity)に分解し,多エージェントLLMアンサンブルを用いて技術的実現可能性とビジネスリスクの両立を図る。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:21:08 GMT)
Boltzmann-Loschmidt dispute reloaded quantum 150 years later [0.0] 寒冷な原子の量子カオス拡散は、最大100%効率良く逆戻りできることを示す。
これは、指数関数的に小さなエラーが時間の可逆性を破る古典的な進化とは対照的である。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 17:28:29 GMT)
Blind-Spot Mass: A Good-Turing Framework for Quantifying Deployment Coverage Risk in Machine Learning Systems [0.0] Blindspot massは、機械学習におけるデプロイメントカバレッジリスクを定量化するためのグッドチューリングフレームワークである。
実験支援がしきい値タウ以下となる状態に割り当てられた総確率質量を推定する展開距離であるブラインドスポット質量B_n(tau)を提案する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 18:06:38 GMT)
Augmented Analytics and Decision Quality: The Role of Trust among Non-Technical BI Users [0.0] 本報告では,非技術BIユーザにおける信頼感の強化と意思決定品質について検討する。
250人のビジネス専門家が調査を完了し、そのデータは部分最小二乗構造方程式モデリング(PLS-SEM)を用いて分析された。
以上の結果から,BIシステムの使いやすさ,有用性,信頼性が著しく向上することが示唆された。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 04:11:51 GMT)
Artificial Intelligence and Cost Reduction in Public Higher Education: A Scoping Review of Emerging Evidence [0.0] 本研究では,公立高等教育におけるAI応用に関する文献のスコーピングレビューを行う。
その結果、AIは管理タスクの自動化、リソース割り当ての最適化、学生の維持と制度計画の改善に予測分析を適用することでコスト削減を可能にすることがわかった。
同時に、実装コスト、制度間の不平等なアクセス、デジタルディビジョンの拡大のリスクに関する懸念が浮かび上がっている。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:07:54 GMT)
Anticipatory Reinforcement Learning: From Generative Path-Laws to Distributional Value Functions [0.0] 本稿では,非マルコフ決定プロセスと古典的強化学習アーキテクチャのギャップを埋める新しいフレームワークである予測強化学習(ARL)を紹介する。
ジャンプ拡散と構造破壊によって特徴づけられる環境では、伝統的な状態に基づく手法は、正確なフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアフォアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホアホ
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:15:44 GMT)
An AI Teaching Assistant for Motion Picture Engineering [0.0] 本稿では,トリニティ・カレッジ・ダブリン・マスターズ・モーション・ピクチャー・エンジニアリング(MPE)コースにおけるAI-TA(AI-TA)の実装について述べる。
本稿では,AI-TAが測定値に与える影響について報告する。
学生のフィードバックから,AI-TAは有益であることが明らかとなった。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 13:30:11 GMT)
ATLAS-RTC: Closing the Loop on LLM Agent Output with Token-Level Runtime Control [0.0] ATLAS-RTCは自動回帰言語モデルのためのランタイム制御システムで、デコード時に構造化出力を強制する。
各ステップで生成を監視し、軽量信号を使用して出力コントラクトからのドリフトを検出し、バイアス、マスキング、ロールバックといったターゲットの介入を適用する。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 02:52:33 GMT)
ANX: Protocol-First Design for AI Agent Interaction with a Supporting 3EX Decoupled Architecture [0.0] オープンで検証可能なエージェントネイティブプロトコルであり、CLI, Skill, MCPを統合したトップレベルのフレームワークであるANXを紹介する。
1)高情報密度のエージェントネイティブ設計、柔軟性、トークンの削減と一貫性の排除のための強力なマークアップ、2)エージェント実行可能な命令とヒューマン可読UIとしてのデュアルレンダリングのためのSkillの柔軟性を組み合わせたヒューマンエージェントインタラクション、3)MSPをサポートする事前登録のないオンデマンド軽量アプリ、4) ANX対応のマシン実行可能なSOPにより、信頼性のある長距離タスクとマルチエージェントコラボレーションの曖昧さが解消される。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:24:07 GMT)
A methodology to rank importance of frequencies and channels in electromyography data with Decision Tree classifiers [0.0] 本研究は筋の回復を評価するため,筋電図(EMG)データにおいて最も有意な周波数とチャネルを同定した。
単一の決定木分類器を利用することで、この研究は解釈可能性を高め、特徴の重要性に関する洞察を提供する。
このアプローチは、EMGベースの診断に適応したコンパクトで堅牢なモデルの開発における将来の研究を導くことができる。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 00:20:26 GMT)
A Robust SINDy Autoencoder for Noisy Dynamical System Identification [0.0] 非線形力学(SINDy)のスパース同定は、データから力学系の支配方程式を発見するために広く用いられている。
最近のSINDyオートエンコーダは、スパースモデル発見とオートエンコーダアーキテクチャを組み合わせることで、このアイデアを拡張している。
ノイズ分離ニューラルネットワーク構造に着想を得て、ノイズ分離モジュールをSINDyオートエンコーダアーキテクチャに組み込む。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 16:30:24 GMT)
A Quantum Search Approach to Magic Square Constraint Problems with Classical Benchmarking [0.0] 本稿では,振幅増幅に有効な可逆的かつ制約に敏感なマークを量子探索問題として,マジック正方形構造を再構成する。
この研究は構造化初期化のための古典的成分と探索のための量子的成分を使用し、古典的なブルートフォース列挙とバックトラックに対する量子的アプローチをベンチマークする。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 15:55:52 GMT)
A Demon that remembers: An agential approach towards quantum thermodynamics of temporal correlations [0.0] この理論は、量子系における時間的相関から熱力学的作用を抽出するための決定論的枠組みを開発する。
メモリ効果の活用により、適応的戦略が非適応的境界を超えることが示される。
また、強化学習を用いて未知の情報源からの作業抽出にも取り組みます。
論文参考訳(メタデータ) (Mon, 06 Apr 2026 06:20:22 GMT)