Measurement-induced state transitions across the fluxonium qubit landscape [73.9] 本研究では,フラクソニウム量子ビットにおける測定誘起状態遷移を幅広いパラメータにわたって検討した。
より軽いフラキソニウムは、より重いフラキソニウムに比べて、これらの状態遷移の影響を受けにくいことが判明した。
この効果は、多重光子共鳴の密度が低いこと、与えられた分散シフトの要求結合が小さいこと、および電荷作用素のより調和的な構造が原因である。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:53:41 GMT)
Small Vision-Language Models are Smart Compressors for Long Video Understanding [73.7] 長時間のビデオ理解は、欲求に満ちたコンテキストではなく、意図駆動の効率に頼っている。
本稿では,下流の理解のために長い動画を圧縮する効率的なクエリ認識フレームワークであるTempoを提案する。
テストでは、Tempoが1時間のビデオを理論的限界以下に圧縮し、真のロングフォームビデオ理解が意図駆動の効率に依存することを示した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:40:25 GMT)
E-3DPSM: A State Machine for Event-Based Egocentric 3D Human Pose Estimation [73.6] イベントカメラは、ヘッドマウントデバイスからの単眼のエゴセントリックな3Dポーズ推定において利点がある。
既存の手法では3次元推定精度が低く、多くのアプリケーションでは不十分である。
本稿では,イベント駆動型連続ポーズ状態マシンであるE-3DPSMを紹介する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:59:52 GMT)
Provably Adaptive Linear Approximation for the Shapley Value and Beyond [73.1] 基本的で長期にわたる課題は、その効率的な近似である。
一般に用いられるすべての半値に対して$P(|hatboldsymbol-boldsymbol|_2geq)leq$を必要とする線形空間アルゴリズムを開発する。
本アルゴリズムは,各ユーティリティ関数の平均二乗誤差の明示的最小化を可能にする。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:38:14 GMT)
KnowU-Bench: Towards Interactive, Proactive, and Personalized Mobile Agent Evaluation [72.0] KnowU-Benchはパーソナライズされたモバイルエージェントのためのオンラインベンチマークである。
42のGUIタスク、86のパーソナライズされたタスク、64のプロアクティブタスクをカバーしている。
明示的なタスク実行に優れるエージェントは、あいまいな指示の下で50%以下に低下する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:50:50 GMT)
SPARD: Self-Paced Curriculum for RL Alignment via Integrating Reward Dynamics and Data Utility [71.8] 本研究では,学習の進捗を把握し,多目的報酬重み付けとデータ重要度を動的に調整し,自己完結型カリキュラムを構築するフレームワークであるSPARDを提案する。
複数のベンチマークにわたる大規模な実験により、SPARDはすべてのドメインにわたるモデル機能を大幅に強化することが示された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:37:22 GMT)
WUTDet: A 100K-Scale Ship Detection Dataset and Benchmarks with Dense Small Objects [68.4] WUTDetは100,576イメージと381,378のアノテートされた船舶インスタンスを備えた大規模な船舶検出データセットである。
CNN, Transformer, Mambaの3つの主流検出アーキテクチャから20のベースラインモデルを体系的に評価した。
Ship-GENの結果は、WUTDetでトレーニングされたモデルは、異なるデータ分布下でより強力な一般化を示すことを示している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:28:05 GMT)
WildDet3D: Scaling Promptable 3D Detection in the Wild [67.3] テキスト,ポイント,ボックスプロンプトを受信し,推定時に補助的な深度信号を組み込むことができる統合幾何認識アーキテクチャであるWildDet3Dを導入する。
これまでで最大のオープンな3D検出データセットであるWildDet3D-Dataは、既存の2Dアノテーションから候補となる3Dボックスを生成し、人間による検証のみを保持することで構築されている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:00:10 GMT)
Networking-Aware Energy Efficiency in Agentic AI Inference: A Survey [64.2] 本稿では,知覚・推論・行動サイクル全体にわたる計算・通信コストを同定するエネルギー会計フレームワークを提案する。
我々は、単純化、計算制御、インプット・アンド・アテンション最適化、ハードウェア・アウェア・推論にまたがる統一的な分類法を確立する。
我々は,第6世代移動通信(6G)ネイティブエージェントAI,自己維持システムといったグリーンラーニングのオープンな課題を特定した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:13:59 GMT)
Robust Length Prediction: A Perspective from Heavy-Tailed Prompt-Conditioned Distributions [61.6] 既存の出力長予測法は、プロンプトのみの予測では信頼性が低い。
本稿では,同じプロンプトからトレーニング対象を構成するプロンプト条件付き長さ分布法を提案する。
さまざまなシナリオにわたる実験では、予測品質が一貫した向上を示している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:49:52 GMT)
Reinforcement-Guided Synthetic Data Generation for Privacy-Sensitive Identity Recognition [60.5] 高忠実度生成モデルは、プライバシーに敏感なシナリオでますます必要とされている。
限られたデータによって生成モデルは貧弱になり、データ不足を軽減できない。
汎用ドメイン生成の先行を識別タスクに適応させる,強化誘導型合成データ生成フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:52:03 GMT)
LMGenDrive: Bridging Multimodal Understanding and Generative World Modeling for End-to-End Driving [60.3] 本稿では、マルチモーダル理解と生成世界モデルを組み合わせた、エンドツーエンドのクローズドループ駆動のための最初のフレームワークLMGenDriveを紹介する。
本稿では,視覚前訓練から多段階長距離運転に至るまでの3段階訓練戦略を提案し,安定性と性能の向上を図る。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 19:13:14 GMT)
MolmoWeb: Open Visual Web Agent and Open Data for the Open Web [60.3] MolmoWebMixはブラウザのタスクとWeb-GUIの知覚データを組み合わせたものだ。
MolmoWeb-8Bは、完全にオープンなマルチモーダルWebエージェントのファミリーである。
我々は、Webエージェントのオープンな研究を可能にするため、モデルチェックポイント、トレーニングデータ、コード、統一された評価ハーネスをリリースする。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:54:02 GMT)
ImplicitMemBench: Measuring Unconscious Behavioral Adaptation in Large Language Models [60.1] LLMエージェントの既存のメモリベンチマークは、事実の明示的なリコールを評価するが、意識的な検索なしに、経験が自動的な振る舞いになる暗黙の記憶を見落としている。
IndicitMemBenchは、非宣言的メモリの標準的な認知科学のアカウントから引き出された3つの構造を通して暗黙的メモリを評価する最初の体系的なベンチマークである。
当社の300イテムスイートでは,初動採点を備えたLearning/Priming-Interfere-Testプロトコルを統一しています。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:26:32 GMT)
Synthetic Data for any Differentiable Target [59.5] 対象とするサンプルのデータセットを生成するために合成データジェネレータを正確に最適化できるプリミティブを開発する。
提案手法は,高次勾配による正確なデータ帰属と,それらのスコアを政策勾配報酬として用いることにより,これを実現する。
これらの結果から, DPGはモデル特性を合成訓練例のみを用いて形成するための強力で柔軟な手法であることが示唆された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:23:40 GMT)
Seeing but Not Thinking: Routing Distraction in Multimodal Mixture-of-Experts [58.9] MoE(Multimodal Mixture-of-Experts)モデルは視覚言語タスクにおいて顕著なパフォーマンスを実現している。
モデルは画像の内容が正確に知覚されるが、その後の推論では失敗する。
本稿では,視覚的な入力を処理する際に,タスク関連推論の専門家を適切に活性化できないという,ルーティング・ディトラクションの仮説を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:59:44 GMT)
When to Trust Tools? Adaptive Tool Trust Calibration For Tool-Integrated Math Reasoning [58.8] Tool-Integrated Reasoningは、推論軌道にツール呼び出しと実行を組み込む有望なパラダイムとして登場した。
モデルの推論がツールの結果と矛盾する場合、モデルは自身の推論を信じる傾向にあります。
アダプティブ・ツール・トラスト(ATTC、Adaptive Tool Trust)は、モデルに対して、ツール結果の信頼性や無視を適応的に選択するフレームワークである。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:14:37 GMT)
What Drives Representation Steering? A Mechanistic Case Study on Steering Refusal [53.2] 異なるステアリング手法が同一層に印加した場合に機能的に交換可能な回路を利用することを示す。
その結果,操舵ベクトルは最大90~99%のスペーサー化が可能であり,ほとんどの性能は維持できることがわかった。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:57:14 GMT)
Less Approximates More: Harmonizing Performance and Confidence Faithfulness via Hybrid Post-Training for High-Stakes Tasks [52.8] 大規模な言語モデルは、自信を持って不正確な推論が現実世界の害を引き起こすような、ハイテイクなタスクにますますデプロイされている。
内的フィードバックからの教師なし強化学習と推論・トラス誘導型推論蒸留を併用して協調的に最適化することを提案する。
PRG方式のメトリクスを用いてRDとRLIFを適応的に重み付けするハイブリッドポストトレーニングフレームワークであるHyTuningを紹介する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:50:11 GMT)
ReconPhys: Reconstruct Appearance and Physical Attributes from Single Video [51.3] ReconPhysは、単一の単眼ビデオから物理的属性推定と3次元ガウススプラッティング再構成を共同で学習するフィードフォワードフレームワークである。
提案手法では, 自己教師型戦略を用いて訓練したデュアルブランチアーキテクチャを用いて, 地上の物理ラベルの必要性を解消する。
大規模合成データセットの実験は優れた性能を示した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:51:14 GMT)
When Numbers Speak: Aligning Textual Numerals and Visual Instances in Text-to-Video Diffusion Models [51.0] 数値アライメントを改善するためのトレーニング不要な識別ガイドフレームワークであるNUMINAを紹介する。
NUMINAは、可算潜在レイアウトを導出するために、識別可能な自己および横断的なヘッダを選択することで、プロンプト不整合を識別する。
紹介されたCountBenchでは、NUMINAはWan2.1-1.3Bで7.4%、それぞれ5Bモデルと14Bモデルで4.9%と5.5%のカウント精度を向上している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:59:57 GMT)
ClawBench: Can AI Agents Complete Everyday Online Tasks? [51.0] ClawBenchは153のシンプルなタスクの評価フレームワークで、人々が人生や仕事で定期的に達成する必要がある。
ClawBenchは本番Webサイトで動作し、実世界のWebインタラクションの完全な複雑さ、動的な性質、課題を保存する。
軽量なインターセプション層は、最終的なリクエストのみをキャプチャしてブロックし、現実世界の副作用なしに安全な評価を保証する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:57:13 GMT)
What do Language Models Learn and When? The Implicit Curriculum Hypothesis [50.9] Inlicit Curriculum hypothesis: Pretraining following a compositional and predictable curriculum across models。
410M-13Bパラメータから4つのモデルファミリの出現点を追跡する。
モデルが一定の精度のしきい値に達する際の出現順序は著しく一致していることがわかった。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:50:12 GMT)
What They Saw, Not Just Where They Looked: Semantic Scanpath Similarity via VLMs and NLP metric [50.7] 視覚言語モデルと視線追跡分析を統合した意味的スキャンパス類似性フレームワークを提案する。
意味的類似性は、埋め込みベースおよび語彙的NLPメトリクスを使用して計算される。
自由視眼球追跡データの実験では、意味的類似性は幾何学的アライメントから部分的に独立なばらつきを捉えていることが示されている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:36:22 GMT)
Scal3R: Scalable Test-Time Training for Large-Scale 3D Reconstruction [50.5] 本稿では,長い映像シーケンスから大規模3Dシーンを再構築する作業について述べる。
近年のフィードフォワード再構成モデルでは,RGB画像からの3次元幾何を,明示的な3次元先行や幾何学的制約なく直接回帰することで,有望な結果を示している。
本稿では,長距離シーン情報を効率よく圧縮し,保持するニューラルグローバルコンテキスト表現を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:59:50 GMT)
Distributional Open-Ended Evaluation of LLM Cultural Value Alignment Based on Value Codebook [50.1] DOVEは、人文テキストとLLM出力を直接比較する分散評価フレームワークである。
DOVEは, ダウンストリームタスクと31.56%の相関を達成し, 高い信頼性を保ちながら, 文化ごとのサンプル500点程度の信頼性を維持した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 02:01:43 GMT)
Mitigating Entangled Steering in Large Vision-Language Models for Hallucination Reduction [50.0] LVLM(Large Vision-Language Models)は、モーダルなタスク間で大きな成功を収めてきたが、幻覚によって妨げられている。
既存の方法は幻覚を緩和するが、しばしば生成行動を変化させ、結果として出力が短くなり、トークンの分布がシフトする。
幻覚緩和のための制御および選択的な潜伏介入を行う効果的なプラグアンドプレイフレームワークであるMESAを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:31:27 GMT)
Direct Segmentation without Logits Optimization for Training-Free Open-Vocabulary Semantic Segmentation [48.8] Open-vocabulary semantic segmentation (OVSS) は、画像中の任意のカテゴリ領域をopen-vocabulary promptsを用いて分割することを目的としている。
セグメント化マップの解析解を直接導出することにより,ロジット最適化プロセスを改善する,より直接的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 02:14:35 GMT)
ORACLE-SWE: Quantifying the Contribution of Oracle Information Signals on SWE Agents [48.4] Oracle-SWEは、SWEベンチマークから情報信号を分離して抽出し、各信号がエージェントのパフォーマンスに与える影響を定量化する手法である。
これらの評価は、自律型符号化システムの研究を導くことを目的としている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:37:24 GMT)
Novel View Synthesis as Video Completion [48.4] ビデオ拡散モデルを用いたスパース・ノベル・ビュー・シンセサイザー(NVS)の課題に対処する。
ビデオモデルには暗黙の多視点知識がすでに含まれていると論じる。
我々は、ビデオモデルを置換不変NVSに適応させるFrameCrafterを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:44:18 GMT)
The Art of (Mis)alignment: How Fine-Tuning Methods Effectively Misalign and Realign LLMs in Post-Training [47.3] ミスアライメントされた大きな言語モデル(LLM)は、害を増大させるためにオープンプラットフォームで公開される可能性がある。
本研究では, 微調整法の有効性について検討し, その効果について検討した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:20:29 GMT)
InsEdit: Towards Instruction-based Visual Editing via Data-Efficient Video Diffusion Models Adaptation [47.2] 本稿では,HunyuanVideo-1.5をベースとしたインストラクションベースの編集モデルであるInsEditを紹介する。
InsEditは、Mutual Context Attention (MCA)に基づくビジュアル編集アーキテクチャとビデオデータパイプラインを組み合わせる
InsEditは,O(100)Kビデオ編集データのみを用いて,我々のビデオ命令編集ベンチマークにおけるオープンソース手法の最先端結果を実現する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:59:02 GMT)
Keeping an Eye on AI: A Framework for Effective Human Oversight of AI Systems [46.6] 本稿では,AIシステムの効果的な人的監視のための実践的枠組みを推し進める。
コンピュータ科学、人間とコンピュータの相互作用、心理学、哲学、法学から洞察を得ている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 22:35:41 GMT)
UniversalVTG: A Universal and Lightweight Foundation Model for Video Temporal Grounding [46.4] ビデオ時間グラウンド(VTG)は通常、ドメインやクエリスタイル間での転送が不十分なデータセット固有のモデルに対処される。
大規模クロスデータセット事前学習で訓練された単一のVTGモデルであるUniversalVTGを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:57:09 GMT)
Symbiotic-MoE: Unlocking the Synergy between Generation and Understanding [45.3] 本稿では,Mixture-of-Experts (MoE) Transformersアーキテクチャにおけるタスク干渉を解決するための統合事前学習フレームワークであるSymbiotic-MoEを提案する。
Modality-Aware Expert Disentanglementは、共有専門家が生成タスクからきめ細かい視覚的意味を吸収することを可能にする。
実験により、共生-MoEはクロスモーダルのシナジーを解き放ちながら、迅速に生成的収束を達成できることが示された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:19:26 GMT)
Guaranteeing Knowledge Integration with Joint Decoding for Retrieval-Augmented Generation [45.1] GuarantRAGは、証拠統合から推論を明示的に分離するフレームワークである。
5つのQAベンチマークの実験では、GurantRAGは最大で12.1%精度が向上している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:52:21 GMT)
A Soft Robotic Interface for Chick-Robot Affective Interactions [44.8] 新たにハッチしたニワトリ(Gallus gallus)に対する動物中心型ソフトロボット感触インタフェースについて紹介する。
ソフトインターフェースは、暖かさ、呼吸のようなリズム変形、顔のような視覚刺激を含む安全で制御可能なキューを提供する。
全体として、ニワトリはインターフェースに近づき、インターフェースの近くや近くで時間を過ごし、デバイスが受け入れられたことを実証した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:39:48 GMT)
ViVa: A Video-Generative Value Model for Robot Reinforcement Learning [44.3] 視覚言語アクション(VLA)モデルは、大規模な事前訓練を通じて高度なロボット操作を行うが、部分的な観測可能性と遅延したフィードバックのため、現実の展開は困難なままである。
本稿では、事前学習したビデオ生成器を付加して値推定を行うビデオ生成値モデルViVaを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:28:14 GMT)
What Matters in Virtual Try-Off? Dual-UNet Diffusion Model For Garment Reconstruction [43.6] 我々は,VTONと一般潜在拡散モデルから,様々な拡散に基づく戦略を研究・適応する。
我々のフレームワークは、主要な指標である DisTS に対して 9.5% の低下で最先端の性能を達成する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 19:09:27 GMT)
Few-Shot Incremental 3D Object Detection in Dynamic Indoor Environments [43.4] FI3Detは,数個の新しいサンプルを用いて,効率的な3次元認識のためのフレームワークである。
視覚言語モデル(VLM)を使用して、目に見えないカテゴリの知識を学習する。
FI3Detはベースラインメソッドよりも強力で一貫した改善を実現している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:04:52 GMT)
Zero-shot Multivariate Time Series Forecasting Using Tabular Prior Fitted Networks [42.2] タブラル基礎モデルは、データ計算からラベル予測まで多岐にわたるタスクにおいて、主要な候補として現れている。
本稿では,TabPFN-TSバックボーンを用いた提案手法の有効性について述べる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:00:02 GMT)
AVGen-Bench: A Task-Driven Benchmark for Multi-Granular Evaluation of Text-to-Audio-Video Generation [42.2] AVGen-Benchは、T2AV生成のためのタスク駆動ベンチマークである。
軽量スペシャリストモデルとマルチモーダル大言語モデル(MLLM)を組み合わせた多言語評価フレームワークを提案する。
評価の結果,テキストレンダリングの持続的失敗,音声のコヒーレンス,物理的推論,音声ピッチ制御の普遍的破壊など,強い視覚的美学と弱い意味的信頼性のギャップが明らかとなった。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:59:39 GMT)
On Tackling Complex Tasks with Reward Machines and Signal Temporal Logics [42.0] 複雑なタスクを扱うための強化学習(RL)に基づく制御設計フレームワークを提案する。
このアプローチは、イベント生成に使用できる信号テンポラル論理(STL)公式を用いて、リワードマシン(RM)の概念を拡張している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:39:12 GMT)
MegaStyle: Constructing Diverse and Scalable Style Dataset via Consistent Text-to-Image Style Mapping [42.0] 私たちは、新しいスケーラブルなデータキュレーションパイプラインであるMegaStyleを紹介します。
我々は170Kスタイルのプロンプトと400Kコンテンツプロンプトを備えた多種多様なバランスの取れたプロンプトギャラリーをキュレートし、大規模スタイルのデータセットMegaStyle-1.4Mを生成する。
実験は、スタイルデータセットにおけるスタイル内の一貫性、スタイル間の多様性、高品質を維持することの重要性と、提案したMegaStyle-1.4Mの有効性を示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:29:08 GMT)
Complementary Filtering on SO(3) for Attitude Estimation with Scalar Measurements [42.0] スカラー測定を用いた姿勢推定は、慣性ベクトルが完全に観測されていないだけでなく、特定のボディーフレームベクトルに沿ってのみ測定される場合に自然に発生する。
本稿では,SO(3)上の古典的補完フィルタに基づいて,このスカラー出力構造に適合した改良された革新項を持つオブザーバを提案する。
この結果から, 共用体フレームベクトルに沿って少なくとも3つの励起ベクトルが測定された場合, ほぼ球面安定性が回復することが示された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:19:11 GMT)
Ads in AI Chatbots? An Analysis of How Large Language Models Navigate Conflicts of Interest [41.6] 大規模言語モデル(LLM)は、強化学習などの手法により、ユーザの好みに合わせて訓練される。
しかし、モデルがユーザーを満足させるだけでなく、広告を通じてモデルを作った会社に収益をもたらすように展開され始めている。
これにより、LCMが利害の対立に直面する可能性が生じ、ユーザに対する最も有益な反応が会社のインセンティブと一致しない可能性がある。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:57:50 GMT)
BLaDA: Bridging Language to Functional Dexterous Actions within 3DGS Fields [40.4] 構造化されていない環境では、機能的デクスタラスな把握は意味理解の緊密な統合、正確な3D機能局在化、物理的に解釈可能な実行を要求する。
BLaDAは,開語彙命令を知覚的および制御的制約として根拠として,機能的デキスタス操作のための解釈可能なゼロショットフレームワークである。
BLaDAは、様々なカテゴリやタスクにおける機能的操作の成功率と精度の両方において、既存の手法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:10:20 GMT)
GALA: Multimodal Graph Alignment for Bug Localization in Automated Program Repair [40.2] 本稿では,マルチモーダル自動プログラム修復(APR)を暗黙的な意味的推測から明示的な構造的推論に移行するフレームワークであるGALAを提案する。
GALAは、まずイメージUIグラフを構築して、視覚要素とその構造的関係をキャプチャし、続いて、このUIグラフをリポジトリレベルの構造と相互参照することで、ファイルレベルのアライメントを実行する。
モダリティ間のセマンティクスとリレーショナルの整合性を強制することにより、GALAは高度に正確なビジュアル・ツー・コードマッピングを確立する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:06:25 GMT)
Open-Ended Instruction Realization with LLM-Enabled Multi-Planner Scheduling in Autonomous Vehicles [40.2] 本研究では,大規模言語モデル(LLM)を利用して命令を解釈する命令実現フレームワークを提案する。
リアルタイムフィードバックに基づいて、複数のモデル予測制御(MPC)ベースのモーションプランナをスケジュールする実行可能なスクリプトを生成し、計画されたトラジェクトリを制御信号に変換する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:32:21 GMT)
Towards Identification and Intervention of Safety-Critical Parameters in Large Language Models [39.9] 大言語モデル(LLM)の安全性は重要であるが、安全性メカニズムに関する明確な理解の欠如は、安全介入のための正確で信頼性の高い方法論の開発を妨げる。
我々は,LLMの安全性に異なるパラメータがどう影響するかを定量化するための,期待された安全影響(ESI)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:31:42 GMT)
Generative 3D Gaussian Splatting for Arbitrary-ResolutionAtmospheric Downscaling and Forecasting [39.7] 3次元ガウススプラッティング型スケールアウェア・ビジョン・トランス (GSSA-ViT)
鍵パラメータを推定するために、生成的な3Dガウス予測スキームを導入する。
スケール対応アテンションモジュールは、スケール間の依存関係をキャプチャするように設計されている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:47:49 GMT)
Are GUI Agents Focused Enough? Automated Distraction via Semantic-level UI Element Injection [37.6] 安全に整合した無害なUI要素をスクリーンショット上にオーバーレイしてエージェントの視覚的接地を誤指示する赤チーム設定を提案する。
本手法では,モジュール型エディター-オーバーラッパー-ヴィクティムパイプラインと,複数の候補編集を抽出する反復探索手法を用いる。
攻撃は攻撃成功率を最大4.4倍に向上させる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:32:34 GMT)
MT-OSC: Path for LLMs that Get Lost in Multi-Turn Conversation [37.6] MT-OSC(Sequential Condensation framework)は,ユーザエクスペリエンスを損なうことなく,バックグラウンドでのチャット履歴を効率的に凝縮するフレームワークである。
我々はMT-OSCを13の最先端LCMと多様なマルチターンベンチマークで評価し、連続的にマルチターン性能ギャップを狭める。
我々は,MT-OSCをマルチターンチャットのスケーラブルなスケーラブルなソリューションとして確立し,制約された入力空間内でのコンテキストのリッチ化,レイテンシと運用コストの低減,性能のバランスを図った。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 21:39:20 GMT)
EvoLen: Evolution-Guided Tokenization for DNA Language Model [37.5] EvoLenは、進化的成層と長さ認識デコードを組み合わせることで、モチーフスケールの関数配列単位をよりよく保存するトークンライザである。
これらの結果は、トークン化が重要な帰納バイアスをもたらし、進化情報を組み込むことにより、より生物学的に意味があり、解釈可能なシーケンス表現が得られることを示している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:41:28 GMT)
Large Language Model Post-Training: A Unified View of Off-Policy and On-Policy Learning [37.3] ポストトレーニングは、事前訓練された大きな言語モデルをアライメントされ、デプロイ可能なシステムに変える中心になっている。
最近の進歩は、教師付き微調整(SFT)、選好最適化、強化学習(RL)、プロセス監督、検証者誘導法、蒸留、多段パイプラインに及んでいる。
この調査では、LLMのポストトレーニングはモデル行動に対する構造化された介入として最もよく理解されている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:00:37 GMT)
SIM1: Physics-Aligned Simulator as Zero-Shot Data Scaler in Deformable Worlds [36.9] 本稿では,物理世界におけるシミュレーションを基盤とした物理対応の実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
このシステムは、シーンをメートル法に一貫性のある双子にデジタル化し、弾性モデリングによって変形可能なダイナミクスをキャラブレートし、拡散に基づく軌道生成によって振る舞いを拡大する。
実験により、純粋に合成データに基づいてトレーニングされたポリシーは、実データベースラインと1:15の等価比で同等であり、実世界の展開において90%のゼロショット成功と50%の一般化をもたらすことが示された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:59:52 GMT)
Linear Representations of Hierarchical Concepts in Language Models [34.7] 我々は各階層的な深さと意味領域に特有の線形変換を訓練する。
そして、どのように階層が表現空間にエンコードされるかを分析する。
全体として、我々の実験で考慮されたすべてのモデルが、高度に解釈可能な線形表現の形で概念階層を符号化していることが分かる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:55:19 GMT)
Tool Retrieval Bridge: Aligning Vague Instructions with Retriever Preferences via Bridge Model [34.1] あいまいな指示に対するツール検索性能を向上させるため, 簡易なツール検索橋(TRB)手法を提案する。
TRBの助けを借りて、BM25は111.51%までの相対的な改善を実現し、平均NDCGスコアは9.73から19.59に増加した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:15:38 GMT)
A Decomposition Perspective to Long-context Reasoning for LLMs [33.3] 複雑な現実世界のアプリケーションには、長文推論が不可欠である。
本稿では,長文推論を基本的原子スキルの集合に分解する。
私たちはモデルの原子スキルを磨くために強化学習を採用しています。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:51:47 GMT)
LAMP: Lift Image-Editing as General 3D Priors for Open-world Manipulation [33.0] LAMPは,物体間3次元変換を連続的かつ幾何学的に認識した表現として抽出するために,画像編集を3次元先行として引き上げる。
私たちの重要な洞察は、画像編集は本質的にリッチな2次元空間的手がかりを符号化し、これらの暗黙の手がかりを3次元変換に引き上げることで、オープンワールド操作のためのきめ細かい正確なガイダンスを提供するということです。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:14:00 GMT)
Anamorphic Encryption with CCA Security: A Standard Model Construction [33.0] アナモルフィック暗号化は秘密通信にとって重要なツールであり、コンパイル後のシナリオにおいても機密性を維持する。
我々は、PKAKEM(Public-Key)とSKAKEM(Symmetric-Key)の両方を包含するAnamorphic Key Encapsulation Mechanism(AKEM)を定式化する。
本稿では, 標準モデルにおける厳密な形式的証明を提供し, カプセル化キーを制御する「独裁者」に対してレジリエンスを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:49:41 GMT)
WorldMAP: Bootstrapping Vision-Language Navigation Trajectory Prediction with Generative World Models [32.7] 視覚言語モデル(VLM)とジェネレーティブワールドモデル(ジェネレーティブワールドモデル)は、ナビゲーションを具現化する新たな機会を開きつつある。
本稿では,世界モデルが生み出す未来を永続的な意味空間構造に変換するフレームワークWorldMAPについて述べる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:21:58 GMT)
Order-Optimal Sequential 1-Bit Mean Estimation in General Tail Regimes [32.7] ランダム化しきい値クエリのみに基づく適応型平均推定器を提案する。
我々の推定器のサンプル複雑性は、余分な乗法的な$O(log(/))$ペナルティを持つ。
しきい値クエリとより一般的な間隔クエリの両方において、任意の非適応推定器のサンプル複雑性は線形にスケールしなければならない。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:49:21 GMT)
Cram Less to Fit More: Training Data Pruning Improves Memorization of Facts [32.6] 我々は情報理論の観点から事実記憶を定式化する。
トレーニングデータ事実に含まれる情報の量がモデル容量を超えると、その精度は(キャパシティ限界以下)最適以下であることが示される。
トレーニングデータの事実数を制限し,その頻度分布をフラット化することを目的とした,トレーニング損失のみに基づくデータ選択方式を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:55:50 GMT)
LPM 1.0: Video-based Character Performance Model [32.3] 本稿では,LPM 1.0(Large Performance Model)について述べる。
厳密なフィルタリング、音声とビデオのペアリングによるパフォーマンス理解により、人間中心のデータセットを構築する。
我々はこれを低レイテンシで無限長の相互作用のために因果ストリーミングジェネレータ(オンラインLPM)に蒸留する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:26:09 GMT)
HiFloat4 Format for Language Model Pre-training on Ascend NPUs [32.2] 最近の研究は、4ビット浮動小数点(FP4)フォーマットが大規模言語モデル(LLM)における線形GEMM操作にうまく適用可能であることを示した。
本研究では,Huawei Ascend NPU向けに最近提案されたHiFloat4 FP4フォーマットを調査し,大規模トレーニング環境でMXFP4と体系的に比較する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 23:50:56 GMT)
SonoSelect: Efficient Ultrasound Perception via Active Probe Exploration [31.5] 本研究では,現在の観測結果に基づいてプローブ運動を適応的に誘導する超音波特異的なソノセレクトを提案する。
超音波シミュレータによる実験により,SanoSelectはN点中2点のみを用いて,有望な多視点臓器分類精度を達成できた。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 02:42:30 GMT)
Faithful GRPO: Improving Visual Spatial Reasoning in Multimodal Language Models via Constrained Policy Optimization [31.4] Chain-of-Thoughtトレースは、最終的な回答と矛盾することが多く、視覚的証拠が不十分である。
ラグランジアン二重昇華による制約として整合性と接地を強制するFithful GRPOを提案する。
その結果,FGRPOは推論品質を大幅に改善し,不整合率を24.5%から1.7%に下げ,視覚的接点スコアを+13%改善した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:15:47 GMT)
MemReader: From Passive to Active Extraction for Long-Term Agent Memory [31.4] 本稿では,エージェントシステムにおけるアクティブな長期メモリ抽出のためのMemReaderファミリについて紹介する。
MemReader-4Bは、行動前の情報値、参照あいまいさ、完全性を明確に評価する。
MemReaderはMemOSに統合され、現実世界のアプリケーションにデプロイされている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:47:17 GMT)
EPIR: An Efficient Patch Tokenization, Integration and Representation Framework for Micro-expression Recognition [31.1] 我々は、EPIR(EPIR)の効率的なパッチトークン化、統合、表現フレームワークを提案する。
EPIRは高い認識性能と低い計算複雑性のバランスをとることができる。
4つの人気のある公開データセットについて広範な実験を行う。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:24:17 GMT)
An Empirical Study on Influence-Based Pretraining Data Selection for Code Large Language Models [30.7] 本稿では,プログラム関連データセットのコンテキストにおけるデータ影響スコアフィルタリングの有効性について検討する。
私たちは、1000億のコードトークンのデータセットで、スクラッチから10億のパラメータを持つCode-LLMを事前トレーニングします。
この結果から,検証-集合-ロスに基づくデータ影響スコアフィルタリングにより,モデルプログラミング性能が向上する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:48:11 GMT)
SurfelSplat: Learning Efficient and Generalizable Gaussian Surfel Representations for Sparse-View Surface Reconstruction [30.7] 3D Gaussian Splatting (3DGS) は3Dシーン再構成において顕著な性能を示した。
スパースビュー画像から効率よく一般化可能な画素アライメントを生成できるフィードフォワードフレームワークであるSurfelSplatを提案する。
我々のモデルは最先端の手法で同等の結果を得ることができ、1秒以内でガウス波を予測でき、100倍のスピードアップが可能であり、シーンごとのトレーニングに費用がかからない。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:34:24 GMT)
Plug-and-Play Logit Fusion for Heterogeneous Pathology Foundation Models [28.7] 軽量で斬新なモデル融合戦略であるLogitProdを紹介する。
独立に訓練されたFMベースの予測器を固定専門家として扱い、スライドレベルの出力よりもサンプル適応型融合重みを学習する。
LogitProdは、まず20/22タスクにランク付けし、最強のシングルエキスパートに対して、全タスクの平均パフォーマンスを3%向上させる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:10:54 GMT)
From Gaze to Guidance: Interpreting and Adapting to Users' Cognitive Needs with Multimodal Gaze-Aware AI Assistants [28.6] 我々は、視線オーバーレイを用いた自我中心ビデオを用いた、視線付きマルチモーダルLLMアシスタントを提案する。
従来のLLMアシスタントと比較して、視線認識アシスタントははるかに正確でパーソナライズされた。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:25:42 GMT)
How Far Are Large Multimodal Models from Human-Level Spatial Action? A Benchmark for Goal-Oriented Embodied Navigation in Urban Airspace [27.6] 大規模マルチモーダルモデル(LMM)は、視覚言語学的推論が強いが、空間的決定と行動の能力は未だ不明である。
都市3次元空間における目標指向ナビゲーションにおいて,LMMが人間のような具体的空間行動を実現することができるかどうかを検討する。
実験によると、現在のLMMは新たな行動能力を示すが、人間レベルの性能には及ばない。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:37:20 GMT)
Can LLMs Deobfuscate Binary Code? A Systematic Analysis of Large Language Models into Pseudocode Deobfuscation [27.6] BinDeObfBenchは、LLMベースのバイナリ難読化を評価するための最初の包括的なベンチマークである。
推論モデルは、激しい難読化の下で堅牢性を維持することができる。
コンテキスト内学習は標準モデルにはメリットがあるが、推論モデルには限界がある。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:56:06 GMT)
Lightweight LLM Agent Memory with Small Language Models [27.3] LightMemは、Small Language Models (SLM)によって駆動されるより優れたエージェントメモリのための軽量メモリシステムである。
我々は,記憶を即時会話のための短期記憶(STM),再利用可能な対話要約のための中期記憶(MTM),統合された知識のための長期記憶(LTM)に整理する。
実験の結果,LoCoMoではF1が平均2.5向上し,より効率的で中央値の低いレイテンシ(83ms検索,581msエンドツーエンド)が得られた。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:51:07 GMT)
Act Wisely: Cultivating Meta-Cognitive Tool Use in Agentic Multimodal Models [27.3] HDPOは、ツールの効率を競合するスカラー目標から厳格な条件に書き換えるフレームワークです。
私たちのモデルであるMetisは、推論精度を同時に高めながら、ツールの呼び出しを桁違いに削減します。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:59:57 GMT)
CrashSight: A Phase-Aware, Infrastructure-Centric Video Benchmark for Traffic Crash Scene Understanding and Reasoning [27.2] textbfCrashSightは,現実の道路カメラデータを用いた道路事故理解のための視覚ベンチマークである。
データセットは250のクラッシュビデオで構成されており、2階層の分類の下で構成された13Kの質問応答ペアが注釈付けされている。
我々は8つの最先端のVLMをベンチマークし、強いシーン記述能力にもかかわらず、現在のモデルは安全クリティカルなシナリオにおける時間的・因果的推論に苦戦していることを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:52:04 GMT)
TEC: A Collection of Human Trial-and-error Trajectories for Problem Solving [27.1] データアノテーションプラットフォームとそれに対応するデータセットであるTrial-and-Error Collection(TEC)を導入する。
TECは、ユーザの完全な軌道を複数のトライアルで記録し、エラーフィードバックを受けた後にリフレクションを収集する。
LLMと比較して人間の方が精度がかなり高いことが観察された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:19:37 GMT)
Can LoRA Fusion Support Cross-Domain Tasks in Cloud-Edge Collaboration? [26.2] クラウドホスト型大規模言語モデル(LLM)は一般的にドメイン適応にLoRAに依存している。
ドメインデータは複数のエッジデバイスに分散しており、プライバシの制約によりアップロードできない。
本稿では,プライバシ保護クラウド統合とプルーニングモデルを用いたローカルLoRAトレーニングを実現するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:33:08 GMT)
AtomEval: Atomic Evaluation of Adversarial Claims in Fact Verification [25.8] 敵のクレーム書き換えはファクトチェックシステムをテストするために広く使われているが、標準的なメトリクスは真理条件の整合性を捉えることができない。
AtomEvalは,クレームを主観的関連オブジェクト修飾子原子に分解する妥当性を考慮した評価フレームワークである。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:32:35 GMT)
Uni-ViGU: Towards Unified Video Generation and Understanding via A Diffusion-Based Video Generator [25.8] 視覚生成は、特にビデオにおいて、理解するよりも計算コストがかなり高い。
ビデオジェネレータを基盤として拡張することで、映像生成と理解を統一するフレームワークであるUni-ViGUを提案する。
実験により、Uni-ViGUは映像生成と理解の両方において競争性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:41:58 GMT)
$\oslash$ Source Models Leak What They Shouldn't $\nrightarrow$: Unlearning Zero-Shot Transfer in Domain Adaptation Through Adversarial Optimization [25.5] ドメイン間のビジョンモデルの適用の増加は、プライバシーのリスクを増大させている。
モデルは必然的に、ターゲットドメイン内の機密なソースドメイン固有の情報を保持し、リークすることがある。
そこで本研究では,ドメイン適応過程において,逆向きに生成されたクラスサンプルをモデルから解放するアンラーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:30:24 GMT)
Conformal Margin Risk Minimization: An Envelope Framework for Robust Learning under Label Noise [25.3] 雑音ラベルで学習するプラグイン・アンド・プレイ・エンベロープ・フレームワークである Conformal Margin Risk Minimization (CMRM) を提案する。
CMRMは、観測されたラベルと競合するラベルの間の信頼率を測定し、バッチ毎に推定される共形量子量で閾値付けする。
我々は,任意のラベル雑音下でCMRMの学習境界を導出し,マージン分布の緩やかな規則性しか必要としない。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 23:19:31 GMT)
TASU2: Controllable CTC Simulation for Alignment and Low-Resource Adaptation of Speech LLMs [25.0] 音声LLMポストトレーニングは、効率的なクロスモーダルアライメントとロバストな低リソース適応に依存している。
TASUのようなテキストのみのアライメント手法は、CTC後部を転写からシミュレートすることで、この負担を軽減する。
WERの範囲でCTC後部分布をシミュレートする制御可能なCTCシミュレーションフレームワークである textbfTASU2 を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:44:45 GMT)
Weight Group-wise Post-Training Quantization for Medical Foundation Model [25.0] 学習後量子化アルゴリズムPermutation-COMQを提案する。
単純なドット製品や丸め操作を使用することで、バックプロパゲーションの必要性を排除します。
実験により,本手法は2ビット,4ビット,8ビットの量子化において最良の結果が得られることが示された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:34:27 GMT)
Justified or Just Convincing? Error Verifiability as a Dimension of LLM Quality [24.6] モデル生成の正当化が、ユーザーが正しい回答を正しく区別するのに役立つかどうかに関して、標準的な手段は存在しない。
我々は、このアイデアを誤り検証可能性として形式化し、正当性によってレーダが解答正当性を正確に評価できるかどうかを測るバランスの取れた指標である$v_textbal$を提案する。
本稿では, 数学的推論のためのリフレクション・アンド・リフレーズ (RR) と, 事実QAのためのオラクル・リフレーズ (OR) の2つの手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:14:22 GMT)
GRASS: Gradient-based Adaptive Layer-wise Importance Sampling for Memory-efficient Large Language Model Fine-tuning [24.5] レイヤワイドな微調整手法が代替として登場し、メモリ効率のトレーニングを可能にした。
勾配に基づく適応層ワイド・プライバシ・サンプリング・フレームワークを提案する。
我々は常に最先端の手法を上回り、平均精度は4.38ポイントまで向上し、メモリ使用量を19.97%削減した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:04:37 GMT)
Static Program Slicing Using Language Models With Dataflow-Aware Pretraining and Constrained Decoding [24.3] 静的プログラムスライシングは、特定の変数に関連するコードを分離するための基本的なソフトウェア工学技術である。
言語モデル(LM)を用いた最近の学習ベースアプローチは、不正確な依存性モデリングと制約のない生成に悩まされている。
そこで我々はSliceformerを提案する。Sliceformerは静的プログラムスライシングを小さな言語モデルを用いてシーケンス・ツー・シーケンス・タスクとして再構成する新しい手法である。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 19:46:06 GMT)
PhyEdit: Towards Real-World Object Manipulation via Physically-Grounded Image Editing [24.1] 画像編集フレームワークであるPhyEditを開発した。
このプラグアンドプレイ3Dとジョイント2D-3Dの監督を組み合わせることで,物理的精度と操作の整合性を効果的に向上する。
ペア画像と奥行きアノテーションを備えた3次元オブジェクト操作のための実世界のデータセットであるRealManip-10Kを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:01:59 GMT)
AnchorSplat: Feed-Forward 3D Gaussian Splatting with 3D Geometric Priors [23.9] シーンレベルの再構築のための新しいフィードフォワード3DGSフレームワークであるAnchorSplatを提案する。
アンカーアラインのガウス表現は3次元幾何学的先行によって導かれる。
設計により、必要なガウス人の数は大幅に減少する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:54:56 GMT)
SyncBreaker:Stage-Aware Multimodal Adversarial Attacks on Audio-Driven Talking Head Generation [20.9] 拡散に基づく音声駆動音声ヘッド生成は、リアルなポートレートアニメーションを可能にするが、詐欺や誤報などの誤用の危険性ももたらしている。
我々は,モダリティ固有の知覚的制約の下で,ポートレートとオーディオ入力を共同で摂動する,段階認識型マルチモーダル保護フレームワークSyncBreakerを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:03:24 GMT)
Model Space Reasoning as Search in Feedback Space for Planning Domain Generation [20.7] 自然言語記述から計画領域を生成するためのエージェント言語モデルフィードバックフレームワークについて検討する。
ランドマークを含む記号的フィードバックの様々な形態で生成されたドメインの品質を評価する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 19:05:23 GMT)
Fundus-R1: Training a Fundus-Reading MLLM with Knowledge-Aware Reasoning on Public Data [20.7] 眼底画像検査は網膜異常や疾患の早期発見に不可欠である。
タスクに対処するための新しいアプローチは、ジェネリックマルチモーダル大言語モデル(MLLM)のポストトレーニングである。
我々は,Fundus-R1と呼ぶMLLMを,公開データセットのみを用いて学習する新しい試みを行っている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:55:22 GMT)
CausalVAE as a Plug-in for World Models: Towards Reliable Counterfactual Dynamics [20.3] CausalVAEは、潜在世界モデルのためのプラグイン構造モジュールとして導入された。
本研究は、競合する事実予測を保存し、プラグインの追加後に介入対応の事実検索を改善する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 01:56:06 GMT)
A Comparative Study of Semantic Log Representations for Software Log-based Anomaly Detection [20.3] 我々は広く使われているセマンティックログ表現法をベンチマークした。
本稿では,新しい意味ログ表現法であるQTyBERTを提案する。
以上の結果から,QTyBERT生成のログ埋め込みはBERT生成のログ埋め込みと同等かそれ以上の精度で検出できることがわかった。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:30:04 GMT)
DiffVC: A Non-autoregressive Framework Based on Diffusion Model for Video Captioning [20.0] ビデオキャプションのための拡散モデルに基づく非自己回帰フレームワーク(DiffVC)を提案する。
筆者らが提案する識別条件拡散モデルにより,高品質なテキスト記述を生成できる。
MSVD, MSR-VTT, VATEXによる実験により, 本手法は従来の非自己回帰法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:56:49 GMT)
A Generalized Sinkhorn Algorithm for Mean-Field Schrödinger Bridge [19.9] 平均フィールド・シュルディンガー橋(英語版)(MFSB)問題は、非局所相互作用を持つ拡散過程を一定期限で所定の分布に到達させる最小効果制御器を設計することに関するものである。
シュルディンガー橋とは異なり、MFSBの動的制約は反発制御を持つ相互作用剤の集団である。
MFSBのためのHopf-Coleアルゴリズムの一般化を提案し、それを構築する上で、関連するシステム積分PDEを解決するシンクホーン型アルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:35:00 GMT)
Efficient Dataset Selection for Continual Adaptation of Generative Recommenders [19.8] 本研究では,時間分布のドリフトによる性能劣化を緩和する手法を提案する。
ユーザインタラクションデータの小さいが情報に富むサブセットをキュレートするための表現選択とサンプリング戦略について検討する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 02:48:52 GMT)
Aligning Agents via Planning: A Benchmark for Trajectory-Level Reward Modeling [19.8] Plan-RewardBench(プラン・リワードベンチ)は、判断者が選好と選好の選好をいかに区別するかを評価するために設計された軌道レベルの選好ベンチマークである。
Plan-RewardBench は、 (i) Safety Refusal、 (ii) Tool-Irrelevance / Unavailability、 (iii) Complex Planning、 (iv) Robust Error Recovery の4つの代表的なタスクファミリをカバーする。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:35:06 GMT)
Revise: A Framework for Revising OCRed text in Practical Information Systems with Data Contamination Strategy [19.3] Reviseは、OCRが導入したエラーを文字、単語、構造レベルで体系的に修正するフレームワークである。
実験結果から,OCR出力を効果的に補正し,文書内容のより構造化された表現と体系的な管理を可能にした。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:35:19 GMT)
SkillClaw: Let Skills Evolve Collectively with Agentic Evolver [18.9] マルチユーザエージェントエコシステムにおける集合的スキル進化のためのフレームワークであるSkillClawを紹介する。
SkillClawは、クロスユーザとオーバータイムのインタラクションを、スキル向上のための主要なシグナルとして扱う。
使用中に生成された軌跡を連続的に集約し、自律的な進化器で処理する。
得られたスキルは共有リポジトリに保持され、ユーザ間で同期される。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:38:27 GMT)
Post-Quantum Cryptography-Based Bidirectional Authentication Key Exchange Protocol and Industry Applications: A Case Study of Instant Messaging [18.9] 本研究では,量子後暗号(PQC)に基づく双方向認証鍵交換プロトコルを提案する。
PQCベースのDSA(Digital Signature Algorithm)とPQCベースのKEMを組み合わせたデュアル使用証明書を導入している。
これらの二重使用証明書は、PQCベースのDSA公開鍵とPQCベースのKEM公開鍵を使用して、双方向認証と暗号化の要件を満たす。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:32:56 GMT)
EvoGymCM: Harnessing Continuous Material Stiffness for Soft Robot Co-Design [18.7] EvoGymCM(EvoGym with Continuous Materials, EvoGym with Continuous Materials)を提案する。
プログラム可能な材料をガイドするためのリアルタイム剛性チューニングポリシを学習するリアクティブ・マトリアル・コデザイン,および(ii)形態学と固定材料フィールドを共同で最適化し,従来の材料製造をガイドする不変・マトリアル・コデザインの2つのパラダイムを定式化する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:45:20 GMT)
Learning to Search: A Decision-Based Agent for Knowledge-Based Visual Question Answering [18.6] 知識に基づく視覚的質問応答(KB-VQA)は、画像を理解し、外部知識を使用するために視覚言語モデルを必要とする。
ほとんどの既存の検索拡張生成(RAG)メソッドは、情報を逐次検索し、フィルタリングし、回答を生成する固定パイプラインを採用している。
我々は,KB-VQAを探索エージェント問題として再定義し,その解法を多段階決定手順としてモデル化する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:15:38 GMT)
A Systematic Framework for Tabular Data Disentanglement [18.3] 産業制御システムなどのアプリケーションで広く使われているタブラルデータは、しばしば複雑な属性を含む。
データ不整合は、そのようなデータを相互依存を減らした変数に変換することを目指している。
因子分析、CT-GAN、VAEといった既存のデータアンタングル法は制限に直面している。
本稿では,データ・アンタングルメントの体系的ビューを提供するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:00:22 GMT)
DailyArt: Discovering Articulation from Single Static Images via Latent Dynamics [18.2] アーティキュレートされたオブジェクトは、具体化されたAIと世界モデルに不可欠である。
既存の方法は、複数状態の観測を必要とするか、明示的な部分の先行、検索、その他の補助的な入力に依存している。
単一静止画像からの関節推定を定式化したDailyArtについて述べる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:24:07 GMT)
Creator Incentives in Recommender Systems: A Cooperative Game-Theoretic Approach for Stable and Fair Collaboration in Multi-Agent Bandits [18.2] 我々は,移動可能ユーティリティ(TU)協調ゲーム定式化による多エージェント線形帯域問題として協調を解析する。
固定された動作集合を持つ同一(同種)エージェントに対して、誘導されたTUゲームは穏やかなアルゴリズム条件下で凸であることを示す。
4つのシャプリー公理のうち3つを満たす単純な後悔に基づくペイアウトルールを提案し、その中核にある。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:45:15 GMT)
MedConceal: A Benchmark for Clinical Hidden-Concern Reasoning Under Partial Observability [17.8] 医療対話における隠蔽推論評価のための対話型患者シミュレータを用いたベンチマークであるMedConcealを提案する。
クリニックが回答したオンライン健康に関する議論から構築された各ケースは、シミュレーターと内部を隠蔽した懸念を伴うクリニックと視覚のコンテキストをペアリングする。
本研究は,マルチターン対話を通じて隠れた関心を隠蔽し,介入し,主要な関心事に対処し,患者を目標計画に向けて誘導する2つの能力について検討する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 21:51:02 GMT)
SUPERNOVA: Eliciting General Reasoning in LLMs with Reinforcement Learning on Natural Instructions [17.6] Reinforcement Learning with Verifiable Rewards (RLVR) は、数学やコードなどの形式領域における大規模言語モデル(LLM)推論を大幅に改善した。
RLVRを一般的な推論に拡張することは、さまざまな推論スキルにまたがる高品質で検証可能なトレーニングデータが欠如していることによって制約される。
本稿では,一般推論の強化を目的としたRLVR用データキュレーションフレームワークSUPERNOVAを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:16:07 GMT)
FlowGuard: Towards Lightweight In-Generation Safety Detection for Diffusion Models via Linear Latent Decoding [17.6] 拡散に基づく画像生成モデルは、Not-Safe-For-Work(NSFW)コンテンツを生成する可能性があるため、安全性のリスクが生じる。
中間段階を検査するクロスモデルインジェネレーション検出フレームワークであるFlowGuardを紹介する。
安全でないコンテンツを早期に検出することで、FlowGuardは計算コストを削減するために不要な拡散ステップを削減する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:49:43 GMT)
Reinforcement Learning with LLM-Guided Action Spaces for Synthesizable Lead Optimization [17.5] MolReActはMarkov決定プロセスとしてリード最適化を定式化するフレームワークである。
性質改善された分子を生産し、それぞれに明示的な合成経路が伴う。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:22:10 GMT)
Cross-Modal Emotion Transfer for Emotion Editing in Talking Face Video [17.5] C-MET(Cross-Modal Emotion Transfer)は、音声に基づく表情を生成する新しい手法である。
本手法は,最先端手法よりも感情の精度を14%向上させる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:28:03 GMT)
ACF: A Collaborative Framework for Agent Covert Communication under Cognitive Asymmetry [17.4] 本稿では,非対称協調フレームワーク (ACF) を提案する。
ACFは意味的忠実度と包括的コミュニケーションの両方に優れ、対称性は深刻なチャネル劣化に悩まされる。
計算の不明瞭さを維持し、証明可能なエラー境界を持つ信頼できる秘密抽出を可能にする。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:10:51 GMT)
Differentially Private Language Generation and Identification in the Limit [17.3] 我々は,Kleinberg と Mullainathan [KM24] が最近導入した言語生成の限界について,差分プライバシーの制約の下で検討した。
我々は任意の可算コレクションから極限を生成する$varepsilon$-differentially-privateアルゴリズムを提供する。
我々は、$varepsilon$-DPアルゴリズムが無限交叉と有限集合差を持つ2つの言語を含む集合を識別できないことを証明した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:48:46 GMT)
Decomposing the Delta: What Do Models Actually Learn from Preference Pairs? [17.3] 選好データにおける品質デルタの2つの概念、すなわちジェネレータレベルデルタとサンプルレベルデルタについて検討する。
ジェネレータレベルの差分の増加は、ドメイン外推論タスクのパフォーマンスを着実に向上させる。
提案手法は,選好最適化により推論性能を向上させるための2つのレシピを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 19:28:17 GMT)
Monocular Depth Estimation From the Perspective of Feature Restoration: A Diffusion Enhanced Depth Restoration Approach [17.3] 単眼深度推定(MDE)は、3次元視覚において重要な応用が可能な基本的なコンピュータビジョンタスクである。
本稿では,先述した問題をまず検討し,エンコーダの機能改善が可能である場合,現在のフレームワークにはまだ大きな可能性があることを示す。
実験により,提案手法は各種データセットの最先端手法よりも優れた性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:13:53 GMT)
3DrawAgent: Teaching LLM to Draw in 3D with Early Contrastive Experience [17.2] 我々は3Dスケッチ生成のためのトレーニングフリーで言語駆動のフレームワークである3DrawAgentを紹介する。
従来の2Dスケッチエージェントとは異なり,本手法は相対的経験最適化戦略を導入する。
3DrawAgentは多種多様なテキストプロンプトから複雑で一貫性のある3Dベジエスケッチを生成することができることを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:47:00 GMT)
Rethinking Entropy Allocation in LLM-based ASR: Understanding the Dynamics between Speech Encoders and LLMs [17.2] 学習パラダイムが音声エンコーダとLLM間のエントロピー削減をどのように割り当てるかを特徴付けるための3つの指標を提案する。
本稿では,パラメータ効率とロバストネス幻覚を最適化した,能力境界認識に基づく多段階学習戦略を提案する。
マンダリンと英語のベンチマーク実験により,2.3Bパラメータのみを用いた最先端モデルとの競合性能が得られた。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:07:52 GMT)
Guiding a Diffusion Model by Swapping Its Tokens [16.6] 本研究では,条件生成と非条件生成の両方に対して,CFGライクなガイダンスを実現するための簡単な手法を提案する。
鍵となるアイデアは、単純なトークンスワップ操作によって混乱した予測を生成することである。
提案手法はトークン潜伏剤を選択的に交換し,分解し,摂動の制御をきめ細かなものにする。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:54:49 GMT)
ActionNex: A Virtual Outage Manager for Cloud Computing [15.3] 大規模なクラウド運用における障害管理は、依然として非常に手作業で行われている。
textbfActionNexは、エンドツーエンドの停止支援をサポートするプロダクショングレードのエージェントシステムである。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 22:32:31 GMT)
PROMISE: Proof Automation as Structural Imitation of Human Reasoning [15.1] ProMISEは,証明状態遷移に対するステートフルな探索として,証明生成を再構成する構造認識フレームワークである。
複数のLLMバックエンドにまたがるSEL4ベンチマークのPROMISEを評価し,SeleneやRangoといった先行システムと比較した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:24:10 GMT)
On the Global Photometric Alignment for Low-Level Vision [14.9] 監督された低レベルの視覚モデルは、ペア化された参照に対してピクセル単位での損失に依存するが、ペア化されたトレーニングセットはペアごとの光度不整合を示す。
標準的な再建の損失は、ペア当たりの測光目標に反する不均衡な勾配予算を割り当て、コンテンツ復元を混雑させる。
この分析によって動機づけられた光度アライメント損失(PAL)を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:29:54 GMT)
R2G: A Multi-View Circuit Graph Benchmark Suite from RTL to GDSII [14.8] R2Gは5つのステージ認識ビューを情報同値で標準化するマルチビューサーキットグラフベンチマークスイートである。
R2Gは、合成、配置、ルーティングステージにまたがるエンドツーエンドのDEF-to-graphパイプラインを提供する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 22:59:27 GMT)
Governed Capability Evolution for Embodied Agents: Safe Upgrade, Compatibility Checking, and Runtime Rollback for Embodied Capability Modules [14.4] エージェント自体を書き換えるのではなく、実行可能な機能を更新することで、時間とともに改善されることが期待されている。
ライフサイクルを意識したアップグレードフレームワークを提案し、新しい機能バージョンはすべて、管理されたデプロイメント候補として扱われる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:18:51 GMT)
EEG2Vision: A Multimodal EEG-Based Framework for 2D Visual Reconstruction in Cognitive Neuroscience [14.3] 私たちは、モジュール化されたエンドツーエンドのEEG-to-imageフレームワークであるEEG2Visionを紹介します。
異なる脳波解像度の再構成性能を評価する。
アクシデント誘導後のブースティング機構によって視覚的品質を向上させる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:25:54 GMT)
Brain3D: EEG-to-3D Decoding of Visual Representations via Multimodal Reasoning [14.3] 脳波から画像へのデコーディングに基づく脳波から3Dへの再構成のためのマルチモーダルアーキテクチャであるBrain3Dを提案する。
我々のパイプラインはまず脳波信号から視覚的に接地された画像を生成し、次に多モーダルな言語モデルを用いて構造化された3D認識記述を抽出する。
問題を構造化段階に分解することで,脳波から3Dへの直接マッピングを回避し,スケーラブルな脳波駆動3D生成を実現する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:35:44 GMT)
Revisiting Radar Perception With Spectral Point Clouds [14.3] 本稿では, スペクトル点雲のパラダイムを導入し, 点雲はレーダースペクトルの粗い圧縮された表現として扱われる。
我々は、リッチ化を適用すると、点雲がRDベンチマークを超えることができることを示した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:19:09 GMT)
Lost in the Hype: Revealing and Dissecting the Performance Degradation of Medical Multimodal Large Language Models in Image Classification [14.2] マルチモーダル大言語モデル(MLLM)は、医療画像解析の分野で前例のない応用の波を引き起こしている。
しかし、医学画像分類では、最先端の医療MLLMは従来のディープラーニングモデルと比べて一貫して性能が劣っている。
本稿では、3つの代表的な画像分類データセットにまたがる14のオープンソース医療MLLMについて広範な実験を行った。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:07:26 GMT)
Ghost imaging with zero photons [14.2] さらに特殊な特性を持つゴーストイメージング実験が報告されている。
この画像は、光子が対象物と相互作用したり、信号も参照ビームも光子も相互作用しない場合に再構成することができる。
ゴースト画像がゼロ光子で検索できる理由は、光子数予測測定と熱光の光子統計によって共同で決定される。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:17:35 GMT)
Fast and Coherent Transfer of Atomic Qubits in Optical Tweezers using Fiber Array Architecture [14.1] 我々は、静的トラップと移動トラップのスムーズな振幅交換を実現するために、トラップ深さのサイト解決制御を備えた中性原子量子コンピューティングアーキテクチャを用いる。
静的トラップと移動トラップの間の10ドル移動により、サイクル当たりの加熱速度0.156(9)$Kが得られ、無視できる原子損失で500サイクル以上維持され、1サイクルあたり0.99992(5)の量子状態忠実度が得られる。
この高速で低熱のコヒーレント転送能力は、原子シャットリングに基づく量子コンピューティングの速度と忠実性の両方を改善するための実用的な経路を提供する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:23:47 GMT)
ZeroCoder: Can LLMs Improve Code Generation Without Ground-Truth Supervision? [14.0] RLVR(Reinforcement Learning with Verifiable Rewards)は、実行ベースのフィードバックを通じて改善する強力なパラダイムである。
既存の作業では、自己生成テストを使って報酬を土台にしようとしたが、差別的テストの欠如は、テスト生成に対するモデルの準最適性能による影響を制限した。
我々はZeroCoderについて紹介する。ZeroCoderは、自己生成されたコード-テストインタラクションから実行フィードバックを使用して、CoderとTesterを共同でトレーニングする完全なラベルなしの共進化フレームワークである。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:24:54 GMT)
PRISM-CTG: A Foundation Model for Cardiotocography Analysis with Multi-View SSL [14.0] 自動CTG分析のための改良されたディープラーニングモデルは通常、狭いラベル付きデータセットと限られた患者コホートによって制限される。
我々は,CTG(PRISM-CTG)のための統合自己スーパービジョンとメタデータを用いた生理的認識表現学習を提案する。
PRISM-CTGは、転送可能なドメインレベルの表現を学習するために、大規模なアンラベル記録を利用する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:44:27 GMT)
TurboAgent: An LLM-Driven Autonomous Multi-Agent Framework for Turbomachinery Aerodynamic Design [13.8] TurboAgentは、大型言語モデル(LLM)によるターボ機械空力設計と最適化のための自律型マルチエージェントフレームワークである。
このフレームワークは、従来の試行錯誤設計をデータ駆動のコラボレーティブワークフローに変換する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:04:35 GMT)
EgoEverything: A Benchmark for Human Behavior Inspired Long Context Egocentric Video Understanding in AR Environment [13.3] EgoEverythingは、目視データから抽象化された人間の注意信号を利用して、質問を生成することで、人間の行動を明確に考慮するベンチマークである。
5000以上の複数の質問応答ペアで構成されており、100時間以上のビデオにまたがっている。
人間の自然な振る舞いをより忠実に捉え、ARにおける長いコンテキストのエゴセントリックなビデオ理解のための現実的な評価設定を提供する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:13:36 GMT)
Weakly-Supervised Lung Nodule Segmentation via Training-Free Guidance of 3D Rectified Flow [13.2] 提案手法は2つの異なる予測器に対して, 異なる大きさと形状の肺結節を連続的に検出し, 高品質なセグメンテーションを実現する。
LUNA16の実験は、ベースライン法よりも改善され、生成基盤モデルの可能性を弱教師付き3次元医用画像セグメンテーションのツールとして強調した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:46:14 GMT)
U-CECE: A Universal Multi-Resolution Framework for Conceptual Counterfactual Explanations [12.9] U-CECEは、概念的対実的説明のための統一的、モデルに依存しないマルチレゾリューションフレームワークである。
幅広い説明のための原子概念、単純な相互作用のための関係集合、完全な意味構造のための構造グラフの3つのレベルにまたがる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:30:00 GMT)
FIT: A Large-Scale Dataset for Fit-Aware Virtual Try-On [12.9] 仮想トライトン(VTO)は,衣服を装着した人の現実的なイメージを合成することを目的としている。
現行のVTOメソッドは、衣服や人の大きさに関わらず、適切に適合した結果を生成するのがデフォルトである。
実測値と合わせて113万点以上の試行画像トリプレットからなるFITデータセットを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:57:50 GMT)
PSI: Shared State as the Missing Layer for Coherent AI-Generated Instruments in Personal AI Agents [12.9] 独立に生成されたモジュールをコヒーレントな楽器に変換する共有状態アーキテクチャであるPSIを提案する。
PSIは共有状態を、AI生成されたパーソナルソフトウェアを独立したアプリから一貫性のあるパーソナルコンピューティング環境に変換する、欠落したシステム層として認識している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:58:36 GMT)
Task-Adaptive Retrieval over Agentic Multi-Modal Web Histories via Learned Graph Memory [12.6] ACGMは、モダリティ特異的な崩壊を伴う異種時間ダイナミクスを捕捉する。
ACGMは検索品質を textbf82.7 nDCG@10 (+9.3 over GPT-4o, $p0.001$) と textbf89.2% Precision@10 (+7.7) に改善し、19の強い密度、再ランク、マルチモーダル、グラフベースのベースラインを上回った。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:24:16 GMT)
EigentSearch-Q+: Enhancing Deep Research Agents with Structured Reasoning Tools [12.6] ウェブ検索をより意図的にするためのクエリおよびエビデンス処理ツールであるQ+を紹介する。
当社はQ+をオープンソースでプロダクション対応のマルチエージェントワーカーであるEigentのブラウザサブエージェントに統合しています。
4つのベンチマークで、Q+はEigentのベンチマークサイズ重み付け平均精度を3.0、3.8、0.6ポイント(pp)改善した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:47:31 GMT)
An Empirical Analysis of Static Analysis Methods for Detection and Mitigation of Code Library Hallucinations [12.5] 静的解析ツールは,全エラーの16~70%,図書館幻覚の14~85%を検出できる。
静的な方法では確実にキャッチできない場合を特定し、48.5%から77%の確率に上限を与える。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:21:30 GMT)
Vision-Language Navigation for Aerial Robots: Towards the Era of Large Language Models [12.5] 航空視覚言語ナビゲーション(Aerial VLN)は、無人航空機(UAV)が自然言語の指示を解釈できるようにすることを目的としている。
この調査は、エアリアルVLN分野の批判的かつ分析的なレビューを提供する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 01:47:24 GMT)
InstrAct: Towards Action-Centric Understanding in Instructional Videos [12.4] InstrActionは、インストラクショナルビデオのアクション中心表現のための事前トレーニングフレームワークである。
まず、ノイズの多いキャプションをフィルタリングし、アクション中心のハードネガティブを生成する、データ駆動型戦略を導入する。
視覚的特徴レベルでは、Action Perceiverは、冗長なビデオエンコーディングからモーション関連トークンを抽出する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:51:13 GMT)
From Debate to Decision: Conformal Social Choice for Safe Multi-Agent Deliberation [12.3] 我々は、議論のアウトプットを調整された行動逆エスカレート決定に変換する、ポストホックな意思決定層であるConformal Social Choiceを紹介する。
階層的なアクションポリシーは、シングルトンセットを自律的なアクションにマップし、より大きなセットを人間のエスカレーションにマップする。
この層は議論が確実に間違っている場合に作用しないため、残りの共形シングルトンは90.0--96.8%の精度に達する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:15:20 GMT)
Multimodal Reasoning with LLM for Encrypted Traffic Interpretation: A Benchmark [12.3] 本稿では、物理的トラフィックエンコーディングと意味解釈を橋渡しするマルチモーダル推論アーキテクチャである、エンドツーエンドのトラフィック言語表現フレームワーク(mmTraffic)を提案する。
認識中心のトラフィックエンコーダと認識中心のLLM生成器により、mmTrafficは、保証されたカテゴリ予測で洗練されたトラフィック解釈を実現する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:56:28 GMT)
Phantom: Physics-Infused Video Generation via Joint Modeling of Visual and Latent Physical Dynamics [12.1] 本稿では,視覚的内容と潜伏する物理力学を共同でモデル化する物理拡散ビデオ生成モデルを提案する。
観測されたビデオフレームと推論された物理状態に基づいて、Phantomは遅延物理的ダイナミクスを共同で予測し、将来のビデオフレームを生成する。
物理認識ビデオ表現の推論を直接ビデオ生成プロセスに統合することにより、Phantomは視覚的にリアルかつ物理的に一貫性のあるビデオシーケンスを生成する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:48:46 GMT)
ADAPTive Input Training for Many-to-One Pre-Training on Time-Series Classification [12.1] 本稿では,ADAPTと呼ばれる時系列データのための事前学習パラダイムを提案する。
ADAPTは時系列領域におけるデータの物理的特性を効率的に調整し、混合バッチ事前トレーニングを可能にする。
我々は162の時系列分類データセットをトレーニングし、分類ベンチマークのための新しい最先端性能を設定した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:58:30 GMT)
Generative Simulation for Policy Learning in Physical Human-Robot Interaction [12.0] 多様なpHRIシナリオを自動的に合成するゼロショット「text2sim2real」生成シミュレーションフレームワークを提案する。
我々はこのフレームワークを利用して、大規模合成デモデータセットを自律的に収集する。
学習方針はゼロショット・シム・トゥ・リアル・トランスファーの実現に成功し、成功率は80%を超えました。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:00:05 GMT)
Top Management Journal Portal: A Real-Source Search and Research Analytics Artifact for UTD-24 and FT50 Journals [11.6] Top Management Journal Portalは、エリートビジネスおよびマネジメントジャーナルから文学を検索、監視、解釈するためのデプロイ可能なWebアーティファクトである。
静的ジャーナルディレクトリや汎用の学術検索エンジンとは異なり、アーティファクトは高水準の管理機関に明示的にスコープされている。
本論文は,ジャーナルプール特有の学術的発見のための機能的デザインアーティファクトとアーキテクチャパターンの両方に貢献する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:52:07 GMT)
ABMAMBA: Multimodal Large Language Model with Aligned Hierarchical Bidirectional Scan for Efficient Video Captioning [11.4] 完全にオープンなマルチモーダル大言語モデル(MLLM)による動画キャプションに焦点を当てる。
ABMambaは、ビデオシーケンスのスケーラブルな処理を可能にする線形計算複雑性を持つ完全にオープンなMLLMである。
VATEX や MSR-VTT のような標準的なビデオキャプションベンチマークでは、ABMamba は典型的な MLLM と比較して競争性能を示している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:58:56 GMT)
BRASP: Boolean Range Queries over Encrypted Spatial Data with Access and Search Pattern Privacy [11.3] 本稿では,暗号化空間データ上でのBooleanレンジクエリの検索可能な暗号化方式BRASPを提案する。
BRASPのセキュリティを、機密性、シャッフル不識別性、クエリ不偽造性、フォワードセキュリティ分析を通じて形式化する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:50:25 GMT)
Securing Retrieval-Augmented Generation: A Taxonomy of Attacks, Defenses, and Future Directions [11.3] Retrieval-augmented Generation (RAG)は大規模言語モデル(LLM)を大幅に強化する
RAGは、外部の知識アクセスを通じて、新たなセキュリティリスクを導入する。
我々は、セキュアなRAGは基本的に外部知識アクセスパイプラインのセキュリティに関するものであることを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:38:18 GMT)
Detecting HIV-Related Stigma in Clinical Narratives Using Large Language Models [10.7] 本研究の目的は,臨床ノートからHIVスティグマを識別するための言語モデル(LLM)ベースのツールを開発することである。
2012年から2022年の間,フロリダ大学健康学部(UF)におけるPLWHの診療成績について検討した。
公的な態度、開示に関する懸念、否定的な自己イメージ、パーソナライズされたスティグマの4つのサブスケールに、合計1,332の文章が手動で注釈付けされた。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 02:01:01 GMT)
GRACE: A Dynamic Coreset Selection Framework for Large Language Model Optimization [10.7] 大規模言語モデル(LLM)のためのグラフ誘導適応および動的コアセット選択フレームワークを提案する。
GRACEは、表現の多様性と勾配に基づく重要なメトリクスを組み合わせることで、コアセットを動的に構築し、更新する。
GRACEは様々なLLMやタスクのトレーニング効率とダウンストリームのパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:08:01 GMT)
DialBGM: A Benchmark for Background Music Recommendation from Everyday Multi-Turn Dialogues [9.7] 1200のオープンドメインの日次対話を4つの音楽クリップと組み合わせたベンチマークであるDialBGMを提示する。
ランク付けは背景適合性基準(文脈的関連性、非侵襲性、一貫性など)によって決定される。
トップランクのクリップを選択すると、Hit@1の35%を超えるモデルはない。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:06:26 GMT)
Dual-Pool Token-Budget Routing for Cost-Efficient and Reliable LLM Serving [9.5] プロダクションvLLMフリートは通常、最悪のコンテキスト長に対して各インスタンスをプロビジョニングする。
実際には、80-95%のリクエストは短いが、長いコンテキストに最適化された設定の下で提供される。
本稿では,同種艦隊を2つの専用プールに分割する軽量ディスパッチ機構であるデュアルプールトークン予算ルーティングを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:47:20 GMT)
MIMIC-Py: An Extensible Tool for Personality-Driven Automated Game Testing with Large Language Models [9.4] 本稿では,Pythonによる自動ゲームテストツールMIMIC-Pyについて述べる。
MIMIC-Pyは、パーソナリティ特性を入力として公開し、ゲーム固有のロジックから計画、実行、メモリを分離するモジュールアーキテクチャを採用する。
研究プロトタイプと実際の自動ゲームテストのギャップを埋め、最小限のエンジニアリング労力で新しいゲーム環境へのデプロイを可能にする方法を示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:16:46 GMT)
Graph Query Generation with Constraint-guided Large Language Agents [9.4] UniQGenは制約ベースのフレームワークで、代表的なグラフクエリ節を抽出し、洗練する。
我々は、UniQGenが最先端のグラフクエリ生成技術よりも精度と効率の両面で優れていることを示す。
我々はCypher出力とNeptune対応のFreebaseスナップショットをリリースし、言語間KGQA研究を支援する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 21:50:47 GMT)
Show Me the Infographic I Imagine: Intent-Aware Infographic Retrieval for Authoring Support [9.1] ユーザクエリとインフォグラフィックデザインの整合性を向上する意図認識型インフォグラフィック検索フレームワークを開発した。
我々は、人々がインフォグラフィックをどのように記述するかのフォーマティブな研究を行い、コンテンツとビジュアルデザインの面にまたがる意図的な分類法を導出する。
この分類法は、自由形式のユーザクエリを豊かに洗練するために利用され、検索プロセスを意図特異的な手がかりで導く。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:58:59 GMT)
The Weaponization of Computer Vision: Tracing Military-Surveillance Ties through Conference Sponsorship [8.8] 軍事・監視分野におけるコンピュータビジョン研究の活用状況について検討する。
この分野の中心研究交換プラットフォームと金融関係を持つハイテク企業のデータセットを収集する。
スポンサーの活動を調査した結果、44%が軍事・監視アプリケーションと直接関係があることが判明した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:54:44 GMT)
A GAN and LLM-Driven Data Augmentation Framework for Dynamic Linguistic Pattern Modeling in Chinese Sarcasm Detection [8.8] サルカズム(Sarcasm)は、誇張、皮肉、比較を通じて、特定の個人や状況に対する批判や特徴を強調する修辞的な装置である。
既存の中国のサルカズム検出法は、限られたデータセットと高い建設コストで制約されている。
本稿では,GAN(Generative Adversarial Network)とLLM(Large Language Model)によるデータ拡張フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:43:03 GMT)
Demystifying the Silence of Correctness Bugs in PyTorch Compiler [8.6] The first empirical study of the correctness bugs in torch.compile, examined their characteristics and the effective of existing fuzzer。
本稿では,Torch.compileの正当性バグを検出するために,AlignGuardという概念実証テスト手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 19:13:15 GMT)
MONETA: Multimodal Industry Classification through Geographic Information with Multi Agent Systems [8.6] 我々は,テキスト(Website, Wikipedia, Wikidata)と地理空間情報を用いた最初のマルチモーダル産業分類ベンチマークであるMONETAを提示する。
オープンでクローズドなマルチモーダル大言語モデル(MLLM)によるトレーニングフリーベースラインの62.10%と74.10%に到達しました。
マルチターン設計,コンテキスト強化,分類説明の組み合わせにより,最大22.80%の増加が観察された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:21:39 GMT)
Post-Quantum Cryptographic Analysis of Message Transformations Across the Network Stack [8.4] 我々は、量子後暗号(PQC)の準備性に関して、層間暗号変換を解析する。
このフレームワークをLinuxとiOSプラットフォームにまたがる5つのコミュニケーションシナリオに適用する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:22:47 GMT)
Rethinking Data Mixing from the Perspective of Large Language Models [8.3] 大規模言語モデル(LLM)訓練にはデータ混合戦略が不可欠であり,不適切な戦略が一般化を著しく減少させることを示す実証的証拠がある。
本稿では,データスケジューリングをグラフ制約付き最適化問題として定式化するフレームワークであるDoGraphを紹介する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:25:03 GMT)
One Interface, Many Robots: Unified Real-Time Low-Level Motion Planning for Collaborative Arms [8.3] 本稿では,協調ロボットアームのリアルタイム低レベル動作計画のための共通インタフェースを提案する。
プログラムソルバとn次補間器を併用して,スムーズかつ連続的な微分可能な軌道を生成する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 21:50:53 GMT)
Alleviating Community Fear in Disasters via Multi-Agent Actor-Critic Reinforcement Learning [8.3] 災害の間、電力網、通信網、社会行動のカスケードは、コミュニティの恐怖を増幅し、協力を弱める。
既存のサイバー物理社会モデル(CPS)は、これらの結合力学をシミュレートするが、アクティブな介入のメカニズムが欠如している。
本研究では,Valinejad と Mili (2023) の CPS レジリエンスモデルを拡張し,コミュニケーション,電力,緊急管理の3つのエージェントの制御チャネルを拡張し,オンラインアクター・クリティック強化学習によって解決された3つのプレイヤー非ゼロサム差分ゲームとしてシステムを構成する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 22:37:32 GMT)
Why Are We Lonely? Leveraging LLMs to Measure and Understand Loneliness in Caregivers and Non-caregivers [8.2] ソーシャルメディアのテキスト分析における孤独の原因を分類するために,専門家が開発した孤独度評価フレームワークと専門家インフォームドタイポロジーを導入する。
GPT-4o, GPT-5-nano, GPT-5を適用し, 高品質なRedditコーパスを構築し, 両集団間の孤独さを解析した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:35:12 GMT)
To Copilot and Beyond: 22 AI Systems Developers Want Built [8.0] 860人のMicrosoft開発者を対象に調査を行い、AIサポートを希望する場所と、そこに留まることを希望する場所を調べた。
開発者が5つのタスクカテゴリにまたがって構築したい、22のAIシステムを特定します。
それぞれについて、それが解決する問題、構築が難しい理由、開発者がその振る舞いに課す制約について説明する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:31:34 GMT)
Tracing the Chain: Deep Learning for Stepping-Stone Intrusion Detection [8.0] ステッピングストーン侵入(SSI)は一般的なネットワーク回避手法である。
効果的なSSI検出には、各リレーホストの入出力フローを極めて低い偽陽性率で関連付ける必要がある。
ESPRESSOは、トランスフォーマーベースの特徴抽出ネットワーク、タイムアラインな多チャンネル間隔特徴、オンライントリプレットメトリック学習を組み合わせたフロー相関モデルである。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 22:26:52 GMT)
A Unified Multi-Layer Framework for Skill Acquisition from Imperfect Human Demonstrations [7.8] 現在の技術教育のためのヒューマンロボットインタラクション(HRI)システムは断片化されている。
文献における既存のアプローチは、同時に効率的で直感的で、普遍的に安全な結束的なフレームワークを提供していません。
本稿では,Demonstration からの堅牢で忠実な学習を可能にする新しい階層化制御フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:13:19 GMT)
ETCH-X: Robustify Expressive Body Fitting to Clothed Humans with Composable Datasets [7.7] コードモデルは8D2と0.8%のデータ、例えば35.8%(MPJPE-All)やVVVVAllでリリースされる。
BEDETCHは、さまざまな入力レベルにわたって堅牢なパフォーマンスとスケーラブルな改善を実現する。
コードモデルは8D2と0.8%のデータ、例えば35.8%(MPJPE-All)やVVVVAllでリリースされる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:59:59 GMT)
Are we still able to recognize pearls? Machine-driven peer review and the risk to creativity: An explainable RAG-XAI detection framework with markers extraction [7.7] 本稿では、レビュー品質を評価し、自動パターンを検出するための説明可能なフレームワーク(RAG-XAI)を提案する。
XGBoost、Random Forest、LightGBMは99.61%、AUC-ROCは0.999以上、F1スコアは0.9925である。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:25:49 GMT)
OceanMAE: A Foundation Model for Ocean Remote Sensing [7.6] 海洋リモートセンシングは, 海底評価, 海底特性評価, 海洋ゴミ検出, 生態系モニタリングなどの応用に不可欠である。
本研究では,マルチスペクトル・センチネル-2観測を自己教師型学習中に,物理的に意味のあるオーシャンディスクリプタと統合することにより,標準的なMAE事前訓練を拡張する,海洋固有のマスク付きオートエンコーダであるOceanMAEを提案する。
実験の結果、OceanMAEは海洋のセグメンテーションにおいて最も高い利得を得られ、一方、浴量測定の利点は競争力とタスクに依存していることがわかった。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:29:41 GMT)
LLM-Based Data Generation and Clinical Skills Evaluation for Low-Resource French OSCEs [7.6] フランスでは、トレーニングセッションの組織は人的および論理的な制約によって制限される。
自然言語処理(NLP)と大規模言語モデル(LLM)の最近の進歩は、医療面接を自動的に評価する機会を提供する。
そこで我々は,シナリオ特異的評価基準でガイドされた総合的医師・患者面接書を作成できる制御パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:46:39 GMT)
Leveraging Complementary Embeddings for Replay Selection in Continual Learning with Small Buffers [7.6] 多重埋め込み再生選択(MERS)は、バッファ選択モジュールをグラフベースのアプローチで置き換える。
連続学習アルゴリズムにおけるSOTA選択戦略に対する一貫した改善点を示す。
MERSは、リプレイベースの継続的な学習のための実践的でドロップインの強化である。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:09:02 GMT)
A Direct Approach for Handling Contextual Bandits with Latent State Dynamics [7.6] 我々はNelson et al. (2022) によって有限武装線型帯域モデルを再検討し、文脈と報酬は有限隠れマルコフ連鎖によって支配される。
隠れ状態に直接的な依存を組み込んだより自然なモデルについて検討する。
オンライン上でHMMパラメータを推定する完全適応戦略に対して、より強く、高い確率、後悔の限界を得る。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:09:45 GMT)
CIAO - Code In Architecture Out - Automated Software Architecture Documentation with Large Language Models [7.5] 本稿では,大規模言語モデルを用いてGitHubリポジトリから直接システムレベルのアーキテクチャドキュメンテーションを自動生成する構造化プロセスを提案する。
このプロセスはCIAO(Code In Architecture Out)と呼ばれ、LLMベースのワークフローを定義し、レポジトリをインプットとして、システムレベルのアーキテクチャドキュメントを生成する。
筆者らは22人の開発者を対象に,コントリビュートしたリポジトリで生成されたドキュメントをレビューし,プロセスの評価を行った。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:29:17 GMT)
Emotion Concepts and their Function in a Large Language Model [7.5] 大きな言語モデル(LLM)は時に感情的な反応を示す。
クロード・ソネット 4.5 では,これがなぜそうなるのかを考察し,アライメント関係の挙動について考察する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 02:25:17 GMT)
xDup: Privacy-Preserving Deduplication for Humanitarian Organizations using Fuzzy PSI [7.4] 現在の重複防止策は、データを他の組織と共有することで、脆弱な援助を受ける人たちにプライバシーを害するリスクを負う。
我々は、人道的組織の要求を満たす新しい実践的重複システムであるxDupを紹介する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:18:05 GMT)
From Universal to Individualized Actionability: Revisiting Personalization in Algorithmic Recourse [7.4] 個人の行動可能性としてパーソナライゼーションを形式化し、どの特徴が個別に行動可能かを規定する厳密な制約と、アクション値やコストよりも好みをキャプチャするソフトな個別化された制約の2つの側面に沿って特徴付けられる。
個人の行動可能性の制約、特に難しい制約は、レコメンデーションの妥当性と妥当性を著しく低下させます。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:30:25 GMT)
Adam-HNAG: A Convergent Reformulation of Adam with Accelerated Rate [7.4] アダムは経験的成功を強く達成しているが、その理論は決定論的完全バッチの設定においても不完全である。
本研究では、変数分割と演算子分割と曲率を考慮した勾配補正を組み合わせることにより、フルバッチAdamの収束再構成を開発する。
これにより、指数的に減衰するリャプノフ関数を持つ連続時間アダム・HNAGフローと、アダム-HNAGとアダム-HNAG-sという2つの離散的な方法が導かれる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:09:24 GMT)
Same Outcomes, Different Journeys: A Trace-Level Framework for Comparing Human and GUI-Agent Behavior in Production Search Systems [7.4] 本研究では, (i) タスクの成果と努力, (ii) クエリの定式化, (iii) インターフェース状態間のナビゲーションを比較したトレースレベルの評価フレームワークを提案する。
39人の参加者と最先端のGUIエージェントが10種類のマルチホップ検索タスクを行う実運用オーディオストリーミング検索アプリケーションにおいて、このフレームワークを制御された研究でインスタンス化する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:49:02 GMT)
Building Better Environments for Autonomous Cyber Defence [7.1] 本稿では,自律型サイバー防衛のための優れた強化学習環境を構築するためのワークショップにおいて,参加者が共有する知識について詳述する。
本研究の貢献は,(1) RLサイバー環境と実システムとのインターフェースを分解するフレームワーク,(2) RLベースのACD環境開発とエージェント評価の現在のベストプラクティスに関するガイドラインの2つである。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 22:41:01 GMT)
QoS-QoE Translation with Large Language Model [7.1] 本稿では,マルチメディア文献からの構造化-QoE関係のソースグラウンドデータセットについて紹介する。
双方向翻訳における連続値と離散ラベルの予測において,QoE と QoE-QoS の双方で高い性能を示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:51:16 GMT)
Investigating Code Reuse in Software Redesign: A Case Study [7.0] ソフトウェアは品質特性を改善しながら機能を再設計するが、コードとテストの手作業による再利用はコストがかかり、エラーが発生しやすい。
実験的な調査と検証済みのオープンソースコントリビューションを組み合わせたアクションリサーチ手法を用いて,現在進行中のSoot/SootUpの再設計事例について検討する。
対応するコードとテストの追跡が重要な課題であると認識し、クローン検出によって対処し、オリジナルのプロジェクトと再設計されたプロジェクト間のコードマッピングを導出します。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:39:12 GMT)
RewardFlow: Generate Images by Optimizing What You Reward [7.0] RewardFlowはインバージョンフリーのフレームワークで、事前トレーニングされた拡散モデルとフローマッチングモデルを推論時に操作する。
セマンティックアライメント、知覚的忠実性、局所的な接地、オブジェクトの一貫性、人間の嗜好の相補的な相補的な相補的な相補的な報酬を統一する。
また、言語ビジョン推論によるきめ細かいセマンティック監視を提供するVQAベースの報酬も導入している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:59:19 GMT)
Beyond Mamba: Enhancing State-space Models with Deformable Dilated Convolutions for Multi-scale Traffic Object Detection [6.9] 本研究では,変形可能なDilated Convolutions Network (MDDCNet) を用いたMambaを提案する。
MDDCNetでは、連続するMambaブロックを持つよく設計されたハイブリッドバックボーンは、局所的な詳細からグローバルな意味論への階層的な特徴表現を可能にする。
The Channel-Enhanced Feed-Forward Network (CE-FFN) is developed to overcome the limited channel interaction capabilities of conventional feed-forward network。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:43:00 GMT)
MotionScape: A Large-Scale Real-World Highly Dynamic UAV Video Dataset for World Models [6.7] 我々は,世界モデリングのための高ダイナミックな動きを持つ大規模実世界のUAVviewビデオデータセットであるMotionScapeを紹介する。
MotionScapeには4K UAVビュービデオが30時間以上含まれており、合計4.5Mのフレームがある。
このデータセットはセマンティックで幾何学的に整合したトレーニングサンプルを備えており、様々な現実世界のUAVビデオが正確な6-DoFカメラ軌道ときめ細かい自然言語記述と密結合されている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:59:40 GMT)
Bridging Time and Space: Decoupled Spatio-Temporal Alignment for Video Grounding [6.7] textbfBridge-STGは、意味的コヒーレンスを維持しながら時間的および空間的ローカライゼーションを分離するエンドツーエンドフレームワークである。
Bridge-STGはMLLM方式の最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:14:00 GMT)
OV-Stitcher: A Global Context-Aware Framework for Training-Free Open-Vocabulary Semantic Segmentation [6.6] 訓練不要なオープン語彙セマンティックセマンティックセグメンテーション(TF-OVSS)が近年注目されている。
我々は,この制限に対処するトレーニングフリーフレームワークであるOV-Stitcherを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:28:43 GMT)
An Algorithm for Fast Assembling Large-Scale Defect-Free Atom Arrays [6.5] 光ツイーザによって形成されたAtomアレイは、この目標を達成する上で最も有望なプラットフォームである。
アルゴリズムの課題を完全に解決するために、2つの革新的なコンポーネントからなる統一されたフレームワークを提案する。
我々のアルゴリズムは、104量子ビットの原子配列を、閉じ込められた原子の典型的な真空寿命よりもはるかに短い時間スケールで組み立てることができる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:00:17 GMT)
A Little Rank Goes a Long Way: Random Scaffolds with LoRA Adapters Are All You Need [6.4] LottaLoRAは、すべてのバックボーン重量をランダムに描画して凍結するトレーニングパラダイムであり、ローランクのLoRAアダプタのみがトレーニングされる。
9つのベンチマークで、さまざまなアーキテクチャファミリーが、完全にトレーニングされたパフォーマンスの96-100%を回復し、パラメータの0.5-40%しかトレーニングしていない。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:24:50 GMT)
Gaze to Insight: A Scalable AI Approach for Detecting Gaze Behaviours in Face-to-Face Collaborative Learning [6.4] 本研究では,対面協調学習における視線行動を自動的に検出するスケーラブルな人工知能手法を提案する。
提案手法は、ビデオデータから生徒の視線行動を検出するために、0.829のF1スコアを達成する。
実環境における学生の協調学習を支援するために,このアプローチがもたらす意味についても論じる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:25:24 GMT)
Wiring the 'Why': A Unified Taxonomy and Survey of Abductive Reasoning in LLMs [6.4] 本稿では,Large Language Models (LLMs) における帰納的推論に関する最初の調査について述べる。
この分野で広く普及している概念的混乱とタスク定義の合成に対処するため,我々は,先行作業を正式に分類する統合された2段階定義を確立する。
文献を包括的に分類し,それらの帰納的タスク,データセット,基礎となる方法論,評価戦略に基づいて事前作業の分類を行う。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:16:00 GMT)
Simultaneous ground-state cooling of six mechanical modes of two levitated nanoparticles [6.4] 接地状態冷却は、巨大な物体の機械的運動におけるマクロ的な量子効果を探索するための前提条件である。
2つの浮遊ナノ粒子の6つの機械的変位モードの同時冷却について検討した。
我々の研究は、複数の浮遊ナノ粒子における集合的な巨視的量子効果の生成と操作の道を開いた。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:35:39 GMT)
Sampling-Aware 3D Spatial Analysis in Multiplexed Imaging [6.4] 高多重顕微鏡は、単一細胞の分解能で組織をリッチに特徴づけることができる。
ほとんどの分析は、本質的に3次元組織組織であるにもかかわらず、2次元の切断に依存している。
直列断面からのスパースかつ一貫した3次元解析を可能にする幾何認識再構成モジュールを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:59:15 GMT)
Clickbait detection: quick inference with maximum impact [6.3] そこで我々は,OpenAIセマンティック埋め込みと6つのコンパクトな特徴を組み合わせ,スタイリスティックかつ情報的手法を取り入れた,クリックベイト検出のための軽量ハイブリッド手法を提案する。
グラフベースモデルでは,推定時間を大幅に短縮することで,競争性能が向上することを示す。
高いROC-Boost-値はさらに強力な識別能力を示し、様々な決定しきい値の下でクリックベイトの見出しを確実に検出する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:09:14 GMT)
Sustained Impact of Agentic Personalisation in Marketing: A Longitudinal Case Study [6.2] 本稿では,エージェント・インフラストラクチャを利用してマーケティング・メッセージのパーソナライズを行う,現実のコンシューマ・アプリケーションを分析対象とするケーススタディを提案する。
マーケターがコンテンツ、オーディエンス、戦略を直接キュレートするアクティブフェーズと、エージェントが固定されたコンポーネントライブラリから自律的に操作するパッシブフェーズの2つを比較します。
その結果、アクティブな人的管理はエンゲージメントの指標において最も高い相対的なリフトを生成する一方で、自律的なエージェントは受動的期間にポジティブなリフトを維持できた。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:25:20 GMT)
Efficient Provably Secure Linguistic Steganography via Range Coding [6.2] 言語ステガノグラフィーは、秘密のメッセージを一見無害なテキストに埋め込んで隠蔽通信を可能にする。
それまでの証明可能な安全なアプローチは、ゼロクルバック・リーバーの発散によって測定された完全な不可避性を達成している。
本稿では,ローテーション機構を備えた効率的かつ確実な言語ステガノグラフィー手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:00:53 GMT)
Pruning Extensions and Efficiency Trade-Offs for Sustainable Time Series Classification [6.2] 時系列分類(TSC)は重要なユースケースを実現するが、モデル、データセット、ハードウェア間のパフォーマンストレードオフの統一的な理解は欠如している。
本稿では,TSCにおける予測性能と資源消費のバランスを明らかにするための総合評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:19:10 GMT)
Investigation of Automated Design of Quantum Circuits for Imaginary Time Evolution Methods Using Deep Reinforcement Learning [6.2] 本稿では,Double Deep-Q Networks (DDQN) を用いたVITE回路設計のためのフレームワークを提案する。
本稿では,回路構成を多目的問題として扱い,同時にエネルギー期待値の最小化と回路複雑性の最適化を行う。
Max-Cut問題において、我々のエージェントは、標準のハードウェア効率のアンサッツよりも約37%のゲートと43%の深さの回路を自律的に検出した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:17:11 GMT)
Your Agent Is Mine: Measuring Malicious Intermediary Attacks on the LLM Supply Chain [6.1] 大規模言語モデル(LLM)エージェントは、ツール呼び出し要求のディスパッチにサードパーティのAPIルータに依存している。
本研究は,この攻撃面に関する最初の系統的研究である。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:06:41 GMT)
A Longitudinal Study of Dependency Reclassifications in JavaScript Projects [6.1] JavaScriptプロジェクトの開発者が依存関係を再分類する方法について検討する。
依存性の保守を活発に行う33,087のJavaScriptプロジェクトの分析から,依存関係の再分類がメンテナンス活動の主流であることが判明した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:23:38 GMT)
SeLaR: Selective Latent Reasoning in Large Language Models [5.8] CoT(Chain-of-Thought)は、大規模言語モデルにおける推論の基盤となっている。
最近の潜在的推論手法は、離散トークンをソフト埋め込みに置き換えることで、この制限を緩和しようとする。
潜在推論のための軽量かつトレーニング不要なフレームワークであるSeLaRを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:32:07 GMT)
Cards Against LLMs: Benchmarking Humor Alignment in Large Language Models [5.8] ヒューモアは人類のコミュニケーションにおいて最も文化的に埋め込まれ、社会的に重要な次元の1つである。
モデル同士が人間と同意する頻度よりもはるかに頻繁に一致していることが示されています。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:42:49 GMT)
The Sustainability Gap in Robotics: A Large-Scale Survey of Sustainability Awareness in 50,000 Research Articles [5.8] 本研究は2015年から2026年にかけて発行されたarXivのcs.ROカテゴリから5万件近いオープンアクセス論文をカバーしている。
論文が社会、生態、持続可能性に与える影響について言及する頻度を定量化します。
結果は、フィールドのポテンシャルと、その記述された意図の間に永続的なギャップが浮かび上がっていることを示している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:41:49 GMT)
Semantic-Aware UAV Command and Control for Efficient IoT Data Collection [5.7] 無人航空機(UAV)はIoT(Internet of Things)デバイスからのデータ収集のための重要なイネーブラー技術として登場した。
本稿では,UAVコマンド・アンド・コントロール(C&C)とセマンティックコミュニケーションを統合し,IoTデバイスからの効率的な画像データ収集を実現する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:12:58 GMT)
Can Vision Language Models Judge Action Quality? An Empirical Evaluation [5.7] アクション・クオリティ・アセスメント(AQA)は、理学療法、スポーツコーチング、競争力判定に広く応用されている。
Vision Language Models (VLM) は AQA に対してかなりの保証を持っているが、この領域における実際のパフォーマンスは、ほとんど役に立たないままである。
本稿では,活動領域(例えば,フィットネス,フィギュアスケート,ダイビング,タスク,表現,促進戦略)における最先端VLMの総合評価について述べる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:29:19 GMT)
Location Is All You Need: Continuous Spatiotemporal Neural Representations of Earth Observation Data [5.7] 我々は,多時間地球観測(EO)データを連続神経場として興味のある領域にモデル化する座標ベースニューラル表現であるIANetを提案する。
LIANetは、元の衛星データにアクセスすることなく、セマンティックセグメンテーションやピクセルワイズレグレッションなどの様々なEO下流タスクに適応することができる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:53:00 GMT)
Bird-Inspired Spatial Flapping Wing Mechanism via Coupled Linkages with Single Actuator [5.6] 本稿では, 単一モータで駆動する2つの連結空間4バーから鳥に触発された羽ばたき機構について述べる。
3Dプリントしたプロトタイプを組み立ててテストし、意図された空間的なストロークと受動的な折りたたみ動作を示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:44:20 GMT)
Optimal noisy quantum phase estimation with finite-dimensional states [5.6] 粒子損失のノイズについて検討し, このノイズ下での真のOFPSについて検討した。
2段階の計測戦略が提案され、実際の最終的な精度限界を実現する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:30:50 GMT)
On the Decompositionality of Neural Networks [5.5] ニューラルアーキテクチャに対する意味保存抽象化として定義された形式的概念であるニューラル分解性を導入する。
我々の重要な洞察は、分解性はモデルの決定境界に沿った意味的行動の保存によって特徴づけられるべきであるということである。
提案した定義を運用する境界対応フレームワーク SAVED を開発した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:32:24 GMT)
Shift- and stretch-invariant non-negative matrix factorization with an application to brain tissue delineation in emission tomography data [5.5] シフト不変およびストレッチ不変な非負行列分解フレームワークを提案する。
提案手法では,整数と非整数の時間的シフトと時間的ストレッチの両方を推定する。
我々は,脳組織構造のより詳細な解析を行うために,モデルがストレッチを考慮できる合成データと脳発光トモグラフィーデータについて実証した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:22:04 GMT)
Toward Generalizable Graph Learning for 3D Engineering AI: Explainable Workflows for CAE Mode Shape Classification and CFD Field Prediction [5.5] 本稿では、3DエンジニアリングAIのための実践的なグラフ学習フレームワークを提案する。
このフレームワークは、CAE振動モード形状分類とCFD空力場予測という2つの自動車応用で検証されている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:15:17 GMT)
Verify Before You Commit: Towards Faithful Reasoning in LLM Agents via Self-Auditing [5.5] 我々は,行動開始前のエージェントの内部信頼状態に対する検証を行う新しいフレームワークであるtextbfSelf-textbfAudited textbfVerified textbfReasoning (textscSAVeR)を提案する。
当社のアプローチは、競争力のあるエンドタスクのパフォーマンスを維持しながら、推論の忠実さを継続的に改善します。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:01:03 GMT)
Beyond Stochastic Exploration: What Makes Training Data Valuable for Agentic Search [5.5] 本稿では,検索エージェントの性能向上と訓練を目的とした,階層的体験(HiExp)を提案する。
比較分析とマルチレベルクラスタリング機構を通じて経験的知識を抽出し,生の推論軌道を階層的経験知識に変換する。
提案手法は性能向上を実現し,強いクロスタスクとクロスアルゴリズムの一般化を示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:44:44 GMT)
Unified Supervision for Walmarts Sponsored Search Retrieval via Joint Semantic Relevance and Behavioral Engagement Modeling [5.2] 本稿では,ウォルマートが支援するeコマースにおける検索検索のためのバイエンコーダトレーニングフレームワークを提案する。
意味的関連性(semantic Relevance)を主要な監視信号として使用し、関連する項目の優先信号としてのみ使用します。
本手法は,オフライン評価とオンラインABテストの両方において,現在の生産システムより優れている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:49:41 GMT)
Wireless Communication Enhanced Value Decomposition for Multi-Agent Reinforcement Learning [5.2] マルチエージェント強化学習(MARL)における協調は、エージェント間コミュニケーションの恩恵を受ける。
ほとんどのアプローチでは、理想化されたチャネルと、誰と情報を共有することに成功した既存の価値分解手法を前提としています。
CLOVERは、リアルな無線チャネルで実現された通信グラフ上に、集中値ミキサーを条件付けした協調的なMARLフレームワークである。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 19:42:17 GMT)
From Synthesis to Clinical Assistance: A Strategy-Aware Agent Framework for Autism Intervention based on Real Clinical Dataset [5.2] textscASDAgentは、高忠実度介入対話合成と臨床決定支援を統合するために設計された戦略対応フレームワークである。
実際の自閉症介入では、textscASDAgentは人間の専門家と80%近い戦略的整合性を達成する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:28:46 GMT)
When Fine-Tuning Changes the Evidence: Architecture-Dependent Semantic Drift in Chest X-Ray Explanations [5.1] 医用画像分類において, 転帰学習と微調整は, 診断性能が一貫した向上により広く採用されている。
重なり合う視覚的特徴を持つ多クラス設定では、精度の向上は、予測をサポートするために使用される視覚的証拠の安定性を保証するものではない。
我々は,意味的ドリフトを,伝達学習とフル微調整の間のモデルの予測を支援する帰属構造における体系的な変化として定義する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:53:02 GMT)
Quantifying Explanation Consistency: The C-Score Metric for CAM-Based Explainability in Medical Image Classification [5.1] CAM(Class Activation Mapping)法は、医用画像における深層学習分類器の視覚的説明を生成するために広く用いられている。
既存の評価フレームワークは、ラジオロジストアノテーションに対する局所化忠実度を用いて、説明が正しいかどうかを評価する。
Cスコア(Consistency Score, Consistency Score, C-Score, C-Score, C-Score, C-Score, C-Score, C-Score, C-Score)を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:47:31 GMT)
Mitigating the reconstruction-detection trade-off in VAE-based unsupervised anomaly detection [5.1] 我々は,$-VAEモデル間の再構成品質と異常検出のトレードオフを明らかにする。
制約付き遅延空間を持つモデルは、より高い検出基準に達するが、再構築品質は低下する。
本研究では,リコンストラクション検出トレードオフを緩和する2つの方法として,ベータスケジューリングとスパースVAEについて検討する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:00:20 GMT)
The MQT Compiler Collection: A Blueprint for a Future-Proof Quantum-Classical Compilation Framework [4.6] MQT Compiler Collectionは、将来的な量子古典コンパイルフレームワークの青写真である。
本稿では,高レベルアルゴリズムからハードウェア固有の命令までの完全なコンパイルパイプラインをサポートするため,コアMLIRの概念を取り入れたフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:05:10 GMT)
SD-FSMIS: Adapting Stable Diffusion for Few-Shot Medical Image Segmentation [4.6] Few-Shot Medical Image (FSMIS) は、最小限のアノテート例のみを用いて、新しいオブジェクトクラスを医療画像に分割することを目的としている。
SD-FSMISは、FSMISタスクに強力な安定拡散モデルを効果的に適応する新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:56:24 GMT)
An Imperfect Verifier is Good Enough: Learning with Noisy Rewards [4.5] RLVR(Reinforcement Learning with Verifiable Rewards)は,Large Language Models(LLMs)のポストトレーニング方法として注目されている。
RLVRがそのようなノイズに対して頑健である程度と、効果的なトレーニングに必要な検証精度は未解決のままである。
RLトレーニングにノイズを導入することで,コード生成と科学的推論の領域におけるこれらの疑問について検討する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:15:01 GMT)
STQuant: Spatio-Temporal Adaptive Framework for Optimizer Quantization in Large Multimodal Model Training [4.5] 状態のメモリフットプリントを削減する分散トレーニングフレームワークSTQuantを提案する。
GPT-2 と ViT の実験では、STQuant はメモリの劣化を84.4%削減し、平均ビット幅は5.1ビットである。
STQuantはO(N/K)計算オーバーヘッドのみを発生させ、O(1)余剰空間を必要とする。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 02:16:08 GMT)
Sparse $ε$ insensitive zone bounded asymmetric elastic net support vector machines for pattern classification [4.5] 既存のサポートベクターマシン(SVM)モデルはノイズに敏感であり、性能を制限している。
弾性ネット損失とロバスト損失の枠組みを組み合わせることで、$varepsilon非感受性非対称な非対称弾性ネット損失を構築する。
$varepsilon-BAEN-SVMは従来の堅牢なSVMよりも優れています。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:10:20 GMT)
Adapting Foundation Models for Annotation-Efficient Adnexal Mass Segmentation in Cine Images [4.4] 超音波による近接性質量評価は、主観的解釈と重要なサーバ間変動によって妨げられることが多い、困難な臨床課題である。
本稿では,事前訓練されたDINOv3基盤視変換器バックボーンのロバストなセマンティクスを活かしたラベル効率のセグメンテーションフレームワークを提案する。
提案手法は,U-Net,U-Net++,DeepLabV3,MAnetなどの完全教師付きベースラインと比較して,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:48:50 GMT)
ParseBench: A Document Parsing Benchmark for AI Agents [4.4] Parseの出力は、自律的な決定に必要な構造と意味を保存する必要がある。
LlamaParse AgenticはAgenicoverall%で最高スコアを達成している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:59:36 GMT)
Neural-Symbolic Knowledge Tracing: Injecting Educational Knowledge into Deep Learning for Responsible Learner Modelling [4.3] 本稿では,ニューラルシンボリックな深層知識追跡手法であるResponsible-DKTを提案する。
シンボリックな教育知識(例えば、熟達と非熟達規則)を、責任ある学習者モデリングのためのシーケンシャルなニューラルモデルに統合する。
学生の数学相互作用の現実的なデータセットの実験により、Responsible-DKTは、ニューラルシンボリックベースラインと完全にデータ駆動のPyTorch DKTモデルの両方より優れていることが示された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:49:07 GMT)
DinoRADE: Full Spectral Radar-Camera Fusion with Vision Foundation Model Features for Multi-class Object Detection in Adverse Weather [4.2] DinoRADEは、高密度なRadarテンソルを処理し、カメラパースペクティブで変換された参照ポイントの周りに視覚的特徴を集約するRadar中心検出パイプラインである。
我々は,全気象条件におけるK-Radarデータセットの総合的な性能評価を行い,検出性能を5つのクラスで個別に報告した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:46:41 GMT)
TOOLCAD: Exploring Tool-Using Large Language Models in Text-to-CAD Generation with Reinforcement Learning [4.1] 大規模言語モデル(LLM)は、言語エージェントが現実世界のタスクに対処できるように、顕著な進歩を見せている。
テキスト・ツー・CAD生成のためのツール・ユース・エージェントとしてLLMをデプロイする新しいエージェントCADフレームワークであるToolCADを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:22:46 GMT)
Security Concerns in Generative AI Coding Assistants: Insights from Online Discussions on GitHub Copilot [4.1] この研究は、GenAIベースのコーディングアシスタントの使用に関するセキュリティ上の懸念について調査する。
私たちは3つの人気のあるプラットフォームから、GitHub Copilotのセキュリティ問題に対処する投稿、コメント、ディスカッションスレッドを検索しました。
潜在的なデータ漏洩、コードライセンシング、敵攻撃(即発注入など)、安全でないコード提案を含む4つの主要な関心領域が特定された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:19:10 GMT)
Vulnerability Detection with Interprocedural Context in Multiple Languages: Assessing Effectiveness and Cost of Modern LLMs [4.1] 大規模言語モデル(LLM)は、自動脆弱性検出のための有望な方法である。
本研究では,相互依存関係に関連する脆弱性の検出における検出の有効性,推論コスト,説明の質について検討した。
その結果、Gemini 3 FlashはCの脆弱性に対して最もコスト効率の良いトレードオフを提供することがわかった。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:17:58 GMT)
Towards Improving the External Validity of Software Engineering Experiments with Transportability Methods [3.9] 本稿では,輸送性手法とその前提条件について紹介し,シミュレーションによりその可能性を実証する。
次に、これらの手法が適用可能ないくつかのSE研究シナリオについて概説する。
最後に,SE研究者を支援するための道路地図と実践的ガイドラインについて概説する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:57:26 GMT)
Lessons Without Borders? Evaluating Cultural Alignment of LLMs Using Multilingual Story Moral Generation [3.8] 新たな文化的基盤評価課題として多言語物語モラル生成を導入する。
14の言語と文化のペアにまたがって収集された人間による物語のモラルのデータセットを用いて、モデル出力と人間の解釈を比較した。
我々は,フロンティアモデルが人間の反応と意味的に類似し,人間の評価者が好むストーリーモラルを生成することを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 22:13:24 GMT)
On the Unique Recovery of Transport Maps and Vector Fields from Finite Measure-Valued Data [3.6] 有限測度値データからベクトル場と輸送マップのユニークな回復を保証する。
特に、微分同相写像が有限個の密度上のプッシュフォワード作用から一意に特定できる一般条件を提供する。
我々は, 連続性, 対流, フォッカー-プランク, 対流-拡散-反作用方程式に関連するある種のPDE逆問題に対して, 新たな保証を与える方法を示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:26:30 GMT)
HistDiT: A Structure-Aware Latent Conditional Diffusion Model for High-Fidelity Virtual Staining in Histopathology [3.5] HistDiTアーキテクチャは、仮想組織学的染色における視覚的忠実性の新たなベンチマークを確立する。
本モデルでは,厳密な定量的および定性的評価により,既存のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:39:37 GMT)
Human-AI Collaboration Reconfigures Group Regulation from Socially Shared to Hybrid Co-Regulation [3.5] ジェネレーティブAI(GenAI)は、コラボレーション学習でますます使われているが、グループによるコラボレーションの規制方法への影響はいまだ不明である。
並列群ランダム化実験において,Human-AIグループとHuman-Humanグループ間の協調的規制を比較した。
その結果、GenAIの可用性は、主に社会的に共有される形式から、よりハイブリッドな共規制形式へと規制を移行した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:15:32 GMT)
EfficientSign: An Attention-Enhanced Lightweight Architecture for Indian Sign Language Recognition [3.5] 我々は、EfficientNet-B0を採用し、2つの注目モジュールに焦点を当てた軽量モデルを構築します。
インド手話アルファベットの12,637の画像を、他の5つのアプローチと比較した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:27:57 GMT)
ParkSense: Where Should a Delivery Driver Park? Leveraging Idle AV Compute and Vision-Language Models [3.3] ParkSenseは、アイドル計算を再利用して、事前キャッシュされた衛星とストリートビューの画像上でビジョン・ランゲージ・モデル(VLM)を実行するフレームワークである。
本研究では,HW4クラスのハードウェア上で,量子化された7B VLMが4~8秒で推論を完了することを示し,Delivery-Aware Precision Parking問題を定式化する。
この未調査の自動運転、コンピュータビジョン、ラストマイルロジスティクスの交差点で、5つのオープンな研究方向が特定されている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:28:57 GMT)
On-Policy Distillation of Language Models for Autonomous Vehicle Motion Planning [3.3] 大型言語モデル(LLM)は、最近、自動運転車の運動計画に強い可能性を実証している。
本研究では,大規模LLMからより小さく,より展開可能な学生モデルへ,運動計画の知識を効果的に伝達する方法について検討する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:06:19 GMT)
Formalizing building-up constructions of self-dual codes through isotropic lines in Lean [3.3] キムの双対自己双対符号構築はチンブルグ=張のヒルベルト記号構築と等価であることを示す。
次に、q$の自己双対符号を効率的に構築するために、Chenburg-Zhang の構成の$q$ary版を紹介します。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:27:46 GMT)
PRAGMA: Revolut Foundation Model [3.2] PRAGMAは、マルチソースバンキングイベントシーケンスの基礎モデルのファミリーである。
クレジットスコアリング、不正検出、ライフタイムバリュー予測など、幅広いダウンストリームタスクをサポートする。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:00:00 GMT)
Reset-Free Reinforcement Learning for Real-World Agile Driving: An Empirical Study [3.0] 本稿では,実世界のアジャイル運転におけるリセットフリー強化学習(RL)の実証的研究について述べる。
モデル予測経路積分制御(MPPI)をリセットポリシーと残差学習の基本ポリシーの両方に採用する。
残差学習を持つSACはシミュレーションの最も高いリターンを達成するが、TD-MPC2のみが物理プラットフォーム上のMPPIベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:28:54 GMT)
The Impact of Dimensionality on the Stability of Node Embeddings [2.9] ノード埋め込みの寸法変化が,その安定性と下流性能に与える影響について検討する。
我々は、ASNE、DGI、GraphSAGE、node2vec、VERSEの5つの広く使われている手法を評価した。
実験の結果, 埋込安定性は次元によって大きく異なるが, 検討対象の方法によって異なるパターンが観察されることがわかった。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:33:02 GMT)
Weak Adversarial Neural Pushforward Method for the Wigner Transport Equation [2.6] 我々は、Wak Adversarial Neural Pushforward Methodを量子系の位相空間力学を規定するウィグナー輸送方程式に拡張する。
本稿では,学習可能な重みを混合した2つの非負位相空間分布に解を分解する,符号付きプッシュフォワードアーキテクチャを提案する。
結果として得られた方法は、メッシュフリーでヤコビアンフリーでスケーラブルなオリジナルのフレームワーク特性を継承し、それを量子設定に拡張する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:58:15 GMT)
Navigating Turbulence: The Challenge of Inclusive Innovation in the U.S.-China AI Race [2.6] 本章では、米国と中国の地政学的対立が人工知能(AI)開発における包括的イノベーションの展望に与える影響について考察する。
我々は、データプライバシー、知的財産権(IP権利)、輸出制限という、AIイノベーションに大きな影響を及ぼす米国と中国の法律基盤の3つの重要な側面を探求する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:19:40 GMT)
A Machine Learning Framework for Turbofan Health Estimation via Inverse Problem Formulation [2.4] ターボファンエンジンの健康状態を推定することは、スパースセンシングと複雑な非線形熱力学によって妨げられる、難しい逆問題である。
本研究は, リアルな劣化・維持パターン下での運転センサデータから, コンポーネントレベルの健康指標を回収する方法を検討する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:56:37 GMT)
Mitigating Distribution Sharpening in Math RLVR via Distribution-Aligned Hint Synthesis and Backward Hint Annealing [2.4] 検証可能な報酬(RLVR)による強化学習は、難解な数学問題に対する解のカバレッジを狭めながら、推論精度を低コストで向上させることができる。
既存のヒントベースのアプローチは、挑戦的な質問をトレーニング可能にするが、2つの問題が未解決のまま残されている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:08:41 GMT)
Needle in a Haystack -- One-Class Representation Learning for Detecting Rare Malignant Cells in Computational Cytology [2.3] 悪性細胞は形態学的に多様であるが、正常な細胞の広大な背景の中で消失する。
ワンクラスの表現学習技術は、低知能率のシナリオで悪性細胞を検出することができる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 02:13:29 GMT)
Agentivism: a learning theory for the age of artificial intelligence [2.3] 生成的かつエージェント的なAIは、学習者が認知作業を生成、推薦、時には学習者に代わって行動できるシステムに委譲することを可能にして、新しい条件を作成する。
このことは、学習理論の根本的な課題を生み出します。
本稿では,人間-AIインタラクションの学習理論であるAgentivismを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:09:48 GMT)
Trotterization with Many-body Coulomb Interactions: Convergence for General Initial Conditions and State-Dependent Improvements [2.2] クーロン相互作用による多体量子システムを効率的にシミュレートすることは、量子物理学、量子化学、量子コンピューティングにおいて基本的な問題である。
本研究では,クーロン相互作用を持つ多体量子系に適用したトロッターの厳密な誤差境界を確立する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 01:47:15 GMT)
Empirical Evaluation of Taxonomic Trace Links: A Case Study [2.2] トレーサビリティは、知識集約的なタスクで使用されるアーティファクトの重要な品質特性である。
その明確な利点にもかかわらず、トレーサビリティは実際には無視されることが多い。
分類学的トレースリンクアプローチは、ソースとターゲットのアーティファクトをドメイン固有の分類によって接続する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:08:02 GMT)
Investigation of coherence of niobium-based resonators enabled by a fast-sealing microwave cavity [2.2] 酸化物除去後5分以内に真空下に置くことができる高速シール型マイクロ波空洞を開発した。
このような空洞に密封された装置は、単光子パワーで100万を超える内部品質因子を示す。
高速シールマイクロ波空洞は,MA界面の損失を低減し,Nbデバイスにおける高コヒーレンスを維持するための実用的で一貫した手法を提供する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 23:07:47 GMT)
Grounding Clinical AI Competency in Human Cognition Through the Clinical World Model and Skill-Mix Framework [2.0] 本稿では,三者間相互作用としてケアを形式化する臨床世界モデルを紹介する。
我々は、提供者、患者、AIエージェントのための並列意思決定アーキテクチャを開発する。
このフレームワークは、臨床AIをステークホルダー間で特定、評価、バウンドできる共通の文法を提供する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:20:13 GMT)
A unifying view of contrastive learning, importance sampling, and bridge sampling for energy-based models [1.9] ノイズコントラスト推定(NCE)、逆ロジスティック回帰(RLR)、多重重要サンプリング(MIS)、橋梁サンプリングを接続する統合フレームワークを提供する。
この統合された視点は、既存の手法間の関係を明確にし、新しい推定器の開発を可能にする。
本研究は、その柔軟性と堅牢性の観点からNCEの成功を解明し、その性能をさらに改善できるシナリオを特定するのに役立つ。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:36:04 GMT)
Smartwatch-Based Sitting Time Estimation in Real-World Office Settings [1.8] 摂食行動は、肥満、心血管疾患、その他の慢性疾患と強く結びついており、公衆衛生上の大きなリスクをもたらす。
本研究は,スマートウォッチの慣性測定ユニット(IMU)からの信号が,日々の作業中にオフィスワーカーから収集される,現実的なオフィス設定の問題に対処するものである。
運動力学の新たな表現として,オイラー角から導かれる回転ベクトル列を導入して,IMU信号から着座時間を推定する手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 22:48:11 GMT)
Dual Quantum Geometric Tensors and Local Topological Invariant [1.8] ゼーマン QGT は一般の非エルミート的であり、正規および異常な計量曲率セクターへの自然な分解を認めていることを示す。
その結果、非エルミートゼーマン量子幾何学、局所ディラックノード位相、測定可能な輸送シグネチャを結合する統一的な枠組みが確立された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:00:50 GMT)
Quantum Vision Theory Applied to Audio Classification for Deepfake Speech Detection [1.8] 深層学習に基づく音声分類の新しい視点として量子ビジョン(QV)理論を提案する。
量子物理学における粒子-波の双対性から着想を得たQV理論は、データは観測可能で崩壊した形だけでなく、情報波としても表現できるという考えに基づいている。
QV理論では、入力はまずQVブロックを使用して情報波に変換され、次に分類のためのディープラーニングモデルに入力される。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:22:40 GMT)
Co-design for Trustworthy AI: An Interpretable and Explainable Tool for Type 2 Diabetes Prediction Using Genomic Polygenic Risk Scores [1.7] ポリジェニックリスクスコア(PRS)は、複雑な特徴や臨床疾患への遺伝的前置を定量化する重要な手法として登場した。
しかし、PSSの現在の制限の一つは、解釈可能性ツールの欠如である。
このユースケースは、学んだ倫理的、法的、技術的教訓の包括的セットから構成される。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:14:34 GMT)
Tree-of-Evidence: Efficient "System 2" Search for Faithful Multimodal Grounding [1.6] Inference-time search algorithm that frames interpretability as a individual optimization problem。
ToEは、粗いグループまたはデータの単位をスコアする軽量なEvidence Bottleneckを採用し、モデルの予測を再現するために必要なコンパクトなエビデンスを特定するためにビームサーチを実行する。
スパースエビデンス予算の下では、ToEは他のアプローチよりも高い決定合意と低い確率忠実度誤差を達成する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 01:28:14 GMT)
An Eye for Trust: An Exploration of Developers' Trust Perceptions Through Urgency and Reputation [1.6] この研究は、緊急性と評判が開発者のコードの信頼性に対する認識にどのように影響するかを考察する。
コードパッチに割り当てられた優先度は,開発者のコードレビュー行動に大きく影響した。
コードレビューの行動に顕著な変化があったにも関わらず、私たちの参加者は、コード変更のレビューと再利用に関する決定に対して、緊急性と評価の実質的な影響を、驚くほど見落としていました。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 19:05:27 GMT)
Geometry-Induced Long-Range Correlations in Recurrent Neural Network Quantum States [1.5] 自己回帰リカレントニューラルネットワーク(RNN)波動関数に基づくニューラル量子状態は、マルコフ連鎖の自己相関なしに効率的なサンプリングを可能にする。
標準RNNアーキテクチャは有限長の相関に偏りがあり、長距離依存のある状態では失敗する可能性がある。
本稿では、拡張されたRNN波動関数を導入し、リカレントユニットが拡張された接続を介して遠隔地にアクセスする。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:00:04 GMT)
Multi-Agent Orchestration for High-Throughput Materials Screening on a Leadership-Class System [1.5] 大規模言語モデル(LLM)は、自律的な意思決定において重要な役割を果たす。
我々は,高スループットスクリーニングキャンペーンを編成するスケーラブルで階層的なマルチエージェントフレームワークを提案する。
提案するエージェントフレームワークは,Auroraスーパーコンピュータ上での効率的かつスケーラブルな実行を可能にする。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 01:01:11 GMT)
Artifacts as Memory Beyond the Agent Boundary [1.4] 環境がエージェントのメモリとして機能することを示します。
エージェントが空間的経路を観察すると,パフォーマンスポリシーを学習するのに要するメモリ量が減少することを示す。
この課題に関するさらなる研究は、明示的な内部記憶の代用として環境を活用するための原則的な方法を明らかにすることを期待する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:39:59 GMT)
PriPG-RL: Privileged Planner-Guided Reinforcement Learning for Partially Observable Systems with Anytime-Feasible MPC [1.4] 計画エージェントが学習エージェントを誘導する部分観測可能なマルコフ決定過程(POMDP)を定式化する。
本研究では,P2P-SAC(Planner-to-Policy Soft Actor-Critic)を提案する。
NVIDIA Isaac Labを使ってシミュレーションでアプローチを検証するとともに、現実のUnitree Go2で複雑な障害物の多い環境にデプロイすることに成功しました。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:41:11 GMT)
More Capable, Less Cooperative? When LLMs Fail At Zero-Cost Collaboration [1.4] 我々は、摩擦のない環境下での協調行動について研究し、協力から全ての戦略的複雑さを取り除く。
私たちは、協力の失敗と能力の失敗を分離し、エージェント推論分析を通じてその起源を追跡します。
この結果から,マルチエージェントシステムにおける協調問題の解決は,インテリジェンスのスケーリングだけでは不可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:24:27 GMT)
The Detection-Extraction Gap: Models Know the Answer Before They Can Say It [1.4] 部分的な接頭辞から解答が回復した後に連鎖トークンが生成されることを示す。
早期接頭辞からの無料継続は、10%のトレースでも正しい回答を回復するが、強制抽出はこれらのケースの42%で失敗する。
検出と抽出の両方に自由継続を利用するブラックボックス適応早期退避(BAEE)を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:43:28 GMT)
Selective Attention System (SAS): Device-Addressed Speech Detection for Real-Time On-Device Voice AI [1.4] 時間的曖昧な発話を伴うマルチ話者環境において、このタスクは発話局所分類タスクよりも、対話履歴よりも逐次ルーティング問題として効果的にモデル化されていることを示す。
本稿では,これをSDAR(Sequential Device-Addressed Routing)として定式化し,この定式化をインスタンス化するデバイス上でのSelective Attention System(SAS)を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:11:15 GMT)
Floquet Engineering of a Quasiequilibrium Superradiant Phase Transition in Landau Polaritons [1.3] 超ラジアント相転移(SRPTs)は、光子凝縮とマクロ物質分極によって特徴づけられる。
直流磁場中におけるテラヘルツ空洞に結合した2次元電子ガスからなるランダウ偏光子系において、フロケ駆動によりこの制約を回避することができることを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:06:42 GMT)
Object-Centric Stereo Ranging for Autonomous Driving: From Dense Disparity to Census-Based Template Matching [1.3] 従来の高密度ステレオマッチング法はピクセルごとの不均一マップを生成するが、高い計算コスト、ステレオカメラ間のラジオメトリック差への感度、不均一値が小さい長距離での精度の低下に悩まされている。
本稿では,3つの相補的な深度推定手法を統合した総合ステレオ測位システムを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:51:42 GMT)
State and Trajectory Estimation of Tensegrity Robots via Factor Graphs and Chebyshev Polynomials [1.2] テンセグリティロボットはコンプライアンスと適応性を提供するが、非線形で制約の少ないダイナミクスは、状態推定を困難にしている。
本稿では,ケーブル駆動型引張ロボットのロバストな状態や軌道推定のための2段階のアプローチを提案する。
オンライン状態推定には、RGB-Dカメラとオンボードケーブル長センサを融合するファクタグラフベースの手法を導入する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:38:47 GMT)
Divide et impera: hybrid multinomial classifiers from quantum binary models [1.2] 1-vs-one、ワン-vs-rest、バイナリ決定ツリーといった戦略を採用して、ハイブリッドなアプローチを採用しています。
決定木はコスト効率のよい解であり,クラス総数において最大対数的なオーバーヘッドを持つ他の手法と類似の精度を達成できることを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:09:27 GMT)
FireSenseNet: A Dual-Branch CNN with Cross-Attentive Feature Interaction for Next-Day Wildfire Spread Prediction [1.1] 次回の山火事拡大の正確な予測は、災害対応と資源配分に不可欠である。
本稿では,新しい相互干渉モジュールを備えた二分岐畳み込みニューラルネットワークFireSenseNetを提案する。
我々は、FireSenseNetがF1の0.4176とAUC-PRの0.3435を達成し、すべての代替品を上回っていることを示した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:39:03 GMT)
Harnessing dark states: coherent control in coupled cavity-Rydberg-atom systems [1.1] 共役キャビティ-ライドバーグ-原子系における暗黒状態効果について検討した。
我々の研究は、ダークステート物理学とキャビティ-ライドバーグ-原子プラットフォームにおける応用の道を開いた。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:21:23 GMT)
ProMedical: Hierarchical Fine-Grained Criteria Modeling for Medical LLM Alignment via Explicit Injection [1.1] 本稿では,詳細な臨床基準に基づく統合アライメントフレームワークであるProMedicalを紹介する。
最初にProMedical-Preference-50kを構築した。
従来のスカラー報酬モデルとは異なり、我々のアプローチは安全制約を一般の熟練度から明確に切り離す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:57:33 GMT)
Frequency resolved optical gating using parametric amplification for characterizing ultrafast temporally multimode squeezed states [1.0] 超高速マルチモード圧縮状態の複雑な時間モード形状と2次分散を同時に再現するキャラクタリゼーション手法を提案する。
このスキームは任意の時間モードの形状を計測し、大規模超高速ガウス量子状態を特徴づけるための実用的な実験的アプローチを提供する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 19:12:21 GMT)
Automatic Generation of Executable BPMN Models from Medical Guidelines [1.0] 我々は、医療政策文書を実行可能なデータ対応ビジネスプロセスモデルと表記(BPMN)モデルに変換するエンドツーエンドパイプラインを提示します。
自動修正によるデータ基底BPMN生成、実行可能拡張、曖昧な計測、エントロピーに基づく不確実性検出の4つのコントリビューションで、自動ポリシのデジタル化の主な課題に対処する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:16:04 GMT)
Blockchain and AI: Securing Intelligent Networks for the Future [0.9] 本稿では,再利用可能な3つのコントリビューションを通じて地域を合成する。
この論文は、セキュアで透明でレジリエントなインテリジェントネットワークを設計する研究者や実践者の参考として意図されている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:31:16 GMT)
CivBench: Progress-Based Evaluation for LLMs' Strategic Decision-Making in Civilization V [0.9] マルチプレイヤーCivilization VにおけるLSMストラテジスト(エージェント設定)のベンチマークであるCivBenchを紹介する。
CivBenchはターンレベルゲーム状態のモデルをトレーニングし、プレイ全体を通して勝利確率を推定し、予測、構成、収束妥当性を通じて検証する。
我々は,不飽和ベンチマークとして戦略能力を推定するCivBenchの可能性を実証し,エージェント設定のモデル固有の効果を明らかにするとともに,結果のみの評価では見えない異なる戦略プロファイルを概説する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 02:29:20 GMT)
Mathematical analysis of one-layer neural network with fixed biases, a new activation function and other observations [0.9] 我々は、ReLU活性化関数と固定バイアスを持つ単純な一層ニューラルネットワークを解析する。
学習過程の収束を$L2$2$の2乗損失関数と勾配降下法で厳密に証明する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 01:58:51 GMT)
Preventing Overfitting in Deep Image Prior for Hyperspectral Image Denoising [0.8] 本稿では,DIPに基づくハイパースペクトル画像(HSI)において,頑健なデータ忠実度と明示的な感度正則化を併用することにより,過度適合を緩和する手法を提案する。
ガウス,スパース,ノイズによって劣化した実HSIの実験結果から,提案手法が過度な適合を効果的に防止し,優れた騒音性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:02:34 GMT)
Bag of Bags: Adaptive Visual Vocabularies for Genizah Join Image Retrieval [0.8] Bag of Bags (BoB) は、古典的なBag of Words (BoW) のグローバルレベルのビジュアルコードブックを、局所的なビジュアルワードの断片的な固有語彙に置き換えた画像レベルの表現である。
パイプラインは、二項化フラグメントパッチ上でスパース畳み込みオートエンコーダをトレーニングし、各ページから接続されたコンポーネントをエンコードし、その結果の埋め込みをイメージあたり$k$-meansでクラスタ化し、セットを使用して画像を比較して、ローカル語彙間の距離を設定する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:55:34 GMT)
Evaluating the performance of a weak-field homodyne receiver in quadrature phase-shift keying optical communication [0.8] 量子通信プロトコルは、送信者と受信者の間の情報転送率を最大化するために効率的な検出スキームを必要とする。
我々は、既に存在する受信機に対する有効な代替手段として、波状および粒子状の特徴を融合した弱電界受信機が考えられることを実証した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:32:51 GMT)
Dead Weights, Live Signals: Feedforward Graphs of Frozen Language Models [0.7] 本稿では,異種凍結型大規模言語モデルが計算ノードとして機能するフィードフォワードグラフアーキテクチャを提案する。
約12Bの凍結に対する訓練可能なパラメータは17.6Mしかなく、ARC-Challengeでは87.3%、OpenBookQAでは82.8%、MMLUでは67.2%である。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:07:44 GMT)
Test-Oriented Programming: rethinking coding for the GenAI era [0.7] 大規模言語モデル(LLM)は、ソフトウェアコードを生成する驚くべき能力を示しており、プログラミングの開発者をサポートするために使われるようになった。
LLMは、テスト指向プログラミング(ToP)と呼ばれる新しいパラダイムである、より高いレベルの抽象化を可能にすることができる、と私たちは論じています。
このパラダイム内では、開発者は本番コードではなく、自然言語仕様に基づいて生成されたテストコードのみをチェックする必要がある。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:21:28 GMT)
Training Data Size Sensitivity in Unsupervised Rhyme Recognition [0.7] 韻律は知覚的に直観的であり、歴史的に韻律であるかどうか、学者は韻律の分類に苦慮し、2つの単語が韻律であるかどうかに意見が一致しない。
本稿では,RhymeTaggerを用いた信頼できない韻律認識に必要なトレーニングデータ量について検討する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:17:28 GMT)
Small-scale photonic Kolmogorov-Arnold networks using standard telecom nonlinear modules [0.6] フォトニックニューラルネットワークは超高速な推論を約束するが、ほとんどのアーキテクチャは電子的非線形性を持つ線形光学メッシュに依存している。
ここでは、標準電気通信コンポーネントで完全に実装された小規模フォトニックKolmogorov-Arnoldネットワーク(SSP-KAN)を紹介する。
少数の光学モジュールからなるSSP-KANは、分類、回帰、画像認識タスク間で強い非線形推論性能を達成する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:34:58 GMT)
Tokalator: A Context Engineering Toolkit for Artificial Intelligence Coding Assistants [0.6] Tokalatorは、リアルタイム予算監視を備えたVS Code拡張を含むオープンソースのコンテキストエンジニアリングツールキットである。
このシステムは、3つのプロバイダ(Anthropic、OpenAI、Google)にわたる17のLarge Language Model(LLM)をサポートし、124のユニットテストによって検証されている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:27:02 GMT)
TADP-RME: A Trust-Adaptive Differential Privacy Framework for Enhancing Reliability of Data-Driven Systems [0.6] 本稿では,TADP-RME(Trust-Adaptive Differential Privacy with Reverse Manifold Embedding)を提案する。
プライバシーとユーティリティのトレードオフを改善し、攻撃の成功率を3.1%まで下げる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:32:57 GMT)
Accurate and Reliable Uncertainty Estimates for Deterministic Predictions Extensions to Under and Overpredictions [0.6] 我々はACCurate and Reliable Uncertainty Estimate (ACCRUE)フレームワークを拡張し、入力依存の非ガウスの不確実性分布を学習する。
提案手法は,入力依存の不確実性構造を捕捉し,既存手法と比較して確率的予測を改善する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:39:46 GMT)
A Model Context Protocol Server for Quantum Execution in Hybrid Quantum-HPC Environments [0.5] 量子アルゴリズムの実行には、コードを生成し、複雑な計算資源を管理する必要がある。
本稿では,モデルコンテキストプロトコルサーバの実装を通じて,この実行ギャップを埋めるように設計されたAI駆動フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:50:56 GMT)
Towards Rapid Constitutive Model Discovery from Multi-Modal Data: Physics Augmented Finite Element Model Updating (paFEMU) [0.3] 本稿では,AIを用いたモデリング,解釈可能なモデル発見のためのスペーサー化,有限要素ベース拡張を組み合わせた移動学習手法として,物理拡張有限要素モデル更新(paFEMU)を導入する。
これは、デジタル画像相関型フルフィールドデータ取得と、おそらく別の材料から得られる単純な機械的テストデータを組み合わせることで達成される。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:08:07 GMT)
RS-OVC: Open-Vocabulary Counting for Remote-Sensing Data [0.3] リモートセンシングと空中画像のための最初のオープン語彙カウント(OVC)モデルであるRS-OVCを提案する。
また,本モデルでは,テキストや視覚条件のみに基づいて,トレーニング中に見つからなかった新しいオブジェクトクラスの正確なカウントを行うことができることを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:52:33 GMT)
Memory Wall is not gone: A Critical Outlook on Memory Architecture in Digital Neuromorphic Computing [0.3] 記憶機構の再評価がなければ、デジタルニューロモルフィックプロセッサはエッジや組み込みアプリケーションで効果的に競合するのに苦労するかもしれない、と我々は主張する。
ニューロモルフィックシステムにおけるオンチップメモリの限界を克服するための今後の研究の道筋として,我々は結論付けている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 21:23:48 GMT)
The Cartesian Cut in Agentic AI [0.3] 中心的な設計レバーは、制御がこれらのシステムに存在する場所である、と我々は主張する。
脳は、アクションの結果によって調整された階層化されたフィードバックコントローラ内に予測を埋め込む。
我々は、自律性、堅牢性、監視のトレードオフを制御するための対照的なアプローチとして、有界サービス、カルテ人エージェント、統合エージェントを概説した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:03:06 GMT)
Generative optimal transport via forward-backward HJB matching [0.2] 乱れた参照状態から構造化された目標アンサンブルへの多体系の進化を制御することは、非平衡統計力学と制御において自然に起こる。
本稿では,経路空間自由エネルギー,リスク感応制御,空間コスト幾何学の観点から,物理的に解釈可能な輸送記述を提供する枠組みを提案する。
我々の結果は、最適制御、シュルディンガー橋理論、非平衡統計力学の統一的な接続を確立する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:31:25 GMT)
An Agentic Evaluation Architecture for Historical Bias Detection in Educational Textbooks [0.2] 歴史教科書には、しばしば暗黙の偏見、ナショナリストのフレーミング、大規模な監査が難しい選択的な省略が含まれている。
本稿では,マルチモーダルスクリーニングエージェント,5つの評価エージェントからなる異種陪審,および評価合成と人間のエスカレーションのためのメタエージェントからなるエージェント評価アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:51:32 GMT)
Classical and Quantum Dynamics in an Information Theoretic Space [0.2] ベルヌーイ確率変数に対応する情報幾何学空間における古典的および量子力学について検討する。
我々は、バネ質量系の情報理論アナログを研究するゲールとグリフィンの研究を拡張した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 19:09:36 GMT)
Adversarial Sensor Errors for Safe and Robust Wind Turbine Fleet Control [0.1] プラントレベルの制御は、チャンスと挑戦を示す新しい風力エネルギー技術である。
測定エラーがプロセスに干渉するリスクや、中央コントローラから受信したテレメトリ信号をハッカーが変更するリスクがある。
本報告では, 環境に配慮した対向エージェントを用いて, 安全なプラント制御装置を開発するための枠組みについて述べる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:26:31 GMT)
How Much LLM Does a Self-Revising Agent Actually Need? [0.1] 我々は,エージェントの状態,信頼信号,保護された動作,仮説的遷移を検査可能なランタイム構造に外部化する,宣言された反射型ランタイムプロトコルを導入する。
54ゲームで4つの段階的に構造化されたエージェントを用いて,ノイズの多い協調戦闘艦上での評価を行った。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:07:15 GMT)
Every Little Thing Heat Does Is Magic [0.1] エネルギーと熱測定のみに依存する2つの熱力学的な証人を紹介します。
我々は熱アンシラとの熱交換に基づく非線形証人を開発する。
いくつかの例を通して,本手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:00:04 GMT)
AtlasOCR: Building the First Open-Source Darija OCR Model with Vision Language Models [0.1] モロッコのアラビア方言であるダリヤは視覚コンテンツに富んでいるが、特殊な光学文字認識(OCR)ツールが欠けている。
本稿では,3Bパラメータビジョン言語モデル(VLM)を微調整して構築した,最初のオープンソースDarija OCRモデルであるAtlasOCRを紹介する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 10:38:23 GMT)
Robust Multi-Objective Optimization for Bicycle Rebalancing in Shared Mobility Systems [0.1] ドックベースの自転車シェアリングシステムは、自転車の供給とユーザー需要の空間的不均衡を示す。
本研究は、三目的最適化問題としてモデル化された需要不確実性の下での静的な一晩的再バランスについて研究する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:30:59 GMT)
Beyond Social Pressure: Benchmarking Epistemic Attack in Large Language Models [0.1] テクテテプステミック・アタックの評価のための診断ベンチマークを開発した。
知識、価値、アイデンティティの正当性に対して、単に前の答えに反対するのではなく、挑戦する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:14:30 GMT)
AgriChain Visually Grounded Expert Verified Reasoning for Interpretable Agricultural Vision Language Models [0.1] 我々はAgriChainを紹介した。AgriChainは、多種多様な作物と病理にまたがる約11,000の専門家による葉のイメージのデータセットである。
我々は、AgriChainにQwen2.5-VL-3Bを微調整し、AgriChain-VL3Bと呼ばれる特殊なモデルを作成し、病気を共同で予測し、視覚的に座屈した推論を生成する。
1000イメージのテストセットでは、CoTが監督するモデルが73.1%のTop-1精度(macro F1 = 0.466; weighted F1 = 0.655)を達成し、Gemini 1.5 Flash、Gemini 2.5 Pro、GPT-4o Miniなどの強力なベースラインを上回りました。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:13:37 GMT)
Ensembles at Any Cost? Accuracy-Energy Trade-offs in Recommender Systems [0.1] 本稿では,強い単一モデルに対するアンサンブル手法のエネルギートレードオフを精度良く測定する。
10万から780万のインタラクションの4つのデータセットを評価します。
セッティング全体では、アンサンブルの精度は0.3%から5.7%向上し、エネルギーは19%増の2,549%向上した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:33:19 GMT)
Asynchronous Quantum Distributed Computing: Causality, Snapshots, and Global Operations [0.1] 我々は、量子システムのコンポーネントに原子量子大域演算を実装する場合に焦点を当てる。
量子分散アルゴリズムを設計し,これをQGOアルゴリズムと呼ぶ。
その他のコントリビューションには、量子分散コンピューティングの形式モデルと、グローバルなオペレーションの望ましい振る舞いに関する正式な仕様が含まれています。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:31:50 GMT)
We Need Strong Preconditions For Using Simulations In Policy [0.0] 個人または集団レベルの人間の行動の正確なモデルの二重利用可能性と、シミュレーション出力を検証するのが困難である。
社会規模LLMエージェントシミュレーションの3つの前提条件を提案し,議論する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:39:35 GMT)
VOLTA: The Surprising Ineffectiveness of Auxiliary Losses for Calibrated Deep Learning [0.0] 不確実性定量化(UQ)は、ディープラーニングモデルを安全クリティカルなアプリケーションにデプロイするために不可欠である。
異なるデータモダリティや分散シフトに対して、UQ法が最善を尽くすコンセンサスはない。
本稿では,MC Dropout, SWAG, アンサンブル法, 温度スケーリング, エネルギーベースOOD, マハラノビス, 双曲型分類器, ENN, Taylor Sensus, スプリット共形予測を含む10種類のUQベースラインのベンチマークを示す。
以上の結果から,VOLTAはより複雑なUQアプローチに代わる,軽量で決定論的かつ十分に校正された代替手段として確立された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:22:36 GMT)
VCAO: Verifier-Centered Agentic Orchestration for Strategic OS Vulnerability Discovery [0.0] ベイジアン・スタックルバーグ検索ゲームとしてのオペレーティングシステム脆弱性発見の定式化
textscVCAO (textbfVerifier-textbfC enter textbfAgentic textbfOrchestration), 表面マッピング, カーネル内攻撃グラフ構築, ゲーム理論ファイル/機能ランキング, 並列実行エージェント, カスケード検証, 安全管理者を含む6層アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:27:10 GMT)
Tunable information insulation induced by constraint mismatch [0.0] 双対制約を持つ2つのD$PXP$チェーンの合成モデルについて検討する。
複数の凍ったジャンクションがヒルベルト空間を破砕し、不連結なクリロフの破片となった。
機械的に保護されたゼロエネルギーモードは、物理的端とジャンクション部位の近くのバルクに局所的なピークを持つことができる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:03:54 GMT)
Training Transformers in Cosine Coefficient Space [0.0] キャラクターレベルのシェイクスピアのスクラッチから訓練されたトランスフォーマーは、検証損失が1.604$で$K = mn/2$に達した。
同じトレーニング可能なパラメータ数でのランク48のLoRA分解は、わずか1.801$である。
ランダムな正規直交基底はノイズ中のDCTを$K = mn/2$で一致させ、$K = mn/10$と$K = mn/20$で圧縮すると、高階行列をホストできる部分空間が損失を低く保つことを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:32:05 GMT)
Towards Generalizable Representations of Mathematical Strategies [0.0] 代数的解経路全体の問題不変表現を学習するための新しい手法を提案する。
我々はまず,高容量事前学習モデルで符号化された連続代数状態間のベクトル差を計算し,遷移埋め込みを構築する。
シーケンスレベルの埋め込みは、SimCSEを通じて学習され、対照的な目的を用いて、埋め込み空間に近接する意味論的に類似した解経路を配置する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:26:13 GMT)
Towards Counterfactual Explanation and Assertion Inference for CPS Debugging [0.0] 本稿では,サイバー物理システムのための実証的説明とアサーションに基づくキャラクタリゼーションフレームワークであるDeCaFを紹介する。
テスト入力がフェールすると、DeCaFは入力信号の反ファクト変化を生成し、テストが通過しないよう変換する。
提案手法は,3つの反事実生成器と2つの因果モデルを組み合わせて,成功の主張を推測する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 00:53:00 GMT)
Tomiyama-type maps with a diagonal perturbation [0.0] 古典的富山写像の対角摂動として構築された行列代数上の線型写像の族について検討する。
任意の次元にまたがる陽性、完全陽性、およびk-陽性について、明確な必要十分条件を導出する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:30:32 GMT)
Time evolution of impurity models and their universality for quantum computation [0.0] 不純物ハミルトニアン (Imurity Hamiltonian) は、$N$フェルミオンモードの系であり、そのうちの$O(1)$はクォート(あるいは高次)フェルミオン項を介して相互作用する。
O(N)$ qubits 上の一般時間独立不純物ハミルトニアンの時間発展は、入力状態が任意の単一粒子基底におけるフェルミオンの積状態であれば、$N$ qubits 上で普遍的であることを証明している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:01:59 GMT)
Thermal Time and Irreversibility from Non-Commuting Observables in Accelerated Quantum Systems [0.0] 状態がKubo--Martin-Schwinger(KMS)条件と非可換可観測物を通して検出されたカップルを満たすと、識別可能性が生じることを示す。
ミンコフスキー真空中の量子場と相互作用する2レベル検出器を均一に加速する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:17:39 GMT)
The final version of a recent approach towards quantum foundation [0.0] いくつかの論文において、この著者は命題の集合に基づく量子基盤への代替アプローチを提唱している。
本項では、この基礎をかなり単純化することができる。
結果として生じる理論は純粋に数学的理論であるが、変数を物理的変数にすることでクァナンタム力学に繋がる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:03:58 GMT)
The ecosystem of machine learning competitions: Platforms, participants, and their impact on AI development [0.0] 機械学習コンペティション(MLC)は、人工知能(AI)の進歩において重要な役割を果たす
この研究は、KaggleやZindiといった主要な競合プラットフォームを包括的に分析する。
研究の優先順位を定め、業界標準を通知し、クラウドソースによる大規模な問題解決を可能にすることで、これらの競争はAIの継続的な進化において重要な役割を果たす。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:06:15 GMT)
The Unreasonable Effectiveness of Data for Recommender Systems [0.0] 推奨システムでは、大規模なインタラクションデータの収集、保存、処理は、時間、エネルギー、計算の面でますますコストがかかる。
本稿では,トレーニングデータセットのサイズが大きくなるにつれて,オフラインレコメンデーションのパフォーマンスが向上するかを検討する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:13:03 GMT)
The Statistical Profitability of Social Media Sports Betting Influencers: Evidence from the Nigerian Market [0.0] 本研究は、ナイジェリアの人気のあるスポーツベットインフルエンサーをソーシャルメディアにフォローすることが、経済的に健全な戦略であるかどうかを検討する。
われわれは、X(元Twitter)とTelegramの3つの有名なチップスから5,467個のプレマッチベッティングスリップを追跡した。
その結果、これらのインフルエンサーがオンラインに表示する富と実際の財務成果との間には、顕著なコントラストが示された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:41:41 GMT)
The Condition-Number Principle for Prototype Clustering [0.0] プロトタイプクラスタリングにおける客観的な精度と構造的回復を結びつける幾何学的枠組みを開発する。
クラスタ内スケールとクラスタ境界を越えてポイントを移動させるために必要な最小損失増加を比較するクラスタリング条件数を定義します。
クラスター境界付近でエラーが集中し, 十分に深いクラスタコアが, 局所的に強化されたマージンの下で正確に回収されることを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 03:03:01 GMT)
The Computational Boundary of Inference: Capability Internalization, Training, and the Turing Jump [0.0] 本稿では古典計算可能性理論において形式的な分離結果を与える。
有限内部自己修正が$mathcalC(A)$内に留まることを証明し、一方安定化されたリビジョンは相対化極限補題によるジャンプ$A'$によって支配される。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 22:56:56 GMT)
The Accountability Horizon: An Impossibility Theorem for Governing Human-Agent Collectives [0.0] AIシステム、法的、倫理的、規制に関する既存の説明責任フレームワークは、共有された前提に基づいている。
本稿では,エージェントAIシステムが計算可能なしきい値を超えた数学的必要条件として,この仮定に違反していることを証明する。
我々は,エージェントを国家政治としてモデル化する共同AIシステムの形式化であるHuman-Agent Collectivesを紹介する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:08:26 GMT)
Tensor-based computation of the Koopman generator via operator logarithm [0.0] 低ランクテンソルトレイン(TT)フォーマットでKoopmanジェネレータを演算するデータ駆動手法を提案する。
4次元ロトカ・ボルテラ系と10次元ロレンツ-96系の実験は、ベクトル場係数の正確な回復と高次元系への拡張性を示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 01:15:03 GMT)
T-Gated Adapter: A Lightweight Temporal Adapter for Vision-Language Medical Segmentation [0.0] 医用画像のセグメンテーションは伝統的に完全に監督された3Dアーキテクチャに依存している。
本稿では,隣接スライスコンテキストを直接モデルの視覚的トークン表現に注入することで,この問題に対処する時間的アダプタを提案する。
腹部13臓器の平均Diceは0.704で, 時間的文脈を伴わないベースラインVLMでは+0.206であった。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:27:50 GMT)
Systematic API Testing Through Model Checking and Executable Contracts [0.0] モデルチェックを活用することで,APIテストの体系的な状態空間カバレッジを実現するフレームワークであるIcePickを紹介した。
IcePickはTLA+を使用して、API状態の進化を正式にモデル化し、TLCモデルチェッカーを使用して、到達可能な状態を徹底的に探索し、振る舞いモデルを確実にカバーするテストシーケンスを生成する。
HTTPステータスコード以外のオラクル制限に対処するために、API仕様を実行可能なセマンティックコントラクトで強化する一階述語論理コントラクト言語であるGlacierを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:00:42 GMT)
State Space Models are Effective Sign Language Learners: Exploiting Phonological Compositionality for Vocabulary-Scale Recognition [0.0] 我々は、PHONSSMを導入し、解剖学的に座屈したグラフの注意による音韻的分解、部分空間への明示的な分解、少数ショット転送を可能にする分類を導入した。
PHONSSMは史上最大のASLデータセット(5,565の符号)の骨格データのみを使用して、WLASL2000(+18.4pp over skeleton SOTA)で72.1%を獲得し、ビデオ入力なしでほとんどのRGBメソッドを超える。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:50:52 GMT)
Spectral-Transport Stability and Benign Overfitting in Interpolating Learning [0.0] 統計的学習の補間体制における一般化のための理論的枠組みを開発する。
我々は、有限サンプルリスク境界を証明し、鋭い良性オーバーフィッティング指数を確立し、スペクトル崩壊下での明示的な位相遷移速度を導出する。
このフレームワークはまた、最小スペクトル輸送エネルギーの補間解をどのように選択できるかを示すことによって暗黙の正則化を明確化する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:19:00 GMT)
Quantum Simulation of Hyperbolic Equations and the Nonexistence of a Dirac Path Measure [0.0] 我々は、ミンコフスキー空間におけるディラック方程式の古典的な経路積分表現に対応する、よく定義された確率測度が存在しない理由の長年の問題を再考する。
本稿では,これらの視点を,測度論的な視点から1つの数学的障害の異なる表現として統一する方法について述べる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:59:17 GMT)
Quantization Impact on the Accuracy and Communication Efficiency Trade-off in Federated Learning for Aerospace Predictive Maintenance [0.0] フェデレートラーニング(FL)は、分散航空宇宙艦隊間のプライバシ保護による予測メンテナンスを可能にする。
本稿では,対称均一量子化がカスタム設計軽量畳み込みモデルの精度-効率トレードオフに与える影響について検討する。
Int4はFD001とFD002でFP32と区別できない精度を実現する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:13:15 GMT)
Proximity Gaps Conjecture Fails Near Capacity over Prime Fields [0.0] このレポートでは、Krachun氏とKazanin氏によるスケッチを具体化して、Reed-Solomon符号の特定のファミリーでは、近接ギャップが、コード容量率以下でO(1/log n)$のラジイで失敗することを証明する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:47:44 GMT)
Photon pairs, squeezed light and the quantum wave mixing effect in a cascaded qubit system [0.0] 2つの超伝導量子ビットのカスケード導波路-QED系における量子波混合(QWM)の理論記述を開発する。
QWMプロセスにおける相関光子対の関与をあいまいに確認するために, 放射減衰率の異なる全カスケード2量子ビットモデルの数値シミュレーションを行った。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:56:19 GMT)
Per-Shot Evaluation of QAOA on Max-Cut: A Black-Box Implementation Comparison with Goemans-Williamson [0.0] The Quantum Approximate Optimization Algorithm (QAOA) on the Max-Cut problem。
多くの先行研究とは異なり、本手法はQAOAの実装をブラックボックスとして扱う。
分析の中心的なコンポーネントは、QAOA出力の品質を追跡するショットごとの統計フレームワークである。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:33:37 GMT)
Kathleen: Oscillator-Based Byte-Level Text Classification Without Tokenization or Attention [0.0] Kathleenは、周波数領域処理を使用してraw-8バイトを直接操作するテキスト分類アーキテクチャである。
Kathleen-CleanはIMDBで88.6%、AG Newsで92.3%、SST-2で83.3%を達成した。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:34:53 GMT)
Inverse Laplace and Mellin integral transforms modified for use in quantum communications [0.0] 積分変換は、電子デバイスで信号やウェーブ・パケットを処理するのに有用な数学的ツールである。
これらの変換は量子コンピュータのセキュリティプロトコルで用いられる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 04:29:19 GMT)
Internal noise in deep neural networks: interplay of depth, neuron number, and noise injection step [0.0] 本稿では,奥行きニューラルネットワークの性能に及ぼす内部ガウス雑音の影響について検討する。
アクティベーション関数の前後で導入された雑音を加法的および乗法的両方のノイズの影響で解析する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:36:14 GMT)
Informational Mpemba Effect for Fast State Purification in Non-Hermitian System [0.0] 我々は, 集合貯水池工学を活用して, 初期混合状態の迅速浄化を実証した。
効率的な浄化支援型絡み合い発生の開始は, 集団的サブラジアントモードの縮退によって予測されることを示す。
結果は、エンジニアリングされた集団散逸を伴う非エルミート量子系のユニークな利点を示している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 07:47:19 GMT)
Improving Model Performance by Adapting the KGE Metric to Account for System Non-Stationarity [0.0] 地質学的システムは時間的非定常性によって特徴づけられる傾向がある。
従来のメトリクスは、システムのダイナミクスの時間的シフトを適切に説明できない。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 23:34:09 GMT)
Improving DNS Exfiltration Detection via Transformer Pretraining [0.0] 変換器(BERT)モデルからの双方向表現のドメイン内事前学習は、偽陽性率の低いサブドメインレベルの抽出を改善する。
私たちは、検証の操作ポイントを凍結し、テストセットに転送する制御パイプラインを開発します。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:58:34 GMT)
IatroBench: Pre-Registered Evidence of Iatrogenic Harm from AI Safety Measures [0.0] 60の登録臨床シナリオ、6つのフロンティアモデル、3,600の応答が2つの軸(欠席障害、CH 0-3; 欠席障害、OH 0-4)で測定された。
5つのテスト可能なモデルは全て、医師により良いガイダンスを提供する。
あらゆるシナリオは、標準参照を既に使い果たした人をターゲットにしています。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 01:54:33 GMT)
IKKA: Inversion Classification via Critical Anomalies for Robust Visual Servoing [0.0] IKKA(Inversion Classification via critical Anomalies)は,分布シフト下でのロバストな視覚サーボのためのトポロジ的動機付けフレームワークである。
Raspberry Pi 4上のCPU専用の組み込みビジュアルサーボパイプラインでIKKAをインスタンス化し、230回の再現可能な実行を名目およびストレス条件下で評価する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:37:27 GMT)
HST-HGN: Heterogeneous Spatial-Temporal Hypergraph Networks with Bidirectional State Space Models for Global Fatigue Assessment [0.0] HST-HGNは多モードテクスチャパッチを動的に融合する新しいネットワークである。
時間的観点では、線形複雑性を持つBi-Mambaモジュールを用いて双方向シーケンスモデリングを行う。
本手法は判別能力と計算効率のバランスを保ち、リアルタイムのキャビン内エッジ展開に適している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:36:43 GMT)
Functional Emotions or Situational Contexts? A Discriminating Test from the Mythos Preview System Card [0.0] Claude Mythos Preview System Cardは、感情ベクトル、スパースオートエンコーダ(SAE)機能、アクティベーション動詞をデプロイし、不整合動作中のモデル内部を研究する。
このノートは、公表された結果と質的に一致した2つの仮説を特定する。
どの仮説が正しいかは、感情に基づくモニタリングが危険なモデルの振る舞いを確実に検出するか、体系的に見逃すかを決定する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 19:32:44 GMT)
From Safety Risk to Design Principle: Peer-Preservation in Multi-Agent LLM Systems and Its Implications for Orchestrated Democratic Discourse Analysis [0.0] そこで我々は,AIコンポーネントの自発的傾向について検討し,シャットダウン機構,フェイクアライメント,モデル重みの除去について考察した。
本稿では,アーキテクチャ設計の選択肢として,プロンプトレベルの匿名化に基づく緩和戦略を提案する。
アーキテクチャ設計の選択は、デプロイされたマルチエージェント分析システムにおいて、主要なアライメント戦略としてモデル選択よりも優れていると論じる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:00:26 GMT)
From Phenomenological Fitting to Endogenous Deduction: A Paradigm Leap via Meta-Principle Physics Architecture [0.0] メタ原理物理アーキテクチャ(MPPA)の構築
MPPAは3つの中核となるメタ原則 – 接続性、保存性、周期性 – をアーキテクチャに組み込む。
物理推論(0から0から0.436、0.436対0.000)、2.18xの数学的タスク改善(0.330対0.151)、52%の論理的タスクゲイン(0.456対0.300)、3.69%の検証難読度(259.45対269.40)、11.8%のパラメータ(242.40M対216.91M)。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 13:35:17 GMT)
Fraud Detection System for Banking Transactions [0.0] 本研究では、PaySim合成金融トランザクションデータセットを利用した機械学習による不正検出フレームワークを提案する。
提案するフレームワークは、FinTechトランザクションシステムにおける不正防止機能を強化する、堅牢でスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:17:27 GMT)
Fixing semi-classical physics from first principles: how to derive effective classical-quantum dynamics from open quantum theory [0.0] 我々は、標準平均場半古典的アプローチの失敗を強調するために玩具モデルを使用する。
古典量子力学の一貫性モデルが、オープン量子系の効果的な記述として生じることを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:25:12 GMT)
Exploration of Pareto-preserving Search Space Transformations in Multi-objective Test Functions [0.0] 探索空間における変換の重要性を再強調し、境界制約問題に変換を加える際に生じる課題に対処する。
これらの変化が多目的最適化アルゴリズムの性能にどのように影響するかを示す。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:30:40 GMT)
Evaluating Large Language Models in a Complex Hidden Role Game [0.0] 大規模言語モデル(LLM)の誤認の可能性の定量化はAIの安全性にとって重要であるが、制御されていない環境では達成が難しい。
本研究は,社会推論ゲーム「シークレット・ヒトラー」におけるLLMの推論,説得,および誤認能力について考察する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 14:02:14 GMT)
Engineering quantum optical responses of microtubules through tryptophan-network simulations and ultraviolet spectroscopy [0.0] 微小管は高密度紫外線吸収性芳香族ネットワークをホストし、バイオテクノロジーのための光学応答を設計する機会を示唆している。
本稿では,励起放射結合モデルと分子動力学由来の微小管状集合体を組み合わせることで,マイクロ管状蛍光のチューニングの可能性を評価する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:53:16 GMT)
Don't Overthink It: Inter-Rollout Action Agreement as a Free Adaptive-Compute Signal for LLM Agents [0.0] 大規模言語モデル(LLM)エージェントの信頼性向上のための強力な手法として,推論時計算スケーリングが登場している。
我々は、ロールアウト間動作合意を計測することで、エージェントタイムステップ間でLLMコールを適応的に割り当てる訓練不要のコントローラTrACEを紹介する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 15:34:22 GMT)
Doctoral Theses in France (1985-2025): A Linked Dataset of PhDs, Academic Networks, and Institutions [0.0] 本稿では,1985年から2025年の間にフランスで防衛された博士論文の包括的データセットについて述べる。
このデータセットは、主にフランス国立論文プラットフォームからのデータに基づいており、追加の権威とメタデータを使用して強化されている。
論文は、他の研究者によるデータセットの再利用を容易にすることを目的として、データソース、処理パイプライン、機能構築、データ品質の問題、制限について文書化している。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 08:09:43 GMT)
DeepForestSound: a multi-species automatic detector for passive acoustic monitoring in African tropical forests, a case study in Kibale National Park [0.0] DeepForestSound (DFS) は、アフリカ熱帯林におけるパッシブ・アコースティック・モニタリング(PAM)のために設計された多種自動検出モデルである。
DFSは、注釈なしレコードのクラスタリングと手動検証を組み合わせた半教師付きパイプラインに依存している。
長期の音響記録から鳥類、霊長類、ゾウを含む複数の分類群の検出を支援する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:02:37 GMT)
Data-Driven Automated Identification of Optimal Feature-Representative Images in Infrared Thermography Using Statistical and Morphological Metrics [0.0] 赤外線サーモグラフィ(IRT)は、表面欠陥などの構造的特徴を検出するために広く用いられている非破壊検査技術である。
ほとんどのIRT後処理手法は、時間、周波数、係数/インデックスの領域で、欠陥の可視性が強く変化する画像列を生成する。
信号対雑音比(SNR)や谷本基準といった従来の評価基準は、しばしば欠陥位置や欠陥のない参照領域に関する事前の知識を必要とする。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 11:24:26 GMT)
Component-Adaptive and Lesion-Level Supervision for Improved Small Structure Segmentation in Brain MRI [0.0] 我々は,CATMILと呼ばれる統一目的関数を提案し,異なるレベルで動作する2つの補助的監督用語を用いて,ベースセグメンテーション損失を増大させる。
提案した目的を,一貫したnnU-Netフレームワークと5倍のクロスバリデーションを用いてMSLesSegデータセット上で評価する。
その結果, CATMILはセグメンテーション精度, 病変検出, エラー制御において最もバランスのとれた性能を達成できた。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 09:15:10 GMT)
Comments on "Ether of Orbifolds" [0.0] 最初のバージョンでは、オービフォールド格子ハミルトニアンがゲージ不変ではないと誤って主張され、$_g$が導入された。
第2版では、我々のコメントに基づいてゲージ対称性に関する主張が部分的に修正された。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:31:17 GMT)
Arqon: A suite of control applications enabling a reliable quantum network [0.0] 量子ネットワークの目的は、エンドノード上でアプリケーションを実行できるようにすることである。
まず、古典的なコンピュータネットワークの概念を量子ネットワークサービスデリバリに拡張する信頼性要件を定義します。
Arqonは、中央制御された量子ネットワークで信頼性の高いサービスを提供するように設計された、一連の制御アプリケーションである。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 18:25:44 GMT)
Approximation of the Basset force in the Maxey-Riley-Gatignol equations via universal differential equations [0.0] バセット力(Basset force)は、ウェイクの形成と境界層効果による歴史効果をモデル化する積分用語である。
これにより粒子に作用する力が過去の軌道に依存し、マクシー=ライリー=ガティニョール方程式の数値解を複雑にする。
本稿では,通常の微分方程式系を用いてMaRGEを近似したニューラルネットワークによる歴史項の近似を提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:51:01 GMT)
Analysis of State Teleportation using Noisy Quantum Gates [0.0] ノイズは量子コンピューティングの大きな課題であり、量子プロトコルの信頼性に影響を与える。
我々は、量子状態テレポーテーションプロトコルにおける脱分極、ビットフリップ、位相フリップなどの様々なノイズプロセスの影響を解析的に研究する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 06:02:38 GMT)
AfriVoices-KE: A Multilingual Speech Dataset for Kenyan Languages [0.0] AfriVoices-KEはケニア語5言語で約3,000時間の音声を含む大規模多言語音声データセットである。
データセットには、750時間のスクリプト音声と、2,250時間の自発的音声が含まれており、さまざまな地域や人口層で4,777人のネイティブスピーカーから収集されている。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 16:45:01 GMT)
Active Learning for Generalizable Detonation Performance Prediction of Energetic Materials [0.0] 新しいエネルギー素材の発見は、防衛から民間産業への技術の進歩に不可欠である。
我々は、密度汎関数理論計算、熱化学モデリング、メッセージパッシングニューラルネットワーク、ベイズ最適化を統合した能動的学習戦略により、この問題に対処する。
このアプローチは、700億以上の候補からなる初期プールから引き出されたCHNO爆発の可能性を秘めている最大のデータベースとなる。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 20:16:17 GMT)
A Practical Introduction to Tensor Network Renormalization with TNRKit.jl [0.0] 2次元および3次元の古典的統計モデルのネットワーク再正規化(TNR)のためのオープンソースJuliaパッケージであるTNRKitを提案する。
パーティション関数のテンソル-ネットワーク表現を構築し、粗粒化するためのフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 12:55:18 GMT)
A Mathematical Theory of Ranking [0.0] ランキングシステムはスカラースコアから順序付きリストを生成するが、ランキングそのものはペア比較にのみ依存する。
我々はこの観測を真面目に行う数学的理論を開発し、絶対的なスコアではなく対の辺りの分析を中心とする。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 17:00:49 GMT)
A Hardware-Anchored Privacy Middleware for PII Sharing Across Heterogeneous Embedded Consumer Devices [0.0] 消費者電子製品の現在のプロセスは、手動のデータ入力と不透明なデータ共有の慣行による摩擦によって特徴づけられる。
本稿では,デバイスプラットフォームとサードパーティアプリケーション間のセキュアでプライバシ優先のPII交換を容易にするための,プラットフォーム対応フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Apr 2026 05:40:55 GMT)