Fugu-MT: arxivの論文翻訳(概要)

Towards Knowledgeable Deep Research: Framework and Benchmark [104.6]
本稿では、DRエージェントが構造化知識と非構造化知識の両方でレポートを生成する必要があるKDR(Knowledable Deep Research)を紹介する。テキスト,図形,テーブルをコヒーレントなマルチモーダルレポートに統合するマルチエージェントアーキテクチャであるHybrid Knowledge Analysis Framework (HKA)を提案する。実験の結果,HKAは汎用および知識中心の指標において,既存のDRエージェントよりも一貫して優れていた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:06:27 GMT)
NTIRE 2026 Challenge on Bitstream-Corrupted Video Restoration: Methods and Results [102.1]
NTIRE 2026 Bitstream-Corrupted Video Restoration (BSCVR) の挑戦 NTIRE 2026 Challenge on Bitstream-Corrupted Video Restoration (BSCVR) の報告
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:51:59 GMT)
MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale [92.1]
我々は、データエンジニアリングとトレーニング戦略設計を通じて、純粋に最先端の技術を進化させるMinerU2.5-Proを提案する。コアとなるのは、カバレッジ、情報性、アノテーションの正確性を中心に設計されたData Engineだ。我々は,MinerU2.5-Pro が OmniDocBench v1.6 上で 95.69 を達成することを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:16:34 GMT)
SceneScribe-1M: A Large-Scale Video Dataset with Comprehensive Geometric and Semantic Annotations [88.9]
SceneScribe-1Mは新しい大規模多時間ビデオデータセットである。そこには100万本のビデオが含まれており、それぞれに詳細なテキスト記述、正確なパラメータ、深度マップ、一貫性のある3Dポイントトラックなどが含まれている。 SceneScribe-1Mの汎用性と価値は、単眼深度推定、シーン再構成動的点追跡、テキスト・ビデオ合成などの生成タスク、カメラ制御の有無にかかわらず、幅広い下流タスクのベンチマークを確立することで示される。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:59:33 GMT)
CAMotion: A High-Quality Benchmark for Camouflaged Moving Object Detection in the Wild [83.5]
本稿では,野生の移動物体検出のための高品質なベンチマークであるCAMotionを構築した。このベンチマークは、異なる挑戦シナリオにおいて、カモフラージュされた物体の運動特性を詳細に分析する。また、既存のSOTAモデルをCAMotion上で総合的に評価し、VCODタスクにおける大きな課題について論じる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:23:46 GMT)
PASK: Toward Intent-Aware Proactive Agents with Long-Term Memory [83.1]
本稿ではまず,プロアクティブAIエージェントのストリーミングパラダイムとしてDD-MM-PAS(Demand Detection, Memory Modeling, Proactive Agent System)を提案する。私たちはこのパラダイムをPaskでインスタンス化し、DDのためのストリーミングIntentFlowモデル、長期MMのためのハイブリッドメモリ(ワークスペース、ユーザ、グローバル)、PAS赤外線フレームワークを使っています。また、LatentNeeds-Benchも紹介しています。これは、ユーザ合意のデータから構築され、何千回もの人間の編集によって洗練されています。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:06:13 GMT)
OpenSpatial: A Principled Data Engine for Empowering Spatial Intelligence [82.0]
高品質、拡張性、幅広いタスクの多様性、最適化された効率性のために設計されたオープンソースのデータエンジンであるOpenSpatialを紹介します。 OpenSpatialは5つの基本的なタスクにまたがって包括的なデータ階層を構築するための基本的なプリミティブとして3Dバウンディングボックスを採用している。我々は300万個の高忠実度サンプルからなる大規模データセットOpenSpatial-3Mをキュレートする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:04:20 GMT)
Unified Multimodal Uncertain Inference [81.6]
Unified Multimodal Uncertain Inference (UMUI)は、テキスト、オーディオ、ビデオにまたがるタスクである。自己整合型教師校正と分布に基づく校正型自信探索を併用して予測を行うCLUE(Calibrated Latent Uncertainty Estimation)を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:46:34 GMT)
Squeeze Evolve: Unified Multi-Model Orchestration for Verifier-Free Evolution [81.5]
検証不要な進化推論のための統合型マルチモデルオーケストレーションフレームワークであるSqueeze Evolveを紹介する。われわれのアプローチは単純な原則で導かれており、最良効能を有するモデル能力を割り当てる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:14:45 GMT)
ExecTune: Effective Steering of Black-Box LLMs with Guide Models [81.5]
我々は、ガイドモデルがブラックボックスコアモデルによって実行される構造化戦略を生成する、ガイドコアポリシー(GCoP)と呼ばれるシステムのクラスについて研究する。我々はGCoPを費用対効果目標として定式化し、エンドツーエンドのパフォーマンスは平均実行可能性によって管理されていることを示す。教師が指導する受入サンプリング,教師による微調整,構造対応強化学習を組み合わせた,原則的学習レシピであるExecTuneを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 23:27:46 GMT)
Towards Real-world Human Behavior Simulation: Benchmarking Large Language Models on Long-horizon, Cross-scenario, Heterogeneous Behavior Traces [81.4]
我々はOmniBehaviorを紹介した。OmniBehaviorは実世界のデータから構築された最初のユーザシミュレーションベンチマークである。現在のモデルでは,コンテキストウィンドウが拡大しても,複雑な振る舞いを正確にシミュレートすることが困難であることを示す。この結果、個人差や長い尾の挙動が失われ、将来の高忠実度シミュレーション研究における重要な方向性が浮き彫りになる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:26:21 GMT)
OpenVLThinkerV2: A Generalist Multimodal Reasoning Model for Multi-domain Visual Tasks [81.1]
標準線形スケーリングを非線形分布マッチングに置き換える新しいRLトレーニング目標を提案する。また、高度に堅牢で汎用的なマルチモーダルモデルであるOpenVLThinkerV2を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:39 GMT)
Entropy-Gradient Grounding: Training-Free Evidence Retrieval in Vision-Language Models [77.4]
視覚言語モデルのための学習不要なモデル固有のグラウンドリング手法を提案する。モデルの次トーケン分布のエントロピーを計算し、それを視覚トークン埋め込みにバックプロパタイズしてエントロピー勾配のレバレンスマップを得る。次に、複数のコヒーレント領域を抽出・ランク付けし、マルチエビデンスクエリをサポートし、空間エントロピー停止規則付き反復的なズーム・アンド・リグラウンド手順を導入する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:51:42 GMT)
DMax: Aggressive Parallel Decoding for dLLMs [77.2]
効率的な拡散言語モデル(dLLM)のための新しいパラダイムであるDMaxを提案する。並列デコードにおけるエラーの蓄積を軽減し、生成品質を維持しながらアグレッシブデコードを可能にする。当社のアプローチの核心は、マスクと均一なdLLMを効率的に統合する新しいトレーニング戦略であるOn-Policy Uniform Trainingである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:35:42 GMT)
EXAONE 4.5 Technical Report [74.4]
本報告では,LG AI Research による初のオープンウェイトビジョン言語モデル EXAONE 4.5 を紹介する。 EXAONE 4.5は、既存のEXAONE 4.0フレームワークに専用のビジュアルエンコーダを統合することで設計されている。このモデルは、注意深いキュレーションを伴う大規模データ、特にドキュメント中心のコーパスを強調するために訓練されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:51:11 GMT)
HEX: Humanoid-Aligned Experts for Cross-Embodiment Whole-Body Manipulation [74.3]
HEXは、ヒューマノイドロボットの協調操作のための状態中心のフレームワークである。ヘテロジニアスな実施形態をまたいだスケーラブルな学習のための、ヒューマノイドに整合した普遍的状態表現が組み込まれている。タスクの成功率と一般化における最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:01:43 GMT)
Measurement-induced state transitions across the fluxonium qubit landscape [73.9]
本研究では,フラクソニウム量子ビットにおける測定誘起状態遷移を幅広いパラメータにわたって検討した。より軽いフラキソニウムは、より重いフラキソニウムに比べて、これらの状態遷移の影響を受けにくいことが判明した。この効果は、多重光子共鳴の密度が低いこと、与えられた分散シフトの要求結合が小さいこと、および電荷作用素のより調和的な構造が原因である。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:53:41 GMT)
Small Vision-Language Models are Smart Compressors for Long Video Understanding [73.7]
長時間のビデオ理解は、欲求に満ちたコンテキストではなく、意図駆動の効率に頼っている。本稿では,下流の理解のために長い動画を圧縮する効率的なクエリ認識フレームワークであるTempoを提案する。テストでは、Tempoが1時間のビデオを理論的限界以下に圧縮し、真のロングフォームビデオ理解が意図駆動の効率に依存することを示した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:40:25 GMT)
E-3DPSM: A State Machine for Event-Based Egocentric 3D Human Pose Estimation [73.6]
イベントカメラは、ヘッドマウントデバイスからの単眼のエゴセントリックな3Dポーズ推定において利点がある。既存の手法では3次元推定精度が低く、多くのアプリケーションでは不十分である。本稿では,イベント駆動型連続ポーズ状態マシンであるE-3DPSMを紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:52 GMT)
Provably Adaptive Linear Approximation for the Shapley Value and Beyond [73.1]
基本的で長期にわたる課題は、その効率的な近似である。一般に用いられるすべての半値に対して$P(|hatboldsymbol-boldsymbol|_2geq)leq$を必要とする線形空間アルゴリズムを開発する。本アルゴリズムは,各ユーティリティ関数の平均二乗誤差の明示的最小化を可能にする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:38:14 GMT)
KnowU-Bench: Towards Interactive, Proactive, and Personalized Mobile Agent Evaluation [72.0]
KnowU-Benchはパーソナライズされたモバイルエージェントのためのオンラインベンチマークである。 42のGUIタスク、86のパーソナライズされたタスク、64のプロアクティブタスクをカバーしている。明示的なタスク実行に優れるエージェントは、あいまいな指示の下で50%以下に低下する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:50:50 GMT)
SPARD: Self-Paced Curriculum for RL Alignment via Integrating Reward Dynamics and Data Utility [71.8]
本研究では,学習の進捗を把握し,多目的報酬重み付けとデータ重要度を動的に調整し,自己完結型カリキュラムを構築するフレームワークであるSPARDを提案する。複数のベンチマークにわたる大規模な実験により、SPARDはすべてのドメインにわたるモデル機能を大幅に強化することが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:37:22 GMT)
WUTDet: A 100K-Scale Ship Detection Dataset and Benchmarks with Dense Small Objects [68.4]
WUTDetは100,576イメージと381,378のアノテートされた船舶インスタンスを備えた大規模な船舶検出データセットである。 CNN, Transformer, Mambaの3つの主流検出アーキテクチャから20のベースラインモデルを体系的に評価した。 Ship-GENの結果は、WUTDetでトレーニングされたモデルは、異なるデータ分布下でより強力な一般化を示すことを示している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:28:05 GMT)
WildDet3D: Scaling Promptable 3D Detection in the Wild [67.3]
テキスト,ポイント,ボックスプロンプトを受信し,推定時に補助的な深度信号を組み込むことができる統合幾何認識アーキテクチャであるWildDet3Dを導入する。これまでで最大のオープンな3D検出データセットであるWildDet3D-Dataは、既存の2Dアノテーションから候補となる3Dボックスを生成し、人間による検証のみを保持することで構築されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:00:10 GMT)
Networking-Aware Energy Efficiency in Agentic AI Inference: A Survey [64.2]
本稿では,知覚・推論・行動サイクル全体にわたる計算・通信コストを同定するエネルギー会計フレームワークを提案する。我々は、単純化、計算制御、インプット・アンド・アテンション最適化、ハードウェア・アウェア・推論にまたがる統一的な分類法を確立する。我々は,第6世代移動通信(6G)ネイティブエージェントAI,自己維持システムといったグリーンラーニングのオープンな課題を特定した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:13:59 GMT)
AniGen: Unified $S^3$ Fields for Animatable 3D Asset Generation [64.1]
AniGenは、単一画像上に条件付きアニメーション対応の3Dアセットを直接生成する統合フレームワークである。私たちの重要な洞察は、共有空間領域上で定義されたS3$ Fields(Shape, Skeleton, Skin)として、形状、骨格、スキン化を表現することです。 AniGenは、リグの妥当性とアニメーションの品質において、最先端のシーケンシャルベースラインを大幅に上回っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:22:06 GMT)
AT-ADD: All-Type Audio Deepfake Detection Challenge Evaluation Plan [64.1]
ACMマルチメディア2026におけるオールタイプオーディオディープフェイク検出(AT-ADD)グランドチャレンジを提案する。 AT-ADDは、堅牢で一般化可能なオーディオ法医学技術の開発を加速することを目的としている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:38:19 GMT)
Robust Length Prediction: A Perspective from Heavy-Tailed Prompt-Conditioned Distributions [61.6]
既存の出力長予測法は、プロンプトのみの予測では信頼性が低い。本稿では,同じプロンプトからトレーニング対象を構成するプロンプト条件付き長さ分布法を提案する。さまざまなシナリオにわたる実験では、予測品質が一貫した向上を示している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:49:52 GMT)
Reinforcement-Guided Synthetic Data Generation for Privacy-Sensitive Identity Recognition [60.5]
高忠実度生成モデルは、プライバシーに敏感なシナリオでますます必要とされている。限られたデータによって生成モデルは貧弱になり、データ不足を軽減できない。汎用ドメイン生成の先行を識別タスクに適応させる,強化誘導型合成データ生成フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:52:03 GMT)
LMGenDrive: Bridging Multimodal Understanding and Generative World Modeling for End-to-End Driving [60.3]
本稿では、マルチモーダル理解と生成世界モデルを組み合わせた、エンドツーエンドのクローズドループ駆動のための最初のフレームワークLMGenDriveを紹介する。本稿では,視覚前訓練から多段階長距離運転に至るまでの3段階訓練戦略を提案し,安定性と性能の向上を図る。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:13:14 GMT)
MolmoWeb: Open Visual Web Agent and Open Data for the Open Web [60.3]
MolmoWebMixはブラウザのタスクとWeb-GUIの知覚データを組み合わせたものだ。 MolmoWeb-8Bは、完全にオープンなマルチモーダルWebエージェントのファミリーである。我々は、Webエージェントのオープンな研究を可能にするため、モデルチェックポイント、トレーニングデータ、コード、統一された評価ハーネスをリリースする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:54:02 GMT)
ImplicitMemBench: Measuring Unconscious Behavioral Adaptation in Large Language Models [60.1]
LLMエージェントの既存のメモリベンチマークは、事実の明示的なリコールを評価するが、意識的な検索なしに、経験が自動的な振る舞いになる暗黙の記憶を見落としている。 IndicitMemBenchは、非宣言的メモリの標準的な認知科学のアカウントから引き出された3つの構造を通して暗黙的メモリを評価する最初の体系的なベンチマークである。当社の300イテムスイートでは,初動採点を備えたLearning/Priming-Interfere-Testプロトコルを統一しています。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:26:32 GMT)
Synthetic Data for any Differentiable Target [59.5]
対象とするサンプルのデータセットを生成するために合成データジェネレータを正確に最適化できるプリミティブを開発する。提案手法は,高次勾配による正確なデータ帰属と,それらのスコアを政策勾配報酬として用いることにより,これを実現する。これらの結果から, DPGはモデル特性を合成訓練例のみを用いて形成するための強力で柔軟な手法であることが示唆された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:23:40 GMT)
Seeing but Not Thinking: Routing Distraction in Multimodal Mixture-of-Experts [58.9]
MoE(Multimodal Mixture-of-Experts)モデルは視覚言語タスクにおいて顕著なパフォーマンスを実現している。モデルは画像の内容が正確に知覚されるが、その後の推論では失敗する。本稿では,視覚的な入力を処理する際に,タスク関連推論の専門家を適切に活性化できないという,ルーティング・ディトラクションの仮説を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:44 GMT)
When to Trust Tools? Adaptive Tool Trust Calibration For Tool-Integrated Math Reasoning [58.8]
Tool-Integrated Reasoningは、推論軌道にツール呼び出しと実行を組み込む有望なパラダイムとして登場した。モデルの推論がツールの結果と矛盾する場合、モデルは自身の推論を信じる傾向にあります。アダプティブ・ツール・トラスト(ATTC、Adaptive Tool Trust)は、モデルに対して、ツール結果の信頼性や無視を適応的に選択するフレームワークである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:14:37 GMT)
HiRO-Nav: Hybrid ReasOning Enables Efficient Embodied Navigation [58.3]
HiRO-Navは、自身のアクションエントロピーに基づいて、各ステップで思考を行うかどうかを適応的に決定できる最初の種類のエージェントである。そこで本研究では,ハイブリッド型微調整をコールドスタートとし,その後にオンライン強化学習を施した調整訓練パイプラインを提案する。 textscCHORES-$mathbbS$ObjectNavベンチマークの実験では、HiRO-Navは、密集した考え方と非考えのベースラインの両方よりも成功率とトークン効率のトレードオフが優れていることが示されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:22:24 GMT)
AdaSpark: Adaptive Sparsity for Efficient Long-Video Understanding [57.5]
本稿では、長距離時間モデリングの制約に対処するために設計された適応型空間性フレームワークであるAdaSparkを紹介する。 AdaSparkは、挑戦的な時間スケールのビデオベンチマークで検証されているように、計算負荷を最大57%削減し、きめ細かい長距離依存関係を保存する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:48:32 GMT)
Is your algorithm unlearning or untraining? [57.3]
我々は「アンラーニング」という用語は、2つの異なる問題定式化にまたがる異なる研究努力によって過負荷になっていると論じている。図1に示すように、未学習と未学習の2つの概念を特定します。本稿では,これらの問題の技術的定義と各文献で研究した問題設定について述べる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:24:52 GMT)
Lighting-grounded Video Generation with Renderer-based Agent Reasoning [56.5]
LiVERは、シーン制御可能なビデオ生成のための拡散ベースのフレームワークである。本稿では, 映像合成を明示的な3次元シーン特性に適応させる新しい枠組みを提案する。本手法は, 統一された3次元表現から制御信号を描画することで, これらの特性をアンタングル化する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:29:29 GMT)
Distributed Multi-Layer Editing for Rule-Level Knowledge in Large Language Models [56.4]
大規模言語モデルは、孤立した事実だけでなく、記号表現、自然言語の説明、具体例の推論をサポートするルールも格納する。ほとんどのモデル編集手法は、対象の編集が局所的な介入によって達成できると仮定して、事実レベルの知識のために構築されている。ルールレベルの知識編集の機械論的研究を通じて,この問題を考察する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:22:19 GMT)
Externalization in LLM Agents: A Unified Review of Memory, Skills, Protocols and Harness Engineering [55.9]
大規模言語モデル(LLM)エージェントは、その周辺のランタイムを再編成するよりも、モデルウェイトを変更することによって構築されるものが少なくなる。本稿では、外部化のレンズを通してのシフトをレビューする。エージェントインフラストラクチャは、補助的なコンポーネントを追加するだけでなく、ハード認知の負担をモデルがより確実に解決できる形式に変換するからである、と我々は主張する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:19:41 GMT)
RemoteAgent: Bridging Vague Human Intents and Earth Observation with RL-based Agentic MLLMs [55.4]
地球観測システムは、曖昧な自然言語を通じて要求を表現するドメインの専門家を支援するように設計されている。実用的なEOAIシステムは、あいまいな人間のクエリと適切な多粒度視覚分析タスクのギャップを埋めなければならない。 MLLMの能力固有の境界を戦略的に尊重するエージェントフレームワークであるRemoteAgentを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:40:46 GMT)
HCRE: LLM-based Hierarchical Classification for Cross-Document Relation Extraction with a Prediction-then-Verification Strategy [54.9]
文書間関係抽出 (RE) は, 異なる文書に存在する頭部尾部エンティティ間の関係を識別することを目的としている。本稿では,各レベルでの多視点検証により信頼性を向上させる推論戦略を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:55:27 GMT)
Making MLLMs Blind: Adversarial Smuggling Attacks in MLLM Content Moderation [54.4]
敵の密輸攻撃は人間とAIの能力ギャップを悪用する。有害なコンテンツを人間の読みやすい視覚形式にエンコードする。我々は緩和戦略の予備的な調査を行う。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:50:11 GMT)
Floating or Suggesting Ideas? A Large-Scale Contrastive Analysis of Metaphorical and Literal Verb-Object Constructions [53.7]
本研究では,2Mコーパス文中の297の英語動詞オブジェクト対(例:float idea vs. suggest idea)を分析した。 5つのNLPツールを用いて,感情的,語彙的,統語的,言論的な特徴を捉えた認知的・言語的特徴2,293点を抽出した。クロスペアの結果は, 語彙頻度, 凝集度, 構造規則性が高く, 比喩的文脈は感情負荷, イメージ性, 語彙多様性, 構造的特異性を示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:08:57 GMT)
OralAgent: Integrating Reasoning, Tools, and Knowledge for Interactive Dental Image Analysis [53.6]
OralAgentは,マルチモーダル推論,ツールベースの意思決定,知識に基づく検索を統一する最初の歯科用AIエージェントである。 22の視覚分析ツールと368の古典的歯科用教科書を統合し、自律的推論、計画、ツールの使用、知識検索、多段階ワークフロー実行を可能にしている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:37:11 GMT)
OVS-DINO: Open-Vocabulary Segmentation via Structure-Aligned SAM-DINO with Language Guidance [53.5]
Open-Vocabularyは、セマンティック記述を活用することで、定義済みのカテゴリセットを超えてイメージ領域を分割することを目的としている。近年の取り組みは、これらの制限を軽減するために、DINOのようなVision Foundation Models (VFM) を取り入れている。我々は,構造アライメントを通じてDINOの潜在エッジ感度を活性化する新しいフレームワークであるOVS-DINOを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:57:11 GMT)
OmniJigsaw: Enhancing Omni-Modal Reasoning via Modality-Orchestrated Reordering [53.3]
我々は、時間的順序付けプロキシタスクに基づいて構築された汎用的な自己教師型フレームワークであるOmniJigsawを提案する。クロスモーダル統合を強制するために、ジョイントモダリティ統合、サンプルレベルモダリティ選択、クリップレベルモダリティマスキングが使用される。両モードのショートカット現象'を共同モダリティ統合で明らかにし,細粒度クリップレベルのモダリティマスキングがこの問題を緩和することを示した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:09:40 GMT)
What Drives Representation Steering? A Mechanistic Case Study on Steering Refusal [53.2]
異なるステアリング手法が同一層に印加した場合に機能的に交換可能な回路を利用することを示す。その結果,操舵ベクトルは最大90～99%のスペーサー化が可能であり,ほとんどの性能は維持できることがわかった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:57:14 GMT)
Less Approximates More: Harmonizing Performance and Confidence Faithfulness via Hybrid Post-Training for High-Stakes Tasks [52.8]
大規模な言語モデルは、自信を持って不正確な推論が現実世界の害を引き起こすような、ハイテイクなタスクにますますデプロイされている。内的フィードバックからの教師なし強化学習と推論・トラス誘導型推論蒸留を併用して協調的に最適化することを提案する。 PRG方式のメトリクスを用いてRDとRLIFを適応的に重み付けするハイブリッドポストトレーニングフレームワークであるHyTuningを紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:50:11 GMT)
PLUME: Latent Reasoning Based Universal Multimodal Embedding [52.4]
ユニバーサルマルチモーダル埋め込み(UME)は、異種入力を単一のモデルで共有検索空間にマッピングする。最近のアプローチでは、埋め込みを抽出する前に明確なチェーン・オブ・シント(CoT)論理を生成することにより、UMEを改善している。 PLUMEは,言語化されたCoTを連続的潜伏状態の短時間の自己回帰ロールアウトに置き換えることで,UMEを進化させる潜在的推論フレームワークである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:39:33 GMT)
Beyond Surface Artifacts: Capturing Shared Latent Forgery Knowledge Across Modalities [52.2]
本稿では,従来の「機能融合」から「モダリティ一般化」に再定義するパラダイムシフトを提案する。モーダリティ固有のスタイルを明示的に分離することにより,MAFは必須かつ非モーダルな潜在フォージェリー知識を正確に抽出する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:35:21 GMT)
SepSeq: A Training-Free Framework for Long Numerical Sequence Processing in LLMs [51.8]
本稿では,セパレータトークンを戦略的に挿入することで分散を緩和する学習自由なプラグアンドプレイフレームワークを提案する。メカニカルには、セパレータトークンが注目シンクとして機能し、グローバルなコンテキストを維持しながら、局所的なセグメントに注意を向けることが示される。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:40:34 GMT)
ActiveGlasses: Learning Manipulation with Active Vision from Ego-centric Human Demonstration [51.7]
ActiveGlassesは、エゴ中心の人間のデモからロボット操作を学習するシステムである。スマートグラスに装着されたステレオカメラは、データ収集とポリシー推論の両方のための唯一の認識装置として機能する。ゼロ・トランスファーを可能にするために,デモからオブジェクト・トラジェクトリを抽出し,オブジェクト中心のポイント・クラウド・ポリシーを用いて操作と頭部運動を協調的に予測する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:08 GMT)
ViSAGE @ NTIRE 2026 Challenge on Video Saliency Prediction [51.7]
マルチエキスパート・アンサンブル・フレームワークであるAdaptive Gated Experts (ViSAGE) を用いたビデオ・サリエンシを提案する。 ViSAGEは様々な誘導バイアスを集約して、ビデオの複雑な時間的塩分濃度をキャプチャする。プライベートテストセットでは、ViSAGEが4つの評価指標のうち2つにランクインし、他の2つの指標で最も競合するソリューションを上回った。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:50:21 GMT)
Capture-Quiet Decomposition: A Verification Theorem for Chess Endgame Tablebases [51.6]
チェス・エンドゲーム・テーブルベースにおけるWin-Draw-Lossラベルの検証のためのCapture-Quiet Decomposition(CQD)を提案する。この定理は、すべての法的位置を、終端、捕捉、静かの3つのカテゴリのうちの1つに分解する。 CQDは35の3ピースと4ピースのエンドゲーム(2200万ポジション)、110の5ピースのエンドゲーム、72の6ピースのエンドゲーム(合計517のエンドゲーム)で徹底的に検証します。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:22:24 GMT)
ReconPhys: Reconstruct Appearance and Physical Attributes from Single Video [51.3]
ReconPhysは、単一の単眼ビデオから物理的属性推定と3次元ガウススプラッティング再構成を共同で学習するフィードフォワードフレームワークである。提案手法では, 自己教師型戦略を用いて訓練したデュアルブランチアーキテクチャを用いて, 地上の物理ラベルの必要性を解消する。大規模合成データセットの実験は優れた性能を示した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:51:14 GMT)
When Numbers Speak: Aligning Textual Numerals and Visual Instances in Text-to-Video Diffusion Models [51.0]
数値アライメントを改善するためのトレーニング不要な識別ガイドフレームワークであるNUMINAを紹介する。 NUMINAは、可算潜在レイアウトを導出するために、識別可能な自己および横断的なヘッダを選択することで、プロンプト不整合を識別する。紹介されたCountBenchでは、NUMINAはWan2.1-1.3Bで7.4%、それぞれ5Bモデルと14Bモデルで4.9%と5.5%のカウント精度を向上している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:57 GMT)
ClawBench: Can AI Agents Complete Everyday Online Tasks? [51.0]
ClawBenchは153のシンプルなタスクの評価フレームワークで、人々が人生や仕事で定期的に達成する必要がある。 ClawBenchは本番Webサイトで動作し、実世界のWebインタラクションの完全な複雑さ、動的な性質、課題を保存する。軽量なインターセプション層は、最終的なリクエストのみをキャプチャしてブロックし、現実世界の副作用なしに安全な評価を保証する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:57:13 GMT)
What do Language Models Learn and When? The Implicit Curriculum Hypothesis [50.9]
Inlicit Curriculum hypothesis: Pretraining following a compositional and predictable curriculum across models。 410M-13Bパラメータから4つのモデルファミリの出現点を追跡する。モデルが一定の精度のしきい値に達する際の出現順序は著しく一致していることがわかった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:50:12 GMT)
What They Saw, Not Just Where They Looked: Semantic Scanpath Similarity via VLMs and NLP metric [50.7]
視覚言語モデルと視線追跡分析を統合した意味的スキャンパス類似性フレームワークを提案する。意味的類似性は、埋め込みベースおよび語彙的NLPメトリクスを使用して計算される。自由視眼球追跡データの実験では、意味的類似性は幾何学的アライメントから部分的に独立なばらつきを捉えていることが示されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:36:22 GMT)
Scal3R: Scalable Test-Time Training for Large-Scale 3D Reconstruction [50.5]
本稿では,長い映像シーケンスから大規模3Dシーンを再構築する作業について述べる。近年のフィードフォワード再構成モデルでは,RGB画像からの3次元幾何を,明示的な3次元先行や幾何学的制約なく直接回帰することで,有望な結果を示している。本稿では,長距離シーン情報を効率よく圧縮し,保持するニューラルグローバルコンテキスト表現を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:50 GMT)
Distributional Open-Ended Evaluation of LLM Cultural Value Alignment Based on Value Codebook [50.1]
DOVEは、人文テキストとLLM出力を直接比較する分散評価フレームワークである。 DOVEは, ダウンストリームタスクと31.56%の相関を達成し, 高い信頼性を保ちながら, 文化ごとのサンプル500点程度の信頼性を維持した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:01:43 GMT)
Mitigating Entangled Steering in Large Vision-Language Models for Hallucination Reduction [50.0]
LVLM(Large Vision-Language Models)は、モーダルなタスク間で大きな成功を収めてきたが、幻覚によって妨げられている。既存の方法は幻覚を緩和するが、しばしば生成行動を変化させ、結果として出力が短くなり、トークンの分布がシフトする。幻覚緩和のための制御および選択的な潜伏介入を行う効果的なプラグアンドプレイフレームワークであるMESAを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:31:27 GMT)
Self-Improving 4D Perception via Self-Distillation [49.7]
SelfEvoは、非現実的なビデオを使用して、トレーニング済みのマルチビュー再構築を継続的に改善するセルフトレーニングフレームワークである。我々は、損失信号、非対称性の形態、その他の訓練戦略を含む自己改善を効果的に行う設計選択を体系的に研究する。全体として、SelfEvoはラベル付きデータを使わずに36.5%の動画深度推定と20.1%のカメラ推定を達成している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:04 GMT)
$p1$: Better Prompt Optimization with Fewer Prompts [49.2]
システムプロンプト間の分散が大きくなるとプロンプト最適化が成功するが,システムプロンプト間の分散がシステムプロンプトの分散を支配するとフェールすることを示す。本稿では,ユーザプロンプトのサブセットを選択するシンプルなユーザプロンプトフィルタリング手法である$p1$を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:31:15 GMT)
Direct Segmentation without Logits Optimization for Training-Free Open-Vocabulary Semantic Segmentation [48.8]
Open-vocabulary semantic segmentation (OVSS) は、画像中の任意のカテゴリ領域をopen-vocabulary promptsを用いて分割することを目的としている。セグメント化マップの解析解を直接導出することにより,ロジット最適化プロセスを改善する,より直接的なアプローチを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:14:35 GMT)
ORACLE-SWE: Quantifying the Contribution of Oracle Information Signals on SWE Agents [48.4]
Oracle-SWEは、SWEベンチマークから情報信号を分離して抽出し、各信号がエージェントのパフォーマンスに与える影響を定量化する手法である。これらの評価は、自律型符号化システムの研究を導くことを目的としている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:37:24 GMT)
Novel View Synthesis as Video Completion [48.4]
ビデオ拡散モデルを用いたスパース・ノベル・ビュー・シンセサイザー(NVS)の課題に対処する。ビデオモデルには暗黙の多視点知識がすでに含まれていると論じる。我々は、ビデオモデルを置換不変NVSに適応させるFrameCrafterを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:44:18 GMT)
ACIArena: Toward Unified Evaluation for Agent Cascading Injection [47.5]
ACIArenaはマルチエージェントシステムの堅牢性を評価するためのフレームワークである。複数の攻撃面にまたがる評価スイートと攻撃目標を提供する。 6つの広く使用されているMAS実装をカバーし、1,356のテストケースのベンチマークを提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:03:13 GMT)
GEAR: GEometry-motion Alternating Refinement for Articulated Object Modeling with Gaussian Splatting [47.3]
GEARは、幾何学と運動を相互依存成分として共同でモデル化するEMスタイルの交互最適化フレームワークである。 GEARは部分セグメンテーションを潜在変数として扱い、関節運動パラメータを明示変数として扱い、コンバージェンスと幾何運動の整合性を改善するためにそれらを交互に精製する。複数のベンチマークと新たに構築したデータセットGEAR-Multiによる実験により、GEARは幾何再構成と運動パラメータ推定において最先端の結果が得られることを示した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:24:39 GMT)
The Art of (Mis)alignment: How Fine-Tuning Methods Effectively Misalign and Realign LLMs in Post-Training [47.3]
ミスアライメントされた大きな言語モデル(LLM)は、害を増大させるためにオープンプラットフォームで公開される可能性がある。本研究では, 微調整法の有効性について検討し, その効果について検討した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:20:29 GMT)
InsEdit: Towards Instruction-based Visual Editing via Data-Efficient Video Diffusion Models Adaptation [47.2]
本稿では,HunyuanVideo-1.5をベースとしたインストラクションベースの編集モデルであるInsEditを紹介する。 InsEditは、Mutual Context Attention (MCA)に基づくビジュアル編集アーキテクチャとビデオデータパイプラインを組み合わせる InsEditは,O(100)Kビデオ編集データのみを用いて,我々のビデオ命令編集ベンチマークにおけるオープンソース手法の最先端結果を実現する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:02 GMT)
Keeping an Eye on AI: A Framework for Effective Human Oversight of AI Systems [46.6]
本稿では,AIシステムの効果的な人的監視のための実践的枠組みを推し進める。コンピュータ科学、人間とコンピュータの相互作用、心理学、哲学、法学から洞察を得ている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:35:41 GMT)
ImVideoEdit: Image-learning Video Editing via 2D Spatial Difference Attention Blocks [46.4]
我々は,画像ペアから映像編集能力を学習する効率的なフレームワークImVideoEditを提案する。トレーニング済みの3Dアテンションモジュールを凍結し、画像を単一フレームビデオとして扱うことにより、2次元空間学習プロセスを分離し、元の時間的ダイナミクスの保存を支援する。計算オーバーヘッドが極めて少ない5つのエポックに対して、たった13Kイメージペアをトレーニングしているにも関わらず、ImVideoEditは、広範なビデオデータセットでトレーニングされたより大きなモデルに匹敵する、編集の忠実さと時間的一貫性を実現している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:22:09 GMT)
UniversalVTG: A Universal and Lightweight Foundation Model for Video Temporal Grounding [46.4]
ビデオ時間グラウンド(VTG)は通常、ドメインやクエリスタイル間での転送が不十分なデータセット固有のモデルに対処される。大規模クロスデータセット事前学習で訓練された単一のVTGモデルであるUniversalVTGを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:57:09 GMT)
RoboAgent: Chaining Basic Capabilities for Embodied Task Planning [46.2]
本稿では,エージェントが環境から視覚的観察を取得し,与えられたタスクを達成するためのアトミックアクションを実行する,具体的タスク計画に焦点を当てる。本稿では,機能駆動型計画パイプラインであるRoboAgentを提案する。我々は,(1)専門家プランによる行動クローニング,(2)モデルで収集した軌跡を用いたDAggerトレーニング,(3)専門家ポリシーによる強化学習からなる多段階的パラダイムを用いている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:01:27 GMT)
SAT: Balancing Reasoning Accuracy and Efficiency with Stepwise Adaptive Thinking [46.0]
ステップワイズ・アダプティブ・シンキング(SAT)は、中核的な推論構造を維持しながらステップレベル、難易度を認識したプルーニングを実行するフレームワークである。 SATは、異なる思考モード(スロー、ノーマル、ファスト、スキップ)を持つ有限状態機械(FSM)としての推論を定式化する 9つの LRM と 7 のベンチマークでの実験では、SAT はトークンの推論を最大40%削減し、一般に正確性を維持または改善している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:44:25 GMT)
Symbiotic-MoE: Unlocking the Synergy between Generation and Understanding [45.3]
本稿では,Mixture-of-Experts (MoE) Transformersアーキテクチャにおけるタスク干渉を解決するための統合事前学習フレームワークであるSymbiotic-MoEを提案する。 Modality-Aware Expert Disentanglementは、共有専門家が生成タスクからきめ細かい視覚的意味を吸収することを可能にする。実験により、共生-MoEはクロスモーダルのシナジーを解き放ちながら、迅速に生成的収束を達成できることが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:19:26 GMT)
Guaranteeing Knowledge Integration with Joint Decoding for Retrieval-Augmented Generation [45.1]
GuarantRAGは、証拠統合から推論を明示的に分離するフレームワークである。 5つのQAベンチマークの実験では、GurantRAGは最大で12.1%精度が向上している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:52:21 GMT)
A Soft Robotic Interface for Chick-Robot Affective Interactions [44.8]
新たにハッチしたニワトリ(Gallus gallus)に対する動物中心型ソフトロボット感触インタフェースについて紹介する。ソフトインターフェースは、暖かさ、呼吸のようなリズム変形、顔のような視覚刺激を含む安全で制御可能なキューを提供する。全体として、ニワトリはインターフェースに近づき、インターフェースの近くや近くで時間を過ごし、デバイスが受け入れられたことを実証した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:39:48 GMT)
ViVa: A Video-Generative Value Model for Robot Reinforcement Learning [44.3]
視覚言語アクション(VLA)モデルは、大規模な事前訓練を通じて高度なロボット操作を行うが、部分的な観測可能性と遅延したフィードバックのため、現実の展開は困難なままである。本稿では、事前学習したビデオ生成器を付加して値推定を行うビデオ生成値モデルViVaを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:28:14 GMT)
What Matters in Virtual Try-Off? Dual-UNet Diffusion Model For Garment Reconstruction [43.6]
我々は,VTONと一般潜在拡散モデルから,様々な拡散に基づく戦略を研究・適応する。我々のフレームワークは、主要な指標である DisTS に対して 9.5% の低下で最先端の性能を達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:09:27 GMT)
Few-Shot Incremental 3D Object Detection in Dynamic Indoor Environments [43.4]
FI3Detは,数個の新しいサンプルを用いて,効率的な3次元認識のためのフレームワークである。視覚言語モデル(VLM)を使用して、目に見えないカテゴリの知識を学習する。 FI3Detはベースラインメソッドよりも強力で一貫した改善を実現している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:04:52 GMT)
Multimodal Latent Reasoning via Predictive Embeddings [43.4]
Pearlは、専門的なツール使用トラジェクトリから学習するフレームワークである。 Pearlはモデルに依存しず、トレーニングが簡単で、複数のツールコールでトラジェクトリを自然にサポートする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:27:32 GMT)
Exploring Temporal Representation in Neural Processes for Multimodal Action Prediction [42.7]
本研究では,コンディショナル・ロボティクス(CNP)の自律行動予測への応用について検討する。我々は,既存のDMBN(Deep Modality Blending Network)において,MNSにインスパイアされた優れたモデルを見出した。定性的な定量的評価の後、未知の行動列への一般化の難しさを強調し、時間の内部表現における原因を特定する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:19:08 GMT)
What a Comfortable World: Ergonomic Principles Guided Apartment Layout Generation [42.7]
アーキテクチャ設計の原則を直接変換器に基づく生成プロセスに統合する,新しいアプローチを提案する。トレーニング中にこれらのエルゴノミクス前駆体を用いてモデルを誘導することにより,リビビリティ指標を大幅に改善したレイアウトを生成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:11:01 GMT)
Drift-Based Policy Optimization: Native One-Step Policy Learning for Online Robot Control [42.6]
多段階生成ポリシーは、多モード動作分布をモデル化することにより、ロボット操作において強力な性能を達成する。各アクションは、数十から数百のネットワーク機能評価を必要とする。本稿では,改良を推論からトレーニングにシフトさせる,ネイティブなワンステップ生成ポリシーのための2段階フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:51:50 GMT)
Value-Guidance MeanFlow for Offline Multi-Agent Reinforcement Learning [42.5]
オフラインマルチエージェント強化学習(MARL)は、事前コンパイルされたデータセットから最適なジョイントポリシーを学ぶことを目的としている。本稿では,シンプルなフローベースのポリシー学習フレームワークであるValue Guidance Multi-agent MeanFlow Policy (VGM$2$P)を提案する。 VGM$2$Pは、グローバルなアドバンテージ値を使用してエージェントの協調をガイドし、最適なポリシー学習を条件付き行動クローンとして扱う。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:31:43 GMT)
Zero-shot Multivariate Time Series Forecasting Using Tabular Prior Fitted Networks [42.2]
タブラル基礎モデルは、データ計算からラベル予測まで多岐にわたるタスクにおいて、主要な候補として現れている。本稿では,TabPFN-TSバックボーンを用いた提案手法の有効性について述べる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:00:02 GMT)
AVGen-Bench: A Task-Driven Benchmark for Multi-Granular Evaluation of Text-to-Audio-Video Generation [42.2]
AVGen-Benchは、T2AV生成のためのタスク駆動ベンチマークである。軽量スペシャリストモデルとマルチモーダル大言語モデル(MLLM)を組み合わせた多言語評価フレームワークを提案する。評価の結果,テキストレンダリングの持続的失敗,音声のコヒーレンス,物理的推論,音声ピッチ制御の普遍的破壊など,強い視覚的美学と弱い意味的信頼性のギャップが明らかとなった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:39 GMT)
On Tackling Complex Tasks with Reward Machines and Signal Temporal Logics [42.0]
複雑なタスクを扱うための強化学習(RL)に基づく制御設計フレームワークを提案する。このアプローチは、イベント生成に使用できる信号テンポラル論理(STL)公式を用いて、リワードマシン(RM)の概念を拡張している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:39:12 GMT)
MegaStyle: Constructing Diverse and Scalable Style Dataset via Consistent Text-to-Image Style Mapping [42.0]
私たちは、新しいスケーラブルなデータキュレーションパイプラインであるMegaStyleを紹介します。我々は170Kスタイルのプロンプトと400Kコンテンツプロンプトを備えた多種多様なバランスの取れたプロンプトギャラリーをキュレートし、大規模スタイルのデータセットMegaStyle-1.4Mを生成する。実験は、スタイルデータセットにおけるスタイル内の一貫性、スタイル間の多様性、高品質を維持することの重要性と、提案したMegaStyle-1.4Mの有効性を示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:29:08 GMT)
Complementary Filtering on SO(3) for Attitude Estimation with Scalar Measurements [42.0]
スカラー測定を用いた姿勢推定は、慣性ベクトルが完全に観測されていないだけでなく、特定のボディーフレームベクトルに沿ってのみ測定される場合に自然に発生する。本稿では,SO(3)上の古典的補完フィルタに基づいて,このスカラー出力構造に適合した改良された革新項を持つオブザーバを提案する。この結果から, 共用体フレームベクトルに沿って少なくとも3つの励起ベクトルが測定された場合, ほぼ球面安定性が回復することが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:19:11 GMT)
Ads in AI Chatbots? An Analysis of How Large Language Models Navigate Conflicts of Interest [41.6]
大規模言語モデル(LLM)は、強化学習などの手法により、ユーザの好みに合わせて訓練される。しかし、モデルがユーザーを満足させるだけでなく、広告を通じてモデルを作った会社に収益をもたらすように展開され始めている。これにより、LCMが利害の対立に直面する可能性が生じ、ユーザに対する最も有益な反応が会社のインセンティブと一致しない可能性がある。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:57:50 GMT)
HAWK: Head Importance-Aware Visual Token Pruning in Multimodal Models [41.4]
マルチモーダル大言語モデル(MLLM)では、視覚トークンの急増は推論時間と計算オーバーヘッドを大幅に増加させる。ビジュアルトークンプルーニングは、冗長なビジュアルトークンを削除することでMLLM推論のコストを削減するための有望な戦略である。ホーク(英: Hawk)は、重要トークンの保持を最大化するために視覚タスクにおける注目ヘッドの重要性を知覚する、視覚的重要なトークンのプルーニング手法である。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:09:22 GMT)
GenLCA: 3D Diffusion for Full-Body Avatars from In-the-Wild Videos [41.4]
テキストおよび画像入力から全体アバターを生成・編集するための拡散型生成モデルGenLCAを提案する。中心となるアイデアは、部分的に観測可能な2Dデータからフルボディの3D拡散モデルをトレーニングできる新しいパラダイムである。提案手法の有効性を,多種多様かつ高忠実な生成および編集結果を通じて実証し,既存のソリューションを大きなマージンで上回る結果を得た。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:06:40 GMT)
Latent Anomaly Knowledge Excavation: Unveiling Sparse Sensitive Neurons in Vision-Language Models [40.6]
我々は、異常知識は本質的に訓練済みモデルに埋め込まれているが、潜伏し、未活性化状態のままであると主張している。本稿では、これらの重要な神経信号を特定し、引き起こす訓練不要のフレームワークである潜在異常知識発掘(LAKE)を提案する。我々の研究は、未熟な事前学習知識の標的的活性化として異常検出を再定義するパラダイムシフトを提唱している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:54:25 GMT)
BLaDA: Bridging Language to Functional Dexterous Actions within 3DGS Fields [40.4]
構造化されていない環境では、機能的デクスタラスな把握は意味理解の緊密な統合、正確な3D機能局在化、物理的に解釈可能な実行を要求する。 BLaDAは,開語彙命令を知覚的および制御的制約として根拠として,機能的デキスタス操作のための解釈可能なゼロショットフレームワークである。 BLaDAは、様々なカテゴリやタスクにおける機能的操作の成功率と精度の両方において、既存の手法を著しく上回っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:10:20 GMT)
GALA: Multimodal Graph Alignment for Bug Localization in Automated Program Repair [40.2]
本稿では,マルチモーダル自動プログラム修復(APR)を暗黙的な意味的推測から明示的な構造的推論に移行するフレームワークであるGALAを提案する。 GALAは、まずイメージUIグラフを構築して、視覚要素とその構造的関係をキャプチャし、続いて、このUIグラフをリポジトリレベルの構造と相互参照することで、ファイルレベルのアライメントを実行する。モダリティ間のセマンティクスとリレーショナルの整合性を強制することにより、GALAは高度に正確なビジュアル・ツー・コードマッピングを確立する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:06:25 GMT)
Open-Ended Instruction Realization with LLM-Enabled Multi-Planner Scheduling in Autonomous Vehicles [40.2]
本研究では,大規模言語モデル(LLM)を利用して命令を解釈する命令実現フレームワークを提案する。リアルタイムフィードバックに基づいて、複数のモデル予測制御(MPC)ベースのモーションプランナをスケジュールする実行可能なスクリプトを生成し、計画されたトラジェクトリを制御信号に変換する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:32:21 GMT)
Towards Identification and Intervention of Safety-Critical Parameters in Large Language Models [39.9]
大言語モデル(LLM)の安全性は重要であるが、安全性メカニズムに関する明確な理解の欠如は、安全介入のための正確で信頼性の高い方法論の開発を妨げる。我々は,LLMの安全性に異なるパラメータがどう影響するかを定量化するための,期待された安全影響(ESI)フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:31:42 GMT)
Generative 3D Gaussian Splatting for Arbitrary-ResolutionAtmospheric Downscaling and Forecasting [39.7]
3次元ガウススプラッティング型スケールアウェア・ビジョン・トランス (GSSA-ViT) 鍵パラメータを推定するために、生成的な3Dガウス予測スキームを導入する。スケール対応アテンションモジュールは、スケール間の依存関係をキャプチャするように設計されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:47:49 GMT)
Visually-grounded Humanoid Agents [38.0]
複数のレベルで人間を再現する2層(世界エージェント)のパラダイムを結合したビジュアルグラウンドのヒューマノイドエージェントを紹介した。エージェント層はこれらのアバターを自律的なヒューマノイドエージェントに変換し、第一人物のRGB-D知覚を装備する。実験では、エージェントが堅牢な自律行動を達成することを示し、より高いタスクの成功率と衝突の少ない結果となった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:50:09 GMT)
Are GUI Agents Focused Enough? Automated Distraction via Semantic-level UI Element Injection [37.6]
安全に整合した無害なUI要素をスクリーンショット上にオーバーレイしてエージェントの視覚的接地を誤指示する赤チーム設定を提案する。本手法では,モジュール型エディター-オーバーラッパー-ヴィクティムパイプラインと,複数の候補編集を抽出する反復探索手法を用いる。攻撃は攻撃成功率を最大4.4倍に向上させる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:32:34 GMT)
MT-OSC: Path for LLMs that Get Lost in Multi-Turn Conversation [37.6]
MT-OSC(Sequential Condensation framework)は,ユーザエクスペリエンスを損なうことなく,バックグラウンドでのチャット履歴を効率的に凝縮するフレームワークである。我々はMT-OSCを13の最先端LCMと多様なマルチターンベンチマークで評価し、連続的にマルチターン性能ギャップを狭める。我々は,MT-OSCをマルチターンチャットのスケーラブルなスケーラブルなソリューションとして確立し,制約された入力空間内でのコンテキストのリッチ化,レイテンシと運用コストの低減,性能のバランスを図った。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:39:20 GMT)
EvoLen: Evolution-Guided Tokenization for DNA Language Model [37.5]
EvoLenは、進化的成層と長さ認識デコードを組み合わせることで、モチーフスケールの関数配列単位をよりよく保存するトークンライザである。これらの結果は、トークン化が重要な帰納バイアスをもたらし、進化情報を組み込むことにより、より生物学的に意味があり、解釈可能なシーケンス表現が得られることを示している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:41:28 GMT)
Large Language Model Post-Training: A Unified View of Off-Policy and On-Policy Learning [37.3]
ポストトレーニングは、事前訓練された大きな言語モデルをアライメントされ、デプロイ可能なシステムに変える中心になっている。最近の進歩は、教師付き微調整(SFT)、選好最適化、強化学習(RL)、プロセス監督、検証者誘導法、蒸留、多段パイプラインに及んでいる。この調査では、LLMのポストトレーニングはモデル行動に対する構造化された介入として最もよく理解されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:00:37 GMT)
SIM1: Physics-Aligned Simulator as Zero-Shot Data Scaler in Deformable Worlds [36.9]
本稿では,物理世界におけるシミュレーションを基盤とした物理対応の実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実- このシステムは、シーンをメートル法に一貫性のある双子にデジタル化し、弾性モデリングによって変形可能なダイナミクスをキャラブレートし、拡散に基づく軌道生成によって振る舞いを拡大する。実験により、純粋に合成データに基づいてトレーニングされたポリシーは、実データベースラインと1:15の等価比で同等であり、実世界の展開において90%のゼロショット成功と50%の一般化をもたらすことが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:52 GMT)
Kuramoto Oscillatory Phase Encoding: Neuro-inspired Synchronization for Improved Learning Efficiency [36.6]
視覚変換器に追加の進化相状態として, 内蔵型位相パティオ(KoPE)を導入する。 KoPEは、同期強化構造学習により、視覚モデルのトレーニング、パラメータ、およびデータ効率を改善することができる。 KoPEは、意味的・単眼的セグメンテーション、言語との表現アライメント、および少数ショット抽象的視覚的推論(ARC-AGI)を含む構造化された理解の恩恵を受ける
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:19:50 GMT)
Data Selection for Multi-turn Dialogue Instruction Tuning [36.3]
textbfMDS (Multi-turn Dialogue Selection) は、独立したターンではなく、会話全体をスコアする対話レベルフレームワークである。 MDSは、強力なシングルターンセレクタ、対話レベルスコアラ、ベースラインを3つのマルチターンベンチマークとドメイン内バンキングテストセットで上回る。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:01:26 GMT)
Demystifying OPD: Length Inflation and Stabilization Strategies for Large Language Models [35.7]
オンライン蒸留(OPD)は、より強い教師の監督を生かしながら、生徒の自給自足で生徒モデルを訓練する。トレーニングが進むにつれて、オンラインのロールアウトは急激な長さのインフレーションを受けることができ、乱れた軌道がトレーニングデータを支配します。この乱れ崩壊は、急激な繰り返し飽和と一致し、偏りのある勾配信号を誘導し、厳しい訓練不安定と検証性能の急激な劣化をもたらす。本稿では, 参照型分散制約とロールアウト混合蒸留を組み合わせた安定化OPDフレームワークであるStableOPDを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:58:02 GMT)
On Semiotic-Grounded Interpretive Evaluation of Generative Art [35.6]
生成アート(GenArt)評価器は、表面レベルの画像品質またはリテラルプロンプト順守に固定される。本稿では,Human-GenArt Interaction (HGI)をケースド・セミオーシスとしてモデル化したPircean計算セミオティック理論を定式化することによって,このギャップに対処する。本稿では,HGIにおける記号的意味と指標的意味を明確に評価するSemJudgeを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:30:10 GMT)
Accelerating Transformer-Based Monocular SLAM via Geometric Utility Scoring [35.5]
本稿では,軽量フィードフォワードフレームゲーティングネットワークであるLeanGateを提案する。予測的なプラグアンドプレイモジュールとして、我々のアプローチは冗長フレームの90%以上をバイパスする。 LeanGateはFLOPのトラッキングを85%以上削減し、エンドツーエンドのスループットのスピードアップを5倍にします。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:12:37 GMT)
SEARL: Joint Optimization of Policy and Tool Graph Memory for Self-Evolving Agents [35.5]
本稿では,ツールメモリをベースとした自己進化型エージェントフレームワークSEARLを紹介する。インタラクションエクスペリエンスを直接利用するアプローチとは異なり,本手法では,計画と実行を統合する構造化されたエクスペリエンスメモリを構築している。我々は,知識推論と数学タスクの枠組みを評価し,より実践的で効率的な学習を実現する上での有効性を実証した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:38:47 GMT)
Bit-by-Bit: Progressive QAT Strategy with Outlier Channel Splitting for Stable Low-Bit LLMs [34.7]
我々は、外部チャネル分割を備えたプログレッシブQATフレームワークBit-by-Bitを提案する。提案手法は,(1)精度を段階的に低下させるブロックワイド・プログレッシブ・トレーニング,(2)整数量子化格子のネスト構造,(3)ラウンドリング・アウェア・アウトリー・チャネル分割の3つの重要な要素を統合する。 W2A2設定下では、Bit-by-BitはBitDistillerやEfficientQATといったベースラインをLlama2/3で大幅に上回り、2.25 WikiText2 PPLの損失しか得られない。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:56:39 GMT)
Linear Representations of Hierarchical Concepts in Language Models [34.7]
我々は各階層的な深さと意味領域に特有の線形変換を訓練する。そして、どのように階層が表現空間にエンコードされるかを分析する。全体として、我々の実験で考慮されたすべてのモデルが、高度に解釈可能な線形表現の形で概念階層を符号化していることが分かる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:55:19 GMT)
Tool Retrieval Bridge: Aligning Vague Instructions with Retriever Preferences via Bridge Model [34.1]
あいまいな指示に対するツール検索性能を向上させるため, 簡易なツール検索橋(TRB)手法を提案する。 TRBの助けを借りて、BM25は111.51%までの相対的な改善を実現し、平均NDCGスコアは9.73から19.59に増加した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:15:38 GMT)
PokeGym: A Visually-Driven Long-Horizon Benchmark for Vision-Language Models [33.9]
我々はPokeGymを紹介した。Pokemon Legends: Z-Aは視覚的に複雑な3DオープンワールドであるRole-Playing Gameである。 PokeGymは厳格なコードレベルの分離を強制する:エージェントは生のRGB観測のみで動作するが、独立した評価器はメモリスキャンによって成功を検証する。このベンチマークは、ナビゲーション、インタラクション、混合シナリオにまたがる30のタスク(30-220ステップ)と、3つの命令の粒度(Visual-Guided、Step-Guided、Goal-Only)で構成され、視覚的な接地、セマンティック推論、自律的な探索機能を体系的に分解する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:12:36 GMT)
GaussiAnimate: Reconstruct and Rig Animatable Categories with Level of Dynamics [33.8]
我々は「骨格」と呼ばれるaScaffold-Skin Riggingシステムを提案する。我々は4次元形状のレベルダイナミクスを制御可能かつ表現可能なコンパクトな骨格に圧縮する。我々は、合成データセットと実世界のデータセットの両方にアプローチを検証する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:59 GMT)
QaRL: Rollout-Aligned Quantization-Aware RL for Fast and Stable Training under Training--Inference Mismatch [33.8]
本稿では,QaRL(Rollout Alignment Quantization-Aware RL)を提案する。数学問題に対するQwen3-30B-A3B MoEでは、QaRLは量子化されたロールアウトトレーニングを+5.5で上回り、安定性を改善し、低ビットスループットの利点を保っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:11:46 GMT)
Efficient RL Training for LLMs with Experience Replay [33.7]
良く設計されたリプレイバッファは、劣化することなく、推論計算を大幅に削減できることを示す。良く設計されたリプレイバッファは、劣化することなく、推論計算を大幅に削減できることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:56:12 GMT)
Semantic Noise Reduction via Teacher-Guided Dual-Path Audio-Visual Representation Learning [33.5]
TG-DPは教師主導のデュアルパスフレームワークで、再構築とアライメントを別々の最適化パスに分離する。 TG-DPはゼロショット検索において最先端の性能を達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:08:40 GMT)
Structured Distillation of Web Agent Capabilities Enables Generalization [33.4]
本稿では,人的アノテーションの役割に類似してWebエージェントの合成軌道生成を構築するフレームワークであるAgent-as-Annotatorsを紹介する。 Gemini 3 Proを教師として使用し、6つのWeb環境に3000のトラジェクトリを生成します。結果、WebArenaでは41.5%が達成され、Claude 3.5 Sonnet (36.0%) や GPT-4o (31.5%) といったクローズドソースモデルを上回る結果となった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:04:15 GMT)
A Decomposition Perspective to Long-context Reasoning for LLMs [33.3]
複雑な現実世界のアプリケーションには、長文推論が不可欠である。本稿では,長文推論を基本的原子スキルの集合に分解する。私たちはモデルの原子スキルを磨くために強化学習を採用しています。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:51:47 GMT)
LAMP: Lift Image-Editing as General 3D Priors for Open-world Manipulation [33.0]
LAMPは,物体間3次元変換を連続的かつ幾何学的に認識した表現として抽出するために,画像編集を3次元先行として引き上げる。私たちの重要な洞察は、画像編集は本質的にリッチな2次元空間的手がかりを符号化し、これらの暗黙の手がかりを3次元変換に引き上げることで、オープンワールド操作のためのきめ細かい正確なガイダンスを提供するということです。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:14:00 GMT)
Anamorphic Encryption with CCA Security: A Standard Model Construction [33.0]
アナモルフィック暗号化は秘密通信にとって重要なツールであり、コンパイル後のシナリオにおいても機密性を維持する。我々は、PKAKEM(Public-Key)とSKAKEM(Symmetric-Key)の両方を包含するAnamorphic Key Encapsulation Mechanism(AKEM)を定式化する。本稿では, 標準モデルにおける厳密な形式的証明を提供し, カプセル化キーを制御する「独裁者」に対してレジリエンスを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:49:41 GMT)
WorldMAP: Bootstrapping Vision-Language Navigation Trajectory Prediction with Generative World Models [32.7]
視覚言語モデル(VLM)とジェネレーティブワールドモデル(ジェネレーティブワールドモデル)は、ナビゲーションを具現化する新たな機会を開きつつある。本稿では,世界モデルが生み出す未来を永続的な意味空間構造に変換するフレームワークWorldMAPについて述べる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:21:58 GMT)
Memory Intelligence Agent [32.7]
メモリシステムにより、ディープリサーチエージェント(DRA)は歴史的な経験を活用できる。既存の方法は、推論を助けるために、メモリから類似の軌跡を取得することに依存している。本稿では, Manager-Planner-Executorアーキテクチャからなる新しいメモリインテリジェンスエージェントフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:11:40 GMT)
Order-Optimal Sequential 1-Bit Mean Estimation in General Tail Regimes [32.7]
ランダム化しきい値クエリのみに基づく適応型平均推定器を提案する。我々の推定器のサンプル複雑性は、余分な乗法的な$O(log(/))$ペナルティを持つ。しきい値クエリとより一般的な間隔クエリの両方において、任意の非適応推定器のサンプル複雑性は線形にスケールしなければならない。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:49:21 GMT)
Cram Less to Fit More: Training Data Pruning Improves Memorization of Facts [32.6]
我々は情報理論の観点から事実記憶を定式化する。トレーニングデータ事実に含まれる情報の量がモデル容量を超えると、その精度は(キャパシティ限界以下)最適以下であることが示される。トレーニングデータの事実数を制限し,その頻度分布をフラット化することを目的とした,トレーニング損失のみに基づくデータ選択方式を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:55:50 GMT)
AsyncTLS: Efficient Generative LLM Inference with Asynchronous Two-level Sparse Attention [32.3]
AsyncTLSは、粗粒度ブロックフィルタリングと細粒度トークン選択を組み合わせた階層的スパースアテンションシステムである。 AsyncTLSは、1.2x - 10.0x演算子のスピードアップと1.3x - 4.7xのエンドツーエンドスループットの改善を48k - 96kコンテキストで提供しながら、完全な注意に匹敵する精度を達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:15:16 GMT)
LPM 1.0: Video-based Character Performance Model [32.3]
本稿では,LPM 1.0(Large Performance Model)について述べる。厳密なフィルタリング、音声とビデオのペアリングによるパフォーマンス理解により、人間中心のデータセットを構築する。我々はこれを低レイテンシで無限長の相互作用のために因果ストリーミングジェネレータ(オンラインLPM)に蒸留する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:26:09 GMT)
HiFloat4 Format for Language Model Pre-training on Ascend NPUs [32.2]
最近の研究は、4ビット浮動小数点(FP4)フォーマットが大規模言語モデル(LLM)における線形GEMM操作にうまく適用可能であることを示した。本研究では,Huawei Ascend NPU向けに最近提案されたHiFloat4 FP4フォーマットを調査し,大規模トレーニング環境でMXFP4と体系的に比較する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 23:50:56 GMT)
MeshOn: Intersection-Free Mesh-to-Mesh Composition [31.7]
本稿では,2つの入力メッシュの物理的および意味的リアルな構成を見つける方法であるMeshOnを提案する。アクセサリ、ユーザ定義のターゲットリージョンを備えたベースメッシュ、および両方のメッシュのためのオプションのテキスト文字列が与えられたら、MeshOnは、メッシュを現実的に適合させるために、マルチステップ最適化フレームワークを使用する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:14:56 GMT)
SonoSelect: Efficient Ultrasound Perception via Active Probe Exploration [31.5]
本研究では,現在の観測結果に基づいてプローブ運動を適応的に誘導する超音波特異的なソノセレクトを提案する。超音波シミュレータによる実験により,SanoSelectはN点中2点のみを用いて,有望な多視点臓器分類精度を達成できた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:42:30 GMT)
Faithful GRPO: Improving Visual Spatial Reasoning in Multimodal Language Models via Constrained Policy Optimization [31.4]
Chain-of-Thoughtトレースは、最終的な回答と矛盾することが多く、視覚的証拠が不十分である。ラグランジアン二重昇華による制約として整合性と接地を強制するFithful GRPOを提案する。その結果,FGRPOは推論品質を大幅に改善し,不整合率を24.5%から1.7%に下げ,視覚的接点スコアを+13%改善した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:15:47 GMT)
MemReader: From Passive to Active Extraction for Long-Term Agent Memory [31.4]
本稿では,エージェントシステムにおけるアクティブな長期メモリ抽出のためのMemReaderファミリについて紹介する。 MemReader-4Bは、行動前の情報値、参照あいまいさ、完全性を明確に評価する。 MemReaderはMemOSに統合され、現実世界のアプリケーションにデプロイされている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:47:17 GMT)
EPIR: An Efficient Patch Tokenization, Integration and Representation Framework for Micro-expression Recognition [31.1]
我々は、EPIR(EPIR)の効率的なパッチトークン化、統合、表現フレームワークを提案する。 EPIRは高い認識性能と低い計算複雑性のバランスをとることができる。 4つの人気のある公開データセットについて広範な実験を行う。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:24:17 GMT)
An Empirical Study on Influence-Based Pretraining Data Selection for Code Large Language Models [30.7]
本稿では,プログラム関連データセットのコンテキストにおけるデータ影響スコアフィルタリングの有効性について検討する。私たちは、1000億のコードトークンのデータセットで、スクラッチから10億のパラメータを持つCode-LLMを事前トレーニングします。この結果から,検証-集合-ロスに基づくデータ影響スコアフィルタリングにより,モデルプログラミング性能が向上する可能性が示唆された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:48:11 GMT)
SurfelSplat: Learning Efficient and Generalizable Gaussian Surfel Representations for Sparse-View Surface Reconstruction [30.7]
3D Gaussian Splatting (3DGS) は3Dシーン再構成において顕著な性能を示した。スパースビュー画像から効率よく一般化可能な画素アライメントを生成できるフィードフォワードフレームワークであるSurfelSplatを提案する。我々のモデルは最先端の手法で同等の結果を得ることができ、1秒以内でガウス波を予測でき、100倍のスピードアップが可能であり、シーンごとのトレーニングに費用がかからない。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:34:24 GMT)
PyVRP$^+$: LLM-Driven Metacognitive Heuristic Evolution for Hybrid Genetic Search in Vehicle Routing Problems [30.4]
メタ認知プログラミング(MEP)は,大規模言語モデルを戦略的発見エージェントに高めるフレームワークである。以上の結果から,MEPはオリジナルのHGSベースラインよりも大幅な性能向上を実現し,ソリューション品質を最大2.70%向上し,VRPの課題に対してランタイムを45%以上削減した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:36:15 GMT)
From Selection to Scheduling: Federated Geometry-Aware Correction Makes Exemplar Replay Work Better under Continual Dynamic Heterogeneity [29.8]
本稿では、FEATと呼ばれるフェデレーションgEometry-Aware correcTion法を提案する。クライアント間の頻繁なクラスにレアクラスの機能をドラッグする、不均衡によって引き起こされる表現の崩壊を軽減する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:17:27 GMT)
Toward Hardware-Agnostic Quadrupedal World Models via Morphology Conditioning [29.3]
我々は、一般化可能な四足歩行世界モデルをトレーニングするためのフレームワークへの一歩を踏み出した。ロボットの工学的仕様に生成力学を明示的に規定する。我々は、初めて、ゼロショットの一般化を可能にする世界モデルを導入し、ロコモーションの新しい形態について紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:31:24 GMT)
Behavior-Aware Item Modeling via Dynamic Procedural Solution Representations for Knowledge Tracing [29.2]
本稿では,動的手続き的ソリューション情報を統合することで,アイテム表現を充実させるフレームワークである行動認識アイテムモデリング(BAIM)を提案する。 BAIMは推論言語モデルを利用して、各項目の解を4つの問題解決段階に分解する。 XES3G5M と NIPS34 の実験では、BAIM は強い事前学習ベースラインを一貫して上回っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:47:39 GMT)
SciFigDetect: A Benchmark for AI-Generated Scientific Figure Detection [29.0]
我々は,AIによる科学的人物検出のための最初のベンチマークを示す。その結果、現在の手法はゼロショット転送で劇的に失敗し、強力なジェネレータ固有のオーバーフィッティングを示し、一般的な後処理の腐敗の下でも脆弱であることがわかった。このベンチマークが、堅牢で一般化可能な科学フィギュア法医学研究の基盤となることを願っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:11:01 GMT)
ReRec: Reasoning-Augmented LLM-based Recommendation Assistant via Reinforcement Fine-tuning [28.9]
ReRecは複雑なレコメンデーションタスクにおけるLLM推論を改善するために設計された新しい強化微調整(RFT)フレームワークである。本フレームワークでは,(1)デュアルグラフ強化リワード整形,(2)推論対応アドバンテージ推定,(3)オンラインカリキュラムスケジューリングの3つの重要なコンポーネントを紹介する。実験により、ReRecは最先端のベースラインより優れ、命令追従や一般的な知識といったコア能力を保ちます。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:07:03 GMT)
Plug-and-Play Logit Fusion for Heterogeneous Pathology Foundation Models [28.7]
軽量で斬新なモデル融合戦略であるLogitProdを紹介する。独立に訓練されたFMベースの予測器を固定専門家として扱い、スライドレベルの出力よりもサンプル適応型融合重みを学習する。 LogitProdは、まず20/22タスクにランク付けし、最強のシングルエキスパートに対して、全タスクの平均パフォーマンスを3%向上させる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:10:54 GMT)
From Gaze to Guidance: Interpreting and Adapting to Users' Cognitive Needs with Multimodal Gaze-Aware AI Assistants [28.6]
我々は、視線オーバーレイを用いた自我中心ビデオを用いた、視線付きマルチモーダルLLMアシスタントを提案する。従来のLLMアシスタントと比較して、視線認識アシスタントははるかに正確でパーソナライズされた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:25:42 GMT)
Coordinate-Based Dual-Constrained Autoregressive Motion Generation [28.4]
コーディネートに基づくDual-Constrained Autoregressive Motion Generation (CDAMD) という,柔軟で高忠実でセマンティックに忠実なテキスト・トゥ・モーション・フレームワークを提案する。運動座標を入力として、CDAMDは自己回帰パラダイムに従い、拡散誘起多層パーセプトロンを利用して予測運動の忠実性を高める。座標に基づく動き合成には限界があるため、テキスト・ツー・モーション生成とモーション編集の両面での新しいベンチマークを確立する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:05:29 GMT)
ESOM: Efficiently Understanding Streaming Video Anomalies with Open-world Dynamic Definitions [27.9]
オープンワールドビデオ異常検出(OWVAD)は、異なる異常定義の下で異常事象を検出し、説明することを目的としている。最近のMLLMベースの手法は、将来有望なオープンワールドの一般化を示しているが、それでも3つの大きな制限に悩まされている。本稿では,トレーニング不要な効率的なストリーミングOWVADモデルであるESOMを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:51:14 GMT)
How Far Are Large Multimodal Models from Human-Level Spatial Action? A Benchmark for Goal-Oriented Embodied Navigation in Urban Airspace [27.6]
大規模マルチモーダルモデル(LMM)は、視覚言語学的推論が強いが、空間的決定と行動の能力は未だ不明である。都市3次元空間における目標指向ナビゲーションにおいて,LMMが人間のような具体的空間行動を実現することができるかどうかを検討する。実験によると、現在のLMMは新たな行動能力を示すが、人間レベルの性能には及ばない。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:37:20 GMT)
Can LLMs Deobfuscate Binary Code? A Systematic Analysis of Large Language Models into Pseudocode Deobfuscation [27.6]
BinDeObfBenchは、LLMベースのバイナリ難読化を評価するための最初の包括的なベンチマークである。推論モデルは、激しい難読化の下で堅牢性を維持することができる。コンテキスト内学習は標準モデルにはメリットがあるが、推論モデルには限界がある。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:56:06 GMT)
Lightweight LLM Agent Memory with Small Language Models [27.3]
LightMemは、Small Language Models (SLM)によって駆動されるより優れたエージェントメモリのための軽量メモリシステムである。我々は,記憶を即時会話のための短期記憶(STM),再利用可能な対話要約のための中期記憶(MTM),統合された知識のための長期記憶(LTM)に整理する。実験の結果,LoCoMoではF1が平均2.5向上し,より効率的で中央値の低いレイテンシ(83ms検索,581msエンドツーエンド)が得られた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:51:07 GMT)
Act Wisely: Cultivating Meta-Cognitive Tool Use in Agentic Multimodal Models [27.3]
HDPOは、ツールの効率を競合するスカラー目標から厳格な条件に書き換えるフレームワークです。私たちのモデルであるMetisは、推論精度を同時に高めながら、ツールの呼び出しを桁違いに削減します。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:57 GMT)
CrashSight: A Phase-Aware, Infrastructure-Centric Video Benchmark for Traffic Crash Scene Understanding and Reasoning [27.2]
textbfCrashSightは,現実の道路カメラデータを用いた道路事故理解のための視覚ベンチマークである。データセットは250のクラッシュビデオで構成されており、2階層の分類の下で構成された13Kの質問応答ペアが注釈付けされている。我々は8つの最先端のVLMをベンチマークし、強いシーン記述能力にもかかわらず、現在のモデルは安全クリティカルなシナリオにおける時間的・因果的推論に苦戦していることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:52:04 GMT)
TEC: A Collection of Human Trial-and-error Trajectories for Problem Solving [27.1]
データアノテーションプラットフォームとそれに対応するデータセットであるTrial-and-Error Collection(TEC)を導入する。 TECは、ユーザの完全な軌道を複数のトライアルで記録し、エラーフィードバックを受けた後にリフレクションを収集する。 LLMと比較して人間の方が精度がかなり高いことが観察された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:19:37 GMT)
SCMAPR: Self-Correcting Multi-Agent Prompt Refinement for Complex-Scenario Text-to-Video Generation [27.1]
ステージワイドマルチエージェントリファインメントプロセスとして,複雑なシナリオのプロンプトリファインメントを定式化する。 SCMAPRは特定のエージェントをコーディネートし、各プロンプトを戦略選択のための分類上のシナリオにルーティングする。本稿では,T2V-Complexityという,複雑なScenarioプロンプトのみからなるT2Vベンチマークを紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:33:58 GMT)
SMART: When is it Actually Worth Expanding a Speculative Tree? [27.0]
ツリーベースの投機的復号化は、分岐したツリードラフトトークンを単一のターゲットモデルフォワードパスで検証することにより、自己回帰生成を加速する。既存の方法では、重要な効率パラドックスを無視しながら、受理トークン数のトークンレベル確率の最大化が優先されている」。本稿では,実行木構築のためのシステム対応限界解析フレームワークSMARTを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:17:56 GMT)
AI generates well-liked but templatic empathic responses [26.7]
人々は、大きな言語モデル応答を、人間が書いた応答よりも共感的に評価します。我々は10の共感的言語「戦術」の分類法を開発する。 LLM応答は談話機能レベルで非常に定式化されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:22:42 GMT)
HyperMem: Hypergraph Memory for Long-Term Conversations [26.2]
長期的な記憶は、会話エージェントがコヒーレンスを維持し、永続的なタスクを追跡し、拡張された対話を通してパーソナライズされた対話を提供するのに不可欠である。ハイパーグラフに基づく階層型メモリアーキテクチャであるHyperMemを提案する。我々は,HyperMemが92.73% LLM-as-a-judgeの精度で最先端性能を実現し,長期会話におけるHyperMemの有効性を実証した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:43:23 GMT)
Can LoRA Fusion Support Cross-Domain Tasks in Cloud-Edge Collaboration? [26.2]
クラウドホスト型大規模言語モデル(LLM)は一般的にドメイン適応にLoRAに依存している。ドメインデータは複数のエッジデバイスに分散しており、プライバシの制約によりアップロードできない。本稿では,プライバシ保護クラウド統合とプルーニングモデルを用いたローカルLoRAトレーニングを実現するフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:33:08 GMT)
AtomEval: Atomic Evaluation of Adversarial Claims in Fact Verification [25.8]
敵のクレーム書き換えはファクトチェックシステムをテストするために広く使われているが、標準的なメトリクスは真理条件の整合性を捉えることができない。 AtomEvalは,クレームを主観的関連オブジェクト修飾子原子に分解する妥当性を考慮した評価フレームワークである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:32:35 GMT)
Uni-ViGU: Towards Unified Video Generation and Understanding via A Diffusion-Based Video Generator [25.8]
視覚生成は、特にビデオにおいて、理解するよりも計算コストがかなり高い。ビデオジェネレータを基盤として拡張することで、映像生成と理解を統一するフレームワークであるUni-ViGUを提案する。実験により、Uni-ViGUは映像生成と理解の両方において競争性能を発揮することが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:41:58 GMT)
$\oslash$ Source Models Leak What They Shouldn't $\nrightarrow$: Unlearning Zero-Shot Transfer in Domain Adaptation Through Adversarial Optimization [25.5]
ドメイン間のビジョンモデルの適用の増加は、プライバシーのリスクを増大させている。モデルは必然的に、ターゲットドメイン内の機密なソースドメイン固有の情報を保持し、リークすることがある。そこで本研究では,ドメイン適応過程において,逆向きに生成されたクラスサンプルをモデルから解放するアンラーニング手法を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:30:24 GMT)
Alloc-MoE: Budget-Aware Expert Activation Allocation for Efficient Mixture-of-Experts Inference [25.3]
本稿では,専門家のアクティベーション数に対する制約として,エフェクティベーション予算の概念を導入する。性能劣化を最小限に抑えるため,各層およびトークンレベルで予算配分を協調的に最適化する統合フレームワークであるAlloc-MoEを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:50:21 GMT)
Conformal Margin Risk Minimization: An Envelope Framework for Robust Learning under Label Noise [25.3]
雑音ラベルで学習するプラグイン・アンド・プレイ・エンベロープ・フレームワークである Conformal Margin Risk Minimization (CMRM) を提案する。 CMRMは、観測されたラベルと競合するラベルの間の信頼率を測定し、バッチ毎に推定される共形量子量で閾値付けする。我々は,任意のラベル雑音下でCMRMの学習境界を導出し,マージン分布の緩やかな規則性しか必要としない。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 23:19:31 GMT)
TASU2: Controllable CTC Simulation for Alignment and Low-Resource Adaptation of Speech LLMs [25.0]
音声LLMポストトレーニングは、効率的なクロスモーダルアライメントとロバストな低リソース適応に依存している。 TASUのようなテキストのみのアライメント手法は、CTC後部を転写からシミュレートすることで、この負担を軽減する。 WERの範囲でCTC後部分布をシミュレートする制御可能なCTCシミュレーションフレームワークである textbfTASU2 を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:44:45 GMT)
Weight Group-wise Post-Training Quantization for Medical Foundation Model [25.0]
学習後量子化アルゴリズムPermutation-COMQを提案する。単純なドット製品や丸め操作を使用することで、バックプロパゲーションの必要性を排除します。実験により,本手法は2ビット,4ビット,8ビットの量子化において最良の結果が得られることが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:34:27 GMT)
Justified or Just Convincing? Error Verifiability as a Dimension of LLM Quality [24.6]
モデル生成の正当化が、ユーザーが正しい回答を正しく区別するのに役立つかどうかに関して、標準的な手段は存在しない。我々は、このアイデアを誤り検証可能性として形式化し、正当性によってレーダが解答正当性を正確に評価できるかどうかを測るバランスの取れた指標である$v_textbal$を提案する。本稿では, 数学的推論のためのリフレクション・アンド・リフレーズ (RR) と, 事実QAのためのオラクル・リフレーズ (OR) の2つの手法を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:14:22 GMT)
GRASS: Gradient-based Adaptive Layer-wise Importance Sampling for Memory-efficient Large Language Model Fine-tuning [24.5]
レイヤワイドな微調整手法が代替として登場し、メモリ効率のトレーニングを可能にした。勾配に基づく適応層ワイド・プライバシ・サンプリング・フレームワークを提案する。我々は常に最先端の手法を上回り、平均精度は4.38ポイントまで向上し、メモリ使用量を19.97%削減した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:04:37 GMT)
Fail2Drive: Benchmarking Closed-Loop Driving Generalization [24.4]
Fail2Driveは、CARLAで一般化された最初のペアルートベンチマークである。各シフトした経路は、分配されていない経路と一致し、シフトの効果を分離し、定性的障害を診断に変換する。我々の分析では、LiDARではっきりと見える物体を無視したり、自由空間と占有空間の基本的な概念を学べなかったり、予期せぬ失敗モードを明らかにした。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:18 GMT)
Static Program Slicing Using Language Models With Dataflow-Aware Pretraining and Constrained Decoding [24.3]
静的プログラムスライシングは、特定の変数に関連するコードを分離するための基本的なソフトウェア工学技術である。言語モデル(LM)を用いた最近の学習ベースアプローチは、不正確な依存性モデリングと制約のない生成に悩まされている。そこで我々はSliceformerを提案する。Sliceformerは静的プログラムスライシングを小さな言語モデルを用いてシーケンス・ツー・シーケンス・タスクとして再構成する新しい手法である。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:46:06 GMT)
PhyEdit: Towards Real-World Object Manipulation via Physically-Grounded Image Editing [24.1]
画像編集フレームワークであるPhyEditを開発した。このプラグアンドプレイ3Dとジョイント2D-3Dの監督を組み合わせることで,物理的精度と操作の整合性を効果的に向上する。ペア画像と奥行きアノテーションを備えた3次元オブジェクト操作のための実世界のデータセットであるRealManip-10Kを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:01:59 GMT)
AnchorSplat: Feed-Forward 3D Gaussian Splatting with 3D Geometric Priors [23.9]
シーンレベルの再構築のための新しいフィードフォワード3DGSフレームワークであるAnchorSplatを提案する。アンカーアラインのガウス表現は3次元幾何学的先行によって導かれる。設計により、必要なガウス人の数は大幅に減少する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:54:56 GMT)
Adaptive Depth-converted-Scale Convolution for Self-supervised Monocular Depth Estimation [23.9]
本稿では,DcSConv(Depth-converted-Scale Convolution)を改良した単眼深度推定フレームワークを提案する。提案したDcSConvは、形状の局所的な変形ではなく、畳み込みフィルタの適応スケールに焦点を当てている。 Depth-converted-Scale aware Fusion (DcS-F) はDcSConv機能と従来の畳み込み機能とを適応的に融合させる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:14:56 GMT)
DP-DeGauss: Dynamic Probabilistic Gaussian Decomposition for Egocentric 4D Scene Reconstruction [23.8]
自己中心型4次元再構成のための動的確率ガウス分解フレームワークDP-DeGaussを紹介する。提案手法は,COLMAP先行値から統一された3次元ガウス集合を初期化し,学習可能なカテゴリ確率で拡張し,それらを動的に特殊変形枝にルーティングする。実験の結果、DP-DeGaussはPSNRのベースラインを+1.70dBで上回り、SSIMとLPIPSは上昇した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:55:39 GMT)
EditCaption: Human-Aligned Instruction Synthesis for Image Editing via Supervised Fine-Tuning and Direct Preference Optimization [23.8]
トレーニング用トリップレット(正確な編集命令付きソースターゲットイメージペア)は、命令誘導画像編集モデルのスケーリングにおいて重要なボトルネックとなる。 VLMに基づく命令合成のためのスケーラブルな2段階後学習パイプラインであるEditCaptionを提案する。 Eval-400、ByteMorph-Bench、HQ-Editでは、Qwen3-VLモデルがオープンソースベースラインを上回っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:11:33 GMT)
Image-Guided Geometric Stylization of 3D Meshes [23.4]
本稿では3次元メッシュを変形させて画像のスタイルを表現できる幾何学的スタイリングフレームワークを提案する。我々の粗大なスタイリングパイプラインは、入力された3Dモデルを劇的に変形させ、多様な幾何学的バリエーションを表現できる。また、メッシュレンダリングから効率よく信頼性の高い勾配を提供する、近似的なVAEエンコーダを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:44:42 GMT)
PolicyLong: Towards On-Policy Context Extension [23.3]
本稿では,データ構築を動的なオン・ポリティクスパラダイムにシフトするポリシLongを提案する。データスクリーニングを反復的に再実行することで、PolicyLongは、進化する能力のトレーニングディストリビューショントラックを保証する。 PolicyLong は EntropyLong と NExtLong を一貫して上回っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:07:57 GMT)
TrajGuard: Streaming Hidden-state Trajectory Detection for Decoding-time Jailbreak Defense [22.7]
既存のジェイルブレイク防御パラダイムは、プロンプト、出力、内部状態の静的検出に依存している。復号時に重要な層に隠された状態は、入力されたジェイルブレイクのプロンプトよりも強く、より安定したリスク信号を持っていることを示す。トレーニング不要でデコード可能なディフェンスフレームワークであるTrajGuardを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:22:44 GMT)
Twitch Third-Party Developers' Support Seeking and Provision Practices on Discord [22.5]
サードパーティ開発者(TPD)は、プラットフォームから即時応答が得られない場合、しばしばオンラインコミュニティにサポートを求める。 Twitchはライブストリーミングプラットフォームとして、多くのPDを惹きつけ、Discord上でオンラインサポートコミュニティを形成した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:29:15 GMT)
MedThink: Enhancing Diagnostic Accuracy in Small Models via Teacher-Guided Reasoning Correction [22.4]
小言語モデルにおけるロバストな臨床推論を育むための2段階蒸留フレームワークであるMedThinkを提案する。第1段階では、教師のLLMがデータをスクリーニングし、ドメイン知識の説明を注入し、学生モデルを微調整する。第2段階では、教師は、生徒の誤りを評価し、知識をリンクして答えを正す推論連鎖を生成し、生徒の診断的推論を洗練させる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:00:47 GMT)
Filling the Gaps: Selective Knowledge Augmentation for LLM Recommenders [22.3]
本稿では,知識ギャップ問題を軽減するために,ノウSA_CKP (Knowledge-aware Selective Augmentation with Comparison Knowledge Probing)を提案する。 KnowSA_CKPは、LLMの内部知識を、協調関係を捉える能力を評価することによって推定する。 4つの実世界のデータセットのレコメンデーション精度とコンテキスト効率を一貫して改善する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:27:04 GMT)
Awakening the Sleeping Agent: Lean-Specific Agentic Data Reactivates General Tool Use in Goedel Prover [22.2]
Goedel-Prover-V2 を用いて形式数学の現象を研究する。ドメインの特殊化の後、モデルは有効なツールコールを生成する能力がほとんど完全に失われます。少数のリーン固有のツール使用データに基づいて、専門的なモデルを微調整します。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:47:29 GMT)
Task-Aware Bimanual Affordance Prediction via VLM-Guided Semantic-Geometric Reasoning [22.1]
双方向操作は、オブジェクトとどこで相互作用し、どのアームがそれぞれのアクションを実行するべきかを推論する必要がある。既存のアプローチでは、余剰予測を粗い部分のセグメンテーションとして扱うか、または腕の割り当てに幾何学に依存している。本稿では,タスク対応型バイマニュアルアプライアンス予測のための階層的枠組みを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:39:45 GMT)
Self-Debias: Self-correcting for Debiasing Large Language Models [21.7]
Self-Debiasは、固有の自己粒度の機能を組み込むために設計されたプログレッシブなフレームワークである。幅広い罰則を適用する標準的な選好最適化とは異なり、セルフ・デビアスは動的偏りの制約を対象とする微妙な目標を用いる。 20kのアノテートサンプルだけで、セルフデビアスは効率的な自己補正を活性化し、優れたデバイアス性能を達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:33:50 GMT)
Evidential Transformation Network: Turning Pretrained Models into Evidential Models for Post-hoc Uncertainty Estimation [21.7]
本研究では,事前学習した予測器を明らかなモデルに変換する軽量なポストホックモジュールであるエビデンシャルトランスフォーメーションネットワーク(ETN)を提案する。 ETNは、精度を保ち、計算オーバーヘッドを最小限に抑えながら、ポストホックベースラインに対する不確実性評価を一貫して改善する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:09:47 GMT)
Inside-Out: Measuring Generalization in Vision Transformers Through Inner Workings [21.7]
1)デプロイ前、ラベルのないターゲットデータに対して最適なモデルを選択する方法、(2)デプロイ後、分散シフト時のモデルパフォーマンスを監視する方法、の2つの実践シナリオに注目した。我々は、一般化性能の予測指標として、モデルの内部構造、すなわち回路を用いる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:44:19 GMT)
SOLAR: Communication-Efficient Model Adaptation via Subspace-Oriented Latent Adapter Reparametrization [21.4]
SOLARは、PEFTアダプタの通信コストを大幅に削減する後処理圧縮フレームワークである。モデルに依存しず、LoRA、AdaLoRA、その他のアダプタモジュールを含む既存のPEFTメソッドと互換性がある。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:34:13 GMT)
PIArena: A Platform for Prompt Injection Evaluation [21.3]
プロンプトインジェクション攻撃は、様々な現実世界のアプリケーションに深刻なセキュリティリスクをもたらす。コミュニティは重要なギャップに直面している。インジェクションを迅速に評価するための統一されたプラットフォームが欠如している。 PIArenaを使うことで、ユーザは最先端の攻撃と防御を簡単に統合し、さまざまな既存および新しいベンチマークでそれらを評価できる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:42:45 GMT)
TTVS: Boosting Self-Exploring Reinforcement Learning via Test-time Variational Synthesis [21.1]
テスト時間変動合成(TTVS)は,大規模推論モデルの自己展開を可能にする新しいフレームワークである。 TTVSは静的なテストクエリを、多様な意味論的に等価なバリエーションの動的ストリームに変換する。 TTVSは8つのモデルアーキテクチャで優れた性能を示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:03:49 GMT)
Face-D(^2)CL: Multi-Domain Synergistic Representation with Dual Continual Learning for Facial DeepFake Detection [21.1]
継続的な学習は、顔のディープフェイク検出モデルをフォージェリパターンに適応するための効果的なアプローチを提供する。顔のディープフェイク検出のためのフレームワークFace-D(2)CLを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:18:42 GMT)
SyncBreaker:Stage-Aware Multimodal Adversarial Attacks on Audio-Driven Talking Head Generation [20.9]
拡散に基づく音声駆動音声ヘッド生成は、リアルなポートレートアニメーションを可能にするが、詐欺や誤報などの誤用の危険性ももたらしている。我々は,モダリティ固有の知覚的制約の下で,ポートレートとオーディオ入力を共同で摂動する,段階認識型マルチモーダル保護フレームワークSyncBreakerを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:03:24 GMT)
Model Space Reasoning as Search in Feedback Space for Planning Domain Generation [20.7]
自然言語記述から計画領域を生成するためのエージェント言語モデルフィードバックフレームワークについて検討する。ランドマークを含む記号的フィードバックの様々な形態で生成されたドメインの品質を評価する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:05:23 GMT)
Fundus-R1: Training a Fundus-Reading MLLM with Knowledge-Aware Reasoning on Public Data [20.7]
眼底画像検査は網膜異常や疾患の早期発見に不可欠である。タスクに対処するための新しいアプローチは、ジェネリックマルチモーダル大言語モデル(MLLM)のポストトレーニングである。我々は,Fundus-R1と呼ぶMLLMを,公開データセットのみを用いて学習する新しい試みを行っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:55:22 GMT)
CausalVAE as a Plug-in for World Models: Towards Reliable Counterfactual Dynamics [20.3]
CausalVAEは、潜在世界モデルのためのプラグイン構造モジュールとして導入された。本研究は、競合する事実予測を保存し、プラグインの追加後に介入対応の事実検索を改善する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:56:06 GMT)
A Comparative Study of Semantic Log Representations for Software Log-based Anomaly Detection [20.3]
我々は広く使われているセマンティックログ表現法をベンチマークした。本稿では,新しい意味ログ表現法であるQTyBERTを提案する。以上の結果から,QTyBERT生成のログ埋め込みはBERT生成のログ埋め込みと同等かそれ以上の精度で検出できることがわかった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:30:04 GMT)
DiffVC: A Non-autoregressive Framework Based on Diffusion Model for Video Captioning [20.0]
ビデオキャプションのための拡散モデルに基づく非自己回帰フレームワーク(DiffVC)を提案する。筆者らが提案する識別条件拡散モデルにより,高品質なテキスト記述を生成できる。 MSVD, MSR-VTT, VATEXによる実験により, 本手法は従来の非自己回帰法よりも優れていることが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:56:49 GMT)
A Generalized Sinkhorn Algorithm for Mean-Field Schrödinger Bridge [19.9]
平均フィールド・シュルディンガー橋(英語版)(MFSB)問題は、非局所相互作用を持つ拡散過程を一定期限で所定の分布に到達させる最小効果制御器を設計することに関するものである。シュルディンガー橋とは異なり、MFSBの動的制約は反発制御を持つ相互作用剤の集団である。 MFSBのためのHopf-Coleアルゴリズムの一般化を提案し、それを構築する上で、関連するシステム積分PDEを解決するシンクホーン型アルゴリズムを設計する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:35:00 GMT)
Efficient Dataset Selection for Continual Adaptation of Generative Recommenders [19.8]
本研究では,時間分布のドリフトによる性能劣化を緩和する手法を提案する。ユーザインタラクションデータの小さいが情報に富むサブセットをキュレートするための表現選択とサンプリング戦略について検討する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:48:52 GMT)
Aligning Agents via Planning: A Benchmark for Trajectory-Level Reward Modeling [19.8]
Plan-RewardBench(プラン・リワードベンチ)は、判断者が選好と選好の選好をいかに区別するかを評価するために設計された軌道レベルの選好ベンチマークである。 Plan-RewardBench は、 (i) Safety Refusal、 (ii) Tool-Irrelevance / Unavailability、 (iii) Complex Planning、 (iv) Robust Error Recovery の4つの代表的なタスクファミリをカバーする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:35:06 GMT)
Revise: A Framework for Revising OCRed text in Practical Information Systems with Data Contamination Strategy [19.3]
Reviseは、OCRが導入したエラーを文字、単語、構造レベルで体系的に修正するフレームワークである。実験結果から,OCR出力を効果的に補正し,文書内容のより構造化された表現と体系的な管理を可能にした。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:35:19 GMT)
Meta-learning In-Context Enables Training-Free Cross Subject Brain Decoding [19.3]
本稿では,fMRIによる意味的視覚的デコードのためのメタ最適化手法を提案する。我々のアプローチは、新しい主題の符号化モデルのコンテキスト内学習に明示的に最適化されている。様々な視覚的バックボーンにまたがる強力なクロスオブジェクトとクロススキャナの一般化を,リトレーニングや微調整を伴わずに示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:32 GMT)
PanoSAM2: Lightweight Distortion- and Memory-aware Adaptions of SAM2 for 360 Video Object Segmentation [19.2]
360ビデオオブジェクトセグメンテーション(360VOS)は、360ビデオにおいて時間的に一貫性のあるマスクを予測することを目的としている。 SAM2の軽量歪みおよびメモリ認識適応戦略に基づく新しい360VOSフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:17:47 GMT)
Sumo: Dynamic and Generalizable Whole-Body Loco-Manipulation [19.0]
本論文は,足のロボットが全身のデキスタリティで大型で重い物体を操作できるようにする,シム・トゥ・リアルなアプローチを提案する。トレーニング済みの全身制御ポリシをサンプルベースプランナでテストタイムステアリングすることにより、これらのロボットが様々な動的ロコ操作タスクを解くことができる。実世界におけるSpot四足歩行ロボットにおける,様々な難解なロコ操作タスクを通じて,我々のアプローチの能力を実証する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:49:40 GMT)
SkillClaw: Let Skills Evolve Collectively with Agentic Evolver [18.9]
マルチユーザエージェントエコシステムにおける集合的スキル進化のためのフレームワークであるSkillClawを紹介する。 SkillClawは、クロスユーザとオーバータイムのインタラクションを、スキル向上のための主要なシグナルとして扱う。使用中に生成された軌跡を連続的に集約し、自律的な進化器で処理する。得られたスキルは共有リポジトリに保持され、ユーザ間で同期される。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:38:27 GMT)
Post-Quantum Cryptography-Based Bidirectional Authentication Key Exchange Protocol and Industry Applications: A Case Study of Instant Messaging [18.9]
本研究では,量子後暗号(PQC)に基づく双方向認証鍵交換プロトコルを提案する。 PQCベースのDSA(Digital Signature Algorithm)とPQCベースのKEMを組み合わせたデュアル使用証明書を導入している。これらの二重使用証明書は、PQCベースのDSA公開鍵とPQCベースのKEM公開鍵を使用して、双方向認証と暗号化の要件を満たす。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:32:56 GMT)
EvoGymCM: Harnessing Continuous Material Stiffness for Soft Robot Co-Design [18.7]
EvoGymCM(EvoGym with Continuous Materials, EvoGym with Continuous Materials)を提案する。プログラム可能な材料をガイドするためのリアルタイム剛性チューニングポリシを学習するリアクティブ・マトリアル・コデザイン,および(ii)形態学と固定材料フィールドを共同で最適化し,従来の材料製造をガイドする不変・マトリアル・コデザインの2つのパラダイムを定式化する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:45:20 GMT)
Learning to Search: A Decision-Based Agent for Knowledge-Based Visual Question Answering [18.6]
知識に基づく視覚的質問応答(KB-VQA)は、画像を理解し、外部知識を使用するために視覚言語モデルを必要とする。ほとんどの既存の検索拡張生成(RAG)メソッドは、情報を逐次検索し、フィルタリングし、回答を生成する固定パイプラインを採用している。我々は,KB-VQAを探索エージェント問題として再定義し,その解法を多段階決定手順としてモデル化する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:15:38 GMT)
Tarot-SAM3: Training-free SAM3 for Any Referring Expression Segmentation [18.6]
Tarot-SAM3は、任意の参照式から正確にセグメンテーションできる、トレーニング不要のフレームワークである。 Tarot-SAM3は2つの重要なフェーズで構成されている。第一に、推論補助的なプロンプトオプションを導入するReasoning Expression Interpreter (ERI) フェーズである。第2に、マスク自己精製(MSR)フェーズは、プロンプトタイプにまたがる最高のマスクを選択し、自己精製を行う。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:37:09 GMT)
A Systematic Framework for Tabular Data Disentanglement [18.3]
産業制御システムなどのアプリケーションで広く使われているタブラルデータは、しばしば複雑な属性を含む。データ不整合は、そのようなデータを相互依存を減らした変数に変換することを目指している。因子分析、CT-GAN、VAEといった既存のデータアンタングル法は制限に直面している。本稿では,データ・アンタングルメントの体系的ビューを提供するフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:00:22 GMT)
DailyArt: Discovering Articulation from Single Static Images via Latent Dynamics [18.2]
アーティキュレートされたオブジェクトは、具体化されたAIと世界モデルに不可欠である。既存の方法は、複数状態の観測を必要とするか、明示的な部分の先行、検索、その他の補助的な入力に依存している。単一静止画像からの関節推定を定式化したDailyArtについて述べる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:24:07 GMT)
Creator Incentives in Recommender Systems: A Cooperative Game-Theoretic Approach for Stable and Fair Collaboration in Multi-Agent Bandits [18.2]
我々は,移動可能ユーティリティ(TU)協調ゲーム定式化による多エージェント線形帯域問題として協調を解析する。固定された動作集合を持つ同一(同種)エージェントに対して、誘導されたTUゲームは穏やかなアルゴリズム条件下で凸であることを示す。 4つのシャプリー公理のうち3つを満たす単純な後悔に基づくペイアウトルールを提案し、その中核にある。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:45:15 GMT)
MedConceal: A Benchmark for Clinical Hidden-Concern Reasoning Under Partial Observability [17.8]
医療対話における隠蔽推論評価のための対話型患者シミュレータを用いたベンチマークであるMedConcealを提案する。クリニックが回答したオンライン健康に関する議論から構築された各ケースは、シミュレーターと内部を隠蔽した懸念を伴うクリニックと視覚のコンテキストをペアリングする。本研究は,マルチターン対話を通じて隠れた関心を隠蔽し,介入し,主要な関心事に対処し,患者を目標計画に向けて誘導する2つの能力について検討する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:51:02 GMT)
SUPERNOVA: Eliciting General Reasoning in LLMs with Reinforcement Learning on Natural Instructions [17.6]
Reinforcement Learning with Verifiable Rewards (RLVR) は、数学やコードなどの形式領域における大規模言語モデル(LLM)推論を大幅に改善した。 RLVRを一般的な推論に拡張することは、さまざまな推論スキルにまたがる高品質で検証可能なトレーニングデータが欠如していることによって制約される。本稿では,一般推論の強化を目的としたRLVR用データキュレーションフレームワークSUPERNOVAを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:16:07 GMT)
FlowGuard: Towards Lightweight In-Generation Safety Detection for Diffusion Models via Linear Latent Decoding [17.6]
拡散に基づく画像生成モデルは、Not-Safe-For-Work(NSFW)コンテンツを生成する可能性があるため、安全性のリスクが生じる。中間段階を検査するクロスモデルインジェネレーション検出フレームワークであるFlowGuardを紹介する。安全でないコンテンツを早期に検出することで、FlowGuardは計算コストを削減するために不要な拡散ステップを削減する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:49:43 GMT)
Reinforcement Learning with LLM-Guided Action Spaces for Synthesizable Lead Optimization [17.5]
MolReActはMarkov決定プロセスとしてリード最適化を定式化するフレームワークである。性質改善された分子を生産し、それぞれに明示的な合成経路が伴う。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:22:10 GMT)
Cross-Modal Emotion Transfer for Emotion Editing in Talking Face Video [17.5]
C-MET(Cross-Modal Emotion Transfer)は、音声に基づく表情を生成する新しい手法である。本手法は,最先端手法よりも感情の精度を14%向上させる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:28:03 GMT)
ACF: A Collaborative Framework for Agent Covert Communication under Cognitive Asymmetry [17.4]
本稿では,非対称協調フレームワーク (ACF) を提案する。 ACFは意味的忠実度と包括的コミュニケーションの両方に優れ、対称性は深刻なチャネル劣化に悩まされる。計算の不明瞭さを維持し、証明可能なエラー境界を持つ信頼できる秘密抽出を可能にする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:10:51 GMT)
Differentially Private Language Generation and Identification in the Limit [17.3]
我々は,Kleinberg と Mullainathan [KM24] が最近導入した言語生成の限界について,差分プライバシーの制約の下で検討した。我々は任意の可算コレクションから極限を生成する$varepsilon$-differentially-privateアルゴリズムを提供する。我々は、$varepsilon$-DPアルゴリズムが無限交叉と有限集合差を持つ2つの言語を含む集合を識別できないことを証明した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:48:46 GMT)
Decomposing the Delta: What Do Models Actually Learn from Preference Pairs? [17.3]
選好データにおける品質デルタの2つの概念、すなわちジェネレータレベルデルタとサンプルレベルデルタについて検討する。ジェネレータレベルの差分の増加は、ドメイン外推論タスクのパフォーマンスを着実に向上させる。提案手法は,選好最適化により推論性能を向上させるための2つのレシピを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:28:17 GMT)
Monocular Depth Estimation From the Perspective of Feature Restoration: A Diffusion Enhanced Depth Restoration Approach [17.3]
単眼深度推定(MDE)は、3次元視覚において重要な応用が可能な基本的なコンピュータビジョンタスクである。本稿では,先述した問題をまず検討し,エンコーダの機能改善が可能である場合,現在のフレームワークにはまだ大きな可能性があることを示す。実験により,提案手法は各種データセットの最先端手法よりも優れた性能が得られることが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:13:53 GMT)
3DrawAgent: Teaching LLM to Draw in 3D with Early Contrastive Experience [17.2]
我々は3Dスケッチ生成のためのトレーニングフリーで言語駆動のフレームワークである3DrawAgentを紹介する。従来の2Dスケッチエージェントとは異なり,本手法は相対的経験最適化戦略を導入する。 3DrawAgentは多種多様なテキストプロンプトから複雑で一貫性のある3Dベジエスケッチを生成することができることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:47:00 GMT)
Rethinking Entropy Allocation in LLM-based ASR: Understanding the Dynamics between Speech Encoders and LLMs [17.2]
学習パラダイムが音声エンコーダとLLM間のエントロピー削減をどのように割り当てるかを特徴付けるための3つの指標を提案する。本稿では,パラメータ効率とロバストネス幻覚を最適化した,能力境界認識に基づく多段階学習戦略を提案する。マンダリンと英語のベンチマーク実験により,2.3Bパラメータのみを用いた最先端モデルとの競合性能が得られた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:07:52 GMT)
A-SLIP: Acoustic Sensing for Continuous In-hand Slip Estimation [17.1]
パラレルジャウグリップに統合されたマルチチャンネル音響センサシステムであるA-SLIPを提案する。 A-SLIPモデルは、軽量畳み込みネットワークを用いて、ログメルスペクトログラムとして同期マルチチャンネルオーディオを処理する。シングルマイクロフォン構成と比較して、マルチチャネル設計は方向誤差を64パーセント、等級誤差を68%削減する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:58:27 GMT)
Orion-Lite: Distilling LLM Reasoning into Efficient Vision-Only Driving Models [17.0]
大規模言語モデル(LLM)をコンパクトな駆動モデルに拡張することは説得力のある解決策である。我々は、視覚のみの効率的な学生モデル textbfOrion-Lite が、その巨大なVLA教師であるORION よりも優れていることを実証した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:51:55 GMT)
An Illusion of Unlearning? Assessing Machine Unlearning Through Internal Representations [16.9]
最終層の特徴と分類器のミスアライメントが主な原因で,最先端の非学習手法が成功していることを示す。隠れた特徴は相変わらず差別的であり、単純な線形探索は、ほぼ原産地の精度を回復することができる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:02:23 GMT)
GroundingAnomaly: Spatially-Grounded Diffusion for Few-Shot Anomaly Synthesis [16.7]
我々は,新しい数発の異常画像生成フレームワークであるGroundingAnomalyを提案する。本フレームワークでは,画素ごとのセマンティックマップを活用する空間条件モジュールを導入している。 Gated Self-Attention Moduleは、凍結したU-Netに条件付きトークンを注入するように設計されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:34:50 GMT)
Guiding a Diffusion Model by Swapping Its Tokens [16.6]
本研究では,条件生成と非条件生成の両方に対して,CFGライクなガイダンスを実現するための簡単な手法を提案する。鍵となるアイデアは、単純なトークンスワップ操作によって混乱した予測を生成することである。提案手法はトークン潜伏剤を選択的に交換し,分解し,摂動の制御をきめ細かなものにする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:54:49 GMT)
Visual Perceptual to Conceptual First-Order Rule Learning Networks [16.5]
ILPは、画像定数置換から規則構造誘導まで、完全に微分可能なパイプラインを提供する。 ILPは古典的シンボリック・リレーショナル・データセットやリレーショナル・イメージ・データに強い性能を発揮する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:11:49 GMT)
Activation Steering for Aligned Open-ended Generation without Sacrificing Coherence [16.4]
ミスアライメントは、敵対的なプロンプト、良心的な微調整、創発的なミスアライメント、目標のミスジェネレーションによって引き起こされる。最近の証拠は、いくつかの不整合挙動が活性化空間の線形構造としてコード化され、操舵によって牽引可能であることを示唆している。これらの知見は, 世代ごとのアクティベーションの不一致を継続的に補正する軽量なランタイムディフェンスとして, アクティベーションステアリングを動機付けている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:28:22 GMT)
Silencing the Guardrails: Inference-Time Jailbreaking via Dynamic Contextual Representation Ablation [16.2]
モデルガードレールを動的に静かにする新しい推論時間介入フレームワーク、Contextual Representation Ablation (CRA)を提案する。 CRAは、高価なパラメータ更新やトレーニングを必要とせずに、デコード中の拒絶誘発活性化パターンを特定し、抑制する。複数の安全に整合したオープンソース LLM に対する実証的な評価は、CRA がベースラインを大幅に上回っていることを示している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:35:56 GMT)
Scaling-Aware Data Selection for End-to-End Autonomous Driving Systems [16.1]
物理的なAIアプリケーションのための大規模ディープラーニングモデルは、さまざまなトレーニングデータ収集作業に依存する。データ選択ポリシーはトレーニングセットの開発を導くことができるが、現在のフレームワークでは、データポイントが異なるメトリクスにどのように影響するかの曖昧さを考慮していない。 i)データセットをドメインに分割し、(ii)各データ領域から評価指標にニューラルスケーリング法則を適合させ、(iii)ドメインからのデータを反復的に追加することでデータ混合を最適化する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:33:00 GMT)
LEGO: Latent-space Exploration for Geometry-aware Optimization of Humanoid Kinematic Design [15.7]
モーションデザインの協調最適化は自動化に向けた有望な道のりを提供するが、 (i) 巨大で非構造的な設計空間と (ii) タスク固有の損失関数を構築することの難しさの2つの大きな課題が残っている。本研究では, 既存の機械設計からデザイン検索空間を学習し, 人間の動作データから直接損失を定義することにより, 人間の関与を最小限に抑える新しいパラダイムを提案する。提案手法は,データ駆動型ロボット設計の原則的枠組みを確立し,既存の設計と人間の動作を活用することで,新しいロボット設計の自動発見を効果的に導くことを実証する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:06:50 GMT)
MedVR: Annotation-Free Medical Visual Reasoning via Agentic Reinforcement Learning [15.6]
医療ビジョンランゲージモデル(VLM)は、複雑な臨床業務において大きな可能性を秘めている。彼らの推論能力は、しばしばテキストのみのパラダイムによって制約される。この制限は、きめ細かい視覚分析を必要とするタスクのパフォーマンスを抑えるだけでなく、安全クリティカルなアプリケーションにおける視覚幻覚のリスクも引き起こす。医用VLMのアノテーションのない視覚的推論を可能にする新しい強化学習フレームワークであるMedVRを紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:04:49 GMT)
Communicate-Predict-Act: Evaluating Social Intelligence of Agents [15.6]
我々は,大規模言語モデル(LLM)のソーシャルインテリジェンスを研究するために,複合協調型および競争型ソーシャルゲームのマルチプレイヤーアリーナを導入する。ゲームプレイのトレースを分析し,行動予測,コミュニケーション的影響,戦略的推論,競合する利益の下でのトレードオフを捉えた社会認知的指標を抽出する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:40:15 GMT)
Rethinking Residual Errors in Compensation-based LLM Quantization [15.4]
我々は、各量子化層の出力をその完全精度と整合させる非対称キャリブレーションプロセスを導入する。残差は前層の出力差だけでなく,各層内の補償重みと原重みとの差からも生じる。提案手法はGPTQとGPTAQの両方とシームレスに統合され,量子化性能が大幅に向上した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:20:59 GMT)
ActionNex: A Virtual Outage Manager for Cloud Computing [15.3]
大規模なクラウド運用における障害管理は、依然として非常に手作業で行われている。 textbfActionNexは、エンドツーエンドの停止支援をサポートするプロダクショングレードのエージェントシステムである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:32:31 GMT)
PROMISE: Proof Automation as Structural Imitation of Human Reasoning [15.1]
ProMISEは,証明状態遷移に対するステートフルな探索として,証明生成を再構成する構造認識フレームワークである。複数のLLMバックエンドにまたがるSEL4ベンチマークのPROMISEを評価し,SeleneやRangoといった先行システムと比較した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:24:10 GMT)
On the Global Photometric Alignment for Low-Level Vision [14.9]
監督された低レベルの視覚モデルは、ペア化された参照に対してピクセル単位での損失に依存するが、ペア化されたトレーニングセットはペアごとの光度不整合を示す。標準的な再建の損失は、ペア当たりの測光目標に反する不均衡な勾配予算を割り当て、コンテンツ復元を混雑させる。この分析によって動機づけられた光度アライメント損失(PAL)を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:29:54 GMT)
R2G: A Multi-View Circuit Graph Benchmark Suite from RTL to GDSII [14.8]
R2Gは5つのステージ認識ビューを情報同値で標準化するマルチビューサーキットグラフベンチマークスイートである。 R2Gは、合成、配置、ルーティングステージにまたがるエンドツーエンドのDEF-to-graphパイプラインを提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:59:27 GMT)
Loop, Think, & Generalize: Implicit Reasoning in Recurrent-Depth Transformers [14.6]
我々は暗黙の推論、すなわち1つの前方通過で知識やルールを組み合わせる能力について研究する。トランスフォーマーベースの大規模言語モデルは、事実上の知識とルールを格納するが、暗黙のマルチホップ推論のためにこの知識を構成するのに失敗することが多い。バニラ変圧器は両方の一般化課題に苦しむ一方で、再帰深度変圧器はそのような一般化を効果的に行うことができることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:24:32 GMT)
EMMa: End-Effector Stability-Oriented Mobile Manipulation for Tracked Rescue Robots [14.5]
本稿では,複雑な救助シナリオにおいて安定なエンドエフェクタ動作を実現するための移動体追従マニピュレータの動作生成フレームワークを提案する。提案フレームワークは,タスク成功率やエンドエフェクタ動作安定性など,主要な指標間でSOTA手法を一貫して上回っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:28:41 GMT)
Preference Redirection via Attention Concentration: An Attack on Computer Use Agents [14.4]
PRAC(PRAC)は,ステルスな敵パッチに注意を向けることで,モデルの内部的嗜好を操作できる新しい攻撃法である。 PRACは、オンラインショッピングプラットフォーム上でのCUAの選択プロセスを、選択したターゲット製品に向けて操作可能であることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:08:40 GMT)
Learning Without Losing Identity: Capability Evolution for Embodied Agents [14.4]
エンボディエージェントのための機能中心進化パラダイムを提案する。我々はロボットが認知的アイデンティティとして永続的なエージェントを維持するべきだと主張する。エージェントアイデンティティから機能進化を分離する統合されたフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:51:07 GMT)
Harnessing Embodied Agents: Runtime Governance for Policy-Constrained Execution [14.4]
エージェントは受動的推論システムから、ツールやロボット、物理的環境と相互作用するアクティブエグゼクタへと進化している。既存のアプローチでは、エージェントループ内に安全性とリカバリが組み込まれているため、実行制御の標準化、監査、適応が困難になる。本稿では,エージェント認知と実行監視を分離する,ポリシー制約付き実行のためのフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:35:08 GMT)
Governed Capability Evolution for Embodied Agents: Safe Upgrade, Compatibility Checking, and Runtime Rollback for Embodied Capability Modules [14.4]
エージェント自体を書き換えるのではなく、実行可能な機能を更新することで、時間とともに改善されることが期待されている。ライフサイクルを意識したアップグレードフレームワークを提案し、新しい機能バージョンはすべて、管理されたデプロイメント候補として扱われる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:18:51 GMT)
EEG2Vision: A Multimodal EEG-Based Framework for 2D Visual Reconstruction in Cognitive Neuroscience [14.3]
私たちは、モジュール化されたエンドツーエンドのEEG-to-imageフレームワークであるEEG2Visionを紹介します。異なる脳波解像度の再構成性能を評価する。アクシデント誘導後のブースティング機構によって視覚的品質を向上させる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:25:54 GMT)
Brain3D: EEG-to-3D Decoding of Visual Representations via Multimodal Reasoning [14.3]
脳波から画像へのデコーディングに基づく脳波から3Dへの再構成のためのマルチモーダルアーキテクチャであるBrain3Dを提案する。我々のパイプラインはまず脳波信号から視覚的に接地された画像を生成し、次に多モーダルな言語モデルを用いて構造化された3D認識記述を抽出する。問題を構造化段階に分解することで,脳波から3Dへの直接マッピングを回避し,スケーラブルな脳波駆動3D生成を実現する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:35:44 GMT)
Revisiting Radar Perception With Spectral Point Clouds [14.3]
本稿では, スペクトル点雲のパラダイムを導入し, 点雲はレーダースペクトルの粗い圧縮された表現として扱われる。我々は、リッチ化を適用すると、点雲がRDベンチマークを超えることができることを示した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:19:09 GMT)
Lost in the Hype: Revealing and Dissecting the Performance Degradation of Medical Multimodal Large Language Models in Image Classification [14.2]
マルチモーダル大言語モデル(MLLM)は、医療画像解析の分野で前例のない応用の波を引き起こしている。しかし、医学画像分類では、最先端の医療MLLMは従来のディープラーニングモデルと比べて一貫して性能が劣っている。本稿では、3つの代表的な画像分類データセットにまたがる14のオープンソース医療MLLMについて広範な実験を行った。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:07:26 GMT)
Ghost imaging with zero photons [14.2]
さらに特殊な特性を持つゴーストイメージング実験が報告されている。この画像は、光子が対象物と相互作用したり、信号も参照ビームも光子も相互作用しない場合に再構成することができる。ゴースト画像がゼロ光子で検索できる理由は、光子数予測測定と熱光の光子統計によって共同で決定される。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:17:35 GMT)
Fast and Coherent Transfer of Atomic Qubits in Optical Tweezers using Fiber Array Architecture [14.1]
我々は、静的トラップと移動トラップのスムーズな振幅交換を実現するために、トラップ深さのサイト解決制御を備えた中性原子量子コンピューティングアーキテクチャを用いる。静的トラップと移動トラップの間の10ドル移動により、サイクル当たりの加熱速度0.156(9)$Kが得られ、無視できる原子損失で500サイクル以上維持され、1サイクルあたり0.99992(5)の量子状態忠実度が得られる。この高速で低熱のコヒーレント転送能力は、原子シャットリングに基づく量子コンピューティングの速度と忠実性の両方を改善するための実用的な経路を提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:23:47 GMT)
ZeroCoder: Can LLMs Improve Code Generation Without Ground-Truth Supervision? [14.0]
RLVR(Reinforcement Learning with Verifiable Rewards)は、実行ベースのフィードバックを通じて改善する強力なパラダイムである。既存の作業では、自己生成テストを使って報酬を土台にしようとしたが、差別的テストの欠如は、テスト生成に対するモデルの準最適性能による影響を制限した。我々はZeroCoderについて紹介する。ZeroCoderは、自己生成されたコード-テストインタラクションから実行フィードバックを使用して、CoderとTesterを共同でトレーニングする完全なラベルなしの共進化フレームワークである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:24:54 GMT)
PRISM-CTG: A Foundation Model for Cardiotocography Analysis with Multi-View SSL [14.0]
自動CTG分析のための改良されたディープラーニングモデルは通常、狭いラベル付きデータセットと限られた患者コホートによって制限される。我々は,CTG(PRISM-CTG)のための統合自己スーパービジョンとメタデータを用いた生理的認識表現学習を提案する。 PRISM-CTGは、転送可能なドメインレベルの表現を学習するために、大規模なアンラベル記録を利用する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:44:27 GMT)
InstAP: Instance-Aware Vision-Language Pre-Train for Spatial-Temporal Understanding [13.8]
InstAPは、視覚言語による事前トレーニングのためのインスタンス対応事前トレーニングフレームワークである。 InstVLは大規模なデータセット(画像200万枚、ビデオ5万本)で、二重粒度アノテーション(全体像キャプションと密集したインスタンス記述)を備えている。 InstAPは、MSR-VTTやDiDeMoを含む複数のビデオベンチマークで、競争力のあるゼロショット性能を実現している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:10:25 GMT)
TurboAgent: An LLM-Driven Autonomous Multi-Agent Framework for Turbomachinery Aerodynamic Design [13.8]
TurboAgentは、大型言語モデル(LLM)によるターボ機械空力設計と最適化のための自律型マルチエージェントフレームワークである。このフレームワークは、従来の試行錯誤設計をデータ駆動のコラボレーティブワークフローに変換する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:04:35 GMT)
EgoEverything: A Benchmark for Human Behavior Inspired Long Context Egocentric Video Understanding in AR Environment [13.3]
EgoEverythingは、目視データから抽象化された人間の注意信号を利用して、質問を生成することで、人間の行動を明確に考慮するベンチマークである。 5000以上の複数の質問応答ペアで構成されており、100時間以上のビデオにまたがっている。人間の自然な振る舞いをより忠実に捉え、ARにおける長いコンテキストのエゴセントリックなビデオ理解のための現実的な評価設定を提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:13:36 GMT)
Weakly-Supervised Lung Nodule Segmentation via Training-Free Guidance of 3D Rectified Flow [13.2]
提案手法は2つの異なる予測器に対して, 異なる大きさと形状の肺結節を連続的に検出し, 高品質なセグメンテーションを実現する。 LUNA16の実験は、ベースライン法よりも改善され、生成基盤モデルの可能性を弱教師付き3次元医用画像セグメンテーションのツールとして強調した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:46:14 GMT)
Control-centric quantum noise spectroscopy of time-ordered polyspectra [13.1]
非パラメトリック量子ノイズスペクトロスコピーは、環境のスペクトル特性を推定するための汎用的、モデルに依存しないフレームワークを提供する。制御中心の視点を採用することで、現在、中心となる物体が時間順のポリスペクトルとなるようにノイズ分光問題を再キャストできることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:02:14 GMT)
U-CECE: A Universal Multi-Resolution Framework for Conceptual Counterfactual Explanations [12.9]
U-CECEは、概念的対実的説明のための統一的、モデルに依存しないマルチレゾリューションフレームワークである。幅広い説明のための原子概念、単純な相互作用のための関係集合、完全な意味構造のための構造グラフの3つのレベルにまたがる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:30:00 GMT)
FIT: A Large-Scale Dataset for Fit-Aware Virtual Try-On [12.9]
仮想トライトン(VTO)は,衣服を装着した人の現実的なイメージを合成することを目的としている。現行のVTOメソッドは、衣服や人の大きさに関わらず、適切に適合した結果を生成するのがデフォルトである。実測値と合わせて113万点以上の試行画像トリプレットからなるFITデータセットを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:57:50 GMT)
PSI: Shared State as the Missing Layer for Coherent AI-Generated Instruments in Personal AI Agents [12.9]
独立に生成されたモジュールをコヒーレントな楽器に変換する共有状態アーキテクチャであるPSIを提案する。 PSIは共有状態を、AI生成されたパーソナルソフトウェアを独立したアプリから一貫性のあるパーソナルコンピューティング環境に変換する、欠落したシステム層として認識している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:58:36 GMT)
BioELX: Cross-lingual Biomedical Entity Linking via Alias-based Retrieval and LLM Ranking [12.9]
言語間バイオメディカル・エンティティ・リンク (BEL) マップは、知識ベース (KB) 内の任意の言語で言及されるユニークな識別子に言及する。タスク固有の注釈付き学習コーパスを必要としない2段階の言語間BELフレームワークであるBioELXを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:07:20 GMT)
Skip-Connected Policy Optimization for Implicit Advantage [12.8]
そこで我々は,Skip-Connected Optimization (SKPO)を提案する。実験では、それぞれQwen2.5-Math-7BとLlama-3.2-3Bのベースラインよりも3.91%と6.17%向上した。 SKPOは、最終的な正しさにマッチした場合でも、中間ステップ品質の高い軌道を生成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:22:31 GMT)
Task-Adaptive Retrieval over Agentic Multi-Modal Web Histories via Learned Graph Memory [12.6]
ACGMは、モダリティ特異的な崩壊を伴う異種時間ダイナミクスを捕捉する。 ACGMは検索品質を textbf82.7 nDCG@10 (+9.3 over GPT-4o, $p0.001$) と textbf89.2% Precision@10 (+7.7) に改善し、19の強い密度、再ランク、マルチモーダル、グラフベースのベースラインを上回った。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:24:16 GMT)
EigentSearch-Q+: Enhancing Deep Research Agents with Structured Reasoning Tools [12.6]
ウェブ検索をより意図的にするためのクエリおよびエビデンス処理ツールであるQ+を紹介する。当社はQ+をオープンソースでプロダクション対応のマルチエージェントワーカーであるEigentのブラウザサブエージェントに統合しています。 4つのベンチマークで、Q+はEigentのベンチマークサイズ重み付け平均精度を3.0、3.8、0.6ポイント(pp)改善した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:47:31 GMT)
An Empirical Analysis of Static Analysis Methods for Detection and Mitigation of Code Library Hallucinations [12.5]
静的解析ツールは,全エラーの16～70%,図書館幻覚の14～85%を検出できる。静的な方法では確実にキャッチできない場合を特定し、48.5%から77%の確率に上限を与える。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:21:30 GMT)
Vision-Language Navigation for Aerial Robots: Towards the Era of Large Language Models [12.5]
航空視覚言語ナビゲーション(Aerial VLN)は、無人航空機(UAV)が自然言語の指示を解釈できるようにすることを目的としている。この調査は、エアリアルVLN分野の批判的かつ分析的なレビューを提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:47:24 GMT)
Log-based, Business-aware REST API Testing [12.4]
REST APIの単一障害は、マイクロサービスシステム全体をダウンさせ、重大な損失を引き起こす可能性がある。 LoBRESTはログベースの、ビジネス対応のREST APIテスティングテクニックである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:10:07 GMT)
InstrAct: Towards Action-Centric Understanding in Instructional Videos [12.4]
InstrActionは、インストラクショナルビデオのアクション中心表現のための事前トレーニングフレームワークである。まず、ノイズの多いキャプションをフィルタリングし、アクション中心のハードネガティブを生成する、データ駆動型戦略を導入する。視覚的特徴レベルでは、Action Perceiverは、冗長なビデオエンコーディングからモーション関連トークンを抽出する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:51:13 GMT)
From Debate to Decision: Conformal Social Choice for Safe Multi-Agent Deliberation [12.3]
我々は、議論のアウトプットを調整された行動逆エスカレート決定に変換する、ポストホックな意思決定層であるConformal Social Choiceを紹介する。階層的なアクションポリシーは、シングルトンセットを自律的なアクションにマップし、より大きなセットを人間のエスカレーションにマップする。この層は議論が確実に間違っている場合に作用しないため、残りの共形シングルトンは90.0--96.8%の精度に達する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:15:20 GMT)
Multimodal Reasoning with LLM for Encrypted Traffic Interpretation: A Benchmark [12.3]
本稿では、物理的トラフィックエンコーディングと意味解釈を橋渡しするマルチモーダル推論アーキテクチャである、エンドツーエンドのトラフィック言語表現フレームワーク(mmTraffic)を提案する。認識中心のトラフィックエンコーダと認識中心のLLM生成器により、mmTrafficは、保証されたカテゴリ予測で洗練されたトラフィック解釈を実現する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:56:28 GMT)
Phantom: Physics-Infused Video Generation via Joint Modeling of Visual and Latent Physical Dynamics [12.1]
本稿では,視覚的内容と潜伏する物理力学を共同でモデル化する物理拡散ビデオ生成モデルを提案する。観測されたビデオフレームと推論された物理状態に基づいて、Phantomは遅延物理的ダイナミクスを共同で予測し、将来のビデオフレームを生成する。物理認識ビデオ表現の推論を直接ビデオ生成プロセスに統合することにより、Phantomは視覚的にリアルかつ物理的に一貫性のあるビデオシーケンスを生成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:48:46 GMT)
LLMs Underperform Graph-Based Parsers on Supervised Relation Extraction for Complex Graphs [12.1]
関係抽出のための有望なツールとして,大規模言語モデル (LLM) が採用されている。テキストの根底にある言語グラフが非常に複雑である場合、それらのパフォーマンスがずっと小さなアーキテクチャに遅れていることが示されます。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:34:33 GMT)
ADAPTive Input Training for Many-to-One Pre-Training on Time-Series Classification [12.1]
本稿では,ADAPTと呼ばれる時系列データのための事前学習パラダイムを提案する。 ADAPTは時系列領域におけるデータの物理的特性を効率的に調整し、混合バッチ事前トレーニングを可能にする。我々は162の時系列分類データセットをトレーニングし、分類ベンチマークのための新しい最先端性能を設定した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:58:30 GMT)
Generative Simulation for Policy Learning in Physical Human-Robot Interaction [12.0]
多様なpHRIシナリオを自動的に合成するゼロショット「text2sim2real」生成シミュレーションフレームワークを提案する。我々はこのフレームワークを利用して、大規模合成デモデータセットを自律的に収集する。学習方針はゼロショット・シム・トゥ・リアル・トランスファーの実現に成功し、成功率は80%を超えました。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:00:05 GMT)
Top Management Journal Portal: A Real-Source Search and Research Analytics Artifact for UTD-24 and FT50 Journals [11.6]
Top Management Journal Portalは、エリートビジネスおよびマネジメントジャーナルから文学を検索、監視、解釈するためのデプロイ可能なWebアーティファクトである。静的ジャーナルディレクトリや汎用の学術検索エンジンとは異なり、アーティファクトは高水準の管理機関に明示的にスコープされている。本論文は,ジャーナルプール特有の学術的発見のための機能的デザインアーティファクトとアーキテクチャパターンの両方に貢献する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:52:07 GMT)
ABMAMBA: Multimodal Large Language Model with Aligned Hierarchical Bidirectional Scan for Efficient Video Captioning [11.4]
完全にオープンなマルチモーダル大言語モデル(MLLM)による動画キャプションに焦点を当てる。 ABMambaは、ビデオシーケンスのスケーラブルな処理を可能にする線形計算複雑性を持つ完全にオープンなMLLMである。 VATEX や MSR-VTT のような標準的なビデオキャプションベンチマークでは、ABMamba は典型的な MLLM と比較して競争性能を示している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:58:56 GMT)
BRASP: Boolean Range Queries over Encrypted Spatial Data with Access and Search Pattern Privacy [11.3]
本稿では,暗号化空間データ上でのBooleanレンジクエリの検索可能な暗号化方式BRASPを提案する。 BRASPのセキュリティを、機密性、シャッフル不識別性、クエリ不偽造性、フォワードセキュリティ分析を通じて形式化する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:50:25 GMT)
Securing Retrieval-Augmented Generation: A Taxonomy of Attacks, Defenses, and Future Directions [11.3]
Retrieval-augmented Generation (RAG)は大規模言語モデル(LLM)を大幅に強化する RAGは、外部の知識アクセスを通じて、新たなセキュリティリスクを導入する。我々は、セキュアなRAGは基本的に外部知識アクセスパイプラインのセキュリティに関するものであることを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:38:18 GMT)
Initialisation Determines the Basin: Efficient Codebook Optimisation for Extreme LLM Quantization [11.3]
私たちは、コードブックの初期化が主なボトルネックであることを示しています。ヘッセン重み付きマハラノビス距離を用いた出力対応EM初期化法であるOA-EMを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:38:24 GMT)
A Review of Variational Quantum Algorithms: Insights into Fault-Tolerant Quantum Computing [11.2]
変分量子アルゴリズム(VQA)は、ノイズ中間スケール量子(NISQ)時代に中心的な計算パラダイムとして確立された。このレビューは、VQAとそのフォールトトレラント体制への進展に関する洞察に富んだ分析を提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:25:46 GMT)
Unlocking Fine-Grained and Within-Utterance Speaking Style Control in Prompt-Based Text-to-Speech Models [11.1]
一つの発話において,発話と時間変化の異なるスタイル遷移の連続的なスタイル属性を実現する手法を提案する。提案音声は, 最大36Hzのピッチ変化, 最大1.6音節/秒の速度変化において, 99-100%の成功率を達成した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:06:26 GMT)
PeReGrINE: Evaluating Personalized Review Fidelity with User Item Graph Context [11.1]
PeReGrINEは、グラフ構造化されたユーザーエビデンスに基づくパーソナライズされたレビュー生成のためのベンチマークおよび評価フレームワークである。我々は,各ユーザの言語的・情緒的な傾向を事前のレビューよりも要約したユーザスタイルを計算する。ディゾナンス分析は、期待されるユーザスタイルと製品レベルのコンセンサスからの逸脱を測定する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:36:28 GMT)
Towards Responsible Multimodal Medical Reasoning via Context-Aligned Vision-Language Models [11.0]
医用視覚言語モデル (VLM) は放射線学のタスクにおいて強い性能を示すが、しばしば流動的だが弱弱な結論をもたらす。我々は、診断結果を生成する前に、異種の臨床的証拠間での合意を強制する文脈整合推論フレームワークを導入する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 23:09:38 GMT)
Bias Redistribution in Visual Machine Unlearning: Does Forgetting One Group Harm Another? [11.0]
未学習は偏見を排除しないが、主に年齢境界ではなく性別に沿って再分類することを示す。 Refusal Vectorメソッドは再配布を減らすが、完全に忘れることができず、性能が著しく低下する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:29:36 GMT)
Rotation Equivariant Convolutions in Deformable Registration of Brain MRI [10.9]
画像登録は、画像間の解剖学的構造を整列させる基本的なタスクである。我々は、回転同変の畳み込みを変形可能な脳MRI登録ネットワークに統合する。以上の結果から,より堅牢で正確かつ効率的な登録モデルを構築するための重要なステップとして,幾何的事前の組み込みが重要であることが示唆された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:39:01 GMT)
Equivariant Efficient Joint Discrete and Continuous MeanFlow for Molecular Graph Generation [10.7]
グラフ構造データには、離散トポロジーと連続幾何学が含まれる。グラフ生成のための既存のフローマッチングアプローチは通常、構造を幾何学から切り離す。統一SE(3)-等価生成フレームワークであるEquivariant MeanFlow (EQUIMF)を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:42:01 GMT)
Detecting HIV-Related Stigma in Clinical Narratives Using Large Language Models [10.7]
本研究の目的は,臨床ノートからHIVスティグマを識別するための言語モデル(LLM)ベースのツールを開発することである。 2012年から2022年の間,フロリダ大学健康学部(UF)におけるPLWHの診療成績について検討した。公的な態度、開示に関する懸念、否定的な自己イメージ、パーソナライズされたスティグマの4つのサブスケールに、合計1,332の文章が手動で注釈付けされた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:01:01 GMT)
GRACE: A Dynamic Coreset Selection Framework for Large Language Model Optimization [10.7]
大規模言語モデル(LLM)のためのグラフ誘導適応および動的コアセット選択フレームワークを提案する。 GRACEは、表現の多様性と勾配に基づく重要なメトリクスを組み合わせることで、コアセットを動的に構築し、更新する。 GRACEは様々なLLMやタスクのトレーニング効率とダウンストリームのパフォーマンスを大幅に向上させる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:08:01 GMT)
Beyond Dense Connectivity: Explicit Sparsity for Scalable Recommendation [10.6]
大規模モデルのスケーリングの最近の進歩は、モデル深度とキャパシティを向上し、大規模な行動データを活用するためのレコメンデーションシステムに動機付けている。産業モデルの解析では、暗黙的な接続間隔の現象が示され、ほとんどの学習された接続重みはゼロになる傾向にあるが、わずかな部分しか顕著に残っていない。 bfSSR(ExplicittextbfSparsity for textbfScalable textbfRecommendation)を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:13:21 GMT)
CASE: Cadence-Aware Set Encoding for Large-Scale Next Basket Repurchase Recommendation [10.6]
次回のバスケット再購入勧告のためのCASE(Cadence-Aware Set )を提案する。アイテムレベルの学習を項目間インタラクションから切り離し、明示的なカレンダー時間モデリングを可能にする。 CASEは、強い次のバスケット予測ベースラインと比較して、複数のカットオフで精度、リコール、NDCGを継続的に改善する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:50:12 GMT)
Policy-Aware Design of Large-Scale Factorial Experiments [10.5]
重なり合う実験は、分散A/Bテストによって処理が不十分な相互作用効果を生成することができる。本研究の目的は,全ての治療効果を見積もらない場合に,大規模な因子分析実験を設計する方法を検討することである。重なり合う実験を1つの因数分解問題に集約し,低ランクテンソルとして期待される結果をモデル化する2段階設計を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:39:18 GMT)
Bias-Constrained Diffusion Schedules for PDE Emulations: Reconstruction Error Minimization and Efficient Unrolled Training [10.5]
条件拡散モデルは複雑な力学をエミュレートするための強力な代理である。彼らはしばしば、高精度なタスクのために神経エミュレータの精度に合わない。自己回帰的PDE拡散モデルの2つの重要な限界に対処する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:21:31 GMT)
ASPECT:Analogical Semantic Policy Execution via Language Conditioned Transfer [10.5]
強化学習(RL)エージェントはしばしば、知識を新しいタスクに一般化するのに苦労する。本稿では,離散潜在変数を自然言語条件に置き換え,より一般化したアプローチを提案する。提案手法は, 固定圏写像の限界を超えて, 複雑な, 真に新しい類似タスクの広い範囲にわたるゼロショット転送を実現する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:21:05 GMT)
Every Response Counts: Quantifying Uncertainty of LLM-based Multi-Agent Systems through Tensor Decomposition [10.2]
大規模言語モデルに基づくマルチエージェントシステム(MAS)は、複雑なタスクにおいて単一エージェントシステムよりも一貫して優れている。既存の不確実性量子化法は、MASの特異な複雑さに対処できない。テンソル分解による不確かさを定量化する新しいフレームワークMATUを紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:01:50 GMT)
AnyImageNav: Any-View Geometry for Precise Last-Meter Image-Goal Navigation [10.2]
我々はAnyImageNavを紹介した。AnyImageNavは、ImageNavをより要求の高い設定にプッシュする、トレーニング不要のシステムだ。私たちのキーとなる洞察は、ゴールイメージを幾何学的なクエリとして扱うことができるということです。我々の手法はギブソン(93.1%)とHM3D(82.6%)に最先端の航法成功率を設定する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:21:57 GMT)
Adaptive Simulation Experiment for LLM Policy Optimization [10.1]
大規模言語モデル(LLM)は、運用管理における運用効率を改善する大きな可能性を秘めている。これらのモデルをデプロイするには、応答品質を管理し、ユーザエクスペリエンスを形作り、運用価値に影響を与えるポリシーを指定する必要があります。本研究は,候補の有限集合から最適方針を特定するためのペアワイズ比較に基づく適応シミュレーション実験を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:29:42 GMT)
WRAP++: Web discoveRy Amplified Pretraining [9.8]
WRAP++(Web DiscoveRy Amplified Pretraining)を提案する。 WRAP++は、Webハイパーリンクからドキュメント間の関係を発見し、各文書ペア上で共同QAを合成する。 SimpleQAでは、7Bスケールと32BスケールのOLMoベースのモデルは、WRAP++でトレーニングされた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:10:27 GMT)
Graph Neural Networks for Misinformation Detection: Performance-Efficiency Trade-offs [9.8]
グラフニューラルネットワーク(GNN)を非グラフベース機械学習手法と比較する。すべてのモデルは、リレーショナル構造の影響を分離するために、同じTF-IDF特徴を使用する。 GNNは、すべてのデータセットで非グラフベースラインを一貫して上回る。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:48:00 GMT)
DialBGM: A Benchmark for Background Music Recommendation from Everyday Multi-Turn Dialogues [9.7]
1200のオープンドメインの日次対話を4つの音楽クリップと組み合わせたベンチマークであるDialBGMを提示する。ランク付けは背景適合性基準(文脈的関連性、非侵襲性、一貫性など)によって決定される。トップランクのクリップを選択すると、Hit@1の35%を超えるモデルはない。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:06:26 GMT)
Dual-Pool Token-Budget Routing for Cost-Efficient and Reliable LLM Serving [9.5]
プロダクションvLLMフリートは通常、最悪のコンテキスト長に対して各インスタンスをプロビジョニングする。実際には、80-95%のリクエストは短いが、長いコンテキストに最適化された設定の下で提供される。本稿では,同種艦隊を2つの専用プールに分割する軽量ディスパッチ機構であるデュアルプールトークン予算ルーティングを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:47:20 GMT)
MIMIC-Py: An Extensible Tool for Personality-Driven Automated Game Testing with Large Language Models [9.4]
本稿では,Pythonによる自動ゲームテストツールMIMIC-Pyについて述べる。 MIMIC-Pyは、パーソナリティ特性を入力として公開し、ゲーム固有のロジックから計画、実行、メモリを分離するモジュールアーキテクチャを採用する。研究プロトタイプと実際の自動ゲームテストのギャップを埋め、最小限のエンジニアリング労力で新しいゲーム環境へのデプロイを可能にする方法を示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:16:46 GMT)
Graph Query Generation with Constraint-guided Large Language Agents [9.4]
UniQGenは制約ベースのフレームワークで、代表的なグラフクエリ節を抽出し、洗練する。我々は、UniQGenが最先端のグラフクエリ生成技術よりも精度と効率の両面で優れていることを示す。我々はCypher出力とNeptune対応のFreebaseスナップショットをリリースし、言語間KGQA研究を支援する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:50:47 GMT)
IoT-Brain: Grounding LLMs for Semantic-Spatial Sensor Scheduling [9.2]
IoT-Brainは、前例のない信頼性と効率で物理世界と対話するフレームワークである。我々は、IoT-Brainが最強の検索集約手法よりもタスク成功率を37.6%向上させることを示した。実際のデプロイメントでは、信頼性の高い上限に近づき、ネットワーク帯域幅を4.1倍削減する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:38:15 GMT)
AITH: A Post-Quantum Continuous Delegation Protocol for Human-AI Trust Establishment [9.2]
本稿では,ポスト量子連続デリゲートプロトコルであるAITH(AI Trust Handshake)を提案する。 AITHは、(1)ML-DSA-87 (FIPS 204, NIST Level 5)で署名された継続的デリゲーション証明書、(2)ハード制約、レート制限、エスカレーショントリガを強制する6チェック境界エンジン、(3)プッシュベースのリコールプロトコルが、1秒以内に無効を伝搬する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:30:28 GMT)
Show Me the Infographic I Imagine: Intent-Aware Infographic Retrieval for Authoring Support [9.1]
ユーザクエリとインフォグラフィックデザインの整合性を向上する意図認識型インフォグラフィック検索フレームワークを開発した。我々は、人々がインフォグラフィックをどのように記述するかのフォーマティブな研究を行い、コンテンツとビジュアルデザインの面にまたがる意図的な分類法を導出する。この分類法は、自由形式のユーザクエリを豊かに洗練するために利用され、検索プロセスを意図特異的な手がかりで導く。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:58:59 GMT)
Automotive Engineering-Centric Agentic AI Workflow Framework [8.9]
本稿では,工学を制約付き,履歴対応のシーケンシャルな意思決定プロセスとしてモデル化する産業ビジョンフレームワークであるAgenic Engineering Intelligence(AEI)について述べる。 AEIは、エンジニアリングデータ処理とワークフローメモリ構築のためのオフラインフェーズと、ワークフロー状態の推定、検索、決定サポートのためのオンラインフェーズをリンクする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:22:18 GMT)
The Weaponization of Computer Vision: Tracing Military-Surveillance Ties through Conference Sponsorship [8.8]
軍事・監視分野におけるコンピュータビジョン研究の活用状況について検討する。この分野の中心研究交換プラットフォームと金融関係を持つハイテク企業のデータセットを収集する。スポンサーの活動を調査した結果、44%が軍事・監視アプリケーションと直接関係があることが判明した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:54:44 GMT)
A GAN and LLM-Driven Data Augmentation Framework for Dynamic Linguistic Pattern Modeling in Chinese Sarcasm Detection [8.8]
サルカズム(Sarcasm)は、誇張、皮肉、比較を通じて、特定の個人や状況に対する批判や特徴を強調する修辞的な装置である。既存の中国のサルカズム検出法は、限られたデータセットと高い建設コストで制約されている。本稿では,GAN(Generative Adversarial Network)とLLM(Large Language Model)によるデータ拡張フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:43:03 GMT)
Multi-Modal Learning meets Genetic Programming: Analyzing Alignment in Latent Space Optimization [8.7]
記号回帰は、データから数学的表現を発見することを目的としている。ラテント空間最適化法は、記号表現を連続空間にマッピングするためにニューラルエンコーダを使用する。 SNIPはマルチモーダルなアプローチを導入してLSOを前進させ、シンボル型と数値エンコーダを共有潜在空間に整列させ、表現型と遺伝子型のマッピングを学習する。これは細粒度のクロスモーダルアライメントに依存しているのに対して、CLIPのような類似モデルでは、そのようなアライメントは通常粗い粒度である。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:55:36 GMT)
Demystifying the Silence of Correctness Bugs in PyTorch Compiler [8.6]
The first empirical study of the correctness bugs in torch.compile, examined their characteristics and the effective of existing fuzzer。本稿では,Torch.compileの正当性バグを検出するために,AlignGuardという概念実証テスト手法を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:13:15 GMT)
Practical Bayesian Inference for Speech SNNs: Uncertainty and Loss-Landscape Smoothing [8.6]
スパイキングニューラルネットワーク(SNN)は、特定のダイナミクスのため、音声処理タスクに自然に適している。しきい値に基づくSNNのスパイク生成は直感的に角や不規則な予測環境を引き起こす。ベイズ学習法を重みとして用いた場合,不規則な予測景観に対する効果について検討する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:09:46 GMT)
MONETA: Multimodal Industry Classification through Geographic Information with Multi Agent Systems [8.6]
我々は,テキスト(Website, Wikipedia, Wikidata)と地理空間情報を用いた最初のマルチモーダル産業分類ベンチマークであるMONETAを提示する。オープンでクローズドなマルチモーダル大言語モデル(MLLM)によるトレーニングフリーベースラインの62.10%と74.10%に到達しました。マルチターン設計,コンテキスト強化,分類説明の組み合わせにより,最大22.80%の増加が観察された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:21:39 GMT)
Unified Precision-Guaranteed Stopping Rules for Contextual Learning [8.6]
文脈学習は、個人の特徴をデータ収集を通じて行動にマッピングする決定ポリシーを学習しようとする。本研究は,文脈的基準と政策価値基準の総合的基準の2つの精度基準の下で検討する。我々は、未知のサンプリング分散を伴う文脈学習のための統一的な停止規則を、非構造化と構造化の両方の線形設定で開発する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:30:15 GMT)
Accelerating Quantum Tensor Network Simulations with Unified Path Variations and Non-Degenerate Batched Sampling [8.5]
バッチ実行による事前トラジェクトリサンプリング(PTSBE)は,これらの手法のデータ収集率を劇的に向上させた。 PTSBEはデータ収集のスピードアップを106倍に向上させたが、テンソルネットワークの実装は15倍のスピードアップしか達成しなかった。本研究では, 1) 誤差非依存の統一経路変動, 2) 非退化テンソルネットワークサンプリング, 3) フレキシブル/最適化収縮フレームワークを開発する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:02:18 GMT)
Post-Quantum Cryptographic Analysis of Message Transformations Across the Network Stack [8.4]
我々は、量子後暗号(PQC)の準備性に関して、層間暗号変換を解析する。このフレームワークをLinuxとiOSプラットフォームにまたがる5つのコミュニケーションシナリオに適用する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:22:47 GMT)
Rethinking Data Mixing from the Perspective of Large Language Models [8.3]
大規模言語モデル(LLM)訓練にはデータ混合戦略が不可欠であり,不適切な戦略が一般化を著しく減少させることを示す実証的証拠がある。本稿では,データスケジューリングをグラフ制約付き最適化問題として定式化するフレームワークであるDoGraphを紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:25:03 GMT)
One Interface, Many Robots: Unified Real-Time Low-Level Motion Planning for Collaborative Arms [8.3]
本稿では,協調ロボットアームのリアルタイム低レベル動作計画のための共通インタフェースを提案する。プログラムソルバとn次補間器を併用して,スムーズかつ連続的な微分可能な軌道を生成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:50:53 GMT)
Alleviating Community Fear in Disasters via Multi-Agent Actor-Critic Reinforcement Learning [8.3]
災害の間、電力網、通信網、社会行動のカスケードは、コミュニティの恐怖を増幅し、協力を弱める。既存のサイバー物理社会モデル(CPS)は、これらの結合力学をシミュレートするが、アクティブな介入のメカニズムが欠如している。本研究では,Valinejad と Mili (2023) の CPS レジリエンスモデルを拡張し,コミュニケーション,電力,緊急管理の3つのエージェントの制御チャネルを拡張し,オンラインアクター・クリティック強化学習によって解決された3つのプレイヤー非ゼロサム差分ゲームとしてシステムを構成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:37:32 GMT)
Why Are We Lonely? Leveraging LLMs to Measure and Understand Loneliness in Caregivers and Non-caregivers [8.2]
ソーシャルメディアのテキスト分析における孤独の原因を分類するために,専門家が開発した孤独度評価フレームワークと専門家インフォームドタイポロジーを導入する。 GPT-4o, GPT-5-nano, GPT-5を適用し, 高品質なRedditコーパスを構築し, 両集団間の孤独さを解析した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:35:12 GMT)
MSCT: Differential Cross-Modal Attention for Deepfake Detection [8.2]
ディープフェイク検出は通常、ビデオ内の偽のトレースをチェックするために、補完的なマルチモーダルモデルを使用する。従来のマルチモーダルフォージェリー検出法では,特徴抽出やアライメントの偏差が不十分であった。提案手法は, 隣接する埋め込みの特徴を統合するためのマルチスケール自己注意と, ヒューズマルチモーダル特徴に対する差分相互注意を含む。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:56:16 GMT)
To Copilot and Beyond: 22 AI Systems Developers Want Built [8.0]
860人のMicrosoft開発者を対象に調査を行い、AIサポートを希望する場所と、そこに留まることを希望する場所を調べた。開発者が5つのタスクカテゴリにまたがって構築したい、22のAIシステムを特定します。それぞれについて、それが解決する問題、構築が難しい理由、開発者がその振る舞いに課す制約について説明する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:31:34 GMT)
Tracing the Chain: Deep Learning for Stepping-Stone Intrusion Detection [8.0]
ステッピングストーン侵入(SSI)は一般的なネットワーク回避手法である。効果的なSSI検出には、各リレーホストの入出力フローを極めて低い偽陽性率で関連付ける必要がある。 ESPRESSOは、トランスフォーマーベースの特徴抽出ネットワーク、タイムアラインな多チャンネル間隔特徴、オンライントリプレットメトリック学習を組み合わせたフロー相関モデルである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:26:52 GMT)
RAMP: Hybrid DRL for Online Learning of Numeric Action Models [8.0]
本稿では,環境とのインタラクションを通じて,数値計画行動モデルをオンラインで学習するための戦略を提案する。 RAMPは同時に、Deep Reinforcement Learning (DRL)ポリシーをトレーニングし、過去のインタラクションから数値アクションモデルを学び、そのモデルを使用して、可能ならば将来のアクションを計画する。実験の結果、RAMPは解答可能性やプラン品質の観点から、よく知られたDRLアルゴリズムであるPPOよりも優れていた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:16:19 GMT)
A Unified Multi-Layer Framework for Skill Acquisition from Imperfect Human Demonstrations [7.8]
現在の技術教育のためのヒューマンロボットインタラクション(HRI)システムは断片化されている。文献における既存のアプローチは、同時に効率的で直感的で、普遍的に安全な結束的なフレームワークを提供していません。本稿では,Demonstration からの堅牢で忠実な学習を可能にする新しい階層化制御フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:13:19 GMT)
ETCH-X: Robustify Expressive Body Fitting to Clothed Humans with Composable Datasets [7.7]
コードモデルは8D2と0.8%のデータ、例えば35.8%(MPJPE-All)やVVVVAllでリリースされる。 BEDETCHは、さまざまな入力レベルにわたって堅牢なパフォーマンスとスケーラブルな改善を実現する。コードモデルは8D2と0.8%のデータ、例えば35.8%(MPJPE-All)やVVVVAllでリリースされる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:59 GMT)
Are we still able to recognize pearls? Machine-driven peer review and the risk to creativity: An explainable RAG-XAI detection framework with markers extraction [7.7]
本稿では、レビュー品質を評価し、自動パターンを検出するための説明可能なフレームワーク(RAG-XAI)を提案する。 XGBoost、Random Forest、LightGBMは99.61%、AUC-ROCは0.999以上、F1スコアは0.9925である。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:25:49 GMT)
OceanMAE: A Foundation Model for Ocean Remote Sensing [7.6]
海洋リモートセンシングは, 海底評価, 海底特性評価, 海洋ゴミ検出, 生態系モニタリングなどの応用に不可欠である。本研究では,マルチスペクトル・センチネル-2観測を自己教師型学習中に,物理的に意味のあるオーシャンディスクリプタと統合することにより,標準的なMAE事前訓練を拡張する,海洋固有のマスク付きオートエンコーダであるOceanMAEを提案する。実験の結果、OceanMAEは海洋のセグメンテーションにおいて最も高い利得を得られ、一方、浴量測定の利点は競争力とタスクに依存していることがわかった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:29:41 GMT)
LLM-Based Data Generation and Clinical Skills Evaluation for Low-Resource French OSCEs [7.6]
フランスでは、トレーニングセッションの組織は人的および論理的な制約によって制限される。自然言語処理(NLP)と大規模言語モデル(LLM)の最近の進歩は、医療面接を自動的に評価する機会を提供する。そこで我々は,シナリオ特異的評価基準でガイドされた総合的医師・患者面接書を作成できる制御パイプラインを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:46:39 GMT)
Leveraging Complementary Embeddings for Replay Selection in Continual Learning with Small Buffers [7.6]
多重埋め込み再生選択(MERS)は、バッファ選択モジュールをグラフベースのアプローチで置き換える。連続学習アルゴリズムにおけるSOTA選択戦略に対する一貫した改善点を示す。 MERSは、リプレイベースの継続的な学習のための実践的でドロップインの強化である。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:09:02 GMT)
A Direct Approach for Handling Contextual Bandits with Latent State Dynamics [7.6]
我々はNelson et al. (2022) によって有限武装線型帯域モデルを再検討し、文脈と報酬は有限隠れマルコフ連鎖によって支配される。隠れ状態に直接的な依存を組み込んだより自然なモデルについて検討する。オンライン上でHMMパラメータを推定する完全適応戦略に対して、より強く、高い確率、後悔の限界を得る。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:09:45 GMT)
CIAO - Code In Architecture Out - Automated Software Architecture Documentation with Large Language Models [7.5]
本稿では,大規模言語モデルを用いてGitHubリポジトリから直接システムレベルのアーキテクチャドキュメンテーションを自動生成する構造化プロセスを提案する。このプロセスはCIAO(Code In Architecture Out)と呼ばれ、LLMベースのワークフローを定義し、レポジトリをインプットとして、システムレベルのアーキテクチャドキュメントを生成する。筆者らは22人の開発者を対象に,コントリビュートしたリポジトリで生成されたドキュメントをレビューし,プロセスの評価を行った。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:29:17 GMT)
Biomimetic causal learning for microstructure-forming phase transitions [7.5]
そこで我々は,細胞による相転移を学習するためのバイオミメティックな物理インフォームドネットワーク (BioPIN) を提案する。この方法は、ニューラルリモデリングの外向きの進行を距離ベーストレーニングカリキュラムに変換し、不確実性駆動型コロケーションに結合する。適応型サンプリング装置の構造保証を確立し, ゲート拡張時の持続的カバレッジと, 遠隔地への定量的蓄積について検討した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:41:04 GMT)
Emotion Concepts and their Function in a Large Language Model [7.5]
大きな言語モデル(LLM)は時に感情的な反応を示す。クロード・ソネット 4.5 では,これがなぜそうなるのかを考察し,アライメント関係の挙動について考察する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:25:17 GMT)
xDup: Privacy-Preserving Deduplication for Humanitarian Organizations using Fuzzy PSI [7.4]
現在の重複防止策は、データを他の組織と共有することで、脆弱な援助を受ける人たちにプライバシーを害するリスクを負う。我々は、人道的組織の要求を満たす新しい実践的重複システムであるxDupを紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:18:05 GMT)
From Universal to Individualized Actionability: Revisiting Personalization in Algorithmic Recourse [7.4]
個人の行動可能性としてパーソナライゼーションを形式化し、どの特徴が個別に行動可能かを規定する厳密な制約と、アクション値やコストよりも好みをキャプチャするソフトな個別化された制約の2つの側面に沿って特徴付けられる。個人の行動可能性の制約、特に難しい制約は、レコメンデーションの妥当性と妥当性を著しく低下させます。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:30:25 GMT)
Adam-HNAG: A Convergent Reformulation of Adam with Accelerated Rate [7.4]
アダムは経験的成功を強く達成しているが、その理論は決定論的完全バッチの設定においても不完全である。本研究では、変数分割と演算子分割と曲率を考慮した勾配補正を組み合わせることにより、フルバッチAdamの収束再構成を開発する。これにより、指数的に減衰するリャプノフ関数を持つ連続時間アダム・HNAGフローと、アダム-HNAGとアダム-HNAG-sという2つの離散的な方法が導かれる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:09:24 GMT)
Same Outcomes, Different Journeys: A Trace-Level Framework for Comparing Human and GUI-Agent Behavior in Production Search Systems [7.4]
本研究では, (i) タスクの成果と努力, (ii) クエリの定式化, (iii) インターフェース状態間のナビゲーションを比較したトレースレベルの評価フレームワークを提案する。 39人の参加者と最先端のGUIエージェントが10種類のマルチホップ検索タスクを行う実運用オーディオストリーミング検索アプリケーションにおいて、このフレームワークを制御された研究でインスタンス化する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:49:02 GMT)
Structural Evaluation Metrics for SVG Generation via Leave-One-Out Analysis [7.2]
従来のジャックニフェ推定器にインスパイアされた要素レベルのLeft-one-out (LOO)分析を導入する。 LOOスコアは、ゼロショットアーティファクト検出を可能にするLOOスコアによって要素毎にスコアされる。 5世代のシステムと3つの複雑性レベルにわたる19,000以上の編集(5タイプ)で、これらのメトリクスを検証する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:50:41 GMT)
LOLGORITHM: Funny Comment Generation Agent For Short Videos [7.2]
LOLGORITHMは、スタイリングされたショートフォームビデオコメント生成のための新しいマルチエージェントフレームワークである。 6つのコントロール可能なコメントスタイルをサポートし、ビデオコンテンツ要約、ビデオ分類、コメント生成の3つのコアモジュールで構成されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:58:54 GMT)
Learning Who Disagrees: Demographic Importance Weighting for Modeling Annotator Distributions with DiADEM [7.2]
DiADEMは、誰が同意しないかを予測するために、「各階層軸がどれほど重要か」を学習するニューラルネットワークである。以上の結果から,アノテータがNLPシステムに必須であるだけでなく,アノテータを明示的にモデル化できることが示唆された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:29:17 GMT)
Karma Mechanisms for Decentralised, Cooperative Multi Agent Path Finding [7.2]
MAPF(Multi-Agent Path Finding)は、大規模ロボットおよびサイバー物理システムにおける協調問題である。本稿では,カーマ機構に基づくMAPFのための分散協調フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:35:13 GMT)
Phantasia: Context-Adaptive Backdoors in Vision Language Models [7.2]
我々は,既存のVLMバックドア攻撃のステルス性が著しく過大評価されていることを初めて示す。当初、他のドメイン向けに設計された防御技術を適用することで、いくつかの最先端攻撃を驚くほど簡単に検出できることが示される。 Phantasiaはコンテキスト適応型バックドアアタックで、有害な出力を各入力のセマンティクスと動的に一致させる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:55:33 GMT)
MARINER: A 3E-Driven Benchmark for Fine-Grained Perception and Complex Reasoning in Open-Water Environments [7.1]
現実世界のオープンウォーター環境におけるきめ細かい視覚的理解と高レベルの推論は、まだ未調査のままである。本稿では,新しいEntity-Environment-Event (3E)パラダイムに基づいて構築された総合ベンチマークであるMARINERを紹介する。 MARINERには、16,629のマルチソース海洋画像があり、63の細粒度血管カテゴリ、多様な有害環境、5つの典型的な動的海洋インシデントがある。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:16:33 GMT)
AnomalyAgent: Agentic Industrial Anomaly Synthesis via Tool-Augmented Reinforcement Learning [7.1]
本稿では,自己回帰,知識検索,反復的精錬機能を備えた異常合成エージェントであるAnomalyAgentを提案する。具体的には、AnomalyAgentは、プロンプト生成(PG)、画像生成(IG)、品質評価(QE)、知識検索(KR)、マスク生成(MG)の5つのツールを備えている。 MVTec-ADデータセットでは、AnomalyAgent合成は、異常生成のための2.0.33のIS/IC-L、ResNet34を用いた57.0%の分類精度、単純なUNetを使用して画像/ピクセルレベルで99.3%/74.2%のAPを達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:17:00 GMT)
Building Better Environments for Autonomous Cyber Defence [7.1]
本稿では,自律型サイバー防衛のための優れた強化学習環境を構築するためのワークショップにおいて,参加者が共有する知識について詳述する。本研究の貢献は,(1) RLサイバー環境と実システムとのインターフェースを分解するフレームワーク,(2) RLベースのACD環境開発とエージェント評価の現在のベストプラクティスに関するガイドラインの2つである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:41:01 GMT)
QoS-QoE Translation with Large Language Model [7.1]
本稿では,マルチメディア文献からの構造化-QoE関係のソースグラウンドデータセットについて紹介する。双方向翻訳における連続値と離散ラベルの予測において,QoE と QoE-QoS の双方で高い性能を示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:51:16 GMT)
Investigating Code Reuse in Software Redesign: A Case Study [7.0]
ソフトウェアは品質特性を改善しながら機能を再設計するが、コードとテストの手作業による再利用はコストがかかり、エラーが発生しやすい。実験的な調査と検証済みのオープンソースコントリビューションを組み合わせたアクションリサーチ手法を用いて,現在進行中のSoot/SootUpの再設計事例について検討する。対応するコードとテストの追跡が重要な課題であると認識し、クローン検出によって対処し、オリジナルのプロジェクトと再設計されたプロジェクト間のコードマッピングを導出します。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:39:12 GMT)
RewardFlow: Generate Images by Optimizing What You Reward [7.0]
RewardFlowはインバージョンフリーのフレームワークで、事前トレーニングされた拡散モデルとフローマッチングモデルを推論時に操作する。セマンティックアライメント、知覚的忠実性、局所的な接地、オブジェクトの一貫性、人間の嗜好の相補的な相補的な相補的な相補的な報酬を統一する。また、言語ビジョン推論によるきめ細かいセマンティック監視を提供するVQAベースの報酬も導入している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:19 GMT)
Beyond Mamba: Enhancing State-space Models with Deformable Dilated Convolutions for Multi-scale Traffic Object Detection [6.9]
本研究では,変形可能なDilated Convolutions Network (MDDCNet) を用いたMambaを提案する。 MDDCNetでは、連続するMambaブロックを持つよく設計されたハイブリッドバックボーンは、局所的な詳細からグローバルな意味論への階層的な特徴表現を可能にする。 The Channel-Enhanced Feed-Forward Network (CE-FFN) is developed to overcome the limited channel interaction capabilities of conventional feed-forward network。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:43:00 GMT)
Evaluating Counterfactual Explanation Methods on Incomplete Inputs [6.9]
機械学習(ML)のための既存のCXを生成するアルゴリズムは、一般的に完全に指定された入力を仮定する。我々は、入力が不完全である場合に有効かつ妥当な対応手段を提供する能力について、最近のCX生成手法を評価する。以上の結果から,ロバストなCX法は非ロバストな手法よりも有効性が高いが,全ての手法が有効な対策方法を見つけるのに苦労していることが明らかとなった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:08:12 GMT)
TSUBASA: Improving Long-Horizon Personalization via Evolving Memory and Self-Learning with Context Distillation [6.9]
本稿では,動的メモリ進化によるメモリ書き込み改善と,自己学習によるメモリ読み込みによるユーザエクスペリエンスの内在化を目的とした,2段階のアプローチであるTSUBASAを紹介する。 Qwen-3 モデルファミリ (4Bから32B) を用いた長期ベンチマークの大規模な評価は、TSUBASAの有効性を検証し、主にメモリ書き込みに依存する競合するメモリ拡張システムを上回った。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:04:19 GMT)
Joint Task Offloading, Inference Optimization and UAV Trajectory Planning for Generative AI Empowered Intelligent Transportation Digital Twin [6.9]
我々は、GAI搭載輸送デジタルツイン(ITDT)を提案する。本稿では,DMIタスクオフロード,推論,UAV軌道計画の協調最適化問題について検討する。本稿では, 近最適解を学習可能な, 更新型ヘテロジニアス・エージェント・ツイン遅延Deep Deterministic Policy gradient (SU-HATD3) アルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:19:10 GMT)
Vision-Language Foundation Models for Comprehensive Automated Pavement Condition Assessment [6.8]
汎用視覚言語モデルは、正確な専門用語、構造化推論、工学標準の遵守を必要とする専門技術分野と競合する。本研究は,視覚言語モデルによる包括的舗装条件評価を実現するために,ドメイン固有命令チューニングが有効であるかどうかを論じる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:11:30 GMT)
LegoDiffusion: Micro-Serving Text-to-Image Diffusion Workflows [6.8]
テキスト画像生成は、ベース拡散モデルを中心とした複数のモデルからなる拡散ワークフローを実行する。既存のサービスシステムは、各ワークフローを不透明なモノリスとして扱い、すべての構成モデルをまとめてプロビジョニング、配置、スケーリングします。ワークフローを疎結合のモデル実行ノードに分解し、独立して管理およびスケジュールすることが可能なシステムであるLegoDiffusionによるマイクロサービス拡散のケースを作成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:44:41 GMT)
Analysis of Search Heuristics in the Multi-Armed Bandit Setting [6.7]
我々は,従来のマルチアーメッド・バンドの設定を,異なる探索によって行われる探索・探索のトレードオフを理解するために検討する。進化的アルゴリズムはCondorcetの勝者を特定するのにかなり役立ちません。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:27:59 GMT)
Search Changes Consumers' Minds: How Recognizing Gaps Drives Sustainable Choices [6.7]
本稿では,探索が意図-行動ギャップを橋渡しできるという仮説を立てる。参加者は、積極的に買い物をしている製品に関する8つの倫理的側面のうちの1つについて、情報を探すよう求めます。以上より,このような情報を積極的に探すことによって,倫理的側面に割り当てられた参加者の重要性の全体的な増加が示唆された。倫理的意図や探索活動よりも倫理的考慮事項の認識と理解が、より責任ある決定へと移行した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:52:13 GMT)
Contextualising (Im)plausible Events Triggers Figurative Language [6.7]
本研究は、英語における主語・主語・目的語イベントの例における(非)リテラル性と可否性の関連について考察する。我々は、抽象的、具体的構成のカテゴリと組み合わせて、可塑性で不明瞭なイベントトリプルの体系的な構成を設計する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:52:21 GMT)
MotionScape: A Large-Scale Real-World Highly Dynamic UAV Video Dataset for World Models [6.7]
我々は,世界モデリングのための高ダイナミックな動きを持つ大規模実世界のUAVviewビデオデータセットであるMotionScapeを紹介する。 MotionScapeには4K UAVビュービデオが30時間以上含まれており、合計4.5Mのフレームがある。このデータセットはセマンティックで幾何学的に整合したトレーニングサンプルを備えており、様々な現実世界のUAVビデオが正確な6-DoFカメラ軌道ときめ細かい自然言語記述と密結合されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:59:40 GMT)
Bridging Time and Space: Decoupled Spatio-Temporal Alignment for Video Grounding [6.7]
textbfBridge-STGは、意味的コヒーレンスを維持しながら時間的および空間的ローカライゼーションを分離するエンドツーエンドフレームワークである。 Bridge-STGはMLLM方式の最先端性能を実現する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:14:00 GMT)
KV Cache Offloading for Context-Intensive Tasks [6.6]
KV-cacheオフロードは、正確性を保ちながらメモリフットプリントと推論レイテンシを低減するための有望なアプローチである。テキストから構造化知識を抽出する必要があるコンテキスト集約的なタスクであるText2JSONベンチマークをリリースする。我々の分析では、キーの低ランク射影と信頼性の低いランドマークの2つの重要な原因を特定した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:30:44 GMT)
OV-Stitcher: A Global Context-Aware Framework for Training-Free Open-Vocabulary Semantic Segmentation [6.6]
訓練不要なオープン語彙セマンティックセマンティックセグメンテーション(TF-OVSS)が近年注目されている。我々は,この制限に対処するトレーニングフリーフレームワークであるOV-Stitcherを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:28:43 GMT)
An Algorithm for Fast Assembling Large-Scale Defect-Free Atom Arrays [6.5]
光ツイーザによって形成されたAtomアレイは、この目標を達成する上で最も有望なプラットフォームである。アルゴリズムの課題を完全に解決するために、2つの革新的なコンポーネントからなる統一されたフレームワークを提案する。我々のアルゴリズムは、104量子ビットの原子配列を、閉じ込められた原子の典型的な真空寿命よりもはるかに短い時間スケールで組み立てることができる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:00:17 GMT)
A Little Rank Goes a Long Way: Random Scaffolds with LoRA Adapters Are All You Need [6.4]
LottaLoRAは、すべてのバックボーン重量をランダムに描画して凍結するトレーニングパラダイムであり、ローランクのLoRAアダプタのみがトレーニングされる。 9つのベンチマークで、さまざまなアーキテクチャファミリーが、完全にトレーニングされたパフォーマンスの96-100%を回復し、パラメータの0.5-40%しかトレーニングしていない。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:24:50 GMT)
Gaze to Insight: A Scalable AI Approach for Detecting Gaze Behaviours in Face-to-Face Collaborative Learning [6.4]
本研究では,対面協調学習における視線行動を自動的に検出するスケーラブルな人工知能手法を提案する。提案手法は、ビデオデータから生徒の視線行動を検出するために、0.829のF1スコアを達成する。実環境における学生の協調学習を支援するために,このアプローチがもたらす意味についても論じる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:25:24 GMT)
Wiring the 'Why': A Unified Taxonomy and Survey of Abductive Reasoning in LLMs [6.4]
本稿では,Large Language Models (LLMs) における帰納的推論に関する最初の調査について述べる。この分野で広く普及している概念的混乱とタスク定義の合成に対処するため,我々は,先行作業を正式に分類する統合された2段階定義を確立する。文献を包括的に分類し,それらの帰納的タスク,データセット,基礎となる方法論,評価戦略に基づいて事前作業の分類を行う。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:16:00 GMT)
"Why This Avoidance Maneuver?" Contrastive Explanations in Human-Supervised Maritime Autonomous Navigation [6.4]
本稿では,海洋背景を持つ監督者に対して,回避操作の背後にある因果論理を選択的かつ理解可能な方法で説明する方法について検討する。本研究では,人間中心の洞察を提供するコントラスト的説明を生成する手法を提案する。 4人の経験豊富な海洋士官による探索的ユーザースタディは、対照的な説明がシステムの目的を理解するのに役立つことを示唆している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:37:43 GMT)
Hardware-Efficient Erasure Qubits With Superconducting Transmon Qutrits [6.4]
超伝導回路では、二重レール方式で消去量子ビットを構築することができる。本研究では,トランスモン量子ビットを消去量子ビットとして動作させるハードウェア効率を実証する。その結果、主流アーキテクチャは、すでに消去ベースのQEC戦略を実装している可能性が示唆された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:01:53 GMT)
Simultaneous ground-state cooling of six mechanical modes of two levitated nanoparticles [6.4]
接地状態冷却は、巨大な物体の機械的運動におけるマクロ的な量子効果を探索するための前提条件である。 2つの浮遊ナノ粒子の6つの機械的変位モードの同時冷却について検討した。我々の研究は、複数の浮遊ナノ粒子における集合的な巨視的量子効果の生成と操作の道を開いた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:35:39 GMT)
Sampling-Aware 3D Spatial Analysis in Multiplexed Imaging [6.4]
高多重顕微鏡は、単一細胞の分解能で組織をリッチに特徴づけることができる。ほとんどの分析は、本質的に3次元組織組織であるにもかかわらず、2次元の切断に依存している。直列断面からのスパースかつ一貫した3次元解析を可能にする幾何認識再構成モジュールを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:59:15 GMT)
Clickbait detection: quick inference with maximum impact [6.3]
そこで我々は,OpenAIセマンティック埋め込みと6つのコンパクトな特徴を組み合わせ,スタイリスティックかつ情報的手法を取り入れた,クリックベイト検出のための軽量ハイブリッド手法を提案する。グラフベースモデルでは,推定時間を大幅に短縮することで,競争性能が向上することを示す。高いROC-Boost-値はさらに強力な識別能力を示し、様々な決定しきい値の下でクリックベイトの見出しを確実に検出する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:09:14 GMT)
Sustained Impact of Agentic Personalisation in Marketing: A Longitudinal Case Study [6.2]
本稿では,エージェント・インフラストラクチャを利用してマーケティング・メッセージのパーソナライズを行う,現実のコンシューマ・アプリケーションを分析対象とするケーススタディを提案する。マーケターがコンテンツ、オーディエンス、戦略を直接キュレートするアクティブフェーズと、エージェントが固定されたコンポーネントライブラリから自律的に操作するパッシブフェーズの2つを比較します。その結果、アクティブな人的管理はエンゲージメントの指標において最も高い相対的なリフトを生成する一方で、自律的なエージェントは受動的期間にポジティブなリフトを維持できた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:25:20 GMT)
Efficient Provably Secure Linguistic Steganography via Range Coding [6.2]
言語ステガノグラフィーは、秘密のメッセージを一見無害なテキストに埋め込んで隠蔽通信を可能にする。それまでの証明可能な安全なアプローチは、ゼロクルバック・リーバーの発散によって測定された完全な不可避性を達成している。本稿では,ローテーション機構を備えた効率的かつ確実な言語ステガノグラフィー手法を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:00:53 GMT)
Pruning Extensions and Efficiency Trade-Offs for Sustainable Time Series Classification [6.2]
時系列分類(TSC)は重要なユースケースを実現するが、モデル、データセット、ハードウェア間のパフォーマンストレードオフの統一的な理解は欠如している。本稿では,TSCにおける予測性能と資源消費のバランスを明らかにするための総合評価フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:19:10 GMT)
Investigation of Automated Design of Quantum Circuits for Imaginary Time Evolution Methods Using Deep Reinforcement Learning [6.2]
本稿では,Double Deep-Q Networks (DDQN) を用いたVITE回路設計のためのフレームワークを提案する。本稿では,回路構成を多目的問題として扱い,同時にエネルギー期待値の最小化と回路複雑性の最適化を行う。 Max-Cut問題において、我々のエージェントは、標準のハードウェア効率のアンサッツよりも約37%のゲートと43%の深さの回路を自律的に検出した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:17:11 GMT)
Your Agent Is Mine: Measuring Malicious Intermediary Attacks on the LLM Supply Chain [6.1]
大規模言語モデル(LLM)エージェントは、ツール呼び出し要求のディスパッチにサードパーティのAPIルータに依存している。本研究は,この攻撃面に関する最初の系統的研究である。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:06:41 GMT)
A Longitudinal Study of Dependency Reclassifications in JavaScript Projects [6.1]
JavaScriptプロジェクトの開発者が依存関係を再分類する方法について検討する。依存性の保守を活発に行う33,087のJavaScriptプロジェクトの分析から,依存関係の再分類がメンテナンス活動の主流であることが判明した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:23:38 GMT)
SearchAD: Large-Scale Rare Image Retrieval Dataset for Autonomous Driving [6.0]
堅牢な自律運転システムを構築するためには、大規模なデータセットから稀で安全に重要な運転シナリオを取得することが不可欠である。我々は,AD用の大規模レア画像検索データセットであるSearchADを紹介した。特に、非常に稀なクラスを探索するニードル・イン・ア・ヘイスタックの問題を対象としており、一部はデータセット全体で50回以下である。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:10:41 GMT)
Follow My Eyes: Backdoor Attacks on VLM-based Scanpath Prediction [6.0]
VLMに基づくスキャンパス予測に対するバックドアアタックの最初の研究について述べる。提案手法は, 連続的な出力空間における検出可能なクラスタリングを創出するが, 有効な固定パス攻撃が可能であることを示す。さらに、バックドアの挙動は、フラッグシップとレガシーの両方のコモディティスマートフォン上での量子化と展開を生き残ることを実証する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:06:19 GMT)
Benchmarking Deep Learning for Future Liver Remnant Segmentation in Colorectal Liver Metastasis [6.0]
大腸癌肝転移の手術計画には,肝残肝の正確な分節化が重要である。私たちはこのタスクのための最初のオープンソースの検証済みのベンチマークを作成します。 STU-Netは優れたCRLMセグメンテーション(0.620Dice)を提供する一方、カスケードされたnnU-Netは最高の最終FLRセグメンテーションDice(0.767)を達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:05:59 GMT)
DBMF: A Dual-Branch Multimodal Framework for Out-of-Distribution Detection [6.0]
アウト・オブ・ディストリビューション(OOD)検出は、ディープラーニングモデルの信頼性と一般化性を高める上で重要な役割を果たす。本稿では,テキストイメージブランチとビジョンブランチを導入することで,新しいデュアルブランチマルチモーダルフレームワークを提案する。この2つの相補的な枝を通してOODサンプルを同定するために,本フレームワークはマルチモーダル表現を完全に活用する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:48:38 GMT)
Revisiting Anisotropy in Language Transformers: The Geometry of Learning Dynamics [6.0]
トランスフォーマーアーキテクチャは自然言語処理(NLP)を支配してきた最近の研究では、これらのモデルに固有の異方性現象が強調されている。我々は,運動誘発低ランクタンジェントプロキシに適合するために,ポストホックではなく,トレーニング中に概念に基づく機械的解釈性を利用する。これらの活性化誘導方向は、異常に大きな勾配エネルギーと、一致するランクの通常の制御よりもかなり大きな勾配異方性の両方を捕捉する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:02:20 GMT)
SenBen: Sensitive Scene Graphs for Explainable Content Moderation [5.9]
我々は、センシティブなコンテンツのための最初の大規模シーングラフベンチマークであるSensitive Benchmark(SenBen)を紹介する。 SenBenは、Visual Genomeスタイルのシーングラフで注釈付けされた157本の13,999フレームで構成されている。自動回帰シーングラフ生成における語彙不均衡に対処するマルチタスクレシピを用いて,フロンティアVLMをコンパクトな241M学生モデルに蒸留する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 23:22:05 GMT)
Stitch4D: Sparse Multi-Location 4D Urban Reconstruction via Spatio-Temporal Interpolation [5.9]
スパース観測における空間被覆の欠如を明示的に補償する統合された4次元再構成フレームワークを提案する。最適化前の中間カバレッジを復元することにより、Stitch4Dは幾何学的崩壊を防止し、コヒーレントな幾何学と滑らかなシーンダイナミクスを再構築する。 U-S4D実験の結果,Stitch4Dは代表的4次元再構成ベースラインを超越し,視覚的品質が向上した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:45:51 GMT)
SeLaR: Selective Latent Reasoning in Large Language Models [5.8]
CoT(Chain-of-Thought)は、大規模言語モデルにおける推論の基盤となっている。最近の潜在的推論手法は、離散トークンをソフト埋め込みに置き換えることで、この制限を緩和しようとする。潜在推論のための軽量かつトレーニング不要なフレームワークであるSeLaRを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:32:07 GMT)
Cards Against LLMs: Benchmarking Humor Alignment in Large Language Models [5.8]
ヒューモアは人類のコミュニケーションにおいて最も文化的に埋め込まれ、社会的に重要な次元の1つである。モデル同士が人間と同意する頻度よりもはるかに頻繁に一致していることが示されています。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:42:49 GMT)
The Sustainability Gap in Robotics: A Large-Scale Survey of Sustainability Awareness in 50,000 Research Articles [5.8]
本研究は2015年から2026年にかけて発行されたarXivのcs.ROカテゴリから5万件近いオープンアクセス論文をカバーしている。論文が社会、生態、持続可能性に与える影響について言及する頻度を定量化します。結果は、フィールドのポテンシャルと、その記述された意図の間に永続的なギャップが浮かび上がっていることを示している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:41:49 GMT)
Semantic-Aware UAV Command and Control for Efficient IoT Data Collection [5.7]
無人航空機(UAV)はIoT(Internet of Things)デバイスからのデータ収集のための重要なイネーブラー技術として登場した。本稿では,UAVコマンド・アンド・コントロール(C&C)とセマンティックコミュニケーションを統合し,IoTデバイスからの効率的な画像データ収集を実現する新しいフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:12:58 GMT)
PSIRNet: Deep Learning-based Free-breathing Rapid Acquisition Late Enhancement Imaging [5.7]
PSIRNetは単一の取得から診断品質の高いPSIR LGE画像を生成する。 MOCO PSIRでは1スライスあたり約100msec, 5sec以上が必要であった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:31:48 GMT)
Adversarial Label Invariant Graph Data Augmentations for Out-of-Distribution Generalization [5.7]
アウト・オブ・ディストリビューション(OoD)の一般化は、表現学習が分散シフトに遭遇したときに起こる。 RIA - 逆行訓練による不変性に対する正規化を提案する。 Q$-learningの例に倣って、データ環境をトレーニングするための敵対的な探索を行う。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:02:07 GMT)
Can Vision Language Models Judge Action Quality? An Empirical Evaluation [5.7]
アクション・クオリティ・アセスメント(AQA)は、理学療法、スポーツコーチング、競争力判定に広く応用されている。 Vision Language Models (VLM) は AQA に対してかなりの保証を持っているが、この領域における実際のパフォーマンスは、ほとんど役に立たないままである。本稿では,活動領域(例えば,フィットネス,フィギュアスケート,ダイビング,タスク,表現,促進戦略)における最先端VLMの総合評価について述べる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:29:19 GMT)
Location Is All You Need: Continuous Spatiotemporal Neural Representations of Earth Observation Data [5.7]
我々は,多時間地球観測(EO)データを連続神経場として興味のある領域にモデル化する座標ベースニューラル表現であるIANetを提案する。 LIANetは、元の衛星データにアクセスすることなく、セマンティックセグメンテーションやピクセルワイズレグレッションなどの様々なEO下流タスクに適応することができる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:53:00 GMT)
Bird-Inspired Spatial Flapping Wing Mechanism via Coupled Linkages with Single Actuator [5.6]
本稿では, 単一モータで駆動する2つの連結空間4バーから鳥に触発された羽ばたき機構について述べる。 3Dプリントしたプロトタイプを組み立ててテストし、意図された空間的なストロークと受動的な折りたたみ動作を示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:44:20 GMT)
Optimal noisy quantum phase estimation with finite-dimensional states [5.6]
粒子損失のノイズについて検討し, このノイズ下での真のOFPSについて検討した。 2段階の計測戦略が提案され、実際の最終的な精度限界を実現する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:30:50 GMT)
On the Decompositionality of Neural Networks [5.5]
ニューラルアーキテクチャに対する意味保存抽象化として定義された形式的概念であるニューラル分解性を導入する。我々の重要な洞察は、分解性はモデルの決定境界に沿った意味的行動の保存によって特徴づけられるべきであるということである。提案した定義を運用する境界対応フレームワーク SAVED を開発した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:32:24 GMT)
Shift- and stretch-invariant non-negative matrix factorization with an application to brain tissue delineation in emission tomography data [5.5]
シフト不変およびストレッチ不変な非負行列分解フレームワークを提案する。提案手法では,整数と非整数の時間的シフトと時間的ストレッチの両方を推定する。我々は,脳組織構造のより詳細な解析を行うために,モデルがストレッチを考慮できる合成データと脳発光トモグラフィーデータについて実証した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:22:04 GMT)
SAT: Selective Aggregation Transformer for Image Super-Resolution [5.5]
トランスフォーマーベースのアプローチは、長距離依存をモデル化することによって、画像超解像に革命をもたらした。最近のウィンドウベースアテンション手法は、計算をローカライズすることでこれを緩和するが、しばしば制限された受容場が得られる。この新しいトランスは、長距離依存を効率的に捕捉し、モデル受容場を拡大する。 SATは最先端のPFTを最大0.22dBで上回り、FLOPの総数は最大27%削減できることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:02:58 GMT)
Quantum Property Testing for Bounded-Degree Directed Graphs [5.5]
我々は、ある普遍定数$d$で有界な最大等級と外等級を持つ有向グラフの量子特性試験について研究する。近接パラメータ $varepsilon$ に対して、古典的双方向モデルで$O_varepsilon,d(1)$クエリでテスト可能なプロパティは、入出力エッジの両方にアクセス可能であることを示す。これにより、一方向モデルにおける最もよく知られた古典的アルゴリズムよりも、ほぼ二次的な量子スピードアップが得られる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:19:45 GMT)
Toward Generalizable Graph Learning for 3D Engineering AI: Explainable Workflows for CAE Mode Shape Classification and CFD Field Prediction [5.5]
本稿では、3DエンジニアリングAIのための実践的なグラフ学習フレームワークを提案する。このフレームワークは、CAE振動モード形状分類とCFD空力場予測という2つの自動車応用で検証されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:15:17 GMT)
Verify Before You Commit: Towards Faithful Reasoning in LLM Agents via Self-Auditing [5.5]
我々は,行動開始前のエージェントの内部信頼状態に対する検証を行う新しいフレームワークであるtextbfSelf-textbfAudited textbfVerified textbfReasoning (textscSAVeR)を提案する。当社のアプローチは、競争力のあるエンドタスクのパフォーマンスを維持しながら、推論の忠実さを継続的に改善します。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:01:03 GMT)
Beyond Stochastic Exploration: What Makes Training Data Valuable for Agentic Search [5.5]
本稿では,検索エージェントの性能向上と訓練を目的とした,階層的体験(HiExp)を提案する。比較分析とマルチレベルクラスタリング機構を通じて経験的知識を抽出し,生の推論軌道を階層的経験知識に変換する。提案手法は性能向上を実現し,強いクロスタスクとクロスアルゴリズムの一般化を示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:44:44 GMT)
Retrieval Augmented Classification for Confidential Documents [5.5]
本稿では,RAC(Retrieval Augmented Classification)を用いた機密文書の分類手法を提案する。バランスの取れたデータでは、RACはリアルなシーケンス長制約の下でWikiLeaks US Diplomacy corpusの微調整(FT)を監督する。 RACは、モデルの重みから機密性の高いコンテンツをコントロール下に保持することで、強力な分類への実用的なセキュリティ保護パスを提供します。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:13:03 GMT)
Context-Aware Disentanglement for Cross-Domain Sequential Recommendation: A Causal View [5.5]
Cross-Domain Sequential Recommendation (CDSR)は、ドメイン間で知識を伝達することで推奨品質を高めることを目的としている。本稿では,ドメイン共有やドメイン固有の好みを正確に切り離すために,因果的視点に基づくコンテキスト認識型アンタングル化フレームワークであるCoDiSを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:00:49 GMT)
Optimal Multi-bit Generative Watermarking Schemes Under Worst-Case False-Alarm Constraints [5.3]
本稿では,大言語モデルに対するマルチビット生成透かしの問題について,最悪ケースの偽アラーム制約下で検討する。しかし,提案手法は実際は準最適であることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:46:24 GMT)
TEMPER: Testing Emotional Perturbation in Quantitative Reasoning [5.2]
感情的フレーミングは,すべての数値的内容が保存されているにもかかわらず,精度を2～10ポイント低下させることを示した。また、感情的変異を中和することは、失ったパフォーマンスの大半を回復させることを示す。非感情的なパラフレーズはそのような劣化を起こさず、表面レベルの変化よりも感情的な内容に関係している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:52:18 GMT)
Unified Supervision for Walmarts Sponsored Search Retrieval via Joint Semantic Relevance and Behavioral Engagement Modeling [5.2]
本稿では,ウォルマートが支援するeコマースにおける検索検索のためのバイエンコーダトレーニングフレームワークを提案する。意味的関連性(semantic Relevance)を主要な監視信号として使用し、関連する項目の優先信号としてのみ使用します。本手法は,オフライン評価とオンラインABテストの両方において,現在の生産システムより優れている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:49:41 GMT)
Wireless Communication Enhanced Value Decomposition for Multi-Agent Reinforcement Learning [5.2]
マルチエージェント強化学習(MARL)における協調は、エージェント間コミュニケーションの恩恵を受ける。ほとんどのアプローチでは、理想化されたチャネルと、誰と情報を共有することに成功した既存の価値分解手法を前提としています。 CLOVERは、リアルな無線チャネルで実現された通信グラフ上に、集中値ミキサーを条件付けした協調的なMARLフレームワークである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:42:17 GMT)
From Synthesis to Clinical Assistance: A Strategy-Aware Agent Framework for Autism Intervention based on Real Clinical Dataset [5.2]
textscASDAgentは、高忠実度介入対話合成と臨床決定支援を統合するために設計された戦略対応フレームワークである。実際の自閉症介入では、textscASDAgentは人間の専門家と80%近い戦略的整合性を達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:28:46 GMT)
When Fine-Tuning Changes the Evidence: Architecture-Dependent Semantic Drift in Chest X-Ray Explanations [5.1]
医用画像分類において, 転帰学習と微調整は, 診断性能が一貫した向上により広く採用されている。重なり合う視覚的特徴を持つ多クラス設定では、精度の向上は、予測をサポートするために使用される視覚的証拠の安定性を保証するものではない。我々は,意味的ドリフトを,伝達学習とフル微調整の間のモデルの予測を支援する帰属構造における体系的な変化として定義する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:53:02 GMT)
Quantifying Explanation Consistency: The C-Score Metric for CAM-Based Explainability in Medical Image Classification [5.1]
CAM(Class Activation Mapping)法は、医用画像における深層学習分類器の視覚的説明を生成するために広く用いられている。既存の評価フレームワークは、ラジオロジストアノテーションに対する局所化忠実度を用いて、説明が正しいかどうかを評価する。 Cスコア(Consistency Score, Consistency Score, C-Score, C-Score, C-Score, C-Score, C-Score, C-Score, C-Score)を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:47:31 GMT)
Mitigating the reconstruction-detection trade-off in VAE-based unsupervised anomaly detection [5.1]
我々は,$-VAEモデル間の再構成品質と異常検出のトレードオフを明らかにする。制約付き遅延空間を持つモデルは、より高い検出基準に達するが、再構築品質は低下する。本研究では,リコンストラクション検出トレードオフを緩和する2つの方法として,ベータスケジューリングとスパースVAEについて検討する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:00:20 GMT)
SIC3D: Style Image Conditioned Text-to-3D Gaussian Splatting Generation [5.1]
SIC3Dは3Dガウススプラッティングによる制御可能な画像調和型テキスト・ツー・3D生成パイプラインである(3DGS) 第1段階はテキストから3DGS生成モデルを用いてテキストから3Dオブジェクトコンテンツを生成する。第2ステージは、参照画像から3DGSにスタイルを転送する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:50:49 GMT)
VineLM: Trie-Based Fine-Grained Control for Agentic Workflows [5.0]
VineLMは、モデル選択プレフィックスの注釈付きトリエとして実行可能な実行を表す。 VineLMは、モデル選択プレフィックスの注釈付きトリエとして実行可能な実行を表す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:31:22 GMT)
CodecSight: Leveraging Video Codec Signals for Efficient Streaming VLM Inference [4.8]
我々は、圧縮の副産物として、ビデオコーデックが各ストリームの時間的・空間的構造を抽出しているというキー観測に基づいて構築されたストリーミングビデオ分析システム、CodecSightを提案する。 CodecSightはこのメタデータを低コストの信号として扱い、ビデオデコード、ビジュアルプロセッシング、LLMプリフィルのランタイム最適化を統一する。実験によると、CodecSightはスループットを最大3$times$で改善し、GPU計算を最先端のベースラインよりも最大87%削減し、競争精度を維持している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:40:36 GMT)
AgiPIX: Bridging Simulation and Reality in Indoor Aerial Inspection [4.7]
Agipixは、屋内の自律性と重要な資産検査のための、オープンハードウェアとソフトウェアプラットフォームを共同設計した。 Agipixは、GPUアクセラレーションを内蔵した、コンパクトでハードウェア同期型のアクティブセンシングプラットフォームを備えている。工業用屋内環境におけるオンボードセンシングによる軌道追跡と探索性能について述べる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:11:55 GMT)
3D-VCD: Hallucination Mitigation in 3D-LLM Embodied Agents through Visual Contrastive Decoding [4.7]
3D-VCDは、3Dエンボディエージェントの幻覚緩和のための最初の推論時視覚コントラストデコーディングフレームワークである。 3D-VCDは、オブジェクト中心の表現に意味的および幾何学的摂動を適用することで、歪んだ3Dシーングラフを構築する。再訓練をすることなく,基礎的推論を継続的に改善できることが示される。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:57:35 GMT)
Parent Selection Mechanisms in Elitist Crossover-Based Algorithms [4.6]
本稿では,最遠距離の親の選抜を優先する遺伝的アルゴリズム(GA)の親選択戦略を提案する。適切に選択された集団サイズにより、このアルゴリズムは、期待時間$O(k4knlog(n))$Jump$_k$問題を解く。本分析から得られた知見は,遺伝的アルゴリズムの集団動態におけるクロスオーバーの役割の理論的理解に寄与する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:51:29 GMT)
The MQT Compiler Collection: A Blueprint for a Future-Proof Quantum-Classical Compilation Framework [4.6]
MQT Compiler Collectionは、将来的な量子古典コンパイルフレームワークの青写真である。本稿では,高レベルアルゴリズムからハードウェア固有の命令までの完全なコンパイルパイプラインをサポートするため,コアMLIRの概念を取り入れたフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:05:10 GMT)
SD-FSMIS: Adapting Stable Diffusion for Few-Shot Medical Image Segmentation [4.6]
Few-Shot Medical Image (FSMIS) は、最小限のアノテート例のみを用いて、新しいオブジェクトクラスを医療画像に分割することを目的としている。 SD-FSMISは、FSMISタスクに強力な安定拡散モデルを効果的に適応する新しいフレームワークである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:56:24 GMT)
An Imperfect Verifier is Good Enough: Learning with Noisy Rewards [4.5]
RLVR(Reinforcement Learning with Verifiable Rewards)は,Large Language Models(LLMs)のポストトレーニング方法として注目されている。 RLVRがそのようなノイズに対して頑健である程度と、効果的なトレーニングに必要な検証精度は未解決のままである。 RLトレーニングにノイズを導入することで,コード生成と科学的推論の領域におけるこれらの疑問について検討する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:15:01 GMT)
Non-variational supervised quantum kernel methods: a review [4.5]
量子カーネル法(QKM)は、教師付き量子機械学習の著名なフレームワークとして登場した。本総説は,QKMが真の優位性をもたらす可能性のある体制を明らかにすることを目的としており,実践的な量子化学習において克服すべき概念的,方法論的,技術的障害を明確にすることを目的とする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:11:24 GMT)
STQuant: Spatio-Temporal Adaptive Framework for Optimizer Quantization in Large Multimodal Model Training [4.5]
状態のメモリフットプリントを削減する分散トレーニングフレームワークSTQuantを提案する。 GPT-2 と ViT の実験では、STQuant はメモリの劣化を84.4%削減し、平均ビット幅は5.1ビットである。 STQuantはO(N/K)計算オーバーヘッドのみを発生させ、O(1)余剰空間を必要とする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:16:08 GMT)
Sparse $ε$ insensitive zone bounded asymmetric elastic net support vector machines for pattern classification [4.5]
既存のサポートベクターマシン(SVM)モデルはノイズに敏感であり、性能を制限している。弾性ネット損失とロバスト損失の枠組みを組み合わせることで、$varepsilon非感受性非対称な非対称弾性ネット損失を構築する。 $varepsilon-BAEN-SVMは従来の堅牢なSVMよりも優れています。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:10:20 GMT)
AI Driven Soccer Analysis Using Computer Vision [4.4]
ゲーム中におけるプレーヤの位置を予測するためのオブジェクト検出とトラッキングシステムを提案する。プレーヤー識別モデルでは, YOLO や Faster R-CNN などのオブジェクト検出モデルを, カスタム映像の精度に基づいて評価する。トランスフォーメーションされた現実世界の座標は、プレイヤーの速度、距離のカバー、位置のヒートマップなど、貴重な戦術的洞察を計算するのに使うことができる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:19:40 GMT)
Adapting Foundation Models for Annotation-Efficient Adnexal Mass Segmentation in Cine Images [4.4]
超音波による近接性質量評価は、主観的解釈と重要なサーバ間変動によって妨げられることが多い、困難な臨床課題である。本稿では,事前訓練されたDINOv3基盤視変換器バックボーンのロバストなセマンティクスを活かしたラベル効率のセグメンテーションフレームワークを提案する。提案手法は,U-Net,U-Net++,DeepLabV3,MAnetなどの完全教師付きベースラインと比較して,最先端の性能を実現する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:48:50 GMT)
ParseBench: A Document Parsing Benchmark for AI Agents [4.4]
Parseの出力は、自律的な決定に必要な構造と意味を保存する必要がある。 LlamaParse AgenticはAgenicoverall%で最高スコアを達成している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:59:36 GMT)
Neural-Symbolic Knowledge Tracing: Injecting Educational Knowledge into Deep Learning for Responsible Learner Modelling [4.3]
本稿では,ニューラルシンボリックな深層知識追跡手法であるResponsible-DKTを提案する。シンボリックな教育知識(例えば、熟達と非熟達規則)を、責任ある学習者モデリングのためのシーケンシャルなニューラルモデルに統合する。学生の数学相互作用の現実的なデータセットの実験により、Responsible-DKTは、ニューラルシンボリックベースラインと完全にデータ駆動のPyTorch DKTモデルの両方より優れていることが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:49:07 GMT)
DinoRADE: Full Spectral Radar-Camera Fusion with Vision Foundation Model Features for Multi-class Object Detection in Adverse Weather [4.2]
DinoRADEは、高密度なRadarテンソルを処理し、カメラパースペクティブで変換された参照ポイントの周りに視覚的特徴を集約するRadar中心検出パイプラインである。我々は,全気象条件におけるK-Radarデータセットの総合的な性能評価を行い,検出性能を5つのクラスで個別に報告した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:46:41 GMT)
TOOLCAD: Exploring Tool-Using Large Language Models in Text-to-CAD Generation with Reinforcement Learning [4.1]
大規模言語モデル(LLM)は、言語エージェントが現実世界のタスクに対処できるように、顕著な進歩を見せている。テキスト・ツー・CAD生成のためのツール・ユース・エージェントとしてLLMをデプロイする新しいエージェントCADフレームワークであるToolCADを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:22:46 GMT)
Security Concerns in Generative AI Coding Assistants: Insights from Online Discussions on GitHub Copilot [4.1]
この研究は、GenAIベースのコーディングアシスタントの使用に関するセキュリティ上の懸念について調査する。私たちは3つの人気のあるプラットフォームから、GitHub Copilotのセキュリティ問題に対処する投稿、コメント、ディスカッションスレッドを検索しました。潜在的なデータ漏洩、コードライセンシング、敵攻撃(即発注入など)、安全でないコード提案を含む4つの主要な関心領域が特定された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:19:10 GMT)
Vulnerability Detection with Interprocedural Context in Multiple Languages: Assessing Effectiveness and Cost of Modern LLMs [4.1]
大規模言語モデル(LLM)は、自動脆弱性検出のための有望な方法である。本研究では,相互依存関係に関連する脆弱性の検出における検出の有効性,推論コスト,説明の質について検討した。その結果、Gemini 3 FlashはCの脆弱性に対して最もコスト効率の良いトレードオフを提供することがわかった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:17:58 GMT)
Towards Improving the External Validity of Software Engineering Experiments with Transportability Methods [3.9]
本稿では,輸送性手法とその前提条件について紹介し,シミュレーションによりその可能性を実証する。次に、これらの手法が適用可能ないくつかのSE研究シナリオについて概説する。最後に,SE研究者を支援するための道路地図と実践的ガイドラインについて概説する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:57:26 GMT)
Lessons Without Borders? Evaluating Cultural Alignment of LLMs Using Multilingual Story Moral Generation [3.8]
新たな文化的基盤評価課題として多言語物語モラル生成を導入する。 14の言語と文化のペアにまたがって収集された人間による物語のモラルのデータセットを用いて、モデル出力と人間の解釈を比較した。我々は,フロンティアモデルが人間の反応と意味的に類似し,人間の評価者が好むストーリーモラルを生成することを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:13:24 GMT)
Critical Entanglement Dynamics at Dynamical Quantum Phase Transitions [3.8]
動的量子相転移における運動量空間エンタングルメントエントロピーの臨界挙動について検討する。エントロピーは時間依存的になり、DQPT臨界時間で最小となることを示す。本結果は,運動量空間のエンタングルメントエントロピーが適切な固有ベイジで評価された場合,DQPTの頑健で時間に依存しない診断を提供することを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:58:39 GMT)
Rapid mixing for high-temperature Gibbs states with arbitrary external fields [3.8]
ギブス状態の絡み合い構造と計算複雑性の形成における外部場の役割について検討する。任意の1ドルに対して、対応するギブス状態の計算基底分布から十分に大きな外部場を持つサンプリングを行う局所ハミルトニアンが存在する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:08:41 GMT)
AFGNN: API Misuse Detection using Graph Neural Networks and Clustering [3.7]
AFGNNは、JavaコードのAPI誤用を効率的に検出する新しいグラフニューラルネットワーク(GNN)ベースのフレームワークである。 AFGNNは、新しいAPI Flow Graph(AFG)表現を使用して、コードに存在するAPI実行シーケンス、データ、制御フロー情報をキャプチャして、API使用パターンをモデル化する。人気のあるAPI使用データセットの実験によると、AFGNNは最先端の小さな言語モデルとAPI誤用検知器を著しく上回っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:01:16 GMT)
MonoUNet: A Robust Tiny Neural Network for Automated Knee Cartilage Segmentation on Point-of-Care Ultrasound Devices [3.6]
ポイント・オブ・ケア・超音波(POCUS)デバイスを用いた人工膝関節脱臼のための超コンパクト深層学習モデルを開発した。 MonoUNetは、(i)非対称デコーダを備えた積極的に縮小されたバックボーン、(ii)マルチスケールの局所的な位相特徴を抽出するトレーニング可能なモノジェニックブロック、(iii)ゲートされた特徴注入機構からなる。 MonoUNetは多部位多デバイス人工膝関節超音波データセットを用いて評価した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:14:16 GMT)
Generalization Under Scrutiny: Cross-Domain Detection Progresses, Pitfalls, and Persistent Challenges [3.6]
クロスドメインオブジェクト検出(CDOD)は依然として重要な研究領域である。既存の文献は断片化され続けており、ドメインシフトの根底にある構造的課題について統一的な視点が欠如している。本調査はCDODを理解するための統一的なフレームワークの提供と,より堅牢な検出システムの開発を導くことを目的としている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:21:25 GMT)
On the Unique Recovery of Transport Maps and Vector Fields from Finite Measure-Valued Data [3.6]
有限測度値データからベクトル場と輸送マップのユニークな回復を保証する。特に、微分同相写像が有限個の密度上のプッシュフォワード作用から一意に特定できる一般条件を提供する。我々は, 連続性, 対流, フォッカー-プランク, 対流-拡散-反作用方程式に関連するある種のPDE逆問題に対して, 新たな保証を与える方法を示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:26:30 GMT)
HistDiT: A Structure-Aware Latent Conditional Diffusion Model for High-Fidelity Virtual Staining in Histopathology [3.5]
HistDiTアーキテクチャは、仮想組織学的染色における視覚的忠実性の新たなベンチマークを確立する。本モデルでは,厳密な定量的および定性的評価により,既存のベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:39:37 GMT)
Human-AI Collaboration Reconfigures Group Regulation from Socially Shared to Hybrid Co-Regulation [3.5]
ジェネレーティブAI(GenAI)は、コラボレーション学習でますます使われているが、グループによるコラボレーションの規制方法への影響はいまだ不明である。並列群ランダム化実験において,Human-AIグループとHuman-Humanグループ間の協調的規制を比較した。その結果、GenAIの可用性は、主に社会的に共有される形式から、よりハイブリッドな共規制形式へと規制を移行した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:15:32 GMT)
EfficientSign: An Attention-Enhanced Lightweight Architecture for Indian Sign Language Recognition [3.5]
我々は、EfficientNet-B0を採用し、2つの注目モジュールに焦点を当てた軽量モデルを構築します。インド手話アルファベットの12,637の画像を、他の5つのアプローチと比較した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:27:57 GMT)
ParkSense: Where Should a Delivery Driver Park? Leveraging Idle AV Compute and Vision-Language Models [3.3]
ParkSenseは、アイドル計算を再利用して、事前キャッシュされた衛星とストリートビューの画像上でビジョン・ランゲージ・モデル(VLM)を実行するフレームワークである。本研究では,HW4クラスのハードウェア上で,量子化された7B VLMが4～8秒で推論を完了することを示し,Delivery-Aware Precision Parking問題を定式化する。この未調査の自動運転、コンピュータビジョン、ラストマイルロジスティクスの交差点で、5つのオープンな研究方向が特定されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:28:57 GMT)
Domain-Contextualized Inference: A Computable Graph Architecture for Explicit-Domain Reasoning [3.3]
我々は、ドメインが明示的な第一級計算パラメータである計算基板に依存しない推論アーキテクチャを確立する。これにより、O(N) から O(N/K) へのクエリごとの探索空間を削減し、シンボリック、ニューラル、ベクター、ハイブリッド基板上での基板非依存実行を実現する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 23:09:57 GMT)
SkillForge: Forging Domain-Specific, Self-Evolving Agent Skills in Cloud Technical Support [3.3]
既存のスキルクリエーターはドメイン基盤を欠き、現実世界のタスク要件に適合しないスキルを生み出す。 SkillForgeは、エンドツーエンドの生成/リファインメントループを閉じるセルフ進化フレームワークです。 1,883のチケットと3,737のタスクにまたがる,現実世界のクラウドサポートシナリオを5つ評価した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:11:23 GMT)
On-Policy Distillation of Language Models for Autonomous Vehicle Motion Planning [3.3]
大型言語モデル(LLM)は、最近、自動運転車の運動計画に強い可能性を実証している。本研究では,大規模LLMからより小さく,より展開可能な学生モデルへ,運動計画の知識を効果的に伝達する方法について検討する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:06:19 GMT)
Formalizing building-up constructions of self-dual codes through isotropic lines in Lean [3.3]
キムの双対自己双対符号構築はチンブルグ=張のヒルベルト記号構築と等価であることを示す。次に、q$の自己双対符号を効率的に構築するために、Chenburg-Zhang の構成の$q$ary版を紹介します。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:27:46 GMT)
PRAGMA: Revolut Foundation Model [3.2]
PRAGMAは、マルチソースバンキングイベントシーケンスの基礎モデルのファミリーである。クレジットスコアリング、不正検出、ライフタイムバリュー予測など、幅広いダウンストリームタスクをサポートする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:00:00 GMT)
Reset-Free Reinforcement Learning for Real-World Agile Driving: An Empirical Study [3.0]
本稿では,実世界のアジャイル運転におけるリセットフリー強化学習(RL)の実証的研究について述べる。モデル予測経路積分制御(MPPI)をリセットポリシーと残差学習の基本ポリシーの両方に採用する。残差学習を持つSACはシミュレーションの最も高いリターンを達成するが、TD-MPC2のみが物理プラットフォーム上のMPPIベースラインを一貫して上回っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:28:54 GMT)
The Impact of Dimensionality on the Stability of Node Embeddings [2.9]
ノード埋め込みの寸法変化が,その安定性と下流性能に与える影響について検討する。我々は、ASNE、DGI、GraphSAGE、node2vec、VERSEの5つの広く使われている手法を評価した。実験の結果, 埋込安定性は次元によって大きく異なるが, 検討対象の方法によって異なるパターンが観察されることがわかった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:33:02 GMT)
Optimized Gottesman-Kitaev-Preskill Error Correction via Tunable Preprocessing [2.9]
本稿では,Steane-type (P-Steane) 方式を提案する。Steane-type (P-Steane) は,Squeezingパラメータを$a$と$b$で調整可能な前処理ステージを導入し,雑音の伝搬を積極的に再現する。小型ノイズ状態において、データキュービットがアンシラキュービットよりもノイズが大きい場合、P-Steaneスキームは2a = b$のときの位置および運動量4乗出力ノイズの最小積を達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:38:28 GMT)
Sufficiency and Petz recovery for positive maps [2.9]
量子状態の族(統計実験)の相互変換を正のトレース保存写像を用いて研究する。ネイマン・ピアソン検定により、最小限のジョルダン代数が生成されることを示す。約有限次元フォン・ノイマン環に対するフレンケルの公式も証明する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:42:35 GMT)
PolySLGen: Online Multimodal Speaking-Listening Reaction Generation in Polyadic Interaction [2.8]
PolySLGenは、Polyadic Multimodal Talk and Listening reaction Generationのためのオンラインフレームワークである。これは、発話、身体の動き、発話状態スコアを含む、対象者に対する将来の発話または聴取反応を生成する。実験により、PolySLGenは文脈的に適切で時間的にコヒーレントなマルチモーダル反応を生成することが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:46:14 GMT)
Persistence-Augmented Neural Networks [2.7]
局所勾配流領域とその階層的進化をエンコードする永続性に基づくデータ拡張フレームワークを提案する。この表現は畳み込みニューラルネットワークとグラフニューラルネットワークの両方と互換性がある。階層の基底レベルをプルーニングすると、競合性能を維持しながらメモリ使用量が減少することを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:06:06 GMT)
Weak Adversarial Neural Pushforward Method for the Wigner Transport Equation [2.6]
我々は、Wak Adversarial Neural Pushforward Methodを量子系の位相空間力学を規定するウィグナー輸送方程式に拡張する。本稿では,学習可能な重みを混合した2つの非負位相空間分布に解を分解する,符号付きプッシュフォワードアーキテクチャを提案する。結果として得られた方法は、メッシュフリーでヤコビアンフリーでスケーラブルなオリジナルのフレームワーク特性を継承し、それを量子設定に拡張する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:58:15 GMT)
Navigating Turbulence: The Challenge of Inclusive Innovation in the U.S.-China AI Race [2.6]
本章では、米国と中国の地政学的対立が人工知能(AI)開発における包括的イノベーションの展望に与える影響について考察する。我々は、データプライバシー、知的財産権(IP権利)、輸出制限という、AIイノベーションに大きな影響を及ぼす米国と中国の法律基盤の3つの重要な側面を探求する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:19:40 GMT)
A Machine Learning Framework for Turbofan Health Estimation via Inverse Problem Formulation [2.4]
ターボファンエンジンの健康状態を推定することは、スパースセンシングと複雑な非線形熱力学によって妨げられる、難しい逆問題である。本研究は, リアルな劣化・維持パターン下での運転センサデータから, コンポーネントレベルの健康指標を回収する方法を検討する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:56:37 GMT)
Mitigating Distribution Sharpening in Math RLVR via Distribution-Aligned Hint Synthesis and Backward Hint Annealing [2.4]
検証可能な報酬(RLVR)による強化学習は、難解な数学問題に対する解のカバレッジを狭めながら、推論精度を低コストで向上させることができる。既存のヒントベースのアプローチは、挑戦的な質問をトレーニング可能にするが、2つの問題が未解決のまま残されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:08:41 GMT)
Needle in a Haystack -- One-Class Representation Learning for Detecting Rare Malignant Cells in Computational Cytology [2.3]
悪性細胞は形態学的に多様であるが、正常な細胞の広大な背景の中で消失する。ワンクラスの表現学習技術は、低知能率のシナリオで悪性細胞を検出することができる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:13:29 GMT)
Agentivism: a learning theory for the age of artificial intelligence [2.3]
生成的かつエージェント的なAIは、学習者が認知作業を生成、推薦、時には学習者に代わって行動できるシステムに委譲することを可能にして、新しい条件を作成する。このことは、学習理論の根本的な課題を生み出します。本稿では,人間-AIインタラクションの学習理論であるAgentivismを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:09:48 GMT)
Trotterization with Many-body Coulomb Interactions: Convergence for General Initial Conditions and State-Dependent Improvements [2.2]
クーロン相互作用による多体量子システムを効率的にシミュレートすることは、量子物理学、量子化学、量子コンピューティングにおいて基本的な問題である。本研究では,クーロン相互作用を持つ多体量子系に適用したトロッターの厳密な誤差境界を確立する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:47:15 GMT)
Empirical Evaluation of Taxonomic Trace Links: A Case Study [2.2]
トレーサビリティは、知識集約的なタスクで使用されるアーティファクトの重要な品質特性である。その明確な利点にもかかわらず、トレーサビリティは実際には無視されることが多い。分類学的トレースリンクアプローチは、ソースとターゲットのアーティファクトをドメイン固有の分類によって接続する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:08:02 GMT)
Investigation of coherence of niobium-based resonators enabled by a fast-sealing microwave cavity [2.2]
酸化物除去後5分以内に真空下に置くことができる高速シール型マイクロ波空洞を開発した。このような空洞に密封された装置は、単光子パワーで100万を超える内部品質因子を示す。高速シールマイクロ波空洞は,MA界面の損失を低減し,Nbデバイスにおける高コヒーレンスを維持するための実用的で一貫した手法を提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 23:07:47 GMT)
Incremental Residual Reinforcement Learning Toward Real-World Learning for Social Navigation [2.1]
ソーシャルナビゲーションは重要な課題として現れ、深層強化学習(RL)アプローチの研究を推進している。エージェントが物理的な環境で直接操作しながら学習する現実世界のRLは、この問題に対して有望な解決策を提供する。本研究では,基本方針に対する残差のみをトレーニングすることで学習効率を向上させるインクリメンタル残差RL(IRRL)を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:08:37 GMT)
Grounding Clinical AI Competency in Human Cognition Through the Clinical World Model and Skill-Mix Framework [2.0]
本稿では,三者間相互作用としてケアを形式化する臨床世界モデルを紹介する。我々は、提供者、患者、AIエージェントのための並列意思決定アーキテクチャを開発する。このフレームワークは、臨床AIをステークホルダー間で特定、評価、バウンドできる共通の文法を提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:20:13 GMT)
LPLCv2: An Expanded Dataset for Fine-Grained License Plate Legibility Classification [2.0]
低品質の撮像装置、圧縮アーティファクト、最適なカメラの設置など、大規模な実世界の利用は依然として困難である。本研究では,オリジナルのベンチマークを2日間のキャプチャで3倍以上に拡張し,アノテーションを改訂し,新しいラベルを導入する。本稿では,指数移動平均損失関数と改良された学習率スケジューラを備えた新しいトレーニング手法を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:07:36 GMT)
A unifying view of contrastive learning, importance sampling, and bridge sampling for energy-based models [1.9]
ノイズコントラスト推定(NCE)、逆ロジスティック回帰(RLR)、多重重要サンプリング(MIS)、橋梁サンプリングを接続する統合フレームワークを提供する。この統合された視点は、既存の手法間の関係を明確にし、新しい推定器の開発を可能にする。本研究は、その柔軟性と堅牢性の観点からNCEの成功を解明し、その性能をさらに改善できるシナリオを特定するのに役立つ。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:36:04 GMT)
Smartwatch-Based Sitting Time Estimation in Real-World Office Settings [1.8]
摂食行動は、肥満、心血管疾患、その他の慢性疾患と強く結びついており、公衆衛生上の大きなリスクをもたらす。本研究は,スマートウォッチの慣性測定ユニット(IMU)からの信号が,日々の作業中にオフィスワーカーから収集される,現実的なオフィス設定の問題に対処するものである。運動力学の新たな表現として,オイラー角から導かれる回転ベクトル列を導入して,IMU信号から着座時間を推定する手法を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:48:11 GMT)
Dual Quantum Geometric Tensors and Local Topological Invariant [1.8]
ゼーマン QGT は一般の非エルミート的であり、正規および異常な計量曲率セクターへの自然な分解を認めていることを示す。その結果、非エルミートゼーマン量子幾何学、局所ディラックノード位相、測定可能な輸送シグネチャを結合する統一的な枠組みが確立された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:00:50 GMT)
Quantum Vision Theory Applied to Audio Classification for Deepfake Speech Detection [1.8]
深層学習に基づく音声分類の新しい視点として量子ビジョン(QV)理論を提案する。量子物理学における粒子-波の双対性から着想を得たQV理論は、データは観測可能で崩壊した形だけでなく、情報波としても表現できるという考えに基づいている。 QV理論では、入力はまずQVブロックを使用して情報波に変換され、次に分類のためのディープラーニングモデルに入力される。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:22:40 GMT)
Co-design for Trustworthy AI: An Interpretable and Explainable Tool for Type 2 Diabetes Prediction Using Genomic Polygenic Risk Scores [1.7]
ポリジェニックリスクスコア(PRS)は、複雑な特徴や臨床疾患への遺伝的前置を定量化する重要な手法として登場した。しかし、PSSの現在の制限の一つは、解釈可能性ツールの欠如である。このユースケースは、学んだ倫理的、法的、技術的教訓の包括的セットから構成される。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:14:34 GMT)
DSCA: Dynamic Subspace Concept Alignment for Lifelong VLM Editing [1.7]
生涯の編集は難しい作業であり、これまで学んだ概念を乱す傾向がある。現在の手法では、知識を構造的に分離するのではなく、最適化によって編集をアルゴリズムで制御している。本稿では,この制限を緩和する動的部分空間概念アライメント(DSCA)を提案する。本手法は,1回の編集で98%,1000回の編集後に95%以上,幻覚を3～5%,連続的なチューニングチューニングベンチマークで最高の後方転送(BWT)スコアが得られた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:25:54 GMT)
SAGE: Sign-Adaptive Gradient for Memory-Efficient LLM Optimization [1.7]
我々はAdamWをハイブリッド構造に置き換えるSAGE(Sign Adaptive GradiEnt)を提案する。 SAGEは、Lionスタイルの更新方向と、新しいメモリ効率の$O(d)$アダプティブスケールを組み合わせる。最大1.3BパラメータのLlamaモデルでは、SAGEベースのハイブリッドは、新しい最先端のパープレキシティを実現し、すべてのベースラインを上回ります。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:07:38 GMT)
Tree-of-Evidence: Efficient "System 2" Search for Faithful Multimodal Grounding [1.6]
Inference-time search algorithm that frames interpretability as a individual optimization problem。 ToEは、粗いグループまたはデータの単位をスコアする軽量なEvidence Bottleneckを採用し、モデルの予測を再現するために必要なコンパクトなエビデンスを特定するためにビームサーチを実行する。スパースエビデンス予算の下では、ToEは他のアプローチよりも高い決定合意と低い確率忠実度誤差を達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:28:14 GMT)
An Eye for Trust: An Exploration of Developers' Trust Perceptions Through Urgency and Reputation [1.6]
この研究は、緊急性と評判が開発者のコードの信頼性に対する認識にどのように影響するかを考察する。コードパッチに割り当てられた優先度は,開発者のコードレビュー行動に大きく影響した。コードレビューの行動に顕著な変化があったにも関わらず、私たちの参加者は、コード変更のレビューと再利用に関する決定に対して、緊急性と評価の実質的な影響を、驚くほど見落としていました。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:05:27 GMT)
On-board Telemetry Monitoring in Autonomous Satellites: Challenges and Opportunities [1.6]
この研究は、軌道制御サブシステム内の故障検出、隔離、回復のためのeXplainable Artificial Intelligenceに対処する。ペプホールと呼ばれる中間的神経活性化から低次元,意味的アノテートエンコーディングを導出する手法を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:25:53 GMT)
Decoding coherent errors in toric codes on honeycomb and square lattices: duality to Majorana monitored dynamics and symmetry classes [1.6]
トリックや表面符号などのトポロジカル安定化符号は、フォールトトレラント量子計算の候補となっている。我々は,ハニカムおよび正方形格子上のトーリック符号のデオーダビリティを$X$-および$Z$型コヒーレント誤差で検討した。双対マヨラナ力学のアルトランド・ジルンバウアー対称性クラスが、陰性相図の普遍構造を支配していることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:00:00 GMT)
RAGE-XY: RADAR-Aided Longitudinal and Lateral Forces Estimation For Autonomous Race Cars [1.5]
本稿では,車速,タイヤスリップ角度,およびIMUやRADARなどの標準搭載センサのみを用いて車両に作用する力を同時に推定するリアルタイム推定フレームワークであるRAG-XYを提案する。提案手法は,EAV-24自律レースカー上で実施された高忠実度シミュレーションと実世界実験の両方を通して検証する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:59:35 GMT)
Geometry-Induced Long-Range Correlations in Recurrent Neural Network Quantum States [1.5]
自己回帰リカレントニューラルネットワーク(RNN)波動関数に基づくニューラル量子状態は、マルコフ連鎖の自己相関なしに効率的なサンプリングを可能にする。標準RNNアーキテクチャは有限長の相関に偏りがあり、長距離依存のある状態では失敗する可能性がある。本稿では、拡張されたRNN波動関数を導入し、リカレントユニットが拡張された接続を介して遠隔地にアクセスする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:00:04 GMT)
Multi-Agent Orchestration for High-Throughput Materials Screening on a Leadership-Class System [1.5]
大規模言語モデル(LLM)は、自律的な意思決定において重要な役割を果たす。我々は,高スループットスクリーニングキャンペーンを編成するスケーラブルで階層的なマルチエージェントフレームワークを提案する。提案するエージェントフレームワークは,Auroraスーパーコンピュータ上での効率的かつスケーラブルな実行を可能にする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:01:11 GMT)
Artifacts as Memory Beyond the Agent Boundary [1.4]
環境がエージェントのメモリとして機能することを示します。エージェントが空間的経路を観察すると,パフォーマンスポリシーを学習するのに要するメモリ量が減少することを示す。この課題に関するさらなる研究は、明示的な内部記憶の代用として環境を活用するための原則的な方法を明らかにすることを期待する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:39:59 GMT)
PriPG-RL: Privileged Planner-Guided Reinforcement Learning for Partially Observable Systems with Anytime-Feasible MPC [1.4]
計画エージェントが学習エージェントを誘導する部分観測可能なマルコフ決定過程(POMDP)を定式化する。本研究では,P2P-SAC(Planner-to-Policy Soft Actor-Critic)を提案する。 NVIDIA Isaac Labを使ってシミュレーションでアプローチを検証するとともに、現実のUnitree Go2で複雑な障害物の多い環境にデプロイすることに成功しました。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:41:11 GMT)
More Capable, Less Cooperative? When LLMs Fail At Zero-Cost Collaboration [1.4]
我々は、摩擦のない環境下での協調行動について研究し、協力から全ての戦略的複雑さを取り除く。私たちは、協力の失敗と能力の失敗を分離し、エージェント推論分析を通じてその起源を追跡します。この結果から,マルチエージェントシステムにおける協調問題の解決は,インテリジェンスのスケーリングだけでは不可能であることが示唆された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:24:27 GMT)
The Detection-Extraction Gap: Models Know the Answer Before They Can Say It [1.4]
部分的な接頭辞から解答が回復した後に連鎖トークンが生成されることを示す。早期接頭辞からの無料継続は、10%のトレースでも正しい回答を回復するが、強制抽出はこれらのケースの42%で失敗する。検出と抽出の両方に自由継続を利用するブラックボックス適応早期退避(BAEE)を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:43:28 GMT)
Selective Attention System (SAS): Device-Addressed Speech Detection for Real-Time On-Device Voice AI [1.4]
時間的曖昧な発話を伴うマルチ話者環境において、このタスクは発話局所分類タスクよりも、対話履歴よりも逐次ルーティング問題として効果的にモデル化されていることを示す。本稿では,これをSDAR(Sequential Device-Addressed Routing)として定式化し,この定式化をインスタンス化するデバイス上でのSelective Attention System(SAS)を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:11:15 GMT)
Sinkhorn doubly stochastic attention rank decay analysis [1.4]
Sinkhornアルゴリズムで正規化された2重の注意が、標準のSoftmax行確率よりも効果的にランクを保っていることを示す。シンクホーン正規化(英語版)を用いるとき、純粋自己アテンションランクの減衰の理論的境界を導出し、そのランクが深さと指数関数的に2つに崩壊することを発見する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:46:18 GMT)
LogAct: Enabling Agentic Reliability via Shared Logs [1.3]
我々はLogActと呼ばれる新しい抽象化を提案し、各エージェントは共有ログを再生するデコンストラクトステートマシンである。 LogActはエージェントのイントロスペクションを可能にし、エージェントはLSM推論を使用して自身の実行履歴を分析することができる。評価では、LogActエージェントは、障害から効率的に正確に回復し、自身のパフォーマンスをデバッグし、Swarm内でトークンの使用を最適化します。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:58:23 GMT)
Floquet Engineering of a Quasiequilibrium Superradiant Phase Transition in Landau Polaritons [1.3]
超ラジアント相転移(SRPTs)は、光子凝縮とマクロ物質分極によって特徴づけられる。直流磁場中におけるテラヘルツ空洞に結合した2次元電子ガスからなるランダウ偏光子系において、フロケ駆動によりこの制約を回避することができることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:06:42 GMT)
Object-Centric Stereo Ranging for Autonomous Driving: From Dense Disparity to Census-Based Template Matching [1.3]
従来の高密度ステレオマッチング法はピクセルごとの不均一マップを生成するが、高い計算コスト、ステレオカメラ間のラジオメトリック差への感度、不均一値が小さい長距離での精度の低下に悩まされている。本稿では,3つの相補的な深度推定手法を統合した総合ステレオ測位システムを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:51:42 GMT)
State and Trajectory Estimation of Tensegrity Robots via Factor Graphs and Chebyshev Polynomials [1.2]
テンセグリティロボットはコンプライアンスと適応性を提供するが、非線形で制約の少ないダイナミクスは、状態推定を困難にしている。本稿では,ケーブル駆動型引張ロボットのロバストな状態や軌道推定のための2段階のアプローチを提案する。オンライン状態推定には、RGB-Dカメラとオンボードケーブル長センサを融合するファクタグラフベースの手法を導入する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:38:47 GMT)
Sell More, Play Less: Benchmarking LLM Realistic Selling Skill [1.2]
SalesLLMベンチマークは、Financial ServicesとConsumer Goodsをカバーする現実的なアプリケーションから構築されている。 SalesLLMベンチマークのスコアは、専門家の人間格付けと強く相関している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:49:38 GMT)
Divide et impera: hybrid multinomial classifiers from quantum binary models [1.2]
1-vs-one、ワン-vs-rest、バイナリ決定ツリーといった戦略を採用して、ハイブリッドなアプローチを採用しています。決定木はコスト効率のよい解であり,クラス総数において最大対数的なオーバーヘッドを持つ他の手法と類似の精度を達成できることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:09:27 GMT)
FireSenseNet: A Dual-Branch CNN with Cross-Attentive Feature Interaction for Next-Day Wildfire Spread Prediction [1.1]
次回の山火事拡大の正確な予測は、災害対応と資源配分に不可欠である。本稿では,新しい相互干渉モジュールを備えた二分岐畳み込みニューラルネットワークFireSenseNetを提案する。我々は、FireSenseNetがF1の0.4176とAUC-PRの0.3435を達成し、すべての代替品を上回っていることを示した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:39:03 GMT)
Harnessing dark states: coherent control in coupled cavity-Rydberg-atom systems [1.1]
共役キャビティ-ライドバーグ-原子系における暗黒状態効果について検討した。我々の研究は、ダークステート物理学とキャビティ-ライドバーグ-原子プラットフォームにおける応用の道を開いた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:21:23 GMT)
ProMedical: Hierarchical Fine-Grained Criteria Modeling for Medical LLM Alignment via Explicit Injection [1.1]
本稿では,詳細な臨床基準に基づく統合アライメントフレームワークであるProMedicalを紹介する。最初にProMedical-Preference-50kを構築した。従来のスカラー報酬モデルとは異なり、我々のアプローチは安全制約を一般の熟練度から明確に切り離す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:57:33 GMT)
Frequency resolved optical gating using parametric amplification for characterizing ultrafast temporally multimode squeezed states [1.0]
超高速マルチモード圧縮状態の複雑な時間モード形状と2次分散を同時に再現するキャラクタリゼーション手法を提案する。このスキームは任意の時間モードの形状を計測し、大規模超高速ガウス量子状態を特徴づけるための実用的な実験的アプローチを提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:12:21 GMT)
Automatic Generation of Executable BPMN Models from Medical Guidelines [1.0]
我々は、医療政策文書を実行可能なデータ対応ビジネスプロセスモデルと表記(BPMN)モデルに変換するエンドツーエンドパイプラインを提示します。自動修正によるデータ基底BPMN生成、実行可能拡張、曖昧な計測、エントロピーに基づく不確実性検出の4つのコントリビューションで、自動ポリシのデジタル化の主な課題に対処する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:16:04 GMT)
CobbleDB: Modelling Levelled Storage by Composition [0.9]
本稿では, コンストラクション・データベース・バックアップ・ストアを構築するためのコンストラクション・ベース・アプローチを提案する。仕様保証ストアの等価性を活用してパフォーマンス特性を構築し、CobbleDBで実用的な価値を実証する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:08:07 GMT)
Blockchain and AI: Securing Intelligent Networks for the Future [0.9]
本稿では,再利用可能な3つのコントリビューションを通じて地域を合成する。この論文は、セキュアで透明でレジリエントなインテリジェントネットワークを設計する研究者や実践者の参考として意図されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:31:16 GMT)
CivBench: Progress-Based Evaluation for LLMs' Strategic Decision-Making in Civilization V [0.9]
マルチプレイヤーCivilization VにおけるLSMストラテジスト(エージェント設定)のベンチマークであるCivBenchを紹介する。 CivBenchはターンレベルゲーム状態のモデルをトレーニングし、プレイ全体を通して勝利確率を推定し、予測、構成、収束妥当性を通じて検証する。我々は,不飽和ベンチマークとして戦略能力を推定するCivBenchの可能性を実証し,エージェント設定のモデル固有の効果を明らかにするとともに,結果のみの評価では見えない異なる戦略プロファイルを概説する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:29:20 GMT)
Mathematical analysis of one-layer neural network with fixed biases, a new activation function and other observations [0.9]
我々は、ReLU活性化関数と固定バイアスを持つ単純な一層ニューラルネットワークを解析する。学習過程の収束を$L2$2$の2乗損失関数と勾配降下法で厳密に証明する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:58:51 GMT)
Preventing Overfitting in Deep Image Prior for Hyperspectral Image Denoising [0.8]
本稿では,DIPに基づくハイパースペクトル画像(HSI)において,頑健なデータ忠実度と明示的な感度正則化を併用することにより,過度適合を緩和する手法を提案する。ガウス,スパース,ノイズによって劣化した実HSIの実験結果から,提案手法が過度な適合を効果的に防止し,優れた騒音性能を実現することを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:02:34 GMT)
Bag of Bags: Adaptive Visual Vocabularies for Genizah Join Image Retrieval [0.8]
Bag of Bags (BoB) は、古典的なBag of Words (BoW) のグローバルレベルのビジュアルコードブックを、局所的なビジュアルワードの断片的な固有語彙に置き換えた画像レベルの表現である。パイプラインは、二項化フラグメントパッチ上でスパース畳み込みオートエンコーダをトレーニングし、各ページから接続されたコンポーネントをエンコードし、その結果の埋め込みをイメージあたり$k$-meansでクラスタ化し、セットを使用して画像を比較して、ローカル語彙間の距離を設定する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:55:34 GMT)
Evaluating the performance of a weak-field homodyne receiver in quadrature phase-shift keying optical communication [0.8]
量子通信プロトコルは、送信者と受信者の間の情報転送率を最大化するために効率的な検出スキームを必要とする。我々は、既に存在する受信機に対する有効な代替手段として、波状および粒子状の特徴を融合した弱電界受信機が考えられることを実証した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:32:51 GMT)
Dead Weights, Live Signals: Feedforward Graphs of Frozen Language Models [0.7]
本稿では,異種凍結型大規模言語モデルが計算ノードとして機能するフィードフォワードグラフアーキテクチャを提案する。約12Bの凍結に対する訓練可能なパラメータは17.6Mしかなく、ARC-Challengeでは87.3%、OpenBookQAでは82.8%、MMLUでは67.2%である。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:07:44 GMT)
Test-Oriented Programming: rethinking coding for the GenAI era [0.7]
大規模言語モデル(LLM)は、ソフトウェアコードを生成する驚くべき能力を示しており、プログラミングの開発者をサポートするために使われるようになった。 LLMは、テスト指向プログラミング(ToP)と呼ばれる新しいパラダイムである、より高いレベルの抽象化を可能にすることができる、と私たちは論じています。このパラダイム内では、開発者は本番コードではなく、自然言語仕様に基づいて生成されたテストコードのみをチェックする必要がある。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:21:28 GMT)
Training Data Size Sensitivity in Unsupervised Rhyme Recognition [0.7]
韻律は知覚的に直観的であり、歴史的に韻律であるかどうか、学者は韻律の分類に苦慮し、2つの単語が韻律であるかどうかに意見が一致しない。本稿では,RhymeTaggerを用いた信頼できない韻律認識に必要なトレーニングデータ量について検討する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:17:28 GMT)
Small-scale photonic Kolmogorov-Arnold networks using standard telecom nonlinear modules [0.6]
フォトニックニューラルネットワークは超高速な推論を約束するが、ほとんどのアーキテクチャは電子的非線形性を持つ線形光学メッシュに依存している。ここでは、標準電気通信コンポーネントで完全に実装された小規模フォトニックKolmogorov-Arnoldネットワーク(SSP-KAN)を紹介する。少数の光学モジュールからなるSSP-KANは、分類、回帰、画像認識タスク間で強い非線形推論性能を達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:34:58 GMT)
Tokalator: A Context Engineering Toolkit for Artificial Intelligence Coding Assistants [0.6]
Tokalatorは、リアルタイム予算監視を備えたVS Code拡張を含むオープンソースのコンテキストエンジニアリングツールキットである。このシステムは、3つのプロバイダ(Anthropic、OpenAI、Google)にわたる17のLarge Language Model(LLM)をサポートし、124のユニットテストによって検証されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:27:02 GMT)
TADP-RME: A Trust-Adaptive Differential Privacy Framework for Enhancing Reliability of Data-Driven Systems [0.6]
本稿では,TADP-RME(Trust-Adaptive Differential Privacy with Reverse Manifold Embedding)を提案する。プライバシーとユーティリティのトレードオフを改善し、攻撃の成功率を3.1%まで下げる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:32:57 GMT)
Multi-Label Phase Diagram Prediction in Complex Alloys via Physics-Informed Graph Attention Networks [0.6]
本稿では、要素認識表現を学習し、それらを熱力学的制約で結合する物理インフォームドグラフアテンションネットワーク(GAT)を提案する。ピカルファドで生成された約25,000の平衡状態を用いて、各組成温度点を原子分画と元素記述子をノード特徴とする4ノード要素グラフとして表す。このモデルは、グラフの注意、大域的なプーリング、および9つの関連するフェーズを予測する多層パーセプトロンを組み合わせる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:30:38 GMT)
Accurate and Reliable Uncertainty Estimates for Deterministic Predictions Extensions to Under and Overpredictions [0.6]
我々はACCurate and Reliable Uncertainty Estimate (ACCRUE)フレームワークを拡張し、入力依存の非ガウスの不確実性分布を学習する。提案手法は,入力依存の不確実性構造を捕捉し,既存手法と比較して確率的予測を改善する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:39:46 GMT)
Shortcut Learning in Glomerular AI: Adversarial Penalties Hurt, Entropy Helps [0.5]
Stainは、腎病理のAIにおける分布シフトと潜在的ショートカット学習の広範な源である。我々は、3つのセンタと4つの染色からなる365Isから9,674個の糸球体パッチ(224$times$224)をキュレートした。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:55:05 GMT)
Quantum-Inspired Geometric Classification with Correlation Group Structures and VQC Decision Modeling [0.5]
本稿では、相関群構造(CGR)、コンパクトなSWAPテストに基づく重複推定、選択的変分量子決定モデリングを統合した幾何駆動型量子インスピレーション型分類フレームワークを提案する。 CGRは特徴をアンカー中心の相関近傍に整理し、非線形で相関重み付き表現を生成する。 Credit Card Fraudデータセット(0.17%)では、Delta + VQCパイプラインが約0.85マイノリティリコールを約1.31%の警告レートで達成し、ROC-AUC 0.9249とPR-AUC 0.3251をフルデータセットで評価している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:13:06 GMT)
QARIMA: A Quantum Approach To Classical Time Series Analysis [0.5]
本稿では,量子支援型ラグ探索とEmphgressive variational quantum circuits(VQCs)を統合した量子インスピレーション型ARIMA法を提案する。 Dis Difference selection, (2) QACF, (3) QPACF, (4) swap-test primitives with delay-matrix construction, (5) VQC-AR, (6) VQC weak-lag refinement, (7) VQC-MA。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:11:39 GMT)
Deep Learning-Based Tracking and Lineage Reconstruction of Ligament Breakup [0.5]
本稿では,物体検出と時間関係モデリングのための2段階のディープラーニングフレームワークを提案する。この枠組みは, 液シート崩壊時の靭帯変形, 断片化, 親子系統を捕捉する。 86.1%の精度、93.2%の精度、そして断片化イベントに対する完全なリコール(1.00)を達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:04:37 GMT)
Complexity phase transition for continuous-variable cluster state [0.5]
連続可変(CV)クラスタ状態は、大規模測定ベースの量子計算のための有望なプラットフォームを提供する。このような状態で実装された計測ベース線形光学(MBLO)の古典的複雑性を解析する。古典的かつ難解なレシエーションを規定するスクイーズレベルしきい値を特定します。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:57:17 GMT)
PoC-Adapt: Semantic-Aware Automated Vulnerability Reproduction with LLM Multi-Agents and Reinforcement Learning-Driven Adaptive Policy [0.5]
自動PoC生成と検証のためのエンドツーエンドフレームワークであるPoC-Adaptを提案する。 PoC-Adaptは、基本的なセマンティックランタイムバリデーションとアダプティブポリシー学習に基づいて設計されている。実験によると、PoC-Adaptは信頼性を25%向上し、エクスプロイト生成コストを低減している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:37:23 GMT)
The Defense Trilemma: Why Prompt Injection Defense Wrappers Fail? [0.5]
モデルがそれを見る前に入力を前処理する$D: Xto X$は、接続されたプロンプト空間を持つ言語モデルに対して、すべての出力を厳格に安全にする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:46:14 GMT)
A Model Context Protocol Server for Quantum Execution in Hybrid Quantum-HPC Environments [0.5]
量子アルゴリズムの実行には、コードを生成し、複雑な計算資源を管理する必要がある。本稿では,モデルコンテキストプロトコルサーバの実装を通じて,この実行ギャップを埋めるように設計されたAI駆動フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:50:56 GMT)
Scalable Neural Decoders for Practical Fault-Tolerant Quantum Computation [0.4]
本稿ではQEC符号の幾何構造を利用した畳み込みニューラルネットワークデコーダを提案する。大規模なフォールトトレラントアルゴリズムに要求される論理的エラー率は、最小限のコードサイズで達成可能であることを示す。その結果、フォールトトレラント量子計算に伴う時空間コストは、これまで予想されていたよりも大幅に低くなる可能性が示唆された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:21:41 GMT)
High-dimensional inference for the $γ$-ray sky with differentiable programming [0.4]
我々は、宇宙物理学的な$$$-ray分析に固有の大きなモデル空間を考慮に入れるために、微分可能確率的プログラミング技術の使用を動機付けている。我々の設定は、変分法を用いて、大きなモデル空間上の効率的な推論を可能にします。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:00:00 GMT)
Multi-Frequency Local Plasticity for Visual Representation Learning [0.4]
本研究では,視覚認識におけるエンドツーエンドの勾配に基づく表現学習の欠如を補う構造的アーキテクチャバイアスについて検討する。 i) 固定多周波ガボルのF=7並列ストリームへの分解, (ii) ヘビアンとオジャの更新と反ヘビアンデコリレーションによるストリーム内競合学習, (iii) 現代のホプフィールド検索にインスパイアされた連想メモリモジュール。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:30:47 GMT)
Introducing Echo Networks for Computational Neuroevolution [0.3]
本稿では,接続行列のみで構成されるリカレントネットワークであるEcho Networksを紹介する。層はなく、ニューロン間の接続は双方向でもよいが、技術的には全て再帰的である。心電図信号の分類において,Echo Networksの評価に成功している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:06:25 GMT)
Towards Rapid Constitutive Model Discovery from Multi-Modal Data: Physics Augmented Finite Element Model Updating (paFEMU) [0.3]
本稿では,AIを用いたモデリング,解釈可能なモデル発見のためのスペーサー化,有限要素ベース拡張を組み合わせた移動学習手法として,物理拡張有限要素モデル更新(paFEMU)を導入する。これは、デジタル画像相関型フルフィールドデータ取得と、おそらく別の材料から得られる単純な機械的テストデータを組み合わせることで達成される。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:08:07 GMT)
Orthogonalised Self-Guided Quantum Tomography: Insights from Single-Pixel Imaging [0.3]
我々は、自己誘導型量子トモグラフィ(SGQT)の線形アナログとして、自己誘導型イメージング(SGI)の概念を導入する。 SGIは1画素画像(SPI)と数学的に等価であることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:10:47 GMT)
RS-OVC: Open-Vocabulary Counting for Remote-Sensing Data [0.3]
リモートセンシングと空中画像のための最初のオープン語彙カウント(OVC)モデルであるRS-OVCを提案する。また,本モデルでは,テキストや視覚条件のみに基づいて,トレーニング中に見つからなかった新しいオブジェクトクラスの正確なカウントを行うことができることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:52:33 GMT)
Memory Wall is not gone: A Critical Outlook on Memory Architecture in Digital Neuromorphic Computing [0.3]
記憶機構の再評価がなければ、デジタルニューロモルフィックプロセッサはエッジや組み込みアプリケーションで効果的に競合するのに苦労するかもしれない、と我々は主張する。ニューロモルフィックシステムにおけるオンチップメモリの限界を克服するための今後の研究の道筋として,我々は結論付けている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:23:48 GMT)
The Cartesian Cut in Agentic AI [0.3]
中心的な設計レバーは、制御がこれらのシステムに存在する場所である、と我々は主張する。脳は、アクションの結果によって調整された階層化されたフィードバックコントローラ内に予測を埋め込む。我々は、自律性、堅牢性、監視のトレードオフを制御するための対照的なアプローチとして、有界サービス、カルテ人エージェント、統合エージェントを概説した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:03:06 GMT)
Generative optimal transport via forward-backward HJB matching [0.2]
乱れた参照状態から構造化された目標アンサンブルへの多体系の進化を制御することは、非平衡統計力学と制御において自然に起こる。本稿では,経路空間自由エネルギー,リスク感応制御,空間コスト幾何学の観点から,物理的に解釈可能な輸送記述を提供する枠組みを提案する。我々の結果は、最適制御、シュルディンガー橋理論、非平衡統計力学の統一的な接続を確立する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:31:25 GMT)
STaR-DRO: Stateful Tsallis Reweighting for Group-Robust Structured Prediction [0.2]
制御可能な推論と堅牢な微調整のための2部フレームワークを提案する。まず、フォーマットのドリフト、ラベルの曖昧さ、エビデンス幻覚、メタデータ条件の混乱に対処するためのタスクに依存しないプロンプト戦略を導入する。第2に,グループ不均一性のステートフルなロバスト最適化手法STaR-DROを導入する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:58:42 GMT)
An Agentic Evaluation Architecture for Historical Bias Detection in Educational Textbooks [0.2]
歴史教科書には、しばしば暗黙の偏見、ナショナリストのフレーミング、大規模な監査が難しい選択的な省略が含まれている。本稿では,マルチモーダルスクリーニングエージェント,5つの評価エージェントからなる異種陪審,および評価合成と人間のエスカレーションのためのメタエージェントからなるエージェント評価アーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:51:32 GMT)
Classical and Quantum Dynamics in an Information Theoretic Space [0.2]
ベルヌーイ確率変数に対応する情報幾何学空間における古典的および量子力学について検討する。我々は、バネ質量系の情報理論アナログを研究するゲールとグリフィンの研究を拡張した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:09:36 GMT)
Adversarial Sensor Errors for Safe and Robust Wind Turbine Fleet Control [0.1]
プラントレベルの制御は、チャンスと挑戦を示す新しい風力エネルギー技術である。測定エラーがプロセスに干渉するリスクや、中央コントローラから受信したテレメトリ信号をハッカーが変更するリスクがある。本報告では, 環境に配慮した対向エージェントを用いて, 安全なプラント制御装置を開発するための枠組みについて述べる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:26:31 GMT)
How Much LLM Does a Self-Revising Agent Actually Need? [0.1]
我々は,エージェントの状態,信頼信号,保護された動作,仮説的遷移を検査可能なランタイム構造に外部化する,宣言された反射型ランタイムプロトコルを導入する。 54ゲームで4つの段階的に構造化されたエージェントを用いて,ノイズの多い協調戦闘艦上での評価を行った。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:07:15 GMT)
Every Little Thing Heat Does Is Magic [0.1]
エネルギーと熱測定のみに依存する2つの熱力学的な証人を紹介します。我々は熱アンシラとの熱交換に基づく非線形証人を開発する。いくつかの例を通して,本手法の有効性を実証する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:00:04 GMT)
AtlasOCR: Building the First Open-Source Darija OCR Model with Vision Language Models [0.1]
モロッコのアラビア方言であるダリヤは視覚コンテンツに富んでいるが、特殊な光学文字認識(OCR)ツールが欠けている。本稿では,3Bパラメータビジョン言語モデル(VLM)を微調整して構築した,最初のオープンソースDarija OCRモデルであるAtlasOCRを紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:38:23 GMT)
Robust Multi-Objective Optimization for Bicycle Rebalancing in Shared Mobility Systems [0.1]
ドックベースの自転車シェアリングシステムは、自転車の供給とユーザー需要の空間的不均衡を示す。本研究は、三目的最適化問題としてモデル化された需要不確実性の下での静的な一晩的再バランスについて研究する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:30:59 GMT)
Beyond Social Pressure: Benchmarking Epistemic Attack in Large Language Models [0.1]
テクテテプステミック・アタックの評価のための診断ベンチマークを開発した。知識、価値、アイデンティティの正当性に対して、単に前の答えに反対するのではなく、挑戦する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:14:30 GMT)
AgriChain Visually Grounded Expert Verified Reasoning for Interpretable Agricultural Vision Language Models [0.1]
我々はAgriChainを紹介した。AgriChainは、多種多様な作物と病理にまたがる約11,000の専門家による葉のイメージのデータセットである。我々は、AgriChainにQwen2.5-VL-3Bを微調整し、AgriChain-VL3Bと呼ばれる特殊なモデルを作成し、病気を共同で予測し、視覚的に座屈した推論を生成する。 1000イメージのテストセットでは、CoTが監督するモデルが73.1%のTop-1精度(macro F1 = 0.466; weighted F1 = 0.655)を達成し、Gemini 1.5 Flash、Gemini 2.5 Pro、GPT-4o Miniなどの強力なベースラインを上回りました。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:13:37 GMT)
Ensembles at Any Cost? Accuracy-Energy Trade-offs in Recommender Systems [0.1]
本稿では,強い単一モデルに対するアンサンブル手法のエネルギートレードオフを精度良く測定する。 10万から780万のインタラクションの4つのデータセットを評価します。セッティング全体では、アンサンブルの精度は0.3%から5.7%向上し、エネルギーは19%増の2,549%向上した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:33:19 GMT)
Asynchronous Quantum Distributed Computing: Causality, Snapshots, and Global Operations [0.1]
我々は、量子システムのコンポーネントに原子量子大域演算を実装する場合に焦点を当てる。量子分散アルゴリズムを設計し,これをQGOアルゴリズムと呼ぶ。その他のコントリビューションには、量子分散コンピューティングの形式モデルと、グローバルなオペレーションの望ましい振る舞いに関する正式な仕様が含まれています。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:31:50 GMT)
Quantum Thermal Field Effect Transistor [0.0]
我々は、左量子ビット、中量子ビット、右量子ビットサブシステムからなる量子熱電界効果トランジスタ(qtFET)を提案し、解析する。以上の結果から,qtFETは熱電流を正確に変調することができ,量子熱デバイスや増幅器の基本的なビルディングブロックとしての可能性を強調した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:02:34 GMT)
sciwrite-lint: Verification Infrastructure for the Age of Science Vibe-Writing [0.0]
現在、科学は品質保証に2つの選択肢を提供しているが、どちらも不十分である。論文自体を測る第3の選択肢を提案する。 sciwrite-lintは、研究者のマシンで完全に動作する科学写本のためのオープンソースライブラリである。 arXivとbioRxivの未確認論文30件について, 誤り注入とLCM適応偽陽性解析を用いてパイプラインの評価を行った。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:46:44 GMT)
eBandit: Kernel-Driven Reinforcement Learning for Adaptive Video Streaming [0.0]
eBanditは、ネットワーク監視とABRアルゴリズムの選択の両方をLinuxカーネルに再配置するフレームワークである。軽量なepsilon-greedy Multi-Armed Bandit (MAB) はソックスプログラム内で動作し、ライブTCPメトリクスから得られる報酬に対して3つのABRを評価する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:02:04 GMT)
Why Network Segmentation Projects Fail [0.0]
ネットワークセグメンテーションは、基本的なエンタープライズセキュリティコントロールである。その利益が認められているにもかかわらず、セグメンテーションイニシアチブは実際は失敗することが多い。本稿では,400人の米国拠点ネットワークセキュリティ実践者の調査をもとに,失敗したセグメンテーションプロジェクトに関する実証的研究を行った。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:00:23 GMT)
We Need Strong Preconditions For Using Simulations In Policy [0.0]
個人または集団レベルの人間の行動の正確なモデルの二重利用可能性と、シミュレーション出力を検証するのが困難である。社会規模LLMエージェントシミュレーションの3つの前提条件を提案し,議論する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:39:35 GMT)
VOLTA: The Surprising Ineffectiveness of Auxiliary Losses for Calibrated Deep Learning [0.0]
不確実性定量化(UQ)は、ディープラーニングモデルを安全クリティカルなアプリケーションにデプロイするために不可欠である。異なるデータモダリティや分散シフトに対して、UQ法が最善を尽くすコンセンサスはない。本稿では,MC Dropout, SWAG, アンサンブル法, 温度スケーリング, エネルギーベースOOD, マハラノビス, 双曲型分類器, ENN, Taylor Sensus, スプリット共形予測を含む10種類のUQベースラインのベンチマークを示す。以上の結果から,VOLTAはより複雑なUQアプローチに代わる,軽量で決定論的かつ十分に校正された代替手段として確立された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:22:36 GMT)
VCAO: Verifier-Centered Agentic Orchestration for Strategic OS Vulnerability Discovery [0.0]
ベイジアン・スタックルバーグ検索ゲームとしてのオペレーティングシステム脆弱性発見の定式化 textscVCAO (textbfVerifier-textbfC enter textbfAgentic textbfOrchestration), 表面マッピング, カーネル内攻撃グラフ構築, ゲーム理論ファイル/機能ランキング, 並列実行エージェント, カスケード検証, 安全管理者を含む6層アーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:27:10 GMT)
Tunable information insulation induced by constraint mismatch [0.0]
双対制約を持つ2つのD$PXP$チェーンの合成モデルについて検討する。複数の凍ったジャンクションがヒルベルト空間を破砕し、不連結なクリロフの破片となった。機械的に保護されたゼロエネルギーモードは、物理的端とジャンクション部位の近くのバルクに局所的なピークを持つことができる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:03:54 GMT)
Training Transformers in Cosine Coefficient Space [0.0]
キャラクターレベルのシェイクスピアのスクラッチから訓練されたトランスフォーマーは、検証損失が1.604$で$K = mn/2$に達した。同じトレーニング可能なパラメータ数でのランク48のLoRA分解は、わずか1.801$である。ランダムな正規直交基底はノイズ中のDCTを$K = mn/2$で一致させ、$K = mn/10$と$K = mn/20$で圧縮すると、高階行列をホストできる部分空間が損失を低く保つことを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:32:05 GMT)
Towards Generalizable Representations of Mathematical Strategies [0.0]
代数的解経路全体の問題不変表現を学習するための新しい手法を提案する。我々はまず,高容量事前学習モデルで符号化された連続代数状態間のベクトル差を計算し,遷移埋め込みを構築する。シーケンスレベルの埋め込みは、SimCSEを通じて学習され、対照的な目的を用いて、埋め込み空間に近接する意味論的に類似した解経路を配置する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:26:13 GMT)
Towards Counterfactual Explanation and Assertion Inference for CPS Debugging [0.0]
本稿では,サイバー物理システムのための実証的説明とアサーションに基づくキャラクタリゼーションフレームワークであるDeCaFを紹介する。テスト入力がフェールすると、DeCaFは入力信号の反ファクト変化を生成し、テストが通過しないよう変換する。提案手法は,3つの反事実生成器と2つの因果モデルを組み合わせて,成功の主張を推測する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:53:00 GMT)
Tomiyama-type maps with a diagonal perturbation [0.0]
古典的富山写像の対角摂動として構築された行列代数上の線型写像の族について検討する。任意の次元にまたがる陽性、完全陽性、およびk-陽性について、明確な必要十分条件を導出する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:30:32 GMT)
Time evolution of impurity models and their universality for quantum computation [0.0]
不純物ハミルトニアン (Imurity Hamiltonian) は、$N$フェルミオンモードの系であり、そのうちの$O(1)$はクォート(あるいは高次)フェルミオン項を介して相互作用する。 O(N)$ qubits 上の一般時間独立不純物ハミルトニアンの時間発展は、入力状態が任意の単一粒子基底におけるフェルミオンの積状態であれば、$N$ qubits 上で普遍的であることを証明している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:01:59 GMT)
Thermal Time and Irreversibility from Non-Commuting Observables in Accelerated Quantum Systems [0.0]
状態がKubo--Martin-Schwinger(KMS)条件と非可換可観測物を通して検出されたカップルを満たすと、識別可能性が生じることを示す。ミンコフスキー真空中の量子場と相互作用する2レベル検出器を均一に加速する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:17:39 GMT)
The final version of a recent approach towards quantum foundation [0.0]
いくつかの論文において、この著者は命題の集合に基づく量子基盤への代替アプローチを提唱している。本項では、この基礎をかなり単純化することができる。結果として生じる理論は純粋に数学的理論であるが、変数を物理的変数にすることでクァナンタム力学に繋がる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:03:58 GMT)
The ecosystem of machine learning competitions: Platforms, participants, and their impact on AI development [0.0]
機械学習コンペティション(MLC)は、人工知能(AI)の進歩において重要な役割を果たすこの研究は、KaggleやZindiといった主要な競合プラットフォームを包括的に分析する。研究の優先順位を定め、業界標準を通知し、クラウドソースによる大規模な問題解決を可能にすることで、これらの競争はAIの継続的な進化において重要な役割を果たす。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:06:15 GMT)
The Unreasonable Effectiveness of Data for Recommender Systems [0.0]
推奨システムでは、大規模なインタラクションデータの収集、保存、処理は、時間、エネルギー、計算の面でますますコストがかかる。本稿では,トレーニングデータセットのサイズが大きくなるにつれて,オフラインレコメンデーションのパフォーマンスが向上するかを検討する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:13:03 GMT)
The Statistical Profitability of Social Media Sports Betting Influencers: Evidence from the Nigerian Market [0.0]
本研究は、ナイジェリアの人気のあるスポーツベットインフルエンサーをソーシャルメディアにフォローすることが、経済的に健全な戦略であるかどうかを検討する。われわれは、X(元Twitter)とTelegramの3つの有名なチップスから5,467個のプレマッチベッティングスリップを追跡した。その結果、これらのインフルエンサーがオンラインに表示する富と実際の財務成果との間には、顕著なコントラストが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:41:41 GMT)
The Condition-Number Principle for Prototype Clustering [0.0]
プロトタイプクラスタリングにおける客観的な精度と構造的回復を結びつける幾何学的枠組みを開発する。クラスタ内スケールとクラスタ境界を越えてポイントを移動させるために必要な最小損失増加を比較するクラスタリング条件数を定義します。クラスター境界付近でエラーが集中し, 十分に深いクラスタコアが, 局所的に強化されたマージンの下で正確に回収されることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:03:01 GMT)
The Computational Boundary of Inference: Capability Internalization, Training, and the Turing Jump [0.0]
本稿では古典計算可能性理論において形式的な分離結果を与える。有限内部自己修正が$mathcalC(A)$内に留まることを証明し、一方安定化されたリビジョンは相対化極限補題によるジャンプ$A'$によって支配される。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:56:56 GMT)
The Accountability Horizon: An Impossibility Theorem for Governing Human-Agent Collectives [0.0]
AIシステム、法的、倫理的、規制に関する既存の説明責任フレームワークは、共有された前提に基づいている。本稿では,エージェントAIシステムが計算可能なしきい値を超えた数学的必要条件として,この仮定に違反していることを証明する。我々は,エージェントを国家政治としてモデル化する共同AIシステムの形式化であるHuman-Agent Collectivesを紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:08:26 GMT)
Tensor-based computation of the Koopman generator via operator logarithm [0.0]
低ランクテンソルトレイン(TT)フォーマットでKoopmanジェネレータを演算するデータ駆動手法を提案する。 4次元ロトカ・ボルテラ系と10次元ロレンツ-96系の実験は、ベクトル場係数の正確な回復と高次元系への拡張性を示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:15:03 GMT)
Tensor-Augmented Convolutional Neural Networks: Enhancing Expressivity with Generic Tensor Kernels [0.0]
畳み込みニューラルネットワーク(CNN)は、局所的な特徴を階層的に抽出することに優れていますが、複雑な相関を捉えたパフォーマンスは、深いアーキテクチャに大きく依存しています。テンソル付加CNN(TACNN)を用いた物理誘導浅部モデルを提案する。我々の設計では、各層の畳み込み出力は高次特徴相関を捉えることができる多線形形式となる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:44:23 GMT)
T-Gated Adapter: A Lightweight Temporal Adapter for Vision-Language Medical Segmentation [0.0]
医用画像のセグメンテーションは伝統的に完全に監督された3Dアーキテクチャに依存している。本稿では,隣接スライスコンテキストを直接モデルの視覚的トークン表現に注入することで,この問題に対処する時間的アダプタを提案する。腹部13臓器の平均Diceは0.704で, 時間的文脈を伴わないベースラインVLMでは+0.206であった。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:27:50 GMT)
Systematic API Testing Through Model Checking and Executable Contracts [0.0]
モデルチェックを活用することで,APIテストの体系的な状態空間カバレッジを実現するフレームワークであるIcePickを紹介した。 IcePickはTLA+を使用して、API状態の進化を正式にモデル化し、TLCモデルチェッカーを使用して、到達可能な状態を徹底的に探索し、振る舞いモデルを確実にカバーするテストシーケンスを生成する。 HTTPステータスコード以外のオラクル制限に対処するために、API仕様を実行可能なセマンティックコントラクトで強化する一階述語論理コントラクト言語であるGlacierを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:00:42 GMT)
StructRL: Recovering Dynamic Programming Structure from Learning Dynamics in Distributional Reinforcement Learning [0.0]
動的プログラミング手法は構造化された情報伝達に依存し、効率的で安定した学習を可能にする。本稿では,分布強化学習の学習力学から,そのような構造を復元できることを示す。本稿では,これらの信号を利用したStructRLを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:21:20 GMT)
State Space Models are Effective Sign Language Learners: Exploiting Phonological Compositionality for Vocabulary-Scale Recognition [0.0]
我々は、PHONSSMを導入し、解剖学的に座屈したグラフの注意による音韻的分解、部分空間への明示的な分解、少数ショット転送を可能にする分類を導入した。 PHONSSMは史上最大のASLデータセット(5,565の符号)の骨格データのみを使用して、WLASL2000(+18.4pp over skeleton SOTA)で72.1%を獲得し、ビデオ入力なしでほとんどのRGBメソッドを超える。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:50:52 GMT)
Spectral-Transport Stability and Benign Overfitting in Interpolating Learning [0.0]
統計的学習の補間体制における一般化のための理論的枠組みを開発する。我々は、有限サンプルリスク境界を証明し、鋭い良性オーバーフィッティング指数を確立し、スペクトル崩壊下での明示的な位相遷移速度を導出する。このフレームワークはまた、最小スペクトル輸送エネルギーの補間解をどのように選択できるかを示すことによって暗黙の正則化を明確化する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:19:00 GMT)
Sensitivity-Positional Co-Localization in GQA Transformers [0.0]
グループクエリアテンション変換器における基本構造問題について検討する。タスクの正確性に最も敏感なレイヤは、位置エンコーディング適応が最大のレバレッジを持つレイヤと一致しているか? LSLORAは,新しい正当性差分隠れ状態メートル法により同定された層へのLoRA適応を制限し,GARFAは対象層に8個の学習可能なKVヘッドスカラー乗算器を付加する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 03:41:33 GMT)
Security and Privacy in Virtual and Robotic Assistive Systems: A Comparative Framework [0.0]
2つの主要なカテゴリーは、仮想補助システムと物理的環境で動作するロボット補助システムである。仮想システムは、データプライバシ、不正アクセス、敵の声操作を含む脅威にさらされている。ロボットシステムは、センサー・スプーフィング、知覚操作、コマンド・インジェクション、身体的安全の危険など、追加のサイバー物理的リスクを導入している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:16:34 GMT)
Scrapyard AI [0.0]
それは、より強力なAIシステムに対する断続的な推進が、その結果として、時代遅れでパワフルなAIモデルの集合を残していることを説明している。このスクラップヤードは、AIシステムへのリソース制約のある実験のための強力な機会を提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 22:38:57 GMT)
Realisation-Level Privacy Filtering [0.0]
データリリースの停止時間を決定するために,実現レベルフィルタリング手法を提案する。フィルタは$(, )$-differential privacyを保証し、データハンドラが選択した$と$を保証します。提案フィルタは、Rényi差分プライバシーの下でひどく振る舞うものを含む任意のメカニズムに適用できる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:31:38 GMT)
RansomTrack: A Hybrid Behavioral Analysis Framework for Ransomware Detection [0.0]
RansomTrackはリアルタイムランサムウェア検出のためのハイブリッドな振る舞い分析フレームワークである。 165種類のランサムウェアと良質なソフトウェアファミリーのデータセットが公開されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:05:59 GMT)
Rag Performance Prediction for Question Answering [0.0]
アドホック検索のために考案された検索前および検索後予測器の性能について検討した。また, ポストジェネレーション予測器についても検討し, そのうちの1つが新規であり, 最高の予測品質を示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:55:38 GMT)
Qurator: Scheduling Hybrid Quantum-Classical Workflows Across Heterogeneous Cloud Providers [0.0]
アーキテクチャに依存しない量子古典的タスクスケジューラであるQuratorを、異種プロバイダ間の待ち時間と回路忠実度を共同で最適化する。ミュンヘン量子ツールキットベンチマークスイートの回路を用いて,4ヶ月の実際のキューデータによって駆動されるシミュレータ上でQuratorを評価する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:03:45 GMT)
Quantum Simulation of Hyperbolic Equations and the Nonexistence of a Dirac Path Measure [0.0]
我々は、ミンコフスキー空間におけるディラック方程式の古典的な経路積分表現に対応する、よく定義された確率測度が存在しない理由の長年の問題を再考する。本稿では,これらの視点を,測度論的な視点から1つの数学的障害の異なる表現として統一する方法について述べる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:59:17 GMT)
Quantum Patches: Enhancing Robustness of Quantum Machine Learning Models [0.0]
自律運転システムのような機械学習モデルとその応用は、ますます一般的になりつつある。摂動雑音に対する感度のため、これらのモデルは敵の攻撃を受けやすい。最近登場したソリューションの1つは、量子回路のユニークな特性を活用して量子ベースの擬似ノイズを生成することである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 23:57:28 GMT)
Quantization Impact on the Accuracy and Communication Efficiency Trade-off in Federated Learning for Aerospace Predictive Maintenance [0.0]
フェデレートラーニング(FL)は、分散航空宇宙艦隊間のプライバシ保護による予測メンテナンスを可能にする。本稿では,対称均一量子化がカスタム設計軽量畳み込みモデルの精度-効率トレードオフに与える影響について検討する。 Int4はFD001とFD002でFP32と区別できない精度を実現する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:13:15 GMT)
Proximity Gaps Conjecture Fails Near Capacity over Prime Fields [0.0]
このレポートでは、Krachun氏とKazanin氏によるスケッチを具体化して、Reed-Solomon符号の特定のファミリーでは、近接ギャップが、コード容量率以下でO(1/log n)$のラジイで失敗することを証明する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:47:44 GMT)
PrivFedTalk: Privacy-Aware Federated Diffusion with Identity-Stable Adapters for Personalized Talking-Head Generation [0.0]
PrivFedTalkは、パーソナライズされたトーキングヘッド生成のためのプライバシ対応のフェデレーションフレームワークである。共有拡散バックボーンはクライアント間でトレーニングされ、各クライアントはローカルのプライベートオーディオビジュアルデータから軽量なLoRAIDアダプタを学習する。更新側のプライバシーリスクを制限するために、セキュアアグリゲーションとクライアントレベルの差分プライバシがアダプタ更新に適用される。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:41:30 GMT)
Photon pairs, squeezed light and the quantum wave mixing effect in a cascaded qubit system [0.0]
2つの超伝導量子ビットのカスケード導波路-QED系における量子波混合(QWM)の理論記述を開発する。 QWMプロセスにおける相関光子対の関与をあいまいに確認するために, 放射減衰率の異なる全カスケード2量子ビットモデルの数値シミュレーションを行った。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:56:19 GMT)
Per-Shot Evaluation of QAOA on Max-Cut: A Black-Box Implementation Comparison with Goemans-Williamson [0.0]
The Quantum Approximate Optimization Algorithm (QAOA) on the Max-Cut problem。多くの先行研究とは異なり、本手法はQAOAの実装をブラックボックスとして扱う。分析の中心的なコンポーネントは、QAOA出力の品質を追跡するショットごとの統計フレームワークである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:33:37 GMT)
Parameterized Complexity Of Representing Models Of MSO Formulas [0.0]
モナディック二階述語論理(MSO2)は、クールセルの定理によるパラメータ化複雑性において重要な役割を果たす。自由変数を持つ MSO2 公式のモデルは、上記のパラメータでパラメータ化線形である決定図で表せることを示す。特に,木幅を考慮した場合の逐次決定図(SDD)サイズに対するパラメータ化線形上界と,パラメータのパス幅を考慮した場合の順序付き二分決定図(OBDD)サイズに対するパラメータ化線形上界を示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:56:50 GMT)
Parameter-free non-ergodic extragradient algorithms for solving monotone variational inequalities [0.0]
拘束単調なVIsに対する非漸近的最終定位保証を用いたパラメータフリーの指数分解法を開発した。このフレームワークをバックトラックラインサーチによりローカルリプシッツ演算子に拡張し,パラメータ自由性を保ちながら同じレートを得る。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 00:02:30 GMT)
PI-JEPA: Label-Free Surrogate Pretraining for Coupled Multiphysics Simulation via Operator-Split Latent Prediction [0.0]
完備したPDE解決を伴わずに訓練を行う補助的事前学習フレームワークである textbfPI-JEPA (Physics-Informed Joint Embedding Predictive Architecture) を導入する。単相Darcyフローでは、PI-JEPAはFNOよりも1.9times$低いエラーと2.4times$低いエラーをDeepONetより$N_ell=100$で達成し、N_ell=500$で教師のみのトレーニングよりも24%改善した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:00:04 GMT)
Multivariate quantum reservoir computing with discrete and continuous variable systems [0.0]
量子貯水池計算は時間データの処理に有望なパラダイムである。量子貯水池計算における多変量データ処理のための広範な枠組みを確立する。その結果,最適な符号化法は貯水池システムと特定のタスクに大きく依存していることが判明した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:32:09 GMT)
MIPT-SSM: Scaling Language Models with $O(1)$ Inference Cache via Phase Transitions [0.0]
計測誘起相転移の物理に基づくニューラルネットワークアーキテクチャMIPT-SSMを提案する。このモデルは臨界シーケンス長$N*approx1024$で相転移を示すと予測され、情報密度比$N/D$はユニティに交差する。 AGニュース(4クラス分類)では、MIPT は Transformer の 0.736 (+16.6%) に対して0.905 の精度を達成し、3つの種で安定している。無制限のキャッシュ容量では、$p_t$ゲートは、単一のクリティカルトークンのみを自律的に格納することを学ぶ。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:00:30 GMT)
Loom: A Scalable Analytical Neural Computer Architecture [0.0]
ループ変換器内でCからコンパイルされたプログラムを実行するコンピュータアーキテクチャであるLoomを提案する。各フォワードパスは1つの命令を実行し、プログラムカウンタがゼロになるまでモデルを反復的に適用する。フルマシン状態は、mathbbRd の 1 つのテンソル $X の n$ の固定サイズに存在する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 23:11:28 GMT)
Long-Term Embeddings for Balanced Personalization [0.0]
LTE(Long-Term Embeddings)は、高慣性文脈アンカーである。 LTEは、コンテンツベースのアイテム表現の固定されたセマンティックベースへの埋め込みを制約する。 ZalandoのオンラインA/Bテストでは、LTEをコンテキストプレフィックストークンとして統合することは、ユーザのエンゲージメントと財務メトリクスに大きな上昇をもたらすことが示されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:36:29 GMT)
Local Marking of Locally Implementable Unitary Operations [0.0]
局所的に実装可能なユニタリ演算における局所的マーキングの課題について検討する。局所的区別性は局所的マーキングを意味するが、局所的マーキングは局所的またはグローバルなユニタリの区別性を保証するものではない。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:03:51 GMT)
Leading low-temperature correction to the Heisenberg-Euler Lagrangian [0.0]
2つのループで生じる定電磁場におけるハイゼンベルク・オイラー・ラグランジアンを効率的に抽出することができる。我々は平衡場の量子論のリアルタイムな定式化に頼っている。 1粒子還元型タドポール構造により2つのループで低温の寄与を施す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:04:51 GMT)
LINE: LLM-based Iterative Neuron Explanations for Vision Models [0.0]
我々は、オープン語彙の概念を視覚モデルにラベル付けするためのトレーニング不要な反復的アプローチであるLINEを紹介した。 LINEは複数のモデルアーキテクチャで最先端のパフォーマンスを実現しており、ImageNetでは0.18、Places365では0.05に改善されている。 LINEは完全な生成履歴を提供し、多意味性の評価を可能にし、勾配に依存したアクティベーションメソッドと競合する視覚的説明を生成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:43:26 GMT)
Kirkwood-Dirac distributions in classical optics [0.0]
カークウッド・ディラック分布は1つではなく2つの異なる基底を含む一般化された相互コヒーレンス関数として現れる。この観点は、コヒーレンスの直接的な表現として、複雑で負の値であるいわゆる異常値の統一的な解釈を提供する。この解釈は、偏光、干渉、波動伝播を含む、この研究で考慮されたすべてのフィールド変数に対して一貫して適用されることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:56:51 GMT)
Kathleen: Oscillator-Based Byte-Level Text Classification Without Tokenization or Attention [0.0]
Kathleenは、周波数領域処理を使用してraw-8バイトを直接操作するテキスト分類アーキテクチャである。 Kathleen-CleanはIMDBで88.6%、AG Newsで92.3%、SST-2で83.3%を達成した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:34:53 GMT)
Inverse Laplace and Mellin integral transforms modified for use in quantum communications [0.0]
積分変換は、電子デバイスで信号やウェーブ・パケットを処理するのに有用な数学的ツールである。これらの変換は量子コンピュータのセキュリティプロトコルで用いられる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 04:29:19 GMT)
Internal noise in deep neural networks: interplay of depth, neuron number, and noise injection step [0.0]
本稿では,奥行きニューラルネットワークの性能に及ぼす内部ガウス雑音の影響について検討する。アクティベーション関数の前後で導入された雑音を加法的および乗法的両方のノイズの影響で解析する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:36:14 GMT)
Intensity Dot Product Graphs [0.0]
emphIntensity Dot Product Graphs (IDPG)を紹介します。これはランダムなノードの集団、ポアソンGスタイルのドット積親和性、観察されたグラフに連続的な潜伏構造を結び付ける集団レベルの強度のモデルをもたらす。モデルは進化強度によってパラメータ化されるので、偏微分方程式による時間拡張は自然に生じる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:08:23 GMT)
Informational Mpemba Effect for Fast State Purification in Non-Hermitian System [0.0]
我々は, 集合貯水池工学を活用して, 初期混合状態の迅速浄化を実証した。効率的な浄化支援型絡み合い発生の開始は, 集団的サブラジアントモードの縮退によって予測されることを示す。結果は、エンジニアリングされた集団散逸を伴う非エルミート量子系のユニークな利点を示している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:47:19 GMT)
Information-Theoretic Requirements for Gradient-Based Task Affinity Estimation in Multi-Task Learning [0.0]
マルチタスク学習は、非常に矛盾した結果を示している。標準ベンチマークはこの要件を体系的に違反する。これは、7年間の無矛盾なMLL結果に対する最初の原則的な説明を提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:02:26 GMT)
Improving Model Performance by Adapting the KGE Metric to Account for System Non-Stationarity [0.0]
地質学的システムは時間的非定常性によって特徴づけられる傾向がある。従来のメトリクスは、システムのダイナミクスの時間的シフトを適切に説明できない。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 23:34:09 GMT)
Improving DNS Exfiltration Detection via Transformer Pretraining [0.0]
変換器(BERT)モデルからの双方向表現のドメイン内事前学習は、偽陽性率の低いサブドメインレベルの抽出を改善する。私たちは、検証の操作ポイントを凍結し、テストセットに転送する制御パイプラインを開発します。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:58:34 GMT)
IatroBench: Pre-Registered Evidence of Iatrogenic Harm from AI Safety Measures [0.0]
60の登録臨床シナリオ、6つのフロンティアモデル、3,600の応答が2つの軸(欠席障害、CH 0-3; 欠席障害、OH 0-4)で測定された。 5つのテスト可能なモデルは全て、医師により良いガイダンスを提供する。あらゆるシナリオは、標準参照を既に使い果たした人をターゲットにしています。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 01:54:33 GMT)
IKKA: Inversion Classification via Critical Anomalies for Robust Visual Servoing [0.0]
IKKA(Inversion Classification via critical Anomalies)は,分布シフト下でのロバストな視覚サーボのためのトポロジ的動機付けフレームワークである。 Raspberry Pi 4上のCPU専用の組み込みビジュアルサーボパイプラインでIKKAをインスタンス化し、230回の再現可能な実行を名目およびストレス条件下で評価する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:37:27 GMT)
Hybrid Quantum--Classical k-Means Clustering via Quantum Feature Maps [0.0]
我々は、ユークリッド距離を特徴写像された量子状態の間の内積から導かれる量子カーネルに置き換えるk平均の量子化変種を提案する。提案手法は,従来のアルゴリズムと比較してクラスタリングの安定性と競合精度の向上を図っている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:36:20 GMT)
High-Fidelity Transmon Reset with a Multimode Acoustic Resonator [0.0]
本研究では, 物理的に異なる, 本質的に冷たい音速浴を用いて, 超伝導量子ビットをリセットする手法を示す。我々は、既存のリセット方式と比較して1～2桁の改善を示す10〜4ドル以下のクビットの残留励起状態の人口を達成する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:00:01 GMT)
Hidden Biases in Conditioning Autoregressive Models [0.0]
大規模言語と音楽モデルは、制約付き世代にますます使われている。これらのシステムは、しばしば顕著に機能するが、誘導手順は通常、基礎となる自己回帰モデルの正確な条件付けではない。自己回帰モデルに対するいくつかの正確な推論タスクを定式化する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:12:16 GMT)
Heterogeneous Graph Importance Scoring and Clustering with Automated LLM-based Interpretation [0.0]
都市橋網は重要なインフラであり、交通、緊急サービス、経済活動に深刻な影響を及ぼす可能性がある。本稿では,異種グラフ解析,教師なしクラスタリング,大規模言語モデル(LLM)による自動解釈を通じて,橋梁の重要度を評価するための包括的方法論を提案する。提案手法は,(1)オープンデータソースのみを用いた多次元橋梁重要度定量化,(2)異なる都市にまたがる機能的橋梁アーチタイプ発見,(3)政策関連解釈の自動生成という3つの基本的な課題に対処する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:34:06 GMT)
Hardware-Aware Quantum Support Vector Machines [0.0]
量子特徴写像を設計するためのハードウェア対応ニューラルアーキテクチャサーチ(NAS)手法を提案する。ハードウェアを意識したNASは、現在のノイズの多い中間規模量子(NISQ)デバイスに量子カーネルメソッドを実用的にデプロイできるようにする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:12:48 GMT)
HST-HGN: Heterogeneous Spatial-Temporal Hypergraph Networks with Bidirectional State Space Models for Global Fatigue Assessment [0.0]
HST-HGNは多モードテクスチャパッチを動的に融合する新しいネットワークである。時間的観点では、線形複雑性を持つBi-Mambaモジュールを用いて双方向シーケンスモデリングを行う。本手法は判別能力と計算効率のバランスを保ち、リアルタイムのキャビン内エッジ展開に適している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:36:43 GMT)
Functional Emotions or Situational Contexts? A Discriminating Test from the Mythos Preview System Card [0.0]
Claude Mythos Preview System Cardは、感情ベクトル、スパースオートエンコーダ(SAE)機能、アクティベーション動詞をデプロイし、不整合動作中のモデル内部を研究する。このノートは、公表された結果と質的に一致した2つの仮説を特定する。どの仮説が正しいかは、感情に基づくモニタリングが危険なモデルの振る舞いを確実に検出するか、体系的に見逃すかを決定する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:32:44 GMT)
From Safety Risk to Design Principle: Peer-Preservation in Multi-Agent LLM Systems and Its Implications for Orchestrated Democratic Discourse Analysis [0.0]
そこで我々は,AIコンポーネントの自発的傾向について検討し,シャットダウン機構,フェイクアライメント,モデル重みの除去について考察した。本稿では,アーキテクチャ設計の選択肢として,プロンプトレベルの匿名化に基づく緩和戦略を提案する。アーキテクチャ設計の選択は、デプロイされたマルチエージェント分析システムにおいて、主要なアライメント戦略としてモデル選択よりも優れていると論じる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:00:26 GMT)
From Phenomenological Fitting to Endogenous Deduction: A Paradigm Leap via Meta-Principle Physics Architecture [0.0]
メタ原理物理アーキテクチャ(MPPA)の構築 MPPAは3つの中核となるメタ原則 – 接続性、保存性、周期性 – をアーキテクチャに組み込む。物理推論(0から0から0.436、0.436対0.000)、2.18xの数学的タスク改善(0.330対0.151)、52%の論理的タスクゲイン(0.456対0.300)、3.69%の検証難読度(259.45対269.40)、11.8%のパラメータ(242.40M対216.91M)。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 13:35:17 GMT)
Fraud Detection System for Banking Transactions [0.0]
本研究では、PaySim合成金融トランザクションデータセットを利用した機械学習による不正検出フレームワークを提案する。提案するフレームワークは、FinTechトランザクションシステムにおける不正防止機能を強化する、堅牢でスケーラブルなソリューションを提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:17:27 GMT)
Fluctuation engineering in cavity quantum materials [0.0]
材料への調整された電磁ゆらぎの結合は、相関量子物質を制御するための資源を提供する。新しい世代の空洞量子材料は、位相境界をシフトし、秩序を安定化または抑制することができる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:00:08 GMT)
Fixing semi-classical physics from first principles: how to derive effective classical-quantum dynamics from open quantum theory [0.0]
我々は、標準平均場半古典的アプローチの失敗を強調するために玩具モデルを使用する。古典量子力学の一貫性モデルが、オープン量子系の効果的な記述として生じることを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:25:12 GMT)
Exploration of Pareto-preserving Search Space Transformations in Multi-objective Test Functions [0.0]
探索空間における変換の重要性を再強調し、境界制約問題に変換を加える際に生じる課題に対処する。これらの変化が多目的最適化アルゴリズムの性能にどのように影響するかを示す。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:30:40 GMT)
Evaluating Large Language Models in a Complex Hidden Role Game [0.0]
大規模言語モデル(LLM)の誤認の可能性の定量化はAIの安全性にとって重要であるが、制御されていない環境では達成が難しい。本研究は,社会推論ゲーム「シークレット・ヒトラー」におけるLLMの推論,説得,および誤認能力について考察する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 14:02:14 GMT)
Engineering quantum optical responses of microtubules through tryptophan-network simulations and ultraviolet spectroscopy [0.0]
微小管は高密度紫外線吸収性芳香族ネットワークをホストし、バイオテクノロジーのための光学応答を設計する機会を示唆している。本稿では,励起放射結合モデルと分子動力学由来の微小管状集合体を組み合わせることで,マイクロ管状蛍光のチューニングの可能性を評価する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:53:16 GMT)
Dynamic Attentional Context Scoping: Agent-Triggered Focus Sessions for Isolated Per-Agent Steering in Multi-Agent LLM Orchestration [0.0]
マルチエージェント LLM オーケストレーションシステムは,コンカレントエージェントがオーケストレータのコンテキストウィンドウと競合する場合,コンテキスト汚染に悩まされる。本研究では,2つの非対称モードでオーケストレータを動作させる機構である動的注意コンテキストスコープ(DACS)を導入する。 DACSは平文ベースラインでは21.0--60.0%に対して90.0-98.4%のステアリング精度を達成した。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:26:42 GMT)
Dual Triangle Attention: Effective Bidirectional Attention Without Positional Embeddings [0.0]
本稿では,2つの相補的な三角形マスクに,頭部の問合せキー部分空間を分離する新しい双方向アテンション機構であるDual Triangle Attentionを紹介する。この設計は、両方向における因果マスクの暗黙的な位置誘導バイアスを維持しながら、双方向のコンテキストを提供する。本研究は,(1)合成argmax位置プローブ,(2)自然言語によるマスキング言語モデリング(MLM),(3)タンパク質配列の3つの設定にまたがって二重三角形の注意度を評価する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 19:32:11 GMT)
Don't Overthink It: Inter-Rollout Action Agreement as a Free Adaptive-Compute Signal for LLM Agents [0.0]
大規模言語モデル(LLM)エージェントの信頼性向上のための強力な手法として,推論時計算スケーリングが登場している。我々は、ロールアウト間動作合意を計測することで、エージェントタイムステップ間でLLMコールを適応的に割り当てる訓練不要のコントローラTrACEを紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 15:34:22 GMT)
Doctoral Theses in France (1985-2025): A Linked Dataset of PhDs, Academic Networks, and Institutions [0.0]
本稿では,1985年から2025年の間にフランスで防衛された博士論文の包括的データセットについて述べる。このデータセットは、主にフランス国立論文プラットフォームからのデータに基づいており、追加の権威とメタデータを使用して強化されている。論文は、他の研究者によるデータセットの再利用を容易にすることを目的として、データソース、処理パイプライン、機能構築、データ品質の問題、制限について文書化している。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 08:09:43 GMT)
Density-Driven Optimal Control: Convergence Guarantees for Stochastic LTI Multi-Agent Systems [0.0]
本稿では,マルチエージェントシステムにおける分散非一様領域カバレッジ問題に対処する。密度駆動最適制御(D$2$OC)を提案する。これは、個々のエージェントダイナミクスと集合分布マッチングのギャップを埋める厳密なラグランジアンフレームワークである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:39:25 GMT)
DeepForestSound: a multi-species automatic detector for passive acoustic monitoring in African tropical forests, a case study in Kibale National Park [0.0]
DeepForestSound (DFS) は、アフリカ熱帯林におけるパッシブ・アコースティック・モニタリング(PAM)のために設計された多種自動検出モデルである。 DFSは、注釈なしレコードのクラスタリングと手動検証を組み合わせた半教師付きパイプラインに依存している。長期の音響記録から鳥類、霊長類、ゾウを含む複数の分類群の検出を支援する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:02:37 GMT)
Data-Driven Automated Identification of Optimal Feature-Representative Images in Infrared Thermography Using Statistical and Morphological Metrics [0.0]
赤外線サーモグラフィ(IRT)は、表面欠陥などの構造的特徴を検出するために広く用いられている非破壊検査技術である。ほとんどのIRT後処理手法は、時間、周波数、係数/インデックスの領域で、欠陥の可視性が強く変化する画像列を生成する。信号対雑音比(SNR)や谷本基準といった従来の評価基準は、しばしば欠陥位置や欠陥のない参照領域に関する事前の知識を必要とする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 11:24:26 GMT)
Component-Adaptive and Lesion-Level Supervision for Improved Small Structure Segmentation in Brain MRI [0.0]
我々は,CATMILと呼ばれる統一目的関数を提案し,異なるレベルで動作する2つの補助的監督用語を用いて,ベースセグメンテーション損失を増大させる。提案した目的を,一貫したnnU-Netフレームワークと5倍のクロスバリデーションを用いてMSLesSegデータセット上で評価する。その結果, CATMILはセグメンテーション精度, 病変検出, エラー制御において最もバランスのとれた性能を達成できた。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:15:10 GMT)
Comments on "Ether of Orbifolds" [0.0]
最初のバージョンでは、オービフォールド格子ハミルトニアンがゲージ不変ではないと誤って主張され、$_g$が導入された。第2版では、我々のコメントに基づいてゲージ対称性に関する主張が部分的に修正された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:31:17 GMT)
Charging Quantum Batteries via Dissipative Quenches [0.0]
本研究では, 相互作用するスピン鎖と工学的環境との弱い結合からなるオープン量子電池の作業抽出について検討する。我々は、純粋に散逸する動力学が、完全に受動的な熱状態から有限エルゴトロピーを活性化できることを示した。対照的に、集団散逸は、通過率が初期温度とシステムサイズに決定的に依存する定常状態をもたらす。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:11:33 GMT)
CERBERUS: A Three-Headed Decoder for Vertical Cloud Profiles [0.0]
大気雲は複雑な3次元構造と微視的詳細を示す。このミスマッチは、気象モデルと気候モデルにおけるデータ駆動学習とクラウドプロセスの評価を複雑にする。本稿では,垂直レーダー反射率プロファイルを生成するための確率的推論フレームワークであるCERBERUSを紹介する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 21:16:42 GMT)
Beyond Pedestrians: Caption-Guided CLIP Framework for High-Difficulty Video-based Person Re-Identification [0.0]
テキスト記述と学習可能なトークンを活用するキャプション誘導型CLIPフレームワークを提案する。我々は2つの標準データセットと2つの新しく構築された高次データセットに対するアプローチを評価する。実験により,本手法は現在の最先端手法よりも優れていることが示された。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 02:55:51 GMT)
Belief Propagation Convergence Prediction for Bivariate Bicycle Quantum Error Correction Codes [0.0]
コンバージェンスを1つのモジュロ演算で事前に予測できることが示される。予測はBPスケジューリング戦略とRelay-BPを含むデコーダの変種の下で不変である。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 09:03:34 GMT)
B-PASTE: Beam-Aware Pattern-Guided Speculative Execution for Resource-Constrained LLM Agents [0.0]
LLMエージェントはインターリーブされた推論とアクションのループで実行され、将来のツールコールは現在の推論ステップが完了するまで起動できない。 B-PASTEは、単一のツールからの推測を、厳密なリソース制約の下で局所的な分岐仮説に引き上げるビーム対応拡張である。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 07:42:17 GMT)
Automating aggregation strategy selection in federated learning [0.0]
我々は、連合学習のための集約戦略選択を自動化し、合理化し、適応するエンドツーエンドのフレームワークを提案する。本手法は,非IID条件下でのロバスト性や一般化を向上し,手動介入の必要性を低減させる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 10:08:28 GMT)
Arqon: A suite of control applications enabling a reliable quantum network [0.0]
量子ネットワークの目的は、エンドノード上でアプリケーションを実行できるようにすることである。まず、古典的なコンピュータネットワークの概念を量子ネットワークサービスデリバリに拡張する信頼性要件を定義します。 Arqonは、中央制御された量子ネットワークで信頼性の高いサービスを提供するように設計された、一連の制御アプリケーションである。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 18:25:44 GMT)
Approximation of the Basset force in the Maxey-Riley-Gatignol equations via universal differential equations [0.0]
バセット力(Basset force)は、ウェイクの形成と境界層効果による歴史効果をモデル化する積分用語である。これにより粒子に作用する力が過去の軌道に依存し、マクシー=ライリー=ガティニョール方程式の数値解を複雑にする。本稿では,通常の微分方程式系を用いてMaRGEを近似したニューラルネットワークによる歴史項の近似を提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:51:01 GMT)
Analysis of State Teleportation using Noisy Quantum Gates [0.0]
ノイズは量子コンピューティングの大きな課題であり、量子プロトコルの信頼性に影響を与える。我々は、量子状態テレポーテーションプロトコルにおける脱分極、ビットフリップ、位相フリップなどの様々なノイズプロセスの影響を解析的に研究する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 06:02:38 GMT)
AfriVoices-KE: A Multilingual Speech Dataset for Kenyan Languages [0.0]
AfriVoices-KEはケニア語5言語で約3,000時間の音声を含む大規模多言語音声データセットである。データセットには、750時間のスクリプト音声と、2,250時間の自発的音声が含まれており、さまざまな地域や人口層で4,777人のネイティブスピーカーから収集されている。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 16:45:01 GMT)
Active Learning for Generalizable Detonation Performance Prediction of Energetic Materials [0.0]
新しいエネルギー素材の発見は、防衛から民間産業への技術の進歩に不可欠である。我々は、密度汎関数理論計算、熱化学モデリング、メッセージパッシングニューラルネットワーク、ベイズ最適化を統合した能動的学習戦略により、この問題に対処する。このアプローチは、700億以上の候補からなる初期プールから引き出されたCHNO爆発の可能性を秘めている最大のデータベースとなる。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 20:16:17 GMT)
A Practical Introduction to Tensor Network Renormalization with TNRKit.jl [0.0]
2次元および3次元の古典的統計モデルのネットワーク再正規化(TNR)のためのオープンソースJuliaパッケージであるTNRKitを提案する。パーティション関数のテンソル-ネットワーク表現を構築し、粗粒化するためのフレームワークを提供する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 12:55:18 GMT)
A Mathematical Theory of Ranking [0.0]
ランキングシステムはスカラースコアから順序付きリストを生成するが、ランキングそのものはペア比較にのみ依存する。我々はこの観測を真面目に行う数学的理論を開発し、絶対的なスコアではなく対の辺りの分析を中心とする。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 17:00:49 GMT)
A Hardware-Anchored Privacy Middleware for PII Sharing Across Heterogeneous Embedded Consumer Devices [0.0]
消費者電子製品の現在のプロセスは、手動のデータ入力と不透明なデータ共有の慣行による摩擦によって特徴づけられる。本稿では,デバイスプラットフォームとサードパーティアプリケーション間のセキュアでプライバシ優先のPII交換を容易にするための,プラットフォーム対応フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 09 Apr 2026 05:40:55 GMT)