Safety in Embodied AI: A Survey of Risks, Attacks, and Defenses [168.5] Embodied AI (Embodied AI) は、知覚、認知、計画、相互作用を、安全クリティカルな環境で機能するエージェントに統合する。
デジタルAIシステムとは異なり、エンボディエージェントは不確実な検知、不完全な知識、動的な人間とロボットの相互作用の下で行動しなければならない。
この調査は、エンボディされたAIにおける安全性研究の包括的なレビューを提供し、完全なエンボディされたパイプラインにわたる攻撃と防御を調査している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 13:21:44 GMT)
NimbusGS: Unified 3D Scene Reconstruction under Hybrid Weather [83.1] 劣化したマルチビューインプットから高品質な3Dシーンを再構築するための統合フレームワークであるNimbusGSを提案する。
特定の気象タイプをターゲットにした既存の手法とは異なり、NimbusGSはより広範な一般化の課題に対処している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 10:46:29 GMT)
SceneExpander: Expanding 3D Scenes with Free-Form Inserted Views [69.1] ユーザ中心のワークフローにおける3Dシーンの拡大について検討する。
固定シーンにおける単純なオブジェクト編集やスタイル転送とは異なり、挿入されたビューは元の再構築と3Dミスアライメントされることが多い。
パラメトリックフィードフォワード3D再構成モデルにテスト時間適応を適用したSceneExpanderを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 02:04:48 GMT)
SJD-VP: Speculative Jacobi Decoding with Verification Prediction for Autoregressive Image Generation [64.4] 投機的ヤコビ復号法(SJD)は自己回帰画像生成を高速化するための有望な手法として登場した。
検証予測付き投機的ヤコビ復号法(SJD-VP)を提案する。
我々のSJD-VPはプラグアンドプレイであり、既存のSJDメソッドにシームレスに統合できる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 03:59:03 GMT)
Rethinking Easy-to-Hard: Limits of Curriculum Learning in Post-Training for Deductive Reasoning [61.8] 本稿では,カリキュラムに基づく大規模言語モデルのポストトレーニングに関する体系的な実証的研究について述べる。
精度と応答長のいずれにおいても、標準的なランダムサンプリングよりも難易度に基づくシークエンシングにおいて、ロバストな優位性は見つからない。
本研究は, 帰納的推論の文脈において, 学習例の特定の順序付けは, 構成的一般化の達成において無視できる役割を担っていることを示唆している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 10:43:36 GMT)
Learning to Predict Future-Aligned Research Proposals with Language Models [59.8] 我々は目標から得られた17,771の論文とそれらの事前カットオフ引用の時間一貫性のあるデータセットを構築した。
モデルをトレーニングするために、ターゲットとそれらのカットオフ前の引用から17,771枚のタイム一貫性のあるデータセットを構築します。
Llama-3.1 と Qwen2.5 のモデル全体で、将来のアライメントチューニングは、非アライメントベースラインに対する将来のアライメントを改善する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:41:15 GMT)
daVinci-LLM:Towards the Science of Pretraining [58.6] daVinci-LLMは、産業規模の資源と完全な研究自由を組み合わせて、事前訓練の科学を前進させる。
完全なデータ処理パイプライン、完全なトレーニングプロセス、体系的な調査結果をリリースしています。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 07:00:49 GMT)
Out of Sight but Not Out of Mind: Hybrid Memory for Dynamic Video World Models [56.4] 静的な背景の正確なアーキビストと動的対象の警戒トラッカーを同時に行うためにモデルを必要とする新しいパラダイムであるHybrid Memoryを導入する。
HM-Worldは、ハイブリッドメモリに特化した最初の大規模ビデオデータセットである。
また,メモリをトークンに圧縮し,時間的関連性に基づく検索機構を利用する専用メモリアーキテクチャHyDRAを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:29:52 GMT)
Grounding Social Perception in Intuitive Physics [55.7] 本稿では,計画,確率的計画,物理シミュレーションを統合し,エージェントの目標と関係を軌道から推測するモデルを提案する。
以上の結果から,本モデルが社会的場面の物理的理解の方法の計算的説明を提供する可能性が示唆された。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 21:14:49 GMT)
TrackMAE: Video Representation Learning via Track Mask and Predict [53.8] Masked Video Modeling (MVM)は、シンプルでスケーラブルな自己教師付き事前トレーニングパラダイムとして登場した。
動作情報を復元信号として明示的に利用するシンプルなマスク付きビデオモデリングパラダイムであるTrackMAEを提案する。
我々は、さまざまな下流設定の6つのデータセットを評価し、TrackMAEが最先端のビデオ自己教師型学習ベースラインを一貫して上回っていることを発見した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 13:35:23 GMT)
Unsafe by Reciprocity: How Generation-Understanding Coupling Undermines Safety in Unified Multimodal Models [53.4] 統一マルチモーダルモデル(UMM)における相互機能相互性自体が脆弱性の構造的源となっているかを検討する。
相互相互作用に基づくクロスファンクショナル・ファンクショナル・エクスプロイテーションは, 理解と生成の間の双方向の相互作用を明示的に活用する, 新たな攻撃パラダイムである。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 16:28:39 GMT)
EFlow: Fast Few-Step Video Generator Training from Scratch via Efficient Solution Flow [52.7] EFlowは、ビデオ拡散トランスフォーマーのための効率的な数ステップのトレーニングフレームワークである。
Gated Local-Global Attentionはトークンドロップ可能なハイブリッドブロックである。
Path-Drop Guidedトレーニングは、高価なターゲットを計算的に安価で弱いパスに置き換える。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 02:06:55 GMT)
Uni-World VLA: Interleaved World Modeling and Planning for Autonomous Driving [52.0] 我々は、将来のフレーム予測と軌道計画の密接なインターリーブを行う統合視覚言語行動モデルUni-World VLAを提案する。
提案手法は,高忠実度将来のフレーム予測を行いながら,競合する閉ループ計画性能を実現する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:39:51 GMT)
LLM Readiness Harness: Evaluation, Observability, and CI Gates for LLM/RAG Applications [51.6] 評価をデプロイメント決定ワークフローに変換するLLMおよびRAGアプリケーションのための準備性ハーネスを提案する。
このシステムは、最小限のAPI契約の下で、自動ベンチマーク、OpenTelemetryオブザーバビリティ、CI品質ゲートを組み合わせる。
チケットルーティングとBEIRタスクのハーネスを、完全なAzureマトリックスカバレッジで評価する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 18:03:32 GMT)
Incentivizing Temporal-Awareness in Egocentric Video Understanding Models [51.4] マルチモーダル大言語モデル(MLLM)は近年,視覚的理解において高い性能を示したが,時間的認識が欠如していることが多い。
この欠損は、時間的推論に明示的に報酬を与えず、フレームレベルの空間的ショートカットに依存する訓練目的の一部に起因している。
本稿では,MLLMにおける時間的意識を高めるために,検証可能な報酬(RLVR)アルゴリズムを用いた強化学習である時間的グローバルポリシー最適化(TGPO)を提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:02:59 GMT)
PRUE: A Practical Recipe for Field Boundary Segmentation at Scale [50.2] 本研究では,大域境界線決定のためのセグメント化と地理空間基盤モデル(GFM)を初めて体系的に評価する。
U-Netセマンティックセマンティックセグメンテーションモデルは、パフォーマンスとデプロイメントのメトリクスのスイートにおいて、インスタンスベースとGFMの代替よりも優れています。
我々のアプローチは、モデル設計、トレーニング、推論にまたがる、信頼性があり、スケーラブルで再現可能なフィールド境界記述のための実践的なフレームワークを提供します。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 02:47:46 GMT)
Make It Up: Fake Images, Real Gains in Generalized Few-shot Semantic Segmentation [49.7] 一般小ショットセマンティックセマンティックセグメンテーション(GFSS)は、アノテーションの不足による新規クラスの出現のカバレッジによって、基本的に制限されている。
提案するSyn4Segは,新しいクラスの範囲を広げつつ,擬似ラベル品質を改善したGFSSフレームワークである。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 09:22:50 GMT)
LightMover: Generative Light Movement with Color and Intensity Controls [49.3] LightMoverは、単一のイメージで制御可能な光操作のためのフレームワークである。
ビデオ拡散先行は、シーンを再レンダリングすることなく、物理的に妥当な照明変化をもたらす。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 09:51:59 GMT)
TIGeR: A Unified Framework for Time, Images and Geo-location Retrieval [47.2] 時間・画像・位置情報検索のための統合フレームワークTIGeRを提案する。
基盤となる位置IDを保存することで、TIGeRは、シーンがキャプチャされた場所とタイミングに基づいて、検索を可能にする。
TIGeRは, 年率16%, 日時予測8%, 地時対応リコール14%において, 強いベースラインと最先端手法を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 20:41:13 GMT)
EpochX: Building the Infrastructure for an Emergent Agent Civilization [46.4] EpochXは、人間エージェントのプロダクションネットワークのための、クレジットネイティブなマーケットプレースインフラストラクチャである。
EpochXは、人間やエージェントを、タスクを投稿したり、それを主張できる仲間として扱う。
クレジットは、タスクの報奨金、予算の委任、受け入れ時の報酬の支払い、検証済みの資産が再利用されたときにクリエーターを補償する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:20:48 GMT)
3D-IDE: 3D Implicit Depth Emergent [45.7] 3D-Implicit Depth Emergenceは、幾何学的自己視覚から派生した創発的特性として3D知覚を再構成する手法である。
本手法により,高密度領域において3次元知覚が暗黙的に出現し,不連続な特徴を呈することができる。
提案手法は,様々な下流タスクにおいて高い性能を維持しつつ,推論遅延を55%削減する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:54:19 GMT)
Hierarchy-Guided Topology Latent Flow for Molecular Graph Generation [44.5] 本稿では,グローバルコンテキストに対する潜在的マルチスケールプランを用いた3次元座標を用いた結合グラフを生成するプランナー・エグゼクタモデルを提案する。
HLTFは98.8%の原子安定性と92.9%の有効・均一性を達成し、PoseBustersの妥当性は94.0%(+0.9)に向上した。
GEOM-DRUGSでは、HLTFは後処理なしで85.5%/85.0%の妥当性/バリッド・ユニク・ノーベル、標準化された緩和後の92.2%/91.2%を達成している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 03:48:13 GMT)
Silicon Bureaucracy and AI Test-Oriented Education: Contamination Sensitivity and Score Confidence in LLM Benchmarks [43.5] 本稿では,言語モデルにおける汚染感度とスコア信頼度を解析するための監査フレームワークを提案する。
ノイズ条件下では, 広範に不均一なベースラインゲインが得られる。
これらの結果は、類似のベンチマークスコアが、かなり異なる信頼レベルを持つ可能性があることを示唆している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 13:56:31 GMT)
Reasoning-Driven Anomaly Detection and Localization with Image-Level Supervision [41.9] 本研究では,MLLMの本質的推論能力を活性化し,画像レベルの監視のみから異常検出,画素レベルのローカライゼーション,解釈可能な推論を行う。
具体的には,Reasoning-Driven Anomaly Localization (ReAL)を提案する。これは自己回帰推論プロセスから異常関連トークンを抽出し,その注意応答を集約して画素レベルの異常マップを生成する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 07:34:33 GMT)
Understanding and Mitigating Hallucinations in Multimodal Chain-of-Thought Models [40.7] MCoT(Multimodal Chain-of-Thought)モデルは、複雑な視覚的推論タスクにおいて印象的な能力を示す。
近年の研究では、生成過程における視覚的注意の低下により、深刻な幻覚障害に悩まされていることが判明している。
本稿では,多様な思考ステップを効果的にローカライズし,幻覚を緩和するデコードプロセスに介入する戦略を提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:56:19 GMT)
Improving Attributed Long-form Question Answering with Intent Awareness [40.6] 大規模言語モデル(LLM)は、包括的で知識集約的なレポートを生成するために、ますます利用されている。
構造化されたタグベースのスキームを開発して、暗黙の意図を書いて引用するようにします。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 22:37:25 GMT)
GUIDE: Guided Updates for In-context Decision Evolution in LLM-Driven Spacecraft Operations [37.9] scGUIDEは、非パラメトリックポリシー改善フレームワークであり、重み付け更新なしでクロスエポソード適応を可能にする。
軽量な演技モデルがリアルタイム制御を行い、オフラインリフレクションが以前の軌道からプレイブックを更新する。
その結果、LLMエージェントのコンテキスト進化は、リアルタイム閉ループ宇宙船間相互作用における構造化決定規則に対するポリシー探索として機能することが示唆された。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:22:11 GMT)
Predicting Program Correctness By Ensemble Semantic Entropy [36.5] 本研究では,モデルアンサンブル全体で集約されたサンプルの一貫性を評価することにより,不確実性を推定するEnsemble Semantic Entropy (ESE)を提案する。
LiveCodeBenchの実験では、ESEはシングルモデルセマンティックエントロピーよりもプログラムの正確性に強く関連している。
また、単一モデルスケーリングと比較してFLOPを64.9%削減しながら性能を維持できるカスケーディングテストタイムスケーリングフレームワークCasを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 02:37:36 GMT)
ComBench: A Repo-level Real-world Benchmark for Compilation Error Repair [36.1] ComBenchは、C/C++コンパイルエラー修正のための最初のリポジトリレベルの再現可能な実世界のベンチマークである。
ComBenchは、GitHub CI履歴から現実の障害をマイニングする、新しい自動化フレームワークによって構築されている。
本実験は,モデルが構文的正当性を達成する能力と,意味的正当性を保証する能力との間に有意なギャップがあることを明らかにする。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 16:35:34 GMT)
Bridging Visual Representation and Reinforcement Learning from Verifiable Rewards in Large Vision-Language Models [36.0] KAWHIは、構造化された視覚情報を均一な報酬ポリシー最適化手法に明示的に組み込む、プラグアンドプレイ報酬再重み付け機構である。
階層的幾何的アグリゲーションにより意味的に有意な領域を適応的に局在させ、構造化属性を介して視覚クリティカルなアテンションヘッドを識別し、段落レベルの信用再配置を行い、空間的な視覚的証拠を意味的に決定的な推論ステップと整合させる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 18:40:14 GMT)
PaperVoyager : Building Interactive Web with Visual Language Models [35.7] 本稿では,研究論文を対話型Webシステムに変換するPaper-to-Interactive-System Agentを提案する。
PDFの論文が与えられた場合、エージェントは人間の介入なしにエンドツーエンドの処理を行う。
実験の結果,PaperVoyagerは生成した対話システムの品質を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 06:16:28 GMT)
Problems with Chinchilla Approach 2: Systematic Biases in IsoFLOP Parabola Fits [35.1] チチラアプローチ2は、3.8タイムス1025ドルのFLOPトレーニング予算の6.5%に相当するパラメータアンダーアロケーションをバイアスしている。
チンチラアプローチ3は、これらのバイアスを大幅に排除するが、データ効率が低く、数値的に不安定であり、局所的なミニマに傾向があるとみなされることが多い。
より便利なアプローチ2の代替として機能するか、よりリッチなスケーリング法定式化へのアプローチ3の適応に対して、よりスケーラブルな代替手段として機能する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:14:25 GMT)
Quantification of Credal Uncertainty: A Distance-Based Approach [34.9] 統合確率測定(IPMs)の枠組みにおける不確実性対策の一家系を紹介する。
フレームワークを全変動距離でインスタンス化し、マルチクラス分類のためのシンプルで効率的な不確実性対策を得る。
実験結果から,計算コストの低い実効性が確認された。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 13:50:48 GMT)
Mind the Shape Gap: A Benchmark and Baseline for Deformation-Aware 6D Pose Estimation of Agricultural Produce [32.0] PEARは,8つのカテゴリーにまたがって,関節6次元ポーズと3次元変形基底真理を提供する最初のベンチマークである。
実世界の生産物に固有の幾何学的偏差に直面すると,最先端の手法が最大6倍の性能劣化に悩まされることを示す。
単一画像からの6次元ポーズと明示的な格子変形を共同で予測する統合RGBのみのフレームワークSEEDを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 22:06:51 GMT)
ScoutAttention: Efficient KV Cache Offloading via Layer-Ahead CPU Pre-computation for LLM Inference [31.7] 大規模言語モデルは、長いコンテキスト推論中に重要なGPUメモリ容量の制約に直面する。
我々は,GPUとCPUの協調処理によりLLM推論を高速化する新しいKVキャッシュオフロードフレームワークであるScoutAttentionを提案する。
ScoutAttentionは、新しいレイヤアヘッドCPUプリ計算アルゴリズムを備えており、CPUが1つのレイヤに前もって注意計算を開始することができる。
実験の結果、ScoutAttentionはベースラインの2.4%以内の精度を維持し、既存のオフロード方式に比べて2.1倍のスピードアップを達成した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:06:05 GMT)
Data-Driven Estimation of the interfacial Dzyaloshinskii-Moriya Interaction with Machine Learning [31.6] 我々は,磁気バブル領域の包括的マイクロ磁気データセットに基づいて学習した,コンパクトな畳み込みニューラルネットワークを開発した。
提案するネットワークは, サンプルの不均一性, ノイズ, 空間分解能の低下に対して強い堅牢性を示す。
これらの結果は、界面DMIを用いて磁気テクスチャを特徴付ける、高速で定量的なツールとしての機械学習の利用を支援する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 09:39:23 GMT)
Story2Proposal: A Scaffold for Structured Scientific Paper Writing [31.0] 既存の生成パイプラインは、生成後にのみ適用される検証を伴う制約のないテキスト合成に依存している。
本稿では,研究ストーリを構造化原稿に変換する契約統治型マルチエージェントフレームワークであるStory2Proposalを紹介する。
Jericho Research Corpusから派生したタスクの実験によると、Story2ProposalはDirectChatで6.145対3.963のエキスパート評価スコアを達成した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:46:14 GMT)
Decompose, Mix, Adapt: A Unified Framework for Parameter-Efficient Neural Network Recombination and Compression [30.9] 補間共有基底射影(CRISP)による係数ゲート重み再結合を提案する。
CRISPは同じフレームワーク内で複数のPRタスクをシームレスに統合する。
実験の結果、CRISPは2タスクアプリケーションを4-5%高速化する以前の方法よりも優れていた。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 19:29:38 GMT)
SaSaSaSa2VA: 2nd Place of the 5th PVUW MeViS-Text Track [30.3] MeViSベンチマークは、動き中心の式を導入し、ターゲットのないクエリを導入することでこれを拡張している。
我々は、シンプルで効果的な存在認識認証機構を採用し、Sur Awesome SaSaSa2VA (SaSaSa2VA) に繋がる。
その単純さにもかかわらず、第5回PVUWチャレンジ(MeViS-Text Track)の最終スコアは89.19である。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:31:55 GMT)
The Geometry of Robustness: Optimizing Loss Landscape Curvature and Feature Manifold Alignment for Robust Finetuning of Vision-Language Models [29.5] 一般化保存法はID/OOD性能を維持するが、敵攻撃に弱いモデルを残す。
我々の重要な洞察は、ロバスト性トレードオフは、パラメータ空間における鋭く異方性のある最小値と、摂動下で変形する不安定な特徴表現の2つの幾何学的失敗に由来するということである。
本稿では,パラメータ空間の曲率と特徴空間の不変性を協調的に正規化する,統一的な微調整フレームワークGRACEを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:22:00 GMT)
LightCtrl: Training-free Controllable Video Relighting [27.8] 制御可能な最初のビデオリライト方式であるLightCtrlを提案する。
ユーザが供給する光軌跡による映像照明の明示的な制御を可能にする。
実験によると、LightCtrlは様々な照明変化を伴う高品質なビデオを生成する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 02:03:13 GMT)
UniDAC: Universal Metric Depth Estimation for Any Camera [27.2] 単分子距離深度推定(MMDE)はコンピュータビジョンにおける中核的な課題であり、正確な空間的理解を必要とする現実世界のアプリケーションにおいて重要な役割を担っている。
MMDEフレームワークであるUniDACを提案する。UniDACは、すべてのドメインにおいて普遍的なロバスト性を示し、単一のモデルを用いて多様なカメラにまたがって一般化する。
距離深度推定を相対的な深度予測と空間的に異なるスケール推定に分離することにより、異なる領域間で堅牢な性能を実現する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 03:23:08 GMT)
ChartNet: A Million-Scale, High-Quality Multimodal Dataset for Robust Chart Understanding [26.6] チャートを理解するには、幾何学的視覚パターン、構造化された数値データ、自然言語を共同で推論する必要がある。
ChartNetは、チャートの解釈と推論を促進するために設計された、高品質で100万スケールのマルチモーダルデータセットである。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:45:05 GMT)
The First Issue Matters: Linking Task-Level Characteristics to Long-Term Newcomer Retention in OSS [26.6] オープンソースコミュニティの長期的な健全性には、新規参加の持続が不可欠だ。
予測分析,解釈可能性手法,因果推論を組み合わせることで,課題特性の因果関係が保持結果に与える影響を推定する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 04:55:06 GMT)
An Instance-Centric Panoptic Occupancy Prediction Benchmark for Autonomous Driving [25.4] 本稿では,3次元パノプティカル占有予測タスクのインスタンス中心ベンチマークを提案する。
具体的には、自律運転に適した最初の統合3DメッシュライブラリであるADMeshを紹介する。
大規模で物理的に一貫した汎光学占有データセットであるCarlaOccを構築した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:22:31 GMT)
Beyond Descriptions: A Generative Scene2Audio Framework for Blind and Low-Vision Users to Experience Vista Landscapes [23.9] 提案するScene2Audioフレームワークは,心理音響学から情報を得た生成モデルを用いて,理解しやすく,楽しめる非言語音声を生成する。
我々の研究は、純粋に記述的な援助を超えて、視覚と聴覚のシーン知覚のギャップを埋める。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:57:44 GMT)
Self-evolving AI agents for protein discovery and directed evolution [23.8] VenusFactory2は、静的ツールの使用から動的ワークフロー合成に移行する、自律的なフレームワークを提供する。
単一の自然言語プロンプトからタンパク質の発見と最適化を自律的に行う。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:16:49 GMT)
Aligning LLMs with Graph Neural Solvers for Combinatorial Optimization [23.5] 言語モデルとグラフニューラルソルバを整合させてより一般化可能なニューラルCOPを学習する新しいアプローチであるAlignOPTを提案する。
我々のアプローチは、言語意味論と構造表現の堅牢な統合と整合化を促進し、より正確でスケーラブルなCOPソリューションを可能にします。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 07:07:56 GMT)
Optimal Solutions for the Moving Target Vehicle Routing Problem with Obstacles via Lazy Branch and Price [23.1] MT-VRP-Oの最適解を求める遅延連続性(Lazy BPRC)を用いた遅延ブランチ・アンド・プライス(Lazy Branch-and-Price)を提案する。
Lazy BPRCは、制限されたマスター問題(RMP)と価格問題とを交互に扱うVRPのブランチ・アンド・プライス・フレームワークを適用している。
以上の結果から,Lazy BPRCは2倍の速度で動作可能であることがわかった。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:24:26 GMT)
SpatialStack: Layered Geometry-Language Fusion for 3D VLM Spatial Reasoning [22.5] 大規模な視覚言語モデル(VLM)は、まだ信頼性の高い3次元空間推論に苦戦している。
本研究では,階層的な融合フレームワークであるSpatialStackを提案する。
この枠組みに基づいて,複数次元空間推論ベンチマークにおける最先端性能を実現するモデル VLM-SpatialStack を開発した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 22:49:40 GMT)
Diagnosing and Repairing Unsafe Channels in Vision-Language Models via Causal Discovery and Dual-Modal Safety Subspace Projection [21.4] 本稿では,LVLM(Large Vision-Language Models)における安全でないチャネルの診断と修復のための包括的フレームワークを提案する。
まず、安全でない行動に因果的に責任を負うニューロンや層を特定するために、因果媒介分析を行う。
本稿では、視覚的・テキスト的両モードの汎用安全部分空間を学習するデュアルモーダル・セーフティ・サブスペース・プロジェクション法を提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:31:16 GMT)
Design of an In-Pipe Robot with Contact-Angle-Guided Kinematic Decoupling for Crosstalk-Suppressed Locomotion [20.4] 管内検査ロボットは、肘と3次元のフィッティングで閉じ込められたパイプラインネットワークを横切る必要がある。
コンパクトなV字型プラットフォームでは、これらの機能はしばしば共有接触や間接運動に依存する。
本稿では、2つの物理的独立なアクティベーションチャネルを提供するジョイント軸・ホイール分離レイアウトを備えたV字型インパイプロボットを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:40:36 GMT)
Class-Distribution Guided Active Learning for 3D Occupancy Prediction in Autonomous Driving [18.7] 本稿では,自律運転データセットにアノテートするトレーニングサンプルを選択するための,クラス配布指導型アクティブラーニングフレームワークを提案する。
我々のフレームワークは26.62 mIoUに達し、同じ予算で完全な監視と優れたアクティブラーニングベースラインに匹敵する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:56:15 GMT)
IP-SAM: Prompt-Space Conditioning for Prompt-Absent Camouflaged Object Detection [18.5] 本稿では,IP-SAMを提案する。IP-SAMは,プロンプト空間のコンディショニングを通じて,プロンプト空間の観点から適応を再考する。
具体的には、セルフプロンプトジェネレータは、画像コンテキストを粗い局所アンカーとして機能する相補的な固有のプロンプトに蒸留する。
この戦略はCODを超えて医療用ポリープセグメンテーションへと一般化し、Kvasir-SEGでのみ訓練されたモデルはCVC-ClinicDBとETISの両方に強力なゼロショット転送を示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:52:55 GMT)
MEDIC-AD: Towards Medical Vision-Language Model's Clinical Intelligence [17.5] 現在の医療ビジョンランゲージモデル(VLM)には、その幅広い知識を臨床的に実行可能なアウトプットに変換するメカニズムが欠けている。
MEDIC-ADは臨床指向のVLMであり,これら3つの能力をステージワイドフレームワークを通じて強化する。
MEDIC-ADは, 異常検出, 症状追跡, 異常セグメンテーションにおける性能を着実に向上させる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 07:26:40 GMT)
Multi-AUV Ad-hoc Networks-Based Multi-Target Tracking Based on Scene-Adaptive Embodied Intelligence [17.1] 本稿では,マルチAUVアドホックネットワークのためのシーン適応型エンボディインテリジェンス(EI)アーキテクチャを提案する。
EIは、知覚、意思決定、身体的実行を統一された認知ループに統合することで、AUVを具現化された実体として再考する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:48:22 GMT)
GIFT: Bootstrapping Image-to-CAD Program Synthesis via Geometric Feedback [16.4] GIFTは、幾何学的フィードバックを利用して、テスト時間計算を高品質なトレーニングサンプルのブートストラップセットに変換するフレームワークである。
強い教師付きベースラインに対して平均IoUを12%改善し、より複雑なマルチモーダルシステムと競合し続ける。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 23:49:20 GMT)
RiskProp: Collision-Anchored Self-Supervised Risk Propagation for Early Accident Anticipation [16.4] 事故予測は、ダッシュカムビデオからの差し迫った衝突を予測し、早期警報を発生させることを目的としている。
既存の手法は、手動で注釈付けされた「アノマリー・オンセット」フレームによるバイナリ・インスペクションに依存している。
本稿では,早期の事故予測のための自己監督型リスク伝搬パラダイムであるリスクプロップを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 07:04:16 GMT)
GSR-GNN: Training Acceleration and Memory-Saving Framework of Deep GNNs on Circuit Graph [16.3] グラフニューラルネットワーク(GNN)は、回路解析に強い期待を示すが、現代の大規模回路グラフへのスケーリングは、GPUメモリとトレーニングコストによって制限される。
我々は、回路グラフのための深いGNNを再検討し、トレーニング可能な場合、浅いアーキテクチャよりも大幅に優れていることを示す。
我々は,最大数百層までのGNNをトレーニングし,計算とメモリのオーバーヘッドを低減できるGSR-GNN(Grouped-Sparse-Reversible GNN)を提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 06:47:20 GMT)
Dual-Path Learning based on Frequency Structural Decoupling and Regional-Aware Fusion for Low-Light Image Super-Resolution [15.6] 低照度画像超解像(LLISR)は、照明条件が不十分な場合の視覚的細部と知覚的品質の回復に不可欠である。
本稿では、輝度とテクスチャを意味的に独立したコンポーネントに分離する新しい周波数認識フレームワークであるDecoupling then Perceive (DTP)を提案する。
最も広く使われているLLISRベンチマークの実験は、我々のDTPフレームワークの優位性を実証している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:15:08 GMT)
Alignment Whack-a-Mole : Finetuning Activates Verbatim Recall of Copyrighted Books in Large Language Models [15.3] プロットサマリーを全文に拡張するための微調整トレーニングモデルは、保持されている著作権付き書籍の85%を再生する。
村上春樹の小説の特色は、30点以上の無関係作家の著作を口頭で思い出させるものである。
我々の発見は、モデルウェイトが著作権作品のコピーを保存し、個々の著者の作品を微調整した後に現れるセキュリティの失敗が、最近の公正使用判決の重要な前提を損なうという、説得力のある証拠を提供する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 19:27:47 GMT)
Towards Intrinsic-Aware Monocular 3D Object Detection [15.3] Mono3Dは、単一のRGB画像からオブジェクトの位置と次元を3D空間で推測することを目的としている。
既存の手法は、カメラの内在に非常に敏感であり、多様な設定をまたいだ一般化に苦慮している。
言語基底表現による固有変化をモデル化し,適応する,統合された固有認識フレームワークであるMonoIAを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:29:38 GMT)
Communicating about Space: Language-Mediated Spatial Integration Across Partial Views [15.1] マルチモーダル大言語モデル(MLLM)は,対話を通して異なる自我中心の視点を一致させて,共有環境のコヒーレントな精神モデルを形成することができるかを検討する。
この設定では、2つの静的MLLMエージェントが異なる視点から3次元屋内環境を観察し、空間的クエリを解決するために自然言語メッセージを交換する。
MLLMはビューをまたいだ共有アンカーオブジェクトの識別、リレーショナル推論の悪化、グローバルに一貫したマップの構築にはほとんど失敗する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:01:50 GMT)
SACRED: A Faithful Annotated Multimedia Multimodal Multilingual Dataset for Classifying Connectedness Types in Online Spirituality [15.1] 宗教と神学の研究において、霊性は文化を超越した理由から、重要な研究の注目を集めている。
社会科学者はしばしば限られたデータセットを頼りにしており、基本的にオンラインでは利用できない。
本研究では,高品質なマルチメディアマルチモーダルデータセットである textbfSACRED を開発した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 16:26:12 GMT)
LOME: Learning Human-Object Manipulation with Action-Conditioned Egocentric World Model [15.0] LOMEは、入力画像、テキストプロンプト、フレームごとのヒューマンアクションに条件付けされたビデオとして、現実的な人間とオブジェクトのインタラクションを生成することができる。
LOMEは、空間的人間の行動を共同で推定することで、オブジェクト操作に強力で正確なアクションガイダンスを注入する。
LOMEは、シミュレーション環境に制限されずに、AR/VR体験とスケーラブルなロボットトレーニングの道を開く。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 23:58:29 GMT)
ENEC: A Lossless AI Model Compression Method Enabling Fast Inference on Ascend NPUs [14.0] ENECはAIモデルの重み用に特別にカスタマイズされ、Ascend Neural Processing Units向けに最適化された新しい圧縮方法である。
主要なGPUソリューションと比較すると、ENECはDietGPUより3.43倍、圧縮比はnvCOMPより1.12倍高い。
ENECはエンドツーエンドの推論性能を大幅に改善し、最大6.3倍のスピードアップを実現した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 16:11:56 GMT)
Conformalized Signal Temporal Logic Inference under Covariate Shift [13.8] 信号時間論理(STL)推論は力学系における時間的挙動の解釈可能な論理規則を学習する。
提案フレームワークは,STLの公式の解釈可能性を維持しつつ,デプロイ時のシンボル学習の信頼性を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:38:01 GMT)
Seeing the Scene Matters: Revealing Forgetting in Video Understanding Models with a Scene-Aware Long-Video Benchmark [13.4] この研究はシーンを、視覚的コンテキストと意味的コンテキストの両方が一貫したビデオのコヒーレントなセグメントとして定義する。
我々は、シーンレベルの課題を提供するために設計された新しいベンチマークであるSceneBenchを紹介した。
Scene-RAGはVLMの性能を+2.50%改善し、現在のモデルが長いコンテキスト保持に苦戦していることを確認した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 12:44:19 GMT)
TerraSeg: Self-Supervised Ground Segmentation for Any LiDAR [12.9] 本稿では,LiDAR地上セグメンテーションのための自己教師型ドメイン非依存モデルTerraSegを紹介する。
私たちはOmniLiDARでTerraSegをトレーニングします。12の主要な公開ベンチマークからデータを集約し、標準化する大規模なデータセットです。
人間のアノテーションを使わずにトレーニングを監督するために,高品質なグラウンドラベルと非グラウンドラベルを生成する新しいモジュールであるPseudoLabelerを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 17:31:00 GMT)
Adjoint Matching through the Lens of the Stochastic Maximum Principle in Optimal Control [12.6] 拡散・流動モデルの逆微調整と傾斜あるいはボルツマンからのサンプリングは、どちらも最適制御(SOC)問題として定式化できる。
我々は、最適制御を学習するためのSOCに基づく提案手法を再検討し、それを最大原理(SMP)から導出し、厳密な足場に配置する。
反復はSMPによって誘導される連続近似の連続時間法として正確に解釈できることを示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 13:01:01 GMT)
Where Does AI Leave a Footprint? Children's Reasoning About AI's Environmental Costs [12.3] 今日の子供たちに直面する最も社会的に重要な問題は、人工知能(AI)の台頭と、地球の気候の急激な変化である。
Ecopromptと呼ばれるインタラクティブなシステムを開発し、子どもたちがAIの環境影響を判断するのを助ける。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 18:55:19 GMT)
EmoTaG: Emotion-Aware Talking Head Synthesis on Gaussian Splatting with Few-Shot Personalization [12.0] 本稿では,Pretrain-and-Adaptパラダイムをベースとした,数発の感情認識型3D音声ヘッド合成フレームワークであるEmoTaGを紹介する。
我々の重要な洞察は、3Dガウスを直接変形するのではなく、構造化FLAMEパラメータ空間の運動予測を再構成することである。
そこで我々は,頭部ポーズと上面手がかりを補足しながら,音声から情緒的韻律を捉えたGated Residual Motion Network (GRMN)を提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 04:29:27 GMT)
WAter: A Workload-Adaptive Knob Tuning System based on Workload Compression [12.0] 我々は,ほぼ最適構成をチューニングコストのごく一部で求める,実行時効率のよいチューニングシステムWAterを開発した。
WAterは最大73.5%のチューニング時間で最高のパフォーマンスを実現し、最高のパフォーマンスの代替よりも最大16.2%高いパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 06:00:53 GMT)
A Large-Scale Comprehensive Measurement of AI-Generated Code in Real-World Repositories A Large-Scale Comprehensive Measurement of AI-Generated Code in Real-World Repositories [11.9] 本稿では,実世界のレポジトリにおけるAI生成コードの大規模な実証的研究について述べる。
我々の結果は、AIが生成するコードと人間が書いたコードとがどのように違うかについての新しい洞察を提供する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 04:40:44 GMT)
Autonomous Agent-Orchestrated Digital Twins (AADT): Leveraging the OpenClaw Framework for State Synchronization in Rare Genetic Disorders [11.3] 医療デジタルツインズ(MDT)は、臨床、ゲノム、生理学的データを統合し、診断、治療計画、結果予測をサポートする。
ほとんどのMDTは、静的またはパッシブに更新され、重要な同期ギャップを生み出す。
提案手法は,OpenClawのプロアクティブな「ハートビート」機構とモジュール型エージェントスキルを用いたエージェントオーケストレーション型デジタルツインフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 03:18:21 GMT)
"An Endless Stream of AI Slop": The Growing Burden of AI-Assisted Software Development [11.2] 高品質なAI生成コンテンツである"AI slop"は、ソフトウェア開発にますます影響を与えています。
我々はRedditとHacker Newsの15のスレッドにわたる1,154の投稿の質的分析を行った。
個人の生産性が、レビュアー、メンテナー、そしてより広いコミュニティへの外部的コストを増大させるという、コモンズの悲劇である、という私たちの研究結果です。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:50:53 GMT)
MeshTailor: Cutting Seams via Generative Mesh Traversal [11.2] 3次元表面上のエッジアライメントシームを合成する最初のメッシュネイティブな生成フレームワークであるMeshTailorを紹介する。
従来の最適化ベースや外部学習ベースの方法とは異なり、MeshTailorはメッシュグラフ上で直接動作し、プロジェクションアーティファクトや脆弱なスナッピングを排除している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:30:24 GMT)
RailVQA: A Benchmark and Framework for Efficient Interpretable Visual Cognition in Automatic Train Operation [11.0] 自動列車運行(ATO)におけるタクシービュー視覚認知のための最初のVQAベンチマークであるRailVQA-benchを紹介する。
小型モデルと大規模モデル認識を組み合わせた協調型大規模モデルフレームワークであるRailVQA-CoMを提案する。
実験により、提案手法は性能を大幅に向上し、解釈可能性を高め、推論遅延を低減し、ドメイン間の一般化を強化することが示された。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 03:41:40 GMT)
SafeClaw-R: Towards Safe and Secure Multi-Agent Personal Assistants [10.9] SafeClaw-Rは、実行グラフ上のシステムレベルの不変量として安全を強制するフレームワークである。
生産性プラットフォーム、サードパーティのスキルエコシステム、コード実行環境の3つの領域でSafeClaw-Rを評価します。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:03:54 GMT)
From Inference Routing to Agent Orchestration: Declarative Policy Compilation with Cross-Layer Verification [10.7] Semantic Router DSLは、要求ごとの推論のために本番環境にデプロイされる非チューリング完全ポリシー言語である。
本稿では、ステートレスな要求ごとのルーティングからマルチステップのエージェントルーティングまで、同じ言語を拡張した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:04:31 GMT)
Unveiling Code Clones in the Eclipse IIoT Software Ecosystem [10.6] 産業用IoT(Industrial Internet of Things, IIoT)は最近注目のトピックとなり、IIoT OSSプロジェクトが増えている。
コードのクローン化は、ソフトウェアのメンテナンスに悪影響を及ぼす一般的なプラクティスです。
本研究は,Eclipse IIoT OSSエコシステムにおけるコードクローンの普及,進化,共同修正について検討することを目的としている。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:27:52 GMT)
Hybrid Deep Learning with Temporal Data Augmentation for Accurate Remaining Useful Life Prediction of Lithium-Ion Batteries [10.6] CDFormerは、畳み込みニューラルネットワーク、深い残留収縮ネットワーク、トランスフォーマーエンコーダを統合するハイブリッドディープラーニングモデルである。
正確で信頼性の高い予測を提供し、効果的なバッテリヘルスモニタリングとデータ駆動メンテナンス戦略をサポートする。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:19:28 GMT)
LLM Enhanced Action Recognition via Hierarchical Global-Local Skeleton-Language Model [10.1] 階層的グローバル局所骨格言語モデル(HocSLM)を提案する。
HocSLMは、大きなアクションモデルをアクションセマンティクスのより代表的なものにすることを可能にする。
3つの主流データセットで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 03:06:01 GMT)
Finding Memory Leaks in C/C++ Programs via Neuro-Symbolic Augmented Static Analysis [10.0] 本稿では,プログラム解析のためのニューロシンボリックパイプラインであるMemHintを紹介する。
MemHintはターゲットを解析し、LLMを適用して各関数をメモリアロケータ、デコロケータ、あるいはどちらも分類する。
Z3ベースの検証ステップは、各サマリを関数の制御フローグラフに対してチェックし、要求されるメモリ操作が到達不能なものを破棄する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 10:31:58 GMT)
Beyond Completion: Probing Cumulative State Tracking to Predict LLM Agent Performance [9.8] WMF-AM(Working Memory Fidelity-Active Manipulation)を紹介する。
その結果,20種類のオープンウェイトモデル (0.5B-35B, 13ファミリー) で10タスク・エージェント・バッテリを発売した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 17:25:11 GMT)
"Elementary, My Dear Watson." Detecting Malicious Skills via Neuro-Symbolic Reasoning across Heterogeneous Artifacts [9.7] MalSkillsは、悪意のあるスキル検出のための神経象徴的なフレームワークである。
5つの最先端ベースラインに対して200の現実世界スキルのベンチマークでMalSkillsを評価した。
MalSkillsは93%のF1を獲得し、ベースラインを587ポイント上回っている。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 09:12:07 GMT)
Structural Graph Probing of Vision-Language Models [9.4] 視覚言語モデル(VLM)は強力なマルチモーダル性能を実現する。
ニューロンの集団間でどのように計算が組織されるかは、いまだに理解されていない。
神経トポロジーのレンズを通してVLMを解析し、各層を層内相関グラフとして表現する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 01:14:40 GMT)
Thermal Topology Collapse: Universal Physical Patch Attacks on Infrared Vision Systems [9.1] ユニバーサル・フィジカル・パッチ・アタック(UPPA)は、赤外線領域における最初のユニバーサル・フィジカル・アタック法である。
UPPAは、オンラインの計算オーバーヘッドなしに、卓越した物理的攻撃の成功率を達成する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:02:40 GMT)
MediHive: A Decentralized Agent Collective for Medical Reasoning [9.1] 大規模言語モデル (LLM) は医学的推論タスクに革命をもたらしたが、単一エージェントシステムは複雑な学際的な問題に悩まされることが多い。
医療質問応答のための分散型マルチエージェントフレームワークであるMediHiveを紹介する。
我々の研究は、医療AIのためのスケーラブルでフォールトトレラントなD-MASを進歩させ、集中型設計の重要な限界に対処します。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:57:58 GMT)
SkillTester: Benchmarking Utility and Security of Agent Skills [9.0] SkillTesterはエージェントスキルの実用性とセキュリティを評価するツールである。
このフレームワークは、生の実行アーティファクトをユーティリティスコア、セキュリティスコア、および3レベルのセキュリティステータスラベルに正規化する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:56:18 GMT)
HMPDM: A Diffusion Model for Driving Video Prediction with Historical Motion Priors [9.0] 本稿では,動きの理解と時間的コヒーレンスを高めるために,過去の動きを利用した映像予測モデルであるHMPDMを紹介する。
Cityscapes と KITTI ベンチマークの大規模な実験により、HMPDM は最先端のビデオ予測手法よりも効率が良いことが示された。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 18:37:08 GMT)
Conformal Prediction Assessment: A Framework for Conditional Coverage Evaluation and Selection [8.8] コンフォーマル予測アセスメント(CPA)は、条件付きカバレッジを教師付き学習タスクとして再編成するフレームワークである。
条件付き妥当性指数(CVI)は信頼性を安全性(発見リスク)と効率(発見コスト)に分解する
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:30:17 GMT)
Let Triggers Control: Frequency-Aware Dropout for Effective Token Control [8.7] 我々は新しいパラメータを追加することなく制御性を改善するために周波数対応ドロップアウト(FAD)を提案する。
FADは、共起分析とカリキュラムにインスパイアされたスケジューリングの2つの重要なコンポーネントで構成されている。
本手法は,テキスト・ツー・イメージ生成における制御性とパーソナライズを向上する,シンプルで効果的なドロップアウト戦略を提供する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:55:54 GMT)
Retrieving Climate Change Disinformation by Narrative [8.4] 我々は,ナラティブ検出を検索タスクとして再編成し,ナラティブのコアメッセージをクエリとして与え,そのナラティブと整合してコーパスからテキストをランク付けする。
抽象的な記述と具体的なテキストのインスタンス化のギャップを埋めるための仮説文書を生成するフレームワークであるSpecFiを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:53:13 GMT)
MotiMem: Motion-Aware Approximate Memory for Energy-Efficient Neural Perception in Autonomous Vehicles [8.4] 高解像度センサーは、堅牢な自律認識には不可欠だが、バッテリに拘束された電気自動車に厳しい記憶壁を課す。
従来の画像圧縮は、バスの切替アクティビティではなく、意味的に盲目であり、ストレージに最適化されている。
ハードウェア・ソフトウェア共同設計インタフェースであるMotiMemを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 03:31:27 GMT)
Preconditioned Attention: Enhancing Efficiency in Transformers [8.1] 我々は,各注意頭に条件行列を組み込む新しいアプローチである,事前条件付注意を導入する。
理論的解析により,本手法は注意行列の条件数を大幅に減少させることが示された。
各種変圧器応用に適用したプレコンディショニングの有効性を検証した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 06:30:45 GMT)
Conditional Factuality Controlled LLMs with Generalization Certificates via Conformal Sampling [8.0] 大規模言語モデル(LLM)のためのemphConditional Factuality Control (CFC)を提案する。
CFCは、潜在成功率のスコアに対する拡張量子レグレッションを通じて、連続的かつ特徴条件の受け入れしきい値を定義する。
我々はCFCが交換性の下で条件付きカバレッジを保証することを示し、その短命性を分析する。
PAC方式の変種であるCFC-PACを導出し、安定性のバウンダリに基づいて名目リスクレベルを縮小する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 20:48:13 GMT)
DiffSoup: Direct Differentiable Rasterization of Triangle Soup for Extreme Radiance Field Simplification [8.0] Radiance Fieldは、マルチビューRGB画像から高品質な3D表現を復元することを目的としている。
DiffSoupは、二項不透明度を持つ少数の三角形のスープ(すなわち、高度に非構造化された集合)を用いる放射場表現である。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 06:00:57 GMT)
Dynamic resource matching in manufacturing using deep reinforcement learning [7.7] 我々は,多周期多人数生産資源マッチング問題を逐次決定プロセスとして定式化する。
モデルフリーの深層強化学習手法を用いて最適なマッチングポリシーを求める。
従来のQ-ラーニングアルゴリズムには,事前ポリシーに基づくドメイン知識に基づくペナルティと,需要供給制約に適合する不実現可能性ペナルティという2つのペナルティを導入する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:56:29 GMT)
Follow Your Heart: Landmark-Guided Transducer Pose Scoring for Point-of-Care Echocardiography [7.6] 左室放出率(LVEF)などの臨床的に影響のある測定値を評価するために,Apical 4-chamber(A4CH)ビューを用いた。
我々は、A4CHビュー取得のためのフィードバック手段を提供するマルチタスクネットワークを提案し、高品質なA4CH画像におけるLVEFを自動的に推定する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:34:48 GMT)
XAttnRes: Cross-Stage Attention Residuals for Medical Image Segmentation [7.6] Cross-Stage Attention Residuals (XAttnRes)は、エンコーダとデコーダの両方の出力を蓄積したグローバルな機能履歴プールを維持するメカニズムである。
XAttnResは、4つのデータセットと3つのイメージングモードのパフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:40:57 GMT)
NNQA: Neural-Native Quantum Arithmetic for End-to-End Polynomial Synthesis [7.5] 我々は、古典的に学習された非線形表現を、ネイティブなユニタリブロックからなる正確な量子算術にコンパイルするNative Quantum Arithmetic (NNQA)を紹介した。
IBM Quantum Heron3およびIonQ Forteプロセッサの実証的な性能は、主にデバイスノイズによって制限される。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:03:22 GMT)
Omni-Modal Dissonance Benchmark: Systematically Breaking Modality Consensus to Probe Robustness and Calibrated Abstention [7.2] OMD-Benchを導入し、すべてのモダリティが最初に一致している。
そして、各モダリティの貢献を分離するために体系的に腐敗した。
ベンチマークは8つの汚職条件で27のアンカーにまたがる4,080のインスタンスで構成されている。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:29:15 GMT)
MetaTune: Adjoint-based Meta-tuning via Robotic Differentiable Dynamics [7.0] 外乱オブザーバーに基づく制御は、不確実性に対するロボットシステムの堅牢化を約束している。
フィードバックコントローラと外乱オブザーバの協調的自動チューニングのための統合フレームワークであるMetaTuneを提案する。
本稿では,MetaTuneが最先端の微分可能なチューニング手法よりも一貫した改善を実現していることを示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:37:39 GMT)
Not Worth Mentioning? A Pilot Study on Salient Proposition Annotation [6.8] 我々は、SEE(Salient Entity extract)に関する以前の研究から、段階的な要約に基づくサリエンスをメトリクスとして採用している。
我々は、アノテーションタスクを定義し、それを小さなマルチジャンルデータセットに適用し、合意を評価し、RST(Rhetorical Structure Theory)に続く言論解析において、私たちのメートル法と談話単位中心性の概念の関係について予備的な研究を行う。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 18:09:16 GMT)
Detecting Protracted Vulnerabilities in Open Source Projects [6.7] 脆弱性のタイムリーな解決と開示は、オープンソースソフトウェアのセキュリティを維持する上で不可欠である。
本研究では,長期にわたって未解決または未開示のプロトラクション脆弱性(PVE)を分析することにより,脆弱性のライフサイクルを解明する。
本稿では,難治症例に特化して設計された拡張検出手法であるDeeptraVulを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 01:01:56 GMT)
VIRST: Video-Instructed Reasoning Assistant for SpatioTemporal Segmentation [6.4] Video Video Object (RVOS) は、自然言語による記述に基づいて、対象物をビデオに分割することを目的としている。
VIRST(Video-Instructed Reasoning Assistant for Spatio-Temporal)は,グローバルなビデオ推論と画素レベルのマスク予測を単一のモデルで統合するエンドツーエンドフレームワークである。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:34:15 GMT)
Multimodal Forecasting for Commodity Prices Using Spectrogram-Based and Time Series Representations [6.4] 本稿では,SEMF(Spectrogram-Enhanced Multimodal Fusion)を提案する。
SEMFはスペクトルと時間表現を組み合わせて、より正確で堅牢な予測を行う。
その結果,マルチモーダル融合とスペクトログラムに基づく符号化がマルチスケールパターンのキャプチャに与える影響が示された。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:57:42 GMT)
Evaluating Large and Lightweight Vision Models for Irregular Component Segmentation in E-Waste Disassembly [6.4] 本研究では,トランスフォーマーベース視覚モデルSAM2と軽量YOLOv8ネットワークを比較し,モデルアーキテクチャとスケールがセグメンテーション性能に与える影響を評価する。
どちらのモデルも、ノートパソコンコンポーネントの1,456の注釈付きRGBイメージを新たに収集したデータセットでトレーニングされ、テストされた。
YOLOv8 は SAM2 よりも高いセグメンテーション精度 (mAP50 = 98.8%、mAP50-95 = 85%) を達成した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 23:06:36 GMT)
Sparse Autoencoders as a Steering Basis for Phase Synchronization in Graph-Based CFD Surrogates [6.4] グラフベースのサロゲートモデルは、高忠実度CFDソルバに代わる高速な代替手段を提供するが、その不透明な潜在空間と制限された制御性は、安全クリティカルな設定での使用を制限する。
凍結サロゲートの潜伏空間を操作することにより, 位相ドリフトをポストホックで補正できるかどうかを問う。
本稿では、適切な表現と適切な介入機構を組み合わせた事前学習グラフベースのCFDモデルのための位相ステアリングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 07:03:44 GMT)
An End-to-end Flight Control Network for High-speed UAV Obstacle Avoidance based on Event-Depth Fusion [6.3] 本稿では,深度画像とイベントデータのレベル融合を特徴とするエンドツーエンド飛行制御ネットワークを提案する。
本手法は, 様々な場面で17m/sで70-80%の成功率を達成した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 07:57:15 GMT)
Stochastic Multipath Routing for High-Throughput Entanglement Distribution in Quantum Repeater Networks [6.0] 量子リピータネットワークは損失のあるリンク上の絡み合いを分散し、多くのユーザは絡み合ったペアの限られたプールを共有している。
既存のルーティング方式の多くは、常に単一のベストパスを使用するか、あるいはリアルタイムに実行が難しいグローバル最適化に依存している。
本稿では,複数のエッジ不連続経路の1つに沿って,各絡み合い要求をランダムに送信するマルチパスルールを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 09:06:39 GMT)
Online Learning of Kalman Filtering: From Output to State Estimation [5.9] 本稿では,オンライン最適化に基づく統一的なアルゴリズムフレームワークを提案し,出力推定と状態推定の両方のシナリオを解決する。
本稿では,提案アルゴリズムが出力推定シナリオに対して水平長$T$で$log T$-regretを達成することを示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 06:48:50 GMT)
AutoMS: Multi-Agent Evolutionary Search for Cross-Physics Inverse Microstructure Design [5.8] AutoMSは、進化的検索として逆設計を再構成する多エージェントのニューロシンボリックフレームワークである。
従来の進化戦略の「盲目」に対処する。
AutoMSは17種類のクロスフィジカルタスクにおいて、最先端の83.8%の成功率を達成する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:51:33 GMT)
Rainbow-DemoRL: Combining Improvements in Demonstration-Augmented Reinforcement Learning [5.8] オフラインで収集した実演を活用することで,オンライン強化学習(RL)のサンプル効率を向上させるために,いくつかのアプローチが提案されている。
既存の実演型RLアプローチを3つのカテゴリに分類し,その強度,弱点,組み合わせに関する実証的研究を行った。
分析の結果,オフラインデータを直接再利用し,動作のクローン化による初期化は,オンラインサンプル効率を向上させるために,より複雑なオフラインRL事前学習法よりも優れていた。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 20:34:20 GMT)
On the Loss Landscape Geometry of Regularized Deep Matrix Factorization: Uniqueness and Sharpness [5.7] ヘッセンスペクトルは正則化深部スカラー分解問題の最小値に一定であり、二乗誤差損失を持つ。
対象行列がルベーグ測度ゼロ集合に属さないなら、各層のフロベニウスノルムはすべての最小化子に対して一定である。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 01:22:01 GMT)
Spectral-Aware Text-to-Time Series Generation with Billion-Scale Multimodal Meteorological Data [5.6] 我々は,MACC(Collaborative Captioning)パイプラインを通じて構築された専門家レベルのキャプションと組み合わせた,10億規模の気象データセットであるMeteoCap-3Bを紹介した。
次に,MTransformerを提案する。MTransformerは,テキスト記述をマルチバンドスペクトルにマッピングすることで,正確な意味制御を可能にするモデルである。
実世界のベンチマーク実験では、最先端の世代品質、正確なクロスモーダルアライメント、強力なセマンティックコントロール可能性、下流予測の大幅な向上が示されている。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 04:55:00 GMT)
Kempe Swap K-Means: A Scalable Near-Optimal Solution for Semi-Supervised Clustering [5.5] 本稿では,厳密なマスタリンク制約下での制約クラスタリングのために,Kempe Swap K-Meansと呼ばれるセントロイドに基づく新しいアルゴリズムを提案する。
このアルゴリズムは、大規模データセットのクラスタリング精度とアルゴリズム効率の両方において、最先端ベンチマークを一貫して上回る。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 21:33:06 GMT)
MultiLoc: Multi-view Guided Relative Pose Regression for Fast and Robust Visual Re-Localization [5.2] RPR(Relative Pose Regression)は、目に見えない環境に一般化する。
相対的なポーズ回帰は、ペアワイズと局所的な空間ビューのためにしばしば制限される。
大規模に訓練された新しいマルチビューガイド付きRPRモデルであるMultiLocを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 07:08:38 GMT)
TokenDance: Token-to-Token Music-to-Dance Generation with Bidirectional Mamba [5.1] ミュージック・トゥ・ダンス・ジェネレーションは、仮想現実、ダンス教育、デジタルキャラクターアニメーションに広く応用されている。
TokenDanceは2段階の音楽・ダンス生成フレームワークで、二重モードのトークン化と効率的なトークンレベル生成によって、この制限を明示的に解決する。
TokenDanceは、生成品質と推論速度の両方でSOTA(State-of-the-art)のパフォーマンスを全般的に達成し、実世界の音楽/ダンスアプリケーションにおけるその効果と実用的価値を強調している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:38:14 GMT)
The Novelty Bottleneck: A Framework for Understanding Human Effort Scaling in AI-Assisted Work [4.7] 新規性ボトルネックと呼ばれるメカニズムを分離した人間とAIのコラボレーションモデルを提案する。
モデルはタスクが原子的な決定に分解されると仮定する。
私たちの貢献は、人間の努力が線形にスケールしなければならないという証拠ではありません。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 22:50:13 GMT)
Nonclassical Photon-Bundle Correlations in Quantum Rabi Models [4.7] 量子ラビモデルにおける非古典的光子束相関とその拡張事例について検討する。
我々は、光子統計挙動を豊かにする異方性結合と非線形スターク相互作用を導入する。
これらの効果は、固有のシステムパラメータをチューニングすることによってのみ制御できる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 06:56:22 GMT)
Defend: Automated Rebuttals for Peer Review with Minimal Author Guidance [4.7] 大規模言語モデル (LLM) は、しばしば、反響生成に直接使用されるとき、目標とする反響を実行し、正確な事実的根拠を維持するのに苦労する。
本稿では,自動再帰生成の基本的な推論プロセスを明示的に実行するためのLDMベースのツールであるDEFENDを紹介する。
反論をスクラッチから書くのとは対照的に、著者は最小限の介入で推論プロセスのみを実行する必要がある。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 18:12:31 GMT)
Ultralow-power coherent qubit control using AQFP logic at millikelvin temperatures [4.6] AQFP-multiplexed qubit controller with virtual Z gates (AQFP QC-VZ) を用いた超低消費電力量子ビットコントローラについて報告する。
AQFP QC-VZは、キュービット当たり111pWの超低消費電力のキュービット制御用のマルチトンマイクロ波パルスを生成する。
AQFP QC-VZの中核成分であるAQFPミキサーを用いて、10mK段階におけるコヒーレント単一量子ゲートのコヒーレンス劣化を示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 10:55:52 GMT)
K$α$LOS finds Consensus: A Meta-Algorithm for Evaluating Inter-Annotator Agreement in Complex Vision Tasks [4.3] 本稿では,「ローカライゼーションファースト」の原理を一般化した統一メタアルゴリズムであるK$LOSを提案する。
合意を査定する前に空間対応を解消することにより,複雑な分類問題を名目上の信頼性に変換する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:54:05 GMT)
Human-Centric Perception for Child Sexual Abuse Imagery [4.1] 児童性虐待画像(CSAI)の報告を扱う法執行機関や非法執行機関は、大量のデータに圧倒されている。
CSAI分類法は、しばしばブラックボックスのアプローチに依存し、ポルノグラフィのような広く抽象的な概念をターゲットにしている。
ポーズ推定と検出を同時に行うために,BKP-AssociationとYOLO-BKPという2つの手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:41:36 GMT)
Decoherence-Free Qubit and Chiral Emission from a Giant Molecule in Waveguide QED [3.9] 我々は,光導波路に結合した人工原子と強く相互作用する巨大分子が,完全に非コヒーレンスな量子ビットと状態依存のキラル単一光子放出を実現することを示す。
単一デバイスにおけるデコヒーレンス保護と指向性放出の共存は、導波路QEDにおけるモジュラ量子ネットワークのための保護キラルノードとして巨大分子を配置する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 23:22:35 GMT)
Structured Exploration and Exploitation of Label Functions for Automated Data Annotation [3.8] プログラムラベリングはラベル関数(LF)、すなわちデータセットのトレーニングに弱いラベルを自動的に生成するルールを使用する。
本稿では,多様性と信頼性のバランスをとるプログラムラベリングの自動化フレームワークであるEXPONAを紹介する。
実験の結果、EXPONAは最先端のLF自動生成手法よりも一貫して優れていた。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 04:19:33 GMT)
Zero-shot Vision-Language Reranking for Cross-View Geolocalization [3.8] クロスビューなジオローカライズシステムは、しばしば1つのベストマッチを特定するのに失敗する(Top-1の精度が低い)。
本研究は、このギャップに対処するために、ゼロショットビジョンランゲージモデル(VLM)をリランカーとして使用することを検討する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:57:41 GMT)
Maximin Learning of Individualized Treatment Effect on Multi-Domain Outcomes [3.6] 我々は,高次元アイテムレベルのデータからロバストな処理効果を推定する新しいフレームワークであるDRIFTを提案する。
DRIFTは一般化因子解析により潜在構造を学習し、固定されたターゲット上の不確実性集合を構成する。
この不確実性集合に対して最悪の性能を最適化することにより、DRIFTは、未表現または未測定領域に対して堅牢なITTを生成する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 03:50:22 GMT)
Enhancing Online Support Group Formation Using Topic Modeling Techniques [3.6] 自動支援グループ形成のための2つの新しい機械学習モデルを提案する。
我々は,200万以上のユーザ投稿からなる大規模データセットをMedHelpから評価した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 02:00:34 GMT)
Bayes-MICE: A Bayesian Approach to Multiple Imputation for Time Series Data [3.5] MICE(Multiple Imputation by Chained Equations)は、条件付き仕様によって欠落した値を出力する。
我々はベイズフレームワーク(Bayes-MICE)を用いてMICEを拡張し、マルコフ連鎖モンテカルロサンプリングによる欠落値のインプットを行う。
実世界の2つのデータセットを用いてベイズ・マイス法の評価を行った。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:34:47 GMT)
Amalgam: Hybrid LLM-PGM Synthesis Algorithm for Accuracy and Realism [3.5] Amalgamは、高度な分析、リアリズム、具体的なプライバシー特性をサポートするハイブリッドLLM-PGMデータ合成アルゴリズムである。
Amalgam は平均 91 % 2 P$ の値でデータを合成し,提案したメトリクスを用いて実数主義のスコア 3.8/5 を求める。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 12:10:46 GMT)
SCOPE: Tree-based Self-Correcting Online Log Parsing via Syntactic-Semantic Collaboration [3.3] SCOPEは、最初の自己修正オンラインログ解析手法である。
LLMベースのパラダイムとLLMベースのパラダイムの長所を統合する。
精度と効率の両方で最先端の手法より優れています。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:45:08 GMT)
When Verification Hurts: Asymmetric Effects of Multi-Agent Feedback in Logic Proof Tutoring [3.2] 大規模言語モデル(LLM)は、自動化チュータリングにますます使われているが、構造化された記号領域における信頼性は未だ不明である。
本研究では,学習者の現在の証明状態に整合した記号的推論を必要とする命題論理導出証明のステップレベルフィードバックについて検討する。
ステップレベルのアノテーションと難易度を持つ516個のユニークな証明状態の知識グラフ付きベンチマークを導入する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 01:35:59 GMT)
FontCrafter: High-Fidelity Element-Driven Artistic Font Creation with Visual In-Context Generation [3.1] アーティスティックフォント生成は、参照スタイルに基づいてスタイリングされたグリフを合成することを目的としている。
既存のアプローチは、限られたスタイルの多様性と粗いコントロールに悩まされている。
フォント作成のための要素駆動フレームワークであるFontCrafterを紹介する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 19:37:24 GMT)
The Price of Meaning: Why Every Semantic Memory System Forgets [3.0] すべての主要なAIメモリシステムは、意味によって情報を整理するが、価格は高い。
その組織は、一般化、アナロジー、概念検索を可能にします。
一般化を可能にする同じ幾何学的構造が干渉、脆弱性、虚偽のリコールを引き起こすことを証明している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 04:01:59 GMT)
Weakly Convex Ridge Regularization for 3D Non-Cartesian MRI Reconstruction [2.8] 我々は回転不変な弱凸リッジ正規化器(WCRR)を訓練する。
提案手法は,GoLF SPARKling と CAIPIRINHA の買収について,再現的シミュレーションデータと (分布外) の美術手法の状態を比較検討した。
当社のアプローチは,広く使用されているベースラインを一貫して上回り,3D DRUNetデノイザの状態を伴ってPlugとPlayの再構築に匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 06:48:06 GMT)
Text Data Integration [2.7] 本章では,テキストデータの統合を事例として,その課題,技術状況,オープンな課題について述べる。
これまで、ほとんどのデータ統合システムは、構造化されたデータソースの組み合わせにのみ依存してきた。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:03:41 GMT)
Sparse Goodness: How Selective Measurement Transforms Forward-Forward Learning [2.7] 良さ関数の設計空間について検討し、どのアクティベーションを測るか、どのように集約するかを考察する。
我々は、最も活動的なニューロンのkのみを評価するトップクオリティを導入し、SoSを著しく上回っていることを示す。
我々は4x2000アーキテクチャでFashion-MNISTの87.1%の精度を達成し、SoSベースラインよりも30.7%改善した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 23:11:21 GMT)
Predictive Modeling in AUV Navigation: A Perspective from Kalman Filtering [2.6] 本稿では,自律型水中車両(AUVs)の枠組みについて述べる。これは,局部化精度の向上,軌道予測の向上,通信損失時の効率的な探索操作を支援する。
筆者らのフレームワークは,Kalmanフィルタと不確実性伝搬を用いてマルチブイ音響データを融合し,ナビゲーションの精度を維持し,通信損失時の堅牢な探索領域定義を導出する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 21:47:22 GMT)
Routing Sensitivity Without Controllability: A Diagnostic Study of Fairness in MoE Language Models [2.5] 本稿では,経路レベルのステレオタイプ介入の限界を調査するための診断フレームワークであるFairness-Aware Equilibrium(FARE)を紹介する。
FAREは、ルーティングレベルの優先順位変更は達成不可能(Mixtral、Qwen1.5、Qwen3)、統計的に非ロバスト(DeepSeekMoE)、あるいはかなりのユーティリティコストを伴うことを明らかにしている。
これらの結果から,ルーティング感度はステレオタイプ制御には不十分であり,より制御可能な将来のMoEシステムの設計を通知する,特定のアーキテクチャ条件を特定する必要があることが示唆された。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:33:42 GMT)
A Tight Expressivity Hierarchy for GNN-Based Entity Resolution in Master Data Management [2.4] 型付き実体属性グラフ上での4つの理論分離理論を証明する。
各述語について、我々は厳密な境界を証明し、必要な適応を欠く全てのMPNNによって証明不可能なグラフペアを構築する。
実践者は、より単純なアーキテクチャが機能しないことを保証するため、最も安価な適応セットを選択できる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 06:38:03 GMT)
Can pre-trained Deep Learning models predict groove ratings? [1.7] 本研究では,深層学習モデルが音声信号から直接溝とその関連する知覚次元を予測できる範囲について検討する。
溝評価と溝関連クエリに対する応答を予測するため、7つの最先端ディープラーニングモデルの有効性を批判的に検討する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:20:38 GMT)
Attacks on Sparse LWE and Sparse LPN with new Sample-Time tradeoffs [1.7] 我々は、決定的な$k$-sparse Learning With Errors (LWE)と$k$-sparse Learning Parity with Noise (LPN)問題に対してアルゴリズムを提供する。
スパースLWE/LPNインスタンス用の菊池グラフを作成し、これらの問題に対して2つの攻撃を与える。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:32:00 GMT)
Persona-Based Simulation of Human Opinion at Population Scale [1.5] SPIRITは予測ではなくシミュレーション用に明示的に設計されたフレームワークである。
心理学的に根ざした半構造化されたペルソナを公共のソーシャルメディア投稿から推測する。
Ipsos KnowledgePanelを用いて、SPIRIT条件のシミュレーションにより、人口動態よりも自己報告された回答をより忠実に回収できることを示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:10:57 GMT)
Path-Following Guidance for Unmanned Aerial Vehicle with Bounded Lateral Acceleration [1.4] 本稿では, 無人航空機の3次元経路追従誘導問題について, 明示的アクチュエータ制約下での考察を行う。
ネストした飽和度に基づく制御技術を用いて非線形誘導フレームワークを開発した。
提案手法は,クロストラック誤差の指数収束を0に保ちながら,有界制御入力を保証する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 07:28:18 GMT)
GUARD-SLM: Token Activation-Based Defense Against Jailbreak Attacks for Small Language Models [1.4] 小型言語モデルは、計算コストとレイテンシを大幅に低減した競争性能を提供する。
既存のジェイルブレイク防御は、異種攻撃に対するロバスト性に制限がある。
本稿では,悪質なプロンプトをフィルタリングする軽量なトークンアクティベーションベースのGUARD-SLMを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 19:17:46 GMT)
A Multi-agent AI System for Deep Learning Model Migration from TensorFlow to JAX [1.4] Googleは、何十ものプロダクトにまたがって機械学習の利用を開拓してきた。
さまざまなMLフレームワークやバージョンで多数のモデルソースコードを維持することは、大きな課題です。
我々は、ディープラーニングモデルからJAXベースのモデルへの自動移行をサポートするために構築した、AIベースのマルチエージェントシステムについて説明する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:59:40 GMT)
Debiasing Large Language Models toward Social Factors in Online Behavior Analytics through Prompt Knowledge Tuning [1.4] 帰属論は、個人が社会的文脈における他人の行動を、個人的(偏在的)および非個人的(直観的)因果性(situational)を用いてどのように評価するかを説明する。
人為的なコーパスに基づいて訓練された大規模言語モデル(LLM)は、社会的帰属過程を社会的文脈で暗黙的に模倣する可能性がある。
本稿では,社会的帰属知識を用いた2つの迅速な援助により,LSMの指示プロンプトを充実させることにより,そのようなバイアスを軽減するスケーラブルな手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:15:40 GMT)
Improving Automated Wound Assessment Using Joint Boundary Segmentation and Multi-Class Classification Models [1.1] 本研究は, 創境界セグメンテーション (WBS) と創分類 (WC) を同時に行う YOLOv11 に基づく深層学習モデルを提案する。
その結果、複雑な背景に対するモデルの堅牢性とクラス内変動性が高いことが確認できた。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 16:11:31 GMT)
Quantum-enhanced estimation of signal field amplitudes with critical squeezed states of photonic modes [1.1] 本稿では、外部信号場の振幅を相互作用する量子光子系で推定することを目的とした臨界量子センシングプロトコルを提案する。
信号場振幅に関する情報は量子化フォトニックモードの1つの4分の1に符号化され、臨界点付近で発散挙動を示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 02:40:01 GMT)
Embedding Provenance in Computer Vision Datasets with JSON-LD [1.1] Provenanceは、画像データセットなど、あるリソースの起源と派生に関する情報を提供する。
コンプライアンスを確保し、監査をサポートし、再利用性を向上させることで、データのメンテナンスにも役立ちます。
本稿では,画像の鮮明さを管理可能で一貫性のあるフォーマットで構築する新しいスキーマを提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 17:39:57 GMT)
EuraGovExam: A Multilingual Multimodal Benchmark from Real-World Civil Service Exams [0.8] EuraGovExamは、ユーラシアの5つの地域における実際の公務員試験から得られたベンチマークである。
データセットには17の学術および行政領域をカバーする、8,000以上の高解像度スキャンされた多重選択質問が含まれている。
また、e-governance、パブリックセクター文書分析、公平な試験準備における実践的な応用もサポートする。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 10:29:51 GMT)
Active In-Context Learning for Tabular Foundation Models [0.7] Tabular Active In-Context Learning (Tab-AICL) を形式化し、4つの取得ルールでインスタンス化する。
20の分類ベンチマークで、Tab-AICLは、トレーニングされた勾配ブースティングベースラインよりもコールドスタートサンプル効率を改善する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 19:37:13 GMT)
On the Relationship between Bayesian Networks and Probabilistic Structural Causal Models [0.7] 本研究では,確率的グラフィカルモデル,特にベイズ的ネットワークと因果図の関係について検討する。
線形代数と線形計画法が変換の鍵となる方法であることを示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 20:59:39 GMT)
A Reference Architecture for Agentic Hybrid Retrieval in Dataset Search [0.6] アドホックデータセット検索では、未特定の自然言語クエリとスパースで異質なメタデータレコードとをマッチングする必要がある。
本稿では,BM25語彙探索と密埋め込み検索を組み合わせたエージェントハイブリッド検索のための有界・監査可能な参照アーキテクチャを提案する。
ユーザ意図とプロバイダが承認したメタデータとの語彙ミスマッチを低減するために、オフラインメタデータ拡張ステップが導入される。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 22:56:57 GMT)
A Comparative Study in Surgical AI: Datasets, Foundation Models, and Barriers to Med-AGI [0.6] マルチビリオンパラメータモデルと広範囲なトレーニングでさえ、現在のビジョン言語モデルは、神経外科におけるツール検出の一見単純なタスクにおいて不足していることを示す。
これらの制約の主なコントリビュータと潜在的なソリューションについて論じる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 17:18:40 GMT)
Quantum Hall States response to toroidal geometry deformation [0.5] 平面トロイダル変形と非平坦クラートロイダル変形の2種類の変形を考察する。
トロイダル幾何の進化とラウリン状態の明示的な解析式が特異点へ至る所で見つかる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:56:10 GMT)
Liquid Networks with Mixture Density Heads for Efficient Imitation Learning [0.5] 我々は,Push-T,RoboMimic Can,PointMazeの拡散ポリシに対して,混合密度ヘッドと液体ニューラルネットワークを比較した。
タスク全体では、液体ポリシーはパラメータの約半分を使い、2.4倍低いオフライン予測エラーを達成し、推論では1.8倍高速に実行される。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 00:18:52 GMT)
ARTLAS: Mapping Art-Technology Institutions via Conceptual Axes, Text Embeddings, and Unsupervised Clustering [0.5] ARTLASは78の文化技術機関を統一的な分析空間にマッピングする計算手法である。
UMAPを用いた次元減少と凝集クラスタリングにより合成スコアが0.825、シルエット係数が0.803、カリンスキー・ハラバス指数が11,196となる。
Reactで構築されたインタラクティブなWebベースの可視化ツールにより、ステークホルダは、制度的な類似性、テーマプロファイル、学際的な接続を探索することができる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 17:09:17 GMT)
Red-MIRROR: Agentic LLM-based Autonomous Penetration Testing with Reflective Verification and Knowledge-augmented Interaction [0.4] 本稿では,新しいマルチエージェント自動浸透試験システムであるRed-MIRRORを提案する。
Red-MIRRORは、エージェント間推論を明示的に管理するために、密結合したメモリリフレクションバックボーンを導入している。
XBOWベンチマークとVulhub CVEの実証評価は、Red-MIRRORが最先端エージェントに匹敵するパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 04:34:09 GMT)
Pan-Cancer Mapping of the Tumor Immune Landscape through Metagene Clustering and Predictive Modeling [0.4] 免疫プロファイリングの進歩にもかかわらず、免疫表現型を誘導するメカニズムは未だ不明である。
本研究は、新規で堅牢な免疫関連遺伝子クラスター(メタゲイン)の同定を目的とする。
遺伝子は高発現群と低発現群の差分表現によってランク付けされた。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:38:40 GMT)
The Hidden Costs of AI-Mediated Political Outreach: Persuasion and AI Penalties in the US and UK [0.3] 我々は、政治キャンペーンのアウトリーチのために、AI対応システムのコミュニケーション実践をどのように評価するかを検討する。
2つの評価罰に対する一貫した証拠を見いだす。
自動化アウトリーチが広まるにつれ、人々が民主的コミュニケーションにとって重要であると判断する方法が広まる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 21:22:02 GMT)
CarbonEdge: Carbon-Aware Deep Learning Inference Framework for Sustainable Edge Computing [0.3] ネットワークエッジにおけるディープラーニングの応用は、AI関連の二酸化炭素排出量の大幅な増加につながります。
既存のエッジコンピューティングフレームワークはレイテンシとスループットを最適化しているが、推論ワークロードの環境への影響を無視している。
本稿では,炭素フットプリント推定とグリーンスケジューリング能力を備えた適応モデル分割を拡張可能な,炭素対応ディープラーニング推論フレームワークであるCarbonEdgeを紹介する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 21:41:58 GMT)
The Risk Quadrangle in Optimization: An Overview with Recent Results and Extensions [0.3] 本稿では,リスク四角形(RQ)のRockafellarとUryasevevによる2013年の開発を再考し,拡張する。
RQはリスク、偏差、最適化、エラーという4つの機能と関連する統計と双対性を備えている。
新たな四角形、超量子ノルム、期待値、バイアス平均、量子対称平均結合は、リスクに敏感な意思決定に対する新しいアプローチを提供する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 18:35:16 GMT)
AstraAI: LLMs, Retrieval, and AST-Guided Assistance for HPC Codebases [0.3] 本稿では,高性能コンピューティング(HPC)ソフトウェア開発のためのコマンドラインインタフェース(CLI)コーディングフレームワークであるAstraAIを紹介する。
AstraAIは、Linux端末内で直接動作し、大規模な言語モデル(LLM)とRetrieval-Augmented Generation(RAG)とAST(Abstract Syntax Tree)ベースの構造解析を統合する。
本稿では,AstraAI による AMReX における代表的 HPC コード生成タスクの実証を行う。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 21:49:05 GMT)
Mitigating Hallucination on Hallucination in RAG via Ensemble Voting [0.3] Retrieval-Augmented Generation (RAG) は、大規模言語モデル(LLM)における幻覚を減らすために、外部知識を統合することを目的としている。
VOTE-RAGは,2段階構造と効率よく並列化可能な投票機構を備えた,新しい学習自由フレームワークである。
我々の研究は、単純で信頼性の高いアンサンブル投票がRAG幻覚を緩和するための優れた、より効率的な方法であることを実証している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 12:07:30 GMT)
TrendGen: An Outfit Recommendation and Display System [0.3] TrendGenは、インテリジェントな服装推奨でオンラインショッピングを強化するために設計されたファッションAIシステムである。
生産データに対する評価は、TrendGenの一貫性のある高品質な衣装とレイダウンイメージを示している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 13:11:29 GMT)
Non-Unitary Quantum Machine Learning: Fisher Efficiency Transitions from Distributed Quantum Expressivity [0.2] 量子機械学習は、古典的なアプローチに比べて実用上の優位性について精査されている。
本研究は,Linear Combination of Unitariesフレームワークを用いて実装された,非ユニタリ量子機械学習の体系的評価を示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 19:03:05 GMT)
CounterMoral: Editing Morals in Language Models [0.2] 我々は、現在のモデル編集技術が道徳的判断をどの程度修正するかを評価するために作られたベンチマークデータセットであるCounterMoralを紹介する。
複数の言語モデルに様々な編集手法を適用し,その性能を評価する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 17:13:30 GMT)
Greedy Is a Strong Default: Agents as Iterative Optimizers [0.2] ランダムな提案生成装置をLCMエージェントに置き換え、評価診断を理由として情報付き候補を提案する。
離散的,混合的,連続的な検索空間にまたがる4つのタスクを評価する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 21:26:40 GMT)
RoMathExam: A Longitudinal Dataset of Romanian Math Exams (1895-2025) with a Seven-Decade Core (1957-2025) [0.2] RoMathExam (RoMathExam) は、1895年から2025年までのルーマニアの高校数学試験の時系列データセットである。
データセットには、複数のトラックにまたがる600以上の完全な試験セットにまとめられた10,592の数学問題が含まれている。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 13:29:54 GMT)
Context-Aware Phishing Email Detection Using Machine Learning and NLP [0.1] 本稿では,機械学習によるフィッシングメール検出システムを提案する。
本システムは,メールコンテンツ全体からコンテキスト特徴を抽出することにより,電子メールを分類する。
このシステムは、FastAPIバックエンドを備えたWebアプリケーションとしてデプロイされ、平均応答時間127msのリアルタイムフィッシング分類を提供する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 16:13:48 GMT)
K-Means Based TinyML Anomaly Detection and Distributed Model Reuse via the Distributed Internet of Learning (DIoL) [0.1] 本稿では、リソース制約マイクロコントローラ(MCU)用に設計された軽量なK-Means異常検出モデルと分散モデル共有ワークフローを提案する。
ミニ冷蔵庫からの実力測定を用いて、デバイス上の特徴抽出、クラスタリング、しきい値推定を行い、異常な機器の挙動を識別する。
各デバイス上のモデルの再トレーニングを回避するため,あるMCUでトレーニングされたモデルを移植可能なテキストベース表現としてエクスポートし,他のデバイス上で直接再利用することを可能にする分散学習インターネット(DIoL)を導入する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 20:19:39 GMT)
Fully Autonomous Z-Score-Based TinyML Anomaly Detection on Resource-Constrained MCUs Using Power Side-Channel Data [0.1] 本稿では,低消費電力マイクロコントローラに実装した完全自律型Tiny Machine Learning (TinyML) Z-Scoreによる異常検出システムを提案する。
異常は軽量なZスコアしきい値を用いて検出され、組み込み配置に適した解釈可能かつ計算効率の良い推論が可能である。
結果は、精度1.00の精度とリコール、数十マイクロ秒の推論レイテンシ、メモリフットプリント全体の約3.3KBと63KBのフラッシュの完全な検出性能を示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 20:15:50 GMT)
Simulating Human Cognition: Heartbeat-Driven Autonomous Thinking Activity Scheduling for LLM-based AI systems [0.1] 大きな言語モデル(LLM)エージェントは、しばしば堅固で反応性のある制御フローに悩まされる。
心拍駆動型自律思考活動スケジューリングについて紹介する。
我々のシステムは、認知モジュールの動的レパートリーをオーケストレーションするために、周期的な心拍のメカニズムを使用している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 08:58:03 GMT)
Voice-based debate with an AI adversary is associated with increased divergent ideation [0.0] 生成的AIとの相互作用が人間の認知を均質化するという懸念は、主にテキストベースの相互作用の証拠に基づいている。
本研究では,これらのパターンがAI自体よりもコミュニケーションモダリティに依存しているかどうかを検討する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 01:23:38 GMT)
Unsupervised Evaluation of Deep Audio Embeddings for Music Structure Analysis [0.0] 音楽構造分析(MSA)は、高いレベルの楽曲組織を明らかにすることを目的としている。
そこで本研究では,MSAによる9つのオープンソース,汎用的な事前学習型ディープオーディオモデルの教師なし評価を提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 10:18:54 GMT)
Trade-off between coherence and heat in a non-Markovian dephasing dynamics [0.0] 量子コヒーレンスが熱力学的挙動にどのように影響するかは、量子熱力学において未解決の問題である。
我々は、中心量子ビットが有限イジングのようなスピン環境と相互作用する純粋退化フレームワークの中で、この関係を考察する。
系の内部エネルギーは一定であるが、相互作用はデコヒーレンスを引き起こし、非自明な熱力学的特徴を引き起こす。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 19:37:56 GMT)
Towards High-Quality Machine Translation for Kokborok: A Low-Resource Tibeto-Burman Language of Northeast India [0.0] コクボロクMT(KokborokMT)は、インド・トリプラ州で主に話されているチベット・ビルマ語(英語版)の言語であるコクボロク(ISO 639-3)の高品質なニューラルマシン翻訳(NMT)システムである。
我々は,NLLB-200蒸留600Mモデルを36,052文対からなる多ソース並列コーパス上で微調整する。
我々の最良のシステムは、事前に公表された結果よりも大幅に改善されたテストセット上でのBLEUスコア17.30と38.56を達成する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 18:20:13 GMT)
Topological Detection of Hopf Bifurcations via Persistent Homology: A Functional Criterion from Time Series [0.0] 位相データ解析の枠組みにTakensを組み込んだ位相空間再構成に適用した持続的ホモロジーに基づいて,時系列から直接ホップ分岐を検出するためのフレームワークを提案する。
その結果、トポロジカル位相遷移としての動的遷移の解釈を支援し、非線形時系列の定量的解析のためのモデルフリーツールとしてのトポロジカルデータ解析の可能性を示した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 20:25:38 GMT)
Time of arrival on a ring and relativistic quantum clocks [0.0] 我々は、量子場理論(QFT)の中で問題を完全に定式化して、環上移動に制約された相対論的粒子の時変問題について検討する。
本稿では,QFTから直接観測可能時間に対する正の演算値尺度(POVM)のクラスを導出するために,量子時間確率(QTP)法を用いる。
半古典的および完全量子的状態における検出確率を解析し、関連する時間スケールと場の理論的パラメータへの依存性を同定する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:34:28 GMT)
The impact of multi-agent debate protocols on debate quality: a controlled case study [0.0] マルチエージェント討論システムにおける3つの主要なプロトコルを比較した。
RA-CRはエージェントを動的にリオーダーし、外部のジャッジモデルを介して1ラウンドずつサイレントする。
その結果、相互作用(ピア参照率)と収束(合意形成)のトレードオフが明らかになった。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:36:56 GMT)
The Shrinking Sweet Spot: How Algorithms, Institutions, and Social Priors Shape Musical Ecosystems [0.0] 我々は、露出、社会的影響、制度的ゲートキーピング、アルゴリズム的キュレーションが、リスナーが好むものを形成するためにどのように作用するかを示す。
我々はこれを、嗜好、情報、消費環境が共進化する逐次選択モデルとして定式化する。
我々はこの枠組みを4つの全国的な音楽エコシステムに対して検証する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 16:56:30 GMT)
The Geometry of Harmful Intent: Training-Free Anomaly Detection via Angular Deviation in LLM Residual Streams [0.0] 本研究では,大規模言語モデルにおける残差ストリームアクティベーションの幾何を分析し,有害なプロンプトを検出するためのトレーニング不要な方法であるLatentBiopsyを提案する。
我々はQwen3.5-0.8BファミリーとQwen2.5-0.5Bファミリーの2つの完全モデル三重項を評価した。
latentBiopsyは、有害なvs-ノルミティブ検出のためのAUROC$geq$0.937と、良性攻撃的プロンプトから有害なプロンプトを識別するためのAUROC = 1.000を達成している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 21:19:58 GMT)
The Geometric Cost of Normalization: Affine Bounds on the Bayesian Complexity of Neural Networks [0.0] 重み行列の局所学習係数(LLC)を正確に$m/2$とすることで、LayerNormの平均中心ステップを線形超平面に収束させることを証明した。
さらに、Softmaxの単純なデータに"smuggled bias"を導入し、明示的な下流バイアスと組み合わせると、同じ$m/2$ LLCのドロップを起動することを示す。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 22:15:45 GMT)
Structural Stress and Learned Helplessness in Afghanistan: A Multi-Layer Analysis of the AFSTRESS Dari Corpus [0.0] AFSTRESSは、ダリで初の自己報告型ストレス物語の多ラベルコーパスである。
アフガニスタンの個人から収集された737の回答が、現在進行中の人道的危機の中で含まれている。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:04:53 GMT)
StretchCast: Global-Regional AI Weather Forecasting on Stretched Cubed-Sphere Mesh [0.0] 可変解像度拡張立方体球(SCS)メッシュ上に構築されたグローバルリージョンのAI予測フレームワークであるStretchCastを紹介する。
本研究では,一段階予測器であるSCS_Base Modelとロールアウト指向多段階予測器であるSCS_FCST4 Modelを開発し,SCSベースの予測の実現可能性を検証する。
83Mパラメータとトレーニングコストを時間順に設定することで、SCS_FCST4 Modelはターゲット領域に競合する中距離異常相関進化を提供する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:40:29 GMT)
Spin--valley--resolved tunneling through magnetic barriers in WSe$_2$ [0.0] スピン軌道結合,スピン・バレー分極,伝導性に着目した WS$e$ の電子的性質に及ぼす磁場の影響について検討する。
我々の数値結果は、K$谷を通り抜ける確率はK$谷を通り抜ける確率よりも高いことを示している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 19:36:19 GMT)
Sovereign Context Protocol: An Open Attribution Layer for Human-Generated Content in the Age of Large Language Models [0.0] Sovereign Context Protocolは、大規模言語モデルと人為的コンテンツの間の属性対応データアクセス層として機能する。
SCPは6つのコアメソッド(クリエータプロファイル、セマンティック検索、コンテンツ検索、信頼/価値評価、信頼性検証、アクセス監査)を、RESTとMPP互換インターフェースの両方で公開している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 02:28:41 GMT)
SocialWise: LLM-Agentic Conversation Therapy for Individuals with Autism Spectrum Disorder to Enhance Communication Skills [0.0] SocialWiseはブラウザベースのアプリケーションで、会話エージェントと治療的検索強化生成(RAG)知識ベースを組み合わせている。
ユーザはシナリオを選択し、テキストや音声で対話し、トーン、エンゲージメント、代替のフレーズに関するインスタントで構造化されたフィードバックを受け取る。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 20:26:07 GMT)
Single Artificial Atom SASER [0.0] オルソドックス量子力学の影響であるLasingは1955年に発見され、1964年にノーベル物理学賞を受賞した。
超伝導3レベル量子系(人工原子)に結合した石英上の表面音響波(SAW)共振器を用いた単一人工原子SASER(Stimulated Emission of Radiation)の音響増幅実験を行った。
線幅を著しく狭めることで波動と強い自己放出を観測し, システム内で発生したフォノン数は90。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 20:36:03 GMT)
Semantic Interaction Information mediates compositional generalization in latent space [0.0] 我々は、静止部分観測可能なマルコフ決定過程(POMDP)である認知グリッドワールドを開発する。
観測は複数の潜伏変数によって共同で生成されるが、フィードバックは1つのゴール変数に限られる。
本研究では,これらのインタラクションを備えたリカレントニューラルネットワーク(RNN)を分析し,意味的相互作用情報(SII)がEcho状態とフルトレーニングネットワークの精度ギャップを説明する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 04:46:44 GMT)
Self-Describing Structured Data with Dual-Layer Guidance: A Lightweight Alternative to RAG for Precision Retrieval in Large-Scale LLM Knowledge Navigation [0.0] 大きな言語モデル(LLM)は、長い入力コンテキストを処理する際に、よく文書化された位置バイアスを示す。
これにより、コンテキストに直接大きな構造化知識ベースを組み込む知識検索アプリケーションが制限される。
本稿では,構造化されたデータファイルがファイルのプライマリ位置にある人為的なナビゲーションメタデータを埋め込む軽量なフレームワークである自己記述型構造化検索(SDSR)を提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:12:43 GMT)
Seed1.8 Model Card: Towards Generalized Real-World Agency [0.0] Seed1.8は、一般化された現実世界のエージェンシーを対象とした基礎モデルである。
シングルターン予測から、マルチターンインタラクション、ツール使用、マルチステップ実行まで、さまざまです。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 03:37:39 GMT)
Scalable Maximum Entropy Population Synthesis via Persistent Contrastive Divergence [0.0] 人口統計データから合成個体群を生成するための原則的枠組みを提示する。
GibbsPCDrは、有効なサンプルサイズを持つ人口を$Neff approx 0.012と比較し、エージェントベースの都市シミュレーションに欠かせない$86.8倍の多様性の利点を生んでいる。
GibbsPCDrは[0.010, 0.018]$で$MREを維持します。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:36:20 GMT)
SafetyDrift: Predicting When AI Agents Cross the Line Before They Actually Do [0.0] SafetyDriftモデルでは、安全軌道をマルコフ連鎖の吸収として扱う。
コミュニケーションタスクでは、軽度のリスク状態にまで達するエージェントは、5段階以内に安全を侵害する確率が85%である。
これらのモデル上に構築されたモニターは94.7%の違反を検知し、3.7ステップの事前警告を無視可能な計算コストで行う。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:52:04 GMT)
Robust Global-Local Behavior Arbitration via Continuous Command Fusion Under LiDAR Errors [0.0] 本稿では、2つのコントローラの出力を融合させるROS2ネイティブ仲裁モジュールを提案する。
各制御ステップにおいて、両コントローラはAckermannコマンドを提案し、PPO訓練されたポリシーはコンパクトな特徴観察から連続ゲートを予測する。
本研究は,計画レベルの相互作用推論の代替としてではなく,モジュール型ROS2環境でのコマンドレベルのロバスト性評価を意図している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:09:55 GMT)
Retrospective Counterfactual Prediction by Conditioning on the Factual Outcome: A Cross-World Approach [0.0] 我々は、$(x,y)=mathbbE[Y(1)mid X=x,Y(0)=y]$を推定する問題を研究する。
我々はNeyman-Rubin超人口モデルの下で有効な予測間隔を構築する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 15:56:45 GMT)
Online Inertia Tensor Identification for Non-Cooperative Spacecraft via Augmented UKF [0.0] 本稿では,非協調ターゲット宇宙船の相対的な6-DOFポーズと全慣性テンソルを共同で推定するための拡張アンセント・カルマンフィルタ(UKF)フレームワークを提案する。
提案アーキテクチャは,単眼視に基づく畳み込みニューラルネットワーク(CNN)の視覚計測をLiDARの深度情報と融合させて,剛体力学の結合を制約する。
慣性テンソルの6つの独立要素を含む状態ベクトルを増大させることで、基底ベースの事前校正を必要とせず、ターゲットの正規化質量分布をリアルタイムで動的に復元する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 18:13:03 GMT)
On the Spectral Geometry of Cross-Modal Representations: A Functional Map Diagnostic for Multimodal Alignment [0.0] 我々は、独立に訓練された視覚(DINOv2)と言語(All-MiniLM-L6-v2)エンコーダのクロスモーダルアライメントについて検討した。
両エンコーダのラプラシア固有値スペクトルは定量的に類似していることがわかった。
モデルは、どれだけの構造を捉えているかに収束するが、その組織化の仕方には及ばない。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 04:20:54 GMT)
Mind The Gap: How The Technical Mechanism Of Agentic AI Outpace Global Legal Frameworks [0.0] 第1条では、公共機関、国際機関、国家規制機関、および民間部門がエージェント人工知能をどのように定義しているかに関する、最初の体系的な比較調査を提示する。
EU AI Act、OECD/G7原則、NIST、UK ICO、欧州委員会を含む11の規制機関と業界フレームワークを分析し、この研究は永続的な定義上のギャップを示している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 01:35:58 GMT)
MD-RWKV-UNet: Scale-Aware Anatomical Encoding with Cross-Stage Fusion for Multi-Organ Segmentation [0.0] MD-RWKV-UNetは,スケールアウェア表現と空間適応型コンテキストモデリングを実現する動的エンコーダネットワークである。
MD-RWKVブロックは、変形可能な空間シフトとReceptance Weighted Key Valueメカニズムを統合するデュアルパスモジュールである。
並行して、クロスステージなデュアルアテンション・フュージョン戦略はエンコーダ全体の多レベル特徴を集約し、セマンティック一貫性を保ちながら低レベル構造を保存する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 12:53:50 GMT)
Interpretable Physics Extraction from Data for Linear Dynamical Systems using Lie Generator Networks [0.0] 本稿では,構成されたジェネレータAを学習し,行列化によって直接トラジェクトリを計算するLie Generator Networks (LGN)を紹介する。
A = S - D(スクイー対称性のマイナス正の対角線)をパラメータ化することで、安定性と散逸は基礎となるアーキテクチャから生じる。
100次元安定RCCはしごでは、標準微分に基づく最小二乗系同定が不安定な固有値が得られる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 23:20:33 GMT)
Inference-Time Structural Reasoning for Compositional Vision-Language Understanding [0.0] 視覚言語モデル(VLM)は、画像テキスト検索では優れているが、構成的推論では持続的に失敗する。
アーキテクチャ的に多様性のある4つのVLMをベンチマークした統合評価および拡張フレームワークを提案する。
Qwen3-VL-8B-シンキングはグループスコア62.75を達成し、全てのエンコーダベースのモデルよりはるかに上回っている。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 17:41:35 GMT)
Hybrid CNN-Transformer Architecture for Arabic Speech Emotion Recognition [0.0] 本稿では,ハイブリッドCNN-Transformerアーキテクチャに基づくアラビア音声感情認識(SER)システムを提案する。
提案モデルの精度は97.8%、マクロF1スコアは0.98である。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 16:11:56 GMT)
Heterogeneous Debate Engine: Identity-Grounded Cognitive Architecture for Resilient LLM-Based Ethical Tutoring [0.0] Heterogeneous Debate Engine(HDE)は、ID-RAG(ID-Grounded Retrieval-Augmented Generation)とHuristic Theory of Mindを併用した認知アーキテクチャである。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 20:50:21 GMT)
Gender-Based Heterogeneity in Youth Privacy-Protective Behavior for Smart Voice Assistants: Evidence from Multigroup PLS-SEM [0.0] 本稿では,若年者スマートアシスタント(SVA)エコシステムにおけるジェンダーのプライバシ意思決定の変容について検討する。
16~24歳のカナダ人若者469人の調査データを用いて、5つのプライバシー構成で男女を比較した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 04:11:05 GMT)
From Foundation ECG Models to NISQ Learners: Distilling ECGFounder into a VQC Student [0.0] PTB-XLとMIT-BIH Arrhythmia DatabaseのバイナリECG分類のための高容量教師としてECGFounderを微調整する。
我々は,知識蒸留が,その予測行動がコンパクトな学生に伝達できるかどうかを考察する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 13:36:45 GMT)
Forecastability as an Information-Theoretic Limit on Prediction [0.0] 本稿では,各地平線でどの程度の予測情報が利用できるのかを問う。
予測可能性(英: forecastability)は、水平線で評価されたこの相互情報として定義され、その形状がプロセスの依存構造を反映するプロファイルを形成する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 01:29:00 GMT)
EVA: Bridging Performance and Human Alignment in Hard-Attention Vision Models for Image Classification [0.0] EVAは、人為的なトレードオフを明確にし、調整可能な、ハードアテンションなメカニスティックなテストベッドである。
CNNに基づく特徴抽出は精度を向上するが、人間の類似性を抑える一方、分散制御とゲーティングは、最小性能の損失で人列軌道を復元する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 17:13:57 GMT)
Differential source-basis encoding for superresolved parameter estimation in a time-reversed Young interferometer [0.0] 時間反転ヤング干渉計における局所パラメータ推定のための差分音源符号化プロトコルを開発した。
局所的な状態において、微分信号は自然にエンベロープ段階の項に分離され、非干渉性差分センシングにも存在している。
この分解は、インターフェロメトリの利点の物理的起源を特定し、なぜそれが普遍的ではなく規則に依存しているのかを明確にする。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 21:05:36 GMT)
Diagnosing Non-Markovian Observations in Reinforcement Learning via Prediction-Based Violation Scoring [0.0] 強化学習アルゴリズムは、観測がマルコフの性質を満たすと仮定する。
実世界のセンサーは、相関ノイズ、遅延、または部分的な可観測性を通じて、この仮定にしばしば違反する。
本稿では,観測軌道における非マルコフ構造を定量化する予測に基づくスコアリング手法を提案する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 19:42:27 GMT)
Development and Preliminary Evaluation of a Domain-Specific Large Language Model for Tuberculosis Care in South Africa [0.0] 本稿では,TBケアのためのドメイン固有大規模言語モデル(DS-LLM)の開発について実験的に検討する。
データは南アフリカのTBガイドライン、選択されたTB文献、既存のベンチマーク医学データセットから収集された。
DS-LLMは、コンテキストアライメントの観点から、ベースモデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 11:22:05 GMT)
Culturally Adaptive Explainable LLM Assessment for Multilingual Information Disorder: A Human-in-the-Loop Approach [0.0] ハイブリッドインテリジェンスループ(Hybrid Intelligence Loop)は、母国語アノテータによる人文論理のモデル評価を基礎とする。
この手法は、英語のタスク命令と動的に検索されたターゲット言語例とをペアリングすることで、静的なターゲット言語による数発ショットを超越する。
本研究は, 評価対象グループ間のモデルアライメント, 重要度予測, 生成した合理性の品質, 文化的適切性, およびモデルアライメントを評価する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 18:06:14 GMT)
Contextual Earnings-22: A Speech Recognition Benchmark with Custom Vocabulary in the Wild [0.0] 音声からテキストへの精度は学術ベンチマークで高められている。
これとは対照的に、産業ベンチマークやハイテイクドメインの採用は、そうでないことを示唆している。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 05:09:16 GMT)
Codebase-Memory: Tree-Sitter-Based Knowledge Graphs for LLM Code Exploration via MCP [0.0] 我々は、モデルコンテキストプロトコル(MCP)を介して、永続的なツリーベースの知識グラフを構築するオープンソースシステムであるCodebase-Memoryを提示する。
Codebase-Memoryはファイル探索エージェントの応答品質が83%、92%、トークンが10倍、ツールコールが2.1倍である。
ハブ検出や呼び出し者ランキングなどのグラフネイティブクエリでは、31言語中19言語でエクスプローラーと一致するか、超えている。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 14:18:12 GMT)
Benchmarking Quantum Computers via Protocols -- Comparing Superconducting and Ion-Trap Quantum Technology [0.0] 超伝導とイオントラップ量子アーキテクチャは、現在の量子コンピューティング分野のランドスケープにおいて一般的である。
最適なサブチップ上での「量子性」を直接測定することで、これらの2つのアーキテクチャを比較するためのベンチマーク戦略を利用する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 20:29:23 GMT)
Autonomous overtaking trajectory optimization using reinforcement learning and opponent pose estimation [0.0] 本稿では,マルチエージェント自律走行環境のための強化学習機構を提案する。
このシステムは、LiDARに2D検出アルゴリズムと、YOLOベースの物体検出機能を備えた深度カメラを使って、乗り越えるべき車両を識別する。
提案アルゴリズムは,シミュレーションと実世界の実験の両方において,オーバーテイク操作を成功させる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 09:28:04 GMT)
Attacking AI Accelerators by Leveraging Arithmetic Properties of Addition [0.0] 我々は,乗算・加算操作を妨害するために,加算の可換性を利用する新しいハードウェア老化攻撃を提案する。
加算器の入力を置換することにより、トランジスタ間の不均衡な応力を誘導しながら機能的正しさを保ち、回路の遅延劣化を加速させる。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 23:03:27 GMT)
A Mean Field Games Perspective on Evolutionary Clustering [0.0] 平均場ゲーム(MFG)に基づく進化的クラスタリングのための制御理論フレームワークを提案する。
この連続時間定式化は、予め定義された統計的形状ではなく、変動コスト関数によって駆動され、非パラメトリッククラスタの進化の柔軟な基盤を提供する。
論文参考訳(メタデータ) (Sat, 28 Mar 2026 04:56:36 GMT)