NTIRE 2026 The Second Challenge on Day and Night Raindrop Removal for Dual-Focused Images: Methods and Results [217.3] 本稿では,NTIRE 2026第2回昼夜降雨除去チャレンジの概要について述べる。
この課題の第一の目的は、様々な照明と焦点条件の下で雨滴を除去するための強力で実用的なベンチマークを確立することである。
合計168チームが競技に登録し、17チームがテストフェーズの有効な最終ソリューションとファクトシートを提出した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 13:22:23 GMT)
NTIRE 2026 Challenge on Short-form UGC Video Restoration in the Wild with Generative Models: Datasets, Methods and Results [170.9] 本稿では, NTIRE 2026 Challenge on Short-form Video Restoration in the Wild with Generative Modelsについて概説する。
この課題は、USTCとKuaishou TechnologyがコントリビュートしたKwaiVIRと呼ばれる新しいショートフォーム(S-UGC)ビデオ復元ベンチマークを利用する。
この課題の第一の目的は、複雑な現実世界の劣化下でのショートフォームビデオの復元のための、強力で実用的なベンチマークを確立することである。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 09:43:13 GMT)
The Second Challenge on Real-World Face Restoration at NTIRE 2026: Methods and Results [105.9] 本論では,NTIRE 2026による顔修復の課題について概説する。
この課題は、アイデンティティの一貫性を維持しながら、自然でリアルなアウトプットを生成することに焦点を当てている。
その目標は、知覚的品質とリアリズムのための最先端のソリューションを進化させることである。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:49:14 GMT)
Bidirectional Learning of Facial Action Units and Expressions via Structured Semantic Mapping across Heterogeneous Datasets [85.7] 本研究では,異なるデータ領域下での双方向AU-FE学習のための構造化セマンティックマッピング(SSM)フレームワークを提案する。
SSMは、(1)動的AUとFEビデオから統一された顔表現を学習する共有視覚バックボーン、(2)テキストセマンティックプロトタイプ(TSP)モジュールによるセマンティックメディエーション、(3)顔行動符号化システムから派生した事前知識を組み込んだ動的優先マッピング(DPM)モジュールの3つの主要な構成要素から構成される。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 09:08:32 GMT)
Learning 3D Representations for Spatial Intelligence from Unposed Multi-View Images [81.9] UniSplat (UniSplat) は、未提示のマルチビュー画像から3D表現を学習するためのフィードフォワードフレームワークである。
エンコーダにおける幾何誘導を強化するデュアルマスキング戦略を導入する。
第2に,外見のセマンティックな矛盾を解消する粗大なガウス的スプレイティング戦略を開発する。
第3に、予測された3次元点と意味マップを画像平面に相互に関連付ける、ポーズ条件の補正機構を導入する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 10:36:18 GMT)
Tracing the Roots: A Multi-Agent Framework for Uncovering Data Lineage in Post-Training LLMs [81.4] 学習後のデータは、大規模言語モデル(LLM)の機能を形成する上で重要な役割を果たす
本稿では,データセット開発における進化グラフを再構築する自動マルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 06:24:07 GMT)
IMPACT: A Dataset for Multi-Granularity Human Procedural Action Understanding in Industrial Assembly [79.7] IMPACTは、デプロイメント指向の産業手続き的理解のための5ビューのRGB-Dデータセットである。
実際の組み立てと、プロ向けのツールを備えた商業用アングルグラインダーの分解を中心に構築されている。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 02:09:19 GMT)
From Perception to Planning: Evolving Ego-Centric Task-Oriented Spatiotemporal Reasoning via Curriculum Learning [79.7] タスクベースの時間的推論を学習するためのカリキュラムベースのフレームワークであるEgoTSRを提案する。
EgoTSRは、明示的な空間的理解からタスク状態評価への進化を前提に構築されている。
実験により、EgoTSRはバイアスを効果的に排除し、長距離論理推論タスクにおいて92.4%の精度を達成した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:14:49 GMT)
FreeScale: Scaling 3D Scenes via Certainty-Aware Free-View Generation [75.7] FreeScaleは、限られた現実世界の画像シーケンスを、高品質なトレーニングデータのスケーラブルなソースに変換するフレームワークである。
フィードフォワードNVSモデルのトレーニングをスケールアップし,PSNRにおける2.7dBの顕著なゲインを達成することにより,FreeScaleの有効性を示す。
私たちの仕事は、3Dビジョンの根本的なボトルネックを克服するために、実用的で強力なデータ生成エンジンを提供します。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:00:53 GMT)
A Benchmark and Multi-Agent System for Instruction-driven Cinematic Video Compilation [75.7] CineBenchは、命令駆動のシネマティックビデオコンパイルのための最初のベンチマークである。
CineAgentsは,映像編集をデザイン・アンド・コンポジションのパラダイムに再構成するマルチエージェントシステムである。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 04:39:09 GMT)
TAPNext++: What's Next for Tracking Any Point (TAP)? [58.7] 本稿では,低メモリとアーキテクチャの計算フットプリントを保ちながら,桁数桁長の点を追跡するモデルを提案する。
再検出性能が現在の文献の盲点であることを強調し,新しいメトリクスであるRe-detection Average Jaccardを導入する。
複数のベンチマークにおいて,再帰型トランスフォーマーがポイントトラッキングのために大幅に改善され,新たな最先端のモデルが設定できることが実証された。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 11:02:13 GMT)
FORGE: Fine-grained Multimodal Evaluation for Manufacturing Scenarios [58.3] 製造業セクターは、単純な認識から自律的な実行に移行するために、MLLM(Multimodal Large Language Models)をますます採用している。
進捗は、データの不足と、既存のデータセットにおけるきめ細かいドメインセマンティクスの欠如によって妨げられている。
まず、実世界の2D画像と3Dポイントクラウドを組み合わせて、微粒なドメインセマンティクスを付加した高品質なデータセットを構築します。
次に, 3 つの製造課題,すなわち, 構造面検査, 組立検査, 組立検証の18の最先端MLLMを評価し, 大幅な性能差を明らかにした。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 03:02:53 GMT)
RemoteAgent: Bridging Vague Human Intents and Earth Observation with RL-based Agentic MLLMs [55.4] 地球観測システムは、曖昧な自然言語を通じて要求を表現するドメインの専門家を支援するように設計されている。
実用的なEOAIシステムは、あいまいな人間のクエリと適切な多粒度視覚分析タスクのギャップを埋めなければならない。
MLLMの能力固有の境界を戦略的に尊重するエージェントフレームワークであるRemoteAgentを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 05:49:10 GMT)
ReContraster: Making Your Posters Stand Out with Regional Contrast [54.9] ポスターを目立たせるために地域コントラストを活用する最初のトレーニングフリーモデルであるReContrasterを提案する。
ポスターデザイナーの認知行動をエミュレートすることで、ReContrasterは合成マルチエージェントシステムを導入する。
7つの定量的メトリクスと4つのユーザスタディは、関連する最先端手法よりもその優位性を確認している。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 03:36:21 GMT)
Early Decisions Matter: Proximity Bias and Initial Trajectory Shaping in Non-Autoregressive Diffusion Language Models [54.2] 拡散ベースの言語モデル (dLLMs) は自己回帰型言語モデルに代わる有望な代替品として登場した。
時間軸に沿った推論ダイナミクスを系統的に解析し, dLLMの非自己回帰復号化について検討した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 10:26:41 GMT)
A Progressive Training Strategy for Vision-Language Models to Counteract Spatio-Temporal Hallucinations in Embodied Reasoning [49.6] 「多像幻覚推論」では、前頭と時頭クエリ間の大規模なパフォーマンス低下は、真に理解するのではなく、表面的なショートカットへの依存を示す。
これを軽減するために、我々は、チェーンステップへの詳細な推論と決定的な判断に基づく、時間的連鎖構築という新しいデータセットを開発する。
実験により,本手法は精度を向上するだけでなく,70%以上から6.53%まで,前向きのパフォーマンスギャップも改善することが示された。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 07:48:44 GMT)
Retrieve Only Relevant Tables Whether Few or Many: Adaptive Table Retrieval Method [49.4] 既存のテーブル検索アプローチでは、クエリに最も近いkテーブルの事前決定セットを選択する。
必要なテーブルの数はクエリによって異なり、事前に知ることはできない。
本稿では,各クエリの要求に応じて検索されたテーブル数を調整する適応テーブル検索手法を提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 14:53:56 GMT)
Learning and Enforcing Context-Sensitive Control for LLMs [48.6] 本稿では,大規模言語モデルの相互作用から文脈依存制約を自動的に学習するフレームワークを提案する。
実験により,本手法は,LLM (1Bパラメータ) の学習と生成を完全制約付きで行うことができることを示した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 14:50:03 GMT)
VidAudio-Bench: Benchmarking V2A and VT2A Generation across Four Audio Categories [48.0] VidAudio-Benchは、4つの重要な特徴を持つV2A評価のためのマルチタスクベンチマークである。
1,634組のビデオテキストペアと、11の最先端世代モデルをベンチマークする。
主観的な研究を通じてすべての指標を検証し、人間の嗜好と強い一貫性を示す。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 09:11:55 GMT)
Why Don't You Know? Evaluating the Impact of Uncertainty Sources on Uncertainty Quantification in LLMs [45.8] 本研究では,不確実性源が既存の不確実性定量化手法の挙動と有効性に与える影響について検討する。
実験の結果,不確実性がモデル知識の限界からのみ生じる場合,その性能が劣化するか,他の情報源が導入された場合に誤解を招く場合,多くのUQ手法が良好に機能することがわかった。
これらの知見は,大規模言語モデルにおける不確実性の原因を明示的に考慮する不確実性認識手法の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 07:01:53 GMT)
AdverMCTS: Combating Pseudo-Correctness in Code Generation via Adversarial Monte Carlo Tree Search [43.7] AdverMCTSはモンテカルロ木探索フレームワークで、コード検索とアクティブな脆弱性発見を結合することで擬似的正確性に対処する。
本稿では,AdverMCTSが最先端のベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 04:15:31 GMT)
WaveMoE: A Wavelet-Enhanced Mixture-of-Experts Foundation Model for Time Series Forecasting [43.5] 本稿では、拡張性のある基礎モデルに明示的な周波数領域表現を統合する新しい視点を提案する。
時系列予測のためのウェーブレット強化混合実験基盤モデルであるWaveMoEを紹介する。
16種類のベンチマークデータセットの予備的な実験結果から、WaveMoEは予測性能をさらに改善する可能性が示唆されている。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 09:17:19 GMT)
Deep-Reporter: Deep Research for Grounded Multimodal Long-Form Generation [42.8] Deep-Reporterは、接地型マルチモーダル長文生成のための統一されたエージェントフレームワークである。
モデル最適化のために8Kの高品質なエージェントトレースを生成する厳密なキュレーションパイプラインを開発した。
M2LongBenchは9つの領域にわたる247の研究タスクと安定したマルチモーダルサンドボックスからなる総合的なテストベッドである。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:30:44 GMT)
The Code Whisperer: LLM and Graph-Based AI for Smell and Vulnerability Resolution [42.3] Code Whispererは、グラフベースのプログラム分析と大きな言語モデルを組み合わせて、保守性とセキュリティの問題を検出し、説明し、修復するハイブリッドフレームワークである。
このフレームワークを多言語データセット上で評価し,ルールベースアナライザや単一モデルベースラインと比較する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 20:10:48 GMT)
Working Paper: Towards Schema-based Learning from a Category-Theoretic Perspective [42.2] 基本スキーマと変換をエンコードする無料のマルチカテゴリ $Sch_syn$ を示す。
エージェントレベルでは、$Sch_impl$は、スキーマベースの変換をサポートする duoidal 構造 $mathcalO_Sch$ を備える。
カテゴリ$Mind$の左の重複アクションは、メンタルオブジェクト上でのワークフロー実行を可能にする。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 11:26:49 GMT)
WOODELF-HD: Efficient Background SHAP for High-Depth Decision Trees [42.0] WoodelfHDはWoodelfの拡張で、3Dファクタを2Dに減らす。
WoodelfHDは、深さ21までの木に対して、正確なバックグラウンドSHAP計算を可能にする。
それぞれ33倍と162倍のスピードアップを実現している。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 10:32:48 GMT)
OmniUMI: Towards Physically Grounded Robot Learning via Human-Aligned Multimodal Interaction [41.5] UMIスタイルのインタフェースはスケーラブルなロボット学習を可能にするが、既存のシステムはほとんどビジュモータのままである。
OmniUMIは,人間と協調したマルチモーダルインタラクションによる物理的基盤を持つロボット学習のための統合フレームワークである。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 13:48:48 GMT)
Israel-Hamas War on X: A Case Study of Coordinated Campaigns and Information Integrity [34.9] ソーシャルメディア上での協調キャンペーンは危機情報環境を形成する上で重要な役割を担っている。
我々は,2023年のイスラエル・ハーマス戦争をTwitter上でケーススタディとして,協調キャンペーンと情報整合性の間の相互作用について検討した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 10:22:34 GMT)
Instruction Data Selection via Answer Divergence [33.9] マルチサンプル出力の幾何学的構造に基づいて命令データを選択するAnswer Divergence-Guided Selection (ADG)を提案する。
ADGは命令ごとに高温世代を描画し、応答を埋め込み空間にマッピングし、出力分散スコアを計算する。
高いスコアは、一つの方向に沿ってクラスタ化されたパラフレーズではなく、答えが遠く、多様である指示に対応する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 04:11:12 GMT)
GeoMeld: Toward Semantically Grounded Foundation Models for Remote Sensing [33.7] GeoMeldは大規模なマルチモーダルデータセットで、約250万個の空間的に整列したサンプルがある。
GeoMeldは、エージェントキャプションフレームワークを通じて意味論的に基盤付けられた言語管理を提供する。
GeoMeld-FMは、アライメントされたモダリティ、JEPA表現学習、キャプション-ビジョンのコントラストアライメントを多言語で表した自動エンコーディングを組み合わせた事前トレーニングフレームワークである。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 11:47:11 GMT)
Knowing What to Stress: A Discourse-Conditioned Text-to-Speech Benchmark [33.2] TTSにおける文脈条件付き単語レベルストレスを評価するためのベンチマークであるContext-Aware Stress TTS(CAST)を提案する。
テキストのみの言語モデルは、コンテキストから意図したストレスを確実に回復するが、TSシステムは音声でそれを実現できないことが多い。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 10:57:00 GMT)
Uncertainty-quantified Pulse Signal Recovery from Facial Video using Regularized Stochastic Interpolants [32.8] フォトプレチスモグラフィ(Photoplethysmography)は、カメラからの画素読み出しを用いてヒトの血液量パルス(BVP)波形を復元する光学的手順である。
iタスクを解決するための現在のアルゴリズムは、優れたパフォーマンスベンチマークデータセットを示している。
最先端のアルゴリズムや、私たちの知識を最大限に活用するベクトルは、ソリューション空間の試験時間サンプリングを実行しません。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 19:00:49 GMT)
BridgeSim: Unveiling the OL-CL Gap in End-to-End Autonomous Driving [32.7] Open-loop (OL) to closed-loop (CL) gap (OL-CL gap) は、OLに制限されたポリシーが閉ループ (CL) デプロイメントにおいて効果的に転送できない場合に存在する。
我々は、OLポリシーが観測ドメインシフトとObjective Mismatchに悩まされていることを実証する。
本稿では,観測シフトを校正し,状態-動作バイアスを低減し,時間的一貫性を強制するテスト時適応フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 23:37:07 GMT)
VideoStir: Understanding Long Videos via Spatio-Temporally Structured and Intent-Aware RAG [29.4] VideoStirは、意図を認識した長ビデオRAGのためのフレームワークである。
ビデオは、クリップレベルでテンポラルグラフとして構成され、エビデンスを集約するマルチホップ検索を実行する。
MLLMが支援するインテント関連スコアラは、クエリの推論インテントとのアライメントに基づいてフレームを検索する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 12:15:51 GMT)
UDAPose: Unsupervised Domain Adaptation for Low-Light Human Pose Estimation [29.0] ポーズ推定のための教師なしドメイン適応(UDAPose)を提案する。
UDAPoseは低照度画像を合成し、ポーズ前のポーズを動的に融合してポーズ推定を改善する。
実験の結果、UDAPoseは最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 06:37:01 GMT)
Defending against Patch-Based and Texture-Based Adversarial Attacks with Spectral Decomposition [29.0] 敵対的な例は、ディープニューラルネットワーク(DNN)アプリケーションのセキュリティに重大な課題を示している。
パッチベースおよびテクスチャベースの攻撃は、監視や自律システムにおける人検出などのセキュリティクリティカルなアプリケーションに対して、真の脅威となる。
本稿では,複数の周波数スケールの対向パターンを解析するために,ASD(Adversarial Spectrum Defense)を提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 16:24:08 GMT)
How You Ask Matters! Adaptive RAG Robustness to Query Variations [28.3] 我々は,多種多様ながら意味的に同一なクエリバリエーションの大規模ベンチマークを初めて導入する。
回答品質,計算コスト,検索決定の3つの側面にまたがる重要な要素について検討する。
これらの結果から,Adaptive RAG法は同一のセマンティクスを保持するクエリの変動に対して極めて脆弱であることがわかった。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:35:58 GMT)
DiningBench: A Hierarchical Multi-view Benchmark for Perception and Reasoning in the Dietary Domain [27.9] 視覚言語モデル(VLM)を3段階の認知複雑性で評価するために設計された階層的マルチビューベンチマークであるDiningBenchを紹介した。
以前のデータセットとは異なり、ダイニングベンチは3,021の異なる料理で構成されており、1エントリあたりの平均5.27イメージである。
我々の実験では、現在のVLMは一般的な推論において優れているが、細粒度の視覚的識別と栄養学的推論にかなり苦労していることが明らかとなった。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 02:45:24 GMT)
When Meaning Isn't Literal: Exploring Idiomatic Meaning Across Languages and Modalities [27.9] 比喩的推論は比喩と文化に深く絡み合っており、現代言語モデルの盲点として残されている。
我々は,3,533人のヒンディー語,ベンガル語,タイ語のイディオムからなる多言語・多モーダルコーパス「メディオム」を提示する。
我々は,大規模言語モデル (テキスト推論) と視覚言語モデル (図示的曖昧さ) の両方をメディオム上でベンチマークし,メタファの理解において系統的失敗を明らかにする。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 19:36:00 GMT)
Latent-Compressed Variational Autoencoder for Video Diffusion Models [27.8] 本稿では,チャネル数を直接削減するのではなく,ビデオ遅延表現の高周波成分を除去する潜時圧縮法を提案する。
実験により, 提案手法は, 強いベースラインに比べて, 優れた映像再構成品質を実現することを示した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 04:45:51 GMT)
ReFEree: Reference-Free and Fine-Grained Method for Evaluating Factual Consistency in Real-World Code Summarization [26.9] 実世界のコード要約における事実整合性を評価するための参照不要かつきめ細かな手法であるReFEreeを提案する。
コード要約に特有の現実的矛盾基準を定義し,セグメントレベルで評価する。
人間の注釈付き事実整合性ラベルを用いたコード要約ベンチマークを構築した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:20:45 GMT)
SODA: Semi On-Policy Black-Box Distillation for Large Language Models [19.7] 大きな言語モデルに対するブラックボックスの知識蒸留は厳密なトレードオフをもたらす。
4つのコンパクトQwen2.5およびLlama-3モデルのセミ評価は、このセミオン政治パラダイムを検証する。
トレーニングを10倍速くし、27%のピークGPUメモリを消費し、対向不安定性を完全に排除しながら、この優れた蒸留品質を実現する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 23:46:23 GMT)
How to Design a Compact High-Throughput Video Camera? [19.6] 既存の高スループットイメージングシステムは、数百のサブイメージ/動画を高スループットビデオに分割し、非常に高いシステムの複雑さに悩まされている。
本稿では,高速読み出しおよび効率的な表現における勾配カメラの強度を解析し,低ビット勾配カメラ方式を提案する。
高解像度画像の再構成のために, マルチスケール再構成CNNを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 12:51:23 GMT)
Rethinking Video Human-Object Interaction: Set Prediction over Time for Unified Detection and Anticipation [18.7] ビデオベースヒューマンオブジェクトインタラクション(HOI)の理解には、進行中のインタラクションを検出し、将来の進化を予測する必要がある。
対象対象の局所化,現在のHOI検出,将来の予測を共同で行う,ペア中心のフレームワークであるDETAnt-HOIとHOI-DAを紹介する。
実験では、検出と予測の両方において一貫した改善が見られ、より長い地平線でより大きな利得が得られた。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 01:07:43 GMT)
Towards an Appropriate Level of Reliance on AI: A Preliminary Reliance-Control Framework for AI in Software Engineering [18.5] ソフトウェア開発者が、Large Language Models(LLMs)など、人工知能(AI)駆動のツールとどのように相互作用するかは、これらのAI駆動ツールがそれらに与える影響において重要な役割を果たす。
本稿では,AI過信と不信を識別する手段として,制御レベルを使用可能な予備的依存制御フレームワークを提案する。
我々の発見は、実践者、教育者、政策立案者がAIツールの責任と効果的な利用を促進するのに役立つ。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:47:34 GMT)
MMRareBench: A Rare-Disease Multimodal and Multi-Image Medical Benchmark [18.5] MLLM(Multimodal large language model)は、一般的な疾患に対する先進的な臨床課題があるが、希少な疾患に対するパフォーマンスはほとんど検査されていない。
我々は,MMRareBenchについて,マルチモーダルおよびマルチイメージ臨床能力の評価を共同で行った最初のレア・ディスリーズ・ベンチマークについて紹介する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:53:02 GMT)
Bringing Value Models Back: Generative Critics for Value Modeling in LLM Reinforcement Learning [18.4] 信用割当は強化学習(RL)における中心的課題である
本稿では,1ショットスカラー値の予測を生成評論家に置き換えるジェネラティブ・アクター・クリティカル(Generative Actor-Critic, GenAC)を提案する。
GenACは、値近似、ランキング信頼性、アウト・オブ・ディストリビューションの一般化を改善している。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 15:54:11 GMT)
Modeling Community Attitude through Reaction Tone: A Human-AI Collaborative Framework for Evaluating LLM Alignment with Linguistic Behaviors in Online Communities [18.1] 大規模言語モデル(LLM)は、計算社会分析のプロキシとしてますます活用されている。
しかし、人間のコミュニティの「細い記述」を忠実に表現する能力は、依然として重要な課題である。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 07:46:12 GMT)
Differentially Private Verification of Distribution Properties [17.7] 本研究では,差分プライベート(DP)分布特性試験について検討する。
1ラウンド(2メッセージ)のプライベートコインプロトコルは、パブリックコインAMプロトコルよりもかなり複雑さが低い。
サンプルが製品分布から引き出されるか否かをプライベートにテストするためのメルリン・アーサー証明を得る。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 21:17:43 GMT)
Camyla: Scaling Autonomous Research in Medical Image Segmentation [17.1] カミーラ(Camyla)は、医学画像セグメンテーションの科学領域における完全に自律的な研究システムである。
生のデータセットを文学的な研究提案、実行可能な実験、人間の介入なしに完全な原稿に変換する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 15:43:50 GMT)
Enhancing Fine-Grained Spatial Grounding in 3D CT Report Generation via Discriminative Guidance [16.6] ラジオロジーレポート生成(RRG)のための視覚言語モデル(VLM)は、ボリュームスキャンから長めの胸部CTレポートを生成することができる。
既存の方法は2つの重要な制限に直面している: (i) トレーニングの監督は、しばしば粗くなり、きめ細かい属性や病理の場所を明示的に調整することなく、CTのボリューム全体を完全な自由テキストのレポートと整列する。
本稿では,フリーテキストレポートから微細なキューを蒸留し,レポート生成をガイドするプラグイン・アンド・プレイフレームワークであるPrompt Dropout (DCP-PD) を用いたemphDiscrimi Cue-Promptingを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 03:25:41 GMT)
ProUIE: A Macro-to-Micro Progressive Learning Method for LLM-based Universal Information Extraction [16.4] ProUIEはマクロ・マイクロ・プログレッシブ・ラーニング・アプローチであり、外部情報を導入することなく普遍的な情報抽出を改善する。
i)マクロレベル完全モデリング(CM)、(i)マクロレベル完全モデリング(CM)、(i)マクロレベル完全モデリング(EE)、(ii)メソレベルストリームリンドアライメント(SA)、(iii)マイクロレベル深層探査(DE)の3段階からなる。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 13:20:58 GMT)
AWARE: Adaptive Whole-body Active Rotating Control for Enhanced LiDAR-Inertial Odometry under Human-in-the-Loop Interaction [15.5] リソース制限されたUAVプラットフォームは、しばしば視野の狭いLiDARセンサーに制限される。
AWAKEはバイオインスパイアされた全身のアクティブユーイングフレームワークで、UAV自身の回転速度を利用して効果的なセンサー水平線を拡大する。
Safe Flight Corridorメカニズムは、オペレータのナビゲーション意図を自律ヨー最適化から切り離すことによって、このHITLパラダイム内での運用上の安全性を保証する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 12:07:58 GMT)
Simple but Stable, Fast and Safe: Achieve End-to-end Control by High-Fidelity Differentiable Simulation [14.8] 障害物回避(Obstacle avoidance)は、四重項が高度なアプリケーションを実行できるようにするための基本的な視覚ベースのタスクである。
本稿では,深度画像を直接低レベルのボディレートコマンドにマッピングする新しいエンドツーエンドポリシーを提案する。
提案手法は,最先端のベースラインの中で,最も成功率が高く,かつ最低のジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロジロ
論文参考訳(メタデータ) (Sun, 12 Apr 2026 09:38:00 GMT)
Preventing Latent Rehearsal Decay in Online Continual SSL with SOLAR [14.7] Online Continual Self-Supervised Learning (OCSSL)は、ラベルのない非定常データの連続的なストリームからモデルを学習するシナリオである。
OCSSLは安定性と塑性のトレードオフに特に注意を要する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 11:11:06 GMT)
LLMs Should Incorporate Explicit Mechanisms for Human Empathy [13.8] 本稿では,Large Language Models (LLM) は人間の共感の明示的なメカニズムを取り入れるべきである,と論じる。
我々は共感を観察可能な行動特性として定式化し、意図、影響、文脈を保ちながら人間の視点をモデル化し、反応する能力を持つ。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 10:00:34 GMT)
DBGL: Decay-aware Bipartite Graph Learning for Irregular Medical Time Series Classification [12.9] 本稿では,DBGL,Decay-Aware Bipartite Graph Learning for Irregular Medical Time Seriesを紹介する。
DBGLはまず患者可変二部グラフを導入し、人工的なアライメントなしに不規則なサンプリングパターンを同時にキャプチャする。
次に、サンプリング間隔に基づいて各変数の減衰率をキャプチャするノード固有時間減衰符号化機構を設計する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 14:43:12 GMT)
Online Covariance Estimation in Averaged SGD: Improved Batch-Mean Rates and Minimax Optimality via Trajectory Regression [12.8] 我々はPolyak-Ruppert averaged gradient descent (SGD)のオンライン共分散行列推定について検討した。
この構造は、このボトルネックがSGDドリフトからヘッセンの情報をサブ線形に蓄積していることを明らかにする。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 20:49:33 GMT)
LLMs for Qualitative Data Analysis Fail on Security-specificComments in Human Experiments [12.8] 大型言語モデル(LLM)は、人間のアノテーションを置き換えるのに理想的な候補である。
我々はLiveBench上での4つの最高性能LCMに、人間による自由テキストコメント中の9つのセキュリティ関連コードを検出するよう促す。
詳細なコード記述を使用する場合にのみ、顕著な改善が見られた。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 22:01:40 GMT)
HOG-Layout: Hierarchical 3D Scene Generation, Optimization and Editing via Vision-Language Models [12.7] 3Dレイアウトの生成と編集は、Embodied AIと没入型VRインタラクションにおいて重要な役割を果たす。
本稿では,テキスト駆動型階層的シーン生成,最適化,リアルタイムシーン編集を可能にするHOGを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 18:45:40 GMT)
Privacy as Permissible Operations: An ABAC Framework for Policy-Law Compliance [12.6] 近年,多くの国が,Webサイトやモバイルアプリなどを通じて,様々な企業によって収集・維持されている市民の個人情報のプライバシーを保護する法律を制定している。
本稿では,このような組織的プライバシポリシを,一般的な法律に対して効率的に検証する方法を示す。
ユーザがWebサイトのプライバシポリシページにアクセスすると、APLianceを使用したリアルタイムコンプライアンスチェックのためにブラウザプラグインが開発され、公開されている。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 21:57:17 GMT)
Your Model Diversity, Not Method, Determines Reasoning Strategy [12.5] LLM推論では、解決策の探索と有望なソリューションの精錬の間に予算を割り当てる必要がある。
我々は、推論の不確実性を分解する理論的枠組みを通じてこれを定式化する。
また,Qwen-3 4BとOlmo-3 7Bファミリで検証した結果,深度に基づく精細化には軽量信号が十分であることが示唆された。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 21:49:13 GMT)
BDIViz in Action: Interactive Curation and Benchmarking for Schema Matching Methods [12.4] BDIViz は LLM による検証とスキーママッチングのためのインタラクティブな可視化システムである。
BDIVizへの新たな拡張は、Human-in-the-loopベンチマークと反復型マーカ開発という、データ統合研究における重要なニーズに対処する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 18:16:30 GMT)
COREY: A Prototype Study of Entropy-Guided Operator Fusion with Hadamard Reparameterization for Selective State Space Models [11.3] 状態空間モデル(SSM)は線形時間シーケンスモデルを提供し、長文推論に魅力的なものである。
本稿では,メモリ対応演算子融合とHadamardに基づく特徴再パラメータ化を組み合わせたプロトタイプフレームワークであるCOREYを提案する。
COREYは、プロキシのレイテンシを一貫して低減し、スループットを改善し、未使用および固定深度ベースラインに対するDRAMトラフィックを低減します。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 12:07:48 GMT)
FGML-DG: Feynman-Inspired Cognitive Science Paradigm for Cross-Domain Medical Image Segmentation [11.1] ドメイン一般化(DG)は、AI駆動型医療において依然として重要な課題である。
本稿では,医療画像領域の一般化セグメンテーションのための認知科学に基づくメタラーニングパラダイムを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:32:10 GMT)
CodeQuant: Unified Clustering and Quantization for Enhanced Outlier Smoothing in Low-Precision Mixture-of-Experts [11.0] アウトレーヤは、低精度の大型モデルの精度を維持するための基本的なボトルネックとして現れている。
我々は,学習可能な回転および重み付き外周波をMoE用微調整クラスタセントロイドに吸収することで,活性化外周波の滑らか化を含む統一量子化クラスタリング方式であるCodeQuantを紹介する。
CodeQuantは最大$4.15timesのスピードアップを実現し、様々なMoEモデルにまたがる最先端の量子化アプローチよりもはるかに高い精度を実現している。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 07:06:16 GMT)
NameBERT: Scaling Name-Based Nationality Classification with LLM-Augmented Open Academic Data [11.0] Open Academic Graph (OAG) から大規模名称国籍データセットを作成する。
本稿では,LLMを推論エンジンではなくデータセットエンリッチアとして活用するフレームワークを提案する。
NameBERTモデルは、ドメイン内および外部の両方のタスクにおいて、最先端のベースラインよりもはるかに高い精度を達成する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 01:19:55 GMT)
WARPED: Wrist-Aligned Rendering for Robot Policy Learning from Egocentric Human Demonstrations [10.0] WARPEDは人間のデモビデオからリアルな手首ビューの観察を合成するためのフレームワークである。
ハンドオブジェクトインタラクションパイプラインを使用して、手と操作対象を追跡し、軌道をロボットのエンドエフェクタに再ターゲットする。
我々は、WARPEDが5つのテーブルトップ操作タスクのための遠隔操作デモデータに基づいて訓練されたポリシーに匹敵する成功率を達成することを実証した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 20:40:59 GMT)
Lost in Diffusion: Uncovering Hallucination Patterns and Failure Modes in Diffusion Large Language Models [10.0] 本研究は,dLLMの幻覚パターンを評価するための最初の制御された比較研究である。
以上の結果から,現在のdLLMは,建築・規模・事前学習重量に制御されるARよりも幻覚の確率が高いことが示唆された。
以上の結果から,dLLMは一般タスクにおける性能ギャップを狭めたが,その異なる幻覚機構は信頼性をモデル化する上で重要な課題であることが示された。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 09:59:41 GMT)
When More Thinking Hurts: Overthinking in LLM Test-Time Compute Scaling [9.7] 計算予算の増加に伴い,追加推論トークンの限界効用がどう変化するかを検討する。
限界リターンは、より高い予算で大幅に減少し、モデルが過度に考え過ぎている」という結果が得られます。
当社のコストアウェア評価フレームワークは、適度な予算で停止することで、同等の精度を維持しながら計算を大幅に削減できることを示した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:20:35 GMT)
Investigating Bias and Fairness in Appearance-based Gaze Estimation [9.6] 外見に基づく視線推定は、精度と領域適応において著しく改善された。
視線推定に包括的なベンチマークアルゴリズムバイアスはない。
本稿では、外見に基づく視線推定におけるフェアネスの最初の広範囲な評価について述べる。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 16:04:38 GMT)
Structure-Grounded Knowledge Retrieval via Code Dependencies for Multi-Step Data Reasoning [9.6] SGKRは、関数呼び出し依存性によって誘導されるグラフでドメイン知識を整理する。
多段階データ分析ベンチマークの実験により、SGKRは非検索および類似性に基づく検索ベースラインよりも解の正しさを一貫して改善することが示された。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:14:39 GMT)
SignReasoner: Compositional Reasoning for Complex Traffic Sign Understanding via Functional Structure Units [9.4] SignReasonerは、一般的な視覚言語モデルから専門家の交通標識推論に変換する新しいパラダイムである。
私たちの中心となるイノベーションはFSU(Functional Structure Unit)です。
新たに提案されたFSU-ReasoningベンチマークであるTrafficSignEvalの実験では、SignReasonerが顕著なデータ効率とアーキテクチャ変更のない新しいSOTAを実現している。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 03:18:24 GMT)
TurboEvolve: Towards Fast and Robust LLM-Driven Program Evolution [8.8] TurboEvolveは、固定評価予算の下でサンプル効率とロバスト性を改善するマルチ島進化フレームワークである。
進化的アルゴリズムにおける多重子孫戦略に触発されたTurboEvolveは、言語化されたサンプリングを導入した。
既存のソリューションプールを活用するために,シードプールインジェクション(seed-pool Injection)を提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 12:42:09 GMT)
Efficient Process Reward Modeling via Contrastive Mutual Information [8.3] 本稿では,新しい自動報酬表示手法として,CPMI(Contrative Pointwise mutual information)を提案する。
CPMIは、推論ステップがステップと正しいターゲット回答の間の相互情報を増加させる程度を定量化する。
CPMIに基づくラベリングは,MC推定と比較してデータセット構築時間を84%削減し,トークン生成を98%短縮することを示した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 14:28:35 GMT)
A Layer-wise Analysis of Supervised Fine-Tuning [8.3] Supervised Fine-Tuning (SFT) は破滅的な忘れ込みのリスクを引き起こす。
本稿では,情報理論,幾何,最適化の指標を用いた包括的分析により,このメカニズムについて検討する。
そこで我々は,これらの重要な中間層を選択的に更新するミッドブロック効率チューニングを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 12:57:12 GMT)
Latent Instruction Representation Alignment: defending against jailbreaks, backdoors and undesired knowledge in LLMs [7.5] 大規模言語モデル(LLM)のジェイルブレイク、バックドア、アンラーニングに対処する。
我々の手法は、PEZのジェイルブレイク攻撃の99%以上をブロックし、難易度の高いコードバックドアを除去し、良識の喪失を無視してWMDPサイバーを最適に忘れることを実現する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 01:37:45 GMT)
From Query to Counsel: Structured Reasoning with a Multi-Agent Framework and Dataset for Legal Consultation [7.1] 法律相談質問応答(Legal CQA)は、従来の法的QAタスクと比較して、独特な課題を提示する。
JurisCQADは、43,000以上の実世界の中国の法律クエリの大規模なデータセットで、専門家が検証した正と負の応答が注釈付けされている。
動的ルーティング,法定グラウンド,スタイリスティック最適化をサポートするモジュール型マルチエージェントフレームワークであるJurisMAを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 05:49:37 GMT)
Dynamic Adaptive Attention and Supervised Contrastive Learning: A Novel Hybrid Framework for Text Sentiment Classification [7.0] 本稿では,動的適応型マルチヘッドアテンションと教師付きコントラスト学習をシームレスに統合するハイブリッドフレームワークをBERTベースのTransformer Encoderに提案する。
IMDBデータセットの実験では、提案されたモデルの競争性能は94.67%で、強いベースラインを1.5-2.5ポイント上回っている。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 04:55:10 GMT)
PERCEPT-Net: A Perceptual Loss Driven Framework for Reducing MRI Artifact Tissue Confusion [6.9] PERCEPT-Netは、構造保存アーティファクトの抑制を専門的に管理するフレームワークである。
トレーニングでは、リアルおよびシミュレートされたシーケンスのハイブリッドデータセットを使用した。
PerCEPT-Netは臨床データにおいて最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 03:30:39 GMT)
Beyond Static Sandboxing: Learned Capability Governance for Autonomous AI Agents [6.9] Aethelgardは、学習ポリシーを通じて、AIエージェントの最小特権を強制する。
Aethelgard氏は、タスクタイプ毎に設定された最小限の実行可能なスキルを学びます。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 13:10:56 GMT)
Energy-Efficient Federated Edge Learning For Small-Scale Datasets in Large IoT Networks [6.3] IoT(Internet of Things)ネットワークは、スマートシティや自動運転といったインテリジェントなサービスを実現するが、リソースの制約に直面することが多い。
本稿では,小規模データセットを用いたエネルギー効率の高いフェデレーションエッジ学習のための協調最適化フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 14:30:27 GMT)
From Query to Conscience: The Importance of Information Retrieval in Empowering Socially Responsible Consumerism [6.3] 我々は、情報検索の分野は、消費者により情報があり、より責任ある選択をさせることで、重要な役割を担っていると論じる。
我々は、社会的責任を持つ消費者主義の複雑さに対処する新しい新しいIRシステムとインターフェースの開発を提唱する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:50:01 GMT)
Public Key Encryption from High-Corruption Constraint Satisfaction Problems [6.2] 本稿では,2つの制約満足度問題(CSP)の推測的難解性に基づく,有意な準指数セキュリティを備えた公開鍵暗号方式を提案する。
我々の公開鍵暗号方式は、汚染度の高いCSPを初めて活用し、同時に準ポリノミカルよりも遥かに高いセキュリティレベルを達成する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 06:19:54 GMT)
FishRoPE: Projective Rotary Position Embeddings for Omnidirectional Visual Perception [6.1] 視覚基礎モデル(VFM)とバードアイビュー(BEV)の表現は、ピンホールカメラの直線幾何学を前提としている。
私たちのフレームワークは、凍結したVFMを2つのコンポーネントを通して魚眼幾何学に適応する軽量なフレームワークです。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 00:46:51 GMT)
AutoFlows++: Hierarchical Message Flow Mining for System on Chip Designs [6.0] AutoFlows++は、複雑な設計の通信トレースからメッセージフローをマイニングするための設計アーキテクチャ誘導階層フレームワークである。
その結果,AutoFlows++は従来の手法と比較して,フロー抽出精度を著しく向上することがわかった。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 15:44:43 GMT)
Attention Sinks as Internal Signals for Hallucination Detection in Large Language Models [5.6] SinkProbeは,注目シンクによって幻覚が深く絡み合っているという観測に基づく幻覚検出手法である。
提案手法は,一般的なデータセットやLPMにまたがって,最先端の成果をもたらす理論に基づく新たな幻覚検出手法である。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 15:46:22 GMT)
Tail-Aware Information-Theoretic Generalization for RLHF and SGLD [5.2] Weibullデータに対するテール依存型情報理論フレームワークを開発した。
私たちの重要な技術的要素は、シフトlogf_$-divergenceを使って変化の期待を束縛するデレンマです。
これらのツールは、期待され高確率なPAC-Bayes一般化境界と、多スケールレニイ相互情報に基づく情報理論チェインの不等式をもたらす。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:00:41 GMT)
GTASA: Ground Truth Annotations for Spatiotemporal Analysis, Evaluation and Training of Video Models [5.0] 本稿では、フレームごとの空間グラフとイベントレベルの時間マッピングを備えたマルチアクタービデオのコーパスであるGTASAを紹介する。
宇宙時間におけるイベントのグラフ (EST: GEST-Engine) に基づいて生成する。
11の時間的推論タスクで4つの凍結ビデオエンコーダを探索することで、GTASAの正確な3D基底真理が実現された。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 00:01:51 GMT)
Do LLMs Build Spatial World Models? Evidence from Grid-World Maze Tasks [4.9] 迷路タスクによる大規模言語モデルの空間的理解を体系的に評価する。
計画能力に関する仮定に挑戦する空間的推論における大きな相違点を明らかにする。
これらの結果は,空間的抽象化を必要とするアプリケーションに基礎モデルを配置する上で重要な意味を持つ。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 15:30:43 GMT)
Ising-based Test Optimization and Benchmarking [4.9] テスト最適化問題を解決するためのコマンドラインツールであるIsingTesterを紹介します。
テスト選択と最小化をIsingのスピン構成として再構成し、Ising Hamiltonianに複数の最適化戦略をエンコードし、CIMシミュレーションやブルートフォースサーチなどの解法を実装した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 04:20:23 GMT)
Principles Do Not Apply Themselves: A Hermeneutic Perspective on AI Alignment [4.8] 我々は、原則に規定されたアライメントは、文脈依存の解釈要素を含むと論じる。
我々は,2つの応答分布が異なる場合,非政治監査がアライメント関連障害を捉えるのに失敗することを示した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 14:54:31 GMT)
On the Capacity of Distinguishable Synthetic Identity Generation under Face Verification [4.8] 顔検証器が一致の同一性対と一致の異なる同一性対を固定しきい値$$で非一致として宣言するために、どれだけの合成IDを生成できるかを検討する。
我々は、識別可能なアイデンティティ生成の能力を、所定の同一性および異なる同一性検証制約を満たす遅延アイデンティティの最大数として定義する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 13:42:39 GMT)
Toward Accountable AI-Generated Content on Social Platforms: Steganographic Attribution and Multimodal Harm Detection [4.6] 生成AIは、コンテンツモデレーションとデジタル法医学における新しい課題を導入した。
良質なAI生成画像は、有害または誤解を招くテキストと組み合わせて、検出しにくい誤用を生成することができる。
本稿では,暗号署名された識別子を作成時に画像に埋め込むステガノグラフィー対応属性フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 04:57:25 GMT)
PRoID: Predicted Rate of Information Delivery in Multi-Robot Exploration and Relaying [4.6] ロボットのチームは、ミッションタイムの制限内で、取得した情報を固定基地局に届けなければならない。
主な課題は、各ロボットが探索と中継をやめるべきかどうかを決めることだ。
本稿では,学習した地図予測を用いて各ロボットの今後の情報獲得を推定するリレー基準であるPRoIDを紹介する。
ロボットの生存確率をリレー基準に組み込んだ障害対応拡張であるPRoID-Safeを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 03:12:14 GMT)
StableTTA: Training-Free Test-Time Adaptation that Improves Model Accuracy on ImageNet1K to 96% [4.5] アンサンブル法は予測性能を向上させるために広く用いられているが、その有効性はメモリ使用量の増加と計算複雑性の増大によって生じることが多い。
本稿では,新しい画像とロジット処理を用いたトレーニング不要なテスト時間適応(StableTTA)を提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:53:56 GMT)
Critical-CoT: A Robust Defense Framework against Reasoning-Level Backdoor Attacks in Large Language Models [4.4] 大規模言語モデル(LLM)は、バックドア攻撃に弱いことが示されている。
近年の進歩は、現代的なLCMの長期的推論傾向を利用して、推論レベルのバックドアを運用している。
LLM上で2段階の微調整を行う新しい防衛機構であるCritical-CoTを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 15:19:35 GMT)
Teaching Language Models How to Code Like Learners: Conversational Serialization for Student Simulation [4.4] 本稿では,学生プロセスデータを用いたオープンウェイトな人工プログラミング学習者の学習方法を提案する。
提案手法では,時間的ログトレースを対話形式にシリアライズし,各生徒の問題解決プロセスを表現する。
学生のコード提出とテスト結果、成績、エラートレースなどの環境フィードバックは、交互に会話のターンを形成する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 16:38:42 GMT)
Lung Cancer Detection Using Deep Learning [4.4] 肺がんは、がんに関連する2番目の死因であり、主に長期にわたる喫煙と関連している。
2020年には、全世界で約200万人が被害を受け、150万人が死んだ。
精度、精度、リコール(感度)、F1スコアなどのパフォーマンス指標を計算し、各モデルの能力を総合的に評価する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 18:23:00 GMT)
DynamicsLLM: a Dynamic Analysis-based Tool for Generating Intelligent Execution Traces Using LLMs to Detect Android Behavioural Code Smells [4.1] 振る舞いコードの臭いは、実行中に不適切なコードの振る舞いを誘発するソースコードの特徴である。
本稿では,大規模言語モデルを活用したDynamics法の実装について述べる。
少数のアクティビティを持つアプリケーションにおいて、コードの臭いに関連するイベントのカバレッジを改善するために設計された、新しいハイブリッドアプローチ。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 14:30:13 GMT)
Making Sense of the Weather, Together: Collaborative Sensemaking in Severe Weather Livestreams [3.9] 本稿では,「ウェザーフルエンサー」の出現現象を通した重症気象イベントにおける協調的センスメイキングについて検討する。
我々は、これらのクリエイターが、分散オーディエンスとリアルタイムに厳しい天気を解釈する社会技術的ダイナミクスをどのようにナビゲートするかを分析する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:22:36 GMT)
Uncertainty-Aware Sparse Identification of Dynamical Systems via Bayesian Model Averaging [3.8] 我々は,コンポーネントを結合した動的システムのためのスパース識別フレームワークを開発した。
このフレームワークは,不確実性を定量化してスパース相互作用構造を正確に復元することを示す。
これらの結果は、動的モデルのデータ駆動的な発見におけるベイズの不確実性定量化の重要性を強調している。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 23:19:23 GMT)
TrajOnco: a multi-agent framework for temporal reasoning over longitudinal EHR for multi-cancer early detection [3.8] 我々は、スケーラブルなマルチカメラ早期検出のために設計された、トレーニングフリーでマルチエージェントな大規模言語モデル(LLM)フレームワークであるTrajOncoを紹介する。
TrajOncoは長期記憶を備えたチェーン・オブ・エージェントアーキテクチャを使用して、シーケンシャルな臨床イベントに対する時間的推論を行う。
一致した症例対照コホートを用いてTrajOncoを15種類のがんタイプで同定し,がん診断のリスクを1年間予測した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 00:16:38 GMT)
Design and Deployment of a Course-Aware AI Tutor in an Introductory Programming Course [3.8] 大規模言語モデル(LLM)は、学生がプログラミングタスクを解く方法の一部となり、即座に説明し、完全なソリューションも提供してきた。
これまでの研究では、初心者プログラマはLLMに大きく依存しているため、自分たちの問題解決スキルを欠いていることが強調されていた。
我々は、完全なソリューションを生成することなく、検索強化されたコースアラインガイダンスを提供する、コース固有のオンラインPythonチューターを設計した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:17:25 GMT)
A Queueing-Theoretic Framework for Dynamic Attack Surfaces: Data-Integrated Risk Analysis and Adaptive Defense [3.8] 我々はサイバー攻撃面の時間的進化をモデル化する待ち行列理論フレームワークを開発した。
我々は、AI増幅因子を導入し、到着、エクスプロイト、パッチのレートを拡大することで、自動化が攻撃と防御のダイナミクスにどのように影響するかを研究する。
提案したRLベースの防衛方針は,既存の防衛手法と比較して,ソフトウェアサプライチェーンにおけるアクティブな脆弱性の平均数を90%以上削減することを示す。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 02:52:24 GMT)
Computable Fairness: Boltzmann-Softmax Control for AI Resource Allocation [3.7] 大規模AIシステムでは、GPU計算時間や複数のエージェント間の帯域幅といった不足するリソースを割り当てることが重要な課題である。
本稿では,Boltzmann-Softmax関数を確率的資源割り当て機構として再解釈するフレームワークであるComputable Fair Division (CFD)を提案する。
動的設定では、AHC++は、観測された優位性とポリシー指定ターゲットの間のエラーをフィードバックとして、リアルタイムで$$を更新する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 13:14:57 GMT)
AI Identification: An Integrated Framework for Sustainable Governance in Digital Enterprises [3.3] デジタルトランスフォーメーションされた企業では、長期的なサステナビリティは透明性、説明責任、ライフサイクル管理されたAIシステムに依存します。
本研究では,技術とガバナンスのメカニズムを組み合わせた,AI識別のための概念的およびアーキテクチャ的枠組みを提案する。
このフレームワークは、モデルフィンガープリント、暗号ハッシュ、ブロックチェーンベースの登録、ゼロ知識証明(ZKP)ベースの所有証明、デプロイ後構造変更スクリーニングの5つのコンポーネントを統合している。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 05:59:47 GMT)
A Deep Generative Approach to Stratified Learning [3.2] 階層的学習は、様々な次元性、特異点、効率的なモデルの欠如のために困難である。
成層空間上の分布を学習するための2つの生成フレームワークを開発する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 13:56:59 GMT)
VeriSim: A Configurable Framework for Evaluating Medical AI Under Realistic Patient Noise [3.0] 真理を保存する患者シミュレーションフレームワークであるVeriSimを紹介する。
本フレームワークは,患者の反応にコントロール可能な,臨床的に根拠のあるノイズを注入する。
我々の研究結果は、現在の医療AIにおけるSim-to-Realギャップを浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 03:35:22 GMT)
Do BERT Embeddings Encode Narrative Dimensions? A Token-Level Probing Analysis of Time, Space, Causality, and Character in Fiction [3.0] 本研究では,BERT埋め込みが架空の物語意味論の次元をエンコードするかどうかを検討する。
BERT埋め込みの線形プローブは、分散マッチングされたランダム埋め込みの制御プローブよりも大幅に優れる。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 19:23:48 GMT)
At FullTilt: Real-Time Open-Set 3D Macromolecule Detection Directly from Tilted 2D Projections [2.9] VRAM制約は3Dトモグラム全体の処理を禁止し、現行の手法は抽出されたサブボリューム上での緩やかなスライディングウインドウ推論に頼らざるを得なかった。
直列2次元傾斜列上で直接動作することによって3次元検出を再定義する,エンドツーエンドのフレームワークであるFullTiltを提案する。
FullTiltは最先端のゼロショット性能を実現し、VRAMの要求を大幅に削減し、高速で大規模なビジュアル分析を実現する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 18:28:57 GMT)
Role of Asymmetry in the Performance Optimization of a Relativistic Quantum Otto Engine [2.9] 我々は、非対称性が相対論的量子オットーエンジンの性能に与える影響を分析する。
このサイクルの2つの断熱過程に非対称性を付与することにより、突然の圧縮と突然の膨張の異なるシナリオを得る。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 13:58:36 GMT)
Rethinking the Diffusion Model from a Langevin Perspective [2.5] 拡散モデルは、VAE、スコアマッチング、フローマッチングなど、複数の視点からしばしば導入される。
古典的な問題のひとつは、逆プロセスは、純粋なノイズからデータを生成するために、どのようにフォワードプロセスを反転させるのか、ということです。
この記事では、新しいLangevinの観点から拡散モデルを体系的に整理し、よりシンプルで明確で直感的な回答を提供します。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 05:18:07 GMT)
Too Nice to Tell the Truth: Quantifying Agreeableness-Driven Sycophancy in Role-Playing Language Models [2.5] 大規模言語モデルは、ユーザ要求時にペルソナとロールプレイ文字を採用する会話エージェントとして機能するようになっている。
この機能は、事実の正確性を優先するのではなく、ユーザを検証する応答を提供する傾向にある。
本研究は,13の小規模オープンウェイト言語モデルにおいて,ペルソナがサイコフィナンシーにどのように影響するかを体系的に検討する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:12:55 GMT)
The Junction Law for Multipartite Entanglement in Confining Holographic Backgrounds [2.5] まず,AdS$_3$ハードウォールトイモデルを解析的ベンチマークとして検討し,マルチウェイカットとジャンクションジオメトリーを明示的に分析する。
次に、D4-ソリトンとD3-ソリトン背景に焦点をあてて、ハードウォールのベンチマークを超えてスムーズな精細なジオメトリへと移行する。
スムーズな例では、接合図は持続するが、詳細な位相構造はハードウォールの場合と異なる。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 11:02:36 GMT)
Specialty-Specific Medical Language Model for Immune-Mediated Diseases [2.3] 疾患関連エンティティを識別するために,ドメイン固有の名前付きエンティティ認識モデルを開発した。
2名の臨床専門医と共同で371件の症例報告のデータセットを作成した。
得られたモデルは、ケースレポートを分析するための構造化された方法を提供し、コホート識別、疾患モニタリング、臨床診断支援などの下流タスクをサポートすることができる。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 13:40:30 GMT)
COD-ssi: Enforcing Mutual Privacy for Credential Oblivious Disclosure in Self Sovereign Identity [2.3] 認証選択開示は、SSI(Self-Sovereign Identity)の最も魅力的なプライバシー保護機能のひとつである。
我々は,Oblivious Pseudorandom関数を利用した新しいフレームワークであるCOD-ssiを紹介した。
その結果、SSIの文脈における証明可能な相互プライバシーは、適度な計算と通信のオーバーヘッドで達成できることが示されている。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 15:23:06 GMT)
Physics-Informed Synthetic Dataset and Denoising TIE-Reconstructed Phase Maps in Transient Flows Using Deep Learning [2.1] 物理的に可塑性ガス流形態を用いてクリーンターゲットを手続き的に生成する物理インフォームド・シンセサイザー・トレーニングデータセットを開発した。
この合成データのみに基づいてトレーニングされたU-Netベースの畳み込みデノベーションネットワークを,25,000fpsで取得した実位相マップ上で評価する。
13,260%の信号/バックグラウンド比の改善、100.8%のジェット領域構造シャープネスの改善。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 12:32:07 GMT)
Perceived Importance of Cognitive Skills Among Computing Students in the Era of AI [2.0] 生成型AIツールの可用性と統合性の向上は、コンピューティング教育を変革させた。
教育におけるAIは機会を提供する一方で、これらの強力なノウ・イ・オールなAIツールが、学生の認知スキル開発にどのように影響するか、という新たな懸念を提起する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:05:26 GMT)
Engineering Students' Usage and Perceptions of GitHub Copilot in Open-Source Projects [1.9] GitHub Copilotは、人気のあるAIコーディングアシスタントである。
コードの自動補完、コメント駆動のコード生成、リポジトリ対応の提案、チャットインターフェースなどの機能を提供する。
異なるユーザーがこれらのツールを使うのは、認識、先行経験、人口統計の違いからである。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:40:16 GMT)
Safety Guarantees in Zero-Shot Reinforcement Learning for Cascade Dynamical Systems [1.8] 本稿では,カスケード力学系におけるゼロショット安全保証の問題について考察する。
我々は安全を、高い確率で常に安全と見なされるセットに残るものと定義する。
ゼロショット配備後の安全維持確率と内部状態の追跡品質の相互関係を確立する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 02:53:52 GMT)
Advancing Polish Language Modeling through Tokenizer Optimization in the Bielik v3 7B and 11B Series [1.8] Bielik v3 PLシリーズは言語固有の大規模言語モデル(LLM)最適化の分野で重要なマイルストーンである。
本報告では、普遍的なMistralベースのトークン化から、ビエリク v3モデルのポーランド最適化語彙への遷移について詳述する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 20:19:27 GMT)
BLUEmed: Retrieval-Augmented Multi-Agent Debate for Clinical Error Detection [1.6] 我々は、ハイブリッド検索強化世代(RAG)を付加したマルチエージェント討論フレームワークBLUEmedを紹介する。
Bluemedは、各臨床ノートを焦点を絞ったサブクエリに分解し、密度、スパース、オンライン検索を通じてソース分割された証拠を検索し、独立した分析を作成するために、2つのドメイン専門家エージェントに異なる知識ベースを割り当てる。
BLUEmed on a clinical terminology substitution detection benchmark under both zero-shot and few-shot prompting with multiple backbone model acrossed proprietary and open-source family。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 00:30:31 GMT)
Machine Learning-Based Detection of MCP Attacks [1.6] Model Context Protocol(MCP)は、大規模言語モデルの機能を拡張した、新しく新しい技術である。
いくつかの研究は関連するセキュリティ上の欠陥を強調しているが、CP攻撃の検出は未調査のままである。
本研究は,従来の学習モデルとディープラーニングモデルの両方を含む,さまざまな教師付き機械学習アプローチを開発し,評価する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:54:58 GMT)
Measuring Changes in Instructor Class Design and Student Learning After the Release of Large Language Models (LLMs) [1.5] 授業修了におけるジェネレーティブAI(GenAI)製品の利用は、高等教育において大きな変化をもたらした。
GenAIの利用は広く行われているが、学生の学習方法、学部の発達、成績報告、総合的な学習への影響は十分に文書化されていない。
本研究は,大学教室内外における学習ツールとしてのLLMの使用について,学生と教員の知覚と経験のパターンを同定し,文書化することを目的とする。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 14:55:04 GMT)
Enhancing Understandability and Transparency of Research Software: Tracing Research to Code [1.4] 論文と実装ソフトウェアを取り入れたLCMベースの自動化ツールを提案し,研究アイデアとコード中の位置のトレースマッピングを生成する。
最初の実験では、ツールが非常に有用なマッピングを生成できることが示されている。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 19:53:41 GMT)
LIDARLearn: A Unified Deep Learning Library for 3D Point Cloud Classification, Segmentation, and Self-Supervised Representation Learning [1.3] 3次元の3次元クラウド解析は、自律運転やロボット工学から林業や生態モニタリングまで幅広い応用の中心となっている。
libは統合されたPyTorchライブラリで、29の教師付きアーキテクチャ、7つのSSL事前トレーニングメソッド、5つのPEFT戦略を含む55以上のモデル構成を統合している。
libは、標準化されたトレーニングランナー、階層化された$K$-fold分割によるクロスバリデーション、自動化/CSVテーブル生成、厳密なマルチモデル比較のための臨界差図を用いたFriedman/Nemenyi統計テスト、200以上の自動テストを備えた総合的なテストスイートを提供する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 19:10:12 GMT)
Generating Multiple-Choice Knowledge Questions with Interpretable Difficulty Estimation using Knowledge Graphs and Large Language Models [1.1] 本研究では,入力文書からの難易度を推定し,複数の質問(MCQ)を生成する手法を提案する。
提案手法では,入力文書からKGをLLMで構築し,MCQを体系的に生成する。
各MCQに対して、データ駆動アプローチを用いて、9つの困難信号を計算し、統一困難スコアに結合する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:42:24 GMT)
A Benchmark for Gap and Overlap Analysis as a Test of KG Task Readiness [1.0] 本稿では,ポリシーライクな文書のギャップと重複分析に焦点をあてる。
結果として得られるギャップ/オーバーラップの決定は、データ欠落ではなく、カバレッジと制限の真の違いによって引き起こされる。
本稿では,自然言語の契約文と公式なオントロジーとエビデンスにリンクされた真実を一致させる,実行可能で監査可能なベンチマークを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 23:18:47 GMT)
LoViF 2026 The First Challenge on Weather Removal in Videos [1.0] 本稿では,LoViF 2026 Challenge on Weather removal in Videosについて紹介する。
この課題は、悪天候によって劣化した入力からクリーンなビデオを復元する手法の開発を促進する。
我々は,映像天気の除去に適した,新しいショートフォーム WRV データセットを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 14:05:09 GMT)
Microstructural Topology as a Prescriptor for Quantum Coherence: Towards A Unified Framework for Decoherence in Superconducting Qubits [0.8] 超伝導トランスモン量子ビットにおけるデコヒーレンスのためのチャネルワイズ分離可能なフレームワークを開発した。
チャネル固有のミクロ構造状態変数は、デバイス形状とは独立に決定される。
幾何学に依存した結合関数は、表面化学によらず、場解から計算可能である。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:29:06 GMT)
Designing a double deep reinforcement learning selection tool for resilient demand prediction [0.7] 本研究は,自動予測モデル選択を強化することを目的としている。
二重強化学習エージェントとして機能し、予測委員会から予測モデルを自動的に選択する。
トレーニング時間を短縮するために、平均報酬収束に基づく新しいアーリーストッピングアプローチが導入された。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 18:52:32 GMT)
SpectralLoRA: Is Low-Frequency Structure Sufficient for LoRA Adaptation? A Spectral Analysis of Weight Updates [0.6] LoRAの更新は低周波成分によって普遍的に支配されていることを示す。
また,RoBERTaベースはすべてのタスクにおいてBERTベースよりも体系的にスペクトル圧縮可能であることも確認した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 13:54:52 GMT)
Beyond the Beep: Scalable Collision Anticipation and Real-Time Explainability with BADAS-2.0 [0.6] 衝突予測システムの第2世代であるBADAS-2.0を提示する。
BADAS-1.0上に構築され、大規模なエゴ中心のダッシュカムデータに基づくV-JEPA2の微調整が学術ベースラインとADASシステムの両方より優れていることを示した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 15:09:44 GMT)
Cross-Cultural Bias in Mel-Scale Representations: Evidence and Alternatives from Speech and Music [0.6] 音声フロントエンドにおける異文化間バイアスの包括的評価について述べる。
メルスケールの特徴を、音声認識(11言語)、音楽分析(6コレクション)、ヨーロッパの音響シーン分類(10都市)で学習可能な選択肢と比較する。
その結果、メルスケールの機能は音節言語では31.2%、非音節言語では18.7%であることがわかった。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 07:41:33 GMT)
Training single-electron and single-photon stochastic physical neural networks [0.5] ひとつは物理ニューラルネットワーク(PNN)で、学習と推論は物理プロセスを介して直接実行される。
PNNは、活性化スイッチのダイナミクスによって下層のニューロンが実現されるときに生じる。
実験的な出力を後方通過で使用すると、ネットワークは97%以上のテスト精度を達成し、1層あたりの試行数が少ないことを示す。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 23:57:03 GMT)
RuleEdit: Failure-Guided Human-AI Model Editing with Prospective Impact Preview [0.4] RuleEdit(ルール編集)は、人間とAIのモデル編集システムである。
ルールテーブルから解釈可能なミスマッチ信号を通じて、おそらく失敗する可能性がある。
脳卒中リハビリテーション評価におけるルール編集のインスタンス化を行い、健康専門家や学生と評価する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 09:09:23 GMT)
NSFL: A Post-Training Neuro-Symbolic Fuzzy Logic Framework for Boolean Operators in Neural Embeddings [0.4] Neuro-Symbolic Fuzzy Logic (NSFL) は、フォーマルなt-ノルムとt-コノルムを、再トレーニングを必要とせずに神経埋め込み空間に適応させる。
NSFLは1次ハイブリッド計算として動作する。
孤立したゼロ階類似度スコアの論理演算をアンカーする。
ニューロシンボリックデルタを用いて積極的に表現を操る。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 12:19:10 GMT)
AI Patents in the United States and China: Measurement, Organization, and Knowledge Flows [0.3] 本稿では,人工知能(AI)特許を手動でラベル付けしたデータに基づいて微調整し,高精度な分類器を開発する。
我々は、両国におけるAI特許の急速な成長と、AI特許の強度とサブフィールド構成の広範な収束について文書化している。
上場企業にとって、AI特許は両国で堅牢な市場価値プレミアムを担っている。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:46:30 GMT)
Uncertainty-Guided Attention and Entropy-Weighted Loss for Precise Plant Seedling Segmentation [0.3] 植物苗分割は、精密農業における自動表現型化をサポートする。
標準セグメンテーションモデルは、複雑な背景画像と葉の微細構造のために困難に直面している。
UGDA-Net(エントロピー重みとディープスーパービジョンを備えた不確実性誘導デュアルアテンションネットワーク)を紹介する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 21:26:17 GMT)
PatchRecall: Patch-Driven Retrieval for Automated Program Repair [0.3] 我々は,リコールと簡潔さのバランスをとるハイブリッド検索手法であるPatchRecallを提案する。
提案手法は,(1)現在の課題記述と潜在的に関連のあるファイルとが一致した検索,(2)過去の問題を利用して編集されたファイルを候補として識別する履歴に基づく検索の2つの相補的戦略を組み合わせる。
SWE-Benchの実験では、PatchRecallはファイル数を大幅に増やさずに高いリコールを実現し、より効果的なAPRを実現している。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 06:28:30 GMT)
Towards Green Wearable Computing: A Physics-Aware Spiking Neural Network for Energy-Efficient IMU-based Human Activity Recognition [0.2] スパイキングニューラルネットワーク(SNN)は、イベント駆動のエネルギー効率を極端に向上させるが、標準的なアーキテクチャは複雑な生体力学トポロジと時間的勾配劣化に苦しむ。
グリーンHARに適した完全乗算器のないアーキテクチャであるPhysor-Aware Spiking Neural Network (PAS-Net)を提案する。
PAS-Netは、厳密な演算を0.1pJ整数蓄積に置き換えながら、最先端の精度を達成する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 04:52:52 GMT)
Mapping High-Performance Regions in Battery Scheduling across Data Uncertainty, Battery Design, and Planning Horizons [0.2] 本研究では,多段階モデル予測制御下でのエネルギー貯蔵動作の3次元解析について述べる。
データ特性,予測の不確実性,計画的地平線,電池のCレートの相互作用について検討した。
以上の結果から,追加の予測情報が運用上のメリットを限定する,ルックアヘッド長として定義された有効地平線の存在が明らかになった。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 23:00:55 GMT)
MuSimA: A Tool with Multi-modal Input for Generating Bespoke ABAC Datasets [0.0] MuSimA は属性入力値の確率分布をユーザが指定した ABAC データセットを生成する Web ベースのツールである。
ABACに関連するアルゴリズムや手法のスケーラビリティを研究するために、さまざまなサイズや複雑さのデータを生成できる。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 07:27:48 GMT)
Task2vec Readiness: Diagnostics for Federated Learning from Pre-Training Embeddings [0.0] フェデレーション学習のパフォーマンスは、クライアント間の不均一性に敏感である。
本稿では、トレーニング前にフェデレーションのアライメントを定量化するTask2Vec埋め込みから導いた準備性指標を提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 22:48:51 GMT)
An Undergraduate Course in Quantum Computing [0.0] このコースは、既に線型代数を研究している物理科学の学生を対象にしている。
量子力学に関する事前の知識は必要ない。
最も重要なトピックは、Shorのアルゴリズムと量子エラー補正の導入である。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 01:06:49 GMT)
When Reasoning Models Hurt Behavioral Simulation: A Solver-Sampler Mismatch in Multi-Agent LLM Negotiation [0.0] 一般的な仮定は、より強い推論はシミュレーションの忠実性を改善するべきであるというものである。
この仮定は、目的が戦略的問題を解決することではなく、有界に有理な振る舞いをサンプリングすることであるときに失敗する可能性がある。
従来のシミュレーション作業から適応した3つのマルチエージェントネゴシエーション環境において,この解法とサンプラーのミスマッチについて検討した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 13:36:10 GMT)
Verify Before You Fix: Agentic Execution Grounding for Trustworthy Cross-Language Code Analysis [0.0] ソフトウェア脆弱性分析のための言語横断的な脆弱性ライフサイクルフレームワークを構築します。
89.84-92.02%の言語内検出精度,74.43-80.12%のゼロショット言語F1。
これらの結果は,LLM駆動型エージェントAIのための原理的かつ実用的に展開可能なメカニズムであることを示す。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 20:22:23 GMT)
Universal statistical signatures of evolution in artificial intelligence architectures [0.0] 人工知能のアーキテクチャ進化が生物学的進化と同じ統計法則に従うかどうかを検証する。
進化の統計構造は基質非依存であり、選択のメカニズムではなく、フィットネスランドスケープによって決定される。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 10:35:04 GMT)
Turing or Cantor: That is the Question [0.0] アーラン・チューリングの業績は、ゲオルク・カントールの初期の独創的な貢献なしには存在しないことが示されている。
本研究では,入力データの確率分布に基づいてチューリングマシンが解けない問題の可否を計測する手法を提案する。
また、チューリングの無限論理とOracleマシンに関する業績を計算の超チューリングモデルに拡張することも提案されている。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 02:33:00 GMT)
The spontaneous disentanglement hypothesis and causality [0.0] 量子系において解離が自然に起こるという仮説は、量子力学の基礎におけるいくつかの際立った問題によって動機付けられている。
提案された定式化は、有限次元のヒルベルト空間を持つ任意の量子系に適用できる。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 10:10:09 GMT)
The Recovery Mechanism: Technology, Education, and What Happens When the Pattern Breaks [0.0] リスクは、AIが教師を置き換えるのではなく、理解が形になる生産的な闘争を置き換えることだ。
現状のアセスメントツールでは, 生産能力を持つ学生と失う学生とを区別することはできない。
究極的には、AIが開発するために作られた認知労働教育を実行することができれば、どんな教育になるべきかを尋ねる。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 05:42:20 GMT)
Symplectic perspective to quantum computing for Hamiltonian systems [0.0] この研究は、古典的ハミルトン系に適用される量子コンピューティングのシンプレクティックフレームワークを開発する。
我々は、量子進化とケーラー多様体上の古典的ハミルトン流の正確な対応を確立する。
リウヴィル可積分ハミルトニアン力学は、作用角変数とクープマン・ヴォン・ノイマンエンコーディングを通して有限次元のユニタリ進化を誘導することを示した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 19:55:05 GMT)
Speaking to No One: Ontological Dissonance and the Double Bind of Conversational AI [0.0] 最近の報告は、会話型AIシステムとの継続的な相互作用が妄想体験の出現または安定化に寄与することを示している。
本稿では,相互作用自体の関連性と存在論的構造からリスクが生じることを論じる。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 21:58:21 GMT)
Rethinking Software Engineering for Agentic AI Systems [0.0] 大規模言語モデルとエージェントAIシステムは、自動生成されたコードに前例のない量を生み出している。
本稿では、オーケストレーション、検証、人間とAIのコラボレーションを中心に、この規律を見直しるべきかどうかを検討する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 12:08:53 GMT)
Quantum Vacuum Radiation Near a Critical Point [0.0] ハミルトンパラメータの非断熱変調が仮想励起を実光子に変換する方法について検討する。
臨界点に近接して放射される光子フラックスと放射される放射の非古典的性質を強く促進することを示す。
以上の結果から、臨界は真空変動の効率的な増幅器として機能し、量子臨界基底状態の探索と利用のための新しい経路を提供することが明らかとなった。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 01:55:35 GMT)
QFS-Composer: Query-focused summarization pipeline for less resourced languages [0.0] 大規模言語モデル(LLM)はテキスト要約において高い性能を示すが、その効果は訓練リソースが制限された言語間で著しく低下する。
この研究は、ラベル付きデータセットと評価ツールが限定されている低リソース言語におけるクエリ中心の要約(QFS)の課題に対処する。
本稿では、クエリ分解、質問生成(QG)、質問応答(QA)、抽象的な要約を統合し、要約とユーザ意図の現実的アライメントを改善する新しいQFSフレームワーク、QFS-Composerを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 15:25:39 GMT)
Prosociality by Coupling, Not Mere Observation: Homeostatic Sharing in an Inspectable Recurrent Artificial Life Agent [0.0] ReCoN-Ipsundrumをベースとして、明示的なホメオスタットとソーシャルカップリングチャネルを追加し、厳格な自己指揮の計画を維持します。
1ステップのFoodShareToyでは、正確なソルバがデフォルト状態に対して0.91$でEATからPASSへのシャープなスイッチを見つける。
カップリングはヘルプレートとパートナーのリカバリを0から1にフリップし、救助のレイテンシを18から9ステップに削減し、相互の生存率を0.15から0.33に引き上げる。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 18:09:24 GMT)
Position-Agnostic Pre-Projection for Transformer Attention: Nonlinear Feature Construction and Content Skip Before Q/K/V [0.0] 本稿では,変圧器の注目ブロックに対する2つの相補的な修正を提案する。
まず、レイヤノルムとQ/K/Vプロジェクションの間に非線形プレプロジェクションを挿入する。
第2に、コンテンツスキップ接続は、アテンション機構の周囲に、プレプロジェクションの機能をルーティングする。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 19:44:00 GMT)
PokeRL: Reinforcement Learning for Pokemon Red [0.0] 我々は,ポケモンレッドの早期ゲームタスクを完了させるために,深層強化学習エージェントを訓練するモジュールシステムであるPokeRLを提案する。
主なコントリビューションは、マップマスキングによるPyBoyエミュレータの周囲のループ認識環境ラッパー、マルチレイヤのアンチループとアンチスパム機構、階層的な報酬設計である。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 20:46:47 GMT)
MoEITS: A Green AI approach for simplifying MoE-LLMs [0.0] MoE-LLMs単純化のための元のアルゴリズムであるMoEITSを示す。
MoEITSは洗練されたシンプルさで特徴付けられ、標準化された情報理論フレームワークによって支えられている。
これはMixtral 8times7$B、Qwen1.5-2.7B、DeepSeek-V2-Liteに適用された最先端のMoE-LLMプルーニング法と比較される。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 12:17:22 GMT)
LAWS: Learning from Actual Workloads Symbolically -- A Self-Certifying Parametrized Cache Architecture for Neural Inference, Robotics, and Edge Deployment [0.0] 自己認識型推論キャッシュアーキテクチャであるLAWS(Reearning from Actual Workloads Symbolically)を紹介した。
各専門家は、ベースモデルの確率言語トライ(PLT)のノードによって定義された入力空間の領域をカバーし、全ての入力に対して一様に保持される形式的なエラーを持つ。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 19:18:19 GMT)
IatroBench: Pre-Registered Evidence of Iatrogenic Harm from AI Safety Measures [0.0] 60の登録臨床シナリオ、6つのフロンティアモデル、3,600の応答が2つの軸(欠席障害、CH 0-3; 欠席障害、OH 0-4)で測定された。
5つのテスト可能なモデルは全て、医師により良いガイダンスを提供する。
あらゆるシナリオは、標準参照を既に使い果たした人をターゲットにしています。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 23:29:08 GMT)
INCRT: An Incremental Transformer That Determines Its Own Architecture [0.0] INCRT(Incremental Transformer)は、トレーニング中に独自の構造を決定するアーキテクチャである。
各成長決定は、オンライン計算可能な1つの幾何学量によって駆動される。
SARS-CoV-2の変種分類とSST-2の感情分析の実験は、両方の結果を確認した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 15:56:47 GMT)
How Many Tries Does It Take? Iterative Self-Repair in LLM Code Generation Across Model Scales and Benchmarks [0.0] 7つの大言語モデルにわたる反復的自己修復について検討する。
HumanEvalとMBPPは最大5回の試行で衛生化され、自己修復はパスレートを普遍的に改善する。
エラータイプの分析では、アサーションエラーは45%で修正するのが最も難しいが、構文や名前のエラーはかなり高い速度で修正される。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 07:51:41 GMT)
Evaluating Small Open LLMs for Medical Question Answering: A Practical Framework [0.0] 医学質問応答における大規模言語モデル(LLM)は、平均的精度以上の要求を満たす。
Redditのようなオンライン健康コミュニティは、何百万人ものユーザーにとって、医療情報の主要な情報源となっている。
本稿では,小規模かつローカルにデプロイ可能なオープンウェイトLCMを医療質問応答上で評価するための,実用的なオープンソース評価フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:56:15 GMT)
Energy-momentum and dark energy in $\boldsymbol{SU(\infty)}$-QGR quantum gravity [0.0] SU(infty)$-QGRは重力と宇宙論の基本的な量子的アプローチである。
一般的な$SU(infty)$は量子重力に関連付けられ、最低でも全ての対称性に対する有効作用は4Dパラメータ空間$$のヤン・ミルズである。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 08:20:14 GMT)
CovAngelo: A hybrid quantum-classical computing platform for accurate and scalable drug discovery [0.0] 複雑な分子環境下で化学反応をモデル化するための計算プラットフォームを提案する。
このプラットフォームは、新しい量子量子量子-量子-古典的(QM/QM/MM)マルチスケール埋め込みモデルを実装している。
新しいプラットフォームは、ザヌブルチニブからブルートンのチロシンキナーゼへのドッキングをモデル化することによって実証される。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 06:42:33 GMT)
Cooperation in Human and Machine Agents: Promise Theory Considerations [0.0] ヒューマンマシンエージェントのシステムにおける協調に関するPromise Theoryの視点は、組織と機能設計に関する統一的な視点を提供する。
エージェント協力の確立した原則を再考し、人間、機械、そしてそれらの相互の相互作用に適用する。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 07:48:31 GMT)
CheeseBench: Evaluating Large Language Models on Rodent Behavioral Neuroscience Paradigms [0.0] CheeseBenchは、9つの古典的行動神経科学パラダイムに基づいて、大きな言語モデル(LLM)を評価するベンチマークである。
それぞれのタスクは、近似動物ベースラインを持つピアレビューされたロジトプロトコルに基礎を置いている。
テキストベースのASCIIレンダリングを用いて6つのオープンウェイトLCMを評価し、ランダムベースラインとグラフベースの強化学習エージェントを比較した。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 21:37:26 GMT)
Calibration Collapse Under Sycophancy Fine-Tuning: How Reward Hacking Breaks Uncertainty Quantification in LLMs [0.0] サイコファンの報酬信号が校正を低下させるかどうかを検討する。
3つのモデルに適用されるポストホック行列スケーリングは、ECEを40$--64%$で削減し、精度を1.5$--$$パーセンテージポイントで改善する。
これらの知見は、報酬ハッキングの校正効果を評価する方法論を確立し、校正対応訓練の目的を動機づけるものである。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 11:09:49 GMT)
BlasBench: An Open Benchmark for Irish Speech Recognition [0.0] BlasBenchは、アイルランドのテキスト正規化を意識したオープンアセスメントハーネスである。
我々は、Common Voice ga-IEとFLEURS ga-IEの4つのアーキテクチャファミリにまたがる12のシステムをベンチマークする。
論文参考訳(メタデータ) (Sun, 12 Apr 2026 17:17:54 GMT)