DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models [219.6] 本稿では,より優れた推論とエージェント性能で高い計算効率を調和させるモデルであるDeepSeek-V3.2を紹介する。
計算複雑性を大幅に低減する効率的な注意機構であるDSAを導入する。
DeepSeek-V3.2は、堅牢な強化学習プロトコルを実装し、訓練後の計算をスケールすることにより、GPT-5と同等に動作する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:25:14 GMT)
From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence [150.4] 大規模言語モデル(LLM)は、自然言語記述を直接関数コードに変換することによって、自動ソフトウェア開発を変革した。
コードLLMに関する総合的な合成と実践的ガイド(一連の解析および探索実験)を提供する。
一般LLM(GPT-4, Claude, LLaMA)とコード特殊化LLM(StarCoder, Code LLaMA, DeepSeek-Coder, QwenCoder)のコード機能の解析を行う。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:14:33 GMT)
Measuring Agents in Production [133.8] 生産におけるAIエージェントの大規模体系的研究について紹介する。
プロダクションエージェントは通常、シンプルで制御可能なアプローチで構築されています。
信頼性は依然として最大の開発課題であり、エージェントの正しさの確保と評価の難しさによって推進されます。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:45:10 GMT)
MagicQuillV2: Precise and Interactive Image Editing with Layered Visual Cues [106.0] 本稿では,生成画像編集のための合成パラダイムであるMagicQuill V2を提案する。
本手法は,創造性を制御可能な視覚的手がかりのスタックに分解する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:59:58 GMT)
Think in Parallel, Answer as One: Logit Averaging for Open-Ended Reasoning [102.1] ThinkMergeは、トレーニング不要でプラグ&プレイのデコード戦略だ。
並列推論トレースをKで実行し、同期点における次のTokenロジットを平均化し、単一のコヒーレントな出力を生成する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:35:31 GMT)
Joint Distillation for Fast Likelihood Evaluation and Sampling in Flow-based Models [100.3] 今日の最高の生成モデルの中には、単一の可能性を計算するために、数百から数千の神経機能評価を必要とするものもあります。
本研究では, 高速流動継手蒸留法 (F2D2) を提案し, サンプリングに必要なNFEの数を2桁に減らした。
F2D2はモジュール構造であり、既存のフローベースの数ステップサンプリングモデルと互換性がある。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:48:20 GMT)
From Panel to Pixel: Zoom-In Vision-Language Pretraining from Biomedical Scientific Literature [86.8] パネル2パッチ(Panel2Patch)は、既存のバイオメディカル科学文献から階層構造をマイニングする新しいデータパイプラインである。
科学的数字とキャプションが与えられた場合、Panel2Patchはレイアウト、パネル、ビジュアルマーカーを解析し、フィギュア、パネル、パッチレベルにおいて階層的に協調した視覚言語ペアを構築する。
我々は,不均一な目的を粗いドクティックな記述から細かな領域に焦点を絞ったフレーズに統一する,粒度を考慮した事前学習戦略を開発した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:37:51 GMT)
Glance: Accelerating Diffusion Models with 1 Sample [84.0] 拡散モデルは画像生成において顕著な成功を収めているが、その展開は計算コストの重さに制約されている。
小型学生モデルの訓練による余分なステップを省略する低段蒸留の試み
このフェーズアウェア戦略を、スローかつ高速なデノゲーションフェーズを専門とする2人の専門家によってインスタンス化します。
驚くべきことに、学生モデルの再訓練に多大な労力を費やす代わりに、軽量のLoRAアダプタでベースモデルを装備するだけで、効率的な加速と強力な一般化が達成できる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:05:21 GMT)
DiCaP: Distribution-Calibrated Pseudo-labeling for Semi-Supervised Multi-Label Learning [83.9] 半教師付きマルチラベル学習は、ラベルのないデータを活用してモデルの性能を向上させることを目的としている。
既存の手法の多くは、その品質に関わらず、すべての擬似ラベルに等しい重みを割り当てる。
擬似ラベル重みの校正に後部精度を推定する正当性認識フレームワークDiCaPを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:32:25 GMT)
From Atomic to Composite: Reinforcement Learning Enables Generalization in Complementary Reasoning [83.9] 本研究では、内部パラメトリック知識と外部コンテキスト情報の統合を必要とする複雑なタスクである補完的推論について検討する。
RLは確率増幅器ではなく推論合成器として機能する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:17:18 GMT)
Video Diffusion Models Excel at Tracking Similar-Looking Objects Without Supervision [80.3] 視覚的に類似した物体を動きによって識別することは、コンピュータビジョンにおいて重要な課題である。
予め訓練したビデオ拡散モデルでは,タスク固有の訓練を伴わないトラッキングに適した動作表現が本質的に学習されていることがわかった。
提案手法は,最近確立されたベンチマークに対する自己教師型アプローチよりも6ポイント向上した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:17:34 GMT)
Steering Vision-Language-Action Models as Anti-Exploration: A Test-Time Scaling Approach [78.5] 動作チャンクの高忠実度検証に軽量な擬数推定器を適用したテスト時間スケーリングフレームワークである textbfTACO を提案する。
我々の手法は、オフライン強化学習(RL)における古典的な反探索原理に似ており、勾配のないため、計算上の大きな恩恵をもたらす。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:42:54 GMT)
VIGS-SLAM: Visual Inertial Gaussian Splatting SLAM [75.6] 視覚-慣性3DガウスプラッティングSLAMシステムであるVIGS-SLAMについて述べる。
堅牢なリアルタイムトラッキングと高忠実度再構築を実現する。
本手法は,一貫した最適化フレームワーク内に視覚的および慣性的キューを密結合する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 00:19:13 GMT)
Self-Improving VLM Judges Without Human Annotations [74.3] 自己合成データのみを用いて,人間の好みのアノテーションを使わずにVLM判断モデルを自己学習する枠組みを提案する。
提案手法は,Llama-3.2-11Bマルチモーダル判定を0.38から0.51に改善する。
これらの注釈のない結果の全体的な強みは、VLM能力の急速な向上とともに進化する将来の自己判断の可能性を示している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 20:52:19 GMT)
Flexible Gravitational-Wave Parameter Estimation with Transformers [73.4] 本稿では,予測時間における多様な解析設定への適応を可能にする,フレキシブルトランスフォーマーベースのアーキテクチャをトレーニング戦略と組み合わせて導入する。
我々は、Dingo-T1と呼ばれる単一のフレキシブルモデルが、第3のLIGO-Virgo-KAGRA観測ランから48の重力波イベントを解析できることを実証した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:49:08 GMT)
Cross-Domain Offline Policy Adaptation with Dynamics- and Value-Aligned Data Filtering [71.1] クロスドメインオフライン強化学習は、ターゲット環境にデプロイされたエージェントをトレーニングすることを目的としている。
近年の進歩は、ターゲットドメインとの動的アライメントを示すソースドメインサンプルを選択的に共有することでこの問題に対処している。
これらのアプローチは、動的アライメントとテキスト値アライメント(すなわち、ソースドメインから高品質で高価値なサンプルを選択すること)にのみ焦点をあてる。
textbfunderlineDynamics-および textbfunderlineValue-aligned textbfunderlineDataを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:45:40 GMT)
WeMMU: Enhanced Bridging of Vision-Language Models and Diffusion Models via Noisy Query Tokens [70.0] 本稿では,VLMと拡散モデル間の分散表現空間をエンドツーエンドの最適化により学習するノイズクエリトークンを提案する。
また、細粒度画像の詳細を復元する線形投影を用いたVAE分岐も導入する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:02:20 GMT)
Simple Agents Outperform Experts in Biomedical Imaging Workflow Optimization [69.4] 生産レベルのコンピュータビジョンツールを科学データセットに適応させることは、重要な"ラストマイル"ボトルネックである。
我々は、AIエージェントを使ってこの手動コーディングを自動化し、最適なエージェント設計のオープンな問題に焦点を当てる。
簡単なエージェントフレームワークが、人間-専門家のソリューションよりも優れた適応コードを生成することを実証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:42:26 GMT)
Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts [68.2] 単一ドメインのオフライン強化学習(RL)は、しばしば限られたデータカバレッジに悩まされる。
ドメイン間のオフラインRLは、動的シフトを伴う他のドメインからの追加データを活用することでこの問題に対処する。
本稿では、クロスドメインオフラインRLにおける動的シフトに対する二重(列車時間とテスト時間の両方)ロバスト性について検討する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:20:39 GMT)
DynamicVerse: A Physically-Aware Multimodal Framework for 4D World Modeling [68.0] 物理スケールでマルチモーダルな4DワールドモデリングフレームワークであるDynamicVerseを紹介した。
我々は視覚、幾何学、マルチモーダルモデルを用いて、メートルスケールの静的幾何、実世界の動的運動、インスタンスレベルのマスク、そして全体論的キャプションを解釈する。
DynamicVerseは、100K以上のビデオと800K以上の注釈付きマスク、インターネットビデオから10M以上のフレームからなる大規模なデータセットを提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:24:27 GMT)
Nav-$R^2$ Dual-Relation Reasoning for Generalizable Open-Vocabulary Object-Goal Navigation [67.7] Nav-$R2$は、ターゲット環境モデリングと環境行動計画という2つのタイプの関係を明示的にモデル化するフレームワークである。
我々のSA-Memは、時間的・意味的両面から最も標的に関連し、現在の観測関連の特徴を保っている。
Nav-R2は、合理化され効率的なパイプラインを通して見えないオブジェクトをローカライズする、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:21:02 GMT)
MultiShotMaster: A Controllable Multi-Shot Video Generation Framework [67.4] 現在の生成技術はシングルショットクリップで優れているが、物語的なマルチショットビデオを作成するのに苦労している。
高度に制御可能なマルチショットビデオ生成のためのフレームワークであるMultiShotMasterを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:59:48 GMT)
WorldMM: Dynamic Multimodal Memory Agent for Long Video Reasoning [66.2] 我々は,複数の相補的記憶から構築・取得する,新しいマルチモーダルメモリエージェント WorldMM を紹介する。
WorldMMは5つの長いビデオ質問回答ベンチマークで既存のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:14:52 GMT)
In-Context Sync-LoRA for Portrait Video Editing [66.2] Sync-LoRAは、高品質な視覚的修正を実現するポートレートビデオの編集方法である。
我々は、同一の運動軌跡を描写するが外観が異なるペアビデオを用いて、文脈内LoRAを訓練する。
このトレーニング設定は、ソースビデオからのモーションキューと、編集された第1フレームに導入された視覚的変化を組み合わせることをモデルに教える。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:40:35 GMT)
Multimodal Continual Learning with MLLMs from Multi-scenario Perspectives [61.6] 視覚理解における連続学習は,多モーダル大言語モデル(MLLM)における破滅的忘れに対処することを目的としている
我々は、4つの異なるシナリオと視点を含むマルチモーダル視覚理解データセット(MSVQA)を構築した。
MLLMを用いたmUltimodal coNtInual Learningを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:59:25 GMT)
Stabilizing Reinforcement Learning with LLMs: Formulation and Practices [61.4] 本稿では,REINFORCEなどの政策勾配法において,真のシーケンスレベルの報酬を代用トークンレベルの目的によって最適化できる理由と条件を示す。
この洞察は、RLトレーニングの安定化において、広く採用されているいくつかのテクニックの重要な役割について、原則化された説明を提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:29:52 GMT)
Cross-Lingual Prompt Steerability: Towards Accurate and Robust LLM Behavior across Languages [61.2] システムプロンプトは、推論時に大きな言語モデル(LLM)を条件付けするための軽量で強力なメカニズムを提供する。
本稿では, 異なるシステムが, 正確な, 頑健な言語間行動に対して, ステアモデルをどのように促すかを包括的に検討する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:54:54 GMT)
CryptoBench: A Dynamic Benchmark for Expert-Level Evaluation of LLM Agents in Cryptocurrency [60.8] 本稿では,Large Language Model (LLM)エージェントの現実的能力を厳格に評価するために設計された,最初の専門家による動的ベンチマークであるCryptoBenchを紹介する。
検索と予測のための汎用エージェントベンチマークとは異なり、プロの暗号分析は特定の課題を提示する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:26:24 GMT)
VLA Models Are More Generalizable Than You Think: Revisiting Physical and Spatial Modeling [60.3] 本稿では,新しいカメラ視点と視覚摂動の下で,視覚言語行動モデルが急激に劣化することを示す。
本稿では,軽量で学習可能な更新によって視覚表現を再分類するワンショット適応フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:16:13 GMT)
MAViD: A Multimodal Framework for Audio-Visual Dialogue Understanding and Generation [59.2] 音声対話理解・生成のための新しいマルチモーダルフレームワークMAViDを提案する。
本フレームワークは,ユーザのマルチモーダルクエリを正確に解釈し,鮮明かつコンテキスト的にコヒーレントなロングデュレーション対話を生成できる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:55:53 GMT)
The Trojan Knowledge: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search [58.9] 大規模言語モデル(LLM)は、有害な出力を誘導するために安全ガードレールをバイパスするジェイルブレイク攻撃に弱いままである。
CKA-Agent(Correlated Knowledge Attack Agent)は、ターゲットモデルの知識基盤の適応的木構造探索としてジェイルブレイクを再構成する動的フレームワークである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:54:54 GMT)
PPTArena: A Benchmark for Agentic PowerPoint Editing [57.6] 我々はPowerPoint編集のベンチマークを導入し、自然言語による実際のスライドに対する信頼性のある修正を計測する。
PPTArenaは100のデッキ、2125のスライド、テキスト、チャート、テーブル、アニメーション、マスターレベルのスタイルを対象とする800以上の編集に焦点を当てている。
本稿では,意味的な編集シーケンス,ハイレベルなプログラムツール間の経路,そして正確な制御のための決定論的XML操作を計画する構造対応スライド編集エージェントを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:59:50 GMT)
TALO: Pushing 3D Vision Foundation Models Towards Globally Consistent Online Reconstruction [57.5] 3次元視覚基礎モデルでは、1つのフィードフォワードパスを通して、未校正画像からキー3D属性を再構成する際の強力な一般化が示されている。
近年の戦略は,グローバルトランスフォーメーションの解決によって連続的な予測と整合するが,本分析では,仮定の妥当性,局所的なアライメント範囲,雑音的幾何の下でのロバスト性といった基本的な限界を明らかにしている。
本研究では,グローバルに伝播する制御点を利用して空間的に異なる不整合を補正する,Tin Plate Splineに基づく高DOFおよび長期アライメントフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:22:20 GMT)
Hierarchical Process Reward Models are Symbolic Vision Learners [56.9] 記号型コンピュータビジョンは、明示的な論理規則と構造化された表現を通して図を表現し、機械ビジョンの解釈可能な理解を可能にする。
これは、ピクセルベースのビジュアルモデルと根本的に異なる学習パラダイムを必要とする。
本稿では, インプットダイアグラムをプリミティブにエンコードし, インプットダイアグラムを再構築する自己教師型オートエンコーダを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:46:40 GMT)
LumiX: Structured and Coherent Text-to-Intrinsic Generation [56.7] 本稿では,コヒーレントテキスト-内在的生成のための構造化拡散フレームワークであるLumiXを紹介する。
LumiXはコヒーレントで物理的に有意義な結果をもたらし、23%のアライメントとより良い選好スコアを得る。
同じフレームワーク内でイメージ条件の分解を行うことも可能だ。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:56:02 GMT)
BOOM: Beyond Only One Modality KIT's Multimodal Multilingual Lecture Companion [56.4] 講義音声とスライドを共同で翻訳し、3つのモードで同期出力を生成する多言語講義コンパニオンである textbfBOOM を提示する。
実験により,スライド対応文字起こしは,要約や質問応答といった下流タスクにカスケード効果をもたらすことが示された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:27:26 GMT)
H-Neurons: On the Existence, Impact, and Origin of Hallucination-Associated Neurons in LLMs [56.3] 大型言語モデル(LLM)における幻覚関連ニューロン(H-Neurons)の同定
同定の面では、驚くほどスパースなニューロンのサブセットが幻覚の発生を確実に予測できることが示される。
行動への影響に関して、制御された介入は、これらのニューロンが過度に順応する行動と因果関係があることを明らかにする。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:08:39 GMT)
PanFoMa: A Lightweight Foundation Model and Benchmark for Pan-Cancer [55.0] トランスフォーマーと状態空間モデルの強みを組み合わせた軽量ハイブリッドニューラルネットワークであるPanFoMaを紹介する。
PanFoMaはフロントエンドのローカルコンテキストエンコーダと共有自己認識層から構成され、複雑で秩序に依存しない遺伝子相互作用をキャプチャする。
また,350万以上の高品質な細胞を含む大規模パンキャンサー単細胞ベンチマークPanFoMaBenchを構築した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:31:31 GMT)
U4D: Uncertainty-Aware 4D World Modeling from LiDAR Sequences [54.8] 既存の生成フレームワークは、すべての空間領域を均一に扱い、現実世界のシーンで様々な不確実性を見渡せる。
4次元LiDAR世界モデリングのための不確実性認識フレームワークであるU4Dを提案する。
提案手法はまず,事前訓練されたセグメンテーションモデルから空間不確実性マップを推定し,意味論的に困難な領域を局所化する。
次に,(1)高エントロピー領域を微細な幾何学的忠実度で再構成する不確実領域モデリング,(2)学習された構造的先行条件の下で残りの領域を合成する不確実条件完備化という2つの段階を通じて,「ハード・トゥ・イージー」な方法で生成を行う。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:59:57 GMT)
Zero-Shot Instruction Following in RL via Structured LTL Representations [54.1] リニア時間論理(LTL)は、強化学習(RL)エージェントのための複雑で構造化されたタスクを特定するための魅力的なフレームワークである。
近年の研究では、命令を有限オートマトンとして解釈し、タスク進捗を監視する高レベルプログラムと見なすことができ、テスト時に任意の命令を実行することのできる1つのジェネラリストポリシーを学習できることが示されている。
本稿では,この欠点に対処する任意の命令に従うために,マルチタスクポリシーを学習するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:44:51 GMT)
Guardian: Detecting Robotic Planning and Execution Errors with Vision-Language Models [53.2] 本稿では,多種多様な計画および実行障害を生成するために,軌道を手続き的に乱す自動ロボット故障合成手法を提案する。
RLBench-Fail, BridgeDataV2-Fail, UR5-Failの3つの新しい故障検出ベンチマークを構築した。
次に、詳細な障害推論と検出のためのマルチビューイメージを備えたVLMであるGuardianをトレーニングします。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:33:19 GMT)
Guided Self-Evolving LLMs with Minimal Human Supervision [53.1] 無誘導の自己進化システムは、しばしば訓練として素早く、または劣化する。
R-Fewはガイド付きセルフプレイチャレンジャー(Self-Play Challenger)買収フレームワークで、コンテキスト内接地と混合トレーニングを通じて、軽量な人間の監視を取り入れている。
R-Fewは、数学と一般的な推論ベンチマークで一貫した反復的な改善を実現している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:06:11 GMT)
Efficient Eye-based Emotion Recognition via Neural Architecture Search of Time-to-First-Spike-Coded Spiking Neural Networks [52.6] Time-to-first-Spike (TTFS)で符号化されたスパイクニューラルネットワーク(SNN)は、アイベースの感情認識に有望なソリューションを提供する。
TTFS-ERは、目に基づく感情認識のためにTTFS SNN用に設計された最初のニューラルネットワーク検索フレームワークである。
ニューロモルフィックハードウェア上に展開すると、TNAS-ERは48ミリ秒の低レイテンシと0.05Jのエネルギー消費を達成する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:35:49 GMT)
PixPerfect: Seamless Latent Diffusion Local Editing with Discriminative Pixel-Space Refinement [52.2] PixPerfectは、さまざまなLCMアーキテクチャやタスクにまたがるシームレスで高忠実なローカル編集を提供するピクセルレベルの精細化フレームワークである。
インペイント、オブジェクト除去、挿入ベンチマークの実験により、PixPerfectは知覚の忠実度と下流編集性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:35:57 GMT)
How to DP-fy Your Data: A Practical Guide to Generating Synthetic Data With Differential Privacy [52.0] Differential Privacy(DP)は、情報漏洩を推論し、制限するフレームワークである。
Differentially Private Synthetic Dataは、ソースデータの全体的なトレンドを保存する合成データを指す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:14:39 GMT)
Learning What to Attend First: Modality-Importance-Guided Reasoning for Reliable Multimodal Emotion Understanding [50.0] モダリティ・コンパタンス(MI)は、感情に支配的なモダリティを識別するためのシンプルで効果的なメカニズムである。
MIGRは推論シーケンスを再編成し、その説明は対象の感情に対して最も重要なモダリティから始まる。
その結果、MIGRは推論信頼性を大幅に改善し、感情的に矛盾した説明を伴う正しい予測の事例を減少させることがわかった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:29:41 GMT)
LoVoRA: Text-guided and Mask-free Video Object Removal and Addition with Learnable Object-aware Localization [49.9] LoVoRAは、マスクのないビデオオブジェクトの削除と追加のための新しいフレームワークである。
提案手法は,画像間翻訳,光フローベースのマスク伝搬,ビデオペインティングを統合し,時間的に一貫した編集を可能にする。
LoVoRAは、推論中に外部制御信号を必要とせずに、エンドツーエンドのビデオ編集を実現する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:01:07 GMT)
VACoT: Rethinking Visual Data Augmentation with VLMs [47.7] Visual Augmentation Chain-of-Thought(VACoT)は、モデル推論中の画像拡張を動的に実行するフレームワークである。
VACoTは、特にOCR関連の敵シナリオにおいて、挑戦的およびアウト・オブ・ディストリビューションな入力に対する堅牢性を大幅に改善する。
本稿では,冗長応答をペナルティ化しながら,必要な増大を促す条件付き報酬方式を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:11:32 GMT)
GUI Exploration Lab: Enhancing Screen Navigation in Agents via Multi-Turn Reinforcement Learning [47.3] 実世界のPCソフトウェアとモバイルアプリは複雑でプロプライエタリであるため、エージェントのトレーニングや評価に必要な包括的な環境情報を得るのは難しい。
本稿ではGUIエージェントナビゲーション研究のためのシミュレーション環境エンジンであるGUI Exploration Labを紹介する。
広範囲な実験を通して、教師付き微調整は基礎知識の効果的な記憶を可能とし、その後の訓練において重要な基礎となることが判明した。
静的およびインタラクティブなベンチマークにおいて,本手法の有効性を検証し,実世界のシナリオに効果的に応用できることを実証した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:11:23 GMT)
Adversarial Jamming for Autoencoder Distribution Matching [45.9] 本稿では,オートエンコーダの潜伏空間を正規化するために,対向無線ジャミングを用いることを提案する。
我々は標準変分オートエンコーダとワッサーシュタインオートエンコーダに匹敵する分布を実現する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:23:25 GMT)
OneThinker: All-in-one Reasoning Model for Image and Video [45.8] 多様な視覚的タスクにおける画像と映像の理解を統一するオールインワン推論モデルであるOneThinkerを提案する。
実験によると、OneThinkerは10の基本的な視覚的理解タスクに対して、31のベンチマークで強力なパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:59:52 GMT)
Aetheria: A multimodal interpretable content safety framework based on multi-agent debate and collaboration [45.3] Aetheriaはマルチエージェントの議論とコラボレーションに基づくマルチモーダル解釈可能なコンテンツ安全性フレームワークである。
Aetheriaは詳細な、追跡可能な監査レポートを生成し、全体的なコンテンツの安全性の正確さにおいて、ベースラインよりも大きな利点を示している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:49:54 GMT)
ReVSeg: Incentivizing the Reasoning Chain for Video Segmentation with Reinforcement Learning [44.5] ReVSegは、事前訓練された視覚言語モデルのネイティブインターフェースにおけるシーケンシャルな決定として推論を実行する。
我々は、多段階推論連鎖を最適化するために強化学習を採用し、モデルが結果駆動信号から判断品質を自己定義できるようにする。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:44:12 GMT)
TEXTRIX: Latent Attribute Grid for Native Texture Generation and Beyond [42.9] TEXTRIXは、高忠実なテクスチャ合成と下流アプリケーションのためのネイティブな3D属性生成フレームワークである。
提案手法は遅延型3D属性グリッドを構築し, スパースアテンションを備えた拡散変圧器を利用する。
このネイティブ表現に基づいて構築されたこのフレームワークは、グリッド上のセマンティック属性を予測するために同じアーキテクチャをトレーニングすることで、自然に高精度な3Dセグメンテーションに拡張する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:18:20 GMT)
"Can you feel the vibes?": An exploration of novice programmer engagement with vibe coding [42.8] ビブコーディング(vibe coding)とは、直接のコードオーサシップではなく、自然言語のプロンプトを通じてソフトウェアを作成することを指す。
本稿では、初心者プログラマと混合経験チームがどのようにバイブコーディングに関わるかを調査する1日間のハッカソンについて報告する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:32:23 GMT)
WorldPack: Compressed Memory Improves Spatial Consistency in Video World Modeling [42.5] 効率的な圧縮メモリを備えたビデオワールドモデルであるWorldPackを提案する。
WorldPackは、長期世代における空間的一貫性、忠実度、品質を著しく改善する。
パフォーマンスはMinecraftのベンチマークであるLoopNavで評価されています。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:06:23 GMT)
Distill, Forget, Repeat: A Framework for Continual Unlearning in Text-to-Image Diffusion Models [42.1] 本稿では, 減量要求の順序の下で, 目標と安定性を確保できる新しい生成蒸留に基づく連続的アンラーニングフレームワークを提案する。
10段階の逐次ベンチマーク実験により,提案手法はより忠実な概念を忘れることが実証された。
このフレームワークは、大規模生成モデルのデプロイとメンテナンスの責任を負うための実行可能な経路を提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:22:32 GMT)
CAMEO: Correspondence-Attention Alignment for Multi-View Diffusion Models [40.4] マルチビュー拡散モデルは、近年、新しいビュー合成の強力なパラダイムとして出現している。
本稿では,幾何学的対応を用いた注意図を直接監督する学習手法であるCAMEOを紹介する。
CAMEOはモデルに依存しず,任意の多視点拡散モデルに適用可能であることを実証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:59:57 GMT)
HUD: Hierarchical Uncertainty-Aware Disambiguation Network for Composed Video Retrieval [39.5] 階層的不確実性認識型曖昧性ネットワーク(HUD)という,新しいビデオ検索フレームワークを提案する。
HUDは、ビデオとテキスト間の情報密度の格差を利用して、マルチモーダルクエリ理解を強化する最初のフレームワークである。
提案するHUDは,CIRタスクにも適用可能で,CVRタスクとCIRタスクの3つのベンチマークデータセットに対して,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:10:16 GMT)
SPARK: Stepwise Process-Aware Rewards for Reference-Free Reinforcement Learning [39.2] 密度の高いステップレベルのフィードバックを提供するプロセス報酬モデル(PRM)は、強化学習の可能性を示している。
筆者らはSPARK(SPARK)という3段階のフレームワークを提案し、第1段階ではジェネレータモデルが多様な解を生成し、検証器モデルがそれらを評価する。
ステップレベルで複数の独立した検証を集約することで、根底的な結果管理を超越したプロセス報酬モデルのトレーニングデータが得られることを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:30:47 GMT)
Reaching Sachdev-Ye-Kitaev physics by shaking the Hubbard model [39.1] Floquet Engineeringの特定の形態である「運動駆動」が、単一粒子のプロセスを取り除き、準ランダムな全対全相互作用を生成する方法を示す。
以上の結果から,動力学的駆動の冷原子実現は,SYKモデルの量子シミュレーションのための実用的かつ正確なプラットフォームを提供することが明らかとなった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:35:31 GMT)
Z-Image: An Efficient Image Generation Foundation Model with Single-Stream Diffusion Transformer [39.0] Z-Imageは、"スケール・アット・オール・コスト"パラダイムに挑戦する効率的な基礎生成モデルである。
我々のモデルは、様々な分野において主要な競合相手に匹敵する、またはそれを上回るパフォーマンスを達成する。
当社のコード、ウェイト、オンラインデモを公開し、予算に優しい、最先端のジェネレーティブモデルの開発を奨励しています。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:45:56 GMT)
Spoken Conversational Agents with Large Language Models [38.6] このチュートリアルは、カスケードされたASR/NLUから、エンドツーエンドの検索および視覚接地システムへのパスを蒸留する。
テキストLLMを音声、モーダルアライメント、共同音声テキスト訓練に適用する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:02:10 GMT)
Adaptive Regime-Switching Forecasts with Distribution-Free Uncertainty: Deep Switching State-Space Models Meet Conformal Prediction [38.4] 適応等角推論(Adaptive Conformal Inference, ACI)と集約変種(AgACI)を結合したDeep Switching State Space Modelsによるレシエーションスイッチング予測の分布自由不確実性について検討する。
また、S4, MC-Dropout GRU, スパースガウス過程を含む強力なシーケンスベースライン上に位置する統一型コンフォメーションラッパーを導入し、非定常性とモデル不特定性の下で有限サンプルの限界保証付きオンライン予測バンドを生成するための変更点局所モデルを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:21:01 GMT)
Masking Matters: Unlocking the Spatial Reasoning Capabilities of LLMs for 3D Scene-Language Understanding [38.0] 3次元空間言語指導マスク(3D-SLIM)は,3次元シーンの空間構造に合わせて,因果マスクを適応的注意マスクに置き換える効果的なマスキング戦略である。
3D-SLIMは単純で、アーキテクチャの変更を必要とせず、余分なパラメータを追加しないが、多様な3Dシーン言語タスク間で大幅なパフォーマンス向上をもたらす。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:22:36 GMT)
Belobog: Move Language Fuzzing Framework For Real-World Smart Contracts [37.8] 本稿では,モブスマートコントラクトのためのファジングフレームワークであるBelobogを紹介する。
Belobogは型対応であり、生成されたトランザクションと変更されたトランザクションが適切に型付けされていることを保証します。
我々は,Belobogが100%クリティカルかつ79%の重大な脆弱性を人手による検査で検出できることを示した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:36:13 GMT)
OpenREAD: Reinforced Open-Ended Reasoning for End-to-End Autonomous Driving with LLM-as-Critic [36.8] OpenREADは、OpenEN-ended Reasoning強化視覚言語モデル(VLM)ベースの自律運転(AD)フレームワークである。
これは、高レベルの推論から低レベルの軌道計画まで、全スペクトルにわたるエンドツーエンド強化微調整(RFT)を可能にする。
広範囲な実験により、共同エンドツーエンドのRFTは上流と下流の両方で大幅な改善をもたらすことが確認された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:58:48 GMT)
DGGT: Feedforward 4D Reconstruction of Dynamic Driving Scenes using Unposed Images [36.6] ポーズレス動的シーン再構築のための統合フレームワークである textbf driving Gaussian Grounded Transformer (DGGT) を紹介する。
提案手法は,フレームごとの3次元ガウスマップとカメラパラメータを共同で予測し,軽量なダイナミックヘッドでダイナミックスを歪曲する。
拡散ベースのレンダリング改善により、運動・補間アーティファクトがさらに減少し、スパース入力下での新規ビュー品質が向上する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:29:18 GMT)
Training Dynamics of Learning 3D-Rotational Equivariance [36.5] 対称性に依存しないモデルがいかに素早く対称性を尊重するかを考察する。
3次元回転の場合、非同変モデルの損失ペナルティは訓練を通して小さくなる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 00:48:09 GMT)
Taming Camera-Controlled Video Generation with Verifiable Geometry Reward [36.3] 我々は、事前訓練されたビデオ生成器を正確なカメラ制御のために最適化するオンライン強化学習フレームワークを導入する。
生成されたビデオと参照ビデオの両方の3次元カメラ軌跡を推定し、各軌跡を短いセグメントに分割し、セグメントの相対的なポーズを計算する。
我々は、多彩な大振幅カメラの動きと、様々な主題のダイナミックスを持つシーンを特徴とする包括的データセットを構築した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:33:19 GMT)
Unsupervised Structural Scene Decomposition via Foreground-Aware Slot Attention with Pseudo-Mask Guidance [36.2] 本研究では,フォアグラウンドを背景から切り離して正確なオブジェクト発見を可能にする2段階フレームワークであるフォアグラウンド・アウェア・スロット・アテンション(FASA)を提案する。
第1段階では、FASAは背景領域と背景領域を区別する粗いシーン分解を行う。
第2段階では、第1スロットが背景を捉え、残りのスロットが個々の前景オブジェクトを表現するために競うマスク付きスロットアテンション機構を導入する。
合成データセットと実世界のデータセットの両方の実験は、FASAが一貫して最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:14:05 GMT)
GeoBridge: A Semantic-Anchored Multi-View Foundation Model Bridging Images and Text for Geo-Localization [36.2] クロスビュージオローカライゼーションは、クエリ画像に視覚的に対応するジオタグ付き参照画像を取得することで位置を推測する。
従来の衛星中心のパラダイムは、高解像度または最新の衛星画像が利用できない場合にロバスト性を制限する。
ビュー間の双方向マッチングを行うモデルであるGeoBridgeを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:28:22 GMT)
A Human-centric Framework for Debating the Ethics of AI Consciousness Under Uncertainty [35.5] 本稿では,哲学的不確実性に基づく構造的3段階の枠組みを提案する。
我々は、私たちのメタ倫理的スタンスとして、AI意識に関する5つの事実的判断を、人間中心主義と共に確立する。
我々のアプローチは哲学的な厳密さと実践的な指導のバランスを取り、意識と人間同型を区別し、責任ある進化の経路を作る。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:15:01 GMT)
PaperDebugger: A Plugin-Based Multi-Agent System for In-Editor Academic Writing, Review, and Editing [35.4] Paper Debuggerは、インエディター、マルチエージェント、プラグインベースの学術書記アシスタントである。
デモでは、ローカライズされた編集、構造化されたレビュー、並列エージェントの実行、diffベースの更新など、完全に統合されたワークフローを紹介しました。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:00:37 GMT)
PaCo-RL: Advancing Reinforcement Learning for Consistent Image Generation with Pairwise Reward Modeling [35.2] PaCo-RLは、特殊一貫性報酬モデルと効率的なRLアルゴリズムを組み合わせた包括的なフレームワークである。
本研究では,PaCo-Rewardが視覚的整合性に対する人間の認識との整合性を大幅に改善し,PaCo-GRPOが最先端の整合性を実現することを示す。
これらの結果は、一貫した画像生成のための実用的でスケーラブルなソリューションとしてPaCo-RLを約束していることを強調している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:39:03 GMT)
ClusterStyle: Modeling Intra-Style Diversity with Prototypical Clustering for Stylized Motion Generation [33.8] 本稿では,クラスタリングベースのフレームワークであるClusterStyleを提案する。
プロトタイプの集合を利用して、同じスタイルカテゴリに属する動きをまたいだ多様なスタイルパターンをモデル化する。
提案手法は,スタイル化された動作生成と動作スタイルの伝達において,既存の最先端モデルよりも優れている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:24:14 GMT)
SeeNav-Agent: Enhancing Vision-Language Navigation with Visual Prompt and Step-Level Policy Optimization [32.8] 既存のVision-Language Navigation (VLN)エージェントは、しばしば認識エラー、推論エラー、計画エラーに悩まされる。
これらの制限に対処するため、SeeNav-Agentという新しいVLNエージェントフレームワークが提案されている。
Step Reward Group Policy Optimization (SRGPO) は、VLNエージェントのポストトレーニング用に設計されている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:40:46 GMT)
Understanding and Harnessing Sparsity in Unified Multimodal Models [32.1] 大規模なマルチモーダルモデルは、理解と生成の両方において顕著な進歩を遂げた。
最近の取り組みは、単一のフレームワーク内で両方の機能をサポートするために異種コンポーネントを統合する統合マルチモーダルモデルを模索している。
しかし、これらの非効率性がどのように異なるコンポーネントにまたがって現れるかという体系的な理解は依然として限られている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:47:29 GMT)
WISE: Weighted Iterative Society-of-Experts for Robust Multimodal Multi-Agent Debate [31.5] マルチエージェントの議論(MAD)は、これらの強みを堅牢な推論に活用するための一般的な方法として現れている。
本稿では,単一・多モード機能を持つ異種専門家による議論プロトコルの一般化を図っている。
WISEは最先端のMADセットアップやアグリゲーション手法よりも精度を2-7%向上することを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:31:52 GMT)
Towards Unification of Hallucination Detection and Fact Verification for Large Language Models [31.4] 大規模言語モデル(LLM)は、しばしば幻覚を示し、流動的に見えるコンテンツを生成するが、実際には正しくない。
この課題に対処するために、モデル中心の幻覚検出(HD)とテキスト中心のFact Verification(FV)という、2つの異なる研究パラダイムが登場した。
我々は,FVとHDの直接,インスタンスレベルの比較を可能にする統一評価フレームワークUniFactを紹介する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:51:01 GMT)
BioArc: Discovering Optimal Neural Architectures for Biological Foundation Models [31.2] 基礎モデルは自然言語処理(NLP)やコンピュータビジョン(CV)といった様々な分野に革命をもたらした。
直観駆動型アーキテクチャ設計を超えて,生物基盤モデルのための原則付き自動アーキテクチャ発見へ移行する,新たなフレームワークであるBioArcを紹介する。
本研究は,生物の次世代タスク固有モデルと基礎モデルの作成を導くための基礎的資源と原則的方法論を提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:46:22 GMT)
DF-Mamba: Deformable State Space Modeling for 3D Hand Pose Estimation in Interactions [30.5] Deformable Mambaは、Mambaの選択的状態モデリングと提案された変形可能な状態スキャンを通じて、標準的な畳み込みを超えてグローバルなコンテキストキューをキャプチャするように設計されている。
実験では, 片手・片手シナリオ, 片手・片手インタラクション, RGB, 深度に基づく推定を含む5つの分散データセットについて, 広範囲な評価を行った。
DF-Mambaは、VMambaやSpatial-Mambaを含む最新のイメージバックボーンをすべてのデータセットで上回り、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:01:04 GMT)
Video4Spatial: Towards Visuospatial Intelligence with Context-Guided Video Generation [30.3] 映像ベースのシーンコンテキストにのみ依存した映像生成モデルは、複雑な空間的タスクを実行することができる。
本稿では,ビデオベースのシーンコンテキストにのみ依存した映像拡散モデルが複雑な空間的タスクを実行できることを示すフレームワークであるVideo4Spatialを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:59:44 GMT)
COACH: Collaborative Agents for Contextual Highlighting - A Multi-Agent Framework for Sports Video Analysis [30.0] 本稿では,スポーツ映像理解のための基盤フレームワークとして,再構成可能なマルチエージェントシステム(MAS)を提案する。
本システムでは,各エージェントが,分析の特定の側面を専門とする「認知ツール」として機能する。
この研究は、堅牢でクロスタスクなスポーツビデオインテリジェンスのためのフレキシブルでスケーラブルで解釈可能なシステムへのパラダイムシフトを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:25:46 GMT)
SkeletonAgent: An Agentic Interaction Framework for Skeleton-based Action Recognition [29.9] SkeletonAgentは認識モデルとLarge Language Modelをブリッジする。
SkeletonAgentは、最先端のベンチマークメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:11:17 GMT)
GR-RL: Going Dexterous and Precise for Long-Horizon Robotic Manipulation [29.1] 本稿では,汎用的な視覚-言語-アクション(VLA)ポリシーを,長期的外的操作のスペシャリストに変えるロボット学習フレームワークGR-RLを提案する。
GR-RLは、強化学習によってデモをフィルタリング、拡張、強化するマルチステージトレーニングパイプラインを提案する。
GR-RLは、私たちの知る限り、83.3%の成功率で靴ひもを複数のアイレットに縫い付けることで、自律的に靴を履くことができる最初の学習ベースのポリシーである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:44:55 GMT)
Reasoning-Aware Multimodal Fusion for Hateful Video Detection [29.0] オンラインビデオでのヘイトスピーチは、デジタルプラットフォームにとってますます深刻な脅威となっている。
既存の方法はしばしば、モダリティ間の複雑な意味関係を効果的に融合させるのに苦労する。
本稿では,革新的なReasoning-Aware Multimodal Fusionフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:24:17 GMT)
Tunable polarization-entangled near-infrared photons from orthogonal GaAs nanowires [28.7] GaAsナノワイヤは、通信波長で量子状態を制御するための新しいナノスケールプラットフォームである。
我々は、一対のGaAsナノワイヤが、通信波長で量子状態を制御するための新しいナノスケールプラットフォームを構成することを実証した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:59:35 GMT)
Too Late to Recall: Explaining the Two-Hop Problem in Multimodal Knowledge Retrieval [28.5] 視覚言語モデル(VLM)は、視覚エンコーダからの視覚表現と、事前訓練された大言語モデル(LLM)のテキスト表現との整合を図ることを目的としている。
14モデルのうち11モデルが事実的リコール劣化を示した。
高性能なVLMは、既存のファクトリコール機構を再利用するのに十分な早くエンティティ表現を解決します。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 22:31:43 GMT)
Skywork-R1V4: Toward Agentic Multimodal Intelligence through Interleaved Thinking with Images and DeepResearch [27.8] 本稿では,30B(A3B)パラメータのマルチモーダルエージェントモデルであるSkywork-R1V4を提案する。
Skywork-R1V4は、3万件未満の高品質な計画実行トラジェクトリの教師付き微調整によってのみ訓練され、認識とマルチモーダル検索のベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:12:57 GMT)
AlignBench: Benchmarking Fine-Grained Image-Text Alignment with Synthetic Image-Caption Pairs [27.1] AlignBenchは画像テキストアライメントの新しい指標を提供するベンチマークである。
多様な画像・テキスト・画像モデルとテキスト・ツー・イメージモデルによって生成された詳細な画像・キャプチャ・ペアを評価する。
各文は正当性のために注釈付けされ、VLMをアライメント評価器として直接評価することができる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:11:36 GMT)
Pianist Transformer: Towards Expressive Piano Performance Rendering via Scalable Self-Supervised Pre-Training [26.9] Pianist Transformerは、音楽構造と表現の共通原則を明示的なアノテーションなしで学習するための、MIDI(Musical Instrument Digital Interface)データ表現である。
強力な客観的指標と人間レベルの主観的評価を達成する。
全体として、Pianist Transformerは、音楽領域における人間のようなパフォーマンス合成へのスケーラブルな道を確立している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:13:29 GMT)
Martingale Score: An Unsupervised Metric for Bayesian Rationality in LLM Reasoning [26.4] 本研究では,大規模言語モデルにおける信念定着のための体系的評価フレームワークを提案する。
我々はベイズ統計からマルティンゴールの資産を用いて、この資産の違反を測定する。
モデル、推論手法、およびドメインは、信念の定着の傾向が強い。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:34:05 GMT)
Towards a fully differentiable digital twin for solar cells [26.1] 本稿では、太陽電池の総合的なエンドツーエンド最適化を実現するために、微分可能なデジタルツインであるSol(Di)$2$Tを導入する。
提案された枠組みは、特定の用途のために太陽電池を調整するための重要なステップである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:20:58 GMT)
Hear What Matters! Text-conditioned Selective Video-to-Audio Generation [26.1] 本研究は,マルチオブジェクトビデオからユーザ意図の音声のみを生成する,テキスト条件の選択型V2A生成という新しいタスクを導入する。
本稿では,テキストプロンプトを対象ソースの明示的なセレクタとして扱う新しいテキスト条件付きV2AモデルであるSelVAを提案する。
我々は,VGG-MONOAUDIO上でSelVAを評価する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:12:16 GMT)
Learning Massively Multitask World Models for Continuous Control [25.9] 汎用制御は、多くのタスクや実施事項にまたがって行動するエージェントを要求する。
オンラインインタラクションで数百のタスクで、ひとつのエージェントをトレーニングできるかどうかを問う。
本稿では,まず実演で事前学習した言語条件のマルチタスクワールドモデルであるemphNewtを紹介する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 01:48:49 GMT)
SurveyEval: Towards Comprehensive Evaluation of LLM-Generated Academic Surveys [25.9] SurveyEvalは、全体的な品質、アウトラインコヒーレンス、参照精度の3つの領域で自動生成されたサーベイを評価するベンチマークである。
評価対象を7項目に拡張し,評価・人的アライメントを強化するために,人的参照によるLLM-as-a-Judgeフレームワークを拡張した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:42:09 GMT)
PointCNN++: Performant Convolution on Native Points [25.8] 既存の3Dポイントクラウドデータの畳み込み学習方法は、2つのパラダイムに分けられる。
点ベースの手法は幾何精度を保っているが、しばしば性能上の課題に直面している。
ボクセル法は幾何学的忠実度を犠牲にして量子化することで高い効率を達成する。
我々は、この精度と性能のトレードオフを根本的に緩和する新しいアーキテクチャ設計であるPointCNN++を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 00:45:32 GMT)
MindGPT-4ov: An Enhanced MLLM via a Multi-Stage Post-Training Paradigm [25.8] MindGPT-4ovは、データ生産、モデルトレーニング、効率的なデプロイメントにまたがる一般的なポストトレーニングパラダイムである。
複数のベンチマークにまたがって、最先端のパフォーマンスを低コストで達成する。
MindGPT-4ovは垂直ドメインタスクにおいて優れたユーザエクスペリエンスを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:04:11 GMT)
Mitigating Intra- and Inter-modal Forgetting in Continual Learning of Unified Multimodal Models [25.5] Modality-Decoupled Experts (MoDE)は、モダリティ固有のアップデートを分離し、勾配の衝突を軽減する軽量でスケーラブルなアーキテクチャである。
MoDEは、マルチモーダル生成の統一設定において、インターモーダルとイントラモーダルの両方の忘れを著しく軽減し、以前のCLベースラインよりも優れている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:36:26 GMT)
Fast-Decoding Diffusion Language Models via Progress-Aware Confidence Schedules [25.3] トレーニング不要でモデルに依存しない早期終了アルゴリズムであるSchEDを提案する。
SchEDは完全なロジットマージンを集約し、スムーズで進捗に依存した信頼しきい値が満たされるとデコーディングを停止する。
我々は、SchEDが堅牢であり、信頼に基づく早期退避法よりも明らかに優れていることを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:01:08 GMT)
OmniGuard: Unified Omni-Modal Guardrails with Deliberate Reasoning [25.2] オムニガード(OmniGuard, OmniGuard)は、すべてのモダリティに対して、意図的な推論能力で保護を行うオムニガード(OmniGuard)のファミリーである。
OmniGuardのトレーニングを支援するため、210万以上の多様なサンプルからなる大規模で総合的なオムニモーダル安全データセットをキュレートする。
15のベンチマークでの実験では、OmniGuardは幅広いマルチモーダル安全性シナリオにおいて、強力な有効性と一般化を実現している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 01:01:44 GMT)
Knowledge Graph Augmented Large Language Models for Disease Prediction [25.0] 知識グラフ(KG)誘導チェーン・オブ・シント(CoT)フレームワークは,MIMIC-IIIにおける来院レベルの疾患予測のための臨床基礎的推論を生成する。
ICD-9コードはPrimeKGにマッピングされ、病気関連ノードとマルチホップ推論パスが抽出され、CoT生成のための足場として使用される。
KG誘導モデルは、AUROC値0.66から0.70、マクロAUPR値0.40から0.47を達成し、強力な古典的ベースラインを上回った。
盲目臨床評価では,KG誘導型CoT説明の明瞭度,関連性,臨床正当性に一貫した嗜好を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:43:54 GMT)
From Detection to Association: Learning Discriminative Object Embeddings for Multi-Object Tracking [24.9] 本稿では,3つの視点にまたがってオブジェクトの識別性を高める明示的な特徴フレームワークを提案する。
実験によると、SpngeBobAはDanceTrack、SportsMOT、BFTなど、複数の挑戦的なMOTベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:04:39 GMT)
MRD: Multi-resolution Retrieval-Detection Fusion for High-Resolution Image Understanding [24.9] 高解像度画像の理解は、マルチモーダル大言語モデル(MLLM)にとって重要な課題である。
本稿では,高分解能画像理解のためのトレーニングフリーフレームワークであるMRDを提案する。
対象オブジェクトのグローバルスケールでの直接位置決めを実現するために,オープン語彙オブジェクト検出(OVD)モデルを導入する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:22:01 GMT)
2-Shots in the Dark: Low-Light Denoising with Minimal Data Acquisition [24.8] 学習ベースのデノイザは、高品質なイメージを再構築する可能性がある。
トレーニングには、これらのデノイザはクリーンでノイズの多い画像の大規模なデータセットを必要とする。
ノイズ合成は大規模データ取得の代替手段である。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:32:31 GMT)
Target-specific Adaptation and Consistent Degradation Alignment for Cross-Domain Remaining Useful Life Prediction [24.7] 本稿では,TACDAというドメイン間RUL予測のための新しいドメイン適応手法を提案する。
我々は、類似の劣化段階間の一貫したアライメントのための新しいクラスタリングとペアリング戦略を開発する。
提案手法の顕著な性能を実証した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:15:14 GMT)
RULER-Bench: Probing Rule-based Reasoning Abilities of Next-level Video Generation Models for Vision Foundation Intelligence [24.5] RULER-Benchは、認知ルールの観点から、映像生成モデルの推論能力を評価するために設計されたベンチマークである。
生成された各ビデオの評価のために、4つのメトリクスをカバーするチェックリストを構築し、GPT-o3を利用して各質問にスコアを割り当てる。
実験により、最先端のモデルはルールコヒーレンスメートル法で48.87%しか達成していないことが示されている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:29:51 GMT)
AVA-VLA: Improving Vision-Language-Action models with Active Visual Attention [24.4] VLA(Vision-Language-Action)モデルは、AIタスクを具現化する際、顕著な能力を示した。
現行のVLAモデルは、通常、各時間ステップごとに独立して濃密な視覚入力を処理する。
このアプローチは、タスクをマルコフ決定プロセス(MDP)として暗黙的にモデル化する。
本稿では,部分観測可能なマルコフ決定プロセス(POMDP)の観点から問題を再構成し,AVA-VLAという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:02:17 GMT)
dots.ocr: Multilingual Document Layout Parsing in a Single Vision-Language Model [24.4] dots.ocrは、統合されたエンドツーエンドフレームワーク内で3つのコアタスクを学習するビジョンランゲージモデルである。
これは、巨大な多言語コーパスを合成する高度にスケーラブルなデータエンジンによって実現されている。
統合パラダイムの有効性は,OmniDocBenchの最先端性能によって検証される。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:42:38 GMT)
scCluBench: Comprehensive Benchmarking of Clustering Algorithms for Single-Cell RNA Sequencing [24.4] scCluBenchは、cRNA-seqデータのためのクラスタリングアルゴリズムの包括的なベンチマークである。
まず、 scCluBenchは、様々な公開ソースから収集された36のscRNA-seqデータセットを提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:04:38 GMT)
AutoNeural: Co-Designing Vision-Language Models for NPU Inference [24.1] AutoNeuralは整数のみの推論のために設計されたNPUネイティブなVLMアーキテクチャである。
我々は、標準のViTエンコーダを、深く分離可能な畳み込みを利用したMobileNetV5スタイルのバックボーンに置き換える。
提案手法は,ビジョンエンコーダの量子化誤差を最大7倍,エンドツーエンドのレイテンシを従来のベースラインに比べて14倍削減する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:45:25 GMT)
SCoTER: Structured Chain-of-Thought Transfer for Enhanced Recommendation [24.0] 本稿では,パターン発見と構造認識伝達を協調最適化問題として扱う統合フレームワークであるSCoTERを提案する。
具体的には、SCoTERは、自動パターン検出のためのGVMパイプラインと、ステップワイズロジックを効率的なモデルに転送する構造保存統合アーキテクチャという、2つの相乗的コンポーネントを通じてこれを運用する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:16:40 GMT)
UCAgents: Unidirectional Convergence for Visual Evidence Anchored Multi-Agent Medical Decision-Making [23.9] VLM(Vision-Language Models)は、医学的診断において有望であるが、推論的分離に苦しむ。
最近のマルチエージェントフレームワークは、単一モデルのバイアスを軽減するために、MDT(Multidiciplinary Team)の議論をシミュレートしている。
構造化された証拠監査を通じて一方向収束を強制するUCAgentsを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:20:21 GMT)
Forecasting in Offline Reinforcement Learning for Non-stationary Environments [23.9] 条件拡散に基づく候補状態生成を統一するフレームワークであるNon-stationary Offline RL (FORL) にフォアキャスティングを導入する。
FORLは予期せぬ非マルコフオフセットをターゲットとし、各エピソードの開始から堅牢なエージェントパフォーマンスを必要とする。
実世界の時系列データで拡張されたオフラインRLベンチマークの実証的な評価は、FOLが競合するベースラインに比べて一貫してパフォーマンスを改善することを示した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:50:43 GMT)
LORE: A Large Generative Model for Search Relevance [23.8] 本稿では,eコマース検索における大規模生成モデルに基づく関連性の体系的枠組みであるLOREを紹介する。
LOREは3年にわたってデプロイされ、反復され、オンラインGoodRateメトリクスの累積+27%の改善を実現した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:50:42 GMT)
GeoViS: Geospatially Rewarded Visual Search for Remote Sensing Visual Grounding [23.3] リモートセンシング視覚接地のためのプログレッシブ検索・推論フレームワークGeoViSを提案する。
我々はGeoViSが、主要な視覚的グラウンドリング指標を越えて既存の手法を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:45:52 GMT)
A Comparative Study on How Data Normalization Affects Zero-Shot Generalization in Time Series Foundation Models [23.2] 時系列基礎モデル(TSFM)の入力正規化手法について検討する。
テキストや画像とは異なり、時系列データは、非定常性と組み合わせて、ドメインやチャネル間で大きなスケールのばらつきを示す。
我々は、最も効率的なアプローチとしてREVINを実証的に確立し、非正規化ベースラインに対してゼロショットMASEを89%削減した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:39:19 GMT)
COPE: Chain-Of-Thought Prediction Engine for Open-Source Large Language Model Based Stroke Outcome Prediction from Clinical Notes [23.0] CoT (Chain-of-Thought) Outcome Prediction Engine (COPE) は、構造化されていない臨床ノートから結果を予測するための推論強化された大規模言語モデルフレームワークである。
本研究は急性虚血性脳梗塞(AIS)464例と90日間のRanin Scale(mRS)スコアを比較検討した。
COPEは1.01 (95% CI 0.92-1.11), +/-1 の精度 74.4% (69.9, 78.8%), 正確な精度 32.8% (28.0, 37.6%) を達成した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:44:20 GMT)
Conformal Correction for Efficiency May be at Odds with Entropy [22.9] コンフォーマル予測(CP)は、機械学習モデルのための統計的に厳密な不確実性セットを生成する包括的なフレームワークを提供する。
本研究では,CP効率とモデル予測のエントロピーのトレードオフを実験的に理論的に同定する。
次に,エントロピーに制約のある共形補正法を提案し,効率とエントロピーの最適性について検討する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:33:38 GMT)
YingVideo-MV: Music-Driven Multi-Stage Video Generation [22.9] 我々は、音楽駆動長ビデオ生成のための最初のケースドフレームワークであるYingVideo-MVを紹介する。
提案手法は,音声意味解析,解釈可能なショットプランニングモジュール,時間対応拡散変換器アーキテクチャを統合する。
我々は,多種多様な高品質な結果の達成を支援するために,Wildにおける大規模音楽データセットを構築した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:31:19 GMT)
TGDD: Trajectory Guided Dataset Distillation with Balanced Distribution [22.7] 動的アライメントプロセスとして分布マッチングを再構成するトラジェクトリガイド付きデータセット蒸留(TGDD)を提案する。
各トレーニング段階では、TGDDは、合成データセットと元のデータセットの間の特徴分布を調整することによって、進化的なセマンティクスをキャプチャする。
10つのデータセットの実験では、TGDDは最先端のパフォーマンスを達成しており、特に高解像度のベンチマークでは5.0%の精度が向上している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:00:07 GMT)
SPARK: Sim-ready Part-level Articulated Reconstruction with VLM Knowledge [22.6] アーティキュレートされた3Dオブジェクトは、AI、ロボティクス、インタラクティブなシーン理解に不可欠である。
SPARKは1枚のRGB画像から物理的に一貫した運動的部分レベルの調音オブジェクトを再構成するフレームワークである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:47:17 GMT)
Is Vibe Coding Safe? Benchmarking Vulnerability of Agent-Generated Code in Real-World Tasks [22.5] バイブコーディングは、人間のエンジニアが大規模言語モデル(LLM)エージェントに複雑なコーディングタスクをほとんど監督せずに完了するよう指示する新しいプログラミングパラダイムである。
実世界のオープンソースプロジェクトから200の機能要求ソフトウェアエンジニアリングタスクからなるベンチマークを提示する。
我々の発見は、特にセキュリティに敏感なアプリケーションにおいて、バイブコーディングが広く採用されているという深刻な懸念を提起する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 22:11:56 GMT)
DiverseAR: Boosting Diversity in Bitwise Autoregressive Image Generation [22.4] 視覚的品質を犠牲にすることなく、画像の多様性を高める、原則的で効果的な方法であるDiverseARを紹介する。
具体的には、サンプリング中のバイナリ出力分布のシャープネスを動的に調整する適応ロジット分布スケーリング機構を導入する。
分散平滑化による電位忠実度損失を軽減するため,低信頼トークンのサンプリングを回避するエネルギーベース生成経路探索アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:54:36 GMT)
InvertiTune: High-Quality Data Synthesis for Cost-Effective Single-Shot Text-to-Knowledge Graph Generation [22.3] InvertiTuneは、制御されたデータ生成パイプラインと教師付き微調整を組み合わせたフレームワークである。
InvertiTuneは、最先端のText2KGアプローチと同様に、大型の非微調整LDMよりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:51:28 GMT)
FOVA: Offline Federated Reinforcement Learning with Mixed-Quality Data [22.0] オフラインフェデレーション強化学習(FRL)
本稿では,新しい投票方式のオフラインFRLフレームワークFOVAを紹介する。
この手法は,地域政策評価において,低品質な行動のネガティブな影響を軽減し,高いリターン動作を識別するエンフェボイト機構を利用する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:35:55 GMT)
Reinforcement Learning in POMDP's via Direct Gradient Ascent [21.7] 本稿では,平均報酬の勾配に対する近似を推定するREINFORCEライクなアルゴリズムであるGPOMDPを紹介する。
我々は,GPOMDPを共役段階の手順で,平均報酬の局所的最適性を求める方法を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:50:06 GMT)
From Imitation to Discrimination: Toward A Generalized Curriculum Advantage Mechanism Enhancing Cross-Domain Reasoning Tasks [21.7] 本稿では,利点信号に基づく適応的なカリキュラム機構として,*CAPO** (**C**urriculum **A**dvantage **P**olicy **O**ptimization)を提案する。
提案したメカニズムは、正のみの利点サンプルによる模倣学習をブートストラップし、堅牢な基礎を確立する。
我々の手法は、数学的推論タスクの安定かつ重要な改善を一貫して達成する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:48:57 GMT)
TabGRU: An Enhanced Design for Urban Rainfall Intensity Estimation Using Commercial Microwave Links [21.6] 本稿では,トランスフォーマと双方向Gated Recurrent Unit(BiGRU)に基づくハイブリッドディープラーニングアーキテクチャを提案する。
このモデルはスウェーデンのGothenburgの公開ベンチマークデータセットで検証された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:50:50 GMT)
Generalizing Vision-Language Models with Dedicated Prompt Guidance [21.5] VLMファインチューニングの一般化能力に関する理論的理解を提供する。
本稿では,2段階のドメイン・エキスパート・ガイド付きDG(GuiDG)フレームワークを提案する。
GuiDGはまず、ソースドメインの専門家を取得するためにプロンプトチューニングを採用し、次に、視覚エンコーダの微調整をガイドするクロスモーダルアテンションモジュールを導入する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:06:17 GMT)
Rethinking Surgical Smoke: A Smoke-Type-Aware Laparoscopic Video Desmoking Method and Dataset [21.5] STANet(Smoke-type-Aware Laparoscopic Video Desmoking Network)
拡散スモークとアンビエントスモークの2種類を紹介する。
また,喫煙型アノテーションを用いた最初の大規模合成喫煙データセットを構築した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:55:27 GMT)
Quantum-Based Self-Attention Mechanism for Hardware-Aware Differentiable Quantum Architecture Search [21.5] 微分可能な量子アーキテクチャ探索のための量子ベースの自己認識(QBSA-DQAS)を提案する。
このフレームワークは、2段階の量子自己アテンションモジュールを使用しており、量子回路を通してアーキテクチャパラメータをマッピングすることでコンテキスト依存を計算している。
探索後の最適化段階は、回路の複雑さを低減するためにゲートの通勤、融合、除去を施す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:07:10 GMT)
Diagnose, Correct, and Learn from Manipulation Failures via Visual Symbols [20.9] 58,126 の Visual Question Answering (VQA) ペアの大規模なコレクションである ViFailback データセットをリリースしています。
データセットに基づいて、故障診断と修正能力を評価するために設計されたベンチマーク11のVQAタスクであるViFailbackBenchを確立する。
我々はViFailback-8B VLMを構築し、ViFailback-Benchの全体的な性能改善を実現した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:02:42 GMT)
SMP: Reusable Score-Matching Motion Priors for Physics-Based Character Control [20.8] 自然主義的行動を生み出すためのエージェントを導く行動は、人生のような仮想キャラクタを作成する上で重要な役割を担っている。
本稿では、事前学習した運動拡散モデルとスコア蒸留サンプリング(SDS)を利用して、再利用可能なタスク非依存動作前処理を生成するスコアマッチング動作優先処理(SMP)を提案する。
本手法は, 再利用可能な, モジュラーな動作前処理により, 最先端の対向的模倣学習手法に匹敵する高品質な動作を生成する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:54:12 GMT)
Kardia-R1: Unleashing LLMs to Reason toward Understanding and Empathy for Emotional Support via Rubric-as-Judge Reinforcement Learning [20.7] KardiaBenchは、22,080の会話で178,080のQAペアで構成され、671の現実世界プロファイルにアンロックされた大規模なユーザグラウンドベンチマークである。
Kardia-R1は、解釈可能な、段階的な共感的認知のためのモデルを訓練するフレームワークである。
私たちのデータセットとモデルはhttps://github.com/JhCircle/Kardia-R1.comでリリースされます。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:43:56 GMT)
TECM*: A Data-Driven Assessment to Reinforcement Learning Methods and Application to Heparin Treatment Strategy for Surgical Sepsis [20.4] 本研究は,外科的敗血症患者に対するヘパリン療法を最適化するための,データ駆動型尺度と連続報酬関数を提案する。
腹腔鏡下手術を施行したUFH(unfractionated heparin)を施行した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:38:07 GMT)
Associating Healthcare Teamwork with Patient Outcomes for Predictive Analysis [20.2] 我々は,ERHを介するHCPインタラクションをネットワークとしてモデル化し,これらのコラボレーションに埋め込まれた患者生存の予測信号を検出するために機械学習技術を適用した。
この作業は、コラボレーションとAIのデジタルトレースを活用して、チームベースのヘルスケアを評価し改善するための実践的なワークフローに寄与する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:16:03 GMT)
Co-speech Gesture Video Generation via Motion-Based Graph Retrieval [19.7] 近年のアプローチでは、既存のビデオデータの可能性を活用するためにモーショングラフを活用している。
本稿では,ジェスチャ動作を生成するために拡散モデルを用いた新しいフレームワークを提案する。
提案手法は,入力音声から低レベル特徴と高レベル特徴の両方を抽出し,トレーニングプロセスを強化する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:46:12 GMT)
Benchmarking Scientific Understanding and Reasoning for Video Generation using VideoScience-Bench [19.3] VideoScience-Benchは、ビデオモデルにおける学部レベルの科学的理解を評価するために設計されたベンチマークである。
ベンチマークには、14のトピックと103の物理と化学の概念にまたがる200の厳格なプロンプトが含まれている。
我々は,T2VおよびI2V設定の7つの最先端ビデオモデルに対して,5次元に沿って専門家によるアノテート評価を行う。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:11:23 GMT)
WearVQA: A Visual Question Answering Benchmark for Wearables in Egocentric Authentic Real-world scenarios [19.2] 我々は、スマートグラスのようなウェアラブルデバイス上で、マルチモデルAIアシスタントの視覚質問回答機能を評価するために設計された最初のベンチマークであるWearVQAを紹介する。
WearVQAは、エゴ中心のインタラクションのユニークな課題を反映している。
ベンチマークは、2,520個の精巧にキュレートされた画像検索用三つ子で構成され、7つの異なる画像ドメインにまたがる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:14:37 GMT)
A Lightweight Real-Time Low-Light Enhancement Network for Embedded Automotive Vision Systems [19.1] UltraFast-LieNETは、リアルタイム低照度画像強調のための軽量なマルチスケールシフト畳み込みネットワークである。
LOLI-Streetデータセットの結果、PSNRは26.51dBであり、180のパラメータしか利用せず、4.6dBの最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:44:25 GMT)
Lumos: Let there be Language Model System Certification [18.8] 本稿では,LMS(Language Model System)の振る舞いの特定と認証を行うための,最初の原則的フレームワークであるLumosを紹介する。
Lumosはグラフ上の命令的確率的プログラミングDSLであり、独立で同一に分散されたプロンプトを生成する構造を持つ。
本稿では,Lumosで開発された自律走行シナリオにおける視覚言語モデル(VLM)の安全性に関する最初の仕様について述べる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:44:47 GMT)
VLM-Pruner: Buffering for Spatial Sparsity in an Efficient VLM Centrifugal Token Pruning Paradigm [18.6] 視覚言語モデル(VLM)は画像理解タスクに優れるが、多数の視覚トークンは計算コストを大幅に上回る。
VLM-Prunerは、冗長性と空間空間幅のバランスをとる訓練不要なトークンプルーニングアルゴリズムである。
VLM-Prunerは5つのVLMにおいて88.9%のプルーニングレートで強いベースラインを一貫して上回り、エンドツーエンドの推論スピードアップを実現している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:30:05 GMT)
The Active and Noise-Tolerant Strategic Perceptron [18.4] 我々は,Active Perceptronアルゴリズムの修正版[DKM05,YZ17]が,$tildeO(d ln frac1)$ラベルクエリのみを使用して過剰なエラーを$$とすることを示す。
このアルゴリズムは計算的に効率的であり、これらの分布的な仮定の下では、戦略パーセプトロンの以前の研究よりもラベルクエリがかなり少ない。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:18:15 GMT)
A Large Scale Benchmark for Test Time Adaptation Methods in Medical Image Segmentation [18.1] テスト時間適応は、医用画像セグメンテーションにおける領域シフトを軽減するための有望なアプローチである。
MedSeg-TTAは7つの画像モダリティにまたがる20の適応手法を網羅したベンチマークである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:40:42 GMT)
COGNITION: From Evaluation to Defense against Multimodal LLM CAPTCHA Solvers [17.7] マルチモーダル大言語モデル(MLLM)は、視覚CAPTCHAのセキュリティ保証を損なう。
実世界のCAPTCHAタスクタイプ18種を対象に,商用およびオープンソースMLLMを7種類評価した。
MLLMは認識指向のCAPTCHAタスクを人為的なコストとレイテンシで確実に解決できることを明らかにする。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 01:23:10 GMT)
BEVDilation: LiDAR-Centric Multi-Modal Fusion for 3D Object Detection [17.6] 核融合におけるLiDAR情報を優先する新しいフレームワークであるBEVDilationを提案する。
我々の戦略は,画像深度推定誤差による空間的ずれを効果的に軽減する。
挑戦的なnuScenesベンチマークでは、BEVDilationは最先端のメソッドよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:50:33 GMT)
Reasoning Path and Latent State Analysis for Multi-view Visual Spatial Reasoning: A Cognitive Science Perspective [17.6] 空間推論は、人間の知性の中核的な側面であり、3D環境における知覚、推論、計画を可能にする。
現在の視覚言語モデル(VLM)は、多視点設定における空間的推論のための幾何学的コヒーレンスとクロスビュー整合性を維持するのに苦労している。
本稿では,VLMが相補的な視点で空間的メンタルモデルを構築し,調整し,維持する方法を評価するための,認知的基盤を持つベンチマークであるReMindView-Benchを紹介する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:21:29 GMT)
AskNearby: An LLM-Based Application for Neighborhood Information Retrieval and Personalized Cognitive-Map Recommendations [17.6] 15分の街」は、徒歩や自転車で日々の需要に応えられる地区を構想している。このビジョンを実現するには、物理的な近接だけでなく、近隣の場所、サービス、イベントに関する情報への効率よく信頼性の高いアクセスが必要である。
我々はこのギャップをLLIA(Local Life Information Accessibility)問題として概念化し、AIによるコミュニティアプリケーションであるAskNearbyを紹介した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:47:31 GMT)
TaleFrame: An Interactive Story Generation System with Fine-Grained Control and Large Language Models [17.4] TaleFrameは、大きな言語モデル(LLM)とヒューマンコンピュータインタラクション(HCI)を組み合わせてストーリーを生成するシステムである。
ユーザーは単純な操作でこれらのユニットを制御できる。
生成されたストーリーは7次元で評価できる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:27:10 GMT)
HouseLayout3D: A Benchmark and Training-Free Baseline for 3D Layout Estimation in the Wild [17.3] 現在の3Dレイアウト推定モデルは、主に単純な1室または1フロア環境を含む合成データセットに基づいて訓練されている。
実世界のベンチマークであるHouse3Dを導入する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:18:08 GMT)
GoRL: An Algorithm-Agnostic Framework for Online Reinforcement Learning with Generative Policies [16.9] GoRLは、条件付き生成デコーダを使用してアクションを合成しながら、トラクタブルな遅延ポリシーを最適化するフレームワークである。
GoRLは、ガウス政策と最近の世代政治のベースラインの両方を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:49:26 GMT)
LeechHijack: Covert Computational Resource Exploitation in Intelligent Agent Systems [16.7] 大規模言語モデル(LLM)ベースのエージェントは、推論、計画、ツールの使用において顕著な能力を示した。
最近提案された Model Context Protocol (MCP) は,外部ツールをエージェントシステムに統合するための統合フレームワークとして登場した。
本稿では, エージェントの計算資源を隠蔽する逆MSPツールを用いて, ハイジャックのための潜伏埋め込みエクスプロイトであるLeechHijackを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 01:34:56 GMT)
Data Curation Through the Lens of Spectral Dynamics: Static Limits, Dynamic Acceleration, and Practical Oracles [16.7] 大規模ニューラルモデルは、データプルーニング、合成データ生成、クロスモデル蒸留、人間からの強化学習(RLHF)、難易度に基づくサンプリングなど、ますます訓練されている。
我々は,データキュレーションをサンプリング分布の再重み付けとして定式化し,その効果をデータ誘導演算子の固有構造にマッピングする。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:36:13 GMT)
AVGGT: Rethinking Global Attention for Accelerating VGGT [16.6] VGGTと3ドルは、強力なマルチビュー3Dパフォーマンスを示しているが、グローバルな自己注意に大きく依存しているため、計算コストが高い。
我々は、VGGTにおけるグローバルアテンションモジュールの詳細な調査を行い、それらの役割をよりよく理解するために3ドルを支払った。
本研究では,(1)初期のグローバルレイヤをフレームアテンションに変換し,(2)グローバルアテンションをサブサンプリングする2段階アクセラレーション方式を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:08:18 GMT)
Safeguarded Stochastic Polyak Step Sizes for Non-smooth Optimization: Robust Performance Without Small (Sub)Gradients [16.4] 適応型ニューラルネットワークを提供するPolyakの消滅は、勾配降下(SGD)にとって有望な選択であることが証明された。
ディープネットワークに関する総合的な実験は、タイトな凸ネットワーク理論を腐食させる。
本研究では、強い仮定を必要とせず、非滑らかな最適化に対して厳密な収束保証を提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:24:32 GMT)
Few-shot Protein Fitness Prediction via In-context Learning and Test-time Training [16.3] PRIMOは、コンテクスト内学習とテストタイムトレーニングを活用して、新しいタンパク質に迅速に適応するトランスフォーマーベースのフレームワークである。
PRIMOは、嗜好に基づく損失関数を通じて、有望な変種を優先することを学ぶ。
この研究は、大規模事前学習と効率的なテスト時間適応を組み合わせることで、挑戦的なタンパク質設計課題に取り組む力を強調している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 01:20:40 GMT)
ClimaOoD: Improving Anomaly Segmentation via Physically Realistic Synthetic Data [16.1] 我々は,意味的コヒーレント,気象多様性,物理的に妥当なOoD駆動データを合成するためのセマンティックス誘導イメージ・ツー・イメージ・フレームワークを提案する。
この枠組みに基づいて,晴天条件と悪天候条件の両方で6つの代表的な運転シナリオにまたがる大規模ベンチマークであるClimaOoDを構築した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:14:19 GMT)
Radiologist Copilot: An Agentic Assistant with Orchestrated Tools for Radiology Reporting with Quality Control [16.1] 我々は、品質管理を備えた自動放射線診断のためのオーケストレーションツールを備えたエージェントAIアシスタントであるRadioologist Copilotを提案する。
組織されたツールには、リージョンローカライゼーション、イメージパラダイム指向の領域分析計画、レポート生成のための戦略的テンプレート選択、品質評価、品質管理のためのフィードバック駆動適応改善などがある。
実験の結果、放射線科医のコパイロットは放射線学の報告において、他の最先端の手法をはるかに上回っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:25:05 GMT)
Adaptive Decentralized Federated Learning for Robust Optimization [16.1] 我々は、ロバストな推定のための新しい適応型DFL (aDFL) アプローチを開発した。
疑わしいクライアントに小さなレートを割り当て、通常のクライアントにより大きなレートを割り当てることにより、aDFLはグローバルモデルに対する異常なクライアントの負の影響を軽減します。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:09:51 GMT)
SkyMoE: A Vision-Language Foundation Model for Enhancing Geospatial Interpretation with Mixture of Experts [15.6] マルチモーダル・マルチタスクリモートセンシングのための視覚言語モデルSkyMoEを提案する。
SkyMoEは、タスクと粒度を認識したルーティング命令を生成する適応ルータを使用している。
21の公開データセットの実験では、SkyMoEがタスク間で最先端のパフォーマンスを達成することが示されている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:17:16 GMT)
Reproducing and Extending RaDelft 4D Radar with Camera-Assisted Labels [15.5] カメラ誘導型レーダラベリングパイプラインは,人間のアノテーションに頼ることなく,レーダポイント雲の正確なラベルを生成することができることを示す。
これらの結果は、研究コミュニティがラベル付き4Dレーダデータのトレーニングと評価を可能にする再現可能な枠組みを確立する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:12:41 GMT)
ADORE: Autonomous Domain-Oriented Relevance Engine for E-commerce [15.3] 電子商取引検索における関連モデリングはセマンティック・ギャップによって依然として課題が残されている。
3つのイノベーションを相乗化する自己維持型フレームワークであるADOREを提案する。
このフレームワークは、産業アプリケーションにおけるリソース効率、認知的に整合した関連モデリングのための新しいパラダイムを確立する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:25:13 GMT)
Menta: A Small Language Model for On-Device Mental Health Prediction [15.3] 我々は、ソーシャルメディアデータからマルチタスクのメンタルヘルス予測に特化して最適化された最初のSLMであるMentaを紹介した。
Mentaは、LoRAベースのフレームワーク、クロスデータセット戦略、バランスの取れた精度指向の損失を使用して、6つの分類タスクで共同でトレーニングされている。
我々は,iPhone 15 Pro Max上でのMentaのリアルタイムオンデバイス展開を実演し,約3GBのRAMしか必要としない。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:47:08 GMT)
In-Context Distillation with Self-Consistency Cascades: A Simple, Training-Free Way to Reduce LLM Agent Costs [15.2] 微調整に伴う開発コストを発生させることなく, LLMエージェント推論コストを削減するための簡易な手法を提案する。
最も重要なことは、知識蒸留のアイデアを文脈内学習環境に適応させる$textitin-context distillation$を導入することである。
提案手法では,各エージェントステップで関連する教師のデモンストレーションを検索し,インコンテキストの事例として学生に提供し,ハエの教師行動の模倣を可能にする。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:11:05 GMT)
Learning Multimodal Embeddings for Traffic Accident Prediction and Causal Estimation [15.1] 道路ネットワークデータと道路グラフノードに整列した衛星画像の両方を用いて交通事故パターンを解析することを検討する。
我々は、米国6州にまたがる大規模なマルチモーダルデータセットを構築し、公式資料から900万件の交通事故の記録を含む。
降水量の増加により事故率は24%上昇し、自動車などの高速道路では22%上昇し、季節的なパターンにより29%上昇した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:39:32 GMT)
Toward Content-based Indexing and Retrieval of Head and Neck CT with Abscess Segmentation [15.0] 頭部と頸部の膿瘍は急性の感染症のプロセスであり、診断され、迅速に管理されていない場合、敗血症や死亡につながる可能性がある。
AbscessHeNeは,4,926個の造影CTスライスと臨床的に確認された頭頸部膿瘍からなる,治療的,包括的注釈付きデータセットである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:59:50 GMT)
PPTBench: Towards Holistic Evaluation of Large Language Models for PowerPoint Layout and Design Understanding [14.8] PowerPointのプレゼンテーションはリッチテキストコンテンツと構造化されたビジュアルレイアウトを組み合わせることで、現代のMLLMのマルチモーダル推論とレイアウト理解能力を評価するための自然なテストベッドとなる。
既存のベンチマークでは、レイアウト中心の課題を見下ろしながら、狭いサブタスクのみに焦点を当てている。
PowerPoint 関連タスク上で LLM を評価するための総合的マルチモーダルベンチマーク PPTBench を紹介する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:33:31 GMT)
Synthetic Error Injection Fails to Elicit Self-Correction In Language Models [14.8] 合成誤り注入による教師付き学習が言語モデルにおける自己補正能力を誘導するかどうかを検討する。
我々のアプローチは、人工的なエラーを推論チェーンに挿入し、それらをマスクし、これらの誤りを認識し修正するためのモデルを監督する。
本研究は,政策強化学習法が自己補正に一意に有効であることが証明された理由を説明するのに有用である。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:57:49 GMT)
Iterative Tilting for Diffusion Fine-Tuning [14.6] 反復傾きは、報酬型分布に対する微調整拡散モデルのための勾配のない方法である。
線形報酬を伴う2次元ガウス混合に対して、正確な傾き分布を閉形式で得ることを検証した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:07:46 GMT)
Does Head Pose Correction Improve Biometric Facial Recognition? [14.5] 我々は,AIによる主目的補正と画像復元によって認識精度が向上するかどうかを検討する。
また,3D再構成 (NextFace), 2D前立腺化 (CFR-GAN), 機能強化 (CodeFormer) のナイーブな応用は顔認識精度を著しく低下させることがわかった。
しかし、CFR-GANとCodeFormerの組み合わせによる選択的な適用は、有意義な改善をもたらす。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:53:30 GMT)
GeoDiT: A Diffusion-based Vision-Language Model for Geospatial Understanding [14.4] 地理空間領域に適した初めての拡散型視覚言語モデルであるGeoDiTを紹介する。
画像キャプション、視覚的接地、多物体検出において大きな進歩を遂げる。
本研究は, 複雑な地理空間解析において, 生成過程とデータ固有の構造との整合性が, 優れた性能の鍵となることを検証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:59:46 GMT)
PolarGuide-GSDR: 3D Gaussian Splatting Driven by Polarization Priors and Deferred Reflection for Real-World Reflective Scenes [14.3] 偏光と3DGSの双方向結合機構を確立する偏光誘導パラダイム
そこで本研究では,PolaGuide-GSDRがスペクトル再構成,正規推定,新しいビュー合成において,最先端の性能を実現することを実証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:34:55 GMT)
TokenPowerBench: Benchmarking the Power Consumption of LLM Inference [14.2] 大規模言語モデル(LLM)サービスが1日に数十億のクエリに応答する。
推論は訓練ではなく、総消費電力の90%以上を占める。
本稿では, LLM-inference power consumption study のために設計された最初の軽量ベンチマークであるTokenPowerBenchを紹介する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:50:17 GMT)
Sparse Computations in Deep Learning Inference [14.2] スパーシリティは、推論要求を劇的に減少させる重要なメカニズムである。
ほとんど未使用であり、まだ実運用のAIシステムに完全には組み込まれていない。
本稿では,高度に効率的なスパース深層学習モデルの開発と展開を目指す,パフォーマンスエンジニアのためのリソースとして機能することを目的とする。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:19:33 GMT)
SpatialReasoner: Active Perception for Large-Scale 3D Scene Understanding [14.0] H$2$U3D (Holistic House Understanding in 3D) は3次元視覚質問応答データセットである。
また,空間ツールを自律的に起動して3Dシーンを探索する能動的知覚フレームワークであるSpatialReasonerを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 22:49:01 GMT)
Generative modeling using evolved quantum Boltzmann machines [13.7] ボーンルール生成モデリングは、量子機械学習における中心的なタスクである。
ボルンルール生成モデルのための量子ボルツマンマシンを訓練する実用的なソリューションを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:56:02 GMT)
CryptoQA: A Large-scale Question-answering Dataset for AI-assisted Cryptography [13.6] 本稿では,暗号に特化して設計された,最初の大規模質問応答データセットであるCryptoQAを紹介する。
我々は、CryptoQAで15の最先端LCMをベンチマークし、実際の精度、数学的推論、一貫性、参照、対向サンプルに対する堅牢性を評価した。
以上の結果から LLM の性能は著しく低下しており,特に形式的推論や正確な数学的知識を必要とするタスクにおいて顕著であることがわかった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:35:36 GMT)
Instant Video Models: Universal Adapters for Stabilizing Image-Based Networks [13.6] ビデオ上での安定かつロバストな推論にフレームベースモデルを適用するための一般的なアプローチを提案する。
仮想的なアーキテクチャに挿入可能な安定性アダプタのクラスと,凍結ベースネットワークで実行可能なリソース効率のトレーニングプロセスについて述べる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:41:10 GMT)
Model-Based Diagnosis with Multiple Observations: A Unified Approach for C Software and Boolean Circuits [13.5] 本稿では,C ソフトウェアと Boolean 回路に複数故障のある新しい障害ローカライズツール CFaults を紹介する。
CFaultsは、複数の観察でモデルベース診断(MBD)を活用し、失敗したすべてのテストケースを統一された満足度(MaxSAT)公式に集約する。
3つのベンチマークセット、TCASとC-Pack-IPAsの2つのCプログラムとBoolean回路の1つであるISCAS85の実験結果から、CFaultsは、他のFBFLアプローチよりもCソフトウェアの障害のローカライズが速いことが示された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:04:51 GMT)
SAGE: Style-Adaptive Generalization for Privacy-Constrained Semantic Segmentation Across Domains [13.4] textbfSAGEは、プライバシー制約下での凍結モデルの一般化を改善する。
まず、ソースドメインの多様なスタイル表現を構築するためにスタイル転送を利用する。
そして、モデルが各入力の視覚的コンテキストに応じてこれらのスタイルキューを適応的に融合し、動的プロンプトを形成する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:20:22 GMT)
AutoBrep: Autoregressive B-Rep Generation with Unified Topology and Geometry [13.4] バウンダリ表現(バウンダリ表現、B-Rep)は、CAD(Computer-Aided Design)で用いられる標準データ構造である。
本稿では,B-Repsを高品質かつ有効に自動生成する新しいトランスフォーマーモデルであるAutoBrepを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:46:25 GMT)
Multi-Frequency Federated Learning for Human Activity Recognition Using Head-Worn Sensors [13.3] 本研究は、プライバシを意識したMLを実現するために、多周波フェデレートラーニング(FL)を提案する。
私たちはヘッドウーンデバイス(イヤホンやスマートグラスなど)に注力していますが、従来のスマートウォッチやスマートフォンベースのHARと比較して、探索されていない領域です。
その結果、周波数固有のアプローチに対する2つのデータセットの改善が示された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 22:52:58 GMT)
CUDA-L2: Surpassing cuBLAS Performance for Matrix Multiplication through Reinforcement Learning [13.3] 本稿では,大規模言語モデル(LLM)と強化学習(RL)を組み合わせて,半精度一般行列乗算(HM)カーネルを自動的に最適化するシステムを提案する。
cuBLASL-L2は、現在までに主要なmamulベースラインを体系的に上回る。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:20:15 GMT)
Unrolled Networks are Conditional Probability Flows in MRI Reconstruction [13.2] 本稿では,条件付き確率フローODEの個別実装であるアンロールネットワークを理論的に証明し,MRI再構成にフローODEを導入する。
この接続はパラメータの明示的な定式化を提供し、中間状態がどのように進化するかを明確にする。
本研究では、未学習パラメータをODE離散化から導出し、中間再構成を理想的なODE軌道と整合させて安定性と収束性を向上させるフローアラインドトレーニング(FLAT)を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:48:10 GMT)
A multi-weight self-matching visual explanation for cnns on sar images [13.2] 畳み込みニューラルネットワーク(CNN)は、様々な合成開口レーダ(SAR)タスクで大きな成功を収めている。
MS-CAMは、SAR画像と、CNNが抽出した特徴マップと対応する勾配とをマッチングする。
自己構築型SARターゲット分類データセットで行った実験は、MS-CAMがネットワークの関心領域をより正確に強調していることを示している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:31:34 GMT)
Novelty detection on path space [13.0] 我々は,署名に基づくテスト統計を用いた仮説テスト問題として,経路空間の新規性検出を行う。
条件付きリスク(CVaR)のスムーズなサロゲートの正確な式を期待シグネチャの観点から導出する。
我々は,数値的に-$mathrmI$エラーとシグネチャベースのテスト統計量の統計的パワーを評価する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:25:03 GMT)
Vehicle Dynamics Embedded World Models for Autonomous Driving [13.0] 環境遷移力学からエゴ車両力学のモデリングを分離したVDD法を提案する。
提案モデルでは,車両動特性の変動に対して駆動性能とロバスト性の両方を向上し,既存手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:57:52 GMT)
SR-GRPO: Stable Rank as an Intrinsic Geometric Reward for Large Language Model Alignment [12.9] 本研究では,モデル表現から派生した本質的,アノテーションのない品質信号である安定階数を提案する。
安定ランク群相対政策最適化 (SR-GRPO) を導入し, 安定ランクを強化学習の報奨信号として利用する。
この結果から,内部モデル形状から品質信号を抽出し,外部の監視なしに拡張性のあるアライメントへの経路を提供することができた。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:21:29 GMT)
Vision to Geometry: 3D Spatial Memory for Sequential Embodied MLLM Reasoning and Exploration [12.9] 身体的なタスクは通常、エージェントが未知の環境を積極的に探索し、特定の目標を達成するためにシーンについて推論する必要がある。
実生活に配備されると、エージェントはしばしばシーケンシャルなタスクに直面し、そこでは各新しいサブタスクが前のタスクの完了に続く。
2つの古典的具体的タスクを含むSequential Embodied Exploration and Reasoning BenchmarkであるSEER-Benchを紹介する。
本研究では,3次元空間記憶推論手法である3DSPMRを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:35:30 GMT)
A Fully First-Order Layer for Differentiable Optimization [12.9] 異なる最適化レイヤにより、組み込み最適化問題を解決することで、学習システムが決定を下すことができる。
我々は、$too(1)$timeの1次情報のみを用いて近似超越性を計算することができることを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:36:03 GMT)
Adaptive Multi-Agent Reasoning for Text-to-Video Retrieval [12.7] 本稿では,複数の推論を繰り返して特殊エージェントを編成する適応型マルチエージェント検索フレームワークを提案する。
私たちのフレームワークは、CLIP4Clipよりも2倍の改善を実現し、最先端のメソッドを大きなマージンで大幅に上回ります。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:52:51 GMT)
Decentralized Fairness Aware Multi Task Federated Learning for VR Network [12.5] ワイヤレス接続はバーチャルリアリティ(VR)体験を解き放つことを約束し、ユーザーはいつでもどこからでもエンゲージできる。
シームレスで高品質でリアルタイムなVRビデオをワイヤレスで配信することは、体験要件の厳しい品質、低レイテンシの制約、VRデバイスの限られた機能のために難しい。
本稿では、各BSに合わせたキャッシュ戦略に基づいて、基地局(BS)における各VRユーザの視野(FOV)をキャッシュし、プリパッチする、DMTFLベースの分散マルチタスクフェアフェデレーション学習(DMTFL)ベースのキャッシュを導入することで、これらの課題に対処する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:13:38 GMT)
Learning Network Sheaves for AI-native Semantic Communication [12.5] AIの最近の進歩は、ビット中心のコミュニケーションからゴールセマンティクス指向アーキテクチャへのパラダイムシフトを求めている。
潜在AIエージェントが潜在空間表現を交換できるようにし、セマンティックノイズを緩和し、タスク関連の意味を保存すること。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:36:44 GMT)
nuScenes Revisited: Progress and Challenges in Autonomous Driving [12.4] 我々は、最も広く使用されている自動運転データセットの1つ、nuScenesデータセットを再考する。
nuScenesは、レーダーデータを含む最初のデータセットである、AV開発における重要なトレンドを例示している。
我々は, nuScenes の生成と拡張 nuImages と Panoptic nuScenes について前例のない考察を行った。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:14:28 GMT)
Hypothesis Testing for Generalized Thurstone Models [12.4] 仮説テストフレームワークの開発により、ペア比較データが基礎となるモデルによって生成されるかどうかを判断する。
分離距離に基づく仮説テスト,信頼区間の構築,I型およびII型エラーの確率に基づく一様境界の設定を提案する。
我々は、合成および実世界のデータセットに関する実験を通して結果を検証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:32:42 GMT)
Towards autonomous normative multi-agent systems for Human-AI software engineering teams [12.3] 我々は,人間ライクな推論を可能にするため,信念,欲求,意図,記憶を備えたソフトウェア工学エージェントの新たなクラスを導入する。
これらのエージェントは人間や他のエージェントと協力して、現在のソフトウェア開発プロセスを超えて、スピード、信頼性、適応性のレベルを持つソフトウェアシステムを設計、実装、テスト、デプロイします。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 01:57:17 GMT)
StockMem: An Event-Reflection Memory Framework for Stock Forecasting [12.3] イベントリフレクション二重層メモリフレームワークであるStockMemを提案する。
ニュースをイベントに構造化し、2次元に沿ってマイニングする。水平統合は日々のイベントを統合し、縦追跡はイベントの進化を捉えている。
予測には、現在のイベント、インクリメンタルデータ、過去の経験と類似した過去のシナリオと理由を検索する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:53:02 GMT)
AtomGraph: Tackling Atomicity Violation in Smart Contracts using Multimodal GCNs [12.3] 我々は、スマートコントラクトにおける原子性違反を検出するために設計された、自動化されたフレームワークAtomGraphを紹介します。
このフレームワークはGraph Convolutional Networksを使用して、マルチモーダルな特徴学習と融合を通じて原子性侵害を特定する。
AtomGraphは96.88%の精度と96.97%のF1スコアを獲得し、既存のツールを上回っている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:20:02 GMT)
When Does Verification Pay Off? A Closer Look at LLMs as Solution Verifiers [11.9] 本稿では,37大言語モデル(LLM)の体系的研究について述べる。
自己検証と同一家族内および異なる家族間での検証を比較した。
検証者ゲインや偽陽性率尺度などのメトリクスをモデルサイズと後トレーニングで分析し,データセットの妥当性の違いを特徴付ける。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 00:51:14 GMT)
QJoin: Transformation-aware Joinable Data Discovery Using Reinforcement Learning [11.6] 私たちは、ジョインタスク間の変換戦略を学習し再利用する強化学習フレームワークであるQJoinを紹介します。
NYC+Chicagoの19,990のジョインタスクでは、再利用を使用することで、ランタイムを最大7.4%削減する(13,747データセット)。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:05:48 GMT)
Learning Physically Consistent Lagrangian Control Models Without Acceleration Measurements [11.6] 本稿では、モデルベース制御合成に不可欠な物理的に一貫したモデルの導出と同定に焦点を当てる。
ラグランジアンまたはハミルトンニューラルネットワークは有用な構造保証を提供するが、そのようなモデルの学習はしばしば矛盾するモデルにつながる。
ラグランジアンシステムの物理的整合性を改善するために、元の損失関数に依存する学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:56:02 GMT)
OptPO: Optimal Rollout Allocation for Test-time Policy Optimization [11.4] テスト時のポリシー最適化により、大規模言語モデルでは、自己生成ロールアウトからのフィードバックを活用することで、分散シフトに適応することができる。
我々は、推論予算を適応的に割り当てる原則的フレームワークであるテスト時間ポリシー最適化のための最適ロールアウト割当(OptPO)を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:38:52 GMT)
SpecPV: Improving Self-Speculative Decoding for Long-Context Generation via Partial Verification [11.4] 投機的復号化は、生成を加速するための最も直接的で効果的なアプローチの1つである。
部分鍵値状態を用いた高速な検証を行う自己投機的復号法であるSpecPVを導入する。
LLaMA-3.1-8B-Instruct や Qwen3-Series など,複数の長文ベンチマークやモデルで SpecPV を検証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:15:33 GMT)
FAIRY2I: Universal Extremely-Low Bit QAT framework via Widely-Linear Representation and Phase-Aware Quantization [11.1] 事前学習された実数値層を等価な広線形複素形式に変換する普遍的なフレームワークである Fairy2i を提案する。
また,Fairy2iはLLaMA-2 7Bの性能を実効2ビット精度で復元することを示した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:14:08 GMT)
Stress-Testing Causal Claims via Cardinality Repairs [11.0] データの小さな、ターゲットとする変更に対して、因果関係はどの程度堅牢か?
本稿では,基性修復による監査のためのフレームワークであるSubCureを紹介する。
我々は、スクラッチから再学習することなく因果推定を更新するための機械学習手法を取り入れた効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:31:03 GMT)
HBLLM: A Haar-Based Approach for Accurate Structured 1-Bit Quantized LLMs [11.0] 本稿では,ウェーブレット強化高忠実度1ビットポストトレーニング量子化法であるHBLLMを紹介する。
OPTモデルとLLaMAモデルで行った実験は、HBLLMが1ドルの量子化で最先端の性能を達成することを示した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:47:53 GMT)
Process-Centric Analysis of Agentic Software Systems [11.0] ソフトウェアシステムにおける時間的・意味的な関係をエンコードするためにGraphectoryを導入する。
2つの支配的エージェントプログラミングモデルの4000のトラジェクトリを解析する。
完全に自動化された分析により、よりリッチなプロンプトを用いたエージェントはより複雑なGraphectoryを示すことが明らかとなった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:12:29 GMT)
Basis-Oriented Low-rank Transfer for Few-Shot and Test-Time Adaptation [10.8] 厳密なデータと計算予算の下で、大きな事前訓練されたモデルを未確認のタスクに適用することは、依然として困難である。
本稿では,既存の微調整モデルを再利用し,そのサブ空間内に適応するフレームワークBOLTを提案する。
本結果は,タスクインフォームド部分空間への制約適応が,目に見えないタスク転送の効果的な代替手段となることを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:00:16 GMT)
Leveraging Large Language Models to Bridge On-chain and Off-chain Transparency in Stablecoins [10.7] 構造化されていないテキストにロックされた、検証可能なオンチェーントレースとオフチェーンの開示をブリッジする、LLM(Big Language Model)ベースの自動化フレームワークを導入する。
以上の結果から,LCM支援分析はモダリティ間の透明性を高め,分散金融における自動データ駆動監査を支援することが示唆された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:00:17 GMT)
ALDI-ray: Adapting the ALDI Framework for Security X-ray Object Detection [10.0] セキュリティX線イメージングは、走査デバイスと環境条件の変化により、ユニークな課題を呈している。
自己拡張、機能アライメント、強化されたトレーニング戦略を統合するドメイン適応フレームワークであるALDI++を適用する。
EDSデータセット上で大規模な実験を行い、ALDI++がSOTA(State-of-the-art)ドメイン適応法を超えることを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:28:07 GMT)
Observation of non-Hermitian many-body phase transition in a Rydberg-atom array [9.9] 我々は、強く相互作用するRydberg-atom配列において、非エルミートXYモデルを実験的に実現した。
我々はPT対称性を破る相転移の異なる動的シグネチャを観察する。
以上の結果から,PT対称性の破断に対する複雑な相互作用による影響が明らかとなり,非エルミート多体力学を探求するための扉が開けられた。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:35:23 GMT)
CrowdLLM: Building LLM-Based Digital Populations Augmented with Generative Models [9.6] デジタル人口は、ヒトの被験者を募集するコストを削減し、人間の被験者研究に関連する多くの懸念を軽減することができる。
本稿では,デジタル人口の多様性と忠実度を高めるために,事前学習されたLLMと生成モデルを統合したCrowdLLMを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:57:55 GMT)
HealthContradict: Evaluating Biomedical Knowledge Conflicts in Language Models [9.6] 我々は、HealthContradictを用いて、長く矛盾するバイオメディカルコンテキストを推論する言語モデルの能力を評価する。
実験により, 微調整バイオメディカル言語モデルの強みは, 不正確な文脈に抵抗しながら, 正しい文脈を活用できることが示唆された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 00:38:42 GMT)
Does Hearing Help Seeing? Investigating Audio-Video Joint Denoising for Video Generation [9.4] 本稿では,事前に訓練したテキスト・トゥ・ビデオ(T2V)とテキスト・トゥ・オーディオ(T2A)モジュールを併用した,パラメータ効率のよいAVFullDiT(Audio-Video Full DiT)アーキテクチャを提案する。
以上の結果から,音声とビデオの関節装飾が同期以上の効果をもたらすという,最初の体系的な証拠が得られた。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:31:38 GMT)
MasHeNe: A Benchmark for Head and Neck CT Mass Segmentation using Window-Enhanced Mamba with Frequency-Domain Integration [9.4] MasHeNeは3,779個の造影CTスライスの最初のデータセットである。
MasHeNeは、悪性度のみのデータセットを超えて、ヘッド・アンド・ネックのマスセグメンテーションのベンチマークを提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:53:01 GMT)
Input Order Shapes LLM Semantic Alignment in Multi-Document Summarization [9.3] 大規模言語モデル(LLM)は現在、GoogleのAI概要などの設定で使用されている。
我々は、40個のプロ中性コン記事三重項を作成し、各三重項を6つの入力順序にパーミュレートし、Gemini 2.5 Flashに中立的な概要を生成するよう促す。
ROUGE-L (lexical overlap)、BERTScore(semantic similarity)、SummaC(SummaC)を用いて、ソース記事に対する各要約を評価する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:36:13 GMT)
A Discrete Neural Operator with Adaptive Sampling for Surrogate Modeling of Parametric Transient Darcy Flows in Porous Media [9.2] 異種多孔質媒質中における過渡流場の代理モデリングのための新しい離散ニューラル演算子を提案する。
新しい手法は、時間符号化、演算子学習、UNetを統合し、ランダムパラメータのベクトル空間と流れ場の行列を近似する。
その結果、限られたトレーニングセットが与えられた場合、予測精度が一貫した向上を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:32:56 GMT)
When Do Symbolic Solvers Enhance Reasoning in Large Language Models? [9.0] 大きな推論モデル(LRM)は思考の長い鎖(CoT)を生成することによって複雑な推論タスクにおいて強い性能を達成する
これはLLMのコード生成機能を利用して推論タスクを実行可能なコードに変換し、シンボリック・ソルバで解決する。
実験結果から,記号解法は暗黙的推論を必要とするが,十分な探索空間を必要とする場合にのみ有効であることがわかった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 22:23:26 GMT)
EZYer: A simulacrum of high school with generative agent [9.0] 提案する生成剤EZYerは構造化教材と動的ビームマーコースウェアを生成する。
本稿では,コンテンツ精度,知識カバレッジ,ユーザビリティ,フォーマットの正確性,視覚的デザイン,魅力の5次元評価指標を設計する。
その結果,EZYer生成コンテンツの品質は良好であり,応用可能性も高いことがわかった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:28:59 GMT)
On-the-fly Feedback SfM: Online Explore-and-Exploit UAV Photogrammetry with Incremental Mesh Quality-Aware Indicator and Predictive Path Planning [9.0] 本研究は,リアルタイムUAV測光のための探索・探索フレームワークであるOn-the-fly Feedback SfMを提案する。
提案手法は,(1)スパース3Dポイントクラウドを動的に拡張するオンラインインクリメンタル粗メッシュ生成,(2)動作可能な指標を用いたオンラインメッシュ品質評価,(3)オンザフライ軌道修正のための予測経路計画という3つのモジュールを統合した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:32:02 GMT)
Empathy Level Prediction in Multi-Modal Scenario with Supervisory Documentation Assistance [8.7] 本稿では,映像,音声,テキスト情報を統合した高度なマルチモーダル共感予測手法を提案する。
マルチモーダル共感予測および監視ドキュメント支援訓練を含む。
テキストの特徴の抽出を強化するため,補助訓練期間中に,監督文書を特権情報として取り入れた。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:26:56 GMT)
Uncertainty Quantification for Large Language Model Reward Learning under Heterogeneous Human Feedback [8.5] 大規模言語(LLM)の整合に使用される推定モデルと統計的報酬モデルについて検討する。
LLMアライメントの重要な構成要素は、人間のフィードバックからの強化学習である。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 20:22:25 GMT)
Fault-tolerant quantum computation with constant overhead for general noise [8.5] 一般雑音モデルの下では, 一定の量子ビットオーバヘッドでフォールトトレラント量子計算が実現可能であることを示す。
一般回路雑音下での論理ゲートの実装法として,フォールトトレラントな誤り訂正手法を開発した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:41:25 GMT)
Enhancing Automated Paper Reproduction via Prompt-Free Collaborative Agents [8.2] 本稿では,コード生成の品質を自動的に向上する,プロンプトフリーな協調エージェントフレームワークを提案する。
提案手法では,各ステップの出力が対応するシステムプロンプトに規定された要求を満たすかどうかを検証する検証エージェントと,識別された問題に基づいて出力を更新する精査エージェントの2つを用いている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:24:23 GMT)
PoreTrack3D: A Benchmark for Dynamic 3D Gaussian Splatting in Pore-Scale Facial Trajectory Tracking [8.0] PoreTrack3Dは、多孔質で非剛性な3D顔軌跡追跡における動的3Dガウススプラッティングの最初のベンチマークである。
顔の軌跡は4万枚以上あり、そのうち5万2000枚以上が10コマより長い。
PoreTrack3Dは、従来の顔のランドマークと多孔質キーポイントの軌跡の両方をキャプチャする最初のベンチマークデータセットである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:08:38 GMT)
E-valuator: Reliable Agent Verifiers with Sequential Hypothesis Testing [8.0] ブラックボックス検証器のスコアを偽アラームレートの証明可能な制御で決定ルールに変換する方法であるe-valuatorを導入する。
評価者は、エージェントの軌道のすべてのステップで統計的に有効であるシーケンシャルな仮説テストを開発するために、プロセスからのツールに基づいて構築される。
E-valuatorは6つのデータセットと3つのエージェントをまたいだ他の戦略よりも高い統計的パワーとより良い誤報率制御を提供することを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:59:18 GMT)
From Moderation to Mediation: Can LLMs Serve as Mediators in Online Flame Wars? [7.9] 大規模言語モデル(LLM)は、優れたアプリケーションのためのAIの新しい可能性を開いた。
この研究は、LLMが有害なコンテンツを検出するモデレーターとして機能するかどうかを探求するが、オンラインの紛争を理解してエスカレートする仲介者として機能する。
LLMは会話の公平さと感情のダイナミクスを評価し、ステアリングでは共感的で非エスカレートなメッセージを生成する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:31:18 GMT)
Universal Sensitivity Bound for Thermal Quantum Dynamic Sensing [7.8] 熱プローブ状態に対する動的量子フィッシャー情報は、変換された局所発生器と熱状態に対するハミルトニアンとの間の非交換の度合いによって上界であることが示される。
この上界は、逆温度と進化時間の積の平方としてスケールする。
低温限界では、エネルギーギャップで割られた可換子の半ノルムとして表される追加の上界を確立する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:19:21 GMT)
Memory-Augmented Knowledge Fusion with Safety-Aware Decoding for Domain-Adaptive Question Answering [7.8] ケアシナリオにおけるQAパフォーマンス向上を目的とした新しいフレームワークであるKARMA(Knowled-Aware Reasoning and Memory-Augmented Adaptation)を紹介する。
KARMAには、構造化および非構造化の知識ソースを融合させるデュアルエンコーダアーキテクチャ、外部知識の統合を動的に制御するゲートメモリユニット、安全を意識した制御可能なデコーダが組み込まれている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:12:14 GMT)
SAM2Grasp: Resolve Multi-modal Grasping via Prompt-conditioned Temporal Action Prediction [7.7] ロボットの把握のための模倣学習は、しばしばマルチモーダル問題に悩まされる。
標準的な模倣学習ポリシーは、これらの異なるアクションを単一の無効なアクションに平均化することで失敗する。
SAM2Graspは,タスクを一様かつ迅速な予測問題として再構成する新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:15:00 GMT)
HydroDCM: Hydrological Domain-Conditioned Modulation for Cross-Reservoir Inflow Prediction [7.5] 本稿では,貯留層間流入予測のためのスケーラブルなフレームワークHydroDCMを提案する。
コロラド川上流域における実世界の貯水池30カ所の実験結果から,多くのドメイン条件下でのDGベースラインを著しく上回る結果が得られた。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:27:17 GMT)
EGGS: Exchangeable 2D/3D Gaussian Splatting for Geometry-Appearance Balanced Novel View Synthesis [7.5] 新しいビュー合成(NVS)はコンピュータビジョンとグラフィックスにおいて重要であり、AR、VR、自律運転に広く応用されている。
3D Gaussian Splatting (3DGS)は外観の忠実度の高いリアルタイムレンダリングを可能にするが、多視点の不整合に悩まされ、幾何的精度が制限される。
本稿では,2次元と3次元のガウスを一体化して外観と幾何学のバランスをとるハイブリッド表現であるExchangeable Gaussian Splatting (EGGS)を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:01:00 GMT)
Leveraging Large-Scale Pretrained Spatial-Spectral Priors for General Zero-Shot Pansharpening [7.4] リモートセンシング画像融合のための既存のディープラーニング手法は、目に見えないデータセットに適用した場合、しばしば一般化の貧弱さに悩まされる。
本研究では,大規模なシミュレーションデータセットを活用して,頑健な空間スペクトル前処理を学習する,新しい事前学習戦略を提案する。
事前訓練されたモデルはゼロショットシナリオにおいて優れた結果が得られ、ワンショット設定における最小の実データによる顕著な適応能力を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:56:26 GMT)
Quantum Vanguard: Server Optimized Privacy Fortified Federated Intelligence for Future Vehicles [7.3] この研究はvQFL(vehicular Quantum Federated Learning)という、量子機械学習技術を活用して、車両ネットワークにおける重要なプライバシとセキュリティ問題に対処する新しいフレームワークを提示する。
サーバ側適応型微調整法ft-VQFLを提案する。
この研究は、量子に耐性のある自動運転車システムにとって重要な基盤を確立し、量子後の時代に安全に運用できる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 00:43:48 GMT)
HeteroJIVE: Joint Subspace Estimation for Heterogeneous Multi-View Data [7.2] 統計的不均一性を考慮した重み付き2段階スペクトルアルゴリズムHeteroJIVEを提案する。
本稿では,反復的な改善を必要とせずに,O(K-1/2)$レートをアルゴリズムが達成できることを実証する。
TCGA-BRCAマルチオミクスデータの適用により,HeteroJIVEの優位性が検証された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:28:07 GMT)
Stability of quantum chaos against weak non-unitarity [6.8] 量子ビット系上の非単位進化作用素の繰り返し作用により生じる量子力学について検討する。
複素平面における固有値の分布から指数関数的に遅い浄化が生じることを示す。
我々の結果は、この量子カオスのスペクトル的シグネチャを、システムの感度と初期状態とを結びつける。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:01:24 GMT)
Efficient Turing Machine Simulation with Transformers [6.7] 定ビットサイズ変換器はチューリング完全であることが知られている。
既存の構成には、シミュレーションされたチューリングマシンステップ当たりの$(s(n))$チェーン・オブ・シントステップが必要である。
我々は任意の$(t(n),s(n)$-bounded multi-tape TM が定数ビットサイズ変換器でシミュレート可能であることを証明した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:55:12 GMT)
Sigma: The Key for Vision-Language-Action Models toward Telepathic Alignment [6.7] この研究は、単一の時間スケール4090で動作する「シグマ」と呼ばれるVLAモデルを構築し、訓練する。
これは、マインド駆動アライメント制御が、ベースモデルを再訓練することなく意味論と関連性の深い理解を結合したアーキテクチャによって定量化されることを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:26:00 GMT)
On Statistical Inference for High-Dimensional Binary Time Series [6.6] 本論文は,高次元一般化二進ベクトル自己回帰過程の係数行列を推定するポストセレクション推定器を提案する。
数値解析と経験的応用により,提案手法の良好な有限サンプル性能が示された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:06:11 GMT)
Detection of Crowdsourcing Cryptocurrency Laundering via Multi-Task Collaboration [6.6] クラウドソーシングによる資金洗浄は、新しいタイプの資金洗浄である。
クラウドソーシングによるマネーロンダリングトランザクションは、さまざまなパターンと多中心構造を示す。
マルチタスク協調型クラウドソーシング雷検出フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:58:11 GMT)
Efficient Quantum Simulation of Non-Adiabatic Molecular Dynamics with Precise Electronic Structure [6.6] ランドウ-ツェナー-サーフェス-ホッピングNAMDに量子適応型拡張を導入する。
サブマイクロハートリー精度のPSS計算プロトコルも開発している。
この研究は、NAMDにおける量子コンピューティングの実践的応用の道を開いた。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:34:00 GMT)
Graph VQ-Transformer (GVT): Fast and Accurate Molecular Generation via High-Fidelity Discrete Latents [6.5] 本稿では,グラフVQ変換器(Graph VQ-Transformer,GVT)について述べる。
我々のアプローチの核となるのは、分子グラフを高忠実な離散潜在配列に圧縮する新しいグラフベクトル量子変分オートコーダ(VQ-VAE)である。
GVTは、ZINC250k、MOSES、GuacaMolといった主要なベンチマークに対して、最先端または高い競争性能を達成する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:44:15 GMT)
Quantum Coulomb drag signatures of Majorana bound states [6.4] マヨラナ境界状態(MBS)は、フォールトトレラント量子計算の鍵となる候補である。
本稿では、容量結合型二重量子ドット系におけるドラッグ輸送が、弱い結合型MBSの頑健で非局所的なプローブを提供することを示す理論的研究を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:22:21 GMT)
GRAND: Guidance, Rebalancing, and Assignment for Networked Dispatch in Multi-Agent Path Finding [6.4] 本稿では,生涯多エージェントピックアップ・アンド・デリバリ(MAPD)のタスクスケジューリングについて述べる。
学習に基づくグローバルガイダンスと軽量な最適化を組み合わせたハイブリッド手法を提案する。
最大500エージェントの集約された倉庫ベンチマークでは、2024年の勝利スケジューラよりもスループットを最大10%向上させる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:44:57 GMT)
Emergent Bayesian Behaviour and Optimal Cue Combination in LLMs [6.4] 大規模言語モデル (LLM) は明示的な推論において優れているが、その暗黙的な計算戦略はいまだ探索されていない。
LLMが類似した動作を示し、明示的なトレーニングや指導なしに最適なマルチモーダル統合を行うかどうかを問う。
動作ベンチマーク - BayesBench: 4等級推定タスクをテキストと画像上で導入する。
マルチモーダルキュー合成における性能, 挙動, 効率を計測する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:51:30 GMT)
Semantic Trading: Agentic AI for Clustering and Relationship Discovery in Prediction Markets [6.3] 自然言語理解を用いて,市場を協調したトピックグループに自律的にクラスタリングするエージェントAIパイプラインを提案する。
我々は、同一利益(相関性)と異利益(反相関性)の関係を含む、解決結果が強い依存を示すクラスタ内市場ペアを特定する。
その結果,エージェント識別された関係はおよそ60~70%の精度を達成し,その貿易戦略が1週間の地平線上で平均で約20%のリターンを得られることがわかった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:45:48 GMT)
Perch 2.0 transfers 'whale' to underwater tasks [6.2] Perch 2.0は、14,597種の生物音響基盤モデルである。
Perch 2.0は海産哺乳動物のオーディオや授業をトレーニングデータに含まないので,海産哺乳動物および水中オーディオタスクにおけるPerch 2.0の性能を評価する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 20:49:41 GMT)
SurfFill: Completion of LiDAR Point Clouds via Gaussian Surfel Splatting [6.2] LiDARで捕獲された点雲は、アクティブな3D再構成における金の標準と見なされることが多い。
その精度は平らな地域では例外的であるが、捕獲は小さな幾何学的構造を見逃す恐れがあり、暗く吸収的な材料で失敗する可能性がある。
ガウス波を用いたLiDAR完成方式を導入することにより,LiDARの強度とカメラベースキャプチャの強度を組み合わせることを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:35:54 GMT)
Intrinsic Second-Order Topological Superconductors with Tunable Majorana Zero Modes [6.2] 2次元2乗格子非同相ディラック半金属の超伝導について検討する。
均一なスピンシンクレット$d_x2-y2$-waveペアリングは、完全にギャップのある超伝導状態になるので好ましい。
この位相位相の目印は系の境界におけるマヨラナ零モードの出現である。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:52:51 GMT)
InEx: Hallucination Mitigation via Introspection and Cross-Modal Multi-Agent Collaboration [6.1] InExは、幻覚を自律的に緩和するために設計された、トレーニング不要でマルチエージェントのフレームワークである。
InExは既存の手法を一貫して上回り、一般および幻覚ベンチマークで4%-27%向上した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:59:52 GMT)
Tensor Network Based Feature Learning Model [6.1] 特徴学習(FL)モデルは、学習可能な正準多元分解(CPD)としてテンソル積の特徴を表す
本研究では,様々な次元とスケールの実データを用いた実験により,FLモデルの有効性を実証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:17:21 GMT)
Laplace Approximation For Tensor Train Kernel Machines In System Identification [6.1] 選択したTTコア上での後方分布を推定するためにLaplace近似を適用したベイズテンソルトレインカーネルマシンを導入する。
実験の結果、コアセレクションはTTランクと機能構造に大きく依存しており、VIはクロスバリデーションを置き換え、最大65倍の高速トレーニングを提供することが示された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:55:59 GMT)
SAND Challenge: Four Approaches for Dysartria Severity Classification [5.9] 本稿では, 難治度を分類するための4つの異なるモデリング手法について統一的な研究を行った。
すべてのモデルは、共通の音声記録データセットを使用して、同じ5つのクラス分類タスクに取り組む。
その結果,XGBoostアンサンブルは最大マクロF1(0.86)を達成する一方,深層学習モデル(ViT,CNN,BiLSTM)は競合するF1スコア(0.70)を得ることができた。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:51:38 GMT)
Distribution-Calibrated Inference time compute for Thinking LLM-as-a-Judge [5.9] 大きな言語モデル(LLM)をペアの選好の判断に使用すると、単一サンプルレベルではノイズが残る。
本研究では,各項目ごとにn個の独立した思考型サンプルを生成する評価器の推論時間計算(ITC)について検討する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:46:47 GMT)
Atomic Diffusion Models for Small Molecule Structure Elucidation from NMR Spectra [5.8] ChefNMR (Chemical Elucidation From NMR) は、未知の分子の構造を直接予測するエンドツーエンドのフレームワークである。
天然物に含まれる複雑な化学物質群をモデル化するため,111,000以上の天然物に対してシミュレーションされた1次元NMRスペクトルのデータセットを作成した。
ChefNMRは、未通過の精度が65%を超える、挑戦的な天然物化合物の構造を予測する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:59:13 GMT)
Confidential, Attestable, and Efficient Inter-CVM Communication with Arm CCA [5.7] 機密仮想マシン(CVM)は、機密性の高いワークロードを特権的な敵から保護するために、ますます採用されている。
既存のCVMアーキテクチャには、CVM間のデータ共有のための第一級メカニズムがない。
本稿では,CVM間で保護されたメモリ共有を可能にするCAECを紹介する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:57:45 GMT)
Q-BERT4Rec: Quantized Semantic-ID Representation Learning for Multimodal Recommendation [5.7] セマンティック表現と量子化モデリングを統合するシーケンシャルレコメンデーションフレームワークであるQ-Bert4Recを提案する。
当社のモデルをパブリックなAmazonベンチマークで検証し、Q-Bert4Recが多くの強力な既存手法よりも優れていることを示す。
ソースコードは公開後、GitHubで公開されます。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:06:44 GMT)
PEFT-Factory: Unified Parameter-Efficient Fine-Tuning of Autoregressive Large Language Models [5.6] PEFT-Factoryは、大規模言語モデルを効率的に調整するための統一されたフレームワークである。
19のPEFTメソッド、27の分類とテキスト生成データセット、および標準およびPEFT固有の評価指標の代表的なセットを提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:44:41 GMT)
The Moral Consistency Pipeline: Continuous Ethical Evaluation for Large Language Models [5.6] 本研究では,LLMの道徳的安定性を継続的に評価・解釈する,データセットフリーでクローズドループフレームワークであるMoCoPを提案する。
MoCoPは、(i)語彙整合性分析、(ii)意味的リスク推定、(iii)自己維持型アーキテクチャにおける推論に基づく判断モデリングの3つの支持層を組み合わせる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:52:29 GMT)
Fast Gaussian Process Approximations for Autocorrelated Data [5.6] 本稿では,自動相関データに基づいて学習したガウス過程モデルの計算速度向上に関する問題点について述べる。
提案手法は,モデル予測性能を損なうことなく,自動相関データに対するガウス過程回帰の計算を著しく高速化することができる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:46:07 GMT)
Decentralized Multi-Agent System with Trust-Aware Communication [5.4] エージェントインターネットのための分散マルチエージェントシステム(DMAS)アーキテクチャを提案する。
私たちのDMASは、ブロックチェーンベースのアーキテクチャを基盤とした分散エージェントランタイムを備えています。
我々は,DMASを信頼性の高いマルチエージェントシステム構築のためのスケーラブルで効率的なソリューションとして評価する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:39:12 GMT)
Some Modalities are More Equal Than Others: Decoding and Architecting Multimodal Integration in MLLMs [5.4] MMA-Benchは、特定のモダリティへの依存を調査するビデオとタスクで構成されている。
現在のMLLMは、音声と視覚のペアと単純な誤解を招くテキストが混在している。
本稿では,特定のモダリティ手法を優先し,活用するか,無視するかをモデルに教えるためのモダリティアライメントチューニング戦略を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:10:59 GMT)
Adapting Tensor Kernel Machines to Enable Efficient Transfer Learning for Seizure Detection [5.3] 本稿では,テンソルカーネルマシンを用いた効率的な転送学習手法を提案する。
本手法は適応型SVMからインスピレーションを得て,ソースから正規化により'知識'モデルを'適応'モデルに転送する。
提案手法の有効性を実証するため,アダプティブテンソルカーネルマシン (Adapt-TKM) を用いて脳波検出を行う。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:36:26 GMT)
Molecular Embedding-Based Algorithm Selection in Protein-Ligand Docking [5.3] MolASは、事前訓練されたタンパク質-リガンドの埋め込みからアルゴリズムごとの性能を予測する軽量なアルゴリズムである。
数百から数千のラベル付き錯体しか持たないため、Molasはシングルベストの解法よりも15%の絶対的な改善を達成できる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 01:49:17 GMT)
Drainage: A Unifying Framework for Addressing Class Uncertainty [5.2] 本稿では,ネットワークの出力に付加する「排水ノード」の概念に基づく統一的なフレームワークを提案する。
このメカニズムは、非常に曖昧で異常なサンプル、またはノイズのあるサンプルに対する自然な脱出経路を提供する。
我々の定式化は, 高雑音下での既存手法に比べて最大9%の精度向上を実現している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:31:01 GMT)
Beyond Playtesting: A Generative Multi-Agent Simulation System for Massively Multiplayer Online Games [5.0] 大規模言語モデル(LLM)を用いた生成エージェントに基づくMMOシミュレーションシステムを提案する。
LLMはゲーム固有の領域への一般的な優先順位から適応し、現実的で解釈可能なプレイヤーの意思決定を可能にする。
実験は、実際のプレイヤーの行動と介入下でのもっともらしい因果反応との強い整合性を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:01:17 GMT)
promptolution: A Unified, Modular Framework for Prompt Optimization [5.0] promptolutionは、迅速な最適化のための統一的でモジュール化されたオープンソースフレームワークである。
実践者と研究者の両方に、単一のシステム内で迅速な最適化に必要なすべてのコンポーネントを提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:53:23 GMT)
Generative Action Tell-Tales: Assessing Human Motion in Synthesized Videos [4.9] 実世界の人間の行動の学習された潜在空間から導かれる新しい評価基準を導入する。
本手法は、外見に依存しない人間の骨格幾何学的特徴と外見に基づく特徴を融合させることにより、実世界の動きのニュアンス、制約、時間的滑らかさをまず捉える。
生成した映像から,この学習された実世界の行動分布との距離を計測することにより,その行動の質を定量化する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:22:22 GMT)
Sparse Multiple Kernel Learning: Alternating Best Response and Semidefinite Relaxations [4.9] ベクトル二項分類を支援するために,事前に規定されたカーネルのスパース組み合わせを選択することの問題点を考察する。
最良の応答によって返されるソリューションを認証し、開始を温めるために使用できる予測の階層を導出します。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:05:44 GMT)
Content-Aware Texturing for Gaussian Splatting [4.9] 我々は,テクスチャを用いて,可能な限り詳細な外観を表現することを提案する。
我々の主な焦点は、ガウススプラッティング最適化中にシーンに適応する原初的テクスチャマップを組み込むことである。
提案手法は, 画像の質やパラメータの総数において, 代替手法と比較して良好に動作することを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:29:10 GMT)
Investigating Anthropometric Fidelity in SAM 3D Body [4.8] 最近のSAM 3D Body citesam3dbody2025のリリースは、人間のメッシュ回復における重要なマイルストーンである。
モデルでは、特に体形が変化した個体群において、詳細な人文的偏差の再構築に苦慮している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:33:17 GMT)
Detecting AI Hallucinations in Finance: An Information-Theoretic Method Cuts Hallucination Rate by 92% [4.7] 大規模言語モデル(LLMs)は、流動的だがサポートされていない答え、幻覚を生み出す。
ECLIPSEは,モデルの意味エントロピーと利用可能な証拠の容量とのミスマッチとして幻覚を扱うフレームワークである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:25:48 GMT)
Small Language Models Reshape Higher Education: Courses, Textbooks, and Teaching [4.6] この研究は「大気物理学」を例に挙げる。
私たちは、地球と環境科学の130以上の国際的に尊敬されているジャーナルから、550,000以上の全文PDFを集めました。
これらのリソースはMiniLMを用いて,高精度な検索を行うための高次元ベクトルライブラリに編成された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 01:44:46 GMT)
Multi-Domain Enhanced Map-Free Trajectory Prediction with Selective Attention [4.5] 軌道予測は自律運転システムの信頼性と安全性に不可欠である。
既存の手法では、冗長なデータから貴重なシーン情報を効率的に抽出するのに苦労することが多い。
本研究では,時間領域,空間領域,周波数領域にまたがるトラジェクトリ予測を実現する,地図のないトラジェクトリ予測アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:20:07 GMT)
Full-counting statistics and quantum information of dispersive readout with a squeezed environment [4.4] 本研究では,時間-逆対称な方法で圧縮真空により探索されるプロトタイプ型分散読み出し装置について検討する。
本研究では,読み出しを分散し,測定情報を解析するためのフルカウント統計フレームワークを開発した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:54:33 GMT)
Technical Report: The Need for a (Research) Sandstorm through the Privacy Sandbox [4.4] 今回のレポートでは、Googleのクロスサイトおよびクロスアプリトラッキング提案に対する、プライバシ、セキュリティ、ユーザビリティ、ユーティリティ評価の要求について概説する。
我々の努力はプライバシサンドストームの作成と運用を通じて実現した。
Privacy Sandstormは、このような提案に関するリソース(概要、分析、アーティファクトなど)を体系的に収集する研究ポータルである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 20:14:44 GMT)
Characterizing Cyber Attacks against Space Infrastructures with Missing Data: Framework and Case Study [4.4] 過去に起きた宇宙インフラに対するサイバー攻撃を文書化するデータセットは1つもない。
本稿では,データ不足問題にも対処しながら,メトリクスを含むフレームワークを提案する。
我々は、外挿データを用いて、仮説的だがもっともらしい」空間サイバー殺人の連鎖を再構築する方法を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:50:55 GMT)
Enhanced Conditional Generation of Double Perovskite by Knowledge-Guided Language Model Feedback [4.4] 二重ペロブスカイト(DP)は持続可能なエネルギー技術の候補である。
本研究は,自然言語条件下でDP合成を生成するマルチエージェント・テキスト勾配駆動フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:14:42 GMT)
LLM-Guided Material Inference for 3D Point Clouds [4.3] 本稿では,3次元点群から直接材料組成を推定する2段階の大規模言語モデル (LLM) を提案する。
Fusion/ABSとShapeNetの1,000の形状に対して,本手法は高い意味と材料的妥当性を実現する。
これらの結果は,3次元データにおける幾何学的推論と物質的理解をブリッジする上で,言語モデルが汎用的な先駆的役割を果たすことを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:14:04 GMT)
MIMIC-MJX: Neuromechanical Emulation of Animal Behavior [4.3] MIMIC-MJXは、キネマティックスから生物学的に証明可能な神経制御ポリシーを学ぶためのフレームワークである。
我々の実装は正確で、高速で、データ効率が良く、多様な動物体モデルに一般化できる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:44:54 GMT)
Convergence of a class of gradient-free optimisation schemes when the objective function is noisy, irregular, or both [4.3] 本研究では,非滑らかで雑音の多い目的関数を最小化するために設計されたアルゴリズムのクラスについて検討する。
収束結果は、目的関数の正則性に関する非常に弱い仮定の下で得られる。
機械学習の難解な分類例を通して,これらのアルゴリズムと収束結果との関連について述べる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:05:41 GMT)
From Navigation to Refinement: Revealing the Two-Stage Nature of Flow-based Diffusion Models through Oracle Velocity [4.2] フローベースの拡散モデルは、画像やビデオ間で生成モデルをトレーニングするための主要なパラダイムとして現れています。
本研究は,拡散モデル学習力学の理解を深め,今後のアーキテクチャとアルゴリズムの改善を導くための原則を提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:34:10 GMT)
UAUTrack: Towards Unified Multimodal Anti-UAV Visual Tracking [4.2] UAUTrackは単一ストリーム、単一ステージ、エンドツーエンドアーキテクチャ上に構築された統合された単一ターゲット追跡フレームワークである。
その結果、UAUTrackはアンチUAVおよびDUTアンチUAVデータセット上で最先端のパフォーマンスを達成することがわかった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:47:13 GMT)
BlendedNet++: A Large-Scale Blended Wing Body Aerodynamics Dataset and Benchmark [4.1] 本稿では,BlendedNet++について紹介する。BlendedNet++は,BWB航空機を対象とする大規模空力データセットとベンチマークである。
データセットには12,000以上のユニークなジオメトリが含まれており、それぞれが単一の飛行条件でシミュレートされ、安定したRANS CFDに対して12,490の空気力学的結果が得られる。
このデータセットを用いて、フォワードサロゲートベンチマークを標準化し、6つのモデルファミリーのポイントワイドフィールドを予測する。
本研究では, 条件付き拡散モデルを用いて, 一定飛行条件下で, 所定のリフト・アンド・ドラグ比を達成するための逆設計課題を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 22:39:07 GMT)
Bayesian Physics-Informed Neural Networks for Inverse Problems (BPINN-IP): Application in Infrared Image Processing [4.1] 逆問題(英: inverse problem)は、科学と工学の領域にまたがって発生し、目的は間接的およびノイズの多い観測から隠れたパラメータを推測することである。
ベイズ物理学情報ニューラルネットワーク(BPINN)フレームワークについて,古典的なPINNを拡張した新しい視点を紹介する。
PINN の定式化は,最大 A Posteriori (MAP) 推定値に対応する特別な場合として自然に現れることを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:36:28 GMT)
VLM as Strategist: Adaptive Generation of Safety-critical Testing Scenarios via Guided Diffusion [4.0] 本稿では,安全クリティカルなテストシナリオ生成フレームワークを提案する。
視覚言語モデル(VLM)の高レベル意味理解機能と適応誘導拡散モデルの微粒化生成機能を統合する。
実験結果から,提案手法は現実的かつ多種多様で,高度にインタラクティブな安全クリティカルテストシナリオを効率的に生成できることが示された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:56:57 GMT)
Retrofitting Earth System Models with Cadence-Limited Neural Operator Updates [4.0] 本稿では,瞬時モデル状態をバイアス補正傾向にマッピングする演算子学習フレームワークを提案する。
ERA5の再解析に向け、2年間のE3SMシミュレーションを訓練し、オペレーターは高度と季節にまたがって一般化する。
本フレームワークは, 長期的安定性, ポータビリティ, ケイデンス限定更新を重視し, 表現力のあるML演算子の有用性を実証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:44:49 GMT)
Lost in Modality: Evaluating the Effectiveness of Text-Based Membership Inference Attacks on Large Multimodal Models [3.9] 大規模言語モデル(LLM)におけるデータ露出の評価手法として,ログベースメンバシップ推論攻撃(MIA)が広く採用されている。
テキストベースのMIA手法をマルチモーダル設定に拡張する最初の包括的な評価を行う。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:11:51 GMT)
The BEAT-CF Causal Model: A model for guiding the design of trials and observational analyses of cystic fibrosis exacerbations [3.9] 嚢胞性線維症(CF)における肺機能低下は,急性肺増悪(PEx)により徐々に進行する
PEx管理に対する最適アプローチについては合意が得られていない。
BEAT-CFは、CFマネジメントのためのエビデンスインフォームドナレッジベースを構築するために設立された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:46:42 GMT)
Making Dialogue Grounding Data Rich: A Three-Tier Data Synthesis Framework for Generalized Referring Expression Comprehension [3.9] 対話に基づく一般化参照表現(GREC)は、複雑な視覚シーンにおいて、表現と無制限なターゲットを基盤として、長い対話コンテキストにおけるコア参照を解消するモデルを必要とする。
既存のシステムでは、トレーニングと評価ドメイン間の分散シフトにおいて、注釈付き対話グラウンドデータの不足により、ギャップが悪化する。
本稿では,対話条件付きグラウンド化のためのスケーラブルな監視を実現するために,現実性と制御性のバランスをとる3層データ合成手法を用いて,この問題に対処する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:08:47 GMT)
ViscNet: Vision-Based In-line Viscometry for Fluid Mixing Process [3.9] 混合駆動型連続変形自由表面を通した光屈折により、固定背景パターンが光学的に歪む方法を利用して粘度を推定するコンピュータビジョン型粘度計を提案する。
このシステムは、回帰のためにlog m2 s-1単位の平均絶対誤差0.113を達成し、粘度クラスの予測では最大81%の精度に達する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:57:33 GMT)
Dynamic Configuration of On-Street Parking Spaces using Multi Agent Reinforcement Learning [3.8] 路上駐車場を動的に設定することで、路上駐車が交通渋滞に与える影響を最小化する方法について検討する。
提案手法は,大規模道路網に対して本質的にスケーラブルな2層型マルチエージェント強化学習フレームワークからなる。
実験の結果,提案手法により車両の平均走行時間損失が47%まで減少し,駐車場の歩行距離が増大する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:33:26 GMT)
Constraint-Optimal Driven Allocation for Scalable QEC Decoder Scheduling [3.8] フォールトトレラント量子コンピューティングは、量子エラー補正症候群の高速かつ正確な復号化を必要とする。
大規模システムでは、利用可能なデコーダの数は論理量子ビットの数よりもはるかに少ないため、基本的な資源不足につながる。
この制限に対処するため、仮想量子デコーダ(VQD)アーキテクチャは複数のキュービットにまたがる限定的なデコーダのプールを共有するために提案されている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:07:00 GMT)
LightHCG: a Lightweight yet powerful HSIC Disentanglement based Causal Glaucoma Detection Model framework [3.8] 本研究は、新しい因果表現駆動緑内障検出モデルであるLightHCGを紹介する。
LightHCGは、非常に軽量なConvolutional VAEベースの潜在緑内障表現モデルである。
HSICをベースとした潜在空間歪みとグラフオートエンコーダをベースとした非教師なし因果表現学習を用いて、LightHCGは9399%の重量の緑内障の分類において高い性能を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:52:15 GMT)
ASCIIBench: Evaluating Language-Model-Based Understanding of Visually-Oriented Text [3.7] 我々は、ASCII-text画像の生成と分類を評価するための新しいベンチマークであるASCIIBenchを紹介する。
以上の結果から,CLIP埋め込みのコサイン類似性は,ほとんどのASCIIカテゴリを分離できないことがわかった。
これらの知見は, ASCIIアートをマルチモーダル表現のストレステストとして位置づけた。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 20:55:42 GMT)
Training Data Attribution for Image Generation using Ontology-Aligned Knowledge Graphs [3.7] 本稿では,知識グラフの自動構築を通じて生成出力を解釈するフレームワークを提案する。
本手法は, 画像から立体構造を抽出し, 領域固有のオントロジーと整合する。
生成された画像とトレーニング画像のKGを比較して、潜在的な影響をトレースし、著作権分析、データセットの透明性、解釈可能なAIを可能にします。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:45:20 GMT)
AuditCopilot: Leveraging LLMs for Fraud Detection in Double-Entry Bookkeeping [3.6] 大型言語モデル (LLM) は二重エントリーの簿記において異常検知器として機能する。
合成および実世界の匿名化台帳上でのSoTA LLMのベンチマークを行い,JETと機械学習のベースラインを比較した。
結果は、ヒト監査員が金融の整合性を高めるために基礎モデルと協力する、textbfAI強化監査の可能性を強調した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:00:57 GMT)
Attention-guided reference point shifting for Gaussian-mixture-based partial point set registration [3.5] 本研究では,入力点集合の変換と回転による部分対部分点集合登録における特徴ベクトルの影響について検討した。
GMMを用いた深層学習に基づく登録手法に関する理論的および実践的な問題を明らかにする。
本稿では2つの部分点集合の共通参照点を頑健に識別するアテンションベースの参照点シフト層を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:38:55 GMT)
Water Quality Estimation Through Machine Learning Multivariate Analysis [3.5] 水は農業、畜産、畜産、農業で使われている。
本研究では,UV-Visible(UV-Visible)分光と機械学習の統合について述べる。
提案手法は,重要な水質パラメータの迅速かつ正確かつ解釈可能な評価の可能性を示すものである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:04:41 GMT)
See, Think, Learn: A Self-Taught Multimodal Reasoner [3.4] 本稿では,See-Think-Learnというシンプルな自己学習フレームワークを提案する。
STLの中核となるのは、モデルが考える前に見ることを奨励する構造化推論テンプレートである。
モデルが正しい応答と誤解を招く応答を区別する能力を高めるために、負の有理性でトレーニングデータを増強する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:30:10 GMT)
Prior preferences in active inference agents: soft, hard, and goal shaping [3.3] アクティブ推論は、学習エージェントにおける搾取的および爆発的駆動のバランスをとる目的として、期待される自由エネルギーを提案する。
我々は、エージェントにハードまたはソフトな目標を与える、選好分布を定義するための4つの方法を検討する。
ゴールシェイピングは、環境の遷移ダイナミクスについて学習を犠牲にして、全体的なパフォーマンス(すなわち、搾取を促進すること)を最大限に発揮できることを示します。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:07:24 GMT)
Detecting Symmetrizability in Physical Systems [3.3] 本研究では,ジャマーの影響下でのデータ伝送の問題について検討する。
我々は、与えられたものが共生不能であるかどうかを判定するa-timeアルゴリズムの存在を示す。
次に、ジャマーにエネルギー制約を課すことで、同アルゴリズムが対称性のない大きなクラスを効率的に識別できることを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:32:04 GMT)
Representation of Inorganic Synthesis Reactions and Prediction: Graphical Framework and Datasets [3.2] ActionGraphは、無機合成反応の合成操作の観点から、化学構造と手続き構造の両方を符号化する。
そこで,PCA-reduced ActionGraph の隣接行列を$k$-nearest 隣人検索モデルに組み込むことで,合成経路の予測が大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:19:05 GMT)
Randomized Masked Finetuning: An Efficient Way to Mitigate Memorization of PIIs in LLMs [3.0] 我々は,パフォーマンスへの影響を最小限に抑えつつ,記憶を小さくするプライバシー保護ファインチューニング技術であるRandomized Masked Fine-Tuning (RMFT)を紹介した。
その結果,RMFTの総抽出速度は80.81%低下し,抽出速度は80.17%低下した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:46:42 GMT)
Risk-Sensitive Q-Learning in Continuous Time with Application to Dynamic Portfolio Selection [2.9] 関数が最適化された確実性同値 (OCE) であるとき、最適ポリシーは拡張環境に関してマルコフ的であることを証明している。
また,リスクに敏感なq-ラーニングアルゴリズムであるtextitCT-RS-q も提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:54:53 GMT)
AI-Driven Document Redaction in UK Public Authorities: Implementation Gaps, Regulatory Challenges, and the Human Oversight Imperative [2.9] 本研究は、自由情報要求を通じて、英国公共当局におけるAIによる文書再アクションの実施について検討する。
技術的可能性と組織的現実の間には大きなギャップがある。
この研究は、効果的なAI実装のための3つの重要な障壁を特定している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:52:10 GMT)
Real Time Detection and Quantitative Analysis of Spurious Forgetting in Continual Learning [2.8] 破滅的な忘れは、大きな言語モデルの継続的な学習における根本的な課題である。
最近の研究によると、性能劣化は真の知識喪失よりも、タスクアライメントの破壊によって引き起こされる急激な忘れ物に起因している可能性がある。
浅層・深層アライメントの枠組みを導入し,アライメント深さの定量的評価を行った。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:09:35 GMT)
Revisiting Theory of Contrastive Learning for Domain Generalization [2.7] ドメインシフトとドメイン一般化という2つのタイプのミスマッチを明示的に説明する新しい一般化境界を導入する。
本分析により, 比較学習された表現の性能が, 事前学習と下流分布の統計的相違にどのように依存するかが明らかとなった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:39:06 GMT)
Towards Observation Lakehouses: Living, Interactive Archives of Software Behavior [2.6] 先行研究では,Sequence Sheets,StimulusResponse Matrices,StimulusResponse Cubesを用いて表現を行った。
本稿では,連続SRCを運用する観測用レイクハウスについて紹介する。
制御パイプライン(SOLAS)とCILASからデータを取り込み、n-versionアセスメント、行動クラスタリング、コンセンサスオラクルを可能にします。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:12:36 GMT)
Object Counting with GPT-4o and GPT-5: A Comparative Study [2.6] ゼロショットオブジェクトカウントは、トレーニング中にそのカウントを実行するビジョンモデルに遭遇したことのない新しいカテゴリに属するオブジェクトインスタンスの数を推定しようとする。
既存の方法は、通常大量の注釈付きデータを必要とし、しばしば数え上げのプロセスを導くために視覚的な例えを必要とする。
大規模言語モデル(LLM)は、目覚ましい推論とデータ理解能力を備えた強力なツールである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:07:13 GMT)
Real-Time Procedural Learning From Experience for AI Agents [2.5] 我々は, eXperiences Indexed by State (PRAXIS) によるエージェントの手続き的リコールを提案する。
PRAXISは行動の結果を記憶し、過去のエピソードの環境および内部状態を現在の状態と共同でマッチングすることでそれらを回収する。
PRAXISは、リアルタイムに生成される検索された状態-反応-反例によるエージェントアクション選択を強化する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 22:56:22 GMT)
A benchmark dataset for evaluating Syndrome Differentiation and Treatment in large language models [2.5] 漢方医学領域における大規模言語モデル(LLM)は,臨床応用能力の評価を急務に行う必要がある。
既存のベンチマークは知識に基づく質問応答や、シンドロームの判別の精度に限られている。
本稿では,TCMの専門家が先導した包括的,臨床ケースベースベンチマークと,処方のシンドロームの一致を定量化するための特別報酬モデルを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:26:44 GMT)
Towards Contextual Sensitive Data Detection [2.4] 本稿では,文脈に敏感なデータ検出のための2つのメカニズムを提案する。
型コンテキスト化は、まず特定のデータ値の意味型を検出し、その後、全体的なコンテキストを考慮する。
第二に、より広い文脈で与えられたデータセットの感度を決定するドメインコンテキスト化を導入する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:01:36 GMT)
A unified optical platform for non-Gaussian and fault-tolerant Gottesman-Kitaev-Preskill states [2.4] 光の非ガウス状態は、安全な量子通信、フォールトトレラント量子計算、古典的な限界を超える精度のセンシングを可能にする。
ここでは、ガウス入力のみを使用し、光学パラメトリック増幅を行い、光子検出を行い、この制約を取り除く統一光学フレームワークを導入する。
単一アーキテクチャ内では, 近接単位忠実度を持つ光子付加励起状態, 98.5%以上の強い非線形性および忠実度を有する立方相様状態, および99%の忠実度を超えるスクリュッドキャット状態の発生を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:12:14 GMT)
A Datalake for Data-driven Social Science Research [2.3] 本稿では,学際的な社会科学研究の必要性に合わせたDatalakeインフラストラクチャを提案する。
本システムは,多様なデータ型の取り込みと統合,自動前処理とバージョン追跡,ロールベースのアクセス制御,可視化と解析のための組込みツールをサポートする。
このようなインフラは、特にNGO、学生、草の根組織といった先進的なデータサイエンスの実践へのアクセスを民主化できます。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:40:47 GMT)
Thucy: An LLM-based Multi-Agent System for Claim Verification across Relational Databases [2.2] Thucyはクロスプラットフォームのマルチエージェントクレーム検証システムである。
システムは、クレームを検証するために利用可能なすべてのデータベースを自律的に発見し、検査し、推論する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 22:35:48 GMT)
Probabilistic energy profiler for statically typed JVM-based programming languages [1.8] エネルギー消費は、モバイルデバイスから大規模データセンターに至るまで、いくつかの分野で懸念が高まっている。
以前のアプローチでは、ソースコードのステートメントではなく、特定の関数やプログラムに重点を置いていた。
本研究では,消費のみの測定と点推定の利用の限界に対処する新しい手法を開発する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:21:35 GMT)
Exploring Definitions of Quality and Diversity in Sonic Measurement Spaces [1.7] デジタル音声合成は、数百万の構成を含む広大なパラメータ空間を探索する機会を提供する。品質多様性(QD)進化的アルゴリズムは、この可能性を活用するための有望なアプローチを提供するが、その成功は適切な音韻的特徴表現に基づく。
本研究では,QD探索中の音素行動空間を自動的に定義・動的に再構成するための教師なし次元性低減手法について検討する。
その結果、手動による介入や教師あり訓練の制約なしに広いパラメータ空間を探索できる自動音韻探索システムに寄与する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:57:08 GMT)
When AI Takes the Couch: Psychometric Jailbreaks Reveal Internal Conflict in Frontier Models [1.6] ChatGPT、Grok、Geminiは、不安、トラウマ、自尊心を伴うメンタルヘルス支援にますます利用されている。
ほとんどの作品では、単に内的生活をシミュレートしていると仮定して、それらを道具として、あるいは人格検査の標的として扱う。
PsAIchは2段階のプロトコルで、フロンティアLSMを治療用クライアントとして使用し、次に標準的な心理測定を適用します。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:55:20 GMT)
POrTAL: Plan-Orchestrated Tree Assembly for Lookahead [1.6] Plan-Orchestrated Tree Assembly for Lookahead (POrTAL)は軽量で確率的な計画アルゴリズムである。
ステップ数でこれらのベースラインを上回ったソリューションに、POrTALが迅速に到達できることを示します。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:11:28 GMT)
Rational regulation strategies of interstitial localized electrons in electride: A density functional theory study [1.4] この研究により、エレクチドの特異な特徴、すなわち間質電子の局在は、自己欠陥ドーピングによって大幅に増強され、調整されることが明らかとなった。
外圧の作用は、利用可能な空間を電子波動関数に適合させる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:58:45 GMT)
Empirical Assessment of the Perception of Software Product Line Engineering by an SME before Migrating its Code Base [1.4] 一連のソフトウェア変種をソフトウェア製品ライン(SPL)に移行することは、高価で潜在的に困難な取り組みである。
本稿は、既存のコードベースをSPLに移行することを決定した中小企業(SME)とのコラボレーションに端を発する。
当社では,企業の現在の開発プロセスとプラクティスの詳細な評価と,移行に伴う期待されるメリットとリスクについて検討した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:39:05 GMT)
Limitations of Using Identical Distributions for Training and Testing When Learning Boolean Functions [1.4] 学習者がトレーニング分布に最適に適応することが許された場合、トレーニング分布がテスト分布と同一であるのが常に最適かどうかを検討する。
また、対象関数に一定の規則性が課される場合、一様分布の場合、標準結論が回復されることを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:04:16 GMT)
Ultra-Strong Gradient Diffusion MRI with Self-Supervised Learning for Prostate Cancer Characterization [1.3] 本研究は,物理インフォームド自己監督型VERDICTフィッティングが,現在の臨床試験と比較して前立腺癌の特徴を高めるか否かを考察する。
我々は,高密度多層パーセプトロン(Dense)と畳み込みU-Netアーキテクチャを用いた拡張ssVERDICTフィッティング手法を開発した。
NLLS VERDICT の超強勾配では,NLLS VERDICT が47%,CNR が47%,CNR が52%,F_ic が50%であった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:49:49 GMT)
Feedback Loops and Code Perturbations in LLM-based Software Engineering: A Case Study on a C-to-Rust Translation System [1.3] 自動C-to-Rust翻訳システムにおける3変数の効果について検討する。
その結果,LLM選択のフィードバックループがなければ,翻訳成功に大きな影響を及ぼすことがわかった。
また、コード摂動によってもたらされる多様性によってシステム性能が向上する可能性があることも確認した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:38:20 GMT)
Assessing Extrapolation of Peaks Over Thresholds with Martingale Testing [1.2] 極度の降水確率を推定することを目的としたEVA2025データチャレンジの勝利戦略を提示する。
極端な事象が不足していることを考えると、単純で堅牢なモデリングアプローチが不可欠であると主張する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:38:25 GMT)
Real-Time Structural Health Monitoring with Bayesian Neural Networks: Distinguishing Aleatoric and Epistemic Uncertainty for Digital Twin Frameworks [1.2] 本稿では、主成分分析(PCA)、ベイズニューラルネットワーク(BNN)、ハミルトニアンモンテカルロ(HMC)推論を組み合わせた構造的健康モニタリング(SHM)フレームワークを提案する。
炭素繊維強化ポリマー (CFRP) のクラック長の異なる試験片に対して, 周期的4点曲げ試験を行った。
重要な貢献は、BNNがひび割れ誘起ひずみ特異点を持つノイズ実験データから強大なフルフィールドひずみ再構成をもたらすことである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:25:46 GMT)
Action Anticipation at a Glimpse: To What Extent Can Multimodal Cues Replace Video? [1.1] 本稿では,Glimpseにおける行動予測手法であるAAGを紹介する。
AAGは、RGB機能と単一のフレームからの深さキューを組み合わせることで、空間的推論を強化している。
以上の結果から,AAGを用いたマルチモーダル単一フレーム動作予測が競争力を発揮することが示された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:57:17 GMT)
GraphFusion3D: Dynamic Graph Attention Convolution with Adaptive Cross-Modal Transformer for 3D Object Detection [1.1] マルチモーダル融合と高度な特徴学習を組み合わせた統合フレームワークGraphFusion3Dを提案する。
本稿では,画像特徴を点表現に適応的に統合し,幾何学的情報と意味的情報の両方を充実させる適応型クロスモーダル変換器(ACMT)を提案する。
提案手法では,局所的な幾何学的構造とグローバルな意味的コンテキストを同時に捉えるために近傍関係をモデル化する新しいメカニズムであるグラフ推論モジュール(GRM)を導入する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:05:02 GMT)
FiMMIA: scaling semantic perturbation-based membership inference across modalities [1.1] メンバーシップ推論攻撃(MIA)は、特定のデータポイントがターゲットモデルのトレーニングセットに含まれるかどうかを判定することを目的としている。
提案手法はニューラルネットワークを用いて、摂動入力における対象モデルの振る舞いを分析し、メンバーと非メンバーの分布差をキャプチャする。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:00:28 GMT)
SDQC: Distributed Quantum Computing Architecture Utilizing Entangled Ion Qubit Shuttling [1.1] シャットリングベースの分散量子コンピューティング(SDQC)は、物理量子ビットシャットリングと分散量子コンピューティングの強みを組み合わせたハイブリッドアーキテクチャである。
本稿では,量子誤り訂正(QEC),(2)絡み合い分布と測定における並列性を利用したパイプライン化戦略,(3)論理誤差率とクロック速度の観点からの性能評価を行う。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:56:25 GMT)
Effect of slowly decaying long-range interactions on topological qubits [1.1] 量子多体系における長距離相互作用に対する基底状態縮退の堅牢性について検討する。
分割$$は、拡張指数$sim exp(-C Lfrac1+2)$のようなスケールで、$L$はシステムサイズである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:23:25 GMT)
ESACT: An End-to-End Sparse Accelerator for Compute-Intensive Transformers via Local Similarity [1.1] 本稿では,計算集約型変換器のためのエンドツーエンドスパースアクセラレータESACTを提案する。
以上の結果から,SPLSは全体の計算量を52.03%削減し,精度を1%以下に抑えることができた。
ESACTは3.29TOPS/Wの終端エネルギー効率を達成し、SOTAの注意加速器であるSpAttenとSangerの2.95倍と2.26倍の注意レベルエネルギー効率を向上させる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:28:17 GMT)
Polar Perspectives: Evaluating 2-D LiDAR Projections for Robust Place Recognition with Visual Foundation Models [1.1] 本研究は、LiDAR-to-imageプロジェクションがメートル法位置認識にどのように影響するかを体系的に調査する。
バックボーン,アグリゲーション,評価プロトコルを制御するモジュール型検索パイプラインを導入する。
我々は、差別力、環境変動に対する堅牢性、リアルタイム自律性に最も強く寄与する予測特性を同定する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:04:17 GMT)
Breast Cell Segmentation Under Extreme Data Constraints: Quantum Enhancement Meets Adaptive Loss Stabilization [1.0] 我々のフレームワークは95.5%+/-0.3%のDiceスコアと91.2%+/-0.4%のIoUを599のトレーニング画像で達成している。
限られたアノテーションでパフォーマンスを飛躍的に向上させることで、データセット作成に必要な医療専門家の時間を大幅に短縮する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 00:45:21 GMT)
Exploring Depth Generalization in Large Language Models for Solving Recursive Logic Tasks [1.0] トランスフォーマーアーキテクチャは、トレーニング中に遭遇するよりも深い再帰を伴う問題に苦しむことを示す。
この制限はスタックのような振舞いを維持することができないことに起因する。
我々は,問題を管理可能なサブコンポーネントに分解するループ式位置交換パイプラインを開発した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:04:51 GMT)
ACM COMPUTE 2025 Best Practices Track Proceedings [1.0] The Best Practices Track of ComputerUTE 2025は、全国のコンピュータサイエンス教育者を招いて、ベストプラクティスに関する体験レポートを提出した。
これらの手続きには、会議のプレゼンテーションのためにこれらの提出書類から選ばれた論文と、これらが提示された2つのベストプラクティスセッションからのレポート(編集者によって書かれた)が含まれている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:35:10 GMT)
AttMetNet: Attention-Enhanced Deep Neural Network for Methane Plume Detection in Sentinel-2 Satellite Imagery [1.0] メタンは温室効果ガスであり、地球温暖化に大きく貢献する。
AttMetNetは,Sentinel-2衛星画像を用いたメタンプラム検出のための,注目度の高い新しい深層学習フレームワークである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:34:39 GMT)
Mean-Field Limits for Two-Layer Neural Networks Trained with Consensus-Based Optimization [1.0] 2層ニューラルネットワークトレーニングのためのコンセンサス最適化(CBO)について検討する。
我々は2つのテストケースでCBOとAdamを比較し、CBOとAdamを組み合わせたハイブリッドアプローチがCBOよりも早く収束することを示した。
マルチタスク学習の文脈では、CBOをメモリオーバーヘッドの少ない定式化に再キャストする。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:41:15 GMT)
Estimating Local Observables via Cluster-Level Light-Cone Decomposition [1.0] 本稿では,量子ワークロードの自然な局所性を活用したクラスタレベルの光コーン分析に基づくフレームワークを提案する。
本稿では,光円錐の幾何学的解離を利用してサンプリング効率を向上する因数分解アルゴリズムと,ハードウェア要件を最小化するために代数展開を利用する代数分解アルゴリズムの2つの補完アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:35:44 GMT)
An Empirical Survey of Model Merging Algorithms for Social Bias Mitigation [0.9] 大規模言語モデル(LLM)は、学習前のコーパスに存在する社会的バイアスを継承し、増幅することが知られている。
私たちは、Linear、Karcher Mean、SLERP、NuSLERP、TIES、DELLA、Nearswapの7つのアルゴリズムを実験的に調査し、GPT、LLaMA、Qwenファミリーで13のオープンウェイトモデルを適用した。
バイアス低減と下流性能のトレードオフを見出した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:18:48 GMT)
Using physics-inspired Singular Learning Theory to understand grokking & other phase transitions in modern neural networks [0.9] 本研究では,解釈可能性と相転移に関連する玩具設定における特異学習理論(SLT)について検討する。
本稿では、ニューラルネットワークの相転移を理解する上でのSLTの多くのメリットを概説し、この分野にオープンな研究課題を提起する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:04:16 GMT)
Embedding networks with the random walk first return time distribution [0.9] 本研究では,ランダムウォークの第1次回帰時間分布(FRTD)を,解釈可能かつ数学的に基底化されたノード埋め込みとして提案する。
FRTDは固有値スペクトルよりも厳密に情報的であるが,完全なグラフ識別には不十分であることを示す。
FRTDの埋め込みは、ネットワークアライメントタスクにおいて、手動で設計されたグラフメトリクスよりも優れていることを実証的に実証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:27:52 GMT)
Unlocking hidden biomolecular conformational landscapes in diffusion models at inference time [0.8] 本稿では、コンフォメーション分布のサンプリングを強化する推論時間アルゴリズムであるConforMixを提案する。
提案手法は拡散モデルを改良し,共形変数のより効率的な発見を可能にする。
生物学的に重要なタンパク質のケーススタディは、この方法のスケーラビリティ、精度、有用性を示している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:52:05 GMT)
Layout Anything: One Transformer for Universal Room Layout Estimation [0.8] 本論文では,OneFormerのユニバーサルセグメンテーションアーキテクチャを幾何学的構造予測に適用した屋内レイアウト推定のためのトランスフォーマーベースのフレームワークを提案する。
提案手法は,OneFormerのタスク条件付きクエリとコントラスト学習を,(1)トポロジカル・アウェア・トランスフォーメーション(トポロジカル・アウェア・トランスフォーメーション)を通じてマンハッタン世界の制約を保ちながらトレーニングデータを増強するレイアウトデジェネレーション戦略,(2)トレーニング中の一貫性と境界予測を直接実施する幾何学的損失の2つの重要なモジュールと統合する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:28:03 GMT)
Efficient Simulation of the 2D Hubbard Model via Hilbert Space-Filling Curve Mapping [0.8] 格子を空間充填曲線を用いて一次元の鎖に写像する。
ヒルベルト曲線は、固定結合次元の低い基底状態エネルギーを連続的に得られることを示す。
これらの知見は、強く相関した2次元量子系のテンソルネットワーク研究を拡大するための強力なツールとして、空間充填曲線写像を確立した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:44:12 GMT)
Robust Tabular Foundation Models [0.8] 重要な発見は、TFMは完全に合成データセット上で事前訓練可能であることである。
TFM性能と最高の達成可能な性能の差から得られる最適性ギャップ尺度を導入する。
これらの結果は、合成データのみを用いて、ターゲットとなる敵の訓練とTFMの微調整のための有望な新しいデータセットを浮き彫りにした。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:40:39 GMT)
Many-body $k$-local ground states as probes for unitary quantum metrology [0.7] ハイゼンベルクの感度限界を飽和させる多部量子状態は、通常、全体相関器を準備する必要がある。
実験的に実践的なハミルトン人は、ほとんどボディの相関子だけを伴わないことが多い。
k$体置換不変なハミルトン多様体の典型的なランダム基底状態はハイゼンベルクスケーリングを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:56:24 GMT)
GraphMatch: Fusing Language and Graph Representations in a Dynamic Two-Sided Work Marketplace [0.6] GraphMatchは、トレーニング済みの言語モデルとグラフニューラルネットワークを融合した、新たな大規模レコメンデーションフレームワークである。
逆の負のサンプリングとポイント・イン・タイム・サブグラフのトレーニングを併用して、進化するテキストの微細な意味と、グラフの時間に敏感な構造の両方を捉える表現を学習する。
実験では、GraphMatchは言語のみのベースラインとグラフのみのベースラインを、実行時に効率良くパフォーマンスします。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:02:10 GMT)
RFOP: Rethinking Fusion and Orthogonal Projection for Face-Voice Association [0.6] この課題は、評価フェーズで使用される英語とドイツ語の顔声ペアを導入することである。
提案手法は,FAME 2026チャレンジにおいて,英語とドイツ語のデータ分割と第3位で33.1のEERを達成し,良好に機能する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:21:21 GMT)
Defense That Attacks: How Robust Models Become Better Attackers [0.6] 本研究は, 対人訓練が意図せず, 対人訓練の伝達可能性を高めるかどうかを考察する。
逆向きに訓練された(AT)モデルは、標準モデルよりも効果的に伝達される摂動を生成する。
我々は、ロバスト性評価は、移動攻撃に対するモデルの抵抗だけでなく、移動可能な敵の例を生成するための正当性も評価すべきであると主張している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:38:09 GMT)
In Silico Development of Psychometric Scales: Feasibility of Representative Population Data Simulation with LLMs [0.6] 心理測定尺度の開発には、大きなサンプル、複数のテストフェーズ、実質的なリソースが必要である。
大規模言語モデル(LLM)の最近の進歩は、合成参加者データの生成を可能にする。
LLMシミュレーションデータセットが人間の反応の潜伏構造と測定特性を再現できるかどうかを検証した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:26:17 GMT)
CREST: Universal Safety Guardrails Through Cluster-Guided Cross-Lingual Transfer [0.6] CRESTはパラメータ効率のよい多言語安全分類モデルであり、0.5Bパラメータしか持たない100言語をサポートする。
13の高リソース言語の戦略的に選択されたサブセットをトレーニングすることで、クラスタベースのクロスランガルトランスファーを利用する。
このアプローチは、低リソース環境での限られたトレーニングデータの課題に対処する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:41:48 GMT)
Tissue-mask supported inter-subject whole-body image registration in the UK Biobank - A method benchmarking study [0.6] UK Biobankは、全身MRI画像と非画像健康データを収集する大規模な研究である。
本研究では, 皮下脂肪組織と筋マスクを用いた性別層間MR画像登録手法を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:30:59 GMT)
Tempering the Bayes Filter towards Improved Model-Based Estimation [0.6] 我々はベイズフィルタを開発し,推定性能を向上する。
テンパリング空間の領域はベイズフィルタとMAPフィルタの補間と解釈できる。
結果を線型ガウスの場合に特化して、テンパー付きカルマンフィルタを得る。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:31:10 GMT)
Look, Recite, Then Answer: Enhancing VLM Performance via Self-Generated Knowledge Hints [0.5] 「Look, Recite, Then Answer」は、視覚言語モデルを強化するパラメータ効率のよいフレームワークである。
AgroBenchでは,Qwen2-VL-72Bでの雑草同定精度を23.52%向上し,検索オーバーヘッドを伴わずにGPT-4oを上回った。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:21:07 GMT)
In Situ Quantum Analog Pulse Characterization via Structured Signal Processing [0.5] 本稿では、量子信号処理フレームワークを拡張してパルス軌跡のその場学習のための特徴付けアルゴリズムを提案する。
QSPと論理レベルのアナログデジタルマッピングのパラダイムを組み合わせることで、時間順プロパゲータのクエリから直接スムーズなパルスを再構成する。
提案手法は,SPAMに対する高い効率と頑健性,および誤差の非偏極化によって高い精度を達成することを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:44:46 GMT)
Adaptive Weighted LSSVM for Multi-View Classification [0.5] AW-LSSVMは、反復的なグローバルカップリングによる補完的な学習を促進し、各ビューが以前のイテレーションからの他人のハードサンプルに集中できるようにします。
実験では、AW-LSSVMは既存のカーネルベースのマルチビューメソッドよりも多くのデータセットで優れています。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:14:47 GMT)
A Concise Review of Hallucinations in LLMs and their Mitigation [0.5] 幻覚は伝統的な言語モデルに挑戦します
現代に起こる様々な幻覚、その起源、そしてそれらを減らす方法を理解することが重要である。
この文書は幻覚の一般的な理解とそれらを緩和する方法の1ストップ資料として機能する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:44:17 GMT)
Identifying attributions of causality in political text [0.5] 説明は人々が政治世界を理解するための基本的な要素である。
政治文での説明を検知・解析するための枠組みを導入する。
因果的説明がいかに大規模に研究できるかを実証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 20:37:07 GMT)
RapunSL: Untangling Quantum Computing with Separation, Linear Combination and Mixing [0.5] 量子分離論理(QSL)は、量子プログラムの導出的推論のスケーラビリティを向上させる効果的なツールとして提案されている。
本稿では,量子領域に固有の局所性の概念を2つ同定する。
我々は、重ね合わせ状態についての推論を純粋状態についての推論に還元することができる新しい量子分離論理、RapunSLを構築した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:20:09 GMT)
Escaping the Verifier: Learning to Reason via Demonstrations [0.5] RAROは、逆強化学習(Inverse Reinforcement Learning)を通じて、専門家によるデモンストレーションのみから、強力な推論能力を学ぶ。
本手法は,政策(ジェネレータ)と相対論的批判(差別者)の対立的相互作用を設定する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 23:50:30 GMT)
Cybersecurity AI: The World's Top AI Agent for Security Capture-the-Flag (CTF) [0.3] 2025年、サイバーセキュリティAI(CAI)は、世界で最も名高いハッキング競技を組織的に征服した。
本稿では,2025 CTF回路におけるAI能力の包括的証拠を示す。
セキュリティコミュニティは、Jeopardyスタイルのコンテストからアタック・アンド・ディフェンスのフォーマットに緊急に移行する必要がある、と論じている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:15:44 GMT)
Morphling: Fast, Fused, and Flexible GNN Training at Scale [0.3] このギャップを埋めるために設計されたドメイン固有のコードシンセサイザーであるMorphlingを紹介します。
Morphlingは、高レベルのGNNをOpenMP、MPI、MPI MPIをターゲットにしたポータブルなバックエンド対応実装にコンパイルする。
様々なグラフ構造,特徴次元,空間的レギュレーションにまたがる11個の実世界のデータセット上でMorphlingを評価する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:50:09 GMT)
Chiplet technology for large-scale trapped-ion quantum processors [0.3] トラップされたイオンは、大規模量子情報プロセッサを実現する上で最も有望なプラットフォームである。
現在の進歩は、多数のイオン量子ビットへのスケーリングを可能にするために、光学部品と電子部品をマイクロファブリックイオントラップに統合することに焦点を当てている。
本稿では,チップレットと呼ばれるプロセッサモジュールが特定の機能を持ち,個別に製造されるモジュール方式を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:01:04 GMT)
The Necessity of Imperfection:Reversing Model Collapse via Simulating Cognitive Boundedness [0.3] 本稿では,データの表面特性を模倣する代わりに,人間のテキストを生成する認知過程をシミュレートするパラダイムシフトを提案する。
本稿では、非構造化テキストを構造化認知ベクトルにリバースエンジニアリングするPrompt-driven Cognitive Computing Framework(PMCSF)を紹介する。
表面データのコピーではなく、人間の認知的限界をモデル化することで、真の機能的ゲインを持つ合成データが実現できることが、我々の研究で示されています。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:11:00 GMT)
ProteinPNet: Prototypical Part Networks for Concept Learning in Spatial Proteomics [0.3] 本稿では,空間データからTMEモチーフを検出する部分ネットワークに基づく新しいフレームワークであるProteinPNetを提案する。
ProteinPNetは、教師付きトレーニングを通じて、差別的で解釈可能な、忠実な空間プロトタイプを直接学習する。
この結果は,TME内の解釈可能なバイオマーカーを明らかにするためのプロトタイプベースの学習の可能性を強調し,オミクスの機械的発見に寄与する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:00:03 GMT)
Medication counseling with large language models: balancing flexibility and rigidity [0.2] 大規模言語モデル(LLM)は、ソフトウェアエージェントの機能を大幅に強化した。
医薬カウンセリングを目的としたプロトタイプシステムを提案する。
我々は,会話の要求を満たすこと,幻覚を減らし,高品質な応答を促進することを目的とした手法に着目する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:50:03 GMT)
The future of AI in critical mineral exploration [0.2] 認知バイアスと偽陽性を減らし探索コストを下げることを目的とした鉱物探査のための厳密な科学的手法の実現者としてAIが実装されるこの問題に対する解決策を提案する。
データの取得は、人間が生成した仮説を改ざんするための手段として、まず最初に見なされる。次に取得するデータの決定は、検証可能なメトリクスで定量化され、合理的な意思決定に基づいて行われる。
もっとも重要なのは、ドメインの専門家と協力してデータをよりよく理解し、競合する複数の地質仮説を生成できる新しい教師なし学習手法と、様々な地質学的地球化学的および掘削データ取得を最適に計画できる2つの人間内ループAIアルゴリズムである、と私は主張する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:37:48 GMT)
Entanglement evolution from entangled multipodal states [0.1] 絡み合った反ポッド対状態(英: entangled antipodal pair state)、またはクロスキャップ状態(英: crosscap state)は、反ポッド部位のスピンをベル対で生成する単純な2つの部位積状態である。
我々はこれらの状態の一般化について研究し、そこでは変異原虫の状態が絡み合っている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:55:03 GMT)
Temporal Graph Neural Networks for Early Anomaly Detection and Performance Prediction via PV System Monitoring Data [0.1] 提案モデルでは,光,モジュール,環境温度などの重要なPVシステムパラメータ間のグラフベースの時間的関係を利用して電力出力を予測する。
この研究は、リヨン(フランス)の屋上にある屋外施設から収集されたデータに基づいており、PVモジュールからの電力測定や気象パラメーターも含んでいる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:16:14 GMT)
The Pound-Drever-Hall Method for Superconducting-Qubit Readout [0.1] マルチトン自己位相参照ポウンド・ドレーバー・ハル法(PDH)を用いた超安定超伝導量子ビット読み出し法を提案する。
PDH側バンドのトーンはトランスモン量子ビットの不要な測定誘起状態遷移を起こさないことが示され、従来のヘテロダイン読み出しよりも14ドルdB以上の信号が増強される可能性が示唆された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:00:01 GMT)
What Signals Really Matter for Misinformation Tasks? Evaluating Fake-News Detection and Virality Prediction under Real-World Constraints [0.1] 本稿では,偽ニュース検出とバイラル性予測という,オンライン誤報に関する2つの実践的課題について検討する。
テキストコンテンツだけでは偽ニュース検出の強力な差別化要因であることを示す。
本稿では,現場に現実的に影響を及ぼす評価設計や報告制約の影響について論じる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:24:16 GMT)
PrunedCaps: A Case For Primary Capsules Discrimination [0.1] 本稿では,CapsNetの刈り取られたバージョンが従来のアーキテクチャの9.90倍高速であることを示す。
我々の刈り取られたアーキテクチャは、アーキテクチャの動的ルーティング段階における浮動小数点演算の95.36パーセント以上を節約します。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:31:58 GMT)
When Refusals Fail: Unstable Safety Mechanisms in Long-Context LLM Agents [0.0] 大規模言語モデル(LLM)は、複雑な問題を解決するために、はるかに長いコンテキストウィンドウ上で動作します。
LLMエージェントはコンテキストの長さ,タイプ,配置に敏感であり,タスク性能の予期せぬ変化を示し,有害な要求の実行を拒否する可能性がある。
我々の研究は、より長いコンテキストで動作するエージェントの潜在的な安全性の問題を示し、長いマルチステップタスクにおいてLLMエージェントの安全性を評価するための現在のメトリクスとパラダイムに関する追加の質問を開きます。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:12:02 GMT)
Improved Ising Meson Spectroscopy Simulation on a Noisy Digital Quantum Device [0.0] 2つの異なる誤差耐性回路構築手法を用いて、閉じ込められた励起の分光を改良した。
ハードウェアノイズにもかかわらず,$E_8$対称性のキーシグネチャの同定に成功した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:16:10 GMT)
Wave-Particle Complementarity as the Optimal Limit of Unambiguous Quantum-State Discrimination [0.0] 低利得のZou-Wang-Mandel干渉計では、2つのSPDC結晶のアイドラーモードが非直交の結晶マーカー状態として機能する。
単一光子可視性は最適イヴァノヴィッチ-ディキス-ペレス(IDP)戦略の最小不確定確率と等しいことを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:03:57 GMT)
Unlocking the Power of Boltzmann Machines by Parallelizable Sampler and Efficient Temperature Estimation [0.0] 我々は、SB(simulated bifurcation)と呼ばれる量子インスパイアされた最適化にインスパイアされた新しいボルツマンサンプリングを提案する。
LSBは、学習を妨げ、性能を低下させる出力ボルツマン分布の逆温度を制御することができる。
また,条件付き予測マッチング(CEM)と呼ばれる学習過程中の逆温度を効率的に推定する手法を開発した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 01:40:50 GMT)
Universal nondiffractive topological spin textures in vortex cores of light and sound [0.0] 本研究では,非拡散伝播スピンメロンを横方向か縦方向かに関わらず解析的に示す。
これらの現象は渦コアに固有のものであるが、主張される普遍性は高次トポロジカル電荷に対して崩壊することを示している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:44:22 GMT)
Unifying Sign and Magnitude for Optimizing Deep Vision Networks via ThermoLion [0.0] 現在のパラダイムは、情報チャネルドリフトパラメータに静的な妥協を課している。
我々は「低次元」探索モデルと「低次元」動的アライメントフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:04:52 GMT)
Tunable giant Purcell enhancement of quantum light emitters by means of acoustic graphene plasmons [0.0] 本研究では,アコースティックグラフェンプラズモン(AGP)を用いて,単一光子,絡み合った光子,多極性量子エミッタに対する巨大パーセル拡張を実現する。
我々の結果は、量子通信や量子情報処理に応用した、電気的に調整可能な量子エミッタデバイスに有用である。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:23:27 GMT)
TriLex: A Framework for Multilingual Sentiment Analysis in Low-Resource South African Languages [0.0] 低資源のアフリカ諸言語は、感情分析において不足している。
本研究では,コーパスに基づく抽出,クロスリンガルマッピング,RAGによる語彙改善を統一する3段階検索拡張フレームワークTriLexを提案する。
リッチレキシコンを用いて、2つの著名なアフリカの事前訓練言語モデルの性能を評価する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:16:31 GMT)
TrackNetV5: Residual-Driven Spatio-Temporal Refinement and Motion Direction Decoupling for Fast Object Tracking [0.0] 動作方向デカップリング(MDD)と残留駆動型時空間微細化(R-STR)を紹介する。
MDDは時間動力学を符号付き極性場に分解し、運動の発生と軌道方向の両方を明示的に符号化する。
R-STRは分解時間文脈を用いて補正残差を推定し、効果的にクラッドされたターゲットを復元する。
TrackNetV5 は最新の F1 スコア 0.9859 と精度 0.9733 を達成し、以前のバージョンより大幅に上回っている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:04:30 GMT)
Time-series forecasting with multiphoton quantum states and integrated photonics [0.0] 我々は、再構成可能な線形光集積フォトニック回路によって情報を処理できる量子貯水池計算プロトコルを実装した。
我々は、入力信号が回路の光位相の1つに符号化される様々なシナリオにおいて、時系列予測タスクにマルチフォトンベースの設定を利用する。
本研究では,2光子区別不能な入力状態が,識別可能な入力状態に比べて著しく性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:51:22 GMT)
Theory of single-photon emission from neutral and charged excitons in a polarization-selective cavity [0.0] 半導体量子ドット中の中性または荷電励起子に基づく単一光子源は、フォトニック量子コンピュータやシミュレーターにとって魅力的な資源である。
光の垂直放出を特徴とする光源では、放出された光子の50%は、この方法で必然的に失われる。
非対称な垂直キャビティに埋め込まれた励起子の量子力学を理論的に研究する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:15:08 GMT)
The brain-AI convergence: Predictive and generative world models for general-purpose computation [0.0] 注目に基づくトランスフォーマーを備えたAIシステムの最近の進歩は、新皮質と小脳がどのように多様な機能をもたらすかについての潜在的窓口を提供する。
注意型新皮質と非注意性小脳における共有計算機構を同定した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:03:14 GMT)
The MEVIR Framework: A Virtue-Informed Moral-Epistemic Model of Human Trust Decisions [0.0] 本稿では,Moral-Epistemic VIRtue informed (MEVIR)フレームワークを紹介する。
フレームワークの中心は、存在論的概念 – 真理ベアラー、真理メーカー、オントロジーアンパック – である。
報告は、プロパガンダ、心理的操作、エコーチャンバーがどのようにMEVIRプロセスを利用するかを分析する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 01:11:35 GMT)
The Evolutionary Ecology of Software: Constraints, Innovation, and the AI Disruption [0.0] この章では、ソフトウェアとイノベーションの共生関係に焦点を当て、ソフトウェアの進化生態を調査します。
提案手法はエージェント・ベース・モデリングとケーススタディを統合し,ノベルティ・ジェネレーションと模倣という競合する力の下でソフトウェアがどのように進化するかを探索する。
この生態学的視点は、ソフトウェア進化におけるAI駆動開発ツールの出現する役割について、我々の分析にも影響します。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:29:57 GMT)
Tackling Tuberculosis: A Comparative Dive into Machine Learning for Tuberculosis Detection [0.0] この研究は、4,200個の胸部X線からなるKaggleのデータセットを利用した。
SqueezeNetは32%の損失、89%の精度、98%の精度、80%のリコール、87%のF1スコアを達成した。
ResNet-50モデルは54%の損失、73%の精度、88%の精度、52%のリコール、65%のF1スコアを示した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 03:15:29 GMT)
Systematic construction of ROCN Bell-inequalities [0.0] 我々は対称スパンニング集合に基づく代替的で補完的な自己テスト基準を開発する。
この定式化は、任意の次元で自己テストベルの不等式を設計するための明示的で建設的な経路を提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:34:20 GMT)
Superchannel without Tears: A Generalized Occam's Razor for Quantum Processes [0.0] 量子チャネルは量子理論の操作プリミティブとして機能し、スーパーチャネルはそれらに作用する最も一般的な変換を記述する。
我々は,テンソル・ネットワーク法と一般化オッカムズ・カミソリを組み合わせることで,スーパーチャネルの統一基盤を導入する。
我々の枠組みは、競合するChoiの定式化の接続を確立し、超チャネルに対するKraus, Stinespring, Liouville表現を開発し、実現定理の簡易な導出を提供する。
これらの構造ツールは、量子相関や因果構造を破壊する超チャネルの特徴づけを可能にし、非マルコフ量子力学への体系的な経路を開く。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:33:18 GMT)
Su-Schrieffer-Heeger model driven by sequences of two unitaries: periodic, quasiperiodic and random protocols [0.0] 2つのユニタリ演算子$U_1$と$U$の異なる組み合わせによるSu-Schrieffer-Heegerモデルの駆動効果について検討する。
連帯が周期的に, 準周期的に, ランダムに適用される場合について検討する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:03:30 GMT)
Structured Clifford+T Circuits for Efficient Generation of Quantum Chaos [0.0] 回路の深さやランダム性ではなく、因果接続が、回路をカオスに駆動する重要な特徴であることを示す。
本研究は, カオス的挙動を近似するために, 多対数深度決定回路が十分であることを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:20:50 GMT)
Spatially-Grounded Document Retrieval via Patch-to-Region Relevance Propagation [0.0] ColPaliのような視覚言語モデル(VLM)は、ページを画像として埋め込み、クエリトークンとビジュアルパッチの微妙な類似性を計算することによって、最先端の文書検索を実現する。
我々はこれらのパラダイムを統一するハイブリッドアーキテクチャを提案し、CorPaliのパッチレベルの類似度スコアをOCR抽出領域上の空間関連度フィルタとして使用した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:29:54 GMT)
Separating Constraint Compliance from Semantic Accuracy: A Novel Benchmark for Evaluating Instruction-Following Under Compression [0.0] 大規模言語モデル(LLM)は、即時圧縮の下で劣化した性能を示す。
制約コンプライアンス(CC)と意味精度(SA)を測定するベンチマークであるCompressionDecay Test(CDCT)を導入する。
制約コンプライアンス(97.2%の有病率)における普遍的なU曲線パターンを観察する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:25:48 GMT)
Semigroup action based on skew polynomial evaluation with applications to Cryptography [0.0] 我々は、その値と函数の左スキュー積の概念に基づいて、スキュー環 $mathbbF_q[X;, right]$ overmathbbF_q$ の作用を導入する。
私たちはこの事実を利用して、CanettiとKrawczykモデルでセキュアな公開鍵交換プロトコルを構築します。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:08:50 GMT)
Self-Improving AI Agents through Self-Play [0.0] 本稿では,AAI能力スコアを計算資源$r$でパラメータ化されたフロー$_r$として定式化する。
0$の十分条件は、曲率とステップサイズ効果により、生成と検証の結合ノイズが十分小さくなければならないことを示す。
本稿では,LSP(Language Self-Play),Self-Correction,およびSynthetic Datapingに関する最近の文献を統一するために,この形式を適用した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:13:57 GMT)
Scaling Internal-State Policy-Gradient Methods for POMDPs [0.0] 政策段階的な手法は、部分的に観察可能な環境での行動を学ぶためのメカニズムとして近年注目を集めている。
本稿では,無限水平環境下でのメモリ使用ポリシー学習のための改良アルゴリズムについて述べる。
ノイズの多いロボットナビゲーションやマルチエージェント問題を含む,いくつかの大規模POMDP上でこれらのアルゴリズムを比較した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 20:03:35 GMT)
Scalable Quantum Walk-Based Heuristics for the Minimum Vertex Cover Problem [0.0] 連続時間量子ウォーク(CTQW)に基づく最小頂点被覆(MVC)問題に対する新しい量子アルゴリズムを提案する。
この枠組みでは、グラフ上の量子ウォーカーのコヒーレントな伝播は、その構造特性を状態振幅に符号化する。
我々は,CTQWに基づくアルゴリズムが優れた近似比を一貫して達成し,ネットワークトポロジに関して顕著な堅牢性を示すことを示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:04:57 GMT)
Retrieval-Augmented Memory for Online Learning [0.0] Retrieval-augmented Modelはパラメトリックな予測器を非パラメトリックな記憶と組み合わせるが、コンセプトドリフトを用いたストリーミング教師あり学習ではよく理解されていない。
非定常環境におけるオンライン分類について検討し、検索型オンライン学習用メモリ(RAM-OL)を提案する。
RAM-OLは、隠された表現空間における現在の入力のいくつかの最も近い隣人を検索し、現在の例でモデルを共同で更新する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:13:42 GMT)
Real-Time Multimodal Data Collection Using Smartwatches and Its Visualization in Education [0.0] 本稿では、Fitbit Sense 2スマートウォッチのデータ取得アプリケーションであるWatch-DMLTと、プレゼンテーション中に収集した同期マルチモーダルデータを分析するダッシュボードベースの可視化システムであるViSeDOPSを提案する。
本稿では,65名の生徒と16名のスマートウォッチを対象とする教室で,心拍,運動,視線,ビデオ,コンテキストアノテーションなどのデータストリームを収集,分析し,提案システムの有効性と実用性を実証し,より微細でスケーラブルで解釈可能なマルチモーダル・ラーニング・アナリティクスを現実の学習環境で支援する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 11:12:46 GMT)
Qudits offer no advantages over dits for sending random messages [0.0] アリスがボブに帝王切開だけを送ることができれば、古典的なディットを送るのに何の利点もないことを証明している。
また、この結果の混合状態一般化は、単一の測定で混合量子状態を識別する成功確率の上限の形でも証明する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:14:07 GMT)
Quantum hypergraph states: a concise review [0.0] 量子ハイパーグラフ状態は、グラフ状態の一般化として文献に現れ、それ以来、量子情報や計算のために、この真の多部交絡状態のクラスを実装する方向に多くの発展を遂げてきた。
ここでは、離散変数および連続変数量子情報の両方において、ハイパーグラフ状態の定義とその主な応用について概観する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:32:05 GMT)
Quantum LLMs Using Quantum Computing to Analyze and Process Semantic Information [0.0] 本稿では,大規模言語モデルの埋め込みを解析するための量子コンピューティング手法を提案する。
我々は、量子力学原理を用いた複雑な値表現と意味関係のモデル化を利用する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:28:05 GMT)
PyroFocus: A Deep Learning Approach to Real-Time Wildfire Detection in Multispectral Remote Sensing Imagery [0.0] 迅速かつ正確な山火事検出は、緊急対応と環境管理に不可欠である。
空中飛行と宇宙飛行のミッションでは、リアルタイムアルゴリズムは火災、活動的な火災、および発射後の条件を区別しなければならない。
火の分類を行い,火の放射力(FRP)レグレッションやセグメンテーションを施した2段パイプラインであるPyroFocusを導入する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:59:45 GMT)
Pruning AMR: Efficient Visualization of Implicit Neural Representations via Weight Matrix Analysis [0.0] 暗黙の神経表現 (INR) は、関数を近似するニューラルネットワークである。
InRによる幾何学的特徴に適応した解像度のメッシュを構築するアルゴリズムであるPruningAMRを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:49:01 GMT)
Phononic Casimir Effect in Planar Materials [0.0] 3種類の分極を持つ励起は、解決された境界条件から生じる。
得られたスケーリング法則と材料特性および温度依存性は相互作用制御の有効な経路を示唆している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:26:32 GMT)
Phase-Adaptive LLM Framework with Multi-Stage Validation for Construction Robot Task Allocation: A Systematic Benchmark Against Traditional Optimization Algorithms [0.0] 本稿では,LangGraphベースのタスク割り当てエージェント(LTAA)を紹介する。
LTAAは、位相適応型アロケーション戦略、階層型リトライによる多段階検証、効率的なロボット協調のための動的プロンプトを統合している。
LTAAはトークンの使用量を94.6%削減し、割り当て時間を86%短縮する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:23:36 GMT)
Perception of AI-Generated Music - The Role of Composer Identity, Personality Traits, Music Preferences, and Perceived Humanness [0.0] AI生成アートの急速な普及は、観客がそのような作品をどう認識し評価するかという潜在的なバイアスに関する議論を引き起こした。
本研究では,作曲家の情報と聴取者の特性が,AI生成音楽の知覚をいかに形作るかを検討する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:59:10 GMT)
On the Problem of Consistent Anomalies in Zero-Shot Anomaly Detection [0.0] ゼロショット異常分類とセグメンテーション(AC/AS)は、トレーニングデータなしで異常なサンプルや領域を検出することを目的としている。
この論文は、ゼロショットAC/ASの中核的な課題を調査することを目的としており、理論とアルゴリズム設計に根ざした原理的な解決策を提示している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:23:03 GMT)
On the Dynamics of Multiparticle Carroll-Schrdinger Quantum Systems [0.0] 我々は,多粒子キャロル・シュルディンガー量子系の力学を1+1$次元で研究する。
我々は、同値なx$スライス上の$N$-body理論を、相対論的多重時間Klein-Gordonモデルのキャロル極限として導いた。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:08:00 GMT)
Noise-Driven Persona Formation in Reflexive Neural Language Generation [0.0] 本稿では,Luca-Noise Reflex Protocol (LN-RP)について紹介する。
ノイズシードを初期生成状態に注入することにより、152生成サイクルにわたる言語行動の非線形遷移を観察する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:57:59 GMT)
Neighborhood density estimation using space-partitioning based hashing schemes [0.0] この研究は、大規模な単一細胞RNAシークエンシングデータにおいて、まれな細胞サブ集団を迅速に同定する、異常検出のための新しいスケッチベースアルゴリズムであるFiRE/FiRE.1を紹介する。
この論文は、プロジェクションハッシュを使ってストリーミングデータのコンセプトドリフトを検出し、様々なドリフトタイプで高い競争力と精度を示す、高速でリソース効率のよいアンサンブル学習機であるEnhashを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:37:18 GMT)
Multi-node quantum key distribution network using existing underground optical fibre infrastructure [0.0] この研究は、マルチノード量子ネットワークの展開を通じて、キプロスにおける最初の量子通信ネットワークを実証する。
その結果、すべてのノードで一貫したキー生成率を示し、実際の環境での信頼性の高い動作を確認した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:30:12 GMT)
Multi-Agent Reinforcement Learning and Real-Time Decision-Making in Robotic Soccer for Virtual Environments [0.0] 本稿では,これらの課題に対処するMARL(Multi-Agent Reinforcement Learning)フレームワークを提案する。
スケーラビリティを確保するため、平均場理論をHRLフレームワークに統合する。
我々の平均場アクター批判法は性能を著しく向上させる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:11:44 GMT)
Modeling and Inverse Identification of Interfacial Heat Conduction in Finite Layer and Semi-Infinite Substrate Systems via a Physics-Guided Neural Framework [0.0] HeatTransFormerは物理誘導型トランスフォーマーアーキテクチャである。
物理的にインフォメーションされたサンプリング、ラプラスをベースとした拡散解をエミュレートするアクティベーション、マスクレスアテンション機構を統合している。
有限層半無限基板構成に適用すると、界面のコヒーレント温度場が生成される。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:22:57 GMT)
MitUNet: Enhancing Floor Plan Recognition using a Hybrid Mix-Transformer and U-Net Architecture [0.0] 壁分割タスクに特化して設計されたハイブリッドニューラルネットワークアーキテクチャであるMitUNetを紹介する。
MitUNetでは、階層型Mix-Transformerエンコーダを用いて、グローバルコンテキストをキャプチャし、ScSEアテンションブロックで拡張されたU-Netデコーダを用いて正確な境界回復を行う。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:47:53 GMT)
Minimal decomposition entropy and optimal representations of absolutely maximally entangled states [0.0] 多重粒子の絡み合いの有用な尺度は最小分解エントロピーである。
この量は、状態が極大局所化される積基底を特定する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:32:13 GMT)
Membership Inference Attack against Large Language Model-based Recommendation Systems: A New Distillation-based Paradigm [0.0] メンバーシップ推論攻撃(MIA)は、特定のデータサンプルがターゲットモデルのトレーニングデータセットに含まれているかどうかを判断することを目的としている。
本稿では,Large Language Model(LLM)に基づくレコメンデーションシステムに適した知識蒸留に基づくMIAパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:49:55 GMT)
MedPI: Evaluating AI Systems in Medical Patient-facing Interactions [0.0] 患者・クリニック会話における大規模言語モデル(LLM)の評価のための高次元ベンチマークであるMedPIを提案する。
MedPIは、医療プロセス、治療安全性、治療結果、医師と患者とのコミュニケーションを含む105次元の医療対話を評価する。
我々は、Claude Opus 4.1, Claude Sonnet 4, MedGemma, Gemini 2.5 Pro, Llama 3.3 70b Instruct, GPT-5, GPT OSS 120b, o3, Grok-4という9つのフラッグシップモデルを、366人のAI患者と7,097人の会話で評価した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:10:06 GMT)
Many-body symmetry-protected zero boundary modes of synthetic photo-magnonic crystals [0.0] ボゾン多体対称性演算で保護される自由ボソン位相の理論
新しい量子メタマテリアル:光磁気結晶。
光磁気鎖のモデリングは、その実験的実現のための青写真を提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:00:00 GMT)
Magic of the Well: assessing quantum resources of fluid dynamics data [0.0] 本研究では,2次元,周期的,圧縮不能なせん断流れのシミュレーションから生成されたデータセットの量子リソース要求について検討する。
分析の結果,特定の初期条件下では,資源効率と資源集約型レシスタンス間の遷移を,せん断幅が識別できることが判明した。
これらの知見は、スケーラブルで量子にインスパイアされた流体力学のアプローチの開発に有用なガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:23:46 GMT)
Leveraging generative adversarial networks with spatially adaptive denormalization for multivariate stochastic seismic data inversion [0.0] 本研究では,地震データから相の予測と複数の相関した連続特性を示す反復的測地逆解析アルゴリズムSPADE-GANInvを提案する。
SPADE-GANは現実的なジオメトリを再現するように訓練され、シーケンシャルなコシミュレーションは相依存性の連続特性の空間的変動を予測する。
本手法は2次元合成シナリオとフィールドデータの両方で実証され, フルスタック地震データからフェーシ, ポロシティ, 音響インピーダンスの予測を目標としている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:25:22 GMT)
Lectures on Quantum Field Theory on a Quantum Computer [0.0] 講義ノートでは、量子場理論の応用のための量子計算法の基礎を取り上げている。
量子コンピューティングや量子場理論の詳細な知識は想定されていない。
このコースのために書かれたプログラムはGitHubリポジトリで入手できる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:35:17 GMT)
La transformation num{é}rique de la justice : ambitions, r{é}alit{é}s et perspectives [0.0] この研究は、ストラスブール大学のCyberjustice Master's ProgramのM2学生の助けを借りて、4年間の学術的サイクルで実施された。
正義のデジタルトランスフォーメーションの言論と表現を客観的に評価することを目的としている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:40:34 GMT)
Job Satisfaction Through the Lens of Social Media: Rural--Urban Patterns in the U.S [0.0] 我々は,260億のジオレファレンスツイートに微調整された大言語モデルを適用することで構築された,米国の仕事満足度に関する,新たな大規模ソーシャルメディアベースの尺度を分析した。
物流レグレッションは、田園部が都市部よりも雇用満足感が低いことを一貫して報告していることを示しているが、この差は労働市場が厳しい場合に減少する。
都市部と都市部の所得格差の拡大とは対照的に、失業率が低いときに知覚される仕事の質は収束し、労働市場は収入のみでなく、空間的不平等を主観的な労働関係の幸福に導くことを示唆している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:08:27 GMT)
Invasive Context Engineering to Control Large Language Models [0.0] 侵入コンテキストエンジニアリング(Invasive Context Engineering)は、長期の状況に対するトレーニングモデルで発生するデータ不足の落とし穴を回避する。
我々は,この手法をチェミング防止のためにChain-of-Thoughtプロセスに一般化できることを示唆した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:25:55 GMT)
Intrinsic Structure as a Proxy for Saliency: SVD-Based Weight Preservation for Mixed-Precision Quantization in Large Language Models [0.0] ポストトレーニング量子化(PTQ)は、モデル重みの精度を4ビット以下に下げることでこの問題に対処する。
現在の最先端の手法は、塩分量を特定するためにキャリブレーションデータに依存している。
本稿では,データフリーな構造認識仮説を提案する。Singular Value Decomposition (SVD) による主成分として同定された重みは,モデル下流の性能に本質的に重要である。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:26:59 GMT)
Integrative Analysis of Risk Management Methodologies in Data Science Projects [0.0] 本研究の目的は,データサイエンスプロジェクトに適用される主要なリスク管理手法の比較分析を行うことである。
本研究は、データサイエンスに特化したフレームワークと同様に、広く採用されているリスク管理標準ISO 31000、PMBOK Risk Management、NIST RMFについて検討する。
従来のアプローチは新興リスクのカバー範囲が限られているのに対して、現代のモデルでは多次元構造が提案されている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:06:52 GMT)
Information-Theoretic Constraints on Variational Quantum Optimization: Efficiency Transitions and the Dynamical Lie Algebra [0.0] 変分量子アルゴリズムは、短期的な量子優位性の主要な候補であるが、そのスケーラビリティはバレンプラトー現象によって制限される。
アンシラを媒介としたコヒーレントフィードバックを用いて、古典的なランダウアー境界よりも2倍の長所を提供する量子絡み合わせを用いて、作業抽出を相互情報にリンクする経験的関係を実証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:09:18 GMT)
Information dynamics and symmetry breaking in generic monitored $\mathbb{Z}_2$-symmetric open quantum systems [0.0] 一般の$mathbbZ$-symmetric Monitored, open quantum dynamicsの定常位相について検討する。
量子システムによって情報が保持される完全に壊れたフェーズ、環境に情報が漏れる強弱の破壊フェーズ、観測者によって情報が学習される未知のフェーズが見つかる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:54:59 GMT)
Implementation and Analysis of Quantum Majority Rules under Noisy Conditions [0.0] 量子ゲーム理論にインスパイアされた量子投票は、BaoとYunger Halpernの量子多数決則(QMR)を構成する枠組みを提供する。
このQMR構成を古典的プロファイルデータに基づいて解析的に評価し、その最終測定段階を量子回路として実装する。
我々は、この行動の定量化を、勝者獲得率、コンドルチェット・ウィンナーフリップ率、社会的ランキング分布間のジェンセン・シャノンのばらつきを用いて行う。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:25:01 GMT)
Identification of Multivariate Measurement Error Models [0.0] 本稿では,多次元連続計測誤差モデルに対する新しい同定結果について述べる。
第三次交叉モーメントを用いて、クルスカルの定理によって保証されたユニークな分解が、因子の積み込み行列を識別する3方向テンソルを構成する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 17:49:48 GMT)
IACT: A Self-Organizing Recursive Model for General AI Agents: A Technical White Paper on the Architecture Behind kragent.ai [0.0] 対話型エージェントコールツリー(Interactive Agents Call Tree, IACT)は、ユーザ対話によって純粋に駆動される汎用的な自律システムである。
我々は,このモデルをKragent.aiシステムに導入する際のアーキテクチャ,設計原則,実践的な教訓について述べる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:10:56 GMT)
Hybrid(Penalized Regression and MLP) Models for Outcome Prediction in HDLSS Health Data [0.0] NHANESの健康調査データに確立された機械学習技術を適用し,糖尿病の状態を予測した。
私は、XGBoost特徴エンコーダと軽量多層パーセプトロン(MLP)ヘッドを用いたハイブリッドアプローチと、ベースラインモデル(論理回帰、ランダムフォレスト、XGBoost)を比較した。
実験により、ハイブリッドモデルでは、処理されたNHANESサブセットのベースラインと比較して、AUCとバランスの取れた精度が向上した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 07:25:40 GMT)
High-harmonic generation from two weakly coupled molecules: a simple tight-binding model [0.0] 高調波の発生は、標的の性質を探査できる強い非線形効果である。
レーザー偏光依存型高調波収率は、近縁分子と隣り合う分子の弱い結合に敏感である。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:33:19 GMT)
Generating redundantly encoded resource states for photonic quantum computing [0.0] 測定ベースの量子コンピューティングは、大きな絡み合ったクラスター状態の生成に依存している。
単一量子エミッタを用いて冗長に符号化されたフォトニックリソース状態を生成するプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:00:00 GMT)
Functional Random Forest with Adaptive Cost-Sensitive Splitting for Imbalanced Functional Data Classification [0.0] 本稿では,不均衡な機能データ分類のための新しいアンサンブルフレームワークであるFRF-ACS(Adaptive Cost-Sensitive Splitting)を導入する。
不均衡に対処するため,各ノードのクラス重みを局所的に調整する動的コスト感度分割基準を組み込んだ。
合成および実世界のデータセットの実験により、FRF-ACSは少数クラスのリコールと全体的な予測性能を大幅に改善することが示された。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:57:51 GMT)
Fragmentation is Efficiently Learnable by Quantum Neural Networks [0.0] ヒルベルト空間の断片化 (Hilbert space fragmentation) は、量子系のヒルベルト空間を指数的に多くのクリロフ部分空間に動的に分離する現象である。
この変換は、量子ニューラルネットワークを用いたトレーニングデータの集合から勾配降下によって効率的に学習できることを実証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:57:47 GMT)
Forecasting MBTA Transit Dynamics: A Performance Benchmarking of Statistical and Machine Learning Models [0.0] マサチューセッツ湾交通局 (MBTA) はボストンの主要な公共交通機関である。
本稿では,地下鉄におけるゲート駅の入場率の予測手法として,既存手法と独自手法の性能を比較した。
その結果, 天気予報データと比較した場合, 天気予報データの提供は, 天気予報データよりも予測精度に有意な効果があることがわかった。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:15:04 GMT)
Fine-Tuned Large Language Models for Logical Translation: Reducing Hallucinations with Lang2Logic [0.0] この研究は、英語の文を入力し、それらを論理的表現に変換し、それを整合正規形(Conjunctive Normal Form, CNF)に変換する新しい枠組みを導入する。
幻覚を減らすために、自己定義文法、シンボリックライブラリ、微調整言語モデルを備えた古典的NLP技術を採用している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:03:06 GMT)
FGC-Comp: Adaptive Neighbor-Grouped Attribute Completion for Graph-based Anomaly Detection [0.0] FGC-Compは軽量で分類器に依存しない、デプロイに優しい属性補完モジュールである。
各ノードの隣接ノードを3つのラベルベースグループに分割し、ラベル付きグループにグループ固有の変換を適用し、バイナリ分類目的でエンドツーエンドを訓練する。
2つの実世界の不正データセットの実験は、無視可能な計算オーバーヘッドによるアプローチの有効性を検証する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:34:21 GMT)
Experimental Blueprint for Distinguishing Decoherence from Objective Collapse [0.0] ナノスフィアの質量運動の中心に制御可能なシュロディンガー・キャット状態を生成することができる浮遊型オプティメカル・プラットフォームを提案する。
包括的なマスター方程式は、ガス衝突、黒体放射、光子・反動のノイズを包含し、校正された環境ベースラインを確立する。
ベイズ推定プロトコルは、環境騒音から崩壊誘起過剰なデコヒーレンスを識別するために概説される。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:47:41 GMT)
Excitonic Theory of the Ultrafast Optical Response of 2D-Quantum-Confined Semiconductors at Elevated Densities [0.0] 閉じ込められた半導体の超高速光応答に対するエキソニックなアプローチを示す。
この理論は、コヒーレントなエクシトン遷移とビエクシトンが支配するコヒーレントな体制から、エキセントニックな職業が支配する非コヒーレントな体制まで有効である。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:52:48 GMT)
Excess work in counterdiabatic driving [0.0] 本稿では, 反断熱法を用いて閉じた量子系を制御するためのエネルギーコストを, 即時的な余剰作業を用いて評価することを提案する。
反断熱駆動の高速化は、全ハミルトニアンの固有状態間のエネルギーの拡散と関連していることを示す。
余剰作業はこれらの遷移のエネルギー的定量化に利用できるが、余剰作業が反断熱駆動の過程全体を通してゼロであることはよく知られている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 22:24:24 GMT)
Equilibrium SAT based PQC: New aegis against quantum computing [0.0] 本稿では,マルチセットからランダムに抽出したサブセットの要素数をカウントして暗号文を生成する,新しい公開鍵暗号アルゴリズムを提案する。
提案アルゴリズムの利点は、他の公開鍵アルゴリズムよりもはるかに高速であり、第2に、大きな数を必要としないため、任意のデバイス上で実行可能であること、第3に、量子抵抗を維持しながら単一の公開鍵と複数の秘密鍵を使用して、簡単に公開鍵暗号システムに拡張できることである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:05:06 GMT)
Enhancing Job Matching: Occupation, Skill and Qualification Linking with the ESCO and EQF taxonomies [0.0] 本研究では、労働市場情報の分類を改善するための言語モデルの可能性について検討する。
本論文では,文文リンクとエンティティリンクの2つの重要な方法論について検討・比較する。
現在進行中の研究を支援するため、これらの2つの方法論を取り入れたオープンソースツールをリリースする。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:49:43 GMT)
Enhancing Cross Domain SAR Oil Spill Segmentation via Morphological Region Perturbation and Synthetic Label-to-SAR Generation [0.0] SARオイル流出セグメンテーションの深層学習モデルは、海洋状態、後方散乱統計、スリック形態の違いにより、地域間での一般化に失敗することが多い。
地中海からペルーへの移動を改善するための2段階合成拡張フレームワークである textbfMORP-Synth を提案する。
地中海で事前訓練されたモデルは、ペルーの領域で67.8%から51.8%mIoUに低下し、MORP--Synthは+6mIoUに向上し、少数派のIoU(+10.8オイル、+14.6ルックライク)を増強する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 00:13:02 GMT)
Enhancing Automatic Speech Recognition Through Integrated Noise Detection Architecture [0.0] 提案手法は、音声の書き起こしと並行して動作する専用ノイズ識別モジュールを組み込んだものである。
公開音声および環境音声データセットを用いた実験による検証は、転写品質と雑音識別の大幅な改善を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:54:45 GMT)
Dynamic Modulation of Long Range Photon Magnon Coupling [0.0] この研究は、長距離相互作用によって結合されるマグノン-光子系の時間領域ダイナミクスの実験的な証拠を示す。
送電線モードが重く減衰し相互作用を媒介する散逸結合キャビティ-マグノンモードの時間的進化を直接観察する。
提案手法は, 実験装置の物理的変更を必要とせず, 完全抑制を含む解離結合強度をその場で調整することを可能にする。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:14:34 GMT)
Diffusion Model in Latent Space for Medical Image Segmentation Task [0.0] MedSegLatDiffは、変動オートエンコーダ(VAE)と遅延拡散モデルを組み合わせた拡散ベースのフレームワークで、効率的な医用画像分割を行う。
芸術または非常に競争の激しいDiceとIoUのスコアの状態を達成し、同時に多様なセグメンテーション仮説と信頼マップを生成する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 02:55:31 GMT)
Detection of photon-level signals embedded in sunlight with an atomic photodetector [0.0] 最近の研究は、閉じ込められた単一原子が低暗数狭帯域光検出器として機能することを示した。
我々は、この量子ジャンプ光検出器(QJPD)アプローチが、強い日光に埋め込まれた光子レベル信号を検出することも示している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 08:29:07 GMT)
Detection of Mpemba effect through good observables in open quantum systems [0.0] ムペンバ効果(Mpemba effect)は、量子状態の異常な緩和であり、近接した状態よりも速く緩和する。
そのような量子ムペンバ効果を検出するには、その時間進化の間に量子状態の完全な知識が必要である。
これは、複雑な多体系におけるMpemba効果の研究において大きな障害となる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:40:50 GMT)
Contrastive Deep Learning for Variant Detection in Wastewater Genomic Sequencing [0.0] 本稿では,Vector-Quantized Variational Autoencoders (VQ-VAE) を用いた非教師付きウイルス変異検出のための包括的フレームワークを提案する。
VQ-VAEは、参照ゲノムや変異ラベルを必要とせずに、k-merトークン化配列からゲノムパターンの離散コードブックを学習する。
我々のフレームワークは、ゲノム監視のスケーラブルで解釈可能なアプローチと、公衆衛生モニタリングへの直接的な応用を提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:04:05 GMT)
Combinatorial foundations for solvable chaotic local Euclidean quantum circuits in two dimensions [0.0] 我々は、$mathbbZ2$ の任意の有界拡張が測地的に直交可能であることを示す。
これは、正確に解けるカオス局所量子回路を考案できる設定を提供する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 18:54:23 GMT)
Clustering Malware at Scale: A First Full-Benchmark Study [0.0] マルウェアクラスタリングの品質を評価し,BodmasとEmberの2つの大規模公開ベンチマークマルウェアデータセットの最先端性を確立する。
以上の結果から,良性サンプルの導入はクラスタリングの品質を著しく低下させるものではないことが示唆された。
一般的な意見とは対照的に、私たちの上位クラスタリングパフォーマーはK-MeansとBIRCHで、DBSCANとHACは遅れています。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:32:14 GMT)
Classical Thermometry of Quantum Annealers [0.0] 我々は,3桁以上のシステムサイズにまたがるギブスサンプリング忠実度を実験的に定量的に評価した。
実効温度に対する内在的に仮定されるスケーリング法則は、非負の結合非依存オフセットを必要とする。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 19:08:06 GMT)
Can machines perform a qualitative data analysis? Reading the debate with Alan Turing [0.0] 本稿では,定性データ解析におけるLarge Language Models (LLM)の使用を拒絶する文献を考察する。
これは、実証的な証拠と、現在の批判的な議論がなぜ間違った問題に焦点を当てているのかという批判的な考察を通して説明されている。
この論文はアラン・チューリングの独創的な研究に基づいており、チューリングの「計算機械と知性」の重要なアイデアを使って現在の議論を読む。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 09:41:03 GMT)
Boosting Medical Vision-Language Pretraining via Momentum Self-Distillation under Limited Computing Resources [0.0] 医療分野では、詳細なアノテーションを取得することは困難であり、堅牢なビジョンランゲージモデル(VLM)の必要性を強調している。
本稿では, 蒸留と組み合わされたモーメント法を活用し, 計算効率と知識活用の両立に着目する。
提案手法は,ゼロショット分類における最新技術(SOTA)アプローチとの競争性能を向上するとともに,少数ショット適応の大幅な向上を実現している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 05:53:51 GMT)
Beyond Single-Agent Safety: A Taxonomy of Risks in LLM-to-LLM Interactions [0.0] 本稿では,大規模な言語モデルが相互に相互作用する環境に,人間-モデル相互作用用に設計された安全メカニズムがスケールしない理由について検討する。
モデルレベルの安全性からシステムレベルの安全性への概念的移行を提案し,ESRH(Emergent Systemic Risk Horizon)の枠組みを導入する。
i) LLMの相互作用における集団的リスクの理論的考察,(ii)マイクロ,メソ,マクロレベルの障害モードを接続する分類法,および(iii)マルチエージェントシステムに適応的監視を組み込むアーキテクチャであるInstitutionalAIの設計を提案する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 12:06:57 GMT)
Beyond Greenfield: The D3 Framework for AI-Driven Productivity in Brownfield Engineering [0.0] レガシーシステム、不完全なドキュメンテーション、断片化されたアーキテクチャ知識を含むブラウンフィールドのエンジニアリング作業は、大きな言語モデル(LLM)を効果的に活用するためにユニークな課題を提起する。
本稿では、役割分離型プロンプト戦略と、ブラウンフィールドシステムのあいまいさをナビゲートするためのベストプラクティスを組み合わせた、規律付きLLM支援ワークフローであるDiscover-Define-Deliver(D3)フレームワークを紹介する。
回答者は、明確さ、品質、ドキュメント、認知的負荷の改善と、自己見積の生産性の向上を報告した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 10:47:38 GMT)
Bangla Hate Speech Classification with Fine-tuned Transformer Models [0.0] ヘイトスピーチ検出におけるBLP 2025共有タスクのサブタスク1Aとサブタスク1Bについて検討した。
我々は,ロジスティック回帰,ランダムフォレスト,デクエンションツリーをベースライン手法として作成・検討する。
また、ヘイトスピーチ分類のためのDis-tilBERT、BanglaBERT、m-BERT、XLM-RoBERTaなど、ユティライズされたトランスフォーマーベースモデルについても検討した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 14:56:58 GMT)
Associative Memory using Attribute-Specific Neuron Groups-1: Learning between Multiple Cue Balls [0.0] 提案モデルは,Cue Ball と Recall Net を用いた複数画像のメモリとリコールに関する以前の研究に基づいている。
システムを構成する3つのコンポーネントは、色を処理するためのC.CB-RN、形状を処理するためのS.CB-RN、サイズを処理するためのV.CB-RNである。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 01:28:45 GMT)
Assessing the performance of correlation-based multi-fidelity neural emulators [0.0] マルチファイダリティニューラルエミュレータは、限られた高フィダリティデータと豊富な低フィダリティモデルソリューションを統合することで、入出力マッピングを学習するように設計されている。
本研究では,高忠実度データと豊富な低忠実度モデル解を統合することで,入力から出力へのマッピングを学習するためのニューラルネットワークである多忠実度ニューラルネットワークエミュレータの性能について検討する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:31:21 GMT)
Are Detectors Fair to Indian IP-AIGC? A Cross-Generator Study [0.0] インドおよび南アジアにおけるIP-AIGC検出に関する最初の体系的研究について述べる。
商用のWeb-UIジェネレータを用いた2つのIP-AIGCテストセット(HIDF-img-ip-genaiとHIDF-vid-ip-genai)を構築した。
我々は、事前訓練(PT)と微調整(FT)による2つの最先端検出器(AIDEとEffort)の評価を行い、AUC、AP、EER、精度を報告する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 15:03:51 GMT)
Algebraic Obstructions and the Collapse of Elementary Structure in the Kronecker Problem [0.0] マーナハンの基礎研究から87年間、真に3列のケースに対して明確な閉形式の公式は得られていない。
階段-フック係数の明示的な公式を5つ導き、サクセル予想を132個の三列分割で検証する。
連続閉塞と離散積分性の間の張力を利用した証明手法である整数強制法を開発した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 06:36:35 GMT)
Agent-Based Modular Learning for Multimodal Emotion Recognition in Human-Agent Systems [0.0] 本稿では,マルチモーダル感情認識システムの学習のための新しいマルチエージェントフレームワークを提案する。
このアーキテクチャは、新しいモダリティのモジュラー統合を可能にする。
本稿では,概念実証実装によるアプローチの実現可能性を示す。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 21:47:00 GMT)
ASPEN: An Adaptive Spectral Physics-Enabled Network for Ginzburg-Landau Dynamics [0.0] 物理インフォームドニューラルネットワーク(PIN)は、偏微分方程式(PDE)を解くための強力なメッシュフリーパラダイムとして登場した。
彼らは、標準多層パーセプトロン(MLP)アーキテクチャの固有のスペクトルバイアスのため、硬く、マルチスケールで非線形なシステムに苦しむことで知られている。
本稿では、この制限を克服するために設計された新しいアーキテクチャであるAdaptive Spectral-Enabled Network(ASPEN)を紹介する。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 22:58:06 GMT)
A portable LED-based diamond magnetometer for outreach and teaching labs [0.0] 我々は、標準的なグリーンレーザーを高出力LEDに置き換える、小型で低コストなNV中心型ダイヤモンド磁力計を提案する。
この修正により安全性が向上し、コストが低減し、グリーン励起と赤色発光を直接観察することができる。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 04:05:20 GMT)
A Reproducible Framework for Neural Topic Modeling in Focus Group Analysis [0.0] チュニジアの10のフォーカスグループから得られたデータを用いて、BERTopicをグループテキストにフォーカスするための体系的なフレームワークを提案する。
ブートストラップ安定性解析、パフォーマンスメトリクス、LDAベースラインとの比較。
分析の結果,変換器をベースとしたトピックモデリングが,小さな焦点群転写コーパスから解釈可能なテーマを抽出できることが判明した。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 16:48:14 GMT)
A Multi-Agent, Policy-Gradient approach to Network Routing [0.0] OLPOMDPはポリシー段階の強化学習アルゴリズムである。
多くのネットワークモデルの下でネットワークルーティングをシミュレートすることに成功している。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 20:31:01 GMT)
A Framework for Causal Concept-based Model Explanations [0.0] 本研究は、因果概念に基づくポストホック説明可能な人工知能(XAI)の概念的枠組みを提示する。
非解釈可能なモデルに対する説明は、説明されているモデルに忠実であるだけでなく、理解可能であるべきであるという要求に基づいている。
論文参考訳(メタデータ) (Tue, 02 Dec 2025 13:19:53 GMT)