AI Deception: Risks, Dynamics, and Controls [153.7] このプロジェクトは、AI偽装分野の包括的で最新の概要を提供する。
我々は、動物の偽装の研究からシグナル伝達理論に基づく、AI偽装の正式な定義を同定する。
我々は,AI偽装研究の展望を,偽装発生と偽装処理の2つの主要な構成要素からなる偽装サイクルとして整理する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:35:14 GMT)
Multimodal Reinforcement Learning with Agentic Verifier for AI Agents [131.5] Argosは、エージェントタスクの推論モデルをトレーニングするための、原則化されたマルチモーダル報酬エージェントである。
エージェント検証をSFTデータとRLトレーニングの両方で活用することにより、我々のモデルは最先端の結果を得ることができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:42:47 GMT)
Evaluating Generalization Capabilities of LLM-Based Agents in Mixed-Motive Scenarios Using Concordia [100.7] 大規模言語モデル(LLM)エージェントは、社会的相互作用の素晴らしい能力を実証している。
既存の評価手法は、これらの能力がいかに新しい社会的状況に一般化するかを測ることに失敗する。
我々は,NeurIPS 2024 Concordia Contestで,エージェントが相互利得を達成する能力について評価した経験的結果を示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 00:11:05 GMT)
Deep Unfolding: Recent Developments, Theory, and Design Guidelines [99.6] この記事では、最適化アルゴリズムを構造化されたトレーニング可能なMLアーキテクチャに変換するフレームワークであるDeep Unfoldingのチュートリアルスタイルの概要を提供する。
推論と学習のための最適化の基礎を概観し、深層展開のための4つの代表的な設計パラダイムを導入し、その反復的な性質から生じる特有なトレーニングスキームについて議論する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:16:35 GMT)
Data-regularized Reinforcement Learning for Diffusion Models at Scale [99.0] データ正規化拡散強化学習(Data-regularized Diffusion Reinforcement Learning, DDRL)は, フォワードKLの分散を利用して, 政策を非政治データ分布に固定する新しいフレームワークである。
100万時間以上のGPU実験と1万回の二重盲検評価により、DDRLは、RLで見られる報酬ハックを緩和しながら、報酬を大幅に改善することを示した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:45:07 GMT)
PosA-VLA: Enhancing Action Generation via Pose-Conditioned Anchor Attention [92.9] PosA-VLAフレームワークは、ポーズ条件付き監視を通じて視覚的注意を保ち、タスク関連領域に対するモデルの認識を一貫して導く。
本手法は,多様なロボット操作ベンチマークにおいて,正確かつ時間効率のよい動作を実施できることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:14:29 GMT)
Principled RL for Diffusion LLMs Emerges from a Sequence-Level Perspective [85.1] 強化学習(RL)は自己回帰言語モデルに非常に効果的であることが証明されている。
しかし、これらの手法を拡散大言語モデル(dLLM)に適応させることは、根本的な課題を提起する。
本稿では,全シーケンス生成を単一アクションとして扱い,ELBOを抽出可能なシークエンスレベル確率プロキシとして利用する,原則的RLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:05:32 GMT)
Zero-Shot Video Translation and Editing with Frame Spatial-Temporal Correspondence [81.8] フレーム内対応とフレーム間対応を統合し,より堅牢な時空間制約を定式化するFRESCOを提案する。
提案手法は注意誘導を超越して特徴を明示的に最適化し,入力ビデオとの空間的整合性を実現する。
動画翻訳とテキスト誘導ビデオ編集の2つのゼロショットタスクに対してFRESCO適応を検証する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:51:11 GMT)
Optimal Transportation and Alignment Between Gaussian Measures [80.5] 最適なトランスポート(OT)とGromov-Wasserstein(GW)アライメントは、データセットの解釈可能な幾何学的フレームワークを提供する。
これらのフレームワークは計算コストが高いため、大規模アプリケーションは2次コストでガウス分布の閉形式解に依存することが多い。
この研究は、ガウス的、二次的コスト OT と内部積 GW (IGW) のアライメントを包括的に扱い、文学におけるいくつかのギャップを埋めて適用性を広げる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:01:48 GMT)
Unique Lives, Shared World: Learning from Single-Life Videos [77.8] 我々は、視覚的エンコーダを自己監督的に学習するために、1つの人生の中で自然に捉えた複数の視点を活用する。
異なる生活に独立して訓練されたモデルが高度に整合した幾何学的理解を発達させることを示す。
第3に、同一人の1週間から30時間までのトレーニングが、30時間の多様なWebデータのトレーニングに匹敵するパフォーマンスをもたらすことを実証する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:59:57 GMT)
Joint Sensing, Communication, and Computation for Vertical Federated Edge Learning in Edge Perception Network [75.8] 本稿では,統合されたセンサ,通信,および計算可能なエッジ認識ネットワークについて考察する。
複数のエッジデバイスは、無線信号を利用してローカルモデルを更新する環境情報を検知し、エッジサーバは、グローバルモデルトレーニングのためのオーバー・ザ・エア計算によるフィーチャの埋め込みを集約する。
まず、無線センシングノイズの存在下での損失関数の劣化とAirComp中の凝集歪みからISCC対応VFEELの収束挙動を解析する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:20:58 GMT)
RELIC: Interactive Video World Model with Long-Horizon Memory [74.8] 真のインタラクティブな世界モデルは、リアルタイムの長距離ストリーミング、一貫した空間記憶、正確なユーザ制御を必要とする。
この3つの課題を完全に解決する統合フレームワークであるRELICを紹介します。
単一の画像とテキスト記述が与えられた後、RELICは任意のシーンをリアルタイムにメモリを意識した長期探索を可能にする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:29:20 GMT)
CoDA: From Text-to-Image Diffusion Models to Training-Free Dataset Distillation [71.5] コア分散アライメント(Core Distribution Alignment, CoDA)は、市販のテキスト・ツー・イメージモデルのみを使用して効果的な蒸留(DD)を可能にするフレームワークである。
私たちのキーとなるアイデアは、まず、ロバストな密度ベースの発見メカニズムを使用して、ターゲットデータセットの"固有のコア分布"を識別することです。
そうすることで、CoDAは汎用的な生成先行とターゲットセマンティクスのギャップを効果的に埋める。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:45:57 GMT)
What Is The Best 3D Scene Representation for Robotics? From Geometric to Foundation Models [68.4] 現在のSLAMとローカライゼーションシステムは、点雲やボクセルのようなスパース表現に依存している。
NeRF、3DGS、ファンデーションモデルは、ハイレベルなセマンティック機能と言語ベースの先行機能を統合するのに適している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:57:01 GMT)
DynamicVerse: A Physically-Aware Multimodal Framework for 4D World Modeling [68.0] 物理スケールでマルチモーダルな4DワールドモデリングフレームワークであるDynamicVerseを紹介した。
我々は視覚、幾何学、マルチモーダルモデルを用いて、メートルスケールの静的幾何、実世界の動的運動、インスタンスレベルのマスク、そして全体論的キャプションを解釈する。
DynamicVerseは、100K以上のビデオと800K以上の注釈付きマスク、インターネットビデオから10M以上のフレームからなる大規模なデータセットを提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:51:37 GMT)
Learning Steerable Clarification Policies with Collaborative Self-play [67.7] 不明瞭なクエリを処理するために、AIアシスタントは不確実性を管理するためのポリシーが必要である。
我々は,この不確実性を管理するために,自己再生を用いて評価可能な政策を訓練することを提案する。
このことが、提供されたコストに応じて予測可能な振る舞いを変更する、評価可能なポリシーにつながることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:49:54 GMT)
Rethinking Prompt Design for Inference-time Scaling in Text-to-Visual Generation [63.0] Inference-time Scaling のための Prompt Redesign を提案する。これは、拡張された視覚世代に対応するために、推論中にプロンプトを適応的に修正するフレームワークである。
そこで我々は,素早い属性と生成した視覚の微粒化レベルでのアライメントを評価する,新しい検証手法である要素レベルの事実補正を導入する。
テキスト・ツー・イメージ・ベンチマークとテキスト・ツー・ビデオ・ベンチマークによる実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:54:05 GMT)
Stabilizing Reinforcement Learning with LLMs: Formulation and Practices [61.4] 本稿では,REINFORCEなどの政策勾配法において,真のシーケンスレベルの報酬を代用トークンレベルの目的によって最適化できる理由と条件を示す。
この洞察は、RLトレーニングの安定化において、広く採用されているいくつかのテクニックの重要な役割について、原則化された説明を提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:17:19 GMT)
Characterizing Language Use in a Collaborative Situated Game [61.1] 人気のあるPortal 2仮想パズルゲームのコオプモードにおいて,11.5時間の音声対話コーパスを収集する。
我々はプレイヤー言語と行動を分析し、既存のほとんどのchitchatやタスク指向対話コーパスにはめったに現れない多くの言語現象を識別する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:29:53 GMT)
Hierarchical Vision Language Action Model Using Success and Failure Demonstrations [60.8] 階層型視覚-言語-アクションモデルであるVINEを導入し,高レベル推論を低レベル制御から分離する。
システム2は、2Dシーングラフの抽象化を介して、実現可能性誘導木探索を行う。
システム1はエージェントのコアスキルを変更することなく、低レベルのアクションを実行する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:58:38 GMT)
Dual-level Modality Debiasing Learning for Unsupervised Visible-Infrared Person Re-Identification [59.6] 本稿では,モデルと最適化の両レベルでのデバイアス処理を実装したデュアルレベルのモダリティ・デバイアス学習フレームワークを提案する。
ベンチマークデータセットの実験では、DMDLはモダリティ不変の特徴学習とより一般化されたモデルを可能にすることを示した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:43:16 GMT)
HybridWorldSim: A Scalable and Controllable High-fidelity Simulator for Autonomous Driving [59.6] HybridWorldSimは、静的バックグラウンドのためのマルチトラバースニューラルネットワーク再構成と、動的エージェントの生成モデルを統合するハイブリッドシミュレーションフレームワークである。
我々は、様々な都市をまたがる幅広いルートや環境条件をキャプチャーする、新しいマルチトラバースデータセットMIRRORをリリースする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:46:55 GMT)
On GRPO Collapse in Search-R1: The Lazy Likelihood-Displacement Death Spiral [59.1] この障害を引き起こす中核的なメカニズムとしてLazy Likelihood Displacement(LLD)を同定する。
LDDは早期に出現し、自己強化性LDDデススパイラル(LDD Death Spiral)を引き起こす。
本稿では,GRPO のための軽量な確率保存正則化 LLDS を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:41:15 GMT)
Omni-AutoThink: Adaptive Multimodal Reasoning via Reinforcement Learning [58.0] 本稿では,タスクの難易度に応じてモデルの推論深度を動的に調整する適応推論フレームワークを提案する。
本研究の枠組みは,(1)大規模推論データを用いた基本推論能力を備えた適応監視ファインチューニング段階,(2)タスク複雑性と報酬フィードバックに基づく推論行動の最適化を行う適応強化学習段階の2段階からなる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:33:28 GMT)
ZIP-RC: Optimizing Test-Time Compute via Zero-Overhead Joint Reward-Cost Prediction [57.8] ZIP-RCは、モデルに報酬とコストのゼロオーバーヘッド推論時間予測を持たせる適応推論手法である。
ZIP-RCは、同じまたはより低い平均コストで過半数投票よりも最大12%精度が向上する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:00:15 GMT)
Radiance Meshes for Volumetric Reconstruction [56.5] 一定の密度の四面体を持つ放射場を表現する手法である放射メッシュを導入する。
本モデルでは,合成とレイトレーシングの両方を用いて,高精度かつ高速なボリュームレンダリングを行うことができる。
我々のレンダリング手法はボリューム方程式を正確に評価し、標準のコンシューマハードウェア上で高品質でリアルタイムなビューを可能にする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:57:03 GMT)
C3G: Learning Compact 3D Representations with 2K Gaussians [55.0] 近年の手法では3次元ガウススプラッティングを再構成に用い, シーン理解のための2D-to-3D機能昇降ステージが提案されている。
提案するC3Gは,空間的にのみコンパクトな3次元ガウスを推定する新しいフィードフォワードフレームワークである。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:59:05 GMT)
Motion4D: Learning 3D-Consistent Motion and Semantics for 4D Scene Understanding [54.9] 基礎モデルからの2次元先行を統一された4次元ガウススプラッティング表現に統合する新しいフレームワークであるMotion4Dを提案する。
1) 局所的な一貫性を維持するために連続的に動き場と意味体を更新する逐次最適化,2) 長期的コヒーレンスのために全ての属性を共同で洗練するグローバル最適化,である。
提案手法は,ポイントベーストラッキング,ビデオオブジェクトセグメンテーション,新しいビュー合成など,多様なシーン理解タスクにおいて,2次元基礎モデルと既存の3Dベースアプローチの両方に優れる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:32:56 GMT)
UniMo: Unifying 2D Video and 3D Human Motion with an Autoregressive Framework [54.3] 統合された枠組み内での2次元映像と3次元映像の協調モデリングのための自己回帰モデルUniMoを提案する。
本手法は,正確なモーションキャプチャを行いながら,対応する映像と動きを同時に生成することを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:03:18 GMT)
Cognitive Mirrors: Exploring the Diverse Functional Roles of Attention Heads in LLM Reasoning [54.1] 大規模言語モデル(LLM)は、様々なタスクにおいて最先端のパフォーマンスを達成したが、内部メカニズムに関してはほとんど不透明である。
本稿では,注目者の役割と行動を体系的に分析する新しい解釈可能性フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:24:34 GMT)
BlurDM: A Blur Diffusion Model for Image Deblurring [52.3] 画像劣化のためのBlurDM(Blur Diffusion Model)を提案する。
BlurDMは二重拡散フォワードスキームを通じてぼやけた生成過程を暗黙的にモデル化する。
逆生成の過程では、双対なデノイングとデブロアリングの定式化を導出する。
実験により、BlurDMは既存のデブロアリング法を大幅に強化することが示された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:10:44 GMT)
SyncTrack4D: Cross-Video Motion Alignment and Video Synchronization for Multi-Video 4D Gaussian Splatting [50.7] 実世界の非同期ビデオ集合を扱うために, マルチビデオ4Dガウススプラッティング (4DGS) 方式を提案する。
SyncTrack4Dは、4DGSの同時同期と4DGS再構成のためのキューとして動的シーンの高密度な4Dトラック表現を直接活用する。
我々はPanoptic Studio と SyncNeRF Blender に対するアプローチを評価し,0.26 フレーム以下の平均時間誤差でサブフレーム同期精度を示し,高忠実度 4D 再構成は26.3 PSNR スコアに達した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:05:01 GMT)
LoVoRA: Text-guided and Mask-free Video Object Removal and Addition with Learnable Object-aware Localization [49.9] LoVoRAは、マスクのないビデオオブジェクトの削除と追加のための新しいフレームワークである。
提案手法は,画像間翻訳,光フローベースのマスク伝搬,ビデオペインティングを統合し,時間的に一貫した編集を可能にする。
LoVoRAは、推論中に外部制御信号を必要とせずに、エンドツーエンドのビデオ編集を実現する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:50:34 GMT)
A Retrieval-Augmented Generation Approach to Extracting Algorithmic Logic from Neural Networks [48.8] NN-RAGは,大規模で異種なPyTorchを検証済みニューラルネットワークの検索可能なライブラリに変換する検索拡張生成システムである。
19のリポジトリに適用して、パイプラインは1,289の候補ブロックを抽出し、991(73.0%)を検証し、80%以上が構造的にユニークであることを実証した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:28:30 GMT)
Sponsored Questions and How to Auction Them [48.8] 重要な課題は、ユーザの検索クエリが、真の意図を曖昧にしておくことが多いことだ。
従来の検索から会話型AIへの移行は、新しいアプローチを提供する。
我々は、スポンサード提案とフォローする広告を協調的に最適化するためにVCGメカニズムを採用することができることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:06:27 GMT)
Feature-aware Modulation for Learning from Temporal Tabular Data [47.4] 時間分布シフトは、現実世界のデプロイメントにおいて大きな課題となる。
静的モデルは一般化を保証する固定写像を仮定するが、適応モデルは過渡パターンに過度に適合する。
本稿では,時間的文脈における特徴表現を特徴付ける特徴認識型時間変調機構を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:13:12 GMT)
LAMP: Language-Assisted Motion Planning for Controllable Video Generation [46.6] 運動プランナとして大規模言語モデル(LLM)を活用するLAMPを導入し、自然言語記述を動的オブジェクトやカメラのための明示的な3Dトラジェクトリに変換する。
LLMは自然言語から構造化された運動プログラムを生成し、決定論的に3次元軌跡にマッピングされる。
実験では、LAMPの動作制御性とユーザ意図との整合性の向上が、最先端の代替技術と比較して実証されている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:51:13 GMT)
GeoVideo: Introducing Geometric Regularization into Video Generation Model [46.4] フレームごとの深度予測による潜時拡散モデルの拡大により,ビデオ生成に幾何正則化損失を導入する。
本手法は, 外観生成と3次元構造モデリングのギャップを埋めることにより, 構造的コヒーレンス・時間的形状, 整合性, 物理的妥当性が向上する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:11:57 GMT)
OneThinker: All-in-one Reasoning Model for Image and Video [45.8] 多様な視覚的タスクにおける画像と映像の理解を統一するオールインワン推論モデルであるOneThinkerを提案する。
実験によると、OneThinkerは10の基本的な視覚的理解タスクに対して、31のベンチマークで強力なパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:46:41 GMT)
DVPO: Distributional Value Modeling-based Policy Optimization for LLM Post-Training [45.8] 本稿では、条件付きリスク理論と分布値モデリングを組み合わせた新しいRLフレームワークであるDVPOを紹介し、ロバスト性と一般化のバランスを改善する。
DVPOはPPO、GRPO、ロバストなベルマンベースのPPOを常に上回っている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:48:38 GMT)
Colon-X: Advancing Intelligent Colonoscopy from Multimodal Understanding to Clinical Reasoning [45.4] Colon-Xは、大腸内視鏡におけるマルチモーダルインテリジェンス向上を目的としたオープンイニシアチブである。
ColonVQAは、大腸内視鏡のために構築された最も包括的なマルチモーダルデータセットである。
ColonReasonは、マルチエキスパートの議論パイプラインを通じて注釈付けされた推論データセットである。
ColonR1はタスク適応型報酬と勾配安定最適化を取り入れた最初のR1スタイルのモデルである。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:55:07 GMT)
ToG-Bench: Task-Oriented Spatio-Temporal Grounding in Egocentric Videos [44.1] ToG-Benchは、Egoビデオのためのタスク指向固有の時間的ビデオグラウンドティングベンチマークである。
ToG-Benchは、ScanNetからソースされたビデオに基づいて、100の注釈付きクリップと2,704のタスク指向の接地命令で構成されている。
広範囲な実験により、タスク指向STVGの課題と、明示的かつ多目的的なグラウンドリングにおけるパフォーマンスギャップが明らかになる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:54:44 GMT)
SkillFactory: Self-Distillation For Learning Cognitive Behaviors [43.9] 思考の長い連鎖を利用した推論モデルは、その答えの検証、バックトラック、再試行といった様々な認知的スキルを取り入れている。
これまでの研究では、ベース言語モデルがこれらのスキルを示すと、強化学習(RL)を用いてモデルをさらに訓練し、それらを活用できることが示されている。
我々の研究であるSkillFactoryは、RL以前の教師付き微調整段階において、これらのスキルを大まかに学習するための微調整モデルである。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:54:53 GMT)
AutoEnv: Automated Environments for Measuring Cross-Environment Agent Learning [43.4] クロス環境学習は、ほとんど未測定のままである。
我々は、環境を移行、観察、報酬よりも分解可能な分布として扱う自動化フレームワークであるAutoEnvを提案する。
AutoEnvを用いて、358の検証レベルを持つ36の環境のデータセットであるAutoEnv-36を構築し、7つの言語モデルが12-49%の正規化報酬を得る。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:47:10 GMT)
Exploiting Movable Logical Qubits for Lattice Surgery Compilation [43.3] 我々は,論理格子手術CNOTゲートにおいて,移動可能な論理量子ビットをテレポーテーションにより利用することによって,パラダイムシフトを導入する。
数値シミュレーションにより,提案手法は経路回路の深さを大幅に低減できることが示された。
当社のメソッドのオープンソース実装はGitHubで公開されている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:00:04 GMT)
PretrainZero: Reinforcement Active Pretraining [43.0] プレトレーニングコーパス上に構築された強化アクティブラーニングフレームワークであるPretrainZeroを提案する。
PretrainZeroは、事前学習コーパスから合理的かつ情報的コンテンツを積極的に識別する統一的推論ポリシーを学習する。
トレーニング後、事前訓練されたモデルは、下流のRLVRタスクの推論基盤モデルとしても機能する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:51:32 GMT)
Over-the-Air Federated Learning: Rethinking Edge AI Through Signal Processing [42.4] Over-the-Air Federated Learning (AirFL)は、無線信号処理と分散機械学習を緊密に統合する新興パラダイムである。
AirFLは学習プロセスの通信とモデルアグリゲーションを同時に行い、レイテンシ、帯域幅、エネルギー消費を大幅に削減する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:10:15 GMT)
Tunable Automation in Automated Program Verification [42.0] SMTベースの検証ツールは、量子化器のインスタンス化を扱う場合、自動化とパフォーマンスの緊張に直面する。
本稿では,検証コンテキストにおける量化事実の可利用性に対するきめ細かい制御を可能にする機構を提案する。
我々は、Rustベースの検証ツールであるVerusにテクニックを実装し、それを複数のオープンソースで評価しています。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:27:01 GMT)
FireSentry: A Multi-Modal Spatio-temporal Benchmark Dataset for Fine-Grained Wildfire Spread Forecasting [41.8] 本稿では,サブメーター空間とサブ秒時間分解能を特徴とする地域規模のマルチモーダル山火事データセットFireSentryを提案する。
FireSentryは、可視および赤外線のビデオストリーム、その場での環境測定、手動で検証されたファイアマスクを提供する。
FireSentry上に構築され、物理に基づく、データ駆動、生成モデルを含む包括的なベンチマークを構築します。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:02:47 GMT)
DAComp: Benchmarking Data Agents across the Full Data Intelligence Lifecycle [41.6] 実世界のエンタープライズデータインテリジェンスには、ソースを分析可能なテーブルに変換するデータエンジニアリングや、これらのテーブルを意思決定指向の洞察に変換するデータ分析が含まれる。
複雑な機能を反映した210タスクのベンチマークであるDACompを紹介します。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:21:28 GMT)
Beyond Flicker: Detecting Kinematic Inconsistencies for Generalizable Deepfake Video Detection [41.4] ディープフェイク検出を目に見えない操作に一般化することは、依然として重要な課題である。
最近のアプローチでは、手作りの人工物で操作された原始的な顔画像でネットワークを訓練し、より一般化可能な手がかりを抽出する。
微妙な矛盾のあるトレーニングデータを生成する合成ビデオ生成法を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:00:07 GMT)
MVRoom: Controllable 3D Indoor Scene Generation with Multi-View Diffusion Models [40.6] 室内3次元シーンのための制御可能なノベルビュー合成(NVS)パイプラインであるMVRoomを紹介する。
MVRoomは2段階の設計を採用し、3Dレイアウトを多視点整合性を強制するために使用した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 20:33:18 GMT)
MarkTune: Improving the Quality-Detectability Trade-off in Open-Weight LLM Watermarking [40.3] 我々は、ウォーターマーキング言語モデルのための原則付きオンライン微調整フレームワークであるMarkTuneを紹介した。
我々は、MarkTuneがGussMarkの品質検出可能性フロンティアを、推論時ウォーターマーキングのそれに近いものにしていることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:32:19 GMT)
V-ITI: Mitigating Hallucinations in Multimodal Large Language Models via Visual Inference-Time Intervention [39.8] MLLM(Multimodal Large Language Models)は、幻覚に苦しむ多くの視覚言語タスクに優れる。
本稿では,Visual Neglect Detectorを統合した軽量な視覚推論時間介入フレームワークであるV-ITIを提案する。
V-ITIは、一般的なタスク性能を維持しながら、視覚関連幻覚を一貫して緩和する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:03:54 GMT)
Context-Aware Hierarchical Learning: A Two-Step Paradigm towards Safer LLMs [38.3] 大きな言語モデル(LLM)は多様なアプリケーションのための強力なツールとして登場した。
ツール・コンプリート・アタック(TCA)と呼ばれる新しい種類の脆弱性を特定し,提案する。
これらの脆弱性に対処するために、コンテキスト認識階層学習(CAHL)を導入します。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:10:21 GMT)
ReCamDriving: LiDAR-Free Camera-Controlled Novel Trajectory Video Generation [38.2] ReCamDrivingは、ビジョンベースでカメラ制御されたノベル・トラジェクトリー・ビデオ生成フレームワークである。
本稿では,3DGSを用いたクロストラジェクトリデータキュレーション手法を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:55:25 GMT)
Traffic Image Restoration under Adverse Weather via Frequency-Aware Mamba [37.9] 本稿では,周波数対応マンバ(FAMamba)を提案する。このフレームワークは,周波数誘導とシーケンスモデリングを統合し,効率的な画像復元を実現する。
本アーキテクチャは,(1)双方向2次元周波数適応走査による局所的相互作用を強化するDual-Branch Feature extract Block (DFEB) と,(2)ウェーブレットに基づく高周波数残差学習によりテクスチャの詳細を洗練するPreside-Guided Block (PGB) の2つのキーコンポーネントから構成される。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:50:20 GMT)
SimFlow: Simplified and End-to-End Training of Latent Normalizing Flows [37.8] 分散(VAEエンコーダによって予測される)を定数に修正する方法を見つける。
ImageNet $256 256$ 生成タスクでは、我々のモデル SimFlow が gFID スコア 2.15 を取得し、最先端のSTARFlow (gFID 2.40) よりも優れている。
SimFlowは、エンドツーエンドの表現アライメントアライメント(REPA-E)メソッドとシームレスに統合することができ、改良されたgFID 1.91を実現し、NF間の新しい状態を設定する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:59:57 GMT)
Breaking Isolation: A New Perspective on Hypervisor Exploitation via Cross-Domain Attacks [36.8] クロスドメインアタック(Cross-Domain Attacks)は、ゲストメモリの再利用を通じて能力のエスカレーションを可能にする、エクスプロイトテクニックのクラスである。
我々は、ドメイン横断ガジェットを特定し、それらを劣化したポインタとマッチングし、入力をトリガーするシステムを開発し、完全なエクスプロイトチェーンを組み立てる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 20:55:26 GMT)
Decoding Large Language Diffusion Models with Foreseeing Movement [36.3] LLDM(Large Language Diffusion Models)は、自動回帰モデルよりも並列化推論と制御可能な世代を生成するフレキシブルなデコードメカニズムの恩恵を受ける。
しかし、既存の方法は主に、長期的な影響を見越しながら、局所的な影響に焦点を当てている。
本稿では,FDM(Foreseeing Decoding Method)を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:39:41 GMT)
Heatmap Pooling Network for Action Recognition from RGB Videos [35.5] RGBビデオから深い特徴を抽出する既存の方法は、情報冗長性、ノイズへの感受性、高ストレージコストといった課題に直面している。
本稿では,映像からの行動認識のための新しいヒートマッププーリングネットワーク(HP-Net)を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:36:59 GMT)
CloseUpAvatar: High-Fidelity Animatable Full-Body Avatars with Mixture of Multi-Scale Textures [35.4] CloseUpAvatarはアバターを2組の学習可能なテクスチャの集合として表現し、低周波と高周波のディテールを表現している。
CloseUpAvatarは、カメラ距離に基づいてレンダリング品質を調整し、より広い範囲のカメラオリエンテーションにわたってリアルなレンダリングを保証する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:25:01 GMT)
Reconstructing KV Caches with Cross-layer Fusion For Enhanced Transformers [35.3] 層間KVキャッシュの共有は、KVキャッシュのボトルネックを軽減するための経路を提供するが、通常、GQAのような層内メソッドでは性能が劣る。
最上層KVキャッシュは,最下層と中層からの最も情報性の高いキャッシュの融合であるFusedKVを提案する。
FusedKVと比較すると、FusedKV-Liteは難易度をわずかに増加させるコストでI/Oオーバーヘッドを低減する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:22:00 GMT)
MemVerse: Multimodal Memory for Lifelong Learning Agents [35.2] 我々は,モデルに依存しないプラグアンドプレイメモリフレームワークであるMemVerseを紹介した。
MemVerseは階層的検索ベースのメモリで高速パラメトリックリコールを行う。
スケーラブルで適応的なマルチモーダルインテリジェンスを実現する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:06:14 GMT)
CuES: A Curiosity-driven and Environment-grounded Synthesis Framework for Agentic RL [35.1] 大規模言語モデルベースのエージェントは、複雑なツール拡張環境にますますデプロイされている。
既存のアプローチは通常、新しい環境で失敗する前提である事前定義されたタスクコレクションを仮定する。
そこで我々はCuESを提案する。CuESはキュリオシティ駆動環境基盤合成フレームワークで、多様で実行可能で有意義なタスクを自律的に生成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:53:18 GMT)
CookAnything: A Framework for Flexible and Consistent Multi-Step Recipe Image Generation [35.0] CookAnythingは任意の長さの調理命令から一貫性のあるセマンティックな画像シーケンスを生成するフレームワークである。
複雑な多段階命令のスケーラブルで高品質なビジュアル合成をサポートし、教育メディアや手続き的コンテンツ作成における幅広い応用に有意義な可能性を秘めている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:01:48 GMT)
PSA: Pyramid Sparse Attention for Efficient Video Understanding and Generation [34.9] 本稿では,映像理解と生成の両方に応用可能な汎用モジュールであるPraamid Sparse Attention (PSA)を提案する。
バイナリマスクの代わりに、PSAはマルチレベルプールされたKV表現を導入し、より微細なマスクの粒度を実現した。
この設計は、コンピュータビジョンにおける固定点量子化や古典的特徴ピラミッドネットワークに似ているが、計算効率を低く保ちながら、情報損失を効果的に軽減する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:02:11 GMT)
Think Before You Drive: World Model-Inspired Multimodal Grounding for Autonomous Vehicles [34.7] ThinkDeeperは、決定を下す前に将来の空間状態を説明するフレームワークである。
Talk2Carのリーダーボードで1位にランクインし、DrivePilot、MoCAD、RefCOCO/+/gベンチマークで最先端のベースラインを上回っている。
さらに、ADにおけるマルチソースVGデータセットであるDrivePilotを紹介し、Retrieval-Augmented Generation (RAG)とChain-of-Thoughtパイプラインによって生成されるセマンティックアノテーションを特徴とする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:14:16 GMT)
Beyond the Ground Truth: Enhanced Supervision for Image Restoration [34.1] 本稿では,現実の修復のための高品質な監視を実現するために,既存の真実画像を強化する新しい枠組みを提案する。
本フレームワークは,適応周波数マスクを組み込んだ超解像を用いて,知覚的に強化された地中真理画像を生成する。
改良された基底真理画像は、既存の復元モデルとシームレスに統合可能な軽量出力改善ネットワークのトレーニングに使用される。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:30:32 GMT)
ViDiC: Video Difference Captioning [33.8] 本稿では,ViDiCタスクとその対応するViDiC-1Kデータセットを紹介する。
ViDiC-1Kは、4000以上の比較チェックリストアイテムが注釈付けされた1,000のキュレートされたビデオペアで構成されている。
19種類の代表的マルチモーダルモデルに対する実験では、比較記述と差分知覚能力に顕著な性能差が示された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:23:24 GMT)
High-Sensitivity NV Ensemble Imaging via AOD-Based Raster Scanning and Photodetection [33.7] 本研究では,高分解能で磁場を検出できるダイヤモンド中の窒素空孔中心のアンサンブルに基づく手法を提案する。
半ミリ秒以下の時間分解能を有する準秒媒体において、マイクロ電極から時間変化磁界を撮像する。
このアプローチはフレキシブルな空間サンプリングを可能にし、我々のダイヤモンド nT$cdot$Hz$-1/2$ per pixel sensitivity で達成し、生物学的およびその他の複雑系の弱い動的磁場を検出するのに適している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:30:25 GMT)
A Preliminary Study on the Promises and Challenges of Native Top-$k$ Sparse Attention [33.0] 本報告では,Top-k$アテンション機構の有効性と理論的メカニズムについて予備検討する。
実験によると、Top-k$ Decodingはダウンストリームタスクに匹敵する、あるいは超えるパフォーマンスを実現している。
正確なTop-k$Atentionの計算複雑性を考慮すると、Top-k$アルゴリズムの精度が下流タスクに与える影響について検討する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:44:02 GMT)
Optical Context Compression Is Just (Bad) Autoencoding [32.6] DeepSeek-OCRは、レンダリングされたテキストは少数の視覚トークンから高い忠実度で再構成できることを示した。
我々は、視覚ベースの圧縮が圧縮された表現からテキストを復元する際、ユニークな利点をもたらすという2つの仮定を暗黙的に検証し、DeepSeek-OCRの再構成結果は、視覚ベースの圧縮が言語モデリングに有用であることを示すものである。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:27:27 GMT)
Generative AI Practices, Literacy, and Divides: An Empirical Analysis in the Italian Context [32.5] 本研究は、イタリアにおけるGenAI導入、利用パターン、リテラシーに関する総合的な実証的マッピングを初めて提示する。
以上の結果から,情緒的サポートや医療アドバイスなどの敏感なタスクを含む,仕事と個人利用の両方に広く採用されていることが明らかとなった。
女性の半分がGenAIを採用する可能性があり、男性よりも使用頻度が低い、有意義な男女格差を特定した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:01:28 GMT)
A Diffusion Model Framework for Maximum Entropy Reinforcement Learning [32.3] 拡散力学を原理的に組み込んだ MaxEntRL の置換対象を修正した。
DiffSAC, DiffPPO, DiffWPO は, SAC や PPO よりも良いリターンと高いサンプル効率を実現する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 00:55:54 GMT)
EnCompass: Enhancing Agent Programming with Search Over Program Execution Paths [30.7] エージェントプログラミングに対する現在のアプローチは、しばしばエージェント設計の2つの側面、すなわちコアワークフローロジックと推論時戦略を絡み合わせる。
この2つの懸念を解消するプログラミングモデルである「確率的天使的非決定主義(PAN)」を導入する。
本稿では,このフレームワークがエージェントの信頼性を向上し,異なる推論時間戦略を簡単に切り替えることを可能にすることを示す3つのケーススタディを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:50:16 GMT)
UniLight: A Unified Representation for Lighting [30.2] 照明表現としての連立潜在空間UniLightを提案する。
私たちの表現は、一貫性があり、転送可能な照明の特徴を捉え、モジュール間のフレキシブルな操作を可能にします。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:16:53 GMT)
Diagonalizing the Softmax: Hadamard Initialization for Tractable Cross-Entropy Dynamics [29.9] クロスエントロピー(CE)損失はディープラーニングを支配しているが、既存の理論はしばしば単純化に依存している。
標準的なニューラルネットワークベクトルを持つ標準ネットワークの詳細な特徴付けを行う。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:45:09 GMT)
PosterCopilot: Toward Layout Reasoning and Controllable Editing for Professional Graphic Design [29.3] PosterCopilotは、プロのグラフィックデザインのためのレイアウト推論と制御可能な編集を進化させるフレームワークである。
レイアウト設計の幾何学的理解と審美的推論にLMMを取り入れた,段階的な3段階学習戦略を導入する。
学習したLMMベース設計モデルと生成モデルとを結合した完全なワークフローを構築し,階層制御可能な反復的編集による精密な要素修正を実現する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:59:37 GMT)
HBFormer: A Hybrid-Bridge Transformer for Microtumor and Miniature Organ Segmentation [28.7] HBFormerは医療画像セグメンテーションのための新しいハイブリッドブリッジトランスフォーマーアーキテクチャである。
中心となるイノベーションは、マルチスケールの機能統合のための洗練されたネクサスである'Bridge'メカニズムにある。
挑戦的な医療画像セグメンテーションデータセットの実験は、HBFormerの優れた能力を実証している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:30:39 GMT)
Clinical-R1: Empowering Large Language Models for Faithful and Comprehensive Reasoning with Clinical Objective Relative Policy Optimization [28.6] 本稿では,拡張性,多目的性,検証可能な強化学習手法CRPOを紹介する。
CRPOは、人間のアノテーションに頼ることなく、正確さ、忠実さ、包括性を共同で最適化するルールベースおよび検証可能な報酬信号を統合する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:24:00 GMT)
Learning to Comparison-Shop [28.2] Airbnbのようなオンラインマーケットプレースでは、ユーザーは購入決定を行う前に比較ショッピングを頻繁に行う。
従来のランキングモデルは、検索結果ページ上の複数の項目を比較するコンテキストを無視して、アイテムを独立して評価することが多い。
本稿では,利用者のショッピング行動の比較をモデル化し,学習する新しいランキングアーキテクチャ,LTCS(Learning-to-Comparison-Shop)システムを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:46:18 GMT)
Efficient Public Verification of Private ML via Regularization [28.2] 差分プライバシ(DP)を使用したトレーニングは、リリースされたモデルのユーザによって識別できないデータセットのメンバに保証を提供する。
DPの検証に必要な計算量は、モデルのトレーニングに必要な計算量とともに、現在のアルゴリズムの保証がスケールする。
我々は、一連の規則化された目的をプライベートに最小化し、標準のDP構成を限定して、厳密なプライバシー利用トレードオフを得ることができることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:46:16 GMT)
"MCP Does Not Stand for Misuse Cryptography Protocol": Uncovering Cryptographic Misuse in Model Context Protocol at Scale [27.9] Model Context Protocol (MCP) がツール統合のインターフェースとして登場している。
MCPは、開発者が暗号化自体を実装せざるを得ない、真正性や機密性の保証は提供しない。
MCP実装における暗号誤用を検出するための最初のドメイン固有フレームワークであるYSCOPEを提示する。
我々の研究は、MPPにおける暗号誤用に関する最初のエコシステム全体的見解を確立し、この急速に成長するプロトコルのセキュリティ基盤を強化するためのツールと洞察を提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:25:59 GMT)
Cache What Lasts: Token Retention for Memory-Bounded KV Cache in LLMs [27.0] 本稿では,軽量保持ゲートを介して各トークンの創出時の本質的な重要性を学習する手法を提案する。
我々は,特に低メモリ環境において,強い信念と学習可能な検索ベースラインを一貫して上回ることを示す。
一部の設定ではフルキャッシュモデルを超えており、選択的な保持が正規化の一形態として機能することを示している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 00:20:35 GMT)
GaussianBlender: Instant Stylization of 3D Gaussians with Disentangled Latent Spaces [26.8] 3Dスタイリングはゲーム開発、仮想現実、デジタルアートの中心である。
既存の2次元画像エディターからのテキスト・ツー・3Dスタイリング手法
我々はテキスト駆動型3Dスタイリングのための先駆的なフィードフォワードフレームワークを導入し、推論時に即座に編集を行う。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:23:07 GMT)
Highly Efficient Test-Time Scaling for T2I Diffusion Models with Text Embedding Perturbation [26.7] テストタイムスケーリング(TTS)は、ランダムサンプリングを増やし、ルールとメトリクスに基づいてサンプルを評価することで、より良い結果を達成することを目的としている。
本研究では,T2I拡散モデルにおけるランダム性の影響を解析し,テキスト埋め込み摂動によるTSのランダム性の新しい形式を探索する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:27:53 GMT)
Stable Signer: Hierarchical Sign Language Generative Model [26.7] 従来の冗長構造を合理化し、タスクの目的を単純化し、最適化し、Stable Signerと呼ばれる新しい手話生成モデルを設計する。
SLPタスクを、テキスト理解のみを含む階層的なエンドツーエンドタスクとして再定義する。
SLP-MoEハンドジェスチャレンダリングエキスパートブロックを通じて手ジェスチャーを生成し、エンドツーエンドで高品質でマルチスタイルの手話ビデオを生成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:33:40 GMT)
GAOT: Generating Articulated Objects Through Text-Guided Diffusion Models [26.7] GAOTはテキストプロンプトから明瞭なオブジェクトを生成するフレームワークである。
ハイパーグラフに基づく学習は、これらの粗い表現を洗練するために使用される。
グラフエッジとして表現された明瞭な物体の関節は、対象部分に基づいて生成される。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:44:17 GMT)
Large Language Models for Limited Noisy Data: A Gravitational Wave Identification Study [26.4] 本研究では、大言語モデル(LLM)が、天文学的なデータ処理において従来のニューラルネットワークよりも優れているかどうかを検討する。
90のLIGOイベントのみを使用して、微調整されたLLMは信号の識別に97.4%の精度を達成している。
同じ戦略は、電波やパルサーの観測のような同様のノイズ特性を持つ他の天文学領域にまで拡張することができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:13:01 GMT)
Large Language Models as Generalist Policies for Network Optimization [26.0] 本稿では,このような汎用的なネットワークポリシーを実現するための,最初の体系的フレームワークであるTraceblazerを紹介する。
本研究は,ジェネラリストネットワークポリシの基盤としてLLMを検証し,ジェネラリスト駆動パラダイムへの第一歩としてTraceblazerを位置づけた。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:41:58 GMT)
Efficient Transferable Optimal Transport via Min-Sliced Transport Plans [25.8] 我々は,min-Sliced Transport Plan (min-STP) フレームワークについて検討し,最適化スライサの転送性について検討した。
最適化されたスライサは、データ分布のわずかな摂動の下に留まり、関連するタスク間の効率的な転送を可能にする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:24:19 GMT)
MindGPT-4ov: An Enhanced MLLM via a Multi-Stage Post-Training Paradigm [25.8] MindGPT-4ovは、データ生産、モデルトレーニング、効率的なデプロイメントにまたがる一般的なポストトレーニングパラダイムである。
複数のベンチマークにまたがって、最先端のパフォーマンスを低コストで達成する。
MindGPT-4ovは垂直ドメインタスクにおいて優れたユーザエクスペリエンスを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:20:15 GMT)
TwinFlow: Realizing One-step Generation on Large Models with Self-adversarial Flows [25.5] 1ステップ生成モデルをトレーニングするフレームワークであるTwinFlowを提案する。
本手法は,テキスト・ツー・イメージタスクにおいて1-NFEで0.83のGenEvalスコアを得る。
提案手法は,GenEval および DPG-Bench ベンチマーク上でのオリジナルの 100-NFE モデルの性能と一致する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:45:46 GMT)
NavMapFusion: Diffusion-based Fusion of Navigation Maps for Online Vectorized HD Map Construction [25.4] ハイデフィニション(HD)マップは、静的道路インフラのこの表現を自律システムに優先して提供しています。
現実の世界は常に変化しているので、そのような地図はオンボードセンサーのデータからオンラインで構築されなければならない。
本研究では,高忠実度センサデータに基づく反復的 denoising condition を実現する拡散型フレームワークである NavMapFusion を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 00:10:47 GMT)
How (Mis)calibrated is Your Federated CLIP and What To Do About It? [25.2] FLがCLIP校正にどう影響するかを考察し,この分散環境での信頼性向上戦略を提案する。
FL のキャリブレーションを自然に改善する簡単な LoRA ベースのアプローチである $textFL2textoRA$ を提案する。
複数のベンチマークの実験では、$textFL2textoRA$が常によく校正されたモデルを生成することが示されている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 22:40:19 GMT)
TempR1: Improving Temporal Understanding of MLLMs via Temporal-Aware Multi-Task Reinforcement Learning [25.0] MLLM(Multimodal Large Language Models)の時間的理解の促進は,映像解析の進歩に不可欠である。
本研究では,MLLMの時間的理解を体系的に強化する時間的マルチタスク強化学習フレームワークであるTempR1を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:57:00 GMT)
MRD: Multi-resolution Retrieval-Detection Fusion for High-Resolution Image Understanding [24.9] 高解像度画像の理解は、マルチモーダル大言語モデル(MLLM)にとって重要な課題である。
本稿では,高分解能画像理解のためのトレーニングフリーフレームワークであるMRDを提案する。
対象オブジェクトのグローバルスケールでの直接位置決めを実現するために,オープン語彙オブジェクト検出(OVD)モデルを導入する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:27:32 GMT)
MUT3R: Motion-aware Updating Transformer for Dynamic 3D Reconstruction [24.5] MUT3Rは,注意由来の動作キューを適用して,推論中の動的コンテンツを抑制する学習自由フレームワークである。
我々はモデルを再訓練したり微調整したりせず、事前訓練されたトランスフォーマーが自身の動きの手がかりを診断し、修正する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:36:53 GMT)
EEA: Exploration-Exploitation Agent for Long Video Understanding [24.5] ロングフォームビデオ理解には、重要でない情報をピンポイントするために、広範囲の視覚データの効率的なナビゲーションが必要である。
ビデオ理解のロングフォーム化への現在のアプローチは、高密度な前処理による計算オーバーヘッドに悩まされるか、どちらかである。
セマンティックガイダンスを通じて探索・探索バランスをアーカイブする新しいビデオエージェントフレームワークであるEEAを紹介する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:48:36 GMT)
CSMapping: Scalable Crowdsourced Semantic Mapping and Topology Inference for Autonomous Driving [23.9] CSMappingは正確なセマンティックマップとトポロジカル道路中心線を生成する。
nuScenes、Argoverse 2、および大規模プロプライエタリデータセットに関する実験は、最先端のセマンティクスとトポロジマッピングのパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:06:18 GMT)
Full-Stack Alignment: Co-Aligning AI and Institutions with Thick Models of Value [23.8] ユーティリティ関数や嗜好順序、構造化されていないテキストといった値を表現するための現在のアプローチは、これらの問題や他の問題に効果的に対処するのに苦労している、と我々は主張する。
我々は価値の厚いモデルを提案する。
これらの構造は、値とノルムの表現方法に似ており、システムは永続的な値と艦隊の好みを区別することができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:11:32 GMT)
Thinking with Programming Vision: Towards a Unified View for Thinking with Images [23.6] 最先端のMLLMでさえ驚くほど不安定であり、単純な向きの変化や自然破壊を伴う画像の性能劣化が顕著であることを示す。
我々は,モデルが任意のイメージ操作を実行するユニバーサルインターフェースとしてコードを生成する,フレキシブルでスケーラブルなコード・アズ・ツール・フレームワークであるCodeVisionを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:44:15 GMT)
\textit{ViRectify}: A Challenging Benchmark for Video Reasoning Correction with Multimodal Large Language Models [23.4] 動的知覚、科学的推論、具体的意思決定領域にまたがる30textitKインスタンスのデータセットを構築した。
textitViRectifyでは、MLLMに対してステップワイドなエラー識別を行い、重要なビデオエビデンスを根拠とした合理性を生成する。
また,視覚的エビデンスに基づく補正手法として,段階的誤り軌道と報酬モデルを組み合わせた軌道証拠駆動補正手法を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:51:41 GMT)
HarnessAgent: Scaling Automatic Fuzzing Harness Construction with Tool-Augmented LLM Pipelines [22.7] HarnessAgentはツール拡張されたエージェントフレームワークで、何百ものOSS-Fuzzターゲットに対して完全に自動化され、スケーラブルなハーネス構築を実現する。
OSS-Fuzzプロジェクトと178のC++プロジェクトから243のターゲット関数に対してHarnessAgentを評価する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:55:09 GMT)
Label-Efficient Hyperspectral Image Classification via Spectral FiLM Modulation of Low-Level Pretrained Diffusion Features [22.5] 本研究では,自然画像上に事前学習した凍結拡散モデルから空間的特徴を利用するラベル効率のフレームワークを提案する。
本結果は,事前学習した拡散モデルが,ドメインに依存しない,ラベル効率のよい表現学習を支援することを示唆している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:23:54 GMT)
UniQL: Unified Quantization and Low-rank Compression for Adaptive Edge LLMs [22.4] 学習後量子化と低ランク圧縮を一体化したUniQLを導入し,エッジLLMのデバイス上でのプルーニングレートについて述べる。
UniQLは、Transformers、State Space Models(SSM)、ハイブリッドモデルの量子化と低ランク圧縮を統合する一般的なフレームワークである。
当社のフレームワークは,シングルパスワークフローにおいて,クラウド上でウェイトソート,微調整,量子化を行うと同時に,デバイス上でのプルーニングレートを最大35%まで向上させる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:33:39 GMT)
Evaluating Long-Context Reasoning in LLM-Based WebAgents [22.3] 本稿では,WebAgentsの長期コンテキスト推論能力を評価するためのベンチマークを紹介する。
コンテクストの長さが増加するにつれて劇的なパフォーマンス劣化が観察され、成功率はベースライン条件では40-50%から長期シナリオでは10%以下に低下する。
我々の詳細なエラー分析では、エージェントがループで立ち往生し、元のタスクの目的の追跡が失われることが主な原因であることが判明した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 22:53:10 GMT)
Multi-Agent Reinforcement Learning with Communication-Constrained Priors [22.1] コミュニケーションは、マルチエージェントシステムにおける協調政策の学習を改善する効果的な手段の1つである。
コミュニケーションを伴う既存のマルチエージェント強化学習は、複雑で動的な現実世界環境に適用するのに苦労する。
本稿では,コミュニケーションメッセージが世界的報酬に与える影響を定量化する,コミュニケーション制約付きマルチエージェント強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:35:07 GMT)
TabletopGen: Instance-Level Interactive 3D Tabletop Scene Generation from Text or Single Image [22.1] TabletopGenは、多様なインスタンスレベルのインタラクティブな3Dテーブルトップシーンを生成する、トレーニング不要で完全に自動化されたフレームワークである。
そこで,TabletopGenは,視覚的忠実度,レイアウト精度,物理的妥当性において,既存の手法をはるかに上回り,最先端の性能を実現していることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:20:36 GMT)
AdaptVision: Efficient Vision-Language Models via Adaptive Visual Acquisition [22.0] AdaptVisionは、粗いアプローチによる適応的な視覚トークン取得を可能にする効率的なVLMパラダイムである。
本稿では,AdaptVisionが最先端のVLM手法よりもはるかに少ない視覚トークンを消費し,優れた性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:43:30 GMT)
BEP: A Binary Error Propagation Algorithm for Binary Neural Networks Training [21.9] バイナリニューラルネットワーク(BNN)は、計算複雑性、メモリフットプリント、エネルギー消費を大幅に削減する。
しかしながら、勾配に基づく最適化によるBNNのトレーニングは、変数の離散的な性質のため、依然として困難である。
本稿では、バックプロパゲーション・チェーン・ルールの原則化された離散的アナログを確立するための最初の学習アルゴリズムであるBEP(Binary Error Propagation)を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:03:55 GMT)
ConvRot: Rotation-Based Plug-and-Play 4-bit Quantization for Diffusion Transformers [21.7] モデルのサイズが大きくなるにつれて、メモリフットプリントの増加と推論のレイテンシは、実用的なデプロイメントにおいて大きな課題となる。
大規模言語モデル(LLMs)における最近の研究は、回転に基づく手法が外周を滑らかにし、4ビットの量子化を可能にすることを示している。
本稿では,正則アダマール変換(RHT)を利用したグループワイド回転に基づく量子化手法であるConvRotを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:02:16 GMT)
Training-Free Policy Violation Detection via Activation-Space Whitening in LLMs [21.6] 本稿では,政策違反検出をアウト・オブ・ディストリビューション検出問題として扱う,トレーニングフリーで効率的な手法を提案する。
ホワイトニング技術にインスパイアされた線形変換を用いて、モデルの隠れたアクティベーションをデコレーションし、平均と単位の分散をゼロに標準化する。
挑戦的な政策ベンチマークでは、既存のガードレールと微調整された推論モデルの両方を超越して、最先端の結果が得られる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:23:39 GMT)
Divide, then Ground: Adapting Frame Selection to Query Types for Long-Form Video Understanding [21.2] そこで本研究では,クエリタイプに基づいた学習自由なフレーム選択フレームワークを提案する。
3つの長いビデオ理解ベンチマークの実験は、DIGが既存のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:36:06 GMT)
Diagnose, Correct, and Learn from Manipulation Failures via Visual Symbols [20.9] 58,126 の Visual Question Answering (VQA) ペアの大規模なコレクションである ViFailback データセットをリリースしています。
データセットに基づいて、故障診断と修正能力を評価するために設計されたベンチマーク11のVQAタスクであるViFailbackBenchを確立する。
我々はViFailback-8B VLMを構築し、ViFailback-Benchの全体的な性能改善を実現した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:27:29 GMT)
SMP: Reusable Score-Matching Motion Priors for Physics-Based Character Control [20.8] 自然主義的行動を生み出すためのエージェントを導く行動は、人生のような仮想キャラクタを作成する上で重要な役割を担っている。
本稿では、事前学習した運動拡散モデルとスコア蒸留サンプリング(SDS)を利用して、再利用可能なタスク非依存動作前処理を生成するスコアマッチング動作優先処理(SMP)を提案する。
本手法は, 再利用可能な, モジュラーな動作前処理により, 最先端の対向的模倣学習手法に匹敵する高品質な動作を生成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:44:54 GMT)
Does Hearing Help Seeing? Investigating Audio-Video Joint Denoising for Video Generation [20.4] 本稿では,事前に訓練したテキスト・トゥ・ビデオ(T2V)とテキスト・トゥ・オーディオ(T2A)モジュールを併用した,パラメータ効率のよいAVFullDiT(Audio-Video Full DiT)アーキテクチャを提案する。
以上の結果から,音声とビデオの関節装飾が同期以上の効果をもたらすという,最初の体系的な証拠が得られた。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:53:53 GMT)
SeeU: Seeing the Unseen World via 4D Dynamics-aware Generation [20.4] 画像とビデオは4D世界の離散2次元投影(3D空間+時間)
本研究では,連続した4Dダイナミックスを学習し,目に見えない視覚コンテンツを生成する新しいアプローチであるSeeUを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:30:45 GMT)
MoReGen: Multi-Agent Motion-Reasoning Engine for Code-based Text-to-Video Synthesis [20.3] ニュートンの運動制御によるテキスト・ビデオ生成と評価について検討し,身体的精度と動きのコヒーレンスを重視した。
我々は、コードドメイン内のテキストプロンプトから物理的に正確なビデオを生成するモーション対応物理グラウンドT2VフレームワークであるMoReGenを紹介する。
以上の結果から,MoReGenは物理コヒーレントな映像合成に向けての方向性を確立する一方,最先端のモデルは物理的妥当性を維持するのに苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:44:04 GMT)
Open Set Face Forgery Detection via Dual-Level Evidence Collection [20.0] 新しい偽のカテゴリーが出現し続けており、既存の顔偽造検出方法に大きな課題がある。
既存の方法は通常、バイナリのReal-vs-Fake分類や既知の偽のカテゴリの識別に限られる。
本稿では,空間および周波数レベルのカテゴリー別証拠を収集・融合し,予測の不確実性を推定するDLED法を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:40:12 GMT)
D-STEER - Preference Alignment Techniques Learn to Behave, not to Believe -- Beneath the Surface, DPO as Steering Vector Perturbation in Activation Space [20.0] DPO(Direct Preference Optimization)は、大規模言語モデルの整合化のための標準レシピとなっている。
本稿は、DPOがモデル内部の信念を書き換えるのではなく、少数の選好方向に沿ってアクティベーションを育む低ランクのステアリング機構として機能すると主張している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:43:26 GMT)
Menta: A Small Language Model for On-Device Mental Health Prediction [19.9] 我々は、ソーシャルメディアデータからマルチタスクのメンタルヘルス予測に特化して最適化された最初のSLMであるMentaを紹介した。
Mentaは、LoRAベースのフレームワーク、クロスデータセット戦略、バランスの取れた精度指向の損失を使用して、6つの分類タスクで共同でトレーニングされている。
我々は,iPhone 15 Pro Max上でのMentaのリアルタイムオンデバイス展開を実演し,約3GBのRAMしか必要としない。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:43:17 GMT)
Global-Local Aware Scene Text Editing [18.4] STE(Scene Text Editing)は、シーンイメージ内のテキストを、元のテキストスタイルと背景テクスチャを保存しながら、新しいターゲットテキストに置き換えることである。
既存の方法は、矛盾と長さの非感受性という2つの大きな課題に悩まされている。
我々はGLASTE(Global-Local Aware Scene Text Editing)というエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:56:01 GMT)
Eval Factsheets: A Structured Framework for Documenting AI Evaluations [18.3] 我々は,AIシステム評価を文書化するためのフレームワークであるEval Factsheetsを紹介する。
本フレームワークは,5つの基本次元にまたがって評価特性を整理する。
Eval Factsheetsは様々な評価パラダイムを効果的に捉えていることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:46:50 GMT)
RoboScape-R: Unified Reward-Observation World Models for Generalizable Robotics Training via RL [18.0] 強化学習(RL)政策は、様々なシナリオにまたがる一般化可能性の育成に苦慮している。
RLは、効果的なマルチシーン一般化に必要な統一および一般報酬信号の欠如に悩まされている。
本稿では,世界モデルを活用するフレームワークであるRoboScape-Rを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:24:16 GMT)
COGNITION: From Evaluation to Defense against Multimodal LLM CAPTCHA Solvers [17.7] マルチモーダル大言語モデル(MLLM)は、視覚CAPTCHAのセキュリティ保証を損なう。
実世界のCAPTCHAタスクタイプ18種を対象に,商用およびオープンソースMLLMを7種類評価した。
MLLMは認識指向のCAPTCHAタスクを人為的なコストとレイテンシで確実に解決できることを明らかにする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:01:43 GMT)
Domain Feature Collapse: Implications for Out-of-Distribution Detection and Solutions [17.7] 単一ドメインデータの教師あり学習が必然的にドメイン機能の崩壊を引き起こすことを実証する。
単一ドメインでトレーニングされたモデルは、ドメイン機能を捨てながら、クラス固有の機能のみに依存するように学習する。
I(x_d; z) > 0 をドメインフィルタリング(事前訓練された表現を使って)で保存することで、障害モードが解決されることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:17:49 GMT)
Parameter-Efficient Augment Plugin for Class-Incremental Learning [17.6] 非事前学習型CILシナリオに対する追加のLoRAコンポーネント(DLC)のデプロイというプラグイン拡張パラダイムを提案する。
提案手法は精度が 8 % 向上し,優れた効率性を示した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:57:48 GMT)
Adaptive Decentralized Federated Learning for Robust Optimization [17.4] 我々は、ロバストな推定のための新しい適応型DFL (aDFL) アプローチを開発した。
疑わしいクライアントに小さなレートを割り当て、通常のクライアントにより大きなレートを割り当てることにより、aDFLはグローバルモデルに対する異常なクライアントの負の影響を軽減します。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:26:00 GMT)
Artificial Microsaccade Compensation: Stable Vision for an Ornithopter [17.4] 尾の無いオルニトプターで撮影した映像を安定化させる「芸術的マイクロサックド補償」。
提案手法は,SO(3)で表される3次元回転を最適化することにより,画像強度の変化を最小限に抑える。
固定された視方向、時にはササードを保持するように適応すると、フレーム間の動きを劇的に減らすことができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:24:02 GMT)
Network of Theseus (like the ship) [17.0] Network of Theseus (NoT) は、トレーニングされた、あるいは訓練されていないガイドネットワークアーキテクチャを、完全に異なるターゲットネットワークアーキテクチャに変換する方法である。
各段階で、ガイドネットワークアーキテクチャのコンポーネントは、ターゲットアーキテクチャモジュールに徐々に置き換えられ、表現的類似度メトリクスを介して整列される。
NoTは、実行可能な推論時アーキテクチャの空間を拡張し、精度と効率のトレードオフを改善する機会を開放し、アーキテクチャ設計空間をより直接的に探索することを可能にする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:15:18 GMT)
Cross-embodied Co-design for Dexterous Hands [17.0] 本稿では,タスク固有の手形態学と相補的なデキスタス制御ポリシーを学習する協調設計フレームワークを提案する。
我々のフレームワークは、24時間以内に新しいロボットハンドを設計、訓練、製造、展開できるエンドツーエンドパイプラインを可能にする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:40:49 GMT)
UniComp: Rethinking Video Compression Through Informational Uniqueness [17.0] UniCompは、制約のある計算予算の下で、ビデオ表現の情報忠実度を最大化することを目的としている。
本稿では,情報固有性の概念を導入して,トークン間の固有冗長性を計測し,再構成誤差とリンクする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:56:23 GMT)
Training for Identity, Inference for Controllability: A Unified Approach to Tuning-Free Face Personalization [16.9] 両パラダイムを相乗的に統合する統合チューニングフリーフレームワークであるUniIDを紹介する。
私たちの重要な洞察は、これらのアプローチを統合する際には、アイデンティティ関連情報のみを相互に強化する必要があるということです。
この原則により、UniIDはフレキシブルテキスト制御性を備えた高忠実な顔のパーソナライゼーションを実現することができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:57:50 GMT)
Matrix Editing Meets Fair Clustering: Parameterized Algorithms and Complexity [16.7] 離散ベクトルのクラスタリングをフェア平均で計算する際の計算問題について検討する。
高度に制限されたフェア平均クラスタリングインスタンスに対しても、類似アルゴリズムを除外する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:07:24 GMT)
NAS-LoRA: Empowering Parameter-Efficient Fine-Tuning for Visual Foundation Models with Searchable Adaptation [16.7] 新たなNAS-LoRAを提案する。
事前学習間のセマンティックギャップを橋渡しするニューラル・エフェクト・ファインチューニング(PEFT)法
SAMおよび特殊ドメイン。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:47:56 GMT)
Robust Multimodal Sentiment Analysis of Image-Text Pairs by Distribution-Based Feature Recovery and Fusion [16.6] 画像・テキスト・ペアの頑健なマルチモーダル感情分析のための分布型特徴回復・融合(DRF)手法を提案する。
具体的には,各モダリティの特徴分布を近似するために,低品質なモダリティと欠落したモダリティを同時に処理できる機能キューをメンテナンスする。
実験では、低品質なモダリティと欠落したモダリティを模倣するために、サンプルのいくつかのモダリティを破壊・破棄する2つの破壊戦略が採用された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:42:19 GMT)
When, How Long and How Much? Interpretable Neural Networks for Time Series Regression by Learning to Mask and Aggregate [16.5] 時系列外部回帰(英: Time series extrinsic regression、TSER)とは、連続目標変数を入力時系列から予測するタスクである。
新しいアプローチは、アノテーションを必要とせずに、人間の理解可能な概念のコンパクトなセットを学ぶ。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:01:41 GMT)
Breaking Determinism: Stochastic Modeling for Reliable Off-Policy Evaluation in Ad Auctions [16.3] この研究は、決定論的オークション環境における信頼性の高いオフ・ポリティ・アセスメント(OPE)のための、初めて実用的で検証されたフレームワークに貢献する。
提案手法は,提案手法を用いて提案した提案手法を,提案手法を用いて提案する提案手法である。
AuctionNetシミュレーションベンチマークと大規模産業プラットフォームによる2週間のオンラインA/Bテストに対するアプローチを検証する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:37:42 GMT)
Exploiting Domain Properties in Language-Driven Domain Generalization for Semantic Segmentation [16.1] セマンティックセマンティックセグメンテーションのための新しいドメイン一般化フレームワーク、すなわちドメイン対応のPrompt駆動のMasked Transformer(DPMFormer)を提案する。
まず,視覚とテキスト間のセマンティックアライメントを促進するために,ドメイン認識型プロンプト学習を導入する。
そこで本研究では,観測可能な領域を多様化するテクスチャ摂動とともに,ドメインを意識したコントラスト学習を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:58:38 GMT)
Sketch Tomography: Hybridizing Classical Shadow and Matrix Product State [15.7] スケッチ・トモグラフィー(Sketch Tomography)は、古典的なシャドウプロトコルに基づく量子状態トモグラフィーの効率的な手順である。
スケッチトモグラフィーは、最大推定式からトレーニングした量子状態よりも、観測可能な推定においてより正確であることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 00:54:00 GMT)
Plug-and-Play Image Restoration with Flow Matching: A Continuous Viewpoint [15.6] フローマッチングサロゲートに基づく生成モデルは,プラグイン・アンド・プレイ画像復元フレームワークに統合されている。
我々は-Flowの連続的な極限を導出し、結果として微分モデル(SDE)を導出する。
我々はSDEインフォームドの改善を検証した。
いくつかのベンチマークタスクを使用したフロー、イメージのノーミング、デブロアリング、インペインティング。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:50:36 GMT)
OmniDexVLG: Learning Dexterous Grasp Generation from Vision Language Model-Guided Grasp Semantics, Taxonomy and Functional Affordance [15.5] デクサラス・グリップ生成は、タスク要求と人間の解釈可能なグリップ・セマンティクスに沿ったグリップ・ポーズを生成することを目的としている。
OmniDexVLGは、構造的に多様性があり、セマンティックにコヒーレントなセグメンテーションを生成できるセマンティックス認識型セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・アグメンテーション・フレームワークである。
本手法は, 多様性の把握, 接触意味の多様性, 機能能力の多様性, 意味の整合性の観点から, 技術アプローチの状況を大幅に上回っている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:28:23 GMT)
AITutor-EvalKit: Exploring the Capabilities of AI Tutors [15.4] 本稿では,AI教師の教育的品質を評価するために,言語技術を用いたAITutor-EvalKitを提案する。
デモと評価のためのソフトウェアと、モデル検査とデータ視覚化を提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:27:50 GMT)
When does Gaussian equivalence fail and how to fix it: Non-universal behavior of random features with quadratic scaling [15.1] ガウス同値理論 (GET) は、高次元の複素特徴の挙動をガウス級数によって捉えることができると述べている。
しかし、数値実験により、この同値性は一般的なスケーリング体制下での単純な埋め込みでも失敗する可能性があることが示されている。
我々は、低次元のガウス成分を高次元ガウスモデルに付加すると考えられる条件等価(CGE)モデルを導入する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 00:23:12 GMT)
Cross-Stain Contrastive Learning for Paired Immunohistochemistry and Histopathology Slide Representation Learning [15.0] 普遍的、転送可能な全スライド画像(WSI)表現は、計算病理学の中心である。
複数のマーカー(化学、IHCなど)をH&Eと組み合わせることで、多様な生物学的に意味のある情報でH&Eベースの特徴を豊かにすることができる。
そこで我々は,H&E,HER2,KI67,ER,PGRという5段階のデータセットを解析し,ペア化されたH&E-IHC学習と堅牢なクロスステイン表現を実現した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:00:27 GMT)
Physics-Embedded Gaussian Process for Traffic State Estimation [15.0] 物理的モデルは不確実性を統合するのが困難であり、トラフィックの真の複雑さを捉えている。
PEGPは、トラフィック状態の推定において、ドメイン知識とデータ駆動手法を統合するように設計されている。
HighD, NGSIMの実験では、非物理学ベースラインよりも一貫した改善が見られた。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:43:40 GMT)
LLM-Generated Ads: From Personalization Parity to Persuasion Superiority [14.8] 本稿では,補間レンズを用いた大規模言語モデル (LLM) 生成広告の2部構成について検討する。
最初の研究では、特定の性格特性に合わせてパーソナライズされた広告をLLMが生成できるかどうかを検証した。
第2の研究では、個人のパーソナライゼーションから普遍的説得テストへと焦点を移した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:13:38 GMT)
Observation-driven correction of numerical weather prediction for marine winds [14.6] 我々は,大域的数値天気予報(NWP)モデルの観測インフォームド補正として風速予測を再構成する。
我々は,GFS(Global Forecast System)の出力を調整するため,最新のその場観測を同調して局所補正パターンを学習する。
モデルはGFS 10mの風力RMSEを全リードタイムで48時間まで減少させ、1時間のリードタイムで45%、48時間のリードタイムで13%改善する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:39:44 GMT)
Tipping the Dominos: Topology-Aware Multi-Hop Attacks on LLM-Based Multi-Agent Systems [14.6] LLMベースのマルチエージェントシステム(MAS)は、デジタルランドスケープを創発的コーディネーションと問題解決能力で再構築した。
我々は,MASを対象としたトポロジ対応マルチホップ攻撃方式であるTOMAを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:10:39 GMT)
Dual LoRA: Enhancing LoRA with Magnitude and Direction Updates [14.5] 低ランク適応(LoRA)はパラメータ効率微調整(PEFT)の中でも最も一般的な手法の1つである。
そこで本研究では,従来のLoRAにインダクティブバイアスを組み込むことにより,性能を向上させるために,Dual LoRAと呼ばれる新しい手法を提案する。
トレーニング可能なパラメータの数が同じで,LoRAとその最先端の変種を一貫して上回ることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:14:09 GMT)
FloodDiffusion: Tailored Diffusion Forcing for Streaming Motion Generation [14.4] FloodDiffusionは、テキスト駆動のストリーミングヒューマンモーション生成のための新しいフレームワークである。
FloodDiffusionは、リアルタイムレイテンシでテキスト整列でシームレスなモーションシーケンスを生成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:23:47 GMT)
Tada-DIP: Input-adaptive Deep Image Prior for One-shot 3D Image Reconstruction [14.3] そこで我々は,3次元逆問題の解法として,高効率で完全な3次元DIP手法であるDada-DIPを紹介した。
入力適応と正規化を組み合わせ,高品質な3D再構成を実現する。
スパースビューX線CT再構成実験により,提案手法の有効性が検証された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:56:38 GMT)
Experimental Sensitivity Enhancement of a Quantum Rydberg Atom-Based RF Receiver with a Metamaterial GRIN Lens [14.1] 勾配屈折率(GRIN)ルネブルク型メタマテリアルレンズと結合した原子系Rydberg電波周波数(RF)受信機
セシウム蒸気中の電磁誘導透過(EIT)効果を解析することにより、2.2GHzのGRINレンズと3.6GHzの遠視野励起下での受信機性能を比較した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 22:22:08 GMT)
MKSNet: Advanced Small Object Detection in Remote Sensing Imagery with Multi-Kernel and Dual Attention Mechanisms [14.1] 本稿では,MKSNet(Multi- Kernel Selection Network)を紹介する。
MKSNetは、空間的およびチャネル的アテンションモジュールをマージする二重アテンション機構を組み込んでいる。
DOTA-v1.0とHRSC2016ベンチマークの実証的な評価は、MKSNetがリモートセンシング画像中の小さな物体を検出する際に、既存の最先端モデルを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:22:27 GMT)
Beyond Boundary Frames: Audio-Visual Semantic Guidance for Context-Aware Video Interpolation [14.0] BBFは、音声/視覚のセマンティクスによってガイドされるコンテキスト対応のビデオフレームフレームワークである。
BBFは、汎用的タスクとオーディオ視覚同期タスクの両方において、最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:22:13 GMT)
Machine Phenomenology: A Simple Equation Classifying Fast Radio Bursts [13.6] この研究は、人間の身体的推論が機械駆動のシンボリックレグレッションを導く方法を示している。
高速電波バーストを2つの異なるガウス分布に分類する単純な方程式を導出し、2つの物理クラスが存在することを示す。
この枠組みは幅広い科学分野に適用できる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:24:28 GMT)
Exploring the Potential and Limitations of Large Language Models for Novice Program Fault Localization [13.6] 初心者プログラマは、限られた経験とプログラミングの構文とロジックの理解のために、フォールトローカライゼーションの課題に直面することが多い。
大きな言語モデル(LLM)は、プログラムの構文やセマンティクスを理解する能力を活用することで、これらの制限を克服することを約束している。
本研究では、Codeflaws、Condefects、BugTデータセットを用いて、6つのクローズドソースと7つのオープンソースLCMを評価する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:55:18 GMT)
Orchestrator Multi-Agent Clinical Decision Support System for Secondary Headache Diagnosis in Primary Care [13.5] 本稿では,オーケストレータ-スペシャリストアーキテクチャ上に構築された多言語モデル(LLM)に基づく多言語臨床意思決定支援システムを提案する。
このシステムは、診断を7つのドメイン特化エージェントに分解し、それぞれが構造化されエビデンスに基づく理論的根拠を生成する。
90例の2次頭痛患者を用いてマルチエージェントシステムの評価を行い,その成績を単一LLMベースラインと比較した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:26:12 GMT)
Tuning-Free Structured Sparse Recovery of Multiple Measurement Vectors using Implicit Regularization [13.4] 複数の測定ベクトルにおけるスパース信号を復元するためのチューニング不要なフレームワークを提案する。
最適化力学は「モメンタムのような」効果を示し、真のサポートにおける行のノルムは他のものよりも著しく速く成長することを示した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:53:11 GMT)
Multi-Aspect Knowledge-Enhanced Medical Vision-Language Pretraining with Multi-Agent Data Generation [13.4] 医用画像分析の強力なパラダイムとして、視覚言語による事前訓練が登場している。
マルチエージェントデータジェネレーション(MAGEN)システムとオントロジーに基づくマルチアスペクト知識強化(O-MAKE)プリトレーニングを統合する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:55:54 GMT)
Four Over Six: More Accurate NVFP4 Quantization with Adaptive Block Scaling [13.4] NVFP4量子化アルゴリズムを改良したFour Over Six (4/6)を導入する。
いくつかのブロックに対して、より小さなFP4値へのスケーリングは、表現可能な値の分布をより均一にする。
また,4/6は,多くの学習後量子化手法に容易に組み込むことができ,一般に下流の精度が向上することがわかった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:24:59 GMT)
Non-Asymptotic Convergence of Discrete Diffusion Models: Masked and Random Walk dynamics [13.2] 我々は3つの一般的な離散拡散モデルに対する新しい鋭い収束保証を開発する。
各手法の計算複雑性は, 対数的因子まで, 次元で線形にスケールすることを示した。
この研究は、これらのノイズ発生過程に対する最初の非漸近収束保証を提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 22:06:08 GMT)
Active Visual Perception: Opportunities and Challenges [12.9] 本稿では,アクティブな視覚知覚に固有の機会と課題について考察する。
それは、その可能性、現在の研究、そしてより広範な採用のために克服されなければならない障害について、包括的な概要を提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:27:37 GMT)
Immunity memory-based jailbreak detection: multi-agent adaptive guard for large language models [12.8] 大規模言語モデル(LLM)はAIシステムの基盤となっているが、敵のジェイルブレイク攻撃に弱いままである。
ジェイルブレイク検出のためのマルチエージェント適応ガード(MAAG)フレームワークを提案する。
MAAGはまず、入力プロンプトからアクティベーション値を抽出し、メモリバンクに格納された履歴アクティベーションと比較して、迅速な予備検出を行う。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:40:40 GMT)
DeepRule: An Integrated Framework for Automated Business Rule Generation via Deep Predictive Modeling and Hybrid Search Optimization [12.7] DeepRuleは小売アソシエーションと価格最適化におけるビジネスルールの自動生成のための統合フレームワークである。
我々は,大規模言語モデル(LLM)を用いたハイブリッド知識融合エンジンを設計し,非構造化テキストの深い意味解析を行う。
実店舗環境において,運用可能性を確保しつつ,系統的B2Cベースラインよりも高い利益率を達成するための枠組みを検証した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:40:33 GMT)
Decentralized Fairness Aware Multi Task Federated Learning for VR Network [12.5] ワイヤレス接続はバーチャルリアリティ(VR)体験を解き放つことを約束し、ユーザーはいつでもどこからでもエンゲージできる。
シームレスで高品質でリアルタイムなVRビデオをワイヤレスで配信することは、体験要件の厳しい品質、低レイテンシの制約、VRデバイスの限られた機能のために難しい。
本稿では、各BSに合わせたキャッシュ戦略に基づいて、基地局(BS)における各VRユーザの視野(FOV)をキャッシュし、プリパッチする、DMTFLベースの分散マルチタスクフェアフェデレーション学習(DMTFL)ベースのキャッシュを導入することで、これらの課題に対処する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:13:00 GMT)
GRASP: GRouped Activation Shared Parameterization for Parameter-Efficient Fine-Tuning and Robust Inference of Transformers [12.5] 我々は,選択したレイヤのD次元トークン表現をKDグループに分割する軽量PEFTフレームワークGRASPを紹介し,各グループに対して共有スケーリングおよびシフトベクトルを学習する。
決定論的値ではなく,事前学習した重みに対する摂動としてガウス分布を学習するStochGRASPを提案する。
様々なノイズレベルの下で、StochGRASPは決定論的変異を一貫して上回り、エネルギー効率とノイズを発生させるハードウェアプラットフォームに適していることを示した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 22:17:05 GMT)
Fairness-Aware Fine-Tuning of Vision-Language Models for Medical Glaucoma Diagnosis [12.3] 医療用視覚言語モデルのためのフェアネス対応低ランク適応を提案する。
GR-LoRAは診断精度の差を69%削減し、全体的な精度は53.15%を維持している。
当社のアプローチではトレーニング可能なパラメータは0.24%に過ぎず、リソース制約のある医療環境に公正な医療AIを実践的に展開することが可能です。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:09:14 GMT)
Teaching Old Tokenizers New Words: Efficient Tokenizer Adaptation for Pre-trained Models [12.2] トケナイザ適応は、訓練済みの言語モデルを新しいドメインや言語に移行する際に重要な役割を果たす。
拡張のための一般的なアプローチは、ドメイン固有のテキストに新しいトークンをトレーニングし、既存の語彙と重複しないトークンを追加する。
我々は,BPEマージ学習プロセスの継続を新たなデータ上で行うことにより,事前学習されたトークン化装置を適応させる,BPEトレーニングの継続を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:20:16 GMT)
Colored Markov Random Fields for Probabilistic Topological Modeling [11.9] Probabilistic Graphical Models (PGM) は、変数のグラフノード、依存関係のリンクを用いて、確率変数間の条件依存を符号化し、結合分布を低次元成分に分解する。
トポロジカル信号処理の最近の進歩は、いくつかのアプリケーション領域におけるトポロジカル空間上で定義された変数の重要性を強調している。
位相空間上のガウスエッジ変数間の条件的および境界的依存関係をモデル化するカラーマルコフランダム場(CMRF)を導入する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:16:07 GMT)
GaussDetect-LiNGAM:Causal Direction Identification without Gaussianity test [11.7] GaussDetect-LiNGAMは、明示的なGaussianityテストの必要性を排除する。
フォワードモデルノイズのガウス性は、逆モデルにおける回帰器と残留器の独立性と同値であることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:14:57 GMT)
Algorithms for Boolean Matrix Factorization using Integer Programming and Heuristics [11.5] BMFは与えられたバイナリ入力行列を2つのより小さなバイナリ要素の積として近似する。
標準的な算術に基づく二項行列分解とは異なり、BMFはブールORと行列積の演算を用いる。
役割マイニングやコンピュータビジョンにも用いられている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:55:54 GMT)
RippleBench: Capturing Ripple Effects Using Existing Knowledge Repositories [11.4] RippleBench-Makerは、任意のモデル編集タスクにおけるリップル効果の測定を可能にする、Q&Aデータセットを生成する自動ツールである。
我々は8つの最先端の未学習の手法を評価し、すべてのトピックが未学習の知識からますます遠ざかるほど、非自明な精度の低下を示すことを発見した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:57:59 GMT)
SHRP: Specialized Head Routing and Pruning for Efficient Encoder Compression [11.2] トランスフォーマーエンコーダは、自然言語理解タスクのための大規模Webサービスに広くデプロイされている。
これらの制限は主にアーキテクチャ上の冗長性、特にアテンションモジュールに起因している。
本稿では,冗長な注意ヘッドを自動的に識別し,除去する新しい構造化プルーニングフレームワークSHRPを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:03:55 GMT)
BookRAG: A Hierarchical Structure-aware Index-based Approach for Retrieval-Augmented Generation on Complex Documents [11.2] Retrieval-Augmented Generation (RAG)は、外部の複雑なドキュメントから非常に関連性の高い情報をクエリする。
本稿では,階層構造を持つ文書を対象とした新しいRAG手法であるBookRAGを紹介する。
BookRAGは最先端のパフォーマンスを実現し、検索リコールとQA精度の両方において、ベースラインを著しく上回っている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:40:49 GMT)
Fairy2i: Training Complex LLMs from Real LLMs with All Parameters in $\{\pm 1, \pm i\}$ [11.1] 事前学習された実数値層を等価な広線形複素形式に変換する普遍的なフレームワークである Fairy2i を提案する。
また,Fairy2iはLLaMA-2 7Bの性能を実効2ビット精度で復元することを示した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:15:05 GMT)
Research on Brain Tumor Classification Method Based on Improved ResNet34 Network [11.1] 本稿では,ResNet34ネットワークを改良した脳腫瘍分類モデルを提案する。
マルチスケールの入力モジュールをResNet34ネットワークの第1層として、インセプションv2モジュールを残留サンプル層として使用する。
5倍のクロスオーバー実験の結果、改良されたネットワークモデルの平均分類精度は約98.8%であることがわかった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:47:23 GMT)
Mind-to-Face: Neural-Driven Photorealistic Avatar Synthesis via EEG Decoding [11.0] 非侵襲脳波(EEG)信号を高忠実度表情に直接デコードする最初のフレームワークであるMind-to-Faceを提案する。
脳波だけでは、微妙な感情反応を含む動的、主観的な表情を確実に予測できることが示される。
Mind-to-Faceは、ニューラル駆動アバターの新しいパラダイムを確立し、没入型環境におけるパーソナライズされた感情認識のテレプレゼンスと認知的相互作用を可能にする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:02:27 GMT)
Evaluating Hydro-Science and Engineering Knowledge of Large Language Models [10.8] ハイドロ・サイエンス・アンド・エンジニアリング(Hydro-Science and Engineering、Hydro-SE)は、人間の水供給を確保し、クリーンな水力発電を行い、洪水や干ばつによる災害を緩和する、重要かつ非置換可能なドメインである。
大規模言語モデル (LLM) の急速な進歩により,Hydro-SE ドメインにおけるその潜在的な応用が研究されている。
4000の質問を含むHydro-SE LLM評価ベンチマーク(Hydro-SE Bench)を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:01:40 GMT)
MSG-Loc: Multi-Label Likelihood-based Semantic Graph Matching for Object-Level Global Localization [10.6] オブジェクトレベルのグローバルなローカライゼーションのための多ラベル確率に基づくセマンティックグラフマッチングフレームワークを提案する。
提案手法は,各ノードの確率と近隣ノードの最大可能性を組み合わせることにより,グラフ間の意味対応を強化する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:28:01 GMT)
VICoT-Agent: A Vision-Interleaved Chain-of-Thought Framework for Interpretable Multimodal Reasoning and Scalable Remote Sensing Analysis [10.6] 新たなマルチモーダルエージェントフレームワークVision-Interleaved Chain-of-Thought Framework (VICoT)を提案する。
VICoTは、視覚ツールを思考の連鎖に動的に組み込むことにより、明示的な多ラウンド推論を実装している。
また, 複雑なエージェントの挙動を小型軽量モデルに移行するためのReasoning Stack蒸留法を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:40:17 GMT)
Forensic Activity Classification Using Digital Traces from iPhones: A Machine Learning-based Approach [10.4] 本稿では,デジタルトレースを様々な身体活動の確率比(LR)に変換する機械学習アプローチを提案する。
NFI_FAREDは,19のアクティビティをラベル付けした4種類のiPhoneのデジタルトレースを含む。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:37:12 GMT)
Fine-grained Narrative Classification in Biased News Articles [10.4] 本稿では, 偏りのあるニュース記事において, よりきめ細かな物語分類を提案する。
また、物語分類の先駆的課題として記事バイアス分類についても検討する。
InDI-PROPはイデオロギー的に基礎を成した最初の詳細な物語データセットである。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:07:52 GMT)
Procedural Mistake Detection via Action Effect Modeling [10.4] アクション・エフェクト・モデリング(AEM)は、確率的定式化を通じてアクションの実行とその結果をキャプチャする統合されたフレームワークである。
AEMは、意味的関連性と視覚的品質に基づいて最も情報性の高い効果フレームを選択することにより、アクションの結果を特定する。
その後、視覚的接地とシンボリックシーングラフから補完的手がかりを抽出し、それらを共有潜在空間に整列させ、堅牢な効果認識表現を形成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:56:17 GMT)
VAT: Vision Action Transformer by Unlocking Full Representation of ViT [10.2] 視覚変換器(ViT)は視覚知覚の標準であるが、ほとんどの手法は最終層の機能のみを使用することで貴重な情報を捨てる。
これは不十分な表現を提供し、VAT(Vision Action Transformer)を提案する。
VATは、すべてのトランスフォーマー層に視覚的特徴を持つ特殊なアクショントークンを処理し、認識とアクション生成の深みと進歩的な融合を可能にする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:50:40 GMT)
Open-Set Domain Adaptation Under Background Distribution Shift: Challenges and A Provably Efficient Solution [10.1] CoLORは、背景分布がシフトする困難な場合においても、オープンセット認識を解決することが保証される手法である。
我々は、CoLORをスケーラブルで堅牢なものにするための技術を開発し、画像およびテキストデータに対して包括的な経験的評価を行う。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:23:58 GMT)
Guided Flow Policy: Learning from High-Value Actions in Offline Reinforcement Learning [10.0] 本稿では,多段階フローマッチングポリシと蒸留ワンステップアクタを結合したガイドフローポリシーを提案する。
アクターは、重み付けされた振る舞いのクローンを通じてフローポリシーを指示し、データセットから高価値なアクションのクローンに集中する。
この相互誘導により、GFPは144の状態およびピクセルベースのタスクで最先端のパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:05:58 GMT)
One Detector Fits All: Robust and Adaptive Detection of Malicious Packages from PyPI to Enterprises [10.0] PyPIのようなパブリックリポジトリとエンタープライズエコシステムの両方にシームレスに統合可能な堅牢な検出器を導入します。
強靭性を確保するために, きめ細かいコード難読化を用いた逆パッケージ生成手法を提案する。
私たちの検出器は、PyPIのようなパブリックリポジトリとエンタープライズエコシステムの両方にシームレスに統合することができ、偽陽性をレビューするために数分の非常に低い予算を確保できます。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:53:56 GMT)
EFDiT: Efficient Fine-grained Image Generation Using Diffusion Transformer Models [10.0] 大規模なきめ細かな画像生成では、意味情報の絡み合いと詳細性の不足の問題が続いている。
我々は,スーパークラスとチャイルドクラスの両方のセマンティック情報を統合した,きめ細かい画像生成におけるタイレッド埋め込みの概念を導入する。
本稿では,拡散モデルに効果的に実装可能な効率的なProAttention機構を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:10:06 GMT)
Engineering photonic dispersion relation and atomic dynamics in waveguide QED setup via long-range hoppings [9.9] 本研究では、原子を1次元結合共振器導波路と長距離ホッピングで結合するシステムについて検討する。
本研究は原子-環境結合と任意の分散関係をシミュレートするための統一的な枠組みを提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:57:24 GMT)
Generalized Event Partonomy Inference with Structured Hierarchical Predictive Learning [9.9] 本稿では、ストリーミングビデオから直接マルチスケールイベント構造を監視せずに学習する統合フレームワークPARSEを紹介する。
PARSEは,時間的アライメントと構造的整合性の両方において,ストリーミング手法と競合するオフラインベースラインの最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:41:06 GMT)
FuXi-Nowcast: Meet the longstanding challenge of convective initiation in nowcasting [9.8] FuXi-Nowcastは、複合レーダー反射率、地表降水量、表面温度、風速、風速を東方1kmで予測するディープラーニングシステムである。
FuXi-Nowcastは, 反射率, 降水量, 風速の3kmCMA-MESO数値モデルを超え, 最大速度は12時間である。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:46:09 GMT)
Better World Models Can Lead to Better Post-Training Performance [9.7] 本研究では,トランスフォーマーの内部表現と下流能力に,世界モデリングの目的がどう影響するかを考察する。
我々は、標準的な次世代予測と2つの明示的な世界モデリング戦略を比較した。
明示的な世界モデリングは、より線形にデオード可能で、因果的にステアブルな状態表現をもたらす。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:13:20 GMT)
Towards Object-centric Understanding for Instructional Videos [9.7] 107本の動画と514本のオープンエンド質問応答対に時間的根拠を付加した長文ビデオベンチマークであるObject-IVQAを紹介する。
このベンチマークは、状態進化、事前条件検証、反実的推論、誤認識を含む、オブジェクト中心推論の4つの次元を評価する。
本稿では,オブジェクト中心の計画,認識,分析,生成ツールを編成するエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:14:26 GMT)
FeatureLens: A Highly Generalizable and Interpretable Framework for Detecting Adversarial Examples Based on Image Features [9.7] FeatureLensは、画像機能の異常を精査するレンズとして機能する軽量フレームワークである。
クローズドセット評価において97.8%から99.75%の範囲で高い検出精度を達成する。
透明で効果的な敵防衛への実践的な道筋を提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:02:34 GMT)
Towards Irreversible Machine Unlearning for Diffusion Models [9.7] 拡散モデル再学習攻撃 (Diffusion Model Relearning Attack, DiMRA) は、微調整に基づく機械学習手法を逆転させることができる。
DiMUMは、ターゲットとする未学習データや機能を置き換えるために、代替データや機能を記憶する。
拡散モデルの生成性能を維持する優れた能力を示すとともに,DiMUMを広範囲に評価した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:37:33 GMT)
Scalable Decision Focused Learning via Online Trainable Surrogates [9.6] コスト損失関数の評価を効率的な代理に置き換える高速化手法を提案する。
従来定義されていたサロゲートとは異なり、我々のアプローチは、急激な局所最適化のリスクを減らす不偏推定器に依存している。
提案手法は,他の最先端技術に匹敵するソリューション品質で,コストのかかる内部解決コールを削減する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:09:21 GMT)
Balancing Safety and Helpfulness in Healthcare AI Assistants through Iterative Preference Alignment [9.4] 大きな言語モデル(LLM)は、医療でますます使われていますが、その安全性と信頼性は、デプロイメントの障壁として残っています。
本稿では,KTO(Kahneman-Tversky Optimization)とDPO(Direct Preference Optimization)を用いて,ドメイン固有の安全信号に対するモデルの改良を行う。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:30:07 GMT)
Exploring the Potentials of Spiking Neural Networks for Image Deraining [9.2] スパイキングニューラルネットワーク(SNN)は低レベルの視覚タスクでは十分に研究されていない。
本研究は, スパイキングニューロンの固有高通過特性の表現, 特に画像デラリニングについて考察する。
階層型マルチスケール表現学習のためのSpking Decomposition and Enhancement Moduleと軽量Spking Multi-scale Unitを導入する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:47:25 GMT)
CRAFT-E: A Neuro-Symbolic Framework for Embodied Affordance Grounding [9.0] CRAFT-Eは、視覚言語アライメントとエネルギーベースの把握推論を備えた構造化動詞・目的知識グラフを構成する、ニューロシンボリックなフレームワークである。
静的シーン、ImageNetベースの機能検索、20の動詞と39のオブジェクトを含む現実世界での試行において、競合的なパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:54:27 GMT)
Universal Quantum Interconnects via Phase-Coherent Four-Wave Mixing [9.0] 本稿では,波動関数の位相マッピングを間接的に検証することにより,コヒーレント量子状態伝達の実現可能性を示す。
以上の結果から,多種多様な変換機構を通じて強相コヒーレンスを維持可能であることが明らかとなった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:02:25 GMT)
AR-Med: Automated Relevance Enhancement in Medical Search via LLM-Driven Information Augmentation [9.0] 大きな言語モデル(LLM)は、このギャップを埋めるための強力なセマンティック理解を提供する、有望なソリューションを提供する。
textbfAR-Medは,textbfRelevanceアセスメントのための新しいフレームワークである。
AR-Medは、高い精度と信頼性を確保するために、検索強化アプローチを通じて、検証済みの医療知識におけるLCM推論を基礎とする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:34:47 GMT)
MambaScope: Coarse-to-Fine Scoping for Efficient Vision Mamba [8.8] 視覚マンバの効率的な推論のための適応型フレームワークであるMambaScopeを提案する。
MambaScopeは入力画像を大きなパッチに分割することで、まず粗い粒度の推論を行う。
モデルの予測信頼度が低い場合には、選択された領域をより精細な解像度で再処理し、重要な視覚的詳細を回復する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:45:29 GMT)
HalluGen: Synthesizing Realistic and Controllable Hallucinations for Evaluating Image Restoration [8.7] HalluGenは、現実的な幻覚を制御可能なタイプ、位置、重大さで合成する拡散ベースのフレームワークである。
我々は4,350個の注釈付き画像からなる最初の大規模幻覚データセットを構築した。
HalluGenとそのオープンデータセットは、安全クリティカルな画像復元における幻覚を評価するための、最初のスケーラブルな基盤を確立している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:20:00 GMT)
Peek-a-Boo Reasoning: Contrastive Region Masking in MLLMs [8.7] トレーニングフリー診断であるContrastive Region Maskingを紹介する。
MLLM(Multimodal large language model)は,チェーン・オブ・ソート(CoT)推論の各ステップにおいて,特定の視覚領域にどのように依存するかを明らかにする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:05:32 GMT)
Towards Privacy-Preserving Range Queries with Secure Learned Spatial Index over Encrypted Data [8.5] 本稿では,暗号化データセット上での新たなプライバシ保護範囲クエリ手法を提案する。
SLS-INDEXは、Paillier暗号システムと階層的な予測アーキテクチャとノイズ注入バケットを統合している。
SLRQは、データセット、クエリ、結果、アクセスパターンのプライバシを確保しながら、クエリ効率で既存のソリューションを大幅に上回る。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:59:40 GMT)
Digital Twin-based Control Co-Design of Full Vehicle Active Suspensions via Deep Reinforcement Learning [8.5] デジタルツイン(DT)とディープ強化学習(DRL)は、車両のライフサイクル全体にわたってリアルタイムでデータ駆動の最適化を行う新たな機会を提供する。
本研究は、フルサイクルアクティブサスペンションのためのDTベースの制御共設計(CCD)フレームワークを提案する。
我々は,様々な運転行動と環境不確実性の下で,物理的サスペンションコンポーネントと制御ポリシーを共同で最適化する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:41:35 GMT)
Bootstrapped Mixed Rewards for RL Post-Training: Injecting Canonical Action Order [8.4] 粗い順序付け信号は、教師付きデータやアーキテクチャを変更することなく、ソルバ順序軌道に対して強化学習を行うことができることを示す。
その結果, 粗い順序付け信号は, 教師付きデータやアーキテクチャを変更することなく, RL をソルバ順序軌道に操ることが可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:36:35 GMT)
EfficientECG: Cross-Attention with Feature Fusion for Efficient Electrocardiogram Classification [8.3] 本稿では,ECGデータを効果的に管理・分析するための新しいディープラーニング技術について検討する。
私たちのディープラーニングアプローチは、エンドツーエンドのトレーニングを通じて、ECGデータの特徴を自動的に抽出することができます。
ECGデータセットの評価は、高精度、多機能融合、軽量化の観点から、最先端の作業に対して我々のモデルを検証している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:54:33 GMT)
From Hypothesis to Premises: LLM-based Backward Logical Reasoning with Selective Symbolic Translation [8.1] 仮説駆動型後方論理推論(HBLR)を提案する。
中心となる考え方は、信頼を意識したシンボリック翻訳と仮説駆動の後方推論を統合することである。
HBLRは、精度と効率の両方において、強いベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:52:31 GMT)
Fully Unsupervised Self-debiasing of Text-to-Image Diffusion Models [7.9] テキスト・ツー・イメージ(T2I)拡散モデルは高解像度のフォトリアリスティック画像を生成する能力によって広く成功している。
本稿では,UNetをノイズ予測器として使用する拡散モデルに適用可能な,完全教師なしテスト時間脱バイアス法であるSelfDebiasを紹介する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:46:42 GMT)
Logic Encryption: This Time for Real [7.9] 論理暗号(LE)に基づく新しいIP保護手法を提案する。
論理ロックの確立されたスキームとは異なり、我々の研究は論理自体を符号化して暗号化することで回路の構造と機能を曖昧にする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:10:23 GMT)
Training and Evaluation of Guideline-Based Medical Reasoning in LLMs [7.8] 医学における早期予測のための機械学習は、最近、画期的なパフォーマンスを示している。
本研究の目的は,医学コンセンサスガイドラインに従って理学療法と予測過程を段階的に実施することである。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:39:02 GMT)
MOS: Mitigating Optical-SAR Modality Gap for Cross-Modal Ship Re-Identification [7.8] 光学・合成開口レーダ(SAR)画像間のReID(re-modal ship re-identification)は、海洋情報と監視において重要で未発見の課題として浮上している。
我々は,光-SARモダリティギャップを緩和し,光-SARクロスモーダル船ReIDのためのモダリティ-一貫性特徴学習を実現するための新しいフレームワークであるMOSを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:23:19 GMT)
Physics-Driven Learning Framework for Tomographic Tactile Sensing [7.6] この研究は、EITフォワードモデルを学習目的に直接組み込む物理駆動の深層再構築フレームワークであるPhyDNNを提示する。
効率的なバックプロパゲーションを実現するため、非線形EIT応答を正確に近似する微分可能前方演算ネットワークを設計する。
PhyDNNは、NOSER、TV、標準DNNよりずっと優れており、接触形態、位置、圧力分布を再構築している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:11:01 GMT)
ShelfGaussian: Shelf-Supervised Open-Vocabulary Gaussian-based 3D Scene Understanding [7.6] オープンボキャブラリ型多モードガウス型3Dシーン理解フレームワークであるShelfGaussianについて紹介する。
既存の手法は、オブジェクトをアノテーション付き3Dラベルで教師される閉集合意味ガウスとしてモデル化し、そのレンダリング能力を無視したり、純粋に2Dの自己スーパービジョンを通じてオープンセットガウス表現を学習する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:06:09 GMT)
When do spectral gradient updates help in deep learning? [7.6] 本稿では,スペクトル更新によってユークリッド勾配よりも損失の減少が大きくなることを予測できる簡単な条件を提案する。
我々はこれらの予測を合成回帰実験やナノGPTスケール言語モデルトレーニングで検証する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 22:22:09 GMT)
Learning From Limited Data and Feedback for Cell Culture Process Monitoring: A Comparative Study [7.6] 細胞培養バイオプロセスでは、リアルタイムバッチプロセス監視(BPM)は重要なプロセス変数の連続的な追跡と分析を指す。
本研究では、これらの課題に対処するために設計された機械学習(ML)手法のベンチマーク分析を行う。
特徴量削減,オンライン学習,ジャスト・イン・タイム・ラーニングなどのMLアプローチを3つのデータセットで評価する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:28:33 GMT)
RoCo: Role-Based LLMs Collaboration for Automatic Heuristic Design [7.4] 本稿では、自動ヒューリスティックデザイン(AHD)の多様性と品質を高めるために、新しいマルチエージェントロールベースシステムであるRoCoを提案する。
RoCoは4つの特殊なLLM誘導エージェント、エクスプローラー、批評家、インテグレータを協調して高品質なインテグレータを生成する。
実験結果から,RoCoは優れた性能を実現し,既存の手法よりも優れた競争力を連続的に生み出すことがわかった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:09:34 GMT)
Difference Decomposition Networks for Infrared Small Target Detection [7.4] 赤外線小目標検出(ISTD)は、識別可能な標的テクスチャの欠如と厳しい背景乱れの2つの大きな課題に直面している。
単一フレームISTD(SISTD)のための空間差分分解ネットワーク(SD$mathrm2$Net)とマルチフレームISTD(MISTD)のための時空間差分分解ネットワーク(STD$mathrm2$Net)を開発する。
STD$mathrm2$Netは87.68%のmIoUを達成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:52:06 GMT)
MPCFormer: A physics-informed data-driven approach for explainable socially-aware autonomous driving [7.4] MPCFormerは、物理情報とデータ駆動型結合型ソーシャルインタラクションダイナミクスを備えた、社会的に認識可能な自律運転アプローチである。
MPCFormerは94.67%の最高計画成功率を達成し、運転効率を15.75%改善し、衝突速度を21.25%から0.5%に下げることを示した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:43:33 GMT)
BERnaT: Basque Encoders for Representing Natural Textual Diversity [7.4] 言語モデルは、標準化されたテキストにのみ依存するのではなく、言語の変化の完全なスペクトルを捉えることを目的としている。
我々は,標準,ソーシャルメディア,歴史資料を組み合わせた新しいコーパスを構築し,エンコーダのみのモデルのBERnaTファミリーを3つの構成で事前学習する。
その結果、標準コーパスと多種多様なデータでトレーニングされたモデルは、標準コーパスでトレーニングされたモデルよりも一貫して優れていた。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:50:42 GMT)
Scaling Trust in Quantum Federated Learning: A Multi-Protocol Privacy Design [7.3] 量子フェデレートラーニング(QFL)は、量子デバイスの計算能力と協調モデルトレーニングを組み合わせることで、分散機械学習に革命をもたらすことを約束する。
我々は、$n$の量子デバイスからなるネットワークがローカルモデルを訓練し、それを多層プライバシープロトコルの下で中央サーバに送信するプライバシー保護QFLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:45:48 GMT)
The Initialization Determines Whether In-Context Learning Is Gradient Descent [7.1] 大規模言語モデル(LLM)における文脈内学習は目覚ましい現象であるが、その基盤となるメカニズムは部分的にのみ理解されている。
従来の作業は線形自己注意(LSA)と勾配降下(GD)を結びつける
訓練可能な初期推定 yq を用いた単一ヘッド LSA の単純な一般化である yq-LSA を導入する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:18:45 GMT)
Quantum Simulations of Opinion Dynamics [7.1] 我々は、意見力学の量子モデルを開発し、正確に解き、IBM Quantumハードウェアをシミュレートする。
結果は、量子効果がコンセンサスの形成、分極、集団的意思決定の理解をいかに促進するかを示す。
発見は、量子化社会モデリングのさらなる探求の道を開く。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:18:29 GMT)
The Outline of Deception: Physical Adversarial Attacks on Traffic Signs Using Edge Patches [6.8] 本研究は,交通標識分類のためのステルス対応逆パッチ方式TESP-Attackを提案する。
人間の視覚的注意は主に交通標識の中央領域に焦点を当てているという観察に基づいて, エッジアライメントマスクを生成するために, ケースセグメンテーションを採用している。
U-Netジェネレータは敵パッチの作成に利用され、色とテクスチャの制約によって最適化される。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:55:46 GMT)
KVNAND: Efficient On-Device Large Language Model Inference Using DRAM-Free In-Flash Computing [6.8] エッジデバイス上の大規模言語モデル(LLM)は、強力なプライバシと低コストでパーソナライズされたエージェントを可能にする。
数十から数十億のパラメータを持つ単一バッチ自己回帰推論は、非常に低い算術強度に悩まされる。
近年のIn-flash Computing (IFC) ソリューションでは,デコードフェーズにおける重み関連線形計算とフラッシュとの併用により,このボトルネックを緩和している。
モデル重みとKVキャッシュを完全に計算可能な3D NANDフラッシュに格納する最初のDRAMフリーIFCベースのアーキテクチャであるKVNANDを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:41:03 GMT)
Mitigating the Curse of Detail: Scaling Arguments for Feature Learning and Sample Complexity [6.7] 深層学習理論における2つの重要なトピックは、特徴学習機構の解釈と、豊かな体制におけるネットワークの暗黙のバイアスの決定である。
特徴学習の様々なパターンが出現するデータと幅のスケールを予測するための強力な経路を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:00:03 GMT)
Text-Printed Image: Bridging the Image-Text Modality Gap for Text-centric Training of Large Vision-Language Models [6.6] テキスト中心のトレーニングは、テキスト記述のみが利用可能であり、実際の画像は提供されない設定である。
プライバシの制約やニッチドメインの不足によって収集が制限される画像とは異なり、テキストは広く利用することができる。
そこで,テキストプリント画像(TPI)を提案し,テキスト記述を直接白キャンバスに描画することで合成画像を生成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:36:46 GMT)
AugServe: Adaptive Request Scheduling for Augmented Large Language Model Inference Serving [6.5] AugServeは、待ち時間を削減するとともに、拡張大型言語モデル(LLM)の効率的なスループットを向上させるために設計された効率的な推論フレームワークである。
実験の結果、AugServeはvLLMとInferCeptよりも4.7-33.1xと3.3-13.2x高いスループットを実現し、変動するTTFTを最大96.3%、95.0%削減した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:49:38 GMT)
Different types of syntactic agreement recruit the same units within large language models [6.5] 大規模言語モデルにおいて、異なる構文現象が共有または異なるコンポーネントを採用できるかどうかを検討する。
認知神経科学にインスパイアされた機能的局所化アプローチを用いて、67の英構文現象に最も反応するLLM単位を同定した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:07:50 GMT)
Harnessing Hypergraphs in Geometric Deep Learning for 3D RNA Inverse Folding [6.4] RNA設計における鍵となる課題は、望まれる二次構造に折り畳まれる配列を特定することである。
本稿では,ハイパーグラフを利用してRNA配列を設計するエンコーダデコーダアーキテクチャを用いた生成モデルであるHyperRNAを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:23:59 GMT)
Multi-Modal Opinion Integration for Financial Sentiment Analysis using Cross-Modal Attention [6.4] 本稿では,2つの財務的意見の相違を統合したエンドツーエンドのディープラーニングフレームワークを提案する。
提案手法の精度は83.5%で,BERT+Transformerを含むベースラインを21%上回っている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:38:11 GMT)
Fast and Flexible Robustness Certificates for Semantic Segmentation [6.2] そこで我々は,リプシッツ制約を組み込んだ,比較的堅牢なセマンティックネットワークを新たに導入する。
我々のアプローチは、初めて、リアルタイム互換の堅牢なセマンティックセマンティックセグメンテーションを解放する。
当社のアプローチはNVIDIA A100 GPUの同等の証明書を推論してランダムにスムースにする方法よりも約600倍高速であることがわかった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:10:16 GMT)
A2G-QFL: Adaptive Aggregation with Two Gains in Quantum Federated learning [6.1] 量子化ネットワーク上でのフェデレーション学習は、クライアントの品質、テレポーテーションの忠実さ、デバイス不安定性、および局所モデルとグローバルモデル間の幾何学的ミスマッチにより、大幅なパフォーマンス劣化に直面している。
本稿では、幾何学的なゲインを通じてブレンディングを共同で規制し、テレポーテーションの忠実度、レイテンシ、滑らかさ、不安定性から導かれるゲインを用いてクライアントの重要度を調節する二重ゲインフレームワークであるA2Gを紹介する。
量子古典ハイブリッドテストベッドの実験では、ノイズ条件下での安定性と精度の向上が示されている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:58:03 GMT)
CartoMapQA: A Fundamental Benchmark Dataset Evaluating Vision-Language Models on Cartographic Map Understanding [5.9] カルトマップQA(CartoMapQA)は、視覚言語モデルによる地図の理解を評価するためのベンチマークである。
データセットには2000以上のサンプルが含まれており、それぞれが地図地図、質問(オープンエンドまたは複数選択の回答)、接地真実の回答で構成されている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:25:22 GMT)
Grokked Models are Better Unlearners [5.9] グラクテッドチェックポイントから始めると、ずっと効率的に忘れられる。
ポストグロキングモデルは、左行と左行と左行の間の勾配の調整を減らして、よりモジュラーな表現を学習する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:35:49 GMT)
Understanding LLM Reasoning for Abstractive Summarization [5.9] 8つの推論戦略と3つの大推論モデル(LRM)の体系的かつ大規模な比較研究を行う。
その結果,推論は普遍的な解ではなく,その有効性は特定の戦略や文脈に大きく依存していることが判明した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:52:44 GMT)
A User Centric Group Authentication Scheme for Secure Communication [5.7] Group Authentication Schemes(GAS)は、複数のユーザのメンバシップを同時に検証するために開発された方法論である。
気体法は、その数学的原理に基づいて3世代に分類することができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:18:14 GMT)
Simulation of a Heterogeneous Quantum Network [5.5] 量子ネットワークは異質なシステムであり、異なる量子ビットプラットフォーム、光子波長、デバイスボトルネックを組み合わせることが期待されている。
本稿では、量子ネットワークの離散イベントシミュレータであるSeQUeNCeに基づいて、異種量子ネットワークをシミュレーションするためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:32:22 GMT)
Adapting Large Language Models to Low-Resource Tibetan: A Two-Stage Continual and Supervised Fine-Tuning Study [5.5] この研究は、形態学的に豊かで表現不足の言語であるチベット語に、Qwen2.5-3Bの2段階の適応を提示する。
チベットの言語基盤を確立するために,CPT(Continuous Pretraining)を使用し,タスクと翻訳にSFT(Supervised Fine-Tuning)を併用した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:06:51 GMT)
Universally Converging Representations of Matter Across Scientific Foundation Models [5.3] 約60の科学的モデルによって学習された表現は、幅広い化学系に高度に整列していることを示す。
トレーニング中に見られるような入力について、ハイパフォーマンスモデルは密接に整列し、弱いモデルは表現空間において局所的な部分オプティマに発散する。
本研究は,科学モデルにおける基礎レベルの一般化の定量的ベンチマークとして,表現アライメントを確立した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:47:06 GMT)
Generalization Evaluation of Deep Stereo Matching Methods for UAV-Based Forestry Applications [5.3] Stereo, IGEV, IGEV, BridgeDepth, StereoAnywhere, DEFOM。
すべてのメソッドはFlow Sceneに特化してトレーニングされ、4つの標準ベンチマークを微調整することなく評価される。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:14:08 GMT)
GalaxyDiT: Efficient Video Generation with Guidance Alignment and Adaptive Proxy in Diffusion Transformers [5.2] GalaxyDiTは、ガイダンスアライメントと、再利用メトリクスのための体系的なプロキシ選択を備えた、ビデオ生成を高速化するトレーニング不要の方法である。
我々は、Wan2.1-1.3BとWan2.1-14Bで1.87Times$と2.37times$のスピードアップを達成し、VBench-2.0ベンチマークでは0.97%と0.72%のダウンしか達成できなかった。
提案手法は, ピーク信号-雑音比 (PSNR) において, 5~10dB の先行技術アプローチを上回り, ベースモデルに優れた忠実さを保っている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:08:18 GMT)
Jina-VLM: Small Multilingual Vision Language Model [5.2] Jina-VLMは、オープンな2BスケールのVLMのうち、最先端の多言語視覚質問応答を実現する2.4Bパラメータビジョン言語モデルである。
このモデルは、任意の解像度画像のトークン効率の良い処理を可能にする注目プーリングコネクタを介して、Qwen3言語バックボーンとSigLIP2ビジョンエンコーダを結合する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:13:41 GMT)
OpenTrack3D: Towards Accurate and Generalizable Open-Vocabulary 3D Instance Segmentation [5.1] オープンな3Dインスタンスセグメンテーションのための汎用的で正確なフレームワークであるOpenTrack3Dを紹介する。
事前に生成された提案に依存するメソッドとは異なり、OpenTrack3Dは、クロスビュー一貫性のあるオブジェクト提案を構築するために、新しいビジュアル空間トラッカーを使用している。
パイプラインは完全にメッシュフリーですが、シーンメッシュが利用可能になった時にパフォーマンスをさらに向上する、オプションのスーパーポイントリファインメントモジュールも提供しています。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:51:03 GMT)
Look Around and Pay Attention: Multi-camera Point Tracking Reimagined with Transformers [5.0] LAPA(Look Around and Pay Attention)は、マルチカメラポイントトラッキングのための、エンドツーエンドのトランスフォーマーベースのアーキテクチャである。
古典的三角法に頼る代わりに、注意重み付けによる3次元点表現を構築する。
TAPVid-3Dパン光学とPointOdysseyの新しいマルチカメラ(MC)バージョンを含む、挑戦的なデータセットの実験は、我々の統一アプローチが既存の手法を大幅に上回っていることを実証している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:34:08 GMT)
High-Throughput Unsupervised Profiling of the Morphology of 316L Powder Particles for Use in Additive Manufacturing [5.0] SLM(Selective Laser Melting)は、原料形態に依存した粉末層添加型製造技術である。
本稿では,高スループットイメージングと形状抽出とクラスタリングを併用した機械学習フレームワークを提案する。
全体として、この教師なし学習フレームワークは粉体形態の迅速かつ自動評価を可能にし、再利用サイクル間の形状変化の追跡をサポートする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:34:48 GMT)
Approximate Optimal Active Learning of Decision Trees [4.8] 本稿では,メンバシップクエリのみを用いて未知のバイナリ決定木を積極的に学習する問題について考察する。
本稿では,仮説空間の減少を推定するために近似モデル計数を用いる決定木を能動的に学習するための記号的手法を提案する。
決定木に関する実験により、この手法は少数のクエリのみを用いて正しいモデルに確実に収束することが示された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:03:39 GMT)
Adaptive Identification and Modeling of Clinical Pathways with Process Mining [4.8] 臨床経路は、患者の治療手順をモデル化する専門的な医療計画である。
プロセスマイニングを用いた2相モデリング手法を提案する。
我々はSARS-CoV-2感染症に対する患者治療をシミュレーションするベンチマークデータセットであるSyntheaを用いたアプローチを実証した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:37:37 GMT)
An Automated Framework for Large-Scale Graph-Based Cerebrovascular Analysis [4.6] CaravelMetricsは自動脳血管分析のための計算フレームワークである。
アトラスに基づく地域パーセレーション、中心線抽出、グラフ構築を統合し、15の形状、トポロジカル、フラクタル、幾何学的特徴を計算する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:21:51 GMT)
Log Probability Tracking of LLM APIs [4.6] 既存の監査手法は、利用可能なLLM APIの幅広い範囲に対して、定期的な時間間隔で適用するには高すぎる。
LLMログの確率(logprobs)は通常非決定論的であるが、コスト効率のよい連続監視の基盤として使用できることを示す。
我々は,小規模かつ現実的なモデル変更の文脈における監査手法の感度を測定する手段として,TinyChangeベンチマークを導入した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:03:43 GMT)
Minimizing the Number of Code Switching Operations in Fault-Tolerant Quantum Circuits [4.6] 単一の誤り訂正コードは、普遍的な量子計算に必要な全てのゲートの完全かつフォールトトレラントな実装をサポートしていない。
コードスイッチングはこの制限に対処し、異なるコード間で量子情報を移動し、共通のゲートセットをサポートする。
したがって、スイッチング操作数を最小化することは、コードスイッチングを用いた量子計算に不可欠である。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:00:05 GMT)
Rethinking Security in Semantic Communication: Latent Manipulation as a New Threat [4.5] ディープラーニングに基づくセマンティックコミュニケーション(SemCom)は,次世代無線ネットワークにおいて有望なパラダイムとして登場した。
本論文では,マン・イン・ザ・ミドル(MitM)攻撃者が送信されたセマンティクスを隠蔽的に操作できる基本的な潜時空間脆弱性を明らかにする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:54:11 GMT)
SELF: A Robust Singular Value and Eigenvalue Approach for LLM Fingerprinting [4.3] 本稿では,入力への依存を排除し,本質的に偽の主張に抵抗する本質的な重みに基づく指紋認証方式を提案する。
SELFは,1)LLM注目重みの特異値と固有値分解によるユニークな,スケーラブルかつ変換不変な指紋抽出,2)少数ショット学習とデータ拡張に基づく効果的なニューラルネットワークベースの指紋類似性比較という2つの重要なイノベーションを通じて,堅牢なIP保護を実現する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:53:47 GMT)
Out-of-the-box: Black-box Causal Attacks on Object Detectors [4.3] 本稿では,ブラックボックスアルゴリズムであるBlackCAttについて述べる。
BlackCAttは、さまざまな大きさとアーキテクチャの異なる物体検出器で動作し、検出器をブラックボックスとして扱う。
我々のアプローチは、検出を除去する際のベースラインの2.7倍、検出を変更する際の3.86倍、新しい刺激的な検出をトリガーする際の5.75倍である。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:17:35 GMT)
From FLOPs to Footprints: The Resource Cost of Artificial Intelligence [4.3] 本研究では,計算処理とハードウェアの物理的ニーズを結びつけることで,AIトレーニングの材料フットプリントを定量化する。
Nvidia A100 SXM 40GBグラフィックス処理ユニット(GPU)の素子組成を誘導結合プラズマ発光分光法を用いて解析し,32個の素子を同定した。
その結果、AIハードウェアは約90%の重金属と微量の貴金属からなることがわかった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:01:46 GMT)
ATHENA: Agentic Team for Hierarchical Evolutionary Numerical Algorithms [4.2] AtheNAは、エンドツーエンドの計算研究ライフサイクルを管理するためにAutonomous Labとして設計されたエージェントフレームワークである。
その中核は知識駆動型診断プロセスであるHENAループである。
このフレームワークは超人的パフォーマンスを実現し、検証エラーは10~14ドルに達する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:05:27 GMT)
Beyond Lindblad Dynamics: Rigorous Guarantees for Thermal and Ground State Preservation under System Bath Interactions [4.2] 我々は, リンドブラッドの弱い結合限界を超えて, 正確な状態生成が可能であることを証明した。
本証明ではダイソン展開の全ての順序を制御する新しい手法を提案する。
バウンダリIMモデルとハバードモデルに関する数値シミュレーションにより、システムバス相互作用フレームワークの堅牢性をさらに裏付ける。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:22:46 GMT)
AaPE: Aliasing-aware Patch Embedding for Self-Supervised Audio Representation Learning [4.1] エイリアス対応パッチ埋め込みは、高周波情報を保持しながらエイリアスを緩和する。
AaPEは、マスク付き教師学生による自己教師型学習にシームレスに統合される。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:17:35 GMT)
Quantum Encrypted Control of Networked Systems [4.1] 量子鍵に基づく線形システムの状態フィードバック制御のための新しい暗号復号アーキテクチャを開発した。
単一のキービットエラーで崩壊する可能性のある古典的な暗号化制御方式とは対照的に、提案した量子暗号化制御は鍵不完全性に対して強い堅牢性を示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:27:39 GMT)
Automatic Attack Discovery for Few-Shot Class-Incremental Learning via Large Language Models [4.1] 本研究の目的は、FSCILに対する攻撃の影響に関する総合的な研究を提供することである。
まず、人間の専門家が設計した攻撃方法がFSCILにどのように影響するかを体系的に検討することによって、洞察を導き出す。
そこで本研究では,FSCILをターゲットとした最適な攻撃手法を自動で検出する,シンプルで効果的なACraft手法を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:34:26 GMT)
Dissipative Yao-Lee Spin-Orbital Model: Exact Solvability and $\mathcal{PT}$ Symmetry Breaking [4.1] 我々は、ヤオ・リースピン軌道モデルの異方的変種に基づく、正確に解けるモデルについて研究する。
我々は、非エルミート・ハミルトニアンの下で二重ヒルベルト空間上のフェルミオンホッピングにリウヴィリア力学を写像する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:00:00 GMT)
AsymPuzl: An Asymmetric Puzzle for multi-agent cooperation [4.0] 大規模言語モデル(LLM)エージェントは、マルチターン、マルチエージェントのシナリオでますます研究されている。
AsymPuzlは,情報非対称性下でのコミュニケーションを分離するように設計された,最小かつ表現力に富んだ2エージェントパズル環境である。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:42:01 GMT)
Text-Only Training for Image Captioning with Retrieval Augmentation and Modality Gap Correction [3.9] TOMCapは改良されたテキストのみのトレーニング手法で、画像キャプチャペアをアライメントすることなくキャプションを実行する。
TOMCapは、他のトレーニングフリーおよびテキストオンリーメソッドよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 22:54:15 GMT)
DINO-RotateMatch: A Rotation-Aware Deep Framework for Robust Image Matching in Large-Scale 3D Reconstruction [3.8] DINOは、大規模なコレクションで意味的に関連するイメージペアを検索するために使用される。
Kaggle Image Matching Challenge 2025の実験では平均精度(mAA)が一貫した改善が示されている。
その結果、自己教師付きグローバルディスクリプタとローテーション強化ローカルマッチングを組み合わせることで、大規模3次元再構成のための堅牢でスケーラブルなソリューションが提供されることを確認した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:05:49 GMT)
Density-Informed VAE (DiVAE): Reliable Log-Prior Probability via Density Alignment Regularization [3.8] DiVAEは軽量でデータ駆動の正規化器で、VAEのログプライア確率$log p_Z(z)$とデータから推定されるログ密度を一致させる。
MNISTでは、DiVAEは、事前の密度の外部推定値との整合性を改善し、より優れた解釈可能性を提供し、学習可能な事前のOOD検出を改善する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:27:23 GMT)
Adaptive sampling using variational autoencoder and reinforcement learning [3.8] 本稿では,変分オートエンコーダと強化学習を併用して逐次測定を行う適応スパースセンシングフレームワークを提案する。
実験により, この手法は, CS, OSP, Generative model-based reconstruction よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:32:25 GMT)
A Learning-based Control Methodology for Transitioning VTOL UAVs [3.7] 現在の制御方式の高度と位置の分離制御は、大きな振動を引き起こす。
本稿では、強化学習(RL)駆動制御に基づく新しい結合遷移制御手法を提案する。
シミュレーションおよび実環境における本手法の適用可能性を検証する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:13:50 GMT)
Young children's anthropomorphism of an AI chatbot: Brain activation and the role of parent co-presence [3.7] ストーリーテリングセッションにおける子どもの行動と前頭前野の活性化との関連について検討した。
発見は、より強い知覚的人間同型は、AIの精神状態の解釈に関連する脳の活性化と関連していることを示唆している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:28:31 GMT)
Studying Various Activation Functions and Non-IID Data for Machine Learning Model Robustness [3.6] 本研究では,10種類のアクティベーション関数を用いた機械学習モデル(ML)のロバスト性を検討した。
提案手法は,77.08%,67.96%の自然的かつ堅牢な精度を実現する。
しかし, 連合学習環境においては, 特に非IIDデータにおいて, 頑健な精度が著しく低下する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:03:45 GMT)
MANTRA: a Framework for Multi-stage Adaptive Noise TReAtment During Training [3.6] 大規模リポジトリでは、ノイズやラベルの誤りによって、正確性と堅牢性の両方を低下させている。
本稿では,音の診断と緩和を微調整プロセスに直接組み込む多段階適応ノイズTReAtmentフレームワークMANTRAを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:09:55 GMT)
KeyPointDiffuser: Unsupervised 3D Keypoint Learning via Latent Diffusion Models [3.6] 本稿では,空間的に構造化された3次元キーポイントを点雲データから学習するための教師なしフレームワークを提案する。
これらのキーポイントはコンパクトで解釈可能な表現として機能し、Eucidated Diffusion Model (EDM) を用いて完全な形状を再構築する。
提案手法は多種多様な対象カテゴリにまたがって高い性能を達成し,従来の手法に比べてキーポイントの一貫性が6ポイント向上した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:08:03 GMT)
Deep Reinforcement Learning for Dynamic Algorithm Configuration: A Case Study on Optimizing OneMax with the (1+($λ$,$λ$))-GA [3.5] OneMaxインスタンス上の(1+($$,$$$)-GAの集団サイズパラメータを体系的に制御する。
DDQNとPPOについて検討した結果,DACの有効性を抑える2つの根本的な課題が明らかになった。
DDQNエージェント探索を強化するために,報酬分布統計を利用した適応型報酬シフト機構を導入する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:54:41 GMT)
DM3D: Deformable Mamba via Offset-Guided Gaussian Sequencing for Point Cloud Understanding [3.5] ポイントクラウド理解のための変形可能なMambaアーキテクチャである textbfDM3D を提案する。
DM3Dはオフセット誘導型ガウスシークエンシング機構を導入し、デフォルマブルスキャン内で局所再サンプリングとグローバルリオーダーを統一する。
ベンチマークデータセットの実験では、DM3Dは分類、少数ショット学習、部分セグメンテーションにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:57:41 GMT)
Bayes-DIC Net: Estimating Digital Image Correlation Uncertainty with Bayesian Neural Networks [3.4] 本稿では,非一様B-スプライン面に基づく高品質デジタル画像相関(DIC)データセットを生成する新しい手法を提案する。
制御点座標をランダムに生成することにより、様々な現実的な変位シナリオを含む変位場を構築する。
このアプローチにより、現実世界の変位場をキャプチャする大規模なデータセットの生成が可能になる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:16:26 GMT)
Sympathetic Cooling of Levitated Optomechanics through Nonreciprocal Coupling [3.4] 本研究では, 2つの浮遊ナノ粒子間の非相互結合による非エルミート光学冷却法を提案する。
非相反性により指向性エネルギー移動が促進され、従来の空洞冷却よりも低いフォノン占有が達成できる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:31:24 GMT)
WildCode: An Empirical Analysis of Code Generated by ChatGPT [3.2] 我々はChatGPTが生成したコードについて、正確性とセキュリティの両方について評価する。
LLMの生成を依頼するコードのセキュリティ機能について,ユーザがほとんど好奇心を示さないことが分かりました。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 20:54:24 GMT)
RGE-GCN: Recursive Gene Elimination with Graph Convolutional Networks for RNA-seq based Early Cancer Detection [3.2] RGE-GCN(Recursive Gene Elimination with Graph Convolutional Networks)は,単一パイプラインにおける特徴選択と分類を組み合わせたフレームワークである。
提案手法は, 遺伝子発現プロファイルからグラフを構築し, グラフ畳み込みネットワークを用いてがんと正常なサンプルを分類し, 組込み勾配を用いて最も情報性の高い遺伝子をハイライトする。
RGE-GCNは, 肺, 腎臓, 頸部がんのRNA-seqコホートと同様に, 合成データに基づいて評価した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:45:21 GMT)
Structured Uncertainty Similarity Score (SUSS): Learning a Probabilistic, Interpretable, Perceptual Metric Between Images [3.1] 人間の視覚と一致した知覚的類似度スコアは、コンピュータビジョンモデルのトレーニングと評価の両方に不可欠である。
SUSS (Structured Uncertainity similarity Score) を導入し、知覚コンポーネントの集合を通して各イメージをモデル化する。
最終的なスコアは、人間の知覚データセットから学んだ重み付きコンポーネントログ確率の重み付き総和である。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:48:59 GMT)
LLM as Explainable Re-Ranker for Recommendation System [3.1] 従来のレコメンデーションシステムは説明可能性に欠けることが多く、人気バイアスのような問題に悩まされる。
本稿では,大規模言語モデル(LLM)を説明可能なリランカとして使用し,精度と解釈性の両方を向上させることを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:42:58 GMT)
ProtoEFNet: Dynamic Prototype Learning for Inherently Interpretable Ejection Fraction Estimation in Echocardiography [3.0] ProtoEFNetは、連続EF回帰のためのビデオベースのプロトタイプ学習モデルである。
臨床的に意味のある心臓の動きパターンを捉える動的時間的プロトタイプを学習する。
実験の結果,ProtoEFNetの精度は非解釈可能なものと同等であることがわかった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:11:28 GMT)
A Theoretical Framework for Auxiliary-Loss-Free Load Balancing of Sparse Mixture-of-Experts in Large-Scale AI Models [3.0] 大規模なAIトレーニングでは、Sparse Mixture-of-Experts(s-MoE)レイヤによって、トークン当たりのエキスパートの小さなサブセットのみを活性化することで、スケーリングが可能になる。
本稿では,ALF-LB (Auxiliary-Loss-Free Load Balancing) 法を理論的に解析する枠組みを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:00:02 GMT)
Real-time Cricket Sorting By Sex [3.0] ハウスクリケットは工業生産に最も適した種の1つである。
現在の農業は、自動性選別を行わない混合性集団において、後部クリケットを実践している。
本研究は、Acheta domesticusの自動性分類のための低コストでリアルタイムなシステムを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:02:19 GMT)
Memory-Guided Point Cloud Completion for Dental Reconstruction [2.9] 本稿では,プロトタイプメモリをエンコーダ-デコーダパイプラインに統合した歯の補修のための検索拡張フレームワークを提案する。
メモリはエンドツーエンドに最適化され、再利用可能な歯形プロトタイプに自己組織化される。
我々のアプローチは、より正確で忠実な歯科用点クラウド完成のために、クロスサンプルの正則性を活用できるシンプルで効果的な方法を提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:31:07 GMT)
Unfolding Challenges in Securing and Regulating Unmanned Air Vehicles [2.9] 我々は、総合的な最先端の研究を行い、一般的なセキュリティ課題について検討する。
従来の技術とは異なり、我々はセキュリティポリシーを施行するために対処しなければならない研究のギャップを明らかにすることに重点を置いています。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:41:30 GMT)
Dynamic Content Moderation in Livestreams: Combining Supervised Classification with MLLM-Boosted Similarity Matching [2.9] 本稿では、既知の違反に対する教師付き分類と、新規または微妙な事例に対する参照ベース類似性マッチングを組み合わせたハイブリッド・モデレーション・フレームワークを提案する。
プロダクションでは、分類パイプラインは80%の精度で67%のリコールを達成し、類似性パイプラインは80%の精度で76%のリコールを達成している。
これらの結果は、マルチモーダルコンテンツガバナンスに対するスケーラブルで適応可能なアプローチを示し、明示的な違反と新たな敵行動の両方に対処することができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:20:58 GMT)
Bayesian Optimization for Automatic Tuning of Torque-Level Nonlinear Model Predictive Control [2.9] 本稿では,トルクに基づくモデル予測制御(nMPC)のための自動チューニングフレームワークを提案する。
MPCは、最適な関節トルクコマンドのためのリアルタイムコントローラとして機能する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:19:42 GMT)
Lean Unet: A Compact Model for Image Segmentation [2.9] 現在のUnetアーキテクチャは、情報内容を保存するためにチャネル次元を拡大しながら、空間分解能を反復的にダウンサンプルする。
チャネルプルーニングはUnetアーキテクチャを精度損失なく圧縮するが、長い最適化が必要であり、タスクやデータセットをまたいだ一般化はできない。
本稿では,分解能が半減するにつれてチャネルが2倍にならないような,コンパクトでフラットな階層を持つリーンUnetアーキテクチャ(LUnet)を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:35:21 GMT)
On the Role and Impact of GenAI Tools in Software Engineering Education [2.9] ChatGPTやGitHub CopilotといったジェネレーティブAI(GenAI)ツールは、ソフトウェアの学習と書き方を変えました。
ソフトウェア工学(SE)教育において、これらのツールはサポートの新しい機会を提供するだけでなく、過度な信頼、倫理的利用、学習への影響に対する懸念も引き起こす。
本研究は,学部生がGenAIツールをどのように利用するか,そのメリット,課題,倫理的懸念,経験を形作る教育的期待に焦点をあてるものである。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 20:51:16 GMT)
Short-Range Modulated Electron Lattice and d-Wave Superconductivity in Cuprates: A Phenomenological Ginzburg-Landau Framework [2.8] 我々は、電子電荷密度対を$d$マイクロ波超伝導凝縮体に短距離変調した高T_c$銅酸化物のフレームワークを開発する。
得られた変調電子格子(MEL)状態は、長距離静電荷密度波列とは異なる。
このフレームワークは、MEL相関長、超流動剛性、障害、渦ピンニングの相関関係を示し、カップレート観察をテスト可能なSTM/STS予測に整理する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:02:14 GMT)
Metrological Sensitivity beyond Gaussian Limits with Cubic Phase States [2.8] 我々は、立方相状態が全てのガウス状態の位相感知感度を等平均光子数で上回ることを示す。
最適測定戦略を同定し、ガウス限界を超える実験的な準備スキームを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:18:25 GMT)
Cell-cell communication inference and analysis: biological mechanisms, computational approaches, and future opportunities [2.8] 多細胞生物において、細胞は細胞間通信(CCC)を介してその活性を協調する
単一セル・空間オミクス技術の最近の進歩は、これらのオミクスデータからCCCを推測・分析する前例のない機会を提供する。
本稿では, CCCの生物学的機構とモデリング戦略について紹介し, 単一セルおよび空間転写学的データからCCCを推定するための140以上の計算手法について概説する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:45:35 GMT)
Distributed Quantum Computing with Fan-Out Operations and Qudits: the Case of Distributed Global Gates (a Preliminary Study) [2.7] 本稿では,分散ファンアウト操作において,マルチパーティント・エンタングルメント・リソースがいかに有用かを検討する。
また、分散量子回路圧縮における次元4の量子ビットの利用についても検討する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:26:47 GMT)
Solution of the Electric Field Integral Equation Using a Hybrid Quantum-Classical Scheme: Investigation of Accuracy and Efficiency [2.5] 電磁界における任意の形状の3次元完全導電体からの電磁波散乱を解くために,ハイブリッド量子古典法を用いる。
ハイブリッドVQLS古典的スキームの計算複雑性は、古典計算における従来の高速解法よりも低い。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:57:15 GMT)
SweetDeep: A Wearable AI Solution for Real-Time Non-Invasive Diabetes Screening [2.5] SweetDeepは、285人の被験者の生理的、人口統計学的なデータに基づいて訓練された、コンパクトなニューラルネットワークである。
SweetDeepは3000以上のパラメータを含むにもかかわらず、82.5%の患者レベルの精度を達成している。
これらの結果は, 工学的特徴と軽量なアーキテクチャを組み合わせることで, 2型糖尿病の正確な, 迅速, 一般化可能な検出を支援できることを示唆している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:52:26 GMT)
RNNs perform task computations by dynamically warping neural representations [2.3] 本稿では、リカレントニューラルネットワーク(RNN)がタスク変数の表現を動的にワープすることで計算を行うことを示す。
RNNの時間変化幾何学を特徴付けることにより,動的ワープが計算の基本的な特徴であることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:01:43 GMT)
Non-Linear Determinants of Pedestrian Injury Severity: Evidence from Administrative Data in Great Britain [2.3] 本研究では,イギリスの2023 STATS19データセットから得られた管理データを用いて,歩行者の重度の非線形決定因子について検討した。
モード計算とSMOTE(Synthetic Minority Over-Sampling)を利用した厳密な前処理パイプラインを用いる。
分析の結果,車両数,速度制限,照明,路面条件が重度の予測因子であることがわかった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:59:46 GMT)
Probabilistic Foundations of Fuzzy Simplicial Sets for Nonlinear Dimensionality Reduction [2.3] ファジィ単純集合は次元減少と多様体学習への関心の対象となっている。
ファジィsimplicial set を、simplicial set 上の確率測度の限界として説明する枠組みを導入する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:49:38 GMT)
Cross-Space Synergy: A Unified Framework for Multimodal Emotion Recognition in Conversation [2.2] 会話におけるマルチモーダル感情認識は、テキスト、音響、視覚的手がかりを統合することで、話者の感情を予測することを目的としている。
既存のアプローチでは、複雑なクロスモーダルなインタラクションを捉えるのに苦労するか、勾配の衝突と不安定なトレーニングを経験する。
我々は、表現コンポーネントと最適化コンポーネントを結合したクロススペース構文(CSS)を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:26:33 GMT)
Polylogarithmic-Depth Quantum Algorithm for Simulating the Extended Hubbard Model on a Two-Dimensional Lattice Using the Fast Multipole Method [2.0] 本研究では,2次元格子上に拡張されたハバードモデルの時間発展をシミュレーションする効率的な量子アルゴリズムを提案する。
本稿では、2次元中性原子量子コンピューティングの進歩を活用し、長距離ゲートやシャットリングのような非局所的な操作をサポートする方法について論じる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:48:08 GMT)
SSLfmm: An R Package for Semi-Supervised Learning with a Mixed-Missingness Mechanism in Finite Mixture Models [2.0] 半教師付き学習(SSL)は、観測のサブセットのみをラベル付けしたデータセットから分類器を構築する。
観察が損なわれない可能性は、その特徴ベクトルのあいまいさに依存する可能性があるため、不足過程は有益なものとなる。
このパッケージにはモデリングの実用的なツールが含まれており、シミュレートされた例を通してそのパフォーマンスを説明している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 00:14:33 GMT)
Solving N-Queen Problem using Las Vegas Algorithm with State Pruning [2.0] N-クイーン問題(N-Queens problem)は、NxNのチェスボードにNのクイーンを配置する問題であり、制約満足度アルゴリズムの古典的な問題である。
本研究では,ラスベガスの標準フレームワーク上に,反復刈り込みによるハイブリッドアルゴリズムを導入する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:36:52 GMT)
No-Regret Gaussian Process Optimization of Time-Varying Functions [1.9] W-SparQ-GP-UCBは、イテレーション毎に追加のクエリが消えるだけで、ノンレグレットを実現するオンラインアルゴリズムである。
本稿では,関数の時間変化の度合いと,達成可能な後悔率を関連づけた包括的分析を行う。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:28:08 GMT)
Towards Quantum Stochastic Optimization for Energy Systems under Uncertainty: Joint Chance Constraints with Quantum Annealing [1.9] 量子アニールプラットフォームの適用性について検討した。
我々はこの問題を混合整数線形プログラムとして再構成し、GurobiとともにDWaveハイブリッド量子古典解法を用いて解いた。
我々の研究は、現在の量子異方体が基本的に制限されているハイブリッド量子古典法で、制約されたUCPが既に対処できる可能性について述べています。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:26:54 GMT)
The enshittification of online search? Privacy and quality of Google, Bing and Apple in coding advice [1.9] Google Search、Microsoft Bing、およびApple Searchの検索品質を評価する。
検索品質の独立した指標として,1)Web検索におけるプライバシの尺度として,1)検索結果の最初のトラッカー数,2)Stack Overflow検索結果の平均ランクの2つを用いる。
我々の結果は、検索結果のプライバシがGoogleやAppleよりもBingの方が高いことを示唆している。同様に、Stack Overflowの平均的なランクによって測定されるコーディングアドバイスの品質は、Bingで最高だった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:42:22 GMT)
Functional Python Programming in Introductory Computer Science Courses [1.8] 我々は、Pythonの純粋に機能的なサブセットで、学生にプログラミングの課題を学習し、完成させることを強制する入門プログラミングクラスにおいて、ベストプラクティスのアイデアを提示する。
そうすることで、学生は不変性、副作用のない純粋関数、ステートレスプログラミングといった機能的アイデアを学ぶことができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:39:08 GMT)
CR3G: Causal Reasoning for Patient-Centric Explanations in Radiology Report Generation [1.7] 因果推論(英: Causal inference)は、X線における特定の発見が特定の診断に関連する理由を明らかにするためのパターンを識別する以上の強力なアプローチである。
胸部X線分析に応用した放射線学報告生成(CR3G)における患者中心説明のための即時的因果推論法について検討する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:03:00 GMT)
Instantaneous Sobolev Regularization for Dissipative Bosonic Dynamics [1.7] ボゾンフォック空間上の量子マルコフ半群について検討する。
ソボレフ正則化を示す無限次元散逸展開の幅広いクラスを同定する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:48:55 GMT)
Data-Free Pruning of Self-Attention Layers in LLMs [1.7] 本稿では,クエリーキー結合によって注目サブレイヤをランク付けする1ショットの重みのみの基準であるGate-Normを提案する。
Gate-Normは、キャリブレーションデータを必要とせず、フォワードパスも微調整も不要で、特別なカーネルも不要である。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:47:49 GMT)
In-Situ Encryption of Single-Transistor Nonvolatile Memories without Density Loss [1.6] 強誘電体FET(FeFET)を用いた超高密度単一トランジスタ暗号セルを提案する。
XORベースのスキームにおいて、2メモリデバイス毎の暗号化セル要求を排除したのは、これが初めてである。
128x128ビットアレイの解析では、以前のFeFETよりも2倍高い暗号化/復号化スループットを示し、AESよりも45.2x/14.12倍改善した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:30:10 GMT)
Consistent Projection of Langevin Dynamics: Preserving Thermodynamics and Kinetics in Coarse-Grained Models [1.6] この研究は、一般のアンダーダムランゲヴィン力学に対する射影に基づく粗粒の定式化を提示する。
さらに,ジェネレータ拡張動的モード分解(gEDMD)を用いてCG力学をモデル化する方法について述べる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:57:29 GMT)
RAGVUE: A Diagnostic View for Explainable and Automated Evaluation of Retrieval-Augmented Generation [1.6] RAGVUEはRetrieval-Augmented Generation (RAG)システムを評価するためのフレームワークである。
RAGの振る舞いを検索品質、回答の妥当性と完全性、厳格なクレームレベルの忠実さ、および判断の校正に分解する。
RAGVUEは手動のメートル法選択と完全に自動化されたエージェント評価の両方をサポートしている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:42:49 GMT)
Empirical assessment of the perception of graphical threat model acceptability [1.6] 3つの一般的なグラフィカルな脅威モデル、アタック・ディフェンス・ツリー(ADT)、アタック・グラフ(AG)、CORASの受け入れ可能性を比較した。
ADTもCORASも幅広いシナリオで広く受け入れられており、技術的背景が限られているユーザでもうまく適用できることがわかった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:30:51 GMT)
Foundations of Quantum Granular Computing with Effect-Based Granules, Algebraic Properties and Reference Architectures [1.5] 本稿では量子グラニュラーコンピューティング(QGC)の基礎を開発する。
QGCは、ファジィ、粗い、シャドウ化されたグラニュラーを含む古典的なグラニュラーコンピューティングを量子状態に拡張する。
QGCは,非可換性,文脈性,絡み合いを生かしながら,段階的メンバーシップやスムーズな決定境界のようなファジィを再現することを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:07:26 GMT)
On the Temporality for Sketch Representation Learning [1.4] 本研究は、スケッチをシーケンスとして扱うことが妥当かどうか、およびどの内部順序がより関係のある役割を果たすかを検討する。
その結果、従来の位置エンコーディングはスケッチをシーケンスとしてモデル化するのに有効であるが、絶対座標は相対座標よりも一貫して優れていることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:46:05 GMT)
Is Lying Only Sinful in Islam? Exploring Religious Bias in Multilingual Large Language Models Across Major Religions [1.3] 多言語モデルは、しばしば宗教を誤って表現し、宗教的な文脈で正確であるのが困難である。
我々は、南アジアの4つの主要な宗教である仏教、キリスト教、ヒンドゥー教、イスラム教に焦点を当てたBRAND: Bilingual Religious Accountable Normデータセットを紹介する。
我々の結果は、ベンガル語よりも英語の方が優れた結果を示し、宗教中立の疑問に答える場合でも、一貫してイスラム教に対する偏見を示すことを示している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:38:41 GMT)
Probabilistic Fusion and Calibration of Neural Speaker Diarization Models [1.3] 本稿では,確率レベルでのEDEモデルの校正と融合を行うための,最初の包括的枠組みを提案する。
適切なキャリブレーションが個々のモデルに対しても大幅な改善をもたらすことを示す。
我々の最高の構成は、ダウンストリームアプリケーションに不可欠な信頼性の見積を提供しながら、DERの点でDOVER-Lapよりも優れています。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:49:38 GMT)
Learning Group Actions In Disentangled Latent Image Representations [1.3] 潜在表現に対するグループアクションは、高次元画像データの制御可能な変換を可能にする。
ラテント空間法はより柔軟性を提供するが、それでもラテント変数を同変部分空間と不変部分空間に手動で分割する必要がある。
本稿では,潜像多様体上での群作用を初めて学習する,新しいエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:52:24 GMT)
Autonomous Agents and Policy Compliance: A Framework for Reasoning About Penalties [1.3] 本稿では、非コンプライアンスに対する潜在的な罰則を推論できる政策対応自律エージェントのための論理プログラミングベースのフレームワークを提案する。
我々のフレームワークは、罰則を組み込むために、Gelfond と Lobo's Authorization and Obligation Policy Language (AOPL)を拡張しています。
本手法は, 規則違反を明確に識別することで, 整然とした政策の確保, 方針の優先事項の説明, 説明可能性の向上を図る。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:29:09 GMT)
Joint Progression Modeling (JPM): A Probabilistic Framework for Mixed-Pathology Progression [1.2] 本稿では,単相軌跡を部分的ランク付けとして扱う確率的フレームワークであるジョイント・プログレクション・モデル(JPM)を紹介する。
合成実験では、JPMは強いEMMベースラインよりも約21%精度が向上する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:02:32 GMT)
Bayesian Event-Based Model for Disease Subtype and Stage Inference [1.2] サブタイプおよびステージ推論イベントベースモデル(SuStaIn)は、多くの疾患のサブタイプを明らかにするために広く応用されている。
本研究では,イベントベースモデル(BEBMS)のベイズ的サブタイプを考案し,その性能をSuStaInと比較する。
StaInよりBEBMSはアルツハイマー病の進行に関する科学的コンセンサスと一致している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:45:16 GMT)
The promising potential of vision language models for the generation of textual weather forecasts [1.2] 我々は,ビデオ符号化された格子状気象データから直接,象徴的なShipping Forecastテキストを書くための視覚言語モデルの導入について検討する。
これらの初期の成果は、気象庁等における生産効率とサービス革新を向上するための、有望なスケーラブルな技術機会を示している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:00:15 GMT)
Amortized Causal Discovery with Prior-Fitted Networks [1.2] 本稿では,推定精度の限界に対処する新たな因果発見手法を提案する。
提案手法は,PFNを用いてデータ依存確率推定を補正し,構造学習のための信頼性の高いスコアを得る。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:37:20 GMT)
Unlocking the Invisible Urban Traffic Dynamics under Extreme Weather: A New Physics-Constrained Hamiltonian Learning Algorithm [1.0] 都市交通システムでは、極端な天候によるレジリエンスの課題が増大している。
現在の評価方法は、隠れた構造的損傷を見逃す表面レベルの回復指標に依存している。
我々のフレームワークは、表面メトリクスを誤解させるのではなく、真のシステムの健全性に基づくインフラ投資を可能にする、積極的な構造リスク評価のためのツールを提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:42:40 GMT)
Modeling Topics and Sociolinguistic Variation in Code-Switched Discourse: Insights from Spanish-English and Spanish-Guaraní [1.0] 本研究は, スペイン語とスペイン語の2つの異なる文脈において, バイリンガル言説の社会言語学的および話題的分析のためのLLM支援アノテーションパイプラインを提案する。
大規模言語モデルを用いて,3,691のコード切替文に対して,話題,ジャンル,言論的機能を自動的にラベル付けした。
結果として得られた分布は、マイアミのデータにおけるジェンダー、言語優位、談話機能と、パラグアイのテキストにおける正式なグアラーンと非公式なスペイン語の明確な区分の間の体系的な関係を明らかにしている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 00:56:27 GMT)
Hyperdimensional Computing for Sustainable Manufacturing: An Initial Assessment [1.0] 本研究では, センサを用いたスマート加工における幾何学的品質の予測手法を用いて, 一般的なAIモデルのエネルギー消費, 精度, 速度を比較する。
超次元コンピューティング(HDC)は、エネルギー消費を大幅に削減しつつ、従来のモデルに匹敵する精度を達成する代替手段として導入された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:14:34 GMT)
Using physics-inspired Singular Learning Theory to understand grokking & other phase transitions in modern neural networks [0.9] 本研究では,解釈可能性と相転移に関連する玩具設定における特異学習理論(SLT)について検討する。
本稿では、ニューラルネットワークの相転移を理解する上でのSLTの多くのメリットを概説し、この分野にオープンな研究課題を提起する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 22:14:33 GMT)
Embedding networks with the random walk first return time distribution [0.9] 本研究では,ランダムウォークの第1次回帰時間分布(FRTD)を,解釈可能かつ数学的に基底化されたノード埋め込みとして提案する。
FRTDは固有値スペクトルよりも厳密に情報的であるが,完全なグラフ識別には不十分であることを示す。
FRTDの埋め込みは、ネットワークアライメントタスクにおいて、手動で設計されたグラフメトリクスよりも優れていることを実証的に実証する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:33:10 GMT)
Multi-Modal Machine Learning for Early Trust Prediction in Human-AI Interaction Using Face Image and GSR Bio Signals [0.9] 本研究では,画像とガルバニック皮膚反応(GSR)データを組み合わせたマルチモーダル機械学習フレームワークを提案する。
その結果,顔と生理的手がかりを組み合わせることで予測性能が有意に向上した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:35:04 GMT)
Cyclical Temporal Encoding and Hybrid Deep Ensembles for Multistep Energy Forecasting [0.9] 本稿では,周期的時間エンコーディングとハイブリッドLSTM-CNNアーキテクチャを統合した統合型ディープラーニングフレームワークを提案する。
我々の知る限り、これは統合短期エネルギー予測フレームワークにおいて、時間エンコーディング、カレンダーベースの特徴、ハイブリッドアンサンブルアーキテクチャを共同で評価する最初の試みである。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:46:02 GMT)
Autonomous Reinforcement Learning Robot Control with Intel's Loihi 2 Neuromorphic Hardware [0.8] ニューロモルフィックハードウェア上に強化学習訓練されたニューラルネットワークを展開するためのエンドツーエンドパイプラインを提案する。
我々は、完全にシミュレーションで訓練されたANNポリシーを、IntelのLoihi 2アーキテクチャと互換性のあるSDNNに変換することを実証した。
その結果, ロボット制御のためのニューロモルフィックプラットフォームの実現可能性を強調し, エネルギー効率, リアルタイムニューロモルフィック計算への道を開いた。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:56:39 GMT)
DIQ-H: Evaluating Hallucination Persistence in VLMs Under Temporal Visual Degradation [0.8] 時間列の動的視覚劣化下でのVLMロバスト性を評価するための最初のベンチマークであるDIQ-Hを紹介する。
DIQ-Hは、モーションボケ、センサノイズ、圧縮アーティファクトなどの物理ベースの汚職を適用し、幻覚の持続性、エラー回復、時間的一貫性を測定する。
拡張性のあるアノテーションを実現するために,疑似地下構造を生成するUncertainty-Guided Iterative Refinement (UIR)を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:22:29 GMT)
MAGE-ID: A Multimodal Generative Framework for Intrusion Detection Systems [0.8] 本稿では拡散型生成フレームワークであるMAGE-ID(Multimodal Attack Generator for Intrusion Detection)を紹介する。
トランスフォーマーとCNNベースの変分エンコーダをEDMスタイルのデノイザで共同でトレーニングすることにより、MAGE-IDはバランスよくコヒーレントなマルチモーダル合成を実現する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:22:21 GMT)
Density of states of quantum systems from free probability theory: a brief overview [0.8] 量子系とランダム行列ハミルトン系の状態の密度を計算するためのアプローチの概要を概説する。
相互作用量子系とランダム行列モデルの多くの例において、この手順は状態の正確な数値密度に合理的に正確な近似を与えることが知られている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:49:46 GMT)
Towards better dense rewards in Reinforcement Learning Applications [0.7] 強化学習(RL)分野における意味的かつ正確な高密度報酬の発見は基本的な課題である
デンス報酬関数は、エージェントの振る舞いを形作り、学習を加速することで潜在的な解決策を提供する。
本提案では,未解決問題に対処し,高密度報酬構築の有効性と信頼性を高めるためのいくつかのアプローチについて検討する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 22:36:55 GMT)
World Models for Autonomous Navigation of Terrestrial Robots from LIDAR Observations [0.7] 本稿では,DreamerV3アルゴリズム上に構築された新しいモデルベースRLフレームワークを提案する。
MLP-VAE(Multi-Layer Perceptron Variational Autoencoder)を世界モデルに統合し、高次元LIDAR読み出しをコンパクトな潜在表現に符号化する。
シミュレーションされたTurtleBot3ナビゲーションタスクの実験は、提案アーキテクチャがより高速な収束とより高い成功率を達成することを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:15:31 GMT)
Inference-time Stochastic Refinement of GRU-Normalizing Flow for Real-time Video Motion Transfer [0.7] 没入型ゲームのようなリアルタイムビデオモーション転送アプリケーションは、現実的な合成と堅牢な下流決定を支援するために、正確かつ多様な将来予測を必要とする。
このような逐次予測の多様性を改善するために,GRU-NF(Gated Recurrent Unit-Normalizing Flows)とサンプリング手法を組み合わせた新しい推論時間改善手法を提案する。
GRU-SNF(Gated Recurrent Unit- Normalizing Flows, GRU-SNF)は,より長い予測地平線の下でも精度を犠牲にすることなく,多様な出力を生成する上で,GRU-NFより優れていることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:47:30 GMT)
Quench dynamics of the quantum XXZ chain with staggered interactions: Exact results and simulations on digital quantum computers [0.7] 量子$S=1/2$ XXZ反強磁性鎖におけるクエンチダイナミクスについて検討した。
我々はベルベースで作業することで任意の偶数系サイズに対して正確な時間依存状態を得る。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:14:54 GMT)
DrP: Meta's Efficient Investigations Platform at Scale [0.6] DrPは、調査を自動化するエンドツーエンドのフレームワークとシステムである。
コードでプレイブックを調査する,表現力のあるフレキシブルなSDKで構成されています。
DrPは過去5年間本番環境で稼働し、1日に50Kの自動分析を実行している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 20:34:51 GMT)
Decentralized Social Media and Artificial Intelligence in Digital Public Health Monitoring [0.6] 我々は、デジタル公衆衛生監視は、新しいプラットフォームと方法論を採用することで適応する必要があると論じる。
我々は、代替データソースとして、MastodonやBlueskyといった分散型ソーシャルネットワークの台頭について論じる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:54:59 GMT)
Technical Report on Text Dataset Distillation [0.6] テキストデータセットの蒸留は、当初、ビジョン宇宙からの努力の適応として成長した。
近代的なアプローチの大きな進歩にもかかわらず、この分野は成熟段階にある。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:58:44 GMT)
Defense That Attacks: How Robust Models Become Better Attackers [0.6] 本研究は, 対人訓練が意図せず, 対人訓練の伝達可能性を高めるかどうかを考察する。
逆向きに訓練された(AT)モデルは、標準モデルよりも効果的に伝達される摂動を生成する。
我々は、ロバスト性評価は、移動攻撃に対するモデルの抵抗だけでなく、移動可能な敵の例を生成するための正当性も評価すべきであると主張している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:56:37 GMT)
Convergence for Discrete Parameter Updates [0.6] 量子化されたトレーニングは、低ビット整数でトレーニングコンポーネントを表現することでこの問題に対処するが、通常は実際の値更新を判断することに依存する。
我々は、更新ルール自体が離散的な別のアプローチを導入し、設計による継続的更新の定量化を避ける。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:34:26 GMT)
Polynomiogram: An Integrated Framework for Root Visualization and Generative Art [0.6] Polynomiogramは、ルートシステムからアートを探索、視覚化、生成するための統合計算プラットフォームである。
このフレームワークは2つの相補的な数値エンジンを統合している。高速で大規模な計算のためのNumPy共役行列ソルバと、高精度で科学的に厳密な検証のためのMPである。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:03:16 GMT)
Us-vs-Them bias in Large Language Models [0.6] 基礎的大言語モデル間で、一貫した内集団陽性および外集団陰性な関連を見いだす。
調査対象者は,保守的ペルソナは対人関係が強く,リベラルなペルソナは対人関係が強かった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:11:22 GMT)
Federated Learning and Trajectory Compression for Enhanced AIS Coverage [0.5] VesselEdgeは、容器をモバイルセンサーに変換し、リアルタイムの異常検出と効率的なデータ伝送を可能にする。
システムは、連合学習のためのM3fedモデルと、軌道圧縮のためのBWC-DR-Aアルゴリズムを統合する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:10:07 GMT)
A Hybrid Deep Learning Framework with Explainable AI for Lung Cancer Classification with DenseNet169 and SVM [0.5] 本研究では, 深層学習に基づく肺がん自動分類システムを提案する。
DenseNet169とSVMモデルは98%の精度を達成した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:48:56 GMT)
Look, Recite, Then Answer: Enhancing VLM Performance via Self-Generated Knowledge Hints [0.5] 「Look, Recite, Then Answer」は、視覚言語モデルを強化するパラメータ効率のよいフレームワークである。
AgroBenchでは,Qwen2-VL-72Bでの雑草同定精度を23.52%向上し,検索オーバーヘッドを伴わずにGPT-4oを上回った。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 02:28:20 GMT)
An end-to-end quantum algorithm for nonlinear fluid dynamics with bounded quantum advantage [0.5] 我々は非圧縮性格子ボルツマン方程式の新しいアルゴリズムを開発した。
エンド・ツー・エンドの問題に対しては、選択した観測値に対して、控えめな量子優位性を保持することができる。
我々の結果は、CFDの文脈において、小さいが非自明な量子上の利点が達成できるという確固たる証拠を与える。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:03:08 GMT)
VS-Graph: Scalable and Efficient Graph Classification Using Hyperdimensional Computing [0.4] 本稿では,HDCの効率性とメッセージパッシングの表現力とのギャップを狭めるベクトル記号グラフ学習フレームワークであるVS-Graphを提案する。
提案手法は,従来のHDCベースラインを標準ベンチマークで4-5%上回り,最新のGNNと競合する精度を実現している。
また、GNNベースラインのパフォーマンスを複数のデータセットで一致または超過し、最大450倍の速度でトレーニングを加速する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:03:44 GMT)
Idea-Gated Transformers: Enforcing Semantic Coherence via Differentiable Vocabulary Pruning [0.4] 本稿では,セマンティックプランニングと構文生成を分離した新しいアーキテクチャであるIdean-Gated Transformerを紹介する。
本稿では,意味的に無関係なトークンを抑え,検索空間をリアルタイムで効果的に刈り取る,微分可能なゲーティング機構を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:17:07 GMT)
Meta-Continual Mobility Forecasting for Proactive Handover Prediction [0.4] 短期移動予測は、セルネットワークにおけるアクティブハンドオーバ(HO)のコア要件である。
本稿では,GRUベースの予測器と高速な数ショット適応のためのReptileメタ初期化と,ドリフトの発生時にのみコンパクトなオンライン更新をトリガするEWMA残差検出を統合した軽量なメタコンチネンタル予測フレームワークを提案する。
モデルは軽量(128kパラメータ)で、5Gおよび6Gシステムのエッジ展開に適している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:48:20 GMT)
Benchmarking CXR Foundation Models With Publicly Available MIMIC-CXR and NIH-CXR14 Datasets [0.4] この研究は、パブリックMIMIC-CRとNIH ChestX-ray14データセットに2つの大規模胸部X線埋め込みモデル(CXR)をベンチマークする。
トレーニング済みエンコーダから直接埋め込みを抽出し,複数ラベルの軽量LightGBM分類器を訓練し,平均AUROC,F1スコアを95%の信頼区間で報告した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:55:44 GMT)
ExOAR: Expert-Guided Object and Activity Recognition from Textual Data [0.3] ExOAR(Expert-Guided Object and Activity Recognition)は、大規模言語モデル(LLM)と人間の検証を組み合わせたインタラクティブな手法で、テキストデータからオブジェクトやアクティビティを識別する。
ExOARは、非構造化テキストデータと構造化ログの間のギャップを、オブジェクト中心のプロセス分析に必要な明確なセマンティクスで効果的に橋渡しできることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:40:17 GMT)
Numerical simulation of coherent spin-shuttling in a QuBus with charged defects [0.3] 我々は,Si/SiGeにおけるコンベヤモードシャットリングのスピンコヒーレンスに及ぼすデバイス欠陥の影響をシミュレーションツールで調査する。
我々は、Si/SiGeヘテロ構造に配置されたスパースおよび単独電荷の点欠陥の影響下で、移動電子スピン量子ビットの量子進化をシミュレートする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:16:40 GMT)
Flowchart2Mermaid: A Vision-Language Model Powered System for Converting Flowcharts into Editable Diagram Code [0.3] Flowchart2Mermaidは、フローチャート画像を編集可能なMermaidjsコードに変換する軽量なWebシステムである。
インターフェースはインラインテキスト編集、ドラッグ・アンド・ドロップノード挿入、統合AIアシスタントによって解釈される自然言語コマンドによる混合初期化をサポートする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:47:04 GMT)
PULSE: A Unified Multi-Task Architecture for Cardiac Segmentation, Diagnosis, and Few-Shot Cross-Modality Clinical Adaptation [0.3] PULSEは、自己教師付き表現に基づいて構築され、複合的な監視戦略によって最適化されたマルチタスク視覚言語フレームワークである。
マルチスケールトークン再構成デコーダは解剖学的セグメンテーションを可能にし、共有グローバル表現は疾患分類と臨床背景テキスト出力をサポートする。
従来のタスク固有のパイプラインとは異なり、PULSEはタスク不変の心臓前兆を学習し、データセット間で堅牢に一般化し、最小限の監視で新しい画像モダリティに適応することができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:49:01 GMT)
A Comprehensive Study on the Impact of Vulnerable Dependencies on Open-Source Software [0.3] 我々は、Java、Python、Rust、Go、Ruby、JavaScriptといった複数の言語からなる約50万のリリースで、1万以上のオープンソースプロジェクトについて調査を行った。
私たちの目標は、これらの脆弱性の深刻さ、永続性、分散性、およびチームやコントリビュータのサイズ、アクティビティ、リリースサイクルといったプロジェクトメトリクスとの相関性を調べることです。
このアプローチを使うことで、ライブラリのバージョンや依存性の深さ、既知の脆弱性、そしてソフトウェア開発サイクルを通じてどのように進化したかといった情報を提供できるのです。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:20:10 GMT)
Manifold Percolation: from generative model to Reinforce learning [0.3] 生成的モデリングは通常、学習マッピング規則としてフレーム化されるが、これらの規則にアクセスできない観察者の視点からすると、そのタスクは確率分布から幾何学的支援を引き離すことになる。
本研究は, サンプリングプロセスが, 高次元密度推定を支持面上の幾何カウント問題に効果的に投射するので, 連続体パーコレーションは, この支援解析に一意に適していることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:26:14 GMT)
Formal Analysis of the Sigmoid Function and Formal Proof of the Universal Approximation Theorem [0.3] 我々はシグモイド関数の形式化を示し、その単調性、滑らか性、高階微分を証明した。
本稿では、シグモダルアクティベーション関数を持つニューラルネットワークが、任意の連続関数をコンパクトな間隔で近似できることを示すユニバーサル近似定理の構成的証明を提案する。
我々の研究はニューラルネットワークの信頼性を高め、検証され信頼性の高い機械学習というより広い目標に貢献する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:16:02 GMT)
Closing the problem of which causal structures of up to six total nodes have a classical-quantum gap [0.3] 古典的に達成できない量子相関が存在するかどうかという疑問が解き放たれた6個以下のノードを持つ唯一の因果構造について検討する。
このような量子相関は、相関にさらなる制約を課す手法を用いて存在することを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:44:25 GMT)
LM-CartSeg: Automated Segmentation of Lateral and Medial Cartilage and Subchondral Bone for Radiomics Analysis [0.3] LM-CartSegは軟骨/骨分割、幾何学的側面/メディカル区画化、放射線分析のための完全自動パイプラインである。
結果: OAIZIB-CMのマクロASSDは2.63mmから0.36mm,HD95は25.2mmから3.35mmに改善され,DSC 0.91,SKI-10のゼロショットデータセットは0.80であった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:07:56 GMT)
Parameter efficient hybrid spiking-quantum convolutional neural network with surrogate gradient and quantum data-reupload [0.2] Spiking Quantum Neural Network(SQNN)は、スパイクニューラルネットワーク(SNN)と量子コンピューティングの原則を組み合わせたものだ。
SQDR-CNNは、単一のバックプロパゲーションフレームワーク内で畳み込みSNNと量子回路の共同トレーニングを可能にする。
我々は,SOTA SNNベースラインの平均最高性能精度の86%を達成しているが,最小スパイキングモデルのパラメータの0.5%しか使用していない。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:43:33 GMT)
Hybrid Temporal-8-Bit Spike Coding for Spiking Neural Network Surrogate Training [0.2] スパイキングニューラルネットワーク(SNN)は、計算神経科学と人工知能において有望な方向として登場した。
近年の研究では、ハイブリットレート・テンポラルコーディング戦略は、サロゲートバックプロパゲーションでトレーニングした際の性能を著しく向上させることができることが示されている。
本研究では,ビット平面分解と時間符号の原理を統合するハイブリッド時間ビットスパイク符号化法を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:29:26 GMT)
Benchmark for Planning and Control with Large Language Model Agents: Blocksworld with Model Context Protocol [0.2] 我々はBlocksworld問題を表す実行可能なシミュレーション環境を備えたベンチマークを導入する。
Model Context Protocol(MCP)を標準化されたツールインターフェースとして統合することで、多様なエージェントアーキテクチャをベンチマークに接続し、評価することができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:49:14 GMT)
A comparison between initialization strategies for the infinite hidden Markov model [0.2] 無限隠れマルコフモデルは、構造的変化と複雑な力学を持つ時系列をモデル化するための柔軟なフレームワークを提供する。
ビームサンプリングは動的プログラミングとスライスサンプリングを組み合わせて無限状態空間を適応的に切り離す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:30:04 GMT)
OnSight Pathology: A real-time platform-agnostic computational pathology companion for histopathology [0.2] OnSight Pathologyは、連続的なカスタムスクリーンキャプチャーを利用する、プラットフォームに依存しないコンピュータビジョンソフトウェアである。
OnSight Pathologyは、複雑なソフトウェアを統合することなく、コンシューマグレードのパーソナルコンピュータ上でローカルに動作する。
OnSight Pathologyが、幅広い病理パイプラインにわたってリアルタイムAI推論を実現する方法を示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:02:08 GMT)
Quantum Topological Graph Neural Networks for Detecting Complex Fraud Patterns [0.1] 大規模金融ネットワークにおける不正取引を検出するための新しいQTGNNフレームワークを提案する。
量子埋め込み、変分グラフ畳み込み、およびトポロジカルデータ解析を統合することで、QTGNNは不正を示す複雑なトランザクションダイナミクスと構造異常をキャプチャする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:38:21 GMT)
HieroGlyphTranslator: Automatic Recognition and Translation of Egyptian Hieroglyphs to English [0.1] 本稿では,古代エジプトのヒエログリフを画像から英語に自動認識・翻訳する手法を提案する。
このモデルはBLEUスコア42.2を達成したが、これは以前の研究と比べて大きな結果となった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:05:18 GMT)
Addressing Logical Fallacies In Scientific Reasoning From Large Language Models: Towards a Dual-Inference Training Framework [0.1] 大規模言語モデル(LLM)は自然言語処理を変革し、科学、医療、意思決定の進歩への期待が高まっている。
本稿は,2つのコントリビューションを行う。まず,主要なプラットフォームから存在するLCMが,否定や反例,あるいは欠陥のある前提で科学的領域を推論する際に,体系的な弱点を示すことを示す。
第二に、肯定生成と構造化反事実否定を統合する二重推論トレーニングフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:50:39 GMT)
Crossing the Sim2Real Gap Between Simulation and Ground Testing to Space Deployment of Autonomous Free-flyer Control [0.1] 強化学習(Reinforcement Learning, RL)は、宇宙におけるロボット制御の変革的なポテンシャルを提供する。
国際宇宙ステーション(ISS)の無人飛行ロボット、NASA AstrobeeのRLによる自律制御の初の軌道上でのデモンストレーションを紹介する。
NVIDIAのOmniverse物理シミュレータとカリキュラム学習を使用して、Astrobeeの標準姿勢と翻訳制御を置き換えるために、ディープニューラルネットワークをトレーニングし、微小重力でナビゲートできるようにしました。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:33:35 GMT)
Autonomous Planning In-space Assembly Reinforcement-learning free-flYer (APIARY) International Space Station Astrobee Testing [0.1] 米国海軍研究所(NRL)の自律計画宇宙組み立て強化学習(APIary)実験は、宇宙のゼロ重力環境における自由飛行ロボットの制御に強化学習(RL)を用いることを開拓した。
2025年5月27日火曜日、NASAのアストローブ・ロボットが国際宇宙ステーション(ISS)に着陸した。
アクター・クリティカルを用いた頑健な自由度制御政策(DOF)の訓練
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:16:52 GMT)
Deformed LDPC codes with spontaneously broken non-invertible duality symmetries [0.1] 低密度パリティチェック符号の対称性保存変形を提案する。
変形に伴う特別な点を興味深い特徴で同定する。
我々の結果は、既知の数値結果とともに、位相図に三臨界点が存在することを示唆している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:00:06 GMT)
Runnable Directories: The Solution to the Monorepo vs. Multi-repo Debate [0.0] Causify Devはモノレポ戦略とマルチレポ戦略の両方の重要なメリットを統合するハイブリッドアプローチである。
統合されたシン環境によってバックアップされた実行可能なディレクトリは、一貫したセットアップ、独立した依存関係、効率的なCI/CDプロセスを可能にする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:03:32 GMT)
"All You Need" is Not All You Need for a Paper Title: On the Origins of a Scientific Meme [0.0] 我々は'All You Need'を含む717のarXivプレプリントをそのタイトルで分析する。
正統的な「X [Is] All You Need」構造に従う論文の中では、「注意」が最も頻繁に主張される(28件)。
我々は、このパターンの成功は、精度よりも記憶可能性の方がますます好まれる科学コミュニケーションにおける競争的な圧力を反映していると主張している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:36:45 GMT)
Prostate biopsy whole slide image dataset from an underrepresented Middle Eastern population [0.0] イラクのエルビルで収集した185例の前立腺針生検の339例について報告する。
スライドは、グリーソンのスコアと、3人の病理学者によって独立に割り当てられた国際尿路病理学の成績に関連付けられている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:54:14 GMT)
Widefield Quantum Sensor for Vector Magnetic Field Imaging of Micromagnetic Structures [0.0] 我々は、マイクロスケールデバイスからストライフィールドベクトルを再構成するために、カメラ互換のパルス光検出磁気共鳴プロトコルを実装した。
提案手法は, 83mathrmm×83mathrmm×828 pm 142)mathrmnT,Hz-1$の空間分解能と, 取得時間をわずか数分で達成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:46:36 GMT)
Vision Foundry: A System for Training Foundational Vision AI Models [0.0] Vision FoundryはコードフリーのHIPAA準拠のプラットフォームで、ビジョンモデルの事前トレーニング、適応、デプロイを民主化する。
高度な表現学習と実践的応用のギャップを埋めることで、Vision Foundryはドメインの専門家が最先端の臨床AIツールを開発することを可能にする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:02:22 GMT)
Tuning for TraceTarnish: Techniques, Trends, and Testing Tangible Traits [0.0] 攻撃スクリプト $textitTraceTarnish$ は、テキストベースのメッセージのオーサリングを匿名化するために、敵対的なスタイロメトリの原則を使用する。
Stylistometric cues--function-word frequency, Content-word distributions, and the Type-Token Ratio--は妥協の信頼できる指標として機能する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:39:40 GMT)
Tree-Preconditioned Differentiable Optimization and Axioms as Layers [0.0] Axioms-as-Layers"パラダイムは、ランダムユーティリティモデルの公理構造を直接ディープニューラルネットワークに埋め込む。
公理としてのレイヤー」パラダイムは、ペナルティに基づく手法に固有の構造的過適合を排除している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:47:37 GMT)
Thermodynamics of an Open $\mathcal{PT-}$Symmetric Quantum System [0.0] 一般の$mathcalPT-$symmetric Hamiltonianは、その共役と反可換関係に従う。
オープンシステムシナリオにおける$mathcalPT-$symmetric系の3つの熱力学則の整合性も解析した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:33:02 GMT)
Thermalization from quenching in coupled oscillators [0.0] 量子調和振動子を加熱する有限時間プロトコルを,まずは基底状態において,マクロな入浴を必要とせずに導入する。
このプロトコルは、量子熱力学実験と状態準備の迅速かつ制御された熱化のための有望なツールである。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:04:41 GMT)
The Treasury Proof Ledger: A Cryptographic Framework for Accountable Bitcoin Treasuries [0.0] 本稿では,多ドメインBitcoin宝庫のためのBitcoin対応ロギングフレームワークであるSecretary Proof Ledger(TPL)を紹介する。
TPLインスタンスは、スナップショットの保存の証明、ドメイン間の移動の検証のレシート、ポリシーメタデータを記録する。
我々は、TPLが責任ある透明性ポリシーと将来のビットコインの固定的通貨供給と整合した将来的な機関間チェックをどのようにサポートするかを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:14:06 GMT)
The Geometry of Benchmarks: A New Path Toward AGI [0.0] 本稿では,AIエージェントのすべての心理測定バッテリーを,構造化されたモジュライ空間の点として扱う幾何学的枠組みを提案する。
まず、測定可能なパフォーマンスに基づいて、Kardashevスタイルの自律性階層であるAutonomous AI(AAI)スケールを定義します。
第二に、バッテリーのモジュライ空間を構築し、エージェントの順序や能力推定のレベルで区別できないベンチマークの等価クラスを特定する。
第3に、強化学習、自己再生、討論、検証に基づく微調整を前提としたジェネラルジェネレータ-検証更新演算子(GVU)を導入する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:34:09 GMT)
TARA Test-by-Adaptive-Ranks for Quantum Anomaly Detection with Conformal Prediction Guarantees [0.0] 量子鍵分布(QKD)のセキュリティは、古典的な盗聴者シミュレーションと真の量子相関を区別する能力に依存する。
量子異常検出のための整合予測とシーケンシャルマーチンゲール検定を組み合わせた新しいフレームワークであるTARAを紹介する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:53:38 GMT)
Superconducting Parametric Amplifiers: Resonator Design and Role in Qubit Readout [0.0] 超伝導パラメトリック増幅器(SPAs)は、量子コンピューティングにおける超低雑音量子ビット読み出しにおいて重要な要素である。
古典的な増幅器とは異なり、SPAは量子制限性能を達成または近づかせることができる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:02:05 GMT)
Stretched Exponential Scaling of Parity-Restricted Energy Gaps in a Random Transverse-Field Ising Model [0.0] 一次元ランダム逆場イジングモデルがパリティ制限部分空間においても拡張指数スケーリングに従うことを示す。
この結果が量子アニール問題に与える影響について論じる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:32:29 GMT)
State Space Models for Bioacoustics: A comparative Evaluation with Transformers [0.0] まず,マンバをベースとした音声大言語モデル(LLM)を,自己教師付き学習を用いて大規模コーパスで事前学習する。
我々はBEANSベンチマークでBioMambaを微調整し評価した。
その結果,BioMamba は AVES と同等の性能を示し,消費電力は VRAM よりも著しく少ないことがわかった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:37:09 GMT)
Soft Decision Tree classifier: explainable and extendable PyTorch implementation [0.0] PyTorch を用いたソフト決定木 (SDT) と短期記憶ソフト決定木 (SM-SDT) を実装した。
これらの手法はシミュレーションおよび臨床データセットで広範囲に試験された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:46:34 GMT)
SocraticAI: Transforming LLMs into Guided CS Tutors Through Scaffolded Interaction [0.0] 本稿では,大規模言語モデル(LLM)を学部コンピュータサイエンス教育に統合した足場型AI学習システムであるSocraticAIを紹介する。
このシステムは、ソクラティックな対話の足場を提供しながら、よく構造化された質問、反射的エンゲージメント、日々の使用制限を実行する。
最初の展開は、学生が2~3週間以内に曖昧なヘルプシーキングから高度な問題解決へと進むことを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:49:32 GMT)
Small Models Achieve Large Language Model Performance: Evaluating Reasoning-Enabled AI for Secure Child Welfare Research [0.0] 本研究では、言語モデルが児童福祉記録における関心構造を正確に識別できるかどうかを検証するための、体系的なベンチマークフレームワークを開発する。
児童福祉調査サマリーにおけるリスク要因の同定のための4つの指標を構築した。
コーエンのカッパは、人間の専門家によって確立された金の標準分類との合意を測定した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 20:59:54 GMT)
Semantic Nutrition Estimation: Predicting Food Healthfulness from Text Descriptions [0.0] 本稿では、テキスト記述から包括的食品コンパススコア2.0(FCS)を予測する機械学習パイプラインを提案する。
このアプローチでは、マルチヘッドニューラルネットワークを使用して、セマンティックテキスト埋め込み、語彙パターン、ドメインを組み合わせたハイブリッドな特徴ベクトルを処理する。
このシステムは予測力を強く示し、個々の栄養素に対する中央値R2が0.81に達する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:02:55 GMT)
Quantum Max Cut for complete tripartite graphs [0.0] 量子マックス=$d$-Cut(d$-QMC)問題は、局所的なハミルトン問題の特別な例である。
この記事では、小さな局所次元に対する完全三部グラフに対する$d$-QMC問題を、$d le 3$で解決する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:37:48 GMT)
Quantum Hash Function Based on Spectral Properties of Graphs and Discrete Walker Dynamics [0.0] 我々は、メッセージ誘発グラフから高エントロピー指紋を生成する新しい量子スペクトルハッシュアルゴリズム、Quantum Graph Hash (QGH-256)を提案する。
4×4トロイダルグリッドにQGH-256を実装し、より小さなグリッドは衝突を示し、大きなグリッドは実行時間を著しく増加させる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:05:27 GMT)
Quantum Diplomacy within the Southeast Asia Quantum Ecosystem [0.0] 本稿では,マレーシアの量子ランドスケープの概要と地域イニシアチブの概要について述べる。
次に、マレーシアの量子研究における強みを分析し、地域生態系を強化するための4つの勧告を提示します。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:11:28 GMT)
Quantum Algorithm for Searching for the Longest Segment and the Largest Empty Rectangle [0.0] 本稿では, 最大エンプティ正方形問題に対する量子アルゴリズムと, 固定幅$d$ for $ntimes n$-rectangular map の最大エンプティ矩形について述べる。
その問題に対する二次的なスピードアップを得る。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:37:50 GMT)
Quantitative Analysis of Technical Debt and Pattern Violation in Large Language Model Architectures [0.0] 本研究では,AI合成システムにおける「建築エロージョン」と技術的負債の蓄積を計測する最初の経験的枠組みを提案する。
プロプライエタリなモデルは高いアーキテクチャ適合性を実現する一方で、オープンウェイトモデルは重要なばらつきを示す。
これらの結果から, システムスキャフォールディングに小型オープンウェイトモデルを用いることで, 構造的技術的負債の蓄積が促進されることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:24:02 GMT)
Primitive Vector Cipher(PVC): A Hybrid Encryption Scheme based on the Vector Computational Diffie-Hellman (V-CDH) Problem [0.0] Primitive Vector Cipher (PVC)は、新しいハイブリッド暗号方式である。
セキュリティはベクトル計算ディフィー・ヘルマン問題(V-CDH)の確立した硬さに基づいている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 20:09:06 GMT)
Polarization by Design: How Elites Could Shape Mass Preferences as AI Reduces Persuasion Costs [0.0] 民主主義においては、主要な政策決定は通常、何らかの形態の多数派またはコンセンサスを必要とするため、エリートは統治のために大衆の支持を確保する必要がある。
我々は,政策選好の分布を,説得コストと過半数ルール制約を条件として,どの程度の政策選好を形成すべきかを選択するモデルを開発する。
一人のエリートで、最適な介入は、社会をより分極化された意見プロファイル(偏極プル)へと押し上げる傾向がある。」
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:33:26 GMT)
Phase-space open-systems dynamics of second-order nonlinear interactions with pulsed quantum light [0.0] 非線形要素の入力と出力における量子状態の関係を計算するための効率的な枠組みを提案する。
ここで提示される方法は、ブロードバンド量子状態の増幅や周波数変換の最適化に利用できる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:30:48 GMT)
Phase Transitions without gap closing in monitored quantum mean-field systems [0.0] 大規模演算子の射影的測定をユニタリ進化と交互に行う多体量子系のモニタリング力学について検討する。
従来の無限温度状態とは別個の新しい定常状態を発見し、無限体積極限を取ることによって生じる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:17:48 GMT)
Performance and Efficiency of Climate In-Situ Data Reconstruction: Why Optimized IDW Outperforms kriging and Implicit Neural Representation [0.0] 本研究は, 温暖な気候データに対する3つの再構成手法について検討した。
その結果, 再構成精度と計算効率の両面で, 他の参照手法よりも単純なIDW法の方が優れていることが示された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:40:29 GMT)
PARC: An Autonomous Self-Reflective Coding Agent for Robust Execution of Long-Horizon Tasks [0.0] 我々は長軸計算タスクの自律実行のための符号化エージェントである PARC を紹介する。
我々は計算科学とデータサイエンスのタスク間でPARCを評価する。
その結果、階層型マルチエージェントシステムと自己評価と自己フィードバックの統合の可能性を強調した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:15:10 GMT)
Optimizing two-qubit gates for ultracold fermions in optical lattices [0.0] 二重井戸電位に閉じ込められたフェルミオンリチウム原子の衝突ゲートを最適化する。
1次元閉じ込めシミュレーションに基づいて高忠実度ゲートを得る。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:31:16 GMT)
Non-radiative energy transfer between boron vacancies in hexagonal boron nitride and other 2D materials [0.0] 六方晶窒化ホウ素(hBN)のホウ素原子価(V_B-$)は、2次元量子センサーのための有望なプラットフォームとして出現している。
V_B-$中心と単層グラフェンまたは2D半導体間の非放射性フラスター共鳴エネルギー伝達(FRET)について検討した。
興味深いことに、FRETレートは3nm以上のhBNセンシング層では無視でき、超薄型量子センサーに統合するためのV_B-$センターの可能性を強調している。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:02:07 GMT)
More is uncorrelated: Tuning the local correlations of SU($N$) Fermi-Hubbard systems via controlled symmetry breaking [0.0] アルカリ性原子をベースとした低温原子実験により,多数の成分を持つハバード模型を実験的に実現するためのツールが提供される。
我々は,大域的ハーフフィリングにおけるモット遷移に着目し,粒子間の局所的相関を特徴付ける。
動的平均場理論を用いて、SU(4) 系は SU(2) 系よりもかなり小さい相関関係を持つことを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:28:22 GMT)
Modelling the Impact of Device Imperfections on Electron Shuttling in SiMOS devices [0.0] リアルなSiMOSデバイスでコンベアベルト・チャージシャットリングの3次元シミュレーションを行う。
我々は, 酸化物界面粗さ, ゲート形成不良, 輸送路沿いの電荷欠陥など, 典型的なSiMOSデバイスの可能性に注目した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:53:12 GMT)
Mobility Induced Sensitivity of UAV based Nodes to Jamming in Private 5G Airfield Networks An Experimental Study [0.0] 本研究では,UAVをベースとしたUEノードを標的とした指向性SDRジャミング攻撃下でのプライベート5G飛行場ネットワークの性能評価を行った。
クアッドコプターUAVのペイロードとして搭載されたQuariPoc Android UEを用いて,定方向ジャミングの存在下での信号劣化,ハンドオーバ性能,サーデバイス安定性を評価する一連の実験を行った。
この研究の再調査では、プライベート5Gエアフィールドネットワークにおける自律および自動動作中のUAVベースのUEノードのモビリティのレベルに起因するリンク安定性と信号劣化依存性について記述した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:56:49 GMT)
Mapping Data Labour Supply Chain in Africa in an Era of Digital Apartheid: a Struggle for Recognition [0.0] 本研究は、この産業のスコープとアフリカコンテンツモデレーション労働者の労働条件の理解のギャップについて論じる。
調査の結果,アフリカ55か国中43か国でコンテンツモデレーションが実施されている。
我々は,アフリカにおけるコンテンツモデレーション産業の包括的地図を初めて提供し,その状況の文書化において労働者の集団行動を集中させる参加的方法論を実証する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:19:32 GMT)
Maestro: Intelligent Execution for Quantum Circuit Simulation [0.0] Maestroは量子回路シミュレーションのための統一インターフェースである。
状態ベクトル、MPS、テンソルネットワーク、安定化器、GPUアクセラレーション、pブロックメソッドなど、複数のシミュレーションパラダイムを統合している。
Maestroには、回路構造と利用可能なハードウェアに基づいて最適なシミュレータを自動的に選択する予測ランタイムモデルが含まれている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:39:51 GMT)
Machine Learning to Predict Slot Usage in TSCH Wireless Sensor Networks [0.0] 本研究は、TSCHプロトコルに基づいて、ネットワークで生成されたトラフィックパターンを機械学習で学習することを提案する。
典型的なツリーネットワークトポロジにおいて、機械学習モデルが異なるネットワークレベルで優れた予測を行う能力について、深く分析した。
解析アルゴリズムはTSCHネットワークの電力消費をさらに効果的に低減するために好適に利用できる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:50:02 GMT)
Limits of Perturbation Theory for Multimode Light Propagation in Dispersive Optical Cavities [0.0] 光学キャビティにおける群速度分散(GVD)の役割に着目した。
同期励起分散キャビティにおけるGVD効果の摂動理論に基づく解析手法を提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 22:16:41 GMT)
Lifting the Cage of Consent: A Techno-Legal Perspective on Evolvable Trust Relationships [0.0] 私たちのデータは十分に流れていないので、疑わしい、しばしば違法なショートカットへの依存を育んでいる、と私たちは主張する。
本稿では,不確定な承諾の妄想に対して,進化可能な信頼システムの実現をスケーラブルな代替手段として提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:05:18 GMT)
Leveraging LLMs for Structured Data Extraction from Unstructured Patient Records [0.0] 手動チャートのレビューは、臨床研究において非常に時間がかかり、資源集約的な要素である。
局所展開型大規模言語モデル(LLM)を利用した臨床ノートからの自動特徴抽出のためのフレームワークを提案する。
このフレームワークは、手動のチャートレビューの負担を軽減し、データキャプチャの一貫性を向上させるLLMシステムの可能性を示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:10:12 GMT)
Learning Single-Image Super-Resolution in the JPEG Compressed Domain [0.0] 本稿では,JPEGの完全復号化に伴う計算オーバーヘッドを低減し,JPEGの符号化機能を直接トレーニングするモデルを提案する。
本稿では、周波数領域におけるJPEG離散コサイン変換(DCT)係数を利用する軽量超解像パイプラインを提案する。
当社のパイプラインでは、データロードの2.6倍のスピードアップとトレーニングの2.5倍のスピードアップを実現しています。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:51:57 GMT)
Laser-induced modulation of conductance in graphene with magnetic barriers [0.0] 電子がグラフェンシートを横切ると、2つの磁気障壁に遭遇し、その間の領域がレーザー光によって連続的に駆動される。
Floquet理論と伝達行列法を組み合わせることで、主エネルギーバンドと新興光子アシストサイドバンドの両方を通して電子伝達を追跡する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:12:45 GMT)
Knowing oneself with and through AI: From self-tracking to chatbots [0.0] 第1章では、アルゴリズムと人工知能が、私たちの実践である自己理解、自己理解、自己語りをいかに変えているかを説明します。
自己追跡アプリケーション、技術的に分散した自伝的記憶、そして大規模言語モデルとの物語的共構築です。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:22:31 GMT)
Improving Alignment Between Human and Machine Codes: An Empirical Assessment of Prompt Engineering for Construct Identification in Psychology [0.0] 本稿では,テキスト中のコンストラクタをインシデントエンジニアリングで識別するために,インシデント性能を最適化するための実証的フレームワークを提案する。
提案手法は,コードブックによる経験的プロンプト選択,自動プロンプトエンジニアリング,ペルソナプロンプト,チェーンオブ思考推論,説明的プロンプトという5つのプロンプト戦略を実験的に評価した。
3つの構成と2つのモデルで、分類は専門家の判断に最も適しており、コードブックに誘導された経験的プロンプト選択と自動プロンプトエンジニアリングを組み合わせた数発のプロンプトから生まれた。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:07:42 GMT)
Image Theory for the Single Bounce Quantum Gravimeter [0.0] 我々は最近提案された単一バウンス量子重力計の画像理論を開発する。
物質波束の自由落下と量子バウンスは、連続エネルギーに基づく分解によって記述される。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 16:48:11 GMT)
Hybridized-Mode Parametric Amplifier in Kinetic-Inductance Circuits [0.0] NbTiNおよびNbN薄膜から作製した容量結合Kerr非線形共振器を用いた2モード速度インダクタンス増幅器
その結果、ブロードバンド、高出力、磁気抵抗量子制限増幅のためのロバストなプラットフォームとして、共振インダクタンス共振器が確立された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:56:00 GMT)
Hybrid twinning using PBDW and DeepONet for the effective state estimation and prediction on partially known systems [0.0] 本研究では,物理に基づくモデリングとデータ駆動学習を組み合わせ,状態推定を強化する効果的なハイブリッド手法を提案する。
ヘルムホルツ方程式を含む代表問題に対する提案手法を検証した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:19:00 GMT)
Hierarchical Attention for Sparse Volumetric Anomaly Detection in Subclinical Keratoconus [0.0] 階層型アテンションモデルは2D, 3D CNN, ViTの双方のパフォーマンスを上回り, より優れたパラメータ効率の帰納バイアスを与えることを示す。
力学解析により、この利点は正確な空間スケールアライメントに由来することが判明した。
その結果,将来的なボリューム異常検出システムの設計指針が得られた。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:20:13 GMT)
Hey GPT-OSS, Looks Like You Got It - Now Walk Me Through It! An Assessment of the Reasoning Language Models Chain of Thought Mechanism for Digital Forensics [0.0] 新しい推論言語モデルが登場し、内部推論機構を通じて論理ベースのタスクを処理するように設計されている。
本稿では,デジタル法医学における言語モデル推論の可能性について考察する。
結果説明責任を支えるために, 推論部品のユーザビリティを評価するために, テストケースを4つ検討した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 20:46:32 GMT)
Geometrical structure of the Wigner flow information quantifiers and hyperbolic stability in the phase-space framework [0.0] 定常性、古典性、純粋性、渦性の量化子は、ワイル・ウィグナー・フレームワーク内の位相空間微分幾何学的構造から導かれる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:06:09 GMT)
Fully quantum theory of strong-field driven tunable entangled multi-photon states in HHG [0.0] 我々はHHGにおける絡み合い測定のための完全な量子理論を開発し、光-物質相互作用ハミルトニアンを正確に解く。
近年の研究では、Rエンタングルメントパラメータが低閾値高調波に対するレーザーパワーの増加とともに減少することを示す理論の定性的な一致に達した。
我々の研究は、HHGにおける絡み合いの特徴を探究する上での最先端技術を確立し、Truly-quantumの多光子状態の分析と工学のための舗装方法を確立した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:16:24 GMT)
Fine-Tuning ChemBERTa for Predicting Inhibitory Activity Against TDP1 Using Deep Learning [0.0] チロシルDNAホスホジエステラーゼ1(TDP1)に対する小分子の作用を予測することは、初期の薬物発見において重要な課題である。
本稿では,ChemBERTaの微調整によるpIC50値の定量的回帰のためのディープラーニングフレームワークを提案する。
提案手法は、回帰精度と仮想スクリーニングユーティリティの両方において、古典的ベースラインのランダム予測よりも優れている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 20:42:22 GMT)
Fast & Efficient Normalizing Flows and Applications of Image Generative Models [0.0] 理論は、生成モデルの効率を向上すること、特にフローの正規化、および現実のコンピュータビジョンの課題を解決するために生成モデルを適用することである。
第1部では,6つの重要なイノベーションを通じて,フローアーキテクチャの正規化に関する大幅な改善が紹介されている。 1) 数学的に証明された必要条件と可逆性のための十分な条件を備えた3x3畳み込み層の開発,2) より効率的な擬似結合層の導入,3) kxk畳み込み層のための高速かつ効率的な並列反転アルゴリズムの設計,4) 畳み込み逆転用高速かつ効率的な逆プロパゲーションアルゴリズム,5) 逆畳み込みの逆利用
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:29:03 GMT)
Fare Comparison App of Uber, Ola and Rapido [0.0] このプロジェクトでは、最も有益な乗車を選ぶのに役立つWebアプリケーションを提供しています。
バックエンドはデータを取得するために使用され、ユーザは乗車の運賃比較を提供し、最後にPythonを使ってベストなオプションを提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:48:33 GMT)
Experimental quantum voting using photonic GHZ states [0.0] 量子通信プロトコルは、調整や通信タスクに量子システムのユニークな特性を活用しようとしている。
我々は、最近提案された選挙プロトコルを実験的に実装し、潜在的中央機関を含む誰も、自分以外の有権者の好む候補者を知らない。
我々は4党の選挙を行い、4党のGHZ州を$approx 89%の忠実度で生成、分配し、有権者の意図を記録することに成功した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:47:21 GMT)
Epistemic Substitution: How Grokipedia's AI-Generated Encyclopedia Restructures Authority [0.0] 4世紀前、ウィキペディアの分散化、クラウドソース化、コンセンサス駆動型モデルは、百科事典知識の集中化、専門家主導、権威に基づく標準に取って代わった。
グロキペディアのような生成的AI百科事典の出現は、キュレーションにおける別の潜在的なシフトを示す可能性がある。
本研究では,AIと人為的な百科事典が同一の権威基盤に依存しているかどうかを考察する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 01:05:32 GMT)
Entanglement membrane in the Brownian SYK chain [0.0] 我々は, 可溶性カオス大量N$モデル, ブラウンSYK鎖の膜記述を導出した。
この結果は,絡み合い膜に対する新たな視点を与え,量子情報力学とスクランブルの新たな関係を明らかにする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:00:14 GMT)
Entanglement Detection with Rotationally Covariant Measurements - From Compton Scattering to Lemonade [0.0] 回転対称性によってのみ特定される測定装置における偏光子の絡み合いの検出について検討した。
以上の結果から,レモネード系検出器は絡み検出に適していることが示唆された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 17:14:51 GMT)
Enhancing next token prediction based pre-training for jet foundation models [0.0] 次のトークン予測はジェット基礎モデルのための魅力的な事前訓練タスクである。
シミュレーションフリーで、データセット間で転送可能な優れた生成機能を実現する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:00:00 GMT)
Enhancing Instruction-Following Capabilities in Seq2Seq Models: DoLA Adaptations for T5 [0.0] この作業は、T5およびFLAN-T5モデルファミリにDoLaを適応させ、モデルの命令追従能力への影響を評価する。
この結果から,DoLaはタスクの特定のカテゴリに対するテキスト生成の忠実度を向上し,他人を傷つけることを示す。
これらの結果を理解するために、トークン出力確率に対するDoLaの影響を定量化するために、FLAN-T5モデルにおけるロジット進化の層間層間解析を行う。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 13:54:11 GMT)
Energy-Scaled Zero-Noise Extrapolation for Gottesman-Kitaev-Preskill Code [0.0] エネルギースケールゼロノイズ外挿(Energy-Scaled Zero-Noise Extrapolation、ES-ZNE)は、GKP符号の平均光子数をチューナブルな有効雑音パラメータとして使用する量子エラー緩和プロトコルである。
ES-ZNEは有限エネルギー誤差の軽減に成功し, 浅い雑音状態における理想的な期待値の回復を図った。
これらの結果は、ES-ZNEを、短期ボソニック量子プロセッサの性能向上のための実用的なソフトウェアベースの戦略として確立する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:08:20 GMT)
Educational Cone Model in Embedding Vector Spaces [0.0] 本研究では,テキストの多様性が低いという仮定に基づく幾何学的枠組みである教育円錐モデルを提案する。
モデルでは, 構造的難易度に基づくパターンの検出を目的とし, 埋め込みを最適化問題として評価する。
実世界のデータセットに関する実証テストは、難解な注釈付き教育用テキストに最も適した埋め込みスペースを特定する際のモデルの有効性と速度を検証する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:47:08 GMT)
Edge bits in average symmetry protected topological mixed state [0.0] 平均対称性保護トポロジカル(ASPT)混合状態におけるエッジビットについて検討した。
我々は, エッジビットの挙動と, 様々なデコヒーレンスと摂動相互作用に対する頑健さを数値的に明らかにした。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:38:57 GMT)
Dynamic Optical Test for Bot Identification (DOT-BI): A simple check to identify bots in surveys and online processes [0.0] DOT-BI: 人間の動きの知覚を利用して、人間の回答者と自動システムとを区別する、迅速で簡単な方法。
DOT-BIでは、背景と同じランダムな白黒のテクスチャで「隠れた」番号を表示する。
最先端、ビデオ対応、マルチモーダルモデル(GPT-5-ThinkingとGemini 2.5 Pro)は正しい値の抽出に失敗した。
オンライン調査では、99.5% (181/182) の参加者がこの課題を解決し、エンドツーエンドの平均完了時間は10.7秒であった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:03:35 GMT)
Dynamic Modulation of Long Range Photon Magnon Coupling [0.0] この研究は、長距離相互作用によって結合されるマグノン-光子系の時間領域ダイナミクスの実験的な証拠を示す。
送電線モードが重く減衰し相互作用を媒介する散逸結合キャビティ-マグノンモードの時間的進化を直接観察する。
提案手法は, 実験装置の物理的変更を必要とせず, 完全抑制を含む解離結合強度をその場で調整することを可能にする。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:12:52 GMT)
DiscoverDCP: A Data-Driven Approach for Construction of Disciplined Convex Programs via Symbolic Regression [0.0] DCP(Disciplined Convex Programming)のルールセットとシンボリックレグレッションを統合したデータ駆動型フレームワークを提案する。
出力表現が構成によってグローバルに凸であることを保証するため、計算的に難解なポストホック凸性検証のプロセスを回避できる。
提案手法は,安全クリティカルな制御および最適化作業に適した解釈可能,検証可能,フレキシブルな凸モデルを生成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 08:31:45 GMT)
Direct Equivalence between Dynamics of Quantum Walks and Coupled Classical Oscillators [0.0] 指数関数的に大きいスパースグラフ上の連続時間量子ウォーキングは、量子コンピューティングの強力なパラダイムを形成する。
本研究では,これら2つの問題間の直接的かつ透過的なマッピングを確立する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:20:52 GMT)
Diminishing Returns in Self-Supervised Learning [0.0] 事前トレーニングと微調整がモデルに役立つが、リターンが低下しているのに対して、中間的な微調整は下流のパフォーマンスに有害な影響を及ぼす可能性がある。
この結果から,対象とする事前学習と注意深いデータ選択のメリットが最も大きいことが示唆された。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:11:44 GMT)
Differential Filtering in a Common Basic Cycle: Multi-Major Trajectories and Structural Bottlenecks in Exact Sciences and Engineering Degrees [0.0] 大学はしばしばCBC(Common Basic Cycle)を、数度のプログラムで共有される中立的なレベルリング段階として提示する。
本研究は,CBCが一様ゲートウェイとして動作するか,あるいはメジャー間の差分フィルタとして動作するかを検証する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:56:53 GMT)
Decryption Through Polynomial Ambiguity: Noise-Enhanced High-Memory Convolutional Codes for Post-Quantum Cryptography [0.0] 本稿では,雑音強調高メモリ畳み込み符号の直接復号化を利用したポスト量子暗号への新しいアプローチを提案する。
提案手法は、構造攻撃を効果的に隠蔽し抵抗するランダムな発電機行列を生成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:43:18 GMT)
DZ-TDPO: Non-Destructive Temporal Alignment for Mutable State Tracking in Long-Context Dialogue [0.0] DZ-TDPOは、競合を意識した動的KL制約と学習可能な時間的注意バイアスを相乗化する非破壊的アライメントフレームワークである。
Multi-Session Chatデータセットの実験は、DZ-TDPOが最先端の勝利率を達成することを示した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 11:56:53 GMT)
Conditional updates of neural network weights for increased out of training performance [0.0] 本研究では、トレーニングデータとアプリケーションデータがあまり似ていない場合、ニューラルネットワークの性能を向上させる手法を提案する。
1) ニューラルネットワークをトレーニングデータセットの適切なサブセットに向けて再トレーニングし、結果として生じる重み付け異常に注意する。
本稿では, ニューラルネットワークの時間的, 空間的, ドメイン横断的な外挿を成功させる, 気候科学の3つのユースケースでこの手法を実証し, 議論する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:41:06 GMT)
Computational Linguistics Meets Libyan Dialect: A Study on Dialect Identification [0.0] 使用されるデータセットはQADIコーパスであり、18のアラビア方言で54万の文からなる。
カイ二乗分析の結果,メールの言及や感情指標などの特定の特徴が方言の分類に大きく関連していないことが明らかとなった。
分類実験の結果、MNB(Multinomial Naive Bayes)は85.89%の精度を達成した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 20:54:06 GMT)
Complex Wigner entropy and Fisher control of negativity in an oval quantum billiard [0.0] 我々は、楕円量子ビリヤードの通過を避けるためにウィグナーの負性性を適用する。
真のウィグナー函数に対しては、ギブス・シャノン函数は複素函数となる。
符号分解分解は、全負の重みを位相空間分布から分離する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:54:58 GMT)
Comparison of neural network training strategies for the simulation of dynamical systems [0.0] 本稿では,並列トレーニングとシリーズ並列トレーニングの2つの主要なトレーニング戦略を比較した。
この研究は、シリーズ並列トレーニングが現在の実践を支配しているにもかかわらず、並列トレーニングは一貫して、より長期的な予測精度を向上することを示した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:50:06 GMT)
Comparative algorithm performance evaluation and prediction for the maximum clique problem using instance space analysis [0.0] 本研究では, インスタンス空間解析(ISA)手法を用いて, 最先端(SOTA)アルゴリズムの性能を評価・予測する。
データセットは、TWITTER、COLLAB、BINARYベンチマークからグラフインスタンスを使用してコンパイルされた。
ISAベースのアルゴリズム性能予測モデルは、BHOSLIBデータセットとDIMACSデータセットからコンパイルされた34の挑戦的なテストインスタンス上で実行される。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 03:54:20 GMT)
CoGraM: Context-sensitive granular optimization method with rollback for robust model fusion [0.0] リトレーニングなしのニューラルネットワークのマージは、フェデレーションと分散学習の中心である。
重量平均化やフィッシャーマージのような一般的な方法は、しばしば正確さを失い、種子間で不安定である。
CoGraMは、レイヤ、ニューロン、および重量レベルの多段階、文脈依存、損失ベース、反復的な最適化手法である。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 09:43:00 GMT)
Catching UX Flaws in Code: Leveraging LLMs to Identify Usability Flaws at the Development Stage [0.0] 本稿では,大規模言語モデル (LLM) が開発段階において信頼性と一貫した評価を提供できるかどうかを検討する。
OpenAIのGPT-4oのパイプラインを用いて,サイトごとの3つの独立した評価で850以上の評価を作成した。
問題検出では、平均的なコーエンのカッパは0.50で、正確な一致は84%であった。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 21:02:54 GMT)
Blockchain-Anchored Audit Trail Model for Transparent Inter-Operator Settlement [0.0] 電気通信と金融サービス産業は、企業間決済プロセスの課題に直面している。
伝統的な決済機構は、複数の仲介と手作業に依存している。
本研究は、透明で不変で自動化された決済を可能にするブロックチェーンによる監査トレイルモデルを提案する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 18:58:28 GMT)
Automatic Construction of Chinese Verb Collostruction Database [0.0] この論文は動詞の衝突を射影、根付き、順序付け、非巡回グラフとして定義する。
大規模コーパスから検索した文のリストから、与えられた動詞に対する協調を生成する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:44:11 GMT)
Asymmetric excitation of left- vs right-handed photons in accelerating waveguides [0.0] 真空中のマクスウェル方程式の双対対称性は、古典的な電磁波の円偏極$Q$が保存されることを意味する。
これまでの研究では、重力場を伝播する観測者には期待値が保存されないことが示されている。
ここでは、このネーター対称性が双対性保存境界条件を持つ空の導波路でも実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:03:52 GMT)
Artificial Intelligence Applications in Horizon Scanning for Infectious Diseases [0.0] 本総説は,感染性疾患に関連する新興の脅威と機会を特定し,対応することに焦点を当てる。
我々は、AIツールが信号検出、データ監視、シナリオ分析、意思決定支援を強化する方法について検討する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 22:00:46 GMT)
Artificial Intelligence / Human Intelligence: Who Controls Whom? [0.0] この章は、人間の利益に反する決定を下すことができるAIによってもたらされる課題を描いている。
認知的意思決定プロセスは、私たちの行動や選択に影響を与える認知バイアスの影響を受けます。
規制は倫理的、法的、政治的選択を反映しなければならないが、教育はデジタルリテラシーを強化する必要がある。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:21:13 GMT)
Ancient Algorithms for a Modern Curriculum [0.0] インド、中国、バビロン、エジプトといった古代文明に深く根ざしている。
我々の研究は、アルゴリズムの命令をより広い歴史的・文化的文脈に埋め込むことによって、このギャップに対処する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 06:57:25 GMT)
An elementary approach to Wehrl-type entropy bounds in quantitative form [0.0] 我々は、対称$SU(N)$コヒーレント状態に対するリーブ-ソロヴェイ不等式(英語版)(Lieb--Solovej inequality)の安定性(鋭指数)の問題を考える。
この結果の基本的な証明として、Whrl型エントロピーを$mathbbCd$, for some suitable $d$, on some explicit (and some surprise) calculations。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 20:25:23 GMT)
AlignCheck: a Semantic Open-Domain Metric for Factual Consistency Assessment [0.0] ドメイン内およびオープンドメインテキストの事実整合性評価のための解釈可能なフレームワークを提案する。
提案手法では,テキストをアトミックな事実に分解し,フレキシブルでスキーマフリーな手法を導入する。
一般的な一般的なデータセットと臨床データセットにアプローチをベンチマークし、事実認識モデルトレーニングをサポートするためにコードをリリースします。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:14:31 GMT)
AfroBeats Dance Movement Analysis Using Computer Vision: A Proof-of-Concept Framework Combining YOLO and Segment Anything Model [0.0] 本稿では,ダンサー検出のための YOLOv8 と v11 を,正確にセグメンテーションのための Segment Anything Model (SAM) と統合する概念実証フレームワークを提案する。
提案手法は,映像フレーム内のダンサーを識別し,個別のダンスステップをカウントし,空間被覆パターンを計算し,演奏シーケンス間のリズムの整合性を測定する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 07:06:06 GMT)
Adaptive Prefiltering for High-Dimensional Similarity Search: A Frequency-Aware Approach [0.0] 本稿では,Zipfian分布に従ってクエリ空間を周波数層に分割する適応型事前フィルタフレームワークを提案する。
CLIP埋め込みを用いたImageNet-1kの実験は、周波数対応の予算配分が20.4%の距離計算で等価なリコールを達成することを示した。
このフレームワークは、軽量な周波数トラッキングを通じて最小限のオーバーヘッドを導入し、コヒーレンスベースのフォールバックポリシを通じて、目に見えないクエリを優雅に分解する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:11:35 GMT)
Active Inference with Reusable State-Dependent Value Profiles [0.0] 生成モデルにおける隠れ状態に割り当てられた値関連パラメータの小さな再利用可能なバンドル。
この枠組みを確率論的逆転学習において評価し,静的精度,エントロピー結合動的精度,プロファイルベースモデルを比較した。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 04:11:57 GMT)
ActVAE: Modelling human activity schedules with a deep conditional generative approach [0.0] 入力ラベルに依存したリアルなアクティビティスケジュールをモデル化するための、条件付き生成機械学習アプローチを実証する。
これにより、異なる入力ラベルの正確で現実的なスケジュールを迅速に生成できる。
生成能力の重要性を, (i) 条件のない純粋生成モデルと (ii) 入力ラベルが与えられた最も可能性の高いスケジュールを出力する純粋生成モデルとの比較により, より一般的に評価する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:44:19 GMT)
AI/ML in 3GPP 5G Advanced - Services and Architecture [0.0] 人工知能/機械学習(AI/ML)は、テクノロジーのパラダイムシフトをもたらした。
本稿では、サービス・システム・アスペクト(SA)技術仕様グループにおいて、リリース19で導入されたAI/ML関連の技術進歩と機能に焦点を当てる。
i) AI/MLが5Gアドバンストシステム(ネットワーク用AI)に導入した拡張、(ii)AI/MLアプリケーションをサポートするために5Gシステムに実施された拡張。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:16:08 GMT)
A contextual advantage for conclusive exclusion: repurposing the Pusey-Barrett-Rudolph construction [0.0] 決定的な排除をいかにうまく達成できるかには、量子上古典的な優位性があることが示される。
我々は、排他的決定性に縛られたノイズロス非コンテクスト不等式を導出し、これらを量子的違反として記述する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:00:05 GMT)
A Robust Camera-based Method for Breath Rate Measurement [0.0] 本研究は,最小限のハードウェア要件を持つヒトの呼吸速度を測定するための,より堅牢な手法を提案する。
この方法は、14人のボランティアから撮影した2時間30分以上のビデオでテストされた。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 14:19:21 GMT)
A Quantum Gate Architecture via Teleportation and Entanglement [0.0] 本稿では,MBQCの計測駆動的な側面と,回路モデルによる量子ビットの絡み合いの生成を結合した普遍量子コンピューティングアーキテクチャを提案する。
我々のアーキテクチャはQGATEと呼ばれ、1次元の絡み合った光子状態を生成することができる決定論的光子源を持つ離散可変フォトニック量子コンピュータ向けに調整されている。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 19:00:05 GMT)
A Monad-Based Clause Architecture for Artificial Age Score (AAS) in Large Language Models [0.0] この研究は、大規模言語モデルに法則的な制約を課すエンジニアリング指向の節ベースのアーキテクチャを開発する。
ライプニッツのモナドロジーから選ばれた20のモナドは6つのバンドルに分けられる。
6つの最小限のPython実装は、チャネルレベルの量に作用する数値実験でインスタンス化される。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 12:48:40 GMT)
A Hierarchical Tree-based approach for creating Configurable and Static Deep Research Agent (Static-DRA) [0.0] 本稿では,階層木に基づく静的ワークフローに基づく新しいソリューションである静的ディープリサーチエージェント(Static-DRA)を紹介する。
コアコントリビューションは、DepthとBreadthという2つのユーザチューニング可能なパラメータの統合である。
エージェントのアーキテクチャは、スーパーバイザ、インディペンデント、およびWorkerエージェントで構成され、効果的なマルチホップ情報検索を促進する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 15:37:13 GMT)
A Descriptive Model for Modelling Attacker Decision-Making in Cyber-Deception [0.0] 本稿では,この決定を形作る心理的・戦略的要素を組み込んだ記述モデルを提案する。
このフレームワークは、サイバー詐欺シナリオにおけるエンゲージメント決定を分析するための構造化された方法を提供する。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 10:23:33 GMT)
A Convolutional Framework for Mapping Imagined Auditory MEG into Listened Brain Responses [0.0] 脳磁図(MEG)データセットを,音楽的・詩的な刺激を想像し,聴くように訓練したミュージシャンから収集した。
脳の反応と知覚の両方が、一貫した、条件特異的な情報を含んでいることを示す。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 05:23:10 GMT)
A Conceptual Model for AI Adoption in Financial Decision-Making: Addressing the Unique Challenges of Small and Medium-Sized Enterprises [0.0] 本稿では,中小企業の金融意思決定におけるAI導入の概念モデルを提案する。
提案したモデルは、限られたリソース、技術的専門知識、データ管理機能など、中小企業が直面する課題に対処する。
AIを漸進的に実装することで、中小企業は財務予測、予算設定、投資戦略、リスク管理を最適化できる。
論文参考訳(メタデータ) (Wed, 03 Dec 2025 23:57:34 GMT)