JavisGPT: A Unified Multi-modal LLM for Sounding-Video Comprehension and Generation [108.2] 本稿では,JAV(Joint Audio-Video)理解と生成のための,最初の統合マルチモーダル言語モデル(MLLM)であるJavisGについて述べる。
JavisG は Encoder-LLM-decoder アーキテクチャを採用し、SyncFusion モジュールを時時空間の大規模なオーディオビデオ融合用に備えている。
JAVPTの理解と生成ベンチマークの実験は、JavisGPTが既存のMLより優れていることを示している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:25:43 GMT)
Embodied Robot Manipulation in the Era of Foundation Models: Planning and Learning Perspectives [101.2] 近年のビジョン,言語,マルチモーダル学習の進歩は,ロボット基礎モデルの進歩を加速させている。
本研究は,ロボットの操作をアルゴリズムの観点から検討する。
我々は、近年の学習に基づくアプローチを、高レベルの計画と低レベルの制御の統一的な抽象化の中に整理する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 16:05:38 GMT)
EgoReAct: Egocentric Video-Driven 3D Human Reaction Generation [84.4] EgoReActは,エゴセントリックな映像ストリームからリアルタイムに3Dアライメントされた人間の反応運動を生成する最初のフレームワークである。
EgoReAct は,従来の手法に比べて極めて高いリアリズム,空間整合性,生成効率を実現している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 06:44:05 GMT)
Split4D: Decomposed 4D Scene Reconstruction Without Video Segmentation [76.2] 我々は、Freetime FeatureGSで分解された4Dシーンを表現する。
画像ごとのセグメンテーションマップから正確に復元するためのストリーミング機能学習戦略を設計する。
いくつかのデータセットに対する実験結果から,提案手法の再現性は近年の手法よりも大きなマージンで優れていることが示された。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 02:37:12 GMT)
AutoForge: Automated Environment Synthesis for Agentic Reinforcement Learning [71.4] シミュレーション環境における強化学習の実施は、言語ベースのエージェントを強化するためのコスト効率が高く、スケーラブルな方法を提供する。
これまでの作業は、半自動化された環境合成や、十分な困難を欠いたタスクに限られており、幅や深さがほとんどない。
本稿では,高難易度かつ容易に検証可能なタスクに関連付けられたシミュレーション環境の,自動化されたスケーラブルな合成のための統一パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 09:43:11 GMT)
Video-BrowseComp: Benchmarking Agentic Video Research on Open Web [64.5] Video-BrowseCompは、オープンウェブのエージェントによるビデオ推論に適した210の質問からなるベンチマークである。
これは時間的視覚的証拠に必須に依存しており、回答はテキスト検索のみでは導き出せないことを保証している。
初のオープンWebビデオ調査ベンチマークとして、Video-BrowseCompは、受動的知覚を越えて、プロアクティブなビデオ推論へと分野を前進させた。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 19:08:27 GMT)
YOLO-IOD: Towards Real Time Incremental Object Detection [57.9] 本稿では、事前訓練されたYOLO-Worldモデルに基づいて構築されたリアルタイムインクリメンタルオブジェクト検出(IOD)フレームワークであるYOLO-IODを紹介する。
YOLO-IODは3つの主要な構成要素を含む: 1) 衝突を意識した擬似ラベルリファインメント(CPR)は、前景と背景の混乱を緩和する。
また, クロスステージ非対称な知識蒸留法 (CAKD) を導入する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:35:26 GMT)
Adapting, Fast and Slow: Transportable Circuits for Few-Shot Learning [54.9] ドメイン全体の一般化は、目に見えないターゲットドメイン w.r.t を制約する構造を主張しなければ不可能である。
我々は、定性的なドメイン知識へのアクセスに依存するゼロショット合成一般化のためのアルゴリズムを設計する。
我々の理論的結果は、グラフィカル回路の可搬性基準の観点から、数発の学習可能なタスクのクラスを特徴づける。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 04:38:43 GMT)
A Rapid GeoSAM-Based Workflow for Multi-Temporal Glacier Delineation: Case Study from Svalbard [51.6] 我々は,Sentinel-2画像からの氷河の高速デライン化のためのGeoSAMに基づく半自動ワークフローを提案する。
その結果, 本手法は, 主要な氷河体に対して, 空間的に一貫性があり, 時間的に一貫した輪郭を生じさせることが示唆された。
導出RGB画像への依存により、他の光学データセットに柔軟で転送可能である。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 09:42:01 GMT)
DECEPTICON: How Dark Patterns Manipulate Web Agents [50.9] ダークパターンは, ステアリング剤のトラジェクトリーに極めて有効であることを示す。
個別の暗黒パターンを個別にテストするための環境であるDECEPTICONを紹介する。
テストされた実世界のタスクの70%以上において、悪質な結果に対して、ダークパターンが成功した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 11:55:20 GMT)
HiSciBench: A Hierarchical Multi-disciplinary Benchmark for Scientific Intelligence from Reading to Discovery [50.9] HiSciBenchは、完全な科学的ワークフローを反映した5つのレベルにわたる基礎モデルを評価するために設計された階層的なベンチマークである。
HiSciBenchには、6つの主要な科学分野にまたがる8,735件の慎重に管理された事例が含まれている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:08:05 GMT)
3D sans 3D Scans: Scalable Pre-training from Video-Generated Point Clouds [48.0] Sinkhorn-Knopp (Laplacian-Aware Multi-level 3D Clustering with Sinkhorn-Knopp (LAM3C) はビデオ生成点雲からラベルなしビデオから学習する自己教師型フレームワークである。
LAM3Cは、従来の屋内セマンティックスとインスタンスセグメンテーションの自己管理手法よりも高い性能を実現している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 18:59:25 GMT)
VPTracker: Global Vision-Language Tracking via Visual Prompt and MLLM [45.6] Vision-Language Trackingは、ビジュアルテンプレートと言語記述によって記述されたオブジェクトを継続的にローカライズすることを目的としている。
しかし、既存の手法は通常、局所的な探索に限られており、視点の変化の下で失敗する傾向がある。
我々は,多モーダル大言語モデル(VPTracker)に基づく最初のグローバルな追跡フレームワークを導入する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 06:12:28 GMT)
WeDLM: Reconciling Diffusion Language Models with Standard Causal Attention for Fast Inference [44.9] 本稿では,標準因果注意に基づく拡散復号化フレームワークWeDLMを提案する。
WeDLMは強力なARバックボーンの品質を維持しつつ,大幅な高速化を実現している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 01:25:48 GMT)
Value-guided action planning with JEPA world models [44.8] 環境を推論できるディープラーニングモデルを構築するには、その基盤となるダイナミクスをキャプチャする必要がある。
JEPA(Joint-Embeded Predictive Architectures)は、そのようなダイナミクスをモデル化するための有望なフレームワークを提供する。
本稿では,JEPAワールドモデルを用いて,表現空間を形作ることで計画を強化する手法を提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 20:17:49 GMT)
Wavelet-based Multi-View Fusion of 4D Radar Tensor and Camera for Robust 3D Object Detection [44.8] WRCFormerは、デカップリングされたレーダーキューブのマルチビュー表現を介して、生のレーダーキューブとカメラ入力を融合する新しい3Dオブジェクト検出フレームワークである。
WRCFormerはK-Radarベンチマークで最先端のパフォーマンスを達成し、すべてのシナリオで最高のモデルを約2.4%上回っている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:32:17 GMT)
ColaVLA: Leveraging Cognitive Latent Reasoning for Hierarchical Parallel Trajectory Planning in Autonomous Driving [44.0] 視覚言語モデル(VLM)は、クロスモーダルな先行とコモンセンス推論を導入することで、このパラダイムを豊かにする。
現在のVLMベースのプランナは、(i) 個別のテキスト推論と継続的制御のミスマッチ、(ii) 自己回帰的連鎖のデコーディングからの高い遅延、(iii) リアルタイムデプロイメントを制限する非効率または非因果的なプランナである。
テキストから潜在空間へ推論を転送し,それを階層的並列軌道デコーダで結合する統合視覚言語アクションフレームワークColaVLAを提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 14:06:37 GMT)
Effective Kinetic Monte Carlo for a Quantum Epidemic Process [42.0] リンドブラッド方程式の弱い対称性によって、動力学をキネティックモンテカルロにマッピングできることを示す。
この単純化された効果的なダイナミクスは、局所的なジャンプと局所的な決定論的成分を結合して記述することができる。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 14:44:30 GMT)
Multimodal Functional Maximum Correlation for Emotion Recognition [41.6] 感情状態は、中央システムと自律システムにまたがって協調しているが不均一な生理的反応として表される。
我々は,高次マルチモーダル依存を最大化するために,MFMC(Multimodal Functional Maximum correlation)を提案する。
MFMCは、主題に依存しない評価プロトコルと対象に依存しない評価プロトコルの両方の下で、一貫して最先端または競争力を持つ。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 20:48:02 GMT)
UniPR-3D: Towards Universal Visual Place Recognition with Visual Geometry Grounded Transformer [41.5] マルチビューからの情報を効果的に統合する初のVPRアーキテクチャであるUniPR-3Dを紹介する。
UniPR-3DはVGGTのバックボーン上に構築され、マルチビューの3D表現をエンコードできる。
実験により、UniPR-3Dは、単一のビューベースラインと複数ビューベースラインの両方を上回り、新しい最先端の技術を設定できることが判明した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 07:44:56 GMT)
Improving Generalization in LLM Structured Pruning via Function-Aware Neuron Grouping [39.3] FANG(Function-Aware Neuron Grouping)は、大規模言語モデルのための訓練後のプルーニングフレームワークである。
FANGは、それらが処理するセマンティックコンテキストのタイプに基づいて、同様の機能を持つニューロンをグループ化する。
複数のコンテキストタイプにまたがるニューロンを保存する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 17:26:56 GMT)
Forgetting as a Feature: Cognitive Alignment of Large Language Models [39.1] 本研究では,Large Language Models (LLM) が過去の情報を体系的に忘れていることを示す。
人間の記憶力学からインスピレーションを得て,LLM推論を指数的崩壊によって支配される確率的記憶過程としてモデル化する。
これらの観測に基づいて,人間のような記憶崩壊を模倣するエビデンス統合を形作る軽量な戦略である確率的記憶促進法を提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 10:43:00 GMT)
OrchANN: A Unified I/O Orchestration Framework for Skewed Out-of-Core Vector Search [38.3] 数十億ドル規模の近似近接探索(ANNS)は、基本的には中核的な問題である。
我々は、統一されたI/OガバナンスにI/Oオーケストレーションモデルを使用する、アウトオブコアANNSエンジンであるOrchANNを紹介する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 08:42:38 GMT)
FLEX-MoE: Federated Mixture-of-Experts with Load-balanced Expert Assignment [38.3] Mixture-of-Experts (MoE)モデルは条件付き計算によってスケーラブルなニューラルネットワークを実現する。
このアプローチでは、トレーニングフィードバックを通じて、ローカルデータセットのエキスパート適合度を定量化する、クライアント-専門家適合度スコアを導入している。
3つの異なるデータセットに関する包括的実験により、提案したFLEX-MoEの優れた性能を示す。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 20:32:13 GMT)
The Reward Model Selection Crisis in Personalized Alignment [38.1] 標準的なRM精度は、展開可能なパーソナライズアライメントの選択基準として破滅的に失敗することを示す。
我々は、RGDスコアリング機能が好ましくない応答と好ましくない応答とを正しく区別するかどうかの指標であるポリシー精度を導入する。
Pref-LaMPも導入しています。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 20:27:15 GMT)
A method for robust spin relaxometry in the presence of imperfect state preparation [36.9] 不完全なスピン偏極の存在下で、より堅牢なパラメータ推定を可能にする最小限のフィッティング手順を導入する。
我々のモデルは、より正確な適合性を提供することで既存のアプローチを改善し、シングルスピンダイナミクス研究を効率的に並列化するためのフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 01:42:00 GMT)
Embodied Learning of Reward for Musculoskeletal Control with Vision Language Models [35.5] 目標仕様と移動制御のギャップを埋めるために、MoVLR(MoV-Language Representation)を導入する。
MoVLRは、制御最適化と視覚言語モデル間の反復的な相互作用を通じて報酬空間を反復的に探索する。
我々のアプローチは言語と視覚に基づく評価を、具体的学習のための構造化されたガイダンスに変換する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 20:54:23 GMT)
Taming the Tail: Stable LLM Reinforcement Learning via Dynamic Vocabulary Pruning [35.4] 推論エンジンと数値的精度のトレーニングシステムは、同じパラメータから異なる確率分布を生成し、トレーニング推論ミスマッチを生成する。
このようなトークンを刈り取ることで、大きな、体系的にバイアスのあるミスマッチを、小さな、境界付けられた最適化バイアスと交換する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 21:44:07 GMT)
Next Best View Selections for Semantic and Dynamic 3D Gaussian Splatting [33.6] 我々は、ビュー選択問題をアクティブな学習問題として定式化する。
そこで本研究では,候補視点の有意性を定量化する能動的学習アルゴリズムを提案する。
本手法は,大規模静的画像と動的ビデオデータセットを用いて評価する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 04:19:25 GMT)
Understanding the Mechanisms of Fast Hyperparameter Transfer [32.9] 我々は,HP転送を大規模に推論するための概念的枠組みを開発する。
高速転送は計算-最適グリッド探索に有用であることを示す。
最適化軌道の分解は損失低減に2つの寄与があることを推測する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 04:13:00 GMT)
Toward Stable Semi-Supervised Remote Sensing Segmentation via Co-Guidance and Co-Fusion [31.2] Co2Sは半教師付きRSセグメンテーションフレームワークで、ビジョン言語モデルと自己教師型モデルとを融合する。
テキスト埋め込みと学習可能なクエリを利用した,明示的でシンプルなセマンティックコガイダンス機構が導入された。
6つの一般的なデータセットに対する実験は,提案手法の優位性を実証している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 18:24:19 GMT)
Bridging Global Intent with Local Details: A Hierarchical Representation Approach for Semantic Validation in Text-to-SQL [30.8] HEROは、グローバルな意図と局所的な詳細を統合する階層的な表現アプローチである。
我々はNested Message Passing Neural Network (NMPNN) を用いて、関係スキーマ誘導セマンティクスにおける固有情報をキャプチャする。
提案手法は既存の最先端手法よりも優れており,AUPRCの9.40%,AUROCの12.35%が意味的不整合を識別している。
きめ細かいセマンティックエラーを検出し、よりきめ細かいフィードバックで大きな言語モデルを提供し、最終的にはデータクエリプラットフォームの信頼性と解釈性を高めます。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 02:25:33 GMT)
Multiple Token Divergence: Measuring and Steering In-Context Computation Density [28.1] 言語モデルのコンテキスト内計算の労力を測定することは重要な課題である。
モデルの全出力分布と浅い補助予測ヘッドとのKL分散として定義される計算作業の簡易な尺度であるMultiple Token Divergence (MTD)を提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 14:13:54 GMT)
Debugging Tabular Log as Dynamic Graphs [24.5] Tabular logは現実世界のシステムでオブジェクトやイベントを抽象化し、更新を報告してシステムの変更を反映する。
本稿では,動的グラフに基づいてグラフログをデバッグする新しいフレームワークであるGraphLog Debuggerを提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:23:41 GMT)
ReDiF: Reinforced Distillation for Few Step Diffusion [21.7] 蒸留は、より小さいサイズまたは少ないステップのモデルを作成することにより、拡散モデルにおける遅いサンプリング問題に対処する。
拡散モデルのための強化学習に基づく蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 06:27:24 GMT)
Theory and Algorithms for Learning with Multi-Class Abstention and Multi-Expert Deferral [20.8] 大規模言語モデル(LLM)は目覚ましい性能を達成したが、幻覚や高い推論コストといった重要な課題に直面している。
より有能な専門家に不確実なインプットを延期することで、信頼性が向上する。
この論文は、強い一貫性の保証によって支持される、この問題と、それに関連する禁断学習の問題を包括的に研究している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 11:33:39 GMT)
Trust Region Masking for Long-Horizon LLM Reinforcement Learning [20.6] 大規模言語モデルのポリシー勾配法は、ロールアウトポリシーのサンプルから計算された代理目的を最適化する。
$_textroll ne _$ の場合、サロゲートと真の目的の間に近似誤差がある。
本稿では,トークンが信頼領域に違反した場合に,全シーケンスを勾配計算から除外するトラスト領域マスキング(TRM)を提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 20:41:59 GMT)
Agentic AI for Cyber Resilience: A New Security Paradigm and Its System-Theoretic Foundations [20.3] サイバーセキュリティは、ファンデーションモデルに基づく人工知能によって根本的に作り直されている。
この章は、予防中心のセキュリティからエージェントサイバーレジリエンスへの移行を主張する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 11:17:36 GMT)
OpenGround: Active Cognition-based Reasoning for Open-World 3D Visual Grounding [20.1] 3Dビジュアルグラウンドは、3Dシーンにおける自然言語記述に基づくオブジェクトの発見を目的としている。
オープンワールド3Dビジュアルグラウンドのための新しいフレームワークOpenGroundを紹介します。
OpenGroundの中心はActive Cognition-based Reasoning (ACR)モジュールである。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 17:44:20 GMT)
MVInverse: Feed-forward Multi-view Inverse Rendering in Seconds [19.9] 多視点逆レンダリングは、幾何、材料、照明を複数の視点で一貫して回復することを目的としている。
本稿では,RGB画像から空間変化アルベド,金属,粗さ,拡散シェーディング,表面正規度を直接予測するフィードフォワード多視点逆レンダリングフレームワークを提案する。
提案手法は,多視点整合性,物質的および正規推定品質,実世界の画像への一般化という観点から,最先端の性能を実現する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:36:11 GMT)
Fundamental Novel Consistency Theory: $H$-Consistency Bounds [19.5] 機械学習では、トレーニング中に最適化された損失関数は、タスクのパフォーマンスを定義するターゲット損失とは異なることが多い。
本稿では,サロゲート損失推定誤差に対する目標損失推定誤差について詳細に検討する。
私たちの分析では、$H$-一貫性境界が導かれ、これは仮説セットの$H$に対する説明が保証される。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 11:02:20 GMT)
Diversity or Precision? A Deep Dive into Next Token Prediction [19.3] 本研究では,事前学習したトークン出力分布が,その後の強化学習の探索ポテンシャルをいかに形成するかを検討する。
精度指向の勾配を先行させると、RLのより優れた探索空間が得られることが分かる。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 14:53:24 GMT)
ByteLoom: Weaving Geometry-Consistent Human-Object Interactions through Progressive Curriculum Learning [19.3] 本稿では,幾何的に一貫したオブジェクト図面を持つ実写HOIビデオを生成するByteLoomを紹介する。
まず、相対座標マップ(RCM)をオブジェクトの幾何整合性を維持する普遍表現として活用するRCM-cache機構を提案する。
次に、モデル能力を進歩的なスタイルで向上し、ハンドメッシュの需要を緩和するトレーニングカリキュラムを設計する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 09:38:36 GMT)
Heterogeneity in Multi-Agent Reinforcement Learning [18.7] 異種性はマルチエージェント強化学習(MARL)の基本的な性質である
本稿では, MARLにおける異種性について, 定義, 定量化, 利用の観点から体系的に論じる。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 14:07:31 GMT)
3D Scene Change Modeling With Consistent Multi-View Aggregation [18.5] SCaR-3Dは、3次元シーン変化検出フレームワークであり、濃密な事前変化画像シーケンスとスパース的な後変化画像からオブジェクトレベルの変化を識別する。
提案手法は, 符号付き距離ベース2次元差分モジュールと, 投票, プルーニングによる多視点アグリゲーションからなる。
また,変化しない領域を保存しながら動的領域を選択的に更新する連続的なシーン再構築戦略も開発している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 08:00:56 GMT)
Learning Where to Focus: Density-Driven Guidance for Detecting Dense Tiny Objects [18.0] 高解像度のリモートセンシング画像は、ますます小さな物体の密集したクラスターを含んでいる。
DRMNetは、適応的な特徴学習を導くために、空間的事前条件として密度マップを使用する。
AI-TODデータセットとDTODデータセットの実験では、DRMNetが最先端のメソッドを上回ることが示されている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 14:27:55 GMT)
From Confounding to Learning: Dynamic Service Fee Pricing on Third-Party Platforms [16.6] 戦略エージェントに直面するサードパーティプラットフォームの価格変動について検討する。
我々は,$TildecO(sqrtTwedge_S-2)$を最適に後悔するアルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 02:41:36 GMT)
Geometric Structural Knowledge Graph Foundation Model [16.0] 本稿では,知識グラフ推論に多頭部幾何的注意を導入する新しい基礎モデルGammaを提案する。
Gammaは単一のリレーショナル変換を、実数、複素数、分割複素数、双対数に基づく変換を含む複数の並列変換に置き換える。
リレーショナル条件付アテンション融合機構は、エントロピー正則化を伴う軽量ゲーティングを介してリンクレベルでそれらを適応的に融合する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 13:53:23 GMT)
Accelerating Language Model Workflows with Prompt Choreography [15.0] 本稿では,動的でグローバルなKVキャッシュを維持することにより,LLMを効率的に実行するためのフレームワークであるPrompt Choreographyを紹介する。
各LSMコールは、以前エンコードされたメッセージの任意の順序で順序付けされたサブセットに対応することができる。
Prompt Choreographyはメッセージ単位のレイテンシを大幅に削減する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 19:21:11 GMT)
Merge before Forget: A Single LoRA Continual Learning via Continual Merging [14.0] 現在のLow-Rank Adaptation (LoRA) 連続学習技術は、学習済みのLoRAを保持・凍結したり、忘れることを避けるためにデータ表現を生成することが多い。
本稿では,LoRAの更新を1つの統一LoRAに逐次マージする連続学習手法を提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 17:37:57 GMT)
M-ErasureBench: A Comprehensive Multimodal Evaluation Benchmark for Concept Erasure in Diffusion Models [13.9] M-ErasureBenchは、3つの入力モードで概念消去メソッドをベンチマークする新しいフレームワークである。
IRECEはプラグイン・アンド・プレイのモジュールで、クロスアテンションを通じてターゲットのコンセプトをローカライズし、ノイズ発生時に関連する潜伏者を摂動させる。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 10:58:36 GMT)
A Minimal Solver for Relative Pose Estimation with Unknown Focal Length from Two Affine Correspondences [13.7] カメラビューの垂直方向はIMU測定により得ることができる。
本稿では3DOFの相対的なポーズと焦点距離を推定する新しい解法を提案する。
その結果,既存の最先端の解法よりも優れた解法が得られた。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 08:18:48 GMT)
RealCamo: Boosting Real Camouflage Synthesis with Layout Controls and Textual-Visual Guidance [13.4] リアルなカモフラージュ画像生成のための統一されたアウトペイントベースフレームワークを提案する。
ReamCamoは、グローバルなイメージ構造を制御するためのレイアウトコントロールを明示的に導入している。
また,生成画像におけるカモフラージュの有効性を計測する背景・地上分布のばらつき尺度も導入する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:37:56 GMT)
MUSON: A Reasoning-oriented Multimodal Dataset for Socially Compliant Navigation in Urban Environments [13.3] 社会的に適合したナビゲーションは、安全かつ解釈可能な決定を保証するために、動的な歩行者と物理的な制約に対する構造的推論を必要とする。
既存のソーシャルナビゲーションデータセットは、しばしば明確な推論の監督を欠き、非常に長い尾のアクション分布を示す。
MUSONは,屋内および屋外の様々なキャンパスシーンで収集された短時間の社会ナビゲーションのためのマルチモーダルデータセットである。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 10:41:39 GMT)
SNM-Net: A Universal Framework for Robust Open-Set Gas Recognition via Spherical Normalization and Mahalanobis Distance [12.8] 本研究では,オープンセットガス認識のための汎用ディープラーニングフレームワークSNM-Netを提案する。
中心となる革新は、カスケードされたバッチ正規化とL2正規化によって達成される幾何学的疎結合機構にある。
SNM-Netはアーキテクチャに依存しず、CNN、RNN、Transformerのバックボーンとシームレスに統合される。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 05:33:05 GMT)
A Note on Hybrid Online Reinforcement and Imitation Learning for LLMs: Formulations and Algorithms [12.7] 我々は,Imitation LearningとReinforcement Learningを統合したLarge Language Model (LLM)ファインチューニングのための統一フレームワークを提案する。
軌道レベルのKL分散とタスク報酬を結合した複合目的物の勾配を解析することにより、自然な分解を2つの成分に導出する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 22:25:27 GMT)
PreGME: Prescribed Performance Control of Aerial Manipulators based on Variable-Gain ESO [12.7] 可変ゲイン拡張状態オブザーバ(ESOs)に基づく新しい所定のパフォーマンス動作制御フレームワークを提案する。
動的結合のリアルタイム推定のための可変ゲインESOと所定の性能飛行制御とを含む。
実験結果から,ロボットアームの高速動作による動的結合の下でも,高い追従性能が得られた。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 14:54:06 GMT)
Depth Anything in $360^\circ$: Towards Scale Invariance in the Wild [12.6] 私たちはDepth Anythingを、Depth Anything V2のパノラマ適応版である$360circ$(DA360)で紹介します。
我々の重要なイノベーションは、ViTバックボーンからシフトパラメータを学習し、モデルのスケール不変およびシフト不変の出力をスケール不変の見積に変換することです。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 07:12:58 GMT)
Is Chain-of-Thought Really Not Explainability? Chain-of-Thought Can Be Faithful without Hint Verbalization [11.8] Biasing Featuresメトリックは、予測に影響を与えるプロンプト注入されたヒントを省略した場合、CoTを偽りとしてラベル付けする。
この計量は不完全さと不完全さを混同し、分散トランスフォーマー計算を線形自然言語物語に変換するのに必要な圧縮を損なう。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 18:18:02 GMT)
FasterPy: An LLM-based Code Execution Efficiency Optimization Framework [11.8] コードはしばしばパフォーマンスのバグに悩まされる。
従来のルールベースのメソッドは、特定のパフォーマンスバグに対するルールを手動で設計し、保守することに依存しています。
我々は,Pythonコードの実行効率を最適化するために,大規模言語モデルを適用するフレームワークであるFasterPyを提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 07:43:08 GMT)
Let Samples Speak: Mitigating Spurious Correlation by Exploiting the Clusterness of Samples [11.7] ディープラーニングモデルは、トレーニング中にクラスラベルと急激な相関関係を持つ機能を学ぶが、予測タスクとは無関係である。
既存の手法は通常、潜在的なスパイラルな属性を注釈付けしたり、経験的な仮定に基づいてスパイラルな特徴をフィルタリングすることでこの問題に対処する。
本稿では,深層学習モデルにおける突発的相関を緩和するデータ指向手法を提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 10:54:51 GMT)
Learning Anatomy from Multiple Perspectives via Self-supervision in Chest Radiographs [11.2] 我々は,大規模胸部X線写真を用いて,複数の視点から学習解剖学(Lamps)を構築した。
微調整および創発的特性分析によって評価された10個のデータセットにわたる実験は、ランプの優れた堅牢性、伝達性、臨床ポテンシャルを示している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 10:52:51 GMT)
From Rookie to Expert: Manipulating LLMs for Automated Vulnerability Exploitation in Enterprise Software [9.8] 我々は、初心者を有能な攻撃者に変えるために、公開LLMがいかに社会的に設計できるかを示す。
RSA (Role-Solicitation, Scenario-pretexting, Action-Assignment) を事前文化戦略として提案する。
これは、ソフトウェアエンジニアリングにおけるパラダイムシフトを表します。私たちは、コードを理解するのではなく、プロンプトを作る能力だけを必要とする時代において、セキュリティプラクティスを再設計する必要があります。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 02:55:49 GMT)
Breaking the illusion: Automated Reasoning of GDPR Consent Violations [9.5] 我々は、Webフォームにおける同意関連プライバシー侵害を検出するための新しい自動化フレームワークCosmicを提案する。
コズミックは同意フォームの94.1%に3384件の違反を検知し、自由な同意目的開示や離脱オプションなどの重要な原則をカバーしている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 05:22:00 GMT)
A Neural Network-Based Real-time Casing Collar Recognition System for Downhole Instruments [9.1] 資源制約のあるARM Cortex-M7マイクロプロセッサ向けに最適化された軽量な"Collar Recognition Nets"(CRN)を導入する。
CRNは計算複雑性を8,208MACに減らし、F1スコアは0.972を維持した。
ハードウェア検証では、平均レイテンシは343.2秒である。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:19:36 GMT)
Multimodal Fact-Checking: An Agent-based Approach [8.7] 実世界のマルチモーダルファクトチェックのための高品質で説明可能なデータセットであるRW-Postを紹介する。
RW-Postは、実世界のマルチモーダルなクレームと、そのクレームが作成されるリッチなコンテキスト情報を保存するオリジナルのソーシャルメディア投稿を整合させる。
RW-PostをベースとしたエージェントベースのマルチモーダルファクトチェックフレームワークであるAgentFactを提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 13:58:33 GMT)
Risk-Averse Learning with Varying Risk Levels [8.6] 本研究では,リスクレベルの異なる動的環境におけるリスク-逆オンライン最適化について検討する。
環境のダイナミクスとリスクレベルを捉えるために,機能変動指標を用い,新たなリスクレベル変動指標を導入する。
我々は,限られたサンプリング予算でリスク回避学習アルゴリズムを開発し,機能変動,リスクレベル変動,サンプル総数の観点から,それらの動的後悔境界を解析した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 16:09:29 GMT)
A generalized motif-based Naïve Bayes model for sign prediction in complex networks [8.6] 近隣ノードの不均一な影響を明示的にモデル化する一般化可能な符号予測フレームワークを提案する。
我々のフレームワークは、オンラインプラットフォームにおける信頼とセキュリティを強化するための実践的な意味を持って、予測に署名するための効果的で理論的に根ざしたソリューションを提供する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 03:53:05 GMT)
TEACH: Temporal Variance-Driven Curriculum for Reinforcement Learning [8.4] 本稿では,目標設定RLを高速化するために,時間変数駆動型カリキュラムを用いた新しい学生-教師学習パラダイムを提案する。
このフレームワークでは、教師モジュールはポリシーの信頼度スコアが最も高い時間差で目標を動的に優先順位付けする。
11種類の多様なロボット操作および迷路ナビゲーションタスクの評価を通じてこれを実証する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 07:29:29 GMT)
MetaCD: A Meta Learning Framework for Cognitive Diagnosis based on Continual Learning [8.3] 連続学習に基づく認知診断のためのメタラーニングフレームワークを提案する。
また,パラメータ保護機構と呼ばれる連続的な学習手法を用いて,MetaCDに新たなスキルやタスクに適応する能力を与える。
5つの実世界のデータセットに関する総合的な実験は、MetaCDが精度と一般化の両方で他のベースラインより優れていることを示している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:23:50 GMT)
Spatial-aware Symmetric Alignment for Text-guided Medical Image Segmentation [7.5] テキスト誘導医療画像は、医用画像のセグメンテーションをかなり約束している。
本研究では,ハイブリッド医療用テキストを参照する能力を高めるため,空間認識型対称アライメント(SSA)フレームワークを提案する。
SSAは、特に空間的制約によって特徴づけられる病変を正確に分断する際に、最先端のSOTA(State-of-the-art)性能を達成する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 16:02:42 GMT)
Discovering Transmission Dynamics of COVID-19 in China [7.4] 本研究では,中国におけるSARS-CoV-2送信パターンについて,公開追跡データを用いて検討する。
その結果、大きな都市では感染が増加し、おそらくは社会活動によって引き起こされると考えられる地域差が顕著に見られた。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 05:10:15 GMT)
Medical Scene Reconstruction and Segmentation based on 3D Gaussian Representation [7.0] 医用画像の3次元再構成は、医用画像解析と臨床診断において重要な技術である。
従来の手法は計算コストが高く、構造上の不連続性や細かなスライスで細部が失われやすい。
3次元ガウスおよび3次元平面表現に基づく効率的な3次元再構成法を提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 06:18:11 GMT)
JADAI: Jointly Amortizing Adaptive Design and Bayesian Inference [6.9] JADAIはベイズ適応設計と推論を併用したフレームワークである。
標準適応設計ベンチマークよりも優れた、あるいは競争的なパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 16:54:43 GMT)
PI-MFM: Physics-informed multimodal foundation model for solving partial differential equations [6.9] 本稿では, 事前学習と適応において, 制御方程式を直接強制する物理インフォームド・マルチモーダル基礎モデル(PI-MFM)を提案する。
PI-MFMは入力としてPDEのシンボル表現を取り、入力表現からPDEの残留損失を自動的に組み立てる。
13のパラメトリックな1次元時間依存PDEファミリのベンチマークでは、PI-MFMは純粋にデータ駆動のファミリを上回っている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 19:43:57 GMT)
Clinical Document Metadata Extraction: A Scoping Review [6.8] このスコーピングレビューは,臨床文書メタデータ抽出研究のカタログ化を目的としている。
ルールベースおよび従来の機械学習から文書メタデータを抽出する方法が進歩している。
大規模言語モデルの出現は、タスクやデータセット間の一般化可能性の広範な探索を可能にした。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 17:21:16 GMT)
FoldAct: Efficient and Stable Context Folding for Long-Horizon Search Agents [6.5] 大規模言語モデルのためのロングホライゾン強化学習(RL)は、コンテキスト成長から重要なスケーラビリティ課題に直面している。
既存のアプローチでは、サマリアクションを標準アクションとして扱い、サマリがエージェントの将来の観測空間を根本的に変更するのを見下ろしている。
本研究は,(1)要約トークンが不十分なトレーニング信号を受ける勾配の希釈,(2)ポリシー更新による要約分布の変更,トレーニング崩壊の悪循環の創出,(3)各ターンで独自のコンテキストを処理することによる計算コストの3つの基本的な課題を紹介する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 00:24:01 GMT)
TrimTokenator-LC: Towards Adaptive Visual Token Pruning for Large Multimodal Models with Long Contexts [6.5] 大規模マルチモーダルモデル(LMM)は様々なタスクで有効であることが証明されている。
典型的には、視覚入力をトークンのオリジナルモデルシーケンスにエンコードする。
視覚トークンの増加は、推論コストを大幅に増加させます。
有望なソリューションとして、ビジュアルトークンプルーニングが登場した。
本稿では,長いコンテキストでの視覚的トークンプルーニング,複数画像設定の課題を分析し,このようなシナリオに適した適応型プルーニング手法を提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 02:40:56 GMT)
Causal-Policy Forest for End-to-End Policy Learning [6.4] 本研究では、因果推論におけるポリシー学習のためのエンドツーエンドアルゴリズムを提案する。
我々は、政策学習のためのエンドツーエンドCATE推定アルゴリズムである因果林を修正した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 09:03:40 GMT)
Guided Path Sampling: Steering Diffusion Models Back on Track with Principled Path Guidance [5.8] 本稿では,反復的改善のための新しいパラダイムとしてガイドパスサンプリング(GPS)を提案する。
GPSは不安定な外挿を、データ多様体上のサンプリングパスが残るように、原理化された、多様体に制約されたものに置き換える。
GPSは、知覚品質と複雑なプロンプト順守の両方において、既存の手法より優れています。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 11:12:56 GMT)
Time-series Forecast for Indoor Zone Air Temperature with Long Horizons: A Case Study with Sensor-based Data from a Smart Building [5.8] 本稿では,2週間の地平線上に建つ建物におけるゾーン温度の時系列予測モデルを構築した。
この結果は、HVACシステムのインテリジェントな制御と操作を支援するためにさらに改善される可能性がある。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 04:29:01 GMT)
SOFT: a high-performance simulator for universal fault-tolerant quantum circuits [5.7] SOFTは、普遍的なフォールトトレラント量子回路のための高性能なSimulatOrである。
本研究は,フォールトトレラントアーキテクチャ設計における信頼性のあるシミュレーションツールの重要性を実証するものである。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 18:28:56 GMT)
With Great Context Comes Great Prediction Power: Classifying Objects via Geo-Semantic Scene Graphs [5.5] 本稿では,文脈の重要な役割を論じ,文脈オブジェクト分類のための新しい枠組みを導入する。
まず1つの単眼画像からGSCG(Geo-Semantic Contextual Graph)を構築する。
この明示的なグラフ構造は、モデルの推論過程を本質的に解釈可能である。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 17:53:55 GMT)
Deep Learning for Art Market Valuation [5.1] 本研究では,美術品の視覚的内容を予測モデルに組み込むことで,深層学習が美術市場の評価をいかに向上させるかを検討する。
主要なオークションハウスから繰り返し販売される大規模なデータセットを用いて,古典的ヘドニック回帰と木に基づく手法をベンチマークした。
アーティストのアイデンティティと事前の取引履歴が全体的な予測力を支配しているのに対して、視覚的な埋め込みは明らかに経済的に意味のある貢献をもたらす。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 21:04:09 GMT)
LENS: LLM-Enabled Narrative Synthesis for Mental Health by Aligning Multimodal Sensing with Language Models [5.0] LENSは、マルチモーダルセンシングデータを言語モデルと整合させてメンタルヘルスの物語を生成するフレームワークである。
LENSは、うつ病や不安症状に関連する反応を自然言語記述に変換することで、大規模なデータセットを構築する。
以上の結果から, LENSは標準NLP測定値と, 症状重度精度のタスク特異的測定値において, 高いベースラインを達成できることが示唆された。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 18:00:57 GMT)
Fake News Classification in Urdu: A Domain Adaptation Approach for a Low-Resource Language [5.0] ウルドゥー語における偽ニュース分類のための微調整前におけるドメイン適応の有効性について検討した。
我々は、XLM-RoBERTaとmBERTの2つの広く使われている多言語モデルを評価し、ドメイン適応型事前学習を適用した。
公開された4つのUrdu偽ニュースデータセットの実験では、ドメイン適応型XLM-Rがバニラよりも一貫して優れていることが示されている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 04:42:40 GMT)
MedSAM-based lung masking for multi-label chest X-ray classification [5.0] 胸部X線画像(CXR)は肺疾患のスクリーニングと診断に広く用いられている。
肺領域抽出モジュールとしてMedSAMを統合したセグメンテーション誘導型CXR分類パイプラインを提案する。
実験により、MedSAMは様々な画像条件で解剖学的に可塑性の肺マスクを産生することが示された。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 21:56:41 GMT)
SAMP-HDRL: Segmented Allocation with Momentum-Adjusted Utility for Multi-agent Portfolio Management via Hierarchical Deep Reinforcement Learning [4.7] マルチエージェントポートフォリオ管理のためのMomentum-Adjusted Utilityを用いたセグメンテッドアロケーションを提案する。
このフレームワークは動的資産グループ化を統合し、市場を高品質で通常のサブセットに分割する。
提案手法は,リターン率5%以上,ソルティーノ比5%以上,オメガ比2%以上,ゲイン率を著しく向上させる。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 11:56:39 GMT)
Active Constraint Learning in High Dimensions from Demonstrations [4.7] 本稿では,実演者の環境における未知の制約を推定するために,情報伝達系を用いた反復的能動制約学習(ACL)アルゴリズムを提案する。
提案手法は,未知の制約を表現するために利用可能な実演データセット上のガウス過程 (GP) を反復的に訓練し,その結果のGP後処理を用いて開始/終了状態のクエリを行い,データセットに追加される情報的な実演を生成する。
高次元非線形力学と未知の非線形制約を用いたシミュレーションおよびハードウェア実験において、本手法は、反復的に生成されたスパースかつ情報的デモンストレーションの集合からの制約推論を正確に行うために、ベースラインのランダムサンプリングに基づく手法より優れている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 03:06:05 GMT)
Problems With Large Language Models for Learner Modelling: Why LLMs Alone Fall Short for Responsible Tutoring in K--12 Education [4.7] K--12教育における大規模言語モデル(LLM)ベースのチューターの急速な増加は、生成モデルが適応的指導のために従来の学習者モデルを置き換えることができるという誤解を引き起こしている。
本研究は,LLMに基づく教師の限界に関する証拠を合成し,学習者の時間とともに進化する知識を評価するための正確性,信頼性,時間的コヒーレンスという1つの重要な問題を実証的に研究する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 18:26:22 GMT)
CLIP Based Region-Aware Feature Fusion for Automated BBPS Scoring in Colonoscopy Images [4.4] ボストン・ボウエル準備尺度(BBPS)は、標準化されたスコアシステムを提供するが、手動で行うと主観性とサーバ間の変動に悩まされる。
我々は517名の被験者から2,240枚の画像からなる高品質な大腸内視鏡データセットを構築した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 06:08:50 GMT)
Harnessing Large Language Models for Biomedical Named Entity Recognition [4.4] BioNERは医療情報学の基礎的なタスクであり、薬物発見や臨床試験のマッチングといった下流の応用に不可欠である。
提案するBioSelectTuneは,汎用言語モデルを微調整するための,高効率でデータ中心のフレームワークである。
我々のモデルは、正の正のデータのうち50%しか訓練されていないが、完全に訓練されたベースラインを超えている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 01:34:23 GMT)
P-FABRIK: A General Intuitive and Robust Inverse Kinematics Method for Parallel Mechanisms Using FABRIK Approach [4.4] P-FABRIKは汎用的で直感的で頑健な逆キネマティクス法であり、多様な並列機構のための一つの実現可能な解を見つける。
平面, 標準, 冗長並列機構を含むケーススタディは, 多様な並列機構にまたがって提案手法の一般化を実証した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 13:42:45 GMT)
HARBOR: Holistic Adaptive Risk assessment model for BehaviORal healthcare [4.3] 本稿では,個別の気分とリスクスコアを予測するための行動型健康意識言語モデルであるHARBORを紹介する。
PEARLは,3症例の4年間の月次観察を対象とする縦断的行動医療データセットである。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 20:59:20 GMT)
GRExplainer: A Universal Explanation Method for Temporal Graph Neural Networks [4.3] テンポラルグラフニューラルネットワーク(TGNN)は、そのようなグラフを処理する強力なツールとして登場した。
現在の方法は特定のTGNNタイプに合わせて調整され、一般性を制限する。
計算コストが高く、大規模ネットワークには適さない。
本稿では,TGNNの汎用的,効率的,ユーザフレンドリな説明手法であるGRExplainerを提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 04:24:59 GMT)
Sistema de navegación de cobertura para vehículos no holonómicos en ambientes de exterior [4.3] この研究は、カバレッジ・ナビゲーションを必要とする様々なユニット・プロセスの自動化の可能性を実証することを目的としている。
開発システムは、移動プラットフォームが特定のエリアをカバーすることができるルートの計算を含む。
システムは、様々なシミュレーションと実際の屋外環境でテストされ、90%近いカバレッジで結果が得られた。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 00:36:16 GMT)
Revisiting finite Abelian hidden subgroup problem and its distributed exact quantum algorithm [4.3] 我々は数学的な観点から有限アベリア隠れ部分群問題(AHSP)を再考する。
有限 AHSP に対して正確な量子アルゴリズムを提案するが、これは以前の正確なアルゴリズムよりも簡潔である。
本稿では,有限量子AHSPのための分散完全量子アルゴリズムを提案し,量子キューディットを少なくし,量子クエリの複雑性を低くし,量子通信を不要とした。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:00:50 GMT)
PoseStreamer: A Multi-modal Framework for 6DoF Pose Estimation of Unseen Moving Objects [4.1] PoseStreamerは高速移動シナリオのための堅牢なマルチモーダル6DoFポーズ推定フレームワークである。
MoCapCube6Dは、高速動作下でのパフォーマンスをベンチマークするために構築された、新しいマルチモーダルデータセットである。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:52:58 GMT)
Benchmarking Lie-Algebraic Pretraining and Non-Variational QWOA for the MaxCut Problem [4.1] 本稿では,トレーニング性向上を目的とした2つの戦略の比較性能解析を行う。
回路深さは200 Erds-Rényi および 200 3-正則グラフに対して 256$ である。
NV-QWOAはわずか60回で平均98.9%の近似比を獲得し、Lie-代数的事前訓練されたQWOAは500回で77.71%に改善された。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 09:42:02 GMT)
Audited Skill-Graph Self-Improvement for Agentic LLMs via Verifiable Rewards, Experience Synthesis, and Continual Memory [3.7] Audited Skill-Graph Self-Improvementは、自己改善をエージェントの反復的なコンパイルとしてスキルグラフに扱うフレームワークである。
本稿では,完全なシステムアーキテクチャ,脅威モデル,セキュリティ解析を提案し,完全に実行可能な参照実装を提供する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 19:39:47 GMT)
CNSight: Evaluation of Clinical Note Segmentation Tools [3.7] また,MIMIC-IVから得られた1000音符のキュレートデータセットを用いて,ルールベースベースベースライン,ドメイン固有トランスフォーマーモデル,および臨床ノートセグメンテーションのための大規模言語モデルの評価を行った。
GPT-5-miniは文レベルと自由テキストセグメンテーションで平均72.4のF1に達する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 05:40:15 GMT)
Eliminating Agentic Workflow for Introduction Generation with Parametric Stage Tokens [3.7] 我々は外部エージェントを排除して研究紹介を書くことを提案する。
代わりに、我々はそれらの論理構造を大きな言語モデルにパラメータ化します。
これにより、単一の推論で完全な導入が生成される。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:51:36 GMT)
The body is not there to compute: Comment on "Informational embodiment: Computational role of information structure in codes and robots" by Pitti et al [3.6] 計算と情報のレンズを適用することは、私たちの文明の技術的進歩を促進するのに役立ちました。
この記事は、情報と身体に展開する:それらが特定の方法で進化した理由(動物体)を理解し、最適な体(ロボット)を設計する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 10:44:53 GMT)
Breaking the Memory Wall: Exact Analytical Differentiation via Tiled Operator-Space Evolution [3.6] 位相勾配流(PGF)は、状態空間多様体で直接操作することで正確な解析微分を計算するフレームワークである。
提案手法は,最大VRAMの94%削減,スループットの23倍のO(1)メモリの複雑性を実現する。
我々の研究は1つのGPU上で染色体スケールの感度解析を可能にし、理論的な無限コンテキストモデルと実用的なハードウェアの限界のギャップを埋める。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 20:27:58 GMT)
An Automated Grey Literature Extraction Tool for Software Engineering [3.3] 我々は、研究トピックのプロンプトをプラットフォーム固有のクエリに変換するプロンプト駆動ツールであるGLiSEを紹介する。
一般的なソフトウェアエンジニアリングWebソース(GitHub、Stack Overflow)とGoogle検索の結果を集めている。
埋め込みベースのセマンティック分類器を使用して、その関連性に応じて結果をフィルタリングしランク付けする。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 20:20:58 GMT)
Learning Coupled System Dynamics under Incomplete Physical Constraints and Missing Data [3.1] 音楽は、疎結合性によって誘導されるマルチタスクニューラルネットワークフレームワークで、部分的な物理的制約とデータ駆動学習を統合して、結合システムのフル次元ソリューションを復元する。
MUSICは, 複雑な結合系の解を, データスカースおよびノイズ条件下で正確に学習することを示した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 22:02:10 GMT)
Optimal Threshold for Fracton Codes and Nearly Saturated Code Capacity in Three Dimensions [2.9] チェッカーボードコードの最適コード容量は$p_th simeq 0.108(2)$である。
この値は既知の3次元符号の中で最も高く、位相符号の理論的な限界をほぼ飽和させる。
これらの知見はフラクトン符号を高レジリエントな量子メモリとして示し、複雑な量子誤り訂正符号の解析における双対性技術の有用性を実証している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 11:36:07 GMT)
Identifying social bots via heterogeneous motifs based on Naïve Bayes model [2.9] そこで我々は,Nave Bayesモデルに基づくソーシャルボット検出のための理論的枠組みを提案する。
ノードラベル情報を組み込んだ均一なモチーフをヘテロジニアスに洗練する。
各不均一なモチーフの最大能力を数学的に定量化し、その潜在的な利点を推定できる。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 03:25:23 GMT)
A first-order method for nonconvex-strongly-concave constrained minimax optimization [2.7] 制約付きミニマックス問題に対する1次Laepsilon(KK-3.5-1)ソリューションを提案する。
その結果,KK-3.5-1の係数で,従来で最もよく知られた操作を改善することがわかった。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:31:56 GMT)
Adaptive Trust Consensus for Blockchain IoT: Comparing RL, DRL, and MARL Against Naive, Collusive, Adaptive, Byzantine, and Sleeper Attacks [2.6] 本稿では、プライバシ保護ポリシー評価のためのFHEと属性ベースアクセス制御(ABAC)を統合した信頼ベースの委譲コンセンサスフレームワークを提案する。
我々は,NMA,CRA,アダプティブ・アディショナル・アディショナル・アタック(AAA),TDP(Time-Delayed Poisoning)の5つの異なる攻撃群に対する強化学習アプローチを比較した。
この結果から,協調型マルチエージェント学習は,ブロックチェーンIoT環境における高度な信頼操作攻撃を防御する上で,測定可能なメリットを提供することがわかった。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 10:11:32 GMT)
Deep Learning for the Multiple Optimal Stopping Problem [2.4] 本稿では,高次元における複数の最適停止問題を解くための新しいディープラーニングフレームワークを提案する。
我々は、動的プログラミング原理とニューラルネットワークによる値関数の近似を組み合わせることで、この問題に対処する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:09:09 GMT)
Channel Selected Stratified Nested Cross Validation for Clinically Relevant EEG Based Parkinsons Disease Detection [2.4] ネストしたクロスバリデーションと3つの相補的なセーフガードを組み込んだ統合評価フレームワークを提案する。
この枠組みの下で訓練された畳み込みニューラルネットワークは、80.6%の精度を達成し、集団ブロックテストが実施されている技術性能の状態を実証した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 23:34:38 GMT)
Benchmark Success, Clinical Failure: When Reinforcement Learning Optimizes for Benchmarks, Not Patients [2.4] 我々は,2000個のSFTサンプル,1000個のRLサンプル,1つのA100 GPUを用いて,R1スタイルの方法論(SFTとGRPO)を用いて学習した視覚言語モデルであるChexReasonを紹介する。
GRPOは分配性能(CheXpertでは23%改善、マクロF1 = 0.346)を回復するが、データセット間の転送性(NIHでは19%低下)を低下させる。
我々は,SFTチェックポイントがNIHを最適化する前に一意に改善する一般化パラドックスを同定し,教師が指導する推論がより施設に依存しない特徴を捉えていることを示す。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 21:57:42 GMT)
Explaining AI Without Code: A User Study on Explainable AI [1.8] 我々は、オープンソースのノーコードMLプラットフォームであるDashAIに、人間中心のXAIモジュールを提示する。
ユーザスタディは、初心者や専門家に対するユーザビリティと説明の影響を評価した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:44:43 GMT)
Multiverse: A Simulator for Evaluating Entanglement Routing in Quantum Networks [1.8] MQNSはランタイム設定可能な浄化、スワップ、メモリ管理、ルーティングをサポートする。
モジュール型で最小限の設計では、MQNSアーキテクチャ非依存であり、パラダイム間の公正で再現可能な比較を可能にし、将来のエミュレーションを促進する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 14:04:29 GMT)
Text-Routed Sparse Mixture-of-Experts Model with Explanation and Temporal Alignment for Multi-Modal Sentiment Analysis [1.8] 本稿では,MSA のための eXplanation とテンポラルアライメントを備えたテキスト・ルート・スパース・オブ・エキスパート・モデルを提案する。
TEXTは、まずMLLM(Multi-modal Large Language Models)を介してMSAの説明を拡張し、その後、時間性指向のニューラルネットワークブロックを通じて、音声とビデオの表現を新しく整列させる。
TEXTは、最近提案された3つのアプローチと3つのMLLMを含む、すべてのテストモデルの中で、4つのデータセットで最高のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 01:58:30 GMT)
Towards the analysis of team members well-being [1.8] 本稿では,チームの健康分析に関するプロジェクトの結果と,プロジェクト内で開発されたプロトタイプについて述べる。
多くの研究は、チームメンバの幸福の重要な要因は、チームメンバが貢献に感謝し、認めていると感じているかどうかに一致している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 09:02:51 GMT)
Reach-Avoid Differential game with Reachability Analysis for UAVs: A decomposition approach [1.7] Hamilton-Jacobi (HJ) のリーチビリティ分析は,これらの課題に対処するための強力なツールとして登場した。
本稿では,問題を水平RAサブゲームと垂直RAサブゲームに分解することで,次元削減のための新しいフレームワークを提案する。
次に,HJリーチビリティ解析を用いて各サブゲームを解き,ディフェンダーの加速度を考慮した2次ダイナミクスを考察する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 05:34:11 GMT)
Theoretical Analysis and Simulations of Memory-based and All-photonic Quantum Repeaters and Networks [1.7] 本稿では,メモリをベースとした第1世代の量子リピータとネットワークの理論解析とシミュレーションについて述べる。
2つの異なる量子ネットワークパラダイムのリソース要件と同様に、絡み合い発生率と忠実度の観点から相対的な性能について検討する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 23:20:54 GMT)
How Much Data Is Enough? Uniform Convergence Bounds for Generative & Vision-Language Models under Low-Dimensional Structure [1.6] 現代の生成的・視覚言語モデル(VLM)は、科学的・医学的な意思決定支援にますます利用されている。
適度なデータを持つ強い経験的結果にもかかわらず、そのような予測が入力、クラス、サブポピュレーションにわたって均一に一般化されるのかどうかは不明である。
我々は、この疑問を有限サンプルの観点から研究し、次のように問いかける: 構造的仮定の下で、VLMベースの予測器は、実用的なサンプルサイズで均一に正確で校正された振る舞いを達成できるのか?
論文参考訳(メタデータ) (Sun, 28 Dec 2025 23:16:22 GMT)
Osmotic Learning: A Self-Supervised Paradigm for Decentralized Contextual Data Representation [1.5] 本稿では,分散データから高レベルの潜伏知識を明らかにするために,自己教師型分散学習パラダイムであるOSM-Lを紹介する。
OSM-Lは局所データ表現を反復的に整列し、情報拡散と収束を可能にする。
実験により,OSM-Lのコンバージェンスと表現能力を構造化データセット上で確認した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 22:25:16 GMT)
Nonlinear Dynamical Modeling of Human Intracranial Brain Activity with Flexible Inference [1.5] 我々は、DFINEをヒト頭蓋内脳波(iEEG)記録のモデル化に拡張する。
DFINEは将来の神経活動を予測する上で、線形状態空間モデル(LSSM)を大幅に上回っている。
DFINEは、BCIの柔軟な推論と実用性を実証し、ベースラインよりも頑丈に欠落した観測を処理している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 05:05:29 GMT)
On the use of case estimate and transactional payment data in neural networks for individual loss reserving [1.4] 我々は、要約トランザクションに基づいてトレーニングされたフィードフォワードニューラルネットワークと、クレームの支払履歴全体を分析するためのリカレントニューラルネットワークを比較する。
ケース推定が予測を大幅に改善する証拠は見出されているが、ニューラルネットワークにメモリを組み込むことで、測定精度が向上するのみである。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 05:51:05 GMT)
Controlling Nonadiabatic Transitions Through Engineered Ultrafast Laser Fields at Conical Intersections [1.3] 超高速レーザーパルスを用いた円錐交点における非断熱力学のコヒーレント制御について検討した。
モデル振動系内では、パルスチャープと時間プロファイルを調整し、その結果のウェーブ・パケット人口とコヒーレンスダイナミクスを計算する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:50:12 GMT)
Schrodinger AI: A Unified Spectral-Dynamical Framework for Classification, Reasoning, and Operator-Based Generalization [1.3] 量子力学にインスパイアされた統合機械学習フレームワークである textbfSchrdinger AI を紹介する。
システムは,(1)学習したハミルトニアンの下で知覚と分類をスペクトル分解として扱う時間非依存波動エネルギー解法,(2)時間とともに意味的波動関数の進化を制御し,文脈認識による決定の修正,再帰,および環境変化による推論を可能にする時間非依存波動エネルギー解法,(3)学習された量子様遷移作用素を通してモジュラー演算などの記号変換を学習する低ランク演算子によって定義される。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 04:33:18 GMT)
Fusion or Confusion? Multimodal Complexity Is Not All You Need [1.2] 標準化された条件下で19のハイインパクト手法を再実装し、最大23のモダリティを持つ9つの多様なデータセットで評価する。
本稿では,マルチモーダル学習のための簡易ベースライン(SimBaMM)を提案する。
私たちは、アーキテクチャのノベルティの追求から離れて、方法論的な厳格さへと焦点を移すことを主張します。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 16:20:36 GMT)
RGS-SLAM: Robust Gaussian Splatting SLAM with One-Shot Dense Initialization [1.1] RGS-SLAMは、GS-SLAMの残留駆動密度化段階を置き換える堅牢なガウスめっきSLAMフレームワークである。
RGS-SLAMは、最先端のガウス系および点ベースSLAMシステムと比較して、競合的あるいは優れたローカライゼーションと再構成の精度を達成する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 03:45:57 GMT)
Stabilizer Entropy of Subspaces [1.1] 我々は、安定化器エントロピー(SE)を介して定量化された非安定化器性(マジックとしても知られる)の資源理論における埋め込みの影響について研究する。
安定剤のエントロピーギャップは典型的には正であり、マジックを注入する必要があるが、ゼロと負の両方のマジックギャップは達成可能である。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 17:23:50 GMT)
Simulating Fully Gauge-Fixed SU(2) Hamiltonian Dynamics on Digital Quantum Computers [1.1] この研究は、最小の非自明な系の量子シミュレーションに焦点を当てている。
観測可能な天体の予測において、ミレ単位の精度に達するには、プラケット1個あたり3キュービット程度で十分であることが判明した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 04:56:25 GMT)
A Counterexample to the Optimality Conjecture in Convex Quantum Channel Optimization [1.0] 本稿では、Couttsらによって提案された凸量子チャネル最適化における最適性予想に対する反例を示す。
この予想は、量子チャネル最適化における核ノルム最小化問題に対して、最適解の双対証明はチョイ行列のスペクトル計算によって一意に決定できると仮定している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 10:29:03 GMT)
Ungraded Assignments in Introductory Computing: A Report [0.8] 本経験報告は,初等科目における学生の学習経験に及ぼす未学習課題の影響について考察する。
本研究では,未学習課題が学生のエンゲージメント,理解,学業成績に与える影響について検討した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 17:09:45 GMT)
Building AI Agents to Improve Job Referral Requests to Strangers [0.8] 本稿では,求職者の効果的な求職依頼書作成を支援するAIエージェントをオンラインコミュニティで開発する。
基本的なワークフローは、参照要求を書き換える改善エージェントと、リビジョンの品質を測定する評価エージェントで構成される。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 05:59:56 GMT)
Can Consumer Chatbots Reason? A Student-Led Field Experiment Embedded in an "AI-for-All" Undergraduate Course [0.8] 本稿では,ジョージ・メイソン大学のUNIV 182(AI4All)の中間プロジェクトとして,学生主導のフィールド実験を行った。
学生は、独自の推論タスクを設計し、現在使われている消費者チャットボット上で実行し、(i)回答の正しさと(ii)推論の有効性を評価した。
OpenAI GPT-5 と Claude 4.5 は最高平均解答精度 (86.2% と 83.8%) を獲得し、Grok 4 (82.5%) と Perplexity (73.1%) が続いた。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 22:51:25 GMT)
Robust LLM-based Column Type Annotation via Prompt Augmentation with LoRA Tuning [0.7] カラムタイプ。
CTAはスキーマアライメントとセマンティック理解を実現するための基本的なステップです。
既存のエンコーダのみの言語モデルでは,ラベル付き列を微調整すると高い精度が得られる。
本稿では,CTAのパラメータ効率向上のためのフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 02:04:17 GMT)
TabiBERT: A Large-Scale ModernBERT Foundation Model and Unified Benchmarking Framework for Turkish [0.7] TabiBERTはModernBERTアーキテクチャをベースとしたモノリンガルのトルコ語エンコーダである。
8,192トークンのコンテキスト長(16xオリジナルBERT)をサポートし、最大2.65倍の推論スピードアップを実現し、GPUメモリ使用量を削減する。
タビベンチで77.58を獲得し、BERTurkを1.62ポイント上回り、8つのカテゴリーのうち5つの最先端技術を確立した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 20:18:22 GMT)
NepEMO: A Multi-Label Emotion and Sentiment Analysis on Nepali Reddit with Linguistic Insights and Temporal Trends [0.4] ネパールのサブレディットポストにマルチラベル感情(MLE)と感情分類(SC)のための新しいデータセットNepEMOを提案する。
私たちは5つの感情のために、英語、ルーマニア語ネパール語、デバナガリ語の4,462件の注釈付きデータセットを手作業でキュレートし、構築します。
我々は、感情傾向、感情の共起、感情固有のn-gram、トピックモデリングなど、言語的な洞察を捉えるポストを詳細に分析する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 07:27:51 GMT)
Two-Robot Computational Landscape: A Complete Characterization of Model Power in Minimal Mobile Robot Systems [0.4] 本稿では,全ての主要モデルにまたがる2つの自律ロボットの計算能力の完全な評価を行った。
完全同期は,2つのロボットしか存在しない場合に,メモリと通信の両方を代用できることを示す。
これにより、2つのロボットにとって最初の完全かつ正確な計算環境が得られ、最小限のスケールでの協調という本質的な課題が浮き彫りになる。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 04:17:29 GMT)
MoR: Mixture Of Representations For Mixed-Precision Training [0.4] Mixture-of-Representations (MoR) は、新しいテンソル単位およびサブテンソルレベル量子化フレームワークである。
MoRはテンソルの数値特性を動的に解析し、様々な表現を選択する。
最初の研究結果から、この手法は98.38%のテンソルをFP8形式に量子化することで、最先端の結果が得られることが示された。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 06:28:50 GMT)
QSAR-Guided Generative Framework for the Discovery of Synthetically Viable Odorants [0.4] 生成人工知能は、テクスタイドノボ分子設計に有望なアプローチを提供する。
本稿では, 可変オートエンコーダ(VAE)と定量的構造活性相関モデル(QSAR)を組み合わせることで, 新規な臭気を発生させるフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 21:06:01 GMT)
Mechanistic Analysis of Circuit Preservation in Federated Learning [0.4] フェデレートラーニング(FL)は、分散データ上でモデルの協調訓練を可能にするが、その性能は非IIDデータ条件下で著しく低下する。
本稿では、メカニスティック・インタプリタビリティ(MI)のレンズによる標準FedAvgアルゴリズムについて検討し、この故障モードを診断する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 19:03:14 GMT)
SwinTF3D: A Lightweight Multimodal Fusion Approach for Text-Guided 3D Medical Image Segmentation [0.3] テキスト誘導型3次元医用画像分割のための視覚的・言語的表現を統一する軽量多モード融合手法であるSwinTF3Dを提案する。
SwinTF3Dは、コンパクトなアーキテクチャにもかかわらず、複数の臓器で競合するDiceとIoUのスコアを達成している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 11:00:05 GMT)
Improved cystic hygroma detection from prenatal imaging using ultrasound-specific self-supervised representation learning [0.2] 嚢胞性横隔膜腫(Cystic hygroma)は、高リスク出生前超音波検査で、染色体異常、構造的異常、および妊娠の悪影響を呈する。
本研究は,第1トリメスター超音波画像において,超音波による自己教師付き事前訓練が,嚢胞性肥大症を高精度かつ堅牢に検出するのに役立つかどうかを検証した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 00:07:26 GMT)
Enabling Long FFT Convolutions on Memory-Constrained FPGAs via Chunking [0.2] 本稿では,2.8MBBRAMのAlveo U200FPGA上で450K長フィルタ畳み込みを450K長シーケンスで実現するチャンクFFT畳み込み手法を提案する。
スループットはチャンクサイズに比例してスケールするが、長いシーケンスでは7%程度低下する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 00:03:22 GMT)
Enhancing Business Analytics through Hybrid Summarization of Financial Reports [0.2] 財務報告と決算報告には大量の構造化情報と半構造化情報が含まれている。
本稿では,抽出的および抽象的手法を組み合わせて,簡潔かつ現実的に信頼性の高い要約を生成するハイブリッド要約フレームワークを提案する。
これらの知見は、長い財務文書を有効活用できるビジネスインテリジェンスに蒸留する実用的な要約システムの開発を支援するものである。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 16:25:12 GMT)
Gauge Symmetry in Quantum Simulation [0.1] 任意の量子シミュレーション手法に適用可能なゲージ対称性を扱うための普遍原理を示す。
我々は,非シングルレットアプローチが,波のパケットや弦の励起を通じてゲージ不変な観測値が得られることを示す。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 13:56:38 GMT)
CLIP-Joint-Detect: End-to-End Joint Training of Object Detectors with Contrastive Vision-Language Supervision [0.1] CLIP-Joint-Detectは,エンドツーエンドのジョイントトレーニングを通じて,CLIPスタイルのコントラスト的視覚言語指導を統合するフレームワークである。
軽量並列ヘッドは、CLIP埋め込み空間に領域やグリッドを投影し、InfoNCEの対照的な損失と補助的なクロスエントロピー項を通じて学習可能なクラス固有のテキスト埋め込みと整列する。
我々は、Faster R-CNNを用いたPascal VOC 2007+2012と、最新のYOLO検出器(YOLOv11)を用いた大規模MS 2017ベンチマークでこれを検証した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:21:20 GMT)
Any DOF All at Once: Single Photon State Tomography in a Single Measurement Setup [0.0] 光量子技術は、様々な自由度(DOF)の光を使って量子情報を符号化する。
複数のDOFにまたがる単一光子ハイパーエンタングルの密度行列を再構成する枠組みを提案する。
理想カプラとマルチモードファイバを用いた単一光子OAMスピンとOAM周波数の絡み合った状態に対して数値解析を行った。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 10:48:11 GMT)
Interpretable Gallbladder Ultrasound Diagnosis: A Lightweight Web-Mobile Software Platform with Real-Time XAI [0.0] このシステムは、説明可能なAI視覚化を通じて解釈可能なリアルタイム予測を提供する。
99.85%の精度を達成でき、224万のパラメータしか持たない。
このソフトウェアは、ケアの時点で、効率的で、アクセシビリティがあり、信頼できる診断支援を提供する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 18:21:13 GMT)
When Does Multi-Task Learning Fail? Quantifying Data Imbalance and Task Independence in Metal Alloy Property Prediction [0.0] マルチタスク学習は、関連する物質特性がより良い予測のために活用できる基礎となる物理学を共有していると仮定する。
54,028合金試料を用いて比抵抗,ビッカース硬度,アモルファス成形能の同時予測を行った。
MTLは回帰性能を著しく低下させる(抵抗率$R2$: 0.897$to$0.844;硬度$R2$: 0.832$to$0694, $p 0.01$)が、分類を改善する(非晶質F1: 0.703$to$0744, $p 0.05$)。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 01:52:37 GMT)
Viability and Performance of a Private LLM Server for SMBs: A Benchmark Analysis of Qwen3-30B on Consumer-Grade Hardware [0.0] 大規模言語モデル(LLM)には、クラウドベースのプロプライエタリなシステムへの依存が伴っている。
本稿では,中小企業に対して,高性能でプライベートなLLM推論サーバを低コストで展開する可能性について検討する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 18:08:01 GMT)
There is No Quantum World [0.0] 私はネオボヘミアの量子力学の解釈を概説する。
フォン・ノイマンの無限直積に関する業績が、測定問題を解明する理論的な枠組みをいかに提供するかを示す。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 01:49:22 GMT)
The energy-speed relationship of quantum particles challenges Bohmian mechanics? [0.0] 近年、シャログラゾヴァらはボヘミアの力学の基本的性質に違反していると主張した。
簡単に言えば、彼らは主張するエバネッセント波の速度を測定し、これは実数であり、従って$vecnablaS=vec0$を持つ必要がある。
しかし、図2は明らかに1つの導波路からもう1つの導波路への密度運動を示し、非ゼロ密度電流を示唆している。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 03:31:13 GMT)
TEAS: Trusted Educational AI Standard: A Framework for Verifiable, Stable, Auditable, and Pedagogically Sound Learning Systems [0.0] TEAS(Trusted Educational AI Standard)は、4つの独立した柱上に構築された統合フレームワークである。
信頼性は主に、生のモデル能力ではなく、体系的なアーキテクチャに起因している、と私たちは主張する。
この洞察は、安価でオープンソースのモデルはデプロイメントグレードの信頼を達成でき、グローバルな学習環境にAIを安全に統合するためのスケーラブルで公平なパスを提供することを意味する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 07:40:26 GMT)
Symmetry-Preserving Variational Quantum Simulation of the Heisenberg Spin Chain on Noisy Quantum Hardware [0.0] 本研究では,1次元反強磁性ハイゼンベルクスピン-1/2鎖の基底状態特性を,一般的なハードウェア効率のアンサッツと物理インフォームド変動回路の両方を用いて検討する。
その結果、回路設計に物理対称性を組み込むことで、エネルギー推定が大幅に改善され、ハードウェアノイズに対する堅牢性が向上し、より明確な収束挙動がもたらされることが示されている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 17:17:24 GMT)
SwinCCIR: An end-to-end deep network for Compton camera imaging reconstruction [0.0] コンプトンカメラ(CC)はコンプトン散乱に基づいて入射ガンマの方向を決定するように設計されている。
本稿では,CCイメージングのためのエンドツーエンドディープラーニングフレームワークSwinCCIRを提案する。
回転変換器ブロックと変換畳み込みに基づく画像生成モジュールを併用することにより,リストモードイベントと放射源分布の関係を確立した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 04:10:33 GMT)
SciNets: Graph-Constrained Multi-Hop Reasoning for Scientific Literature Synthesis [0.0] クロスドメインな科学的合成は、断片化された文献を接続する機械的説明を必要とする。
文献由来の概念グラフ上でのグラフ制約付きマルチホップ推論問題としてメカニスティック合成を行う。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:27:42 GMT)
Sat-EnQ: Satisficing Ensembles of Weak Q-Learners for Reliable and Compute-Efficient Reinforcement Learning [0.0] Sat-EnQは、アグレッシブに最適化する前に、十分に良いことを学習するフレームワークです。
フェーズ1では、初期価値成長を制限する満足度の高い目標の下で、軽量Qネットワークのアンサンブルをトレーニングします。
フェーズ2では、アンサンブルはより大きなネットワークに蒸留され、標準のダブルDQNで微調整される。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:41:09 GMT)
Reimagining the Traditional Flight Computer: E6BJA as a Modern, Multi-Platform Tool for Flight Calculations and Training [0.0] Jamies Flight Computer (E6BJA) は、Apple iOS、Android、Microsoft Windows向けに設計されたマルチプラットフォーム・ソフトウェアベースのフライトコンピュータである。
E6BJAは、従来の飛行コンピュータのコア計算を再現し、拡張されたモデリング能力によって拡張する。
E6BJAと機械的・電子的飛行コンピュータを比較し,機能的・認知的・技術的側面を比較検討した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 19:43:36 GMT)
Random matrix prediction of average entanglement entropy in non-Abelian symmetry sectors [0.0] 大域的な$mathrmSU(2)$対称性を持つ量子多体系におけるハールランダム純粋状態の平均二部絡み合いエントロピーについて検討する。
解析はランダムな行列アンサンブルの特徴を利用し、任意のスピン密度に対する完全な解析的処理を提供する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 14:10:16 GMT)
Quantum batteries with K-regular graph generators: A no-go for quantum advantage [0.0] K-正則グラフに基づく量子電池の設計について検討する。
0正規グラフ電池は、充電時にシステムサイズと線形にスケールする抽出可能な作業を示す。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:30:31 GMT)
Prompt engineering does not universally improve Large Language Model performance across clinical decision-making tasks [0.0] LLM(Large Language Models)は、医学的知識評価において有望であるが、実際の臨床的意思決定における実用性は未定である。
一般患者における臨床理由づけのワークフロー全体にわたって, 最先端のLCMs-ChatGPT-4o, Gemini 1.5 Pro, LIama 3.370B-inの臨床的意思決定支援の評価を行った。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:15:51 GMT)
Privacy-Preserving Black-Box Optimization (PBBO): Theory and the Model-Based Algorithm DFOp [0.0] 本稿では、制約のないプライバシー保護ブラックボックス最適化(PBBO)の解決に焦点をあてる。
本稿では, DFOp を実装した微分自由解法を提案する。
数値計算の結果,DFOpは比較アルゴリズムよりも優れた性能を示した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 09:04:58 GMT)
OmniNeuro: A Multimodal HCI Framework for Explainable BCI Feedback via Generative AI and Sonification [0.0] 我々はBCI(Brain-Computer Interface)を透過的なフィードバックパートナーに変換する新しいフレームワークであるOmniNeuroを提案する。
OmniNeuroは、(1)物理学(エネルギー)、(2)カオス(フラクタル複雑度)、(3)量子インスパイアされた不確実性モデリングの3つの解釈可能性エンジンを統合している。
このシステムは58.52%の平均精度を達成し、定性的なパイロット研究により、説明可能なフィードバックは、ユーザーが精神的な努力を規制し、"心的およびエラー"のフェーズを短縮するのに役立つことを確認した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 16:06:55 GMT)
Neural Optimal Design of Experiment for Inverse Problems [0.0] 逆問題における最適実験設計のための学習ベースフレームワークである実験のニューラル最適設計を紹介する。
NODEは、センサーの位置、サンプリング時間、測定角度を表す、ニューラルネットワーク再構成モデルと、継続的な設計変数の固定予算セットを共同で訓練する。
我々は,MNIST画像サンプリングを用いて,解析的に抽出可能な指数関数成長ベンチマークを用いてNODEを検証し,実世界のスパースビューX線CTの例でその有効性を示す。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 22:26:18 GMT)
Neighbor-Aware Token Reduction via Hilbert Curve for Vision Transformers [0.0] 視覚変換器(ViT)は視覚認識タスクにおいて顕著な成功を収めているが、冗長なトークン表現は計算効率を制限している。
本稿では, ヒルベルト曲線の再順序付けに基づく, 隣り合うトークンの削減手法を提案する。
実験により,本手法は既存の手法と比較して,最先端の精度効率トレードオフを実現することを示す。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 03:25:45 GMT)
MixRx: Predicting Drug Combination Interactions with LLMs [0.0] 4種類のモデル, GPT-2, Mistral Instruct 2.0, そして微調整したモデルの性能について検討した。
この結果は、Mistral Instruct 2.0 Fine-Tunedモデルを用いて、標準および摂動データセットの平均精度スコアが81.5%であるようなアプリケーションの可能性を示した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 05:37:56 GMT)
Long-Range Distillation: Distilling 10,000 Years of Simulated Climate into Long Timestep AI Weather Models [0.0] 長距離蒸留(Long-range distillation)は、長距離で直接予測するために、長期確率的「学生」モデルを訓練する手法である。
私たちは、さまざまな時間スケールで予測するモデルをトレーニングするために、1万年以上のシミュレーションされた気候を生成します。
完全モデル実験では、蒸留されたモデルは気候学を上回り、自己回帰教師のスキルに近づいた。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 07:03:20 GMT)
Knowledge of Songket Cloth Small Medium Enterprise Digital Transformation [0.0] 本研究は,Songketテキスタイル中小企業における業務プロセス改善のためのデジタル技術,特にブログプラットフォームとeコマースサイトShopeeの利用について検討した。
このレポートは、デジタルトランスフォーメーションを経たSongket衣料品企業の経験を取り入れたケーススタディのアプローチを採っている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 17:02:37 GMT)
Inteligencia Artificial y Empleo: perspectiva Territorial y de Género [0.0] 本稿では,セクターベースデータを用いたAIへの雇用の潜在的露出を推定するための方法論的枠組みを提案する。
スペイン全土におけるAI暴露の領域的・ジェンダー的不合理な評価を提供する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 19:54:01 GMT)
Graph restricted tensors: building blocks for holographic networks [0.0] 我々は,最大二分位エンタングルメントの要求によって課される特定の相関特性を持つ少数体量子状態を分析する。
これらの制約をグラフにエンコードすることでこの問題に対処する新しい枠組みが提唱されている。
結果として得られる対象は、グラフ制限テンソルと呼ばれる」
論文参考訳(メタデータ) (Sun, 28 Dec 2025 17:09:47 GMT)
Generalised Entanglement Entropies from Unit-Invariant Singular Value Decomposition [0.0] 我々は、あるスケール変換に関して不変であるフォン・ノイマン絡み合いエントロピーの一般化を導入する。
これらの構造は、単位不変特異値分解(UISVD)に基づいており、その右、左、両不変のインカーネーションを持つ。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 16:51:19 GMT)
Federated Learning With L0 Constraint Via Probabilistic Gates For Sparsity [0.0] LearningNIST(FL)は、複数のクライアントがデータのプライバシを維持しながらモデルのトレーニングに協力する必要がある分散機械学習設定である。
データとモデルの本質的にの疎さは、過度に密集したモデルと、データとクライアントの参加の下での一般化性の低下をもたらすことが多い。
非ゼロパラメータの密度に対するL0制約付きFLを提案し、確率ゲートを用いた革命と連続緩和により達成する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 20:33:22 GMT)
Fast chiral resolution with optimal control [0.0] 我々は、有界制御場を持つ最小時間完全カイラル分解で達成する問題を定式化する。
最適場は境界値のみを取るか、ゼロであることを示す。
この研究は、自然科学の幅広い応用において有用であることが期待されている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 16:52:01 GMT)
FLOW: A Feedback-Driven Synthetic Longitudinal Dataset of Work and Wellbeing [0.0] FLOWは、ワークロードとライフスタイル、幸福感の間の日々のインタラクションをモデル化するために設計された、合成長手データセットである。
FLOWは、毎日の解像度で2年間に1000人の個人をシミュレートし、公開されているリソースとしてリリースされている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 14:54:04 GMT)
Evaluating the Performance of Open-Vocabulary Object Detection in Low-quality Image [0.0] 実世界の低品質画像をシミュレートする新しいデータセットを提案する。
低レベル画像劣化下では, オープン語彙オブジェクト検出モデルではmAPスコアが有意に低下しなかったが, 高レベル画像劣化下では, 全てのモデルの性能が急激に低下した。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 06:18:22 GMT)
Energy transport in the Schrödinger plate [0.0] シュルディンガープレート(Schrdinger plate)は、平面外自由度を持つ無限の2次元線形マイクロポーラ弾性体である。
プレートの統治方程式は2次元制約コッサート連続体の方程式として導出される。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 12:07:21 GMT)
Efficient population transfer in a quantum dot exciton under phonon-induced decoherence via shortcuts to adiabaticity [0.0] フォノンによる劣化を伴うGaAs/InGaAs量子ドットにおける断熱パルスにショートカットを適用した。
20thK以下の温度と10thps以下のパルス持続時間では、一般的に非常に優れた転送効率が得られる。
この研究は、要求に応じて単一光子生成のために量子ドットを利用する量子技術に応用されることが期待されている。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 17:33:33 GMT)
Efficient flip-chip and on-chip-based modulation of flux-tunable superconducting resonators [0.0] 本研究では,フリップチップやオンチップ型入力コイルを用いたフラックス可変超伝導共振器(FTR)の効率的な変調を実証する。
我々は、フラックス伝達効率を高めるために、最大0.7nHの幾何ループインダクタンスを持つSQUIDを用いる。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 23:47:47 GMT)
Data Augmentation for Classification of Negative Pregnancy Outcomes in Imbalanced Data [0.0] 本稿では,特にTwitterなどのプラットフォームから公開されているソーシャルメディアデータを用いて,観察研究を通じて陰性妊娠の結果を研究するための現在のデータセットを強化する,新たなアプローチを提案する。
自然言語処理(NLP)パイプラインを構築することにより,妊娠経験を共有する女性を自動的に識別し,報告された結果に基づいて分類することを目指す。
本研究は、母体および胎児の健康状態に対する特定の介入、治療、出生前曝露の因果的影響を評価するための潜在的応用を提供する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 00:22:13 GMT)
Comment on "There is No Quantum World" by Jeffrey Bub [0.0] ジェフリー・バブ(Jeffrey Bub)は、ネオボヘミアの量子力学の解釈について論じている。
物理理論における数学的無限性を認めることは、適切に実行されたとしても問題ではないと我々は主張する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:12:59 GMT)
Bell nonlocality and entanglement in $χ_{cJ}$ decays into baryon pair [0.0] 本稿では,バリオン対への$_cJ$崩壊におけるベル非局所性と絡み合いの系統的解析について述べる。
バリオン-反バリオンスピン密度行列から、測定可能なベル可観測性と収束性を構築する。
その結果、$_cJ$システムは高エネルギー衝突における量子エンタングルメントをテストするための新しいプラットフォームであることが示唆された。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 08:40:25 GMT)
An asymmetric and fast Rydberg gate protocol for long range entanglement [0.0] 我々は、オリジナルの$2-$プロトコルに基づいて、新しいRydbergゲート設計を解析する。
ゲートは、ターゲットキュービット上の2ドルパルスに追加のデチューンを加えて、$2-$の構造を維持している。
このプロトコルは、制御およびターゲット量子ビット上の等しい(非対称)ラビ周波数に対して、リドベルク寿命によって設定された基本忠実度限界の2.39 (1.68) の範囲に到達する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 04:10:38 GMT)
An Architecture-Led Hybrid Report on Body Language Detection Project [0.0] 本報告では、2つの近代視覚言語モデル(VLM)のアーキテクチャによる分析について述べる。
アーキテクチャプロパティがBodyLanguageDetectionで実装された実用的なビデオからアーティファクトパイプラインにどのようにマップされているかを説明する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 18:03:00 GMT)
Aliphatic Chains as One-Dimensional XY Spin Chains [0.0] 本研究は, スピン動力学が脂肪族鎖を含む分子の液体原子核磁気共鳴(NMR)に現れることを示す。
このような分子では、各CH基は異なる化学シフトを持ち、対外結合を介して磁気的に等価でなければならない。
翻訳対称性を持つ鎖に対して、スピンハミルトンは1次元のXYモデルと正式に等価な部分空間に分解される。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:20:36 GMT)
Agency under indefinite causality: operational eternalism in higher-order quantum theory [0.0] 操作量子理論と動的時空物理学の間の緊張は、両方の理論が基本であると信じている場合、橋渡し不可能である。
我々はこの緊張を、ブロック・ユニヴァース・ビューに類似したスタンスである操作永遠主義を通じて解釈するが、幾何ではなく情報に適用する。
結果は、非因果性を避けるためのツールとして、運用アプローチにおけるオブザーバを再定義する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 11:00:41 GMT)
A Micro-Macro Machine Learning Framework for Predicting Childhood Obesity Risk Using NHANES and Environmental Determinants [0.0] 子供の肥満は、米国では依然として主要な公衆衛生上の課題である。
個人レベルの人文・社会経済データを統合したマイクロマクロ機械学習フレームワークを提案する。
NHANESマイクロデータを用いて肥満を予測するために、4つの機械学習モデルが訓練された。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 03:20:04 GMT)
A Low-Cost UAV Deep Learning Pipeline for Integrated Apple Disease Diagnosis,Freshness Assessment, and Fruit Detection [0.0] リンゴ果樹園は、タイムリーな病気の検出、果実の品質評価、収量推定を必要とする。
既存のUAVベースのシステムは、そのようなタスクを単独で処理し、しばしば高価なマルチスペクトルセンサーに依存している。
本稿では,葉病検出のためのResNet50と,リンゴの鮮度判定のためのVGG 16と,リアルタイムのリンゴ検出と局在のためのYOLOv8を統合した,低コストでRGBのみのUAVベースの果樹園用パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 16:19:35 GMT)
A Context-Aware Temporal Modeling through Unified Multi-Scale Temporal Encoding and Hierarchical Sequence Learning for Single-Channel EEG Sleep Staging [0.0] 本研究は、自動睡眠ステージングのための実用的で広く利用可能な信号である、単一チャネル脳波(EEG)に焦点を当てる。
既存のアプローチでは、クラス不均衡、限定された受容場モデリング、不十分な解釈可能性といった課題に直面している。
本研究は,単一チャネル脳波睡眠ステージングのためのコンテキスト認識・解釈可能なフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 28 Dec 2025 15:42:33 GMT)