FFP-300K: Scaling First-Frame Propagation for Generalizable Video Editing [97.4] FFP-300Kは、720p解像度と81フレームの高忠実度ビデオペアの大規模データセットである。
本稿では,第1フレームの外観維持とソース映像の動作保存の緊張を解消する,真の誘導不要なFFPのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 01:46:22 GMT)
On Exact Editing of Flow-Based Diffusion Models [97.1] 本研究では,フローベース編集を既知ソースによって駆動される分散変換問題として再構成する条件付き速度補正(CVC)を提案する。
CVCは、双対パースペクティブな速度変換機構を導入することにより、分配間変換における速度の役割を再考する。
我々は,CVCが優れた忠実度,セマンティックアライメント,多種多様なタスクに対する信頼性の高い編集動作を一貫して達成していることを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:05:00 GMT)
Joint Semantic and Rendering Enhancements in 3D Gaussian Modeling with Anisotropic Local Encoding [86.6] 本稿では,セマンティックとレンダリングの両方を相乗化する3次元セマンティックガウスモデリングのための統合拡張フレームワークを提案する。
従来の点雲形状符号化とは異なり、細粒度3次元形状を捉えるために異方性3次元ガウシアン・チェビシェフ記述子を導入する。
我々は、学習した形状パターンを継続的に更新するために、クロスシーンの知識伝達モジュールを使用し、より高速な収束と堅牢な表現を可能にします。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:33:50 GMT)
Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models [78.7] ネイティブエージェントインテリジェンスと高い計算効率を調和させる軽量言語モデルであるYoutu-LLMを紹介する。
Youtu-LLMは、スクラッチから体系的に推論と計画能力の育成まで事前訓練されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 02:44:28 GMT)
K-EXAONE Technical Report [76.2] K-EXAONEはLG AI Researchが開発した大規模多言語言語モデルである。
256Kのコンテキストウィンドウをサポートし、韓国語、英語、スペイン語、ドイツ語、日本語、ベトナム語をカバーしている。
我々はK-EXAONEを、推論、エージェント、一般、韓国語、多言語能力にまたがる総合的なベンチマークスイートで評価した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 02:30:59 GMT)
SimpleMem: Efficient Lifelong Memory for LLM Agents [73.7] セマンティックロスレス圧縮に基づく効率的なメモリフレームワークSimpleMemを紹介する。
本稿では,情報密度とトークン利用量の最大化を目的とした3段階パイプラインを提案する。
ベンチマークデータセットを用いた実験により,提案手法は精度,検索効率,推論コストにおいて,ベースラインアプローチを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:02:49 GMT)
MotionAdapter: Video Motion Transfer via Content-Aware Attention Customization [73.1] MotionAdapterは、ロバストでセマンティックに整合したモーション転送を可能にする、コンテンツ対応のモーション転送フレームワークである。
我々の重要な洞察は、効果的な動き伝達は外見から運動を明示的に切り離す必要があることである。
MotionAdapterは自然に複雑なモーション転送とズームのようなモーション編集タスクをサポートする。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:01:27 GMT)
Random-Matrix-Induced Simplicity Bias in Over-parameterized Variational Quantum Circuits [72.1] 本稿では,観測可能な期待値とパラメータ勾配の両方がシステムサイズに指数関数的に集中するHaar型普遍性クラスに,表現的変分アンサーゼが入ることを示す。
その結果、そのような回路によって誘導される仮説クラスは、近点関数の狭い族に高い確率で崩壊する。
テンソル-ネットワークベースおよびテンソル-ハイパーネットワークパラメータ化を含むテンソル構造VQCは、ハール型普遍性クラスの外にある。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:04:33 GMT)
HeadLighter: Disentangling Illumination in Generative 3D Gaussian Heads via Lightstage Captures [70.0] 三次元ガウススプラッティングに基づく最近の3次元頭部生成モデルにより, リアルタイム, フォトリアリスティック, ビュー一貫性の頭部合成が可能となった。
照明と内在的な外観の深い絡み合いは、制御可能なリライトを防ぐ。
本稿では,頭部生成モデルにおける外観と照明の物理的に妥当な分解を学習する,新しい教師付きフレームワークであるHeadLighterを紹介する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:32:37 GMT)
CORE: Code-based Inverse Self-Training Framework with Graph Expansion for Virtual Agents [69.9] グラフ拡張を用いたコードベースの逆自己学習フレームワークであるCOREを提案する。
COREは模倣と探索を橋渡しし、行動の多様性を促進する新しいトレーニングフレームワークを提供する。
WebとAndroidプラットフォームの実験では、COREは全体的なパフォーマンスと一般化の両方を著しく改善している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:24:05 GMT)
Talk2Move: Reinforcement Learning for Text-Instructed Object-Level Geometric Transformation in Scenes [69.5] 本研究では,シーン内のオブジェクトのテキストによる空間変換を行うフレームワークであるTalk2Moveを紹介する。
Talk2Moveでは,さまざまなロールアウトを通じて幾何学的アクションを探索するために,グループ相対ポリシー最適化を採用している。
キュレートされたベンチマークの実験では、Talk2Moveは正確で一貫性があり、セマンティックに忠実なオブジェクト変換を実現している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:55:32 GMT)
Toward Global Large Language Models in Medicine [67.4] GlobMedは、12言語にまたがる50,000以上のエントリを含む、大規模な多言語医療データセットである。
GlobMed-Benchは、複数の多言語医療タスクにわたる56の最先端のプロプライエタリでオープンなLLMを評価し、言語間での大幅なパフォーマンス格差を明らかにしている。
GlobMed-LLMはベースラインモデルと比較して平均40%以上のパフォーマンス向上を実現し、低リソース言語では3倍以上のパフォーマンス向上を実現した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:05:49 GMT)
PatchAlign3D: Local Feature Alignment for Dense 3D Shape understanding [67.2] 現在の3次元形状の基礎モデルは、グローバルなタスク(検索、分類)において優れているが、局所的な部分レベルの推論には不十分である。
本稿では,ポイントクラウドから直接,言語対応のパッチレベル機能を生成するエンコーダのみの3Dモデルを提案する。
我々の3Dエンコーダは、テストタイムのマルチビューレンダリングなしで高速なシングルパス推論によるゼロショット3D部分分割を実現する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:55:45 GMT)
NextFlow: Unified Sequential Modeling Activates Multimodal Understanding and Generation [66.9] NextFlowは6兆個のインターリーブされたテキストイメージの離散トークンでトレーニングされたデコーダのみの自動回帰トランスフォーマーである。
統合された自己回帰アーキテクチャ内の統一された視覚表現を活用することで、NextFlowはマルチモーダル理解と生成機能を活性化する。
NextFlowは、統一されたモデルと、視覚的品質における特殊な拡散ベースラインの間で、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:27:04 GMT)
InpaintHuman: Reconstructing Occluded Humans with Multi-Scale UV Mapping and Identity-Preserving Diffusion Inpainting [64.4] InpaintHumanは、モノクロビデオから高忠実で完全でアニマタブルなアバターを生成する新しい方法である。
我々のアプローチは、アイデンティティの忠実性を保証するために、直接ピクセルレベルの監視を採用する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:26:02 GMT)
VIBE: Visual Instruction Based Editor [60.2] 本稿では,高速な命令に基づく画像編集パイプラインを提案する。
パイプラインはImgEditとGEditベンチマークで評価される。
BF16ではNVIDIA H100で最大2K解像度で編集画像を生成するが、追加の推論最適化や蒸留は行わない。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:17:20 GMT)
CycleVLA: Proactive Self-Correcting Vision-Language-Action Models via Subtask Backtracking and Minimum Bayes Risk Decoding [60.1] サイクロンVLA(CycleVLA)は、VLA(Vision-Language-Action Model)を積極的に自己補正するシステムである。
CycleVLAは、重要なサブタスク遷移ポイントにフラグを付けるプログレス対応のVLAを統合することで、これを実現する。
大規模な実験により、CycleVLAは、よく訓練されたVLAと訓練されていないVLAの両方のパフォーマンスを改善することが示された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:31:01 GMT)
SafeLoad: Efficient Admission Control Framework for Identifying Memory-Overloading Queries in Cloud Data Warehouses [59.7] メモリオーバーロードは、クラウドデータウェアハウスにおけるリソースの枯渇の一般的な形態である。
我々は,メモリオーバロード(MO)クエリの特定に特化して設計された,最初のクエリ入力制御フレームワークであるSafeLoadを提案する。
SafeLoadは、オンラインおよびオフライン時間オーバーヘッドの少ない最先端の予測性能を実現する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:29:51 GMT)
Refinement Provenance Inference: Detecting LLM-Refined Training Prompts from Model Behavior [58.8] 本稿では,Refinement Provenance Inference (RPI)監査タスクをRefinement Provenance Inference (RPI)として定式化する。
本稿では,ロジットレベルの信号で教師が強制する可能性機能を融合させるロジットベースのフレームワークであるReProを提案する。
トレーニング中、ReProはシャドウファインチューニングを通じて転送可能な表現を学び、訓練データアクセスなしで、見えない犠牲者の証明を推測するために軽量のリニアヘッドを使用する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:16:41 GMT)
ExposeAnyone: Personalized Audio-to-Expression Diffusion Models Are Robust Zero-Shot Face Forgery Detectors [58.5] ビデオ中のディープフェイクを検出するための完全自己教師型アプローチを提案する。
本モデルでは,拡散再構成誤差を用いて,疑わしい映像とパーソナライズされた被写体との同一性距離を算出する。
本手法は, ボケや圧縮などの汚損に対して極めて堅牢であり, 現実の顔偽造検出への適用性を強調している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:59:54 GMT)
Context-Free Recognition with Transformers [57.5] 我々は、$mathcalO(log n)$ looping layerと$mathcalO(n6)$ padding tokensで全てのCFLを認識可能であることを示す。
実験の結果を実証的に検証し,対数深度を必要とする言語にループが有効であることを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 03:14:23 GMT)
Agentic Memory: Learning Unified Long-Term and Short-Term Memory Management for Large Language Model Agents [57.4] 大規模言語モデル (LLM) エージェントは、有限コンテキストウィンドウによる長距離推論において基本的な制限に直面している。
既存のメソッドは通常、長期記憶(LTM)と短期記憶(STM)を独立したコンポーネントとして扱う。
本稿では,エージェントのポリシーに LTM と STM 管理を直接統合する統合フレームワークである Agentic Memory (AgeMem) を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:24:16 GMT)
Scaling Open-Ended Reasoning to Predict the Future [56.7] 我々は、オープンエンドの予測質問の予測を行うために言語モデルを訓練する。
トレーニングデータをスケールアップするために、毎日のニュースで報告されるグローバルイベントから新しい予測質問を合成する。
トレーニングの予測によるキャリブレーションの改善は、一般的なベンチマークで一般化されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:45:47 GMT)
Dynamic Large Concept Models: Latent Reasoning in an Adaptive Semantic Space [56.4] 大規模言語モデル (LLM) は、高度に一様でない情報密度を示す言語にもかかわらず、全てのトークンに一様計算を適用する。
我々は,潜在表現から意味境界を学習し,トークンから推論がより効率的である圧縮概念空間へ移行する階層型言語モデリングフレームワークである$textbfDynamic Large Concept Models (DLCM)$を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:44:29 GMT)
GDRO: Group-level Reward Post-training Suitable for Diffusion Models [55.9] グループレベルの報酬は、モデルを目標とする報酬と整合させるのに成功します。
Group-level Direct Reward Optimization (GDRO)は、グループレベルの報酬アライメントのための新しいトレーニング後のパラダイムである。
GDROは完全なオフライントレーニングをサポートし、画像ロールアウトサンプリングの大幅なコスト削減を実現する。
これは拡散サンプラー非依存であり、取得性に対するODE-to-SDE近似の必要性を排除している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:47:18 GMT)
LongDA: Benchmarking LLM Agents for Long-Document Data Analysis [55.3] LongDAは、長いドキュメントと複雑なデータをナビゲートする実際の設定をターゲットとしています。
LongTAは、ドキュメントアクセス、検索、コード実行を可能にするツール拡張されたエージェントフレームワークである。
実験の結果, 最先端モデルにおいても, かなりの性能差が認められた。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 23:23:16 GMT)
DermoGPT: Open Weights and Open Data for Morphology-Grounded Dermatological Reasoning MLLMs [54.9] MLLM (Multimodal Large Language Models) は、医学的応用を約束するが、限られたトレーニングデータ、狭いタスクカバレッジ、臨床現場での監督の欠如により、皮膚科の遅れが進行する。
これらのギャップに対処するための包括的なフレームワークを提示します。
まず,211,243のイメージと72,675のトラジェクトリを5つのタスク形式に分けた大規模形態素解析コーパスであるDermo Instructを紹介する。
第二にDermoBenchは、4つの臨床軸(形態学、診断、推論、フェアネス)にまたがる11のタスクを評価する厳密なベンチマークで、3600の挑戦的なサブセットを含む。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:55:36 GMT)
Can LLMs Track Their Output Length? A Dynamic Feedback Mechanism for Precise Length Regulation [50.8] 大きな言語モデル (LLM) は入力テキストの長さを正確に測ることができず、長さの制約に固執しない。
本研究では,生成中の動的長さフィードバックを取り入れた新しい長さ制御手法を提案する。
要約タスクと伝記タスクの実験は、目標トークン、単語、文数を達成する際のトレーニング不要なアプローチにより、精度が大幅に向上することを示している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 03:49:14 GMT)
VerLM: Explaining Face Verification Using Natural Language [50.6] 顔認証のための革新的視覚言語モデル(VLM)を提案する。
我々のモデルは2つの補完的な説明スタイルを用いて一意に訓練されている。
提案するVLMは,高度な特徴抽出技術と高度な推論機能を統合し,検証プロセスの明瞭な記述を可能にする。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:16:07 GMT)
Agentic Retoucher for Text-To-Image Generation [50.4] Agentic Retoucherは階層的な意思決定駆動のフレームワークで、ポストジェネレーションの修正を人間のような知覚・推論・アクションループとして再構成する。
この設計は、知覚的証拠、言語的推論、制御可能な修正を統一された自己修正的決定プロセスに統合する。
実験により、エージェント・リタッチは知覚品質、歪みの局在化、人間の嗜好調整において、最先端の手法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:06:43 GMT)
Hidden State Poisoning Attacks against Mamba-based Language Models [48.5] Mambaのような状態空間モデル(SSM)は、Transformerベースの言語モデルの効率的な代替手段を提供する。
本稿では,これらのモデルにおいて,特定の短い入力句が部分記憶効果を誘導する現象を考察する。
我々のベンチマークであるRoBench25は、HiSPAsを受ける際のモデルの情報検索機能を評価することができる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:27:19 GMT)
Confidence Estimation for LLMs in Multi-turn Interactions [48.1] この研究は、マルチターン相互作用における信頼度推定に関する最初の体系的研究である。
そこで我々は,2つの主要なデシラタに基礎を置く形式的評価枠組みを構築した。
我々の研究は、より信頼性が高く信頼性の高い会話エージェントを開発するための基礎的な方法論を提供する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:58:04 GMT)
Robust Egocentric Visual Attention Prediction Through Language-guided Scene Context-aware Learning [47.3] 本稿では,言語誘導型シーン認識学習フレームワークを提案する。
まず,言語に基づくシーン記述に基づいて,エゴセントリックな映像を要約するための文脈知覚器を設計する。
次に,1)関心領域のターゲットに焦点を合わせること,2) 一人の注意を惹きつける可能性が低い無関係領域からの注意を抑えること,の2つのトレーニング目標を紹介した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:14:41 GMT)
Theoretical Convergence of SMOTE-Generated Samples [47.3] SMOTEの収束特性の厳密な理論的解析を行う。
合成確率変数 Z が基底変数 X に確率収束することを証明する。
最寄りのランクの低い値は、より高速な収束につながる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:19:45 GMT)
Polynomial Convergence of Riemannian Diffusion Models [46.7] 拡散モデルは、現代のAIにおける最先端の生成モデルの一つと見なされている。
既存の文献の多くは、基礎となる空間はユークリッド空間であると仮定している。
多くの実践的応用において、データはユークリッド空間の部分多様体上に置かれることに制約される。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:14:09 GMT)
RelayGR: Scaling Long-Sequence Generative Recommendation via Cross-Stage Relay-Race Inference [46.7] リアルタイムレコメンデータシステムは、厳密なテールレイテンシSLOの下でカスケード(検索、前処理、きめ細かいランキング)を実行する。
本稿では,GRのHBMリレートレース推論を可能にする生産システムであるRelayGRについて述べる。
RelayGRは1.5$times$より長いシーケンスをサポートし、SLO準拠のスループットを最大3.6$times$に改善する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 01:34:06 GMT)
Orchestral AI: A Framework for Agent Orchestration [45.9] Orchestralは軽量なPythonフレームワークで、主要なプロバイダ間でLLMエージェントを構築するための統一型安全なインターフェースを提供する。
プロバイダ間でシームレスに動作し、手作業によるフォーマット変換を排除し、フレームワークが引き起こす複雑さを低減します。
リッチなツールコール、コンテキストのコンパクト化、サンドボックス、ユーザ承認、サブエージェント、メモリ管理、MPP統合など、より大きなフレームワークで見られる高度なエージェント機能をサポートする。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 22:02:11 GMT)
SingingBot: An Avatar-Driven System for Robotic Face Singing Performance [44.7] 本稿では,ロボット歌唱をアピールする新しいアバター駆動型フレームワークを提案する。
我々はまず、人間の前身に埋め込まれたポートレートビデオ生成モデルを活用して、鮮やかな歌唱アバターを合成する。
これらの顔の特徴は、幅広い表現空間にまたがる意味指向マッピング機能を介してロボットに伝達される。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:56:36 GMT)
CSSBench: Evaluating the Safety of Lightweight LLMs against Chinese-Specific Adversarial Patterns [43.1] 本研究では,中国における大規模言語モデル(LLM)の安全性を評価するために,CSSBenchを導入した。
私たちのベンチマークでは、違法な活動やコンプライアンス、プライバシーの漏洩、健康と医療の誤報、詐欺と憎悪、公共と政治の安全など、実際の中国のシナリオで一般的な6つのドメインをカバーしています。
以上の結果から,中国固有の対数パターンは軽量LLMにとって重要な課題であることが明らかとなった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:37:42 GMT)
EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning [42.3] 大きな言語モデル(LLM)は、長期の対話エージェントとしてますますデプロイされているが、その限られたコンテキストウィンドウは、拡張された相互作用よりもコヒーレントな振舞いを維持するのが困難である。
本稿では,EverMemOSについて紹介する。EverMemOSは,計算メモリにエミュレートされたライフサイクルを実装した自己組織型メモリオペレーティングシステムである。
EverMemOSは、メモリ拡張推論タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:39:43 GMT)
Unraveling MMDiT Blocks: Training-free Analysis and Enhancement of Text-conditioned Diffusion [41.4] テキスト条件と異なるブロックとそれらの相互作用が合成過程にどのように寄与するかを考察する。
分析の結果,先行ブロックに意味情報が出現し,後続ブロックに細部の詳細が描画されることが判明した。
テキストアライメントの改善, 正確な編集, アクセラレーションのための新しいトレーニングフリー戦略を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:32:53 GMT)
Vision-Language Reasoning for Geolocalization: A Reinforcement Learning Approach [41.0] 提案するGeo-Rは,既存の接地トラス座標から構造的推論経路を明らかにする,検索不要なフレームワークである。
本稿では,ルールに基づく階層的推論パラダイムである領域の連鎖を提案する。
提案手法は,空間的直接監視による地理的推論を構造化し,位置推定精度の向上,一般化の強化,透過的な推論を行う。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:27:19 GMT)
Mind the Gap: Continuous Magnification Sampling for Pathology Foundation Models [39.8] 広範に使用されている離散的な倍率の均一サンプリングにより,中間倍率の劣化が生じることを示す。
倍率スケールで表現品質を最適化するサンプリング分布を導出する。
実験により、連続サンプリングは中間倍率での離散サンプリングよりも大幅に改善されることが示された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:19:59 GMT)
MORE: Multi-Objective Adversarial Attacks on Speech Recognition [39.8] Whisperのような大規模自動音声認識(ASR)モデルは、様々な現実世界のアプリケーションで採用を広げている。
したがって、小さな入力の摂動に対する堅牢性は、リアルタイム環境における信頼性の高い性能を維持するために重要である。
認識精度と推論効率を両立させる多目的反復倍増促進攻撃MOREを導入する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:27:57 GMT)
Reporting LLM Prompting in Automated Software Engineering: A Guideline Based on Current Practices and Expectations [39.6] 大規模言語モデルは、ソフトウェアエンジニアリングタスクの自動化にますます使われています。
これらのモデルは自然言語のプロンプトを通じて導かれるため、システムパフォーマンスと振る舞いにおいて、迅速なエンジニアリングが重要な要素となる。
SE研究での役割が増大しているにもかかわらず、プロンプトに関連する決定は、体系的または透明な方法で文書化されることは滅多にない。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:01:20 GMT)
PauliEngine: High-Performant Symbolic Arithmetic for Quantum Operations [39.4] PauliEngineは高性能なC++フレームワークで、Pauli文字列、演算子、シンボル位相追跡、構造変換のための効率的なプリミティブを提供する。
PauliEngineは数値係数とシンボル係数の両方をサポートし、Pythonインターフェースを介してアクセスすることができる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:00:44 GMT)
Normalized Conditional Mutual Information Surrogate Loss for Deep Neural Classifiers [39.0] 我々は,デファクト・クロスエントロピー(CE)の代替として,新しい情報理論的サロゲート損失,正規化条件付き相互情報(NCMI)を提案する。
画像認識と全スライディングイメージング(WSI)サブタイピングベンチマークを通じて、NCMIでトレーニングされたモデルは、CEと同等の計算コストで、かなりのマージンのアート損失の状態を超越した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 20:37:03 GMT)
Towards Automated Lexicography: Generating and Evaluating Definitions for Learner's Dictionaries [37.9] 辞書定義生成(DDG)、すなわち、与えられた見出しに対する非文脈定義の生成について研究する。
具体的には,学習者の辞書定義生成(LDDG)に対処する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:11:24 GMT)
Generative AI for Social Impact [37.4] AI for Social Impact(AI4SI)は、公衆衛生、保護、セキュリティにおいて魅力的な成果を上げている。
我々は,このボトルネックを,限られたデータや信頼できないデータから生じる観察的不足,決定や非定常性に関わる政策課題,人間とAIの整合性の摩擦という3つのギャップを通じて特徴づける。
我々は、生成AIがこれらのギャップを埋める統一的な経路を提供すると主張する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 02:44:39 GMT)
Learning Diffusion Policy from Primitive Skills for Robot Manipulation [37.0] 拡散政策(DP)は近年,ロボット操作における行動の生成において大きな期待を抱いている。
本稿では,解釈可能なスキル学習と条件付きアクションプランニングを統合した,スキル条件付きDPであるSDPを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:56:24 GMT)
Probing Dark Matter-Electron Interactions with Superconducting Qubits [36.9] 量子デバイス測定は暗黒物質相互作用を探索する強力なツールである。
トランスモンの最近の測定は、様々な実験装置において、熱ノイズや既知の外部源によって説明されていないデコヒーレンス時間への残留的な寄与を一貫して測定している。
このような測定は、keVスケールでの暗黒物質電子散乱と暗黒光子吸収の競合的制約に、これまでで最も厳密な実験室ベースの制約を設定するために用いられる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:00:02 GMT)
VINO: A Unified Visual Generator with Interleaved OmniModal Context [36.7] VINOは、単一のフレームワーク内で画像とビデオの生成と編集を行う統合ビジュアルジェネレータである。
タスク固有のモデルやモジュールを各モダリティに依存するのではなく、VINOは共有拡散バックボーンを使用する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:56:34 GMT)
Seeing the Unseen: Zooming in the Dark with Event Cameras [36.5] 低照度ビデオ超解像(LVSR)は、低照度低解像度(LR)入力から高解像度映像を復元することを目的としている。
既存のLVSR法は、コントラストが限られ、高周波情報が不十分なため、細部を回復するのにしばしば苦労する。
我々はRetinexEVSRについて紹介する。RetinexEVSRは、高コントラストなイベント信号とRetinexにインスパイアされた事前情報を利用して、低照度シナリオ下での画質向上を実現する、最初のイベント駆動型LVSRフレームワークである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:31:07 GMT)
Beyond Segmentation: An Oil Spill Change Detection Framework Using Synthetic SAR Imagery [36.5] オイルスパイル変化検出(OSCD)は、プリスパイルSAR画像とポストスパイルSAR画像の間の変化を特定することに焦点を当てた、新しいバイタイムタスクである。
その結果,OSCDは偽陽性を有意に低減し,従来のセグメンテーションに比べて検出精度が向上した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:10:13 GMT)
Adapting Depth Anything to Adverse Imaging Conditions with Events [36.0] 劣化シーンにおける奥行き情報のためのイベント誘導型時間融合フレームワークであるADAEを提案する。
我々は,情報エントロピー戦略を用いて,フレームベースとイベントベースの機能を適応的にマージする。
我々は、ぼやけた地域で不明瞭な特徴を再検討するために、イベントベースの動きキューを利用する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:29:49 GMT)
WebGym: Scaling Training Environments for Visual Web Agents with Realistic Tasks [36.0] WebGymは、現実的なビジュアルWebエージェントをトレーニングするための、これまでで最大のオープンソース環境である。
WebGymには30万近いタスクがあり、さまざまな現実世界のウェブサイトでルーブリックベースの評価が行われている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:35:11 GMT)
Hunting for "Oddballs" with Machine Learning: Detecting Anomalous Exoplanets Using a Deep-Learned Low-Dimensional Representation of Transit Spectra with Autoencoders [35.6] 本研究では, 異常検出のためのオートエンコーダを用いた機械学習手法の適用について検討した。
我々は,大気大挑戦 (ABC) データベースを用いて,CO2の豊富な大気を異常として,CO2の少ない大気を正常なクラスとして定義し,異常検出シナリオを構築する。
我々は、オートエンコーダ再構成損失、ワンクラスサポートベクトルマシン(1クラスSVM)、K平均クラスタリング、ローカルアウトリーファクタ(LOF)の4つの異なる異常検出戦略をベンチマークした。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:15:53 GMT)
ESGaussianFace: Emotional and Stylized Audio-Driven Facial Animation via 3D Gaussian Splatting [34.7] ESGaussianFaceは感情的でスタイル化された音声駆動の顔アニメーションのための革新的なフレームワークである。
本稿では,感情特徴と音声コンテンツ特徴を効果的に統合する感情誘導型空間アテンション手法を提案する。
得られた結果から, 高効率, 高品質, 3D の整合性が得られた。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:19:38 GMT)
DiffProxy: Multi-View Human Mesh Recovery via Diffusion-Generated Dense Proxies [34.5] Diffproxyは、メッシュリカバリのためのマルチビュー一貫性のあるヒューマンプロキシを生成する新しいフレームワークである。
5つの実世界のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:51:45 GMT)
Environment-Adaptive Covariate Selection: Learning When to Use Spurious Correlations for Out-of-Distribution Prediction [33.7] 結果の真の原因のサブセットのみを観測した場合に,アウト・オブ・ディストリビューション予測が失敗することを示す。
環境適応型共変量選択アルゴリズムを提案する。
EACSは、様々な分布シフトの下で静的因果、不変、およびERMベースの予測器を一貫して上回る。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:13:02 GMT)
Deferred Commitment Decoding for Diffusion Language Models with Confidence-Aware Sliding Windows [33.4] トレーニング不要なデコード戦略として,Dederred Commitment Decoding (DCD)を提案する。
DCDは、マスクされたトークンの上に信頼性を意識したスライディングウィンドウを保持しており、十分な文脈証拠が得られるまで、高い不確実性トークンを延期しながら、早期に低不確実性トークンを解決している。
実験の結果、DCDは固定ブロックベースの拡散法に比べて平均時間で1.39%向上し、最も顕著な改善は9.0%に達した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:57:33 GMT)
Identification of fixations and saccades in eye-tracking data using adaptive threshold-based method [32.9] 視線力学のマルコフ近似に基づく適応的手法を導入・評価する。
速度閾値の閾値は,自由視聴と視覚検索の両方において,最高基準精度(90~93%)を達成する。
適応閾値は、極端ノイズレベルにおいても81%以上の精度を維持しながら、優れたノイズロバスト性を示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 00:42:28 GMT)
Explore the Ideology of Deep Learning in ENSO Forecasts [32.9] 本稿では,有界変動関数に基づく数学的基盤の解釈可能性フレームワークを提案する。
活性化機能の飽和領域から「死」ニューロンを回収することにより、モデルの表現能力を高める。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:15:39 GMT)
Routing by Analogy: kNN-Augmented Expert Assignment for Mixture-of-Experts [32.7] Mixture-of-Experts (MoE)アーキテクチャは、パラメトリックな"router"を使用して、トークンを専門家のまばらなサブセットにディスパッチすることで、大きな言語モデルを効率的にスケールする。
我々は、類似したケースのメモリから最適な専門家の割り当てを再利用する検索強化ルーティングフレームワークであるkNN-MoEを紹介する。
実験の結果、kNN-MoEはゼロショットベースラインよりも優れており、計算コストのかかる微調整に匹敵することがわかった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:16:11 GMT)
AFTER: Mitigating the Object Hallucination of LVLM via Adaptive Factual-Guided Activation Editing [32.6] LVLM(Large Vision-Language Models)は、物体の幻覚に影響を受けやすい。
LVLMの内部活性化の編集は、最小コストで幻覚を緩和するのに有望な効果を示した。
幻覚軽減のための適応的ファクトガイド型ビジュアルテキスト編集法を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:02:22 GMT)
MovieRecapsQA: A Multimodal Open-Ended Video Question-Answering Benchmark [32.5] MovieRecapsQAは、入力の明示的なテキストコンテキストを提供する、オープンなVideoQAベンチマークである。
我々のベンチマークでは、複数の長さの動画(recap-segments, movie-segments)と(モダリティと型による)質問の分類を提供し、きめ細かい分析を可能にする。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 20:17:25 GMT)
RIMRULE: Improving Tool-Using Language Agents via MDL-Guided Rule Learning [31.9] RIMRULEは、動的規則注入に基づく大規模言語モデル(LLM)適応のためのニューロシンボリックアプローチである。
コンパクトで解釈可能なルールは、障害トレースから蒸留され、推論中にプロンプトに注入され、タスク性能が向上する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:14:46 GMT)
VAR RL Done Right: Tackling Asynchronous Policy Conflicts in Visual Autoregressive Generation [31.2] ビジュアル生成はAutoRegressive(AR)、拡散、Visual AutoRegressive(VAR)の3つのパラダイムで支配されている。
ARや拡散とは異なり、VARは生成ステップをまたいだ異種入力構造で動作し、厳しい非同期ポリシーの衝突を引き起こす。
本稿では,これらの対立を明示的に管理することで,グループ相対政策最適化(GRPO)を強化する新しい枠組みを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:36:40 GMT)
Point-SRA: Self-Representation Alignment for 3D Representation Learning [29.4] マスク付きオートエンコーダ(MAE)は3次元表現学習において支配的なパラダイムとなっている。
本稿では,自己蒸留と確率的モデリングにより表現を整列するPoint-SRAを提案する。
3Dオブジェクト検出では、PSRAは47.3%のAP@50を達成し、MaskPointを5.12%上回っている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 02:44:21 GMT)
SLGNet: Synergizing Structural Priors and Language-Guided Modulation for Multimodal Object Detection [28.8] 凍結した視覚変換器(ViT)に基づく基礎モデルにおいて,階層構造と言語誘導変調を相乗化するフレームワークであるSLGNetを提案する。
SLGNetは66.1mAPを実現し、トレーニング可能なパラメータを従来のフル微調整と比較して約87%削減した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:31:41 GMT)
CogFlow: Bridging Perception and Reasoning through Knowledge Internalization for Visual Mathematical Problem Solving [28.6] 本稿では,認知に触発された新しい3段階のフレームワークであるCogFlowについて紹介する。
抽出された視覚的手がかりをその後の推論に忠実に統合することを保証するために,知識内部化リワードモデルを導入する。
また、120K以上の高品質な知覚関連アノテーションを持つサンプルを含むモデルトレーニングのための新しいデータセットMathCogも提供します。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:02:18 GMT)
DDNet: A Dual-Stream Graph Learning and Disentanglement Framework for Temporal Forgery Localization [28.2] AIGC技術は、ビデオ内のごく小さなセグメントを改ざんすることで、視聴者を誤解させることを可能にする。
時間的フォージェリーローカライゼーション(TFL)は、改ざんされたセグメントを正確に特定することを目的としている。
時間的フォージェリーローカライゼーション(DDNet)のためのアンダーライン・ストリームグラフ学習とアンダーライン・ディスタングルメント・フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:35:39 GMT)
Genie Sim 3.0 : A High-Fidelity Comprehensive Simulation Platform for Humanoid Robot [28.2] 我々は,ロボット操作のための統一シミュレーションプラットフォームGenie Sim 3.0を紹介する。
本稿では,大規模言語モデル(LLM)を用いた自然言語命令による高忠実度シーン構築ツールであるGenie Sim Generatorを紹介する。
200以上のタスクにまたがる1万時間以上の合成データからなるオープンソースデータセットもリリースしています。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:59:39 GMT)
Learning with Monotone Adversarial Corruptions [28.1] 標準的な機械学習アルゴリズムがデータの交換可能性や独立性に依存する範囲について検討する。
この結果から, 最適な学習アルゴリズムが, モノトーンの汚損に対してどのように崩壊するかが明らかとなった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:16:26 GMT)
Judging with Personality and Confidence: A Study on Personality-Conditioned LLM Relevance Assessment [27.6] 大きな言語モデル(LLM)は、特定の性格特性をシミュレートし、それらの特徴と一致する振る舞いを生成する。
シミュレーションされた個性が、信頼性の校正、特に過信や過信に対する傾向にどのように影響するかを調査する研究はほとんどない。
低同意性などの個性は、不適切な条件よりも、常に人間のラベルと密に一致していることを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:46:29 GMT)
Towards Any-Quality Image Segmentation via Generative and Adaptive Latent Space Enhancement [27.6] Segment Anything Models (SAM) は例外的なゼロショットセグメンテーション性能で知られている。
しかし、その性能は著しく劣化した低品質の画像に対して著しく低下し、現実のシナリオではその効果が制限される。
低画質画像におけるロバスト性を高めるために生成遅延空間拡張を利用するGleSAM++を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:28:58 GMT)
Crafting Adversarial Inputs for Large Vision-Language Models Using Black-Box Optimization [27.3] 同時摂動近似(ZO-SPSA)を用いたゼロ階最適化によるLVLM(Large Vision-Language Models)に対するブラックボックスジェイルブレイク攻撃を提案する。
InstructBLIP, LLaVA, MiniGPT-4の3つのLVLM上でZO-SPSAを評価し, InstructBLIPのジェイルブレイク成功率は83.0%であった。
これらの知見は、ブラックボックスジェイルブレイクの現実的な実現可能性を強調し、現在のLVLMの安全性メカニズムにおける重大な弱点を明らかにしている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 02:49:33 GMT)
LLM-Empowered Functional Safety and Security by Design in Automotive Systems [27.1] 本稿では,セキュリティを意識したシステムトポロジ設計の側面と,イベント駆動意思決定コード解析について述べる。
コード分析には、機能安全性の体系的検証のための正式な基盤を提供するイベントチェーンモデルを採用しています。
トポロジーのセキュリティ面の分析は、モデル駆動工学(MDE)アプローチとオブジェクト制約言語(OCL)ルールとのシナジーに依存している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:37:08 GMT)
CD4LM: Consistency Distillation and aDaptive Decoding for Diffusion Language Models [27.1] CD4LMは、推論からトレーニングを分離するフレームワークである。
GSM8Kでは、CD4LMはLLaDAベースラインと5.18倍のウォールクロック速度でマッチする。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:09:22 GMT)
PsychEval: A Multi-Session and Multi-Therapy Benchmark for High-Realism and Comprehensive AI Psychological Counselor [26.8] textttPsychEvalは、3つの重要な課題に対処するために設計された、マルチセッション、マルチセラピー、そして非常に現実的なベンチマークである。
メモリ連続性、適応推論、縦計画などの重要な機能を必要とする。
データセットには677以上のメタスキルと4577のアトミックスキルを含む、広範なプロフェッショナルスキルが注釈付けされている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:26:57 GMT)
Remote Sensing Change Detection via Weak Temporal Supervision [26.7] 我々は、既存の単一時間データセットの時間的追加観測を活用する、弱い時間的監視戦略を導入する。
具体的には、異なるタイミングで取得した新しい観測データを用いて、単一日付のリモートセンシングデータセットを拡張し、実際のバイテンポラルペアにほとんど変化がないと仮定して、変更検出モデルをトレーニングする。
我々はFLAIRとIAILDの航空データセットの拡張バージョンに対するアプローチを検証し、強力なゼロショットと低データレシエーション性能を実現する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:57:02 GMT)
MANGO:Natural Multi-speaker 3D Talking Head Generation via 2D-Lifted Enhancement [26.3] 既存の3D会話アバターアプローチは、きめ細かい顔のダイナミクスを捉えるのに失敗した、エラーを起こしやすい擬似3Dラベルに依存している。
擬似3Dラベルがもたらすノイズを軽減するために、交互にトレーニングすることで、純粋な画像レベルの監視を活用する新しい2段階フレームワークMANGOを提案する。
本手法は,2人の対話動作をモデル化する際の例外的精度と現実性を実現し,音声駆動音声ヘッドの忠実度と制御性を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 02:59:49 GMT)
Compositional Diffusion with Guided Search for Long-Horizon Planning [25.9] 合成生成モデルのためのCDGSを用いた合成拡散法を提案する。
提案手法は,人口ベースサンプリングによる局所モードの多種多様な組み合わせ,確率ベースフィルタリングによる不実現候補の探索,反復的再サンプリングによる大域的一貫性の検証を行う。
このアプローチはドメインをまたいで一般化され、テキスト誘導パノラマ画像と長いビデオが、効果的なローカル-グローバルメッセージパッシングによって実現される。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:30:54 GMT)
Prior Diffusiveness and Regret in the Linear-Gaussian Bandit [25.7] 我々はトンプソンサンプリングが$tildeO(d sqrtT + d r sqrtmathrmTr(_0))$ Bayesian regret in the linear-Gaussian bandit。
新たな楕円ポテンシャルの補題を用いてこれらの結果を確立し、バーンイン項が避けられないことを示す下界を与える。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:30:08 GMT)
RealPDEBench: A Benchmark for Complex Physical Systems with Real-World Data [25.5] 本稿では,実世界計測とペア数値シミュレーションを統合した科学機械学習(ML)の最初のベンチマークであるRealPDEBenchを紹介する。
RealPDEBenchは5つのデータセット、3つのタスク、8つのメトリクス、10のベースラインで構成される。
実験では、シミュレーションデータと実世界のデータの間に大きな相違点が示され、シミュレーションデータによる事前学習は、精度と収束性の両方を一貫して改善することを示した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:49:13 GMT)
Demonstration of Discrete-Time Quantum Walks and Observation of Topological Edge States in a Superconducting Qutrit Chain [25.1] 量子ウォークは、普遍的な量子コンピューティングとアルゴリズム研究のための汎用的なツールである。
超伝導回路における拡張性DTQWを実験的に実証し、量子ウォークの量子列における弾道的な拡散を観察した。
この2つの位相相の界面に有界な粒子ホール対称性保護エッジ状態が超伝導プラットフォームで初めて観測された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 03:28:41 GMT)
OpenSocInt: A Multi-modal Training Environment for Human-Aware Social Navigation [24.8] マルチモーダルなソーシャルインタラクションのシミュレータを提供するオープンソースソフトウェアパッケージであるOpenSocIntを紹介する。
我々のフレームワークは、異なる知覚的特徴、その符号化と融合、および異なるエージェントの使用を探索することができる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:48:18 GMT)
360-GeoGS: Geometrically Consistent Feed-Forward 3D Gaussian Splatting Reconstruction for 360 Images [24.6] 3Dシーンの再構築は、AR、ロボティクス、デジタルツインといった空間知能の応用に欠かせない。
本稿では,幾何的に一貫したガウス原始体を生成することができる,360度画像のための新しいフィードフォワード3DGSフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:28:28 GMT)
Inferring Network Evolutionary History via Structure-State Coupled Learning [24.3] 時間的アノテーションが制限された単一の最終スナップショットからネットワークの進化履歴を推測することは、基本的だが難しい。
本稿では、ネットワーク進化史推定のための追加的かつ広くアクセス可能な観測として、ネットワーク定常状態力学を利用する。
6つの実時間ネットワークの実験は、複数の動的プロセスで評価され、CS$2$は強いベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:53:44 GMT)
Evaluating Reward Model Generalization via Pairwise Maximum Discrepancy Competitions [24.0] Pairwise Maximum Discrepancy Competition (PMDC) はRM一般化を評価するための動的かつアノテーション効率の良いフレームワークである。
PMDCは、2つのRM間の不一致を最大化するプロンプト応答対を積極的に選択する。
PMDCを用いて10個の代表RMを再評価し,従来のベンチマークと比較し,実質的なランクリシャッフルを観測する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:14:21 GMT)
Tackling Resource-Constrained and Data-Heterogeneity in Federated Learning with Double-Weight Sparse Pack [23.8] フェデレートラーニングは研究者から広く関心を集めているが、エッジクライアント間のデータの均一性は依然として重要な課題である。
本稿では,コサインスペーシフィケーションパラメータのパッキングと二重重み付きアグリゲーションに基づく,パーソナライズされたフェデレーション学習手法を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:03:04 GMT)
DeeperBrain: A Neuro-Grounded EEG Foundation Model Towards Universal BCI [23.4] DeeperBrainは、ドメイン固有の帰納バイアスをモデル設計と学習目的に統合する、神経基盤モデルである。
エンドツーエンドの微調整の下で、最先端または高い競争性能を達成する。
DeeperBrainは厳密な凍結プロブリングプロトコルの下で優れた効果を維持している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:31:45 GMT)
Real-Time Lane Detection via Efficient Feature Alignment and Covariance Optimization for Low-Power Embedded Systems [22.6] 組込みシステムにおけるリアルタイム車線検出は、RGB画像の微妙でスパースな視覚信号のため、重大な課題に直面している。
本稿では,効率的なリアルタイムアプリケーションに特化して設計された,革新的な共分散分散最適化(CDO)モジュールを提案する。
CDOモジュールは、車線特徴分布を地上構造ラベルと密接に一致させ、計算複雑性を増大させることなく検出精度を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 00:06:06 GMT)
Crystal-KV: Efficient KV Cache Management for Chain-of-Thought LLMs via Answer-First Principle [22.4] CoT(Chain-of-Thought)推論は複雑なタスクの精度を大幅に向上させる。
CoTは最終的な答えを強調し、従来のKV圧縮戦略を非効率にする。
CoT推論に適した効率的なKVキャッシュ管理フレームワークであるCrystal-KVを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:42:58 GMT)
TravelBench: A Broader Real-World Benchmark for Multi-Turn and Tool-Using Travel Planning [22.3] 旅行計画は、大規模言語モデル(LLM)計画とツール使用能力をテストするための自然な現実的なタスクである。
TravelBenchは、完全な現実世界の旅行計画のベンチマークである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:19:13 GMT)
InfiniteVGGT: Visual Geometry Grounded Transformer for Endless Streams [22.3] InfiniteVGGT (InfiniteVGT) は、ローリングメモリの概念を、有界で適応的で永続的に表現可能なKVキャッシュを通じて操作する因果的視覚幾何学変換器である。
本稿では,約1万フレームの連続3次元幾何推定を厳密に評価できるLong3Dベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:11:00 GMT)
AFA-LoRA: Enabling Non-Linear Adaptations in LoRA with Activation Function Annealing [22.0] AFA-LoRAは、シームレスなマージ性を維持しながら、非線形表現性をLoRAにもたらす新しいトレーニング戦略である。
教師付き微調整,強化学習,投機的復号化に本手法を適用した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:00:54 GMT)
Entropy-Aligned Decoding of LMs for Better Writing and Reasoning [22.0] 言語モデル(LM)は、真の言語分布を回復するために、数十億のトークンで訓練されている。
現在、LMからのバニラランダムサンプリングは、品質の低い世代を生み出している。
本稿では,将来の軌道のエントロピーをLMデコーディングに組み込んだ超パラメータフリーデコーディング手法EPICを紹介する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 01:37:10 GMT)
360DVO: Deep Visual Odometry for Monocular 360-Degree Camera [21.8] 深層学習に基づく全方位視覚計測フレームワークである360DVOを提案する。
提案手法では,360度画像から歪み耐性特徴を適応的に学習する歪み対応球面特徴抽出器を提案する。
現実的な設定での評価を容易にするため、我々は新しい実世界のOVOベンチマークにも貢献する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:52:50 GMT)
TalkPhoto: A Versatile Training-Free Conversational Assistant for Intelligent Image Editing [21.7] MLLM(Multimodal Large Language Models)は、命令と画像間の情報交換を促進する。
これらのフレームワークは、複数の編集タスクを処理するためにモデルをトレーニングするために、しばしばマルチインストラクションデータセットを構築する。
本研究では,対話型インタラクションによる正確な画像操作を容易にする,多目的なトレーニング不要な画像編集フレームワークであるTalkPhotoを紹介する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:00:32 GMT)
A Review of Online Diffusion Policy RL Algorithms for Scalable Robotic Control [21.2] 拡散政策はロボット制御の強力なアプローチとして現れている。
スケーラブルなロボット制御システムのためのオンライン拡散政策強化学習(オンラインDPRL)アルゴリズムについて検討した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:19:23 GMT)
CausalNav: A Long-term Embodied Navigation System for Autonomous Mobile Robots in Dynamic Outdoor Scenarios [20.8] CausalNavは、動的な屋外環境に適したグラフベースのセマンティックナビゲーションフレームワークである。
LLMを用いたマルチレベルセマンティック・シーングラフを構築し、粗粒度マップデータと細粒度オブジェクトエンティティを階層的に統合する。
オフラインマップデータとリアルタイム認識を融合することにより、Embodied Graphはさまざまな空間的粒度にわたる堅牢なナビゲーションをサポートする。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:00:34 GMT)
Dancing Points: Synthesizing Ballroom Dancing with Three-Point Inputs [20.7] バーチャルリアリティ(VR)デバイスから利用可能な3点軌跡は,ダンサーの動作記述子として効果的に機能することを示す。
我々は、リーダーの3点入力から直接、フォロワーの3点軌道を予測するために効率的なネットワークを利用する。
提案手法は,没入型ペアダンスアプリケーションに新たな可能性をもたらす,計算的かつデータ効率のよいソリューションを提供する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:24:12 GMT)
AgentMark: Utility-Preserving Behavioral Watermarking for Agents [20.3] AgentMarkは、ユーティリティを保持しながら、計画決定にマルチビット識別子を組み込むフレームワークである。
エージェントから明示的な挙動分布を抽出し、分布保存条件サンプリングを適用する。
具体化、ツール利用、社会環境における実験は、実用的なマルチビット容量、部分ログからの堅牢な回復、ユーティリティ保存を実証している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:42:18 GMT)
Safety at One Shot: Patching Fine-Tuned LLMs with A Single Instance [20.1] 安全アライメントは, 単一の安全事例のみで完全に回復可能であることを示す。
安全勾配の低ランク構造を明らかにし,なぜこのような効率的な補正が可能かを説明する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:26:34 GMT)
SurgWorld: Learning Surgical Robot Policies from Videos via World Modeling [20.0] SurgWorldは外科用物理AI用に設計された世界モデルである。
SurgeWorldは多様な、一般化可能な、リアルな手術ビデオを生成する。
合成外科的ビデオから擬似キネマティクスを推測するために逆動力学モデルを用いた最初の例である。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:58:32 GMT)
COMPASS: A Framework for Evaluating Organization-Specific Policy Alignment in LLMs [19.7] 本稿では,大規模言語モデルが組織的な許容範囲と否定範囲のポリシーに準拠しているかどうかを評価するための最初の体系的枠組みを提案する。
モデルは正当な要求を確実に処理するが、破滅的に禁止を強制することに失敗し、敵の否定主義違反の13-40%しか否定しないことを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:57:45 GMT)
Face Normal Estimation from Rags to Riches [19.4] 本稿では,顔の正規分布推定のための粗大な正規分布推定器を開発する。
遠距離依存を捕捉するために自己注意機構が使用され、推定された粗い顔の正常な局所的なアーティファクトを修復する。
入力された顔画像と対応する模範品とを高精細な顔の正常品にマッピングするために、精細化ネットワークをカスタマイズする。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:57:24 GMT)
EPD-Serve: A Flexible Multimodal EPD Disaggregation Inference Serving System On Ascend [19.4] マルチモーダルモデルのためのステージレベルの分散推論サービスシステムであるEPD-Serveを提案する。
EPD-Serveは推論パイプラインを独立したEncode、Prefill、Decodeステージに分離する。
高速なシナリオでは、PD-disaggregatedデプロイメントと比較して、PD-Serveはエンドツーエンドのスループットを57.37-69.48%改善する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 03:17:15 GMT)
DéjàQ: Open-Ended Evolution of Diverse, Learnable and Verifiable Problems [19.4] DéjQは、モデルトレーニングと並行して、多様な数学的問題の集合を進化させるフレームワークである。
この進化過程は訓練を通じてモデルの能力に適応し、学習可能性に関する問題を最適化する。
このモデルが新規で有意義な問題を生じさせ,これらのLSMによる突然変異がRLトレーニングを改善することが判明した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:27:49 GMT)
Multi-granularity Interactive Attention Framework for Residual Hierarchical Pronunciation Assessment [19.0] 本稿では,粒度をまたいだ双方向モデリングが可能な,新しい階層型対話手法HIAを提案する。
また,音響階層をモデル化する際の特徴忘れ問題を軽減するために,残像階層構造を提案する。
私たちのモデルは、既存の最先端の手法より総合的に先行しています。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 02:43:04 GMT)
DisCo-FLoc: Using Dual-Level Visual-Geometric Contrasts to Disambiguate Depth-Aware Visual Floorplan Localization [18.9] 既存の手法は、幾何学的先行と巧妙に一致するか、あるいはスパース意味論を用いてFLOCの不確実性を減少させる。
深度認識の視覚的特徴を曖昧にするために2段階のビジュアル・ジオメトリ・コントラストを利用するDisCo-FLOCを提案する。
提案手法は最先端のセマンティック・ベースの手法より優れており,ロバスト性と精度の両面で有意な改善が達成されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:31:24 GMT)
Global Parametric Gates for Multi-qubit Entanglement [18.2] 一つのステップで複数ビットの絡み合った状態を生成するグローバルパラメトリックゲートを提案し,実験的に実証する。
計算量子ビットに対して正確なデチューニングで共通の量子ビットにパラメトリックドライブを適用することで、99.4%pm0.2%の状態忠実度を持つ2, 3, 4量子ビットの絡み合わせを直接生成する。
この方式はマイクロ波駆動のみを使用して効率よく再構成可能な制御を可能にし、固定周波数キュービットと互換性がある。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:44:42 GMT)
MagicFight: Personalized Martial Arts Combat Video Generation [18.0] 本稿では,新たな課題であるPersonalized Martial Arts Combat Video Generationを紹介する。
私たちのアプローチであるMagicFightは、これらのハードルを克服するために特別に作られています。
ゲーム物理エンジンのUnityを用いて,bespokeデータセットを生成する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:34:17 GMT)
FedBiCross: A Bi-Level Optimization Framework to Tackle Non-IID Challenges in Data-Free One-Shot Federated Learning on Medical Data [17.9] FedBiCross はパーソナライズされた OSFL フレームワークであり,(1) モデル出力の類似性によるクラスタリングクライアントのコヒーレントなサブアンサンブル,(2) 双方向クラスタ最適化,(3) クライアント固有の適応のためのパーソナライズされた蒸留,の3段階からなる。
4つの医療画像データセットの実験により、FedBiCrossは、非IID度の異なる最先端のベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:46:11 GMT)
RainBalance: Alleviating Dual Imbalance in GNSS-based Precipitation Nowcasting via Continuous Probability Modeling [17.8] 降水流の二重不均衡問題に対処するための連続確率モデリングに基づくフレームワークであるRainBalanceを提案する。
この連続確率空間で学習することにより、このタスクは、単一および非バランスな降水ラベルの適合から連続確率ラベルの分布のモデル化へと再構成される。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:07:43 GMT)
ACDZero: Graph-Embedding-Based Tree Search for Mastering Automated Cyber Defense [17.5] 我々はモンテカルロ木探索(MCTS)に基づく計画中心の防衛政策を提案する。
我々は,ネットワークからの観測を属性グラフとして埋め込むために,グラフニューラルネットワーク(GNN)を新たに利用している。
本研究では,多様なネットワーク構造と敵行動を含むCC4シナリオにおけるエージェントの評価を行った。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:18:54 GMT)
DatBench: Discriminative, Faithful, and Efficient VLM Evaluations [17.5] 経験的評価は、基礎モデルにおける研究の進展を導く主要なコンパスとして機能する。
評価が満足すべき3つのデシラタを提案する。モダリティと応用への忠実さ、品質の異なるモデル間の識別可能性、計算効率である。
私たちはDatBench-Fullをリリースした。DatBench-Fullは9つのVLM機能にまたがる33のデータセットからなるクリーンな評価スイートであり、DatBenchは平均13倍のスピードアップを達成する識別サブセットである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:07:51 GMT)
SWaRL: Safeguard Code Watermarking via Reinforcement Learning [16.9] 本稿では,頑健で忠実な透かしの枠組みであるSWaRLについて述べる。
SWaRLは生成した出力にユニークで検証可能なシグネチャを埋め込む。
本研究では,SWaRLが従来の手法よりも高い透かし検出精度を実現することを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 23:35:39 GMT)
A neural network for modeling human concept formation, understanding and communication [16.9] 人間の脳の顕著な能力は、感覚運動経験からより抽象的な概念的表現を形成することである。
このギャップを埋めるために、デュアルモジュールニューラルネットワークフレームワークであるCATS Netを提案する。
本モデルは,低次元概念表現を抽出する概念抽出モジュールと,視覚的判断タスクを実行する課題解決モジュールから構成される。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:19:07 GMT)
MacVQA: Adaptive Memory Allocation and Global Noise Filtering for Continual Visual Question Answering [16.8] VQA(Visual Question Answering)は、視覚的データとテキストデータを組み合わせることで、マルチモーダル情報を推論するモデルを必要とする。
視覚的質問応答のための適応メモリアロケーションと,MacVQAと呼ばれるグローバルノイズフィルタリングを備えた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:18:09 GMT)
Towards Multi-Level Transcript Segmentation: LoRA Fine-Tuning for Table-of-Contents Generation [16.7] テキストの階層的なトピックセグメンテーションに新たなアプローチを導入し,複数レベルの内容表を生成する。
我々は,大規模言語モデルにおけるゼロショットプロンプトとLoRAの微調整を比較し,高レベル音声ポーズ機能の統合も検討した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:00:48 GMT)
An evaluation of LLMs for political bias in Western media: Israel-Hamas and Ukraine-Russia wars [16.3] メディアにおける政治的偏見は、世論、有権者の行動、より広範な民主的言論を形成する上で重要な役割を担っている。
政治偏見は、新聞などのメディアソースで、その資金調達機構や政党との同盟によって見られる。
政治・メディア研究における大規模言語モデル(LLM)の影響が注目されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 01:15:15 GMT)
Game of Coding: Coding Theory in the Presence of Rational Adversaries, Motivated by Decentralized Machine Learning [16.1] 符号化理論は、信頼できる通信、記憶、計算を可能にする上で重要な役割を果たす。
新興の分散アプリケーション、特に分散機械学習(DeML)では、参加ノードは受け入れられたコントリビューションに対して報酬を受ける。
コーディング理論を信頼最小化設定に拡張する新しいゲーム理論フレームワークであるコーディングゲームを紹介する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:04:32 GMT)
A Universal and Robust Framework for Multiple Gas Recognition Based-on Spherical Normalization-Coupled Mahalanobis Algorithm [16.1] 本研究では,開集合ガス認識のための共通後処理モジュールである球正規化結合マハラノビス (SNM) モジュールを提案する。
Vergaraデータセットの実験により、Transformer+SNM構成は、複数のターゲットガス間での判別において、ほぼ理論的な限界性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:46:47 GMT)
FMVP: Masked Flow Matching for Adversarial Video Purification [15.9] 敵対的ビデオ浄化FMVPは、マスキング戦略によって地球規模の敵構造を物理的に破壊する。
FGLは、低周波忠実性を維持しながら、高周波対向残留を明示的に抑制する。
PGDは87%、CWは89%であった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:55:46 GMT)
Foundation models on the bridge: Semantic hazard detection and safety maneuvers for maritime autonomy with vision-language models [15.5] ドラフトIMOMASSコードでは、自律的な海上船舶に対して、運用設計ドメインからの離脱を検出し、オペレータに通知する事前定義されたフォールバックを入力し、直ちに人間によるオーバーライドを許可し、許可なく航海計画の変更を避けることを求めている。
我々は、視覚言語モデル(VLM)が、そのようなアウト・オブ・ディストリビューションの状況に対して意味的な認識を提供し、短時間で人間に頼りやすいフォールバック操作を備えた高速スロー異常パイプラインが、ハンドオーバウィンドウでこれを実現していると論じる。
我々はセマンティック・ルックアウト(Semantic Lookout)を紹介した。セマンティック・ルックアウト(Semantic Lookout)はカメラ専用、候補制約付きVLMフォールバック・オペレーティング・セレクタで、水価のワールドアンカーから1つの慎重なアクションを選択する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:30:28 GMT)
Dynamic Quantization Error Propagation in Encoder-Decoder ASR Quantization [15.4] 動的量子化エラー伝播(FADE)のための微細アルファ法を提案する。
FADEは、層間誤差補正と局所量子化のトレードオフを適応的に制御する。
実験により,FADEは平均WERのベースラインを上回りながら,走行性能のばらつきを低減し,安定性を著しく向上することが示された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:47:16 GMT)
What you reward is what you learn: Comparing rewards for online speech policy optimization in public HRI [15.1] 我々は,社会ロボットの音声ポリシーを野生で適応させる方法について研究する。
1,400人以上の公的な出会いを伴う12日間のIn-situデプロイメントにおいて、オンラインポリシー最適化をマルチ武器の盗聴問題として捉えた。
我々は、実際のHRI設定で音声ポリシーのオンライン最適化を行うための準備の整った設計レッスンを精査する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:22:58 GMT)
Heterogeneous Low-Bandwidth Pre-Training of LLMs [14.7] SparseLoCoは,低帯域幅パイプラインモデル並列化と,低周波同期とスパース擬似勾配交換に基づく低周波データ並列化手法である。
高帯域相互接続で完全なレプリカをホストする異種分散トレーニングフレームワークを導入する一方、リソース制限された参加者は共同でレプリカをインスタンス化するためにグループ化される。
アクティベーション圧縮はSparseLoCoと最小のコストで構成され、選択的(異種)圧縮は損失通信トレードオフを一貫して改善する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:59:57 GMT)
CTIS-QA: Clinical Template-Informed Slide-level Question Answering for Pathology [14.6] 臨床診断テンプレートに基づくパイプラインを導入し,病理情報を体系的に収集し,構成する。
CTIS-QAは、病理学者の診断アプローチを模倣した二重ストリームアーキテクチャを特徴とするスライドレベルの質問回答モデルである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 03:54:02 GMT)
MergeRec: Model Merging for Data-Isolated Cross-Domain Sequential Recommendation [14.6] ドメイン間のシーケンシャルなレコメンデーションは、この問題に対処するための有望な研究方向として現れている。
本稿では,新しい現実的な問題設定の下でのモデルマージに基づく新しいフレームワークであるMergeRecを提案する。
MergeRecは継続的に優れたパフォーマンスを達成し、Recall@10では平均17.21%の改善を実現している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 03:14:23 GMT)
pdfQA: Diverse, Challenging, and Realistic Question Answering over PDFs [14.4] マルチドメイン2K人間アノテーション(real-pdfQA)と2K合成データセット(syn-pdfQA)について述べる。
両データセットに品質と難易度フィルタを適用して評価し、有効なQAペアと挑戦的なQAペアを得る。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:15:26 GMT)
Entity-Guided Multi-Task Learning for Infrared and Visible Image Fusion [14.4] Infrared and visible image fusion (EGMT) のためのEntity-Guided Multi-Task Learning という新しい融合手法を提案する。
大規模視覚言語モデルにより生成された画像キャプションからエンティティレベルのテキスト情報を抽出する原理的手法を提案する。
並列マルチタスク学習アーキテクチャを構築し、画像融合とマルチラベル分類タスクを統合する。
また、視覚的特徴とエンティティレベルのテキスト的特徴のきめ細かい相互作用を容易にするために、エンティティ誘導型クロスモーダルインタラクティブモジュールも開発されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:00:03 GMT)
Causality-Aware Temporal Projection for Video Understanding in Video-LLMs [14.3] V-COREは、ビデオ理解のための時間的制約を明示的に導入する、パラメータ効率のよいフレームワークである。
4ビットQLoRAと凍結LDMバックボーンにより、V-COREは単一のコンシューマGPU上で効率的にトレーニングできる。
実験の結果、V-COREは挑戦的なNExT-QAベンチマークで強い性能を示し、61.2%の精度に達した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:30:13 GMT)
RS-Prune: Training-Free Data Pruning at High Ratios for Efficient Remote Sensing Diffusion Foundation Models [14.1] 拡散型リモートセンシング(RS)生成基盤モデルは、多量のグローバルな代表データに依存している。
本稿では,高プルーニング率で高品質なサブセットを迅速に選択する,トレーニングフリーな2段階データプルーニング手法を提案する。
実験の結果, トレーニングデータの85%を刈り取った後も, コンバージェンスと生成品質が著しく向上することがわかった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:01:02 GMT)
Evaluating the Diagnostic Classification Ability of Multimodal Large Language Models: Insights from the Osteoarthritis Initiative [14.0] マルチモーダル大言語モデル(MLLM)は,医療視覚的質問応答(VQA)とレポート生成において有望な性能を示す。
膝関節症(OA)分類におけるMLLMアーキテクチャの検討を行った。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:31:44 GMT)
Explicit World Models for Reliable Human-Robot Collaboration [13.9] 私たちは、信頼できるエンボディドAIの問題に対して、根本的に異なるタックを取ります。
我々は人間とロボットの相互作用の動的な、曖昧で主観的な性質を強調した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 00:58:19 GMT)
Interpretable Safety Alignment via SAE-Constructed Low-Rank Subspace Adaptation [13.5] 大規模な言語モデルをトレーニングし、有害な要求を拒否するためには、安全性の調整が不可欠である。
Low-Rank Adaptation (LoRA) は、安全ベンチマークにおける完全な微調整と強化学習を一貫して過小評価している。
このギャップに対処するため、SAILS (Safety Alignment via Interpretable Low-rank Subspace)を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:39:39 GMT)
Vision-Based Early Fault Diagnosis and Self-Recovery for Strawberry Harvesting Robots [13.4] イチゴ収穫効率は, 視覚的知覚, フルーツ・グリッパーのミスアライメント, 空のつかみ, イチゴのすべり面を妥協した。
本稿では,マルチタスク認識と補正制御戦略を統合した視覚的故障診断と自己回復フレームワークを提案する。
SRR-Netは、リピート検出、セグメンテーション、リピート推定を同時に行うエンド・ツー・エンドのマルチタスク知覚モデルである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:12:42 GMT)
Losses that Cook: Topological Optimal Transport for Structured Recipe Generation [13.3] 埋め込み空間における点雲として成分リストを表す新しいトポロジ的損失を示す。
標準のNLGメトリクスとレシピ固有のメトリクスの両方を用いて、我々の損失は食材レベルとアクションレベルのメトリクスを著しく改善する。
人間の嗜好分析は、私たちのモデルが62%のケースで好まれることを示す、私たちの発見を支持します。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 20:09:41 GMT)
Exploring Diversity, Novelty, and Popularity Bias in ChatGPT's Recommendations [13.3] ChatGPTは多用途ツールとして登場し、さまざまなドメインにまたがる機能を示している。
本研究は,ChatGPT-3.5とChatGPT-4の勧告を多様性,新規性,人気バイアスの観点から評価することによって検討した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:56:01 GMT)
Yuan3.0 Flash: An Open Multimodal Large Language Model for Enterprise Applications [13.0] 我々はオープンソースのMixture-of-Experts (MoE) MultiModal Large Language ModelであるYuan3.0 Flashを紹介する。
汎用タスクにおける競争力を維持しつつ、エンタープライズ指向タスクのパフォーマンスを向上させるように設計されている。
また、数学、科学などの分野において強力な推論能力を示し、フロンティアモデルに匹敵する精度を得る。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 01:44:09 GMT)
LION-DG: Layer-Informed Initialization with Deep Gradient Protocols for Accelerated Neural Network Training [13.0] 我々は、ディープニューラルネットワークのためのゼロインフォームド層インフォームド最適化であるLION-DGを提案する。
LION-DGは、背骨へのHe-初期化を実装し、重みが大きくなるにつれて補助的なウォームアップ勾配に相転移する。
CIFAR-10とCIFAR-100のResNet-DSおよびDenseNet-DSアーキテクチャによる実験は、LION-DGの優れた性能を示している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:33:09 GMT)
Self-Supervised Learning with Noisy Dataset for Rydberg Microwave Sensors Denoising [12.9] 単発ノイズ抑圧を可能にするRydbergセンサのための自己教師型ディープラーニングフレームワークについて報告する。
このフレームワークは、同一の統計分布を持つ2組のノイズ信号のトレーニングにより、クリーンな参照信号の必要性を排除している。
Rydbergのセンシングデータセットで評価すると、このフレームワークはウェーブレット変換やカルマンフィルタよりも優れている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:16:09 GMT)
Streaming Hallucination Detection in Long Chain-of-Thought Reasoning [12.9] 長いCoT推論における幻覚は、1つの誤った出来事ではなく、進化している潜伏状態として理解されている。
提案手法は,長いCoT推論におけるストリーミング幻覚検出を可能にし,リアルタイムで解釈可能な証拠を提供する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:47:41 GMT)
PhysSFI-Net: Physics-informed Geometric Learning of Skeletal and Facial Interactions for Orthognathic Surgical Outcome Prediction [12.8] PhysSFI-Netは、矯正手術後の軟部組織の変形を正確に予測するための物理インフォームドな幾何学的深層学習フレームワークである。
モデル性能は点雲形状誤差,表面偏差誤差,ランドマーク位置誤差を用いて評価した。
PhysSFI-Net は点雲形状誤差 1.070 +/- 0.088 mm、表面偏差誤差 1.296 +/- 0.349 mm、ランドマーク局在誤差 2.445 +/- 1.326 mm を達成した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:14:19 GMT)
ELLA: Efficient Lifelong Learning for Adapters in Large Language Models [12.5] 大規模言語モデル(LLM)は、連続的な学習環境において、新しいタスクに逐次適応する際、深刻な破滅的な忘れを被る。
本稿では,選択部分空間デコリレーションの原理に基づくトレーニングフレームワークであるELLAを紹介する。
ELLAは、過去の更新の構造を明示的に特徴づけ、高エネルギーでタスク固有の方向に沿ってアライメントを罰する。
3つの人気のあるベンチマークで最先端のCL性能を達成し、相対的精度は9.6%、メモリフットプリントは35倍になる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:58:08 GMT)
Prior-Guided DETR for Ultrasound Nodule Detection [12.3] 超音波検出に特化して設計された事前誘導型DETRフレームワークを提案する。
提案するフレームワークは、純粋にデータ駆動の機能学習に頼るのではなく、ネットワークの複数の段階で異なる事前知識を段階的に取り入れている。
2つの臨床的に収集された甲状腺超音波データセットを用いて行った実験により,提案法は18種類の検出法と比較して精度が高いことが示された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:32:58 GMT)
Efficient Unrolled Networks for Large-Scale 3D Inverse Problems [12.0] 3Dイメージングのような大規模な問題では、ほとんどの既存手法は、グローバルフォワード演算子に必要なメモリの禁止量のために、演算子をアーキテクチャに組み込むことができない。
本稿では,そのアーキテクチャにフォワード演算子を組み込んだエンドツーエンド再構成モデルのトレーニングを可能にする,ドメイン分割戦略と正規演算子近似を提案する。
提案手法は,3次元X線コーンビームトモグラフィと3次元マルチコイル加速MRIにおいて,トレーニングと推論の両方に1つのGPUしか必要とせず,最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:12:43 GMT)
Parameter-Efficient Domain Adaption for CSI Crowd-Counting via Self-Supervised Learning with Adapter Modules [11.7] WiFi Channel State Information(CSI)を使用したデバイスフリーのクラウドカウントは、新しい世代のプライバシ保護用IoT(Internet of Things)アプリケーションを可能にする重要な技術である。
本稿では,CSI-ResNet-Aアーキテクチャを中心とした新しい2段階フレームワークを提案する。
このモデルは、自己教師付きコントラスト学習を通じてドメイン不変表現を学習し、軽量なAdapterモジュールを活用して高効率な微調整を行う。
私たちのフレームワークは、98.8%の精度で、最先端のパブリックWiARベンチマークを新たに設定しています。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:27:04 GMT)
WebCoderBench: Benchmarking Web Application Generation with Comprehensive and Interpretable Evaluation Metrics [11.4] WebCoderBenchは,Webアプリ生成のための,世界初の実世界のコンパイル,一般化,解釈可能なベンチマークです。
WebCoderBenchは1,572の実際のユーザ要件で構成されており、現実的なユーザの意図を反映したさまざまなモダリティと表現スタイルをカバーしている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:23:07 GMT)
Nodule-DETR: A Novel DETR Architecture with Frequency-Channel Attention for Ultrasound Thyroid Nodule Detection [11.4] 甲状腺癌は最も一般的な内分泌腫瘍であり、その発生率は世界中で増加している。
超音波画像における甲状腺結節検出のための新しい検出変換器(DETR)アーキテクチャであるNodule-DETRを提案する。
Nodule-DETRは、低コントラストノジュールの特徴を高めるために周波数分析を利用するマルチスペクトル周波数領域チャネル注意(MSFCA)モジュール、効率的なマルチスケール統合のための階層的特徴融合(HFF)モジュール、小型で不規則な結節を柔軟にキャプチャするマルチスケール変形性注意(MSDA)モジュールの3つの重要なイノベーションを紹介している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:53:04 GMT)
Forget Less by Learning from Parents Through Hierarchical Relationships [11.1] 本稿では、親子間学習機構を導入した新しいフレームワークFLLP(Forget Less by Learning from Parents)を提案する。
FLLPは事前の知識を保持し、新しい概念の継続的な統合をサポートする。
FLLPを3つの公開データセットと1つの総合ベンチマークで検証し、ロバスト性と一般化の両面で一貫した改善を示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:35:36 GMT)
Less is more: Probabilistic reduction is best explained by small-scale predictability measures [11.1] 本稿では,言語モデルの確率と認知現象の関係について検討する。
確率的減少を観測するために全発話が必要であるかどうかを考察し,n-gram表現が計画の認知単位として十分であることを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 22:28:22 GMT)
A New Benchmark for the Appropriate Evaluation of RTL Code Optimization [11.1] この研究は、RTL最適化における大規模言語モデル(LLM)の能力を評価するベンチマークであるRTL-OPTを導入する。
各タスクは、業界で実証された最適化パターンを反映した、一対のRTLコード、準最適バージョン、人間に最適化された参照を提供する。
さらに、RTL-OPTは自動評価フレームワークを統合し、機能的正当性を検証し、改善を定量化する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 03:47:26 GMT)
ModeX: Evaluator-Free Best-of-N Selection for Open-Ended Generation [11.1] 提案するModeX(ModeX)は,大規模言語モデルを対象とした評価自由なベストオブN選択フレームワークである。
ModeXは生成したテキスト間の支配的なセマンティックコンセンサスを表すモーダル出力を識別することでBest-of-Nを一般化する。
私たちのアプローチは、標準のシングルパスとマルチパスのベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 20:16:32 GMT)
Binarisation-loophole-free observation of high-dimensional quantum nonlocality [11.0] 高次元の絡み合いに基づくベルの不等式試験は、通常、複数の可能な結果を解決できる測定を必要とする。
この2次出力測定へのマルチアウトカム測定の削減は、高次元試験におけるループホールを開放する。
ここでは,4次元光路モードの絡み合いとマルチアウトカム検出を用いて,この抜け穴を塞ぐ。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:48:49 GMT)
Evaluating Feature Dependent Noise in Preference-based Reinforcement Learning [10.9] 強化学習における優先度からの学習(PbRL)は、報酬関数が簡単に利用できない複雑なタスクに自然に適合するため、近年注目を集めている。
それまでの文献の多くはノイズを検出することを目的としていたが、ノイズの種類は限られており、ほとんどの文献は観測とは無関係に均一に分布していた。
対象特徴依存雑音の概念を定式化し、軌跡特徴雑音、軌跡類似性雑音、不確実性認識雑音、言語モデル雑音などいくつかの変種を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:49:30 GMT)
Multivariate Time-series Anomaly Detection via Dynamic Model Pool & Ensembling [10.8] MTS異常検出のための動的モデルプールおよび組立フレームワークDMPEADを提案する。
我々のモデルはすべてのベースラインを上回り、優れた適応性とスケーラビリティを示します。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:48:21 GMT)
Learning and Optimizing the Efficacy of Spatio-Temporal Task Allocation under Temporal and Resource Constraints [10.4] マルチロボットのミッションでは、しばしばチームが共同でタスク割り当て、スケジューリング、経路計画を最適化する必要がある。
我々はこれらの複雑さをSTEAMと呼ばれる新しい種類の問題に分類する。
STEAMは、その能力を使ってロボットをモデル化する特性ベースのフレームワークの上に構築されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:21:56 GMT)
MindChat: A Privacy-preserving Large Language Model for Mental Health Support [10.3] 我々は、メンタルヘルス支援のためのプライバシー保護型大規模言語モデルであるMindChatを紹介する。
我々はまた、マルチエージェントロールプレイングフレームワークを用いて構築された合成マルチターンカウンセリングデータセットであるMindCorpusを提示する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:54:18 GMT)
Exploring Approaches for Detecting Memorization of Recommender System Data in Large Language Models [10.1] 大きな言語モデル(LLM)は、強力な自然言語理解と生成能力のため、推奨シナリオにますます適用されています。
最近の研究によると、MovieLens-1MデータセットはLLaMAとOpenAIモデルファミリの両方で記憶されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:03:56 GMT)
Quantum Interaction Between Free Electrons and Light Involving First-order and Second-order Process [9.9] 2光子過程を考慮した電子-光子相互作用の完全な量子理論を開発する。
KD効果(弾性電子-光子散乱)と非線形コンプトン散乱も一種の2光子過程である。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:19:22 GMT)
Surprisal and Metaphor Novelty: Moderate Correlations and Divergent Scaling Effects [9.9] 本研究では,言語モデルにおける予測可能性の確率的尺度である仮定がメタファの新規性データセットと相関するかどうかを考察する。
我々は、コーパスベースおよび合成メタファーノベルティデータセットに基づく16のLM変種から予備解析を行った。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:24:33 GMT)
Deep Learning Superresolution for 7T Knee MR Imaging: Impact on Image Quality and Diagnostic Performance [9.9] 深層学習型超解像 (SR) は筋骨格MR画像の画質を向上させる可能性があるが, 7T における膝関節画像診断の意義は明らかでない。
この前向き研究では、42人の被験者がLR (0.8*0.8*2 mm3) とHR (0.4*0.4*2 mm3) で7T膝MRIを行った。
SR画像では、LR(中間スコア5対4P.001)よりも全体的な品質が高く、HR(5対4P.001)よりも低ノイズであった。
SR, HRにおける軟骨, 半月, 靭帯の可視性はLR(P.001)と比較して優れていた
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:14:28 GMT)
Experimental realization of quantum Zeno dynamics for robust quantum metrology [9.8] 量子ゼノダイナミクス(QZD)は、ノイズから量子情報を保護するための有望なアプローチを提供する。
パラメータ符号化段階における強い粒子間相互作用を導入する。
提案手法を核磁気共鳴プラットフォーム上で実験的に検証する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:43:59 GMT)
CSCBench: A PVC Diagnostic Benchmark for Commodity Supply Chain Reasoning [9.8] LLM(Large Language Models)は、一般的なベンチマークにおいて顕著な成功を収めているが、商品サプライチェーンにおける彼らの能力は、まだ探索されていない。
CSC推論のための2.3K以上のシングルチョイスベンチマークであるCSCBenchを紹介します。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:44:29 GMT)
Parallel Quantum Gates via Scalable Subsystem-Optimized Robust Control [9.7] クォービット間のクロストークは、高いゲートの忠実さの達成を妨げ、ヒルベルト空間の完全な最適化を違法に困難にする。
そこで本研究では,一定サイズのサブシステムに対するクロストーク・ロバスト制御に対する全システム最適化の削減により,この問題を克服する。
本枠組みでは,並列単一キュービットゲートの解析パルス解と並列多キュービット演算のための数値パルスを構築する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:50:40 GMT)
Beyond Homophily: Community Search on Heterophilic Graphs [9.7] コミュニティ検索は、あるクエリに最も関連性の高い、洗練されたノードのセットを特定することを目的としている。
ホモ親和グラフとは異なり、多くの実世界のネットワークは異種ノードを主に接続する異種ネットワークである。
i)マルチホップ信号とマルチ周波数信号を分離し、スムーズな(ホモ親和性)とコントラストな(ヘテロ親和性)の関係を捕捉するAdaptCS、(ii)主要な計算ボトルネックを除去するメモリ効率の低い低ランク最適化、(iii)オンライン検索をガイドするAdaptive Community Score(ACS)の3つの主要な設計を特徴とする統合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 00:44:17 GMT)
A Defect is Being Born: How Close Are We? A Time Sensitive Forecasting Approach [9.5] 本研究は,欠陥予測における時間依存性技術の有効性について検討する。
我々は、ソフトウェアプロジェクトの将来のバグ密度を予測するために、複数の時間に敏感な予測テクニックを訓練します。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:11:29 GMT)
FAROS: Robust Federated Learning with Adaptive Scaling against Backdoor Attacks [9.5] バックドア攻撃は連邦学習(FL)に重大な脅威をもたらす
適応微分スケーリング(ADS)とロバストコアセットコンピューティング(RCC)を組み合わせた拡張FLフレームワークであるFAROSを提案する。
RCCは、最も信頼性の高いクライアントからなるコアセットのセントロイドを計算することで、単一ポイント障害のリスクを効果的に軽減する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:55:35 GMT)
Moments Matter:Stabilizing Policy Optimization using Return Distributions [9.4] 連続制御タスクでは、小さなパラメータシフトでさえ不安定な歩行を生み出す。
環境に配慮した代替案を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:27:11 GMT)
Agentic AI in Remote Sensing: Foundations, Taxonomy, and Emerging Systems [9.4] この調査は、リモートセンシングにおけるエージェントAIの総合的なレビューである。
単一エージェントのコピロとマルチエージェントのシステムを区別した統合分類を導入する。
評価を画素レベルの精度から軌跡認識推論の正確性に移行する新しいベンチマークをレビューする。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:34:17 GMT)
TAP-ViTs: Task-Adaptive Pruning for On-Device Deployment of Vision Transformers [9.3] ビジョントランスフォーマー(ViT)は、幅広いビジョンタスクにおいて強力なパフォーマンスを示しているが、その相当な計算とメモリ要求は、リソースに制約のあるモバイルおよびエッジデバイスへの効率的なデプロイを妨げる。
本稿では,ローカルデータへのアクセスを必要とせず,デバイス固有のプルーニングViTモデルを生成する新しいタスク適応型プルーニングフレームワークであるTAP-ViTを紹介する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:00:08 GMT)
Local Layer-wise Differential Privacy in Federated Learning [9.1] Federated Learning(FL)は、直接的なデータ共有なしに協調的なモデルトレーニングを可能にするが、モデル反転やメンバシップ推論といったプライバシ攻撃には弱いままである。
既存のFLの差分プライバシ(DP)ソリューションは、しばしばモデル全体にわたってノイズを均一に注入し、最適なプライバシとユーティリティのトレードオフを提供しながら、実用性を低下させる。
モデル精度を維持しながらプライバシ保護を最適化するFL用レイヤワイド適応型ノイズ注入機構であるLaDPを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 02:23:31 GMT)
From Metrics to Meaning: Insights from a Mixed-Methods Field Experiment on Retail Robot Deployment [8.9] 本稿では,ライブベディングストアに展開する対話型サービスロボットの複合手法フィールド実験について報告する。
われわれは3つの条件(ベースライン(ロボットではない)、ロボット専用、ロボット+フィクスチャー)を交互に設定し、サービスファンネルを通行人から購入するためにビデオアノテートした。
ロボットは通行人1人あたりの停止時間(フィクスチャが最も高い)を増やした。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:54:33 GMT)
Digital Twin-Driven Communication-Efficient Federated Anomaly Detection for Industrial IoT [8.9] 本稿では,グローバルモデルの性能を高めるために,デジタルツイン統合フェデレーション学習(DTFL)法を提案する。
我々は,デジタルツインベースメタラーニング(IoTL),フェデレートDTM交換(LPE),サイクルウェイト適応(CWA),デジタルツイン知識蒸留(DTKD)の5つの新しいアプローチを提案する。
目標精度が80%の場合、CWAは33ラウンド、FPFは41ラウンド、LPEは48ラウンド、DTMLは87ラウンドで目標に達するが、標準のFedAvgベースラインとDTKDは100ラウンド以内に目標に到達しない。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 00:26:15 GMT)
MDAgent2: Large Language Model for Code Generation and Knowledge Q&A in Molecular Dynamics [8.8] MDAgent2は、分子動力学領域内で知識Q&Aとコード生成の両方を実行することができる最初のエンドツーエンドフレームワークである。
MD-Instruct と MD-Code の2つのドメイン適応型モデルを訓練するために,3段階の事前学習,教師付き微調整,強化学習を採用する。
さらに、コード生成、実行、評価、自己補正を統合するデプロイ可能なマルチエージェントシステムであるMDAgent2-RUNTIMEを構築します。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:56:51 GMT)
Enhancing Debugging Skills with AI-Powered Assistance: A Real-Time Tool for Debugging Support [8.6] コードの解析、ブレークポイントの提案、コンテキストヒントの提供によるリアルタイムサポートを提供する。
LLM、プログラムスライシング、税関でRAGを使用すると、LLMコールの最小化と精度の向上によって効率が向上する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:20:59 GMT)
Shallow- and Deep-fake Image Manipulation Localization Using Vision Mamba and Guided Graph Neural Network [8.5] 本稿では,浅層画像と深層画像の両方において,深層学習ネットワークによる操作のローカライズの実現可能性について検討する。
本稿では,操作された画素と認証されたピクセルの区別を増幅する新しいガイドグラフニューラルネットワーク(G-GNN)モジュールを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:38:50 GMT)
Falcon-H1R: Pushing the Reasoning Frontiers with a Hybrid Model for Efficient Test-Time Scaling [7.9] ファルコンH1RはSOTAの推理モデルと一貫して一致し、性能は2倍から7倍に向上した。
ファルコンH1Rはより高速な推論、トークン効率、より高い精度を組み合わせることで推論効率の3D限界を推し進める。
Falcon-H1Rは、ターゲットモデルトレーニングとアーキテクチャ選択を通じて、コンパクトモデルが堅牢でスケーラブルな推論性能を提供できることを示した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:44:27 GMT)
Pervasive Vulnerability Analysis and Defense for QKD-based Quantum Private Query [7.9] 本研究は、未決定信号ビット下での隠れ情報抽出に焦点を当て、複雑な量子資源がなくても、ほとんどのQPQプロトコルが深刻なセキュリティ脅威に直面していることを明らかにした。
これらの重要な欠陥に対処するため、提案手法は既存のQPQプロトコルと互換性がある。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:05:49 GMT)
Fact-Checking with Large Language Models via Probabilistic Certainty and Consistency [7.8] 大規模言語モデル(LLM)は、事実の正確性を必要とするアプリケーションでますます使われている。
事実チェックはこれらのエラーを軽減することができるが、既存の手法は通常、外的証拠を無差別に回収する。
本稿では,確率的確実性と一貫性(PCC)について紹介する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:57:41 GMT)
Reinforcement Learning for Option Hedging: Static Implied-Volatility Fit versus Shortfall-Aware Performance [7.8] 我々は、リスク回避とトレーディングコストを組み込むことで、QLBSフレームワークのQ-learnerを拡張する。
本稿では,RLOP(Replication Learning of Option Pricing)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 01:02:41 GMT)
Distorted Distributional Policy Evaluation for Offline Reinforcement Learning [7.7] オフライン分散強化学習(DRL)手法の鍵となる限界は、一様に過小評価される戻り量子化へのアプローチにある。
本研究では,保存度を調整し,一様でない悲観的ペシミズムを可能にする量子歪みという新しい概念を導入する。
提案手法は理論的解析と実証的検証に基礎を置き,一様悲観論よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:04:10 GMT)
Toward Auditable Neuro-Symbolic Reasoning in Pathology: SQL as an Explicit Trace of Evidence [7.6] 臨床医はどのスライド機能で モデルの決定を下すか 理由を尋ねています
視覚言語モデルは自然言語の説明を生成できるが、それらはしばしば相関関係があり、検証可能な証拠が欠如している。
機能測定と推論の両方を監査可能にするアンスクル中心のエージェントフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:02:49 GMT)
Superextensive charging speeds in a correlated quantum charger [7.6] 我々は、2つのドライブ間でエネルギーを伝達する相互作用量子系として量子チャージャーを定義する。
充電器内における長距離相互作用の存在は、集合的な定常充電モードを誘導することができる。
この効果は、高周波体制の崩壊によって設定された臨界システムサイズまで持続することを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:00:04 GMT)
Mitigating Long-Tailed Anomaly Score Distributions with Importance-Weighted Loss [7.4] 異常検出は、システムの信頼性を確保するために稀で目に見えないパターンを特定するために、産業アプリケーションにおいて不可欠である。
単一クラスの通常のデータに基づいてトレーニングされた従来のモデルは、通常のデータがさまざまなパターンを示す現実世界の分散に苦労する。
本稿では,異常検出に特化して設計された新しい重要度重み付き損失を提案する。
本手法は, 実世界の応用において, 異常検出性能を0.043向上させる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:02:09 GMT)
RRNet: Configurable Real-Time Video Enhancement with Arbitrary Local Lighting Variations [7.4] 本稿では,視覚的品質と効率のトレードオフを実現するフレームワークRRNetを紹介する。
RRNetは、ピクセル対応のトレーニングデータを必要とすることなく、深度対応のレンダリングモジュールを通じてローカライズされたリライトを可能にする。
実験により、RRNetは、低照度向上、局所照明調整、グラア除去において、従来手法よりも一貫して優れていたことが示されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:50:59 GMT)
A Survey of Bargmann Invariants: Geometric Foundations and Applications [7.3] バーグマン不変量(英: Bargmann invariants)は、量子状態ベクトルの重なりから生じるゲージ不変量の類である。
このレビューでは、これらの不変量がどのように量子状態空間の固有幾何学を特徴づける強力なツールとなるかを示す。
現代量子情報科学におけるそれらの重要な役割、特に絡み検出の操作方法の開発について検討する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:36:10 GMT)
Hidden costs for inference with deep network on embedded system devices [7.3] 本研究では,組込みシステム環境下での各種深層学習モデルの推論性能を評価する。
その結果,組込みシステムにおけるリアルタイム実行のためのディープラーニングモデルの最適化において,テンソル間の追加計算を考慮することの重要性を強調した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 00:18:51 GMT)
Mechanisms and Opportunities for Tunable High-Purity Single Photon Emitters: A Review of Hybrid Perovskites and Prospects for Bright Squeezed Vacuum [7.3] 単一光子エミッタ(SPE)は量子通信、計算、気象学の中心であるが、その発展は純粋性、不明瞭性、チューニング可能性のトレードオフによって制約されている。
本稿では,SPEのメカニズムに基づく分類を行い,従来の情報源の性能限界を明らかにする物理指向のフレームワークを提案する。
特に有機-無機ペロブスカイト量子ドット(HOIP QDs)が注目され、細い線幅と室温操作を備えたサイズおよび組成可変エミッションが提供される。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:08:00 GMT)
MCD-Net: A Lightweight Deep Learning Baseline for Optical-Only Moraine Segmentation [7.2] 本研究は,Google Earthの3,340個の手動高解像度画像からなる,大規模な光のみのモレーンセグメンテーションデータセットを初めて紹介した。
我々は、MobileNetV2エンコーダ、CBAM(Convolutional Block Attention Module)、DeepLabV3+デコーダを統合する軽量ベースラインであるMCD-Netを開発した。
尾根の起伏はサブピクセル幅とスペクトルのあいまいさによって制限されているが、光学画像だけではモレーンボディのセグメンテーションが信頼できることを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:18:11 GMT)
BiPrompt: Bilateral Prompt Optimization for Visual and Textual Debiasing in Vision-Language Models [7.2] テスト時間適応時の両モード間の非因果的特徴依存を緩和する二元的プロンプト最適化フレームワーク(BiPrompt)を提案する。
視覚面では、背景のアクティベーションを抑制し、因果領域と突発領域の間の予測一貫性を強制するために、構造化された注意誘導消去を用いる。
テキスト側では、クラス埋め込みを等方的意味空間に整合させる学習可能な再中心化機構である、バランスの取れたプロンプト正規化を導入している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:22:20 GMT)
The Invisible Hand of AI Libraries Shaping Open Source Projects and Communities [7.1] 我々は,PythonおよびJava OSSプロジェクトにおけるAIライブラリの採用を評価することを目的としている。
157.7kのOSSリポジトリを大規模に分析します。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:50:37 GMT)
Prototype-Based Learning for Healthcare: A Demonstration of Interpretable AI [7.1] プロトタイプベースの学習がこれらのニーズにどう対処できるかを示す。
提案するフレームワークであるProtoPalは,フロントエンドモードとバックエンドモードの両方を特徴としている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:34:01 GMT)
Adaptive Hybrid Optimizer based Framework for Lumpy Skin Disease Identification [7.0] ランピー皮膚病(Lumpy Skin Disease、LSD)は、家畜の健康を著しく悪化させる伝染性ウイルス感染症である。
我々はLSDの早期検出のためのLUMPNetと呼ばれるハイブリッドディープラーニングベースのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:35:45 GMT)
Improved Accuracy for Private Continual Cardinality Estimation in Fully Dynamic Streams via Matrix Factorization [6.9] 完全動的連続観測モデルにおける微分プライベート統計量について検討する。
筆者らのフレームワークは, 異なる要素をカウントし, 等級ヒストグラムを推定し, 三角形数を推定するためのバウンダリを改良したことを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:36:59 GMT)
The New Compiler Stack: A Survey on the Synergy of LLMs and Compilers [6.8] この調査は、LLM対応コンパイルの新しい分野を体系的に概観した。
コンパイラ開発の民主化、新しい最適化戦略の発見、コンパイラの伝統的なスコープの拡大の3つの主な利点を特定した。
この分野の課題と機会に対処する上で、私たちは、ハイブリッドシステムの開発を最も有望な進路としながら、正確性を確保し、スケーラビリティを達成するための重要なハードルを強調しました。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:02:57 GMT)
Continuous Unitary Designs for Universally Robust Quantum Control [6.7] ユニタリデザイン(Unitary design)は、ハールランダムのユニタリ統計をエミュレートするユニタリアンサンブルである。
まず, 連続的なユニタリ設計について検討し, その構築と実用性に関する根本的な疑問に対処する。
単一量子系に対して、球面 2-次元曲線とホップフィブレーション理論から明示的なユニタリ 1-次元経路を構築する。
任意の次元に対して、ユニタリ群の位相的バンドル理論に基づく2つの体系的な構成フレームワークと、ハイゼンベルク・ワイル群に基づく2つの構成フレームワークを開発する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:45:38 GMT)
Annealed Langevin Posterior Sampling (ALPS): A Rapid Algorithm for Image Restoration with Multiscale Energy Models [6.6] エネルギーベースモデル(EBM)は歴史的に高い計算コストと訓練不安定性に悩まされてきた。
本稿では,最大A-Posteriori (MAP),最小平均角誤差 (MMSE) に対するAnnealed Langevin Posterior Smpling (ALPS) アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 22:53:23 GMT)
Forget Less by Learning Together through Concept Consolidation [6.1] カスタム拡散モデル(CDMs)は、生成過程をパーソナライズする優れた能力のために注目されている。
既存のCDMは、新しい概念を継続的に学習するときに破滅的な忘れ込みに悩まされる。
本稿では,並列性と順序に依存しない概念学習を可能にするFL2T(Forget Less by Learning Together)を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:14:16 GMT)
Code for Machines, Not Just Humans: Quantifying AI-Friendliness with Code Health Metrics [6.1] 我々は、競合プログラミングから5,000のPythonファイルのデータセットを通して「AIフレンドリなコード」の概念を調査する。
我々の発見は、人間フレンドリーなコードもAIツールとより互換性があることを確認した。
これらの結果は、組織がCodeHealthを使用して、AI介入のリスクが低い場所と、追加の人間の監視が保証される場所をガイドできることを示唆している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:23:55 GMT)
Deep Robust Koopman Learning from Noisy Data [6.1] 実世界のデータはしばしばうるさいので、クープマン作用素の正確で偏りのない近似を得るのは難しい。
本稿では、雑音データから適切な昇降関数と縮小バイアスクープマン演算子を協調的に学習する、新しいオートエンコーダベースのニューラルアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:26:26 GMT)
Robust Persona-Aware Toxicity Detection with Prompt Optimization and Learned Ensembling [6.0] 毒性の検出は本質的に主観的であり、多様な視点と異なる人口集団の社会的先行によって形成される。
現在のLarge Language Model (LLM) のプロンプト技術は、異なるペルソナとベースモデルで異なる結果が得られる。
そこで本研究では,4ビットベクトル上のSVMを高速なメタアンサンブルとして提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:32:45 GMT)
Multi-scale Graph Autoregressive Modeling: Molecular Property Prediction via Next Token Prediction [6.0] Connection-Aware Motif Sequencing (CamS)は、分子グラフを学習するためのグラフからシーケンスの表現である。
CamSは、分子グラフを構造豊富な因果配列にシリアライズすることでギャップを埋める。
我々はCamS配列上のバニラLLaMAバックボーンを事前訓練することでCamS-LLaMAをインスタンス化する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 20:06:11 GMT)
SortWaste: A Densely Annotated Dataset for Object Detection in Industrial Waste Sorting [5.9] 手作業による廃棄物の選別は大規模な廃棄物の流れを扱うのに非効率である。
既存の自動ソートアプローチは、現実世界の廃棄物ストリームの高ばらつき、乱雑、視覚的複雑さに悩まされている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:34:50 GMT)
GCR: Geometry-Consistent Routing for Task-Agnostic Continual Anomaly Detection [5.9] 幾何整合性ルーティングによる連続的異常検出を安定化するための軽量なミックス・オブ・サーキットフレームワークを提案する。
GCRは、蓄積した最も近いプロトタイプ距離をカテゴリ固有のプロトタイプバンクに最小化し、各テスト画像を共有パッチ埋め込み空間に直接ルーティングする。
MVTec ADとVisAの実験では、幾何一貫性のあるルーティングがルーティングの安定性を大幅に改善し、連続的な性能崩壊を緩和することを示した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:33:50 GMT)
When Attention Becomes Exposure in Generative Search [5.9] よりポピュラーな音声は,他者よりも強い引用露光を系統的に受けることを示す。
より大きなフォロワーベースと、より集中したクリエーターコアを持つ企業は、より高い露出に関連付けられている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 03:01:46 GMT)
Differential Privacy for Transformer Embeddings of Text with Nonparametric Variational Information Bottleneck [5.5] 本稿では,変換器埋め込みのノイズの多いバージョンを共有することで,テキストデータを共有するためのプライバシ保護手法を提案する。
非パラメトリック変分プライバシー(NVDP)は、有用なデータ共有と強力なプライバシー保護の両方を保証する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:49:39 GMT)
MLIR-Smith: A Novel Random Program Generator for Evaluating Compiler Pipelines [5.3] MLIR-Smithは,コンパイラ最適化のテストと評価に特化して設計された,新しいランダムプログラム生成器である。
本稿では,ランダムなMLIRプログラムを生成可能なツールを提供することで,コンパイラの評価と改善の能力を向上させる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:43:09 GMT)
Understanding Pure Textual Reasoning for Blind Image Quality Assessment [5.0] ブラインド画像品質評価(BIQA)においてテキスト推論が広く採用されている
テキスト情報がどのように品質予測に寄与するか、また、スコア関連画像の内容がどの程度の程度で表現できるかは、まだ不明である。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:43:56 GMT)
AI Agent Systems: Architectures, Applications, and Evaluation [5.0] AIエージェントは、基礎モデルと推論、計画、メモリ、ツールの使用を組み合わせる。
先行作業は、エージェントコンポーネントにまたがる統一された分類にまとめます。
レイテンシ対精度、自律性対可制御性、能力対信頼性といった重要な設計トレードオフについて論じます。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 02:38:40 GMT)
LoRA-Drop: Temporal LoRA Decoding for Efficient LLM Inference [4.8] textbfLoRA-Dropは,中間層の固定部分集合に時空間計算スケジュールを適用することでデコーディングを高速化する,プラグアンドプレイ推論フレームワークである。
LoRA-Dropはルーティングネットワークを必要とせず、標準的なKVキャッシュと互換性があり、LoRAステップ中にドロップパブル層でKV更新をスキップして定期的にリフレッシュすることで、KVキャッシュのフットプリントを削減することができる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:47:47 GMT)
A Music Information Retrieval Approach to Classify Sub-Genres in Role Playing Games [4.8] ビデオゲーム音楽(VGM)は、しばしば映画音楽と同じレンズで研究される。
我々はロールプレイングゲーム(RPG)の3つのサブジャンルから,ゲーム中のVGMから音楽的特徴を抽出した。
この相関関係は、期待されるストーリーテリング要素やサブジャンルに関連するメカニクスに関連があることを示すために用いられる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 22:44:22 GMT)
MOZAIK: A Privacy-Preserving Analytics Platform for IoT Data Using MPC and FHE [4.7] 本稿では,プライバシ保護のための新たな秘密データストレージと分散処理アーキテクチャであるMOZAIKについて述べる。
MOZAIKは、送信、ストレージ、処理を含むライフサイクルを通してデータが暗号化されることを保証する。
2つの異なるCOED技術、特にセキュアなマルチパーティ計算(MPC)と完全同型暗号(FHE)について検討する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:25:08 GMT)
Differential Barometric Altimetry for Submeter Vertical Localization and Floor Recognition Indoors [4.6] 完全にROS準拠のソフトウェアパッケージに統合された微分バロメトリセンシングを活用する,堅牢で低コストな垂直推定フレームワークを提案する。
本システムでは,静止基地局と移動センサの両方からのリアルタイム高度データを同時に公開し,高精度かつドリフトフリーな垂直位置推定を実現する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:03:55 GMT)
MetagenBERT: a Transformer-based Architecture using Foundational genomic Large Language Models for novel Metagenome Representation [4.5] 分類学的および機能的アノテーションなしで生のDNA配列から直接エンド・ツー・エンドのメタゲノムを組み込むフレームワークであるMetagenBERTを提案する。
5つのベンチマーク腸内微生物叢(肝硬変, T2D, 肥満, IBD, CRC)に対する本手法の評価を行った。
また,MetagenBERT Glob Mcardisは多種多様なMetaCardisコホートを訓練し,他のデータセットに転送し,未知の表現型を含む予測信号を保持するクロスコホートである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:36:36 GMT)
PerspectiveCoach: Exploring LLMs for Developer Reflection [4.5] PerspectiveCoachは、大きな言語モデル(LLM)ベースの会話ツールで、構造化された視点取り演習を通じて開発者を誘導するように設計されている。
我々は、パースペクティブコーチが倫理的推論とユーザ視点への関与をどのようにサポートするかを研究する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:21:55 GMT)
Understanding Human Perception of Music Plagiarism Through a Computational Approach [4.4] 類似性分析では,メロディ,リズム,コード進行という3つの音楽的特徴に着目した。
LLM-as-a-judgeフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 22:37:19 GMT)
ARCADE: A City-Scale Corpus for Fine-Grained Arabic Dialect Tagging [4.2] 我々は、都市レベルの方言の粒度を明示的に設計した最初のアラビア語音声データセットARCADEを提示する。
コーパスは、アラブ世界のストリーミングサービスから収集されたアラビアのラジオ音声で構成されている。
その結果得られたコーパスは、19か国58都市にまたがる6,907のアノテーションと3,790のユニークなオーディオセグメントで構成されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:32:17 GMT)
LLM Flow Processes for Text-Conditioned Regression [4.2] 大規模言語モデル(LLM)は、説明やメタデータとともに、さまざまな実世界の回帰データセットを含む巨大なコーパスでトレーニングされる。
最近の作業では、これをレグレッションタスクに拡張し、そのような事前の知識とメタデータを活用することができ、驚くほど優れたパフォーマンスを実現しています。
本稿では,拡散・流れマッチングモデルと,確率密度が2値の「専門家」の積から抽出する一般手法を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:20:38 GMT)
Quantum information of optical magnetometry: Semiclassical Cramer-Rao bound violation and Heisenberg scaling [4.1] 光磁気センサはファラデー効果によって誘導される線形偏光レーザー光の回転を利用して高精度の磁場測定を行う。
ここでは、より詳細な量子情報の調査を行い、2つの異なるモデルをデプロイする。
両モデルの比較は、ハイゼンベルクのスケーリングが、他の非相互作用量子系における測定誘起量子相関の結果であることを示している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:23:31 GMT)
Compressed Qubit Noise Spectroscopy: Piecewise-Linear Modeling and Rademacher Measurements [4.1] ランダムパルス列を用いたスパースノイズスペクトルの再構成法を開発した。
また,本手法の実験的な実装を簡略化する。
これらの発展と共に、現実的な量子システムにおいて、正確で効率的なノイズ特徴づけのためにランダムなパルス列の到達範囲を広げる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:42:15 GMT)
Personalized Spiking Neural Networks with Ferroelectric Synapses for EEG Signal Processing [4.1] プログラム可能な強誘電体ハードウェアは、スパイクニューラルネットワークにおけるロバストで低オーバヘッド適応をサポートすることができることを示す。
その結果、プログラム可能な強誘電体ハードウェアは、スパイキングニューラルネットワークの堅牢で低オーバーヘッド適応をサポートできることが示されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:41:55 GMT)
Flux-noise-resilient transmon qubit via a doubly-connected gradiometric design [4.0] ナノエアブリッジを組み込んで2つのループを繋ぐ2重接続のグラジオメトリックトランスモンを提示する。
この設計は完全な電気調整性を保持し、標準のX-モン制御と読み出しと完全に互換性がある。
また、磁気シールドを使わずとも、長期間の周波数安定性も良好である。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:07:40 GMT)
Exact Mobility Edges in a Disorder-Free Dimerized Stark Lattice with Effective Unbounded Hopping [3.6] 障害のない一次元一次元ハミルトン粒子は、正確な移動エッジ(ME)をホストする
我々は、エネルギー等級がセル間ホッピング強度と等しいシャープなMEを同定し、相互空間のバルクスペクトルを解析的に導出した。
以上の結果から,MEは潜在的な実験的不完全性に対して頑健であることが示唆された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:40:22 GMT)
Edge-aware GAT-based protein binding site prediction [3.4] 生体分子間の結合部位のきめ細かい予測のためのエッジ対応グラフ注意ネットワーク(Edge対応GAT)モデルを提案する。
本手法は原子レベルのグラフを構築し,幾何学的記述子を含む多次元構造特徴を統合する。
本モデルでは,タンパク質結合部位予測のためのROC-AUCの0.93を達成し,いくつかの最先端手法より優れている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:09:57 GMT)
Pauli stabilizer formalism for topological quantum field theories and generalized statistics [3.4] トップ量子場理論(TQFT)は、物質のトポロジカル位相を記述するための統一的な枠組みを提供する。
中心的な課題は格子上のトポロジカル秩序を定式化し、微視的なハミルトニアンからトポロジカル励起の性質を抽出することである。
格子ゲージ理論の新しいクラスをパウリ安定化モデルとして構築し、一般次元における広い範囲のTQFTを実現する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:39:20 GMT)
A Training-Free Large Reasoning Model-based Knowledge Tracing Framework for Unified Prediction and Prescription [3.3] Thinking-KTはテスト時間スケーリング(TTS)を組み込んだトレーニング不要のKTフレームワーク
以上の結果から,RTSはLLMベースのKTにおいて重要で未探索の因子であることが示された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 01:02:21 GMT)
Perish or Flourish? A Holistic Evaluation of Large Language Models for Code Generation in Functional Programming [3.2] FPEvalは、Haskell、Ocaml、Scalaの3つの主要なプログラミング言語における3つの困難レベルにわたる721のプログラミングタスクの新しいベンチマークである。
このフレームワークを用いて,関数型プログラミング言語とJavaにおけるコード生成のための,最先端の大規模言語モデル(LLM)を評価する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:33:37 GMT)
Output Embedding Centering for Stable LLM Pretraining [3.1] トレーニングの終了時に大きな学習率でしばしば発生する特定の不安定性は、出力ロジットのばらつきである。
新たな緩和戦略として出力埋め込み中心化(OEC)を提案する。
OECは、-centeringと呼ばれる決定論的操作または-lossと呼ばれる正規化方法として、2つの異なる方法で実装することができる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:44:05 GMT)
Theory Trace Card: Theory-Driven Socio-Cognitive Evaluation of LLMs [3.0] 多くの社会的認知的評価は、目標能力の明確な理論的な仕様なしで進行していると論じる。
この理論的な根拠がなければ、能力の狭い部分集合のみを行使するベンチマークは、広範能力の証拠として日常的に誤解される。
本稿では,社会認知評価に付随する軽量なドキュメントアーティファクトであるTrace Cardを紹介する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:06:50 GMT)
From Mice to Trains: Amortized Bayesian Inference on Graph Data [2.8] グラフ構造化データに対する推論には、置換不変で、さまざまなサイズや空間にわたってスケーラブルで、複雑な長距離依存関係をキャプチャできるメソッドが必要である。
ABIは、高速で可能性のない後部推論を可能にするために生成ニューラルネットワークを使用するシミュレーションベースのフレームワークである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:16:28 GMT)
A first-order method for nonconvex-strongly-concave constrained minimax optimization [2.7] 本研究では,非強拘束最小値問題に対する一階サブプロブレム法を提案する。
これまでのよく知られた操作を改善するために、$epsilon$-KKのソリューションが見つかる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 03:03:50 GMT)
Low-Back Pain Physical Rehabilitation by Movement Analysis in Clinical Trial [2.7] 本稿では,リハビリテーションのための知的学習システム(ITS)を実現するための臨床収集データセットであるKeraalデータセットを紹介する。
運動監視における4つの課題 - 動作評価、エラー認識、空間的局所化、時間的局所化 - に対処する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:22:05 GMT)
SerpentFlow: Generative Unpaired Domain Alignment via Shared-Structure Decomposition [2.6] ドメインアライメントとは、異なるドメインからのデータ分布間の対応を学習することを指す。
未ペアドメインアライメントのための生成フレームワークであるSerpentFlowを紹介します。
SerpentFlowは、潜在空間内のデータを、ドメインとドメイン固有のコンポーネントの両方に共通する共有コンポーネントに分解する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:33:48 GMT)
The State of Open Science in Software Engineering Research: A Case Study of ICSE Artifacts [2.6] ソフトウェア工学(SE)研究において、複製パッケージの実行可能性と厳密さを包括的に調査する研究は、著しく欠如している。
過去10年間のICSE手続きの一環として,100個の複製パッケージを評価した。
以上の結果から,評価対象となった人工物100品のうち約40%が実行可能であり,そのうち32.5%(40品中13品)が変更することなく実行可能であった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:47:43 GMT)
On the Effectiveness of Proposed Techniques to Reduce Energy Consumption in RAG Systems: A Controlled Experiment [2.5] 本研究では,RAGシステムにおけるエネルギー消費削減を目的とした5つの実用技術について検討した。
我々は,これらの技術がエネルギー消費,レイテンシ,精度に与える影響を評価した。
我々は,類似性検索閾値の増大,埋め込みサイズの低減,ベクトルインデックスの適用,BM25Sリランカの使用などにより,最大60%のエネルギー使用量の削減が可能であることを明らかにした。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:50:49 GMT)
Quantifying Quanvolutional Neural Networks Robustness for Speech in Healthcare Applications [2.5] 我々は、古典的畳み込みニューラルネットワーク(CNN)に対する量子機械学習モデルであるクオン進化ニューラルネットワーク(QNN)の堅牢性を評価する。
我々は3つのQNNモデル(Random、Basic、Strongly)とCNNベースライン(CNN-Base)、ResNet-18、VGG-16(CE、mCE、RCE、RmCE)を比較した。
QNNは、ピッチシフト、時間シフト、速度変化(重度時間シフト時のCE/RCEの最大22%低下)においてCNN-Baseよりも優れており、一方CNN-Baseはガウシアンより弾力性が高い。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:25:29 GMT)
Visualizing the Structure of Lenia Parameter Space [2.4] 我々は,レニア系を4つの定性的に異なる動的クラスに分類する新しい手法を提案する。
これにより、動くソリトンを検出し、ウェブサイト上でレニアのパラメータ空間構造をインタラクティブに可視化することができる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:35:06 GMT)
Green LLM Techniques in Action: How Effective Are Existing Techniques for Improving the Energy Efficiency of LLM-Based Applications in Industry? [2.4] 大規模言語モデル(LLM)の急速な採用により、そのエネルギー消費に対する懸念が高まっている。
オランダのITサービス企業であるSchuberg Philisで、業界状況におけるアプリケーションを分析しました。
プロンプト最適化や2ビット量子化といったいくつかの手法は、エネルギー使用量を最大90%削減することができた。
他の品質を実質的に損なわずに大幅なエネルギー削減を達成した唯一の技術は、NvidiaのPrompt Task and Complexityによる小型で大規模なモデルコラボレーションであった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:35:29 GMT)
LIMOncello: Iterated Error-State Kalman Filter on the SGal(3) Manifold for Fast LiDAR-Inertial Odometry [2.3] LIMOncelloは、$mathrmSGal(3)多様体上の6-DoF運動をモデル化するLiDAR-Inertial Odometryシステムである。
このシステムは、安定したメモリ成長を伴うリアルタイムパフォーマンスを維持し、オープンソース実装としてリリースされている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:58:56 GMT)
Emergent Introspective Awareness in Large Language Models [2.2] 大規模言語モデルが内部状態をイントロスペクションできるかどうかを検討する。
モデルが特定のシナリオにおいて、注入された概念の存在に気付き、それらを正確に識別できることが分かりました。
最も有能なモデルであるクロード・オプス4と4.1は、一般に最も内省的な認識を示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:47:41 GMT)
Subimage Overlap Prediction: Task-Aligned Self-Supervised Pretraining For Semantic Segmentation In Remote Sensing Imagery [2.2] Subimage Overlap Predictionは、リモートセンシング画像におけるセマンティックセグメンテーションを支援するための、新しい自己教師型事前訓練タスクである。
このタスクで事前学習を行うことで、下流セグメンテーションの性能は大幅に向上し、同等かそれ以上に向上することを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:28:49 GMT)
Cold-Starting Podcast Ads and Promotions with Multi-Task Learning on Spotify [2.2] 本稿では,Spotifyポッドキャストエコシステム内の広告とプロモーションの両方を対象として,統合された多目的モデルを提案する。
オンラインA/Bテストは、効果的なコスト・パー・ストリームを22%削減する。
私たちの経験から、統一的なモデリング戦略は保守性、コールドスタート性能、カバレッジを改善します。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:48:15 GMT)
Enhancing Object Detection with Privileged Information: A Model-Agnostic Teacher-Student Approach [2.1] 本稿では、オブジェクト検出におけるLUPI(Learning Using Privileged Information)パラダイムの統合について検討する。
本稿では,ボックスマスクを深層学習に基づく物体検出装置に注入するなど,特権情報を注入するための汎用的モデルに依存しない手法を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:24:34 GMT)
From XAI to Stories: A Factorial Study of LLM-Generated Explanation Quality [2.0] 本稿では,予測モデルの選択,XAI法,Large Language Models (LLMs) の選択,および自然言語の説明にどう影響するかを検討する。
以上の結果から,XAIは非XAIベースラインよりも小さな改善しか提供せず,専門家の聴衆にのみ提供できることが示唆された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:52:20 GMT)
Why Commodity WiFi Sensors Fail at Multi-Person Gait Identification: A Systematic Analysis Using ESP32 [2.0] WiFi Channel State Information (CSI)は、シングルパーソンの歩行識別を約束している。
複数人の識別はほとんど探索されていないが、既存の作業は複雑で高価な設定に依存している。
本研究では,コモディティESP32センサを用いて,7つのシナリオに対して6種類の信号分離手法を体系的に評価した。
分析の結果,人数の増加に伴い,物体内変動,物体間識別性が低下し,高度に劣化することが明らかとなった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:55:38 GMT)
UnPII: Unlearning Personally Identifiable Information with Quantifiable Exposure Risk [1.8] UnPIIは、個々のPII属性または組み合わせたPII属性のリスクに基づいて、忘れを優先する最初のPII中心の未学習アプローチである。
現実的な評価を支援するために,現実的な暴露シナリオをシミュレートする合成PIIデータセットを体系的に構築する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:45:04 GMT)
The Homogeneity Trap: Spectral Collapse in Doubly-Stochastic Deep Networks [1.8] 構造保存深層構造に固有の臨界スペクトル劣化現象を同定する。
最大エントロピーバイアスは混合作用素を均一なバリセンターへ誘導し、従属特異値 を抑えることを示す。
ネットワークの有効深度にリンクするスペクトル境界を導出し、高エントロピー制約が浅層受容場への特徴変換を制限することを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:09:42 GMT)
Adaptive Framework for Failure-Aware Protocols in Fusion-Based Graph-State Generation [1.7] 我々は,融合ネットワークのグラフ理論的特徴量を用いた構築プロセスの最適化フレームワークを開発する。
本稿では, 線形クラスタ状態に対するグラフ状態生成プロトコルと, 融合故障に適応したタイプI/タイプII融合を提案する。
我々の戦略は、成功プロトコルまでの単純な繰り返しと比較して、核融合のオーバーヘッドを桁違いに減らすことができる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:13:39 GMT)
State of the Quantum Software Engineering Ecosystem [1.6] 我々は、量子ソフトウェア工学(QSE)エコシステムの現状について研究し、学術と産業の成果、活動、エンゲージメントに焦点をあてる。
我々の研究方法論は、人工知能(AI)の最先端を特徴とする新しいものである。
目標は、非常に活発で、QSEで卓越した成果を上げた機関や企業を特定することである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 23:34:51 GMT)
AI-exposed jobs deteriorated before ChatGPT [1.6] 公の場での議論は、2022年後半のChatGPTのリリースにAIが露呈した職業の雇用見通しを悪化させている。
毎月の米国失業保険記録を用いて、職業別および場所別失業リスクを測定する。
また,ChatGPTより数ヶ月前の2022年前半にAIが公布した職業において,リスクが上昇していることが示唆された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:03:21 GMT)
DSL or Code? Evaluating the Quality of LLM-Generated Algebraic Specifications: A Case Study in Optimization at Kinaxis [1.6] 大規模言語モデル(LLM)は、自然言語記述からモデルを直接生成することで、コストバランスのシフトを支援する。
しかし、ドメイン固有の言語では、LLM生成モデルはPythonのような主流言語でLLM生成コードよりも正確ではないかもしれない。
AMPLモデルとPythonコードをNL問題記述から導出するLLMベースのアプローチであるEXEOSを導入する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:09:37 GMT)
Context-Adaptive Requirements Defect Prediction through Human-LLM Collaboration [1.4] 本稿では,欠陥予測を静的な分類タスクではなく適応プロセスとして扱うHuman-LLM Collaboration(HLC)アプローチを提案する。
メルセデス・ベンツの要求条件である1,266のQuREベンチマークの弱い単語の匂いを用いて,本手法の評価を行った。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:00:14 GMT)
LIA: Supervised Fine-Tuning of Large Language Models for Automatic Issue Assignment [1.4] LIAは、タイトルや説明から直接、ランク付けされた開発者のレコメンデーションを生成することを学ぶ。
DeepSeek-R1-Distill-Llama-8Bの事前訓練ベースモデルと比較して、Hit@1は+187.8%高い。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:26:46 GMT)
Further Improving the Decoy State Quantum Key Distribution Protocol with Advantage Distillation [1.4] 我々は,古典的優位蒸留(CAD)のデコイ状態BB84プロトコルへの応用を再検討する。
我々は,デコイ状態BB84プロトコルに適用したCADの新しいセキュリティ証明を導出する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:35:31 GMT)
Higher-Order Action Regularization in Deep Reinforcement Learning: From Continuous Control to Building Energy Management [1.4] 我々は高次微分ペナルティによる行動平滑性正規化を体系的に検討する。
我々の研究は、エネルギークリティカルなアプリケーションにおけるRL最適化と運用上の制約の間の効果的な橋渡しとして、高次行動正規化を確立している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:35:33 GMT)
Question Answering for Multi-Release Systems: A Case Study at Ciena [1.3] マルチリリースシステムからのドキュメントに対する質問に対する回答は、異なるリリースが明確に重なり合うドキュメントを持っているため、課題を引き起こします。
マルチリリースシステム文書における最先端質問応答技術の不正確さから,本論文ではQAMRを提案する。
QAMRは、従来の検索拡張生成(RAG)を強化し、異なるリリースのための非常に類似しているが異なるドキュメントに直面した精度を保証する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:44:26 GMT)
QuIC: A Quantum-Inspired Interaction Classifier for Revitalizing Shallow CNNs in Fine-Grained Recognition [1.3] QuICは軽量なプラグイン・アンド・プレイモジュールで、機能ディメンションを爆発させることなく、安定したシングルステージのエンドツーエンドトレーニングをサポートする。
これはVGG16のTop-1精度を20%近く向上させ、ResNet18の最先端アテンション機構(SE-Block)を上回っている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:09:18 GMT)
Quantum AI for Cybersecurity: A hybrid Quantum-Classical models for attack path analysis [1.3] 本研究では,ハイブリッド量子古典学習の可能性について検討し,侵入検出のための特徴表現を強化する。
量子化された表現は、データが不足している場合により優れた攻撃リコールとクラス分離性を示す。
結果は、サイバーセキュリティタスクの一般化と表現品質を改善するための量子埋め込みの可能性を強調している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:11:39 GMT)
LendNova: Towards Automated Credit Risk Assessment with Language Models [1.2] 本稿では、信用リスク評価のための最初の実用的エンドツーエンドパイプラインであるLendNovaを紹介する。
先進的なNLP技術と言語モデルを活用することにより、生クレジットレコードで利用可能なすべての情報を活用するように設計されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:53:36 GMT)
Textual Explanations and Their Evaluations for Reinforcement Learning Policy [1.2] 説明可能な強化学習(XRL)政策は、自律的なエージェントが人間の期待に応じて振舞うことを保証するために不可欠である。
本稿では,テキスト記述の生成,透過的なルールのセットへの変換,品質の向上,評価を行う新しいフレームワークを提案する。
このフレームワークは、既存の手法である自律的政策説明の限界に対処し、生成された透明なルールは、特定のタスクにおいて満足なパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:38:07 GMT)
LLM-Enhanced Reinforcement Learning for Time Series Anomaly Detection [1.2] 時系列異常検出は、しばしばスパースラベル、複雑な時間パターン、高価な専門家アノテーションに悩まされる。
本稿では,LL(Reinforcement Learning),VAE(Variational Autoencoder)の強化された動的報酬スケーリング,ラベル伝搬によるアクティブラーニングを併用した,LLM(Large Language Model)に基づく報酬形成機能の統合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:33:30 GMT)
Clinical Knowledge Graph Construction and Evaluation with Multi-LLMs via Retrieval-Augmented Generation [1.2] 大規模言語モデル(LLM)は、構造化されていない臨床物語から知識グラフを構築する新しい機会を提供する。
既存のアプローチは、しばしば構造化された入力に依存し、事実の正確さと意味的な一貫性の堅牢な検証が欠如している。
マルチエージェントプロンプトとスキーマ制約付き検索・拡張生成戦略を用いた臨床用KG構築のためのエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:16:29 GMT)
BanglaIPA: Towards Robust Text-to-IPA Transcription with Contextual Rewriting in Bengali [1.1] 文字ベースの語彙と単語レベルのアライメントを統合した新しいIPA生成システムであるBanglaIPAを提案する。
提案システムはベンガル数字を正確に処理し,地域方言間で強い性能を示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:17:31 GMT)
Simulated Reasoning is Reasoning [1.1] 推論は特定の方法で理解する過程、すなわち「象徴的推論」として概念化される
基礎モデル(FM)は、これが多くの推論タスクに必要な条件ではないことを示した。
本稿では,この現象のいくつかの哲学的解釈について論じる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:00:04 GMT)
SketchRodGS: Sketch-based Extraction of Slender Geometries for Animating Gaussian Splatting Scenes [1.0] 本稿では,ユーザのスケッチ入力からガウススティングシーンにおいて,オブジェクトの細い部分のポリライン表現を抽出する手法を提案する。
本手法は,画面空間最短経路解析を用いて細い部分を表すポリラインメッシュを強固に構築する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:51:12 GMT)
NQC2: A Non-Intrusive QEMU Code Coverage Plugin [1.0] 一般的に使用されるアプローチでは、実行中にカバレッジ情報を収集してダンプするコードを追加することで、ソースファイルをインストレーションする。
NQC2はQEMU.NQC2用のプラグインで、実行時にQEMUからカバレッジ情報を抽出し、ホストマシン上のファイルに格納する。
改良されたQEMUバージョンと互換性があり、ターゲット・ソフトウェア・インスツルメンテーションを必要としない。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:11:41 GMT)
TopoLoRA-SAM: Topology-Aware Parameter-Efficient Adaptation of Foundation Segmenters for Thin-Structure and Cross-Domain Binary Semantic Segmentation [1.0] バイナリセマンティックセグメンテーションのためのトポロジー認識およびパラメータ効率適応フレームワークである textbfTopoLoRA-SAM を提案する。
TopoLoRA-SAMは、軽量空間畳み込みアダプタで強化された冷凍ViTエンコーダにローランド適応(LoRA)を注入する。
TopoLoRA-SAMはCHASE_DB1データセットのセグメンテーション精度とロバスト性を大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:03:45 GMT)
STELLAR: A Search-Based Testing Framework for Large Language Model Applications [1.0] LLM(Large Language Model)ベースのアプリケーションは、顧客サービス、教育、モビリティなど、さまざまな領域に展開されている。
これらのシステムは不正確、虚偽、有害な応答をしがちであり、その巨大で高次元の入力空間は、特に系統的なテストが困難である。
本稿では,LLMベースのアプリケーションを対象とした自動検索ベースのテストフレームワークSTELLARについて述べる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:03:57 GMT)
Don't Mind the Gaps: Implicit Neural Representations for Resolution-Agnostic Retinal OCT Analysis [1.0] Inlicit Neural representations (INRs) は、ボキセル化データを連続的な表現として保存するツールとして登場した。
網膜CTボリュームの高密度3次元解析にINRの特性を利用する2つのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:41:03 GMT)
Simulating Non-Markovian Dynamics in Open Quantum Systems [1.0] 長寿命の相関効果(非マルコフ性)、システム環境のハイブリッド化、ボルン・マルコフ近似を超える精度の必要性は、特に問題となる。
これらの課題に対応するためのアプローチは、異なる分野から導入された。
我々は、異なるスキームのリンクを非常に便利に可能にし、また、さらなる進歩を触媒する統合されたフレームワークを活用している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:38:04 GMT)
Simulations and Advancements in MRI-Guided Power-Driven Ferric Tools for Wireless Therapeutic Interventions [1.0] 本研究は, 医用画像におけるMRIの役割の向上, 特にロボット支援デバイスを用いた血管内介入のガイドへの応用に焦点をあてる。
計算ユニットとユーザインタフェースを含むMRIスキャナとのシームレスな統合のために,新たに開発された計算システムを導入している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 02:04:39 GMT)
DataParasite Enables Scalable and Repurposable Online Data Curation [1.0] DataParasiteはスケーラブルなオンラインデータ収集のためのモジュールパイプラインである。
キュレーションタスクを独立したエンティティレベルの検索に分解する。
データの収集コストを手作業によるキュレーションと比較して桁違いに削減しながら高い精度を達成する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 22:04:16 GMT)
Leveraging 2D-VLM for Label-Free 3D Segmentation in Large-Scale Outdoor Scene Understanding [0.9] 提案手法では,仮想カメラを用いた2次元画像上に3Dポイントクラウドを投影し,自然言語プロンプトでガイドされた基礎2Dモデルを介してセマンティックセグメンテーションを行う。
提案手法は既存のトレーニング不要な手法より優れており,教師付き手法に匹敵するセグメンテーション精度を実現する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:42:49 GMT)
CT Scans As Video: Efficient Intracranial Hemorrhage Detection Using Multi-Object Tracking [0.9] 本稿では,2次元検出の効率と3次元コンテキストの必要性を両立させる軽量コンピュータビジョンフレームワークを開発する。
計算コストのごく一部で3Dコンテキスト推論を近似することにより,リアルタイム患者優先化のためのスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:49:51 GMT)
The Patient/Industry Trade-off in Medical Artificial Intelligence [0.9] 臨床実習へのAIの統合を妨げるAI研究の3つの特徴について論じる。
これには、臨床的に関連する指標の欠如、結果を検証するための臨床試験と縦断的研究の欠如、開発プロセスへの患者と医師の関与の欠如が含まれる。
このギャップに対処するための3つのアプローチを提案する。AIモデルの透明性と説明可能性の向上、実践に患者利益を集中させるという評判を持つ業界パートナとの関係の促進、医療全体の利益の優先順位付けである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:01:57 GMT)
MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search [0.9] MCGIは、探索戦略をデータ固有の幾何学に適応させる幾何学的・ディスクレジデントインデックス法である。
MCGIは5.8$times$高スループットを高次元GIST1Mでの95%リコールで達成し、最先端のDiskANNと比較した。
数十億ドル規模のSIFT1Bデータセット上では、MCGIは、標準の低次元データセットにおけるパフォーマンスの同等性を保ちながら、ハイリコールクエリレイテンシを3$times$に削減することで、そのスケーラビリティをさらに検証する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:23:48 GMT)
Jenius Agent: Towards Experience-Driven Accuracy Optimization in Real-World Scenarios [0.9] 本稿では,実体験に基づくエージェントフレームワークを提案する。
Jenius-Agentという名前のエンドツーエンドフレームワークは、3つの重要な最適化と統合されている。
実験によると、タスクの精度が20%向上し、トークンコストが削減され、レスポンスレイテンシが低下し、起動障害が発生している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:35:12 GMT)
VIT-Ped: Visionary Intention Transformer for Pedestrian Behavior Analysis [0.9] 本稿では,異なるデータモダリティを用いて異なる大きさのトランス/ビデオビジョン変換器に基づくアルゴリズムを提案する。
我々は,一般的な歩行者行動データセットであるJAADを用いてアルゴリズムを評価し,SOTA性能に到達し,精度,AUC,F1スコアなどの指標でSOTAをパスした。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:48:12 GMT)
RSwinV2-MD: An Enhanced Residual SwinV2 Transformer for Monkeypox Detection from Skin Images [0.8] 本稿では,RSwinV2 (Customized Residual SwinTransformerV2) と呼ばれるMpox診断のための深層学習手法を提案する。
このRSwinV2アプローチでは、入力画像を非重複パッチに分割し、シフトウィンドウを用いて処理し、これらのパッチに注意を払う。
RSwinV2はさらにSwinTransformerをベースとして開発され、トランスフォーマーのグローバルリンク機能を利用するためのパッチと位置埋め込みが含まれている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:57:26 GMT)
Interpretation of Unfair Sampling in Quantum Annealing by Node Centrality [0.8] 退化摂動理論を用いて退化基底状態を解析し、それらの選好を特徴づける。
この分析では、基底状態からなるグラフの隣接行列が自然に現れる。
2次重みは局所的な障壁情報を符号化し、サンプリングフェアネスと局所的なエネルギー景観の平坦度に関連することを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:10:47 GMT)
High-Order Epistasis Detection Using Factorization Machine with Quadratic Optimization Annealing and MDR-Based Evaluation [0.8] 高次てんかんは、候補遺伝子座の組み合わせの爆発による遺伝子関連研究における根本的な課題である。
本稿では,ブラックボックス最適化問題としてエピスタシス検出問題を定義し,分解機を用いて解決する。
本稿では,MDRによって計算される分類誤り率(CER)をブラックボックス目的関数として用いるFMQAに基づく効率的なエピスタシス検出法を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:41:34 GMT)
TabiBERT: A Large-Scale ModernBERT Foundation Model and A Unified Benchmark for Turkish [0.7] TabiBERTはModernBERTアーキテクチャをベースとしたモノリンガルのトルコ語エンコーダである。
8,192トークンのコンテキスト長(16xオリジナルBERT)をサポートし、最大2.65倍のスピードアップを実現し、GPUメモリ使用量を削減する。
タビベンチで77.58を獲得し、BERTurkを1.62ポイント上回り、8つのカテゴリーのうち5つの最先端技術を確立した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:15:27 GMT)
Car Drag Coefficient Prediction from 3D Point Clouds Using a Slice-Based Surrogate Model [0.7] 本稿では,3次元車両形状の逐次スライスワイズ処理に基づいて,空力抵抗係数(Cd)の予測を行うための軽量サロゲートモデルを提案する。
DrivAerNet++データセットでトレーニングされ評価されたこのモデルは、Cd予測において高い判定係数(R2 > 0.9528)と低い平均絶対誤差(MAE approx 6.046 x 10-3)を達成する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:41:20 GMT)
Multi-fidelity graph-based neural networks architectures to learn Navier-Stokes solutions on non-parametrized 2D domains [0.7] 非パラメタライズされた2次元幾何学における定常ナビエ-ストークス解の予測のためのグラフベース多要素学習フレームワークを提案する。
本手法は,Stokesモデルからの逐次近似による学習過程の導出を目的としている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:35:59 GMT)
XAI-MeD: Explainable Knowledge Guided Neuro-Symbolic Framework for Domain Generalization and Rare Class Detection in Medical Imaging [0.6] XAIMeDは、臨床的に正確な専門家の知識を統合された神経シンボルアーキテクチャを通じて深層学習に統合する説明可能な医療AIフレームワークである。
このフレームワークは、臨床の専門知識を、原子医学の命題に対する論理的結合としてエンコードし、それらをマシンチェック可能なクラス固有のルールに変換する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:17:33 GMT)
A fast and exact approach for stabilizer Rényi entropy via the XOR-FWHT algorithm [0.6] 量子優位性は、絡み合い以外の重要な量子資源に依存していると広く理解されている。
しかしながら、全てのパウリ弦の直接のブルートフォースとそれに対応する2N$状態ベクトルからの期待値($N$がシステムサイズである場合)は、全体的な計算コストのスケーリングを$O(8N)$とする。
ここで、ビットストリング言語における二階安定化器レニーエントロピーを再構成し、基底となるXOR-畳み込み構造をmathbb ZN$で公開し、計算を2N$高速ウォルシュ・アダマール変換に還元する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:05:46 GMT)
Coordinated Multi-Domain Deception: A Stackelberg Game Approach [0.5] 我々は,ディフェンダーとアタッカーの戦略的相互作用をモデル化するためのStackelbergゲームフレームワークを紹介した。
我々は,最も重大な脆弱性を特定するために,CVEベースのユーティリティ関数を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 23:04:13 GMT)
A Differentiable Adversarial Framework for Task-Aware Data Subsampling [0.5] 本稿では,データ削減を識別可能なエンドツーエンド学習問題に再構成する新しいパラダイムとして,ASSS(Antagonistic soft selection subsampling)フレームワークを導入する。
この研究は、学習可能なコンポーネントとしてタスク認識データサブサンプリングを確立し、大規模なデータ学習を効果的に行うための原則的なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:10:09 GMT)
Perspective: The creation of "Newsgames" as a teaching method-Empirical observations [0.5] この章では、現在の出来事に対処するニュースゲーム制作に精通した経験を報告する。
約80人の学生が、様々なニュースに関する17のゲームを制作した。
本稿は,ニュースゲームデザインが推論スキルの開発を支援することを結論付けている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:26:53 GMT)
GEM-Style Constraints for PEFT with Dual Gradient Projection in LoRA [0.4] ローランドアダプタ (LoRA) サブスペース内のグラディエント・エピソード・メモリ (GEM) を再検討する。
我々は,GEMの二次射影に対する固定予算,GPU抵抗2次射影勾配近似であるI-GEMを紹介する。
I-GEMはGEMのような安定性を保ち、平均投影オーバーヘッドを下げる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:14:41 GMT)
Automatic Assertion Mining in Assertion-Based Verification: Techniques, Challenges, and Future Directions [0.4] 本稿では,最新の,先進的で広く採用されているアサーション・マイナーについて概説し,それらの方法論の比較分析を行った。
目標は、既存の鉱山労働者の能力と限界に関する洞察を研究者や検証実践者に与えることである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:30:12 GMT)
Efficient temporal prediction of compressible flows in irregular domains using Fourier neural operators [0.4] 本稿ではフーリエ演算子(FNO)を用いた不規則流れ場における高速圧縮性流体の時間的変化について検討する。
我々は,不規則な流れ場をFNO入力要求と整合した逐次形式に再構成し,複数ステップの予測を行うためにリカレントニューラルネットワーク(RNN)に時間的結合手法を組み込む。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:12:35 GMT)
Interconnection and Damping Assignment Passivity-Based Control using Sparse Neural ODEs [0.4] パッシビリティベース制御(IDA-PBC)は、ポート・ハミルトン構造(pH)を状態フィードバック法則を用いて制御システムに割り当てる非線形制御手法である。
IDA-PBCの主な制限は、偏微分方程式の集合(PDE)を解析的に解く複雑さに起因している。
一致するPDEを正確に解くことなく、IDA-PBCコントローラを設計するための新しい数値手法を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:21:27 GMT)
Gaussian time-translation covariant operations: structure, implementation, and thermodynamics [0.3] 離散変数共変演算で知られているいくつかの重要な結果がガウス光学系において分解されることを示す。
この結果はガウス同変演算に対する包括的数学的および操作的ツールキットを提供する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:00:01 GMT)
Classifying several dialectal Nawatl varieties [0.2] メキシコで最も広く話されている先住民言語はナワトル語であり、現在200万人以上がそれを使用している。
その豊かな文化遺産にもかかわらず、ナワトル語はコンピュータ資源がほとんどない言語である。
この問題は方言の変種に関して複雑であり、約30の変種が認識されており、言語の書体で異なる綴りを数えていない。
本研究では,機械学習とニューラルネットワークを用いてナワトル品種を分類する問題に対処する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:38:55 GMT)
A Green Solution for Breast Region Segmentation Using Deep Active Learning [0.2] 本研究は,BRS(Deep Active Learning on Breast Region)におけるサンプル戦略の選択に焦点をあてる。
このプロセスでは,患者の位置決めと乳房サイズが重要な選択基準とされた。
最寄りのポイント戦略は、最も低い炭素フットプリントを30%と40%のデータ比率で継続的に達成した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 20:25:34 GMT)
Latent Space Element Method [0.1] Latent Space Element Method (LSEM) は、学習されたサブドメイン(要素)モデルをタイル化して結合してより大きな計算領域を形成する、要素ベースの潜在代理手法である。
スムーズなウィンドウベースのブレンディングは、重なり合う要素予測から大域的場を再構築し、スケーラブルな組立潜在力学系を生成する。
1D Burgers と Korteweg-de Vries 方程式の実験では、LSEM はトレーニングで見られるものよりも大きい空間領域にスケールしながら予測精度を維持している。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 02:32:50 GMT)
On the Limits of Self-Improving in LLMs and Why AGI, ASI and the Singularity Are Not Near Without Symbolic Model Synthesis [0.0] 我々は,大規模言語モデル(LLM)における自己学習と生成AIを離散時間力学系として定式化する。
1) 有限サンプリング効果が分布多様性の単調な損失(モード崩壊)を引き起こすエントロピー減衰と,(2) 外部グラウンドの損失がモデルの真理表現をランダムウォークとして漂流させる変数増幅の2つの基本的障害モードを導出する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:50:49 GMT)
mHC-GNN: Manifold-Constrained Hyper-Connections for Graph Neural Networks [0.0] 我々は最近Transformersのために提案されたManifold-Constrained Hyper-Connection (mhc)citepxie2025mhcをグラフニューラルネットワークに適用する。
提案手法であるmHC-GNNは,ノード表現を$n$並列ストリームに拡張し,ストリーム混合行列をBirkhoffポリトープに制約する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:25:45 GMT)
Yukthi Opus: A Multi-Chain Hybrid Metaheuristic for Large-Scale NP-Hard Optimization [0.0] Yukthi Opus (YO) は、NP-hard最適化のためのマルチチェーンハイブリッドメタヒューリスティックである。
YOは、構造化された2相アーキテクチャに3つの相補的なメカニズムを統合する。
YOは、予測可能な評価予算を維持しながら、大規模かつマルチモーダルな問題における競争性能を達成する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:51:08 GMT)
Vouchsafe: A Zero-Infrastructure Capability Graph Model for Offline Identity and Trust [0.0] この研究は、このようなインフラがなければ、セキュアなアイデンティティと信頼が可能であることを示す。
現代のアイデンティティと信頼システムは、最も必要な環境で崩壊し、災害帯、断線または被害を受けたネットワーク、検閲やインフラの干渉といった敵の状況である。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:34:47 GMT)
Varying-Coefficient Mixture of Experts Model [0.0] 本稿では、ゲーティング関数とエキスパートモデルの両方におけるすべての係数効果をインデックス変数に沿って変化させることができるVarying-Coefficient Mixture of Experts (VCMoE)モデルを提案する。
本稿では, 胚性マウスにおける単一遺伝子発現のデータセットを用いて, 遺伝子Satb2とBcl11bの関連性の時間的ダイナミクスを特徴づけるVCMoEモデルを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 00:23:30 GMT)
Variational (Energy-Based) Spectral Learning: A Machine Learning Framework for Solving Partial Differential Equations [0.0] 偏微分方程式(PDE)を解くための機械学習フレームワークである変動スペクトル学習(VSL)を導入する。
VSLは変分PDE理論、スペクトルの離散化、現代の機械学習の実践の間に原則化された橋渡しを提供する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:03:58 GMT)
Two-Qubit Module Based on Phonon-Coupled Ge Hole-Spin Qubits: Design, Fabrication, and Readout at 1-4 K [0.0] フォノン結合型ゲルマニウム(Ge)ホールスピン量子ビットをベースとした2量子ビットモジュールのデバイスレベル設計は、$1-4mathrmK$である。
設計は、歪んだGe量子井戸に2つのゲート定義のホールスピン量子ビットと、コヒーレントフォノンベースの相互作用を媒介するGHz PnC欠陥モードを統合する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 00:46:28 GMT)
Topological States Enabled by Non-local Nonlinearity in Synthetic Dimensions [0.0] 我々は、全対全非局所相互作用を持つ合成Su-Schrieffer-Heeger格子を考える。
特異な非線形性は効果的なカイラル対称性を維持し、量子化された非線形巻線とベリー相をもたらす。
この結果は厳密な枠組みを確立し、非線形トポロジカルな現象を探索する道を開いた。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:23:55 GMT)
Topological Obstructions for Quantum Adiabatic Algorithms: Evidence from MaxCut Instances [0.0] 本研究は,アディバティックアルゴリズムが高い確率で成功する場合においても,デジェネリアシーのみがスペクトルフローに避けられない大域的制約を課していることを示す。
以上の結果から, 局所的なギャップ閉鎖ではなく, 固有状態のグローバル接続に根ざした位相的障害の形で, 複雑で制約のあるスペクトル流と共存できることが示された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:35:31 GMT)
Three results on twisted $G-$codes and skew twisted $G-$codes [0.0] ツイスト群代数上の次元 3 のすべてのイデアルがアーベル群符号であることを示す。
また、ツイストされた群符号の次元と距離の有界性や、そのような有界性に達するときの有界性も証明する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:32:19 GMT)
Threat Detection in Social Media Networks Using Machine Learning Based Network Analysis [0.0] 本稿では、ソーシャルメディアネットワーク環境における悪意ある行動の分類に使用できる機械学習に基づく脅威検出フレームワークを提案する。
次に、ニューラルネットワーク(ANN)のモデルを作成し、悪意のあるアクションの複雑で非線形な傾向を取得する。
提案手法は,精度,精度,リコール,F1スコア,ROC-AUCなどの従来の性能指標で検証し,優れた検出精度と高い強度を示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 22:14:41 GMT)
The Rise of Agentic Testing: Multi-Agent Systems for Robust Software Quality Assurance [0.0] 現在のAIベースのテストジェネレータは、実行意識のフィードバックがないため、無効、冗長、あるいは実行不可能なテストを生成する。
本稿では,テスト生成エージェント,実行・分析エージェント,レビュー・最適化エージェントが協調してテストの生成,実行,解析,精査を行う,クローズドループの自己修正システムを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:20:14 GMT)
The Machine Learning Canvas: Empirical Findings on Why Strategy Matters More Than AI Code Generation [0.0] 機械学習(ML)プロジェクトの80%以上は、本当のビジネス価値を提供できない。
我々は,150人のデータサイエンティストを調査し,統計モデルを用いて回答を分析した。
AIアシスタントはコーディングを高速化するが、成功は保証しない。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 07:02:58 GMT)
Temporal Kolmogorov-Arnold Networks (T-KAN) for High-Frequency Limit Order Book Forecasting: Efficiency, Interpretability, and Alpha Decay [0.0] 本稿では,標準LSTMの固定された線形重みを学習可能なB-スプライン活性化関数に置き換えるために,時間的コルモゴロフ・アルノルドネットワーク(T-KAN)を導入する。
T-KANネットワークの有効性は低く、-82.76%のDeepLOBが1.0bpsの取引コストでダウンしたのに対し、132.48%のリターンをもたらす。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:59:42 GMT)
SynRXN: An Open Benchmark and Curated Dataset for Computational Reaction Modeling [0.0] SynRXNは、コンピュータ支援合成計画(CASP)のためのベンチマークフレームワークであり、オープンソースのリソースである
エンド・ツー・エンドの合成計画を5つのタスク・ファミリーに分割し、反応のバランス、原子間マッピング、反応分類、反応特性予測、合成を網羅する。
敏感なベンチマークを行うために、我々は、公開トレーニングと検証データを保留金標準テストセットと組み合わせ、反応のバランスや原子間マッピングなどの汚染防止タスクを評価セットとしてのみ配布する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:49:58 GMT)
Structural Representations for Cross-Attack Generalization in AI Agent Threat Detection [0.0] 構造的トークン化を導入し、会話内容ではなく実行フローパターン(ツール呼び出し、引数、観察)を符号化する。
言語的特徴を必要とする攻撃に対して,両表現を適応的に組み合わせたゲート型多視点融合を提案する。
我々の発見によると、AIエージェントのセキュリティは基本的に構造的な問題であり、アタックセマンティクスはサーフェス言語ではなく実行パターンに存在する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 01:51:40 GMT)
Spatio-temporal modeling and forecasting with Fourier neural operators [0.0] 本研究は, 動的統計時間モデル構築にニューラル演算子(FNO)を用いることを提案する。
FNO は、未知の線型あるいは非線型偏微分方程式の解を近似する関数のフレキシブルな写像である。
欧州全体での海面温度データを用いて,FNOに基づく動的時間-DST統計モデリングの可能性を示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:49:08 GMT)
Solving Cyclic Antibandwidth Problem by SAT [0.0] Cyclic Antibandwidth Problem (CABP) は、NP-hardグラフラベル問題である。
本稿では SAT-CAB と呼ばれる SAT-CAB の解法に基づく一般グラフ上でのCABP の最初の正確なアプローチを示す。
SAT-CABは、最先端のアルゴリズムによって得られる最もよく知られた解に一貫して一致するか、超えるかを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:15:29 GMT)
Schwarz maps with symmetry [0.0] 量子力学系の対称性の理論は、量子情報理論におけるいくつかの関係写像の構造と性質を研究するために応用される。
我々は、等変 A を$Cast$-algebras の間の数学的 B$ へ写像する一般構造を開発する。
次に、自然なユニタリ群作用の下で同変であるユニタリ・エルミシティ保存写像の体系的研究を行う。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:11:03 GMT)
Scalable Construction of a Lung Cancer Knowledge Base: Profiling Semantic Reasoning in LLMs [0.0] オープン情報抽出(OpenIE)を用いた肺癌知識基盤構築のためのパイプラインを提案する。
結果として得られる三重項集合は、細調整された大言語モデル(LLM)のためのドメイン固有で大規模でノイズ対応のリソースを提供する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 23:40:00 GMT)
SRAS: A Lightweight Reinforcement Learning-based Document Selector for Edge-Native RAG Pipelines [0.0] 本稿では、RL(Regress Learning)を用いて学習した軽量文書セレクタであるSRAS(Sparse Reward-Aware Selector)を提案する。
SRASは、PPO(Proximal Policy Optimization)を用いてコンパクトな(0.76MB)ポリシーを学び、Relaxed F1とBERTScoreを組み合わせたハイブリッド報酬信号で導かれる。
この研究は、RLベースのドキュメント選択が超軽量でレイテンシを認識し、オンデバイスRAGパイプラインに有効であることを示す最初のものである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:39:31 GMT)
Robust and fragile quantum effects in the transfer kinetics of delocalized excitons between B850 units of LH2 complexes [0.0] 光収穫2(LH2)錯体の凝集物は、紫細菌の光合成単位において主要なエキシトンリレードメインを形成する。
2つのLH2間の平均移動時間は、物理的に可算なLH2間距離に対して4 - 25 psの範囲にあると推定される。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 01:57:56 GMT)
Renormalization Group is the principle behind the Holographic Entropy Cone [0.0] すべてのホログラフィックエントロピー不等式はエンタングルメント・ウェッジの形で再キャスト可能であることを示す。
不等式が飽和すると、2組のくさびが等しく深い。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:00:01 GMT)
Reconstructing Item Characteristic Curves using Fine-Tuned Large Language Models [0.0] 本研究では,項目応答理論(IRT)の心理測定特性を暗黙的にモデル化する手法を提案する。
我々は、離散能力記述子で条件付けられた複数の選択質問に対する応答を生成するためにモデルを訓練する。
我々は, IRTパラメーターを推定するために, 学生の能力の関数として正しい応答の確率を再構築し, ICC(synthetic Item Characteristics Curves)を効果的に生成する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 22:11:41 GMT)
Quantum Extreme Reservoir Computing for Phase Classification of Polymer Alloy Microstructures [0.0] 自己整合体場理論(SCFT)を用いた高分子合金の分類に量子極端貯水池計算(QERC)を適用した。
その結果、現実的な材料データセット上でのQERC性能を示し、量子エンコーダの設計とモデル一般化のための実用的なガイドラインを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:25:51 GMT)
Project Ariadne: A Structural Causal Framework for Auditing Faithfulness in LLM Agents [0.0] エージェント推論の因果的整合性を評価するための新しいXAIフレームワークである textbfProject Ariadne を紹介する。
表面レベルのテキスト類似性に依存する既存の解釈可能性メソッドとは異なり、Project Ariadne は中間推論ノードに対して textbfhard の介入(do$-calculus)を行う。
我々の最先端モデルに対する実証的な評価は、永続的なテクスチャフルネスギャップを明らかにします。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:05:29 GMT)
Predicting Early and Complete Drug Release from Long-Acting Injectables Using Explainable Machine Learning [0.0] LAI(Long-acting Injectables)は、薬剤の投与を可能にすることによって慢性疾患の治療を変革した。
機械学習(ML)は、LAI特性と薬物放出の間の複雑な関係をモデル化することにより、LAI開発を加速することができる。
本稿では、321 LAI定式化から実行可能な情報を合成するための新しいデータ変換と説明可能なML手法を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:49:17 GMT)
Precision Autotuning for Linear Solvers via Reinforcement Learning [0.0] 本稿では,線形解法の適応的精度調整のための強化学習フレームワークを提案する。
本稿では,2次精度のベースラインに匹敵する精度を維持しながら,計算コストを削減できることを示す。
これはRLによる精度自動チューニングに関する最初の研究であり、目に見えないデータセット上で検証されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 03:25:36 GMT)
Power-of-Two Quantization-Aware-Training (PoT-QAT) in Large Language Models (LLMs) [0.0] 数値を2つのパワー・オブ・ツー(PoT)に制限する特殊量子化法を用いて圧縮重みについて検討する。
さらに重要なのは、コストのかかる乗算を低コストのビットシフトに置き換えることで、処理能力を大幅に削減することです。
また, GPT-2 124Mでは, 66%, BERT-Score損失が1%であった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 17:33:16 GMT)
Placement Semantics for Distributed Deep Learning: A Systematic Framework for Analyzing Parallelism Strategies [0.0] 大規模言語モデルのトレーニングには、多くのアクセラレーターに分散した計算が必要である。
統一された体系的なフレームワークは、その振舞いを予測しません。
配置セマンティクスを導入します。各戦略は、デバイス間で4つのトレーニングステートを配置する方法によって指定されます。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:01:38 GMT)
Physically natural metric-measure Lindbladian ensembles and their learning hardness [0.0] 我々は,Lindblad-Gorini-Kossakowski-Sudarshan(GKSL)マスター方程式によって生成されるランダム開系力学の学習性と暗号的応用について検討した。
特に,ダイアモンド標準におけるリンドブラディアンチャネルの学習において,総変動距離および平均QPStatの出力分布を学習するための平均SQ硬度を確立する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:32:54 GMT)
Photon blockade effect from synergistic optical parametric amplification and driving force in Kerr-medium single-mode cavity [0.0] 本研究では,Kerr非線形空洞とOPAを含むハイブリッド量子系における光子遮断制御について検討する。
また、Kerrの非線形性の影響についても検討し、幅広いKerr強度にわたって光子遮断は頑健である。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:20:30 GMT)
POSEIDON: Physics-Optimized Seismic Energy Inference and Detection Operating Network [0.0] POSEIDONは物理インフォームドエネルギーベースモデルであり、マルチタスク地震事象の予測を統一する。
グテンベルク・リヒター等級数周波数関係や、大森・宇都の余震崩壊法など、基本的な地震学原理を組み込んでいる。
全てのタスクで最先端のパフォーマンスを実現し、グラデーションアップ、ランダムフォレスト、CNNベースラインを上回り、比較したすべてのメソッドの中で平均F1スコアが最も高い。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:46:34 GMT)
Optimization of modulation transfer protocol for Rydberg RF receivers [0.0] プロトコルは結合ビームの位相変調に基づいており、これは原子の非線形応答によってプローブビームの振幅変調に変換される。
結合ビームの変調周波数と変調振幅の両方を最適化し,原子応答を最大化する理論モデルを開発した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:50:34 GMT)
Optical nonlinearity of cold atomic ensemble driven by strong coherent field in a saturation regime [0.0] 希薄な原子ガスの限界では、各原子の動力学はモロー型非線形励起規則に従う。
このような媒体では、光非線形性、特にパラメトリック部分は、コヒーレントポンプと試料密度の両方を操作することにより、著しく拡大することができると論じる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:30:57 GMT)
On the temperature of the quantum black hole [0.0] 一般相対性理論の非自明な特異性は、ブラックホールの地平線領域が無害であるときに外界が2倍になることである。
この複雑さは't Hooft'のユニタリティ論において中心的な役割を果たす。
ボルツマン因子のミスマッチが、対応する密度行列を形成する状態が一般化された熱場二重構造を採用すると、固定されることを示した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:54:38 GMT)
On the homogeneity of the quantum transition probability [0.0] 1952年と1965年、H.-C. Wang と U. Hirzebruch は凸計量を持つ二点同質コンパクト空間が球面に現れることを示した。
この遷移確率は、すべての単純ユークリッドジョルダン代数において最大等質の次数を持つことを示す。
非均一な遷移確率を持つ興味深いケースは、量子論理として$E_6$対称なバイオクレオニオン射影平面が用いられるときに生じる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:38:55 GMT)
O Nature, Where Art Thou? [0.0] 重力と量子論を統一するためには、別のアプローチが必要である。
「歴史の要約と一般相対性理論は、出来事と歴史の同じ基本概念に基づいて構築されている。」
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:10:24 GMT)
Not All Needles Are Found: How Fact Distribution and Don't Make It Up Prompts Shape Literal Extraction, Logical Inference, and Hallucination Risks in Long-Context LLMs [0.0] 大きな言語モデル(LLM)は、非常に長い入力コンテキストをサポートするようになった。
どのようにして情報を抽出し、大規模に推測するかは、まだ不明である。
我々は, 事実配置, コーパスレベルの事実分布, そして, モデル行動にどう影響するかを考察する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:30:56 GMT)
Neuro-Channel Networks: A Multiplication-Free Architecture by Biological Signal Transmission [0.0] ディープラーニングの急速な普及は、高性能ハードウェアに大きく依存していることに制約されている。
これらの特別な加速器は、違法に高価でエネルギー集約的なだけでなく、供給不足にも悩まされている。
我々は,AIを高価なハードウェア依存から切り離すように設計された,新しい乗算自由アーキテクチャであるNeuro-Channel Networks (NCN)を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:33:13 GMT)
Minimization of AND-XOR Expressions with Decoders for Quantum Circuits [0.0] 本稿では,可逆量子回路合成のための新しい論理構造を提案する。
本手法は,デコーダを用いた可逆量子回路の量子コストを最小化することを目的としている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:39:43 GMT)
Meta-Learning Guided Pruning for Few-Shot Plant Pathology on Edge Devices [0.0] 遠隔地の農家は、植物病を迅速かつ信頼性の高い特定方法を必要としている。
ディープラーニングモデルは、葉のイメージから病気を高精度に検出することができるが、これらのモデルは通常、Raspberry Piのような低コストのエッジデバイスで実行するには大きすぎて計算コストがかかりすぎる。
本稿では,ニューラルネットワークプルーニングと数ショット学習を組み合わせることで,モデルが限られた例から学習できるようにすることにより,両課題に対処する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:55:05 GMT)
Magnetically Induced Transparency-Absorption and Normal-Anomalous Dispersion Characteristics of ${}^{87}\text{Rb}$ Medium or Any J-Type Configuration Atomic Vapors Subject to a Vector Magnetic Field and a Weak Resonant Pump [0.0] 我々は磁気誘導型透過吸収 (MITA) と正常非晶質分散 (MINAD) を弱駆動型8,7textRb$蒸気で解析する枠組みを開発した。
この結果は、MITA/MINADの実験観測と精密磁気計測のための原子蒸気プラットフォーム最適化のための理論的基礎を提供する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:43:30 GMT)
Lightweight Transformer Architectures for Edge Devices in Real-Time Applications [0.0] 本調査では,エッジデプロイメント用に設計された軽量トランスフォーマーアーキテクチャについて検討する。
我々は、MobileBERT、TinyBERT、DistilBERT、EfficientFormer、EdgeFormer、MobileViTなど、注目すべき軽量版を体系的にレビューした。
実験により, モデルサイズを4~10倍, 推論遅延を3~9倍削減し, モデル精度を75~96%向上できることを確認した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 01:04:25 GMT)
Is Sanskrit the most token-efficient language? A quantitative study using GPT, Gemini, and SentencePiece [0.0] サンスクリットは、その形態と文法規則のために、トークンごとにより意味を表現していると仮定されている。
我々は、サンスクリット語、英語、ヒンディー語という3つの言語からなるBhagavad Gitaの701のパラレルバースのデータセットを使用している。
我々は、SPM(SentencePiece)、古いGPTモデル、およびGeminiおよびGPTの次世代トークン化器を試験する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:23:50 GMT)
Information supercurrents and spin waves in chiral active matter: Universality of the Landau-Lifshitz-Gilbert equation [0.0] 過度に破壊された極性キラル活性物質は、系が厳密に散逸する微視的性質にもかかわらず、ユーラー乱流の可視化を支援することができる。
非散逸型位相剛性超電流の担持剤として, 捕捉剤状態の同定を行った。
この結果から, 単位球に整列しようとする全ての極性キラル剤は, 散逸性スピントロニクス流体を構成することが明らかとなった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:54:19 GMT)
HyperCLOVA X 8B Omni [0.0] We present HyperCLOVA X 8B Omni, the first toany omnimodal model in the HyperCLOVA X family。
マルチモーダル理解を単一モデルに統合することにより、HyperCLOVA X 8B Omniは、実用的な任意のオムニアシスタントに向けた8Bスケールのオムニパスフィニングポイントとして機能する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:06:11 GMT)
Horizon Activation Mapping for Neural Networks in Time Series Forecasting [0.0] Horizon Activation Mapping (HAM)は、grad-CAMにインスパイアされた視覚的解釈可能性技術である。
Hamは、粒度のモデル選択、検証セットの選択、異なるニューラルネットワークモデルファミリ間の比較に使用することができる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:21:30 GMT)
High-Resolution Spectroscopy of the X-A Transition of the Carbon Monoxide Dication CO$^{2+}$ [0.0] 我々は、CO$2+$二重荷電分子イオン中の3+$($v'=0-2$) - X $3_(v=0)$ロビブロニック遷移のロビブロニックスペクトルを報告する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 09:35:55 GMT)
Gravitational time dilation in quantum clock interferometry with entangled multi-photon states and quantum memories [0.0] 我々は、周波数ビンフォトニッククロックを垂直に分離した2つの量子メモリに格納するメモリアシスト量子クロック干渉計を解析する。
適切な時間依存位相はN因子によって増幅され、N時間に早く崩壊し、干渉信号が復活することを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:00:01 GMT)
Fusion2Print: Deep Flash-Non-Flash Fusion for Contactless Fingerprint Matching [0.0] フラッシュは尾根の細部を保存するがノイズを発生させるが、非フラッシュはノイズを減少させるが尾根のコントラストを低下させる。
We propose Fusion2Print, the first framework for systemally capture and fuseed paired flash-non-flash contactless fingerprints。
軽量な注意に基づく融合ネットワークは、両方のモダリティを統合し、情報チャネルを強調し、ノイズを抑制する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:09:27 GMT)
From Chat Control to Robot Control: The Backdoors Left Open for the Sake of Safety [0.0] 我々は、デジタル監視法を具体化するシステムに拡張することは、継続的な監視を必要とすると論じている。
この規制は、保護とコントロールの境界を曖昧にし、仲間を潜在的な情報提供者に変える。
この研究は、未来を予測することではなく、認識を高め、ある未来が実現されるのを防ぐことを目的としている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:27:07 GMT)
FormuLLA: A Large Language Model Approach to Generating Novel 3D Printable Formulations [0.0] 三次元3Dプリンティングは、真のパーソナライズド・ソーセージ・フォームを可能にする可能性のある高度な製造技術である。
最近の研究は、人工知能(AI)を統合し、定式化とプロセス開発を加速している。
本研究では,多言語モデル (LLMs) を用いて, 有効成分 (API) 量に基づく適切な試薬を推奨する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:50:50 GMT)
FormationEval, an open multiple-choice benchmark for petroleum geoscience [0.0] FormationEvalは、石油地球科学の分野における言語モデルを評価するための、オープンな多重選択質問ベンチマークである。
評価対象はOpenAI, Anthropic, Google, Meta, オープンウェイトな代替品など,主要なプロバイダの72モデルである。
トップパフォーマーは97%以上の精度を達成し、Gemini 3 Pro Previewは99.8%に達した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:36:02 GMT)
Formal Modeling and Verification of Grover's Algorithm [0.0] グローバーのアルゴリズムは量子力学の重ね合わせと干渉に依存している。
我々は、HOL Light定理証明器において、Groverのアルゴリズムを正式にモデル化し、検証する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:56:21 GMT)
FlowPlan-G2P: A Structured Generation Framework for Transforming Scientific Papers into Patent Descriptions [0.0] FlowPlan-G2Pは、このタスクを3段階に書き換えることで、エキスパートドラフトアの認知ワークフローを反映する新しいフレームワークである。
本フレームワークは,紙と紙のテクスト生成のための新しいパラダイムを確立し,特殊なドメインのための構造化テキスト生成を進化させる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 22:40:15 GMT)
First Provably Optimal Asynchronous SGD for Homogeneous and Heterogeneous Data [0.0] 論文は非同期順序最適化のための厳格なフレームワークを開発する。
適切な設計により、非同期SGDは、これまで同期メソッドでのみ知られていた保証に適合する最適な時間複雑性を実現することができることを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:51:09 GMT)
Estimating Text Temperature [0.0] 本研究では,人間によって書かれたテキストを含む任意のテキストの温度を推定する手法を提案する。
次に、最も優れたQwen3 14Bを用いて、一般的なコーパスの温度を推定する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:09:41 GMT)
Emergent Complexity in Nuclear Reaction Networks: A Study of Stellar Nucleosynthesis through Chemical Organization Theory [0.0] この研究は、化学組織理論(COT)に根ざした理論的な枠組みを示し、基本的な構成要素の相互作用から、いかに安定で自己持続的な構造が生じるかを特徴づけるものである。
その結果, 温度上昇は一般にネットワーク凝集を促進させ, より大きな原子集合を減少させることがわかった。
分析により、大きな(1000以上の反応を含む)核クラスターが示され、安定な全ての求核合成構成の核となるように見える半自己維持構造が示される。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:23:38 GMT)
Efficient Calculation of the Maximal Rényi Divergence for a Matrix Product State via Generalized Eigenvalue Density Matrix Renormalization Group [0.0] 量子情報理論において、量子相互情報(quantum mutual information, $I(A;B)$)は、量子状態におけるサブシステム間の相関の尺度である。
最大レニイ発散はフォン・ノイマンの相互情報とは異なる傾向を示す可能性があることを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:54:16 GMT)
Domain Specific Specialization in Low-Resource Settings: The Efficacy of Offline Response-Based Knowledge Distillation in Large Language Models [0.0] LLM(Large Language Models)は、一般的なタスクでは優れるが、ドメイン固有の知識や制度的な知識を扱う際には、予習に苦慮することが多い。
本稿では,ハードウェアリソースの制約下で,高精度な特殊アシスタントを開発するオフライン応答に基づく知識蒸留手法を提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:00:16 GMT)
Distributed Federated Learning by Alternating Periods of Training [0.0] フェデレーション学習(Federated Learning)は、マシンラーニングに対するプライバシ重視のアプローチであり、モデルがローカルに利用可能なデータを持つクライアントデバイス上でトレーニングされ、中央サーバに集約される。
サーバ間通信機能を備えた複数サーバからなるフェデレーション学習のための分散学習手法を提案する。
そこで本研究では,クライアントデータ上でのローカルトレーニングとサーバ間のグローバルトレーニングを交互に行うDFL(Distributed Federated Learning)アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:06:58 GMT)
Diffusion Computation versus Quantum Computation: A Comparative Model for Order Finding and Factoring [0.0] 本稿では,有限グラフ上の拡散過程にのみアクセス可能な,整数分解のハイブリッド計算モデルについて検討する。
Shor のアルゴリズムとの比較は,概念的およびモデルベースである。
デジタルステップと拡散ステップの2つのコスト尺度で複雑性を報告する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:45:38 GMT)
Developments in superconducting erasure qubits for hardware-efficient quantum error correction [0.0] このパースペクティブは、ハードウェア効率のよい量子エラー補正を可能にする消去量子ビットに焦点を当てている。
超伝導量子ビットを用いたデュアルレール符号化消去量子ビットの実装に着目する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:02:47 GMT)
Deep learning parameter estimation and quantum control of single molecule [0.0] 室温でスペクトル変調パルスによって駆動される単一分子の重要な物理パラメータを推測する方法を示す。
この結果は超高速分光法、量子材料、技術に直接応用できる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:44:49 GMT)
DeCode: Decoupling Content and Delivery for Medical QA [0.0] 大規模言語モデル(LLM)は強力な医学的知識を示し、事実的に正確な応答を生成できる。
DeCodeは、既存のLCMに適応して、臨床環境でコンテキスト化された回答を生成する、トレーニング不要で、モデルに依存しないフレームワークである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:54:38 GMT)
DARC: Drum accompaniment generation with fine-grained rhythm control [0.0] DARCはドラム伴奏モデルであり、他の音階からの音環境とビートボックスやタッピングトラックのような明示的なリズムプロンプトの両方を条件付ける。
パラメータ効率のよい微調整を用いて,音環境認識を維持しつつ微粒なリズム制御を施した最先端ドラムステムジェネレータSTAGEを改良した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:55:43 GMT)
CutisAI: Deep Learning Framework for Automated Dermatology and Cancer Screening [0.0] 本稿では,統計学習理論,トポロジカルデータ解析,ベイズ変換推論を組み合わせたコンフォーマルベイズ皮膚学(CBDC)フレームワークを提案する。
CBDCは分類精度を達成し、臨床の観点から解釈可能な校正された予測を生成する。
本研究は, 深部皮膚科診断における理論的, 実践的な飛躍であり, 機械学習理論の臨床応用インターフェースを開拓する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:29:08 GMT)
Cost-Efficient Cross-Lingual Retrieval-Augmented Generation for Low-Resource Languages: A Case Study in Bengali Agricultural Advisory [0.0] 多くの発展途上国では、永続的な言語障壁のため、信頼できる農業アドバイザリーへのアクセスが制限されている。
本稿では,ベンガル農業アドバイザリーのための費用効率・言語横断型検索・拡張フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 12:41:44 GMT)
Compressed code: the hidden effects of quantization and distillation on programming tokens [0.0] 大規模言語モデル(LLM)は例外的なコード生成機能を示しているが、トークンレベルのメカニズムはいまだ検討されていない。
本稿では,明示的なプロンプトを必要とせず,モデル行動に関する洞察を提供する,新しいコールドスタート確率解析手法を提案する。
本稿では,異なるモデル最適化手法がトークンレベルの表現とコード生成品質にどのように影響するかを包括的に評価する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:32:47 GMT)
Comparative Analysis of Binarization Methods For Medical Image Hashing On Odir Dataset [0.0] 我々は,深い特徴埋め込みを用いたODIRデータセット上での4つのバイナライズ手法を評価した。
Supervised Discrete Hashing (SDH)は、32ビットコードのみを使用したmAP@100の0.9184で最高のパフォーマンスを達成した。
これらの結果から, SDHは, 医用画像検索と機器在庫管理において, 精度, ストレージ, 効率の両立を図る上で, 最も効果的なアプローチであることが示唆された。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:34:32 GMT)
ChaosBench-Logic: A Benchmark for Logical and Symbolic Reasoning on Chaotic Dynamical Systems [0.0] 大規模言語モデル(LLM)は自然言語処理に優れるが、正確な論理的および記号的推論を必要とする領域では脆弱である。
カオス力学系は、カオスは決定論的であるが、しばしばランダム性や複雑性と誤解されるため、特に要求の高いテストを提供する。
本稿では,30種類の力学系におけるLSM推論を評価するベンチマークであるChaosBench-Logicを紹介する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:36:40 GMT)
Causal and Federated Multimodal Learning for Cardiovascular Risk Prediction under Heterogeneous Populations [0.0] 我々は、クロスモーダルトランスフォーマーとグラフニューラルネットワークを統合した単一のマルチモーダル学習フレームワークを作成し、因果表現学習を行い、パーソナライズされたCVDリスクを測定する。
このモデルは、ゲノム変異、心臓MRI、心電図波形、ウェアラブルストリーム、構造化ERHデータを組み合わせてリスクを予測する。
本研究は,CVD予測に対する臨床的信頼度,解釈性,プライバシへの原則的アプローチの道を開くものである。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:32:49 GMT)
Can Large Language Models Solve Engineering Equations? A Systematic Comparison of Direct Prediction and Solver-Assisted Approaches [0.0] 大規模言語モデルが直接数値予測によって超越方程式を解くことができるか,あるいはLLMの記号操作と古典的反復解法を組み合わせるハイブリッドアーキテクチャの方が有効かどうかを評価する。
7つのエンジニアリング領域にまたがる100の問題について、最先端の6つのモデルをテストする。
直接予測はモデル間の平均相対誤差0.765から1.262、ソルバ支援計算は0.225から0.301となり、67.9%から81.8%の誤差減少を示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:04:55 GMT)
CSF: Contrastive Semantic Features for Direct Multilingual Sign Language Generation [0.0] 手話翻訳システムは通常、中間言語として英語を必要とし、非英語話者の障壁を形成している。
言語に依存しない意味表現フレームワークであるCanonical Semantic Form (CSF)を提案する。
CSFは、発話をイベント、インテント、時間、条件、エージェント、オブジェクト、場所、目的、修飾子という9つの普遍的な意味スロットに分解する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:15:35 GMT)
CNC-TP: Classifier Nominal Concept Based on Top-Pertinent Attributes [0.0] データベースにおける知識発見は、コンピュータアプリケーションの様々な領域で毎日生成される膨大な量のデータを活用することを目的としている。
その目的は、構造化プロセスを通じてデータセットから隠れた意味のある知識を抽出することである。
中心となるデータマイニング技術には、分類とクラスタリングがある。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:32:10 GMT)
Bridging the AI divide in sub-Saharan Africa: Challenges and opportunities for inclusivity [0.0] 本研究では、2024年のGovernment AI Readiness Indexを用いて、上位SSA諸国のAI準備度を調査する。
AI準備度スコアの比較分析は、国家間の格差を浮き彫りにする。
モーリシャス (53.94) と南アフリカ (52.91) がリードし、ザンビア (42.58) とウガンダ (43.32) が遅れた。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:18:43 GMT)
Attention in Geometry: Scalable Spatial Modeling via Adaptive Density Fields and FAISS-Accelerated Kernels [0.0] 本研究は,空間アグリゲーションを連続空間におけるクエリ条件付き,計量誘導型アグリゲーション演算子として定式化する幾何学的アグリゲーションフレームワークであるAdaptive Density Fields (ADF)を紹介する。
本研究では,Chengdu地域の航空機軌道解析のケーススタディを通じて,軌道条件付き影響帯(ZOI)を抽出し,再帰的な空域構造と局所的な偏差を明らかにする。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 05:42:40 GMT)
Asymptotic freedom, lost: Complex conformal field theory in the two-dimensional $O(N>2)$ nonlinear sigma model and its realization in the spin-1 Heisenberg chain [0.0] 我々は、$textitcomplex$ coupling planeに非自明な不動点が総称的に存在し、複素共形場理論(CCFT)によって記述されることを示す。
さらに、非エルミート・ハミルトニアンがCCFTを実現することで非クリックダイナミクスが支配されるスピン-1鎖に対して現実的なリンドブレディアンを構築する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:00:00 GMT)
Aspect Extraction from E-Commerce Product and Service Reviews [0.0] アスペクト抽出(AE)はアスペクトベース感性分析(ABSA)における重要な課題である
本稿では,Taglish用に設計された包括的AEパイプラインを紹介する。
ルールベースの大規模言語モデル(LLM)と、アスペクト識別と抽出の両方に対処するための微調整技術を組み合わせる。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:45:51 GMT)
An LLM -Powered Assessment Retrieval-Augmented Generation (RAG) For Higher Education [0.0] 本研究では,Retrieval-Augmented Generationアーキテクチャに基づくエージェントアセスメントシステムを提案する。
このシステムは,大規模な言語モデルと,ルーブリック基準やエッセイ,インストラクターのフィードバックなどにアクセスする構造化された検索機構を統合している。
以上の結果から,RAGシステムは信頼性の高いルーブリック整合フィードバックを大規模に生成し,94~99%の人が評価できることがわかった。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 15:13:00 GMT)
AlignVTOFF: Texture-Spatial Feature Alignment for High-Fidelity Virtual Try-Off [0.0] 仮想トライオフ(Virtual Try-Off, VTOFF)は,高忠実度平坦な衣服を合成することを目的とした多モード画像生成課題である。
参照U-Netとテクスチャ空間特徴アライメント(TSFA)に基づく新しい並列U-NetフレームワークAlignVTOFFを提案する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 11:50:02 GMT)
Addressing intramolecular vibrational redistribution in a single molecule through pump and probe surface-enhanced vibrational spectroscopy [0.0] 分子光学に基づく量子力学の枠組みを構築し,振動分光法による評価を最適化するための戦略を解析する。
分子内の振動モード間の集団移動の反ストークスSERSスペクトルに明確なシグネチャが存在することを示す。
本計算では, 分子・SERSパラメータを現実的に適用し, 現在の実験プラットフォームを用いた単一分子レベルでこれらのシグネチャにアクセス可能であることを示唆する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 13:46:14 GMT)
ARIES: A Scalable Multi-Agent Orchestration Framework for Real-Time Epidemiological Surveillance and Outbreak Monitoring [0.0] ARIES(Agentic Retrieval Intelligence for Epidemiological Surveillance)は、静的な病気特異的ダッシュボードを超えて動的インテリジェンスエコシステムに移行するように設計された、自律的な多エージェントフレームワークである。
階層的なコマンド構造に基づいて構築されたARIESは、世界保健機関(WHO)、疾病予防センター(CDC)、および査読された研究論文を自律的にクエリできるスケーラブルなサブエージェント群をGPTを使って編成する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 06:50:40 GMT)
APoW: Auditable Proof-of-Work Against Block Withholding Attacks [0.0] APoWはHashcashスタイルのナンスサーチにインスパイアされた作業証明である。
ナンス空間の再スキャンにより、他の鉱山労働者の作業の監査を可能にする。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 19:10:26 GMT)
AMC26: High-performance DOb for robust position control [0.0] HPDObは、高次トラニケート誤差ダイナミクスを外乱推定に組み込む新しい合成法である。
従来のDObとは異なり、HPDObはゼロ階のトランケーション誤差に制限されている。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 21:24:32 GMT)
AI-enhanced tuning of quantum dot Hamiltonians toward Majorana modes [0.0] 本稿では,量子ドットシミュレータにおける作業状態の広い景観を学習できるニューラルネットワークモデルを提案する。
適切なトレーニングを行うことで,ハミルトンパラメータとコンダクタンスマップ上の構造との関係を効率的に記憶することができることを示す。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:25:49 GMT)
A Wachspress-based transfinite formulation for exactly enforcing Dirichlet boundary conditions on convex polygonal domains in physics-informed neural networks [0.0] 本稿では,ニューラルネットにおけるディリクレ境界条件の厳密な適用のために,凸多角形領域上のワックスプレスに基づく超有限定式化を提案する。
物理インフォームドニューラルネットワークとディープリッツの精度は、前方、逆、およびパラメータ化された幾何学的ポアソン境界値問題に基づいて評価される。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 03:15:21 GMT)
A Survey on Applications of Quantum Computing for Unit Commitment [0.0] ユニットコミットは、電力系統の運用と電力市場スケジューリングにおける中核的な最適化問題である。
システム、運用、市場制約を満たしつつ、最適のオン/オフ状態と生成ユニットのディスパッチを決定する。
量子コンピューティングの最近の進歩は、UCソリューションプロセスを加速する新たな機会を開いた。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 04:17:24 GMT)
A Survey of Medical Drones from Flight Dynamics, Guidance, Navigation, and Control Perspectives [0.0] 本稿では,飛行力学,誘導,ナビゲーション,制御(GNC)システムの観点から,医療用ドローンのレビューを行う。
まず、医用航空輸送ミッションの要件と、適切な無人航空システム(UAS)の構成について議論する。
次に、ペイロードコンテナの設計と最適化に対処し、供給と全体の飛行ダイナミクスにその影響を及ぼします。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 00:45:07 GMT)
A Spatio-Temporal Deep Learning Approach For High-Resolution Gridded Monsoon Prediction [0.0] インドモンスーン夏(英語: Indian Monsoon Summer、ISM)は、10億人を超える人々の農業、経済、水の安全に影響を及ぼす重要な気候現象である。
伝統的な長距離予測は主に、地域レベルの管理に不可欠な空間的詳細を欠いた、空間的に平均的な季節的価値の予測に焦点が当てられている。
本稿では,モンスーン予測を深部コンピュータビジョンタスクとして再編成する新しい学習フレームワークを提案する。
予測のための85年間のERA5再解析データと目標のためのIMD降雨データを用いて、コンボリューショナルニューラルネットワーク(CNN)に基づくアーキテクチャを用いて、複雑なモンスーン時代からの詳細なマッピングを学習する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 14:02:04 GMT)
A Multilayered Approach to Classifying Customer Responsiveness and Credit Risk [0.0] 本研究は, 応答, リスク, 応答リスクの3つのモデルにおいて, 各種分類器の性能を評価する。
マルチクラス応答リスクモデルでは、ランダムフォレスト分類器が最も精度が高い。
本研究では,特定の信用リスクとメール応答性ビジネス問題を解決するために,様々なパフォーマンス指標を最適化した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 10:24:08 GMT)
A Length-Gauge Origin-Invariant Approach to Vibrational Circular Dichroism Spectra without Gauge-Including Atomic Orbitals [0.0] 我々は、振動円二色性(VCD)に対するオリジン不変長ゲージ(LG(OI))アプローチを拡張した。
このアプローチはゲージを含む原子軌道(GIAO)の必要性を回避する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 18:37:26 GMT)
A Hybrid Architecture for Multi-Stage Claim Document Understanding: Combining Vision-Language Models and Machine Learning for Real-Time Processing [0.0] 請求書は医療や保険業務に基本的であり、返済、監査、コンプライアンスの基盤となっている。
本稿では,多言語光文字認識(OCR)エンジンのPaddleOCR,従来のロジスティック回帰,コンパクトビジョンランゲージモデル(VLM),Qwen 2.5-VL-7Bを統合した多段パイプラインを提案する。
提案システムでは,文書毎の処理遅延を平均2秒以下に抑えながら,95%以上の文書型分類精度とフィールドレベルの抽出精度を約87%とする。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 08:40:44 GMT)
A General Class of Functionals for Certifying Quantum Incompatibility [0.0] 我々は最適化のない非線形不適合な証人を構築するためのフレームワークを開発する。
これらの証人は、下層の関数が極端点上の非アフィンであるとき、正確には自明でないことを証明している。
純粋な二部会国家では、証人は絡み合いの度合いを低くする。
我々は、証人が真に非互換性のモノトンとして振る舞う、測定と計器の非互換性を認定する。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:13:22 GMT)
A Foundation Model Approach for Fetal Stress Prediction During Labor From cardiotocography (CTG) recordings [0.0] 心電図は、運動中の胎児のモニタリングに広く用いられている。
深層学習のアプローチは臨床結果ラベル付きCTG記録の不足によって制約されている。
自己教師型プレトレーニングの第1報をCTG解析に応用した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 22:36:18 GMT)
A Comparative Study of Custom CNNs, Pre-trained Models, and Transfer Learning Across Multiple Visual Datasets [0.0] 畳み込みニューラルネットワーク(CNN)は、生のピクセルから階層的表現を学習する能力のため、視覚認識の標準的なアプローチである。
実際には、(i)コンパクトなカスタムCNNをスクラッチからトレーニングすること、(ii)大きな訓練済みCNNを固定特徴抽出器として使用すること、(iii)トレーニング済みのバックボーンの部分的または完全な微調整による転写学習を行うことがしばしばある。
本報告では,この3つのパラダイムを実世界の5つの画像分類データセットで比較した。
論文参考訳(メタデータ) (Mon, 05 Jan 2026 16:26:32 GMT)