JavisGPT: A Unified Multi-modal LLM for Sounding-Video Comprehension and Generation [108.2] 本稿では,ジョイントオーディオビデオ(JAV)の理解と生成のための,最初の統合マルチモーダル言語モデル(MLLM)であるJavisGを提案する。
JavisG には Encoder-LLM-decoder アーキテクチャがあり、SyncFusion モジュールで短時間で大規模なオーディオビデオ融合を行うことができる。
我々は,マルチモーダル・プレトレーニング,オーディオ・ビデオ・ファインチューニング,大規模インストラクション・チューニングからなる効果的な3段階学習パイプラインを設計する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 15:48:28 GMT)
All-in-One Video Restoration under Smoothly Evolving Unknown Weather Degradations [102.9] All-in-one画像復元は、単一のモデルを用いて、さまざまな未知の劣化からクリーンなイメージを復元することを目的としている。
既存のアプローチは主に、現実世界の劣化過程に自然に存在する時間的連続性を見越して、フレームワイドの劣化変動に焦点を当てている。
Smoothly Evolving Unknown Degradations (SEUD) のシナリオでは、アクティブな劣化セットと劣化強度の両方が時間とともに連続的に変化する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 02:20:57 GMT)
Improving Multi-step RAG with Hypergraph-based Memory for Long-Context Complex Relational Modeling [83.3] 多段階検索強化世代(RAG)は,大規模言語モデル(LLM)の拡張戦略として広く採用されている。
我々はHGMemというハイパーグラフベースのメモリ機構を導入し、複雑な推論とグローバルな理解のためにメモリの概念を動的に表現的構造に拡張する。
提案手法では,ハイパーエッジが異なるメモリ単位に対応するハイパーグラフとして表現され,メモリ内での高次相互作用の進行的形成を可能にする。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:05:46 GMT)
Avatar Forcing: Real-Time Interactive Head Avatar Generation for Natural Conversation [71.4] トーキングヘッド生成は、仮想コミュニケーションとコンテンツ生成のための静的ポートレートから、ライフスタイルのアバターを生成する。
現在のモデルは、真の対話的なコミュニケーションの感覚をまだ伝えていない。
本研究では,対話型ヘッドアバター生成のための新しいフレームワークであるAvatar Forcingを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 11:58:48 GMT)
InfoSynth: Information-Guided Benchmark Synthesis for LLMs [69.8] 大規模言語モデル (LLM) は推論やコード生成において大きな進歩を見せている。
従来のベンチマーク作成は人手による作業に依存しています。
この作業では、推論ベンチマークの自動生成と評価のための新しいフレームワークであるInfo Synthを紹介した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:26:27 GMT)
Noise-Robust Tiny Object Localization with Flows [63.6] フレキシブルなエラーモデリングと不確実性誘導最適化に正規化フローを活用するノイズローバストローカライゼーションフレームワークを提案する。
本手法は,フローベース誤差モデルを用いて,複雑な非ガウス予測分布を抽出し,ノイズの多い監視下で頑健な学習を可能にする。
不確実性を考慮した勾配変調機構は、トレーニングを安定化しながら過度な適合を緩和し、高不確実でノイズの強いサンプルからの学習をさらに抑制する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 09:16:55 GMT)
Improving Code-Switching Speech Recognition with TTS Data Augmentation [58.3] 本稿では,この不足に対処する効果的なデータ拡張手法として,多言語テキスト音声(TTS)モデルについて検討する。
我々は、SEAMEデータセット上の多言語CosyVoice2 TTSモデルを微調整し、中国語と英語の合成音声を生成する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 10:11:51 GMT)
The Reasoning-Creativity Trade-off: Toward Creativity-Driven Problem Solving [57.7] 最先端の大規模言語モデル(LLM)パイプラインは、ブートストラップの推論ループに依存している。
我々は、この設計選択が、推論経路上のモデルの分布の崩壊にどのように敏感であるかを分析する。
本稿では,分散創造推論(DCR)について紹介する。これは,解トレースの確率測定を通じて,トレーニングを勾配流としてキャストする,統一的な変分目的である。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:10:31 GMT)
AnyMS: Bottom-up Attention Decoupling for Layout-guided and Training-free Multi-subject Customization [55.1] 我々はレイアウト誘導型マルチオブジェクトカスタマイズのためのトレーニングフリーフレームワークであるAnyMSを紹介する。
AnyMSはテキストプロンプト、主題画像、レイアウト制約という3つの入力条件を利用する。
AnyMSは最先端のパフォーマンスを達成し、複雑な構成をサポートし、より多くの課題にスケールする。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 06:21:26 GMT)
Entropy-Tree: Tree-Based Decoding with Entropy-Guided Exploration [52.5] Entropy-Treeは、分岐決定の信号としてエントロピーを利用するツリーベースのデコード手法である。
単一の復号処理において、効率的な構造化された探索と信頼性の高い不確実性推定を統一する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 07:14:05 GMT)
Unregularized Linear Convergence in Zero-Sum Game from Preference Feedback [50.9] NLHFにおける最適乗算重み更新(mathtOMWU$)に対する最初の収束保証を提供する。
本分析では, 稀に発生する行動の確率が指数関数的に小さい値から指数関数的に増大する新たな限界収束挙動を同定する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 04:23:53 GMT)
Federated Customization of Large Models: Approaches, Experiments, and Insights [50.7] 本稿では, 完全微調整, 効率的な微調整, プロンプトエンジニアリング, プレフィックスチューニング, 知識蒸留, 検索強化生成など, 一般的な大規模モデルのカスタマイズ技術について概説する。
我々は,連合学習環境にプレフィックスチューニングを適用した最初の試みである,フェデレートプレフィックスチューニングの実験を行った。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 01:45:52 GMT)
CoCo-Fed: A Unified Framework for Memory- and Communication-Efficient Federated Learning at the Wireless Edge [50.4] ローカルメモリの効率とグローバル通信の削減を両立させる新しい圧縮・結合型学習フレームワークを提案する。
CoCo-Fedは、メモリと通信効率の両方において最先端のベースラインを著しく上回り、非IID設定下では堅牢な収束を維持している。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 03:39:50 GMT)
Improving Scientific Document Retrieval with Academic Concept Index [48.0] 汎用ドメインレトリバーを科学領域に適用することは、大規模ドメイン固有の関連アノテーションが不足しているため困難である。
最近のアプローチでは、これらの問題を2つの独立した方向で解決している。
本稿では,論文から重要な概念を抽出し,学術分類学に導かれる概念を整理する学術概念索引を紹介する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 04:47:49 GMT)
SEMODS: A Validated Dataset of Open-Source Software Engineering Models [46.6] 本報告では,Hugging Face (HF)から抽出した3,427モデルを対象としたSEMODSについて述べる。
我々のデータセットは、ソフトウェア開発ライフサイクルからSEタスクやアクティビティにモデルをリンクし、評価結果の標準化された表現を提供します。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 10:38:24 GMT)
AEGIS: Exploring the Limit of World Knowledge Capabilities for Unified Mulitmodal Models [44.3] 多様なタスクにまたがって世界知識を適用する統一マルチモーダルモデルの能力は、決定的かつ未解決の課題である。
本稿では,視覚的理解,生成,編集,インターリーブ生成を対象とする総合マルチタスクベンチマークであるAEGISを提案する。
さらに、不明瞭なプロンプトベースのスコアを原子Y/N'の判定に置き換えるプロトコルである決定論的チェックリストベース評価(DCE)を提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 04:22:18 GMT)
CSSBench: Evaluating the Safety of Lightweight LLMs against Chinese-Specific Adversarial Patterns [43.1] 本研究では,中国における大規模言語モデル(LLM)の安全性を評価するために,CSSBenchを導入した。
私たちのベンチマークでは、違法な活動やコンプライアンス、プライバシーの漏洩、健康と医療の誤報、詐欺と憎悪、公共と政治の安全など、実際の中国のシナリオで一般的な6つのドメインをカバーしています。
以上の結果から,中国固有の対数パターンは軽量LLMにとって重要な課題であることが明らかとなった。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 06:21:41 GMT)
Adversarial Samples Are Not Created Equal [42.9] 対向摂動による非破壊的特徴の操作を計測するアンサンブルに基づく計量法を提案する。
この新たな視点は、シャープネスを意識した最小化が敵の強靭性に与える影響など、複数の現象を再検討することを可能にする。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:30:42 GMT)
Stronger Approximation Guarantees for Non-Monotone γ-Weakly DR-Submodular Maximization [42.5] 閉鎖凸体上の非単調な$$$-weakly DR-submodular関数について検討した。
我々のアプローチは、Frank-Wolfe指導の継続的機械学習フレームワークと$-greedyのステップを組み合わせています。
これにより、非単調な$$-weakly DR-submodular over down-closed convex bodyに対する最先端の保証が得られる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 08:44:10 GMT)
NOWA: Null-space Optical Watermark for Invisible Capture Fingerprinting and Tamper Localization [37.7] 画像形成中に物理認証手段を組み込んだハイブリッド光デジタルフレームワークを提案する。
カメラ開口部の位相マスクは、撮像オペレーターのNull空間に位置するNull-space Optical Watermark(NOWA)を生成する。
Null-Space Network (NSN)は、高品質な保護された画像を提供する計測一貫性のある再構成を行う。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:11:37 GMT)
Opening the Black Box: A Survey on the Mechanisms of Multi-Step Reasoning in Large Language Models [34.1] 大規模言語モデル(LLM)は、複数の推論ステップを必要とする問題を解く際、顕著な能力を示した。
この調査は、LLMのマルチステップ推論の基礎となるメカニズムを概観する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 06:22:56 GMT)
Categorical Reparameterization with Denoising Diffusion models [33.6] カテゴリー分布の拡散に基づくソフトリパラメータ化を提案する。
実験の結果,提案手法は様々なベンチマーク上での競合性や最適化性能の向上をもたらすことがわかった。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:30:05 GMT)
Boosting Segment Anything Model to Generalize Visually Non-Salient Scenarios [31.6] 視覚的に非現実的なシナリオに対して視覚的に非現実的なSAM(VNS-SAM)を提案する。
VNS-SAMは、オリジナルのゼロショットの一般化性を保ちながら、SAMの視覚的に無意味なシナリオに対する認識を強化することを目的としている。
SAMデコーダの設計は、余剰パラメータの増分しか持たない非塩分特性をより深く理解するのに役立つ。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 02:42:04 GMT)
Zero-shot Forecasting by Simulation Alone [31.5] 時系列予測は大きな可能性を秘めているが、まだ初期段階にあり、限られた偏見のあるデータコーパス、漏れやすい評価、プライバシーとライセンスの制約によって妨げられている。
そこで本研究では,オンザフライデータ生成に十分な速度で同時に動作する,初の実用的一変量時系列シミュレーションパイプラインを提案する。
我々のシミュレーターはSarSim0(SARIMA Simulator for Zero-Shot Forecasting)と呼ばれ、季節ごとの自己回帰統合移動平均(SARIMA)モデルをコアデータソースとして使っている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:41:42 GMT)
AI-Guided Discovery of Novel Ionic Liquid Solvents for Industrial CO2 Capture [31.5] 我々は, 排ガス・精製ガスの一次源からのCO2捕捉に最適な特性を持つ化合物を発見するためのAI駆動型アプローチを提案する。
イオン液体 (IL) に着目し, 高い作業能力, 管理可能な粘度, 良好な再生エネルギー, 実行可能な合成経路を有する新規IL候補の同定に成功した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 15:41:59 GMT)
DVGBench: Implicit-to-Explicit Visual Grounding Benchmark in UAV Imagery with Large Vision-Language Models [30.7] この記事では、ドローンの高品質な暗黙VGベンチマークであるDVGBenchを紹介します。
トラフィック、災害、セキュリティ、スポーツ、社会活動、生産活動の6つの主要なアプリケーションシナリオをカバーする。
我々は,新しいI2E-CoT(Implicit-to-Explicit Chain-of-Thought)を強化学習パラダイムに統合したLVLMであるDroneVG-R1を設計する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 22:42:38 GMT)
Deep Clustering with Associative Memories [28.5] 本稿では,新しい深層クラスタリング法であるDCAMを定式化するために,Associative Memoriesを用いたエネルギーベースダイナミクスを利用した新たな損失関数を提案する。
本実験では,DCAMの利点を実証し,各種アーキテクチャ選択のためのクラスタリング品質の向上を図った。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:21:06 GMT)
Unified Primitive Proxies for Structured Shape Completion [28.3] 構造的形状完備化は、非構造的点としてではなく原始として欠落した幾何学を回復する。
単一のフィードフォワードパスで、完全な幾何学、意味論、および不整合のメンバーシップを持つプリミティブのセットを予測するUniCoを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:32:40 GMT)
FreeText: Training-Free Text Rendering in Diffusion Transformers via Attention Localization and Spectral Glyph Injection [28.2] 大規模テキスト・ツー・イメージ(T2I)拡散モデルは、オープンドメイン合成において優れているが、正確なテキストレンダリングに苦戦している。
我々は,emphDiffusion Transformer(DiT)モデルの本質的なメカニズムを活用することにより,テキストレンダリングを改善するトレーニングフリーのプラグイン・アンド・プレイフレームワークであるtextbfFreeTextを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 02:36:48 GMT)
Towards Understanding and Characterizing Vulnerabilities in Intelligent Connected Vehicles through Real-World Exploits [27.8] ICVの脆弱性に関する体系的な理解が欠如している。
現在の文献の多くは人間の主観的分析に依存している。
本研究は、ICV脆弱性の包括的でデータ駆動分析を提供する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 09:56:44 GMT)
HFedMoE: Resource-aware Heterogeneous Federated Learning with Mixture-of-Experts [26.6] 我々は,HFedMoEを提案する。HFedMoEは不均一なMoEベースのFLファインチューニングフレームワークで,各クライアントに専門家のサブセットをカスタマイズする。
HFedMoEは、微調整パフォーマンスへの貢献に基づいて、専門家の重要性を特定している。
そして、情報ボトルネックの観点から専門家のサブセットを適応的に選択し、各クライアントのコンピューティング予算に適合させる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:56:11 GMT)
Bayesian Inverse Games with High-Dimensional Multi-Modal Observations [23.9] マルチエージェントの相互作用シナリオは自然に非協調ゲームとしてモデル化され、各エージェントの判断は他のエージェントの将来の行動に依存する。
逆ゲーム問題を解くための近似ベイズ推論手法を提案する。
提案フレームワークは,事前および後続分布の学習に成功し,推論品質を向上し,下流での意思決定をより安全に行えることを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 14:23:38 GMT)
A Comprehensive Dataset for Human vs. AI Generated Image Detection [23.1] 96000個の実データポイントと合成データポイントからなるAI生成画像検出のための新しいデータセットであるMS COCOAIをリリースする。
合成画像を生成するには, 安定拡散3, 安定拡散2.1, SDXL, DALL-E3, MidJourney v6の5つのジェネレータを使用する。
このデータセットに基づいて,(1)画像を実または生成されたものと分類し,(2)どのモデルが与えられた合成画像を生成するかを同定する2つのタスクを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 03:58:18 GMT)
An Agentic Framework for Neuro-Symbolic Programming [22.6] ADSが経験豊富なDomiKnowSユーザや非ユーザに対して,ニューロシンボリックプログラムを迅速に構築する方法について述べる。
ADSが経験豊富なDomiKnowSユーザや非ユーザに対して,迅速なニューロシンボリックプログラムの構築を可能にし,開発時間を数時間から10~15分に短縮できることを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 16:59:39 GMT)
DA-DPO: Cost-efficient Difficulty-aware Preference Optimization for Reducing MLLM Hallucinations [22.3] MLLM(Multimodal Large Language Models)は、容易に区別できる好みのペアを過度に強調する傾向がある。
本稿では,学習過程のバランスをとるための費用対効果の高いフレームワークであるDA-DPOを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 09:41:54 GMT)
Exploring the Performance of Large Language Models on Subjective Span Identification Tasks [21.9] 本稿では,3つのNLPタスクにおけるテキストスパン識別におけるLLM(Large Language Models)の評価について述べる。
命令チューニングや文脈内学習,思考の連鎖など,LLMの戦略について検討する。
以上の結果から, テキストスパンの特定において, LLM の基盤となる関係性が示唆された。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 16:30:14 GMT)
Low Rank Comes with Low Security: Gradient Assembly Poisoning Attacks against Distributed LoRA-based LLM Systems [21.1] Low-Rank Adaptation (LoRA) は、フェデレートされた設定で大規模言語モデル(LLM)を微調整する一般的なソリューションとなっている。
我々は、この盲点を利用した新しい攻撃である、Gradient Assembly Poisoning (GAP)を提案する。
GAPは、表面流速を保ちながら劣化または偏りのある出力を一貫して誘導し、BLEUを最大14.5%削減し、事実的および文法的誤りを800%以上増加させ、92.6%の長文応答長を維持する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 04:42:56 GMT)
Contractive Diffusion Policies: Robust Action Diffusion via Contractive Score-Based Sampling with Differential Equations [19.8] 収縮拡散ポリシ(CDPs)は拡散サンプリング力学において収縮挙動を誘導する。
CDPはベースラインポリシーよりも優れており、データ不足下では顕著なメリットがある。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 23:33:59 GMT)
SingBAG Pro: Accelerating point cloud-based iterative reconstruction for 3D photoacoustic imaging under arbitrary array [19.0] SlingBAG Proは,スライディングボール適応成長法(SlingBAG)のポイントクラウド反復概念に基づく高度な再構成アルゴリズムである。
SlingBAG Proは高い復元品質を維持し、必要なトランスデューサの数を削減し、階層的な最適化戦略を採用している。
元のSlingBAGアルゴリズムと比較して、SlingBAG Proは不規則な配列ジオメトリの下で、ポイントクラウドベースの3D PA再構成において最大2.2倍の速度向上を実現している。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 03:53:45 GMT)
Adapting Feature Attenuation to NLP [18.5] 我々は,特徴減衰仮説をコンピュータビジョンからトランスフォーマーに移植することで,テキストのオープンセット認識(OSR)について検討する。
COSTARRフレームワークは、もともとコンピュータビジョンの分類用に設計されたもので、2つの控えめな言語モデルに適応する。
以上の結果より, COSTARRは再トレーニングなしでNLPに拡張するが, 統計的に有意な上昇は得られなかった。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:28:03 GMT)
RePose: A Real-Time 3D Human Pose Estimation and Biomechanical Analysis Framework for Rehabilitation [17.8] リハビリテーショントレーニングのためのRePoseと呼ばれるリアルタイムな3次元ポーズ推定と動作解析手法を提案する。
リハビリテーション中の患者の運動をリアルタイムにモニタリングし、評価することができる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 09:48:48 GMT)
Scale-aware Adaptive Supervised Network with Limited Medical Annotations [17.4] SASNetは、新しいスケール対応適応リウェイト機構を通じて、低レベルと高レベルの両方の特徴表現を利用するデュアルブランチアーキテクチャである。
このアプローチでは,スケールアウェアのAdaptive Reweight戦略を含む,3つの重要な方法論的イノベーションを導入している。
SASNetは、最先端の半教師付き手法を超越したラベル付きデータで優れた性能を達成する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 23:55:17 GMT)
Reconstructing Building Height from Spaceborne TomoSAR Point Clouds Using a Dual-Topology Network [17.2] 生のTtomoSAR点を高解像度のビルディングハイトマップに変換するための学習ベースのフレームワークを提案する。
我々の双対トポロジーネットワークは、不規則な散乱器の特徴をモデル化する点分枝と、空間的一貫性を強制する格子分枝とを交互に扱う。
これは、TtomoSAR点雲から直接、大規模な都市高度マッピングを行うための最初の概念実証である。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 11:34:35 GMT)
Retrieval--Reasoning Processes for Multi-hop Question Answering: A Four-Axis Design Framework and Empirical Trends [16.7] 本調査では,実行手順を分析単位として,4軸フレームワークを導入している。
代表的マルチホップQAシステムをマッピングし、標準ベンチマークで報告された改善と傾向を合成する。
我々は、構造対応計画、転送可能な制御ポリシー、分散シフト下での堅牢な停止など、検索エージェントに対するオープンな課題で締めくくります。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 02:38:01 GMT)
VEAT Quantifies Implicit Associations in Text-to-Video Generator Sora and Reveals Challenges in Bias Mitigation [16.4] Soraのようなテキスト・トゥ・ビデオ(T2V)ジェネレータは、生成されたコンテンツが社会的バイアスを反映するかどうかを懸念する。
我々は,VEAT(Video Embedding Association Test)とVEAT(Single-Category VEAT)を導入して,単語や画像からビデオへの埋め込み関連テストを拡張した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 22:38:19 GMT)
Sigmoid Head for Quality Estimation under Language Ambiguity [16.2] 言語モデル(LM)確率は、自然言語があいまいであるため、信頼性の高い品質推定器ではない。
本稿では,これらの制約に対処するために,事前学習したLM上で品質評価を行うモジュールのトレーニングを提案する。
私たちのSigmoid Headは、トレーニングと推論の間、計算的に効率的です。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 13:12:28 GMT)
A Language-Agnostic Hierarchical LoRA-MoE Architecture for CTC-based Multilingual ASR [15.7] Whisper のような大規模多言語 ASR (mASR) モデルは高い性能を実現するが、高い計算コストと遅延コストがかかる。
ドメイン適応型CTCアーキテクチャに基づく,軽量かつ言語に依存しない多言語ASRシステムを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 04:08:39 GMT)
Calling for Backup: How Children Navigate Successive Robot Communication Failures [15.2] 本研究は,若年者が繰り返しロボットの会話誤りにどう反応するかを検討するために,子育て参加者 (N=59, 8-10歳) との連続したロボット故障パラダイムを再現する。
子どもたちはプロンプトを調整し、口調を変え、連続的なエラーを通じて感情的な非言語的反応を示した。
これらの知見は,若年者を対象としたより効果的で,発達的に適切なロボットインタラクションシステムの設計を示唆するものである。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:18:10 GMT)
PhyEduVideo: A Benchmark for Evaluating Text-to-Video Models for Physics Education [14.8] このベンチマークは、視覚的なイラストを通してT2Vモデルが核物理学の概念をいかにうまく伝達できるかを評価するように設計されている。
本研究の目的は,T2Vモデルによる高品質でカリキュラムに整合した教育コンテンツ作成の実現可能性について,体系的に検討することである。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:42:02 GMT)
Benchmarking ERP Analysis: Manual Features, Deep Learning, and Foundation Models [14.7] 事象関連電位(ERP)は、外部刺激や事象に対する神経学的反応を反映する。
近年,自然脳波の深層学習手法が大幅に進歩している。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:19:39 GMT)
Fusion-SSAT: Unleashing the Potential of Self-supervised Auxiliary Task by Feature Fusion for Generalized Deepfake Detection [14.4] 自己監督型補助タスクから特徴表現を融合させることが,課題に対する強力な特徴表現であることを示す。
私たちは、FaceForensics++、Celeb-DF、DFD、FaceShifter、UADFVを含む、大規模なデータセットの実験を行った。
その結果,現在の最先端検出器と比較して,データセット間評価の一般化性が向上した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:47:36 GMT)
ASemConsist: Adaptive Semantic Feature Control for Training-Free Identity-Consistent Generation [14.3] ASemconsistは、プロンプトアライメントを犠牲にすることなく、文字アイデンティティの明示的な意味制御を可能にする。
我々のフレームワークは最先端のパフォーマンスを実現し、実質的に以前のトレードオフを克服します。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 08:13:56 GMT)
SafeMo: Linguistically Grounded Unlearning for Trustworthy Text-to-Motion Generation [14.3] 拡散バックボーンによるテキスト・トゥ・モーション(T2M)生成は、強いリアリズムとアライメントを実現する。
現在のメソッドは、モデルの安全でない動作を避けるために、個別のVQ-VAEコードブックエントリを置き換える。
ミニマルモーション・アンラーニング(MMU)を統合した信頼に値するモーション生成フレームワークSafeMoを提案する。
安全なテキストプロンプトを書き換えた最初の安全なテキスト間データセットSafeMoVAE-29Kについて述べる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 06:31:52 GMT)
DefVINS: Visual-Inertial Odometry for Deformable Scenes [14.0] 変形可能なシーンは、視覚-慣性オードメトリーの根底にある剛性仮定に反する。
我々は,厳密なIMUアンコール状態と非剛性ワープを分離する視覚慣性オドメトリーフレームワークであるDefVINSを紹介する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 14:40:33 GMT)
Few-Shot Video Object Segmentation in X-Ray Angiography Using Local Matching and Spatio-Temporal Consistency Loss [13.9] 探索空間を最も近いピクセルに制限する局所マッチング戦略を用いた新しいFSVOSモデルを提案する。
具体的には、動的に異なるサンプリング領域を実現できる非パラメトリックサンプリング機構を実装した。
この研究は、幅広い臨床応用のための強化されたポテンシャルを提供する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 21:26:28 GMT)
HOLOGRAPH: Active Causal Discovery via Sheaf-Theoretic Alignment of Large Language Model Priors [13.0] HOLOGRAPHは、大規模言語モデルに基づく因果発見を形式化するフレームワークである。
我々の重要な洞察は、コヒーレントなグローバル因果構造は、グローバルセクションの存在に対応することである。
合成および実世界のベンチマークの実験は、HOLOGRAPHが厳密な数学的基礎を提供することを示した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:55:58 GMT)
GranAlign: Granularity-Aware Alignment Framework for Zero-Shot Video Moment Retrieval [12.7] ゼロショットビデオモーメント検索(ゼロショットビデオモーメント検索、ZVMR)は、タスク固有のトレーニングデータに頼ることなく、自然言語クエリを用いて、未トリミングビデオ内の時間モーメントをローカライズするタスクである。
ZVMRの以前の研究は、共同空間におけるビデオと言語を表す高品質な事前訓練知識を活用して、アライメントの実現を試みた。
我々は、粗い意味表現と微妙な意味表現のギャップを埋める、Granularity-Aware Alignment (GranAlign)と呼ばれるトレーニング不要のフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 06:04:58 GMT)
Causality-Inspired Safe Residual Correction for Multivariate Time Series [12.2] 我々はCRC(Causality-inspired Safe Residual Correction)を提案する。
因果性にインスパイアされたエンコーダを用いて、自己および相互変数のダイナミクスを分離することで方向認識構造を公開する。
実験の結果、CRCは精度を継続的に改善する一方、深部アブレーションの研究は、そのコアセーフティメカニズムが例外的に高い非劣化速度(NDR)を保証していることを確認した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:45:11 GMT)
BSAT: B-Spline Adaptive Tokenizer for Long-Term Time Series Forecasting [11.9] 変圧器を用いた長期時系列予測は、自己注意の2次複雑さと均一パッチの剛性によって妨げられる。
そこで本研究では,B-splines に適合させて時系列を適応的に分割する新しいパラメータフリー手法である textitB-Spline Adaptive Tokenizer (BSAT) を提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 14:27:54 GMT)
IRPO: Scaling the Bradley-Terry Model via Reinforcement Learning [11.5] Intergroup Relative Preference Optimization (IRPO)は、確立されたBradley-TerryモデルをGRPOに組み込んだ新しいRLフレームワークである。
各応答に対してポイントワイズスコアを生成することにより、IRPOはRLトレーニング中に任意に多くの候補を効率的に評価することができる。
実験の結果,IRPOはポイントワイドGRM間のSOTA(State-of-the-art)性能を達成できた。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 12:57:06 GMT)
Lamps: Learning Anatomy from Multiple Perspectives via Self-supervision in Chest Radiographs [11.2] 我々は,大規模胸部X線写真を用いて,複数の視点から学習解剖学(Lamps)を構築した。
微調整および創発的特性分析によって評価された10個のデータセットにわたる実験は、ランプの優れた堅牢性、伝達性、臨床ポテンシャルを示している。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 10:52:32 GMT)
Uncertainty-Adjusted Sorting for Asset Pricing with Machine Learning [10.6] 点予測のみでなく不確実性調整予測境界を用いて資産をソートする簡単な変更を提案する。
MLモデルと米国株式パネルの幅広いセットにおいて、このアプローチはポイント予測ソートに対するポートフォリオパフォーマンスを改善している。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 06:53:47 GMT)
Learning to Segment Liquids in Real-world Images [10.1] LQDSという名の液体の大規模データセットを構築し、14の異なるクラスに注釈付けされた5000個の実世界の画像からなる。
我々は,専用境界分岐と主セグメンテーション分岐との交差アテンションを利用して,セグメンテーション予測を強化するLQDMという新しい液体検出モデルを設計する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 16:16:25 GMT)
SpikySpace: A Spiking State Space Model for Energy-Efficient Time Series Forecasting [10.0] SpikySpaceは、注意ブロックの二次コストを選択的スキャンによって線形時間に削減する、スパイク状態空間モデルである。
指数関数や除算などの複雑な演算は、ニューロモルフィックチップ上でコストがかかるため、SiLUとSoftplusの簡易近似を導入する。
一致する環境では、SpkySpaceは2つの最先端トランスフォーマーベースのアプローチと比較して、推定エネルギー消費を98.73%、96.24%削減する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 13:10:53 GMT)
AdaGaR: Adaptive Gabor Representation for Dynamic Scene Reconstruction [9.6] 動的シーンモデリングにおける周波数適応性と時間連続性の両方に対処する統合フレームワークを提案する。
Tap-Vid DAVISの実験は最先端の性能を示している。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:59:55 GMT)
Modality Dominance-Aware Optimization for Embodied RGB-Infrared Perception [9.2] 本稿では,特徴量のエントロピーとコントリビューションを共同でモデル化し,モダリティ支配度を測定するモダリティ支配指数(MDI)を提案する。
MDIに基づき,モーダリティ・ドミナンス・アウェア・クロスモーダル・ラーニング・フレームワークを開発し,モーダリティ・ドミナンス・アウェア・クロスモーダル・ラーニングの最適化を規定する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 07:36:47 GMT)
Exponentially Accelerated Sampling of Pauli Strings for Nonstabilizerness [9.1] 非安定化器によって定量化された量子魔法は、安定化器構造からの離脱を測定し、潜在的な量子スピードアップの基盤となる。
一般的な多体波動関数である$N$ qubitsに対して、安定化器のレニイエントロピーと安定化器のヌルティを正確に計算する効率的な古典的アルゴリズムを導入する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:37:04 GMT)
Automatic Question Generation for Intuitive Learning Utilizing Causal Graph Guided Chain of Thought Reasoning [8.6] 因果グラフ誘導連鎖推論とマルチエージェント言語モデルを組み合わせた新しいフレームワークを提案する。
このアプローチは、正確で意味があり、カリキュラムに準拠した質問の生成を保証する。
実験の結果,基準法に比べて70%品質が向上した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 08:49:58 GMT)
FedHypeVAE: Federated Learning with Hypernetwork Generated Conditional VAEs for Differentially Private Embedding Sharing [8.1] FedHypeVAEは、分散化されたクライアントにまたがるレベルのデータを埋め込むための、差分プライベートでハイパーネットワーク駆動のフレームワークである。
共有ハイパーネットワークは、差分プライバシの下で最適化され、ノイズの多いクリップされた勾配のみがクライアント間で集約される。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:40:41 GMT)
The Imperative for Grand Challenges in Computing [7.7] 本論文は,コンピューティングの分野としての大きな課題を定義し,追求することの重要性を強調する。
この論文は、過去の大きな課題から学んだことに基づいて、今日の大きな挑戦の性質を探求している。
本稿は、今後10年以上にわたってコンピューティングにおける大きな課題を定義するために、コミュニティが集結するよう呼びかけることで締めくくります。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 14:37:42 GMT)
Socially-Aware Recommender Systems Mitigate Opinion Clusterization [7.5] ユーザとクリエイターコンテンツとをマッチングして、エンゲージメントを最大化することで、レコメンダシステムはオンラインインタラクションを形成する、と我々は主張する。
このフィードバックループは, ユーザ, クリエータ, 推薦アルゴリズム間の複雑な相互作用を生じさせる。
我々は,このユーザ-クリエータ間のフィードバックインタラクションを明示的に説明し,ユーザのソーシャルネットワークのトポロジを戦略的に活用して多様化を促進するソーシャルネットワーク対応レコメンデータシステムを開発した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 16:54:05 GMT)
Frequent subgraph-based persistent homology for graph classification [7.3] 周波数サブグラフフィルタ(FSF)と呼ばれる新しいグラフフィルタを提案する。
FSFは、頻繁な部分グラフから派生し、安定かつ情報に富んだ周波数ベース永続ホモロジー(FPH)特徴を生成する。
グラフ分類には、FPHベースの機械学習モデル(FPH-ML)とグラフニューラルネットワーク(FPH-GNN)とFPHを統合するハイブリッドフレームワークの2つのアプローチを導入する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 12:53:32 GMT)
Pixel-to-4D: Camera-Controlled Image-to-Video Generation with Dynamic 3D Gaussians [7.1] 人間は、1つの画像だけを与えられたシーンの将来のダイナミクスを予測するのに優れています。
この能力を模倣できるビデオ生成モデルは、インテリジェントシステムにとって不可欠なコンポーネントである。
最近のアプローチでは、単一画像条件のビデオ生成における時間的コヒーレンスと3次元の整合性が改善されている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 13:04:47 GMT)
Explainability-Guided Defense: Attribution-Aware Model Refinement Against Adversarial Data Attacks [6.6] 私たちは、トレーニング中に直接活用できる、解釈可能性と堅牢性との関連性を特定します。
本稿では,局所解釈可能なモデル非依存表現をアクティブな訓練信号に変換する属性誘導型改良フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:36:03 GMT)
Investigating the Viability of Employing Multi-modal Large Language Models in the Context of Audio Deepfake Detection [6.5] VLM(Vision-Language Models)とMLLM(Multimodal Large Language Models)は、画像やビデオのディープフェイクの検出において、強力な一般化を示している。
我々は,音声深度検出のためのMLLMの可能性を探究することを目的としている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:17:22 GMT)
WildIng: A Wildlife Image Invariant Representation Model for Geographical Domain Shift [6.5] 地理的領域シフトのためのワイルドライフ画像不変表現モデルWildIngを紹介する。
地理的領域シフト条件下では,WildIngはBioCLIPなどの基盤モデルの精度を30%向上させることを示す。
異なる地域,すなわちアメリカとアフリカから収集した2つのデータセットからWildIngを評価する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 21:58:19 GMT)
Cyberscurity Threats and Defense Mechanisms in IoT network [6.1] モノのインターネット(Internet of Things)技術の急速な普及は、2030年までに300億以上のデバイスが相互接続されると予測され、サイバーセキュリティの課題の複雑さを著しく増大させた。
この調査は、脆弱性、脅威、防御メカニズムの包括的な分析を提供することを目的としており、リアルタイム監視と意思決定システムにおけるネットワーク層とアプリケーション層の統合に焦点を当てている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 04:06:03 GMT)
Sparse FEONet: A Low-Cost, Memory-Efficient Operator Network via Finite-Element Local Sparsity for Parametric PDEs [5.8] パラメータ問題に対する演算子学習手法である有限要素演算子ネットワーク(FEONet)について検討する。
FEONetは有限要素空間上のパラメータ・ツー・ソリューションマップを実現し、トレーニングデータを必要としないトレーニング手順を認める。
FEONetの計算コストは増加し、要素数が増えるにつれて精度が低下する。
この問題に対処するために,有限要素の構造を動機とした新しいスパースネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 12:39:33 GMT)
The Vibe-Check Protocol: Quantifying Cognitive Offloading in AI Programming [5.6] Vibe Coding'は、開発者が自然言語を通じてハイレベルな意図を明確に表現し、AIエージェントに実装を委譲するパラダイムである。
本稿では,ソフトウェア工学の学習方法としてテキストIs Vibe Codingが優れているか,という研究課題を解明するための理論的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 06:13:41 GMT)
Quality Detection of Stored Potatoes via Transfer Learning: A CNN and Vision Transformer Approach [5.4] 画像ベースのディープラーニングは、ストレージ中のポテトの品質を監視する、非侵襲的でスケーラブルなソリューションを提供する。
DenseNetは98.03%の精度で異常な性能を達成した。
現実的な意味としては、在庫管理の改善、価格戦略の相違、サプライチェーン全体の食品廃棄物の削減などが挙げられる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 11:10:55 GMT)
The CoinAlg Bind: Profitability-Fairness Tradeoffs in Collective Investment Algorithms [5.3] 集団投資アルゴリズム(CoinAlgs)は、投資家コミュニティのための共有トレーディング戦略を展開する人気システムである。
CoinAlg Bindと呼ばれるCoinAlgsの基本的な収益性と公正性のトレードオフを特定し、実証します。
低帯域の秘密チャネル情報漏洩でも不公平な値抽出が可能であることを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 01:23:25 GMT)
A Sparse-Attention Deep Learning Model Integrating Heterogeneous Multimodal Features for Parkinson's Disease Severity Profiling [4.8] Class-Weighted Sparse-Attention Fusion Network (SAFN)は、堅牢なマルチモーダルプロファイリングのための解釈可能なディープラーニングフレームワークである。
SAFNは、MRI皮質厚み、MRI体積測定、臨床評価、人口統計学変数を統合している。
精度は0.98プラスまたは0.02、PR-AUCは1.00プラスまたは0.00で、確立された機械学習およびディープラーニングベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 00:51:21 GMT)
A Vision-and-Knowledge Enhanced Large Language Model for Generalizable Pedestrian Crossing Behavior Inference [4.7] 本研究は歩行者横断推論のための視覚・知識強化フレームワークである歩行者横断LLM(PedX-LLM)を紹介する。
PedX-LLMは、歩行者横断推論をサイト固有のパターン認識から一般化可能な行動推論に変換する。
PedX-LLMは82.0%のバランスの取れた精度を達成する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 14:13:28 GMT)
Learning to be Reproducible: Custom Loss Design for Robust Neural Networks [4.3] 予測精度とトレーニング安定性のバランスをとるカスタムロス関数(CLF)を提案する。
CLFは予測性能を犠牲にすることなくトレーニングを大幅に改善する。
これらの結果は、より安定的で信頼性があり、信頼できるニューラルネットワークを開発するための効率的かつ効率的な戦略として、CLFを確立している。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:31:08 GMT)
Toward Open Science in the AEC Community: An Ecosystem for Sustainable Digital Knowledge Sharing and Reuse [4.2] OpenConstructionはコミュニティ主導のオープンサイエンスエコシステムで、オープンアクセス可能なAECデジタルリソースを収集、整理、コンテキスト化します。
2025年12月時点で、このプラットフォームは94のデータセット、65のモデル、そして増大するユースケースと教育資料のコレクションをホストしている。
2つのケーススタディは、エコシステムがベンチマーク、カリキュラム開発、そしてAECセクターにおけるオープンサイエンスプラクティスの広範な採用をどのようにサポートするかを実証している。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:47:07 GMT)
AceFF: A State-of-the-Art Machine Learning Potential for Small Molecules [4.2] AceFFは、小分子の薬物発見に最適化された機械学習の原子間ポテンシャル(MLIP)である。
AceFFは、薬のような化合物の包括的なデータセットに基づいて訓練された、洗練されたNet2アーキテクチャを通じてこの問題に対処する。
AceFFは必須の化学元素(H, B, C, N, O, F, Si, P, S, Cl, Br, I)を完全にサポートし、荷電状態を扱うように明示的に訓練されている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:47:37 GMT)
PoseStreamer: A Multi-modal Framework for 3D Tracking of Unseen Moving Objects [4.1] PoseStreamerは高速移動シナリオのための堅牢なマルチモーダル6DoFポーズ推定フレームワークである。
MoCapCube6Dは、高速動作下でのパフォーマンスをベンチマークするために構築された、新しいマルチモーダルデータセットである。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 12:58:07 GMT)
Vision-based Goal-Reaching Control for Mobile Robots Using a Hierarchical Learning Framework [4.0] 本稿では,システム全体を密結合した関数モジュールの集合に分解する。
提案手法は,アクティベーションシステムの均一な指数的安定性と全動作の安全性を保証する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 08:41:47 GMT)
NMPC-Augmented Visual Navigation and Safe Learning Control for Large-Scale Mobile Robots [4.0] 大型移動ロボット (LSMR) は高次多体システムであり、しばしば緩やかで不整合な地形で動作する。
本稿では,LSMRのための総合的なナビゲーション制御フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 08:40:35 GMT)
A Cascaded Information Interaction Network for Precise Image Segmentation [3.9] 本稿では,新たなGlobal Information Guidance Moduleを統合した,カスケード型畳み込みニューラルネットワークを提案する。
このモジュールは、複数の層にまたがる高レベルのセマンティック機能で、低レベルのテクスチャの詳細を効果的に融合するように設計されている。
このアーキテクチャの革新は、特に視覚的に散らかったり、ぼやけた環境において、セグメンテーションの精度を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 04:33:03 GMT)
Physio-DPO: Aligning Large Language Models with the Protein Energy Landscape to Eliminate Structural Hallucinations [3.9] 本研究では,タンパク質言語モデルに基づく物理情報アライメントフレームワークであるPhylo-DPOを提案する。
実験により、フィロDPOはSFT、PPO、標準DPOなどの強いベースラインを一貫して上回り、自己整合性RMSDは1.28に減少し、折りたたみ性は92.8%向上した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 11:16:52 GMT)
Detecting Performance Degradation under Data Shift in Pathology Vision-Language Model [3.7] ビジョンランゲージモデルでは、医用画像解析や疾患診断に強い可能性を示している。
それらの性能は、開発中に観測されたデータから入力データ分布がシフトしたときに低下する可能性がある。
本研究では,最新の病理VLMにおけるデータシフトによる性能劣化検出について検討する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 15:12:06 GMT)
Parametrized Sharing for Multi-Agent Hybrid DRL for Multiple Multi-Functional RISs-Aided Downlink NOMA Networks [3.6] 多機能再構成可能な知的表面(MF-RIS)は、その能動RIS能力とエネルギ収穫(EH)による自己持続性から、通信効率を向上させるために考案された。
我々は、MF-RISの位置だけでなく、振幅、位相シフト、EH比の電力割り当て、ビームフォーミング、MF-RIS構成を最適化することでエネルギー効率の問題を定式化する。
マルチエージェントハイブリッド強化学習(PMHRL)のためのパラメータ化共有方式を設計し、マルチエージェントポリシー最適化(PPO)とディープQネットワーク(D)を設計する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 02:44:30 GMT)
FinRetrieval: A Benchmark for Financial Data Retrieval by AI Agents [3.6] FinRetrievalは、ファイナンシャル検索に関する500の質問と、根拠となる真実の回答のベンチマークである。
Claude Opusは構造化データAPIで90.8%の精度を達成しているが、Web検索だけでは19.8%に過ぎない。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:51:37 GMT)
From Perception to Symbolic Task Planning: Vision-Language Guided Human-Robot Collaborative Structured Assembly [3.5] 本研究では,人間ロボット協調型組立のための設計・評価型計画フレームワークについて紹介する。
モジュールI(Perception-to-Symbolic State,PSS)は、視覚言語モデル(VLM)ベースのエージェントを使用して、RGB-D観測を設計仕様やドメイン知識と整合させる。
モジュールII、Human-Aware Planning and Replanning (HPR)は、タスクレベルのマルチロボットの割り当てを実行し、観測された状態が期待された実行結果から逸脱した場合にのみ計画を更新します。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 20:12:50 GMT)
A Machine Learning Framework for Off Ball Defensive Role and Performance Evaluation in Football [3.4] 我々は,フットボールゲームにおいてコーナーキックに適した,共依存型Hidden Markov Model (CDHMM)を導入する。
本モデルでは,プレイヤー追跡データから直接,時間分解によるマンマーキングと地域割当を推定する。
本稿では,防衛的信用帰属のための新しい枠組みと,オフボール防御性能の実証分析のための役割条件付ゴースト法を提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:10:36 GMT)
Comparative Analysis of Formula and Structure Prediction from Tandem Mass Spectra [3.2] 液体クロマトグラフィー質量分析法 (LC-MS) によるメタボロミクスとエポゾミックは、生物学的試料中の検出可能な小さな分子を測定することを目的としている。
発見者は、現実的なパフォーマンスベースラインを確立し、重要なボトルネックを特定し、MSに基づいた複合予測をさらに改善するためのガイダンスを提供した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 16:20:13 GMT)
QSLM: A Performance- and Memory-aware Quantization Framework with Tiered Search Strategy for Spike-driven Language Models [3.1] 大規模言語モデル(LLM)は、多くの自然言語タスクを解決するための顕著なAIモデルとして登場してきた。
計算コストが大きく、メモリフットプリントが膨大で、処理能力/エネルギーが高いため、組み込みデプロイメントでは困難である。
本研究では,事前学習したSLMを圧縮するための自動量子化を行う新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 13:05:33 GMT)
CRoPS: A Training-Free Hallucination Mitigation Framework for Vision-Language Models [3.1] 幻覚コンテンツは、現実世界での使用において信頼性を損なう。
新しいモデルは、キーテキストトークンを選択的に削除することで幻覚効果をキャプチャする。
一般化されたコントラストデコーディングは、多様な幻覚源を表現するために複数の幻覚モデルを統合する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 11:39:00 GMT)
Expert-Guided Explainable Few-Shot Learning with Active Sample Selection for Medical Image Analysis [2.8] エキスパートガイドのFew-Shot LearningとExplainability-Guided ALを紹介する。
EGxFSLは、Grad-CAMベースのDice損失による空間的監視として、放射線学者が定義した領域を統合している。
xGALは、予測の不確実性と注意欠陥の両方を優先した反復的なサンプル取得を導入する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:09:35 GMT)
PDPL Metric: Validating a Scale to Measure Personal Data Privacy Literacy Among University Students [2.8] 本研究は,大学生におけるデータプライバシーリテラシーの指標として,新たな心理測定尺度を導入し,検証するものである。
24項目のアンケートを作成し、米国を拠点とする研究大学の学生に実施した。
PDPLの差は、学術レベルや性別といった基本的な人口統計学的変数に基づいてはみられなかった。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 15:12:00 GMT)
UnrealPose: Leveraging Game Engine Kinematics for Large-Scale Synthetic Human Pose Data [2.7] 高品質のオフラインレンダリングのためにMovie Render Queue上に構築されたUnreal Engine 5パイプラインであるUnrealPose-Genを紹介します。
8つのシーケンスからなる約100万フレームコーパスであるUnrealPose-1Mを提案する。
本研究では,画像から3Dのポーズ,2Dキーポイント検出,2D-to-3Dリフト,人物検出・隔離の4つの課題について実合成結果について報告する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 21:44:02 GMT)
Benchmark Success, Clinical Failure: When Reinforcement Learning Optimizes for Benchmarks, Not Patients [2.4] 我々は,2000個のSFTサンプル,1000個のRLサンプル,1つのA100 GPUを用いて,R1スタイルの方法論(SFTとGRPO)を用いて学習した視覚言語モデルであるChexReasonを紹介する。
GRPOは分配性能(CheXpertでは23%改善、マクロF1 = 0.346)を回復するが、データセット間の転送性(NIHでは19%低下)を低下させる。
我々は,SFTチェックポイントがNIHを最適化する前に一意に改善する一般化パラドックスを同定し,教師が指導する推論がより施設に依存しない特徴を捉えていることを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:25:09 GMT)
LOFA: Online Influence Maximization under Full-Bandit Feedback using Lazy Forward Selection [2.3] オンライン環境における影響問題(L-OFA)を利用して,ノードのサブセットを選択する。
既存のアルゴリズムと比較して優れた性能を実現するアルゴリズムを実証するために実験を行う。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 08:00:14 GMT)
Memory Bank Compression for Continual Adaptation of Large Language Models [1.9] 継続学習は、獲得した知識を消去することなく、新しい情報で大規模言語モデルを更新することを目的としている。
メモリ拡張アプローチは、LCMをメモリバンクに装備することでこの問題に対処する。
我々は,オンライン適応学習において,コードブック最適化戦略を通じてメモリバンクを圧縮するモデルMBCを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:22:34 GMT)
KELP: Robust Online Log Parsing Through Evolutionary Grouping Trees [1.8] リアルタイムログ分析は、現代のインフラにおける可観測性の基礎である。
既存のオンラインは、生産環境のダイナミズムにはアーキテクチャ上不適である。
textbfKelp textbfEvolutionary textbfLog textbfParser)を提案する。
進化的グループ木(Evolutionary Grouping Tree)と呼ばれる新しいデータ構造の上に構築されている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 10:27:41 GMT)
Beyond IVR: Benchmarking Customer Support LLM Agents for Business-Adherence [1.8] 顧客サポートにおけるポリシー対応エージェントの評価を目的としたベンチマークであるJourneyBenchを紹介する。
静的プロンプトエージェント(SPA)と動的プロンプトエージェント(DPA)の2つのエージェント設計を用いて,複数の最先端エージェント設計を評価する。
DPAは,GPT-4o-miniのような小型モデルでも,GPT-4o-miniのようなより有能なモデルよりも優れることを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 07:21:23 GMT)
The Slow Drift of Support: Boundary Failures in Multi-Turn Mental Health LLM Dialogues [1.8] 本稿では,多ターンストレステストフレームワークを提案し,最先端の3つの大言語モデルに対して長時間対話型安全試験を行う。
我々は,50の仮想患者プロファイルを生成し,最大20ラウンドの仮想精神科対話を通じて,各モデルをストレステストした。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:42:28 GMT)
Enhanced Data-Driven Product Development via Gradient Based Optimization and Conformalized Monte Carlo Dropout Uncertainty Estimation [1.7] データ駆動製品開発(DDPD)は、製品設計仕様と結果の特性の関係を学ぶためにデータを活用する。
我々は、過去の実験でニューラルネットワークをトレーニングし、性能を最大化する最適な入力特徴を特定するために、射影勾配 Descent を適用した。
我々は,emphConformalized Monte Carlo Dropout (ConfMC) による不確実性推定を統合し,データ交換性の下でモデルに依存しない有限サンプルカバレッジ保証を提供する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 07:55:02 GMT)
Value Vision-Language-Action Planning & Search [1.6] VLA(Vision-Language-Action)モデルは、ロボット操作のための強力なジェネラリストポリシーとして登場した。
本稿では,モンテカルロ木探索を軽量で学習可能な値関数で拡張するフレームワークであるValue Vision-Language-Action Planning and Search(V-VLAPS)を紹介する。
LIBEROロボット操作スイート上でのV-VLAPSを評価し、価値誘導探索が成功率を5%以上向上することを示した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:40:34 GMT)
Do Chatbot LLMs Talk Too Much? The YapBench Benchmark [1.6] YapBenchは、簡潔なイデアルプロンプトでユーザ可視のオーバージェネレーションを定量化するベンチマークである。
各項目は、1ターンプロンプト、キュレートされた最小限のベースライン回答、およびカテゴリラベルで構成される。
カテゴリーレベル中央値YapScoresの一様重み付き平均YapIndexを用いてモデル性能を要約する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 09:43:52 GMT)
Symmetry and Topology in the Non-Hermitian Kitaev chain [1.4] 非エルミート型キタエフ鎖の非相互ホッピング振幅と非対称超伝導ペアリングについて検討した。
粒子ホール対称性 (PHS) はパラメータ全体を通して維持されていることを示す。
複素パラメータの広い範囲にわたる非エルミート・キータエフ鎖の位相位相図を示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:00:02 GMT)
Quantum Approaches to the Minimum Edge Multiway Cut Problem [1.4] 本稿では,通信網のレジリエンスを評価するための基本課題である,最小エッジマルチウェイ切断問題について検討する。
我々は、D-Wave量子処理ユニット上の量子アニール、Quandela s Percevalプラットフォーム上でシミュレートされたフォトニック変動量子回路、IBM s ゲートベースの量子近似最適化アルゴリズム(QAOA)という3つの量子コンピューティングパラダイムにまたがる問題をベンチマークした。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 15:26:36 GMT)
Assessing Quantum Annealing to Solve the Minimum Vertex Multicut [1.4] 通信ネットワークにおけるサイバーセキュリティは、古典的な方法で解決するのが困難な最適化問題につながることが多い。
本研究では,量子アニールを用いた制限頂点最小マルチカット問題の実現可能性について検討する。
量子ワークフローの重要な側面として、小さな埋め込み技術、チェーン長、トポロジー制約、チェーン強度選択、アン埋め込み手順、後処理などを分析する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 15:09:30 GMT)
The Illusion of Insight in Reasoning Models [1.2] 我々は,中段階のシフトと楽器の訓練を行い,それらを検出する。
推論シフトは稀であり,トレーニングの頻度が向上せず,精度が向上することはめったにない。
本研究は, 自己補正のメカニズムではなく, 不安定な推論行動の症状であることを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 00:12:13 GMT)
Efficient Deep Demosaicing with Spatially Downsampled Isotropic Networks [1.0] デジタルイメージングでは、カラーフィルタアレイ(CFA)からRGB情報を復元する第1ステップとして、画像の復調が重要である。
本稿では,等方性ネットワークの効率と性能を向上できることを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 14:40:58 GMT)
Traffic-Aware Optimal Taxi Placement Using Graph Neural Network-Based Reinforcement Learning [0.9] 本稿では,都市環境における最適なタクシー配車のためのトラヒック対応グラフベース強化学習フレームワークを提案する。
提案手法は,マルチモーダル交通システムに適用可能であり,リアルタイム都市移動最適化のためのスマートシティプラットフォームに統合可能である。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 08:31:16 GMT)
Tessellation Localized Transfer learning for nonparametric regression [0.8] Transfer Learningは、関連するソースタスクの情報を活用することで、ターゲットタスクのパフォーマンスを改善することを目的としている。
ソース・ターゲット関係における不均一性を明示的にモデル化する非パラメトリック回帰変換学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 20:58:05 GMT)
Adaptive Learning Guided by Bias-Noise-Alignment Diagnostics [0.8] 本稿では,誤り適応進化を明示的にモデル化する診断駆動学習フレームワークを提案する。
これらの診断は、損失または時間差(TD)誤差軌跡の軽量統計からオンラインで計算される。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:32:09 GMT)
AlignUSER: Human-Aligned LLM Agents via World Models for Recommender System Evaluation [0.7] 人間のインタラクションから世界モデル駆動エージェントを学習するフレームワークであるAlignを紹介する。
実証に関する反事実的軌跡を生成し, LLMに人間の選択と判断を比較し, 準最適行動を特定し, 教訓を抽出するよう促す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 03:01:33 GMT)
Characterizing Bugs and Quality Attributes in Quantum Software: A Large-Scale Empirical Study [0.6] 本研究は,2012年から2024年までの123個のオープンソース量子レポジトリを対象とした,ソフトウェアバグのエコシステムスケールの経時的解析を行った。
フルスタックのライブラリとコンパイラは、回路、ゲート、トランスパイレーションに関連する問題のために最もバグの多いカテゴリである。
暗号、実験コンピューティング、コンパイラツールチェーンにおける高重度バグクラスタ。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 11:33:39 GMT)
Adapting Natural Language Processing Models Across Jurisdictions: A pilot Study in Canadian Cancer Registries [0.6] 人口ベースのがん登録は、診断源として病理報告に依存するが、手動の抽象化はリソース集約であり、がんデータの遅延に寄与する。
カナダにおけるがん監視のためのバイオメディカルトランスフォーマーモデルであるGatorTronとともに、ブリティッシュコロンビア癌登録所で開発されたドメイン適応トランスフォーマーモデルであるBCCRTronを適応する最初の国家横断評価を行った。
トレーニングデータセットはNewfoundland & Labrador Cancer Registryから,約104,000および22,000の未同定病理報告で構成された。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:46:19 GMT)
A Magnified View into Heterogeneous-ISA Thread Migration Performance without State Transformation [0.6] Unificoは新しいマルチISAコンパイラで、どちらのアーキテクチャ上でも同じスタックレイアウトを維持するバイナリを生成する。
Unificoはランタイムスタック変換の必要性を回避し、ISAマイグレーションに伴うオーバーヘッドを取り除く。
我々は、Unificoを計算集約型NASベンチマークで評価し、全体の実行時間に最小限の影響を示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:24:46 GMT)
Improving Router Security using BERT [0.6] 本研究では,高忠実度 eBPF ベースのシステムコールセンサと対照的な拡張学習を併用することにより,偽陽性率の低い検出性能が向上することを示す。
また,ネットワークパケットデータに類似したパイプライン作成が可能なネットワークパケット抽象化言語を導入する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:34:27 GMT)
Rate-Distortion Analysis of Compressed Query Delegation with Low-Rank Riemannian Updates [0.6] 圧縮クエリデリゲート(CQD)について検討する。
CQDは、クエリ予算関数とノイズの多い演算子としてモデル化されたオラクルを備えた制約付きプログラムである。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 14:04:58 GMT)
Cost Optimization in Production Line Using Genetic Algorithm [0.5] 生産ラインにおけるコスト最適タスクスケジューリングへの遺伝的アルゴリズム(GA)アプローチ
先行構造の3つのクラスに関する実験 - 密結合, 疎結合, 疎結合, 未結合。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 13:36:42 GMT)
Analyzing the Shopping Journey: Computing Shelf Browsing Visits in a Physical Retail Store [0.5] 「買い物客の棚参りを計算できるアルゴリズム」を導入する。
棚の訪問者は、マシンビジョンに基づく3Dトラッキングとオーバーヘッドカメラによって得られた軌跡から抽出される。
その結果, キャリブレーションを行った環境と異なる環境下で評価すると, 顧客の閲覧行動を認識することができることがわかった。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 01:40:12 GMT)
TeleDoCTR: Domain-Specific and Contextual Troubleshooting for Telecommunications [0.5] 通信におけるエンドツーエンドのチケット解決に適した,通信関連,ドメイン特化,コンテキストトラブルシューティングシステムであるTeleDoCTRを提案する。
我々は,TeleDoCTRを通信インフラから実世界のデータセット上で評価し,既存の最先端手法よりも優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 13:55:07 GMT)
Three factor delay learning rules for spiking neural networks [0.4] シナプスおよび軸索遅延を導入し, リーク・アンド・ファイア(LIF)をベースとしたフィードフォワードとリカレントSNNを統合した。
オンライン上で遅延パラメータを同時に学習するための3つの制約付き学習ルールを提案する。
本研究は、デバイス上での学習を可能にし、メモリ要求を低くすることで、パワーと領域制約のあるニューロモルフィックプロセッサの設計に有効である。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 12:28:53 GMT)
Training a Huggingface Model on AWS Sagemaker (Without Tears) [0.4] このデモペーパーは、研究者がAWS SageMakerで最初のHugging Faceモデルをスクラッチからトレーニングするために必要な重要な情報を集中させることで、クラウドの採用を民主化することを目的としている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 13:58:24 GMT)
Simulations of MRI Guided and Powered Ferric Applicators for Tetherless Delivery of Therapeutic Interventions [0.2] 血管内MRIを用いたアプリケーションケータの術前計画とモデリングのための計算プラットフォームを提案する。
仮想廊下は、船の穿孔や衝突を避けるために、応用者が禁止された領域として機能する。
異なる血流プロファイルをユーザ選択し、それらのパラメータをアプリケーション操作のモデリングに使用することができる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 20:33:51 GMT)
Data-Driven Analysis of Crash Patterns in SAE Level 2 and Level 4 Automated Vehicles Using K-means Clustering and Association Rule Mining [0.2] 自動走行車(AV)は、人間の運転ミスを低減または排除し、交通安全を高め、持続可能な移動性をサポートする。
近年、衝突データにより、AVの挙動が予測される安全結果から逸脱し、混在する交通環境における技術の安全性と運用上の信頼性への懸念が高まっている。
本研究は、米国高速道路交通安全局(NHTSA)による2500以上のAV事故記録を分析し、SAEレベル2と4をカバーし、基礎となるクラッシュのダイナミクスを明らかにする。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 16:28:22 GMT)
Improving the Graph Challenge Reference Implementation [0.1] 匿名ネットワークセンシンググラフチャレンジは1000億以上のネットワークパケットを処理し、プライバシ保護トラフィック行列を構築する。
この研究は、明確さ、適応性、パフォーマンスを改善するために、参照コードのセクションのベンチマークを提示します。
オリジナルのPython実装は、2つの集中モジュールで325行に合理化され、コードサイズが67%削減された。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:51:12 GMT)
Toward a Dynamic Intellectual Property Protection Model in High-Growth SMEs [0.0] 本稿では,高度成長期における知的財産権(IP)保護とオープンイノベーションのバランスをとる上で,HG-SME(High-Growth Small-to-Medium Enterprises)が直面する課題に対処する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:19:13 GMT)
Threat Intelligence Driven IP Protection for Entrepreneurial SMEs [0.0] 本稿では,Treat Intelligence-driven IP Protection (TI-IPP)モデルを提案する。
モデルには、機会と脅威の知覚、機会の獲得、知識移転、組織変革の4つの重要なフェーズが含まれている。
サイバーセキュリティ脅威インテリジェンスとIP保護プラクティスを統合することで、E-SMEは、競争上の優位性を維持しながら、価値あるIPを保護する能力を開発することができる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:16:04 GMT)
Uncertainty-Calibrated Explainable AI for Fetal Ultrasound Plane Classification [0.0] 胎児超音波標準平面分類は、出生前生検と異常検診の信頼性を高める。
実世界の展開は、ドメインシフト、画像ノイズ、予測される確率のキャリブレーションによって制限される。
本稿では,胎児平面分類における不確実性校正可能なAIの実践的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 21:32:26 GMT)
Ultracold Quantum Gravimeters: An Introduction for Geophysicists [0.0] 本稿では,原子間干渉法の基本機構に焦点をあてて,2レベルおよび3レベル原子系に基づく重力計のレビューを行う。
マッハ・ツェンダー干渉計の関数は、/2ドルと$$のパルスの作用によって議論され、その結果の位相シフトが重力加速度をエンコードする方法を示している。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 12:50:51 GMT)
Two Deep Learning Approaches for Automated Segmentation of Left Ventricle in Cine Cardiac MRI [0.0] LNU-Net と IBU-Net という2つの新しいディープラーニングアーキテクチャを提案する。
LNU-Netはレイヤ正規化(LN)U-Netアーキテクチャから、IBU-Netはインスタンスバッチ正規化(IB)U-Netから派生している。
提案手法は, サイス係数と平均垂直距離を比較検討した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:56:15 GMT)
Trajectory Guard -- A Lightweight, Sequence-Aware Model for Real-Time Anomaly Detection in Agentic AI [0.0] トラジェクトリガードはシームズ・リカレント・オートエンコーダであり、コントラスト学習によるタスク・トラジェクトリアライメントと、再構成によるシーケンシャル・アライメントを共同で学習するハイブリッド・ロス機能を備えている。
32ミリ秒のレイテンシで、当社のアプローチは LLM Judge のベースラインよりも17-27倍高速で動作し、実運用環境におけるリアルタイムの安全性検証を可能にします。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 00:27:11 GMT)
Training-Free Certified Bounds for Quantum Regression: A Scalable Framework [0.0] パウリ予想値から導かれる量子レグレッションに対して、トレーニング不要で証明済みの誤差を提示する。
実測予算内での性能を認定するために, 漸近的でない統計的保証を提供する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:05:48 GMT)
Three results on twisted $G-$codes and skew twisted $G-$codes [0.0] ツイスト群代数上の次元 3 のすべてのイデアルがアーベル群符号であることを示す。
また、ツイストされた群符号の次元と距離の有界性や、そのような有界性に達するときの有界性も証明する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:16:09 GMT)
The Ground State Energy of a Mean-Field Fermi Gas in Two Dimensions [0.0] 平均場状態における2次元フェルミガスの相関エネルギーの式を厳密に確立する。
この証明はフェルミ面の周囲にゆっくりと成長するパッチを用いた近似ボゾン化に基づいている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:12:21 GMT)
Semantic Event Graphs for Long-Form Video Question Answering [0.0] 本稿では,ビデオと言語間の軽量なシンボリックインタフェースを提案する。
我々のパイプラインは、YOLOv11でオブジェクトを検出し追跡し、近接パターンをSTART/ENDのヒューマンオブジェクトイベントに変換し、それらをテンポラルシーングラフ(TSG)に整理する。
5つのYouTubeビデオ(それぞれ300-500のインタラクション)と120のロングホライゾンの質問が自動生成され、SEG 65.0%の精度はクエリ毎に3.47kトークンしか使用せず、全ログベースラインと密に一致し、トークン使用率を91.4%削減した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 00:11:03 GMT)
SearchGym: A Modular Infrastructure for Cross-Platform Benchmarking and Hybrid Search Orchestration [0.0] 本稿では,クロスプラットフォームのベンチマークとハイブリッド検索オーケストレーション用に設計されたモジュール型インフラストラクチャであるSearchGymを紹介する。
既存のモデル中心のフレームワークとは異なり、SearchGymはデータ表現、埋め込み戦略、ロジックをステートフルな抽象化に分離する。
ハイブリッド検索パイプラインにおける「Top-$k$zance」を解析し、セマンティックランキングと構造化フィルタリングの最適シーケンスがフィルタ強度に大きく依存していることを明らかにする。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 07:19:25 GMT)
Reliability Under Randomness: An Empirical Analysis of Sparse and Dense Language Models Across Decoding Temperatures [0.0] スパースMoEモデルにおける条件計算がデコードによるランダム性を増幅し、温度上昇とともに信頼性を低下させるかを検討する。
その結果、スパース命令調整モデルでは、全ての復号温度で高密度命令調整モデルに匹敵する安定性を示すことが示された。
信頼性クリティカルなアプリケーションにスパース言語モデルを展開する上で,これらの結果がもたらす意味について論じる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:10:10 GMT)
Qubits and Vacuum Amplitudes [0.0] 潜在的な応用は、コライダーデータ分析のための量子機械学習手法から、複雑なマルチループFeynman図のより高速で正確な評価まで様々である。
マルチループ真空振幅の因果構造の同定は、ループトレー双対の鍵となる要素であり、グラフ理論と深い関係を持つ領域である。
高次元関数の統合とサンプリングは、完全に誕生した量子イベント生成器の実現に向けた第一歩である。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 15:34:42 GMT)
Probabilistic Guarantees for Reducing Contextual Hallucinations in LLMs [0.0] 大規模言語モデル(LLM)は、しばしば文脈幻覚を発生させ、生成されたコンテンツはプロンプトで明示された情報に矛盾したり無視する。
本稿では,この設定における幻覚の低減のための確率的保証を明示的に提供する,モデルに依存しないフレームワークを提案する。
判定されたパイプラインが失敗する確率は、審査員の真偽陽性確率によって決定される速度で低下することを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 10:52:33 GMT)
Precision Autotuning for Linear Solvers via Contextual Bandit-Based RL [0.0] 本稿では,線形解法の適応的精度調整のための強化学習フレームワークを提案する。
本稿では,2次精度のベースラインに匹敵する精度を維持しながら,計算コストを削減できることを示す。
これはRLによる精度自動チューニングに関する最初の研究であり、目に見えないデータセット上で検証されている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 15:59:42 GMT)
Post-Quantum Cryptography Key Expansion Method and Anonymous Certificate Scheme Based on NTRU [0.0] NTRUは格子ベースのポスト量子暗号手法の1つである。
本研究では,NTRUを用いた鍵展開手法を提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 00:18:54 GMT)
Photonic Reservoir Engineering via 2D $Λ$-Type Atomic Arrays in Waveguide QED [0.0] $$$タイプの原子系における電磁誘導透過性は、高忠実度メモリや非線形光学などの量子技術を支える。
導波路に結合した1次元の原子鎖の標準ジオメトリは、単一の明るい超ラジカルチャネルのみを許す。
本研究では, フォトニック結晶導波路, ジグザグおよびオルソゴン構造に結合した2次元(2次元)原子格子構造体を提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 09:40:28 GMT)
Optimizing LSTM Neural Networks for Resource-Constrained Retail Sales Forecasting: A Model Compression Study [0.0] 本稿では,LSTMモデル圧縮について,隠蔽ユニットの数を128から16に減らして検討する。
実験により、隠されたLSTMユニットの数を64に下げることは、同じレベルの精度を維持しながら改善することを示した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 01:35:49 GMT)
On orthoposets of numerical events in quantum logic [0.0] 我々はそのようなポーズ P を一般的な事象集合 (GSE) と呼ぶ。
我々は、GSEの様々なクラス、特に正則集合であるクラス、その相互関係と既知の論理への接続について研究する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:08:45 GMT)
Multi-Level Feature Fusion for Continual Learning in Visual Quality Inspection [0.0] 本研究は,事前学習したネットワークの深さの異なる表現を利用することで,両面を同時に改善することを目的としたマルチレベル特徴融合(MLFF)アプローチを提案する。
提案手法は,異なる品質検査問題に対するエンド・ツー・エンド・トレーニングの性能に適合し,トレーニング可能なパラメータを著しく少なくすることができることを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 15:50:32 GMT)
Measuring Social Media Polarization Using Large Language Models and Heuristic Rules [0.0] 本研究では, 気候変動や銃規制など, 様々な話題の議論において, 感情分極を系統的に分析し, 定量化する。
AIによるコンテンツアノテーションとドメインインフォームドスコアを組み合わせることで、私たちのフレームワークは、感情的な偏光を測定するためのスケーラブルで解釈可能なアプローチを提供します。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 01:11:58 GMT)
Lightweight Channel Attention for Efficient CNNs [0.0] 現代の畳み込みニューラルネットワーク(CNN)に注意機構が不可欠なものになった
本研究は,Squeeze and Excitation(SE),Efficient Channel Attention(ECA),Lite Channel Attention(LCA)モジュールを比較した実証的研究である。
LCAは、効果的な注意行動を維持しながらパラメータの使用を減らすために、グループ化された操作を伴う適応的な一次元の畳み込みを用いる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 23:30:06 GMT)
LLM-Based Agentic Exploration for Robot Navigation & Manipulation with Skill Orchestration [0.0] 本稿では,Gazeboシミュレーションとそれに対応する現実世界の廊下レイアウトで評価した,屋内ショッピングタスクのためのエンドツーエンドのLLMエージェント探索システムを提案する。
ロボットは、接合部の看板を検出し、推定された接合のポーズとともに方向とPOIの関係を記憶することで、軽量なセマンティックマップを構築する。
自然言語ショッピング要求が与えられた後、LLMは各ジャンクション(方向と店に入るかどうか)で制約付き離散アクションを生成し、ROS有限状態メインコントローラはモジュラーモーションプリミティブをゲーティングすることで決定を実行する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 04:04:54 GMT)
LLM Agents for Combinatorial Efficient Frontiers: Investment Portfolio Optimization [0.0] 本研究では,カーディナリティ制約付き平均分散ポートフォリオ最適化問題に対する新しいエージェント・フレームワークを実装した。
ベンチマーク問題では、実装されたエージェントフレームワークは最先端のアルゴリズムと一致する。
複雑なアルゴリズム開発は軽減され、最悪の場合、低いが許容できるエラーが報告される。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:02:13 GMT)
Is the Conventional Picture of Coherence Time Complete? Dark Matter Recoherence [0.0] 局所太陽重力ポテンシャルは超軽量暗黒物質(ULDM)の盆地を形成する
我々は、長い間、リコヒーレンス現象が出現し、サブコンポーネントが正式に異なるコヒーレンス時間を示すことを発見した。
これは、長期にわたる観測期間を通じてデータを蓄積する暗黒物質の探索に対する感度を高めることを意味する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:00:06 GMT)
Interpretability-Guided Bi-objective Optimization: Aligning Accuracy and Explainability [0.0] IGBOがDAG(Directed Acyclic Graph)として特徴重要階層を符号化
我々はデータマニフォールド対応統合パスを学習する最適なパスOracleを提案する。
時系列データによる実験結果から、IGBOがDAG制約を最小限の精度で強制する効果を示した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 11:32:00 GMT)
Integrating Multi-Armed Bandit, Active Learning, and Distributed Computing for Scalable Optimization [0.0] ALMAB-DCはスケーラブルなブラックボックス最適化のための統一されたフレームワークである。
アクティブラーニング、マルチアームバンディット、分散コンピューティングを統合している。
常に最先端のブラックボックス評価を上回っている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 09:06:56 GMT)
Improved decoding algorithms for surface codes under independent bit-flip and phase-flip errors [0.0] 標準独立雑音モデル(X/Z)の下で,トーリック符号と平面および回転曲面符号の正確な復号化について検討した。
我々は, (O(n3/2log n)) 時間デコーダが表面およびトーリック符号に対して実現可能であることを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:43:06 GMT)
HyperPriv-EPN: Hypergraph Learning with Privileged Knowledge for Ependymoma Prognosis [0.0] Ependymomaの術前予後は治療計画上重要であるが,MRIでは意味的洞察が欠如しているため困難である。
本稿では,Privileged Informationフレームワークを用いたハイパーグラフベースの学習であるHyperPriv-EPNを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 09:52:41 GMT)
Grading Handwritten Engineering Exams with Multimodal Large Language Models [0.0] 手書きのSTEM試験は、オープンエンドの推論と図をキャプチャするが、手動のグラデーションは遅く、スケールが難しい。
マルチモーダル大言語モデル(LLM)を用いた手書き手書き工学クイズを段階的に学習するためのエンドツーエンドワークフローを提案する。
講師は手書きの参照ソリューション(100%)と短時間のグルーピングルールのみを提供し、基準スキャンを露出することなく、条件がグルーピングされるテキストのみの要約に変換する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 16:10:08 GMT)
Geometry of Reason: Spectral Signatures of Valid Mathematical Reasoning [0.0] 本研究では,注意パターンのスペクトル分析により,大規模言語モデルにおける有効な数学的推論を学習なしで検出する手法を提案する。
この方法は、トレーニングデータ、微調整、あるいは学習された分類器を必要としない。
これらの知見は,ハロゲン化検出とAI安全監視への即時適用による検証を推論するための基本的枠組みとして,スペクトルグラフ解析を確立した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 18:49:37 GMT)
Geometric Complexity of Quantum Channels via Unitary Dilations [0.0] 量子チャネルの族として機能する幾何学的複雑性をユニタリディレーションに基づいて導入・解析する。
所定イデアル閉進化に対する幾何学的複雑性の損失を定量化する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 16:28:36 GMT)
From 2D to 3D terrain-following area coverage path planning [0.0] 3次元地形追従面積被覆経路計画法を提案する。
i)機械の作業幅に等しい距離で局所的に離れた複数の隣接経路を生成し、(ii)地形上の特定の作業高さに等しい投射距離に同時に浮かんでいる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 09:00:48 GMT)
Four-Photon Interference with a High-Efficiency Quantum Dot Source [0.0] 決定論的デマルチプレクシングを持つ量子ドット源は、最大4個の光子からの量子干渉縞を直接観察することができる。
結果は、識別可能な光子によってミニマが影響を受けない「ディープ・フリンジ」の存在を明らかにした。
これらの現象は、様々な潜在的な光量子技術に関連して、より多くの光子の干渉にまで及ぶと予測している。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:30:08 GMT)
Filtering Beats Fine Tuning: A Bayesian Kalman View of In Context Learning in LLMs [0.0] 本稿では,大規模言語モデルにおける推論時適応をオンラインベイズ状態推定として解釈する理論優先フレームワークを提案する。
線形化状態空間モデルにより制御された低次元潜在状態の逐次的推論としてタスク固有学習とコンテキスト固有学習を定式化する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 21:18:48 GMT)
Feedback Indices to Evaluate LLM Responses to Rebuttals for Multiple Choice Type Questions [0.0] 本稿では,チャット中の反論に挑戦する場合に,Large Language Model (LLM) 応答を特徴付けるフレームワークを提案する。
提案手法は,複数質問を提示した場合のLCMの挙動を定量的に評価する,架空の応答応答法を用いている。
指標は特に、サイコファンティックな行動として特徴づけられるものを検知し、測定するために設計されている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 21:16:43 GMT)
Experimental exclusion of a generalized Károlyházy gravity-induced decoherence model [0.0] 我々はKrolyhzyによって提案された重力誘起デコヒーレンスモデルの一般化版に関する新しい実験的制約について報告する。
本研究は,重力関連脱コヒーレンスシナリオに対する実験的制約を著しく強化した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 11:28:32 GMT)
Evaluating the Performance of Open-Vocabulary Object Detection in Low-quality Image [0.0] 実世界の低品質画像をシミュレートする新しいデータセットを提案する。
低レベル画像劣化下では, オープン語彙オブジェクト検出モデルではmAPスコアが有意に低下しなかったが, 高レベル画像劣化下では, 全てのモデルの性能が急激に低下した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 12:29:39 GMT)
Entropy Production in Machine Learning Under Fokker-Planck Probability Flow [0.0] 非平衡コストダイナミクスに基づくエントロピーに基づく再学習フレームワークを提案する。
エントロピートリガーを用いたリトレーニングにより,高周波リトレーニングに匹敵する予測性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 04:01:57 GMT)
Emoji-Based Jailbreaking of Large Language Models [0.0] 大規模言語モデル(LLM)は、現代のAIアプリケーションに不可欠なものであるが、それらの安全アライメント機構は、敵のプロンプトエンジニアリングによってバイパスすることができる。
本研究では,非倫理的な有害なアウトプットを引き起こすために,絵文字配列をテキストのプロンプトに埋め込んだ絵文字ベースのジェイルブレイクについて検討した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 10:49:06 GMT)
ElecTwit: A Framework for Studying Persuasion in Multi-Agent Social Systems [0.0] ElecTwitはマルチエージェントシステム内での説得を研究するために設計されたシミュレーションフレームワークである。
以上の結果から,ほとんどのLLMで25種類の説得法を総合的に使用した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 22:10:09 GMT)
Effects of Donor-Acceptor Quantum Coherence and Non-Markovian Bath on the Distance Dependence of Resonance Energy Transfer [0.0] ドナー・アクセプターの量子コヒーレンスにより、再抵抗は第6のパワーよりも急勾配となることを示す。
非マルコフ浴効果は、CRETと非ウランFRETの双方の6番目のパワーよりも抵抗依存性を緩やかにする。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 15:03:00 GMT)
Early-Stage Prediction of Review Effort in AI-Generated Pull Requests [0.0] 我々は,2,807リポジトリにわたるAIDevデータセットから,エージェントによるPR33,707件を分析した。
本稿では,高解像度PRを生成時に予測するサーキットブレーカートリアージモデルを提案する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 17:18:01 GMT)
ECR: Manifold-Guided Semantic Cues for Compact Language Models [0.0] 埋め込み整合性規制(ECR)と呼ばれる新しい枠組み
ECRは一貫してトレーニングを安定させ、タスクや言語間のセマンティック構造を保存する。
また、よりコンパクトでタスク対応の表現空間も生成する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 03:16:24 GMT)
Dynamic Accuracy Estimation in a Wi-Fi-based Positioning System [0.0] 本稿では,位置推定アルゴリズムを用いて測定結果に基づいて位置推定誤差を導出する動的精度推定手法を提案する。
この概念はWinobreakdash-Fiを用いた屋内位置決めシステムで実験的に検証され、いくつかの回帰法が試験された。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 22:46:41 GMT)
Cycling Race Time Prediction: A Personalized Machine Learning Approach Using Route Topology and Training Load [0.0] 本研究は,選手の現在のフィットネス状態と合わせて,経路トポロジ特徴を用いた乗車時間の予測を行う機械学習手法を提案する。
我々は,N-of-1研究設計において,シングルスリーブデータセット(N=96ライド)を用いてアプローチを評価する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 08:19:26 GMT)
Cost-Performance Analysis of Cloud-Based Retail Point-of-Sale Systems: A Comparative Study of Google Cloud Platform and Microsoft Azure [0.0] 本稿では,Google Cloud Platform(GCP)とMicrosoft Azure上でのPOSワークロードのデプロイを,系統的に反復的に比較する。
自由層クラウドリソースを使用することで、POSワークロード評価のための透過的な方法論を提供します。
GCPはベースラインロード時のレスポンスタイムを23.0%高速化し、Azureは定常オペレーションのコスト効率を71.9%向上した。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 01:54:58 GMT)
Coordination-driven magic numbers in protonated argon clusters [0.0] 1つのプロトンを加えると、説明がつかなかった大量のマジックナンバーが生成される。
我々は、量子モンテカルロ法と、陽子の配位環境を正確に捉える多体abイニシアトポテンシャルを組み合わせる。
クラスタのサイズが大きくなるにつれて、多体協調駆動安定性から二体相互作用に支配される体制への明確な構造的遷移が特定される。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 06:36:11 GMT)
Computational Modeling of Exciton-bath Hamiltonians for LH2 and LH3 Complexes of Purple Photosynthetic Bacteria at Room Temperature [0.0] 低光条件下では、いくつかの紫色の細菌がLH2をLH3に置き換える。
LH2とLH3の吸収線形状の主な違いは、前者の850nm帯から新しい820nm領域へのシフトである。
本研究は,LH2およびLH3錯体の分子レベルの異なる特徴を明らかにするために,LH2およびLH3錯体の包括的計算研究を報告する。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 05:29:05 GMT)
Cloud-Native Generative AI for Automated Planogram Synthesis: A Diffusion Model Approach for Multi-Store Retail Optimization [0.0] 本稿では、拡散モデルを用いて、ストア固有のプラングラムを自動的に生成するクラウドネイティブアーキテクチャを提案する。
このアーキテクチャは、AWS経由でのクラウドベースのモデルトレーニングと、リアルタイム推論のためのエッジデプロイメントを組み合わせたものだ。
経済分析では、生産費が97.5%削減され、4.4ヶ月の休業期間が設けられている。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 01:47:44 GMT)
ChiEngMixBench: Evaluating Large Language Models on Spontaneous and Natural Chinese-English Code-Mixed Generation [0.0] ChiEngMixBenchは、実際のコミュニティコンテキストにおけるコード混合能力を評価するために設計された最初のベンチマークである。
ChiEngMixBenchは、自発性と自然性という2つの相補的な信号によって特徴づけられる認知的アライメント問題としてコードミキシングを定式化している。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 08:18:27 GMT)
ARISE: Adaptive Reinforcement Integrated with Swarm Exploration [0.0] ARISEは強化学習を強化する軽量フレームワークである。
政策行動と、各粒子が候補となる政策軌道を表す粒子駆動の提案をブレンドする。
ARISEはより困難なタスクでかなりの利益を得る。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 14:09:22 GMT)
A Deep Learning Approach for Automated Skin Lesion Diagnosis with Explainable AI [0.0] 皮膚がんは世界で最も一般的で危険ながんの1つである。
本稿では,HAM10000データセットを用いたマルチクラス皮膚病変分類のディープラーニングアーキテクチャについて述べる。
論文参考訳(メタデータ) (Fri, 02 Jan 2026 19:21:59 GMT)